KR20220022486A - 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법 - Google Patents

부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법 Download PDF

Info

Publication number
KR20220022486A
KR20220022486A KR1020217040134A KR20217040134A KR20220022486A KR 20220022486 A KR20220022486 A KR 20220022486A KR 1020217040134 A KR1020217040134 A KR 1020217040134A KR 20217040134 A KR20217040134 A KR 20217040134A KR 20220022486 A KR20220022486 A KR 20220022486A
Authority
KR
South Korea
Prior art keywords
parameter
value
sum
pixel
relative
Prior art date
Application number
KR1020217040134A
Other languages
English (en)
Inventor
다다마사 도마
다카히로 니시
기요후미 아베
유스케 가토
Original Assignee
파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 filed Critical 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Publication of KR20220022486A publication Critical patent/KR20220022486A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

부호화 장치(100)는, 회로와, 회로에 접속된 메모리를 구비하고, 회로는, 동작에 있어서, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 제1 파라미터, 제2 파라미터, 제3 파라미터, 제4 파라미터 및 제5 파라미터를 사용하여, 커런트 블록의 부호화에 사용되는 예측 화상을 생성한다.

Description

부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
본 개시는, 비디오 코딩에 관한 것이며, 예를 들면, 동화상의 부호화 및 복호에 있어서의 시스템, 구성 요소, 그리고 방법 등에 관한 것이다.
비디오 코딩 기술은, H.261 및 MPEG-1로부터, H.264/AVC(Advanced Video Coding), MPEG-LA, H.265/HEVC(High Efficiency Video Coding), 및 H.266/VVC(Versatile Video Codec)로 진보하고 있다. 이 진보에 따라, 다양한 용도에 있어서 계속 증가하는 디지털 비디오 데이터량을 처리하기 위해, 비디오 코딩 기술의 개량 및 최적화를 제공하는 것이 항상 필요해지고 있다.
또한, 비특허문헌 1은, 상술된 비디오 코딩 기술에 관련된 종래의 규격의 일례에 관한 것이다.
H.265(ISO/IEC 23008-2 HEVC)/HEVC(High Efficiency Video Coding)
상기와 같은 부호화 방식에 관하여, 부호화 효율의 개선, 화질의 개선, 처리량의 삭감, 회로 규모의 삭감, 또는, 필터, 블록, 사이즈, 움직임 벡터, 참조 픽처 또는 참조 블록 등의 요소 또는 동작의 적절한 선택 등을 위해, 새로운 방식의 제안이 요망되고 있다.
본 개시는, 예를 들면, 부호화 효율의 개선, 화질의 개선, 처리량의 삭감, 회로 규모의 삭감, 처리 속도의 개선, 및, 요소 또는 동작의 적절한 선택 등 중에서 1개 이상에 공헌할 수 있는 구성 또는 방법을 제공한다. 또한, 본 개시는, 상기 이외의 이익에 공헌할 수 있는 구성 또는 방법을 포함할 수 있다.
예를 들면, 본 개시의 일 양태에 따른 부호화 장치는, 회로와, 상기 회로에 접속된 메모리를 구비하고, 상기 회로는, 동작에 있어서, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 부호화에 사용되는 예측 화상을 생성한다.
본 개시에 있어서의 실시 형태 중 몇 가지 실장은, 부호화 효율을 개선해도 되고, 부호화/복호 처리를 간소화해도 되고, 부호화/복호 처리 속도를 빠르게 해도 되고, 적절한 필터, 블록 사이즈, 움직임 벡터, 참조 픽처, 참조 블록 등과 같은, 부호화 및 복호에 사용되는 적절한 구성 요소/동작을 효율적으로 선택해도 된다.
본 개시의 일 양태에 있어서의 추가적인 이점 및 효과는, 명세서 및 도면으로부터 명백해진다. 이러한 이점 및/또는 효과는, 몇 가지 실시 형태 그리고 명세서 및 도면에 기재된 특징에 의해 각각 얻어지는데, 1개 또는 그 이상의 이점 및/또는 효과를 얻기 위해 반드시 전부가 제공될 필요는 없다.
또한, 이들 전반적 또는 구체적인 양태는, 시스템, 방법, 집적 회로, 컴퓨터 프로그램, 기록 매체, 또는, 이들의 임의의 조합으로 실현되어도 된다.
본 개시의 일 양태에 따른 구성 또는 방법은, 예를 들면, 부호화 효율의 개선, 화질의 개선, 처리량의 삭감, 회로 규모의 삭감, 처리 속도의 개선, 및, 요소 또는 동작의 적절한 선택 등 중에서 1개 이상에 공헌할 수 있다. 또한, 본 개시의 일 양태에 따른 구성 또는 방법은, 상기 이외의 이익에 공헌해도 된다.
도 1은, 실시 형태에 따른 부호화 장치의 기능 구성을 나타내는 블록도이다.
도 2는, 부호화 장치에 의한 전체적인 부호화 처리의 일례를 나타내는 플로차트이다.
도 3은, 블록 분할의 일례를 나타내는 개념도이다.
도 4a는, 슬라이스의 구성의 일례를 나타내는 개념도이다.
도 4b는, 타일의 구성의 일례를 나타내는 개념도이다.
도 5a는, 다양한 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다.
도 5b는, SVT(Spatially Varying Transform)의 일례를 나타내는 개념도이다.
도 6a는, ALF(adaptive loop filter)로 사용되는 필터의 형상의 일례를 나타내는 개념도이다.
도 6b는, ALF로 사용되는 필터의 형상의 다른 일례를 나타내는 개념도이다.
도 6c는, ALF로 사용되는 필터의 형상의 다른 일례를 나타내는 개념도이다.
도 7은, DBF(deblocking filter)로서 기능하는 루프 필터부의 상세한 구성의 일례를 나타내는 블록도이다.
도 8은, 블록 경계에 대해 대칭인 필터 특성을 갖는 디블로킹·필터의 예를 나타내는 개념도이다.
도 9는, 디블로킹·필터 처리가 행해지는 블록 경계를 설명하기 위한 개념도이다.
도 10은, Bs값의 일례를 나타내는 개념도이다.
도 11은, 부호화 장치의 예측 처리부에서 행해지는 처리의 일례를 나타내는 플로차트이다.
도 12는, 부호화 장치의 예측 처리부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
도 13은, 부호화 장치의 예측 처리부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
도 14는, 실시 형태의 인트라 예측에 있어서의 67개의 인트라 예측 모드의 일례를 나타내는 개념도이다.
도 15는, 인터 예측의 기본적인 처리의 흐름의 일례를 나타내는 플로차트이다.
도 16은, 움직임 벡터 도출의 일례를 나타내는 플로차트이다.
도 17은, 움직임 벡터 도출의 다른 예를 나타내는 플로차트이다.
도 18은, 움직임 벡터 도출의 다른 예를 나타내는 플로차트이다.
도 19는, 노멀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 20은, 머지 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 21은, 머지 모드에 의한 움직임 벡터 도출 처리의 일례를 설명하기 위한 개념도이다.
도 22는, FRUC(frame rate up conversion) 처리의 일례를 나타내는 플로차트이다.
도 23은, 움직임 궤도를 따르는 2개의 블록 사이에서의 패턴 매칭(바이래터럴 매칭)의 일례를 설명하기 위한 개념도이다.
도 24는, 커런트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)의 일례를 설명하기 위한 개념도이다.
도 25a는, 복수의 인접 블록의 움직임 벡터에 의거한 서브 블록 단위의 움직임 벡터 도출의 일례를 설명하기 위한 개념도이다.
도 25b는, 3개의 제어 포인트를 갖는 아핀 모드에 있어서의 서브 블록 단위의 움직임 벡터 도출의 일례를 설명하기 위한 개념도이다.
도 26a는, 아핀 머지 모드를 설명하기 위한 개념도이다.
도 26b는, 2개의 제어 포인트를 갖는 아핀 머지 모드를 설명하기 위한 개념도이다.
도 26c는, 3개의 제어 포인트를 갖는 아핀 머지 모드를 설명하기 위한 개념도이다.
도 27은, 아핀 머지 모드의 처리의 일례를 나타내는 플로차트이다.
도 28a는, 2개의 제어 포인트를 갖는 아핀 인터 모드를 설명하기 위한 개념도이다.
도 28b는, 3개의 제어 포인트를 갖는 아핀 인터 모드를 설명하기 위한 개념도이다.
도 29는, 아핀 인터 모드의 처리의 일례를 나타내는 플로차트이다.
도 30a는, 커런트 블록이 3개의 제어 포인트를 갖고, 인접 블록이 2개의 제어 포인트를 갖는 아핀 인터 모드를 설명하기 위한 개념도이다.
도 30b는, 커런트 블록이 2개의 제어 포인트를 갖고, 인접 블록이 3개의 제어 포인트를 갖는 아핀 인터 모드를 설명하기 위한 개념도이다.
도 31a는, DMVR(decoder motion vector refinement)을 포함하는 머지 모드를 나타내는 플로차트이다.
도 31b는, DMVR 처리의 일례를 설명하기 위한 개념도이다.
도 32는, 예측 화상의 생성의 일례를 나타내는 플로차트이다.
도 33은, 예측 화상의 생성의 다른 예를 나타내는 플로차트이다.
도 34는, 예측 화상의 생성의 다른 예를 나타내는 플로차트이다.
도 35는, OBMC(overlapped block motion compensation) 처리에 의한 예측 화상 보정 처리의 일례를 설명하기 위한 플로차트이다.
도 36은, OBMC 처리에 의한 예측 화상 보정 처리의 일례를 설명하기 위한 개념도이다.
도 37은, 2개의 삼각형의 예측 화상의 생성을 설명하기 위한 개념도이다.
도 38은, 등속 직선 운동을 가정한 모델을 설명하기 위한 개념도이다.
도 39는, LIC(local illumination compensation) 처리에 의한 휘도 보정 처리를 사용한 예측 화상 생성 방법의 일례를 설명하기 위한 개념도이다.
도 40은, 부호화 장치의 실장예를 나타내는 블록도이다.
도 41은, 실시 형태에 따른 복호 장치의 기능 구성을 나타내는 블록도이다.
도 42는, 복호 장치에 의한 전체적인 복호 처리의 일례를 나타내는 플로차트이다.
도 43은, 복호 장치의 예측 처리부에서 행해지는 처리의 일례를 나타내는 플로차트이다.
도 44는, 복호 장치의 예측 처리부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
도 45는, 복호 장치에 있어서의 노멀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 46은, 복호 장치의 실장예를 나타내는 블록도이다.
도 47은, BIO에 따른 인터 예측의 일례를 나타내는 플로차트이다.
도 48은, BIO에 따른 인터 예측을 행하는 인터 예측부의 기능 구성의 일례를 나타내는 도면이다.
도 49는, 실시 형태에 있어서의 BIO에 의거한 복호 처리의 제1 구체예를 나타내는 플로차트이다.
도 50은, 실시 형태에 있어서의 수평 구배값의 산출예를 나타내는 개념도이다.
도 51은, 실시 형태에 있어서의 수직 구배값의 산출예를 나타내는 개념도이다.
도 52는, 실시 형태에 있어서의 BIO에 의거한 복호 처리의 제3 구체예를 나타내는 플로차트이다.
도 53은, 실시 형태에 있어서의 BIO에 의거한 복호 처리의 제4 구체예를 나타내는 플로차트이다.
도 54는, 실시 형태에 따른 부호화 장치의 동작을 나타내는 플로차트이다.
도 55는, 실시 형태에 따른 복호 장치의 동작을 나타내는 플로차트이다.
도 56은, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템의 전체 구성을 나타내는 블록도이다.
도 57은, 스케일러블 부호화 시의 부호화 구조의 일례를 나타내는 개념도이다.
도 58은, 스케일러블 부호화 시의 부호화 구조의 일례를 나타내는 개념도이다.
도 59는, web 페이지의 표시 화면예를 나타내는 개념도이다.
도 60은, web 페이지의 표시 화면예를 나타내는 개념도이다.
도 61은, 스마트폰의 일례를 나타내는 블록도이다.
도 62는, 스마트폰의 구성예를 나타내는 블록도이다.
최근, 쌍방향 옵티컬 플로(bi-directional optical flow)를 사용하여, 동화상을 부호화하는 것이 검토되고 있다. 쌍방향 옵티컬 플로는, BIO 또는 BDOF라고도 불린다.
예를 들면, 쌍방향 옵티컬 플로에서는, 옵티컬 플로 등식에 의거하여, 예측 화상이 생성된다. 보다 구체적으로는, 쌍방향 옵티컬 플로에서는, 블록 단위의 참조 화상의 화소값과, 블록 단위의 참조 화상의 구배값에 의거하여 도출되는 파라미터를 사용하여, 화소 단위로 예측값이 조정된 예측 화상이 생성된다. 쌍방향 옵티컬 플로가 사용됨으로써, 고정밀도의 예측 화상이 생성될 가능성이 높다.
예를 들면, 부호화 장치는, 예측 화상과 원화상의 차분 화상을 부호화한다. 그리고, 복호 장치는, 차분 화상을 복호하고, 차분 화상과 예측 화상을 합함으로써, 재구성 화상을 생성한다. 고정밀도의 예측 화상이 사용됨으로써, 차분 화상의 부호량이 삭감될 수 있다. 즉, 쌍방향 옵티컬 플로가 사용됨으로써, 동화상의 부호량이 삭감될 가능성이 높다.
한편, 쌍방향 옵티컬 플로에 사용되는 파라미터는, 참조 화상의 각 화소 위치의 화소값 및 구배값에 의거하여 도출된다. 그 때문에, 쌍방향 옵티컬 플로에 사용되는 파라미터의 도출에 있어서 화소 위치마다 행해지는 연산에 의해 연산량이 증대할 가능성이 있어, 회로 규모가 증대할 가능성이 있다.
그래서, 예를 들면, 본 개시의 일 양태에 따른 부호화 장치는, 회로와, 상기 회로에 접속된 메모리를 구비하고, 상기 회로는, 동작에 있어서, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 부호화에 사용되는 예측 화상을 생성한다.
이로 인해, 화소 위치마다 행해지는 연산에 있어서 연산량이 큰 실질적인 곱셈이 삭감될 가능성이 있으며, 예측 화상을 생성하기 위한 복수의 파라미터가 저(低) 연산량으로 도출될 가능성이 있다. 따라서, 부호화에 있어서의 처리량이 삭감될 가능성이 있다. 또, 수평 구배값에 상관하는 파라미터와, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터를 포함하는 복수의 파라미터에 의거하여, 예측 화상이 적절히 생성될 가능성이 있다.
예를 들면, 상기 회로는, 후술하는 식 (11.1)에 의해 상기 제1 파라미터를 도출하고, 후술하는 식 (11.2)에 의해 상기 제2 파라미터를 도출하며, 후술하는 식 (11.3)에 의해 상기 제3 파라미터를 도출하고, 후술하는 식 (11.4)에 의해 상기 제4 파라미터를 도출하며, 후술하는 식 (11.5)에 의해 상기 제5 파라미터를 도출하고, Ω는, 상기 복수의 상대적 화소 위치의 집합을 나타내며, [i,j]는, 상기 복수의 상대적 화소 위치 각각을 나타내고, 상기 복수의 상대적 화소 위치 각각에 대해서, Ix 0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내며, Ix 1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내고, Iy 0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내며, Iy 1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내고, I0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내며, I1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내고, abs(Ix 1+Ix 0)은, Ix 1+Ix 0의 절대값을 나타내며, sign(Ix 1+Ix 0)은, Ix 1+Ix 0의 양음 부호를 나타내고, abs(Iy 1+Iy 0)은, Iy1+Iy 0의 절대값을 나타내며, sign(Iy 1+Iy 0)은, Iy 1+Iy 0의 양음 부호를 나타낸다.
이로 인해, 화소값, 수평 구배값 및 수직 구배값을 사용하여, 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다.
또, 예를 들면, 상기 회로는, 상기 제3 파라미터를 상기 제1 파라미터로 나눔으로써 제6 파라미터를 도출하고, 상기 제4 파라미터로부터, 상기 제5 파라미터와 상기 제6 파라미터의 곱을 빼고, 상기 제2 파라미터로 나눔으로써 제7 파라미터를 도출하며, 상기 제6 파라미터 및 상기 제7 파라미터를 사용하여, 상기 예측 화상을 생성한다.
이로 인해, 복수의 파라미터가, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터로 적절히 집약될 가능성이 있다. 수평 방향에 대응하는 파라미터에는, 수평 구배값에 상관하는 파라미터가 적절히 들여와질 가능성이 있다. 수직 방향에 대응하는 파라미터에는, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터와, 수평 방향에 대응하는 파라미터가, 적절히 들여와질 가능성이 있다. 그리고, 이 2개의 파라미터를 사용하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 상기 회로는, 후술하는 식 (10.8)에 의해 상기 제6 파라미터를 도출하고, 후술하는 식 (10.9)에 의해 상기 제7 파라미터를 도출하며, sGx는, 상기 제1 파라미터를 나타내고, sGy는, 상기 제2 파라미터를 나타내며, sGxdI는, 상기 제3 파라미터를 나타내고, sGydI는, 상기 제4 파라미터를 나타내며, sGxGy는, 상기 제5 파라미터를 나타내고, u는, 상기 제6 파라미터를 나타내며, Bits는, 인수의 이진 로그를 정수로 절상함으로써 얻어지는 값을 반환하는 함수이다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터가, 저 연산량으로 도출될 가능성이 있다.
또, 예를 들면, 상기 회로는, 상기 커런트 블록에 포함되는 처리 대상 화소 위치의 예측 화소값을, 상기 제1 참조 블록에 있어서 상기 처리 대상 화소 위치에 대응하는 제1 화소 위치의 제1 화소값과, 상기 제1 화소 위치의 제1 수평 구배값과, 상기 제1 화소 위치의 제1 수직 구배값과, 상기 제2 참조 블록에 있어서 상기 처리 대상 화소 위치에 대응하는 제2 화소 위치의 제2 화소값과, 상기 제2 화소 위치의 제2 수평 구배값과, 상기 제2 화소 위치의 제2 수직 구배값과, 상기 제6 파라미터와, 상기 제7 파라미터를 사용하여 도출함으로써, 상기 예측 화상을 생성한다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등을 사용하여, 예측 화상이 생성되고, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터가, 예측 화상에 적절히 반영될 가능성이 있다.
또, 예를 들면, 상기 회로는, 상기 제1 화소값과, 상기 제2 화소값과, 제1 보정값과, 제2 보정값의 합을 2로 나눔으로써, 상기 예측 화소값을 도출하고, 상기 제1 보정값은, 상기 제1 수평 구배값과 상기 제2 수평 구배값의 차와, 상기 제6 파라미터의 곱에 대응하며, 상기 제2 보정값은, 상기 제1 수직 구배값과 상기 제2 수직 구배값의 차와, 상기 제7 파라미터의 곱에 대응한다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등을 사용하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 상기 회로는, 후술하는 식 (10.10)에 의해 상기 예측 화소값을 도출하고, I0은, 상기 제1 화소값을 나타내며, I1은, 상기 제2 화소값을 나타내고, u는, 상기 제6 파라미터를 나타내며, Ix 0은, 상기 제1 수평 구배값을 나타내고, Ix 1은, 상기 제2 수평 구배값을 나타내며, v는, 상기 제7 파라미터를 나타내고, Iy 0은, 상기 제1 수직 구배값을 나타내며, Iy 1은, 상기 제2 수직 구배값을 나타낸다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등에 관련된 식에 따라, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 본 개시의 일 양태에 따른 복호 장치는, 회로와, 상기 회로에 접속된 메모리를 구비하고, 상기 회로는, 동작에 있어서, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 복호에 사용되는 예측 화상을 생성한다.
이로 인해, 화소 위치마다 행해지는 연산에 있어서 연산량이 큰 실질적인 곱셈이 삭감될 가능성이 있어, 예측 화상을 생성하기 위한 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다. 따라서, 복호에 있어서의 처리량이 삭감될 가능성이 있다. 또, 수평 구배값에 상관하는 파라미터와, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터를 포함하는 복수의 파라미터에 의거하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 상기 회로는, 후술하는 식 (11.1)에 의해 상기 제1 파라미터를 도출하고, 후술하는 식 (11.2)에 의해 상기 제2 파라미터를 도출하며, 후술하는 식 (11.3)에 의해 상기 제3 파라미터를 도출하고, 후술하는 식 (11.4)에 의해 상기 제4 파라미터를 도출하며, 후술하는 식 (11.5)에 의해 상기 제5 파라미터를 도출하고, Ω는, 상기 복수의 상대적 화소 위치의 집합을 나타내며, [i,j]는, 상기 복수의 상대적 화소 위치 각각을 나타내고, 상기 복수의 상대적 화소 위치 각각에 대해서, Ix 0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내며, Ix 1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내고, Iy 0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내며, Iy 1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내고, I0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내며, I1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내고, abs(Ix 1+Ix 0)은, Ix 1+Ix 0의 절대값을 나타내며, sign(Ix 1+Ix 0)은, Ix 1+Ix 0의 양음 부호를 나타내고, abs(Iy 1+Iy 0)은, Iy 1+Iy 0의 절대값을 나타내며, sign(Iy 1+Iy 0)은, Iy 1+Iy 0의 양음 부호를 나타낸다.
이로 인해, 화소값, 수평 구배값 및 수직 구배값을 사용하여, 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다.
또, 예를 들면, 상기 회로는, 상기 제3 파라미터를 상기 제1 파라미터로 나눔으로써 제6 파라미터를 도출하고, 상기 제4 파라미터로부터, 상기 제5 파라미터와 상기 제6 파라미터의 곱을 빼고, 상기 제2 파라미터로 나눔으로써 제7 파라미터를 도출하며, 상기 제6 파라미터 및 상기 제7 파라미터를 사용하여, 상기 예측 화상을 생성한다.
이로 인해, 복수의 파라미터가, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터로 적절히 집약될 가능성이 있다. 수평 방향에 대응하는 파라미터에는, 수평 구배값에 상관하는 파라미터가 적절히 들여와질 가능성이 있다. 수직 방향에 대응하는 파라미터에는, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터와, 수평 방향에 대응하는 파라미터가, 적절히 들여와질 가능성이 있다. 그리고, 이 2개의 파라미터를 사용하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 상기 회로는, 후술하는 식 (10.8)에 의해 상기 제6 파라미터를 도출하고, 후술하는 식 (10.9)에 의해 상기 제7 파라미터를 도출하며, sGx는, 상기 제1 파라미터를 나타내고, sGy는, 상기 제2 파라미터를 나타내며, sGxdI는, 상기 제3 파라미터를 나타내고, sGydI는, 상기 제4 파라미터를 나타내며, sGxGy는, 상기 제5 파라미터를 나타내고, u는, 상기 제6 파라미터를 나타내며, Bits는, 인수의 이진 로그를 정수로 절상함으로써 얻어지는 값을 반환하는 함수이다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터가, 저 연산량으로 도출될 가능성이 있다.
또, 예를 들면, 상기 회로는, 상기 커런트 블록에 포함되는 처리 대상 화소 위치의 예측 화소값을, 상기 제1 참조 블록에 있어서 상기 처리 대상 화소 위치에 대응하는 제1 화소 위치의 제1 화소값과, 상기 제1 화소 위치의 제1 수평 구배값과, 상기 제1 화소 위치의 제1 수직 구배값과, 상기 제2 참조 블록에 있어서 상기 처리 대상 화소 위치에 대응하는 제2 화소 위치의 제2 화소값과, 상기 제2 화소 위치의 제2 수평 구배값과, 상기 제2 화소 위치의 제2 수직 구배값과, 상기 제6 파라미터와, 상기 제7 파라미터를 사용하여 도출함으로써, 상기 예측 화상을 생성한다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등을 사용하여, 예측 화상이 생성되고, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터가, 예측 화상에 적절히 반영될 가능성이 있다.
또, 예를 들면, 상기 회로는, 상기 제1 화소값과, 상기 제2 화소값과, 제1 보정값과, 제2 보정값의 합을 2로 나눔으로써, 상기 예측 화소값을 도출하고, 상기 제1 보정값은, 상기 제1 수평 구배값과 상기 제2 수평 구배값의 차와, 상기 제6 파라미터의 곱에 대응하며, 상기 제2 보정값은, 상기 제1 수직 구배값과 상기 제2 수직 구배값의 차와, 상기 제7 파라미터의 곱에 대응한다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등을 사용하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 상기 회로는, 후술하는 식 (10.10)에 의해 상기 예측 화소값을 도출하고, I0은, 상기 제1 화소값을 나타내며, I1은, 상기 제2 화소값을 나타내고, u는, 상기 제6 파라미터를 나타내며, Ix 0은, 상기 제1 수평 구배값을 나타내고, Ix 1은, 상기 제2 수평 구배값을 나타내며, v는, 상기 제7 파라미터를 나타내고, Iy 0은, 상기 제1 수직 구배값을 나타내며, Iy 1은, 상기 제2 수직 구배값을 나타낸다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등에 관련된 식에 따라, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 본 개시의 일 양태에 따른 부호화 방법은, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 부호화에 사용되는 예측 화상을 생성한다.
이로 인해, 화소 위치마다 행해지는 연산에 있어서 연산량이 큰 실질적인 곱셈이 삭감될 가능성이 있어, 예측 화상을 생성하기 위한 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다. 따라서, 부호화에 있어서의 처리량이 삭감될 가능성이 있다. 또, 수평 구배값에 상관하는 파라미터와, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터를 포함하는 복수의 파라미터에 의거하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 본 개시의 일 양태에 따른 복호 방법은, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 복호에 사용되는 예측 화상을 생성한다.
이로 인해, 화소 위치마다 행해지는 연산에 있어서 연산량이 큰 실질적인 곱셈이 삭감될 가능성이 있어, 예측 화상을 생성하기 위한 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다. 따라서, 복호에 있어서의 처리량이 삭감될 가능성이 있다. 또, 수평 구배값에 상관하는 파라미터와, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터를 포함하는 복수의 파라미터에 의거하여, 예측 화상이 적절히 생성될 가능성이 있다.
혹은, 예를 들면, 본 개시의 일 양태에 따른 부호화 장치는, 분할부와, 인트라 예측부와, 인터 예측부와, 변환부와, 양자화부와, 엔트로피 부호화부를 구비한다.
상기 분할부는, 상기 동화상을 구성하는 부호화 대상 픽처를 복수의 블록으로 분할한다. 상기 인트라 예측부는, 상기 부호화 대상 픽처에 있어서의 참조 화상을 사용하여 상기 부호화 대상 픽처에 있어서의 부호화 대상 블록의 상기 예측 화상을 생성하는 인트라 예측을 행한다. 상기 인터 예측부는, 상기 부호화 대상 픽처와는 상이한 참조 픽처에 있어서의 참조 화상을 사용하여 상기 부호화 대상 블록의 상기 예측 화상을 생성하는 인터 예측을 행한다.
상기 변환부는, 상기 인트라 예측부 또는 상기 인터 예측부에서 생성된 상기 예측 화상과, 상기 부호화 대상 블록의 화상 사이에 있어서의 예측 오차 신호를 변환하여, 상기 부호화 대상 블록의 변환 계수 신호를 생성한다. 상기 양자화부는, 상기 변환 계수 신호를 양자화한다. 상기 엔트로피 부호화부는, 양자화 완료된 상기 변환 계수 신호를 부호화한다.
또, 예를 들면, 상기 인터 예측부는, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 부호화에 사용되는 예측 화상을 생성한다.
혹은, 예를 들면, 본 개시의 일 양태에 따른 복호 장치는, 엔트로피 복호부와, 역양자화부와, 역변환부와, 인트라 예측부와, 인터 예측부와, 가산부(재구성부)를 구비한다.
상기 엔트로피 복호부는, 상기 동화상을 구성하는 복호 대상 픽처에 있어서의 복호 대상 블록의 양자화 완료된 변환 계수 신호를 복호한다. 상기 역양자화부는, 양자화 완료된 상기 변환 계수 신호를 역양자화한다. 상기 역변환부는, 상기 변환 계수 신호를 역변환하여, 상기 복호 대상 블록의 예측 오차 신호를 취득한다.
상기 인트라 예측부는, 상기 복호 대상 픽처에 있어서의 참조 화상을 사용하여 상기 복호 대상 블록의 상기 예측 화상을 생성하는 인트라 예측을 행한다. 상기 인터 예측부는, 상기 복호 대상 픽처와는 상이한 참조 픽처에 있어서의 참조 화상을 사용하여 상기 복호 대상 블록의 예측 화상을 생성하는 인터 예측을 행한다. 상기 가산부는, 상기 인트라 예측부 또는 상기 인터 예측부에서 생성된 상기 예측 화상과, 상기 예측 오차 신호를 합해서, 상기 복호 대상 블록의 화상을 재구성한다.
또, 예를 들면, 상기 인터 예측부는, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 복호에 사용되는 예측 화상을 생성한다.
또한, 이들 포괄적 또는 구체적인 양태는, 시스템, 장치, 방법, 집적 회로, 컴퓨터 프로그램, 또는, 컴퓨터 판독 가능한 CD-ROM 등의 비일시적인 기록 매체로 실현되어도 되고, 시스템, 장치, 방법, 집적 회로, 컴퓨터 프로그램, 및, 기록 매체의 임의의 조합으로 실현되어도 된다.
이하, 실시 형태에 대해서 도면을 참조하면서 구체적으로 설명한다. 또한, 이하에서 설명하는 실시 형태는, 모두 포괄적 또는 구체적인 예를 나타내는 것이다. 이하의 실시 형태에서 나타나는 수치, 형상, 재료, 구성 요소, 구성 요소의 배치 위치 및 접속 형태, 단계, 단계의 관계 및 순서 등은 일례이며, 청구의 범위를 한정하는 주지가 아니다.
이하에서는, 부호화 장치 및 복호화 장치의 실시 형태를 설명한다. 실시 형태는, 본 개시의 각 양태에서 설명하는 처리 및/또는 구성을 적용 가능한 부호화 장치 및 복호화 장치의 예이다. 처리 및/또는 구성은, 실시 형태와는 상이한 부호화 장치 및 복호화 장치에 있어서도 실시 가능하다. 예를 들면, 실시 형태에 대해 적용되는 처리 및/또는 구성에 관하여, 예를 들면 이하 중 어느 하나를 실시해도 된다.
(1) 본 개시의 각 양태에서 설명하는 실시 형태의 부호화 장치 또는 복호 장치의 복수의 구성 요소 중 어느 하나는, 본 개시의 각 양태 중 어느 하나에서 설명하는 다른 구성 요소로 치환 또는 조합되어도 된다.
(2) 실시 형태의 부호화 장치 또는 복호 장치에 있어서, 당해 부호화 장치 또는 복호 장치의 복수의 구성 요소 중 일부의 구성 요소에 의해 행해지는 기능 또는 처리에, 기능 또는 처리의 추가, 치환, 삭제 등의 임의의 변경이 이루어져도 된다. 예를 들면, 어느 하나의 기능 또는 처리는, 본 개시의 각 양태 중 어느 하나에서 설명하는 다른 기능 또는 처리로, 치환 또는 조합되어도 된다.
(3) 실시 형태의 부호화 장치 또는 복호 장치가 실시하는 방법에 있어서, 당해 방법에 포함되는 복수의 처리 중 일부의 처리에 대해서, 추가, 치환 및 삭제 등의 임의의 변경이 이루어져도 된다. 예를 들면, 방법에 있어서의 어느 하나의 처리는, 본 개시의 각 양태 중 어느 하나에서 설명하는 다른 처리로, 치환 또는 조합되어도 된다.
(4) 실시 형태의 부호화 장치 또는 복호 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소는, 본 개시의 각 양태 중 어느 하나에서 설명하는 구성 요소와 조합되어도 되고, 본 개시의 각 양태 중 어느 하나에서 설명하는 기능의 일부를 구비하는 구성 요소와 조합되어도 되고, 본 개시의 각 양태에서 설명하는 구성 요소가 실시하는 처리의 일부를 실시하는 구성 요소와 조합되어도 된다.
(5) 실시 형태의 부호화 장치 또는 복호 장치의 기능의 일부를 구비하는 구성 요소, 또는, 실시 형태의 부호화 장치 또는 복호 장치의 처리의 일부를 실시하는 구성 요소는, 본 개시의 각 양태 중 어느 하나에서 설명하는 구성 요소와, 본 개시의 각 양태 중 어느 하나에서 설명하는 기능의 일부를 구비하는 구성 요소와, 또는, 본 개시의 각 양태 중 어느 하나에서 설명하는 처리의 일부를 실시하는 구성 요소와 조합 또는 치환되어도 된다.
(6) 실시 형태의 부호화 장치 또는 복호 장치가 실시하는 방법에 있어서, 당해 방법에 포함되는 복수의 처리 중 어느 하나는, 본 개시의 각 양태 중 어느 하나에서 설명하는 처리로, 또는, 마찬가지의 어느 하나의 처리로, 치환 또는 조합되어도 된다.
(7) 실시 형태의 부호화 장치 또는 복호 장치가 실시하는 방법에 포함되는 복수의 처리 중 일부의 처리는, 본 개시의 각 양태 중 어느 하나에서 설명하는 처리와 조합되어도 된다.
(8) 본 개시의 각 양태에서 설명하는 처리 및/또는 구성의 실시 방법은, 실시 형태의 부호화 장치 또는 복호 장치로 한정되는 것은 아니다. 예를 들면, 처리 및/또는 구성은, 실시 형태에 있어서 개시하는 동화상 부호화 또는 동화상 복호와는 상이한 목적으로 이용되는 장치에 있어서 실시되어도 된다.
[부호화 장치]
우선, 실시 형태에 따른 부호화 장치를 설명한다. 도 1은, 실시 형태에 따른 부호화 장치(100)의 기능 구성을 나타내는 블록도이다. 부호화 장치(100)는, 동화상을 블록 단위로 부호화하는 동화상 부호화 장치이다.
도 1에 나타내는 바와 같이, 부호화 장치(100)는, 화상을 블록 단위로 부호화하는 장치로서, 분할부(102)와, 감산부(104)와, 변환부(106)와, 양자화부(108)와, 엔트로피 부호화부(110)와, 역양자화부(112)와, 역변환부(114)와, 가산부(116)와, 블록 메모리(118)와, 루프 필터부(120)와, 프레임 메모리(122)와, 인트라 예측부(124)와, 인터 예측부(126)와, 예측 제어부(128)를 구비한다.
부호화 장치(100)는, 예를 들면, 범용 프로세서 및 메모리에 의해 실현된다. 이 경우, 메모리에 저장된 소프트웨어 프로그램이 프로세서에 의해 실행되었을 때에, 프로세서는, 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)로서 기능한다. 또, 부호화 장치(100)는, 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에 대응하는 전용의 1 이상의 전자 회로로서 실현되어도 된다.
이하에, 부호화 장치(100)의 전체적인 처리의 흐름을 설명한 후에, 부호화 장치(100)에 포함되는 각 구성 요소에 대해서 설명한다.
[부호화 처리의 전체 플로]
도 2는, 부호화 장치(100)에 의한 전체적인 부호화 처리의 일례를 나타내는 플로차트이다.
우선, 부호화 장치(100)의 분할부(102)는, 동화상인 입력 화상에 포함되는 각 픽처를 복수의 고정 사이즈의 블록(예를 들면, 128×128 화소)으로 분할한다(단계 Sa_1). 그리고, 분할부(102)는, 그 고정 사이즈의 블록에 대해 분할 패턴(블록 형상이라고도 한다)을 선택한다(단계 Sa_2). 즉, 분할부(102)는, 고정 사이즈의 블록을, 그 선택된 분할 패턴을 구성하는 복수의 블록으로, 추가로 분할한다. 그리고, 부호화 장치(100)는, 그 복수의 블록 각각에 대해서, 그 블록(즉 부호화 대상 블록)에 대해 단계 Sa_3~Sa_9의 처리를 행한다.
즉, 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)의 전부 또는 일부로 이루어지는 예측 처리부는, 부호화 대상 블록(커런트 블록이라고도 한다)의 예측 신호(예측 블록이라고도 한다)를 생성한다(단계 Sa_3).
다음에, 감산부(104)는, 부호화 대상 블록과 예측 블록의 차분을 예측 잔차(차분 블록이라고도 한다)로서 생성한다(단계 Sa_4).
다음에, 변환부(106) 및 양자화부(108)는, 그 차분 블록에 대해 변환 및 양자화를 행함으로써, 복수의 양자화 계수를 생성한다(단계 Sa_5). 또한, 복수의 양자화 계수로 이루어지는 블록을 계수 블록이라고도 한다.
다음에, 엔트로피 부호화부(110)는, 그 계수 블록과, 예측 신호의 생성에 관한 예측 파라미터에 대해 부호화(구체적으로는 엔트로피 부호화)를 행함으로써, 부호화 신호를 생성한다(단계 Sa_6). 또한, 부호화 신호는, 부호화 비트 스트림, 압축 비트 스트림, 또는 스트림이라고도 한다.
다음에, 역양자화부(112) 및 역변환부(114)는, 계수 블록에 대해 역양자화 및 역변환을 행함으로써, 복수의 예측 잔차(즉 차분 블록)를 복원한다(단계 Sa_7).
다음에, 가산부(116)는, 그 복원된 차분 블록에 예측 블록을 가산함으로써 커런트 블록을 재구성 화상(재구성 블록 또는 복호 화상 블록이라고도 한다)으로 재구성한다(단계 Sa_8). 이로 인해, 재구성 화상이 생성된다.
이 재구성 화상이 생성되면, 루프 필터부(120)는, 그 재구성 화상에 대해 필터링을 필요에 따라 행한다(단계 Sa_9).
그리고, 부호화 장치(100)는, 픽처 전체의 부호화가 완료되었는지 여부를 판정하고(단계 Sa_10), 완료되지 않았다고 판정하는 경우(단계 Sa_10의 No), 단계 Sa_2에서부터의 처리를 반복하여 실행한다.
또한, 상술한 예에서는, 부호화 장치(100)는, 고정 사이즈의 블록에 대해 1개의 분할 패턴을 선택하고, 그 분할 패턴에 따라 각 블록의 부호화를 행하는데, 복수의 분할 패턴 각각에 따라 각 블록의 부호화를 행해도 된다. 이 경우에는, 부호화 장치(100)는, 복수의 분할 패턴 각각에 대한 코스트를 평가하고, 예를 들면 가장 작은 코스트의 분할 패턴에 따른 부호화에 의해 얻어지는 부호화 신호를, 출력되는 부호화 신호로서 선택해도 된다.
도시되어 있는 바와 같이, 이들 단계 Sa_1~Sa_10의 처리는, 부호화 장치(100)에 의해 시퀀셜하게 행해진다. 혹은, 그들 처리 중 일부의 복수의 처리가 병렬로 행해져도 되고, 그들 처리의 순서 바꿈 등이 행해져도 된다.
[분할부]
분할부(102)는, 입력 동화상에 포함되는 각 픽처를 복수의 블록으로 분할하고, 각 블록을 감산부(104)에 출력한다. 예를 들면, 분할부(102)는, 우선, 픽처를 고정 사이즈(예를 들면 128×128)의 블록으로 분할한다. 다른 고정 블록 사이즈가 채용되어도 된다. 이 고정 사이즈의 블록은, 부호화 트리 유닛(CTU)으로 불리는 경우가 있다. 그리고, 분할부(102)는, 예를 들면 재귀적인 4진 트리(quadtree) 및/또는 2진 트리(binary tree) 블록 분할에 의거하여, 고정 사이즈의 블록 각각을 가변 사이즈(예를 들면 64×64 이하)의 블록으로 분할한다. 즉, 분할부(102)는, 분할 패턴을 선택한다. 이 가변 사이즈의 블록은, 부호화 유닛(CU), 예측 유닛(PU) 혹은 변환 유닛(TU)으로 불리는 경우가 있다. 또한, 여러 가지 처리예에서는, CU, PU 및 TU는 구별될 필요는 없고, 픽처 내의 일부 또는 모든 블록이 CU, PU, TU의 처리 단위가 되어도 된다.
도 3은, 실시 형태에 있어서의 블록 분할의 일례를 나타내는 개념도이다. 도 3에 있어서, 실선은 4진 트리 블록 분할에 의한 블록 경계를 나타내고, 파선은 2진 트리 블록 분할에 의한 블록 경계를 나타낸다.
여기에서는, 블록(10)은, 128×128 화소의 정사각형 블록(128×128 블록)이다. 이 128×128 블록(10)은, 우선, 4개의 정사각형의 64×64 블록으로 분할된다(4진 트리 블록 분할).
좌상측의 64×64 블록은, 추가로 2개의 직사각형의 32×64 블록으로 수직으로 분할되고, 좌측의 32×64 블록은 추가로 2개의 직사각형의 16×64 블록으로 수직으로 분할된다(2진 트리 블록 분할). 그 결과, 좌상측의 64×64 블록은, 2개의 16×64 블록(11, 12)과, 32×64 블록(13)으로 분할된다.
우상측의 64×64 블록은, 2개의 직사각형의 64×32 블록(14, 15)으로 수평으로 분할된다(2진 트리 블록 분할).
좌하측의 64×64 블록은, 4개의 정사각형의 32×32 블록으로 분할된다(4진 트리 블록 분할). 4개의 32×32 블록 중 좌상측의 블록 및 우하측의 블록은 추가로 분할된다. 좌상측의 32×32 블록은, 2개의 직사각형의 16×32 블록으로 수직으로 분할되고, 우측의 16×32 블록은 추가로 2개의 16×16 블록으로 수평으로 분할된다(2진 트리 블록 분할). 우하측의 32×32 블록은, 2개의 32×16 블록으로 수평으로 분할된다(2진 트리 블록 분할). 그 결과, 좌하측의 64×64 블록은, 16×32 블록(16)과, 2개의 16×16 블록(17, 18)과, 2개의 32×32 블록(19, 20)과, 2개의 32×16 블록(21, 22)으로 분할된다.
우하측의 64×64 블록(23)은 분할되지 않는다.
이상과 같이, 도 3에서는, 블록(10)은, 재귀적인 4진 트리 및 2진 트리 블록 분할에 의거하여, 13개의 가변 사이즈의 블록(11~23)으로 분할된다. 이러한 분할은, QTBT(quad-tree plus binary tree) 분할로 불리는 경우가 있다.
또한, 도 3에서는, 1개의 블록이 4개 또는 2개의 블록으로 분할되고 있었지만(4진 트리 또는 2진 트리 블록 분할), 분할은 이들에 한정되지 않는다. 예를 들면, 1개의 블록이 3개의 블록으로 분할되어도 된다(3진 트리 블록 분할). 이러한 3진 트리 블록 분할을 포함하는 분할은, MBT(multi type tree) 분할로 불리는 경우가 있다.
[픽처의 구성 슬라이스/타일]
픽처를 병렬로 디코딩하기 위해, 픽처는 슬라이스 단위 또는 타일 단위로 구성되는 경우가 있다. 슬라이스 단위 또는 타일 단위로 이루어지는 픽처는, 분할부(102)에 의해 구성되어도 된다.
슬라이스는, 픽처를 구성하는 기본적인 부호화의 단위이다. 픽처는, 예를 들면 1개 이상의 슬라이스로 구성된다. 또, 슬라이스는, 1개 이상의 연속하는 CTU(Coding Tree Unit)로 이루어진다.
도 4a는, 슬라이스의 구성의 일례를 나타내는 개념도이다. 예를 들면, 픽처는, 11×8개의 CTU를 포함하고, 또한, 4개의 슬라이스(슬라이스 1-4)로 분할된다. 슬라이스 1은, 16개의 CTU로 이루어지고, 슬라이스 2는, 21개의 CTU로 이루어지며, 슬라이스 3은, 29개의 CTU로 이루어지고, 슬라이스 4는, 22개의 CTU로 이루어진다. 여기서, 픽처 내의 각 CTU는, 어느 하나의 슬라이스에 속한다. 슬라이스의 형상은, 픽처를 수평 방향으로 분할한 형태가 된다. 슬라이스의 경계는, 화면 끝일 필요는 없고, 화면 내의 CTU의 경계 중 어느 곳이어도 된다. 슬라이스 중의 CTU의 처리 순(부호화 순 또는 복호 순)은, 예를 들면 래스터·스캔 순이다. 또, 슬라이스는, 헤더 정보와 부호화 데이터를 포함한다. 헤더 정보에는, 슬라이스의 선두의 CTU 어드레스, 슬라이스·타입 등 그 슬라이스의 특징이 기술되어도 된다.
타일은, 픽처를 구성하는 직사각형 영역의 단위이다. 각 타일에는 TileId로 불리는 번호가 래스터·스캔 순으로 배정되어도 된다.
도 4b는, 타일의 구성의 일례를 나타내는 개념도이다. 예를 들면, 픽처는, 11×8개의 CTU를 포함하고, 또한, 4개의 직사각형 영역의 타일(타일 1-4)로 분할된다. 타일이 사용되는 경우, 타일이 사용되지 않는 경우와 비교해서 CTU의 처리 순이 변경된다. 타일이 사용되지 않는 경우, 픽처 내의 복수의 CTU는 래스터·스캔 순으로 처리된다. 타일이 사용되는 경우에는, 복수의 타일 각각에 있어서, 적어도 1개의 CTU가 래스터·스캔 순으로 처리된다. 예를 들면, 도 4b에 나타내는 바와 같이, 타일 1에 포함되는 복수의 CTU의 처리 순은, 타일 1의 1행째 좌측 끝에서부터 타일 1의 1행째 우측 끝까지 향하고, 다음에, 타일 1의 2행째 좌측 끝에서부터 타일 1의 2행째 우측 끝까지 향하는 순이다.
또한, 1개의 타일은, 1개 이상의 슬라이스를 포함하는 경우가 있으며, 1개의 슬라이스는, 1개 이상의 타일을 포함하는 경우가 있다.
[감산부]
감산부(104)는, 분할부(102)로부터 입력되어, 분할부(102)에 의해 분할된 블록 단위로, 원신호(원샘플)로부터 예측 신호(이하에 나타내는 예측 제어부(128)로부터 입력되는 예측 샘플)를 감산한다. 즉, 감산부(104)는, 부호화 대상 블록(이하, 커런트 블록이라고 한다)의 예측 오차(잔차라고도 한다)를 산출한다. 그리고, 감산부(104)는, 산출된 예측 오차(잔차)를 변환부(106)에 출력한다.
원신호는, 부호화 장치(100)의 입력 신호이며, 동화상을 구성하는 각 픽처의 화상을 나타내는 신호(예를 들면 휘도(luma) 신호 및 2개의 색차(chroma) 신호)이다. 이하에 있어서, 화상을 나타내는 신호를 샘플이라고 하는 경우도 있다.
[변환부]
변환부(106)는, 공간 영역의 예측 오차를 주파수 영역의 변환 계수로 변환하고, 변환 계수를 양자화부(108)에 출력한다. 구체적으로는, 변환부(106)는, 예를 들면 공간 영역의 예측 오차에 대해 소정의 이산 코사인 변환(DCT) 또는 이산 사인 변환(DST)을 행한다. 소정의 DCT 또는 DST는, 미리 정해져 있어도 된다.
또한, 변환부(106)는, 복수의 변환 타입 중에서 적응적으로 변환 타입을 선택하고, 선택된 변환 타입에 대응하는 변환 기저 함수(transform basis function)를 사용하여, 예측 오차를 변환 계수로 변환해도 된다. 이러한 변환은, EMT(explicit multiple core transform) 또는 AMT(adaptive multiple transform)로 불리는 경우가 있다.
복수의 변환 타입은, 예를 들면, DCT-II, DCT-V, DCT-VIII, DST-I 및 DST-VII를 포함한다. 도 5a는, 변환 타입 예에 대응하는 변환 기저 함수를 나타내는 표이다. 도 5a에 있어서 N은 입력 화소의 수를 나타낸다. 이들 복수의 변환 타입 중에서의 변환 타입의 선택은, 예를 들면, 예측의 종류(인트라 예측 및 인터 예측)에 의존해도 되고, 인트라 예측 모드에 의존해도 된다.
이러한 EMT 또는 AMT를 적용할지 여부를 나타내는 정보(예를 들면 EMT 플래그 또는 AMT 플래그로 불린다) 및 선택된 변환 타입을 나타내는 정보는, 통상, CU 레벨에서 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 비트 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
또, 변환부(106)는, 변환 계수(변환 결과)를 재변환해도 된다. 이러한 재변환은, AST(adaptive secondary transform) 또는 NSST(non-separable secondary transform)로 불리는 경우가 있다. 예를 들면, 변환부(106)는, 인트라 예측 오차에 대응하는 변환 계수의 블록에 포함되는 서브 블록(예를 들면 4×4 서브 블록) 마다 재변환을 행한다. NSST를 적용할지 여부를 나타내는 정보 및 NSST에 사용되는 변환 행렬에 관한 정보는, 통상, CU 레벨에서 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
변환부(106)에는, Separable한 변환과, Non-Separable한 변환이 적용되어도 된다. Separable한 변환이란, 입력의 차원의 수만큼 방향마다 분리하여 복수회 변환을 행하는 방식이며, Non-Separable한 변환이란, 입력이 다차원이었을 때에 2개 이상의 차원을 통합해 1차원으로 간주하여, 통합하여 변환을 행하는 방식이다.
예를 들면, Non-Separable한 변환의 일례로서, 입력이 4×4의 블록이었을 경우에는 그것을 16개의 요소를 가진 하나의 배열로 간주하고, 그 배열에 대해 16×16의 변환 행렬로 변환 처리를 행하는 것을 들 수 있다.
또, Non-Separable한 변환의 또 다른 예에서는, 4×4의 입력 블록을 16개의 요소를 가진 하나의 배열로 간주한 후에, 그 배열에 대해 Givens 회전을 복수회 행하는 변환(Hypercube Givens Transform)이 행해져도 된다.
변환부(106)에서의 변환에서는, CU 내의 영역에 따라 주파수 영역으로 변환하는 기저의 타입을 전환할 수도 있다. 일례로서, SVT(Spatially Varying Transform)가 있다. SVT에서는, 도 5b에 나타내는 바와 같이, 수평 혹은 수직 방향으로 CU를 2등분하고, 어느 한쪽의 영역만 주파수 영역으로의 변환을 행한다. 변환 기저의 타입은 영역마다 설정할 수 있으며, 예를 들면, DST7과 DCT8이 사용된다. 본 예에서는 CU 내의 2개의 영역 중, 어느 한쪽만 변환을 행하고, 다른 한쪽은 변환을 행하지 않는데, 2개의 영역 모두 변환해도 된다. 또, 분할 방법도 2등분뿐만 아니라, 4등분, 혹은 분할을 나타내는 정보를 별도로 부호화하여 CU 분할과 마찬가지로 시그널링하는 등, 보다 유연하게 할 수도 있다. 또한, SVT는, SBT(Sub-block Transform)로 부르는 경우도 있다.
[양자화부]
양자화부(108)는, 변환부(106)로부터 출력된 변환 계수를 양자화한다. 구체적으로는, 양자화부(108)는, 커런트 블록의 변환 계수를 소정의 주사 순서로 주사하고, 주사된 변환 계수에 대응하는 양자화 파라미터(QP)에 의거하여 당해 변환 계수를 양자화한다. 그리고, 양자화부(108)는, 커런트 블록의 양자화된 변환 계수(이하, 양자화 계수라고 한다)를 엔트로피 부호화부(110) 및 역양자화부(112)에 출력한다. 소정의 주사 순서는, 미리 정해져 있어도 된다.
소정의 주사 순서는, 변환 계수의 양자화/역양자화를 위한 순서이다. 예를 들면, 소정의 주사 순서는, 주파수의 오름차순(저주파에서 고주파의 순) 또는 내림차순(고주파에서 저주파의 순)으로 정의되어도 된다.
양자화 파라미터(QP)란, 양자화 스텝(양자화 폭)을 정의하는 파라미터이다. 예를 들면, 양자화 파라미터의 값이 증가하면 양자화 스텝도 증가한다. 즉, 양자화 파라미터의 값이 증가하면 양자화 오차가 증대한다.
또, 양자화에는, 양자화 매트릭스가 사용되는 경우가 있다. 예를 들면, 4×4 및 8×8 등의 주파수 변환 사이즈와, 인트라 예측 및 인터 예측 등의 예측 모드와, 휘도 및 색차 등의 화소 성분에 대응하여 여러 종류의 양자화 매트릭스가 사용되는 경우가 있다. 또한, 양자화란, 소정의 간격으로 샘플링한 값을 소정의 레벨에 대응지어서 디지털화하는 것을 말하며, 이 기술 분야에서는, 반올림, 라운딩, 스케일링과 같은 다른 표현을 사용하여 참조되어도 되고, 반올림, 라운딩, 스케일링을 채용해도 된다. 소정의 간격 및 레벨은, 미리 정해져 있어도 된다.
양자화 매트릭스를 사용하는 방법으로서, 부호화 장치측에서 직접 설정된 양자화 매트릭스를 사용하는 방법과, 디폴트의 양자화 매트릭스(디폴트 매트릭스)를 사용하는 방법이 있다. 부호화 장치측에서는, 양자화 매트릭스를 직접 설정함으로써, 화상의 특징에 따른 양자화 매트릭스를 설정할 수 있다. 그러나, 이 경우, 양자화 매트릭스의 부호화에 의해, 부호량이 증가한다는 단점이 있다.
한편, 양자화 매트릭스를 사용하지 않고, 고역 성분의 계수도 저역 성분의 계수도 똑같이 양자화하는 방법도 있다. 또한, 이 방법은, 계수가 전부 같은 값인 양자화 매트릭스(플랫한 매트릭스)를 사용하는 방법과 같다.
양자화 매트릭스는, 예를 들면, SPS(시퀀스 파라미터 세트: Sequence Parameter Set) 또는 PPS(픽처 파라미터 세트: Picture Parameter Set)로 지정되어도 된다. SPS는, 시퀀스에 대해 사용되는 파라미터를 포함하고, PPS는, 픽처에 대해 사용되는 파라미터를 포함한다. SPS와 PPS는, 단순히 파라미터 세트로 불리는 경우가 있다.
[엔트로피 부호화부]
엔트로피 부호화부(110)는, 양자화부(108)로부터 입력된 양자화 계수에 의거하여 부호화 신호(부호화 비트 스트림)를 생성한다. 구체적으로는, 엔트로피 부호화부(110)는, 예를 들면, 양자화 계수를 2치화하고, 2치 신호를 산술 부호화하여, 압축된 비트 스트림 또는 시퀀스를 출력한다.
[역양자화부]
역양자화부(112)는, 양자화부(108)로부터 입력된 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(112)는, 커런트 블록의 양자화 계수를 소정의 주사 순서로 역양자화한다. 그리고, 역양자화부(112)는, 커런트 블록의 역양자화된 변환 계수를 역변환부(114)에 출력한다. 소정의 주사 순서는, 미리 정해져 있어도 된다.
[역변환부]
역변환부(114)는, 역양자화부(112)로부터 입력된 변환 계수를 역변환함으로써 예측 오차(잔차)를 복원한다. 구체적으로는, 역변환부(114)는, 변환 계수에 대해, 변환부(106)에 의한 변환에 대응하는 역변환을 행함으로써, 커런트 블록의 예측 오차를 복원한다. 그리고, 역변환부(114)는, 복원된 예측 오차를 가산부(116)에 출력한다.
또한, 복원된 예측 오차는, 통상, 양자화에 의해 정보가 손실되어 있으므로, 감산부(104)가 산출한 예측 오차와 일치하지 않는다. 즉, 복원된 예측 오차에는, 통상, 양자화 오차가 포함되어 있다.
[가산부]
가산부(116)는, 역변환부(114)로부터 입력된 예측 오차와 예측 제어부(128)로부터 입력된 예측 샘플을 가산함으로써 커런트 블록을 재구성한다. 그리고, 가산부(116)는, 재구성된 블록을 블록 메모리(118) 및 루프 필터부(120)에 출력한다. 재구성 블록은, 로컬 복호 블록으로 불리는 경우도 있다.
[블록 메모리]
블록 메모리(118)는, 예를 들면, 인트라 예측에서 참조되는 블록으로서 부호화 대상 픽처(커런트 픽처라고 한다) 내의 블록을 저장하기 위한 기억부이다. 구체적으로는, 블록 메모리(118)는, 가산부(116)로부터 출력된 재구성 블록을 저장한다.
[프레임 메모리]
프레임 메모리(122)는, 예를 들면, 인터 예측에 사용되는 참조 픽처를 저장하기 위한 기억부이며, 프레임 버퍼로 불리는 경우도 있다. 구체적으로는, 프레임 메모리(122)는, 루프 필터부(120)에 의해 필터링된 재구성 블록을 저장한다.
[루프 필터부]
루프 필터부(120)는, 가산부(116)에 의해 재구성된 블록에 루프 필터링을 실시하고, 필터링된 재구성 블록을 프레임 메모리(122)에 출력한다. 루프 필터란, 부호화 루프 내에서 사용되는 필터(인루프 필터)이며, 예를 들면, 디블로킹·필터(DF 또는 DBF), 샘플 어댑티브 오프셋(SAO) 및 어댑티브 루프 필터(ALF) 등을 포함한다.
ALF에서는, 부호화 왜곡을 제거하기 위한 최소 제곱 오차 필터가 적용되며, 예를 들면 커런트 블록 내의 2×2 서브 블록마다, 국소적인 구배(gradient)의 방향 및 활성도(activity)에 의거하여 복수의 필터 중에서 선택된 1개의 필터가 적용된다.
구체적으로는, 우선, 서브 블록(예를 들면 2×2 서브 블록)이 복수의 클래스(예를 들면 15 또는 25 클래스)로 분류된다. 서브 블록의 분류는, 구배의 방향 및 활성도에 의거하여 행해진다. 예를 들면, 구배의 방향값 D(예를 들면 0~2 또는 0~4)와 구배의 활성값 A(예를 들면 0~4)를 사용하여 분류값 C(예를 들면 C=5D+A)가 산출된다. 그리고, 분류값 C에 의거하여, 서브 블록이 복수의 클래스로 분류된다.
구배의 방향값 D는, 예를 들면, 복수의 방향(예를 들면 수평, 수직 및 2개의 대각 방향)의 구배를 비교함으로써 도출된다. 또, 구배의 활성값 A는, 예를 들면, 복수의 방향의 구배를 가산하고, 가산 결과를 양자화함으로써 도출된다.
이러한 분류의 결과에 의거하여, 복수의 필터 중에서 서브 블록을 위한 필터가 결정된다.
ALF로 사용되는 필터의 형상으로서는 예를 들면 원대칭 형상이 이용된다. 도 6a~도 6c는, ALF로 사용되는 필터의 형상의 복수의 예를 나타내는 도면이다. 도 6a는, 5×5 다이아몬드 형상 필터를 나타내고, 도 6b는, 7×7 다이아몬드 형상 필터를 나타내며, 도 6c는, 9×9 다이아몬드 형상 필터를 나타낸다. 필터의 형상을 나타내는 정보는, 통상, 픽처 레벨에서 신호화된다. 또한, 필터의 형상을 나타내는 정보의 신호화는, 픽처 레벨로 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 CU 레벨)이어도 된다.
ALF의 온/오프는, 예를 들면, 픽처 레벨 또는 CU 레벨에서 결정되어도 된다. 예를 들면, 휘도에 대해서는 CU 레벨에서 ALF를 적용할지 여부가 결정되어도 되고, 색차에 대해서는 픽처 레벨에서 ALF를 적용할지 여부가 결정되어도 된다. ALF의 온/오프를 나타내는 정보는, 통상, 픽처 레벨 또는 CU 레벨에서 신호화된다. 또한, ALF의 온/오프를 나타내는 정보의 신호화는, 픽처 레벨 또는 CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
선택 가능한 복수의 필터(예를 들면 15 또는 25까지의 필터)의 계수 세트는, 통상, 픽처 레벨에서 신호화된다. 또한, 계수 세트의 신호화는, 픽처 레벨로 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨, CU 레벨 또는 서브 블록 레벨)이어도 된다.
[루프 필터부>디블로킹·필터]
디블로킹·필터에서는, 루프 필터부(120)는, 재구성 화상의 블록 경계에 필터 처리를 행함으로써, 그 블록 경계에 생기는 왜곡을 감소시킨다.
도 7은, 디블로킹·필터로서 기능하는 루프 필터부(120)의 상세한 구성의 일례를 나타내는 블록도이다.
루프 필터부(120)는, 경계 판정부(1201), 필터 판정부(1203)와, 필터 처리부(1205)와, 처리 판정부(1208)와, 필터 특성 결정부(1207)와, 스위치(1202, 1204 및 1206)를 구비한다.
경계 판정부(1201)는, 디블로킹·필터 처리되는 화소(즉 대상 화소)가 블록 경계 부근에 존재하고 있는지 여부를 판정한다. 그리고, 경계 판정부(1201)는, 그 판정 결과를 스위치(1202) 및 처리 판정부(1208)에 출력한다.
스위치(1202)는, 대상 화소가 블록 경계 부근에 존재하고 있다고 경계 판정부(1201)에 의해 판정된 경우에는, 필터 처리 전의 화상을, 스위치(1204)에 출력한다. 반대로, 스위치(1202)는, 경계 판정부(1201)에 의해 대상 화소가 블록 경계 부근에 존재하지 않는다고 판정된 경우에는, 필터 처리 전의 화상을 스위치(1206)에 출력한다.
필터 판정부(1203)는, 대상 화소의 주변에 있는 적어도 1개의 주변 화소의 화소값에 의거하여, 대상 화소에 대해 디블로킹·필터 처리를 행할지 여부를 판정한다. 그리고, 필터 판정부(1203)는, 그 판정 결과를 스위치(1204) 및 처리 판정부(1208)에 출력한다.
스위치(1204)는, 대상 화소에 디블로킹·필터 처리를 행한다고 필터 판정부(1203)에 의해 판정된 경우에는, 스위치(1202)를 통해 취득한 필터 처리 전의 화상을, 필터 처리부(1205)에 출력한다. 반대로, 스위치(1204)는, 대상 화소에 디블로킹·필터 처리를 행하지 않는다고 필터 판정부(1203)에 의해 판정된 경우에는, 스위치(1202)를 통해 취득한 필터 처리 전의 화상을 스위치(1206)에 출력한다.
필터 처리부(1205)는, 스위치(1202 및 1204)를 통해 필터 처리 전의 화상을 취득한 경우에는, 필터 특성 결정부(1207)에 의해 결정된 필터 특성을 갖는 디블로킹·필터 처리를, 대상 화소에 대해 실행한다. 그리고, 필터 처리부(1205)는, 그 필터 처리 후의 화소를 스위치(1206)에 출력한다.
스위치(1206)는, 처리 판정부(1208)에 의한 제어에 따라, 디블로킹·필터 처리되지 않은 화소와, 필터 처리부(1205)에 의해 디블로킹·필터 처리된 화소를 선택적으로 출력한다.
처리 판정부(1208)는, 경계 판정부(1201) 및 필터 판정부(1203) 각각의 판정 결과에 의거하여, 스위치(1206)를 제어한다. 즉, 처리 판정부(1208)는, 대상 화소가 블록 경계 부근에 존재하고 있다고 경계 판정부(1201)에 의해 판정되고, 또한, 대상 화소에 디블로킹·필터 처리를 행한다고 필터 판정부(1203)에 의해 판정된 경우에는, 디블로킹·필터 처리된 화소를 스위치(1206)로부터 출력시킨다. 또, 상술한 경우 이외에서는, 처리 판정부(1208)는, 디블로킹·필터 처리되지 않은 화소를 스위치(1206)로부터 출력시킨다. 이러한 화소의 출력이 반복하여 행해짐으로써, 필터 처리 후의 화상이 스위치(1206)로부터 출력된다.
도 8은, 블록 경계에 대해 대칭인 필터 특성을 갖는 디블로킹·필터의 예를 나타내는 개념도이다.
디블로킹·필터 처리에서는, 예를 들면, 화소값과 양자화 파라미터를 사용하여, 특성이 상이한 2개의 디블로킹·필터, 즉 스트롱 필터 및 위크 필터 중 어느 1개가 선택된다. 스트롱 필터에서는, 도 8에 나타내는 바와 같이, 블록 경계를 사이에 두고 화소 p0~p2와, 화소 q0~q2가 존재하는 경우, 화소 q0~q2 각각의 화소값은, 예를 들면 이하의 식에 나타내는 연산을 행함으로써, 화소값 q'0~q'2로 변경된다.
q'0=(p1+2×p0+2×q0+2×q1+q2+4)/8
q'1=(p0+q0+q1+q2+2)/4
q'2=(p0+q0+q1+3×q2+2×q3+4)/8
또한, 상술한 식에 있어서, p0~p2 및 q0~q2는, 화소 p0~p2 및 화소 q0~q2 각각의 화소값이다. 또, q3은, 화소 q2에 블록 경계와 반대측에 인접하는 화소 q3의 화소값이다. 또, 상술한 각 식의 우변에 있어서, 디블로킹·필터 처리에 사용되는 각 화소의 화소값에 곱해지는 계수가, 필터 계수이다.
또한, 디블로킹·필터 처리에서는, 연산 후의 화소값이 역치를 넘어 설정되지 않도록, 클립 처리가 행해져도 된다. 이 클립 처리에서는, 상술한 식에 의한 연산 후의 화소값은, 양자화 파라미터로부터 결정되는 역치를 사용하여, 「연산 대상 화소값±2×역치」로 클립된다. 이로 인해, 과도한 평활화를 막을 수 있다.
도 9는, 디블로킹·필터 처리가 행해지는 블록 경계를 설명하기 위한 개념도이다. 도 10은, Bs값의 일례를 나타내는 개념도이다.
디블로킹·필터 처리가 행해지는 블록 경계는, 예를 들면, 도 9에서 나타내는 8×8 화소 블록의 PU(Prediction Unit) 또는 TU(Transform Unit)의 경계이다. 디블로킹·필터 처리는, 4행 또는 4열을 단위로 행해질 수 있다. 우선, 도 9에 나타내는 블록 P 및 블록 Q에 대해, 도 10과 같이 Bs(Boundary Strength)값이 결정된다.
도 10의 Bs값에 따라, 동일한 화상에 속하는 블록 경계여도, 상이한 강도의 디블로킹·필터 처리를 행할지 여부가 결정된다. 색차 신호에 대한 디블로킹·필터 처리는, Bs값이 2인 경우에 행해진다. 휘도 신호에 대한 디블로킹·필터 처리는, Bs값이 1 이상으로서, 소정의 조건이 만족된 경우에 행해진다. 소정의 조건은, 미리 정해져 있어도 된다. 또한, Bs값의 판정 조건은 도 10에 나타낸 것으로 한정되지 않고, 다른 파라미터에 의거하여 결정되어도 된다.
[예측 처리부(인트라 예측부·인터 예측부·예측 제어부)]
도 11은, 부호화 장치(100)의 예측 처리부에서 행해지는 처리의 일례를 나타내는 플로차트이다. 또한, 예측 처리부는, 인트라 예측부(124), 인터 예측부(126), 및 예측 제어부(128)의 전부 또는 일부의 구성 요소로 이루어진다.
예측 처리부는, 커런트 블록의 예측 화상을 생성한다(단계 Sb_1). 이 예측 화상은, 예측 신호 또는 예측 블록이라고도 한다. 또한, 예측 신호에는, 예를 들면 인트라 예측 신호 또는 인터 예측 신호가 있다. 구체적으로는, 예측 처리부는, 예측 블록의 생성, 차분 블록의 생성, 계수 블록의 생성, 차분 블록의 복원, 및 복호 화상 블록의 생성이 행해짐으로써 이미 얻어져 있는 재구성 화상을 사용하여, 커런트 블록의 예측 화상을 생성한다.
재구성 화상은, 예를 들면, 참조 픽처의 화상이어도 되고, 커런트 블록을 포함하는 픽처인 커런트 픽처 내의 부호화 완료 블록의 화상이어도 된다. 커런트 픽처 내의 부호화 완료 블록은, 예를 들면 커런트 블록의 인접 블록이다.
도 12는, 부호화 장치(100)의 예측 처리부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
예측 처리부는, 제1 방식으로 예측 화상을 생성하고(단계 Sc_1a), 제2 방식으로 예측 화상을 생성하며(단계 Sc_1b), 제3 방식으로 예측 화상을 생성한다(단계 Sc_1c). 제1 방식, 제2 방식, 및 제3 방식은, 예측 화상을 생성하기 위한 서로 상이한 방식으로서, 각각 예를 들면, 인터 예측 방식, 인트라 예측 방식, 및, 그들 이외의 예측 방식이어도 된다. 이들 예측 방식에서는, 상술한 재구성 화상을 사용해도 된다.
다음에, 예측 처리부는, 단계 Sc_1a, Sc_1b, 및 Sc_1c에서 생성된 복수의 예측 화상 중 어느 1개를 선택한다(단계 Sc_2). 이 예측 화상의 선택, 즉 최종적인 예측 화상을 얻기 위한 방식 또는 모드의 선택은, 생성된 각 예측 화상에 대한 코스트를 산출하고, 그 코스트에 의거하여 행해져도 된다. 또는, 그 예측 화상의 선택은, 부호화의 처리에 사용되는 파라미터에 의거하여 행해져도 된다. 부호화 장치(100)는, 그 선택된 예측 화상, 방식 또는 모드를 특정하기 위한 정보를 부호화 신호(부호화 비트 스트림이라고도 한다)로 신호화해도 된다. 그 정보는, 예를 들면 플래그 등이어도 된다. 이로 인해, 복호 장치는, 그 정보에 의거하여, 부호화 장치(100)에 있어서 선택된 방식 또는 모드에 따라 예측 화상을 생성할 수 있다. 또한, 도 12에 나타내는 예에서는, 예측 처리부는, 각 방식으로 예측 화상을 생성한 후에, 어느 하나의 예측 화상을 선택한다. 그러나, 예측 처리부는, 그들 예측 화상을 생성하기 전에, 상술한 부호화의 처리에 사용되는 파라미터에 의거하여, 방식 또는 모드를 선택하고, 그 방식 또는 모드에 따라 예측 화상을 생성해도 된다.
예를 들면, 제1 방식 및 제2 방식은, 각각 인트라 예측 및 인터 예측으로서, 예측 처리부는, 이들 예측 방식에 따라 생성되는 예측 화상으로부터, 커런트 블록에 대한 최종적인 예측 화상을 선택해도 된다.
도 13은, 부호화 장치(100)의 예측 처리부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
우선, 예측 처리부는, 인트라 예측에 의해 예측 화상을 생성하고(단계 Sd_1a), 인터 예측에 의해 예측 화상을 생성한다(단계 Sd_1b). 또한, 인트라 예측에 의해 생성된 예측 화상을, 인트라 예측 화상이라고도 하고, 인터 예측에 의해 생성된 예측 화상을, 인터 예측 화상이라고도 한다.
다음에, 예측 처리부는, 인트라 예측 화상 및 인터 예측 화상 각각을 평가한다(단계 Sd_2). 이 평가에는, 코스트가 사용되어도 된다. 즉, 예측 처리부는, 인트라 예측 화상 및 인터 예측 화상 각각의 코스트 C를 산출한다. 이 코스트 C는, R-D 최적화 모델의 식, 예를 들면, C=D+λ×R에 의해 산출될 수 있다. 이 식에 있어서, D는, 예측 화상의 부호화 왜곡으로서, 예를 들면, 커런트 블록의 화소값과 예측 화상의 화소값의 차분 절대값 합 등에 의해 나타내어진다. 또, R은, 예측 화상의 발생 부호량으로서, 구체적으로는, 예측 화상을 생성하기 위한 움직임 정보 등의 부호화에 필요한 부호량 등이다. 또, λ는, 예를 들면 라그랑쥬의 미정 곱수이다.
그리고, 예측 처리부는, 인트라 예측 화상 및 인터 예측 화상으로부터, 가장 작은 코스트 C가 산출된 예측 화상을, 커런트 블록의 최종적인 예측 화상으로서 선택한다(단계 Sd_3). 즉, 커런트 블록의 예측 화상을 생성하기 위한 예측 방식 또는 모드가 선택된다.
[인트라 예측부]
인트라 예측부(124)는, 블록 메모리(118)에 저장된 커런트 픽처 내의 블록을 참조하여 커런트 블록의 인트라 예측(화면 내 예측이라고도 한다)을 행함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(124)는, 커런트 블록에 인접하는 블록의 샘플(예를 들면 휘도값, 색차값)을 참조하여 인트라 예측을 행함으로써 인트라 예측 신호를 생성하고, 인트라 예측 신호를 예측 제어부(128)에 출력한다.
예를 들면, 인트라 예측부(124)는, 규정된 복수의 인트라 예측 모드 중 1개를 사용하여 인트라 예측을 행한다. 복수의 인트라 예측 모드는, 통상, 1 이상의 비방향성 예측 모드와, 복수의 방향성 예측 모드를 포함한다. 규정된 복수의 모드는, 미리 규정되어 있어도 된다.
1 이상의 비방향성 예측 모드는, 예를 들면 H.265/HEVC 규격에서 규정된 Planar 예측 모드 및 DC 예측 모드를 포함한다.
복수의 방향성 예측 모드는, 예를 들면 H.265/HEVC 규격에서 규정된 33방향의 예측 모드를 포함한다. 또한, 복수의 방향성 예측 모드는, 33방향에 더하여 추가로 32방향의 예측 모드(합계 65개의 방향성 예측 모드)를 포함해도 된다. 도 14는, 인트라 예측에 있어서 사용될 수 있는 총 67개의 인트라 예측 모드(2개의 비방향성 예측 모드 및 65개의 방향성 예측 모드)를 나타내는 개념도이다. 실선 화살표는, H.265/HEVC 규격에서 규정된 33방향을 나타내고, 파선 화살표는, 추가된 32방향을 나타낸다(2개의 비방향성 예측 모드는 도 14에는 도시되어 있지 않다).
여러 가지 처리예에서는, 색차 블록의 인트라 예측에 있어서, 휘도 블록이 참조되어도 된다. 즉, 커런트 블록의 휘도 성분에 의거하여, 커런트 블록의 색차 성분이 예측되어도 된다. 이러한 인트라 예측은, CCLM(cross-component linear model) 예측으로 불리는 경우가 있다. 이러한 휘도 블록을 참조하는 색차 블록의 인트라 예측 모드(예를 들면 CCLM 모드로 불린다)는, 색차 블록의 인트라 예측 모드 중 하나로서 더해져도 된다.
인트라 예측부(124)는, 수평/수직 방향의 참조 화소의 구배에 의거하여 인트라 예측 후의 화소값을 보정해도 된다. 이러한 보정을 동반하는 인트라 예측은, PDPC(position dependent intra prediction combination)로 불리는 경우가 있다. PDPC의 적용 유무를 나타내는 정보(예를 들면 PDPC 플래그로 불린다)는, 통상, CU 레벨에서 신호화된다. 또한, 이 정보의 신호화는, CU 레벨로 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
[인터 예측부]
인터 예측부(126)는, 프레임 메모리(122)에 저장된 참조 픽처로서 커런트 픽처와는 상이한 참조 픽처를 참조하여 커런트 블록의 인터 예측(화면간 예측이라고도 한다)을 행함으로써, 예측 신호(인터 예측 신호)를 생성한다. 인터 예측은, 커런트 블록 또는 커런트 블록 내의 커런트 서브 블록(예를 들면 4×4 블록)의 단위로 행해진다. 예를 들면, 인터 예측부(126)는, 커런트 블록 또는 커런트 서브 블록에 대해서 참조 픽처 내에서 움직임 탐색(motion estimation)을 행하고, 그 커런트 블록 또는 커런트 서브 블록에 가장 일치하는 참조 블록 또는 서브 블록을 찾아낸다. 그리고, 인터 예측부(126)는, 참조 블록 또는 서브 블록으로부터 커런트 블록 또는 서브 블록으로의 움직임 또는 변화를 보상하는 움직임 정보(예를 들면 움직임 벡터)를 취득한다. 인터 예측부(126)는, 그 움직임 정보에 의거하여, 움직임 보상(또는 움직임 예측)을 행하고, 커런트 블록 또는 서브 블록의 인터 예측 신호를 생성한다. 인터 예측부(126)는, 생성된 인터 예측 신호를 예측 제어부(128)에 출력한다.
움직임 보상에 사용된 움직임 정보는, 다양한 형태로 인터 예측 신호로서 신호화되어도 된다. 예를 들면, 움직임 벡터가 신호화되어도 된다. 다른 예로서, 움직임 벡터와 예측 움직임 벡터(motion vector predictor)의 차분이 신호화되어도 된다.
[인터 예측의 기본 플로]
도 15는, 인터 예측의 기본적인 흐름의 일례를 나타내는 플로차트이다.
인터 예측부(126)는, 우선, 예측 화상을 생성한다(단계 Se_1~Se_3). 다음에, 감산부(104)는, 커런트 블록과 예측 화상의 차분을 예측 잔차로서 생성한다(단계 Se_4).
여기서, 인터 예측부(126)는, 예측 화상의 생성에서는, 커런트 블록의 움직임 벡터(MV)의 결정(단계 Se_1 및 Se_2)과, 움직임 보상(단계 Se_3)을 행함으로써, 그 예측 화상을 생성한다. 또, 인터 예측부(126)는, MV의 결정에서는, 후보 움직임 벡터(후보 MV)의 선택(단계 Se_1)과, MV의 도출(단계 Se_2)을 행함으로써, 그 MV를 결정한다. 후보 MV의 선택은, 예를 들면, 후보 MV 리스트로부터 적어도 1개의 후보 MV를 선택함으로써 행해진다. 또, MV의 도출에서는, 인터 예측부(126)는, 적어도 1개의 후보 MV로부터, 또한 적어도 1개의 후보 MV를 선택함으로써, 그 선택된 적어도 1개의 후보 MV를, 커런트 블록의 MV로서 결정해도 된다. 혹은, 인터 예측부(126)는, 그 선택된 적어도 1개의 후보 MV 각각에 대해서, 그 후보 MV에서 지시되는 참조 픽처의 영역을 탐색함으로써, 커런트 블록의 MV를 결정해도 된다. 또한, 이 참조 픽처의 영역을 탐색하는 것을, 움직임 탐색(motion estimation)이라고 칭해도 된다.
또, 상술한 예에서는, 단계 Se_1~Se_3은, 인터 예측부(126)에 의해 행해지는데, 예를 들면 단계 Se_1 또는 단계 Se_2 등의 처리는, 부호화 장치(100)에 포함되는 다른 구성 요소에 의해 행해져도 된다.
[움직임 벡터 도출의 플로]
도 16은, 움직임 벡터 도출의 일례를 나타내는 플로차트이다.
인터 예측부(126)는, 움직임 정보(예를 들면 MV)를 부호화하는 모드로, 커런트 블록의 MV를 도출한다. 이 경우, 예를 들면 움직임 정보가 예측 파라미터로서 부호화되고, 신호화된다. 즉, 부호화된 움직임 정보가, 부호화 신호(부호화 비트 스트림이라고도 한다)에 포함된다.
혹은, 인터 예측부(12)는, 움직임 정보를 부호화하지 않는 모드로 MV를 도출한다. 이 경우에는, 움직임 정보는, 부호화 신호에 포함되지 않는다.
여기서, MV 도출 모드에는, 후술하는 노멀 인터 모드, 머지 모드, FRUC 모드 및 아핀 모드 등이 있어도 된다. 이들 모드 중, 움직임 정보를 부호화하는 모드에는, 노멀 인터 모드, 머지 모드, 및 아핀 모드(구체적으로는, 아핀 인터 모드 및 아핀 머지 모드) 등이 있다. 또한, 움직임 정보에는, MV뿐만 아니라, 후술하는 예측 움직임 벡터 선택 정보가 포함되어도 된다. 또, 움직임 정보를 부호화하지 않는 모드에는, FRUC 모드 등이 있다. 인터 예측부(126)는, 이들 복수의 모드로부터, 커런트 블록의 MV를 도출하기 위한 모드를 선택하고, 그 선택된 모드를 사용하여 커런트 블록의 MV를 도출한다.
도 17은, 움직임 벡터 도출의 다른 예를 나타내는 플로차트이다.
인터 예측부(126)는, 차분 MV를 부호화하는 모드로, 커런트 블록의 MV를 도출한다. 이 경우, 예를 들면 차분 MV가 예측 파라미터로서 부호화되고, 신호화된다. 즉, 부호화된 차분 MV가, 부호화 신호에 포함된다. 이 차분 MV는, 커런트 블록의 MV와, 그 예측 MV의 차이다.
혹은, 인터 예측부(126)는, 차분 MV를 부호화하지 않는 모드로 MV를 도출한다. 이 경우에는, 부호화된 차분 MV는, 부호화 신호에 포함되지 않는다.
여기서, 상술한 바와 같이 MV 도출 모드에는, 후술하는 노멀 인터, 머지 모드, FRUC 모드 및 아핀 모드 등이 있다. 이들 모드 중, 차분 MV를 부호화하는 모드에는, 노멀 인터 모드 및 아핀 모드(구체적으로는, 아핀 인터 모드) 등이 있다. 또, 차분 MV를 부호화하지 않는 모드에는, FRUC 모드, 머지 모드 및 아핀 모드(구체적으로는, 아핀 머지 모드) 등이 있다. 인터 예측부(126)는, 이들 복수의 모드로부터, 커런트 블록의 MV를 도출하기 위한 모드를 선택하고, 그 선택된 모드를 사용하여 커런트 블록의 MV를 도출한다.
[움직임 벡터 도출의 플로]
도 18은, 움직임 벡터 도출의 다른 예를 나타내는 플로차트이다. MV 도출의 모드, 즉 인터 예측 모드에는, 복수의 모드가 있으며, 크게 나눠서, 차분 MV를 부호화하는 모드와, 차분 움직임 벡터를 부호화하지 않는 모드가 있다. 차분 MV를 부호화하지 않는 모드에는, 머지 모드, FRUC 모드, 및 아핀 모드(구체적으로는, 아핀 머지 모드)가 있다. 이들 모드의 상세에 대해서는 후술하겠지만, 간단하게는, 머지 모드는, 주변의 부호화 완료 블록으로부터 움직임 벡터를 선택함으로써, 커런트 블록의 MV를 도출하는 모드이며, FRUC 모드는, 부호화 완료 영역간에서 탐색을 행함으로써, 커런트 블록의 MV를 도출하는 모드이다. 또, 아핀 모드는, 아핀 변환을 상정하여, 커런트 블록을 구성하는 복수의 서브 블록 각각의 움직임 벡터를, 커런트 블록의 MV로서 도출하는 모드이다.
구체적으로는, 도시되는 바와 같이, 인터 예측부(126)는, 인터 예측 모드 정보가 0을 나타내는 경우(Sf_1에서 0), 머지 모드에 의해 움직임 벡터를 도출한다(Sf_2). 또, 인터 예측부(126)는, 인터 예측 모드 정보가 1을 나타내는 경우(Sf_1에서 1), FRUC 모드에 의해 움직임 벡터를 도출한다(Sf_3). 또, 인터 예측부(126)는, 인터 예측 모드 정보가 2를 나타내는 경우(Sf_1에서 2), 아핀 모드(구체적으로는, 아핀 머지 모드)에 의해 움직임 벡터를 도출한다(Sf_4). 또, 인터 예측부(126)는, 인터 예측 모드 정보가 3을 나타내는 경우(Sf_1에서 3), 차분 MV를 부호화하는 모드(예를 들면, 노멀 인터 모드)에 의해 움직임 벡터를 도출한다(Sf_5).
[MV 도출>노멀 인터 모드]
노멀 인터 모드는, 후보 MV에 의해 나타나는 참조 픽처의 영역으로부터, 커런트 블록의 화상에 유사한 블록에 의거하여, 커런트 블록의 MV를 도출하는 인터 예측 모드이다. 또, 이 노멀 인터 모드에서는, 차분 MV가 부호화된다.
도 19는, 노멀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
인터 예측부(126)는, 우선, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 부호화 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Sg_1). 즉, 인터 예측부(126)는, 후보 MV 리스트를 작성한다.
다음에, 인터 예측부(126)는, 단계 Sg_1에서 취득된 복수의 후보 MV 중에서, N개(N은 2 이상의 정수)의 후보 MV 각각을 예측 움직임 벡터 후보(예측 MV 후보라고도 한다)로서, 소정의 우선 순위에 따라 추출한다(단계 Sg_2). 또한, 그 우선 순위는, N개의 후보 MV 각각 대해 미리 정해져 있어도 된다.
다음에, 인터 예측부(126)는, 그 N개의 예측 움직임 벡터 후보 중에서 1개의 예측 움직임 벡터 후보를, 커런트 블록의 예측 움직임 벡터(예측 MV라고도 한다)로서 선택한다(단계 Sg_3). 이 때, 인터 예측부(126)는, 선택된 예측 움직임 벡터를 식별하기 위한 예측 움직임 벡터 선택 정보를 스트림에 부호화한다. 또한, 스트림은, 상술한 부호화 신호 또는 부호화 비트 스트림이다.
다음에, 인터 예측부(126)는, 부호화 완료 참조 픽처를 참조하여, 커런트 블록의 MV를 도출한다(단계 Sg_4). 이 때, 인터 예측부(126)는, 또한, 그 도출된 MV와 예측 움직임 벡터의 차분값을 차분 MV로서 스트림에 부호화한다. 또한, 부호화 완료 참조 픽처는, 부호화 후에 재구성된 복수의 블록으로 이루어지는 픽처이다.
마지막으로, 인터 예측부(126)는, 그 도출된 MV와 부호화 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Sg_5). 또한, 예측 화상은, 상술한 인터 예측 신호이다.
또, 부호화 신호에 포함되는, 예측 화상의 생성에 사용된 인터 예측 모드(상술한 예에서는 노멀 인터 모드)를 나타내는 정보는, 예를 들면 예측 파라미터로서 부호화된다.
또한, 후보 MV 리스트는, 다른 모드에 사용되는 리스트와 공통으로 사용되어도 된다. 또, 후보 MV 리스트에 관한 처리를, 다른 모드에 사용되는 리스트에 관한 처리에 적용해도 된다. 이 후보 MV 리스트에 관한 처리는, 예를 들면, 후보 MV 리스트로부터의 후보 MV의 추출 혹은 선택, 후보 MV의 재정렬, 또는, 후보 MV의 삭제 등이다.
[MV 도출>머지 모드]
머지 모드는, 후보 MV 리스트로부터 후보 MV를 커런트 블록의 MV로서 선택함으로써, 그 MV를 도출하는 인터 예측 모드이다.
도 20은, 머지 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
인터 예측부(126)는, 우선, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 부호화 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Sh_1). 즉, 인터 예측부(126)는, 후보 MV 리스트를 작성한다.
다음에, 인터 예측부(126)는, 단계 Sh_1에서 취득된 복수의 후보 MV 중에서 1개의 후보 MV를 선택함으로써, 커런트 블록의 MV를 도출한다(단계 Sh_2). 이 때, 인터 예측부(126)는, 선택된 후보 MV를 식별하기 위한 MV 선택 정보를 스트림에 부호화한다.
마지막으로, 인터 예측부(126)는, 그 도출된 MV와 부호화 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Sh_3).
또, 부호화 신호에 포함되는, 예측 화상의 생성에 사용된 인터 예측 모드(상술한 예에서는 머지 모드)를 나타내는 정보는, 예를 들면 예측 파라미터로서 부호화된다.
도 21은, 머지 모드에 의한 커런트 픽처의 움직임 벡터 도출 처리의 일례를 설명하기 위한 개념도이다.
우선, 예측 MV의 후보를 등록한 예측 MV 리스트를 생성한다. 예측 MV의 후보로서는, 대상 블록의 공간적으로 주변에 위치하는 복수의 부호화 완료 블록이 갖는 MV인 공간 인접 예측 MV, 부호화 완료 참조 픽처에 있어서의 대상 블록의 위치를 투영한 부근의 블록이 갖는 MV인 시간 인접 예측 MV, 공간 인접 예측 MV와 시간 인접 예측 MV의 MV값을 조합하여 생성한 MV인 결합 예측 MV, 및 값이 제로인 MV인 제로 예측 MV 등이 있다.
다음에, 예측 MV 리스트에 등록되어 있는 복수의 예측 MV 중에서 1개의 예측 MV를 선택함으로써, 대상 블록의 MV로서 결정한다.
또한, 가변 길이 부호화부에서는, 어느 예측 MV를 선택했는지를 나타내는 신호인 merge_idx를 스트림에 기술하여 부호화한다.
또한, 도 21에서 설명한 예측 MV 리스트에 등록하는 예측 MV는 일례이며, 도면 중의 개수와는 상이한 개수이거나, 도면 중의 예측 MV의 일부의 종류를 포함하지 않는 구성이거나, 도면 중의 예측 MV의 종류 이외의 예측 MV를 추가한 구성이어도 된다.
머지 모드에 의해 도출한 대상 블록의 MV를 사용하여, 후술하는 DMVR(decoder motion vector refinement) 처리를 행함으로써 최종적인 MV를 결정해도 된다.
또한, 예측 MV의 후보는, 상술한 후보 MV이며, 예측 MV 리스트는, 상술한 후보 MV 리스트이다. 또, 후보 MV 리스트를, 후보 리스트로 칭해도 된다. 또, merge_idx는, MV 선택 정보이다.
[MV 도출>FRUC 모드]
움직임 정보는 부호화 장치측으로부터 신호화되지 않고, 복호 장치측에서 도출되어도 된다. 또한, 상술한 바와 같이, H.265/HEVC 규격에서 규정된 머지 모드가 사용되어도 된다. 또 예를 들면, 복호 장치측에서 움직임 탐색을 행함으로써 움직임 정보가 도출되어도 된다. 실시 형태에 있어서, 복호 장치측에서는, 커런트 블록의 화소값을 사용하지 않고 움직임 탐색이 행해진다.
여기서, 복호 장치측에서 움직임 탐색을 행하는 모드에 대해서 설명한다. 이 복호 장치측에서 움직임 탐색을 행하는 모드는, PMMVD(pattern matched motion vector derivation) 모드 또는 FRUC(frame rate up-conversion) 모드로 불리는 경우가 있다.
플로차트의 형식으로 FRUC 처리의 일례를 도 22에 나타낸다. 우선, 커런트 블록에 공간적 또는 시간적으로 인접하는 부호화 완료 블록의 움직임 벡터를 참조하여, 각각이 예측 움직임 벡터(MV)를 갖는 복수의 후보의 리스트(즉, 후보 MV 리스트로서, 머지 리스트와 공통이어도 된다)가 생성된다(단계 Si_1). 다음에, 후보 MV 리스트에 등록되어 있는 복수의 후보 MV 중에서 베스트 후보 MV를 선택한다(단계 Si_2). 예를 들면, 후보 MV 리스트에 포함되는 각 후보 MV의 평가값이 산출되고, 평가값에 의거하여 1개의 후보 MV가 선택된다. 그리고, 선택된 후보의 움직임 벡터에 의거하여, 커런트 블록을 위한 움직임 벡터가 도출된다(단계 Si_4). 구체적으로는, 예를 들면, 선택된 후보의 움직임 벡터(베스트 후보 MV)가 그대로 커런트 블록을 위한 움직임 벡터로서 도출된다. 또 예를 들면, 선택된 후보의 움직임 벡터에 대응하는 참조 픽처 내의 위치의 주변 영역에 있어서, 패턴 매칭을 행함으로써, 커런트 블록을 위한 움직임 벡터가 도출되어도 된다. 즉, 베스트 후보 MV의 주변의 영역에 대해, 참조 픽처에 있어서의 패턴 매칭 및 평가값을 사용한 탐색을 행하고, 더욱 평가값이 좋은 값이 되는 MV가 있는 경우는, 베스트 후보 MV를 상기 MV로 갱신하고, 그것을 커런트 블록의 최종적인 MV로 해도 된다. 보다 좋은 평가값을 갖는 MV로의 갱신을 행하는 처리를 실시하지 않는 구성으로 하는 것도 가능하다.
마지막으로, 인터 예측부(126)는, 그 도출된 MV와 부호화 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Si_5).
서브 블록 단위로 처리를 행하는 경우도 완전히 동일한 처리로 해도 된다.
평가값은, 여러 가지 방법에 의해 산출되어도 된다. 예를 들면, 움직임 벡터에 대응하는 참조 픽처 내의 영역의 재구성 화상과, 소정의 영역(그 영역은, 예를 들면, 이하에 나타내는 바와 같이, 다른 참조 픽처의 영역 또는 커런트 픽처의 인접 블록의 영역이어도 된다)의 재구성 화상을 비교한다. 소정의 영역은 미리 정해져 있어도 된다.
그리고, 2개의 재구성 화상의 화소값의 차분을 산출하여, 움직임 벡터의 평가값에 사용해도 된다. 또한, 차분값에 더하여 그 이외의 정보를 사용하여 평가값을 산출해도 된다.
다음에, 패턴 매칭의 예에 대해서 상세하게 설명한다. 우선, 후보 MV 리스트(예를 들면 머지 리스트)에 포함되는 1개의 후보 MV를, 패턴 매칭에 의한 탐색의 스타트 포인트로서 선택한다. 예를 들면, 패턴 매칭으로서는, 제1 패턴 매칭 또는 제2 패턴 매칭이 사용될 수 있다. 제1 패턴 매칭 및 제2 패턴 매칭은, 각각, 바이래터럴 매칭(bilateral matching) 및 템플릿 매칭(template matching)으로 불리는 경우가 있다.
[MV 도출>FRUC>바이래터럴 매칭]
제1 패턴 매칭에서는, 상이한 2개의 참조 픽처 내의 2개의 블록으로서 커런트 블록의 움직임 궤도(motion trajectory)를 따르는 2개의 블록 사이에서 패턴 매칭이 행해진다. 따라서, 제1 패턴 매칭에서는, 상술한 후보의 평가값 산출을 위한 소정의 영역으로서, 커런트 블록의 움직임 궤도를 따르는 다른 참조 픽처 내의 영역이 사용된다. 소정의 영역은, 미리 정해져 있어도 된다.
도 23은, 움직임 궤도를 따르는 2개의 참조 픽처에 있어서의 2개의 블록 사이에서의 제1 패턴 매칭(바이래터럴 매칭)의 일례를 설명하기 위한 개념도이다. 도 23에 나타내는 바와 같이, 제1 패턴 매칭에서는, 커런트 블록(Cur block)의 움직임 궤도를 따르는 2개의 블록으로서 상이한 2개의 참조 픽처(Ref0, Ref1) 내의 2개의 블록 페어 중에서 가장 매칭되는 페어를 탐색함으로써 2개의 움직임 벡터(MV0, MV1)가 도출된다. 구체적으로는, 커런트 블록에 대해, 후보 MV로 지정된 제1 부호화 완료 참조 픽처(Ref0) 내의 지정 위치에 있어서의 재구성 화상과, 상기 후보 MV를 표시 시간 간격으로 스케일링한 대칭 MV로 지정된 제2 부호화 완료 참조 픽처(Ref1) 내의 지정 위치에 있어서의 재구성 화상의 차분을 도출하고, 얻어진 차분값을 사용하여 평가값을 산출한다. 복수의 후보 MV 중에서 가장 평가값이 좋은 값이 되는 후보 MV를 최종 MV로서 선택하는 것이 가능하며, 좋은 결과를 가져올 수 있다.
연속적인 움직임 궤도의 가정 하에서는, 2개의 참조 블록을 가리키는 움직임 벡터(MV0, MV1)는, 커런트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1) 사이의 시간적인 거리(TD0, TD1)에 대해 비례한다. 예를 들면, 커런트 픽처가 시간적으로 2개의 참조 픽처 사이에 위치하고, 커런트 픽처로부터 2개의 참조 픽처로의 시간적인 거리가 같은 경우, 제1 패턴 매칭에서는, 경영(鏡映) 대칭인 쌍방향의 움직임 벡터가 도출된다.
[MV 도출>FRUC>템플릿 매칭]
제2 패턴 매칭(템플릿 매칭)에서는, 커런트 픽처 내의 템플릿(커런트 픽처 내에서 커런트 블록에 인접하는 블록(예를 들면 상측 및/또는 좌측 인접 블록))과 참조 픽처 내의 블록 사이에서 패턴 매칭이 행해진다. 따라서, 제2 패턴 매칭에서는, 상술한 후보의 평가값 산출을 위한 소정의 영역으로서, 커런트 픽처 내의 커런트 블록에 인접하는 블록이 사용된다.
도 24는, 커런트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)의 일례를 설명하기 위한 개념도이다. 도 24에 나타내는 바와 같이, 제2 패턴 매칭에서는, 커런트 픽처(Cur Pic) 내에서 커런트 블록(Cur block)에 인접하는 블록과 가장 매칭되는 블록을 참조 픽처(Ref0) 내에서 탐색함으로써 커런트 블록의 움직임 벡터가 도출된다. 구체적으로는, 커런트 블록에 대해, 좌측 인접 및 상측 인접 양쪽 혹은 어느 한쪽의 부호화 완료 영역의 재구성 화상과, 후보 MV로 지정된 부호화 완료 참조 픽처(Ref0) 내의 동등 위치에 있어서의 재구성 화상의 차분을 도출하고, 얻어진 차분값을 사용하여 평가값을 산출하여, 복수의 후보 MV 중에서 가장 평가값이 좋은 값이 되는 후보 MV를 베스트 후보 MV로서 선택하는 것이 가능하다.
이러한 FRUC 모드를 적용할지 여부를 나타내는 정보(예를 들면 FRUC 플래그로 불린다)는, CU 레벨에서 신호화되어도 된다. 또, FRUC 모드가 적용되는 경우(예를 들면 FRUC 플래그가 참인 경우), 적용 가능한 패턴 매칭의 방법(제1 패턴 매칭 또는 제2 패턴 매칭)을 나타내는 정보가 CU 레벨에서 신호화되어도 된다. 또한, 이들 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
[MV 도출>아핀 모드]
다음에, 복수의 인접 블록의 움직임 벡터에 의거하여 서브 블록 단위로 움직임 벡터를 도출하는 아핀 모드에 대해서 설명한다. 이 모드는, 아핀 움직임 보상 예측(affine motion compensation prediction) 모드로 불리는 경우가 있다.
도 25a는, 복수의 인접 블록의 움직임 벡터에 의거한 서브 블록 단위의 움직임 벡터의 도출의 일례를 설명하기 위한 개념도이다. 도 25a에 있어서, 커런트 블록은, 16의 4×4 서브 블록을 포함한다. 여기에서는, 인접 블록의 움직임 벡터에 의거하여 커런트 블록의 좌상각(左上角) 제어 포인트의 움직임 벡터 v0이 도출되고, 마찬가지로, 인접 서브 블록의 움직임 벡터에 의거하여 커런트 블록의 우상각 (右上角) 제어 포인트의 움직임 벡터 v1이 도출된다. 그리고, 이하의 식 (1A)에 의해, 2개의 움직임 벡터 v0 및 v1이 투영되어도 되고, 커런트 블록 내의 각 서브 블록의 움직임 벡터(vx, vy)가 도출되어도 된다.
Figure pct00001
여기서, x 및 y는, 각각, 서브 블록의 수평 위치 및 수직 위치를 나타내고, w는, 소정의 가중 계수를 나타낸다. 소정의 가중 계수는, 미리 결정되어 있어도 된다.
이러한 아핀 모드를 나타내는 정보(예를 들면 아핀 플래그로 불린다)는, CU 레벨에서 신호화되어도 된다. 또한, 이 아핀 모드를 나타내는 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
또, 이러한 아핀 모드에서는, 좌상각 및 우상각 제어 포인트의 움직임 벡터의 도출 방법이 상이한 몇 가지 모드를 포함해도 된다. 예를 들면, 아핀 모드에는, 아핀 인터(아핀 노멀 인터라고도 한다) 모드와, 아핀 머지 모드의 2개의 모드가 있다.
[MV 도출>아핀 모드]
도 25b는, 3개의 제어 포인트를 갖는 아핀 모드에 있어서의 서브 블록 단위의 움직임 벡터의 도출의 일례를 설명하기 위한 개념도이다. 도 25b에 있어서, 커런트 블록은, 16의 4×4 서브 블록을 포함한다. 여기에서는, 인접 블록의 움직임 벡터에 의거하여 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0이 도출되고, 마찬가지로, 인접 블록의 움직임 벡터에 의거하여 커런트 블록의 우상각 제어 포인트의 움직임 벡터 v1, 인접 블록의 움직임 벡터에 의거하여 커런트 블록의 좌하각(左下角) 제어 포인트의 움직임 벡터 v2가 도출된다. 그리고, 이하의 식 (1B)에 의해, 3개의 움직임 벡터 v0, v1 및 v2가 투영되어도 되고, 커런트 블록 내의 각 서브 블록의 움직임 벡터(vx, vy)가 도출되어도 된다.
Figure pct00002
여기서, x 및 y는, 각각, 서브 블록 중심의 수평 위치 및 수직 위치를 나타내고, w는, 커런트 블록의 폭, h는, 커런트 블록의 높이를 나타낸다.
상이한 제어 포인트 수(예를 들면, 2개와 3개)의 아핀 모드는, CU 레벨에서 전환하여 신호화되어도 된다. 또한, CU 레벨에서 사용하고 있는 아핀 모드의 제어 포인트 수를 나타내는 정보를, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)에서 신호화해도 된다.
또, 이러한 3개의 제어 포인트를 갖는 아핀 모드에서는, 좌상각, 우상각 및 좌하각 제어 포인트의 움직임 벡터의 도출 방법이 상이한 몇 가지 모드를 포함해도 된다. 예를 들면, 아핀 모드에는, 아핀 인터(아핀 노멀 인터라고도 한다) 모드와, 아핀 머지 모드의 2개의 모드가 있다.
[MV 도출>아핀 머지 모드]
도 26a, 도 26b 및 도 26c는, 아핀 머지 모드를 설명하기 위한 개념도이다.
아핀 머지 모드에서는, 도 26a에 나타내는 바와 같이, 예를 들면, 커런트 블록에 인접하는 부호화 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측) 중, 아핀 모드로 부호화된 블록에 대응하는 복수의 움직임 벡터에 의거하여, 커런트 블록의 제어 포인트 각각의 예측 움직임 벡터가 산출된다. 구체적으로는, 부호화 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측)의 순서로 이들 블록이 검사되고, 아핀 모드로 부호화된 최초의 유효한 블록이 특정된다. 이 특정된 블록에 대응하는 복수의 움직임 벡터에 의거하여, 커런트 블록의 제어 포인트의 예측 움직임 벡터가 산출된다.
예를 들면, 도 26b에 나타내는 바와 같이, 커런트 블록의 좌측에 인접하는 블록 A가 2개의 제어 포인트를 갖는 아핀 모드로 부호화되어 있는 경우는, 블록 A를 포함하는 부호화 완료 블록의 좌상각 및 우상각의 위치에 투영한 움직임 벡터 v3 및 v4가 도출된다. 그리고, 도출된 움직임 벡터 v3 및 v4로부터, 커런트 블록의 좌상각의 제어 포인트의 예측 움직임 벡터 v0과, 우상각의 제어 포인트의 예측 움직임 벡터 v1이 산출된다.
예를 들면, 도 26c에 나타내는 바와 같이, 커런트 블록의 좌측에 인접하는 블록 A가 3개의 제어 포인트를 갖는 아핀 모드로 부호화되어 있는 경우는, 블록 A를 포함하는 부호화 완료 블록의 좌상각, 우상각 및 좌하각의 위치에 투영한 움직임 벡터 v3, v4 및 v5가 도출된다. 그리고, 도출된 움직임 벡터 v3, v4 및 v5로부터, 커런트 블록의 좌상각의 제어 포인트의 예측 움직임 벡터 v0과, 우상각의 제어 포인트의 예측 움직임 벡터 v1과, 좌하각의 제어 포인트의 예측 움직임 벡터 v2가 산출된다.
또한, 후술하는 도 29의 단계 Sj_1에 있어서의 커런트 블록의 제어 포인트 각각의 예측 움직임 벡터의 도출에, 이 예측 움직임 벡터 도출 방법을 사용해도 된다.
도 27은, 아핀 머지 모드의 일례를 나타내는 플로차트이다.
아핀 머지 모드에서는, 도시되는 바와 같이, 우선, 인터 예측부(126)는, 커런트 블록의 제어 포인트 각각의 예측 MV를 도출한다(단계 Sk_1). 제어 포인트는, 도 25a에 나타내는 바와 같이, 커런트 블록의 좌상각 및 우상각의 포인트, 혹은 도 25b에 나타내는 바와 같이, 커런트 블록의 좌상각, 우상각 및 좌하각의 포인트이다.
즉, 인터 예측부(126)는, 도 26a에 나타내는 바와 같이, 부호화 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측)의 순서로 이들 블록을 검사하고, 아핀 모드로 부호화된 최초의 유효한 블록을 특정한다.
그리고, 블록 A가 특정되어 블록 A가 2개의 제어 포인트를 갖는 경우, 도 26b에 나타내는 바와 같이, 인터 예측부(126)는, 블록 A를 포함하는 부호화 완료 블록의 좌상각 및 우상각의 움직임 벡터 v3 및 v4로부터, 커런트 블록의 좌상각의 제어 포인트의 움직임 벡터 v0과, 우상각의 제어 포인트의 움직임 벡터 v1을 산출한다. 예를 들면, 인터 예측부(126)는, 부호화 완료 블록의 좌상각 및 우상각의 움직임 벡터 v3 및 v4를, 커런트 블록에 투영함으로써, 커런트 블록의 좌상각의 제어 포인트의 예측 움직임 벡터 v0과, 우상각의 제어 포인트의 예측 움직임 벡터 v1을 산출한다.
혹은, 블록 A가 특정되어 블록 A가 3개의 제어 포인트를 갖는 경우, 도 26c에 나타내는 바와 같이, 인터 예측부(126)는, 블록 A를 포함하는 부호화 완료 블록의 좌상각, 우상각 및 좌하각의 움직임 벡터 v3, v4 및 v5로부터, 커런트 블록의 좌상각의 제어 포인트의 움직임 벡터 v0과, 우상각의 제어 포인트의 움직임 벡터 v1, 좌하각의 제어 포인트의 움직임 벡터 v2를 산출한다. 예를 들면, 인터 예측부(126)는, 부호화 완료 블록의 좌상각, 우상각 및 좌하각의 움직임 벡터 v3, v4 및 v5를, 커런트 블록에 투영함으로써, 커런트 블록의 좌상각의 제어 포인트의 예측 움직임 벡터 v0과, 우상각의 제어 포인트의 예측 움직임 벡터 v1, 좌하각의 제어 포인트의 움직임 벡터 v2를 산출한다.
다음에, 인터 예측부(126)는, 커런트 블록에 포함되는 복수의 서브 블록 각각에 대해서, 움직임 보상을 행한다. 즉, 인터 예측부(126)는, 그 복수의 서브 블록 각각에 대해서, 2개의 예측 움직임 벡터 v0 및 v1과 상술한 식 (1A), 혹은 3개의 예측 움직임 벡터 v0, v1 및 v2와 상술한 식 (1B)를 사용하여, 그 서브 블록의 움직임 벡터를 아핀 MV로서 산출한다(단계 Sk_2). 그리고, 인터 예측부(126)는, 그들 아핀 MV 및 부호화 완료 참조 픽처를 사용하여 그 서브 블록에 대해 움직임 보상을 행한다(단계 Sk_3). 그 결과, 커런트 블록에 대해 움직임 보상이 행해지고, 그 커런트 블록의 예측 화상이 생성된다.
[MV 도출>아핀 인터 모드]
도 28a는, 2개의 제어 포인트를 갖는 아핀 인터 모드를 설명하기 위한 개념도이다.
이 아핀 인터 모드에서는, 도 28a에 나타내는 바와 같이, 커런트 블록에 인접하는 부호화 완료 블록 A, 블록 B 및 블록 C의 움직임 벡터로부터 선택된 움직임 벡터가, 커런트 블록의 좌상각의 제어 포인트의 예측 움직임 벡터 v0으로서 사용된다. 마찬가지로, 커런트 블록에 인접하는 부호화 완료 블록 D 및 블록 E의 움직임 벡터로부터 선택된 움직임 벡터가, 커런트 블록의 우상각의 제어 포인트의 예측 움직임 벡터 v1로서 사용된다.
도 28b는, 3개의 제어 포인트를 갖는 아핀 인터 모드를 설명하기 위한 개념도이다.
이 아핀 인터 모드에서는, 도 28b에 나타내는 바와 같이, 커런트 블록에 인접하는 부호화 완료 블록 A, 블록 B 및 블록 C의 움직임 벡터로부터 선택된 움직임 벡터가, 커런트 블록의 좌상각의 제어 포인트의 예측 움직임 벡터 v0으로서 사용된다. 마찬가지로, 커런트 블록에 인접하는 부호화 완료 블록 D 및 블록 E의 움직임 벡터로부터 선택된 움직임 벡터가, 커런트 블록의 우상각의 제어 포인트의 예측 움직임 벡터 v1로서 사용된다. 또한, 커런트 블록에 인접하는 부호화 완료 블록 F 및 블록 G의 움직임 벡터로부터 선택된 움직임 벡터가, 커런트 블록의 좌하각의 제어 포인트의 예측 움직임 벡터 v2로서 사용된다.
도 29는, 아핀 인터 모드의 일례를 나타내는 플로차트이다.
도시되는 바와 같이, 아핀 인터 모드에서는, 우선, 인터 예측부(126)는, 커런트 블록의 2개 또는 3개의 제어 포인트 각각의 예측 MV (v0, v1) 또는 (v0, v1, v2)를 도출한다(단계 Sj_1). 제어 포인트는, 도 25a 또는 도 25b에 나타내는 바와 같이, 커런트 블록의 좌상각, 우상각 혹은 좌하각의 포인트이다.
즉, 인터 예측부(126)는, 도 28a 또는 도 28b에 나타내는 커런트 블록의 각 제어 포인트 근방의 부호화 완료 블록 중 어느 하나의 블록의 움직임 벡터를 선택함으로써, 커런트 블록의 제어 포인트의 예측 움직임 벡터 (v0, v1) 또는 (v0, v1, v2)를 도출한다. 이 때, 인터 예측부(126)는, 선택된 2개의 움직임 벡터를 식별하기 위한 예측 움직임 벡터 선택 정보를 스트림에 부호화한다.
예를 들면, 인터 예측부(126)는, 커런트 블록에 인접하는 부호화 완료 블록으로부터 어느 블록의 움직임 벡터를 제어 포인트의 예측 움직임 벡터로서 선택할지를, 코스트 평가 등을 사용하여 결정하고, 어느 예측 움직임 벡터를 선택했는지를 나타내는 플래그를 비트 스트림에 기술해도 된다.
다음에, 인터 예측부(126)는, 단계 Sj_1에서 선택 또는 도출된 예측 움직임 벡터를 각각 갱신하면서(단계 Sj_2), 움직임 탐색을 행한다(단계 Sj_3 및 Sj_4). 즉, 인터 예측부(126)는, 갱신되는 예측 움직임 벡터에 대응하는 각 서브 블록의 움직임 벡터를 아핀 MV로서, 상술한 식 (1A) 또는 식 (1B)를 사용하여 산출한다(단계 Sj_3). 그리고, 인터 예측부(126)는, 그들 아핀 MV 및 부호화 완료 참조 픽처를 사용하여 각 서브 블록에 대해 움직임 보상을 행한다(단계 Sj_4). 그 결과, 인터 예측부(126)는, 움직임 탐색 루프에 있어서, 예를 들면 가장 작은 코스트가 얻어지는 예측 움직임 벡터를, 제어 포인트의 움직임 벡터로서 결정한다(단계 Sj_5). 이 때, 인터 예측부(126)는, 또한, 그 결정된 MV와 예측 움직임 벡터 각각의 차분값을 차분 MV로서 스트림에 부호화한다.
마지막으로, 인터 예측부(126)는, 그 결정된 MV와 부호화 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Sj_6).
[MV 도출>아핀 인터 모드]
상이한 제어 포인트 수(예를 들면, 2개와 3개)의 아핀 모드를 CU 레벨에서 전환하여 신호화하는 경우, 부호화 완료 블록과 커런트 블록에서 제어 포인트의 수가 상이한 경우가 있다. 도 30a 및 도 30b는, 부호화 완료 블록과 커런트 블록에서 제어 포인트의 수가 상이한 경우의, 제어 포인트의 예측 벡터 도출 방법을 설명하기 위한 개념도이다.
예를 들면, 도 30a에 나타내는 바와 같이, 커런트 블록이 좌상각, 우상각 및 좌하각의 3개의 제어 포인트를 갖고, 커런트 블록의 좌측에 인접하는 블록 A가 2개의 제어 포인트를 갖는 아핀 모드로 부호화되어 있는 경우는, 블록 A를 포함하는 부호화 완료 블록의 좌상각 및 우상각의 위치에 투영한 움직임 벡터 v3 및 v4가 도출된다. 그리고, 도출된 움직임 벡터 v3 및 v4로부터, 커런트 블록의 좌상각의 제어 포인트의 예측 움직임 벡터 v0과, 우상각의 제어 포인트의 예측 움직임 벡터 v1이 산출된다. 또한, 도출된 움직임 벡터 v0 및 v1로부터, 좌하각의 제어 포인트의 예측 움직임 벡터 v2가 산출된다.
예를 들면, 도 30b에 나타내는 바와 같이, 커런트 블록이 좌상각 및 우상각의 2개의 제어 포인트를 갖고, 커런트 블록의 좌측에 인접하는 블록 A가 3개의 제어 포인트를 갖는 아핀 모드로 부호화되어 있는 경우는, 블록 A를 포함하는 부호화 완료 블록의 좌상각, 우상각 및 좌하각의 위치에 투영한 움직임 벡터 v3, v4 및 v5가 도출된다. 그리고, 도출된 움직임 벡터 v3, v4 및 v5로부터, 커런트 블록의 좌상각의 제어 포인트의 예측 움직임 벡터 v0과, 우상각의 제어 포인트의 예측 움직임 벡터 v1이 산출된다.
도 29의 단계 Sj_1에 있어서의 커런트 블록의 제어 포인트 각각의 예측 움직임 벡터의 도출에, 이 예측 움직임 벡터 도출 방법을 사용해도 된다.
[MV 도출>DMVR]
도 31a는, 머지 모드 및 DMVR의 관계를 나타내는 플로차트이다.
인터 예측부(126)는, 머지 모드로 커런트 블록의 움직임 벡터를 도출한다(단계 Sl_1). 다음에, 인터 예측부(126)는, 움직임 벡터의 탐색, 즉 움직임 탐색을 행할지 여부를 판정한다(단계 Sl_2). 여기서, 인터 예측부(126)는, 움직임 탐색을 행하지 않는다고 판정하면(단계 Sl_2의 No), 단계 Sl_1에서 도출된 움직임 벡터를, 커런트 블록에 대한 최종 움직임 벡터로서 결정한다(단계 Sl_4). 즉, 이 경우에는, 머지 모드에서 커런트 블록의 움직임 벡터가 결정된다.
한편, 단계 Sl_1에서 움직임 탐색을 행한다고 판정하면(단계 Sl_2의 Yes), 인터 예측부(126)는, 단계 Sl_1에서 도출된 움직임 벡터에 의해 나타나는 참조 픽처의 주변 영역을 탐색함으로써, 커런트 블록에 대해 최종 움직임 벡터를 도출한다(단계 Sl_3). 즉, 이 경우에는, DMVR에서 커런트 블록의 움직임 벡터가 결정된다.
도 31b는, MV를 결정하기 위한 DMVR 처리의 일례를 설명하기 위한 개념도이다.
우선, (예를 들면 머지 모드에 있어서) 커런트 블록에 설정된 최적 MVP를, 후보 MV로 한다. 그리고, 후보 MV(L0)에 따라, L0 방향의 부호화 완료 픽처인 제1 참조 픽처(L0)로부터 참조 화소를 특정한다. 마찬가지로, 후보 MV(L1)에 따라, L1 방향의 부호화 완료 픽처인 제2 참조 픽처(L1)로부터 참조 화소를 특정한다. 이들 참조 화소의 평균을 취함으로써 템플릿을 생성한다.
다음에, 상기 템플릿을 사용하여, 제1 참조 픽처(L0) 및 제2 참조 픽처(L1)의 후보 MV의 주변 영역을 각각 탐색하고, 코스트가 최소가 되는 MV를 최종적인 MV로서 결정한다. 또한, 코스트값은, 예를 들면, 템플릿의 각 화소값과 탐색 영역의 각 화소값의 차분값 및 후보 MV값 등을 사용하여 산출해도 된다.
또한, 전형적으로는, 부호화 장치와, 후술하는 복호화 장치에서는, 여기서 설명한 처리의 구성 및 동작은 기본적으로 공통이다.
여기서 설명한 처리예 자체가 아니어도, 후보 MV의 주변을 탐색하여 최종적인 MV를 도출할 수 있는 처리이면, 어떠한 처리를 사용해도 된다.
[움직임 보상>BIO/OBMC]
움직임 보상에서는, 예측 화상을 생성하고, 그 예측 화상을 보정하는 모드가 있다. 그 모드는, 예를 들면, 후술하는 BIO 및 OBMC이다.
도 32는, 예측 화상의 생성의 일례를 나타내는 플로차트이다.
인터 예측부(126)는, 예측 화상을 생성하고(단계 Sm_1), 예를 들면 상술한 것 중 어느 하나의 모드에 의해 그 예측 화상을 보정한다(단계 Sm_2).
도 33은, 예측 화상의 생성의 다른 예를 나타내는 플로차트이다.
인터 예측부(126)는, 커런트 블록의 움직임 벡터를 결정한다(단계 Sn_1). 다음에, 인터 예측부(126)는, 예측 화상을 생성하고(단계 Sn_2), 보정 처리를 행할지 여부를 판정한다(단계 Sn_3). 여기서, 인터 예측부(126)는, 보정 처리를 행한다고 판정하면(단계 Sn_3의 Yes), 그 예측 화상을 보정함으로써 최종적인 예측 화상을 생성한다(단계 Sn_4). 한편, 인터 예측부(126)는, 보정 처리를 행하지 않는다고 판정하면(단계 Sn_3의 No), 그 예측 화상을 보정하지 않고 최종적인 예측 화상으로서 출력한다(단계 Sn_5).
또, 움직임 보상에서는, 예측 화상을 생성할 때에 휘도를 보정하는 모드가 있다. 그 모드는, 예를 들면, 후술하는 LIC이다.
도 34는, 예측 화상의 생성의 다른 예를 나타내는 플로차트이다.
인터 예측부(126)는, 커런트 블록의 움직임 벡터를 도출한다(단계 So_1). 다음에, 인터 예측부(126)는, 휘도 보정 처리를 행할지 여부를 판정한다(단계 So_2). 여기서, 인터 예측부(126)는, 휘도 보정 처리를 행한다고 판정하면(단계 So_2의 Yes), 휘도 보정을 행하면서 예측 화상을 생성한다(단계 So_3). 즉, LIC에 의해 예측 화상이 생성된다. 한편, 인터 예측부(126)는, 휘도 보정 처리를 행하지 않는다고 판정하면(단계 So_2의 No), 휘도 보정을 행하지 않고 통상의 움직임 보상에 의해 예측 화상을 생성한다(단계 So_4).
[움직임 보상>OBMC]
움직임 탐색에 의해 얻어진 커런트 블록의 움직임 정보뿐만 아니라, 인접 블록의 움직임 정보도 사용하여, 인터 예측 신호가 생성되어도 된다. 구체적으로는, (참조 픽처 내의) 움직임 탐색에 의해 얻어진 움직임 정보에 의거한 예측 신호와, (커런트 픽처 내의) 인접 블록의 움직임 정보에 의거한 예측 신호를 가중 가산함으로써, 커런트 블록 내의 서브 블록 단위로 인터 예측 신호가 생성되어도 된다. 이러한 인터 예측(움직임 보상)은, OBMC(overlapped block motion compensation)로 불리는 경우가 있다.
OBMC 모드에서는, OBMC를 위한 서브 블록의 사이즈를 나타내는 정보(예를 들면 OBMC 블록 사이즈로 불린다)는, 시퀀스 레벨에서 신호화되어도 된다. 또한, OBMC 모드를 적용할지 여부를 나타내는 정보(예를 들면 OBMC 플래그로 불린다)는, CU 레벨에서 신호화되어도 된다. 또한, 이들 정보의 신호화의 레벨은, 시퀀스 레벨 및 CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
OBMC 모드의 예에 대해서, 보다 구체적으로 설명한다. 도 35 및 도 36은, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 플로차트 및 개념도이다.
우선, 도 36에 나타내는 바와 같이, 처리 대상(커런트) 블록에 할당된 움직임 벡터(MV)를 사용하여 통상의 움직임 보상에 의한 예측 화상(Pred)을 취득한다. 도 36에 있어서, 화살표 “MV”는 참조 픽처를 가리키고, 예측 화상을 얻기 위해 커런트 픽처의 커런트 블록이 무엇을 참조하고 있는지를 나타내고 있다.
다음에, 부호화 완료된 좌측 인접 블록에 대해 이미 도출된 움직임 벡터(MV_L)를 부호화 대상 블록에 적용(재이용)하여 예측 화상(Pred_L)을 취득한다. 움직임 벡터(MV_L)는, 커런트 블록으로부터 참조 픽처를 가리키는 화살표 “MV_L”에 의해 나타난다. 그리고, 2개의 예측 화상 Pred와 Pred_L을 중첩함으로써 예측 화상의 1회째의 보정을 행한다. 이는, 인접 블록간의 경계를 혼합하는 효과를 갖는다.
마찬가지로, 부호화 완료된 상측 인접 블록에 대해 이미 도출된 움직임 벡터(MV_U)를 부호화 대상 블록에 적용(재이용)하여 예측 화상(Pred_U)을 취득한다. 움직임 벡터(MV_U)는, 커런트 블록으로부터 참조 픽처를 가리키는 화살표 “MV_U”에 의해 나타난다. 그리고, 예측 화상 Pred_U를 1회째의 보정을 행한 예측 화상(예를 들면, Pred와 Pred_L)에 중첩함으로써 예측 화상의 2회째의 보정을 행한다. 이는, 인접 블록간의 경계를 혼합하는 효과를 갖는다. 2회째의 보정에 의해 얻어진 예측 화상은, 인접 블록과의 경계가 혼합된(스무딩된), 커런트 블록의 최종적인 예측 화상이다.
또한, 상술한 예는, 좌측 인접 및 상측 인접 블록을 사용한 2패스의 보정 방법인데, 그 보정 방법은, 우측 인접 및/또는 하측 인접 블록도 사용한 3패스 또는 그 이상의 패스의 보정 방법이어도 된다.
또한, 중첩을 행하는 영역은 블록 전체의 화소 영역이 아니라, 블록 경계 근방의 일부의 영역만이어도 된다.
또한, 여기에서는 1매의 참조 픽처로부터, 추가적인 예측 화상 Pred_L 및 Pred_U를 중첩함으로써 1매의 예측 화상 Pred를 얻기 위한 OBMC의 예측 화상 보정 처리에 대해서 설명했다. 그러나, 복수의 참조 화상에 의거하여 예측 화상이 보정되는 경우에는, 동일한 처리가 복수의 참조 픽처 각각에 적용되어도 된다. 이러한 경우, 복수의 참조 픽처에 의거한 OBMC의 화상 보정을 행함으로써, 각각의 참조 픽처로부터, 보정된 예측 화상을 취득한 후에, 그 취득된 복수의 보정 예측 화상을 추가로 중첩함으로써 최종적인 예측 화상을 취득한다.
또한, OBMC에서는, 대상 블록의 단위는, 예측 블록 단위여도 되고, 예측 블록을 추가로 분할한 서브 블록 단위여도 된다.
OBMC 처리를 적용할지 여부의 판정 방법으로서, 예를 들면, OBMC 처리를 적용할지 여부를 나타내는 신호인 obmc_flag를 사용하는 방법이 있다. 구체적인 일례로서는, 부호화 장치는, 대상 블록이 움직임이 복잡한 영역에 속해 있는지 여부를 판정해도 된다. 부호화 장치는, 움직임이 복잡한 영역에 속해 있는 경우는, obmc_flag로서 값 1을 설정하여 OBMC 처리를 적용하여 부호화를 행하고, 움직임이 복잡한 영역에 속해있지 않은 경우는, obmc_flag로서 값 0을 설정하여 OBMC 처리를 적용하지 않고 블록의 부호화를 행한다. 한편, 복호화 장치에서는, 스트림(예를 들면 압축 시퀀스)에 기술된 obmc_flag를 복호함으로써, 그 값에 따라 OBMC 처리를 적용할지 여부를 전환하여 복호를 행한다.
인터 예측부(126)는, 상술한 예에서는, 직사각형의 커런트 블록에 대해 1개의 직사각형의 예측 화상을 생성한다. 그러나, 인터 예측부(126)는, 그 직사각형의 커런트 블록에 대해 직사각형과 상이한 형상의 복수의 예측 화상을 생성하고, 그들 복수의 예측 화상을 결합함으로써, 최종적인 직사각형의 예측 화상을 생성해도 된다. 직사각형과 상이한 형상은, 예를 들면 삼각형이어도 된다.
도 37은, 2개의 삼각형의 예측 화상의 생성을 설명하기 위한 개념도이다.
인터 예측부(126)는, 커런트 블록 내의 삼각형의 제1 파티션에 대해, 그 제1 파티션의 제1 MV를 사용하여 움직임 보상을 행함으로써, 삼각형의 예측 화상을 생성한다. 마찬가지로, 인터 예측부(126)는, 커런트 블록 내의 삼각형의 제2 파티션에 대해, 그 제2 파티션의 제2 MV를 사용하여 움직임 보상을 행함으로써, 삼각형의 예측 화상을 생성한다. 그리고, 인터 예측부(126)는, 이들 예측 화상을 결합함으로써, 커런트 블록과 같은 직사각형의 예측 화상을 생성한다.
또한, 도 37에 나타내는 예에서는, 제1 파티션 및 제2 파티션은 각각 삼각형인데, 사다리꼴이어도 되고, 각각 서로 상이한 형상이어도 된다. 또한, 도 37에 나타내는 예에서는, 커런트 블록이 2개의 파티션으로 구성되어 있는데, 3개 이상의 파티션으로 구성되어 있어도 된다.
또, 제1 파티션 및 제2 파티션은 중복되어 있어도 된다. 즉, 제1 파티션 및 제2 파티션은 같은 화소 영역을 포함하고 있어도 된다. 이 경우, 제1 파티션에 있어서의 예측 화상과 제2 파티션에 있어서의 예측 화상을 사용하여 커런트 블록의 예측 화상을 생성해도 된다.
또, 이 예에서는 2개의 파티션 모두 인터 예측으로 예측 화상이 생성되는 예를 나타냈는데, 적어도 1개의 파티션에 대해서 인트라 예측에 의해 예측 화상을 생성해도 된다.
[움직임 보상>BIO]
다음에, 움직임 벡터를 도출하는 방법에 대해서 설명한다. 우선, 등속 직선 운동을 가정한 모델에 의거하여 움직임 벡터를 도출하는 모드에 대해서 설명한다. 이 모드는, BIO(bi-directional optical flow) 모드로 불리는 경우가 있다.
도 38은, 등속 직선 운동을 가정한 모델을 설명하기 위한 개념도이다. 도 38에 있어서, (vx, vy)는, 속도 벡터를 나타내고, τ0, τ1은, 각각, 커런트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1) 사이의 시간적인 거리를 나타낸다. (MVx0, MVy0)은, 참조 픽처 Ref0에 대응하는 움직임 벡터를 나타내고, (MVx1, MVy1)은, 참조 픽처 Ref1에 대응하는 움직임 벡터를 나타낸다.
이 때 속도 벡터(vx, vy)의 등속 직선 운동의 가정 하에서는, (MVx0, MVy0) 및 (MVx1, MVy1)은, 각각, (vxτ0, vyτ0) 및 (-vxτ1, -vyτ1)로 표시되고, 이하의 옵티컬 플로 등식 (2)가 채용되어도 된다.
Figure pct00003
여기서, I(k)는, 움직임 보상 후의 참조 화상 k(k=0, 1)의 휘도값을 나타낸다. 이 옵티컬 플로 등식은, (i) 휘도값의 시간 미분과, (ii) 수평 방향의 속도 및 참조 화상의 공간 구배의 수평 성분의 곱과, (iii) 수직 방향의 속도 및 참조 화상의 공간 구배의 수직 성분의 곱의 합이, 제로와 같은 것을 나타낸다. 이 옵티컬 플로 등식과 에르미트 보간(Hermite interpolation)의 조합에 의거하여, 머지 리스트 등으로부터 얻어지는 블록 단위의 움직임 벡터가 화소 단위로 보정되어도 된다.
또한, 등속 직선 운동을 가정한 모델에 의거한 움직임 벡터의 도출과는 상이한 방법으로, 복호 장치측에서 움직임 벡터가 도출되어도 된다. 예를 들면, 복수의 인접 블록의 움직임 벡터에 의거하여 서브 블록 단위로 움직임 벡터가 도출되어도 된다.
[움직임 보상>LIC]
다음에, LIC(local illumination compensation) 처리를 사용하여 예측 화상(예측)을 생성하는 모드의 일례에 대해서 설명한다.
도 39는, LIC 처리에 의한 휘도 보정 처리를 사용한 예측 화상 생성 방법의 일례를 설명하기 위한 개념도이다.
우선, 부호화 완료된 참조 픽처로부터 MV를 도출하여, 커런트 블록에 대응하는 참조 화상을 취득한다.
다음에, 커런트 블록에 대해, 참조 픽처와 커런트 픽처에서 휘도값이 어떻게 변화했는지를 나타내는 정보를 추출한다. 이 추출은, 커런트 픽처에 있어서의 부호화 완료 좌측 인접 참조 영역(주변 참조 영역) 및 부호화 완료 상측 인접 참조 영역(주변 참조 영역)의 휘도 화소값과, 도출된 MV로 지정된 참조 픽처 내의 동등 위치에 있어서의 휘도 화소값에 의거하여 행해진다. 그리고, 휘도값이 어떻게 변화했는지를 나타내는 정보를 사용하여, 휘도 보정 파라미터를 산출한다.
MV로 지정된 참조 픽처 내의 참조 화상에 대해 상기 휘도 보정 파라미터를 적용하는 휘도 보정 처리를 행함으로써, 커런트 블록에 대한 예측 화상을 생성한다.
또한, 도 39에 있어서의 상기 주변 참조 영역의 형상은 일례이며, 이 이외의 형상을 사용해도 된다.
또, 여기에서는 1매의 참조 픽처로부터 예측 화상을 생성하는 처리에 대해서 설명했는데, 복수 매의 참조 픽처로부터 예측 화상을 생성하는 경우도 마찬가지이고, 각각의 참조 픽처로부터 취득한 참조 화상에, 상술한 것과 동일한 방법으로 휘도 보정 처리를 행하고 나서 예측 화상을 생성해도 된다.
LIC 처리를 적용할지 여부의 판정 방법으로서, 예를 들면, LIC 처리를 적용할지 여부를 나타내는 신호인 lic_flag를 사용하는 방법이 있다. 구체적인 일례로서는, 부호화 장치에 있어서, 커런트 블록이, 휘도 변화가 발생하고 있는 영역에 속해 있는지 여부를 판정하고, 휘도 변화가 발생하고 있는 영역에 속해 있는 경우는 lic_flag로서 값 1을 설정하여 LIC 처리를 적용하여 부호화를 행하고, 휘도 변화가 발생하고 있는 영역에 속해있지 않은 경우는 lic_flag로서 값 0을 설정하여 LIC 처리를 적용하지 않고 부호화를 행한다. 한편, 복호화 장치에서는, 스트림에 기술된 lic_flag를 복호화함으로써, 그 값에 따라 LIC 처리를 적용할지 여부를 전환하여 복호를 행해도 된다.
LIC 처리를 적용할지 여부의 판정의 다른 방법으로서, 예를 들면, 주변 블록에서 LIC 처리를 적용했는지 여부에 따라 판정하는 방법도 있다. 구체적인 일례로서는, 커런트 블록이 머지 모드인 경우, 머지 모드 처리에 있어서의 MV의 도출 시에 선택한 주변의 부호화 완료 블록이 LIC 처리를 적용하여 부호화했는지 여부를 판정한다. 그 결과에 따라 LIC 처리를 적용할지 여부를 전환하여 부호화를 행한다. 또한, 이 예의 경우에도, 같은 처리가 복호 장치측의 처리에 적용된다.
LIC 처리(휘도 보정 처리)의 양태에 대해서 도 39를 사용하여 설명했는데, 이하, 그 상세를 설명한다.
우선, 인터 예측부(126)는, 부호화 완료 픽처인 참조 픽처로부터 부호화 대상 블록에 대응하는 참조 화상을 취득하기 위한 움직임 벡터를 도출한다.
다음에, 인터 예측부(126)는, 부호화 대상 블록에 대해, 좌측 인접 및 상측 인접의 부호화 완료 주변 참조 영역의 휘도 화소값과, 움직임 벡터로 지정된 참조 픽처 내의 동등 위치에 있어서의 휘도 화소값을 사용하여, 참조 픽처와 부호화 대상 픽처에서 휘도값이 어떻게 변화했는지를 나타내는 정보를 추출하여 휘도 보정 파라미터를 산출한다. 예를 들면, 부호화 대상 픽처 내의 주변 참조 영역 내의 어느 화소의 휘도 화소값을 p0으로 하고, 당해 화소와 동등 위치의, 참조 픽처 내의 주변 참조 영역 내의 화소의 휘도 화소값을 p1로 한다. 인터 예측부(126)는, 주변 참조 영역 내의 복수의 화소에 대해, A×p1+B=p0을 최적화하는 계수 A 및 B를 휘도 보정 파라미터로서 산출한다.
다음에, 인터 예측부(126)는, 움직임 벡터로 지정된 참조 픽처 내의 참조 화상에 대해 휘도 보정 파라미터를 사용하여 휘도 보정 처리를 행함으로써, 부호화 대상 블록에 대한 예측 화상을 생성한다. 예를 들면, 참조 화상 내의 휘도 화소값을 p2로 하고, 휘도 보정 처리 후의 예측 화상의 휘도 화소값을 p3으로 한다. 인터 예측부(126)는, 참조 화상 내의 각 화소에 대해, A×p2+B=p3을 산출함으로써 휘도 보정 처리 후의 예측 화상을 생성한다.
또한, 도 39에 있어서의 주변 참조 영역의 형상은 일례이며, 이 이외의 형상을 사용해도 된다. 또, 도 39에 나타내는 주변 참조 영역의 일부가 사용되어도 된다. 예를 들면, 상측 인접 화소 및 좌측 인접 화소 각각으로부터 솎아 낸 소정 수의 화소를 포함하는 영역을 주변 참조 영역으로서 사용해도 된다. 또, 주변 참조 영역은, 부호화 대상 블록에 인접하는 영역에 한정하지 않고, 부호화 대상 블록에 인접하지 않는 영역이어도 된다. 화소에 관한 소정 수는, 미리 정해져 있어도 된다.
또, 도 39에 나타내는 예에서는, 참조 픽처 내의 주변 참조 영역은, 부호화 대상 픽처 내의 주변 참조 영역으로부터, 부호화 대상 픽처의 움직임 벡터로 지정되는 영역인데, 다른 움직임 벡터로 지정되는 영역이어도 된다. 예를 들면, 당해 다른 움직임 벡터는, 부호화 대상 픽처 내의 주변 참조 영역의 움직임 벡터여도 된다.
또한, 여기에서는, 부호화 장치(100)에 있어서의 동작을 설명했는데, 복호 장치(200)에 있어서의 동작도 전형적으로는 동일하다.
또한, LIC 처리는 휘도뿐만 아니라, 색차에 적용해도 된다. 이 때, Y, Cb, 및 Cr 각각 대해 개별적으로 보정 파라미터를 도출해도 되고, 어느 하나에 대해 공통의 보정 파라미터를 사용해도 된다.
또, LIC 처리는 서브 블록 단위로 적용해도 된다. 예를 들면, 커런트 서브 블록의 주변 참조 영역과, 커런트 서브 블록의 MV로 지정된 참조 픽처 내의 참조 서브 블록의 주변 참조 영역을 사용하여 보정 파라미터를 도출해도 된다.
[예측 제어부]
예측 제어부(128)는, 인트라 예측 신호(인트라 예측부(124)로부터 출력되는 신호) 및 인터 예측 신호(인터 예측부(126)로부터 출력되는 신호) 중 어느 하나를 선택하고, 선택한 신호를 예측 신호로서 감산부(104) 및 가산부(116)에 출력한다.
도 1에 나타내는 바와 같이, 여러 가지 부호화 장치 예에서는, 예측 제어부(128)는, 엔트로피 부호화부(110)에 입력되는 예측 파라미터를 출력해도 된다. 엔트로피 부호화부(110)는, 예측 제어부(128)로부터 입력되는 그 예측 파라미터, 양자화부(108)로부터 입력되는 양자화 계수에 의거하여, 부호화 비트 스트림(또는 시퀀스)을 생성해도 된다. 예측 파라미터는 복호 장치에 사용되어도 된다. 복호 장치는, 부호화 비트 스트림을 수신하여 복호하고, 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에 있어서 행해지는 예측 처리와 같은 처리를 행해도 된다. 예측 파라미터는, 선택 예측 신호(예를 들면, 움직임 벡터, 예측 타입, 또는, 인트라 예측부(124) 또는 인터 예측부(126)에서 사용된 예측 모드), 또는, 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에 있어서 행해지는 예측 처리에 의거하는, 혹은 그 예측 처리를 나타내는, 임의의 인덱스, 플래그, 혹은 값을 포함하고 있어도 된다.
[부호화 장치의 실장예]
도 40은, 부호화 장치(100)의 실장예를 나타내는 블록도이다. 부호화 장치(100)는, 프로세서(a1) 및 메모리(a2)를 구비한다. 예를 들면, 도 1에 나타난 부호화 장치(100)의 복수의 구성 요소는, 도 40에 나타난 프로세서(a1) 및 메모리(a2)에 의해 실장된다.
프로세서(a1)는, 정보 처리를 행하는 회로이며, 메모리(a2)에 액세스 가능한 회로이다. 예를 들면, 프로세서(a1)는, 동화상을 부호화하는 전용 또는 범용 전자 회로이다. 프로세서(a1)는, CPU와 같은 프로세서여도 된다. 또, 프로세서(a1)는, 복수의 전자 회로의 집합체여도 된다. 또, 예를 들면, 프로세서(a1)는, 도 1 등에 나타난 부호화 장치(100)의 복수의 구성 요소 중, 복수의 구성 요소의 역할을 완수해도 된다.
메모리(a2)는, 프로세서(a1)가 동화상을 부호화하기 위한 정보가 기억되는 전용 또는 범용 메모리이다. 메모리(a2)는, 전자 회로여도 되고, 프로세서(a1)에 접속되어 있어도 된다. 또, 메모리(a2)는, 프로세서(a1)에 포함되어 있어도 된다. 또, 메모리(a2)는, 복수의 전자 회로의 집합체여도 된다. 또, 메모리(a2)는, 자기 디스크 또는 광 디스크 등이어도 되고, 스토리지 또는 기록 매체 등으로 표현되어도 된다. 또, 메모리(a2)는, 불휘발성 메모리여도 되고, 휘발성 메모리여도 된다.
예를 들면, 메모리(a2)에는, 부호화되는 동화상이 기억되어도 되고, 부호화된 동화상에 대응하는 비트열이 기억되어도 된다. 또, 메모리(a2)에는, 프로세서(a1)가 동화상을 부호화하기 위한 프로그램이 기억되어 있어도 된다.
또, 예를 들면, 메모리(a2)는, 도 1 등에 나타난 부호화 장치(100)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소의 역할을 완수해도 된다. 예를 들면, 메모리(a2)는, 도 1에 나타난 블록 메모리(118) 및 프레임 메모리(122)의 역할을 완수해도 된다. 보다 구체적으로는, 메모리(a2)에는, 재구성 완료 블록 및 재구성 완료 픽처 등이 기억되어도 된다.
또한, 부호화 장치(100)에 있어서, 도 1 등에 나타난 복수의 구성 요소 전부가 실장되지 않아도 되고, 상술된 복수의 처리 전부가 행해지지 않아도 된다. 도 1 등에 나타난 복수의 구성 요소의 일부는, 다른 장치에 포함되어 있어도 되고, 상술된 복수의 처리의 일부는, 다른 장치에 의해 실행되어도 된다.
[복호 장치]
다음에, 예를 들면 상기의 부호화 장치(100)로부터 출력된 부호화 신호(부호화 비트 스트림)를 복호 가능한 복호 장치에 대해서 설명한다. 도 41은, 실시 형태에 따른 복호 장치(200)의 기능 구성을 나타내는 블록도이다. 복호 장치(200)는, 동화상을 블록 단위로 복호하는 동화상 복호 장치이다.
도 41에 나타내는 바와 같이, 복호 장치(200)는, 엔트로피 복호부(202)와, 역양자화부(204)와, 역변환부(206)와, 가산부(208)와, 블록 메모리(210)와, 루프 필터부(212)와, 프레임 메모리(214)와, 인트라 예측부(216)와, 인터 예측부(218)와, 예측 제어부(220)를 구비한다.
복호 장치(200)는, 예를 들면, 범용 프로세서 및 메모리에 의해 실현된다. 이 경우, 메모리에 저장된 소프트웨어 프로그램이 프로세서에 의해 실행되었을 때에, 프로세서는, 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 루프 필터부(212), 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)로서 기능한다. 또, 복호 장치(200)는, 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 루프 필터부(212), 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)에 대응하는 전용의 1 이상의 전자 회로로서 실현되어도 된다.
이하에, 복호 장치(200)의 전체적인 처리의 흐름을 설명한 후에, 복호 장치(200)에 포함되는 각 구성 요소에 대해서 설명한다.
[복호 처리의 전체 플로]
도 42는, 복호 장치(200)에 의한 전체적인 복호 처리의 일례를 나타내는 플로차트이다.
우선, 복호 장치(200)의 엔트로피 복호부(202)는, 고정 사이즈의 블록(예를 들면, 128×128 화소)의 분할 패턴을 특정한다(단계 Sp_1). 이 분할 패턴은, 부호화 장치(100)에 의해 선택된 분할 패턴이다. 그리고, 복호 장치(200)는, 그 분할 패턴을 구성하는 복수의 블록 각각에 대해 단계 Sp_2~Sp_6의 처리를 행한다.
즉, 엔트로피 복호부(202)는, 복호 대상 블록(커런트 블록이라고도 한다)의 부호화된 양자화 계수 및 예측 파라미터를 복호(구체적으로는 엔트로피 복호)한다(단계 Sp_2).
다음에, 역양자화부(204) 및 역변환부(206)는, 복수의 양자화 계수에 대해 역양자화 및 역변환을 행함으로써, 복수의 예측 잔차(즉 차분 블록)를 복원한다(단계 Sp_3).
다음에, 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)의 전부 또는 일부로 이루어지는 예측 처리부는, 커런트 블록의 예측 신호(예측 블록이라고도 한다)를 생성한다(단계 Sp_4).
다음에, 가산부(208)는, 차분 블록에 예측 블록을 가산함으로써 커런트 블록을 재구성 화상(복호 화상 블록이라고도 한다)으로 재구성한다(단계 Sp_5).
그리고, 이 재구성 화상이 생성되면, 루프 필터부(212)는, 그 재구성 화상에 대해 필터링을 행한다(단계 Sp_6).
그리고, 복호 장치(200)는, 픽처 전체의 복호가 완료되었는지 여부를 판정하고(단계 Sp_7), 완료되지 않았다고 판정하는 경우(단계 Sp_7의 No), 단계 Sp_1에서부터의 처리를 반복하여 실행한다.
도시된 바와 같이, 단계 Sp_1~Sp_7의 처리는, 복호 장치(200)에 의해 시퀀셜하게 행해진다. 혹은, 그들 처리 중 일부의 복수의 처리가 병렬로 행해져도 되고, 순서 바꿈 등이 행해져도 된다.
[엔트로피 복호부]
엔트로피 복호부(202)는, 부호화 비트 스트림을 엔트로피 복호한다. 구체적으로는, 엔트로피 복호부(202)는, 예를 들면, 부호화 비트 스트림으로부터 2치 신호로 산술 복호한다. 그리고, 엔트로피 복호부(202)는, 2치 신호를 다치화(debinarize)한다. 엔트로피 복호부(202)는, 블록 단위로 양자화 계수를 역양자화부(204)에 출력한다. 엔트로피 복호부(202)는, 실시 형태에 있어서의 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)에, 부호화 비트 스트림(도 1 참조)에 포함되어 있는 예측 파라미터를 출력해도 된다. 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)는, 부호화 장치측에 있어서의 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에서 행해지는 처리와 같은 예측 처리를 실행할 수 있다.
[역양자화부]
역양자화부(204)는, 엔트로피 복호부(202)로부터의 입력인 복호 대상 블록(이하, 커런트 블록이라고 한다)의 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(204)는, 커런트 블록의 양자화 계수 각각에 대해서, 당해 양자화 계수에 대응하는 양자화 파라미터에 의거하여 당해 양자화 계수를 역양자화한다. 그리고, 역양자화부(204)는, 커런트 블록의 역양자화된 양자화 계수(즉 변환 계수)를 역변환부(206)에 출력한다.
[역변환부]
역변환부(206)는, 역양자화부(204)로부터의 입력인 변환 계수를 역변환함으로써 예측 오차를 복원한다.
예를 들면 부호화 비트 스트림으로부터 해독된 정보가 EMT 또는 AMT를 적용하는 것을 나타내는 경우(예를 들면 AMT 플래그가 참), 역변환부(206)는, 해독된 변환 타입을 나타내는 정보에 의거하여 커런트 블록의 변환 계수를 역변환한다.
또 예를 들면, 부호화 비트 스트림으로부터 해독된 정보가 NSST를 적용하는 것을 나타내는 경우, 역변환부(206)는, 변환 계수에 역재변환을 적용한다.
[가산부]
가산부(208)는, 역변환부(206)로부터의 입력인 예측 오차와 예측 제어부(220)로부터의 입력인 예측 샘플을 가산함으로써 커런트 블록을 재구성한다. 그리고, 가산부(208)는, 재구성된 블록을 블록 메모리(210) 및 루프 필터부(212)에 출력한다.
[블록 메모리]
블록 메모리(210)는, 인트라 예측에서 참조되는 블록으로서 복호 대상 픽처(이하, 커런트 픽처라고 한다) 내의 블록을 저장하기 위한 기억부이다. 구체적으로는, 블록 메모리(210)는, 가산부(208)로부터 출력된 재구성 블록을 저장한다.
[루프 필터부]
루프 필터부(212)는, 가산부(208)에 의해 재구성된 블록에 루프 필터링을 실시하고, 필터링된 재구성 블록을 프레임 메모리(214) 및 표시 장치 등에 출력한다.
부호화 비트 스트림으로부터 해독된 ALF의 온/오프를 나타내는 정보가 ALF의 온을 나타내는 경우, 국소적인 구배의 방향 및 활성도에 의거하여 복수의 필터 중에서 1개의 필터가 선택되고, 선택된 필터가 재구성 블록에 적용된다.
[프레임 메모리]
프레임 메모리(214)는, 인터 예측에 이용되는 참조 픽처를 저장하기 위한 기억부이며, 프레임 버퍼로 불리는 경우도 있다. 구체적으로는, 프레임 메모리(214)는, 루프 필터부(212)에 의해 필터링된 재구성 블록을 저장한다.
[예측 처리부(인트라 예측부·인터 예측부·예측 제어부)]
도 43은, 복호 장치(200)의 예측 처리부에서 행해지는 처리의 일례를 나타내는 플로차트이다. 또한, 예측 처리부는, 인트라 예측부(216), 인터 예측부(218), 및 예측 제어부(220)의 전부 또는 일부의 구성 요소로 이루어진다.
예측 처리부는, 커런트 블록의 예측 화상을 생성한다(단계 Sq_1). 이 예측 화상은, 예측 신호 또는 예측 블록이라고도 한다. 또한, 예측 신호에는, 예를 들면 인트라 예측 신호 또는 인터 예측 신호가 있다. 구체적으로는, 예측 처리부는, 예측 블록의 생성, 차분 블록의 생성, 계수 블록의 생성, 차분 블록의 복원, 및 복호 화상 블록의 생성이 행해짐으로써 이미 얻어져 있는 재구성 화상을 사용하여, 커런트 블록의 예측 화상을 생성한다.
재구성 화상은, 예를 들면, 참조 픽처의 화상이어도 되고, 커런트 블록을 포함하는 픽처인 커런트 픽처 내의 복호 완료 블록의 화상이어도 된다. 커런트 픽처 내의 복호 완료 블록은, 예를 들면 커런트 블록의 인접 블록이다.
도 44는, 복호 장치(200)의 예측 처리부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
예측 처리부는, 예측 화상을 생성하기 위한 방식 또는 모드를 판정한다(단계 Sr_1). 예를 들면, 이 방식 또는 모드는, 예를 들면 예측 파라미터 등에 의거하여 판정되어도 된다.
예측 처리부는, 예측 화상을 생성하기 위한 모드로서 제1 방식을 판정한 경우에는, 그 제1 방식에 따라 예측 화상을 생성한다(단계 Sr_2a). 또, 예측 처리부는, 예측 화상을 생성하기 위한 모드로서 제2 방식을 판정한 경우에는, 그 제2 방식에 따라 예측 화상을 생성한다(단계 Sr_2b). 또, 예측 처리부는, 예측 화상을 생성하기 위한 모드로서 제3 방식을 판정한 경우에는, 그 제3 방식에 따라 예측 화상을 생성한다(단계 Sr_2c).
제1 방식, 제2 방식, 및 제3 방식은, 예측 화상을 생성하기 위한 서로 상이한 방식으로서, 각각 예를 들면, 인터 예측 방식, 인트라 예측 방식, 및, 그들 이외의 예측 방식이어도 된다. 이들 예측 방식에서는, 상술한 재구성 화상을 사용해도 된다.
[인트라 예측부]
인트라 예측부(216)는, 부호화 비트 스트림으로부터 해독된 인트라 예측 모드에 의거하여, 블록 메모리(210)에 저장된 커런트 픽처 내의 블록을 참조하여 인트라 예측을 행함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(216)는, 커런트 블록에 인접하는 블록의 샘플(예를 들면 휘도값, 색차값)을 참조하여 인트라 예측을 행함으로써 인트라 예측 신호를 생성하고, 인트라 예측 신호를 예측 제어부(220)에 출력한다.
또한, 색차 블록의 인트라 예측에 있어서 휘도 블록을 참조하는 인트라 예측 모드가 선택되어 있는 경우는, 인트라 예측부(216)는, 커런트 블록의 휘도 성분에 의거하여, 커런트 블록의 색차 성분을 예측해도 된다.
또, 부호화 비트 스트림으로부터 해독된 정보가 PDPC의 적용을 나타내는 경우, 인트라 예측부(216)는, 수평/수직 방향의 참조 화소의 구배에 의거하여 인트라 예측 후의 화소값을 보정한다.
[인터 예측부]
인터 예측부(218)는, 프레임 메모리(214)에 저장된 참조 픽처를 참조하여, 커런트 블록을 예측한다. 예측은, 커런트 블록 또는 커런트 블록 내의 서브 블록(예를 들면 4×4 블록)의 단위로 행해진다. 예를 들면, 인터 예측부(218)는, 부호화 비트 스트림(예를 들면, 엔트로피 복호부(202)로부터 출력되는 예측 파라미터)으로부터 해독된 움직임 정보(예를 들면 움직임 벡터)를 사용하여 움직임 보상을 행함으로써 커런트 블록 또는 서브 블록의 인터 예측 신호를 생성하고, 인터 예측 신호를 예측 제어부(220)에 출력한다.
부호화 비트 스트림으로부터 해독된 정보가 OBMC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 움직임 탐색에 의해 얻어진 커런트 블록의 움직임 정보뿐만 아니라, 인접 블록의 움직임 정보도 사용하여, 인터 예측 신호를 생성한다.
또, 부호화 비트 스트림으로부터 해독된 정보가 FRUC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 부호화 스트림으로부터 해독된 패턴 매칭의 방법(바이래터럴 매칭 또는 템플릿 매칭)에 따라 움직임 탐색을 행함으로써 움직임 정보를 도출한다. 그리고, 인터 예측부(218)는, 도출된 움직임 정보를 사용하여 움직임 보상(예측)을 행한다.
또, 인터 예측부(218)는, BIO 모드가 적용되는 경우에, 등속 직선 운동을 가정한 모델에 의거하여 움직임 벡터를 도출한다. 또, 부호화 비트 스트림으로부터 해독된 정보가 아핀 움직임 보상 예측 모드를 적용하는 것을 나타내는 경우에는, 인터 예측부(218)는, 복수의 인접 블록의 움직임 벡터에 의거하여 서브 블록 단위로 움직임 벡터를 도출한다.
[MV 도출>노멀 인터 모드]
부호화 비트 스트림으로부터 해독된 정보가 노멀 인터 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 부호화 스트림으로부터 해독된 정보에 의거하여, MV를 도출하고, 그 MV를 사용하여 움직임 보상(예측)을 행한다.
도 45는, 복호 장치(200)에 있어서의 노멀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
복호 장치(200)의 인터 예측부(218)는, 블록마다, 그 블록에 대해 움직임 보상을 행한다. 인터 예측부(218)는, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 복호 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Ss_1). 즉, 인터 예측부(218)는, 후보 MV 리스트를 작성한다.
다음에, 인터 예측부(218)는, 단계 Ss_1에서 취득된 복수의 후보 MV 중에서, N개(N은 2 이상의 정수)의 후보 MV 각각을 예측 움직임 벡터 후보(예측 MV 후보라고도 한다)로서, 소정의 우선 순위에 따라 추출한다(단계 Ss_2). 또한, 그 우선 순위는, N개의 예측 MV 후보 각각에 대해 미리 정해져 있어도 된다.
다음에, 인터 예측부(218)는, 입력된 스트림(즉 부호화 비트 스트림)으로부터 예측 움직임 벡터 선택 정보를 복호하고, 그 복호된 예측 움직임 벡터 선택 정보를 사용하여, 그 N개의 예측 MV 후보 중에서 1개의 예측 MV 후보를, 커런트 블록의 예측 움직임 벡터(예측 MV라고도 한다)로서 선택한다(단계 Ss_3).
다음에, 인터 예측부(218)는, 입력된 스트림으로부터 차분 MV를 복호하고, 그 복호된 차분 MV인 차분값과, 선택된 예측 움직임 벡터를 가산함으로써, 커런트 블록의 MV를 도출한다(단계 Ss_4).
마지막으로, 인터 예측부(218)는, 그 도출된 MV와 복호 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Ss_5).
[예측 제어부]
예측 제어부(220)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 하나를 선택하고, 선택한 신호를 예측 신호로서 가산부(208)에 출력한다. 전체적으로, 복호 장치측의 예측 제어부(220), 인트라 예측부(216) 및 인터 예측부(218)의 구성, 기능, 및 처리는, 부호화 장치측의 예측 제어부(128), 인트라 예측부(124) 및 인터 예측부(126)의 구성, 기능, 및 처리와 대응하고 있어도 된다.
[복호 장치의 실장예]
도 46은, 복호 장치(200)의 실장예를 나타내는 블록도이다. 복호 장치(200)는, 프로세서(b1) 및 메모리(b2)를 구비한다. 예를 들면, 도 41에 나타난 복호 장치(200)의 복수의 구성 요소는, 도 46에 나타난 프로세서(b1) 및 메모리(b2)에 의해 실장된다.
프로세서(b1)는, 정보 처리를 행하는 회로이며, 메모리(b2)에 액세스 가능한 회로이다. 예를 들면, 프로세서(b1)는, 부호화된 동화상(즉 부호화 비트 스트림)을 복호하는 전용 또는 범용 전자 회로이다. 프로세서(b1)는, CPU와 같은 프로세서여도 된다. 또, 프로세서(b1)는, 복수의 전자 회로의 집합체여도 된다. 또, 예를 들면, 프로세서(b1)는, 도 41 등에 나타난 복호 장치(200)의 복수의 구성 요소 중, 복수의 구성 요소의 역할을 완수해도 된다.
메모리(b2)는, 프로세서(b1)가 부호화 비트 스트림을 복호하기 위한 정보가 기억되는 전용 또는 범용 메모리이다. 메모리(b2)는, 전자 회로여도 되고, 프로세서(b1)에 접속되어 있어도 된다. 또, 메모리(b2)는, 프로세서(b1)에 포함되어 있어도 된다. 또, 메모리(b2)는, 복수의 전자 회로의 집합체여도 된다. 또, 메모리(b2)는, 자기 디스크 또는 광 디스크 등이어도 되고, 스토리지 또는 기록 매체 등으로 표현되어도 된다. 또, 메모리(b2)는, 불휘발성 메모리여도 되고, 휘발성 메모리여도 된다.
예를 들면, 메모리(b2)에는, 동화상이 기억되어도 되고, 부호화 비트 스트림이 기억되어도 된다. 또, 메모리(b2)에는, 프로세서(b1)가 부호화 비트 스트림을 복호하기 위한 프로그램이 기억되어 있어도 된다.
또, 예를 들면, 메모리(b2)는, 도 41 등에 나타난 복호 장치(200)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소의 역할을 완수해도 된다. 구체적으로는, 메모리(b2)는, 도 41에 나타난 블록 메모리(210) 및 프레임 메모리(214)의 역할을 완수해도 된다. 보다 구체적으로는, 메모리(b2)에는, 재구성 완료 블록 및 재구성 완료 픽처 등이 기억되어도 된다.
또한, 복호 장치(200)에 있어서, 도 41 등에 나타난 복수의 구성 요소 전부가 실장되지 않아도 되고, 상술된 복수의 처리 전부가 행해지지 않아도 된다. 도 41 등에 나타난 복수의 구성 요소의 일부는, 다른 장치에 포함되어 있어도 되고, 상술된 복수의 처리의 일부는, 다른 장치에 의해 실행되어도 된다.
[각 용어의 정의]
각 용어는 일례로서, 이하와 같은 정의여도 된다.
픽처는, 모노크롬 포맷에 있어서의 복수의 휘도 샘플의 배열, 또는, 4:2:0, 4:2:2 및 4:4:4의 컬러 포맷에 있어서의 복수의 휘도 샘플의 배열 및 복수의 색차 샘플의 2개의 대응 배열이다. 픽처는, 프레임 또는 필드여도 된다.
프레임은, 복수의 샘플 행 0, 2, 4,···가 생기는 탑 필드, 및, 복수의 샘플 행 1, 3, 5,···가 생기는 바텀 필드의 조성물이다.
슬라이스는, 1개의 독립 슬라이스 세그먼트, 및, (혹시 있다면) 같은 액세스 유닛 내의 (혹시 있다면) 다음 독립 슬라이스 세그먼트에 선행하는 모든 후속하는 종속 슬라이스 세그먼트에 포함되는 정수 개의 부호화 트리 유닛이다.
타일은, 픽처에 있어서의 특정 타일 열 및 특정 타일 행 내의 복수의 부호화 트리 블록의 직사각형 영역이다. 타일은, 타일의 에지에 걸치는 루프 필터가 여전히 적용되어도 되는데, 독립적으로 복호 및 부호화될 수 있는 것이 의도된, 프레임의 직사각형 영역이어도 된다.
블록은, 복수의 샘플의 M×N(N행 M열) 배열, 또는, 복수의 변환 계수의 M×N 배열이다. 블록은, 1개의 휘도 및 2개의 색차의 복수의 행렬로 이루어지는 복수의 화소의 정사각형 또는 직사각형의 영역이어도 된다.
CTU(부호화 트리 유닛)는, 3개의 샘플 배열을 갖는 픽처의 복수의 휘도 샘플의 부호화 트리 블록이어도 되고, 복수의 색차 샘플의 2개의 대응 부호화 트리 블록이어도 된다. 혹은, CTU는, 모노크롬 픽처와, 3개의 분리된 컬러 평면 및 복수의 샘플의 부호화에 사용되는 신택스 구조를 사용하여 부호화되는 픽처 중 어느 하나의 복수의 샘플의 부호화 트리 블록이어도 된다.
슈퍼 블록은, 1개 또는 2개의 모드 정보 블록을 구성하고, 또는, 재귀적으로 4개의 32×32 블록으로 분할되고, 추가로 분할될 수 있는 64×64 화소의 정사각형 블록이어도 된다.
[BDOF(BIO) 처리의 개요의 설명]
BDOF(BIO) 처리의 개요에 대해서, 도 38, 도 47 및 도 48을 사용하여 다시 한 번 설명한다.
도 47은, BIO에 따른 인터 예측의 일례를 나타내는 플로차트이다. 또, 도 48은, 그 BIO에 따른 인터 예측을 행하는 인터 예측부(126)의 기능 구성의 일례를 나타내는 도면이다.
도 48에 나타내는 바와 같이, 인터 예측부(126)는, 예를 들면, 메모리(126a)와, 보간 화상 도출부(126b)와, 구배 화상 도출부(126c)와, 옵티컬 플로 도출부(126d)와, 보정값 도출부(126e)와, 예측 화상 보정부(126f)를 구비한다. 또한, 메모리(126a)는, 프레임 메모리(122)여도 된다.
인터 예측부(126)는, 커런트 블록을 포함하는 픽처(Cur Pic)와 상이한 2매의 참조 픽처(Ref0, Ref1)를 사용하여, 2개의 움직임 벡터(M0, M1)를 도출한다. 그리고, 인터 예측부(126)는, 그 2개의 움직임 벡터(M0, M1)를 사용하여 커런트 블록의 예측 화상을 도출한다(단계 Sy_1). 또한, 움직임 벡터 M0는, 참조 픽처 Ref0에 대응하는 움직임 벡터(MVx0, MVy0)이며, 움직임 벡터 M1은, 참조 픽처 Ref1에 대응하는 움직임 벡터(MVx1, MVy1)이다.
다음에, 보간 화상 도출부(126b)는, 메모리(126a)를 참조하고, 움직임 벡터 M0 및 참조 픽처 L0을 사용하여 커런트 블록의 보간 화상 I0을 도출한다. 또, 보간 화상 도출부(126b)는, 메모리(126a)를 참조하고, 움직임 벡터 M1 및 참조 픽처 L1을 사용하여 커런트 블록의 보간 화상 I1을 도출한다(단계 Sy_2). 여기서, 보간 화상 I0은, 커런트 블록에 대해서 도출되는, 참조 픽처 Ref0에 포함되는 화상으로서, 보간 화상 I1은, 커런트 블록에 대해 도출되는, 참조 픽처 Ref1에 포함되는 화상이다. 보간 화상 I0 및 보간 화상 I1은 각각, 커런트 블록과 같은 사이즈여도 된다. 또는, 보간 화상 I0 및 보간 화상 I1은 각각, 후술하는 구배 화상을 적절히 도출하기 위해, 커런트 블록보다 큰 화상이어도 된다. 또한, 보간 화상 I0 및 I1은, 움직임 벡터(M0, M1) 및 참조 픽처(L0, L1)와, 움직임 보상 필터를 적용하여 도출된 예측 화상을 포함하고 있어도 된다.
또, 구배 화상 도출부(126c)는, 보간 화상 I0 및 보간 화상 I1로부터, 커런트 블록의 구배 화상(Ix0, Ix1, Iy0, Iy1)을 도출한다(단계 Sy_3). 또한, 수평 방향의 구배 화상은, (Ix0, Ix1)이고, 수직 방향의 구배 화상은, (Iy0, Iy1)이다. 구배 화상 도출부(126c)는, 예를 들면, 보간 화상에 대해 구배 필터를 적용함으로써, 그 구배 화상을 도출해도 된다. 구배 화상은, 수평 방향 또는 수직 방향을 따른 화소값의 공간적인 변화량을 나타내는 것이면 된다.
다음에, 옵티컬 플로 도출부(126d)는, 커런트 블록을 구성하는 복수의 서브 블록 단위로, 보간 화상(I0, I1) 및 구배 화상(Ix0, Ix1, Iy0, Iy1)을 사용하여 상술한 속도 벡터인 옵티컬 플로(vx, vy)를 도출한다(단계 Sy_4). 옵티컬 플로는, 화소의 공간적인 이동량을 보정하는 계수이며, 국소 움직임 추정값, 보정 움직임 벡터, 또는 보정 가중치 벡터로 불려도 된다. 일례로서, 서브 블록은, 4×4 화소의 서브 CU여도 된다. 또한, 옵티컬 플로의 도출은, 서브 블록 단위가 아니라, 화소 단위 등의 다른 단위로 행해져도 된다.
다음에, 인터 예측부(126)는, 옵티컬 플로(vx, vy)를 사용하여 커런트 블록의 예측 화상을 보정한다. 예를 들면, 보정값 도출부(126e)는, 옵티컬 플로(vx, vy)를 사용하여 커런트 블록에 포함되는 화소의 값의 보정값을 도출한다(단계 Sy_5). 그리고, 예측 화상 보정부(126f)는, 보정값을 사용하여 커런트 블록의 예측 화상을 보정해도 된다(단계 Sy_6). 또한, 보정값은 각 화소 단위로 도출되어도 되고, 복수의 화소 단위 또는 서브 블록 단위로 도출되어도 된다.
또한, BIO의 처리 플로는, 도 47에 개시한 처리로 한정되지 않는다. 도 47에 개시한 처리의 일부의 처리만을 실시해도 되고, 상이한 처리를 추가 또는 치환해도 되고, 상이한 처리 순으로 실행해도 된다.
예를 들면, BDOF(BIO)는, 참조 블록의 구배를 사용하여, 보정된 예측 화상을 생성하는 처리로 정의되어도 된다. 혹은, BDOF는, 2개의 참조 블록 각각의 구배를 사용하여 예측 화상을 생성하는 처리로 정의되어도 된다. 혹은, BDOF는, 아핀 모드와는 상이한 모드에 있어서 구배를 사용하여 예측 화상을 생성하는 처리로 정의되어도 된다. 혹은, BDOF는, 아핀 모드와는 상이한 모드에 있어서의 옵티컬 플로 처리로 정의되어도 된다. 여기서, 구배는, 화소값의 공간적인 구배를 의미한다.
[BIO의 제1 구체예]
다음에, 도 49, 도 50 및 도 51을 사용하여, BIO에 의거한 복호 처리의 제1 구체예를 설명한다. 예를 들면, 복호 장치(200)는, 움직임 보상이 행해진 2개의 참조 블록으로부터 BIO 파라미터를 산출하고, 산출된 BIO 파라미터를 사용하여 커런트 블록을 복호한다. BIO 파라미터는, 상술된 옵티컬 플로에 대응하는 파라미터로서, 국소 움직임 추정값, 보정 움직임 벡터, 보정 MV값, 보정 가중치 움직임 벡터, 또는, BIO 보정값으로도 불린다.
도 49는, BIO에 의거한 복호 처리의 제1 구체예를 나타내는 플로차트이다. 도 50은, 수평 방향의 구배값인 수평 구배값의 산출예를 나타내는 개념도이다. 도 51은, 수직 방향의 구배값인 수직 구배값의 산출예를 나타내는 개념도이다.
우선, 복호 장치(200)는, 커런트 블록에 대해, 제1 참조 블록의 수평 구배값 및 제2 참조 블록의 수평 구배값을 사용하여 제1 합을 산출한다(S1001). 커런트 블록은, 도 50 및 도 51에 나타내는 커런트 부호화 유닛(커런트 CU)의 서브 블록이어도 된다.
제1 참조 블록은, 커런트 블록의 복호에 있어서 참조되는 블록으로서, 커런트 블록 또는 커런트 CU의 제1 움직임 벡터에 의해 참조 픽처 L0에 있어서 정해지는 블록이다. 제2 참조 블록은, 커런트 블록의 복호에 있어서 참조되는 블록으로서, 커런트 블록 또는 커런트 CU의 제2 움직임 벡터에 의해 참조 픽처 L1에 있어서 정해지는 블록이다.
기본적으로, 참조 픽처 L0 및 참조 픽처 L1은, 서로 상이한 2개의 참조 픽처이며, 제1 참조 블록 및 제2 참조 블록은, 서로 상이한 2개의 참조 블록이다. 또, 여기에서는, 움직임 보상 필터에 의해 소수 화소 정밀도로 각각 조정된 제1 참조 블록 및 제2 참조 블록이 사용되고 있으며, 이들은 커런트 블록과 같은 사이즈를 갖고 있다.
커런트 블록이, 커런트 부호화 유닛의 서브 블록인 경우, 제1 참조 블록 및 제2 참조 블록 각각은, 커런트 부호화 유닛의 참조 블록의 서브 블록이어도 된다.
즉, 도 50 및 도 51에 있어서의 참조 픽처 L0 내의 복수의 화소값은, 참조 픽처 L0에 대해 커런트 부호화 유닛의 참조 블록으로서 정해지는 블록의 복수의 화소값이어도 된다. 마찬가지로, 도 50 및 도 51에 있어서의 참조 픽처 L1 내의 복수의 화소값은, 참조 픽처 L1에 대해 커런트 부호화 유닛의 참조 블록으로서 정해지는 블록의 복수의 화소값이어도 된다.
복호 장치(200)는, 상술된 제1 참조 블록의 수평 구배값, 및, 상술된 제2 참조 블록의 수평 구배값을 사용하여 제1 합을 산출한다. 복호 장치(200)는, 제1 참조 블록의 수평 구배값, 및, 제2 참조 블록의 수평 구배값으로만 한정하지 않고, 제1 참조 블록의 주변의 수평 구배값, 및, 제2 참조 블록의 주변의 수평 구배값을 사용하여, 제1 합을 산출해도 된다. 다음의 식 (3.1) 및 (3.2)는, 제1 합의 산출 처리 방법의 예를 나타낸다.
Figure pct00004
Figure pct00005
여기서, ×는, 곱셈을 나타내고, +는, 가산을 나타낸다. 또, sign는, 양 또는 음의 양음 부호를 나타낸다. 구체적으로는, sign는, 양을 1로 표시하고, 음을 -1로 표시한다. 보다 구체적으로는, sign는, 예를 들면, 이하를 나타낸다.
Figure pct00006
그 결과, sign(Gx[i,j])×Gx[i,j]는, Gx[i,j]가 양의 값인 경우에는 그대로 Gx[i,j]가 되고, Gx[i,j]가 음의 값인 경우에는 -Gx[i,j]가 되어, 즉, Gx[i,j]의 절대값(abs)를 도출하는 것과 같아진다.
식 (3.1)에 있어서, Ix 0은, 참조 픽처 L0의 제1 참조 블록에 있어서의 수평 구배값을 나타내고, Ix 1은, 참조 픽처 L1의 제2 참조 블록에 있어서의 수평 구배값을 나타낸다.
수평 구배값을 취득하기 위한 수평 구배 필터의 예는, [-1,0,1]의 필터 계수 세트를 갖는 3탭 필터이다. 제1 참조 블록에 있어서의 수평 구배값은, 제1 참조 블록에 있어서의 복수의 참조 화소에 수평 구배 필터를 적용함으로써 산출된다. 제2 참조 블록에 있어서의 수평 구배값은, 제2 참조 블록에 있어서의 복수의 참조 화소에 수평 구배 필터를 적용함으로써 산출된다.
도 50에 나타내는 예에서는, 제1 참조 블록의 [3,2]에 위치하는 화소의 수평 구배값 Ix 0은, 행렬 곱 [-1,0,1]T[2,3,5]로서 산출되고, 그 값은 3이다. 제2 참조 블록의 [3,2]에 위치하는 화소의 수평 구배값 Ix 1은, 행렬 곱 [-1,0,1]T[5,3,2]로서 산출되고, 그 값은 -3이다. 또한, [a,b c]는, 3행 1열의 행렬을 나타낸다.
식 (3.2)에 있어서, sGx는, 제1 합을 나타내고, Ω로 표시되는 윈도우에 걸친 Gx의 절대값 합으로서 산출된다. Ω의 사이즈는, 커런트 블록과 같아도 된다. 또, Ω의 사이즈는, 커런트 블록의 사이즈보다 커도 된다. 또, 후자의 경우, 커런트 블록의 인접 위치에 있어서의 Gx의 값은, 제1 합의 산출 처리에 포함된다.
또, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값의 합인 제1 합과 마찬가지로, 제1 참조 블록의 수직 구배값 및 제2 참조 블록의 수직 구배값을 사용하여 제2 합을 산출한다(S1002). 다음의 식 (3.3) 및 (3.4)는, 제2 합의 산출 처리 방법의 예를 나타낸다.
Figure pct00007
Figure pct00008
식 (3.3)에 있어서, Iy 0은, 참조 픽처 L0의 제1 참조 블록에 있어서의 수직 구배값을 나타내고, Iy 1은, 참조 픽처 L1의 제2 참조 블록에 있어서의 수직 구배값을 나타낸다.
수직 구배값을 취득하기 위한 수직 구배 필터의 예는, [-1,0,1]의 필터 계수 세트를 갖는 3탭 필터이다. 제1 참조 블록에 있어서의 수직 구배값은, 제1 참조 블록에 있어서의 복수의 참조 화소에 수직 구배 필터를 적용함으로써 산출된다. 제2 참조 블록에 있어서의 수직 구배값은, 제2 참조 블록에 있어서의 복수의 참조 화소에 수직 구배 필터를 적용함으로써 산출된다.
도 51에 나타내는 예에서는, 제1 참조 블록의 [3,2]에 위치하는 화소의 수직 구배값 Iy 0은, 행렬 곱 [-1,0,1]T[2,3,5]로서 산출되고, 그 값은 3이다. 제2 참조 블록의 [3,2]에 위치하는 화소의 수직 구배값 Iy 1은, 행렬 곱[-1,0,1]T[5,3,2]로서 산출되고, 그 값은 -3이다.
식 (3.4)에 있어서, sGy는, 제2 합을 나타내고, Ω로 표시되는 윈도우에 걸친 Gy의 절대값 합으로서 산출된다. Ω의 사이즈가, 커런트 블록의 사이즈보다 큰 경우, 커런트 블록의 인접 위치에 있어서의 Gy의 값은, 제2 합의 산출 처리에 포함된다.
다음에, 복호 장치(200)는, 제1 합이 제2 합보다 큰지 여부를 판정한다(S1003). 제1 합이 제2 합보다 크다고 판정된 경우(S1003에서 Yes), 복호 장치(200)는, 커런트 블록에 대해, 수직 구배값을 사용하지 않고 BIO 파라미터를 결정한다(S1004). 식 (3.5)~(3.9)는, 이 경우에 있어서의 BIO 파라미터를 결정하기 위한 연산 처리의 예를 나타낸다. 이들 식에서는, u로 표시되는 BIO 파라미터가, 수평 구배값을 사용하여 산출된다.
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
여기서, -는, 뺄셈을 나타내고, >>는, 시프트 연산을 나타낸다. 예를 들면, a>>b는 a에 대해 b비트 분의 오른쪽 시프트를 행하는 것을 의미한다. 또, Bits, BIOShift 및 Clip은, 각각, 이하를 나타낸다. 또한, 이하에 있어서, ceil는, 소수의 절상, floor는, 소수의 절사를 나타낸다.
Figure pct00014
식 (3.5)에서는, sGxdI가, 윈도우 Ω에 걸친, I0 i,j 및 I1 i,j의 차분과 sign(Gx[i,j])의 곱의 합으로서 산출된다. 여기서, I0 i,j는, 참조 픽처 L0의 제1 참조 블록 내의 위치 [i,j]에 있어서의 화소값을 나타내고, I1 i,j는, 참조 픽처 L1의 제2 참조 블록 내의 위치 [i,j]에 있어서의 화소값을 나타낸다. I0 i,j 및 I1 i,j는, 단순히 I0 및 I1로 표현되는 경우가 있다. BIO 파라미터 u는, 식 (3.6)~(3.9)에 의해, sGxdI 및 sGx를 사용하여 산출된다.
제1 합이 제2 합보다 크지 않다고 판정된 경우(S1003에서 No), 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값을 사용하지 않고 BIO 파라미터 u를 결정한다(S1005). 식 (3.10)~(3.14)는, 이 경우에 있어서의 BIO 파라미터 u를 결정하기 위한 연산 처리의 예를 나타낸다. 식 (3.10)~(3.14)는, 기본적으로, 식 (3.5)~(3.9)와 같은데, 식 (3.10)~(3.14)에서는, BIO 파라미터 u가, 수직 구배값을 사용하여 산출된다.
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
식 (3.10)에서는, sGydI가, 윈도우 Ω에 걸친, I0 i,j와 I1 i,j의 차분과 sign(Gy[i,j])의 곱의 합으로서 산출된다. BIO 파라미터 u는, 식 (3.11)~(3.14)에 의해, sGydI 및 sGy를 사용하여 산출된다.
그리고, 복호 장치(200)는, BIO 파라미터 u를 사용하여 커런트 블록을 복호한다(S1006). 구체적으로는, 복호 장치(200)는, BIO 파라미터 u를 사용하여 예측 샘플을 생성하고, 예측 샘플을 사용하여 커런트 블록을 복호한다. 식 (3.15) 및 (3.16)은, 예측 샘플을 생성하기 위한 연산 처리의 예를 나타낸다.
Figure pct00020
Figure pct00021
제1 합이 제2 합보다 크다고 판정된 경우(S1003에서 Yes), 식 (3.15)가 사용된다. 제1 합이 제2 합보다 크지 않다고 판정된 경우(S1003에서 No), 식 (3.16)이 사용된다.
복호 장치(200)는, 상기의 처리(S1001~S1006)를 커런트 CU의 모든 서브 블록에 대해 반복해도 된다.
복호 장치(200)는, BIO를 사용함으로써, 커런트 블록에 있어서의 예측 샘플의 정밀도를 높일 수 있다. 또, 복호 장치(200)는, BIO 파라미터를 산출할 때, 수평 구배값 및 수직 구배값 중 한쪽만 사용하기 때문에, 연산량의 증가를 억제할 수 있다.
또, 상기의 식은 일례이며, BIO 파라미터를 산출하기 위한 식은, 상기의 식에 한정되지 않는다. 예를 들면, 적절히, 상기의 식에 포함되는 양음 부호가 변경되어도 되고, 상기의 식과 등가인 식이 사용되어도 된다. 구체적으로는, 상기의 식 (3.1) 및 (3.2)에 대응하는 식으로서, 이하의 식 (4.1)이 사용되어도 된다.
Figure pct00022
또, 예를 들면, 상기의 식 (3.5)에 대응하는 식으로서, 이하의 식 (4.2)가 사용되어도 된다.
Figure pct00023
또, 예를 들면, 상기의 식 (3.15)에 대응하는 식으로서, 이하의 식 (4.3)이 사용되어도 된다.
Figure pct00024
또, 식 (3.6)~(3.9)는, 실질적으로는 나눗셈을 나타내고 있기 때문에, 이하의 식 (4.4)와 같이 나타내어져도 된다.
Figure pct00025
이들 식 (4.1)~(4.4)는, 상술된 식 (3.1), (3.2), (3.5)~(3.9) 및 (3.15)와 실질적으로 같다.
마찬가지로, 구체적으로는, 상기의 식 (3.3), (3.4)에 대응하는 식으로서, 이하의 식 (4.5)가 사용되어도 된다.
Figure pct00026
또, 예를 들면, 상기의 식 (3.10)에 대응하는 식으로서, 이하의 식 (4.6)이 사용되어도 된다.
Figure pct00027
또, 예를 들면, 상기의 식 (3.16)에 대응하는 식으로서, 이하의 식 (4.7)이 사용되어도 된다.
Figure pct00028
또, 식 (3.11)~(3.14)는, 실질적으로는 나눗셈을 나타내고 있기 때문에, 이하의 식 (4.8)과 같이 나타내어져도 된다.
Figure pct00029
이들 식 (4.5)~(4.8)은, 상술된 식 (3.3), (3.4), (3.10)~(3.14) 및 (3.16)과 실질적으로 같다.
또, 상기 플로에서는, 제1 합과 제2 합의 비교에 의거하여, 수평 구배값 또는 수직 구배값이 사용되고 있는데, 복호 처리의 플로는, 상기의 플로에 한정되지 않는다. 다른 부호화 파라미터 등에 의해, 수평 구배값을 사용할지, 수직 구배값을 사용할지가 정해져도 된다. 그리고, 제1 합과 제2 합이 비교되는 일 없이, 수평 구배값을 사용하여 BIO 파라미터가 도출되어도 되고, 수직 구배값을 사용하여 BIO 파라미터가 도출되어도 된다. 또, 제1 합 및 제2 합 중 한쪽만 산출되어도 된다.
제1 합과 제2 합이 비교되지 않아도, 상술된 식에 의해, 복호 장치(200)는, 화소 위치마다 행해지는 연산에 있어서 연산량이 큰 실질적인 곱셈을 삭감할 수 있고, 예측 화상을 생성하기 위한 복수의 파라미터를 저 연산량으로 도출할 수 있다. 구체적으로는, 식 (3.2), (3.4), (3.5), (3.10), (4.1), (4.2), (4.5) 및 (4.6) 등에 있어서, 양음 부호가 변경되어 있는데, 실질적인 곱셈이 사용되고 있지 않다. 따라서, BIO 처리에 있어서의 실질적인 곱셈의 횟수가 큰폭으로 삭감될 수 있다.
즉, 복호 장치(200)는, 저 연산량으로 sGx, sGxdI, sGy 및 sGydI를 산출할 수 있다. 따라서, 복호 장치(200)는, 복호에 있어서의 처리량을 삭감할 수 있다.
상기에서는, 복호 처리가 나타나 있는데, 상기와 같은 처리가, 부호화 처리에도 적용될 수 있다. 즉, 상기의 설명에 있어서의 복호는, 부호화로 치환되어도 된다.
또한, 여기서 설명한 연산식은 일례이며, 동일한 처리를 의미하는 연산식이면, 연산식이, 부분적으로, 변경되거나, 삭제되거나, 추가되어도 된다. 예를 들면, 제1 합, 제2 합 및 BIO 파라미터의 복수의 식 중 1개 이상의 식은, 다른 구체예의 식으로 치환되어도 되고, 다른 구체예의 식과도 상이한 다른 식으로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
[BIO의 제2 구체예]
다음에, BIO에 의거한 복호 처리의 제2 구체예를 설명한다. 예를 들면, 제1 구체예와 마찬가지로, 복호 장치(200)는, 움직임 보상이 행해진 2개의 참조 블록으로부터 BIO 파라미터를 산출하고, 산출된 BIO 파라미터를 사용하여 커런트 블록을 복호한다.
본 구체예에서는, 이하의 식 (5.1)~(5.8)에 의해, 커런트 블록을 복호하기 위한 예측 샘플을 생성한다.
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
본 구체예에 있어서의 식 (5.1)의 S1은, 제1 구체예에 있어서의 식 (3.2)의 sGx에 대응한다. 또, 본 구체예에 있어서의 식 (5.2)의 S2는, 제1 구체예에 있어서의 식 (3.4)의 sGy에 대응한다. 또, 본 구체예에 있어서의 식 (5.3)의 S3은, 제1 구체예에 있어서의 식 (3.5)의 sGxdI에 대응한다. 또, 본 구체예에 있어서의 식 (5.4)의 S4는, 제1 구체예에 있어서의 식 (3.10)의 sGydI에 대응한다.
그리고, 본 구체예에 있어서의 식 (5.5)~(5.7)의 vx 및 vy는, 각각, BIO 파라미터에 대응하고, 제1 구체예에 있어서의 식 (3.9) 및 (3.14)의 u에 대응한다.
제1 구체예에서는, sGx, sGy, sGxdI 및 sGydI의 산출에 있어서, 양음 부호의 변경이 행해지고, 실질적인 곱셈이 행해지지 않는다. 한편, 본 구체예에서는, S1, S2, S3 및 S4의 산출에, 실질적인 곱셈이 행해진다. 이로 인해, 연산량이 증가하지만, 보다 높은 정밀도로 예측 샘플이 생성된다. 반대로, 제1 구체예에서는, 연산량이 삭감된다.
또한, 여기서 설명한 연산식은 일례이며, 동일한 처리를 의미하는 연산식이면, 연산식이, 부분적으로, 변경되거나, 삭제되거나, 추가되어도 된다. 예를 들면, 제1 합, 제2 합 및 BIO 파라미터의 복수의 식 중 1개 이상의 식은, 다른 구체예의 식으로 치환되어도 되고, 다른 구체예의 식과도 상이한 다른 식으로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1,0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
[BIO의 제3 구체예]
다음에, 도 52를 사용하여, BIO에 의거한 복호 처리의 제3 구체예를 설명한다. 예를 들면, 제1 구체예와 마찬가지로, 복호 장치(200)는, 움직임 보상이 행해진 2개의 참조 블록으로부터 적어도 1개의 BIO 파라미터를 산출하고, 산출된 적어도 1개의 BIO 파라미터를 사용하여 커런트 블록을 복호한다.
도 52는, BIO에 의거한 복호 처리의 제3 구체예를 나타내는 플로차트이다.
우선, 복호 장치(200)는, 커런트 블록에 대해, 제1 참조 블록의 수평 구배값 및 제2 참조 블록의 수평 구배값을 사용하여 제1 합을 산출한다(S2001). 본 구체예에 있어서의 제1 합의 산출 처리(S2001)는, 제1 구체예에 있어서의 제1 합의 산출 처리(S1001)와 동일해도 된다. 구체적으로는, 복호 장치(200)는, 제1 구체예에 있어서의 식 (3.1) 및 (3.2)와 같은 이하의 식 (6.1) 및 (6.2)에 의해, sGx를 제1 합으로서 산출한다.
Figure pct00038
Figure pct00039
또, 복호 장치(200)는, 커런트 블록에 대해, 제1 참조 블록의 수직 구배값 및 제2 참조 블록의 수직 구배값을 사용하여 제2 합을 산출한다(S2002). 본 구체예에 있어서의 제2 합의 산출 처리(S2002)는, 제1 구체예에 있어서의 제2 합의 산출 처리(S1002)와 동일해도 된다. 구체적으로는, 복호 장치(200)는, 제1 구체예에 있어서의 식 (3.3) 및 (3.4)와 같은 이하의 식 (6.3) 및 (6.4)에 의해, sGy를 제2 합으로서 산출한다.
Figure pct00040
Figure pct00041
다음에, 복호 장치(200)는, 제1 합과 제2 합이 둘 다 제1 값보다 큰 것, 및, 제1 합과 제2 합이 둘 다 제2 값보다 작은 것 중, 적어도 한쪽이 성립하는지 여부를 판정한다(S2003). 제1 값은, 제2 값보다 커도 되고, 제2 값보다 작아도 되고, 제2 값과 같아도 된다. 제1 값 및 제2 값은, 각각, 제1 역치 및 제2 역치라고도 표현될 수 있다.
예를 들면, 제1 값=100, 및, 제2 값=100인 경우에 있어서, 제1 합 및 제2 합에 의거한 판정 결과는, 이하와 같다.
제1 합=300, 제2 합=50: 판정 결과=거짓
제1 합=50, 제2 합=50: 판정 결과=참
제1 합=300, 제2 합=300: 판정 결과=참
제1 합=50, 제2 합=300: 판정 결과=거짓
판정 결과가 참인 경우(S2003에서 Yes), 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값 및 수직 구배값 양쪽을 사용하여, 2개의 BIO 파라미터를 결정한다(S2004). 식 (6.5)~(6.8)은, 이 경우에 있어서의 2개의 BIO 파라미터를 결정하기 위한 연산 처리의 예를 나타낸다. 이들 식에서는, u 및 v로 표시되는 2개의 BIO 파라미터가, 수평 구배값 및 수직 구배값을 사용하여 산출된다.
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
식 (6.5) 및 (6.6)은, 각각, 제1 구체예에 있어서의 식 (3.5) 및 (3.10)과 같다. BIO 파라미터 u는, 식 (6.7)에 의해, sGxdI 및 sGx를 사용하여 산출된다. BIO 파라미터 v는, 식 (6.8)에 의해, sGydI 및 sGy를 사용하여 산출된다. BIO 파라미터 u 및 v는, 각각, 식 (6.7) 및 식 (6.8) 대신에, 이하의 식 (6.9) 및 (6.10)을 사용하여 산출되어도 된다.
Figure pct00046
Figure pct00047
판정 결과가 거짓인 경우(S2003에서 No), 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값 또는 수직 구배값을 사용하지 않고, 1개의 BIO 파라미터를 결정한다(S2005). 이 경우에 있어서의 1개의 BIO 파라미터를 결정하기 위한 연산 처리의 예는, 이하와 같다.
예를 들면, 복호 장치(200)는, 제1 합이 제2 합보다 큰지 여부를 판정한다. 제1 합이 제2 합보다 큰 경우, 복호 장치(200)는, 식 (6.5) 및 (6.7)(또는(6.9))에 의해, 「u」만을 BIO 파라미터로서 산출한다. 즉, 이 경우, 복호 장치(200)는, 커런트 블록에 대해, 수직 구배값을 사용하지 않고, BIO 파라미터를 결정한다.
한편, 제1 합이 제2 합보다 크지 않은 경우, 복호 장치(200)는, 식 (6.6) 및 (6.8)(또는(6.10))에 의해, 「v」만을 BIO 파라미터로서 산출한다. 즉, 이 경우, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값을 사용하지 않고, BIO 파라미터를 결정한다.
혹은, 예를 들면, 복호 장치(200)는, 제1 합이 제1 값보다 크며, 또한, 제2 합이 제2 값보다 작은지 여부를 판정해도 된다.
그리고, 제1 합이 제1 값보다 크며, 또한, 제2 합이 제2 값보다 작은 경우, 복호 장치(200)는, 커런트 블록에 대해, 수직 구배값을 사용하지 않고, 「u」만을 BIO 파라미터로서 결정해도 된다. 제1 합이 제1 값보다 크지 않거나, 또는, 제2 합이 제2 값보다 작지 않은 경우, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값을 사용하지 않고, 「v」만을 BIO 파라미터로서 결정해도 된다.
마지막으로, 복호 장치(200)는, 적어도 1개의 BIO 파라미터를 사용하여 커런트 블록을 복호한다(S2006). 구체적으로는, 복호 장치(200)는, 2개의 BIO 파라미터 u 및 v 중 적어도 1개를 사용하여 예측 샘플을 생성하고, 예측 샘플을 사용하여 커런트 블록을 복호한다. 식 (6.11)~(6.13)은, 예측 샘플을 생성하기 위한 연산 처리의 복수의 예를 나타낸다.
Figure pct00048
Figure pct00049
Figure pct00050
제1 합, 제2 합, 제1 값 및 제2 값에 의거한 판정 처리(S2003)의 결과가 참인 경우, 식 (6.11)이 사용된다. 판정 처리(S2003)의 결과가 거짓인 경우에 있어서, 「u」만이 산출된 경우, 식 (6.12)가 사용된다. 판정 처리(S2003)의 결과가 거짓인 경우에 있어서, 「v」만이 산출된 경우, 식 (6.13)이 사용된다.
복호 장치(200)는, 상기의 처리(S2001~S2006)를 커런트 CU의 모든 서브 블록에 대해 반복해도 된다.
또, 상술된 판정 처리(S2003)와는 상이한 판정 처리가 사용되어도 된다. 예를 들면, 복호 장치(200)는, 제1 합과 제2 합이 둘 다 제1 값보다 큰지 여부를 판정해도 된다.
그리고, 제1 합과 제2 합이 둘 다 제1 값보다 큰 경우, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값 및 수직 구배값 양쪽을 사용하여, 2개의 BIO 파라미터를 결정해도 된다. 제1 합과 제2 합 중 적어도 한쪽이 제1 값보다 크지 않은 경우, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값 또는 수직 구배값을 사용하지 않고, 1개의 BIO 파라미터를 결정해도 된다.
혹은, 예를 들면, 복호 장치(200)는, 제1 합이 제1 값보다 크며, 또한, 제2 합이 제2 값보다 큰지 여부를 판정해도 된다.
그리고, 제1 합이 제1 값보다 크며, 또한, 제2 합이 제2 값보다 큰 경우, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값 및 수직 구배값 양쪽을 사용하여, 2개의 BIO 파라미터를 결정해도 된다. 제1 합이 제1 값보다 크지 않거나, 또는, 제2 합이 제2 값보다 크지 않은 경우, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값 또는 수직 구배값을 사용하지 않고, 1개의 BIO 파라미터를 결정해도 된다.
혹은, 예를 들면, 복호 장치(200)는, 제1 합이 제1 값보다 크고, 제2 합이 제2 값보다 크다는 조건과, 제1 합이 제3 값보다 작고, 제2 합이 제4 값보다 작다는 조건의 2개의 조건 중 적어도 한쪽이 성립하는지를 판정해도 된다.
그리고, 2개의 조건 중 적어도 한쪽이 성립하는 경우, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값 및 수직 구배값 양쪽을 사용하여, 2개의 BIO 파라미터를 결정해도 된다. 2개의 조건 모두 성립하지 않는 경우, 복호 장치(200)는, 커런트 블록에 대해, 수평 구배값 또는 수직 구배값을 사용하지 않고, 1개의 BIO 파라미터를 결정해도 된다.
복호 장치(200)는, BIO를 사용함으로써, 커런트 블록에 있어서의 예측 샘플의 정밀도를 높일 수 있다. 또, 복호 장치(200)는, 조건에 의거하여, 수평 구배값 및 수직 구배값 중 한쪽만 사용하는 경우가 있다. 이로 인해, 복호 장치(200)는, 연산량의 증가를 억제할 수 있다.
또, 상기의 식은 일례이며, BIO 파라미터를 산출하기 위한 식은, 상기의 식에 한정되지 않는다. 예를 들면, 적절히, 상기의 식에 포함되는 양음 부호가 변경되어도 되고, 상기의 식과 등가인 식이 사용되어도 된다. 구체적으로는, 상기의 식 (6.1) 및 (6.2)에 대응하는 식으로서, 이하의 식 (7.1)이 사용되어도 된다.
Figure pct00051
또, 예를 들면, 상기의 식 (6.5)에 대응하는 식으로서, 이하의 식 (7.2)가 사용되어도 된다.
Figure pct00052
또, 예를 들면, 상기의 식 (6.12)에 대응하는 식으로서, 이하의 식 (7.3)이 사용되어도 된다.
Figure pct00053
또, 식 (6.7) 및 (6.9)는, 실질적으로는 나눗셈을 나타내고 있기 때문에, 이하의 식 (7.4)와 같이 나타내어져도 된다.
Figure pct00054
이들 식 (7.1)~(7.4)는, 상술된 식 (6.1), (6.2), (6.5), (6.7), (6.9) 및 (6.12)와 실질적으로 같다.
마찬가지로, 구체적으로는, 상기의 식 (6.3) 및 (6.4)에 대응하는 식으로서, 이하의 식 (7.5)가 사용되어도 된다.
Figure pct00055
또, 예를 들면, 상기의 식 (6.6)에 대응하는 식으로서, 이하의 식 (7.6)이 사용되어도 된다.
Figure pct00056
또, 예를 들면, 상기의 식 (6.13)에 대응하는 식으로서, 이하의 식 (7.7)이 사용되어도 된다.
Figure pct00057
또, 식 (6.8) 및 (6.10)은, 실질적으로는 나눗셈을 나타내고 있기 때문에, 이하의 식 (7.8)과 같이 나타내어져도 된다.
Figure pct00058
이들 식 (7.5)~(7.8)은, 상술된 식 (6.3), (6.4), (6.6), (6.8), (6.10) 및 (6.13)과 실질적으로 같다. 또, 예를 들면, 상기의 식 (6.11)에 대응하는 식으로서, 이하의 식 (7.9)가 사용되어도 된다. 이하의 식 (7.9)는, 상술된 식 (6.11)과 실질적으로 같다.
Figure pct00059
또, 상기의 플로에서는, 제1 합 및 제2 합에 의거하여, 수평 구배값 및 수직 구배값 중 적어도 한쪽이 사용되고 있는데, 복호 처리의 플로는, 상기의 플로에 한정되지 않는다. 다른 부호화 파라미터 등에 의해, 수평 구배값을 사용할지, 수직 구배값을 사용할지, 이들 양쪽을 사용할지가 정해져도 된다.
그리고, 제1 합 및 제2 합에 관계없이, 적어도 1개의 BIO 파라미터가, 수평 구배값을 사용하여 도출되어도 되고, 수직 구배값을 사용하여 도출되어도 되고, 수평 구배값 및 수직 구배값 양쪽을 사용하여 도출되어도 된다.
제1 합 및 제2 합에 관계없이, 상술된 식에 의해, 복호 장치(200)는, 화소 위치마다 행해지는 연산에 있어서 연산량이 큰 실질적인 곱셈을 삭감할 수 있고, 예측 화상을 생성하기 위한 복수의 파라미터를 저 연산량으로 도출할 수 있다. 구체적으로는, 식 (6.2), (6.4), (6.5), (6.6), (7.1), (7.2), (7.5) 및 (7.6) 등에 있어서, 양음 부호가 변경되어 있는데, 실질적인 곱셈이 사용되고 있지 않다. 따라서, BIO 처리에 있어서의 실질적인 곱셈의 횟수가 큰폭으로 삭감될 수 있다.
즉, 복호 장치(200)는, 저 연산량으로 sGx, sGxdI, sGy 및 sGydI를 산출할 수 있다. 따라서, 복호 장치(200)는, 복호에 있어서의 처리량을 삭감할 수 있다. 특히, 제1 합 및 제2 합에 관계없이, 복호 장치(200)는, 수평 구배값 및 수직 구배값 양쪽을 사용하여 적어도 1개의 BIO 파라미터를 도출해도 된다. 이로 인해, 복호 장치(200)는, 복호에 있어서의 처리량을 삭감하면서, 수평 구배값 및 수직 구배값 양쪽을 사용하여 적절히 예측 화상을 생성할 수 있다.
상기에서는, 복호 처리가 나타나 있는데, 상기와 같은 처리가, 부호화 처리에도 적용될 수 있다. 즉, 상기의 설명에 있어서의 복호는, 부호화로 치환되어도 된다.
또한, BIO 파라미터를 산출하기 위한 식은, 수평 구배값 또는 수직 구배값을 사용하여 BIO 파라미터가 산출되는 식이면, 다른 식으로 치환되어도 된다.
예를 들면, 제3 구체예에 있어서, BIO 파라미터 u를 산출하기 위한 식은, 수직 구배값에 의거하지 않고 수평 구배값에 의거하여 BIO 파라미터 u가 산출되는 식이면, 식 (6.7), (6.9) 및 (7.4) 등으로 한정되지 않는다. 또, BIO 파라미터 v를 산출하기 위한 식은, 수평 구배값에 의거하지 않고 수직 구배값에 의거하여 BIO 파라미터 v가 산출되는 식이면, 식 (6.8), (6.10) 및 (7.8) 등으로 한정되지 않는다.
또, 제1 구체예 및 제3 구체예에 있어서, 제1 합은, 수평 구배값에 대응하고, 제2 합은, 수직 구배값에 대응한다. 그러나, 이 순서는, 바뀌어도 된다. 즉, 제1 합이, 수직 구배값에 대응하고, 제2 합이, 수평 구배값에 대응해도 된다.
또한, 여기서 설명한 연산식은 일례이며, 동일한 처리를 의미하는 연산식이면, 연산식이, 부분적으로, 변경되거나, 삭제되거나, 추가되어도 된다. 예를 들면, 제1 합, 제2 합 및 BIO 파라미터의 복수의 식 중 1개 이상의 식은, 다른 구체예의 식으로 치환되어도 되고, 다른 구체예의 식과도 상이한 다른 식으로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
[BIO의 제4 구체예]
제1 구체예, 제2 구체예 및 제3 구체예에 있어서의 BIO 파라미터의 산출 처리 및 예측 화상의 생성 처리는 일례이며, 그 외의 산출 처리 및 생성 처리가 적용되어도 된다. 예를 들면, 도 53의 플로차트에 나타나는 처리가 적용되어도 된다.
도 53은, BIO에 의거한 복호 처리의 제4 구체예를 나타내는 플로차트이다. 상술된 복수의 구체적인 예에 있어서, 복호 장치(200)는, 도 49 및 도 52와 같이, 제1 합의 크기와 제2 합의 크기에 의거하여, 예측 샘플의 도출 방법을 전환한다. 한편, 본 구체예에 있어서, 복호 장치(200)는, 항상 수직 방향 및 수평 방향 각각의 옵티컬 플로 성분을 구하여 예측 샘플을 도출한다. 이로 인해, 예측 정밀도가 보다 높아질 가능성이 있다.
구체적으로는, 도 53의 예에 있어서, 도 49의 예 및 도 52의 예와 마찬가지로, 복호 장치(200)는, 커런트 블록에 대해, 제1 참조 블록의 수평 구배값 및 제2 참조 블록의 수평 구배값을 사용하여 제1 합을 산출한다(S2001). 또, 복호 장치(200)는, 커런트 블록에 대해, 제1 참조 블록의 수직 구배값 및 제2 참조 블록의 수직 구배값을 사용하여 제2 합을 산출한다(S2002).
그리고, 도 53의 예에 있어서, 복호 장치(200)는, 제1 합의 크기 및 제2 합의 크기에 상관없이, 커런트 블록에 대해, 수평 구배값 및 수직 구배값 양쪽을 사용하여, BIO 파라미터를 결정한다(S2004). 커런트 블록에 대해, 수평 구배값 및 수직 구배값 양쪽을 사용하여, BIO 파라미터를 결정하는 동작은, 제3 구체예와 같아도 된다. 예를 들면, 복호 장치(200)는, BIO 파라미터를 결정하기 위한 연산식으로서, 제3 구체예에 기재된 식 (6.1)~(6.10) 등을 사용해도 된다.
그리고, 복호 장치(200)는, BIO 파라미터를 사용하여 커런트 블록을 복호한다(S2006). 예를 들면, 복호 장치(200)는, 2개의 BIO 파라미터 u 및 v을 사용하여 예측 샘플을 생성한다. 그 때, 복호 장치(200)는, 예측 샘플을 식 (6.11) 등에 의해 도출해도 된다. 복호 장치(200)는, 제1 구체예에 기재된 식, 또는, 그 외의 식을 사용해도 된다. 그리고, 복호 장치(200)는, 예측 샘플을 사용하여 커런트 블록을 복호한다.
또, 식 (6.2), (6.4), (6.5) 및 (6.6) 등에 있어서 나타나는 sign(x)는, 상술한 2치 식 (a)에 의해 정의되어도 되고, 다음의 식 (b)에 의해 정의되어도 된다.
Figure pct00060
식 (a)의 sign 함수는, sign 함수에 주어진 인수가 양인지 음인지를 나타내는 값을 반환한다. 식 (b)의 sign 함수는, sign 함수에 주어진 인수가 양인지 음인지 제로인지를 나타내는 값을 반환한다.
본래의 옵티컬 플로의 도출식에 있어서, 식 (6.2), (6.4), (6.5) 및 (6.6) 중의 sign(Gx[i,j]) 및 sign(Gy[i,j])는, 각각, Gx[i,j] 및 Gy[i,j]이다. 따라서, 예를 들면, Gx[i,j]=0인 경우, Gx[i,j]×(I0 i,j-I1 i,j)=0이 중간값으로서 산출되고, Gy[i,j]=0인 경우, Gy[i,j]×(I0 i,j-I1 i,j)=0이 중간값으로서 산출된다.
그러나, 간략화된 옵티컬 플로의 도출식에 있어서, sign(0)=1인 경우, 적절한 중간값이 얻어지지 않는다. 예를 들면, 식 (6.5)에 있어서, Gx[i,j]=0인 경우, sign(Gx[i,j])×(I0 i,j-I1 i,j)=(I0 i,j-I1 i,j)가 중간값으로서 산출된다. 또, 식 (6.6)에 있어서, Gy[i,j]=0인 경우, sign(Gy[i,j])×(I0 i,j-I1 i,j)=(I0 i,j-I1 i,j)가 중간값으로서 산출된다. 즉, 중간값이 0이 되지 않고, 0과는 상이한 값이 남는다.
상기의 식 (b)의 sign의 정의에서는, Gx[i,j]=0인 경우, sign(Gx[i,j])×(I0 i,j-I1 i,j)=0이 중간값으로서 산출되고, Gy[i,j]=0인 경우, sign(Gy[i,j])×(I0 i,j-I1 i,j)=0이 중간값으로서 산출된다. 따라서, 이들의 경우, 본래의 옵티컬 플로의 도출식과 같은 중간값이 산출된다.
따라서, 상기의 식 (b)에 의해 정의되는 sign이, 상기의 식 (a)에 의해 정의되는 sign보다, 본래의 옵티컬 플로의 식과 유사한 값을 갖는다. 따라서, 예측 정밀도가 보다 높아질 가능성이 있다.
또한, 상기의 변경이, 본 개시 전체에 있어서, 조합되어도 된다. 예를 들면, 제1 구체예의 sign(x)의 정의가, 상기의 식 (b)로 치환되어도 되고, 제3 구체예의 sign(x)의 정의가, 상기의 식 (b)로 치환되어도 된다.
또, 상기에서는, 복호 처리가 나타나 있는데, 상기와 같은 처리가, 부호화 처리에도 적용될 수 있다. 즉, 상기의 설명에 있어서의 복호는, 부호화로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
또, 식 (b)는, 인수가 양인지 음인지 제로인지를 나타내는 값을 반환하는 sign 함수의 일례이다. 인수가 양인지 음인지 제로인지를 나타내는 값을 반환하는 sign 함수는, 인수가 양인지 음인지 제로인지에 따라 3개의 값을 취할 수 있는 다른 식으로 표현되어도 된다.
[BIO의 제5 구체예]
다음에, BIO에 의거한 복호 처리의 제5 구체예를 설명한다. 제5 구체예에서는, 제4 구체예와 마찬가지로, 항상 수직 방향 및 수평 방향 각각의 옵티컬 플로 성분을 구하여 예측 샘플을 도출한다. 이하의 연산식은, 제5 구체예에 있어서의 연산식이다.
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
Figure pct00065
Figure pct00066
Figure pct00067
Figure pct00068
Figure pct00069
Figure pct00070
상기의 식 (8.1)~(8.6), (8.8) 및 (8.10)은, 제3 구체예에 있어서의 식 (6.1)~(6.6), (6.9) 및 (6.11)과 같다. 본 구체예에서는, 식 (8.7)이 추가되고, 식 (6.10)이 식 (8.9)로 치환되어 있다. 즉, y방향의 BIO 파라미터 “v”은, x방향의 BIO 파라미터 “u”및, x방향의 구배와 y방향의 구배의 상관 파라미터 “sGxGy”에 의존한 연산 처리로 도출된다. 이로 인해, 보다 정밀도가 높은 BIO 파라미터를 도출하는 것이 가능해지고, 부호화 효율을 향상시킬 수 있을 가능성이 높아진다. 또한, sGxGy는, 제3 합으로도 표현될 수 있다.
또, sign(x)로서, 제4 구체예에 기재된 식 (b)가 사용되어도 된다. 식 (b)에서 정의되는 바와 같이, 3치에 대응하는 sign(x)에 의해, 부호화 효율을 더 향상시킬 수 있을 가능성이 있다. 또, sign(x)로서, 제1 구체예에 기재된 식 (a)가 사용되어도 된다. 이로 인해, sign(x)가 3치에 대응하는 경우에 비해 식이 간이화되기 때문에, 처리 부하를 줄이면서, 부호화 효율을 향상시킬 수 있을 가능성이 있다.
또한, 여기서 설명한 연산식은 일례이며, 동일한 처리를 의미하는 연산식이면, 연산식이, 부분적으로, 변경되거나, 삭제되거나, 추가되어도 된다. 예를 들면, 제1 합, 제2 합, 제3 합 및 BIO 파라미터의 복수의 식 중 1개 이상의 식은, 다른 구체예의 식으로 치환되어도 되고, 다른 구체예의 식과도 상이한 다른 식으로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
또, 본 연산식은, 제4 구체예에 있어서의 도 53의 플로차트에 대해서 뿐만 아니라, 제1 구체예에 있어서의 도 49의 플로차트, 제3 구체예에 있어서의 도 52의 플로차트, 또는, 그 외의 플로차트에 적용되어도 된다.
또, 상기에서는, 복호 처리가 나타나 있는데, 상기와 같은 처리가, 부호화 처리에도 적용될 수 있다. 즉, 상기의 설명에 있어서의 복호는, 부호화로 치환되어도 된다.
[BIO의 제6 구체예]
다음에, BIO에 의거한 복호 처리의 제6 구체예를 설명한다. 제6 구체예에서는, 제4 구체예 등과 마찬가지로, 항상 수직 방향 및 수평 방향 각각의 옵티컬 플로 성분을 구하여 예측 샘플을 도출한다. 이하의 연산식은, 제6 구체예에 있어서의 연산식이다.
Figure pct00071
Figure pct00072
Figure pct00073
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
Figure pct00078
Figure pct00079
상기의 식 (9.1), (9.3) 및 (9.7)~(9.9)는, 제3 구체예에 있어서의 식 (6.1), (6.3) 및 (6.9)~(6.11)과 같다. 본 구체예에서는, 식 (6.2) 및 (6.4)~(6.6)이, 각각, 식 (9.2) 및 (9.4)~(9.6)으로 치환되어 있다.
예를 들면, 식 (6.2) 및 (6.4)~(6.6)에서는, Gx[i,j] 및 Gy[i,j] 대신에, sign(Gx[i,j]) 및 sign(Gy[i,j])가 사용됨으로써, 실질적인 곱셈이 제거되어 있다. 한편, 식 (9.2) 및 (9.4)~(9.6)에서는, sign(Gx[i,j]) 및 sign(Gy[i,j])가 사용되지 않고, Gx[i,j] 및 Gy[i,j]의 값이 그대로 사용된다. 즉, 실질적인 곱셈이 사용되고 있다.
이로 인해, 연산 처리량은 증가한다. 그러나, 보다 정밀도가 높은 BIO 파라미터를 도출하는 것이 가능해져, 부호화 효율을 향상시킬 수 있을 가능성이 높아진다.
또한, 여기서 설명한 연산식은 일례이며, 동일한 처리를 의미하는 연산식이면, 연산식이, 부분적으로, 변경되거나, 삭제되거나, 추가되어도 된다. 예를 들면, 제1 합, 제2 합, 제3 합 및 BIO 파라미터의 복수의 식 중 1개 이상의 식은, 다른 구체예의 식으로 치환되어도 되고, 다른 구체예의 식과도 상이한 다른 식으로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
또, 본 구체예에 대응하는 연산식은, 제4 구체예에 있어서의 도 53의 플로차트에 대해서 뿐만 아니라, 제1 구체예에 있어서의 도 49의 플로차트, 제3 구체예에 있어서의 도 52의 플로차트, 또는, 그 외의 플로차트에 적용되어도 된다.
또, 상기에서는, 복호 처리가 나타나 있는데, 상기와 같은 처리가, 부호화 처리에도 적용될 수 있다. 즉, 상기의 설명에 있어서의 복호는, 부호화로 치환되어도 된다.
[BIO의 제7 구체예]
다음에, BIO에 의거한 복호 처리의 제7 구체예를 설명한다. 제7 구체예에서는, 제4 구체예 등과 마찬가지로, 항상 수직 방향 및 수평 방향 각각의 옵티컬 플로 성분을 구하여 예측 샘플을 도출한다. 이하의 연산식은, 제7 구체예에 있어서의 연산식이다.
Figure pct00080
Figure pct00081
Figure pct00082
Figure pct00083
Figure pct00084
Figure pct00085
Figure pct00086
Figure pct00087
Figure pct00088
Figure pct00089
상기의 식 (10.1), (10.3) 및 (10.5)~(10.10)은, 제5 구체예에 있어서의 식 (8.1), (8.3) 및 (8.5)~(8.10)과 같다. 본 구체예에서는, 식 (8.2) 및 (8.4)가 식 (10.2) 및 (10.4)로 각각 치환되어 있다. 구체적으로는, sign 함수를 사용하여 양음 부호를 변환하는 것을 대신하여, abs 함수가 사용되고 있다.
식 (10.2) 및 (10.4)와 같이 abs 함수를 사용하여 얻어지는 결과는, 식 (8.2) 및 (8.4)와 같이 sign 함수를 사용하여 양음 부호를 변환함으로써 얻어지는 결과와 같다. 즉, 본 구체예는, 제5 구체예와 실질적으로 같다.
제5 구체예에서는, Gx의 양음 부호와 Gx의 곱이 사용되고, Gy의 양음 부호와 Gy의 곱이 사용되고 있다. 본 구체예에서는, 이 곱의 부분이 절대값으로 치환되어 있다. 이로 인해, 저(低) 처리화가 실현될 수 있다.
또, 적절히, 상기의 식에 포함되는 양음 부호가 변경되어도 되고, 상기의 식과 등가인 식이 사용되어도 된다. 구체적으로는, 상기의 식 (10.1)~(10.7)에 대응하는 이하의 식 (11.1)~(11.5)가 사용되어도 된다.
Figure pct00090
Figure pct00091
Figure pct00092
Figure pct00093
Figure pct00094
또, 식 (10.8) 및 (10.9)는, 실질적으로는 나눗셈을 나타내고 있기 때문에, 이하의 식 (11.6) 및 (11.7)과 같이 나타내어져도 된다.
Figure pct00095
Figure pct00096
또한, 여기서 설명한 연산식은 일례이며, 동일한 처리를 의미하는 연산식이면, 연산식이, 부분적으로, 변경되거나, 삭제되거나, 추가되어도 된다. 예를 들면, 제1 합, 제2 합, 제3 합 및 BIO 파라미터의 복수의 식 중 1개 이상의 식은, 다른 구체예의 식으로 치환되어도 되고, 다른 구체예의 식과도 상이한 다른 식으로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
또, 본 구체예에 대응하는 연산식은, 제4 변형예에 있어서의 도 53의 플로차트에 대해서 뿐만 아니라, 제1 구체예에 있어서의 도 49의 플로차트, 제3 구체예에 있어서의 도 52의 플로차트, 또는, 그 외의 플로차트에 적용되어도 된다.
또, 상기에서는, 복호 처리가 나타나 있는데, 상기와 같은 처리가, 부호화 처리에도 적용될 수 있다. 즉, 상기의 설명에 있어서의 복호는, 부호화로 치환되어도 된다.
[BIO의 제8 구체예]
다음에, BIO에 의거한 복호 처리의 제8 구체예를 설명한다. 제8 구체예에서는, 제4 구체예 등과 마찬가지로, 항상 수직 방향 및 수평 방향 각각의 옵티컬 플로 성분을 구하여 예측 샘플을 도출한다. 이하의 연산식은, 제8 구체예에 있어서의 연산식이다.
Figure pct00097
Figure pct00098
Figure pct00099
Figure pct00100
Figure pct00101
Figure pct00102
Figure pct00103
Figure pct00104
Figure pct00105
Figure pct00106
상기의 식 (12.1), (12.3) 및 (12.8)~(12.10)은, 제5 구체예에 있어서의 식 (8.1), (8.3) 및 (8.8)~(8.10)과 같다.
한편, 식 (8.2) 및 (8.4)~(8.7)에 관하여, Gx 및 Gy의 양음 부호를 나타내는 값이 항상 1이라고 가정되어, 식 (8.2) 및 (8.4)~(8.7)이, 각각, 식 (12.2) 및 (12.4)~(12.7)로 치환되어 있다. 이는, 미소 영역 Ω에 있어서 화소값의 구배의 절대값 및 양음 부호가 모두 일정하다는 가정에 의거하고 있다.
양음 부호가 일정하다고 가정되어 있기 때문에, Gx 및 Gy의 양음 부호를 화소 단위로 산출하는 처리가 삭감될 수 있다. 또, sGx의 연산식과, sGxGy의 연산식이, 서로 같아진다. 이로 인해, 한층 더 처리 삭감이 가능해진다.
또한, 여기서 설명한 연산식은 일례이며, 동일한 처리를 의미하는 연산식이면, 연산식이, 부분적으로, 변경되거나, 삭제되거나, 추가되어도 된다. 예를 들면, 제1 합, 제2 합, 제3 합 및 BIO 파라미터의 복수의 식 중 1개 이상의 식은, 다른 구체예의 식으로 치환되어도 되고, 다른 구체예의 식과도 상이한 다른 식으로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
또, 본 연산식은, 제4 구체예에 있어서의 도 53의 플로차트에 대해서 뿐만 아니라, 제1 구체예에 있어서의 도 49의 플로차트, 제3 구체예에 있어서의 도 52의 플로차트, 또는, 그 외의 플로차트에 적용되어도 된다.
또, 상기에서는, 복호 처리가 나타나 있는데, 상기와 같은 처리가, 부호화 처리에도 적용될 수 있다. 즉, 상기의 설명에 있어서의 복호는, 부호화로 치환되어도 된다.
[BIO의 제9 구체예]
다음에, BIO에 의거한 복호 처리의 제9 구체예를 설명한다. 제9 구체예에서는, 제4 구체예 등과 마찬가지로, 항상 수직 방향 및 수평 방향 각각의 옵티컬 플로 성분을 구하여 예측 샘플을 도출한다. 이하의 연산식은, 제9 구체예에 있어서의 연산식이다.
Figure pct00107
Figure pct00108
Figure pct00109
Figure pct00110
Figure pct00111
Figure pct00112
Figure pct00113
Figure pct00114
Figure pct00115
상기의 식 (13.1)~(13.9)는, 제8 구체예에 있어서의 식 (12.1)~(12.6) 및 (12.8)~(12.10)과 같다. 제8 구체예에 있어서 sGx의 연산식과 sGxGy의 연산식이 같다는 것에 의거하여, 본 구체예에서는, 제3 합에 있어서의 상호 상관의 도출 처리가 삭제되어 있다. 그리고, v의 도출에는 sGx가 사용된다.
또한, 여기서 설명한 연산식은 일례이며, 동일한 처리를 의미하는 연산식이면, 연산식이, 부분적으로, 변경되거나, 삭제되거나, 추가되어도 된다. 예를 들면, 제1 합, 제2 합 및 BIO 파라미터의 복수의 식 중 1개 이상의 식은, 다른 구체예의 식으로 치환되어도 되어도 되고, 다른 구체예의 식과도 상이한 다른 식으로 치환되어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
또, 본 구체예에 대응하는 연산식은, 제4 구체예에 있어서의 도 53의 플로차트에 대해서 뿐만 아니라, 제1 구체예에 있어서의 도 49의 플로차트, 제3 구체예에 있어서의 도 52의 플로차트, 또는, 그 외의 플로차트에 적용되어도 된다.
또, 상기에서는, 복호 처리가 나타나 있는데, 상기와 같은 처리가, 부호화 처리에도 적용될 수 있다. 즉, 상기의 설명에 있어서의 복호는, 부호화로 치환되어도 된다.
[BIO의 제10 구체예]
본 구체예는, 다른 구체예에 적용 가능한 변형예를 나타낸다. 예를 들면, 각 구체예의 나눗셈에, 룩업 테이블이 사용되어도 된다. 예를 들면, 6비트, 즉, 64개의 엔트리를 갖는 룩업 테이블(divSigTable)이 사용되어도 된다. 이로 인해, 제5 구체예에 있어서의 식 (8.8) 및 (8.9)는, 각각, 이하의 식 (14.1) 및 (14.2)와 같이 치환될 수 있다. 다른 구체예에 있어서의 동종의 식도 똑같이 치환되어도 된다.
Figure pct00116
Figure pct00117
상기의 식 (14.1) 및 (14.2)에 있어서의 Upper6digits는, 이하를 나타낸다.
Figure pct00118
또, 구배 화상은, 복수의 화소에 대한 구배값을 구함으로써 얻어진다. 구배값은, 예를 들면, 복수의 화소에 대해 구배 필터를 적용함으로써 도출되어도 된다. 구배 필터의 탭수를 많게 함으로써, 구배값의 정밀도가 향상되고, 예측 화상의 정밀도가 높아져, 부호화 효율이 오를 가능성이 있다.
한편, 화소 위치마다 처리가 행해지기 때문에, 처리가 행해지는 화소 위치가 많은 경우, 연산량이 많아진다. 따라서, 구배 필터로서 2탭의 필터가 사용되어도 된다. 즉, 구배값은, 구배값의 산출 대상 화소의 상하 또는 좌우의 2화소의 차분값이어도 된다. 혹은, 구배값은, 구배값의 산출 대상 화소와, 구배값의 산출 대상 화소에 인접하는 화소(구체적으로는 상, 하, 좌 또는 우 등의 화소)의 차분값이어도 된다. 이로 인해, 탭수가 많은 경우에 비해, 처리량이 저하될 가능성이 있다.
또한, 구배값이 산출되는 복수의 화소는, 복수의 정수 화소여도 되고, 소수 화소를 포함하고 있어도 된다.
또, 예를 들면, 상기의 설명에 있어서, 수평 구배값 및 수직 구배를 구하는 필터의 예로서, [-1,0,1]의 필터 계수 세트를 갖는 필터가 사용되고 있는데, [1, 0,-1]의 필터 계수 세트를 갖는 필터 등이 사용되어도 된다.
[구성 및 처리의 대표예]
상기에 나타난 부호화 장치(100) 및 복호 장치(200)의 구성 및 처리의 대표예를 이하에 나타낸다. 이 대표예는, 주로 상기의 제5 구체예 및 제7 구체예 등에 대응한다.
도 54는, 부호화 장치(100)가 행하는 동작을 나타내는 플로차트이다. 예를 들면, 부호화 장치(100)는, 회로, 및, 회로에 접속된 메모리를 구비한다. 부호화 장치(100)가 구비하는 회로 및 메모리는, 도 40에 나타나는 프로세서(a1) 및 메모리(a2)에 대응하고 있어도 된다. 부호화 장치(100)의 회로는, 동작에 있어서, 이하를 행한다.
예를 들면, 부호화 장치(100)의 회로는, 각 상대적 화소 위치에 대해서, 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출한다(S3101).
여기서, 제1 범위는, 커런트 블록의 제1 참조 블록을 포함하고, 제2 범위는, 커런트 블록의 제2 참조 블록을 포함한다. 각 상대적 화소 위치는, 제1 범위 및 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 화소 위치이며, 제1 범위 및 제2 범위 각각에 있어서의 화소 위치이다.
또, 제1 범위 및 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 화소 위치는, 제1 범위 및 제2 범위 양쪽에 대해 상대적으로 똑같이 정해지는 화소 위치를 의미한다. 예를 들면, 1개의 수평 구배합 절대값을 구할 때, 제1 범위 및 제2 범위에 있어서 상대적으로 같은 화소 위치의 수평 구배값이 사용된다. 구체적으로는, 예를 들면, 제1 범위에 있어서의 가장 좌상측 위치의 화소 위치의 수평 구배값과, 제2 범위에 있어서의 가장 좌상측 위치의 화소 위치의 수평 구배값을 사용하여, 1개의 수평 구배합 절대값이 도출된다.
그리고, 부호화 장치(100)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출한다(S3102).
또, 부호화 장치(100)의 회로는, 각 상대적 화소 위치에 대해서, 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출한다(S3103).
그리고, 부호화 장치(100)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출한다(S3104).
또, 부호화 장치(100)의 회로는, 각 상대적 화소 위치에 대해서, 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출한다(S3105). 예를 들면, 이 때, 부호화 장치(100)의 회로는, 각 상대적 화소 위치에 대해서, 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값 중, 한쪽에서 다른 쪽을 제함으로써, 양음 부호가 달린 화소 차분값을 도출한다.
그리고, 부호화 장치(100)의 회로는, 각 상대적 화소 위치에 대해서, 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 화소 차분값의 양음 부호를 반전 또는 유지하여, 수평 대응 화소 차분값을 도출한다(S3106). 여기서, 각 상대적 화소 위치에 대해서, 수평 구배합은, 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합이다. 수평 대응 화소 차분값은, 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 화소 차분값이다.
그리고, 부호화 장치(100)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출한다(S3107).
또, 부호화 장치(100)의 회로는, 각 상대적 화소 위치에 대해서, 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 화소 차분값의 양음 부호를 반전 또는 유지하여, 수직 대응 화소 차분값을 도출한다(S3108). 여기서, 각 상대적 화소 위치에 대해서, 수직 구배합은, 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합이다. 수직 대응 화소 차분값은, 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 화소 차분값이다.
그리고, 부호화 장치(100)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출한다(S3109).
또, 부호화 장치(100)의 회로는, 각 상대적 화소 위치에 대해서, 수직 구배합의 양음 부호에 따라, 수평 구배합의 양음 부호를 반전 또는 유지하여, 수직 대응 수평 구배합을 도출한다(S3110). 여기서, 수직 대응 수평 구배합은, 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 수평 구배합이다.
그리고, 부호화 장치(100)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출한다(S3111).
그리고, 부호화 장치(100)의 회로는, 제1 파라미터, 제2 파라미터, 제3 파라미터, 제4 파라미터 및 제5 파라미터를 사용하여, 커런트 블록의 부호화에 사용되는 예측 화상을 생성한다(S3112).
이로 인해, 화소 위치마다 행해지는 연산에 있어서 연산량이 큰 실질적인 곱셈이 삭감될 가능성이 있어, 예측 화상을 생성하기 위한 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다. 따라서, 부호화에 있어서의 처리량이 삭감될 가능성이 있다. 또, 수평 구배값에 상관하는 파라미터와, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터를 포함하는 복수의 파라미터에 의거하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 상술된 식 (11.1)에 의해 제1 파라미터를 도출하고, 상술된 식 (11.2)에 의해 제2 파라미터를 도출해도 된다. 또, 부호화 장치(100)의 회로는, 상술된 식 (11.3)에 의해 제3 파라미터를 도출하고, 상술된 식 (11.4)에 의해 제4 파라미터를 도출해도 된다. 또, 부호화 장치(100)의 회로는, 상술된 식 (11.5)에 의해 제5 파라미터를 도출해도 된다.
여기서, Ω는, 복수의 상대적 화소 위치의 집합을 나타내고, [i,j]는, 각 상대적 화소 위치를 나타낸다. 또, 각 상대적 화소 위치에 대해서, Ix 0은, 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내고, Ix 1은, 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타낸다. 또, 각 상대적 화소 위치에 대해서, Iy 0은, 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내고, Iy 1은, 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타낸다.
또, 각 상대적 화소 위치에 대해서, I0은, 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내고, I1은, 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타낸다. 또, abs(Ix 1+Ix 0)는, Ix 1+Ix 0의 절대값을 나타내고, sign(Ix 1+Ix 0)은, Ix 1+Ix 0의 양음 부호를 나타내며, abs(Iy 1+Iy 0)은, Iy1+Iy 0의 절대값을 나타내고, sign(Iy 1+Iy 0)은, Iy 1+Iy 0의 양음 부호를 나타낸다.
이로 인해, 화소값, 수평 구배값 및 수직 구배값을 사용하여, 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 제3 파라미터를 제1 파라미터로 나눔으로써 제6 파라미터를 도출해도 된다. 또, 부호화 장치(100)의 회로는, 제4 파라미터로부터, 제5 파라미터와 제6 파라미터의 곱을 빼고, 제2 파라미터로 나눔으로써 제7 파라미터를 도출해도 된다. 그리고, 부호화 장치(100)의 회로는, 제6 파라미터 및 제7 파라미터를 사용하여, 예측 화상을 생성해도 된다.
이로 인해, 복수의 파라미터가, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터로 적절히 집약될 가능성이 있다. 수평 방향에 대응하는 파라미터에는, 수평 구배값에 상관하는 파라미터가 적절히 들여와질 가능성이 있다. 수직 방향에 대응하는 파라미터에는, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터와, 수평 방향에 대응하는 파라미터가, 적절히 들여와질 가능성이 있다. 그리고, 이 2개의 파라미터를 사용하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 상술된 식 (10.8)에 의해 제6 파라미터를 도출해도 된다. 또, 부호화 장치(100)의 회로는, 상술된 식 (10.9)에 의해 제7 파라미터를 도출해도 된다.
여기서, sGx는, 제1 파라미터를 나타내고, sGy는, 제2 파라미터를 나타내며, sGxdI는, 제3 파라미터를 나타내고, sGydI는, 제4 파라미터를 나타내며, sGxGy는, 제5 파라미터를 나타내고, u는, 제6 파라미터를 나타낸다. Bits는, 인수의 이진 로그를 정수로 절상함으로써 얻어지는 값을 반환하는 함수이다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터가, 저 연산량으로 도출될 가능성이 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 제1 화소값과 제1 수평 구배값과 제1 수직 구배값과 제2 화소값과 제2 수평 구배값과 제2 수직 구배값과 제6 파라미터와 제7 파라미터를 사용하여, 예측 화소값을 도출함으로써, 예측 화상을 생성해도 된다.
여기서, 예측 화소값은, 커런트 블록에 포함되는 처리 대상 화소 위치의 예측 화소값이다. 제1 화소값은, 제1 참조 블록에 있어서 처리 대상 화소 위치에 대응하는 제1 화소 위치의 화소값이다. 제1 수평 구배값은, 제1 화소 위치의 수평 구배값이다. 제1 수직 구배값은, 제1 화소 위치의 수직 구배값이다. 제2 화소값은, 제2 참조 블록에 있어서 처리 대상 화소 위치에 대응하는 제2 화소 위치의 화소값이다. 제2 수평 구배값은, 제2 화소 위치의 수평 구배값이다. 제2 수직 구배값은, 제2 화소 위치의 수직 구배값이다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등을 사용하여, 예측 화상이 생성되고, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터가, 예측 화상에 적절히 반영될 가능성이 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 제1 화소값과, 제2 화소값과, 제1 보정값과, 제2 보정값의 합을 2로 나눔으로써, 예측 화소값을 도출해도 된다. 여기서, 제1 보정값은, 제1 수평 구배값과 제2 수평 구배값의 차와, 제6 파라미터의 곱에 대응하고, 제2 보정값은, 제1 수직 구배값과 제2 수직 구배값의 차와, 제7 파라미터의 곱에 대응한다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등을 사용하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 상술된 식 (10.10)에 의해 예측 화소값을 도출해도 된다. 여기서, I0은, 제1 화소값을 나타내고, I1은, 제2 화소값을 나타내며, u는, 제6 파라미터를 나타내고, Ix 0은, 제1 수평 구배값을 나타내며, Ix 1은, 제2 수평 구배값을 나타내고, v는, 제7 파라미터를 나타내며, Iy 0은, 제1 수직 구배값을 나타내고, Iy 1은, 제2 수직 구배값을 나타낸다. 이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등에 관련된 식에 따라, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 제1 파라미터, 제2 파라미터, 제3 파라미터, 제4 파라미터 및 제5 파라미터를 사용하여 쌍방향 옵티컬 플로의 1개 이상의 파라미터를 도출하고, 쌍방향 옵티컬 플로의 1개 이상의 파라미터, 및, 쌍방향 옵티컬 플로를 사용하여, 예측 화상을 생성해도 된다. 이로 인해, 부호화 장치(100)는, 예측 화상을 적절히 생성할 수 있다.
쌍방향 옵티컬 플로의 1개 이상의 파라미터는, 상술된 제6 파라미터 및 제7 파라미터 중 적어도 1개여도 된다.
또한, 부호화 장치(100)의 인터 예측부(126)가, 부호화 장치(100)의 회로로서, 상술된 동작을 행해도 된다.
도 55는, 복호 장치(200)가 행하는 동작을 나타내는 플로차트이다. 예를 들면, 복호 장치(200)는, 회로, 및, 회로에 접속된 메모리를 구비한다. 복호 장치(200)가 구비하는 회로 및 메모리는, 도 46에 나타나는 프로세서(b1) 및 메모리(b2)에 대응하고 있어도 된다. 복호 장치(200)의 회로는, 동작에 있어서, 이하를 행한다.
예를 들면, 복호 장치(200)의 회로는, 각 상대적 화소 위치에 대해서, 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출한다(S3201).
여기서, 제1 범위는, 커런트 블록의 제1 참조 블록을 포함하고, 제2 범위는, 커런트 블록의 제2 참조 블록을 포함한다. 각 상대적 화소 위치는, 제1 범위 및 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 화소 위치이며, 제1 범위 및 제2 범위 각각에 있어서의 화소 위치이다.
그리고, 복호 장치(200)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출한다(S3202).
또, 복호 장치(200)의 회로는, 각 상대적 화소 위치에 대해서, 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출한다(S3203).
그리고, 복호 장치(200)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출한다(S3204).
또, 복호 장치(200)의 회로는, 각 상대적 화소 위치에 대해서, 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출한다(S3205). 예를 들면, 이 때, 복호 장치(200)의 회로는, 각 상대적 화소 위치에 대해서, 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값 중, 한쪽에서 다른 쪽을 제함으로써, 양음 부호가 달린 화소 차분값을 도출한다.
그리고, 복호 장치(200)의 회로는, 각 상대적 화소 위치에 대해서, 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 화소 차분값의 양음 부호를 반전 또는 유지하여, 수평 대응 화소 차분값을 도출한다(S3206). 여기서, 각 상대적 화소 위치에 대해서, 수평 구배합은, 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합이다. 수평 대응 화소 차분값은, 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 화소 차분값이다.
그리고, 복호 장치(200)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출한다(S3207).
또, 복호 장치(200)의 회로는, 각 상대적 화소 위치에 대해서, 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 화소 차분값의 양음 부호를 반전 또는 유지하여, 수직 대응 화소 차분값을 도출한다(S3208). 여기서, 각 상대적 화소 위치에 대해서, 수직 구배합은, 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합이다. 수직 대응 화소 차분값은, 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 화소 차분값이다.
그리고, 복호 장치(200)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출한다(S3209).
또, 복호 장치(200)의 회로는, 각 상대적 화소 위치에 대해서, 수직 구배합의 양음 부호에 따라, 수평 구배합의 양음 부호를 반전 또는 유지하여, 수직 대응 수평 구배합을 도출한다(S3210). 여기서, 수직 대응 수평 구배합은, 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 수평 구배합이다.
그리고, 복호 장치(200)의 회로는, 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출한다(S3211).
그리고, 복호 장치(200)의 회로는, 제1 파라미터, 제2 파라미터, 제3 파라미터, 제4 파라미터 및 제5 파라미터를 사용하여, 커런트 블록의 복호에 사용되는 예측 화상을 생성한다(S3212).
이로 인해, 화소 위치마다 행해지는 연산에 있어서 연산량이 큰 실질적인 곱셈이 삭감될 가능성이 있어, 예측 화상을 생성하기 위한 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다. 따라서, 복호에 있어서의 처리량이 삭감될 가능성이 있다. 또, 수평 구배값에 상관하는 파라미터와, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터를 포함하는 복수의 파라미터에 의거하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 상술된 식 (11.1)에 의해 제1 파라미터를 도출하고, 상술된 식 (11.2)에 의해 제2 파라미터를 도출해도 된다. 또, 복호 장치(200)의 회로는, 상술된 식 (11.3)에 의해 제3 파라미터를 도출하고, 상술된 식 (11.4)에 의해 제4 파라미터를 도출해도 된다. 또, 복호 장치(200)의 회로는, 상술된 식 (11.5)에 의해 제5 파라미터를 도출해도 된다.
여기서, Ω는, 복수의 상대적 화소 위치의 집합을 나타내고, [i,j]는, 각 상대적 화소 위치를 나타낸다. 또, 각 상대적 화소 위치에 대해서, Ix 0은, 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내고, Ix 1은, 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타낸다. 또, 각 상대적 화소 위치에 대해서, Iy 0은, 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내고, Iy 1은, 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타낸다.
또, 각 상대적 화소 위치에 대해서, I0은, 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내고, I1은, 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타낸다. 또, abs(Ix 1+Ix 0)은, Ix 1+Ix 0의 절대값을 나타내고, sign(Ix 1+Ix 0)은, Ix 1+Ix 0의 양음 부호를 나타내며, abs(Iy 1+Iy 0)은, Iy 1+Iy 0의 절대값을 나타내고, sign(Iy 1+Iy 0)은, Iy 1+Iy 0의 양음 부호를 나타낸다.
이로 인해, 화소값, 수평 구배값 및 수직 구배값을 사용하여, 복수의 파라미터가 저 연산량으로 도출될 가능성이 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 제3 파라미터를 제1 파라미터로 나눔으로써 제6 파라미터를 도출해도 된다. 또, 복호 장치(200)의 회로는, 제4 파라미터로부터, 제5 파라미터와 제6 파라미터의 곱을 빼고, 제2 파라미터로 나눔으로써 제7 파라미터를 도출해도 된다. 그리고, 복호 장치(200)의 회로는, 제6 파라미터 및 제7 파라미터를 사용하여, 예측 화상을 생성해도 된다.
이로 인해, 복수의 파라미터가, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터로 적절히 집약될 가능성이 있다. 수평 방향에 대응하는 파라미터에는, 수평 구배값에 상관하는 파라미터가 적절히 들여와질 가능성이 있다. 수직 방향에 대응하는 파라미터에는, 수직 구배값에 상관하는 파라미터와, 수평 구배값 및 수직 구배값 양쪽에 상관하는 파라미터와, 수평 방향에 대응하는 파라미터가, 적절히 들여와질 가능성이 있다. 그리고, 이 2개의 파라미터를 사용하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 상술된 식 (10.8)에 의해 제6 파라미터를 도출해도 된다. 또, 복호 장치(200)의 회로는, 상술된 식 (10.9)에 의해 제7 파라미터를 도출해도 된다.
여기서, sGx는, 제1 파라미터를 나타내고, sGy는, 제2 파라미터를 나타내며, sGxdI는, 제3 파라미터를 나타내고, sGydI는, 제4 파라미터를 나타내며, sGxGy는, 제5 파라미터를 나타내고, u는, 제6 파라미터를 나타낸다. Bits는, 인수의 이진 로그를 정수로 절상함으로써 얻어지는 값을 반환하는 함수이다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터가, 저 연산량으로 도출될 가능성이 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 제1 화소값과 제1 수평 구배값과 제1 수직 구배값과 제2 화소값과 제2 수평 구배값과 제2 수직 구배값과 제6 파라미터와 제7 파라미터를 사용하여, 예측 화소값을 도출함으로써, 예측 화상을 생성해도 된다.
여기서, 예측 화소값은, 커런트 블록에 포함되는 처리 대상 화소 위치의 예측 화소값이다. 제1 화소값은, 제1 참조 블록에 있어서 처리 대상 화소 위치에 대응하는 제1 화소 위치의 화소값이다. 제1 수평 구배값은, 제1 화소 위치의 수평 구배값이다. 제1 수직 구배값은, 제1 화소 위치의 수직 구배값이다. 제2 화소값은, 제2 참조 블록에 있어서 처리 대상 화소 위치에 대응하는 제2 화소 위치의 화소값이다. 제2 수평 구배값은, 제2 화소 위치의 수평 구배값이다. 제2 수직 구배값은, 제2 화소 위치의 수직 구배값이다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등을 사용하여, 예측 화상이 생성되고, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터가, 예측 화상에 적절히 반영될 가능성이 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 제1 화소값과, 제2 화소값과, 제1 보정값과, 제2 보정값의 합을 2로 나눔으로써, 예측 화소값을 도출해도 된다. 여기서, 제1 보정값은, 제1 수평 구배값과 제2 수평 구배값의 차와, 제6 파라미터의 곱에 대응하고, 제2 보정값은, 제1 수직 구배값과 제2 수직 구배값의 차와, 제7 파라미터의 곱에 대응한다.
이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등을 사용하여, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 상술된 식 (10.10)에 의해 예측 화소값을 도출해도 된다. 여기서, I0은, 제1 화소값을 나타내고, I1은, 제2 화소값을 나타내며, u는, 제6 파라미터를 나타내고, Ix 0은, 제1 수평 구배값을 나타내며, Ix 1은, 제2 수평 구배값을 나타내고, v는, 제7 파라미터를 나타내며, Iy 0은, 제1 수직 구배값을 나타내고, Iy 1은, 제2 수직 구배값을 나타낸다. 이로 인해, 수평 방향 및 수직 방향에 대응하는 2개의 파라미터 등에 관련된 식에 따라, 예측 화상이 적절히 생성될 가능성이 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 제1 파라미터, 제2 파라미터, 제3 파라미터, 제4 파라미터 및 제5 파라미터를 사용하여 쌍방향 옵티컬 플로의 1개 이상의 파라미터를 도출하고, 쌍방향 옵티컬 플로의 1개 이상의 파라미터, 및, 쌍방향 옵티컬 플로를 사용하여, 예측 화상을 생성해도 된다. 이로 인해, 복호 장치(200)는, 예측 화상을 적절히 생성할 수 있다.
쌍방향 옵티컬 플로의 1개 이상의 파라미터는, 상술된 제6 파라미터 및 제7 파라미터 중 적어도 1개여도 된다.
또한, 복호 장치(200)의 인터 예측부(218)가, 복호 장치(200)의 회로로서, 상술된 동작을 행해도 된다.
[그 외의 예]
상술된 각 예에 있어서의 부호화 장치(100) 및 복호 장치(200)는, 각각, 화상 부호화 장치 및 화상 복호 장치로서 이용되어도 되고, 동화상 부호화 장치 및 동화상 복호 장치로서 이용되어도 된다.
혹은, 부호화 장치(100) 및 복호 장치(200) 각각은, 예측 장치로서 이용되어도 된다. 즉, 부호화 장치(100) 및 복호 장치(200)는, 각각, 인터 예측부(126) 및 인터 예측부(218)에만 대응하고 있어도 된다. 그리고, 다른 구성 요소는, 다른 장치에 포함되어 있어도 된다.
또, 상술된 각 예 중 적어도 일부가, 부호화 방법으로서 이용되어도 되고, 복호 방법으로서 이용되어도 되며, 예측 방법으로서 이용되어도 되고, 그 외의 방법으로서 이용되어도 된다.
또, 각 구성 요소는, 전용 하드웨어로 구성되거나, 각 구성 요소에 적합한 소프트웨어 프로그램을 실행함으로써 실현되어도 된다. 각 구성 요소는, CPU 또는 프로세서 등의 프로그램 실행부가, 하드 디스크 또는 반도체 메모리 등의 기록 매체에 기록된 소프트웨어 프로그램을 읽어내어 실행함으로써 실현되어도 된다.
구체적으로는, 부호화 장치(100) 및 복호 장치(200) 각각은, 처리 회로(Processing Circuitry)와, 당해 처리 회로에 전기적으로 접속된, 당해 처리 회로로부터 액세스 가능한 기억 장치(Storage)를 구비하고 있어도 된다. 예를 들면, 처리 회로는 프로세서(a1 또는 b1)에 대응하고, 기억 장치는 메모리(a2 또는 b2)에 대응한다.
처리 회로는, 전용 하드웨어 및 프로그램 실행부 중 적어도 한쪽을 포함하고, 기억 장치를 사용하여 처리를 실행한다. 또, 기억 장치는, 처리 회로가 프로그램 실행부를 포함하는 경우에는, 당해 프로그램 실행부에 의해 실행되는 소프트웨어 프로그램을 기억한다.
여기서, 상술된 부호화 장치(100) 또는 복호 장치(200) 등을 실현하는 소프트웨어는, 다음과 같은 프로그램이다.
예를 들면, 이 프로그램은, 컴퓨터로 하여금, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 부호화에 사용되는 예측 화상을 생성하는 부호화 방법을 실행하게 해도 된다.
또, 예를 들면, 이 프로그램은, 컴퓨터로 하여금, 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고, 상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고, 상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고, 상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 복호에 사용되는 예측 화상을 생성하는 복호 방법을 실행하게 해도 된다.
또, 각 구성 요소는, 상술한 바와 같이, 회로여도 된다. 이들 회로는, 전체적으로 1개의 회로를 구성해도 되고, 각각 별개의 회로여도 된다. 또, 각 구성 요소는, 범용적인 프로세서로 실현되어도 되고, 전용 프로세서로 실현되어도 된다.
또, 특정 구성 요소가 실행하는 처리를 다른 구성 요소가 실행해도 된다. 또, 처리를 실행하는 순번이 변경되어도 되고, 복수의 처리가 병행되어 실행되어도 된다. 또, 부호화 복호 장치가, 부호화 장치(100) 및 복호 장치(200)를 구비하고 있어도 된다.
또, 설명에 사용된 제1 및 제2 등의 서수는, 적절히 바꿔 붙여져도 된다. 또, 구성 요소 등에 대해, 서수가 새로 부여되어도 되고, 제거되어도 된다.
이상, 부호화 장치(100) 및 복호 장치(200)의 양태에 대해서, 복수의 예에 의거하여 설명했는데, 부호화 장치(100) 및 복호 장치(200)의 양태는, 이들 예로 한정되는 것은 아니다. 본 개시의 취지를 일탈하지 않는 한, 당업자가 생각해 내는 각종 변형을 각 예에 실시한 것이나, 상이한 예에 있어서의 구성 요소를 조합하여 구축되는 형태도, 부호화 장치(100) 및 복호 장치(200)의 양태의 범위 내에 포함되어도 된다.
여기서 개시된 1 이상의 양태를 본 개시에 있어서의 다른 양태의 적어도 일부와 조합하여 실시해도 된다. 또, 여기서 개시된 1 이상의 양태의 플로차트에 기재된 일부의 처리, 장치의 일부의 구성, 신택스의 일부 등을 다른 양태와 조합하여 실시해도 된다.
[실시 및 응용]
이상의 각 실시 형태에 있어서, 기능적 또는 작용적인 블록 각각은, 통상, MPU(micro proccessing unit) 및 메모리 등에 의해 실현 가능하다. 또, 기능 블록 각각에 의한 처리는, ROM 등의 기록 매체에 기록된 소프트웨어(프로그램)를 읽어내어 실행하는 프로세서 등의 프로그램 실행부로서 실현되어도 된다. 당해 소프트웨어는, 배포되어도 된다. 당해 소프트웨어는, 반도체 메모리 등의 다양한 기록 매체에 기록되어도 된다. 또한, 각 기능 블록을 하드웨어(전용 회로)에 의해 실현하는 것도 가능하다. 하드웨어 및 소프트웨어의 다양한 조합이 채용될 수 있다.
각 실시 형태에 있어서 설명한 처리는, 단일한 장치(시스템)를 사용하여 집중 처리함으로써 실현해도 되고, 또는, 복수의 장치를 사용하여 분산 처리함으로써 실현해도 된다. 또, 상기 프로그램을 실행하는 프로세서는, 단수여도 되고, 복수여도 된다. 즉, 집중 처리를 행해도 되고, 또는 분산 처리를 행해도 된다.
본 개시의 양태는, 이상의 실시예로 한정되지 않고, 여러 가지 변경이 가능하며, 그들도 본 개시의 양태의 범위 내에 포함된다.
또한 여기서, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 또는 동화상 복호화 방법(화상 복호 방법)의 응용예, 및, 그 응용예를 실시하는 여러 가지 시스템을 설명한다. 이러한 시스템은, 화상 부호화 방법을 사용한 화상 부호화 장치, 화상 복호 방법을 사용한 화상 복호 장치, 또는, 양쪽을 구비하는 화상 부호화 복호 장치를 갖는 것을 특징으로 해도 된다. 이러한 시스템의 다른 구성에 대해서, 경우에 따라 적절히 변경할 수 있다.
[사용예]
도 56은, 컨텐츠 전송 서비스를 실현하는 적절한 컨텐츠 공급 시스템(ex100)의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 에리어를 원하는 크기로 분할하고, 각 셀 내에 각각, 도시된 예에 있어서의 고정 무선국인 기지국(ex106, ex107, ex108, ex109, ex110)이 설치되어 있다.
이 컨텐츠 공급 시스템(ex100)에서는, 인터넷(ex101)에, 인터넷 서비스 프로바이더(ex102) 또는 통신망(ex104), 및 기지국(ex106~ex110)을 통해, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 및 스마트폰(ex115) 등의 각 기기가 접속된다. 당해 컨텐츠 공급 시스템(ex100)은, 상기 중 어느 하나의 장치를 조합하여 접속하도록 해도 된다. 여러 가지 실시에 있어서, 기지국(ex106~ex110)을 통하지 않고, 각 기기가 전화망 또는 근거리 무선 등을 통해 직접적 또는 간접적으로 서로 접속되어 있어도 된다. 또, 스트리밍 서버(ex103)는, 인터넷(ex101) 등을 통해, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 및 스마트폰(ex115) 등의 각 기기와 접속되어도 된다. 또, 스트리밍 서버(ex103)는, 위성(ex116)을 통해, 비행기(ex117) 내의 핫 스팟 내의 단말 등과 접속되어도 된다.
또한, 기지국(ex106~ex110) 대신에, 무선 액세스 포인트 또는 핫 스팟 등이 사용되어도 된다. 또, 스트리밍 서버(ex103)는, 인터넷(ex101) 또는 인터넷 서비스 프로바이더(ex102)를 통하지 않고 직접 통신망(ex104)과 접속되어도 되고, 위성(ex116)을 통하지 않고 직접 비행기(ex117)와 접속되어도 된다.
카메라(ex113)는 디지털 카메라 등의 정지 화상 촬영, 및 동화상 촬영이 가능한 기기이다. 또, 스마트폰(ex115)은, 2G, 3G, 3.9G, 4G, 그리고 향후 5G로 불리는 이동 통신 시스템의 방식에 대응한 스마트폰기, 휴대 전화기, 또는 PHS(Personal Handyphone System) 등이다.
가전(ex114)은, 냉장고, 또는 가정용 연료 전지 코제너레이션 시스템에 포함되는 기기 등이다.
컨텐츠 공급 시스템(ex100)에서는, 촬영 기능을 갖는 단말이 기지국(ex106) 등을 통해 스트리밍 서버(ex103)에 접속됨으로써, 라이브 전송 등이 가능해진다. 라이브 전송에서는, 단말(컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115), 및 비행기(ex117) 내의 단말 등)은, 사용자가 당해 단말을 이용하여 촬영한 정지 화상 또는 동화상 컨텐츠에 대해 상기 각 실시 형태에서 설명한 부호화 처리를 행해도 되고, 부호화에 의해 얻어진 영상 데이터와, 영상에 대응하는 소리를 부호화한 소리 데이터와 다중화해도 되고, 얻어진 데이터를 스트리밍 서버(ex103)에 송신해도 된다. 즉, 각 단말은, 본 개시의 일 양태에 따른 화상 부호화 장치로서 기능한다.
한편, 스트리밍 서버(ex103)는 요구가 있었던 클라이언트에 대해 송신된 컨텐츠 데이터를 스트림 전송한다. 클라이언트는, 상기 부호화 처리된 데이터를 복호화하는 것이 가능한, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115), 또는 비행기(ex117) 내의 단말 등이다. 전송된 데이터를 수신한 각 기기는, 수신한 데이터를 복호화 처리하여 재생해도 된다. 즉, 각 기기는, 본 개시의 일 양태에 따른 화상 복호 장치로서 기능해도 된다.
[분산 처리]
또, 스트리밍 서버(ex103)는 복수의 서버 또는 복수의 컴퓨터로서, 데이터를 분산하여 처리하거나 기록하거나 전송하는 것이어도 된다. 예를 들면, 스트리밍 서버(ex103)는, CDN(Contents Delivery Network)에 의해 실현되고, 전 세계에 분산된 다수의 에지 서버와 에지 서버 사이를 연결하는 네트워크에 의해 컨텐츠 전송이 실현되고 있어도 된다. CDN에서는, 클라이언트에 따라 물리적으로 가까운 에지 서버가 동적으로 할당될 수 있다. 그리고, 당해 에지 서버에 컨텐츠가 캐시 및 전송됨으로써 지연을 줄일 수 있다. 또, 몇 가지 타입의 에러가 발생한 경우 또는 트래픽의 증가 등에 의해 통신 상태가 바뀌는 경우에 복수의 에지 서버에서 처리를 분산하거나, 다른 에지 서버로 전송 주체를 전환하거나, 장애가 발생한 네트워크의 부분을 우회하여 전송을 계속할 수 있으므로, 고속이면서 안정된 전송을 실현할 수 있다.
또, 전송 자체의 분산 처리에 그치지 않고, 촬영한 데이터의 부호화 처리를 각 단말에서 행해도 되고, 서버측에서 행해도 되며, 서로 분담하여 행해도 된다. 일례로서, 일반적으로 부호화 처리에서는, 처리 루프가 2번 행해진다. 첫 번째 루프에서 프레임 또는 신(scene) 단위로의 화상의 복잡함, 또는, 부호량이 검출된다. 또, 두 번째 루프에서는 화질을 유지하여 부호화 효율을 향상시키는 처리가 행해진다. 예를 들면, 단말이 첫 번째 부호화 처리를 행하고, 컨텐츠를 수취한 서버측이 두 번째 부호화 처리를 행함으로써, 각 단말에서의 처리 부하를 줄이면서도 컨텐츠의 질과 효율을 향상시킬 수 있다. 이 경우, 거의 실시간으로 수신하여 복호하는 요구가 있으면, 단말이 행한 첫 번째 부호화 완료 데이터를 다른 단말에서 수신하여 재생할 수도 있으므로, 보다 유연한 실시간 전송도 가능해진다.
다른 예로서, 카메라(ex113) 등은, 화상으로부터 특징량(특징 또는 특성량)을 추출하고, 특징량에 관한 데이터를 메타데이터로서 압축하여 서버에 송신한다. 서버는, 예를 들면 특징량으로부터 오브젝트의 중요성을 판단하여 양자화 정밀도를 전환하는 등, 화상의 의미(또는 내용의 중요성)에 따른 압축을 행한다. 특징량 데이터는 서버에서의 재차 압축 시의 움직임 벡터 예측의 정밀도 및 효율 향상에 특히 유효하다. 또, 단말에서 VLC(가변 길이 부호화) 등의 간이적인 부호화를 행하고, 서버에서 CABAC(컨텍스트 적응형 2치 산술 부호화 방식) 등 처리 부하가 큰 부호화를 행해도 된다.
또 다른 예로서, 스타디움, 쇼핑몰, 또는 공장 등에 있어서는, 복수의 단말에 의해 거의 동일한 신이 촬영된 복수의 영상 데이터가 존재하는 경우가 있다. 이 경우에는, 촬영을 행한 복수의 단말과, 필요에 따라 촬영을 하지 않은 다른 단말 및 서버를 사용하여, 예를 들면 GOP(Group of Picture) 단위, 픽처 단위, 또는 픽처를 분할한 타일 단위 등으로 부호화 처리를 각각 할당하여 분산 처리를 행한다. 이로 인해, 지연을 줄이고, 보다 실시간성을 실현할 수 있다.
복수의 영상 데이터는 거의 동일 신이기 때문에, 각 단말에서 촬영된 영상 데이터를 서로 참조할 수 있도록, 서버에서 관리 및/또는 지시를 해도 된다. 또, 각 단말로부터의 부호화 완료 데이터를, 서버가 수신하여 복수의 데이터 사이에서 참조 관계를 변경, 또는 픽처 자체를 보정 혹은 교체하여 다시 부호화해도 된다. 이로 인해, 하나 하나의 데이터의 질과 효율을 높인 스트림을 생성할 수 있다.
또, 서버는, 영상 데이터의 부호화 방식을 변경하는 트랜스 코드를 행한 다음에 영상 데이터를 전송해도 된다. 예를 들면, 서버는, MPEG계 부호화 방식을 VP계(예를 들면 VP9)로 변환해도 되고, H.264를 H.265로 변환 등 해도 된다.
이와 같이, 부호화 처리는, 단말, 또는 1개 이상의 서버에 의해 행하는 것이가능하다. 따라서, 이하에서는, 처리를 행하는 주체로서 「서버」 또는 「단말」 등의 기재를 사용하는데, 서버에서 행해지는 처리의 일부 또는 전부가 단말에서 행해져도 되고, 단말에서 행해지는 처리의 일부 또는 전부가 서버에서 행해져도 된다. 또, 이들에 관해서는, 복호 처리에 대해서도 마찬가지이다.
[3D, 멀티 앵글]
서로 거의 동기한 복수의 카메라(ex113) 및/또는 스마트폰(ex115) 등의 단말에 의해 촬영된 상이한 신, 또는, 동일 신을 상이한 앵글로부터 촬영한 화상 혹은 영상을 통합하여 이용하는 것이 증가하고 있다. 각 단말에서 촬영한 영상은, 별도로 취득한 단말간의 상대적인 위치 관계, 또는, 영상에 포함되는 특징점이 일치하는 영역 등에 의거하여 통합될 수 있다.
서버는, 2차원의 동화상을 부호화할 뿐만 아니라, 동화상의 신 해석 등에 의거하여 자동적으로, 또는, 사용자가 지정한 시각에 있어서, 정지 화상을 부호화하여, 수신 단말에 송신해도 된다. 서버는, 또한, 촬영 단말간의 상대적인 위치 관계를 취득할 수 있는 경우에는, 2차원의 동화상뿐만 아니라, 동일 신이 상이한 앵글로부터 촬영된 영상에 의거하여, 당해 신의 3차원 형상을 생성할 수 있다. 서버는, 포인트 클라우드 등에 의해 생성된 3차원의 데이터를 별도로 부호화해도 되고, 3차원 데이터를 사용하여 인물 또는 오브젝트를 인식 혹은 추적한 결과에 의거하여, 수신 단말에 송신하는 영상을, 복수의 단말에서 촬영한 영상으로부터 선택, 또는, 재구성하여 생성해도 된다.
이와 같이 하여, 사용자는, 각 촬영 단말에 대응하는 각 영상을 임의로 선택하여 신을 즐길 수도 있고, 복수 화상 또는 영상을 사용하여 재구성된 3차원 데이터로부터 선택 시점(視點)의 영상을 잘라낸 컨텐츠를 즐길 수도 있다. 또한, 영상과 함께, 소리도 복수의 상이한 앵글로부터 수음(收音)되고, 서버는, 특정 앵글 또는 공간으로부터의 소리를 대응하는 영상과 다중화하여, 다중화된 영상과 소리를 송신해도 된다.
또, 최근에는 Virtual Reality(VR) 및 Augmented Reality(AR) 등, 현실 세계와 가상 세계를 대응지은 컨텐츠도 보급되어 오고 있다. VR 화상의 경우, 서버는, 우안용 및 좌안용의 시점 화상을 각각 작성하여, Multi-View Coding(MVC) 등에 의해 각 시점 영상 사이에서 참조를 허용하는 부호화를 행해도 되고, 서로 참조하지 않고 개별 스트림으로서 부호화해도 된다. 개별 스트림의 복호 시에는, 사용자의 시점에 따라 가상적인 3차원 공간이 재현되도록 서로 동기시켜 재생하면 된다.
AR 화상의 경우에는, 서버는, 현실 공간의 카메라 정보에, 가상 공간 상의 가상 물체 정보를, 3차원적 위치 또는 사용자의 시점의 움직임에 의거하여 중첩해도 된다. 복호 장치는, 가상 물체 정보 및 3차원 데이터를 취득 또는 유지하며, 사용자의 시점의 움직임에 따라 2차원 화상을 생성하고, 매끄럽게 연결함으로써 중첩 데이터를 작성해도 된다. 또는, 복호 장치는 가상 물체 정보의 의뢰에 더하여 사용자의 시점의 움직임을 서버에 송신해도 된다. 서버는, 서버에 유지되는 3차원 데이터로부터 수신한 시점의 움직임에 맞추어 중첩 데이터를 작성하고, 중첩 데이터를 부호화하여 복호 장치에 전송해도 된다. 또한, 중첩 데이터는, 전형적으로는, RGB 이외에 투과도를 나타내는 α값을 갖고, 서버는, 3차원 데이터로부터 작성된 오브젝트 이외의 부분의 α값이 0 등으로 설정되고, 당해 부분이 투과하는 상태에서, 부호화해도 된다. 혹은, 서버는, 크로마키와 같이 소정 값의 RGB값을 배경으로 설정하고, 오브젝트 이외의 부분은 배경색으로 한 데이터를 생성해도 된다. 소정 값의 RGB값은, 미리 정해져 있어도 된다.
마찬가지로 전송된 데이터의 복호 처리는 클라이언트(예를 들면, 단말)에서 행해도 되고, 서버측에서 행해도 되고, 서로 분담하여 행해도 된다. 일례로서, 어떤 단말이, 일단 서버에 수신 리퀘스트를 보내고, 그 리퀘스트에 따른 컨텐츠를 다른 단말에서 수신하여 복호 처리를 행하여, 디스플레이를 갖는 장치에 복호 완료된 신호가 송신되어도 된다. 통신 가능한 단말 자체의 성능에 상관없이 처리를 분산하여 적절한 컨텐츠를 선택함으로써 화질이 좋은 데이터를 재생할 수 있다. 또, 다른 예로서 큰 사이즈의 화상 데이터를 TV 등으로 수신하면서, 감상자의 개인 단말에 픽처가 분할된 타일 등 일부의 영역이 복호되어 표시되어도 된다. 이로 인해, 전체 상(像)을 공유화하면서, 자신의 담당 분야 또는 보다 상세하게 확인하고 싶은 영역을 가까이에서 확인할 수 있다.
실내외의 근거리, 중거리, 또는 장거리의 무선 통신이 복수 사용 가능한 상황 하에서, MPEG-DASH 등의 전송 시스템 규격을 이용하여, 심리스로 컨텐츠를 수신하는 것이 가능할지도 모른다. 사용자는, 사용자의 단말, 실내외에 배치된 디스플레이 등의 복호 장치 또는 표시 장치를 자유롭게 선택하면서 실시간으로 전환해도 된다. 또, 자신의 위치 정보 등을 사용하여, 복호하는 단말 및 표시하는 단말을 전환하면서 복호를 행할 수 있다. 이로 인해, 사용자가 목적지로 이동하고 있는 동안에, 표시 가능한 디바이스가 매설된 인근 건물의 벽면 또는 지면의 일부에 정보를 매핑 및 표시하는 것이 가능해진다. 또, 부호화 데이터가 수신 단말로부터 단시간에 액세스할 수 있는 서버에 캐시되어 있거나, 또는, 컨텐츠·딜리버리·서비스에 있어서의 에지 서버에 카피되어 있는 등의, 네트워크 상에서의 부호화 데이터로의 액세스 용이성에 의거하여, 수신 데이터의 비트 레이트를 전환하는 것도 가능하다.
[스케일러블 부호화]
컨텐츠의 전환에 관하여, 도 57에 나타내는, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법을 응용하여 압축 부호화된 스케일러블한 스트림을 사용하여 설명한다. 서버는, 개별 스트림으로서 내용은 같으며 질이 다른 스트림을 복수 갖고 있어도 상관없으나, 도시하는 바와 같이 레이어로 나누어 부호화를 행함으로써 실현되는 시간적/공간적 스케일러블한 스트림의 특징을 살려, 컨텐츠를 전환하는 구성이어도 된다. 즉, 복호측이 성능과 같은 내적 요인과 통신 대역의 상태 등의 외적 요인에 따라 어느 레이어를 복호할지를 결정함으로써, 복호측은, 저해상도 컨텐츠와 고해상도 컨텐츠를 자유롭게 전환하여 복호할 수 있다. 예를 들면 사용자가 이동 중에 스마트폰(ex115)으로 시청하고 있던 영상을 계속해서, 예를 들면 귀가 후에 인터넷 TV 등의 기기로 시청하고 싶은 경우에는, 당해 기기는, 같은 스트림을 상이한 레이어까지 복호하면 되므로, 서버측의 부담을 경감할 수 있다.
또한, 상기와 같이, 레이어마다 픽처가 부호화되어 있고, 베이스 레이어의 상위의 인핸스먼트 레이어로 스케일러빌리티를 실현하는 구성 이외에, 인핸스먼트 레이어가 화상의 통계 정보 등에 의거한 메타 정보를 포함하고 있어도 된다. 복호측이, 메타 정보에 의거하여 베이스 레이어의 픽처를 초해상함으로써 고화질화된 컨텐츠를 생성해도 된다. 초해상은, 해상도를 유지 및/또는 확대하면서, SN비를 향상시켜도 된다. 메타 정보는, 초해상 처리에 사용하는 선형 혹은 비선형의 필터 계수를 특정하기 위한 정보, 또는, 초해상 처리에 사용하는 필터 처리, 기계 학습 혹은 최소 제곱 연산에 있어서의 파라미터값을 특정하는 정보 등을 포함한다.
또는, 화상 내의 오브젝트 등의 의미에 따라 픽처가 타일 등으로 분할되는 구성이 제공되어도 된다. 복호측이, 복호하는 타일을 선택함으로써 일부의 영역만을 복호한다. 또, 오브젝트의 속성(인물, 자동차, 볼 등)과 영상 내의 위치(동일 화상에 있어서의 좌표 위치 등)를 메타 정보로서 저장함으로써, 복호측은, 메타 정보에 의거하여 원하는 오브젝트의 위치를 특정하고, 그 오브젝트를 포함하는 타일을 결정할 수 있다. 예를 들면, 도 58에 나타내는 바와 같이, 메타 정보는, HEVC에 있어서의 SEI(supplemental enhancement information) 메세지 등, 화소 데이터와는 상이한 데이터 저장 구조를 사용하여 저장되어도 된다. 이 메타 정보는, 예를 들면, 메인 오브젝트의 위치, 사이즈, 또는 색채 등을 나타낸다.
스트림, 시퀀스 또는 랜덤 액세스 단위 등, 복수의 픽처로 구성되는 단위로 메타 정보가 저장되어도 된다. 복호측은, 특정 인물이 영상 내에 출현하는 시각 등을 취득할 수 있으며, 픽처 단위의 정보와 시간 정보를 합침으로써, 오브젝트가 존재하는 픽처를 특정할 수 있고, 픽처 내에서의 오브젝트의 위치를 특정할 수 있다.
[Web 페이지의 최적화]
도 59는, 컴퓨터(ex111) 등에 있어서의 web 페이지의 표시 화면예를 나타내는 도면이다. 도 60은, 스마트폰(ex115) 등에 있어서의 web 페이지의 표시 화면예를 나타내는 도면이다. 도 59 및 도 60에 나타내는 바와 같이 web 페이지가, 화상 컨텐츠에 대한 링크인 링크 화상을 복수 포함하는 경우가 있으며, 열람하는 디바이스에 따라 그 보이는 방식이 상이해도 된다. 화면 상에 복수의 링크 화상이 보이는 경우에는, 사용자가 명시적으로 링크 화상을 선택할 때까지, 또는 화면의 중앙 부근에 링크 화상이 가까워지거나 혹은 링크 화상 전체가 화면 내에 들어갈 때까지, 표시 장치(복호 장치)는, 링크 화상으로서 각 컨텐츠가 갖는 정지 화상 또는 I 픽처를 표시해도 되고, 복수의 정지 화상 또는 I 픽처 등으로 gif 애니메이션과 같은 영상을 표시해도 되고, 베이스 레이어만 수신하여, 영상을 복호 및 표시해도 된다.
사용자에 의해 링크 화상이 선택된 경우, 표시 장치는, 예를 들면 베이스 레이어를 최우선으로 하면서 복호를 행한다. 또한, web 페이지를 구성하는 HTML에 스케일러블한 컨텐츠임을 나타내는 정보가 있으면, 표시 장치는, 인핸스먼트 레이어까지 복호해도 된다. 또, 실시간성을 담보하기 위해, 선택되기 전 또는 통신 대역이 매우 열악한 경우에는, 표시 장치는, 전방 참조의 픽처(I 픽처, P 픽처, 전방 참조만인 B 픽처)만을 복호 및 표시함으로써, 선두 픽처의 복호 시각과 표시 시각 사이의 지연(컨텐츠의 복호 개시부터 표시 개시까지의 지연)을 저감할 수 있다. 또한, 표시 장치는, 픽처의 참조 관계를 일부러 무시하고, 모든 B 픽처 및 P 픽처를 전방 참조로 하여 거칠게 복호하고, 시간이 지나 수신한 픽처가 증가함에 따라 정상적인 복호를 행해도 된다.
[자동 주행]
또, 자동차의 자동 주행 또는 주행 지원을 위해 2차원 또는 3차원의 지도 정보 등과 같은 정지 화상 또는 영상 데이터를 송수신하는 경우, 수신 단말은, 1 이상의 레이어에 속하는 화상 데이터에 더하여, 메타 정보로서 기후 또는 공사 정보 등도 수신하고, 이들을 대응지어 복호해도 된다. 또한, 메타 정보는, 레이어에 속해도 되고, 단순히 화상 데이터와 다중화되어도 된다.
이 경우, 수신 단말을 포함하는 자동차, 드론 또는 비행기 등이 이동하기 때문에, 수신 단말은, 당해 수신 단말의 위치 정보를 송신함으로써, 기지국(ex106~ex110)을 전환하면서 심리스한 수신 및 복호의 실행을 실현할 수 있다. 또, 수신 단말은, 사용자의 선택, 사용자의 상황 및/또는 통신 대역 상태에 따라, 메타 정보를 어느 정도 수신할지, 또는 지도 정보를 어느 정도 갱신해 갈지를 동적으로 전환하는 것이 가능해진다.
컨텐츠 공급 시스템(ex100)에서는, 사용자가 송신한 부호화된 정보를 실시간으로 클라이언트가 수신하여 복호하고, 재생할 수 있다.
[개인 컨텐츠의 전송]
또, 컨텐츠 공급 시스템(ex100)에서는, 영상 전송 업자에 의한 고화질이며 장시간의 컨텐츠뿐만 아니라, 개인에 의한 저화질이며 단시간의 컨텐츠의 유니캐스트, 또는 멀티캐스트 전송이 가능하다. 이러한 개인 컨텐츠는 향후에도 증가해 갈 것으로 생각된다. 개인 컨텐츠를 보다 우수한 컨텐츠로 하기 위해, 서버는, 편집 처리를 행하고 나서 부호화 처리를 행해도 된다. 이는, 예를 들면, 이하와 같은 구성을 사용하여 실현할 수 있다.
촬영 시에 실시간 또는 축적하여 촬영 후에, 서버는, 원화상 데이터 또는 부호화 완료 데이터로부터 촬영 에러, 신 탐색, 의미의 해석, 및 오브젝트 검출 등의 인식 처리를 행한다. 그리고, 서버는, 인식 결과에 의거하여 수동 또는 자동으로, 핀트 어긋남 또는 손떨림 등을 보정하거나, 명도가 다른 픽처에 비해 낮거나 또는 초점이 맞지 않는 신 등의 중요성이 낮은 신을 삭제하거나, 오브젝트의 에지를 강조하거나, 색조를 변화시키는 등의 편집을 행한다. 서버는, 편집 결과에 의거하여 편집 후의 데이터를 부호화한다. 또 촬영 시각이 너무 길면 시청률이 낮아지는 것도 알려져 있으며, 서버는, 촬영 시간에 따라 특정 시간 범위 내의 컨텐츠가 되도록 상기와 같이 중요성이 낮은 신뿐만 아니라 움직임이 적은 신 등을, 화상 처리 결과에 의거하여 자동으로 클립해도 된다. 또는, 서버는, 신의 의미 해석의 결과에 의거하여 다이제스트를 생성하여 부호화해도 된다.
개인 컨텐츠에는, 그대로는 저작권, 저작자 인격권, 또는 초상권 등의 침해가 되는 것이 찍혀 있는 케이스도 있고, 공유하는 범위가 의도한 범위를 초과해 버리는 등 개인에게 있어서 불편한 경우도 있다. 따라서, 예를 들면, 서버는, 화면의 주변부의 사람의 얼굴, 또는 집 안 등을 일부러 초점이 맞지 않는 화상으로 변경하여 부호화해도 된다. 또, 서버는, 부호화 대상 화상 내에, 미리 등록한 인물과는 상이한 인물의 얼굴이 찍혀 있는지 여부를 인식하여, 찍혀 있는 경우에는, 얼굴 부분에 모자이크를 하는 등의 처리를 행해도 된다. 또는, 부호화의 전처리 또는 후처리로서, 저작권 등의 관점에서 사용자가 화상을 가공하고 싶은 인물 또는 배경 영역을 지정해도 된다. 서버는, 지정된 영역을 다른 영상으로 치환하거나, 또는 초점을 흐리는 등의 처리를 행해도 된다. 인물이면, 동화상에 있어서 인물을 트래킹하여, 인물의 얼굴 부분의 영상을 치환할 수 있다.
데이터량이 작은 개인 컨텐츠의 시청은 실시간성의 요구가 강하기 때문에, 대역폭에도 따르지만, 복호 장치는, 우선 베이스 레이어를 최우선으로 수신하여 복호 및 재생을 행해도 된다. 복호 장치는, 이 사이에 인핸스먼트 레이어를 수신하고, 재생이 루프되는 경우 등 2회 이상 재생되는 경우에, 인핸스먼트 레이어도 포함시켜 고화질의 영상을 재생해도 된다. 이와 같이 스케일러블한 부호화가 행해지고 있는 스트림이면, 미선택 시 또는 보기 시작한 단계에서는 거친 동화상이지만, 서서히 스트림이 스마트해져 화상이 좋아지는 체험을 제공할 수 있다. 스케일러블 부호화 이외에도, 1회째에 재생되는 거친 스트림과, 1회째의 동화상을 참조하여 부호화되는 2회째의 스트림이 하나의 스트림으로서 구성되어 있어도 동일한 체험을 제공할 수 있다.
[그 외의 실시 응용예]
또, 이들 부호화 또는 복호 처리는, 일반적으로 각 단말이 갖는 LSI(ex500)에서 처리된다. LSI(large scale integration circuitry)(ex500)(도 56 참조)는, 원 칩이어도 되고 복수 칩으로 이루어지는 구성이어도 된다. 또한, 동화상 부호화 또는 복호용 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플렉시블 디스크, 또는 하드 디스크 등)에 장착하고, 그 소프트웨어를 사용하여 부호화 또는 복호 처리를 행해도 된다. 또한, 스마트폰(ex115)이 카메라가 달린 경우에는, 그 카메라로 취득한 동화상 데이터를 송신해도 된다. 이때의 동화상 데이터는 스마트폰(ex115)이 갖는 LSI(ex500)에서 부호화 처리된 데이터여도 된다.
또한, LSI(ex500)는, 어플리케이션 소프트를 다운로드하여 액티베이트하는 구성이어도 된다. 이 경우, 단말은, 우선, 당해 단말이 컨텐츠의 부호화 방식에 대응하고 있는지, 또는, 특정 서비스의 실행 능력을 갖는지를 판정한다. 단말이 컨텐츠의 부호화 방식에 대응하고 있지 않은 경우, 또는, 특정 서비스의 실행 능력을 갖지 않는 경우, 단말은, 코덱 또는 어플리케이션 소프트를 다운로드하고, 그 후, 컨텐츠 취득 및 재생해도 된다.
또, 인터넷(ex101)을 통한 컨텐츠 공급 시스템(ex100)에 한정하지 않고, 디지털 방송용 시스템에도 상기 각 실시 형태의 적어도 동화상 부호화 장치(화상 부호화 장치) 또는 동화상 복호화 장치(화상 복호 장치) 중 어느 하나를 장착할 수 있다. 위성 등을 이용하여 방송용 전파에 영상과 소리가 다중화된 다중화 데이터를 실어 송수신하기 때문에, 컨텐츠 공급 시스템(ex100)의 유니캐스트가 하기 쉬운 구성에 대해 멀티캐스트에 적합하다는 차이가 있으나 부호화 처리 및 복호 처리에관해서는 동일한 응용이 가능하다.
[하드웨어 구성]
도 61은, 도 56에 나타난 스마트폰(ex115)을 더욱 상세하게 나타내는 도면이다. 또, 도 62는, 스마트폰(ex115)의 구성예를 나타내는 도면이다. 스마트폰(ex115)은, 기지국(ex110)과의 사이에서 전파를 송수신하기 위한 안테나(ex450)와, 영상 및 정지 화상을 촬영하는 것이 가능한 카메라부(ex465)와, 카메라부(ex465)에서 촬상한 영상, 및 안테나(ex450)에서 수신한 영상 등이 복호된 데이터를 표시하는 표시부(ex458)를 구비한다. 스마트폰(ex115)은, 또한, 터치 패널 등인 조작부(ex466)와, 음성 또는 음향을 출력하기 위한 스피커 등인 음성 출력부(ex457)와, 음성을 입력하기 위한 마이크 등인 음성 입력부(ex456)와, 촬영한 영상 혹은 정지 화상, 녹음한 음성, 수신한 영상 혹은 정지 화상, 메일 등의 부호화된 데이터, 또는, 복호화된 데이터를 저장 가능한 메모리부(ex467)와, 사용자를 특정하고, 네트워크를 비롯하여 각종 데이터에 대한 액세스의 인증을 하기 위한 SIM(ex468)과의 인터페이스부인 슬롯부(ex464)를 구비한다. 또한, 메모리부(ex467) 대신에 외장 메모리가 사용되어도 된다.
표시부(ex458) 및 조작부(ex466) 등을 통괄적으로 제어할 수 있는 주제어부(ex460)와, 전원 회로부(ex461), 조작 입력 제어부(ex462), 영상 신호 처리부(ex455), 카메라 인터페이스부(ex463), 디스플레이 제어부(ex459), 변조/복조부(ex452), 다중/분리부(ex453), 음성 신호 처리부(ex454), 슬롯부(ex464), 및 메모리부(ex467)가 동기 버스(ex470)를 통해 접속되어 있다.
전원 회로부(ex461)는, 사용자의 조작에 의해 전원 키가 온 상태가 되면, 스마트폰(ex115)을 동작 가능한 상태로 기동하고, 배터리 팩으로부터 각 부에 대해 전력을 공급한다.
스마트폰(ex115)은, CPU, ROM 및 RAM 등을 갖는 주제어부(ex460)의 제어에 의거하여, 통화 및 데이터 통신 등의 처리를 행한다. 통화 시에는, 음성 입력부(ex456)에서 수음한 음성 신호를 음성 신호 처리부(ex454)에서 디지털 음성 신호로 변환하고, 이를 변조/복조부(ex452)에서 스펙트럼 확산 처리를 실시하며, 송신/수신부(ex451)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시하고, 그 결과의 신호를, 안테나(ex450)를 통해 송신한다. 또 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변조/복조부(ex452)에서 스펙트럼 역확산 처리하며, 음성 신호 처리부(ex454)에서 아날로그 음성 신호로 변환한 후, 이를 음성 출력부(ex457)로부터 출력한다. 데이터 통신 모드 시에는, 본체부의 조작부(ex466) 등의 조작에 의거하여 텍스트, 정지 화상, 또는 영상 데이터가 조작 입력 제어부(ex462)를 통해 주제어부(ex460)의 제어 하에서 송출될 수 있다. 동일한 송수신 처리가 행해진다. 데이터 통신 모드 시에 영상, 정지 화상, 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부(ex455)는, 메모리부(ex467)에 저장되어 있는 영상 신호 또는 카메라부(ex465)로부터 입력된 영상 신호를 상기 각 실시 형태에서 나타낸 동화상 부호화 방법에 의해 압축 부호화하고, 부호화된 영상 데이터를 다중/분리부(ex453)에 송출한다. 음성 신호 처리부(ex454)는, 영상 또는 정지 화상을 카메라부(ex465)에서 촬상 중에 음성 입력부(ex456)에서 수음한 음성 신호를 부호화하고, 부호화된 음성 데이터를 다중/분리부(ex453)에 송출한다. 다중/분리부(ex453)는, 부호화 완료 영상 데이터와 부호화 완료 음성 데이터를 소정의 방식으로 다중화하고, 변조/복조부(변조/복조 회로부)(ex452), 및 송신/수신부(ex451)에서 변조 처리 및 변환 처리를 실시하여 안테나(ex450)를 통해 송신한다. 소정의 방식은, 미리 정해져 있어도 된다.
전자 메일 또는 채팅에 첨부된 영상, 또는 웹페이지 등에 링크된 영상을 수신한 경우 등에 있어서, 안테나(ex450)를 통해 수신된 다중화 데이터를 복호하기 위해, 다중/분리부(ex453)는, 다중화 데이터를 분리함으로써, 다중화 데이터를 영상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누고, 동기 버스(ex470)를 통해 부호화된 영상 데이터를 영상 신호 처리부(ex455)에 공급함과 더불어, 부호화된 음성 데이터를 음성 신호 처리부(ex454)에 공급한다. 영상 신호 처리부(ex455)는, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법에 대응한 동화상 복호화 방법에 의해 영상 신호를 복호하고, 디스플레이 제어부(ex459)를 통해 표시부(ex458)로부터, 링크된 동화상 파일에 포함되는 영상 또는 정지 화상이 표시된다. 음성 신호 처리부(ex454)는, 음성 신호를 복호하고, 음성 출력부(ex457)로부터 음성이 출력된다. 실시간 스트리밍이 점점 보급되기 시작하고 있기 때문에, 사용자의 상황에 따라서는 음성의 재생이 사회적으로 적합하지 않은 경우도 있을 수 있다. 그 때문에, 초기값으로는, 음성 신호는 재생하지 않고 영상 데이터만을 재생하는 구성이 바람직하고, 사용자가 영상 데이터를 클릭하는 등 조작을 행한 경우에만 음성을 동기하여 재생해도 된다.
또 여기서는 스마트폰(ex115)을 예로 설명했는데, 단말로서는 부호화기 및 복호화기를 둘 다 갖는 송수신형 단말 외에, 부호화기만을 갖는 송신 단말, 및, 복호화기만을 갖는 수신 단말과 같은 다른 실장 형식을 생각할 수 있다. 디지털 방송용 시스템에 있어서, 영상 데이터에 음성 데이터가 다중화된 다중화 데이터를 수신 또는 송신하는 것으로서 설명했다. 단, 다중화 데이터에는, 음성 데이터 이외에 영상에 관련된 문자 데이터 등이 다중화되어도 된다. 또, 다중화 데이터가 아닌 영상 데이터 자체가 수신 또는 송신되어도 된다.
또한, CPU를 포함하는 주제어부(ex460)가 부호화 또는 복호 처리를 제어하는 것으로서 설명했는데, 여러 가지 단말은 GPU를 구비하는 경우도 많다. 따라서, CPU와 GPU에서 공통화된 메모리, 또는 공통으로 사용할 수 있도록 어드레스가 관리되어 있는 메모리에 의해, GPU의 성능을 살려 넓은 영역을 일괄적으로 처리하는 구성이어도 된다. 이로 인해 부호화 시간을 단축할 수 있고, 실시간성을 확보하여, 저(低) 지연을 실현할 수 있다. 특히 움직임 탐색, 디블록 필터, SAO(Sample Adaptive Offset), 및 변환·양자화의 처리를, CPU가 아니라, GPU에서 픽처 등의 단위로 일괄적으로 행하면 효율적이다.
본 개시는, 예를 들면, 텔레비전 수상기, 디지털 비디오 레코더, 자동차 내비게이션, 휴대 전화, 디지털 카메라, 디지털 비디오 카메라, TV 회의 시스템, 또는, 전자 미러 등에 이용 가능하다.
100: 부호화 장치 102: 분할부
104: 감산부 106: 변환부
108: 양자화부 110: 엔트로피 부호화부
112, 204: 역양자화부 114, 206: 역변환부
116, 208: 가산부 118, 210: 블록 메모리
120, 212: 루프 필터부 122, 214: 프레임 메모리
124, 216: 인트라 예측부 126, 218: 인터 예측부
126a, a2, b2: 메모리 126b: 보간 화상 도출부
126c: 구배 화상 도출부 126d: 옵티컬 플로 도출부
126e: 보정값 도출부 126f: 예측 화상 보정부
128, 220: 예측 제어부 200: 복호 장치
202: 엔트로피 복호부 1201: 경계 판정부
1202, 1204, 1206: 스위치 1203: 필터 판정부
1205: 필터 처리부 1207: 필터 특성 결정부
1208: 처리 판정부 a1, b1: 프로세서

Claims (16)

  1. 회로와,
    상기 회로에 접속된 메모리를 구비하고,
    상기 회로는, 동작에 있어서,
    커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고,
    상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 부호화에 사용되는 예측 화상을 생성하는,
    부호화 장치.
  2. 청구항 1에 있어서,
    상기 회로는,
    Figure pct00119

    에 의해 상기 제1 파라미터를 도출하고,
    Figure pct00120

    에 의해 상기 제2 파라미터를 도출하며,
    Figure pct00121

    에 의해 상기 제3 파라미터를 도출하고,
    Figure pct00122

    에 의해 상기 제4 파라미터를 도출하며,
    Figure pct00123

    에 의해 상기 제5 파라미터를 도출하고,
    Ω는, 상기 복수의 상대적 화소 위치의 집합을 나타내며, [i,j]는, 상기 복수의 상대적 화소 위치 각각을 나타내고, 상기 복수의 상대적 화소 위치 각각에 대해서, Ix 0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내며, Ix 1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내고, Iy 0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내며, Iy 1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내고, I0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내며, I1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내고, abs(Ix 1+Ix 0)은, Ix 1+Ix 0의 절대값을 나타내며, sign(Ix 1+Ix 0)은, Ix 1+Ix 0의 양음 부호를 나타내고, abs(Iy 1+Iy 0)은, Iy 1+Iy 0의 절대값을 나타내며, sign(Iy 1+Iy 0)은, Iy 1+Iy 0의 양음 부호를 나타내는, 부호화 장치.
  3. 청구항 1 또는 청구항 2에 있어서,
    상기 회로는,
    상기 제3 파라미터를 상기 제1 파라미터로 나눔으로써 제6 파라미터를 도출하고,
    상기 제4 파라미터로부터, 상기 제5 파라미터와 상기 제6 파라미터의 곱을 빼고, 상기 제2 파라미터로 나눔으로써 제7 파라미터를 도출하며,
    상기 제6 파라미터 및 상기 제7 파라미터를 사용하여, 상기 예측 화상을 생성하는, 부호화 장치.
  4. 청구항 3에 있어서,
    상기 회로는,
    Figure pct00124

    에 의해 상기 제6 파라미터를 도출하고,
    Figure pct00125

    에 의해 상기 제7 파라미터를 도출하며,
    sGx는, 상기 제1 파라미터를 나타내고, sGy는, 상기 제2 파라미터를 나타내며, sGxdI는, 상기 제3 파라미터를 나타내고, sGydI는, 상기 제4 파라미터를 나타내며, sGxGy는, 상기 제5 파라미터를 나타내고, u는, 상기 제6 파라미터를 나타내며, Bits는, 인수의 이진 로그를 정수로 절상함으로써 얻어지는 값을 반환하는 함수인, 부호화 장치.
  5. 청구항 3 또는 청구항 4에 있어서,
    상기 회로는, 상기 커런트 블록에 포함되는 처리 대상 화소 위치의 예측 화소값을, 상기 제1 참조 블록에 있어서 상기 처리 대상 화소 위치에 대응하는 제1 화소 위치의 제1 화소값과, 상기 제1 화소 위치의 제1 수평 구배값과, 상기 제1 화소 위치의 제1 수직 구배값과, 상기 제2 참조 블록에 있어서 상기 처리 대상 화소 위치에 대응하는 제2 화소 위치의 제2 화소값과, 상기 제2 화소 위치의 제2 수평 구배값과, 상기 제2 화소 위치의 제2 수직 구배값과, 상기 제6 파라미터와, 상기 제7 파라미터를 사용하여 도출함으로써, 상기 예측 화상을 생성하는, 부호화 장치.
  6. 청구항 5에 있어서,
    상기 회로는, 상기 제1 화소값과, 상기 제2 화소값과, 제1 보정값과, 제2 보정값의 합을 2로 나눔으로써, 상기 예측 화소값을 도출하고,
    상기 제1 보정값은, 상기 제1 수평 구배값과 상기 제2 수평 구배값의 차와, 상기 제6 파라미터의 곱에 대응하며,
    상기 제2 보정값은, 상기 제1 수직 구배값과 상기 제2 수직 구배값의 차와, 상기 제7 파라미터의 곱에 대응하는, 부호화 장치.
  7. 청구항 6에 있어서,
    상기 회로는,
    Figure pct00126

    에 의해 상기 예측 화소값을 도출하고,
    I0은, 상기 제1 화소값을 나타내며, I1은, 상기 제2 화소값을 나타내고, u는, 상기 제6 파라미터를 나타내며, Ix 0은, 상기 제1 수평 구배값을 나타내고, Ix 1은, 상기 제2 수평 구배값을 나타내며, v는, 상기 제7 파라미터를 나타내고, Iy 0은, 상기 제1 수직 구배값을 나타내며, Iy 1은, 상기 제2 수직 구배값을 나타내는, 부호화 장치.
  8. 회로와,
    상기 회로에 접속된 메모리를 구비하고,
    상기 회로는, 동작에 있어서,
    커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고,
    상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 복호에 사용되는 예측 화상을 생성하는,
    복호 장치.
  9. 청구항 8에 있어서,
    상기 회로는,
    Figure pct00127

    에 의해 상기 제1 파라미터를 도출하고,
    Figure pct00128

    에 의해 상기 제2 파라미터를 도출하며,
    Figure pct00129

    에 의해 상기 제3 파라미터를 도출하고,
    Figure pct00130

    에 의해 상기 제4 파라미터를 도출하며,
    Figure pct00131

    에 의해 상기 제5 파라미터를 도출하고,
    Ω는, 상기 복수의 상대적 화소 위치의 집합을 나타내며, [i,j]는, 상기 복수의 상대적 화소 위치 각각을 나타내고, 상기 복수의 상대적 화소 위치 각각에 대해서, Ix 0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내며, Ix 1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값을 나타내고, Iy 0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내며, Iy 1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값을 나타내고, I0은, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내며, I1은, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값을 나타내고, abs(Ix 1+Ix 0)은, Ix 1+Ix 0의 절대값을 나타내며, sign(Ix 1+Ix 0)은, Ix 1+Ix 0의 양음 부호를 나타내고, abs(Iy 1+Iy 0)은, Iy 1+Iy 0의 절대값을 나타내며, sign(Iy 1+Iy 0)은, Iy 1+Iy 0의 양음 부호를 나타내는, 복호 장치.
  10. 청구항 8 또는 청구항 9에 있어서,
    상기 회로는,
    상기 제3 파라미터를 상기 제1 파라미터로 나눔으로써 제6 파라미터를 도출하고,
    상기 제4 파라미터로부터, 상기 제5 파라미터와 상기 제6 파라미터의 곱을 빼고, 상기 제2 파라미터로 나눔으로써 제7 파라미터를 도출하며,
    상기 제6 파라미터 및 상기 제7 파라미터를 사용하여, 상기 예측 화상을 생성하는, 복호 장치.
  11. 청구항 10에 있어서,
    상기 회로는,
    Figure pct00132

    에 의해 상기 제6 파라미터를 도출하고,
    Figure pct00133

    에 의해 상기 제7 파라미터를 도출하며,
    sGx는, 상기 제1 파라미터를 나타내고, sGy는, 상기 제2 파라미터를 나타내며, sGxdI는, 상기 제3 파라미터를 나타내고, sGydI는, 상기 제4 파라미터를 나타내며, sGxGy는, 상기 제5 파라미터를 나타내고, u는, 상기 제6 파라미터를 나타내며, Bits는, 인수의 이진 로그를 정수로 절상함으로써 얻어지는 값을 반환하는 함수인, 복호 장치.
  12. 청구항 10 또는 청구항 11에 있어서,
    상기 회로는, 상기 커런트 블록에 포함되는 처리 대상 화소 위치의 예측 화소값을, 상기 제1 참조 블록에 있어서 상기 처리 대상 화소 위치에 대응하는 제1 화소 위치의 제1 화소값과, 상기 제1 화소 위치의 제1 수평 구배값과, 상기 제1 화소 위치의 제1 수직 구배값과, 상기 제2 참조 블록에 있어서 상기 처리 대상 화소 위치에 대응하는 제2 화소 위치의 제2 화소값과, 상기 제2 화소 위치의 제2 수평 구배값과, 상기 제2 화소 위치의 제2 수직 구배값과, 상기 제6 파라미터와, 상기 제7 파라미터를 사용하여 도출함으로써, 상기 예측 화상을 생성하는, 복호 장치.
  13. 청구항 12에 있어서,
    상기 회로는, 상기 제1 화소값과, 상기 제2 화소값과, 제1 보정값과, 제2 보정값의 합을 2로 나눔으로써, 상기 예측 화소값을 도출하고,
    상기 제1 보정값은, 상기 제1 수평 구배값과 상기 제2 수평 구배값의 차와, 상기 제6 파라미터의 곱에 대응하며,
    상기 제2 보정값은, 상기 제1 수직 구배값과 상기 제2 수직 구배값의 차와, 상기 제7 파라미터의 곱에 대응하는, 복호 장치.
  14. 청구항 13에 있어서,
    상기 회로는,
    Figure pct00134

    에 의해 상기 예측 화소값을 도출하고,
    I0은, 상기 제1 화소값을 나타내며, I1은, 상기 제2 화소값을 나타내고, u는, 상기 제6 파라미터를 나타내며, Ix 0은, 상기 제1 수평 구배값을 나타내고, Ix 1은, 상기 제2 수평 구배값을 나타내며, v는, 상기 제7 파라미터를 나타내고, Iy 0은, 상기 제1 수직 구배값을 나타내며, Iy 1은, 상기 제2 수직 구배값을 나타내는, 복호 장치.
  15. 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고,
    상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 부호화에 사용되는 예측 화상을 생성하는,
    부호화 방법.
  16. 커런트 블록의 제1 참조 블록을 포함하는 제1 범위, 및, 상기 커런트 블록의 제2 참조 블록을 포함하는 제2 범위 양쪽에 대해 공통으로 또한 상대적으로 정해지는 복수의 화소 위치이며, 상기 제1 범위 및 상기 제2 범위 각각에 있어서의 복수의 화소 위치인 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합의 절대값인 수평 구배합 절대값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 구배합 절대값의 총합을 제1 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합의 절대값인 수직 구배합 절대값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 구배합 절대값의 총합을 제2 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 화소값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 화소값의 차인 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수평 구배값의 합인 수평 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수평 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수평 대응 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수평 대응 화소 차분값의 총합을 제3 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 제1 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값과, 상기 제2 범위에 있어서의 당해 상대적 화소 위치의 수직 구배값의 합인 수직 구배합의 양음 부호에 따라, 당해 상대적 화소 위치에 대해서 도출된 상기 화소 차분값의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 화소 차분값인 수직 대응 화소 차분값을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 화소 차분값의 총합을 제4 파라미터로서 도출하고,
    상기 복수의 상대적 화소 위치 각각에 대해서, 상기 수직 구배합의 양음 부호에 따라, 상기 수평 구배합의 양음 부호를 반전 또는 유지하고, 상기 수직 구배합의 양음 부호에 따라 양음 부호가 반전 또는 유지된 상기 수평 구배합인 수직 대응 수평 구배합을 도출하고,
    상기 복수의 상대적 화소 위치에 대해서 각각 도출된 복수의 수직 대응 수평 구배합의 총합을 제5 파라미터로서 도출하고,
    상기 제1 파라미터, 상기 제2 파라미터, 상기 제3 파라미터, 상기 제4 파라미터 및 상기 제5 파라미터를 사용하여, 상기 커런트 블록의 복호에 사용되는 예측 화상을 생성하는,
    복호 방법.

KR1020217040134A 2019-06-21 2020-06-15 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법 KR20220022486A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962864728P 2019-06-21 2019-06-21
US62/864,728 2019-06-21
PCT/JP2020/023329 WO2020255903A1 (ja) 2019-06-21 2020-06-15 符号化装置、復号装置、符号化方法、および復号方法

Publications (1)

Publication Number Publication Date
KR20220022486A true KR20220022486A (ko) 2022-02-25

Family

ID=74040068

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217040134A KR20220022486A (ko) 2019-06-21 2020-06-15 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법

Country Status (11)

Country Link
US (3) US11095883B2 (ko)
EP (1) EP3989575A4 (ko)
KR (1) KR20220022486A (ko)
CN (1) CN114128293A (ko)
AU (1) AU2020298425A1 (ko)
BR (1) BR112021017765A2 (ko)
CA (1) CA3140379A1 (ko)
MX (1) MX2021012502A (ko)
SG (1) SG11202112656UA (ko)
TW (1) TW202106002A (ko)
WO (1) WO2020255903A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111083484A (zh) 2018-10-22 2020-04-28 北京字节跳动网络技术有限公司 基于子块的预测
WO2020084475A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Utilization of refined motion vector
CN111436227B (zh) 2018-11-12 2024-03-29 北京字节跳动网络技术有限公司 在视频处理中使用组合帧间-帧内预测
CN113170171B (zh) 2018-11-20 2024-04-12 北京字节跳动网络技术有限公司 组合帧间帧内预测模式的预测细化
WO2020103852A1 (en) 2018-11-20 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Difference calculation based on patial position
WO2020121879A1 (ja) * 2018-12-10 2020-06-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
KR102635518B1 (ko) 2019-03-06 2024-02-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 변환된 단예측 후보의 사용
CN113647099B (zh) * 2019-04-02 2022-10-04 北京字节跳动网络技术有限公司 解码器侧运动矢量推导

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2648254B2 (fr) * 1988-09-23 1991-08-30 Thomson Csf Procede et dispositif d'estimation de mouvement dans une sequence d'images animees
GB2431794A (en) * 2005-10-31 2007-05-02 Sony Uk Ltd Filtering pixels
US9319708B2 (en) * 2006-06-16 2016-04-19 Via Technologies, Inc. Systems and methods of improved motion estimation using a graphics processing unit
GB2443858A (en) * 2006-11-14 2008-05-21 Sony Uk Ltd Alias avoiding image processing using directional pixel block correlation and predetermined pixel value criteria
US8405714B2 (en) * 2010-06-03 2013-03-26 Panasonic Corporation Pupil hidden state detecting apparatus and vehicle-mounted camera employing the same
US20150350671A1 (en) * 2013-01-04 2015-12-03 Samsung Electronics Co., Ltd. Motion compensation method and device for encoding and decoding scalable video
CN103632352B (zh) * 2013-11-01 2017-04-26 华为技术有限公司 一种噪声图像的时域降噪方法和相关装置
US10986367B2 (en) * 2016-11-04 2021-04-20 Lg Electronics Inc. Inter prediction mode-based image processing method and apparatus therefor
WO2018124329A1 (ko) * 2016-12-28 2018-07-05 엘지전자(주) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
US10931969B2 (en) * 2017-01-04 2021-02-23 Qualcomm Incorporated Motion vector reconstructions for bi-directional optical flow (BIO)
CA3065492C (en) * 2017-05-17 2022-06-14 Kt Corporation Method and device for video signal processing
US10904565B2 (en) * 2017-06-23 2021-01-26 Qualcomm Incorporated Memory-bandwidth-efficient design for bi-directional optical flow (BIO)
US10757442B2 (en) * 2017-07-05 2020-08-25 Qualcomm Incorporated Partial reconstruction based template matching for motion vector derivation
US10986360B2 (en) * 2017-10-16 2021-04-20 Qualcomm Incorproated Various improvements to FRUC template matching
US11265551B2 (en) * 2018-01-18 2022-03-01 Qualcomm Incorporated Decoder-side motion vector derivation
US11575933B2 (en) * 2018-04-06 2023-02-07 Vid Scale, Inc. Bi-directional optical flow method with simplified gradient derivation
US10779002B2 (en) * 2018-04-17 2020-09-15 Qualcomm Incorporated Limitation of the MVP derivation based on decoder-side motion vector derivation
CA3133984A1 (en) 2019-03-19 2020-09-24 Huawei Technologies Co., Ltd. Optical flow based video inter prediction

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
H.265(ISO/IEC 23008-2 HEVC)/HEVC(High Efficiency Video Coding)

Also Published As

Publication number Publication date
TW202106002A (zh) 2021-02-01
BR112021017765A2 (pt) 2022-04-26
AU2020298425A2 (en) 2022-01-06
SG11202112656UA (en) 2021-12-30
JPWO2020255903A1 (ko) 2020-12-24
MX2021012502A (es) 2021-11-12
US11689714B2 (en) 2023-06-27
US20230283771A1 (en) 2023-09-07
WO2020255903A1 (ja) 2020-12-24
AU2020298425A1 (en) 2021-12-23
EP3989575A1 (en) 2022-04-27
US11095883B2 (en) 2021-08-17
US20210337185A1 (en) 2021-10-28
US20210168357A1 (en) 2021-06-03
CN114128293A (zh) 2022-03-01
EP3989575A4 (en) 2022-09-14
CA3140379A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
KR102648038B1 (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
WO2020255903A1 (ja) 符号化装置、復号装置、符号化方法、および復号方法
JP2023126578A (ja) 画像符号化装置及び画像復号装置
JP7389283B2 (ja) 符号化装置及び復号装置
KR20190137806A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR20210030357A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR20210132057A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
WO2019240050A1 (ja) 符号化装置、復号装置、符号化方法および復号方法
JP7337222B2 (ja) 符号化装置及び復号装置
JP7432022B2 (ja) 符号化装置及び復号装置
JP2023068203A (ja) 復号装置及び復号方法
KR20220106771A (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
KR20200015518A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR20220047757A (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
KR20210122782A (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
TW202101987A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
KR20210124213A (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
JP2023001298A (ja) 復号装置及び復号方法
KR20220051171A (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
WO2020050281A1 (ja) 符号化装置、復号装置、符号化方法、および復号方法
KR20220009376A (ko) 복호 장치
KR20210055044A (ko) 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
TWI835963B (zh) 編碼裝置、解碼裝置、編碼方法、及解碼方法
WO2020250883A1 (ja) 符号化装置、復号装置、符号化方法、および復号方法
KR20220097532A (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법 및 기록 매체