KR102409138B1 - 화상 부호화 장치, 화상 복호 장치 및 프로그램 - Google Patents

화상 부호화 장치, 화상 복호 장치 및 프로그램 Download PDF

Info

Publication number
KR102409138B1
KR102409138B1 KR1020207030463A KR20207030463A KR102409138B1 KR 102409138 B1 KR102409138 B1 KR 102409138B1 KR 1020207030463 A KR1020207030463 A KR 1020207030463A KR 20207030463 A KR20207030463 A KR 20207030463A KR 102409138 B1 KR102409138 B1 KR 102409138B1
Authority
KR
South Korea
Prior art keywords
unit
image
prediction
block
evaluation
Prior art date
Application number
KR1020207030463A
Other languages
English (en)
Other versions
KR20200136443A (ko
Inventor
아츠로 이치가야
슌스케 이와무라
šœ스케 이와무라
심페이 네모토
가즈히사 이구치
Original Assignee
닛폰 호소 교카이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 닛폰 호소 교카이 filed Critical 닛폰 호소 교카이
Priority to KR1020227019455A priority Critical patent/KR20220085841A/ko
Publication of KR20200136443A publication Critical patent/KR20200136443A/ko
Application granted granted Critical
Publication of KR102409138B1 publication Critical patent/KR102409138B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

화상 부호화 장치(1)는, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행함으로써, 대상 화상에 대응하는 예측 화상을 생성하는 움직임 보상 예측부(109)와, 복수의 참조 화상 사이의 유사도를, 하나 또는 복수의 화소로 이루어지는 화상 부분마다 산출함으로써, 예측 화상의 예측 정밀도를 화상 부분마다 평가하는 평가부(111)를 구비한다.

Description

화상 부호화 장치, 화상 복호 장치 및 프로그램
본 발명은 화상 부호화 장치, 화상 복호 장치 및 프로그램에 관한 것이다.
종래, 대상 화상(화상 블록)을 부호화하는 부호화 장치에 있어서, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하고, 대상 화상에 대응하는 예측 화상을 생성하여, 상기 대상 화상과 예측 화상 사이의 화소 단위에서의 차분을 나타내는 예측 잔차에 대하여 직교 변환 및 양자화를 행하는 방법이 알려져 있다.
또한, 화상 부호화 장치는, 직교 변환 및 양자화에 의해 얻어진 양자화 변환 계수를 엔트로피 부호화에 의해 부호화함과 더불어, 양자화 변환 계수에 대하여 역양자화 및 역직교 변환을 행하여 예측 잔차를 복원한다. 그리고, 화상 부호화 장치는, 복원한 예측 잔차를 예측 화상과 합성하여 대상 화상을 재구성하여, 재구성 화상을 그 이후의 예측에 이용한다.
한편, 화상 복호 장치는, 엔트로피 부호화된 양자화 변환 계수를 복호함과 더불어, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하여, 대상 화상에 대응하는 예측 화상을 생성한다. 화상 복호 장치는, 양자화 변환 계수를 역양자화 및 역직교 변환하여 예측 잔차를 복원하고, 복원 예측 잔차를 예측 화상과 합성하여 대상 화상을 재구성한다.
이러한 화상 부호화 장치 및 화상 복호 장치는, 복수의 참조 화상을 이용하는 움직임 보상 예측에 있어서, 예컨대 복수의 참조 화상을 평균화함으로써 예측 화상을 생성한다(비특허문헌 1 참조).
비특허문헌 1: Recommendation ITU-T H.265, (12/2016), "High efficiency video coding", International Telecommunication Union
예측 화상을 생성하기 위한 복수의 참조 화상 사이의 유사도가 현저히 낮은 부분이 존재하는 경우, 그 부분에 있어서의 예측 화상의 정밀도(즉, 예측 정밀도)가 저하하여, 그 부분에 있어서의 예측 잔차(殘差)가 다른 부분과 비교하여 커진다.
예측 잔차가 큰 부분과 작은 부분이 혼재하는 예측 잔차를 직교 변환하면, 저주파수 성분에 전력이 집중하지 않고 변환 계수의 전력 집중도가 저하한다. 이러한 변환 계수에 관해서 고주파수 성분을 거칠게 양자화하면, 고주파수 성분에 있어서의 변환 계수가 열화된다. 이러한 변환 계수의 열화는 역양자화 및 역직교 변환을 거쳐 화상(블록) 내에 전체적으로 전파된다.
이와 같이 하여 열화된 복원 예측 잔차를 예측 화상에 합성하여 대상 화상 블록을 재구성하면, 고정밀도의 예측이 이루어진 부분에도 화질의 열화가 전파되어 버린다. 즉, 예측 정밀도가 낮은 부분에 기인하여, 예측 정밀도가 높은 부분에도 직교 변환 계수의 양자화의 영향이 전파됨으로써 화질이 열화되고, 이에 따라 부호화 효율의 저하를 야기한다고 하는 문제가 있었다.
그래서, 본 발명은, 복수의 참조 화상을 이용하여 예측을 행하는 경우에 있어서 부호화 효율을 개선할 수 있는 화상 부호화 장치, 화상 복호 장치 및 프로그램을 제공하는 것을 목적으로 한다.
또한, 복수의 참조 화상을 이용하여 예측을 행하는 예측 기술이란, 움직임 보상 예측에 있어서의 쌍예측이 대표적인 것이지만, 그것에 한정되는 것은 아니다. 예컨대 HEVC 부호화 방식에서 이용되고 있는 화상의 IntraBC 모드(인트라 블록 카피 모드) 등과 같이 복수 참조하여 예측 화상을 생성하는 경우에도 같은 수법을 적용할 수 있다.
제1 특징에 따른 화상 부호화 장치는 대상 화상을 부호화한다. 이 화상 부호화 장치는, 복수의 참조 화상을 이용하여 예측(대표적인 예측 방법의 예로서는 쌍방향 움직임 보상 예측)을 행함으로써 상기 대상 화상에 대응하는 예측 화상을 생성하는 예측부와, 상기 복수의 참조 화상 사이의 유사도를 산출함으로써 상기 예측 화상의 예측 정밀도를 평가하는 평가부를 구비하는 것을 요지로 한다.
예컨대 이러한 화상 부호화 장치는, 예측 화상의 예측 정밀도를 화상 부분마다 평가함으로써, 예측 잔차가 큰 부분이나 예측 잔차가 작은 부분을 추정할 수 있게 되기 때문에, 화질의 열화를 효율적으로 억제할 수 있다. 이로써, 복수의 참조 화상을 이용하여 예측을 행하는 경우에 있어서 부호화 효율을 개선할 수 있는 화상 부호화 장치를 제공할 수 있다.
또한, 예측부가 행하는 예측은, 복수의 참조 화상을 이용하는 것이라면 어떠한 예측 방식인지를 막론하고 다양한 예측 방식을 이용할 수 있다. 대표적인 예측방법의 예로서는 쌍방향 움직임 보상 예측을 들 수 있지만, HEVC 방식에서 이용되고 있는 복수 참조의 IntraBC 모드(인트라 블록 카피 모드)에 의한 예측이라도 좋다.
제2 특징에 따른 화상 복호 장치는 대상 화상을 복호한다. 상기 화상 복호 장치는, 복수의 참조 화상을 이용하여 예측(대표적인 예측 방법의 예로서는 쌍방향 움직임 보상 예측)을 행함으로써 상기 대상 화상에 대응하는 예측 화상을 생성하는 예측부와, 상기 복수의 참조 화상 사이의 유사도를 산출함으로써 상기 예측 화상의 예측 정밀도를 평가하는 평가부를 구비하는 것을 요지로 한다.
예컨대 화상 복호 장치는, 예측 화상의 예측 정밀도를 화상 부분마다 평가함으로써, 예측 잔차가 큰 부분이나 예측 잔차가 작은 부분을 추정할 수 있게 되기 때문에, 화질의 열화를 효율적으로 억제할 수 있다. 이로써, 복수의 참조 화상을 이용하여 예측을 행하는 경우에 있어서 부호화 효율을 개선할 수 있는 화상 복호 장치를 제공할 수 있다.
제3 특징에 따른 프로그램은, 컴퓨터를 제1 특징에 따른 화상 부호화 장치로서 기능시키기 위한 프로그램인 것을 요지로 한다.
제4 특징에 따른 프로그램은, 컴퓨터를 제2 특징에 따른 화상 복호 장치로서 기능시키기 위한 프로그램인 것을 요지로 한다.
도 1은 제1 실시형태에 따른 화상 부호화 장치의 구성을 도시하는 도면이다.
도 2는 제1 실시형태에 따른 화상 복호 장치의 구성을 도시하는 도면이다.
도 3은 움직임 보상 예측의 일례를 도시하는 도면이다.
도 4는 움직임 보상 예측에 의해 생성되는 예측 화상의 일례를 도시하는 도면이다.
도 5는 평가부 구성의 일례를 도시하는 도면이다.
도 6은 합성부 구성의 일례를 도시하는 도면이다.
도 7은 제1 실시형태에 따른 화상 부호화 장치에 있어서의 처리 플로우를 도시하는 도면이다.
도 8은 제1 실시형태에 따른 화상 복호 장치에 있어서의 처리 플로우를 도시하는 도면이다.
도 9는 제2 실시형태에 따른 화상 부호화 장치의 구성을 도시하는 도면이다.
도 10은 제2 실시형태에 따른 화상 복호 장치의 구성을 도시하는 도면이다.
도 11은 루프 필터의 구성의 일례를 도시하는 도면이다.
도 12는 제2 실시형태에 따른 화상 부호화 장치에 있어서의 처리 플로우를 도시하는 도면이다.
도 13은 제2 실시형태에 따른 화상 복호 장치에 있어서의 처리 플로우를 도시하는 도면이다.
도 14는 제1 실시형태 및 제2 실시형태를 병용하는 경우의 화상 부호화 장치의 구성을 도시하는 도면이다.
도 15는 제1 실시형태 및 제2 실시형태를 병용하는 경우의 화상 복호 장치의 구성을 도시하는 도면이다.
도 16은 제3 실시형태에 따른 화상 부호화 장치의 구성을 도시하는 도면이다.
도 17은 제3 실시형태에 따른 화상 복호 장치의 구성을 도시하는 도면이다.
도 18은 제3 실시형태에 따른 평가부의 구성의 일례를 도시하는 도면이다.
도 19는 제3 실시형태에 따른 엔트로피 부호화부의 구성의 일례를 도시하는 도면이다.
도 20은 제3 실시형태에 따른 엔트로피 부호 복호부의 구성의 일례를 도시하는 도면이다.
도 21은 제3 실시형태에 따른 화상 부호화 장치에 있어서의 처리 플로우를 도시하는 도면이다.
도 22는 제3 실시형태에 따른 화상 복호 장치에 있어서의 처리 플로우를 도시하는 도면이다.
도 23은 제3 실시형태에 따른 평가부의 구성의 변경예를 도시하는 도면이다.
도면을 참조하여, 실시형태에 따른 화상 부호화 장치 및 화상 복호 장치에 관해서 설명한다. 실시형태에 따른 화상 부호화 장치 및 화상 복호 장치는 MPEG로 대표되는 동화상의 부호화 및 복호를 행한다. 이하의 도면의 기재에 있어서, 동일하거나 또는 유사한 부분에는 동일 또는 유사한 부호를 붙이고 있다.
<1. 제1 실시형태>
제1 실시형태에 따른 화상 부호화 장치 및 화상 복호 장치에 관해서 설명한다.
(1.1. 화상 부호화 장치의 구성)
도 1은 제1 실시형태에 따른 화상 부호화 장치(1)의 구성을 도시하는 도면이다. 도 1에 도시하는 것과 같이, 화상 부호화 장치(1)는 블록 분할부(100)와 감산부(101)와 변환부(102a)와 양자화부(102b)와 엔트로피 부호화부(103)와 역양자화부(104a)와 역변환부(104b)와 합성부(105)와 인트라 예측부(106)와 루프 필터(107)와 프레임 메모리(108)와 움직임 보상 예측부(109)와 전환부(110)와 평가부(111)를 구비한다.
블록 분할부(100)는, 프레임(혹은 픽쳐) 단위의 입력 화상을 블록형의 소영역으로 분할하여, 화상 블록을 감산부(101)(및 움직임 보상 예측부(109))에 출력한다. 화상 블록의 사이즈는 예컨대 32×32 화소, 16×16 화소, 8×8 화소 또는 4×4 화소 등이다. 화상 블록은, 화상 부호화 장치(1)가 부호화를 행하는 단위 및 화상 복호 장치(2)가 복호를 행하는 단위이며, 이러한 화상 블록을 대상 화상 블록이라고 부른다.
감산부(101)는, 블록 분할부(100)로부터 입력된 대상 화상 블록과 대상 화상 블록에 대응하는 예측 화상(예측 화상 블록) 사이의 화소 단위에서의 차분을 나타내는 예측 잔차를 산출한다. 구체적으로는 감산부(101)는, 부호화 대상 블록의 각 화소치로부터 예측 화상의 각 화소치를 감산함으로써 예측 잔차를 산출하여, 산출한 예측 잔차를 변환부(102a)에 출력한다. 또한, 예측 화상은 후술하는 인트라 예측부(106) 또는 움직임 보상 예측부(109)로부터 전환부(110)를 통해 감산부(101)에 입력된다.
변환부(102a) 및 양자화부(102b)는, 블록 단위로 직교 변환 처리 및 양자화 처리를 행하는 변환 · 양자화부(102)를 구성한다.
변환부(102a)는, 감산부(101)로부터 입력된 예측 잔차에 대하여 직교 변환을 행하여 변환 계수를 산출하고, 산출한 변환 계수를 양자화부(102b)에 출력한다. 직교 변환이란, 예컨대 이산 코사인 변환(DCT: Discrete Cosine Transform)이나 이산 사인 변환(DST: Discrete Sine Transform), 칼루넨레이브 변환(KLT: Karhunen-Loeve Transform) 등을 말한다.
양자화부(102b)는, 변환부(102a)로부터 입력된 변환 계수를 양자화 파라미터(Qp) 및 양자화 행렬을 이용하여 양자화하여, 양자화 변환 계수를 생성한다. 양자화 파라미터(Qp)는, 블록 내의 각 변환 계수에 대하여 공통적으로 적용되는 파라미터이며, 양자화의 거칠기를 정하는 파라미터이다. 양자화 행렬은 각 변환 계수를 양자화할 때의 양자화치를 요소로서 갖는 행렬이다. 양자화부(102b)는, 양자화 제어 정보, 생성한 양자화 변환 계수 정보 등을 엔트로피 부호화부(103) 및 역양자화부(104a)에 출력한다.
엔트로피 부호화부(103)는, 양자화부(102b)로부터 입력된 양자화 변환 계수에 대하여 엔트로피 부호화를 행하고, 데이터 압축을 행하여 부호화 데이터(비트 스트림)를 생성하여, 부호화 데이터를 화상 부호화 장치(1)의 외부로 출력한다. 엔트로피 부호화에는 허프만 부호나 CABAC(Context-based Adaptive Binary Arithmetic Coding; 콘텍스트 적응형 2치 산술 부호) 등을 이용할 수 있다. 또한, 엔트로피 부호화부(103)에는, 인트라 예측부(106) 및 움직임 보상 예측부(109)로부터 예측에 관한 정보가 입력되고, 루프 필터(107)로부터 필터 처리에 관한 정보가 입력된다. 엔트로피 부호화부(103)는 이들 정보의 엔트로피 부호화도 행한다.
역양자화부(104a) 및 역변환부(104b)는 블록 단위로 역양자화 처리 및 역직교 변환 처리를 행하는 역양자화 · 역변환부(104)를 구성한다.
역양자화부(104a)는, 양자화부(102b)가 행하는 양자화 처리에 대응하는 역양자화 처리를 행한다. 구체적으로는 역양자화부(104a)는, 양자화부(102b)로부터 입력된 양자화 변환 계수를, 양자화 파라미터(Qp) 및 양자화 행렬을 이용하여 역양자화함으로써 변환 계수를 복원하고, 복원한 변환 계수를 역변환부(104b)에 출력한다.
역변환부(104b)는, 변환부(102a)가 행하는 직교 변환 처리에 대응하는 역직교 변환 처리를 행한다. 예컨대 변환부(102a)가 이산 코사인 변환을 행한 경우에는, 역변환부(104b)는 역이산 코사인 변환을 행한다. 역변환부(104b)는, 역양자화부(104a)로부터 입력된 변환 계수에 대하여 역직교 변환을 행하여 예측 잔차를 복원하고, 복원한 예측 잔차인 복원 예측 잔차를 합성부(105)에 출력한다.
합성부(105)는, 역변환부(104b)로부터 입력된 복원 예측 잔차를 전환부(110)로부터 입력된 예측 화상과 화소 단위로 합성한다. 합성부(105)는, 복원 예측 잔차의 각 화소치와 예측 화상의 각 화소치를 가산하여 대상 화상 블록을 재구성하고, 재구성한 대상 화상 블록인 재구성 화상을 인트라 예측부(106) 및 루프 필터(107)에 출력한다.
인트라 예측부(106)는, 합성부(105)로부터 입력된 재구성 화상을 이용하여 인트라 예측을 행하여 인트라 예측 화상을 생성하고, 인트라 예측 화상을 전환부(110)에 출력한다. 또한, 인트라 예측부(106)는 선택한 인트라 예측 모드의 정보 등을 엔트로피 부호화부(103)에 출력한다.
루프 필터(107)는, 합성부(105)로부터 입력된 재구성 화상에 대하여, 후처리로서의 필터 처리를 행하고, 필터 처리 후의 재구성 화상을 프레임 메모리(108)에 출력한다. 또한, 루프 필터(107)는 필터 처리에 관한 정보를 엔트로피 부호화부(103)에 출력한다. 필터 처리에는, 디블록킹 필터(deblocking filter) 처리와 샘플 어댑티브 오프셋(sample adaptive offset) 처리가 포함된다. 디블록킹 필터 처리는, 블록 단위의 처리에 기인하는 신호 열화를 경감하기 위한 처리이며, 인접하는 블록의 경계부에 있어서의 신호의 갭을 평활화하는 처리이다. 이 디블록킹 필터 처리에 의해, 경계부에 있어서의 신호 갭과 양자화의 정도를 나타내는 양자화 파라미터를 이용하여 디블록킹 필터 처리의 세기(필터 강도)가 제어된다. 한편, 샘플 어댑티드 오프셋 처리는, 예컨대 HEVC(비특허문헌 1 참조)에서 채용된 화질 개선 필터 처리이며, 블록 내의 화소의 인접 화소와의 상대적인 관계에 의해 각 화소를 카테고리 나누기를 하고, 각각의 카테고리에 관해서 화질을 향상시키기 위한 오프셋치를 산출하여, 동일한 카테고리에 속하는 각 화소에 일률적으로 오프셋치를 부여하는 처리이다. 오프셋치가 클수록 강한 필터 처리가 적용되기 때문에, 오프셋치는 샘플 어댑티드 오프셋 처리의 필터 강도를 정하는 값이라고 간주할 수 있다.
프레임 메모리(108)는 루프 필터(107)로부터 입력된 재구성 화상을 프레임 단위로 기억한다.
움직임 보상 예측부(109)는, 프레임 메모리(108)에 기억된 하나 또는 복수의 재구성 화상을 참조 화상으로서 이용하는 인터 예측을 행한다. 구체적으로는 움직임 보상 예측부(109)는, 블록 매칭 등의 수법에 의해 움직임 벡터를 산출하고, 움직임 벡터에 기초하여 움직임 보상 예측 화상을 생성하여, 움직임 보상 예측 화상을 전환부(110)에 출력한다. 또한, 움직임 보상 예측부(109)는 움직임 벡터에 관한 정보를 엔트로피 부호화부(103)에 출력한다.
전환부(110)는, 인트라 예측부(106)로부터 입력된 인트라 예측 화상과, 움직임 보상 예측부(109)로부터 입력된 움직임 보상 예측 화상을 전환하여, 예측 화상(인트라 예측 화상 또는 움직임 보상 예측 화상)을 감산부(101) 및 합성부(105)에 출력한다.
평가부(111)는, 움직임 보상 예측부(109)가 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하는 경우에 있어서, 예측에 이용하는 복수의 참조 화상 사이의 유사도를 하나 또는 복수의 화소로 이루어지는 화상 부분마다 산출하고, 이러한 유사도에 의해 예측 화상의 예측 정밀도를 화상 부분마다 평가하여, 평가 결과의 정보를 합성부(105)에 출력한다.
본 실시형태에 있어서, 평가부(111)가, 예측에 이용하는 복수의 참조 화상 사이의 유사도를 1 화소 단위로 산출하고, 예측 화상의 예측 정밀도를 1 화소 단위로 평가하는 일례를 설명한다. 또한, 본 실시형태에서는 도시하지 않지만, 복수의 참조 화상을 이용한 인트라 예측(예컨대 인트라 블록 카피 모드) 등을 이용하는 경우에는, 평가부(111)는, 인트라 예측부(106)가 복수의 참조 화상을 이용하여 예측을 행하는 경우, 복수의 참조 화상 사이의 유사도를 산출하고, 예측 화상의 예측 정밀도를 화소 단위로 평가하여, 이 평가 결과를 합성부(105)에 출력한다. 합성부(105)는, 평가부(111)에 의한 평가 결과에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 제어한다. 평가부(111) 및 합성부(105)의 상세한 점에 관해서는 후술한다.
(1.2. 화상 복호 장치의 구성)
도 2는 제1 실시형태에 따른 화상 복호 장치(2)의 구성을 도시하는 도면이다. 도 2에 도시하는 것과 같이, 화상 복호 장치(2)는 엔트로피 부호 복호부(200)와 역양자화부(201a)와 역변환부(201b)와 합성부(202)와 인트라 예측부(203)와 루프 필터(204)와 프레임 메모리(205)와 움직임 보상 예측부(206)와 전환부(207)와 평가부(208)를 구비한다.
엔트로피 부호 복호부(200)는, 부호화 장치(1)에 의해 생성된 부호화 데이터를 복호하여, 양자화 변환 계수를 역양자화부(201a)에 출력한다. 또한, 엔트로피 부호 복호부(200)는, 부호화 데이터를 복호하고, 예측(인트라 예측 및 움직임 보상 예측)에 관한 정보와 필터 처리에 관한 정보를 취득하여, 예측에 관한 정보를 인트라 예측부(203) 및 움직임 보상 예측부(206)에 출력하고, 필터 처리에 관한 정보를 루프 필터(204)에 출력한다.
역양자화부(201a) 및 역변환부(201b)는 블록 단위로 역양자화 처리 및 역직교 변환 처리를 행하는 역양자화 · 역변환부(201)를 구성한다.
역양자화부(201a)는, 화상 부호화 장치(1)의 양자화부(102b)가 행하는 양자화 처리에 대응하는 역양자화 처리를 행한다. 역양자화부(201a)는, 엔트로피 부호 복호부(200)로부터 입력된 양자화 변환 계수를, 양자화 파라미터(Qp) 및 양자화 행렬을 이용하여 역양자화함으로써 변환 계수를 복원하고, 복원한 변환 계수를 역변환부(201b)에 출력한다.
역변환부(201b)는, 화상 부호화 장치(1)의 변환부(102a)가 행하는 직교 변환 처리에 대응하는 역직교 변환 처리를 행한다. 역변환부(201b)는, 역양자화부(201a)로부터 입력된 변환 계수에 대하여 역직교 변환을 행하여 예측 잔차를 복원하고, 복원한 예측 잔차(복원 예측 잔차)를 합성부(202)에 출력한다.
합성부(202)는, 역변환부(201b)로부터 입력된 예측 잔차와 전환부(207)로부터 입력된 예측 화상을 화소 단위로 합성함으로써, 원래의 대상 화상 블록을 재구성하여, 재구성 화상을 인트라 예측부(203) 및 루프 필터(204)에 출력한다.
인트라 예측부(203)는, 합성부(202)로부터 입력된 재구성 부호화 블록 화상을 참조하여, 엔트로피 부호 복호부(200)로부터 입력된 인트라 예측 정보에 따라서 인트라 예측을 행함으로써 인트라 예측 화상을 생성하여, 인트라 예측 화상을 전환부(207)에 출력한다.
루프 필터(204)는, 엔트로피 부호 복호부(200)로부터 입력된 필터 처리 정보에 기초하여, 합성부(202)로부터 입력된 재구성 화상에 대하여, 화상 부호화 장치(1)의 루프 필터(107)가 행하는 필터 처리와 같은 식의 필터 처리를 행하고, 필터 처리 후의 재구성 화상을 프레임 메모리(205)에 출력한다.
프레임 메모리(205)는 루프 필터(204)로부터 입력된 재구성 화상을 프레임 단위로 기억한다. 프레임 메모리(205)는 기억한 재구성 화상을 표시 순으로 화상 복호 장치(2)의 외부로 출력한다.
움직임 보상 예측부(206)는, 프레임 메모리(205)에 기억된 하나 또는 복수의 재구성 화상을 참조 화상으로서 이용하여, 엔트로피 부호 복호부(200)로부터 입력된 움직임 벡터 정보에 따라서 움직임 보상 예측(인터예측)을 행함으로써 움직임 보상 예측 화상을 생성하여, 움직임 보상 예측 화상을 전환부(207)에 출력한다.
전환부(207)는, 인트라 예측부(203)로부터 입력된 인트라 예측 화상과, 움직임 보상 예측부(206)로부터 입력된 움직임 보상 예측 화상을 전환하여, 예측 화상(인트라 예측 화상 또는 움직임 보상 예측 화상)을 합성부(202)에 출력한다.
평가부(208)는 화상 부호화 장치(1)의 평가부(111)와 같은 식의 동작을 행한다. 구체적으로는 평가부(208)는, 움직임 보상 예측부(206)가 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하는 경우에 있어서, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가하여, 평가 결과의 정보를 합성부(202)에 출력한다. 합성부(202)는, 평가부(208)에 의한 평가 결과에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 제어한다.
(1.3. 움직임 보상 예측)
도 3은 움직임 보상 예측의 일례를 도시하는 도면이다. 도 4는 움직임 보상 예측에 의해 생성되는 예측 화상의 일례를 도시하는 도면이다. 움직임 보상 예측의 심플한 예로서, HEVC에서 이용되고 있는 쌍예측, 특히 전방향과 후방향 예측(양방향 예측)을 이용하는 경우에 관해서 설명한다.
도 3에 도시하는 것과 같이, 움직임 보상 예측은, 대상 프레임(현재 프레임)에 대하여 시간적으로 전 및 후의 프레임을 참조한다. 도 3의 예에서는, t번째 프레임의 화상 중의 블록의 움직임 보상 예측을, t-1번째 프레임과 t+1번째 프레임을 참조하여 행한다. 움직임 보상은, t-1 및 t+1번째 프레임의 참조 프레임 내에서, 대상 화상 블록과 유사한 부위(블록)를 시스템에서 설정된 탐색 범위 중에서 검출한다.
검출된 부위가 참조 화상이다. 대상 화상 블록에 대한 참조 화상의 상대 위치를 나타내는 정보가 도면 중에 도시하는 화살표이며, 움직임 벡터라고 불린다. 움직임 벡터의 정보는, 화상 부호화 장치(1)에 있어서, 참조 화상의 프레임 정보와 함께 엔트로피 부호화에 의해 부호화된다. 한편, 화상 복호 장치(2)는 화상 부호화 장치(1)에 의해 생성된 움직임 벡터의 정보에 기초하여 참조 화상을 검출한다.
도 3 및 도 4에 도시하는 것과 같이, 움직임 보상에 의해서 검출된 참조 화상 1 및 2는, 대상 화상 블록에 대하여, 참조하는 프레임 내에서 위치가 맞춰진 유사한 부분 화상이기 때문에, 대상 화상 블록(부호화 대상 화상)과 유사한 화상으로 된다. 도 4의 예에서는, 대상 화상 블록은 별 모양과 부분적인 원 모양을 포함하고 있다. 참조 화상 1은 별 모양과 전체적인 원 모양을 포함하고 있다. 참조 화상 2는 별 모양을 포함하지만, 원 모양을 포함하고 있지 않다.
이러한 참조 화상 1 및 2로부터 예측 화상을 생성한다. 또한, 예측 처리는, 일반적으로 특징은 다르지만 부분적으로 유사한 참조 화상 1 및 2를 평균화함으로써, 각각의 참조 화상의 특징을 갖춘 예측 화상을 생성한다. 단, 보다 고도의 처리, 예컨대 로우 패스 필터나 하이 패스 필터 등에 의한 신호 강조 처리를 병용하여 예측 화상을 생성하여도 좋다. 여기서, 참조 화상 1은 원 모양을 포함하고, 참조 화상 2는 원 모양을 포함하지 않기 때문에, 참조 화상 1 및 2를 평균화하여 예측 화상을 생성하면, 예측 화상에 있어서의 원 모양은 참조 화상 1과 비교하여 신호가 반감하고 있다.
참조 화상 1 및 2로부터 얻어진 예측 화상과 대상 화상 블록(부호화 대상 화상)의 차분이 예측 잔차이다. 도 4에 도시하는 예측 잔차에 있어서, 별 모양의 엣지의 어긋난 부분과 동그라미 모양의 어긋난 부분(사선부)에만 큰 차분이 생기고 있지만, 그 이외의 부분에 관해서는 정밀도 좋게 예측을 행할 수 있으며, 차분이 적어진다(도 4의 예에서는 차분이 생기지 않았다).
차분이 생기지 않은 부분(별 모양의 비(非)엣지 부분 및 배경 부분)은, 참조 화상 1과 참조 화상 2 사이의 유사도가 높은 부분이고, 고정밀도의 예측이 이루어진 부분이다. 한편, 큰 차분이 생긴 부분은, 각 참조 화상에 특유의 부분, 즉, 참조 화상 1과 참조 화상 2 사이의 유사도가 현저히 낮은 부분이다. 이로써, 참조 화상 1과 참조 화상 2 사이의 유사도가 현저히 낮은 부분은, 예측의 정밀도가 낮고, 큰 차분(잔차)을 생기게 하는 것을 알 수 있다.
이와 같이 차분이 큰 부분과 차분이 없는 부분이 혼재한 예측 잔차를 직교 변환하여, 양자화에 의한 변환 계수의 열화가 생기면, 이러한 변환 계수의 열화가 역양자화 및 역직교 변환을 거쳐 화상(블록) 내에 전체적으로 전파된다.
그리고, 역양자화 및 역직교 변환에 의해서 복원된 예측 잔차(복원 예측 잔차)를 예측 화상에 합성하여 대상 화상 블록을 재구성하면, 도 4에 도시하는 별 모양의 비엣지 부분 및 배경 부분과 같이 고정밀도의 예측이 이루어진 부분에도 화질의 열화가 전파되어 버린다.
(1.4. 평가부 및 합성부)
화상 부호화 장치(1)에 있어서, 평가부(111)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가한다. 그리고, 합성부(105)는, 평가부(111)에 의한 평가 결과에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 제어한다.
마찬가지로, 화상 복호 장치(2)에 있어서, 평가부(208)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가한다. 그리고, 합성부(202)는, 평가부(208)에 의한 평가 결과에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 제어한다.
이에 따라, 고정밀도의 예측이 이루어지는 부분에 관해서, 예측 화상과 합성하는 복원 예측 잔차를 억제하는 것이 가능하게 되기 때문에, 고정밀도의 예측이 이루어지는 부분에 대하여 복원 예측 잔차에 있어서의 화질의 열화가 전파되는 것을 억제할 수 있다. 이로써, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하는 경우에 있어서 화질을 향상시켜, 부호화 효율을 개선할 수 있다.
도 5는 화상 부호화 장치(1)에 있어서의 평가부(111)의 구성의 일례를 도시하는 도면이다. 도 5에 도시하는 것과 같이, 평가부(111)는 차분 산출부(감산부)(111a)와 정규화부(111b)와 무게 조정부(111c)를 구비한다.
차분 산출부(111a)는, 참조 화상 1과 참조 화상 2 사이의 차분치의 절대치를 화소 단위로 산출하고, 산출한 차분치의 절대치를 정규화부(111b)에 출력한다. 차분치의 절대치는 유사도를 나타내는 값의 일례이다. 차분치의 절대치가 작을수록 유사도가 높고, 차분치의 절대치가 클수록 유사도가 낮다고 말할 수 있다. 차분 산출부(111a)는, 각 참조 화상에 대하여 필터 처리를 행한 뒤에 차분치의 절대치를 산출하여도 좋다. 차분 산출부(111a)는, 제곱오차 등의 통계량을 산출하여, 이러한 통계량을 유사도로서 이용하여도 좋다.
정규화부(111b)는, 차분 산출부(111a)로부터 입력된 각 화소의 차분치를, 블록 내에서 차분치의 절대치가 최대가 되는 화소의 차분치의 절대치(즉, 블록 내의 차분치의 절대치의 최대치)로 정규화하고, 정규화한 차분치의 절대치인 정규화 차분치를 무게 조정부(111c)에 출력한다. 제1 실시형태에 있어서, 정규화 차분치는, 합성부(105)에 있어서 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 가중(weighting)하기 위한 무게로서 이용된다.
무게 조정부(111c)는, 양자화의 거칠기를 정하는 양자화 파라미터(Qp)에 기초하여, 정규화부(111b)로부터 입력된 정규화 차분치(무게)를 조정하여, 이 무게를 출력한다. 양자화의 거칠기가 클수록 복원 예측 잔차의 열화도가 높기 때문에, 무게 조정부(111c)는, 양자화 파라미터(Qp)에 기초하여 정규화 차분치(무게)를 조정함으로써, 열화도를 고려하여 복원 예측 잔차의 가중을 행할 수 있다.
평가부(111)가 출력하는 각 화소(ij)의 무게 Wij는 예컨대 하기의 식 (1)과같이 표현할 수 있다.
Wij=(abs(Xij-Yij)/maxD×Scale(Qp)) ···(1)
식 (1)에 있어서, Xij는 참조 화상 1의 화소 ij의 화소치이고, Yij는 참조 화상 2의 화소 ij의 화소치이고, abs는 절대치를 얻는 함수이다. 도 5에 도시하는 차분 산출부(111a)에서는 abs(Xij-Yij)를 출력한다.
또한, 식 (1)에 있어서, maxD는 블록 내의 차분치 abs(Xij-Yij)의 최대치이다. maxD를 구하기 위해서, 블록 내의 모든 화소에 관해서 차분치를 구할 필요가 있지만, 이 처리를 생략하기 위해서 이미 부호화 처리 완료된 인접하는 블록의 최대치 등으로 대용하여도 좋으며, 예컨대 그 값 이상이 존재하는 경우는, 사용한 최대치로 클립함으로써 maxD의 정규화를 행하여도 좋다. 혹은 양자화 파라미터(Qp)와 maxD의 대응 관계를 정하는 테이블을 이용하여, 양자화 파라미터(Qp)로부터 maxD를 구하여도 좋다. 혹은 미리 사양으로 규정된 고정치를 maxD로서 이용하여도 좋다. 정규화부(111b)는 abs(Xij-Yij)/maxD를 출력한다.
또한, 식 (1)에 있어서, Scale(Qp)는 양자화 파라미터(Qp)에 따라서 곱해지는 계수이다. Scale(Qp)는, Qp가 큰 경우에 1.0에 근접하고, 작은 경우에 0에 근접하도록 설계되며, 그 정도는 시스템에 의해 조정하는 것으로 한다. 혹은 미리 사양으로 규정된 고정치를 Scale(Qp)로서 이용하여도 좋다. 또한, 처리를 간략화하기 위해서, Scale(QP)를 1.0 등 시스템에 따라서 설계된 고정치로 하여도 좋다.
무게 조정부(111c)는 abs(Xij-Yij)/maxD×Scale(Qp)를 무게 Wij로서 출력한다. 또한, 이 Wij는, 시스템에 따라서 설계되는 감도 함수에 의해서 조정된 가중을 출력하여도 좋다. 예컨대 abs(Xij-Yij)/maxD×Scale(Qp)=wij로 하고, Wij=Clip(wij, 1.0,0.0)뿐만 아니라, Wij=Clip(wij+offset, 1.0,0.0)와 예컨대 QP 등의 제어 정보에 따른 오프셋을 붙여 감도를 조정하여도 좋다. 또한, Clip(x, max, min)는, x가 max를 넘는 경우는 max로, x가 min을 밑도는 경우는 min으로 클립하는 처리를 나타낸다.
이와 같이 하여 산출된 무게 Wij는 0부터 1.0까지 범위 내의 값으로 된다. 기본적으로는 무게 Wij는, 참조 화상 사이의 화소 ij의 차분치의 절대치가 큰(즉, 예측 정밀도가 낮은) 경우에 1.0에 근접하고, 참조 화상 사이의 화소 ij의 차분치의 절대치가 작은(즉, 예측 정밀도가 높다) 경우에 0에 근접한다. 평가부(111)는, 블록 내의 각 화소 ij의 무게 Wij로 이루어지는 맵 정보를 블록 단위로 합성부(105)에 출력한다.
또한, 평가부(111)는, 복수의 참조 화상을 이용하는 움직임 보상 예측을 적용하는 경우에만 평가(무게 Wij의 산출)를 행하고, 그 이외의 모드, 예컨대 단방향 예측이나 복수 참조 화상을 이용하지 않는 인트라 예측 처리에서는, 평가를 하지 않고 무게 Wij로서 일률적으로 1.0을 설정한다.
도 6은 화상 부호화 장치(1)에 있어서의 합성부(105)의 구성의 일례를 도시하는 도면이다. 도 6에 도시하는 것과 같이, 합성부(105)는 가중부(곱셈부)(105a)와 가산부(105b)를 구비한다.
가중부(105a)는, 평가부(111)로부터 입력된 맵 정보(무게 Wij)를 이용하여, 역변환부(104b)로부터 입력된 복원 예측 잔차에 대하여 화소 단위로 가중을 행하고, 가중 후의 복원 예측 잔차를 가산부(105b)에 출력한다.
가산부(105b)는, 가중부(105a)로부터 입력된 가중 후의 복원 예측 잔차를, 움직임 보상 예측부(109)로부터 전환부(110)를 통해 입력된 예측 화상에 화소 단위로 가산함으로써 재구성 화상을 생성하여, 생성한 재구성 화상을 출력한다.
이러한 합성부(105)의 처리는 예컨대 하기의 식 (2)와 같이 표현할 수 있다.
Recij=Dij×Wij+ Pij···(2)
식 (2)에 있어서, Recij는 재구성 화상에 있어서의 화소 ij의 화소치이고, Dij는 복원 예측 잔차에 있어서의 화소 ij의 화소치이고, Wij는 맵 정보에 있어서의 화소 ij의 무게이고, Pij는 예측 화상에 있어서의 화소 ij의 화소치이다.
또한, 합성부(105)는, 복수의 참조 화상을 이용하는 움직임 보상 예측을 적용하는 경우에만 가중 처리를 행하고, 그 이외의 모드, 예컨대 단방향 예측이나 인트라 예측 처리에서는 가중 처리를 행하지 않는다.
또한, 화상 부호화 장치(1)에 있어서의 평가부(111) 및 합성부(105)에 관해서 설명했지만, 화상 복호 장치(2)에 있어서의 평가부(208) 및 합성부(202)는, 화상 부호화 장치(1)에 있어서의 평가부(111) 및 합성부(105)와 같은 식으로 구성된다. 구체적으로는 화상 복호 장치(2)에 있어서의 평가부(208)는 차분 산출부(208a)와 정규화부(208b)와 무게 조정부(208c)를 구비한다. 화상 복호 장치(2)에 있어서의 합성부(202)는 가중부(곱셈부)(202a)와 가산부(202b)를 구비한다.
(1.5. 화상 부호화의 동작)
도 7은 제1 실시형태에 따른 화상 부호화 장치(1)에 있어서의 처리 플로우를 도시하는 도면이다.
도 7에 도시하는 것과 같이, 단계 S1101에 있어서, 움직임 보상 예측부(109)는, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행함으로써 대상 화상 블록을 예측하여, 대상 화상 블록에 대응하는 예측 화상을 생성한다. 움직임 보상 예측 정보는, 엔트로피 부호화부(103)에서 부호화 데이터의 일부로서 부호화되고, 엔트로피 부호화부(103)는, 움직임 보상 예측 정보를 포함하는 부호화 데이터를 출력한다.
단계 S1102에 있어서, 평가부(111)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가하거나, 혹은 복수의 화소의 예측 정밀도를 평균화한 부분 화상 단위로 평가하여, 블록 내의 각 화소 혹은 부분 화상의 무게로 이루어지는 맵 정보를 생성한다.
단계 S1103에 있어서, 감산부(101)는, 대상 화상 블록과 예측 화상 사이의 화소 단위에서의 차분을 나타내는 예측 잔차를 산출한다.
단계 S1104에 있어서, 변환 · 양자화부(102)는, 감산부(101)가 산출한 예측 잔차에 대하여 직교 변환 및 양자화를 행함으로써, 양자화 변환 계수를 생성한다.
단계 S1105에 있어서, 엔트로피 부호화부(103)는, 양자화 변환 계수를 엔트로피 부호화하여 부호화 데이터를 출력한다.
단계 S1106에 있어서, 역양자화 · 역변환부(104)는, 양자화 변환 계수에 대하여 역양자화 및 역직교 변환을 행함으로써 예측 잔차를 복원하여, 복원 예측 잔차를 생성한다.
단계 S1107에 있어서, 합성부(105)는, 평가부(111)에 의한 평가 결과(맵 정보)에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 제어한다. 구체적으로는 합성부(105)는, 복원 예측 잔차에 대하여, 상술한 것과 같은 화소 단위에서의 가중 처리를 행한다.
단계 S1108에 있어서, 합성부(105)는, 가중 후의 복원 예측 잔차를 화소 단위로 예측 화상과 합성함으로써 대상 화상 블록을 재구성하여, 재구성 화상을 생성한다.
단계 S1109에 있어서, 루프 필터(107)는 재구성 화상에 대하여 필터 처리를 행한다. 또한, 루프 필터에 관한 정보(오프셋 및 오프셋을 적용하는 카테고리 정보 등)는, 엔트로피 부호화부(103)에서 부호화 데이터의 일부로서 부호화되고, 엔트로피 부호화부(103)는, 루프 필터에 관한 정보를 포함하는 부호화 데이터를 출력한다.
단계 S1110에 있어서, 프레임 메모리(108)는 필터 처리 후의 재구성 화상을 프레임 단위로 기억한다.
(1.6. 화상 복호의 동작)
도 8은 제1 실시형태에 따른 화상 복호 장치(2)에 있어서의 처리 플로우를 도시하는 도면이다.
도 8에 도시하는 것과 같이, 단계 S1201에 있어서, 엔트로피 부호 복호부(200)는, 부호화 데이터를 복호하여 양자화 변환 계수, 움직임 벡터 정보 및 루프 필터에 관한 정보를 취득한다.
단계 S1202에 있어서, 움직임 보상 예측부(206)는, 움직임 벡터 정보에 기초한 복수의 참조 화상을 이용하여 움직임 보상 예측을 행함으로써 대상 화상 블록을 예측하여, 대상 화상 블록에 대응하는 예측 화상을 생성한다.
단계 S1203에 있어서, 평가부(208)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가하여, 블록내의 각 화소 혹은 부분 화상의 무게로 이루어지는 맵 정보를 생성한다.
단계 S1204에 있어서, 역양자화 · 역변환부(201)는, 양자화 변환 계수에 대하여 역양자화 및 역직교 변환을 행함으로써 예측 잔차를 복원하여, 복원 예측 잔차를 생성한다.
단계 S1205에 있어서, 합성부(202)는, 평가부(208)에 의한 평가 결과(맵 정보)에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 제어한다. 구체적으로는 합성부(202)는, 복원 예측 잔차에 대하여, 상술한 것과 같은 화소 단위에서의 가중 처리를 행한다.
단계 S1206에 있어서, 합성부(202)는, 가중 후의 복원 예측 잔차를 화소 단위로 예측 화상과 합성함으로써 대상 화상 블록을 재구성하여, 재구성 화상을 생성한다.
단계 S1207에 있어서, 루프 필터(204)는 재구성 화상에 대하여 필터 처리를 행한다.
단계 S1208에 있어서, 프레임 메모리(205)는 필터 처리 후의 재구성 화상을 프레임 단위로 기억하여 출력한다.
(1.7. 제1 실시형태의 정리)
화상 부호화 장치(1)에 있어서, 평가부(111)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가한다. 그리고, 합성부(105)는, 평가부(111)에 의한 평가 결과에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 제어한다.
화상 복호 장치(2)에 있어서, 평가부(208)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가한다. 그리고, 합성부(202)는, 평가부(208)에 의한 평가 결과에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 화소 단위로 제어한다.
이에 따라, 고정밀도의 예측이 이루어지는 부분에 관해서, 예측 화상과 합성하는 복원 예측 잔차를 억제하는 것이 가능하게 되기 때문에, 고정밀도의 예측이 이루어지는 부분에 대하여 복원 예측 잔차에 있어서의 화질의 열화가 전파되는 것을 방지할 수 있다. 이로써, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하는 경우에 있어서 화질을 향상시켜, 부호화 효율을 개선할 수 있다.
<2. 제2 실시형태>
제2 실시형태에 따른 화상 부호화 장치 및 화상 복호 장치에 관해서 제1 실시형태와의 상이점을 주로 설명한다. 제1 실시형태에서는 예측 정밀도의 평가 결과를 신호 합성 처리에서 이용했지만, 제2 실시형태에서는 예측 정밀도의 평가 결과를 필터 처리에서 이용한다.
(2.1. 화상 부호화 장치)
도 9는 제2 실시형태에 따른 화상 부호화 장치(1)의 구성을 도시하는 도면이다. 도 9에 도시하는 것과 같이, 제2 실시형태에 있어서, 평가부(111)는 평가 결과(맵 정보)를 루프 필터(107)에 출력한다. 구체적으로는 평가부(111)는, 제1 실시형태와 마찬가지로, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가한다.
루프 필터(107)는, 평가부(111)에 의한 평가 결과에 기초하여, 필터 처리에 있어서의 필터 강도를 화소 단위로 제어한다. 그리고, 루프 필터(107)는, 화소 단위로 제어한 오프셋치를, 합성부(105)로부터 입력된 재구성 화상에 화소 단위로 가산함으로써 필터 처리(샘플 어댑티브 오프셋 처리)를 행하여, 필터 처리 후의 재구성 화상을 프레임 메모리(108)에 출력한다.
(2.2. 화상 복호 장치)
도 10은 제2 실시형태에 따른 화상 복호 장치(2)의 구성을 도시하는 도면이다. 도 10에 도시하는 것과 같이, 제2 실시형태에 있어서, 평가부(208)는 평가 결과(맵 정보)를 루프 필터(204)에 출력한다. 구체적으로는 평가부(208)는, 제1 실시형태와 마찬가지로, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가한다.
루프 필터(204)는, 평가부(208)에 의한 평가 결과에 기초하여, 필터 처리에 있어서의 필터 강도를 화소 단위로 제어한다. 그리고, 루프 필터(204)는, 화소 단위로 제어한 오프셋치를, 합성부(202)로부터 입력된 재구성 화상에 화소 단위로 가산함으로써 필터 처리(샘플 어댑티브 오프셋 처리)를 행하고, 필터 처리 후의 재구성 화상을 프레임 메모리(205)에 출력한다.
(2.3. 루프 필터)
도 11은 화상 부호화 장치(1)에 있어서의 루프 필터(107)의 구성의 일례를 도시하는 도면이다. 도 11에 도시하는 것과 같이, 루프 필터(107)는 가중부(곱셈부)(107a)와 가산부(107b)를 구비한다.
가중부(107a)는, 평가부(111)로부터 입력된 맵 정보(무게 Wij)를 이용하여, 필터 강도를 정하는 오프셋치에 대하여 화소 단위로 가중을 행한다. 필터 강도를 정하는 오프셋치로서는, 샘플 어댑티브 오프셋 처리(비특허문헌 1 참조)에서 이용하는 오프셋치를 이용할 수 있다. 상술한 것과 같이, 샘플 어댑티브 오프셋 처리에서는, 루프 필터(107)는, 블록 내의 화소의 인접 화소와의 상대적인 관계에 의해 각 화소를 카테고리 나누기를 하여, 각각의 카테고리에 관해서 화질을 향상시키기 위한 오프셋치를 산출한다. 가중부(107a)는, 샘플 어댑티브 오프셋 처리에 이용하는 오프셋치에 대하여 화소 단위로 가중을 행하고, 가중 후의 오프셋치를 가산부(107b)에 출력한다.
가산부(107b)는, 가중부(107a)로부터 입력된 가중 후의 오프셋치를, 합성부(105)로부터 입력된 재구성 화상에 화소 단위로 가산함으로써 필터 처리(샘플 어댑티브 오프셋 처리)를 행하고, 필터 처리 후의 재구성 화상을 출력한다.
이러한 루프 필터(107)의 처리는 예컨대 하기의 식 (3)과 같이 표현할 수 있다.
Recij'=Recij+dij×Wij···(3)
식 (3)에 있어서, Recij'는 필터 처리 후의 재구성 화상에 있어서의 화소 ij의 화소치이고, Recij는 필터 처리 전의 재구성 화상에 있어서의 화소 ij의 화소치이고, dij는 화소 ij에 부여되어야 하는 오프셋치이고, Wij는 맵 정보에 있어서의 화소 ij의 무게이다.
또한, 루프 필터(107)는, 복수의 참조 화상을 이용하는 움직임 보상 예측을 적용하는 경우에만 맵 정보에 기초한 가중 처리를 행하고, 그 이외의 모드, 예컨대 단방향 예측이나 인트라 예측 처리에서는 맵 정보에 기초한 가중 처리를 행하지 않는다.
또한, 화상 부호화 장치(1)에 있어서의 루프 필터(107)에 관해서 설명했지만, 화상 복호 장치(2)에 있어서의 루프 필터(204)는, 화상 부호화 장치(1)에 있어서의 루프 필터(107)와 같은 식으로 구성된다. 구체적으로는, 화상 복호 장치(2)에 있어서의 루프 필터(204)는 가중부(곱셈부)(204a)와 가산부(204b)를 구비한다.
(2.4. 화상 부호화의 동작)
도 12는 제2 실시형태에 따른 화상 부호화 장치(1)에 있어서의 처리 플로우를 도시하는 도면이다.
도 12에 도시하는 것과 같이, 단계 S2101에 있어서, 움직임 보상 예측부(109)는, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행함으로써 대상 화상 블록을 예측하여, 대상 화상 블록에 대응하는 예측 화상을 생성한다. 움직임 보상 예측 정보는 엔트로피 부호화부(103)에서 부호화 데이터의 일부로서 부호화되고, 엔트로피 부호화부(103)는 움직임 보상 예측 정보를 포함하는 부호화 데이터를 생성하여 출력한다.
단계 S2102에 있어서, 평가부(111)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가하여, 블록 내의 각 화소의 무게로 이루어지는 맵 정보를 생성한다.
단계 S2103에 있어서, 감산부(101)는, 대상 화상 블록과 예측 화상 사이의 화소 단위에서의 차분을 나타내는 예측 잔차를 산출한다.
단계 S2104에 있어서, 변환 · 양자화부(102)는, 감산부(101)가 산출한 예측 잔차에 대하여 직교 변환 및 양자화를 행함으로써, 양자화 변환 계수를 생성한다.
단계 S2105에 있어서, 엔트로피 부호화부(103)는 양자화 변환 계수를 엔트로피 부호화하여 부호화 데이터를 출력한다.
단계 S2106에 있어서, 역양자화 · 역변환부(104)는, 양자화 변환 계수에 대하여 역양자화 및 역직교 변환을 행함으로써 예측 잔차를 복원하여, 복원 예측 잔차를 생성한다.
단계 S2107에 있어서, 합성부(105)는, 복원 예측 잔차를 화소 단위로 예측 화상과 합성함으로써 대상 화상 블록을 재구성하여, 재구성 화상을 생성한다.
단계 S2108에 있어서, 루프 필터(107)는, 평가부(111)에 의한 평가 결과(맵 정보)에 기초하여, 필터 처리에 있어서의 필터 강도를 화소 단위로 제어한다. 구체적으로는 루프 필터(107)는, 상술한 것과 같이, 필터 강도를 정하는 오프셋치에 대하여 화소 단위로 가중을 행한다. 또한, 루프 필터에 관한 정보(오프셋 및 오프셋을 제공하는 카테고리 정보 등)는, 엔트로피 부호화부(103)에서 부호화 데이터의 일부로서 부호화되고, 엔트로피 부호화부(103)는 루프 필터에 관한 정보를 포함하는 부호화 데이터를 출력한다.
단계 S2109에 있어서, 루프 필터(107)는, 가중 후의 오프셋치를 재구성 화상에 화소 단위로 가산함으로써 필터 처리(샘플 어댑티브 오프셋 처리)를 행하여, 필터 처리 후의 재구성 화상을 출력한다.
단계 S2110에 있어서, 프레임 메모리(108)는 필터 처리 후의 재구성 화상을 프레임 단위로 기억한다.
(2.5. 화상 복호의 동작)
도 13은 제2 실시형태에 따른 화상 복호 장치(2)에 있어서의 처리 플로우를 도시하는 도면이다.
도 13에 도시하는 것과 같이, 단계 S2201에 있어서, 엔트로피 부호 복호부(200)는, 부호화 데이터를 복호하여 양자화 변환 계수, 움직임 벡터 정보 및 루프 필터에 관한 정보를 취득한다.
단계 S2202에 있어서, 움직임 보상 예측부(206)는, 움직임 벡터 정보에 기초한 복수의 참조 화상을 이용하여 움직임 보상 예측을 행함으로써 대상 화상 블록을 예측하여, 대상 화상 블록에 대응하는 예측 화상을 생성한다.
단계 S2203에 있어서, 평가부(208)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가하여, 블록내의 각 화소의 무게로 이루어지는 맵 정보를 생성한다.
단계 S2204에 있어서, 역양자화 · 역변환부(201)는, 양자화 변환 계수에 대하여 역양자화 및 역직교 변환을 행함으로써 예측 잔차를 복원하여, 복원 예측 잔차를 생성한다.
단계 S2205에 있어서, 합성부(202)는, 복원 예측 잔차를 화소 단위로 예측 화상과 합성함으로써 대상 화상 블록을 재구성하여, 재구성 화상을 생성한다.
단계 S2206에 있어서, 루프 필터(204)는, 평가부(208)에 의한 평가 결과(맵 정보)에 기초하여, 필터 처리에 있어서의 필터 강도를 화소 단위로 제어한다. 구체적으로는 루프 필터(204)는, 상술한 것과 같이, 필터 강도를 정하는 오프셋치에 대하여 화소 단위로 가중을 행한다.
단계 S2207에 있어서, 루프 필터(204)는, 가중 후의 오프셋치를 재구성 화상에 화소 단위로 가산함으로써 필터 처리(샘플 어댑티브 오프셋 처리)를 행하여, 필터 처리 후의 재구성 화상을 출력한다.
단계 S2208에 있어서, 프레임 메모리(205)는 필터 처리 후의 재구성 화상을 프레임 단위로 기억하여 출력한다.
(2.6. 제2 실시형태의 정리)
화상 부호화 장치(1)에 있어서, 평가부(111)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가한다. 그리고, 루프 필터(107)는, 평가부(111)에 의한 평가 결과에 기초하여, 필터 처리에 있어서의 필터 강도를 화소 단위로 제어한다.
화상 복호 장치(2)에 있어서, 평가부(208)는, 복수의 참조 화상 사이의 유사도를 화소 단위로 산출함으로써, 예측 화상의 예측 정밀도를 화소 단위로 평가한다. 그리고, 루프 필터(204)는, 평가부(208)에 의한 평가 결과에 기초하여, 필터 처리에 있어서의 필터 강도를 화소 단위로 제어한다.
이에 따라, 고정밀도의 예측이 이루어지는 부분에 관해서, 필터 강도를 약하게 하여, 필터 처리가 걸리기 어렵게 하는 것이 가능하게 된다. 또한, 고정밀도의 예측이 이루어지지 않는 부분에 관해서, 필터 강도를 강화하여, 필터 처리가 걸리기 쉽게 하는 것이 가능하게 된다. 이로써, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하는 경우에 있어서 화질을 향상시켜, 부호화 효율을 개선할 수 있다.
<3. 제1 및 제2 실시형태의 변경예>
상술한 제1 실시형태 및 제2 실시형태에 있어서, 평가부(111)가, 예측에 이용하는 복수의 참조 화상 사이의 유사도를 1 화소마다 산출하여 예측 화상의 예측 정밀도를 1 화소마다 평가하는 일례를 설명했다. 또한, 상술한 제1 실시형태에 있어서, 합성부(105)가, 평가부(111)에 의한 평가 결과에 기초하여, 예측 화상과 합성하는 복원 예측 잔차를 1 화소마다 제어하는 일례를 설명했다. 또한, 상술한 제2 실시형태에 있어서, 루프 필터(107)가, 평가부(111)에 의한 평가 결과에 기초하여, 필터 처리에 있어서의 필터 강도를 1 화소마다 제어하는 일례를 설명했다.
그러나, 이러한 1 화소 단위로 처리하는 대신에, 복수의 화소로 이루어지는 그룹(서브블록) 단위에서의 처리를 이용하여도 좋다. 본 변경예에 있어서, 대상 화상 블록을 N개의 서브블록으로 분할한다(N: 2 이상의 정수). 여기서, 각 서브블록은 m×n 화소로 이루어지고, m 및 n 중 적어도 한쪽은 2 이상의 정수이다. 평가부(111)는, 상술한 실시형태의 방법에 의해서 각 화소(ij)의 무게 Wij를 산출한 후, k번째의 서브블록마다 무게 Wij의 평균치 Wk를 산출한다(단, 0≤k≤N).
그리고, 상술한 제1 실시형태에서는, 평가부(111)는, 서브블록마다 산출한 무게 평균치 Wk를 합성부(105)에 출력한다. 합성부(105)는, 무게 평균치 Wk를 이용하여, 예측 화상과 합성하는 복원 예측 잔차를 서브블록마다 제어한다. 구체적으로는 합성부(105)는, 평가부(111)로부터 입력된 무게 평균치 Wk를 이용하여, 역변환부(104b)로부터 입력된 복원 예측 잔차에 대하여 서브블록 단위로 가중을 행하고, 가중 후의 복원 예측 잔차를 예측 화상에 화소 단위로 가산함으로써 재구성 화상을 생성한다. 또한, 화상 복호 장치(2)에서도 동일한 처리를 행한다.
상술한 제2 실시형태에서는, 평가부(111)는 서브블록마다 산출한 무게 평균치 Wk를 루프 필터(107)에 출력한다. 루프 필터(107)는 무게 평균치 Wk를 이용하여 필터 처리에 있어서의 필터 강도를 서브블록마다 제어한다. 구체적으로는 루프 필터(107)는, 샘플 어댑티브 오프셋 처리에 이용하는 오프셋치에 대하여 서브블록 단위로 가중을 행하여, 가중 후의 오프셋치를 재구성 화상에 화소 단위로 가산함으로써 필터 처리(샘플 어댑티브 오프셋 처리)를 행한다. 또한, 화상 복호 장치(2)에서도 동일한 처리를 행한다.
<3. 제3 실시형태>
(3.1. 화상 부호화 장치의 구성)
도 16은 제3 실시형태에 따른 화상 부호화 장치(1)의 구성을 도시하는 도면이다. 도 16에 도시하는 것과 같이, 화상 부호화 장치(1)는 블록 분할부(100)와 감산부(101)와 변환부(102a)와 양자화부(102b)와 엔트로피 부호화부(103)와 역양자화부(104a)와 역변환부(104b)와 합성부(105)와 인트라 예측부(106)와 루프 필터(107)와 프레임 메모리(108)와 움직임 보상 예측부(109)와 전환부(110)와 평가부(111)를 구비한다.
블록 분할부(100)는, 프레임(혹은 픽쳐) 단위의 입력 화상을 블록형의 소영역으로 분할하여, 화상 블록을 감산부(101)(및 움직임 보상 예측부(109))에 출력한다. 화상 블록의 사이즈는 예컨대 32×32 화소, 16×16 화소, 8×8 화소 또는 4×4 화소 등이다. 화상 블록은, 화상 부호화 장치(1)가 부호화를 행하는 단위 및 화상 복호 장치(2)가 복호를 행하는 단위이며, 이러한 화상 블록을 대상 화상 블록이라고 부른다.
감산부(101)는, 블록 분할부(100)로부터 입력된 대상 화상 블록과 대상 화상 블록에 대응하는 예측 화상(예측 화상 블록) 사이의 화소 단위에서의 차분을 나타내는 예측 잔차를 산출한다. 구체적으로는 감산부(101)는, 부호화 대상 블록의 각 화소치로부터 예측 화상의 각 화소치를 감산함으로써 예측 잔차를 산출하고, 산출한 예측 잔차를 변환부(102a)에 출력한다. 또한, 예측 화상은 후술하는 인트라 예측부(106) 또는 움직임 보상 예측부(109)로부터 전환부(110)를 통해 감산부(101)에 입력된다.
변환부(102a) 및 양자화부(102b)는 블록 단위로 직교 변환 처리 및 양자화 처리를 행하는 변환 · 양자화부(102)를 구성한다.
변환부(102a)는, 감산부(101)로부터 입력된 예측 잔차에 대하여 직교 변환을 행하여 주파수 성분마다 변환 계수를 산출하고, 산출한 변환 계수를 양자화부(102b)에 출력한다. 직교 변환이란, 예컨대 이산 코사인 변환(DCT: Discrete Cosine Transform)이나 이산 사인 변환(DST: Discrete Sine Transform), 칼루넨레이브 변환(KLT: Karhunen-Loeve Transform) 등을 말한다. 직교 변환은 화소 영역의 잔차 신호를 주파수 영역으로 변환하는 처리이다.
양자화부(102b)는, 변환부(102a)로부터 입력된 변환 계수를 양자화 파라미터(Qp) 및 양자화 행렬을 이용하여 양자화하여, 양자화된 변환 계수(양자화 변환 계수)를 생성한다. 양자화 파라미터(Qp)는, 블록 내의 각 변환 계수에 대하여 공통적으로 적용되는 파라미터이며, 양자화의 거칠기를 정하는 파라미터이다. 양자화 행렬은, 각 변환 계수를 양자화할 때의 양자화치를 요소로서 갖는 행렬이다. 양자화부(102b)는, 양자화 제어 정보, 생성한 양자화 변환 계수 정보 등을 엔트로피 부호화부(103) 및 역양자화부(104a)에 출력한다.
엔트로피 부호화부(103)는, 양자화부(102b)로부터 입력된 양자화 변환 계수에 대하여 엔트로피 부호화를 행하고, 데이터 압축을 행하여 부호화 데이터(비트 스트림)를 생성하여, 부호화 데이터를 화상 부호화 장치(1)의 외부로 출력한다. 엔트로피 부호화에는 허프만 부호나 CABAC(Context-based Adaptive Binary Arithmetic Coding; 콘텍스트 적응형 2치 산술 부호) 등을 이용할 수 있다. 엔트로피 부호화는, 2차원으로 배열된 변환 계수를 소정의 스캔 순으로 판독하여 1차원의 변환 계수열로 변환하는 시리얼라이즈(serialize)라는 처리를 포함한다. 여기서, 소정의 스캔 순으로 최후의 유의 계수(제로가 아닌 계수)를 종료 위치로 하여, 이 종료 위치까지의 변환 계수를 효율적으로 부호화하고 있다.
또한, 엔트로피 부호화부(103)에는, 인트라 예측부(106) 및 움직임 보상 예측부(109)로부터 예측에 관한 정보가 입력되고, 루프 필터(107)로부터 필터 처리에 관한 정보가 입력된다. 엔트로피 부호화부(103)는 이들 정보의 엔트로피 부호화도 행한다.
역양자화부(104a) 및 역변환부(104b)는 블록 단위로 역양자화 처리 및 역직교 변환 처리를 행하는 역양자화 · 역변환부(104)를 구성한다.
역양자화부(104a)는 양자화부(102b)가 행하는 양자화 처리에 대응하는 역양자화 처리를 행한다. 구체적으로는 역양자화부(104a)는, 양자화부(102b)로부터 입력된 양자화 변환 계수를, 양자화 파라미터(Qp) 및 양자화 행렬을 이용하여 역양자화함으로써 변환 계수를 복원하고, 복원한 변환 계수를 역변환부(104b)에 출력한다.
역변환부(104b)는 변환부(102a)가 행하는 직교 변환 처리에 대응하는 역직교 변환 처리를 행한다. 예컨대 변환부(102a)가 이산 코사인 변환을 행한 경우에는, 역변환부(104b)는 역이산 코사인 변환을 행한다. 역변환부(104b)는, 역양자화부(104a)로부터 입력된 변환 계수에 대하여 역직교 변환을 행하여 예측 잔차를 복원하고, 복원한 예측 잔차인 복원 예측 잔차를 합성부(105)에 출력한다.
합성부(105)는, 역변환부(104b)로부터 입력된 복원 예측 잔차를 전환부(110)로부터 입력된 예측 화상과 화소 단위로 합성한다. 합성부(105)는, 복원 예측 잔차의 각 화소치와 예측 화상의 각 화소치를 가산하여 대상 화상 블록을 재구성하고, 재구성한 대상 화상 블록인 재구성 화상을 인트라 예측부(106) 및 루프 필터(107)에 출력한다.
인트라 예측부(106)는, 합성부(105)로부터 입력된 재구성 화상을 이용하여 인트라 예측을 행하여 인트라 예측 화상을 생성하고, 인트라 예측 화상을 전환부(110)에 출력한다. 또한, 인트라 예측부(106)는 선택한 인트라 예측 모드의 정보 등을 엔트로피 부호화부(103)에 출력한다.
루프 필터(107)는, 합성부(105)로부터 입력된 재구성 화상에 대하여, 후처리로서의 필터 처리를 행하여, 필터 처리 후의 재구성 화상을 프레임 메모리(108)에 출력한다. 또한, 루프 필터(107)는 필터 처리에 관한 정보를 엔트로피 부호화부(103)에 출력한다. HEVC 규격에 있어서, 필터 처리에는 디블록킹 필터 처리와 샘플 어댑티브 오프셋 처리가 포함된다.
프레임 메모리(108)는 루프 필터(107)로부터 입력된 재구성 화상을 프레임 단위로 기억한다.
움직임 보상 예측부(109)는, 프레임 메모리(108)에 기억된 하나 또는 복수의 재구성 화상을 참조 화상으로서 이용하는 인터 예측을 행한다. 구체적으로는 움직임 보상 예측부(109)는, 블록 매칭 등의 수법에 의해 움직임 벡터를 산출하고, 움직임 벡터에 기초하여 움직임 보상 예측 화상을 생성하여, 움직임 보상 예측 화상을 전환부(110)에 출력한다. 또한, 움직임 보상 예측부(109)는 움직임 벡터에 관한 정보를 엔트로피 부호화부(103)에 출력한다.
전환부(110)는, 인트라 예측부(106)로부터 입력된 인트라 예측 화상과 움직임 보상 예측부(109)로부터 입력된 움직임 보상 예측 화상을 전환하여, 예측 화상(인트라 예측 화상또는 움직임 보상 예측 화상)을 감산부(101) 및 합성부(105)에 출력한다.
평가부(111)는, 움직임 보상 예측부(109)가 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하는 경우에 있어서, 복수의 참조 화상 사이의 유사도를 주파수 성분마다 평가하여, 평가 결과의 정보를 엔트로피 부호화부(103)에 출력한다. 본 실시예형태에서는 도시하지 않지만, 복수의 참조 화상을 이용한 인트라 예측(예컨대 인트라 블록 카피 모드) 등을 이용하는 경우에는, 평가부(111)는, 인트라 예측부(106)가 복수의 참조 화상을 이용하여 예측을 행하는 경우, 복수의 참조 화상 사이의 유사도를 주파수 성분마다 평가하여, 이 평가 결과를 엔트로피 부호화부(103)에 출력한다. 엔트로피 부호화부(103)는, 평가부(111)에 의한 평가 결과에 기초하여, 양자화부(102b)로부터 입력된 변환 계수를 재배열하여 부호화한다. 평가부(111) 및 엔트로피 부호화부(103)의 상세한 점에 관해서는 후술한다.
(3.2. 화상 복호 장치의 구성)
도 17은 제3 실시형태에 따른 화상 복호 장치(2)의 구성을 도시하는 도면이다. 도 17에 도시하는 것과 같이, 화상 복호 장치(2)는 엔트로피 부호 복호부(200)와 역양자화부(201a)와 역변환부(201b)와 합성부(202)와 인트라 예측부(203)와 루프 필터(204)와 프레임 메모리(205)와 움직임 보상 예측부(206)와 전환부(207)와 평가부(208)를 구비한다.
엔트로피 부호 복호부(200)는, 부호화 장치(1)에 의해 생성된 부호화 데이터를 복호하여, 양자화 변환 계수를 역양자화부(201a)에 출력한다. 또한, 엔트로피 부호 복호부(200)는, 부호화 데이터를 복호하고, 예측(인트라 예측 및 움직임 보상 예측)에 관한 정보와 필터 처리에 관한 정보를 취득하여, 예측에 관한 정보를 인트라 예측부(203) 및 움직임 보상 예측부(206)에 출력하고, 필터 처리에 관한 정보를 루프 필터(204)에 출력한다.
역양자화부(201a) 및 역변환부(201b)는 블록 단위로 역양자화 처리 및 역직교 변환 처리를 행하는 역양자화 · 역변환부(201)를 구성한다.
역양자화부(201a)는, 화상 부호화 장치(1)의 양자화부(102b)가 행하는 양자화 처리에 대응하는 역양자화 처리를 행한다. 역양자화부(201a)는, 엔트로피 부호 복호부(200)로부터 입력된 양자화 변환 계수를, 양자화 파라미터(Qp) 및 양자화 행렬을 이용하여 역양자화함으로써 변환 계수를 복원하고, 복원한 변환 계수를 역변환부(201b)에 출력한다.
역변환부(201b)는, 화상 부호화 장치(1)의 변환부(102a)가 행하는 직교 변환 처리에 대응하는 역직교 변환 처리를 행한다. 역변환부(201b)는, 역양자화부(201a)로부터 입력된 변환 계수에 대하여 역직교 변환을 행하여 예측 잔차를 복원하고, 복원한 예측 잔차인 복원 예측 잔차를 합성부(202)에 출력한다.
합성부(202)는, 역변환부(201b)로부터 입력된 예측 잔차와 전환부(207)로부터 입력된 예측 화상을 화소 단위로 합성함으로써, 원래의 대상 화상 블록을 재구성하여, 재구성 화상을 인트라 예측부(203) 및 루프 필터(204)에 출력한다.
인트라 예측부(203)는, 합성부(202)로부터 입력된 재구성 블록 화상을 참조하여, 엔트로피 부호 복호부(200)로부터 입력된 인트라 예측 정보에 따라서 인트라 예측을 행함으로써 인트라 예측 화상을 생성하고, 인트라 예측 화상을 전환부(207)에 출력한다.
루프 필터(204)는, 엔트로피 부호 복호부(200)로부터 입력된 필터 처리 정보에 기초하여, 합성부(202)로부터 입력된 재구성 화상에 대하여, 화상 부호화 장치(1)의 루프 필터(107)가 행하는 필터 처리와 같은 식의 필터 처리를 행하여, 필터 처리 후의 재구성 화상을 프레임 메모리(205)에 출력한다.
프레임 메모리(205)는 루프 필터(204)로부터 입력된 재구성 화상을 프레임 단위로 기억한다. 프레임 메모리(205)는, 기억한 재구성 화상을, 엔트로피 부호화부(103)의 처리와 마찬가지로 표시 순으로 화상 복호 장치(2)의 외부로 출력한다.
움직임 보상 예측부(206)는, 프레임 메모리(205)에 기억된 하나 또는 복수의 재구성 화상을 참조 화상으로서 이용하여, 엔트로피 부호 복호부(200)로부터 입력된 움직임 벡터 정보에 따라서 움직임 보상 예측(인터 예측)을 행함으로써, 움직임 보상 예측 화상을 생성하고, 움직임 보상 예측 화상을 전환부(207)에 출력한다.
전환부(207)는, 인트라 예측부(203)로부터 입력된 인트라 예측 화상과 움직임 보상 예측부(206)로부터 입력된 움직임 보상 예측 화상을 전환하여, 예측 화상(인트라 예측 화상 또는 움직임 보상 예측 화상)을 합성부(202)에 출력한다.
평가부(208)는 화상 부호화 장치(1)의 평가부(111)와 같은 식의 동작을 행한다. 구체적으로는 평가부(208)는, 움직임 보상 예측부(206)가 복수의 참조 화상을 이용하여 움직임 보상 예측을 행하는 경우에 있어서, 복수의 참조 화상 사이의 유사도를 주파수 성분마다 평가하여, 평가 결과의 정보를 엔트로피 부호 복호부(200)에 출력한다. 엔트로피 부호 복호부(200)는, 부호화 데이터를 복호하여 주파수 성분마다 변환 계수를 취득하고, 평가부(208)에 의한 평가 결과에 기초하여 변환 계수를 재배열하여 출력한다. 평가부(208) 및 엔트로피 부호 복호부(200)의 상세한 점에 관해서는 후술한다.
(3.3. 움직임 보상 예측)
도 3은 움직임 보상 예측의 일례를 도시하는 도면이다. 도 4는 움직임 보상 예측에 의해 생성되는 예측 화상의 일례를 도시하는 도면이다. 움직임 보상 예측의 심플한 예로서, HEVC에서 이용되고 있는 쌍예측, 특히 전방향과 후방향 예측(양방향 예측)을 이용하는 경우에 관해서 설명한다.
도 3에 도시하는 것과 같이, 움직임 보상 예측은, 대상 프레임(현재 프레임)에 대하여 시간적으로 전 및 후의 프레임을 참조한다. 도 3의 예에서는, t번째 프레임의 화상 중의 블록의 움직임 보상 예측을, t-1번째 프레임과 t+1번째 프레임을 참조하여 행한다. 움직임 보상은, t-1 및 t+1번째 프레임의 참조 프레임 중에서, 대상 화상 블록과 유사한 부위(블록)를 시스템에서 설정된 탐색 범위 중에서 검출한다.
검출된 부위가 참조 화상이다. 대상 화상 블록에 대한 참조 화상의 상대 위치를 나타내는 정보가 도면 중에 도시하는 화살표이며, 움직임 벡터라고 불린다. 움직임 벡터의 정보는, 화상 부호화 장치(1)에 있어서, 참조 화상의 프레임 정보와 함께 엔트로피 부호화에 의해서 부호화된다. 한편, 화상 복호 장치(2)는, 화상 부호화 장치(1)에 의해 생성된 움직임 벡터의 정보에 기초하여 참조 화상을 검출한다.
도 3 및 도 4에 도시하는 것과 같이, 움직임 보상에 의해서 검출된 참조 화상 1 및 2는, 대상 화상 블록에 대하여, 참조하는 프레임 내에서 위치가 맞춰진 유사한 부분 화상이기 때문에, 대상 화상 블록(부호화 대상 화상)과 유사한 화상으로 된다. 도 4의 예에서는, 대상 화상 블록은 별 모양과 부분적인 원 모양을 포함하고 있다. 참조 화상 1은 별 모양과 전체적인 원 모양을 포함하고 있다. 참조 화상 2는 별 모양을 포함하지만, 원 모양을 포함하고 있지 않다.
이러한 참조 화상 1 및 2로부터 예측 화상을 생성한다. 또한, 예측 처리는, 일반적으로 특징은 다르지만, 부분적으로 유사한 참조 화상 1 및 2를 평균화함으로써, 각각의 참조 화상의 특징을 갖춘 보다 예측 정밀도가 높은 화상을 생성할 수 있다. 단, 보다 고도의 처리, 예컨대 로우 패스 필터나 하이 패스 필터 등에 의한 신호 강조 처리를 병용하여 예측 화상을 생성하여도 좋다. 여기서, 도면에 도시하는 참조 화상 1은 원 모양을 포함하고, 참조 화상 2는 원 모양을 포함하지 않기 때문에, 참조 화상 1 및 2를 평균화하여 예측 화상을 생성하면, 참조 화상 2에서는 예측할 수 없는 원 모양을 예측에 반영할 수 있다. 그러나 예측 화상에 있어서의 원 모양은 참조 화상 1과 비교하여 신호가 반감하고 있다.
참조 화상 1 및 2로부터 얻어진 예측 화상과 대상 화상 블록(부호화 대상 화상)의 차분이 예측 잔차이다. 도 4에 도시하는 예측 잔차에 있어서, 별 모양 엣지의 어긋난 부분과 동그라미 모양의 어긋난 부분(사선부)에만 큰 차분이 생기고 있지만, 그 이외의 부분에 관해서는 정밀도 좋게 예측을 행할 수 있고, 차분이 적어진다(도 4의 예에서는 차분이 생기지 않았다).
차분이 생기지 않은 부분(별 모양의 비엣지 부분 및 배경 부분)은, 참조 화상 1과 참조 화상 2 사이의 유사도가 높은 부분이며, 고정밀도의 예측이 이루어진 부분이다. 한편, 큰 차분이 생긴 부분은, 각 참조 화상에 특유의 부분, 즉, 참조 화상 1과 참조 화상 2 사이의 유사도가 현저히 낮은 부분이다. 이로써, 참조 화상 1과 참조 화상 2 사이의 유사도가 현저히 낮은 부분은 예측의 신뢰성이 낮고, 큰 차분(잔차)을 생기게 할 가능성이 높다는 것을 알 수 있다.
이와 같이 차분이 큰 부분과 차분이 없는 부분이 혼재한 예측 잔차를 직교 변환하면, 변환 계수의 양자화에 의한 신호 열화가 예측 정밀도의 고저에 관계없이 한결같이 다중되기 때문에 부호화 품질이 저하한다.
제3 실시형태에 있어서, 평가부(111)는, 복수의 참조 화상 사이의 유사도를 주파수 성분마다 평가하여, 평가 결과의 정보를 엔트로피 부호화부(103)에 출력한다. 엔트로피 부호화부(103)는, 평가부(111)에 의한 평가 결과에 기초하여, 양자화부(102b)로부터 입력된 변환 계수를 재배열하여 부호화한다.
여기서, 복수의 참조 화상 사이의 유사도가 낮은 주파수 성분은 큰 전력을 갖는다고 간주할 수 있다. 한편, 복수의 참조 화상 사이의 유사도가 높은 주파수 성분은 전력이 제로에 가까워진다고 간주할 수 있다. 이로써, 평가부(111)에 의해서 결정되는 변환 계수의 재배열 순서에 의하면, 엔트로피 부호화부(103)가 유사도가 낮은 주파수 성분의 변환 계수를 집중(정리)시키도록 재배열함으로써, 변환 계수를 효율적으로 부호화할 수 있다.
따라서, 직교 변환 후의 잔차 화상에 있어서 저주파수 성분에 전력이 집중하지 않고 변환 계수의 전력 집중도가 저하하는 경우라도, 효율적인 엔트로피 부호화를 행하는 것을 가능하게 하여, 부호화 효율을 개선할 수 있다.
(3.4. 평가부)
도 18은 화상 부호화 장치(1)에 있어서의 평가부(111)의 구성의 일례를 도시하는 도면이다. 도 18에 도시하는 것과 같이, 평가부(111)는 제1 변환부(111a)와 제2 변환부(111b)와 유사도 산출부(111c)와 정규화부(111d)를 구비한다. 또한, 평가부(111)가 정규화부(111d)를 구비하는 일례를 설명하지만, 본 발명은 유사도의 대소에 기초한 계수의 부호화 순서를 결정하는 것이 목적이기 때문에, 평가부(111)는 반드시 정규화부(111d)를 구비하고 있지 않아도 좋다.
제1 변환부(111a)는, 움직임 보상 예측부(109)로부터 입력된 참조 화상 1(제1 참조 화상)에 대하여 직교 변환을 행함으로써, 주파수 성분마다 제1 변환 계수를 산출하여, 산출한 제1 변환 계수를 유사도 산출부(111c)에 출력한다.
제2 변환부(111b)는, 움직임 보상 예측부(109)로부터 입력된 참조 화상 2(제2 참조 화상)에 대하여 직교 변환을 행함으로써, 주파수 성분마다 제2 변환 계수를 산출하여, 산출한 제2 변환 계수를 유사도 산출부(111c)에 출력한다.
유사도 산출부(111c)는, 제1 변환부(111a)로부터 입력된 제1 변환 계수와 제2 변환부(111b)로부터 입력된 제2 변환 계수의 유사도를 주파수 성분마다 산출하여, 산출한 유사도를 정규화부(111d)에 출력한다. 유사도로서는 예컨대 차분치의 절대치를 이용할 수 있다. 차분치의 절대치가 작을수록 유사도가 높고, 차분치의 절대치가 클수록 유사도가 낮다고 말할 수 있다. 유사도 산출부(111c)는, 각 참조 화상에 대하여 필터 처리를 행한 뒤에 차분치를 산출하여도 좋다. 유사도 산출부(111c)는, 제곱오차 등의 통계량을 산출하여, 이러한 통계량을 유사도로서 이용하여도 좋다. 이하에서는, 유사도로서 차분치의 절대치를 이용하는 일례에 관해서 설명한다.
정규화부(111d)는, 유사도 산출부(111c)로부터 입력된 변환 계수 사이의 차분치의 절대치를, 블록 내에서 차분치의 절대치가 최대가 되는 주파수 성분의 크기(즉, 블록 내의 차분치의 절대치의 최대치)로 정규화하여 출력한다. 정규화된 차분치는, 엔트로피 부호화부(103)에 있어서 변환 계수의 부호화 순서를 결정하기 위한 중요도로서 이용된다. 변환 계수 사이의 절대치가 작을수록 유사도가 높고, 예측 정밀도도 높아지기 때문에, 예측 오차 신호의 변환 계수의 부호화에 있어서의 중요도가 낮다. 한편, 절대치가 큰 계수 성분일수록 유사도가 낮고, 예측 정밀도도 낮아지기 때문에, 예측 오차 신호의 변환 계수의 부호화에 있어서의 중요도가 높은 계수라고 간주할 수 있다. 이 때문에, 엔트로피 부호화부(103)는 중요도가 높은 주파수 성분의 변환 계수를 우선적으로 부호화한다.
정규화부(111d)는, 양자화의 거칠기를 정하는 양자화 파라미터(Qp)와, 변환 계수마다 다른 양자화치가 적용되는 양자화 행렬의 적어도 한쪽에 기초하여, 정규화부(111d)로부터 입력된 정규화 차분치(중요도)를 조정하고, 조정 후의 중요도를 출력하여도 좋다. 양자화의 거칠기가 클수록 복원 예측 잔차의 열화도가 높기 때문에, 양자화 파라미터(Qp)나 양자화 행렬의 양자화치에 기초하여 정규화 차분치를 조정함으로써, 열화도를 고려하여 중요도를 설정할 수 있다.
평가부(111)가 출력하는 각 주파수 성분(ij)의 중요도 Rij는 예컨대 하기의 식 (4)와 같이 표현할 수 있다.
Rij=(abs(Xij-Yij)/maxD×Scale(Qp)) ···(4)
식 (4)에 있어서, Xij는 참조 화상 1의 주파수 성분 ij의 변환 계수이고, Yij는 참조 화상 2의 주파수 성분 ij의 변환 계수이고, abs는 절대치를 얻는 함수이다. 유사도 산출부(111c)는 abs(Xij-Yij)을 출력한다.
또한, 식(4)에 있어서, maxD는 블록 내의 차분치 abs(Xij-Yij)의 최대치이다. maxD를 구하기 위해서, 블록 내의 모든 주파수 성분에 관해서 변환 계수 사이의 차분치를 구할 필요가 있지만, 이 처리를 생략하기 위해서 이미 부호화 처리가 완료된 인접하는 블록의 최대치 등으로 대용하여도 좋으며, 예컨대 그 값 이상이 존재하는 경우는, 사용한 최대치로 클립함으로써 maxD의 정규화를 행하여도 좋다. 혹은 양자화 파라미터(Qp)나 양자화 행렬의 양자화치와 maxD의 대응 관계를 정하는 테이블을 이용하여, 양자화 파라미터(Qp)나 양자화 행렬의 양자화치로부터 maxD를 구하여도 좋다. 혹은 미리 사양으로 규정된 고정치를 maxD로서 이용하여도 좋다. 정규화부(111d)는 abs(Xij-Yij)/maxD를 출력한다.
또한, 식(4)에 있어서, Scale(Qp)는 양자화 파라미터(Qp)나 양자화 행렬의 양자화치에 따라서 곱해지는 계수이다. Scale(Qp)는, Qp나 양자화 행렬의 양자화치가 큰 경우에 1.0에 근접하고, 작은 경우에 0에 근접하도록 설계되며, 그 정도는 시스템에 의해서 조정하는 것으로 한다. 혹은 미리 사양으로 규정된 고정치를 Scale(Qp)로서 이용하여도 좋다. 더욱이, 처리를 간략화하기 위해서, Scale(QP)를 1.0 등 시스템에 따라서 설계된 고정치로 하여도 좋다.
정규화부(111d)는 abs(Xij-Yij)/maxD×Scale(Qp)를 중요도 Rij로서 출력한다. 또한, 이 Rij는, 시스템에 따라서 설계되는 감도 함수에 의해서 조정된 가중을 출력하여도 좋다. 예컨대 abs(Xij-Yij)/maxD×Scale(Qp)=rij로 하고, Rij=Clip(rij, 1.0,0.0)뿐만 아니라, Rij=Clip(rij+offset, 1.0,0.0)와 오프셋을 붙여 감도를 조정하여도 좋다. 또한, Clip(x, max, min)은 x가 max를 넘는 경우는 max로, x가 min을 밑도는 경우는 min로 클립하는 처리를 나타낸다.
이와 같이 하여 산출된 중요도 Rij는 0부터 1.0까지 범위 내의 값으로 된다. 기본적으로는, 중요도 Rij는 주파수 성분 ij의 변환 계수 사이의 차분치가 큰(즉, 예측 정밀도가 낮은) 경우에 1.0에 근접하고, 작은(즉, 예측 정밀도가 높은) 경우에 0에 근접한다. 평가부(111)는, 블록 내의 각 주파수 성분 ij의 중요도 Rij로 이루어지는 맵 정보(이하, 「중요도 맵」이라고 부른다)를 엔트로피 부호화부(103)에 출력한다.
또한, 평가부(111)는, 복수의 참조 화상을 이용하는 움직임 보상 예측을 적용하는 경우에만 평가(중요도 Rij의 산출)를 행하고, 그 이외의 모드, 예컨대 단방향 예측이나, 복수 참조 화상을 이용하지 않는 인트라 예측 처리에서는, 평가(중요도 Rij의 산출)를 행하지 않거나 또는 중요도 Rij로서 일률적으로 1.0을 설정한다.
또한, 화상 복호 장치(2)에 있어서의 평가부(208)는, 화상 부호화 장치(1)에 있어서의 평가부(111)와 같은 식으로 구성된다. 구체적으로는, 화상 복호 장치(2)에 있어서의 평가부(208)는 제1 변환부(208a)와 제2 변환부(208b)와 유사도 산출부(208c)와 정규화부(208d)를 구비한다. 화상 복호 장치(2)에 있어서의 평가부(208)는, 블록 내의 각 주파수 성분 ij의 중요도 Rij로 이루어지는 중요도 맵을 엔트로피 부호 복호부(200)에 출력한다.
(3.5. 엔트로피 부호화부)
도 19는 엔트로피 부호화부(103)의 구성의 일례를 도시하는 도면이다. 도 19에 도시하는 것과 같이, 엔트로피 부호화부(103)는 소트부(103a)와 시리얼라이즈부(103b)와 부호화부(103c)를 구비한다. 소트부(103a) 및 시리얼라이즈부(103b)는 재배열부를 구성한다.
소트부(103a)는, 평가부(111)로부터 입력된 중요도 맵 중 중요도 Rij를 높은 순으로 재배열한다. 중요도 맵에 있어서 중요도 Rij는 2차원으로 배열되어 있기 때문에, 소트부(103a)는, 예컨대 중요도 맵을 미리 정한 스캔 순서에 의해 시리얼라이즈하여 중요도열 R[i]로 하고, 인덱스 라벨 i를 기억한다. 그리고, 소트부(103a)는, 중요도열 R[i] 중의 중요도 Rij가 높은 순으로 인덱스 라벨 i를 재배열하고, 중요도 순으로 재배열한 인덱스 라벨 i를 시리얼라이즈부(103b)에 출력한다.
시리얼라이즈부(103b)는, 양자화부(102b)로부터 입력된 변환 계수를 소정의 스캔 순으로 판독하여 변환 계수열을 부호화부(103c)에 출력하는 시리얼라이즈 처리를 행한다. 양자화부(102b)로부터 입력된 변환 계수는 2차원으로 배열되어 있기 때문에, 시리얼라이즈부(103b)는, 예컨대 2차원으로 배열된 변환 계수를 소정의 스캔 순으로 시리얼라이즈하여 변환 계수열 C[i]로 한다. 여기서, 시리얼라이즈부(103b)와 소트부(103a)에서 동일한 스캔 순서를 이용한다. 그리고, 시리얼라이즈부(103b)는, 소트부(103a)로부터 입력된 인덱스 라벨 i에 기초하여, 변환 계수열 C[i] 중의 변환 계수를 중요도가 높은 순으로 재배열하여 출력한다. 즉, 시리얼라이즈부(103b)는, 평가부(111)에 의한 평가 결과에 기초하여, 변환 계수 사이의 유사도가 낮은 주파수 성분부터 순차 변환 계수가 변환 계수열에 포함되도록 시리얼라이즈 처리를 행한다. 이에 따라, 유의 계수(제로가 아닌 계수)를 정리할 수 있다.
혹은 시리얼라이즈부(103b)는, 중요도가 높은 순으로 변환 계수를 스캔하도록 스캔 순서를 결정하고, 결정한 스캔 순으로 스캔을 행함으로써, 중요도가 높은 순으로 변환 계수가 늘어서는 변환 계수열을 출력하여도 좋다.
부호화부(103c)는, 시리얼라이즈부(103b)로부터 입력된 변환 계수열 중의 변환 계수를 부호화하여 부호화 데이터를 출력한다. 부호화부(103c)는, 시리얼라이즈부(103b)로부터 입력된 변환 계수열의 최후의 유의 계수를 종료 위치로 하여, 종료 위치까지의 변환 계수를 부호화한다. 상기한 것과 같이 유의 계수를 정리함으로써, 종료 위치까지의 변환 계수의 수를 적게 하여, 부호화해야 할 변환 계수열의 길이를 짧게 할 수 있다.
또한, 엔트로피 부호화부(103)는, 복수의 참조 화상을 이용하는 움직임 보상 예측을 적용하는 경우에만 중요도에 의한 재배열 처리를 행하고, 그 이외의 모드, 예컨대 단방향 예측이나 인트라 예측 처리에서는 중요도에 의한 재배열 처리를 행하지 않더라도 좋다.
(3.6. 엔트로피 부호 복호부)
도 20은 엔트로피 부호 복호부(200)의 구성의 일례를 도시하는 도면이다. 도 20에 도시하는 것과 같이, 엔트로피 부호 복호부(200)는 복호부(200a)과 소트부(200b)와 디시리얼라이즈(desirealize)부(200c)를 구비한다. 소트부(200b) 및 디시리얼라이즈부(200c)는 재배열부를 구성한다.
복호부(200a)는, 화상 부호화 장치(1)에 의해 생성된 부호화 데이터를 복호하고, 변환 계수열(양자화된 변환 계수)과 예측(인트라 예측 및 움직임 보상 예측)에 관한 정보를 취득하여, 변환 계수열을 디시리얼라이즈부(200c)에 출력하고, 예측에 관한 정보를 인트라 예측부(203) 및 움직임 보상 예측부(206)에 출력한다.
소트부(200b)는, 평가부(208)로부터 입력된 중요도 맵 중의 중요도 Rij를 높은 순으로 재배열한다. 중요도 맵에 있어서 중요도 Rij는 2차원으로 배열되어 있기 때문에, 소트부(200b)는, 예컨대 중요도 맵을 미리 정한 스캔 순서에 의해 시리얼라이즈하여 중요도열 R[i]로 하고, 인덱스 라벨 i를 기억한다. 그리고, 소트부(200b)는, 중요도열 R[i] 중의 중요도 Rij가 높은 순으로 인덱스 라벨 i를 재배열하고, 중요도 순으로 재배열한 인덱스 라벨 i와 이 인덱스 라벨 i에 대응하는 좌표치(주파수 성분 ij)를 디시리얼라이즈부(200c)에 출력한다.
디시리얼라이즈부(200c)는, 복호부(200a)로부터 입력된 변환 계수열을, 소트부(200b)로부터 입력된 인덱스 라벨 i와 좌표치(주파수 성분 ij)에 기초하여 디시리얼라이즈하여, 2차원으로 배열된 변환 계수를 역양자화부(201a)에 출력한다.
또한, 엔트로피 부호 복호부(200)는, 복수의 참조 화상을 이용하는 움직임 보상 예측을 적용하는 경우에만 중요도에 의한 재배열 처리를 행하고, 그 이외의 모드, 예컨대 단방향 예측이나 인트라 예측 처리에서는 중요도에 의한 재배열 처리를 행하지 않더라도 좋다.
(3.7. 화상 부호화 플로우)
도 21은 제3 실시형태에 따른 화상 부호화 장치(1)에 있어서의 처리 플로우를 도시하는 도면이다. 여기서는 본 발명에 관련된 동작을 주로 설명하고, 본 발명과의 관련도가 낮은 동작에 관해서는 설명을 생략한다.
도 21에 도시하는 것과 같이, 단계 S3101에 있어서, 움직임 보상 예측부(109)는, 복수의 참조 화상을 이용하여 움직임 보상 예측을 행함으로써 대상 화상 블록을 예측하여, 대상 화상 블록에 대응하는 예측 화상을 생성한다.
단계 S3102에 있어서, 평가부(111)는, 복수의 참조 화상 사이의 유사도를 주파수 성분마다 평가하여, 블록 내의 각 주파수 성분의 중요도를 나타내는 중요도 맵을 생성한다.
단계 S3103에 있어서, 감산부(101)는, 대상 화상 블록과 예측 화상 사이의 화소 단위에서의 차분을 나타내는 예측 잔차를 산출한다.
단계 S3104에 있어서, 변환 · 양자화부(102)는, 감산부(101)가 산출한 예측 잔차에 대하여 직교 변환 및 양자화를 행함으로써, 양자화된 변환 계수를 생성한다.
단계 S3105에 있어서, 엔트로피 부호화부(103)는, 평가부(111)에 의한 평가 결과(중요도 맵)에 기초하여, 변환 · 양자화부(102)(양자화부(102b))로부터 입력된 변환 계수를 중요도가 높은 순(즉, 변환 계수 사이의 유사도가 낮은 순)으로 재배열하여 출력한다.
단계 S3106에 있어서, 엔트로피 부호화부(103)는, 중요도가 높은 순으로 재배열한 변환 계수를 엔트로피 부호화에 의해 부호화하여 부호화 데이터를 출력한다.
단계 S3107에 있어서, 역양자화 · 역변환부(104)는, 변환 · 양자화부(102)(양자화부(102b))로부터 입력된 변환 계수에 대하여 역양자화 및 역직교 변환을 행함으로써 예측 잔차를 복원하여, 복원 예측 잔차를 생성한다.
단계 S3108에 있어서, 합성부(105)는, 복원 예측 잔차를 화소 단위로 예측 화상과 합성함으로써 대상 화상 블록을 재구성하여, 재구성 화상을 생성한다.
단계 S3109에 있어서, 루프 필터(107)는 재구성 화상에 대하여 필터 처리를 행한다.
단계 S3110에 있어서, 프레임 메모리(108)는 필터 처리 후의 재구성 화상을 프레임 단위로 기억한다.
(3.8. 화상 복호 플로우)
도 22는 제3 실시형태에 따른 화상 복호 장치(2)에 있어서의 처리 플로우를 도시하는 도면이다. 여기서는 본 발명에 관련된 동작을 주로 설명하고, 본 발명과의 관련도가 낮은 동작에 관해서는 설명을 생략한다.
도 22에 도시하는 것과 같이, 단계 S3201에 있어서, 엔트로피 부호 복호부(200)는, 부호화 데이터를 복호하여 움직임 벡터 정보를 취득하고, 취득한 움직임 벡터 정보를 움직임 보상 예측부(206)에 출력한다.
단계 S3202에 있어서, 움직임 보상 예측부(206)는, 움직임 벡터 정보에 기초한 복수의 참조 화상을 이용하여 움직임 보상 예측을 행함으로써 대상 화상 블록을 예측하여, 대상 화상 블록에 대응하는 예측 화상을 생성한다.
단계 S3203에 있어서, 평가부(208)는, 복수의 참조 화상 사이의 유사도를 주파수 성분마다 산출하여, 블록 내의 각 주파수 성분의 중요도를 나타내는 중요도 맵을 생성한다.
단계 S3204에 있어서, 엔트로피 부호 복호부(200)는, 부호화 데이터를 복호하여 변환 계수열을 취득하고, 취득한 변환 계수열을 재배열하여, 2차원으로 배열된 변환 계수를 역양자화 · 역변환부(201)에 출력한다.
단계 S3205에 있어서, 역양자화 · 역변환부(201)는, 변환 계수(양자화된 변환 계수)에 대하여 역양자화 및 역직교 변환을 행함으로써 예측 잔차를 복원하여, 복원 예측 잔차를 생성한다.
단계 S3206에 있어서, 합성부(202)는, 복원 예측 잔차를 화소 단위로 예측 화상과 합성함으로써 대상 화상 블록을 재구성하여, 재구성 화상을 생성한다.
단계 S3207에 있어서, 루프 필터(204)는 재구성 화상에 대하여 필터 처리를 행한다.
단계 S3208에 있어서, 프레임 메모리(205)는 필터 처리 후의 재구성 화상을 프레임 단위로 기억하여 출력한다.
(3.9. 제3 실시형태의 정리)
화상 부호화 장치(1)에 있어서, 평가부(111)는, 복수의 참조 화상 사이의 유사도를 주파수 성분마다 평가하여, 평가 결과의 정보를 엔트로피 부호화부(103)에 출력한다. 엔트로피 부호화부(103)는, 평가부(111)에 의한 평가 결과에 기초하여, 양자화부(102b)로부터 입력된 변환 계수를 재배열하여 부호화한다. 유사도가 낮은 주파수 성분의 변환 계수를 집중(정리)시키도록 재배열하여 부호화함으로써, 변환 계수를 효율적으로 부호화하여, 효율적인 엔트로피 부호화를 행할 수 있게 되기 때문에, 부호화 효율을 개선할 수 있다.
화상 복호 장치(2)에 있어서, 평가부(208)는, 복수의 참조 화상 사이의 유사도를 주파수 성분마다 평가하여, 평가 결과의 정보를 엔트로피 부호 복호부(200)에 출력한다. 엔트로피 부호 복호부(200)는, 부호화 데이터를 복호하여 주파수 성분마다 변환 계수를 취득하고, 평가부(208)에 의한 평가 결과에 기초하여 변환 계수를 재배열하여 출력한다. 이와 같이, 평가부(208)에 의한 평가 결과에 기초하여 변환 계수를 재배열함으로써, 재배열의 상세를 지정하는 정보가 화상 복호 장치(1)로부터 전송되지 않더라도, 엔트로피 부호 복호부(200)가 자율적으로 변환 계수를 재배열할 수 있다. 이로써, 재배열의 상세를 지정하는 정보를 화상 복호 장치(1)로부터 전송할 필요가 없어, 부호화 효율의 저하를 피할 수 있다.
(3.10. 제3 실시형태의 변경예)
도 23은 화상 부호화 장치(1)에 있어서의 평가부(111)의 구성의 변경예를 도시하는 도면이다. 도 23에 도시하는 것과 같이, 본 변경예에 따른 평가부(111A)는 유사도 산출부(111c)와 변환부(111e)와 정규화부(111d)를 구비한다. 또한, 평가부(111)가 정규화부(111d)를 구비하는 일례를 설명하지만, 평가부(111)는 반드시 정규화부(111d)를 구비하고 있지 않아도 된다.
유사도 산출부(111c)는, 움직임 보상 예측부(109)로부터 입력된 참조 화상 1(제1 참조 화상) 및 참조 화상 2(제2 참조 화상)의 유사도를 화소 단위로 산출하고, 화소 단위로 산출한 유사도를 변환부(111e)에 출력한다. 유사도로서는 예컨대 차분치의 절대치를 이용할 수 있다. 절대치가 작을수록 유사도가 높고, 절대치가 클수록 유사도가 낮다고 말할 수 있다. 유사도 산출부(111c)는, 각 참조 화상에 대하여 필터 처리를 행한 뒤에 차분치를 산출하여도 좋다. 유사도 산출부(111c)는, 제곱오차 등의 통계량을 산출하여, 이러한 통계량을 유사도로서 이용하여도 좋다. 이하에서는, 유사도로서 차분치의 절대치를 이용하는 일례에 관해서 설명한다.
유사도 산출부(111c)는, 유사도 산출부(111c)로부터 입력된 화소 단위의 유사도(차분치)에 대하여 직교 변환을 행함으로써, 주파수 성분마다 유사도를 산출한다.
정규화부(111d)는, 유사도 산출부(111c)로부터 입력된 주파수 성분 단위의 차분치(변환 계수)를, 블록 내에서 차분치가 최대가 되는 주파수 성분의 차분치(즉, 블록 내의 차분치의 절대치의 최대치)로 정규화하여 출력한다.
정규화부(111d)는, 양자화의 거칠기를 정하는 양자화 파라미터(Qp)와, 변환 계수마다 다른 양자화치가 적용되는 양자화 행렬의 적어도 한쪽에 기초하여, 정규화부(111d)로부터 입력된 정규화 차분치(중요도)를 조정하여 출력하여도 좋다.
변경예에 따른 평가부(111A)가 출력하는 각 주파수 성분(ij)의 중요도 Rij는 예컨대 하기의 식 (5)와 같이 표현할 수 있다.
Rij=abs(Dij)/maxD×Scale(Qp)···(5)
식 (5)에 있어서, Dij는 주파수 성분 ij의 변환 계수이고, abs는 절대치를 얻는 함수이다. 변환부(111e)는 abs(Dij)를 출력한다.
또한, 식 (5)에 있어서, maxD는 블록 내의 변환 계수의 최대치이다. maxD를 구하기 위해서 블록 내의 모든 주파수 성분에 관해서 변환 계수를 구할 필요가 있지만, 이 처리를 생략하기 위해서 이미 부호화 처리가 완료된 인접하는 블록의 최대치 등으로 대용하여도 좋다. 혹은 양자화 파라미터(Qp)나 양자화 행렬의 양자화치와 maxD의 대응 관계를 정하는 테이블을 이용하여, 양자화 파라미터(Qp)나 양자화 행렬의 양자화치로부터 maxD를 구하여도 좋다. 혹은 미리 사양으로 규정된 고정치를 maxD로서 이용하여도 좋다. 정규화부(111d)는 abs(Dij)/maxD를 출력한다. 식 (5)에 있어서, Scale(Qp)는 상술한 제3 실시형태와 마찬가지다.
이와 같이 하여, 변경예에 따른 평가부(111A)는, 블록 내의 각 주파수 성분 ij의 중요도 Rij로 이루어지는 중요도 맵을 생성하여, 생성한 중요도 맵을 엔트로피 부호화부(103)에 출력한다.
변경예에 따른 평가부(111A)에 의하면, 상술한 제3 실시형태에 따른 평가부(111)와 비교하여, 직교 변환부의 수를 줄일 수 있기 때문에, 처리 부하를 삭감할 수 있다. 일반적으로 영상의 부호화에서 이용되는 직교 변환은 거의 정규 직교 변환이기 때문에, 변경예에 따른 평가부(111A)는 제3 실시형태에 따른 평가부(111)와 동등한 성능을 얻을 수 있다.
또한, 변경예에 있어서, 화상 복호 장치(2)에 있어서의 평가부(208A)는, 화상 부호화 장치(1)에 있어서의 평가부(111A)와 같은 식으로 구성된다. 구체적으로는 화상 복호 장치(2)에 있어서의 평가부(208A)는 유사도 산출부(208c)와 변환부(208e)와 정규화부(208d)를 구비한다. 화상 복호 장치(2)에 있어서의 평가부(208A)는, 블록 내의 각 주파수 성분 ij의 중요도 Rij로 이루어지는 중요도 맵을 엔트로피 부호 복호부(200)에 출력한다.
<4. 그 밖의 실시형태>
상술한 제1 실시형태 및 제2 실시형태를 병용하여도 좋다. 도 14는 제1 실시형태 및 제2 실시형태를 병용하는 경우의 화상 부호화 장치(1)의 구성을 도시하는 도면이다. 도 14에 도시하는 것과 같이, 평가부(111)는 평가 결과(맵 정보)를 합성부(105) 및 루프 필터(107) 양쪽에 출력한다. 도 15는 제1 실시형태 및 제2 실시형태를 병용하는 경우의 화상 복호 장치(2)의 구성을 도시하는 도면이다. 도 15에 도시하는 것과 같이, 평가부(208)는 평가 결과(맵 정보)를 합성부(202) 및 루프 필터(204) 양쪽에 출력한다.
상술한 제3 실시형태에 있어서, 엔트로피 부호화부(103)가, 2차원으로 배열된 변환 계수 모두를 중요도 순으로 판독하여 시리얼라이즈 처리를 행하는 일례에 관해서 설명했다. 그러나, 2차원으로 배열된 변환 계수 중 중요도가 높은 순으로 상위 몇 개만을 판독하고, 그 이외의 변환 계수에 관해서는 시스템에서 정해진 고정 순서로 판독하는 것으로 하여도 좋다. 혹은 2차원으로 배열된 변환 계수에 관해서, 중요도에 따라서 판독 순서를 소정의 수만큼 앞당기거나 또는 미루거나 하여도 좋다.
상술한 제3 실시형태에 있어서, 변환 계수의 스캔 순서로서, 예컨대 MPEG2에서 채용되는 지그재그 스캔을 이용할 수 있지만, 예컨대 최신의 부호화 방식인 HEVC(비특허문헌 1 참조)의 경우, 변환 계수 재배열은, 블록 내에 있어서 4×4의 변환 계수마다 그룹 나누기된 CG라고 불리는 단위로 이루어진다. CG 내에 제로가 아닌 계수가 있는지 여부를 판정하여, CG 내에 제로가 아닌 계수가 있는 경우에, 그 CG 내의 변환 계수를 시리얼라이즈하여 부호화한다. 상술한 제3 실시형태에 따른 동작을, CG 내의 변환 계수를 판독할 때의 변환 계수의 재배열에 응용할 수도 있다. 또한, 혹은 CG의 판독 순서를 결정하는 시리얼라이즈에 적용하여, CG 내의 직교 변환 계수의 유사도의 평균을 산출하여 CG마다의 유사도를 비교함으로써 판독 순서의 재배열에 응용할 수도 있다.
상술한 각 실시형태에 있어서, 움직임 보상 예측으로서 인터 예측을 주로 설명했다. 인터 예측에 있어서는, 현재 프레임과 다른 프레임 내의 참조 화상이 현재 프레임의 대상 화상 블록의 예측에 이용된다. 그러나, 움직임 보상 예측에 한정되는 것이 아니라, 예컨대 인트라 플록 카피라고 불리는 기술에 있어서의 복수 참조 블록에도 적용할 수 있다. 인트라 플록 카피에 있어서는, 현재 프레임과 같은 프레임 내의 참조 화상이 현재 프레임의 대상 화상 블록의 예측에 이용된다.
상술한 본 발명의 구체예는, 화상 부호화 장치(1)가 행하는 각 처리를 컴퓨터에 실행시키는 프로그램 및 화상 복호 장치(2)가 행하는 각 처리를 컴퓨터에 실행시키는 프로그램에 의해 제공되어도 좋다. 또한, 프로그램은 컴퓨터 판독 가능한 매체에 기록되어 있어도 좋다. 컴퓨터 판독 가능한 매체를 이용하면, 컴퓨터에 프로그램을 인스톨할 수 있다. 여기서, 프로그램이 기록된 컴퓨터 판독 가능한 매체는 비일과성(非一過性)의 기록 매체라도 좋다. 비일과성의 기록 매체는, 특별히 한정되는 것은 아니지만, 예컨대 CD-ROM이나 DVD-ROM 등의 기록 매체라도 좋다. 또한, 화상 부호화 장치(1)가 행하는 각 처리를 실행하는 회로를 집적화하여, 화상 부호화 장치(1)를 반도체 집적 회로(칩 세트, SoC)로서 구성하여도 좋다. 마찬가지로, 화상 복호 장치(2)가 행하는 각 처리를 실행하는 회로를 집적화하여, 화상 복호 장치(2)를 반도체 집적 회로(칩 세트, SoC)로서 구성하여도 좋다.
이상, 도면을 참조하여 실시형태에 관해서 자세히 설명했지만, 구체적인 구성은 상술한 것에 한정되지 않으며, 요지를 일탈하지 않는 범위 내에서 여러 가지 설계 변경 등을 할 수 있다.
또한, 본원은 일본국 특허출원 제2018-065895호(2018년 3월 29일 출원) 및 일본국 특허출원 제2018-065886호(2018년 3월 29일 출원)의 우선권을 주장하며, 이들의 내용 전부가 참조에 의해 본원 명세서에 들어가 있다.

Claims (23)

  1. 대상 화상을 블록 단위로 부호화하는 화상 부호화 장치에 있어서,
    복수의 참조 화상을 이용하여 예측을 행함으로써, 상기 대상 화상의 블록에 대응하는 예측 화상의 블록을 생성하는 예측부와,
    상기 복수의 참조 화상 간의 유사도를, 상기 블록보다 작은 단위이며 복수의 화소로 이루어진 화상 부분마다 산출함으로써, 상기 예측 화상의 블록의 예측 정밀도를 상기 화상 부분마다 평가하는 평가부와,
    상기 대상 화상의 블록과 상기 예측 화상의 블록 사이의 화소 단위에서의 차분을 나타내는 예측 잔차에 대하여 변환 및 양자화를 행하는 변환 · 양자화부와,
    상기 변환 · 양자화부로부터 입력된 양자화 변환 계수에 대하여 역양자화 및 역변환을 행함으로써, 상기 예측 잔차를 복원하는 역양자화·역변환부와,
    상기 역양자화·역변환부로부터 입력된 복원 예측 잔차를 화소 단위로 상기 예측 화상의 블록과 합성함으로써, 상기 대상 화상의 블록을 재구성하는 합성부
    를 포함하고,
    상기 복원 예측 잔차와 상기 예측 화상의 블록을 처리 대상으로 하는 미리 결정된 처리에 있어서, 상기 평가부에 의한 평가 결과는, 상기 처리 대상을 상기 화상 부분 단위로 보정하기 위해 이용되는 것인 화상 부호화 장치.
  2. 제1항에 있어서,
    상기 평가부는, 상기 복수의 참조 화상 간의 유사도를 나타내는 값을 정규화하는 정규화부를 갖는 것인 화상 부호화 장치.
  3. 제1항에 있어서,
    상기 합성부는, 상기 평가부에 의한 평가 결과에 기초하여, 상기 예측 화상의 블록과 합성하는 상기 복원 예측 잔차를 상기 화상 부분마다 제어하는 것인 화상 부호화 장치.
  4. 제3항에 있어서,
    상기 합성부는,
    상기 예측 화상의 블록과 합성하는 상기 복원 예측 잔차에 대하여 상기 화상 부분마다 가중을 행하는 가중부와,
    상기 가중 후의 상기 복원 예측 잔차를 화소 단위로 상기 예측 화상의 블록에 가산하는 가산부
    를 포함하고,
    상기 평가부는, 상기 평가 결과에 기초하여, 상기 가중에 이용하는 무게를 상기 화상 부분마다 설정하는 것인 화상 부호화 장치.
  5. 대상 화상을 부호화하는 화상 부호화 장치에 있어서,
    복수의 참조 화상을 이용하여 예측을 행함으로써, 상기 대상 화상에 대응하는 예측 화상을 생성하는 예측부와,
    상기 복수의 참조 화상 간의 유사도를 하나 또는 복수의 화소로 이루어진 화상 부분마다 산출함으로써, 상기 예측 화상의 예측 정밀도를 상기 화상 부분마다 평가하는 평가부와,
    상기 대상 화상과 상기 예측 화상 사이의 화소 단위에서의 차분을 나타내는 예측 잔차에 대하여 변환 및 양자화를 행하는 변환 · 양자화부와,
    상기 변환 · 양자화부로부터 입력된 양자화 변환 계수에 대하여 역양자화 및 역변환을 행함으로써, 상기 예측 잔차를 복원하는 역양자화 · 역변환부와,
    상기 역양자화 · 역변환부로부터 입력된 복원 예측 잔차를 화소 단위로 상기 예측 화상과 합성함으로써, 상기 대상 화상을 재구성하는 합성부와,
    상기 합성부로부터 입력된 재구성 화상에 대하여 필터 처리를 행하는 루프 필터
    를 포함하고,
    상기 루프 필터는, 상기 평가부에 의한 평가 결과에 기초하여, 상기 필터 처리에 있어서의 필터 강도를 상기 화상 부분마다 제어하는 것인 화상 부호화 장치.
  6. 제5항에 있어서,
    상기 루프 필터는,
    상기 필터 강도를 정하는 오프셋치에 대하여 상기 화상 부분마다 가중을 행하는 가중부와,
    상기 가중 후의 상기 오프셋치를 화소 단위로 상기 재구성 화상에 가산하는 가산부
    를 포함하고,
    상기 평가부는, 상기 평가 결과에 기초하여, 상기 가중에 이용하는 무게를 상기 화상 부분마다 설정하는 것인 화상 부호화 장치.
  7. 대상 화상을 블록 단위로 복호하는 화상 복호 장치에 있어서,
    복수의 참조 화상을 이용하여 예측을 행함으로써, 상기 대상 화상의 블록에 대응하는 예측 화상의 블록을 생성하는 예측부와,
    상기 복수의 참조 화상 간의 유사도를, 상기 블록보다 작은 단위이며 복수의 화소로 이루어진 화상 부분마다 산출함으로써, 상기 예측 화상의 블록의 예측 정밀도를 상기 화상 부분마다 평가하는 평가부와,
    상기 대상 화상의 블록과 상기 예측 화상의 블록 사이의 화소 단위에서의 차분을 나타내는 예측 잔차를 화상 부호화 장치에 있어서 변환 및 양자화하여 얻어진 양자화 변환 계수에 대하여 역양자화 및 역변환을 행함으로써, 상기 예측 잔차를 복원하는 역양자화 · 역변환부와,
    상기 역양자화 · 역변환부로부터 입력된 복원 예측 잔차를 화소 단위로 상기 예측 화상의 블록과 합성함으로써, 상기 대상 화상의 블록을 재구성하는 합성부
    를 포함하고,
    상기 복원 예측 잔차와 상기 예측 화상의 블록을 처리 대상으로 하는 미리 결정된 처리에 있어서, 상기 평가부에 의한 평가 결과는, 상기 처리 대상을 상기 화상 부분 단위로 보정하기 위해 이용되는 것인 화상 복호 장치.
  8. 제7항에 있어서,
    상기 평가부는, 상기 복수의 참조 화상 간의 유사도를 나타내는 값을 정규화하는 정규화부를 갖는 것인 화상 복호 장치.
  9. 제7항에 있어서,
    상기 합성부는, 상기 평가부에 의한 평가 결과에 기초하여, 상기 예측 화상과 합성하는 상기 복원 예측 잔차를 상기 화상 부분마다 제어하는 것인 화상 복호 장치.
  10. 제9항에 있어서,
    상기 합성부는,
    상기 예측 화상의 블록과 합성하는 상기 복원 예측 잔차에 대하여 상기 화상 부분마다 가중을 행하는 가중부와,
    상기 가중 후의 상기 복원 예측 잔차를 화소 단위로 상기 예측 화상의 블록에 가산하는 가산부
    를 포함하고,
    상기 평가부는, 상기 평가 결과에 기초하여, 상기 가중에 이용하는 무게를 상기 화상 부분마다 설정하는 것인 화상 복호 장치.
  11. 대상 화상을 복호하는 화상 복호 장치에 있어서,
    복수의 참조 화상을 이용하여 예측을 행함으로써, 상기 대상 화상에 대응하는 예측 화상을 생성하는 예측부와,
    상기 복수의 참조 화상 간의 유사도를 하나 또는 복수의 화소로 이루어진 화상 부분마다 산출함으로써, 상기 예측 화상의 예측 정밀도를 상기 화상 부분마다 평가하는 평가부와,
    상기 대상 화상과 상기 예측 화상 사이의 화소 단위에서의 차분을 나타내는 예측 잔차를 화상 부호화 장치에 있어서 변환 및 양자화하여 얻어진 양자화 변환 계수에 대하여 역양자화 및 역변환을 행함으로써, 상기 예측 잔차를 복원하는 역양자화 · 역변환부와,
    상기 역양자화 · 역변환부로부터 입력된 복원 예측 잔차를 화소 단위로 상기 예측 화상과 합성함으로써, 상기 대상 화상을 재구성하는 합성부와,
    상기 합성부로부터 입력된 재구성 화상에 대하여 필터 처리를 행하는 루프 필터
    를 더 포함하고,
    상기 루프 필터는, 상기 평가부에 의한 평가 결과에 기초하여, 상기 필터 처리에 있어서의 필터 강도를 상기 화상 부분마다 제어하는 것인 화상 복호 장치.
  12. 제11항에 있어서,
    상기 루프 필터는,
    상기 필터 강도를 정하는 오프셋치에 대하여 상기 화상 부분마다 가중을 행하는 가중부와,
    상기 가중 후의 상기 오프셋치를 화소 단위로 상기 재구성 화상에 가산하는 가산부
    를 포함하고,
    상기 평가부는, 상기 평가 결과에 기초하여, 상기 가중에 이용하는 무게를 상기 화상 부분마다 설정하는 것인 화상 복호 장치.
  13. 컴퓨터를 제1항 내지 제6항 중 어느 한 항에 기재된 화상 부호화 장치로서 기능시키기 위한 매체에 저장된 프로그램.
  14. 컴퓨터를 제7항 내지 제12항 중 어느 한 항에 기재된 화상 복호 장치로서 기능시키기 위한 매체에 저장된 프로그램.
  15. 대상 화상을 블록 단위로 복호하는 화상 복호 방법에 있어서,
    복수의 참조 화상을 이용하여 예측을 행함으로써, 상기 대상 화상의 블록에 대응하는 예측 화상의 블록을 생성하는 단계와,
    상기 복수의 참조 화상 간의 유사도를, 상기 블록보다 작은 단위이며 복수의 화소로 이루어진 화상 부분마다 산출함으로써, 상기 화상 부분마다 평가치를 생성하는 평가 단계와,
    상기 대상 화상의 블록과 상기 예측 화상의 블록 사이의 화소 단위에서의 차분을 나타내는 예측 잔차를 화상 부호화측에서 변환 및 양자화하여 얻어진 양자화 변환 계수에 대하여 역양자화 및 역변환을 행함으로써, 상기 예측 잔차를 복원하는 단계와,
    상기 예측 잔차를 복원하는 단계에 의해 얻어지는 복원 예측 잔차를 화소 단위로 상기 예측 화상과 합성함으로써, 상기 대상 화상의 블록을 재구성하는 합성 단계
    를 가지며,
    상기 복원 예측 잔차와 상기 예측 화상의 블록을 처리 대상으로 하는 미리 결정된 처리에 있어서, 상기 평가 단계에 의한 상기 평가치는, 상기 처리 대상을 상기 화상 부분 단위로 보정하기 위해 이용되는 것인 화상 복호 방법.
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
KR1020207030463A 2018-03-29 2019-03-29 화상 부호화 장치, 화상 복호 장치 및 프로그램 KR102409138B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020227019455A KR20220085841A (ko) 2018-03-29 2019-03-29 화상 부호화 장치, 화상 복호 장치 및 프로그램

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2018065886 2018-03-29
JPJP-P-2018-065886 2018-03-29
JPJP-P-2018-065895 2018-03-29
JP2018065895 2018-03-29
PCT/JP2019/014359 WO2019189899A1 (ja) 2018-03-29 2019-03-29 画像符号化装置、画像復号装置、及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020227019455A Division KR20220085841A (ko) 2018-03-29 2019-03-29 화상 부호화 장치, 화상 복호 장치 및 프로그램

Publications (2)

Publication Number Publication Date
KR20200136443A KR20200136443A (ko) 2020-12-07
KR102409138B1 true KR102409138B1 (ko) 2022-06-16

Family

ID=68058216

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020227019455A KR20220085841A (ko) 2018-03-29 2019-03-29 화상 부호화 장치, 화상 복호 장치 및 프로그램
KR1020207030463A KR102409138B1 (ko) 2018-03-29 2019-03-29 화상 부호화 장치, 화상 복호 장치 및 프로그램

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020227019455A KR20220085841A (ko) 2018-03-29 2019-03-29 화상 부호화 장치, 화상 복호 장치 및 프로그램

Country Status (6)

Country Link
US (3) US11394958B2 (ko)
EP (1) EP3780598A4 (ko)
JP (2) JP6892555B2 (ko)
KR (2) KR20220085841A (ko)
CN (1) CN112020859A (ko)
WO (1) WO2019189899A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11689743B2 (en) * 2020-11-12 2023-06-27 Tencent America LLC Method and apparatus for video coding
CN112905829A (zh) * 2021-03-25 2021-06-04 王芳 一种跨模态人工智能信息处理系统及检索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011080807A1 (ja) 2009-12-28 2011-07-07 富士通株式会社 動画像符号化装置および動画像復号装置
WO2011080806A1 (ja) 2009-12-28 2011-07-07 富士通株式会社 動画像符号化装置および動画像復号装置
US20190230350A1 (en) 2016-05-13 2019-07-25 Vid Scale, Inc Systems and methods for generalized multi-hypothesis prediction for video coding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000059785A (ja) * 1998-08-06 2000-02-25 Hitachi Ltd 予測復号装置
KR100597402B1 (ko) * 2003-12-01 2006-07-06 삼성전자주식회사 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
RU2506711C2 (ru) * 2008-07-25 2014-02-10 Сони Корпорейшн Способ и устройство обработки изображения
KR20130034566A (ko) * 2011-09-28 2013-04-05 한국전자통신연구원 제한된 오프셋 보상 및 루프 필터를 기반으로 하는 영상 부호화 및 복호화 방법 및 그 장치
TWI577181B (zh) * 2011-12-28 2017-04-01 Jvc Kenwood Corp Dynamic video coding device, dynamic image coding method and dynamic image coding program
JP6012014B2 (ja) * 2012-03-30 2016-10-25 サン パテント トラスト 画像符号化方法および画像復号方法
KR101373704B1 (ko) * 2012-05-29 2014-03-14 주식회사 코아로직 적응적 가중치 예측을 이용한 영상 처리 방법
JP6843377B2 (ja) 2016-10-17 2021-03-17 国立大学法人山口大学 含硫黄樹脂
JP6777931B2 (ja) 2016-10-17 2020-10-28 西工業株式会社 可塑剤抽出装置
JP6880310B2 (ja) * 2018-03-29 2021-06-02 日本放送協会 画像符号化装置、画像復号装置、及びプログラム
JP2021520710A (ja) * 2018-04-06 2021-08-19 ヴィド スケール インコーポレイテッド 簡易化された勾配導出による双方向オプティカルフロー方法
JP7022731B2 (ja) 2019-11-12 2022-02-18 Kddi株式会社 多数のアンテナを選択的に使用する制御装置、制御方法、及びプログラム。

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011080807A1 (ja) 2009-12-28 2011-07-07 富士通株式会社 動画像符号化装置および動画像復号装置
WO2011080806A1 (ja) 2009-12-28 2011-07-07 富士通株式会社 動画像符号化装置および動画像復号装置
US20190230350A1 (en) 2016-05-13 2019-07-25 Vid Scale, Inc Systems and methods for generalized multi-hypothesis prediction for video coding

Also Published As

Publication number Publication date
EP3780598A1 (en) 2021-02-17
US20240040128A1 (en) 2024-02-01
JPWO2019189899A1 (ja) 2021-02-12
US11394958B2 (en) 2022-07-19
KR20220085841A (ko) 2022-06-22
WO2019189899A1 (ja) 2019-10-03
US11818360B2 (en) 2023-11-14
KR20200136443A (ko) 2020-12-07
JP6892555B2 (ja) 2021-06-23
JP7203149B2 (ja) 2023-01-12
US20220321877A1 (en) 2022-10-06
US20210014481A1 (en) 2021-01-14
JP2021141604A (ja) 2021-09-16
EP3780598A4 (en) 2022-01-26
CN112020859A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
US20150156513A1 (en) Method and apparatus for encoding and decoding image by using large transformation unit
JP7092920B2 (ja) 画像復号装置及びプログラム
JP2013538471A (ja) 辞書を用いてビデオをコード化する方法
US11962776B2 (en) Inverse quantization device and method used in video decoding device
JP7203149B2 (ja) 画像符号化装置、画像復号装置、及びプログラム
Kumar et al. Performance Comparison of Jpeg, Jpeg XT, Jpeg LS, Jpeg 2000, Jpeg XR, HEVC, EVC and VVC for Images
JP6839327B1 (ja) 画像符号化装置、画像復号装置、及びプログラム
KR20200004749A (ko) 잔차신호 재배열 방법 및 영상 복호화 장치
JP6402520B2 (ja) 符号化装置、方法、プログラム及び機器
JP7291471B2 (ja) 画像符号化装置、画像復号装置、及びプログラム
JP6846134B2 (ja) 映像符号化装置及び映像復号装置
JP6497100B2 (ja) 映像符号化装置、方法及びプログラム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right