KR20190086453A - 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 - Google Patents
부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 Download PDFInfo
- Publication number
- KR20190086453A KR20190086453A KR1020197013979A KR20197013979A KR20190086453A KR 20190086453 A KR20190086453 A KR 20190086453A KR 1020197013979 A KR1020197013979 A KR 1020197013979A KR 20197013979 A KR20197013979 A KR 20197013979A KR 20190086453 A KR20190086453 A KR 20190086453A
- Authority
- KR
- South Korea
- Prior art keywords
- block
- geometry
- sub
- blocks
- predetermined
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 419
- 230000008569 process Effects 0.000 claims abstract description 292
- 238000006243 chemical reaction Methods 0.000 claims abstract description 93
- 238000012545 processing Methods 0.000 claims description 194
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000005192 partition Methods 0.000 description 463
- 230000033001 locomotion Effects 0.000 description 203
- 239000013598 vector Substances 0.000 description 142
- 238000013139 quantization Methods 0.000 description 124
- 238000010586 diagram Methods 0.000 description 71
- 230000006835 compression Effects 0.000 description 58
- 238000007906 compression Methods 0.000 description 58
- 230000004048 modification Effects 0.000 description 49
- 238000012986 modification Methods 0.000 description 49
- 238000000638 solvent extraction Methods 0.000 description 38
- 238000012937 correction Methods 0.000 description 27
- 239000000470 constituent Substances 0.000 description 22
- 230000009466 transformation Effects 0.000 description 21
- 239000000523 sample Substances 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 14
- 238000004590 computer program Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 12
- 230000011664 signaling Effects 0.000 description 12
- 230000002123 temporal effect Effects 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000009795 derivation Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 101100537098 Mus musculus Alyref gene Proteins 0.000 description 5
- 101150095908 apex1 gene Proteins 0.000 description 5
- 238000010187 selection method Methods 0.000 description 5
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000003702 image correction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010130 dispersion processing Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical group COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Error Detection And Correction (AREA)
Abstract
화상의 블록을 부호화하는 부호화 장치는, 프로세서와, 프로세서에 접속된 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 블록의 지오메트리를 읽어내고(S9001), 읽어내어진 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고(S9002), 읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한 경우에(S9002의 Y), 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고(S9003), 읽어내어진 지오메트리가 소정의 지오메트리와 동일하지 않은 경우에(S9002의 N), 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 소정 수의 서브 블록으로 분할하고(S9004), 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화한다(S9005).
Description
본 개시는 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법에 관한 것이다.
HEVC(High-Efficiency Video Coding)라고 하는 영상 부호화 표준 규격이, JCT-VC(Joint Coll aborative Team on Video Coding)에 의해 표준화되어 있다.
H.265(ISO/IEC23008-2 HEVC(High Efficiency Video Coding))
이러한 부호화 및 복호 기술에서는, 압축 효율의 향상 및 처리 부하의 경감이 더 요구되고 있다.
그래서, 본 개시는, 압축 효율의 향상 및 처리 부하의 경감을 더 실현할 수 있는 부호화 장치, 복호 장치, 부호화 방법 또는 복호 방법을 제공한다.
본 개시의 일 양태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와, 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록의 지오메트리를 읽어내고, 읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화한다.
또한, 이들의 전반적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의 조합으로 실현되어도 된다.
본 개시는, 압축 효율의 향상 및 처리 부하의 경감을 더 실현할 수 있는 부호화 장치, 복호 장치, 부호화 방법 또는 복호 방법을 제공할 수 있다.
도 1은, 실시형태 1에 관한 부호화 장치의 기능 구성을 나타내는 블록도이다.
도 2는, 실시형태 1에서의 블록 분할의 일례를 나타내는 도면이다.
도 3은, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다.
도 4a는, ALF에서 이용되는 필터 형상의 일례를 나타내는 도면이다.
도 4b는, ALF에서 이용되는 필터 형상의 다른 일례를 나타내는 도면이다.
도 4c는, ALF에서 이용되는 필터 형상의 다른 일례를 나타내는 도면이다.
도 5a는, 인트라 예측에서의 67개의 인트라 예측 모드를 나타내는 도면이다.
도 5b는, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 플로차트이다.
도 5c는, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 개념도이다.
도 5d는, FRUC의 일례를 나타내는 도면이다.
도 6은, 움직임 궤도를 따르는 2개의 블록 간에서의 패턴 매칭(바이라테랄 매칭)을 설명하기 위한 도면이다.
도 7은, 커렌트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)을 설명하기 위한 도면이다.
도 8은, 등속 직선운동을 가정한 모델을 설명하기 위한 도면이다.
도 9a는, 복수의 인접 블록의 움직임 벡터에 근거하는 서브 블록 단위의 움직임 벡터의 도출을 설명하기 위한 도면이다.
도 9b는, 머지 모드에 의한 움직임 벡터 도출 처리의 개요를 설명하기 위한 도면이다.
도 9c는, DMVR 처리의 개요를 설명하기 위한 개념도이다.
도 9d는, LIC 처리에 의한 휘도 보정 처리를 이용한 예측 화상 생성 방법의 개요를 설명하기 위한 도면이다.
도 10은, 실시형태 1에 관한 복호 장치의 기능 구성을 나타내는 블록도이다.
도 11은, 실시형태 2에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 12는, 실시형태 2에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 13은, 실시형태 3에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 14는, 실시형태 3에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 15는, 실시형태 4에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 16은, 실시형태 4에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 17은, 실시형태 5에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 18은, 실시형태 5에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 19는, 실시형태 6에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 20은, 실시형태 6에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 21은, 실시형태 7에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 22는, 실시형태 7에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 23은, 실시형태 8에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 24는, 실시형태 8에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 25는, 실시형태 9에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 26은, 실시형태 9에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 27은, 실시형태 10에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 28은, 실시형태 10에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 29는, 실시형태 11에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 30은, 실시형태 11에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 31은, 실시형태 12에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 32는, 실시형태 12에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 33은, 실시형태 13에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 34는, 실시형태 13에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 35는, 실시형태에 관한 영상/화상 부호화 장치의 구조를 나타내는 블록도이다.
도 36은, 실시형태에 관한 영상/화상 복호 장치의 구조를 나타내는 블록도이다.
도 37은, 압축 영상 비트 스트림에서의 파라미터의 가능한 위치를 나타내는 도면이다.
도 38은, 블록 분할 정보에 따라 다른 블록 분할의 결과를 나타내는 도면이다.
도 39는, 블록 파티션 구조 조합의 일례를 나타내는 도면이다.
도 40은, 블록 파티션 구조 수정의 일례를 나타내는 도면이다.
도 41은, 분할 방법 및 블록 파티션 구조의 예를 나타내는 도면이다.
도 42a는, 초기 블록 파티션 구조의 수정 예를 나타내는 도면이다.
도 42b는, 초기 블록 파티션 구조의 수정 예를 나타내는 도면이다.
도 42c는, 초기 블록 파티션 구조의 수정 예를 나타내는 도면이다.
도 43은, 초기 블록 파티션 구조의 수정 예를 나타내는 도면이다.
도 44는, 지오메트리에 따라 다른 블록 분할의 결과를 나타내는 도면이다.
도 45a는, 블록의 지오메트리에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 45b는, 블록의 지오메트리에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 45c는, 블록의 지오메트리에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 45d는, 블록의 지오메트리에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 46a는, 파라미터에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 46b는, 파라미터에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 46c는, 파라미터에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 46d는, 파라미터에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 47a는, 블록의 지오메트리에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 47b는, 블록의 지오메트리에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 48a는, 파라미터에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 48b는, 파라미터에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 48c는, 파라미터에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 49a는, 블록 분할 정보의 세트로부터의 블록 분할 정보의 선택의 일례를 나타내는 도면이다.
도 49b는, 블록 분할 정보의 세트로부터의 블록 분할 정보의 선택의 일례를 나타내는 도면이다.
도 50은, 예측 블록 파티션 구조에 근거하는 블록 파티션 구조의 선택의 예를 나타내는 도면이다.
도 51은, 블록 분할 정보의 리스트 정렬의 예를 나타내는 도면이다.
도 52는, 블록 분할 정보의 리스트 정렬의 예를 나타내는 도면이다.
도 53은, 파티션 선택 파라미터의 부호화 비트 및 그 의미를 나타내는 도면이다.
도 54는, 콘텐츠 전송 서비스를 실현하는 콘텐츠 공급 시스템의 전체 구성도이다.
도 55는, 스케일러블 부호화시 부호화 구조의 일례를 나타내는 도면이다.
도 56은, 스케일러블 부호화시 부호화 구조의 일례를 나타내는 도면이다.
도 57은, web 페이지의 표시 화면 예를 나타내는 도면이다.
도 58은, web 페이지의 표시 화면 예를 나타내는 도면이다.
도 59는, 스마트폰의 일례를 나타내는 도면이다.
도 60은, 스마트폰의 구성 예를 나타내는 블록도이다.
도 2는, 실시형태 1에서의 블록 분할의 일례를 나타내는 도면이다.
도 3은, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다.
도 4a는, ALF에서 이용되는 필터 형상의 일례를 나타내는 도면이다.
도 4b는, ALF에서 이용되는 필터 형상의 다른 일례를 나타내는 도면이다.
도 4c는, ALF에서 이용되는 필터 형상의 다른 일례를 나타내는 도면이다.
도 5a는, 인트라 예측에서의 67개의 인트라 예측 모드를 나타내는 도면이다.
도 5b는, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 플로차트이다.
도 5c는, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 개념도이다.
도 5d는, FRUC의 일례를 나타내는 도면이다.
도 6은, 움직임 궤도를 따르는 2개의 블록 간에서의 패턴 매칭(바이라테랄 매칭)을 설명하기 위한 도면이다.
도 7은, 커렌트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)을 설명하기 위한 도면이다.
도 8은, 등속 직선운동을 가정한 모델을 설명하기 위한 도면이다.
도 9a는, 복수의 인접 블록의 움직임 벡터에 근거하는 서브 블록 단위의 움직임 벡터의 도출을 설명하기 위한 도면이다.
도 9b는, 머지 모드에 의한 움직임 벡터 도출 처리의 개요를 설명하기 위한 도면이다.
도 9c는, DMVR 처리의 개요를 설명하기 위한 개념도이다.
도 9d는, LIC 처리에 의한 휘도 보정 처리를 이용한 예측 화상 생성 방법의 개요를 설명하기 위한 도면이다.
도 10은, 실시형태 1에 관한 복호 장치의 기능 구성을 나타내는 블록도이다.
도 11은, 실시형태 2에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 12는, 실시형태 2에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 13은, 실시형태 3에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 14는, 실시형태 3에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 15는, 실시형태 4에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 16은, 실시형태 4에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 17은, 실시형태 5에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 18은, 실시형태 5에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 19는, 실시형태 6에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 20은, 실시형태 6에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 21은, 실시형태 7에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 22는, 실시형태 7에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 23은, 실시형태 8에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 24는, 실시형태 8에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 25는, 실시형태 9에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 26은, 실시형태 9에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 27은, 실시형태 10에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 28은, 실시형태 10에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 29는, 실시형태 11에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 30은, 실시형태 11에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 31은, 실시형태 12에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 32는, 실시형태 12에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 33은, 실시형태 13에 관한 영상 부호화 처리의 일례를 나타내는 플로차트이다.
도 34는, 실시형태 13에 관한 영상 복호 처리의 일례를 나타내는 플로차트이다.
도 35는, 실시형태에 관한 영상/화상 부호화 장치의 구조를 나타내는 블록도이다.
도 36은, 실시형태에 관한 영상/화상 복호 장치의 구조를 나타내는 블록도이다.
도 37은, 압축 영상 비트 스트림에서의 파라미터의 가능한 위치를 나타내는 도면이다.
도 38은, 블록 분할 정보에 따라 다른 블록 분할의 결과를 나타내는 도면이다.
도 39는, 블록 파티션 구조 조합의 일례를 나타내는 도면이다.
도 40은, 블록 파티션 구조 수정의 일례를 나타내는 도면이다.
도 41은, 분할 방법 및 블록 파티션 구조의 예를 나타내는 도면이다.
도 42a는, 초기 블록 파티션 구조의 수정 예를 나타내는 도면이다.
도 42b는, 초기 블록 파티션 구조의 수정 예를 나타내는 도면이다.
도 42c는, 초기 블록 파티션 구조의 수정 예를 나타내는 도면이다.
도 43은, 초기 블록 파티션 구조의 수정 예를 나타내는 도면이다.
도 44는, 지오메트리에 따라 다른 블록 분할의 결과를 나타내는 도면이다.
도 45a는, 블록의 지오메트리에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 45b는, 블록의 지오메트리에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 45c는, 블록의 지오메트리에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 45d는, 블록의 지오메트리에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 46a는, 파라미터에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 46b는, 파라미터에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 46c는, 파라미터에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 46d는, 파라미터에 근거하는 지오메트리의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 47a는, 블록의 지오메트리에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 47b는, 블록의 지오메트리에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 48a는, 파라미터에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 48b는, 파라미터에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 48c는, 파라미터에 근거하는 수의 서브 블록에 대한 블록 분할의 예를 나타내는 도면이다.
도 49a는, 블록 분할 정보의 세트로부터의 블록 분할 정보의 선택의 일례를 나타내는 도면이다.
도 49b는, 블록 분할 정보의 세트로부터의 블록 분할 정보의 선택의 일례를 나타내는 도면이다.
도 50은, 예측 블록 파티션 구조에 근거하는 블록 파티션 구조의 선택의 예를 나타내는 도면이다.
도 51은, 블록 분할 정보의 리스트 정렬의 예를 나타내는 도면이다.
도 52는, 블록 분할 정보의 리스트 정렬의 예를 나타내는 도면이다.
도 53은, 파티션 선택 파라미터의 부호화 비트 및 그 의미를 나타내는 도면이다.
도 54는, 콘텐츠 전송 서비스를 실현하는 콘텐츠 공급 시스템의 전체 구성도이다.
도 55는, 스케일러블 부호화시 부호화 구조의 일례를 나타내는 도면이다.
도 56은, 스케일러블 부호화시 부호화 구조의 일례를 나타내는 도면이다.
도 57은, web 페이지의 표시 화면 예를 나타내는 도면이다.
도 58은, web 페이지의 표시 화면 예를 나타내는 도면이다.
도 59는, 스마트폰의 일례를 나타내는 도면이다.
도 60은, 스마트폰의 구성 예를 나타내는 블록도이다.
(본 개시의 기초가 된 지견)
종래의 화상 및 영상의 부호화 및 복호 방법에서는, 화상은 블록으로 분할되고, 블록 레벨로 부호화 처리 및 복호 처리가 실시된다. 근래의 영상 표준 규격에서는, 통상의 8×8 또는 16×16과 같은 사이즈 이외에도 여러 가지 블록 사이즈로 부호화 처리 및 복호 처리를 실시할 수 있다. 예를 들면, 화상의 부호화 처리 및 복호 처리에서는, 4×4~256×256의 사이즈 범위를 사용할 수 있다.
4×4~256×256의 블록 사이즈의 범위를 나타내기 위해, 분할 모드(예를 들면, 4진 트리 분할 모드 및 2진 트리 분할 모드) 및 분할 플래그(예를 들면, split flag) 등의 블록 분할 정보가 블록에 대해 결정되고, 신호화된다. 이 신호화의 오버헤드는, 분할 깊이가 커짐에 따라 증가한다. 그리고, 오버헤드가 증가하면, 전체의 영상 압축 효율이 저하한다.
그래서, 본 개시에서는, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있는 부호화 장치 및 복호 장치를 제공한다.
이하, 실시형태에 대해 도면을 참조하면서 구체적으로 설명한다.
또한, 이하에서 설명하는 실시형태는, 모두 포괄적 또는 구체적인 예를 나타내는 것이다. 이하의 실시형태에서 나타나는 수치, 형상, 재료, 구성 요소, 구성 요소의 배치 위치 및 접속 형태, 단계, 단계의 순서 등은, 일례이며, 청구범위를 한정하는 주지가 아니다. 또, 이하의 실시형태에서의 구성 요소 중, 최상위 개념을 나타내는 독립 청구항에 기재되지 않은 구성 요소에 대해서는, 임의의 구성 요소로서 설명된다.
(실시형태 1)
우선, 후술하는 본 개시의 각 양태에서 설명하는 처리 및/또는 구성을 적용 가능한 부호화 장치 및 복호화 장치의 일례로서, 실시형태 1의 개요를 설명한다. 단, 실시형태 1은, 본 개시의 각 양태에서 설명하는 처리 및/또는 구성을 적용 가능한 부호화 장치 및 복호화 장치의 일례에 지나지 않고, 본 개시의 각 양태에서 설명하는 처리 및/또는 구성은, 실시형태 1과는 다른 부호화 장치 및 복호화 장치에서도 실시 가능하다.
실시형태 1에 대해 본 개시의 각 양태에서 설명하는 처리 및/또는 구성을 적용하는 경우, 예를 들면 이하 중 어느 하나를 실시해도 된다.
(1)실시형태 1의 부호화 장치 또는 복호화 장치에 대해, 당해 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중, 본 개시의 각 양태에서 설명하는 구성 요소에 대응하는 구성 요소를 본 개시의 각 양태에서 설명하는 구성 요소로 치환하는 것
(2)실시형태 1의 부호화 장치 또는 복호화 장치에 대해, 당해 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소에 대해 기능 또는 실시하는 처리의 추가, 치환, 삭제 등의 임의가 변경을 실시한 후, 본 개시의 각 양태에서 설명하는 구성 요소에 대응하는 구성 요소를 본 개시의 각 양태에서 설명하는 구성 요소로 치환하는 것
(3)실시형태 1의 부호화 장치 또는 복호화 장치가 실시하는 방법에 대해, 처리의 추가 및/또는 당해 방법에 포함되는 복수의 처리 중 일부의 처리에 대해 치환, 삭제 등의 임의가 변경을 실시한 후, 본 개시의 각 양태에서 설명하는 처리에 대응하는 처리를 본 개시의 각 양태에서 설명하는 처리로 치환하는 것
(4)실시형태 1의 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소를 본 개시의 각 양태에서 설명하는 구성 요소, 본 개시의 각 양태에서 설명하는 구성 요소가 구비하는 기능의 일부를 구비하는 구성 요소, 또는 본 개시의 각 양태에서 설명하는 구성 요소가 실시하는 처리의 일부를 실시하는 구성 요소와 조합하여 실시하는 것
(5)실시형태 1의 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소가 구비하는 기능의 일부를 구비하는 구성 요소, 또는 실시형태 1의 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소가 실시하는 처리의 일부를 실시하는 구성 요소를 본 개시의 각 양태에서 설명하는 구성 요소, 본 개시의 각 양태에서 설명하는 구성 요소가 구비하는 기능의 일부를 구비하는 구성 요소, 또는 본 개시의 각 양태에서 설명하는 구성 요소가 실시하는 처리의 일부를 실시하는 구성 요소와 조합하여 실시하는 것
(6)실시형태 1의 부호화 장치 또는 복호화 장치가 실시하는 방법에 대해, 당해 방법에 포함되는 복수의 처리 중, 본 개시의 각 양태에서 설명하는 처리에 대응하는 처리를 본 개시의 각 양태에서 설명하는 처리로 치환하는 것
(7)실시형태 1의 부호화 장치 또는 복호화 장치가 실시하는 방법에 포함되는 복수의 처리 중 일부의 처리를 본 개시의 각 양태에서 설명하는 처리와 조합하여 실시하는 것
또한, 본 개시의 각 양태에서 설명하는 처리 및/또는 구성의 실시 방법은, 상기 예에 한정되는 것이 아니다. 예를 들면, 실시형태 1에서 개시하는 동화상/화상 부호화 장치 또는 동화상/화상 복호화 장치와는 다른 목적으로 이용되는 장치에서 실시되어도 되고, 각 양태에서 설명한 처리 및/또는 구성을 단독으로 실시해도 된다. 또, 다른 양태에서 설명한 처리 및/또는 구성을 조합하여 실시해도 된다.
[부호화 장치의 개요]
우선, 실시형태 1에 관한 부호화 장치의 개요를 설명한다. 도 1은, 실시형태 1에 관한 부호화 장치(100)의 기능 구성을 나타내는 블록도이다. 부호화 장치(100)는, 동화상/화상을 블록 단위로 부호화하는 동화상/화상 부호화 장치이다.
도 1에 나타내는 바와 같이, 부호화 장치(100)는, 화상을 블록 단위로 부호화하는 장치로서, 분할부(102)와, 감산부(104)와, 변환부(106)와, 양자화부(108)와, 엔트로피 부호화부(110)와, 역양자화부(112)와, 역변환부(114)와, 가산부(116)와, 블록 메모리(118)와, 루프 필터부(120)와, 프레임 메모리(122)와, 인트라 예측부(124)와. 인터 예측부(126)와, 예측 제어부(128)를 구비한다.
부호화 장치(100)는, 예를 들면 범용 프로세서 및 메모리에 의해 실현된다. 이 경우, 메모리에 저장된 소프트웨어 프로그램이 프로세서에 의해 실행되었을 때, 프로세서는 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)로서 기능한다. 또, 부호화 장치(100)는 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에 대응하는 전용의 1 이상의 전자회로로서 실현되어도 된다.
이하에, 부호화 장치(100)에 포함되는 각 구성 요소에 대해 설명한다.
[분할부]
분할부(102)는, 입력 동화상에 포함되는 각 픽처를 복수의 블록으로 분할하고, 각 블록을 감산부(104)에 출력한다. 예를 들면, 분할부(102)는, 우선, 픽처를 고정 사이즈(예를 들면 128×128) 블록으로 분할한다. 이 고정 사이즈 블록은, 부호화 트리 유닛(CTU)이라고 하기도 한다. 그리고, 분할부(102)는, 재귀적인 4진 트리(quad tree) 및/또는 2진 트리(binary tree) 블록 분할에 근거하여, 고정 사이즈 블록 각각을 가변 사이즈(예를 들면 64×64 이하) 블록으로 분할한다. 이 가변 사이즈 블록은, 부호화 유닛(CU), 예측 유닛(PU) 혹은 변환 유닛(TU)이라고 하기도 한다. 또한, 본 실시형태에서는, CU, PU 및 TU는 구별될 필요는 없으며, 픽처 내의 일부 또는 모든 블록이 CU, PU, TU의 처리 단위가 되어도 된다.
도 2는, 실시형태 1에서의 블록 분할의 일례를 나타내는 도면이다. 도 2에서, 실선은 4진 트리 블록 분할에 의한 블록 경계를 나타내고, 파선은 2진 트리 블록 분할에 의한 블록 경계를 나타낸다.
여기서는, 블록(10)은, 128×128 화소의 정사각형 블록(128×128 블록)이다. 이 128×128 블록(10)은, 우선, 4개의 정사각형의 64×64 블록으로 분할된다(4진 트리 블록 분할).
왼쪽 위의 64×64 블록은, 2개의 직사각형의 32×64 블록으로 수직으로 더 분할되고, 왼쪽의 32×64 블록은 2개의 직사각형의 16×64 블록으로 수직으로 더 분할된다(2진 트리 블록 분할). 그 결과, 왼쪽 위의 64×64 블록은, 2개의 16×64 블록(11, 12)과 32×64 블록(13)으로 분할된다.
오른쪽 위의 64×64 블록은, 2개의 직사각형의 64×32 블록(14, 15)으로 수평으로 분할된다(2진 트리 블록 분할).
왼쪽 아래의 64×64 블록은, 4개의 정사각형의 32×32 블록으로 분할된다(4진 트리 블록 분할). 4개의 32×32 블록 중 왼쪽 위의 블록 및 오른쪽 아래의 블록은 더 분할된다. 왼쪽 위의 32×32 블록은, 2개의 직사각형의 16×32 블록으로 수직으로 분할되고, 오른쪽의 16×32 블록은 2개의 16×16 블록으로 수평으로 더 분할된다(2진 트리 블록 분할). 오른쪽 아래의 32×32 블록은, 2개의 32×16 블록으로 수평으로 분할된다(2진 트리 블록 분할). 그 결과, 왼쪽 아래의 64×64 블록은, 16×32 블록(16)과 2개의 16×16 블록(17, 18)과 2개의 32×32 블록(19, 20)과 2개의 32×16 블록(21, 22)으로 분할된다.
오른쪽 아래의 64×64 블록(23)은 분할되지 않는다.
이상과 같이, 도 2에서는, 블록(10)은, 재귀적인 4진 트리 및 2진 트리 블록 분할에 근거하여, 13개의 가변 사이즈 블록(11~23)으로 분할된다. 이러한 분할은, QTBT(quad-tree plus binary tree) 분할이라고 하기도 한다.
또한, 도 2에서는, 하나의 블록이 4개 또는 2개의 블록으로 분할되어 있었지만(4진 트리 또는 2진 트리 블록 분할), 분할은 이에 한정되지 않는다. 예를 들면, 하나의 블록이 3개의 블록으로 분할되어도 된다(3진 트리 블록 분할). 이러한 3진 트리 블록 분할을 포함하는 분할은, MBT(multi type tree) 분할이라고 하기도 한다.
[감산부]
감산부(104)는, 분할부(102)에 의해 분할된 블록 단위로 원신호(원샘플)로부터 예측 신호(예측 샘플)를 감산한다. 즉, 감산부(104)는, 부호화 대상 블록(이하, 커렌트 블록이라고 함)의 예측 오차(잔차라고도 함)를 산출한다. 그리고, 감산부(104)는, 산출된 예측 오차를 변환부(106)에 출력한다.
원신호는, 부호화 장치(100)의 입력 신호이며, 동화상을 구성하는 각 픽처의 화상을 나타내는 신호(예를 들면 휘도(luma) 신호 및 2개의 색차(chroma) 신호)이다. 이하에서, 화상을 나타내는 신호를 샘플이라고 하기도 한다.
[변환부]
변환부(106)는, 공간 영역의 예측 오차를 주파수 영역의 변환 계수로 변환하고, 변환 계수를 양자화부(108)에 출력한다. 구체적으로는, 변환부(106)는, 예를 들면 공간 영역의 예측 오차에 대해 미리 정해진 이산 코사인 변환(DCT) 또는 이산 사인 변환(DST)을 실시한다.
또한, 변환부(106)는, 복수의 변환 타입 중에서 적응적으로 변환 타입을 선택하고, 선택된 변환 타입에 대응하는 변환 기저 함수(transform basis function)를 이용하여, 예측 오차를 변환 계수로 변환해도 된다. 이러한 변환은, EMT(explicit multiple core transform) 또는 AMT(adaptive multiple transform)라고 하기도 한다.
복수의 변환 타입은, 예를 들면, DCT-Ⅱ, DCT-Ⅴ, DCT-Ⅷ, DST-Ⅰ 및 DST-Ⅶ를 포함한다. 도 3은, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다. 도 3에서 N은 입력 화소의 수를 나타낸다. 이들 복수의 변환 타입 중에서의 변환 타입의 선택은, 예를 들면, 예측의 종류(인트라 예측 및 인터 예측)에 의존해도 되고, 인트라 예측 모드에 의존해도 된다.
이러한 EMT 또는 AMT를 적용할지 아닐지를 나타내는 정보(예를 들면 AMT 플래그라고 함) 및 선택된 변환 타입을 나타내는 정보는, CU 레벨로 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
또, 변환부(106)는, 변환 계수(변환 결과)를 재변환해도 된다. 이러한 재변환은, AST(adaptive secondary transform) 또는 NSST(non-separable secondary transform)라고 하기도 한다. 예를 들면, 변환부(106)는, 인트라 예측 오차에 대응하는 변환 계수의 블록에 포함되는 서브 블록(예를 들면 4×4 서브 블록)마다 재변환을 실시한다. NSST를 적용할지 아닐지를 나타내는 정보 및 NSST에 이용되는 변환 행렬에 관한 정보는, CU 레벨로 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
여기서, Separable한 변환이란, 입력의 차원 수만큼 방향마다 분리하여 복수회 변환을 실시하는 방식이며, Non-Separable한 변환이란, 입력이 다차원이었을 때 2개 이상의 차원을 통합하여 1차원으로 간주하고, 통합하여 변환을 실시하는 방식이다.
예를 들면, Non-Separable한 변환의 일례로, 입력이 4×4 블록인 경우에는 그를 16개의 요소를 가진 하나의 배열로 간주하고, 그 배열에 대해 16×16의 변환 행렬로 변환 처리를 실시하는 것을 예들 수 있다.
또, 마찬가지로 4×4의 입력 블록을 16개의 요소를 가진 하나의 배열로 간주한 후에, 그 배열에 대해 Givens 회전을 복수회 실시하는 것(Hypercube Givens Transform)도 Non-Separable한 변환의 예이다.
[양자화부]
양자화부(108)는, 변환부(106)로부터 출력된 변환 계수를 양자화한다. 구체적으로는, 양자화부(108)는, 커렌트 블록의 변환 계수를 소정의 주사 순서로 주사하고, 주사된 변환 계수에 대응하는 양자화 파라미터(QP)에 근거하여 당해 변환 계수를 양자화한다. 그리고, 양자화부(108)는, 커렌트 블록의 양자화된 변환 계수(이하, 양자화 계수라고 함)를 엔트로피 부호화부(110) 및 역양자화부(112)에 출력한다.
소정의 순서는, 변환 계수의 양자화/역양자화를 위한 순서이다. 예를 들면, 소정의 주사 순서는, 주파수의 오름차순(저주파에서 고주파 순) 또는 내림차순(고주파에서 저주파 순)으로 정의된다.
양자화 파라미터란, 양자화 단계(양자화 폭)를 정의하는 파라미터이다. 예를 들면, 양자화 파라미터의 값이 증가하면 양자화 단계도 증가한다. 즉, 양자화 파라미터의 값이 증가하면 양자화 오차가 증대한다.
[엔트로피 부호화부]
엔트로피 부호화부(110)는, 양자화부(108)로부터 입력된 양자화 계수를 가변 길이 부호화함으로써 부호화 신호(부호화 비트 스트림)를 생성한다. 구체적으로는, 엔트로피 부호화부(110)는, 예를 들면, 양자화 계수를 2치화하고, 2치 신호를 산술 부호화한다.
[역양자화부]
역양자화부(112)는, 양자화부(108)로부터 입력된 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(112)는, 커렌트 블록의 양자화 계수를 소정의 주사 순서로 역양자화한다. 그리고, 역양자화부(112)는, 커렌트 블록의 역양자화된 변환 계수를 역변환부(114)에 출력한다.
[역변환부]
역변환부(114)는, 역양자화부(112)로부터 입력된 변환 계수를 역변환함으로써 예측 오차를 복원한다. 구체적으로는, 역변환부(114)는, 변환 계수에 대해, 변환부(106)에 의한 변환에 대응하는 역변환을 실시함으로써, 커렌트 블록의 예측 오차를 복원한다. 그리고, 역변환부(114)는, 복원된 예측 오차를 가산부(116)에 출력한다.
또한, 복원된 예측 오차는, 양자화에 의해 정보가 손실되었기 때문에, 감산부(104)가 산출한 예측 오차와 일치하지 않는다. 즉, 복원된 예측 오차에는, 양자화 오차가 포함되어 있다.
[가산부]
가산부(116)는, 역변환부(114)로부터 입력된 예측 오차와 예측 제어부(128)로부터 입력된 예측 샘플을 가산함으로써 커렌트 블록을 재구성한다. 그리고, 가산부(116)는, 재구성된 블록을 블록 메모리(118) 및 루프 필터부(120)에 출력한다. 재구성 블록은, 로컬 복호 블록이라고 하기도 한다.
[블록 메모리]
블록 메모리(118)는, 인트라 예측에서 참조되는 블록으로서 부호화 대상 픽처(이하, 커렌트 픽처라고 함) 내의 블록을 저장하기 위한 기억부이다. 구체적으로는, 블록 메모리(118)는, 가산부(116)로부터 출력된 재구성 블록을 저장한다.
[루프 필터부]
루프 필터부(120)는, 가산부(116)에 의해 재구성된 블록에 루프 필터를 실시하고, 필터된 재구성 블록을 프레임 메모리(122)에 출력한다. 루프 필터란, 부호화 루프 내에서 이용되는 필터(인루프 필터)이며, 예를 들면, 데블로킹 필터(DF), 샘플 어댑티브 오프셋(SAO) 및 어댑티브 루프 필터(ALF) 등을 포함한다.
ALF에서는, 부호화 왜곡을 제거하기 위한 최소 이승 오차 필터가 적용되며, 예를 들면 커렌트 블록 내의 2×2 서브 블록마다 국소적인 구배(gradient)의 방향 및 활성도(activity)에 근거하여 복수의 필터 중에서 선택된 하나의 필터가 적용된다.
구체적으로는, 우선, 서브 블록(예를 들면 2×2 서브 블록)이 복수의 클래스(예를 들면 15 또는 25 클래스)로 분류된다. 서브 블록의 분류는, 구배의 방향 및 활성도에 근거하여 실시된다. 예를 들면, 구배의 방향치(D)(예를 들면 0~2 또는 0~4)와 구배의 활성치(A)(예를 들면 0~4)를 이용하여 분류치(C)(예를 들면 C=5D+A)가 산출된다. 그리고, 분류치(C)에 근거하여, 서브 블록이 복수의 클래스(예를 들면 15 또는 25 클래스)로 분류된다.
구배의 방향치(D)는, 예를 들면, 복수의 방향(예를 들면 수평, 수직 및 2개의 대각 방향)의 구배를 비교함으로써 도출된다. 또, 구배의 활성치(A)는, 예를 들면, 복수 방향의 구배를 가산하고, 가산 결과를 양자화함으로써 도출된다.
이러한 분류의 결과에 근거하여, 복수의 필터 중에서 서브 블록을 위한 필터가 결정된다.
ALF에서 이용되는 필터의 형상으로는 예를 들면 원 대칭 형상이 이용된다. 도 4a~도 4c는, ALF에서 이용되는 필터 형상의 복수의 예를 나타내는 도면이다. 도 4a는, 5×5 다이아몬드 형상 필터를 나타내고, 도 4b는, 7×7 다이아몬드 형상 필터를 나타내며, 도 4c는, 9×9 다이아몬드 형상 필터를 나타낸다. 필터의 형상을 나타내는 정보는, 픽처 레벨로 신호화된다. 또한, 필터의 형상을 나타내는 정보의 신호화는, 픽처 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 CU 레벨)이어도 된다.
ALF의 온/오프는, 예를 들면, 픽처 레벨 또는 CU 레벨로 결정된다. 예를 들면, 휘도에 대해서는 CU 레벨로 ALF를 적용할지 아닐지가 결정되고, 색차에 대해서는 픽처 레벨로 ALF를 적용할지 아닐지가 결정된다. ALF의 온/오프를 나타내는 정보는, 픽처 레벨 또는 CU 레벨로 신호화된다. 또한, ALF의 온/오프를 나타내는 정보의 신호화는, 픽처 레벨 또는 CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
선택 가능한 복수의 필터(예를 들면 15 또는 25까지의 필터)의 계수 세트는, 픽처 레벨로 신호화된다. 또한, 계수 세트의 신호화는, 픽처 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨, CU 레벨 또는 서브 블록 레벨)이어도 된다.
[프레임 메모리]
프레임 메모리(122)는, 인터 예측에 이용되는 참조 픽처를 저장하기 위한 기억부이며, 프레임 버퍼라고 하기도 한다. 구체적으로는, 프레임 메모리(122)는, 루프 필터부(120)에 의해 필터된 재구성 블록을 저장한다.
[인트라 예측부]
인트라 예측부(124)는, 블록 메모리(118)에 저장된 커렌트 픽처 내의 블록을 참조하여 커렌트 블록의 인트라 예측(화면 내 예측이라도 함)을 실시함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(124)는, 커렌트 블록에 인접하는 블록의 샘플(예를 들면 휘도치, 색차치)을 참조하여 인트라 예측을 실시함으로써 인트라 예측 신호를 생성하고, 인트라 예측 신호를 예측 제어부(128)에 출력한다.
예를 들면, 인트라 예측부(124)는, 미리 규정된 복수의 인트라 예측 모드 중 하나를 이용하여 인트라 예측을 실시한다. 복수의 인트라 예측 모드는, 1 이상의 비방향성 예측 모드와 복수의 방향성 예측 모드를 포함한다.
1 이상의 비방향성 예측 모드는, 예를 들면 H.265/HEVC(High-Efficiency Video Coding) 규격(비특허문헌 1)으로 규정된 Planar 예측 모드 및 DC 예측 모드를 포함한다.
복수의 방향성 예측 모드는, 예를 들면 H.265/HEVC 규격으로 규정된 33 방향의 예측 모드를 포함한다. 또한, 복수의 방향성 예측 모드는, 33 방향에 더하여 32 방향의 예측 모드(합계 65개의 방향성 예측 모드)를 더 포함해도 된다. 도 5a는, 인트라 예측에서의 67개의 인트라 예측 모드(2개의 비방향성 예측 모드 및 65개의 방향성 예측 모드)를 나타내는 도면이다. 실선 화살표는 H.265/HEVC 규격으로 규정된 33 방향을 나타내고, 파선 화살표는 추가된 32 방향을 나타낸다.
또한, 색차 블록의 인트라 예측에서, 휘도 블록이 참조되어도 된다. 즉, 커렌트 블록의 휘도 성분에 근거하여, 커렌트 블록의 색차 성분이 예측되어도 된다. 이러한 인트라 예측은, CCLM(cross-component linear model) 예측이라고 하기도 한다. 이러한 휘도 블록을 참조하는 색차 블록의 인트라 예측 모드(예를 들면 CCLM 모드라고 함)는, 색차 블록의 인트라 예측 모드의 하나로서 더해져도 된다.
인트라 예측부(124)는, 수평/수직 방향의 참조 화소의 구배에 근거하여 인트라 예측 후의 화소치를 보정해도 된다. 이러한 보정을 동반하는 인트라 예측은, PDPC(position dependent intra prediction combination)라고 하기도 한다. PDPC의 적용 유무를 나타내는 정보(예를 들면 PDPC 플래그라고 함)는, 예를 들면 CU 레벨로 신호화된다. 또한, 이 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.
[인터 예측부]
인터 예측부(126)는, 프레임 메모리(122)에 저장된 참조 픽처로서 커렌트 픽처와는 다른 참조 픽처를 참조하여 커렌트 블록의 인터 예측(화면 간 예측이라도 함)을 실시함으로써, 예측 신호(인터 예측 신호)를 생성한다. 인터 예측은, 커렌트 블록 또는 커렌트 블록 내의 서브 블록(예를 들면 4×4 블록)의 단위로 실시된다. 예를 들면, 인터 예측부(126)는, 커렌트 블록 또는 서브 블록에 대해 참조 픽처 내에서 움직임 탐색(motion estimation)을 실시한다 .그리고, 인터 예측부(126)는, 움직임 탐색에 의해 얻어진 움직임 정보(예를 들면 움직임 벡터)를 이용하여 움직임 보상을 실시함으로써 커렌트 블록 또는 서브 블록의 인터 예측 신호를 생성한다. 그리고, 인터 예측부(126)는, 생성된 인터 예측 신호를 예측 제어부(128)에 출력한다.
움직임 보상에 이용된 움직임 정보는 신호화된다. 움직임 벡터의 신호화에는, 예측 움직임 벡터(motion vector predictor)가 이용되어도 된다. 즉, 움직임 벡터와 예측 움직임 벡터 사이의 차분이 신호화되어도 된다.
또한, 움직임 탐색에 의해 얻어진 커렌트 블록의 움직임 정보뿐 아니라, 인접 블록의 움직임 정보도 이용하여, 인터 예측 신호가 생성되어도 된다. 구체적으로는, 움직임 탐색에 의해 얻어진 움직임 정보에 근거하는 예측 신호와, 인접 블록의 움직임 정보에 근거하는 예측 신호를 가중 가산함으로써, 커렌트 블록 내의 서브 블록 단위로 인터 예측 신호가 생성되어도 된다. 이러한 인터 예측(움직임 보상)은, OBMC(overlapped block motion compensation)라고 하기도 한다.
이러한 OBMC 모드에서는, OBMC를 위한 서브 블록의 사이즈를 나타내는 정보(예를 들면 OBMC 블록 사이즈라고 함)는, 시퀀스 레벨로 신호화된다. 또, OBMC 모드를 적용할지 아닐지를 나타내는 정보(예를 들면 OBMC 플래그라고 함)는, CU 레벨로 신호화된다. 또한, 이들 정보의 신호화 레벨은, 시퀀스 레벨 및 CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
OBMC 모드에 대해, 보다 구체적으로 설명한다. 도 5b 및 도 5c는, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 플로차트 및 개념도이다.
우선, 부호화 대상 블록에 할당된 움직임 벡터(MV)를 이용하여 통상의 움직임 보상에 의한 예측 화상(Pred)을 취득한다.
다음으로, 부호화가 완료된 왼쪽 인접 블록의 움직임 벡터(MV_L)를 부호화 대상 블록에 적용하여 예측 화상(Pred_L)을 취득하고, 상기 예측 화상과 Pred_L을 가중하여 중첩함으로써 예측 화상의 1회째 보정을 실시한다.
마찬가지로, 부호화가 완료된 위쪽 인접 블록의 움직임 벡터(MV_U)를 부호화 대상 블록에 적용하여 예측 화상(Pred_U)을 취득하고, 상기 1회째 보정을 실시한 예측 화상과 Pred_U를 가중하여 중첩함으로써 예측 화상의 2회째 보정을 실시하고, 그를 최종적인 예측 화상으로 한다.
또한, 여기서는 왼쪽 인접 블록과 위쪽 인접 블록을 이용한 2단계의 보정 방법을 설명했지만, 오른쪽 인접 블록이나 아래쪽 이접 블록을 이용하여 2단계보다도 많은 횟수의 보정을 실시하는 구성으로 하는 것도 가능하다.
또한, 중첩을 실시하는 영역은 블록 전체의 화소 영역이 아니라, 블록 경계 근방의 일부 영역만이어도 된다.
또한, 여기서는 1매의 참조 픽처로부터의 예측 화상 보정 처리에 대해 설명했지만, 복수매의 참조 픽처로부터 예측 화상을 보정하는 경우도 마찬가지며, 각각의 참조 픽처로부터 보정한 예측 화상을 취득한 후에, 얻어진 예측 화상을 더 중첩함으로써 최종적인 예측 화상으로 한다.
또한, 상기 처리 대상 블록은, 예측 블록 단위이어도 되고, 예측 블록을 더 분할한 서브 블록 단위이어도 된다.
OBMC 처리를 적용할지의 판정 방법으로서, 예를 들면, OBMC 처리를 적용할지를 나타내는 신호인 obmc_flag를 이용하는 방법이 있다. 구체적인 일례로는, 부호화 장치에서, 부호화 대상 블록이 움직임이 복잡한 영역에 속해 있는지를 판정하고, 움직임이 복잡한 영역에 속해 있는 경우는 obmc_flag로서 값 1을 설정하여 OBMC 처리를 적용하여 부호화를 실시하고, 움직임이 복잡한 영역에 속해 있지 않은 경우는 obmc_flag로서 값 0을 설정하여 OBMC 처리를 적용하지 않고 부호화를 실시한다. 한편, 복호화 장치에서는, 스트림에 기술된 obmc_flag를 복호화함으로써, 그 값에 따라 OBMC 처리를 적용할지를 전환하여 복호화를 실시한다.
또한, 움직임 정보는 신호화되지 않고, 복호 장치 측에서 도출되어도 된다. 예를 들면, H.265/HEVC 규격으로 규정된 머지 모드가 이용되어도 된다. 또 예를 들면, 복호 장치 측에서 움직임 탐색을 실시함으로써 움직임 정보가 도출되어도 된다. 이 경우, 커렌트 블록의 화소치를 이용하지 않고 움직임 탐색이 실시된다.
여기서, 복호 장치 측에서 움직임 탐색을 실시하는 모드에 대해 설명한다. 이 복호 장치 측에서 움직임 탐색을 실시하는 모드는, PMMVD(pattern matched motion vector derivation) 모드 또는 FRUC(frame rate up-conversion) 모드라고 하기도 한다.
FRUC 처리의 일례를 도 5d에 나타낸다. 우선, 커렌트 블록에 공간적 또는 시간적으로 인접하는 부호화 완료 블록의 움직임 벡터를 참조하여, 각각이 예측 움직임 벡터를 가지는 복수의 후보 리스트(머지 리스트와 공통이어도 됨)가 생성된다. 다음으로, 후보 리스트에 등록되어 있는 복수의 후보 MV 중에서 베스트 후보 MV를 선택한다. 예를 들면, 후보 리스트에 포함되는 각 후보의 평가치가 산출되고, 평가치에 근거하여 하나의 후보가 선택된다.
그리고, 선택된 후보의 움직임 벡터에 근거하여, 커렌트 블록을 위한 움직임 벡터가 도출된다. 구체적으로는, 예를 들면, 선택된 후보의 움직임 벡터(베스트 후보 MV)가 그대로 커렌트 블록을 위한 움직임 벡터로서 도출된다. 또 예를 들면, 선택된 후보의 움직임 벡터에 대응하는 참조 픽처 내 위치의 주변 영역에서, 패턴 매칭을 실시함으로써, 커렌트 블록을 위한 움직임 벡터가 도출되어도 된다. 즉, 베스트 후보 MV의 주변 영역에 대해 동일한 방법으로 탐색을 실시하고, 더 평가치가 좋은 값이 되는 MV가 있는 경우는, 베스트 후보 MV를 상기 MV로 갱신하고, 그를 커렌트 블록의 최종적인 MV로 해도 된다. 또한, 당해 처리를 실시하지 않는 구성으로 하는 것도 가능하다.
서브 블록 단위로 처리를 실시하는 경우도 완전히 동일한 처리로 해도 된다.
또한, 평가치는, 움직임 벡터에 대응하는 참조 픽처 내의 영역과, 소정 영역 사이의 패턴 매칭에 의해 재구성 화상의 차분치를 구함으로써 산출된다. 또한, 차분치에 더하여 그 이외의 정보를 이용하여 평가치를 산출해도 된다.
패턴 매칭으로는, 제1 패턴 매칭 또는 제2 패턴 매칭이 이용된다. 제1 패턴 매칭 및 제2 패턴 매칭은, 각각, 바이라테랄 매칭(bilateral matching) 및 템플릿 매칭(template matching)이라고 하기도 한다.
제1 패턴 매칭에서는, 상이한 2개의 참조 픽처 내의 2개의 블록으로서 커렌트 블록의 움직임 궤도(motion trajectory)를 따르는 2개의 블록 사이에서 패턴 매칭이 실시된다. 따라서, 제1 패턴 매칭에서는, 상술한 후보의 평가치의 산출을 위한 소정의 영역으로서, 커렌트 블록의 움직임 궤도를 따르는 다른 참조 픽처 내의 영역이 이용된다.
도 6은, 움직임 궤도를 따르는 2개의 블록 간에서의 패턴 매칭(바이라테랄 매칭)의 일례를 설명하기 위한 도면이다. 도 6에 나타내는 바와 같이, 제1 패턴 매칭에서는, 커렌트 블록(Cur block)의 움직임 궤도를 따르는 2개의 블록으로서 상이한 2개의 참조 픽처(Ref0, Ref1) 내의 2개의 블록 쌍 중에서 가장 매치하는 쌍을 탐색함으로써 2개의 움직임 벡터(MV0, MV1)가 도출된다. 구체적으로는, 커렌트 블록에 대해, 후보 MV로 지정된 제1 부호화 완료 참조 픽처(Ref0) 내의 지정 위치에서의 재구성 화상과, 상기 후보 MV를 표시 시간 간격으로 스케일링한 대칭 MV로 지정된 제2 부호화 완료 참조 픽처(Ref1) 내의 지정 위치에서의 재구성 화상의 차분을 도출하고, 얻어진 차분치를 이용하여 평가치를 산출한다. 복수의 후보 MV 중에서 가장 평가치가 좋은 값이 되는 후보 MV를 최종 MV로 선택하면 된다.
연속적인 움직임 궤도의 가정 하에서는, 2개의 참조 블록을 가리키는 움직임 벡터(MV0, MV1)는, 커렌트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1) 사이의 시간적인 거리(TD0, TD1)에 대해 비례한다. 예를 들면, 커렌트 픽처가 시간적으로 2개의 참조 픽처 사이에 위치하고, 커렌트 픽처로부터 2개의 참조 픽처에 대한 시간적인 거리가 동일한 경우, 제1 패턴 매칭에서는, 경영(鏡映) 대칭인 쌍방향의 움직임 벡터가 도출된다.
제2 패턴 매칭에서는, 커렌트 픽처 내의 템플릿(커렌트 픽처 내에서 커렌트 블록에 인접하는 블록(예를 들면 위쪽 및/또는 왼쪽 인접 블록))과 참조 픽처 내의 블록 사이에서 패턴 매칭이 실시된다. 따라서, 제2 패턴 매칭에서는, 상술한 후보의 평가치의 산출을 위한 소정 영역으로서, 커렌트 픽처 내의 커렌트 블록에 인접하는 블록이 이용된다.
도 7은, 커렌트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)의 일례를 설명하기 위한 도면이다. 도 7에 나타내는 바와 같이, 제2 패턴 매칭에서는, 커렌트 픽처(Cur Pic) 내에서 커렌트 블록(Cur block)에 인접하는 블록과 가장 매치하는 블록을 참조 픽처(Ref0) 내에서 탐색함으로써 커렌트 블록의 움직임 벡터가 도출된다. 구체적으로는, 커렌트 블록에 대해, 왼쪽 인접 및 위쪽 인접 모두 혹은 어느 한쪽의 부호화 완료 영역의 재구성 화상과, 후보 MV로 지정된 부호화 완료 참조 픽처(Ref0) 내의 동등 위치에서의 재구성 화상의 차분을 도출하고, 얻어진 차분치를 이용하여 평가치를 산출하고, 복수의 후보 MV 중에서 가장 평가치가 좋은 값이 되는 후보 MV를 베스트 후보 MV로 선택하면 된다.
이러한 FRUC 모드를 적용할지 아닐지를 나타내는 정보(예를 들면 FRUC 플래그라고 함)는, CU 레벨로 신호화된다. 또, FRUC 모드가 적용되는 경우(예를 들면 FRUC 플래그가 참일 경우), 패턴 매칭의 방법(제1 패턴 매칭 또는 제2 패턴 매칭)을 나타내는 정보(예를 들면 FRUC 모드 플래그라고 함)가 CU 레벨로 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
여기서, 등속 직선운동을 가정한 모델에 근거하여 움직임 벡터를 도출하는 모드에 대해 설명한다. 이 모드는, BIO(bi-directional optical flow) 모드라고 하기도 한다.
도 8은, 등속 직선운동을 가정한 모델을 설명하기 위한 도면이다. 도 8에서, (vx, vy)는 속도 벡터를 나타내고, τ0, τ1은 각각 커렌트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1) 사이의 시간적인 거리를 나타낸다. (MVx0, MVy0)은 참조 픽처(Ref0)에 대응하는 움직임 벡터를 나타내고, (MVx1, MVy1)는 참조 픽처(Ref1)에 대응하는 움직임 벡터를 나타낸다.
이때 속도 벡터(vx, vy)의 등속 직선운동의 가정 하에서는, (MVx0, MVy0) 및 (MVx1, MVy1)은, 각각 (vxτ0, vyτ0) 및 (-vxτ1, -vyτ1)로 표시되고, 이하의 옵티컬 플로 등식(1)이 성립된다.
여기서, I(k)는, 움직임 보상 후의 참조 화상 k(k=0, 1)의 휘도치를 나타낸다. 이 옵티컬 플로 등식은, (ⅰ)휘도치의 시간 미분과, (ⅱ)수평 방향의 속도 및 참조 화상의 공간 구배의 수평 성분의 곱과, (ⅲ)수직 방향의 속도 및 참조 화상의 공간 구배의 수직 성분의 곱의 합이, 제로와 동일한 것을 나타낸다. 이 옵티컬 플로 등식과 에르미트 보간(Hermite interpolation)의 조합에 근거하여, 머지 리스트 등에서 얻어지는 블록 단위의 움직임 벡터가 화소 단위로 보정된다.
또한, 등속 직선운동을 가정한 모델에 근거하는 움직임 벡터의 도출과는 다른 방법으로, 복호 장치 측에서 움직임 벡터가 도출되어도 된다. 예를 들면, 복수의 인접 블록의 움직임 벡터에 근거하여 서브 블록 단위로 움직임 벡터가 도출되어도 된다.
여기서, 복수의 인접 블록의 움직임 벡터에 근거하여 서브 블록 단위로 움직임 벡터를 도출하는 모드에 대해 설명한다. 이 모드는, 아핀 움직임 보상 예측(affine motion compensation prediction) 모드라고 하기도 한다.
도 9a는, 복수의 인접 블록의 움직임 벡터에 근거하는 서브 블록 단위의 움직임 벡터의 도출을 설명하기 위한 도면이다. 도 9a에서, 커렌트 블록은, 16의 4×4 서브 블록을 포함한다. 여기서는, 인접 블록의 움직임 벡터에 근거하여 커렌트 블록의 왼쪽 위 모퉁이 제어 포인트의 움직임 벡터(v0)갸 도출되고, 인접 서브 블록의 움직임 벡터에 근거하여 커렌트 블록의 오른쪽 위 모퉁이 제어 포인트의 움직임 벡터(v1)가 도출된다. 그리고, 2개의 움직임 벡터(v0 및 v1)를 이용하여, 이하의 식(2)에 의해 커렌트 블록 내의 각 서브 블록의 움직임 벡터(vx, vy)가 도출된다.
여기서, x 및 y는 각각 서브 블록의 수평 위치 및 수직 위치를 나타내고, w는 미리 정해진 중량 계수를 나타낸다.
이러한 아핀 움직임 보상 예측 모드에서는, 왼쪽 위 및 오른쪽 위 모퉁이 제어 포인트의 움직임 벡터의 도출 방법이 다른 몇 개의 모드를 포함해도 된다. 이러한 아핀 움직임 보상 예측 모드를 나타내는 정보(예를 들면 아핀 플래그라고 함)는, CU 레벨로 신호화된다. 또한, 이 아핀 움직임 보상 예측 모드를 나타내는 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
[예측 제어부]
예측 제어부(128)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 하나를 선택하고, 선택한 신호를 예측 신호로서 감산부(104) 및 가산부(116)에 출력한다.
여기서, 머지 모드에 의해 부호화 대상 픽처의 움직임 벡터를 도출하는 예를 설명한다. 도 9b는, 머지 모드에 의한 움직임 벡터 도출 처리의 개요를 설명하기 위한 도면이다.
우선, 예측 MV의 후보를 등록한 예측 MV 리스트를 생성한다. 예측 MV의 후보로는, 부호화 대상 블록의 공간적으로 주변에 위치하는 복수의 부호화 완료 블록이 가지는 MV인 공간 인접 예측 MV, 부호화 완료 참조 픽처에서의 부호화 대상 블록의 위치를 투영한 부근의 블록이 가지는 MV인 시간 인접 예측 MV, 공간 인접 예측 MV와 시간 인접 예측 MV의 MV 값을 조합하여 생성한 MV인 결합 예측 MV 및 값이 제로의 MV인 제로 예측 MV 등이 있다.
다음으로, 예측 MV 리스트에 등록되어 있는 복수의 예측 MV 중에서 하나의 예측 MV를 선택함으로써, 부호화 대상 블록의 MV로서 결정한다.
또한 가변 길이 부호화부에서는, 어느 예측 MV를 선택했는지를 나타내는 신호인 merge_idx를 스트림에 기술하여 부호화한다.
또한, 도 9b에서 설명한 예측 MV 리스트에 등록하는 예측 MV는 일례이며, 도면 중의 개수와는 다른 개수이거나, 도면 중의 예측 MV의 일부 종류를 포함하지 않는 구성이거나, 도면 중의 예측 MV의 종류 이외의 예측 MV를 추가한 구성이거나 해도 된다.
또한, 머지 모드에 의해 도출한 부호화 대상 블록의 MV를 이용하여, 후술하는 DMVR 처리를 실시함으로써 최종적인 MV를 결정해도 된다.
여기서, DMVR 처리를 이용하여 MV를 결정하는 예에 대해 설명한다.
도 9c는, DMVR 처리의 개요를 설명하기 위한 개념도이다.
우선, 처리 대상 블록에 설정된 최적 MVP를 후보 MV로 하여, 상기 후보 MV에 따라 L0 방향의 처리 완료 픽처인 제1 참조 픽처 및 L1방향의 처리 완료 픽처인 제2 참조 픽처로부터 참조 화소를 각각 취득하고, 각 참조 화소의 평균을 취함으로써 템플릿을 생성한다.
다음으로, 상기 템플릿을 이용하여, 제1 참조 픽처 및 제2 참조 픽처의 후보 MV의 주변 영역을 각각 탐색하고, 가장 코스트가 최소가 되는 MV를 최종적인 MV로서 결정한다. 또한, 코스트 값은 템플릿의 각 화소치와 탐색 영역의 각 화소치의 차분치 및 MV 값 등을 이용하여 산출한다.
또한, 부호화 장치 및 복호화 장치에서는, 여기서 설명한 처리의 개요는 기본적으로 공통이다.
또한, 여기서 설명한 처리 그 자체가 아니어도, 후보 MV의 주변을 탐색하여 최종적인 MV를 도출할 수 있는 처리이면, 다른 처리를 이용해도 된다.
여기서, LIC 처리를 이용하여 예측 화상을 생성하는 모드에 대해 설명한다.
도 9d는, LIC 처리에 의한 휘도 보정 처리를 이용한 예측 화상 생성 방법의 개요를 설명하기 위한 도면이다.
우선, 부호화 완료 픽처인 참조 픽처로부터 부호화 대상 블록에 대응하는 참조 화상을 취득하기 위한 MV를 도출한다.
다음으로, 부호화 대상 블록에 대해, 왼쪽 인접 및 위쪽 인접 부호화 완료 주변 참조 영역의 휘도 화소치와, MV로 지정된 참조 픽처 내의 동등 위치에서의 휘도 화소치를 이용하여, 참조 픽처와 부호화 대상 픽처에서 휘도치가 어떻게 변화했는지를 나타내는 정보를 추출하여 휘도 보정 파라미터를 산출한다.
MV로 지정된 참조 픽처 내의 참조 화상에 대해 상기 휘도 보정 파라미터를 이용하여 휘도 보정 처리를 실시함으로써, 부호화 대상 블록에 대한 예측 화상을 생성한다.
또한, 도 9d에서의 상기 주변 참조 영역의 형상은 일례이며, 이 이외의 형상을 이용해도 된다.
또, 여기서는 1매의 참조 픽처로부터 예측 화상을 생성하는 처리에 대해 설명했지만, 복수매의 참조 픽처로부터 예측 화상을 생성하는 경우도 마찬가지며, 각각의 참조 픽처로부터 취득한 참조 화상에 동일한 방법으로 휘도 보정 처리를 실시한 후 예측 화상을 생성한다.
LIC 처리를 적용할지의 판정 방법으로서, 예를 들면, LIC 처리를 적용할지를 나타내는 신호인 lic_flag를 이용하는 방법이 있다. 구체적인 일례로는, 부호화 장치에서, 부호화 대상 블록이 휘도 변화가 발생하고 있는 영역에 속해 있는지를 판정하고, 휘도 변화가 발생하고 있는 영역에 속해 있는 경우는 lic_flag로서 값 1을 설정하여 LIC 처리를 적용하여 부호화를 실시하고, 휘도 변화가 발생하고 있는 영역에 속해 있지 않은 경우는 lic_flag로서 값 0을 설정하여 LIC 처리를 적용하지 않고 부호화를 실시한다. 한편, 복호화 장치에서는, 스트림에 기술된 lic_flag를 복호화함으로써, 그 값에 따라 LIC 처리를 적용할지를 전환하여 복호화를 실시한다.
LIC 처리를 적용할지의 판정의 다른 방법으로서, 예를 들면, 주변 블록에서 LIC 처리를 적용했는지에 따라 판정하는 방법도 있다. 구체적인 일례로는, 부호화 대상 블록이 머지 모드인 경우, 머지 모드 처리에서의 MV 도출 시에 선택한 주변의 부호화 완료 블록이 LIC 처리를 적용하여 부호화했는지를 판정하고, 그 결과에 따라 LIC 처리를 적용할지를 전환하여 부호화를 실시한다. 또한, 이 예의 경우, 복호화에서의 처리도 완전히 동일해진다.
[복호 장치의 개요]
다음으로, 상기의 부호화 장치(100)에서 출력된 부호화 신호(부호화 비트 스트림)를 복호 가능한 복호 장치의 개요에 대해 설명한다. 도 10은, 실시형태 1에 관한 복호 장치(200)의 기능 구성을 나타내는 블록도이다. 복호 장치(200)는, 동화상/화상을 블록 단위로 복호하는 동화상/화상 복호 장치이다.
도 10에 나타내는 바와 같이, 복호 장치(200)는, 엔트로피 복호부(202)와, 역양자화부(204)와, 역변환부(206)와, 가산부(208)와, 블록 메모리(210)와, 루프 필터부(212)와, 프레임 메모리(214)와, 인트라 예측부(216)와, 인터 예측부(218)와, 예측 제어부(220)를 구비한다.
복호 장치(200)는, 예를 들면, 범용 프로세서 및 메모리에 의해 실현된다. 이 경우, 메모리에 저장된 소프트웨어 프로그램이 프로세서에 의해 실행되었을 때, 프로세서는 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 루프 필터부(212), 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)로서 기능한다. 또, 복호 장치(200)는 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 루프 필터부(212), 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)에 대응하는 전용의 1 이상의 전자회로로서 실현되어도 된다.
이하에, 복호 장치(200)에 포함되는 각 구성 요소에 대해 설명한다.
[엔트로피 복호부]
엔트로피 복호부(202)는, 부호화 비트 스트림을 엔트로피 복호한다. 구체적으로는, 엔트로피 복호부(202)는, 예를 들면, 부호화 비트 스트림으로부터 2치 신호로 산술 복호한다. 그리고, 엔트로피 복호부(202)는, 2치 신호를 다치화(debinarize)한다. 이에 의해, 엔트로피 복호부(202)는, 블록 단위로 양자화 계수를 역양자화부(204)에 출력한다.
[역양자화부]
역양자화부(204)는, 엔트로피 복호부(202)로부터 입력된 복호 대상 블록(이하, 커렌트 블록이라고 함)의 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(204)는, 커렌트 블록의 양자화 계수의 각각에 대해, 당해 양자화 계수에 대응하는 양자화 파라미터에 근거하여 당해 양자화 계수를 역양자화한다. 그리고, 역양자화부(204)는, 커렌트 블록의 역양자화된 양자화 계수(즉 변환 계수)를 역변환부(206)에 출력한다.
[역변환부]
역변환부(206)는, 역양자화부(204)로부터 입력된 변환 계수를 역변환함으로써 예측 오차를 복원한다.
예를 들면 부호화 비트 스트림으로부터 해독된 정보가 EMT 또는 AMT를 적용하는 것을 나타내는 경우(예를 들면 AMT 플래그가 참), 역변환부(206)는, 해독된 변환 타입을 나타내는 정보에 근거하여 커렌트 블록의 변환 계수를 역변환한다.
또 예를 들면, 부호화 비트 스트림으로부터 해독된 정보가 NSST를 적용하는 것을 나타내는 경우, 역변환부(206)는 변환 계수에 역재변환을 적용한다.
[가산부]
가산부(208)는, 역변환부(206)로부터 입력된 예측 오차와 예측 제어부(220)로부터 입력된 예측 샘플을 가산함으로써 커렌트 블록을 재구성한다. 그리고, 가산부(208)는, 재구성된 블록을 블록 메모리(210) 및 루프 필터부(212)에 출력한다.
[블록 메모리]
블록 메모리(210)는, 인트라 예측에서 참조되는 블록으로서 복호 대상 픽처(이하, 커렌트 픽처라고 함) 내의 블록을 저장하기 위한 기억부이다. 구체적으로는, 블록 메모리(210)는, 가산부(208)로부터 출력된 재구성 블록을 저장한다.
[루프 필터부]
루프 필터부(212)는, 가산부(208)에 의해 재구성된 블록에 루프 필터를 실시하고, 필터된 재구성 블록을 프레임 메모리(214) 및 표시 장치 등에 출력한다.
부호화 비트 스트림으로부터 해독된 ALF의 온/오프를 나타내는 정보가 ALF의 온을 나타내는 경우, 국소적인 구배의 방향 및 활성도에 근거하여 복수의 필터 중에서 하나의 필터가 선택되고, 선택된 필터가 재구성 블록에 적용된다.
[프레임 메모리]
프레임 메모리(214)는, 인터 예측에 이용되는 참조 픽처를 저장하기 위한 기억부이며, 프레임 버퍼라고 하기도 한다. 구체적으로는, 프레임 메모리(214)는, 루프 필터부(212)에 의해 필터된 재구성 블록을 저장한다.
[인트라 예측부]
인트라 예측부(216)는, 부호화 비트 스트림으로부터 해독된 인트라 예측 모드에 근거하여, 블록 메모리(210)에 저장된 커렌트 픽처 내의 블록을 참조하여 인트라 예측을 실시함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(216)는, 커렌트 블록에 인접하는 블록의 샘플(예를 들면 휘도치, 색차치)을 참조하여 인트라 예측을 실시함으로써 인트라 예측 신호를 생성하고, 인트라 예측 신호를 예측 제어부(220)에 출력한다.
또한, 색차 블록의 인트라 예측에서 휘도 블록을 참조하는 인트라 예측 모드가 선택되어 있는 경우는, 인트라 예측부(216)는, 커렌트 블록의 휘도 성분에 근거하여, 커렌트 블록의 색차 성분을 예측해도 된다.
또, 부호화 비트 스트림으로부터 해독된 정보가 PDPC의 적용을 나타내는 경우, 인트라 예측부(216)는, 수평/수직 방향의 참조 화소의 구배에 근거하여 인트라 예측 후의 화소치를 보정한다.
[인터 예측부]
인터 예측부(218)는, 프레임 메모리(214)에 저장된 참조 픽처를 참조하여, 커렌트 블록을 예측한다. 예측은, 커렌트 블록 또는 커렌트 블록 내의 서브 블록(예를 들면 4×4 블록)의 단위로 실시된다. 예를 들면, 인터 예측부(218)는, 부호화 비트 스트림으로부터 해독된 움직임 정보(예를 들면 움직임 벡터)를 이용하여 움직임 보상을 실시함으로써 커렌트 블록 또는 서브 블록의 인터 예측 신호를 생성하고, 인터 예측 신호를 예측 제어부(220)에 출력한다.
또한, 부호화 비트 스트림으로부터 해독된 정보가 OBMC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 움직임 탐색에 의해 얻어진 커렌트 블록의 움직임 정보뿐 아니라, 인접 블록의 움직임 정보도 이용하여, 인터 예측 신호를 생성한다.
또, 부호화 비트 스트림으로부터 해독된 정보가 FRUC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 부호화 스트림으로부터 해독된 패턴 매칭의 방법(바이라테랄 매칭 또는 템플릿 매칭)에 따라 움직임 탐색을 실시함으로써 움직임 정보를 도출한다. 그리고, 인터 예측부(218)는, 도출된 움직임 정보를 이용하여 움직임 보상을 실시한다.
또, 인터 예측부(218)는, BIO 모드가 적용되는 경우에, 등속 직선운동을 가정한 모델에 근거하여 움직임 벡터를 도출한다. 또, 부호화 비트 스트림으로부터 해독된 정보가 아핀 움직임 보상 예측 모드를 적용하는 것을 나타내는 경우에는, 인터 예측부(218)는, 복수의 인접 블록의 움직임 벡터에 근거하여 서브 블록 단위로 움직임 벡터를 도출한다.
[예측 제어부]
예측 제어부(220)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 하나를 선택하고, 선택한 신호를 예측 신호로서 가산부(208)에 출력한다.
(실시형태 2)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여 파라미터를 비트 스트림에 기입하고, 기입된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고, 기입된 상기 파라미터가 상기 소정 값과 동일한 경우에, 블록 분할 정보를 예측하고, 예측된 상기 블록 분할 정보를 이용하여 블록을 복수의 서브 블록으로 분할하고, 기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 예측된 상기 블록 분할 정보를 이용하지 않고, 블록을 복수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 부호화한다.
이에 의해, 파라미터가 소정 값과 동일한 경우에, 블록 분할 정보를 예측할 수 있다. 이 예측된 블록 분할 정보를 이용하여 블록을 분할함으로써, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 블록 분할 정보를 예측하는 처리는, 부호화 완료 블록의 블록 정보를 이용하여, 블록 분할 정보를 생성하는 처리를 포함해도 된다.
이에 의해, 부호화 완료 블록의 블록 정보를 이용하여 블록 분할 정보를 예측할 수 있고, 블록 분할 정보의 예측 정밀도를 향상시켜, 부호량을 삭감할 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여 비트 스트림으로부터 파라미터를 해석하고, 해석된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고, 해석된 상기 파라미터가 상기 소정 값과 동일한 경우에, 블록 분할 정보를 예측하고, 예측된 상기 블록 분할 정보를 이용하여 블록을 복수의 서브 블록으로 분할하고, 기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 예측된 상기 블록 분할 정보를 이용하지 않고, 블록을 복수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 복호한다.
이에 의해, 파라미터가 소정 값과 동일한 경우에, 블록 분할 정보를 예측할 수 있다. 이 예측된 블록 분할 정보를 이용하여 블록을 분할함으로써, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 블록 분할 정보를 예측하는 처리는, 복호 완료 블록의 블록 정보를 이용하여 블록 분할 정보를 생성하는 처리를 포함해도 된다.
이에 의해, 복호 완료 블록의 블록 정보를 이용하여 블록 분할 정보를 예측할 수 있고, 블록 분할 정보의 예측 정밀도를 향상시켜, 부호량을 삭감할 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 11 및 도 12에 각각 나타내는 대로, 실시형태에 따라 설명한다. 또, 영상을 부호화하는 장치 및 복호하는 장치를 도 35 및 도 36에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 11은, 실시형태 2에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S1001로서, 비트 스트림에 파라미터가 기입된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 기입 가능한 위치를 나타낸다. 기입된 파라미터는, 블록 분할 정보의 예측이 유효한지 아닌지를 식별하기 위한 1 이상의 파라미터를 포함한다. 예를 들면, 1 이상의 파라미터는, 블록 분할 정보의 예측이 유효한지 아닌지를 나타내는 플래그를 포함할 수 있다.
다음으로, 단계 S1002에서, 기입된 파라미터가 소정 값과 동일한지 아닌지가 판정된다.
기입된 파라미터가 소정 값과 동일하면(S1002의 Y), 단계 S1003에서 블록 분할 정보가 예측되고, 그 후, 단계 S1004에서, 예측 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다. 예를 들면, 예측 블록 분할 정보는, 초기 블록 분할 정보로서 이용된다. 그리고, 초기 블록 분할 정보는, 최종 블록 분할 정보로 갱신된다.
최종 블록 분할 정보는, 인트라 및 인터 예측 처리 중에, 다른 사용 가능한 블록 분할 정보에 대해 레이트 왜곡 코스트가 최소가 되도록 결정된다. 예측 블록 분할 정보와 최종 블록 분할 정보의 차분 정보가 비트 스트림에 기입됨으로써, 디코더에서, 예측 블록 분할 정보에 근거하여, 대응하는 최종 블록 분할 정보가 생성된다. 최종 블록 분할 정보 대신 차분 정보를 부호화함으로써, 최종 블록 분할 정보의 신호화에 필요한 비트를 줄일 수 있다.
분할 방법으로는, 예를 들면, 도 41의 b1) 및 b2)에 나타내는 바와 같은 2진 트리 분할, 또는 도 41의 q1) 및 q2)에 나타내는 바와 같은 4진 트리 분할, 또는 도 41의 m1) 및 m2)에 나타내는 바와 같은 다중 트리 커트/분할, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할이 가능하다. 서브 블록의 지오메트리(형상 및/또는 크기)로는, 도 41의 b2)에 나타내는 바와 같은 비대칭 2진 트리 분할, 도 41의 q2)에 나타내는 바와 같은 비대칭 4진 트리 분할, 도 41의 m1)에 나타내는 바와 같은 크기가 다른 다중 트리 커트, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할과 같이, 여러 가지 지오메트리가 있을 수 있다.
여기서, 블록 분할 정보는, 부호화 완료 블록의 블록 정보(예를 들면, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이 등)에 따라 예측할 수 있다. 블록은, 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할된다. 도 38에 나타내는 바와 같이, 이용하는 블록 분할 정보가 다르면, 블록 분할의 결과인 복수의 서브 블록의 높이, 폭, 또는 형상도 다르다.
커렌트 블록의 예측 블록 파티션 구조로는, 부호화 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 부호화 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다.
부호화 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 부호화 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 부호화된 1 이상의 부호화 완료 블록이 선택된다.
부호화 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다.
예측 블록 분할 정보는, 부호화 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 예측하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 세로 분할을 포함하는 블록 분할 정보를 예측할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 가로 분할을 포함하는 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
블록 분할 정보는, 부호화 완료 블록의 인트라/인터 예측 모드에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 부호화 완료 블록의 예측 모드가 인터 예측 모드인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 움직임 벡터에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 한편, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 양자화 파라미터에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 참조 픽처 정보에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우, 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 분할 깊이에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 부호화 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 부호화 완료 블록의 분할 정보에 따라 예측되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 부호화 완료 프레임의 부호화 완료 블록(예를 들면, 같은 위치 블록(collocated block), 직전의 부호화 완료 블록(last encoded block), 또는 움직임 벡터로 특정되는 부호화 완료 블록 등)으로부터 예측할 수 있다.
기입된 파라미터가 소정 값과 동일하지 않은 경우(S1002의 N), 단계 S1005에서, 예측 블록 분할 정보를 이용하지 않고, 블록이 복수의 서브 블록으로 분할된다. 분할 방법으로는, 예를 들면, 도 41의 b1) 및 b2)에 나타내는 바와 같은 2진 트리 분할, 또는 도 41의 q1) 및 q2)에 나타내는 바와 같은 4진 트리 분할, 또는 도 41의 m1) 및 m2)에 나타내는 바와 같은 다중 트리 커트/분할, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할이 가능하다. 서브 블록의 지오메트리(형상 및/또는 크기)로는, 도 41의 b2)에 나타내는 바와 같은 비대칭 2진 트리 분할, 도 41의 q2)에 나타내는 바와 같은 비대칭 4진 트리 분할, 도 41의 m1)에 나타내는 바와 같은 크기가 다른 다중 트리 커트, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할과 같이, 여러 가지 지오메트리가 있을 수 있다.
단계 S1006에서는, 복수의 서브 블록에 포함되는 서브 블록이 부호화 처리로 부호화된다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
도 35는, 실시형태에 관한 영상/화상 부호화 장치의 구조를 나타내는 블록도이다.
영상 부호화 장치(25000)는, 입력 영상/화상 비트 스트림을 블록마다 부호화하고, 부호화 출력 비트 스트림을 생성하는 장치이며, 도 35에 나타내는 바와 같이, 변환부(25001), 양자화부(25002), 역양자화부(25003), 역변환부(25004), 블록 메모리(25005), 프레임 메모리(25006), 인트라 예측부(25007), 인터 예측부(25008), 엔트로피 부호화부(25009) 및 블록 분할 정보 결정부(25010)를 포함한다.
입력 영상은 가산기에 입력되고, 가산 후의 값이 변환부(25001)에 출력된다. 변환부(25001)은, 블록 분할 정보 결정부(25010)에 의해 도출된 블록 분할 정보에 근거하여 가산 후의 값을 주파수 계수로 변환하고, 얻어진 주파수 계수를 양자화부(25002)에 출력한다. 양자화부(25002)는, 입력된 주파수 계수를 양자화하고, 얻어진 양자화 값을 역양자화부(25003) 및 엔트로피 부호화부(25009)에 출력한다.
역양자화부(25003)는, 양자화부(25002)로부터 출력된 양자화 값을 역양자화하고, 주파수 계수를 역변환부(25004)에 출력한다. 역변환부(25004)는, 블록 분할 정보 결정부(25010)에 의해 도출된 블록 분할 정보에 근거하여 주파수 계수를 역주파수 변환함으로써 비트 스트림의 샘플 값으로 변환하고, 얻어진 샘플 값을 가산기에 출력한다.
가산기는, 역변환부(25004)로부터 출력된 비트 스트림의 샘플 값을 인트라 예측부(25007)/인터 예측부(25008)로부터 출력된 영상/화상의 예측치에 가산하고, 얻어진 가산 후의 값을 향후 예측을 위해 블록 메모리(25005) 또는 프레임 메모리(25006)에 출력한다.
블록 분할 정보 결정부(25010)는, 블록 모리(25005) 또는 프레임 메모리(25006)로부터 블록 정보를 수집함으로써, 블록 분할 정보 및 블록 분할 정보에 관한 파라미터를 도출한다. 여기서 도출된 블록 분할 정보가 이용되면, 블록은 복수의 서브 블록으로 분할된다.
인트라 예측부(25007)/인터 예측부(25008)는, 블록 분할 정보 결정부(25010)에 의해 도출된 블록 분할 정보에 근거하여, 블록 메모리(25005)에 기억되어 있는 재구축 영상/화상 또는 프레임 메모리(25006)에 있는 재구축 영상/화상을 검색하고, 예를 들면 입력 영상/화상에 가장 유사한 영상/화상 영역을 예측을 위해 추정한다.
엔트로피 부호화부(25009)는, 양자화부(25002)로부터 출력된 양자화 값을 부호화하고, 블록 분할 정보 결정부(25010)로부터의 파라미터를 부호화하고, 비트 스트림을 출력한다.
[복호 처리]
도 12는, 실시형태 2에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S2001로서, 비트 스트림으로부터 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 해석 가능한 위치를 나타낸다. 해석된 파라미터는, 블록 분할 정보의 예측이 유효한지 아닌지를 식별하기 위한 1 이상의 파라미터를 포함한다. 이 1 이상의 파라미터는, 예를 들면, 플래그가 포함되면, 블록 분할 정보의 예측이 유효한지 아닌지를 나타낼 수 있다.
다음으로, 단계 S2002에서, 해석된 파라미터가 소정 값과 동일한지 아닌지가 판정된다.
해석된 파라미터가 소정 값과 동일한 경우(S2002의 Y), 단계 S2003에서, 블록 분할 정보가 예측되고, 그 후, 단계 S2004에서, 예측 블록 분할 정보를 이용하여, 블록이 복수의 서브 블록으로 분할된다. 예측 블록 분할 정보는, 예를 들면, 초기 블록 분할 정보로서 이용된다. 그리고, 초기 블록 분할 정보는, 비트 스트림으로부터 해석되는 차분 정보로서 예측 블록 분할 정보와 최종 블록 분할 정보의 차분 정보에 따라, 최종 블록 분할 정보로 갱신된다. 분할 방법으로는, 예를 들면, 도 41의 b1) 및 b2)에 나타내는 바와 같은 2진 트리 분할, 또는 도 41의 q1) 및 q2)에 나타내는 바와 같은 4진 트리 분할, 또는 도 41의 m1) 및 m2)에 나타내는 바와 같은 다중 트리 커트/분할, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할이 가능하다. 서브 블록의 지오메트리(형상 및/또는 크기)로는, 도 41의 b2)에 나타내는 바와 같은 비대칭 2진 트리 분할, 도 41의 q2)에 나타내는 바와 같은 비대칭 4진 트리 분할, 도 41의 m1)에 나타내는 바와 같은 크기가 다른 다중 트리 커트, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할과 같이, 여러 가지 지오메트리가 있을 수 있다.
여기서, 블록 분할 정보는, 복호 완료 블록의 블록 정보(예를 들면, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이 등)에 따라 예측할 수 있다. 블록은, 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할된다. 도 38에 나타내는 바와 같이, 이용하는 블록 분할 정보가 다르면, 블록 분할의 결과인 복수의 서브 블록의 높이, 폭, 또는 형상도 다르다.
커렌트 블록의 예측 블록 파티션 구조로는, 복호 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 복호 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다. 복호 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 복호 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 복호된 1 이상의 복호 완료 블록이 선택된다.
복호 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다.
예측 블록 분할 정보는, 복호 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 예측하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 세로 분할을 포함하는 블록 분할 정보를 예측할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 가로 분할을 포함하는 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
블록 분할 정보는, 복호 완료 블록의 인트라/인터 예측 모드에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 복호 완료 블록의 예측 모드가 인터 예측 모드인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 움직임 벡터에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 한편, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 양자화 파라미터에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 참조 픽처 정보에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우, 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 분할 깊이에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 복호 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 복호 완료 블록의 분할 정보에 따라 예측되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 복호 완료 프레임의 복호 완료 블록(예를 들면, 같은 위치 블록(collocated block), 최후 복호 완료 블록(last decoded block), 또는 움직임 벡터로 특정되는 복호 완료 블록 등)으로부터 예측될 수 있다.
기입된 파라미터가 소정 값과 동일하지 않은 경우(S2002의 N), 단계 S2005에서, 예측 블록 분할 정보를 이용하지 않고, 블록이 복수의 서브 블록으로 분할된다. 분할 방법으로는, 예를 들면, 도 41의 b1) 및 b2)에 나타내는 바와 같은 2진 트리 분할, 또는 도 41의 q1) 및 q2)에 나타내는 바와 같은 4진 트리 분할, 또는 도 41의 m1) 및 m2)에 나타내는 바와 같은 다중 트리 커트/분할, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할이 가능하다. 서브 블록의 지오메트리(형상 및/또는 크기)로는, 도 41의 b2)에 나타내는 바와 같은 비대칭 2진 트리 분할, 도 41의 q2)에 나타내는 바와 같은 비대칭 4진 트리 분할, 도 41의 m1)에 나타내는 바와 같은 크기가 다른 다중 트리 커트, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할과 같이, 여러 가지 지오메트리가 있을 수 있다.
단계 S2006에서는, 복수의 서브 블록에 포함되는 서브 블록이 복호 처리로 복호된다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
도 36은, 실시형태에 관한 영상/화상 복호 장치의 구조를 나타내는 블록도이다.
영상 복호 장치(26000)는, 부호화 입력 비트 스트림을 블록마다 복호하고, 영상/화상을 출력하는 장치이며, 도 36에 나타내는 바와 같이, 엔트로피 복호부(26001), 역양자화부(26002), 역변환부(26003), 블록 메모리(26004), 프레임 메모리(26005), 인트라 예측부(26006), 인터 예측부(26007) 및 블록 분할 정보 결정부(26008)를 포함한다.
부호화 입력 비트 스트림은, 엔트로피 복호부(26001)에 입력된다. 부호화 입력 비트 스트림이 엔트로피 복호부(26001)에 입력된 후, 엔트로피 복호부(26001)은, 부호화 입력 비트 스트림을 복호하고, 블록 분할 정보 결정부(26008)에 파라미터를 출력하고, 역양자화부(26002)에 복호치를 출력한다.
역양자화부(26002)는, 복호치를 역양자화하고, 역변환부(26003)에 주파수 계수를 출력한다. 역변환부(26003)는, 블록 분할 정보 결정부(26008)에 의해 도출된 블록 분할 정보에 근거하여 주파수 계수를 역주파수 변환함으로써 샘플 값으로 변환하고, 얻어진 샘플 값을 가산기에 출력한다.
가산기는, 얻어진 샘플 값을 인트라 예측부(26006)/인터 예측부(26007)로부터 출력된 영상/화상의 예측치에 가산하고, 얻어진 가산 후의 값을 디스플레이에 출력함과 함꼐, 향후 예측을 위해 블록 메모리(26004) 또는 프레임 메모리(26005)에 출력한다.
블록 분할 정보 결정부(26008)는, 블록 메모리(26004) 또는 프레임 메모리(26005)로부터 블록 정보를 수집함으로써, 엔트로피 결정부(복호부(26001)로부터의 복호 파라미터를 이용하여 블록 분할 정보를 도출한다. 여기서 도출된 블록 분할 정보가 이용되면, 블록은 복수의 서브 블록으로 분할된다.
또한, 인트라 예측부(26006)/인터 예측부(26007)는, 블록 분할 정보 결정부(26008)로부터 도출한 블록 분할 정보에 근거하여, 블록 메모리(26004)에 기억되어 있는 영상/화상 또는 프레임 메모리(26005)에 있는 재구축 영상/화상을 검색하고, 예를 들면 복호 완료 블록의 영상/화상에 가장 유사한 영상/화상 영역을 예측을 위해 추정한다.
(실시형태 3)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여 파라미터를 비트 스트림에 기입하고, 기입된 상기 파라미터를 이용하여, 복수의 부호화 완료 블록으로부터 적어도 하나의 부호화 완료 블록을 선택하고, 선택된 상기 적어도 하나의 부호화 완료 블록으로부터 블록 정보를 읽어내고, 읽어내어진 상기 블록 정보를 이용하여, 커렌트 블록을 복수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 부호화한다.
이에 의해, 파라미터를 이용하여, 커렌트 블록의 분할을 위한 부호화 완료 블록을 적응적으로 선택할 수 있다. 이와 같이 선택된 부호화 완료 블록의 블록 정보를 이용하여 블록을 복수의 서브 블록으로 분할함으로써, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 커렌트 블록 및 상기 복수의 부호화 완료 블록은 서로 다른 블록이며, 상기 복수의 부호화 완료 블록 중 적어도 하나는, 상기 커렌트 블록과 같은 프레임 또는 상기 커렌트 블록의 프레임과 상이한 다른 프레임에 포함되어도 된다.
이에 의해, 서로 다른 복수의 부호화 완료 블록 중에서 블록 분할을 위한 부호화 완료 블록을 선택할 수 있고, 블록 분할에 의해 적합한 블록 정보를 이용하여 커렌트 블록을 분할하는 것이 가능해진다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 읽어내어진 상기 블록 정보는, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이에 관한 정보 중 적어도 하나를 포함해도 된다.
이에 의해, 블록 정보로서 적절한 정보를 이용할 수 있고, 블록 분할에 의해 적합한 블록 정보를 이용하여 커렌트 블록을 분할하는 것이 가능해진다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여 비트 스트림으로부터 파라미터를 해석하고, 해석된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고, 해석된 상기 파라미터가 상기 소정 값과 동일한 경우에, 블록 분할 정보를 예측하고, 예측된 상기 블록 분할 정보를 이용하여 블록을 복수의 서브 블록으로 분할하고, 기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 예측된 상기 블록 분할 정보를 이용하지 않고, 블록을 복수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 복호한다.
이에 의해, 파라미터를 이용하여, 커렌트 블록의 분할을 위한 복호 완료 블록을 적응적으로 선택할 수 있다. 이와 같이 선택된 복호 완료 블록의 블록 정보를 이용하여 블록을 복수의 서브 블록으로 분할함으로써, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 커렌트 블록 및 상기 복호 완료 블록은 서로 다른 블록이며, 상기 복호 완료 블록 중 적어도 하나는, 상기 커렌트 블록과 같은 프레임 또는 상기 커렌트 블록의 프레임과 상이한 다른 프레임에 포함되어도 된다.
이에 의해, 서로 다른 복수의 복호 완료 블록 중에서 블록 분할을 위한 복호 완료 블록을 선택할 수 있고, 블록 분할에 의해 적합한 블록 정보를 이용하여 커렌트 블록을 분할하는 것이 가능해진다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 읽어내어진 상기 블록 정보는, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이에 관한 정보 중 적어도 하나를 포함해도 된다.
이에 의해, 블록 정보로서 적절한 정보를 이용할 수 있고, 블록 분할에 의해 적합한 블록 정보를 이용하여 커렌트 블록을 분할하는 것이 가능해진다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 13 및 도 14에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 13은, 실시형태 3에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S3001로서, 비트 스트림에 파라미터가 기입된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 기입 가능한 위치를 나타낸다. 기입된 파라미터는, 소정의 후보 리스트로부터 1 이상의 부호화 완료 블록 또는 블록 정보를 선택하기 위한 1 이상의 파라미터를 포함한다.
다음으로, 단계 S3002에서, 기입된 파라미터를 이용하여, 복수의 부호화 완료 블록으로부터 적어도 하나의 부호화 완료 블록이 선택된다. 여기서, 적어도 하나의 부호화 완료 블록은, 커렌트 블록과 같은 프레임에 포함되는 블록(예를 들면, 커렌트 블록의 인접 블록)이거나, 혹은 커렌트 블록을 포함하는 프레임과는 상이한 다른 프레임에 포함되는 블록(예를 들면, 커렌트 블록의 같은 위치 블록, 또는 커렌트 블록의 움직임 벡터를 이용하여 그 위치가 취득되는 움직임 보상 블록, 또는 커렌트 프레임과 상이한 최신의 부호화 완료 프레임에 포함되는 최후 부호화 완료 블록)이다.
단계 S3003에서는, 선택된 부호화 완료 블록으로부터 블록 정보가 읽어내어진다.
그리고, 단계 S3004에서, 읽어내어진 블록 정보를 이용하여 커렌트 블록이 복수의 서브 블록으로 분할된다. 도 38은, 읽어내어진 블록 정보를 이용하여 커렌트 블록을 복수의 서브 블록으로 분할하는 예를 나타낸다.
블록을 서브 블록으로 분할하기 위해, 당해 블록의 블록 분할 정보가 도출된다. 여기서, 블록 분할 정보는, 부호화 완료 블록의 블록 정보(예를 들면, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이 등)에 따라 도출된다. 블록은, 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할된다. 도 38에 나타내는 바와 같이, 이용하는 블록 분할 정보가 다르면, 블록 분할의 결과인 복수의 서브 블록의 높이, 폭, 또는 형상도 다르다.
커렌트 블록의 블록 파티션 구조로는, 선택된 부호화 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
선택된 2 이상의 부호화 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 블록 파티션 구조로 도출할 수도 있다.
선택된 부호화 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 블록 파티션 구조로 도출할 수도 있다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다.
블록 분할 정보는, 선택된 부호화 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 결정하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 세로 분할을 포함하는 블록 분할 정보를 도출할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 가로 분할을 포함하는 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
블록 분할 정보는, 선택된 부호화 완료 블록의 인트라/인터 예측 모드에 따라 도출되어도 된다. 예를 들면, 선택된 부호화 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 또 예를 들면, 선택된 부호화 완료 블록의 예측 모드가 인터 예측 모드인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 선택된 부호화 완료 블록의 움직임 벡터에 따라 도출되어도 된다. 예를 들면, 선택된 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 한편, 선택된 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 선택된 부호화 완료 블록의 양자화 파라미터에 따라 도출되어도 된다. 예를 들면, 선택된 부호화 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 또 예를 들면, 선택된 부호화 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 선택된 부호화 완료 블록의 참조 픽처 정보에 따라 도출되어도 된다. 예를 들면, 선택된 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 선택된 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 선택된 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 선택된 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 선택된 부호화 완료 블록의 분할 깊이에 따라 도출되어도 된다. 예를 들면, 선택된 부호화 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 선택된 부호화 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 부호화 완료 블록의 분할 정보에 따라 도출되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 부호화 완료 프레임의 부호화 완료 블록(예를 들면, 같은 위치 블록(collocated block), 직전의 부호화 완료 블록(last encoded block), 또는 움직임 벡터로 특정되는 부호화 완료 블록)의 블록 정보로부터 도출할 수 있다.
단계 S3005에서는, 복수의 서브 블록에 포함되는 서브 블록이 부호화 처리로 부호화된다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 14는, 실시형태 3에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S4001로서, 비트 스트림으로부터 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 해석 가능한 위치를 나타낸다. 해석된 파라미터는, 소정 후보 리스트로부터 1 이상의 복호 완료 블록 또는 블록 정보를 선택하기 위한 1 이상의 파라미터를 포함한다.
다음으로, 단계 S4002에서, 해석된 파라미터를 이용하여, 복수의 복호 완료 블록으로부터 적어도 하나의 복호 완료 블록이 선택된다. 기서, 적어도 하나의 복호 완료 블록은, 커렌트 블록과 같은 프레임에 포함되는 블록(예를 들면, 커렌트 블록의 인접 블록)이거나, 혹은 커렌트 블록을 포함하는 프레임과는 상이한 다른 프레임에 포함되는 블록(예를 들면, 커렌트 블록의 같은 위치 블록, 또는 커렌트 블록의 움직임 벡터를 이용하여 그 위치가 취득되는 움직임 보상 블록, 또는 커렌트 프레임과 상이한 최신 부호화 완료 프레임에 포함되는 최후 부호화 완료 블록)이다.
단계 S4003에서는, 선택된 복호 완료 블록으로부터 블록 정보가 읽어내어진다.
그리고, 단계 S4004에서, 읽어내어진 블록 정보를 이용하여 커렌트 블록이 복수의 서브 블록으로 분할된다. 도 38은, 읽어내어진 블록 정보를 이용하여 커렌트 블록을 복수의 서브 블록으로 분할하는 예를 나타낸다.
블록을 서브 블록으로 분할하기 위해, 당해 블록의 블록 분할 정보가 도출된다. 여기서, 블록 분할 정보는, 복호 완료 블록의 블록 정보(예를 들면, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이 등)에 따라 도출된다. 블록은, 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할된다. 도 38에 나타내는 바와 같이, 이용하는 블록 분할 정보가 다르면, 블록 분할의 결과인 복수의 서브 블록의 높이, 폭, 또는 형상도 다르다.
커렌트 블록의 블록 파티션 구조로는, 선택된 복호 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
선택된 2 이상의 복호 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 블록 파티션 구조로 도출할 수도 있다.
선택된 복호 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 블록 파티션 구조로 도출할 수도 있다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다.
블록 분할 정보는, 선택된 복호 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 결정하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 세로 분할을 포함하는 블록 분할 정보를 도출할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 가로 분할을 포함하는 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
블록 분할 정보는, 선택된 복호 완료 블록의 인트라/인터 예측 모드에 따라 도출되어도 된다. 예를 들면, 선택된 복호 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 또 예를 들면, 선택된 복호 완료 블록의 예측 모드가 인터 예측 모드인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 선택된 복호 완료 블록의 움직임 벡터에 따라 도출되어도 된다. 예를 들면, 선택된 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 한편, 선택된 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 선택된 복호 완료 블록의 양자화 파라미터에 따라 도출할 수도 있다. 예를 들면, 선택된 복호 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 또 예를 들면, 선택된 복호 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 선택된 복호 완료 블록의 참조 픽처 정보에 따라 도출할 수도 있다. 예를 들면, 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 선택된 복호 완료 블록의 분할 깊이에 따라 도출되어도 된다. 예를 들면, 선택된 복호 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 도출할 수 있다. 선택된 복호 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 도출할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 복호 완료 블록의 분할 정보에 따라 예측되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 복호 완료 프레임의 복호 완료 블록(예를 들면, 같은 위치 블록(collocated block), 직전의 복호 완료 블록(last decoded block), 또는 움직임 벡터로 특정되는 복호 완료 블록)의 블록 정보로부터 도출할 수 있다.
단계 S4005에서는, 복수의 서브 블록에 포함되는 서브 블록이 복호 처리로 복호된다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 복호 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 4)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여 블록 분할 정보를 초기화하고, 초기화된 상기 블록 분할 정보가 사용되면, 블록은, 제1 지오메트리 세트의 복수의 서브 블록으로 분할되고, 파라미터를 비트 스트림에 기입하고, 기입된 상기 파라미터를 이용하여, 초기화된 상기 블록 분할 정보를 수정 블록 분할 정보로 수정하고, 상기 수정 블록 분할 정보가 사용되면, 블록은, 상기 제1 지오메트리 세트와 상이한 지오메트리 세트의 복수의 서브 블록으로 분할되고. 상기 수정 블록 분할 정보를 이용하여 복수의 서브 블록의 지오메트리를 수정하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 부호화한다.
이에 의해, 파라미터를 이용하여, 초기화된 블록 분할 정보를 수정 블록 분할 정보로 적응적으로 수정할 수 있다. 이 수정 블록 분할 정보를 이용하여, 복수의 서브 블록의 지오메트리를 수정할 수 있다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 블록 분할 정보를 초기화하는 처리는, 소정 블록 분할 정보 리스트로부터 블록 분할 정보를 선택하는 처리를 포함해도 된다.
이에 의해, 소정 리스트로부터 블록 분할 정보를 선택함으로써, 블록 분할 정보를 초기화할 수 있다. 따라서, 리스트 내에서 블록 분할 정보를 식별하는 정보가 블록 분할 정보에 포함되면 되어, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 블록 분할 정보를 초기화하는 처리는, 지오메트리에 관한 소정의 파라미터를 이용하여 블록 분할 정보를 생성하는 처리를 포함해도 된다.
이에 의해, 파라미터를 이용하여 블록 분할 정보를 생성함으로써, 블록 분할 정보를 초기화할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 블록 분할 정보의 초기화에서는, 커렌트 블록의 픽처 타입 및 양자화 파라미터 중 적어도 한쪽에 근거하여 분할 깊이를 결정해도 된다.
이에 의해, 블록 분할 정보의 초기화에서, 커렌트 블록의 픽처 타입 및/또는 양자화 파라미터에 근거하여, 분할 깊이를 결정할 수 있다. 따라서, 비트 스트림 내의 기존 정보에 근거하여 분할 깊이를 결정할 수 있고, 블록 분할 정보에 관한 부호량을 삭감할 수 있다. 또한, 커렌트 블록의 픽처 타입 및/또는 양자화 파라미터를 이용함으로써, 커렌트 블록에 적합한 분할 깊이로 블록 분할 정보를 초기화할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 기입된 상기 파라미터는, 초기화된 상기 블록 분할 정보가 나타내는 분할 깊이와 상기 수정 블록 분할 정보가 나타내는 분할 깊이의 차분을 포함해도 된다.
이에 의해, 파라미터를 이용하여, 블록의 분할 깊이를 수정할 수 있어, 보다 부호화에 적합한 서브 블록을 이용할 수 있다. 그 결과, 압축 효율을 향상시킬 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여 블록 분할 정보를 초기화하고, 초기화된 상기 블록 분할 정보가 사용되면, 블록은, 제1 지오메트리 세트의 복수의 서브 블록으로 분할되고, 비트 스트림으로부터 파라미터를 해석하고, 해석된 상기 파라미터를 이용하여, 초기화된 상기 블록 분할 정보를 수정 블록 분할 정보로 수정하고, 상기 수정 블록 분할 정보가 사용되면, 블록은, 상기 제1 지오메트리 세트와 상이한 지오메트리 세트의 복수의 서브 블록으로 분할되고. 상기 수정 블록 분할 정보를 이용하여 복수의 서브 블록의 지오메트리를 수정하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 복호한다.
이에 의해, 파라미터를 이용하여, 초기화된 블록 분할 정보를 수정 블록 분할 정보로 적응적으로 수정할 수 있다. 이 수정 블록 분할 정보를 이용하여, 복수의 서브 블록의 지오메트리를 수정할 수 있다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 블록 분할 정보를 초기화하는 처리는, 소정 블록 분할 정보 리스트로부터 블록 분할 정보를 선택하는 처리를 포함해도 된다.
이에 의해, 소정 리스트로부터 블록 분할 정보를 선택함으로써, 블록 분할 정보를 초기화할 수 있다. 따라서, 리스트 내에서 블록 분할 정보를 식별하는 정보가 블록 분할 정보에 포함되면 되어, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 블록 분할 정보를 초기화하는 처리는, 지오메트리에 관한 소정의 파라미터를 이용하여 블록 분할 정보를 생성하는 처리를 포함해도 된다.
이에 의해, 파라미터를 이용하여 블록 분할 정보를 생성함으로써, 블록 분할 정보를 초기화할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 블록 분할 정보의 초기화에서는, 커렌트 블록의 픽처 타입 및 양자화 파라미터 중 적어도 한쪽에 근거하여 분할 깊이를 결정해도 된다.
이에 의해, 블록 분할 정보의 초기화에서, 커렌트 블록의 픽처 타입 및/또는 양자화 파라미터에 근거하여, 분할 깊이를 결정할 수 있다. 따라서, 비트 스트림 내의 기존 정보에 근거하여 분할 깊이를 결정할 수 있고, 블록 분할 정보에 관한 부호량을 삭감할 수 있다. 또한, 커렌트 블록의 픽처 타입 및/또는 양자화 파라미터를 이용함으로써, 커렌트 블록에 적합한 분할 깊이로 블록 분할 정보를 초기화할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 해석된 상기 파라미터는, 초기화된 상기 블록 분할 정보가 나타내는 분할 깊이와 상기 수정 블록 분할 정보가 나타내는 분할 깊이의 차분을 포함해도 된다.
이에 의해, 파라미터를 이용하여, 블록의 분할 깊이를 수정할 수 있어, 보다 부호화에 적합한 서브 블록을 이용할 수 있다. 그 결과, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
영상을 부호화하는 방법 및 복호하는 방법을 도 15 및 도 16에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 15는, 실시형태 4에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S5001로서, 블록 분할 정보가 초기화된다. 이 초기화된 블록 분할 정보(이하, 초기 블록 분할 정보라고 함)가 이용되면, 블록은, 제1 지오메트리 세트의 복수의 서브 블록으로 분할된다. 도 38에 나타내는 바와 같이, 이용하는 블록 분할 정보가 다르면, 블록 분할의 결과인 복수의 서브 블록의 높이, 폭, 또는 형상도 다르다.
커렌트 블록의 초기 블록 파티션 구조로는, 부호화 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 부호화 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 초기 블록 파티션 구조로 도출할 수도 있다. 부호화 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 부호화 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 부호화된 1 이상의 부호화 완료 블록을 선택한다.
부호화 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 초기 블록 파티션 구조로 도출할 수도 있다.
초기 블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 초기 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다.
초기 블록 분할 정보는, 부호화 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 결정하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위한 블록 분할 정보를 세로 분할을 포함하는 블록 분할 정보로 초기화할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위한 블록 분할 정보를 가로 분할을 포함하는 블록 분할 정보로 초기화할 수 있다.
초기 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 초기 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
블록 분할 정보는, 부호화 완료 블록의 인트라/인터 예측 모드에 따라 초기화할 수 있다. 예를 들면, 부호화 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 또 예를 들면, 부호화 완료 블록의 예측 모드가 인터 예측 모드인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 움직임 벡터에 따라 초기화되어도 된다. 예를 들면, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 한편, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 양자화 파라미터에 따라 초기화되어도 된다. 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 또 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 참조 픽처 정보에 따라 초기화되어도 된다. 예를 들면, 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 분할 깊이에 따라 초기화되어도 된다. 예를 들면, 부호화 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 부호화 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 부호화 완료 블록의 분할 정보에 따라 초기화되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 부호화 완료 프레임의 부호화 완료 블록(예를 들면, 같은 위치 블록(collocated block), 직전의 부호화 완료 블록(last encoded block), 또는 움직임 벡터로 특정되는 부호화 완료 블록 등)으로 초기화될 수 있다.
다음으로, 단계 S5002에서, 비트 스트림에 파라미터가 기입된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 기입 가능한 위치를 나타낸다.
단계 S5003에서, 기입된 파라미터를 이용하여 초기 블록 분할 정보가 수정 블록 분할 정보로 수정된다. 이 수정 블록 분할 정보가 이용되면, 블록은, 제1 지오메트리 세트와는 상이한 지오메트리 세트의 복수의 서브 블록으로 분할된다. 기입된 파라미터는, 초기 블록 분할 정보를 수정 블록 분할 정보로 수정하기 위한 1 이상의 파라미터를 포함한다.
예를 들면, 기입된 파라미터에는, 블록을 복수의 서브 블록으로 분할하는 분할 플래그가 포함될 수 있다. 도 42a에 나타내는 바와 같이, 이 파라미터를 이용하면, 4진 트리(QT) 분할 플래그의 값이 변화하고, 초기 블록 파티션 구조가 수정된다.
다른 예로, 기입된 파라미터에는, 소정의 스캔순(래스터 스캔 또는 Z 스캔 등)에 근거하여, 작은 블록을 계층적으로 결합함으로써 큰 블록으로 하는 머지 플래그(merge flags)가 포함될 수 있다. 도 42b에 나타내는 바와 같이, 이 파라미터를 이용하면, 복수의 블록이 결합되어 큰 블록이 되고, 초기 블록 파티션 구조가 수정된다. 작은 블록끼리를 계층적으로 결합하여 큰 블록으로 하는 예를 도 43에 나타낸다.
다른 예로, 기입된 파라미터에는, 소정의 스캔순(래스터 스캔 또는 Z 스캔 등)에 근거하여, 큰 블록을 계층적으로 분할함으로써 작은 블록으로 하는 분할 유효 플래그(split enable flags)가 포함될 수 있다. 도 42c에 나타내는 바와 같이, 이 파라미터를 이용하면, 블록이 보다 작은 서브 블록으로 분할되고, 초기 블록 파티션 구조가 수정된다.
다른 예로, 기입된 파라미터에는, 초기 블록 분할 정보가 나타내는 분할 깊이와 수정 블록 분할 정보가 나타내는 분할 깊이의 차분이 포함될 수 있다. 이 파라미터를 이용하면, 블록의 분할 깊이가 수정된다.
블록의 분할 및 작은 블록끼리의 결합 등, 다른 분할 방법을 조합하여, 최종적인 블록 파티션 구조를 구성하는 것도 가능하다. 비트 스트림의 헤더에는, 머지 유효 플래그(merge enable flag) 또는 분할 유효 플래그(split enable flag)를 사용할지 아닐지를 나타내는 1 이상의 전환 파라미터 또는 플래그와 같은 제어 파라미터가 포함될 수 있다.
초기 블록 분할 정보 또는 수정 블록 분할 정보를 이용하면, 여러 가지 분할 방법에 의한 여러 가지 블록 파티션 구조가 얻어진다. 분할 방법으로는, 예를 들면, 도 41의 b1) 및 b2)에 나타내는 바와 같은 2진 트리 분할, 또는 도 41의 q1) 및 q2)에 나타내는 바와 같은 4진 트리 분할, 또는 도 41의 m1) 및 m2)에 나타내는 바와 같은 다중 트리 커트/분할, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할이 가능하다. 서브 블록의 지오메트리(형상 및/또는 크기)로는, 도 41의 b2)에 나타내는 바와 같은 비대칭 2진 트리 분할, 도 41의 q2)에 나타내는 바와 같은 비대칭 4진 트리 분할, 도 41의 m1)에 나타내는 바와 같은 크기가 다른 다중 트리 커트, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할과 같이, 여러 가지 지오메트리가 있을 수 있다.
기입된 파라미터는, 예를 들면, 수정이 필요하지 않은 것을 나타낼 수도 있다. 수정이 필요하지 않으면, 단계 S5003 및 단계 S5004는 생략할 수 있다. 따라서, 블록은, 단계 S5005로 가기 전에, 초기 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할되게 된다. 그리고, 단계 S5005에서, 수정 블록 분할 정보를 이용하여 분할된 복수의 서브 블록에 포함되는 서브 블록을 부호화 처리로 부호화하는 것이, 초기 블록 분할 정보를 이용하여 분할된 복수의 서브 블록에 포함되는 서브 블록을 부호화 처리로 부호화하는 것으로 치환된다.
단계 S5004에서는, 수정 블록 분할 정보를 이용하여 복수의 서브 블록의 지오메트리 수정된다.
단계 S5005에서는, 당해 복수의 서브 블록에 포함되는 서브 블록이 부호화 처리로 부호화된다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 16은, 실시형태 4에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S6001로서, 블록 분할 정보가 초기화된다. 이 초기 블록 분할 정보가 이용되면, 블록은, 제1 지오메트리 세트의 복수의 서브 블록으로 분할된다. 도 38에 나타내는 바와 같이, 이용하는 블록 분할 정보가 다르면, 블록 분할의 결과인 복수의 서브 블록의 높이, 폭, 또는 형상도 다르다.
커렌트 블록의 초기 블록 파티션 구조로는, 복호 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 복호 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 초기 블록 파티션 구조로 도출할 수도 있다. 복호 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 복호 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 복호된 1 이상의 복호 완료 블록을 선택한다.
복호 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 초기 블록 파티션 구조로 도출할 수도 있다.
초기 블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 초기 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다.
초기 블록 분할 정보는, 복호 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 결정하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위한 블록 분할 정보를 세로 분할을 포함하는 블록 분할 정보로 초기화할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위한 블록 분할 정보를 가로 분할을 포함하는 블록 분할 정보로 초기화할 수 있다.
초기 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 초기 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
블록 분할 정보는, 복호 완료 블록의 인트라/인터 예측 모드에 따라 초기화할 수 있다. 예를 들면, 복호 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 또 예를 들면, 복호 완료 블록의 예측 모드가 인터 예측 모드인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 복호 완료 블록의 움직임 벡터에 따라 초기화되어도 된다. 예를 들면, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 한편, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 복호 완료 블록의 양자화 파라미터에 따라 초기화되어도 된다. 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 또 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 복호 완료 블록의 참조 픽처 정보에 따라 초기화되어도 된다. 예를 들면, 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 복호 완료 블록의 분할 깊이에 따라 초기화되어도 된다. 예를 들면, 복호 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 복호 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 복호 완료 블록의 분할 정보에 따라 초기화되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 복호 완료 프레임의 복호 완료 블록(예를 들면, 같은 위치 블록(collocated block), 최후 복호 완료 블록(last decoded block), 또는 움직임 벡터로 특정되는 복호 완료 블록 등)으로 초기화될 수 있다.
다음으로, 단계 S6002에서, 비트 스트림으로부터 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 해석 가능한 위치를 나타낸다.
단계 S6003에서, 해석된 파라미터를 이용하여, 초기 블록 분할 정보가 수정 블록 분할 정보로 수정된다. 이 수정 블록 분할 정보가 이용되면, 블록은, 제1 지오메트리 세트와는 상이한 지오메트리 세트의 복수의 서브 블록으로 분할된다. 해석된 파라미터는, 초기 블록 분할 정보를 수정 블록 분할 정보로 수정하기 위한 1 이상의 파라미터를 포함한다.
예를 들면, 해석된 파라미터에는, 블록을 복수의 서브 블록으로 분할하는 분할 플래그가 포함될 수 있다. 도 42a에 나타내는 바와 같이, 이 파라미터를 이용하면, 4진 트리(QT) 분할 플래그의 값이 변화하고, 초기 블록 파티션 구조가 수정된다.
다른 예로, 해석된 파라미터에는, 소정의 스캔순(래스터 스캔 또는 Z 스캔 등)에 근거하여, 작은 블록을 계층적으로 결합함으로써 큰 블록으로 하는 머지 플래그(merge flags)가 포함될 수 있다. 도 42b에 나타내는 바와 같이, 이 파라미터를 이용하면, 복수의 블록이 결합되어 큰 블록이 되고, 초기 블록 파티션 구조가 수정된다. 작은 블록끼리를 계층적으로 결합하여 큰 블록으로 하는 예를 도 43에 나타낸다.
다른 예로, 해석된 파라미터에는, 소정의 스캔순(래스터 스캔 또는 Z 스캔 등)에 근거하여, 큰 블록을 계층적으로 분할함으로써 작은 블록으로 하는 분할 유효 플래그(split enable flags)가 포함될 수 있다. 도 42c에 나타내는 바와 같이, 이 파라미터를 이용하면, 블록이 보다 작은 서브 블록으로 분할되고, 초기 블록 파티션 구조가 수정된다.
다른 예로, 해석된 파라미터에는, 초기 블록 분할 정보가 나타내는 분할 깊이와 수정 블록 분할 정보가 나타내는 분할 깊이의 차분이 포함될 수 있다. 이 파라미터를 이용하면, 블록의 분할 깊이가 수정된다.
블록의 분할 및 작은 블록끼리의 결합 등, 다른 분할 방법을 조합하여, 최종적인 블록 파티션 구조를 구성하는 것도 가능하다. 비트 스트림의 헤더에는, 머지 유효 플래그(merge enable flag) 또는 분할 유효 플래그(split enable flag)를 사용할지 아닐지를 나타내는 1 이상의 전환 파라미터 또는 플래그와 같은 제어 파라미터가 포함될 수 있다.
초기 블록 분할 정보 또는 수정 블록 분할 정보를 이용하면, 여러 가지 분할 방법에 의한 여러 가지 블록 파티션 구조가 얻어진다. 분할 방법으로는, 예를 들면, 도 41의 b1) 및 b2)에 나타내는 바와 같은 2진 트리 분할, 또는 도 41의 q1) 및 q2)에 나타내는 바와 같은 4진 트리 분할, 또는 도 41의 m1) 및 m2)에 나타내는 바와 같은 다중 트리 커트/분할, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할이 가능하다. 서브 블록의 지오메트리(형상 및/또는 크기)로는, 도 41의 b2)에 나타내는 바와 같은 비대칭 2진 트리 분할, 도 41의 q2)에 나타내는 바와 같은 비대칭 4진 트리 분할, 도 41의 m1)에 나타내는 바와 같은 크기가 다른 다중 트리 커트, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할과 같이, 여러 가지 지오메트리가 있을 수 있다.
해석된 파라미터는, 예를 들면, 수정이 필요하지 않은 것을 나타낼 수도 있다. 수정이 필요하지 않으면, 단계 S6003 및 단계 S6004는 생략할 수 있다. 따라서, 블록은, 단계 S6005로 가기 전에, 초기 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할된다. 그리고, 단계 S6005에서, 수정 블록 분할 정보를 이용하여 분할된 복수의 서브 블록에 포함되는 서브 블록을 복호 처리로 복호하는 것이, 초기 블록 분할 정보를 이용하여 분할된 복수의 서브 블록에 포함되는 서브 블록을 복호 처리로 복호하는 것으로 치환된다.
단계 S6004에서는, 복수의 서브 블록의 지오메트리를 수정 블록 분할 정보를 이용하여 수정한다.
단계 S6005에서는, 당해 복수의 서브 블록에 포함되는 서브 블록을 복호 처리로 복호한다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 복호 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
또한, 본 실시형태에서, 초기 블록 분할 정보로서, 디폴트 블록 분할 정보가 이용되어도 된다. 디폴트 블록 분할 정보란, 미리 정해진 블록 분할 정보이다. 예를 들면, 디폴트 블록 분할 정보는, 표준 규격에 미리 정의된 블록 분할 정보이어도 된다. 또 예를 들면, 디폴트 블록 분할 정보는, 블록보다도 상위의 헤더에 기입된 블록 분할 정보이어도 된다. 또한, 디폴트 블록 분할 정보가 이용되는 경우는, 단계 S5001 및 단계 S6001에서, 블록 분할 정보의 초기화 대신, 디폴트 블록 분할 정보가 취득된다.
또한, 본 실시형태에서는, 블록 분할 정보의 초기화로서, 부호화 완료 블록 또는 복호 완료 블록의 블록 정보에 근거하는 초기화의 예가 설명되었지만, 이에 한정되지 않는다. 예를 들면, 블록 분할 정보의 초기화에서는, 커렌트 블록의 픽처 타입(I, P 또는 B 픽처) 및 양자화 파라미터 중 적어도 한쪽에 근거하여 분할 깊이가 결정되어도 된다.
구체적으로는, 예를 들면 커렌트 블록의 픽처 타입이 I 픽처이면, 블록 분할 정보는, 비교적 깊은 분할 깊이로 블록을 분할하는 블록 분할 정보로 초기화되어도 된다. 또 예를 들면, 커렌트 블록의 픽처 타입이 P 픽처 또는 B 픽처이면, 블록 분할 정보는, 비교적 얕은 분할 깊이로 블록을 분할하는 블록 분할 정보로 초기화되어도 된다.
또 예를 들면, 초기 블록 분할 정보에서의 분할 깊이는, 커렌트 블록의 양자화 파라미터에 근거하여 결정되어도 된다. 구체적으로는, 커렌트 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 블록 분할 정보는, 비교적 깊은 분할 깊이로 블록을 분할하는 블록 분할 정보로 초기화되어도 된다. 또 예를 들면, 커렌트 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 블록 분할 정보는, 비교적 얕은 분할 깊이로 블록을 분할하는 다른 블록 분할 정보로 초기화되어도 된다.
(실시형태 5)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 파라미터를 비트 스트림에 기입하고, 블록을 복수의 서브 블록으로 분할하고, 기입된 상기 파라미터를 이용하여, 상기 복수의 서브 블록에 포함되는 적어도 2개의 서브 블록을 결합하여 결합 블록으로 하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 상기 결합 블록을 부호화한다.
이에 의해, 파라미터를 이용하여, 적어도 2개의 서브 블록을 결합할 수 있다. 따라서, 커렌트 블록의 분할을 파라미터로 수정할 수 있어, 보다 부호화에 적합한 서브 블록을 이용할 수 있다. 그 결과, 압축 효율을 향상시킬 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 비트 스트림으로부터 파라미터를 해석하고, 블록을 복수의 서브 블록으로 분할하고, 해석된 상기 파라미터를 이용하여, 상기 복수의 서브 블록에 포함되는 적어도 2개의 서브 블록을 결합하여 결합 블록으로 하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 상기 결합 블록을 복호한다.
이에 의해, 파라미터를 이용하여, 적어도 2개의 서브 블록을 결합할 수 있다. 따라서, 커렌트 블록의 분할을 파라미터로 수정할 수 있어, 보다 복호에 적합한 서브 블록을 이용할 수 있다. 그 결과, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
영상을 부호화하는 방법 및 복호하는 방법을 도 17 및 도 18에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 17은, 실시형태 5에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S7001로서, 비트 스트림에 파라미터가 기입된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S7002에서, 초기 블록 분할 정보를 이용하여 블록을 복수의 서브 블록으로 분할한다. 도 38에 나타내는 바와 같이, 이용하는 블록 분할 정보가 다르면, 블록 분할의 결과인 복수의 서브 블록의 높이, 폭, 또는 형상도 다르다.
커렌트 블록의 초기 블록 파티션 구조로는, 부호화 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다. 또, 커렌트 블록의 초기 블록 파티션 구조로는, 디폴트 블록 파티션 구조를 사용할 수도 있다.
2 이상의 부호화 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 초기 블록 파티션 구조로 도출할 수도 있다. 부호화 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 부호화 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 부호화된 1 이상의 부호화 완료 블록을 선택한다.
부호화 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 초기 블록 파티션 구조로 도출할 수도 있다.
초기 블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 초기 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다.
초기 블록 분할 정보는, 부호화 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 결정하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위한 블록 분할 정보를 세로 분할을 포함하는 블록 분할 정보로 초기화할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위한 블록 분할 정보를 가로 분할을 포함하는 블록 분할 정보로 초기화할 수 있다.
초기 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 초기 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
블록 분할 정보는, 부호화 완료 블록의 인트라/인터 예측 모드에 따라 초기화할 수 있다. 예를 들면, 부호화 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 또 예를 들면, 부호화 완료 블록의 예측 모드가 인터 예측 모드인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 움직임 벡터에 따라 초기화되어도 된다. 예를 들면, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 한편, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 양자화 파라미터에 따라 초기화되어도 된다. 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 또 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 참조 픽처 정보에 따라 초기화되어도 된다. 예를 들면, 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 분할 깊이에 따라 초기화되어도 된다. 예를 들면, 부호화 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 부호화 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 부호화 완료 블록의 분할 정보에 따라 초기화되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 부호화 완료 프레임의 부호화 완료 블록(예를 들면, 같은 위치 블록(collocated block), 직전의 부호화 완료 블록(last encoded block), 또는 움직임 벡터로 특정되는 부호화 완료 블록 등)으로 초기화될 수 있다.
단계 S7003에서, 기입된 파라미터를 이용하여, 복수의 서브 블록에 포함되는 2 이상의 서브 블록을 결합하고, 결합 블록(merged block)으로 한다. 예를 들면, 기입된 파라미터에는, 소정의 스캔순(래스터 스캔 또는 Z 스캔 등)에 근거하여, 작은 블록을 계층적으로 결합함으로써 큰 블록으로 하는 머지 플래그(merge flags)가 포함될 수 있다. 도 42b에 나타내는 바와 같이, 이 파라미터를 이용하면, 복수의 블록이 결합되어 큰 블록이 되고, 초기 블록 파티션 구조가 수정된다. 작은 블록끼리를 계층적으로 결합하여 큰 블록으로 하는 예를 도 43에 나타낸다.
블록 파티션 구조를 도출할 때의 분할 방법은, 단계 S7003에서의 결합 처리 전후에서 달라도 된다. 분할 방법으로는, 예를 들면, 도 41의 b1) 및 b2)에 나타내는 바와 같은 2진 트리 분할, 또는 도 41의 q1) 및 q2)에 나타내는 바와 같은 4진 트리 분할, 또는 도 41의 m1) 및 m2)에 나타내는 바와 같은 다중 트리 커트/분할, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할이 가능하다. 서브 블록의 지오메트리(형상 및/또는 크기)로는, 도 41의 b2)에 나타내는 바와 같은 비대칭 2진 트리 분할, 도 41의 q2)에 나타내는 바와 같은 비대칭 4진 트리 분할, 도 41의 m1)에 나타내는 바와 같은 크기가 다른 다중 트리 커트, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할과 같이, 여러 가지 지오메트리가 있을 수 있다.
기입된 파라미터는, 예를 들면, 결합이 필요하지 않은 것을 나타낼 수도 있다. 결합이 필요하지 않으면, 단계 S7003는 생략할 수 있다. 따라서, 블록은, 단계 S7004로 가기 전에, 초기 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할되게 된다. 그리고, 단계 S7004에서, 결합 블록 대신 서브 블록이 부호화 처리로 부호화된다.
단계 S7004에서는, 결합 블록을 부호화 처리로 부호화한다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 18은, 실시형태 5에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S8001로서, 비트 스트림으로부터 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S8002에서, 초기 블록 분할 정보를 이용하여 블록을 복수의 서브 블록으로 분할한다. 도 38에 나타내는 바와 같이, 이용하는 블록 분할 정보가 다르면, 블록 분할의 결과인 복수의 서브 블록의 높이, 폭, 또는 형상도 다르다.
커렌트 블록의 초기 블록 파티션 구조로는, 복호 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 복호 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 초기 블록 파티션 구조로 도출할 수도 있다. 복호 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 복호 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 복호된 1 이상의 복호 완료 블록을 선택한다.
복호 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 초기 블록 파티션 구조로 도출할 수도 있다.
초기 블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 초기 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다.
초기 블록 분할 정보는, 복호 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 결정하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위한 블록 분할 정보를 세로 분할을 포함하는 블록 분할 정보로 초기화할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위한 블록 분할 정보를 가로 분할을 포함하는 블록 분할 정보로 초기화할 수 있다.
초기 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 초기 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
블록 분할 정보는, 복호 완료 블록의 인트라/인터 예측 모드에 따라 초기화할 수 있다. 예를 들면, 복호 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 또 예를 들면, 복호 완료 블록의 예측 모드가 인터 예측 모드인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 복호 완료 블록의 움직임 벡터에 따라 초기화되어도 된다. 예를 들면, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 한편, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 복호 완료 블록의 양자화 파라미터에 따라 초기화되어도 된다. 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 또 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 복호 완료 블록의 참조 픽처 정보에 따라 초기화되어도 된다. 예를 들면, 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 복호 완료 블록의 분할 깊이에 따라 초기화되어도 된다. 예를 들면, 복호 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 블록 분할 정보는, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보로 초기화할 수 있다. 복호 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 블록 분할 정보는, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보로 초기화할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 복호 완료 블록의 분할 정보에 따라 초기화되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 복호 완료 프레임의 복호 완료 블록(예를 들면, 같은 위치 블록(collocated block), 최후 복호 완료 블록(last decoded block), 또는 움직임 벡터로 특정되는 복호 완료 블록 등)으로 초기화될 수 있다.
단계 S8003에서, 해석된 파라미터를 이용하여, 복수의 서브 블록에 포함되는 2 이상의 서브 블록을 결합하고, 결합 블록(merged block)으로 한다. 예를 들면, 해석된 파라미터에는, 소정의 스캔순(래스터 스캔 또는 Z 스캔 등)에 근거하여, 작은 블록을 계층적으로 결합함으로써 큰 블록으로 하는 머지 플래그(merge flags)가 포함될 수 있다. 도 42b에 나타내는 바와 같이, 이 파라미터를 이용하면, 복수의 블록이 결합되어 큰 블록이 되고, 초기 블록 파티션 구조가 수정된다. 작은 블록끼리를 계층적으로 결합하여 큰 블록으로 하는 예를 도 43에 나타낸다.
블록 파티션 구조를 도출할 때의 분할 방법은, 단계 S8003에서의 결합 처리 전후에서 달라도 된다. 분할 방법으로는, 예를 들면, 도 41의 b1) 및 b2)에 나타내는 바와 같은 2진 트리 분할, 또는 도 41의 q1) 및 q2)에 나타내는 바와 같은 4진 트리 분할, 또는 도 41의 m1) 및 m2)에 나타내는 바와 같은 다중 트리 커트/분할, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할이 가능하다. 서브 블록의 지오메트리(형상 및/또는 크기)로는, 도 41의 b2)에 나타내는 바와 같은 비대칭 2진 트리 분할, 도 41의 q2)에 나타내는 바와 같은 비대칭 4진 트리 분할, 도 41의 m1)에 나타내는 바와 같은 크기가 다른 다중 트리 커트, 또는 도 41의 n1)에 나타내는 바와 같은 비정사각형/비직사각형의 분할과 같이, 여러 가지 지오메트리가 있을 수 있다.
해석된 파라미터는, 예를 들면, 결합이 필요하지 않은 것을 나타낼 수도 있다. 결합이 필요하지 않으면, 단계 S8003는 생략할 수 있다. 따라서, 블록은, 단계 S8004로 가기 전에, 초기 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할되게 된다. 그리고, 단계 S8004에서, 결합 블록 대신 서브 블록이 복호 처리로 복호된다.
단계 S8004에서는, 결합 블록을 복호 처리로 복호한다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 복호 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 6)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록의 지오메트리를 읽어내고, 읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화한다.
이에 의해, 블록의 지오메트리에 근거하여, 당해 블록을 분할할 수 있다. 따라서, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킬 수 있다. 또한, 블록의 지오메트리의 이용은, 보다 부호화에 적합한 서브 블록에 공헌하며, 압축 효율의 향상에도 공헌할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 서브 블록의 높이 및 폭 중 적어도 한쪽은 2의 멱승이어도 된다.
이에 의해, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 되도록, 블록을 분할할 수 있다. 따라서, 부호화에 적합한 사이즈의 서브 블록을 얻을 수 있어, 압축 효율을 향상시킬 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록의 지오메트리를 읽어내고, 읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호한다.
이에 의해, 블록의 지오메트리에 근거하여, 당해 블록을 분할할 수 있다. 따라서, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킬 수 있다. 또한, 블록의 지오메트리의 이용은, 보다 부호화에 적합한 서브 블록에 공헌하며, 압축 효율의 향상에도 공헌할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 서브 블록의 높이 및 폭 중 적어도 한쪽은 2의 멱승이어도 된다.
이에 의해, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 되도록, 블록을 분할할 수 있다. 따라서, 부호화에 적합한 사이즈의 서브 블록을 이용할 수 있어, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 19 및 도 20에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 19는, 실시형태 6에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S9001로서, 블록의 지오메트리를 읽어낸다. 여기서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타낸다. 도 44에 나타내는 바와 같이, 이용하는 지오메트리가 다르면, 블록 분할의 결과인 복수의 서브 블록의 형상, 블록 높이, 또는 블록 폭도 다르다.
다음으로, 단계 S9002에서, 읽어낸 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정한다.
읽어낸 지오메트리가 소정의 지오메트리와 동일한 경우(S9002의 Y), 단계 S9003에서, 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할한다. 읽어낸 지오메트리가 소정의 지오메트리와 동일하지 않은 경우(S9002의 N), 단계 S9004에서, 블록을 제1 지오메트리 세트와는 상이한 다른 지오메트리 세트의 소정 수의 서브 블록으로 분할한다.
예를 들면, 도 45a의 (a1)에 나타내는 바와 같이, 서브 블록의 소정 수가 2로 설정된 경우, 블록 폭이 2의 멱승이면(예를 들면, 32), 1:3 또는 3:1의 비율로 블록을 2개의 서브 블록으로 세로 분할할 수 있다. 한편, 도 45a의 (a2)에 나타내는 바와 같이, 폭이 2의 멱승이 아니면(예를 들면, 24), 1:2 또는 2:1의 비율로 블록을 2개의 서브 블록으로 세로 분할할 수 있다. 마찬가지로, 블록의 블록 높이가 2의 멱승이지 아닌지에 따라, 블록을 2개의 서브 블록으로 가로 분할할 수 있다.
다른 예로, 도 45c의 (c1)에 나타내는 바와 같이, 서브 블록의 소정 수가 2로 설정된 경우, 블록 폭(예를 들면, 8)이 블록 높이(예를 들면, 32)보다 작으면, 블록을 동일한 크기의 2개의 서브 블록으로 가로 분할할 수 있다. 한편, 도 45c의 (c2)에 나타내는 바와 같이, 폭(예를 들면, 32)이 블록 높이(예를 들면, 8)보다 크면, 블록을 동일한 크기의 2개의 서브 블록으로 세로 분할할 수 있다.
서브 블록의 소정 수가 4로 설정된 경우는, 예를 들면, 도 45b의 (b1)에 나타내는 바와 같이, 블록의 블록 폭이 2의 멱승이면(예를 들면, 32), 가장 큰 서브 블록의 폭이 가장 작은 서브 블록의 폭의 3배가 되는 4개의 서브 블록으로 블록을 분할할 수 있다. 한편, 도 45b의 (b2)에 나타내는 바와 같이, 블록의 블록 폭이 2의 멱승이 아니면(예를 들면, 24), 가장 큰 서브 블록의 폭이 가장 작은 서브 블록의 폭의 2배가 되는 4개의 서브 블록으로 블록을 분할할 수 있다.
다른 예로, 도 45d의 (d1)에 나타내는 바와 같이, 서브 블록의 소정 수가 4로 설정된 경우, 블록의 블록 폭(예를 들면, 32)이 그 블록의 블록 높이(예를 들면, 32)와 같으면, 그 블록을 세로 가로 양쪽으로 등분할 할 수 있다. 도 45d의 (d2)에 나타내는 바와 같이, 블록의 블록 폭(예를 들면, 32)이 그 블록의 블록 높이(예를 들면, 8)의 4배이면, 블록을 세로로 등분할 할 수 있다. 마찬가지로, 블록의 블록 높이(예를 들면, 32)가 그 블록의 블록 폭(예를 들면 8)의 4배이면, 블록을 가로로 등분할 할 수 있다.
도 45a~도 45d와 같이, 본 실시형태에서는, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 된다. 또한, 서브 블록의 높이 및/또는 폭은, 2의 멱승에 한정되지 않아도 된다.
단계 S9005에서는, 서브 블록을 부호화 처리로 부호화한다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 20은, 실시형태 6에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S10001로서, 블록의 지오메트리를 읽어낸다. 여기서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타낸다. 도 44에 나타내는 바와 같이, 이용하는 지오메트리가 다르면, 블록 분할의 결과인 복수의 서브 블록의 형상, 블록 높이, 또는 블록 폭도 다르다.
다음으로, 단계 S10002에서, 읽어낸 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정한다.
읽어낸 지오메트리가 소정의 지오메트리와 동일한 경우(S10002의 Y), 단계 S10003에서, 블록을 제1 지오메트리 세트로 이루어지는 소정 수의 서브 블록으로 분할한다. 읽어낸 지오메트리가 소정의 지오메트리와 동일하지 않은 경우(S10002의 N), 단계 S10004에서, 블록을 제1 지오메트리 세트와는 상이한 다른 지오메트리 세트로 이루어지는 소정 수의 서브 블록으로 분할한다.
예를 들면, 도 45a의 (a1)에 나타내는 바와 같이, 서브 블록의 소정 수가 2로 설정된 경우, 블록 폭이 2의 멱승이면(예를 들면, 32), 1:3 또는 3:1의 비율로 블록을 2개의 서브 블록으로 세로 분할할 수 있다. 한편, 도 45a의 (a2)에 나타내는 바와 같이, 폭이 2의 멱승이 아니면(예를 들면, 24), 1:2 또는 2:1의 비율로 블록을 2개의 서브 블록으로 세로 분할할 수 있다. 마찬가지로, 블록의 블록 높이가 2의 멱승이지 아닌지에 따라, 블록을 2개의 서브 블록으로 가로 분할할 수 있다.
다른 예로, 도 45c의 (c1)에 나타내는 바와 같이, 서브 블록의 소정 수가 2로 설정된 경우, 블록 폭(예를 들면, 8)이 블록 높이(예를 들면, 32)보다 작으면, 블록을 동일한 크기의 2개의 서브 블록으로 가로 분할할 수 있다. 한편, 도 45c의 (c2)에 나타내는 바와 같이, 폭(예를 들면, 32)이 블록 높이(예를 들면, 8)보다 크면, 블록을 동일한 크기의 2개의 서브 블록으로 세로 분할할 수 있다.
예를 들면, 도 45b의 (b1)에 나타내는 바와 같이, 서브 블록의 소정 수가 4로 설정된 경우, 블록의 블록 폭이 2의 멱승이면(예를 들면, 32), 가장 큰 서브 블록의 폭이 가장 작은 서브 블록의 폭의 3배가 되는 4개의 서브 블록으로 블록을 분할할 수 있다. 한편, 도 45b의 (b2)에 나타내는 바와 같이, 블록의 블록 폭이 2의 멱승이 아니면(예를 들면, 24), 가장 큰 서브 블록의 폭이 가장 작은 서브 블록의 폭의 2배가 되는 4개의 서브 블록으로 블록을 분할할 수 있다.
예를 들면, 도 45d의 (d1)에 나타내는 바와 같이, 서브 블록의 소정 수가 4로 설정된 경우, 블록의 블록 폭(예를 들면, 32)이 그 블록의 블록 높이(예를 들면, 32)와 같으면, 그 블록을 세로 가로 양쪽으로 등분할 할 수 있다. 도 45d의 (d2)에 나타내는 바와 같이, 블록의 블록 폭(예를 들면, 32)이 그 블록의 블록 높이(예를 들면, 8)의 4배이면, 블록을 세로로 등분할 할 수 있다. 마찬가지로, 블록의 블록 높이(예를 들면, 32)가 그 블록의 블록 폭(예를 들면 8)의 4배이면, 블록을 가로로 등분할 할 수 있다.
도 45a~도 45d와 같이, 본 실시형태에서는, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 된다. 또한, 서브 블록의 높이 및/또는 폭은, 2의 멱승에 한정되지 않아도 된다.
단계 S10005에서는, 서브 블록을 복호 처리로 복호한다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 복호 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 7)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 파라미터를 비트 스트림에 기입하고, 기입된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고, 기입된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고, 기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화한다.
이에 의해, 파라미터가 소정 값과 동일한지 아닌지에 의해, 분할 후의 소정 수의 서브 블록의 지오메트리 세트를 전환할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 서브 블록의 높이 및 폭 중 적어도 한쪽은 2의 멱승이어도 된다.
이에 의해, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 되도록, 블록을 분할할 수 있다. 따라서, 부호화에 적합한 사이즈의 서브 블록을 얻을 수 있어, 압축 효율을 향상시킬 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 비트 스트림으로부터 파라미터를 해석하고, 해석된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고, 해석된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고, 해석된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호한다.
이에 의해, 파라미터가 소정 값과 동일한지 아닌지에 의해, 분할 후의 소정 수의 서브 블록의 지오메트리 세트를 전환할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 서브 블록의 높이 및 폭 중 적어도 한쪽은 2의 멱승이어도 된다.
이에 의해, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 되도록, 블록을 분할할 수 있다. 따라서, 부호화에 적합한 사이즈의 서브 블록을 이용할 수 있어, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 21 및 도 22에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 21은, 실시형태 7에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S11001로서, 파라미터가 비트 스트림에 기입된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S11002에서, 기입된 파라미터가 소정 값과 동일한지 아닌지를 판정한다.
기입된 파라미터가 소정 값과 동일한 경우(S11002의 Y), 단계 S11003에서, 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할한다. 기입된 파라미터가 소정 값과 동일하지 않은 경우(S11002의 N), 단계 S11004에서, 블록을 제1 지오메트리 세트와는 상이한 다른 지오메트리 세트의 소정 수의 서브 블록으로 분할한다.
기입된 파라미터는, 분할 모드(예를 들면, 4진 트리/2진 트리/다중 트리 분할, 세로/가로 분할, 대칭/비대칭 분할 및 서브 블록의 블록 폭/블록 높이의 비율)를 나타낼 수 있다.
예를 들면, 24×32 블록에 대해, 도 46a의 (a1)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 2진 트리 분할인 것, 분할이 세로 분할인 것 및 2개의 서브 블록의 블록 폭의 비율이 1:2인 것을 나타낼 수 있다. 이 경우, 24×32 블록은, 8×32 서브 블록과 16×32 서브 블록으로 분할된다.
다른 예로, 24×32 블록에 대해, 도 46a의 (a2)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 2진 트리 분할인 것, 분할이 세로 분할인 것 및 2개의 서브 블록의 블록 폭의 비율이 2:1인 것을 나타낼 수 있다. 이 경우, 24×32 블록은, 16×32 서브 블록과 8×32 서브 블록으로 분할된다.
예를 들면, 24×24 블록에 대해, 도 46b의 (b1)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 4진 트리 분할인 것, 왼쪽 위의 서브 블록이 가장 큰 서브 블록인 것 및 가장 큰 서브 블록과 가장 작은 서브 블록의 블록 폭의 비율이 2:1인 것을 나타낼 수 있다. 이 경우, 24×24 블록은, 16×16 서브 블록과 8×16 서브 블록과 16×8 서브 블록과 8×8 서브 블록으로 분할된다.
다른 예로, 24×24 블록에 대해, 도 46b의 (b2)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 4진 트리 분할인 것, 오른쪽 아래의 서브 블록이 가장 큰 서브 블록인 것 및 가장 큰 서브 블록과 가장 작은 서브 블록의 블록 폭의 비율이 2:1인 것을 나타낼 수 있다. 이 경우, 24×24 블록은, 8×8 서브 블록과 16×8 서브 블록과 8×16 서브 블록과 16×16 서브 블록으로 분할된다.
예를 들면, 32×32 블록에 대해, 도 46c의 (c1)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 3진 트리 분할인 것, 분할이 세로 분할인 것 및 서브 블록의 블록 폭의 비율이 1:1:2인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 2개의 8×32 서브 블록과 16×32 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 46c의 (c2)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 3진 트리 분할인 것, 분할이 세로 분할인 것 및 서브 블록의 블록 폭의 비율이 2:1:1인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 16×32 서브 블록과 2개의 8×16 서브 블록으로 분할된다.
예를 들면, 32×32 블록에 대해, 도 46d의 (d1)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 세로 가로 양쪽의 방향이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 16×16 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 46d의 (d2)에 나타내는 바와 같이, 기입된 파라미터에 의해, 분할이 4진 트리 분할인 것 및 분할에는 세로방향만이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 8×32 서브 블록으로 분할된다.
도 46a~도 46d와 같이, 본 실시형태에서는, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 된다. 또한, 서브 블록의 높이 및/또는 폭은, 2의 멱승에 한정되지 않아도 된다.
단계 S11005에서는, 서브 블록을 부호화 처리로 부호화한다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 22는, 실시형태 7에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S12001로서, 비트 스트림으로부터 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S12002에서, 해석된 파라미터가 소정 값과 동일한지 아닌지를 판정한다.
해석된 파라미터가 소정 값과 동일한 경우(S12002의 Y), 단계 S12003에서, 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할한다. 해석된 지오메트리 소정 값과 동일하지 않은 경우(S12002의 N), 단계 S12004에서, 블록을 제1 지오메트리 세트와는 상이한 다른 지오메트리 세트의 소정 수의 서브 블록으로 분할한다.
해석된 파라미터는, 분할 모드(예를 들면, 4진 트리/2진 트리/다중 트리 분할, 세로/가로 분할, 대칭/비대칭 분할 및 서브 블록의 블록 폭/블록 높이의 비율)를 나타낼 수 있다.
예를 들면, 24×32 블록에 대해, 도 46a의 (a1)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 2진 트리 분할인 것, 분할이 세로 분할인 것 및 2개의 서브 블록의 블록 폭의 비율이 1:2인 것을 나타낼 수 있다. 이 경우, 24×32 블록은, 8×32 서브 블록과 16×32 서브 블록으로 분할된다.
다른 예로, 24×32 블록에 대해, 도 46a의 (a2)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 2진 트리 분할인 것, 분할이 세로 분할인 것 및 2개의 서브 블록의 블록 폭의 비율이 2:1인 것을 나타낼 수 있다. 이 경우, 24×32 블록은, 16×32 서브 블록과 8×32 서브 블록으로 분할된다.
예를 들면, 24×24 블록에 대해, 도 46b의 (b1)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 4진 트리 분할인 것, 왼쪽 위의 서브 블록이 가장 큰 서브 블록인 것 및 가장 큰 서브 블록과 가장 작은 서브 블록의 블록 폭의 비율이 2:1인 것을 나타낼 수 있다. 이 경우, 24×24 블록은, 16×16 서브 블록과 8×16 서브 블록과 16×8 서브 블록과 8×8 서브 블록으로 분할된다.
다른 예로, 24×24 블록에 대해, 도 46b의 (b2)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 4진 트리 분할인 것, 오른쪽 아래의 서브 블록이 가장 큰 서브 블록인 것 및 가장 큰 서브 블록과 가장 작은 서브 블록의 블록 폭의 비율이 2:1인 것을 나타낼 수 있다. 이 경우, 24×24 블록은, 8×8 서브 블록과 16×8 서브 블록과 8×16 서브 블록과 16×16 서브 블록으로 분할된다.
예를 들면, 32×32 블록에 대해, 도 46c의 (c1)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 3진 트리 분할인 것, 분할이 세로 분할인 것 및 서브 블록의 블록 폭의 비율이 1:1:2인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 2개의 8×32 서브 블록과 16×32 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 46c의 (c2)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 3진 트리 분할인 것, 분할이 세로 분할인 것 및 서브 블록의 블록 폭의 비율이 2:1:1인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 16×32 서브 블록과 2개의 8×16 서브 블록으로 분할된다.
예를 들면, 32×32 블록에 대해, 도 46d의 (d1)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 세로 가로 양쪽의 방향이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 16×16 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 46d의 (d2)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 세로방향만이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 8×32 서브 블록으로 분할된다.
도 46a~도 46d와 같이, 본 실시형태에서는, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 된다. 또한, 서브 블록의 높이 및/또는 폭은, 2의 멱승에 한정되지 않아도 된다.
단계 S12005에서는, 서브 블록을 복호 처리로 복호한다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 8)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록의 지오메트리를 읽어내고, 읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화한다.
이에 의해, 블록을 당해 블록의 지오메트리에 근거하는 수의 서브 블록으로 분할할 수 있다. 따라서, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킬 수 있다. 또한, 서브 블록의 수를 블록의 지오메트리에 의존시킬 수 있다. 그 결과, 보다 효과적으로 블록을 분할할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 서브 블록의 높이 및 폭 중 적어도 한쪽은 2의 멱승이어도 된다.
이에 의해, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 되도록, 블록을 분할할 수 있다. 따라서, 부호화에 적합한 사이즈의 서브 블록을 얻을 수 있어, 압축 효율을 향상시킬 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록의 지오메트리를 읽어내고, 읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고, 읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호한다.
이에 의해, 블록을 당해 블록의 지오메트리에 근거하는 수의 서브 블록으로 분할할 수 있다. 따라서, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킬 수 있다. 또한, 서브 블록의 수를 블록의 지오메트리에 의존시킬 수 있다. 그 결과, 보다 효과적으로 블록을 분할할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 서브 블록의 높이 및 폭 중 적어도 한쪽은 2의 멱승이어도 된다.
이에 의해, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 되도록, 블록을 분할할 수 있다. 따라서, 부호화에 적합한 사이즈의 서브 블록을 이용할 수 있어, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 23 및 도 24에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 23은, 실시형태 8에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S13001로서, 블록의 지오메트리를 읽어낸다. 여기서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타낸다. 도 44에 나타내는 바와 같이, 이용하는 지오메트리가 다르면, 블록 분할의 결과인 복수의 서브 블록의 형상, 블록 높이, 또는 블록 폭도 다르다.
다음으로, 단계 S13002에서, 읽어낸 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정한다.
읽어낸 지오메트리가 소정의 지오메트리와 동일한 경우(S13002의 Y), 단계 S13003에서, 블록을 제1 수의 서브 블록으로 분할한다. 읽어낸 지오메트리가 소정의 지오메트리와 동일하지 않은 경우(S13002의 N), 단계 S13004에서, 블록을 제1 수와 동일하지 않은 수의 서브 블록으로 분할한다.
예를 들면, 도 47a의 (a1)에 나타내는 바와 같이, 블록의 블록 폭이 2의 멱승이면, 블록(예를 들면, 32×32)을 같은 크기의 4개의 서브 블록(예를 들면, 8×32)으로 세로 분할할 수 있다. 한편, 도 47a의 (a2)에 나타내는 바와 같이, 블록의 블록 폭이 2의 멱승이 아니면, 블록(예를 들면, 24×32)을 같은 크기의 3개의 서브 블록(예를 들면, 8×32)으로 세로 분할할 수 있다.
다른 예로, 도 47b의 (b1)에 나타내는 바와 같이, 블록의 블록 폭 및 블록 높이가 모두 2의 멱승이며, 블록 폭이 블록 높이의 2배이면, 블록(예를 들면, 64×32)을 동일한 크기의 8개의 서브 블록(예를 들면, 16×16)으로 등분할 할 수 있다. 한편, 도 47b의 (b2)에 나타내는 바와 같이, 블록의 블록 폭 및 블록 높이가 모두 2의 멱승이며, 블록 폭이 블록 높이와 같으면, 블록(예를 들면, 32×32)을 동일한 크기의 4개의 서브 블록(예를 들면, 16×16)으로 등분할 할 수 있다.
도 47a~도 47b와 같이, 본 실시형태에서는, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 된다. 또한, 서브 블록의 높이 및/또는 폭은, 2의 멱승에 한정되지 않아도 된다.
단계 S13005에서는, 서브 블록을 부호화 처리로 부호화한다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 24는, 실시형태 8에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S14001로서, 블록의 지오메트리를 읽어낸다. 여기서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타낸다. 도 44에 나타내는 바와 같이, 이용하는 지오메트리가 다르면, 블록 분할의 결과인 복수의 서브 블록의 형상, 블록 높이, 또는 블록 폭도 다르다.
다음으로, 단계 S14002에서, 읽어낸 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정한다.
읽어낸 지오메트리가 소정의 지오메트리와 동일한 경우(S14002의 Y), 단계 S14003에서, 블록을 제1 수의 서브 블록으로 분할한다. 읽어낸 지오메트리가 소정의 지오메트리와 동일하지 않은 경우(S14002의 N), 단계 S14004에서, 블록을 제1 수와 동일하지 않은 수의 서브 블록으로 분할한다.
예를 들면, 도 47a의 (a1)에 나타내는 바와 같이, 블록의 블록 폭이 2의 멱승이면, 블록(예를 들면, 32×32)을 같은 크기의 4개의 서브 블록(예를 들면, 8×32)으로 세로 분할할 수 있다. 한편, 도 47a의 (a2)에 나타내는 바와 같이, 블록의 블록 폭이 2의 멱승이 아니면, 블록(예를 들면, 24×32)을 같은 크기의 3개의 서브 블록(예를 들면, 8×32)으로 세로 분할할 수 있다.
다른 예로, 도 47b의 (b1)에 나타내는 바와 같이, 블록의 블록 폭 및 블록 높이가 모두 2의 멱승이며, 블록 폭이 블록 높이의 2배이면, 블록(예를 들면, 64×32)을 동일한 크기의 8개의 서브 블록(예를 들면, 16×16)으로 등분할 할 수 있다. 한편, 도 47b의 (b2)에 나타내는 바와 같이, 블록의 블록 폭 및 블록 높이가 2의 멱승이며, 블록 폭이 블록 높이와 같으면, 블록(예를 들면, 32×32)을 동일한 크기의 4개의 서브 블록(예를 들면, 16×16)으로 등분할 할 수 있다.
도 47a~도 47b와 같이, 본 실시형태에서는, 서브 블록의 높이 및 폭 중 적어도 한쪽이 2의 멱승이 된다. 또한, 서브 블록의 높이 및/또는 폭은, 2의 멱승에 한정되지 않아도 된다.
단계 S14005에서는, 서브 블록을 복호 처리로 복호한다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 9)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 파라미터를 비트 스트림에 기입하고, 기입된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고, 기입된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고, 상기 제1 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크고, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고, 기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 제2 수의 서브 블록으로 분할하고, 상기 제2 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크고, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화한다.
이에 의해, 파라미터가 소정 값과 동일한지 아닌지에 의해, 분할 후의 서브 블록의 수를 전환할 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 비트 스트림으로부터 파라미터를 해석하고, 해석된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고, 해석된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고, 상기 제1 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크고, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고, 해석된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 제2 수의 서브 블록으로 분할하고, 상기 제2 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크고, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호한다.
이에 의해, 파라미터가 소정 값과 동일한지 아닌지에 의해, 분할 후의 서브 블록의 수를 전환할 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 25 및 도 26에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 25는, 실시형태 9에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S15001로서, 파라미터가 비트 스트림에 기입된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S15002에서, 기입된 파라미터가 소정 값과 동일한지 아닌지를 판정한다.
기입된 파라미터가 소정 값과 동일한 경우(S15002의 Y), 단계 S15003에서, 블록을 제1 수의 서브 블록으로 분할한다. 여기서, 제1 수는, 블록의 분할 처리가 세로 또는 가로의 한 방향인 것이면, 2보다 크고, 블록의 분할 처리가 세로 또는 가로의 한 방향인 것이 아니면, 3보다 크다. 기입된 파라미터가 소정 값과 동일하지 않은 경우(S15002의 N), 단계 S15004에서, 블록을 제1 수와 동일하지 않은 제2 수의 서브 블록으로 분할한다. 여기서, 이 제2 수는, 블록의 분할 처리가 세로 또는 가로의 한 방향인 것이면, 2보다 크고, 블록의 분할 처리가 세로 또는 가로의 한 방향인 것이 아니면, 3보다 크다.
예를 들면, 32×32 블록에 대해, 도 48a의 (a1)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 세로방향만이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 8×32 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 48a의 (a2)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 3진 트리 분할인 것, 분할이 세로 분할인 것 및 서브 블록의 블록 폭의 비율이 1:2:1인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 8×32 서브 블록과 16×32 서브 블록과 8×32 서브 블록으로 분할된다.
32×32 블록에 대해, 예를 들면, 도 48b의 (b1)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 가로방향만이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 32×8 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 48b의 (b2)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 3진 트리 분할인 것, 분할이 가로 분할인 것 및 서브 블록의 블록 높이의 비율이 1:2:1인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 32×8 서브 블록과 32×16 서브 블록과 32×8 서브 블록으로 분할된다.
32×32 블록에 대해, 예를 들면, 도 48c의 (c1)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 세로 가로 양쪽의 방향이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 16×16 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 48c의 (c2)에 나타내는 바와 같이, 기입된 파라미터는, 분할이 다중 트리 분할인 것, 분할에는 세로 가로 양쪽의 방향이 포함되는 것 및 서브 블록의 수가 16인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 16개의 8×8 서브 블록으로 분할된다.
단계 S15005에서는, 서브 블록을 부호화 처리로 부호화한다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 26은, 실시형태 9에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S16001로서, 비트 스트림으로부터 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 상기 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S16002에서, 해석된 파라미터가 소정 값과 동일한지 아닌지를 판정한다.
해석된 파라미터가 소정 값과 동일한 경우(S16002의 Y), 단계 S16003에서, 블록을 제1 수의 서브 블록으로 분할한다. 여기서, 제1 수는, 블록의 분할 처리가 세로 또는 가로의 한 방향인 것이면, 2보다 크고, 블록의 분할 처리가 세로 또는 가로의 한 방향인 것이 아니면, 3보다 크다. 해석된 파라미터가 소정 값과 동일하지 않은 경우(S16002의 N), 단계 S16004에서, 블록을 제1 수와 동일하지 않은 제2 수의 서브 블록으로 분할한다. 여기서, 이 제2 수는, 블록의 분할 처리가 세로 또는 가로의 한 방향인 것이면, 2보다 크고, 블록의 분할 처리가 세로 또는 가로의 한 방향인 것이 아니면, 3보다 크다.
예를 들면, 32×32 블록에 대해, 도 48a의 (a1)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 세로방향만이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 8×32 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 48a의 (a2)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 3진 트리 분할인 것, 분할이 세로 분할인 것 및 서브 블록의 블록 폭의 비율이 1:2:1인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 8×32 서브 블록과 16×32 서브 블록과 8×32 서브 블록으로 분할된다.
예를 들면, 32×32 블록에 대해, 도 48b의 (b1)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 가로방향만이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 32×8 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 48b의 (b2)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 3진 트리 분할인 것, 분할이 가로 분할인 것 및 서브 블록의 블록 높이의 비율이 1:2:1인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 32×8 서브 블록과 32×16 서브 블록과 32×8 서브 블록으로 분할된다.
예를 들면, 32×32 블록에 대해, 도 48c의 (c1)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 4진 트리 분할인 것 및 분할에는 세로 가로 양쪽의 방향이 포함되는 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 4개의 16×16 서브 블록으로 분할된다.
다른 예로, 32×32 블록에 대해, 도 48c의 (c2)에 나타내는 바와 같이, 해석된 파라미터는, 분할이 다중 트리 분할인 것, 분할에는 세로 가로 양쪽의 방향이 포함되는 것 및 서브 블록의 수가 16인 것을 나타낼 수 있다. 이 경우, 32×32 블록은, 16개의 8×8 서브 블록으로 분할된다.
단계 S16005에서는, 서브 블록을 복호 처리로 복호한다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 10)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 파티션 후보 선택 파라미터를 비트 스트림에 기입하고, 기입된 상기 파티션 후보 선택 파라미터를 이용하여, 소정 블록 분할 정보의 큰 세트로부터 블록 분할 정보의 작은 세트를 선택하고, 파티션 선택 파라미터를 비트 스트림에 기입하고, 기입된 상기 파티션 선택 파라미터를 이용하여, 선택된 상기 블록 분할 정보의 작은 세트만으로부터 블록 분할 정보를 특정하고, 특정된 상기 블록 분할 정보가 사용되면, 블록은, 지오메트리 세트의 복수의 서브 블록으로 분할되고, 다른 블록 분할 정보가 사용되면, 블록은, 다른 지오메트리 세트의 복수의 서브 블록으로 분할되고, 특정된 상기 블록 분할 정보를 이용하여, 블록을 복수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화한다.
이에 의해, 2개의 파라미터를 이용하여, 소정 블록 분할 정보의 세트로부터 블록 분할 정보를 단계적으로 선택할 수 있다. 따라서, 블록 분할 정보의 작은 세트가 적절히 분류되면, 효과적인 선택이 가능해진다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킨다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 비트 스트림으로부터 파티션 후보 선택 파라미터를 해석하고, 해석된 상기 파티션 후보 선택 파라미터를 이용하여, 소정 블록 분할 정보의 큰 세트로부터 블록 분할 정보의 작은 세트를 선택하고, 비트 스트림으로부터 파티션 선택 파라미터를 해석하고, 해석된 상기 파티션 선택 파라미터를 이용하여, 선택된 상기 블록 분할 정보의 작은 세트만으로부터 블록 분할 정보를 특정하고, 특정된 상기 블록 분할 정보가 사용되면, 블록은, 지오메트리 세트의 복수의 서브 블록으로 분할되고, 다른 블록 분할 정보가 사용되면, 블록은, 다른 지오메트리 세트의 복수의 서브 블록으로 분할되고, 특정된 상기 블록 분할 정보를 이용하여, 블록을 복수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호한다.
이에 의해, 2개의 파라미터를 이용하여, 소정 블록 분할 정보의 세트로부터 블록 분할 정보를 단계적으로 선택할 수 있다. 따라서, 블록 분할 정보의 작은 세트가 적절히 분류되면, 효과적인 선택이 가능해진다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킨다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 27 및 도 28에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 27은, 실시형태 10에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S17001로서, 파티션 후보 선택 파라미터가 비트 스트림에 기입된다. 도 37은, 압축 영상 비트 스트림에서의 파티션 후보 선택 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S17002에서, 기입된 파티션 후보 선택 파라미터를 이용하여, 소정 블록 분할 정보의 큰 세트로부터 블록 분할 정보의 작은 세트가 선택된다.
기입된 파티션 후보 선택 파라미터는, 예를 들면, 2 이상의 블록 분할 정보 세트로부터 블록 분할 정보 세트를 선택하기 위한 인덱스를 포함할 수 있다.
블록 분할 정보는, 이용하는 분할 방법(세로 분할, 가로 분할 및 4진 트리 분할 등)마다 다른 블록 분할 정보의 그룹(세트)으로 분류할 수 있다. 예를 들면, 도 49a에 나타내는 바와 같이, 세로 분할 그룹(제1 세트), 가로 분할 그룹(제2 세트) 및 4진 트리 분할 그룹(제3 세트)의 3개의 블록 분할 정보 그룹이 있다. 세로 분할 그룹은 세로 분할에만 대응하고, 가로 분할 그룹은 가로 분할에만 대응하며, 4진 트리 분할 그룹은 4진 트리 분할에만 대응한다. 인덱스의 값이 0이면, 세로 분할 그룹이 선택된다. 인덱스의 값이 1이면, 가로 분할 그룹이 선택된다. 인덱스의 값이 2이면, 4진 트리 분할 그룹이 선택된다.
부호화 완료 블록의 블록 분할 정보도 화상 위치마다 다른 블록 분할 정보 그룹으로 분류할 수 있다. 예를 들면, 왼쪽 위 블록, 위쪽 블록 및 오른쪽 위 블록의 블록 분할 정보는, 위쪽 블록 분할 그룹(제1 세트)으로 분류할 수 있다. 왼쪽 아래 블록 및 왼쪽 블록의 블록 분할 정보는, 왼쪽 블록 분할 그룹(제2 세트)으로 분류할 수 있다. 같은 위치 블록 및 움직임 보상 참조 블록의 블록 분할 정보는, 시간 블록 분할 그룹(제3 세트)으로 분류할 수 있다. 인덱스의 값이 0이면, 위쪽 블록 분할 그룹이 선택된다. 인덱스의 값이 1이면, 왼쪽 블록 분할 그룹이 선택된다. 인덱스의 값이 2이면, 시간 블록 분할 그룹이 선택된다.
다른 예로, 기입된 파티션 후보 선택 파라미터는, 도 49b에 나타내는 바와 같이, 블록 분할 정보 세트로부터 1 이상의 선택 블록 분할 정보를 선택하기 위한 파라미터/인덱스를 포함할 수 있다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
단계 S17003에서, 파티션 선택 파라미터가 비트 스트림에 기입된다. 도 37은, 압축 영상 비트 스트림에서의 파티션 선택 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S17004에서, 기입된 파티션 선택 파라미터를 이용하여, 선택된 블록 분할 정보의 세트만으로부터 블록 분할 정보가 특정된다. 여기서, 특정된 블록 분할 정보가 이용되면, 블록은 지오메트리 세트의 복수의 서브 블록으로 분할되지만, 다른 블록 분할 정보가 이용되면, 블록은 다른 지오메트리 세트의 복수의 서브 블록으로 분할된다.
기입된 파티션 선택 파라미터는, 예를 들면, 선택된 블록 분할 정보의 작은 세트로부터 하나의 블록 분할 정보를 선택하기 위한 인덱스를 포함할 수 있다.
예를 들면, 도 49a에 나타내는 바와 같이, 단계 S17002에서, 세로 분할 그룹(제1 세트)이 블록 분할 정보의 작은 세트로서 선택된다. 세로 분할 그룹에는, 3개의 다른 블록 분할 정보에 따른 3개의 다른 블록 파티션 구조가 있다. 인덱스의 값이 0이면, 세로 분할 그룹의 제1 블록 파티션 구조가 특정된다. 인덱스의 값이 1이면, 세로 분할 그룹의 제2 블록 파티션 구조가 특정된다. 인덱스의 값이 2이면, 세로 분할 그룹의 제3 블록 파티션 구조가 특정된다.
다른 예에서는, 블록 분할 정보의 작은 세트로서 단계 S17002에서 선택된 위쪽 블록 분할 그룹에 왼쪽 위 블록, 위쪽 블록 및 오른쪽 위 블록의 블록 분할 정보를 분류한다. 인덱스의 값이 0이면, 왼쪽 위 블록의 블록 파티션 구조가 특정된다. 인덱스의 값이 1이면, 위쪽 블록의 블록 파티션 구조가 특정된다. 인덱스의 값이 2이면, 오른쪽 위 블록의 블록 파티션 구조가 특정된다.
다른 예로, 기입된 파티션 선택 파라미터는, 초기 블록 분할 정보로부터 블록 분할 정보를 도출하기 위한 복수의 분할/머지 플래그(split/merge flags)를 포함할 수 있다.
그리고, 단계 S17005에서, 블록은, 특정된 블록 분할 정보를 이용하여 복수의 서브 블록으로 분할된다.
단계 S17006에서는, 서브 블록은, 부호화 처리로 부호화된다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 28은, 실시형태 10에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S18001로서, 비트 스트림으로부터 파티션 후보 선택 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 파티션 후보 선택 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S18002에서, 해석된 파티션 후보 선택 파라미터를 이용하여, 소정 블록 분할 정보의 큰 세트로부터 블록 분할 정보의 작은 세트가 선택된다.
해석된 파티션 후보 선택 파라미터는, 예를 들면, 2 이상의 블록 분할 정보 세트로부터 블록 분할 정보 세트를 선택하기 위한 인덱스를 포함할 수 있다.
블록 분할 정보는, 이용하는 분할 방법(세로 분할, 가로 분할 및 4진 트리 분할 등)마다 다른 블록 분할 정보의 그룹(세트)으로 분류할 수 있다. 예를 들면, 도 49a에 나타내는 바와 같이, 세로 분할 그룹(제1 세트), 가로 분할 그룹(제2 세트) 및 4진 트리 분할 그룹(제3 세트)의 3개의 블록 분할 정보 그룹이 있다. 세로 분할 그룹은 세로 분할에만 대응하고, 가로 분할 그룹은 가로 분할에만 대응하고, 4진 트리 분할 그룹은 4진 트리 분할에만 대응한다. 인덱스의 값이 0이면, 세로 분할 그룹이 선택된다. 인덱스의 값이 1이면, 가로 분할 그룹이 선택된다. 인덱스의 값이 2이면, 4진 트리 분할 그룹이 선택된다.
복호 완료 블록의 블록 분할 정보도 화상 위치마다 다른 블록 분할 정보 그룹으로 분류할 수 있다. 예를 들면, 왼쪽 위 블록, 위쪽 블록 및 오른쪽 위의 블록의 블록 분할 정보는, 위쪽 블록 분할 그룹(제1 세트)으로 분류할 수 있다. 왼쪽 아래 블록 및 왼쪽 블록의 블록 분할 정보는, 왼쪽 블록 분할 그룹(제2 세트)으로 분류할 수 있다. 같은 위치 블록 및 움직임 보상 참조 블록의 블록 분할 정보는, 시간 블록 분할 그룹(제3 세트)으로 분류할 수 있다. 인덱스의 값이 0이면, 위쪽 블록 분할 그룹이 선택된다. 인덱스의 값이 1이면, 왼쪽 블록 분할 그룹이 선택된다. 인덱스의 값이 2이면, 시간 블록 분할 그룹이 선택된다.
다른 예로, 해석된 파티션 후보 선택 파라미터는, 도 49b에 나타내는 바와 같이, 블록 분할 정보 세트로부터 1 이상의 선택 블록 분할 정보를 선택하기 위한 파라미터/인덱스를 포함할 수 있다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
단계 S18003에서, 비트 스트림으로부터 파티션 선택 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 파티션 선택 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S18004에서, 해석된 파티션 선택 파라미터를 이용하여, 선택된 블록 분할 정보의 작은 세트만으로부터 블록 분할 정보가 특정된다. 여기서, 특정된 블록 분할 정보가 이용되면, 블록은 지오메트리 세트의 복수의 서브 블록으로 분할되지만, 다른 블록 분할 정보가 이용되면, 블록은 다른 지오메트리 세트의 복수의 서브 블록으로 분할된다.
해석된 파티션 선택 파라미터는, 예를 들면, 선택된 블록 분할 정보의 작은 세트로부터 하나의 블록 분할 정보를 선택하기 위한 인덱스를 포함할 수 있다.
예를 들면, 도 49a에 나타내는 바와 같이, 단계 S18002에서, 세로 분할 그룹(제1 세트)이 블록 분할 정보의 작은 세트로서 선택된다. 세로 분할 그룹에는, 3개의 다른 블록 분할 정보에 따른 3개의 다른 블록 파티션 구조가 있다. 인덱스의 값이 0이면, 세로 분할 그룹의 제1 블록 파티션 구조가 특정된다. 인덱스의 값이 1이면, 세로 분할 그룹의 제2 블록 파티션 구조가 특정된다. 인덱스의 값이 2이면, 세로 분할 그룹의 제3 블록 파티션 구조가 특정된다.
다른 예에서는, 블록 분할 정보의 작은 세트로서 단계 S18002에서 선택된 위쪽 블록 분할 그룹에 왼쪽 위 블록, 위쪽 블록 및 오른쪽 위 블록의 블록 분할 정보가 분류된다. 인덱스의 값이 0이면, 왼쪽 위 블록의 블록 파티션 구조가 특정된다. 인덱스의 값이 1이면, 위쪽 블록의 블록 파티션 구조가 특정된다. 인덱스의 값이 2이면, 오른쪽 위 블록의 블록 파티션 구조가 특정된다.
다른 예로, 해석된 파티션 선택 파라미터는, 초기 블록 분할 정보로부터 블록 분할 정보를 도출하기 위한 복수의 분할/머지 플래그(split/merge flags)를 포함할 수 있다.
그리고, 단계 S18005에서, 특정된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다.
단계 S18006에서는, 서브 블록이 복호 처리로 복호된다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 11)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 파라미터를 비트 스트림에 기입하고, 1 이상의 부호화 완료 블록으로부터 블록 정보를 읽어내고, 읽어내어진 상기 블록 정보를 이용하여, 소정 블록 분할 정보의 큰 세트로부터 블록 분할 정보의 작은 세트를 선택하고, 기입된 상기 파라미터를 이용하여, 선택된 상기 블록 분할 정보의 작은 세트만으로부터 블록 분할 정보를 특정하고, 특정된 상기 블록 분할 정보가 사용되면, 블록은, 지오메트리 세트의 복수의 서브 블록으로 분할되고, 다른 블록 분할 정보가 사용되면, 블록은, 다른 지오메트리 세트의 복수의 서브 블록으로 분할되고, 특정된 상기 블록 분할 정보를 이용하여, 커렌트 블록을 복수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화한다.
이에 의해, 부호화 완료 블록의 블록 정보에 의해, 소정 블록 분할 정보로부터 선택 가능한 블록 분할 정보를 좁힐 수 있고, 블록 분할 정보를 선택하기 위한 파라미터의 부호량을 삭감할 수 있다. 그 결과, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 커렌트 블록 및 상기 1 이상의 부호화 완료 블록은 서로 다른 블록이며, 상기 1 이상의 부호화 완료 블록 중 적어도 하나는, 상기 커렌트 블록과 같은 프레임 또는 상기 커렌트 블록의 프레임과 상이한 다른 프레임에 포함되어도 된다.
이에 의해, 서로 다른 1 이상의 부호화 완료 블록으로부터 블록 정보를 읽어낼 수 있고, 보다 적절한 블록 분할 정보의 작은 세트를 선택할 수 있다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 읽어내어진 상기 블록 정보는, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이에 관한 정보 중 적어도 하나를 포함해도 된다.
이에 의해, 블록 정보로서, 블록 분할 정보의 작은 세트의 선택에 의해 적합한 정보를 이용할 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 비트 스트림으로부터 파라미터를 해석하고, 1 이상의 복호 완료 블록으로부터 블록 정보를 읽어내고, 읽어내어진 상기 블록 정보를 이용하여, 소정 블록 분할 정보의 큰 세트로부터 블록 분할 정보의 작은 세트를 선택하고, 해석된 상기 파라미터를 이용하여, 선택된 상기 블록 분할 정보의 작은 세트만으로부터 블록 분할 정보를 특정하고, 특정된 상기 블록 분할 정보가 사용되면, 블록은, 지오메트리 세트의 복수의 서브 블록으로 분할되고, 다른 블록 분할 정보가 사용되면, 블록은, 다른 지오메트리 세트의 복수의 서브 블록으로 분할되고, 특정된 상기 블록 분할 정보를 이용하여, 커렌트 블록을 복수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호한다.
이에 의해, 복호 완료 블록의 블록 정보에 의해, 소정 블록 분할 정보로부터 선택 가능한 블록 분할 정보를 좁힐 수 있고, 블록 분할 정보를 선택하기 위한 파라미터의 부호량을 삭감할 수 있다. 그 결과, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 지오메트리는, 적어도 블록의 형태, 높이 또는 폭을 나타내도 된다.
이에 의해, 지오메트리로서, 블록의 형태 및/또는 사이즈를 이용할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 커렌트 블록 및 상기 1 이상의 복호 완료 블록은 서로 다른 블록이며, 상기 1 이상의 복호 완료 블록 중 적어도 하나는, 상기 커렌트 블록과 같은 프레임 또는 상기 커렌트 블록의 프레임과 상이한 다른 프레임에 포함되어도 된다.
이에 의해, 서로 다른 1 이상의 복호 완료 블록으로부터 블록 정보를 읽어낼 수 있고, 보다 적절한 블록 분할 정보의 작은 세트를 선택할 수 있다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 읽어내어진 상기 블록 정보는, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이에 관한 정보 중 적어도 하나를 포함해도 된다.
이에 의해, 블록 정보로서, 블록 분할 정보의 작은 세트의 선택에 의해 적합한 정보를 이용할 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
영상을 부호화하는 방법 및 복호하는 방법을 도 29 및 도 30에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 29는, 실시형태 11에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S19001로서, 파라미터가 비트 스트림에 기입된다. 도 37은, 압축 영상 비트 스트림에서의 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S19002에서, 1 이상의 부호화 완료 블록으로부터 블록 정보(예를 들면, 위치, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이)가 읽어내어진다.
단계 S19003에서, 읽어내어진 블록 정보를 이용하여, 소정 블록 분할 정보의 큰 세트로부터 블록 분할 정보의 작은 세트가 선택된다.
예를 들면, 읽어내어진 블록 정보를 이용하여, 우선, 예측 블록 분할 정보를 도출할 수 있다. 그리고, 소정 블록 분할 정보의 큰 세트로부터 예측 블록 분할 정보와 유사한 블록 파티션 구조를 가지는 블록 분할 정보가 선택되고, 블록 분할 정보의 작은 세트에 추가된다. 이들 블록 분할 정보의 선택에서, 예를 들면, 예측 블록 분할 정보가 세로 분할만을 사용하는 것을 나타내고 있으면, 세로 분할만의 블록 파티션 구조가 선택된다(도 49a의 제1 세트). 이들 블록 분할 정보의 선택에서, 예를 들면, 예측 블록 분할 정보가 가로 분할만을 사용하는 것을 나타내고 있으면, 가로 분할만의 블록 파티션 구조가 선택된다(도 49a의 제2 세트). 다른 예로는, 이들 블록 분할 정보의 선택에서, 도 50에 나타내는 바와 같이, 예측 블록 분할 정보에 따른 블록 파티션 구조와 같은/유사한 지오메트리를 가지는 블록 파티션 구조가 선택된다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다. 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
커렌트 블록의 예측 블록 파티션 구조로는, 부호화 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 부호화 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다. 부호화 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 부호화 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 부호화된 1 이상의 부호화 완료 블록이 선택된다.
부호화 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다.
예측 블록 분할 정보는, 부호화 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 예측하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 세로 분할을 포함하는 블록 분할 정보를 예측할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 가로 분할을 포함하는 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 인트라/인터 예측 모드에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 부호화 완료 블록의 예측 모드가 인터 예측 모드인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 움직임 벡터에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 한편, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 양자화 파라미터에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 참조 픽처 정보에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 분할 깊이에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 부호화 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 부호화 완료 블록의 분할 정보에 따라 예측되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 부호화 완료 프레임의 부호화 완료 블록(예를 들면, 같은 위치 블록(collocated block), 직전의 부호화 완료 블록(last encoded block), 또는 움직임 벡터로 특정되는 부호화 완료 블록 등)으로부터 예측할 수 있다.
부호화 완료 블록의 블록 분할 정보도 화상 위치마다 다른 블록 분할 정보 그룹으로 분류할 수 있다. 예를 들면, 왼쪽 위 블록, 위쪽 블록 및 오른쪽 위 블록의 블록 분할 정보는, 위쪽 블록 분할 그룹(제1 세트)으로 분류할 수 있다. 왼쪽 아래 블록 및 왼쪽 블록의 블록 분할 정보는, 왼쪽 블록 분할 그룹(제2 세트)으로 분류할 수 있다. 같은 위치 블록 및 움직임 보상 참조 블록의 블록 분할 정보는, 시간 블록 분할 그룹(제3 세트)으로 분류할 수 있다. 인덱스의 값이 0이면, 위쪽 블록 분할 그룹이 선택된다. 인덱스의 값이 1이면, 왼쪽 블록 분할 그룹이 선택된다. 인덱스의 값이 2이면, 시간 블록 분할 그룹이 선택된다.
다음으로, 단계 S19004에서, 기입된 파라미터를 이용하여, 선택된 블록 분할 정보의 작은 세트만으로부터 블록 분할 정보가 특정된다. 여기서, 특정된 블록 분할 정보가 이용되면, 블록은 지오메트리 세트의 복수의 서브 블록으로 분할되지만, 다른 블록 분할 정보가 이용되면, 블록은 다른 지오메트리 세트의 복수의 서브 블록으로 분할된다. 기입된 파라미터는, 예를 들면, 선택된 블록 분할 정보의 작은 세트로부터 하나의 블록 분할 정보를 선택하기 위한 인덱스를 포함할 수 있다.
예를 들면, 왼쪽 위 블록, 위쪽 블록 및 오른쪽 위 블록의 블록 분할 정보는, 블록 분할 정보의 작은 세트로서 단계 S19003에서 선택된 위쪽 블록 분할 그룹으로 분류된다. 인덱스의 값이 0이면, 왼쪽 위 블록의 블록 파티션 구조가 특정된다. 인덱스의 값이 1이면, 위쪽 블록의 블록 파티션 구조가 특정된다. 인덱스의 값이 2이면, 오른쪽 위 블록의 블록 파티션 구조가 특정된다.
다른 예로, 기입된 파라미터는, 초기 블록 분할 정보로부터 블록 분할 정보를 도출하기 위한 복수의 분할/머지 플래그(split/merge flags)를 포함할 수 있다.
그리고, 단계 S19005에서, 특정된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다.
단계 S19006에서는, 서브 블록이 부호화 처리로 부호화된다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 30은, 실시형태 11에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S20001로서, 비트 스트림으로부터 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S20002에서, 1 이상의 부호화 완료 블록으로부터 블록 정보(예를 들면, 위치, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이)가 읽어내어진다.
단계 S20003에서, 읽어내어진 블록 정보를 이용하여, 소정 블록 분할 정보의 큰 세트로부터 블록 분할 정보의 작은 세트가 선택된다.
예를 들면, 읽어내어진 블록 정보를 이용하여, 우선, 예측 블록 분할 정보를 도출할 수 있다. 그리고, 소정 블록 분할 정보의 큰 세트로부터 예측 블록 분할 정보와 유사한 블록 파티션 구조를 가지는 블록 분할 정보가 선택되고, 블록 분할 정보의 작은 세트에 추가된다. 이들 블록 분할 정보의 선택에서, 예를 들면, 예측 블록 분할 정보가 세로 분할만을 사용하는 것을 나타내고 있으면, 세로 분할만의 블록 파티션 구조가 선택된다(도 49a의 제1 세트). 이들 블록 분할 정보의 선택에서, 예를 들면, 예측 블록 분할 정보가 가로 분할만을 사용하는 것을 나타내고 있으면, 가로 분할만의 블록 파티션 구조가 선택된다(도 49a의 제2 세트). 다른 예로는, 이들 블록 분할 정보의 선택에서, 도 50에 나타내는 바와 같이, 예측 블록 분할 정보에 따른 블록 파티션 구조와 같은/유사한 지오메트리를 가지는 블록 파티션 구조가 선택된다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다. 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
커렌트 블록의 예측 블록 파티션 구조로는, 복호 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 복호 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다. 복호 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 복호 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 복호된 1 이상의 복호 완료 블록이 선택된다.
복호 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다.
예측 블록 분할 정보는, 복호 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 예측하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 세로 분할을 포함하는 블록 분할 정보를 예측할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 가로 분할을 포함하는 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 인트라/인터 예측 모드에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 복호 완료 블록의 예측 모드가 인터 예측 모드인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 움직임 벡터에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 한편, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 양자화 파라미터에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 참조 픽처 정보에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 분할 깊이에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다.복호 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 복호 완료 블록의 분할 정보에 따라 예측되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보는, 커렌트 프레임과 상이한 복호 완료 프레임의 복호 완료 블록(예를 들면, 같은 위치 블록(collocated block), 최후 복호 완료 블록(last decoded block), 또는 움직임 벡터로 특정되는 복호 완료 블록 등)으로부터 예측할 수 있다.
복호 완료 블록의 블록 분할 정보도 화상 위치마다 다른 블록 분할 정보 그룹으로 분류할 수 있다. 예를 들면, 왼쪽 위 블록, 위쪽 블록 및 오른쪽 위 블록의 블록 분할 정보는, 위쪽 블록 분할 그룹(제1 세트)으로 분류할 수 있다. 왼쪽 아래 블록 및 왼쪽 블록의 블록 분할 정보는, 왼쪽 블록 분할 그룹(제2 세트)으로 분류할 수 있다. 같은 위치 블록 및 움직임 보상 참조 블록의 블록 분할 정보는, 시간 블록 분할 그룹(제3 세트)으로 분류할 수 있다. 인덱스의 값이 0이면, 위쪽 블록 분할 그룹이 선택된다. 인덱스의 값이 1이면, 왼쪽 블록 분할 그룹이 선택된다. 인덱스의 값이 2이면, 시간 블록 분할 그룹이 선택된다.
다음으로, 단계 S20004에서, 해석된 파라미터를 이용하여, 선택된 블록 분할 정보의 작은 세트만으로부터 블록 분할 정보가 특정된다. 여기서, 특정된 블록 분할 정보가 이용되면, 블록은 지오메트리 세트의 복수의 서브 블록으로 분할되지만, 다른 블록 분할 정보가 이용되면, 블록은 다른 지오메트리 세트의 복수의 서브 블록으로 분할된다.
해석된 파티션 선택 파라미터는, 예를 들면, 선택된 블록 분할 정보의 작은 세트로부터 하나의 블록 분할 정보를 선택하기 위한 인덱스를 포함할 수 있다.
예를 들면, 왼쪽 위 블록, 위쪽 블록 및 오른쪽 위 블록의 블록 분할 정보는, 블록 분할 정보의 작은 세트로서 단계 S20003에서 선택된 위쪽 블록 분할 그룹으로 분류된다. 인덱스의 값이 0이면, 왼쪽 위 블록의 블록 파티션 구조가 특정된다. 인덱스의 값이 1이면, 위쪽 블록의 블록 파티션 구조가 특정된다. 인덱스의 값이 2이면, 오른쪽 위 블록의 블록 파티션 구조가 특정된다.
다른 예로, 해석된 파티션 선택 파라미터는, 초기 블록 분할 정보로부터 블록 분할 정보를 도출하기 위한 복수의 분할/머지 플래그(split/merge flags)를 포함할 수 있다.
그리고, 단계 S20005에서, 특정된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다.
단계 S20006에서는, 서브 블록이 복호 처리로 복호된다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 12)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 리스트 수정 파라미터를 비트 스트림에 기입하고, 기입된 상기 리스트 수정 파라미터를 이용하여, 소정 블록 분할 정보 리스트를 수정 블록 분할 정보 리스트로 수정하고, 파티션 선택 파라미터를 비트 스트림에 기입하고, 기입된 상기 파티션 선택 파라미터를 이용하여, 상기 수정 블록 분할 정보 리스트만으로부터, 블록을 복수의 서브 블록으로 분할하게 되는 블록 분할 정보를 선택하고, 선택된 상기 블록 분할 정보를 이용하여, 블록을 복수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 부호화한다.
이에 의해, 비트 스트림 내의 리스트 수정 파라미터를 이용하여, 소정 블록 분할 정보 리스트를 수정할 수 있다. 따라서, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 소정 블록 분할 정보 리스트의 수정에서는, 소정 블록 분할 정보 리스트를 정렬하여 수정 블록 분할 정보를 생성하고, 상기 파티션 선택 파라미터는, 리스트순이 늦은 블록 분할 정보보다도 리스트순이 빠른 블록 분할 정보 쪽이 적은 비트로 부호화되어도 된다.
이에 의해, 비트 스트림 내의 리스트 수정 파라미터를 이용하여, 소정 블록 분할 정보 리스트를 정렬할 수 있다. 따라서, 선택될 가능성이 높은 블록 분할 정보를 리스트의 상위에 배치하는 것이 용이해져, 블록 분할 정보에 관한 부호량을 삭감할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 소정 블록 분할 정보 리스트의 수정에서는, 상기 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입하여, 보다 긴 블록 분할 정보 리스트를 생성해도 된다.
이에 의해, 비트 스트림 내의 리스트 수정 파라미터를 이용하여, 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입할 수 있다. 따라서, 블록 분할에 적합한 블록 분할 정보를 리스트에 추가하는 것이 용이해져, 압축 효율을 향상시킬 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 비트 스트림으로부터 리스트 수정 파라미터를 해석하고, 해석된 상기 리스트 수정 파라미터를 이용하여, 소정 블록 분할 정보 리스트를 수정 블록 분할 정보 리스트로 수정하고, 비트 스트림으로부터 파티션 선택 파라미터를 해석하고, 해석된 상기 파티션 선택 파라미터를 이용하여, 상기 수정 블록 분할 정보 리스트만으로부터, 블록을 복수의 서브 블록으로 분할하게 되는 블록 분할 정보를 선택하고, 선택된 상기 블록 분할 정보를 이용하여, 블록을 복수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 복호한다.
이에 의해, 비트 스트림 내의 리스트 수정 파라미터를 이용하여, 소정 블록 분할 정보 리스트를 수정할 수 있다. 따라서, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 소정 블록 분할 정보 리스트의 수정에서는, 소정 블록 분할 정보 리스트를 정렬하여 수정 블록 분할 정보를 생성하고, 상기 파티션 선택 파라미터는, 리스트순이 늦은 블록 분할 정보보다도 리스트 순이 빠른 블록 분할 정보 쪽이 적은 비트로 부호화되어도 된다.
이에 의해, 비트 스트림 내의 리스트 수정 파라미터를 이용하여, 소정 블록 분할 정보 리스트를 정렬할 수 있다. 따라서, 선택될 가능성이 높은 블록 분할 정보를 리스트의 상위에 배치하는 것이 용이해져, 블록 분할 정보에 관한 부호량을 삭감할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 소정 블록 분할 정보 리스트의 수정에서는, 상기 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입하여, 보다 긴 블록 분할 정보 리스트를 생성해도 된다.
이에 의해, 비트 스트림 내의 리스트 수정 파라미터를 이용하여, 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입할 수 있다. 따라서, 블록 분할에 적합한 블록 분할 정보를 리스트에 추가하는 것이 용이해져, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 31 및 도 32에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 31은, 실시형태 12에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S21001로서, 리스트 수정 파라미터가 비트 스트림에 기입된다. 도 37은, 압축 영상 비트 스트림에서의 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S21002에서, 기입된 리스트 수정 파라미터를 이용하여 소정 블록 분할 정보 리스트가 수정 블록 분할 정보 리스트로 수정된다. 이 수정은, 예를 들면, 소정 블록 분할 정보 리스트를 정렬하여 수정 블록 분할 정보 리스트를 생성하는 처리이어도 된다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 부호화된다. 정렬에 의해, 도 51에 나타내는 바와 같이, 선택된 블록 분할 정보의 리스트순이 빨라지고, 파티션 선택 파라미터의 부호화 비트가 감소한다.
리스트의 정렬을 위해, 예를 들면, 리스트를 다른 블록 분할 정보 그룹(예를 들면, 세로 분할 그룹, 가로 분할 그룹, 4진 트리 분할 그룹 및 모든 블록 분할 정보를 포함하는 전체 분할 그룹)으로 분류하면 된다. 이들 블록 분할 정보 그룹을 정렬함으로써, 도 52에 나타내는 바와 같이 리스트가 정렬된다. 이 예에서는, 리스트 수정 파라미터는, 수정 블록 분할 정보 리스트에서의 각 블록 분할 그룹의 순서를 나타내는 파라미터를 포함할 수 있다.
커렌트 블록의 지오메트리를 이용함으로써, 각 그룹의 블록 분할 정보에 묵시적으로 제한을 가할 수 있다. 예를 들면, 블록 폭 및 블록 높이가 2의 멱승이 되는 분할만 이용할 수 있게 할 수 있다. 이들 블록 분할 정보의 경우, 서브 블록의 폭 또는 서브 블록의 높이가 2의 멱승이 되지 않는 것은, 그 그룹에서 사용되지 않는다.
다른 예로, 수정은, 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입함으로써, 보다 긴 블록 분할 정보 리스트를 작성하는 처리이어도 된다. 가장 이용 가능성이 높은 블록 분할 정보를 리스트의 선두에 삽입하면, 파티션 선택 파라미터의 부호화 비트는 적어진다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 부호화된다.
다른 예로, 수정은, 소정 블록 분할 정보 리스트로부터 블록 분할 정보를 삭제함으로써, 보다 짧은 블록 분할 정보 리스트를 작성하는 처리이어도 된다. 가장 이용 가능성이 높은 블록 분할 정보보다 앞에 있는 이용 가능성이 낮은 블록 분할 정보를 삭제하면, 파티션 선택 파라미터의 부호화 비트는 적어진다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 부호화된다.
정렬 처리, 삽입 처리 및 삭제 처리는 조합되어도 된다(정렬 및 삽입, 또는 정렬 및 삭제, 또는 삽입 및 삭제, 또는 정렬, 삽입 및 삭제 등).
커렌트 블록의 지오메트리를 이용함으로써, 블록 분할 정보 리스트에서의 블록 분할 정보에 묵시적으로 제한을 가할 수 있다. 예를 들면, 블록 폭 및 블록 높이가 2의 멱승이 되는 분할만 이용할 수 있게 할 수 있다. 이들 블록 분할 정보의 경우, 서브 블록의 폭 또는 서브 블록의 높이가 2의 멱승이 되지 않는 것은, 그 리스트에서 사용되지 않는다.
리스트 수정 파라미터는, 예를 들면, 수정이 필요하지 않은 것을 나타낼 수도 있다. 수정이 필요하지 않으면, 단계 S21002는 생략할 수 있다. 따라서, 수정 블록 분할 정보 리스트는, 단계 S21003으로 가기 이전에 소정 블록 분할 정보 리스트와 동일하다.
단계 S21003에서, 파티션 선택 파라미터가 비트 스트림에 기입된다. 도 37은, 압축 영상 비트 스트림에서의 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S21004에서, 기입된 파티션 선택 파라미터를 이용하여, 수정 블록 분할 정보 리스트만으로부터 블록 분할 정보가 선택된다. 여기서 선택된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다. 기입된 파티션 선택 파라미터는, 예를 들면, 소정 블록 분할 정보 리스트로부터 하나의 블록 분할 정보를 선택하기 위한 인덱스를 포함할 수 있다. 다른 예로, 기입된 파티션 선택 파라미터는, 초기 블록 분할 정보로부터 블록 분할 정보를 도출하기 위한 복수의 분할/머지 플래그(split/merge flags)를 포함할 수 있다.
파티션 선택 파라미터의 부호화 비트 및 그 의미는, 선택된 블록 분할 정보에 따라 다르다. 예를 들면, 선택된 블록 분할 정보에 의해 가로 분할만이 발생하는 경우, 분할이 가로 분할인지 세로 분할인지를 나타낼 필요는 없으며, 블록을 나눈다는 것만으로, 도 53에 나타내는 바와 같이 블록을 가로 분할하는 것을 의미한다. 한편, 선택된 블록 분할 정보에 의해 세로 분할만이 발생하는 경우, 분할이 가로 분할인지 세로 분할인지를 나타낼 필요는 없으며, 블록을 나눈다는 것만으로, 블록을 세로 분할하는 것을 의미한다.
단계 S21005에서, 선택된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다. 선택된 블록 분할 정보는, 예를 들면, 블록을 서브 블록으로 분할하기 위해 사용되는 최종 블록 분할 정보가 될 수 있다. 다른 예로, 선택된 블록 분할 정보는, 예측 블록 분할 정보 또는 초기 블록 분할 정보이어도 된다. 예측 블록 분할 정보 또는 초기 블록 분할 정보에 근거하여, 블록을 서브 블록으로 분할하기 위한 최종 블록 분할 정보가 도출된다.
단계 S21006에서는, 복수의 서브 블록에 포함되는 서브 블록이 부호화 처리로 부호화된다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 32는, 실시형태 12에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S22001로서, 비트 스트림으로부터 리스트 수정 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S22002에서, 해석된 리스트 수정 파라미터를 이용하여 소정 블록 분할 정보 리스트가 수정 블록 분할 정보 리스트로 수정된다. 이 수정은, 예를 들면, 소정 블록 분할 정보 리스트를 정렬하여 수정 블록 분할 정보 리스트를 생성하는 처리이어도 된다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 복호된다. 정렬함으로써, 도 51에 나타내는 바와 같이, 선택된 블록 분할 정보의 리스트순이 빨라지고, 파티션 선택 파라미터의 복호 비트가 감소한다.
리스트의 정렬을 위해, 예를 들면, 리스트를 다른 블록 분할 정보 그룹(예를 들면, 세로 분할 그룹, 가로 분할 그룹, 4진 트리 분할 그룹 및 모든 블록 분할 정보를 포함하는 전체 분할 그룹)으로 분류하면 된다. 이들 블록 분할 정보 그룹을 정렬함으로써, 도 52에 나타내는 바와 같이 리스트가 정렬된다. 이 예에서는, 리스트 수정 파라미터는, 수정 블록 분할 정보 리스트에서의 각 블록 분할 그룹의 순서를 나타내는 파라미터를 포함할 수 있다.
커렌트 블록의 지오메트리를 이용함으로써, 각 그룹의 블록 분할 정보에 묵시적으로 제한을 가할 수 있다. 예를 들면, 블록 폭 및 블록 높이가 2의 멱승이 되는 분할만 이용할 수 있게 할 수 있다. 이들 블록 분할 정보의 경우, 서브 블록의 폭 또는 서브 블록의 높이가 2의 멱승이 되지 않는 것은, 그 그룹에서 사용되지 않는다.
다른 예로, 수정은, 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입함으로써, 보다 긴 블록 분할 정보 리스트를 작성하는 처리이어도 된다. 가장 이용 가능성이 높은 블록 분할 정보를 리스트의 선두에 삽입하면, 파티션 선택 파라미터의 복호 비트는 적어진다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 복호된다.
다른 예로, 수정은, 소정 블록 분할 정보 리스트로부터 블록 분할 정보를 삭제함으로써, 보다 짧은 블록 분할 정보 리스트를 작성하는 처리이어도 된다. 가장 이용 가능성이 높은 블록 분할 정보보다 앞에 있는 이용 가능성이 낮은 블록 분할 정보를 삭제하면, 파티션 선택 파라미터의 복호 비트는 적어진다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 복호된다.
정렬 처리, 삽입 처리 및 삭제 처리는 조합되어도 된다(정렬 및 삽입, 또는 정렬 및 삭제, 또는 삽입 및 삭제, 또는 정렬, 삽입 및 삭제 등).
커렌트 블록의 지오메트리를 이용함으로써, 블록 분할 정보 리스트에서의 블록 분할 정보에 묵시적으로 제한을 가할 수 있다. 예를 들면, 블록 폭 및 블록 높이가 2의 멱승이 되는 분할만 이용할 수 있게 할 수 있다. 이들 블록 분할 정보의 경우, 서브 블록의 폭 또는 서브 블록의 높이가 2의 멱승이 되지 않는 것은, 그 리스트에서 사용되지 않는다.
리스트 수정 파라미터는, 예를 들면, 수정이 필요하지 않은 것을 나타낼 수도 있다. 수정이 필요하지 않으면, 단계 S22002는 생략할 수 있다. 따라서, 수정 블록 분할 정보 리스트는, 단계 S22003으로 가기 이전에 소정 블록 분할 정보 리스트와 동일하다.
단계 S22003에서, 비트 스트림으로부터 파티션 선택 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S22004에서, 해석된 파티션 선택 파라미터를 이용하여, 수정 블록 분할 정보 리스트만으로부터 블록 분할 정보가 선택된다. 여기서 선택된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다. 해석된 파티션 선택 파라미터는, 예를 들면, 소정 블록 분할 정보 리스트로부터 하나의 블록 분할 정보를 선택하기 위한 인덱스를 포함할 수 있다. 다른 예로, 해석된 파티션 선택 파라미터는, 초기 블록 분할 정보로부터 블록 분할 정보를 도출하기 위한 복수의 분할/머지 플래그(split/merge flags)를 포함할 수 있다.
파티션 선택 파라미터의 복호 비트 및 그 의미는, 선택된 블록 분할 정보에 따라 다르다. 예를 들면, 선택된 블록 분할 정보에 의해 가로 분할만이 발생하는 경우, 분할이 가로 분할인지 세로 분할인지를 나타낼 필요는 없으며, 블록을 나눈다는 것만으로, 도 53에 나타내는 바와 같이 블록을 가로 분할하는 것을 의미한다. 한편, 선택된 블록 분할 정보에 의해 세로 분할만이 발생하는 경우, 분할이 가로 분할인지 세로 분할인지를 나타낼 필요는 없으며, 블록을 나눈다는 것만으로, 블록을 세로 분할하는 것을 의미한다.
단계 S22005에서, 선택된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다. 선택된 블록 분할 정보는, 예를 들면, 블록을 서브 블록으로 분할하기 위해 사용되는 최종 블록 분할 정보가 될 수 있다. 다른 예로, 선택된 블록 분할 정보는, 예측 블록 분할 정보 또는 초기 블록 분할 정보이어도 된다. 예측 블록 분할 정보 또는 초기 블록 분할 정보에 근거하여, 블록을 서브 블록으로 분할하기 위한 최종 블록 분할 정보가 도출된다.
단계 S22006에서는, 복수의 서브 블록에 포함되는 서브 블록이 복호 처리로 복호된다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 13)
[개요]
본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 1 이상의 부호화 완료 블록으로부터 블록 정보를 읽어내고, 읽어내어진 상기 블록 정보를 이용하여, 소정 블록 분할 정보 리스트를 수정 블록 분할 정보 리스트로 수정하고, 파티션 선택 파라미터를 비트 스트림에 기입하고, 기입된 상기 파티션 선택 파라미터를 이용하여, 상기 수정 블록 분할 정보 리스트만으로부터, 블록을 복수의 서브 블록으로 분할하게 되는 블록 분할 정보를 선택하고, 선택된 상기 블록 분할 정보를 이용하여, 커렌트 블록을 복수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 부호화한다.
이에 의해, 부호화 완료 블록으로부터 읽어내어진 블록 정보를 이용하여, 소정 블록 분할 정보 리스트를 수정할 수 있다. 따라서, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 소정 블록 분할 정보 리스트의 수정에서는, 소정 블록 분할 정보 리스트를 정렬하여 수정 블록 분할 정보를 생성하고, 상기 파티션 선택 파라미터는, 리스트순이 늦은 블록 분할 정보보다도 리스트순이 빠른 블록 분할 정보 쪽이 적은 비트로 부호화되어도 된다.
이에 의해, 부호화 완료 블록으로부터 읽어내어진 블록 정보를 이용하여, 소정 블록 분할 정보 리스트를 정렬할 수 있다. 따라서, 선택될 가능성이 높은 블록 분할 정보를 리스트의 상위에 배치할 수 있고, 블록 분할 정보에 관한 부호량을 삭감할 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 소정 블록 분할 정보 리스트의 수정에서는, 상기 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입하여, 보다 긴 블록 분할 정보 리스트를 생성해도 된다.
이에 의해, 부호화 완료 블록으로부터 읽어내어진 블록 정보를 이용하여, 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입할 수 있다. 따라서, 블록 분할에 적합한 블록 분할 정보를 리스트에 추가할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 상기 커렌트 블록 및 상기 1 이상의 부호화 완료 블록은 서로 다른 블록이며, 상기 1 이상의 부호화 완료 블록 중 적어도 하나는, 상기 커렌트 블록과 같은 프레임 또는 상기 커렌트 블록의 프레임과 상이한 다른 프레임에 포함되어도 된다.
이에 의해, 서로 다른 1 이상의 부호화 완료 블록으로부터 블록 정보를 읽어낼 수 있고, 블록 분할 정보 리스트를 보다 적절히 수정할 수 있다. 그 결과, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 부호화 장치에서, 읽어내어진 상기 블록 정보는, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이에 관한 정보 중 적어도 하나를 포함해도 된다.
이에 의해, 블록 정보로서 적절한 정보를 이용할 수 있어, 보다 적절한 블록 정보를 이용하여 블록 분할 정보 리스트를 수정하는 것이 가능해진다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 1 이상의 복호 완료 블록으로부터 블록 정보를 읽어내고, 읽어내어진 상기 블록 정보를 이용하여, 소정 블록 분할 정보 리스트를 수정 블록 분할 정보 리스트로 수정하고, 비트 스트림으로부터 파티션 선택 파라미터를 해석하고, 해석된 상기 파티션 선택 파라미터를 이용하여, 상기 수정 블록 분할 정보 리스트만으로부터, 블록을 복수의 서브 블록으로 분할하게 되는 블록 분할 정보를 선택하고, 선택된 상기 블록 분할 정보를 이용하여, 커렌트 블록을 복수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 복호한다.
이에 의해, 복호 완료 블록으로부터 읽어내어진 블록 정보를 이용하여, 소정 블록 분할 정보 리스트를 수정할 수 있다. 따라서, 블록 분할 정보에 관한 부호량을 삭감할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 소정 블록 분할 정보 리스트의 수정에서는, 소정 블록 분할 정보 리스트를 정렬하여 수정 블록 분할 정보를 생성하고, 상기 파티션 선택 파라미터는, 리스트순이 늦은 블록 분할 정보보다도 리스트순이 빠른 블록 분할 정보 쪽이 적은 비트로 부호화되어도 된다.
이에 의해, 복호 완료 블록으로부터 읽어내어진 블록 정보를 이용하여, 소정 블록 분할 정보 리스트를 정렬할 수 있다. 따라서, 선택될 가능성이 높은 블록 분할 정보를 리스트의 상위에 배치할 수 있고, 블록 분할 정보에 관한 부호량을 삭감할 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 소정 블록 분할 정보 리스트의 수정에서는, 상기 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입하여, 보다 긴 블록 분할 정보 리스트를 생성해도 된다.
이에 의해, 복호 완료 블록으로부터 읽어내어진 블록 정보를 이용하여, 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입할 수 있다. 따라서, 블록 분할에 적합한 블록 분할 정보를 리스트에 추가할 수 있어, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 상기 커렌트 블록 및 상기 1 이상의 복호 완료 블록은 서로 다른 블록이며, 상기 1 이상의 복호 완료 블록 중 적어도 하나는, 상기 커렌트 블록과 같은 프레임 또는 상기 커렌트 블록의 프레임과 상이한 다른 프레임에 포함되어도 된다.
이에 의해, 서로 다른 1 이상의 복호 완료 블록으로부터 블록 정보를 읽어낼 수 있고, 블록 분할 정보 리스트를 보다 적절히 수정할 수 있다. 그 결과, 압축 효율을 향상시킬 수 있다.
예를 들면, 본 실시형태에 관한 복호 장치에서, 읽어내어진 상기 블록 정보는, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이에 관한 정보 중 적어도 하나를 포함해도 된다.
이에 의해, 블록 정보로서 적절한 정보를 이용할 수 있어, 보다 적절한 블록 정보를 이용하여 블록 분할 정보 리스트를 수정하는 것이 가능해진다. 그 결과, 블록 분할 정보에 관한 부호량을 삭감하여, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
이하에, 영상을 부호화하는 방법 및 복호하는 방법을 도 33 및 도 34에 각각 나타내는 대로, 실시형태에 따라 설명한다.
[부호화 처리]
도 33은, 실시형태 13에 관한 영상 부호화 처리의 일례를 나타낸다.
최초의 단계 S23001로서, 1 이상의 부호화 완료 블록으로부터 블록 정보(예를 들면, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이)가 읽어내어진다.
다음으로, 단계 S23002에서, 읽어내어진 블록 정보를 이용하여 소정 블록 분할 정보 리스트가 수정 블록 분할 정보 리스트로 수정된다. 이 수정은, 예를 들면, 소정 블록 분할 정보 리스트를 정렬하여 수정 블록 분할 정보 리스트를 생성하는 처리이어도 된다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 부호화된다. 정렬함으로써, 도 51에 나타내는 바와 같이, 선택된 블록 분할 정보의 리스트순이 빨라지고, 파티션 선택 파라미터의 부호화 비트가 감소한다.
리스트의 정렬을 위해, 예를 들면, 리스트를 다른 블록 분할 정보 그룹(예를 들면, 세로 분할 그룹, 가로 분할 그룹, 4진 트리 분할 그룹 및 모든 블록 분할 정보를 포함하는 전체 분할 그룹)으로 분류하면 된다. 이들 블록 분할 정보 그룹을 정렬함으로써, 도 52에 나타내는 바와 같이 리스트가 정렬된다. 이 예에서는, 리스트 수정 파라미터는, 수정 블록 분할 정보 리스트에서의 각 블록 분할 그룹의 순서를 나타내는 파라미터를 포함할 수 있다.
커렌트 블록의 지오메트리를 이용함으로써, 각 그룹의 블록 분할 정보에 묵시적으로 제한을 가할 수 있다. 예를 들면, 블록 폭 및 블록 높이가 2의 멱승이 되는 분할만 이용할 수 있게 할 수 있다. 이들 블록 분할 정보의 경우, 서브 블록의 폭 또는 서브 블록의 높이가 2의 멱승이 되지 않는 것은, 그 그룹에서 사용되지 않는다.
다른 예로, 수정은, 소정 블록 분할 정보 리스트에 추가 블록 분할 정보를 삽입함으로써, 보다 긴 블록 분할 정보 리스트를 작성하는 처리이어도 된다. 가장 이용 가능성이 높은 블록 분할 정보를 리스트의 선두에 삽입하면, 파티션 선택 파라미터의 부호화 비트는 적어진다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 부호화된다.
다른 예로, 수정은, 소정 블록 분할 정보 리스트로부터 블록 분할 정보를 삭제함으로써, 보다 짧은 블록 분할 정보 리스트를 작성하는 처리이어도 된다. 가장 이용 가능성이 높은 블록 분할 정보보다 앞에 있는 이용 가능성이 낮은 블록 분할 정보를 삭제하면, 파티션 선택 파라미터의 부호화 비트는 적어진다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 부호화된다.
정렬 처리, 삽입 처리 및 삭제 처리는 조합되어도 된다(정렬 및 삽입, 또는 정렬 및 삭제, 또는 삽입 및 삭제, 또는 정렬, 삽입 및 삭제 등).
커렌트 블록의 지오메트리를 이용함으로써, 블록 분할 정보 리스트에서의 블록 분할 정보에 묵시적으로 제한을 가할 수 있다. 예를 들면, 블록 폭 및 블록 높이가 2의 멱승이 되는 분할만 이용할 수 있게 할 수 있다. 이들 블록 분할 정보의 경우, 서브 블록의 폭 또는 서브 블록의 높이가 2의 멱승이 되지 않는 것은, 그 리스트에서 사용되지 않는다.
읽어내어진 블록 정보를 소정 블록 분할 정보 리스트를 수정하기 위해 이용하기 위해서는, 우선, 예측 블록 분할 정보를 도출하면 된다. 예를 들면, 소정 블록 분할 정보 리스트에서, 예측 블록 분할 정보와 같은/유사한 블록 파티션 구조를 가지는 블록 분할 정보를 리스트의 앞쪽으로 이동시킨다. 예측 블록 파티션 구조에 가로 분할만 포함되는 것이라면, 예를 들면, 도 52(정렬 전)에 나타내는 그룹 1을 도 52(정렬 후)에 나타내는 바와 같이 리스트의 선두로 이동시킨다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다. 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
커렌트 블록의 예측 블록 파티션 구조로는, 부호화 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 부호화 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다. 부호화 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 부호화 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 부호화된 1 이상의 부호화 완료 블록을 선택한다.
부호화 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다.
예측 블록 분할 정보는, 부호화 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 예측하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 세로 분할을 포함하는 블록 분할 정보를 예측할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 가로 분할을 포함하는 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 인트라/인터 예측 모드에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 부호화 완료 블록의 예측 모드가 인터 예측 모드인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 움직임 벡터에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 한편, 부호화 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 양자화 파라미터에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 부호화 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 참조 픽처 정보에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 부호화 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 부호화 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 부호화 완료 블록의 분할 깊이에 따라 예측되어도 된다. 예를 들면, 부호화 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 부호화 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 부호화 완료 블록의 분할 정보에 따라 예측되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보를 산술 부호화하기 위해 이용되는 콘텍스트는, 커렌트 프레임과 상이한 부호화 완료 프레임의 부호화 완료 블록(예를 들면, 같은 위치 블록(collocated block), 직전의 부호화 완료 블록(last encoded block), 또는 움직임 벡터로 특정되는 부호화 완료 블록 등)으로부터 예측될 수 있다.
단계 S23003에서, 파티션 선택 파라미터가 비트 스트림에 기입된다. 도 37은, 압축 영상 비트 스트림에서의 파티션 선택 파라미터의 기입 가능한 위치를 나타낸다.
다음으로, 단계 S23004에서, 기입된 파티션 선택 파라미터를 이용하여, 수정 블록 분할 정보 리스트만으로부터 블록 분할 정보가 선택된다. 여기서 선택된 블록 분할 정보가 이용되면, 블록은, 복수의 서브 블록으로 분할된다. 기입된 파티션 선택 파라미터는, 예를 들면, 소정 블록 분할 정보 리스트로부터 하나의 블록 분할 정보를 선택하기 위한 인덱스를 포함할 수 있다. 다른 예로, 기입된 파티션 선택 파라미터는, 초기 블록 분할 정보로부터 블록 분할 정보를 도출하기 위한 복수의 분할/머지 플래그(split/merge flags)를 포함할 수 있다.
파티션 선택 파라미터의 부호화 비트 및 그 의미는, 선택된 블록 분할 정보에 따라 다르다. 예를 들면, 선택된 블록 분할 정보에 의해 가로 분할만이 발생하는 경우, 분할이 가로 분할인지 세로 분할인지를 나타낼 필요는 없으며, 블록을 나눈다는 것만으로, 도 53에 나타내는 바와 같이 블록을 가로 분할하는 것을 의미한다. 한편, 선택된 블록 분할 정보에 의해 세로 분할만이 발생하는 경우, 분할이 가로 분할인지 세로 분할인지를 나타낼 필요는 없으며, 블록을 나눈다는 것만으로, 블록을 세로 분할하는 것을 의미한다.
단계 S23005에서, 선택된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다.
단계 S23006에서는, 복수의 서브 블록에 포함되는 서브 블록이 부호화 처리로 부호화된다. 여기서, 이 부호화 처리에는, 변환 처리 및/또는 예측 처리가 포함된다. 변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[부호화 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 35와 동일하므로, 도시 및 설명을 생략한다.
[복호 처리]
도 34는, 실시형태 13에 관한 영상 복호 처리의 일례를 나타낸다.
최초의 단계 S24001로서, 1 이상의 복호 완료 블록으로부터 블록 정보(예를 들면, 블록 파티션 구조, 인트라 예측 모드 또는 인터 예측 모드, 인트라 예측 방향, 움직임 벡터, 참조 픽처, 양자화 파라미터 및 분할 깊이)가 읽어내어진다.
다음으로, 단계 S24002에서, 읽어내어진 블록 정보를 이용하여 소정 블록 분할 정보 리스트가 수정 블록 분할 정보 리스트로 수정된다. 이 수정은, 예를 들면, 소정 블록 분할 정보 리스트를 정렬하여 수정 블록 분할 정보 리스트를 생성하는 처리이어도 된다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 복호된다. 정렬함으로써, 도 51에 나타내는 바와 같이, 선택된 블록 분할 정보의 리스트순이 빨라지고, 파티션 선택 파라미터의 복호 비트가 감소한다.
리스트의 정렬을 위해, 예를 들면, 리스트를 다른 블록 분할 정보 그룹(예를 들면, 세로 분할 그룹, 가로 분할 그룹, 4진 트리 분할 그룹 및 모든 블록 분할 정보를 포함하는 전체 분할 그룹)으로 분류하면 된다. 이들 블록 분할 정보 그룹을 정렬함으로써, 도 52에 나타내는 바와 같이 리스트가 정렬된다. 이 예에서는, 리스트 수정 파라미터는, 수정 블록 분할 정보 리스트에서의 각 블록 분할 그룹의 순서를 나타내는 파라미터를 포함할 수 있다.
커렌트 블록의 지오메트리를 이용함으로써, 각 그룹의 블록 분할 정보에 묵시적으로 제한을 가할 수 있다. 예를 들면, 블록 폭 및 블록 높이가 2의 멱승이 되는 분할만 이용할 수 있게 할 수 있다. 이들 블록 분할 정보의 경우, 서브 블록의 폭 또는 서브 블록의 높이가 2의 멱승이 되지 않는 것은, 그 그룹에서 사용되지 않는다.
다른 예로. 수정은, 소정 블록 분할 정보 리스트에 추가 분할 정보를 삽입함으로써, 보다 긴 블록 분할 정보 리스트를 작성하는 처리이어도 된다. 가장 이용 가능성이 높은 블록 분할 정보를 리스트의 선두에 삽입하면, 파티션 선택 파라미터의 복호 비트는 적어진다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 복호된다.
다른 예로, 수정은, 소정 블록 분할 정보 리스트로부터 분할 정보를 삭제함으로써, 보다 짧은 블록 분할 정보 리스트를 작성하는 처리이어도 된다. 가장 이용 가능성이 높은 블록 분할 정보보다 앞에 있는 이용 가능성이 낮은 블록 분할 정보를 삭제하면, 파티션 선택 파라미터의 복호 비트는 적어진다. 여기서는, 리스트순이 늦은 쪽의 블록 분할 정보보다도 리스트순이 빠른 쪽의 블록 분할 정보 쪽이 적은 비트로 파티션 선택 파라미터가 복호된다.
정렬 처리, 삽입 처리 및 삭제 처리는 조합되어도 된다(정렬 및 삽입, 또는 정렬 및 삭제, 또는 삽입 및 삭제, 또는 정렬, 삽입 및 삭제 등).
커렌트 블록의 지오메트리를 이용함으로써, 블록 분할 정보 리스트에서의 블록 분할 정보에 묵시적으로 제한을 가할 수 있다. 예를 들면, 블록 폭 및 블록 높이가 2의 멱승이 되는 분할만 이용할 수 있게 할 수 있다. 이들 블록 분할 정보의 경우, 서브 블록의 폭 또는 서브 블록의 높이가 2의 멱승이 되지 않는 것은, 그 리스트에서 사용되지 않는다.
읽어내어진 블록 정보를 소정 블록 분할 정보 리스트를 수정하기 위해 이용하기 위해서는, 우선, 예측 블록 분할 정보를 도출하면 된다. 예를 들면, 소정 블록 분할 정보 리스트에서, 예측 블록 분할 정보와 같은/유사한 블록 파티션 구조를 가지는 블록 분할 정보를 리스트의 앞쪽으로 이동시킨다. 예측 블록 파티션 구조에 가로 분할만 포함되는 것이라면, 예를 들면, 도 52(정렬 전)에 나타내는 그룹 1을 도 52(정렬 후)에 나타내는 바와 같이 리스트의 선두로 이동시킨다.
블록 분할 정보는, 블록을 가로 분할할지 세로 분할할지를 나타내는 파라미터 세트이어도 된다. 또, 블록 분할 정보는, 블록 내의 모든 서브 블록의 소정 블록 폭 및 소정 블록 높이를 포함하는 파라미터 세트이어도 된다. 블록 분할 정보는, 소정의 블록 파티션 구조 후보 리스트로부터 하나의 분할 구조 후보를 선택하기 위한 인덱스를 포함하는 파라미터 세트이어도 된다. 이때, 블록 파티션 구조는, 도 38에 나타내는 바와 같이, 블록 내의 모든 서브 블록의 지오메트리를 시각적으로 제시한다.
커렌트 블록의 예측 블록 파티션 구조로는, 복호 완료 블록의 블록 파티션 구조를 그대로 사용할 수 있다.
2 이상의 복호 완료 블록의 블록 파티션 구조를 조합하여(예를 들면, 도 39와 같이, 위쪽 절반은 위쪽 블록의 블록 파티션 구조를 이용하고, 나머지 절반은 왼쪽 블록의 블록 파티션 구조를 이용함), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다. 복호 완료 블록의 선택 방법으로는, 일례로, 커렌트 블록과 같은 인트라/인터 예측 모드의 복호 완료 블록을 선택하는 방법이 있다. 구체적으로는, 커렌트 블록이 인터 예측 블록이면, 인터 예측을 이용하여 복호된 1 이상의 복호 완료 블록을 선택한다.
복호 완료 블록의 블록 파티션 구조를 수정하여(예를 들면, 도 40에 나타내는 바와 같이, 분할 깊이가 보다 얕은 블록 파티션 구조를 사용하여), 새로운 블록 파티션 구조를 커렌트 블록의 예측 블록 파티션 구조로 도출할 수도 있다.
예측 블록 분할 정보는, 복호 완료 블록의 인트라 예측 방향의 정보마다 달라도 된다. 예를 들면, 커렌트 블록을 보다 작은 블록으로 세로 분할할지 가로 분할할지를 예측하기 위해, 특정 인접 블록 위치에서의 인트라 예측 방향의 정보가 사용되어도 된다. 예를 들면, 위쪽 인접 블록의 인트라 예측 방향의 정보가 세로방향 또는 세로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 세로 분할을 포함하는 블록 분할 정보를 예측할 수 있다. 마찬가지로, 왼쪽 인접 블록의 인트라 예측 방향의 정보가 가로방향 또는 가로방향에 가깝다고 판정되면, 커렌트 블록을 위해, 가로 분할을 포함하는 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 인트라/인터 예측 모드에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 예측 모드가 인트라 예측 모드인 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 복호 완료 블록의 예측 모드가 인터 예측 모드인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 움직임 벡터에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 한편, 복호 완료 블록의 움직임 벡터와 커렌트 블록의 움직임 벡터의 차분이 소정 역치 이하인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 양자화 파라미터에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값보다 작은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 또 예를 들면, 복호 완료 블록의 양자화 파라미터의 값이 소정 값 이상인 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 참조 픽처 정보에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가까운 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사한 경우, 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 복호 완료 블록의 참조 픽처가 커렌트 픽처에 시간적으로 가깝지 않은 경우 또는 복수의 복호 완료 블록의 복수의 참조 픽처가 서로 유사하지 않은 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 복호 완료 블록의 분할 깊이에 따라 예측되어도 된다. 예를 들면, 복호 완료 블록의 분할 깊이가 소정 값(예를 들면 4)보다 큰 경우, 비교적 작은 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 소정 블록 분할 정보를 예측할 수 있다. 복호 완료 블록의 분할 깊이가 소정 값 이하인 경우(예를 들면 분할 깊이가 2와 동일한 경우), 비교적 큰 블록 사이즈의 복수의 서브 블록으로 블록을 분할하는 다른 소정 블록 분할 정보를 예측할 수 있다.
블록 분할 정보는, 커렌트 프레임과 상이한 프레임의 복호 완료 블록의 분할 정보에 따라 예측되어도 된다. 예를 들면, 커렌트 블록을 위한 블록 분할 정보(스플릿 정보를 포함함) 또는 커렌트 블록의 스플릿 정보를 산술 복호하기 위해 이용되는 콘텍스트는, 커렌트 프레임과 상이한 복호 완료 프레임의 복호 완료 블록(예를 들면, 같은 위치 블록(collocated block), 최후 복호 완료 블록(last decoded block), 또는 움직임 벡터로 특정되는 복호 완료 블록 등)으로부터 예측될 수 있다.
단계 S24003에서, 비트 스트림으로부터 파티션 선택 파라미터가 해석된다. 도 37은, 압축 영상 비트 스트림에서의 파티션 선택 파라미터의 해석 가능한 위치를 나타낸다.
다음으로, 단계 S24004에서, 해석된 파티션 선택 파라미터를 이용하여, 수정 블록 분할 정보 리스트만으로부터 블록 분할 정보가 선택된다. 여기서 선택된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다. 해석된 파티션 선택 파라미터는, 예를 들면, 소정 블록 분할 정보 리스트로부터 하나의 블록 분할 정보를 선택하기 위한 인덱스를 포함할 수 있다. 다른 예로, 해석된 파티션 선택 파라미터는, 초기 블록 분할 정보로부터 블록 분할 정보를 도출하기 위한 복수의 분할/머지 플래그(split/merge flags)를 포함할 수 있다.
파티션 선택 파라미터의 복호 비트 및 그 의미는, 선택된 블록 분할 정보에 따라 다르다. 예를 들면, 선택된 블록 분할 정보에 의해 가로 분할만이 발생하는 경우, 분할이 가로 분할인지 세로 분할인지를 나타낼 필요는 없으며, 블록을 나눈다는 것만으로, 도 53에 나타내는 바와 같이 블록을 가로 분할하는 것을 의미한다. 한편, 선택된 블록 분할 정보에 의해 세로 분할만이 발생하는 경우, 분할이 가로 분할인지 세로 분할인지를 나타낼 필요는 없으며, 블록을 나눈다는 것만으로, 블록을 세로 분할하는 것을 의미한다.
단계 S24005에서, 선택된 블록 분할 정보를 이용하여 블록이 복수의 서브 블록으로 분할된다.
단계 S24006에서는, 복수의 서브 블록에 포함되는 서브 블록이 복호 처리로 복호된다. 여기서, 이 복호 처리에는, 역변환 처리 및/또는 예측 처리가 포함된다. 역변환 처리는, 서브 블록의 크기와 같은 정도의 블록마다 실시되면 된다.
[복호 장치]
본 실시형태에서의 영상/화상 부호화 장치의 구조는, 실시형태 2의 도 36과 동일하므로, 도시 및 설명을 생략한다.
(실시형태 14)
상기 각 실시형태에서, 블록 및/또는 서브 블록의 지오메트리는, 특히 제한되지 않았지만, 블록 및/또는 서브 블록의 지오메트리는 제한되어도 된다. 예를 들면, 블록 및 서브 블록의 블록 폭 및 블록 높이의 각각은, 2의 멱승에 한정되어도 된다. 특히, 3이상의 홀수의 자식 노드(child node)를 포함하는 다중 트리 분할에서, 서브 블록의 블록 폭 및 블록 높이의 각각은, 2의 멱승에 한정되어도 된다. 이 경우, 서브 블록의 블록 폭 및 블록 높이가 2의 멱승이 되지 않는 블록 분할 정보는, 블록의 분할에 이용되지 않는다.
즉, 본 실시형태에 관한 부호화 장치는, 화상의 블록을 부호화하는 부호화 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록을 복수의 서브 블록으로 분할하고, 변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 부호화하고, 상기 블록의 분할은, 3 이상의 홀수의 자식 노드를 포함하는 다중 트리 분할이며, 상기 복수의 서브 블록의 폭 및 높이의 각각은 2의 멱승이다.
이에 의해, 3 이상의 홀수의 자식 노드를 포함하는 다중 트리 분할에 의해 블록이 분할되는 경우에도, 복수의 서브 블록의 폭 및 높이의 각각이 2의 멱승이 되도록, 블록을 분할할 수 있다. 따라서, 부호화에 적합한 사이즈의 서브 블록을 얻을 수 있어, 압축 효율을 향상시킬 수 있다.
또, 본 실시형태에 관한 복호 장치는, 화상의 블록을 복호하는 복호 장치로서, 프로세서와 상기 프로세서에 접속된 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록을 복수의 서브 블록으로 분할하고, 역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 상기 복수의 서브 블록에 포함되는 서브 블록을 복호하고, 상기 블록의 분할은, 3 이상의 홀수의 자식 노드를 포함하는 다중 트리 분할이며, 상기 복수의 서브 블록의 폭 및 높이의 각각은 2의 멱승이다.
이에 의해, 3 이상의 홀수의 자식 노드를 포함하는 다중 트리 분할에 의해 블록이 분할되는 경우에도, 복수의 서브 블록의 폭 및 높이의 각각이 2의 멱승이 되도록, 블록을 분할할 수 있다. 따라서, 복호에 적합한 사이즈의 서브 블록을 얻을 수 있어, 압축 효율을 향상시킬 수 있다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록매체의 임의의 조합으로 실현되어도 된다.
(실시형태 15)
이상의 각 실시형태에서, 기능 블록의 각각은, 통상, MPU 및 메모리 등에 의해 실현 가능하다. 또, 기능 블록의 각각에 의한 처리는, 통상, 프로세서 등의 프로그램 실행부가, ROM 등의 기록매체에 기록된 소프트웨어(프로그램)를 읽어내어 실행함으로써 실현된다. 당해 소프트웨어는 다운로드 등에 의해 배포되어도 되고, 반도체 메모리 등의 기록매체에 기록하여 배포되어도 된다. 또한, 각 기능 블록을 하드웨어(전용 회로)에 의해 실현되는 것도 당연히 가능하다.
또, 각 실시형태에서 설명한 처리는, 단일 장치(시스템)를 이용하여 집중 처리함으로써 실현되어도 되고, 또는 복수의 장치를 이용하여 분산 처리함으로써 실현되어도 된다. 또, 상기 프로그램을 실행하는 프로세서는, 단수이어도 되고, 복수이어도 된다. 즉, 집중 처리를 실시해도 되고, 또는 분산 처리를 실시해도 된다.
본 개시의 양태는, 이상의 실시예에 한정되지 않고 여러 변경이 가능하며, 그들도 본 개시의 양태의 범위 내에 포함된다.
또 여기서, 상기 각 실시형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 또는 동화상 복호화 방법(화상 복호 방법)의 응용예와 그를 이용한 시스템을 설명한다. 당해 시스템은, 화상 부호화 방법을 이용한 화상 부호화 장치, 화상 복호 방법을 이용한 화상 복호 장치 및 양자를 구비하는 화상 부호화 복호 장치를 가지는 것을 특징으로 한다. 시스템에서의 다른 구성에 대해, 경우에 따라 적절히 변경할 수 있다.
[사용예]
도 54는, 콘텐츠 전송 서비스를 실현하는 콘텐츠 공급 시스템(ex100)의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 영역을 원하는 크기로 분할하고, 각 셀 내에 각각 고정 무선국인 기지국(ex106, ex107, ex108, ex109, ex110)이 설치되어 있다.
이 콘텐츠 공급 시스템(ex100)에서는, 인터넷(ex101)에, 인터넷 서비스 프로바이더(ex102) 또는 통신망(ex104) 및 기지국(ex106~ex110)을 통해 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114) 및 스마트폰(ex115) 등의 각 기기가 접속된다. 당해 콘텐츠 공급 시스템(ex100)은, 상기 중 어느 하나의 요소를 조합하여 접속하도록 해도 된다. 고정 무선국인 기지국(ex106~ex110)을 통하지 않고, 각 기기가 전화망 또는 근거리 무선 등을 통해 직접적 또는 간접적으로 상호 접속되어 있어도 된다. 또, 스트리밍 서버(ex103)는, 인터넷(ex101) 등을 통해 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114) 및 스마트폰(ex115) 등의 각 기기와 접속된다. 또, 스트리밍 서버(ex103)는, 위성(ex116)을 통해 비행기(ex117) 내의 핫스폿 내의 단말 등에 접속된다.
또한, 기지국(ex106~ex110) 대신, 무선 액세스 포인트 또는 핫스폿 등이 이용되어도 된다. 또, 스트리밍 서버(ex103)는, 인터넷(ex101) 또는 인터넷 서비스 프로바이더(ex102)를 통하지 않고 직접 통신망(ex104)과 접속되어도 되고, 위성(ex116)을 통하지 않고 직접 비행기(ex117)와 접속되어도 된다.
카메라(ex113)는 디지탈카메라 등의 정지화상 촬영 및 동화상 촬영이 가능한 기기이다. 또, 스마트폰(ex115)은, 일반적으로 2G, 3G, 3.9G, 4G, 그리고 향후에는 5G라고 하는 이동 통신 시스템의 방식에 대응한 스마트폰기, 휴대전화기 또는 PHS(Personal Handyphone System) 등이다.
가전(ex118)은, 냉장고 또는 가정용 연료 전지 코제너레이션(cogeneration) 시스템에 포함되는 기기 등이다.
콘텐츠 공급 시스템(ex100)에서는, 촬영 기능을 가지는 단말이 기지국(ex106) 등을 통해 스트리밍 서버(ex103)에 접속됨으로써, 라이브 전송 등이 가능해진다. 라이브 전송에서는, 단말(컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115) 및 비행기(ex117) 내의 단말 등)은, 사용자가 당해 단말을 이용하여 촬영한 정지화상 또는 동화상 콘텐츠에 대해 상기 각 실시형태에서 설명한 부호화 처리를 실시하고, 부호화에 의해 얻어진 영상 데이터와 영상에 대응하는 소리를 부호화한 소리 데이터를 다중화하고, 얻어진 데이터를 스트리밍 서버(ex103)에 송신한다. 즉, 각 단말은, 본 개시의 일 양태에 관한 화상 부호화 장치로서 기능한다.
한편, 스트리밍 서버(ex103)는 요구가 있던 클라이언트에 대해 송신된 콘텐츠 데이터를 스트림 전송한다. 클라이언트는, 상기 부호화 처리된 데이터를 복호화하는 것이 가능한 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115) 또는 비행기(ex117) 내의 단말 등이다. 전송된 데이터를 수신한 각 기기는, 수신한 데이터를 복호화 처리하여 재생한다. 즉, 각 기기는, 본 개시의 일 양태에 관한 화상 복호 장치로서 기능한다.
[분산 처리]
또, 스트리밍 서버(ex103)는 복수의 서버 또는 복수의 컴퓨터로서, 데이터를 분산하여 처리하거나 기록하거나 전송하는 것이어도 된다. 예를 들면, 스트리밍 서버(ex103)는, CDN(Contents Delivery Network)에 의해 실현되고, 세계 중으로 분산된 다수의 에지 서버와 에지 서버 간을 잇는 네트워크에 의해 콘텐츠 전송이 실현되고 있어도 된다. CDN에서는, 클라이언트에 따라 물리적으로 가까운 에지 서버가 동적으로 할당된다. 그리고, 당해 에지 서버에 콘텐츠가 캐시 및 전송됨으로써 지연을 줄일 수 있다. 또, 어떠한 에러가 발생한 경우 또는 트래픽의 증가 등에 의해 통신 상태가 바뀌는 경우에 복수의 에지 서버로 처리를 분산하거나, 다른 에지 서버로 전송 주체를 전환하거나, 장해가 생긴 네트워크 부분을 우회하여 전송을 계속할 수 있으므로, 고속이면서 안정된 전송을 실현될 수 있다.
또, 전송 자체의 분산 처리에 머무르지 않고, 촬영한 데이터의 부호화 처리를 각 단말에서 실시해도 되고, 서버 측에서 실시해도 되며, 서로 분담하여 실시해도 된다. 일례로, 일반적으로 부호화 처리에서는, 처리 루프가 2번 실시된다. 첫 번째 루프에서는 프레임 또는 신(scene) 단위에서의 화상의 복잡함 또는 부호량이 검출된다. 또, 두 번째 루프에서는 화질을 유지하여 부호화 효율을 향상시키는 처리가 실시된다. 예를 들면, 단말이 첫 번째 부호화 처리를 실시하고, 콘텐츠를 수취한 서버 측이 두 번째 부호화 처리를 실시함으로써, 각 단말에서의 처리 부하를 줄이면서도 콘텐츠의 질과 효율을 향상시킬 수 있다. 이 경우, 거의 실시간으로 수신하여 복호하는 요구가 있으면, 단말이 실시한 첫 번째의 부호화 완료 데이터를 다른 단말에서 수신하여 재생할 수도 있으므로, 보다 유연한 실시간 전송도 가능해진다.
다른 예로, 카메라(ex113) 등은, 화상으로부터 특징량 추출을 실시하고, 특징량에 관한 데이터를 메타 데이터로 압축하여 서버로 송신한다. 서버는, 예를 들면 특징량으로부터 오브젝트의 중요성을 판단하여 양자화 정밀도를 전환하는 등, 화상의 의미에 따른 압축을 실시한다. 특징량 데이터는 서버에서 다시 압축할 때의 움직임 벡터 예측의 정밀도 및 효율 향상에 특히 유효하다. 또, 단말에서 VLC(가변 길이 부호화) 등의 간이적인 부호화를 실시하고, 서버에서 CABAC(콘텍스트 적응형 2치 산술 부호화 방식) 등 처리 부하가 큰 부호화를 실시해도 된다.
또 다른 예로, 스타디움, 쇼핑몰 또는 공장 등에서는, 복수의 단말에 의해 거의 동일한 신(scene)이 촬영된 복수의 영상 데이터가 존재하는 경우가 있다. 이 경우에는, 촬영을 실시한 복수의 단말과 필요에 따라 촬영을 하고 있지 않은 다른 단말 및 서버를 이용하여, 예를 들면 GOP(Group of Picture) 단위, 픽처 단위 또는 픽처를 분할한 타일 단위 등으로 부호화 처리를 각각 할당하여 분산 처리를 실시한다. 이에 의해, 지연을 줄여 보다 실시간성을 실현할 수 있다.
또, 복수의 영상 데이터는 거의 동일 신(scene)이기 때문에, 각 단말에서 촬영된 영상 데이터를 서로 참조할 수 있도록, 서버에서 관리 및/또는 지시를 해도 된다. 또는, 각 단말로부터의 부호화 완료 데이터를 서버가 수신하여 복수의 데이터 간에 참조 관계를 변경, 또는 픽처 자체를 보정 혹은 바꿔서 다시 부호화해도 된다. 이에 의해, 하나 하나의 데이터의 질과 효율을 높인 스트림을 생성할 수 있다.
또, 서버는, 영상 데이터의 부호화 방식을 변경하는 트랜스 코드를 실시한 후에 영상 데이터를 전송해도 된다. 예를 들면, 서버는, MPEG계 부호화 방식을 VP계로 변환해도 되고, H.264를 H.265로 변환해도 된다.
이와 같이, 부호화 처리는, 단말 또는 1 이상의 서버에 의해 실시하는 것이 가능하다. 따라서, 이하에서는, 처리를 실시하는 주체로서 '서버' 또는 '단말' 등의 기재를 이용하지만, 서버에서 실시되는 처리의 일부 또는 전부가 단말에서 실시되어도 되고, 단말에사 실시되는 처리의 일부 또는 전부가 서버에서 실시되어도 된다. 또, 이들에 관해서는, 복호 처리에 대해서도 마찬가지이다.
[3D, 멀티앵글]
근래에는, 서로 거의 동기한 복수의 카메라(ex113) 및/또는 스마트폰(ex115) 등의 단말에 의해 촬영된 다른 신(scene) 또는 동일 신(scene)을 다른 앵글로 촬영한 화상 혹은 영상을 통합하여 이용하는 경우도 증가하고 있다. 각 단말에서 촬영한 영상은, 별도 취득한 단말 간의 상대적인 위치 관계 또는 영상에 포함되는 특징점이 일치하는 영역 등에 근거하여 통합된다.
서버는, 2차원 동화상을 부호화할 뿐 아니라, 동화상의 신(scene) 해석 등에 근거하여 자동적으로 또는 사용자가 지정한 시각에 정지화상을 부호화하고, 수신 단말에 송신해도 된다. 서버는, 또한, 촬영 단말 간의 상대적인 위치 관계를 취득할 수 있는 경우에는, 2차원 동화상뿐 아니라, 동일 신(scene)이 다른 앵글로 촬영된 영상에 근거하여, 당해 신(scene)의 3차원 형상을 생성할 수 있다. 또한, 서버는, 포인트 클라우드 등에 의해 생성한 3차원 데이터를 별도 부호화해도 되고, 3차원 데이터를 이용하여 인물 또는 오브젝트를 인식 혹은 추적한 결과에 근거하여, 수신 단말로 송신하는 영상을 복수의 단말에서 촬영한 영상으로부터 선택 또는 재구성하여 생성해도 된다.
이와 같이 하여, 사용자는, 각 촬영 단말에 대응하는 각 영상을 임의로 선택하여 신(scene)을 즐길 수도 있고, 복수 화상 또는 영상을 이용하여 재구성된 3차원 데이터로부터 임의 시점의 영상을 잘라낸 콘텐츠를 즐길 수도 있다. 또한, 영상과 마찬가지로 소리도 복수의 상이한 앵글로 수음되고, 서버는 영상에 맞추어 특정 앵글 또는 공간으로부터의 소리를 영상과 다중화하여 송신해도 된다.
또, 근래에는 Virtual Reality(VR) 및 Augmented Reality(AR) 등, 현실 세계와 가상 세계를 대응시킨 콘텐츠도 보급되고 있다. VR 화상의 경우, 서버는 우안용 및 좌안용 시점 화상을 각각 작성하여, Multi-View Coding(MVC) 등에 의해 각 시점 영상 간에 참조를 허용하는 부호화를 실시해도 되고, 서로 참조하지 않고 별도 스트림으로서 부호화해도 된다. 별도 스트림의 복호 시에는, 사용자의 시점에 따라 가상적인 3차원 공간이 재현되도록 서로 동기시켜 재생하면 된다.
AR 화상의 경우에는, 서버는, 현실 공간의 카메라 정보에, 가상 공간상의 가상 물체 정보를 3차원적 위치 또는 사용자 시점의 움직임에 근거하여 중첩한다. 복호 장치는, 가상 물체 정보 및 3차원 데이터를 취득 또는 유지하고, 사용자 시점의 움직임에 따라 2차원 화상을 생성하고, 원활하게 연결함으로써 중첩 데이터를 작성해도 된다. 또는, 복호 장치는 가상 물체 정보의 의뢰에 더하여 사용자 시점의 움직임을 서버에 송신하고, 서버는, 서버에 유지되는 3차원 데이터로부터 수신한 시점의 움직임에 맞추어 중첩 데이터를 작성하고, 중첩 데이터를 부호화하여 복호 장치에 전송해도 된다. 또한, 중첩 데이터는 RGB 이외에 투과도를 나타내는 α값을 가지며, 서버는 3차원 데이터로 작성된 오브젝트 이외의 부분의 α값을 0 등으로 설정하고, 당해 부분이 투과하는 상태에서 부호화해도 된다. 혹은 서버는, 크로마 키와 같이 소정 값의 RGB 값을 배경으로 설정하고, 오브젝트 이외의 부분은 배경색으로 한 데이터를 생성해도 된다.
마찬가지로 전송된 데이터의 복호 처리는 클라이언트인 각 단말에서 실시해도 되고, 서버 측에서 실시해도 되며, 서로 분담하여 실시해도 된다. 일례로, 어느 단말이 일단 서버에 수신 리퀘스트를 보내고, 그 리퀘스트에 따른 콘텐츠를 다른 단말에서 수신하여 복호 처리를 실시하고, 디스플레이를 가지는 장치에 복호 완료 신호가 송신되어도 된다. 통신 가능한 단말 자체의 성능과 상관없이 처리를 분산하여 적절한 콘텐츠를 선택함으로써 화질이 좋은 데이터를 재생할 수 있다. 또, 다른 예로, 큰 사이즈의 화상 데이터를 TV 등에서 수신하면서, 감상자의 개인 단말에 픽처가 분할된 타일 등 일부 영역이 복호되어 표시되어도 된다. 이에 의해, 전체 상을 공유화하면서, 자신의 담당 분야 또는 보다 상세하게 확인하고 싶은 영역을 바로 옆에서 확인할 수 있다.
또 앞으로는, 실내외에 관계없이 근거리, 중거리 또는 장거리 무선 통신이 복수 사용 가능한 상황하에서, MPEG-DASH 등의 전송 시스템 규격을 이용하여, 접속중인 통신에 대해 적절한 데이터를 전환하면서 심리스로 콘텐츠를 수신하는 것이 예상된다. 이에 의해, 사용자는, 자신의 단말뿐 아니라 실내외에 설치된 디스플레이 등의 복호 장치 또는 표시 장치를 자유롭게 선택하면서 실시간으로 전환된다. 또, 자신의 위치 정보 등에 근거하여, 복호하는 단말 및 표시하는 단말을 전환하면서 복호를 실시할 수 있다. 이에 의해, 목적지로 이동 중에, 표시 가능한 디바이스가 매립된 이웃 건물의 벽면 또는 지면의 일부에 지도 정보를 표시시키면서 이동하는 것도 가능해진다. 또, 부호화 데이터가 수신 단말로부터 단시간에 액세스 할 수 있는 서버에 캐시되어 있는, 또는 콘텐츠 딜리버리 서비스에서의 에지 서버에 카피되어 있는 등의 네트워크 상에서의 부호화 데이터에 대한 액세스 용이성에 근거하여, 수신 데이터의 비트 레이트를 전환하는 것도 가능하다.
[스케일러블 부호화]
콘텐츠의 전환에 관해, 도 55에 나타낸다, 상기 각 실시형태에서 나타낸 동화상 부호화 방법을 응용하여 압축 부호화된 스케일러블한 스트림을 이용하여 설명한다. 서버는, 개별 스트림으로서 내용은 같고 질은 다른 스트림을 복수 가지고 있어도 상관없지만, 도시하는 바와 같이 레이어로 나누어 부호화를 실시함으로써 실현되는 시간적/공간적 스케일러블한 스트림의 특징을 살려, 콘텐츠를 전환하는 구성이어도 된다. 즉, 복호 측이 성능이라는 내적 요인과 통신 대역 상태 등의 외적 요인에 따라 어느 레이어까지 복호할지를 결정함으로써, 복호 측은, 저해상도 콘텐츠와 고해상도 콘텐츠를 자유롭게 전환하여 복호할 수 있다. 예를 들면 이동 중에 스마트폰(ex115)으로 시청하고 있던 영상을 귀가 후에 인터넷 TV 등의 기기로 계속 시청하고 싶은 경우에는, 당해 기기는, 같은 스트림을 다른 레이어까지 복호하면 되기 때문에, 서버 측의 부담을 경감할 수 있다.
또한, 상기와 같이, 레이어마다 픽처가 부호화되어 있고, 베이스 레이어의 상위에 인헨스먼트(enhancement) 레이어가 존재하는 확장성(scalability)을 실현하는 구성 이외에, 인헨스먼트 레이어가 화상의 통계 정보 등에 근거하는 메타 정보를 포함하고, 복호 측이, 메타 정보에 근거하여 베이스 레이어의 픽처를 초해상함으로써 고화질화된 콘텐츠를 생성해도 된다. 초해상이란, 동일 해상도에서의 SN비의 향상 및 해상도의 확대 중 어느 것이어도 된다. 메타 정보는, 초해상 처리에 이용하는 선형 혹은 비선형 필터 계수를 특정하기 위해 정보 또는 초해상 처리에 이용하는 필터 처리, 기계 학습 혹은 최소 2승 연산에서의 파라미터 값을 특정하는 정보 등을 포함한다.
또한, 화상 내의 오브젝트 등의 의미에 따라 픽처가 타일 등으로 분할되어 있고, 복호 측이, 복호하는 타일을 선택함으로써 일부 영역만을 복호하는 구성이어도 된다. 또, 오브젝트의 속성(인물, 차, 볼 등)과 영상 내의 위치(동일 화상에서의 좌표 위치 등)를 메타 정보로서 저장함으로써, 복호 측은, 메타 정보에 근거하여 원하는 오브젝트의 위치를 특정하고, 그 오브젝트를 포함하는 타일을 결정할 수 있다. 예를 들면, 도 56에 나타내는 바와 같이, 메타 정보는, HEVC에서의 SEI 메시지 등 화소 데이터와는 다른 데이터 저장 구조를 이용하여 저장된다. 이 메타 정보는, 예를 들면, 메인 오브젝트의 위치, 사이즈 또는 색채 등을 나타낸다.
또, 스트림, 시퀀스 또는 랜덤 억세스 단위 등, 복수의 픽처로 구성되는 단위로 메타 정보가 저장되어도 된다. 이에 의해, 복호 측은, 특정 인물이 영상 내에 출현하는 시각 등을 취득할 수 있고, 픽처 단위의 정보와 합침으로써, 오브젝트가 존재하는 픽처 및 픽처 내에서의 오브젝트의 위치를 특정할 수 있다.
[Web 페이지의 최적화]
도 57은, 컴퓨터(ex111) 등에서의 web 페이지의 표시 화면 예를 나타내는 도면이다. 도 58은, 스마트폰(ex115) 등에서의 web 페이지의 표시 화면 예를 나타내는 도면이다. 도 57 및 도 58에 나타내는 바와 같이 web 페이지가, 화상 콘텐츠에 대한 링크인 링크 화상을 복수 포함하는 경우가 있어, 열람하는 디바이스에 따라 그 보이는 방법은 다르다. 화면상에 복수의 링크 화상이 보이는 경우에는, 사용자가 명시적으로 링크 화상을 선택할 때까지, 또는 화면의 중앙 부근에 링크 화상이 가까워지는 혹은 링크 화상의 전체가 화면 내에 들어갈 때까지는, 표시 장치(복호 장치)는, 링크 화상으로서 각 콘텐츠가 가지는 정지화상 또는 I 픽처를 표시하거나, 복수의 정지화상 또는 I 픽처 등으로 Gif 애니메이션과 같은 영상을 표시하거나, 베이스 레이어만 수신하여 영상을 복호 및 표시하거나 한다.
사용자에 의해 링크 화상이 선택된 경우, 표시 장치는, 베이스 레이어를 최우선으로 하여 복호한다. 또한, web 페이지를 구성하는 HTML에 스케일러블한 콘텐츠인 것을 나타내는 정보가 있으면, 표시 장치는, 인헨스먼트 레이어까지 복호해도 된다. 또, 실시간성을 담보하기 위해, 선택되기 전 또는 통신 대역이 매우 혹독한 경우에는, 표시 장치는, 전방 참조 픽처(I 픽처, P 픽처, 전방 참조만인 B 픽처)만을 복호 및 표시함으로써, 선두 픽처의 복호 시각과 표시 시각 사이의 지연(콘텐츠의 복호 개시부터 표시 개시까지의 지연)을 저감할 수 있다. 또, 표시 장치는, 픽처의 참조 관계를 과감히 무시하고 모든 B 픽처 및 P 픽처를 전방 참조로 하여 성기게 복호하고, 시간이 지나 수신한 픽처가 증가함에 따라 정상 복호를 실시해도 된다.
[자동 주행]
또, 차의 자동 주행 또는 주행 지원을 위해 2차원 또는 3차원 지도 정보 등의 정지화상 또는 영상 데이터를 송수신하는 경우, 수신 단말은, 1 이상의 레이어에 속하는 화상 데이터에 더하여, 메타 정보로서 기후 또는 공사 정보 등도 수신하고, 이들을 대응지어 복호해도 된다. 또한, 메타 정보는, 레이어에 속해도 되고, 단지 화상 데이터와 다중화되어도 된다.
이 경우, 수신 단말을 포함하는 차, 드론 또는 비행기 등이 이동하기 때문에, 수신 단말은, 당해 수신 단말의 위치 정보를 수신 요구시에 송신함으로써, 기지국(ex106~ex110)을 전환하면서 심리스한 수신 및 복호를 실현할 수 있다. 또, 수신 단말은, 사용자의 선택, 사용자의 상황 또는 통신 대역 상태에 따라, 메타 정보를 어느 정도 수신할지, 또는 지도 정보를 어느 정도 갱신해 갈지를 동적으로 전환하는 것이 가능해진다.
이상과 같이 하여, 콘텐츠 공급 시스템(ex100)에서는, 사용자가 송신한 부호화된 정보를 실시간으로 클라이언트가 수신하여 복호하고, 재생할 수 있다.
[개인 콘텐츠의 전송]
또, 콘텐츠 공급 시스템(ex100)에서는, 영상 전송업자에 의한 고화질 장시간의 콘텐츠뿐 아니라, 개인에 따른 저화질 단시간의 콘텐츠의 유니캐스트, 또는 멀티캐스트 전송이 가능하다. 또, 이러한 개인의 콘텐츠는 앞으로도 증가할 것으로 생각된다. 개인 콘텐츠를 보다 뛰어난 콘텐츠로 하기 위해, 서버는, 편집 처리를 실시한 후 부호화 처리를 실시해도 된다. 이는, 예를 들면, 이하와 같은 구성으로 실현할 수 있다.
촬영시에 실시간 또는 축적하여 촬영 후에, 서버는, 원화 또는 부호화 완료 데이터로부터 촬영 에러, 신(scene) 탐색, 의미 해석 및 오브젝트 검출 등의 인식 처리를 실시한다. 그리고, 서버는, 인식 결과에 근거하여 수동 또는 자동으로, 초점 어긋남 또는 손떨림 등을 보정하거나, 명도가 다른 픽처에 비하여 낮은 또는 초점이 맞지 않는 신(scene) 등의 중요성이 낮은 신(scene)을 삭제하거나, 오브젝트의 에지를 강조하거나, 색조를 변화시키는 등의 편집을 실시한다. 서버는, 편집 결과에 근거하여 편집 후의 데이터를 부호화한다. 또 촬영 시각이 너무 길면 시청률이 떨어지는 경우도 알려져 있어, 서버는, 촬영 시간에 따라 특정 시간 범위 내의 콘텐츠가 되도록 상기와 같이 중요성이 낮은 신(scene)뿐 아니라 움직임이 적은 신(scene) 등을 화상 처리 결과에 근거하여 자동으로 클립해도 된다. 또는, 서버는, 신(scene)의 의미 해석의 결과에 근거하여 다이제스트를 생성하여 부호화해도 된다.
또한, 개인 콘텐츠에는, 그대로로는 저작권, 저작자 인격권 또는 초상권 등의 침해가 되는 것이 투영되어 있는 케이스도 있어, 공유하는 범위가 의도한 범위를 초과하게 되는 등 개인에게 좋지 않은 경우도 있다. 따라서, 예를 들면, 서버는, 화면 주변부의 사람 얼굴 또는 집안 등을 과감히 초점이 맞지 않는 화상으로 변경하여 부호화해도 된다. 또, 서버는, 부호화 대상 화상 내에 미리 등록한 인물과는 다른 인물의 얼굴이 찍혀 있는지를 인식하고, 찍힌 경우에는, 얼굴 부분에 모자이크를 하는 등의 처리를 실시해도 된다. 또는, 부호화의 사전 처리 또는 후처리로서, 저작권 등의 관점으로부터 사용자가 화상을 가공하고 싶은 인물 또는 배경 영역을 지정하고, 서버는, 지정된 영역을 다른 영상으로 치환하는, 또는 초점을 흐릿하게 하는 등의 처리를 실시하는 것도 가능하다. 인물이라면, 동화상에서 인물을 트랙킹하면서, 얼굴 부분의 영상을 치환할 수 있다.
또, 데이터량이 작은 개인 콘텐츠의 시청은 실시간성의 요구가 강하기 때문에, 대역폭에 따라 다르지만, 복호 장치는, 우선 베이스 레이어를 최우선으로 수신하여 복호 및 재생을 실시한다. 복호 장치는, 이 동안에 인헨스먼트 레이어를 수신하고, 재생이 루프되는 경우 등 2회 이상 재생되는 경우에, 인헨스먼트 레이어도 포함하여 고화질 영상을 재생해도 된다. 이와 같이 스케일러블한 부호화가 실시되고 있는 스트림이라면, 미선택시 또는 보기 시작한 단계에서는 성긴 동화상이지만, 서서히 스트림이 스마트해져 화상이 좋아지는 체험을 제공할 수 있다. 스케일러블 부호화 이외에도, 1회째에 재생되는 성긴 스트림과, 1회째 동화상을 참조하여 부호화되는 2회째 스트림이 하나의 스트림으로서 구성되어 있어도 동일한 체험을 제공할 수 있다.
[그 외의 사용예]
또, 이들 부호화 또는 복호 처리는, 일반적으로 각 단말이 가지는 LSI(ex500)에서 처리된다. LSI(ex500)는, 원칩이어도 되고 복수 칩으로 이루어지는 구성이어도 된다. 또한, 동화상 부호화 또는 복호용 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플렉시블 디스크 또는 하드 디스크 등)에 내장하고, 그 소프트웨어를 이용하여 부호화 또는 복호 처리를 실시해도 된다. 또한, 스마트폰(ex115)에 카메라가 부착되어 있는 경우에는, 그 카메라로 취득한 동화상 데이터를 송신해도 된다. 이때의 동화상 데이터는 스마트폰(ex115)이 가지는 LSI(ex500)에서 부호화 처리된 데이터이다.
또한, LSI(ex500)는, 어플리케이션 소프트를 다운로드하여 활성화(activate)하는 구성이어도 된다. 이 경우, 단말은, 우선, 당해 단말이 콘텐츠의 부호화 방식에 대응하고 있는지, 또는 특정 서비스의 실행 능력을 가지는지를 판정한다. 단말이 콘텐츠의 부호화 방식에 대응하고 있지 않는 경우, 또는 특정 서비스의 실행 능력을 갖지 않는 경우, 단말은, 코덱 또는 어플리케이션 소프트를 다운로드하고, 그 후, 콘텐츠를 취득 및 재생한다.
또, 인터넷(ex101)을 통한 콘텐츠 공급 시스템(ex100)에 한정하지 않고, 디지털 방송용 시스템에도 상기 각 실시형태의 적어도 동화상 부호화 장치(화상 부호화 장치) 또는 동화상 복호화 장치(화상 복호 장치) 중 어느 하나를 내장할 수 있다. 위성 등을 이용하여 방송용 전파에 영상과 소리가 다중화된 다중화 데이터를 실어 송수신 하기 때문에, 콘텐츠 공급 시스템(ex100)의 유니캐스트 하기 쉬운 구성에 비해 멀티캐스트에 적합하다는 차이가 있지만 부호화 처리 및 복호 처리에 관해서는 동일한 응용이 가능하다.
[하드웨어 구성]
도 59는, 스마트폰(ex115)을 나타내는 도면이다. 또, 도 60은, 스마트폰(ex115)의 구성 예를 나타내는 도면이다. 스마트폰(ex115)은, 기지국(ex110)과의 사이에서 전파를 송수신하기 위한 안테나(ex450)와, 영상 및 정지화상을 찍는 것이 가능한 카메라부(ex465)와, 카메라부(ex465)에서 촬상한 영상 및 안테나(ex450)로 수신한 영상등 이 복호된 데이터를 표시하는 표시부(ex458)를 구비한다. 스마트폰(ex115)은, 또한, 터치패널 등인 조작부(ex466)와, 음성 또는 음향을 출력하기 위한 스피커 등인 음성 출력부(ex457)와, 음성을 입력하기 위한 마이크 등인 음성 입력부(ex456)와, 촬영한 영상 혹은 정지화상, 녹음한 음성, 수신한 영상 혹은 정지화상, 메일 등의 부호화된 데이터 또는 복호화된 데이터를 저장 가능한 메모리부(ex467)와, 사용자를 특정하고, 네트워크를 비롯한 각종 데이터에 대한 액세스 인증을 하기 위한 SIM(ex468)과의 인터페이스부인 슬롯부(ex464)를 구비한다. 또한, 메모리부(ex467) 대신 외부 부착 메모리가 이용되어도 된다.
또, 표시부(ex458) 및 조작부(ex466) 등을 통괄적으로 제어하는 주제어부(ex460)와, 전원 회로부(ex461), 조작 입력 제어부(ex462), 영상 신호 처리부(ex455), 카메라 인터페이스부(ex463), 디스플레이 제어부(ex459), 변조/복조부((ex452)), 다중/분리부(ex453), 음성 신호 처리부(ex454), 슬롯부(ex464) 및 메모리부(ex467)가 버스(ex470)를 통해 접속되어 있다.
전원 회로부(ex461)는, 사용자의 조작에 의해 전원 키가 온 상태가 되면, 배터리 팩으로부터 각 부에 대해 전력을 공급함으로써 스마트폰(ex115)을 동작 가능한 상태로 기동한다.
스마트폰(ex115)은, CPU, ROM 및 RAM 등을 가지는 주제어부(ex460)의 제어에 근거하여, 통화 및 데이터 통신 등의 처리를 실시한다. 통화 시에는, 음성 입력부(ex456)에서 수음한 음성 신호를 음성 신호 처리부(ex454)에서 디지털 음성 신호로 변환하고, 이를 변조/복조부((ex452))에서 스펙트럼 확산 처리하고, 송신/수신부(ex451)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex450)를 통해 송신한다. 또 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변조/복조부((ex452))에서 스펙트럼 역확산 처리하고, 음성 신호 처리부(ex454)에서 아날로그 음성 신호로 변환한 후, 이를 음성 출력부(ex457)로부터 출력한다. 데이터 통신 모드 시에는, 본체부의 조작부(ex466) 등의 조작에 의해 텍스트, 정지화상 또는 영상 데이터가 조작 입력 제어부(ex462)를 통해 주제어부(ex460)로 송출되고, 마찬가지로 송수신 처리가 실시된다. 데이터 통신 모드 시에 영상, 정지화상 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부(ex455)는, 메모리부(ex467)에 저장되어 있는 영상 신호 또는 카메라부(ex465)로부터 입력된 영상 신호를 상기 각 실시형태에서 나타낸 동화상 부호화 방법에 따라 압축 부호화하고, 부호화된 영상 데이터를 다중/분리부(ex453)로 송출한다. 또, 음성 신호 처리부(ex454)는, 영상 또는 정지화상 등을 카메라부(ex465)에서 촬상중에 음성 입력부(ex456)에서 수음한 음성 신호를 부호화하고, 부호화된 음성 데이터를 다중/분리부(ex453)로 송출한다. 다중/분리부(ex453)는, 부호화 완료 영상 데이터와 부호화 완료 음성 데이터를 소정 방식으로 다중화하고, 변조/복조부(변조/복조 회로부)(ex452) 및 송신/수신부(ex451)에서 변조 처리 및 변환 처리를 실시하여 안테나(ex450)를 통해 송신한다.
전자 메일 또는 채팅에 첨부된 영상, 또는 웹 페이지 등에 링크된 영상을 수신한 경우, 안테나(ex450)를 통해 수신된 다중화 데이터를 복호하기 위해, 다중/분리부(ex453)는, 다중화 데이터를 분리함으로써, 다중화 데이터를 영상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누고, 동기 버스(ex470)를 통해 부호화된 영상 데이터를 영상 신호 처리부(ex455)에 공급함과 함께, 부호화된 음성 데이터를 음성 신호 처리부(ex454)에 공급한다. 영상 신호 처리부(ex455)는, 상기 각 실시형태에서 나타낸 동화상 부호화 방법에 대응한 동화상 복호화 방법에 따라 영상 신호를 복호하고, 디스플레이 제어부(ex459)를 통해 표시부(ex458)로부터, 링크된 동화상 파일에 포함되는 영상 또는 정지화상이 표시된다. 또 음성 신호 처리부(ex454)는, 음성 신호를 복호하고, 음성 출력부(ex457)로부터 음성이 출력된다. 또한 실시간 스트리밍이 보급되고 있기 때문에, 사용자의 상황에 따라서는 음성 재생이 사회적으로 걸맞지 않는 경우도 생길 수 있다. 그 때문에, 초기 값으로는, 음성 신호는 재생하지 않고 영상 데이터만을 재생하는 구성인 편이 바람직하다. 사용자가 영상 데이터를 클릭하는 등 조작을 실시한 경우에게만 음성을 동기하여 재생해도 된다.
또 여기서는 스마트폰(ex115)을 예로 설명했지만, 단말로는 부호화기 및 복호화기를 모두 가지는 송수신형 단말 외에, 부호화기만을 가지는 송신 단말 및 복호화기만을 가지는 수신 단말이라는 3가지 실장 형식을 생각할 수 있다. 또한, 디지털 방송용 시스템에서, 영상 데이터에 음성 데이터 등이 다중화된 다중화 데이터를 수신 또는 송신하는 것으로 설명했지만, 다중화 데이터에는, 음성 데이터 이외에 영상에 관련된 문자 데이터 등이 다중화되어도 되고, 다중화 데이터가 아닌 영상 데이터 자체가 수신 또는 송신되어도 된다.
또한, CPU를 포함하는 주제어부(ex460)가 부호화 또는 복호 처리를 제어하는 것으로 설명했지만, 단말은 GPU를 구비하는 경우도 많다. 따라서, CPU와 GPU로 공통화된 메모리, 또는 공통으로 사용할 수 있도록 어드레스가 관리되고 있는 메모리에 의해, GPU의 성능을 살려 넓은 영역을 일괄하여 처리하는 구성이어도 된다. 이것에 의해 부호화 시간을 단축할 수 있어, 실시간성을 확보하고, 저지연을 실현할 수 있다. 특별히 움직임 탐색, 디플록 필터, SAO(Sample Adaptive Offset) 및 변환·양자화 처리를 CPU가 아닌 GPU에서 픽처 등의 단위로 일괄하여 실시하면 효율적이다.
산업상의 이용 가능성
모든 멀티미디어 데이터의 부호화/복호에 사용할 수 있고, 특히, 블록 코딩 구조를 이용한 화상 및 영상의 부호화/복호에 사용할 수 있다.
100 부호화 장치
102 분할부
104 감산부
106, 25001 변환부
108, 25002 양자화부
110, 25009 엔트로피 부호화부
112, 204, 25003, 26002 역양자화부
114, 206, 25004, 26003 역변환부
116, 208 가산부
118, 210, 25005, 26004 블록 메모리
120, 212 루프 필터부
122, 214, 25006, 26005 프레임 메모리
124, 216, 25007, 26006 인트라 예측부
126, 218, 25008, 26007 인터 예측부
128, 220 예측 제어부
200 복호 장치
202, 26001 엔트로피 복호부
25000 영상 부호화 장치
25010, 26008 블록 분할 정보 결정부
26000 영상 복호 장치
102 분할부
104 감산부
106, 25001 변환부
108, 25002 양자화부
110, 25009 엔트로피 부호화부
112, 204, 25003, 26002 역양자화부
114, 206, 25004, 26003 역변환부
116, 208 가산부
118, 210, 25005, 26004 블록 메모리
120, 212 루프 필터부
122, 214, 25006, 26005 프레임 메모리
124, 216, 25007, 26006 인트라 예측부
126, 218, 25008, 26007 인터 예측부
128, 220 예측 제어부
200 복호 장치
202, 26001 엔트로피 복호부
25000 영상 부호화 장치
25010, 26008 블록 분할 정보 결정부
26000 영상 복호 장치
Claims (20)
- 화상의 블록을 부호화하는 부호화 장치로서,
프로세서와,
상기 프로세서에 접속된 메모리를 구비하고,
상기 프로세서는, 상기 메모리를 이용하여,
블록의 지오메트리를 읽어내고,
읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고,
변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화하는, 부호화 장치. - 화상의 블록을 부호화하는 부호화 장치로서,
프로세서와,
상기 프로세서에 접속된 메모리를 구비하고,
상기 프로세서는, 상기 메모리를 이용하여,
파라미터를 비트 스트림에 기입하고,
기입된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고,
기입된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고,
기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고,
변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화하는, 부호화 장치. - 화상의 블록을 부호화하는 부호화 장치로서,
프로세서와,
상기 프로세서에 접속된 메모리를 구비하고,
상기 프로세서는, 상기 메모리를 이용하여,
블록의 지오메트리를 읽어내고,
읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 수의 서브 블록으로 분할하고,
변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화하는, 부호화 장치. - 청구항 1 내지 청구항 3 중 어느 한 항에 있어서,
지오메트리는 적어도 블록의 형태, 높이 또는 폭을 나타내는, 부호화 장치. - 청구항 4에 있어서,
상기 서브 블록의 높이 및 폭 중 적어도 한쪽은 2의 멱승인 부호화 장치 - 화상의 블록을 부호화하는 부호화 장치로서,
프로세서와,
상기 프로세서에 접속된 메모리를 구비하고,
상기 프로세서는, 상기 메모리를 이용하여,
파라미터를 비트 스트림에 기입하고,
기입된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고,
기입된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고, 상기 제1 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크며, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고,
기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 제2 수의 서브 블록으로 분할하고, 상기 제2 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크며, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고,
변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화하는, 부호화 장치. - 화상의 블록을 복호하는 복호 장치로서,
프로세서와,
상기 프로세서에 접속된 메모리를 구비하고,
상기 프로세서는, 상기 메모리를 이용하여,
블록의 지오메트리를 읽어내고,
읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고,
역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호하는, 복호 장치. - 화상의 블록을 복호하는 복호 장치로서,
프로세서와,
상기 프로세서에 접속된 메모리를 구비하고,
상기 프로세서는, 상기 메모리를 이용하여,
비트 스트림으로부터 파라미터를 해석하고,
해석된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고,
해석된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고,
해석된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고,
역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호하는, 복호 장치. - 화상의 블록을 복호하는 복호 장치로서,
프로세서와,
상기 프로세서에 접속된 메모리를 구비하고,
상기 프로세서는, 상기 메모리를 이용하여,
블록의 지오메트리를 읽어내고,
읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 수의 서브 블록으로 분할하고,
역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호하는, 복호 장치. - 청구항 7 내지 청구항 9 중 어느 한 항에 있어서,
지오메트리는 적어도 블록의 형태, 높이 또는 폭을 나타내는, 복호 장치. - 청구항 10에 있어서,
상기 서브 블록의 높이 및 폭 중 적어도 한쪽은 2의 멱승인, 복호 장치. - 화상의 블록을 복호하는 복호 장치로서,
프로세서와,
상기 프로세서에 접속된 메모리를 구비하고,
상기 프로세서는, 상기 메모리를 이용하여,
비트 스트림으로부터 파라미터를 해석하고,
해석된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고,
해석된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고, 상기 제1 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크며, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고,
해석된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 제2 수의 서브 블록으로 분할하고, 상기 제2 수는 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크며, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고,
역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호하는, 복호 장치. - 화상의 블록을 부호화하는 부호화 방법으로서,
블록의 지오메트리를 읽어내고,
읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고,
변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화하는, 부호화 방법. - 화상의 블록을 부호화하는 부호화 방법으로서,
파라미터를 비트 스트림에 기입하고,
기입된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고,
기입된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고,
기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고,
변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화하는, 부호화 방법. - 화상의 블록을 부호화하는 부호화 방법으로서,
블록의 지오메트리를 읽어내고,
읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 수의 서브 블록으로 분할하고,
변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화하는, 부호화 방법. - 화상의 블록을 부호화하는 부호화 방법으로서,
파라미터를 비트 스트림에 기입하고,
기입된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고,
기입된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고, 상기 제1 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크며, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고,
기입된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 제2 수의 서브 블록으로 분할하고, 상기 제2 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크며, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고,
변환 처리 및/또는 예측 처리를 포함하는 부호화 처리로 서브 블록을 부호화하는, 부호화 방법. - 화상의 블록을 복호하는 복호 방법으로서,
블록의 지오메트리를 읽어내고,
읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고,
역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호하는, 복호 방법. - 화상의 블록을 복호하는 복호 방법으로서,
비트 스트림으로부터 파라미터를 해석하고,
해석된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고,
해석된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 지오메트리 세트의 소정 수의 서브 블록으로 분할하고,
해석된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 제1 지오메트리 세트와 상이한 다른 지오메트리 세트의 상기 소정 수의 서브 블록으로 분할하고,
역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호하는, 복호 방법. - 화상의 블록을 복호하는 복호 방법으로서,
블록의 지오메트리를 읽어내고,
읽어내어진 상기 지오메트리가 소정의 지오메트리와 동일한지 아닌지를 판정하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고,
읽어내어진 상기 지오메트리가 상기 소정의 지오메트리와 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 수의 서브 블록으로 분할하고,
역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호하는, 복호 방법. - 화상의 블록을 복호하는 복호 방법으로서,
비트 스트림으로터 파라미터를 해석하고,
해석된 상기 파라미터가 소정 값과 동일한지 아닌지를 판정하고,
해석된 상기 파라미터가 상기 소정 값과 동일한 경우에, 상기 블록을 제1 수의 서브 블록으로 분할하고, 상기 제1 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크며, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고,
해석된 상기 파라미터가 상기 소정 값과 동일하지 않은 경우에, 상기 블록을 상기 제1 수와 동일하지 않은 제2 수의 서브 블록으로 분할하고, 상기 제2 수는, 상기 블록의 분할이 세로 또는 가로의 단일 방향인 경우에 2보다 크며, 상기 블록의 분할이 세로 또는 가로의 단일 방향이 아닌 경우에 3보다 크고,
역변환 처리 및/또는 예측 처리를 포함하는 복호 처리로 서브 블록을 복호하는, 복호 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020227043694A KR102592616B1 (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662424782P | 2016-11-21 | 2016-11-21 | |
US62/424,782 | 2016-11-21 | ||
PCT/JP2017/041422 WO2018092869A1 (ja) | 2016-11-21 | 2017-11-17 | 符号化装置、復号装置、符号化方法及び復号方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227043694A Division KR102592616B1 (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190086453A true KR20190086453A (ko) | 2019-07-22 |
Family
ID=62145621
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197013979A KR20190086453A (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
KR1020237035542A KR102710983B1 (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
KR1020227043694A KR102592616B1 (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
KR1020247031603A KR20240146085A (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237035542A KR102710983B1 (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
KR1020227043694A KR102592616B1 (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
KR1020247031603A KR20240146085A (ko) | 2016-11-21 | 2017-11-17 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
Country Status (7)
Country | Link |
---|---|
US (3) | US11399176B2 (ko) |
EP (2) | EP3968637A1 (ko) |
JP (1) | JPWO2018092869A1 (ko) |
KR (4) | KR20190086453A (ko) |
CN (5) | CN116248878A (ko) |
TW (1) | TWI781966B (ko) |
WO (1) | WO2018092869A1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11284076B2 (en) * | 2017-03-22 | 2022-03-22 | Electronics And Telecommunications Research Institute | Block form-based prediction method and device |
WO2019234605A1 (en) | 2018-06-05 | 2019-12-12 | Beijing Bytedance Network Technology Co., Ltd. | Extended quad-tree with asymmetric sub-blocks and different tree for chroma |
CN111050184A (zh) * | 2018-10-15 | 2020-04-21 | 华为技术有限公司 | 图像块的划分方法和装置 |
CN111083489B (zh) | 2018-10-22 | 2024-05-14 | 北京字节跳动网络技术有限公司 | 多次迭代运动矢量细化 |
CN111083484B (zh) * | 2018-10-22 | 2024-06-28 | 北京字节跳动网络技术有限公司 | 基于子块的预测 |
CN111127304B (zh) * | 2018-10-31 | 2024-02-20 | 微软技术许可有限责任公司 | 跨域图像转换 |
CN112997489B (zh) * | 2018-11-06 | 2024-02-06 | 北京字节跳动网络技术有限公司 | 具有几何分割的帧间预测的边信息信令 |
WO2020098643A1 (en) | 2018-11-12 | 2020-05-22 | Beijing Bytedance Network Technology Co., Ltd. | Simplification of combined inter-intra prediction |
CN113170093B (zh) | 2018-11-20 | 2023-05-02 | 北京字节跳动网络技术有限公司 | 视频处理中的细化帧间预测 |
CN117319644A (zh) | 2018-11-20 | 2023-12-29 | 北京字节跳动网络技术有限公司 | 基于部分位置的差计算 |
CN113170166B (zh) | 2018-12-30 | 2023-06-09 | 北京字节跳动网络技术有限公司 | 具有几何分割的帧间预测在视频处理中有条件的应用 |
US11445203B2 (en) * | 2019-01-04 | 2022-09-13 | Qualcomm Incorporated | Sub-partition intra prediction in video coding |
EP3937488A3 (en) | 2019-01-09 | 2022-04-13 | Beijing Dajia Internet Information Technology Co., Ltd. | System and method for improving combined inter and intra prediction |
CN113273217A (zh) | 2019-02-03 | 2021-08-17 | 北京字节跳动网络技术有限公司 | 非对称四叉树分割 |
WO2020177756A1 (en) | 2019-03-06 | 2020-09-10 | Beijing Bytedance Network Technology Co., Ltd. | Size dependent inter coding |
US11206417B2 (en) * | 2019-05-30 | 2021-12-21 | Tencent America LLC | Method and apparatus for video coding |
US20210092390A1 (en) * | 2019-09-23 | 2021-03-25 | Alibaba Group Holding Limited | Methods and apparatuses for prediction refinement with optical flow in reference picture resampling |
CN111031319B (zh) * | 2019-12-13 | 2022-04-19 | 浙江大华技术股份有限公司 | 一种局部光照补偿预测方法、终端设备及计算机存储介质 |
US20220408098A1 (en) * | 2021-06-18 | 2022-12-22 | Tencent America LLC | Block-wise entropy coding method in neural image compression |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6633611B2 (en) | 1997-04-24 | 2003-10-14 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for region-based moving image encoding and decoding |
JP3284932B2 (ja) | 1997-08-05 | 2002-05-27 | 松下電器産業株式会社 | 画像処理装置 |
JP4572480B2 (ja) * | 2001-04-06 | 2010-11-04 | ソニー株式会社 | 情報処理装置 |
KR100695142B1 (ko) | 2004-03-08 | 2007-03-14 | 삼성전자주식회사 | 적응적 2의 n 제곱 진트리 생성방법 및 이를 이용한 3차원 체적 데이터 부호화/복호화 방법 및 장치 |
KR101517768B1 (ko) | 2008-07-02 | 2015-05-06 | 삼성전자주식회사 | 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
KR20100095992A (ko) | 2009-02-23 | 2010-09-01 | 한국과학기술원 | 비디오 부호화에서의 분할 블록 부호화 방법, 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체 |
WO2011046008A1 (ja) | 2009-10-16 | 2011-04-21 | シャープ株式会社 | 動画像符号化装置、および、動画像復号装置 |
CN105472394B (zh) | 2010-01-15 | 2018-11-30 | 三星电子株式会社 | 用于预测编码的使用可变分区的视频编码的方法和设备以及用于预测编码的使用可变分区的视频解码的方法和设备 |
SG184528A1 (en) * | 2010-04-09 | 2012-11-29 | Mitsubishi Electric Corp | Moving image encoding device and moving image decoding device |
EP2559238B1 (en) | 2010-04-13 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Adaptive image filtering method and apparatus |
KR101584480B1 (ko) | 2010-04-13 | 2016-01-14 | 지이 비디오 컴프레션, 엘엘씨 | 평면 간 예측 |
JP2012080213A (ja) * | 2010-09-30 | 2012-04-19 | Mitsubishi Electric Corp | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 |
US9055305B2 (en) | 2011-01-09 | 2015-06-09 | Mediatek Inc. | Apparatus and method of sample adaptive offset for video coding |
KR101712156B1 (ko) | 2010-12-06 | 2017-03-06 | 에스케이 텔레콤주식회사 | 임의의 형태의 블록을 이용한 인터예측에 의한 영상의 부호화/복호화 방법 및 장치 |
EP3668095B1 (en) | 2011-01-13 | 2021-07-07 | Canon Kabushiki Kaisha | Image coding apparatus, image coding method, and program, and image decoding apparatus, image decoding method, and program |
US20120182388A1 (en) | 2011-01-18 | 2012-07-19 | Samsung Electronics Co., Ltd. | Apparatus and method for processing depth image |
JP5616984B2 (ja) * | 2011-01-26 | 2014-10-29 | 株式会社日立製作所 | 画像復号化装置 |
WO2012120822A1 (en) | 2011-03-09 | 2012-09-13 | Canon Kabushiki Kaisha | Image coding apparatus, method for coding image, program therefor, image decoding apparatus, method for decoding image, and program therefor |
EP2725799B1 (en) * | 2011-06-27 | 2020-04-29 | Sun Patent Trust | Image encoding method, image decoding method, image encoding device, image decoding device, and image encoding/decoding device |
KR101912485B1 (ko) | 2011-08-25 | 2018-10-26 | 선 페이턴트 트러스트 | 타일 부호화 스킴을 이용한 영상 부호화, 추출 및 복호화 방법 및 장치 |
CN102970526B (zh) * | 2011-08-31 | 2016-12-14 | 华为技术有限公司 | 一种获得变换块尺寸的方法和模块 |
CN102957907B (zh) | 2011-08-31 | 2016-06-29 | 华为技术有限公司 | 一种变换块位置信息的获取方法和模块 |
US9787982B2 (en) * | 2011-09-12 | 2017-10-10 | Qualcomm Incorporated | Non-square transform units and prediction units in video coding |
US20130136180A1 (en) | 2011-11-29 | 2013-05-30 | Futurewei Technologies, Inc. | Unified Partitioning Structures and Signaling Methods for High Efficiency Video Coding |
US20130163664A1 (en) * | 2011-12-22 | 2013-06-27 | Qualcomm Incorporated | Unified partition mode table for intra-mode coding |
US9560362B2 (en) | 2011-12-22 | 2017-01-31 | Mediatek Inc. | Method and apparatus of texture image compression in 3D video coding |
JP2013229674A (ja) | 2012-04-24 | 2013-11-07 | Sharp Corp | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム |
US9307264B2 (en) | 2012-06-22 | 2016-04-05 | Sharp Kabushiki Kaisha | Arithmetic decoding device, arithmetic coding device, image decoding apparatus, and image coding apparatus |
MX341828B (es) * | 2012-08-09 | 2016-09-05 | Panasonic Ip Corp America | Metodo decodificador de imagen, metodo codificador de imagen, aparato decodificador de imagen, aparato codificador de imagen, y aparato codificador y decodificador de imagen. |
US9544612B2 (en) | 2012-10-04 | 2017-01-10 | Intel Corporation | Prediction parameter inheritance for 3D video coding |
EP2952003B1 (en) | 2013-01-30 | 2019-07-17 | Intel Corporation | Content adaptive partitioning for prediction and coding for next generation video |
JP6473078B2 (ja) | 2013-04-05 | 2019-02-20 | シャープ株式会社 | 画像復号装置 |
US20160173904A1 (en) * | 2013-07-24 | 2016-06-16 | Samsung Electronics Co., Ltd. | Method for determining motion vector and apparatus therefor |
CN106063271B (zh) * | 2013-12-26 | 2019-09-03 | 三星电子株式会社 | 用于执行基于子块的预测的层间视频解码方法及其设备以及用于执行基于子块的预测的层间视频编码方法及其设备 |
EP3270593A4 (en) | 2015-03-13 | 2018-11-07 | LG Electronics Inc. | Method of processing video signal and device for same |
US10334248B2 (en) | 2015-05-29 | 2019-06-25 | Qualcomm Incorporated | Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design |
JP2017090965A (ja) | 2015-11-02 | 2017-05-25 | 株式会社東芝 | 群衆分類装置、その方法、及び、そのプログラム |
US10212444B2 (en) * | 2016-01-15 | 2019-02-19 | Qualcomm Incorporated | Multi-type-tree framework for video coding |
US11223852B2 (en) | 2016-03-21 | 2022-01-11 | Qualcomm Incorporated | Coding video data using a two-level multi-type-tree framework |
KR102571062B1 (ko) | 2016-05-10 | 2023-08-25 | 삼성전자주식회사 | 영상을 부호화/복호화 하는 방법 및 그 장치 |
US10880548B2 (en) * | 2016-06-01 | 2020-12-29 | Samsung Electronics Co., Ltd. | Methods and apparatuses for encoding and decoding video according to coding order |
US10609423B2 (en) * | 2016-09-07 | 2020-03-31 | Qualcomm Incorporated | Tree-type coding for video coding |
US20180109812A1 (en) | 2016-10-14 | 2018-04-19 | Media Tek Inc. | Block partitioning using tree structures |
KR102504876B1 (ko) * | 2016-11-01 | 2023-02-28 | 삼성전자주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
WO2018092868A1 (ja) | 2016-11-21 | 2018-05-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法及び復号方法 |
-
2017
- 2017-11-17 KR KR1020197013979A patent/KR20190086453A/ko not_active Application Discontinuation
- 2017-11-17 KR KR1020237035542A patent/KR102710983B1/ko active IP Right Grant
- 2017-11-17 WO PCT/JP2017/041422 patent/WO2018092869A1/ja active Application Filing
- 2017-11-17 CN CN202310453174.2A patent/CN116248878A/zh active Pending
- 2017-11-17 KR KR1020227043694A patent/KR102592616B1/ko active IP Right Grant
- 2017-11-17 EP EP21192846.0A patent/EP3968637A1/en active Pending
- 2017-11-17 JP JP2018551694A patent/JPWO2018092869A1/ja active Pending
- 2017-11-17 KR KR1020247031603A patent/KR20240146085A/ko unknown
- 2017-11-17 CN CN201780071858.9A patent/CN109997359B/zh active Active
- 2017-11-17 CN CN202310457281.2A patent/CN116320416A/zh active Pending
- 2017-11-17 EP EP17872674.1A patent/EP3544300B1/en active Active
- 2017-11-17 CN CN202310460266.3A patent/CN116347077A/zh active Pending
- 2017-11-17 CN CN202310456705.3A patent/CN116320415A/zh active Pending
- 2017-11-20 TW TW106140147A patent/TWI781966B/zh active
-
2019
- 2019-05-20 US US16/417,517 patent/US11399176B2/en active Active
-
2022
- 2022-06-06 US US17/833,540 patent/US11889078B2/en active Active
-
2023
- 2023-12-06 US US18/531,574 patent/US20240114136A1/en active Pending
Non-Patent Citations (1)
Title |
---|
H.265(ISO/IEC23008-2 HEVC(High Efficiency Video Coding)) |
Also Published As
Publication number | Publication date |
---|---|
KR20240146085A (ko) | 2024-10-07 |
CN116248878A (zh) | 2023-06-09 |
CN109997359A (zh) | 2019-07-09 |
WO2018092869A1 (ja) | 2018-05-24 |
KR102592616B1 (ko) | 2023-10-23 |
US11399176B2 (en) | 2022-07-26 |
US20190273922A1 (en) | 2019-09-05 |
US20220303534A1 (en) | 2022-09-22 |
KR102710983B1 (ko) | 2024-09-27 |
CN109997359B (zh) | 2023-05-09 |
US20240114136A1 (en) | 2024-04-04 |
CN116347077A (zh) | 2023-06-27 |
TWI781966B (zh) | 2022-11-01 |
CN116320415A (zh) | 2023-06-23 |
US11889078B2 (en) | 2024-01-30 |
KR20230003609A (ko) | 2023-01-06 |
EP3544300A1 (en) | 2019-09-25 |
TW201834452A (zh) | 2018-09-16 |
JPWO2018092869A1 (ja) | 2019-10-17 |
KR20230149868A (ko) | 2023-10-27 |
EP3544300A4 (en) | 2019-09-25 |
CN116320416A (zh) | 2023-06-23 |
EP3544300B1 (en) | 2021-10-13 |
TW202310621A (zh) | 2023-03-01 |
EP3968637A1 (en) | 2022-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7086240B2 (ja) | 画像復号装置及び復号方法 | |
KR102710983B1 (ko) | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 | |
TWI784883B (zh) | 非暫時性記憶媒體 | |
WO2018092868A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
KR102608008B1 (ko) | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 | |
KR102577599B1 (ko) | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 | |
JP2023029657A (ja) | 非一時的記憶媒体 | |
WO2019172202A1 (ja) | 符号化装置及び符号化方法 | |
TWI856399B (zh) | 非暫時性記憶媒體 | |
KR20210089797A (ko) | 부호화 장치, 복호 장치, 부호화 방법, 복호 방법 및 픽처 압축 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
E601 | Decision to refuse application | ||
E801 | Decision on dismissal of amendment |