KR20240051294A - 적응적 변환 타입의 공간 가변 변환 - Google Patents
적응적 변환 타입의 공간 가변 변환 Download PDFInfo
- Publication number
- KR20240051294A KR20240051294A KR1020247011386A KR20247011386A KR20240051294A KR 20240051294 A KR20240051294 A KR 20240051294A KR 1020247011386 A KR1020247011386 A KR 1020247011386A KR 20247011386 A KR20247011386 A KR 20247011386A KR 20240051294 A KR20240051294 A KR 20240051294A
- Authority
- KR
- South Korea
- Prior art keywords
- transform
- svt
- block
- type
- horizontal
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 title description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims abstract description 148
- 238000000034 method Methods 0.000 claims abstract description 68
- 230000009466 transformation Effects 0.000 claims description 53
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 22
- 238000013519 translation Methods 0.000 description 18
- 230000014616 translation Effects 0.000 description 18
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 241000023320 Luma <angiosperm> Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/179—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/62—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding by frequency transforming in three dimensions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
이 방법은 잔차 블록에 대한 SVT-V 또는 SVT-H의 사용을 결정하는 단계와, 잔차 블록의 변환 블록의 변환 블록 위치를 결정하는 단계와, 상기 변환 블록의 변환 타입을 결정하는 단계 - 상기 변환 타입은 상기 변환 블록에 대한 수평 변환 및 수직 변환을 나타내며, 상기 수평 변환 및 상기 수직 변환 중 적어도 하나는 DST-7임 - 와, 상기 변환 타입, 상기 변환 블록 위치 및 상기 변환 블록의 변환 계수에 기초하여 상기 잔차 블록을 재구성하는 단계를 포함한다. 본 개시의 해법을 이용하면 디코딩 품질을 향상시킬 수 있다.
Description
본 발명은 비디오 디코딩 기술에 관한 것으로, 구체적으로는 적응적 변환 타입(adaptive transform type)의 공간 가변 변환(spatially varying transform)을 이용하는 비디오 디코딩 방법 및 관련 장치에 관한 것이다.
H.265와 같은 비디오 코딩은 예측(prediction) 및 변환 프레임워크(transform framework)에 기초한다. 인코더에서, (복수의 픽셀을 포함하는) 이미지 블록은 예측 블록과 잔차 블록으로 분해될 수 있으며, 예측 정보(예컨대, 예측 모드 및 움직임 벡터 정보) 및 잔차 정보(예컨대, 변환 모드, 변환 계수 및 양자화 파라미터)는 비트스트림으로 코딩된다. 디코더에서, 예측 정보와 잔차 정보가 파싱된다. 예측 정보에 따라, 인트라 예측 또는 인터 예측이 수행되어 예측 샘플을 생성한다. 잔차 정보에 따라, 역 양자화 및 역변환이 차례로 수행되어 잔차 샘플을 생성한다. 예측 샘플과 잔차 샘플을 더하여 재구성된 샘플을 얻는다.
비디오 코딩 효율을 개선하기 위해 공간 가변 변환(SVT: spatially varying transform)이 개발되었다. 폭이 w이고 높이가 h인 직사각형 잔차 블록(즉, w×h)의 경우, 잔차 블록의 일부를 변환하는 데 잔차 블록보다 작은 변환 블록이 사용되며, 잔차 블록의 나머지 부분은 코딩되지 않는다. SVT의 논리는 잔차가 잔차 블록에서 균등하게 분포되지 않을 수 있다는 것이다. 적응적 위치를 갖는 더 작은 변환 블록을 사용하여 잔차 블록의 주요 잔차를 캡처할 수 있으므로, 잔차 블록의 모든 잔차를 변환하는 것보다 더 나은 코딩 효율성을 얻을 수 있다.
w×h 크기의 잔차 블록에 SVT를 적용하면, 변환 블록의 크기 및 위치 정보가 비디오 비트스트림으로 코딩되므로, 디코더는 변환 블록을 재구성하여 그것을 잔차 블록과 연관된 예측 블록의 올바른 위치에 구성할 수 있다.
일례로, 도 1에 도시된 바와 같이, 세 가지 타입의 SVT 블록이 잔차 블록에 사용될 수 있다.
1) SVT-I: w_t=w/2, h_t=h/2, 여기서 w_t와 h_t는 각각 변환 블록의 폭과 높이를 나타내고, w와 h는 잔차 블록의 폭과 높이를 나타낸다. 즉, 변환 블록의 폭과 높이가 모두 잔차 블록의 절반이다.
2) SVT-II: w_t=w/4, h_t=h
3) SVT-III: w_t=w, h_t=h/4
SVT 블록의 타입 정보는 비트스트림으로 코딩된다.
변환 블록의 위치는 잔차 블록의 좌측 상단 코너에 대한 위치 오프셋(x, y)으로 표현되는데, 여기서 x는 변환 블록의 좌측 상단 코너와 잔차 블록의 좌측 상단 코너 사이의 픽셀 단위의 수평 거리를 의미하고, y는 변환 블록의 좌측 상단 코너와 잔차 블록의 좌측 상단 코너 사이의 픽셀 단위의 수직 거리를 의미한다. 잔차 블록 내에서 변환 블록을 만드는 각 위치는 후보 위치이다. 잔차 블록에서, 후보 위치의 수는 SVT 타입에 대해(w-w_t+1)×(h-h_t+1)이다. 보다 구체적으로, 16×16 잔차 블록의 경우, SVT-I가 사용될 경우, 81개의 후보 위치가 있고, SVT-II 또는 SVT-III를 사용할 경우 13개의 후보 위치가 있다. x 및 y 값은 비트스트림으로 코딩된다. SVT-I에 대한 복잡도를 줄이기 위해, 81개의 후보 위치에서 32개 위치의 서브세트가 SVT-I에 대한 허용된 후보 위치로 선택된다.
SVT 방식의 한 가지 단점은 위치 정보의 과도한 시그널링 오버헤드이다. 또한 RDO(Rate-Distortion Optimization)에서 테스트된 위치의 수로 인해 인코더 복잡도가 크게 증가할 수 있다. 잔차 블록의 크기에 따라 후보 위치의 수가 증가하기 때문에 32×32 또는 64×128과 같이 더 큰 잔차 블록의 경우 오버헤드가 훨씬 더 커질 수 있다.
SVT 방식의 또 다른 단점은 변환 블록의 크기가 잔차 블록의 1/4이라는 점이다. 변환 블록은 잔차 블록의 주요 잔차를 커버할만큼 충분히 크지 않을 수 있다.
따라서, 단순화된 SVT가 개발되고, 도 2에 도시된 바와 같이 SVT-H 및 SVT-V로 표시되는 두 가지 타입의 SVT 블록이 잔차 코딩에 사용된다.
1) SVT-V: w_t=w/2 및 h_t=h.
2) SVT-H: w_t=w 및 h_t=h/2.
SVT-V는 SVT-II와 유사하고 SVT-H는 SVT-III과 유사하다. SVT-II 및 SVT-III에 비해 SVT-V 및 SVT-H의 변환 블록은 잔차 블록의 절반으로 확대되어 잔차 블록에서 더 많은 잔차를 커버할 수 있다.
후보 위치는 CPSS(Candidate Position Step Size)에 의해 결정된다. 따라서, 후보 위치는 CPSS에 의해 지정된 동일한 간격으로 분리된다. 후보 위치의 수가 5개 이하로 감소하는데, 이는 위치 정보의 오버헤드 및 최상의 변환 블록 위치를 결정하기 위한 인코더 복잡도를 완화한다.
본 발명은 디코딩 품질을 향상시키기 위해 적응적 변환 타입의 공간 가변 변환을 이용하는 비디오 디코딩 방법 및 관련 장치를 개시한다.
상기 및 다른 목적은 독립항의 주제에 의해 달성된다. 추가 구현 형태는 종속 청구항, 상세한 설명 및 도면으로부터 명백하다.
제1 양태에 따르면, 본 개시는 비디오 디코딩 방법에 관한 것이다. 이 방법은 비디오 디코딩 장치에 의해 수행된다. 이 방법은 잔차 블록에 대한 공간 가변 변환(SVT)의 사용을 결정하는 단계와, 상기 잔차 블록에 SVT가 사용될 경우 상기 잔차 블록에 대한 SVT 타입을 결정하는 단계 - 상기 잔차 블록에 대한 SVT 타입은 SVT-V 또는 SVT-H임 - 와, 잔차 블록의 변환 블록의 변환 블록 위치를 결정하는 단계와, 상기 변환 블록의 변환 타입을 결정하는 단계 - 상기 변환 타입은 상기 변환 블록에 대한 수평 변환 및 수직 변환을 나타내며, 상기 수평 변환 및 상기 수직 변환 중 적어도 하나는 DST-7임 - 와, 상기 변환 타입, 상기 변환 블록 위치 및 상기 변환 블록의 변환 계수에 기초하여 상기 잔차 블록을 재구성하는 단계를 포함한다.
제1 양태에 따른 방법의 가능한 구현 형태에서, 상기 잔차 블록에 대한 SVT 타입이 SVT-V이고, 상기 변환 블록의 상기 변환 블록 위치가 상기 잔차 블록의 상기 좌측 상단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DCT-8이고, 상기 수직 변환은 DST-7이다.
제1 양태에 따른 방법의 가능한 구현 형태에서, 상기 잔차 블록에 대한 상기 SVT 타입이 SVT-V이고, 상기 변환 블록의 상기 변환 블록 위치가 상기 잔차 블록의 상기 우측 하단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7이고, 상기 수직 변환은 DST-7이다.
제1 양태에 따른 방법의 가능한 구현 형태에서, 상기 잔차 블록에 대한 SVT 타입이 SVT-H 타입이고, 상기 변환 블록의 상기 변환 블록 위치가 상기 잔차 블록의 상기 좌측 상단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7이고, 상기 수직 변환은 DCT-8이다.
제1 양태에 따른 방법의 가능한 구현 형태에서, 상기 잔차 블록에 대한 상기 SVT 타입이 SVT-H 타입이고, 상기 변환 블록의 상기 변환 블록 위치가 상기 잔차 블록의 상기 우측 하단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7이고, 상기 수직 변환은 DST-7이다.
제2 양태에 따르면, 본 개시는, 잔차 블록에 대한 공간 가변 변환(SVT)의 사용을 결정하도록 구성된 유닛과, 상기 잔차 블록에 SVT가 사용될 경우 상기 잔차 블록에 대한 SVT 타입을 결정하도록 구성된 유닛 - 상기 잔차 블록에 대한 SVT 타입은 SVT-V 또는 SVT-H임 - 과, 상기 잔차 블록의 변환 블록의 변환 블록 위치를 결정하도록 구성된 유닛과, 상기 변환 블록의 변환 타입을 결정하도록 구성된 유닛 - 상기 변환 타입은 상기 변환 블록에 대한 수평 변환 및 수직 변환을 나타내며, 상기 수평 변환 및 상기 수직 변환 중 적어도 하나는 DST-7임 - 과, 상기 변환 타입, 상기 변환 블록 위치 및 상기 변환 블록의 변환 계수에 기초하여 상기 잔차 블록을 재구성하도록 구성된 유닛을 포함하는, 장치와 관련된다.
제2 양태에 따른 방법의 가능한 구현 형태에서, 상기 잔차 블록에 대한 SVT 타입이 SVT-V이고, 상기 변환 블록의 상기 변환 블록 위치가 상기 잔차 블록의 상기 좌측 상단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DCT-8이고, 상기 수직 변환은 DST-7이다.
제2 양태에 따른 방법의 가능한 구현 형태에서, 상기 잔차 블록에 대한 상기 SVT 타입이 SVT-V이고, 상기 변환 블록의 상기 변환 블록 위치가 상기 잔차 블록의 상기 우측 하단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7이고, 상기 수직 변환은 DST-7이다.
제2 양태에 따른 방법의 가능한 구현 형태에서, 상기 잔차 블록에 대한 SVT 타입이 SVT-H이고, 상기 변환 블록의 상기 변환 블록 위치가 상기 잔차 블록의 상기 좌측 상단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7이고, 상기 수직 변환은 DCT-8이다.
제2 양태에 따른 방법의 가능한 구현 형태에서, 상기 잔차 블록에 대한 상기 SVT 타입이 SVT-H이고, 상기 변환 블록의 상기 변환 블록 위치가 상기 잔차 블록의 상기 우측 하단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7이고, 상기 수직 변환은 DST-7이다.
제3 양태에 따르면, 본 개시는, 하나 이상의 프로세서와, 상기 프로세서에 결합되어 있으며, 상기 프로세서에 의해 실행되는 프로그램이 저장되어 있는 비일시적 컴퓨터 판독가능한 저장 매체를 포함하는 비디오 디코딩 장치와 관련되며, 상기 프로그램은 상기 프로세서에 의해 실행될 경우에, 제1 양태에 따른 방법을 수행하도록 상기 디코딩 장치를 구성한다.
제4 양태에 따르면, 본 개시는 하나 이상의 프로세서에 의해 실행될 경우에, 상기 하나 이상의 프로세서로 하여금, 제1 양태에 따른 방법의 단계들을 수행하게 하는 컴퓨터 명령어가 저장되어 있는 비휘발성 컴퓨터 판독가능한 저장 매체와 관련된다.
본 개시는 SVT 타입 및 위치 정보에 기초하여 변환 블록에 대한 다수의 변환 타입을 적응적으로 사용하며, 따라서 디코딩 품질 및 디코딩 효율을 향상시킬 수 있고, 또한, 일부 실시예에서 변환 알고리즘의 양이 제한되어 디코딩 장치의 실현을 단순화할 수 있다.
도 1은 SVT-I, SVT-II 및 SVT-III의 예시이다.
도 2는 SVT-V 및 SVT-H의 예시이다.
도 3은 SVT-V 및 SVT-H 블록의 후보 위치의 예시이다.
도 4는 3개의 후보 위치를 갖는 SVT-V 및 SVT-H의 예시이다.
도 5는 본 개시의 일 실시예에 따른 비디오 디코딩 방법의 흐름도이다.
도 6은 본 개시의 일 실시예에 따른 비디오 디코딩 장치의 개략적인 구조도이다.
도 2는 SVT-V 및 SVT-H의 예시이다.
도 3은 SVT-V 및 SVT-H 블록의 후보 위치의 예시이다.
도 4는 3개의 후보 위치를 갖는 SVT-V 및 SVT-H의 예시이다.
도 5는 본 개시의 일 실시예에 따른 비디오 디코딩 방법의 흐름도이다.
도 6은 본 개시의 일 실시예에 따른 비디오 디코딩 장치의 개략적인 구조도이다.
본 개시는 개선된 SVT 방식을 소개한다. 개선된 점은 SVT 타입 및 SVT 블록 위치에 따라 SVT 블록의 수평 변환 타입과 수직 변환 타입이 결정된다는 것이다. 수평 변환은 수직 변환과 다를 수 있다.
제1 실시예는 잔차 블록을 디코딩하는 프로세스를 설명한다. 비디오 데이터의 하나 이상의 픽처를 포함하는 비트스트림이 디코딩된다. 픽처는 복수의 직사각형 이미지 영역으로 분할되며, 각 영역은 CTU(Coding Tree Unit)에 대응한다. CTU는 비트스트림에 포함된 블록 분할 정보에 따라 HEVC의 코딩 유닛과 같은 복수의 블록으로 분할된다. 블록의 코딩 정보는 비트스트림으로부터 파싱되고, 블록의 픽셀은 코딩 정보에 기초하여 재구성된다.
일 실시예에서, SVT는 인터-예측된 블록에 사용되도록 제한된다. 다른 실시예에서, SVT는 또한 인트라 예측 블록에 사용될 수 있다.
일 예에서, SVT는 특정 인터 예측 방법(예컨대, 변환 모델 기반 움직임 보상)을 이용하는 블록에 대해 허용될 수 있지만 일부 다른 인터 예측 방법(예컨대, 아핀 모델 기반 움직임 보상)을 이용하는 블록에 대해서는 허용되지 않을 수 있다. 또 다른 예에서, SVT는 1/4 픽셀 움직임 벡터 차이 정밀도를 갖는 병합 모드 또는 AMVP(advanced motion vector prediction) 모드를 사용하는 예측 블록에 대해 허용될 수 있지만, 1 픽셀 또는 4 픽셀 움직임 벡터 차이 정밀도를 갖는 아핀 병합 모드(affine merge), 아핀 인터 모드(affine inter mode) 또는 AMVP 모드를 사용하는 예측 블록에 대해서는 허용되지 않을 수 있다. 또 다른 예에서, SVT는 병합 인덱스가 2보다 작은 병합 모드를 사용하는 예측 블록에 대해 허용될 수 있지만, 병합 인덱스가 2보다 작지 않은 병합 모드를 사용하는 예측 블록에 대해서는 허용되지 않을 수 있다. 병합 모드 및 AMVP 모드는 H.265/HEVC 표준에서 참조될 수 있다. 아핀 병합 모드 및 아핀 인터 모드는 JVET(Joint Video Exploration Team)의 JEM(Joint Exploration Model) 코덱에서 참조될 수 있다.
일 예에서, 블록은 코딩 단위를 지칭할 수 있으며, 여기서 코딩 단위는 하나의 예측 블록 및 하나의 잔차 블록을 포함할 수 있다. 예측 블록은 코딩 단위의 모든 예측 샘플을 포함할 수 있고, 잔차 블록은 코딩 단위의 모든 잔차 샘플을 포함할 수 있으며, 예측 블록은 잔차 블록과 크기가 동일하다. 또 다른 예에서, 블록은 코딩 단위를 지칭할 수 있고, 코딩 단위는 두 개의 예측 블록과 하나의 잔차 블록을 포함할 수 있으며, 각 예측 블록은 코딩 단위의 예측 샘플의 일부를 포함할 수 있으고, 잔차 블록은 코딩 단위의 모든 잔차 샘플을 포함할 수 있다. 또 다른 예에서, 블록은 코딩 단위를 지칭할 수 있고, 코딩 단위는 2개의 예측 블록과 4 개의 잔차 블록을 포함할 수 있다. 코딩 단위의 잔차 블록의 분할 패턴은 HEVC 내 RQT(Residual Quad-Tree)와 같이 비트스트림에서 시그널링될 수 있다.
블록은 이미지 샘플(또는 픽셀)의 Y 성분(luma)만을 포함할 수도 있고, 이미지 샘플의 Y, U(색차) 및 V(색차) 성분을 포함할 수도 있다.
w×h 크기의 잔차 블록(Ro)은 다음 단계들에 의해 재구성될 수 있다.
단계 1. 잔차 블록(Ro)의 변환 블록 크기를 결정한다.
단계 1.1. 구문 요소에 따라 SVT 사용을 결정한다. SVT를 사용하도록 허용되어 있는 잔차 블록의 경우, 잔차 블록이 Y 성분의 0이 아닌 변환 계수를 가지면(또는 임의의 색상 성분에 대해 0이 아닌 변환 계수를 가지면), 비트스트림에서 플래그(즉, svt_flag)가 파싱된다. 이 플래그는, 잔차 블록이 잔차 블록과 동일한 크기의 변환 블록을 사용하여 코딩되는지(예컨대, svt_flag=0) 또는 잔차 블록이 잔차 블록의 크기보다 더 작은 크기의 변환 블록으로 코딩되는지(예컨대, svt_flag=1) 여부를 나타낸다. 블록이 색상 성분의 0이 아닌 변환 계수를 갖는지 여부는 HEVC에서 사용되는 색상 성분의 코딩된 블록 플래그(cbf: coded block flag)에 의해 표시될 수 있다. 블록이 임의의 색 성분의 0이 아닌 변환 계수를 갖는지 여부는 HEVC에서 사용되는 루트 코딩된 블록 플래그(root cbf)에 의해 표시될 수 있다.
한 예에서, 블록은 다음 조건이 충족되면 SVT를 사용하도록 허용된다.
*1) 블록이 인터 예측을 사용하여 예측된다.
2) 블록 폭 또는 블록 높이가 미리 결정된 범위 [a1, a2], 예컨대, a1=16 내지 a2=64, a1=8 내지 a2=64 또는 a1=16 내지 a2=128에 속한다. a1 및 a2의 값은 고정 값일 수 있다. 이 값은 SPS(sequence parameter set) 또는 슬라이스 헤더에서 도출될 수 있다.
또 다른 예에서, 블록은 다음 조건이 충족되면 SVT를 사용하도록 허용된다.
1) 임계 값(예컨대, 1 또는 2 또는 3)보다 작은 병합 인덱스를 갖는 병합 모드를 사용하거나 또는 1/4 픽셀 움직임 벡터 차이 정밀도를 갖는 AMVP 모드를 사용하여 블록이 예측된다.
2) 블록의 한 차원은 미리 결정된 범위 [a1, a2]에 속하고, 블록의 다른 차원은 임계 값(a3)보다 크지 않다(예컨대, a1=8, a2=32 및 a3=32). 파라미터 a1은 최소 변환 크기의 두 배로 설정될 수 있으며, a2와 a3은 모두 최대 변환 크기로 설정될 수 있다. a1, a2 및 a3의 값은 고정 값일 수 있다. 이 값은 SPS(sequence parameter set) 또는 슬라이스 헤더에서 도출될 수 있다.
블록이 SVT를 사용하지 않는 경우, 변환 블록 크기는 w×h로 설정된다. 그렇지 않으면 1.2 단계가 적용되어 변환 크기를 결정한다.
단계 1.2. 구문 요소에 따라 SVT 타입을 결정하고, SVT 타입에 따라 변환 블록 크기를 도출한다. 잔차 블록에 허용되는 SVT 타입은 잔차 블록의 폭과 높이에 따라 결정된다. w가 [a1, a2] 범위에 있고 h가 a3보다 크지 않은 경우 SVT-V가 허용되고, h가 [a1, a2] 범위에 있고 w가 a3보다 크지 않은 경우 SVT-H가 허용된다. SVT는 Y 성분에만 사용될 수도 있고, Y 성분, U 성분, V 성분의 세 성분 모두에 사용될 수도 있다. SVT가 Y 성분에만 사용되는 경우, Y 성분 잔차는 SVT에 의해 변환되고 U 및 V 성분은 잔차 블록의 크기에 따라 변환된다.
SVT-V 및 SVT-H가 모두 허용될 경우, 비트스트림에서 하나의 플래그(즉, svt_type_flag)가 파싱되는데, 이는 잔차 블록에 대해 SVT-V가 사용되는지(예컨대, svt_type_flag=0) 또는 SVT-H가 사용되는지(예컨대, svt_type_flag=1)를 나타내고, 변환 블록 크기는 시그널링된 SVT 타입에 따라 설정된다(즉, SVT-V의 경우 w_t=w/2 및 h_t=h, SVT-H의 경우 w_t=w 및 h_t=h/2). SVT-V만 허용되거나 SVT-H만 허용되는 경우, svt_type_flag는 비트스트림에서 구문 분석되지 않고, 허용된 SVT 타입에 따라 변환 블록 크기가 설정된다.
단계 2. 신택스 요소에 따라 변환 블록 위치를 결정하고, SVT의 타입 및 변환 블록 위치 정보에 기초하여 변환 블록에 대한 변환 타입을 결정한다.
단계 2.1: 신택스 요소에 따라 변환 블록 위치를 결정한다.
비트스트림으로부터 위치 인덱스(P)가 파싱되고, 잔차 블록의 좌측 상단 코너에 대한 변환 블록의 좌측 상단 코너의 위치 오프셋(Z)는 Z=s×P로 결정되며, 여기서 s는 후보 위치 스텝 크기(CPSS: candidate position step size)이다. SVT-V가 사용되는 경우 P의 값은 0, 1, ..., 중에 있고, SVT-H가 사용되는 경우 P의 값은 0, 1, ..., 중에 있다. 보다 구체적으로, (0, 0)은 잔차 블록의 좌측 상단 코너의 좌표를 나타내고, 변환 블록의 좌측 상단 코너의 좌표는 SVT-V의 경우에는 (Z, 0)이거나 또는 SVT-H의 경우에 (0, Z)이다.
일 예에서, CPSS는 SVT-V의 경우 s=w/M1 또는 SVT-H의 경우 s=h/M2로 계산되며, 여기서 w 및 h는 각각 잔차 블록의 폭 및 높이이고, M1 및 M2는 2 내지 8 범위의 미리 결정된 정수이다. M1 또는 M2 값이 클수록 더 많은 후보 위치가 허용된다. 이 예에서 M1과 M2는 모두 8로 설정된다. 따라서, P의 값은 0 에서 4 사이이다. 후보 위치는 도 3에 도시되어 있다.
다른 예에서, CPSS는 SVT-V에 대해 s=max(w/M1, Th1)로 계산되거나 또는 SVT-H에 대해 s=max(h/M2, Th2)로 계산되는데, 여기서 Th1 및 Th2는 최소 스텝 크기를 특정하는 미리 정의된 정수이다. Th1 및 Th2는 2 이상의 정수이다. 이 예에서, Th1 및 Th2는 4로 설정되고, M1 및 M2는 8로 설정된다. 이 예에서, 블록 크기가 상이하면 후보 위치의 수가 상이할 수 있다. 예를 들어, w=8인 경우, 2개의 후보 위치(도 3(a) 및 도 3(e)에 도시됨)를 선택할 수 있고, w=16인 경우 3개의 후보 위치(도 3(a), 도 3(c) 및 도 3(e)에 도시됨)를 선택할 수 있으며, w>16 인 경우 5개의 위치를 선택할 수 있다.
또 다른 예에서 CPSS는 SVT-V의 경우 s=w/M1, SVT-H의 경우 s=h/M2로 계산되며, 여기서 M1 및 M2는 4로 설정된다. 따라서 3개의 후보 위치가 허용된다.
또 다른 예에서, CPSS는 SVT-V의 경우 s=w/M1로 또는 SVT-H의 경우 s=h/M2로 계산되며, 여기서 M1 및 M2는 2로 설정된다. 따라서, 2개의 후보 위치가 허용된다.
다른 예에서, CPSS는 SVT-V의 경우 s=max(w/M1, Th1)로 또는 SVT-H의 경우 s=max(h/M2, Th2)로 계산되며, 여기서 T1 및 T2는 2로 설정되고, M1은 w≥h이면 8로 설정되고 w<h이면 4로 설정되며, M2는 h≥w이면 8로 설정되고 h<w이면 4로 설정된다. 이 경우, SVT-H 또는 SVT-V에 대한 후보 위치의 수는 또한 잔차 블록의 종횡비에 의존할 수 있다.
다른 예에서, CPSS는 SVT-V의 경우 s=max(w/M1, Th1)로 또는 SVT-H의 경우 s=max(h/M2, Th2)로 계산되며, 여기서 M1, M2, Th1 및 Th2의 값은 비트스트림의 고수준 구문 구조(예컨대, 시퀀스 매개 변수 집합)에서 도출된다. M1 및 M2는 구문 요소에서 파싱된 동일한 값을 공유할 수 있으며, Th1 및 Th2는 다른 구문 요소에서 파싱된 동일한 값을 공유할 수 있다.
위치 인덱스(P)는 절삭형 단항 코드(truncated unary code)를 사용하여 하나 이상의 빈(bin)으로 이진화될 수 있다. 예를 들어, P 값이 0 내지 4 범위에 있으면, P 값 0, 4, 2, 3 및 1은 각각 0, 01, 001, 0001 및 0000으로 이진화되고, P 값이 0 내지 1 범위에 있으면, P 값 0 및 1은 각각 0과 1로 이진화된다.
위치 인덱스(P)는 하나의 가장 가능성 있는 위치와 몇 개의 나머지 위치를 사용하여 하나 이상의 빈으로 이진화될 수 있다. 좌측 및 상단 이웃이 사용 가능할 경우, 가장 가능성이 높은 위치는 잔차 블록의 우측 하단 코너를 커버하는 위치로 설정될 수 있다. 한 예에서, P 값이 0 내지 4 범위에 있고 위치 4가 가장 가능성이 높은 위치로 설정되는 경우, P 값 4, 0, 1, 2 및 3은 각각 1, 000, 001, 010 및 011로 이진화되고, P 값이 0 내지 2 범위에 있고 위치 2가 가장 가능성이 높은 위치로 설정되는 경우, P 값 2, 0 및 1은 각각 1, 01 및 00으로 이진화된다.
단계 2.2: SVT의 타입 및 변환 블록 위치 정보에 기초하여 변환 블록에 대한 변환 타입을 결정한다. 변환 타입은 분리 가능한 2-D 변환의 수평 변환 및 수직 변환을 포함한다.
도 4에 도시된 바와 같이, 3개의 후보 위치가 허용되는 경우를 예로 들어 보자. 위치 0은 좌측 상단 코너를 커버하고, 위치 2는 우측 하단 코너를 커버한다. 위치 1은 잔차 블록의 중간에 있다. 그림 4에 도시된 바와 같이, SVT-V 및 SVT-H에 대해 세 가지 위치가 있다.
또 다른 예에서는, 2개의 후보 위치가 허용된다. 위치 0은 좌측 상단 코너를 커버하고 위치 1은 우측 하단 코너를 커버한다(도 4의 위치 2와 동일). 즉, SVT-V와 SVT-H 모두에 대해 두 가지 위치가 있다.
2차원 변환은 1차원 수평 변환 및 수직 변환으로 분리될 수 있다. 잔차를 변환 계수로 바꾸는 순방향 2D 변환은, JEM 코덱에서 구현된 것처럼, 먼저 잔차 블록에 수평 변환을 적용하여 블록(TA)을 생성한 다음, 블록(TA)에 수직 변환을 적용하여 변환 계수 블록을 생성함으로써 실현될 수 있다. 따라서, 변환 계수를 다시 바꾸는 역 2D 변환은, JEM 코덱에서 구현된 바와 같이, 변환 계수 블록에 역 수직 변환을 적용하여 블록(TB)을 생성한 다음 블록(TB)에 역 수평 변환을 적용하여 잔차 블록을 생성함으로써 실현될 수 있다.
한 예에서, 표 I에 나열된 바와 같이, SVT-V 위치 0에 대한 수평 및 수직 변환은 DCT-8 및 DST-7이고, SVT-V 위치 1에 대한 수평 및 수직 변환은 DST-1 및 DST-7이며, SVT-V 위치 2에 대한 수평 및 수직 변환은 DST-7 및 DST-7이고, SVT-H 위치 0에 대한 수평 및 수직 변환은 DST-7 및 DCT-8이고, SVT-H 위치 1에 대한 수평 및 수직 변환은 DST-7 및 DST-1이며, SVT-H 위치 2에 대한 수평 및 수직 변환은 DST-7 및 DST-7이다. 이 예에서 SVT-V에 대한 수직 변환과 SVT-H에 대한 수평 변환은 DST-7로 설정되고, 다른 변환은 SVT 위치에 기초한다.
다른 예에서, 상이한 SVT 타입 및 위치에 대한 수평 변환 및 수직 변환이 표 II에 나열되어 있다. 이 예에서, SVT-V에 대한 수직 변환과 SVT-H에 대한 수평 변환은 DCT-2로 설정되고, 다른 변환은 SVT 위치에 기초한다.
또 다른 예에서, 상이한 SVT 타입 및 위치에 대한 수평 변환 및 수직 변환이 표 III에 나열되어 있다. 이 예에서 수평 변환과 수직 변환은 SVT 위치에 의해서만 결정된다.
또 다른 예에서, 상이한 SVT 타입 및 위치에 대한 수평 변환 및 수직 변환이 표 IV에 나열되어 있다.
또 다른 예에서, 상이한 SVT 타입 및 위치에 대한 수평 변환 및 수직 변환이 표 V에 나열되어 있다.
또 다른 예에서, 상이한 SVT 타입 및 위치에 대한 수평 변환 및 수직 변환이 표 VI에 나열되어 있다.
위치 의존적 다중 변환은 루마 변환 블록에만 적용될 수 있으며, 대응하는 크로마 변환 블록은 항상 역 변환 과정에서 역 DCT-2를 사용한다.단계 3. 변환 블록 크기에 기초하여 변환 블록의 변환 계수를 변환한다.
이것은 HEVC 또는 H.264/AVC에서 파싱하는 변환 계수와 같은 비디오 디코딩에서 일반적으로 사용되는 프로세스이다. 변환 계수는 런-길이 코딩을 사용하여 코딩되거나 변환 계수 그룹(CG)의 세트로서 더 정교하게 코딩될 수 있다.
단계 3은 단계 2 이전에 수행될 수 있다.
단계 4. 변환 계수 및 변환 블록 위치 및 역변환 타입에 기초하여 잔차 블록(Ro)을 재구성한다.
상기 변환 계수에 역 양자화 및 크기(w_t×h_t)의 역변환을 적용하여 잔류 샘플을 복구한다. 잔차 샘플의 크기는 변환 블록 크기와 동일한 w_t×h_t이다. 역변환은 분리 가능한 2차원 변환이다. 역 양자화된 변환 계수 블록은 먼저 역 수직 변환에 의해 변환되어 블록(TC)을 생성하고, 그 후 블록(TC)이 역 수평 변환에 의해 변환되며, 여기서 변환 블록 위치 또는 변환 블록 위치 및 변환 블록의 SVT 타입에 기초하여 단계 2.2에서 역 수평 변환 및 역 수직 변환이 결정된다.
변환 블록 위치에 따라 잔차 샘플이 잔차 블록(Ro) 내부의 대응하는 영역에 할당되고, 잔차 블록 내부의 나머지 샘플은 0으로 설정된다. 예를 들어, SVT-V가 사용되고 후보 위치의 수가 5이며 위치 인덱스가 4인 경우, 재구성된 잔차 샘플은 도 3(e)의 영역 A에 할당되고 영역 A 좌측의 크기가 (w/2)×h인 영역은 잔차가 0이다.
단계 1 내지 단계 4를 수행한 후, 재구성된 잔차 블록은 예측 블록으로 구성되어 코딩 유닛에서 재구성된 샘플을 생성할 수 있다. HEVC에서 디 블로킹 필터 및 샘플 적응 오프셋(SAO) 처리와 같은 필터링 프로세스가 나중에 재구성된 샘플에 적용될 수 있다.
기존 솔루션과 달리, 본 개시는 SVT 타입 및 위치 정보에 기초하여 변환 블록에 대해 다수의 변환 타입을 적응적으로 사용한다.
도 5는 적응적 변환 타입의 공간 가변 변환을 이용하는 예시적인 비디오 디코딩 방법의 흐름도이다. 이 방법은 비트스트림을 수신할 때 디코더에서 시작될 수 있다. 이 방법은 비트스트림을 사용하여 예측 블록 및 변환된 잔차 블록을 결정한다. 이 방법은 또한 잔차 블록을 결정하기 위해 사용되는 변환 블록을 결정할 수 있다. 잔차 블록과 예측 블록은 그 후 이미지 블록을 재구성하기 위해 사용된다. 이 방법은 디코더의 관점에서 설명하지만, SVT를 사용하여 비디오를 인코딩하는기 위해(예를 들어, 역으로) 유사한 방법이 이용될 수 있다는 점에 유의해야 한다. 여기서 방법은 다음 단계들을 포함한다.
단계 501, 잔차 블록에 대한 SVT의 사용을 결정한다. 특정 결정 프로세스는 단계 1.1과 유사하다.
단계 502, 잔차 블록에 SVT가 사용될 때 잔차 블록에 대한 SVT 타입을 결정하며, 잔차 블록에 대한 SVT 타입은 SVT-V 타입 또는 SVT-H 타입이며, 여기서 SVT-V 타입은 잔차 블록의 변환 블록 폭이 잔차 블록 폭의 절반 크기이고, 변환 블록의 높이가 잔차 블록 높이와 같은 크기임을 나타내고(도 4 참조), 여기서 SVT-H 타입은 변환 블록의 폭의 크기가 잔차 블록의 폭의 크기와 동일하고, 변환 블록의 높이는 잔차 블록 높이의 절반 크기임을 나타낸다(도 4 참조). 특정 결정 프로세스는 단계 1.2와 유사하다.
단계 503, SVT 타입에 따라 변환 블록의 변환 블록 크기를 도출한다. 특정 도출 프로세스는 단계 1.2와 유사하다.
단계 504, 변환 블록의 변환 블록 위치를 결정한다. 특정 결정 프로세스는 단계 2.1과 유사할 수 있다.
또는, SVT 타입에 대한 후보 위치가 2개인 경우, 잔차 블록의 변환 블록의 변환 블록 위치를 나타내기 위해 1비트 플래그가 사용될 수 있다. 예를 들어, 도 4의 위치 0과 2만 SVT-V에 사용되는 경우, 변환 블록 위치가 위치 0인지 위치 2인지를 나타내는 데 1비트 플래그면 충분하다. 도 4의 위치 0과 2만 SVT-H에 사용되는 경우, 변환 블록 위치가 위치 0인지 또는 위치 2인지를 나타내는 데 1 비트 플래그면 충분하다.
단계 505, SVT 타입 및 변환 블록의 변환 블록 위치에 따라 변환 블록의 변환 타입을 결정하며, 여기서 변환 타입은 변환 블록에 대한 수평 변환 및 수직 변환을 나타내며, 수평 변환과 수직 변환 중 적어도 하나는 DST-7이다. 특정 결정 프로세스는 단계 2.2와 유사할 수 있다.
특정 변환 타입은 전술한 표 I, IV 및 V 중 어느 하나의 임의의 변환 타입일 수도 있고, 또는 전술한 표 II, III 및 VI 중 어느 하나의 DST-7을 포함하는 임의의 변환 타입일 수도 있다.
예를 들어, 잔차 블록에 대한 SVT 타입이 SVT-V 타입이고 변환 블록의 변환 블록 위치가 잔차 블록의 좌측 상단 코너를 커버하는 위치(즉, 도 4의 위치 0)인 경우, 수평 변환은 DCT-8이고 수직 변환은 DST-7이다.
예를 들어, 잔차 블록에 대한 SVT 타입이 SVT-V 타입이고, 변환 블록의 변환 블록 위치가 잔차 블록의 우측 하단 코너를 커버하는 위치(즉, 도 4의 위치 2)인 경우, 수평 변환은 DST-7이고, 수직 변환은 DST-7이다.
예를 들어, 잔차 블록에 대한 SVT 타입이 SVT-H 타입이고 변환 블록의 변환 블록 위치가 잔차 블록의 좌측 상단 코너를 커버하는 위치(즉, 도 4의 위치 0)인 경우, 수평 변환은 DCT-7이고 수직 변환은 DST-8이다.
예를 들어, 잔차 블록에 대한 SVT 타입이 SVT-H 타입이고, 변환 블록의 변환 블록 위치가 잔차 블록의 우측 하단 코너를 커버하는 위치(즉, 도 4의 위치 2)인 경우, 수평 변환은 DST-7이고, 수직 변환은 DST-7이다.
단계 506, 변환 블록 크기에 따라 변환 블록의 변환 계수를 파싱한다. 과 구문 분석의 특정 프로세스는 단계 3과 유사할 수 있다.
단계 507, 변환 타입, 변환 블록 위치 및 변환 블록의 변환 계수에 기초하여 잔차 블록을 재구성한다. 특정 결정 프로세스는 단계 4와 유사할 수 있다.
본 개시는 SVT 타입 및 위치 정보에 기초하여 변환 블록에 대한 다수의 타입을 적응적으로 사용하며, 따라서 디코딩 품질 및 디코딩 효율을 향상시킬 수 있고, 또한, 일부 실시예에서 변환 알고리즘의 양이 제한되어 디코딩 장치의 실현을 단순화할 수 있다.
본 개시는 본 출원의 기법들을 구현하도록 구성되는 비디오 디코딩 장치를 개시하며, 이 비디오 디코딩 장치는 다음 유닛들을 포함한다.
잔차 블록에 대한 SVT(Spatially Variableing Transform)의 사용을 결정하도록 구성된 유닛. 특정 결정 프로세스는 단계 1.1과 유사하다.
잔차 블록에 SVT를 사용하는 경우 잔차 블록에 대한 SVT 타입을 결정하도록 구성된 유닛, 여기서, 잔차 블록에 대한 SVT 타입은 SVT-V 타입 또는 SVT-H 타입이며, SVT-V 타입은 잔차 블록의 변환 블록의 폭이 잔차 블록의 폭의 절반 크기이고, 변환 블록의 높이가 잔차 블록의 높이와 동일한 크기임을 나타내고, SVT-H 타입은 변환 블록의 폭이 잔차 블록의 폭과 같은 크기이고 변환 블록의 높이가 잔차 블록 높이의 절반 크기임을 나타낸다. 특정 결정 프로세스는 단계 1.2와 유사하다.
SVT 타입에 따라 변환 블록의 변환 블록 크기를 도출하도록 구성된 유닛. 특정 도출 프로세스는 단계 1.2와 유사하다.
변환 블록의 변환 블록 위치를 결정하도록 구성된 유닛. 특정 결정 프로세스는 단계 2.1과 유사할 수 있다. 또는, SVT 타입에 대한 후보 위치가 2인 경우, 잔차 블록의 변환 블록의 변환 블록 위치를 나타내기 위해 1비트 플래그를 사용할 수 있다. 예를 들어, 도 4의 위치 0과 2만 SVT-V에 사용되는 경우, 변환 블록 위치가 위치 0인지 위치 2인지를 나타내는 데 1 비트 플래그면 충분하다. 도 4의 위치 0과 2만 SVT-H에 사용되는 경우, 변환 블록 위치가 위치 0인지 또는 위치 2인지를 나타내는 데 1 비트 플래그면 충분하다.
SVT 타입 및 변환 블록의 변환 블록 위치에 따라 변환 블록의 변환 타입을 결정하도록 구성된 유닛, 여기서 변환 타입은 변환 블록에 대한 수평 변환 및 수직 변환을 나타내며, 수평 변환 및 수직 변환 중 적어도 하나는 DST-7이다. 특정 결정 프로세스는 단계 2.2와 유사할 수 있다.
변환 블록 크기에 따라 변환 블록의 변환 계수를 파싱하도록 구성된 유닛. 특정 파싱 프로세스는 단계 3과 유사할 수 있다.
변환 타입, 변환 블록 위치 및 변환 블록의 변환 계수에 기초하여 잔차 블록을 재구성하도록 구성된 유닛. 특정 결정 프로세스는 단계 4와 유사할 수 있다.
특정 변환 타입은 전술한 표 I, IV 및 V 중 어느 하나의 임의의 변환 타입일 수도 있고, 또는 전술한 표 II, III 및 VI 중 어느 하나의 DST-7을 포함하는 임의의 변환 타입일 수도 있다.
예를 들어, 잔차 블록에 대한 SVT 타입이 SVT-V 타입이고, 변환 블록의 변환 블록 위치가 잔차 블록의 좌측 상단 코너를 커버하는 위치(즉, 도 4의 위치 0)인 경우, 수평 변환은 DCT-8이고 수직 변환은 DST-7이다.
예를 들어, 잔차 블록에 대한 SVT 타입이 SVT-V 타입이고, 변환 블록의 변환 블록 위치가 잔차 블록의 우측 하단 코너를 커버하는 위치(즉, 도 4의 위치 2)인 경우, 수평 변환은 DST-7이고, 수직 변환은 DST-7이다.
예를 들어, 잔차 블록에 대한 SVT 타입이 SVT-H 타입이고, 변환 블록의 변환 블록 위치가 잔차 블록의 좌측 상단 코너를 커버하는 위치(즉, 도 4의 위치 0)인 경우, 수평 변환은 DST-7이고 수직 변환은 DCT-8이다.
예를 들어, 잔차 블록에 대한 SVT 타입이 SVT-H 타입이고, 변환 블록의 변환 블록 위치가 잔차 블록의 우측 하단 코너를 커버하는 위치(즉, 도 4의 위치 2)인 경우, 수평 변환은 DST-7이고, 수직 변환은 DST-7이다.
본 개시는 본 출원의 기술을 구현하도록 구성된 다른 비디오 디코딩 장치를 개시하며, 이 비디오 디코딩 장치는, 하나 이상의 프로세서, 및 상기 프로세서에 결합되고 상기 프로세서에 의해 실행되는 프로그램을 저장하는 비 휘발성 컴퓨터 판독 가능 저장 매체를 포함하며, 상기 프로그램은 프로세서에 의해 실행될 때 전술한 방법들 중 임의의 것을 처리하도록 비디오 디코딩 장치를 구성한다.
본 개시는 하나 이상의 프로세서에 의해 실행될 때 하나 이상의 프로세서로 하여금 전술한 임의의 방법의 단계를 수행하게 하는 컴퓨터 명령어를 저장하는 비 휘발성 컴퓨터 판독 가능 저장 매체를 개시한다.
도 9는 본 개시의 실시예에 따른 코딩 장치(900)의 개략도이다. 코딩 장치(900)는 본 명세서에 설명된 바와 같이 개시된 실시예를 구현하기에 적합하다. 코딩 장치(900)는 데이터를 수신하기 위한 입구 포트(910) 및 수신기 유닛(Rx)(920); 데이터를 처리하는 프로세서, 로직 유닛 또는 중앙 처리 장치(CPU)(930); 데이터를 송신하기 위한 송신기 유닛(Tx)(940) 및 출구 포트(950); 및 데이터를 저장하기 위한 메모리(960)를 포함한다. 코딩 장치(900)는 또한 입구 포트(910), 수신기 유닛(920), 송신기 유닛(940) 및 광학 또는 전기 신호의 유출 또는 유입을 위한 출구 포트(950)에 결합된 광-전기(OE) 소자 및 전기-광(EO) 소자를 포함할 수 있다.
프로세서(930)는 하드웨어 및 소프트웨어로 구현된다. 프로세서(930)는 하나 이상의 CPU 칩, 코어(예를 들어, 멀티 코어 프로세서), FPGA(field-programmable gate array), ASIC(application specific integrated circuits) 및 DSP(digital signal processor)로 구현될 수 있다. 프로세서(930)는 입구 포트(910), 수신기 유닛(920), 송신기 유닛(940), 출구 포트(950) 및 메모리(960)와 통신한다. 프로세서(930)는 코딩 모듈(970)을 포함한다. 코딩 모듈(970)은 전술한 개시된 실시예를 구현한다. 예를 들어, 코딩 모듈(970)은 다양한 그래픽 프로세스 및 계산을 구현, 처리, 분석, 준비 또는 제공한다. 따라서, 코딩 모듈(970)을 포함하면, 장치(900)의 기능에 실질적인 개선을 주고 장치(900)를 다른 상태로 변환하는 데에 영향을 준다. 대안적으로, 코딩 모듈(970)은, 메모리(960)에 저장되어 프로세서(930)에 의해 실행되는 명령어로서 구현된다.
메모리(960)는 하나 이상의 디스크, 테이프 드라이브 및 솔리드 스테이트 드라이브를 포함하며, 오버플로우 데이터 저장 장치로 사용되어, 실행을 위해 프로그램이 선택되면 그러한 프로그램을 저장하고, 프로그램 실행 동안 판독되는 명령어 및 데이터를 저장할 수 있다. 메모리(960)는 휘발성 및/또는 비 휘발성일 수 있으며, ROM(read-only memory), RAM(random-access memory), TCAM(ternary content-addressable memory) 및/또는 SRAM(static random-access memory)일 수 있다.
다음의 참조사항은 그 전체가 재구성된 것처럼 본 명세서에 참고로 포함된다.
본 개시에서 여러 실시예가 제공되었지만, 개시된 시스템 및 방법은 본 개시의 사상 또는 범위를 벗어나지 않고 많은 다른 특정 형태로 구현될 수 있음을 이해해야 한다. 본 예들은 제한적인 것이 아니라 예시적인 것으로 간주되어야 하며, 본 명세서에 제공된 세부 사항에 한정하고자 하는 것이 아니다. 예를 들어, 다양한 요소들 또는 컴포넌트들이 다른 시스템에서 결합되거나 또는 통합될 수도 있고 소정의 특징이 생략되거나 구현되지 않을 수도 있다.
또한, 다양한 실시예에서 개별적 또는 별개로 설명되고 예시된 기술, 시스템, 서브시스템 및 방법이 본 개시의 범위를 벗어나지 않고 다른 시스템, 모듈, 기술 또는 방법과 결합되거나 통합될 수도 있다. 서로 결합되거나 직접 결합되거나 또는 통신하는 것으로 도시되거나 논의된 다른 항목들이 일부 인터페이스, 장치 또는 중간 구성 요소를 통해 전기적으로 또는 기계적으로 또는 다른 방식으로, 간접적으로 결합되거나 통신할 수 있다. 변경, 대체 및 수정의 다른 예는 당업자에 의해 확인될 수 있고 본 명세서에 개시된 사상 및 범위를 벗어나지 않고 이루어질 수 있다.
Claims (12)
- 비디오 디코딩 방법으로서,
비트스트림을 수신하는 단계 - 상기 비트스트림은 제1 플래그, 제2 플래그 및 신택스 요소를 포함함 - 와,
상기 제1 플래그에 따라, 공간 가변 변환(SVT: spatially varying transform)이 잔차 블록에 대하여 사용되었음을 결정하는 단계와,
상기 제2 플래그에 따라, 상기 잔차 블록에 대한 SVT 타입을 결정하는 단계 - 상기 SVT 타입은 SVT-V (SVT-vertical) 타입 또는 SVT-H (SVT-horizontal) 타입이고, 상기 SVT-V 타입은 상기 잔차 블록의 변환 블록의 제1 폭이 상기 잔차 블록의 제2 폭보다 작고, 상기 변환 블록의 제1 높이가 상기 잔차 블록의 제2 높이와 동일한 크기임을 나타내고, 상기 SVT-H 타입은 상기 제1 폭이 상기 제2 폭과 동일한 크기이고 상기 제1 높이가 상기 제2 높이보다 작음을 나타냄 - 와,
상기 신택스 요소에 따라, 상기 변환 블록의 변환 블록 위치를 결정하는 단계와,
상기 SVT 타입 및 상기 변환 블록 위치에 따라 상기 변환 블록의 변환 타입을 결정하는 단계와,
상기 변환 블록의 변환 계수를 파싱하는 단계와,
상기 변환 타입 및 상기 변환 계수에 기초하여 상기 잔차 블록을 재구성하는 단계를 포함하는,
비디오 디코딩 방법.
- 제1항에 있어서,
상기 변환 블록의 상기 변환 타입이 상기 변환 블록의 수평 변환 및 수직 변환을 나타내고,
상기 SVT 타입이 상기 SVT-V 타입이고, 상기 변환 블록 위치가 상기 잔차 블록의 좌측 상단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DCT-8 (discrete cosine ransform-8)에 기초하고, 상기 수직 변환은 DST-7 (discrete sine transform -7)에 기초하는,
비디오 디코딩 방법.
- 제1항에 있어서,
상기 변환 블록의 상기 변환 타입이 상기 변환 블록의 수평 변환 및 수직 변환을 나타내고,
상기 SVT 타입이 상기 SVT-V 타입이고, 상기 변환 블록 위치가 상기 잔차 블록의 우측 하단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7에 기초하고, 상기 수직 변환은 상기 DST-7에 기초하는,
비디오 디코딩 방법.
- 제1항에 있어서,
상기 변환 블록의 상기 변환 타입이 상기 변환 블록의 수평 변환 및 수직 변환을 나타내고,
상기 SVT 타입이 상기 SVT-H 타입이고, 상기 변환 블록 위치가 상기 잔차 블록의 좌측 상단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7에 기초하고, 상기 수직 변환은 DCT-8에 기초하는,
비디오 디코딩 방법.
- 제1항에 있어서,
상기 변환 블록의 상기 변환 타입이 상기 변환 블록의 수평 변환 및 수직 변환을 나타내고,
상기 SVT 타입이 상기 SVT-H 타입이고, 상기 변환 블록 위치가 상기 잔차 블록의 우측 하단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7에 기초하고, 상기 수직 변환은 상기 DST-7에 기초하는,
비디오 디코딩 방법.
- 방법으로서,
변환 블록을 획득하는 단계와,
제1 플래그의 값을 획득하는 단계 - 상기 제1 플래그는 상기 변환 블록에 대응하는 잔차 블록에 대하여 공간 가변 변환(SVT: spatially varying transform)이 사용되었음을 나타냄 - 와,
제2 플래그의 값을 획득하는 단계 - 상기 제2 플래그는 상기 잔차 블록에 대한 SVT 타입을 나타내고, 상기 SVT 타입은 SVT-V (SVT-vertical) 타입 또는 SVT-H (SVT-horizontal) 타입이고, 상기 SVT-V 타입은 상기 잔차 블록의 변환 블록의 제1 폭이 상기 잔차 블록의 제2 폭보다 작고 상기 변환 블록의 제1 높이가 상기 잔차 블록의 제2 높이와 동일한 크기임을 나타내고, 상기 SVT-H 타입은 상기 제1 폭이 상기 제2 폭과 동일한 크기이고 상기 제1 높이가 상기 제2 높이보다 작음을 나타냄 - 와,
상기 변환 블록의 변환 블록 위치를 나타내는 신택스 요소를 획득하는 단계 - 상기 변환 블록의 변환 타입은 상기 변환 블록 위치 및 상기 제2 플래그의 값에 대응함 - 와,
상기 변환 블록의 변환 계수를 획득하는 단계와,
비트스트림 내에 상기 제1 플래그의 값, 상기 제2 플래그의 값, 상기 신택스 요소 및 상기 변환 계수를 포함시키는 단계와,
상기 비트스트림을 저장 또는 송신하는 단계를 포함하는,
방법.
- 제6항에 있어서,
상기 변환 블록의 상기 변환 타입이 상기 변환 블록의 수평 변환 및 수직 변환을 나타내고,
상기 SVT 타입이 상기 SVT-V 타입이고, 상기 변환 블록 위치가 상기 잔차 블록의 좌측 상단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DCT-8에 기초하고, 상기 수직 변환은 DST-7에 기초하는,
방법.
- 제6항에 있어서,
상기 변환 블록의 상기 변환 타입이 상기 변환 블록의 수평 변환 및 수직 변환을 나타내고,
상기 SVT 타입이 상기 SVT-V 타입이고, 상기 변환 블록 위치가 상기 잔차 블록의 우측 하단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7에 기초하고, 상기 수직 변환은 상기 DST-7에 기초하는,
방법.
- 제6항에 있어서,
상기 변환 블록의 상기 변환 타입이 상기 변환 블록의 수평 변환 및 수직 변환을 나타내고,
상기 SVT 타입이 상기 SVT-H 타입이고, 상기 변환 블록 위치가 상기 잔차 블록의 좌측 상단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7에 기초하고, 상기 수직 변환은 DCT-8에 기초하는,
방법.
- 제6항에 있어서,
상기 변환 블록의 상기 변환 타입이 상기 변환 블록의 수평 변환 및 수직 변환을 나타내고,
상기 SVT 타입이 상기 SVT-H 타입이고, 상기 변환 블록 위치가 상기 잔차 블록의 우측 하단 코너를 커버하는 위치인 경우, 상기 수평 변환은 DST-7에 기초하고, 상기 수직 변환은 상기 DST-7에 기초하는,
방법.
- 비디오 디코딩 장치로서,
하나 이상의 프로세서와,
상기 프로세서에 결합되어 있으며, 상기 프로세서에 의해 실행되는 프로그램이 저장되어 있는 비일시적 컴퓨터 판독가능한 저장 매체를 포함하되,
상기 프로그램은 상기 프로세서에 의해 실행될 경우에, 제1항 내지 제5항 중 어느 한 항에 따른 방법을 수행하도록 상기 비디오 디코딩 장치를 구성하는,
비디오 디코딩 장치.
- 비디오 인코딩 장치로서,
하나 이상의 프로세서와,
상기 프로세서에 결합되어 있으며, 상기 프로세서에 의해 실행되는 프로그램이 저장되어 있는 비일시적 컴퓨터 판독가능한 저장 매체를 포함하되,
상기 프로그램은 상기 프로세서에 의해 실행될 경우에, 제6항 내지 제10항 중 어느 한 항에 따른 방법을 수행하도록 상기 비디오 인코딩 장치를 구성하는,
비디오 인코딩 장치.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862678738P | 2018-05-31 | 2018-05-31 | |
US62/678,738 | 2018-05-31 | ||
KR1020237015726A KR102656221B1 (ko) | 2018-05-31 | 2019-05-28 | 적응적 변환 타입의 공간 가변 변환 |
PCT/CN2019/088751 WO2019228332A1 (en) | 2018-05-31 | 2019-05-28 | Spatially varying transform with adaptive transform type |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237015726A Division KR102656221B1 (ko) | 2018-05-31 | 2019-05-28 | 적응적 변환 타입의 공간 가변 변환 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240051294A true KR20240051294A (ko) | 2024-04-19 |
Family
ID=68697832
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207033786A KR102532021B1 (ko) | 2018-05-31 | 2019-05-28 | 적응적 변환 타입의 공간 가변 변환 |
KR1020247011386A KR20240051294A (ko) | 2018-05-31 | 2019-05-28 | 적응적 변환 타입의 공간 가변 변환 |
KR1020237015726A KR102656221B1 (ko) | 2018-05-31 | 2019-05-28 | 적응적 변환 타입의 공간 가변 변환 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207033786A KR102532021B1 (ko) | 2018-05-31 | 2019-05-28 | 적응적 변환 타입의 공간 가변 변환 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237015726A KR102656221B1 (ko) | 2018-05-31 | 2019-05-28 | 적응적 변환 타입의 공간 가변 변환 |
Country Status (19)
Country | Link |
---|---|
US (4) | US11252426B2 (ko) |
EP (2) | EP3782361B1 (ko) |
JP (2) | JP7160948B2 (ko) |
KR (3) | KR102532021B1 (ko) |
CN (1) | CN111989913A (ko) |
AU (1) | AU2019277966B9 (ko) |
BR (1) | BR112020024218B1 (ko) |
CA (1) | CA3099323A1 (ko) |
CL (1) | CL2020003084A1 (ko) |
DK (1) | DK3782361T3 (ko) |
ES (1) | ES2962364T3 (ko) |
HU (1) | HUE063475T2 (ko) |
IL (1) | IL279095B1 (ko) |
NZ (1) | NZ769880A (ko) |
PL (1) | PL3782361T3 (ko) |
PT (1) | PT3782361T (ko) |
UA (1) | UA127899C2 (ko) |
WO (1) | WO2019228332A1 (ko) |
ZA (1) | ZA202006882B (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111758255A (zh) * | 2018-02-23 | 2020-10-09 | 华为技术有限公司 | 用于视频编解码的位置相关空间变化变换 |
WO2020003268A2 (en) * | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Definition of zero unit |
WO2020046091A1 (ko) * | 2018-09-02 | 2020-03-05 | 엘지전자 주식회사 | 다중 변환 선택에 기반한 영상 코딩 방법 및 그 장치 |
CN113853791B (zh) * | 2019-05-19 | 2023-11-14 | 字节跳动有限公司 | 数字视频中的变换旁路编解码残差块 |
CN112969067B (zh) * | 2021-05-18 | 2021-08-03 | 浙江华创视讯科技有限公司 | 一种视频编码方法、装置、设备和可读存储介质 |
KR20240000457U (ko) | 2022-08-31 | 2024-03-07 | 김재동 | 착용감과 내구성이 향상된 덧신 양말 |
KR20240000458U (ko) | 2022-08-31 | 2024-03-07 | 김재동 | 착용감과 내구성이 향상된 덧신 양말 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101448162B (zh) * | 2001-12-17 | 2013-01-02 | 微软公司 | 处理视频图像的方法 |
WO2003053066A1 (en) | 2001-12-17 | 2003-06-26 | Microsoft Corporation | Skip macroblock coding |
KR101403338B1 (ko) | 2007-03-23 | 2014-06-09 | 삼성전자주식회사 | 영상의 부호화, 복호화 방법 및 장치 |
US20120128074A1 (en) * | 2008-08-12 | 2012-05-24 | Nokia Corporation | Video coding using spatially varying transform |
GB0906058D0 (en) | 2009-04-07 | 2009-05-20 | Nokia Corp | An apparatus |
CN102484701A (zh) * | 2009-07-06 | 2012-05-30 | 汤姆逊许可证公司 | 用于空间变化残差编码的方法和设备 |
CN101668205B (zh) * | 2009-09-25 | 2011-04-20 | 南京邮电大学 | 基于残差宏块自适应下采样立体视频压缩编码方法 |
KR101457894B1 (ko) | 2009-10-28 | 2014-11-05 | 삼성전자주식회사 | 영상 부호화 방법 및 장치, 복호화 방법 및 장치 |
US8885714B2 (en) | 2010-01-14 | 2014-11-11 | Texas Instruments Incorporated | Method and system for intracoding in video encoding |
KR101487687B1 (ko) | 2010-01-14 | 2015-01-29 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
KR101791078B1 (ko) | 2010-04-16 | 2017-10-30 | 에스케이텔레콤 주식회사 | 영상 부호화/복호화 장치 및 방법 |
US9172968B2 (en) | 2010-07-09 | 2015-10-27 | Qualcomm Incorporated | Video coding using directional transforms |
US8885701B2 (en) | 2010-09-08 | 2014-11-11 | Samsung Electronics Co., Ltd. | Low complexity transform coding using adaptive DCT/DST for intra-prediction |
KR101756442B1 (ko) * | 2010-11-29 | 2017-07-11 | 에스케이텔레콤 주식회사 | 인트라예측모드의 중복성을 최소화하기 위한 영상 부호화/복호화 방법 및 장치 |
EP3668095B1 (en) | 2011-01-13 | 2021-07-07 | Canon Kabushiki Kaisha | Image coding apparatus, image coding method, and program, and image decoding apparatus, image decoding method, and program |
CN103597827B (zh) | 2011-06-10 | 2018-08-07 | 寰发股份有限公司 | 可伸缩视频编码方法及其装置 |
KR101943049B1 (ko) | 2011-06-30 | 2019-01-29 | 에스케이텔레콤 주식회사 | 영상 부호화/복호화 방법 및 장치 |
JP5711098B2 (ja) | 2011-11-07 | 2015-04-30 | 日本電信電話株式会社 | 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置およびそれらのプログラム |
KR20130050404A (ko) | 2011-11-07 | 2013-05-16 | 오수미 | 인터 모드에서의 복원 블록 생성 방법 |
US9549182B2 (en) | 2012-07-11 | 2017-01-17 | Qualcomm Incorporated | Repositioning of prediction residual blocks in video coding |
CN103581676B (zh) | 2012-08-10 | 2016-12-28 | 联发科技股份有限公司 | 视频编码变换系数的解码方法及装置 |
US20140056347A1 (en) | 2012-08-23 | 2014-02-27 | Microsoft Corporation | Non-Transform Coding |
CN103716623B (zh) * | 2013-12-17 | 2017-02-15 | 北京大学深圳研究生院 | 基于加权量化的视频压缩编解码方法及编解码器 |
CN104935927A (zh) | 2014-03-17 | 2015-09-23 | 上海京知信息科技有限公司 | 一种基于流水线的hevc视频序列编解码加速方法 |
CN103997650B (zh) | 2014-05-30 | 2017-07-14 | 华为技术有限公司 | 一种视频解码的方法和视频解码器 |
CN104125466B (zh) | 2014-07-10 | 2017-10-10 | 中山大学 | 一种基于gpu的hevc并行解码方法 |
CN105530518B (zh) | 2014-09-30 | 2019-04-26 | 联想(北京)有限公司 | 一种视频编码、解码方法及装置 |
MY190919A (en) | 2014-11-28 | 2022-05-19 | Mediatek Inc | Method and apparatus of alternative transform for video coding |
US10306229B2 (en) | 2015-01-26 | 2019-05-28 | Qualcomm Incorporated | Enhanced multiple transforms for prediction residual |
CN106254870B (zh) | 2015-06-08 | 2020-08-18 | 财团法人工业技术研究院 | 采用自适性色彩转换的视频编码方法、系统和计算机可读取记录介质 |
US10681379B2 (en) | 2015-09-29 | 2020-06-09 | Qualcomm Incorporated | Non-separable secondary transform for video coding with reorganizing |
CN108605129A (zh) | 2016-01-28 | 2018-09-28 | 日本放送协会 | 编码装置、解码装置以及程序 |
US10904526B2 (en) | 2016-03-28 | 2021-01-26 | Kt Corporation | Method and apparatus for processing video signal |
EP4447452A2 (en) | 2016-10-04 | 2024-10-16 | B1 Institute of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
WO2019076138A1 (en) | 2017-10-16 | 2019-04-25 | Huawei Technologies Co., Ltd. | METHOD AND APPARATUS FOR ENCODING |
-
2019
- 2019-05-28 PT PT198106924T patent/PT3782361T/pt unknown
- 2019-05-28 JP JP2020566562A patent/JP7160948B2/ja active Active
- 2019-05-28 BR BR112020024218-7A patent/BR112020024218B1/pt active IP Right Grant
- 2019-05-28 KR KR1020207033786A patent/KR102532021B1/ko active IP Right Grant
- 2019-05-28 ES ES19810692T patent/ES2962364T3/es active Active
- 2019-05-28 CN CN201980024809.9A patent/CN111989913A/zh active Pending
- 2019-05-28 PL PL19810692.4T patent/PL3782361T3/pl unknown
- 2019-05-28 IL IL279095A patent/IL279095B1/en unknown
- 2019-05-28 KR KR1020247011386A patent/KR20240051294A/ko active Application Filing
- 2019-05-28 EP EP19810692.4A patent/EP3782361B1/en active Active
- 2019-05-28 NZ NZ769880A patent/NZ769880A/en unknown
- 2019-05-28 DK DK19810692.4T patent/DK3782361T3/da active
- 2019-05-28 KR KR1020237015726A patent/KR102656221B1/ko active IP Right Grant
- 2019-05-28 WO PCT/CN2019/088751 patent/WO2019228332A1/en active Application Filing
- 2019-05-28 CA CA3099323A patent/CA3099323A1/en active Pending
- 2019-05-28 UA UAA202008441A patent/UA127899C2/uk unknown
- 2019-05-28 HU HUE19810692A patent/HUE063475T2/hu unknown
- 2019-05-28 EP EP23185053.8A patent/EP4250730A3/en active Pending
- 2019-05-28 AU AU2019277966A patent/AU2019277966B9/en active Active
-
2020
- 2020-11-04 ZA ZA2020/06882A patent/ZA202006882B/en unknown
- 2020-11-25 US US17/104,866 patent/US11252426B2/en active Active
- 2020-11-27 CL CL2020003084A patent/CL2020003084A1/es unknown
-
2021
- 2021-12-23 US US17/561,049 patent/US11601663B2/en active Active
-
2022
- 2022-10-13 JP JP2022164888A patent/JP2022189870A/ja active Pending
-
2023
- 2023-02-09 US US18/166,890 patent/US12022100B2/en active Active
-
2024
- 2024-05-21 US US18/670,305 patent/US20240305807A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102656221B1 (ko) | 적응적 변환 타입의 공간 가변 변환 | |
WO2019141012A1 (en) | Video processing methods and apparatuses for processing video data coded in large size coding units | |
KR20220084059A (ko) | 크로스 컴포넌트 적응적 루프 필터 | |
KR102698932B1 (ko) | 변환 스킵된 블록들에 대한 잔차 코딩 | |
CN114270838B (zh) | 变换跳过模式的信令通知 | |
US20230007246A1 (en) | External attention in neural network-based video coding | |
KR20220106209A (ko) | 이미지 코딩에서 제한된 2차 변환 및 그의 시그널링을 위한 방법들 및 장치 | |
WO2020228693A1 (en) | Coding of multiple intra prediction methods | |
RU2781213C2 (ru) | Пространственно изменяющееся преобразование с типом адаптивного преобразования | |
RU2799905C2 (ru) | Пространственно изменяющееся преобразование с типом адаптивного преобразования | |
RU2819359C2 (ru) | Пространственно изменяющееся преобразование с типом адаптивного преобразования | |
WO2022218280A1 (en) | Transforms and sign prediction | |
WO2022174762A1 (en) | Transforms on non-dyadic blocks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent |