KR20210128401A - 적어도 하나의 이미지를 표현하는 데이터 스트림을 코딩 및 디코딩하기 위한 방법들 및 디바이스들 - Google Patents
적어도 하나의 이미지를 표현하는 데이터 스트림을 코딩 및 디코딩하기 위한 방법들 및 디바이스들 Download PDFInfo
- Publication number
- KR20210128401A KR20210128401A KR1020217025873A KR20217025873A KR20210128401A KR 20210128401 A KR20210128401 A KR 20210128401A KR 1020217025873 A KR1020217025873 A KR 1020217025873A KR 20217025873 A KR20217025873 A KR 20217025873A KR 20210128401 A KR20210128401 A KR 20210128401A
- Authority
- KR
- South Korea
- Prior art keywords
- pixel
- prediction
- block
- value
- image
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 블록들로 분할되는 적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 코딩 및 디코딩하기 위한 방법, 그리고 그에 대응하여, 코딩 및 디코딩하기 위한 디바이스에 관한 것이다. 이미지의 적어도 하나의 현재 블록에 대해, 블록에서 일정한 픽셀 값들의 그룹이 미리 디코딩된 픽셀들로부터 결정되고(E441), 블록의 각각의 픽셀에 대해, 상기 픽셀과 연관된 예측 잔차가 디코딩된다(E442). 픽셀이 미리 디코딩된 적어도 하나의 다른 픽셀로부터 예측되는 제1 예측 모드를 사용하여 픽셀과 연관된 예측 값이 결정되며(E4411), 상기 미리 디코딩된 다른 픽셀은 상기 현재 블록에 속하고, 하나의 정보(E4422)는 블록에서 일정한 상기 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 픽셀이 예측되는 제2 예측 모드를 사용하여 픽셀이 예측될지 여부를 표시한다. 픽셀이 제2 예측 모드를 사용하여 예측될 때, 픽셀과 연관된 예측 값은 그룹의 선택된 값으로 대체된다(E4423). 픽셀은 픽셀과 연관된 예측 값을 사용하여 그리고 예측 잔차를 사용하여 재구성된다(E444).
Description
본 발명의 분야는 이미지들 또는 이미지들의 시퀀스들, 특히 비디오 스트림들을 코딩 및 디코딩하는 분야이다.
보다 구체적으로, 본 발명은 이미지들의 블록 표현을 이용한 이미지들 또는 이미지들의 시퀀스들의 압축에 관한 것이다.
본 발명은 특히, 현재 또는 미래의 인코더들(JPEG, MPEG, H.264, HEVC 등 및 이들의 수정들)에서 구현되는 이미지 또는 비디오 코딩에, 그리고 대응하는 디코딩에 적용될 수 있다.
디지털 이미지들 및 이미지들의 시퀀스들은 메모리의 관점에서 많은 공간을 차지하며, 이는 이러한 이미지들을 송신할 때, 이러한 송신에 사용되는 네트워크 상의 혼잡 문제들을 피하기 위해 이러한 이미지들을 압축할 것을 요구한다.
비디오 데이터를 압축하기 위한 많은 기술들이 이미 알려져 있다. 이들 중에서, HEVC 압축 표준("High Efficiency Video Coding, Coding Tools and Specification", Matthias Wien, Signals and Communication Technology, 2015)은 동일한 이미지(인트라 예측) 또는 이전 또는 후속 이미지(인터 예측)에 속하는 다른 픽셀들과 관련하여 현재 이미지의 픽셀들의 예측을 구현하는 것을 제안한다.
보다 구체적으로, 인트라 예측은 이미지 내의 공간 중복성들을 사용한다. 이를 위해, 이미지들은 픽셀들의 블록들로 분할된다. 이어서, 이미 재구성된 정보를 사용하여 픽셀들의 블록들이 예측되는데, 이는 이미지 내의 블록들의 스캐닝 순서에 따라 현재 이미지 내의 이전에 코딩된/디코딩된 블록들에 대응한다.
더욱이, 표준 방식으로, 현재 블록의 코딩은 예측자 블록으로 지칭되는 현재 블록의 예측, 및 현재 블록과 예측자 블록 간의 차이에 대응하는 예측 잔차 또는 "잔차 블록"을 사용하여 실행된다. 이어서, 결과적인 잔차 블록이 예를 들어, DCT(discrete cosine transform) 타입 변환을 사용하여 변환된다. 그 다음, 변환된 잔차 블록의 계수들이 양자화되고, 엔트로피 코딩에 의해 코딩되고 디코더에 송신되며, 디코더는 이러한 잔차 블록을 예측자 블록에 추가함으로써 현재 블록을 재구성할 수 있다.
디코딩은 이미지 단위로 그리고 각각의 이미지에 대해 블록 단위로 수행된다. 각각의 블록에 대해, 스트림의 대응하는 엘리먼트들이 판독된다. 잔차 블록의 계수들의 역양자화 및 역변환이 수행된다. 그 다음, 블록 예측이 계산되어 예측자 블록을 획득하고, 디코딩된 잔차 블록에 예측(즉, 예측자 블록)을 추가함으로써 현재 블록이 재구성된다.
US9253508에서는, 인트라 모드에서 블록들을 코딩하기 위한 DPCM(Differential Pulse Code Modulation) 코딩 기술이 HEVC 인코더에 통합된다. 그러한 기술은 인트라 블록의 한 세트의 픽셀들을 이전에 재구성된 동일한 블록의 다른 세트의 픽셀들에 의해 예측하는 것에 있다. US9253508에서는, 코딩될 인트라 블록의 한 세트의 픽셀들은 블록의 행, 또는 열, 또는 행과 열에 대응하고, 한 세트의 픽셀들을 예측하는 데 사용되는 인트라 예측은 HEVC 표준에 정의된 방향성 인트라 예측들 중 하나이다.
그러나 그러한 기술은 최적이 아니다. 실제로, 이전에 처리된 이웃 픽셀들에 의한 픽셀의 예측은 자연 타입 데이터(사진들, 비디오들)를 코딩하도록 잘 적응된다. 그러나 콘텐츠의 타입이 인공적인, 예를 들어 스크린샷들 또는 합성 이미지들에 대응하는 콘텐츠인 경우, 이미지들은 고 에너지 전환들을 생성하는 강한 불연속성들을 갖는다.
보다 구체적으로, 예를 들어 합성 이미지들은 이하 레벨들로도 또한 지칭되는 매우 적은 수의 픽셀 값들을 갖는 영역들을 포함할 가능성이 있다. 예를 들어, 일부 영역들은 2개의 레벨들: 배경에 대한 레벨 및 전경에 대한 레벨, 이를테면 흰색 배경 상의 흑색 텍스트만을 가질 수 있다.
이미지의 영역에서 그러한 전환의 존재 시에, 코딩될 픽셀의 값은 다음에, 이웃 픽셀들의 값으로부터 매우 멀다. 그러면, 이전에 처리된 이웃 픽셀들을 사용하는 위에서 설명된 바와 같은 그러한 픽셀의 예측은 그러한 전환들을 거의 모델링할 수 없다.
따라서 이미지 또는 비디오 데이터의 압축을 개선하기 위한 새로운 코딩 및 디코딩 방법이 필요하다.
본 발명은 최신 기술을 개선한다. 이러한 목적으로, 본 발명은 블록들로 분할되는 적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 방법에 관한 것이다. 이러한 디코딩 방법은, 현재 블록으로 지칭되는, 이미지의 적어도 하나의 블록에 대해:
- 이전에 디코딩된 픽셀들로부터 블록에서 일정한 픽셀 값들의 그룹을 결정하는 단계,
- 블록의 각각의 픽셀에 대해:
제1 예측 모드에 따라 픽셀과 연관된 예측 값을 결정하는 단계 ― 제1 예측 모드에 따라 적어도 하나의 다른 이전에 디코딩된 픽셀로부터 픽셀이 예측되고, 상기 다른 이전에 디코딩된 픽셀은 상기 현재 블록에 또는 이미지의 이전에 디코딩된 블록에 속함 ―,
제2 예측 모드에 따라 픽셀이 예측되는지 여부를 표시하는 정보 항목을 데이터 스트림으로부터 디코딩하는 단계 ― 블록에서 일정한 상기 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 제2 예측 모드에 따라 픽셀이 예측됨 ―,
o
상기 그룹의 값을 선택하는 단계,
o
상기 픽셀과 연관된 예측 값을 상기 선택된 값으로 대체하는 단계,
상관적으로, 본 발명은 또한, 블록들로 분할되는 적어도 하나의 이미지를 나타내는 데이터 스트림을 코딩하기 위한 방법에 관한 것이다. 이러한 코딩 방법은, 현재 블록으로 지칭되는, 이미지의 적어도 하나의 블록에 대해:
- 이전에 디코딩된 픽셀들로부터 블록에서 일정한 픽셀 값들의 그룹을 결정하는 단계,
- 블록의 각각의 픽셀에 대해:
제1 예측 모드에 따라 픽셀과 연관된 예측 값을 결정하는 단계 ― 적어도 하나의 다른 이전에 디코딩된 픽셀로부터 결정된 픽셀과 연관된 예측 값에 의해 제1 예측 모드에 따라 픽셀이 예측되고, 상기 다른 이전에 디코딩된 픽셀은 상기 현재 블록에 또는 이미지의 이전에 디코딩된 블록에 속함 ―,
o
상기 그룹의 값을 선택하는 단계,
o
상기 픽셀과 연관된 예측 값을 상기 선택된 값으로 대체하는 단계,
따라서 본 발명은 코딩될 픽셀의 이웃 픽셀들에 의한 로컬 예측을 사용하여 코딩 모드의 압축 성능을 개선한다. 유리하게, 코딩될 블록의 이웃 픽셀들의 값들을 나타내는 픽셀 값들의 그룹이 결정된다. 예를 들어, 이 그룹은 코딩될 블록의 이웃 픽셀들 중에서 가장 빈번한 미리 결정된 수의 픽셀 값들을 포함한다. 통상적으로, 이러한 값들의 그룹은, 이미지가 예를 들어, 합성 이미지들에 대해 계층들로 표현될 때, 또는 구분된 전경 및 배경, 이를테면 백색 배경 상의 흑색 텍스트를 갖는 영역들을 포함할 때, 이미지 계층들의 세기 값들을 포함할 수 있다.
본 발명의 특정 실시예에 따르면, 값들의 그룹은 블록의 이웃에서 2개의 가장 빈번한 값들을 나타내는 2개의 값들을 포함한다.
전환 영역에 위치된 픽셀이 검출될 때, 그 픽셀의 예측 값은 이와 같이 결정된 그룹의 값들 중 하나로 변경된다.
그러한 그룹의 값들은 현재 블록의 모든 픽셀들에 대해 단 한 번만 결정되기 때문에, 그러한 값들은 현재 블록에서 일정하다고 한다.
본 발명의 특정 실시예에 따르면, 그룹의 값은 그룹의 일정한 픽셀 값들과 관련하여, 상기 픽셀과 연관되며 제1 예측 모드에 따라 결정된 예측 값 사이의 거리에 따라 선택된다.
본 발명의 이러한 특정 실시예는 전환 영역에 위치된 픽셀에 대한 그룹의 예측 값의 편리한 선택을 가능하게 하고, 이러한 선택을 표시하기 위해 추가 정보가 송신될 것을 요구하지 않는다.
본 발명의 다른 특정 실시예에 따르면, 그룹은 제1 값 및 제2 값을 포함하는데, 상기 픽셀과 연관된 예측 값과 제1 값 사이의 거리가 상기 픽셀과 연관된 예측 값과 제2 값 사이의 거리 미만일 때, 상기 그룹의 선택된 값은 제1 값이고, 그렇지 않으면 상기 그룹의 선택된 값은 제2 값이다.
본 발명의 다른 특정 실시예에 따르면, 제2 예측 모드에 따라 픽셀이 예측되는지 여부를 표시하는 정보 항목은, 픽셀의 예측 잔차가 0과 다른 경우에만 데이터 스트림으로부터 디코딩되거나 또는 데이터 스트림으로 코딩된다.
이 특정 실시예는 예측 잔차가 0과 다를 때 제2 예측 모드에 따른 예측을 표시하는 정보 항목을 코딩하는 것을 피한다. 따라서 이 특정 실시예에 따르면, 디코더에서, 현재 픽셀을 예측하기 위해 제1 예측 모드가 디폴트로 사용된다.
본 발명의 이러한 특정 실시예는 불필요한 정보가 인코더에 의해 코딩되는 것을 피한다. 실제로, 인코더에서, 제1 예측 모드에 따른 예측이 0인 예측 잔차, 즉 최적의 예측을 야기할 때는, 정보 항목이 현재 픽셀에 제2 예측 모드가 사용되지 않음을 표시하는 것이 암시적이다.
본 발명의 이러한 특정 실시예는 인코더에서, 제1 예측 모드로부터 야기되는 예측으로부터의 예측 잔차를 계산하는 데 있는 이전 단계에 의해 또는 코딩될 픽셀의 원래 값이 예측 모드로부터 야기되는 예측 값으로부터 먼지 여부를 결정하는 것에 있는 단계에 의해 구현될 수 있다.
본 발명의 다른 특정 실시예에 따르면, 이전에 디코딩된 픽셀들로부터 블록에서 일정한 픽셀 값들의 그룹의 결정은, 이전에 재구성된 현재 블록의 이웃 픽셀들의 값들의 히스토그램을 계산하고 현재 블록의 이웃 픽셀들 중에서 가장 빈번한 2개의 픽셀 값들을 각각 나타내는 적어도 2개의 픽셀 값들을 선택함으로써 수행된다.
본 발명의 다른 특정 실시예에 따르면, 이전에 디코딩된 픽셀들로부터 블록에서 일정한 상기 픽셀 값들의 그룹의 적어도 하나의 값으로부터 임계 값이 결정된다. 픽셀에 대한 예측 모드를 결정할 때는, 다음과 같은 경우에 제2 예측 모드가 선택된다:
- 상기 픽셀의 원래 값이 상기 임계 값보다 크고 임계 값이 제1 예측 모드에 따라 결정된 픽셀과 연관된 예측 값보다 큰 경우, 또는
- 상기 픽셀의 원래 값이 상기 임계 값보다 작고 임계 값이 제1 예측 모드에 따라 결정된 픽셀과 연관된 예측 값보다 작은 경우.
본 발명은 또한, 블록들로 분할되는 적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 디바이스에 관한 것이다. 이러한 디코딩 디바이스는 프로세서를 포함하며, 이 프로세서는 현재 블록으로 지칭되는, 이미지의 적어도 하나의 블록에 대해:
- 이전에 디코딩된 픽셀들로부터 블록에서 일정한 픽셀 값들의 그룹을 결정하고,
- 블록의 각각의 픽셀에 대해:
적어도 하나의 다른 이전에 디코딩된 픽셀로부터 픽셀과 연관된 예측 값을 결정하고 ― 상기 다른 이전에 디코딩된 픽셀은 상기 현재 블록에 또는 이미지의 이전에 디코딩된 블록에 속함 ―,
o
상기 그룹의 값을 선택하고,
o
상기 픽셀과 연관된 예측 값을 상기 선택된 값으로 대체하고,
본 발명의 특정 실시예에 따르면, 이러한 디코딩 디바이스는 단말에 포함된다.
본 발명은 또한, 블록들로 분할되는 적어도 하나의 이미지를 나타내는 데이터 스트림을 코딩하기 위한 디바이스에 관한 것이다. 이러한 코딩 디바이스는 프로세서를 포함하며, 이 프로세서는 현재 블록으로 지칭되는, 이미지의 적어도 하나의 블록에 대해:
- 이전에 디코딩된 픽셀들로부터 블록에서 일정한 픽셀 값들의 그룹을 결정하고,
- 블록의 각각의 픽셀에 대해:
제1 예측 모드에 따라 픽셀과 연관된 예측 값을 결정하고 ― 제1 예측 모드에 따라 적어도 하나의 다른 이전에 디코딩된 픽셀로부터 픽셀이 예측되고, 상기 다른 이전에 디코딩된 픽셀은 상기 현재 블록에 또는 이미지의 이전에 디코딩된 블록에 속함 ―,
o
상기 그룹의 값을 선택하고,
o
상기 픽셀과 연관된 예측 값을 상기 선택된 값으로 대체하고,
본 발명의 특정 실시예에 따르면, 이러한 코딩 디바이스는 단말 또는 서버에 포함된다.
본 발명은 또한 블록들로 분할되는 적어도 하나의 이미지를 나타내는 데이터 스트림에 관한 것이다. 이러한 데이터 스트림 방법은, 현재 블록으로 지칭되는, 이미지의 적어도 하나의 블록에 대해 그리고 현재 블록의 각각의 픽셀에 대해:
- 상기 픽셀과 연관된 예측 잔차를 나타내는 정보 항목,
- 블록에서 일정한 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 픽셀이 예측되는지 여부를 표시하는 정보 항목을 포함하며, 블록에서 일정한 픽셀 값들의 그룹은 이전에 디코딩된 픽셀들로부터 결정된다.
본 발명에 따른 디코딩 방법, 코딩 방법은 각각 다양한 방식들로, 특히 유선 형태로 또는 소프트웨어 형태로 구현될 수 있다. 본 발명의 특정 실시예에 따르면, 디코딩 방법, 코딩 방법은 각각 컴퓨터 프로그램에 의해 구현된다. 본 발명은 또한 컴퓨터 프로그램에 관한 것으로, 이 컴퓨터 프로그램은 상기 프로그램이 프로세서에 의해 실행될 때, 이전에 설명된 특정 실시예들 중 임의의 실시예에 따른 디코딩 방법 또는 코딩 방법을 구현하기 위한 명령들을 포함한다. 이러한 프로그램은 임의의 프로그래밍 언어를 사용할 수 있다. 이는 통신 네트워크로부터 다운로드될 수 있고 그리고/또는 컴퓨터 판독 가능 매체 상에 기록될 수 있다.
이 프로그램은 임의의 프로그래밍 언어를 사용할 수 있고, 소스 코드, 객체 코드, 또는 소스 코드와 객체 코드 사이의 중간 코드의 형태, 이를테면 부분적으로 컴파일된 형태, 또는 임의의 다른 바람직한 형태일 수 있다.
본 발명은 또한, 위에서 언급된 바와 같은 컴퓨터 프로그램의 명령들을 포함하는 컴퓨터 판독 가능 저장 매체 또는 데이터 매체에 관한 것이다. 위에서 언급된 기록 매체는 프로그램을 저장할 수 있는 임의의 엔티티 또는 디바이스일 수 있다. 예를 들어, 매체는 메모리와 같은 저장 수단을 포함할 수 있다. 다른 한편으로, 기록 매체는 전기 또는 광 케이블을 통해, 라디오에 의해 또는 다른 수단에 의해 전달될 수 있는 전기 또는 광 신호와 같은 송신 가능 매체에 대응할 수 있다. 본 발명에 따른 프로그램은 특히, 인터넷 타입 네트워크 상에서 다운로드될 수 있다.
대안으로, 기록 매체는 프로그램이 내장되는 집적 회로에 대응할 수 있으며, 회로는 해당 방법을 실행하도록 또는 해당 방법의 실행에 사용되도록 적응된다.
본 발명의 다른 특징들 및 이점들은 간단한 예시적인 비-제한적 예로서 제공되는 특정 실시예의 다음의 설명 및 첨부된 도면들을 읽으면 보다 명확하게 나타날 것이다.
도 1은 본 발명의 특정 실시예에 따른 코딩 방법의 단계들을 도시한다.
도 2a는 본 발명의 특정 실시예에 따른 코딩된 데이터 스트림의 일부의 일례를 예시한다.
도 2b는 본 발명의 다른 특정 실시예에 따른 코딩된 데이터 스트림의 일부의 일례를 예시한다.
도 3a는 본 발명의 특정 실시예에 따라 인트라 예측 모드를 결정하기 위한 현재 블록의 이웃 블록들의 포지션 예를 예시한다.
도 3b는 본 발명의 특정 실시예에 따라 현재 블록의 픽셀들을 예측하는 데 사용되는 기준 픽셀들의 포지션 예를 예시한다.
도 4는 본 발명의 특정 실시예에 따른 디코딩 방법의 단계들을 도시한다.
도 5는 본 발명의 특정 실시예에 따라 이미지에서 2개의 콘텐츠 계층들을 각각 갖는 스크린들과 같은 콘텐츠를 포함하는 블록들 및 이들 각각의 이웃의 예들을 예시한다.
도 6은 본 발명의 특정 실시예에 따라, 2개의 콘텐츠 계층들을 갖는 스크린들과 같은 콘텐츠를 포함하는 16x16 블록 및 그 블록에 대한 픽셀들의 전환 상태들을 보여주는 전환 맵의 일례를 예시한다.
도 7은 본 발명의 특정 실시예들 중 임의의 실시예에 따른 코딩 방법을 구현하도록 적응된 코딩 디바이스의 단순화된 구조를 도시한다.
도 8은 본 발명의 특정 실시예들 중 임의의 실시예에 따른 디코딩 방법을 구현하도록 적응된 디코딩 디바이스의 단순화된 구조를 도시한다.
도 1은 본 발명의 특정 실시예에 따른 코딩 방법의 단계들을 도시한다.
도 2a는 본 발명의 특정 실시예에 따른 코딩된 데이터 스트림의 일부의 일례를 예시한다.
도 2b는 본 발명의 다른 특정 실시예에 따른 코딩된 데이터 스트림의 일부의 일례를 예시한다.
도 3a는 본 발명의 특정 실시예에 따라 인트라 예측 모드를 결정하기 위한 현재 블록의 이웃 블록들의 포지션 예를 예시한다.
도 3b는 본 발명의 특정 실시예에 따라 현재 블록의 픽셀들을 예측하는 데 사용되는 기준 픽셀들의 포지션 예를 예시한다.
도 4는 본 발명의 특정 실시예에 따른 디코딩 방법의 단계들을 도시한다.
도 5는 본 발명의 특정 실시예에 따라 이미지에서 2개의 콘텐츠 계층들을 각각 갖는 스크린들과 같은 콘텐츠를 포함하는 블록들 및 이들 각각의 이웃의 예들을 예시한다.
도 6은 본 발명의 특정 실시예에 따라, 2개의 콘텐츠 계층들을 갖는 스크린들과 같은 콘텐츠를 포함하는 16x16 블록 및 그 블록에 대한 픽셀들의 전환 상태들을 보여주는 전환 맵의 일례를 예시한다.
도 7은 본 발명의 특정 실시예들 중 임의의 실시예에 따른 코딩 방법을 구현하도록 적응된 코딩 디바이스의 단순화된 구조를 도시한다.
도 8은 본 발명의 특정 실시예들 중 임의의 실시예에 따른 디코딩 방법을 구현하도록 적응된 디코딩 디바이스의 단순화된 구조를 도시한다.
5.1 일반 원리
본 발명은 픽셀 값들의 2개의 매우 뚜렷이 구별되는 레벨들 사이의 전환부 상에 위치된 블록의 픽셀들에 대한 로컬 예측을 사용하여 이미지의 블록의 코딩 모드를 개선한다.
로컬 예측을 사용하여 코딩될 블록의 코딩 모드는 코딩될 블록의 다른 픽셀들을 예측하기 위해 코딩될 블록에 속하는 기준 픽셀들을 사용하는 것을 가능하게 한다. 이러한 예측 모드는 코딩될 픽셀에 공간적으로 매우 가까운 블록의 픽셀들을 사용함으로써 예측 잔차를 감소시킨다.
그러나 이러한 코딩 모드는 원래의 픽셀들이 이들의 예측에서 멀리 있을 때 비교적 큰 코딩 잔차를 도입한다. 이는 일반적으로, 스크린샷들 또는 합성 이미지들과 같은 콘텐츠에 대한 경우이다. 이러한 타입의 콘텐츠에서, 코딩될 블록은 강한 불연속성들을 가질 수 있다. 이 경우, 배경에 속하는 기준 픽셀들은 전경에 속하는 동일한 블록의 픽셀들을 예측하는 데 사용될 수 있으며, 그 반대의 경우도 마찬가지이다. 이 경우, 기준 픽셀들에서 이용 가능한 정보 항목은 정확한 예측에 적합하지 않다. 배경 영역과 전경 영역 사이의 경계에 위치된 픽셀들은 이하, 전환 픽셀들로 지칭된다.
유리하게는, 본 발명은 코딩될 블록에 대해 이미지의 각각의 계층에 관련된 정보 항목, 예를 들어 2개의 계층들만이 고려되는 경우, 전경에 관한 정보 항목 및 배경에 관한 정보 항목을 도출하는 것을 제안한다. 물론, 추가 콘텐츠 계층들이 고려되어, 도출될 정보 항목들의 수를 증가시킬 수 있다. 예를 들어, 그러한 정보의 도출은 블록에서 일정한 픽셀 값들의 그룹을 결정하는 것에 있다.
본 발명의 특정 실시예에 따르면, 이미지의 각각의 계층에 관련된 이러한 정보는 코딩될 블록의 로컬 이웃으로부터 도출된다.
유리하게는, 이러한 정보는 코딩될 블록에서 전환 픽셀들을 검출하기 위한 메커니즘과 함께 사용된다. 이는 그러한 픽셀들의 잔차 에너지를 감소시킨다.
도 5는 이미지에서 2개의 콘텐츠 계층들을 각각 갖는 스크린들과 같은 콘텐츠를 포함하는 블록들(Bi-bl) 및 이들 각각의 이웃(Neigh)을 예시한다. 도 5에 예시된 바와 같이, 코딩될 현재 블록의 로컬 이웃은 2개의 계층들의 세기 레벨에 관한 유용한 정보를 포함한다.
본 발명에 따르면, 코딩될 블록에서의 전환 픽셀들이 검출될 때, 이러한 픽셀들에 대한 예측 값은 픽셀이 속할 가능성이 있는 계층에 대응하는 계층의 세기 레벨을 사용하여 보정된다.
본 발명의 특정 실시예에 따르면, 블록의 각각의 픽셀에 대한 최적의 예측 및 제한된 레이트 비용을 갖기 위해, 이러한 메커니즘은 특정 조건들을 충족시키는 픽셀들로 제한된다.
예측될 픽셀의 로컬 이웃에 따라, 예측될 픽셀의 3개의 상태들이 정의될 수 있다:
- s1: 픽셀은, 이웃 픽셀들로부터의 로컬 예측이 매우 효율적인 균질 영역에 속하는데, 예를 들어 이는 0의 양자화된 예측 잔차를 제공한다. 이 경우, 픽셀은 전환 픽셀이 아니다. 실시예 변형에 따르면, 이 상태는 디코더에서 암시적으로 검출될 수 있다,
- s2: 픽셀은, 이웃 픽셀들로부터의 로컬 예측이 적절하게 효율적인 영역에 속하는데, 예를 들어 이는 낮은 예측 잔차를 제공한다. 위에서 언급된 보정 메커니즘에 의한 픽셀의 예측은 이 픽셀에 대해 허용되지만, 잔차 예측 에러가 계층들의 세기 레벨들에 따라 결정된 임계 값과 비교하여 충분히 크지 않다면, 보정 메커니즘은 적용되지 않는다. 이 경우, 보정 메커니즘이 사용되지 않음을 표시하도록 표시자가 구체적으로 코딩된다,
- s3: 픽셀은, 이웃 픽셀들로부터의 로컬 예측이 효율적이지 않은 영역에 속하는데, 예를 들어 이는 큰 예측 잔차를 제공한다. 위에서 언급된 보정 메커니즘에 의한 픽셀의 예측이 해당 픽셀에 대해 허용되고, 표시자가 그 사용을 표시하도록 구체적으로 코딩된다.
도 6은 어두운 배경 상에 밝은 텍스트를 갖는 16x16 블록의 일례를 좌측에, 그리고 위에서 설명된 상태들이 블록의 픽셀들에 어떻게 할당될 수 있는지를 보여주는, 이 블록에 대한 전환 맵을 우측에 도시한다.
5.2 실시예들
도 1은 본 발명의 특정 실시예에 따른 코딩 방법의 단계들을 도시한다. 예를 들어, 이미지들의 시퀀스(I1, I2, …, INb)가 본 발명의 특정 실시예에 따라, 코딩된 데이터 스트림(STR)의 형태로 코딩된다. 예를 들어, 이러한 코딩 방법은 도 7과 관련하여 나중에 설명되는 바와 같이 코딩 디바이스에 의해 구현된다.
코딩될 시퀀스의 다수의 이미지들인 이미지들의 시퀀스(I1, I2, …, INb)가 코딩 방법의 입력으로서 제공된다. 코딩 방법은 입력으로서 제공된 이미지들의 시퀀스를 나타내는 코딩된 데이터 스트림(STR)을 출력한다.
알려진 방식으로, 이미지들의 시퀀스(I1, I2, …, INb)의 코딩은 이전에 설정되어 인코더에 알려진 코딩 순서에 따라 이미지 단위로 이루어진다. 예를 들어, 이미지들은 시간 순서(I1, I2, …, INb)로 또는 다른 순서, 예를 들어 I1,I3, I2, …, INb로 코딩될 수 있다.
단계(E0)에서, 이미지들의 시퀀스(I1,I2, …, INb 의 코딩될 이미지(Ij)가 블록들로, 예를 들어 32x32 또는 64x64 픽셀 크기 이상의 블록들로 분할된다. 이러한 블록은 정사각형 또는 직사각형 서브블록들, 예를 들어 16x16, 8x8, 4x4, 16x8, 8x16…으로 세분될 수 있다.
단계(E1)에서, 이미지(Ij)의 코딩될 제1 블록 또는 서브블록(X b )이 이미지(Ij)의 미리 결정된 스캐닝 순서에 따라 선택된다. 예를 들어, 이는 이미지의 사전식(lexicographical) 스캐닝 순서에서의 첫 번째 블록일 수 있다.
단계(E2)에서, 인코더는 현재 블록(X b )을 코딩하기 위한 코딩 모드를 선택한다.
여기서 설명되는 특정 실시예에 따르면, 인코더는 제1 코딩 모드(M1) 및 제2 코딩 모드(M2) 중에서 현재 블록(X b )을 코딩하기 위한 코딩 모드를 선택한다. (여기서는 설명되지 않는) 추가 코딩 모드들이 사용될 수 있다.
여기서 설명되는 특정 실시예에 따르면, 제1 코딩 모드(M1)는 예를 들어, HEVC 표준에 따라 정의된 현재 블록의 종래의 인트라 예측 코딩에 대응하고, 제2 코딩 모드(M2)는 루프 내 잔차(ILR: In-Loop Residual) 또는 나중에 설명되는 DPCM 예측 코딩에 대응한다.
본 발명의 원리는 제1 코딩 모드(M1)에 대한 다른 타입들의 코딩 모드들로 확장될 수 있다. 예를 들어, 제1 코딩 모드는 예측 잔차의 변환(이미지 간 예측 코딩, 템플릿 매칭 코딩을 이용한 공간 예측 등)을 사용하는 임의의 타입의 코딩 모드들에 대응할 수 있다.
단계(E2)에서, 인코더는 레이트/왜곡 최적화를 수행하여 현재 블록을 코딩하기 위한 최상의 코딩 모드를 결정할 수 있다. 이러한 레이트/왜곡 최적화 동안, 제1 코딩 모드 및 제2 코딩 모드와 별개인 추가 코딩 모드들, 예를 들어 인터 모드 코딩 모드가 테스트될 수 있다. 이러한 레이트/왜곡 최적화 동안, 인코더는 각각의 코딩 모드와 연관된 레이트 및 왜곡을 결정하기 위해 상이한 이용 가능한 코딩 모드들에 따라 현재 블록(X b )의 코딩을 시뮬레이션하고, 최상의 레이트/왜곡 절충을 제공하는 코딩 모드를 예를 들어, D+λ×R 함수에 따라 선택하며, 여기서 R은 평가된 코딩 모드에 따라 현재 블록을 코딩하는 데 요구되는 레이트이고, D는 디코딩된 블록과 원래 현재 블록 간에 측정된 왜곡이며, λ는 예를 들어, 사용자에 의해 입력된 또는 인코더에서 정의된 라그랑주 승수(Lagrangian multiplier)이다.
단계(E20)에서, 현재 블록에 대해 선택된 코딩 모드를 표시하는 정보 항목이 데이터 스트림(STR)으로 코딩된다.
현재 블록(X b )이 제1 코딩 모드(M1)에 따라 코딩된다면, 이 방법은 M1에 따라 블록을 코딩하기 위한 단계(E21)로 진행한다. 현재 블록(X b )이 제2 코딩 모드(M2)에 따라 코딩된다면, 이 방법은 M2에 따라 블록을 코딩하기 위한 단계(E22)로 진행한다.
본 발명의 특정 실시예에 따라, 제1 코딩 모드(M1)에 따라 블록을 코딩하기 위한 단계(E21)가 아래에서 설명된다. 여기서 설명되는 특정 실시예에 따르면, 제1 코딩 모드는 종래의 인트라 예측, 이를테면 HEVC 표준에 정의된 것에 대응한다.
단계(E210)에서, 양자화 스텝(δ 1)이 결정된다. 예를 들어, 양자화 스텝(δ1)은 사용자에 의해 설정될 수 있거나, 압축과 품질 간의 절충을 설정하는 양자화 파라미터를 사용하여 계산되고 사용자에 의해 입력되거나 인코더에 의해 정의될 수 있다. 따라서 이러한 양자화 파라미터는 레이트 왜곡 비용 함수(D+λ×R)에서 사용되는 파라미터(λ)일 수 있으며, 여기서 D는 코딩에 의해 도입된 왜곡을 나타내고, R은 코딩에 사용되는 레이트를 나타낸다. 이 함수는 코딩 선택들을 하는 데 사용된다. 통상적으로, 이 기능을 최소화하는 이미지를 코딩하는 방식이 추구된다.
변형으로서, 양자화 파라미터는 종래에 AVC 또는 HEVC 표준들에서 사용되는 양자화 파라미터에 대응하는 QP일 수 있다. 따라서 HEVC 표준에서, 양자화 스텝(δ 1)은 식 δ 1 = levelScale[QP%6] << (QP/6)에 의해 결정되며, 여기서 k = 0..5에 대해 levelScale[ k ] = { 40, 45, 51, 57, 64, 72 }이다.
단계(E211)에서, 현재 블록의 예측은 종래의 인트라 예측 모드를 사용하여 결정된다. 이러한 종래의 인트라 예측에 따르면, 각각의 예측된 픽셀은 현재 블록 위에 그리고 현재 블록의 좌측에 위치된 이웃 블록들(기준 픽셀들)에서 비롯되는 디코딩된 픽셀들로부터만 계산된다. 픽셀들이 기준 픽셀들로부터 예측되는 방식은, 디코더에 송신되며 인코더 및 디코더에 알려진 미리 결정된 한 세트의 모드들 중에서 인코더에 의해 선택되는 예측 모드에 의존한다.
따라서 HEVC에는 35개의 가능한 예측 모드들: 33개의 상이한 각도 방향들로 기준 픽셀들을 보간하는 33개의 모드들, 및 2개의 다른 모드들: 예측된 블록의 각각의 픽셀이 기준 픽셀들의 평균으로부터 생성되는 DC 모드, 및 평면 및 비-방향성 보간을 수행하는 PLANAR 모드가 존재한다. 이러한 "종래의 인트라 예측"은 잘 알려져 있고, (단지 9개의 상이한 모드들만이 존재하는) ITU-T H.264 표준뿐만 아니라, 67개의 상이한 예측 모드들이 존재하는, 인터넷 어드레스(https://jvet.hhi.fraunhofer.de/)에서 입수할 수 있는 실험용 JEM 소프트웨어에서도 또한 사용된다. 모든 경우들에, 종래의 인트라 예측은 위에서 언급된 2개의 양상들(이웃 블록들의 픽셀들로부터 코딩될 블록의 픽셀들의 예측 및 최적의 예측 모드의 디코더로의 송신)을 준수한다.
따라서 단계(E211)에서, 인코더는 예측 모드들의 미리 결정된 리스트로부터 이용 가능한 예측 모드들 중 하나를 선택한다. 선택하기 위한 한 가지 방식은 예를 들어, 모든 예측 모드들을 평가하고, 전형적으로는 레이트 왜곡 비용과 같은 비용 함수를 최소화하는 예측 모드를 유지하는 것에 있다.
단계(E212)에서, 현재 블록에 대해 선택된 예측 모드는 현재 블록의 이웃 블록들로부터 코딩된다. 도 3a는 현재 블록(Xb)의 예측 모드를 코딩하기 위한 현재 블록(Xb)의 이웃 블록들(Ab, Bb)의 포지션 예를 예시한다.
단계(E212)에서, 현재 블록에 대해 선택된 인트라 예측 모드가 이웃 블록들과 연관된 인트라 예측 모드들을 사용하여 코딩된다.
예를 들어, 현재 블록의 예측 모드를 코딩하기 위해 HEVC 표준에 기술된 접근법이 사용될 수 있다. 도 3a의 예에서, 이러한 접근법은 현재 블록 위에 위치된 블록(Ab)과 연관된 인트라 예측 모드(mA), 및 현재 블록의 바로 왼쪽에 위치된 블록(Bb)과 연관된 인트라 예측 모드(mB)를 식별하는 것에 있다. mA 및 mB 값에 따라, 3개의 인트라 예측 모드들을 포함하는 MPM(Most Probable Mode)으로 불리는 리스트, 및 32개의 다른 예측 모드들을 포함하는 비-MPM으로 불리는 리스트가 생성된다.
HEVC 표준에 따르면, 현재 블록의 인트라 예측 모드를 코딩하기 위해, 신택스 엘리먼트들이 송신된다:
- 현재 블록에 대해 코딩될 예측 모드가 MPM 리스트에 있는지 여부를 표시하는 이진 표시자,
- 현재 블록의 예측 모드가 MPM 리스트에 속한다면, 현재 블록의 예측 모드에 대응하는 MPM 리스트 내의 인덱스가 코딩되고,
- 현재 블록의 예측 모드가 MPM 리스트에 속하지 않는다면, 현재 블록의 예측 모드에 대응하는 비-MPM 리스트 내의 인덱스가 코딩된다.
단계(E213)에서, 현재 블록에 대한 예측 잔차(R)가 구성된다.
단계(E213)에서는, 표준 방식으로, 예측된 블록(P)이 단계(E211)에서 선택된 예측 모드에 따라 구성된다. 그런 다음, 예측된 블록(P)과 원래의 현재 블록 사이의 각각의 픽셀에 대한 차이를 계산함으로써 예측 잔차(R)가 획득된다.
단계(E214)에서, 예측 잔차(R)가 RT로 변환된다.
단계(E214)에서, 변환 계수들을 포함하는 블록(RT)을 생성하기 위해, 잔차 블록(R)에 주파수 변환이 적용된다. 변환은 예를 들어 DCT 타입 변환일 수 있다. 미리 결정된 세트의 변환들(ET) 중에서 사용될 변환을 선택하고, 사용된 변환을 디코더에 통지하는 것이 가능하다.
단계(E215)에서, 변환된 잔차 블록(RT)이 예를 들어, 양자화 스텝 스칼라 양자화(δ 1)를 사용하여 양자화된다. 이는 양자화된 변환된 예측 잔차 블록(RTQ)을 생성한다.
단계(E216)에서, 양자화된 블록(RTQ)의 계수들은 엔트로피 인코더에 의해 코딩된다. 예를 들어, HEVC 표준에 특정된 엔트로피 코딩이 사용될 수 있다.
알려진 방식으로, 양자화된 블록(RTQ)의 계수들을 역양자화한 다음, 역양자화된 계수들에 역변환을 적용하여 디코딩된 예측 잔차를 획득함으로써 현재 블록이 디코딩된다. 그 다음, 현재 블록을 재구성하고 그 디코딩된 버전을 획득하기 위해 디코딩된 예측 잔차에 예측이 더해진다. 이어서, 현재 블록의 디코딩된 버전은 이미지의 다른 이웃 블록들을 공간적으로 예측하기 위해 또는 이미지 간 예측에 의해 다른 이미지들의 블록들을 예측하기 위해 나중에 사용될 수 있다.
본 발명의 특정 실시예에 따라, 제2 코딩 모드(M2)에 따라 블록을 코딩하기 위한 단계(E22)가 아래에서 설명된다. 여기서 설명되는 특정 실시예에 따르면, 제2 코딩 모드는 ILR 예측 코딩에 대응한다.
이전 단계(E220)에서, 양자화 스텝(δ 2)이 결정된다. 예를 들어, 양자화 스텝(δ 2)은, 현재 블록이 제1 코딩 모드에 따라 코딩되었다면 단계(E210)에서 결정될 양자화 스텝(δ 1)과 동일한 양자화 파라미터에 의존한다.
본 발명에 따르면, 이러한 코딩 모드에서, 현재 블록의 픽셀들은 제1 예측 모드 또는 제2 예측 모드에 따라 예측될 수 있다.
제1 예측 모드에 따르면, 현재 블록의 픽셀은 현재 블록의 이웃 블록의 이전에 재구성된 픽셀들 및/또는 현재 블록 자체의 이전에 처리된 픽셀들에 의해 예측된다. 바람직하게는, 픽셀을 예측하기 위해, 예측될 픽셀에 가능한 한 근접한 픽셀들이 선택된다. 이러한 이유로 이는 로컬 예측자로 지칭된다.
제2 예측 모드에 따르면, 현재 블록의 픽셀은 예를 들어, 현재 블록의 이웃으로부터 결정된 값들의 그룹에 의해 선택된 계층들의 레벨 값에 의해 예측된다.
단계(E221)에서는, 블록에서 일정한 픽셀 값들의 그룹이 이전에 디코딩된 픽셀들로부터 결정된다. 현재 블록의 여러 재구성 레벨들이 결정되는데, 예를 들어 f 및 b로 불리는 2개의 재구성 레벨들이 결정된다. 이러한 레벨들은 현재 블록의 기준 픽셀들, 즉 현재 블록에 이웃하는 이전에 처리된 블록들로부터의 픽셀들에 의해 취해진 값들을 분석함으로써 구성된다. 레벨들(f, b)을 결정하기 위한 여러 기술들이 있다. 따라서 기준 픽셀들의 값들의 히스토그램을 계산하고, b에 가장 빈번한 값을 할당하고 f에 두 번째로 가장 빈번한 값을 할당하는 것이 가능하다. 다른 접근법은 히스토그램의 로컬 최대치, 즉 더 작은 값들로 둘러싸인 가장 큰 값들을 식별하는 것에 있다. 그런 다음, 레벨(f)에는 최대 로컬 최대치가 할당되고 레벨 b에는 두 번째로 가장 큰 로컬 최대치가 할당된다.
더욱이, 본 발명의 특정 실시예에 따르면, 임계 값(thr)이 결정되며, 이는 통상적으로 f와 b 사이의 중간에 있고 로서 정의된다. 대안적인 실시예에서, 이 또한 선택될 수 있으며, 여기서 dyn은 신호의 최대 값이다.
블록에서 일정한 픽셀 값들의 그룹을 결정하기 위한 위에서 설명된 실시예 변형들은, 추가 정보를 송신할 필요 없이, 디코더에서 또한 구현될 수 있는 이미지 계층들의 암시적 검출을 가능하게 한다.
예를 들어, 이미지 계층들의 검출의 복잡성을 제한하기 위해, 현재 블록의 바로 이웃이 사용되는데: 예를 들어, 현재 블록 위의 라인의 그리고 좌측의 열의 픽셀들만이 사용된다.
다른 변형들에 따르면, 예를 들어 히스토그램의 다음의 로컬 최대치를 고려함으로써 2개보다 많은 값들이 결정될 수 있다.
이와 같이 결정된 값들(f, b)은 제2 예측 모드에 사용되는 값들의 그룹의 값들에 대응한다.
현재 블록의 각각의 픽셀에 대해 다음의 단계들이 실행된다.
단계(E2201)에서, 고려되는 픽셀에 대한 로컬 예측자(PL)가 결정된다. 이 로컬 예측자(PL)는 제1 예측 모드에 따라 획득된 예측자에 대응한다.
로컬 예측자(PL)는 다음과 같이 결정될 수 있다. 현재 블록(Xb)을 보여주는 도 3b에 예시된 바와 같이, X를 현재 블록의 예측될 현재 픽셀로, A를 X의 바로 좌측에 위치된 픽셀로, B를 X의 바로 좌측 및 위에 위치된 픽셀로, C를 X 바로 위에 위치된 픽셀로 부른다면. 로컬 예측자(PL)는 다음으로 정의되며:
PL(X) =
C ≥ max(A, B)라면 min(A,B)
C ≥ min(A,B)라면 max(A, B)
그렇지 않으면 A+B-C
여기서 min(A, B)는 A 값과 B 값 사이에서 가장 작은 값을 리턴하는 함수에 대응하고, max(A, B)는 A 값과 B 값 사이에서 가장 큰 값을 리턴하는 함수에 대응한다.
다른 로컬 예측 함수들이 사용될 수 있다. 다른 변형에 따르면, 여러 로컬 예측 함수들이 이용 가능할 수 있고, 현재 블록의 모든 픽셀들에 대해 동일한 로컬 예측 함수가 선택된다. 예를 들어, 이전에 코딩된 이웃 블록들의 픽셀들의 텍스처의 배향이 분석된다. 예를 들어, 현재 블록의 위에 또는 왼쪽에 위치되는 이웃 블록의 이전에 코딩된 픽셀들은 소벨(Sobel) 타입 연산자를 사용하여 분석된다. 다음과 같이 결정된다면:
- 배향이 나오지 않는다면, 예측 함수는 위에서 정의된 함수이고,
- 배향이 수평이라면, 예측 함수는 PL(X) = A이고,
- 배향이 수직이라면, 예측 함수는 PL(X) = B이고,
- 배향이 대각선이라면, 예측 함수는 PL(X) = C이다.
따라서 현재 블록의 현재 픽셀(X)과 연관된 예측 값(PL(X))은, 블록 외부의 이미 재구성된(그리고 이에 따라 이들의 디코딩된 값으로 이용 가능한) 픽셀들 또는 현재 블록에서 이전에 재구성된 픽셀들, 또는 이 둘 모두를 사용하여 현재 블록 내의 픽셀의 위치에 따라 획득된다. 모든 경우들에서, 예측자(PL)는 이전에 재구성된 픽셀들을 사용한다. 도 3b에서, 현재 블록의 첫 번째 행 및/또는 첫 번째 열 상에 위치된 현재 블록의 픽셀들은 블록 외부의 이미 재구성된 픽셀들(도 3b에서 회색의 픽셀들) 및 가능하게는 현재 블록의 이미 재구성된 픽셀들을 (예측 값(PL(X))을 구성하기 위한) 기준 픽셀들로서 사용할 것임이 확인될 수 있다. 현재 블록의 다른 픽셀들의 경우, 예측 값(PL(X))을 구성하는 데 사용되는 기준 픽셀들은 현재 블록 내부에 위치된다.
단계(E2202)에서, 제1 예측 모드 및 제2 예측 모드 중에서 현재 픽셀을 예측하는 데 사용될 예측 모드가 결정된다.
본 발명의 특정 실시예에 따르면, PL(X) < thr < X일 때 또는 PL(X) > thr > X일 때 제2 예측 모드가 선택된다. 즉, 다음의 경우에 제2 예측 모드가 선택된다:
- 픽셀의 원래 값(X)이 임계 값(thr)보다 크고 임계 값(thr)이 제1 예측 모드에 따라 결정된 픽셀과 연관된 예측 값(PL(X))보다 큰 경우, 또는
- 픽셀의 원래 값(X)이 임계 값(thr)보다 작고 임계 값(thr)이 제1 예측 모드에 따라 결정된 픽셀과 연관된 예측 값(PL(X))보다 작은 경우.
위의 조건들 중 하나가 충족된다면, 예측될 픽셀의 상태는 s = 3이고, 인코더는 다음 단계(E2203)로 진행한다.
단계(E2203)에서, 예측될 픽셀이 제2 예측 모드에 따라 예측됨을 표시하는 표시자(t)는 예를 들어, 1로 설정되고, 예를 들어 엔트로피 인코딩에 의해 데이터 스트림(STR)에서 인코딩되거나, 스트림에서 그대로 송신된다.
단계(E2204)에서는, 단계(E221)에서 결정된 값들의 그룹의 값이 현재 픽셀을 예측하도록 선택된다.
본 발명의 특정 실시예에 따르면, 그룹의 값은 단계(E221)에서 결정된 그룹 픽셀 값들과 관련하여, 제1 예측 모드에 따라 결정된 상기 픽셀과 연관된 예측 값 사이의 거리에 따라 선택된다. 예를 들어, 제1 예측 모드에 따른 상기 픽셀과 연관된 예측 값(PL(X))과 그룹의 값(b) 사이의 거리가 제1 예측 모드에 따라 상기 픽셀과 연관된 예측 값(PL(X))과 값(f) 사이의 거리 미만일 때, 선택된 값은 b이고, 그렇지 않으면 선택된 값은 f이다.
L1 또는 L2 표준이 예를 들어, 거리 측정으로서 사용될 수 있다.
따라서 |PL(X) - b| < |PL(X) - f|라면, PL(X) = b이고, 그렇지 않으면 PL(X) = f이다.
이어서, 방법은 단계(E2205)로 진행한다.
단계(E2202)에서, 현재 픽셀이 제2 예측 모드에 따라 예측되지 않는다고 결정된다면, 현재 픽셀은 제1 예측 모드에 따라 예측된다. 그 다음, 현재 픽셀과 연관되며 제1 예측 모드에 따라 획득된 예측 값(PL(X))은 수정되지 않는다. 그런 다음, 현재 픽셀은 s = 1 또는 s = 2 상태이다.
단계(E2205)에서, 현재 픽셀의 원래 값(X)과 현재 픽셀과 연관된 예측 값(PL(X)) 간의 차이로서 현재 픽셀에 대해 예측 잔차(R1(X))가 계산되는데, 즉 R1(X)=X-PL(X)이다. 여기서 예측 값(PL(X))은 제1 예측 모드에 의해 또는 제2 예측 모드에 의해 획득되었을 수 있다.
그 다음, 예측 잔차(R1(X))가 양자화 스텝 스칼라 양자화기(δ 2)로 Q(X) = ScalarQuant(R1(X)) = ScalarQuant(δ 2,X - PL(X))에 의해 Q(X)로 양자화되며, 스칼라 양자화기는 예를 들어, 최근접 이웃 스칼라 양자화기, 이를테면: 이며, 여기서 Δ는 양자화 스텝이고 x는 양자화될 값이다.
Q(X)는 X와 연관된 양자화된 잔차이다. 이는 공간 도메인에서 계산되는데, 즉 픽셀(X)의 예측 값(PL(X))과 X의 원래 값 간의 차이로부터 직접적으로 계산된다. 픽셀(X)에 대한 이러한 양자화된 잔차(Q(X))는 나중에 코딩될 양자화된 예측 잔차 블록(R1Q)에 저장된다.
단계(E2206)에서, 예측 값(PL(X))에 양자화된 잔차(Q(X))의 역양자화된 값을 더함으로써 X의 디코딩된 예측 값(P1(X))이 계산된다. 따라서 X의 디코딩된 예측 값(P1(X))은 P1(X) = PL(X) + ScalarDequant(δ 2 ,Q(X))에 의해 획득된다. 예를 들어, 최근접 스칼라 양자화 역함수는: ScalarDequant(Δ,x)=Δ×x로 주어진다.
따라서 디코딩된 예측 값(P1(X))은 현재 블록에서 아직 처리되어야 하는 가능한 픽셀들을 예측하는 것을 가능하게 한다.
더욱이, 현재 블록의 픽셀들의 디코딩된/재구성된 값들(P1(X))을 포함하는 블록(P1)이 정의될 수 있다. 이러한 블록(P1)은 (종래의 인트라 예측자와는 대조적으로) 현재 블록의 ILR 예측자이다.
본 발명의 특정 실시예에 따르면, 단계(E2207)에서, 양자화된 예측 잔차(Q1(X))가 0이 아닐 때, 즉 양자화된 예측 잔차(Q1(X))의 진폭(a)이 0이 아닐 때, 표시자(t)는 예를 들어, 0으로 설정되고, 데이터 스트림(STR)으로 코딩된다. 이 경우, 현재 픽셀은 s = 2 상태인 것으로 간주된다.
본 발명의 이러한 특정 실시예에 따르면, 양자화된 예측 잔차(Q1(X))가 0일 때, 즉 양자화된 예측 잔차(Q1(X))의 진폭(a)이 0일 때, 현재 픽셀이 제2 예측 모드에 의해 예측되지 않기 때문에 표시자(t)는 또한 0으로 설정되지만, 표시자(t)는 데이터 스트림(STR)으로 코딩되지 않는다. 이 예측 모드는 양자화된 예측 잔차(Q1(X))의 진폭의 디코딩된 값으로부터 디코더에서 암시적으로 추론될 것이다. 이 경우, 현재 픽셀은 s = 1 상태인 것으로 간주된다. 이 경우, 방법은 단계(E2206)에서 직접 단계(E223)로 진행한다.
물론, 실제로, 표시자(t)가 명시적으로 코딩될 때는(s = 2 또는 s = 3), 양자화된 예측 잔차(Q1(X))가 코딩된 후에 표시자(t)가 데이터 스트림으로 코딩된다.
본 발명의 다른 특정 실시예에 따르면, 표시자(t)는 0으로 설정되고, 예측 잔차(Q1(X))의 진폭(a)의 값에 관계없이, 각각의 픽셀에 대해 단계(E2207)에서 데이터 스트림(STR)으로 체계적으로 코딩된다. 따라서 디코더에서, 양자화된 예측 잔차의 값에 관계없이, 표시자(t)를 판독함으로써, 현재 픽셀이 제2 예측 모드에 따라 예측되는지 여부가 디코더에 의해 명시적으로 결정된다. 이 경우, 픽셀이 s = 1 상태인지 또는 s = 2 상태인지는 구별되지 않는다.
본 발명의 이러한 특정 실시예에서 변형에 따르면, 표시자(t)가 체계적으로 코딩되기 때문에, 단계(E2202)에서, 제1 예측 모드 및 제2 예측 모드 중 현재 픽셀을 예측하는 데 사용될 예측 모드의 결정은 예를 들어, 제1 예측 모드에 의해 제공된 예측 값과 현재 픽셀의 원래 값(X) 사이의 거리 측정과 제2 예측 모드에 의해 제공된 예측 값과 현재 픽셀의 원래 값(X) 사이의 거리 측정을 비교함으로써 이루어질 수 있다.
위에서 설명된 단계들은, 로컬 예측에 사용되는 픽셀들이 이용 가능함을 보장하는 스캐닝 순서로, 현재 블록의 모든 픽셀들에 대해 수행된다.
실시예 변형에 따르면, 현재 블록의 스캐닝 순서는 사전식 순서, 즉 왼쪽에서 오른쪽 그리고 위에서 아래이다.
다른 실시예 변형에 따르면, 현재 블록의 여러 스캐닝 순서들이 사용될 수 있는데, 예를 들어:
- 사전식 순서, 또는
- 첫 번째 열을 위에서 아래로 스캐닝하고, 이어서 열을 그 바로 오른쪽으로 스캐닝하는 등, 또는
- 대각선들을 차례로 스캐닝하는 것.
이러한 다른 변형에 따르면, 스캐닝 순서들 각각과 연관된 코딩 비용을 시뮬레이션하고, 레이트/왜곡의 관점에서 현재 블록에 대한 최상의 스캐닝 순서를 선택한 다음, 현재 블록에 대해, 선택된 스캐닝 순서를 나타내는 정보 항목을 코딩하는 것이 가능하다.
단계(E2205)의 끝에서, 양자화된 잔차 블록(R1Q)이 결정되었다. 이 양자화된 잔차 블록(R1Q)은 디코더로의 송신을 위해 코딩되어야 한다. 현재 블록의 예측자(P1)가 또한 결정되었다.
단계(E223)에서, 양자화된 잔차 블록(R1Q)은 디코더로의 송신을 위해 코딩된다. HEVC에서 설명된 방법과 같은 임의의 알려진 접근법이 종래의 예측 잔차의 양자화된 계수들을 코딩하는 데 사용될 수 있다.
표준 방식으로, 현재 블록의 각각의 양자화된 예측 잔차(Q1(X))는 진폭(a)이 0과 구별될 때 진폭 값(a)과 부호 표시자(sgn)로 분해된다.
여기서 설명되는 본 발명의 특정 실시예에 따르면, 양자화된 잔차 블록(R1Q)의 진폭 및 부호 값들은 데이터 스트림(STR)의 엔트로피 인코더를 사용하여 코딩된다.
본 발명의 특정 실시예에 따르면, 현재 블록에 대해 획득된 ILR 예측자로부터 추가 예측 잔차(R2)를 결정하고 코딩하는 것이 가능하다. 그러나 추가 예측 잔차(R2)의 코딩은 선택적이다. 현재 블록을 그의 예측된 버전(P1) 및 양자화된 잔차(R1Q)에 의해 단순히 코딩하는 것이 실제로 가능하다.
현재 블록에 대한 추가 예측 잔차(R2)를 코딩하기 위해, 다음의 단계들이 구현된다.
단계(E224)에서, 예측자(P1)와 원래의 현재 블록(Xb) 간의 차이(R2)가 계산되어 추가 잔차(R2: R2= Xb-P1)를 형성한다. 다음의 단계들은 이 잔차(R2)에 대한 종래의 코딩 단계들에 대응한다.
단계(E225)에서, 계수들의 블록(R2T)을 생성하기 위해 주파수 변환을 사용하여 잔차(R2)가 변환된다.
변환은 예를 들어 DCT 타입 변환일 수 있다. 미리 결정된 세트의 변환들(ET2) 중에서 사용될 변환을 선택하고, 사용된 변환을 디코더에 통지하는 것이 가능하다. 이 경우, 잔차(R2)의 특정 통계치에 적응하기 위해 세트(ET2)는 세트(ET)와 다를 수 있다.
단계(E226)에서, 계수들의 블록(R2T)이 예를 들어, 양자화 스텝 스칼라 양자화(δ)를 사용하여 양자화된다. 이는 블록(R2TQ)을 생성한다.
양자화 스텝(δ)은 사용자에 의해 설정될 수 있다. 이는 또한, 압축과 품질 간의 절충을 설정하는 파라미터(λ)를 사용하여 계산되고 사용자 또는 인코더에 의해 입력될 수 있다. 예를 들어, 양자화 스텝(δ)은 양자화 스텝(δ 1)에 대응하거나 양자화 스텝(δ 1)과 유사하게 결정될 수 있다.
그런 다음, 단계(E227)에서, 양자화된 블록(R2TQ)의 계수들이 코딩된 방식으로 송신된다. 예를 들어, HEVC 표준에 특정된 코딩이 사용될 수 있다.
알려진 방식으로, 양자화된 블록(R2TQ)의 계수들을 역양자화한 다음, 역양자화된 계수들에 역변환을 적용하여 디코딩된 예측 잔차를 획득함으로써 현재 블록이 디코딩된다. 그 다음, 현재 블록을 재구성하고 그 디코딩된 버전(Xrec)을 획득하기 위해 디코딩된 예측 잔차에 예측(P1)이 더해진다. 이어서, 현재 블록의 디코딩된 버전(Xrec)은 이미지의 다른 이웃 블록들을 공간적으로 예측하기 위해 또는 이미지 간 예측에 의해 다른 이미지들의 블록들을 예측하기 위해 나중에 사용될 수 있다.
단계(E23)에서, 이전에 정의된 스캐닝 순서를 고려하여, 현재 블록이 코딩 방법에 의해 처리될 이미지의 마지막 블록인지 여부가 체크된다. 현재 블록이 처리될 이미지의 마지막 블록이 아니라면, 단계(E24)에서, 처리될 이미지의 후속 블록이 이미지의 이전에 정의된 스캐닝 순서에 따라 선택되고, 코딩 방법은 단계(E2)로 진행하며, 여기서 선택된 블록은 처리될 현재 블록이 된다.
이미지의 모든 블록들이 코딩되었다면, 방법은 단계(E231)에서 재구성된 이미지에 적용될 후처리 방법들의 적용으로 진행한다. 예를 들어, 이러한 후처리 방법들은 HEVC 표준에 정의된 바와 같은 블록 분리(deblocking) 필터링 및/또는 SAO(Sample Adaptive Offset) 방법일 수 있다.
이 방법은, 만약 있다면, 비디오의 다음 이미지를 코딩하는 것(단계(E25))으로 진행한다.
도 2a 및 도 2b는 본 발명의 상이한 특정 실시예들에 따른, 위에서 설명된 바와 같은 코딩으로부터 야기되는 데이터 스트림의 일부를 개략적으로 예시한다.
도 2a는 본 발명의 특정 실시예에 따라 코딩된 이미지의 블록의 3개의 픽셀들(X1, X2, X3)에 대한 스트림의 일례를 예시하며, 여기서 픽셀(X1)은 s = 3 상태인 것으로 간주되고, 픽셀(X2)은 s = 2 상태인 것으로 간주되고, 픽셀(X3)은 s = 1 상태인 것으로 간주된다고 결정되었다.
여기서 설명된 변형에 따르면, 픽셀(X1)에 대해 코딩된 데이터는 양자화된 예측 잔차의 진폭 값(a(X1)), 그 부호(sgn(X1)) 및 1로 설정된 표시자(t)의 값이라는 것이 확인될 수 있다. 픽셀(X2)에 대해 코딩된 데이터는 양자화된 예측 잔차의 진폭 값(a(X2)), 그 부호(sgn(X2)) 및 표시자(t)의 값이다. X2의 경우, 양자화된 예측 잔차의 진폭 값이 0과 구별되면, 0으로 설정된 표시자(t)가 스트림으로 명시적으로 코딩된다.
픽셀(X3)에 대해 코딩된 데이터는 0인 양자화된 예측 잔차의 진폭 값(a(X3))이다. 이 경우, 양자화된 예측 잔차의 진폭 값은 0과 구별되므로, 0으로 설정된 표시자(t)는 스트림으로 명시적으로 코딩되지 않으며, 디코더에서 암시적으로 추론될 것이다.
도 2b는 본 발명의 다른 특정 실시예에 따라 코딩된 이미지의 블록의 3개의 픽셀들(X1, X2, X3)에 대한 스트림의 일례를 예시하며, 여기서 픽셀(X1)은 s = 3 상태인 것으로 간주되고, 픽셀(X2)은 s = 2 상태인 것으로 간주되고, 픽셀(X3)은 s = 1 상태인 것으로 간주된다고 결정되었다.
여기서 설명된 변형에 따르면, 픽셀(X1)에 대해 코딩된 데이터는 양자화된 예측 잔차의 진폭 값(a(X1)), 그 부호(sgn(X1)) 및 1로 설정된 표시자(t)의 값이라는 것이 확인될 수 있다. 픽셀(X2)에 대해 코딩된 데이터는 양자화된 예측 잔차의 진폭 값(a(X2)), 그 부호(sgn(X2)) 및 0으로 설정된 표시자(t)의 값이라는 것이 확인될 수 있다.
픽셀(X3)에 대해 코딩된 데이터는 0인 양자화된 예측 잔차의 진폭 값(a(X3)) 및 0으로 설정된 표시자(t)이다.
도 4는 본 발명의 특정 실시예에 따라 디코딩될 이미지들(I1, I2, …, INb)의 시퀀스를 나타내는 코딩된 데이터의 스트림(STR)을 디코딩하기 위한 방법의 단계들을 도시한다.
예를 들어, 데이터 스트림(STR)은 도 1과 관련하여 도시된 코딩 방법을 통해 생성되었다. 도 8과 관련하여 설명되는 바와 같이, 데이터 스트림(STR)은 디코딩 디바이스(DEC)에 대한 입력으로서 제공된다.
디코딩 방법은 이미지 단위로 스트림 이미지를 디코딩하고, 각각의 이미지는 블록 단위로 디코딩된다.
단계(E40)에서, 디코딩될 이미지(Ij)는 블록들로 세분된다. 각각의 블록은 이후에 상세히 설명되는 일련의 단계들에 있는 디코딩 동작을 거칠 것이다. 블록들은 동일한 크기이거나 상이한 크기들일 수 있다.
단계(E41)에서, 이미지(Ij)의 디코딩될 제1 블록 또는 서브블록(X b )이 이미지(Ij)의 미리 결정된 스캐닝 순서에 따라 현재 블록으로서 선택된다. 예를 들어, 이는 이미지의 사전식 스캐닝 순서에서의 첫 번째 블록일 수 있다.
단계(E42)에서, 현재 블록에 대한 코딩 모드를 표시하는 정보 항목이 데이터 스트림(STR)으로부터 판독된다. 여기서 설명되는 특정 실시예에 따르면, 이 정보 항목은 현재 블록이 제1 코딩 모드(M1)에 따라 코딩되는지 또는 제2 코딩 모드(M2)에 따라 코딩되는지를 표시한다. 여기서 설명되는 특정 실시예에 따르면, 제1 코딩 모드(M1)는 예를 들어, HEVC 표준에 따라 정의된 현재 블록의 종래의 인트라 예측 코딩에 대응하고, 제2 코딩 모드(M2)는 루프 내 잔차(ILR) 예측 코딩에 대응한다.
다른 특정 실시예들에서, 스트림(STR)으로부터 판독된 정보 항목은 또한 (여기서 설명되지 않는) 현재 블록을 코딩하기 위한 다른 코딩 모드들의 사용을 표시할 수 있다.
현재 블록이 제1 코딩 모드(M1)에 따라 코딩될 때 현재 블록을 디코딩하기 위한 단계(E43)가 아래에서 설명된다.
단계(E430)에서, 양자화 스텝(δ 1)이 결정된다. 예를 들어, 양자화 스텝(δ 1)은 데이터 스트림(STR)에서 송신된 양자화 파라미터(QP)로부터 또는 인코더에서 행해진 것과 유사하게 결정된다. 예를 들어, 양자화 파라미터(QP)는 종래에 AVC 또는 HEVC 표준들에서 사용되는 양자화 파라미터일 수 있다. 따라서 HEVC 표준에서, 양자화 스텝(δ 1)은 식 δ 1 = levelScale[QP%6] << (QP/6)에 의해 결정되며, 여기서 k = 0..5에 대해 levelScale[ k ] = { 40, 45, 51, 57, 64, 72 }이다.
단계(E431)에서, 현재 블록을 코딩하도록 선택된 예측 모드가 이웃 블록들로부터 디코딩된다. 이러한 목적으로, 인코더에서 행해진 바와 같이, 현재 블록에 대해 선택된 인트라 예측 모드가 현재 블록의 이웃 블록들과 연관된 인트라 예측 모드들을 사용하여 코딩된다.
MPM 리스트와 비-MPM 리스트들 모두의 구성은 코딩 중에 행해진 것과 엄격하게 유사하다. HEVC 표준에 따르면, 다음 타입의 신택스 엘리먼트들이 디코딩된다:
- 현재 블록에 대해 코딩될 예측 모드가 MPM 리스트에 있는지 여부를 표시하는 이진 표시자,
- 현재 블록의 예측 모드가 MPM 리스트에 속한다면, 현재 블록의 예측 모드에 대응하는 MPM 리스트 내의 인덱스가 판독되고,
- 현재 블록의 예측 모드가 MPM 리스트에 속하지 않는다면, 현재 블록의 예측 모드에 대응하는 비-MPM 리스트 내의 인덱스가 판독된다.
따라서 데이터 스트림(STR)으로부터 현재 블록에 대해 이진 표시자 및 예측 모드 인덱스가 판독되어, 현재 블록의 인트라 예측 모드를 디코딩한다.
단계(E432)에서, 디코더는 디코딩된 예측 모드로부터 현재 블록에 대한 예측된 블록(P)을 구성한다.
단계(E433)에서, 디코더는 예를 들어, HEVC 표준에 특정된 디코딩을 사용하여, 데이터 스트림(STR)으로부터 양자화된 블록(RTQ)의 계수들을 디코딩한다.
단계(E434)에서, 디코딩된 블록(RTQ)은 예를 들어, 양자화 스텝 스칼라 역양자화(δ 1)를 사용하여 역양자화된다. 이는 역양자화된 계수들의 블록(RTQD)을 생성한다.
단계(E435)에서는, 디코딩된 예측 잔차 블록(RTQDI)을 생성하기 위해 역양자화된 계수들의 블록(RTQD)에 주파수 역변환이 적용된다. 변환은 예를 들어 DCT 타입 역변환일 수 있다. 데이터 스트림(STR)으로부터 표시자를 디코딩함으로써, 미리 결정된 세트의 변환들(ETI) 중에서 사용될 변환을 선택하는 것이 가능하다.
단계(E436)에서, 디코딩된 현재 블록(Xrec)을 Xrec = P + RTQDI에 의해 생성하기 위해, 단계(E432)에서 획득된 예측된 블록(P) 및 단계(E435)에서 획득된 디코딩된 잔차 블록(RTQDI)으로부터 현재 블록이 재구성된다.
현재 블록이 제2 코딩 모드(M2)에 따라 코딩될 때 현재 블록을 디코딩하기 위한 단계(E44)가 아래에서 설명된다.
단계(E440)에서는, 인코더에서 행해진 것과 유사하게 양자화 스텝(δ 2)이 결정된다.
본 발명에 따르면, 이러한 코딩 모드(M2)에서, 현재 블록의 픽셀들은 도 1과 관련하여 이미 제시된 제1 예측 모드 또는 제2 예측 모드에 따라 예측될 수 있다.
단계(E441)에서는, 블록에서 일정한 픽셀 값들의 그룹이 인코더에서 행해진 것과 유사하게 이미지의 이전에 디코딩된 픽셀들로부터 결정된다. 레벨 값들(f, b)이 결정된 것은 인코더에서와 같이 고려된다.
현재 블록의 각각의 픽셀에 대해 다음의 단계들이 실행된다.
단계(E4411)에서, 제1 예측 모드에 따른 현재 픽셀의 예측 값이 결정된다. 이러한 목적으로, 인코더에서와 동일한 로컬 예측자(PL)가 사용된다. 여러 로컬 예측자들이 가능할 때, 로컬 예측자(PL)는 인코더에서 행해진 것과 유사하게 결정된다.
단계(E442)에서, 양자화된 잔차(R1Q)가 데이터 스트림(STR)으로부터 디코딩된다. HEVC에서 설명된 방법과 같은 임의의 알려진 접근법이 종래의 예측 잔차의 양자화된 계수들을 디코딩하는 데 사용될 수 있다. 그 다음, 현재 픽셀에 대한 양자화된 예측 잔차(Q1'(X))의 진폭(a)이 획득된다.
본 발명의 특정 실시예에 따르면, 단계(E4421)에서, 양자화된 예측 잔차(Q1'(X))의 진폭(a)이 0일 때, 현재 픽셀이 제2 예측 모드에 따라 예측되는지 여부를 표시하는 표시자(t)가 암시적으로 0으로 설정된다. 이 경우, 현재 픽셀은 s = 1 상태인 것으로 간주되고, 제1 예측 모드로부터 야기되는 예측 값에 의해 현재 픽셀이 예측될 것이다. 그런 다음, 양자화된 예측 잔차(Q1’(X))가 Q1'(X) = 0에 의해 재구성된다.
그렇지 않으면, 양자화된 예측 잔차(Q1'(X))의 진폭(a)이 0이 아닐 때, 양자화된 예측 잔차(Q1'(X))와 연관된 부호(sgn)가 데이터 스트림(STR)에서 판독된다. 그런 다음, 양자화된 예측 잔차(Q1’(X))가 Q1'(X) = a×sgn에 의해 재구성된다.
그 다음, 단계(E4422)에서, 현재 픽셀에 대한 표시자(t)가 데이터 스트림(STR)에서 판독된다. 표시자(t) 판독 값이 0이라면, 현재 픽셀의 상태는 s = 2이다. 표시자(t) 판독 값이 1이라면, 현재 픽셀의 상태는 s = 3이다.
본 발명의 다른 특정 실시예에 따르면, 표시자(t)는 현재 블록의 각각의 픽셀에 대해 체계적으로 코딩된다. 이 경우, 단계(E4422)에서, 표시자(t)의 값(0 또는 1)이 데이터 스트림(STR)에서 판독되고, 그에 따라 픽셀(s)의 상태가 설정된다.
현재 픽셀의 상태가 s = 3일 때, 현재 픽셀은 제2 예측 모드에 따라 예측된다. 이 경우, 단계(E4423)에서는, 단계(E441)에서 결정된 값들의 그룹의 값이 선택되고 현재 픽셀과 연관된 예측 값(PL(X))에 할당되어, 인코더에서 수행된 것과 유사하게 현재 픽셀을 예측한다. 예를 들어, |PL(X) - b| < |PL(X) - f|라면, PL(X) = b이고, 그렇지 않으면 PL(X) = f이다.
이어서, 방법은 단계(E443)로 진행한다.
현재 픽셀의 상태가 s = 2 또는 s = 1일 때, 현재 픽셀은 제1 예측 모드에 따라 예측된다. 이 경우, 단계(E4411)에서 제1 예측 모드에 따라 결정된 현재 픽셀의 예측 값(PL(X))은 변경되지 않는다.
단계(E443)에서, 역양자화된 잔차(QD1(X))를 생성하기 위해, 양자화된 잔차(Q1’(X))가 양자화 스텝(δ 2)을 사용하여 역양자화된다.
단계(E444)에서, 현재 픽셀(X')의 재구성된 값은 단계(E4411 또는 E4423)에서 결정된 예측 값(PL(X)) 및 역양자화된 예측 잔차(QD1(X))를 사용하여 획득된다: X'=PL(X)+QD1(X).
현재 블록의 픽셀들의 예측 잔차들(Q1(X))은 예측 잔차 블록(R1Q)에 배치되고, 현재 블록의 픽셀들의 역양자화된 예측 잔차들(QD1(X))은 역양자화된 예측 잔차 블록(R1QD)에 배치되고, 현재 블록의 픽셀들의 재구성된 값들(X')은 재구성된 블록(P1)에 배치된다.
위의 단계들은, 로컬 예측에 사용되는 픽셀들이 이용 가능함을 보장하는 스캐닝 순서로, 현재 블록의 모든 픽셀들에 대해 구현된다.
예를 들어, 스캐닝 순서는 사전식 순서이다(왼쪽에서 오른쪽으로, 그 다음 위에서부터 아래의 행).
본 발명의 특정 실시예에 따르면, 현재 블록의 각각의 픽셀의 재구성된 값들(PL(X)+QD1(X))을 포함하는 블록(P1)이 여기서 디코딩된 현재 블록(Xrec)을 형성한다.
본 발명의 다른 특정 실시예에 따르면, 현재 블록에 대해 추가 예측 잔차가 코딩된 것으로 간주된다. 따라서 현재 블록(Xrec)의 디코딩된 버전을 재구성하기 위해 이러한 추가 예측 잔차를 디코딩할 필요가 있다.
예를 들어, 이 다른 특정 실시예는 인코더 및 디코더 레벨에서 디폴트로 활성화되거나 활성화되지 않을 수 있다. 또는, ILR 코딩 모드에 따라 코딩된 각각의 블록에 대해 추가 예측 잔차가 코딩되는지 여부를 표시하기 위해 블록 레벨 정보를 이용하여 데이터 스트림으로 표시자가 코딩될 수 있다. 또는 추가로, ILR 코딩 모드에 따라 코딩된 이미지의 또는 이미지들의 시퀀스의 모든 블록들에 대해 추가 예측 잔차가 코딩되는지 여부를 표시하기 위해 이미지 또는 이미지들의 레벨 정보를 이용하여 데이터 스트림으로 표시자가 코딩될 수 있다.
현재 블록에 대해 추가 예측 잔차가 코딩될 때, 단계(E445)에서는, 인코더에서 구현되는 것들에 적응된 수단, 예를 들어 HEVC 디코더에서 구현된 수단을 사용하여, 양자화된 예측 잔차(R2TQ)의 계수들이 데이터 스트림(STR)으로부터 디코딩된다.
단계(E446)에서, 양자화된 계수들의 블록(R2TQ)이 예를 들어, 양자화 스텝 스칼라 역양자화(δ 1)를 사용하여 역양자화된다. 이는 역양자화된 계수들의 블록(R2TQD)을 생성한다.
단계(E447)에서, 디코딩된 예측 잔차 블록(R2TQDI)을 생성하기 위해 블록(R2TQD)에 주파수 역변환이 적용된다.
역변환은 예를 들어 DCT 타입 역변환일 수 있다.
미리 결정된 세트의 변환들(ET2) 중에서 사용될 변환을 선택하고, 사용될 변환을 디코더에 통지하는 정보 항목을 디코딩하는 것이 가능하다. 이 경우, 잔차(R2)의 특정 통계치에 적응하기 위해 세트(ET2)는 세트(ET)와 다르다.
단계(E448)에서는, 단계(E444)에서 획득된 예측된 블록(P1)을 디코딩된 예측 잔차(R2TQDI)에 추가함으로써 현재 블록이 재구성된다.
단계(E45)에서, 이전에 정의된 스캐닝 순서를 고려하여, 현재 블록이 디코딩 방법에 의해 처리될 이미지의 마지막 블록인지 여부가 체크된다. 현재 블록이 처리될 이미지의 마지막 블록이 아니라면, 단계(E46)에서, 처리될 이미지의 후속 블록이 이미지의 이전에 정의된 스캐닝 순서에 따라 선택되고 디코딩 방법은 단계(E42)로 진행하며, 선택된 블록은 처리될 현재 블록이 된다.
이미지의 모든 블록들이 코딩되었다면, 방법은, 만약 요구된다면, 단계(E451)에서 재구성된 이미지에 적용될 후처리 방법들의 적용으로 진행한다. 이러한 후처리 방법들은 블록 분리 필터링 및/또는 SAO 방법일 수 있다.
그 다음, 이 방법은, 만약 있다면, 비디오의 다음 이미지를 디코딩하는 것(단계(E47))으로 진행한다.
도 7은 본 발명의 특정 실시예들 중 임의의 실시예에 따른 코딩 방법을 구현하도록 적응된 코딩 디바이스(COD)의 단순화된 구조를 도시한다.
본 발명의 특정 실시예에 따르면, 코딩 방법의 단계들은 컴퓨터 프로그램 명령들에 의해 구현된다. 이러한 목적으로, 코딩 디바이스(COD)는 컴퓨터의 표준 아키텍처를 가지며, 특히 메모리(MEM), 예를 들어 프로세서(PROC)가 장착되고 메모리(MEM)에 저장된 컴퓨터 프로그램(PG)에 의해 구동되는 처리 유닛(UT)을 포함한다. 컴퓨터 프로그램(PG)은, 프로그램이 프로세서(PROC)에 의해 실행될 때, 위에서 설명된 코딩 방법의 단계들을 구현하기 위한 명령들을 포함한다.
초기화 시에, 컴퓨터 프로그램(PG)의 코드 명령들은 프로세서(PROC)에 의해 실행되기 전에, 예를 들어 (도시되지 않은) RAM 메모리에 로딩된다. 특히, 처리 유닛(UT)의 프로세서(PROC)는 컴퓨터 프로그램(PG)의 명령들에 따라, 위에서 설명된 코딩 방법의 단계들을 구현한다.
도 8은 본 발명의 특정 실시예들 중 임의의 실시예에 따른 디코딩 방법을 구현하도록 적응된 디코딩 디바이스(DEC)의 단순화된 구조를 도시한다.
본 발명의 특정 실시예에 따르면, 디코딩 디바이스(DEC)는 컴퓨터의 표준 아키텍처를 가지며, 특히 메모리(MEM0), 예를 들어 프로세서(PROC0)가 장착되고 메모리(MEM0)에 저장된 컴퓨터 프로그램(PG0)에 의해 구동되는 처리 유닛(UT0)을 포함한다. 컴퓨터 프로그램(PG0)은, 프로그램이 프로세서(PROC0)에 의해 실행될 때, 위에서 설명된 디코딩 방법의 단계들을 구현하기 위한 명령들을 포함한다.
초기화 시에, 컴퓨터 프로그램(PG0)의 코드 명령들은 프로세서(PROC0)에 의해 실행되기 전에, 예를 들어 (도시되지 않은) RAM 메모리에 로딩된다. 특히, 처리 유닛(UT0)의 프로세서(PROC0)는 컴퓨터 프로그램(PG0)의 명령들에 따라, 위에서 설명된 디코딩 방법의 단계들을 구현한다.
Claims (12)
- 적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 방법으로서,
상기 이미지는 블록들로 분할되고,
상기 디코딩하기 위한 방법은, 현재 블록으로 지칭되는, 상기 이미지의 적어도 하나의 블록에 대해:
- 이전에 디코딩된 픽셀들로부터 상기 블록 내의 픽셀 값들의 그룹을 결정하는 단계(E441),
- 상기 블록의 각각의 픽셀에 대해:
(ⅰ) 상기 픽셀과 연관된 예측 잔차를 디코딩하는 단계(E442),
(ⅱ) 제1 예측 모드에 따라 상기 픽셀과 연관된 예측 값을 결정하는 단계(E4411) ― 상기 제1 예측 모드에 따라 적어도 하나의 다른 이전에 디코딩된 픽셀로부터 상기 픽셀이 예측되고, 상기 다른 이전에 디코딩된 픽셀은 상기 현재 블록에 속함 ―,
(ⅲ) 제2 예측 모드에 따라 상기 픽셀이 예측되는지 여부를 표시하는 정보 항목을 상기 데이터 스트림으로부터 디코딩하는 단계(E4422) ― 상기 블록에서 상기 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 상기 제2 예측 모드에 따라 상기 픽셀이 예측됨 ―,
(ⅳ) 상기 정보 항목이 상기 제2 예측 모드에 따라 상기 픽셀이 예측됨을 표시할 때:
(a) 상기 그룹의 값을 선택하는 단계(E4423),
(b) 상기 픽셀과 연관된 예측 값을 상기 선택된 값으로 대체하는 단계(E4423),
(ⅴ) 상기 픽셀과 연관된 예측 값 및 상기 예측 잔차를 사용하여 상기 픽셀을 재구성하는 단계(E444)를 포함하는,
적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 방법. - 적어도 하나의 이미지를 나타내는 데이터 스트림을 코딩하기 위한 방법으로서,
상기 이미지는 블록들로 분할되고,
상기 코딩하기 위한 방법은, 현재 블록으로 지칭되는, 상기 이미지의 적어도 하나의 블록에 대해:
- 이전에 디코딩된 픽셀들로부터 상기 블록 내의 픽셀 값들의 그룹을 결정하는 단계(E221),
- 상기 블록의 각각의 픽셀에 대해:
(ⅰ) 제1 예측 모드에 따라 상기 픽셀과 연관된 예측 값을 결정하는 단계(E2201) ― 상기 제1 예측 모드에 따라 적어도 하나의 다른 이전에 디코딩된 픽셀로부터 상기 픽셀이 예측되고, 상기 다른 이전에 디코딩된 픽셀은 상기 현재 블록에 속함 ―,
(ⅱ) 상기 블록에서 상기 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 상기 픽셀이 예측되는, 상기 픽셀에 대한 예측 모드를 상기 제1 예측 모드 및 제2 예측 모드 중에서 결정하는 단계(E2202),
(ⅲ) 상기 제2 예측 모드에 따라 상기 픽셀이 예측되는지 여부를 표시하는 정보 항목을 상기 데이터 스트림으로 코딩하는 단계(E2203, E2207),
(ⅳ) 상기 정보 항목이 상기 제2 예측 모드에 따라 상기 픽셀이 예측됨을 표시할 때:
(a) 상기 그룹의 값을 선택하는 단계(E2204),
(b) 상기 픽셀과 연관된 예측 값을 상기 선택된 값으로 대체하는 단계(E2204),
(ⅴ) 상기 픽셀과 연관된 예측 값 및 상기 픽셀의 값을 사용하여 상기 픽셀과 연관된 양자화된 예측 잔차를 계산하는 단계(E2205),
(ⅵ) 상기 픽셀과 연관된 예측 값 및 상기 디코딩된 예측 잔차를 사용하여 상기 픽셀을 재구성하는 단계(E2206),
(ⅶ) 상기 픽셀과 연관된 양자화된 예측 잔차를 상기 데이터 스트림으로 코딩하는 단계(E223)를 포함하는,
적어도 하나의 이미지를 나타내는 데이터 스트림을 코딩하기 위한 방법. - 제1 항 또는 제2 항에 있어서,
사용될 상기 그룹의 값은 상기 그룹의 픽셀 값들과 비교하여 상기 픽셀과 연관된 예측 값 사이의 거리에 따라 선택되는,
적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 방법 또는 코딩하기 위한 방법. - 제3 항에 있어서,
상기 그룹은 제1 값 및 제2 값을 포함하며,
상기 픽셀과 연관된 예측 값과 상기 제1 값 사이의 거리가 상기 픽셀과 연관된 예측 값과 상기 제2 값 사이의 거리 미만일 때, 상기 그룹의 선택된 값은 제1 값이고, 그렇지 않으면 상기 그룹의 선택된 값은 제2 값인,
적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 방법 또는 코딩하기 위한 방법. - 제1 항 또는 제2 항에 있어서,
상기 제2 예측 모드에 따라 상기 픽셀이 예측되는지 여부를 표시하는 정보 항목을 상기 데이터 스트림으로부터 디코딩하는 단계 또는 상기 데이터 스트림으로 코딩하는 단계는 상기 예측 잔차가 0과 다른 경우에만 수행되는,
적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 방법 또는 코딩하기 위한 방법. - 제1 항 또는 제2 항에 있어서,
이전에 디코딩된 픽셀들로부터 상기 블록 내의 픽셀 값들의 그룹을 결정하는 단계는, 이전에 재구성된 현재 블록의 이웃 픽셀들의 값들의 히스토그램을 계산하고 상기 현재 블록의 이웃 픽셀들 중에서 가장 빈번한 2개의 픽셀 값들을 각각 나타내는 적어도 2개의 픽셀 값들을 선택함으로써 수행되는,
적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 방법 또는 코딩하기 위한 방법. - 제2 항에 있어서,
이전에 디코딩된 픽셀들로부터의 상기 블록 내의 상기 픽셀 값들의 그룹의 적어도 하나의 값으로부터 임계 값이 결정되며,
상기 픽셀에 대한 예측 모드를 결정할 때,
- 상기 픽셀의 원래 값이 상기 임계 값보다 크고 상기 임계 값이 상기 제1 예측 모드에 따라 결정된 픽셀과 연관된 예측 값보다 큰 경우, 또는
- 상기 픽셀의 원래 값이 상기 임계 값보다 작고 상기 임계 값이 상기 제1 예측 모드에 따라 결정된 픽셀과 연관된 예측 값보다 작은 경우,
상기 제2 예측 모드가 선택되는,
적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 코딩하기 위한 방법. - 적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 디바이스로서,
상기 이미지는 블록들로 분할되고,
상기 디코딩 디바이스는 프로세서(PROC0)를 포함하며,
상기 프로세서(PROC0)는 현재 블록으로 지칭되는, 상기 이미지의 적어도 하나의 블록에 대해:
- 이전에 디코딩된 픽셀들로부터 상기 블록 내의 픽셀 값들의 그룹을 결정하고,
- 상기 블록의 각각의 픽셀에 대해:
(ⅰ) 상기 픽셀과 연관된 예측 잔차를 디코딩하고,
(ⅱ) 적어도 하나의 다른 이전에 디코딩된 픽셀로부터 상기 픽셀과 연관된 예측 값을 결정하고 ― 상기 다른 이전에 디코딩된 픽셀은 상기 현재 블록에 속함 ―,
(ⅲ) 상기 블록에서 상기 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 상기 픽셀이 예측되는지 여부를 표시하는 정보 항목을 상기 데이터 스트림으로부터 결정하고,
(ⅳ) 상기 정보 항목이 상기 블록에서 상기 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 상기 픽셀이 예측됨을 표시할 때:
(a) 상기 그룹의 값을 선택하고,
(b) 상기 픽셀과 연관된 예측 값을 상기 선택된 값으로 대체하고,
(ⅴ) 상기 픽셀과 연관된 예측 값 및 상기 예측 잔차를 사용하여 상기 픽셀을 재구성하도록 구성되는,
적어도 하나의 이미지를 나타내는 코딩된 데이터 스트림을 디코딩하기 위한 디바이스. - 적어도 하나의 이미지를 나타내는 데이터 스트림을 코딩하기 위한 디바이스로서,
상기 이미지는 블록들로 분할되고,
상기 코딩 디바이스는 프로세서(PROC)를 포함하며,
상기 프로세서(PROC)는 현재 블록으로 지칭되는, 상기 이미지의 적어도 하나의 블록에 대해:
- 이전에 디코딩된 픽셀들로부터 상기 블록 내의 픽셀 값들의 그룹을 결정하고,
- 상기 블록의 각각의 픽셀에 대해:
(ⅰ) 제1 예측 모드에 따라 상기 픽셀과 연관된 예측 값을 결정하고 ― 상기 제1 예측 모드에 따라 적어도 하나의 다른 이전에 디코딩된 픽셀로부터 상기 픽셀이 예측되고, 상기 다른 이전에 디코딩된 픽셀은 상기 현재 블록에 속함 ―,
(ⅱ) 상기 블록에서 상기 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 상기 픽셀이 예측되는, 상기 픽셀에 대한 예측 모드를 상기 제1 예측 모드 및 제2 예측 모드 중에서 결정하고,
(ⅲ) 상기 제2 예측 모드에 따라 상기 픽셀이 예측되는지 여부를 표시하는 정보 항목을 상기 데이터 스트림으로 코딩하고,
(ⅳ) 상기 정보 항목이 상기 제2 예측 모드에 따라 상기 픽셀이 예측됨을 표시할 때:
(a) 상기 그룹의 값을 선택하고,
(b) 상기 픽셀과 연관된 예측 값을 상기 선택된 값으로 대체하고,
(ⅴ) 상기 픽셀과 연관된 예측 값 및 상기 픽셀의 값을 사용하여 상기 픽셀과 연관된 예측 잔차를 계산하고,
(b) 상기 픽셀과 연관된 예측 잔차를 상기 데이터 스트림으로 코딩하고,
(ⅶ) 상기 픽셀과 연관된 예측 값 및 상기 디코딩된 예측 잔차를 사용하여 상기 픽셀을 재구성하도록 구성되는,
적어도 하나의 이미지를 나타내는 데이터 스트림을 코딩하기 위한 디바이스. - 적어도 하나의 이미지를 나타내는 데이터 스트림으로서,
상기 이미지는 블록들로 분할되고,
상기 데이터 스트림은 현재 블록으로 지칭되는, 상기 이미지의 적어도 하나의 블록에 대해 그리고 상기 현재 블록의 각각의 픽셀에 대해:
- 상기 픽셀과 연관된 예측 잔차를 나타내는 정보 항목,
- 상기 블록 내의 픽셀 값들의 그룹으로부터 야기되는 예측을 사용하여 상기 픽셀이 예측되는지 여부를 표시하는 정보 항목을 포함하며,
상기 블록 내의 픽셀 값들의 그룹은 이전에 디코딩된 픽셀들로부터 결정되는,
적어도 하나의 이미지를 나타내는 데이터 스트림. - 컴퓨터 프로그램으로서,
상기 프로그램이 프로세서에 의해 실행될 때, 제1 항 또는 제3 항 내지 제6 항 중 어느 한 항에 따른 디코딩하기 위한 방법 또는 제2 항 내지 제7 항 중 어느 한 항에 따른 코딩하기 위한 방법을 구현하기 위한 명령들을 포함하는,
컴퓨터 프로그램. - 제11 항에 따른 컴퓨터 프로그램의 명령들을 포함하는,
컴퓨터 판독 가능 데이터 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1901228A FR3092719A1 (fr) | 2019-02-07 | 2019-02-07 | Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image. |
FR1901228 | 2019-02-07 | ||
PCT/FR2020/050146 WO2020161413A1 (fr) | 2019-02-07 | 2020-01-30 | Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210128401A true KR20210128401A (ko) | 2021-10-26 |
Family
ID=67185272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217025873A KR20210128401A (ko) | 2019-02-07 | 2020-01-30 | 적어도 하나의 이미지를 표현하는 데이터 스트림을 코딩 및 디코딩하기 위한 방법들 및 디바이스들 |
Country Status (8)
Country | Link |
---|---|
US (2) | US12022115B2 (ko) |
EP (1) | EP3922017A1 (ko) |
JP (1) | JP2022519739A (ko) |
KR (1) | KR20210128401A (ko) |
CN (2) | CN118301343A (ko) |
BR (1) | BR112021014787A2 (ko) |
FR (1) | FR3092719A1 (ko) |
WO (1) | WO2020161413A1 (ko) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2977111A1 (fr) * | 2011-06-24 | 2012-12-28 | France Telecom | Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants |
US9503750B2 (en) | 2011-11-04 | 2016-11-22 | Futurewei Technologies, Inc. | Binarization of prediction residuals for lossless video coding |
US10015515B2 (en) | 2013-06-21 | 2018-07-03 | Qualcomm Incorporated | Intra prediction from a predictive block |
FR3023112A1 (fr) * | 2014-06-27 | 2016-01-01 | Bcom | Procede de codage d'une image numerique, procede de decodage, dispositifs et programmes d'ordinateurs associes |
FR3046321B1 (fr) * | 2015-12-29 | 2018-01-26 | B<>Com | Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes |
FR3066873A1 (fr) * | 2017-05-29 | 2018-11-30 | Orange | Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'au moins une image |
US20190014325A1 (en) * | 2017-07-05 | 2019-01-10 | Industrial Technology Research Institute | Video encoding method, video decoding method, video encoder and video decoder |
-
2019
- 2019-02-07 FR FR1901228A patent/FR3092719A1/fr not_active Withdrawn
-
2020
- 2020-01-30 EP EP20707501.1A patent/EP3922017A1/fr active Pending
- 2020-01-30 KR KR1020217025873A patent/KR20210128401A/ko unknown
- 2020-01-30 JP JP2021546344A patent/JP2022519739A/ja active Pending
- 2020-01-30 CN CN202410522725.0A patent/CN118301343A/zh active Pending
- 2020-01-30 BR BR112021014787-0A patent/BR112021014787A2/pt unknown
- 2020-01-30 CN CN202080013072.3A patent/CN113412618B/zh active Active
- 2020-01-30 WO PCT/FR2020/050146 patent/WO2020161413A1/fr unknown
- 2020-01-30 US US17/429,174 patent/US12022115B2/en active Active
-
2024
- 2024-05-13 US US18/662,281 patent/US20240298028A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220103862A1 (en) | 2022-03-31 |
EP3922017A1 (fr) | 2021-12-15 |
CN113412618A (zh) | 2021-09-17 |
FR3092719A1 (fr) | 2020-08-14 |
US12022115B2 (en) | 2024-06-25 |
JP2022519739A (ja) | 2022-03-24 |
WO2020161413A1 (fr) | 2020-08-13 |
US20240298028A1 (en) | 2024-09-05 |
CN118301343A (zh) | 2024-07-05 |
CN113412618B (zh) | 2024-05-17 |
BR112021014787A2 (pt) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230199193A1 (en) | Methods and devices for coding and decoding a data stream representing at least one image | |
JP2024056766A (ja) | 少なくとも1つの画像を表すデータストリームをコーディングおよびデコーディングするための方法および装置 | |
CN113412618B (zh) | 用于编码和解码表示至少一个图像的数据流的方法和设备 | |
CN112740690B (zh) | 用于编码和解码代表至少一个图像的数据流的方法和设备 | |
CN112740692B (zh) | 用于编码和解码表示至少一个图像的数据流的方法和设备 | |
CN112292858B (zh) | 用于编码和解码表示至少一个图像的数据流的方法和装置 | |
KR102543086B1 (ko) | 화상을 인코딩 및 디코딩하기 위한 방법 및 장치 |