KR20220024020A - 모션 보상 처리 방법, 인코더, 디코더 및 저장 매체 - Google Patents
모션 보상 처리 방법, 인코더, 디코더 및 저장 매체 Download PDFInfo
- Publication number
- KR20220024020A KR20220024020A KR1020217040779A KR20217040779A KR20220024020A KR 20220024020 A KR20220024020 A KR 20220024020A KR 1020217040779 A KR1020217040779 A KR 1020217040779A KR 20217040779 A KR20217040779 A KR 20217040779A KR 20220024020 A KR20220024020 A KR 20220024020A
- Authority
- KR
- South Korea
- Prior art keywords
- search
- pixel
- motion vector
- search step
- step length
- Prior art date
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 239000013598 vector Substances 0.000 claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 68
- 230000015654 memory Effects 0.000 claims description 26
- 238000004891 communication Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 20
- 230000003044 adaptive effect Effects 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 238000013139 quantization Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/533—Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/57—Motion estimation characterised by a search window with variable size or shape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 출원의 실시예는 모션 보상 처리 방법, 인코더, 디코더 및 저장 매체를 개시한다. 상기 방법은, 초기 모션 벡터를 기반으로 수색 위치 성상도를 구축하는 것과, 프리셋 범위 커버리지 규칙에 따라 수색 위치 성상도로부터 적어도 하나의 수색 위치를 선택하는 것과, 적어도 하나의 수색 위치를 새로운 모션 벡터로 하여, 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 코딩 유닛(CU)의 예측값을 획득하는 것을 포함한다. 프리셋 범위 커버리지 규칙은, 프리셋 수량의 수색 포인트를 N개의 수색 방향으로 분산시켜 선택하는 것이다. 따라서 수색 스텝 길이의 일부가 선택되지 않아 부호화 효율이 낮아지는 문제를 피할 수 있고, 대부분 물체의 모션 조건을 만족할 수 있으므로 모션 정보를 보다 정확하게 표현할 수 있다.
Description
본 출원의 실시예는 비디오 부호화 및 복호화 기술 분야에 관한 것으로, 보다 구체적으로 모션 보상 처리 방법, 인코더, 디코더 및 저장 매체에 관한 것이다.
MMVD(Merge with motion vector difference) 기술은 인터 예측의 스킵 모드(skip mode)와 병합 모드(merge mode)에서 사용되며, 모션 벡터의 특별한 표현 형식이다. MMVD 기술은 주로 다음 프로세스를 통해 실현된다. VVC(versatile video coding)의 병합 후보 모션 벡터를 재사용하고, 그 중 하나의 후보를 선택하여 초기 모션 벡터로 하고, 다음 방법으로 초기 모션 벡터를 확장한다. 주로 시작점, 움직임 크기 및 움직임 방향을 포함하는 몇가지 간단한 구문 요소를 사용하여 움직임 벡터의 최종 확장 표현을 얻어 새로운 움직임 벡터를 형성한다. 그러나, 현재 상술한 방안은 대부분 물체의 움직임 조건을 만족하기 어렵고, 표현할 수 있는 움직임 정보의 정밀도가 부족하다.
본 출원의 실시예는 모션 보상 처리 방법, 인코더, 디코더 및 저장 매체를 제공하고, 수색 스텝 길이(step length)의 일부가 선택되지 않아 부호화 효율이 낮아지는 문제를 피할 수 있고, 대부분 물체의 모션 조건을 만족할 수 있으므로 모션 정보를 보다 정확하게 표현할 수 있다.
본 출원의 실시예에 따른 기술적 방안은 다음과 같다.
제 1 양태에서, 본 출원의 실시예는 모션 보상 처리 방법을 제공한다. 모션 보상 처리 방법은,
초기 모션 벡터를 기반으로 수색 위치 성상도(search position constellation)를 구성하는 것 - 수색 위치 성상도에는 N개의 수색 방향이 포함되며, 수색 방향에서 적어도 한가지 수색 스텝 길이를 사용하여 수색함으로써 적어도 하나의 수색 포인트를 획득하고, N은 1이상의 정수이고, N개의 수색 방향은 적어도 대각선 수색 방향을 포함함 - 과,
프리셋 범위 커버리지 규칙에 따라 수색 위치 성상도로부터 적어도 하나의 수색 위치를 선택하는 것 - 프리셋 범위 커버리지 규칙은, 프리셋 수량의 수색 포인트를 N개의 수색 방향으로 분산시켜 선택하는 것임 - 과,
적어도 하나의 수색 위치를 새로운 모션 벡터로 하여, 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 코딩 유닛(coding unit, CU)의 예측값을 획득하는 것을 포함한다.
제 2 양태에서, 본 출원의 실시예는 인코더를 제공한다. 인코더는 구축 부분 및 부호화 부분을 포함한다. 구축 부분은 초기 모션 벡터를 기반으로 수색 위치 성상도를 구축하도록 구성된다. 수색 위치 성상도에는 N개의 수색 방향이 포함되며, 수색 방향에서 적어도 한가지 수색 스텝 길이를 사용하여 수색함으로써 적어도 하나의 수색 포인트를 획득하고, N은 1이상의 정수이고, N개의 수색 방향은 적어도 대각선 수색 방향을 포함한다. 부호화 부분은 프리셋 범위 커버리지 규칙에 따라 수색 위치 성상도로부터 적어도 하나의 수색 위치를 선택하고, 적어도 하나의 수색 위치를 새로운 모션 벡터로 하여, 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 코딩 유닛의 예측값을 획득하도록 구성된다. 프리셋 범위 커버리지 규칙은, 프리셋 수량의 수색 포인트를 N개의 수색 방향으로 분산시켜 선택하는 것이다.
제 3 양태에서, 본 출원의 실시예는 디코더에 적용되는 모션 보상 처리 방법을 제공한다. 상기 방법은,
초기 모션 벡터의 구문 요소를 기반으로 수색 위치 성상도에 있어서의 초기 모션 벡터에 대응하는 적어도 하나의 수색 위치를 확장하는 것과;
초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 재구성된 블록을 획득하는 것을 포함하고,
구문 요소는 초기 모션 벡터 인덱스, 수색 방향 인덱스, 수색 스텝 길이 인덱스를 포함하고, 수색 방향 인덱스에서 지시하는 수색 방향은 적어도 대각선 수색 방향을 포함한다.
제 4 양태에서, 본 출원의 실시예는 디코더를 제공한다. 디코더는 확장 부분과 복호화 부분을 포함한다. 확장 부분은 초기 모션 벡터의 구문 요소를 기반으로 수색 위치 성상도에 있어서의 초기 모션 벡터에 대응하는 적어도 하나의 수색 위치를 확장하도록 구성된다. 구문 요소는 초기 모션 벡터 인덱스, 수색 방향 인덱스, 수색 스텝 길이 인덱스를 포함하고, 수색 방향 인덱스에서 지시하는 수색 방향은 적어도 대각선 수색 방향을 포함한다. 복호화 부분은 초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 재구성된 블록을 획득하도록 구성된다.
제 5 양태에서, 본 출원의 실시예는 인코더를 제공한다. 인코더는 프로세서와, 프로세서에 의해 실행 가능한 명령어를 저장하는 메모리와, 통신 인터페이스와, 프로세서, 메모리 및 통신 인터페이스를 연결하는 데에 사용되는 버스를 포함한다. 명령어가 프로세서에 의해 실행되면, 상술한 제 1 양태 또는 다른 각 양태의 방안을 실현한다.
제 6 양태에서, 본 출원의 실시예는 디코더를 제공한다. 디코더는 프로세서와, 프로세서에 의해 실행 가능한 명령어를 저장하는 메모리와, 통신 인터페이스와, 프로세서, 메모리 및 통신 인터페이스를 연결하는 데에 사용되는 버스를 포함한다. 명령어가 프로세서에 의해 실행되면, 상술한 제 3 양태 또는 다른 각 양태의 방안을 실현한다.
제 7 양태에서, 본 출원의 실시예는 컴퓨터 저장 매체를 제공한다. 컴퓨터 저장 매체는 예측 프로그램을 저장한다. 예측 프로그램이 프로세서에 의해 실행되면 제 1 양태의 방법의 단계 또는 제 3 양태의 방법의 단계가 실현된다.
본 출원의 실시예에서, 대각선 수색 방향을 포함하는 N개의 수색 방향 및 여러가지 수색 스텝 길이에 따라 수색 위치를 확정한다. 따라서, 종래 기술과 비교하면, 각 방향의 수색 스텝 길이를 감소하여 수색 스텝 길이의 일부가 선택되지 않아 부호화 효율이 낮아지는 문제를 피할 수 있고, 또한 수색 방향을 증가하여 대부분 물체의 모션 조건을 만족할 수 있으므로 모션 정보를 보다 정확하게 표현할 수 있다.
도 1은 인트라 예측을 사용하여 수색 위치를 확정하는 것을 나타내는 개략도이다.
도 2는 본 출원의 실시예에 따른 모션 보상 처리 방법의 제 1 흐름도이다.
도 3은 본 출원의 실시예에 따른 수색 위치를 확정하는 것을 나타내는 개략도이다.
도 4는 본 출원이 MMVD에 적용될 때의 수색 방향을 나타내는 개략도이다.
도 5는 본 출원이 MMVD에서 복수의 수색 위치를 획득하는 것을 나타내는 개략도이다.
도 6은 비디오 인코딩 시스템의 구조를 나타내는 개략도이다.
도 7은 비디오 디코딩 시스템의 구조를 나타내는 개략도이다.
도 8은 본 출원의 실시예에 따른 인코더의 구조를 나타내는 개략도이다.
도 9는 본 출원의 실시예에 따른 모션 보상 처리 방법의 제 2 흐름도이다.
도 10은 본 출원의 실시예에 따른 디코더의 구조를 나타내는 개략도이다.
도 11은 본 출원의 실시예에 따른 하드웨어의 구조를 나타내는 개략도이다.
도 2는 본 출원의 실시예에 따른 모션 보상 처리 방법의 제 1 흐름도이다.
도 3은 본 출원의 실시예에 따른 수색 위치를 확정하는 것을 나타내는 개략도이다.
도 4는 본 출원이 MMVD에 적용될 때의 수색 방향을 나타내는 개략도이다.
도 5는 본 출원이 MMVD에서 복수의 수색 위치를 획득하는 것을 나타내는 개략도이다.
도 6은 비디오 인코딩 시스템의 구조를 나타내는 개략도이다.
도 7은 비디오 디코딩 시스템의 구조를 나타내는 개략도이다.
도 8은 본 출원의 실시예에 따른 인코더의 구조를 나타내는 개략도이다.
도 9는 본 출원의 실시예에 따른 모션 보상 처리 방법의 제 2 흐름도이다.
도 10은 본 출원의 실시예에 따른 디코더의 구조를 나타내는 개략도이다.
도 11은 본 출원의 실시예에 따른 하드웨어의 구조를 나타내는 개략도이다.
이하, 본 출원의 실시예의 도면을 참조하여 본 출원의 실시예의 기술적 방안을 명확하고 완전하게 설명한다. 본 명세서에 기재된 구체적인 실시예는 관련 출원을 설명하는 데에 사용되며, 본 출원을 한정하고자 하는 것은 아님을 이해할 수 있다. 또한, 쉽게 설명하기 위하여, 관련 출원의 관련된 부분만을 도면에 도시한다.
MMVD 기술에서, VVC(versatile video coding)에서 병합 후보 리스트를 구축하는 프로세스를 통해 현재 코딩 유닛(CU)의 모션 벡터 후보 리스트를 획득한다. 그 다음에 리스트의 각 후보에 대하여 아래와 같이 구문 확장을 실행한다. 도 1에 도시된 바와 같이, 각 후보를 초기 모션 벡터로 하여 참조 화상에서 상기 후보가 가리키는 위치를 출발점으로 하여 상하좌우 4개의 방향에서 8개의 상이한 스텝 길이로 수색한다. 각 초기 모션 벡터의 각 방향에서의 각 스텝 길이는 모두 새로운 모션 벡터를 형성할 수 있으며, 상기 모션 벡터를 기반으로 모션 보상을 수행하여 현재 CU의 예측값을 획득한다. 현재 모든 예측값에 대하여 레이트 왜곡 비용 비교(rate-distortion cost comparison)를 수행하여 최적의 구문 요소 조합을 선택하고, 병합 후보 리스트에 있어서의 초기 모션 벡터의 세가지 구문 요소, 즉 위치 인덱스, 이동 방향 인덱스 및 수색 스텝 길이 인덱스를 기록한다.
알고리즘의 복잡성과 성능의 절충을 고려하면, 현재 알고리즘에서 병합 후보 리스트의 앞의 두개의 후보를 초기 모션 벡터로 한다. 초기 모션 벡터 인덱스, 8가지 수색 스텝 길이의 인덱스, 4개의 수색 방향의 인덱스에 대해서는 하기 표 1, 2, 3을 참조할 수 있다.
표 1
표 2
표 3
상술한 MMVD 기술에 따라 새로운 모션 벡터를 선택할 때, 8가지 수색 스텝 길이의 사용은 완전하지 않다. VVC의 표준 테스트 시퀀스에서 8가지 스텝 길이가 선택되는 확률을 통계함으로써, 각 테스트 시퀀스에 대하여, 앞의 4가지 수색 스텝 길이(즉, 1/4, 1/2, 1, 2)가 선택되는 확률은 거의 90%이상을 차지하는 것으로 발견되었다. 따라서, 나머지 4가지 스텝 길이는 충분히 이용되지 않아 부호화 효율이 저하된다. 또한, 상, 하, 좌, 우의 4개의 수색 방향만 존재하기 때문에, 대부분 물체의 모션 조건을 만족하기 어렵고, 표현할 수 있는 모션 정보의 정밀도가 부족하다.
따라서, 본 출원의 실시예는 모션 보상 처리 방법을 제공한다. 도 2에 도시된 바와 같이, 본 방법은 아래 내용을 포함한다.
블록 11: 초기 모션 벡터를 기반으로 수색 위치 성상도(search position constellation)를 구성한다. 수색 위치 성상도에는 N개의 수색 방향이 포함되며, 수색 방향에서 적어도 한가지 수색 스텝 길이를 사용하여 수색함으로써 적어도 하나의 수색 포인트를 획득하고, N은 1이상의 정수이고, N개의 수색 방향은 적어도 대각선 수색 방향을 포함한다.
블록 12: 프리셋 범위 커버리지 규칙에 따라 수색 위치 성상도로부터 적어도 하나의 수색 위치를 선택한다. 프리셋 범위 커버리지 규칙은, 프리셋 수량의 수색 포인트를 N개의 수색 방향으로 분산시켜 선택하는 것이다.
블록 13: 적어도 하나의 수색 위치를 새로운 모션 벡터로 하여, 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 코딩 유닛(coding unit, CU)의 예측값을 획득한다.
본 출원의 실시예에 따른 모션 보상 처리 방법은 비디오 인코딩 및 디코딩 시스템의 인코더에 적용될 수 있다.
총적으로 상술한 방안에 따르면, 우선 거리에 따라 여러 수색 방향에 사용 가능한 수색 포인트를 할당하여 수색 위치 성상도를 구축한 다음에, 프리셋 범위 커버리지 규칙에 따라 성상도에서 적절한 수량의 수색 위치를 선택한다.
즉, 본 실시예에 있어서, 프리셋 수색 위치가 32개인 것을 전제로 하여, 원래 4개의 수색 방향을 8개의 수색 방향으로 확장하고, 각 수색 방향의 8개의 수색 스텝 길이의 수량을 감소하고, 서로 다른 수색 방향에 수색 스텝 길이를 할당하여 비교적 넓은 수색 범위를 커버한다.
초기 움직임 벡터를 기반으로 수색 위치 성상도를 구축하는 것은, 구체적으로 초기 움직임 벡터가 가리키는 점을 중심점으로 하여 수색 위치 성상도를 구축하는 것을 더 포함한다.
8개의 수색 방향은 수평 수직 수색 방향과 대각선 수색 방향의 두가지 유형으로 나눠진다.
수평 수직 수색 방향은 각각 상, 하, 좌, 우이다. 대각선 수색 방향은 각각 좌상, 좌하, 우상, 우하이다.
수색 스텝 길이는 수색 방향의 유형에 대응된다.
상기 방법은 또한 아래 내용을 포함한다. 수색 방향의 유형이 수평 수직 수색 방향인 경우, 제 1 수색 스텝 길이 세트가 채용된다. 수색 방향의 유형이 대각선 수색 방향인 경우, 제 2 수색 스텝 길이 세트가 채용된다.
프리셋 수색 위치가 32개인 경우에 제 1 수색 스텝 길이 세트는 적어도 한가지 제 1 수색 스텝 길이를 포함하고, 제 2 수색 스텝 길이 세트는 적어도 한가지 제 2 수색 스텝 길이를 포함한다.
본 실시예에 있어서, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트는 동일하거나 상이할 수 있다.
제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 동일한 경우, 수평 수직 수색 방향과 대각선 수색 방향에서 모두 동일한 4개의 수색 스텝 길이(스텝 길이는 수색 위치와 성상도 중심점 사이의 거리이다)를 사용하여 수색 위치를 선택하는 것으로 간주할 수 있다.
또는, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 다른 경우, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트는 교차할 수 있다. 예를 들면, 수평 수직 방향의 수색 스텝 길이와 대각선 방향의 수색 스텝 길이가 엇갈리게 커진다. 하나의 예시에서, 수평 수직 방향의 거리는 우선적으로 선택되고, 대각선 방향의 수색 스텝 길이는 2개의 인접한 수평 수직 방향의 수색 스텝 길이 사이에 교차된다. 따라서, 대각선 방향의 수색이 수평 수직 방향에서 수색할 수 없는 영역을 커버할 수 있도록 한다.
즉, 제 1 수색 스텝 길이 세트의 제 1 유형의 제 1 수색 스텝 길이와 제 2 유형의 제 1 수색 스텝 길이 사이에 제 2 수색 스텝 길이 세트의 제 1 유형의 제 2 수색 스텝 길이가 있을 수 있다. 마찬가지로, 제 2 수색 스텝 길이 세트의 제 2 유형의 제 2 수색 스텝 길이와 제 3 유형의 제 2 수색 스텝 길이 사이에 제 1 수색 스텝 길이 세트의 제 3 유형의 제 1 수색 스텝 길이가 있을 수 있다.
대각선 방향 위치는 (lx, ly)로 표시되며, 여기서 lx=ly이며, 본문에서 수색 스텝 길이는 단일 값 lx로 표시된다.
예를 들어, 제 1 수색 스텝 길이는 1/4 픽셀, 1/2 픽셀, 2 픽셀, 4 픽셀 중 적어도 하나이고, 제 2 수색 스텝 길이는 1/8 픽셀, 3/8 픽셀, 3/4 픽셀, 3/2 픽셀 중 적어도 하나이다.
이하, 첨부된 도면을 참조하여 본 실시예의 기술 방안을 설명한다.
배수로 증가되는 수색 스텝 길이를 반경으로 하여 초기 모션 벡터가 가리키는 위치를 원심으로 하여 원을 그린다. 대각선 방향의 수색 스텝 길이는 모두 원의 가장자리에 가깝고 순차적으로 멀리 확장되도록 설정된다. 여기서, 수색 스텝 길이는 수색 스텝 길이에 따라 확정될 수 있다. 예를 들어, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 동일한 경우, 4가지 제 1 수색 스텝 길이 또는 4가지 제 2 수색 스텝 길이를 반경으로 하여 원을 그려 4개의 원을 획득한다. 대각선 방향과 수평 수직 방향에 모두 4개의 수색 포인트가 있다. 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 다른 경우, 각각 4개의 제 1 수색 스텝 길이, 4개의 제 2 수색 스텝 길이를 기반으로 대각선 수색 방향 및 수평 수직 수색 방향에서 복수의 수색 포인트를 획득할 수 있다.
다음, 통계를 기반으로 커버리지 영역에 따라 대표적인 수색 포인트를 선택하고, 보간 연산을 편리하게 하는 원칙에 따라 2의 거듭 제곱으로 나누어 표현할 수 있는 위치에 근사한다. 도 3에 도시된 바와 같이, 수평 방향 및 수직 방향에서 모두 1/4픽셀 위치, 1/2픽셀 위치, 2픽셀 위치, 4픽셀 위치를 선택하고, 대각선 방향에서는 (1/8, 1/8) 픽셀 위치, (3/8, 3/8) 픽셀 위치, (3/4, 3/4) 픽셀 위치, (3/2, 3/2) 픽셀 위치를 선택한다. 대표적인 수색 포인트를 선택하는 경우, 상이한 해상도 시퀀스의 상이한 통계적 특성을 고려하여, 반경이 1/2인 원과 반경이 2인 원의 근처에 더 많은 수색 포인트를 할당할 수 있다.
이에 기초하여 MMVD를 실현하는 상세한 설명은 다음과 같다.
우선, 후보 리스트로부터 초기 모션 벡터를 선택한다.
구체적으로, 여전히 VVC의 병합 후보 리스트의 앞의 2개의 후보를 재사용하여 초기 모션 벡터로 한다. 각 초기 모션 벡터에 대하여, 여전히 초기 모션 벡터 인덱스, 수색 방향 및 수색 스텝 길이와 같은 3개의 구문 요소를 사용하여 확장 표현을 수행한다.
확장 표현을 수행하는 과정에서, 수색 방향 부분에 대하여, 도 4에 도시된 바와 같이, 원래의 상, 하, 좌, 우의 4개의 방향은 상, 하, 좌, 우의 4개의 방향 및 좌상, 우상, 우하, 좌하의 4개의 방향을 포함하도록 변경된다. 즉, 원래의 방향 외에 대각선 방향이 추가된다.
도 4에 도시된 바와 같이, 새로 추가된 방향은 실선으로 표시되고, 원래의 방향은 점선으로 표시된다. 따라서, 원래의 수평 수직 방향 외에 모션 방향이 새로 추가되어, 모션 벡터 표현의 유연성을 높일 수 있다.
본 실시예에 있어서의 수색 방향 인덱스 테이블은 표 4와 같다.
표 4
다음, 수색 스텝 길이를 변경한다. 도 5에 도시된 바와 같이, 우선 원래 알고리즘의 8가지 수색 스텝 길이를 자주 사용되는 4가지 수색 스텝 길이로 감소한다.
표 5
표 5를 기반으로, 더욱 넓은 수색 범위를 커버하기 위하여, 표 6에서는 대각선 방향에 대하여 상하좌우 방향과 다른 수색 스텝 길이를 설정하였다.
표 6
마지막으로, 각 초기 모션 벡터에 대하여, 형성된 수색 방향 및 스텝 길이는 도 5에 도시된 바와 같다.상술한 기술 방안을 기반으로, 본 실시예는 아래 내용을 더 포함할 수 있다. 적어도 하나의 수색 위치를 새로운 모션 벡터로 한다. 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 CU의 예측값을 획득한다. 그 다음에 현재 모든 예측값에 대하여 레이트 왜곡 비용 비교(rate-distortion cost comparison)를 수행하여 최적의 구문 요소 조합을 선택하고, 병합 후보 리스트에 있어서의 초기 모션 벡터의 세가지 구문 요소, 즉 위치 인덱스, 이동 방향 인덱스 및 수색 스텝 길이 인덱스를 기록한다.
상술한 방안을 채용함으로써, 랜덤 액세스 조건하에서 JVET(joint video experts team)가 요구하는 테스트 시퀀스를 테스트하고, Y, Cb, Cr 성분의 BD-rate의 평균 변동은 각각 -0.14 %, -0.12%, 0.10%이다. 이 데이터는 이 기술이 코딩 성능을 향상시킨다는 것을 나타낸다.
도 6은 비디오 인코딩 시스템의 구조를 나타내는 개략도이다. 도 6에 도시된 바와 같이, 비디오 인코딩 시스템(100)은 변환 및 양자화 모듈(101), 인트라 추정 모듈(102), 인트라 예측 모듈(103), 모션 보상 모듈(104), 모션 추정 모듈(105), 역변환 및 역양자화 모듈(106), 필터 제어 분석 모듈(107), 디블로킹 필터링(deblocking filtering, DBK) 및 샘플 적응 오프셋(sample adaptive offset, SAO) 필터링 모듈(108), 헤더 정보 인코딩 및 CABAC(context-based adaptive binary arithmetic coding) 인코딩 모듈(109), 디코딩된 화상 버퍼 모듈(110) 등을 포함한다. 도 7은 비디오 디코딩 시스템의 구조를 나타내는 개략도이다. 도 7에 도시된 바와 같이, 비디오 디코딩 시스템(200)은 헤더 정보 디코딩 및 CABAC(context-based adaptive binary arithmetic coding) 디코딩 모듈(201), 역변환 및 역양자화 모듈(202), 인트라 예측 모듈(203), 모션 보상 모듈(204), 디블로킹 필터링(deblocking filtering) 및 샘플 적응 오프셋(sample adaptive offset, SAO) 필터링 모듈(205), 디코딩된 화상 버퍼 모듈(206) 등을 포함한다. 비디오 이미지는 비디오 인코딩 시스템(200)의 헤더 정보 디코딩 모듈(201), 인트라 추정 모듈(202), 인트라 예측 모듈(203), 모션 보상 모듈(204), 모션 추정 모듈(205), 디코딩된 화상 버퍼 모듈(206) 등에 의해 처리된 후에 비디오 이미지의 코드 스트림을 출력한다. 상기 코드 스트림은 비디오 디코딩 시스템(200)에 입력되고, 비디오 디코딩 시스템(200)의 헤더 정보 디코딩 및 CABAC 디코딩 모듈(201), 역변환 및 역양자화 모듈(202), 인트라 예측 모듈(203) 및 모션 보상 모듈(204) 등에 의해 처리된 후에, 마지막으로 복원된 원본 비디오 이미지를 획득한다.
또한, 본 출원에 의해 제출되는 비디오 인코딩 방법은 비디오 인코딩 하이브리드 프레임워크의 인트라 예측 부분에 영향을 미칠 수 있다. 즉, 주로 비디오 인코딩에 있어서의 모션 보상 모듈(104) 및 모션 추정 모듈(105), 비디오 디코딩에 있어서의 모션 보상 모듈(204)에 적용되어, 부호화 말단과 복호화 말단 양쪽 모두에 작용한다.
상술한 기술 방안을 기반으로, 본 실시예에서는, 연산 횟수가 거의 변하지 않는 조건하에서, 부호화 성능을 개선할 수 있다. 종래의 기술에서는, 2개의 초기 모션 벡터에 대하여 확장 표현을 수행할 필요가 있고, 합계 2*4*8=64회의 비교가 필요하며, 2는 2개의 초기 모션 벡터를 나타내고, 4는 수색 방향을 나타내며, 8은 수색 스텝 길이를 나타낸다. 변경 후에도 여전히 2개의 초기 모션 벡터에 대하여 확장 표현을 수행하고, 총 2*8*4=64 회의 비교가 필요하며, 8개의 수색 방향과 4개의 수색 스텝 길이를 포함한다. 본 기술은 원래의 기술과 동일한 연산 양을 유지하면서 전반적인 인코딩 성능을 향상시킬 수 있다.
이에 대응하여, 상술한 방안을 기반으로, 복호화 말단의 복잡도가 변하지 않도록 유지할 수 있다. 종래의 기술에서는, 복호화 말단에서 3개의 구문 요소를 복호화함으로써, 초기 모션 벡터에 대하여 확장 표현을 수행하고, 모션 보상을 실행하여, 마지막으로 재구성된 블록을 획득한다. 본 기술 방안에서는 여전히 3개의 구문 요소를 복호화함으로써 초기 모션 벡터에 대하여 확장 표현을 수행하므로 복잡성은 변하지 않는다.
본 실시예에 의해 제공되는 기술 방안에 따르면, 8개의 수색 방향 및 각 방향에 대응하는 4개의 수색 스텝 길이를 기반으로 수색 위치를 확정할 수 있다. 이와 같이, 종래 기술과 비교하면, 각 방향의 수색 스텝 길이를 감소하여 수색 스텝 길이의 일부가 선택되지 않아 부호화 효율이 낮아지는 문제를 피할 수 있고, 또한 수색 방향을 증가하여 대부분 물체의 모션 조건을 만족할 수 있으므로 모션 정보를 보다 정확하게 표현할 수 있다.
상기에 기초하여, 본 실시예는 인코더를 제공한다. 도 8에 도시된 바와 같이, 인코더는 구축 부분(32) 및 부호화 부분(33)을 포함한다.
구축 부분(32)은 초기 모션 벡터를 기반으로 수색 위치 성상도(search position constellation)를 구성하도록 구성된다. 수색 위치 성상도에는 N개의 수색 방향이 포함되며, 수색 방향에서 적어도 한가지 수색 스텝 길이를 사용하여 수색함으로써 적어도 하나의 수색 포인트를 획득하고, N은 1이상의 정수이고, N개의 수색 방향은 적어도 대각선 수색 방향을 포함한다.
부호화 부분(33)은 프리셋 범위 커버리지 규칙에 따라 수색 위치 성상도로부터 적어도 하나의 수색 위치를 선택하고, 적어도 하나의 수색 위치를 새로운 모션 벡터로 하여, 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 코딩 유닛(coding unit, CU)의 예측값을 획득하도록 구성된다. 프리셋 범위 커버리지 규칙은, 프리셋 수량의 수색 포인트를 N개의 수색 방향으로 분산시켜 선택하는 것이다.
본 실시예에 따른 방법은 비디오 인코딩 및 디코딩 시스템의 인코더에 적용될 수 있다.
즉, 본 실시예에 있어서, 프리셋 수색 위치가 32개인 것을 전제로 하여, 원래 4개의 수색 방향을 8개의 수색 방향으로 확장하고, 각 수색 방향의 8개의 수색 스텝 길이의 수량을 감소하고, 서로 다른 수색 방향에 수색 스텝 길이를 할당하여 비교적 넓은 수색 범위를 커버한다.
구체적으로, 구축 부분은 초기 움직임 벡터가 가리키는 점을 중심점으로 하여 수색 위치 성상도를 구축한다.
수색 위치 성상도에 포함되는 N개의 수색 방향은 수평 수직 수색 방향을 더 포함한다. 수평 수직 수색 방향은 각각 상, 하, 좌, 우이고, 대각선 수색 방향은 각각 좌상, 좌하, 우상, 우하이다.
수색 스텝 길이는 수색 방향의 유형에 대응된다. 부호화 부분은 수색 방향의 유형이 수평 수직 수색 방향인 경우에 제 1 수색 스텝 길이 세트를 채용하고, 수색 방향의 유형이 대각선 수색 방향인 경우에 제 2 수색 스텝 길이 세트를 채용한다.
프리셋 수색 위치가 32개인 경우에 제 1 수색 스텝 길이 세트는 적어도 한가지 제 1 수색 스텝 길이를 포함하고, 제 2 수색 스텝 길이 세트는 적어도 한가지 제 2 수색 스텝 길이를 포함한다.
본 실시예에 있어서, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트는 동일하거나 상이할 수 있다.
제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 동일한 경우, 수평 수직 수색 방향과 대각선 수색 방향에서 모두 동일한 4개의 수색 스텝 길이(스텝 길이는 수색 위치와 성상도 중심점 사이의 거리이다)를 사용하여 수색 위치를 선택하는 것으로 간주할 수 있다.
또는, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 다른 경우, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트는 교차할 수 있다. 예를 들면, 수평 수직 방향의 수색 스텝 길이와 대각선 방향의 수색 스텝 길이가 엇갈리게 커진다. 하나의 예시에서, 수평 수직 방향의 거리는 우선적으로 선택되고, 대각선 방향의 수색 스텝 길이는 2개의 인접한 수평 수직 방향의 수색 스텝 길이 사이에 교차된다. 따라서, 대각선 방향의 수색이 수평 수직 방향에서 수색할 수 없는 영역을 커버할 수 있도록 한다.
즉, 제 1 수색 스텝 길이 세트의 제 1 유형의 제 1 수색 스텝 길이와 제 2 유형의 제 1 수색 스텝 길이 사이에 제 2 수색 스텝 길이 세트의 제 1 유형의 제 2 수색 스텝 길이가 있을 수 있다. 마찬가지로, 제 2 수색 스텝 길이 세트의 제 2 유형의 제 2 수색 스텝 길이와 제 3 유형의 제 2 수색 스텝 길이 사이에 제 1 수색 스텝 길이 세트의 제 3 유형의 제 1 수색 스텝 길이가 있을 수 있다.
대각선 방향 위치는 (lx, ly)로 표시되며, 여기서 lx=ly이며, 본문에서 수색 스텝 길이는 단일 값 lx로 표시된다.
예를 들어, 제 1 수색 스텝 길이는 1/4 픽셀, 1/2 픽셀, 2 픽셀, 4 픽셀 중 적어도 하나이고, 제 2 수색 스텝 길이는 1/8 픽셀, 3/8 픽셀, 3/4 픽셀, 3/2 픽셀 중 적어도 하나이다.
이하, 첨부된 도면을 참조하여 본 실시예의 기술 방안을 설명한다.
배수로 증가되는 수색 스텝 길이를 반경으로 하여 초기 모션 벡터가 가리키는 위치를 원심으로 하여 원을 그린다. 대각선 방향의 수색 스텝 길이는 모두 원의 가장자리에 가깝고 순차적으로 멀리 확장되도록 설정된다. 여기서, 수색 스텝 길이는 수색 스텝 길이에 따라 확정될 수 있다. 예를 들어, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 동일한 경우, 4가지 제 1 수색 스텝 길이 또는 4가지 제 2 수색 스텝 길이를 반경으로 하여 원을 그려 4개의 원을 획득한다. 대각선 방향과 수평 수직 방향에 모두 4개의 수색 포인트가 있다. 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 다른 경우, 각각 4개의 제 1 수색 스텝 길이, 4개의 제 2 수색 스텝 길이를 기반으로 대각선 수색 방향 및 수평 수직 수색 방향에서 복수의 수색 포인트를 획득할 수 있다.
다음, 통계를 기반으로 커버리지 영역에 따라 대표적인 수색 포인트를 선택하고, 보간 연산을 편리하게 하는 원칙에 따라 2의 거듭 제곱으로 나누어 표현할 수 있는 위치에 근사한다. 도 3에 도시된 바와 같이, 수평 방향 및 수직 방향에서 모두 1/4픽셀 위치, 1/2픽셀 위치, 2픽셀 위치, 4픽셀 위치를 선택하고, 대각선 방향에서는 (1/8, 1/8) 픽셀 위치, (3/8, 3/8) 픽셀 위치, (3/4, 3/4) 픽셀 위치, (3/2, 3/2) 픽셀 위치를 선택한다. 대표적인 수색 포인트를 선택하는 경우, 상이한 해상도 시퀀스의 상이한 통계적 특성을 고려하여, 반경이 1/2인 원과 반경이 2인 원의 근처에 더 많은 수색 포인트를 할당할 수 있다.
이에 기초하여 MMVD를 실현하는 상세한 설명은 다음과 같다.
우선, 후보 리스트로부터 초기 모션 벡터를 선택한다.
구체적으로, 여전히 VVC의 병합 후보 리스트의 앞의 2개의 후보를 재사용하여 초기 모션 벡터로 한다. 각 초기 모션 벡터에 대하여, 여전히 초기 모션 벡터 인덱스, 수색 방향 및 수색 스텝 길이와 같은 3개의 구문 요소를 사용하여 확장 표현을 수행한다.
확장 표현을 수행하는 과정에서, 수색 방향 부분에 대하여, 도 4에 도시된 바와 같이, 원래의 상, 하, 좌, 우의 4개의 방향은 상, 하, 좌, 우의 4개의 방향 및 좌상, 우상, 우하, 좌하의 4개의 방향을 포함하도록 변경된다. 즉, 원래의 방향 외에 대각선 방향이 추가된다.
도 4에 도시된 바와 같이, 새로 추가된 방향은 실선으로 표시되고, 원래의 방향은 점선으로 표시된다. 따라서, 원래의 수평 수직 방향 외에 모션 방향이 새로 추가되어, 모션 벡터 표현의 유연성을 높일 수 있다.
본 실시예에 있어서의 수색 방향 인덱스 테이블은 표 4와 같다.
표 4
다음, 수색 스텝 길이를 변경한다. 도 5에 도시된 바와 같이, 우선 원래 알고리즘의 8가지 수색 스텝 길이를 자주 사용되는 4가지 수색 스텝 길이로 감소한다.
표 5
표 5를 기반으로, 더욱 넓은 수색 범위를 커버하기 위하여, 표 6에서는 대각선 방향에 대하여 상하좌우 방향과 다른 수색 스텝 길이를 설정하였다.
표 6
마지막으로, 각 초기 모션 벡터에 대하여, 형성된 수색 방향 및 스텝 길이는 도 5에 도시된 바와 같다.상술한 기술 방안을 기반으로, 본 실시예의 부호화 부분은 적어도 하나의 수색 위치를 새로운 모션 벡터로 한다. 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 CU의 예측값을 획득한다. 그 다음에 현재 모든 예측값에 대하여 레이트 왜곡 비용 비교(rate-distortion cost comparison)를 수행하여 최적의 구문 요소 조합을 선택하고, 병합 후보 리스트에 있어서의 초기 모션 벡터의 세가지 구문 요소, 즉 위치 인덱스, 이동 방향 인덱스 및 수색 스텝 길이 인덱스를 기록한다.
상술한 방안을 채용함으로써, 랜덤 액세스 조건하에서 JVET(joint video experts team)가 요구하는 테스트 시퀀스를 테스트하고, Y, Cb, Cr 성분의 BD-rate의 평균 변동은 각각 -0.14 %, -0.12%, 0.10%이다. 이 데이터는 이 기술이 코딩 성능을 향상시킨다는 것을 나타낸다.
상술한 기술 방안을 기반으로, 본 실시예에서는, 연산 횟수가 거의 변하지 않는 조건하에서, 부호화 성능을 개선할 수 있다. 종래의 기술에서는, 2개의 초기 모션 벡터에 대하여 확장 표현을 수행할 필요가 있고, 합계 2*4*8=64회의 비교가 필요하며, 2는 2개의 초기 모션 벡터를 나타내고, 4는 수색 방향을 나타내며, 8은 수색 스텝 길이를 나타낸다. 변경 후에도 여전히 2개의 초기 모션 벡터에 대하여 확장 표현을 수행하고, 총 2*8*4=64 회의 비교가 필요하며, 8개의 수색 방향과 4개의 수색 스텝 길이를 포함한다. 본 기술은 원래의 기술과 동일한 연산 양을 유지하면서 전반적인 인코딩 성능을 향상시킬 수 있다.
이에 대응하여, 상술한 방안을 기반으로, 복호화 말단의 복잡도가 변하지 않도록 유지할 수 있다. 종래의 기술에서는, 복호화 말단에서 3개의 구문 요소를 복호화함으로써, 초기 모션 벡터에 대하여 확장 표현을 수행하고, 모션 보상을 실행하여, 마지막으로 재구성된 블록을 획득한다. 본 기술 방안에서는 여전히 3개의 구문 요소를 복호화함으로써 초기 모션 벡터에 대하여 확장 표현을 수행하므로 복잡성은 변하지 않는다.
보다시피, 본 실시예에 의해 제공되는 기술 방안에 따르면, 8개의 수색 방향 및 각 방향에 대응하는 4개의 수색 스텝 길이를 기반으로 수색 위치를 확정할 수 있다. 이와 같이, 종래 기술과 비교하면, 각 방향의 수색 스텝 길이를 감소하여 수색 스텝 길이의 일부가 선택되지 않아 부호화 효율이 낮아지는 문제를 피할 수 있고, 또한 수색 방향을 증가하여 대부분 물체의 모션 조건을 만족할 수 있으므로 모션 정보를 보다 정확하게 표현할 수 있다.
본 실시예는 디코더에 적용되는 모션 보상 처리 방법을 제공한다. 도 9에 도시된 바와 같이, 상기 방법은 아래 내용을 포함한다.
블록 41: 초기 모션 벡터의 구문 요소를 기반으로 수색 위치 성상도에 있어서의 초기 모션 벡터에 대응하는 적어도 하나의 수색 위치를 확장한다.
블록 42: 초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 재구성된 블록을 획득한다.
구문 요소는 초기 모션 벡터 인덱스, 수색 방향 인덱스, 수색 스텝 길이 인덱스를 포함하고, 수색 방향 인덱스에서 지시하는 수색 방향은 적어도 대각선 수색 방향을 포함한다.
초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 재구성된 블록을 획득하는 것은, 초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 현재 처리 블록의 재구성된 블록을 획득한다. 현재 처리 블록은 현재 코딩 블록이다.
본 실시예에 따른 방법은 비디오 인코딩 및 디코딩 시스템의 디코더에 적용될 수 있다.
총적으로 상술한 방안에 따르면, 우선 거리에 따라 여러 수색 방향에 사용 가능한 수색 포인트를 할당하여 수색 위치 성상도를 구축한 다음에, 프리셋 범위 커버리지 규칙에 따라 성상도에서 적절한 수량의 수색 위치를 선택한다.
즉, 본 실시예에 있어서, 프리셋 수색 위치가 32개인 것을 전제로 하여, 원래 4개의 수색 방향을 8개의 수색 방향으로 확장하고, 각 수색 방향의 8개의 수색 스텝 길이의 수량을 감소하고, 서로 다른 수색 방향에 수색 스텝 길이를 할당하여 비교적 넓은 수색 범위를 커버한다.
구체적으로 초기 움직임 벡터가 가리키는 점을 중심점으로 하여 수색 위치 성상도를 구축한다.
수색 위치 성상도에 포함되는 수색 방향은 수평 수직 수색 방향을 더 포함한다. 수평 수직 수색 방향은 각각 상, 하, 좌, 우이고, 대각선 수색 방향은 각각 좌상, 좌하, 우상, 우하이다.
수색 스텝 길이는 수색 방향의 유형에 대응된다.
상기 방법은 또한 아래 내용을 포함한다. 수색 방향의 유형이 수평 수직 수색 방향인 경우, 제 1 수색 스텝 길이 세트가 채용된다. 수색 방향의 유형이 대각선 수색 방향인 경우, 제 2 수색 스텝 길이 세트가 채용된다.
프리셋 수색 위치가 32개인 경우에 제 1 수색 스텝 길이 세트는 적어도 한가지 제 1 수색 스텝 길이를 포함하고, 제 2 수색 스텝 길이 세트는 적어도 한가지 제 2 수색 스텝 길이를 포함한다.
본 실시예에 있어서, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트는 동일하거나 상이할 수 있다.
제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 동일한 경우, 수평 수직 수색 방향과 대각선 수색 방향에서 모두 동일한 4개의 수색 스텝 길이(스텝 길이는 수색 위치와 성상도 중심점 사이의 거리이다)를 사용하여 수색 위치를 선택하는 것으로 간주할 수 있다.
또는, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 다른 경우, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트는 교차할 수 있다. 예를 들면, 수평 수직 방향의 수색 스텝 길이와 대각선 방향의 수색 스텝 길이가 엇갈리게 커진다. 하나의 예시에서, 수평 수직 방향의 거리는 우선적으로 선택되고, 대각선 방향의 수색 스텝 길이는 2개의 인접한 수평 수직 방향의 수색 스텝 길이 사이에 교차된다. 따라서, 대각선 방향의 수색이 수평 수직 방향에서 수색할 수 없는 영역을 커버할 수 있도록 한다.
즉, 제 1 수색 스텝 길이 세트의 제 1 유형의 제 1 수색 스텝 길이와 제 2 유형의 제 1 수색 스텝 길이 사이에 제 2 수색 스텝 길이 세트의 제 1 유형의 제 2 수색 스텝 길이가 있을 수 있다. 마찬가지로, 제 2 수색 스텝 길이 세트의 제 2 유형의 제 2 수색 스텝 길이와 제 3 유형의 제 2 수색 스텝 길이 사이에 제 1 수색 스텝 길이 세트의 제 3 유형의 제 1 수색 스텝 길이가 있을 수 있다.
대각선 방향 위치는 (lx, ly)로 표시되며, 여기서 lx=ly이며, 본문에서 수색 스텝 길이는 단일 값 lx로 표시된다.
예를 들어, 제 1 수색 스텝 길이는 1/4 픽셀, 1/2 픽셀, 2 픽셀, 4 픽셀 중 적어도 하나이고, 제 2 수색 스텝 길이는 1/8 픽셀, 3/8 픽셀, 3/4 픽셀, 3/2 픽셀 중 적어도 하나이다.
이에 기초하여 MMVD를 실현하는 상세한 설명은 다음과 같다.
우선, 후보 리스트로부터 초기 모션 벡터를 선택한다.
구체적으로, 여전히 VVC의 병합 후보 리스트의 앞의 2개의 후보를 재사용하여 초기 모션 벡터로 한다. 각 초기 모션 벡터에 대하여, 여전히 초기 모션 벡터 인덱스, 수색 방향 및 수색 스텝 길이와 같은 3개의 구문 요소를 사용하여 확장 표현을 수행한다.
확장 표현을 수행하는 과정에서, 수색 방향 부분에 대하여, 도 4에 도시된 바와 같이, 원래의 상, 하, 좌, 우의 4개의 방향은 상, 하, 좌, 우의 4개의 방향 및 좌상, 우상, 우하, 좌하의 4개의 방향을 포함하도록 변경된다. 즉, 원래의 방향 외에 대각선 방향이 추가된다.
도 4에 도시된 바와 같이, 새로 추가된 방향은 실선으로 표시되고, 원래의 방향은 점선으로 표시된다. 따라서, 원래의 수평 수직 방향 외에 모션 방향이 새로 추가되어, 모션 벡터 표현의 유연성을 높일 수 있다.
본 실시예에 있어서의 수색 방향 인덱스 테이블은 표 4와 같다.
표 4
다음, 수색 스텝 길이를 변경한다. 도 5에 도시된 바와 같이, 우선 원래 알고리즘의 8가지 수색 스텝 길이를 자주 사용되는 4가지 수색 스텝 길이로 감소한다.
표 5
표 5를 기반으로, 더욱 넓은 수색 범위를 커버하기 위하여, 표 6에서는 대각선 방향에 대하여 상하좌우 방향과 다른 수색 스텝 길이를 설정하였다.
표 6
마지막으로, 각 초기 모션 벡터에 대하여, 형성된 수색 방향 및 스텝 길이는 도 5에 도시된 바와 같다.상술한 기술 방안을 기반으로, 본 실시예는 초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 재구성된 블록을 획득하는 것을 더 포함한다.
도 7은 비디오 디코딩 시스템의 구조를 나타내는 개략도이다. 도 7에 도시된 바와 같이, 비디오 디코딩 시스템(200)은 헤더 정보 디코딩 및 CABAC(context-based adaptive binary arithmetic coding) 디코딩 모듈(201), 역변환 및 역양자화 모듈(202), 인트라 예측 모듈(203), 모션 보상 모듈(204), 디블로킹 필터링(deblocking filtering) 및 샘플 적응 오프셋(sample adaptive offset, SAO) 필터링 모듈(205), 디코딩된 화상 버퍼 모듈(206) 등을 포함한다. 비디오 이미지는 비디오 인코딩 시스템(200)의 헤더 정보 디코딩 모듈(201), 인트라 추정 모듈(202), 인트라 예측 모듈(203), 모션 보상 모듈(204), 모션 추정 모듈(205), 디코딩된 화상 버퍼 모듈(206) 등에 의해 처리된 후에 비디오 이미지의 코드 스트림을 출력한다. 상기 코드 스트림은 비디오 디코딩 시스템(200)에 입력되고, 비디오 디코딩 시스템(200)의 헤더 정보 디코딩 및 CABAC 디코딩 모듈(201), 역변환 및 역양자화 모듈(202), 인트라 예측 모듈(203) 및 모션 보상 모듈(204) 등에 의해 처리된 후에, 마지막으로 복원된 원본 비디오 이미지를 획득한다.
또한, 본 출원에 의해 제출되는 비디오 인코딩 방법은 비디오 인코딩 하이브리드 프레임워크의 인트라 예측 부분에 영향을 미칠 수 있다. 즉, 주로 비디오 인코딩에 있어서의 모션 보상 모듈(104) 및 모션 추정 모듈(105), 비디오 디코딩에 있어서의 모션 보상 모듈(204)에 적용되어, 부호화 말단과 복호화 말단 양쪽 모두에 작용한다.
상술한 방안을 기반으로, 복호화 말단의 복잡도가 변하지 않도록 유지할 수 있다. 종래의 기술에서는, 복호화 말단에서 3개의 구문 요소를 복호화함으로써, 초기 모션 벡터에 대하여 확장 표현을 수행하고, 모션 보상을 실행하여, 마지막으로 재구성된 블록을 획득한다. 본 기술 방안에서는 여전히 3개의 구문 요소를 복호화함으로써 초기 모션 벡터에 대하여 확장 표현을 수행하므로 복잡성은 변하지 않는다.
또한, 원래의 화상 프레임 내의 코딩 블록에 대하여, 디코더 측에서 우선 코딩 블록이 채용하는 부호화 모드를 확정하고, 그 다음에 확정된 부호화 모드에 따라 부호화 모드에 대응하는 후보 리스트를 확립하고, 부호화 모드에 대응하는 후보 리스트에 따라 부호화 블록에 대응하는 복호화 파라미터를 획득하고, 마지막으로 부호화 블록에 대응하는 복호화 파라미터에 따라 부호화 블록에 대한 예측 복호화를 수행한다.
코딩 블록에 대하여 예측 부호화를 수행한 다음에, 인코더는 코딩 블록에 대응하는 코드 스트림을 디코더로 전송한다. 디코더측에서 코드 스트림 내의 부호화 파라미터와 후보 리스트에 따라 복호화 파라미터를 공동으로 확정할 수 있다.
보다시피, 본 출원의 실시예에서, 대각선 수색 방향을 포함하는 N개의 수색 방향 및 여러가지 수색 스텝 길이에 따라 수색 위치를 확정한다. 따라서, 종래 기술과 비교하면, 각 방향의 수색 스텝 길이를 감소하여 수색 스텝 길이의 일부가 선택되지 않아 부호화 효율이 낮아지는 문제를 피할 수 있고, 또한 수색 방향을 증가하여 대부분 물체의 모션 조건을 만족할 수 있으므로 모션 정보를 보다 정확하게 표현할 수 있다.
본 실시예는 디코더를 제공한다. 도 10에 도시된 바와 같이, 디코더는 확장 부분(51) 및 복호화 부분(52)을 포함한다.
확장 부분(51)은 초기 모션 벡터의 구문 요소를 기반으로 수색 위치 성상도에 있어서의 초기 모션 벡터에 대응하는 적어도 하나의 수색 위치를 확장하도록 구성된다. 구문 요소는 초기 모션 벡터 인덱스, 수색 방향 인덱스, 수색 스텝 길이 인덱스를 포함하고, 수색 방향 인덱스에서 지시하는 수색 방향은 적어도 대각선 수색 방향을 포함한다.
복호화 부분(52)은 초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 재구성된 블록을 획득하도록 구성된다,
본 출원의 실시예에 따른 모션 보상 처리 방법은 비디오 인코딩 및 디코딩 시스템의 디코더에 적용될 수 있다.
총적으로 상술한 방안에 따르면, 우선 거리에 따라 여러 수색 방향에 사용 가능한 수색 포인트를 할당하여 수색 위치 성상도를 구축한 다음에, 프리셋 범위 커버리지 규칙에 따라 성상도에서 적절한 수량의 수색 위치를 선택한다.
즉, 본 실시예에 있어서, 프리셋 수색 위치가 32개인 것을 전제로 하여, 원래 4개의 수색 방향을 8개의 수색 방향으로 확장하고, 각 수색 방향의 8개의 수색 스텝 길이의 수량을 감소하고, 서로 다른 수색 방향에 수색 스텝 길이를 할당하여 비교적 넓은 수색 범위를 커버한다.
구체적으로, 확장 부분은 초기 움직임 벡터가 가리키는 점을 중심점으로 하여 수색 위치 성상도를 구축하는 데에 사용된다.
수색 위치 성상도에 포함되는 수색 방향은 수평 수직 수색 방향을 더 포함한다. 수평 수직 수색 방향은 각각 상, 하, 좌, 우이고, 대각선 수색 방향은 각각 좌상, 좌하, 우상, 우하이다.
수색 스텝 길이는 수색 방향의 유형에 대응된다.
확장 부분(51)은 수색 방향의 유형이 수평 수직 수색 방향인 경우에 제 1 수색 스텝 길이 세트를 채용하고, 수색 방향의 유형이 대각선 수색 방향인 경우에 제 2 수색 스텝 길이 세트를 채용한다.
프리셋 수색 위치가 32개인 경우에 제 1 수색 스텝 길이 세트는 적어도 한가지 제 1 수색 스텝 길이를 포함하고, 제 2 수색 스텝 길이 세트는 적어도 한가지 제 2 수색 스텝 길이를 포함한다.
본 실시예에 있어서, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트는 동일하거나 상이할 수 있다.
제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 동일한 경우, 수평 수직 수색 방향과 대각선 수색 방향에서 모두 동일한 4개의 수색 스텝 길이(스텝 길이는 수색 위치와 성상도 중심점 사이의 거리이다)를 사용하여 수색 위치를 선택하는 것으로 간주할 수 있다.
또는, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트가 다른 경우, 제 1 수색 스텝 길이 세트와 제 2 수색 스텝 길이 세트는 교차할 수 있다. 예를 들면, 수평 수직 방향의 수색 스텝 길이와 대각선 방향의 수색 스텝 길이가 엇갈리게 커진다. 하나의 예시에서, 수평 수직 방향의 거리는 우선적으로 선택되고, 대각선 방향의 수색 스텝 길이는 2개의 인접한 수평 수직 방향의 수색 스텝 길이 사이에 교차된다. 따라서, 대각선 방향의 수색이 수평 수직 방향에서 수색할 수 없는 영역을 커버할 수 있도록 한다.
즉, 제 1 수색 스텝 길이 세트의 제 1 유형의 제 1 수색 스텝 길이와 제 2 유형의 제 1 수색 스텝 길이 사이에 제 2 수색 스텝 길이 세트의 제 1 유형의 제 2 수색 스텝 길이가 있을 수 있다. 마찬가지로, 제 2 수색 스텝 길이 세트의 제 2 유형의 제 2 수색 스텝 길이와 제 3 유형의 제 2 수색 스텝 길이 사이에 제 1 수색 스텝 길이 세트의 제 3 유형의 제 1 수색 스텝 길이가 있을 수 있다.
대각선 방향 위치는 (lx, ly)로 표시되며, 여기서 lx=ly이며, 본문에서 수색 스텝 길이는 단일 값 lx로 표시된다.
예를 들어, 제 1 수색 스텝 길이는 1/4 픽셀, 1/2 픽셀, 2 픽셀, 4 픽셀 중 적어도 하나이고, 제 2 수색 스텝 길이는 1/8 픽셀, 3/8 픽셀, 3/4 픽셀, 3/2 픽셀 중 적어도 하나이다.
도 7은 비디오 디코딩 시스템의 구조를 나타내는 개략도이다. 도 7에 도시된 바와 같이, 비디오 디코딩 시스템(200)은 헤더 정보 디코딩 및 CABAC(context-based adaptive binary arithmetic coding) 디코딩 모듈(201), 역변환 및 역양자화 모듈(202), 인트라 예측 모듈(203), 모션 보상 모듈(204), 디블로킹 필터링(deblocking filtering) 및 샘플 적응 오프셋(sample adaptive offset, SAO) 필터링 모듈(205), 디코딩된 화상 버퍼 모듈(206) 등을 포함한다. 비디오 이미지는 비디오 인코딩 시스템(200)의 헤더 정보 디코딩 모듈(201), 인트라 추정 모듈(202), 인트라 예측 모듈(203), 모션 보상 모듈(204), 모션 추정 모듈(205), 디코딩된 화상 버퍼 모듈(206) 등에 의해 처리된 후에 비디오 이미지의 코드 스트림을 출력한다. 상기 코드 스트림은 비디오 디코딩 시스템(200)에 입력되고, 비디오 디코딩 시스템(200)의 헤더 정보 디코딩 및 CABAC 디코딩 모듈(201), 역변환 및 역양자화 모듈(202), 인트라 예측 모듈(203) 및 모션 보상 모듈(204) 등에 의해 처리된 후에, 마지막으로 복원된 원본 비디오 이미지를 획득한다.
또한, 본 출원에 의해 제출되는 비디오 인코딩 방법은 비디오 인코딩 하이브리드 프레임워크의 인트라 예측 부분에 영향을 미칠 수 있다. 즉, 주로 비디오 인코딩에 있어서의 모션 보상 모듈(104) 및 모션 추정 모듈(105), 비디오 디코딩에 있어서의 모션 보상 모듈(204)에 적용되어, 부호화 말단과 복호화 말단 양쪽 모두에 작용한다.
상술한 방안을 기반으로, 복호화 말단의 복잡도가 변하지 않도록 유지할 수 있다. 종래의 기술에서는, 복호화 말단에서 3개의 구문 요소를 복호화함으로써, 초기 모션 벡터에 대하여 확장 표현을 수행하고, 모션 보상을 실행하여, 마지막으로 재구성된 블록을 획득한다. 본 기술 방안에서는 여전히 3개의 구문 요소를 복호화함으로써 초기 모션 벡터에 대하여 확장 표현을 수행하므로 복잡성은 변하지 않는다.
또한, 원래의 화상 프레임 내의 코딩 블록에 대하여, 디코더 측에서 우선 코딩 블록이 채용하는 부호화 모드를 확정하고, 그 다음에 확정된 부호화 모드에 따라 부호화 모드에 대응하는 후보 리스트를 확립하고, 부호화 모드에 대응하는 후보 리스트에 따라 부호화 블록에 대응하는 복호화 파라미터를 획득하고, 마지막으로 부호화 블록에 대응하는 복호화 파라미터에 따라 부호화 블록에 대한 예측 복호화를 수행한다.
코딩 블록에 대하여 예측 부호화를 수행한 다음에, 인코더는 코딩 블록에 대응하는 코드 스트림을 디코더로 전송한다. 디코더측에서 코드 스트림 내의 부호화 파라미터와 후보 리스트에 따라 복호화 파라미터를 공동으로 확정할 수 있다.
보다시피, 본 출원의 실시예에서, 대각선 수색 방향을 포함하는 N개의 수색 방향 및 여러가지 수색 스텝 길이에 따라 수색 위치를 확정한다. 따라서, 종래 기술과 비교하면, 각 방향의 수색 스텝 길이를 감소하여 수색 스텝 길이의 일부가 선택되지 않아 부호화 효율이 낮아지는 문제를 피할 수 있고, 또한 수색 방향을 증가하여 대부분 물체의 모션 조건을 만족할 수 있으므로 모션 정보를 보다 정확하게 표현할 수 있다.
도 11은 본 출원의 실시예에 따른 하드웨어의 구조를 나타내는 개략도이다. 도면의 하드웨어는 상술한 인코더 또는 디코더일 수 있다. 도 11에 도시된 바와 같이, 본 출원의 실시예에 따른 인코더(300)는 프로세서(304)와, 프로세서(304)에 의해 실행 가능한 명령어를 저장하는 메모리(305)와, 통신 인터페이스(306)와, 프로세서(304), 메모리(305) 및 통신 인터페이스(306)를 연결하는 데에 사용되는 버스(307)를 포함한다.
또한, 본 출원의 실시예에 있어서, 상술한 프로세서(304)는 인코더 또는 디코더의 처리를 수행하도록 구성된다.
본 출원의 실시예에 있어서, 프로세서(304)는 주문형 집적 회로(Application Specific Integrated Circuit, ASIC), 디지털 신호 프로세서(Digital Signal Processor, DSP), 디지털 신호 처리 장치(Digital Signal Processor device, DSPD), 프로그래머블 로직 장치(Programmable Logic Device, PLD), 필드 프로그래머블 게이트 어레이(Field-Programmable Gate Array, FPGA), 중앙 처리 장치(central processing unit, CPU), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 중 적어도 하나일 수 있다. 상이한 디바이스에 대하여, 상술한 프로세서 기능을 구현하기 위해 사용되는 전자 디바이스는 다른 것일 수 있으며, 본 출원의 실시예는 구체적으로 한정하지 않는다. 메모리(305)는 프로세서(304)에 연결될 수 있고, 메모리(305)는 실행가능한 프로그램 코드를 저장하는 데에 사용된다. 프로그램 코드는 컴퓨터 조작 명령을 포함한다. 메모리(305)는 고속 랜덤 액세스 메모리(Random Access Memory, RAM)를 포함할 수 있거나, 또는 비휘발성 메모리, 예를 들어 적어도 2개의 디스크 저장 장치를 포함할 수 있다.
본 출원의 실시예에 있어서, 버스(307)는 통신 인터페이스(306), 프로세서(304), 메모리(305)를 연결하도록 구성되며, 이러한 디바이스들 사이의 상호 통신에 사용된다.
본 출원의 실시예에 있어서, 메모리(305)는 명령 및 데이터를 저장하는 데에 사용된다.
실제 응용에서, 메모리(305)는 랜덤 액세스 메모리(Random Access Memory, RAM)와 같은 휘발성 메모리일 수 있거나, 또는 읽기 전용 메모리(Read-Only Memory, ROM), 플래시 메모리(flash memory), 하드 디스크 드라이브(Hard Disk Drive,HDD) 또는 솔리드 스테이트 드라이브(Solid-State Drive,SSD)와 같은 비 휘발성 메모리일 수 있거나, 또는 상술한 유형의 메모리의 조합일 수 있으며, 프로세서에 명령 및 데이터를 제공한다.
또한, 본 발명의 각 실시예에서의 각 기능 모듈은 하나의 처리 유닛에 통합될 수 있고, 또는 각각의 유닛이 물리적으로 별도로 존재할 수도 있고, 또는 2개 이상의 유닛이 하나의 유닛에 통합될 수도 있다. 상술한 통합 유닛은 하드웨어 또는 소프트웨어 기능 모듈의 형태로 구현될 수 있다.
통합 유닛이 소프트웨어 기능 모듈의 형태로 구현되어 별도의 제품으로 판매되거나 사용되는 경우, 컴퓨터 판독 가능 저장 매체에 저장될 수 있다. 이러한 이해를 기초로 하여 본 발명의 기술방안의 본질, 혹은 기술 분야에 기여하는 부분 또는 기술적 방안의 전부 또는 일부를 소프트웨어 제품의 형태로 구현될 수 있다. 해당 컴퓨터 소프트웨어는 하나의 저장 매체에 저장되며, 컴퓨터 장치(개인용 컴퓨터, 서버 또는 네트워크 장치일 수 있음) 또는 프로세서가 본 발명의 각 실시예에 따른 방법의 전부 또는 일부를 실행할 수 있도록 하는 다수의 명령어를 포함한다. 전술한 저장 매체는 USB, 외장 하드, 읽기 전용 기억 장치(ROM, Read-Only Memory), 랜덤 액세스 메모리(RAM, Random Access Memory), 디스크 또는 광 디스크 등과 같은 프로그램 코드를 저장할 수 있는 다양한 매체를 포함한다.
본 출원의 실시예는 상술한 인코더의 처리를 수행하도록 구성된 이미지 인코더를 제공한다.
본 출원의 실시예는 또한 상술한 디코더의 처리를 수행하도록 구성된 디코더를 제공한다.
본 출원의 실시예는 프로그램을 저장하는 컴퓨터 판독 가능 저장 매체를 제공한다. 프로그램이 프로세서에 의해 실행되면, 상술한 실시예에서 설명된 방법을 실현한다.
당업자라면 본 출원의 실시예는 방법, 시스템 또는 컴퓨터 프로그램 제품을 제공할 수 있음을 이해할 수 있다. 따라서, 본 출원은 하드웨어 실시예, 소프트웨어 실시예 또는 소프트웨어와 하드웨어를 결합한 실시예를 채용할 수 있다. 또한, 본 출원은 하나 이상의 컴퓨터 사용 가능한 프로그램 코드를 포함하는 컴퓨터 사용 가능한 저장 매체(자기 기억 장치, 광 메모리 등을 포함하지만, 이에 한정되지 않음)에 저장된 컴퓨터 프로그램 제품 형태를 채용할 수 있다.
본 출원은 본 출원의 실시예에 따른 방법, 장치(시스템) 및 컴퓨터 프로그램 제품의 흐름도 및/또는 블록도를 참조하여 설명한다. 흐름도의 각 흐름 및/또는 블록도의 각 블록, 흐름도의 흐름 및/또는 블록도의 블록의 조합은 컴퓨터 프로그램 명령에 의해 실현될 수 있음을 이해하기 바란다. 이러한 컴퓨터 프로그램 명령은 범용 컴퓨터, 전용 컴퓨터, 임베디드 프로세서, 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세서에 제공되어 기계를 형성할 수 있으며, 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세서에서 명령을 실행함으로써, 흐름도의 하나 이상의 흐름 및/또는 블록도의 하나 이상의 블록에 의해 지정되는 기능을 실현하기 위한 디바이스를 생성할 수 있다.
이러한 컴퓨터 프로그램 명령은 컴퓨터 또는 기타 프로그램 가능한 데이터 처리 장치가 특정 방식으로 작동하도록 지시할 수 있는 컴퓨터 판독 가능 메모리에 저장될 수 있으며, 따라서 컴퓨터 판독 가능 메모리에 저장된 명령은 명령 장치를 포함하는 제품을 생성할 수 있으며, 명령 장치는 흐름도의 하나 이상의 흐름 및/또는 블록도의 하나 이상의 블록에 의해 지정되는 기능을 실현한다.
이러한 컴퓨터 프로그램 명령은 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치에 로드될 수 있으며, 따라서 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치에서 일련의 프로세스 단계를 수행하여 컴퓨터에 의해 실행되는 처리를 생성할 수 있으며, 그 결과, 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치에서 실행되는 명령은 흐름도의 하나 이상의 흐름 및/또는 블록도의 하나 이상의 블록에 의해 지정되는 기능을 실현하기 위한 단계를 제공한다.
상술한 것은 단지 본 출원의 바람직한 실시예일 뿐이며, 본 출원의 보호 범위를 한정하는 데에 사용되지 않는다.
본 출원의 실시예는 모션 보상 처리 방법, 인코더, 디코더 및 저장 매체를 제공한다. 인코더는 초기 모션 벡터를 기반으로 수색 위치 성상도를 구축한다. 수색 위치 성상도에는 N개의 수색 방향이 포함되며, 수색 방향에서 적어도 한가지 수색 스텝 길이를 사용하여 수색함으로써 적어도 하나의 수색 포인트를 획득하고, N은 1이상의 정수이고, N개의 수색 방향은 적어도 대각선 수색 방향을 포함한다. 인코더는 프리셋 범위 커버리지 규칙에 따라 수색 위치 성상도로부터 적어도 하나의 수색 위치를 선택한다. 프리셋 범위 커버리지 규칙은, 프리셋 수량의 수색 포인트를 N개의 수색 방향으로 분산시켜 선택하는 것이다. 인코더는 적어도 하나의 수색 위치를 새로운 모션 벡터로 하여, 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 코딩 유닛(coding unit, CU)의 예측값을 획득한다. 따라서, 종래 기술과 비교하면, 각 방향의 수색 스텝 길이를 감소하여 수색 스텝 길이의 일부가 선택되지 않아 부호화 효율이 낮아지는 문제를 피할 수 있고, 또한 수색 방향을 증가하여 대부분 물체의 모션 조건을 만족할 수 있으므로 모션 정보를 보다 정확하게 표현할 수 있다.
Claims (20)
- 모션 보상 처리 방법으로서,
수색 위치 성상도를 구축 초기 모션 벡터를 기반으로 수색 위치 성상도를 구성하는 것 - 상기 수색 위치 성상도에는 N개의 수색 방향이 포함되며, 상기 수색 방향에서 적어도 한가지 수색 스텝 길이를 사용하여 수색함으로써 적어도 하나의 수색 포인트를 획득하고, N은 1이상의 정수이고, 상기 N개의 수색 방향은 적어도 대각선 수색 방향을 포함함 - 과,
프리셋 범위 커버리지 규칙에 따라 상기 수색 위치 성상도로부터 적어도 하나의 수색 위치를 선택하는 것 - 상기 프리셋 범위 커버리지 규칙은, 프리셋 수량의 수색 포인트를 상기 N개의 수색 방향으로 분산시켜 선택하는 것임 - 과,
적어도 하나의 수색 위치를 새로운 모션 벡터로 하여, 상기 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 코딩 유닛(CU)의 예측값을 획득하는 것을 포함하는 것을 특징으로 하는 모션 보상 처리 방법. - 제 1 항에 있어서,
초기 모션 벡터를 기반으로 수색 위치 성상도를 구성하는 것은, 구체적으로 상기 초기 움직임 벡터가 가리키는 점을 중심점으로 하여 수색 위치 성상도를 구성하는 것을 더 포함하고,
상기 수색 위치 성상도에 포함되는 N개의 수색 방향은 수평 수직 수색 방향을 더 포함하고, 상기 수평 수직 수색 방향은 각각 상, 하, 좌, 우이고, 상기 대각선 수색 방향은 각각 좌상, 좌하, 우상, 우하인 것을 특징으로 하는 방법. - 제 2 항에 있어서,
상기 방법은,
상기 수색 방향의 유형이 수평 수직 수색 방향인 경우에 제 1 수색 스텝 길이 세트를 채용하고, 상기 수색 방향의 유형이 대각선 수색 방향인 경우에 제 2 수색 스텝 길이 세트를 채용하는 것을 더 포함하고,
상기 제 1 수색 스텝 길이 세트는 적어도 한가지 제 1 수색 스텝 길이를 포함하고, 상기 제 2 수색 스텝 길이 세트는 적어도 한가지 제 2 수색 스텝 길이를 포함하며, 상기 제 1 수색 스텝 길이 세트와 상기 제 2 수색 스텝 길이 세트는 상이한 것을 특징으로 하는 방법. - 제 3 항에 있어서,
상기 제 1 수색 스텝 길이는 1/4 픽셀, 1/2 픽셀, 2 픽셀, 4 픽셀 중 적어도 하나이고,
상기 제 2 수색 스텝 길이는 1/8 픽셀, 3/8 픽셀, 3/4 픽셀, 3/2 픽셀 중 적어도 하나인 것을 특징으로 하는 방법. - 인코더로서,
구축 부분 및 부호화 부분을 포함하고,
상기 구축 부분은 초기 모션 벡터를 기반으로 수색 위치 성상도를 구성하도록 구성되고, 상기 수색 위치 성상도에는 N개의 수색 방향이 포함되며, 상기 수색 방향에서 적어도 한가지 수색 스텝 길이를 사용하여 수색함으로써 적어도 하나의 수색 포인트를 획득하고, 상기 N은 1이상의 정수이고, 상기 N개의 수색 방향은 적어도 대각선 수색 방향을 포함하며,
상기 부호화 부분은 프리셋 범위 커버리지 규칙에 따라 상기 수색 위치 성상도로부터 적어도 하나의 수색 위치를 선택하고, 적어도 하나의 수색 위치를 새로운 모션 벡터로 하여, 상기 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 코딩 유닛의 예측값을 획득하도록 구성되며,
상기 프리셋 범위 커버리지 규칙은, 프리셋 수량의 수색 포인트를 상기 N개의 수색 방향으로 분산시켜 선택하는 것을 특징으로 하는 인코더. - 제 5 항에 있어서,
상기 구축 부분은 상기 초기 움직임 벡터가 가리키는 점을 중심점으로 하여 수색 위치 성상도를 구축하고,
상기 수색 위치 성상도에 포함되는 N개의 수색 방향은 수평 수직 수색 방향을 더 포함하고, 상기 수평 수직 수색 방향은 각각 상, 하, 좌, 우이고, 상기 대각선 수색 방향은 각각 좌상, 좌하, 우상, 우하인 것을 특징으로 하는 인코더. - 제 6 항에 있어서,
상기 부호화 부분은 상기 수색 방향의 유형이 수평 수직 수색 방향인 경우에 제 1 수색 스텝 길이 세트를 채용하고, 상기 수색 방향의 유형이 대각선 수색 방향인 경우에 제 2 수색 스텝 길이 세트를 채용하며,
상기 제 1 수색 스텝 길이 세트는 적어도 한가지 제 1 수색 스텝 길이를 포함하고, 상기 제 2 수색 스텝 길이 세트는 적어도 한가지 제 2 수색 스텝 길이를 포함하며, 상기 제 1 수색 스텝 길이 세트와 상기 제 2 수색 스텝 길이 세트는 상이한 것을 특징으로 하는 인코더. - 제 7 항에 있어서,
상기 제 1 수색 스텝 길이는 1/4 픽셀, 1/2 픽셀, 2 픽셀, 4 픽셀 중 적어도 하나이고,
상기 제 2 수색 스텝 길이는 1/8 픽셀, 3/8 픽셀, 3/4 픽셀, 3/2 픽셀 중 적어도 하나인 것을 특징으로 하는 인코더. - 디코더에 적용되는 모션 보상 처리 방법으로서,
초기 모션 벡터의 구문 요소를 기반으로 수색 위치 성상도에 있어서의 상기 초기 모션 벡터에 대응하는 적어도 하나의 수색 위치를 확장하는 것과;
상기 초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 재구성된 블록을 획득하는 것을 포함하고,
상기 구문 요소는 초기 모션 벡터 인덱스, 수색 방향 인덱스, 수색 스텝 길이 인덱스를 포함하고, 상기 수색 방향 인덱스에서 지시하는 수색 방향은 적어도 대각선 수색 방향을 포함하는 것을 특징으로 하는 모션 보상 처리 방법. - 제 9 항에 있어서,
상기 방법은, 상기 초기 움직임 벡터가 가리키는 점을 중심점으로 하여 수색 위치 성상도를 구축하는 것을 더 포함하고,
상기 수색 위치 성상도에 포함되는 수색 방향은 수평 수직 수색 방향을 더 포함하고, 상기 수평 수직 수색 방향은 각각 상, 하, 좌, 우이고, 상기 대각선 수색 방향은 각각 좌상, 좌하, 우상, 우하인 것을 특징으로 하는 방법. - 제 10 항에 있어서,
상기 방법은,
상기 수색 방향의 유형이 수평 수직 수색 방향인 경우에 제 1 수색 스텝 길이 세트를 채용하는 것과,
상기 수색 방향의 유형이 대각선 수색 방향인 경우에 제 2 수색 스텝 길이 세트를 채용하는 것을 더 포함하고,
상기 제 1 수색 스텝 길이 세트는 적어도 한가지 제 1 수색 스텝 길이를 포함하고, 상기 제 2 수색 스텝 길이 세트는 적어도 한가지 제 2 수색 스텝 길이를 포함하며, 상기 제 1 수색 스텝 길이 세트와 상기 제 2 수색 스텝 길이 세트는 상이한 것을 특징으로 하는 방법. - 제 11 항에 있어서,
상기 제 1 수색 스텝 길이는 1/4 픽셀, 1/2 픽셀, 2 픽셀, 4 픽셀 중 적어도 하나이고,
상기 제 2 수색 스텝 길이는 1/8 픽셀, 3/8 픽셀, 3/4 픽셀, 3/2 픽셀 중 적어도 하나인 것을 특징으로 하는 방법. - 디코더로서,
확장 부분과 복호화 부분을 포함하고,
상기 확장 부분은 초기 모션 벡터의 구문 요소를 기반으로 수색 위치 성상도에 있어서의 상기 초기 모션 벡터에 대응하는 적어도 하나의 수색 위치를 확장하도록 구성되고, 상기 구문 요소는 초기 모션 벡터 인덱스, 수색 방향 인덱스, 수색 스텝 길이 인덱스를 포함하고, 상기 수색 방향 인덱스에서 지시하는 수색 방향은 적어도 대각선 수색 방향을 포함하며,
상기 복호화 부분은 상기 초기 모션 벡터를 확장하여 획득한 새로운 모션 벡터를 기반으로 모션 보상을 수행하여 재구성된 블록을 획득하도록 구성되는 것을 특징으로 하는 디코더. - 제 13 항에 있어서,
상기 확장 부분은 상기 초기 움직임 벡터가 가리키는 점을 중심점으로 하여 수색 위치 성상도를 구축하는 데에 사용되고,
상기 수색 위치 성상도에 포함되는 수색 방향은 수평 수직 수색 방향을 더 포함하고, 상기 수평 수직 수색 방향은 각각 상, 하, 좌, 우이고, 상기 대각선 수색 방향은 각각 좌상, 좌하, 우상, 우하인 것을 특징으로 하는 디코더. - 제 14 항에 있어서,
상기 확장 부분은 상기 수색 방향의 유형이 수평 수직 수색 방향인 경우에 제 1 수색 스텝 길이 세트를 채용하고, 상기 수색 방향의 유형이 대각선 수색 방향인 경우에 제 2 수색 스텝 길이 세트를 채용하는 데에 사용되고,
상기 제 1 수색 스텝 길이 세트는 적어도 한가지 제 1 수색 스텝 길이를 포함하고, 상기 제 2 수색 스텝 길이 세트는 적어도 한가지 제 2 수색 스텝 길이를 포함하며, 상기 제 1 수색 스텝 길이 세트와 상기 제 2 수색 스텝 길이 세트는 상이한 것을 특징으로 하는 디코더. - 제 15 항에 있어서,
상기 제 1 수색 스텝 길이는 1/4 픽셀, 1/2 픽셀, 2 픽셀, 4 픽셀 중 적어도 하나이고,
상기 제 2 수색 스텝 길이는 1/8 픽셀, 3/8 픽셀, 3/4 픽셀, 3/2 픽셀 중 적어도 하나인 것을 특징으로 하는 디코더. - 인코더로서,
프로세서와, 상기 프로세서에 의해 실행 가능한 명령어를 저장하는 메모리와, 통신 인터페이스와, 상기 프로세서, 상기 메모리 및 상기 통신 인터페이스를 연결하는 데에 사용되는 버스를 포함하고, 상기 명령어가 상기 프로세서에 의해 실행되면, 제 1 항 내지 제 4 항 중 어느 한 항에 기재된 방법이 실현되는 것을 특징으로 하는 인코더. - 디코더로서,
프로세서와, 상기 프로세서에 의해 실행 가능한 명령어를 저장하는 메모리와, 통신 인터페이스와, 상기 프로세서, 상기 메모리 및 상기 통신 인터페이스를 연결하는 데에 사용되는 버스를 포함하고, 상기 명령어가 상기 프로세서에 의해 실행되면, 제 9 항 내지 제 12 항 중 어느 한 항에 기재된 방법이 실현되는 것을 특징으로 하는 디코더. - 인코더에 적용되는 컴퓨터 판독 가능한 저장 매체로서,
상기 컴퓨터 판독 가능한 저장 매체는 프로그램을 저장하고, 상기 프로그램이 프로세서에 의해 실행되면, 제 1 항 내지 제 4 항 중 어느 한 항에 기재된 방법이 실현되는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체. - 디코더에 적용되는 컴퓨터 판독 가능한 저장 매체로서,
상기 컴퓨터 판독 가능한 저장 매체는 프로그램을 저장하고, 상기 프로그램이 프로세서에 의해 실행되면, 제 9 항 내지 제 12 항 중 어느 한 항에 기재된 방법이 실현되는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/092829 WO2020258039A1 (zh) | 2019-06-25 | 2019-06-25 | 运动补偿的处理方法、编码器、解码器以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220024020A true KR20220024020A (ko) | 2022-03-03 |
Family
ID=74060441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217040779A KR20220024020A (ko) | 2019-06-25 | 2019-06-25 | 모션 보상 처리 방법, 인코더, 디코더 및 저장 매체 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11490113B2 (ko) |
EP (1) | EP3972257A4 (ko) |
JP (1) | JP7381615B2 (ko) |
KR (1) | KR20220024020A (ko) |
CN (2) | CN114222136B (ko) |
WO (1) | WO2020258039A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023051646A1 (en) * | 2021-09-30 | 2023-04-06 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8462850B2 (en) * | 2004-07-02 | 2013-06-11 | Qualcomm Incorporated | Motion estimation in video compression systems |
CN101326821B (zh) * | 2006-03-14 | 2011-05-25 | 索尼株式会社 | 图像处理设备和图像处理方法 |
US8671344B2 (en) * | 2009-02-02 | 2014-03-11 | Panasonic Corporation | Information display device |
CN101795409B (zh) * | 2010-03-03 | 2011-12-28 | 北京航空航天大学 | 内容自适应分数像素运动估计方法 |
US9628674B2 (en) * | 2010-06-02 | 2017-04-18 | Cisco Technology, Inc. | Staggered motion compensation for preprocessing video with overlapped 3D transforms |
US9635308B2 (en) * | 2010-06-02 | 2017-04-25 | Cisco Technology, Inc. | Preprocessing of interlaced video with overlapped 3D transforms |
US8472725B2 (en) * | 2010-06-02 | 2013-06-25 | Cisco Technology, Inc. | Scene change detection and handling for preprocessing video with overlapped 3D transforms |
US9451277B2 (en) * | 2012-02-08 | 2016-09-20 | Qualcomm Incorporated | Restriction of prediction units in B slices to uni-directional inter prediction |
JP5987768B2 (ja) * | 2012-04-16 | 2016-09-07 | 株式会社Jvcケンウッド | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム |
CN104077796B (zh) * | 2013-03-28 | 2017-01-18 | 北京京东方光电科技有限公司 | 一种将二维图像转换为三维图像的方法和装置 |
EP3018907A4 (en) | 2013-07-12 | 2017-02-22 | Samsung Electronics Co., Ltd. | Method for predicting disparity vector based on blocks for apparatus and method for inter-layer encoding and decoding video |
EP3180918A1 (en) * | 2014-08-12 | 2017-06-21 | Intel Corporation | System and method of motion estimation for video coding |
FR3041495B1 (fr) * | 2015-09-17 | 2017-10-20 | Ateme | Procede d'encodage d'image et equipement pour la mise en oeuvre du procede |
EP3171595A1 (en) * | 2015-11-18 | 2017-05-24 | Thomson Licensing | Enhanced search strategies for hierarchical motion estimation |
WO2017094298A1 (ja) * | 2015-12-04 | 2017-06-08 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
WO2017142327A1 (ko) * | 2016-02-16 | 2017-08-24 | 삼성전자 주식회사 | 인트라 예측오차의 감소를 위한 인트라 예측 방법 및 그 장치 |
CN105959705B (zh) * | 2016-05-10 | 2018-11-13 | 武汉大学 | 一种面向可穿戴设备的视频直播方法 |
JP2018032949A (ja) * | 2016-08-23 | 2018-03-01 | キヤノン株式会社 | 動きベクトル検出装置およびその制御方法 |
CN116320493A (zh) * | 2016-11-28 | 2023-06-23 | 韩国电子通信研究院 | 用于滤波的方法和装置 |
JP2018107762A (ja) * | 2016-12-28 | 2018-07-05 | 日本電信電話株式会社 | 映像符号化方法、映像符号化装置、及び映像符号化プログラム |
CN110832865A (zh) * | 2017-07-04 | 2020-02-21 | 三星电子株式会社 | 图像编码方法和设备以及图像解码方法和设备 |
US10595045B2 (en) * | 2017-07-27 | 2020-03-17 | Advanced Micro Devices, Inc. | Device and method for compressing panoramic video images |
CN116708780A (zh) * | 2017-08-11 | 2023-09-05 | 华为技术有限公司 | 视频图像编码和解码的方法、装置及设备 |
WO2019072371A1 (en) * | 2017-10-09 | 2019-04-18 | Huawei Technologies Co., Ltd. | MEMORY ACCESS WINDOW FOR PREDICTION SUB-BLOCK MOTION VECTOR CALCULATION |
CN109660799A (zh) * | 2017-10-12 | 2019-04-19 | 北京金山云网络技术有限公司 | 视频编码中的运动估计方法、装置、电子设备及存储介质 |
CN115941941A (zh) * | 2017-11-29 | 2023-04-07 | 韩国电子通信研究院 | 采用环内滤波的图像编码/解码方法和装置 |
JP7310794B2 (ja) * | 2018-03-16 | 2023-07-19 | ソニーグループ株式会社 | 画像処理装置と画像処理方法 |
WO2019199127A1 (ko) * | 2018-04-12 | 2019-10-17 | 삼성전자 주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
US10783647B2 (en) * | 2018-05-24 | 2020-09-22 | Cisco Technology, Inc. | Real-time object tracking |
CN118784864A (zh) * | 2018-12-07 | 2024-10-15 | 夏普株式会社 | 运动图像解码装置 |
-
2019
- 2019-06-25 CN CN202111584028.0A patent/CN114222136B/zh active Active
- 2019-06-25 KR KR1020217040779A patent/KR20220024020A/ko not_active Application Discontinuation
- 2019-06-25 EP EP19935161.0A patent/EP3972257A4/en not_active Ceased
- 2019-06-25 WO PCT/CN2019/092829 patent/WO2020258039A1/zh unknown
- 2019-06-25 CN CN201980096079.3A patent/CN113785592A/zh active Pending
- 2019-06-25 JP JP2021573521A patent/JP7381615B2/ja active Active
-
2021
- 2021-12-09 US US17/643,522 patent/US11490113B2/en active Active
-
2022
- 2022-09-15 US US17/945,261 patent/US11910003B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3972257A4 (en) | 2022-06-08 |
US11910003B2 (en) | 2024-02-20 |
US11490113B2 (en) | 2022-11-01 |
CN114222136A (zh) | 2022-03-22 |
CN114222136B (zh) | 2024-10-01 |
JP2022541104A (ja) | 2022-09-22 |
CN113785592A (zh) | 2021-12-10 |
EP3972257A1 (en) | 2022-03-23 |
US20230007295A1 (en) | 2023-01-05 |
WO2020258039A1 (zh) | 2020-12-30 |
JP7381615B2 (ja) | 2023-11-15 |
US20220103857A1 (en) | 2022-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6995952B2 (ja) | インタ予測方法及びその装置 | |
TWI759389B (zh) | 用於視訊寫碼之低複雜度符號預測 | |
KR102435393B1 (ko) | 참조 유닛 결정 방법 및 장치 | |
CN110383841B (zh) | 用于视频编码或解码的方法、编码器、解码器及介质 | |
RU2696304C2 (ru) | Способ декодирования видеосигнала | |
US20180160113A1 (en) | Method and device for encoding and decoding intra-frame prediction | |
US20240056606A1 (en) | Encoding method and apparatus therefor, and decoding method and apparatus therefor | |
US11412251B2 (en) | Video decoding method and apparatus and video encoding method and apparatus | |
CN111567047B (zh) | 进行子预测块运动矢量推导的存储器访问窗口 | |
US20220417553A1 (en) | Encoding method and apparatus therefor, and decoding method and apparatus therefor | |
KR20200005648A (ko) | 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치 | |
US20180352221A1 (en) | Image encoding method and device, and image decoding method and device | |
US20220078436A1 (en) | Image encoding/decoding method and device | |
JP7437426B2 (ja) | インター予測方法および装置、機器、記憶媒体 | |
KR20220024020A (ko) | 모션 보상 처리 방법, 인코더, 디코더 및 저장 매체 | |
US11882307B2 (en) | Method and apparatus for decoding video, and method and apparatus for encoding video | |
KR102031120B1 (ko) | 인트라 예측 부호화 및 복호화 방법과 상기 방법을 수행하는 장치 | |
JP6323185B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
KR20200138137A (ko) | 영상 부호화/복호화 방법 및 장치 | |
CN116684578A (zh) | 基于控制点运动矢量的仿射模型优化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |