KR101740039B1 - 적응형 기하학적 분할을 이용한 비디오 인코딩 및 디코딩 방법 및 장치 - Google Patents

적응형 기하학적 분할을 이용한 비디오 인코딩 및 디코딩 방법 및 장치 Download PDF

Info

Publication number
KR101740039B1
KR101740039B1 KR1020127001936A KR20127001936A KR101740039B1 KR 101740039 B1 KR101740039 B1 KR 101740039B1 KR 1020127001936 A KR1020127001936 A KR 1020127001936A KR 20127001936 A KR20127001936 A KR 20127001936A KR 101740039 B1 KR101740039 B1 KR 101740039B1
Authority
KR
South Korea
Prior art keywords
geometric
partitions
subset
distance
region
Prior art date
Application number
KR1020127001936A
Other languages
English (en)
Other versions
KR20120096458A (ko
Inventor
리웨이 구오
펭 인
조엘 솔
윤페이 정
시아오안 루
치안 수
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20120096458A publication Critical patent/KR20120096458A/ko
Application granted granted Critical
Publication of KR101740039B1 publication Critical patent/KR101740039B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/543Motion estimation other than block-based using regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

적응형 기하학적 분할을 이용해서 비디오 인코딩 및 디코딩하는 방법 및 장치가 제공된다. 장치는 적응형 기하학적 분할을 이용해서 화상 내의 하나의 영역에 대한 화상 데이터를 인코딩하는 인코더(100)를 포함하되, 상기 영역에 대한 화상 데이터를 코딩하는데 이용되는 기하학적 분할부들의 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정된다. 상기 거리는 상기 영역 내의 지점으로부터 분할 경계까지 측정된다. 상기 각도는 적어도 상기 영역 내의 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된다.

Description

적응형 기하학적 분할을 이용한 비디오 인코딩 및 디코딩 방법 및 장치{METHODS AND APPARATUS FOR VIDEO ENCODING AND DECODING USING ADAPTIVE GEOMETRIC PARTITIONING}
관련 출원의 교차 참조
본 출원은 미국 특허 가출원 제61/220,918호(출원일: 2009년 6월 26일, 대리인 문서 번호: PU090067)의 우선권을 주장하며, 그 전문은 본 명세서에 참조로 포함된다.
기술 분야
본 발명은 비디오 인코딩 및 디코딩에 관한 것으로, 특히 적응형 기하학적 분할(adaptive geometric partitioning)을 이용한 비디오 인코딩/디코딩 방법 및 장치에 관한 것이다.
프레임 분할(frame partitioning)은 유효한 비디오 코딩에 있어서 중요한 주된 방식이다. 현재의 비디오 압축 기술의 대부분은 트리 기반 프레임 분할(tree based frame partitioning)을 이용한다. 하나의 예시적인 현재의 비디오 압축 기술은 ISO/IEC(International Organization for Standardization/International Electrotechnical Commission) MPEG-4(Moving Picture Experts Group-4) 파트 10 AVC(Advanced Video Coding) 표준/국제 전기통신 연합, 전기통신 영역(ITU-T) H.264 권장사항(이하, "MPEG-4 AVC 표준"이라 칭함)을 포함한다. MPEG-4 AVC 표준에 있어서의 프레임 분할은 단순한 균일한 블록 분할보다 훨씬 효율적이고, 이 후자는 전형적으로 MPEG-2와 같은 보다 구식의 비디오 코딩 표준에서 이용된다. 그러나, 트리 기반 프레임 분할은, 2차원(2D) 데이터의 기하학적 구조를 포획할 수 없으므로, 여전히 비디오 정보를 효율적으로 충분히 코딩하지 못한다.
기하학적-적응형 블록 분할은 상기 코딩 효율을 향상시키기 위하여 제안되어 있었지만, 복잡성의 대가를 치르고 있다. 개선된 성능을 얻기 위하여, 첫번째 종래 기술의 접근법은 각각의 거리 및 각도에 의거해서 분할 모드들을 모두 지원한다. 이 첫번째 종래 기술의 접근법에서는, 블록을 분할하는 간단한 적응형 모델이 이용된다. 더욱 상세하게는, 직선 모델이 예측가능한 영역들의 로컬 기하학적 통계 의존성을 포획하기 위하여 각도 및 위치를 적합화하는데 이용된다. 선 코딩(line coding)은 두 인덱스(index)를 전송함으로써 수행된다. 이들 두 인덱스의 각각은 블록의 중심에 대한 각도 및 거리의 값에 상당한다. 거리 Δρ 및 각도 Δθ에 대한 양자화 스텝(quantization step)은 분할부를 코딩하는데 소요되는 비트에서 최상의 비율-왜곡(rate-distortion: R-D) 절충점(뿐만 아니라, 필요한 경우, 최대 허용된 계산 복잡성에 대한 제어)을 지니기 위하여 하이 신택스 레벨(high syntax level) 상에 고정될 수 있다.
두번째 종래 기술의 접근법은 수직, 수평 혹은 대각(+45도 혹은 -45도) 방위에 대한 각도 Δθ를 제한함으로써 분할 모드 복잡성을 감소시키려고 노력하고 있다. 그러나, 이것은 상기 첫번째 종래 기술의 접근법과 비교할 때 성능을 저하시킨다.
이러한 제한을 해소하기 위하여, 첫번째 종래 기술의 접근법은 그의 2차원적 기하 형태를 고려함으로써 2D 비디오 데이터를 더욱 잘 표현하고 코딩하는 방법을 제공한다. 즉, 상기 첫번째 종래 기술의 접근법은 인터 예측(inter prediction)(INTER16×l6GEO, INTER8×8GEO) 및 인트라 예측(intra prediction)(INTRA16×16GEO, INTRA8×8GEO)의 양쪽 모두에 대한 새로운 세트의 모드들에 대해서 쐐기 분할(wedge partition)(즉, 임의의 선 혹은 곡선에 의해 분리된 두 영역 내의 블록의 분할)을 이용한다.
블록들 내의 기하학적 분할부들은 하나의 선의 음함수 공식(implicit formulation)에 의해 모델화된다. 따라서, 분할부들은 다음과 같이 정의된다:
Figure 112012006079223-pct00001
식 중, ρ 및 θ는 각각 원점으로부터 f(x,y)에 대한 직교방향에 있어서의 경계선까지의 거리; 및 수평 좌표축 x를 이용한 f(x,y)에 대한 직교방향의 각도를 나타낸다.
각 블록 화소 (x,y)는 다음과 같이 분류된다:
Figure 112012006079223-pct00002
코딩 목적을 위하여, 가능한 기하학적 분할부들(혹은 기하학적 모드들)의 사전(dictionary)(규정된 편찬물 혹은 일람)은 선험적으로 규정되어 있다. 이것은 다음과 같이 f(x,y)의 각 파라미터에 대한 값 범위를 결정하고 정확도를 샘플링함으로써 형식적으로 규정될 수 있다:
Figure 112012006079223-pct00003
Figure 112012006079223-pct00004
식 중, Δρ 및 Δθ는 선택된 양자화(파라미터 분해) 스텝이고, MBsize는 매크로블록의 크기이다. θ 및 ρ에 대한 양자화된 인덱스는 분할 경계선을 코딩하도록 전송된 정보이다. 그러나, 모드 16×8 및 8×16이 이 코딩 절차에서 이용된다면, 각도 0 및 90은, ρ=0인 경우에 대해서, 가능한 가장자리부들의 세트로부터 제거될 수 있다.
첫번째 종래 기술의 접근법에서 제시된 실시형태 내에서, 기하학적-적응형 움직임 보상 모드에 대해서, 각 분할부를 위한 θ, ρ 및 움직임 벡터에 대한 검색은 최상의 배치 형태를 찾기 위하여 수행된다. 전체 검색 전략은 두 단계로 수행되므로, 매 θ, ρ쌍에 대해서, 최상의 움직임 벡터가 검색된다. 기하학적-적응형 인트라 예측 모드 내에서, 각 분할부를 위한 θ, ρ 및 최상의 예측변수(predictor)(방향성 예측 혹은 통계자료(statistics) 등)에 대한 검색은 최상의 배치 형태를 찾기 위하여 수행된다.
인코더(encoder) 측에서, 기하학적 모드에 대한 계산 복잡성은, 전체 검색이 이용된다면, 매우 높을 수 있다. 디코더(decoder) 측에서, 해당 디코더는 모든 분할 모드를 지원할 필요가 있다. 룩업 테이블이 모드 형상의 즉석 계산(on-the-fly computation)을 저감시키는데 이용된다면, 해당 테이블은 매우 클 것이다.
상기 두번째 종래 기술의 접근법에서 기재된 다른 기하학적 분할 작업은 단지 수직, 수평 혹은 대각(+45도 혹은 -45도) 방위를 허용함으로써 기하학적 모드의 수를 저감시고자 시도하고 있다. 이것은 상기 결정의 복잡성을 감소시키지만, 저하된 코딩 성능을 희생한다.
종래 기술의 이들 및 기타 결점 및 단점들은 적응형 기하학적 분할을 이용하는 비디오 인코딩/디코딩 방법 및 장치에 관한 본 발명에 의해 대처된다.
본 발명의 일 양상에 따르면, 장치가 제공된다. 이러한 본 발명의 장치는 적응형 기하학적 분할을 이용해서 화상(picture) 내의 하나의 영역에 대한 화상 데이터를 인코딩하는 인코더를 포함하되, 상기 영역에 대한 화상 데이터를 코딩하는데 이용되는 기하학적 분할부들의 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정된다. 상기 거리는 상기 영역 내의 규정된 지점으로부터 분할 경계까지 측정된다. 상기 각도는 상기 영역 내의 상기 규정된 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된다.
본 발명의 다른 양상에 따르면, 비디오 인코더에서의 방법이 제공된다. 해당 방법은 적응형 기하학적 분할을 이용해서 화상 내의 하나의 영역에 대한 화상 데이터를 인코딩하는 단계를 포함하되, 상기 영역에 대한 화상 데이터를 코딩하는데 이용되는 기하학적 분할부들의 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정된다. 상기 거리는 상기 영역 내의 규정된 지점으로부터 분할 경계까지 측정된다. 상기 각도는 적어도 상기 영역 내의 상기 규정된 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된다.
본 발명의 또 다른 양상에 따르면, 장치가 제공된다. 해당 장치는 적응형 기하학적 분할을 이용해서 화상 내의 하나의 영역에 대한 화상 데이터를 디코딩하는 디코더를 포함하되, 상기 영역에 대한 화상 데이터를 디코딩하는데 이용되는 기하학적 분할부들의 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정된다. 상기 거리는 상기 영역 내의 규정된 지점으로부터 분할 경계까지 측정된다. 상기 각도는 상기 영역 내의 상기 규정된 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된다.
본 발명의 또 다른 양상에 따르면, 비디오 디코더에서의 방법이 제공된다. 해당 방법은 적응형 기하학적 분할을 이용해서 화상 내의 하나의 영역에 대한 화상 데이터를 디코딩하는 단계를 포함하되, 상기 영역에 대한 화상 데이터를 디코딩하는데 이용되는 기하학적 분할부들의 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정된다. 상기 거리는 상기 영역 내의 규정된 지점으로부터 분할 경계까지 측정된다. 상기 각도는 상기 영역 내의 상기 규정된 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된다.
본 발명의 이들 및 기타 양상, 특성 및 이점들은 첨부 도면과 관련하여 읽게 될 이하의 예시적인 실시형태의 상세한 설명으로부터 명백해질 것이다.
본 발명은 이하의 예시적인 도면에 따라 더욱 잘 이해될 수 있다.
도 1은 본 발명의 일 실시형태에 따라서, 본 발명이 적용될 수 있는 예시적인 인코더의 블록도;
도 2는 본 발명의 일 실시형태에 따라서, 본 발명이 적용될 수 있는 예시적인 디코더의 블록도;
도 3은 본 발명의 일 실시형태에 따라서, 본 발명이 적용될 수 있는 이미지 블록(image block)의 예시적인 기하학적 분할의 블록도;
도 4는 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할을 이용해서 화상 데이터를 인코딩하는 예시적인 방법의 흐름도;
도 5는 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 인코더 측에서 최상의 예측을 위하여 검색하는 예시적인 방법의 흐름도;
도 6은 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드를 위하여 엔트로피 코딩(entropy coding)하는 예시적인 방법의 흐름도;
도 7은 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 예시적인 방법의 흐름도;
도 8은 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법의 흐름도;
도 9는 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법의 흐름도;
도 10은 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법의 흐름도;
도 11은 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법의 흐름도;
도 12는 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법의 흐름도;
도 13은 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 예시적인 방법의 흐름도;
도 14는 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 다른 예시적인 방법의 흐름도;
도 15는 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 다른 예시적인 방법의 흐름도;
도 16은 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 예시적인 방법의 흐름도;
도 17은 본 발명의 일 실시형태에 따라서, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 다른 예시적인 방법의 흐름도.
본 발명은 적응형 기하학적 분할을 이용하는 비디오 인코딩/디코딩 방법 및 장치에 관한 것이다.
본 명세서는 본 발명의 원리에 대해서 설명하고 있다. 따라서 당업자라면 비록 여기서는 명시적으로 설명하거나 도시하지는 않았지만 본 발명의 원리를 구체화하고 본 발명의 본질과 범위 내에 있는 여러 가지 구성을 강구해낼 수 있을 것이다.
여기에 인용된 예와 조건문들은 모두 본 발명자(들)가 기술 발전에 기여한 본 발명의 원리와 그 개념을 독자들이 이해하는데 도움을 주고자 한 것이며, 그러한 특정 예와 조건에 한정되지 않는 것으로 해석하여야 한다.
더욱이 여기서 본 발명의 원리, 양상 및 실시형태들뿐만 아니라 그의 구체적인 실시예를 기재하는 모든 설명문들은 그 구조적 기능적 등가물을 포괄하는 것이다. 그 외에도 그와 같은 등가물은 현재 공지된 등가물은 물론 장래에 개발될 등가물, 즉, 구조를 불문하고 동일 기능을 수행하도록 개발되는 구성요소를 포함하도록 의도되어 있다.
따라서, 예컨대, 당업자라면 여기서 제시된 블록도가 본 발명을 구체화하는 예시적인 회로의 개념도를 나타냄을 잘 알 것이다. 마찬가지로, 순서도, 흐름도, 상태 전이도, 의사코드 등은 컴퓨터 판독 매체에서 실체적으로 표현될 수 있고 따라서 컴퓨터 또는 프로세서가 명시적으로 나타나 있든지 없든지 간에 이러한 컴퓨터 또는 프로세서에 의해 실행될 수 있는 여러 가지 프로세스를 나타냄을 이해할 필요가 있다.
상기 도면들에 도시된 각종 구성요소의 기능은 전용 하드웨어는 물론 적절한 소프트웨어와 연관하여 소프트웨어를 실행할 수 있는 하드웨어를 통해 제공될 수 있다. 이 기능들은, 프로세서를 통해 제공되는 경우에는, 단일의 전용 프로세서, 단일의 공유 프로세서, 또는 일부가 공유될 수 있는 복수의 개별 프로세서를 통해 제공될 수 있다. 더욱이, "프로세서"나 "제어기"라는 용어를 명시적으로 사용하더라도 이들이 소프트웨어를 실행할 수 있는 하드웨어만을 배타적으로 의미하는 것으로 해석해서는 안되고 DSP(Digital Signal Processor) 하드웨어, 소프트웨어를 저장하는 ROM(Read-Only Memory), RAM(Random Access Mmeory) 및 비휘발성 저장 장치를 아무런 제한없이 암시적으로 포함할 수 있다.
다른 종래의 및/또는 관행적인 하드웨어도 포함될 수 있다. 마찬가지로, 도면들에 도시된 스위치들도 단지 개념적인 것이다. 이들의 기능은 프로그램 로직의 동작을 통해, 전용 로직을 통해, 프로그램 컨트롤과 전용 로직의 상호 작용을 통해, 또는 수동으로도 실시될 수 있으며, 본 명세서로부터 더 구체적으로 이해할 수 있는 바와 같이, 실행자가 특정 기술을 선택할 수 있다.
특허청구범위에서, 특정 기능을 수행하기 위한 수단으로 표현된 구성요소는 예컨대 a) 그 기능을 수행하는 회로 요소들의 조합, 또는 b) 펌웨어, 마이크로코드 등을 포함한 임의의 형태의 소프트웨어로서 그 기능을 수행하는 그 소프트웨어를 실행하는 적당한 회로와 조합된 소프트웨어를 포함하여, 그 기능을 수행하는 어떠한 방식도 모두 포함하는 것이다. 그러한 특허청구범위에 기재된 본 발명의 원리는 여러 가지 기재된 수단이 제공하는 기능들이 특허청구범위가 필요로 하는 방식으로 조합되고 묶여진다는 사실에 있다. 따라서, 이러한 기능들을 제공할 수 있는 수단은 여기에 표시된 수단들과 등가인 것으로 간주해야 한다.
명세서에서 본 발명의 "일 실시형태" 또는 "하나의 실시형태"는 물론 그 파생어는 그 실시형태와 관련하여 기재된 특수한 특성, 구조, 특징 등이 본 발명의 적어도 하나의 실시형태에 포함된다는 것을 의미한다. 따라서 본 명세서 전체에 걸쳐 여러 곳에서 나타나는 "일 실시형태에서" 또는 "하나의 실시형태에서"라는 구절은 물론 그 파생어는 반드시 같은 실시형태를 말하는 것은 아니다.
예컨대 "A/B", "A 및/또는 B" 및 "A와 B 중 적어도 어느 하나"의 경우에서 "/", "및/또는" 및 "적어도 어느 하나"를 사용하는 것은 첫번째 옵션 (A)만, 두번째 옵션 (B)만, 양 옵션 (A 및 B)를 선택하는 것을 포함하는 것임을 알아야 한다. 추가 예로서, "A, B 및/또는 C" 및 "A, B 및 C 중 적어도 어느 하나"의 경우에 이러한 구절은 첫번째 옵션 (A)만, 두번째 옵션 (B)만, 세번째 옵션 (C)만, 첫번째 옵션 (A)와 두번째 옵션 (B)만, 첫번째 옵션 (A)와 세번째 옵션 (C)만, 두번째 옵션 (B)와 세번째 옵션 (C)만, 세가지 옵션 모두(A, B 및 C)를 선택하는 것을 포함하는 것이다. 이것은 당업자라면 쉽게 알 수 있는 바와 같이 더 많은 옵션에 대해서도 확장될 수 있다.
게다가, 본 발명의 하나 이상의 실시형태는 MPEG-4 AVC 표준에 관하여 여기에서 설명되어 있지만, 본 발명은 이 표준으로만 제한되지 않고, 본 발명의 정신을 유지하면서, MPEG-4 AVC 표준의 확장을 비롯한, 그의 표준, 권장사항 및 그의 확장을 코딩하는 다른 비디오에 관해서도 이용될 수 있다는 것을 이해할 수 있을 것이다.
또, 본 명세서에서 이용되는 바와 같이, "화상" 및 "이미지"란 단어는 호환가능하게 이용되며, 비디오 시퀀스(video sequence)로부터의 정지 이미지 혹은 화상을 의미한다. 공지된 바와 같이, 픽처는 하나의 프레임(frame) 혹은 필드(field)일 수 있다.
본 명세서에서 이용되는 바와 같이, "하이 레벨 신택스"(high level syntax)란 매크로블록 층의 위쪽에서 계층적으로 존재하는 비트스트림 내에 존재하는 신택스를 의미한다. 예를 들어, 하이 레벨 신택스는, 본 명세서에서 이용되는 바와 같이, 슬라이스 헤더 레벨, SEI(Supplemental Enhancement Information) 레벨, PPS(Picture Parameter Set) 레벨, SPS(Sequence Parameter Set) 레벨 및 NAL(Network Abstraction Layer) 단위 헤더 레벨에서의 신택스를 지칭할 수 있지만, 이들로 제한되는 것은 아니다.
또, 본 명세서에서 이용되는 바와 같이, "신호화"(signal)란 단어는 대응하는 디코더에 대해서 어떤 것을 표시하는 것을 의미한다. 예를 들어, 인코더는 인코더 측 상에서 특정 서브세트가 사용되는 것을 디코더에 알리기 위하여, 기하학적 분할부들의 복수개의 서브세트 중에서 기하학적 분할부들의 특정한 하나의 서브세트를 신호화할 수 있다(즉, 신호로 보낼 수 있다). 이와 같이 해서, 해당 동일한 서브세트가 인코더 측과 디코더 측의 양쪽 모두에서 이용될 수 있다. 따라서, 예를 들어, 인코더는 디코더가 동일한 특정 서브세트를 이용하도록 디코더에 서브세트를 전송할 수 있거나, 또는 디코더가 다른 것뿐만 아니라 특정 서브세트를 이미 지니고 있다면, 신호화는 단순히 디코더가 특정 서브세트를 인지하여 선택할 수 있도록 (전송없이) 하는데 이용될 수 있다. 임의의 실제 서브세트의 전송을 피하기 위하여, 비트 절약화가 실현될 수 있다. 신호화가 다양한 방식으로 달성될 수 있다는 것을 이해할 필요가 있다. 예를 들어, 하나 이상의 신택스 요소, 플래그 등이 대응하는 디코더에 대해서 정보를 신호화하는 데 이용될 수 있다.
또한, 본 명세서에서 이용되는 바와 같이, "화상 영역"(혹은 단순히 "영역"이라 약칭할 경우도 있음)이란 어구는 예를 들어 임의의 크기의 하나 이상의 블록 혹은 임의의 형상으로부터 내포되고/되거나 다르게는 만들어지는 화상의 일부를 의미한다. 하나 이상의 블록은, 예를 들어, 수퍼 매크로블록, 매크로블록, 매크로블록 분할, 서브-매크로블록 분할 등에 관한 것일 수 있다. 일례에 있어서, 하나의 영역은 하나의 블록일 수 있고, 이 경우, 하나의 분할 경계는 그 블록의 하나의 가장자리부일 수 있다. 영역(화상 내)을 고려할 수 있는 것 및 해당 영역의 분할 경계를 고려할 수 있는 이들 및 기타 변형예는 본 발명의 정신을 유하면서 본 명세서에서 제공된 본 발명의 교시 내용을 고려해서 당업자에 의해 용이하게 결정된다.
또, 본 명세서에서 이용되는 바와 같이, "후속 영역"이란 어구는 아직 코딩 또는 디코딩되지 않은 화상 혹은 비디오 시퀀스 내의 영역을 의미한다. 이 어구는 코딩 혹은 디코딩되고 있는 (현행) 영역 사이를 구별하는데 이용된다.
또한, 본 명세서에서 이용되는 바와 같이, "기하학적 분할부들의 서브세트"란 어구는 억지 계산(brute force computation) 혹은 일람에서 이용될 수 있는 기하학적 분할부들 전체보다 적은 기하학적 분할부들의 그룹화를 의미한다. 이와 같이 해서, 대응하는 인코더 혹은 디코더에 의해 고려될 필요가 있는 기하학적 분할부들의 총 수가 저감된다.
또, 본 명세서에서 이용되는 바와 같이, "거리 간격"(distance space)이란 어구는 기하학적 모드의 거리 파라미터에 대한 모든 허용된 값들의 세트를 의미한다. 예를 들어 16×16 블록에 대해서, 거리의 최대값은 11.312(주 대각선의 길이, 16×1.414/2)이고, 최소값은 음일 수 없으므로 0이다. 거리 파라미터에 대해서 너무 많은 선택지가 있으므로, 기하학적 분할 사전을 구축할 경우 전체 공간으로부터의 값의 제한된 수를 단지 선택한다(이 "선택하는" 것은 "샘플링"이라고도 호칭된다).
또한, 본 명세서에서 이용되는 바와 같이, "각도 간격"이란 어구는 각도 파라미터에 대한 모든 허용된 값들의 세트를 의미한다. 거리 파라미터가 0일 경우, 각도 간격은 [0, 180)이다(즉, 0보다 크거나 동일한 임의의 값일 수 있지만 180보다 작을 수 있다). 거리 파라미터가 0보다 크면, 각도 간격은 [0, 360)이다(즉, 0보다 크거나 동일한 임의의 값일 수 있지만, 180보다 작을 수 있다).
위에서 언급된 바와 같이, 본 발명은 기하학적 분할을 이용해서 비디오 인코딩/디코딩하는 방법 및 장치에 관한 것이다.
도 1을 참조하면, MPEG-4 AVC 표준에 따라서 비디오 인코딩을 수행하는 것이 가능한 비디오 인코더는 참조번호 (100)으로 일반적으로 표시되어 있다. 비디오 인코더(100)는 컴바이너(combiner)(185)의 비반전 입력(non-inverting input)과 신호 통신(signal communication)하는 출력을 지니는 프레임 정렬 버퍼(frame ordering buffer)(110)를 포함한다. 컴바이너(185)의 출력은 기하학적 확장부(geometric extensions)를 구비한 변환기 및 양자화기(125)의 제1입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 변환기 및 양자화기(125)의 출력은 기하학적 확장부를 구비한 엔트로피 코더(145)의 제1입력 및 기하학적 확장부를 구비한 역변환기 및 역양자화기(150)의 제1입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 엔트로피 코더(145)의 출력은 컴바이너(190)의 제1비반전 입력과의 신호 통신에 연관된다. 컴바이너(190)의 출력은 출력 버퍼(135)의 제1입력과의 신호 통신에 연관된다.
기하학적 확장부를 구비한 인코더 제어기(105)의 제1출력은 프레임 정렬 버퍼(110)의 제2입력, 기하학적 확장부를 구비한 역변환기 및 역양자화기(150)의 제2입력, 화상-타입 결정 모듈(115)의 입력, 기하학적 확장부를 구비한 매크로블록-타입(MB-타입) 결정 모듈(120)의 제1입력, 기하학적 확장부를 구비한 인트라 예측 모듈(160)의 제2입력, 기하학적 확장부를 구비한 디블로킹 필터(deblocking filter)(165)의 제2입력, 기하학적 확장부를 구비한 움직임 보상기(170)의 제1입력, 기하학적 확장부를 구비한 움직임 추정기(175)의 제1입력 및 기준 화상 버퍼(180)의 제2입력과의 신호 통신에 연관된다
기하학적 확장부를 구비한 인코더 제어기(105)의 제2출력은 SEI(Supplemental Enhancement Information) 인서터(inserter)(130)의 제1입력, 기하학적 확장부를 구비한 변환기 및 양자화기(125)의 제2입력, 기하학적 확장부를 구비한 엔트로피 코더(145)의 제2입력, 출력 버퍼(135)의 제2입력 및 SPS(Sequence Parameter Set) 및 PPS(Picture Parameter Set) 인서터(140)의 입력과의 신호 통신에 연관된다.
SEI 인서터(130)의 출력은 컴바이너(190)의 제2비반전 입력과의 신호 통신에 연관된다.
화상-타입 결정 모듈(115)의 제1출력은 프레임 정렬 버퍼(110)의 제3입력과의 신호 통신에 연관된다. 화상-타입 결정 모듈(115)의 제2출력은 기하학적 확장부를 구비한 매크로블록-타입 결정 모듈(120)의 제2입력과의 신호 통신에 연관된다.
SPS 및 PPS 인서터(140)의 출력은 컴바이너(190)의 제3비반전 입력과의 신호 통신에 연관된다
기하학적 확장부를 구비한 역양자화기 및 역변환기(150)의 출력은 컴바이너(119)의 제1비반전 입력과의 신호 통신에 연관된다. 컴바이너(119)의 출력은 기하학적 확장부를 구비한 인트라 예측 모듈(160)의 제1입력 및 기하학적 확장부를 구비한 디블로킹 필터(165)의 제1입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 디블로킹 필터(165)의 출력은 기준 화상 버퍼(180)의 제1입력과의 신호 통신에 연관된다. 기준 화상 버퍼(180)의 출력은 기하학적 확장부를 구비한 움직임 추정기(175)의 제2입력 및 기하학적 확장부를 구비한 움직임 보상기(170)의 제3입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 움직임 추정기(175)의 제1출력은 기하학적 확장부를 구비한 움직임 보상기(170)의 제2입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 움직임 추정기(175)의 제2출력은 기하학적 확장부를 구비한 엔트로피 코더(145)의 제3입력과의 신호 통신에 연관된다.
기하학적 확장부를 구비한 움직임 보상기(170)의 출력은 스위치(197)의 제1입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 인트라 예측 모듈(160)의 출력은 스위치(197)의 제2입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 매크로블록-타입 결정 모듈(120)의 출력은 스위치(197)의 제3입력과의 신호 통신에 연관된다. 스위치(197)의 제3입력은 스위치의 "데이터" 입력(제어 입력, 즉, 제3입력과 비교해서)이 기하학적 확장부를 구비한 움직임 보상기(170) 혹은 기하학적 확장부를 구비한 인트라 예측 모듈(160)에 의해 제공되는 것인지의 여부를 판정한다. 스위치(197)의 출력은 컴바이너(119)의 제2비반전 입력 및 컴바이너(185)의 반전 입력과의 신호 통신에 연관된다.
프레임 정렬 버퍼(110)의 제1입력 및 기하학적 확장부를 구비한 인코더 제어기(105)의 입력은, 입력 화상(101)을 수신하기 위하여, 인코더(100)의 입력으로서 이용가능하다. 또한, SEI 인서터(130)의 제2입력은, 메타데이터를 수신하기 위하여, 인코더(100)의 입력으로서 이용가능하다. 출력 버퍼(135)의 출력은, 비트스트림을 출력하기 위하여, 인코더(100)의 출력으로서 이용가능하다.
도 2를 참조하면, MPEG-4 AVC 표준에 따라서 비디오 디코딩을 수행할 수 있는 비디오 디코더가 참조 번호 (200)으로 일반적으로 표시되어 있다. 비디오 디코더(200)는 기하학적 확장부를 구비한 엔트로피 디코더(245)의 제1입력과의 신호 통신에 관련된 출력을 지니는 입력 버퍼(210)를 포함한다. 기하학적 확장부를 구비한 엔트로피 디코더(245)의 제1출력은 기하학적 확장부를 구비한 역변환기 및 역양자화기(250)의 제1입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 역변환기 및 역양자화기(250)의 출력은 컴바이너(225)의 제2비반전 입력과의 신호 통신에 연관된다. 컴바이너(225)의 출력은 기하학적 확장부를 구비한 디블로킹 필터(265)의 제2입력 및 기하학적 확장부를 구비한 인트라 예측 모듈(260)의 제1입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 디블로킹 필터(265)의 제2출력은 기준 화상 버퍼(280)의 제1입력과의 신호 통신에 연관된다. 기준 화상 버퍼(280)의 출력은 기하학적 확장부를 구비한 움직임 보상기(270)의 제2입력과의 신호 통신에 연관된다.
기하학적 확장부를 구비한 엔트로피 디코더(245)의 제2출력은 기하학적 확장부를 구비한 움직임 보상기(270)의 제3입력 및 기하학적 확장부를 구비한 디블로킹 필터(265)의 제1입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 엔트로피 디코더(245)의 제3출력은 기하학적 확장부를 구비한 디코더 제어기(205)의 입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 디코더 제어기(205)의 제1출력은 기하학적 확장부를 구비한 엔트로피 디코더(245)의 제2입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 디코더 제어기(205)의 제2출력은 기하학적 확장부를 구비한 역변환기 및 역양자화기(250)의 제2입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 디코더 제어(205)기의 제3출력은 기하학적 확장부를 구비한 디블로킹 필터(265)의 제3입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 디코더 제어기(205)의 제4입력은 기하학적 확장부를 구비한 인트라 예측 모듈(260)의 제2입력, 기하학적 확장부를 구비한 움직임 보상기(270)의 제1입력 및 기준 화상 버퍼(280)의 제2입력과의 신호 통신에 연관된다.
기하학적 확장부를 구비한 움직임 보상기(270)의 출력은 스위치(297)의 제1입력과의 신호 통신에 연관된다. 기하학적 확장부를 구비한 인트라 예측 모듈(260)의 출력은 스위치(297)의 제2입력과의 신호 통신에 연관된다. 스위치(297)의 출력은 컴바이너(225)의 제1비반전 입력과의 신호 통신에 연관된다.
입력 버퍼(210)의 입력은, 입력 비트스트림을 수신하기 위하여, 디코더(200)의 입력으로서 이용가능하다. 기하학적 확장부를 구비한 디블로킹 필(265)터의 제1출력은, 출력 화상을 출력하기 위하여, 디코더(200)의 출력으로서 이용가능하다.
위에서 언급된 바와 같이, 기하학적 영역 분할을 이용한 인터 및 인트라 예측은 비디오 코딩 효율을 향상시킴에 있어서 촉망받는 연구 동향으로서 인식되어 왔지만, 증가된 계산 복잡성의 문제는 수월치 않으며 여전히 해결해야할 과제로 남아 있다. 따라서, 본 발명의 일 실시형태에서, 본 발명자들은 적응형 기하학적 영역 분할 사전(예컨대, 억지 접근법(brute force approach)에 의해 규정된 서브세트인 규정된 편찬물 혹은 일람)을 이용한 방식을 제공한다. 인코더 및 디코더에서 고려되는 기하학적 분할부들의 수를 감소시키면서 코딩 효율을 유지하는 것은 인코더와 디코더의 양쪽 모두에 유익을 제공한다.
이와 같이 해서, 일 실시형태에서, 양호한 코딩 효율을 여전히 유지하면서 고려되는 기하학적 모드의 수를 감소시키기 위하여 적응형 기하학적 분할 사전(예컨대, 규정된 편찬물 혹은 일람)을 제공한다. 이것의 배후에 있는 기본적인 개념은, 억지 계산 혹은 일람에 의해 이용가능한 모든 거리 및 각도 조합에 대해서 분할을 균일하게 지원하지 않는다는 점이다. 대신에, 거리 스텝과 각도 스텝은 블록(혹은 영역)의 규정된 지점으로부터(예를 들어, 중심부 혹은 원점으로부터) 경계선까지의 거리의 함수이다. 이하의 명명법, 즉, Δρ = h(ρ) , Δθ = g(ρ)가 사용될 수 있으며, 여기서 h() 및 g()는 선형 및/또는 비선형 함수일 수 있다. 또한, 위에서 언급된 바와 같이, ρ 및 θ는 각각 f(x,y)에 대해서 직교방향에 있어서 원점으로부터 경계선까지의 거리 f(x,y); 및 수평 좌표축 x를 이용한 f(x,y)에 대한 직교방향의 각도를 나타낸다(예컨대, 도 8 및 도 13 참조).
도 3을 참조하면, 이미지 블록의 예시적인 기하학적 분할은 참조 번호 (300)으로 일반적으로 표시되어 있다. 전체적인 이미지 블록은 참조 번호 (320)으로 일반적으로 표시되고, 대각선(350)의 대향하는 측면들 상에 위치된 이미지 블록(320)의 두 분할부는 각각 참조 번호 (330) 및 (340)으로 일반적으로 표시되어 있다.
일 실시형태에서, ρ가 블록의 중심(원점)에 가까울 경우 치밀한 거리(Δρ가 작음)를, 그리고 ρ가 블록의 중심(원점)으로부터 멀리 있을 경우 성긴 거리(Δρ가 큼)를 지원한다(예컨대, 도 8 및 도 13 참조).
일 실시형태에서, ρ가 블록의 중심(원점)에 가까울 경우 치밀한 각도를, 그리고 ρ가 블록의 중심(원점)으로부터 멀리 있을 경우 성긴 각도(Δρ가 큼)를 지원한다(예컨대, 도 8 및 도 13 참조).
일 실시형태에서, 디폴트 사전(default dictionary)(예컨대, 규정된 편찬물 혹은 일람)에서 시작한다. 이 실시형태는 트레이닝 단계(training phase)와 코딩 단계를 포함하는 것으로 간주될 수 있다. M트레이닝 프레임, 슬라이스 혹은 블록(트레이닝 단계에 대응하는 것으로 간주될 수 있는 것)을 인코딩한 후, 이미 인코딩된 블록에 의해 선택된 분할부들의 통계자료를 분석하고, 이하의 N코딩 프레임, 슬라이스 혹은 블록(코딩 단계에 대응하는 것으로 간주될 수 있는 것)의 코딩을 위하여 사전을 재확립한다. 그 후, 다른 사이클(코딩 단계 후의 트레이닝 단계)이 시작한다. M트레이닝 및 N코딩의 수는 하나 이상의 하이 레벨 신택스 요소(예컨대, 슬라이스 헤더, SEI 메시지, PPS, SPS 및/또는 NAL 유닛 헤더 등등)에 특정될 수 있다. 이들은 또한 인코더와 디코더 양쪽 모두에 공지된 미리 규정된 상수일 수 있다. 동일한 절차는 디코더에서 적용된다(예컨대, 도 9 및 도 14 참조).
일 실시형태에서는, 디폴트 사전에서 시작한다. 현행 블록의 인코딩을 마친 후, 다음 블록을 코딩하기 위한 사전을 현행 블록을 위해 선택된 분할부에 따라서 조정한다. 이 조정은 현행 블록에 의해 선택된 분할부로부터 멀리 떨어진 몇몇 분할부의 제거일 수 있다. 상기 조정은 또한 다음과 같을 수 있다: 현행 블록의 선택된 분할은 다음 블록의 분할부를 예측하도록 외삽되고, 다음 블록을 위한 사전은 이 예측된 분할부에 의거하고 있다. 동일한 절차가 디코더에서 적용된다(예컨대, 도 9 및 도 14 참조).
일 실시형태에서는, 디폴트 사전에서 시작한다. 하나의 블록에 대해서, 몇몇 비율-왜곡 기준(rate-distortion criteria)에 의거해서 설정된 디폴트로부터 최상의 분할부를 선택하고, 기하학적 움직임 보상을 행하여 레지듀(residue)를 얻고, 이 레지듀를 인코딩한다. 예측 레지듀는, 선택된 분할부와 몇몇 다른 분할부를 포함하는 분할부들의 새로운 사전을 추론하도록, 인코더에서 재구축되고 분석된다. 새로운 사전은 선택된 분할부를 디코더에 반송하기 위하여 보다 적은 비트가 필요하도록 설정된 디폴트보다 적은 분할부를 포함할 것으로 상정된다. 디코더 측에서, 레지듀는 인코더에 의해 사용된 것과 동일한 사전을 추론하도록 재구축되고 분석된다. 입수된 인덱스를 이용해서, 블록의 재구축을 위하여 이 사전으로부터 하나의 분할부가 선택된다.
일시적인 혹은 공간적으로 이웃한 블록들은 유사한 콘텐츠를 지닐 수 있고, 따라서 디폴트 사전 내의 제한된 수의 분할부로부터 선택되는 경향이 있다. 많은 분할부를 지니는 디폴트 사전을 이용하는 것과 비교해서, 보다 적은 분할부를 지니는 작은 사전을 이용하면, 인코딩 시간 및 기하학적 분할 모드를 신호화하기 위한 비트의 양쪽 모두를 절약할 수 있다. 일 실시형태에서, 인코더와 디코더의 양쪽에서 미리 저장된 기하학적 분할부들의 사전의 수를 미리 결정한다. 이들 사전의 각각은 디폴트 사전의 서브세트이다. 사전이 인코더에서 현재 이용되고 있는 것을 나타내는 인덱스를 이용하고, 이 인덱스는 디코더가 인코더와 동기할 수 있도록 하나 이상의 하이 레벨 신택스 요소(예컨대, 슬라이스 헤더, SEI 메시지, PPS, SPS 및/또는 NAL 유닛 헤더 등등)에 특정된다. 기하학적 분할 모드를 발송함에 있어서 오버헤드를 감소시키기 위하여 사전 내의 기하학적 분할부들만을 선택한다(예컨대, 도 11 및 도 16 참조).
일 실시형태에서, 사용자-규정 사전이 인코더에 적용되고, 예컨대, 디코더에 전송될 하나 이상의 하이 레벨 신택스 요소(예컨대, 슬라이스 헤더, SEI 메시지, PPS, SPS 및/또는 NAL 유닛 헤더 등등)를 이용해서 비트-스트림에 특정된다(예컨대, 도 10 및 도 15 참조).
상기 실시형태는 모두 선택된 기하학적 분할부의 명백한 신호화를 필요로 한다. 만약 분할 인덱스가 다른 코딩 정보 내로 삽입될 수 있다면, 코딩 비트는 절약될 수 있고, 코딩 효율은 향상될 수 있다. 일 실시형태에서는, 디폴트 사전에서부터 시작한다. 하나의 블록에 대해서, 본 발명자들은 몇몇 비율-왜곡 기준에 의거해서 설정된 디폴트로부터 최상의 분할부를 선택하고, 기하학적 움직임 보상을 수행하여 레지듀를 얻어, 해당 레지듀를 인코딩한다. 인코더 측에서, 기하학적 분할 정보가 변환 계수 혹은 양자화 계수 내로 삽입(embedding)된다. 디코더는 디코딩된 비트 스트림으로부터 기하학적 분할부를 추론하기 위하여 동일한 규칙을 따른다. 기하학적 분할 인덱스를 변환 계수 혹은 양자화 계수 내로 삽입하는 일례는 다음과 같을 수 있다. 계수의 합(M) 속으로 분할 인덱스 정보를 삽입한다. 만약 분할 인덱스가 n이면, M % k = n이 되도록 계수들의 일부를 변형시키며, 여기서, k는 인코더와 디코더의 양쪽 모두에 대해서 공지된 상수이며, %는 모듈 동작(module operation)이다. 처리된 계수는 디코더에 전송되고, 디코더는 동일한 레지듀를 정확히 재구축할 수 있다. 이어서, 기하학적 분할부를 추론할 수 있다. 이와 같이 해서, 기하학적 분할부에 대한 비트가 절약된다(예컨대, 도 12 및 도 17 참조).
다음은 적응형 기하학적 분할 사전이 압축 시스템에서 어떻게 구축되고 사용되는지에 대해서 상세히 설명하는 특정 예이다. 이하의 예는 MPEG-4 AVC 표준에 의거하고 있지만, 위에서 언급된 바와 같이, 본 발명은 다른 비디오 코딩 표준, 권장사항 및 그의 확장에 적용될 수 있다.
적응형 사전의 구축:
코딩 블록 단위의 크기가 16×16인 것으로 가정한다. 기하학적 분할부들의 디폴트 사전에 대해서, 균일한 샘플링이 각도 파라미터들과 거리 파라미터들의 양쪽 모두에 적용되는 것으로 가정하고, 여기서 Δθ = 11.25이고, Δρ = 1이다. 이 사전에서의 가능한 분할부들의 총 수는 274이다.
이 예에서 적응형 사전을 구축함에 있어서, 우선 거리(ρ)의 비균일 샘플링을 수행한다. 또, ρ의 상이한 값들(거리들)에 대해서, 각도 샘플링 밀도(Δθ)가 상이한 것으로 하고, 따라서 Δθ는 ρ의 함수, 즉, Δθ = g(ρ)인 것으로 한다.
구체적으로, 16×16 코딩 블록 단위의 가정 하에, 도 3으로부터 계산될 수 있는 최대 거리(ρ)는 11(즉, 주 대각선의 길이의 절반보다 작은 최대 정수 16×1.414/2 = 11.312)이다. 상기 사전의 크기를 감소시키기 위하여, 거리 샘플링 간격을 감소시키고, 단지 ρ ≤ 7일 때 기하학적 분할부들을 고려한다. 마찬가지로, 각도 샘플링 간격을 감소시킨다.
ρ의 상이한 값에 대해서, 상이한 샘플링 밀도가 기하학적 분할의 효율을 최대로 활용하면서 오버헤드를 최소화하는데 이용된다. 표 1은 다음과 같이 본 발명의 일 실시형태에 따른 하나의 예시적인 샘플링 방법에 대응한다:
Figure 112012006079223-pct00005
표 1에 표시된 샘플링 방법은 θ의 비균일 ρ-의존적 샘플링 및 ρ ≤ 7에 상당하고, 이는 단지 총 46개의 가능한 분할부에서 일어난다. 이 규칙은 선험적인 것으로 가정되며, 인코더와 디코더 모두가 이 사전을 구축할 수 있는데, 이 사전의 요소들은 디폴트 사전의 것보다 훨씬 적을 수 있다.
적응형 사전을 이용한 인코딩 및 디코딩:
인코더 측에서, 우선 최상의 분할부((ρ, θ)로 표시됨)뿐만 아니라 연관된 움직임 벡터들을 구하기 위하여 검색이 수행된다. 이어서, ρ가 소정의 엔트로피 코딩 방법을 이용해서 인코딩된다. 하나의 가능한 엔트로피 코딩 방법은 Expo-Golomb 코드를 포함할 수 있지만, 본 발명은 이 선행하는 코드만으로 제한되지 않고, 기타 코드도 이용될 수 있음을 이해할 필요가 있다. 그 후, ρ 및 미리 규정된 규칙 Δθ - g(ρ)를 이용해서, 모든 가능한 수의 θ 및 θ의 인덱스가 계산될 수 있다. 따라서, 엔트로피 코딩 방법이 설계될 수 있다. 하나의 가능한 엔트로피 코딩 방법은 N-비트 고정 길이 코딩일 수 있고, 여기서 N은 ρ 및 Δθ로부터 계산될 수 있다.
디코더 측에서, 먼저 ρ가 디코딩된다. ρ 및 미리 규정된 규칙 Δθ = g(ρ)를 이용해서, θ의 전체 가능한 수는 θ의 신택스를 파싱(parsing)하고 그의 값을 재구성하는 것을 돕도록 계산될 수 있다.
신택스
표 2는 본 발명의 실시형태에 따라서 예시적인 슬라이스-레벨 신택스를 표시하고 있다.
Figure 112012006079223-pct00006
이 예에서, 본 발명자들은, 디폴트 사전에 부가해서 미리 규정된 적응형 사전이 인코더와 디코더의 양쪽 모두에서 기억되는 것을 가정한다.
adaptive _ dictionary _ flag (적응형_사전_플래그):
adaptive _ dictionary _ flag가 1이라는 것은 상기 적응형 사전이 이 슬라이스 내의 모든 기하학적 분할된 블록의 디코딩에서 이용되는 것을 특정한다. 디코딩 작업은 함수 Geo_partition_derivation_adaptive ()로 규정되며, 여기서 분할 인덱스는 비트스트림으로부터 파싱되고, 분할부는 미리 규정된 적응형 사전으로부터 선택된다.
adaptive _ dictionary _ flag가 0이라는 것은 디폴트 사전이 이 슬라이스 내의 기하학적 분할된 블록의 모두의 디코딩에 이용되는 것을 특정한다. 디코딩 작업은 함수 Geo_partition_derivation_default()로 규정되며, 여기서 분할 인덱스는 비트스트림으로부터 파싱되고, 하나의 분할부가 미리 규정된 디폴트 사전으로부터 선택된다.
도 4를 참조하면, 적응형 기하학적 분할부들을 이용해서 화상 데이터를 인코딩하는 예시적인 방법이 참조 번호 (400)으로 일반적으로 표시되어 있다. 이 방법(400)은 기능 블록(410)으로 제어를 진행시키는 개시 블록(405)을 포함한다. 기능 블록(410)은 적응형 기하학적 분할 사전을 구축하고, 기능 블록(415)으로 제어를 진행한다. 기능 블록(415)은 적응형 기하학적 분할 사전을 이용해서 최상의 기하학적 분할부를 검색하고, 기능 블록(420)으로 제어를 진행한다. 기능 블록(420)은 정규의 코딩 모드들을 이용해서 최상의 예측을 검색하여, 정규의 코딩 모드들에 의해 얻어진 예측을 기하학적 예측들과 비교하여 최상의 예측을 선택하고, 기능 블록(425)으로 제어를 진행한다. 판정 블록(425)은 최상의 예측 모드가 기하학적 예측 모드인지의 여부를 판정한다. 만약 기하학적 예측 모드라면, 기능 블록(430)으로 제어가 진행되고, 기하학적 모드가 아니라면, 기능 블록(435)으로 제어가 진행된다.
기능 블록(430)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드(들)에 대해서 엔트로피 코딩을 수행하고, 종료 블록(499)으로 제어를 진행한다.
기능 블록(435)은 정규의(통상의) 엔트로피 코딩을 수행하고, 종료 블록(499)으로 제어를 진행한다.
도 5를 참조하면, 적응형 기하학적 분할 사전을 이용해서 인코더에서 최상의 예측을 위하여 검색하는 하나의 예시적인 방법이 참조 번호 (500)으로 일반적으로 표시되어 있다. 상기 방법(500)은 루프 제한 블록(510)으로 제어를 진행하는 개시 블록(505)을 포함한다. 루프 제한 블록(510)은 상기 사전 내에서 가능한 거리(ρ)에 대해서 루프 1을 개시하고, 루프 제한 블록(515)으로 제어를 진행한다. 루프 제한 블록(515)은 사전 내에서 거리(ρ)에 대한 가능한 각도(θ)에 대해서 루프 2를 개시하고, 기능 블록(520)으로 제어를 진행한다. 기능 블록(520)은 파라미터 세트(ρ, θ)를 이용해서 분할부를 생성하고, 기능 블록(525)으로 제어를 진행한다. 기능 블록(525)은 분할부에 설정된 최상의 예측변수를 검색하고, 루프 제한 블록(530)으로 제어를 진행한다. 루프 제한 블록(530)은 루프 1을 종료하고, 루프 제한 블록(535)으로 제어를 진행한다. 루프 제한 블록(535)은 루프 2를 종료하고, 종료 블록(599)으로 제어를 진행한다.
도 6을 참조하면, 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대해서 엔트로피 코딩하는 하나의 예시적인 방법이 참조 번호 (600)으로 일반적으로 표시되어 있다. 상기 방법(600)은 기능 블록(610)으로 제어를 진행하는 개시 블록(605)을 포함한다. 기능 블록(610)은, 선택된 거리(ρ)에 대해서, 사전에서 조회하여 대응하는 인덱스를 찾아, 해당 인덱스를 인코딩하고, 기능 블록(615)으로 제어를 진행한다. 기능 블록(615)은, 선택된 각도에 대해서, 사전을 조회하여 대응하는 인덱스를 찾아, 해당 인덱스를 인코딩하고, 기능 블록(620)으로 제어를 진행한다. 기능 블록(620)은 이 블록의 나머지 모드 정보를 인코딩하고, 기능 블록(625)으로 제어를 진행한다. 기능 블록(625)은 이 블록의 예측 오차들(레지듀들)을 인코딩하고, 종료 블록(699)으로 제어를 진행한다.
도 7을 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 하나의 예시적인 방법이 참조 번호 (700)으로 일반적으로 표시되어 있다. 상기 방법(700)은 기능 블록(710)으로 제어를 진행하는 개시 블록(705)을 포함한다. 기능 블록(710)은 적응형 기하학적 분할 사전을 구축하고, 판정 블록(715)으로 제어를 진행한다. 판정 블록(715)은 현행 모드가 기하학적 분할 모드인지의 여부를 판정한다. 만약 기하학적 분할 모드라면, 기능 블록(720)으로 제어가 진행되고, 기하학적 분할 모드가 아니라면, 기능 블록(730)으로 제어가 진행된다.
기능 블록(720)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드 블록에 대한 엔트로피 디코딩을 수행하고, 기능 블록(725)으로 제어를 진행한다. 기능 블록(725)는 적응형 분할 사전을 이용해서 기하학적 분할 모드 블록에 대해서 예측 및 재구축을 수행하고, 종료 블록(799)으로 제어를 진행한다.
기능 블록(730)은 정규의(통상의) 엔트로피 디코딩을 수행하고, 기능 블록(735)으로 제어를 진행한다. 기능 블록(735)은 정규의(통상의) 예측 및 재구축을 수행하고, 종료 블록(799)으로 제어를 진행한다.
도 8를 참조하면, 적응형 기하학적 분할부들을 이용해서 화상 데이터를 인코딩하는 예시적인 방법이 참조 번호 (800)으로 일반적으로 표시되어 있다. 이 방법(800)에 있어서, 적응형 기하학적 분할 사전은 블록 내의 규정된 지점에 대한 분할 경계의 각도 및/또는 그의 거리에 의거하고 있다. 상기 방법(800)은 기능 블록(810)으로 제어를 진행하는 개시 블록(805)을 포함한다. 기능 블록(810)은 분할부들의 개수를 선택하여 블록 내의 규정된 지점에 대한 분할 경계의 각도 및/또는 그의 거리에 의거해서 적응형 기하학적 분할 사전을 구축하고, 기능 블록(815)으로 제어를 진행한다. 기능 블록(815)은 적응형 기하학적 분할 사전을 이용해서 최상의 기하학적 예측을 검색하고, 기능 블록(820)으로 제어를 진행한다. 기능 블록(820)은 정규의(즉, 비기하학적) 코딩 모드들에 대해서 최상의 예측을 검색하고, 정규의 코딩 모드들에 대한 예측을 기하학적 예측과 비교하여 (예컨대, 비율-왜곡(RD) 값에 의거한) 최상의 것을 선택하고, 판정 블록(825)으로 제어를 진행한다. 판정 블록(825)은 최상의 예측이 기하학적 예측 모드를 이용해서 얻어진 것인지의 여부를 판정한다. 만약 그렇다면, 제어는 기능 블록(830)으로 제어가 진행되고, 그렇지 않다면, 제어는 기능 블록(835)으로 진행된다. 기능 블록(830)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 신택스 요소들을 엔트로피 코딩하고, 종료 블록(899)으로 제어를 진행한다. 기능 블록(835)은 정규의(통상의) 엔트로피 코딩을 수행하고, 종료 블록(899)으로 제어를 진행한다.
도 9를 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법이 참조 번호 (900)으로 일반적으로 표시되어 있다. 이 방법(900)에서, 적응형 기하학적 분할 사전은 미리 인코딩된 영역들의 정보에 의거한다. 상기 방법(900)은 기능 블록(910)으로 제어를 진행하는 개시 블록(905)을 포함한다. 기능 블록(910)은, 미리 코딩된 영역(들)의 정보에 의거해서, 예컨대, 미리 코딩된 다른 영역(들)에 대해 선택된 분할부 및/또는 해당 분할부들의 통계자료 등에 의거해서, (인코딩될) 현행 블록에 대한 적응형 기하학적 분할 사전을 구축하고, 기능 블록(915)으로 제어를 진행한다. 기능 블록(915)은 적응형 기하학적 분할 사전을 이용해서 최상의 기하학적 예측을 검색하고, 기능 블록(920)으로 제어를 진행한다. 기능 블록(920)은 정규의(즉, 비기하학적) 코딩 모드들에 대한 최상의 예측을 검색하고, 해당 정규의 코딩 모드들에 대한 예측을 기하학적 예측과 비교하여 (예컨대, 비율-왜곡(RD) 값에 의거해서) 최상의 것을 선택하고, 판정 블록(925)으로 제어를 진행한다. 판정 블록(925)은 최상의 예측이 기하학적 예측 모드를 이용해서 얻어진 것인지의 여부를 판정한다. 만약 그렇다면, 기능 블록(930)으로 제어가 진행되고, 그렇지 않다면, 기능 블록(935)으로 제어가 진행된다. 기능 블록(930)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 신택스 요소들을 엔트로피 코딩하고, 종료 블록(999)으로 제어를 진행한다. 기능 블록(935)은 정규의(통상의) 엔트로피 코딩을 수행하고, 종료 블록(999)으로 제어를 진행한다.
도 10을 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법이 참조 번호 (1000)으로 일반적으로 표시되어 있다. 이 방법(1000)에서, 적응형 기하학적 분할 사전은 사용자-규정되어 있고, 디코더에 전송된다. 상기 방법(1000)은 기능 블록(1010)으로 제어를 진행하는 개시 블록(1005)을 포함한다. 기능 블록(1010)은 사용자 입력에 의거해서 (인코딩될) 현행 블록에 대한 적응형 기하학적 분할 사전을 구축하고, 기능 블록(1015)으로 제어를 진행한다. 기능 블록(1015)은 사용자-규정 사전을 디코더에 전송하고, 루프 제한 블록(1020)으로 제어를 진행한다. 루프 제한 블록(1020)은, 1 내지 (예컨대, 현재의 화상 내의) 블록들의 번호(#)의 범위를 지니는 변수 I를 이용해서, 예컨대, 현재의 화상 내의 블록에 대해서 루프를 개시하고, 기능 블록(1025)으로 제어를 진행한다. 기능 블록(1025)은 적응형 기하학적 분할 사전을 이용해서 최상의 기하학적 예측을 검색하고, 기능 블록(1030)으로 제어를 진행한다. 기능 블록(1030)은 정규의(즉, 비기하학적) 코딩 모드들에 대한 최상의 예측을 검색하고, 해당 정규의 코딩 모드들에 대한 예측을 기하학적 예측과 비교하여 (예컨대, 비율-왜곡(RD) 값에 의거해서) 최상의 것을 선택하고, 판정 블록(1035)으로 제어를 진행한다. 판정 블록(1035)은 최상의 예측이 기하학적 예측 모드를 이용해서 얻어진 것인지의 여부를 판정한다. 만약 그렇다면, 기능 블록(1040)으로 제어가 진행되고, 그렇지 않다면, 기능 블록(1045)으로 제어가 진행된다. 기능 블록(1040)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 신택스 요소들을 엔트로피 코딩하고, 루프 제한 블록(1050)으로 제어를 진행한다. 기능 블록(1045)은 정규의(통상의) 엔트로피 코딩을 수행하고, 루프 제한 블록(1050)으로 제어를 진행한다. 루프 제한 블록(1050)은 루프를 종료하고, 종료 블록(1099)으로 제어를 진행한다.
도 11을 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법이 참조 번호 (1100)으로 일반적으로 표시되어 있다. 이 방법(1100)에서, 적응형 기하학적 분할 사전(즉, 기하학적 분할부들의 서브세트)은 복수개의 서브세트들(이들 각각은, 예를 들어, 디폴트 사전으로부터 얻어지고, 이어서 예컨대 강제 접근법을 이용해서 얻어짐)로부터 선택되며, 이 서브세트 혹은 이 서브세트의 인덱스는 디코더에 표시된다. 상기 방법(1100)은 기능 블록(1110)으로 제어를 진행하는 개시 블록(1105)을 포함한다. 기능 블록(1110)은 복수개의 서브세트로부터 적응형 기하학적 분할 사전(즉, 하나의 서브세트)을 구축하고, 기능 블록(1115)으로 제어를 진행한다. 기능 블록(1115)은 선택된 기하학적 분할 서브세트를 표시하거나 선택된 서브세트의 인덱스를 표시하고, 루프 제한 블록(1120)으로 제어를 진행한다. 루프 제한 블록(1120)은 1 내지 (예컨대, 현재의 화상 내의) 블록들의 번호(#)의 범위를 지니는 변수 I를 이용해서, 예컨대, 현재의 화상 내의 블록에 대해서 루프를 개시하고, 기능 블록(1125)으로 제어를 진행한다. 기능 블록(1125)은 적응형 기하학적 분할 사전을 이용해서 최상의 기하학적 예측을 검색하고, 기능 블록(1130)으로 제어를 진행한다. 기능 블록(1030)은 정규의(즉, 비기하학적) 코딩 모드들에 대한 최상의 예측을 검색하고, 해당 정규의 코딩 모드들에 대한 예측을 기하학적 예측과 비교하여 (예컨대, 비율-왜곡(RD) 값에 의거해서) 최상의 것을 선택하고, 판정 블록(1135)으로 제어를 진행한다. 판정 블록(1135)은 최상의 예측이 기하학적 예측 모드를 이용해서 얻어진 것인지의 여부를 판정한다. 만약 그렇다면, 기능 블록(1140)으로 제어가 진행되고, 그렇지 않다면, 기능 블록(1145)으로 제어가 진행된다. 기능 블록(1140)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 신택스 요소들을 엔트로피 코딩하고, 루프 제한 블록(1150)으로 제어를 진행한다. 기능 블록(1145)은 정규의(통상의) 엔트로피 코딩을 수행하고, 루프 제한 블록(1150)으로 제어를 진행한다. 루프 제한 블록(1150)은 루프를 종료하고, 종료 블록(1199)으로 제어를 진행한다.
도 12를 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 인코딩하는 다른 예시적인 방법이 참조 번호 (1200)으로 일반적으로 표시되어 있다. 이 방법(120)에서, 적응형 기하학적 분할 모드는 디코딩된 레지듀들로부터 디코더에 의해 추론된다. 상기 방법(1200)은 기능 블록(1210)으로 제어를 진행하는 개시 블록(1205)을 포함한다. 기능 블록(1210)은 디폴트 기하학적 분할 사전을 이용해서 최상의 기하학적 예측을 검색하고, 기능 블록(1215)으로 제어를 진행한다. 기능 블록(1215)은 최상의 기하학적 분할을 이용해서 현행 블록을 인코딩하고, 선택된 분할부가 디코더에서 디코딩된 레지듀로부터 추론될 수 있도록 레지듀를 처리하고, 기능 블록(1220)으로 제어를 진행한다. 기능 블록(1220)은 정규의(즉, 비기하학적) 코딩 모드들에 대해서 최상의 예측을 검색하고, 해당 정규의 코딩 모드들에 대한 예측을 기하학적 예측과 비교하여 (예컨대, 비율-왜곡(RD) 값에 의거해서) 최상의 것을 선택하고, 판정 블록(1225)으로 제어를 진행한다. 판정 블록(1225)은 최상의 예측이 기하학적 예측 모드를 이용해서 얻어진 것인지의 여부를 판정한다. 만약 그렇다면, 기능 블록(1230)으로 제어가 진행되고, 그렇지 않다면, 기능 블록(1240)으로 제어가 진행된다. 기능 블록(1230)은 선택된 기하학적 분할 모드에 대해서 레지듀 계수들을 엔트로피 코딩하고, 기능 블록(1235)으로 제어를 진행한다. 기능 블록(1235)은 분할 인덱스를 제외하고 기하학적 분할 모드에 대한 다른 신택스 요소들을 엔트로피 코딩하고, 종료 블록(1299)으로 제어를 진행한다. 기능 블록(1240)은 정규의(통상의) 엔트로피 코딩을 수행하고, 종료 블록(1299)으로 제어를 진행한다.
여기에서는, 단지 선택된 분할부만이 디코더에서 디코딩된 레지듀로부터 추론될 수 있도록 해당 레지듀를 어떻게 처리하는지의 일례가 부여되어 있다: 계수의 합(M) 속으로 분할 정보를 삽입한다. 만약 분할 인덱스가 n이면, M % k = n이 되도록 계수들의 일부를 변형시키며, 여기서, k는 인코더와 디코더의 양쪽 모두에 대해서 공지된 상수이며, %는 모듈 동작이다. 처리된 계수는 디코더에 전송되고, 디코더는 동일한 레지듀를 정확히 재구축할 수 있다. 이어서, 기하학적 분할부를 추론할 수 있다.
도 13을 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 하나의 예시적인 방법이 참조 번호 (1300)으로 일반적으로 표시되어 있다. 이 방법(1300)에서, 적응형 기하학적 분할 사전은 블록 내의 규정된 지점에 대한 분할 경계의 각도 및/또는 그의 거리에 의거하고 있다. 상기 방법(1300)은 기능 블록(1210)으로 제어를 진행하는 개시 블록(1305)을 포함한다. 기능 블록(1310)은 블록 내의 미리 규정된 지점에 대한 분할 경계의 각도 및/또는 그의 거리에 의거해서 분할부들의 개수를 선택함으로써 적응형 기하학적 분할 사전을 구축하고, 판정 블록(1315)으로 제어를 진행한다. 판정 블록(1315)은 현행 예측 모드가 기하학적 예측 모드인지의 여부를 판정한다. 만약 기하학적 예측 모드이면, 기능 블록(1320)으로 제어가 진행되고, 기하학적 예측 모드가 아니라면, 기능 블록(1330)으로 제어가 진행된다. 기능 블록(1320)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드 블록에 대한 신택스 요소들을 디코딩하는 엔트로피 디코딩을 수행하고, 기능 블록(1325)으로 제어를 진행한다. 기능 블록(1325)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 예측 및 재구축을 수행하고, 종료 블록(1399)으로 제어를 진행한다. 기능 블록(1330)은 정규의(통상의) 엔트로피 코딩을 수행하고, 기능 블록(1335)으로 제어를 진행한다. 기능 블록(1335)은 정규의(통상의) 예측 및 재구축을 수행하고, 종료 블록(1399)으로 제어를 진행한다.
도 14를 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 다른 예시적인 방법이 참조 번호 (1400)으로 일반적으로 표시되어 있다. 이 방법(1400)에서, 적응형 기하학적 분할 사전은 미리 디코딩된 영역들의 정보에 의거하고 있다. 상기 방법(1400)은 기능 블록(1410)으로 제어를 진행하는 개시 블록(1405)을 포함한다. 기능 블록(1410)은 미리 코딩된 영역(들)의 정보에 의거해서, 예컨대, 미리 코딩된 다른 영역(들)에 대해 선택된 분할부 및/또는 해당 선택된 분할부의 통계자료 등에 의거해서, (디코딩될) 현행 블록에 대한 적응형 기하학적 분할 사전을 구축하고, 판정 블록(1415)으로 제어를 진행한다. 판정 블록(1415)은 현행 예측 모드가 기하학적 예측 모드인지의 여부를 판정한다. 만약 기하학적 예측 모드라면, 기능 블록(1420)으로 제어가 진행되고, 기하학적 예측 모드가 아니라면, 기능 블록(1430)으로 제어가 진행된다. 기능 블록(1420)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 신택스 요소들을 디코딩하는 엔트로피 디코딩을 수행하고, 기능 블록(1425)으로 제어를 진행한다. 기능 블록(1425)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 예측 및 재구축을 수행하고, 종료 블록(1499)으로 제어를 진행한다. 기능 블록(1430)은 정규의(통상의) 엔트로피 코딩을 수행하고, 기능 블록(1435)으로 제어를 진행한다. 기능 블록(1435)은 정규의(통상의) 예측 및 재구축을 수행하고, 종료 블록(1499)으로 제어를 진행한다.
도 15를 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 다른 예시적인 방법이 참조 번호 (1500)으로 일반적으로 표시되어 있다. 이 방법(1500)에서, 적응형 기하학적 분할 사전은 비트-스트림으로 전송되고, 디코더에 의해 파싱된다. 상기 방법(1500)은 기능 블록(1510)으로 제어를 진행하는 개시 블록(1505)을 포함한다. 기능 블록(1510)은 비트스트림으로부터 사용자-규정 적응형 기하학적 분할 사전을 파싱하고, 루프 제한 블록(1515)으로 제어를 진행한다. 루프 제한 블록(1515)은 1 내지 (예컨대, 현재의 화상 내의) 블록들의 번호(#)의 범위를 지니는 변수 I를 이용해서, 예컨대, 현재의 화상 내의 블록에 대해서 루프를 개시하고, 판정 블록(1520)으로 제어를 진행한다. 판정 블록(1520)은 현행 예측 모드가 기하학적 예측 모드인지의 여부를 판정한다. 만약 기하학적 예측 모드라면, 기능 블록(1525)으로 제어가 진행되고, 기하학적 예측 모드가 아니라면, 기능 블록(1535)으로 제어가 진행된다. 기능 블록(1525)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드 블록에 대한 신택스 요소들을 디코딩하는 엔트로피 디코딩을 수행하고, 기능 블록(1530)으로 제어를 진행한다. 기능 블록(1530)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 예측 및 재구축을 수행하고, 루프 제한 블록(1545)으로 제어를 진행한다. 기능 블록(1535)은 정규의(통상의) 엔트로피 코딩을 수행하고, 기능 블록(1540)으로 제어를 진행한다. 기능 블록(1540)은 정규의(통상의) 예측 및 재구축을 수행하고, 루프 제한 블록(1545)으로 제어를 진행한다. 루프 제한 블록(1545)은 루프를 종료하고, 종료 블록(1599)으로 제어를 진행한다.
도 16을 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 다른 예시적인 방법이 참조 번호 (1600)으로 일반적으로 표시되어 있다. 이 방법(1600)에서, 적응형 기하학적 분할 사전의 인덱스는 비트-스트림으로 전송되고, 디코더에 의해 파싱된다. 상기 방법(1600)은 기능 블록(1610)으로 제어를 진행하는 개시 블록(1605)을 포함한다. 기능 블록(1610)은 서브세트의 인덱스를 파싱하여 올바른 서브세트를 선택하고 적응형 기하학적 분할 사전을 구축하고 나서, 루프 제한 블록(1615)으로 제어를 진행한다. 루프 제한 블록(1615)은 1 내지 (예컨대, 현재의 화상 내의) 블록들의 번호(#)의 범위를 지니는 변수 I를 이용해서, 예컨대, 현재의 화상 내의 블록에 대해서 루프를 개시하고, 판정 블록(1620)으로 제어를 진행한다. 판정 블록(1620)은 현행 예측 모드가 기하학적 예측 모드인지의 여부를 판정한다. 만약 기하학적 예측 모드라면, 기능 블록(1625)으로 제어가 진행되고, 기하학적 예측 모드가 아니라면, 기능 블록(1635)으로 제어가 진행된다. 기능 블록(1625)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드 블록에 대한 신택스 요소들을 디코딩하는 엔트로피 디코딩을 수행하고, 기능 블록(1630)으로 제어를 진행한다. 기능 블록(1630)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대해서 예측 및 재구축을 수행하고, 블록(1645)으로 제어를 진행한다. 기능 블록(1635)은 정규의(통상의) 엔트로피 코딩을 수행하고, 기능 블록(1640)으로 제어를 진행한다. 기능 블록(1640)은 정규의(통상의) 예측 및 재구축을 수행하고, 루프 제한 블록(1645)으로 제어를 진행한다. 루프 제한 블록(1645)은 루프를 끝내고, 종료 블록(1699)으로 제어를 진행한다.
도 17을 참조하면, 적응형 기하학적 분할 사전을 이용해서 화상 데이터를 디코딩하는 다른 예시적인 방법이 참조 번호 (1700)으로 일반적으로 표시되어 있다. 이 방법(1700)에서, 디코더는 디코딩된 레지듀들로부터 기하학적 분할 모드를 추론한다. 상기 방법(1700)은 판정 블록(1710)으로 제어를 진행하는 개시 블록(1705)을 포함한다. 판정 블록(1710)은 현행 예측 모드가 기하학적 예측 모드인지의 여부를 판정한다. 만약 기하학적 예측 모드라면, 기능 블록(1715)으로 제어가 진행되고, 기하학적 예측 모드가 아니라면, 기능 블록(1730)으로 제어가 진행된다. 기능 블록(1715)은 레지듀 계수를 디코딩하는 엔트로피 디코딩을 수행하고, 재구축된 레지듀로부터 분할 인덱스를 추론하고서, 기능 블록(1720)으로 제어를 진행한다. 기능 블록(1720)은 기하학적 분할 모드에 대한 다른 신택스 요소들을 디코딩하는 엔트로피 디코딩을 수행하고, 기능 블록(1725)으로 제어를 진행한다. 기능 블록(1725)은 적응형 기하학적 분할 사전을 이용해서 기하학적 분할 모드에 대한 예측 및 재구축을 수행하고, 종료 블록으로 제어를 진행한다. 기능 블록(1730)은 정규의(통상의) 엔트로피 코딩을 수행하고, 기능 블록(1735)으로 제어를 진행한다. 기능 블록(1735)은 정규의 예측 및 재구축을 수행하고, 종료 블록(1799)으로 제어를 진행한다.
이하, 본 발명의 다수의 부수적인 이점/특징의 몇몇에 대해 설명하며, 이들의 일부는 위에서 언급되어 있다. 예를 들어, 하나의 이점/특성은 적응형 기하학적 분할을 이용해서 화상 내의 하나의 영역에 대한 화상 데이터를 인코딩하는 인코더를 구비한 장치이며, 여기서 상기 영역에 대한 화상 데이터를 코딩하는데 이용되는 기하학적 분할부들의 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정된다. 상기 거리는 상기 영역 내의 규정된 지점으로부터 분할 경계까지 측정된다. 상기 각도는 상기 영역 내의 상기 규정된 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된다.
다른 이점/특성은 전술한 바와 같은 인코더를 구비한 장치이며, 여기서 상기 영역 내의 상기 규정된 지점은 상기 영역의 중심부이고, 상기 기하학적 분할부들의 서브세트는 상기 영역의 중심부로부터 상기 분할 경계까지의 거리에 응답하여 결정된다.
또 다른 이점/특성은 상기 인코더를 구비한 장치이며, 여기서 상기 영역 내의 상기 규정된 지점은 전술한 바와 같이 상기 영역의 중심부이고, 상기 기하학적 분할부들의 서브세트는 상기 영역의 중심부로부터 상기 분할 경계까지의 거리에 응답하여 결정되며, 거리 스텝 및 각도 스텝이 기하학적 분할 사전을 구축하기 위하여 상기 적응형 기하학적 분할을 위한 거리 간격 및 각도 간격을 샘플링하는데 이용되고, 상기 거리 스텝 및 상기 각도 스텝은 상기 규정된 지점으로부터 상기 분할 경계까지의 거리의 함수이며, 상기 기하학적 분할부들의 서브세트는 상기 기하학적 분할 사전보다 적은 기하학적 분할부들을 지닌다.
다른 이점/특성은 상기 인코더를 구비한 장치이며, 여기서, 상기 영역 내의 상기 규정된 지점은 전술한 바와 같이 상기 영역의 중심부이고, 상기 기하학적 분할부들의 서브세트는 상기 영역의 중심부로부터 상기 분할 경계까지의 거리에 응답하여 결정되며, 상기 기하학적 분할부들의 서브세트는 상기 규정된 지점으로부터 역치 거리보다 작거나 동등한 상기 분할 경계까지의 거리를 지니는 기하학적 분할부들을 포함한다.
또 다른 이점/특성은 전술한 바와 같은 인코더를 구비한 장치이며, 여기서 상기 기하학적 분할부들의 서브세트는 상기 화상 내의 상기 영역 및 미리 코딩된 다른 영역들 중 적어도 하나의 영역의 미리 코딩된 정보에 의거한다.
다른 이점/특성은 상기 인코더를 구비한 장치이며, 여기서 상기 기하학적 분할부들의 서브세트는 전술한 바와 같이 화상 내의 상기 영역 및 이미 코딩된 다른 영역들의 적어도 하나의 이미 코딩된 정보에 의거하고, 상기 기하학적 분할부들의 서브세트는 상기 이미 코딩된 다른 영역들에 대해서 선택된 분할부에 의거한다.
또, 다른 이점/특성은 상기 인코더를 구비한 장치이며, 여기서 상기 기하학적 분할부들의 서브세트는 전술한 바와 같이 이미 코딩된 다른 영역들에 대해서 선택된 분할부에 의거하고, 상기 영역에 대해서 선택된 분할부는 후속 영역에 대한 분할부를 예측하도록 외삽되며, 상기 후속 영역을 코딩하기 위한 기하학적 분할부들의 서브세트는 상기 후속 영역에 대한 상기 예측된 분할부에 의거한다.
또한, 다른 이점/특성은 상기 인코더를 구비한 장치이며, 여기서 상기 기하학적 분할부들의 서브세트는 전술한 바와 같이 화상 내의 상기 영역 및 이미 코딩된 다른 영역들 중 적어도 하나의 영역의 이미 코딩된 정보에 의거하고, 상기 기하학적 분할부들의 서브세트는 미리 코딩된 다른 영역들에 대해 선택된 분할부들의 통계 자료에 의거해서 유도된다.
또, 다른 이점/특성은 상기 인코더를 구비한 장치이며, 여기서 상기 기하학적 분할부들의 서브세트는 전술한 바와 같이 미리 코딩된 다른 영역들에 대해 선택된 분할부들의 통계자료에 의거하고, 상기 화상은 비디오 시퀀스에 포함되며, 해당 비디오 시퀀스 내의 화상들의 세트는, 상기 영역 없이 각각, 강제 분할 계산 접근법에 대응하는 기하학적 분할부들의 디폴트 사전을 이용해서 인코딩되고, 상기 화상들의 세트에 대해 선택된 분할부들의 통계자료는 상기 영역에 대한 상기 기하학적 분할부들의 서브세트를 구축하는데 이용되고, 상기 서브세트는 상기 디폴트 사전보다 적은 기하학적 분할부들을 지닌다.
또한, 기타 이점/특성은 전술한 바와 같은 인코더를 구비한 장치이며, 여기서 상기 적응형 기하학적 분할을 위해 이용되는 상기 기하학적 분할부들의 서브세트는 사용자 규정되어 얻어지는 비트스트림 내에 명시적으로 신호화된다.
또, 다른 이점/특성은 전술한 바와 같은 인코더를 구비한 장치이며, 여기서 상기 서브세트는 복수개의 서브세트 중 하나이고, 상기 서브세트 및 상기 복수개의 서브세트는 모두 함께 가능한 모든 분할부 미만을 나타내며, 상기 복수개의 서브세트는 미리 저장되어 있고, 상기 인코더는 하나 이상의 하이 레벨 신택스 요소를 이용해서 디코더에 인덱스를 전송하며, 상기 인덱스는 디코딩을 위해 이용될 복수개의 서브세트 중 특정한 하나 이상을 표시한다.
또한, 기타 이점/특성은 전술한 바와 같은 인코더를 구비한 장치이며, 여기서 상기 기하학적 분할부들의 서브세트는 상기 영역에 대한 화상 데이터를 적어도 디코딩함에 있어서 상기 디코더에 의해 사용하기 위하여 비트스트림으로 상기 디코더에 전송된다.
또한, 기타 이점/특성은 전술한 바와 같은 인코더를 구비한 장치이며, 여기서 인코더는 비율-왜곡 기준에 의거해서 기하학적 분할부들의 디폴트 사전으로부터 영역에 대한 분할부를 선택하고, 기하학적 움직임 보상을 실시하여, 해당 영역에 대한 레지듀를 얻으며, 기하학적 분할부들의 디폴트 사전 내의 다수의 이용가능한 분할부들 중에서 선택된 분할부만이 디코더에서 레지듀의 후속의 재구축으로부터 추론될 수 있도록 해당 레지듀를 재구축한다.
본 발명의 이들 및 기타 특성 및 이점들은 본 명세서의 교시 내용에 의거해서 당업자에 의해 용이하게 규명될 수 있다. 본 발명의 교시 내용은 하드웨어, 소프트웨어, 펌웨어, 전용 프로세서 혹은 이들의 조합의 각종 형태로 구현될 수 있다는 것을 이해할 필요가 있다.
가장 바람직하게는, 본 발명의 교시 내용은 하드웨어와 소프트웨어의 조합으로서 구현된다. 또한, 소프트웨어는 프로그램 저장 장치에 명백히 내장된 어플리케이션 프로그램으로서 구현될 수 있다. 해당 어플리케이션 프로그램은 임의의 적절한 구조를 포함하는 기계에 업로드되어 해당 기계에 의해 실행될 수 있다. 바람직하게는, 상기 기계는 하나 이상의 중앙처리장치("CPU"), 랜덤 액세스 메모리("RAM") 및 입/출력("I/O") 인터페이스 등과 같은 하드웨어를 지니는 컴퓨터 플랫폼 상에서 구현된다. 상기 컴퓨터 플랫폼은 또한 운용 시스템 및 마이크로명령 코드를 포함할 수 있다. 본 명세서에 기재된 각종 처리 및 기능은 마이크로명령 코드의 일부 혹은 어플리케이션 프로그램의 일부일 수 있고, 이는 CPU에 의해 실행될 수 있다. 또, 각종 기타 주변 장치가 추가의 데이터 저장장치 및 인쇄 장치 등과 같은 컴퓨터 플랫폼에 연결될 수 있다.
첨부된 도면에 표시된 구성 시스템 요소들 및 방법의 몇몇은 바람직하게는 소프트웨어로 구현되기 때문에, 시스템 요소들 혹은 방법의 기능 블록들 간의 실제 연결관계는 본 발명이 프로그래밍되는 방식에 따라 다를 수 있다는 것 또한 이해할 필요가 있다. 본 명세서의 교시 내용을 고려하면, 당업자는 본 발명의 이들 및 유사한 구현 혹은 배치 형태를 생각해낼 수 있을 것이다.
예시적인 실시형태가 첨부 도면을 참조하여 본 명세서에서 설명되어 있지만, 본 발명은 이들 정확한 실시형태로 제한되지 않고, 각종 변화와 수정이 본 발명의 범위 혹은 정신으로부터 벗어나는 일없이 당업자에 의해 수행될 수 있다는 것을 이해할 필요가 있다. 이렇나 모든 변화와 수정은 첨부된 특허청구범위에 기재된 바와 같은 본 발명의 범위 내에 포함되도록 의도되어 있다.

Claims (24)

  1. 적응형 기하학적 분할(adaptive geometric partitioning)을 이용해서 화상(picture) 내의 하나의 영역에 대한 화상 데이터를 인코딩하는, 프로세서와 상기 프로세서에 연결된 메모리를 포함하는 비디오 인코더(encoder)(100)를 포함하되, 상기 영역에 대한 화상 데이터를 인코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정되며, 상기 거리는 상기 영역 내의 지점으로부터 분할 경계까지 측정된 것이고, 상기 각도는 상기 영역 내의 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된 것이고,
    상기 영역에 대한 화상 데이터를 인코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트는 미리 선택되고 인코딩된 분할부들의 통계자료를 분석하고, 인코딩된 블록들에 의해 선택된 분할부들의 통계자료에 기반하여 상기 서브세트를 재확립하고, 추가 영역들을 인코딩함으로써 결정되고, 분석하기 위한 영역들과 코드의 수는 적어도 하나의 하이 레벨 신택스 요소 내에서 특정되고, 상기 영역은 오직 상기 서브세트 내의 기하학적 분할부들만을 평가함으로써 인코딩되고, 상기 서브세트는 모든 이용가능한 기하학적 분할부들보다 덜 포함하고, 상기 기하학적 분할부들의 서브세트는 상기 거리의 비균일 샘플링과 한 영역의 규정된 지점으로부터 분할부의 경계까지의 상기 거리의 함수인 상기 각도의 밀도를 이용하는 것 및 상기 거리와 각도의 샘플링 간격을 제한하는 것에 기초하고,
    각도들은 상기 규정된 지점으로부터 한 영역 내의 한 블록의 중심까지의 거리가 작을 때 더 치밀하고, 각도들은 상기 규정된 지점으로부터 상기 블록의 중심까지의 거리가 더 클 때 더 성긴 비디오 인코딩 장치.
  2. 프로세서와 상기 프로세서에 연결된 메모리를 포함하는 비디오 인코더(video encoder)에서의 비디오 인코딩 방법에 있어서, 적응형 기하학적 분할 을 이용해서 화상 내의 하나의 영역에 대한 화상 데이터를 인코딩하는 단계(430, 615, 620, 625)를 포함하되, 상기 영역에 대한 화상 데이터를 인코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정되며, 상기 거리는 상기 영역 내의 지점으로부터 분할 경계까지 측정된 것이고, 상기 각도는 상기 영역 내의 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된 것이고,
    상기 영역에 대한 화상 데이터를 인코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트는 미리 선택되고 인코딩된 분할부들의 통계자료를 분석하고, 인코딩된 블록들에 의해 선택된 분할부들의 통계자료에 기반하여 상기 서브세트를 재확립하고, 추가 영역들을 인코딩함으로써 결정되고, 분석하기 위한 영역들과 코드의 수는 적어도 하나의 하이 레벨 신택스 요소 내에서 특정되고, 상기 영역은 오직 상기 서브세트 내의 기하학적 분할부들만을 평가함으로써 인코딩되고, 상기 서브세트는 모든 이용가능한 기하학적 분할부들보다 덜 포함하고, 상기 기하학적 분할부들의 서브세트는 상기 거리의 비균일 샘플링과 한 영역의 규정된 지점으로부터 분할부의 경계까지의 상기 거리의 함수인 상기 각도의 밀도를 이용하는 것 및 상기 거리와 각도의 샘플링 간격을 제한하는 것에 기초하고,
    각도들은 상기 규정된 지점으로부터 한 영역 내의 한 블록의 중심까지의 거리가 작을 때 더 치밀하고, 각도들은 상기 규정된 지점으로부터 상기 블록의 중심까지의 거리가 더 클 때 더 성긴 비디오 인코딩 방법.
  3. 제2항에 있어서, 상기 영역 내의 지점은 상기 영역의 중심부이고, 상기 기하학적 분할부들의 서브세트는 상기 영역의 중심부로부터 상기 분할 경계까지의 거리에 응답하여 결정되는(810) 것인 비디오 인코딩 방법.
  4. 제3항에 있어서, 거리 스텝(distance step) 및 각도 스텝(angle step)이 기하학적 분할 사전(geometric partition dictionary)을 구축하기 위하여 상기 적응형 기하학적 분할을 위한 거리 간격 및 각도 간격을 샘플링하는데 이용되고, 상기 거리 스텝 및 상기 각도 스텝은 상기 지점으로부터 상기 분할 경계까지의 거리의 함수이며, 상기 기하학적 분할부들의 서브세트는 상기 기하학적 분할 사전보다 적은 기하학적 분할부들을 지니는(810) 것인 비디오 인코딩 방법.
  5. 제3항에 있어서, 상기 기하학적 분할부들의 서브세트는 상기 지점으로부터 역치 거리보다 작거나 동등한 상기 분할 경계까지의 거리를 지니는 기하학적 분할부들을 포함하는 것인 비디오 인코딩 방법.
  6. 제2항에 있어서, 상기 기하학적 분할부들의 서브세트는 상기 화상 내의 상기 영역 및 미리 코딩된 다른 영역들 중 적어도 하나의 영역의 미리 코딩된 정보에 의거한(910) 것인 비디오 인코딩 방법.
  7. 제6항에 있어서, 상기 기하학적 분할부들의 서브세트는 상기 미리 코딩된 다른 영역들에 대해서 선택된 분할부에 의거한(910) 것인 비디오 인코딩 방법.
  8. 제7항에 있어서, 상기 영역에 대해서 선택된 분할부가 후속 영역에 대한 분할을 예측하기 위하여 외삽되고, 상기 후속 영역을 코딩하기 위한 기하학적 분할부들의 서브세트가 상기 후속 영역에 대한 예측된 분할부에 의거한(910) 것인 비디오 인코딩 방법.
  9. 제6항에 있어서, 상기 기하학적 분할부들의 서브세트는 상기 미리 코딩된 다른 영역들에 대해 선택된 분할부들의 통계자료(statistics)에 의거해서 유도된(910) 것인 비디오 인코딩 방법.
  10. 제9항에 있어서, 상기 화상은 비디오 시퀀스(video sequence)에 포함되고, 해당 비디오 시퀀스 내의 화상들의 세트는, 상기 영역 없이 각각, 강제 분할 계산 접근법(brute force partition computation approach)에 대응하는 기하학적 분할부들의 디폴트 사전(default dictionary)을 이용해서 인코딩되고, 상기 화상들의 세트에 대해 선택된 분할부들의 통계자료는 상기 영역에 대한 상기 기하학적 분할부들의 서브세트를 구축하는데 이용되고, 상기 서브세트는 상기 디폴트 사전보다 적은 기하학적 분할부들을 지니는 것인 비디오 인코딩 방법.
  11. 제2항에 있어서, 상기 적응형 기하학적 분할을 위해 이용되는 상기 기하학적 분할부들의 서브세트는 사용자 규정되고 얻어지는 비트스트림 내에 명시적으로 신호화되는(1010, 1115) 것인 비디오 인코딩 방법.
  12. 제2항에 있어서, 상기 서브세트는 복수개의 서브세트 중 하나이고, 상기 서브세트 및 상기 복수개의 서브세트는 모두 함께 가능한 모든 분할부 미만을 나타내고, 상기 복수개의 서브세트는 미리 저장되어 있으며, 상기 방법은 하나 이상의 하이 레벨 신택스 요소(high level syntax element)를 이용해서 디코더(decorder)에 인덱스를 전송하는 단계를 더 포함하되, 상기 인덱스는 디코딩을 위해 이용될 복수개의 서브세트 중 특정한 하나 이상을 표시하는(1110, 1115) 것인 비디오 인코딩 방법.
  13. 제2항에 있어서, 적어도 상기 영역에 대한 화상 데이터를 디코딩할 때 디코더에 의해 사용하기 위한 상기 기하학적 분할부들의 서브세트를 비트스트림으로 상기 디코더에 전송하는 단계(1010, 1110, 1115)를 더 포함하는 비디오 인코딩 방법.
  14. 제2항에 있어서, 상기 인코딩하는 단계는
    비율-왜곡 기준(rate-distortion criteria)에 의거해서 기하학적 분할부들의 디폴트 사전으로부터 상기 영역에 대한 분할부를 선택하는 단계; 및
    기하학적 움직임 보상을 수행하여 상기 영역에 대한 레지듀(residue)를 얻고, 기하학적 분할부들의 디폴트 사전 내의 다수의 이용가능한 분할부로부터 선택된 분할부만이 디코더에서 상기 레지듀의 후속 재구축으로부터 추정될 수 있도록 상기 레지듀를 재구축하는 단계(1215)를 더 포함하는 비디오 인코딩 방법.
  15. 적응형 기하학적 분할을 이용해서 화상 내의 하나의 영역에 대한 화상 데이터를 디코딩하는, 프로세서와 상기 프로세서에 연결된 메모리를 포함하는 비디오 디코더(decoder)(200)를 포함하되, 상기 영역에 대한 화상 데이터를 디코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정되며, 상기 거리는 상기 영역 내의 지점으로부터 분할 경계까지 측정된 것이고, 상기 각도는 상기 영역 내의 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된 것이고,
    상기 영역에 대한 화상 데이터를 디코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트는 미리 선택되고 디코딩된 분할부들의 통계자료를 분석하고, 인코딩된 블록들에 의해 선택된 분할부들의 통계자료에 기반하여 상기 서브세트를 재확립하고, 추가 영역들을 디코딩함으로써 결정되고, 분석하기 위한 영역들과 코드의 수는 적어도 하나의 하이 레벨 신택스 요소 내에서 특정되고, 상기 영역은 오직 상기 서브세트 내의 기하학적 분할부들만을 평가함으로써 디코딩되고, 상기 서브세트는 모든 이용가능한 기하학적 분할부들보다 덜 포함하고, 상기 기하학적 분할부들의 서브세트는 상기 거리의 비균일 샘플링과 한 영역의 규정된 지점으로부터 분할부의 경계까지의 상기 거리의 함수인 상기 각도의 밀도를 이용하는 것 및 상기 거리와 각도의 샘플링 간격을 제한하는 것에 기초하고,
    각도들은 상기 규정된 지점으로부터 한 영역 내의 한 블록의 중심까지의 거리가 작을 때 더 치밀하고, 각도들은 상기 규정된 지점으로부터 상기 블록의 중심까지의 거리가 더 클 때 더 성긴 비디오 디코딩 장치.
  16. 프로세서와 상기 프로세서에 연결된 메모리를 포함하는 비디오 디코더(video decoder)에서의 비디오 디코딩 방법에 있어서, 적응형 기하학적 분할을 이용해서 화상 내의 하나의 영역에 대한 화상 데이터를 디코딩하는 단계(720)를 포함하되, 상기 영역에 대한 화상 데이터를 디코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정되며, 상기 거리는 상기 영역 내의 지점으로부터 분할 경계까지 측정된 것이고, 상기 각도는 상기 영역 내의 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된 것이고,
    상기 영역에 대한 화상 데이터를 디코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트는 미리 선택되고 디코딩된 분할부들의 통계자료를 분석하고, 인코딩된 블록들에 의해 선택된 분할부들의 통계자료에 기반하여 상기 서브세트를 재확립하고, 추가 영역들을 디코딩함으로써 결정되고, 분석하기 위한 영역들과 코드의 수는 적어도 하나의 하이 레벨 신택스 요소 내에서 특정되고, 상기 영역은 오직 상기 서브세트 내의 기하학적 분할부들만을 평가함으로써 디코딩되고, 상기 서브세트는 모든 이용가능한 기하학적 분할부들보다 덜 포함하고, 상기 기하학적 분할부들의 서브세트는 상기 거리의 비균일 샘플링과 한 영역의 규정된 지점으로부터 분할부의 경계까지의 상기 거리의 함수인 상기 각도의 밀도를 이용하는 것 및 상기 거리와 각도의 샘플링 간격을 제한하는 것에 기초하고,
    각도들은 상기 규정된 지점으로부터 한 영역 내의 한 블록의 중심까지의 거리가 작을 때 더 치밀하고, 각도들은 상기 규정된 지점으로부터 상기 블록의 중심까지의 거리가 더 클 때 더 성긴 비디오 디코딩 방법.
  17. 제16항에 있어서, 상기 영역 내의 지점은 상기 영역의 중심부이고, 상기 기하학적 분할부들의 서브세트는 상기 영역의 중심부로부터 상기 분할 경계까지의 거리에 응답하여 결정되는(1310) 것인 비디오 디코딩 방법.
  18. 제17항에 있어서, 거리 스텝 및 각도 스텝이 기하학적 분할 사전을 구축하기 위하여 상기 적응형 기하학적 분할을 위한 거리 간격 및 각도 간격을 샘플링하는데 이용되고, 상기 거리 스텝 및 상기 각도 스텝은 상기 지점으로부터 상기 분할 경계까지의 거리의 함수이며, 상기 기하학적 분할부들의 서브세트는 상기 기하학적 분할 사전보다 적은 기하학적 분할부들을 지니는(1310) 것인 비디오 디코딩 방법.
  19. 제17항에 있어서, 상기 기하학적 분할부들의 서브세트는 상기 지점으로부터 역치 거리보다 작거나 동등한 상기 분할 경계까지의 거리를 지니는 기하학적 분할부들을 포함하는 것인 비디오 디코딩 방법.
  20. 제16항에 있어서, 상기 기하학적 분할부들의 서브세트는 상기 화상 내의 상기 영역 및 미리 코딩된 다른 영역들 중 적어도 하나의 영역의 미리 디코딩된 정보에 의거한(1410) 것인 비디오 디코딩 방법.
  21. 제16항에 있어서, 상기 서브세트는 복수개의 서브세트 중 하나이고, 상기 서브세트 및 상기 복수개의 서브세트는 모두 함께 가능한 모든 분할부 미만을 나타내고, 상기 복수개의 서브세트는 미리 저장되어 있으며, 상기 방법은 하나 이상의 하이 레벨 신택스 요소 내의 인덱스를 수신하는 단계를 더 포함하되, 상기 인덱스는 디코딩을 위해 이용될 복수개의 서브세트 중 특정한 하나 이상을 표시하는(1610) 것인 비디오 디코딩 방법.
  22. 제16항에 있어서, 상기 기하학적 분할부들의 서브세트는 적어도 상기 영역에 대한 상기 화상 데이터를 디코딩하는데 이용하기 위하여 인코더로부터 비트스트림으로 수신되는(1510) 것인 비디오 디코딩 방법.
  23. 제16항에 있어서, 상기 디코딩하는 단계는 레지듀를 비트스트림으로 수신하는 단계를 포함하되, 해당 레지듀는, 비율-왜곡 기준에 의거해서 기하학적 분할부들의 디폴트 사전으로부터 상기 영역에 대한 분할부를 선택하여, 기하학적 움직임 보상을 수행해서 상기 영역에 대한 레지듀를 얻고, 기하학적 분할부들의 디폴트 사전 내의 다수의 이용가능한 분할부로부터 선택된 분할부만이 상기 디코더에서 상기 레지듀의 후속 재구축으로부터 추정될 수 있도록 상기 레지듀를 재구축함으로써 미리 형성된 것인 비디오 디코딩 방법.
  24. 인코딩된 비디오 신호 데이터를 구비한 비일시적 저장매체(non-transitory storage media)로서,
    적응형 기하학적 분할을 이용해서 인코딩된 화상 내의 하나의 영역에 대한 화상 데이터를 포함하되, 상기 영역에 대한 화상 데이터를 인코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트가 거리와 각도 중 적어도 하나에 응답하여 결정되며, 상기 거리는 상기 영역 내의 지점으로부터 분할 경계까지 측정된 것이고, 상기 각도는 상기 영역 내의 지점으로부터 상기 분할 경계까지 연장되는 선에 대해서 측정된 것이고,
    상기 영역에 대한 화상 데이터를 인코딩하는데 이용되는 기하학적 분할부들의 초기 서브세트는 미리 선택되고 인코딩된 분할부들의 통계자료를 분석하고, 인코딩된 블록들에 의해 선택된 분할부들의 통계자료에 기반하여 상기 서브세트를 재확립하고, 추가 영역들을 인코딩함으로써 결정되고, 분석하기 위한 영역들과 코드의 수는 적어도 하나의 하이 레벨 신택스 요소 내에서 특정되고, 상기 영역은 오직 상기 서브세트 내의 기하학적 분할부들만을 평가함으로써 인코딩되고, 상기 서브세트는 모든 이용가능한 기하학적 분할부들보다 덜 포함하고, 상기 기하학적 분할부들의 서브세트는 상기 거리의 비균일 샘플링과 한 영역의 규정된 지점으로부터 분할부의 경계까지의 상기 거리의 함수인 상기 각도의 밀도를 이용하는 것 및 상기 거리와 각도의 샘플링 간격을 제한하는 것에 기초하고,
    각도들은 상기 규정된 지점으로부터 한 영역 내의 한 블록의 중심까지의 거리가 작을 때 더 치밀하고, 각도들은 상기 규정된 지점으로부터 상기 블록의 중심까지의 거리가 더 클 때 더 성긴 비일시적 저장매체.
KR1020127001936A 2009-06-26 2010-06-25 적응형 기하학적 분할을 이용한 비디오 인코딩 및 디코딩 방법 및 장치 KR101740039B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22091809P 2009-06-26 2009-06-26
US61/220,918 2009-06-26
PCT/US2010/001829 WO2010151334A1 (en) 2009-06-26 2010-06-25 Methods and apparatus for video encoding and decoding using adaptive geometric partitioning

Publications (2)

Publication Number Publication Date
KR20120096458A KR20120096458A (ko) 2012-08-30
KR101740039B1 true KR101740039B1 (ko) 2017-05-25

Family

ID=42617514

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127001936A KR101740039B1 (ko) 2009-06-26 2010-06-25 적응형 기하학적 분할을 이용한 비디오 인코딩 및 디코딩 방법 및 장치

Country Status (6)

Country Link
US (1) US9326003B2 (ko)
EP (1) EP2446627B1 (ko)
JP (1) JP5826747B2 (ko)
KR (1) KR101740039B1 (ko)
CN (1) CN102484706B (ko)
WO (1) WO2010151334A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019078581A1 (ko) * 2017-10-16 2019-04-25 디지털인사이트주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2024111964A1 (ko) * 2022-11-21 2024-05-30 현대자동차주식회사 기하학적 분할 모드에서 적응적으로 블렌딩 영역을 결정하는 비디오 코딩을 위한 방법 및 장치

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US20120147961A1 (en) * 2010-12-09 2012-06-14 Qualcomm Incorporated Use of motion vectors in evaluating geometric partitioning modes
US9807424B2 (en) 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
US9167274B1 (en) * 2012-03-21 2015-10-20 Google Inc. Generating synchronized dictionaries for sparse coding
US9137528B1 (en) * 2012-09-28 2015-09-15 Google Inc. Synchronizing sparse coding dictionaries for use in communication sessions
US20160073107A1 (en) * 2013-04-15 2016-03-10 Intellectual Discovery Co., Ltd Method and apparatus for video encoding/decoding using intra prediction
CN103561276B (zh) * 2013-11-07 2017-01-04 北京大学 一种图像视频编解码方法
KR101980349B1 (ko) * 2014-03-05 2019-05-20 엘지전자 주식회사 폴리곤 유닛 기반 영상 인코딩/디코딩 방법 및 이를 위한 장치
CN107251008B (zh) 2015-02-27 2020-11-13 帝威视有限公司 在实况视频编码和流传输中进行帧复制和帧扩展的系统和方法
KR20180045530A (ko) 2016-10-26 2018-05-04 디지털인사이트 주식회사 임의의 블록 분할을 사용하는 비디오 코딩 방법 및 장치
WO2018128239A1 (ko) * 2017-01-03 2018-07-12 엘지전자 주식회사 영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치
EP3632106A1 (en) 2017-06-30 2020-04-08 Huawei Technologies Co., Ltd. Encoder, decoder, computer program and computer program product for processing a frame of a video sequence
WO2019001734A1 (en) * 2017-06-30 2019-01-03 Huawei Technologies Co., Ltd. ENCODER, DECODER, COMPUTER PROGRAM, AND COMPUTER PROGRAM PRODUCT FOR PROCESSING A FRAME OF A VIDEO SEQUENCE
CA3068393A1 (en) * 2017-06-30 2019-01-03 Sharp Kabushiki Kaisha Systems and methods for geometry-adaptive block partitioning of a picture into video blocks for video coding
BR112019028012A2 (pt) 2017-06-30 2020-07-07 Huawei Technologies Co., Ltd. dispositivo e método para determinar um vetor de movimento, codificador e decodificador de vídeo para codificar e decodificar uma pluralidade de fotos
WO2019050418A1 (en) * 2017-09-11 2019-03-14 Nyriad Limited COMPRESSION OF DATA BASED ON A DICTIONARY
JP2021514162A (ja) 2018-02-22 2021-06-03 エルジー エレクトロニクス インコーポレイティド 映像コーディングシステムにおけるブロック分割構造による映像デコーディング方法及び装置
CN112602324A (zh) * 2018-06-22 2021-04-02 Op方案有限责任公司 块水平几何划分
WO2020088689A1 (en) 2018-11-02 2020-05-07 Beijing Bytedance Network Technology Co., Ltd. Usage of hmvp candidates in geometry partition prediction mode
WO2020094049A1 (en) 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Extensions of inter prediction with geometric partitioning
CN112997487A (zh) 2018-11-15 2021-06-18 北京字节跳动网络技术有限公司 仿射模式与其他帧间编解码工具之间的协调
CN113170182B (zh) * 2018-12-03 2024-01-26 北京字节跳动网络技术有限公司 不同预测模式下的修剪方法
CN113170166B (zh) 2018-12-30 2023-06-09 北京字节跳动网络技术有限公司 具有几何分割的帧间预测在视频处理中有条件的应用
JP2022523697A (ja) 2019-01-28 2022-04-26 オーピー ソリューションズ, エルエルシー 適応的な数の領域を伴う幾何学的分割におけるインター予測
AU2020294669B2 (en) 2019-06-21 2024-03-28 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods for sub-block partitioning mode
JP7233561B2 (ja) * 2019-07-02 2023-03-06 テンセント・アメリカ・エルエルシー 点群圧縮のための方法並びにその、装置およびコンピュータプログラム
CA3152030A1 (en) * 2019-08-26 2021-03-04 Huawei Technologies Co., Ltd. Method and apparatus for motion information storage
IL291768A (en) 2019-10-03 2022-06-01 Huawei Tech Co Ltd Encoding process for geometric division mode
US11533498B2 (en) 2019-11-21 2022-12-20 Tencent America LLC Geometric partitioning mode in video coding
CN117729330A (zh) 2019-11-30 2024-03-19 抖音视界(北京)有限公司 使用几何分割的简化的帧间预测
US11317094B2 (en) * 2019-12-24 2022-04-26 Tencent America LLC Method and apparatus for video coding using geometric partitioning mode
WO2021129694A1 (en) * 2019-12-24 2021-07-01 Beijing Bytedance Network Technology Co., Ltd. High level syntax for inter prediction with geometric partitioning
US11212523B2 (en) * 2020-01-12 2021-12-28 Mediatek Inc. Video processing methods and apparatuses of merge number signaling in video coding systems
EP4131958A4 (en) * 2020-04-03 2023-04-26 Guangdong Oppo Mobile Telecommunications Corp., Ltd. INTERFRAME PREDICTION METHOD, ENCODER, DECODER AND STORAGE MEDIUM
WO2021196235A1 (zh) * 2020-04-03 2021-10-07 Oppo广东移动通信有限公司 帧间预测方法、编码器、解码器及存储介质
WO2022047099A1 (en) * 2020-08-28 2022-03-03 Op Solutions, Llc Methods and systems of adaptive geometric partitioning
WO2023033603A1 (ko) * 2021-09-02 2023-03-09 한국전자통신연구원 기하학적 분할을 사용하는 영상 부호화/복호화를 위한 방법, 장치 및 기록 매체

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016605A2 (en) 2006-08-02 2008-02-07 Thomson Licensing Adaptive geometric partitioning for video decoding
US20080101707A1 (en) 2006-10-30 2008-05-01 Debargha Mukherjee Method for decomposing a video sequence frame
WO2008127568A2 (en) 2007-04-12 2008-10-23 Thomson Licensing Methods and apparatus for fast geometric mode decision in a video encoder

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144688A (en) * 1990-03-23 1992-09-01 Board Of Regents, The University Of Texas System Method and apparatus for visual pattern image coding
JP3480971B2 (ja) * 1993-10-17 2003-12-22 ヒューレット・パッカード・カンパニー 画像データの生成方法及び復元方法
KR100327412B1 (ko) * 1999-08-02 2002-03-13 서평원 에러 정정을 위한 영상 부호화 및 복호화 방법
US7728878B2 (en) * 2004-12-17 2010-06-01 Mitsubishi Electric Research Labortories, Inc. Method and system for processing multiview videos for view synthesis using side information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016605A2 (en) 2006-08-02 2008-02-07 Thomson Licensing Adaptive geometric partitioning for video decoding
US20080101707A1 (en) 2006-10-30 2008-05-01 Debargha Mukherjee Method for decomposing a video sequence frame
WO2008127568A2 (en) 2007-04-12 2008-10-23 Thomson Licensing Methods and apparatus for fast geometric mode decision in a video encoder

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019078581A1 (ko) * 2017-10-16 2019-04-25 디지털인사이트주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
US11159793B2 (en) 2017-10-16 2021-10-26 Digitalinsights Inc. Method, device, and recording medium storing bit stream, for encoding/decoding image
US11265543B2 (en) 2017-10-16 2022-03-01 Digitalinsights Inc. Method, device, and recording medium storing bit stream, for encoding/decoding image
US11831870B2 (en) 2017-10-16 2023-11-28 Digitalinsights Inc. Method, device, and recording medium storing bit stream, for encoding/decoding image
WO2024111964A1 (ko) * 2022-11-21 2024-05-30 현대자동차주식회사 기하학적 분할 모드에서 적응적으로 블렌딩 영역을 결정하는 비디오 코딩을 위한 방법 및 장치

Also Published As

Publication number Publication date
US9326003B2 (en) 2016-04-26
EP2446627A1 (en) 2012-05-02
CN102484706B (zh) 2015-09-16
WO2010151334A1 (en) 2010-12-29
JP5826747B2 (ja) 2015-12-02
KR20120096458A (ko) 2012-08-30
EP2446627B1 (en) 2017-09-13
JP2012531808A (ja) 2012-12-10
US20120106627A1 (en) 2012-05-03
CN102484706A (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
KR101740039B1 (ko) 적응형 기하학적 분할을 이용한 비디오 인코딩 및 디코딩 방법 및 장치
US11895327B2 (en) Method and apparatus for parametric, model- based, geometric frame partitioning for video coding
TWI816858B (zh) 用於變換矩陣選擇的隱式編碼
US8625670B2 (en) Method and apparatus for encoding and decoding image
US9161031B2 (en) Method and apparatus for transform selection in video encoding and decoding
US10743027B2 (en) Methods and apparatus for adaptive template matching prediction for video encoding and decoding
EP3361733B1 (en) Entropy coding of a video and entropy decoding of a video
CN107396117B (zh) 视频编码和解码方法及非暂时性计算机可读存储介质
US10075725B2 (en) Device and method for image encoding and decoding
CN111819853A (zh) 变换域中预测的信令残差符号
KR20110009141A (ko) 비디오 부호화 및 복호화에서의 템플릿 매칭 예측을 위한 방법 및 장치
EP3107298A1 (en) Image encoding method for sample value compensation and apparatus therefor, and image decoding method for sample value compensation and apparatus therefor
US20230300326A1 (en) Prediction methods
WO2021115387A1 (en) Methods and apparatus for restricted secondary transform and signaling thereof in image coding
CN114747216A (zh) 多重转换选择的发信技术

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant