KR20110057794A - 부호화기 및 부호화기의 후보 모드 결정 방법 - Google Patents

부호화기 및 부호화기의 후보 모드 결정 방법 Download PDF

Info

Publication number
KR20110057794A
KR20110057794A KR1020090114349A KR20090114349A KR20110057794A KR 20110057794 A KR20110057794 A KR 20110057794A KR 1020090114349 A KR1020090114349 A KR 1020090114349A KR 20090114349 A KR20090114349 A KR 20090114349A KR 20110057794 A KR20110057794 A KR 20110057794A
Authority
KR
South Korea
Prior art keywords
mode
candidate
type
cost
skip
Prior art date
Application number
KR1020090114349A
Other languages
English (en)
Other versions
KR101138736B1 (ko
Inventor
장의선
이선영
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020090114349A priority Critical patent/KR101138736B1/ko
Publication of KR20110057794A publication Critical patent/KR20110057794A/ko
Application granted granted Critical
Publication of KR101138736B1 publication Critical patent/KR101138736B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

부호화기 및 부호화기의 후보 모드 결정 방법이 개시된다. 후보 모드 결정 방법은, 현재 프레임 내의 a개의 참조 매크로블록에 대한 모드 타입 및 하나 이상의 이전 프레임 내의 b개 참조 매크로블록에 대한 모드 타입의 모드 타입 인덱스를 포함하는 시공간적 컨텍스트를 입력받는 단계; 및 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스를 참조하여 현재 매크로블록의 인코딩을 위한 후보 모드 타입을 결정하는 단계를 포함할 수 있다. 본 발명에 의해, AVC/H.264 표준의 모드 선택 및 인코딩 처리가 신속하게 이루어질 수 있다.
인코더, 부호화, 모드

Description

부호화기 및 부호화기의 후보 모드 결정 방법{Encoder and method for selecting candidate mode types}
본 발명은 부호화기에 관한 것으로, 특히 매크로블록의 부호화 모드 타입을 신속하게 결정할 수 있는 부호화기 및 부호화기의 후보 모드 결정 방법에 관한 것이다.
최신 동영상 부호화 표준인, MPEG-4 AVC/H.264는 현존하는 동영상 부호화 표준 중 압축률에 있어서 최대 성능을 제공하는 것으로 알려져 있다. 블록 기반의 비디오 데이터를 압축하는 AVC/H.264 방식의 비디오 인코더(encoder)는, 예측 부호화 방법을 이용하여 잔차 데이터(residual data)를 감소시키고, 이 과정에서의 잔차 데이터(residual data), 모드 정보, 움직임 벡터 정보 등을 블록 DCT(Discrete Cosine Transform), 양자화(Quantization), 엔트로피 코딩(entropy coding) 등의 과정으로 압축된 데이터 스트림으로 만든다.
예측 부호화 방법은 인터 예측(inter prediction)과 인트라 예측(intra prediction)으로 구분된다. 인터 예측은 이전 영상의 시간적(temporal) 상관관계를 이용하는 방법이고, 인트라 예측은 공간적(spatial) 상관관계를 이용하는 방법이다. H.264/AVC 방식 등의 비디오 인코더에서는 예를 들어 I-프레임에 대해서는 인트라 예측을 수행하고, P-프레임이나 B-프레임에 대해서는 인터 예측과 인트라 예측을 모두 수행한다.
다양한 압축 방법 중 AVC/H.264 JM 인코더의 매크로블록(MB, macroblock)에 대한 모드 선택 과정은, 매 매크로블록마다 다수의 모드 타입들(mode types)을 평 가한 후 그 중 가장 성능이 우수한 모드 타입을 해당 매크로 블록의 모드 타입으로 선정하는 과정이다.
아래의 표 1은 AVC/H.264 BP(baseline profile) 표준에서 사용되는 매크로블록 모드 타입들을 나열한 것이고, 도 1은 종래기술에 따른 AVC/H.264 JM 11.0에서의 최적 모드 타입 선정 과정을 나타낸 도면이다.
표 1. AVC/H.264 BP 표준의 매크로블록 모드 타입들
Coding type Mode type
index
Mode type Sub-mode type
Intra 9 I4MB
(for luma)
Vertical
Horizontal
DC
Diagonal down-left
Diagonal down-right
Vertical-right
Horizontal-down
Vertical-left
Horizontal-up
10 I16MB
(for luma)
Vertical
Horizontal
DC
Plane
- I8MB
(for chroma)
DC
Horizontal
Vertical
Plane
Inter 0 SKIP
1 16×16
2 16×8
3 8×16
8 P8×8 8×8
8×4
4×8
4×4
도 1에 도시된 바와 같이, 매크로블록의 부호화를 위한 최적 모드 타입(best mode type)을 결정하기 위하여, 표 1에 제시된 각 모드 타입들에 대한 인터 예측 및 인트라 예측을 순차적으로 수행(단계 110 및 단계 120)한 후 각각의 모드에 대한 비트율-왜곡 비용(Rate-Distortion cost)을 계산하여(단계 130), 최소 비트율-왜곡 비용을 보이는 모드 타입을 최적 모드 타입으로 선택(단계 140)하고 압축을 수행한다.
참고로, 부호화기의 최적 모드 타입 결정에는 코딩 비트(coding bits (rate))와 이미지 퀄리티(image quality (distortion))라는 두 가지 요인이 고려 될 수 있다. AVC/H.264 표준에서는 모드 타입을 결정함에 있어 세 가지 모드를 지원한다.
첫째, “RDO=ON” 모드로서, 각 모드 타입의 비용(cost)을 측정하기 위해 RDO 함수를 이용한다. 이때 RDO 함수는 하나의 모드 타입이 적용 될 때 발생하는 비용을 비트율(rate)과 이미지 왜곡(distortion)을 고려하여 산정한다.
둘째, “RDO=ON and earlySkip” 모드로서, 모드 타입 결정을 위해서는 “RDO=ON" 모드와 동일하게 RDO 함수를 이용하지만, 해당 매크로블록 타입이 스킵 모드(SKIP mode) 인지를 조기에 결정하여, 스킵 모드인 경우는 그 외 다른 모드 타입을 평가하지 않는다. 이를 통해, “RDO=ON” 모드에 비해 복잡도를 상당량 감소시킬 수 있는 장점이 있다.
셋째, “RDO=OFF” 모드로서, 일부 비트율과 이미지 왜곡만을 측정함으로써 계산 복잡도를 낮추어 모든 모드 타입들을 평가하는 방법이다.
상술한 바와 같이, 매 매크로블록을 부호화하기 위해 수많은 매크로블록 모 드 타입들 중에서 하나의 모드 타입을 결정하는 방법은 엄청난 복잡도를 가지게 된다. 또한 엄청난 복잡도로 인해 부호화기의 성능이 약화되며, 이는 실시간 비디오 데이터 처리에 대한 문제점을 야기할 수도 있다.
본 발명은 다양한 모드 타입들 중 시간적 및 공간적 상관관계(spatial and temporal correlation)를 이용하여 일부의 후보 모드 타입들(CMT, candidate mode types)을 선별함으로써 AVC/H.264 표준의 모드 선택 및 인코딩 처리가 신속하게 이루어질 수 있도록 하는 부호화기 및 부호화기의 후보 모드 결정 방법을 제공하기 위한 것이다.
본 발명은 시간적 및 공간적 상관관계(spatial and temporal correlation)를 이용하여 모드 선택 방법을 단순화함으로써 부호화기의 복잡도를 최소화할 수 있는 부호화기 및 부호화기의 후보 모드 결정 방법을 제공하기 위한 것이다.
또한 본 발명은 복잡도의 감소로 인해 부호화기의 성능이 극대화되며, 실시간 비디오 처리에 보다 효과적인 부호화기 및 부호화기의 후보 모드 결정 방법을 제공하기 위한 것이다.
또한 본 발명은 MPEG-4 AVC/H.264 부호화기를 사용하는 모든 기기에서 동영상 부호화 시간을 최소화하도록 하는 부호화기 및 부호화기의 후보 모드 결정 방법을 제공하기 위한 것이다.
본 발명의 이외의 목적들은 하기의 설명을 통해 쉽게 이해될 수 있을 것이다.
본 발명의 일 측면에 따르면, 후보 모드 타입 결정 방법 및 그 방법을 수행하기 위한 프로그램이 기록된 기록매체가 제공된다.
본 발명의 일 실시예에 따르면, 현재 매크로블록(current macroblock)의 인코딩을 위해 인코더에서 수행되는 후보 모드 타입(CMT) 결정 방법으로서, 현재 프레임 내의 a개의 참조 매크로블록에 대한 모드 타입 및 하나 이상의 이전 프레임 내의 b개 참조 매크로블록에 대한 모드 타입의 모드 타입 인덱스(mode type index)를 포함하는 시공간적 컨텍스트(spatio-temporal context)를 입력받는 단계; 및 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스를 참조하여 상기 현재 매크로블록의 인코딩을 위한 후보 모드 타입을 결정하는 단계를 포함하되, 상기 a와 b는 각각 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법이 제공된다.
상기 후보 모드 타입을 결정하기 위해 상기 모드 타입 인덱스의 합산 값 및 상기 인트라 모드 타입의 수 중 하나 이상이 이용될 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0이고, 상기 현재 매크로블록을 SKIP 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 RDcostMAX 이하인 경우 SKIP 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 RDcostMAX을 산출하기 위한 수학식은,
Figure 112009072360012-PAT00001
이고, 상기
Figure 112009072360012-PAT00002
는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0이고, 상기 현재 매크로블록을 SKIP 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 RDcostMAX를 초과하는 경우 SKIP 모드 및 16x16 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 RDcostMAX을 산출하기 위한 수학식은,
Figure 112009072360012-PAT00003
이고, 상기 는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0 초과 및 n 미만이고, 상기 현재 매크로블록을 SKIP 모드와 16x16 모드로 각각 가정하여 산출한 비트율-왜곡 비용(RD Cost)의 최소값이 RDcostMED 이하인 경우 SKIP 모드 및 16x16 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 RDcostMED를 산출하 기 위한 수학식은,
Figure 112009072360012-PAT00005
이고, 상기
Figure 112009072360012-PAT00006
는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, Median은 네 개의 RD cost들 중 두 번째 및 세 번째 크기를 가지는 값들의 평균값을 산출하기 위한 것이며, 상기 n은 임의의 자연수인 것일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0 초과 및 n 미만이고, 상기 현재 매크로블록을 SKIP 모드와 16x16 모드로 각각 가정하여 산출한 비트율-왜곡 비용(RD Cost)의 최소값이 RDcostMED를 초과하는 경우 SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 RDcostMED를 산출하기 위한 수학식은,
Figure 112009072360012-PAT00007
이고, 상기
Figure 112009072360012-PAT00008
는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, Median은 네 개의 RD cost들 중 두 번째 및 세 번째 크기를 가지는 값들의 평균값을 산출하기 위한 것이며, 상기 n은 임의의 자연수인 것일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이며, 상기 현재 매크로블록을 16x16 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 상기 현재 매크로블록을 P8x8의 4444 서브 모드로 가정하여 산출한 RD Cost 이하인 경우 SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 n은 임 의의 자연수일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이며, 상기 현재 매크로블록을 16x16 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 상기 현재 매크로블록을 P8x8의 4444 서브 모드로 가정하여 산출한 RD Cost를 초과하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드 및 P8x8 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 n은 임의의 자연수일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I4MB 모드를 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I4MB 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 n은 임의의 자연수일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I16MB 모드를 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I16MB 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 n은 임의의 자연수일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I4MB 모드와 I16MB 모드를 모두 포함하는 경우 SKIP 모 드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드, I4MB 모드 및 I16MB 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 n은 임의의 자연수일 수 있다.
상기 n은 4일 수 있다.
상기 현재 프레임 내의 2개의 참조 매크로블록은 상기 현재 매크로블록의 상측과 좌측에 각각 위치된 매크로블록일 수 있다.
상기 b개의 참조 매크로블록은 현재 프레임인 t번째 프레임의 직전 프레임인 t-1번째 프레임에서의 상기 현재 매크로블록과 동일 위치인 매크로블록 및 그 이전 프레임인 t-2번째 프레임에서의 상기 현재 매크로블록과 동일 위치인 매크로블록을 포함할 수 있다.
본 발명의 다른 측면에 따르면, 후보 모드 타입 결정 방법이 적용되는 부호화기가 제공된다.
본 발명의 일 실시예에 따른 부호화기는, 현재 프레임 내의 a개의 참조 매크로블록에 대한 모드 타입 및 하나 이상의 이전 프레임 내의 b개 참조 매크로블록에 대한 모드 타입의 모드 타입 인덱스를 포함하는 시공간적 컨텍스트를 이용하여 하나 이상의 후보 모드 타입(CMT)을 결정하는 후보 모드 결정 유닛; 및 상기 후보 모드 타입에 대해 인터 예측(inter prediction) 및 인트라 예측(intra prediction) 중 하나 이상을 수행하고, 상기 모드 예측 수행된 모드 타입에 대해 비트율 및 이미지 왜곡 중 하나 이상의 측정에 따라 최적 인코딩 모드 타입을 결정하는 부호화 모드 결정 유닛을 포함하되, 상기 a와 b는 각각 임의의 자연수일 수 있다.
상기 후보 모드 타입을 결정하기 위해 상기 모드 타입 인덱스의 합산 값 및 상기 인트라 모드 타입의 수 중 하나 이상이 이용될 수 있다.
상기 후보 모드 결정 유닛은, 상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0이고, 상기 현재 매크로블록을 SKIP 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 RDcostMAX 이하인 경우 SKIP 모드를 포함하는 상기 후보 모드 타입을 결정하되, 상기 RDcostMAX을 산출하기 위한 수학식은,
Figure 112009072360012-PAT00009
이고, 상기
Figure 112009072360012-PAT00010
는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것일 수 있다.
상기 후보 모드 결정 유닛은, 상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0이고, 상기 현재 매크로블록을 SKIP 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 RDcostMAX를 초과하는 경우 SKIP 모드 및 16x16 모드를 포함하는 상기 후보 모드 타입을 결정하되, 상기 RDcostMAX을 산출하기 위한 수학식은,
Figure 112009072360012-PAT00011
이고, 상기
Figure 112009072360012-PAT00012
는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것일 수 있다.
상기 후보 모드 결정 유닛은, 상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0 초과 및 n 미만이고, 상기 현재 매크로블록을 SKIP 모드와 16x16 모드로 각각 가정하여 산출한 비트율-왜곡 비용(RD Cost)의 최소값이 RDcostMED 이하인 경우 SKIP 모드 및 16x16 모드를 포함하는 상기 후보 모드 타입을 결정하되, 상기 RDcostMED를 산출하기 위한 수학식은,
Figure 112009072360012-PAT00013
이고, 상기
Figure 112009072360012-PAT00014
는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, Median은 네 개의 RD cost들 중 두 번째 및 세 번째 크기를 가지는 값들의 평균값을 산출하기 위한 것이며, 상기 n은 임의의 자연수일 수 있다.
상기 후보 모드 결정 유닛은, 상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0 초과 및 n 미만이고, 상기 현재 매크로블록을 SKIP 모드와 16x16 모드로 각각 가정하여 산출한 비트율-왜곡 비용(RD Cost)의 최소값이 RDcostMED를 초과하는 경우 SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드를 포함하는 상기 후보 모드 타입을 결정하되, 상기 RDcostMED를 산출하기 위한 수학식은,
Figure 112009072360012-PAT00015
이고, 상기
Figure 112009072360012-PAT00016
는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, Median은 네 개의 RD cost들 중 두 번째 및 세 번째 크기를 가지는 값들의 평균값을 산출하기 위한 것이며, 상기 n은 임의의 자연수일 수 있다.
상기 후보 모드 결정 유닛은, 상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이며, 상기 현재 매크로블록을 16x16 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 상기 현재 매크로블록을 P8x8의 4444 서브 모드로 가정하여 산출한 RD Cost 이하인 경우 SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드를 포함하는 상기 후보 모드 타입을 결정하되, 상기 n은 임의의 자연수일 수 있다.
상기 후보 모드 결정 유닛은, 상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이며, 상기 현재 매크로블록을 16x16 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 상기 현재 매크로블록을 P8x8의 4444 서브 모드로 가정하여 산출한 RD Cost를 초과하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드 및 P8x8 모드를 포함하는 상기 후보 모드 타입을 결정하되, 상기 n은 임의의 자연수일 수 있다.
상기 후보 모드 결정 유닛은, 상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I4MB 모드를 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I4MB 모드를 포함하는 상기 후보 모드 타입을 결정하되, 상기 n은 임의의 자연수일 수 있다.
상기 후보 모드 결정 유닛은, 상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I16MB 모드를 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I16MB 모드를 포함하는 상기 후보 모드 타입을 결정하되, 상기 n은 임의의 자연수일 수 있다.
상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I4MB 모드와 I16MB 모드를 모두 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드, I4MB 모드 및 I16MB 모드를 포함하는 상기 후보 모드 타입이 결정되되, 상기 n은 임의의 자연수일 수 있다.
본 발명의 실시예에 의하면, 다양한 모드 타입들 중 시간적 및 공간적 상관관계(spatial and temporal correlation)를 이용하여 일부의 후보 모드 타입들(CMT, candidate mode types)을 선별함으로써 AVC/H.264 표준의 모드 선택 및 인코딩 처리가 신속하게 이루어질 수 있도록 하는 효과가 있다.
또한 시간적 및 공간적 상관관계(spatial and temporal correlation)를 이용하여 모드 선택 방법을 단순화함으로서 부호화기의 복잡도를 최소화할 수 있는 효과가 있다.
또한 복잡도의 감소로 인해 부호화기의 성능이 극대화되며, 실시간 비디오 처리에 보다 효과적인 장점도 있다.
또한 MPEG-4 AVC/H.264 부호화기를 사용하는 모든 기기에서 동영상 부호화 시간을 최소화하도록 할 수 있는 효과도 있다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. 또한, “/”의 기호는 “및”과 “또는”을 포함하는 것이고, 문장에서 어느 하나의 의미로 또는 둘을 모 두 포함하여 해석되는 것으로 이해되어야 한다.
또한, 명세서에 기재될 수 있는 “...부”, “...기”, “...유닛”, “...모듈” 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
이하, 본 발명의 실시예에 대해 관련 도면들을 참조하여 상세히 설명하기로 한다.
도 2는 본 발명의 일 실시예에 따른 모드 선택부의 구성을 나타낸 블록 구성도이고, 도 3 내지 도 4d는 본 발명의 일 실시예에 따른 모드 결정 모델(MDM, mode decision model)의 후보 모드 타입 결정 과정을 나타낸 순서도이다.
도 2를 참조하면, 모드 선택부는 후보 모드 결정 유닛(210) 및 부호화 모드 결정 유닛(220)을 포함한다. 모드 선택부 또는 모드 선택부에 포함된 하나 이상의 구성 요소는 하드웨어 구성으로 구현되거나 소프트웨어 알고리즘의 형태로 구현될 수도 있다.
후보 모드 결정 유닛(210)은 네 개의 매크로블록 타입 정보 (T1, T2, T3, T4)를 입력받아 모드 결정 모델(MDM, mode decision model)을 이용하여 후보 모드 타입들(CMTs, candidate mode types)을 선별하고, 선별한 후모 모드 타입들에 관한 정보를 부호화 모드 결정 유닛(220)으로 제공한다.
네 개의 매크로블록 타입 정보는 세 개의 프레임에서 현재 부호화 모드 결정을 위한 매크로블록에 대한 시간적 및/또는 공간적 상관관계(spatial and temporal correlation)를 이용하여 인식될 수 있다.
예를 들어, 공간적(spatial) 상관관계로서 현재 프레임(t번째 프레임)에서 해당 매크로블록의 상측(top) 매크로블록과 좌측(left) 매크로블록의 타입 정보들과, 시간적(temporal) 상관관계로서 직전 프레임(t-1번째 프레임)과 그 이전 프레임(t-2번째 프레임)에서의 동일 위치의 매크로블록의 타입 정보들이 이용될 수 있다. 여기서, 본 실시예에 따른 후보 모드 타입 결정 방법은 t가 3이상인 자연수일 때 이용될 수 있다.
상술한 예에서 t번째 프레임에서 (i, j) 위치의 매크로블록의 타입을 위한 시간적 및 공간적 상관관계(spatial and temporal correlation)는 하기 수학식 1과 같이 표현될 수 있다.
Figure 112009072360012-PAT00017
여기서,
Figure 112009072360012-PAT00018
은 t번째 프레임의 (i, j) 위치의 매크로블록 타입을 나타낸다.
물론, 참조되는 네 개의 매크로블록의 위치는 상기 예에 제한되지 않으며, 시간적으로 해당 매크로블록에 앞서서 모드 타입이 결정된 매크로블록이면 임의로 지정될 수도 있다. 또한, 참조를 위한 매크로블록의 수량도 위의 예에서 제시된 네 개의 매크로블록으로 제한되지 않음은 당연하다.
상술한 수학식 1에 따른 네 개의 매크로블록 타입(MB types) 정보를 이용하여 t번째 프레임의 (i, j) 위치의 매크로블록 타입을 위해 선별된 후보 모드 타입들(CMTs)의 표기 방법은 아래 수학식 2와 같이 예시될 수 있다.
CMT(T1,T2,T3,T4) = b0b1...bn
여기서, 모드 타입 k가 선정되었을 때 bk = 1이고, 그렇지 않은 경우라면 bk = 0이다. 모드 타입 k는 앞서 설명한 표 1의 모드 타입 인덱스(mode type index)에서 확인할 수 있다. 즉, CMT는 7비트의 형태로 표기될 수 있으며, 각 비트는 표 1에 기재된 모드 타입 인덱스의 순서로, 각 모드 타입이 선택되었는지 여부를 나타낸다. 물론, CMT의 표기 방식이나 순서는 다양하게 지정될 수 있다.
예를 들어, 현재의 AVC/H.264 JM 인코더의 경우, 매 매크로블록마다 모든 모드 타입이 항상 활성화되어 있으므로, 수학식 2 및 도 2를 참조할 때 CMT는 “1111111”로 표기될 수 있다. 그러나 만약, 후보 모드 타입으로 SKIP 및 16×16 모드 타입들만이 선정된 경우라면 CMT는 “1100000”로 표기될 수 있다. 마찬가지로 후보 모드 타입으로 SKIP, 16×16, 16x8 및 8x16 모드 타입들만이 선정된 경우라면 CMT는 “1111000”로 표기될 수 있다.
후보 모드 결정 유닛(210)의 모드 결정 모델(MDM, mode decision model)은 후보 모드 타입들(CMTs)에 관한 정보(예를 들어, (T1,T2,T3,T4)와 같은 시공간적 컨텍스트(spatio-temporal context))를 입력받아 후보 모드들(candidate modes)을 보다 효과적으로 결정할 수 있도록 한다.
모드 결정 모델이 후보 모드들을 보다 신속히 결정할 수 있도록 하기 위해 CMT 타입, 각 CMT 타입에 속하는 후보 모드 그룹들이 미리 설정하여 구비할 수 있으며, 이는 아래 표 2에 예시된 바와 같이 4개의 CMT 타입 및 7개의 후보 모드 그룹으로 세분화될 수 있다. 물론, CMT 타입 및 후보 모드 그룹의 유형은 보다 세분화하여 설정될 수도 있다.
표 2. CMT 타입, 후보 모드 그룹 및 후보 모드들의 예시
CMT 타입 후보 모드
그룹
후보 모드들
1 그룹 1 {SKIP}
그룹 2 {SKIP, 16×16}
2 그룹 2 {SKIP, 16×16}
그룹 3 {SKIP, 16×16, 16×8, 8×16}
3 그룹 3 {SKIP, 16×16, 16×8, 8×16}
그룹 4 {SKIP, 16×16, 16×8, 8×16, P8×8}
4 그룹 5 {SKIP, 16×16, 16×8, 8×16, P8×8, I4MB}
그룹 6 {SKIP, 16×16, 16×8, 8×16, P8×8, I16MB}
그룹 7 {SKIP, 16×16, 16×8, 8×16, P8×8, I4MB, I16MB}
전술한 바와 같이, 표 2에는 후보 모드 타입들(CMTs)에 의해 결정되는 4개의 CMT 타입들, 각 CMT 타입에 속하는 후보 모드 그룹과 각 후보 모드 그룹에 속하는 하나 이상의 후보 모드들이 나열되어 있다. 모드 결정 모델은 각 매크로블록의 시공간적 컨텍스트를 이용하여 CMT 타입을 결정한다. 이때, 이용되는 컨텍스트들을 예시하면 아래와 같다.
먼저, 컨텍스트 T1, T2, T3 및 T4의 합인 Modes_Sum(Modes_sum = T1 + T2 + T3 + T4)이 있을 수 있다. 수학식 1에서 보여지는 바와 같이, 만일 (T1, T2, T3, T4) = (0, 0, 0, 0)이라면 표 1에 따를 때 네 개의 참조 매크로블록 모두 SKIP 모드인 것으로, 그 합(Modes_sum)은 0이 된다. 그러나 만일 (T1, T2, T3, T4) = (0, 0, 0, 1)이라면 표 1에 따를 때 세 개의 참조 매크로블록은 SKIP 모드이고 다른 하나의 참조 매크로블록은 16x16 모드로서, 그 합(Modes_sum)은 1이 된다.
다음으로, 컨텍스트 내의 인트라 모드 타입들의 수(Intra_cnt)가 있을 수 있다. 만일 (T1, T2, T3, T4) = (0, 0, 0, 0)이라면 표 1에 따를 때 네 개의 참조 매크로블록 모두 인터 모드인 것으로, Intra_cnt는 0이 된다.
이하 도 3을 참조하여 모드 결정 모델이 입력된 시공간적 컨텍스트를 이용하여 CMT 타입을 결정하고, 결정된 CMT 타입에 포함되는 후보 모드 그룹들 중 어느 하나를 결정하는 방법을 설명한다.
단계 310에서, 모드 결정 모델은 컨텍스트의 합(Modes_sum)이 0인지 여부를 판단한다. 만일 컨텍스트의 합이 0이라면 CMT 타입이 CMT-1 유형인 것으로 결정한다.
단계 310에 의해 CMT 타입이 CMT-1 유형인 것으로 판단되면, 도 4a의 단계 410으로 진행한다.
수학식 3에는, 시간적 및/또는 공간적 상관관계(spatial and temporal correlation)를 가지는 4개의 매크로블록들에 대한 RD Cost(비트율-왜곡 비용, Rate-Distortion cost)들의 최대값을 산출하는 공식이 예시되어 있다.
Figure 112009072360012-PAT00019
여기서,
Figure 112009072360012-PAT00020
는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내며, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것이다.
단계 410에서, 모드 결정 모델은 부호화 모드의 결정을 위한 현재 매크로블록을 SKIP 모드로 가정하여 산출한 RD Cost가 수학식 3에 따른 RDcostMAX보다 같거나 작은지 여부를 판단한다.
만일 SKIP 모드로 가정하여 산출한 RD Cost가 수학식 3에 따른 RDcostMAX보다 같거나 작다면, 현재 매크로블록에 대한 부호화 모드 결정을 위한 후보 모드 그룹을 그룹 1(전술한 표 2 참조)로 결정한다. 이 경우, SKIP 모드 타입만이 후보 모드 그룹으로 선정되었으므로 CMT는 “100000”으로 표기될 수 있다.
그러나 만일 SKIP 모드로 가정하여 산출한 RD Cost가 수학식 3에 따른 RDcostMAX보다 크다면, 현재 매크로블록에 대한 부호화 모드 결정을 위한 후보 모드 그룹을 그룹 2(전술한 표 2 참조)로 결정한다. 이 경우, SKIP 모드 및 16x16 모드 타입만이 후보 모드 그룹으로 선정되었으므로 CMT는 “1100000”으로 표기될 수 있다.
다시 도 3을 참조하여, 단계 310의 판단에 의해 컨텍스트의 합(Modes_sum)이 0이 아닌 경우, 단계 320에서 모드 결정 모델은 컨텍스트의 합이 4 미만인지 여부를 판단한다. 만일 컨텍스트의 합이 4 미만이라면 CMT 타입이 CMT-2 유형인 것으로 결정한다.
단계 320에 의해 CMT 타입이 CMT-2 유형인 것으로 판단되면, 도 4b의 단계 420으로 진행한다.
수학식 4에는, 시간적 및/또는 공간적 상관관계(spatial and temporal correlation)를 가지는 4개의 매크로블록들에 대한 RD Cost들 중 2번째 및 3번째의 크기를 가지는 값들의 평균값을 산출하는 공식이 예시되어 있다.
Figure 112009072360012-PAT00021
단계 420에서, 모드 결정 모델은 부호화 모드의 결정을 위한 현재 매크로블록을 SKIP 모드로 가정하여 산출한 RD Cost와 16x16 모드로 가정하여 산출한 RD Cost 중 작은 값(즉, RDcostmin ( SKIP ,16×16))이 수학식 4에 따른 RDcostMED보다 같거나 작은지 여부를 판단한다.
만일 단계 420의 조건을 만족한다면, 현재 매크로블록에 대한 부호화 모드 결정을 위한 후보 모드 그룹을 그룹 2(전술한 표 2 참조)로 결정한다. 이 경우, SKIP 모드 및 16x16 타입만이 후보 모드 그룹으로 선정되었으므로 CMT는 “1100000”으로 표기될 수 있다.
그러나, 단계 420의 조건을 만족하지 못한다면, 현재 매크로블록에 대한 부 호화 모드 결정을 위한 후보 모드 그룹을 그룹 3(전술한 표 2 참조)으로 결정한다. 이 경우, SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드 타입만이 후보 모드 그룹으로 선정되었으므로 CMT는 “1111000”으로 표기될 수 있다.
다시 도 3을 참조하여, 단계 320의 판단에 의해 컨텍스트의 합이 4이상인 경우, 단계 330에서 모드 결정 모델은 인트라 모드 타입들의 수(Intra_cnt)가 0인지 여부를 판단한다. 만일 인트라 모드 타입들의 수가 0이라면 CMT 타입이 CMT-3 유형인 것으로 결정한다.
단계 330에 의해 CMT 타입이 CMT-3 유형인 것으로 판단되면, 도 4c의 단계 430으로 진행한다.
단계 430에서, 모드 결정 모델은 부호화 모드의 결정을 위한 현재 매크로블록을 16x16 모드로 가정하여 산출한 RD Cost(즉, RDCost16 ×16)가 현재 매크로블록을 P8x8의 4444 서브 모드(sub-mode)로 가정하여 산출한 RD Cost(즉, RDCost8 ×8(4444))보다 같거나 작은지 여부를 판단한다.
만일 단계 430의 조건을 만족한다면, 현재 매크로블록에 대한 부호화 모드 결정을 위한 후보 모드 그룹을 그룹 3(전술한 표 2 참조)으로 결정한다. 이 경우, SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드 타입만이 후보 모드 그룹으로 선정되었으므로 CMT는 “1111000”으로 표기될 수 있다.
그러나, 단계 430의 조건을 만족하지 못한다면, 현재 매크로블록에 대한 부호화 모드 결정을 위한 후보 모드 그룹을 그룹 4(전술한 표 2 참조)로 결정한다. 이 경우, SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드, P8x8 모드 타입만이 후보 모드 그룹으로 선정되었으므로 CMT는 “1111100”으로 표기될 수 있다.
다시 도 3을 참조하여, 단계 330의 판단에 의해 인트라 모드 타입들의 수(Intra_cnt)가 0이 아닌 경우라면 모드 결정 모델은 CMT 타입이 CMT-4 유형인 것으로 판단하여 도 4d의 단계 440으로 진행한다.
단계 440에서, 모드 결정 모델은 (T1, T2, T3, T4)에 I4MB 모드의 매크로블록이 포함되지 않았는지 여부를 판단한다.
만일, I4MB 모드의 매크로블록이 하나도 포함되지 않았다면, 현재 매크로블록에 대한 부호화 모드 결정을 위한 후보 모드 그룹을 그룹 6(전술한 표 2 참조)으로 결정한다. 이 경우, SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I16MB 모드가 후보 모드 그룹으로 선정되었으므로 CMT는 “1111101”로 표기될 수 있다.
그러나 만일 I4MB 모드의 매크로블록이 하나 이상 포함되었다면, 모드 결정 모델은 단계 450에서 (T1, T2, T3, T4)에 I16MB 모드의 매크로블록이 포함되지 않았는지 여부를 판단한다.
만일, I16MB 모드의 매크로블록이 하나도 포함되지 않았다면, 현재 매크로블록에 대한 부호화 모드 결정을 위한 후보 모드 그룹을 그룹 5(전술한 표 2 참조)로 결정한다. 이 경우, SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I4MB 모드가 후보 모드 그룹으로 선정되었으므로 CMT는 “1111110”으로 표기될 수 있다.
그러나, 만일 단계 450의 판단에 의해 I16MB 모드가 포함되어 있다면, 현재 매크로블록에 대한 부호화 모드 결정을 위한 후보 모드 그룹이 그룹 7(전술한 표 2 참조)로 결정된다. 이 경우, 모든 부호화 모드가 후보 모드 그룹으로 선정되었으므로 CMT는 “1111111”으로 표기될 수 있다.
인트라 모드에 해당되는 부호화 모드들(I4MB, I16MB)은 인터 코딩시 거의 선택되지 않는다. 따라서, 인트라 모드들은 4개의 시간적 및/또는 공간적 상관관계(spatial and temporal correlation)를 가지는 4개의 매크로블록들 중에 인트라 모드인 매크로블록이 존재하는 경우에만 고려하도록 함으로써 후보 모드 결정이 신속히 처리되도록 할 수 있다.
또한 위에서 설명한 바와 같이, CMT 타입을 결정함에 있어 인터 모드인 CMT-1부터 CMT-3을 우선 판단한다. 이는 하기 표 3에 나타나는 바와 같이 CMT 타입들의 발생 빈도가 상이하지만 인터 모드의 발생 빈도가 훨씬 높아 후보 모드 결정이 신속이 처리되도록 하기 위함이다. 표 3에서 QP는 양자화 파라미터(Quantization Parameter)를 의미한다.
표 3. CMT 타입의 발생 빈도 [단위:%]
Sequence Qp CMT -1 CMT -2 CMT -3 CMT -4
Akiyo 20 54.20 14.58 31.22 0.00
30 66.61 18.80 14.58 0.00
40 82.08 15.61 2.30 0.00
Foreman 20 0.79 6.47 92.07 0.67
30 10.29 34.80 54.46 0.45
40 35.14 43.46 20.86 0.53
Stefan 20 0.61 7.68 90.92 0.80
30 5.78 20.39 73.17 0.66
40 20.22 44.07 35.29 0.42
Average 30.64 22.87 46.10 0.39
상술한 바와 같이, 모드 결정 모델이 시공간적 컨텍스트를 이용하여 후보 모드 타입을 결정하도록 함으로써 전체 또는 다수의 모드 타입들을 평가함에 의해 야기되는 복잡도를 상당부분 감소시킬 수 있다.
부호화 모드 결정 유닛(220)은 후보 모드 결정 유닛(210)으로부터 입력되는 후보 모드 타입에 관한 정보를 이용하여 인터 예측 및/또는 인트라 예측을 순차적으로 또는 병렬적으로 수행하고, 예측 결과에 따른 모드들에 대해 비트율-왜곡 비용(Rate-Distortion cost)을 계산하여 최소 비트율-왜곡 비용을 보이는 모드 타입을 최적 모드 타입으로 선택한다. 선택된 최적 모드 타입으로 부호화가 수행될 것이다.
부호화 모드 결정 유닛(220)은 최적 모드 타입의 선택을 위해 앞서 설명한 “RDO=ON” 모드, “RDO=ON and earlySkip” 모드, “RDO=OFF” 모드, 이와 별도의 모드로서 최적 모드 타입 결정을 위한 임의의 모드들 중 하나 이상을 수행할 수 있을 것이다.
이하, 본 실시예에 따른 인코딩 처리 성능의 개선에 대해 설명한다. 성능 개선의 정도를 비교 측정하기 위해 AVC/H.264 JM 11.0 인코더에 본 실시예에 따른 후보 모드 타입 결정 방법이 적용되었다. 성능 측정은 평균 PSNR(peak signal to noise rate)(ΔPSNR), 평균 비트레이트(ΔB) 및 인코딩 시간 감소량(ΔT)에 기반하 여 수행되었다. 인코딩 시간 감소량은 하기 수학식 5에 의해 산출될 수 있다.
Figure 112009072360012-PAT00022
여기서, TREF 는 종래의 AVC/H.264 JM 인코더에 의한 전체 인코딩 시간(total encoding time)을 의미하고, TPROP는 본 실시예에 따른 후보 모드 타입 결정 방법이 적용되어 개선된 인코더에 의한 전체 인코딩 시간을 의미한다.
하기 표 4에서 보여지는 바와 같이, 개선된 인코더는 종래의 AVC/H.264 JM 인코더에 비해 평균적으로 2배의 속도로 동작(즉, ΔT가 50%)이 가능하며, QP 값이 증가할수록 더 빠른 속도로 인코딩 처리가 가능한 장점을 가진다.
표 4. 성능 비교 실험 결과표
Sequence Qp ΔB (%) ΔPSNR (dB ΔT (%)
Bus 22 -0.13 -0.10 36.94
27 -0.01 -0.17 36.73
32 -0.38 -0.25 38.16
37 -0.34 -0.32 42.60
Coastguard 22 -0.67 -0.18 36.72
27 -0.84 -0.17 36.73
32 -1.41 -0.25 38.45
37 -1.25 -0.39 46.04
Foreman 22 0.58 -0.12 35.55
27 0.98 -0.16 38.65
32 0.72 -0.29 44.53
37 0.57 -0.57 51.67
Hall 22 0.39 -0.05 35.16
27 -1.75 -0.16 48.65
32 -1.79 -0.28 68.56
37 -0.62 -0.46 74.88
Mobile 22 -0.06 -0.10 38.03
27 -0.40 -0.20 36.91
32 -1.10 -0.26 37.07
37 -0.96 -0.26 40.05
Mother &
Daughter
22 -0.39 -0.16 51.58
27 0.23 -0.18 56.23
32 -0.77 -0.28 61.66
37 -0.42 -0.36 68.37
News 22 1.47 -0.14 59.06
27 1.68 -0.23 62.15
32 1.93 -0.40 65.32
37 2.33 -0.47 68.95
Silent 22 1.57 -0.10 56.29
27 1.70 -0.14 59.09
32 2.43 -0.21 62.34
37 1.46 -0.33 67.03
Average 0.15 -0.24 50.00
상술한 후보 모드 결정 방법은 부호화기에 내장된 소프트웨어 프로그램 등에 의해 시계열적 순서에 따른 자동화된 절차로 수행될 수도 있음은 자명하다. 상기 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 상기 방법을 구현한다. 상기 정보저장매체는 자기 기록매체, 광 기록매체 및 캐리어 웨이브 매체를 포함한다.
상기에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
도 1은 종래기술에 따른 AVC/H.264 JM 11.0에서의 최적 모드 타입 선정 과정을 나타낸 도면.
도 2는 본 발명의 일 실시예에 따른 모드 선택부의 구성을 나타낸 블록 구성도.
도 3 내지 도 4d는 본 발명의 일 실시예에 따른 모드 결정 모델(MDM, mode decision model)의 후보 모드 타입 결정 과정을 나타낸 순서도.

Claims (27)

  1. 현재 매크로블록(current macroblock)의 인코딩을 위해 인코더에서 수행되는 후보 모드 타입(CMT) 결정 방법으로서,
    현재 프레임 내의 a개의 참조 매크로블록에 대한 모드 타입 및 하나 이상의 이전 프레임 내의 b개 참조 매크로블록에 대한 모드 타입의 모드 타입 인덱스(mode type index)를 포함하는 시공간적 컨텍스트(spatio-temporal context)를 입력받는 단계; 및
    상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스를 참조하여 상기 현재 매크로블록의 인코딩을 위한 후보 모드 타입을 결정하는 단계를 포함하되,
    상기 a와 b는 각각 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  2. 제1항에 있어서,
    상기 후보 모드 타입을 결정하기 위해 상기 모드 타입 인덱스의 합산 값 및 상기 인트라 모드 타입의 수 중 하나 이상이 이용되는 것을 특징으로 하는 후보 모드 타입 결정 방법.
  3. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0이고, 상기 현재 매크로블록을 SKIP 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 RDcostMAX 이하인 경우 SKIP 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 RDcostMAX을 산출하기 위한 수학식은,
    Figure 112009072360012-PAT00023
    이고,
    상기
    Figure 112009072360012-PAT00024
    는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것임을 특징으로 하는 후보 모드 타입 결정 방법.
  4. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0이고, 상 기 현재 매크로블록을 SKIP 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 RDcostMAX를 초과하는 경우 SKIP 모드 및 16x16 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 RDcostMAX을 산출하기 위한 수학식은,
    Figure 112009072360012-PAT00025
    이고,
    상기
    Figure 112009072360012-PAT00026
    는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것임을 특징으로 하는 후보 모드 타입 결정 방법.
  5. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0 초과 및 n 미만이고, 상기 현재 매크로블록을 SKIP 모드와 16x16 모드로 각각 가정하여 산출한 비트율-왜곡 비용(RD Cost)의 최소값이 RDcostMED 이하인 경우 SKIP 모드 및 16x16 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 RDcostMED를 산출하기 위한 수학식은,
    Figure 112009072360012-PAT00027
    이고,
    상기
    Figure 112009072360012-PAT00028
    는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, Median은 네 개의 RD cost들 중 두 번째 및 세 번째 크기를 가지는 값들의 평균값을 산출하기 위한 것이며, 상기 n은 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  6. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0 초과 및 n 미만이고, 상기 현재 매크로블록을 SKIP 모드와 16x16 모드로 각각 가정하여 산출한 비트율-왜곡 비용(RD Cost)의 최소값이 RDcostMED를 초과하는 경우 SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 RDcostMED를 산출하기 위한 수학식은,
    Figure 112009072360012-PAT00029
    이고,
    상기
    Figure 112009072360012-PAT00030
    는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, Median은 네 개의 RD cost들 중 두 번째 및 세 번째 크기를 가지는 값들의 평균값을 산출하기 위한 것이며, 상기 n은 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  7. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이며, 상기 현재 매크로블록을 16x16 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 상기 현재 매크로블록을 P8x8의 4444 서브 모드로 가정하여 산출한 RD Cost 이하인 경우 SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  8. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이며, 상기 현재 매크로블록을 16x16 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 상기 현재 매크로블록을 P8x8의 4444 서브 모드로 가정하여 산출한 RD Cost를 초과하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드 및 P8x8 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  9. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I4MB 모드를 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I4MB 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  10. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I16MB 모드를 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I16MB 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  11. 제2항에 있어서,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이 고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I4MB 모드와 I16MB 모드를 모두 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드, I4MB 모드 및 I16MB 모드를 포함하는 상기 후보 모드 타입이 결정되되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  12. 제5항 내지 제11항 중 어느 한 항에 있어서,
    상기 n은 4인 것을 특징으로 하는 후보 모드 타입 결정 방법.
  13. 제1항에 있어서,
    상기 현재 프레임 내의 a개의 참조 매크로블록은 상기 현재 매크로블록의 상측과 좌측에 각각 위치된 매크로블록을 포함하는 것을 특징으로 하는 후보 모드 타입 결정 방법.
  14. 제1항에 있어서,
    상기 b개의 참조 매크로블록은 현재 프레임인 t번째 프레임의 직전 프레임인 t-1번째 프레임에서의 상기 현재 매크로블록과 동일 위치인 매크로블록 및 그 이전 프레임인 t-2번째 프레임에서의 상기 현재 매크로블록과 동일 위치인 매크로블록을 포함하는 것을 특징으로 하는 후보 모드 타입 결정 방법.
  15. 부호화기에 있어서,
    현재 프레임 내의 a개의 참조 매크로블록에 대한 모드 타입 및 하나 이상의 이전 프레임 내의 b개 참조 매크로블록에 대한 모드 타입의 모드 타입 인덱스를 포함하는 시공간적 컨텍스트를 이용하여 하나 이상의 후보 모드 타입(CMT)을 결정하는 후보 모드 결정 유닛; 및
    상기 후보 모드 타입에 대해 인터 예측(inter prediction) 및 인트라 예측(intra prediction) 중 하나 이상을 수행하고, 상기 모드 예측 수행된 모드 타입에 대해 비트율 및 이미지 왜곡 중 하나 이상의 측정에 따라 최적 인코딩 모드 타입을 결정하는 부호화 모드 결정 유닛을 포함하되,
    상기 a와 b는 각각 임의의 자연수인 것을 특징으로 하는 부호화기.
  16. 제15항에 있어서,
    상기 후보 모드 타입을 결정하기 위해 상기 모드 타입 인덱스의 합산 값 및 상기 인트라 모드 타입의 수 중 하나 이상이 이용되는 것을 특징으로 하는 부호화기.
  17. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0이고, 상기 현재 매크로블록을 SKIP 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 RDcostMAX 이하인 경우 SKIP 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 RDcostMAX을 산출하기 위한 수학식은,
    Figure 112009072360012-PAT00031
    이고,
    상기
    Figure 112009072360012-PAT00032
    는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것임을 특징으로 하는 부호화기.
  18. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0이고, 상기 현재 매크로블록을 SKIP 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 RDcostMAX를 초과하는 경우 SKIP 모드 및 16x16 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 RDcostMAX을 산출하기 위한 수학식은,
    Figure 112009072360012-PAT00033
    이고,
    상기
    Figure 112009072360012-PAT00034
    는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, argmax는 네 개의 RD cost들 중 최대값을 산출하기 위한 것임을 특징으로 하는 부호화기.
  19. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0 초과 및 n 미만이고, 상기 현재 매크로블록을 SKIP 모드와 16x16 모드로 각각 가정하여 산출한 비트율-왜곡 비용(RD Cost)의 최소값이 RDcostMED 이하인 경우 SKIP 모드 및 16x16 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 RDcostMED를 산출하기 위한 수학식은,
    Figure 112009072360012-PAT00035
    이고,
    상기
    Figure 112009072360012-PAT00036
    는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, Median은 네 개의 RD cost들 중 두 번째 및 세 번째 크기를 가지는 값들의 평균값을 산출하기 위한 것이며, 상기 n은 임의의 자연수인 것을 특징으로 하는 부호화기.
  20. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 0 초과 및 n 미만이고, 상기 현재 매크로블록을 SKIP 모드와 16x16 모드로 각각 가정하여 산출한 비트율-왜곡 비용(RD Cost)의 최소값이 RDcostMED를 초과하는 경우 SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 RDcostMED를 산출하기 위한 수학식은,
    Figure 112009072360012-PAT00037
    이고,
    상기
    Figure 112009072360012-PAT00038
    는 t번째 프레임의 (i, j) 위치의 매크로블록의 RD Cost를 나타내고, Median은 네 개의 RD cost들 중 두 번째 및 세 번째 크기를 가지는 값들의 평균값을 산출하기 위한 것이며, 상기 n은 임의의 자연수인 것을 특징으로 하는 부호화기.
  21. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이며, 상기 현재 매크로블록을 16x16 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 상기 현재 매크로블록을 P8x8의 4444 서브 모드로 가정하여 산출한 RD Cost 이하인 경우 SKIP 모드, 16x16 모드, 16x8 모드 및 8x16 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 부호화기.
  22. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이며, 상기 현재 매크로블록을 16x16 모드로 가정하여 산출한 비트율-왜곡 비용(RD Cost)이 상기 현재 매크로블록을 P8x8의 4444 서브 모드로 가정하여 산출한 RD Cost를 초과하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드 및 P8x8 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 부호화기.
  23. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I4MB 모드를 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I4MB 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 부호화기.
  24. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I16MB 모드를 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드 및 I16MB 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 부호화기.
  25. 제15항에 있어서,
    상기 후보 모드 결정 유닛은,
    상기 시공간적 컨텍스트에 포함된 모드 타입 인덱스의 합산 값이 n 이상이고, 상기 인트라 모드 타입의 수가 0이 아니며, 상기 시공간적 컨텍스트에 포함된 상기 모드 타입 인덱스가 I4MB 모드와 I16MB 모드를 모두 포함하는 경우 SKIP 모드, 16x16 모드, 16x8 모드, 8x16 모드, P8x8 모드, I4MB 모드 및 I16MB 모드를 포함하는 상기 후보 모드 타입을 결정하되,
    상기 n은 임의의 자연수인 것을 특징으로 하는 부호화기
  26. 제19항 내지 제25항 중 어느 한 항에 있어서,
    상기 n은 4인 것을 특징으로 하는 부호화기.
  27. 제1항 내지 제14항 중 어느 하나에 기재된 후보 모드 타입 결정 방법을 수행하기 위하여 디지털 처리 장치에 의해 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있으며 디지털 처리 장치에 의해 판독될 수 있는 프로그램을 기록 한 기록매체.
KR1020090114349A 2009-11-25 2009-11-25 부호화기 및 부호화기의 후보 모드 결정 방법 KR101138736B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090114349A KR101138736B1 (ko) 2009-11-25 2009-11-25 부호화기 및 부호화기의 후보 모드 결정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090114349A KR101138736B1 (ko) 2009-11-25 2009-11-25 부호화기 및 부호화기의 후보 모드 결정 방법

Publications (2)

Publication Number Publication Date
KR20110057794A true KR20110057794A (ko) 2011-06-01
KR101138736B1 KR101138736B1 (ko) 2012-04-24

Family

ID=44393364

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090114349A KR101138736B1 (ko) 2009-11-25 2009-11-25 부호화기 및 부호화기의 후보 모드 결정 방법

Country Status (1)

Country Link
KR (1) KR101138736B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101221984B1 (ko) * 2011-07-05 2013-01-15 고려대학교 산학협력단 영상압축성능을 고려한 멀티코어 프로세서용 영상압축방법 및 그 기록매체
WO2013109066A1 (ko) * 2012-01-20 2013-07-25 주식회사 팬택 화면 내 예측 모드 매핑 방법 및 이러한 방법을 사용하는 장치
US9491476B2 (en) 2013-07-05 2016-11-08 Samsung Electronics Co., Ltd. Method and apparatus for deciding a video prediction mode
CN109089114A (zh) * 2018-09-28 2018-12-25 河海大学 一种复杂度自适应的虚拟现实设备的屏幕内容编码算法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100728031B1 (ko) 2006-01-23 2007-06-14 삼성전자주식회사 가변 블록 크기 움직임 예측을 위한 부호화 모드 결정 방법및 장치
KR100829169B1 (ko) * 2006-07-07 2008-05-13 주식회사 리버트론 H.264 코딩의 압축모드 예측 장치 및 방법
KR100842558B1 (ko) 2007-01-26 2008-07-01 삼성전자주식회사 동영상 부호화를 위한 블록 모드 결정 방법 및 그 장치
KR20090041944A (ko) * 2007-10-25 2009-04-29 (주)씨앤에스 테크놀로지 인근 블록의 모드정보를 이용한 움직임 추정 방법 및 장치

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101221984B1 (ko) * 2011-07-05 2013-01-15 고려대학교 산학협력단 영상압축성능을 고려한 멀티코어 프로세서용 영상압축방법 및 그 기록매체
CN109194961A (zh) * 2012-01-20 2019-01-11 英迪股份有限公司 解码方法、视频解码设备及编码方法
US9554130B2 (en) 2012-01-20 2017-01-24 Pantech Inc. Intra prediction mode mapping method and device using the method
CN109413428A (zh) * 2012-01-20 2019-03-01 英迪股份有限公司 编码方法
US10616575B2 (en) 2012-01-20 2020-04-07 Intellectual Discovery Co., Ltd. Intra prediction mode mapping method and device using the method
US9986238B2 (en) 2012-01-20 2018-05-29 Intellectual Discovery Co., Ltd. Intra prediction mode mapping method and device using the method
US10158852B2 (en) 2012-01-20 2018-12-18 Intellectual Discovery Co., Ltd. Intra prediction mode mapping method and device using the method
CN109413429A (zh) * 2012-01-20 2019-03-01 英迪股份有限公司 解码方法、视频解码设备及编码方法
WO2013109066A1 (ko) * 2012-01-20 2013-07-25 주식회사 팬택 화면 내 예측 모드 매핑 방법 및 이러한 방법을 사용하는 장치
US11750803B2 (en) 2012-01-20 2023-09-05 Dolby Laboratories Licensing Corporation Intra prediction mode mapping method and device using the method
US11412216B2 (en) 2012-01-20 2022-08-09 Dolby Laboratories Licensing Corporation Intra prediction mode mapping method and device using the method
US9854239B2 (en) 2012-01-20 2017-12-26 Intellectual Discovery Co., Ltd. Intra prediction mode mapping method and device using the method
US10863173B2 (en) 2012-01-20 2020-12-08 Dolby Laboratories Licensing Corporation Intra prediction mode mapping method and device using the method
CN109413429B (zh) * 2012-01-20 2022-05-17 杜比实验室特许公司 解码方法、视频解码设备及编码方法
CN109194961B (zh) * 2012-01-20 2022-05-17 杜比实验室特许公司 解码方法、视频解码设备及编码方法
CN109413428B (zh) * 2012-01-20 2022-05-17 杜比实验室特许公司 编码方法
US9491476B2 (en) 2013-07-05 2016-11-08 Samsung Electronics Co., Ltd. Method and apparatus for deciding a video prediction mode
CN109089114B (zh) * 2018-09-28 2022-01-28 河海大学 一种复杂度自适应的虚拟现实设备的屏幕内容编码方法
CN109089114A (zh) * 2018-09-28 2018-12-25 河海大学 一种复杂度自适应的虚拟现实设备的屏幕内容编码算法

Also Published As

Publication number Publication date
KR101138736B1 (ko) 2012-04-24

Similar Documents

Publication Publication Date Title
US9838718B2 (en) Secondary boundary filtering for video coding
CA2812307C (en) Intra smoothing filter for video coding
CN107197256B (zh) 用于对图像的序列进行编码和解码的方法和装置
KR101037816B1 (ko) 인터레이스된 비디오의 코딩 및 디코딩을 위한 방법 및장치
KR102323427B1 (ko) 영상 부호화 방법 및 장치
US8213505B2 (en) Encoding apparatus, encoding method, program for encoding method, and recording medium having program for encoding method recorded thereon
US20120287994A1 (en) Filtering blockiness artifacts for video coding
US20050201633A1 (en) Method, medium, and filter removing a blocking effect
KR100727990B1 (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
US8780994B2 (en) Apparatus, method, and computer program for image encoding with intra-mode prediction
KR20130063028A (ko) 인트라-예측을 이용한 비디오 코딩
KR20070001621A (ko) 인트라 부호화 장치 및 방법
KR101138736B1 (ko) 부호화기 및 부호화기의 후보 모드 결정 방법
JP2014075652A (ja) 画像符号化装置及び方法
KR100727991B1 (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
KR101037834B1 (ko) 인터레이스형 비디오의 코딩 및 디코딩
KR20170077621A (ko) 영상 압축에서의 플리커링 현상 제거 방법 및 그 장치
KR100991138B1 (ko) 부호화기 및 부호화기의 후보 모드 결정 방법
KR20040093253A (ko) 16×16 인트라 휘도 예측 모드 결정방법 및 장치
JP5488168B2 (ja) 画像符号化装置
Kesireddy A new adaptive trilateral filter for in-loop filtering
An et al. High Speed and Low-Complexity Mode Decision for Advanced Video Coding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160418

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170403

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190415

Year of fee payment: 8