KR20110103276A - H.264/avc에서 매크로 블록의 부호화 모드 고속 결정방법 - Google Patents

H.264/avc에서 매크로 블록의 부호화 모드 고속 결정방법 Download PDF

Info

Publication number
KR20110103276A
KR20110103276A KR1020100022528A KR20100022528A KR20110103276A KR 20110103276 A KR20110103276 A KR 20110103276A KR 1020100022528 A KR1020100022528 A KR 1020100022528A KR 20100022528 A KR20100022528 A KR 20100022528A KR 20110103276 A KR20110103276 A KR 20110103276A
Authority
KR
South Korea
Prior art keywords
mode
rate
inter
distortion cost
sub
Prior art date
Application number
KR1020100022528A
Other languages
English (en)
Other versions
KR101099257B1 (ko
Inventor
김용관
박성빈
Original Assignee
호서대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 호서대학교 산학협력단 filed Critical 호서대학교 산학협력단
Priority to KR1020100022528A priority Critical patent/KR101099257B1/ko
Publication of KR20110103276A publication Critical patent/KR20110103276A/ko
Application granted granted Critical
Publication of KR101099257B1 publication Critical patent/KR101099257B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 H.264/AVC에서 매크로 블록의 부호화 모드를 고속으로 결정하는 매크로 블록의 부호화 모드 고속 결정방법에 관한 것으로서 스킵 모드의 율-왜곡 비용이 인터 16×16 모드의 율-왜곡 비용보다 작을 경우에 조기 스킵모드를 결정하고, 스킵 모드의 율-왜곡 비용이 인터 16×16 모드의 율-왜곡 비용보다 클 경우에 인터 16×16 모드의 율-왜곡 비용이 최소 값인지의 여부를 판단하고, 인터 16×16 모드의 율-왜곡 비용이 최소 값일 경우에 모든 인터 모드의 결정과정을 생략하며, 인터 16×16 모드의 율-왜곡 비용이 최소 값이 아닐 경우에 인터 16×8 또는 인터 8×16들이 최소 값인지의 여부에 따라 8×8 모드 내 서브 매크로블록의 최적모드를 설정하며, 최적모드를 설정한 서브 매크로블록 8×8이 2개이고, 또한 최적모드를 설정한 서브 매크로블록 4×4가 2개인지의 여부를 판단하여, 8×8이 2개이고, 4×4가 2개일 경우에 4×4 정방 마스크 및 블록간 상관도를 이용하여 인트라 4×4 모드 결정 알고리즘을 수행하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산한 후 최적 모드를 결정하며, 8×8이 2개가 아니거나 4×4가 2개가 아닐 경우에 서브 매크로블록 8×8이 2개 이상 또는 서브 매크로블록 4×4가 2개 이상인지의 여부에 따라 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정한다.

Description

H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법{Method for fast determining encoding mode of macro block in H.264/AVC}
본 발명은 H.264/AVC에서 매크로 블록의 부호화 모드를 고속으로 결정하는 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법에 관한 것이다. 보다 상세하게는 매크로 블록의 부호화 모드를 인터 모드 또는 인트라 모드로 고속으로 결정하도록 함으로써 부호화기 및 복호화기의 복잡도를 줄일 수 있는 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법에 관한 것이다.
H.264/AVC는 매우 높은 데이터 압축률을 가지는 디지털 비디오 코덱 표준으로서 ITU-T(International Telecommunications Union - Telecommunication Standardization Sector)의 비디오 코딩 전문가그룹(Video Coding Experts Group ; VCEG)과 ISO/IEC(International Standardization Organization / International Electro-technical Commission)의 동화상 전문가그룹(Moving Picture Experts Group ; MPEG)이 공동으로 조인트 비디오 팀(Joint Video Team ; JVT)을 구성하여 표준화를 진행한 것이다.
상기 H.264/AVC 비디오 부호화 표준방식에는 이전의 비디오 부호화 표준들(MPEG2, MPEG4 Part 2, H.263)에 없던 새로운 부호화 도구들이 추가되었으며, 이러한 도구들로 인하여 H.264/AVC 비디오 부호화 표준은 MPEG2에 비해 약 40∼50% 정도 성능이 향상되었고, MPEG4에 비해서는 약 30∼40% 정도 성능이 향상되었다.
특히, 최근에 제안된 율-왜곡 최적화(RDO : Rate Distortion Optimization) 방식은 H.264/AVC의 압축 효율을 크게 향상시켰다.
반면에 H.264/AVC에서는 복잡도의 증가를 고려하지 않고 압축 효율의 향상만을 최우선 목표로 삼았기 때문에 부호화기 및 복호화기의 계산량은 극단적으로 증가하여 매우 높은 복잡도를 지니게 되었다.
새로 추가된 부호화 기법들 중에서 다중 참조 프레임의 사용 및 1/4 화소 단위의 움직임 추정과 가변 블록 크기의 다중 예측 모드에 대한 반복적인 율-왜곡 비용(RDO_cost)의 함수 계산은 부호화기 및 복호화기의 복잡도를 증가시키는 주된 요인이 된다.
H.264/AVC 부호화기에서는 최적의 인터/인트라 예측 모드를 선택하기 위하여 다양한 인터 모드 및 인트라 모드의 조합에 대해 율-왜곡 비용을 계산해야 한다.
율-왜곡 비용 함수에 사용되는 발생 비트량을 계산하기 위해서는 각 모드에 대한 DCT/Hadamard 변환 및 양자화/역양자화, 역 DCT/Hadamard 변환 및 엔트로피 부호화 과정을 수행해야 되므로 부호화기의 복잡도를 크게 증가시키게 된다.
이에 따라 최근에는 인트라 모드의 결정을 고속화하기 위하여, 소벨 마스크(Soble mask)와 에지 히스토그램(edge histogram)을 이용하여 율-왜곡 계산을 필요로 하는 후보 모드의 수를 줄이는 방법이 제안되었다.
상기한 방법에서는 특정 임계값을 이용하여 인트라 모드 결정 과정을 생략함으로써 인트라 모드의 결정를 고속화하거나 또는 다중 참조 프레임의 특성을 이용하여 참조 프레임의 결정을 고속화시키고, 선택적 인트라 모드 결정법으로 전체 부호화기의 계산량을 줄이고 있다.
그러나 상기 특정 임계값을 이용할 경우에 부호화의 성능을 유지하면서 계산량을 충분히 감소시키지는 못하는 단점이 있다.
그러므로 본 발명이 해결하려는 과제는 매크로 블록들의 인터 모드 및 인트라 모드를 효율적으로 고속 결정하여 부호화기 및 복호화기의 복잡도를 줄일 수 있는 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법을 제공한다.
본 발명이 해결하려는 과제들은 상기에서 언급한 기술적 과제들로 제한되지 않고, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 명확하게 이해될 수 있을 것이다.
본 발명의 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법은 스킵 모드의 율-왜곡 비용이 인터 16×16 모드의 율-왜곡 비용보다 작을 경우에 조기 스킵모드를 결정하는 단계와, 상기 스킵 모드의 율-왜곡 비용이 상기 인터 16×16 모드의 율-왜곡 비용보다 클 경우에 인터 16×16 모드의 율-왜곡 비용이 최소 값인지의 여부를 판단하고, 상기 인터 16×16 모드의 율-왜곡 비용이 최소 값일 경우에 모든 인터 모드의 결정과정을 생략하는 단계와, 상기 인터 16×16 모드의 율-왜곡 비용이 최소 값이 아닐 경우에 인터 16×8 또는 인터 8×16들이 최소 값인지의 여부에 따라 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계와, 상기 최적모드를 설정한 서브 매크로블록 8×8이 2개이고, 또한 상기 최적모드를 설정한 서브 매크로블록 4×4가 2개인지의 여부를 판단하는 단계와, 상기 판단 결과 최적모드를 설정한 서브 매크로블록 8×8이 2개이고, 또한 최적모드를 설정한 서브 매크로블록 4×4가 2개일 경우에 4×4 정방 마스크 및 블록간 상관도를 이용하여 인트라 4×4 모드 결정 알고리즘을 수행하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산한 후 최적 모드를 결정하는 단계와, 상기 판단 결과 최적모드를 설정한 서브 매크로블록 8×8이 2개가 아니거나 또는 최적모드를 설정한 서브 매크로블록 4×4가 2개가 아닐 경우에 서브 매크로블록 8×8이 2개 이상 또는 서브 매크로블록 4×4가 2개 이상인지의 여부에 따라 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계를 포함하여 구성됨을 특징으로 한다.
상기 조기 스킵모드를 결정하는 단계는 스킵 모드의 율-왜곡 비용과 인터 16×16 모드의 율-왜곡 비용을 각기 계산하는 단계와, 상기 계산한 스킵 모드의 율-왜곡 비용과 인터 16×16 모드의 율-왜곡 비용을 비교하는 단계와, 상기 비교 결과 스킵 모드의 율-왜곡 비용이 상기 인터 16×16 모드의 율-왜곡 비용보다 작을 경우에 조기 스킵모드를 결정하는 단계를 포함하여 구성됨을 특징으로 한다.
상기 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계는 상기 인터 16×16 모드의 율-왜곡 비용이 최소 값인지의 여부를 판단하는 단계와, 상기 인터 16×16 모드의 율-왜곡 비용이 최소 값일 경우에 모든 인터모드 결정과정을 생략하는 단계와, 상기 인터 16×16 모드의 율-왜곡 비용이 최소 값이 아닐 경우에 인터 16×8 모드에 대한 율-왜곡 비용이 최소 값인지 또는 인터 8×16 모드에 대한 율-왜곡 비용이 최소 값인지의 여부를 판단하는 단계와, 상기 인터 16×8 모드에 대한 율-왜곡 비용이 최소 값일 경우에 인터 16×16 모드, 인터 8×16 모드 및 서브 매크로블록 4×8 모드에 대한 모드 결정과정을 생략하고 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계와, 상기 인터 8×16 모드에 대한 율-왜곡 비용이 최소 값일 경우에 인터 16×16 모드, 인터 16×8 모드 및 서브 매크로블록 8×4 모드에 대한 모드 결정과정을 생략하고 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계와, 상기 인터 16×8 모드에 대한 율-왜곡 비용 및 상기 인터 8×16 모드에 대한 율-왜곡 비용이 모두 최소 값이 아닐 경우에 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계를 포함하여 구성됨을 특징으로 한다.
상기 서브 매크로블록 8×8이 2개 이상 또는 상기 서브 매크로블록 4×4가 2개 이상인지의 여부에 따라 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계는 상기 서브 매크로블록 8×8이 2개 이상일 경우에 인트라 4×4 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계와, 상기 서브 매크로블록 4×4가 2개 이상일 경우에 인트라 16×16 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계와, 상기 서브 매크로블록 8×8이 2개 이상이 아니고, 또한 상기 서브 매크로블록 4×4가 2개 이상이 아닐 경우에 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계를 포함하여 구성됨을 특징으로 한다.
본 발명의 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법은 발생 비트율이 크게 감소하고, 결과적으로 전체 부호화의 효율이 향상되고, 부호화 시간이 크게 감소되는 효과가 있다.
이하에서는 첨부된 도면들을 참조하여 본 발명을 한정하지 않는 실시 예를 통해 본 발명을 보다 상세히 설명하며, 일부 도면에서 동일한 요소에 대해서는 동일한 부호를 부여한다.
도 1a는 H.264/AVC에서 시방향 예측을 위한 인터모드를 보여주는 도면,
도 1b는 H.264/AVC에서 공간영역에서의 예측을 위한 인트라모드를 보여주는 도면,
도 2a는 도 1b의 인트라 16×16 모드의 각 예측모드를 보다 상세하게 설명하기 위한 도면,
도 2b는 인트라 4×4 모드의 예측모드를 보다 상세하게 설명하기 위한 도면,
도 3은 인트라 4×4 모드에서 블록 간 유사성과 각 블록의 화소 정보에 따른 예측방향을 일 예로 보여주는 도면,
도 4 및 도 5는 본 발명에 따라 인트라 4×4 모드에서 최적모드를 결정하기 위한 계산과정을 줄이는 방법을 설명하기 위한 도면,
도 6은 서브매크로블록의 최적 모드 분포를 보여주는 도면, 및
도 7a 및 도 7b는 본 발명에 따른 매크로블록의 부호화 모드 고속 결정방법의 바람직한 실시 예의 동작을 보인 신호흐름도이다.
이하의 상세한 설명은 예시에 지나지 않으며, 본 발명의 실시 예를 도시한 것에 불과하다. 또한 본 발명의 원리와 개념은 가장 유용하고, 쉽게 설명할 목적으로 제공된다.
따라서, 본 발명의 기본 이해를 위한 필요 이상의 자세한 구조를 제공하고자 하지 않았음은 물론 통상의 지식을 가진 자가 본 발명의 실체에서 실시될 수 있는 여러 가지의 형태들을 도면을 통해 예시한다.
도 1a는 H.264/AVC에서 시방향 예측을 위한 인터모드를 보여주는 도면이고, 도 1b는 H.264/AVC에서 공간영역에서의 예측을 위한 인트라모드를 보여주는 도면이다.
H.264/AVC 국제 비디오 표준에서는 움직임 예측 및 모드 결정방법을 사용하며, 상기 움직임 예측 및 모드 결정방법은 가변블록을 이용한 움직임 보상 기술을 적용한 것으로서 매크로블록의 크기를 16×16에서 4×4까지 나눈 후 율-왜곡 최적화 기법을 사용하는데, 비디오 처리를 위하여 인터모드와 인트라모드를 구별하여 설정한다.
도 1a를 참조하면, 시(時)방향 예측을 위한 모드로 매크로블록(macroblock)의 단위크기에 따라 5개의 인터모드를 지원한다. 즉, 스킵(skip) 모드, 인터 16×16 모드, 인터 8×16 모드, 인터 16×8 모드, 인터 8×8 모드가 있다.
상기 인터 8×8 모드에 포함된 8×8 크기의 매크로블록들은 8×8, 8×4, 4×8, 4×4의 크기로 갖는 서브 매크로블록(sub-macroblock)으로 구분할 수 있다.
도 1b를 참조하면, 공간영역에서의 예측을 위한 모드로 매크로블록의 단위크기에 따라 3개의 인트라모드를 지원한다. 즉, 인트라 16×16 모드(휘도), 인트라 8×8 모드(색채) 및 인트라 4×4 모드(휘도)가 있다. 상기 인트라 8×8 모드는 FRExt 프로파일에서만 제공되므로 본 발명에서는 인트라 8×8 모드는 제외하고 설명하기로 하겠다.
인트라 16×16 모드에서는 4가지의 예측 모드 및 방향을 지원하고, 인트라 8×8 모드에서는 8가지의 방향성 모드와 방향성을 가지지 않는 평균치 예측 모드인 DC모드를 지원한다. 인트라 모드는 이전에 부호화된 유효한 이웃 매크로블록의 경계 화소(좌측, 상단, 우측 상단 또는 좌측 상단의 화소)를 이용해 현재 매크로블록을 예측한다.
도 2a는 도 1b의 인트라 16×16 모드에서 각각의 예측모드를 보다 상세히 설명하기 위한 도면이고, 도 2b는 인트라 4×4 모드의 예측모드를 보다 상세하게 설명하기 위한 도면이다.
도 2a 및 도2b를 참조하면, 기 부호화된 상단, 좌측, 우측 상단 또는 좌측 상단의 화소들을 이용하여 현재 부호화할 블록의 화소를 예측하는데, 인트라 16×16 모드는 상단 화소들을 이용하여 예측하는 예측모드 0(수직예측), 좌측의 화소를 이용하여 예측하는 예측모드 1(수평예측), 좌측과 상단의 화소를 이용하여 평균값으로 예측하는 예측모드 2(평균값예측), 좌측 및 상단 화소를 이용하여 예측하는 예측모드 3(평균예측)을 가지며, 인트라 4×4 모드는 예측모드 0부터 예측모드 8까지 총 9가지의 예측모드를 가진다.
H.264/AVC에서는 상기와 같이 다양한 모드들 각각의 율-왜곡 비용을 계산하여 최소 값을 가지는 모드를 부호화할 최적 모드로 결정하는데, 인트라 4×4 모드의 경우에 총 9개의 예측 방향에 따라 최적 모드를 결정하고, 세분화된 블록에 대한 예측 부호화를 수행해야하기 때문에 인트라 16×16에 비해 상대적으로 높은 복잡도를 가진다.
만약, 예를 들어 도 3에 도시된 바와 같이, 주변 배경과 같은 일반적인 영상에서 영상 신호의 변화가 작은 영역에서는 현재 블록(현재 부호화할 블록)과 주변 블록의 화소 정보가 유사하다. 또한, 인트라 4×4 모드에서 현재 블록의 최적 예측 방향이 주변 블록의 예측 방향과 같다면 현재 블록과 주변 블록의 화소 정보 또한 비슷할 확률이 높다.
그렇기 때문에 블록간 유사성이 높을 경우, 인트라 4×4 모드의 현재 블록의 최적 모드를 결정하기 위하여 9가지 후보모드들 각각에 대한 율-왜곡 비용을 계산하는 것보다는 이미 결정된 주변 모드 정보를 이용하여 현재 블럭의 최적 모드를 결정하는 것이 복잡도를 낮추어 준다.
즉, 본 발명에서는 매크로블록에 대한 부호화를 위해 계산과정을 줄여 복잡도를 낮추고자, 인트라 4×4 모드에서 9가지 후보모드 각각에 대한 율-왜곡 비용을 계산하는 것이 아니라, 기 결정된 주변블록의 모드 정보를 이용하여 최적 모드를 결정하는데, 우선 현재 블록의 화소 분포와 주변 블록의 화소 분포의 차이에 따른 블록 간 유사성을 판별하여 후보모드의 수를 줄인다.
이에 대해 수학식을 통해 좀 더 상세히 살펴보면, 현재 블록 내 화소 분포도(Cdis), 현재 블록과 좌측 블럭과의 화소 분포 차이(Lcor) 및 현재 블록과 상측 블록과의 화소 분포 차이(Ucor)는 하기의 수학식 1을 통해 구해진다.
Figure pat00001
여기서, Cavr은 현재 블록 내 화소들의 평균값이고, CPx, LPx 및 UPx들 각각은 현재, 좌측 및 상측 블록의 x인덱스에 해당하는 화소 값이다.
그리고 현재 블록과 좌측 블록과의 화소값 분포에 따른 블록간 차이(Ldif) 및 현재 블록과 상측 블록과의 화소 분포 차이(Udif)는 하기의 수학식 2를 통해 구해진다.
Figure pat00002
여기서, Cdis는 현재 블록 내 화소 분포도이고, Lcor은 현재 블록과 좌측 블록과의 화소 분포 차이이며, Ucor은 현재 블록과 상측 블록과의 화소 분포 차이이다.
상기 계산한 Ldif와 Udif를 미리 설정된 임계값 T와 비교하고, 비교 결과 Ldif 및 Udif가 임계값 T보다 작으면, 현재 블록의 화소 분포와 주변 블록과의 화소 분포가 상관도가 높은 것이므로 현재 블록의 최적 모드를 이미 결정된(부호화된) 주변 블록의 모드로부터 예측한다.
이에 따라, 인트라 4×4 모드에서 현재 블록의 최적 모드가 될 후보모드는, 도 4에 도시된 바와 같이 L 모드(LMODE) 와 U 모드(UMODE)로 압축된다. 또한, L 모드와 U 모드가 동일할 경우에는 선택 가능한 후보모드가 하나가 된다. 즉, 블록 간 화소 분포의 유사성을 판단하여 인트라 4×4 모드의 예측모드들 중에서 소수의 후보모드를 결정하는 것이다.
한편, 상기 계산한 Ldif 또는 Udif가 임계값 T보다 크면, 블록 내 화소 값들의 방향성과 상관도가 높은 것이므로 도 5에 도시된 바와 같이, (a)의 정방형 4×4 마스크를 이용하여 인트라 4×4 모드의 8가지 예측 방향(평균값 예측모드 제외) 중 4가지 방향 정보를 하기의 수학식 3을 이용하여 획득한다.
Figure pat00003
여기서, a부터 p는 정방형 4×4 마스크의 해당 위치에서의 화소값이다.
이를 통해, 인트라 4×4 모드의 예측모드들 중에서 최종적으로 결정되는 후보모드는 상기 수학식 3의 연산 값이 최소가 되는 하나의 후보모드이거나, 또는 최대 4개의 후보모드로 결정된다.
따라서, 본 발명은 상기와 같이 인트라 4×4 모드에서 소수의 후보모드를 결정하여 그 결정된 후보모드 각각에 대해서만 율-왜곡 비용을 계산함으로써 계산과정을 줄일 수 있게 된다.
도 7a 및 도 7b는 본 발명에 따른 매크로블록의 부호화 모드 고속 결정방법의 바람직한 실시 예의 동작을 보인 신호흐름도이다. 먼저 도 7a을 참조하면, 먼저 스킵(Skip) 모드에 대한 율-왜곡 비용(RDCost_Skip)을 계산하고(S702), 인터 16x16 모드의 율-왜곡 비용(RDCost_인터 16×16)을 계산하며(S704), 계산한 스킵(Skip) 모드에 대한 율-왜곡 비용(RDCost_Skip)과 인터 16x16 모드의 율-왜곡 비용(RDCost_Inter16×16)을 비교한다(S706).
상기 비교 결과 스킵(Skip) 모드에 대한 율-왜곡 비용(RDCost_Skip)이 인터 16x16 모드의 율-왜곡 비용(RDCost_Inter16×16)보다 작을 경우에 모든 모드의 결정과정을 생략하고, 최적의 모드는 스킵 모드로 설정하고(S708), 최적 모드를 스킵 모드로 결정한다(S710).
상기 단계(S706)의 비교 결과 스킵(Skip) 모드에 대한 율-왜곡 비용(RDCost_Skip)이 인터 16x16 모드의 율-왜곡 비용(RDCost_Inter16×16)를 초과할 경우에 인터 16×8에 대한 율-왜곡 비용(RDCost_Inter16×8)과 인터 8×16 모드에 대한 율-왜곡 비용(RDCost_Inter8×16)을 계산한다(S712).
그리고 상기 인터 16x16 모드의 율-왜곡 비용(RDCost_Inter16×16)이 최소 값(MIN_RDCost)인지의 여부를 판단하고(S714), 인터 16x16 모드의 율-왜곡 비용(RDCost_Inter16×16)이 최소 값(MIN_RDCost)일 경우에 이하의 모든 인터 모드의 결정과정을 생략한다(S716).
상기 단계(S714)에서의 판단 결과 상기 인터 16x16 모드의 율-왜곡 비용(RDCost_Inter16×16)이 최소 값(MIN_RDCost)이 아닐 경우에 도 7b에 도시된 바와 같이 상기 계산한 인터 16×8에 대한 율-왜곡 비용(RDCost_Inter16×8)과 인터 8×16 모드에 대한 율-왜곡 비용(RDCost_Inter8×16)이 최소 값(MIN_RDCost)인지의 여부를 판단한다(S718, S720).
상기 단계(S718)의 판단 결과 상기 인터 16×8에 대한 율-왜곡 비용(RDCost_Inter16×8)이 최소 값(MIN_RDCost)일 경우에 인터 16×16 모드, 인터 8×16 모드 및 서브 매크로블록 4×8 모드에 대한 모드 결정과정을 생략하고(S722), 8×8 모드 내 서브 매크로블록의 최적모드를 설정한다(S726).
상기 단계(S720)의 판단 결과 상기 인터 8×16 모드에 대한 율-왜곡 비용(RDCost_Inter8×16)이 최소 값(MIN_RDCost)일 경우에 인터 16×16 모드, 인터 16×8 모드 및 서브 매크로블록 8×4 모드에 대한 모드 결정과정을 생략하고(S724), 8×8 모드 내 서브 매크로블록의 최적모드를 설정한다(S726).
또한 상기 단계(S718, S720)의 판단 결과 인터 16×8에 대한 율-왜곡 비용(RDCost_Inter16×8) 및 인터 8×16 모드에 대한 율-왜곡 비용(RDCost_Inter8×16)이 모두 최소 값(MIN_RDCost)이 아닐 경우에 8×8 모드 내 서브 매크로블록의 최적모드를 설정한다(S726).
그리고 서브 매크로블록들 중에서 최적 모드로 설정된 서브 매크로블록 8×8이 2개이고, 또한 서브 매크로블록 4×4가 2개인지의 여부를 판단한다(S728).
상기 판단 결과 서브 매크로블록 8×8이 2개가 아니거나 또는 서브 매크로블록 4×4가 2개가 아닐 경우에 최적 모드로 설정된 서브매크로블록 8×8이 2개를 이상인지의 여부를 판단한다(S730).
상기 단계(S730)에서 최적 모드로 설정된 서브매크로블록 8×8이 2개를 이상일 경우에 인트라 4×4 예측모드 결정과정을 생략한다(S732). 그리고 상기 단계(S730)에서 최적 모드로 설정된 서브매크로블록 8×8이 2개를 이상이 아닐 경우에 최적 모드로 설정된 서브매크로블록 4×4가 2개 이상인지의 여부를 판단하고(S734), 최적 모드로 설정된 서브매크로블록 4×4가 2개 이상일 경우에 인트라 16×16 예측모드 결정과정을 생략한다(S736).
또한 상기 단계(S728)에서 최적 모드로 설정된 서브 매크로블록 8×8이 2개이고, 또한 최적 모드로 설정된 서브 매크로블록 4×4가 2개일 경우에 4×4 정방 마스크 및 블록간 상관도를 이용하여 인트라 4×4 모드 결정 알고리즘을 수행한다(S738).
그리고 활성화된 모드들에 대한 율-왜곡 비용을 계산하고(S740), 최적 모드를 결정한다(S742).
이상에서는 대표적인 실시 예를 통하여 본 발명에 대하여 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 상술한 실시 예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다.
그러므로 본 발명의 권리범위는 설명된 실시 예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims (4)

  1. 스킵 모드의 율-왜곡 비용이 인터 16×16 모드의 율-왜곡 비용보다 작을 경우에 조기 스킵모드를 결정하는 단계;
    상기 스킵 모드의 율-왜곡 비용이 상기 인터 16×16 모드의 율-왜곡 비용보다 클 경우에 인터 16×16 모드의 율-왜곡 비용이 최소 값인지의 여부를 판단하고, 상기 인터 16×16 모드의 율-왜곡 비용이 최소 값일 경우에 모든 인터 모드의 결정과정을 생략하는 단계;
    상기 인터 16×16 모드의 율-왜곡 비용이 최소 값이 아닐 경우에 인터 16×8 또는 인터 8×16들이 최소 값인지의 여부에 따라 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계;
    상기 최적모드를 설정한 서브 매크로블록 8×8이 2개이고, 또한 상기 최적모드를 설정한 서브 매크로블록 4×4가 2개인지의 여부를 판단하는 단계;
    상기 판단 결과 최적모드를 설정한 서브 매크로블록 8×8이 2개이고, 또한 최적모드를 설정한 서브 매크로블록 4×4가 2개일 경우에 4×4 정방 마스크 및 블록간 상관도를 이용하여 인트라 4×4 모드 결정 알고리즘을 수행하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산한 후 최적 모드를 결정하는 단계; 및
    상기 판단 결과 최적모드를 설정한 서브 매크로블록 8×8이 2개가 아니거나 또는 최적모드를 설정한 서브 매크로블록 4×4가 2개가 아닐 경우에 서브 매크로블록 8×8이 2개 이상 또는 서브 매크로블록 4×4가 2개 이상인지의 여부에 따라 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계;를 포함하여 구성된 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법.
  2. 제 1 항에 있어서, 상기 조기 스킵모드를 결정하는 단계는;
    스킵 모드의 율-왜곡 비용과 인터 16×16 모드의 율-왜곡 비용을 각기 계산하는 단계;
    상기 계산한 스킵 모드의 율-왜곡 비용과 인터 16×16 모드의 율-왜곡 비용을 비교하는 단계; 및
    상기 비교 결과 스킵 모드의 율-왜곡 비용이 상기 인터 16×16 모드의 율-왜곡 비용보다 작을 경우에 조기 스킵모드를 결정하는 단계;를 포함하여 구성됨을 특징으로 하는 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법.
  3. 제 1 항에 있어서, 상기 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계는;
    상기 인터 16×16 모드의 율-왜곡 비용이 최소 값인지의 여부를 판단하는 단계;
    상기 인터 16×16 모드의 율-왜곡 비용이 최소 값일 경우에 모든 인터모드 결정과정을 생략하는 단계;
    상기 인터 16×16 모드의 율-왜곡 비용이 최소 값이 아닐 경우에 인터 16×8 모드에 대한 율-왜곡 비용이 최소 값인지 또는 인터 8×16 모드에 대한 율-왜곡 비용이 최소 값인지의 여부를 판단하는 단계;
    상기 인터 16×8 모드에 대한 율-왜곡 비용이 최소 값일 경우에 인터 16×16 모드, 인터 8×16 모드 및 서브 매크로블록 4×8 모드에 대한 모드 결정과정을 생략하고 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계;
    상기 인터 8×16 모드에 대한 율-왜곡 비용이 최소 값일 경우에 인터 16×16 모드, 인터 16×8 모드 및 서브 매크로블록 8×4 모드에 대한 모드 결정과정을 생략하고 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계; 및
    상기 인터 16×8 모드에 대한 율-왜곡 비용 및 상기 인터 8×16 모드에 대한 율-왜곡 비용이 모두 최소 값이 아닐 경우에 8×8 모드 내 서브 매크로블록의 최적모드를 설정하는 단계;를 포함하여 구성됨을 특징으로 하는 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법.
  4. 제 1 항에 있어서, 상기 서브 매크로블록 8×8이 2개 이상 또는 상기 서브 매크로블록 4×4가 2개 이상인지의 여부에 따라 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계는;
    상기 서브 매크로블록 8×8이 2개 이상일 경우에 인트라 4×4 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계;
    상기 서브 매크로블록 4×4가 2개 이상일 경우에 인트라 16×16 예측모드 결정과정을 생략하고, 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계; 및
    상기 서브 매크로블록 8×8이 2개 이상이 아니고, 또한 상기 서브 매크로블록 4×4가 2개 이상이 아닐 경우에 활성화된 모드들에 대한 율-왜곡 비용을 계산하여 최적 모드를 결정하는 단계;를 포함하여 구성됨을 특징으로 하는 H.264/AVC에서 매크로 블록의 부호화 모드 고속 결정방법.
KR1020100022528A 2010-03-12 2010-03-12 H.264/avc에서 매크로 블록의 부호화 모드 고속 결정방법 KR101099257B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100022528A KR101099257B1 (ko) 2010-03-12 2010-03-12 H.264/avc에서 매크로 블록의 부호화 모드 고속 결정방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100022528A KR101099257B1 (ko) 2010-03-12 2010-03-12 H.264/avc에서 매크로 블록의 부호화 모드 고속 결정방법

Publications (2)

Publication Number Publication Date
KR20110103276A true KR20110103276A (ko) 2011-09-20
KR101099257B1 KR101099257B1 (ko) 2011-12-27

Family

ID=44954578

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100022528A KR101099257B1 (ko) 2010-03-12 2010-03-12 H.264/avc에서 매크로 블록의 부호화 모드 고속 결정방법

Country Status (1)

Country Link
KR (1) KR101099257B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101427516B1 (ko) * 2013-01-31 2014-08-13 세종대학교산학협력단 변환 계수의 분포에 기반한 예측 방법 및 장치
KR20170126817A (ko) * 2016-05-10 2017-11-20 한양대학교 산학협력단 고속 영상 부호화 방법 및 장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102185857B1 (ko) 2014-02-13 2020-12-02 삼성전자주식회사 영상 부호화, 복호화 방법 및 장치

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194035B2 (en) 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101427516B1 (ko) * 2013-01-31 2014-08-13 세종대학교산학협력단 변환 계수의 분포에 기반한 예측 방법 및 장치
KR20170126817A (ko) * 2016-05-10 2017-11-20 한양대학교 산학협력단 고속 영상 부호화 방법 및 장치

Also Published As

Publication number Publication date
KR101099257B1 (ko) 2011-12-27

Similar Documents

Publication Publication Date Title
KR102007289B1 (ko) 적응적인 영상 부호화 방법 및 장치
KR101433170B1 (ko) 인접 블록의 공간 예측 방향성을 이용하여 화면 내 예측모드를 추정하는 인코딩 및 디코딩 방법, 그 장치
US8160374B2 (en) Method and apparatus for realizing adaptive quantization in process of image coding
KR100703200B1 (ko) 인트라 부호화 장치 및 방법
EP2127110B1 (en) Method and apparatus for bit rate reduction in video telephony
JP4317814B2 (ja) 動画像情報の符号化装置及び符号化方法
EP1723796A1 (en) Method, medium, and filter removing a blocking effect
AU2015415109A1 (en) Method and apparatus of adaptive filtering of samples for video coding
WO2011031692A2 (en) Speedup techniques for rate distortion optimized quantization
WO2009121233A1 (zh) 一种用于视频编码的空间预测方法
CA2807784A1 (en) Video encoding method, video decoding method, video encoding apparatus, video decoding apparatus, and program thereof
KR101960470B1 (ko) 오프라인 cabac을 지원하는 비디오 코딩 프로세스의 비트 예측 기반 비트 레이트 컨트롤 방법 및 그 장치
CN102075751B (zh) 一种基于宏块运动状态的h264快速模式选择方法
KR101099257B1 (ko) H.264/avc에서 매크로 블록의 부호화 모드 고속 결정방법
Kim et al. Fast intra-mode decision in H. 264 video coding using simple directional masks
KR101138736B1 (ko) 부호화기 및 부호화기의 후보 모드 결정 방법
KR100943636B1 (ko) 매크로블록의 부호화 모드 고속 결정 방법
Chono et al. Detented quantization to suppress flicker artifacts in periodically inserted intra-coded pictures in H. 264 video coding
KR101242560B1 (ko) 탐색 영역 조정 장치 및 방법
WO2022140905A1 (zh) 预测方法、编码器、解码器以及存储介质
KR101215138B1 (ko) 매크로블록의 인터/인트라모드 고속 결정 방법
Han et al. Fast macroblock mode decision in H. 264
KR100939280B1 (ko) 다중 참조 프레임을 이용한 비디오 부호화 방법 및 그방법이 기록된 컴퓨터로 판독 가능한 기록매체
KR101130733B1 (ko) 매크로 블록의 부호화 모드 결정 방법 및 그 장치
KR101247781B1 (ko) 부호화기 및 분산값 기반의 인트라 모드 결정 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141209

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee