KR20100059038A - 고속 모드 결정을 위한 h.264의 화면내 예측모드 처리방법 - Google Patents

고속 모드 결정을 위한 h.264의 화면내 예측모드 처리방법 Download PDF

Info

Publication number
KR20100059038A
KR20100059038A KR1020080117674A KR20080117674A KR20100059038A KR 20100059038 A KR20100059038 A KR 20100059038A KR 1020080117674 A KR1020080117674 A KR 1020080117674A KR 20080117674 A KR20080117674 A KR 20080117674A KR 20100059038 A KR20100059038 A KR 20100059038A
Authority
KR
South Korea
Prior art keywords
prediction
mode
samples
sample
intra
Prior art date
Application number
KR1020080117674A
Other languages
English (en)
Inventor
김기철
김정훈
Original Assignee
서울시립대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울시립대학교 산학협력단 filed Critical 서울시립대학교 산학협력단
Priority to KR1020080117674A priority Critical patent/KR20100059038A/ko
Publication of KR20100059038A publication Critical patent/KR20100059038A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 고속 모드 결정을 위한 H.264의 화면 내 예측 방법에 관한 것으로서, 동영상 데이터 압축에 사용되는 H.264의 화면 내 예측의 고속 모드 결정을 위해 4×4 블록 화면에 대해 전처리 과정에서 예측모드에 따라 중복성을 이용하여 예측 샘플의 개수를 줄임으로 적은 연산과 간소화된 식으로 최종 예측모드를 결정하도록 함으로써 고화질의 성능을 만족시킬 수 있다.
H.264, 화면 내 예측, 고속 모드 결정, 전처리, 4x4 블록, 예측모드, 예측샘플, 이웃샘플, 중복성

Description

고속 모드 결정을 위한 H.264의 화면 내 예측 방법{INTRA PREDICTION METHOD FOR FAST MODE DECISION IN H.264}
본 발명은 고속 모드 결정을 위한 H.264의 화면 내 예측 방법에 관한 것으로서, 보다 상세하게는 동영상 데이터 압축에 사용되는 H.264의 화면 내 예측의 고속 모드 결정을 위해 4×4 블록 화면에 대해 전처리 과정에서 예측모드에 따라 중복성을 이용하여 예측 샘플의 개수를 줄임으로 적은 연산과 간소화된 식으로 최종 예측모드를 결정하도록 하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법에 관한 것이다.
최근 무선 통신 기반의 확충과 다양한 콘텐츠들의 개발로 멀티미디어는 더 이상 특정 계층이 아닌 일반 대중도 쉽게 접할 수 있는 문화 생활이 되었다. 다양한 포맷의 음악 파일과 동영상 파일, 동영상 강의, 오디오 북, 디지털 액자 등의 다양한 콘텐츠가 개발되면서 우리는 멀티미디어를 일상의 여러 곳에서 손쉽게 접할 수 있다.
특히 2000년대에 접어들면서 DMB(Digital Media Broadcasting)의 보급으로 멀티미디어는 일상 생활의 한 부분이 되어가고 있다.
멀티미디어 시대를 맞아 다양한 멀티미디어 응용에 필수적인 기술 요소 중 하나로서, 주어진 저장 및 전송 자원의 활용을 극대화할 수 있는 영상 압축 기술이 있다. 대표적 영상 압축 기술로는 MPEG-1/2/4 및 H.261/262/263,그리고 H.264 등이 있는데, 이들 중 가장 최근에 규격화된 H.264는 MPEG-2 영상 압축 기술에 비해 최대 2배 이상의 압축 효율을 제공할 수 있는 고성능 압축 표준으로, 2Mbps 이하의 비트율에서 디지털 텔레비전 수준의 고품질 비디오를 제공할 수 있어 3세대 무선 네트워크를 통한 비디오 스트리밍, DMB(Digital Multimedia Broadcasting) 등의 포터블 멀티미디어 방송 및 ADSL(Asymmetric Digital Subscribers' Loop) 등의 현세대 네트워크 기반의 IP-TV(Internet Protocol-Television)와 같은 다양한 멀티미디어 응용분야에서 활용되고 있다.
H.264(Advanced Video Coding) 동영상 표준은 ITU-T VCEG(Video Coding Experts Group)과 ISO/IEC MPEG(Moving Picture Experts Group)의 JVT(Joint Video Team)에 의해 개발되었다. H.264 동영상 표준은 보다 효율적인 데이터의 처리를 위해 기존의 동영상 표준에서는 지원하지 않았던 4x4 블록 기반의 연산, 1/4 픽셀 움직임 예측 연산 등의 개선된 연산 기능을 지원한다.
이에 따라 H.264 동영상 표준은 기존의 동영상 표준인 MPEG-4, H.263, MPEG-2에 비해 각각 39%, 49%, 64%의 비트율 감소를 보이는 등 이전 동영상 표준에 비해 뛰어난 성능 향상을 보인다.
이처럼 H.264 동영상 표준은 데이터의 효율적인 처리를 위해 다양하고 개선된 기능들을 지원한다. 이로 인하여 H.264 동영상 표준은 이전 동영상 표준에 비해 복잡하고 많은 양의 연산을 필요로 하게 되었다. 화면 내 예측은 화면 간 예측과 함께 H.264 동영상 표준 내에서도 가장 많은 연산량을 차지하는 기능이다.
따라서 화면 내 예측 연산을 H.264 인코더(encoder)에서 구현하기 위해서는 많은 하드웨어 자원을 필요로 한다. 이러한 화면 내 예측 연산의 하드웨어 비용이나 연산 시간을 줄이기 위하여 고속 화면 내 예측 알고리듬이 필요하게 되었다.
화면 내 예측은 화면 간 예측과 함께 동영상 표준을 구성하는 주요 기능으로 어떤 화면과 유사한 화면을 해당 화면의 데이터만을 이용해 생성한 후 그 차분값만을 전송하여 정보량을 줄이는 역할을 한다. 또한 이전 프레임을 사용하는 화면 간 예측의 시간적 특성에 의한 에러 지연을 방지하는 역할도 수행한다.
이러한 역할을 담당하는 화면 내 예측은 다음과 같은 연산 과정을 거쳐 수행된다.
우선 블록 단위의 예측을 수행하기 위해 현재 프레임을 블록 단위로 나누고, 나누어진 각각의 블록은 주변 블록의 샘플들을 이용해 예측되는데, 이때 사용되는 주변 블록들은 이미 예측이 끝나고 복원된 블록들을 사용한다.
하나의 블록은 블록의 종류에 따라 주어지는 예측모드에서 최종적으로 결정되는 하나의 예측모드에 의해서 예측된다. 예측된 블록의 데이터를 전부 보내는 것보다는 영상의 차분값만을 전송하여 데이터의 양을 줄이기 위해 예측된 블록과 원영상과의 차분값인 잔여 블록을 생성한다. 이렇게 생성된 잔여 블록은 변환-양자화 -역양자화-역변환을 거친 후 예측된 블록과 더해져서 해당 블록을 복원한다.
H.264의 화면 내 예측은 기존 동영상 표준이 8×8 블록 단위의 연산까지 지원한 반면에 4×4 블록과 16×16 블록으로 세분화된 블록 단위의 연산을 지원한다.
도 1은 H.264에서 4×4 휘도 블록의 이웃 샘플을 나타낸 도면이고, 도 2는 H.264에서 4×4 휘도 블록의 9가지 예측모드를 나타낸 도면이다.
여기에 도시된 바와 같이 4×4 블록의 화면 내 예측에서 4×4 블록 내 16개 예측 샘플의 생성에 사용되는 이웃 샘플의 개수는 13개이다. 13개의 이웃 샘플은 좌(I,J,K,L), 좌상(M), 상(A,B,C,D), 우상(E,F,G,H)에 위치한 블록의 샘플들로 구성된다.
또한, 도 2에 도시된 바와 같이 H.264에서 4×4 휘도 블록을 위한 화면 내 예측은 9가지의 예측모드를 가진다. 이러한 9가지 예측모드는 13개의 이웃 샘플이 각각 수직, 수평 등의 방향성을 갖는 8개의 모드와 DC 모드로 구성된다. 그리고, 4×4 블록의 화면 내 예측은 잔여 블록의 생성을 위해 각 예측모드마다 4×4 블록에 대하여 16개 예측 샘플을 생성한다. 이때 예측 샘플의 생성을 위해 각 모드마다 다른 식이 사용되며, 13개의 이웃 샘플도 각 모드의 방향성에 따라 각기 다르게 조합되어 사용된다.
이와 같이 H.264 동영상 표준은 다양한 블록 크기와 다양한 예측모드를 지원하므로 이에 따라 각 블록 크기와 예측모드를 비교하기 위한 모드 결정 방식이 필요하다.
첫 번째 방식은 고화질 모드 방식으로 다중경로 부호화 방식을 취한다. 즉, 후보가 되는 모든 모드에 대해서 예측을 수행하고 그 잔여 블록을 생성한 후 변환-양자화-역양자화-역변환 과정을 거쳐 왜곡 관점에서 가장 효율이 좋은 모드를 선택한다. 이 고화질 모드 방식은 모든 모드에 대해 복원 과정을 수행하므로 고화질의 장점을 얻을 수 있으나 많은 연산과 시간을 필요로 하는 단점이 있다.
두 번째 방식은 고속 모드 방식으로 단일 경로 부호화 방식을 취한다. 이 방식은 후보가 되는 모든 모드에 대해서 예측을 수행하고 그 잔여블록을 생성하는 것까지는 고화질 모드 방식과 동일하나 완전한 복원 과정을 수행하지 않는 점이 다르다. 고속 모드 방식은 각 모드의 비교를 위해 모든 후보 모드에 대해 복원 과정을 거치는 고화질 모드 방식과는 달리 SATD(Sum of Absolute Transformed Difference)를 사용하여 복원 과정을 거치지 않고 각 모드를 비교한다. SATD는 생성된 잔여 블록에 대해 하다마드(Hadamard) 변환을 수행하고 그 절대값의 합을 계산하는 연산이다.
따라서 고속 모드 방식은 모든 후보 모드에 대해 SATD 연산을 수행하여 가장 작은 SATD 값을 갖는 모드를 최종 예측 모드로 선택한다. 이 고속 모드 방식은 고화질 모드 방식에 비해 성능은 낮지만 빠른 모드 결정을 수행할 수 있는 장점이 있다.
이러한 고속 모드 방식에 의한 화면 내 예측의 유형은 전처리를 통하여 후보 예측 모드를 감소시키는 고속 모드 결정 방식과, 매크로블록 내 4×4 블록의 연산 순서를 개선하는 방식과, 모드 결정을 간소화하는 방식과, 변환 부분을 간소화하는 방식과, 블록의 예측에서 이웃 블록을 사용할 때 복원된 블록을 사용하지 않고 원 영상의 블록을 사용하는 방식이 있다.
위에서 설명한 기술은 본 발명이 속하는 기술분야의 배경기술을 의미하며, 종래기술을 의미하는 것은 아니다.
이와 같이 H.264 동영상 표준은 다양한 블록 크기와 다양한 예측모드를 지원함에 따라 각 블록 크기와 예측모드를 비교하기 위한 모드 결정 방식이 필요하며, 모드 결정 방식에 따라 화질의 성능이 저하되거나 많은 연산과 시간이 필요한 문제점이 있다.
본 발명은 상기와 같은 문제점을 개선하기 위해 창작된 것으로서, 동영상 데이터 압축에 사용되는 H.264의 화면 내 예측의 고속 모드 결정을 위해 4×4 블록 화면에 대해 전처리 과정에서 예측모드에 따라 중복성을 이용하여 예측 샘플의 개수를 줄임으로 적은 연산과 간소화된 식으로 최종 예측모드를 결정하도록 함으로써 고화질의 성능을 만족시킬 수 있도록 한 고속 모드 결정을 위한 H.264의 화면 내 예측 방법을 제공하는데 그 목적이 있다.
본 발명의 일 측면에 따른 고속 모드 결정을 위한 H.264의 화면 내 예측 방 법은 동영상 데이터 처리를 위해 고속 모드 결정 방식에 의해 화면 내 예측을 수행하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법에 있어서, 4×4 블록에 이웃하는 7개의 이웃샘플을 통해 예측모드에 따라 각각 8개씩의 예측샘플을 생성하는 단계; 예측모드에 따라 생성된 예측샘플과 동일한 위치의 원영상 블록 내 샘플들과 SAD를 계산하는 단계; SAD가 가장 작은 3개의 예측모드와 DC 예측모드를 결정하는 단계;를 포함하는 것을 특징으로 한다.
본 발명의 예측샘플을 생성하는 단계에서 하나의 예측샘플을 생성할 때 이웃샘플 중 최대 3개를 사용하여 생성하는 것을 특징으로 한다.
본 발명의 예측샘플을 생성하는 단계에서 예측샘플은 예측모드의 방향성에 따라 중복하여 생성하는 것을 특징으로 한다.
이때 예측샘플은 예측모드에 따라 2개에서 최대 4개까지 중복되는 것을 특징으로 한다.
본 발명에서 예측샘플은 아래식에 의해 간소화되는 것을 특징으로 한다.
(아래식)
pred[x, y] = ( p[] + 2*p[] + p[] ) >> b
이때, pred[x, y] : x, y 위치의 예측샘플
p[] : 이웃샘플
b : 상수
본 발명에서 예측샘플을 생성하는 단계는 멀티플렉서, 쉬프터, 덧셈기를 이용하여 생성하는 것을 특징으로 한다.
상기한 바와 같이 본 발명은 동영상 데이터 압축에 사용되는 H.264의 화면 내 예측의 고속 모드 결정을 위해 4×4 블록 화면에 대해 전처리 과정에서 예측모드에 따라 중복성을 이용하여 예측 샘플의 개수를 줄임으로 적은 연산과 간소화된 식으로 최종 예측모드를 결정하도록 함으로써 고화질의 성능을 만족시킬 수 있다
이하, 첨부된 도면을 참조하여 본 발명에 따른 고속 모드 결정을 위한 H.264의 화면 내 예측 방법의 일 실시예를 설명한다. 이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 3은 본 발명의 일 실시예에 따른 고속 모드 결정을 위한 H.264의 화면 내 예측 방법을 설명하기 위한 흐름도이다.
여기에 도시된 바와 같이 H.264에서 고속 모드 결정 방식에 의한 화면 내 예측을 위해 전처리 과정을 수행하여 4×4 휘도 블록에 이웃하는 최대 7개의 이웃샘플을 선택한다(S10), 이후 예측모드에 따라 선택된 이웃샘플을 통해 예측모드의 방향성에 따른 중복성을 이용하여 예측모드에 따라 각각 8개의 예측샘플을 생성한 다(S20).
이렇게 예측모드에 따라 생성된 예측샘플과 동일한 위치의 원영상 블록 내 샘플을 빼고 절대값을 취한 후 이들 값을 합산한 SAD를 계산한다(S30).
이후 SAD가 가장 작은 3개의 예측모드와 DC 예측모드를 후보 예측모드로 결정함으로써 후보 예측모드의 수를 9개에서 4개로 줄인다(S40).
이와 같이 4개로 줄인 후보 예측모드를 통해 화면 내 예측을 수행하여 하나의 최종 예측모드를 결정한다(S50).
위와 같은 방법에 의한 고속 모드 결정을 위한 H.264의 화면 내 예측 방법에 대해 도 4에 도시된 본 발명의 실시예에 따른 예측샘플과 필요한 이웃샘플을 나타낸 도면과, 도 5에 도시된 본 발명의 실시예에 따른 고속 모드 결정을 위한 전처리 유닛을 나타낸 도면을 참조하여 구체적으로 설명하면 다음과 같다.
먼저, 4×4 휘도 블록의 화면 내 예측을 위한 H.264 화면 내 예측의 중복성은 다음과 같다. 이때 DC 모드는 전처리 과정에서 다루어지지 않으므로 제외하고 설명한다.
첫째로 H.264에서 4×4 블록의 화면 내 예측은 예측 모드에 관계없이 예측샘플의 생성에 pred[x, y] = ( p[] + 2*p[] + p[] + a ) >> b 와 같은 유사한 식을 사용함에 따라 이를 pred[x, y] = ( p[] + 2*p[] + p[] ) >> b 로 간소화하여 세 번의 덧셈과 두 번의 쉬프트 연산으로 표현할 수 있다.
둘째로 예측 모드에 관계없이 하나의 예측샘플 생성할 때 최대 세 개의 이웃 샘플을 사용한다. 각 모드마다 사용되는 이웃샘플은 달라지지만 하나의 예측샘플을 생성할 때 각각 사용되는 이웃샘플의 개수는 최대 세 개만을 사용하여 생성한다.
셋째로 하나의 4×4 블록에 대해 각 예측모드마다 2∼4개의 예측샘플이 동일한 값을 갖기 때문에 예측샘플의 생성에 소요되는 연산량을 줄일 수 있다.
넷째로 하나의 4×4 블록의 예측에 있어서 최대 7개의 이웃샘플만을 사용한다. 이는 각 예측모드가 갖는 방향성 때문에 생기는 특징으로 도 4에 도시된 바와 같이 예측샘플에 필요한 이웃샘플의 개수를 확인할 수 있다.
이와 같은 H.264 화면 내 예측의 중복성을 이용하여 이웃샘플을 선택하여(S10) DC 모드를 제외한 8개의 예측모드에 대해 각각 8개씩의 예측 샘플을 생성한다(S20).
각 예측모드별 예측샘플의 위치는 도 4에 도시된 바와 같이 위치하며 이는 시뮬레이션을 통하여 가장 고화질의 성능을 가질 수 있도록 선정하였으며, 각 예측모드마다 동일한 패턴으로 표시된 예측샘플들은 동일한 값을 갖는 예측샘플들이다.
그리고, 예측샘플들은 각 예측모드에 따라 아래식과 같이 H.264 화면 내 예측을 간소화한 식에 의해 생성된다.
Mode 0 : a, i = A, f, n = B, c, k = C, h, p = D
Mode 1 : a, c = I, f, h = J, i, k = K, n, p = L
Mode 3 : b, e = ( B + 2*C + D ) >> 2,
d, g, j, m = ( D + 2*E + F ) >> 2, l, o = ( F + 2*G + H ) >> 2
Mode 4 : c, h = ( A + 2*B + C ) >> 2,
a, f, k, p = ( A + 2*M + I ) >> 2, i, n = ( I + 2*J + K ) >> 2
Mode 5 : e, n = ( I + 2*M + A ) >> 2, f, o = ( M + 2*A + B ) >> 2
b, k = ( A + B ) >> 1, c, l = ( B + C ) >> 1
Mode 6 : b, h = ( I + 2*M + A ) >> 2, f, l = ( M + 2*I + J ) >> 2
e, k = ( I + J ) >> 1, i, o = ( J + K ) >> 1
Mode 7 : g, n = ( C + 2*D + E ) >> 2, h, o = ( D + 2*E + F ) >> 2
b, i = ( B + C ) >> 1, c, j = ( C + D ) >> 1
Mode 8 : j, h = ( K + 3*L ) >> 2, n, l = L
e, c = ( J + K ) >> 1, i, g = ( K + L ) >> 1 >> b
이렇게 생성된 예측샘플은 원영상 블록 내 같은 위치의 샘플들과 SAD가 계산된다(S30).
계산된 SAD는 가장 작은 SAD로부터 세 번째로 작은 SAD까지를 갖는 세 개의 예측모드와 DC 모드로 후보 예측모드의 수를 줄인다(S40).
위와 같은 전처리 과정을 하드웨어로 구현할 경우 도 5에 도시된 바와 같이 구성할 수 있다.
즉, 예측모드에 따라 레지스터에 저장된 이웃샘플들 중에서 멀티플렉서를 통해 각 예측모드에 해당하는 7개의 이웃샘플을 선택한다. 그런다음 예측모드에 따른 8개의 예측샘플을 중복성을 이용하여 쉬프터와 멀티플렉서와 덧셈기를 이용하여 8개의 예측 샘플을 생성하고, 생성되어진 예측샘플에서 원영상 블록의 샘플을 빼고 절대값을 구한 후 덧셈기를 통해 이를 각 예측모드마다 누적하여 레지스터에 저장 한다. 그런다음 비교기를 통하여 DC 모드를 포함한 네 개의 후보 예측모드를 결정한다.
이와 같이 고속 모드 결정을 위해 전처리 과정에서 네 개의 후보 예측모드가 결정되면 최종 예측모드를 결정하기 위해 네 개의 후보 예측모드에 대하여 화면 내 예측을 수행하여 하나의 최종 예측모드를 결정한다(S50).
본 발명에 의한 고속 모드 결정을 위한 H.264의 화면 내 예측 방법의 검증을 위하여 C 언어를 통하여 시뮬레이션하고, 그 결과와 VHDL로 설계한 예측기의 결과를 비교하였다.
시뮬레이션을 위한 C 언어 코드(code)는 JM 11.0 소프트웨어를 토대로 작성하였으며, 시뮬레이션의 출력은 디블록킹 필터 이전 단계의 복원된 프레임이고, 시뮬레이션의 대상은 YUV 4:2:0 포맷을 사용하며 평균 300 프레임으로 구성된 CIF급(352×288) 동영상으로 하였다.
비교 결과 본 발명에 의한 시뮬레이션 결과와 VHDL을 이용하여 설계한 예측기의 결과가 일치함을 알 수 있다.
성능 평가에 있어서는 가장 많이 사용되는 지표인 PSNR(Peak Signal to Noise Ratio)을 통하여 성능을 평가할 때 그 결과를 도 6에 도시하였다.
PSNR의 공식은 객관적인 성능 평가를 위해서 JM 소프트웨어와 종래 기술에서 성능 비교를 위해 수학식 1과 수학식 2를 사용하였다.
Figure 112008081330401-PAT00001
Figure 112008081330401-PAT00002
그리고, QP(Quantization Parameter)는 JVT 회의 문서에서 추천하는 실험 환경을 참고하여 16, 20, 24, 28, 34, 40으로 설정되었다.
도 6은 각 QP에 따른 PSNR 성능을 나타내고 있으며, PSNR의 계산에는 수학식 1을 사용하였다. △ PSNR은 H.264 동영상 표준의 화면 내 예측을 적용하였을 때의 PSNR에서 본원 발명을 적용하였을 때의 PSNR을 뺀 값이다. 두 경우 모두 모드 결정 방법에 있어서는 RDO(Rate-Distortion Optimization) 대신 SATD 연산을 사용하였다.
이와 같이 비교 결과 본원 발명에 의한 방법은 휘도 성분(Y)에서 최대 0.04dB의 PSNR 감소만을 보이는 것을 확인할 수 있다.
이와 같은 성능 평가의 결과에서와 같이 본원 발명에 의한 H.264 고속 화면 내 예측 방법은 종래 방법에 비해 높은 PSNR 성능을 나타내는 것을 확인할 수 있다.
본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적 인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
도 1은 H.264에서 4×4 휘도 블록의 이웃 샘플을 나타낸 도면이다.
도 2는 H.264에서 4×휘도 블록의 9가지 예측모드를 나타낸 도면이다.
도 3은 본 발명의 실시예에 따른 고속 모드 결정을 위한 H.264의 화면 내 예측 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 실시예에 따른 예측샘플과 필요한 이웃샘플을 나타낸 도면이다.
도 5는 본 발명의 실시예에 따른 고속 모드 결정을 위한 전처리 유닛을 나타낸 도면이다.

Claims (6)

  1. 동영상 데이터 처리를 위해 고속 모드 결정 방식에 의해 화면 내 예측을 수행하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법에 있어서,
    4×4 블록에 이웃하는 7개의 이웃샘플을 통해 예측모드에 따라 각각 8개씩의 예측샘플을 생성하는 단계;
    상기 예측모드에 따라 생성된 상기 예측샘플과 동일한 위치의 원영상 블록 내 샘플들과 SAD를 계산하는 단계; 및
    상기 SAD가 가장 작은 3개의 예측모드와 DC 예측모드를 결정하는 단계;를 포함하는 것을 특징으로 하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법.
  2. 제 1항에 있어서, 상기 예측샘플을 생성하는 단계에서 하나의 예측샘플을 생성할 때 상기 이웃샘플 중 최대 3개를 사용하여 생성하는 것을 특징으로 하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법.
  3. 제 1항에 있어서, 상기 예측샘플을 생성하는 단계에서 상기 예측샘플은 상기 예측모드의 방향성에 따라 중복하여 생성하는 것을 특징으로 하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법.
  4. 제 3항에 있어서, 상기 예측샘플은 상기 예측모드에 따라 2개에서 최대 4개까지 중복되는 것을 특징으로 하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법.
  5. 제 1항에 있어서, 상기 예측샘플은 아래식에 의해 간소화되는 것을 특징으로 하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법.
    (아래식)
    pred[x, y] = ( p[] + 2*p[] + p[] ) >> b
    이때, pred[x, y] : x, y 위치의 예측샘플
    p[] : 이웃샘플
    b : 상수
  6. 제 1항에 있어서, 상기 예측샘플을 생성하는 단계는 멀티플렉서, 쉬프터, 덧셈기를 이용하여 생성하는 것을 특징으로 하는 고속 모드 결정을 위한 H.264의 화면 내 예측 방법.
KR1020080117674A 2008-11-25 2008-11-25 고속 모드 결정을 위한 h.264의 화면내 예측모드 처리방법 KR20100059038A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080117674A KR20100059038A (ko) 2008-11-25 2008-11-25 고속 모드 결정을 위한 h.264의 화면내 예측모드 처리방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080117674A KR20100059038A (ko) 2008-11-25 2008-11-25 고속 모드 결정을 위한 h.264의 화면내 예측모드 처리방법

Publications (1)

Publication Number Publication Date
KR20100059038A true KR20100059038A (ko) 2010-06-04

Family

ID=42360389

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080117674A KR20100059038A (ko) 2008-11-25 2008-11-25 고속 모드 결정을 위한 h.264의 화면내 예측모드 처리방법

Country Status (1)

Country Link
KR (1) KR20100059038A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107483932A (zh) * 2011-06-28 2017-12-15 三星电子株式会社 对视频数据进行编码的方法和设备
US9848204B2 (en) 2012-07-04 2017-12-19 Thomson Licensing Spatial prediction method and device, coding and decoding methods and devices
US10110905B2 (en) 2014-02-21 2018-10-23 Industry-Academic Cooperation Foundation, Yonsei University TSM rate-distortion optimizing method, encoding method and device using the same, and apparatus for processing picture
KR20190076273A (ko) 2017-12-22 2019-07-02 한동대학교 산학협력단 컨볼루션 신경망 기반의 검색 이미지 정렬 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107483932A (zh) * 2011-06-28 2017-12-15 三星电子株式会社 对视频数据进行编码的方法和设备
CN107483932B (zh) * 2011-06-28 2020-05-12 三星电子株式会社 对视频数据进行编码的方法和设备
US9848204B2 (en) 2012-07-04 2017-12-19 Thomson Licensing Spatial prediction method and device, coding and decoding methods and devices
US10110905B2 (en) 2014-02-21 2018-10-23 Industry-Academic Cooperation Foundation, Yonsei University TSM rate-distortion optimizing method, encoding method and device using the same, and apparatus for processing picture
KR20190076273A (ko) 2017-12-22 2019-07-02 한동대학교 산학협력단 컨볼루션 신경망 기반의 검색 이미지 정렬 방법

Similar Documents

Publication Publication Date Title
JP6254668B2 (ja) イントラ予測モードにおける映像復号化方法
TWI626842B (zh) Motion picture coding device and its operation method
JP4643454B2 (ja) 動画像復号装置及び動画像復号方法
RU2497303C2 (ru) Видео кодирование с использованием преобразования больше чем 4×4 и 8×8
JP5795525B2 (ja) 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム
KR20130091799A (ko) 인트라 예측 복호화 방법
KR20090079894A (ko) 예측 데이터 리파인먼트를 이용한 비디오 코딩 방법 및 장치
CN107211161B (zh) 包括最后阶段处理的扩展空间的视频编码优化
CN112703732A (zh) 使用存储的参数对视频编码和解码进行局部照明补偿
JP2012151576A (ja) 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置
Song et al. Early merge mode decision for texture coding in 3D-HEVC
JP7508705B2 (ja) イントラ予測モード向けのエントロピーコーディングのための方法、装置、及びコンピュータプログラム
KR20100059038A (ko) 고속 모드 결정을 위한 h.264의 화면내 예측모드 처리방법
CN110913215A (zh) 一种预测模式的选择方法及装置、可读存储介质
KR100689215B1 (ko) H.264 에서 다운 샘플링과 에지 방향성을 이용한 고속예측 모드 결정 방법
CN113452998A (zh) 一种解码、编码、编解码方法、装置及其设备
KR100896978B1 (ko) Mpeg-2에서 h.264/avc로의 고속 트랜스코딩에서 움직임 벡터 예측 방법과 모드 예측 방법 및 기록매체
KR20130085088A (ko) 스케일러블 비디오 코딩에서의 고속 모드 결정 방법 및 그 장치
CN115699738B (zh) 视频编解码方法设备、装置以及计算机可读存储介质
KR20230038300A (ko) 인트라 모드 코딩을 위한 개선
RU2777967C1 (ru) Деблокирующий фильтр для границ подразделов, возникающих под действием инструмента кодирования интра-подразделов
KR100986992B1 (ko) H.264 인코딩 시 고속 인터 모드 결정 방법
KR20100032235A (ko) 압축영상 트랜스코딩 방법 및 장치
CN116998153A (zh) 基于多个预测模式的交叉通道预测
WO2024039803A1 (en) Methods and devices for adaptive loop filter

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application