KR101378434B1 - 고속 화면내 예측 모드 결정 방법 - Google Patents

고속 화면내 예측 모드 결정 방법 Download PDF

Info

Publication number
KR101378434B1
KR101378434B1 KR1020120116659A KR20120116659A KR101378434B1 KR 101378434 B1 KR101378434 B1 KR 101378434B1 KR 1020120116659 A KR1020120116659 A KR 1020120116659A KR 20120116659 A KR20120116659 A KR 20120116659A KR 101378434 B1 KR101378434 B1 KR 101378434B1
Authority
KR
South Korea
Prior art keywords
prediction mode
current block
mode
prediction
difference values
Prior art date
Application number
KR1020120116659A
Other languages
English (en)
Inventor
김태호
정제창
전지현
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020120116659A priority Critical patent/KR101378434B1/ko
Application granted granted Critical
Publication of KR101378434B1 publication Critical patent/KR101378434B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes

Abstract

화소에 기반하여 화면내 예측 모드를 결정하는 방법이 개시된다. 화면내 예측 모드 결정 방법은 현재 블록 내에서 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들에 기반하여 현재 블록의 방향성을 예측하는 단계와, 현재 블록의 방향성에 상응하는 적어도 하나의 후보 예측 모드를 선택하는 단계를 포함한다. 따라서, 현재 블록의 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들을 이용한 간단한 계산으로 신뢰성 있는 후보 예측 모드를 할 수 있고, 현재 블록의 방향성에 상응하는 후보 예측 모드를 선택함으로써 부호화 효율을 향상시키고 복잡도를 감소시킬 수 있다.

Description

고속 화면내 예측 모드 결정 방법{METHOD FOR FAST INTRA PREDICTION MODE DECISION}
본 발명은 비디오 부호화 및 복호화에 관한 것으로, 더욱 상세하게는 화소에 기반하여 화면내 예측 모드를 결정하는 방법에 관한 것이다.
최근에는 스마트폰과 스마트TV의 등장으로 인하여 유·무선 통신 네트워크를 통한 동영상 데이터의 이용이 폭발적으로 증가하고 있는 추세이다. 동영상 데이터는 일반 텍스트 데이터에 비하여 정보 전달 능력이 뛰어난 반면에 용량이 매우 크기 때문에 제한된 대역폭을 가진 네트워크 채널에서 데이터를 전송하거나 재생 및 저장하는데 어려움이 존재한다. 또한, 어플리케이션의 요구에 따라서 방대한 동영상 정보가 적절히 처리되어야 하므로, 동영상을 처리하기 위한 시스템 또한 높은 사양이 요구된다.
이러한 문제점들을 해결하기 위하여, 동영상 데이터를 작은 정보로 압축시키는 기술인 동영상 부호화 알고리즘이 활발히 연구되어 오고 있다. 현재까지 연구된 동영상 압축과 관련된 대표적인 국제 표준에는 ISO/IEC의 엠팩(MPEG) 시리즈와 ITU-T의 H.26x 시리즈가 있다.
H.264/AVC에 따르면 하나의 프레임에 포함된 복수의 매크로 블록 또는 서브 블록 단위로 부호화 및 복호화가 수행된다. 부호화 및 복호화는 시간적 예측과 공간적 예측을 기반으로 이루어진다. 시간적 예측은 현재 프레임의 매크로 블록의 움직임을 예측하는데 있어서 인접한 프레임의 매크로 블록을 참조하여 예측을 수행하는 것을 말하고, 공간적 예측은 부호화하고자 하는 현재 프레임의 매크로 블록을 그 프레임 내에서 인접한 블록을 이용하여 예측을 수행하는 것을 말한다.
도 1은 H.264/AVC에 따른 인트라 예측 모드를 나타낸다. 공간적 예측을 인트라 예측(Intra Prediction)이라고도 하는데, H.264/AVC는 4×4 휘도 블록에 대하여 9가지 예측 모드를 제공하고, 16×16 휘도 블록에 대해서는 4가지 예측 모드를 제공한다. 또한, 8×8 블록에 대해서는 16×16 휘도 블록과 예측 방향은 동일하나 모드 번호만 다른 4가지 예측 모드를 제공한다.
도 1a를 참조하면, 4×4 휘도 블록에 대한 9가지의 예측 모드는 수직(Vertical) 모드(모드 0), 수평(Horizontal) 모드(모드 1), DC 모드(모드 2), 대각 좌하향 모드 (Diagonal_Down_Left mode)(모드 3), 대각 우하향 모드(Diagonal_Down_Right mode)(모드 4), 수직 우향 모드(Vertical_Right)(모드 5), 수평 하향 모드(Horizontal_Down mode)(모드 6), 수직 좌향 모드(Vertical_Left mode)(모드 7), 수평 상향 모드(Horizontal_Up mode)(모드 8)로 구분된다.
또한, 도 1b를 참조하면, 16×16 휘도 블록에 대한 4가지 예측 모드는 수직(Vertical) 모드(모드 0), 수평(Horizontal) 모드(모드 1), DC 모드(모드 2), 평면(Plane) 모드(모드3)로 구분된다.
화소에 기반한 방향성 검출 기술(Pixel-Based Direction Detection)은 4×4 휘도 블록의 경우 상기의 9가지 예측 모드의 방향성에 따라 구한 16개의 화소들의 차이값에 기반한 3가지 예측 모드와 DC 예측 모드를 후보 예측 모드로 결정하여 화면내 예측 부호화를 수행하도록 한다. 그리고 16×16 휘도 블록과 8×8 블록의 경우 서브 블록의 화소들의 평균값으로 의사 4×4 블록을 만들어 4×4 휘도 블록과 같은 방식으로 화면내 예측을 수행할 수 있다.
하지만, 종래의 화소에 기반한 방향성 검출 기술은 항상 5개의 예측 모드가 버려지기 때문에 잘못된 예측으로 인한 비트의 손실이 발생할 수 있고, 불필요한 예측 모드까지 후보 예측 모드로 선택함에 따라 복잡도를 증가시키는 문제점이 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 현재 블록의 화소에 기반한 방향성을 검출하여 고속으로 화면내 예측 모드를 결정하는 방법을 제공하는데 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은, 현재 블록의 화소에 기반한 방향성을 검출하여 고속으로 화면내 예측 모드를 결정하여 부호화된 비디오를 복호화하는 방법을 제공하는데 있다.
상기 목적을 달성하기 위한 본 발명의 일 측면에 따른 화면내 예측 모드 결정 방법은, 현재 블록 내에서 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들에 기반하여 현재 블록의 방향성을 예측하는 단계와, 현재 블록의 방향성에 상응하는 적어도 하나의 후보 예측 모드를 선택하는 단계를 포함한다.
여기에서, 상기 현재 블록의 방향성을 예측하는 단계는, 수직 방향의 화소들의 차이값들의 절대값들의 평균값과 수평 방향의 화소들의 차이값들의 평균값의 비율에 따른 예측 각도를 산출하여 현재 블록의 방향성을 예측할 수 있다.
여기에서, 상기 적어도 하나의 후보 예측 모드를 선택하는 단계는, 미리 설정된 예측 각도의 범위로 구분되는 현재 블록의 방향성 별로 비트율 왜곡이 최적화되는 예측 모드의 빈도를 통계화하여 적어도 하나의 후보 예측 모드를 선택할 수 있다.
여기에서, 상기 적어도 하나의 후보 예측 모드를 선택하는 단계는, 현재 블록의 주변에 위치한 블록의 방향성을 이용하여 결정되는 최고 확률 모드(Most Probable Mode)를 포함하여 선택할 수 있다.
여기에서, 상기 화면내 예측 모드 결정 방법은, 적어도 하나의 후보 예측 모드 중에서 비트율 왜곡이 최적화되는 예측 모드를 최종 예측 모드로 결정하는 단계를 더 포함할 수 있다.
상기 목적을 달성하기 위한 본 발명의 다른 측면에 따른 비디오 복호화 방법은, 현재 블록 내에서 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들에 기반한 현재 블록의 방향성을 예측하고, 현재 블록의 방향성에 상응하는 적어도 하나의 후보 예측 모드로부터 결정된 예측 모드에 대한 정보를 포함하여 부호화된 비트스트림을 복호화하는 단계와, 예측 모드에 대한 정보를 참조하여 화면내 예측을 수행하는 단계를 포함한다.
상기와 같은 본 발명의 실시예에 따른 화면내 예측 모드 결정 방법을 이용할 경우에는 현재 블록의 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들을 이용한 간단한 계산으로 신뢰성 있는 후보 예측 모드를 선택할 수 있다.
또한, 본 발명의 실시예는 현재 블록의 방향성에 상응하는 후보 예측 모드를 선택함으로써 부호화 효율을 향상시키고 복잡도를 감소시킬 수 있는 장점이 있다.
도 1은 H.264/AVC에 따른 인트라 예측 모드를 설명하는 개념도이다.
도 2는 본 발명의 실시예에 따른 화면내 예측 모드 결정 방법을 설명하는 흐름도이다.
도 3은 본 발명의 실시예에 따른 화면내 예측을 수행하는 비디오 복호화 방법을 설명하는 흐름도이다.
도 4는 본 발명의 실시예에 따른 예측 각도에 기반한 예측 모드의 빈도를 통계화하여 나타낸 그래프이다.
도 5는 본 발명의 실시예에 따른 예측 각도에 기반한 후보 예측 모드를 나타내는 예시표이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하에서 후술할 영상 부호화 장치(Video Encoding Apparatus), 영상 복호화 장치(Video Decoding Apparatus)는 개인용 컴퓨터(PC: Personal Computer), 노트북 컴퓨터, 개인 휴대 단말기(PDA: Personal Digital Assistant), 휴대형 멀티미디어 플레이어(PMP: Portable Multimedia Player), 플레이스테이션 포터블(PSP: PlayStation Portable), 무선 통신 단말기(Wireless Communication Terminal), 스마트폰(Smart Phone), TV 응용 서버와 서비스 서버 등 서버 단말기일 수 있으며, 각종 기기 또 등과 같은 사용자 단말기이거나 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 부호화하거나 복호화하거나 부호화 또는 복호화를 위해 화면 간 또는 화면내 예측하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미할 수 있다.
또한, 영상 부호화 장치에 의해 비트스트림으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망, 이동통신망 등의 유무선 통신망 등을 통하거나 케이블, 범용 직렬 버스(USB: Universal Serial Bus) 등과 같은 다양한 통신 인터페이스를 통해 영상 복호화 장치로 전송되어 영상 복호화 장치에서 복호화되어 영상으로 복원되고 재생될 수 있다.
통상적으로 동영상은 일련의 픽처(Picture)로 구성될 수 있으며, 각 픽처들은 블록(Block)과 같은 소정의 영역으로 분할될 수 있다. 영상의 영역이 블록으로 분할되는 경우에는 분할된 블록은 부호화 방법에 따라 크게 인트라 블록(Intra Block), 인터 블록(Inter Block)으로 분류될 수 있다. 인트라 블록은 화면내 예측 부호화(Intra Prediction Coding) 방식을 사용하여 부호화되는 블록을 뜻하는데, 화면내 예측 부호화란 현재 부호화를 수행하는 현재 픽처 내에서 이전에 부호화되고 복호화되어 복원된 블록들의 화소를 이용하여 현재 블록의 화소를 예측함으로써 예측 블록을 생성하고 현재 블록의 화소와의 차분값을 부호화하는 방식이다. 인터 블록은 화면 간 예측 부호화(Inter Prediction Coding)를 사용하여 부호화되는 블록을 뜻하는데, 화면 간 예측 부호화란 하나 이상의 과거 픽처 또는 미래 픽처를 참조하여 현재 픽처 내의 현재 블록을 예측함으로써 예측 블록을 생성하고 현재 블록과의 차분값을 부호화하는 방식이다. 또한, 이하에 기재된 "픽처(picture)"이라는 용어는 영상(image), 프레임(frame) 등과 같은 동등한 의미를 갖는 다른 용어로 대치되어 사용될 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 2는 본 발명의 실시예에 따른 화면내 예측 모드 결정 방법을 설명하는 흐름도이다.
도 2를 참조하면, 본 발명의 실시예에 따른 화면내 예측 모드 결정 방법은, 현재 블록의 방향성을 예측하는 단계와 후보 예측 모드를 결정하는 단계를 포함한다.
현재 블록 내에서 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들에 기반하여 현재 블록의 방향성을 예측할 수 있고, 현재 블록의 방향성에 상응하는 적어도 하나의 후보 예측 모드를 선택할 수 있다.
화면내 예측은 공간상으로 인접한 화소값들이 높은 유사성을 가지고 있는 특성을 이용한 압축 방법으로, 화면내 예측에 있어서 블록의 방향성은 화소값들 사이의 유사성을 판단하는 기준이 될 수 있다.
본 발명의 실시예에 따르면, 부호화 대상 블록인 현재 블록의 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들을 이용하여 현재 블록의 방향성을 예측할 수 있다.
먼저, 다음의 수학식 1과 같이 현재 블록 내에서 수직 방향의 화소들의 차이값들의 절대값들의 평균값 및 수평 방향의 화소들의 차이값들의 절대값들의 평균값을 산출할 수 있다(S200).
Figure 112012085299314-pat00001
Figure 112012085299314-pat00002
는 수평 방향의 화소들의 차이값들의 절대값들의 평균값을 나타내고,
Figure 112012085299314-pat00003
는 수직 방향의 화소들의 차이값들의 절대값들의 평균값을 나타낸다.
여기서,
Figure 112012085299314-pat00004
는 현재 블록의 화소값을 나타내는 것으로 j번째 행과 i번째 열에 위치한 화소값을 나타낼 수 있다.
또한, m과 n은 현재 블록을 구성하는 화소들의 행과 열을 각각 나타낼 수 있다.
다음으로, 수직 방향의 화소들의 차이값들의 절대값들의 평균값과 수평 방향의 화소들의 차이값들의 절대값들의 평균값 사이의 비율을 이용하여 예측 각도를 산출할 수 있다(S210).
수학식 2를 이용하여 예측 각도(
Figure 112012085299314-pat00005
)를 산출할 수 있다.
Figure 112012085299314-pat00006
즉, 예측 각도는 현재 블록 내의 수직 방향의 화소들의 차이값들의 절대값들의 평균값과 수평 방향의 화소들의 차이값들의 평균값의 비율에 아크탄젠트(arctangent)를 적용하여 산출할 수 있고, 현재 블록의 ?향성은 예측 각도를 통하여 예측할 수 있다. 여기서, 예측 각도는 현재 블록에 수평인 방향을 기준으로 산출되는 각도일 수 있다.
또한, 현재 블록의 ?향성은 미리 설정된 예측 각도의 범위로 구분되어 예측될 수 있다(S220). 예컨대, 예측 각도의 범위를 0도에서 90까지 10도 단위로 구분하면 현재 블록의 방향성은 9개로 구분될 수 있다.
예측된 현재 블록의 방향성에 상응하는 적어도 하나의 후보 예측 모드들을 선택할 수 있다(S230). 특히, 본 발명의 실시예에 따르면, 미리 설정된 예측 각도의 범위로 구분되는 현재 블록의 방향성 별로 비트율 왜곡이 최적화되는 예측 모드의 빈도를 통계화하여 적어도 하나의 후보 예측 모드를 선택할 수 있다.
예를 들어, H.264/AVC의 화면내 예측 모드들 중에서 적어도 하나를 후보 예측 모드로 선택할 수 있다. 현재 블록이 4×4 블록인 경우 9가지의 예측 모드들 중에서 적어도 하나의 후보 예측 모드를 선택할 수 있고, 현재 블록이 16×16 블록 또는 8×8블록인 경우 4가지의 예측 모드들 중에서 적어도 하나의 후보 예측 모드를 선택할 수 있다.
또한, 후보 예측 모드는 현재 블록의 주변에 위치한 블록의 방향성을 이용하여 결정되는 최고 확률 모드(Most Probable Mode: MPM)을 항상 포함하도록 할 수 있다.
여기서, H.264/AVC는 4×4 블록의 경우 9가지 예측 모드에 따라 효율적으로 부호화를 수행하기 위하여 현재 블록의 좌측 블록의 예측 모드와 현재 블록의 상단 블록의 예측 모드를 참조하여 MPM을 예측할 수 있다.
따라서, 선택된 적어도 하나의 후보 예측 모드 중에서 비트율 왜곡이 최적화되는 예측 모드를 최종 예측 모드로 결정할 수 있고(S240), 결정된 최종 예측 모드를 이용하여 화면내 예측을 수행할 수 있다.
도 3은 본 발명의 실시예에 따른 화면내 예측을 수행하는 비디오 복호화 방법을 설명하는 흐름도이다.
도 3을 참조하면, 본 발명의 실시예에 따른 비디오 복호화 방법은, 예측 모드에 대한 정보를 포함하여 부호화된 비트스트림을 복호화하는 단계와, 예측 모드에 대한 정보를 참조하여 화면내 예측을 수행하는 단계를 포함한다.
부호화된 비트스트림은 현재 블록에 대한 화면내 예측에 적용되는 예측 모드에 대한 정보를 포함한다. 따라서, 예측 모드에 대한 정보를 포함하여 부호화된 비트스트림을 복호화하여 예측 모드에 대한 정보를 생성할 수 있다.
본 발명의 실시예에 따른 현재 블록에 적용될 예측 모드는, 현재 블록 내에서 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들에 기반한 현재 블록의 방향성을 이용하여 선택된 적어도 하나의 후보 예측 모드로부터 결정될 수 있다.
여기서, 후보 예측 모드들은 수직 방향의 화소들의 차이값들의 절대값들의 평균값과 수평 방향의 화소들의 차이값들의 평균값의 비율에 아크탄젠트(arctangent)를 적용하여 산출된 예측 각도의 범위로 구분되는 현재 블록의 방향성에 상응하여 선택될 수 있다.
또한, 후보 예측 모드들은 미리 설정된 예측 각도의 범위로 표시되는 현재 블록의 방향성 별로 비트율 왜곡이 최적화되는 예측 모드의 빈도를 통계화하여 선택될 수 있으며, 현재 블록의 주변에 위치한 블록의 방향성을 이용하여 결정되는 최고 확률 모드(MPM)를 포함할 수 있다.
따라서, 본 발명의 실시예에 따른 비디오 복호화 방법은, 현재 블록 내에서 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들에 기반하여 예측된 현재 블록의 방향성을 이용하여 후보 예측 모드를 선택하고, 후보 예측 모드 중에서 비트율 왜곡이 최적화되는 예측 모드를 최종 예측 모드로 화면내 예측을 수행하여 부호화된 비디오를 효과적으로 복호화할 수 있다.
도 4는 본 발명의 실시예에 따른 예측 각도에 기반한 예측 모드의 빈도를 통계화하여 나타낸 그래프이다.
도4는 H.264/AVC의 경우에 있어서 예측 각도의 범위에 따라 결정된 예측 모드의 빈도를 통계화하여 나타낸다. 도 4a는 현재 블록이 4×4 블록인 경우를 나타내고, 도 4b는 현재 블록이 16×16 또는 8×8 블록인 경우를 나타낼 수 있다.
도 4를 참조하면 10도의 예측 각도의 범위를 기준으로 현재 블록의 방향성을 구분할 수 있고, 구분된 현재 블록의 방향성에 따른 예측 모드로 결정될 확률을 퍼센트(%)로 나타낸다.
도 4a를 참조하면 현재 블록이 4×4 블록인 경우 9가지의 예측 모드로부터 후보 예측 모드를 선택할 수 있다.
예컨대, 예측 각도의 범위가 0도에서 10도인 경우 비트율 왜곡이 최적화되는 예측 모드가 수평(Horizontal) 모드(모드 1)일 확률이 90%를 넘는 것을 알 수 있다. 또한, 예측 각도가 커질수록 비트율 왜곡이 최적화되는 예측 모드가 수평(Horizontal) 모드(모드 1)일 확률은 점점 작아지고, 수직(Vertical) 모드(모드 0)일 확률은 점점 증가하는 것을 알 수 있다.
도 4b를 참조하면, 현재 블록이 16×16 블록 또는 8×8 블록인 경우 4가지의 예측 모드로부터 후보 예측 모드를 선택할 수 있다.
예컨대, 예측 각도의 범위가 0도에서 10도인 경우 비트율 왜곡이 최적화되는 예측 모드가 수평(Horizontal) 모드(모드 1)일 확률이 거의 100%임을 알 수 있다. 또한, 예측 각도가 커질수록 비트율 왜곡이 최적화되는 예측 모드가 수평(Horizontal) 모드(모드 1)일 확률은 점점 작아지고, 수직(Vertical) 모드(모드 0)일 확률은 점점 증가하는 것을 알 수 있다.
본 발명의 실시예에 따른 화면내 예측 모드 결정 방법은, 미리 설정된 예측 각도의 범위로 구분된 현재 블록의 방향성 별로 비트율 왜곡 최적화되는 예측 모드의 빈도를 통계화한 그래프를 이용하여 적어도 하나의 후보 예측 모드를 선택할 수 있다. 따라서, 이렇게 선택된 후보 예측 모드는 비트율 왜곡이 최적화될 가능성이 높다.
도 5는 본 발명의 실시예에 따른 예측 각도에 기반한 후보 예측 모드를 나타내는 예시표이다.
도 5는 H.264/AVC의 경우에 있어서 예측 각도의 범위에 따라 결정된 후보 예측 모드를 나타내는 예시표이다. 도 5a는 현재 블록이 4×4 블록인 경우를 나타내고, 도 5b는 현재 블록이 16×16 또는 8×8 블록인 경우를 나타낼 수 있다.
도 5a를 참조하면, 현재 블록이 4×4 블록인 경우 9가지의 예측 모드로부터 후보 예측 모드를 선택할 수 있다.
예컨대, 예측 각도가 0도에서 7.5도 사이에 있는 경우 수평(Horizontal) 모드(모드 1), DC 모드(모드 2)를 후보 예측 모드로 선택할 수 있고, 예측 각도가 7.5도에서 37.5도 사이에 있는 경우 수평(Horizontal) 모드(모드 1), DC 모드(모드 2), 수평 하향 모드(Horizontal_Down mode)(모드 6), 수평 상향 모드(Horizontal_Up mode)(모드 8)를 예측 모드로 선택할 수 있다. 즉, 예측 각도가 37.5도 보다 작거나 같은 영역에 있는 경우에는 수평 모드 또는 수평에 가까운 모드를 후보 예측 모드로 선택할 수 있다.
또한, 예측 각도가 82.5도에서 90도 사이에 있는 경우 수직(Vertical) 모드(모드 0), DC 모드(모드 2)를 후보 예측 모드로 선택할 수 있고, 예측 각도가 67.5도에서 82.5도 사이에 있는 경우 수직(Vertical) 모드(모드 0), DC 모드(모드 2), 수직 우향 모드(Vertical_Right)(모드 5), 수직 좌향 모드(Vertical_Left mode)(모드 7)를 예측 모드로 선택할 수 있다. 즉, 예측 각도가 67.5도 보다 큰 영역에 있는 경우에는 수직 모드 또는 수직에 가까운 모드를 후보 예측 모드로 선택할 수 있다.
여기서, DC 모드(모드 2) 또는 최고 확률 모드(MPM)은 후보 예측 모드에 항상 포함되도록 할 수 있다.
도 5b를 참조하면, 현재 블록이 16×16 블록 또는 8×8 블록인 경우 4가지의 예측 모드로부터 후보 예측 모드를 선택할 수 있다.
예컨대, 예측 각도가 0도에서 30도 사이에 있는 경우 수평(Horizontal) 모드(모드 1), DC 모드(모드 2)를 후보 예측 모드로 선택할 수 있고, 예측 각도가 30도에서 60도 사이에 있는 경우 DC 모드(모드 2), 평면(Plane) 모드(모드3)를 후보 예측 모드로 선택할 수 있으며, 예측 각도가 60도에서 90도 사이에 있는 경우 수직(Vertical) 모드(모드 0), DC 모드(모드 2)를 후보 예측 모드로 선택할 수 있다.
다만, 도 5의 표에 나타낸 후보 예측 모드의 선택은 본 발명의 실시예를 설명하기 위한 예시로, 본 발명의 실시예는 도 5의 표와 같은 후보 예측 모드의 선택으로 제한되지 않는다.
따라서, 본 발명의 실시예에 따르면 도 4와 같이 미리 설정된 예측 각도의 범위로 구분된 현재 블록의 방향성 별로 비트율 왜곡 최적화되는 예측 모드의 빈도를 통계화한 그래프를 이용하여 적어도 하나의 후보 예측 모드를 선택할 수 있다.
상술한 본 발명의 실시예에 따른 화면내 예측 모드 결정 방법 또는 비디오 복호화 방법은, 현재 블록의 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들을 이용한 간단한 계산으로 신뢰성있는 후보 예측 모드를 선택할 수 있도록 한다.
또한, 이를 통하여 부호화 효율을 향상시키고 복잡도를 감소시킬 수 있는 장점이 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (8)

  1. 현재 블록 내에서 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들에 기반하여 현재 블록의 방향성을 예측하는 단계;
    상기 현재 블록의 방향성에 상응하는 적어도 하나의 후보 예측 모드를 선택하는 단계; 및
    상기 적어도 하나의 후보 예측 모드 중에서 비트율 왜곡이 최적화되는 예측 모드를 최종 예측 모드로 결정하는 단계를 포함하는 화면내 예측 모드 결정 방법.
  2. 청구항 1에 있어서, 상기 현재 블록의 방향성을 예측하는 단계는,
    상기 수직 방향의 화소들의 차이값들의 절대값들의 평균값과 상기 수평 방향의 화소들의 차이값들의 평균값의 비율에 따른 예측 각도를 산출하여 상기 현재 블록의 방향성을 예측하는 것을 특징으로 하는 화면내 예측 모드 결정 방법.
  3. 청구항 2에 있어서, 상기 적어도 하나의 후보 예측 모드를 선택하는 단계는,
    미리 설정된 상기 예측 각도의 범위로 구분되는 상기 현재 블록의 방향성 별로 비트율 왜곡이 최적화되는 예측 모드의 빈도를 통계화하여 상기 적어도 하나의 후보 예측 모드를 선택하는 것을 특징으로 하는 화면내 예측 모드 결정 방법.
  4. 청구항 1에 있어서, 상기 적어도 하나의 후보 예측 모드를 선택하는 단계는,
    상기 현재 블록의 주변에 위치한 블록의 방향성을 이용하여 결정되는 최고 확률 모드(Most Probable Mode)를 포함하여 선택하는 것을 특징으로 하는 화면내 예측 모드 결정 방법.
  5. 삭제
  6. 현재 블록 내에서 수직 방향의 화소들의 차이값들과 수평 방향의 화소들의 차이값들에 기반한 현재 블록의 방향성을 예측하고, 상기 현재 블록의 방향성에 상응하는 적어도 하나의 후보 예측 모드로부터 결정된 예측 모드에 대한 정보를 포함하여 부호화된 비트스트림을 복호화하는 단계; 및
    상기 예측 모드에 대한 정보를 참조하여 화면내 예측을 수행하는 단계를 포함하되,
    상기 적어도 하나의 후보 예측 모드는,
    미리 설정된 예측 각도의 범위로 구분되는 상기 현재 블록의 방향성 별로 비트율 왜곡이 최적화되는 예측 모드의 빈도를 통계화하여 선택되는 것을 특징으로 하는 비디오 복호화 방법.
  7. 삭제
  8. 청구항 6에 있어서, 상기 적어도 하나의 후보 예측 모드는,
    상기 현재 블록의 주변에 위치한 블록의 방향성을 이용하여 결정되는 최고 확률 모드(Most Probable Mode)를 포함하는 것을 특징으로 하는 비디오 복호화 방법.

KR1020120116659A 2012-10-19 2012-10-19 고속 화면내 예측 모드 결정 방법 KR101378434B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120116659A KR101378434B1 (ko) 2012-10-19 2012-10-19 고속 화면내 예측 모드 결정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120116659A KR101378434B1 (ko) 2012-10-19 2012-10-19 고속 화면내 예측 모드 결정 방법

Publications (1)

Publication Number Publication Date
KR101378434B1 true KR101378434B1 (ko) 2014-03-27

Family

ID=50649596

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120116659A KR101378434B1 (ko) 2012-10-19 2012-10-19 고속 화면내 예측 모드 결정 방법

Country Status (1)

Country Link
KR (1) KR101378434B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017176030A1 (ko) * 2016-04-06 2017-10-12 주식회사 케이티 비디오 신호 처리 방법 및 장치
KR20190037946A (ko) * 2017-09-29 2019-04-08 한밭대학교 산학협력단 Hevc 부호기를 위한 효율적인 화면내 예측 모드 결정 시스템 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070062146A (ko) * 2005-12-12 2007-06-15 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070062146A (ko) * 2005-12-12 2007-06-15 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017176030A1 (ko) * 2016-04-06 2017-10-12 주식회사 케이티 비디오 신호 처리 방법 및 장치
US11259047B2 (en) 2016-04-06 2022-02-22 Kt Corporation Method and apparatus for processing video signal
US11785257B2 (en) 2016-04-06 2023-10-10 Kt Corporation Method and apparatus for processing video signal
KR20190037946A (ko) * 2017-09-29 2019-04-08 한밭대학교 산학협력단 Hevc 부호기를 위한 효율적인 화면내 예측 모드 결정 시스템 및 방법
KR102050238B1 (ko) 2017-09-29 2019-11-29 한밭대학교 산학협력단 Hevc 부호기를 위한 효율적인 화면내 예측 모드 결정 시스템 및 방법

Similar Documents

Publication Publication Date Title
US11265555B2 (en) Video encoding and decoding method
Zhang et al. Low complexity HEVC INTRA coding for high-quality mobile video communication
KR101808327B1 (ko) 영상 코덱에서 패딩을 이용한 영상 부/복호화 방법 및 장치
KR102271765B1 (ko) 인트라프레임 예측 방법과 장치, 비디오 인코딩 장치 및 저장 매체
KR101409826B1 (ko) 적응적 탐색 범위를 이용한 움직임 예측 방법
KR101587927B1 (ko) 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치
US8189673B2 (en) Method of and apparatus for predicting DC coefficient of video data unit
JP2022526276A (ja) 画像エンコーディングおよびデコーディングのための方法およびデバイス
KR20230157287A (ko) 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치
KR101378434B1 (ko) 고속 화면내 예측 모드 결정 방법
KR101596085B1 (ko) 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법
CN112673628B (zh) 影像编码装置及方法、影像解码装置及方法、记录介质
KR20200084300A (ko) 영상 복호화 방법, 영상 부호화 방법, 영상 복호화 장치, 영상 부호화 장치 및 컴퓨터 판독 가능한 기록 매체
KR20160014082A (ko) 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치
KR20130023444A (ko) 다단계 화면간 예측을 이용한 영상 부호화/복호화 장치 및 방법
KR20150081240A (ko) 무손실 비디오 부호화/복호화 방법 및 장치
KR101540510B1 (ko) 추가적 예측 후보를 이용한 인트라 예측 방법 및 그 장치
KR101510585B1 (ko) 움직임 정보 부호화/복호화 장치 및 움직임 정보를 부호화/복호화하는 방법
KR101413364B1 (ko) 이진 블록 정합을 이용한 움직임 추정 방법
JP2014027676A (ja) 画像の復号化装置
KR102235314B1 (ko) 영상 코덱에서 패딩을 이용한 영상 부/복호화 방법 및 장치
JP5913474B2 (ja) 復号化方法
JP5868909B2 (ja) 復号化方法
KR20140009912A (ko) 무손실 비디오 부호화/복호화 방법 및 장치
CN112714312A (zh) 编码模式选择方法、装置以及可读存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161227

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee