KR20150139354A - 비디오 부호화/복호화를 위한 인터 예측 방법 및 장치 - Google Patents

비디오 부호화/복호화를 위한 인터 예측 방법 및 장치 Download PDF

Info

Publication number
KR20150139354A
KR20150139354A KR1020140067852A KR20140067852A KR20150139354A KR 20150139354 A KR20150139354 A KR 20150139354A KR 1020140067852 A KR1020140067852 A KR 1020140067852A KR 20140067852 A KR20140067852 A KR 20140067852A KR 20150139354 A KR20150139354 A KR 20150139354A
Authority
KR
South Korea
Prior art keywords
macroblock
inter prediction
inter
prediction
value
Prior art date
Application number
KR1020140067852A
Other languages
English (en)
Inventor
김준
김영섭
Original Assignee
단국대학교 천안캠퍼스 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 단국대학교 천안캠퍼스 산학협력단 filed Critical 단국대학교 천안캠퍼스 산학협력단
Priority to KR1020140067852A priority Critical patent/KR20150139354A/ko
Publication of KR20150139354A publication Critical patent/KR20150139354A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 부호화/복호화를 위한 인터 예측의 성능 향상을 위한 방법 및 장치이 개시된다. 비디오 부호화/복호화를 위한 인터 예측 방법은, 메크로블록의 크기에 따른 인터 예측의 율-왜곡값을 계산하여 제1 메크로블록을 결정하는 단계와, 제1 메크로블록이 미리 설정된 블록 크기의 메크로블록인 경우, 제1 메크로블록의 움직임 벡터에 대한 분산값을 계산하는 단계와, 분산값이 미리 설정된 값 이상인 경우, 제1 메크로블록을 구획한 제2 메크로블록에 기반하여 인터 예측을 수행하는 단계를 포함한다. 따라서, 큰 메크로블록의 움직임 벡터에 대한 분산값이 커서 데이터의 량을 증가시키는 경우에, 큰 메크로블록을 보다 작은 메크로블록으로 구획하여 움직임 벡터를 산출함으로써, 인코딩되는 데이터의 량을 줄일 수 있다.

Description

비디오 부호화/복호화를 위한 인터 예측 방법 및 장치{METHOD AND APPARATUS OF INTER-PREDICTION FOR VIDEO ENCODING/DECODING}
본 발명은 비디오 부호화/복호화에 관한 것으로, 더욱 상세하게는 비디오 부호화/복호화를 위한 인터 예측의 성능 향상을 위한 방법 및 장치에 관한 것이다.
최근에는 스마트폰과 스마트TV의 등장으로 인하여 유·무선 통신 네트워크를 통한 동영상 데이트의 이용이 폭발적으로 증가하고 있는 추세이다. 동영상 데이터는 일반 텍스트 데이터에 비하여 정보 전달 능력이 뛰어난 반면에 용량이 매우 크기 때문에 제한된 대역폭을 가진 네트워크 채널에서 데이터를 전송하거나 재생 및 저장하는데 어려움이 존재한다. 또한, 어플리케이션의 요구에 따라서 방대한 동영상 정보가 적절히 처리되어야 하므로, 동영상을 처리하기 위한 시스템 또한 높은 사양이 요구된다.
이러한 문제점들을 해결하기 위하여, 동영상 데이터를 작은 정보로 압축시키는 기술인 동영상 부호화 알고리즘이 활발히 연구되어 오고 있다. 현재까지 연구된 동영상 압축과 관련된 대표적인 국제 표준에는 ISO/IEC의 엠펙(MPEG) 시리즈와 ITU-T의 H.26x 시리즈가 있다.
동영상 데이터는 시간적 (temporal), 공간적(spatial), 통계적(statistical) 중복성을 가지는 것을 특징으로 한다. 시간적 중복성은 연속되는 프레임간의 중복성을 의미하며, 연속되는 프레임의 화소값 들은 매우 높은 상관도를 가진다. 공간적 중복성은 프레임 내에 존재하는 중복성을 의미하며, 하나의 화소의 밝기 값은 이웃하는 화소들의 밝기 값과 높은 상관도를 가진다. 마지막으로, 통계적 중복성은 부호화된 데이터들 간의 중복성을 의미하는데, 화소들의 밝기 값의 확률 분포에 의한 중복성을 말한다.
동영상 부호화를 위하여, 상기 3가지 중복성을 제거함으로써 방대한 양의 동영상 데이터를 보다 작은 양의 데이터로 압축할 수 있다. 예를 들어, 움직임 추정 및 보상 기술은 시간적 중복성을 제거하며, 변환 부호화 기술과 양자화 기술은 공간적 중복성을 제거한다. 가변장 부호화 등과 같은 엔트로피 부호화 기술은 통계적 중복성을 제거하기 위한 목적으로 동영상 코덱의 국제 표준에 채택되어 사용된다.
국제 표준화 기구 중 MPEG 표준에서는 화면내 부호화(intra coded frame : I 프레임), 예측부호화(predictive coded frame : P 프레임), 양방향 예측부호화(bi-directionally-predicitve coded frame : B 프레임)의 세가지 형태의 예측 부호화 방식을 사용하며, P 프레임 및 B 프레임은 움직임 추정 및 보상 기술을 이용하여 높은 압축 효율을 달성한다.
I 프레임은 다른 프레임의 참조없이 화면 내부의 이웃하는 픽셀값을 이용하여 부호화된다. P 프레임은 과거의 I 프레임이나 P 프레임을 참조하여 부호화된다. 과거의 I 프레임이나 P 프레임에서 블록 단위로 움직임 정보를 추정하여 예측된 움직임 벡터와 예측 블록을 이용하여 움직임 보상을 수행하고, 움직임 보상 후 블록의 차분 신호와 차분 움직임 벡터를 부호화하여 시간적 중복도를 줄이고 높은 압축률을 달성할 수 있다.
B 프레임은 과거의 I 프레임과 P 프레임 뿐만 아니라, 미래의 I 프레임과 P 프레임도 참조하여 예측을 수행한다. B 프레임은 P 프레임과 마찬가지로 움직임 추정 및 보상기술을 이용한다. 그러나 참조 프레임을 두 개 사용하고, 이 중에서 보다 우수한 예측 성능을 선택하므로 압축률이 가장 높다. 그러나 B 프레임은 다른 프레임을 위한 참조 프레임이 되지는 않는다.
그러나, H.264/AVC(JM 18.2 Reference Software)를 분석하는 과정에서 P16x16 mode(P_slice_16x16_block) 임에도 불구하고 높은 Motion Vector 값을 갖는 경우가 있어 부호화 효율을 저하시키는 문제점이 발견되었다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 비디오 부호화/복호화를 위한 인터 예측의 성능 향상을 위한 방법을 제공하는데 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은, 비디오 부호화/복호화를 위한 인터 예측의 성능 향상을 위한 장치를 제공하는데 있다.
상기 목적을 달성하기 위한 본 발명의 실시예에 따른 비디오 부호화/복호화를 위한 인터 예측 방법은, 메크로블록의 크기에 따른 인터 예측의 율-왜곡값을 계산하여 제1 메크로블록을 결정하는 단계와, 제1 메크로블록이 미리 설정된 블록 크기의 메크로블록인 경우, 제1 메크로블록의 움직임 벡터에 대한 분산값을 계산하는 단계와, 분산값이 미리 설정된 값 이상인 경우, 제1 메크로블록을 구획한 제2 메크로블록에 기반하여 인터 예측을 수행하는 단계를 포함한다.
여기에서, 상기 미리 설정된 블록 크기는 16×16 화소 크기일 수 있다.
여기에서, 상기 제2 메크로블록은, 8×8 화소 크기일 수 있다.
여기에서, 상기 제1 메크로블록이 상기 미리 설정된 블록 크기의 메크로블록이 아니거나, 상기 분산값이 미리 설정된 값 미만인 경우, 상기 제1 메크로블록에 기반하여 인터 예측을 수행할 수 있다.
여기에서, 상기 제1 메크로블록 및 상기 제2 메크로블록은, P 프레임에 기반한 움직임 예측이 수행될 수 있다.
상기 다른 목적을 달성하기 위한 본 발명의 실시예에 따른 인터 예측 장치는, 비디오 부호화/복호화에 있어서, 메크로블록의 크기에 따른 인터 예측의 율-왜곡값을 계산하여 제1 메크로블록을 결정하고, 제1 메크로블록이 미리 설정된 블록 크기의 메크로블록인지 판단하고, 제1 메크로블록의 움직임 벡터에 대한 분산값이 미리 설정된 값 이상인지 판단하여 인터 예측을 수행할 수 있다.
상기와 같은 본 발명에 따른 인터 예측 방법 및 장치는, 큰 메크로블록의 움직임 벡터에 대한 분산값이 커서 데이터의 량을 증가시키는 경우에, 큰 메크로블록을 보다 작은 메크로블록으로 구획하여 움직임 벡터를 산출함으로써, 인코딩되는 데이터의 량을 줄일 수 있다.
도 1은 본 발명의 실시예에 따른 움직임 벡터 산출을 설명하기 위한 개념도이다.
도 2는 본 발명의 실시예에 따른 인터 예측 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 실시예에 따른 영상 부호화 장치를 설명하기 위한 블록도이다.
도 4는 본 발명의 실시예에 따른 영상 복호화 장치를 설명하기 위한 블록도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하에서 후술할 영상 부호화 장치(Video Encoding Apparatus), 영상 복호화 장치(Video Decoding Apparatus)는 개인용 컴퓨터(PC: Personal Computer), 노트북 컴퓨터, 개인 휴대 단말기(PDA: Personal Digital Assistant), 휴대형 멀티미디어 플레이어(PMP: Portable Multimedia Player), 플레이스테이션 포터블(PSP: PlayStation Portable), 무선 통신 단말기(Wireless Communication Terminal), 스마트폰(Smart Phone), TV 응용 서버와 서비스 서버 등 서버 단말기일 수 있으며, 각종 기기 또 등과 같은 사용자 단말기이거나 는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 부호화하거나 복호화하거나 부호화 또는 복호화를 위해 화면간 또는 화면내 예측하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미할 수 있다.
또한, 영상 부호화 장치에 의해 비트스트림으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망, 이동통신망 등의 유무선 통신망 등을 통하거나 케이블, 범용 직렬 버스(USB: Universal Serial Bus) 등과 같은 다양한 통신 인터페이스를 통해 영상 복호화 장치로 전송되어 영상 복호화 장치에서 복호화되어 영상으로 복원되고 재생될 수 있다.
통상적으로 동영상은 일련의 픽처(Picture)로 구성될 수 있으며, 각 픽처들은 프레임 또는 블록(Block)과 같은 소정의 영역으로 분할될 수 있다. 영상의 영역이 블록으로 분할되는 경우에는 분할된 블록은 부호화 방법에 따라 크게 화면내 블록(Intra Block), 인터 블록(Inter Block)으로 분류될 수 있다. 화면내 블록은 화면내 예측 부호화(Intra Prediction Coding) 방식을 사용하여 부호화되는 블록을 뜻하는데, 화면내 예측 부호화란 현재 부호화를 수행하는 현재 픽처 내에서 이전에 부호화되고 복호화되어 복원된 블록들의 화소를 이용하여 현재 블록의 화소를 예측함으로써 예측 블록을 생성하고 현재 블록의 화소와의 차분값을 부호화하는 방식이다. 인터 블록은 인터 예측 부호화(Inter Prediction Coding)를 사용하여 부호화되는 블록을 뜻하는데, 인터 예측 부호화란 하나 이상의 과거 픽처 또는 미래 픽처를 참조하여 현재 픽처 내의 현재 블록을 예측함으로써 예측 블록을 생성하고 현재 블록과의 차분값을 부호화하는 방식이다. 여기서, 현재 픽처를 부호화하거나 복호화하는데 참조되는 프레임을 참조 프레임(Reference Frame)이라고 한다. 또한, 이하에 기재된 "픽처(picture)"이라는 용어는 영상(image), 프레임(frame) 등과 같은 동등한 의미를 갖는 다른 용어로 대치되어 사용될 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 실시예에 따른 움직임 벡터 산출을 설명하기 위한 개념도이다.
도 1을 참조하면, 본 발명의 실시예에 따르면 현재 프레임(10)은 이전에 부호화되어 복원된 참조 프레임들(11, 12)을 참조할 수 있다. 즉, 하나 이상의 참조 프레임(11, 12)에 기반한 움직임 예측을 통하여 인터 예측을 수행할 수 있다.
또한, 움직임 예측은 다양한 메크로블록 유형에 기반하여 움직임 벡터를 산출할 수 있다.
예를 들어, H.264/AVC에 따르면, 16×16, 16×8, 8×16, 8×8화소 크기를 가지는 메크로블록 유형에 기반하여 움직임 벡터가 산출되어 활용될 수 있으며, 도 1은 16×16 화소 크기에 기반하여 움직임 벡터가 산출되는 경우를 나타낸다.
상세하게는, 제1 참조 프레임(11)으로부터 산출되는 움직임 벡터는 mv0 또는 mv0'로 표시될 수 있고, 제2 참조 프레임(12)으로부터 산출되는 움직임 벡터는 mv1 또는 mv1'로 표시될 수 있다.
그러나, 16×16 화소 크기와 같이 큰 메크로블록의 경우, 복잡도가 적은 영역이나 움직임이 적은 영역에서 결정이 되나, 이처럼 큰 메크로블록으로 결정된 부분들 중 움직임 벡터의 값이 큰 부분이 존재할 수 있고, 이러한 부분은 부호화 성능을 저하시키는 요인이 될 수 있다.
따라서, 움직임 벡터의 값이 크게 나타나는 16×16 화소 크기의 메크로블록을 보다 작은 메크로블록으로 구획하여 움직임 벡터를 산출하여 부호화 성능을 향상시킬 수 있다.
도 2는 본 발명의 실시예에 따른 인터 예측 방법을 설명하기 위한 흐름도이다.
도 2를 참조하여, 본 발명의 실시예에 따른 인터 예측 방법을 보다 상세하게 설명한다.
먼저, 메크로블록의 크기에 따른 인터 예측의 율-왜곡값(rate-distortion)을 계산하여 제1 메크로블록을 결정할 수 있다(S210).
예를 들어, 16×16, 16×8, 8×16, 8×8화소 크기 및 SKIP 모드에 따른 율-왜곡값을 계산하여 최소 비용의 모드를 선택할 수 있다. 여기서, 결정된 모드에 따라 제1 메크로블록이 결정될 수 있다.
제1 메크로블록이 미리 설정된 블록 크기의 메크로블록인지 판단할 수 있다(S220).
판단 결과, 제1 메크로블록이 상기 미리 설정된 블록 크기의 메크로블록인 경우, 제1 메크로블록의 움직임 벡터에 대한 분산값을 계산할 수 있다(S230). 여기서, 미리 설정된 블록 크기는 16×16 화소 크기일 수 있다. 즉, 제1 메크로블록이 16×16 화소 크기의 메크로블록인 경우, 제1 메크로블록의 움직임 벡터에 대한 분산값을 계산할 수 있다.
다음으로, 계산된 분산값이 미리 설정된 값 이상인지 판단할 수 있고(S230), 분산값이 미리 설정된 값 이상인 경우 제1 메크로블록을 구획한 제2 메크로블록에 기반하여 인터 예측을 수행할 수 있다(S250). 여기서, 제2 메크로블록은 제1 메크로블록을 구획한 것으로 제1 메크로블록보다 작다. 예를 들어, 제2 메크로블록은 8×8 화소 크기의 메크로블록일 수 있다.
반면에, 제1 메크로블록이 상기 미리 설정된 블록 크기의 메크로블록이 아니거나, 상기 분산값이 미리 설정된 값 미만인 경우, 제1 메크로블록에 기반하여 인터 예측을 수행할 수 있다(S260).
또한, 제1 메크로블록 및 제2 메크로블록은 P 프레임에 기반한 움직임 예측이 수행될 수 있다.
따라서, 본 발명의 실시예에 따른 인터 예측 방법은, 큰 메크로블록의 움직임 벡터에 대한 분산값이 커서 데이터의 량을 증가시키는 경우에, 큰 메크로블록을 보다 작은 메크로블록으로 구획하여 움직임 벡터를 산출함으로써, 인코딩되는 데이터의 량을 줄일 수 있다. 특히, 본 발명의 실시예에 따른 인터 예측 방법은 H.264/AVC 표준의 인터 예측을 개선시킬 수 있다.
도 3은 본 발명의 실시예에 따른 영상 부호화 장치를 설명하기 위한 블록도이다.
도 3을 참조하면, 본 발명에 따른 영상 부호화 장치(100)는 감산부(110), 변환부(120), 양자화부(130), 엔트로피 부호화부(140), 역양자화부(131), 역변환부(121), 가산부(150), 필터부(160), 메모리(170), 인트라 예측부(180) 및 인터 예측부(190)를 포함하여 구성될 수 있으며, 이는 영상 부호화 장치(100)의 일반적인 구성요소로 이를 간략히 설명한다.
감산부(110)는 제공받은 입력 영상인 부호화할 대상 영상(현재 영상)으로부터 예측부(180, 190)에 의해 생성된 예측 영상을 감산함으로써 현재 영상과 예측 영상 간의 잔차 영상(residue image)를 생성한다.
변환부(120)는 감산부(110)에 의해 생성된 잔차 영상을 공간 영역에서 주파수 영역으로 변환하는 기능을 한다. 여기서, 변환부(120)는 하다마드 변환, 이산 여현 변환(Discrete Cosine Transform) 등과 같이 공간축의 화상 신호를 주파수축으로 변환하는 기법을 이용하여 잔차 영상을 주파수 영역으로 변환할 수 있다.
양자화부(130)는 변환부(120)로부터 제공되는 변환된 데이터(주파수 계수)에 대해 양자화를 수행한다. 즉, 양자화부(130)는 변환부(120)에 의해 변환된 데이터인 주파수 계수들을 양자화 스텝사이즈(Quantization Step-Size)로 나누어 근사화하여 양자화 결과값을 산출한다.
엔트로피 부호화부(140)는 양자화부(130)에 의하여 산출된 양자화 결과값을 엔트로피 부호화함으로써 비트스트림을 생성한다. 또한, 엔트로피 부호화부(140)는 양자화부(130)에 의해 산출된 양자화 결과값을 CAVLC(Context-Adaptive Variable Length Coding) 또는 CABAC(Context-Adaptive Binary Arithmetic Coding) 기법 등을 이용하여 엔트로피 부호화할 수 있으며, 양자화 결과값 이외에 영상을 복호화하는데 필요한 정보(복호화 정보)인 참조 프레임의 색인정보, 움직임 벡터의 정보, 화면간 예측정보 등을 엔트로피 부호화할 수 있다.
역양자화부(131)는 양자화부(130)에 의해 산출된 양자화 결과값을 역양자화한다. 즉, 역양자화부(131)는 양자화 결과값으로부터 주파수 영역의 값(주파수 계수)를 복원한다.
역변환부(121)는 역양자화부(131)에 제공받은 주파수 영역의 값(주파수 계수)을 주파수 영역에서 공간 영역으로 변환함으로써 잔차 영상을 복원하고, 가산부(150)는 인터 예측부(190)에 의해 생성된 예측 영상에 역변화부(121)에 의해 복원된 잔차 영상을 가산함으로써 입력 영상의 복원 영상을 생성시켜, 이를 메모리(170)로 제공한다. 여기서 인터 예측부(190)는 화면간 예측을 수행할 수 있으며, 움직임 추정부 및 움직임 보상부를 포함하여 구성될 수 있다.
즉, 인트라 예측부(180)는 화면내 예측(Intra Prediction)을 수행하며, 인터 예측부(190)는 화면간 예측(Inter Prediction)을 위한 움직임 벡터를 보상한다.
필터부(160)는 복원된 영상에 대한 필터링을 수행하는 것으로, 디블록킹 필터(DF: Deblocking Filter)를 포함하여 구성될 수 있다.
도 4는 본 발명의 실시예에 따른 복호화 장치를 설명하기 위한 블록도이다.
본 발명에 따른 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 가산부(240), 필터부(250), 메모리(260), 인트라 예측부(270) 및 인터 예측부(280)를 포함하여 구성될 수 있으며, 이는 영상 복호화 장치(200)의 일반적인 구성요소로 이를 간략하게 설명한다. 또한, 자세한 설명은 상술한 도 3을 참조한다.
엔트로피 복호화부(210)는 도 3에 도시된 영상 부호화 장치(100)로부터 생성된 비트스트림을 엔트로피 복호화하며, 역양자화부(220)는 엔트로피 복호화부(210)로부터 전송받은 데이터를 역양자화함으로써 주파수 영역의 값(주파수 계수)으로 복원한다. 또한, 역변환부(230)는 주파수 영역의 값(주파수 계수)을 주파수 영역에서 공간영역으로 역변환한다. 가산부(240)는 인트라 예측부(270) 또는 인터 예측부(280)에 의해 생성된 예측 영상에 역변환부(230)에 의해 복원된 잔차 영상(잔여값)을 가산함으로써 현재 영상의 복원영상을 생성한다.
본 발명의 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는 인터 예측부(190, 280)를 포함하여 구성된다.
본 발명의 실시예에 따른 인터 예측부(190, 280)는 메크로블록의 크기에 따른 인터 예측의 율-왜곡값을 계산하여 제1 메크로블록을 결정하고, 제1 메크로블록이 미리 설정된 블록 크기의 메크로블록인지 판단하고, 제1 메크로블록의 움직임 벡터에 대한 분산값이 미리 설정된 값 이상인지 판단하여 인터 예측을 수행할 수 있다.
또한, 인터 예측부(190, 280)는 제1 메크로블록이 미리 설정된 블록 크기의 메크로블록인 경우, 제1 메크로블록의 움직임 벡터에 대한 분산값을 계산하고, 분산값이 미리 설정된 값 이상인 경우에는 제1 메크로블록을 구획한 제2 메크로블록에 기반하여 인터 예측을 수행할 수 있다.
여기서, 미리 설정된 블록 크기는 16×16 화소 크기일 수 있고, 제2 메크로블록은 8×8 화소 크기일 수 있으며, 제1 메크로블록 및 제2 메크로블록은 P 프레임에 기반한 움직임 예측이 수행될 수 있다.
또한, 인터 예측부(190, 280)는 제1 메크로블록이 미리 설정된 블록 크기의 메크로블록이 아니거나, 분산값이 미리 설정된 값 미만인 경우, 제1 메크로블록에 기반하여 인터 예측을 수행할 수 있다.
본 발명의 실시예에 따른 인터 예측 방법 및 장치는, 큰 메크로블록의 움직임 벡터에 대한 분산값이 커서 데이터의 량을 증가시키는 경우에, 큰 메크로블록을 보다 작은 메크로블록으로 구획하여 움직임 벡터를 산출함으로써, 인코딩되는 데이터의 량을 줄일 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
110: 감산부 120: 변환부
121, 230: 역변환부 130: 양자화부
131, 220: 역양자화부 140: 엔트로피 부호화부
150, 240: 가산부 160, 250: 필터부
170, 260: 메모리 180, 270: 인트라 예측부
190, 280: 인터 예측부 210: 엔트로피 복호화부

Claims (11)

  1. 비디오 부호화/복호화 장치에서 수행되는 방법에 있어서,
    메크로블록의 크기에 따른 인터 예측의 율-왜곡값을 계산하여 제1 메크로블록을 결정하는 단계;
    상기 제1 메크로블록이 상기 미리 설정된 블록 크기의 메크로블록인 경우, 상기 제1 메크로블록의 움직임 벡터에 대한 분산값을 계산하는 단계; 및
    상기 분산값이 미리 설정된 값 이상인 경우, 상기 제1 메크로블록을 구획한 제2 메크로블록에 기반하여 인터 예측을 수행하는 단계를 포함하는,
    비디오 부호화/복호화를 위한 인터 예측 방법.
  2. 청구항 1에 있어서,
    상기 미리 설정된 블록 크기는,
    16×16 화소 크기인 것을 특징으로 하는,
    비디오 부호화/복호화를 위한 인터 예측 방법.
  3. 청구항 1에 있어서,
    상기 제2 메크로블록은,
    8×8 화소 크기인 것을 특징으로 하는,
    비디오 부호화/복호화를 위한 인터 예측 방법.
  4. 청구항 1에 있어서,
    상기 제1 메크로블록이 상기 미리 설정된 블록 크기의 메크로블록이 아니거나, 상기 분산값이 미리 설정된 값 미만인 경우,
    상기 제1 메크로블록에 기반하여 인터 예측을 수행하는 것을 특징으로 하는,
    비디오 부호화/복호화를 위한 인터 예측 방법.
  5. 청구항 1에 있어서,
    상기 제1 메크로블록 및 상기 제2 메크로블록은,
    P 프레임에 기반한 움직임 예측이 수행되는 것을 특징으로 하는,
    비디오 부호화/복호화를 위한 인터 예측 방법.
  6. 비디오 부호화/복호화에 있어서,
    메크로블록의 크기에 따른 인터 예측의 율-왜곡값을 계산하여 제1 메크로블록을 결정하고, 상기 제1 메크로블록이 미리 설정된 블록 크기의 메크로블록인지 판단하고, 상기 제1 메크로블록의 움직임 벡터에 대한 분산값이 미리 설정된 값 이상인지 판단하여 인터 예측을 수행하는,
    인터 예측 장치.
  7. 청구항 6에 있어서,
    상기 제1 메크로블록이 상기 미리 설정된 블록 크기의 메크로블록인 경우, 상기 제1 메크로블록의 움직임 벡터에 대한 분산값을 계산하고, 상기 분산값이 미리 설정된 값 이상인 경우에는 상기 제1 메크로블록을 구획한 제2 메크로블록에 기반하여 인터 예측을 수행하는 것을 특징으로 하는,
    인터 예측 장치.
  8. 청구항 7에 있어서,
    상기 미리 설정된 블록 크기는,
    16×16 화소 크기인 것을 특징으로 하는,
    인터 예측 장치.
  9. 청구항 7에 있어서,
    상기 제2 메크로블록은,
    8×8 화소 크기인 것을 특징으로 하는,
    인터 예측 장치.
  10. 청구항 6에 있어서,
    상기 제1 메크로블록이 상기 미리 설정된 블록 크기의 메크로블록이 아니거나, 상기 분산값이 미리 설정된 값 미만인 경우,
    상기 제1 메크로블록에 기반하여 인터 예측을 수행하는 것을 특징으로 하는,
    인터 예측 장치.
  11. 청구항 7에 있어서,
    상기 제1 메크로블록 및 상기 제2 메크로블록은,
    P 프레임에 기반한 움직임 예측이 수행되는 것을 특징으로 하는,
    인터 예측 장치.
KR1020140067852A 2014-06-03 2014-06-03 비디오 부호화/복호화를 위한 인터 예측 방법 및 장치 KR20150139354A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140067852A KR20150139354A (ko) 2014-06-03 2014-06-03 비디오 부호화/복호화를 위한 인터 예측 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140067852A KR20150139354A (ko) 2014-06-03 2014-06-03 비디오 부호화/복호화를 위한 인터 예측 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20150139354A true KR20150139354A (ko) 2015-12-11

Family

ID=55020530

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140067852A KR20150139354A (ko) 2014-06-03 2014-06-03 비디오 부호화/복호화를 위한 인터 예측 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20150139354A (ko)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
김준 외 "움직임 벡터의 변화량을 이용한 인터 예측 모드 결정에 관한 연구", 반도체디스틀레이기술확회지 제13권제1호(2014년제3월) *
논문(동일출원인) *

Similar Documents

Publication Publication Date Title
KR101894971B1 (ko) 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
KR101431545B1 (ko) 영상의 부호화, 복호화 방법 및 장치
CN106170092B (zh) 用于无损编码的快速编码方法
US9955155B2 (en) Method for encoding video information and method for decoding video information, and apparatus using same
KR20070001621A (ko) 인트라 부호화 장치 및 방법
KR101530758B1 (ko) 적응적 필터링을 이용하는 인트라 예측 방법 및 장치
KR101427229B1 (ko) 적응적인 부호화 순서를 이용한 영상 부호화/복호화 장치 및 방법
KR20170072637A (ko) 영상 부호화/복호화 방법 및 그 장치
KR101943058B1 (ko) 영상 부호화/복호화 방법 및 장치
JP2008219205A (ja) 画像情報符号化装置及び画像情報符号化方法
KR101596085B1 (ko) 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법
KR101911587B1 (ko) 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법
KR101427516B1 (ko) 변환 계수의 분포에 기반한 예측 방법 및 장치
KR20140081681A (ko) 영상의 부호화 방법 및 이를 이용하는 장치
KR20130023444A (ko) 다단계 화면간 예측을 이용한 영상 부호화/복호화 장치 및 방법
KR20150081240A (ko) 무손실 비디오 부호화/복호화 방법 및 장치
JP2015027097A (ja) 動画像復号方法
KR101893946B1 (ko) 트랜스코딩 방법 및 장치
KR20150139354A (ko) 비디오 부호화/복호화를 위한 인터 예측 방법 및 장치
KR101307406B1 (ko) 참조 프레임을 압축하여 저장하는 영상 부호화/복호화 장치
KR101629999B1 (ko) 무손실 비디오 부호화/복호화 방법 및 장치
JP4926912B2 (ja) 映像符号化装置及び方法
KR101766600B1 (ko) 화면내 예측을 수행하는 부호화/복호화 장치 및 화면내 예측 부호화/복호화 방법
KR20110067648A (ko) 영상 부호화/복호화 방법 및 이를 수행하는 장치
KR101672085B1 (ko) 화면내 예측을 수행하는 부호화/복호화 장치 및 화면내 예측 부호화/복호화 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal