KR20130111061A - 이진 분할 트리를 이용한 영상 인코딩 방법 - Google Patents

이진 분할 트리를 이용한 영상 인코딩 방법 Download PDF

Info

Publication number
KR20130111061A
KR20130111061A KR20120033557A KR20120033557A KR20130111061A KR 20130111061 A KR20130111061 A KR 20130111061A KR 20120033557 A KR20120033557 A KR 20120033557A KR 20120033557 A KR20120033557 A KR 20120033557A KR 20130111061 A KR20130111061 A KR 20130111061A
Authority
KR
South Korea
Prior art keywords
value
frame
current frame
block
binary
Prior art date
Application number
KR20120033557A
Other languages
English (en)
Inventor
고은진
강현철
박상욱
박노삼
한미경
박미룡
장종현
박광로
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR20120033557A priority Critical patent/KR20130111061A/ko
Priority to US13/834,680 priority patent/US9165380B2/en
Publication of KR20130111061A publication Critical patent/KR20130111061A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/004Predictors, e.g. intraframe, interframe coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 이진 분할 트리를 이용한 영상 인코딩 방법에 관한 것으로, 참조 프레임의 이진 분할 트리를 수행하는 단계, 참조 프레임의 이진 분할 트리 결과를 기반으로 현재 프레임에서 임계치값을 초과하는 픽셀값 차이가 발생하는 블록들을 검출하는 단계 및 검출된 블록들에 대하여 현재 프레임의 이진 분할 트리를 수행하는 단계를 포함하여 구성되며, 본 발명은 프레임 전체에 대하여 블록 분할을 적용하는 것이 아니라 참조 프레임과 현재 프레임간의 픽셀값 차이에 기반한 부분 분할 방식을 제공함으로써 P 또는 B 프레임 내의 인코딩 속도를 향상시킬 수 있다.

Description

이진 분할 트리를 이용한 영상 인코딩 방법{IMAGE ENCODING METHOD USING BINARY PARTITION TREE}
본 발명은 이진 분할 트리를 이용한 영상 인코딩 방법에 관한 것으로서, 보다 상세하게는 P 또는 B 프레임 내에서 이진 분할 트리(Binary Partition Tree : BPT)에 의한 매크로블록의 가변 크기 분할을 하는 경우 프레임간 차분 픽셀값에 기반하여 인코딩을 수행하는 이진 분할 트리를 이용한 영상 인코딩 방법에 관한 것이다.
일반적으로 영상 압축 분야에서 P 또는 B 프레임을 처리함에 있어서 매크로블록(Macro Block : MB)의 크기를 나눠 처리하는 방식은 다양하다.
먼저, 매크로 블록을 분할하고 해당 매크로 블록들에 대해 프레임간 상호 예측(Inter Prediction)을 하는 경우 두 가지 작업을 수행한다.
첫 번째 작업은 매크로 블록과 픽셀값이 가장 유사한 매크로 블록을 찾아서 해당 매크로 블록과의 위치 차이를 계산하는 모션 벡터(Motion Vector)값 처리 작업이며, 두 번째 작업은 압축 대상 매크로 블록과 비교 대상 매크로 블록과의 픽셀 값 편차를 계산하는 모션 보상(Motion Compensation) 작업이다.
이러한 모션 보상(Motion Compensation) 작업은 픽셀값 편차만을 대상으로 압축하기 때문에 압축 대상 정보가 줄어들어 압축 효과를 높일 수 있는 이점이 있다.
한편, 종래에는 P 프레임에서 매크로 블록의 분할 크기를 16*16에서 시작하여 16*8, 8*16, 8*8, 4*8, 8*4, 4*4의 정형화된 크기로 분할하여 프레임간 상호 예측(Inter Prediction)을 수행하였다. 이처럼 가변 크기 방식으로 매크로 블록 분할(MB Partition)을 처리하는 경우 PSNR(Peak Signal to Noise Ratio)값을 유지하면서도 압축률이 3.4%~24.4% 가량 향상시킬 수 있었다.
하지만, 이진 분할 트리 방식에 의한 매크로 블록 가변 크기 분할에 있어서는 기준값을 구하기 위한 연산량이 많기 때문에 인코딩 속도가 떨어지는 문제점이 있다.
관련 선행기술로는 대한민국 공개특허공보 제2010-0081974 호(2010.07.16 공개, 발명의 명칭 : 비디오 신호처리 방법 및 장치)가 있다.
본 발명은 전술한 문제점을 개선하기 위해 창안된 것으로서, P 또는 B 프레임 내에서 이진 분할 트리에 의한 매크로 블록의 가변 크기 분할을 하는 경우에 해당 프레임의 PSNR을 참조 프레임의 PSNR과 일정 범위 내로 유지시키면서 인코딩 속도를 향상시킬 수 있도록 하는 이진 분할 트리를 이용한 영상 인코딩 방법을 제공하는데 그 목적이 있다.
본 발명의 일 측면에 따른 이진 분할 트리를 이용한 영상 인코딩 방법은 참조 프레임의 이진 분할 트리를 수행하는 단계; 상기 참조 프레임의 이진 분할 트리 결과를 기반으로 현재 프레임에서 임계치값을 초과하는 픽셀값 차이가 발생하는 블록들을 검출하는 단계; 및 검출된 상기 블록들에 대하여 상기 현재 프레임의 이진 분할 트리를 수행하는 단계를 포함한다.
본 발명은 상기 참조 프레임의 이진 분할 트리를 수행하는 단계 이후에, 상기 참조 프레임의 이진 분할 트리 결과를 기반으로 상기 참조 프레임의 블록 리스트를 만드는 단계를 더 포함하는 것을 특징으로 한다.
본 발명에서 상기 블록 리스트는 각 블록의 헤더 정보와 픽셀값 세트 정보를 포함하는 것을 특징으로 한다.
본 발명에서 상기 헤더 정보는 프레임 넘버, 블록 시리얼 넘버, 블록 폭, 블록 높이, 블록의 좌상단점의 X축 정보 및 블록의 좌상단점의 Y축 정보를 포함하는 것을 특징으로 한다.
본 발명에의 상기 현재 프레임에서 임계치값을 초과하는 픽셀값 차이가 발생하는 블록들을 검출하는 단계는, 상기 참조 프레임에서 상기 현재 프레임의 픽셀값을 빼서 상기 현재 프레임의 차분 픽셀값을 산출하는 단계; 상기 현재 프레임의 차분 픽셀값에서 상기 임계치값을 빼서 픽셀 처리값을 산출하는 단계; 및 상기 픽셀 처리값을 미리 설정된 특정 값과 비교하여 상기 픽셀 처리값이 상기 특정 값 이하인 블록들을 검출하는 단계를 포함하는 것을 특징으로 한다.
본 발명은 상기 현재 프레임의 이진 분할 트리를 수행하는 단계 이후에, 상기 현재 프레임의 이진 분할 트리 결과에 기반하여, 검출된 상기 블록들에 대한 신규 블록 리스트를 생성하는 단계를 더 포함하는 것을 특징으로 한다.
본 발명에서 상기 신규 블록 리스트는 기존 블록 리스트에 합해져 상기 현재 프레임의 최종 블록 리스트를 완성하도록 이루어지는 것을 특징으로 한다.
본 발명은 상기 현재 프레임의 이진 분할 트리 결과를 기반으로 상기 임계치값을 재설정하는 단계; 및 재설정된 상기 임계치값을 이용하여 상기 현재 프레임의 이진 분할 트리를 재수행하는 단계를 더 포함하는 것을 특징으로 한다.
본 발명의 상기 임계치값을 재설정하는 단계는, 상기 현재 프레임의 PSNR값과 상기 참조 프레임의 PSNR값을 비교하는 단계; 및 상기 현재 프레임의 PSNR값과 상기 참조 프레임의 PSNR값의 차이가 미리 설정된 기준범위를 벗어나면 상기 임계치값에 임계치 진폭값을 반영하여 상기 임계치값을 재설정하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 프레임 전체에 대하여 블록 분할을 적용하는 것이 아니라 참조 프레임과 현재 프레임 간의 픽셀값 차이에 기반한 부분 분할 방식을 제공함으로써 P 또는 B 프레임 내의 인코딩 속도를 향상시킬 수 있다.
또한, 본 발명에 따르면, 해당 프레임의 PSNR을 참조 프레임의 PSNR과 일정 범위 내로 유지시키면서 압축 효과를 높일 수 있다.
도 1은 영상 압축에 사용되는 이미지 시퀀스를 보인 예시도이다.
도 2는 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법을 수행하기 위한 장치의 구성을 도시한 블록도이다.
도 3은 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법에서 프레임 픽셀값 차이에 따른 프레임 처리 방법을 설명하기 위한 예시도이다.
도 4는 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법에서 프레임 처리를 수행하기 위한 데이터 구조를 보인 예시도이다.
도 5는 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법에서 프레임 처리를 위한 블록 리스트 구조와 구성을 보인 예시도이다.
도 6은 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법의 동작을 도시한 순서도이다.
이하에서는 본 발명에 따른 이진 분할 트리를 이용한 영상 인코딩 방법을 첨부된 도면들을 참조하여 상세하게 설명한다. 이러한 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명은 이진 분할 트리(Binary Partition Tree : BPT)에 의한 매크로 블록의 가변 크기 분할을 통해 인코딩 속도를 향상시킬 수 있는 영상 인코딩 방법에 관한 것이다.
도 1은 영상 압축에 사용되는 이미지 시퀀스를 보인 예시도이다.
일반적으로 압축에 사용되는 영상의 타입은 I 프레임(11), P 프레임(12), B 프레임(13)으로 구분되며, 영상 압축 기법은 I 프레임(11)에 적용되는 기법과 P 프레임(12) 및 B 프레임(13)에 적용되는 기법으로 구분할 수 있다.
I 프레임(11)은 독립적인 이미지 역할을 하며, P 프레임(12)과 B 프레임(13)의 참조 프레임(Fn -1)으로 활용된다.
P 프레임(12)은 여러 개가 연속적으로 나올 수 있으며, B 프레임(13)은 앞뒤에 존재하는 프레임들을 참조할 수 있다.
이와 같은 I,P,B 프레임(11,12,13)에 대한 특성들은 영상 압축 분야에서는 일반적인 사항이므로 그에 대한 구체적인 설명은 생략한다.
도 2는 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법을 수행하기 위한 장치의 구성을 도시한 블록도이다.
도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법을 수행하기 위한 장치는 프레임 결정부(102), 가변 크기 블록 매칭부(103), 인트라 예측 선택부(104), 인트라 예측 부(105), 이산코사인 변환부(106), 양자화부(107), 엔트로피 부호화부(108), 역양자화부(109), 역이산코사인 변환부(110), 디블럭 필터(111), 움직임 추정부(113) 및 움직임 보상부(114)를 포함한다.
먼저, 프레임 결정부(102)는 영상이 입력되면 현재 프레임(Fn)을 읽어 그 프레임 타입을 결정하여 메모리(미도시)에 저장한다.
예를 들어, 현재 프레임(Fn)은 영상 압축의 시작인 경우에 I 프레임(11)일 수 있고, 영상 압축을 이미 시작한 경우에는 P 프레임(12) 또는 B 프레임(13)일 수 있다. 이때 프레임 결정부(102)에 의해 결정되는 프레임 타입에 따라 처리 방식이 달라진다.
만약, 프레임 결정부(102)에 의해 결정된 프레임 타입이 I 프레임(11)인 경우, 가변 크기 블록 매칭부(Variable Size Block Matching : VSBM)(103)는 인트라 예측(Intra Prediction)을 하기 위해 16*16 아래 4*4 크기로 매크로 블록을 분할한다.
이후, 인트라 예측 선택부(104)가 적용 가능한 인트라 예측을 선택하면, 인트라 예측부(105)가 인트라 예측을 수행한다.
그러고 나서, 이산코사인 변환부(Discrete Cosine Transform : DCT)(106), 양자화부(Quantization)(107) 및 엔트로피 부호화부(Entropy Coding)(108)을 거쳐 압축이 수행된다.
이와 같은 일련의 과정을 통해 I 프레임(11)에 대한 압축은 완료되지만 다음 프레임의 참조 프레임(Fn-1)으로 사용하기 위해 역양자화부(109), 역이산코사인 변환부(110) 및 디블럭 필터(111)를 통해 참조 프레임(Fn-1)이 생성된다.
그리고, 프레임 결정부(102)에서 결정되는 다음 프레임의 타입이 P 프레임(12) 또는 B 프레임(13)인 경우, 움직임 추정부(Motion Estimation : ME)(113)는 해당 프레임을 참조 프레임(Fn-1)와 비교하여 움직임 차이를 계산하고, 움직임 보상부(Motion Compensation : MC)(114)에서 그 차이를 보상한다.
이후, 상술한 I 프레임(11) 처리와 동일하게 이산코사인 변환부(106), 양자화부(107) 및 엔트로피 부호화부(108)를 통해 압축이 수행된다.
도 3은 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법에서 프레임 픽셀값 차이에 따른 프레임 처리 방법을 설명하기 위한 예시도이다.
도 3의 (a)에 도시된 바와 같이, 압축 대상이 되는 P 프레임(12) 또는 B 프레임(13)이 현재 프레임(Fn)으로 입력되면, 참조 프레임(Fn -1)의 이진 분할 트리(BPT) 결과(도 3의 (b))를 기반으로 참조 프레임(Fn -1)과의 픽셀값 차이를 구하여 임계치값을 넘는 픽셀값 차이가 발생하는지 판단한다.
그리고, 도 3의 (c)에 도시된 바와 같이, 현재 프레임(Fn)의 특정 블록 영역(A)에서 임계치값을 넘는 픽셀값 차이가 발생하는 경우, 현재 프레임(Fn)의 특정 블록 영역(A)에 대한 이진 분할 트리(BPT) 결과(도 3의 (d))에 이진 분할 트리(BPT)를 재적용 한 결과를 인코딩함으로써 현재 프레임(Fn) 전체에 대해 이진 분할 트리(BPT)를 수행하는 것보다 인코딩 속도를 향상시킬 수 있다.
도 4는 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법에서 프레임 처리를 수행하기 위한 데이터 구조를 보인 예시도이다.
도 4는 도 3에서 설명한 프레임 처리를 위해 필요한 정보를 임시 저장하는 데이터 구조를 보인 것으로, 도 4에 도시된 바와 같이, 프레임 넘버(201), 임계치값(202), 임계치 진폭값(203), 차분 픽셀값이 저장되는 제1 임시 저장소(204), 차분 픽셀값에서 임계치값(202)을 뺀 결과가 저장되는 제2 임시 저장소(205)를 포함하여 구성할 수 있다.
여기서, 차분 픽셀값은 참조 프레임(Fn -1)과 현재 프레임(Fn) 간의 픽셀값 차이의 절대값을 의미하며, 차분 픽셀값에서 임계치값(202)을 뺀 결과를 '픽셀 처리값'으로 정의한다.
또한, 임계치값(202)은 참조 프레임(Fn-1)과 현재 프레임(Fn) 간의 차분 픽셀값에 대한 임계치에 해당하며, 임계치 진폭값(203)은 추후에 설정 임계치값을 재설정할 때 임계치값(202)을 증가 또는 감소시키기 위한 값에 해당한다.
이러한 임계치값(202) 및 임계치 진폭값(203)은 디폴트로 설정되어 있고, 임계치값(202)은 프레임마다 변경될 수 있다.
도 5는 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법에서 프레임 처리를 위한 블록 리스트 구조와 구성을 보인 예시도이다.
도 5에 도시된 바와 같이, 현재 프레임(Fn)이 P 프레임(12)또는 B 프레임(13)인 경우 P 프레임(12)또는 B 프레임(13)에 대해 이진 분할 트리(BPT)를 수행하여 생성되는 블록 리스트의 헤더(210)는 각 블록마다 존재하며, 헤더(210)의 구조를 살펴보면 프레임 넘버(Frame Number)(211), 블록 시리얼 넘버(Block Serial Number)(212), 블록 폭(Block Width)(213), 블록 높이(Block Height)(214), 블록의 좌상단점의 X축 정보를 담고 있는 Block X Point(215), 블록의 좌상단점의 Y축 정보를 담고 있는 Block Y Point(216) 정보를 저장하는 구조로 되어 있다.
이때, 각 블록의 개별 픽셀값 정보들은 픽셀 값 세트(220)에 저장된다.
그리고, 참조 프레임(Fn -1)의 블록 리스트(230)는 이진 분할 트리(BPT) 방식에 의해 블록이 나누어지고, 그 결과 각 블록 리스트(231)들이 목록화되어 있으며, 현재 프레임(Fn)의 블록 리스트(240)는 픽셀값 차이가 일정 수준을 넘어서기 때문에 재구성된 블록 리스트(241)들이 참조 프레임(Fn -1)의 기존 블록 리스트(231)와 합쳐서 구성된다.
도 6은 본 발명의 일 실시예에 따른 이진 분할 트리를 이용한 영상 인코딩 방법의 동작을 도시한 순서도로, 이를 참조하여 본 발명의 구체적인 동작을 설명한다.
도 6에 도시된 바와 같이, 먼저 압축 대상이 되는 현재 프레임(Fn)이 P 프레인(12) 또는 B 프레임(13)인지 확인한다(S301).
만약, 현재 프레임(Fn)이 P 프레임(12) 또는 B 프레임(13)인 경우, 임계치값(202)과 임계치 진폭값(203)을 읽어와서 임계치값(202)을 메모리(미도시)의 설정 임계치값에 복사한다(S302).
그리고, 참조 프레임(Fn -1)에 대해 이진 분할 트리(BPT) 방식에 의한 가변 크기 블록 설정 기능을 수행하고(S303), 그 수행된 결과에 기반하여 참조 프레임(Fn -1)의 블록 리스트(230)를 생성하고 이를 메모리(미도시)에 저장한다(S304).
이후, 참조 프레임(Fn -1)에서 현재 프레임(Fn)의 픽셀값을 빼서 차분 픽셀값을 산출하고, 이를 제1 임시 저장소(204)에 저장한다(S305).
그러고 나서, 제1 임시 저장소(204)에 저장된 차분 픽셀값에서 메모리(미도시)에 저장된 설정 임계치값(단계 S302에서 임계치값(202)을 복사한 값)을 빼서 픽셀 처리값을 산출하고, 이를 제2 임시 저장소(205)에 저장한다(S306).
이후, 참조 프레임(Fn -1)의 블록 리스트(230)에서 순서대로 블록 정보(헤더(210)와 픽셀값 세트(220))를 읽어온 후(S307), 그 참조 프레임(Fn -1)의 블록과 동일 위치에 해당되는 현재 프레임(Fn)에 대한 픽셀 처리값을 제2 임시 저장소(205)로부터 읽어 온다(S308).
그리고, 현재 프레임(Fn)에 대한 픽셀 처리값(차분 픽셀값에서 설정 임계치값을 뺀 값)들이 모두 '0' 이하인지 확인하여(S309), 모두 '0' 이하이면 참조 프레임(Fn -1) 블록 정보에 해당하는 현재 프레임(Fn)의 픽셀값 세트를 '-1'로 설정하고(S310), 더 읽어올 블록 정보가 있는지 확인한다(S311).
반면, 현재 프레임(Fn)에 대한 픽셀 처리값이 모두 '0' 이하가 아니면 픽셀값 세트의 설정 없이 단계 S311로 진행한다.
단계 S311에서 참조 프레임(Fn -1)의 블록 리스트(230)에서 더 읽어올 블록 정보가 있으면 참조 프레임(Fn -1)의 블록 리스트(230)에서 블록 정보를 읽어오는 단계 S307으로 회귀하여 다음 블록 정보를 읽는다.
상기와 같은 단계 S307 ~ S310을 참조 프레임(Fn -1)의 마지막 블록 정보까지 처리하여 더 이상 읽어올 블록 정보가 없으면(S311), 블록 리스트의 픽셀값 세트의 모든 값이 '-1'인 블록 리스트(즉, 픽셀 처리값이 모두 '0' 이하인 블록 리스트)만 읽어 온다(S312).
이후, 읽어온 블록 리스트만을 가지고 현재 프레임(Fn)의 이진 분할 트리(BPT)를 수행하여 신규 블록 리스트(241)를 생성한다(S313).
그리고, 신규 블록 리스트(241)들을 기존 블록 리스트(231)에 합하여 현재 프레임(Fn)의 최종 블록 리스트(240)를 완성한다(S314).
이후, 현재 프레임(Fn)에 대한 이진 분할 트리를 재수행하기 위하여 임계치값(202)을 재설정하는 과정을 수행한다.
즉, 현재 프레임(Fn)에 대한 최종 블록 리스트(240)가 완성되면, 메모리(미도시)에 복사했던 설정 임계치값과 디폴트로 설정되어 있던 임계치값(202)을 비교하여(S315), 그 값이 동일하면 이진 분할 트리가 재수행되지 않은 것으로 판단할 수 있다.
따라서, 현재 프레임(Fn)의 블록 리스트(240)를 엔트로피 코딩한 후 디코딩하여 PSNR값을 계산하고(S316), 참조 프레임(Fn -1)의 PSNR값과 현재 프레임(Fn)의 PSNR값의 차이가 기준범위(예를 들어, -0.7[dB]~0.7[dB]) 이내인지 여부를 확인한다(S317).
만약, 현재 프레임(Fn)의 PSNR값이 참조 프레임(Fn -1)의 PSNR값과의 차이가 기준범위를 벗어나는 경우, 임게치값(202)에 임계치 진폭값(203)을 반영하여 설정 임계치값을 재설정한다(S318).
구체적으로, 현재 프레임(Fn)의 PSNR값이 참조 프레임(Fn -1)의 PSNR값보다 0.7dB 이상 낮으면, 임계치값(202)에서 임계치 진폭값(203)을 줄인 값을 설정 임계치값에 복사하고, 차분 픽셀값을 산출하는 단계 S305로 회귀하여 해당 프레임에 대한 인코딩 작업을 다시 수행한다.
반면, 현재 프레임(Fn)의 PSNR값이 참조 프레임(Fn -1)의 PSNR 값보다 0.7[dB] 이상 높으면, 임계치값(202)에 임계치 진폭값(203)을 더한 값을 설정 임계치값에 복사하고, 차분 픽셀값을 산출하는 단계 S305로 회귀하여 해당 프레임에 대한 인코딩 작업을 다시 수행한다.
즉, 본 발명은 인코딩할 프레임간의 픽셀값 차이에 기반하여 매크로 블록을 이진 분할 트리 방식으로 부분 분할하여 인코딩하는 과정을 재 수행한다(S304 ~ S314).
한편, 단계 S315에서, 메모리(미도시)에 복사한 설정 임계치값이 디폴트로 설정된 임계치값(202)과 동일하지 않으면, 설정 임계치값을 이미 한번 조정한 것이기 때문에 인코딩을 종료한다.
또한, 단계 S317에서, 현재 프레임(Fn)의 PSNR값과 참조 프레임(Fn -1)의 PSNR값의 차이가 기준범위 이내이면 인코딩을 종료한다.
이와 같이 본 발명에 따르면, 프레임 전체에 대하여 블록 분할을 적용하는 것이 아니라 참조 프레임(Fn -1)과 인코딩할 현재 프레임(Fn) 간의 픽셀 차이 값에 기반한 부분 분할 방식을 제공함으로써 P 프레임(12) 또는 B 프레임(13) 내의 인코딩 속도를 향상시킬 수 있다.
또한, 본 발명에 따르면, 현재 프레임(Fn)의 PSNR을 참조 프레임(Fn-1)의 PSNR과 일정 범위 내로 유지시키면서 압축 효과를 높일 수 있다.
본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
11 : I 프레임
12 : P 프레임 13 : B 프레임
Fn : 현재 프레임 Fn -1 : 참조 프레임
102 : 프레임 결정부 103 : 가변 크기 블록 매칭부
104 : 인트라 예측 선택부 105 : 인트라 예측부
106 : 이산코사인 변환부 107 : 양자화부
108 : 엔트로피 부호화부 109 : 역양자화부
110 : 역이산코사인 변환부 111 : 디블럭 필터
113 : 움직임 예측부 114 : 움직임 보상부

Claims (9)

  1. 참조 프레임의 이진 분할 트리를 수행하는 단계;
    상기 참조 프레임의 이진 분할 트리 결과를 기반으로 현재 프레임에서 임계치값을 초과하는 픽셀값 차이가 발생하는 블록들을 검출하는 단계; 및
    검출된 상기 블록들에 대하여 상기 현재 프레임의 이진 분할 트리를 수행하는 단계를 포함하는 이진 분할 트리를 이용한 영상 인코딩 방법.
  2. 제 1항에 있어서,
    상기 참조 프레임의 이진 분할 트리를 수행하는 단계 이후에,
    상기 참조 프레임의 이진 분할 트리 결과를 기반으로 상기 참조 프레임의 블록 리스트를 생성하는 단계를 더 포함하는 것을 특징으로 하는 이진 분할 트리를 이용한 영상 인코딩 방법.
  3. 제 2항에 있어서, 상기 블록 리스트는 각 블록의 헤더 정보와 픽셀값 세트 정보를 포함하는 것을 특징으로 하는 이진 분할 트리를 이용한 영상 인코딩 방법.
  4. 제 3항에 있어서, 상기 헤더 정보는 프레임 넘버, 블록 시리얼 넘버, 블록 폭, 블록 높이, 블록의 좌상단점의 X축 정보 및 블록의 좌상단점의 Y축 정보를 포함하는 것을 특징으로 하는 이진 분할 트리를 이용한 영상 인코딩 방법.
  5. 제 1항에 있어서, 상기 현재 프레임에서 임계치값을 초과하는 픽셀값 차이가 발생하는 블록들을 검출하는 단계는,
    상기 참조 프레임의 픽셀값에서 상기 현재 프레임의 픽셀값을 빼서 상기 현재 프레임의 차분 픽셀값을 산출하는 단계;
    상기 현재 프레임의 차분 픽셀값에서 상기 임계치값을 빼서 픽셀 처리값을 산출하는 단계; 및
    상기 픽셀 처리값을 미리 설정된 특정 값과 비교하여 상기 픽셀 처리값이 상기 특정 값 이하인 블록들을 검출하는 단계를 포함하는 것을 특징으로 하는 이진 분할 트리를 이용한 영상 인코딩 방법.
  6. 제 1항에 있어서,
    상기 현재 프레임의 이진 분할 트리를 수행하는 단계 이후에,
    상기 현재 프레임의 이진 분할 트리 결과에 기반하여, 검출된 상기 블록들에 대한 신규 블록 리스트를 생성하는 단계를 더 포함하는 것을 특징으로 하는 이진 분할 트리를 이용한 영상 인코딩 방법.
  7. 제 6항에 있어서, 상기 신규 블록 리스트는 기존 블록 리스트에 합해져 상기 현재 프레임의 최종 블록 리스트를 완성하도록 이루어지는 것을 특징으로 하는 이진 분할 트리를 이용한 영상 인코딩 방법.
  8. 제 1항에 있어서,
    상기 현재 프레임의 이진 분할 트리 결과를 기반으로 상기 임계치값을 재설정하는 단계; 및
    재설정된 상기 임계치값을 이용하여 상기 현재 프레임의 이진 분할 트리를 재수행하는 단계를 더 포함하는 것을 특징으로 하는 이진 분할 트리를 이용한 영상 인코딩 방법.
  9. 제 8항에 있어서, 상기 임계치값을 재설정하는 단계는,
    상기 현재 프레임의 PSNR(Peak Signal to Noise Ratio)값과 상기 참조 프레임의 PSNR값을 비교하는 단계; 및
    상기 현재 프레임의 PSNR값과 상기 참조 프레임의 PSNR값의 차이가 미리 설정된 기준범위를 벗어나면 상기 임계치값에 임계치 진폭값을 반영하여 상기 임계치값을 재설정하는 단계를 포함하는 것을 특징으로 하는 이진 분할 트리를 이용한 영상 인코딩 방법.
KR20120033557A 2012-03-30 2012-03-30 이진 분할 트리를 이용한 영상 인코딩 방법 KR20130111061A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR20120033557A KR20130111061A (ko) 2012-03-30 2012-03-30 이진 분할 트리를 이용한 영상 인코딩 방법
US13/834,680 US9165380B2 (en) 2012-03-30 2013-03-15 Image encoding method using binary partition tree

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20120033557A KR20130111061A (ko) 2012-03-30 2012-03-30 이진 분할 트리를 이용한 영상 인코딩 방법

Publications (1)

Publication Number Publication Date
KR20130111061A true KR20130111061A (ko) 2013-10-10

Family

ID=49380180

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20120033557A KR20130111061A (ko) 2012-03-30 2012-03-30 이진 분할 트리를 이용한 영상 인코딩 방법

Country Status (2)

Country Link
US (1) US9165380B2 (ko)
KR (1) KR20130111061A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170077203A (ko) * 2014-12-10 2017-07-05 미디어텍 싱가폴 피티이. 엘티디. 2진 트리 블록 분할을 사용한 비디오 코딩 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180359494A1 (en) * 2015-12-31 2018-12-13 Mediatek Inc. Method and apparatus of prediction binary tree structure for video and image coding

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778190A (en) * 1995-07-21 1998-07-07 Intel Corporation Encoding video signals using multi-phase motion estimation
US5812788A (en) * 1995-07-21 1998-09-22 Intel Corporation Encoding/decoding video signals using quantization tables based on explicitly encoded base and scale matrices
US7296231B2 (en) * 2001-08-09 2007-11-13 Eastman Kodak Company Video structuring by probabilistic merging of video segments
KR100961760B1 (ko) 2002-08-13 2010-06-07 퀄컴 인코포레이티드 이산코사인변환 계수를 참조하는 움직임 추정 방법 및 장치
US7437697B2 (en) * 2005-12-16 2008-10-14 International Business Machines Corporation System and method of criticality prediction in statistical timing analysis
US8150155B2 (en) * 2006-02-07 2012-04-03 Qualcomm Incorporated Multi-mode region-of-interest video object segmentation
US8265349B2 (en) * 2006-02-07 2012-09-11 Qualcomm Incorporated Intra-mode region-of-interest video object segmentation
US8265392B2 (en) * 2006-02-07 2012-09-11 Qualcomm Incorporated Inter-mode region-of-interest video object segmentation
EP2191652B1 (en) 2007-09-02 2017-02-08 Lg Electronics Inc. A method and an apparatus for processing a video signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170077203A (ko) * 2014-12-10 2017-07-05 미디어텍 싱가폴 피티이. 엘티디. 2진 트리 블록 분할을 사용한 비디오 코딩 방법

Also Published As

Publication number Publication date
US20130279821A1 (en) 2013-10-24
US9165380B2 (en) 2015-10-20

Similar Documents

Publication Publication Date Title
KR101770047B1 (ko) 차세대 비디오 코팅용 콘텐츠 적응적 예측 거리 분석기 및 계층적 움직임 추정 시스템
AU2015213340B2 (en) Video decoder, video encoder, video decoding method, and video encoding method
US8023562B2 (en) Real-time video coding/decoding
US20240098289A1 (en) Method and apparatus for encoding/decoding image
CN106034235B (zh) 计算编码失真度和编码模式控制的方法及其系统
US8189667B2 (en) Moving picture encoding apparatus
US10349071B2 (en) Motion vector searching apparatus, motion vector searching method, and storage medium storing motion vector searching program
JP5613319B2 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
US10154261B2 (en) Encoder and method for video processing
JPH08102938A (ja) 画像符号化装置
CN111010578A (zh) 一种帧内帧间联合预测的方法、装置以及存储介质
US8687910B2 (en) Image filtering method using pseudo-random number filter and apparatus thereof
US9077996B2 (en) Predicted motion vectors
KR20130111061A (ko) 이진 분할 트리를 이용한 영상 인코딩 방법
KR100790757B1 (ko) H.264 동영상 부호화기의 적응적 고속 움직임 추정 방법
KR101021538B1 (ko) H.264 인코딩 시 고속 인트라 모드 결정 방법
KR20070063479A (ko) 1/4픽셀 움직임 벡터를 이용한 동영상 압축방법

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid