KR100744435B1 - 고속 동영상 압축을 위한 dct 및 양자화 과정 생략 방법 - Google Patents

고속 동영상 압축을 위한 dct 및 양자화 과정 생략 방법 Download PDF

Info

Publication number
KR100744435B1
KR100744435B1 KR1020060016783A KR20060016783A KR100744435B1 KR 100744435 B1 KR100744435 B1 KR 100744435B1 KR 1020060016783 A KR1020060016783 A KR 1020060016783A KR 20060016783 A KR20060016783 A KR 20060016783A KR 100744435 B1 KR100744435 B1 KR 100744435B1
Authority
KR
South Korea
Prior art keywords
dct
quantization
integer
maximum
dct coefficient
Prior art date
Application number
KR1020060016783A
Other languages
English (en)
Inventor
송원선
홍민철
이승호
Original Assignee
(주)씨앤에스 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)씨앤에스 테크놀로지 filed Critical (주)씨앤에스 테크놀로지
Priority to KR1020060016783A priority Critical patent/KR100744435B1/ko
Application granted granted Critical
Publication of KR100744435B1 publication Critical patent/KR100744435B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 DCT 및 양자화 과정 생략을 통해 계산량을 감소시킬 수 있는 고속 동영상 압축을 위한 개선된 DCT 및 양자화 과정 생략 방법에 관한 것으로, DCT 계수들의 이론적 분석을 통하여 모든 DCT 계수값들이 '0'으로 양자화되는 보다 더 정확한 충분조건을 유도함으로써 DCT 및 양자화 과정 생략을 통해 계산량을 감소시킬 수 있도록 하며, 본 발명에 따르면 모든 DCT 계수값들이 '0'으로 양자화되는 충분조건은
Figure 112006012630350-pat00001
가 된다.
DCT, 양자화, 변환 계수, 계산량, H.264, 생략

Description

고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법 {An Improved Early Detection of all-zero DCT Coefficients for Fast Video Encoding}
도 1은 H.264 부호화기의 구조를 보여주는 블록도이다.
도 2는 본 발명에서 제안하고 있는 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법의 전체 흐름도이다.
본 발명은 H.264 동영상 표준 부호화 방식(이하, H.264라고 약칭함)에 관한 것으로, 특히 DCT 및 양자화 과정 생략을 통해 계산량을 감소시킬 수 있는 고속 동영상 압축을 위한 개선된 DCT 및 양자화 과정 생략 방법에 관한 것이다.
H.264는 MPEG-4 Part 10 (AVC)라고도 불리우며, ITU-T & ISO/IEC Joint Video Team에서 승인된 국제 동영상 압축 표준으로 뛰어난 압축 효율과 에러에 강하고 네트워크 적응성이 뛰어나다는 장점을 지니고 있다.
최신의 동영상 압축 표준인 H.264는 정수형 DCT(Discrete Cosine Transform), 변환 블록 크기의 움직임 추정 및 보상(variable block size motion estimation and compensation), 양자화(quantization), 엔트로피 부호화 등으로 구 성되어 있다. 이 중에서 움직임 추정 및 보상, DCT/IDCT은 실제 구현시 많은 계산량과 부가적인 메모리가 요구되는 것으로 알려져 있다. 특히, MPEG-4에 대하여 2배의 압축 성능을 지니는 H.264에서는 보다 많은 계산량이 사용된다.
현재 고속 동영상 압축을 위하여 DCT 및 양자화 과정에서의 계산량 감소에 관한 많은 연구가 진행되고 있다. 일반적인 동영상 압축 부호화기에서는 예측 오차 블록의 DCT 계수들 모두가 '0'으로 양자화될 때의 특정 상태를 나타내는 신호만을 복호화기로 전송한다. 이것은 각 계수값 대신에 특정 부호만을 전송하기 때문에 압축 효율을 보다 향상시킬 수 있는 장점을 제공한다. 그러나, 이러한 특정 상태는 DCT 및 양자화 과정을 거친 후에야 비로소 판정할 수 있다. 따라서, DCT 및 양자화 과정 이전에 미리 이러한 상태를 예측할 수 있다면 불필요한 DCT 및 양자화 과정은 생략될 수 있으므로 이에 따른 많은 계산량과 부가적인 메모리를 줄일 수 있다.
이에 관한 연구들에는 Zhou Xuan 등의 "Method for detecting all-zero DCT coefficients ahead of discrete cosine transformation and quantisation", Electronics Letters, Vol.34, No.19, pp.1839-1840, Sept. 1998; L.A Sousa의 "General method for eliminating redundant computations in video coding", Electronics Letters, Vol.36, No.4, pp.306-307, Feb. 2000; Shi Jun 등의 " Efficient method for early detection of all-zero DCT confficients", Electronics Letters, Vol.37, No.3, pp.160-161, Feb. 2001; 문용호의 " 고속 비디오 코딩을 위한 효율적인 DCT 계산 방식" 한국 통신 학회 논문지, Vol.27, No.9A, pp.908-915, Sept. 2002 등이 있다.
본 발명은 상기한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 DCT 계수들의 이론적 분석을 통하여 모든 DCT 계수값들이 '0'으로 양자화되는 보다 더 정확한 충분조건을 유도함으로써 고속 부호화가 가능한 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법을 제공하는 것이다.
상기한 목적을 달성하기 위한 본 발명의 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법은, H.264에서의 동영상 부호화 방법에 있어서, 정수 변환된 최대 DCT 계수값(
Figure 112006012630350-pat00002
)를 탐색하는 단계와; 상기 정수 변환된 최대 DCT 계수값(
Figure 112006012630350-pat00003
)이 소정의 임계값 보다 작은 경우에는 DCT 및 양자화 과정을 생략하는 단계를 포함하는 것을 특징으로 한다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대해 상세히 설명한다.
먼저, H.264의 부호화기 전체 구조 중에서 정수 변환, 양자화, 정수 역변환, 역양자화의 구조에 대하여 기술하고 DCT 계수들의 이론적 분석을 통하여 모든 DCT 계수값들이 '0'으로 양자화되는 보다 더 정확한 충분조건을 유도하는 과정에 대해 기술한다.
도 1은 H.264 부호화기의 구조를 보여주는 블록도로서, 입력된 영상 데이터의 각각의 매크로블록(Macroblock)은 인트라모드(Intra Mode)와 인터모드(Inter Mode)로 부호화 되어진다. 인트라모드는 입력된 영상 데이터로부터 구성되어지며, 인터모드는 재구성된 기준 영상(Reference Frame)을 이용하여 움직임 추정(ME)과 움직임 보정 (MC)에 의하여 구성되어진다. 각 모드에 의해 생성된 값과 입력된 영상 데이터와의 차로 생성된 레지듀얼(Residual) 매크로블록은 정수 변환과 양자화를 거쳐 양자화된 변환 계수로 변환되며 엔트로피 코딩(Entropy Coding)을 거치게 된다. 그와 동시에 생성된 양자화된 변환 계수는 다시 역양자화와 정수 역변환을 거치고 인트라모드 또는 인터모드로 형성된 값과 더하여진 후 필터를 거쳐 기준 영상으로 사용된다. 이러한 부호화 과정 중에서 도 1에 점선으로 표시된 부분이 본 발명과 관련된 정수 변환, 양자화, 역양자화, 정수 역변환 구조이다.
H.264는 MPEG-1, MPEG-2, MPEG-4, H.261, H.263과 같은 기존의 다른 표준 부호화 방식과는 서로 상이한 구조를 가지는데, 최소 4x4 단위까지 움직임 보상의 수행이 가능하고, 움직임 보상을 하는데 사용하는 참조 프레임으로 다수의 참조 프레임을 사용하여 예측 부호화할 수 있고, 1/2화소 단위였던 움직임 벡터가 1/4화소 단위의 움직임 벡터로 정밀도가 높아졌으며, 정수형 변환에 의하여 DCT가 정수 단위로 수행되어 기존의 DCT 변환, 역변환시 발생하는 부동소수점 단위의 오류가 제거되었다는 주된 특징을 갖는다. 참고로, 표 1은 H.264와 MPEG-4 Part 2의 주요 특징을 서로 비교해 본 것이다.
Figure 112006012630350-pat00004
본 발명에서는 DCT 및 양자화 과정 후 변환 과정을 거친 계수 값들이 모두 '0'이 되는 조건을 이용해 두 과정을 생략하여 계산량을 효과적으로 절감 시킬 수 있도록 한다.
기존의 DCT 및 양자화 과정을 이용한 계산량 절감은 다음과 같은 식을 이용하여 DCT 계수 값들이 '0'으로 양자화되는 충분 조건을 이론적으로 유도할 수 있다.
Figure 112006012630350-pat00005
(1)
Figure 112006012630350-pat00006
(2)
위의 식 (1)과 (2)에서,
Figure 112006012630350-pat00007
는 각각 DCT 계수, 원 화소 값, 그리고 양자화 매개변수를 나타내며, 괄호 안의
Figure 112006012630350-pat00008
는 각 방향에 대한 화소의 위치를 나타낸다.
위의 식 (2)와 같은 기존의 동영상 부호화 방식들과 유사한 형태로 H.264의 변환 과정과 양자화 과정은 식 (3)과 같은 매트릭스 형태의 수식으로 표현할 수 있다.
Figure 112006012630350-pat00009
(3)
위의 식 (3)에서,
Figure 112006012630350-pat00010
는 양자화 된 계수를 나타내고,
Figure 112006012630350-pat00011
는 H.264의 정수 변환만을 거친 계수이며,
Figure 112006012630350-pat00012
은 H.264 동영상 표준 부호화 방식에서의 실제 양자화 값으로, 기존의 양자화 파라미터(QP)는 H.264에서 색인(index)으로만 사용된다. PF는 포스트 스케일링 요소(post scaling factor)를 나타낸다. 4x4 블록 화소의 각 위치에 따른 PF는 다음과 같은 표 2로 나타내어질 수 있다.
Figure 112006012630350-pat00013
위의 식 (3)에서,
Figure 112006012630350-pat00014
은 H.264의 참조 모델(reference model)에서 곱셈과 우측 이동연산(right shift)을 이용해 나눗셈 연산을 피하고 정수 보정을 위하여 MF(multiplication factor)라는 요소를 이용해 다음과 같은 식 (4)로 표현하였다.
Figure 112006012630350-pat00015
(4)
정수 보정을 위한 요소들, MF는 각 화소의 위치에 따라 다음의 표 3과 같이 표현할 수 있다.
Figure 112006012630350-pat00016
따라서, H.264의 변환 및 양자화 과정으로부터 4x4 크기의 블록이 양자화 과정까지의 수행 후 '0'이 되기 위한 조건은 식 (2)를 이용하여 다음의 식 (5)와 같은 형태로 나타낼 수 있다.
Figure 112006012630350-pat00017
(5)
위의 식 (5)에서,
Figure 112006012630350-pat00018
는 4x4 크기의 블록이 변환 및 양자화된 계수이다.
또한, 위의 식 (3)과 식 (4)로부터
Figure 112006012630350-pat00019
에 의한 임계치를 유도할 수 있다.
Figure 112006012630350-pat00020
(6)
Figure 112006012630350-pat00021
(7)
위의 식 (7)을 식 (5)에 대입하여 블록이 '0'이기 위한 조건은 다음과 같은 식 (8)으로 나타낼 수 있다.
Figure 112006012630350-pat00022
(8)
마지막으로, 식 (8)에 식 (7)을 대입하여 정리하면, 다음과 같은 임계치로 유도하여 정리할 수 있다.
Figure 112006012630350-pat00023
(9)
위의 식 (9)는 모든 DCT 계수값들이 '0'으로 양자화되는 충분조건이 된다. 식 (9)의 충분조건을 이용하여 H.264의 정수 변환된 최대 계수값이 우변의 임계치보다 작은 경우에는 그 블록이 '0'이 되므로 실제 변환 과정과 양자화 과정을 거치지 않고 바로 부호화 되며, 우변의 임계치보다 큰 경우에는 변환 과정과 양자화 과정 모두 수행하게 된다.
도 2는 본 발명에서 제안하고 있는 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법의 전체 흐름도이다.
도 2를 참조하면, 정수 변환된 최대 DCT 계수값(
Figure 112006012630350-pat00024
)를 탐색하고(S100), 정수 변환된 최대 DCT 계수값(
Figure 112006012630350-pat00025
)이 위의 식들에 의해 결정된 임계치에 따라서 조건이 만족하는지 판단한다(S110). 만약 조건을 만족하는 경우에는 DCT, 양자화, 역양자화, IDCT 과정을 수행하지 않고 곧바로 엔트로피 부호화 과정을 수행하게 된다(S120 및 S140). 이와 반대로, 임계치 조건에 만족하지 않는 경우에는 기존의 동영상 압축 방식을 모두 수행하게 된다(S130 및 S140).
지금까지 본 발명에 따른 구체적인 실시예에 관하여 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서는 여러 가지 변형이 가능함은 물론이다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며, 후술하는 특허 청구의 범위뿐 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허 청구 범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
이상에서 기술된 바와 같이 본 발명은 H.264 동영상 표준 부호화 방식이 사용되는 디지털 영상기기에서 고속 부호화가 가능토록 고안된 기법으로, 특히 저비트율 또는 고속처리가 요망되는 압축 부호화에 적용될 수 있다.

Claims (2)

  1. H.264에서의 동영상 부호화 방법에 있어서,
    정수 변환된 최대 DCT 계수값(
    Figure 112006012630350-pat00026
    )를 탐색하는 단계와;
    상기 정수 변환된 최대 DCT 계수값(
    Figure 112006012630350-pat00027
    )이 소정의 임계값 보다 작은 경우에는 DCT 및 양자화 과정을 생략하는 단계를 포함하는 것을 특징으로 하는 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법.
  2. 청구항 1에 있어서,
    모든 DCT 계수값들이 '0'으로 양자화되는 충분조건은,
    Figure 112006012630350-pat00028
    이며, 여기서
    Figure 112006012630350-pat00029
    는 H.264의 정수 변환만을 거친 계수이고,
    Figure 112006012630350-pat00030
    은 H.264에서의 실제 양자화 값이고, PF는 포스트 스케일링 요소이고, MF는 정수 보정을 위한 요소이며,
    Figure 112006012630350-pat00031
    인 것을 특징으로 하는 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법.
KR1020060016783A 2006-02-21 2006-02-21 고속 동영상 압축을 위한 dct 및 양자화 과정 생략 방법 KR100744435B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060016783A KR100744435B1 (ko) 2006-02-21 2006-02-21 고속 동영상 압축을 위한 dct 및 양자화 과정 생략 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060016783A KR100744435B1 (ko) 2006-02-21 2006-02-21 고속 동영상 압축을 위한 dct 및 양자화 과정 생략 방법

Publications (1)

Publication Number Publication Date
KR100744435B1 true KR100744435B1 (ko) 2007-08-01

Family

ID=38601416

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060016783A KR100744435B1 (ko) 2006-02-21 2006-02-21 고속 동영상 압축을 위한 dct 및 양자화 과정 생략 방법

Country Status (1)

Country Link
KR (1) KR100744435B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9497465B2 (en) 2012-06-29 2016-11-15 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US9787998B2 (en) 2014-07-22 2017-10-10 Samsung Electronics Co., Ltd. Video encoding circuit and video encoding method using the same, and operation processing device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001078188A (ja) 1999-09-01 2001-03-23 Casio Comput Co Ltd 画像圧縮符号化装置、及び記憶媒体
JP2004336157A (ja) 2003-04-30 2004-11-25 Fujitsu Ltd 画像伸張プログラム、画像伸張方法および画像伸張装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001078188A (ja) 1999-09-01 2001-03-23 Casio Comput Co Ltd 画像圧縮符号化装置、及び記憶媒体
JP2004336157A (ja) 2003-04-30 2004-11-25 Fujitsu Ltd 画像伸張プログラム、画像伸張方法および画像伸張装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11399182B2 (en) 2012-06-29 2022-07-26 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US11399183B2 (en) 2012-06-29 2022-07-26 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US11399185B2 (en) 2012-06-29 2022-07-26 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US11399184B2 (en) 2012-06-29 2022-07-26 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US9723311B2 (en) 2012-06-29 2017-08-01 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US9497465B2 (en) 2012-06-29 2016-11-15 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US10341661B2 (en) 2012-06-29 2019-07-02 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US10827177B2 (en) 2012-06-29 2020-11-03 Electronics And Telecommuncations Research Institute Method and device for encoding/decoding images
US12010312B2 (en) 2012-06-29 2024-06-11 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US9635363B2 (en) 2012-06-29 2017-04-25 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US9641845B2 (en) 2012-06-29 2017-05-02 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US11399186B2 (en) 2012-06-29 2022-07-26 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US11399181B2 (en) 2012-06-29 2022-07-26 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US9628799B2 (en) 2012-06-29 2017-04-18 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US11595655B2 (en) 2012-06-29 2023-02-28 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US11765356B2 (en) 2012-06-29 2023-09-19 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US11770534B2 (en) 2012-06-29 2023-09-26 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images
US9787998B2 (en) 2014-07-22 2017-10-10 Samsung Electronics Co., Ltd. Video encoding circuit and video encoding method using the same, and operation processing device

Similar Documents

Publication Publication Date Title
KR101365575B1 (ko) 인터 예측 부호화, 복호화 방법 및 장치
CN101543074B (zh) 去块滤波装置和方法
EP1983759A1 (en) Estimation of separable adaptive interpolation filters for hybrid video coding
KR100853931B1 (ko) 동화상 부호화 장치 및 기록 매체
WO2011121894A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
CN101589624A (zh) 图像再编码设备、图像再编码方法以及图像编码程序
KR20090095012A (ko) 연속적인 움직임 추정을 이용한 영상 부호화, 복호화 방법및 장치
US20120008686A1 (en) Motion compensation using vector quantized interpolation filters
US8150171B2 (en) Apparatus for and method of decoding moving picture, and computer product
JP2011229145A (ja) 符号化ユニットにおける動画符号化においてハイブリッド多仮説予測を行う方法、および関連装置
TWI468018B (zh) 使用向量量化解區塊過濾器之視訊編碼
KR20090087767A (ko) 영상의 인트라 예측 부호화 방법
US20070133689A1 (en) Low-cost motion estimation apparatus and method thereof
JP2004215275A (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
CN102210150A (zh) 运动图像编码装置以及运动图像解码装置
KR100744435B1 (ko) 고속 동영상 압축을 위한 dct 및 양자화 과정 생략 방법
US7991048B2 (en) Device and method for double-pass encoding of a video data stream
JP5180887B2 (ja) 符号化装置およびその方法
JP2009284058A (ja) 動画像符号化装置
KR100599935B1 (ko) 정화소 탐색시의 사드값 및 확률 변수에 기반한 고속의반화소 탐색 방법
JP3804764B2 (ja) 動き補償予測特異値展開符号化装置
JP4642033B2 (ja) 参照フレームの数を固定する符号化方式で画像の参照ブロックを取得する方法
US20060181650A1 (en) Encoding method and device
JP4361665B2 (ja) 動画像符号化データのトランスコーディング方法およびトランスコーディング装置
JP4561701B2 (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130620

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140701

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150701

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160701

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170703

Year of fee payment: 11