KR100566191B1 - H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기 - Google Patents

H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기 Download PDF

Info

Publication number
KR100566191B1
KR100566191B1 KR1020030052623A KR20030052623A KR100566191B1 KR 100566191 B1 KR100566191 B1 KR 100566191B1 KR 1020030052623 A KR1020030052623 A KR 1020030052623A KR 20030052623 A KR20030052623 A KR 20030052623A KR 100566191 B1 KR100566191 B1 KR 100566191B1
Authority
KR
South Korea
Prior art keywords
mpeg
image
image frame
component
frame
Prior art date
Application number
KR1020030052623A
Other languages
English (en)
Other versions
KR20050014141A (ko
Inventor
이현승
박지호
신대규
이승철
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020030052623A priority Critical patent/KR100566191B1/ko
Priority to US10/702,745 priority patent/US7356080B2/en
Publication of KR20050014141A publication Critical patent/KR20050014141A/ko
Application granted granted Critical
Publication of KR100566191B1 publication Critical patent/KR100566191B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

본 발명은 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기 및 그 방법에 관한 것으로서, 본 발명의 엠펙-4 부호화기는 기 설정된 엠펙-4의 양자화값에 의거하여 H.263에 의해 부호화된 이미지프레임의 직류성분을 예측하는 직류성분예측기와 H.263 복원 이미지를 엠펙-4 복원 이미지로 변환하여 저장하는 엠펙-4 복원 이미지 저장기를 포함하여 구성되고, 본 발명의 엠펙-4 부호화방법은 기 설정된 H.263 양자화값을 이용하여 프레임단위로 입력되는 원시영상데이터의 공간적 중복성을 제거하는 과정과, 기 설정된 엠펙-4 양자화값을 이용하여 공간적 중복성이 제거된 이미지프레임의 직류성분을 예측하는 과정과, 상기 과정에서 예측된 직류성분을 이용하여 상기 이미지프레임을 가변길이부호화한 후 엠펙-4 비트 스트림으로 출력하는 과정과, 상기 제1 과정에서 공간적 중복성이 제거된 이미지프레임을 엠펙-4 이미지프레임으로 복원하여 저장하는 과정과, 복원/저장된 이미지프레임과 새로 입력되는 다음프레임을 비교하여 시간적 중복성을 제거하는 과정을 포함한다.
엠펙-4, H.263, 부호화, 캠코더폰

Description

H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기{MPEG-4 ENCODER USING H.263 MULTIMEDIA CHIP}
도 1은 본 발명의 일 실시 예에 따른 엠펙(MPEG)-4 부호화기에 대한 개략적인 블록도,
도 2a 내지 도 2c는 본 발명의 일 실시 예에 따른 엠펙(MPEG)-4 부호화기의 DC 예측(prediction)을 설정하기 위한 도면,
도 3은 본 발명의 일 실시 예에 따른 엠펙(MPEG)-4 부호화기의 부호화 방법에 대한 처리 흐름도.
본 발명은 엠펙(MPEG: Motion Picture Experts Group)-4 부호화기에 관한 것으로서, 특히, H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기에 관한 것이다.
차세대 휴대폰에서는 사용자의 다양한 욕구를 충족시키기 위해 여러 가지 어플리케이션(application)을 단말기에 접목시키려는 시도가 계속되고 있다. 그러한 어플리케이션(application) 중에 사용자의 욕구가 가장 강한 것은 화상통화와 캠코더 기능이라 할 수 있다. 따라서 단말기 제조업체에서는 화상전화 및 캠코더 기능을 구현하기 위해 그에 해당하는 인터내셔널(international) 표준(standard)인 H.263 및 엠펙(MPEG)-4 부호화기를 단말기에 구현하여야 한다. 통상적으로 H.263 부호화는 화상통화용 영상(video)을 위한 것이고, 엠펙(MPEG)-4 는 동영상(예컨대, 캠코더 영상 등)을 위한 것이다.
이러한 H.263 및 엠펙(MPEG)-4 부호화기를 단말기에 구현하는 방법은 소프트웨어(S/W: software)를 이용한 방법과 하드웨어(H/W: hardware)를 이용한 방법이 모두 가능하다. 그런데, 소프트웨어(S/W)를 이용한 방법은 사용자의 요구에 부합하는 고속의 서비스를 제공하는데 한계가 있고, 하드웨어(H/W)를 이용한 방법은 하나의 멀티미디어 칩(chip)으로 H.263/MPEG-4를 동시에 구현할 경우 칩(chip)의 복잡도와 크기(size)가 증가할 뿐만 아니라 칩(chip) 단가가 상승한다는 단점이 있다.
따라서, 통상적으로 단말기 제조업체에서는 상기 소프트웨어(S/W)와 하드웨어(H/W)를 병용하여 단말기에 H.263/MPEG-4를 구현한다. 예를 들어, 단말기 제조업체에서는 화상통화용으로 사용되는 H.263은 하드웨어(H/W)로 구현하고, MPEG-4는 소프트웨어(S/W)로 구현한다.
그런데 MPEG-4 부호화기에서 이산코사인변환(DCT: Discrete Cosine Transform)과 모션추정(motion estimation)/모션보상(motion compensation)을 처리하기 위한 부하(load)가 상대적으로 크기 때문에 MPEG-4 부호화기를 소프트웨어(software)로 구현할 경우 영상을 코딩하는 속도가 상당히 저하된다는 단점이 있다.
본 발명은 이러한 종래의 문제점을 보완하기 위해 안출된 것으로서, 본 발명의 제1 목적은 동영상 저장을 위한 캠코더-폰의 성능을 향상시키기 위한 MPEG-4 부호화기 및 그 방법을 제공함에 있다.
본 발명의 제2 목적은 캠코더-폰의 엔코딩 속도를 향상시키기 위한 MPEG-4 부호화기 및 그 방법을 제공함에 있다.
본 발명의 제3 목적은 별도의 하드웨어 블록(hardware block)을 추가하지 않고 기존의 하드웨어 블록(hardware block)을 이용함으로써 제조단가의 상승 없이 구현이 가능한 MPEG-4 부호화기를 제공함에 있다.
본 발명의 제4 목적은 H.263 멀티미디어 칩을 이용한 MPEG-4 부호화기 및 그 방법을 제공함에 있다.
상기 목적들을 달성하기 위해 본 발명에서 제공하는 MPEG-4 부호화기는 프레임단위로 입력되는 원시영상데이터를 이산코사인 변환하는 이산코사인 변환기와, 상기 이산코사인 변환된 이미지프레임을 H.263 멀티미디어 칩의 양자화값으로 양자화하는 양자화기와, 기 설정된 엠펙-4의 양자화값으로 상기 양자화된 이미지프레임의 직류성분을 예측하는 직류성분예측기와, 상기 직류성분예측기의 결과값에 의거 하여 상기 이미지프레임을 가변길이부호화한 후 엠펙-4 비트 스트림을 출력하는 가변길이부호화기와, 상기 양자화된 이미지프레임을 H.263 멀티미디어 칩의 양자화값을 이용하여 역양자화하는 역양자화기와, 상기 역양자화된 이미지프레임을 역이산코사인변환하는 역이산코사인변환기와, 상기 역이산코사인변환기에서 출력되는 H.263 복원 이미지를 저장하는 H.263 복원 이미지 저장기와, 상기 H.263 복원 이미지를 엠펙-4 복원 이미지로 변환하여 저장하는 엠펙-4 복원 이미지 저장기와, 새로 입력되는 다음 이미지프레임과 상기 엠펙-4 복원 이미지 저장기에 저장된 엠펙-4 이미지를 비교하여 시간적 중복성을 제거하는 모션보상부를 포함하는 것을 특징으로 한다.
또한, 상기 목적들을 달성하기 위해 본 발명에서 제공하는 MPEG-4 부호화방법은 기 설정된 H.263 양자화값을 이용하여 프레임단위로 입력되는 원시영상데이터의 공간적 중복성을 제거하는 제1 과정과, 기 설정된 엠펙-4 양자화값을 이용하여 상기 제1 과정에서 공간적 중복성이 제거된 이미지프레임의 직류성분을 예측하는 제2 과정과, 상기 제2 과정에서 예측된 직류성분을 이용하여 상기 이미지프레임을 가변길이부호화한 후 엠펙-4 비트 스트림으로 출력하는 제3 과정과, 상기 제1 과정에서 공간적 중복성이 제거된 이미지프레임을 복원하여 저장하는 제4 과정과, 상기 제4 과정에서 복원된 이미지프레임을 엠펙-4 프레임으로 변환하여 저장하는 제5 과정과, 상기 제5 과정에서 저장된 이미지프레임과 새로 입력되는 다음프레임을 비교하여 시간적 중복성을 제거하는 제6 과정을 포함하는 것을 특징으로 한다.
이하 본 발명의 바람직한 실시 예들을 첨부한 도면을 참조하여 상세히 설명 한다. 이 때, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
도 1은 본 발명의 일 실시 예에 따른 엠펙(MPEG)-4 부호화기에 대한 개략적인 블록도이다. 도 1을 참조하면, 본 발명의 일 실시 예에 따른 MPEG-4 부호화기는 이산코사인변환기(DCT: Discrete Cosine Transfer)(115)와, 양자화기(Q: Quantizer)(120), 역양자화기(IQ: Inverse Quantizer)(135), 역이산코사인변환기(IDCT: Inverse Discrete Cosine Transfer)(140), DC 예측기(210)를 포함한다.
이러한 MPEG-4 부호화기는 프레임 단위로 입력되는 영상데이터의 맨 첫 프레임을 인트라(intra)형식으로 부호화하고, 그 부호화결과를 이용하여 두 번째 프레임부터는 인터(inter)형식으로 부호화한다. 이를 위해 MPEG-4 부호화기는 인트라모드 및 인터모드로 동작하며, 모드변경스위치(180, 185)를 포함한다. 모드변경스위치(180, 185)는 MPEG-4 부호화기의 동작모드 제어 정보를 저장하는 소정 메모리(qp_mem)(175)에서 출력되는 제어신호에 의해 MPEG-4 부호화기의 동작모드를 변경한다.
상기와 같은 구성을 갖는 본 발명의 MPEG-4 부호화기 각 부의 동작을 살펴보면 다음과 같다.
먼저, 이산코사인변환기(DCT)(115)는 프레임단위로 입력되는 원시영상데이터를 이산코사인 변환한다. 프레임단위로 입력되는 원시영상데이터를 임시 저장하는 메모리(current memory)(110)로부터 이미지프레임을 전달받아 이산코사인변환한다. 이산코사인변환과정을 거치게 되면 0-255 사이의 값들이 골고루 퍼져있는 공간영역상의 영상데이터는 매우 큰 절대값을 가지는 직류(DC: Direct Current) 주파수 계수와 그 보다 고주파로 갈수록 값이 급격히 작아지는 교류(AC: Alternating Current) 주파수 계수로 분리된다.
양자화기(Q)(120)는 이산코사인 변환된 이미지프레임을 H.263 멀티미디어 칩의 양자화값으로 양자화한다. 즉, 이산코사인변환기(DCT)(115)를 통해 이산코사인변환되어 이산 코사인변환계수들로 이루어진 프레임은 H.263 멀티미디어 칩의 양자화값에 의해 나눗셈이 이루어져서 보다 작은 값과 많은 수의 '0'값으로 변화되는 양자화과정을 거치게 된다. 이와 같이 양자화된 이미지프레임은 '0'과 '0이 아닌 계수'가 확실하게 분리된다.
이와 같이 이미지프레임이 이산코사인변환 및 양자화과정을 거치게 되면 그 프레임 내에 포함된 공간적 중복성이 제거된다.
양자화기(Q)(120)에서 양자화된 신호는 임시메모리(dctq_mem)(125)에 임시저장되었다가 직류성분예측기(DC predictor)(210)로 전달되고, 직류성분예측기(DC predictor)(210)는 기 설정된 MPEG-4의 양자화값(DC_scaler)을 이용하여 상기 양자화된 이미지프레임의 직류성분을 예측한다. 직류성분예측기(DC predictor)(210)에서 이미지프레임의 직류성분을 예측하는 과정은 도 2a 내지 도 2c를 참조하여 상세히 설명될 것이다.
한편, 상기 직류성분을 예측하기 위해 참조되는 MPEG-4의 양자화값(DC_scaler)은 표 1에 예시된 바와 같다.
엠펙-4를 위한 양자화값
Component type DC_scaler for quantiser_scale range
1 ~ 4 5 ~ 8 9 ~ 24 25 =<
Luminance 8 2*quantiser_scale quantiser_scale+8 2*quantiser_scale-16
Chrominance 8 (quantiser_scale+13)/2 quantiser_scale-6
가변길이부호화기(VLC: Variable Length Coder)(130)는 직류성분예측기(210)의 결과값에 의거하여 상기 이미지프레임을 가변길이부호화(variable length coding)한 후 MPEG-4 비트 스트림을 출력한다. 본 발명의 MPEG-4 부호화기가 인트라모드로 동작할 때 가변길이부호화기(VLC)(130)는 인트라프레임을 출력하고 인터모드로 동작할 때 가변길이부호화기(VLC)(130)는 인터프레임을 출력한다.
한편, 역양자화기(IQ)(135)는 상기 양자화된 이미지프레임을 양자화기(Q)(120)로부터 전달받아 그 이미지프레임을 역양자화한다. 역양자화기(IQ)(135)에서 이미지프레임을 역양자화할 때는 소정의 양자화값이 필요한데, 그 양자화값은 양자화기(Q)(120)의 양자화값과 동일한 값을 사용한다.
역이산코사인변환기(140)는 역양자화된 이미지프레임을 역이산코사인변환한다.
이와 같이 양자화기(Q)(120)에서 출력된 신호가 역양자화기(IQ)(135) 및 역이산코산인변환기(IDCT)(140)를 거치게 되면 다시 공간영역의 영상데이터로 복원된다.
H.263 복원 이미지 저장기(145)는 상기 공간영역의 영상데이터로 복원된 데이터를 저장한다. 즉, H.263 복원 이미지 저장기(145)는 역이산코사인변환기(IDCT)(140)에서 출력되는 H.263 복원 이미지(H.263 reconstructed image)를 저장한다.
MPEG-4 복원 이미지 저장기(220)는 H.263 복원 이미지 저장기(145)에 저장된 상기 H.263 복원 이미지를 엠펙-4 복원 이미지로 변환하여 저장한다. 이 때, MPEG-4 복원 이미지 저장기(220)는 기 설정된 H.263 직류성분계수(DCh263)와 H.263 양자화값(Qh263)의 곱에서 엠펙-4 직류성분계수(DCmpeg4)와 엠펙-4 양자화값(Qmpeg4 )의 곱을 뺀값을 이미지변환상수(A)로 산출하고, 그 이미지변환상수(A)를 이용하여 상기 H.263 복원 이미지(RECONh263)를 엠펙-4 복원 이미지(RECONmpeg4)로 변환한다. MPEG-4 복원 이미지 저장기(220)에서 H.263 복원 이미지를 엠펙-4 복원 이미지로 변환하는 방법을 수학식 1에 예시하였다.
Figure 112003028175460-pat00001
수학식 1을 참조하면 엠펙-4 복원 이미지(RECONmpeg4)는 H.263 복원 이미지(RECONh263)에서 이미지변환상수(A)를 뺀 값이다.
MPEG-4 복원 이미지 저장기(220)에 저장된 MPEG-4 복원 이미지(RECONmpeg4)는 다시 SDRAM(Synchronous Dynamic Random Access Memory)(150)를 거쳐 모션추정부(ME: Motion Estimator)(160)로 전달되고, 모션추정부(ME)(160)는 그 MPEG-4 복원 이미지(RECONmpeg4)와 새로 입력되는 다음 프레임의 비교결과에 의해 모션을 추정한다.
모션보상부(MC: Motion Compensator)(155)는 모션추정부(ME)(160)의 결과값에 의해 해당 프레임의 모션을 보상하여 SDRAM(165)에 저장한다. SDRAM(165)에 저장된 모션보상결과는 MPEG-4 복호화기가 인터모드로 동작할 경우 소정의 메모리(Mced memory)(170)를 거쳐 다음 프레임의 공간 및 시간적 중복성을 제거하기 위한 참조 프레임으로 활용된다.
도 2a 내지 도 2c는 본 발명의 일 실시 예에 따른 엠펙(MPEG)-4 부호화기의 DC 예측(prediction) 과정을 설정하기 위한 도면이다.
도 2a 및 도 2b는 99개의 MB(Micro Block)을 갖는 QCIF(Quarter Common Intermediate Format) 이미지의 구성 예를 도시하고 있다. 특히, 도 2b는 99개의 MB들 중 임의의 한 MB(도 2a의 'A')의 구성 예를 도시하고 있다. 이 때, QCIF 이미지는 화상회의 시스템에서 사용되는 비데오(Video) 형식으로서, 도 1의 양자화기(120)에서 출력되는 이미지 프레임은 QCIF 이미지 형식을 갖는다.
도 2b를 참조하면 MB들 각각에는 6개의 8*8 블록이 존재하며 이들 6개의 블록은 4개의 휘도(luminance) 블록(DQ[0], DQ[1], DQ[2], DQ[3])과 2개의 색채(chrominance) 블록(DQ[4], DQ[5])을 포함한다. 6개의 블록 각각에서 빗금친 영역은 DCT 도메인의 DC 성분을 가리킨다.
도 2c는 QCIF 이미지에 대한 DC 예측(prediction)값을 저장하기 위한 배열 구조를 나타낸다.
상기와 같이 6개의 8*8 블록을 포함하는 99개의 MB로 구성된 QCIF 이미지에 대한 DC 예측값 저장을 위해 도 1의 DC 예측기(210)는 99개의 저장영역을 갖는 6개의 배열을 포함한다. 이들 6개의 배열들은 99개의 MB 블록 각각에 포함된 4개의 휘도(luminance) 블록의 DC 예측값을 저장하기 위한 배열들(luminance 0 ~ luminance 3)과 2개의 색채(chrominance) 블록의 DC 예측값을 저장하기 위한 배열들(cr, cb)로 구성된다. 도 2c의 예에서는 1*99 의 1차원 배열 6개에 대한 예를 보여주고 있지만, 상기 배열들은 6*99의 2차원 배열로 구성하는 것도 가능하다.
이러한 구성을 갖는 DC 예측기(210)에서 이미지 프레임에 대한 DC를 예측하는 방법은 MPEG-4 표준을 따른다.
도 3은 본 발명의 일 실시 예에 따른 엠펙(MPEG)-4 부호화기의 부호화 방법에 대한 처리 흐름도이다. 도 3을 참조하면 본 발명의 일 실시 예에 따른 MPEG-4 부호화기의 부호화 방법은 다음과 같다.
먼저 외부로부터 프레임단위의 영상데이터가 입력되면(S202) MPEG-4 부호화기는 첫 번째 프레임을 선택한다(S204). 그리고 그 이미지프레임의 공간적 중복성을 제거하는 과정을 수행한다. 즉, 상기 선택된 이미지 프레임을 이산코산인변환한 후(S206) 이산코사인변환된 이미지 프레임을 양자화한다(S208).
상기 과정(S206, S208)에서 이미지 프레임의 공간적 중복성을 제거하였으면 그 이미지 프레임의 DC 성분을 예측(prediction)한 후(S210) 그 DC 성분을 이용하 여 상기 이미지 프레임에 대한 가변길이부호화(VLC)를 수행한다(S212). 그리고 그 결과로 생성된 MPEG-4 비트-스트림(bit-stream)을 출력한다(S214). 이 때 상기 과정(S210)은 기 설정된 MPEG-4 양자화값을 이용하여 상기 공간적 중복성이 제거된 이미지프레임의 직류성분을 예측한다.
이 때 첫 번째 이미지 프레임에 대하여 출력된 MPEG-4 비트-스트림은 인트라 스트림이다.
그리고 이후로 입력되는 프레임들에 대한 시간적 중복성을 제거하기 위해 공간적 중복성이 제거된 이미지 프레임을 복원한다. 즉, 상기 과정(S208)에서 양자화된 이미지프레임을 역양자화한 후(S216) 역이산코사인변환한다(S218). 그리고 그 복원된 이미지를 저장한다(S220).
이 때, 복원된 이미지는 H.263 형식을 따르므로 상기 복원된 이미지를 변환하여 저장한다(S222). 즉, 상기 과정(S220)에서 공간영역의 영상데이터로 복원되어 저장된 이미지 프레임을 MPEG-4 형태로 변환하여 저장한다.
그리고 상기 과정(S222)에서 저장된 이미지프레임과 새로 입력되는 다음프레임을 비교하여 모션 보상을 수행한 후(S224) 그 모션 보상된 이미지프레임을 저장한다(S226). 이 때 상기 모션 보상(motion compensation) 과정은 모션 추정(motion estimation)과정을 포함한다.
그리고, 다음 프레임이 입력되면 상기 과정(S226)에서 저장된 이미지 프레임과 다음 프레임의 차분데이터를 생성한 후(S232) 상기 차분데이터를 이용하여 MPEG-4 부호화과정(S206 내지 S226)을 수행한다. 결과적으로 첫 번째 프레임 이후 로 입력되는 이미지 프레임은 이전 이미지 프레임과의 차에 의해 시간적 중복성이 제거된 후 공간적 중복성을 제거하는 과정을 거치게 된다.
이 때, 상기 각 과정들(S206 내지 S226)에 대한 구체적인 설명은 도 1에 대한 설명시 언급되었으므로 생략하였다.
상술한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시할 수 있다. 따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위와 특허청구범위의 균등한 것에 의해 정해 져야 한다.
상기와 같은 본 발명은 기존의 H.263 멀티미디어 칩을 이용하여 MPEG-4 부호화기 및 그 방법을 구현함으로써 제조단가의 상승 없이 MPEG-4 부호화가 가능해진다는 장점이 있다. 또한, 본 발명은 MPEG-4 부호화를 하드웨어에 의해 구현함으로써 동영상 저장을 위한 캠코더-폰의 엔코딩(encoding) 속도를 향상시킬 수 있는 장점이 있다. 구체적으로 본 발명은 기존의 H.263 용 멀티미디어 칩을 이용한 캠코더-폰과 같이 소프트웨어(software)로 MPEG-4 부호화를 구현한 경우와 비교하여 MPEG-4 엔코딩 속도가 2배 이상 빠르다는 효과가 있다. 결과적으로 캠코더-폰의 성능을 향상시킬 수 있는 장점이 있다.

Claims (6)

  1. 기 설정된 H.263 양자화값을 이용하여 프레임단위로 입력되는 원시영상데이터의 공간적 중복성을 제거하는 제1 과정과,
    기 설정된 엠펙-4 양자화값을 이용하여 상기 제1 과정에서 공간적 중복성이 제거된 이미지프레임의 직류성분을 예측하는 제2 과정과,
    상기 제2 과정에서 예측된 직류성분을 이용하여 상기 이미지프레임을 가변길이부호화한 후 엠펙-4 비트 스트림으로 출력하는 제3 과정과,
    상기 제1 과정에서 공간적 중복성이 제거된 이미지프레임을 복원하여 저장하는 제4 과정과,
    상기 제4 과정에서 복원된 이미지프레임을 엠펙-4 프레임으로 변환하여 저장하는 제5 과정과,
    상기 제5 과정에서 저장된 이미지프레임과 새로 입력되는 다음프레임을 비교하여 시간적 중복성을 제거하는 제6 과정을 포함하는 것을 특징으로 하는 엠펙-4 부호화방법.
  2. 제1항에 있어서, 상기 제1 과정은
    기 설정된 H.263 양자화값을 이용하여 상기 제6 과정에서 시간적 중복성이 제거된 이미지프레임의 공간적 중복성을 제거하는 것을 특징으로 하는 엠펙-4 부호 화방법.
  3. H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기에 있어서,
    프레임단위로 입력되는 원시영상데이터를 이산코사인 변환하는 이산코사인 변환기와,
    상기 이산코사인 변환된 이미지프레임을 H.263 멀티미디어 칩의 양자화값으로 양자화하는 양자화기와,
    기 설정된 엠펙-4의 양자화값으로 상기 양자화된 이미지프레임의 직류성분을 예측하는 직류성분예측기와,
    상기 직류성분예측기의 결과값에 의거하여 상기 이미지프레임을 가변길이부호화한 후 엠펙-4 비트 스트림을 출력하는 가변길이부호화기와,
    상기 양자화된 이미지프레임을 H.263 멀티미디어 칩의 양자화값을 이용하여 역양자화하는 역양자화기와,
    상기 역양자화된 이미지프레임을 역이산코사인변환하는 역이산코사인변환기와,
    상기 역이산코사인변환기에서 출력되는 H.263 복원 이미지를 저장하는 H.263 복원 이미지 저장기와,
    상기 H.263 복원 이미지를 엠펙-4 복원 이미지로 변환하여 저장하는 엠펙-4 복원 이미지 저장기와,
    새로 입력되는 다음 이미지프레임과 상기 엠펙-4 복원 이미지 저장기에 저장된 엠펙-4 이미지를 비교하여 시간적 중복성을 제거하는 모션보상부를 포함하는 것을 특징으로 하는 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기.
  4. 제3항에 있어서, 상기 직류성분예측기는
    l개의 휘도 블록과 m개의 색채 블록을 포함하는 n개의 마이크로 블록으로 구성된 이미지프레임의 직류성분을 예측하여 저장하되, 상기 휘도블록들 및 색채블록들 각각의 직류성분을 별도로 저장하기 위해 n개의 저장영역을 갖는 1차원 배열 l+m개를 포함하는 것을 특징으로 하는 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기.
  5. 제3항에 있어서, 상기 직류성분예측기는
    l개의 휘도 블록과 m개의 색채 블록을 포함하는 n개의 마이크로 블록으로 구성된 이미지프레임의 직류성분을 예측하여 저장하되, 상기 휘도블록들 및 색채블록들 각각의 직류성분을 별도로 저장하기 위해 (l+m)*n의 2차원 배열을 포함하는 것을 특징으로 하는 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기.
  6. 제3항에 있어서, 상기 엠펙-4 복원 이미지 저장기는
    기 설정된 H.263 직류성분계수와 H.263 양자화 값의 곱에서 엠펙-4 직류성분계수와 엠펙-4 양자화 값의 곱을 뺀 값을 이미지변환상수로 산출하고, 그 이미지변환상수를 이용하여 상기 H.263 복원 이미지를 엠펙-4 복원 이미지로 변환하는 것을 특징으로 하는 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기.
KR1020030052623A 2003-07-30 2003-07-30 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기 KR100566191B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020030052623A KR100566191B1 (ko) 2003-07-30 2003-07-30 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기
US10/702,745 US7356080B2 (en) 2003-07-30 2003-11-06 MPEG-4 encoder using H.263 multimedia chip

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030052623A KR100566191B1 (ko) 2003-07-30 2003-07-30 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기

Publications (2)

Publication Number Publication Date
KR20050014141A KR20050014141A (ko) 2005-02-07
KR100566191B1 true KR100566191B1 (ko) 2006-03-29

Family

ID=34101778

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030052623A KR100566191B1 (ko) 2003-07-30 2003-07-30 H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기

Country Status (2)

Country Link
US (1) US7356080B2 (ko)
KR (1) KR100566191B1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7860005B2 (en) * 2004-01-30 2010-12-28 Hewlett-Packard Development Company, L.P. Methods and systems that use information about a frame of video data to make a decision about sending the frame
US8737219B2 (en) * 2004-01-30 2014-05-27 Hewlett-Packard Development Company, L.P. Methods and systems that use information about data packets to determine an order for sending the data packets
US8059902B2 (en) * 2006-10-31 2011-11-15 Ntt Docomo, Inc. Spatial sparsity induced temporal prediction for video compression
CN102047612A (zh) * 2008-03-24 2011-05-04 惠普开发有限公司 基于图像的远程访问系统
US8558862B2 (en) * 2009-09-28 2013-10-15 Lifesize Communications, Inc. Videoconferencing using a precoded bitstream
US8754922B2 (en) * 2009-09-28 2014-06-17 Lifesize Communications, Inc. Supporting multiple videoconferencing streams in a videoconference
US8885701B2 (en) * 2010-09-08 2014-11-11 Samsung Electronics Co., Ltd. Low complexity transform coding using adaptive DCT/DST for intra-prediction
CN102740079B (zh) * 2012-07-12 2014-10-01 北方工业大学 基于hevc标准率失真优化的质量可伸缩编码

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2650472B2 (ja) * 1990-07-30 1997-09-03 松下電器産業株式会社 ディジタル信号記録装置およびディジタル信号記録方法
KR100487988B1 (ko) * 1997-10-23 2005-05-09 미쓰비시덴키 가부시키가이샤 부호화 비트 스트림 변환 장치
US6343098B1 (en) * 1998-02-26 2002-01-29 Lucent Technologies Inc. Efficient rate control for multi-resolution video encoding
KR100281967B1 (ko) * 1998-08-31 2001-02-15 전주범 공간 상관성을 이용한 영상 부호화 장치 및 그 방법
JP2000209580A (ja) * 1999-01-13 2000-07-28 Canon Inc 画像処理装置およびその方法
JP2001078188A (ja) * 1999-09-01 2001-03-23 Casio Comput Co Ltd 画像圧縮符号化装置、及び記憶媒体
US6498816B1 (en) * 1999-09-03 2002-12-24 Equator Technologies, Inc. Circuit and method for formatting each of a series of encoded video images into respective regions
EP1124379A3 (en) * 2000-02-09 2011-08-17 Canon Kabushiki Kaisha Method and apparatus for inhibiting reproduction of parts of a recording
JP4607305B2 (ja) * 2000-09-27 2011-01-05 株式会社東芝 映像符号化装置及び映像符号化方法
US20040057521A1 (en) * 2002-07-17 2004-03-25 Macchina Pty Ltd. Method and apparatus for transcoding between hybrid video CODEC bitstreams

Also Published As

Publication number Publication date
KR20050014141A (ko) 2005-02-07
US20050025373A1 (en) 2005-02-03
US7356080B2 (en) 2008-04-08

Similar Documents

Publication Publication Date Title
KR100563756B1 (ko) 디지탈 신호 변환 방법 및 디지탈 신호 변환 장치
EP1571850A2 (en) Apparatus and method for encoding and decoding image containing grayscale alpha channel image
Lee et al. A new frame recompression algorithm integrated with H. 264 video compression
Su et al. Efficient MPEG-2 to H. 264/AVC intra transcoding in transform-domain
KR20040054776A (ko) 고레벨 화소-그리드 모션 보상을 사용하여 복잡성을감소시키기 위한 디코딩
Jung et al. Fast mode decision using all-zero block detection for fidelity and spatial scalable video coding
US7502415B2 (en) Range reduction
JPH06189290A (ja) 1d/2d dctを用いた映像信号符号化装置
de Queiroz et al. Fringe benefits of the H. 264/AVC
KR100566191B1 (ko) H.263 멀티미디어 칩을 이용한 엠펙-4 부호화기
Lee et al. Quantization/DCT conversion scheme for DCT-domain MPEG-2 to H. 264/AVC transcoding
Li et al. A fast downsizing video transcoder based on H. 264/AVC standard
KR101562343B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
Kleihorst et al. DCT-domain embedded memory compression for hybrid video coders
KR100497760B1 (ko) 이동통신 단말기용 동영상 부호화 시스템 및 방법
KR100626651B1 (ko) 선택적인 미세입자 스케일러블 코딩 장치 및 그 방법
Halbach et al. SNR scalability by transform coefficient refinement for block-based video coding
JP4140163B2 (ja) 符号化方式変換装置
KR101810198B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
Ezhilarasan et al. A hybrid transformation technique for advanced video coding
KR0178225B1 (ko) 영상기기의 부호화장치
Koumaras et al. Principles of Digital Video Coding
KR101700411B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
Tamanna Transcoding H. 265/HEVC
Liu et al. Coding mode analysis of MPEG-2 to H. 264/AVC transcoding for digital TV applications

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130227

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140227

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee