KR100713400B1 - 평균 히스토그램 오차 방식을 이용한 h.263/mpeg비디오 인코더 및 그 제어 방법 - Google Patents

평균 히스토그램 오차 방식을 이용한 h.263/mpeg비디오 인코더 및 그 제어 방법 Download PDF

Info

Publication number
KR100713400B1
KR100713400B1 KR1020040030563A KR20040030563A KR100713400B1 KR 100713400 B1 KR100713400 B1 KR 100713400B1 KR 1020040030563 A KR1020040030563 A KR 1020040030563A KR 20040030563 A KR20040030563 A KR 20040030563A KR 100713400 B1 KR100713400 B1 KR 100713400B1
Authority
KR
South Korea
Prior art keywords
image
mode
value
video
input
Prior art date
Application number
KR1020040030563A
Other languages
English (en)
Other versions
KR20050105550A (ko
Inventor
이현승
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020040030563A priority Critical patent/KR100713400B1/ko
Priority to US11/056,414 priority patent/US20050243917A1/en
Priority to EP05006647A priority patent/EP1592257A1/en
Priority to CNB2005100684350A priority patent/CN100442852C/zh
Publication of KR20050105550A publication Critical patent/KR20050105550A/ko
Application granted granted Critical
Publication of KR100713400B1 publication Critical patent/KR100713400B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01GHORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
    • A01G13/00Protecting plants
    • A01G13/02Protective coverings for plants; Coverings for the ground; Devices for laying-out or removing coverings
    • A01G13/0256Ground coverings
    • A01G13/0281Protective ground coverings for individual plants, e.g. for plants in pots
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01GHORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
    • A01G13/00Protecting plants
    • A01G13/02Protective coverings for plants; Coverings for the ground; Devices for laying-out or removing coverings
    • A01G13/0237Devices for protecting a specific part of a plant, e.g. roots, trunk or fruits
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01GHORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
    • A01G17/00Cultivation of hops, vines, fruit trees, or like trees
    • A01G17/005Cultivation methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Abstract

본 발명은 평균 히스토그램을 오차 방식을 이용한 H.263/MPEG 비디오 인코더 및 그의 방법에 관한 것이다. 이를 위해 본 발명은 입력 영상(N-1)을 이산 코사인 변환(DCT)하고 이를 양자화(Q)하여 비디오 스트림으로 출력하고, 상기 양자화된 신호에 대해 역양자화(IQ) 및 역 이산 코사인 변환(IDCT)을 통해 디코딩하여 다음 입력 영상(N)의 인코딩을 위한 기준 영상을 구성하는 H.263/MPEG 비디오 인코더에 있어서, 상기 다음 영상(N)이 상기 인코더에 입력되어 시간적 중복성 제거 시 상기 입력된 다음 영상(N)과 상기 기준 영상을 비교하여 상기 다음 영상(N)이 상기 기준 영상으로부터 이미지 변화가 큰 영상일 경우에는 상기 움직임 예측/보상을 수행하지 않기 위한 제 1모드를 선택하는 모드 선택부를 더 구비함을 특징으로 한다.
H.263/MPEG, 인코더, ME/MC.

Description

평균 히스토그램 오차 방식을 이용한 H.263/MPEG 비디오 인코더 및 그 제어 방법{H.263/MPEG VIDEO ENCODER FOR CONTROLLING USING AVERAGE HISTOGRAM DIFFERENCE FORMULA AND ITS CONTROL METHOD}
도 1 은 일반적인 H.263/MPEG 비디오 인코더의 일 실시예 구성도,
도 2 는 일반적인 H.263/MPEG 비디오 인코더의 첫 번째 영상 입력 시 인코딩과정을 도시하는 동작 흐름도,
도 3은 일반적인 H.263/MPEG 비디오 인코더의 영상 입력시 인코딩 과정을 도시하는 동작 흐름도,
도 4 는 본 발명에 따른 평균 히스토그램 오차 방식을 이용한 H.263/MPEG 비디오 인코더의 일 실시예 구성도,
도 5는 본 발명에 따른 평균 히스토그램 오차 방식을 이용한 H.263/MPEG 비디오 인코더의 입력되는 영상에 대한 인코딩 과정을 도시하는 동작 흐름도.
본 발명은 이동통신 단말기에 있어서 멀티미디어 데이터 서비스에 관한 것이다. 특히, 본 발명은 평균 히스토그램을 오차 방식을 이용한 H.263/MPEG 비디오 인코더 및 그의 방법에 관한 것이다.
2세대 무선망에서는 좁은 대역폭의 한계 때문에 음성서비스에 한정적이었던 휴대전화가 IMT-2000 기술이 본격적으로 추진됨에 따라 동영상서비스를 소비자에게 제공하는 것이 가능하게 되었다. 또한, 1차원적인 음성정보와는 다른 시각적인 정보를 얻고자 하는 소비자들의 욕구 또한 커지고 있어 휴대전화에서 동영상을 구현하는 기술은 소비자에게 만족할 만한 정보를 제공할 수 있다. 하지만, 기존의 기술로서 처리하던 데이터의 몇 배에 해당하는 방대한 양의 영상 데이터를 실시간에 고속으로 전송하는 기술은 많은 제약이 따르기 때문에 현재 다양한 연구가 이루어지고 있는 실정이다. 실시간 동영상의 전송을 위해서는 고속으로, 최대한으로 원본의 영상을 압축, 전송하여 복원하는 기술이 필수라 하겠다. 이와 같은 실시간 동영상 전송 기술이 적용되는 이동통신 단말기에서는 고정 비트율로 통신을 할 수 있도록 비디오 인코더에서 비트율을 제어하고 있다. 현재 3GPP(3rd Generation Partnership Project)나 국내 이동통신 사업자들의 경우 동영상 인코더로서 H.263과 MPEG(Motion Pcture Ecperts Group) 4를 사용하도록 표준안을 세워 놓고 권고하고 있다. 이들 표준 비디오 인코더의 압축 원리는 이산코사인변환과 움직임 예측에 기초하고 있기 때문에 영상의 특성에 따라 압축률이 달라지는데, 이에 따른 기민한 비트율 제어 기술은 구현이 매우 어렵다. 따라서, 표준 스펙에는 양자화 단계값의 변화를 통해 영상의 압축률을 제어할 수 있도록 하는 방안을 권고하고 있다. 이때 동영상을 압축하는 기술의 핵심은 공간적 중복성과 시간 중복성을 제거하여 영상을 압축하는 것인데 전자를 위한 압축형식을 I-mode 그리고 후자를 위한 압축형식을 P-mode 이라 불린다.
도 1 은 일반적인 H.263/MPEG 비디오 인코더의 일실시예 구성도이다.
도 1 에 도시된 바와 같이, 일반적인 H.263/MPEG 비디오 인코더는 프레임 단위의 영상 정보를 입력받아 이를 저장하는 원본 저장부(100), 원본 저장부(100)로부터의 영상 정보를 첫 프레임은 바로 DCT부(Discrete Cosine Transform)(104)로 전달하고 나머지 프레임인 경우는 움직임 보상된 정보와의 연산을 통해 DCT부(104)로 전달하고, 이산 코사인 변환을 수행하는 DCT부(104), DCT부(104)의 출력을 양자화하는 양자화부(Q)(106), 양자화된 데이터를 역양자화하는 역양자화부(IQ)(112), 역양자화부(112)의 출력을 역 이산 코사인 변환하는 IDCT부(114), 이전 프레임(n-1)의 움직임 보상된 정보와 IDCT부(114)를 통한 디코딩된 당 프레임(n)의 디코딩 정보를 결합하고, 다음 프레임(n)을 위한 디코딩 정보를 저장하는 기준 프레임 생성부(Reference frame)(116), 기준 프레임 생성부(116)에 저장된 이전 프레임(n-1)의 디코딩 정보와 당 프레임(n)의 원본 영상을 입력받아 움직임 예측을 위한 움직임 벡터와 디퍼렌셜 이미지를 출력하는 움직임 예측부(ME : Motion Compensation)(118), 기준 프레임 생성부(116)에 저장된 이전 프레임(n-1)의 디코딩 정보에 움직임 예측부(118)의 출력을 받아 움직임을 보상하는 움직임 보상부(MC : Motion Compensation)(120), 한 프레임의 인코딩을 마친 뒤, 프레임 당 할당된 비트량을 초과한 경우, 초과량의 비율만큼 원래 계획된 인코딩 시간을 증가시키고, 만약 할당량에 미치지 못 했을 경우, 다음 프레임에서 사용되도록 제어하기 위한 프레임 레이트 제어부(110), 자주 나오는 값을 작은 비트로 할당하고 가끔 나오는 값일수록 큰 비트로 할당하도록 하는 엔트로피 코딩을 위한 VLC부 (variable length coding)(108)를 포함한다.
도 2 는 일반적인 H.263/MPEG 비디오 인코더의 첫 번째 영상 입력 시 인코딩과정을 도시하는 동작 흐름도이다.
첫 번째 영상이 부호화기에 입력되면 I-프레임에 대한 인코딩이 수행된다. 즉, 200단계에서 입력된 영상 프레임은 DCT(104)에서 1 마이크로 블록당 8*8 이산 코사인 변환(DCT)을 수행한다. 이후 202단계에서 양자화부(106)를 통해 양자화를 수행한 후 VLC(108)을 통해 비트 스트림을 생성한다. 또한, 202단계에서 204단계와 206단계로 진행하면, 이산 코사인 변환되고, 양자화 된 이미지 프레임은 역양자화부((112)와 IDCT(114)를 통해 208단계에서 다음 입력되는 영상 이미지의 인코딩을 위해 기준 프레임을 구성한다.
도 3은 일반적인 H.263/MPEG 비디오 인코더의 영상 입력시 인코딩 과정을 도시하는 동작 흐름도이다.
상기한 도 2의 흐름도와 같이 다음 입력되는 영상 이미지의 인코딩을 위해 기준 프레임을 구성된 후, 300단계에서 대기상태를 유지하다가 302단계에서 다음 영상 이미지가 입력되면 304단계로 진행한다.
304단계에서 현재 이미지와 기준 이미지 사이에 움직임 추정을 수행한다. 이 후 306단계에서 SAD (sum of absolute difference) 값을 계산 후 308단계에서 SAD 값이 미리 정해진 임계값보다 큰 경우에는 310단계로 진행하여 I-모드로 설정되고, SAD 값이 임계값보다 적은 경우에는 312단계로 진행하여 P-모드로 설정된다.
다음영상이 부호화기에 입력되면 P-프레임에 대한 인코딩이 수행된다. 즉, 움직임 예측부(118)와 움직임 보상부(120)를 통해 예상 이미지(Predicted Image)를 생성한 후 입력영상과 예측영상과의 차이를 인코딩 한다. 그런데, 이때 모든 영역이 그 차분을 인코딩하는 것이 아니라, 모드 선택단계를 통해 시간적 중복성을 제거하는 P-모드 또는 공간적 중복성을 제거하는 I-모드로 코딩을 수행할지를 결정하는 것이다. 이와 같은 모드 선택 단계에서 움직임 보상을 수행한 경우가 움직임 보상을 수행하지 않은 경우보다 예상 에러가 미리 설정된 값보다 작으면 P-모드로 선택되고, 예상 에러가 미리 설정된 값보다 크면 I-모드로 선택된다.
즉, 이와 같은 비디오 코딩 표준(video coding standard)에서 부호화기의 구조는 첫번째 영상이 입력 시에는 1 마이크로 블록(MB : macro block) 당 8x8 DCT (104) 와 양자화부(106)를 통해 양자화(Quantization) 을 수행한 결과를 VLC(108) 인코딩을 통해 부호화된 비트 스트림(encoded bitstream)을 생성한다. 그리고, 양자화된 결과는 역양자와부와 IDCT(114)를 통해 공간적인 범위의 기준 이미지를 복원한다. 또한, 다음 영상이 입력 시 현재 이미지와 기준 이미지 사이에 움직임 추정 (ME) 을 수행하고, SAD (sum of absolute difference) 값을 계산 후에 설정된 임계치(threshold) 값 보다 크면 움직임 예측을 수행하지 않는 마이크로 블록, 즉 I-mode로 설정하고, 임계치보다 적으면 움직임 예측(ME)과 움직임 보상(MC)을 수행 하는 P-mode으로 설정하여 부호화를 실행한다. 즉, 시간적 중복성을 제거 시에 모드 선택(mode selection)단계에서 P-mode or I-mode 가 결정되어 I-mode 에 해당하는 MB 에 대해서는 입력 영상에 대한 DCT 가 계산되지만, P-mode 에 해당하는 영상 이미지 블록(MB)에 대해서는 입력 영상과 예측된 영상과의 차이가 부호화가 된다.
상기에서 설명한 바와 같이 기존의 MPEG-4/H.263 인코더에서는 시간적 중복성을 제거 시에 모든 영상 이미지 블록(MB) 영역에 대해서 움직임 예측(ME)/움직임 보상(MC)을 수행한다. 그런데, 실제로 인코딩 시 모든 영상 이미지 블록이 P-mode 로 코딩되는 것이 아니라, 모드 선택 단계에서 움직임 예측(ME)/움직임 보상(MC)을 수행한 결과가 움직임 예측(ME)/움직임 보상(MC)을 수행하지 않았을 때 보다 이득이 크지 않다고 판단되면 공간적 중복성을 제거하기 위한 I-모드로 코딩된다. 이와 같은 I-모드로 코딩되는 영역에 대해서도 움직임 예측(ME)/움직임 보상(MC)을 수행하는 것은 성능의 낭비를 가져올 수 있다.
즉, 최악의 경우에는 입력되는 영상 이미지 블록(MB) 영역에 대해 움직임 예측(ME)/움직임 보상(MC)을 수행한 후 영상 이미지 블록의 모드가 모두 I-모드로 될 수 있다. 이 경우에는 결과적으로는 움직임 예측(ME)/움직임 보상(MC)을 수행할 필요가 없는 경우임에도 불구하고 불필요한 움직임 예측(ME)/움직임 보상(MC)과정을 수행하게 된다.
상기한 바와 같이 일반적인 기존의 MPEG-4/H.263 인코더에서 입력되는 영상 이미지 인코딩 시 I-모드와 P-모드에 관계없이 모든 영상 이미지 블록(MB) 영역에 대하여 움직임 예측(ME)을 수행하는 구조를 가지고 있어 로드가 많이 걸리는 문제점이 있었다.
따라서, 본 발명의 목적은 MPEG-4/H.263 인코더에서 입력되는 영상 이미지 영역에 대하여 움직임 예측(ME)/움직임 보상(MC)과정 수행 전에 평균 히스토그램 오차 방식을 이용하여 미리 코딩할 모드를 선택할 수 있는 부호화기 및 그의 방법을 제공함에 있다.
본 발명의 다른 목적은 MPEG-4/H.263 인코더에서 입력되는 모든 영상 이미지 영역에 대해 움직임 예측(ME)/움직임 보상(MC)을 수행할 필요가 없이 변화가 작은 영역에 대해서만 움직임 예측(ME)/움직임 보상(MC)을 수행하도록 하여 전체적인 인코더의 성능을 높이기 위한 부호화기 및 그의 방법을 제공함에 있다.
본 발명의 또 다른 목적은 MPEG-4/H.263 인코더에서 입력되는 모든 영상 이미지 영역 중 변화가 큰 영역에 대해서는 I-모드로 코딩하고, 변화가 작은 영역에 대해서는 움직임 예측(ME)/움직임 보상(MC)을 수행하는 P-모드로 코딩하기 위한 부호화기 및 그의 방법을 제공함에 있다.
상기의 목적들을 달성하기 위한 본 발명은 입력 영상(N-1)을 이산 코사인 변환(DCT)하고 이를 양자화(Q)하여 비디오 스트림으로 출력하고, 상기 양자화된 신호에 대해 역양자화(IQ) 및 역 이산 코사인 변환(IDCT)을 통해 디코딩하여 다음 입력 영상(N)의 인코딩을 위한 기준 영상을 구성하는 H.263/MPEG 비디오 인코더에 있어서, 상기 다음 영상(N)이 상기 인코더에 입력되어 시간적 중복성 제거 시 상기 입력된 다음 영상(N)과 상기 기준 영상을 비교하여 상기 다음 영상(N)이 상기 기준 영상으로부터 이미지 변화가 큰 영상일 경우에는 상기 움직임 예측/보상을 수행하지 않기 위한 제 1모드를 선택하는 모드 선택부를 포함한다.
본 발명은 입력 영상(N-1)을 이산 코사인 변환(DCT)하고 이를 양자화(Q)하여 비디오 스트림으로 출력하고, 상기 양자화된 신호에 대해 역양자화(IQ) 및 역 이산 코사인 변환(IDCT)을 통해 디코딩하여 다음 입력 영상(N)의 인코딩을 위한 기준 영상을 구성하는 H.263/MPEG 비디오 인코더에 있어서의 부호화 제어방법에 있어서, 상기 다음 영상(N)이 입력되면, 상기 기준 영상과의 평균 히스토그램 오차값을 계산하는 과정과, 상기 계산된 평균 히스토그램 오차값이 미리 정해진 기준값 이상인지를 검사하는 과정과, 상기 계산된 평균 히스토그램 오차값이 상기 기준값보다 큰 경우에는 변화가 큰 영역임을 판단하여 움직임 예측/움직임 보상을 수행하지 않은 제 1모드를 선택하고, 상기 계산된 평균 히스토그램 오차값이 상기 기준치값보다 작은 경우에는 변화가 작은 영역임을 판단하여 움직임 예측(ME)/움직임 보상(MC)을 수행하기 위한 제 2모드를 선택하는 과정을 포함한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일 실시 예를 상세히 설명한다. 도면에서 동일한 구성요소들에 대해서는 비록 다른 도면에 표시되더라도 가능한 한 동일한 참조번호 및 부호로 나타내고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명은 생략한다.
본 발명은 기존의 부호화기의 구조에서 모든 영역에 대하여 움직임 예측을 수행한 후 공간적 중복성을 제거하기 위한 I-모드로 코딩할 것인지, 시간적 중복성을 제거하기 위한 P-모드로 코딩할 것인지를 결정하기 때문에 움직임 예측(ME)/움직임 보상(MC)이 필요없는 영역에 대하여서도 움직임 예측(ME)을 수행하므로 인해 발생하는 로드를 없애기 위한 것이다.
그러면, 먼저 도 4를 참조하여 MPEG-4/H.263 인코더에서 입력되는 모든 영상 이미지 영역에 대해 움직임 예측(ME)/움직임 보상(MC)을 수행할 필요가 없이 변화가 작은 영역에 대해서만 움직임 예측(ME)/움직임 보상(MC)을 수행하기 위한 인코더 구조에 대하여 설명하도록 한다. 도 4 는 본 발명에 따른 평균 히스토그램 오차 방식을 이용한 H.263/MPEG 비디오 인코더의 일 실시예 구성도이다.
도 4에 도시된 바와 같이, 본 발명에 따른 H.263/MPEG 비디오 인코더는 프레임 단위의 영상 정보를 입력받아 이를 저장하는 원본 저장부(400), 원본 저장부(400)로부터의 영상 정보를 첫 프레임은 바로 DCT부(Discrete Cosine Transform)(404)로 전달하고 나머지 프레임인 경우는 움직임 보상된 정보와의 연산을 통해 DCT부(404)로 전달하고, 이산 코사인 변환을 수행하는 DCT부(404), DCT부(404)의 출력을 양자화하는 양자화부(Q)(406), 양자화된 데이터를 역양자화하는 역양자화부(IQ)(412), 역양자화부(412)의 출력을 역 이산 코사인 변환하는 IDCT부(414), 이전 프레임(n-1)의 움직임 보상된 정보와 IDCT부(414)를 통한 디코딩된 당 프레임(n)의 디코딩 정보를 결합하고, 다음 프레임(n)을 위한 디코딩 정보를 저장하는 기준 프레임 생성부(Reference frame)(416)를 포함하는 도 1의 구성에 기준 프레임 생성부(416)에 저장된 이전 프레임(n-1)의 디코딩 정보와 당 프레임(n)의 원본 영상을 입력받아 I-모드 또는 P-모드를 선택하기 위한 I/P모드 선택부(418)를 더 포함한다.
이와 같은 I/P 모드 선택부(418)는 현재 영상 프레임(n)에 대해 기준 프레임 생성부(416)에 저장된 이전 프레임(n-1)의 디코딩 정보와 평균 히스토그램 오차를 계산하여 한 마이크로 블록 영역을 P-모드 또는 I-모드로 코딩할 것인지를 결정한다. 이 때 P-모드 또는 I-모드 선택 시 사용되는 평균 히스토그램 오차는 하기 <수학식 1>과 같다.
Figure 112004018438170-pat00001
상기한 <수학식 1>에서 f와 g는 이미지 A(이전 영상 이미지(n-1))와 B(현재 영상 이미지(n))의 그레이 값(gray value)이다.
또한, 상기한 <수학식 1>과 같이 계산된 평균 히스토그램 오차 값이 기준치 보다 큰 경우에는 I-모드로, 계산된 평균 히스토그램 오차 값이 기준치 보다 작다면 P-모드로 인코딩한다. 즉, 계산량이 적은 히스토그램의 차이를 이용하여 변화가 작은 영역에 대해서는 움직임 예측(ME)/움직임 보상(MC)을 수행하기 위한 P-모드가 선택되고, 변화가 큰 영역에 대해서는 움직임 예측(ME)/움직임 보상(MC)을 수행하지 않은 I-모드가 선택된다.
즉, 움직임 예측(ME)/움직임 보상(MC)이 필요한 이미지 영역과 그렇지 않은 영역을 구분하여 압축을 수행하여 필요없는 움직임 예측(ME)/움직임 보상(MC)을 수행함으로 인해 발생하는 로드를 줄일 수 있다.
그러면, I/P 모드 선택 시 현재 영상 이미지 프레임(n)에 대해 이전 프레임(n-1)인 기준 영상 이미지 프레임(n-1)으로 계산된 평균 히스토그램 오차 값과 비교하는 기준치 값은 하기 <수학식 2>과 같다.
Figure 112004018438170-pat00002
상기한 <수학식 2>에서 X1 …Xn은 테스트용 영상에 대한 <수학식 1ㅇ>을 이용한 평균 히스토그램 오차 값의 실험치 값이다.
또한, X값에 대해 95% 신뢰구간(confidence interval)을 설정한다. 샘플값
Figure 112004018438170-pat00003
,…,
Figure 112004018438170-pat00004
이 평균값 ??과 표준편차 ??를 가진 정규분포를 따른다고 가정하면, 95% 신뢰구간은 하기 <수학식 3>과 같다.
Figure 112004018438170-pat00005
이때,
Figure 112004018438170-pat00006
는 샘플값
Figure 112004018438170-pat00007
, …,
Figure 112004018438170-pat00008
의 평균값이다.
본 발명에서는 기준치 값은 상기한 신뢰구간의 upper bound값으로 정한다. 즉, 평균 히스토그램 오차 값이 신뢰구간의 upper bound값보다 크다면 I-모드로, 작다면 P-모드로 인코딩된다.
만약, 인코딩 모드가 P-모드로 선택되면, 움직임 예측을 위한 움직임 벡터와 디퍼렌셜 이미지를 출력하는 움직임 예측부(ME : Motion Compensation)(420), 기준 프레임 생성부(416)에 저장된 이전 프레임(n-1)의 디코딩 정보에 움직임 예측부(420)의 출력을 받아 움직임을 보상하는 움직임 보상부(MC : Motion Compensation)(422)를 거쳐 인코딩 된다.
또한, 한 프레임의 인코딩을 마친 뒤, 프레임 당 할당된 비트량을 초과한 경우, 초과량의 비율만큼 원래 계획된 인코딩 시간을 증가시키고, 만약 할당량에 미치지 못했을 경우, 다음 프레임에서 사용되도록 제어하기 위한 프레임 레이트 제어부(410), 자주 나오는 값을 작은 비트로 할당하고 가끔 나오는 값일수록 큰 비트로 할당하도록 하는 엔트로피 코딩을 위한 VLC부 (variable length coding)(408)를 포함한다.
그러면, 이제 상기한 도 4와 같이 구성되는 H.263/MPEG 비디오 인코더에서 입력되는 영상 이미지 영역에 대하여 움직임 예측(ME)/움직임 보상(MC)과정 수행 전에 평균 히스토그램 오차 방식을 이용하여 미리 코딩할 모드를 선택하기 위한 과정에 대하여 도 5를 참조하여 설명하도록 한다. 도 5는 본 발명에 따른 평균 히스 토그램 오차 방식을 이용한 H.263/MPEG 비디오 인코더의 입력되는 영상에 대한 인코딩 과정을 도시하는 동작 흐름도이다.
먼저, 상기한 도 2의 흐름도와 같이 다음 입력되는 영상 이미지의 인코딩을 위해 기준 프레임을 구성된 후임을 가정하고 설명한다.
500단계에서 대기상태를 유지하다가 502단계에서 다음 영상이 입력되면, 504단계로 진행하여 현재 이미지에 대해 기준 이미지 평균 히스토그램 오차값을 계산한다. 이후, 506단계에서 계산한 평균 히스토그램 오차값이 미리 정해진 기준값 이상인지를 검사한다. 여기서 기준값은 상기한 <수학식 2>와 같이 계산되어 현재 이미지가 기준 이미지로부터 이미지 변화가 작고 큼을 판단하기 위한 값이다. 즉, 506단계에서 상기에서 계산된 평균 히스토그램 오차 값이 기준값 보다 큰 경우에는 508단계로 진행하여 I-모드로 이미지를 인코딩하도록 설정한다. 즉, 변화가 큰 영역에 대해서는 움직임 예측(ME)/움직임 보상(MC)을 수행하지 않은 I-모드가 선택된다. 도 4를 참조하면, 움직임 예측부(420)와 움직임 보상부(422)를 거치지 않고 이미지 인코딩을 수행한다.
한편, 506단계에서 상기에서 계산된 평균 히스토그램 오차 값이 기준값 보다 작다면 510단계로 진행하여 P-모드로 인코딩한다. 즉, 계산량이 적은 히스토그램의 차이를 이용하여 변화가 작은 영역에 대해서는 움직임 예측(ME)/움직임 보상(MC)을 수행하기 위한 P-모드가 선택된다. 도 4를 참조하면, I/P 모드 선택부(418)에서 P-모드가 선택되는 경우에는 움직임 예측부(420)와 움직임 보상부(422)를 통해 움직임을 예측하고 보상하는 과정을 수행한다.
본 발명은 인코딩 모드 타입을 효율적으로 선택하여 압축 효율을 향상시키고 속도 또한 개선시킬 수 있는 변형된 인코더 구조이다. 본 발명은 동영상 압축 표준 방식인 MPEG-4나 H.263 압축 표준(compression standard)에 적용되어질 수 있으며, 모드 타입 선택을 위해 평균 히스토그램 오차 방식(Average Histogram Difference method)을 이용한다.
상술한 바와 같은 본 발명은 계산량이 적은 히스토그램의 차이를 이용하여 미리 움직임 예측(ME)/움직임 보상(MC)이 필요한 이미지 영역과 그렇지 않은 영역을 구분하여 압축을 수행하여 필요 없는 움직임 예측(ME)/움직임 보상(MC)을 수행함으로 인해 발생하는 로드를 줄이고자 한다.
상기와 같은 본 발명은 모든 영상 이미지 블록(MB)에 대해서 인코더의 성능에 많은 영향을 끼치는 움직임 예측(ME)/움직임 보상(MC)을 수행할 필요없이 선택적으로 움직임 예측(ME)/움직임 보상(MC)을 수행하기 때문에 인코더의 성능개선에 기여할 수 있는 효과가 있다.
또한, 움직임 예측(ME)/움직임 보상(MC)이 필요한 영역을 미리 계산량이 적은 평균 히스토그램 오차 방식으로 처리하기 때문에 움직임 예측(ME)/움직임 보상(MC)에 소요되는 시간을 줄일 수 있는 이점이 있다.
그리고, 평균 히스토그램 오차값으로부터 변화가 큰 영상에 대하여 I-모드, 변화가 작은 영상에 대해 P-모드를 선택하기 때문에 P-모드에 필요한 움직임 예측(ME) 에러가 발생할 가능성이 적어진다.

Claims (6)

  1. 입력 영상(N-1)을 이산 코사인 변환(DCT)하고 이를 양자화(Q)하여 비디오 스트림으로 출력하고, 상기 양자화된 신호에 대해 역양자화(IQ) 및 역 이산 코사인 변환(IDCT)을 통해 디코딩하여 다음 입력 영상(N)의 인코딩을 위한 기준 영상을 구성하는 H.263/MPEG 비디오 인코더에 있어서,
    상기 다음 영상(N)이 상기 인코더에 입력되어 시간적 중복성 제거 시 상기 입력된 다음 영상(N)에 대해 기준 영상과의 평균 히스토그램 오차값을 계산하고, 만약 상기 계산된 평균 히스토그램 오차값이 미리 설정된 기준치보다 큰 경우에는 상기 기준 영상으로부터 이미지 변화가 큰 영역임을 판단하여 움직임 예측(ME)/움직임 보상(MC)을 수행하지 않은 제 1모드를 선택하고, 상기 계산된 평균 히스토그램 오차값이 상기 기준치값보다 작은 경우에는 상기 기준 영상으로부터 변화가 작은 영역임을 판단하여 움직임 예측/움직임 보상을 수행하기 위한 제 2모드를 선택하는 모드 선택부를 더 구비함을 특징으로 하는 비디오 인코더.
  2. 삭제
  3. 제 1항에 있어서, 상기 기준치 값은 상기 다음 영상(N)이 상기 기준 영상과 비교하여 상기 기준 영상에 비해 상기 다음 영상(N)의 이미지 변화정도를 판단하기 위한 값임을 특징으로 하는 비디오 인코더.
  4. 입력 영상(N-1)을 이산 코사인 변환(DCT)하고 이를 양자화(Q)하여 비디오 스트림으로 출력하고, 상기 양자화된 신호에 대해 역양자화(IQ) 및 역 이산 코사인 변환(IDCT)을 통해 디코딩하여 다음 입력 영상(N)의 인코딩을 위한 기준 영상을 구성하는 H.263/MPEG 비디오 인코더에 있어서의 부호화 제어방법에 있어서,
    상기 다음 영상(N)이 입력되면, 상기 기준 영상과의 평균 히스토그램 오차값을 계산하는 과정과,
    상기 계산된 평균 히스토그램 오차값이 미리 정해진 기준값 이상인지를 검사하는 과정과,
    상기 계산된 평균 히스토그램 오차값이 상기 기준값보다 큰 경우에는 변화가 큰 영역임을 판단하여 움직임 예측/움직임 보상을 수행하지 않은 제 1모드를 선택하고, 상기 계산된 평균 히스토그램 오차값이 상기 기준치값보다 작은 경우에는 변화가 작은 영역임을 판단하여 움직임 예측(ME)/움직임 보상(MC)을 수행하기 위한 제 2모드를 선택하는 과정을 포함함을 특징으로 하는 방법.
  5. 제 4항에 있어서, 상기 기준치값은 상기 다음 영상(N)이 상기 기준 영상으로부터 이미지 변화가 작고 큼을 판단하기 위한 값으로, 통계적 방식을 이용하여 부호화 모드를 상기 제1 모드인지 제2 모드인지 선택하기 위한 임계값임을 특징으로 하는 방법.
  6. 제 5항에 있어서,
    상기 기준치 값은 <수학식 2>와 같은 것을 특징으로 하는 방법.
    [수학식 2]
    Figure 112004018438170-pat00009
    여기서, X1 … Xn은 움직임이 심한 영상에 대한 평균 히스토그램 오차 값의 실험치 값임.
KR1020040030563A 2004-04-30 2004-04-30 평균 히스토그램 오차 방식을 이용한 h.263/mpeg비디오 인코더 및 그 제어 방법 KR100713400B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020040030563A KR100713400B1 (ko) 2004-04-30 2004-04-30 평균 히스토그램 오차 방식을 이용한 h.263/mpeg비디오 인코더 및 그 제어 방법
US11/056,414 US20050243917A1 (en) 2004-04-30 2005-02-11 H.263/MPEG video encoder using average histogram difference and method for controlling the same
EP05006647A EP1592257A1 (en) 2004-04-30 2005-03-24 H.263/MPEG video encoder using average histogram difference and method for controlling the same
CNB2005100684350A CN100442852C (zh) 2004-04-30 2005-04-28 使用平均直方图差值的视频编码器及其控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040030563A KR100713400B1 (ko) 2004-04-30 2004-04-30 평균 히스토그램 오차 방식을 이용한 h.263/mpeg비디오 인코더 및 그 제어 방법

Publications (2)

Publication Number Publication Date
KR20050105550A KR20050105550A (ko) 2005-11-04
KR100713400B1 true KR100713400B1 (ko) 2007-05-04

Family

ID=34934532

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040030563A KR100713400B1 (ko) 2004-04-30 2004-04-30 평균 히스토그램 오차 방식을 이용한 h.263/mpeg비디오 인코더 및 그 제어 방법

Country Status (4)

Country Link
US (1) US20050243917A1 (ko)
EP (1) EP1592257A1 (ko)
KR (1) KR100713400B1 (ko)
CN (1) CN100442852C (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100598093B1 (ko) * 2003-01-29 2006-07-07 삼성전자주식회사 낮은 메모리 대역폭을 갖는 동영상 압축 장치와 그 방법
DE102004056447A1 (de) * 2004-11-23 2006-05-24 Siemens Ag Codierverfahren und Decodierverfahren, sowie Codiervorrichtung und Decodiervorrichtung
KR100757734B1 (ko) * 2006-03-15 2007-09-11 삼성전자주식회사 비디오 영상 후처리 장치 및 방법
KR101270167B1 (ko) 2006-08-17 2013-05-31 삼성전자주식회사 저복잡도의 이미지 압축 방법 및 장치, 저복잡도의 이미지복원 방법 및 장치
US8259793B2 (en) * 2007-03-19 2012-09-04 Sony Corporation System and method of fast MPEG-4/AVC quantization
KR101611437B1 (ko) * 2009-10-28 2016-04-26 삼성전자주식회사 복수의 프레임을 참조하여 영상을 부호화, 복호화하는 방법 및 장치
KR101410837B1 (ko) * 2013-09-10 2014-06-24 이에스이 주식회사 비디오 메모리의 모니터링을 이용한 영상 처리 장치
US9235279B2 (en) * 2013-10-14 2016-01-12 Pixart Imaging Inc. Wake up method and optical input device using the same
US10542283B2 (en) * 2016-02-24 2020-01-21 Wipro Limited Distributed video encoding/decoding apparatus and method to achieve improved rate distortion performance
WO2018012366A1 (ja) * 2016-07-13 2018-01-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 復号装置、符号化装置、復号方法及び符号化方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000270327A (ja) 1999-03-12 2000-09-29 Nec Corp 動き補償予測決定回路
KR20010011309A (ko) * 1999-07-27 2001-02-15 이준우 저 복잡도의 동영상 인코더 장치 및 방법
KR20030037587A (ko) * 2001-11-06 2003-05-14 한국전자통신연구원 움직임 탐색을 위한 이진 평면 구성방법 및 이를 이용한움직임 추정 장치
KR20030059400A (ko) * 2001-12-29 2003-07-10 엘지전자 주식회사 동영상 비디오의 장면전환 검출 방법
KR20040066397A (ko) * 2003-01-17 2004-07-27 아스텔 주식회사 디지털 영상압축 시스템 및 그 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5592226A (en) * 1994-01-26 1997-01-07 Btg Usa Inc. Method and apparatus for video data compression using temporally adaptive motion interpolation
US5724100A (en) * 1996-02-26 1998-03-03 David Sarnoff Research Center, Inc. Method and apparatus for detecting scene-cuts in a block-based video coding system
US6072542A (en) * 1997-11-25 2000-06-06 Fuji Xerox Co., Ltd. Automatic video segmentation using hidden markov model
US6870956B2 (en) * 2001-06-14 2005-03-22 Microsoft Corporation Method and apparatus for shot detection
BRPI0304565B1 (pt) * 2002-03-15 2018-07-24 Nokia Technologies Oy Método de predição de movimento compensado para uso na codificação da sequência de vídeo digital, codificador e decodificador de vídeo para codificar/decodificar uma sequência de vídeo digital usando predição de movimento compensado, terminal de miltimídia, e, codec de vídeo

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000270327A (ja) 1999-03-12 2000-09-29 Nec Corp 動き補償予測決定回路
KR20010011309A (ko) * 1999-07-27 2001-02-15 이준우 저 복잡도의 동영상 인코더 장치 및 방법
KR20030037587A (ko) * 2001-11-06 2003-05-14 한국전자통신연구원 움직임 탐색을 위한 이진 평면 구성방법 및 이를 이용한움직임 추정 장치
KR20030059400A (ko) * 2001-12-29 2003-07-10 엘지전자 주식회사 동영상 비디오의 장면전환 검출 방법
KR20040066397A (ko) * 2003-01-17 2004-07-27 아스텔 주식회사 디지털 영상압축 시스템 및 그 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
1020010011309 *
1020030059400 *

Also Published As

Publication number Publication date
US20050243917A1 (en) 2005-11-03
EP1592257A1 (en) 2005-11-02
KR20050105550A (ko) 2005-11-04
CN1694536A (zh) 2005-11-09
CN100442852C (zh) 2008-12-10

Similar Documents

Publication Publication Date Title
KR101196429B1 (ko) 동영상 트랜스코딩 방법 및 그 장치, 이에 사용되는움직임 벡터 보간방법
US7792193B2 (en) Image encoding/decoding method and apparatus therefor
KR101608426B1 (ko) 영상의 인트라 예측 부호화/복호화 방법 및 그 장치
KR100850706B1 (ko) 적응적 동영상 부호화 및 복호화 방법과 그 장치
KR101044934B1 (ko) 움직임 벡터 추정방법 및 부호화 모드 결정방법
CN1949877B (zh) 自适应量化控制器及其方法
CN101483774B (zh) 用于视频编解码器的选择性的和/或可缩放的复杂度控制
KR101103698B1 (ko) 영상 부호화 장치 및 방법, 영상 부호화 프로그램 및 그 프로그램을 기록한 기록 매체
CN100442852C (zh) 使用平均直方图差值的视频编码器及其控制方法
KR100790149B1 (ko) 비디오 인코딩 데이터율 제어 방법
KR100843080B1 (ko) 비디오 트랜스코딩 방법 및 장치
CN1938728A (zh) 使用包括多个宏块的预测和非预测画面对画面序列编码的方法和装置
KR100594056B1 (ko) 효율적인 비트율 제어를 위한 h.263/mpeg 비디오인코더 및 그 제어 방법
KR101959490B1 (ko) 비디오 비트율 제어 방법 및 그 장치
KR20090090152A (ko) 영상의 부호화, 복호화 방법 및 장치
US20010053182A1 (en) Picture encoding format converting apparatus
KR100708182B1 (ko) 동영상 부호화기의 비트율 제어 장치 및 방법
KR101086724B1 (ko) 영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기
KR20040007818A (ko) 동영상 부호화를 위한 dct연산량 조절 방법 및 그 장치
KR20130023444A (ko) 다단계 화면간 예측을 이용한 영상 부호화/복호화 장치 및 방법
KR20110024574A (ko) 통합 영상 부호화 방법 및 장치
KR19990065775A (ko) 비디오 스트림 코딩을 위한 적응적 비트율 제어 방법
KR100832872B1 (ko) 기하학적 변환을 이용한 영상 부호화 효율 향상 방법 및장치
KR20100082700A (ko) 와이너-지브 부호화 및 복호화 시스템 및 방법
KR100266708B1 (ko) 양방향 예측 픽쳐의 조건부 보충 부호화 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee