KR101087109B1 - 비디오 부호화 장치 및 그 방법 - Google Patents
비디오 부호화 장치 및 그 방법 Download PDFInfo
- Publication number
- KR101087109B1 KR101087109B1 KR1020050025520A KR20050025520A KR101087109B1 KR 101087109 B1 KR101087109 B1 KR 101087109B1 KR 1020050025520 A KR1020050025520 A KR 1020050025520A KR 20050025520 A KR20050025520 A KR 20050025520A KR 101087109 B1 KR101087109 B1 KR 101087109B1
- Authority
- KR
- South Korea
- Prior art keywords
- picture
- bit rate
- image
- gop
- encoding
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 디지털 방송 수신기에 고정식 또는 이동식 저장 매체를 장착하여 수신되는 방송 신호를 상기 저장 매체에 녹화/재생할 수 있는 개인용 비디오 녹화 장치에서 가변 GOP 구조로 비트율을 제어하여 입력 영상을 부호화하는 장치 및 그 방법에 관한 것이다. 특히 본 발명은 아날로그 방송 신호(예를 들면, NTSC 전송 방식)를 주어진 비트율의 제약을 준수하면서 MPEG-2 비디오 스트림으로 실시간 부호화하는 과정에서 가변 GOP 구조를 이용하여 기존의 화질을 유지함과 동시에 비트 소모량을 줄일 수 있다. 또한 변화가 크지 않은 비디오 구간의 경우에 I 픽쳐의 개수를 줄임으로써 기존과 동일한 화질을 유지하면서 효과적으로 비트 소모량을 줄일 수 있다.
비트율 제어, 가변, GOP, 장면 전환, 화질 저하
Description
도 1은 일반적인 PVR 장치를 이용한 아날로그 및 디지털 방송 녹화의 일 실시예를 보인 구성 블록도
도 2는 본 발명에 따른 비디오 부호화 장치의 일 실시예를 보인 구성 블록도
도 3은 본 발명에 따른 가변 GOP 구조에 의한 비트율 감소 효과를 보인 도면
도 4는 본 발명에 따른 비디오 부호화 장치에서 새로운 GOP를 생성하는 과정의 일 실시예를 보인 흐름도
도면의 주요부분에 대한 부호의 설명
201 : 감산기 202 : DCT부
203 : 비트율 제어 및 양자화부 204 : 스캔 및 재배열부
205 : VLC부 206 : VLD부
207 : 역스캔부 208 : 역양자화부
209 : IDCT부 210 : 프레임 메모리
211 : 움직임 추정부 212 : 움직임 보상부
213 : 비교부 214 : 장면전환 검출부
본 발명은 디지털 방송 수신기에 관한 것으로서, 더욱 상세하게는 디지털 방송 수신기에 고정식 또는 이동식 저장 매체를 장착하여 수신되는 방송 신호를 상기 저장 매체에 녹화/재생할 수 있는 개인용 비디오 녹화 장치에서 가변 GOP(Group Of Picture) 구조로 비트율을 제어하여 입력 영상을 부호화하기 위한 장치 및 그 방법에 관한 것이다.
개인용 비디오 녹화 장치(Personal Video Recorder ; 이하 PVR 장치라 함)는 디지털 TV 또는 셋톱 박스 등에 고정식 또는 이동식 저장 매체 예를 들면, 하드디스크(HDD)를 장착함으로써, 디지털 방송을 HDD에 저장할 수 있는 기능을 제공한다. 이는 기존의 VCR(Video Cassette Recorder)이 녹화를 위해 비디오 테이프를 수시로 교체해 주어야 하는 불편을 해소함과 동시에 대용량의 방송 녹화가 가능케 한다. 아울러 상기 PVR 장치는 주 기능인 녹화 기능은 물론 타임 시프트(time-shift), 생방송 시청 중 순간 재생(instant replay), 기타 각종 트릭 플레이 기능을 제공하면서 사용자로 하여금 TV를 보다 다양하게 즐길 수 있는 향상된 기능을 제공한다.
이러한 PVR 장치에서 NTSC 또는 PAL 규격에 의한 아날로그 방송 신호를 MPEG(Moving Picture Experts Group)-2 비디오 스트림으로 변환하여 HDD에 녹화하기 위해서는 실시간 MPEG-2 비디오 부호화 장치가 필요하다.
도 1은 PVR 장치에서 아날로그 및 디지털 방송을 HDD에 저장하는 경로를 나타낸다. NTSC나 PAL과 같은 아날로그 방송 신호는 아날로그 튜너(101)에서 튜닝된 후 A/D 컨버터(Analog/Digital Converter)(102)로 출력되어 디지털화된다.
도 1에서는 NTSC 전송 방식의 아날로그 방송 신호를 실시예로 설명하고 있다.
그러므로 상기 A/D 컨버터(102)에서 디지털화된 아날로그 방송 신호는 NTSC 디코더(103)로 출력된다. 상기 NTSC 디코더(103)에서는 아날로그 방송 신호를 MPEG-2로 부호화하기 위한 4:2:0 포맷으로 변환하여 MPEG-2 엔코더(104)로 출력한다. 상기 MPEG-2 엔코더(104)는 포맷 변환된 방송 신호를 도 2와 같은 MPEG-2 압축 알고리즘에 의해 압축 부호화하여 PVR 모듈(108)로 출력한다.
한편 디지털 방송 신호는 디지털 튜너(105)에서 튜닝된 후 복조기(106)로 출력된다. 상기 복조기(106)는 튜닝된 방송 신호에 대해 변조 방식의 역으로 복조한다. 예를 들어, 수신된 디지털 방송이 지상파 방송이면 VSB(Vestigial Side Band) 복조를 수행하고, 위성 방송이면 QPSK(Quadrature Phase Shift Keying) 복조를 수행하여 트랜스포트 스트림(Transport Stream ; TS) 형태로 TS 디코더(107)로 출력한다. 상기 TS 디코더(107)는 입력되는 트랜스포트 스트림에 복수개 이상의 프로그램이 다중화되어 있는 경우 저장을 원하는 프로그램만을 역다중화하여 PVR 모듈(108)로 출력한다.
상기 PVR 모듈(108)은 MPEG-2 엔코더(104)에서 압축 부호화된 아날로그 방송 스트림 또는, TS 디코더(107)에서 역다중화된 디지털 방송 스트림에 오디오 스트림 및 캡션 정보 등을 포함한 데이터 스트림을 함께 다중화(multiplexing)한 후 HDD(110)에 저장한다. 여기서 상기 오디오 스트림 및 데이터 스트림 또한 상응하는 부호화 장치를 이용하여 부호화를 수행하도록 한다.
한편 도 1과 같은 실시간 MPEG2 비디오 부호화 과정에서 가장 중요한 것은 비트량과 화질이다. 이 두 가지 특성은 서로 trade-off 관계이며 이 두 특성을 적절히 조화시켜 최적의 결과를 얻기 위한 과정이 바로 비트율 제어(rate control)이다. 상기 비트율 제어는 주어진 비트율을 기준으로 버퍼 모델을 설정하여 비디오 데이터의 GOP 및 각 프레임 단위로 부호화 과정에 필요한 비트량을 할당하며 이에 상응하는 양자화 계수를 결정하는 과정이다.
기존의 MPEG-2 부호화 장치에서 비트량을 할당하는 과정은 목표 비트율이 결정되었을 때 이것을 만족하기 위하여 GOP 단위로 할당할 비트량을 계산한 다음 각 픽쳐 타입 (picture type)에 따라서 차별적으로 비트율을 할당하는 방법을 사용한다. 이때, I 픽쳐에는 P 또는 B 픽쳐에 비하여 월등히 많은 양의 비트를 할당한다. 그 이유는 GOP 내의 모든 픽쳐는 이전에 부호화된 픽쳐를 참조하여 인코딩되며 이때, I 픽쳐는 참조되는 픽쳐의 시초가 되기 때문이다. 결국 GOP의 전체적인 화질은 I 픽쳐의 화질에 의하여 결정되며 I 픽쳐에서 발생한 오차가 GOP 내에서 이후에 인코딩되는 픽쳐들에게 누적되어 전파된다.
각 I 픽쳐는 각 GOP의 시작점이며 가장 일반적인 GOP 구조는 12 개 또는 15 개의 픽쳐로 구성된다. 결과적으로 MPEG-2 부호화 과정에서 전체 비트 소모량 중에서 I 픽쳐가 차지하는 부분이 상당하다. 일반적인 방송 신호를 이용하여 실험한 결과, 하나의 GOP의 전체 비트 소모량에서 I 픽쳐가 차지하는 부분은 20% 정도에 이른다. I 픽쳐는 결과적으로 비디오 신호의 부호화 과정에서 일종의 리프레쉬(refresh) 기능을 수행하는 역할을 한다. 그러나 비디오 신호가 가지고 있는 반복 적인 성질에 의하여 이러한 리프레쉬 주기는 실제로 종래의 주기보다 더 길게 잡아도 화질에 큰 영향을 주지 않는다. 실제 실험 결과, 같은 장면 구간을 부호화하는 과정에서 이러한 리프레쉬 주기를 어느 정도 더 길게 잡더라도 화질에 미치는 영향은 미미하다. 따라서 화질이 일정한 수준을 유지한다는 보장이 있다면 I 픽쳐의 개수를 줄임으로써 비트 소모량을 줄일 수 있는 방법이 존재한다.
또한 고정 GOP를 사용하는 인코더는 장면 전환에 취약하다는 문제점이 존재한다. 예를 들어 GOP 내에서 장면 전환이 발생할 경우 장면 전환이 발생한 시점 이후에 입력되는 신호는 부호화 과정에서 적절한 참조 프레임(reference frame)이 존재하지 않음으로 화질에 문제가 발생할 수 있으며, 또한 인트라(intra) 타입의 매크로블록의 증가로 인해 부호화 과정이 비효율적으로 수행되는 문제점이 존재한다.
아울러 가변 비트율 비디오 부호화 장치에서 적정 화질의 구현을 위한 구체적인 비트 할당 방법이 필요하다. 즉, 정해진 수준의 화질을 달성하기 위해 어느 정도의 비트율로 인코딩을 수행해야할 지에 대한 구체적이고 정량적인 방법이 필요하다.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 실시간 단일 패스 가변 비트율 비디오 부호화 과정에서 가변 GOP 구조를 사용하여 기존과 동일한 수준의 화질을 유지하면서 그 비디오 데이터에 대한 비트 발생량을 감소시키는 비디오 부호화 장치 및 그 방법을 제공하는 것이다.
상기 목적을 달성하기 위하여, 본 발명에 따른 비디오 부호화 장치는, 압축 부호화된 후 다시 복호화된 이전 영상을 저장하고 있는 메모리; 입력되는 현재 영상과 상기 프레임 메모리에 저장된 이전 영상을 비교하여 부호화된 영상의 화질을 검출하는 비교부; 입력되는 현재 영상과 이전 영상을 이용하여 장면 전환을 검출하는 장면 전환 검출부; 및 상기 비교부의 출력과 장면 전환 검출부의 출력에 따라 새로운 GOP의 시작 여부와 비트율을 제어하여 입력 영상을 압축 부호화하는 부호화부를 포함하여 구성되는 것을 특징으로 한다.
상기 비교부는 입력되는 현재 영상과 메모리에 저장된 이전 영상의 신호 대 잡음비를 프레임 단위로 계산하여 부호화된 프레임의 화질을 검출하는 것을 특징으로 한다.
상기 부호화부는 상기 GOP 내에 포함되는 픽쳐의 개수가 기 설정된 최대 픽쳐수와 같아지면 다음 입력 영상을 I 픽쳐로 부호화하는 것을 특징으로 한다.
상기 부호화부는 상기 장면 전환 검출부에서 장면 전환으로 검출되면 현재 입력 영상을 I 픽쳐로 부호화하는 것을 특징으로 한다.
상기 부호화부는 상기 비교부에서 계산된 화질이 기 설정된 기준 화질보다 낮으면 목표 비트율을 새로 계산하고 계산된 목표 비트율로 다음 입력 영상을 I 픽쳐로 부호화하는 것을 특징으로 한다.
본 발명에 따른 비디오 부호화 방법은,
(a) 입력되는 현재 영상과 이를 부호화한 결과를 비교하여 부호화된 영상의 화질을 검출하는 단계;
(b) 입력되는 현재 영상과 한 프레임 지연된 이전 영상을 비교하여 장면 전환을 검출하는 단계; 및
(c) 상기 단계의 장면 전환 검출 및 부호화된 화질 상태에 따라 새로운 GOP의 시작 여부와 비트율을 제어하여 입력 영상을 부호화하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
상기 (c) 단계는 적어도 I 픽쳐 이후로 입력되는 픽쳐의 개수가 기 설정된 GOP 내 최대 픽쳐수와 같아지거나 장면 전환이 검출되거나 부호화된 영상의 화질이 기준값 이하가 되면 새로운 GOP의 시작으로 판단하는 단계와, 상기 단계에서 새로운 GOP의 시작으로 판별되면 I 픽쳐의 목표 비트량을 결정하고 입력 영상을 I 픽쳐로 부호화하는 단계를 포함하는 것을 특징으로 한다.
상기 (c) 단계는 입력 영상의 부호화를 위한 목표 비트율이 결정되면 GOP 단위의 할당이 아닌 각 픽쳐 타입별로 정해진 규칙에 따라 목표 비트량을 할당하는 것을 특징으로 한다.
본 발명의 다른 목적, 특징 및 잇점들은 첨부한 도면을 참조한 실시예들의 상세한 설명을 통해 명백해질 것이다.
이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명한다. 이때 도면에 도시되고 또 이것에 의해서 설명되는 본 발명의 구성과 작용은 적어도 하나의 실시예로서 설명되는 것이며, 이것에 의해서 상기한 본 발명의 기술적 사상과 그 핵심 구성 및 작용이 제한되지는 않는다.
그리고 종래와 동일한 구성 요소는 설명의 편의상 동일 명칭 및 동일 부호를 부여하며 이에 대한 상세한 설명은 생략한다.
본 발명은 아날로그 방송 신호(예를 들면, NTSC 전송 방식)를 주어진 비트율의 제약을 준수하면서 MPEG-2 비디오 스트림으로 실시간 부호화하는 과정에서 가변 GOP 구조를 이용하여 기존의 화질을 유지함과 동시에 비트 소모량을 줄임으로써, 단일 패스 MPEG-2 부호화 과정의 효율성을 증가시킴과 동시에 PVR의 저장 공간을 효과적으로 운용할 수 있도록 한다.
즉, GOP의 크기를 비디오 신호의 특성에 따라 가변적으로 결정한다면 보다 유연하고 효율적인 MPEG2 비디오 부호화를 수행할 수 있다. 이때, 비트량의 할당 방법 또한 기존의 방법에서 사용하는 GOP 단위의 할당이 아닌 각 픽쳐 타입에 따라서 정해진 규칙에 의해 바로 비트량을 할당한다면 가변 GOP 구조의 구현이 가능하며, 특히 변화가 크지 않은 비디오 구간의 경우에 I 픽쳐의 개수를 줄임으로써 기존과 동일한 화질을 유지하면서 효과적으로 비트 소모량을 줄일 수 있다.
도 2는 본 발명에 따른 MPEG-2 비디오 부호화 장치의 일 실시예를 보인 구성 블록도로서, 매크로 블록(Macro block) 단위로 부호화가 이루어진다.
도 2에서 입력 신호는 감산기(201), 움직임 추정부(211), 프레임 비교부(213), 및 장면 전환 검출부(214)로 제공된다.
상기 입력 신호는 I 픽쳐의 경우에는 DC 값을 기준으로 한 residual 신호를 의미하며, P 및 B 픽쳐의 경우에는 움직임 추정을 수행한 결과 원본 비디오 신호와 추정된 신호의 차이, 즉 frame difference 신호를 의미한다.
상기 감산기(211)는 입력 신호와 움직임 보상된 신호와의 차를 구하여 이산코사인변환(DCT)부(202)로 출력한다. 상기 DCT부(202)는 입력되는 데이터를 블록 단위로 DCT한 후 비트율 제어 및 양자화부(203)로 출력하고, 비트율 제어 및 양자화부(203)는 DCT 계수를 양자화 파라미터에 의해 결정되는 양자화 스텝 크기에 따라 양자화하여 스캔 및 재배열(coefficient scan & ordering)부(204)로 출력한다. 이때 전체적인 비트율과 화질에 영향을 끼치는 양자화 파라미터는 비트율 제어 과정에 의하여 결정된다.
상기 스캔 및 재배열부(204)는 양자화되어 입력되는 데이터를 미리 정해진 스캔 방식에 따라 1차원으로 재배치하여 VLC부(205)로 출력된다. 상기 VLC부(205)는 재배치되어 출력되는 양자화된 DCT 계수에 대해 자주 나오는 값은 적은 수의 비트로, 드물게 나오는 값은 많은 수의 비트로 표시하여 전체 비트 수를 줄이는 엔트로피 부호화(Entropy Coding)를 수행한다. 이때 상기 DCT 계수 이외에도 픽처 헤더 정보 및 움직임 정보 등이 부호화 되는 MPEG-2 비트 스트림에 포함된다.
이때, 상기 VLC부(205)에서 VLC된 데이터는 도 1의 PVR 모듈(108)을 거쳐 일정한 속도로 HDD(110)에 저장됨과 동시에 가변 길이 디코딩부(VLD)부(206), 역스캔부(207), 역 양자화부(208), 및 역 DCT(IDCT)부(209)를 순차적으로 거치면서 압축 부호화 이전의 상태로 복원되어 프레임 메모리(210)에 저장된다.
상기 프레임 메모리(210)에 저장된 데이터는 움직임 추정 및 보상을 위해 움직임 추정부(211)와 움직임 보상부(212)로 출력되고, 프레임 비교를 위해 비교부(213)로 출력된다.
상기 움직임 추정부(211)는 입력 신호에 프레임 메모리(210)에 저장된 참조 영상을 이용하여 움직임 벡터를 추정한 후 움직임 보상부(212)로 출력한다.
상기 움직임 보상부(212)는 움직임 추정(Motion Estimation ; ME)부(211)의 움직임 벡터에 따라 프레임 메모리(210)로부터 읽어온 이전 프레임에 대해 움직임 보상을 수행한 후 감산기(201)로 출력한다.
상기 프레임 비교부(213)에서는 현재 입력되는 원본 프레임과 프레임 메모리(210)에 읽어 온 부호화 된 프레임의 SNR을 계산하여 비트율 제어 및 양자화부(203)로 출력한다.
상기 장면 전환 검출(scene change detector)부(214)는 현재 입력되는 프레임과 한 프레임 지연된 이전 프레임 신호를 비교하여 현재 프레임이 새로운 장면의 시작점인지 여부를 판단하고 그 결과를 상기 비트율 제어 및 양자화부(203)로 출력한다. 즉 비교부(213)에 이용되는 이전 프레임은 부호화된 후 복호된 이전 영상이고, 장면 전환 검출부(214)에 이용되는 이전 프레임은 부호화되지 않고 단지 한 프레임 지연된 이전 영상이다.
이때, 상기 비트율 제어 및 양자화부(203)는 프레임 비교부(213)와 장면 전환 검출부(214)의 출력 값에 따라 새로운 GOP의 시작 여부를 결정한다. 아울러 프레임 비교부(213)에서 출력한 값을 이용하여 다음 비디오 구간을 부호화하기 위한 비트율을 결정한다.
도 3은 본 발명의 가변 GOP를 이용한 부호화 과정에 의해 비트율이 감소하는 효과를 나타낸 도면으로서, 도면의 상단에는 종래의 고정된 GOP 크기를 갖는 비디 오 부호화 장치의 GOP 구조를 나타내고, 하단에는 본 발명에 의한 비디오 부호화 장치에서의 가변 GOP 구조의 일 실시예를 나타낸다.
종래의 GOP가 N=15, M=3의 고정된 크기를 갖는 구조라고 가정할 때, 목표 비트율을 초당 TBR bits, 프레임 레이트를 초당 FR 장이라고 가정한다면, 각각의 GOP에는 T * 15 / 30 = (T/2) bits 만큼의 비트량이 할당된다. 이때 픽쳐 타입에 따라 하나의 프레임에 대한 비트량 할당은 하기의 수학식 1과 같다.
이때, 상기 TI, TP, TB는 각각 하나의 I 픽쳐, P 픽쳐, B 픽쳐에 대하여 할당되는 비트량을 의미한다. 상기 NGOP는 GOP에 포함되는 프레임의 수, 즉 본 실시예에서는 15의 값을 가진다. 상기 RI, RP, RB는 비례 상수이며 각 픽쳐 타입에 대하여 할당할 비트량의 비율을 나타낸다. 상기 NI, NP, NB는 GOP에 포함되는 I 픽쳐, P 픽쳐, B 픽쳐의 개수를 의미하며 N=15, M=3인 경우 각각 1, 4, 10의 값을 갖는다.
결과적으로 각 GOP는 (TBR * NGOP / FR)만큼의 비트량을 소모한다.
그러나 GOP1, GOP2, GOP3가 같은 비디오 구간에 포함된다고 가정할 때, 이 세 구간을 하나의 GOP로 묶을 경우 두 개의 I 픽쳐는 각각 P 픽쳐로 대체된다. 이 때, 발생하는 비트량의 감소는 2 * (TI - TP)이다. 실제 방송 신호에 대한 실험 결과, RI : RP : RB의 비율은 9 : 4 : 2일 때 최적의 성능을 얻을 수 있었다.
따라서, 상기 3개의 GOP를 하나의 GOP로 묶을 경우에 10/135, 즉 7.4% 만큼의 비트량 감소 효과가 발생한다. 이때, 각각의 픽쳐에 대한 목표 비트량은 NGOP=15일 때와 동일하게 할당한다. 즉, GOP의 크기가 다르더라도 같은 비트율에 의하여 부호화가 수행될 경우에 픽쳐 타입에 따라 할당되는 비트량은 동일해야 한다.
결과적으로 본 발명에 의한 실시간 비디오 부호화 장치에서 각 픽쳐 타입에 대한 비트량 할당은 하기의 수학식 2와 같이 고정한다.
이때, 프레임 레이트(FR)는 1초당 30장이라고 가정한다.
도 4는 본 발명에 의한 가변 GOP 구조를 이용한 실시간 비디오 부호화 장치에서 새로운 GOP의 생성 여부를 판단하는 과정의 일 실시 예를 나타낸 흐름도이다.
즉, 비디오 부호화 장치는 먼저 주어진 신호의 부호화를 위한 목표 비트율(TBR)을 결정하고, 새로운 GOP를 시작한다.
이때 새로운 GOP의 생성 또는 현재 프레임을 I 픽쳐로 부호화하는 조건은 다음과 같다.
1) 현재 GOP 내에 포함되는 픽쳐의 개수가 최대값 Max_GOP_Size와 같은 경우
GOP의 최대 크기를 Max_GOP_Size로 결정하며, GOP 내의 픽쳐의 수가 결정된 최대 크기에 도달하면 현재 인코딩 중인 GOP에는 더 이상의 프레임을 포함할 수 없다. 결과적으로 다음에 입력되는 프레임은 I 픽쳐로 인코딩을 수행한다. 즉 새로운 GOP가 시작되는 것이다. 그리고 새로운 GOP가 시작되면 변수 K는 0으로 초기화되면, 이 후 한 픽쳐가 인코딩될 때마다 1씩 증가된다.
2) 장면 전환이 발생한 경우
상기 장면 전환 검출부(214)는 현재 프레임과 이전 프레임을 비교하여 현저한 차이가 발생할 경우 장면 전환이 발생하였다고 판단하고 그 결과를 비트율 제어 및 양자화부(203)로 출력한다. 상기 비트율 제어 및 양자화부(203)는 장면 전환 발생부(214)에서 장면 전환이 발생하였다고 판단하면 현재 프레임을 새로운 장면의 시작점으로 결정하고, 현재 프레임을 I 픽쳐로 인코딩한다(새로운 GOP 시작).
3) 부호화 된 프레임의 화질이 일정 기준 이하인 경우
현재 프레임을 부호화 한 다음 비교부(213)에서 부호화 된 프레임의 화질을 계산한다. 이때, 상기 비교부(213)에서 기준 화질 이하의 값이 발생할 경우 상기 비트율 제어 및 양자화부(203)는 해당 비트율에 의해 만족스러운 화질을 얻을 수 없으므로 비트율을 다시 계산한다. 그리고 다음에 입력되는 프레임부터 새로운 비트율을 적용하여 인코딩을 수행한다. 즉, 비트율 결정 및 새로운 GOP가 시작된다.
이때, 현재 프레임에 대한 새로운 비트율은 다음 사항을 참고하여 목표 화질에 따라 정량적인 방법으로 결정한다.
만일 비트율이 4 Mbps 이하인 경우 1 Mbps 만큼의 비트율 증가는 약 2 dB 정도의 화질 향상을 발생시킨다.
비트율이 4 Mbps에서 7 Mbps 사이의 값을 가질 경우 1 Mbps 만큼의 비트율 증가는 약 1.5 dB 정도의 화질 향상을 발생시킨다.
비트율이 7 Mbps에서 10 Mbps 사이의 값을 가질 경우 1 Mbps 만큼의 비트율 증가는 약 1 dB 정도의 화질 향상을 발생시킨다.
비트율이 10 Mbps 이상의 값을 가질 경우 더 이상의 비트율 증가는 시각적으로 의미 있는 효과를 나타내지 않는다.
상기 기술한 바와 같이 GOP 단위가 아닌 각 픽쳐 단위로 비트를 할당한 다음 매크로블록 단위로 각각에 대한 복잡도를 이용한 적응적인 방법에 의해 비트량을 결정한다. 그리고 이를 이용하여 최종적으로 양자화 계수를 결정함으로써 비트율 제어 과정을 완성한다.
또한 부호화된 프레임의 화질을 정량적으로 계산하여 현재 비디오 신호에 대하여 최선의 화질을 발생시킬 수 있는 목표 비트율을 정확하게 계산할 수 있다.
도 4를 이용하여 다시 설명하면 다음과 같다.
즉, 목표 비트율(TBR)이 결정되면(단계 401), K=0로 초기화하고 새로운 GOP를 시작한다(단계 402). 이때 현재 프레임에 대한 목표 비트량 TBpic을 결정하고(단계 403), 현재 프레임을 I 픽쳐로 인코딩한 후 K 값을 1 증가시킨다(단계 404).
그리고 다음 인코딩할 픽쳐가 존재하는지를 판단한다(단계 405). 만일 다음 인코딩할 픽쳐가 없으면 프로그램을 종료하고, 다음 인코딩할 픽쳐가 존재하면 증가된 K 값이 기 결정된 GOP의 최대 크기 Max_GOP_Size와 같은지를 비교한다(단계 406). 만일 K 값이 기 결정된 GOP의 최대 크기 Max_GOP_Size와 같다면 현재 인코딩 중인 GOP에는 더 이상의 픽쳐를 포함시킬 수 없으므로 단계 402로 진행하여 새로운 GOP를 시작한다. 결과적으로 다음에 입력되는 프레임은 I 픽쳐로 인코딩이 이루어진다.
한편 상기 단계 406에서 K 값이 기 결정된 GOP의 최대 크기 Max_GOP_Size와 같지 않다면 장면 전환 검출부(214)의 출력으로부터 장면 전환이 발생하였는지를 판별한다(단계 407). 만일 장면 전환이 발생하였다고 판별되면 단계 402로 진행하여 다음에 입력되는 프레임을 I 픽쳐로 인코딩하는 새로운 GOP를 시작한다.
상기 단계 407에서 장면 전환이 발생하지 않았다고 판별되면 비교부(213)의 출력으로부터 화질 저하가 발생하였는지를 판별한다(단계 408). 만일 화질 저하가 발생하였다고 판별되면 즉, 계산된 화질이 기준값보다 낮으면 해당 비트율에 의해 만족스러운 화질을 얻을 수 없으므로 단계 401로 진행하여 목표 비트율을 다시 계산한다.
그러나 화질 저하가 발생하지 않았다고 판단되면 단계 403로 진행하여 입력 프레임에 대한 목표 비트량을 결정하고 부호화를 수행한다.
본 발명은 디지털 TV에 하드 디스크를 장착한 PVR에서 NTSC 및 PAL과 같은 아날로그 방송을 디지털 스트림으로 부호화하여 저장하는 분야에 적용할 수 있으며, 그 외에도 실시간 가변 비트율 및 고정 비트율 MPEG-2 비디오 부호화 장치와 관련된 응용 분야에 적용할 수 있다.
한편 본 발명에서 사용되는 용어(terminology)들은 본 발명에서의 기능을 고 려하여 정의 내려진 용어들로써 이는 당분야에 종사하는 기술자의 의도 또는 관례 등에 따라 달라질 수 있으므로 그 정의는 본 발명의 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명은 상술한 실시예에 한정되지 않으며, 첨부된 청구범위에서 알 수 있는 바와 같이 본 발명이 속한 분야의 통상의 지식을 가진 자에 의해 변형이 가능하고 이러한 변형은 본 발명의 범위에 속한다.
상기에서 설명한 본 발명에 따른 비디오 부호화 장치 및 그 방법의 효과를 설명하면 다음과 같다.
첫째, 아날로그 방송 신호(예를 들면, NTSC 전송 방식)를 주어진 비트율의 제약을 준수하면서 MPEG-2 비디오 스트림으로 실시간 부호화하는 과정에서 가변 GOP 구조를 이용하여 기존의 화질을 유지함과 동시에 비트 소모량을 줄임으로써, 단일 패스 MPEG-2 부호화 과정의 효율성을 증가시킴과 동시에 PVR의 저장 공간을 효과적으로 운용할 수 있게 된다.
둘째, 가변 비트율 제어 과정에서 부호화된 프레임의 화질을 기준으로 새로운 구간에 대하여 목표 화질에 적합한 비트율을 정량적으로 획득할 수 있는 방법을 제공함으로써, 화질 및 비트율 제어 측면에서 최적의 비디오 부호화를 수행할 수 있다.
셋째, 변화가 크지 않은 비디오 구간의 경우에 I 픽쳐의 개수를 줄임으로써 기존과 동일한 화질을 유지하면서 효과적으로 비트 소모량을 줄일 수 있다.
이상 설명한 내용을 통해 당업자라면 본 발명의 기술 사상을 일탈하지 아니하는 범위에서 다양한 변경 및 수정이 가능함을 알 수 있을 것이다.
따라서, 본 발명의 기술적 범위는 실시예에 기재된 내용으로 한정되는 것이 아니라 특허 청구의 범위에 의하여 정해져야 한다.
Claims (10)
- 입력되는 영상을 DCT 변환하고 양자화한 후 가변 길이 코딩(VLC)하여 입력 영상을 압축 부호화하는 비디오 부호화 장치에 있어서,압축 부호화된 후 다시 복호화된 이전 영상을 저장하고 있는 프레임 메모리;입력되는 현재 영상과 상기 프레임 메모리에 저장된 이전 영상을 비교하여 부호화된 영상의 화질을 검출하는 비교부;입력되는 현재 영상과 이전 영상을 이용하여 장면 전환을 검출하는 장면 전환 검출부;상기 비교부의 출력과 장면 전환 검출부의 출력에 따라 새로운 GOP의 시작 여부를 결정하고, 상기 비교부에서 출력한 값을 이용하여 다음 비디오 구간을 부호화하기 위한 비트율을 결정하는 비트율 제어 및 양자화부; 및상기 결정된 비트율로 입력 영상을 압축 부호화하는 부호화부;를 포함하고,상기 비교부는,입력되는 현재 영상과 상기 프레임 메모리에 저장된 이전 영상의 신호 대 잡음비를 프레임 단위로 계산하여 부호화된 프레임의 화질을 검출하고,상기 비트율 제어 및 양자화부는,상기 GOP 내에 포함되는 픽쳐의 개수가 기 설정된 최대 픽쳐수와 같아지면 다음 입력 영상부터 새로운 GOP가 시작되도록 제어하고, 입력 영상의 부호화를 위한 목표 비트율이 결정되면 GOP 단위의 할당이 아닌 각 픽쳐 타입별로 정해진 규칙에 따라 목표 비트량을 할당하는 것을 특징으로 하는 비디오 부호화 장치.
- 제 1 항에 있어서,상기 비트율 제어 및 양자화부는,TBR을 목표 비트율, T1, TP, TB는 각각 하나의 I 픽쳐, P 픽쳐, B 픽쳐에 대하여 할당되는 비트량이라고 할 때,TI = TBR/10, TP = (2 x TBR)/45, TB= (1 x TBR)/45에 따라 각 피쳐 타입에 대한 비트량 할당을 하는 것을 특징으로 하는 비디오 부호화 장치.
- 제 1 항에 있어서,상기 부호화부는,상기 GOP 내에 포함되는 픽쳐의 개수가 기 설정된 최대 픽쳐수와 같아지면 다음 입력 영상부터 새로운 GOP가 시작되도록 제어하는 것을 특징으로 하는 비디오 부호화 장치.
- 제 1 항에 있어서,상기 부호화부는,상기 장면 전환 검출부에서 장면 전환으로 검출되면 현재 입력 영상을 I 픽쳐로 부호화하며, I 픽쳐로 부호화된 현재 픽쳐부터 새로운 GOP가 시작되는 것을 특징으로 하는 비디오 부호화 장치.
- 제 1 항에 있어서,상기 부호화부는,상기 비교부에서 검출된 화질이 기 설정된 기준 화질보다 낮으면 목표 비트율을 새로 계산하고 계산된 목표 비트율로 다음 입력 영상을 부호화하는 것을 특징으로 하는 비디오 부호화 장치.
- 제 5 항에 있어서,상기 부호화부는,상기 다음 입력 영상은 I 픽쳐로 부호화하며, I 픽쳐로 부호화된 픽쳐부터 기 설정된 목표 비트율을 적용한 새로운 GOP가 시작되는 것을 특징으로 하는 비디오 부호화 장치.
- 목표 비트율 및 비트량을 결정하고 입력되는 영상을 압축 부호화하는 비디오 부호화 방법에 있어서,(a) 입력되는 현재 영상과 이를 부호화한 결과를 비교하여 부호화된 영상의 화질을 검출하는 단계;(b) 입력되는 현재 영상과 한 프레임 지연된 이전 영상을 비교하여 장면 전환을 검출하는 단계; 및(c) 상기 단계의 장면 전환 검출 및 부호화된 화질 상태에 따라 새로운 GOP의 시작 여부와 비트율을 제어하여 입력 영상을 부호화하는 단계;를 포함하고,상기 (c) 단계는,입력 영상의 부호화를 위한 목표 비트율이 결정되면 각 픽쳐 타입별로 정해진 규칙에 따라 목표 비트량을 할당하고,상기 정해진 규칙은,TBR을 목표 비트율, T1, TP, TB는 각각 하나의 I 픽쳐, P 픽쳐, B 픽쳐에 대하여 할당되는 비트량이라고 할 때,TI = TBR/10, TP = (2 x TBR)/45, TB= (1 x TBR)/45에 따라 각 피쳐 타입에 대한 비트량을 할당하는 것을 특징으로 하는 비디오 부호화 방법.
- 제 7 항에 있어서,상기 (c) 단계는,I 픽쳐 이후로 입력되는 픽쳐의 개수가 기 설정된 GOP 내 최대 픽쳐수와 같아지거나 장면 전환이 검출되거나 부호화된 영상의 화질이 기준값 이하가 되면 새로운 GOP의 시작으로 판단하는 단계; 및상기 단계에서 새로운 GOP의 시작으로 판별되면 I 픽쳐의 목표 비트량을 결정하고 입력 영상을 I 픽쳐로 부호화하는 단계;를 포함하는 비디오 부호화 방법.
- 제 7 항에 있어서,상기 (c) 단계는,상기 부호화된 영상의 화질이 기준값보다 낮으면 목표 비트율을 새로 계산하고 계산된 비트율로 다음 입력 영상을 부호화하는 것을 특징으로 하는 비디오 부호화 방법.
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050025520A KR101087109B1 (ko) | 2005-03-28 | 2005-03-28 | 비디오 부호화 장치 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050025520A KR101087109B1 (ko) | 2005-03-28 | 2005-03-28 | 비디오 부호화 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060103681A KR20060103681A (ko) | 2006-10-04 |
KR101087109B1 true KR101087109B1 (ko) | 2011-11-25 |
Family
ID=37623564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050025520A KR101087109B1 (ko) | 2005-03-28 | 2005-03-28 | 비디오 부호화 장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101087109B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100853143B1 (ko) * | 2007-02-15 | 2008-08-20 | 충북대학교 산학협력단 | I 프레임 태그를 이용한 동영상 압축 및 복원방법 |
KR101033442B1 (ko) * | 2008-06-12 | 2011-05-09 | 주식회사 몬도시스템즈 | 영상 처리 시스템에서 비트 레이트를 제어하는 장치 및방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0147938B1 (ko) * | 1994-07-30 | 1998-09-15 | 배순훈 | 균일한 첨두신호대 잡음비를 유지하기 위한 비트할당회로 |
KR19990088475A (ko) * | 1998-05-29 | 1999-12-27 | 포만 제프리 엘 | 다수의비디오프레임스트림처리방법및그장치 |
KR20010099660A (ko) * | 1998-09-29 | 2001-11-09 | 매클린토크 샤운 엘 | 고품위 텔레비전 인코더에서 장면변화의 검출 및화면코딩타입의 조정을 행하기 위한 방법 및 장치 |
KR20030082818A (ko) * | 2002-04-18 | 2003-10-23 | 삼성전자주식회사 | 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법 |
-
2005
- 2005-03-28 KR KR1020050025520A patent/KR101087109B1/ko not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0147938B1 (ko) * | 1994-07-30 | 1998-09-15 | 배순훈 | 균일한 첨두신호대 잡음비를 유지하기 위한 비트할당회로 |
KR19990088475A (ko) * | 1998-05-29 | 1999-12-27 | 포만 제프리 엘 | 다수의비디오프레임스트림처리방법및그장치 |
KR20010099660A (ko) * | 1998-09-29 | 2001-11-09 | 매클린토크 샤운 엘 | 고품위 텔레비전 인코더에서 장면변화의 검출 및화면코딩타입의 조정을 행하기 위한 방법 및 장치 |
KR20030082818A (ko) * | 2002-04-18 | 2003-10-23 | 삼성전자주식회사 | 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20060103681A (ko) | 2006-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2421066C (en) | Transcoder-based adaptive quantization for digital video recording | |
KR100252108B1 (ko) | Mpeg 압축부호화 및 복호화기를 채용한 디지털 기록 재생장치 및 그 방법 | |
US20050169371A1 (en) | Video coding apparatus and method for inserting key frame adaptively | |
JP4351746B2 (ja) | 符号化装置、符号化方法、復号装置及び復号方法 | |
US6801574B2 (en) | Apparatus of layered picture coding, apparatus of picture decoding, methods of picture decoding, apparatus of recording for digital broadcasting signal, and apparatus of picture and audio decoding | |
US7010034B2 (en) | Video compression | |
US20100166060A1 (en) | Video transcoder rate control | |
WO1998026602A1 (en) | Equipment and method for compressing picture data | |
EP1825686A1 (en) | System and method for real-time transcoding of digital video for fine-granular scalability | |
JP2001218213A (ja) | 画像信号変換符号化装置 | |
US20060190625A1 (en) | Video encoding method, video encoder, and personal video recorder | |
JP2001028748A (ja) | データ再生伝送装置及びデータ再生伝送方法 | |
JPH0879766A (ja) | 動画像符号化方法及び動画像符号化装置 | |
US6160847A (en) | Detection mechanism for video channel underflow in MPEG-2 video decoding | |
EP1172008A1 (en) | Image data compression | |
JP4114210B2 (ja) | 映像データ圧縮装置およびその方法 | |
US20080253447A1 (en) | Video Transcoding with Selection of Data Portions to be Processed | |
KR101087109B1 (ko) | 비디오 부호화 장치 및 그 방법 | |
KR100617097B1 (ko) | 실시간 동영상 부호화 방법 | |
JPH0998427A (ja) | 動画像符号化装置 | |
JPH08251597A (ja) | 動画像符号化/復号化装置 | |
KR100793781B1 (ko) | 실시간 동영상 부호화 장치 및 방법 | |
JP4573511B2 (ja) | トランスコーダ、トランスコーディング方法、データ記録装置及び方法、並びに放送データ受信・記録装置 | |
Van der Schaar-Mitrea et al. | Near-lossless embedded compression algorithm for cost reduction in DTV receivers | |
KR20060024609A (ko) | 실시간 동영상 부호화 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20141024 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151023 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |