KR20060062744A - 동영상 압축 및 복원 방법 - Google Patents

동영상 압축 및 복원 방법 Download PDF

Info

Publication number
KR20060062744A
KR20060062744A KR1020040101690A KR20040101690A KR20060062744A KR 20060062744 A KR20060062744 A KR 20060062744A KR 1020040101690 A KR1020040101690 A KR 1020040101690A KR 20040101690 A KR20040101690 A KR 20040101690A KR 20060062744 A KR20060062744 A KR 20060062744A
Authority
KR
South Korea
Prior art keywords
frame
frames
gob
error
compressed
Prior art date
Application number
KR1020040101690A
Other languages
English (en)
Other versions
KR100669634B1 (ko
Inventor
이진수
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020040101690A priority Critical patent/KR100669634B1/ko
Priority to US11/294,724 priority patent/US20060120449A1/en
Priority to PCT/KR2005/004150 priority patent/WO2006062333A1/en
Priority to EP05821437A priority patent/EP1820350A4/en
Publication of KR20060062744A publication Critical patent/KR20060062744A/ko
Application granted granted Critical
Publication of KR100669634B1 publication Critical patent/KR100669634B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 동영상 압축 과정에서 발생되는 프레임 구성시에 I 프레임을 매번 참조케 함으로써 프레임 오류가 전파되는 것을 방지할 수 있도록 한 동영상 압축 및 복원 방법에 관한 것이다.
이와 같은 목적을 달성하기 위한 본 발명에 따른 동영상 압축 및 복원 방법은, 다른 프레임을 참조하지 않고 압축되는 I 프레임과, 다른 프레임을 참조하여 압축되는 프레임으로 구성된 동영상 압축 및 복원 방법에 있어서, GOB내 모든 P 프레임은 해당 GOB의 I 프레임을 참조하는 것을 특징으로 한다.
이와 같은 본 발명에 의한 동영상 압축 방법에 따르면, 네트워크 환경에 적응적으로 대처하거나, 서로 다른 단말기 간의 원활한 호환성과 화질을 보증하기 위한 시간적 계위성(scalability)을 효과적으로 지원할 수 있는 것과 동시에 무선 환경에서의 응용에 맞추어 오류 환경 대응 능력이 향상될 수 있게 되었다.
I 프레임, P 프레임, B 프레임, MPEG, 동영상

Description

동영상 압축 및 복원 방법{Methods for encoding and decoding moving picture data}
도 1은 종래의 MPEG4에 따른 P 프레임의 표준 인코딩 방법을 설명하는 도면
도 2는 종래의 I 프레임, P 프레임 및 B 프레임으로 구성된 영상에서의 P 프레임과 B 프레임의 프레임 참조 방법을 설명하기 위한 도면
도 3은 종래의 I 프레임과 P 프레임으로만 구성된 영상에서의 P 프레임의 프레임 참조 방법을 설명하기 위한 도면
도 4는 본 발명의 일실시예에 따른 I 프레임과 P 프레임으로만 구성된 영상에서의 P 프레임의 프레임 참조 방법을 설명하기 위한 도면
도 5는 본 발명의 다른 실시예에 따른 I 프레임과 B 프레임으로만 구성된 영상에서의 B 프레임의 2개의 I 프레임 참조 방법을 설명하기 위한 도면
도 6a 및 도 6b는 본 발명의 다른 실시예에 따른 B 프레임이 2개의 I 프레임을 참조하는 경우의 영상전송순서를 설명하기 위한 도면
<도면의 주요 부분에 대한 부호의 설명>
210: I 프레임 220: P 프레임
230: B 프레임 240: GOB
본 발명은 동영상 압축 및 복원 방법에 관한 것이다.
지난 수년간 MPEG(Moving Picture Expert Group)1,2,4 등 동영상 압축 방법(코덱)이 많은 분야에서 사용되고 있다. 특히 최근에는 압축률을 높이려는 시도에 따라 H.264가 MPEG4 part 10으로 제정되었다. 하지만 무엇보다 이들 동영상 코덱이 무선 이동 단말 장치에 활용됨에 따라, 단순한 압축률 보다는 적은 연산량과 화질 유지를 위한 QoS (Quality Of Service)가 보다 중요한 이슈가 되고 있다.
일반적으로 핸드폰이나 PDA와 같은 무선 이동 단말 장치는, PC와는 달리 CPU도 연산 능력이 제한적이고 사용할 수 있는 메모리 량 등도 제한적일 수 밖에 없다. 따라서 제한 적인 리소스와 적은 전력을 가지고, 동영상 압축 및 복원과 같은 복잡한 연산을 처리하기 위해, 전용 하드웨어나 DSP(Digital Signal Processor)등이 개발되어 사용되고 있다. 한편에서는 알고리즘을 보다 단순화하거나, 지금까지와는 조금 다른 방식의 새로운 무선 환경 용 영상 코덱을 개발하는 곳도 있다. 하지만 두번째의 경우, 무선 환경에서 서로 다른 단말 장치와의 호환성을 유지하기 위해 표준이 아닌 영상 코덱의 사용에는 무리가 있는 것이 실정이다.
QoS 관련된 이슈로는, 무선 중에 손실되거나 왜곡 되는 오류 데이터에 의한 화질 저하를 막기 위한 에러 복구(Error Resilience) 분야와, 네트워크나 단말 환경에 따라 적합한 스펙의 영상을 적응적으로 전송하기 위한 UMA (Universal Multimedia Assess) 분야가 있다.
UMA 분야를 조금 더 자세히 기술하면 다음과 같다.
일반적으로 영상의 품질은 공간적 화질, 초당 프레임 수, 그리고 해상도로 나타내어질 수 있다. 해상도는 QCIF(Quarter Common Intermediate Format) (176x144), QVGA(Quad Video Graphic Array)(320x240)과 같은 픽셀수에 따라 달라지고, 초당 플레이되는 프레임 수는 자연스럽게 움직임이 보이는 정도를 결정하는 요소로서, 일반적으로 24fps(frame per second) 이상이면 눈으로 자연스럽게 느껴지나, 이동 단말에서는 제한된 성능과 네트워크 대역폭(bandwidth)으로 인하여 15fps 이하로 이루어지는 것이 대부분이다. 공간적 화질은 각 프레임을 정지해놓고 보았을 때 보이는 화질로서, 화질을 좋게 하기 위해서는 압축률이 떨어지고, 따라서 전송할 데이터량이 많아지므로 이들간의 조절을 적절하게 해야 한다.
UMA란 서로 다른 환경의 단말 환경에 서로 호환되도록 전송 파일 포멧을 적응적으로 변경하거나, 스펙을 변경하여 전달할 수 있는 기술을 의미한다. 스펙을 변경할 경우에는 다음 세 가지 경우를 가정할 수 있다.
첫째로 단말기의 성능이 서로 상이한 경우이다. 즉 보내는 단말기는 VGA(640x480) 해상도를 지원하는 성능이지만 받는 단말기 성능은 QVGA(320x240)해상도까지만 지원 가능하다면 보내는 단말기가 VGA로 전송하더라도 받는 단말기는 QVGA로 받도록 중간 어디선가 전송 데이터를 변환해주어야 한다.
다음으로는 단말기의 스펙이 서로 상이한 경우이다. 예를 들어 보내는 단말기가 VGA LCD(Liquid Cristal Display)를 장착하고 있고 수신하는 단말기는 QVGA LCD를 장착하고 있다면 이또한 데이터의 변환이 요구된다.
마지막으로 네트워크 환경이 변하는 경우이다. 송신 상황이 초당 약 1Mbits를 전송할 수 있는 1Mbps 환경이라서 VGA 15fps로 전송했으나, 수신측이나 중간 경유지에서 이보다 적은 512Kbps까지만 전송할 수 있는 환경이라면, 수신측에서는 데이터의 50%를 손실(loss)시키거나, 2배 늦게 받게 되어 느리게 디스플레이될 수 있다. 이를 방지하려면 중간에 1Mbps 데이터 크기를 512Kbps 데이터 크기로 축소하는 작업이 필요하다. 이 경우 해상도를 줄이거나 프레임 레이트(frame rate)를 줄여서 데이터 크기를 변경할 수 있다.
이와 같이 데이터 크기를 적응적으로 조정하여, 네트워크 환경에 따라 적응적으로 조정 가능한 것을 계위성(scalability)이라고 한다. 해상도를 조정하는 것을 공간적 scalability라고 하며 프레임율을 조정하는 것을 시간적 scalability라고 한다. 공간적 scalability는 웨이블릿(Wavelet) 방식의 영상 코덱이나, MPEG4에서 연구되고 있다.
MPEG4에서 사용되는 일반적인 압축 방법을 첨부된 도면을 참조하여 간략하게 기술하면 다음과 같다.
도 1은 종래의 MPEG4에 따른 P 프레임의 표준 인코딩 방법을 설명하는 도면이다.
입력버퍼로 입력된(S110) 영상정보로부터 일정크기의 매크로 블록 단위로 움 직임 추정(motion estimation)이 되어지는(S120) 한편, 공간적 상관관계에 따른 공간적 압축과정(S130)이 수행된다.
상기 공간적 압축과정(S130)은 DCT 과정(S131) 과 양자화(Quantizing) 과정(S132)의 이중의 압축과정으로 진행되는 것이 일반적이다.
상기 공간적 압축과정(S130)이 행해진 압축된 영상정보는, 역 양자화과정(S141) 및 역 DCT 과정(S142) 등의 역변환 과정(S140)을 거친다. 이후 움직임 보상 과정(S150)이 수행된 후, 프레임 버퍼에 입력된다(S160).
상기 프레임 버퍼에 입력된 영상정보는, 이후에 입력 버퍼로 입력되는 영상정보와 함께 이후 프레임의 구성에 사용되어 진다. 이때 이전 영상정보와 현재 영상정보의 변화에 따른 움직임 벡터을 이용한 시간적 압축과정이 수행됨으로써 전체 영상정보에 대한 압축률이 강화되게 된다.
상기 공간적 압축과정(S130)이 수행된 압축된 영상정보는 부호화 과정(S170)을 거친 후 출력버퍼로 출력된다(S180). 상기 출력버퍼로 출력된 압축된 영상정보는 적절한 전송매체를 통하여, 저장수단에 저장되거나 원하는 수신수단으로 전송되어 진다.
상기 과정에서 수행되는 영상정보에 대한 압축 방법에 대하여 보다 상세히 설명한다. 먼저, 압축은 크게 공간적 압축과 시간적 압축을 사용한다.
공간적 압축이란, JPEG(Joint Photograhpic Expert Group)과 같이 한장의 프레임을 압축하는 것으로서, 주로 매크로 블록(16x16 pixel의 블록) 단위로, 주파수 도메인(frequency domain)으로 변환시키는 DCT(Discrete Cosine Transform:이산 여 현 변환)를 수행 한 후에 허프만 코딩과 같은 방법으로 압축을 수행한다.
시간적 압축이란, 연속된 두 프레임간의 영상 차가 크지 않다는 점을 이용하는 것으로서, 역시 매크로 블록 단위로 압축을 수행하되, 이전 프레임에서 가장 유사한 매크로 블록 만큼의 부분영역을 찾아, 그 부분 영역과 현재의 매크로 블록간의 차이를 구한 후, 이 값을 DCT를 수행하여 마찬가지로 압축을 수행한다. 이렇게 하는 이유는, 일반적으로 이웃한 픽셀값들의 변화가 적은 단조로운 값의 특성을 가질수록, DCT결과가 연속된 0값들로 이루어질 확률이 커지며, 그럴수록 압축률이 높아지기 때문이다. 이와 같이 이전 프레임에서의 유사한 부분영역을 찾는 과정을 움직임 추정(motion estimation)이라고 한다.
도 1에서는 이전 프레임을 참조하여 움직임 추정을 하는 경우에 바로 앞 영상을 참조하는 경우를 기술 하였으며, MPEG4에서는 앞 뒤 영상을 참조하는 기술도 소개하고 있다. 바로 앞 영상을 참조하는 경우 P 프레임(Predicted frame)이라고 하고, 앞뒤 영상을 모두 참조하는 경우 B 프레임(Bi-directional frame)이라고 한다.
상기와 같이 이전 프레임 및 앞 뒤 프레임을 참조하는 경우에, 만일 전송 도중 오류가 발생하여 한 프레임의 화질에 손상을 입게 되면, 그 프레임을 참조하는 다음 프레임도 손상되게 되고, 그러한 오류는 계속 이후 프레임에 영향을 주어 손상의 영향이 점점 더 심화되게 되는데, 이러한 현상을 오류전파(Error propagation) 라고 한다.
이러한 현상을 방지하기 위해 MPEG4에서는, 첫번째 프레임과 함께 주기적으 로 아무 프레임도 참조하지 않고 현 프레임만을 독립적으로 압축하는 I 프레임(Intra frame)을 삽입하게 된다. 즉 오류에 의해 화질이 저하 되어도 새롭게 삽입되는 I 프레임은 이전의 결과에 아무런 영향을 받지 않고 새롭게 압축되어 전송된 것이므로, 오류가 더 이상 전파되지 않는다.
이러한 I 프레임, P 프레임, B 프레임과 각 프레임이 움직임 추정을 위해 참조하는 관계를 도 2 및 도 3을 참조하여 설명한다.
도 2는 종래의 I 프레임, P 프레임 및 B 프레임으로 구성된 영상에서의 P 프레임과 B 프레임의 프레임 참조 방법을 설명하기 위한 도면이다.
도 2에서는 4프레임[(I210, P211, B210, P211), (I220, P221, B220, P222), (I230, P231, B230, P232)]마다 I 프레임(I210, I220, I230)을 삽입한 4 size의 GOP 예이며, 이경우 각 GOP마다 2개의 P 프레임[(P211, P212), (P221, P222), (P231, P232)]과 1개의 B 프레임(B210, B220, B230)과 I 프레임(I210, I220, I230)이 있다.
일반적으로 B 프레임(B210, B220, B230)은 두개의 프레임을 참조해야 하므로 연산량이 다른 프레임에 비해 많다. 따라서, 모바일 단말과 같이 제한된 자원을 사용하는 경우에는 P 프레임과 I 프레임으로만 구성된 프로파일을 사용하고 있다.
도 3은 종래의 I 프레임과 P 프레임으로만 구성된 영상에서의 P 프레임의 프레임 참조 방법을 설명하기 위한 도면이다.
도 3에 도시된 바와 같이, 종래의 P 프레임(P311 내지 P316)은 해당 GOB내의 I 프레임(I310)과 이전의 P 프레임(P311 내지 P315)을 참조하게 되므로, 영상 전송시 오류가 발생하더라도 다음 GOB(I320, P321 내지 P326)의 I 프레임(I320)부터는 아무런 참조 없이 새롭게 압축이 되므로, 이전의 오류에 의한 영향을 받지 않는다. 따라서 사용자가 볼 때에는 화질이 점점 나빠지다가 주기적으로 좋아지는 것 처럼 보이는데, 이를 리프레쉬(refresh)라고 한다. 즉 I 프레임(I320)이 삽입될 때 마다 리프레쉬가 일어난다. 따라서, I 프레임을 자주 삽입하면 리프레쉬 주기가 짧아져 화질은 좋아질 수 있으나, 처리해야 하는 데이터 양이 많아지는 문제점이 발생한다.
본 발명은 네트워크 환경에 적응적으로 대처하거나, 서로 다른 단말기 간의 원할한 호환성과 화질을 보증하기 위한 시간적 게위성을 효과적으로 지원할 수 있는 것과 동시에 무선 환경에서의 응용에 맞추어 오류 환경 대응 능력이 향상된 동영상 압축 방법을 제공하는 것에 그 목적이 있다.
본 발명은 다음 I 프레임이 도착하여 리프레쉬가 일어나기 이전에라도, 앞서 발생한 오류가 전파되는 것을 방지하여 현재에 영향을 미치지 않도록 함으로써, 오류전파에 의한 화질의 점진적 악화를 방지하는 동영상 압축 방법을 제공하는 것에 그 목적이 있다.
본 발명은 MPEG1,2,4 및 H.263, H.264에 공통적으로 적용할 수 있는 동영상 압축 방법을 제공하는 것에 그 목적이 있다.
한편, 본 발명은 상기 본 발명의 동영상 압축 방법에 따라 압축된 압축 동영 상 데이터를 전송시키기 위한 압축 동영상 전송 방법을 제공하는 것에 다른 목적이 있다.
또한, 본 발명은 상기 본 발명의 압축 동영상 전송 방법에 따라 전송된 압축 동영상 데이터를 복원시키기 위한 압축 동영상 복원 방법을 제공하는 것에 또 다른 목적이 있다.
이와 같은 목적을 달성하기 위한 본 발명에 따른 동영상 압축 및 복원 방법은, 다른 프레임을 참조하지 않고 압축하는 I 프레임과, 다른 프레임을 참조하여 압축되는 프레임으로 구성된 동영상 압축 및 복원 방법에 있어서, GOB내 모든 P 프레임은 해당 GOB의 I 프레임을 참조하는 것을 특징으로 한다.
상기 압축방법에 따라 동영상 프레임을 압축시키고 복원시키는 경우, 상기 I 프레임은 해당 I 프레임에 대한 오류 강성을 위해 데이터 은닉을 이용한 오류 검출 알고리즘을 더 포함하는 것을 특징으로 한다.
상기 데이터 은닉을 이용한 오류 검출 알고리즘은 압축시 DCT 블록의 계수의 합이 짝수 또는 홀수가 되도록 강제로 맞추는 단계와, 복원시 계수의 합이 짝수 또는 홀수가 아닐 경우 이를 오류로 판단하는 단계로 구성되는 것을 특징으로 한다.
상기 목적을 달성하기 위한 본 발명에 따른 동영상 압축 방법은, 다른 프레임을 참조하지 않고 압축하는 I 프레임과 다른 프레임을 참조하여 압축되는 프레임으로 구성된 동영상 압축 방법에 있어서, 다른 프레임을 참조하는 프레임은 두개의 I 프레임을 참조하는 B 프레임으로 구성된 것을 특징으로 한다.
상기 두개의 I 프레임은 해당 GOB의 I 프레임과 다음 GOB의 I 프레임인 것을 특징으로 한다.
상기 다른 목적을 달성하기 위한 본 발명에 따른 압축 동영상 전송 방법은, 첫 프레임의 경우 첫번째 GOB의 I 프레임을 전송시키고, 두번째 GOB의 I 프레임을 전송시킨 이후에 첫번째 GOB의 B 프레임을 전송시키는 단계와, 두번째 GOB부터는 n+1번째 GOB의 I 프레임을 전송시킨 후, n번째 GOB의 B 프레임을 전송시키는 단계를 포함하여 구성되는 것을 특징으로 한다.
상기 또 다른 목적을 달성하기 위한 본 발명에 따른 압축 동영상 복원 방법은, 첫번째 프레임인 경우 첫번째 GOB의 I 프레임과 두번째 GOB의 I 프레임을 순차적으로 복원시킨 후 첫번째 GOB의 B 프레임들을 순차적으로 복원시키는 단계와, 두번째 GOB부터는, n+1번째 I 프레임을 먼저 복원시킨 후, n번째 GOB의 B 프레임들을 복원시키는 단계를 포함하여 구성되는 것을 특징으로 한다.
상기 본 발명에 따른 동영상 압축 방법과 압축 동영상 전송 및 복원 방법은 MPEG1,2,4 및 H.263, H.264에 따른 영상 압축과 압축 데이터 전송 및 복원 과정에 공통적으로 적용될 수 있는 특징이 있으나, 본 발명의 설명을 위하여 이하에서는 MPEG4를 예로 하여 설명하기로 한다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예에 따른 동영상 압축 방법에 대하여 상세히 설명한다.
도 4는 본 발명의 일실시예에 따른 동영상 압축 방법에서의 P 프레임의 구성 방법을 나타낸 도면이다.
도 4에 도시된 바와 같이, 본 발명의 일실시예에 따른 동영상 압축 방법에 따르는 영상정보는 P 프레임과 I 프레임만으로 구성된다.
도 4에서 I410 및 I420은 I 프레임을 나타내고, P411 내지 P416과 P421 내지 P426은 P프레임을 나타낸다. 또한, I410과 P411 내지 P416은 하나의 GOB를 나타내고, I420과 P421 내지 P426은 다른 하나의 GOB를 나타낸다.
화질의 점진적 악화는 매번 바로 앞의 프레임을 참조하기 때문에, 참조할 때마다 오류 영향이 더해져서 일어난다. 본 발명에서는 이를 방지하고자, 모든 P 프레임은 바로 앞의 프레임을 참조하는 대신 해당 GOB의 I 프레임을 참조하도록 한다.
즉, P411 내지 P 416은 해당 GOB내의 I 프레임인 I410을 참조하여 구성시키고, P421 내지 P 426은 해당 GOB내의 I 프레임인 I420을 참조하여 구성시킨다.
이와 같이 함으로써, 중간에 P 프레임에서 오류가 발생하더라도 다른 P 프레임은 오류가 발생한 이전의 P 프레임을 참조하지 않기 때문에, 다른 P 프레임으로 더 이상 오류가 전파되지 않는다.
한편, 모든 P 프레임이 I 프레임을 참조하는 대신, I 프레임의 오류 발생 여부는 매우 중요해진다. 따라서 I 프레임의 오류 강성 툴을 강화해줄 필요가 있다. 표준에서는 몇가지 에러 복구 툴(Error Resilience Tool)를 제안하고 있으며, 본 발명에서는 I 프레임의 오류 강성을 위해 표준에서 제안하는 에러 복구 툴을 I 프레임에 모두 적용함과 동시에 데이터 은닉을 통한 오류 강성 방법이 I 프레임에 대 해서만 추가로 적용되도록 하였다. 데이터 은닉이란 원화질의 영향을 주지 않으면서 원하는 데이터를 은닉시키는 기술로 많은 기술이 소개되고 있다.
본 발명에 따른 실시예에서는 매 DCT(8x8) 블록 마다, 계수의 합이 짝수가 되도록 강제로 계수를 세팅함으로서, 오류로 인하여 계수의 합이 홀수가 될 경우 오류로 인식하여 오류를 복구시키도록 한다.
또한, 매 DCT(8x8) 블록 마다, 계수의 합이 홀수가 되도록 강제로 계수를 세팅하는 경우에는, 오류로 인하여 계수의 합이 짝수가 될 경우 오류로 인식하여 오류를 복구시키도록 할 수 있음은 물론이다.
한편, 보다 안전한 오류 강성을 위해 해당 GOB의 I 프레임과 바로 다음 GOB의 I 프레임을 함께 참조하도록 구성할 수 있다.
도 5는 본 발명의 다른 실시예에 따른 I 프레임과 B 프레임으로만 구성된 영상에서의 B 프레임의 2개의 I 프레임 참조 방법을 설명하기 위한 도면이다.
도 5에서 I510 및 I520은 I 프레임을 나타내고, B511 내지 B516과 B521 내지 B526은 B프레임을 나타낸다. 또한, I510과 P511 내지 B516은 하나의 GOB를 나타내고, I520과 B521 내지 B526은 다른 하나의 GOB를 나타낸다.
도 5에 도시된 바와 같이, B 프레임의 하나인 B511은 보다 안전한 오류 강성을 위해 해당 GOB의 I 프레임인 I510과 바로 다음 GOB의 I 프레임인 I520을 함께 참조하여 구성시킨다. 즉, 종래의 P프레임을 참조하는 B 프레임과 같이 2개의 프레임을 참조하되, 두개의 GOB에서 두개의 I 프레임을 참조시켜 구성시키도록 하는 것이다.
이와 같이 함으로써, 만일 하나의 I 프레임에서 큰 오류가 발생하더라도 오류 영향이 부분적으로만 나뉘도록 하여 보다 안전한 오류 강성을 도모할 수 있다.
상기와 같이 영상정보를 구성시키는 경우에는 시간축에 따른 순차적 구성이 아니므로, 상기와 같이 구성된 영상정보를 전송하기 위해서는 그 전송되는 순서를 달리 해야 할 필요성이 생긴다. 즉, 이 경우 전송 순서는 일반적인 경우와 상이해져야 실시간 재생이 가능하다,
도 6a 및 도 6b는 본 발명의 다른 실시예에 따른 B 프레임이 2개의 I 프레임을 참조하는 경우의 영상전송순서를 설명하기 위한 도면이다.
도 6a에 도시된 바와 같이, 일반적인 방법으로 영상신호 프레임을 전송시킬 때는, 압축과정에 통해 구성된 프레임을 영상정보를 구성하는 각각의 프레임의 순서에 따라 순차적으로 전송시키게 된다.
즉, 첫번째 GOB의 I 프레임인 I610을 전송하고 B 프레임인 B611, B612, B613을 순차적으로 전송시킨다. 첫번째 GOB의 모든 프레임을 전송시키고 나면, 같은 방법으로 다음번 GOB의 프레임들을 순차적으로 전송시키면 되는 것이다.
그런데. 상기와 같이 일반적인 순서로 전송할 경우, 수신단에서는 다음 GOB의 첫 프레임이 도착할 때 까지 현 GOB의 P 프레임들이 참조할 영상이 없어서 복원될 수 없으므로 신호처리를 하기 위해서 지연(delay)이 발생되는 문제가 생긴다.
상기 문제점을 해결하기 위하여 본 발명은, 첫 프레임의 경우 첫번째 I 프레임을 전송시키고, 두번째 GOB의 I 프레임을 전송시킨 이후에 첫번째 GOB의 B 프레임을 전송시키는 단계와, 두번째 GOB부터는 n+1번째 GOB의 I 프레임을 전송시킨 후 , n번째 GOB의 B 프레임을 전송시키는 단계로 구성되는 압축 동영상 전송 방법을 제공한다.
즉, 도 6b에 도시된 바와 같이, 전송 순서를 첫번째 GOB의 I 프레임인 I610을 전송하고, 두번째 GOB의 I 프레임인 I620을 전송한 후에 첫번째 GOB의 중간 프레임들(B611, B612, B613)을 전송하고 두번째 GOB의 중간 프레임(B621, B622, B623)을 전송하기 전에 세번째 GOB의 I프레임을 먼저 전송하도록 한다. 이후, 두번째 GOB의 중간 프레임(B621, B622, B623)을 전송한다.
이 경우 이전에 보냈던 두번째 GOB의 I 프레임을 저장하고 있으므로 수신단에서 전송되어 온 영상신호를 복원할 때 두개의 I 프레임을 유지할 수 있게 된다.
이상에서 본 발명의 일실시예에 따른 동영상 압축 방법을 MPEG 4에 적용되는 경우를 실시예로 들어 상세히 설명하였다. 그러나, 본 발명은 이에 한정되는 것이 아니라 본 발명의 기술적 사상의 기초를 벗어나지 않고 변경 및 수정을 하더라도 본 발명에 포함되는 것이며, 그러한 사실은 당업자에게 자명할 것이다.
본 발명에 따른 동영상 압축 방법에 따르면, 네트워크 환경에 적응적으로 대처하거나, 서로 다른 단말기 간의 원할한 호환성과 화질을 보증하기 위한 시간적 계위성(scalability)을 효과적으로 지원할 수 있는 것과 동시에 무선 환경에서의 응용에 맞추어 오류 환경 대응 능력이 향상될 수 있게 되었다.
또한, 다음 I 프레임이 도착하여 리프레쉬가 일어나기 이전에라도, 앞서 발 생한 오류가 전파되는 것을 방지하여 현재에 영향을 미치지 않도록 함으로써, 오류전파에 의한 화질의 점진적 악화를 방지하는 것이 가능하게 되었다.
본 발명에 의한 새로운 동영상 압축, 복원 및 전송 방법은 MPEG1,2,4 및 H.263, H.264를 지원하는 무선 이동 통신 환경에 적용될 수 있으므로, 동영상 송수신과 관련되는 모든 응용에서 오류에 강한 화상 서비스를 제공할 수 있는 효과가 있다.
뿐만 아니라, 본 발명은 또한 오류의 전파에 강하고, 오류의 검출을 집중하여 강화시킬 수 있는 방법을 제시함으로써 현실적인 모바일 영상 코덱 알고리즘을 제공 할 수 있도록 하였다.

Claims (7)

  1. 다른 프레임을 참조하지 않고 압축하는 I 프레임과, 다른 프레임을 참조하여 압축되는 프레임으로 구성된 동영상의 압축 및 복원 방법에 있어서,
    GOB내 모든 P 프레임은 해당 GOB의 I 프레임을 참조하는 것을 특징으로 하는 동영상 압축 및 복원 방법.
  2. 제 1항에 있어서, 상기 I 프레임은, 해당 I 프레임에 대한 오류 강성을 위해 데이터 은닉을 이용한 오류 검출 알고리즘을 더 포함하는 것을 특징으로 하는 동영상 압축 방법.
  3. 제 2항에 있어서, 상기 데이터 은닉을 이용한 오류 검출 알고리즘은,
    압축시 DCT 블록의 계수의 합이 짝수 또는 홀수가 되도록 강제 맞추는 단계와,
    복원시 계수의 합이 짝수 또는 홀수가 아닐 경우 이를 오류로 판단하는 단계를 포함하여 구성되는 것을 특징으로 하는 동영상 압축 방법.
  4. 다른 프레임을 참조하지 않고 압축하는 I 프레임과 다른 프레임을 참조하여 압축되는 프레임으로 구성된 동영상 압축 방법에 있어서,
    다른 프레임을 참조하여 압축되는 프레임은 두개의 I 프레임을 참조하는 것 을 특징으로 하는 동영상 압축 방법.
  5. 제 4항에 있어서, 상기 두개의 I 프레임은, 해당 GOB의 I 프레임과 다음 GOB의 I 프레임인 것을 특징으로 하는 동영상 압축 방법.
  6. 두개의 I 프레임을 참조하는 B 프레임을 포함하는 압축된 영상을 전송함에 있어서,
    첫 프레임의 경우 첫번째 GOB의 I 프레임을 전송시키고, 두번째 GOB의 I 프레임을 전송시킨 이후에 첫번째 GOB의 B 프레임을 전송시키는 단계와,
    두번째 GOB부터는 n+1번째 GOB의 I 프레임을 전송시킨 후, n번째 GOB의 B 프레임을 전송시키는 단계를 포함하여 구성되는 것을 특징으로 하는 압축 동영상 전송 방법.
  7. 두개의 I 프레임을 참조하는 B 프레임을 포함하여 압축된 영상을 수신하여 복원함에 있어서,
    수신된 첫번째 프레임인 경우 첫번째 GOB의 I 프레임과 두번째 GOB의 I 프레임을 순차적으로 복원시킨 후 첫번째 GOB의 B 프레임들을 순차적으로 복원시키는 단계와;
    두번째 GOB부터는, n+1번째 I 프레임을 먼저 복원시킨 후, n번째 GOB의 B 프레임들을 복원시키는 단계를 포함하여 구성되는 것을 특징으로 하는 동영상 복원 방법.
KR1020040101690A 2004-12-06 2004-12-06 동영상 압축 및 복원 방법 KR100669634B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020040101690A KR100669634B1 (ko) 2004-12-06 2004-12-06 동영상 압축 및 복원 방법
US11/294,724 US20060120449A1 (en) 2004-12-06 2005-12-05 Method of coding and decoding moving picture
PCT/KR2005/004150 WO2006062333A1 (en) 2004-12-06 2005-12-06 Method of coding and decoding moving picture
EP05821437A EP1820350A4 (en) 2004-12-06 2005-12-06 METHOD FOR CODING AND DECODING A MOVABLE IMAGE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040101690A KR100669634B1 (ko) 2004-12-06 2004-12-06 동영상 압축 및 복원 방법

Publications (2)

Publication Number Publication Date
KR20060062744A true KR20060062744A (ko) 2006-06-12
KR100669634B1 KR100669634B1 (ko) 2007-01-15

Family

ID=36574177

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040101690A KR100669634B1 (ko) 2004-12-06 2004-12-06 동영상 압축 및 복원 방법

Country Status (4)

Country Link
US (1) US20060120449A1 (ko)
EP (1) EP1820350A4 (ko)
KR (1) KR100669634B1 (ko)
WO (1) WO2006062333A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006057983A1 (de) * 2006-12-08 2008-06-12 Siemens Ag Verfahren zur Vidoecodierung einer Folge digitalisierter Bilder
CN101192903B (zh) * 2007-11-28 2011-08-03 腾讯科技(深圳)有限公司 数据帧编解码控制方法
KR101583870B1 (ko) * 2013-09-10 2016-01-22 주식회사 큐램 이미지 인코딩 시스템, 디코딩 시스템 및 그 제공방법
CN105847825A (zh) * 2015-01-16 2016-08-10 杭州海康威视数字技术股份有限公司 视频编码码流的编码、索引存储和访问方法及相应装置
CN105847722B (zh) * 2015-01-16 2019-04-12 杭州海康威视数字技术股份有限公司 一种视频存储方法和装置、读取方法和装置以及存取系统
CN111726620A (zh) * 2019-03-22 2020-09-29 浙江宇视科技有限公司 一种监控视频背景帧的编码方法、装置、电子设备及介质
CN110366003A (zh) * 2019-06-24 2019-10-22 北京大米科技有限公司 视频数据的抗抖动处理方法、装置、电子设备和存储介质
CN112040232B (zh) * 2020-11-04 2021-06-22 北京金山云网络技术有限公司 实时通信的传输方法和装置、实时通信的处理方法和装置
CN115550688A (zh) * 2021-06-30 2022-12-30 华为技术有限公司 视频码流的处理方法、介质、程序产品和电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5282049A (en) * 1991-02-08 1994-01-25 Olympus Optical Co., Ltd. Moving-picture data digital recording and reproducing apparatuses
US5539466A (en) * 1991-07-30 1996-07-23 Sony Corporation Efficient coding apparatus for picture signal and decoding apparatus therefor
TW224553B (en) * 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
JPH0795571A (ja) * 1993-09-27 1995-04-07 Oki Electric Ind Co Ltd 画像符号化装置、画像復号化装置及び多地点間データ伝送方法
JP3068002B2 (ja) * 1995-09-18 2000-07-24 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
GB2305797B (en) * 1995-09-27 2000-03-01 Sony Uk Ltd Video data compression
US6014694A (en) * 1997-06-26 2000-01-11 Citrix Systems, Inc. System for adaptive video/audio transport over a network

Also Published As

Publication number Publication date
EP1820350A4 (en) 2010-11-17
KR100669634B1 (ko) 2007-01-15
WO2006062333A1 (en) 2006-06-15
EP1820350A1 (en) 2007-08-22
US20060120449A1 (en) 2006-06-08

Similar Documents

Publication Publication Date Title
RU2409005C2 (ru) Способ масштабируемого кодирования и декодирования видеосигнала
RU2302707C2 (ru) Кодирующие динамические фильтры
CA2713414C (en) Fast macroblock delta qp decision
US9414086B2 (en) Partial frame utilization in video codecs
EP1575302A2 (en) Intra block walk around refresh for H.264
US20060120449A1 (en) Method of coding and decoding moving picture
US20060133490A1 (en) Apparatus and method of encoding moving picture
KR20060085150A (ko) 베이스 레이어의 내부모드 블록의 예측정보를 이용하여영상신호를 엔코딩/디코딩하는 방법 및 장치
KR20040046320A (ko) 동영상 부호화 방법
Gadgil et al. VPx error resilient video coding using duplicated prediction information
KR100627494B1 (ko) 동영상 부호화기 및 이를 이용한 부호화 방법
US20040228404A1 (en) Moving picture coding method
KR100564967B1 (ko) 동영상 디코더 및 이를 이용한 디코딩 방법
KR20040039809A (ko) 동영상 부호화기 및 이를 이용한 부호화 방법
KR100557118B1 (ko) 동영상 디코더 및 이를 이용한 디코딩 방법
KR100543607B1 (ko) 동영상 디코딩 방법
KR20040047045A (ko) 동영상 디코딩 방법
KR20040039808A (ko) 움직임 벡터 예측 방법
KR20070045737A (ko) 복수의 프레임을 참조하는 시간적 및 공간적 스케일러블인코딩 및 디코딩 방법과 그 장치
KR100590328B1 (ko) 동영상 디코더 및 이를 이용한 디코딩 방법
JP3862479B2 (ja) ビデオダウンコンバージョンにおけるドリフトエラーを防ぐ方法
KR100627493B1 (ko) 동영상 부호화기 및 이를 이용한 부호화 방법
KR100557047B1 (ko) 동영상 디코딩 방법
KR20040035013A (ko) 동영상 디코딩 방법
KR100681920B1 (ko) 복수의 프레임을 참조하는 공간적 스케일러블 인코딩 및디코딩 방법과 그 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091230

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee