KR20010099660A - 고품위 텔레비전 인코더에서 장면변화의 검출 및화면코딩타입의 조정을 행하기 위한 방법 및 장치 - Google Patents

고품위 텔레비전 인코더에서 장면변화의 검출 및화면코딩타입의 조정을 행하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR20010099660A
KR20010099660A KR1020017004044A KR20017004044A KR20010099660A KR 20010099660 A KR20010099660 A KR 20010099660A KR 1020017004044 A KR1020017004044 A KR 1020017004044A KR 20017004044 A KR20017004044 A KR 20017004044A KR 20010099660 A KR20010099660 A KR 20010099660A
Authority
KR
South Korea
Prior art keywords
frame
scene change
encoding
frames
scene
Prior art date
Application number
KR1020017004044A
Other languages
English (en)
Inventor
시우-와이위
Original Assignee
매클린토크 샤운 엘
제너럴 인스트루먼트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 매클린토크 샤운 엘, 제너럴 인스트루먼트 코포레이션 filed Critical 매클린토크 샤운 엘
Publication of KR20010099660A publication Critical patent/KR20010099660A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

디지털 텔레비전 신호의 연속하는 필드간의 장면변화를 검출하기 위한 장치와 그 방법이 제공된다. 장면변화 검출시에, 부적당한 편집으로부터 얻은 플래시나 나쁜 필드를 포함하면, 화면코딩타입은 비디오 인코더의 코딩효율을 최적화하도록 조정된다. 새로운 GOP가 시작되는 I-프레임은 MPEG 인코더(100)의 코딩효율을 상당히 향상시키기 위해 장면변화와 정렬된다. 전처리 스테이지(205, 210)에 있어서, 연속적인 홀수필드간의 화소차 또는 연속적인 짝수필드간의 화소차의 합에서의 변화는 연속적인 입력필드마다 계산된다. 장면변화는, 합에서의 변화의 큰 정의 값이 큰 부의 값에 의해 추종될 때 검출된다. 어느 화면타입을 이용할지에 대한 결정은 최종 부호화 스테이지(225, 235)에 이를 때까지 정해지지 않는다. 인코더 버퍼레벨이 너무 높으면, I-프레임은 금지될 수 있다. 카운터(CountDown)는 정지로부터 이동으로의 천이에 대해 끊임없는 장면변화를 회피하기 위해 장면변화지정을 리셋한다. 장면변화 프레임으로 결정되는 MPEG 필름모드 프레임에 대해서는, 장면변화가 필드 경계상에서 발생했을 경우에(예컨대, 화면에 용장성 필드가 없는 경우에) MPEG 권고 프레임에 기초를 둔 DCT와 예측 부호화는 해제된다.

Description

고품위 텔레비전 인코더에서 장면변화의 검출 및 화면코딩타입의 조정을 행하기 위한 방법 및 장치 {METHOD AND APPARATUS FOR DETECTING SCENE CHANGES AND ADJUSTING PICTURE CODING TYPE IN A HIGH DEFINITION TELEVISION ENCODER}
장면변화와 I-프레임(intra-coded frame)을 정렬시키면 MPEG(Moving Picture Expert's Group) 비디오 인코더의 코딩효율을 상당히 향상시킬 수 있다. 지금까지 이러한 장면변화검출은, 예컨대 휘도값의 편차를 검출함으로써 제공되어 왔다.
몇몇의 현존하는 장면변화검출 제안에 있어서, 장면변화가 끝나고 새로운 GOP(group of pictures)가 시작될 때까지 I-프레임의 코딩은 피하게 된다. 그러나, 장면변화검출은 프레임 단위(frame-by-frame basis)로 행해진다. 그러므로, 이 접근법은 나쁜 편집, 특별한 효과 또는 카메라 플래시의 부정확한 결과를 초래할 수 있는데, 이 경우 장면변화는 동일 프레임의 홀수/짝수 필드 경계상에서 발생할 수도 있다.
따라서, 종래기술에 의해 부닥친 상술한 문제점없이 부적당한 편집으로부터 얻은 플래시나 나쁜 필드를 포함하는 장면변화를 검출하고, 화면코딩타입을 조정하기 위한 시스템을 제공하는 것이 유리하다. 장면변화동안 비디오 인코더의 코딩효율을 보다 좋게 최적화하는 것이 더 유리하다. 또, 장면변화의 검출에 기초한 새로운 GOP의 스케줄링을 위한 유효한 시스템을 제공하는 것이 바람직할 것이다. 게다가, 이 시스템은 연속하는 필드간의 장면변화를 검출할 것이다.
이 시스템은 예견능력을 제공할 필요가 있는 프레임 버퍼메모리의 총계를 최소로 하면서, 장면변화 부근에서 스케줄된 I-프레임이 생기지 않도록 필요한 예견 지연을 제공하는 부호화 처리 파이프라인(pipeline) 구조를 이용할 것이다.
이 구조는 SDTV(standard definition television) 비디오뿐만 아니라, 1920x 1080 I(비월스캔), 1440x1080 I, 1280x720 P(순차스캔)를 포함하는 다른 HDTV 모드 /화소 해상도와 호환가능해야만 한다.
이 시스템은 MPEG-2를 포함하는 어떤 디지털 비디오 코딩구조와도 호환가능해야만 한다.
이 시스템은 인코더 버퍼레벨이 너무 높은 경우에는 I-프레임의 부호화를 금지해야만 한다.
이 시스템은 끊임없는 장면변화상태를 회피하기 위해 장면변화지정을 리셋하는 감시카운터를 정지로부터 이동으로의 천이에 제공해야만 한다.
장면변화 프레임으로서 결정되는 MPEG 필름모드 프레임 화면에 대해서는, 코딩정밀도와 효율성을 향상시키기 위해서 이 시스템은 장면변화가 필드 경계상에서발생했을 경우에 MPEG 권고 프레임에 기초를 둔 DCT(Discrete Cosine Transform)와 예측 부호화를 해제시켜야만 한다.
본 발명은 상기한 이점 및 다른 이점을 갖는 장면변화와 조정구조를 제공한다.
본 발명은 비디오 압축에 관한 것으로, 특히 비디오 인코더의 코딩효율을 최적화하기 위해 장면변화를 검출하고, 화면코딩타입을 조정하는 장치 및 그 방법에 관한 것이다. 본 발명은 디지털 HDTV 인코더의 화면코딩타입 결정과 장면변화검출에 특히 유용하다.
도 1은 본 발명에 따른 HDTV 인코더를 나타낸 블록도이고,
도 2는 본 발명에 따른 비디오 인코더 처리 파이프라인을 나타낸 도면,
도 3은 본 발명에 따른 장면변화 스코어 델타, 가장 최근에 이용된 장면변화스코어 및 연속적인 반복되는 필드수를 결정하기 위한 플로우차트를 나타낸 도면,
도 4는 본 발명에 따른 장면변화 검출프레임을 결정하고, 장면변화 카운트다운 타이머를 활성화하기 위한 플로우차트를 나타낸 도면,
도 5는 본 발명에 따른 scene_change 플래그를 세팅하기 위한 플로우차트를 나타낸 도면,
도 6a와 도 6b는 본 발명에 따른 프레임에 대한 최종 화면 코딩타입을 결정하기 위한 플로우차트를 나타낸 도면이다.
본 발명은 플래시나 부적당한 편집으로부터 얻는 나쁜 필드를 포함하는 연속하는 필드간의 장면변화를 검출하고, 그것에 응답하여 화면코딩타입과 GOP 경계를 조정하는 유효한 비디오 압축구조에 관한 것이다. 그러므로, 용어 "장면변화"은 정상장면변화(프레임 경계에서)와 동일 프레임의 필드경계에서의 장면변화, 나쁜 편집이나 플래시 또는 비디오 이미지의 시퀀스의 어떤 다른 뜻밖의 변화를 포함하는 사상을 포함하기 위해 여기에 일반적으로 사용되고 있다.
본 발명에 따르면, 장면변화검출은 비디오 인코더의 전처리 스테이지에서 행해진다. I-프레임이나 P-프레임과 같은 프레임을 부호화하겠다는 최종결정은 최종 부호화 스테이지까지 진행되지 않는다. 즉, 인코더의 처리 파이프라인은 필요한 프레임 버퍼 메모리의 총계를 최소로 하기 위해 예견버퍼로서 이용된다.
특히, 비디오 인코더의 전처리 스테이지는 연속 입력필드마다 연속 홀수 필드간이나 연속 짝수 필드간의 화소차의 합에서의 변화를 계산한다. 이 때, 장면변화는 합의 변화에서 큰 부의(negative) 값(부의 드레숄드 이하)에 의해 추종되는 큰 정의(positive) 값(정의 드레숄드를 초과)을 찾음으로써 검출된다.
I-프레임은 장면변화가 검출되자마자 처리 파이프라인의 부호화 스테이지에서 금지된다. 장면변화 프레임이 파이프라인의 부호화 스테이지에 도달할 때 새로운 GOP는 시작되고, 파이프라인에 다른 장면변화 프레임은 없다.
장면변화 카운터는 처리 파이프라인에서 일반적으로 부호화되지 않은 장면변화 프레임수를 기억하는데 이용된다. 장면변화 카운터가 장면변화 프레임의 버스트(연속)의 최종 장면변화 프레임을 제외하고는, 0보다 더 큰 값을 갖는 동안 I-프레임은 금지된다.
더욱이, 장면변화 카운트다운 카운터 또는 "감시"카운터는 장면변화가 영구히 세트되지 않는 것을 보증하기 위해 정지프레임으로부터 이동프레임으로의 천이을 고려하는데 이용된다.
게다가, 장면변화 프레임으로서 결정되는 MPEG 필름모드 화면에 대해서는 MPEG 권고 프레임에 기초를 둔 DCT와 예측 부호화는 장면변화가 필드경계에서 지정될 때 해제된다(예컨대, 화면에 용장성 필드가 없을 때). 이러한 해제시에, 프레임이나 필드에 기초를 둔 DCT와 예측은 화면에서 매크로블록 단위로 이용할 수 있다. 이것은 장면변화가 동일 프레임의 홀수/짝수필드에서 발생하는 나쁜 편집을 필드예측이 취급하는데 이용되는 것을 가능하게 한다.
본 발명은 HDTV 인코더와 SDTV 인코더 모두에 이용하는데 적당하다.
본 발명은 연속하는 필드간의 장면변화를 검출하고, 그것에 응답하여 화면코딩타입과 GOP경계를 조정하는 유효한 비디오 압축구조에 관한 것이다.
이하의 전문용어가 사용된다.
용어: 설명:
CountDown ScDet가 거짓으로 설정될 때까지의 잔여 프레임수(정지-
이동 천이 시퀀스에 대한);
d1 제1필드에 대한 연속적인 장면변화 스코어에서의 델타;
d2 제2필드에 대한 연속적인 장면변화 스코어에서의 델타;
FrameCount GOP에서 지금까지 부호화된 프레임수;
GopLen 명목상의 GOP길이;
maxCount 연속적인 반복되는 필드의 최대 허용되는 수;
MaxGopLen 최대 허용되는 GOP길이;
picture_type 장면변화검출에 기초하여 어떻게든지 변경된 화면타입;
preType 전화면(pre-picture)타입 - 명목상 할당된 화면타입;
rfc 반복되는 필드 카운트 - 연속적인 반복되는 필드수;
sc1 장면 스코어1 - 제1필드에 대한 장면변화
메트릭(metric);
sc2 장면 스코어2 - 제2필드에 대한 장면변화 메트릭;
ScCount 장면변화 카운트 - 처리 파이프라인에서 현재 장면변화
프레임의 수;
ScDet 검출된 장면변화 프레임;
scene_change 선언된 장면변화 프레임;
scLast 최종 장면스코어;
ScPending 미결정의 장면변화;
start_new_gop 새로운 GOP를 현재 프레임으로 시작;
Th0 장면스코어(sc1, sc2)에 대한 제로 드레숄드;
ThBuf 새로운 GOP가 시작될 수 있는지의 여부를 판단하는데 이
용되는 버퍼레벨 드레숄드;
ThNeg 장면스코어(sc1, sc2)에 대한 부의 드레숄드;
ThPos 장면스코어(sc1, sc2)에 대한 정의 드레숄드.
도 1은 본 발명에 따른 HDTV 인코더를 나타낸 블록도이다.
인코더(100)는 입력 HDTV 비디오 스트림을 입력받는 HDTV 패널 스플리터(splitter; 110)를 포함한다. 이 스플리터(110)는 8개의 분리된 비디오 압축기 (120~127) 사이에서 데이터를 분할시킨다. 압축기(120)는 PCI(Peripheral Compone nt Interconnect)버스(130)와 연통한다. 비디오 버퍼(140; 예컨대, 선입 선출(FIF O)버퍼)는 버스로부터 압축 비디오 데이터를 입력받고, 그것을 패킷 프로세서(150)에 제공하여 출력 압축 비트스트림을 제공한다. 원형버퍼(165)를 포함하는 마스터 압축제어기(MCC; 160)는 데이터의 흐름을 제어하고, 비디오 압축기(120~127)를 동기화시킨다. 버퍼(165)의 기능은 도 6a와 도 6b와 관련하여 더 상세히 설명한다.
본 발명이 멀티-압축기 HDTV 실시예로 설명되지만, SDTV 데이터도 이용될 수 있다는 점에 주의해야 한다. 게다가, 8개의 압축기(120~127)의 사용은 단지 일례이고, 어떤 갯수의 압축기가 이용되어도 좋다.
입력 HDTV 화면은 8개의 패널로 분할된다. 각 패널은 비디오 압축엔진에 의해 처리된다. 압축엔진(120~127)은 압축된 비디오 데이터를 비디오 버퍼(140)로 덤프(dump)시킨다. 패킷 프로세서(150)는 구성된 출력 대역폭에 의해 결정된 레이트(rate)로 버퍼(140)로부터 압축 데이터를 풀(pull)하고, 이 데이터를 예컨대 MPEG 전송패킷으로 패킷화한다.
도 2는 본 발명에 따른 비디오 인코더 처리 파이프라인을 나타낸 도면이다. 비디오 압축기(120~127)는 파이프라인 아키텍처(200)를 이용하여 비디오 프레임을 처리한다. 파이프라인(200)의 제1스테이지는 비디오 필터링, 다운샘플링(downsampling ; 임의의)을 행하는 전처리 스테이지(205)를 포함하고, 텔레비전 영화와 장면변화 검출 기능부(210)에 이용하기 위해 통계치를 계산한다.
파이프라인(200)의 다음 스테이지는 비디오 프레임을 지연시키고 재배열하는 P/B 프레임 재배열 지연기능부(215)을 포함하고 있다. 이것은 P-프레임이 때때로 B-프레임을 예측하는데 이용하기 위한 디스플레이 순서로 부호화되기 때문에, 행해진다. 모션추정 스테이지(220)는 모션추정을 실핸한다. 마지막 스테이지는 출력 비트스트림을 제공하기 위해 비디오 프레임의 실제 부호화를 행하는 부호화 스테이지(225)를 포함하고 있다.
재배열과 모션추정의 다음 스테이지를 용이하게 하기 위해, 전처리 스테이지 (205)는 전처리되는 프레임이 B-프레임인지의 여부를 판단한다. 프레임이 B-프레임으로서 분류되지 않으면, 단지 화면이 실제로 인코드되기 전에, 인코더(부호화 스테이지(225))는 그것이 파이프라인의 마지막 스테이지에서 I-프레임인지 P-프레임인지를 판정한다. 새로운 GOP는 I-프레임에 의해 시작된다.
장면변화 검출 기능부(210)는 파이프라인의 전처리 스테이지에서 연속적인 프레임 사이에서 장면변화를 검출한다. 장면변화처리의 주요 목적은, 장면변화가 원래 스케줄된 I-프레임의 부근에서 검출되면, 새로운 장면의 시작과 정력하기 위해 새로운 GOP의 스케줄된 시작의 위치를 변경하는 것이다. 일단 장면변화가 장면변화 검출 기능부(210)에서 검출되면, 제어신호(ScDet 플래그)는 그것이 부호화되기를 기다리는 인코더의 처리 파이프라인에 지금 있는 프레임에 대한 I-프레임을 발생시키는 것을 막기 위해 부호화 스테이지로 전송된다. 대응하는 장면변화 프레임이 부호화 스테이지(225)에 그 후에 도달할 때, 파이프라인에 다른 장면변화 프레임이 없다고 가정하면, 파이프라인의 최종 장면변화 프레임이 I-프레임으로서 부호화되는 경우에, 그것은 I-프레임으로서 부호화된다.
특히, scene_change 플래그는 재배열 지연기능부(215)와 모션추정 스테이지(220)의 대응하는 프레임을 처리하는데 지연을 고려하기 위해 지연(230)과 화면코딩타입 결정기능부(235)에 제공된다. 기능부(235)는 인코드될 현재프레임의 화면타입을 설정하기 위해, 대응하는 화면타입 제어신호를 부호화 스테이지(225)에 전송한다.
다중 장면변화가 연속하는 프레임(예컨대, 카메로 플래시, 특정 효과, 부적당한 편집에 의해 생성되는 나쁜 프레임/필드)에서 연속적으로 검출될 경우에는, 시작 새로운 GOP 결정기능부(235)는 시작 새로운 GOP 제어신호를 부호화 스테이지 (225)로 전송하기를 기다린다. 그러므로, 부호화 스테이지(225)는 최종 장면변화가 끝날 때까지 I-프레임을 부호하고, 새로운 GOP를 시작하기를 기다린다.
이것은 전처리 스테이지에서 장면변화검출과 화면코딩타입 결정 모두를 행하는 종래구조와는 다르기 때문에, 다수의 예견 프레임 버퍼를 필요하게 되고, 또는 어떤 예견능력도 제공하지 않는 부호화 스테이지에서 장면변화검출과 화면코딩타입 결정 모두를 행하는 종래구조와는 다르다.
유리하게, 파이프라인 아키텍처(200)는 예견능력을 제공하는데 필요한 다수의 프레임 버퍼메모리를 최소로 하면서, 장면변화 부근에서 스케줄된 I-프레임을 실행하는 것을 회피하기 위해 필요한 예견지연을 제공한다.
장면변화 카운터(240)는 파이프라인(200)에서 장면변화 프레임수의 카운트 (ScCount)를 유지한다. 카운트는 장면변화 검출기능부(210)에서 지적되는 각각의새로운 장면변화 프레임에 대해서는 증가되고, 화면코딩타입 결정 기능부(235)에 도달하는 모든 장면변화 프레임에 대해서는 감소된다.
예비 화면타입정보(preType)은 전처리 스테이지(205)에 의해 결정되고, 파이프라인(200) 도처에 비디오 프레임에 태그(tag)된다. 이 정보는 프레임이 부호화 스테이지(225)에 도달할 때 이용되는 최종 화면타입(picture_type)을 결정하는데 이용하기 위해 검색된다. 본질적으로, 아래에 "장면변화 예시"에서 더 상세히 설명되는 바와 같이, 장면변화가 검출되면 프레임의 미리 할당된 화면타입은 본 발명에 따라 수정된다.
모든 전처리된 프레임에 대해서는, 장면변화 검출기능부(210)는 현재 입력프레임의 대응하는 패널의 화소와 이전의 입력프레임의 화소간의 절대적인 차를 계산한다. 이들 절대적인 차는 제1필드와 제2필드에 관해 합계되고, 한쌍의 장면변화 메트릭, 즉 sc1(제1필드에 대한)과 sc2(제2필드에 대한)를 형성하기 위해 16비트 무부호 정수에 적합하도록 스케일(scale)된다. 예컨대, 장면변화 메트릭을 계산하기 전에 공간적으로 다운샘플링하는 프레임에 의해 실현을 간단하게 하기 위해 입력화소의 서브셋(subset)으로부터 장면변화 메트릭을 발생시킬 수 있다. 장면변화 검출기능부(210)는 장면변화를 검출하기 위해 비디오 압축기(120~127)로부터 장면변화 측정을 독출하는 MCC(160)를 구비함으로써 실현될 수 있다. 장면변화검출의 결과와, 인코더의 출력 비디오 FIFO 레벨과 GOP에 지금까지 부호화된 프레임수에 기초하여, 화면 코딩타입 결정기능부(235; MCC(160)에 의해 실현될 수 있는)는 처리 파이프라인의 부호화 스테이지(225)에서 프레임의 화면코딩타입에 대한 최종결정을 한다.
도 3은 본 발명에 따른 화면변경 스코어 델타, 가장 최근에 의용된 장면변화 스코어, 연속적인 반복되는 필드수를 결정하기 위한 플로우차트를 나타낸다.
장면변화를 검출하기 위해 MCC(160)에 의해 실현되는 장면변화 검출 기능부(210)는 먼저 프레임의 모든 패널에 관해 MAD값을 합함으로써, 각 프레임의 전체 홀수필드와 짝수필드에 대한 장면변화 스코어(sc1, sc2)를 계산한다(블록 300).
장면변화 검출 기능부(210)는 뜻밖의 감소에 의해 추종되는 장면스코어의 뜻밖의 증가를 찾음으로써 장면변화를 검출한다. 블록 305에서 sc1 > 드레숄드값(Th0)지의 여부가 테스트되고, 블록 310과 315에서 sc2 > Th0지의 여부가 테스트된다.
d1, d2, scLast 및 rfc는 sc1과 sc2 모두가 Th0를 초과하면 블록 320에서 지시하는 바와 같이 설정되거나, sc1은 Th0을 초과하지만 sc2는 그렇지 않으면 블록 325에서 지시하는 바와 같이 설정되거나, sc2는 Th0을 초과하지만 sc1은 그렇지 않으면 블록 330에서 지시하는 바와 같이 설정된다. 블록 335에서, 결정은 연속적인 반복되는 필드(rfc)수가 최대값(maxCount)을 초과하는지의 여부에 대해 이루어진다. d1, d2, scLast 및 rfc는 각각 블록 335가 참인지 거짓인지에 따라 블록 340과 350에서 설정된다.
도면과 텍스트에 있어서, "예", "참", "1"은 같은 뜻이고, "아니오", "거짓", "0"은 같은 뜻이다.
일반적으로, {ThPos, ThNeg, Th0}으로 규정되는 3개의 드레숄드는 이하와 같은 비디오 포맷에 의존한다.
1920x1080 I 1440x1080 I 1280x720 P
ThPos 24,480 17,952 10,240
ThNeg -16,320 -11,968 -5,120
Th0 6,120 4,488 1,920
비디오 포맷은 수평화소x수직화소 해상도와 비디오가 비월스캔(I)인지 순차스캔(P)인지에 관하여 설명한다. 이 표기는 I-프레임 타입 및 P-프레임 타입과 혼동되지 않아야만 한다. 이 의미는 문맥으로부터 분명해져야만 한다. 본 밤령은 비월스캔 프레임과 순차스캔 프레임 모두를 수용한다. 순차스캔 이미지는 제1필드와 제2필드에서 처리된다. 이것들은 드레숄드만을 제안하고, 그것들의 값은 예컨대 다른 비디오 시퀀스와의 실험에 의해 조정될 수 있다.
장면변화 검출 기능부(210)는 제1입력필드와 제2입력필드 모두에 대한 연속적인 장면변화 스코어간의 차(d1, d2)를 계산한다. 가장 최근에 이용된 장면변화 스코어는 가변의 scLast에 의해 유지된다. 최대 카운트(maxCount)까지 반복된 필드는 차(d1, d2)를 계산할 때 스킵(skip)된다.
가변의 rfc는 연속적인 반복되는 필드수를 기억하기 위해 유지된다. 연속적인 반복되는 필드의 최대수(maxCount)는 예컨대 1080 I 모드에 대한 14개 필드와 720 P 모드에 대한 24개 필드로 설정될 수 있다. 그러나, 다른 값이 이용될 수도 있다. rfc가 maxCount(박스 335)를 초과할 때마다, d1, d2, rfc가 정상적으로 업데이트되도록 정지화면인 것으로 가정한다(박스 340).
d1은 sc1과 sc2간의 차로서 계산된다. d2는 장면스코어가 Th0를 넘고, rfc가 최대 카운트보다 더 작은지의 여부에 따라, sc2와 sc1과 scLast 둘중 어느 한쪽간의 차로서 계산된다.
최대 카운트(maxCount)까지에 대한 작은 장면변화 스코어는, 예컨대 텔레비전 영화처리를 실패하는 카툰(cartoon), 슬로우 모션 편집, 나쁜 필름의 반복되는 필드가 있을 때 잘못된 검출을 회피하기 위해 배제된다(블록 325, 330, 350). 텔레비전 영화처리는 3:2 풀다운(pulldown) 시퀀스로 용장성 필드를 제거하는 것을 나타낸다. 텔레비전 영화처리(필름으로부터 비디오로 전송)가 요란하다면, 인코더의 텔레비전 영화처리는 용장성 필드를 검출할 수 없을 것이다.
다른 시나리오는 인코더가 사용자에 의해 명령되는 용장성 필드를 고의로 유지할 때이거나(예컨대, 사용자가 인코더상의 텔레비전 영화처리를 고의로 불능으로 하면), 용장성 필드가 드롭(drop)되지 않는 편집 포인트에서이다(예컨대, 2개의 연속적인 프레임에 용장성 필드가 있을 때). 또, 정규의 3:2 풀다운 패턴을 따르지 않는 특별한 필름은, 예컨대 3:2:3:2 대신에 3:3:2:2이다.
3-필드 필름 프레임의 경우에는, 제3필드가 인코더에 드롭되기 때문에 단지 제1필드와 제2필드간의 장면변화를 체크한다.
도 4는 본 발명에 따른 장면변화 검출프레임을 결정하고, 장면변화 카운트다운 타이머를 활성화하기 위한 플로우차트를 나타낸다.
블록 400에서, d1, d2 및 scLast는 도 3의 박스 320, 325, 330, 340, 350과 관련하여 설명되는 바와 같이 계산된다.
MCC는 장면변화가 발생했는지를 나타내는 플래그 ScDet를 유지한다. 장면 스코어(d1 또는 d2)의 변화가 정의 드레숄드를 넘을 때마다(블록 430) ScDet는 참(즉, 1)으로 설정된다(블록 435). d1과 d2의 변화가 부의이고 부의 드레숄드보다 더 작을 때마다(블록 440) ScDet는 0으로 설정된다(블록 425와 445). d1과 d2가 거의 Th0일 때, 즉 d1도 d2도 ThPos를 넘지 않거나 ThNeg보다 작을 때 ScDet는 불변이다(블록 450).
감시카운터(CountDown)는 최종시간 장면 스코어가 정의 드레숄드를 넘기 때문에, 경과딘 프레임수를 기억하도록 유지된다. 카운터는 제로에 도달할 때까지 그 후에 모든 프레임(블록 410)에 대해 하나씩 감소된다(블록 405). ScDet는 카운터가 제로에 도달하면 제로로 리셋된다(블록 415). 이 메커니즘은 장면스코어의 큰 부의 변화가 객체가 정지 이미지에서 이동하기 시작할 때 발생하는 큰 파지티브 서지(surge)를 따르지 않는 경우에 ScDet를 리셋시킨다(즉, 정지-이동 시퀀스).
도 5는 본 발명에 따른 scene_change 플래그를 세팅하기 위한 플로우차트를 나타낸다.
ScDet는 도 4의 블록 415, 425, 435, 445, 450과 관련하여 설명되는 바와 같이 블록 500에서 결정된다.
MCC는, 새로운 GOP가 현재 프레임에서 시작하는 것을 나타내기 위해 부호화 파이프라인(200)의 전처리 스테이지(205)에서 결정된 예비 화면타입(B-프레임 또는 B-프레임이 아님)을 이용한다(블록 505). 장면변화가 전처리된 B-프레임상에서 검출되면(블록 510), ScPending는 참으로 설정되지만, B-프레임에 대한 장면변화는설정되지 않는다(블록 515). 장면변화가 전처리된 B-프레임상에서 검출되지 않으면(블록 510), B-프레임에 대한 ScPending과 scene_change 플래그는 거짓으로 설정된다(블록 520).
전처리된 B-프레임을 따르는 다음의 P-프레임에 대해서는, ScDet나 ScPending이 참인 경우에는(블록 525), scene_change 플래그는 참으로 설정된다(블록 530). 전처리된 B-프레임을 따르는 다음의 P-프레임에 대해서는, ScDet도 ScPending도 참이 아닌 경우에는(블록 525), scene_change 플래그는 거짓으로 설정된다(블록 535).
그러므로, MCC는 ScCount에 의해 처리 파이프라인의 현재 장면변화수를 기억하고 있다. scene_change 플래그가 설정되면 ScCount값은 1씩 증가하고(블록 530), 부호화 스테이지에서의 현재 화면이 장면변화 프레임이면 1씩 감소한다(도 6a와 도 6b의 블록 610). 전처리된 프레임의 scene_change 플래그와 preType은 MCC(160)의 원형버퍼(165)에 저장되고, 프레임이 부호화될 때 최종 화면타입을 결정하기 위해 나중에 검색된다. 원형버퍼(165)는 각 프레임의 입력순서를 나타내는 시퀀스 번호인 일시적인 참조 태그에 의해 인덱스(index)된다. 원형버퍼(165)에 대한 입력은 디스플레이 순서로 이루어지고, 출력은 코딩순서로 이루어진다(B/P 프레임 재밸열 후에)는 점에 주의해야 한다.
도 6a와 도 6b는 본 발명에 따른 프레임에 대한 최종 화면 코딩타입을 결정하기 위한 플로우차트를 나타낸 도면이다.
프레임이 파이프라인의 (최종) 부호화 스테이지에 도달하면, MCC는 프레임의preType과 scene_change 플래그의 값(블록 600)을 그 원형버퍼로부터 검색한다. 이것은 비디오 압축기의 부호화 스테이지(225)에서 부호화되는 프레임에 대해 행해진다. ScCount는, 현재 프레임에 대한 scene_change가 참으로 설정되면(블록 605) 하나씩 감소된다(블록 610). 이들 값은 블록 670, 675, 또는 685의 프레임의 최종 화면코딩타입(picture_type)을 결정하는데 이용된다.
GOP(FrameCount)에서 지금까지 부호화된 프레임수의 카운트는 유지되고 있다. 새로운 GOP는, FrameCount가 사용자가 구성한 GOP의 명목상의 길이(GopLen)에 도달하거나 장면변화가 현재 프레임에서 검출되며 처리 파이프라인에 지금 다른 장면변화 프레임이 없으면(ScCount=거직으로 나타낸 바와 같이; 블록 645), P-프레임을 I-프레임으로 변환함으로써(블록 675) 시작된다(블록 620).
그러나, 비록 상기 조건이 충족될지라도, 장면변화가 부호화 파이프라인의 어떤 비부호화된 프레임상에서 검출되거나(블록 635), I-프레임을 수용하기 위해 비트스트림 버퍼(140; 도 1)에 충분한 공간이 없으면(블록 625), 새로운 GOP는 시작되지 않는다(블록 640). 예외는 새로운 GOP가 여하튼 시작되는 경우에, FrameCo unt가 GOP의 최대 가능한 길이(MaxGopLen)를 넘을 때이다(블록 615).
블록 665에서 preType이 B-프레임이면, 불변이다(블록 670). preType이 P-프레임이면, start_new_gop가 참일 때(블록 680) 그것은 I-프레임으로 변경된다(블록 675). preType이 P-프레임이면, start_new_gop가 거짓일 때(블록 680) 그것은 불변이다(블록 685). I-프레임과 P-프레임은 부호화 스테이지까지의 파이프라인 도처에서 동일하게 다루어진다는 점에 주의해야 한다. 부호화 스테이지까지 프레임이 I프레임인지 또는 P-프레임인지를 결정할 필요는 없다.
start_new_gop 플래그는 부호화되는 현재 프레임으로 새로운 GOP를 시작하든 그렇지 않든지 신호에 이용된다(블록 620, 640). start_new_gop와 picture_type의 최종값은 플로우차트에 나타낸 바와 같이 결정된다.
새로운 GOP가 시작될 수 있는지의 여부를 판단하는데 이용되는 버퍼레벨 드레숄드는 다음과 같이 계산된다.
ThBuf = targer_buffer_level+(0.5*GopLen*bit_rate/frame_rate)
targer_buffer_level은 1920x1080 I 모드에 대한 max_decoder_buffer_level의 1/6로 설정되고, 1280x720 P 모드에 대한 max_decoder_buffer_level의 1/5로 설정된다. max_decoder_buffer_level은 부호화된 비트스트림을 입력받는 디코더 버퍼가 유지가능한 비디의 최대수이다. 게다가, ThBuf값은 max_decoder_buffer_lev el의 반을 넘지 않도록 한도가 부과된다.
장면변화 예
표 A~D는 4개의 가능한 장면변화 시나리오를 나타낸다. 다른 시나리오도 가능하다. 이 시나리오에 있어서, 다음의 표기가 사용된다.
X1: 제1장면(X)의 제1필드
X2: 제1장면(X)의 제2필드
Y1: 제2장면(Y)의 제1필드
Y2: 제2장면(Y)의 제2필드
xx: 장면(X)에서의 필드간의 sumMAD
xy: 장면(X)와 장면(Y)에서의 필드간의 sumMAD(xy >> xx로 가정)
0: ThNeg < delta < ThPos
+ = delta > ThPos
- = delta < ThNeg
예컨대, 표 A에 있어서 각 프레임은 제1과 제2필드를 갖는다. 프레임1과 프레임2에 대해서는, x1은 제1필드이고, x2는 제2필드이다. 프레임3~5에 대해서는, Y1은 제1필드이고, Y2는 제2필드이다. 그러므로, 장면(X)과 장면(Y) 사이의 경계는 프레임3에 있다. 그 때문에, 프레임3은 장면변화 프레임이다(ScDet=1). 장면변화 프레임은 델타값을 관찰함으로써 결정된다. 표 A에 대해서는, 프레임3의 제1필드(Y1)에서 델타는 "0"(작거나 제로값을 나타냄)으로부터 "+"(큰 정의 값을 나타냄)로 천이한다. 그 후, 프레임3의 제2필드(Y2)에서 델타는 원래의 "0"으로 천이한 후에, 프레임4의 제1필드(Y1)에서 큰 부의 값으로 천이한 다음에, 프레임4의 제2필드에서 원래의 작거나 제로값(0)으로 천이한다.
다음의 델타 시퀀스 0, 0, 0, +, 0, 0, 0, …ScDet에 대해서는, "+" 델타값을 갖는 프레임을 위해 "1"로 설정되고, 각각의 다음 프레임을 위해 "1"로 유지한다는 점에 주의해야 한다. 상술한 감시카운터(CountDown)는, 비록 델타가 끊임없는 장면변화 상태로 유지하는 것을 회피하기 위해 "-"로 바뀌지 않을지라도 10개 프레임 뒤에 ScDet가 원래의 "0"으로 설정되게 한다. 이 델타시퀀스는, 객체가 정지 이미지에서 이동하기 시작할 때 발생한다. 한편, 델타시퀀스 0, 0, 0, …, 0, 0, …는 모션장면이 멈춰 정지화면이 될 때 생긴다. 이 경우에, 잘못된 장면변화가 검출될 수 없을 것이다.
표기의 예로서, 표 A에 있어서 프레임2, 필드 X1에 대한 "xx"표기는 프레임1의 X1과 프레임2의 X1간의 sumMAD를 나타낸다. 프레임3, 필드 Y1에 대한 "xy"표기는 프레임2의 X1과 프레임3의 Y1간의 sumMAD를 나타낸다. 프레임4, 필드 Y1에 대한 "yy"표기는 프레임3의 Y1과 프레임4의 Y1간의 sumMAD를 나타낸다.
경우 1-A는 프레임 시퀀스 B, P, B, P, B에 대한 장변변경 검출에 의한 화면타입의 리세팅을 나타낸다. 특히, 프레임4에 있어서, P-프레임은 I-프레임으로 변경된다. 이것은 새로운 GOP의 시작을 나타낸다.
경우 1-B는 프레임 시퀀스 P, B, P, B, P에 대한 장변변경 검출에 의한 화면타입의 리세팅을 나타낸다. 특히, 프레임3에 있어서, P-프레임은 I-프레임으로 변경된다.
여러 가지 다른 프레임 시퀀스도 가능하다.
ScDet는, 검출이 비록 각 필드에 대한 델타검토에 기초할지라도 전체 프레임마다 설정된다는 점에 주의해야 한다.
표 B에 있어서, 장면은 필드경계(제1필드(X1)과 제2필드(Y2) 사이)에서 변경된다. X1은 장면 X의 일부이고, Y2는 제2장면 Y의 일부이다.
표 C는 나쁜 편집을 나타내는데, 이 경우 X, Y, Z는 3개의 분리된 장면을 나타낸다. 장면변화는 프레임3에 대해 나타내어지는데, 이 경우 Y1은 장면 Y의 제1필드이고, 프레임의 X2는 장면 X의 최종필드이다. 프레임3의 제2필드(Z2)와 프레임4의 제1필드(Z1)가 동일 장면(Z)의 일부이기 때문에, 장면변화는 프레임4에 대해검출되지 않는다.
표 D는 나쁜 편집이나 플래시를 나타낸다. 프레임3의 제1필드(Y1)는 플래시이거나 나쁜 편집장면이다.
일반적으로, 장면변화 프레임이 검출되고, 장면변화 프레임이 P-프레임이면, 그것은 I-프레임으로 변경된다. 장면변화 프레임이 P-프레임이 아니면, 장면변화 프레임을 따르는 제1P-프레임은 I-프레임으로 변경된다.
이들 경우는 오픈(open) GOP를 나타내는데, 이 경우 각각의 I-프레임이나 P-프레임은 하나 이상의 B프레임에 의해 분리된다는 점에 주의해야 한다. 그러나, 오픈 GOP는 불필요하다.
표 A - 정상의 장면변화(프레임 경계에서)
프레임1 프레임2 프레임3 프레임4 프레임5
입력필드 X1 X2 X1 X2 Y1 Y2 Y1 Y2 Y1 Y2
SumMAD xx xx xx xx xy xy yy yy yy yy
델타 O O O + O - O O O
ScDet 0 1 0 0
case 1-A
preType B P B P B
picture_type B P B 1 B
case 2-A
preType P B P B P
picture_type P B I B P`
표 B - 동일 프레임의 필드경계에서의 장면변화
프레임1 프레임2 프레임3 프레임4 프레임5
입력필드 X1 X2 X1 X2 X1 Y2 Y1 Y2 Y1 Y2
SumMAD xx xx xx xx xy xy xy yy yy yy
델타 O O O + O O - O O
ScDet 0 1 0 0
case 1-B
preType B P B P B
picture_type B P B 1 B
case 2-B
preType P B P B P
picture_type P B 1 B P
표 C - 나쁜 편집
프레임1 프레임2 프레임3 프레임4 프레임5 프레임6
입력필드 X1 X2 X1 X2 Y1 Z2 Z1 Z2 Z1 Z2 Z1 Z2
SumMAD xx xx xx xx xy xz yz zz zz zz zz zz
델타 O O O + + + - O O O O
ScDet 0 1 0 0 0
case 1-C
preType B P B P B P
picture_type B P B 1 B P
case 2-C
preType P B P B P P
picture_type P B 1 B P B
표 D - 나쁜 편집 또는 플래시
프레임1 프레임2 프레임3 프레임4 프레임5 프레임6
입력필드 X1 X2 X1 X2 Y1 X2 X1 X2 X1 X2 X1 X2
SumMAD xx xx xx xx xy xx xy xx xx xx xx xx
델타 O O O + - + - O O O O
ScDet 0 1 0 0 0
case 1-D
preType B P B P B P
picture_type B P B 1 B P
case 2-D
preType P B P B P B
picture_type P B 1 B P B
Frame_Pred_Frame_DCT 결정:
MPEG-2 인코더는 단지 프레임에 기초를 둔 예측과 필름모드화면에 대한 DCT를 사용한다. 이것은 비트스트림 신택스(syntax)에서 플래그 frame_pred_frame_ dct=1을 설정함으로써 달성된다. frame_pred_frame_dct=0이면, 필드나 프레임에 기초를 둔 예측과 DCT는 화면에 대한 매크로블록 단위로 이용될 수 있다.
게다가, 1로 설정되면, MPEG-2는 프레임이 3개의 입력필드로 구성되도록 현재 프레임이 필름에 속하고 용장성 제1필드를 포함하는 신호에 repeat_first_field 플래그를 제공한다. 특히, 제1필드(MPEG값 top_field_first에 의해 확인되는 탑(t op) 또는 보톰(bottom)필드)는 다른 필드에 의해 추종되고, 그 후 제1필드가 반복된다.
본 발명자들은 필름 프레임이 용장성 제1필드(repeat_first_field=1)를 포함하면, 장면변화가 이 프레임의 홀수필드와 짝수필드간의 경계에서 발생했을 것 같지 않은 것으로 판단했다. 또한, 클린(clean) 장면변화는 프레임 경계에 있을 것같다. 그러므로, frame_pred_frame_dct=1이 종래의 MPEG-2 구조에 따라 설정되고, 전체 프레임은 프레임에 기초를 둔 DCT와 예측을 이용하여 부호화된다.
그러나, 장면변화가 필름모드 프레임의 홀수-짝수 필드경계에서 발생했을 때의 특별한 경우를 다루기 위해서는, frame_pred_frame_ dct 플래그는 매크로블록 단위로 프레임이나 필드에 기초를 둔 예측과 DCT를 허용하도록 본 발명에 따라 무시된다. 전장면변화(pre-scene change) 필드의 상관관계는 높아지고, 후장면변화 (post-scene change) 필드의 상관관계는 높아질 것이지만, 전장면변화가나 후장면변화 필드만을 갖춘 다른 프레임과 전장면변화와 후장면변화 필드 모두를 갖춘 프레임의 상관관계는 낮아질 것이기 때문에, 이것은 코딩효율을 향상시키고, 필드나 프레임에 기초를 둔 예측과 DCT가 각각의 매크로블록에 이용되고 있는지의 여부를 나타내는데 필요한 비트의 증가된 오버헤드(overhead)조차 향상시킨다.
그러므로, 필름모드 프레임에 나쁜 편집이 있으면, 인코더는 천이 프레임에 프레임에 기초를 둔 예측만을 이용하는데 제한되지 않는다.
따라서, 장면변화가 특정 프레임상에서 검출되면, frame_pred_frame_dct 플래그값은 repeat_first_field 플래그와 같은 값으로 설정된다. 그렇지 않으면, 필름이 검출되면 frame_pred_frame_dct는 참으로 설정되고, 필름이 검출되지 않으면 제로로 설정되도록 frame_pred_frame_dct 플래그는 텔레비전 영화 검출의 결과에 따라 단독으로 결정된다.
본 발명이 필드 단위로 장면변화를 검출하고, 비디오 인코더의 코딩효율을 최적화하기 위해 화면코딩타입을 조정하기 위한 시스템을 제공함은 물론이다. I-프레임을 장면변화와 정렬시킴으로써, MPEG 인코더의 코딩효율은 상당히 향상된다. 본 발명은 HDTV신호와 SDTV신호 모두에 유리하다. 장면변화 검출시에, 부적당한 편집으로부터 얻은 플래시나 나쁜 필드를 포함하면, 화면코딩타입은 비디오 인코더의 코딩효율을 최적화하도록 조정된다. 새로운 GOP의 시작화면(즉, I-프레임)은 MPEG 인코더의 코딩효율을 상당히 향상시키기 위해 장면변화와 정렬된다. 전처리 스테이지에 있어서, 연속적인 홀수필드간의 화소차 또는 연속적인 짝수필드간의 화소차의 합에서의 변화는 모든 연속적인 입력필드마다 계산된다. 장면변화는, 합의 변화의 큰 정의 값이 큰 부의 값에 의해 추종될 때 검출된다. 어느 화면타입을 이용할지에 대한 결정은 최종 부호화 스테이지에 이를 때까지 정해지지 않는다. 인코더 버퍼레벨이 너무 높으면, I-프레임은 금지될 수 있다.
감시카운터는 정지로부터 이동으로의 천이에 대해 끊임없는 장면변화를 회피하기 위해 장면변화지정을 리셋한다.
장면변화 프레임으로서 결정되는 MPEG 필름모드 프레임에 대해서는, 장면변화가 필드 경계상에서 발생했을 경우에(예컨대, 화면에 용장성 필드가 없는 경우에) MPEG 권고 프레임에 기초를 둔 DCT와 예측 부호화는 해제된다. 이러한 해제시에, 프레임이나 필드에 기초를 둔 DCT와 예측은 화면에서 매크로블록 단위로 이용할 수 있다.
또한, 본 발명은 여러 가지의 특정한 실시예와 관련하여 설명했지만, 이에 한정되지 않고, 발명의 요지를 이탈하지 않는 범위내에서 여러 가지로 변형하여 실시할 수 있음은 물론이다.
예컨대, 본 발명에서 논의되는 여러 가지의 신택스 구성요소는 단지 일례일 뿐이고, 다른 신택스도 이용될 수 있다는 점에 주의해야 한다.

Claims (22)

  1. 연속하는 비디오 프레임을 갖는 디지털 비디오 신호를 부호화하는 방법에 있어서,
    상기 각각의 연속하는 프레임마다 프레임의 제1필드와 이전 프레임의 제1필드간의 화소차의 제1합과, 프레임의 제2필드와 이전 프레임의 제2필드간의 화소차의 제2합을 계산하기 위해 상기 비디오 신호를 전처리하는 단계와,
    상기 각각의 연속하는 프레임마다 상기 이전 프레임의 상기 제1 및 제2합의 각각에 관하여 그 제1 및 제2합에서의 변화를 계산하는 단계 및,
    그 제1 또는 제2합의 적어도 하나에서의 변화가 정의 드레숄드를 넘고, 다음 프레임의 제1 또는 제2합의 적어도 하나에서의 변화가 부의 드레숄드보다 작을 때, 상기 연속하는 프레임중 특정의 것을 장면변화 프레임으로서 지정하는 단계를 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  2. 제1항에 있어서, 상기 장면변화 프레임이 지정된 때에 I-프레임(인트라 코드화된 프레임)의 부호화를 금지하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  3. 제1항에 있어서, 복수의 연속적인 장면변화 프레임의 수의 카운트를 유지하는 단계와,
    정지-이동 비디오 천이에 대해 끊임없는 장면변화상태로 있는 것을 회피하기 위해 상기 카운트가 최대값을 넘는 상기 장면변화 프레임의 장면변화지정을 종료하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  4. 제1항에 있어서, 비디오 인코더의 처리 파이프라인에서 지금 부호화되지 않은 장면변화 프레임의 수의 카운트를 유지하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  5. 제4항에 있어서, 장면변화 프레임의 버스트에서 최종 장면변화를 제외하고 상기 카운트가 0보다 큰 값을 갖는 한 I-프레임의 부호화를 금지하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  6. 제1항에 있어서, 상기 비디오 신호는 (a) 전처리단계와 계산단계 및 지정단계가 발생하는 전처리 스테이지와, (b) 각 프레임이 부호화되는 부호화 스테이지를 포함하는 파이프라인 아키텍처를 이용하여 처리되고,
    상기 지정단계에 응답하여 상기 부호화 스테이지에서 상기 프레임중 하나의 미리 할당된 화면의 타입을 변경하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  7. 제6항에 있어서, P-프레임인 상기 장면변화 프레임에 대해 상기 미리 할당된 화면타입은 상기 변경단계에서 I-프레임으로 변경되는 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  8. 제6항에 있어서, 상기 장면변화 프레임은 B-프레임이고, 다음의 연속하는 P-프레임에 대해 상기 미리 할당된 화면타입은 상기 변경단계에서 I-프레임으로 변경되는 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  9. 제6항에 있어서, 상기 파이프라인 아키텍처는 상기 연속하는 비디오 프레임의 부호화에 버퍼 예견능력을 제공하는 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  10. 제1항에 있어서, 상기 장면변화 프레임이 지정됨에 따라서 새로운 GOP의 부호화를 개시하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  11. 제10항에 있어서, 상기 장면변화 프레임은 필름모드 프레임이고,
    상기 필름모드 프레임의 상기 제1 및 제2필드간의 장면변화 경계가 나타나 있는지의 여부를 판단하는 단계와,
    상기 판단단계에서 상기 경계가 나타나 있다고 판단된 때에, 매크로블록 단위로 상기 필름모드 프레임의 프레임 및 필드에 기초를 둔 예측과 DCT 부호화를 모두 허용하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  12. 제11항에 있어서, 상기 판단단계는, 상기 필름모드 프레임에서 반복되는 필드가 없을 때, 상기 필름모드 프레임의 상기 제1 및 제2필드간의 장면변화 경계가 나타나 있다고 판단하는 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  13. 제11항에 있어서, 상기 판단단계가 상기 필름모드 프레임의 상기 제1 및 제2필드간의 장면변화 경계가 나타나 있지 않은 것으로 판단한 경우에, 상기 필름모드 프레임의 프레임에 기초를 둔 예측과 DCT 부호화만을 허용하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  14. 제13항에 있어서, 상기 판단단계는, 상기 필름모드 프레임에 반복되는 필드가 있을 때, 상기 필름모드 프레임의 상기 제1 및 제2필드간의 장면변화 경계가 나타나 있지 않다고 판단하는 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  15. 제1항에 있어서, 상기 비디오 신호의 부호화된 데이터를 입력받는 버퍼의 충만레벨을 감시하는 단계와,
    상기 충만레벨이 최대값을 넘음에 따라서 상기 I-프레임의 부호화를 금지하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  16. 제1항에 있어서, 상기 장면변화 프레임이 부호화될 때까지 상기 장면변화 프레임이 지정되고, 지정되었지만 아직 부호화되지 않은 다른 장면변화 프레임이 없을 때 I-프레임의 부호화를 금지하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  17. 연속하는 비디오 프레임을 갖는 디지털 비디오 신호를 부호화하는 방법에 있어서,
    장면변화 기준에 따라 상기 연속하는 프레임중 특정의 것을 필름모드 프레임인 장면변화 프레임으로서 지정하는 단계와,
    상기 필름모드 프레임의 제1 및 제2필드간의 장면변화 경계가 나타나 있는지의 여부를 판단하는 단계 및,
    상기 판단단계에서 상기 경계가 나타나 있다고 판단된 때에, 매크로블록 단위로 상기 필름모드 프레임의 프레임 및 필드에 기초를 둔 예측과 DCT 부호화를 모두 허용하는 단계를 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  18. 제17항에 있어서, 상기 판단단계는, 상기 필름모드 프레임에서 반복되는 필드가 없을 때, 상기 필름모드 프레임의 상기 제1 및 제2필드간의 장면변화 경계가 나타나 있다고 판단하는 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  19. 제17항에 있어서, 상기 판단단계가 상기 필름모드 프레임의 상기 제1 및 제2필드간의 장면변화 경계가 나타나 있지 않은 것으로 판단한 경우에, 상기 필름모드 프레임의 프레임에 기초를 둔 예측과 DCT 부호화만을 허용하는 단계를 더 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  20. 제19항에 있어서, 상기 판단단계는, 상기 필름모드 프레임에 반복되는 필드가 있을 때, 상기 필름모드 프레임의 상기 제1 및 제2필드간의 장면변화 경계가 나타나 있지 않다고 판단하는 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화방법.
  21. 연속하는 비디오 프레임을 갖는 디지털 비디오 신호를 부호화하는 장치에 있어서,
    상기 각각의 연속하는 프레임마다 프레임의 제1필드와 이전 프레임의 제1필드간의 화소차의 제1합과, 프레임의 제2필드와 이전 프레임의 제2필드간의 화소차의 제2합을 계산하기 위해 상기 비디오 신호를 전처리하는 전처리기와,
    상기 각각의 연속하는 프레임마다 상기 이전 프레임의 상기 제1 및 제2합의 각각에 관하여 그 제1 및 제2합에서의 변화를 계산하는 수단 및,
    그 제1 또는 제2합의 적어도 하나에서의 변화가 정의 드레숄드를 넘고, 다음 프레임의 제1 또는 제2합의 적어도 하나에서의 변화가 부의 드레숄드(SWU34)보다 작을 때, 상기 연속하는 프레임중 특정의 것을 장면변화 프레임으로서 지정하는 장면변화 검출기를 갖춘 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화장치.
  22. 연속하는 비디오 프레임을 갖는 디지털 비디오 신호를 부호화하는 장치에 있어서,
    장면변화 기준에 따라 상기 연속하는 프레임중 특정의 것을 필름모드 프레임인 장면변화 프레임으로서 지정하는 수단과,
    상기 필름모드 프레임의 제1 및 제2필드간의 장면변화 경계가 나타나 있는지의 여부를 판단하는 장면변화 검출기 및,
    상기 판단단계에서 상기 경계가 나타나 있다고 판단된 때에 매크로블록 단위로 상기 필름모드 프레임의 프레임 및 필드에 기초를 둔 예측과 DCT 부호화를 모두 허용하는 수단을 구비한 것을 특징으로 하는 연속하는 비디오 프레임을 갖는 디지털 비디오 신호의 부호화장치.
KR1020017004044A 1998-09-29 1999-08-27 고품위 텔레비전 인코더에서 장면변화의 검출 및화면코딩타입의 조정을 행하기 위한 방법 및 장치 KR20010099660A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10223498P 1998-09-29 1998-09-29
US60/102,234 1998-09-29
PCT/US1999/019804 WO2000019726A1 (en) 1998-09-29 1999-08-27 Method and apparatus for detecting scene changes and adjusting picture coding type in a high definition television encoder

Publications (1)

Publication Number Publication Date
KR20010099660A true KR20010099660A (ko) 2001-11-09

Family

ID=22288827

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017004044A KR20010099660A (ko) 1998-09-29 1999-08-27 고품위 텔레비전 인코더에서 장면변화의 검출 및화면코딩타입의 조정을 행하기 위한 방법 및 장치

Country Status (7)

Country Link
EP (1) EP1119979B1 (ko)
KR (1) KR20010099660A (ko)
CN (1) CN1328747A (ko)
AU (1) AU5793199A (ko)
BR (1) BR9914117A (ko)
CA (1) CA2344915C (ko)
WO (1) WO2000019726A1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100971601B1 (ko) * 2005-10-17 2010-07-20 콸콤 인코포레이티드 비디오 스트리밍에서의 적응적 화상 그룹 구조
KR101087109B1 (ko) * 2005-03-28 2011-11-25 엘지전자 주식회사 비디오 부호화 장치 및 그 방법
US8879857B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Redundant data encoding methods and device
US9131164B2 (en) 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL134182A (en) 2000-01-23 2006-08-01 Vls Com Ltd Method and apparatus for visual lossless pre-processing
GB2365245B (en) 2000-07-28 2004-06-30 Snell & Wilcox Ltd Video Compression
US6694060B2 (en) 2000-12-21 2004-02-17 General Instrument Corporation Frame bit-size allocation for seamlessly spliced, variable-encoding-rate, compressed digital video signals
KR100846770B1 (ko) * 2002-03-05 2008-07-16 삼성전자주식회사 동영상 부호화 방법 및 이에 적합한 장치
JP3715273B2 (ja) * 2002-11-26 2005-11-09 パイオニア株式会社 画像データの平滑化処理装置、平滑化処理方法及び平滑化処理プログラム
US20040131117A1 (en) * 2003-01-07 2004-07-08 Sheraizin Vitaly S. Method and apparatus for improving MPEG picture compression
CN1237814C (zh) * 2003-10-17 2006-01-18 清华大学 一种用剪辑标识码来辅助视频剪辑的方法
CN100391232C (zh) * 2005-01-07 2008-05-28 智辉研发股份有限公司 数字影像闪光场景检测与消除方法
US8780957B2 (en) 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
AR052601A1 (es) 2005-03-10 2007-03-21 Qualcomm Inc Clasificacion de contenido para procesamiento de multimedia
CN100452878C (zh) * 2005-03-28 2009-01-14 腾讯科技(深圳)有限公司 一种视频编码中的运动图像处理方法
ES2371188T3 (es) * 2005-09-27 2011-12-28 Qualcomm Incorporated Transcodificador dirigido por el contenido que organiza la transcodificación multimedia usando información del contenido.
US8654848B2 (en) 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
JP4849339B2 (ja) * 2007-03-30 2012-01-11 ソニー株式会社 情報処理装置および方法
CN101453642B (zh) * 2007-11-30 2012-12-26 华为技术有限公司 图像编/解码方法、装置和系统
CN102223544B (zh) * 2011-06-02 2013-02-06 福州瑞芯微电子有限公司 一种h264视频码流检测到错误后处理错误的方法
CN104685873B (zh) * 2012-10-05 2017-12-15 索尼公司 编码控制设备以及编码控制方法
JP6481457B2 (ja) * 2015-03-26 2019-03-13 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法
CN104780367B (zh) * 2015-04-13 2018-05-01 浙江宇视科技有限公司 一种动态调整gop长度的方法和装置
WO2017105391A1 (en) * 2015-12-14 2017-06-22 Arris Enterprises, Inc. A method to encode video with close multiple scene changes
US11128914B2 (en) * 2018-04-25 2021-09-21 Roku, Inc. Client side stitching of content into a multimedia stream
EP4226639A1 (en) * 2020-10-07 2023-08-16 Telefonaktiebolaget LM Ericsson (publ) A system and method to minimize repetitive flashes in streaming media content

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2977104B2 (ja) * 1991-07-26 1999-11-10 ソニー株式会社 動画像データエンコード方法および装置、並びに動画像データデコード方法および装置
DE69333896T2 (de) * 1992-01-29 2006-07-27 Mitsubishi Denki K.K. Vorrichtung und Verfahren zum Aufzeichnen/Wiedergeben von Videoinformation
US5734419A (en) * 1994-10-21 1998-03-31 Lucent Technologies Inc. Method of encoder control
US5508750A (en) * 1995-02-03 1996-04-16 Texas Instruments Incorporated Encoding data converted from film format for progressive display
GB9607645D0 (en) * 1996-04-12 1996-06-12 Snell & Wilcox Ltd Processing of video signals prior to compression

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101087109B1 (ko) * 2005-03-28 2011-11-25 엘지전자 주식회사 비디오 부호화 장치 및 그 방법
US8879857B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Redundant data encoding methods and device
US8879856B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US8879635B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
KR100971601B1 (ko) * 2005-10-17 2010-07-20 콸콤 인코포레이티드 비디오 스트리밍에서의 적응적 화상 그룹 구조
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US9131164B2 (en) 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus

Also Published As

Publication number Publication date
CA2344915C (en) 2008-10-14
EP1119979B1 (en) 2013-01-23
EP1119979A1 (en) 2001-08-01
WO2000019726A1 (en) 2000-04-06
AU5793199A (en) 2000-04-17
BR9914117A (pt) 2001-10-16
CA2344915A1 (en) 2000-04-06
CN1328747A (zh) 2001-12-26

Similar Documents

Publication Publication Date Title
US6731684B1 (en) Method and apparatus for detecting scene changes and adjusting picture coding type in a high definition television encoder
KR20010099660A (ko) 고품위 텔레비전 인코더에서 장면변화의 검출 및화면코딩타입의 조정을 행하기 위한 방법 및 장치
US7224734B2 (en) Video data encoding apparatus and method for removing a continuous repeat field from the video data
US5878166A (en) Field frame macroblock encoding decision
US5682204A (en) Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level
US5854658A (en) Statistical multiplexing system which encodes a sequence of video images using a plurality of video encoders
US5872598A (en) Scene change detection using quantization scale factor rate control
US5929916A (en) Variable bit rate encoding
US7058130B2 (en) Scene change detection
US5781249A (en) Full or partial search block matching dependent on candidate vector prediction distortion
US5650860A (en) Adaptive quantization
US5801779A (en) Rate control with panic mode
US5761398A (en) Three stage hierarchal motion vector determination
EP2536143B1 (en) Method and a digital video encoder system for encoding digital video data
US5771316A (en) Fade detection
JP2002543713A (ja) デジタルビデオ用動き推定
US20070092007A1 (en) Methods and systems for video data processing employing frame/field region predictions in motion estimation
US5764293A (en) Method of encoding video using master and slave encoders wherein bit budgets for frames to be encoded are based on encoded frames
JPH08223577A (ja) 動画像符号化方法及び装置、並びに動画像復号方法及び装置
US8345148B2 (en) Method and system for inverse telecine and scene change detection of progressive video
US20110129012A1 (en) Video Data Compression
JP3240024B2 (ja) 画像処理方法
US10856002B2 (en) Method, device and system for method of encoding a sequence of frames in a video stream
US6754270B1 (en) Encoding high-definition video using overlapping panels
KR0185841B1 (ko) 영상 부호기에서의 움직임 추정 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
NORF Unpaid initial registration fee