KR20070033363A - 처리할 데이터 부분들이 선택되는 비디오 트랜스코딩 - Google Patents

처리할 데이터 부분들이 선택되는 비디오 트랜스코딩 Download PDF

Info

Publication number
KR20070033363A
KR20070033363A KR1020067026974A KR20067026974A KR20070033363A KR 20070033363 A KR20070033363 A KR 20070033363A KR 1020067026974 A KR1020067026974 A KR 1020067026974A KR 20067026974 A KR20067026974 A KR 20067026974A KR 20070033363 A KR20070033363 A KR 20070033363A
Authority
KR
South Korea
Prior art keywords
portions
bit rate
transcoding
input signal
signal
Prior art date
Application number
KR1020067026974A
Other languages
English (en)
Inventor
스테픈 컴프손
아드리아누스 데니쎈
윌헬무스 브룰스
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20070033363A publication Critical patent/KR20070033363A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234354Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering signal-to-noise ratio parameters, e.g. requantization

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 미리 결정된 임계값(TH)보다 큰 비트 레이트를 갖는 입력 신호(20)의 부분들을 식별하기 위해 상기 입력 신호(20)를 모니터링하는 처리 수단(18); 상기 임계값(TH) 미만으로 상기 부분들(22)의 비트 레이트를 감소시키기 위해 상기 부분들(22)을 트랜스코딩하는 트랜스코딩 모듈을 포함하는 장치 및 대응하는 방법 및 미디어 플레이어 시스템에 관한 것이다.
Figure 112006095032469-PCT00001
입력 신호, 트랜스코딩 모듈, 미디어 플레이어 시스템, 임계값, 비트 레이트

Description

처리할 데이터 부분들이 선택되는 비디오 트랜스코딩{VIDEO TRANSCODING WITH SELECTION OF DATA PORTIONS TO BE PROCESSED}
이 발명은 예를 들면 넓은 범위의 인코딩된 비트 레이트들을 가진 디지털 콘텐트를 받아들일 수 있는 소비자 전자 디바이스들에서 사용하기 위해 디지털 신호를 선택적으로 트랜스코딩하는 시스템 및 방법에 관한 것이다.
디지털 비디오 제품 및 서비스들의 출현으로, 디지털 비디오 신호들은 시장에 출시되고 있으며 많은 관심을 끌고 있다. 디지털 신호 저장용량에 한계와 네트워크의 한계 및 방송 대역폭 한계로 인해, 디지털 비디오 신호들의 압축이 비디오 신호 저장 및 전송에 주요하였다. 결국, 비디오 인코딩을 위한 MPEG, MPEG-1, MPEG-2 표준들을 포함하여, 디지털 비디오 신호들의 압축 및 인코딩을 위한 많은 표준들이 나왔다. 이들 표준들은 인코딩된 디지털 비디오 신호들의 형태와 뷰어에게 표현하기 위해 이러한 신호들을 어떻게 디코딩할 것인가를 명시한다. 그러나, 본래의 비압축된 포맷에서 명시된 인코딩된 포맷으로 디지털 비디오 신호들을 어떻게 변환할 것인가에 대해 많은 재량이 남겨져 있다. 결국, 많은 서로 다른 디지털 비디오 신호 인코더들이 현재 존재하고 있고 달성되는 가변 압축도로 디지털 비디오 신호들을 인코딩하기 위해 많은 방법들이 사용된다.
여기서 트랜스코딩은 데이터 스트림, 예를 들면 주어진 비트 레이트를 갖는 비디오 스트림을 다른 비트 레이트를 갖는 다른 데이터 스트림으로 변환하는 동작을 의미한다. 본 발명은 MPEG 표준("MPEG"는 "Moving Picture Experts Group"의 약어이며, 이는 1990년에 설립된 ISO(International Standardization Organisation)의 전문가 그룹이며 이 표준을 동화상을 전송 및/또는 저장하기 위해 채택하였으며 이 표준은 ISP에 의한 수많은 문헌들에 공포되었다)에 준하여 데이터 스트림들을 트랜스코딩하는데 특히 적합하다.
트랜스코딩은 제 1 신호 트랜스포트 시스템이 제 2 신호 트랜스포트 시스템과 인터페이스는 상황들에서 행해질 수 있다.
제 1 예에서, 9Mbits/초의 입력된 MPEG 압축된 비디오 신호(이를테면 위성에 의해 전송된)가 한정된 대역폭 용량을 갖는 통신채널을 통해 케이블 헤드엔드에 보내져야 한다면, 케이블 헤드엔드는 이 입력된 신호를 예를 들면 5Mbits/초의 상기 제한된 대역폭에 맞는 낮은 비트 레이트로 트랜스코딩할 것이다.
제 2 예에서, 디지털 비디오 방송(DVD)에 따라 방송된 입력된 MPEG 압축된 비디오 신호, 즉 아마도 10Mbits/초 이상의 비디오 신호가 DVD(디지털 다기능 디스크) 상에, 즉 9.8Mbits/초의 최대 비디오 비트 레이트로 제한된 매체 상에 보관되어야 한다면, 이 입력 신호는 상기 제한된 대역폭에 맞는 낮은 비트 레이트로 트랜스코딩되어야 한다.
트랜스코딩은 전체 입력 신호가 먼저 기본적으로 디코딩된 후에 요구되는 비트레이트 수율을 달성하기 위해 재인코딩되기 때문에, 시간 면에서 그리고 프로세서 사용면에서 비용이 든다. 대안으로, 입력 신호는 디코딩된 화소블록들에 대해 수행하는 대신 한 블록의 차분 화소들에 대해 처리를 수행할 때 부분적으로 트랜스코딩될 수 있지만, 이러한 프로세스는 여전히 전체 입력 신호에 적용하므로 이 또한 비용이 드는 해결책이 된다.
<발명의 목적 및 요약>
본 발명의 목적은 트랜스코딩을 수행하는데 걸리는 시간 및 이에 대해 요구되는 프로세서 사용이 종래 기술의 구성들에 비해 감소되는, 입력되는 디지털 신호를 선택적으로 트랜스코딩하는 개선된 장치 및 방법을 제공하는 것이다.
본 발명에 따른 장치는,
- 미리 결정된 임계값보다 큰 비트 레이트를 갖는 입력 신호의 부분들을 식별하기 위해 상기 입력 신호를 모니터링하는 처리 수단; 및
- 상기 임계값 미만으로 상기 부분들의 비트 레이트를 감소시키기 위해 상기 부분들을 트랜스코딩하는 트랜스코딩 모듈을 포함한다.
본 발명에 따른 방법은,
- 미리 결정된 임계값보다 큰 비트 레이트를 갖는 입력 신호의 부분들을 식별하기 위해 상기 입력 신호를 모니터링하는 단계; 및
- 상기 임계값 미만으로 상기 부분들의 비트 레이트를 감소시키기 위해 상기 부분들을 트랜스코딩하는 단계를 포함한다.
상기 트랜스코딩은 단지 식별된 부분들에 적용되기 때문에, 이 장치는 제한된 처리 수단을 요구할 뿐만 아니라 보다 고속으로 수행한다.
본 발명의 이들 및 그외 다른 특징들은 여기 기술된 실시예로부터 명백할 것이며 이들을 참조로 기술한다.
본 발명의 실시예를 예에 의해서만 기술하고 첨부한 도면을 참조로 기술한다.
도 1은 본 발명의 실시예에 따른 공지의 개략적인 트랜스코딩 구성도.
도 2는 어떤 미리 결정된 임계값보다 큰 비트 레이트를 갖는 MPEG 비디오 스트림의 부분들을 식별하기 위한 구성을 예시한 개략적 블록도.
도 3은 도 2의 구성의 결과로서 얻어진 비디오 파일을 개략적으로 도시한 도면.
도 4는 너무 높은 비트 레이트를 갖는 비디오 파일의 부분들의 비트 레이트를 감소시키는 프로세스를 개략적으로 도시한 도면.
도 5는 최대 허용된 비트 레이트에 관하여 비디오 질을 최적화하기 위해 도 4의 프로세스에서 사용을 위한 반복적 바이너리 탐색 방법을 예시한 개략적 흐름도.
도 1은 현재의 입력된 코딩된 비디오 신호(103)로부터 디코딩된 데이터 신호(102)를 생성하는 적어도 에러 디코딩 단계(101)를 포함하는 공지의 트랜스코딩 구성을 도시한 것이다. 이러한 에러 디코딩 단계(101)는 상기 입력 신호에 포함된 감소된 수의 데이터 유형만이 디코딩되기 때문에 입력 비디오 신호(103)의 부분적 디코딩을 수행한다. 이 단계는 신호(103)에 포함된 적어도 DCT 계수들 및 움직임 벡터들에 대한, 참조부호 104로 표기한 가변길이 디코딩(VLD)을 포함한다. 이 단계는 디코딩된 DCT 계수들(105) 및 움직임 벡터들(106)을 얻기 위한 엔트로피 디코딩(예를 들면, 허프만 코드들을 포함하는 역 룩업 테이블에 의해)로 구성된다. 상기 단계 104)와 연속하여, 상기 디코딩된 데이터 신호(102)를 생성하기 위해 상기 디코딩된 계수들(105)에 107로 표기된 역 양자화(IQ)가 수행된다. 역 양자화(107)는 주로 상기 입력 신호(103)의 양자화율에 의해 상기 DCT 디코딩된 계수들(105)을 곱하는 것으로 구성된다. 대부분의 경우들에 있어서, 이러한 역 양자화(107)는 상기 양자화율이 매크로블록마다 변경될 수 있기 때문에 매크로블록 레벨에서 수행된다. 디코딩된 신호(102)는 주파수 영역에서의 데이터를 포함한다.
이 트랜스코딩 구성은 상기 입력 비디오 신호(103)의 트랜스코딩에 기인한 신호에 대응하는 출력 비디오 신호(109)를 생성하는 재인코딩 단계(108)를 또한 포함한다. 이 비디오신호(109)는 베이스 비디오 신호로서 지정된다. 신호(109)는 입력 신호(103)로서 MPEG-2 비디오 표준과 호환된다. 상기 재인코딩(108)은 가산 서 브-단계 111에 의해서, 수정된 움직임 보상된 신호(112)에 상기 디코딩된 데이터 신호(102)의 가산에 기인한 중간 데이터 신호(110)에 작용한다. 상기 재인코딩 단계 108은 연속하여 113으로 표기한 양자화를 포함한다. 이 양자화(113)는 양자화된 DCT 계수들(114)를 생성하기 위해서, 새로운 양자화율(Q)로 신호(110) 내 DCT 계수들을 나누는 것으로 구성된다. 이러한 새로운 양자화율은 예를 들면 단계 107에서 사용된 것보다 큰 양자화율은 상기 입력된 코딩된 비디오 신호(103)의 비트레이트를 감소시킬 수 있기 때문에 상기 입력된 코딩된 비디오 신호(103)의 트랜스코딩에 의해 수행되는 수정을 특징으로 한다. 상기 양자화(113)에 연속하여, 115로 표기한 가변 길이 코딩(VLC)를 상기 계수들(114)에 적용하여 엔트로피 코딩된 DCT 계수들(116)을 얻는다. VLD 처리와 유사하게, VLC 처리는 각 계수(114)에 허프만 코드를 정의하기 위한 룩업 테이블로 구성된다. 이어서, 상기 베이스 비디오 신호(109) 내 트랜스코딩된 프레임들을 구성하기 위해 움직임 벡터들(106)(도시생략)뿐만 아니라 계수들(116)이 117로 표기된 버퍼(BUF)에 축적된다.
이러한 구성은 주파수 영역에서 상기 베이스 비디오 신호(109)의 코딩 에러(119)를 생성하기 위한 재구성 단계 118를 포함한다. 이 재구성 단계는 양자화(113)에 의해 유발된 코딩 에러를 정량화할 수 있게 한다. 움직임 보상 단계에서, 현 트랜스코딩된 비디오 프레임의 이러한 코딩 에러는 베이스 비디오 신호(109)의 프레임마다 질적 변동을 피하기 위해 다음 비디오 프레임의 트랜스코딩을 위해 고려된다. 상기 코딩 에러(119)는 120으로 표기된 역 양자화(IQ)에 의해 재구성되고 신호(114)에 대해 수행되어 신호(121)이 된다. 이어서 신호들(110, 121)간에 감산 서브-단계 122가 수행되어, DCT 영역, 즉 주파수 영역에서의 코딩 에러(119)가 된다. 이러한 코딩 에러(119)는 상기 입력된 코딩된 비디오 신호(103)와 베이스 비디오 신호(109)간의 차이에 해당된다. 주파수 영역에서의 상기 코딩 에러(119)는 123으로 표기된 역 이산 코사인 변환(IDCT)을 거쳐 화소영역에서의 대응 코딩 에러(124)를 생성한다.
이 구성은 125로 표기된 메모리(MEM)에 저장된, 신호(109)의 이전 트랜스코딩된 비디오 프레임에 대한 코딩 에러로부터, 상기 움직임 보상된 신호(112)를 생성하기 위한 움직임 보상 서브-단계 126를 포함한다. 메모리(125)는 적어도 2개의 서브-메모리들로서 트랜스코딩되는 비디오 프레임에 대한 수정된 코딩 에러(124)의 저장에만 사용되는 제 1 서브-메모리, 및 이전 트랜스코딩된 비디오 프레임에 대한 수정된 코딩 에러(124)의 저장에만 사용되는 제 2 서브-메모리를 포함한다. 먼저, 움직임 보상(128)(COMP)이 신호(127)에 의해 액세스 가능한 상기 제 2 서브-메모리의 내용에 대해 예측단계에서 수행된다. 예측 단계는 상기 저장된 코딩 에러(127)로부터 예측된 신호(129)를 계산하는 것으로 구성되는데, 움직임 보상된 신호라고도 하는 이 예측된 신호는 트랜스코딩되는 입력 비디오 신호(102)의 부분에 대한 움직임 벡터에 의해 가리켜진 상기 메모리 디바이스(125)에 저장된 신호의 부분에 해당된다. 당업자들에 공지된 바와 같이, 상기 예측은 일반적으로 MB 레벨에서 수행되는데, 이는 신호(102)의 각 입력된 MB에 대해서, 예측된 MB이 결정되고 또한 DCT 영역에서 서브-단계 111에서 상기 입력 MB에 가산함으로써 가산되어 프레임간 질적 변동을 감쇄시킨다. 움직임 보상된 신호(129)가 화소 영역에 있기 때문에, DCT 단계 130를 거쳐 DCT 영역에서 상기 움직임 보상된 신호(112)를 생성하게 된다.
본 발명에 따라서, 트랜스코딩 단계 전에, 입력 신호는 미리 결정된 임계값보다 큰 비트 레이트를 갖는 상기 입력 신호의 부분들을 식별하기 위해서 모니터링된다. 그러므로, 상기 부분들만이 낮은 비트 레이트로 트랜스코딩된다. 이를 위해서, 도 1에 따라 기술된 구성을 구현하는 트랜스코딩 모듈이 잇점이 있게 사용될 수 있다.
예를 들면, DVB 신호가 DVD 매체 상에 보관되어야 한다면, 상기 임계값은 상기 DVD 매체에 의해 허용되는 최대 대역폭, 즉 9.8Mbits/초로 설정된다.
이점이 있게, 상기 임계값보다 큰 비트 레이트를 갖는 것으로 식별된 부분들의 트랜스코딩을 용이하게 하기 위해서, 상기 부분들은 GOP(화상 그룹들)의 내부호화된 화상(즉, 이전 혹은 후속 화상들을 참조로 하여 코딩되지 않은 화상들)에 의해 시작되고, GOP의 마지막 화상에 대응하는 화상에 의해 인코딩된다.
도면에서 도 2는 너무 높은 비트 레이트(즉, 입력 디바이스(들)에 의해 결정된 어떤 미리 결정된 임계값보다 큰)를 갖는 MPEG 비디오 스트림의 부분들을 식별하기 위한 구성을 개략적으로 도시한 것이다.
입력되는 신호는 안테나 혹은 위성 케이블(10)에 의해 수신되고 튜너(12)를 거쳐 MPEG 비디오 스트림 입력을 출력하는 디멀티플렉싱 디바이스(14)에 보내진다. 모든 이 결과적인 비디오 데이터는 이 경우 저장 디바이스(16)에 입력된다. 또한, 비디오 데이터는 로컬 비트 레이트 검출기(18)를 거치는데, 이 로컬 비트 레이트 검출기는 너무 높은 비트 레이트를 갖는 비디오 데이터의 부분들에의 포인터들을 생성한다. 이러한 부분들은 완전한 비디오 신호의 몇 퍼센트만에 달하는 경향이 있음을 알 것이다.
비디오 신호(20)가 도면의 도 3에 개략적으로 도시되었는데, 상기 비디오 신호는 너무 높은 비트 레이트(즉, 비트 레이트가 임계값 이상)를 갖는 부분들(22) 및 적합한 비트 레이트(즉, 비트 레이트가 임계값 미만)를 갖는 부분들(24)을 포함한다.
또한 도면의 도 4를 참조하면, 입력된 MPEG 비디오 스트림(20)(너무 높은 비트 레이트를 갖는 부분들(24)에의 포인터들을 포함함)이 읽혀지고, 이의 고 비트 레이트 부분들(24)은 비트 레이트가 영속적으로 비트 레이트 임계값 이상인 출력신호를 생성하기 위해서 반복적으로 재인코딩된다(즉, 트랜스코딩된다).
도면의 도 5를 참조하면, 고 비트 레이트 부분들을 반복적으로 트랜스코딩하는 프로세스가 흐름도 형태로 개략적으로 도시되었다.
도 1에 도시된 트랜스코딩 구성이 사용된다면, 고 비트 레이트 부분들은 113으로 지칭된 양자화율(Q)의 양자화 블록에 작용시 트랜스코딩된다.
먼저, 현 양자화율(cur_Q)은 초기 하위 양자화율(low_Q)와 초기 상위 양자화율(up_Q)을 설정하고, 이들 두 값들을 서로 더하고 2로 나눔으로써 결정된다. 이어서, 이 현 양자화율(cur_Q)로 고 비트 레이트 부분이 트랜스코딩된다.
이어서, 트랜스코딩된 영역의 비트 레이트가 결정된다.
비디오 스트림의 트랜스코딩된 영역의 결과적인 비트 레이트가 너무 높다면 (미리 결정된 비트 레이트 임계값(TH)에 비해서), 하위 양자화율(low_Q)은 현 양자화율(cur_Q)의 값으로 설정되고, 상위 양자화율(up_Q)은 이전과 같고, 새로운(높은) 현 양자화 율(cur_Q)이 계산되고 이 새로운 현 양자화율(cur_Q)을 사용하여 트랜스코딩 프로세스가 반복된다.
반대로, 비디오 스트림의 트랜스코딩된 영역의 비트 레이트가 너무 낮은 것으로 결정되면(미리 결정된 비트 레이트 임계값(TH)에 비해서), 상위 양자화율(up_Q)은 현 양자화율(cur_Q)의 값으로 설정되고, 하위 양자화율(low_Q)은 이전 그대로 이며, 새로운(낮은) 현 양자화율(cur_Q)이 계산되고, 이 새로운 양자화율(cur_Q)을 사용하여 트랜스코딩 프로세스가 반복된다. 이 프로세스는 트랜스코딩된 영역의 결과적인 비트 레이트가 너무 높은 것으로 혹은 너무 낮은 것으로 결정될 때까지 반복된다.
상기 비트 레이트가 상기 미리 결정된 비트 레이트 임계값(TH)에 비해 너무 낮아지게 되는 것을 피하기 위해, 상기 비트 레이트는 상기 임계값(TH)의 몇 퍼센트 아래인 경우에만 너무 낮다고 간주되는 것으로 결정될 수도 있다.
MPEG 비디오 스트림과 같은 입력되는 디지털 신호의 비트 레이트를 결정하는 몇가지 적합한 방법들이 있다. 예를 들면, 기간 Δt 내에 FIFO(선입선출) 버퍼에 입력되는 비트들의 수가 결정될 수 있다. 대안적으로, 화상그룹(GOP) 헤더들에 대한 기본 스트림(즉, 비디오 스트림)을 조사함으로써 단순 추정이 얻어질 수 있다. GOP는 고정된 수의 고정된 기간의 비디오 프레임들의 구조를 갖는다. MPEG 스트림 내에는 타이밍 정보를 위해 조사될 수 있는 클럭 참조에 기초한 시간 베이스가 있 다. GOP를 구성하는 고정된 크기의 패킷들의 수를 측정하는 것도 가능하다. 이에 따라, 시간 및 데이터 크기가 얻어질 수 있고, 이로부터 비트 레이트가 추정될 수 있다. 이외 다른 적합한 방법들이 당업자에게 명백할 것이다.
이에 따라, 본 발명의 실시예에 따른 시스템은 입력되는 디지털 신호를 기록동안(예를 들면, DVD 보관 애플리케이션의 경우) 모니터링하고, 높은 비트 레이트들이 있는 영역들을 식별하도록 구성된다. 이것은 가외의 특징점 정보로서 유별될 수 있다. 이러한 정보는 어떤 미리 결정된 임계값(입력되는 디지털 신호가 기록될 것이 요구되는 디바이스 최대 비트 레이트 용량에 의해 설정된)보다 큰 비트 레이트를 갖는 데이트 스트림들만이 트랜스코딩될 필요가 있을 것이기 때문에, 수행될 필요가 있는 처리 작업량을 즉시 제한시킬 수 있어 트랜스코더에는 매우 중하다. 결국, 트랜스코딩은 이들 검출된 시간적 영역들에서만 입력 비트 레이트를 감소시키게(예를 들면, DVD 보관 애플리케이션이 관계된다면 9.8Mbits/초 이하) 수행될 뿐이다.
위에 언급된 DVD 보관 맥락에서 실험측정들은 시간의 5% 미만동안, 비트 레이트가 높은 것으로 간주될 수 있음을 보인다. 이러한 시스템은 (최소한) 실시간 레이트들의 20배로 그리고 20배 미만의 프로세서 사용을 갖고 트랜스코딩을 수행할 수도 있을 것이다. 본 발명의 방법 및 시스템은 일반적으로 포맷 변환 혹은 고속 보관 기능에 이상적이나, 여기서 인용한 DVD 보관 애플리케이션으로 한정되는 것은 아니다.
장치 및 방법은 트랜스코더에, 혹은 고속 보관 기능을 가진 DVD+RW/HDD 콤비 레코더, 포맷 변환을 행할 수 있는 네트워크 연결 HDD 레코더, 및 일반적으로 디지털 입력을 활성화되는 저장 디바이스들과 같은 미디어 플레이어 시스템에 구현되는 이점이 있다.
본 발명은 본 발명에 따른 방법의 여러 단계들을 구현하는 코드 명령들을 저장하기 위한 메모리에 접속되는 이를테면 신호 프로세서와 같은 하드웨어에 의해 구현될 수도 있다.
위에 언급된 실시예들은 본 발명을 한정하는 것이 아니라 예시하는 것이며, 당업자들은 첨부한 청구항들에 정의된 본 발명의 범위 내에서 많은 대안적 실시예들을 설계할 수 있을 것임에 유의한다. 청구항들에서, 괄호 내 참조부호는 청구항들을 한정하는 것으로 해석되지 않을 것이다. 포함하다라는 단어는 청구항에서 혹은 명세서 전체에서 열거된 것들 이외의 요소들 혹은 단계들의 존재를 배제하지 않는다. 요소의 단일의 참조는 이러한 요소들의 복수의 참조를 배제하지 않으며, 그 반대도 그러하다.
상호 서로 다른 종속 청구항들에서 어떤 조치들이 인용되어 있다는 단순한 사실이 이들 조치들의 조합을 이점이 있게 사용할 수 없다는 것을 나타내는 것은 아니다.

Claims (7)

  1. 장치에 있어서,
    - 미리 결정된 임계값(TH)보다 큰 비트 레이트를 갖는 입력 신호(20)의 부분들(22)을 식별하기 위해 상기 입력 신호(20)를 모니터링하는 처리 수단(18); 및
    - 상기 임계값(TH) 미만으로 상기 부분들(22)의 비트 레이트를 감소시키기 위해 상기 부분들(22)을 트랜스코딩하는 트랜스코딩 모듈을 포함하는, 장치.
  2. 제 1 항에 있어서,
    상기 트랜스코딩 모듈은 상기 부분들(22)에 적용된 반복 처리 수단을 포함하는, 장치.
  3. 제 1 항에 있어서,
    상기 트랜스코딩 모듈은 상기 부분들(22)을 구성하는 DCT 계수들을 정량화하기 위한 양자화 블록을 포함하는, 장치.
  4. 제 2 항 또는 제 3 항에 있어서,
    상기 부분들(22) 각각은 화상들 그룹의 내부호화된 화상에 의해 시작되며, 화상들 그룹의 마지막 화상에 대응하는 화상에 의해 끝나는, 장치.
  5. 방법에 있어서,
    - 미리 결정된 임계값(TH)보다 큰 비트 레이트를 갖는 입력 신호(20)의 부분들을 식별하기 위해 상기 입력 신호(20)를 모니터링하는 단계; 및
    - 상기 임계값(TH) 미만으로 상기 부분들(22)의 비트 레이트를 감소시키기 위해 상기 부분들(22)을 트랜스코딩하는 단계를 포함하는, 방법.
  6. 트랜스코더 장치에 있어서,
    - 미리 결정된 임계값(TH)보다 큰 비트 레이트를 갖는 입력 신호(20)의 부분들을 식별하기 위해 상기 입력 신호(20)를 모니터링하는 처리 수단(18), 및
    - 상기 임계값(TH) 미만으로 상기 부분들(22)의 비트 레이트를 감소시키기 위해 상기 부분들(22)을 트랜스코딩하는 트랜스코딩 모듈을 포함하는, 트랜스코더 장치.
  7. 입력 신호(20)를 수신하는 미디어 플레이어 시스템에 있어서,
    - 미리 결정된 임계값(TH)보다 큰 비트 레이트를 갖는 입력 신호(20)의 부분들을 식별하기 위해 상기 입력 신호(20)를 모니터링하는 처리 수단(18); 및
    - 상기 임계값(TH) 미만으로 상기 부분들(22)의 비트 레이트를 감소시키기 위해 상기 부분들(22)을 트랜스코딩하는 트랜스코딩 모듈을 포함하는, 미디어 플레이어 시스템.
KR1020067026974A 2004-06-21 2005-06-17 처리할 데이터 부분들이 선택되는 비디오 트랜스코딩 KR20070033363A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04300387.0 2004-06-21
EP04300387 2004-06-21
PCT/IB2005/051994 WO2006000964A1 (en) 2004-06-21 2005-06-17 Video transcoding with selection of data portions to be processed

Publications (1)

Publication Number Publication Date
KR20070033363A true KR20070033363A (ko) 2007-03-26

Family

ID=34970607

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067026974A KR20070033363A (ko) 2004-06-21 2005-06-17 처리할 데이터 부분들이 선택되는 비디오 트랜스코딩

Country Status (6)

Country Link
US (1) US20080253447A1 (ko)
EP (1) EP1762099A1 (ko)
JP (1) JP2008503959A (ko)
KR (1) KR20070033363A (ko)
CN (1) CN1973548B (ko)
WO (1) WO2006000964A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4526426B2 (ja) * 2005-03-24 2010-08-18 富士通株式会社 トランスコーダ、ストリームデータ配信システムおよびストリームデータ変換方法
FR2907565B1 (fr) * 2006-10-23 2009-03-06 Canon Res Ct France Soc Par Ac Procede et dispositif pour determiner une valeur d'une grandeur physique, procede et dispositif de codage, programme d'ordinateur et support d'information pour mettre en oeuvre un tel procede.
EP2579593A1 (en) * 2011-10-04 2013-04-10 Thomson Licensing Adaptive quantisation for intra-encoded image blocks
US20160041993A1 (en) * 2014-08-05 2016-02-11 Time Warner Cable Enterprises Llc Apparatus and methods for lightweight transcoding
US10958948B2 (en) 2017-08-29 2021-03-23 Charter Communications Operating, Llc Apparatus and methods for latency reduction in digital content switching operations

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146324A (en) * 1990-07-31 1992-09-08 Ampex Corporation Data compression using a feedforward quantization estimator
CA2160568A1 (en) * 1993-04-16 1994-10-27 James M. Hardiman Adaptive video compression using variable quantization
US5687095A (en) * 1994-11-01 1997-11-11 Lucent Technologies Inc. Video transmission rate matching for multimedia communication systems
US5617142A (en) * 1994-11-08 1997-04-01 General Instrument Corporation Of Delaware Method and apparatus for changing the compression level of a compressed digital signal
US6097435A (en) * 1997-01-31 2000-08-01 Hughes Electronics Corporation Video system with selectable bit rate reduction
JP4061511B2 (ja) * 1997-04-15 2008-03-19 ソニー株式会社 符号化装置及び符号化方法
US6414996B1 (en) * 1998-12-08 2002-07-02 Stmicroelectronics, Inc. System, method and apparatus for an instruction driven digital video processor
DE19946267C2 (de) * 1999-09-27 2002-09-26 Harman Becker Automotive Sys Digitales Transcodiersystem
US6643327B1 (en) * 2000-05-05 2003-11-04 General Instrument Corporation Statistical multiplexer and remultiplexer that accommodates changes in structure of group of pictures
US7266148B2 (en) * 2001-01-05 2007-09-04 Lg Electronics Inc. Video transcoding apparatus
JP2003189311A (ja) * 2001-12-19 2003-07-04 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像符号化方法
US7079578B2 (en) * 2002-10-28 2006-07-18 Scopus Network Technologies Ltd. Partial bitstream transcoder system for compressed digital video bitstreams
EP1570674A1 (en) * 2002-11-22 2005-09-07 Koninklijke Philips Electronics N.V. Transcoder for a variable length coded data stream
US7835437B1 (en) * 2003-03-10 2010-11-16 Ji Zhang Statistical remultiplexing of compressed video segments

Also Published As

Publication number Publication date
CN1973548A (zh) 2007-05-30
WO2006000964A1 (en) 2006-01-05
EP1762099A1 (en) 2007-03-14
US20080253447A1 (en) 2008-10-16
JP2008503959A (ja) 2008-02-07
CN1973548B (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
US6441754B1 (en) Apparatus and methods for transcoder-based adaptive quantization
KR100850705B1 (ko) 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치
TWI478584B (zh) 一種視訊編解碼的方法及其裝置
JP2008523687A (ja) ファイングラニュラースケーラビリティのためのデジタルビデオのリアルタイムトランスコーディングのシステム及び方法
KR19990082456A (ko) 영상 데이터 압축 장치 및 그 방법
KR20020026198A (ko) 비디오 압축
WO2006098226A1 (ja) 符号化装置および符号化装置を備えた動画像記録システム
KR100386583B1 (ko) 영상 변환 부호화 장치 및 방법
KR20070033363A (ko) 처리할 데이터 부분들이 선택되는 비디오 트랜스코딩
WO2000021300A1 (en) Method and apparatus for converting the bitrate of an encoded bitstream without full re-encoding
JP5345797B2 (ja) ビデオ信号の変換方法及び装置
US6804299B2 (en) Methods and systems for reducing requantization-originated generational error in predictive video streams using motion compensation
JP4114210B2 (ja) 映像データ圧縮装置およびその方法
US20070025438A1 (en) Elastic storage
US20030123538A1 (en) Video recording and encoding in devices with limited processing capabilities
JP3948025B2 (ja) 画像符号のトランスコーダ及び画像符号のトランスコーディング方法
JP4032446B2 (ja) 映像データ圧縮装置およびその方法
JP2007336005A (ja) 画像符号化装置および画像符号化方法
KR20030083109A (ko) 비트율 변환부호화장치
US11490121B2 (en) Transform device, decoding device, transforming method, and decoding method
KR100338725B1 (ko) 목표부호량에근접시킨영상신호부호화방법및그에따른장치
JPH11252546A (ja) 伝送速度変換装置
JP2005507620A (ja) 圧縮
JPH07298270A (ja) 動き補償フレーム間予測符号化装置
KR0123092B1 (ko) 픽쳐 시작 위치 코드 코딩 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
NORF Unpaid initial registration fee