KR20060036922A - 비디오 압축 - Google Patents

비디오 압축 Download PDF

Info

Publication number
KR20060036922A
KR20060036922A KR1020057023456A KR20057023456A KR20060036922A KR 20060036922 A KR20060036922 A KR 20060036922A KR 1020057023456 A KR1020057023456 A KR 1020057023456A KR 20057023456 A KR20057023456 A KR 20057023456A KR 20060036922 A KR20060036922 A KR 20060036922A
Authority
KR
South Korea
Prior art keywords
stream
video
audio
information
decoding
Prior art date
Application number
KR1020057023456A
Other languages
English (en)
Inventor
한 제라르드 드
마르코 케이. 보스마
브루인 프레데릭 제이. 드
로기어 로더
아브라함 케이. 리에멘스
피터 이. 비에렌가
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20060036922A publication Critical patent/KR20060036922A/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234381Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/242Synchronization processes, e.g. processing of PCR [Program Clock References]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • H04N7/52Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 비디오 데이터의 스트림으로부터 비디오 프레임들의 스토리-보드를 생성하는 방법 및 장치에 관한 것이며, 여기서는 스토리-보드의 비디오 프레임들만이 휴대용 전자 디바이스들에 전송된다. 콘텐트 제어 요약은 입력 비디오 데이터로부터 생성된다. 그 다음에, 콘텐트 제어 요약은 연속 오디오 신호와 동기된다. 요약은 전송을 위해 연속 오디오와 함께 인코딩된다.
비트스트림, 콘텐트 제어 요약, 스토리-보드, 비디오 프레임

Description

비디오 압축{Video compression}
본 발명은 비디오 압축 및 전송, 특히 모바일 데이터 서비스들을 위한 비디오 압축에 관한 것이다.
셀룰라 전화들 및 다른 휴대용 전자 디바이스들은 요즘 단순한 통신 이상으로 사용된다. 예컨대, 많은 새로운 셀룰라 전화들 및 다른 휴대용 전자 디바이스들은 지금 비디오 이미지들을 디스플레이할 수 있는 스크린을 갖추고 있다. 결과로서, 뉴스, 스포츠 등과 같은 비디오 이미지들은 이들 휴대용 디바이스들에 방송될 수 있다. 그러나, 비디오 이미지들에 고유한 많은 양의 데이터는 모바일 전화들 및 다른 휴대용 디바이스들에 전체-움직임 비디오 신호들을 전송하여 디스플레이할 때 중요한 문제점들을 생성한다. 특히, 각각의 이미지 프레임은 특정 시스템의 디스플레이 해상도에 따라 화소들의 어레이로 형성된 정지 이미지이다. 결과로서, 고해상도 비디오 시퀀스들에 포함된 생정보(raw information)의 양은 대용량이다. 전송되어야 하는 데이터량을 감소시키기 위하여, 압축 기법들은 데이터를 압축하기 위하여 사용된다. MPEG-2, MPEG-4, 및 H.264를 포함하는 다양한 비디오 압축 표준들 또는 프로세스들이 구축되었다. 그러나, 이들 압축 기법들은 단독으로 휴대용 전자 디바이스들 상으로 쉽게 전송하고 디스플레이하기 위한 수용 가능한 레벨로 데이터량을 감소시키지 못할 수 있다.
본 발명은 비디오 데이터의 스트림으로부터 비디오 프레임들의 스토리 보드를 생성하기 위한 방법 및 장치들을 공개하고, 여기서는 스토리-보드의 비디오 프레임들만이 휴대용 전자 디바이스들에 전송된다.
본 발명의 일 실시예에 따르면, 전송을 위해 비디오 신호들을 압축하기 위한 방법 및 장치들이 공개되었다. 콘텐트 제어 요약은 입력 비디오 데이터로부터 발생된다. 그 다음에, 콘텐트 제어 요약은 연속 오디오 신호와 동기된다. 요약은 전송을 위해 연속 오디오와 함께 인코딩된다.
본 발명의 다른 실시예에 따르면, 사용자에 의하여 요청된 정보를 제공하기 위한 통신 시스템 및 방법이 기술된다. 정보 요청이 사용자로부터 수신될 때, 요청된 비디오 정보를 위하여 데이터베이스는 탐색되고, 데이터베이스로부터 추출된다. 그 다음에, 추출된 정보의 콘텐트 제어 요약이 발생된다. 콘텐트 제어 요약은 연속 오디오 신호와 동기된다. 요약은 전송을 위해 연속 오디오와 함께 인코딩된다.
본 발명의 이들 및 다른 특징들은 이후에 기술된 실시예들을 참조하여 명백해질 것이다.
본 발명은 첨부 도면들을 참조하여 예로서 지금 기술될 것이다.
도 1은 본 발명의 일 실시예에 따른 통신 시스템의 블럭도.
도 2는 본 발명의 일 실시예에 따라 비쥬얼 인덱스를 생성할 때 사용되는 디바이스의 블럭도.
도 3은 본 발명의 일 실시예에 따라 비쥬얼 인덱스를 생성할 때 사용되는 디바이스의 블럭도.
도 4는 본 발명의 일 실시예에 따른 키-프레임 추출을 기술한 도면.
도 5는 본 발명의 다른 실시예에 따른 오디오/비디오 동기화를 기술한 도면.
도 6은 본 발명의 다른 실시예에 따른 키-프레임 인코더의 블럭도.
도 7은 본 발명의 다른 실시예에 따른 키-프레임 디코더의 블럭도.
도 8은 본 발명의 다른 실시예에 따른 임시 계층 인코더의 블럭도.
도 9는 본 발명의 다른 실시예에 따른 공간 계층 디코더의 블럭도.
도 10은 본 발명의 다른 실시예에 따른 대화형 통신 시스템의 블럭도.
도 1은 본 발명의 실시예에 따라 모바일 데이터 서비스들에 스토리-보드(story-board) 기반 비디오 압축을 제공하기 위한 통신 시스템(100)을 도시한다. 통신 시스템(100)은 입력 비디오 신호(104)를 수신하고 비디오 신호(104)에서 유효 장면들(significant scenes)의 스토리-보드를 생성하는 콘텐트 제어 요약 추출 디바이스(102)를 갖는다. 사용자의 휴대용 전자 디바이스에는 전체 비디오 스트림을 전송하기보다 단지 이들 유효 비디오 장면들만이 전송될 것이다. 요약/오디오 동기 디바이스(106)는 비디오 입력(104)을 수반하는 대응하는 연속 오디오 신호와 함께 콘텐트 제어 요약 추출 디바이스(102)에 의하여 생성된 요약 스토리-보드 비디 오 프레임들을 동기시키기 위하여 사용된다. 그 다음에, 스토리-보드 신호 및 오디오 신호는 압축유닛(108)에서 결합된다. 그 다음에, 압축된 신호는 수신된 신호를 압축해제하고 원래의 비디오 스트림으로부터의 전체 오디오 스트림이 재생되는 동안 선택된 비디오 장면들을 디스플레이하는 수신기 유닛(110)에 전송된다. 통신 시스템(100)의 각각의 컴포넌트들은 이하에서 더 상세히 지금 기술될 것이다.
본 발명에 따르면, 비디오 스트림(104)은 요약 추출 디바이스(102)에 의하여 스토리-보드 요약으로 된다. 본 발명은 비디오 입력으로부터 스토리-보드를 생성하기 위하여 데이터 검색 시스템들에서 사용되는 임의의 알려진 유효 장면 검출 방법 및 장치를 사용할 수 있다. 예컨대, 드미트로바(Dimitrova) 등에 의한 미국특허번호 제6,137,544호에 개시된 유효장면 검출 및 프레임 필터링 시스템은 도 2 및 도 3을 참조로하여 지금 간단하게 기술될 것이나, 본 발명은 이에 제한되지 않는다.
비디오는 아날로그(연속 데이터) 또는 디지털(불연속 데이터) 형식으로 존재한다. 본 예는 디지털 영역에서 동작하며 이에 따라 처리를 위한 디지털 형식을 사용한다. 따라서, 소스 비디오 또는 비디오 신호는 이미지들의 디스플레이된 시퀀스가 연속 화상 스트림으로서 보이도록 충분히 높은 레이트로 일련의 개별 이미지들 또는 비디오 프레임들이다. 이들 비디오 프레임들은 MPEG, MPEG2, MPEG4, 움직임 JPEG 등과 같은 형식으로 비압축 또는 압축 데이터일 수 있다.
비압축 비디오의 정보는 우선 인텔 스마트 비디오 레코더 III에서 제시되는 기술과 같은 프레임 그래빙 기술(frame grabbing technique)을 사용하여 미디어 프 로세서(202)에서 프레임들로 분할된다. 프레임들은 호스트 프로세서(210)에서 예컨대 8x8 화소들의 블럭들로 각각 분할된다. 이들 블럭들 및 인기있는 방송 표준, 즉 CCIR-601을 사용하면, 매트로블럭 생성기(206)는 휘도 블럭들을 생성하고, 색 정보를 평균하여 크로미넌스 블럭들(chrominance blocks)을 생성한다. 휘도 및 크로미넌스 블럭은 매크로블럭을 형성한다.
비디오 신호는 또한 움직임 JPEG 및 MPEG와 같은 압축 표준을 사용하여 압축된 이미지를 나타낼 수 있다. 만일 신호가 MPEG 또는 다른 압축된 신호이면, MPEG 신호는 프레임 파서(frame parser: 205)에 의하여 프레임 또는 비트스트림 파싱 기술을 사용하여 프레임들로 분할된다. 그 다음에, 프레임들은 미디어 프로세서(203)에서 엔트로피 디코더(214) 및 테이블 지정자(table specifier: 216)에 전송된다. 엔트로피 디코더(214)는 테이블 지정자(216)로부터의 데이터, 예컨대 허프만 디코딩(Huffman decording) 또는 다른 디코딩 기술을 사용하여 MPEG 신호를 디코딩한다.
다음에, 디코딩된 신호는 역양자화기(218)에 공급되어 테이블 지정자(216)로부터의 데이터를 사용하여 디코딩된 신호를 역양자화된다. 비록 미디어 프로세서(203)에서 일어나는 것으로 도시될지라도, 이들 단계들은 비디오 프로세서(203), 호스트 프로세서(211) 또는 다른 외부 디바이스에서 일어날 수 있다. 선택적으로, 시스템이 상이한 처리 단계들에서 액세스를 허용하는 인코딩 능력을 가지면, DCT 계수들은 호스트 프로세서에 직접 전달될 수 있다. 이들 모든 접근법들에서는 실시간으로 처리가 수행될 수 있다.
자동 유효 장면 검출을 위하여, 본 예는 언제 비디오의 장면이 변경되거나 또는 정적 장면이 일어나는 지를 검출하기를 시도한다. 장면은 관련 이미지들 이상을 나타낼 수 있다. 유효 장면 검출에서, 2개의 연속 프레임들의 적어도 하나의 특성은 유효 장면 프로세서(230)에 의하여 비교되며, 프레임들의 선택된 특성들이 주어진 제 1임계값 이상이면, 선택된 특성들은 매우 다른 것으로 식별되며, 장면 변화는 2개의 프레임들 사이에서 일어나도록 결정되며; 선택된 특성들이 주어진 제 2임계값보다 작으면, 선택된 특성들은 매우 동일하도록 결정되며, 정적 장면이 일어나는 지를 결정하기 위하여 처리가 수행된다. 유효 장면 변화가 일어날 때, 프레임은 키-프레임으로서 저장된다. 유효 장면 검출 처리 동안, 프레임이 키-프레임으로서 프레임 메모리(234)에 저장되면, 연관된 프레임 넘버는 예컨대 상대 발생시간을 지시하는 시간 코드 또는 시간 스탬프로 변환된다.
키-프레임 필터링 방법은 반복 프레임들 및 다른 선택된 타입들의 프레임들을 필터링함으로써 프레임 메모리에 저장된 키-프레임들의 수를 감소시키기 위하여 사용될 수 있다. 키-프레임 필터링은 유효 장면 검출이 발생된 후에 호스트 프로세서(210)에서 키-프레임 필터(240)에 의하여 수행된다. 그 다음에, 키-프레임 필터링에서 살아남은 프레임들은 비디오 입력(104)의 스토리-보드 요약을 생성하기 위하여 사용될 수 있다. 키-프레임 추출에 대한 설명은 도 4에 기술된다. 입력 비디오 신호(401)는 첨부 오디오 신호(403)가 변경되지 않는 동안 스토리-보드 요약을 생성하는 키-프레임들의 비디오 이미지들만을 포함하는 실질적으로 감소된 비디오 신호(405)로 변환된다.
통신채널의 이용가능한 대역폭(또는 비트율)을 최적으로 사용하기 위하여, 단위 시간당 키-프레임들의 수는 너무 많이 변화하지 않아야 한다. 이 때문에, 본 발명의 유리한 구현에서, 연속 프레임들이 유효하게 다르거나 또는 유사한지의 여부를 결정하는 앞서 언급된 제 1 및 제 2 임계치들은 유효 장면 프로세서(230)의 비트율 제어 루프에 의하여 제어된다. 출력-버퍼의 상태에 따르면, 잠재적인 키-프레임들의 수는 버퍼가 절반 이상인 경우에 임계치들을 수정함으로써 감소될 수 있거나, 또는 잠재적인 키-프레임의 수는 버퍼가 절반 이하인 경우에 반대방향으로 임계치들을 수정함으로써 증가될 수 있다. 이러한 목표를 달성하기 위한 대안 또는 추가 수단은 버퍼-상태 신호에 의하여 앞서 언급된 키-프레임 필터링 수단을 수정하는 데 있어서 존재한다.
일단 스토리-보드 요약이 생성되면, 스토리-보드 요약 및 오디오 신호는 동기될 필요가 있다. 동기에 관한 설명은 도 5에 기술된다.
비디오 입력(401) 및 오디오 입력(403)이 동기된다고 가정하면, 동기화기(106)는 스토리-보드 요약 생성 후에 비디오 및 오디오를 유지하기 위하여 필요로 된다. 이는 예컨대 스토리-보드 프레임들 및 오디오에 시간-코드를 포함함으로써 행해질 수 있다. 이러한 방식에서, 버퍼에 다중 스토리-보드 프레임들을 배치하고 디코더측에서 정확하게 동기된 시간에 적정 프레임을 나타내는 것이 가능하다.
앞서 언급된 바와 같이, 일단 스토리-보드 요약이 생성되고 오디오/비디오가 동기되었으면, 정보는 전송을 위하여 압축될 필요가 있다. 다양한 압축방법들 및 인코더들은 본 발명에서 사용될 수 있으며, 본 발명은 특정 방법에 제한되지 않는 다. 요약-보드 및 첨부 오디오의 압축 및 인코딩을 위하여 사용될 수 있는 하나의 가능한 인코더의 예로서, 전형적인 인코더(600)는 도 6을 참조로하여 지금 기술될 것이다.
도시된 인코딩 시스템(600)은 키 프레임들의 압축을 성취한다. 각각의 프레임에 대한 압축 설명은 독립적이거나(인트라-프레임 인코딩됨) 또는 하나 이상의 이전에 인코딩된 키 프레임들과 관련할 수 있다(인터-프레임 인코딩됨). 본 발명의 일 실시예에 따른 인트라 프레임 인코딩 시스템은 양자화된 값들을 무손실 인코딩하기 위한 가변길이 인코딩 유닛(630)에 접속되는 양자화 유닛(620)에 접속되는 영역 화소-역상관 유닛(regional pixel-decorrelation unit: 610)에 기초한다.
영역 화소 역상관 유닛은 차동 펄스 코드 변조(DPCM: differential pulse code modulation)에 기초하거나 또는 블럭방식 선형 변환, 예컨대 각각의 블럭 휘도 또는 크로미넌스 화소들에 대한 이산코사인변환(DCT)의 형태에 기초할 수 있다. 본 발명의 일 실시예에서, 비중첩 8x8 블럭들은 획득 유닛(611)에 의하여 미리 결정된 순서로 획득된다. DCT 함수는 8x8 화소 평균을 나타내는 하나의 DC 계수 및 8x8 화소들의 블럭에서 저주파수 또는 고주파수 코사인 패턴들의 존재를 나타내는 63 AC 계수들을 생성하기 위하여 변환 유닛(612)에 의하여 표현된 8x8 화소들의 각 블럭에 적용된다. 후속으로, DPCM은 DPCM 인코더 유닛(613)에 의하여 DC 변환 계수들의 시리즈에 적용된다.
양자화 유닛(620)은 스칼라 양자화 또는 벡터 양자화를 수행할 수 있다. 스칼라 양자화는 역상관 유닛(610)에 의하여 생성된 각각의 원래의 값(여기서, 'AC 변환 계수(AC transform coefficient)')의 근사치를 나타내는 코드(또는 '표현레벨(representation level)')를 발생시킨다. 벡터 양자화기는 역상관 유닛(610)에 의하여 발생되는 원래의 값들의 그룹(예컨대 '블럭(block)')의 근사치를 나타내는 코드를 발생시킨다. 인코더의 일 실시예에서, 스칼라 양자화는 각각의 표현 레벨이 각각의 AC 변환 계수의 근사화 유닛(621)에서의 정수 분할에 따르도록 적용된다. 각 정수 분할의 분모는 일반적으로 63 AC 계수들의 각각에 대하여 다르다. 미리 결정된 분모들은 '양자화 매트릭스(quantization matrix)'(622)로서 표현된다.
가변-길이 인코딩 유닛(630)은 일반적으로 허프만-인코딩, 산술 코딩 또는 이들의 결합에 기초할 수 있다. 인코더의 일 실시예에서, 일련의 표현 레벨들은 미리 결정된 순서로(DC 계수 위치로부터 시작하여 '지그-재그(zig-zag)'로) 값들을 주사하는 주사 유닛(631)에 의하여 주사함으로써 생성된다. 일련의 표현 레벨들은 일련의 비제로(non-zero) 값들의 끝을 식별하는 코드('블럭의 끝(end of block)')와 함께 동일한 값을 가진 다음 반복의 수와 표현레벨의 값에 대한 고유 코드를 발생시키는 런-길이(run-length) 인코딩 유닛(632)에 전송된다. 이들 코드들의 2진 심볼들에 대한 수는 압축 설명 양자화 비디오 신호가 획득되도록 한다. 결합 유닛(633)은 비디오 신호의 휘도 및 크로미넌스 성분들, 각 블럭에 대한 DC 계수들, 및 블럭당 AC 계수들을 나타내는 2진 심볼들의 스트림들을 결합한다. 색 성분당, 8x8 블럭당 및 프레임당 다중화 순서는 인식가능한 대부분의 관련 데이터가 우선 전송되도록 한다. 결합 유닛에 의하여 발생되는 다중화된 비트-스트림은 원래의 비디오 신호의 압축 표현을 형성한다.
본 발명의 일 실시예에 따른 키프레임 디코더는 도 7을 참조로하여 지금 기술될 것이다. 디코더는 가변-길이 디코더(710), 역양자화 유닛(720), 및 반전 역상관 유닛(inverse decorrelation unit: 730)을 포함한다. 가변-길이 디코더(710)는 색 성분들, 8x8 블럭들 및 계수들과 연관된 데이터를 획득하기 위하여 역다중화 프로세스를 수행하는 분리 유닛(711)을 포함한다. 런-길이 디코딩 유닛(712)은 8x8 화소당 AC 계수들의 표현 레벨들을 복원한다.
역양자화 유닛(720)은 복원 유닛(722)을 사용하여 표현 레벨로부터 원래의 계수 값의 근사치를 복원하기 위하여 미리 결정된 양자화 매트릭스(721)를 사용한다.
반전 역상관 유닛(730)은 역상관 유닛(610)의 역동작이며, 동일한 입력 비디오 신호 또는 최상의 가능한 근사치를 야기한다. 디코더의 일 실시예에서, DCT 유닛(612)으로부터 DCT 함수와 매칭되는 역 DCT 함수(731) 뿐만 아니라 DPCM 인코더 유닛(613)과 매칭되는 DPCM 디코더(732)가 적용된다. 분배 유닛(733)은 획득 유닛(611)에 의하여 획득되는 것과 동일한 미리 결정된 순서대로 적절한 위치에 휘도 및 크로미넌스 화소값들의 디코딩된 8x8 블럭들을 배치시킨다.
예로서, 임시 계층 인코더(800)는 도 8 및 도 2를 참조로하여 지금 기술될 것이다. 표현된 인코딩 시스템(800)은 임시 계층 압축을 수행하며, 이에 따라 채널의 일부분은 단지 키프레임을 제공하기 위하여 사용되며 채널의 다른 부분은 손실 상보 프레임들을 전송하기 위하여 사용되며, 그 결과 결합된 신호들은 원래의 프레임 속도에서 비디오 신호를 형성한다. 유효-장면 검출기(230, 801)는 원래의 비디오를 처리하며 키프레임을 식별하는 신호를 발생시킨다. 임의의 표준 인코더(MPEG-1, MPEG-2, MPEG-4 ASP, H.261, H.262, MPEG-4 AVC a.k.a. H.264)일 수 있는 정상 MPEG 인코더(802)는 검출기(801)로부터의 키프레임 식별 신호로 하여금 인코더가 P-또는 B-프레임이 아니라 I-프레임으로서 적절한 프레임을 처리하도록 하는 특징과 함께 원래의 신호를 수신하여 MPEG-추정 형식으로 인코딩한다. 단지 국제 P-프레임이 I-프레임으로 대체된다는 것을 적절한 프레임으로 지정한다. B-프레임들의 교체는 이미 인코딩된 선행 B-프레임들의 재계산을 필요로 한다. MPEG 인코더는 비록 경우에 따라 규칙적 GOP-구조를 가질지라도 모든 I-, P- 및 B-프레임들을 가진 MPEG-추정 비트스트림을 발생할 수 있다.
키프레임 필터(803)는 MPEG-비트스트림 및 키프레임 식별신호를 수신하고 기본 스트림 및 인헨스먼트 스트림을 발생시킨다. 기본 스트림은 인트라-인코딩된 키프레임들로 구성된다. 이는 시간-샘플링된 I-프레임들을 가진 MPEG-추종 스트림이다. 인헨스먼트 스트림은 인트라-뿐만아니라 인터-인코딩된 프레임들을 가진 MPEG-추종 스트림이다. 이는 '키프레임(keyframe)'으로 식별된 I-프레임들이 손실한 특징과 함께 시간-스탬핑된 I-, P- 및 B-프레임들을 가진 MPEG-추종 스트림이다. 키프레임을 전송하기 위한 결정은 키프레임 식별신호 뿐만 아니라 현재의 MPEG-프레임의 예측 타입에 기초한다. 전류 프레임이 B-프레임인 경우에, 다음 I-또는 P-프레임은 기본 스트림으로 전송된다. 키프레임 식별 인스턴스 및 키프레임 전송 인스턴스간의 지연시간은 일반적으로 작으며 불량한 장면의 프레임이 전송되지 않도록 한다.
기본 디코더는 시간 스탬핑된 키프레임들을 가진 MPEG-추종 기본 스트림을 수신하고, 프레임들을 디코딩하며, 적절한 인스턴스에 프레임들을 디스플레이한다. 계층 디코더는 도 9에 기술된 바와 같이 기본 및 인헨스먼트 스트림을 결합하는 결합 유닛을 가진다. 기본 스트림(901)은 인코딩된 기본 스트림을 디코딩하는 기본 디코더(902)에 제공된다. 디코딩된 기본 스트림은 상향 변환기(904)에 의하여 상향 변환되어 가산 유닛(906)에 제공된다. 인헨스먼트 스트림(903)은 디코더(908)에 의하여 디코딩된다. 그 다음에, 디코딩된 인헨스먼트 스트림은 디스플레이를 위한 최종 비디오 신호를 생성하기 위하여 가산유닛(906)에 의하여 상향 변환된 기본 스트림에 가산된다. 이는 정상 MPEG-디코더가 원래 의도된 프레임 속도로 디코딩된 비디오 신호를 획득하는데 충분하도록 모든 프레임들을 가진 MPEG-추종 비디오 스트림을 발생시킨다.
이러한 응용을 위하여, 전송된 키-프레임들은 전형적으로 시간에 대하여 등거리로 배치되지 않는다. 신호에는 오디오 및 키-프레임의 시간 인스턴스에 시맨틱 결합이 존재한다. 이용가능한 채널 대역폭에서 최적의 장점을 취하기 위하여, 키-프레임들은 디스플레이될 필요가 있기 전에 양호하게 전송될 수 있다. 이는 수신 당사자에게 정보를 제공할 때 오디오 및 키-프레임간의 시맨틱 결합을 복원하는데 중요하다. 메시지의 시맨틱은 통신채널을 통해 보존된다. 이를 수행하기 위하여, 시간 스탬프는 데이터 스트림의 인코딩 동안 키-프레임에 부착된다. 디코딩 동안 시간 스탬프는 키-프레임이 어느 시점에 디스플레이되어야 하는지(따라서, 이전에 디스플레이된 키-프레임을 어느 시점에 대체해야하는 지를)를 결정하기 위하 여 사용된다. 결과로서, 키-프레임들은 시간 스탬프에 의하여 오디오에 동기된다.
본 발명의 일 실시예에 따르면, 본 발명은 사용자들이 휴대용 전자 디바이스들을 통해 수신하고 싶어하는 정보의 타입을 사용자들이 지정할 수 있는 대화형 통신 시스템에서 사용될 수 있다. 대화형 통신 시스템(1000)의 예시적인 예가 도 10에 기술된다. 사용자는 시스템이 임의의 수의 다른 화제들에 대한 사용자 정보를 전송할 것을 요청하는 시스템(1000)에 휴대용 전자 디바이스(1002)를 사용하여 음성, SMS 등을 통해 메시지를 전송한다. 이러한 예에서, 사용자는 시스템(1000)에 "이스라엘 뉴스(news about Israel)"에 대한 요청을 전송한다. 이 요청은 수신기(1004)에 의하여 수신되며, 그 다음에 요청은 컴퓨터(1006)에 전송된다. 컴퓨터(1006)는 요청을 디코딩하며, 요청된 정보의 타입을 결정한다. 그 다음에, 컴퓨터(1006)는 요청과 관련된 비디오 정보에 대하여 데이터베이스(1008)를 탐색한다. 데이터베이스(1008)가 시스템(100) 내에 있거나 또는 시스템(1000)으로부터 분리되며 컴퓨터(1006)가 하나 이상의 컴퓨팅 엘리먼트들을 포함할 수 있다는 것이 이해되어야 한다. 요청과 관련한 데이터베이스내의 정보는 콘텐트 제어 요약 추출 디바이스(1010)에 전송된다. 콘텐트 제어된 요약 추출 디바이스(102)는 데이터베이스로부터 비디오 정보를 수신하고 비디오 정보에서 유효 장면의 스토리-보드를 생성한다. 요약/오디오 동기 디바이스(1012)는 데이터베이스로부터 비디오 정보를 수반하는 대응 연속 오디오 신호와 콘텐트 제어 요약 추출 디바이스(1010)에 의하여 생성된 요약 스토리-보드를 동기시키기 위하여 사용된다. 그 다음에, 스토리-보드 신호 및 오디오 신호는 압축 유닛(1014)에서 결합된다. 압축된 신호들은 송 신기(1016)에 의하여 전송되고 사용자의 휴대용 전자 디바이스(1002)에 의하여 수신된다. 그 다음에, 압축된 신호는 디코딩된후 휴대용 전자 디바이스(1002)상에 디스플레이된다.
당업자는 앞서 기술된 실시예들을 구현하기 위하여 사용되는 프로그램 단계들 및 연관된 데이터가 본 발명으로부터 벗어나지 않고 디스크 저장 장치뿐만 아니라 판독전용 메모리(ROM) 디바이스들, 랜덤 액세스 메모리(RAM) 디바이스들, 광학 저장 엘리먼트들, 자기 저장 엘리먼트들, 자기-광학 저장 엘리먼트들, 플래시 메모리, 코어 메모리 및/또는 다른 등가의 저장 기술들을 포함하는 다른 형태의 저장 장치들(그러나, 이에 제한되지 않음)을 사용하여 실행될 수 있다는 것을 인식해야 한다. 이러한 대안 저장 디바이스들은 균등물들로서 고려되어야 한다.
본 발명의 다른 실시예들이 일부 단계들의 타이밍이 본 발명의 전체 동작에 영향을 미치지 않고 상호교환될 수 있기 때문에 앞서 기술된 단계들의 정확한 순서에 제한되지 않는다는 것이 이해될 것이다. 게다가, 단수는 다수를 배제하지 않는다.
앞서 언급된 실시예들은 본 발명을 제한하는 것이 아니라 예시적이며 당업자가 첨부된 청구항들의 범위를 벗어나지 않고 많은 대안 실시예들을 설계할 수 있다는 것이 이해되어야 한다. 청구항들에서, 괄호 내에 삽입된 일부 참조부호들은 청구항들을 제한하는 것으로 고려되어서는 안 된다. 용어 "포함한다(comprising)"는 청구항에서 리스트된 것과 다른 엘리먼트들 또는 단계들의 존재를 배제하지 않는다. 본 발명은 여러 개별 엘리먼트들을 포함하는 하드웨어에 의하여 그리고 적절 하게 프로그래밍된 컴퓨터에 의하여 구현될 수 있다. 디바이스 청구항에서, 열거된 수단들중 여러 수단들은 하나 또는 동일한 하드웨어 항목으로 구현될 수 있다. 임의의 측정치들이 서로 다른 종속항들에서 인용되는 단순한 사실은 이들 측정치들의 결합이 장점으로 사용될 수 없다는 것을 지시하지 않는다.

Claims (16)

  1. 전송을 위해 비디오 신호들을 압축하기 위한 장치에 있어서,
    입력 비디오 데이터로부터 콘텐트 제어 요약(content controlled summary)을 생성하는 수단(102);
    상기 콘텐트 제어 요약을 연속 오디오 신호와 동기시키는 수단(106); 및
    전송을 위해 상기 연속 오디오와 함께 상기 요약을 인코딩하는 수단(108)을 포함하는, 비디오 신호 압축 장치.
  2. 제 1항에 있어서, 상기 인코딩된 신호를 전송하는 수단(1016)을 더 포함하는, 비디오 신호 압축 장치.
  3. 제 1항에 있어서, 상기 콘텐트 제어 요약은 키-프레임 검출을 사용하여 생성되는, 비디오 신호 압축 장치.
  4. 제 1항에 있어서, 상기 콘텐트 제어 요약 수단은 비트율 제어 루프에 의해 제어되는, 비디오 신호 압축 장치.
  5. 제 1항에 있어서, 상기 콘텐트 제어 요약 및 상기 연속 오디오 신호는 실질적으로 일정한 비트율 프레임으로 압축되는, 비디오 신호 압축 장치.
  6. 제 1항에 있어서, 적절한 디코딩을 보장하기 위하여 상기 동기된 신호에 시간-스탬프들이 삽입되는, 비디오 신호 압축 장치.
  7. 전송을 위해 비디오 신호들을 압축하기 위한 방법에 있어서,
    입력 비디오 데이터로부터 콘텐트 제어 요약을 생성하는 단계;
    상기 콘텐트 제어 요약을 연속 오디오 신호와 동기시키는 단계; 및
    전송을 위해 상기 연속 오디오와 함께 상기 요약을 인코딩하는 단계를 포함하는, 비디오 신호 압축 방법.
  8. 컴퓨터가 제 7항의 방법을 수행하게 하는 명령들이 저장된 컴퓨터 저장매체.
  9. 사용자에 의하여 요청된 정보를 공급하는 대화형 통신 시스템(interactive communication system)으로서,
    상기 사용자로부터 정보 요청을 수신하는 수단(1004);
    상기 요청된 정보에 대하여 데이터베이스를 탐색하고 상기 데이터베이스로부터 상기 요청된 정보를 추출하는 수단(806);
    상기 추출된 정보의 콘텐트 제어 요약을 생성하는 수단(1010);
    상기 콘텐트 제어 요약과 연속 오디오 신호를 동기시키는 수단(1012); 및
    전송을 위해 상기 연속 오디오와 함께 상기 요약을 인코딩하는 수단(1014)을 포함하는, 대화형 통신 시스템.
  10. 대화형 통신 시스템에서 사용자에 의하여 요청된 정보를 제공하는 방법에 있어서,
    상기 사용자로부터 정보 요청을 수신하는 단계;
    상기 요청된 정보에 대하여 데이터베이스를 탐색하고 상기 데이터베이스로부터 상기 요청된 정보를 추출하는 단계;
    상기 추출된 정보의 콘텐트 제어 요약을 생성하는 단계;
    상기 콘텐트 제어 요약과 연속 오디오 신호를 동기시키는 단계; 및
    전송을 위해 상기 연속 오디오와 함께 상기 요약을 인코딩하는 단계를 포함하는, 정보 제공 방법.
  11. 통신 시스템에서 오디오/비디오 정보를 운반하는 비트스트림에 있어서,
    오디오 스트림(403);
    입력 비디오 신호의 키-프레임들로부터 생성된 콘텐트 비디오 요약 스트림(405)으로서, 상기 오디오 스트림은 방송을 위한 상기 비디오 요약 스트림과 동기되는, 상기 콘텐트 비디오 요약 스트림을 포함하는, 비트스트림.
  12. 저장 매체에 있어서,
    오디오 스트림(403); 및
    입력 비디오 신호의 키-프레임들로부터 생성된 콘텐트 비디오 요약 스트림(405)으로서, 상기 오디오 스트림은 방송을 위한 상기 비디오 요약 스트림과 동기되는, 상기 콘텐트 비디오 요약 스트림을 포함하는, 저장 매체.
  13. 수신된 정보 스트림을 디코딩하는 디코더에 있어서,
    상기 정보 스트림에서 기본 스트림을 디코딩하는 수단(902);
    상기 디코딩된 기본 스트림을 상향 변환하는 수단(904);
    상기 정보 스트림에서 인헨스먼트 스트림을 디코딩하는 수단(908); 및
    상기 상향 변환된 기본 스트림과 상기 인헨스먼트 스트림을 결합하는 수단(906)으로서, 상기 결합된 신호는 오디오 스트림과 동기된 정지 비디오 이미지들을 갖는, 상기 결합 수단을 포함하는, 디코더.
  14. 수신된 정보 스트림을 디코딩하기 위한 방법에 있어서,
    상기 정보 스트림에서 기본 스트림을 디코딩하는 단계(902);
    상기 디코딩된 기본 스트림을 상향 변환하는 단계(904);
    상기 정보 스트림에서 인헨스먼트 스트림을 디코딩하는 단계(908); 및
    상기 상향 변환된 기본 스트림 및 상기 인헨스먼트 스트림을 결합하는 단계(906)로서, 상기 결합된 신호는 오디오 신호와 동기된 정지 비디오 이미지를 갖는, 상기 결합 단계를 포함하는, 디코딩 방법.
  15. 비트스트림을 디코딩하는 방법으로서, 상기 비트스트림은 오디오 스트림과 입력 비디오 신호의 키-프레임들로부터 생성된 콘텐트 비디오 요약 스트림을 운반하고, 상기 오디오 스트림은 상기 비디오 요약 스트림과 동기되는, 상기 비트스트림 디코딩 방법에 있어서,
    상기 오디오 스트림을 디코딩하는 단계;
    상기 비디오 요약 스트림을 디코딩하는 단계; 및
    상기 비트스트림에 의하여 지시된 동기된 형식으로 상기 디코딩된 오디오 스트림 및 상기 디코딩된 비디오 요약 스트림을 재생하는 단계를 포함하는, 비트스트림 디코딩 방법.
  16. 비트스트림을 디코딩하는 디바이스로서, 상기 비트스트림은 오디오 스트림과 입력 비디오 신호의 키-프레임들로부터 생성된 콘텐트 비디오 요약 스트림을 운반하고, 상기 오디오 스트림은 상기 비디오 요약 스트림과 동기되는, 상기 비트스트림 디코딩 디바이스에 있어서,
    상기 오디오 스트림을 디코딩하는 수단;
    상기 비디오 요약 스트림을 디코딩하는 수단; 및
    상기 비트스트림에 의하여 지시된 동기된 형식으로 상기 디코딩된 오디오 스트림 및 상기 디코딩된 비디오 요약 스트림을 재생하는 수단을 포함하는, 비트스트림 디코딩 디바이스.
KR1020057023456A 2003-06-06 2004-05-27 비디오 압축 KR20060036922A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03101665 2003-06-06
EP03101665.2 2003-06-06

Publications (1)

Publication Number Publication Date
KR20060036922A true KR20060036922A (ko) 2006-05-02

Family

ID=33495633

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057023456A KR20060036922A (ko) 2003-06-06 2004-05-27 비디오 압축

Country Status (4)

Country Link
US (1) US20060209947A1 (ko)
JP (1) JP2006527518A (ko)
KR (1) KR20060036922A (ko)
WO (1) WO2004110069A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100776415B1 (ko) * 2006-07-18 2007-11-16 삼성전자주식회사 동영상 재생 방법 및 그 시스템
CN108171763A (zh) * 2018-01-15 2018-06-15 珠海市杰理科技股份有限公司 解码系数的存取方法和系统、jpeg解码系数的存取方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070058614A1 (en) * 2004-06-30 2007-03-15 Plotky Jon S Bandwidth utilization for video mail
US7826536B2 (en) * 2005-12-29 2010-11-02 Nokia Corporation Tune in time reduction
EP1827009A1 (en) * 2006-02-28 2007-08-29 Matsushita Electric Industrial Co., Ltd. Video encoder and decoder for an improved zapping service for mobile video reception
JP4994698B2 (ja) * 2006-04-13 2012-08-08 キヤノン株式会社 情報伝送装置及び情報伝送方法
US20100231582A1 (en) * 2009-03-10 2010-09-16 Yogurt Bilgi Teknolojileri A.S. Method and system for distributing animation sequences of 3d objects
CN102196303B (zh) * 2010-03-02 2014-03-19 中兴通讯股份有限公司 一种媒体同步的方法和系统
JP5853142B2 (ja) * 2011-01-24 2016-02-09 パナソニックIpマネジメント株式会社 動画伝送システム
ITVI20120104A1 (it) * 2012-05-03 2013-11-04 St Microelectronics Srl Metodo e apparato per generare in tempo reale uno storyboard visuale
CN104780422B (zh) * 2014-01-13 2018-02-16 北京兆维电子(集团)有限责任公司 流媒体播放方法及流媒体播放器
CN107517400B (zh) * 2016-06-15 2020-03-24 成都鼎桥通信技术有限公司 流媒体播放方法及流媒体播放器
CN108632557B (zh) * 2017-03-20 2021-06-08 中兴通讯股份有限公司 一种音视频同步的方法及终端
CN113747235B (zh) * 2021-10-09 2023-09-19 咪咕文化科技有限公司 一种视频处理方法、装置及设备
CN116800976B (zh) * 2023-07-17 2024-03-12 武汉星巡智能科技有限公司 伴睡婴幼儿时音视频压缩和还原方法、装置及设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6496228B1 (en) * 1997-06-02 2002-12-17 Koninklijke Philips Electronics N.V. Significant scene detection and frame filtering for a visual indexing system using dynamic thresholds
EP1201088B1 (en) * 1999-07-30 2005-11-16 Indinell Sociedad Anonima Method and apparatus for processing digital images and audio data
US6493386B1 (en) * 2000-02-02 2002-12-10 Mitsubishi Electric Research Laboratories, Inc. Object based bitstream transcoder
US7463683B2 (en) * 2000-10-11 2008-12-09 Koninklijke Philips Electronics N.V. Method and apparatus for decoding spatially scaled fine granular encoded video signals

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100776415B1 (ko) * 2006-07-18 2007-11-16 삼성전자주식회사 동영상 재생 방법 및 그 시스템
CN108171763A (zh) * 2018-01-15 2018-06-15 珠海市杰理科技股份有限公司 解码系数的存取方法和系统、jpeg解码系数的存取方法
CN108171763B (zh) * 2018-01-15 2021-08-13 珠海市杰理科技股份有限公司 解码系数的存取方法和系统、jpeg解码系数的存取方法

Also Published As

Publication number Publication date
US20060209947A1 (en) 2006-09-21
JP2006527518A (ja) 2006-11-30
WO2004110069A1 (en) 2004-12-16

Similar Documents

Publication Publication Date Title
CN101232618B (zh) 用于在视频编码系统中指示量化器参数的方法与设备
US7519228B2 (en) Method and apparatus for encrypting and compressing multimedia data
AU2007319699B2 (en) Techniques for variable resolution encoding and decoding of digital video
US6400768B1 (en) Picture encoding apparatus, picture encoding method, picture decoding apparatus, picture decoding method and presentation medium
KR100417932B1 (ko) 영상 인코더, 영상 부호화 방법, 영상 디코더 및 영상 복호화 방법
EP2384002B1 (en) Moving picture decoding method using additional quantization matrices
US7839930B2 (en) Signaling valid entry points in a video stream
CN101889447A (zh) 扩展avc标准以与视频串行地对高分辨率数字静止画面编码
KR20060036922A (ko) 비디오 압축
KR20110063004A (ko) 키 프레임 추출 장치 및 방법과 이를 이용한 방송 녹화 장치 및 방법
US6847684B1 (en) Zero-block encoding
JP2004241869A (ja) 透かし埋め込み及び画像圧縮部
CN111182310A (zh) 视频处理方法、装置、计算机可读介质及电子设备
JP4086966B2 (ja) 映像信号符号化装置
JP3623056B2 (ja) 動画像圧縮装置
US20030128757A1 (en) Video coding method and corresponding transmittable video signal
EP0927954B1 (en) Image signal compression coding method and apparatus
KR20190067577A (ko) 데이터 인코딩 및 디코딩 장치와 방법
MEMORY Si MACROBLOCKS Q
JP3380981B2 (ja) 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体
JP2003179826A (ja) 画像再生表示装置
Burg Image and video compression: the principles behind the technology
KR100242832B1 (ko) 양자화 스텝값 발생장치
Шевяков et al. The video processing features research in computer systems and special purpose networks
Sheviakov et al. The video processing features research in computer systems and special purpose networks

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid