KR20060036922A - 비디오 압축 - Google Patents
비디오 압축 Download PDFInfo
- Publication number
- KR20060036922A KR20060036922A KR1020057023456A KR20057023456A KR20060036922A KR 20060036922 A KR20060036922 A KR 20060036922A KR 1020057023456 A KR1020057023456 A KR 1020057023456A KR 20057023456 A KR20057023456 A KR 20057023456A KR 20060036922 A KR20060036922 A KR 20060036922A
- Authority
- KR
- South Korea
- Prior art keywords
- stream
- video
- audio
- information
- decoding
- Prior art date
Links
- 230000006835 compression Effects 0.000 title claims description 16
- 238000007906 compression Methods 0.000 title claims description 16
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000001360 synchronised effect Effects 0.000 claims abstract description 17
- 230000005236 sound signal Effects 0.000 claims abstract description 15
- 230000005540 biological transmission Effects 0.000 claims abstract description 14
- 238000004891 communication Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 7
- 230000002452 interceptive effect Effects 0.000 claims description 5
- 238000013139 quantization Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8549—Creating video summaries, e.g. movie trailer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234327—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234381—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2368—Multiplexing of audio and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/242—Synchronization processes, e.g. processing of PCR [Program Clock References]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25808—Management of client data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/414—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
- H04N21/41407—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4341—Demultiplexing of audio and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/24—Systems for the transmission of television signals using pulse code modulation
- H04N7/52—Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Graphics (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 비디오 데이터의 스트림으로부터 비디오 프레임들의 스토리-보드를 생성하는 방법 및 장치에 관한 것이며, 여기서는 스토리-보드의 비디오 프레임들만이 휴대용 전자 디바이스들에 전송된다. 콘텐트 제어 요약은 입력 비디오 데이터로부터 생성된다. 그 다음에, 콘텐트 제어 요약은 연속 오디오 신호와 동기된다. 요약은 전송을 위해 연속 오디오와 함께 인코딩된다.
비트스트림, 콘텐트 제어 요약, 스토리-보드, 비디오 프레임
Description
본 발명은 비디오 압축 및 전송, 특히 모바일 데이터 서비스들을 위한 비디오 압축에 관한 것이다.
셀룰라 전화들 및 다른 휴대용 전자 디바이스들은 요즘 단순한 통신 이상으로 사용된다. 예컨대, 많은 새로운 셀룰라 전화들 및 다른 휴대용 전자 디바이스들은 지금 비디오 이미지들을 디스플레이할 수 있는 스크린을 갖추고 있다. 결과로서, 뉴스, 스포츠 등과 같은 비디오 이미지들은 이들 휴대용 디바이스들에 방송될 수 있다. 그러나, 비디오 이미지들에 고유한 많은 양의 데이터는 모바일 전화들 및 다른 휴대용 디바이스들에 전체-움직임 비디오 신호들을 전송하여 디스플레이할 때 중요한 문제점들을 생성한다. 특히, 각각의 이미지 프레임은 특정 시스템의 디스플레이 해상도에 따라 화소들의 어레이로 형성된 정지 이미지이다. 결과로서, 고해상도 비디오 시퀀스들에 포함된 생정보(raw information)의 양은 대용량이다. 전송되어야 하는 데이터량을 감소시키기 위하여, 압축 기법들은 데이터를 압축하기 위하여 사용된다. MPEG-2, MPEG-4, 및 H.264를 포함하는 다양한 비디오 압축 표준들 또는 프로세스들이 구축되었다. 그러나, 이들 압축 기법들은 단독으로 휴대용 전자 디바이스들 상으로 쉽게 전송하고 디스플레이하기 위한 수용 가능한 레벨로 데이터량을 감소시키지 못할 수 있다.
본 발명은 비디오 데이터의 스트림으로부터 비디오 프레임들의 스토리 보드를 생성하기 위한 방법 및 장치들을 공개하고, 여기서는 스토리-보드의 비디오 프레임들만이 휴대용 전자 디바이스들에 전송된다.
본 발명의 일 실시예에 따르면, 전송을 위해 비디오 신호들을 압축하기 위한 방법 및 장치들이 공개되었다. 콘텐트 제어 요약은 입력 비디오 데이터로부터 발생된다. 그 다음에, 콘텐트 제어 요약은 연속 오디오 신호와 동기된다. 요약은 전송을 위해 연속 오디오와 함께 인코딩된다.
본 발명의 다른 실시예에 따르면, 사용자에 의하여 요청된 정보를 제공하기 위한 통신 시스템 및 방법이 기술된다. 정보 요청이 사용자로부터 수신될 때, 요청된 비디오 정보를 위하여 데이터베이스는 탐색되고, 데이터베이스로부터 추출된다. 그 다음에, 추출된 정보의 콘텐트 제어 요약이 발생된다. 콘텐트 제어 요약은 연속 오디오 신호와 동기된다. 요약은 전송을 위해 연속 오디오와 함께 인코딩된다.
본 발명의 이들 및 다른 특징들은 이후에 기술된 실시예들을 참조하여 명백해질 것이다.
본 발명은 첨부 도면들을 참조하여 예로서 지금 기술될 것이다.
도 1은 본 발명의 일 실시예에 따른 통신 시스템의 블럭도.
도 2는 본 발명의 일 실시예에 따라 비쥬얼 인덱스를 생성할 때 사용되는 디바이스의 블럭도.
도 3은 본 발명의 일 실시예에 따라 비쥬얼 인덱스를 생성할 때 사용되는 디바이스의 블럭도.
도 4는 본 발명의 일 실시예에 따른 키-프레임 추출을 기술한 도면.
도 5는 본 발명의 다른 실시예에 따른 오디오/비디오 동기화를 기술한 도면.
도 6은 본 발명의 다른 실시예에 따른 키-프레임 인코더의 블럭도.
도 7은 본 발명의 다른 실시예에 따른 키-프레임 디코더의 블럭도.
도 8은 본 발명의 다른 실시예에 따른 임시 계층 인코더의 블럭도.
도 9는 본 발명의 다른 실시예에 따른 공간 계층 디코더의 블럭도.
도 10은 본 발명의 다른 실시예에 따른 대화형 통신 시스템의 블럭도.
도 1은 본 발명의 실시예에 따라 모바일 데이터 서비스들에 스토리-보드(story-board) 기반 비디오 압축을 제공하기 위한 통신 시스템(100)을 도시한다. 통신 시스템(100)은 입력 비디오 신호(104)를 수신하고 비디오 신호(104)에서 유효 장면들(significant scenes)의 스토리-보드를 생성하는 콘텐트 제어 요약 추출 디바이스(102)를 갖는다. 사용자의 휴대용 전자 디바이스에는 전체 비디오 스트림을 전송하기보다 단지 이들 유효 비디오 장면들만이 전송될 것이다. 요약/오디오 동기 디바이스(106)는 비디오 입력(104)을 수반하는 대응하는 연속 오디오 신호와 함께 콘텐트 제어 요약 추출 디바이스(102)에 의하여 생성된 요약 스토리-보드 비디 오 프레임들을 동기시키기 위하여 사용된다. 그 다음에, 스토리-보드 신호 및 오디오 신호는 압축유닛(108)에서 결합된다. 그 다음에, 압축된 신호는 수신된 신호를 압축해제하고 원래의 비디오 스트림으로부터의 전체 오디오 스트림이 재생되는 동안 선택된 비디오 장면들을 디스플레이하는 수신기 유닛(110)에 전송된다. 통신 시스템(100)의 각각의 컴포넌트들은 이하에서 더 상세히 지금 기술될 것이다.
본 발명에 따르면, 비디오 스트림(104)은 요약 추출 디바이스(102)에 의하여 스토리-보드 요약으로 된다. 본 발명은 비디오 입력으로부터 스토리-보드를 생성하기 위하여 데이터 검색 시스템들에서 사용되는 임의의 알려진 유효 장면 검출 방법 및 장치를 사용할 수 있다. 예컨대, 드미트로바(Dimitrova) 등에 의한 미국특허번호 제6,137,544호에 개시된 유효장면 검출 및 프레임 필터링 시스템은 도 2 및 도 3을 참조로하여 지금 간단하게 기술될 것이나, 본 발명은 이에 제한되지 않는다.
비디오는 아날로그(연속 데이터) 또는 디지털(불연속 데이터) 형식으로 존재한다. 본 예는 디지털 영역에서 동작하며 이에 따라 처리를 위한 디지털 형식을 사용한다. 따라서, 소스 비디오 또는 비디오 신호는 이미지들의 디스플레이된 시퀀스가 연속 화상 스트림으로서 보이도록 충분히 높은 레이트로 일련의 개별 이미지들 또는 비디오 프레임들이다. 이들 비디오 프레임들은 MPEG, MPEG2, MPEG4, 움직임 JPEG 등과 같은 형식으로 비압축 또는 압축 데이터일 수 있다.
비압축 비디오의 정보는 우선 인텔 스마트 비디오 레코더 III에서 제시되는 기술과 같은 프레임 그래빙 기술(frame grabbing technique)을 사용하여 미디어 프 로세서(202)에서 프레임들로 분할된다. 프레임들은 호스트 프로세서(210)에서 예컨대 8x8 화소들의 블럭들로 각각 분할된다. 이들 블럭들 및 인기있는 방송 표준, 즉 CCIR-601을 사용하면, 매트로블럭 생성기(206)는 휘도 블럭들을 생성하고, 색 정보를 평균하여 크로미넌스 블럭들(chrominance blocks)을 생성한다. 휘도 및 크로미넌스 블럭은 매크로블럭을 형성한다.
비디오 신호는 또한 움직임 JPEG 및 MPEG와 같은 압축 표준을 사용하여 압축된 이미지를 나타낼 수 있다. 만일 신호가 MPEG 또는 다른 압축된 신호이면, MPEG 신호는 프레임 파서(frame parser: 205)에 의하여 프레임 또는 비트스트림 파싱 기술을 사용하여 프레임들로 분할된다. 그 다음에, 프레임들은 미디어 프로세서(203)에서 엔트로피 디코더(214) 및 테이블 지정자(table specifier: 216)에 전송된다. 엔트로피 디코더(214)는 테이블 지정자(216)로부터의 데이터, 예컨대 허프만 디코딩(Huffman decording) 또는 다른 디코딩 기술을 사용하여 MPEG 신호를 디코딩한다.
다음에, 디코딩된 신호는 역양자화기(218)에 공급되어 테이블 지정자(216)로부터의 데이터를 사용하여 디코딩된 신호를 역양자화된다. 비록 미디어 프로세서(203)에서 일어나는 것으로 도시될지라도, 이들 단계들은 비디오 프로세서(203), 호스트 프로세서(211) 또는 다른 외부 디바이스에서 일어날 수 있다. 선택적으로, 시스템이 상이한 처리 단계들에서 액세스를 허용하는 인코딩 능력을 가지면, DCT 계수들은 호스트 프로세서에 직접 전달될 수 있다. 이들 모든 접근법들에서는 실시간으로 처리가 수행될 수 있다.
자동 유효 장면 검출을 위하여, 본 예는 언제 비디오의 장면이 변경되거나 또는 정적 장면이 일어나는 지를 검출하기를 시도한다. 장면은 관련 이미지들 이상을 나타낼 수 있다. 유효 장면 검출에서, 2개의 연속 프레임들의 적어도 하나의 특성은 유효 장면 프로세서(230)에 의하여 비교되며, 프레임들의 선택된 특성들이 주어진 제 1임계값 이상이면, 선택된 특성들은 매우 다른 것으로 식별되며, 장면 변화는 2개의 프레임들 사이에서 일어나도록 결정되며; 선택된 특성들이 주어진 제 2임계값보다 작으면, 선택된 특성들은 매우 동일하도록 결정되며, 정적 장면이 일어나는 지를 결정하기 위하여 처리가 수행된다. 유효 장면 변화가 일어날 때, 프레임은 키-프레임으로서 저장된다. 유효 장면 검출 처리 동안, 프레임이 키-프레임으로서 프레임 메모리(234)에 저장되면, 연관된 프레임 넘버는 예컨대 상대 발생시간을 지시하는 시간 코드 또는 시간 스탬프로 변환된다.
키-프레임 필터링 방법은 반복 프레임들 및 다른 선택된 타입들의 프레임들을 필터링함으로써 프레임 메모리에 저장된 키-프레임들의 수를 감소시키기 위하여 사용될 수 있다. 키-프레임 필터링은 유효 장면 검출이 발생된 후에 호스트 프로세서(210)에서 키-프레임 필터(240)에 의하여 수행된다. 그 다음에, 키-프레임 필터링에서 살아남은 프레임들은 비디오 입력(104)의 스토리-보드 요약을 생성하기 위하여 사용될 수 있다. 키-프레임 추출에 대한 설명은 도 4에 기술된다. 입력 비디오 신호(401)는 첨부 오디오 신호(403)가 변경되지 않는 동안 스토리-보드 요약을 생성하는 키-프레임들의 비디오 이미지들만을 포함하는 실질적으로 감소된 비디오 신호(405)로 변환된다.
통신채널의 이용가능한 대역폭(또는 비트율)을 최적으로 사용하기 위하여, 단위 시간당 키-프레임들의 수는 너무 많이 변화하지 않아야 한다. 이 때문에, 본 발명의 유리한 구현에서, 연속 프레임들이 유효하게 다르거나 또는 유사한지의 여부를 결정하는 앞서 언급된 제 1 및 제 2 임계치들은 유효 장면 프로세서(230)의 비트율 제어 루프에 의하여 제어된다. 출력-버퍼의 상태에 따르면, 잠재적인 키-프레임들의 수는 버퍼가 절반 이상인 경우에 임계치들을 수정함으로써 감소될 수 있거나, 또는 잠재적인 키-프레임의 수는 버퍼가 절반 이하인 경우에 반대방향으로 임계치들을 수정함으로써 증가될 수 있다. 이러한 목표를 달성하기 위한 대안 또는 추가 수단은 버퍼-상태 신호에 의하여 앞서 언급된 키-프레임 필터링 수단을 수정하는 데 있어서 존재한다.
일단 스토리-보드 요약이 생성되면, 스토리-보드 요약 및 오디오 신호는 동기될 필요가 있다. 동기에 관한 설명은 도 5에 기술된다.
비디오 입력(401) 및 오디오 입력(403)이 동기된다고 가정하면, 동기화기(106)는 스토리-보드 요약 생성 후에 비디오 및 오디오를 유지하기 위하여 필요로 된다. 이는 예컨대 스토리-보드 프레임들 및 오디오에 시간-코드를 포함함으로써 행해질 수 있다. 이러한 방식에서, 버퍼에 다중 스토리-보드 프레임들을 배치하고 디코더측에서 정확하게 동기된 시간에 적정 프레임을 나타내는 것이 가능하다.
앞서 언급된 바와 같이, 일단 스토리-보드 요약이 생성되고 오디오/비디오가 동기되었으면, 정보는 전송을 위하여 압축될 필요가 있다. 다양한 압축방법들 및 인코더들은 본 발명에서 사용될 수 있으며, 본 발명은 특정 방법에 제한되지 않는 다. 요약-보드 및 첨부 오디오의 압축 및 인코딩을 위하여 사용될 수 있는 하나의 가능한 인코더의 예로서, 전형적인 인코더(600)는 도 6을 참조로하여 지금 기술될 것이다.
도시된 인코딩 시스템(600)은 키 프레임들의 압축을 성취한다. 각각의 프레임에 대한 압축 설명은 독립적이거나(인트라-프레임 인코딩됨) 또는 하나 이상의 이전에 인코딩된 키 프레임들과 관련할 수 있다(인터-프레임 인코딩됨). 본 발명의 일 실시예에 따른 인트라 프레임 인코딩 시스템은 양자화된 값들을 무손실 인코딩하기 위한 가변길이 인코딩 유닛(630)에 접속되는 양자화 유닛(620)에 접속되는 영역 화소-역상관 유닛(regional pixel-decorrelation unit: 610)에 기초한다.
영역 화소 역상관 유닛은 차동 펄스 코드 변조(DPCM: differential pulse code modulation)에 기초하거나 또는 블럭방식 선형 변환, 예컨대 각각의 블럭 휘도 또는 크로미넌스 화소들에 대한 이산코사인변환(DCT)의 형태에 기초할 수 있다. 본 발명의 일 실시예에서, 비중첩 8x8 블럭들은 획득 유닛(611)에 의하여 미리 결정된 순서로 획득된다. DCT 함수는 8x8 화소 평균을 나타내는 하나의 DC 계수 및 8x8 화소들의 블럭에서 저주파수 또는 고주파수 코사인 패턴들의 존재를 나타내는 63 AC 계수들을 생성하기 위하여 변환 유닛(612)에 의하여 표현된 8x8 화소들의 각 블럭에 적용된다. 후속으로, DPCM은 DPCM 인코더 유닛(613)에 의하여 DC 변환 계수들의 시리즈에 적용된다.
양자화 유닛(620)은 스칼라 양자화 또는 벡터 양자화를 수행할 수 있다. 스칼라 양자화는 역상관 유닛(610)에 의하여 생성된 각각의 원래의 값(여기서, 'AC 변환 계수(AC transform coefficient)')의 근사치를 나타내는 코드(또는 '표현레벨(representation level)')를 발생시킨다. 벡터 양자화기는 역상관 유닛(610)에 의하여 발생되는 원래의 값들의 그룹(예컨대 '블럭(block)')의 근사치를 나타내는 코드를 발생시킨다. 인코더의 일 실시예에서, 스칼라 양자화는 각각의 표현 레벨이 각각의 AC 변환 계수의 근사화 유닛(621)에서의 정수 분할에 따르도록 적용된다. 각 정수 분할의 분모는 일반적으로 63 AC 계수들의 각각에 대하여 다르다. 미리 결정된 분모들은 '양자화 매트릭스(quantization matrix)'(622)로서 표현된다.
가변-길이 인코딩 유닛(630)은 일반적으로 허프만-인코딩, 산술 코딩 또는 이들의 결합에 기초할 수 있다. 인코더의 일 실시예에서, 일련의 표현 레벨들은 미리 결정된 순서로(DC 계수 위치로부터 시작하여 '지그-재그(zig-zag)'로) 값들을 주사하는 주사 유닛(631)에 의하여 주사함으로써 생성된다. 일련의 표현 레벨들은 일련의 비제로(non-zero) 값들의 끝을 식별하는 코드('블럭의 끝(end of block)')와 함께 동일한 값을 가진 다음 반복의 수와 표현레벨의 값에 대한 고유 코드를 발생시키는 런-길이(run-length) 인코딩 유닛(632)에 전송된다. 이들 코드들의 2진 심볼들에 대한 수는 압축 설명 양자화 비디오 신호가 획득되도록 한다. 결합 유닛(633)은 비디오 신호의 휘도 및 크로미넌스 성분들, 각 블럭에 대한 DC 계수들, 및 블럭당 AC 계수들을 나타내는 2진 심볼들의 스트림들을 결합한다. 색 성분당, 8x8 블럭당 및 프레임당 다중화 순서는 인식가능한 대부분의 관련 데이터가 우선 전송되도록 한다. 결합 유닛에 의하여 발생되는 다중화된 비트-스트림은 원래의 비디오 신호의 압축 표현을 형성한다.
본 발명의 일 실시예에 따른 키프레임 디코더는 도 7을 참조로하여 지금 기술될 것이다. 디코더는 가변-길이 디코더(710), 역양자화 유닛(720), 및 반전 역상관 유닛(inverse decorrelation unit: 730)을 포함한다. 가변-길이 디코더(710)는 색 성분들, 8x8 블럭들 및 계수들과 연관된 데이터를 획득하기 위하여 역다중화 프로세스를 수행하는 분리 유닛(711)을 포함한다. 런-길이 디코딩 유닛(712)은 8x8 화소당 AC 계수들의 표현 레벨들을 복원한다.
역양자화 유닛(720)은 복원 유닛(722)을 사용하여 표현 레벨로부터 원래의 계수 값의 근사치를 복원하기 위하여 미리 결정된 양자화 매트릭스(721)를 사용한다.
반전 역상관 유닛(730)은 역상관 유닛(610)의 역동작이며, 동일한 입력 비디오 신호 또는 최상의 가능한 근사치를 야기한다. 디코더의 일 실시예에서, DCT 유닛(612)으로부터 DCT 함수와 매칭되는 역 DCT 함수(731) 뿐만 아니라 DPCM 인코더 유닛(613)과 매칭되는 DPCM 디코더(732)가 적용된다. 분배 유닛(733)은 획득 유닛(611)에 의하여 획득되는 것과 동일한 미리 결정된 순서대로 적절한 위치에 휘도 및 크로미넌스 화소값들의 디코딩된 8x8 블럭들을 배치시킨다.
예로서, 임시 계층 인코더(800)는 도 8 및 도 2를 참조로하여 지금 기술될 것이다. 표현된 인코딩 시스템(800)은 임시 계층 압축을 수행하며, 이에 따라 채널의 일부분은 단지 키프레임을 제공하기 위하여 사용되며 채널의 다른 부분은 손실 상보 프레임들을 전송하기 위하여 사용되며, 그 결과 결합된 신호들은 원래의 프레임 속도에서 비디오 신호를 형성한다. 유효-장면 검출기(230, 801)는 원래의 비디오를 처리하며 키프레임을 식별하는 신호를 발생시킨다. 임의의 표준 인코더(MPEG-1, MPEG-2, MPEG-4 ASP, H.261, H.262, MPEG-4 AVC a.k.a. H.264)일 수 있는 정상 MPEG 인코더(802)는 검출기(801)로부터의 키프레임 식별 신호로 하여금 인코더가 P-또는 B-프레임이 아니라 I-프레임으로서 적절한 프레임을 처리하도록 하는 특징과 함께 원래의 신호를 수신하여 MPEG-추정 형식으로 인코딩한다. 단지 국제 P-프레임이 I-프레임으로 대체된다는 것을 적절한 프레임으로 지정한다. B-프레임들의 교체는 이미 인코딩된 선행 B-프레임들의 재계산을 필요로 한다. MPEG 인코더는 비록 경우에 따라 규칙적 GOP-구조를 가질지라도 모든 I-, P- 및 B-프레임들을 가진 MPEG-추정 비트스트림을 발생할 수 있다.
키프레임 필터(803)는 MPEG-비트스트림 및 키프레임 식별신호를 수신하고 기본 스트림 및 인헨스먼트 스트림을 발생시킨다. 기본 스트림은 인트라-인코딩된 키프레임들로 구성된다. 이는 시간-샘플링된 I-프레임들을 가진 MPEG-추종 스트림이다. 인헨스먼트 스트림은 인트라-뿐만아니라 인터-인코딩된 프레임들을 가진 MPEG-추종 스트림이다. 이는 '키프레임(keyframe)'으로 식별된 I-프레임들이 손실한 특징과 함께 시간-스탬핑된 I-, P- 및 B-프레임들을 가진 MPEG-추종 스트림이다. 키프레임을 전송하기 위한 결정은 키프레임 식별신호 뿐만 아니라 현재의 MPEG-프레임의 예측 타입에 기초한다. 전류 프레임이 B-프레임인 경우에, 다음 I-또는 P-프레임은 기본 스트림으로 전송된다. 키프레임 식별 인스턴스 및 키프레임 전송 인스턴스간의 지연시간은 일반적으로 작으며 불량한 장면의 프레임이 전송되지 않도록 한다.
기본 디코더는 시간 스탬핑된 키프레임들을 가진 MPEG-추종 기본 스트림을 수신하고, 프레임들을 디코딩하며, 적절한 인스턴스에 프레임들을 디스플레이한다. 계층 디코더는 도 9에 기술된 바와 같이 기본 및 인헨스먼트 스트림을 결합하는 결합 유닛을 가진다. 기본 스트림(901)은 인코딩된 기본 스트림을 디코딩하는 기본 디코더(902)에 제공된다. 디코딩된 기본 스트림은 상향 변환기(904)에 의하여 상향 변환되어 가산 유닛(906)에 제공된다. 인헨스먼트 스트림(903)은 디코더(908)에 의하여 디코딩된다. 그 다음에, 디코딩된 인헨스먼트 스트림은 디스플레이를 위한 최종 비디오 신호를 생성하기 위하여 가산유닛(906)에 의하여 상향 변환된 기본 스트림에 가산된다. 이는 정상 MPEG-디코더가 원래 의도된 프레임 속도로 디코딩된 비디오 신호를 획득하는데 충분하도록 모든 프레임들을 가진 MPEG-추종 비디오 스트림을 발생시킨다.
이러한 응용을 위하여, 전송된 키-프레임들은 전형적으로 시간에 대하여 등거리로 배치되지 않는다. 신호에는 오디오 및 키-프레임의 시간 인스턴스에 시맨틱 결합이 존재한다. 이용가능한 채널 대역폭에서 최적의 장점을 취하기 위하여, 키-프레임들은 디스플레이될 필요가 있기 전에 양호하게 전송될 수 있다. 이는 수신 당사자에게 정보를 제공할 때 오디오 및 키-프레임간의 시맨틱 결합을 복원하는데 중요하다. 메시지의 시맨틱은 통신채널을 통해 보존된다. 이를 수행하기 위하여, 시간 스탬프는 데이터 스트림의 인코딩 동안 키-프레임에 부착된다. 디코딩 동안 시간 스탬프는 키-프레임이 어느 시점에 디스플레이되어야 하는지(따라서, 이전에 디스플레이된 키-프레임을 어느 시점에 대체해야하는 지를)를 결정하기 위하 여 사용된다. 결과로서, 키-프레임들은 시간 스탬프에 의하여 오디오에 동기된다.
본 발명의 일 실시예에 따르면, 본 발명은 사용자들이 휴대용 전자 디바이스들을 통해 수신하고 싶어하는 정보의 타입을 사용자들이 지정할 수 있는 대화형 통신 시스템에서 사용될 수 있다. 대화형 통신 시스템(1000)의 예시적인 예가 도 10에 기술된다. 사용자는 시스템이 임의의 수의 다른 화제들에 대한 사용자 정보를 전송할 것을 요청하는 시스템(1000)에 휴대용 전자 디바이스(1002)를 사용하여 음성, SMS 등을 통해 메시지를 전송한다. 이러한 예에서, 사용자는 시스템(1000)에 "이스라엘 뉴스(news about Israel)"에 대한 요청을 전송한다. 이 요청은 수신기(1004)에 의하여 수신되며, 그 다음에 요청은 컴퓨터(1006)에 전송된다. 컴퓨터(1006)는 요청을 디코딩하며, 요청된 정보의 타입을 결정한다. 그 다음에, 컴퓨터(1006)는 요청과 관련된 비디오 정보에 대하여 데이터베이스(1008)를 탐색한다. 데이터베이스(1008)가 시스템(100) 내에 있거나 또는 시스템(1000)으로부터 분리되며 컴퓨터(1006)가 하나 이상의 컴퓨팅 엘리먼트들을 포함할 수 있다는 것이 이해되어야 한다. 요청과 관련한 데이터베이스내의 정보는 콘텐트 제어 요약 추출 디바이스(1010)에 전송된다. 콘텐트 제어된 요약 추출 디바이스(102)는 데이터베이스로부터 비디오 정보를 수신하고 비디오 정보에서 유효 장면의 스토리-보드를 생성한다. 요약/오디오 동기 디바이스(1012)는 데이터베이스로부터 비디오 정보를 수반하는 대응 연속 오디오 신호와 콘텐트 제어 요약 추출 디바이스(1010)에 의하여 생성된 요약 스토리-보드를 동기시키기 위하여 사용된다. 그 다음에, 스토리-보드 신호 및 오디오 신호는 압축 유닛(1014)에서 결합된다. 압축된 신호들은 송 신기(1016)에 의하여 전송되고 사용자의 휴대용 전자 디바이스(1002)에 의하여 수신된다. 그 다음에, 압축된 신호는 디코딩된후 휴대용 전자 디바이스(1002)상에 디스플레이된다.
당업자는 앞서 기술된 실시예들을 구현하기 위하여 사용되는 프로그램 단계들 및 연관된 데이터가 본 발명으로부터 벗어나지 않고 디스크 저장 장치뿐만 아니라 판독전용 메모리(ROM) 디바이스들, 랜덤 액세스 메모리(RAM) 디바이스들, 광학 저장 엘리먼트들, 자기 저장 엘리먼트들, 자기-광학 저장 엘리먼트들, 플래시 메모리, 코어 메모리 및/또는 다른 등가의 저장 기술들을 포함하는 다른 형태의 저장 장치들(그러나, 이에 제한되지 않음)을 사용하여 실행될 수 있다는 것을 인식해야 한다. 이러한 대안 저장 디바이스들은 균등물들로서 고려되어야 한다.
본 발명의 다른 실시예들이 일부 단계들의 타이밍이 본 발명의 전체 동작에 영향을 미치지 않고 상호교환될 수 있기 때문에 앞서 기술된 단계들의 정확한 순서에 제한되지 않는다는 것이 이해될 것이다. 게다가, 단수는 다수를 배제하지 않는다.
앞서 언급된 실시예들은 본 발명을 제한하는 것이 아니라 예시적이며 당업자가 첨부된 청구항들의 범위를 벗어나지 않고 많은 대안 실시예들을 설계할 수 있다는 것이 이해되어야 한다. 청구항들에서, 괄호 내에 삽입된 일부 참조부호들은 청구항들을 제한하는 것으로 고려되어서는 안 된다. 용어 "포함한다(comprising)"는 청구항에서 리스트된 것과 다른 엘리먼트들 또는 단계들의 존재를 배제하지 않는다. 본 발명은 여러 개별 엘리먼트들을 포함하는 하드웨어에 의하여 그리고 적절 하게 프로그래밍된 컴퓨터에 의하여 구현될 수 있다. 디바이스 청구항에서, 열거된 수단들중 여러 수단들은 하나 또는 동일한 하드웨어 항목으로 구현될 수 있다. 임의의 측정치들이 서로 다른 종속항들에서 인용되는 단순한 사실은 이들 측정치들의 결합이 장점으로 사용될 수 없다는 것을 지시하지 않는다.
Claims (16)
- 전송을 위해 비디오 신호들을 압축하기 위한 장치에 있어서,입력 비디오 데이터로부터 콘텐트 제어 요약(content controlled summary)을 생성하는 수단(102);상기 콘텐트 제어 요약을 연속 오디오 신호와 동기시키는 수단(106); 및전송을 위해 상기 연속 오디오와 함께 상기 요약을 인코딩하는 수단(108)을 포함하는, 비디오 신호 압축 장치.
- 제 1항에 있어서, 상기 인코딩된 신호를 전송하는 수단(1016)을 더 포함하는, 비디오 신호 압축 장치.
- 제 1항에 있어서, 상기 콘텐트 제어 요약은 키-프레임 검출을 사용하여 생성되는, 비디오 신호 압축 장치.
- 제 1항에 있어서, 상기 콘텐트 제어 요약 수단은 비트율 제어 루프에 의해 제어되는, 비디오 신호 압축 장치.
- 제 1항에 있어서, 상기 콘텐트 제어 요약 및 상기 연속 오디오 신호는 실질적으로 일정한 비트율 프레임으로 압축되는, 비디오 신호 압축 장치.
- 제 1항에 있어서, 적절한 디코딩을 보장하기 위하여 상기 동기된 신호에 시간-스탬프들이 삽입되는, 비디오 신호 압축 장치.
- 전송을 위해 비디오 신호들을 압축하기 위한 방법에 있어서,입력 비디오 데이터로부터 콘텐트 제어 요약을 생성하는 단계;상기 콘텐트 제어 요약을 연속 오디오 신호와 동기시키는 단계; 및전송을 위해 상기 연속 오디오와 함께 상기 요약을 인코딩하는 단계를 포함하는, 비디오 신호 압축 방법.
- 컴퓨터가 제 7항의 방법을 수행하게 하는 명령들이 저장된 컴퓨터 저장매체.
- 사용자에 의하여 요청된 정보를 공급하는 대화형 통신 시스템(interactive communication system)으로서,상기 사용자로부터 정보 요청을 수신하는 수단(1004);상기 요청된 정보에 대하여 데이터베이스를 탐색하고 상기 데이터베이스로부터 상기 요청된 정보를 추출하는 수단(806);상기 추출된 정보의 콘텐트 제어 요약을 생성하는 수단(1010);상기 콘텐트 제어 요약과 연속 오디오 신호를 동기시키는 수단(1012); 및전송을 위해 상기 연속 오디오와 함께 상기 요약을 인코딩하는 수단(1014)을 포함하는, 대화형 통신 시스템.
- 대화형 통신 시스템에서 사용자에 의하여 요청된 정보를 제공하는 방법에 있어서,상기 사용자로부터 정보 요청을 수신하는 단계;상기 요청된 정보에 대하여 데이터베이스를 탐색하고 상기 데이터베이스로부터 상기 요청된 정보를 추출하는 단계;상기 추출된 정보의 콘텐트 제어 요약을 생성하는 단계;상기 콘텐트 제어 요약과 연속 오디오 신호를 동기시키는 단계; 및전송을 위해 상기 연속 오디오와 함께 상기 요약을 인코딩하는 단계를 포함하는, 정보 제공 방법.
- 통신 시스템에서 오디오/비디오 정보를 운반하는 비트스트림에 있어서,오디오 스트림(403);입력 비디오 신호의 키-프레임들로부터 생성된 콘텐트 비디오 요약 스트림(405)으로서, 상기 오디오 스트림은 방송을 위한 상기 비디오 요약 스트림과 동기되는, 상기 콘텐트 비디오 요약 스트림을 포함하는, 비트스트림.
- 저장 매체에 있어서,오디오 스트림(403); 및입력 비디오 신호의 키-프레임들로부터 생성된 콘텐트 비디오 요약 스트림(405)으로서, 상기 오디오 스트림은 방송을 위한 상기 비디오 요약 스트림과 동기되는, 상기 콘텐트 비디오 요약 스트림을 포함하는, 저장 매체.
- 수신된 정보 스트림을 디코딩하는 디코더에 있어서,상기 정보 스트림에서 기본 스트림을 디코딩하는 수단(902);상기 디코딩된 기본 스트림을 상향 변환하는 수단(904);상기 정보 스트림에서 인헨스먼트 스트림을 디코딩하는 수단(908); 및상기 상향 변환된 기본 스트림과 상기 인헨스먼트 스트림을 결합하는 수단(906)으로서, 상기 결합된 신호는 오디오 스트림과 동기된 정지 비디오 이미지들을 갖는, 상기 결합 수단을 포함하는, 디코더.
- 수신된 정보 스트림을 디코딩하기 위한 방법에 있어서,상기 정보 스트림에서 기본 스트림을 디코딩하는 단계(902);상기 디코딩된 기본 스트림을 상향 변환하는 단계(904);상기 정보 스트림에서 인헨스먼트 스트림을 디코딩하는 단계(908); 및상기 상향 변환된 기본 스트림 및 상기 인헨스먼트 스트림을 결합하는 단계(906)로서, 상기 결합된 신호는 오디오 신호와 동기된 정지 비디오 이미지를 갖는, 상기 결합 단계를 포함하는, 디코딩 방법.
- 비트스트림을 디코딩하는 방법으로서, 상기 비트스트림은 오디오 스트림과 입력 비디오 신호의 키-프레임들로부터 생성된 콘텐트 비디오 요약 스트림을 운반하고, 상기 오디오 스트림은 상기 비디오 요약 스트림과 동기되는, 상기 비트스트림 디코딩 방법에 있어서,상기 오디오 스트림을 디코딩하는 단계;상기 비디오 요약 스트림을 디코딩하는 단계; 및상기 비트스트림에 의하여 지시된 동기된 형식으로 상기 디코딩된 오디오 스트림 및 상기 디코딩된 비디오 요약 스트림을 재생하는 단계를 포함하는, 비트스트림 디코딩 방법.
- 비트스트림을 디코딩하는 디바이스로서, 상기 비트스트림은 오디오 스트림과 입력 비디오 신호의 키-프레임들로부터 생성된 콘텐트 비디오 요약 스트림을 운반하고, 상기 오디오 스트림은 상기 비디오 요약 스트림과 동기되는, 상기 비트스트림 디코딩 디바이스에 있어서,상기 오디오 스트림을 디코딩하는 수단;상기 비디오 요약 스트림을 디코딩하는 수단; 및상기 비트스트림에 의하여 지시된 동기된 형식으로 상기 디코딩된 오디오 스트림 및 상기 디코딩된 비디오 요약 스트림을 재생하는 수단을 포함하는, 비트스트림 디코딩 디바이스.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03101665 | 2003-06-06 | ||
EP03101665.2 | 2003-06-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060036922A true KR20060036922A (ko) | 2006-05-02 |
Family
ID=33495633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057023456A KR20060036922A (ko) | 2003-06-06 | 2004-05-27 | 비디오 압축 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20060209947A1 (ko) |
JP (1) | JP2006527518A (ko) |
KR (1) | KR20060036922A (ko) |
WO (1) | WO2004110069A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100776415B1 (ko) * | 2006-07-18 | 2007-11-16 | 삼성전자주식회사 | 동영상 재생 방법 및 그 시스템 |
CN108171763A (zh) * | 2018-01-15 | 2018-06-15 | 珠海市杰理科技股份有限公司 | 解码系数的存取方法和系统、jpeg解码系数的存取方法 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070058614A1 (en) * | 2004-06-30 | 2007-03-15 | Plotky Jon S | Bandwidth utilization for video mail |
US7826536B2 (en) * | 2005-12-29 | 2010-11-02 | Nokia Corporation | Tune in time reduction |
EP1827009A1 (en) * | 2006-02-28 | 2007-08-29 | Matsushita Electric Industrial Co., Ltd. | Video encoder and decoder for an improved zapping service for mobile video reception |
JP4994698B2 (ja) * | 2006-04-13 | 2012-08-08 | キヤノン株式会社 | 情報伝送装置及び情報伝送方法 |
US20100231582A1 (en) * | 2009-03-10 | 2010-09-16 | Yogurt Bilgi Teknolojileri A.S. | Method and system for distributing animation sequences of 3d objects |
CN102196303B (zh) * | 2010-03-02 | 2014-03-19 | 中兴通讯股份有限公司 | 一种媒体同步的方法和系统 |
JP5853142B2 (ja) * | 2011-01-24 | 2016-02-09 | パナソニックIpマネジメント株式会社 | 動画伝送システム |
ITVI20120104A1 (it) * | 2012-05-03 | 2013-11-04 | St Microelectronics Srl | Metodo e apparato per generare in tempo reale uno storyboard visuale |
CN104780422B (zh) * | 2014-01-13 | 2018-02-16 | 北京兆维电子(集团)有限责任公司 | 流媒体播放方法及流媒体播放器 |
CN107517400B (zh) * | 2016-06-15 | 2020-03-24 | 成都鼎桥通信技术有限公司 | 流媒体播放方法及流媒体播放器 |
CN108632557B (zh) * | 2017-03-20 | 2021-06-08 | 中兴通讯股份有限公司 | 一种音视频同步的方法及终端 |
CN113747235B (zh) * | 2021-10-09 | 2023-09-19 | 咪咕文化科技有限公司 | 一种视频处理方法、装置及设备 |
CN116800976B (zh) * | 2023-07-17 | 2024-03-12 | 武汉星巡智能科技有限公司 | 伴睡婴幼儿时音视频压缩和还原方法、装置及设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6496228B1 (en) * | 1997-06-02 | 2002-12-17 | Koninklijke Philips Electronics N.V. | Significant scene detection and frame filtering for a visual indexing system using dynamic thresholds |
EP1201088B1 (en) * | 1999-07-30 | 2005-11-16 | Indinell Sociedad Anonima | Method and apparatus for processing digital images and audio data |
US6493386B1 (en) * | 2000-02-02 | 2002-12-10 | Mitsubishi Electric Research Laboratories, Inc. | Object based bitstream transcoder |
US7463683B2 (en) * | 2000-10-11 | 2008-12-09 | Koninklijke Philips Electronics N.V. | Method and apparatus for decoding spatially scaled fine granular encoded video signals |
-
2004
- 2004-05-27 KR KR1020057023456A patent/KR20060036922A/ko not_active Application Discontinuation
- 2004-05-27 US US10/559,559 patent/US20060209947A1/en not_active Abandoned
- 2004-05-27 JP JP2006508463A patent/JP2006527518A/ja active Pending
- 2004-05-27 WO PCT/IB2004/050783 patent/WO2004110069A1/en not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100776415B1 (ko) * | 2006-07-18 | 2007-11-16 | 삼성전자주식회사 | 동영상 재생 방법 및 그 시스템 |
CN108171763A (zh) * | 2018-01-15 | 2018-06-15 | 珠海市杰理科技股份有限公司 | 解码系数的存取方法和系统、jpeg解码系数的存取方法 |
CN108171763B (zh) * | 2018-01-15 | 2021-08-13 | 珠海市杰理科技股份有限公司 | 解码系数的存取方法和系统、jpeg解码系数的存取方法 |
Also Published As
Publication number | Publication date |
---|---|
US20060209947A1 (en) | 2006-09-21 |
JP2006527518A (ja) | 2006-11-30 |
WO2004110069A1 (en) | 2004-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101232618B (zh) | 用于在视频编码系统中指示量化器参数的方法与设备 | |
US7519228B2 (en) | Method and apparatus for encrypting and compressing multimedia data | |
AU2007319699B2 (en) | Techniques for variable resolution encoding and decoding of digital video | |
US6400768B1 (en) | Picture encoding apparatus, picture encoding method, picture decoding apparatus, picture decoding method and presentation medium | |
KR100417932B1 (ko) | 영상 인코더, 영상 부호화 방법, 영상 디코더 및 영상 복호화 방법 | |
EP2384002B1 (en) | Moving picture decoding method using additional quantization matrices | |
US7839930B2 (en) | Signaling valid entry points in a video stream | |
CN101889447A (zh) | 扩展avc标准以与视频串行地对高分辨率数字静止画面编码 | |
KR20060036922A (ko) | 비디오 압축 | |
KR20110063004A (ko) | 키 프레임 추출 장치 및 방법과 이를 이용한 방송 녹화 장치 및 방법 | |
US6847684B1 (en) | Zero-block encoding | |
JP2004241869A (ja) | 透かし埋め込み及び画像圧縮部 | |
CN111182310A (zh) | 视频处理方法、装置、计算机可读介质及电子设备 | |
JP4086966B2 (ja) | 映像信号符号化装置 | |
JP3623056B2 (ja) | 動画像圧縮装置 | |
US20030128757A1 (en) | Video coding method and corresponding transmittable video signal | |
EP0927954B1 (en) | Image signal compression coding method and apparatus | |
KR20190067577A (ko) | 데이터 인코딩 및 디코딩 장치와 방법 | |
MEMORY | Si MACROBLOCKS Q | |
JP3380981B2 (ja) | 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体 | |
JP2003179826A (ja) | 画像再生表示装置 | |
Burg | Image and video compression: the principles behind the technology | |
KR100242832B1 (ko) | 양자화 스텝값 발생장치 | |
Шевяков et al. | The video processing features research in computer systems and special purpose networks | |
Sheviakov et al. | The video processing features research in computer systems and special purpose networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |