JP2006067571A - 空間および時間符号化を使用して複数の階層化ビデオ・ストリームの圧縮および圧縮解除を行うためのシステムおよびプロセス - Google Patents
空間および時間符号化を使用して複数の階層化ビデオ・ストリームの圧縮および圧縮解除を行うためのシステムおよびプロセス Download PDFInfo
- Publication number
- JP2006067571A JP2006067571A JP2005222022A JP2005222022A JP2006067571A JP 2006067571 A JP2006067571 A JP 2006067571A JP 2005222022 A JP2005222022 A JP 2005222022A JP 2005222022 A JP2005222022 A JP 2005222022A JP 2006067571 A JP2006067571 A JP 2006067571A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- block
- pixel
- action
- key frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 391
- 230000008569 process Effects 0.000 title claims abstract description 219
- 230000002123 temporal effect Effects 0.000 title claims description 21
- 238000007906 compression Methods 0.000 claims abstract description 148
- 230000006835 compression Effects 0.000 claims abstract description 131
- 230000006837 decompression Effects 0.000 claims abstract description 74
- 230000009471 action Effects 0.000 claims description 184
- 230000036961 partial effect Effects 0.000 claims description 24
- 238000013139 quantization Methods 0.000 claims description 9
- 230000033001 locomotion Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims 6
- 230000000737 periodic effect Effects 0.000 claims 1
- 238000005070 sampling Methods 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000002441 reversible effect Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 14
- 230000002452 interceptive effect Effects 0.000 description 10
- 238000009877 rendering Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000005055 memory storage Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- CDFKCKUONRRKJD-UHFFFAOYSA-N 1-(3-chlorophenoxy)-3-[2-[[3-(3-chlorophenoxy)-2-hydroxypropyl]amino]ethylamino]propan-2-ol;methanesulfonic acid Chemical compound CS(O)(=O)=O.CS(O)(=O)=O.C=1C=CC(Cl)=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC(Cl)=C1 CDFKCKUONRRKJD-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4347—Demultiplexing of several video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/111—Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
- H04N19/21—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with binary alpha-plane coding for video objects, e.g. context-based arithmetic encoding [CAE]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/39—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2365—Multiplexing of several video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
【解決手段】複数のストリームの同時発生の複数のビデオ・フレームからなる各集合内の各フレームは、少なくとも2つの層−主層および境界層−により表される。主層の圧縮は、最初に同時発生の複数のフレームからなる各集合内のそれらの層の1つまたは複数をキー・フレームとして指定することを伴う。時間系列順序の同時発生の複数のフレームからなる各集合について、各キー・フレームの主層は、フレーム間圧縮法を使用して圧縮される。さらに、考察対象のフレーム集合内の各非キー・フレームの主層は、空間予測圧縮法を使用して圧縮される。最後に、現在のフレーム集合内の各フレームの境界層は、フレーム内圧縮法を使用してそれぞれ圧縮される。圧縮解除は、一般に、圧縮プロセスの逆である。
【選択図】図3
Description
本発明のシステムおよびプロセスは、インターラクティブ視点ビデオ・データ、または同じビデオ・フレーム形式を持つ他のデータの圧縮および圧縮解除を行うために使用される。一般に、インターラクティブ視点ビデオは、ユーザが思いのままに時間を操作し(フリーズ、スローダウン、または反転)、視点を変更しながら、動的シーンを見ることができるビデオである。このビデオを生成するには、比較的少ない台数のカメラを使用して、異なる視点からシーンの複数のビューを同時にキャプチャし、ビデオの同時発生の複数のフレームからなる集合を作成する。これは継続的に実行され、これらのフレーム集合からなるシーケンスを生成し、その後、一意的な2層フレーム表現を使用してそれらを特徴付け、ビデオを形成する。インターラクティブ視点ビデオの生成は本発明のシステムおよびプロセスの範囲を超えているが、これは、 年 月 日に出願され、シリアル番号 を割り当てられた「Interactive Viewpoint Video System And Process」という表題の同時係属出願の主題である。
本発明の好ましい実施形態の説明を行う前に、本発明の一部を実装できる好適なコンピューティング環境の概要について簡単に説明する。図1は、好適なコンピューティング・システム環境100の一実施例を示している。コンピューティング・システム環境100は、好適なコンピューティング環境の一例にすぎず、本発明の用途または機能性の範囲に関する制限を示唆する意図はない。コンピューティング環境100は、典型的な動作環境100に例示されている1つのコンポーネントまたはその組合せに関係する何らかの依存関係または要求条件がその環境にあるものと解釈すべきでない。
すでに説明した2層フレーム・データは、大量のデータ(例えば、8台のカメラを使用し15fpsの速さで1秒間記録した、未圧縮800MBのオーダーの)を表す。本発明による圧縮スキームはこの大量のデータを管理可能なサイズに縮小するのに使用され、圧縮解除は高速再生をサポートするように設計される。それぞれのカメラは、同じシーンの部分をキャプチャしているため、カメラ間(つまり空間)冗長性とともに、連続するフレーム集合の間で時間的に有効に活用することによって、データを圧縮する機会が存在する。一般に、時間圧縮態様では、先行するフレームからの動き補償推定結果を使用する時間予測を含むが、空間圧縮態様では、空間的に隣接するカメラの視点内に変換された基準カメラのテクスチャおよびディスパリティ・マップ(disparity maps)を使用する空間予測を含む。その後、テクスチャおよびディスパリティ/深度データを同時に処理できる新規性のある変換ベースの圧縮スキームを使用して、予測されたフレームと実際のフレームとの差分が符号化される。
前述のように、インターラクティブ視点ビデオ・データの「フレーム」を構成する同時にキャプチャされたフレームの各集合内の各構成要素フレームは、RGBDピクセル値を含む主層と、RGBADピクセル値を含む境界層とにより表される。さらに、キー・フレームの主層は、最初に、またそれ以降周期的に、非予測Iフレーム法を使用して圧縮される。この節では、その手法について説明する。
上述の各Iフレームの間に入る同時発生の複数のフレームからなる集合内のキー・フレームの主層に対し、従来のフレーム間圧縮法の予測フェーズが使用される。例えば、テストされた実施形態では、MPEG4規格のPフレーム生成方式を使用した。この方式に対する唯一の修正は、ディスパリティ値(D)の追加であり、その理由は、このデータを主フレーム・ピクセル・データが含むからである。Dデータは、Yデータとまったく同じようにして処理されるという点で前述のIフレーム手続きの場合と同じ方法で、追加される。
キー・フレームとして選択されないそれぞれの同時発生の複数のフレームからなる集合内のフレームの主層に対し、空間予測圧縮法を使用して、それらを前記のように圧縮する。一般に、空間予測を実行するために、近隣のキー・フレームからのディスパリティ・データを使用して、テクスチャ・データおよびディスパリティ・データの両方を、圧縮される非キー・フレームの視点に変換する。この結果、非キー・フレームのデータが近似され、その後、圧縮された差分情報を送信することにより補正される。そのため、キー・フレームは、隣接する非キー・フレームを圧縮するための基準視野(reference views)として機能する。カメラ視野変換時に作成されたオクルージョン・ホール(手前にある物体が背後にある物体を隠す部分)は、別々に取り扱われ、欠損テクスチャは、アルファ・マスクを使用して予測なしで符号化される。これは、従来のブロック・ベースのPフレーム・コーデックだと得られない、クリーンな結果が得られる。
前述のように、インターラクティブ視点ビデオ・データの「フレーム」を構成する同時にキャプチャされたフレームの各集合内の各構成要素フレームは、さらに、割り当てられたRGBAD値を持つピクセルを含む境界層により表される。これらの境界層は、非予測Iフレーム法であるが、Aプレーンに関連付けられたサブブロックがそのプロセスに追加され、非透明ピクセルを持つブロックが符号化されることを除き、主層キー・フレームの圧縮に関して上述したのに似た非予測Iフレーム法、を使用して圧縮される。構成要素フレームに関連付けられた境界層データに適用されるときのこの圧縮法について詳細に説明することにする。
すでに示されているように、インターラクティブ視点ビデオにより、ユーザは、自分がビデオの現在の部分に示されているシーンを見るために使用したい視点を選択することができる。このユーザ選択視点は、カメラ視野の1つと一致している場合もあれば、あるいは2つのカメラ視野の間に入る可能性も高い。そこで、選択された視点から示されているシーンの画像を生成するために、ビデオの各時間フレーム集合を構成する複数の同時にキャプチャされたフレームに関連付けられている限られた量のデータのみが必要である。これにより、ビデオ・データを選択的に復号化し、圧縮解除することができる。一般に、ビデオを見るユーザによって選択された有利な地点からビデオの現在のフレームをレンダリングするために必要な受信ビデオ・データの一部だけが復号化される。このようにして、可能な最低量のデータが処理されなければならず、それによってプロセスがスピードアップし、レンダリング機能が高速化される。
前述の非予測Iフレーム法を使用して圧縮された符号化キー・フレームの主層の圧縮解除は、大半が、いくつか例外はあるが、圧縮の逆である。この圧縮解除プロセスは、一般的に、符号化された所定の順序で、復号化されるフレームの所定のサイズのブロック(例えば、テストされた実施形態のように16×16)に対応する圧縮プロセス内で生成されたデータ・ストリームの各部分を取得し、その後各データ・ストリーム部分を圧縮解除することにより、実行される。
前述のPフレーム手続きを使用して圧縮された各同時発生の複数のフレームからなる集合内のキー・フレームの主層の圧縮解除が、従来のフレーム間圧縮解放法を使用して実行される。テストされた実施形態では、これは、MPEG4規格のPフレーム復元方式を使用することを含む。この方式に対する唯一の修正は、ディスパリティ値(D)の復元であり、これは主フレーム・ピクセル・データにこのデータが含まれているためである。Dデータは、で前述のIフレーム圧縮解除手続きの場合と同じ方法で復元され、ここでは、このデータはYデータの復元とまったく同じようにして処理される。
次に、前述の空間予測圧縮法を使用して圧縮された非キー・フレームの符号化された主層の圧縮解除について説明する。すでに説明したように、同時発生の複数のフレームからなる各集合の非キー・フレーム画像は、考察対象の非キー・フレーム画像を圧縮する際に基準フレームとして採用された、集合内の圧縮解除されたキー・フレームを使用して、圧縮解除される。特に、図8A〜Bを参照すると、同時発生の複数のフレームからなる各集合内のそれぞれの非キー・フレームについて、まず、その基準フレームとしてその集合内のどのキーフレーム(複数ある場合)が使用されたかが判別される(プロセス・アクション800)。これは、圧縮解除モジュールをキー・フレーム選択および関連付けルールを使用して事前プログラムすることにより実行され、これらは、キー・フレームに関連付けられているすべての非キー・フレームを識別するために使用することができる。次に、このキー・フレームの圧縮解除バージョンをYuvD形式でピクセル・データとともに入力する(プロセス・アクション802)。次に、キー・フレームのディスパリティ・データ(D)と、キー・フレームおよび圧縮解除される非キー・フレームをキャプチャするために使用されるカメラのカメラ・パラメータ(圧縮ビデオ・データに含まれている)とを使用して、そのテクスチャ・データおよびディスパリティ・データ(YuvD)の両方を圧縮解除される非キー・フレームの視点に変換する(プロセス・アクション804)。非キー・フレーム画像の圧縮の場合のように、キー・フレームの主層を圧縮解除される非キー・フレームの視点に「ワープ」するために使用されるプロセスは、従来の方法を使用して実行される。
次に、前述の非予測Iフレーム方式を使用して圧縮され符号化された境界層の圧縮解除について説明する。図9A〜Cを参照すると、圧縮解除プロセスは、圧縮されたフレーム・データに含まれる分類データを復号化することから始まる(プロセス・アクション900)。これは、分類データを圧縮するために使用される手続きに適用可能な特定の復号化手続きを適用し(例えば、テストされた実施形態ではHuffmann符号化法)、その後、圧縮プロセスで使用される所定のサイズのブロック(例えば、テストされた実施形態では8×8)のそれぞれに割り当てられたカテゴリ(つまり、T、O、またはP)を取得するために逆四分木手続きを実行することを含む。
110 コンピュータ
120 演算処理装置
121 システム・バス
130 システム・メモリ
134 オペレーティング・システム
135 アプリケーション・プログラム
136 その他のプログラム・モジュール
137 プログラム・データ
140 取り外し不可能不揮発性メモリ・インターフェース
141 ハードディスク・ドライブ
144 オペレーティング・システム
145 アプリケーション・プログラム
146 その他のプログラム・モジュール
147 プログラム・データ
150 取り外し可能不揮発性メモリ・インターフェース
151 磁気ディスク・ドライブ
152 磁気ディスク
155 光ディスク・ドライブ
156 光ディスク
160 ユーザ入力インターフェース
161 マウス
162 キーボード
170 ネットワーク・インターフェース
171 ローカル・エリア・ネットワーク
172 モデム
173 ワイド・エリア・ネットワーク
180 リモート・コンピュータ
181 メモリ記憶デバイス
185 リモート・アプリケーション・プログラム
190 ビデオ・インターフェース
191 モニタ
192 カメラ
193 画像シーケンス
194 カメラ・インターフェース
195 出力周辺インターフェース
196 プリンタ
197 スピーカ
200 カメラ
300 キー・フレーム・カメラ視野
302 特定の非キー・フレーム
304 曲線
306 時間予測フレーム
Claims (40)
- 同時発生の複数のビデオ・フレームからなる順次的な複数の集合であって、1つの集合内の前記複数のビデオ・フレームは、異なる視点からの実質的に同じシーンを表し、そのそれぞれのフレームは少なくとも主層および境界層により表される、複数の集合を含むビデオ・データを圧縮するコンピュータにより実装されるプロセスであって、前記プロセスはコンピュータを使用して、
同時発生の複数フレームからなる各集合に対し1つまたは複数のキー・フレームを指定するプロセス・アクションであって、同時発生の複数フレームからなるどれか1つの集合内のそれぞれの指定されたキー・フレームが、同時発生の複数フレームからなる前記他のすべての集合内の指定されたキー・フレームと同じである視点を持つように、指定するプロセス・アクションと、
時間系列順序で同時発生の複数のビデオ・フレームからなる集合毎に、
フレーム間圧縮手法を使用して各キー・フレームの前記主層を圧縮するプロセス・アクションと、
空間予測圧縮手法を使用して各非キー・フレームの前記主層を圧縮プロセス・アクションと、
フレーム内圧縮手法を使用して各フレームの前記境界層を圧縮するプロセス・アクションと
を実行するプロセス・アクションと、
を備えることを特徴とするコンピュータにより実装されるプロセス。 - 同時発生の複数フレームからなる各集合の各フレームは、そのピクセルがピクセル色値およびピクセル・ディスパリティまたは深度値により特徴付けられる前記主層と、そのピクセルがピクセル色値、ピクセル・アルファ値およびピクセル・ディスパリティまたは深度値により特徴付けられる前記境界層とにより表され、フレーム間圧縮法を使用して同時発生の複数フレームからなる各集合内の各キー・フレームの前記主層を圧縮する前記プロセス・アクションは、
所定の周期をベースにして、前記第1のビデオ・フレーム集合および他の後続のフレーム集合に対し、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する非予測Iフレーム圧縮法を使用して、各キー・フレームの前記主層を圧縮するアクションと、
前記非予測Iフレーム圧縮法を使用して圧縮されない1つまたは複数のキー・フレームを含む各フレーム集合について、先行するフレーム集合内の同じ視点を示す前記キー・フレームの前記主層に基づき、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する、時間予測圧縮法を使用して各キー・フレームの前記主層を圧縮するアクションと
を備えることを特徴とする請求項1に記載のプロセス。 - 同時発生の複数フレームからなる各集合内の各非キー・フレームの前記主層を圧縮する前記プロセス・アクションは、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する空間予測圧縮法を使用して、同時発生の複数フレームからなる各集合内の各非キー・フレームの前記主層を圧縮するアクションを備えることを特徴とする請求項2に記載のプロセス。
- 同時発生の複数フレームからなる各集合について1つまたは複数のキー・フレームを指定する前記プロセス・アクションは、集合内のどのフレームも指定されたキー・フレームの視点から所定の視点個数分を超えて離れないように前記1つまたは複数のキー・フレームを指定するアクションを含み、同時発生の複数フレームからなる各集合内の各非キー・フレームの前記主層を圧縮する前記プロセス・アクションは、圧縮される前記主層から前記所定の視点個数以下の個数分だけ離れているキー・フレーム位置のフレームの前記主層を前記空間予測圧縮法の基準フレームとして使用するアクションを備えることを特徴とする請求項3に記載のプロセス。
- 前記キー・フレームの可能な最低数が指定されることを特徴とする請求項4に記載のプロセス。
- 前記所定の視点個数は2であることを特徴とする請求項4に記載のプロセス。
- 各フレーム集合内の各フレームの前記境界層を圧縮する前記プロセス・アクションは、最低でもピクセル色値、ピクセル・ディスパリティまたは深度値、およびピクセル・アルファ値を符号化する非予測Iフレーム圧縮法を使用して、各フレーム集合内の各フレームの前記境界層を圧縮するアクションを備えることを特徴とする請求項2に記載のプロセス。
- 前記ピクセル色値は、RGB値であり、前記第1のビデオ・フレーム集合および他の後続のフレーム集合に対し非予測Iフレーム圧縮法を使用して各キー・フレームの前記主層を圧縮する前記プロセス・アクションは、ブロック毎に実行され、所定のサイズのフレーム・ブロック毎に、
考察対象の前記フレーム・ブロックの前記RGB値をYuv値に変換するアクションと、
前記フレーム・ブロックの前記uおよびvプレーンをダウン・サンプリングして、所定のサイズのサブブロックを生成するアクションと、
前記フレーム・ブロックの前記Yおよびピクセル・ディスパリティまたは深度(D)プレーンを前記所定のサイズのサブブロックに分割するアクションと、
前記Y、u、v、およびDサブブロックのそれぞれに、所定のパターンを介して順序番号を割り当てるアクションと、
前記Y、u、v、およびDサブブロックのそれぞれをDCT領域に変換し、前記サブブロックと同じサイズの周波数ブロックを生成するアクションと、
DC成分予測法を各周波数ブロックに適用し、各周波数ブロック内の前記DC成分を、隣接周波数ブロックに基づいて予測されたDC成分値と前記実際の値との前記差分を表す値で置き換えるアクションと、
各周波数ブロックの前記AC周波数成分を量子化するアクションと、
前記すでに割り当てられているブロック番号の順序で各周波数ブロックを符号化する符号化アクションであって、前記符号化は、所定のパターンを使用して各ブロックの前記周波数成分を順序付けし、その後Iフレーム可変長符号化法を使用して前記順序付けされた成分を符号化する、符号化アクションと、
前記周波数ブロックの前記符号化された周波数値から、それらが符号化されている前記順序で、ビットストリームを生成するアクションと
を含む複数のアクションを備えることを特徴とする請求項2に記載のプロセス。 - 各フレーム・ブロックは、サイズが16×16ピクセルであり、ラスター順序で符号化されることを特徴とする請求項8に記載のプロセス。
- 前記周波数成分を順序付けするために使用される前記所定のパターンは、ジグザグ・パターンであり、前記Iフレーム可変長符号化法は、MPEG4 Huffman符号化法であることを特徴とする請求項8に記載のプロセス。
- 前記周波数ブロックの前記符号化された周波数値からビットストリームを生成する前記プロセス・アクションは、
データ構造体を含む各周波数ブロックに対するビットストリームを生成するアクションを備え、
前記データ構造体は、
Y、u v、およびDサブブロックを表す前記周波数ブロックがそれぞれ、非ゼロのAC周波数成分を持つかどうかを示すCBPY、CBPu、CBPv、およびCBPDセクションを備えるCBPヘッダ・フィールドと、
周波数ブロックのすべての前記AC成分がゼロである場合には必ずDC差分値のみが含まれることを除き、前記周波数ブロックの前記符号化された周波数値を符号化される順序で備える符号化された周波数成分フィールドと
を備えることを特徴とする請求項8に記載のプロセス。 - 前記CBPヘッダの前記CBPY、CBPu、CBPvセクションは、MPEG4に従って符号化され、前記ヘッダの前記CBPDセクションは、前記CBPYセクションの前記MPEG4符号化と同じやり方で符号化されることを特徴とする請求項11に記載のプロセス。
- 前記非予測Iフレーム圧縮法を使用して圧縮されない1つまたは複数のキー・フレームを含む各フレーム集合に対し、時間予測圧縮法を使用して各キー・フレームの前記主層を圧縮する前記プロセス・アクションは、前記ピクセル・ディスパリティまたは深度値を含むように修正された前記MPEG4規格のPフレーム生成方式を使用するアクションを備えることを特徴とする請求項2に記載のプロセス。
- 空間予測圧縮法を使用して、同時発生の複数フレームからなる各集合内の各非キー・フレームの前記主層を圧縮する前記プロセス・アクションは、
圧縮される前記非キー・フレームから所定の視点個数分の範囲内にあるキー・フレームを識別するアクションと、
前記識別されたキー・フレームの前記ピクセル・データを入力するアクションと、
前記識別されたキー・フレームの前記ピクセル色値をYuv値に変換するアクションと、
前記識別されたキー・フレームおよび圧縮される前記非キー・フレームをキャプチャするために使用されるカメラの位置、向き、およびカメラ属性を示すカメラ・パラメータを入力するアクションと、
前記識別されたキー・フレームの深度値(D)の前記ディスパリティと、前記キー・フレームおよび圧縮解除される前記非キー・フレームをキャプチャするために使用される前記カメラの前記カメラ・パラメータとを使用して、圧縮解除される前記非キー・フレームの前記視点に前記識別されたキー・フレームをワープするアクションと、
YuvD値を持たない前記ワープされたキー・フレームのピクセルを識別するアクションと、
前記ワープされたキー・フレームのピクセル位置毎にYuvDピクセル値が使用可能である場合に一方の2進値を、YuvD値が存在しない場合に他方の2進値を持つバイナリ・マスクを生成するアクションと、
所定のピクセル数だけの使用可能なYuvD値がないことを示す前記バイナリ・マスクの前記領域を拡張するアクションと、
前記バイナリ・マスクを所定のサイズのブロックのグリッドに分割するアクションと、
ブロック毎に、そのブロック内の前記バイナリ・マスク・ピクセルのどれもが、YuvD値が存在しない領域に関連付けられた前記第2の2進値を持つかどうかを示す、モード指定を確立するアクションと、
前記ワープされたキー・フレームの各ピクセルの前記ピクセル値を、圧縮される前記非キー・フレーム画像の前記対応するピクセルの類似の型の値から差し引き、差分画像を出力するアクションと、
前記非キー・フレームおよび前記差分画像を、前記バイナリ・マスクを分割するために使用されるサイズと同じサイズのブロックに、セグメント分割するアクションと、
前記非キー・フレームおよび差分画像の対応する配置のブロック毎に、所定の順序で考察して、
前記ブロックが、前記ブロックの前記モード指定を使用してYuvD値を持たないピクセルを備える前記ワープされたキー・フレームの領域に関連付けられているかどうかを判別し、
前記ブロックが、YuvD値を持たないピクセルを備える前記ワープされたキー・フレームの領域に関連付けられていると判明した場合に必ず、隣接するブロックのピクセルがすべてYuvD値を持つ場合に必ず前記隣接ブロックに関連付けられる実際の値の代わりに、DC周波数成分予測フェーズで所定の中間範囲DC周波数成分値を使用するIフレーム圧縮法のあるバージョンを使用して、前記非キー・フレームの前記ブロックを符号化し、
前記ブロックが、すべてYuvD値を持つピクセルを含む前記ワープされたキー・フレームの領域に関連付けられていると判明した場合に必ず、DC周波数成分予測フェーズがスキップされ、前記DC周波数成分を符号化するためにAC周波数成分符号化テーブルが使用されるIフレーム圧縮法のあるバージョンを使用して、前記差分画像の前記ブロックを符号化し、
前記ブロックの前記モード指定を前記符号化された前記ブロック・データに付加する
アクションと
を備えることを特徴とする請求項3に記載のプロセス。 - 前記ピクセル色値は、RGB値であり、最低でもピクセル色値、ピクセル・ディスパリティまたは深度値、およびピクセル・アルファ値を符号化する非予測Iフレーム圧縮法を使用して各フレーム集合内の各フレームの前記境界層を圧縮する前記プロセス・アクションは、
圧縮される前記境界層フレームの前記RGBピクセル色、ピクセル・アルファ(A)、およびピクセル・ディスパリティまたは深度(D)データを入力するアクションと、
前記フレームの所定のサイズのカテゴリ・ブロック毎に、前記ブロックを、A値に基づいて透明、不透明、または部分的に透明で部分的に不透明(部分ブロック)と分類するアクションと、
前記分類を符号化し、前記符号化された分類を前記圧縮された境界層データの一部として指定するアクションと、
所定のサイズの境界層フレーム・ブロック毎に、所定の順序で
前記カテゴリ・ブロックに対応する所定の個数の対応するサブブロックに、前記フレーム・ブロックを分割し、
サブブロックが、透明であると分類されているカテゴリ・ブロックに対応する場合に必ず、どのようなコードも生成せず、
サブブロックが、部分ブロックであると分類されているカテゴリ・ブロックに対応する場合に必ず、
前記部分サブブロックに対して、不透明または透明であるかをピクセル毎に指定するバイナリ・マスクを生成し、
前記バイナリ・マスクを符号化し、
前記符号化されたバイナリ・マスクを前記圧縮された境界層データの一部であるとして指定し、
前記部分サブブロックの前記透明ピクセルをフィル・インし、
考察対象の前記フレーム・ブロックの前記RGB値をYuv値に変換し、
前記フレーム・ブロックの前記uおよびvプレーンをダウン・サンプリングして、所定のサイズのサブブロックを生成し、
前記フレーム・ブロックの前記Y、A、およびDプレーンを前記所定のサイズのサブブロックに分割し、
前記Y、A、またはDサブブロックのどれかが透明ピクセルのみを含むかどうかを判別し、もしそうであれば、それらを排除し、
前記残りのY、u、v、A、およびDサブブロックのそれぞれに、所定のパターンを介して順序番号を割り当て、
前記Y、u、v、A、およびDサブブロックのそれぞれを前記DCT領域に変換して前記サブブロックと同じサイズの周波数ブロックを生成し、
DC成分予測法を各周波数ブロックに適用し、各周波数ブロック内の前記DC成分を、隣接周波数ブロックに基づいて予測されたDC成分値と前記実際の値との前記差分を表す値で置き換え、
各周波数ブロックの前記AC周波数成分を量子化し、
前記すでに割り当てられているブロック番号の順序で各周波数ブロックを、所定のパターンを使用して各ブロックの前記周波数成分を順序付けすること、その後前記順序付けされた成分を、Iフレーム可変長符号化法を使用して符号化することを備えた符号化を実行し、
前記周波数ブロックの前記符号化された周波数値からビットストリームをそれが符号化される順序で生成し、前記符号化された周波数値を前記圧縮された境界層データの一部であるとして指定するアクションと
を備えることを特徴とする請求項7に記載のプロセス。 - 前記フレームの前記所定のサイズのカテゴリ・ブロックは8×8ピクセル・ブロックであることを特徴とする請求項15に記載のプロセス。
- 前記分類を符号化する前記プロセス・アクションは、
四分木手法を適用して前記分類を符号化するアクションと、
可変長符号化手法を使用して前記符号化された分類を圧縮するアクションと
を備えることを特徴とする請求項15に記載のプロセス。 - 前記バイナリ・マスクを符号化する前記プロセス・アクションは、可変長符号化手法を使用して前記バイナリ・マスク・データを圧縮するアクションを備えることを特徴とする請求項15に記載のプロセス。
- 各フレーム・ブロックは、サイズが16×16ピクセルであり、ラスター順序で符号化されることを特徴とする請求項15に記載のプロセス。
- 前記周波数成分を順序付けするために使用される前記所定のパターンは、ジグザグ・パターンであり、前記Iフレーム可変長符号化法は、MPEG4 Huffman符号化法であることを特徴とする請求項15に記載のプロセス。
- 前記周波数ブロックの前記符号化された周波数値からビットストリームを生成する前記プロセス・アクションは、
データ構造体を含む各周波数ブロックに対するビットストリームを生成するアクションを備え、前記データ構造体は、
Y、u v、A、およびDサブブロックを表す前記周波数ブロックがそれぞれ、非ゼロのAC周波数成分を持つかどうかを示すCBPY、CBPu、CBPv、CBPA、およびCBPDセクションを備えるCBPヘッダ・フィールドと、
周波数ブロックのすべての前記AC成分がゼロである場合には必ずDC差分値のみが含まれることを除き、前記周波数ブロックの前記符号化された周波数値を符号化される順序で備える符号化された周波数成分フィールドと
を備えることを特徴とする請求項15に記載のプロセス。 - 前記CBPヘッダの前記CBPY、CBPu、CBPvセクションは、MPEG4に従って符号化され、前記ヘッダの前記CBPAおよびCBPDセクションは、前記CBPYセクションの前記MPEG4符号化と同じやり方で符号化されることを特徴とする請求項21に記載のプロセス。
- 請求項1に記載のプロセス・アクションを実行するためのコンピュータ実行可能命令を備えることを特徴とするコンピュータ可読媒体。
- 同時発生の複数ビデオ・フレームからなる順次的な複数の集合であって、1つの集合内の前記複数のビデオ・フレームは、異なる視点からの実質的に同じシーンを表し、そのそれぞれのフレームは、ピクセルがピクセル色値およびピクセル・ディスパリティまたは深度値により特徴付けられる主層およびピクセルがピクセル色値、ピクセル・アルファ値およびピクセル・ディスパリティまたは深度値により特徴付けられる境界層により表される、複数の集合を含むビデオ・データを圧縮するシステムであって、
汎用コンピューティング・デバイスと、
前記汎用コンピューティング・デバイスにより実行可能なプログラム・モジュールを含むコンピュータ・プログラムであって、前記コンピューティング・デバイスに、前記コンピュータ・プログラムの前記プログラム・モジュールは、
前記ビデオ・フレーム集合のすべてに共通の1つまたは複数のキー・フレーム位置を、集合内のどのフレームも、指定されたキー・フレーム位置から所定の視点個数分を超えて離れないように指定し、
所定の周期をベースにして、前記第1のビデオ・フレーム集合および他の後続のフレーム集合に対し、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する非予測Iフレーム圧縮法を使用して、キー・フレーム位置視点を示す各フレームの前記主層を圧縮し、
圧縮される前記主層から前記所定の視点個数以下の個数分だけ離れているキー・フレーム位置のフレームの前記主層を基準フレームとして使用し、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する、空間予測圧縮法を使用してキー・フレーム位置視点を示さない各フレームの前記主層を圧縮し、
前記非予測Iフレーム圧縮法を使用して圧縮されない1つまたは複数のキー・フレーム位置フレームを含む各フレーム集合について、先行するフレーム集合内の同じ視点を示す前記フレームの前記主層からの動き補償推定に基づき、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する、時間予測圧縮法を使用してキー・フレーム位置視点を示す各フレームの前記主層を圧縮し、
最低でもピクセル色値、ピクセル・ディスパリティまたは深度値、およびピクセル・アルファ値を符号化する非予測Iフレーム圧縮法を使用して各フレーム集合内の各フレームの前記境界層を圧縮する
ように指令するコンピュータ・プログラムと
を備えることを特徴とするシステム。 - 同時発生の複数のビデオ・フレームからなる順次的な複数の集合であって、1つの集合内の前記ビデオ・フレームは、異なる視点からの実質的に同じシーンを表し、そのそれぞれのフレームは少なくとも主層および境界層により表される、複数の集合を含むビデオ・データを圧縮解除するコンピュータにより実装されるプロセスであって、
前記ビデオ・データは、
同時発生の複数のフレームからなる各集合に対し1つまたは複数のキー・フレームを、同時発生の複数のフレームからなるどれか1つの集合内のそれぞれの指定されたキー・フレームが、同時発生の複数のフレームからなる前記他のすべての集合内の指定されたキー・フレームと同じである視点を持つように、指定すること、
フレーム間圧縮手法を使用して、同時発生の複数のフレームからなる各集合内の各キー・フレームの前記主層を圧縮すること、
空間予測圧縮手法を使用して同時発生の複数のフレームからなる各集合内の各非キー・フレームの前記主層を圧縮すること、および
フレーム内圧縮手法を使用して各フレーム集合内の各フレームの前記境界層を圧縮すること
により圧縮されているビデオ・データであり、
前記プロセスは、コンピュータを使用して、
フレーム内圧縮解除手法を使用して各フレーム集合内の各フレームの前記境界層を圧縮解除するプロセス・アクションと、
フレーム間圧縮解除手法を使用して同時発生の複数のフレームからなる各集合内の各キー・フレームの前記主層を圧縮解除するプロセス・アクションと、
空間予測圧縮解除手法を使用して同時発生の複数のフレームからなる各集合内の各非キー・フレームの前記主層を圧縮解除するプロセス・アクションと
を実行することを備えることを特徴とするコンピュータにより実装されるプロセス。 - 同時発生の複数のフレームからなる各集合の各フレームは、そのピクセルがピクセル色値およびピクセル・ディスパリティ値により特徴付けられる前記主層と、およびそのピクセルがピクセル色値、ピクセル・アルファ値およびピクセル・ディスパリティ値により特徴付けられる前記境界層とにより表され、フレーム間圧縮解除法を使用して同時発生の複数のフレームからなる各集合内の各キー・フレームの前記主層を圧縮解除する前記プロセス・アクションは、
所定の周期をベースにして、前記第1のビデオ・フレーム集合および他の後続のフレーム集合に対し、最低でも前記元のピクセル色値、さらにはピクセル・ディスパリティまたは深度値の近似を復元する非予測Iフレーム圧縮法を使用して、各キー・フレームの前記主層を圧縮解除するアクションと、
前記非予測Iフレーム圧縮法を使用して圧縮されない1つまたは複数のキー・フレームを含む各フレーム集合について、他のフレーム集合内の同じ視点を示す前記キー・フレームの前記主層に基づき、最低でも前記元のピクセル色値、さらにはピクセル・ディスパリティまたは深度値の近似を復元する、時間予測圧縮解除法を使用して各キー・フレームの前記主層を圧縮解除するアクションと
を備えることを特徴とする請求項25に記載のプロセス。 - 空間予測圧縮解除法を使用して同時発生の複数のフレームからなる各集合内の各非キー・フレームの前記主層を圧縮解除する前記プロセス・アクションは、最低でも前記元のピクセル色値、さらにはピクセル・ディスパリティまたは深度値の近似を復元する空間予測圧縮解除法を使用して同時発生の複数のフレームからなる各集合内の各非キー・フレームの前記主層を圧縮解除するアクションを備えることを特徴とする請求項26に記載のプロセス。
- 同時発生の複数のフレームからなる各集合について指定される前記1つまたは複数のキー・フレームは、集合内のどのフレームも指定されたキー・フレームの視点から所定の視点個数分を超えて離れないように指定され、同時発生の複数のフレームからなる各集合内の各非キー・フレームの前記主層を圧縮解除する前記プロセス・アクションは、圧縮解除される前記主層から前記所定の視点個数以下の個数分だけ離れているキー・フレーム位置のフレームの前記主層を前記空間予測圧縮解除法の基準フレームとして使用するアクションを備えることを特徴とする請求項27に記載のプロセス。
- フレーム内圧縮解除法を使用して各フレーム集合内の各フレームの前記境界層を圧縮解除する前記プロセス・アクションは、最低でも前記元のピクセル色値、ピクセル・ディスパリティまたは深度値、およびピクセル・アルファ値の近似を復元する非予測Iフレーム圧縮解除法を使用して各フレーム集合内の各フレームの前記境界層を圧縮解除するアクションを備えることを特徴とする請求項26に記載のプロセス。
- 所定の周期をベースにして、前記第1のビデオ・フレーム集合および他の後続のフレーム集合に対し、非予測Iフレーム圧縮法を使用して各キー・フレームの前記主層を圧縮解除する前記プロセス・アクションは、
考察対象の前記キー・フレームの前記主層の圧縮時に生成されたデータ・ストリームを入力するアクションと、
前記キー・フレームの所定のサイズのフレーム・ブロックに対応する前記データ・ストリームの部分毎に、所定の順序で考察して、
ゼロを加えて圧縮時に削除されたゼロ値AC成分を置き換えることにより考察対象の前記データ・ストリーム部分を拡大し、
前記拡大されたデータ・ストリーム部分を復号化して、所定のサイズの複数の周波数ブロックからなる順序付けされたバージョンであって、前記周波数ブロックと同じサイズであるYuv値の形式のピクセル色値、およびピクセル・ディスパリティまたは深度値(D)により特徴付けられたピクセルの符号化されたサブブロックを表すバージョンをリストアし、
圧縮で使用された順序付けパターンの逆を使用して、各周波数ブロックの前記周波数成分を、圧縮前のその順序にリストアし、
前記リストアされた周波数ブロックのそれぞれに対し逆DC成分予測手続きを実行して、各周波数ブロックの前記元のDC成分の量子化バージョンをリストアし、
前記量子化された周波数ブロックのそれぞれに対し逆量子化手続きを実行して、各周波数ブロックの前記元のDC成分を実質的にリストアし、
圧縮時に前記Y、u、v、およびDサブブロックに対し実行されたDCTの逆を実行して、前記周波数ブロックを出力し、前記サブブロックの前記Y、u、v、およびD値の近似をリストアし、
圧縮時にダウン・サンプリングされたのと同じ倍率で前記uおよびvサブブロックをアップ・サンプリングし、それらを元の所定のプレーン・サイズに戻し、
圧縮時に前記元のYプレーンを分割するために使用されたのと同じ順序で前記Yサブブロックを結合して、リストアされたYプレーンを形成し、
圧縮時に前記元のDプレーンを分割するために使用されたのと同じ順序で前記Dサブブロックを結合して、リストアされたDプレーンを形成し、
前記Y、u、およびvピクセル値をRGB値に変換し、
考察対象の前記キー・フレームのリストアされたフレーム・ブロックとして、前記リストアされたRGBおよびD値から形成されたピクセルの前記ブロックを指定する
複数のアクションとを備えることを特徴とする請求項26に記載のプロセス。 - 前記所定のサイズのフレーム・ブロックだけでなく、前記リストアされたフレーム・ブロック、元のuおよびvプレーン、YプレーンおよびDプレーンは、すべて16×16ピクセル・ブロックであり、前記所定の順序は、ラスター順序であることを特徴とする請求項30に記載のプロセス。
- 前記キー・フレームの前記所定のサイズのフレーム・ブロックに対応する前記データ・ストリームの各部は、圧縮時において、前記Y、u v、およびDサブブロックを表す前記周波数ブロックがそれぞれ、非ゼロAC周波数成分を持つかどうかを示すCBPY、CBPu、CBPv、およびCBPDセクションを備えるCBPヘッダ・フィールドと、周波数ブロックの前記すべてのAC成分がゼロである場合に必ずDC差分値のみが含まれることを除き、前記周波数ブロックの前記符号化された周波数値を符号化された順序で含む符号化された周波数成分フィールドとを持つデータ構造を形成することを備えて生成されており、圧縮時に削除されたゼロ値AC成分を、ゼロを加えて置き換えることにより考察対象の前記データ・ストリーム部分を拡大する前記プロセス・アクションは、ゼロ値AC成分が前記符号化された周波数ブロックから削除されていることを前記CBPヘッダが示す場所の周波数ブロックに割り当てられたAC成分の個数に等しくするために必要な個数のゼロを加えるアクションを備えることを特徴とする請求項30に記載のプロセス。
- 前記周波数ブロックおよび前記サブブロックは、8×8ピクセル・ブロックであることを特徴とする請求項30に記載のプロセス。
- 前記非予測Iフレーム圧縮法を使用して圧縮されない1つまたは複数のキー・フレームを含む各フレーム集合に対し時間予測圧縮解除法を使用して各キー・フレームの前記主層を圧縮解除する前記プロセス・アクションは、ピクセル・ディスパリティまたは深度値を前記復元することを含むように修正された前記MPEG4規格のPフレーム圧縮解除方式を使用するアクションを備えることを特徴とする請求項26に記載のプロセス。
- 空間予測圧縮解除法を使用して同時発生の複数のフレームからなる各集合内の各非キー・フレームの前記主層を圧縮解除する前記プロセス・アクションは、
圧縮解除される前記非キー・フレームの前記圧縮時に基準フレームとして使用された同時発生の複数のフレームからなる前記集合内のキー・フレームを識別するアクションと、
YuvD形式のピクセル・データを持つ前記識別されたキー・フレームの圧縮解除バージョンを入力するアクションと、
前記識別されたキー・フレームおよび圧縮解除される前記非キー・フレームをキャプチャするために使用される前記カメラの位置、向き、およびカメラ属性を示すカメラ・パラメータを入力するアクションと、
前記識別されたキー・フレームの深度値(D)の前記ディスパリティと、前記キー・フレームおよび圧縮解除される前記非キー・フレームをキャプチャするために使用される前記カメラの前記カメラ・パラメータとを使用して、圧縮解除される前記非キー・フレームの前記視点に前記識別されたキー・フレームをワープするアクションと、
前記ワープされたキー・フレームの対応する配置のブロック内の前記ピクセルのどれもyuv値を持たないかを示す、前記非キー・フレームのそれぞれの所定のサイズのブロックに対する、モード指定子を備える圧縮解除される前記非キー・フレームに関連付けられている圧縮データを入力するアクションと、
圧縮解除される前記非キー・フレームのブロック毎に、前記ブロックが圧縮された前記順序と一致する所定の順序で考察して、
前記ワープされたキー・フレームの前記対応する配置のブロックが、すべてのピクセルについてYuvD値を持つことを前記ブロックの前記モード指定子が示す場合に必ず、逆DC周波数成分予測ステップがスキップされ、前記DC周波数成分を復号化するためにAC周波数成分復号化テーブルが使用されるIフレーム圧縮解除法の修正バージョンを使用して前記ブロックを復号化し、その後、前記復号化されたブロックの各ピクセルの前記ピクセル値を、前記ワープされたキー・フレームの対応する配置のブロックの対応するピクセル値に加え、
前記ワープされたキー・フレームの前記対応する配置のブロックがYuvD値を持たないピクセルを含むことを前記ブロックの前記モード指定子が示している場合には必ず、DC周波数成分予測フェーズは隣接ブロックのピクセルがすべてYuvD値を持つ場合に前記隣接ブロックに関連付けられる実際の値の代わりに、所定の中間範囲DC周波数成分値を使用するIフレーム圧縮解除法の異なる修正バージョンを使用して、前記ブロックを復号し、
前記復号化されたブロックを前記元の非キー・フレーム内のその位置に対応する前記圧縮解除された非キー・フレーム内の位置に割り当てる
アクションと
を備えることを特徴とする請求項27に記載のプロセス。 - 非予測Iフレーム圧縮解除法を使用して各フレーム集合内の各フレームの前記境界層を圧縮解除する前記プロセス・アクションは、
前記境界層の圧縮時に生成されたデータ・ストリームを入力するアクションと、
前記データ・ストリームに含まれる分類データを復号化するアクションと、
前記境界層の所定のサイズのフレーム・ブロックに対応する前記データ・ストリームの部分毎に、所定の順序で考察して、
前記分類データから、考察対象の前記フレーム・ブロック内に含まれる非透明の所定のサイズのサブブロックがあるかどうかを判別し、
前記フレーム・ブロック内に非透明サブブロックがあると判明した場合には必ず、
(a)前記フレーム・ブロックのこれまで未選択の非透明サブブロックを所定の順序で選択し、
(b)前記選択された非透明サブブロックに対応する圧縮されたDCT周波数ブロック・データを含むデータ・ストリームの一部分を識別し、
(c)ゼロを加えて圧縮時に削除されたゼロ値AC周波数成分を置き換ることにより前記圧縮されたDCT周波数ブロック・データの前記現在識別されている部分を拡大し、
(d)前記拡大された周波数ブロック・データを復号化して、所定のサイズの複数の周波数ブロックの順序付けされたバージョンであって、前記周波数ブロックと同じサイズであるYuv値の形式のピクセル色値、ピクセル・アルファ値(A)、およびピクセル・ディスパリティまたは深度値(D)により特徴付けられたピクセルの符号化されたサブブロックを表すバージョンをリストアし、
(e)圧縮で使用された順序付けパターンの逆を使用して、各周波数ブロックの前記周波数成分を圧縮前のその順序にリストアし、
(f)前記リストアされた周波数ブロックのそれぞれに対し逆DC成分予測手続きを実行して各周波数ブロックの前記元のDC成分の量子化バージョンにリストアし、
(g)前記量子化された周波数ブロックのそれぞれに対し逆量子化手続きを実行して各周波数ブロックの前記元のDC成分に実質的にリストアし、
(h)圧縮時に前記選択されたサブブロックのY、u、v、A、およびDプレーンに対し実行されたDCTの逆を実行して、前記それらの周波数ブロックを出力し、前記プレーンの前記Y、u、v、A、およびD値の近似をリストアし、
(i)圧縮時にダウン・サンプリングされたのと同じ倍率で前記uおよびvプレーンをアップ・サンプリングし、それらを元の所定のプレーン・サイズに戻し、
(j)そのサブブロックに対する前記uおよびvプレーンとして前記選択されたサブブロックに対応する前記アップ・サンプリングされたuおよびvプレーンの前記象限を指定し、
(k)前記選択されたサブブロックの前記Y、u、およびvピクセル値をRGB値に変換し、
(l)前記選択されたサブブロックが部分ブロックとして分類されているかどうかを判別し、
(m)前記選択されたサブブロックが部分ブロックであると判断された場合には必ず、前記サブブロックについて生成され、前記データ・ストリームに含まれる前記圧縮されたバイナリ・マスクを復号化し、前記マスクを前記サブブロックに適用して、前記すべての非不透明ピクセルを透明にし、
(n)考察対象の前記フレーム・ブロック内の前記すべての非透明サブブロックが選択され、処理されるまでアクション(a)から(n)を繰り返し、
すべての透明ピクセルを持つサブブロックを、非透明サブブロックにより占有されていない位置にある考察対象の前記フレーム・ブロックに追加するアクションと
を備えることを特徴とする請求項29に記載のプロセス。 - 分類データを復号化する前記プロセス・アクションは、
圧縮時に前記分類データを圧縮するために使用される前記手続きに適用可能な復号化手続きを適用するアクションと、
逆四分木手続きを実行して、前記境界層の各所定のサイズのブロックに割り当てられた前記カテゴリを取得するアクションとを備えることを特徴とする請求項36に記載のプロセス。 - 圧縮されたバイナリ・マスクを復号化する前記プロセス・アクションは、
圧縮時に前記分類データを圧縮するために使用される前記手続きに適用可能な復号化手続きを適用するアクションと、
逆四分木手続きを実行するアクションと
を備えることを特徴とする請求項36に記載のプロセス。 - 請求項25に記載のプロセス・アクションを実行するためのコンピュータ実行可能命令を備えることを特徴とするコンピュータ可読媒体。
- 同時発生の複数のビデオ・フレームからなる順次集合であって、一つの集合内の前記ビデオ・フレームは、異なる視点から実質的に同じシーンを表し、その各フレームは、ピクセルがピクセル色値およびピクセル・ディスパリティまたは深度値により特徴付けられる主層と、ピクセルがピクセル色値、ピクセル・アルファ値およびピクセル・ディスパリティまたは深度値により特徴付けられる境界層とにより表される順次集合を含むビデオ・データを圧縮解除するシステムであって、前記ビデオ・データは、
前記ビデオ・フレーム集合すべてに共通の1つまたは複数のキー・フレーム位置を、集合内のどのフレームも、指定されたキー・フレーム位置から所定の視点個数分を超えて離れていないように、指定すること、
所定の周期をベースにして、前記第1のビデオ・フレーム集合および他の後続のフレーム集合に対し、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する非予測Iフレーム圧縮法を使用して、キー・フレーム位置視点を示す各フレームの前記主層を圧縮すること、
圧縮される前記主層から前記所定の視点個数以下の個数分だけ離れているキー・フレーム位置フレームの前記主層を基準フレームとして使用し、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する空間予測圧縮法を使用して、キー・フレーム位置視点を示さない各フレームの前記主層を圧縮すること、
前記非予測Iフレーム圧縮法を使用して1つまたは複数のキー・フレーム位置フレームが圧縮される各フレーム集合について、先行するフレーム集合内の同じ視点を示す前記フレームの前記主層からの動き補償推定に基づき、最低でもピクセル色値、さらにはピクセル・ディスパリティまたは深度値を符号化する時間予測法を使用して、キー・フレーム位置視点を示す各フレームの前記主層を圧縮すること、および
最低でもピクセル色値、ピクセル・ディスパリティまたは深度値、およびピクセル・アルファ値を符号化する非予測Iフレーム圧縮法を使用して、各フレーム集合内の各フレームの前記境界層を圧縮すること
により圧縮されており、
前記システムは、
汎用コンピューティング・デバイスと、
前記汎用コンピューティング・デバイスにより実行可能なプログラム・モジュールを含むコンピュータ・プログラムであって、前記コンピューティング・デバイスに、前記コンピュータ・プログラムの前記プログラム・モジュールは、
最低でも前記元のピクセル色値、ピクセル・ディスパリティまたは深度値、およびピクセル・アルファ値の近似を復元する非予測Iフレーム圧縮解除法を使用して、各フレーム集合内の各フレームの前記境界層を圧縮解除し、
前記第1のビデオ・フレーム集合および他の周期的な後続のフレーム集合に対し、最低でも前記元のピクセル色値、さらにはピクセル・ディスパリティまたは深度値の近似を復元する非予測Iフレーム圧縮解除法を使用して、キー・フレーム位置視点を示す各フレームの前記主層を圧縮解除し、
圧縮解除される前記主層から前記所定の視点個数以下の個数分だけ離れているキー・フレーム位置フレームの前記主層を、基準フレームとして使用し、最低でも前記元のピクセル色値およびピクセル・ディスパリティまたは深度値の近似を復元する空間予測圧縮解除法を使用して、キー・フレーム位置視点を示さない各フレームの前記主層を圧縮解除し、
前記非予測Iフレーム圧縮法を使用して圧縮されない1つまたは複数のキー・フレーム位置フレームを含む各フレーム集合について、先行するフレーム集合内の同じ視点を示す前記フレームの前記主層からの動き補償推定を採用し、最低でも前記元のピクセル色値およびピクセル・ディスパリティまたは深度値の近似を復元する、時間予測圧縮解除法を使用して、キー・フレーム位置視点を示す各フレームの前記主層を圧縮解除する
よう指令するコンピュータ・プログラムと
を備えることを特徴とするシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/910,077 US7561620B2 (en) | 2004-08-03 | 2004-08-03 | System and process for compressing and decompressing multiple, layered, video streams employing spatial and temporal encoding |
US10/910,077 | 2004-08-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006067571A true JP2006067571A (ja) | 2006-03-09 |
JP4878451B2 JP4878451B2 (ja) | 2012-02-15 |
Family
ID=35203351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005222022A Active JP4878451B2 (ja) | 2004-08-03 | 2005-07-29 | 空間および時間符号化を使用して複数の階層化ビデオ・ストリームの圧縮および圧縮解除を行うためのシステムおよびプロセス |
Country Status (3)
Country | Link |
---|---|
US (4) | US7561620B2 (ja) |
EP (1) | EP1624675B1 (ja) |
JP (1) | JP4878451B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100803862B1 (ko) | 2006-09-29 | 2008-02-14 | 주식회사 팬택앤큐리텔 | 이종 네트워크 환경에서 수직적 핸드오프시의 비디오 전송중단을 방지하기 위한 비디오 전송방법 |
KR101452862B1 (ko) * | 2013-04-02 | 2014-10-23 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
US8953682B2 (en) | 2009-08-14 | 2015-02-10 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
JP2015521445A (ja) * | 2012-06-01 | 2015-07-27 | アルカテル−ルーセント | ビデオストリームを符号化するための方法および装置 |
JP2016519501A (ja) * | 2013-04-05 | 2016-06-30 | ブリティッシュ・ブロードキャスティング・コーポレーションBritish Broadcasting Corporation | 合成画像の送信および受信 |
Families Citing this family (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4501631B2 (ja) * | 2004-10-26 | 2010-07-14 | 日本電気株式会社 | 画像符号化装置及び方法、画像符号化装置のコンピュータ・プログラム、並びに携帯端末 |
WO2006067731A1 (en) * | 2004-12-22 | 2006-06-29 | Koninklijke Philips Electronics N.V. | Video stream modifier |
KR100779875B1 (ko) * | 2005-01-14 | 2007-11-27 | 주식회사 휴맥스 | 다-시점 코딩을 위한 참조 프레임 순서 설정 방법 및 그방법을 기록한 기록매체 |
EP1900216A2 (en) * | 2005-05-12 | 2008-03-19 | Tenebraex Corporation | Improved methods of creating a virtual window |
US8189908B2 (en) * | 2005-09-02 | 2012-05-29 | Adobe Systems, Inc. | System and method for compressing video data and alpha channel data using a single stream |
WO2007081713A1 (en) * | 2006-01-09 | 2007-07-19 | Thomson Licensing | Method and apparatus for providing reduced resolution update mode for multi-view video coding |
KR100754205B1 (ko) * | 2006-02-07 | 2007-09-03 | 삼성전자주식회사 | 다시점 동영상 부호화 장치 및 방법 |
US8295349B2 (en) * | 2006-05-23 | 2012-10-23 | Flextronics Ap, Llc | Methods and apparatuses for video compression intra prediction mode determination |
KR101311403B1 (ko) * | 2006-07-04 | 2013-09-25 | 삼성전자주식회사 | 영상의 부호화 방법 및 장치, 복호화 방법 및 장치 |
US8446509B2 (en) * | 2006-08-09 | 2013-05-21 | Tenebraex Corporation | Methods of creating a virtual window |
US8582658B2 (en) * | 2007-05-11 | 2013-11-12 | Raritan Americas, Inc. | Methods for adaptive video quality enhancement |
US20080316221A1 (en) * | 2007-06-19 | 2008-12-25 | Aas Eric F | Down-sampled image display |
US8266251B2 (en) * | 2007-07-30 | 2012-09-11 | Nec Corporation | Communication terminal, distribution system, method for conversion and program |
US20090060043A1 (en) * | 2007-08-29 | 2009-03-05 | Geert Nuyttens | Multiviewer based on merging of output streams of spatio scalable codecs in a compressed domain |
TW200910937A (en) * | 2007-08-29 | 2009-03-01 | Imagia Technologies Co Ltd | The generation device of continuous crisscross scenes |
US8127233B2 (en) * | 2007-09-24 | 2012-02-28 | Microsoft Corporation | Remote user interface updates using difference and motion encoding |
US20090290033A1 (en) * | 2007-11-16 | 2009-11-26 | Tenebraex Corporation | Systems and methods of creating a virtual window |
WO2009064504A1 (en) * | 2007-11-16 | 2009-05-22 | Tenebraex Corporation | Systems and methods of creating a virtual window |
US8791984B2 (en) * | 2007-11-16 | 2014-07-29 | Scallop Imaging, Llc | Digital security camera |
WO2009108028A1 (ko) * | 2008-02-28 | 2009-09-03 | 엘지전자(주) | 자유시점 영상 복호화 방법 및 장치 |
EP2266322A2 (en) * | 2008-04-25 | 2010-12-29 | Thomson Licensing | Coding of depth signal |
WO2009139569A2 (ko) * | 2008-05-13 | 2009-11-19 | 엘지전자(주) | 비디오 신호 디코딩 방법 및 장치 |
KR101591085B1 (ko) * | 2008-05-19 | 2016-02-02 | 삼성전자주식회사 | 영상 파일 생성 및 재생 장치 및 방법 |
FR2933565A1 (fr) * | 2008-07-01 | 2010-01-08 | France Telecom | Procede et dispositif de codage d'une sequence d'images mettant en oeuvre une prediction temporelle, signal, support de donnees, procede et dispositif de decodage, et produit programme d'ordinateur correspondants |
CN102124742B (zh) | 2008-08-20 | 2013-09-11 | 汤姆逊许可公司 | 精制深度图 |
EP2348733A4 (en) * | 2008-10-27 | 2012-09-12 | Lg Electronics Inc | METHOD AND APPARATUS FOR THE SYNTHESIS OF VIRTUAL VISUALIZATION IMAGES |
US8125524B2 (en) * | 2008-12-12 | 2012-02-28 | Nxp B.V. | System and method for the detection of de-interlacing of scaled video |
CN102272778B (zh) | 2009-01-07 | 2015-05-20 | 汤姆森特许公司 | 联合深度估计 |
WO2010092740A1 (ja) * | 2009-02-10 | 2010-08-19 | パナソニック株式会社 | 画像処理装置、画像処理方法、プログラムおよび集積回路 |
US8164617B2 (en) * | 2009-03-25 | 2012-04-24 | Cisco Technology, Inc. | Combining views of a plurality of cameras for a video conferencing endpoint with a display wall |
US8761268B2 (en) * | 2009-04-06 | 2014-06-24 | Intel Corporation | Selective local adaptive wiener filter for video coding and decoding |
US20110069148A1 (en) * | 2009-09-22 | 2011-03-24 | Tenebraex Corporation | Systems and methods for correcting images in a multi-sensor system |
KR101365329B1 (ko) * | 2009-11-23 | 2014-03-14 | 제너럴 인스트루먼트 코포레이션 | 비디오 시퀀스로의 추가 채널로서의 깊이 코딩 |
KR20110064722A (ko) * | 2009-12-08 | 2011-06-15 | 한국전자통신연구원 | 영상 처리 정보와 컬러 정보의 동시 전송을 위한 코딩 장치 및 방법 |
US9253447B2 (en) * | 2009-12-29 | 2016-02-02 | Kodak Alaris Inc. | Method for group interactivity |
KR101628383B1 (ko) * | 2010-02-26 | 2016-06-21 | 연세대학교 산학협력단 | 영상 처리 장치 및 방법 |
US8601056B2 (en) * | 2010-03-09 | 2013-12-03 | Avistar Communications Corporation | Scalable high-performance interactive real-time media architectures for virtual desktop environments |
KR101289269B1 (ko) * | 2010-03-23 | 2013-07-24 | 한국전자통신연구원 | 영상 시스템에서 영상 디스플레이 장치 및 방법 |
US8538177B2 (en) | 2010-07-30 | 2013-09-17 | Microsoft Corporation | Line and pixel based methods for intra frame coding |
CN103636228A (zh) * | 2011-04-28 | 2014-03-12 | 三星电子株式会社 | 用于调整无线通信系统中的数据发送速率的方法和设备 |
KR101569602B1 (ko) * | 2011-05-05 | 2015-11-16 | 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 | 렌즈형 지향성 디스플레이 |
US9460551B2 (en) * | 2011-08-10 | 2016-10-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for creating a disocclusion map used for coding a three-dimensional video |
CN104883576B (zh) * | 2011-08-29 | 2017-11-14 | 苗太平洋控股有限公司 | 以amvp模式产生预测区块的方法 |
US8872895B2 (en) * | 2011-09-30 | 2014-10-28 | Deutsche Telekom Ag | Real-time video coding using graphics rendering contexts |
US8928969B2 (en) | 2011-12-06 | 2015-01-06 | Ostendo Technologies, Inc. | Spatio-optical directional light modulator |
US8854724B2 (en) | 2012-03-27 | 2014-10-07 | Ostendo Technologies, Inc. | Spatio-temporal directional light modulator |
KR20130074383A (ko) * | 2011-12-26 | 2013-07-04 | 삼성전자주식회사 | 다중-레이어 표현을 사용하는 영상 처리 방법 및 장치 |
US9152303B2 (en) | 2012-03-01 | 2015-10-06 | Harris Corporation | Systems and methods for efficient video analysis |
US9311518B2 (en) | 2012-03-01 | 2016-04-12 | Harris Corporation | Systems and methods for efficient comparative non-spatial image data analysis |
US9135338B2 (en) | 2012-03-01 | 2015-09-15 | Harris Corporation | Systems and methods for efficient feature based image and video analysis |
US20130271565A1 (en) * | 2012-04-16 | 2013-10-17 | Qualcomm Incorporated | View synthesis based on asymmetric texture and depth resolutions |
US9860555B2 (en) * | 2012-05-22 | 2018-01-02 | Lg Electronics Inc. | Method and apparatus for processing video signal |
US9448064B2 (en) | 2012-05-24 | 2016-09-20 | Qualcomm Incorporated | Reception of affine-invariant spatial mask for active depth sensing |
US9767598B2 (en) | 2012-05-31 | 2017-09-19 | Microsoft Technology Licensing, Llc | Smoothing and robust normal estimation for 3D point clouds |
US9846960B2 (en) | 2012-05-31 | 2017-12-19 | Microsoft Technology Licensing, Llc | Automated camera array calibration |
US20130321564A1 (en) | 2012-05-31 | 2013-12-05 | Microsoft Corporation | Perspective-correct communication window with motion parallax |
US9179126B2 (en) | 2012-06-01 | 2015-11-03 | Ostendo Technologies, Inc. | Spatio-temporal light field cameras |
US9979960B2 (en) | 2012-10-01 | 2018-05-22 | Microsoft Technology Licensing, Llc | Frame packing and unpacking between frames of chroma sampling formats with different chroma resolutions |
US8976224B2 (en) | 2012-10-10 | 2015-03-10 | Microsoft Technology Licensing, Llc | Controlled three-dimensional communication endpoint |
KR20140121315A (ko) | 2013-04-04 | 2014-10-15 | 한국전자통신연구원 | 참조 픽처 리스트를 이용한 다 계층 기반의 영상 부호화/복호화 방법 및 그 장치 |
RU2652099C2 (ru) | 2013-07-05 | 2018-04-25 | Сони Корпорейшн | Устройство передачи, способ передачи, устройство приема и способ приема |
US9418469B1 (en) * | 2013-07-19 | 2016-08-16 | Outward, Inc. | Generating video content |
US9392293B2 (en) * | 2014-05-21 | 2016-07-12 | Alcatel Lucent | Accelerated image processing |
KR20160031717A (ko) * | 2014-09-15 | 2016-03-23 | 삼성전자주식회사 | 전면 송풍방식 공기조화장치 |
US10521472B2 (en) * | 2015-02-27 | 2019-12-31 | Realnetworks, Inc. | Composing media stories method and system |
US10204449B2 (en) * | 2015-09-01 | 2019-02-12 | Siemens Healthcare Gmbh | Video-based interactive viewing along a path in medical imaging |
US10045023B2 (en) * | 2015-10-09 | 2018-08-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Cross component prediction in video coding |
US10277921B2 (en) * | 2015-11-20 | 2019-04-30 | Nvidia Corporation | Hybrid parallel decoder techniques |
EP3273686A1 (en) | 2016-07-21 | 2018-01-24 | Thomson Licensing | A method for generating layered depth data of a scene |
JP6894687B2 (ja) * | 2016-10-11 | 2021-06-30 | キヤノン株式会社 | 画像処理システム、画像処理装置、制御方法、及び、プログラム |
US10368080B2 (en) | 2016-10-21 | 2019-07-30 | Microsoft Technology Licensing, Llc | Selective upsampling or refresh of chroma sample values |
CN109348226B (zh) * | 2017-04-08 | 2022-11-11 | 腾讯科技(深圳)有限公司 | 一种图片文件处理方法及智能终端 |
US10636201B2 (en) * | 2017-05-05 | 2020-04-28 | Disney Enterprises, Inc. | Real-time rendering with compressed animated light fields |
CN108121973A (zh) * | 2017-12-25 | 2018-06-05 | 江苏易乐网络科技有限公司 | 基于主成分分析的运动捕捉数据关键帧提取方法 |
US10417806B2 (en) * | 2018-02-15 | 2019-09-17 | JJK Holdings, LLC | Dynamic local temporal-consistent textured mesh compression |
EP3756163B1 (en) * | 2018-02-23 | 2022-06-01 | Sony Group Corporation | Methods, devices, and computer program products for gradient based depth reconstructions with robust statistics |
CN110881140B (zh) * | 2018-09-05 | 2022-01-21 | 北京高德云图科技有限公司 | 从视频中截取图片的方法、装置及嵌入式设备、存储介质 |
WO2020072665A1 (en) * | 2018-10-02 | 2020-04-09 | Futurewei Technologies, Inc. | Hierarchical tree attribute coding in point cloud coding |
US11228790B2 (en) * | 2018-11-30 | 2022-01-18 | Kt Corporation | Providing time slice video |
US10896523B2 (en) * | 2019-04-01 | 2021-01-19 | Microsoft Technology Licensing, Llc | Depth image compression |
EP3745706B1 (en) | 2019-05-29 | 2021-06-30 | Axis AB | System and method for video processing with picture stabilization and predictive compression |
KR102680385B1 (ko) * | 2019-10-30 | 2024-07-02 | 삼성전자주식회사 | 멀티 렌즈 영상 복원 장치 및 방법 |
CN111246217B (zh) * | 2020-01-19 | 2022-02-01 | 中国石油大学(华东) | 基于八度卷积的压缩视频动作识别方法 |
CN111654706B (zh) * | 2020-05-06 | 2022-06-28 | 山东浪潮科学研究院有限公司 | 一种视频压缩方法、装置、设备及介质 |
US11941752B2 (en) * | 2020-07-21 | 2024-03-26 | Nvidia Corporation | Streaming a compressed light field |
CN111800653B (zh) * | 2020-07-29 | 2021-06-11 | 北京大学深圳研究生院 | 视频解码方法、系统、设备及计算机可读存储介质 |
CN112040248B (zh) * | 2020-08-31 | 2022-04-29 | 重庆锐明信息技术有限公司 | 视频压缩方法、系统、终端设备及存储介质 |
US11501467B2 (en) * | 2020-11-03 | 2022-11-15 | Nvidia Corporation | Streaming a light field compressed utilizing lossless or lossy compression |
CN112104869B (zh) * | 2020-11-10 | 2021-02-02 | 光谷技术有限公司 | 一种视频大数据存储及转码优化系统 |
WO2022109916A1 (zh) * | 2020-11-26 | 2022-06-02 | 深圳市大疆创新科技有限公司 | 图像编码方法、解码方法、装置、图像处理系统、可移动平台、图传系统及存储介质 |
CN115037936A (zh) * | 2021-03-04 | 2022-09-09 | 华为技术有限公司 | 视频编解码方法及装置 |
CN115134629B (zh) * | 2022-05-23 | 2023-10-31 | 阿里巴巴(中国)有限公司 | 视频传输方法、系统、设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09182083A (ja) * | 1995-12-27 | 1997-07-11 | Matsushita Electric Ind Co Ltd | ビデオ画像符号化方法及び復号化方法とその装置 |
IT1313382B1 (it) * | 1999-03-18 | 2002-07-23 | St Microelectronics Srl | Stima del moto ricorsiva spazio temporale con sottocampionamento ad 1/2 di macroblocco e ad 1/4 di pixel |
US7050503B2 (en) * | 1999-04-17 | 2006-05-23 | Pts Corporation | Segment-based encoding system using residue coding by basis function coefficients |
US6700933B1 (en) * | 2000-02-15 | 2004-03-02 | Microsoft Corporation | System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding |
US6693964B1 (en) * | 2000-03-24 | 2004-02-17 | Microsoft Corporation | Methods and arrangements for compressing image based rendering data using multiple reference frame prediction techniques that support just-in-time rendering of an image |
GB2364459B (en) * | 2000-06-30 | 2004-03-31 | Nokia Mobile Phones Ltd | Video error resilience |
CN1992895B (zh) * | 2002-04-19 | 2010-12-08 | 松下电器产业株式会社 | 图像编码方法及图像编码装置 |
US7418190B2 (en) * | 2002-08-22 | 2008-08-26 | Microsoft Corporation | Accelerated access to frames from a compressed digital video stream without keyframes |
US7426306B1 (en) * | 2002-10-24 | 2008-09-16 | Altera Corporation | Efficient use of keyframes in video compression |
US20050185711A1 (en) * | 2004-02-20 | 2005-08-25 | Hanspeter Pfister | 3D television system and method |
US7292257B2 (en) * | 2004-06-28 | 2007-11-06 | Microsoft Corporation | Interactive viewpoint video system and process |
-
2004
- 2004-08-03 US US10/910,077 patent/US7561620B2/en not_active Expired - Fee Related
-
2005
- 2005-03-31 US US11/097,533 patent/US7702016B2/en active Active
- 2005-07-15 US US11/182,144 patent/US8098728B2/en not_active Expired - Fee Related
- 2005-07-29 JP JP2005222022A patent/JP4878451B2/ja active Active
- 2005-08-02 EP EP05107129.8A patent/EP1624675B1/en active Active
-
2012
- 2012-01-11 US US13/348,262 patent/US8774274B2/en not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100803862B1 (ko) | 2006-09-29 | 2008-02-14 | 주식회사 팬택앤큐리텔 | 이종 네트워크 환경에서 수직적 핸드오프시의 비디오 전송중단을 방지하기 위한 비디오 전송방법 |
US8953682B2 (en) | 2009-08-14 | 2015-02-10 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9307238B2 (en) | 2009-08-14 | 2016-04-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9313490B2 (en) | 2009-08-14 | 2016-04-12 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9313489B2 (en) | 2009-08-14 | 2016-04-12 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9374579B2 (en) | 2009-08-14 | 2016-06-21 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
JP2015521445A (ja) * | 2012-06-01 | 2015-07-27 | アルカテル−ルーセント | ビデオストリームを符号化するための方法および装置 |
KR101452862B1 (ko) * | 2013-04-02 | 2014-10-23 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
JP2016519501A (ja) * | 2013-04-05 | 2016-06-30 | ブリティッシュ・ブロードキャスティング・コーポレーションBritish Broadcasting Corporation | 合成画像の送信および受信 |
Also Published As
Publication number | Publication date |
---|---|
US7702016B2 (en) | 2010-04-20 |
EP1624675B1 (en) | 2020-04-22 |
US20060031915A1 (en) | 2006-02-09 |
JP4878451B2 (ja) | 2012-02-15 |
US8774274B2 (en) | 2014-07-08 |
EP1624675A1 (en) | 2006-02-08 |
US7561620B2 (en) | 2009-07-14 |
US20120114037A1 (en) | 2012-05-10 |
US8098728B2 (en) | 2012-01-17 |
US20060029134A1 (en) | 2006-02-09 |
US20060031917A1 (en) | 2006-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4878451B2 (ja) | 空間および時間符号化を使用して複数の階層化ビデオ・ストリームの圧縮および圧縮解除を行うためのシステムおよびプロセス | |
Smolic et al. | Coding algorithms for 3DTV—a survey | |
Shum et al. | Survey of image-based representations and compression techniques | |
US7324594B2 (en) | Method for encoding and decoding free viewpoint videos | |
Pavez et al. | Dynamic polygon clouds: representation and compression for VR/AR | |
JPH10271511A (ja) | 画像符号化装置と画像復号化装置 | |
Chou et al. | Dynamic polygon clouds: Representation and compression for VR/AR | |
US20240040101A1 (en) | Method and device for compressing data representative of a volumetric three-dimensional scene with a view to real-time decompression for online viewing | |
Muller et al. | Compressing time-varying visual content | |
Shum et al. | Virtual reality using the concentric mosaic: Construction, rendering and data compression | |
Ng et al. | A multi-camera approach to image-based rendering and 3-D/multiview display of ancient chinese artifacts | |
CN117242480A (zh) | 使用几何信息和语义信息的曼哈顿布局估计 | |
Chai et al. | A depth map representation for real-time transmission and view-based rendering of a dynamic 3D scene | |
CA3232434A1 (en) | Point cloud data frames compression | |
Chen et al. | patchVVC: A real-time compression framework for streaming volumetric videos | |
JP2000285260A (ja) | 多視点画像の符号化方法及び任意視点画像の生成方法 | |
Naik et al. | Surface lightfield support in video-based point cloud coding | |
CN112806015A (zh) | 全向视频的编码和解码 | |
Park et al. | Efficient depth compression based on partial surface for 3-D object represented by layered depth image | |
Kauff et al. | Data format and coding for free viewpoint video | |
Pratapa et al. | RLFC: Random access light field compression using key views | |
Yoon et al. | Inter-camera coding of multi-view video using layered depth image representation | |
Park et al. | Depth compression of 3D object represented by layered depth image | |
Würmlin et al. | Dynamic point samples for free-viewpoint video | |
Yoon et al. | Color data coding for three-dimensional mesh models considering connectivity and geometry information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110415 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20110602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111122 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4878451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |