JP5590574B2 - 多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算 - Google Patents
多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算 Download PDFInfo
- Publication number
- JP5590574B2 JP5590574B2 JP2012120308A JP2012120308A JP5590574B2 JP 5590574 B2 JP5590574 B2 JP 5590574B2 JP 2012120308 A JP2012120308 A JP 2012120308A JP 2012120308 A JP2012120308 A JP 2012120308A JP 5590574 B2 JP5590574 B2 JP 5590574B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- horizontal
- base layer
- vertical
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012952 Resampling Methods 0.000 title description 31
- 238000000034 method Methods 0.000 claims description 183
- 238000005070 sampling Methods 0.000 claims description 30
- 238000003860 storage Methods 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 8
- 238000009795 derivation Methods 0.000 claims 6
- 230000003416 augmentation Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 72
- 239000010410 layer Substances 0.000 description 60
- 230000008569 process Effects 0.000 description 55
- 230000033001 locomotion Effects 0.000 description 54
- 238000013461 design Methods 0.000 description 36
- 238000013459 approach Methods 0.000 description 25
- 238000012545 processing Methods 0.000 description 21
- 230000006835 compression Effects 0.000 description 16
- 238000007906 compression Methods 0.000 description 16
- 238000013139 quantization Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 230000000750 progressive effect Effects 0.000 description 15
- 230000002829 reductive effect Effects 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- 238000001914 filtration Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000008520 organization Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000006837 decompression Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000007670 refining Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001010 compromised effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 101100382264 Mus musculus Ca14 gene Proteins 0.000 description 1
- 101100112373 Mus musculus Ctsm gene Proteins 0.000 description 1
- 101100094962 Salmo salar salarin gene Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/16—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234327—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234354—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering signal-to-noise ratio parameters, e.g. requantization
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/647—Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
- H04N21/64784—Data processing by the network
- H04N21/64792—Controlling the complexity of the content stream, e.g. by dropping packets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/01—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
- H04N7/0102—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving the resampling of the incoming video signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Television Systems (AREA)
Description
もに、デジタルメディアが当たり前のものになってきた。手法者は、様々な手法を使用し
て、品質をそのまま維持しながらデジタルオーディオ、デジタルビデオ、およびデジタル
画像を効率よく処理する。これらの手法を理解するために、オーディオ、ビデオ、および
画像情報がコンピュータ内でどのように表現され、処理されるかを理解するのは有益なこ
とである。
コンピュータは、メディア情報をその情報を表す一連の数値として処理する。例えば、
単一の数値で、画像のそれぞれの基本的な小領域に対する輝度または赤色、緑色、または
青色の色成分の強度を表すことができ、したがって画像のデジタル表現は、このような数
値の1つまたは複数の配列からなる。それぞれのこのような数値は、サンプルと呼ばれう
る。カラー画像の場合、それぞれの画素の色を表すために複数のサンプルを使用するのが
習慣であり、典型的には、3つのサンプルが使用される。要素領域に対するこれらのサン
プルの集合は、ピクセルと呼ぶことができるが、「ピクセル」という単語は、「画素」と
いう概念を指し示す略語である。例えば、1ピクセルは、要素領域を表現するのに必要な
赤色、緑色、青色の光の強度を表す3つのサンプルで構成されうる。このようなピクセル
タイプは、RGBピクセルと呼ばれる。複数の因子が、サンプル深度、解像度、およびフ
レームレート(ビデオの場合)を含む、メディア情報の品質に影響を及ぼす。
通常測定される特性である。サンプルに対しさらに多くの値を使用できる場合、数値で捕
捉できる強度の微妙な変化が増え、および/または値の範囲が広がるため、品質を高める
ことができる。解像度は、一般に、ある継続時間(オーディオ用)または空間(画像また
は個々の映像用)におけるサンプルの数を意味する。画像は空間解像度が高いほど、他の
画像よりも明瞭に見え、より識別しやすい有益な細部を含むように見える。フレームレー
トは、ビデオの時間解像度に対する一般的な用語である。ビデオはフレームレートが高い
ほど、他のビデオに比べて自然物の動きをより滑らかに再現する傾向があり、同様に、時
間次元においてより精細な細部を含むと考えられる。これらすべての因子について、高品
質に対するトレードオフは、表1に示されているようにサンプル深度、解像度およびフレ
ームレートを表すのに必要なビットレートに関して示されている情報を格納し、送信する
コストである。
にもかかわらず、企業も消費者も、高品質なコンテンツを作成し、配信し、再生するのに
コンピュータにますます依存するようになってきている。このような理由から、手法者は
、圧縮(ソースコーディング(source coding)またはソース符号化とも呼ばれる)を使
用して、デジタルメディアのビットレートを削減する。圧縮は、情報をより低いビットレ
ート形式に変換することにより情報を格納し、送信するコストを低減する。圧縮は、可逆
とすることができ、この場合、ビデオの品質は損なわれないが、ビットレートの低減は、
ビデオの複雑度により制限される。あるいは、圧縮は、不可逆とすることができ、ビデオ
の品質は損なわれるが、ビットレートの低減は、より劇的である。圧縮解除(復号化とも
呼ばれる)では、圧縮形式からあるバージョンの元情報を再構成する。「コーデック」は
、符号器/復号器システムである。
縮または予測圧縮を含む。映像については、イントラ圧縮手法で、個々の画像を圧縮する
。インター圧縮手法では、先行および/または後続の画像を参照して画像を圧縮する。
標準ビデオ符号器では、目標ビットレートが特定の閾値よりも低い場合に性能が劇的に
低下する。量子化および他の不可逆処理段において、歪みを生じる。低ビットレートでは
、高周波情報は、大きく歪むか、または完全に失われることがある。その結果、著しいア
ーチファクトが発生し、再構成されたビデオの品質の実質的低下を引き起こす。利用可能
なビットレートは、伝送および処理手法が改善するにつれ増大するけれども、制約された
ビットレートで高い視覚的品質を維持することが、いぜんとしてビデオコーデック設計の
主要目標である。既存のコーデックでは、制約されたビットレートで視覚的品質を改善す
るために複数の方法を利用する。
ことができる。解像度を落としたビデオは、情報が失われるのと引き替えに、実質的に低
いビットレートで符号化されうる。例えば、事前ビデオ符号器(prior video encoder)
は、(ダウンダンプリングフィルタを使用して)最大解像度(フルレゾ)ビデオをダウン
サンプリングし、垂直および/または水平方向に解像度を落として符号化することができ
る。それぞれの方向の解像度を半分に減らすと、符号化された画像サイズの寸法が半分に
なる。符号器は、解像度を落とした符号化信号を復号器に送る。復号器は、解像度を落と
した符号化であることを示す情報を受け取り、受け取った情報から、表示する前に画像サ
イズを増大するのに解像度を落としたビデオを(アップサンプリングフィルタを使用して
)どのようにアップサンプリングするかについて確認する。しかし、符号器がビデオ画像
をダウンサンプリングしたときには、符号化したときに失われた情報は、アップサンプリ
ングされた画像から依然としてなくなっている。
チを使用して、これにより、符号器は、1つまたは複数のエンハンスメントレイヤ(拡張
階層:enhancement layer)におけるソースビデオから高解像度の情報を保持しながらベ
ースレイヤ(基層)における空間解像度(したがってビットレート)を低減することがで
きる。例えば、ベースレイヤイントラ画像は、解像度を落として符号化されうるが、随伴
するエンハンスメントレイヤイントラ画像は、高解像度で符号化されうる。同様に、ベー
スレイヤ予測画像には、エンハンスメントレイヤ予測画像が随伴しうる。復号器は、(ビ
ットレート制約条件および/または他の基準に基づき)低解像度再構成画像を得るために
低解像度でベースレイヤ画像のみを復号化すること、または高解像度再構成画像を得るた
めにベースレイヤとエンハンスメントレイヤ画像を復号化することを選択することができ
る。ベースレイヤが、表示される画像よりも低い解像度で符号化される場合(ダウンサン
プリングとも呼ばれる)、符号化された画像サイズは、表示される画像よりも実際に小さ
い。復号器は、再構成される画像のサイズを変更するために計算を実行し、アップサンプ
リングフィルタを使用して再構成される画像内の適切な位置に補間されたサンプル値を生
成する。
なアップサンプリングフィルタと、不正確な、または(計算時間もしくはビットレートに
関して)高コストの画像サイズ変更手法に悩んでいる。
デオ圧縮および圧縮解除は、十分に開発の進んでいる分野であることは驚くべきことでは
ない。しかし、以前のビデオ圧縮および圧縮解除手法には、どのような利点があろうと、
以下に説明する本発明の手法およびツールの利点を有していない。
れる簡素化された形式の概念の選択を導入する。この「発明の開示」は、請求されている
主題の鍵となる特徴または本質的特徴を明示することを意図しておらず、また請求されて
いる主題の範囲を制限するために使用されることも意図していない。
ケーラブルなビデオ符号化および復号化用の様々な手法およびツールを対象とする。
化および復号化などのアプリケーションにおける画像サイズ変更のための高精度の位置計
算を行うための様々な手法およびツールを対象とする。空間的スケーラブルなビデオ符号
化および復号化などのアプリケーションにおける画像サイズ変更のための高精度の位置計
算を行うための手法およびツールについて説明する。一態様では、映像の再サンプリング
は、再サンプリングスケール係数に応じて実行される。再サンプリングは、再サンプリン
グ配列内の位置i、jにおけるサンプル値の計算を含む。この計算処理は、一部は2n値
にアップサンプリングスケール係数の逆数(近似値または厳密な値)を乗算する(か、ま
たは2n値をアップサンプリングスケール係数またはアップサンプリングスケール係数の
近似値で除算する)ことにより値を近似することを伴う仕方により導出された水平または
垂直のサブサンプル位置(sub-sample position)xまたはyを計算することを含む。指
数nは、小数部のビット数を表す整数Fを含む2つの整数の和としてよい。この近似は、
近い整数に近似するシーリング関数またはフロア関数などの、丸めまたは他の何らかの種
類の近似とすることができる。サンプル値は、フィルタを使用して補間される。
位置計算プロセスまたはその複雑度を著しく変えることなく計算の中に約1エクストラビ
ット(エキストラビット;extra bit)の精度を用意する変更されたサンプル位置計算を
行う。説明されている手法のさらにいくつかの代替え手段は、4:2:2および4:4:
4のサンプリング構造でサンプル位置計算が動作する仕方に関係する。このようなサンプ
リング構造に対するこれらの代替え手法では、色度および輝度サンプリンググリッドの解
像度が特定の次元において同じである場合に必ず輝度および色度サンプル位置計算を一緒
にロックする。
細な説明から明白になる。
号化および復号化用の手法およびツールを対象とする。
これらの手法およびツールの一部は、併用することができる(例えば、組み合わされた符
号化および/または復号化プロセスの異なるフェーズで)。
いる様々な処理活動を少数の活動にまとめたり、またはさらに多くの活動に分けたりする
ことができる。単純にするため、特定の流れ図に示されている活動と別のところで説明さ
れている活動との関係は、しばしば示されていない。多くの場合、流れ図内の動作は、順
序変更することができる。
および復号化を取りあげている。ビデオ情報の表現、符号化、および復号化について本明
細書で説明されている手法およびツールは、オーディオ情報、静止画情報、または他のメ
ディア情報に適用されうる。
図1は、説明されている実施形態のうちの複数を実装できる好適なコンピュータ環境1
00の一般化された実施形態を例示している。これらの手法およびツールは多様な汎用ま
たは専用コンピュータ環境に実装できるため、コンピュータ環境100は、使用または機
能性の範囲に関する制限を示唆する意図はない。
びメモリ120を備える。図1で、この最も基本的な構成130は、破線で囲まれている
。処理装置110は、コンピュータ実行可能命令を実行し、実プロセッサでも、仮想プロ
セッサでもよい。マルチプロセッシングシステムでは、処理能力を高めるため、複数の処
理装置がコンピュータ実行可能命令を実行する。メモリ120は、揮発性メモリ(例えば
、レジスタ、キャッシュ、RAM)、不揮発性メモリ(例えば、ROM、EEPROM、
フラッシュメモリなど)、またはこれら2つの何らかの組合せとすることができる。メモ
リ120は、説明されている手法およびツールのうちの1つまたは複数を使ってビデオ符
号器または復号器を実装するソフトウェア180を格納する。
0は、記憶装置140、1つまたは複数の入力デバイス150、1つまたは複数の出力デ
バイス160、および1つまたは複数の通信接続170を含む。バス、コントローラ、ま
たはネットワークなどの相互接続メカニズム(図に示されていない)は、コンピュータ環
境100のコンポーネントを相互接続する。通常、オペレーティングシステムソフトウェ
ア(図に示されていない)は、コンピュータ環境100内で他のソフトウェアを実行する
ためのオペレーティング環境を提供し、コンピュータ環境100のコンポーネントの動作
を調整する。
ク、磁気テープまたはカセット、CD−ROM、DVD、フラッシュメモリ、または情報
を格納するために使用することができ、コンピュータ環境100内でアクセスできるその
他の媒体を含む。記憶装置140は、ビデオ符号器または復号器を実装するソフトウェア
180の命令を格納する。
たはトラックボールなどの接触入力デバイス、音声入力デバイス、スキャニングデバイス
、またはコンピュータ環境100に入力を行う他のデバイスとすることができる。オーデ
ィオまたはビデオ符号化については、(複数の)入力デバイス150は、サウンドカード
、ビデオカード、TVチューナーカード、または、アナログもしくはデジタル形式のオー
ディオまたはビデオ入力、またはコンピュータ環境100内にオーディオまたはビデオサ
ンプルを読み込むCD−ROM、CD−RW、またはDVDのオーディオまたはビデオ入
力を受け入れる類似のデバイスとすることができる。(複数の)出力デバイス160は、
ディスプレイ、プリンタ、スピーカ、CDもしくはDVDライター、またはコンピュータ
環境100からの出力を供給する他のデバイスとすることができる。
通信することが可能である。通信媒体は、コンピュータ実行可能命令、オーディオまたは
ビデオ入力もしくは出力、または変調データ信号内の他のデータなどの情報を伝達する。
変調データ信号は、信号内の情報を符号化する仕方でその特性のうち1つまたは複数が設
定または変更された信号である。例えば、限定はしないが、通信媒体は、電気的搬送波、
光学的搬送波、RF搬送波、赤外線搬送波、音響搬送波、またはその他の搬送波により実
装された有線または無線手法を含む。
うる。コンピュータ可読媒体は、コンピュータ環境内でアクセスできる入手可能な媒体で
ある。例えば、限定はしないが、コンピュータ環境100では、コンピュータ可読媒体は
、メモリ120、記憶装置140、通信媒体、およびこれらのどれかの組合せを含む。
プロセッサ上のコンピュータ環境で実行される、プログラムモジュールに含まれるような
、コンピュータ実行可能命令の一般的な文脈において説明することができる。一般に、プ
ログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装する
ルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構
造などを含む。プログラムモジュールの機能は、様々な実施形態で望まれているように、
組み合わせたり、または複数のプログラムモジュールに分割することができる。プログラ
ムモジュールのコンピュータ実行可能命令は、ローカルまたは分散コンピュータ環境内で
実行することができる。
する」、および「選択する」のような用語を使用して、コンピュータ環境におけるコンピ
ュータの演算を説明する。これらの用語は、コンピュータにより実行される演算の高水準
の抽象化であり、人間が実行する行為と混同すべきではない。これらの用語に対応する実
際のコンピュータの演算は、実装によって異なる。
図2は、いくつかの説明されている実施形態を実装できる例示的なビデオ符号器200
のブロック図である。図3は、いくつかの説明されている実施形態を実装できる一般化さ
れたビデオ復号器300のブロック図である。
号器内の情報の一般的な流れを示し、他の関係は、単純にするため示されていない。特に
、図2および図3は、通常、ビデオシーケンス、画像、スライス、マクロブロック、ブロ
ックなどに使用される符号器設定、モード、テーブルなどを示すサイド情報を示していな
い。このようなサイド情報は、出力ビットストリームで送信され、これは、典型的には、
サイド情報のエントロピー符号化の後に実行する。出力ビットストリームの形式は、実装
によって異なりうる。
ームとフィールドの組合せであってよい、映像を処理する。画像およびマクロブロックレ
ベルにおけるビットストリームのシンタックスおよびセマンティックスは、フレームが使
用されるのか、フィールドが使用されるのかに依存しうる。マクロブロックの編成および
全体的なタイミングにも変更が生じうる。符号器200および復号器300は、ブロック
ベースであり、フレームには4:2:0マクロブロック形式を使用し、それぞれのマクロ
ブロックは4つの8×8輝度ブロック(ときには、1つの16×16マクロブロックとし
て処理される)および2つの8×8色度ブロックを含む。フィールドについては、同じま
たは異なるマクロブロック編成および形式を使用することができる。8×8ブロックは、
さらに、異なる複数の段、例えば、周波数変換およびエントロピー符号化段で、細分され
うる。例示的なビデオフレーム編成について、以下でさらに詳しく説明する。それとは別
に、符号器200および復号器300は、オブジェクトベースであるか、異なるマクロブ
ロックまたはブロック形式を使用するか、または8×8ブロックおよび16×16マクロ
ブロックと異なるサイズまたは構成のサンプルの集合に対し演算を実行する。
し、複数のモジュールに分割し、他のモジュールと組み合わせ、および/または類似のモ
ジュールと交換することができる。代替え実施形態では、異なるモジュールおよび/また
はモジュールの他の構成を使用する符号器または復号器は、説明されている手法の1つま
たは複数を実行する。
いくつかの実装では、符号器200および復号器300は、以下のように編成されたビ
デオフレームを処理する。1つのフレームは、1つのビデオ信号の数ライン分の空間情報
を含む。プログレッシブビデオスキャニング(斬新的画像読み取り)では、これらのライ
ンは同じ時刻にサンプリングされたシーンコンテンツのスナップショットを表し、フレー
ムの上部から下部へのシーンで全体を覆うサンプルを含む。プログレッシブビデオフレー
ムは、図4に示されているマクロブロック400などの複数のマクロブロックに分割され
る。マクロブロック400は、従来の4:2:0マクロブロック形式に従って4つの8×
8輝度ブロック(Y1からY4まで)および4つの輝度ブロックと同一の場所に配置され
るが水平方向および垂直方向分解が半分である2つの8×8色度ブロックを含む。8×8
ブロックは、さらに、異なる複数の段、例えば、周波数変換(例えば、8×4、4×8、
または4×4DCT)およびエントロピー符号化段で、細分されうる。プログレッシブI
−フレームは、イントラ符号化プログレッシブビデオフレームであるが、ただし、「イン
トラ」という用語は、他のすでに復号化されている画像のコンテンツからの予測を伴わな
い符号化方式を指す。プログレッシブP−フレームは、現在の画像と時間的に異なる時刻
の1つまたは複数他の画像からの予測(ときには、文脈によっては前方予測とも呼ばれる
)を使用して符号化されるプログレッシブビデオフレームであり、プログレッシブB−フ
レームは、いくつかの領域における複数の予測値の(場合によっては重み付け)平均を伴
うインターフレーム予測を使用して符号化されたプログレッシブビデオフレームである(
ときには、双予測または双方向予測とも呼ばれる)。プログレッシブP−およびB−フレ
ームは、イントラ符号化されたマクロブロックだけでなく様々な種類のインターフレーム
予測マクロブロックを含むことができる。
互系列からなり、1つはフレームの偶数ライン(番号0、2、4などのライン)を含む、
トップフィールド(top field)と呼ばれ、もう1つはそのフレームの奇数ライン(番号
1、3、5などのライン)を含む、ボトムフィールド(bottom field)と呼ばれる。これ
ら2つのフィールドは、典型的には、2つの異なるスナップショット時刻を表す。図5A
は、インターレースビデオフレーム500の左上部分にトップフィールドおよびボトムフ
ィールドの交互ラインを含む、インターレースビデオフレーム500の一部を示している
。
スビデオフレーム500を示している。インターレースビデオフレーム500は、複数の
マクロブロックまたは図4に示されているような4:2:0形式を使用するマクロブロッ
ク531および532などの他のそのような複数の領域に分割されている。輝度平面内で
、それぞれのマクロブロック531、532は、合計16本のラインについてボトムフィ
ールドからの8本のラインと交互に並ぶトップフィールドからの8本のラインを含み、そ
れぞれのラインは、16サンプル長である。(画像を複数のマクロブロックまたは他のそ
のような領域に実際に編成すること、および輝度ブロックおよび色度ブロックをマクロブ
ロック531、532内に配置することは、示されておらず、実際には、異なる符号化決
定および異なるビデオ符号化設計について異なることがある。)与えられたマクドブロッ
ク内で、トップフィールド情報およびボトムフィールド情報は、一緒に符号化されるか、
または様々フェーズにおいて別々に符号化されうる。
スビデオフレームであり、それぞれのマクロブロックは、一方または両方のフィールドに
対する情報を含む。インターレースP−フレームは、インターフレーム予測を使用して符
号化される2つのフィールドを含むインターレースビデオフレームであり、それぞれのマ
クロブロックは、インターレースB−フレームの場合のように、一方または両方のフィー
ルドに対する情報を含む。インターレースP−およびB−フレームは、イントラ符号化さ
れたマクロブロックだけでなく様々な種類のインターフレーム予測マクロブロックを含む
ことができる。
ースビデオフレーム500を示している。インターレースビデオフレーム500の2つの
フィールドはそれぞれ、複数のマクロブロックに分割される。トップフィールドは、マク
ロブロック561などの複数のマクロブロックに分割され、ボトムフィールドは、マクロ
ブロック562などの複数のマクロブロックに分割される。(ここでもまた、マクロブロ
ックは、図4に示されているように4:2:0形式を使用し、画像を複数のマクロブロッ
クまたは他のそのような領域に編成すること、および輝度ブロックおよび色度ブロックを
複数のマクロブロック内に配置することは、図に示されておらず、異なることがある。)
輝度平面内で、マクロブロック561は、トップフィールドからの16本のラインを含み
、マクロブロック562は、ボトムフィールドからの16本のラインを含み、それぞれの
ラインは16サンプル長である。
されたフィールドである。インターレースP−フィールドは、インターレースB−フィー
ルドのように、画像間予測(inter-picture prediction)を使用して符号化されたインタ
ーレースビデオフレームの単一の別々に表現されたフィールドである。インターレースP
−およびB−フィールドは、イントラ符号化されたマクロブロックだけでなく様々な種類
の画像間予測マクロブロックを含むことができる。
は、異なるフィールドタイプの様々な組合せを含むことができる。例えば、そのようなフ
レームはトップフィールドおよびボトムフィールドの両方において同じフィールドタイプ
(I−フィールド、P−フィールド、またはB−フィールド)を持つか、またはそれぞれ
のフィールドにおいて異なるフィールドタイプを持つことができる。
またはフィールドを指す。プログレッシブスキャンビデオでは、画像は、典型的には、プ
ログレッシブビデオフレームである。インターレースビデオでは、画像は、文脈に応じて
、インターレースビデオフレーム、フレームのトップフィールド、またはフレームのボト
ムフィールドを指すことができる。
4:2:0色度サンプル配置の6つの例示的な空間的アライメントを示す。
なるマクロブロック形式(例えば、4:2:2または4:4:4)もしくはブロック形式
を使用するか、または8×8ブロックおよび16×16マクロブロックと異なるサイズま
たは構成のサンプルの集合に対し演算を実行する。
図2は、例示的なビデオ符号器システム200のブロック図である。符号器システム2
00は、現在の画像205を含む映像のシーケンス(例えば、プログレッシブビデオフレ
ーム、インターレースビデオフレーム、またはインターレースビデオフレームのフィール
ド)を受け取り、圧縮されたビデオ情報295を出力として生成する。ビデオ符号器の特
定の実施形態は、典型的には、例示的な符号器200の一変更形態または補足バージョン
を使用する。
画像間予測画像(inter-picture predicted picture)(P−またはB−画像)に符号化
プロセスを使用する。提示するため、図2では、符号器システム200を通るI画像に対
する経路および画像間予測画像に対する経路を示す。符号器システム200のコンポーネ
ントの多くは、I−画像と画像間予測画像の両方を圧縮するために使用される。これらの
コンポーネントにより実行される厳密な演算は、圧縮される情報のタイプに依存し、変化
しうる。
の予測(または差)に関して表現される。予測残差は、予測されたものと元の画像との差
である。対照的に、I−画像は、他の画像を参照せずに圧縮される。I−画像では、空間
的予測または周波数領域予測(つまり、イントラ画像予測(画像内画像予測;intra-pict
ure prediction))を使用し、I−画像それ自体の他の部分からのデータを使用してI−
画像のいくつかの部分を予測することができる。しかし、簡単のため、このようなI−画
像は、この説明では、「予測」画像と呼ばれず、したがって、「予測画像」というフレー
ズは、画像間予測画像(例えば、P−またはB−画像)であると理解することができる。
画像、例えば、画像記憶部(picture store)220内にバッファリングされている再構
成された前の画像225に関して、現在の画像205のサンプルのマクロブロックまたは
サンプルの他の集合の動きを推定する。動き推定器(motion estimator)210は、1つ
または複数の時間的に前の参照画像および1つまたは複数の時間的に後の参照画像に関し
て動きを推定することができる(例えば、双予測画像(bi-predictive picture)の場合
)。したがって、符号器システム200は、複数の参照画像に対し別々のストア220お
よび222を使用することができる。
分により動きを推定することができ、画像毎に、または他の基準に関して動き推定の解像
度(resolution)を切り替えることができる。動き推定器210(および補償器230)
は、さらに、フレーム毎に、または他の基準に関して、参照画像サンプル補間の種類を切
り替える(例えば、三次畳み込み補間法と双一次補間とを切り替える)こともできる。動
き推定の解像度は、水平方向および垂直方向に同じである場合も、異なる場合もある。動
き推定器210は、サイド情報として、差動運動ベクトル情報などの動き情報215を出
力する。符号器200は、例えば、動きベクトルに対する1つまたは複数の予測因子を計
算し、動きベクトルと予測因子との差を計算し、それらの差をエントロピー符号化するこ
とにより動き情報215を符号化する。動きベクトルを再構成するために、動き補償器2
30は、予測因子と動きベクトル差情報(motion vector difference information)とを
組み合わせる。
に適用して、動き補償予測235を形成する。しかし、予測は、めったに完全ではなく、
動き補償予測235と元の現在画像205との差が、予測残差245である。画像を後か
ら再構成するときに、予測残差245の近似が、動き補償予測235に加えられ、これに
より、動き補償予測235よりも元の現在画像205に近い再構成画像を得ることができ
る。しかし、不可逆圧縮では、元の現在画像205から一部の情報がそのまま失われる。
それとは別に、動き推定器および動き補償器は、他の種類の動き推定/補償を適用する。
タに変換する。ブロックベースのビデオ符号化では、周波数変換器260は、典型的には
、離散コサイン変換(DCT)、DCTの一変種、または他の何らかのブロック変換をサ
ンプルデータまたは予測残差データのブロックに適用し、周波数領域変換係数のブロック
を生成する。それとは別に、周波数変換器260は、フーリエ変換などの他の種類の周波
数変換を適用するか、またはウェーブレットもしくはサブバンド分析を使用する。周波数
変換器260は、8×8、8×4、4×8、もしくは4×4または他のサイズの周波数変
換を適用することができる。
、画像毎に、マクロブロック毎に、または他の基準により変化する量子化ステップサイズ
に応じてスカラー量子化を変換係数に適用するが、ただし、量子化ステップサイズは、符
号器逆量子化器プロセス276で複製されうる復号器逆量子化器プロセスにおける離散表
現可能再構成点同士の間の一定間隔を決定する制御パラメータである。それとは別に、量
子化器は、他の種類の量子化、例えば、非一様な再構成点を持つスカラー量子化器、ベク
トル量子化器、または非適応量子化を周波数領域変換係数に適用するか、または周波数変
換を使用しない符号化システム内で空間領域データを直接量子化する。適応量子化に加え
て、符号器200は、フレームドロッピング(frame dropping)、適応フィルタリング、
またはレート制御の他の手法を使用することができる。
子化された周波数領域変換係数に対し逆量子化を実行する。次いで、逆周波数変換器26
6は、周波数変換器260の演算の逆を実行し、(予測された画像に対する)再構成され
た予測残差近似または再構成されたI−画像近似を出力する。現在画像205が、I−画
像であった場合、再構成されたI−画像近似は、再構成された現在画像近似(図に示され
ていない)とみなされる。現在画像205が、予測画像であった場合、再構成された予測
残差近似が、動き補償予測235に加えられ、再構成された現在画像近似を形成する。画
像記憶部220、222の1つまたは複数に、後続の画像の動き補償予測で参照画像とし
て使用する再構成された現在画像近似をバッファリングする。符号器は、非ブロック化フ
ィルタまたは他の画像リファイニングプロセス(画像精錬工程;picture refining proce
ss)を再構成されたフレームに適用し、画像近似を1つまたは複数の画像記憶部220、
222に格納するのに先立って不連続を適応平滑化し、画像から他のアーチファクトを除
去することができる。
えば、動き情報215、量子化ステップサイズ)を圧縮する。典型的なエントロピー符号
化手法は、算術符号化、差分符号化、ハフマン符号化、ランレングス符号化、Lempe
l−Ziv符号化、辞書符号化、およびこれらの組合せを含む。エントロピー符号器28
0は、典型的には、異なる種類の情報(例えば、低周波係数、高周波係数、ゼロ周波数係
数、異なる種類のサイド情報)に対し異なる符号化手法を使用し、特定の符号化手法の範
囲内の複数のコード表の中から選択することができる。
290に供給する。MUX 290は、バッファを備えることができ、バッファ充足レベ
ルインジケータをレート制御のためビットレート適応モジュールにフィードバックするこ
とができる。MUX 290の前または後に、圧縮ビデオ情報290は、ネットワークに
よる伝送用に通信路符号化することができる。通信路符号化は、誤り検出および補正デー
タを圧縮ビデオ情報295に適用することができる。
図3は、例示的なビデオ復号器システム300のブロック図である。復号器システム3
00は、圧縮された映像シーケンスに対する情報395を受信し、再構成された画像30
5を含む出力を生成する(例えば、プログレッシブビデオフレーム、インターレースビデ
オフレーム、またはインターレースビデオフレームのフィールド)。ビデオ復号器の特定
の実施形態は、典型的には、一般化された復号器300の一変更形態または補足バージョ
ンを使用する。
では、復号器システム300を通るI−画像に対する経路および予測画像に対する経路を
示す。復号器システム300のコンポーネントの多くは、I−画像と予測画像の両方を圧
縮解除するために使用される。これらのコンポーネントにより実行される厳密な演算は、
圧縮解除される情報のタイプに依存し、変化しうる。
受け取った情報をエントロピー復号器380に供給する。DEMUX 390は、ジッタ
バッファおよび他のバッファも備えることができる。DEMUX 390の前、またはそ
の中で、圧縮されたビデオ情報を通信路復号化し、誤り検出および訂正のため処理するこ
とができる。
ントロピー符号化されたサイド情報(例えば、動き情報315、量子化ステップサイズ)
をエントロピー復号化し、典型的には、符号器内で実行されるエントロピー符号化の逆演
算を適用する。エントロピー復号化手法は、算術復号化、差分復号化、ハフマン復号化、
ランレングス復号化、Lempel−Ziv復号化、辞書復号化、およびこれらの組合せ
を含む。エントロピー復号器380は、典型的には、異なる種類の情報(例えば、低周波
係数、高周波係数、ゼロ周波数係数、異なる種類のサイド情報)に対し異なる復号化手法
を使用し、特定の復号化手法の範囲内の複数のコード表の中から選択することができる。
きベクトル差をエントロピー復号化し(エントロピー復号器380で)、復号化された動
きベクトル差と予測因子と組み合わせて動きベクトルを再構成することにより動き情報3
15を復号化する。
再構成される画像305の予測335を形成する。例えば、動き補償器330は、1つま
たは複数のマクロブロック動きベクトルを使用して、サンプルのブロックを見つけるか、
または(複数の)参照画像325内のサンプル間の分数位置を補間する。1つまたは複数
の画像記憶部(例えば、画像記憶部320、322)では、参照画像として使用するため
に、前の再構成された画像を格納する。典型的には、B−画像は、複数の参照画像(例え
ば、少なくとも1つの時間的に前の参照画像および少なくとも1つの時間的に後の参照画
像)を有する。したがって、復号器システム300は、複数の参照画像に対し別々の画像
記憶部320および322を使用することができる。動き推定器330は、完全サンプル
、1/2サンプル、1/4サンプル、または他の増分で動きを補償することができ、画像
毎に、または他の基準に関して動き補償の解像度を切り替えることができる。動き補償器
330は、さらに、フレーム毎に、または他の基準に関して、参照画像サンプル補間の種
類を切り替える(例えば、三次畳み込み補間法と双一次補間とを切り替える)こともでき
る。動き補償の解像度は、水平方向および垂直方向に同じである場合も、異なる場合もあ
る。それとは別に、動き補償器は、他の種類の動き補償を適用する。動き補償器による予
測は、めったに完全ではなく、したがって、復号器300は、さらに、予測残差を再構成
する。
化は、画像毎に、マクロブロック毎に、または他の何らかの基準に関して変化する再構成
ステップサイズにより均一スカラー逆量子化をエントロピー復号化データに適用する。そ
れとは別に、逆量子化器は、他の種類の逆量子化、例えば、不均一、ベクトル、または非
適応逆量子化をデータに適用するか、または逆周波数変換を使用しない復号器システム内
の空間領域データを直接逆量子化する。
変換する。ブロックベース映像では、逆周波数変換器360は、逆DCT[「IDCT」
]、IDCTの一変種、または他の何らかの逆ブロック変換を周波数変換係数のブロック
に適用し、それぞれI−画像または予測画像に対するサンプルデータまたは画像間予測残
差データを生成する。それとは別に、逆周波数変換器360は、逆フーリエ変換などの他
の種類の逆周波数変換を適用するか、またはウェーブレットもしくはサブバンド合成を使
用する。逆周波数変換器360は、8×8、8×4、4×8、4×4、または他のサイズ
の逆周波数変換を適用することができる。
5とを組み合わせて、再構成された画像305を形成する。復号器が、後の動き補償のた
め再構成された画像305を必要とする場合、それらの画像記憶部の1つまたは複数(例
えば、画像記憶部320)に、次の画像を予測する際に使用する再構成された画像305
をバッファリングする。いくつかの実施形態では、復号器300は、非ブロック化フィル
タまたは他の画像リファイニングプロセスを再構成された画像に適用し、再構成された画
像305を画像記憶部(例えば、画像記憶部320)の1つまたは複数に格納するのに先
立って、または復号化されたビデオの再生時に復号化された画像を表示するのに先立って
、不連続を適応平滑化し、画像から他のアーチファクトを除去する。
ビデオは、異なる解像度で符号化され(復号化され)うる。この説明のために、多重解
像度符号化および復号化をフレームベースの符号化および復号化(例えば、参照画像再サ
ンプリング)または階層化(ときには、空間的スケーラブルとも呼ばれる)符号化および
復号化として説明することができる。多重解像度符号化および複合化は、さらに、インタ
ーレースビデオおよびフィールドベースの符号化および復号化、ならびに分解特有の基準
に基づき、または他の何らかの基準に従って、フレームベースの符号化および復号化とフ
ィールドベースの符号化および復号化とを切り替えることを伴うこともありうる。しかし
、プログレッシブビデオのフレーム符号化については、概念の説明を簡素化することを目
的としてこの概要において説明する。
フレームベースの多重解像度符号化では、符号器は、異なる解像度で入力画像を符号化
する。符号器は、画像毎に、または他の何らかの基準に従って画像に対する空間解像度を
選択する。例えば、参照画像再サンプリングでは、参照画像は、符号化される画像の解像
度と異なる解像度で符号化される場合に再サンプリングされうる。再サンプリングという
用語は、サンプリングされた信号の画像領域または他の何らかのセクションを表すために
使用されるサンプルの数を増やす(アップサンプリング)または減らす(ダウンサンプリ
ング)ことを説明するために使用される。単位面積当たり、または信号セクション毎のサ
ンプルの数は、サンプリングの解像度と呼ばれる。
、入力ビデオコンテンツ内の動きの量の増減、ビデオコンテンツの他の特性(例えば、強
いエッジ、テキスト、低解像度で著しく歪みことがある他のコンテンツの存在)、または
他の何らかの基準に基づいて選択できる。空間解像度は、垂直、水平、または垂直と水平
の両方の次元で変化しうる。水平解像度は、垂直解像度と同じ場合もあれば、異なる場合
もある。復号器は、相補的手法を使用して符号化されたフレームを復号化する。
は、符号化する前に所望の解像度に合わせて元の画像を再サンプリングする。次いで、符
号器は、空間解像度の選択結果を復号器に信号で伝えることができる。
号器200などの符号器は、画像に対する解像度(610)を設定する。例えば、符号器
は、上記の基準または他の基準を考慮する。次いで、符号器は、その解像度で画像(62
0)を符号化する。符号化すべきすべての画像の符号化が完了したら(630)、符号器
は終了する。完了しなかった場合、符号器は、次の画像に対し解像度(610)を設定し
、符号化を続ける。それとは別に、符号器は、画像の異なる部分に対し異なる形で解像度
を設定する、または画像のグループまたは画像のシーケンスに対し解像度の選択を行うな
ど、画像レベルと異なる何らかのレベルで解像度を設定する。
トラ画像および画像間予測画像のフレームベースの多重解像度符号化の手法(800)を
示す。第1に、符号器は、符号化すべき現在画像がイントラ画像であるか、または予測画
像であるかを810でチェックする。現在画像が、イントラ画像である場合、符号器は、
820で現在画像に対する解像度を設定する。画像が予測画像である場合、符号器は、現
在画像に対する解像度を設定する前に830で参照画像に対する解像度を設定する。現在
画像に対する解像度を設定した後、符号器は、その解像度で現在画像(840)を符号化
する。画像に対する解像度を設定することは(現在ソース画像または格納されている参照
画像かに関係なく)、選択された解像度と一致する画像を再サンプリングすることを伴い
、また信号を符号化して選択された解像度を復号器に指示することを伴うことがある。符
号化すべきすべての画像の符号化が完了したら(850)、符号器は終了する。そうでな
ければ、符号器は、追加の画像を符号化することを続ける。それとは別に、符号器は、予
測画像を異なる方法で取り扱う。
ングする。符号化された画像の解像度のように、復号化された画像の解像度も、多くの異
なる方法で調節することができる。例えば、復号化された画像の解像度は、出力表示デバ
イスの解像度または出力表示デバイスの一領域の解像度に合うように調節することができ
る(例えば、「ピクチャインピクチャ」またはPCデスクトップウィンドウ表示に対し)
。
号器300などの復号器は、画像に対する解像度(710で)を設定する。例えば、復号
器は、符号器から解像度情報を取得する。次いで、復号器は、その解像度で画像(720
)を復号化する。復号化すべきすべての画像の復号化が完了したら(730)、復号器は
終了する。完了しなかった場合、復号器は、次の画像に対し解像度(710)を設定し、
復号化を続ける。それとは別に、復号器は、画像レベルと異なる何らかのレベルに解像度
を設定する。
トラ画像および予測画像のフレームベースの多重解像度復号化の手法(900)を示す。
像であるかをチェックする(910)。現在画像が、イントラ画像である場合、復号器は
、現在画像に対する解像度を設定する(920)。画像が予測画像である場合、復号器は
、現在画像に対する解像度を設定する(920)前に参照画像(930)に対する解像度
を設定する。参照画像の解像度を設定することは、選択された解像度に一致するように格
納されている参照画像を再サンプリングすることを伴いうる。現在画像(920)に対す
る解像度を設定した後、復号器は、その解像度で現在画像(940)を符号化する。復号
化すべきすべての画像の復号化が完了したら(950)、復号器は終了する。そうでない
場合、復号器は、復号化を続ける。
とは別に、復号器は、復号器で利用できる解像度が符号器内で使用されるのとまったく同
じではないときなど、異なる解像度で画像を復号化する。
階層化多重解像度符号化では、符号器は、ビデオをレイヤで符号化し、それぞれのレイ
ヤは異なる解像度でビデオを復号化するための情報を含む。このようにして、符号器は、
複数の解像度でビデオ内の少なくとも一部の個別画像を符号化する。次いで、復号器は、
レイヤの異なる組合せを処理することにより1つまたは複数の解像度でビデオを復号化す
ることができる。例えば、第1のレイヤ(ときには、ベースレイヤとも呼ばれる)は、低
解像度でビデオを復号化するための情報を含むが、1つまたは複数の他のレイヤ(ときに
は、エンハンスメントレイヤとも呼ばれる)は、高解像度でビデオを復号化するための情
報を含む。
うる。したがって、このような設計では、ベースレイヤのみを復号化する復号器は、ベー
スレイヤの低解像度の有効な復号化されたビットストリームを生成する。エンハンスメン
トレイヤを使用して高解像度画像を適切に復号化するには、さらに、符号化されたベース
レイヤデータおよび場合によっては1つまたは複数のエンハンスメントレイヤの一部また
は全部を復号化する必要がある場合がある。ベースレイヤおよび1つまたは複数の他の高
解像度のレイヤを復号化する復号器は、ベースレイヤのみを復号化する復号器よりも高い
解像度のコンテンツを生成することができる。2つ、3つ、またはそれ以上のレイヤを使
用することにより、2つ、3つ、またはそれ以上の異なる解像度を利用することができる
。それとは別に、高解像度のレイヤは、それ自体も、独立に復号化可能なビットストリー
ムとなりうる。(このような設計は、サイマルキャスト(同時放送、サーマル放送;simu
lcast)多重解像度符号化アプローチと呼ばれることが多い。)
法(1000)を示す。図2の符号器200などの符号器は、入力(1010)として最
大解像度(full-resolution)のビデオ情報をとる。符号器は、最大解像度のビデオ情報
(1020)をダウンサンプリングし、ダウンサンプリングされた情報(1030)を使
用してベースレイヤを符号化する。符号器は、ベースレイヤおよび高解像度のビデオ情報
(1040)を使用して1つまたは複数の高解像度のレイヤを符号化する。高解像度のレ
イヤは、最大解像度で復号化することを許すレイヤ、または何らかの中間解像度で復号化
することを許すレイヤとすることができる。次いで、符号器は、符号化されたレイヤのも
う2つを含む階層化ビットストリームを出力する。それとは別に、高解像度のレイヤ(1
040)の符号化では、ベースレイヤ情報を使用することができず、したがって、サイマ
ルキャスト多重解像度符号化アプローチについては高解像度のレイヤデータを独立に復号
化することができる。
イヤ符号化を実行することができる。詳細については、特許文献1またはMPEG−2標
準もしくは他のビデオ標準を参照のこと。
化する手法(1100)を示す。図3の復号器300などの復号器は、入力(1110)
として階層化ビットストリームをとる。レイヤは、低解像度のレイヤ(ベースレイヤ)、
および高解像度の情報を含む1つまたは複数のレイヤを含む。高解像度のレイヤは、独立
に符号化された画像を含む必要はなく、典型的には、高解像度のレイヤは、画像の高解像
度のバージョンと低解像度のバージョンとの差を記述する残差情報を含む。復号器は、ベ
ースレイヤ(1120)を復号化し、高解像度の復号化が望まれている場合、復号器は、
復号化されたベースレイヤ画像(1130)を所望の解像度に合わせてアップサンプリン
グする。復号器は、1つまたは複数の高解像度のレイヤ(1140)を復号化し、復号化
された高解像度の情報をアップサンプリングされ復号化されたベースレイヤ画像と組み合
わせて、高解像度の画像(1150)を形成する。所望の解像度をレベルに応じて、高解
像度の画像は、最大解像度の画像または中間解像度の画像とすることができる。詳細につ
いては、特許文献1またはMPEG−2標準もしくは他のビデオ標準を参照のこと。
それとは別に、復号器に利用可能な解像度は、符号器で使用されるのとまったく同じでは
ない。
この節では、スケーラブルなビデオ符号化および復号化用の手法およびツールについて
説明する。いくつかの説明されている手法およびツールは、階層化(または空間的スケー
ラブルな)文脈において説明されるが、いくつかの説明されている手法およびツールは、
フレームベースの(または参照画像サンプリングの)文脈において、または再サンプリン
グフィルタを伴う他の何らかの文脈において使用されうる。さらに、いくつかの説明され
ている手法およびツールが再サンプリング画像の文脈において説明されているが、いくつ
かの説明されている手法およびツールは、さらに、高解像度の信号の予測から結果として
得られる残差または差信号を再サンプリングするために使用されうる。
復号化して、一部のアプリケーションに対し許容可能な品質の復号化された画像を生成す
ることを可能にするデジタルビデオ符号化の一種である(ただし、このような画質は、高
ビットレートのビットストリーム全体を復号化することにより生成される画質よりも低い
ものとなる)。SVCの種類によって知られているものは、空間スケーラビリティまたは
解像度スケーラビリティと呼ばれる。空間SVC設計では、符号化プロセス(または、符
号化プロセスの範囲の正確な定義に応じて、符号化プロセスに先立って実行される前処理
機能)は、典型的には、ビデオを低解像度にダウンサンプリングして低解像度の復号化プ
ロセスを使用できるようにその低解像度のビデオを符号化することと、高解像度のビデオ
の画像内のサンプルの値の予測として使用するため低解像度の符号化された画像をアップ
サンプリングすることとを含む。次いで、高解像度のビデオの復号化プロセスは、低解像
度のビデオ(またはその一部)を復号化することと、そのアップサンプリングされたビデ
オを高解像度のビデオの画像内のサンプルの値の予測として使用することとを含む。この
ような設計では、再サンプリングフィルタを使用する必要がある。特に、コーデック設計
は、復号器と符号器の両方においてアップサンプリングフィルタを使用することと、符号
器または符号化プリプロセッサでダウンサンプリングフィルタを使用することとを含む。
ここでは、特に、このような設計で使用されるアップサンプリングフィルタを重点的に取
りあげる。典型的には、アップサンプリングプロセスは、符号器と復号器において同一と
なるように設計され、これにより、符号化および復号化の際に同じ信号の異なる予測を使
用することに引き起こされる誤差の蓄積であるドリフトと呼ばれる現象を防ぐ。
ば、2タップ双線形フィルタ)を使用することである。高品質のフィルタを使用すると、
ビデオ画質には有利である。
ンプリングフィルタを含むことができる。しかし、これは、このようなフィルタのそれぞ
れの異なる「フェーズ」に対する多数の特定のフィルタ設計を開発し、これらのフィルタ
の「タップ」値を符号器および復号器の実装内に格納する必要がある場合がある。
きることは、ビデオ画質にとって有益であると思われる。したがって、アップサンプリン
グまたはダウンサンプリング用に設計される再サンプリングのそれぞれの「フェーズ」に
ついて、プロセスに入り込むぼけの所望の程度に応じて、選択対象となる異なるフィルタ
をいくつか用意すると都合がよいであろう。アップサンプリングの際に実行されるぼけの
程度の選択結果は、復号化プロセスで使用するために伝達される情報として符号器から復
号器に送られうる。このさらなる柔軟性により、設計の複雑度が増し、符号器または復号
器に格納される必要があるかもしれない必要なタップ値の数が大幅に増える。
々な再サンプリングフィルタを指定することが可能であろう。可能な解決手段の1つは、
Mitchell−Netravaliフィルタ設計法の使用である。これらの問題にM
itchell−Netravaliフィルタ設計法を直接適用する場合、符号器または
復号器において計算されるべき量に対し可能な値の過剰なダイナミックレンジの形で過剰
な計算資源を必要とすることがある。例えば、このような設計の1つでは、汎用CPUお
よびDSPで通常使用される16ビットまたは32ビット処理要素ではなく、45ビット
算術演算処理を使用する必要がある場合もある。このような問題に対処するために、設計
に対しいくつか改良を加える。
タを必要とする。任意の再サンプリング比(拡張空間スケーラビリティと呼ばれる特徴)
をサポートするために、再サンプリング比に関する大きな柔軟性を組み込んだアップサン
プリングフィルタ設計について説明する。他の重要な態様は、輝度および色度の相対的ア
ライメントである。様々なアライメント構造(例えば、4:2:0色度に対するH.26
1/MPEG−1対MPEG−2のアライメント、およびH.264/MPEG−4 A
VC)が、単一レイヤアプローチに見つかるので、説明されている手法およびツールは、
柔軟性の高い様々なアライメントをサポートし、符号器がフィルタリングを適宜適用する
方法を復号器に示す簡単な方法となっている。
リアシングを実行できるアップサンプリングフィルタを含む。特に、説明されている手法
およびツールは、空間スケーラビリティに対する前の双線形フィルタ設計により実現され
たものを超える品質を有する。説明されている手法およびツールは、見栄えよくするだけ
でなく、良好な信号処理周波数挙動をもたらす高品質アップサンプリングフィルタを有す
る。説明されている手法およびツールは、簡単に指定でき、タップ値を保持する大きな記
憶域をとるテーブルを必要としないフィルタ設計を含み、フィルタリング演算それ自体は
、計算動作が単純である。例えば、説明されている手法およびツールは、過剰に冗長であ
るということのない、過剰な数学的精度または過剰に複雑な数学的関数を必要としないフ
ィルタを有する。
− 再サンプリング比の柔軟性、
− 周波数特性の柔軟性、
− 高い視覚的品質、
− フィルタタップが少なすぎも、多すぎもしない(例えば、4から6の範囲)、
− 指定するのが簡単、
− 動作が単純(例えば、実用的なワード長の算術演算を使用する)。
説明されている手法およびツールは、分離可能フィルタリングアプローチを採用する−
したがって、以下の説明では、一次元信号の処理に主に注目するが、それは、二次元の場
合は、一次元の場合の単純な分離可能な応用だからである。最初に、
集合を提案するが、だたし、bおよびcは、2つのパラメータである。相対的フェーズオ
フセット位置0≦x<1について、このカーネルは、行列の式
成する。
フィルタカーネルであるため、0から1/2までのxの範囲のみを考えるだけで十分であ
る。
しない。実際、このようなフィルタに対するタップ値は、ごく少数の単純な演算で直接計
算できる。使用すべきパラメータおよびフェーズの様々な可能な値に対し格納しておく必
要はなく、必要になったら、単に計算するだけでよい。(したがって、このようなフィル
タの使用を標準化するために、少数の公式があればよい−コサインまたはベッセル関数な
どの関数を近似する巨大な数表または標準化された試行を必要としない。)
− その結果得られるフィルタは、4つのタップを有する。これは、非常に実用的な数
である。
− フィルタは、メインローブのそれぞれの側に単一のサイドローブのみを有する。し
たがって、過剰なリンギングアーチファクト(ringing artifact)を発生しない。
− フィルタは、平滑化されたインパルス応答を有する。その値およびその一次導関数
は、両方とも連続である。
− 利得1のDC応答を有するが、これは、アップサンプリングされる情報内に全体的
な輝度増幅または減衰がないことを意味する。
− このフィルタファミリのメンバは、「Lanczos−2」設計および「Catm
ull−Rom」設計などのよく知られているよいフィルタの比較的良好な近似を含む。
2つのパラメータの間の特定の関係を含む。この関係は、
フィルタにより持ち込まれる付加的なぼけの程度を制御する。値b=0に関連するこのフ
ィルタファミリのメンバは、優秀な、よく知られているCatmull−Romアップサ
ンプリングフィルタ(Keys「三次畳み込み」補間フィルタとも呼ばれる)であること
に留意されたい。
avaliフィルタファミリのすべてのメンバについて見られる基本的な利点に加えて、
それ自体良好な特性を多数有する。
し、フィルタは、1に等しい単一の非ゼロタップを有する。言い換えると、アップサンプ
リングされた信号は、それぞれのアップサンプリングされた曲線セグメントのエッジにお
ける入力サンプルの値を正確に通る。
− 入力サンプルの集合が、放物線(または直線、もしくは静的値)を形成すると、出
力点は、正確に放物線(または直線もしくは静的値)上に載る。
らこの長さの最良のアップサンプリングフィルタであると考えることができる−ただし、
何らかのよけいなぼけを持ち込む(bの増大)と、ときには、見栄えよいものとなる可能
性がある。さらに、ある程度のよけいなぼけを持ち込むことで、低ビットレート圧縮アー
チファクトをぼけさせることができ、そのため、真のアップサンプリングされた画像Wi
enerフィルタ(ノイズフィルタリングに使用されるよく知られているフィルタ)推定
器により似た挙動を示す。
報告された。
− 0≦b≦1/2は、視覚的に「満足」のゆくものとして分類され、b=1/3は、
見栄えをよくするものとして報告される、
− b>1/2は、「ぼけ」として分類され、b=3/2は、過剰にぼけているとして
報告される、
式(4)において6で除算することは、望ましくない場合がある。その代わりに、無限
精度は復号器設計の一部として実用的でないので、帯域幅制御パラメータおよびフィルタ
タップ値を整数化することが望ましい場合がある。新しい整数値変数として
a=(b/6)*2S (5)
で定義されたaを使用する代入を考えるが、
ただし、Sは、整数シフト係数であり、aは、整数化帯域幅制御パラメータとして作用
する符号なし整数である。パラメータaは、ビットストリーム内のビデオシーケンスレベ
ルで符号器によりシンタックス要素として符号化されうる。例えば、パラメータaは、可
変長または固定長のコードで明示的に符号化されるか、または他の情報と一緒に符号化さ
れるか、または明示的に信号で伝達されうる。それとは別に、パラメータaは、ビットス
トリーム内の他の何らかのレベルで信号で伝達される。
る。
対する可能ないくつかの有益な選択は、以下のとおりである。
− M=2(S−2)−1、この結果bの範囲は0から3/2−6/2Sまでである。
− M=Ceil(2S/6)、2S/6以上の最小の整数を返し、その結果bの範囲
は0から1よりも少し大きい値までとなる。
− M=2(S−3)−1、この結果bの近似的範囲は0から3/4−6/2Sまでと
なる。
選択(M=2(S−2)−1)は3つの選択のうちの大きい方である。Sに対する有用な
範囲は、6から8までである。
、MおよびSの他の値を使用することができる。
次に、xの値の粒度を考える。実用上は、xも近似すべきである。例えば、整数iを、
x=i÷2F (7)
と定義することができる。
サンプリング演算の一実施例では、F≧4(1/16以上のサンプル位置決め精度)を考
える。この結果、整数化されたフィルタタップ値
要がある。
する)ことに留意されたい。そこで、代わりに、タップ値を
置だけスケールダウンされる必要がある。
して定義する。
る。それとは別に、丸め右シフトは、異なる形で実行される。
サンプルビット深度のNビットで画像をフィルタリングし、丸めの実行前に二次元でそ
うする場合、2*(3F+S−1)位置だけ結果をダウンシフトし、出力をNビット範囲
にクリップする前にアキュムレータ内にダイナミックレンジの2*(3F+S−1)+N
+1ビットが入っている必要がある。例えば、F=4、S=7、およびN=8であるとす
ると、フィルタリングされた結果を計算するために45ビットアキュムレータを使用する
必要がある場合がある。
アプローチは、別々に、または互いに組み合わせて使用することができる。本明細書の説
明に基づき、説明されているダイナミックレンジ軽減アプローチのいくつかの変更形態が
可能であることは理解されるであろう。
水平フィルタリングが最初に実行され、続いて垂直フィルタリングが実行される実施例
を考察する。二次元処理パイプライン内の任意の点に対し最大ワード長Wビットを考える
。第1のダイナミックレンジ軽減アプローチでは、フィルタリングを実行するために、プ
ロセスの第1(水平)段の出力でRHビットの丸め右シフトを、プロセスの第2の(垂直
)段の出力でRVビットの丸め右シフトを使用する。
2*(3F+S−1)+N+1−RH=W (11)
を計算することができ、したがって
RH=2*(3F+S−1)+N+1−W (12)
となる。
RH+RV=2*(3F+S−1) (13)
から計算することができ、したがって
RV=2*(3F+S−1)−RH (14)
となる。
びRV=23が得られる。したがって、ダイナミックレンジの45ビットの代わりに、丸
め右シフトを使用すると、ダイナミックレンジは、32ビットに縮小される。ビットの異
なる数の右シフトを、Wの異なる値に対し使用することができる。
第2のダイナミックレンジ軽減アプローチは、フェーズ位置決めの精度を減らす(つま
り、Fを小さくする)、フィルタ帯域幅調節パラメータの粒度を下げる(つまり、Sを小
さくする)、または第1の段の出力の精度を下げる(つまり、RHを高くする)のではな
く、タップ値の精度を減らすことを伴う。
。4つのフィルタタップ値の合計は、23F+S−1に等しくなる、つまり、
t−1+t0+t1+t2=23F+S−1 (15)
となることに留意されたい。
を持つため、この例示的なダイナミックレンジ軽減アプローチの重要な特性である。
tを与えて、以下の式を定義する。
u−1=RoundingRightShift(t−1,Rt)、
u1=RoundingRightShift(t1,Rt)、
u2=RoundingRightShift(t2,Rt)、
u0=23F+S−1−u−1−u1−u2。
2]を使用してフィルタリングを実行する。Rtの値において1のそれぞれの増加は、算
術アキュムレータにおいて必要なダイナミックレンジの1少ないビット、および処理の後
続の段において実行される右シフトの1少ないビットを表す。
以前のある設計では、概念上は似ているが、プロセスの第1段の後の右シフトの量をフ
ェーズ位置決め変数iの値の関数にするという点で第1の例示的なダイナミックレンジ軽
減アプローチと異なるトリックを使用する。
のゼロ値LSBを含むことがわかる。そこで、フィルタリングプロセスの第2段で、2K
の整数倍であるフェーズ位置決め変数iを使用する場合、第2段のタップ値をKビットだ
け右シフトし、第1段の右シフト量をKビットだけ減らすことができる。
い場合がある。しかし、2:1の単純な再サンプリング係数または他の単純な係数を実行
する場合には、フィルタリングプロセス第2段について使用中のすべてのフェーズが2K
の同じ倍数を含むことを理解することは容易であり、このアプローチをこれらの特別なケ
ースに適用することができる。
空間SVCに対する位置決め情報を計算するための手法およびツールについて説明する
。
精度を最適化する方法を対象とする。精度をただ選択し、何らかの必要なワード長を要求
する代わりに、新しい方法を適用すると、実際の実装の精度が高まり、手法の効果的適用
の範囲が広がるが、それというのも、利用可能なワード長すべてを使用して、その制約内
で精度を最大化するからである。
付き整数ではなく符号なし整数を使用して、精度とワード長/ダイナミックレンジとの間
のトレードオフの関係を改善することとを対象とする。原点オフセット項をそれぞれの計
算された位置に加えるのに、計算量をわずかに増やす必要がある。
異なる処理段に分けることを対象とし、その際に、座標系の原点は、それぞれの段の開始
に変更される。ここでもまた、必要な計算量をさらにわずかに増やすだけで精度とワード
長/ダイナミックレンジとの間のトレードオフの関係を改善する(それぞれの段の開始時
にいくつかの余分な計算が実行される)。この手法を論理的極限まで高めると、乗算の必
要性をなくすことができ、また精度とワード長/ダイナミックレンジとの間のトレードオ
フの関係をさらに改善することができる。しかし、サンプル毎にいくつかの余分な演算を
実行する必要がある(「それぞれの段」に必要な余分な計算処理は、すべての段が1つの
サンプルのみを含む場合にサンプル毎に必要になるからである)。
ックレンジ、および処理に関与する数学的演算の数および種類(例えば、シフト演算、加
算、および乗算)の間の望ましいトレードオフの関係を達成する処理の位置計算の一部に
ついて説明される。
ト)算術演算を使用して柔軟精度計算を実行できる。これにより、空間SVC符号器/復
号器は、計算のため異なる算術演算(例えば、16ビットまたは64ビット算術演算)に
変換することなく異なる画像サイズに柔軟に対応できる。柔軟精度Bビット(例えば、3
2ビット)算術演算では、符号器/復号器は、柔軟な個数のビットを分数成分に充てるこ
とができる。これにより、整数成分を表すために必要なビットの個数を減らすとともに計
算の精度を高めることができる(例えば、フレームサイズの縮小のため)。整数成分を表
すのに必要なビットの個数が増えると(例えば、フレームサイズが大きい場合)、符号器
/復号器は整数成分には多くのビットを、分数成分には少ないビットを使用して、精度を
下げるが、Bビット算術演算を維持することができる。このようにして、異なる精度と異
なるフレームサイズとの間の変更が、大幅に簡素化される。
される詳細は、本明細書で説明される原理に応じて他の実装では変えることができること
に留意されたい。
精度を著しく失うことなく必要な計算量をかなり減らせる、位置およびフェーズ情報を
計算する手法について説明する。例えば、説明されている手法は、例えば、公称ダイナミ
ックレンジ要件を劇的に(数十ビットほど)下げることにより必要計算量を著しく減らせ
る。ベースレイヤおよびエンハンスメントレイヤで使用されうる様々な可能な色度位置を
考えると、輝度サンプルに関する再サンプリングされた色度サンプルの適切な位置決めを
行う解決策を見つけることが望ましい。したがって、説明されている手法を使用すること
で、輝度位置と色度位置との間の異なる関係によりビデオ形式に対する位置を計算するよ
うに調節を行うことができる。
解像度のレイヤをアップサンプリングするときに位置およびフェーズ情報を計算するとい
うかなりやっかいな方法を用い、分母のアップシフトされた近似的逆数をスケーリングす
るが、このため、分子が大きくなると(つまり、アップサンプリングプロセスが左から右
へ、または上から下へ移動するときに)逆数近似の丸め誤差が増幅される。比較すると、
本明細書で説明されている手法は、優れた精度を有し、計算を簡素化する。特に、ダイナ
ミックレンジおよび位置計算の右シフト量を数十ビットほど減らす手法が説明される。
1であるフェーズ位置決め変数iを取得するための位置決め情報を計算する手法について
説明される。
く、空間スケーラブルなビデオ符号化のアプリケーションに適用する。空間スケーラブル
なビデオ符号化のこのアプリケーションにおいて、いくつかの簡素化を適用しうる。ここ
では、一般的なワーピングプロセスではなく、画像サイズ変更演算のみを必要とする。こ
れは、それぞれの次元について分離可能な設計とすることができる。
新しい(アップサンプリングされた)配列内のLからR>Lまでの実数値範囲内に概念
上置かれるサンプルの列の生成として、それぞれの次元(xまたはy)における、問題文
を考える。この実数値範囲は、参照される低解像度配列におけるL’からR’>L’の範
囲に対応する。
配列内の位置を計算する必要がある。これは、位置T’=L’+(T−L)*(R’−L
’)÷(R−L)である。
サイズ変更比(R’−L’)÷(R−L)によりLからL+2Mまでの範囲をサイズ変更
することを考える。次いで、参照されるサンプル座標における対応する範囲は、L’から
R”までであり、R”=L’+2M*(R’−L’)÷(R−L)である。Mが十分に大
きい場合、つまり、M≧Ceil(Log2(R−L))であれば、R”≧R’である。
(ここで、以下の概念を説明するためにこの制約条件が満たされるが、この制約は式の適
切な関数機能に実際に必要ではないと仮定する。)
Lは、位置L’にマッピングされ、位置T>=Lは、位置((2M−(T−L))*L’
+(T−L)*R”)÷2M.にマッピングされる。これは、演算の分母を2の累乗に変
換し、したがって、2進数右シフトで置き換えられるようにしつつ、計算複雑度を除算演
算に低減する。
÷2Gの整数倍に丸め、Gは、整数であり、したがって、L’は、k÷2Gにより近似さ
れ、R”は、r÷2Gにより近似され、kおよびrは、整数である。この調節を使用する
ことで、位置Tを位置((2M−(T−L))*k+(T−L)*r)÷2(M+G)に
マッピングしておく。
=j÷2Jとなる。この調節を使用することで、位置Tを位置((2(M+J)−j)*
k+j*r)÷2(M+G+J)にマッピングしておく。
あることを思い出しておこう。したがって、これらの単位における計算された位置は、R
ound(((2(M+J)−j)*k+j*r)÷2(M+G+J−F))、または
t’=((2(M+J)−j)*k+j*r+2(M+G+J−F−1))>>(M+
G+J−F) (16)
またはより単純に、
t’=(j*C+D)>>S (17)
であるが、ただし、
S=M+G+J−F (18)
C=r−k (19)
D=(k<<(M+J))+(1<<(S−1)) (20)
である。
およびRならびにL’およびR’の表現に誤差がないと仮定して)で生じる唯一の誤差(
両方の設計に存在する誤差である)は、位置R”を1÷2Gの最近倍数に丸めることで生
じる丸め誤差である。この量は、G+Mが比較的大きい場合には非常に小さい。実際、こ
の誤差発生源は、ほぼ(T−L)÷2(G+M+1)の大きさに強く束縛されており、結
果の計算に対するワード長要件は穏当であり、モジュロ演算により、結果の整数部を分離
してワード長を最小にすることができるか、または計算を他の類似の方法で分解すること
もできる。
3またはF=2で十分な場合がある。)Jの例示的な値は、輝度位置計算についてはJ=
1、色度サンプル位置についてはJ=2を含む。Jのこれらの例示的な値に対する根拠を
以下に示す。
R’>0およびL’>−R’である場合、1÷2Fを単位とする整数として、アップサ
ンプリングされる画像内の計算すべきすべての位置t’は、−2Zと2Z−1の間にあり
、ただし、Z=Ceil(Log2(R’))+Fである。(j*C+D)計算のワード
長がBビットであり、符号付き2の補数演算を使用すると仮定した場合、B−1≧Z+S
を要求することができる。この制約がきつい場合、つまり、B−1=Z+M+G+J−F
である場合に、高い精度が得られる。
ける最大レベル4.2までのレベルの場合)については、B=32がワード長として使用
されうる。Bの他の値も、使用できる。非常に大きな画像では、さらに大きなBを使用で
きる。計算処理は、さらに、16ビットまたは他のプロセッサ上で使用するため、より小
さなワード長の複数の部分計算に容易に分解することができる。
丸め誤差の必要性を回避する十分な大きさのGである限り、柔軟である。したがって、S
VCについて次の節で説明されている課題に基づき、単にG=2を選ぶことができ、これ
により、
M=B+F−(G+J+Z+1)
つまり、
M=32+4−(2+1+Z+1)
つまり、
M=32−Z
が得られる。
アップサンプリングしたい場合、この第1の実施例の位置計算手法を使用して、F=4、
G=2、J=1、M=18、S=17、およびZ=14を用いることができる。
)場合、特に(T−L)*(R’−L’)÷2Fが大きい(例えば、1/2よりも大きい
)場合、仮定上、上限を1だけ違反する可能性がありうる。このようなケースについては
ここではこれ以上説明しないが、このようなケースを取り扱うための調整は簡単である。
低解像度画像において計算すべきすべての位置が、0以上の場合、これは、適切なオフ
セットを座標系の原点に加えることにより真にできるものであるが、符号付き2の補数演
算ではなく符号なし整数演算を使用してt’=(j*C+D)を計算するのがよい選択で
あるといえる。これにより、計算にオーバーフローを起こすことなくダイナミックレンジ
の1つ多いビットを許し(つまり、ダイナミックレンジの大きさのB−1ビットではなく
Bビットを使用することができ)、したがって、M(またはG)およびSをそれぞれ1だ
け増やし、さらに、計算された結果の精度を高めることができる。そのため、オフセット
Eを入れて、座標系の原点を調節した後、計算の形式は、単にt’=(j*C+D)>>
Sではなく、t’=((j*C+D’)>>S’)+Eとなる。
し算術演算を伴うこのより正確な方法をさらに詳しく述べる。
− 上述のようにB、F、G、J、およびZに対する値を選択する。
− M=B+F−(G+J+Z)と設定する。
− 式(18)、(19)、および(20)それぞれで上に指定されているようにS、
C、およびDを計算するが、ただし、Dは、符号付き数として計算される。
− Dが0以上の場合、原点オフセットは不要であり(つまり、Eを使用しない)、計
算処理は、符号なし算術演算を使用して単にt’=(j*C+D)>>Sとして実行する
ことができ、結果の精度は、上の節V.B.1で説明されている第1の例示的な位置計算
手法よりも高くなる。
をオフセットすることも、ときには、Zの値を小さくできるようにすることにより精度改
善に使用できる。原点オフセットがない場合、Zは、R’の関数である。しかし、原点オ
フセットがある場合、ZをR’−L’の関数にすることができ、これにより、計算処理は
、この結果Zの小さな値が得られる場合により正確なものとなる。
より、符号なし算術演算を伴うこのより正確な方法をさらに詳しく述べる。
− 上述のようにB、F、G、およびJに対する値を選択する。
− Z=Ceil(Log2(R’−L’))+Fと設定する。
− M=B+F−(G+J+Z)と設定する。
− 式(18)、(19)、および(20)それぞれで上に指定されているようにS、
C、およびDを計算するが、ただし、Dは、符号付き数として計算される。
− E=D>>Sと設定する。
− D’=D−(E<<S)と設定する。
− 次いで、位置計算をt’=((j*C+D’)>>S)+Eとして実行することが
できる。
’=((j*C+D’)>>S)+Eの数学的結果は、実際には、(j*C+D)の値が
ときには0から2B−1までの値範囲を外れるが、(j*C+D’)の値はそうでないこ
とを除き式t’=(j*C+D)>>Sの結果と理論上常に同じになる。
アップサンプリングしたい場合、この第2の実施例の位置計算手法を使用して、F=4、
G=2、J=1、M=19、S=18、およびZ=14を用いることができる。j*C+
D’のすべての値が非負となるように原点をオフセットし、符号なし算術演算を使用する
0から2B−1までのBビット計算範囲を使用できるようにする代わりに、同じように働
く可能な別の方法として、さらに2(B−1)だけ原点をさらに右にオフセットし、符号
付き算術演算を使用する−2(B−1)から2(B−1)−1までのBビット計算範囲を
使用できるようにする方法がある。
、R’−L’が2の整数乗に非常に近い(または等しい)場合に必要な「コーナーケース
」修正がありうる。
生成されるサンプルの範囲をカバーするjのすべての値(つまり、LとRの間のTのす
べての値)に対し同じ変数値C、D’、S、およびEを用いて、同じ式、例えば、t’=
((j*C+D’)>>S)+Eを使用して計算を実行できるような設計を行う方法につ
いて説明した。次に、この仮定を緩和し、精度を大きくし、および/または計算ダイナミ
ックレンジ要件を下げることができる方法について説明する。
で並ぶ位置に連続するサンプル列を生成する。上のV.B.2節で説明されている第2の
例示的な位置手法では、われわれは、オフセットパラメータEを使用して原点を変更する
ことで、位置計算の(j*C+D’)部分を計算するために使用されるレジスタのBビッ
トダイナミックレンジを活用する方法を示した。
に留意されたい。そのため、(j*C+D’)の計算に対する残りの主な問題点は、j*
Cの大きさである。
グプロセスを実行して、高解像度の画像において整数値増分でサンプル列を生成するが、
例えば、連続生成されるサンプル間に2Jの間隔を入れる。そこで、pおよびNの何らか
の値についてi=0からN−1に対する位置Ti=(p+i*2J)÷2Jに対応する位
置t’iを計算したい。
されているように擬似コードで要約できる。iがNに向かって大きくなるにつれ、qの値
は増大し、qの最大値は、Bビットの利用可能なダイナミックレンジの範囲内に保持され
なければならない。qについて計算された最大値は、(p+(N−1)*2J)*C+D
’である。
を複数の段、例えば、2段に分けることを考える。例えば、2段プロセスでは、第1段で
、第1のN0<N個のサンプルを生成し、第2段で、残りN−N0個のサンプルを生成す
る。さらに、pは、そのループに関して一定であるため、第1段の前にその影響をD’お
よびEに移動することができる。この結果、図13の擬似コード1300に例示されてい
る2段プロセスが得られる。
最下位ビット以外のすべてが、Eに移動されている(つまり、第1段についてはE0に、
第2段についてはE1に移動する)ように原点がリセットされている。そのため、2段の
それぞれの演算の際に、qは、より小さなダイナミックレンジを必要とする。プロセスを
このように複数の段に分けた後、qの最大値は、N0*C’+D0、または((N−N0
−1)*C’+D1のいずれか大きい方となる。しかし、D0およびD1はそれぞれが有
する符号なしダイナミックレンジのビット数はSビット以下なので、これは、通常、すで
に説明されている単一段設計の場合よりも小さい最大値となる。この段で生成されるサン
プルの数(つまり、第1段についてはN0、第2段についてはN−N0)は、関連する計
算に対するダイナミックレンジに影響を及ぼす可能性がある。例えば、それぞれの段にお
いて少ないサンプル数を使用すると、関連する計算に対するダイナミックレンジが小さく
なる。
プルの生成は、さらに、そのような小さな任意の個数の段に分解されうる。例えば、プロ
セスは、例えば、8または16個の連続サンプルのブロックがそれぞれの段で生成される
ように等しいサイズの複数の段に分けることができるであろう。この手法を使用すること
で、qを計算するためダイナミックレンジBの必要なビット数を減らすか、または計算の
精度を高める(SおよびG+Mを大きくする)一方で、ダイナミックレンジを同じに保つ
か、またはこれら2つの利点を同時に保持することができる。
号用のアナログ−デジタル変換器から到着するとともにサンプリングレート変換を実行す
る場合など、入力サンプルの非常に長い列(概念上、その列は無限長となりうる)にそっ
て連続再サンプリングプロセスを実行するために使用することができる。明らかに、プロ
セスを有限サイズの複数の段に分割し、原点をそれぞれの段から徐々に次の段へとリセッ
トしなければ、これが処理ワード長における無限ダイナミックレンジを必要とするので、
無限長のサンプル列は前の節で説明されている手法により処理できない場合がある。しか
し、これらの手法を実効無限列長に適用する際の困難は、1÷2Gの倍数を表す整数単位
で仮説的ベンチマーク位置L’およびR’の表現に丸め誤差が一切伴わないときにのみ実
効無限長への適用が有用であるので、そのような手法に対する実質的制限ではない。
演算においてどのようなものであれ丸め誤差の「ドリフト」累積を生じることなく、無限
長サンプル列にそって計算を実行する手段が実現される。
上述の多段分解概念に対する興味深い特別なケースは、それぞれの段で生成されるサン
プルの数が1段当たりたった1つのサンプルにまで減らされた場合である。図14の擬似
コード1400は、i=0からN−1に対するN個の位置t’iを生成するプロセスを表
す。
ンサンプリングプロセスにも適用可能であるけれども)、iの増分毎に、高解像度の画像
内に1の間隔があり、したがって、低解像度の画像内に1以下の増分があることがわかる
。低解像度の画像内の空間位置における1の増分は、C’に対する2(S+F)の値に対
応する。また、D’<2Sであることがわかる。したがって、q=C’+D’の範囲は、
0から2(S+F)+2S未満までであり、したがって、qは、符号なし整数演算を使用
してB=S+F+1ビット以下のダイナミックレンジ要件で計算できる。一実装では、こ
のダイナミックレンジ要件は、画像サイズに対して不変である(つまり、R’またはR’
−L’の値に依存しない)。
非常に近いアップサンプリング比をサポートする実際の必要性はありえない。このような
アプリケーションでは、C’は、実際には、S+F以下のビットを必要とすると仮定する
ことができる。
アップサンプリングしたい場合、この方法を使用して、F=4、G=2、J=1、M=2
9、S=28、およびZ=14を用いることができる。この結果は異常に正確であるため
、Bの小さい値がより妥当な選択のように見える。
配列をアップサンプリングしたい場合、この方法を使用して、F=4、G=2、J=1、
M=13、S=12、およびZ=14を用いることができる。
が得られる。例えば、アップサンプリング比が2よりも著しく大きい場合、ダイナミック
レンジ要件は、もう1つのビットだけ低減され、4、16などよりも大きなアップサンプ
リング比についても同様に低減される。
計算手法に関する)変更はどれも、C、D、およびSの与えられた値について位置t’i
の実際の計算された値に影響を及ぼすことはない。この計算をサポートするのに必要なダ
イナミックレンジのみが変更される。
ない。この事実は、いくつかの計算プロセッサに対する計算時間を短縮するうえで有利で
あると思われる。
2:1、3:2などの共通再サンプリング比では−位置L’およびR”を1÷2G単位
の整数として近似するのに丸めが必要ない場合−これらの方法を使用するときに丸め誤差
はまったくない(最終結果を位置計算法に関係なく存在する誤差である1÷2Fを単位と
する整数に丸めたときに発生しうる丸め誤差以外)。
輝度サンプリンググリッドインデックス座標に関して、完全な新しい(アップサンプリ
ングされた)画像および参照画像配列の正確なアライメントを仮定すると、現在画像座標
における位置LおよびRは、
方向または水平方向の数である。同等のことであるが、画像空間座標からグリッドインデ
ックス値に変換するときに、画像空間座標系の原点をグリッドインデックス0の位置の左
(または上)、半サンプル分のところに設定し、1/2を加えることが可能であり、これ
により、空間座標系内で計算を実行したときに負の数を扱わなくて済む。
プリンググリッド座標を基準とし、この場合、Wは、新しい画像ではなく、参照画像内の
サンプルの数である。
の状況は、いくぶん単純ではない。輝度に関して色度サンプルの指定されたアライメント
を構成するために、色度サンプルにより表現される画像矩形を輝度サンプルにより表現さ
れる矩形と同じものであると考える。これにより、以下のケースが生じる。
− 水平方向に、4:2:0の色度サンプリングタイプ0、2、および4(図5Dを参
照)については、現在画像座標は、
− 水平方向に、4:2:0の色度サンプリングタイプ3、1、および5(図5Dを参
照)については、現在画像座標は、
− 垂直方向に、4:2:0の色度サンプリングタイプ2および3(図5Dを参照)に
ついては、現在画像座標は、
− 垂直方向に、4:2:0の色度サンプリングタイプ0および1(図5Dを参照)に
ついては、現在画像座標は、
− 垂直方向に、4:2:0の色度サンプリングタイプ4および5(図5Dを参照)に
ついては、現在画像座標は、
− 水平方向に、4:2:2色度サンプリングについて、典型的には業界慣行で使用さ
れる4:2:2サンプリングに対する現在画像座標は、
− 垂直方向に、4:2:2色度サンプリングについて、典型的には業界慣行で使用さ
れる4:2:2サンプリングに対する現在画像座標は、
− 水平方向と垂直方向の両方で、4:4:4色度サンプリングについて、現在画像座
標は、
を扱わなくて済むようにできる。
されるサンプルの整数座標位置を調節して、分数オフセットLを補正し、節V.Bの末尾
に示されている変換を適用することにより計算される。概念上、結果をFビットだけ右に
シフトすると、整数座標ポインタは参照画像を指し、左シフトされた整数座標(Fビット
だけシフトされた)を減算すると、フェーズオフセット剰余が得られる。
この節では、上の節V.C.4の位置計算方法を、H.264 SVC Extens
ionに使用されうるアップサンプリングプロセスなどの特定のアップサンプリングプロ
セスにマッピングする方法を説明している。位置計算は、非常に融通の利く方法で適用さ
れ、様々な色度形式で輝度と色度の両方のチャネル、さらにはプログレッシブフレーム形
式およびインターレースフレーム形式の両方について精度を最大化する。この節で説明さ
れる手法は、実装に応じて、また異なるアップサンプリングプロセスに関して異なる。
、以下の式においてこれ以降deltaX(またはdeltaY))は、2J(ただし、
輝度に対してはJ=1、色度に対しては2)に等しいスケーリング係数だけスケールアッ
プされ、左から右へ、または上から下へそれぞれのサンプル位置を生成するために加えら
れる増分を形成する。スケーリングは、アップスケーリング増分が16ビットに収まるよ
うに選択された。
位置計算方法を適用する直接的な方法は、輝度に対しJ=1、色度に対し2として、2
Jに等しいスケーリング係数により再スケーリングパラメータをスケールアップし、左か
ら右へ、上から下へそれぞれのサンプル位置を生成するために加えられる増分を形成する
ことである。次いで、アップスケーリングされた増分が16ビットなどの特定のワード長
に収まるようにスケーリングパラメータが選択される。以下の節では、位置精度を最大に
するより柔軟な設計が説明される。
「直接的」輝度位置計算法は、F=4およびS=12に対し以下のサンプル式で要約す
ることができる(水平方向にそって)。
deltaX=Floor(((BasePicWidth<<15)+(Scale
dBaseWidth>>1))÷ScaledBaseWidth)
xf=((2*(xP−ScaledBaseLeftOffset)+1)*del
taX−30720)>>12
ここで、BasePicWidthは、ベースレイヤの水平解像度または低解像度画像
であり、ScaledBaseWidthは、高解像度画像領域またはウィンドウの水平
解像度であり、deltaXは、中間再スケーリングパラメータであり、この場合、32
768の丸めた近似にアップサンプリング比の逆数を掛けた値であり、xPは、高解像度
画像内のサンプル位置を表し、ScaledBaseLeftOffsetは、高解像度
画像内の画像ウィンドウの相対位置を表し、Floor()は、その引数以下の最大整数
を表す。定数値30720は、上の節V.Cの始めに説明されているように右シフトし、
輝度サンプリンググリッド参照位置の半サンプルオフセットについて2S*2F/2を減
算する前に、2S−1を丸めオフセットとして加えた結果得られる。
する。そして、数量2*deltaXのLSBは、常に、ゼロであり、したがって計算精
度の1ビットは、本質的に無駄になる。これらの式を以下に変更することにより、複雑度
を著しく増大することなく、約1エクストラビットの精度が得られる。
deltaX=Floor(((BasePicWidth<<16)+(Scale
dBaseWidth>>1))÷ScaledBaseWidth)
xf=((xP−ScaledBaseLeftOffset)*deltaX+(d
eltaX>>1)−30720)>>12
または、以下のように(少し)精度が高い形式。
deltaXa=Floor(((BasePicWidth<<16)+(Scal
edBaseWidth>>1))÷ScaledBaseWidth)
deltaXa=Floor(((BasePicWidth<<15)+(Scal
edBaseWidth>>1))÷ScaledBaseWidth)
xf=((xP−ScaledBaseLeftOffset)*deltaXa+d
eltaXb−30720)>>12
これら2つの形式のうちの後者は、精度が高く,複雑度影響度が無視できるくらい小さ
いため、示唆される(精度差も非常に小さく見えるが)。
とで、他の計算を簡素化することができる。deltaXaの値は、常に、2*delt
aXa±1の範囲内にある。したがって、以下の簡素化された規則を、deltaXaの
計算に除算を実行する必要がなくなるように導出することができる。
deltaXa=(deltaXb<<1)
remainderDiff=(BasePicWidth<<16)+(Scale
dBaseWidth>>1)−deltaX
(remaindeDiff<0)の場合、
deltaXa−−
そうでなく、(remainderDiff≧SealedBaseWidth)の場
合、
deltaXa++
設計のこの部分では、色度チャネルに対して、2倍乗算器の代わりに、4倍乗算器が使
用され、4:2:0サンプリングに対し色度位置を表現することができる(輝度について
説明されているようにJ=1ではなく色度に対しJ=2を使用する)。したがって、「直
接的」な式は以下のとおりである。
deltaXC=Floor(((BasePicWidthC<<14)+(Sca
ledBaseWidthC>>1))÷ScaledBaseWidthC)
xfC=((((4*(xC−ScaledBaseLeftOffsetC)+(2
+scaledBaseChromaPhaseX))*deltaXC)+2048)
>>12)−4*(2+baseChromaPhaseX)
ここで、baseChromaPhaseXおよびscaledBaseChroma
PhaseXは、それぞれ、低解像度および高解像度画像に対する色度サンプリンググリ
ッド位置オフセットを表す。これらのパラメータの値は、符号器から復号器に送られる情
報として明示的に伝達されるか、またはアプリケーションにより決定された特定の値を持
つことができる。他のすべての変数は、色度チャネルへのアプリケーションを表す「C」
サフィックスを付加した輝度チャネルについて定義されているものと似た変数である。
したがって、これらの式を以下に変更することにより、複雑度を著しく増大することなく
、約2エクストラビットの精度が得られる。
deltaXC=Floor(((BasePicWidthC<<16)+(Sca
ledBaseWidthC>>1))÷ScaledBaseWidthC)
xfC=(((xC−ScaledBaseLeftOffsetC)*deltaX
C+(2+scaledBaseChromaPhaseX)*((deltaXC+K
)>>2)+2048)>>12)−4*(2+baseChromaPhaseX)
ただし、K=0、1、または2。K=0を使用すると、余分な演算を避けられる。K=1
またはK=2を使用すると、精度が少し高くなる。
deltaXCa=Floor(((BasePicWidthC<<16)+(Sc
aledBaseWidthC>>1))÷ScaledBaseWidthC)
deltaXCb=Floor(((BasePicWidthC<<14)+(Sc
aledBaseWidthC>>1))÷ScaledBaseWidthC)
xfC=(((xC−ScaledBaseLeftOffsetC)*deltaX
Ca+(2+scaledBaseChromaPhaseX)*deltaXCb+2
048)>>12)−4*(2+baseChromaPhaseX)
輝度の場合のように、後者の変更形態は、複雑度の差が無視できるくらい小さいように
思われるため好ましい(精度差も非常に小さいにように思われるが)。
画像の座標系に対する参照は、通常、輝度フレーム座標内の半サンプル位置に基づいて
おり、その結果、上述のように輝度座標参照位置に対し2のスケール係数が得られる。輝
度フレーム座標内の半サンプルシフトは、4:2:0色度フレーム座標内の1/4サンプ
ルシフトに対応するが、これは、現在上述のように色度座標に対するスケーリングにおい
て係数2ではなく係数4を使用しているからである。
ルドを表す画像に対する演算に実質的違いはない。しかし、符号化された画像が、単一フ
ィールドを表す場合、輝度フレーム垂直座標内の半サンプル位置シフトは、輝度フィール
ド垂直座標内の1/4サンプル位置シフトに対応する。そのため、垂直輝度座標位置の計
算では、スケール係数として2ではなく4が適用されるべきである。
半サンプル位置シフトは、色度フィールド垂直座標内の1/8サンプル位置シフトに対応
する。そのため、垂直色度座標位置の計算では、スケール係数として4ではなく8が適用
されるべきである。
符号化フレーム画像内の増分計算について上で説明されているのと同じ方法でdelta
Y垂直増分計算に組み込むことができる。この場合、適用されるスケーリング係数が大き
いため、精度改善は、輝度位置については約2ビットの精度追加、色度(垂直方向)につ
いては3ビットの精度追加となる。
節V.D.1.bの位置計算方法では、色度については輝度と異なる増倍率を使用する
必要がある。これは4:2:0ビデオについてはもっともなことであり、また水平方向で
4:2:2ビデオについては妥当であるが、垂直方向で4:2:2ビデオ、または水平方
向もしくは垂直方向のいずれかで4:4:4ビデオについては必要でないが、それは、こ
れらの場合において、輝度および色度解像度は、同じであり、したがって輝度および色度
サンプルは、たぶん同一の場所に配置されるからである。
、フェーズシフトが意図されていない場合であっても、丸めが2つのケースにおいて少し
異なる形で実行されるという理由だけで、輝度および色度位置を決定するために別々の計
算を必要とする可能性がある。これは、望ましくなく、したがって、4:2:2および4
:4:4サンプリング構造とともに使用するために、色度の異なる取り扱いが、この節で
提案されている。
4:2:2ビデオの垂直次元、ならびに4:4:4ビデオの垂直および水平次元の両方
について、色度フェーズのカスタム制御の明白な必要性はない。したがって、色度解像度
が、ある次元において輝度解像度と同じである場合には必ず、色度位置を計算する式を修
正すべきであり、その結果、色度サンプリング形式が特定の次元において輝度と色度につ
いて同じ解像度を有する場合に必ず、輝度サンプルと色度サンプルの両方についてまった
く同じ位置を計算することになる。オプションの1つは、色度位置変数を輝度位置変数と
等しくなるように設定することであり、もう1つのオプションは、同じ結果となるように
色度位置式をセットアップすることである。
4:2:2ビデオに対し色度フェーズ調節を水平方向に行えるようにすることに機能的
問題はないが、節V.D.1.bの式のscaledBaseChromaPhaseX
またはBaseChromaPhaseXに対し値−1に対応するものなど、4:2:2
に使用されている水平サブサンプリング構造が1種類しかない場合、カラーサンプリング
形式が4:2:2であるときに必ずそれらの値が使用されるよう強制することを考慮する
ことが望ましい場合がある。
本明細書で説明されている手法およびツールは、さらに、例えば、非特許文献1の付録
Pに示されているように参照画像再サンプリングを使用して多重解像度ビデオ符号化に適
用されうる。
ンプリングだけでなく、残差データ信号または他の信号のアップサンプリングにも適用さ
れうる。例えば、本明細書で説明されている手法およびツールは、さらに、例えば、非特
許文献1の付録Qに示されているように画像解像度を落とした更新符号化用の残差データ
信号のアップサンプリングに適用されうる。他の実施例では、本明細書で説明されている
手法およびツールは、さらに、空間スケーラブルなビデオ符号化の設計において低解像度
の残差信号から高解像度残差信号を予測するための残差データ信号のアップサンプリング
に適用されうる。他の実施例として、本明細書で説明されている手法およびツールは、さ
らに、空間スケーラブルなビデオ符号化の設計において動きベクトルフィールドのアップ
サンプリングに適用されうる。他の実施例として、本明細書で説明されている手法および
ツールは、さらに、グラフィック画像、写真静止画像、オーディオサンプル信号などのア
ップサンプリングに適用されうる。
されている実施形態は、そのような原理から逸脱することなく配列および詳細について修
正されうることは理解されるであろう。本明細書で説明されているプログラム、プロセス
、または方法は、特に断りのない限り、特定の種類のコンピュータ環境に関係または制限
されないことは理解されるであろう。様々な種類の汎用または専用コンピュータ環境を、
本明細書で説明されている教示とともに使用するか、または本明細書で説明されている教
示に従って演算を実行することができる。ソフトウェアで示されている説明されている実
施形態の要素は、ハードウェハで実装することができ、またその逆も可能である。
物の範囲および精神の範囲内に収まりうるすべての実施形態を本発明として請求する。
Claims (15)
- 画像あるいは映像の符号化または復号化を行うコンピューティング装置でベースレイヤ画像データのアップサンプリングを実行する方法であって、前記コンピューティング装置は、プロセッサとメモリとを含んでおり、前記方法は、アップサンプルされた配列における位置について、
前記コンピューティング装置によって、前記ベースレイヤ画像データにおける位置を計算するステップを含み、yは前記ベースレイヤ画像データにおける位置の垂直値を示し、
yの導出は、(j*C+D)>>Sに基づいて計算され、
jはアップサンプルされた配列における位置についての垂直値を示し、
Cは垂直スケール係数の逆数を掛けた2S+F に基づき、
Dはオフセットであり、
Sはシフト値であり、
Fはyの分数部分におけるビット数に基づいている
ことを特徴とする方法。 - jおよびDは、前記ベースレイヤ画像データが輝度かまたは色度かに基づいて異なることを特徴とする請求項1に記載の方法。
- Sはダイナミックレンジをセットし、
Dは垂直スケール係数およびSに基づいて異なることを特徴とする請求項1に記載の方法。 - Fは4であり、Sは12であることを特徴とする請求項1に記載の方法。
- xは、前記ベースレイヤ画像データにおける前記位置のための水平値を示し、xの導出は、(i*C’+D’)>>S’に基づいて計算され、
iはアップサンプルされた配列における位置についての水平値を示し、
C’は水平スケール係数の逆数を掛けた2S’+F’に基づき、
D’はオフセットであり、
S’はSと同じまたは異なるシフト値であり、
F’はxの分数部分におけるビット数に基づいている
ことを特徴とする請求項1に記載の方法。 - C’は、((BasePicWidth<<16)+(ScaledBaseWidth>>1))÷ScaledBaseWidth)にしたがって、生成され、
BasePicWidthは、前記ベースレイヤ画像データのための水平解像度を示し、ScaledBaseWidthは、前記アップサンプリングの後の水平解像度を示すことを特徴とする請求項5に記載の方法。 - xはさらに、オフセットEに依存し、xの導出は、((j*C’+D’)>>S’)+Eに基づいて計算されることを特徴とする請求項5に記載の方法。
- yのF個の最小位ビットに基づいて垂直フィルタを選択し、yの残りのビットに基づいてフィルタされる垂直整数位置を選択するステップであって、前記ベースレイヤ画像データの垂直補間は、前記垂直整数位置で前記垂直フィルタを使用する、ステップと、
xのF’個の最小位ビットに基づいて水平フィルタを選択し、xの残りのビットに基づいてフィルタされる水平整数位置を選択するステップであって、前記ベースレイヤ画像データの水平補間は、前記水平整数位置で前記水平フィルタを使用する、ステップと
をさらに含むことを特徴とする請求項5に記載の方法。 - 前記ベースレイヤ画像データにおける前記位置で値を補間するステップと、
前記アップサンプルされた配列における前記位置で補間された値を割り当てるステップと
をさらに含むことを特徴とする請求項5に記載の方法。 - プロセッサ、メモリ、およびコンピュータにアップサンプリングの方法を実行させるコンピュータ可読実行命令を格納するコンピュータ可読ストレージを含むシステムであって、前記方法は、アップサンプルされた配列における位置について、
前記コンピューティング装置によって、前記ベースレイヤ画像データにおける位置を計算するステップを含み、yは前記ベースレイヤ画像データにおける位置の垂直値を示し、
yの導出は、(j*C+D)>>Sに基づいて計算され、
jはアップサンプルされた配列における位置についての垂直値を示し、
Cは垂直スケール係数の逆数を掛けた2S+Fに基づき、
Dはオフセットであり、
Sはシフト値であり、
Fはyの分数部分におけるビット数に基づいている
ことを特徴とするシステム。 - jおよびDは、前記ベースレイヤ画像データが輝度かまたは色度かに基づいて異なり、
Dは、垂直スケール係数およびSに基づいて異なり、
Fは4であり、
Sは12であることを特徴とする請求項10に記載のシステム。 - xは、前記ベースレイヤ画像データにおける前記位置のための水平値を示し、xの導出は、(i*C’+D’)>>S’に基づいて計算され、
iはアップサンプルされた配列における位置についての水平値を示し、
C’は水平スケール係数の逆数を掛けた2S’+F’ に基づき、
D’はオフセットであり、
S’はSと同じまたは異なるシフト値であり、
F’はxの分数部分におけるビット数に基づいている
ことを特徴とする請求項1に記載の方法。 - F’は4であり、
S’は12である
C’は、((BasePicWidth<<16)+(ScaledBaseWidth>>1))÷ScaledBaseWidth)にしたがって、生成され、
BasePicWidthは、前記ベースレイヤ画像データのための水平解像度を示し、ScaledBaseWidthは、前記アップサンプリングの後の水平解像度を示すことを特徴とする請求項12に記載の方法。 - yのF個の最小位ビットに基づいて垂直フィルタを選択し、yの残りのビットに基づいてフィルタされる垂直整数位置を選択するステップであって、前記ベースレイヤ画像データの垂直補間は、前記垂直整数位置で前記垂直フィルタを使用する、ステップと、
xのF’個の最小位ビットに基づいて水平フィルタを選択し、xの残りのビットに基づいてフィルタされる水平整数位置を選択するステップであって、前記ベースレイヤ画像データの水平補間は、前記水平整数位置で前記水平フィルタを使用する、ステップと
をさらに含むことを特徴とする請求項12に記載の方法。 - プロセッサ、メモリ、無線通信接続、ディスプレイ、およびコンピュータにアップサンプリングの方法を実行させるコンピュータ可読実行命令を格納するコンピュータ可読ストレージを含むシステムであって、前記方法は、
前記無線通信接続を通じて、ビットストリームにおける符号化されたデータを受信するステップと、
前記符号化されたデータを復号化して映像を再構成するステップであって、
ベースレイヤ画像データを復号するステップと、
前記ベースレイヤ画像データをアップサンプリングするステップであって、
前記ベースレイヤ画像データにおける位置のための垂直値yを計算するステップであって、yの導出は、(j*C+D)>>Sに基づいて計算され、jはアップサンプルされた配列における前記位置についての垂直値を示し、Cは垂直スケール係数の逆数を掛けた2 S+F に基づき、Dはオフセットであり、Sはシフト値であり、Fはyの分数部におけるビット数に基づいている、ステップと、
前記ベースレイヤ画像データにおける位置のための水平値xを計算するステップであって、xの導出は(i*C’+D’)>>S’に基づいて計算され、iはアップサンプルされた配列における位置についての水平値を示し、C’は水平スケール係数の逆数を掛けた2 S’+F’ に基づき、D’はオフセットであり、S’はSと同じまたは異なるシフト値であり、F’はxの分数部分におけるビット数に基づいている、ステップと、
yのF個の最小位ビットに基づいて垂直フィルタを選択し、yの残りのビットに基づいてフィルタされる垂直整数位置を選択するステップであって、前記ベースレイヤ画像データの垂直補間は、前記垂直整数位置で前記垂直フィルタを使用する、ステップと、
xのF’個の最小位ビットに基づいて水平フィルタを選択し、xの残りのビットに基づいてフィルタされる水平整数位置を選択するステップであって、前記ベースレイヤ画像データの水平補間は、前記水平整数位置で前記水平フィルタを使用する、ステップと、を含む、ステップと、
増大レイヤを復号するステップと、を含む、ステップと、
前記再構成された映像を前記ディスプレイ上に出力するステップと
を含む
ことを特徴とするシステム。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US75684606P | 2006-01-06 | 2006-01-06 | |
US60/756,846 | 2006-01-06 | ||
US78657306P | 2006-03-27 | 2006-03-27 | |
US60/786,573 | 2006-03-27 | ||
US82951506P | 2006-10-13 | 2006-10-13 | |
US60/829,515 | 2006-10-13 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008549559A Division JP5302010B2 (ja) | 2006-01-06 | 2007-01-08 | 多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012191655A JP2012191655A (ja) | 2012-10-04 |
JP5590574B2 true JP5590574B2 (ja) | 2014-09-17 |
Family
ID=38256899
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008549559A Active JP5302010B2 (ja) | 2006-01-06 | 2007-01-08 | 多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算方法 |
JP2012120308A Active JP5590574B2 (ja) | 2006-01-06 | 2012-05-25 | 多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008549559A Active JP5302010B2 (ja) | 2006-01-06 | 2007-01-08 | 多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算方法 |
Country Status (11)
Country | Link |
---|---|
US (4) | US7956930B2 (ja) |
EP (1) | EP1985120B1 (ja) |
JP (2) | JP5302010B2 (ja) |
KR (2) | KR101354741B1 (ja) |
CN (2) | CN101366281B (ja) |
AU (2) | AU2007205175B2 (ja) |
CA (1) | CA2635898C (ja) |
HK (1) | HK1161016A1 (ja) |
IL (2) | IL192420A (ja) |
RU (2) | RU2420915C2 (ja) |
WO (1) | WO2007081752A2 (ja) |
Families Citing this family (169)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8340177B2 (en) * | 2004-07-12 | 2012-12-25 | Microsoft Corporation | Embedded base layer codec for 3D sub-band coding |
US8442108B2 (en) * | 2004-07-12 | 2013-05-14 | Microsoft Corporation | Adaptive updates in motion-compensated temporal filtering |
US8374238B2 (en) * | 2004-07-13 | 2013-02-12 | Microsoft Corporation | Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video |
US9071847B2 (en) * | 2004-10-06 | 2015-06-30 | Microsoft Technology Licensing, Llc | Variable coding resolution in video codec |
US8243820B2 (en) * | 2004-10-06 | 2012-08-14 | Microsoft Corporation | Decoding variable coded resolution video with native range/resolution post-processing operation |
US7956930B2 (en) | 2006-01-06 | 2011-06-07 | Microsoft Corporation | Resampling and picture resizing operations for multi-resolution video coding and decoding |
CN101589625B (zh) * | 2006-10-25 | 2011-09-21 | 弗劳恩霍夫应用研究促进协会 | 质量可缩放编码 |
US8199812B2 (en) * | 2007-01-09 | 2012-06-12 | Qualcomm Incorporated | Adaptive upsampling for scalable video coding |
US8233536B2 (en) * | 2007-01-23 | 2012-07-31 | Sharp Laboratories Of America, Inc. | Methods and systems for multiplication-free inter-layer image prediction |
US8665942B2 (en) * | 2007-01-23 | 2014-03-04 | Sharp Laboratories Of America, Inc. | Methods and systems for inter-layer image prediction signaling |
US8503524B2 (en) * | 2007-01-23 | 2013-08-06 | Sharp Laboratories Of America, Inc. | Methods and systems for inter-layer image prediction |
KR100834443B1 (ko) * | 2007-02-27 | 2008-06-04 | 삼성전자주식회사 | 비디오 코덱을 위한 메모리 구조 및 메모리 액세스 방법 |
US8107571B2 (en) * | 2007-03-20 | 2012-01-31 | Microsoft Corporation | Parameterized filters and signaling techniques |
US8619874B2 (en) * | 2007-04-13 | 2013-12-31 | Apple Inc. | Method and system for video encoding and decoding |
KR20080114388A (ko) * | 2007-06-27 | 2008-12-31 | 삼성전자주식회사 | 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법 |
KR101365596B1 (ko) * | 2007-09-14 | 2014-03-12 | 삼성전자주식회사 | 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법 |
US8989553B2 (en) * | 2008-01-12 | 2015-03-24 | Innotive Inc. Korea | Video processing system and video processing method |
US20100278236A1 (en) * | 2008-01-17 | 2010-11-04 | Hua Yang | Reduced video flicker |
US8953673B2 (en) * | 2008-02-29 | 2015-02-10 | Microsoft Corporation | Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers |
KR20090097015A (ko) * | 2008-03-10 | 2009-09-15 | 삼성전자주식회사 | 스케일러블 영상 부호화장치 및 스케일러블 영상복호화장치 |
US8711948B2 (en) | 2008-03-21 | 2014-04-29 | Microsoft Corporation | Motion-compensated prediction of inter-layer residuals |
FR2931610B1 (fr) * | 2008-05-20 | 2010-12-17 | Canon Kk | Procede et un dispositif de transmission de donnees d'images |
JP2009290552A (ja) * | 2008-05-29 | 2009-12-10 | Fujifilm Corp | 動画圧縮装置および動画圧縮プログラム |
JP5369893B2 (ja) * | 2008-05-30 | 2013-12-18 | 株式会社Jvcケンウッド | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、動画像復号プログラム、動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラム |
US9571856B2 (en) | 2008-08-25 | 2017-02-14 | Microsoft Technology Licensing, Llc | Conversion operations in scalable video encoding and decoding |
US8213503B2 (en) | 2008-09-05 | 2012-07-03 | Microsoft Corporation | Skip modes for inter-layer residual video coding and decoding |
US8194977B2 (en) * | 2008-12-09 | 2012-06-05 | Microsoft Corporation | Remote desktop protocol compression acceleration using single instruction, multiple dispatch instructions |
US20100177162A1 (en) * | 2009-01-15 | 2010-07-15 | Charles Macfarlane | Method and system for enabling 3d video and image processing using one full resolution video stream and one lower resolution video stream |
US9036714B2 (en) * | 2009-01-26 | 2015-05-19 | Thomson Licensing | Frame packing for video coding |
WO2010093430A1 (en) * | 2009-02-11 | 2010-08-19 | Packetvideo Corp. | System and method for frame interpolation for a compressed video bitstream |
US20100226437A1 (en) * | 2009-03-06 | 2010-09-09 | Sony Corporation, A Japanese Corporation | Reduced-resolution decoding of avc bit streams for transcoding or display at lower resolution |
US9020287B2 (en) * | 2009-04-14 | 2015-04-28 | Thomson Licensing | Methods and apparatus for filter parameter determination and selection responsive to variable transforms in sparsity-based de-artifact filtering |
US9774882B2 (en) * | 2009-07-04 | 2017-09-26 | Dolby Laboratories Licensing Corporation | Encoding and decoding architectures for format compatible 3D video delivery |
US8699565B2 (en) * | 2009-08-27 | 2014-04-15 | Hewlett-Packard Development Company, L.P. | Method and system for mixed-resolution low-complexity information coding and a corresponding method and system for decoding coded information |
US8487929B2 (en) * | 2009-09-09 | 2013-07-16 | Advanced Micro Devices, Inc. | Resolution enhancement of video stream based on spatial and temporal correlation |
US8665968B2 (en) * | 2009-09-30 | 2014-03-04 | Broadcom Corporation | Method and system for 3D video coding using SVC spatial scalability |
JP2011109469A (ja) * | 2009-11-18 | 2011-06-02 | Canon Inc | コンテンツ受信装置及びコンテンツ受信装置の制御方法 |
US9014276B2 (en) * | 2009-12-04 | 2015-04-21 | Broadcom Corporation | Method and system for 3D video coding using SVC temporal and spatial scalabilities |
US8611414B2 (en) * | 2010-02-17 | 2013-12-17 | University-Industry Cooperation Group Of Kyung Hee University | Video signal processing and encoding |
JP5544996B2 (ja) * | 2010-04-09 | 2014-07-09 | ソニー株式会社 | 画像処理装置および方法 |
US9047531B2 (en) * | 2010-05-21 | 2015-06-02 | Hand Held Products, Inc. | Interactive user interface for capturing a document in an image signal |
CN101895748B (zh) * | 2010-06-21 | 2014-03-26 | 华为终端有限公司 | 一种编解码方法以及编解码装置 |
JP5693716B2 (ja) | 2010-07-08 | 2015-04-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 参照処理信号を使った多層画像およびビデオ送達のためのシステムおよび方法 |
US8910046B2 (en) | 2010-07-15 | 2014-12-09 | Apple Inc. | Media-editing application with anchored timeline |
CN105847781B (zh) | 2010-07-21 | 2018-03-20 | 杜比实验室特许公司 | 用于多层帧兼容视频传输的解码方法 |
MX2013002429A (es) * | 2010-09-03 | 2013-04-08 | Dolby Lab Licensing Corp | Metodo y sistema para compensacion de iluminacion y transicion para codificacion y procesamiento de video. |
US9462220B2 (en) | 2010-12-17 | 2016-10-04 | Microsoft Technology Licensing, Llc | Auto-regressive edge-directed interpolation with backward projection constraint |
US8639053B2 (en) * | 2011-01-18 | 2014-01-28 | Dimension, Inc. | Methods and systems for up-scaling a standard definition (SD) video to high definition (HD) quality |
US9099161B2 (en) | 2011-01-28 | 2015-08-04 | Apple Inc. | Media-editing application with multiple resolution modes |
US9412414B2 (en) | 2011-02-16 | 2016-08-09 | Apple Inc. | Spatial conform operation for a media-editing application |
US8839110B2 (en) * | 2011-02-16 | 2014-09-16 | Apple Inc. | Rate conform operation for a media-editing application |
US11747972B2 (en) | 2011-02-16 | 2023-09-05 | Apple Inc. | Media-editing application with novel editing tools |
CN103354997A (zh) * | 2011-02-18 | 2013-10-16 | 索尼公司 | 图像处理设备和图像处理方法 |
KR20120118781A (ko) * | 2011-04-19 | 2012-10-29 | 삼성전자주식회사 | 다시점 비디오를 위한 단일화된 스케일러블 비디오 부호화 방법 및 그 장치, 다시점 비디오를 위한 단일화된 스케일러블 비디오 복호화 방법 및 그 장치 |
DK3787289T3 (da) | 2011-06-14 | 2022-08-29 | Lg Electronics Inc | Fremgangsmåde til kodning og afkodning af billedinformationer |
CN108391135B (zh) | 2011-06-15 | 2022-07-19 | 韩国电子通信研究院 | 可伸缩解码方法/设备、可伸缩编码方法/设备和介质 |
CN107529708B (zh) | 2011-06-16 | 2019-05-07 | Ge视频压缩有限责任公司 | 解码器、编码器、解码和编码视频的方法及存储介质 |
US8837582B2 (en) * | 2011-06-22 | 2014-09-16 | Blackberry Limited | Compressing image data |
KR20130001541A (ko) | 2011-06-27 | 2013-01-04 | 삼성전자주식회사 | 다시점 영상의 해상도 복원 방법 및 장치 |
KR101727449B1 (ko) * | 2011-06-28 | 2017-04-14 | 닛본 덴끼 가부시끼가이샤 | 영상 양자화 파라미터 복호 방법 |
UA114674C2 (uk) | 2011-07-15 | 2017-07-10 | ДЖ.І. ВІДІЕУ КЕМПРЕШН, ЛЛСі | Ініціалізація контексту в ентропійному кодуванні |
EP2557789B1 (en) | 2011-08-09 | 2017-09-27 | Dolby Laboratories Licensing Corporation | Guided image up-sampling in video coding |
JP2014531807A (ja) | 2011-09-09 | 2014-11-27 | パナモーフ, インコーポレイテッドPanamorph, Inc. | 画像処理システム及び方法 |
US9131245B2 (en) | 2011-09-23 | 2015-09-08 | Qualcomm Incorporated | Reference picture list construction for video coding |
JP5232319B2 (ja) | 2011-10-20 | 2013-07-10 | 株式会社東芝 | 通信装置及び通信方法 |
GB201119206D0 (en) | 2011-11-07 | 2011-12-21 | Canon Kk | Method and device for providing compensation offsets for a set of reconstructed samples of an image |
CN103123718B (zh) * | 2011-11-21 | 2016-06-22 | 腾讯科技(深圳)有限公司 | 一种图像处理方法和系统 |
WO2013081615A1 (en) * | 2011-12-01 | 2013-06-06 | Intel Corporation | Motion estimation methods for residual prediction |
US9111376B2 (en) | 2012-01-26 | 2015-08-18 | Samsung Electronics Co., Ltd. | Image processing method and apparatus for 3D video |
FR2989856B1 (fr) * | 2012-04-23 | 2014-11-28 | Assistance Tech Et Etude De Materiels Electroniques | Compression/decompression progressive d'un flux numerique video comprenant au moins une image entrelacee |
AU2013261845A1 (en) * | 2012-05-14 | 2014-12-11 | Guido MEARDI | Encoding and reconstruction of residual data based on support information |
JP5390667B2 (ja) * | 2012-06-11 | 2014-01-15 | 株式会社東芝 | 映像送信機器及び映像受信機器 |
US9146666B2 (en) * | 2012-06-21 | 2015-09-29 | Sharp Laboratories Of America, Inc. | Touch sensor navigation |
EP2868111A1 (en) * | 2012-07-02 | 2015-05-06 | Cisco Technology, Inc. | Signalling information for consecutive coded video sequences that have the same aspect ratio but different picture resolutions |
CN110087091B (zh) * | 2012-08-06 | 2021-11-12 | Vid拓展公司 | 多层视频编码中用于空间层的采样栅格信息 |
US9350899B2 (en) * | 2012-09-14 | 2016-05-24 | Qualcomm Incorporated | Methods and device for efficient resampling and resizing of digital images |
EP2898694B1 (en) * | 2012-09-24 | 2019-06-19 | Huawei Technologies Co., Ltd. | Video compression with color space scalability |
JP6274108B2 (ja) * | 2012-09-28 | 2018-02-07 | ソニー株式会社 | 符号化装置および符号化方法 |
US20140119446A1 (en) * | 2012-11-01 | 2014-05-01 | Microsoft Corporation | Preserving rounding errors in video coding |
KR102345770B1 (ko) * | 2012-12-04 | 2022-01-03 | 인텔렉추얼디스커버리 주식회사 | 비디오 부호화 및 복호화 방법, 그를 이용한 장치 |
US8891905B2 (en) * | 2012-12-19 | 2014-11-18 | Hong Kong Applied Science And Technology Research Institute Co., Ltd. | Boundary-based high resolution depth mapping |
TWI597968B (zh) * | 2012-12-21 | 2017-09-01 | 杜比實驗室特許公司 | 在高位元深度視訊的可適性編碼中,高精度升取樣 |
EP2942963A4 (en) * | 2013-01-04 | 2016-08-17 | Samsung Electronics Co Ltd | SCALABLE VIDEO ENCODING METHOD AND APPARATUS USING IMAGE OVERHEAD SAMPLING IN CONSIDERATION OF A PHASE AND METHOD AND APPARATUS FOR SCALEABLE VIDEO DECODING |
US10284908B2 (en) * | 2013-02-26 | 2019-05-07 | Comcast Cable Communications, Llc | Providing multiple data transmissions |
ES2617314T3 (es) | 2013-04-05 | 2017-06-16 | Dolby Laboratories Licensing Corporation | Aparato de compresión y método para reducir un ruido de cuantización utilizando una expansión espectral avanzada |
CN105247865A (zh) * | 2013-04-08 | 2016-01-13 | 诺基亚技术有限公司 | 用于视频编码和解码的方法和技术设备 |
US9813723B2 (en) * | 2013-05-03 | 2017-11-07 | Qualcomm Incorporated | Conditionally invoking a resampling process in SHVC |
KR20140138538A (ko) * | 2013-05-24 | 2014-12-04 | 주식회사 케이티 | 복수의 레이어를 지원하는 비디오 코딩 방법 및 장치 |
WO2014189300A1 (ko) * | 2013-05-24 | 2014-11-27 | 주식회사 케이티 | 복수의 레이어를 지원하는 비디오 코딩 방법 및 장치 |
US9635371B2 (en) * | 2013-05-31 | 2017-04-25 | Qualcomm Incorporated | Determining rounding offset using scaling factor in picture resampling |
US9762920B2 (en) * | 2013-06-07 | 2017-09-12 | Qualcomm Incorporated | Dynamic range control of intermediate data in resampling process |
KR102062764B1 (ko) | 2013-07-19 | 2020-02-21 | 삼성전자주식회사 | 모바일 단말 화면을 위한 3k해상도를 갖는 디스플레이 영상 생성 방법 및 장치 |
US9497473B2 (en) * | 2013-10-03 | 2016-11-15 | Qualcomm Incorporated | High precision explicit weighted prediction for video coding |
CN105659602B (zh) | 2013-10-14 | 2019-10-08 | 微软技术许可有限责任公司 | 用于视频和图像编码的帧内块复制预测模式的编码器侧选项 |
KR102257269B1 (ko) | 2013-10-14 | 2021-05-26 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 비디오 및 이미지 코딩 및 디코딩을 위한 인트라 블록 카피 예측 모드의 피쳐 |
KR102275639B1 (ko) | 2013-10-14 | 2021-07-08 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 비디오 및 영상 코딩 및 디코딩에 대한 기본 색상 인덱스 맵 모드의 특징 |
US9648348B2 (en) * | 2013-10-23 | 2017-05-09 | Qualcomm Incorporated | Multi-layer video file format designs |
US9310908B2 (en) | 2013-10-30 | 2016-04-12 | Htc Corporation | Color sampling method and touch control device thereof |
EP2890131A1 (en) * | 2013-12-31 | 2015-07-01 | Patents Factory Ltd. Sp. z o.o. | Video coding with different spatial resolutions for intra-coded frames and inter-coded frames |
EP3090549A1 (en) | 2014-01-02 | 2016-11-09 | VID SCALE, Inc. | Methods and systems for scalable video coding with mixed interlace and progressive content |
US10469863B2 (en) | 2014-01-03 | 2019-11-05 | Microsoft Technology Licensing, Llc | Block vector prediction in video and image coding/decoding |
US10390034B2 (en) | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
US11350015B2 (en) | 2014-01-06 | 2022-05-31 | Panamorph, Inc. | Image processing system and method |
US9749642B2 (en) | 2014-01-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Selection of motion vector precision |
US9774881B2 (en) * | 2014-01-08 | 2017-09-26 | Microsoft Technology Licensing, Llc | Representing motion vectors in an encoded bitstream |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
US10542274B2 (en) | 2014-02-21 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dictionary encoding and decoding of screen content |
US20150264368A1 (en) * | 2014-03-14 | 2015-09-17 | Sony Corporation | Method to bypass re-sampling process in shvc with bit-depth and 1x scalability |
CN103838543A (zh) * | 2014-03-27 | 2014-06-04 | 成都睿明医疗信息技术有限公司 | 屏幕画面共享方法及其系统 |
US9807343B2 (en) | 2014-05-08 | 2017-10-31 | Samsung Electronics Co., Ltd | Apparatus and method for changing mode of device |
US9843812B2 (en) * | 2014-05-23 | 2017-12-12 | Sony Corporation | Video transmission system with color gamut partitioning and method of operation thereof |
US9449239B2 (en) | 2014-05-30 | 2016-09-20 | Apple Inc. | Credit card auto-fill |
US9565370B2 (en) | 2014-05-30 | 2017-02-07 | Apple Inc. | System and method for assisting in computer interpretation of surfaces carrying symbols or characters |
US9251431B2 (en) | 2014-05-30 | 2016-02-02 | Apple Inc. | Object-of-interest detection and recognition with split, full-resolution image processing pipeline |
CN105187824A (zh) * | 2014-06-10 | 2015-12-23 | 杭州海康威视数字技术股份有限公司 | 图像编码方法和装置以及图像解码方法和装置 |
WO2015192353A1 (en) | 2014-06-19 | 2015-12-23 | Microsoft Technology Licensing, Llc | Unified intra block copy and inter prediction modes |
CN104184981B (zh) * | 2014-08-27 | 2017-12-15 | 深圳市华星光电技术有限公司 | 一种基于缩减像素采样处理的低解析度显示方法及设备 |
EP3202150B1 (en) | 2014-09-30 | 2021-07-21 | Microsoft Technology Licensing, LLC | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
US9690752B2 (en) | 2014-10-03 | 2017-06-27 | Harris Corporation | Method and system for performing robust regular gridded data resampling |
US10410398B2 (en) * | 2015-02-20 | 2019-09-10 | Qualcomm Incorporated | Systems and methods for reducing memory bandwidth using low quality tiles |
KR102440941B1 (ko) | 2015-03-03 | 2022-09-05 | 삼성전자주식회사 | 이미지 처리 정보에 따라 크기와 방향을 갖는 초기 위상을 계산할 수 있는 이미지 처리 장치들 |
CN106664405B (zh) | 2015-06-09 | 2020-06-09 | 微软技术许可有限责任公司 | 用调色板模式对经逸出编码的像素的稳健编码/解码 |
CN105407352A (zh) * | 2015-11-23 | 2016-03-16 | 小米科技有限责任公司 | 图像压缩方法、装置及服务器 |
CN106802964A (zh) * | 2015-11-26 | 2017-06-06 | 北京华大九天软件有限公司 | 一种图形自动转化阵列的方法 |
EP3185556A1 (en) * | 2015-12-21 | 2017-06-28 | Thomson Licensing | Method and apparatus for combined adaptive resolution and internal bit-depth increase coding |
US10630992B2 (en) | 2016-01-08 | 2020-04-21 | Samsung Electronics Co., Ltd. | Method, application processor, and mobile terminal for processing reference image |
EP3466075A1 (en) | 2016-05-26 | 2019-04-10 | VID SCALE, Inc. | Geometric conversion for 360-degree video coding |
US20180146019A1 (en) * | 2016-11-21 | 2018-05-24 | International Business Machines Corporation | Light-weight resolution switching for online video streaming |
CN108495130B (zh) * | 2017-03-21 | 2021-04-20 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法和装置、终端、服务器和存储介质 |
CN107896330B (zh) * | 2017-11-29 | 2019-08-13 | 北京大学深圳研究生院 | 一种用于帧内和帧间预测的滤波方法 |
US10986349B2 (en) | 2017-12-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Constraints on locations of reference blocks for intra block copy prediction |
WO2019159696A1 (ja) * | 2018-02-14 | 2019-08-22 | ソニー株式会社 | 画像処理装置および方法 |
US11736648B2 (en) | 2018-05-09 | 2023-08-22 | Panamorph, Inc. | Progressive image compression and restoration providing a high spatial quality intermediate image |
KR102022648B1 (ko) | 2018-08-10 | 2019-09-19 | 삼성전자주식회사 | 전자 장치, 이의 제어 방법 및 서버의 제어 방법 |
CN109040755A (zh) * | 2018-09-17 | 2018-12-18 | 珠海亿智电子科技有限公司 | 一种适用于视频编码的图像前处理装置 |
CN109544502B (zh) * | 2018-09-25 | 2023-06-30 | 中山大学 | 一种jpeg图像下采样因子估计方法 |
KR102312338B1 (ko) * | 2018-10-19 | 2021-10-14 | 삼성전자주식회사 | Ai 부호화 장치 및 그 동작방법, 및 ai 복호화 장치 및 그 동작방법 |
KR102312337B1 (ko) * | 2018-10-19 | 2021-10-14 | 삼성전자주식회사 | Ai 부호화 장치 및 그 동작방법, 및 ai 복호화 장치 및 그 동작방법 |
US11290734B2 (en) * | 2019-01-02 | 2022-03-29 | Tencent America LLC | Adaptive picture resolution rescaling for inter-prediction and display |
US11012710B2 (en) | 2019-03-06 | 2021-05-18 | Tencent America LLC | Techniques for intra prediction for 360 image and video coding |
JP2020160737A (ja) * | 2019-03-26 | 2020-10-01 | 株式会社コーエーテクモゲームス | 情報処理装置、情報処理方法及びプログラム |
EP3981155A4 (en) | 2019-06-24 | 2022-08-17 | Alibaba Group Holding Limited | ADAPTIVE RESOLUTION CHANGE IN VIDEO PROCESSING |
KR102665968B1 (ko) | 2019-06-27 | 2024-05-16 | 삼성전자주식회사 | 블러 추정 방법 및 장치 |
CN114467305A (zh) * | 2019-08-06 | 2022-05-10 | Op方案有限责任公司 | 自适应分辨率管理预测重缩放 |
JP2022544160A (ja) * | 2019-08-06 | 2022-10-17 | オーピー ソリューションズ, エルエルシー | 適応分解能管理信号伝達 |
WO2021026334A1 (en) * | 2019-08-06 | 2021-02-11 | Op Solutions | Adaptive resolution management signaling |
WO2021026324A1 (en) * | 2019-08-06 | 2021-02-11 | Op Solutions | Adaptive resolution management prediction rescaling |
EP4011068A4 (en) | 2019-08-06 | 2023-08-09 | OP Solutions, LLC | IMPLICIT SIGNALING OF ADAPTIVE RESOLUTION MANAGEMENT BASED ON FRAME TYPE |
CN114503581A (zh) | 2019-08-06 | 2022-05-13 | Op方案有限责任公司 | 基于块的自适应分辨率管理 |
US11140402B2 (en) | 2019-09-20 | 2021-10-05 | Tencent America LLC | Signaling of reference picture resampling with constant window size indication in video bitstream |
US11336894B2 (en) * | 2019-09-20 | 2022-05-17 | Tencent America LLC | Signaling of reference picture resampling with resampling picture size indication in video bitstream |
JP2022548521A (ja) * | 2019-09-23 | 2022-11-21 | アリババ グループ ホウルディング リミテッド | 参照ダウンサンプリングありの動き補償補間のためのフィルタ |
US11317093B2 (en) | 2019-09-24 | 2022-04-26 | Tencent America LLC | Method for reference picture resampling with offset in video bitstream |
CN110572674B (zh) * | 2019-09-27 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 视频编解码方法和装置、存储介质及电子装置 |
CN110662071B (zh) * | 2019-09-27 | 2023-10-24 | 腾讯科技(深圳)有限公司 | 视频解码方法和装置、存储介质及电子装置 |
CN110677690B (zh) * | 2019-09-27 | 2022-07-01 | 腾讯科技(深圳)有限公司 | 视频处理方法和装置、存储介质 |
CN110572673B (zh) * | 2019-09-27 | 2024-04-09 | 腾讯科技(深圳)有限公司 | 视频编解码方法和装置、存储介质及电子装置 |
CN110572672B (zh) * | 2019-09-27 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 视频编解码方法和装置、存储介质及电子装置 |
CA3223625A1 (en) | 2019-11-08 | 2021-05-14 | Op Solutions, Llc | Methods and systems for adaptive cropping |
CN112995663B (zh) * | 2019-12-02 | 2022-09-23 | 华为技术有限公司 | 视频编码的方法、视频解码的方法及相应装置 |
US11372644B2 (en) | 2019-12-09 | 2022-06-28 | Meta Platforms, Inc. | Matrix processing instruction with optional up/down sampling of matrix |
US11438611B2 (en) * | 2019-12-11 | 2022-09-06 | Hfi Innovation Inc. | Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding |
US20210192019A1 (en) * | 2019-12-18 | 2021-06-24 | Booz Allen Hamilton Inc. | System and method for digital steganography purification |
US11563947B2 (en) | 2019-12-31 | 2023-01-24 | Tencent America LLC | Signaling output picture size for reference picture resampling |
US11445176B2 (en) | 2020-01-14 | 2022-09-13 | Hfi Innovation Inc. | Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding |
US12039696B2 (en) * | 2020-03-27 | 2024-07-16 | Alibaba Group Holding Limited | Method and system for video processing based on spatial or temporal importance |
CN111757142B (zh) * | 2020-07-22 | 2022-03-11 | 四川新视创伟超高清科技有限公司 | 一种基于云端流媒体切画的视频播放系统 |
US11375241B2 (en) * | 2020-10-20 | 2022-06-28 | Alibaba Group Holding Limited | Frequency specific compression and compensation technique in image processing |
CN112235606A (zh) * | 2020-12-11 | 2021-01-15 | 全时云商务服务股份有限公司 | 一种多层视频处理方法、系统和可读存储介质 |
Family Cites Families (200)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SU1506554A1 (ru) | 1987-10-06 | 1989-09-07 | Предприятие П/Я А-1772 | Кодер видеосигнала |
USRE35910E (en) * | 1989-05-11 | 1998-09-29 | Matsushita Electric Industrial Co., Ltd. | Moving image signal encoding apparatus and decoding apparatus |
JP3303869B2 (ja) | 1990-11-30 | 2002-07-22 | 株式会社日立製作所 | 画像符号化方法、画像符号化装置、画像復号化方法 |
JP3191935B2 (ja) | 1990-11-30 | 2001-07-23 | 株式会社日立製作所 | 画像符号化方法、画像符号化装置、画像復号化方法 |
US5136377A (en) * | 1990-12-11 | 1992-08-04 | At&T Bell Laboratories | Adaptive non-linear quantizer |
US5611038A (en) * | 1991-04-17 | 1997-03-11 | Shaw; Venson M. | Audio/video transceiver provided with a device for reconfiguration of incompatibly received or transmitted video and audio information |
US5414469A (en) * | 1991-10-31 | 1995-05-09 | International Business Machines Corporation | Motion video compression system with multiresolution features |
US5300949A (en) * | 1992-10-22 | 1994-04-05 | International Business Machines Corporation | Scalable digital video decompressor |
KR970000683B1 (ko) * | 1993-05-31 | 1997-01-16 | 삼성전자 주식회사 | 해상도 가변 적응적 화상압축/복원방법 및 장치 |
US5555021A (en) * | 1993-12-14 | 1996-09-10 | Watec America Corporation | Compact television camera with switching noise prevention |
US5592226A (en) * | 1994-01-26 | 1997-01-07 | Btg Usa Inc. | Method and apparatus for video data compression using temporally adaptive motion interpolation |
US5828421A (en) * | 1994-10-11 | 1998-10-27 | Hitachi America, Ltd. | Implementation efficient digital picture-in-picture decoding methods and apparatus |
US5821986A (en) * | 1994-11-03 | 1998-10-13 | Picturetel Corporation | Method and apparatus for visual communications in a scalable network environment |
US6002801A (en) * | 1995-04-18 | 1999-12-14 | Advanced Micro Devices, Inc. | Method and apparatus for improved video decompression by selection of IDCT method based on image characteristics |
US5864637A (en) * | 1995-04-18 | 1999-01-26 | Advanced Micro Devices, Inc. | Method and apparatus for improved video decompression by selective reduction of spatial resolution |
US6026182A (en) * | 1995-10-05 | 2000-02-15 | Microsoft Corporation | Feature segmentation |
US6324301B1 (en) * | 1996-01-24 | 2001-11-27 | Lucent Technologies Inc. | Adaptive postfilter for low bitrate visual telephony noise removal |
US6957350B1 (en) * | 1996-01-30 | 2005-10-18 | Dolby Laboratories Licensing Corporation | Encrypted and watermarked temporal and resolution layering in advanced television |
US6529631B1 (en) * | 1996-03-29 | 2003-03-04 | Sarnoff Corporation | Apparatus and method for optimizing encoding and performing automated steerable image compression in an image coding system using a perceptual metric |
JP3466032B2 (ja) * | 1996-10-24 | 2003-11-10 | 富士通株式会社 | 動画像符号化装置および復号化装置 |
US6175592B1 (en) * | 1997-03-12 | 2001-01-16 | Matsushita Electric Industrial Co., Ltd. | Frequency domain filtering for down conversion of a DCT encoded picture |
WO1998041012A1 (en) | 1997-03-12 | 1998-09-17 | Matsushita Electric Industrial Co., Ltd. | Mpeg decoder providing multiple standard output signals |
US6014694A (en) * | 1997-06-26 | 2000-01-11 | Citrix Systems, Inc. | System for adaptive video/audio transport over a network |
KR100435257B1 (ko) * | 1997-08-07 | 2004-07-16 | 삼성전자주식회사 | 영상신호 처리 시스템에서의 이미지 포맷 변환장치 및 방법 |
AR016812A1 (es) | 1997-08-14 | 2001-08-01 | Samsung Electronics Co Ltd | Metodo para transmitir informacion de video comprimida, disposiciones de compresion y de grabacion de video y aparato de reproduccion de video |
US6339434B1 (en) * | 1997-11-24 | 2002-01-15 | Pixelworks | Image scaling circuit for fixed pixed resolution display |
US6600785B1 (en) * | 1997-12-01 | 2003-07-29 | Matsushita Electric Industrial | Image processor, image data processor and variable length encoder/decoder |
US6239847B1 (en) * | 1997-12-15 | 2001-05-29 | Netergy Networks, Inc. | Two pass multi-dimensional data scaling arrangement and method thereof |
US6731811B1 (en) | 1997-12-19 | 2004-05-04 | Voicecraft, Inc. | Scalable predictive coding method and apparatus |
US6873368B1 (en) * | 1997-12-23 | 2005-03-29 | Thomson Licensing Sa. | Low noise encoding and decoding method |
US5995150A (en) | 1998-02-20 | 1999-11-30 | Winbond Electronics Corporation America | Dual compressed video bitstream camera for universal serial bus connection |
MY123018A (en) * | 1998-07-24 | 2006-05-31 | Panasonic Corp | Video signal character converting device and method of the same |
US6157396A (en) * | 1999-02-16 | 2000-12-05 | Pixonics Llc | System and method for using bitstream information to process images for use in digital display systems |
US6229570B1 (en) * | 1998-09-25 | 2001-05-08 | Lucent Technologies Inc. | Motion compensation image interpolation—frame rate conversion for HDTV |
US6501484B1 (en) * | 1998-09-29 | 2002-12-31 | Globalstreams, Inc. | System and method for high definition video rescaling |
JP2000134618A (ja) | 1998-10-23 | 2000-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 画像信号符号化方法と装置、及び画像信号復号方法と装置、及びこれらの方法を記録した記録媒体 |
JP2000165661A (ja) * | 1998-11-27 | 2000-06-16 | Murata Mach Ltd | 画像処理装置及び記録媒体 |
US6983018B1 (en) | 1998-11-30 | 2006-01-03 | Microsoft Corporation | Efficient motion vector coding for video compression |
US6418166B1 (en) * | 1998-11-30 | 2002-07-09 | Microsoft Corporation | Motion estimation and block matching pattern |
AUPP779898A0 (en) * | 1998-12-18 | 1999-01-21 | Canon Kabushiki Kaisha | A method of kernel selection for image interpolation |
JP3672185B2 (ja) * | 1999-02-09 | 2005-07-13 | ソニー株式会社 | コーディングシステム及びこれを用いた装置並びに記録媒体 |
US6259741B1 (en) * | 1999-02-18 | 2001-07-10 | General Instrument Corporation | Method of architecture for converting MPEG-2 4:2:2-profile bitstreams into main-profile bitstreams |
US6499060B1 (en) | 1999-03-12 | 2002-12-24 | Microsoft Corporation | Media coding for loss recovery with remotely predicted data units |
FR2792798B1 (fr) * | 1999-04-26 | 2001-05-25 | Thomson Multimedia Sa | Procede et dispositif de quantification pour compression video |
FI113124B (fi) | 1999-04-29 | 2004-02-27 | Nokia Corp | Tiedonsiirto |
WO2000074385A2 (en) | 1999-05-27 | 2000-12-07 | University Of Maryland, College Park | 3d wavelet based video codec with human perceptual model |
US6678424B1 (en) | 1999-11-11 | 2004-01-13 | Tektronix, Inc. | Real time human vision system behavioral modeling |
US6931060B1 (en) | 1999-12-07 | 2005-08-16 | Intel Corporation | Video processing of a quantized base layer and one or more enhancement layers |
US6700933B1 (en) * | 2000-02-15 | 2004-03-02 | Microsoft Corporation | System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding |
US7079157B2 (en) * | 2000-03-17 | 2006-07-18 | Sun Microsystems, Inc. | Matching the edges of multiple overlapping screen images |
US6510177B1 (en) * | 2000-03-24 | 2003-01-21 | Microsoft Corporation | System and method for layered video coding enhancement |
US6456663B1 (en) * | 2000-03-29 | 2002-09-24 | Matsushita Electric Industrial Co., Ltd. | DCT domain down conversion system that compensates for IDCT mismatch |
JP4686048B2 (ja) | 2000-04-21 | 2011-05-18 | パナソニック株式会社 | 画素演算装置 |
JP4560897B2 (ja) * | 2000-06-02 | 2010-10-13 | ソニー株式会社 | 通信装置、通信方法及び媒体 |
US6647061B1 (en) * | 2000-06-09 | 2003-11-11 | General Instrument Corporation | Video size conversion and transcoding from MPEG-2 to MPEG-4 |
US7023922B1 (en) | 2000-06-21 | 2006-04-04 | Microsoft Corporation | Video coding system and method using 3-D discrete wavelet transform and entropy coding with motion information |
US6907075B2 (en) | 2000-06-30 | 2005-06-14 | Koninklijke Philips Electronics N.V. | Encoding method for the compression of a video sequence |
KR100370076B1 (ko) * | 2000-07-27 | 2003-01-30 | 엘지전자 주식회사 | 다운 컨버젼 기능을 갖는 비디오 디코더 및 비디오 신호를디코딩 하는 방법 |
CN1180630C (zh) | 2000-08-08 | 2004-12-15 | 皇家菲利浦电子有限公司 | 基于子波分解的视频编码方法 |
US6937291B1 (en) * | 2000-08-31 | 2005-08-30 | Intel Corporation | Adaptive video scaler |
US7039115B1 (en) * | 2000-09-20 | 2006-05-02 | General Instrument Corporation | Processor allocation for channels in a video multi-processor system |
US6940905B2 (en) * | 2000-09-22 | 2005-09-06 | Koninklijke Philips Electronics N.V. | Double-loop motion-compensation fine granular scalability |
DE10048735A1 (de) * | 2000-09-29 | 2002-04-11 | Bosch Gmbh Robert | Verfahren zur Codierung und Decodierung von Bildsequenzen sowie Einrichtungen hierzu |
JP4231620B2 (ja) * | 2000-10-11 | 2009-03-04 | メディア・テック・ユーエスエイ・インコーポレーテッド | 画像処理方法および装置 |
US20020159484A1 (en) * | 2000-12-05 | 2002-10-31 | Murat Azizoglu | Coding scheme using a control code map for signal transmission in optical communications networks |
US6907070B2 (en) | 2000-12-15 | 2005-06-14 | Microsoft Corporation | Drifting reduction and macroblock-based control in progressive fine granularity scalable video coding |
AUPR222500A0 (en) | 2000-12-21 | 2001-01-25 | Unisearch Limited | Method for efficient scalable compression of video |
WO2002054777A1 (en) | 2000-12-28 | 2002-07-11 | Koninklijke Philips Electronics N.V. | Mpeg-2 down-sampled video generation |
US20020118743A1 (en) | 2001-02-28 | 2002-08-29 | Hong Jiang | Method, apparatus and system for multiple-layer scalable video coding |
US6831947B2 (en) | 2001-03-23 | 2004-12-14 | Sharp Laboratories Of America, Inc. | Adaptive quantization based on bit rate prediction and prediction error energy |
CN1251509C (zh) | 2001-04-10 | 2006-04-12 | 皇家菲利浦电子有限公司 | 帧序列的编码方法 |
KR100783396B1 (ko) | 2001-04-19 | 2007-12-10 | 엘지전자 주식회사 | 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법 |
DE10120395A1 (de) * | 2001-04-25 | 2002-10-31 | Bosch Gmbh Robert | Einrichtung zur Interpolation von Abtastwerten sowie Bildencoder und Bilddecoder |
US7206453B2 (en) * | 2001-05-03 | 2007-04-17 | Microsoft Corporation | Dynamic filtering for lossy compression |
US6907143B2 (en) * | 2001-05-16 | 2005-06-14 | Tektronix, Inc. | Adaptive spatio-temporal filter for human vision system models |
US6792044B2 (en) | 2001-05-16 | 2004-09-14 | Koninklijke Philips Electronics N.V. | Method of and system for activity-based frequency weighting for FGS enhancement layers |
WO2002096120A1 (en) | 2001-05-25 | 2002-11-28 | Centre For Signal Processing, Nanyang Technological University | Bit rate control for video compression |
WO2003003749A1 (en) * | 2001-06-29 | 2003-01-09 | Ntt Docomo, Inc. | Image encoder, image decoder, image encoding method, and image decoding method |
US20040208247A1 (en) | 2001-07-10 | 2004-10-21 | Eric Barrau | Method and device for generating a scalable coded video signal from a non-scalable coded video signal |
US9894379B2 (en) | 2001-07-10 | 2018-02-13 | The Directv Group, Inc. | System and methodology for video compression |
EP1294196A3 (en) * | 2001-09-04 | 2004-10-27 | Interuniversitair Microelektronica Centrum Vzw | Method and apparatus for subband encoding and decoding |
US6992725B2 (en) * | 2001-10-22 | 2006-01-31 | Nec Electronics America, Inc. | Video data de-interlacing using perceptually-tuned interpolation scheme |
WO2003041055A1 (en) * | 2001-11-02 | 2003-05-15 | The Regents Of The University Of California | End-to-end distortion estimation for streaming of pre-compressed video |
WO2003053066A1 (en) * | 2001-12-17 | 2003-06-26 | Microsoft Corporation | Skip macroblock coding |
US20050084010A1 (en) | 2001-12-28 | 2005-04-21 | Koninklijke Philips Electronics N.V. | Video encoding method |
WO2003063497A1 (en) * | 2002-01-22 | 2003-07-31 | Koninklijke Philips Electronics N.V. | Drift-free video encoding and decoding method, and corresponding devices |
US7596179B2 (en) * | 2002-02-27 | 2009-09-29 | Hewlett-Packard Development Company, L.P. | Reducing the resolution of media data |
US7317759B1 (en) * | 2002-02-28 | 2008-01-08 | Carnegie Mellon University | System and methods for video compression mode decisions |
US6993078B2 (en) * | 2002-03-28 | 2006-01-31 | International Business Machines Corporation | Macroblock coding technique with biasing towards skip macroblock coding |
US8284844B2 (en) * | 2002-04-01 | 2012-10-09 | Broadcom Corporation | Video decoding system supporting multiple standards |
JP4102973B2 (ja) * | 2002-04-24 | 2008-06-18 | 日本電気株式会社 | 動画像の符号化方法および復号化方法、これを用いた装置とプログラム |
US7715477B2 (en) | 2002-05-29 | 2010-05-11 | Diego Garrido | Classifying image areas of a video signal |
AUPS291002A0 (en) | 2002-06-12 | 2002-07-04 | Unisearch Limited | Method and apparatus for scalable compression of video |
JP2005532725A (ja) * | 2002-07-09 | 2005-10-27 | ノキア コーポレイション | ビデオ符号化における内挿フィルタタイプの選択方法および選択システム |
JP4724351B2 (ja) * | 2002-07-15 | 2011-07-13 | 三菱電機株式会社 | 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置 |
CN1669328A (zh) | 2002-07-17 | 2005-09-14 | 皇家飞利浦电子股份有限公司 | 三维小波视频编码和解码方法以及相应的设备 |
US7154952B2 (en) | 2002-07-19 | 2006-12-26 | Microsoft Corporation | Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures |
US7010037B2 (en) * | 2002-08-06 | 2006-03-07 | Koninklijke Philips Electronics N.V. | System and method for rate-distortion optimized data partitioning for video coding using backward adaptation |
US7072394B2 (en) | 2002-08-27 | 2006-07-04 | National Chiao Tung University | Architecture and method for fine granularity scalable video coding |
US7379496B2 (en) | 2002-09-04 | 2008-05-27 | Microsoft Corporation | Multi-resolution video coding and decoding |
KR20050052532A (ko) | 2002-10-16 | 2005-06-02 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 적응성 움직임 보상 시간 필터링을 이용하는 충분히 크기조정가능 3-d 오버컴플릿 웨이브릿 비디오 코딩 |
US7227901B2 (en) * | 2002-11-21 | 2007-06-05 | Ub Video Inc. | Low-complexity deblocking filter |
EP1422928A3 (en) * | 2002-11-22 | 2009-03-11 | Panasonic Corporation | Motion compensated interpolation of digital video signals |
GB0228556D0 (en) | 2002-12-06 | 2003-01-15 | British Telecomm | Video quality measurement |
US20060222083A1 (en) * | 2002-12-19 | 2006-10-05 | Klein Gunnewiek Reinier B M | Digital filter with spatial scalability |
KR20050105246A (ko) | 2003-02-25 | 2005-11-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오버컴플릿 웨이블렛 확장에 대해 모션 보상된 시간필터링을 사용하는 3차원 웨이블렛 비디오 코딩 |
FR2852773A1 (fr) | 2003-03-20 | 2004-09-24 | France Telecom | Procedes et dispositifs de codage et de decodage d'une sequence d'images par decomposition mouvement/texture et codage par ondelettes |
US8761252B2 (en) * | 2003-03-27 | 2014-06-24 | Lg Electronics Inc. | Method and apparatus for scalably encoding and decoding video signal |
CA2523055A1 (en) | 2003-04-25 | 2004-11-11 | Thomson Licensing | Marking techniques for tracking pirated media |
US20130107938A9 (en) | 2003-05-28 | 2013-05-02 | Chad Fogg | Method And Apparatus For Scalable Video Decoder Using An Enhancement Stream |
US8107535B2 (en) * | 2003-06-10 | 2012-01-31 | Rensselaer Polytechnic Institute (Rpi) | Method and apparatus for scalable motion vector coding |
US7653133B2 (en) * | 2003-06-10 | 2010-01-26 | Rensselaer Polytechnic Institute (Rpi) | Overlapped block motion compression for variable size blocks in the context of MCTF scalable video coders |
EP1634458B1 (en) * | 2003-06-16 | 2011-08-17 | Thomson Licensing | Decoding method and apparatus enabling fast channel change of compressed video |
JP4207684B2 (ja) | 2003-06-27 | 2009-01-14 | 富士電機デバイステクノロジー株式会社 | 磁気記録媒体の製造方法、および、製造装置 |
CN1813269A (zh) | 2003-06-30 | 2006-08-02 | 皇家飞利浦电子股份有限公司 | 使用过完备小波编码和循环预测映射进行视频处理的系统及方法 |
CN1813479A (zh) * | 2003-06-30 | 2006-08-02 | 皇家飞利浦电子股份有限公司 | 过完备小波域中的视频编码 |
JP4699685B2 (ja) | 2003-08-21 | 2011-06-15 | パナソニック株式会社 | 信号処理装置及びそれを用いた電子機器 |
TWI232681B (en) * | 2003-08-27 | 2005-05-11 | Mediatek Inc | Method of transforming one video output format into another video output format without degrading display quality |
US7822123B2 (en) | 2004-10-06 | 2010-10-26 | Microsoft Corporation | Efficient repeat padding for hybrid video sequence with arbitrary video resolution |
US7391933B2 (en) * | 2003-10-30 | 2008-06-24 | Samsung Electronics Co., Ltd. | Method and apparatus for image interpolation based on adaptive polyphase filters |
NO319660B1 (no) * | 2003-11-17 | 2005-09-05 | Tandberg Telecom As | Fremgangsmåte for interpolering av pixelverdier |
KR100519776B1 (ko) * | 2003-11-24 | 2005-10-07 | 삼성전자주식회사 | 영상 신호의 해상도 변환 방법 및 장치 |
KR100597402B1 (ko) * | 2003-12-01 | 2006-07-06 | 삼성전자주식회사 | 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치 |
US7369610B2 (en) | 2003-12-01 | 2008-05-06 | Microsoft Corporation | Enhancement layer switching for scalable video coding |
US7379608B2 (en) | 2003-12-04 | 2008-05-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Arithmetic coding for transforming video and picture data units |
CN1332563C (zh) * | 2003-12-31 | 2007-08-15 | 中国科学院计算技术研究所 | 一种视频图像跳过宏块的编码方法 |
US20050157791A1 (en) * | 2004-01-20 | 2005-07-21 | Eastman Kodak Company | System and method for video tone scale reduction |
JP2005217940A (ja) | 2004-01-30 | 2005-08-11 | Ntt Docomo Inc | 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム |
US7227894B2 (en) | 2004-02-24 | 2007-06-05 | Industrial Technology Research Institute | Method and apparatus for MPEG-4 FGS performance enhancement |
US7324616B2 (en) * | 2004-03-01 | 2008-01-29 | Motorola, Inc. | Low cost and high performance narrowband interference cancellation system |
US7505636B2 (en) * | 2004-03-04 | 2009-03-17 | Broadcom Corporation | System and method for two-pass interpolation for quarter-pel motion compensation |
KR100596705B1 (ko) * | 2004-03-04 | 2006-07-04 | 삼성전자주식회사 | 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템 |
US20050195896A1 (en) * | 2004-03-08 | 2005-09-08 | National Chiao Tung University | Architecture for stack robust fine granularity scalability |
EP1578137A2 (en) * | 2004-03-17 | 2005-09-21 | Matsushita Electric Industrial Co., Ltd. | Moving picture coding apparatus with multistep interpolation process |
WO2005099276A2 (en) | 2004-04-02 | 2005-10-20 | Thomson Licensing | Complexity scalable video encoding |
EP1599046A1 (en) | 2004-05-19 | 2005-11-23 | THOMSON Licensing | Method for coding video data of a sequence of pictures |
US20050259729A1 (en) * | 2004-05-21 | 2005-11-24 | Shijun Sun | Video coding with quality scalability |
JP4891234B2 (ja) * | 2004-06-23 | 2012-03-07 | エージェンシー フォー サイエンス, テクノロジー アンド リサーチ | グリッド動き推定/補償を用いたスケーラブルビデオ符号化 |
KR100654436B1 (ko) * | 2004-07-07 | 2006-12-06 | 삼성전자주식회사 | 비디오 코딩 방법과 디코딩 방법, 및 비디오 인코더와디코더 |
US8340177B2 (en) | 2004-07-12 | 2012-12-25 | Microsoft Corporation | Embedded base layer codec for 3D sub-band coding |
EP1617672A1 (en) | 2004-07-13 | 2006-01-18 | Matsushita Electric Industrial Co., Ltd. | Motion estimator/compensator including a 16-bit 1/8 pel interpolation filter |
US20060013305A1 (en) * | 2004-07-14 | 2006-01-19 | Sharp Laboratories Of America, Inc. | Temporal scalable coding using AVC coding tools |
KR100657268B1 (ko) | 2004-07-15 | 2006-12-14 | 학교법인 대양학원 | 컬러 영상의 신축적 부호화, 복호화 방법 및 장치 |
KR100621581B1 (ko) * | 2004-07-15 | 2006-09-13 | 삼성전자주식회사 | 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치 |
KR100679011B1 (ko) | 2004-07-15 | 2007-02-05 | 삼성전자주식회사 | 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치 |
US9071847B2 (en) * | 2004-10-06 | 2015-06-30 | Microsoft Technology Licensing, Llc | Variable coding resolution in video codec |
US7839933B2 (en) | 2004-10-06 | 2010-11-23 | Microsoft Corporation | Adaptive vertical macroblock alignment for mixed frame video sequences |
US8243820B2 (en) * | 2004-10-06 | 2012-08-14 | Microsoft Corporation | Decoding variable coded resolution video with native range/resolution post-processing operation |
WO2006044370A1 (en) | 2004-10-13 | 2006-04-27 | Thomson Licensing | Method and apparatus for complexity scalable video encoding and decoding |
DE102004059978B4 (de) * | 2004-10-15 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium |
KR20060043115A (ko) * | 2004-10-26 | 2006-05-15 | 엘지전자 주식회사 | 베이스 레이어를 이용하는 영상신호의 엔코딩/디코딩 방법및 장치 |
US7783106B2 (en) | 2004-11-12 | 2010-08-24 | Fuji Xerox Co., Ltd. | Video segmentation combining similarity analysis and classification |
KR100679025B1 (ko) | 2004-11-12 | 2007-02-05 | 삼성전자주식회사 | 다 계층 기반의 인트라 예측 방법, 및 그 방법을 이용한비디오 코딩 방법 및 장치 |
KR100679031B1 (ko) | 2004-12-03 | 2007-02-05 | 삼성전자주식회사 | 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치 |
KR100703734B1 (ko) | 2004-12-03 | 2007-04-05 | 삼성전자주식회사 | Dct 업샘플링을 이용한 다 계층 비디오 인코딩/디코딩방법 및 장치 |
KR100888962B1 (ko) * | 2004-12-06 | 2009-03-17 | 엘지전자 주식회사 | 영상 신호의 인코딩 및 디코딩 방법 |
KR100888963B1 (ko) * | 2004-12-06 | 2009-03-17 | 엘지전자 주식회사 | 영상 신호의 스케일러블 인코딩 및 디코딩 방법 |
US7616824B2 (en) * | 2004-12-08 | 2009-11-10 | Ecole Polytechnique Fédérale de Lausanne (EPFL) CM - Ecublens | Method for spatially scalable video coding |
US20090252425A1 (en) | 2004-12-13 | 2009-10-08 | Koninklijke Philips Electronics, N.V. | Scalable picture encoding |
US7801220B2 (en) * | 2005-01-07 | 2010-09-21 | Microsoft Corporation | In-band wavelet video coding with spatial scalability |
KR100714689B1 (ko) * | 2005-01-21 | 2007-05-04 | 삼성전자주식회사 | 다 계층 구조 기반의 스케일러블 비디오 코딩 및 디코딩방법, 이를 위한 장치 |
CN101111864A (zh) | 2005-01-31 | 2008-01-23 | 皇家飞利浦电子股份有限公司 | 用于多分辨率图像滤波的金字塔式分解 |
US7995656B2 (en) | 2005-03-10 | 2011-08-09 | Qualcomm Incorporated | Scalable video coding with two layer encoding and single layer decoding |
US8175168B2 (en) * | 2005-03-18 | 2012-05-08 | Sharp Laboratories Of America, Inc. | Methods and systems for picture up-sampling |
US8638862B2 (en) * | 2005-03-18 | 2014-01-28 | Sharp Laboratories Of America, Inc. | Methods and systems for upsampling filter design |
EP1862010A4 (en) * | 2005-03-25 | 2011-08-17 | Korea Electronics Telecomm | HIERARCHICAL VIDEO ENCODING / DECODING METHOD FOR COMPLETE SCALE VARIABILITY AND APPARATUS THEREOF |
WO2006109135A2 (en) | 2005-04-11 | 2006-10-19 | Nokia Corporation | Method and apparatus for update step in video coding based on motion compensated temporal filtering |
US7876833B2 (en) | 2005-04-11 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Method and apparatus for adaptive up-scaling for spatially scalable coding |
KR100703778B1 (ko) | 2005-04-29 | 2007-04-06 | 삼성전자주식회사 | 고속 fgs를 지원하는 비디오 코딩 방법 및 장치 |
US8619860B2 (en) | 2005-05-03 | 2013-12-31 | Qualcomm Incorporated | System and method for scalable encoding and decoding of multimedia data using multiple layers |
EP1727372A1 (en) | 2005-05-27 | 2006-11-29 | Thomson Licensing | Method and apparatus for encoding and decoding video data, |
WO2006129184A1 (en) * | 2005-06-03 | 2006-12-07 | Nokia Corporation | Residual prediction mode in scalable video coding |
US7830961B2 (en) | 2005-06-21 | 2010-11-09 | Seiko Epson Corporation | Motion estimation and inter-mode prediction |
ZA200800261B (en) | 2005-07-11 | 2009-08-26 | Thomson Licensing | Method and apparatus for macroblock adaptive inter-layer intra texture prediction |
US7216279B2 (en) * | 2005-07-19 | 2007-05-08 | Lsi Logic Corporation | Testing with high speed pulse generator |
US20080123947A1 (en) * | 2005-07-22 | 2008-05-29 | Mitsubishi Electric Corporation | Image encoding device, image decoding device, image encoding method, image decoding method, image encoding program, image decoding program, computer readable recording medium having image encoding program recorded therein |
EP1746839A1 (en) | 2005-07-22 | 2007-01-24 | Thomson Licensing | Method and apparatus for encoding video data |
KR100746011B1 (ko) | 2005-08-24 | 2007-08-06 | 삼성전자주식회사 | 잔차 예측의 성능 개선 방법, 상기 방법을 이용한 비디오인코더 및 비디오 디코더 |
EP1775958A1 (en) | 2005-10-14 | 2007-04-18 | Thomson Licensing | Method and apparatus for reconstructing the texture of a spatial enhancement-layer video picture |
KR100772868B1 (ko) * | 2005-11-29 | 2007-11-02 | 삼성전자주식회사 | 복수 계층을 기반으로 하는 스케일러블 비디오 코딩 방법및 장치 |
US8023569B2 (en) * | 2005-12-15 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for block-based residual upsampling |
US8094721B2 (en) * | 2005-12-29 | 2012-01-10 | Cisco Technology, Inc. | Methods and apparatuses for selecting a mode within a compression scheme |
GB0600141D0 (en) | 2006-01-05 | 2006-02-15 | British Broadcasting Corp | Scalable coding of video signals |
US7956930B2 (en) * | 2006-01-06 | 2011-06-07 | Microsoft Corporation | Resampling and picture resizing operations for multi-resolution video coding and decoding |
JP2009522974A (ja) * | 2006-01-09 | 2009-06-11 | ノキア コーポレイション | 低複雑度の動き補償付き微細粒度スケーラブルビデオ符号化のためのシステムと装置 |
CN1794821A (zh) | 2006-01-11 | 2006-06-28 | 浙江大学 | 可分级视频压缩中插值的方法与装置 |
KR100772873B1 (ko) * | 2006-01-12 | 2007-11-02 | 삼성전자주식회사 | 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더 |
US8848789B2 (en) * | 2006-03-27 | 2014-09-30 | Qualcomm Incorporated | Method and system for coding and decoding information associated with video compression |
KR100781524B1 (ko) | 2006-04-04 | 2007-12-03 | 삼성전자주식회사 | 확장 매크로블록 스킵 모드를 이용한 인코딩/디코딩 방법및 장치 |
US20070274396A1 (en) * | 2006-05-26 | 2007-11-29 | Ximin Zhang | Complexity adaptive skip mode estimation for video encoding |
WO2008004816A1 (en) | 2006-07-04 | 2008-01-10 | Electronics And Telecommunications Research Institute | Scalable video encoding/decoding method and apparatus thereof |
US8253752B2 (en) * | 2006-07-20 | 2012-08-28 | Qualcomm Incorporated | Method and apparatus for encoder assisted pre-processing |
JP4647558B2 (ja) | 2006-07-27 | 2011-03-09 | 日本電信電話株式会社 | 映像符号化並列処理方法,映像符号化装置,映像符号化プログラムおよびその記録媒体 |
CN101589625B (zh) | 2006-10-25 | 2011-09-21 | 弗劳恩霍夫应用研究促进协会 | 质量可缩放编码 |
US7756350B2 (en) * | 2006-11-13 | 2010-07-13 | Global Ip Solutions, Inc. | Lossless encoding and decoding of digital data |
US8311120B2 (en) * | 2006-12-22 | 2012-11-13 | Qualcomm Incorporated | Coding mode selection using information of other coding modes |
US8199812B2 (en) * | 2007-01-09 | 2012-06-12 | Qualcomm Incorporated | Adaptive upsampling for scalable video coding |
US8848787B2 (en) | 2007-10-15 | 2014-09-30 | Qualcomm Incorporated | Enhancement layer coding for scalable video coding |
US20090268818A1 (en) | 2008-04-29 | 2009-10-29 | International Business Machines Corporation | Method and system for integrating noise filtering in predictive video coding |
KR101474756B1 (ko) | 2009-08-13 | 2014-12-19 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
-
2007
- 2007-01-05 US US11/650,531 patent/US7956930B2/en active Active
- 2007-01-08 AU AU2007205175A patent/AU2007205175B2/en active Active
- 2007-01-08 JP JP2008549559A patent/JP5302010B2/ja active Active
- 2007-01-08 KR KR1020137008246A patent/KR101354741B1/ko active IP Right Grant
- 2007-01-08 CN CN2007800019896A patent/CN101366281B/zh active Active
- 2007-01-08 EP EP07717801.0A patent/EP1985120B1/en active Active
- 2007-01-08 CA CA2635898A patent/CA2635898C/en active Active
- 2007-01-08 CN CN201110120389XA patent/CN102176748B/zh active Active
- 2007-01-08 RU RU2008127319/09A patent/RU2420915C2/ru active
- 2007-01-08 WO PCT/US2007/000195 patent/WO2007081752A2/en active Application Filing
-
2008
- 2008-06-24 IL IL192420A patent/IL192420A/en active IP Right Grant
- 2008-07-04 KR KR1020087016381A patent/KR101344193B1/ko active IP Right Grant
-
2010
- 2010-09-08 AU AU2010219337A patent/AU2010219337B2/en active Active
-
2011
- 2011-02-21 RU RU2011106505/07A patent/RU2456761C1/ru active
- 2011-05-06 US US13/102,943 patent/US8493513B2/en active Active
-
2012
- 2012-02-08 HK HK12101256.3A patent/HK1161016A1/xx unknown
- 2012-02-16 IL IL218145A patent/IL218145A/en active IP Right Grant
- 2012-05-25 JP JP2012120308A patent/JP5590574B2/ja active Active
-
2013
- 2013-06-06 US US13/911,940 patent/US8780272B2/en active Active
-
2014
- 2014-05-30 US US14/292,073 patent/US9319729B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5590574B2 (ja) | 多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算 | |
US8107571B2 (en) | Parameterized filters and signaling techniques | |
JP4625240B2 (ja) | コンピュータ実施される方法、システムおよびコンピュータ可読媒体 | |
US7116831B2 (en) | Chrominance motion vector rounding | |
US7620109B2 (en) | Sub-pixel interpolation in motion estimation and compensation | |
US7305034B2 (en) | Rounding control for multi-stage interpolation | |
KR20050084396A (ko) | 공간 스케일 능력를 갖는 디지털 필터 | |
MX2008008762A (en) | Resampling and picture resizing operations for multi-resolution video coding and decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130701 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140723 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5590574 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |