JP2010501141A - デジタル映像の可変解像度エンコードおよびデコード技術 - Google Patents

デジタル映像の可変解像度エンコードおよびデコード技術 Download PDF

Info

Publication number
JP2010501141A
JP2010501141A JP2009524766A JP2009524766A JP2010501141A JP 2010501141 A JP2010501141 A JP 2010501141A JP 2009524766 A JP2009524766 A JP 2009524766A JP 2009524766 A JP2009524766 A JP 2009524766A JP 2010501141 A JP2010501141 A JP 2010501141A
Authority
JP
Japan
Prior art keywords
video
level
resolution
layer
enhancement layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009524766A
Other languages
English (en)
Inventor
ブイ.バークレイ ウォーレン
エー.チョウ フィリップ
ジェイ.クリノン リージス
ムーア ティム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2010501141A publication Critical patent/JP2010501141A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234345Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234363Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234381Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2347Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving video stream encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

デジタル映像の可変解像度エンコードおよびデコード技術が記載される。装置は、映像情報を、基本レイヤおよび強化レイヤを有するビデオストリームに符号化するビデオエンコーダから成ることができる。基本レイヤは、第1レベルの空間的解像度および第1レベルの時間的解像度を持つことができる。強化レイヤは、第1レベルの空間的解像度または第1レベルの時間的解像度を増大させることができる。他の実施形態が記載され請求される。

Description

デジタル映像(digital video)は、大量の記憶および伝送容量を消費する。典型的な、生のデジタル映像シーケンスは、1秒当たり15、30または60ものフレーム(フレーム/秒)を含む。フレームは数十万の画素を含むことができる。各画素すなわちピクセルは、ピクチャの極めて小さな要素を表す。例えば、生の形式では、コンピュータは共通して1画素を24ビットで表す。従って、典型的な生のデジタル映像シーケンスのビットレートすなわち1秒辺りのビット数は、1秒当たり500万ビット以上のオーダーであり得る。
ほとんどの媒体処理装置および通信ネットワークは、生のデジタル映像を処理するための資源が不足している。このため、技術者は、圧縮(また、符号化またはエンコーディングとも呼ばれる)を利用して、デジタル映像のビットレートを減らす。解凍(またはデコーディング)は、圧縮の逆である。
一般に、所定の処理装置および/または通信ネットワークのための特定のタイプの映像圧縮を選択するにあたっては、設計トレードオフがある。例えば圧縮は、より高いビットレートを費やした、映像品質が高いままのところでは損失が無く、または、映像品質が劣化しているところでは損失があるが、ビットレートがより劇的に減少する。ほとんどのシステム設計では、設計制約および性能用件の所定の組に基づいて、品質とビットレートの間である程度の妥協をする。そのため、所定の映像圧縮技術は一般的に、異なるタイプの媒体処理装置および/または通信ネットワークに対して適応しない。
この要約は、以下の「発明を実施するための形態」でさらに述べる概念を選択して簡略化した形式で紹介するために提供するものである。この要約は、請求の主題の重要な特徴または主要な特徴を確認することを意図していない。また、請求の主題の範囲を限定するために使用されることを意図してもいない。
種々の実施形態は、一般に映像、画像、ピクチャ等のデジタルメディアコンテンツのデジタルエンコード、デコードおよび処理を対象とする。ある実施形態では、デジタルメディアコンテンツのデジタルエンコード、デコードおよび処理は、映画テレビ技術者協会(SMPTE)規格421M(「VC−1」)の規格および改良型ビデオコーデックシリーズに基づき得る。より詳細には、ある実施形態は、多重解像度エンコードおよびデコード技術、および、下位互換性を切ることなくVC−1ビットストリームにおいてそのような技術をどのように可能にするか、を対象とする。一実施形態においては、例えば、一装置が、デジタル映像情報を増大されたSMPTE VC−1ビデオストリームまたはビットストリームに圧縮または符号化するようにされたビデオエンコーダを含むことができる。ビデオエンコーダは、デジタル映像情報を基本レイヤおよび1つまたは複数の空間的および/または時間的強化レイヤ等の多重レイヤの形式に符号化することができる。基本レイヤは、空間的解像度の定義された最低限度および時間的解像度の基本レベルを提示することができる。1つまたは複数の強化レイヤは、基本レイヤに符号化された映像情報の空間的解像度の基本レベルおよび/または時間的解像度の基本レベルを増加させるのに使用されることができる、符号化された映像情報を含むことができる。ビデオデコーダは、基本レイヤおよび、1つまたは複数の強化レイヤから映像情報を選択的にデコードし、その映像情報を所望の品質レベルで再生または再現することができる。同様に、オーディオビデオマルチポイントコントロールユニット(AVMCU)は、基本レイヤおよび、1つまたは複数の強化レイヤから映像情報を選択して、現在利用できるネットワークの帯域幅および受信機のデコード能力等の情報に基づき、会議の参加者に転送することができる。他の実施形態は記載され請求される。
ビデオキャプチャ/再生システムのための実施形態を図解した図である。 一般的なビデオエンコーダシステムのための実施形態を図解した図である。 ビデオデコーダシステムのための実施形態を図解した図である。 ビデオレイヤ階層のための実施形態を図解した図である。 第1ビデオストリームのための実施形態を図解した図である。 第2ビデオストリームのための実施形態を図解した図である。 第3ビデオストリームのための実施形態を図解した図である。 第4ビデオストリームのための実施形態を図解した図である。 論理フローのための実施形態を図解した図である。 第1の変形映像システムのための実施形態を図解した図である。 第2の変形映像システムのための実施形態を図解した図である。 コンピュータ環境のための実施形態を図解した図である。
種々の媒体処理装置は、デジタル映像等のデジタルメディアコンテンツの一定レベルの圧縮を行う、ビデオコーダおよび/またはデコーダ(まとめて「コーデック」と称される)を実装することができる。選択される圧縮のレベルは、多くの要因、例えば映像ソースのタイプ、映像圧縮技術のタイプ、通信回線で利用可能な帯域幅またはプロトコル、所定の受信装置で利用可能な処理またメモリリソース、デジタル映像を再現するのに使用される表示装置のタイプ、等によって変更することができる。一度実装されると、媒体処理装置は典型的には、エンコードおよびデコード両方の動作が、ビデオコーデックによって設定された圧縮のレベルに制限される。この手法は、典型的にはほとんど柔軟性を提供しない。異なるレベルの圧縮が所望される場合は、媒体処理装置は典型的には、各圧縮レベルに対して異なるビデオコーデックを実装する。この手法は、媒体処理装置ごとに多数のビデオコーデックの使用を必要とすることになり、従って媒体処理装置の複雑さとコストを増大させる。
これらおよび他の問題を解決するため、種々の実施形態が、多重解像度エンコードおよびデコード技術を対象とすることができる。スケーラブルビデオエンコーダは、共通のビデオストリーム内の多数のビデオレイヤとしてデジタル映像情報を符号化することができ、ビデオストリームでは各ビデオレイヤが、空間的解像度および/または時間的解像度の1つまたは複数のレベルを提示する。ビデオエンコーダは、基本レイヤおよび強化レイヤ等の多数のビデオレイヤのためのデジタル映像情報を、単一の共通のビデオストリームにマルチプレクス(multiplex:多重化)することができる。ビデオデコーダは、共通のビデオストリームから映像情報をデマルチプレクスまたは選択的にデコードし、基本レイヤおよび、1つまたは複数の強化レイヤから映像情報を検索し、典型的には信号対ノイズ比(SN比)または他の測定基準で定義された所望の品質レベルで、該映像情報を再生または再現する。ビデオデコーダは、各ビデオレイヤに対して定義されるような種々のスタートコードを使用して、映像情報を選択的にデコードすることができる。同様に、AVMCUは、利用可能な現在の帯域幅およびデコーダ能力のような情報に基づき、基本レイヤおよび強化レイヤの1サブセットのみを1人または複数の参加者へ選択して転送することができる。AVMCUは、ビデオビットストリーム内のスタートコードを使用してレイヤを選択する。
空間的解像度は一般的に、測定されている空間の詳細に関する精度の基準を参照することができる。デジタル映像においては、空間的解像度は、フレーム、ピクチャ、画像内の画素の数として測定または表現されることができる。例えば、640×480画素のデジタル画像サイズは、326,688の個々の画素と等しい。一般に、高い空間的解像度を有する画像は、低い空間的解像度の画像よりも多くの画素で構成される。空間的解像度は、とりわけ映像フレーム、ピクチャまたは画像の画質に影響を及ぼす。
時間的解像度は一般的に、時間に関する特定の測定の精度を参照することができる。デジタル映像においては、時間的解像度は、フレームレート、すなわち、15フレーム/秒、30フレーム/秒、60フレーム/秒等の1秒当たりのキャプチャされる映像情報のフレーム数として測定され、または表現されることができる。一般に、高い時間的解像度は、低い時間的解像度のフレーム数/秒よりも大きいフレーム数/秒を参照する。時間的解像度は、とりわけ、映像画像またはフレームのシーケンスにおける動き表現に影響を及ぼすことができる。ビデオストリームまたはビットストリームは、オーディオおよび/または映像情報を表すセグメント(例えば、ビットまたはバイト)の連続シーケンスを参照することができる。
一実施形態において、例えば、スケーラブルビデオエンコーダは、基本レイヤ、および1つまたは複数の時間的および/または空間的強化レイヤとして、デジタル映像情報を符号化することができる。基本レイヤは、デジタル映像情報の空間的解像度および/または時間的解像度の基本または最低レベルを提供することができる。時間的および/または空間的強化レイヤは、デジタル映像情報の、スケールされ強化された映像空間的解像度のレベルおよび/または時間的解像度のレベルを提供することができる。ビデオストリーム内の異なるビデオレイヤを描くために、種々のタイプのエントリーポイントおよびスタートコードが定義されることができる。この方法で、単一のスケーラブルビデオエンコーダは、空間的解像度および/または時間的解像度の多数のレベルを単一のビデオストリームに提供し、マルチプレクスすることができる。
種々の実施形態において、多数の異なるビデオデコーダは、符号化されたビデオストリームの所定のビデオレイヤからデジタル映像情報を選択的にデコードし、空間的解像度および/または時間的解像度の所望のレベルを所定の媒体処理装置に提供することができる。例えば、あるタイプのビデオデコーダは、基本レイヤをビデオストリームからデコードすることができ、一方、別のタイプのビデオデコーダは、基本レイヤおよび、1つまたは複数の強化レイヤをビデオストリームからデコードすることができる。媒体処理装置は、各ビデオレイヤからデコードされたデジタル映像情報を種々の方法で合成し、空間的解像度および/または時間的解像度に関する映像品質の異なるレベルを提供することができる。そして、媒体処理装置は、デコードされたデジタル映像情報を空間的解像度および時間的解像度の選択されたレベルで、1つまたは複数のディスプレイ上に再現することができる。
スケーラブルまたは多重解像度ビデオエンコーダおよびデコーダは、従来のビデオエンコーダおよびデコーダを越えるいくつかの利点を提供することができる。例えば、種々にスケールまたは分化されたデジタル映像サービスは、単一のスケーラブルビデオエンコーダおよび1つまたは複数のタイプのビデオデコーダを使用して、提供されることができる。旧式の(legacy)ビデオデコーダは、強化レイヤへのアクセスを必ずしも有することなく、デジタル映像情報をビデオストリームの基本レイヤからデコードすることができる一方、改良されたビデオデコーダは、同一のビデオストリーム内の基本レイヤおよび、1つまたは複数の強化レイヤ両方にアクセスすることができる。別の実施形態において、さまざまな暗号化技術が各レイヤに使用され、それによって各レイヤへのアクセスをコントロールすることができる。同様に、異なるデジタル著作権が各レイヤに割り当てられ、各レイヤへのアクセスを許可することができる。さらに別の例では、空間的および/または時間的解像度のあるレベルは、映像ソースのタイプ、映像圧縮技術のタイプ、通信回線で利用可能な帯域幅またはプロトコル、所定の受信装置で利用可能な処理またはメモリリソース、デジタル映像を再生するのに使用される表示装置のタイプ、等に基づき増減されることができる。
特に、改善された可変映像符号化解像度の実現により、ビデオストリーム内のディスプレイ解像度の大きさを特定するパラメータを持つという利点がもたらされる。映像の一部の符号化解像度は、エントリーポイントレベルにおいて信号で伝えられる。エントリーポイントは、イントラ符号化フレーム(「Iフレーム」とも称される)と共に始まりイントラ符号化フレームに対して予測して符号化される1つまたは複数の予測符号化フレーム(「Pフレーム」または「Bフレーム」とも称される)を含有することもできるビデオシーケンスのピクチャの、1つまたは複数のサブシーケンスまたはグループの近傍にあるかまたは隣接している。所定のエントリーポイントレベルにおいて信号で伝えられた符号化解像度は、基本レイヤにおけるIフレーム、およびIフレームを参照するPフレームまたはBフレームを含むピクチャのグループにこのようにして適用される。
後に続く記載は、ビデオシーケンスの一部が異なる解像度で可変的に符号化されることを可能にする改善された可変符号化解像度技術の実現を対象とする。この技術の例示的な適用は、ビデオコーデックシステムにおいてなされている。従って、可変符号化解像度技術は、符号化されたビットストリームシンタックスを利用して、例示的なビデオエンコーダ/デコーダの文脈で記載される。特に、改善された可変符号化解像度技術の記載される1つの実現は、SMPTE規格421M(VC−1)のビデオコーデックシリーズの規格および改良型アドバンスト・プロファイルに準拠するビデオコーデックにおいてなされる。代替として、この技術は、後述される例示のビデオコーデックおよびシンタックスとは細部において異なる、種々のビデオコーデックの実現および規格において組み込まれることができる。
図1は、ビデオキャプチャ/再生システム100の実装を図解する。図1は、可変符号化解像度技術が、典型的なアプリケーションまたは利用シナリオにおいて実現される、ビデオコーデックを採用するビデオキャプチャ/再生システム100を図解する。ビデオキャプチャ/再生システム100は一般的に、映像コンテンツを、入力されたデジタル映像ソース110から、通信チャネル140上で、圧縮されたビデオビットストリームにキャプチャして符号化する映像ソース/エンコーダ120と、映像を該チャネルから受け取りデコードし、該映像をビデオディスプレイ170上に表示するビデオプレーヤ/デコーダ150と、を含む。可変符号化解像度を有する後述されるビデオコーデックが実現されるこのようなシステムのいくつかの例は、ビデオキャプチャ、エンコード、デコードおよび再生が、全て単一の機器で実行されるシステム、また、これらの動作が別個の地理的に離れた機器で実行されるシステム、を包含する。例えば、デジタルビデオレコーダまたはテレビチューナーカード付のパーソナルコンピュータは、映像信号をキャプチャし、映像をハードドライブにエンコードすることが可能で、同様に、映像をハードドライブからリードバックし、デコードしモニタ上に表示することができる。別の例として、映像の商業出版者もしくは放送者は、ビデオエンコーダを組み込んだビデオマスタリングシステムを使用して、エンコードされた映像を有する、映像伝送(例えば、デジタル衛星チャンネル、またはウェブビデオストリーム)または記憶装置(例えば、テープまたはディスク)を生成することができ、そしてこのマスタリングシステムは、ユーザのデコーダおよび再生機(例えば、パーソナルコンピュータ、ビデオプレーヤ、ビデオ受信機等)へ映像を配布するために使用される。
図解のシステム100において、映像ソース/エンコーダ120は、ソースプリプロセッサ122、ソース圧縮エンコーダ124、マルチプレクサ126、およびチャネルエンコーダ128を含む。プリプロセッサ122は、ビデオカメラ、アナログテレビキャプチャ、または他のソース等のデジタル映像ソース110から非圧縮デジタル映像を受け取り、その映像を圧縮エンコーダ124への入力のために処理する。圧縮エンコーダ124は、例として、図2を参照して記載されるようなビデオエンコーダ200が挙げられ、映像の圧縮および符号化を実行する。マルチプレクサ126は、得られた圧縮ビデオビットストリームをパケット化し、通信チャネル140上に符号化するために、チャネルエンコーダ128に配信する。通信チャネル140は、デジタル映像放送、衛星または他の無線伝送、またはケーブル、電話または他の有線伝送、等の映像伝送であり得る。通信チャネル140はまた、コンピュータハードドライブまたは他の記憶ディスク等の記録映像媒体、テープ、光ディスク(DVD)または他の着脱可能記録媒体であり得る。チャネルエンコーダ128は、圧縮ビデオビットストリームをファイルコンテナ、伝送搬送波信号等に符号化する。
ビデオプレーヤ/デコーダ150において、チャネルデコーダ152は、通信チャネル140上の圧縮ビデオビットストリームをデコードする。デマルチプレクサ154は、圧縮ビデオビットストリームをチャネルデコーダから圧縮デコーダ156へデマルチプレクスし、配信する。圧縮デコーダ156の例として、図3を参照して記載されるようなビデオデコーダ300が挙げられる。そして圧縮デコーダは、映像を圧縮ビデオビットストリームからデコードし再構成する。最後に、ポストプロセッサ158は、映像を処理しビデオディスプレイ170上に表示させる。後処理動作の例には、デブロッキング、デリンギングまたは他のアーチファクト除去、レンジリマッピング、色変換、および他の同様の動作が含まれる。
図2は、汎用のビデオエンコーダ200のブロック図、図3は、汎用のビデオデコーダ300のブロック図であり、ここにおいて可変符号化解像度技術が組み込まれることが可能である。エンコーダおよびデコーダ内のモジュール間に示される関係はエンコーダおよびデコーダ内の情報のメインフローを表し、他の関係は、明確にする目的のため、省略されている。特に、図2および3は、通常、ビデオシーケンス、フレーム、マクロブロック、ブロック等に使用されるような、エンコーダの設定、モード、テーブル等を表すサイド情報(side information)を示さない。このようなサイド情報は、典型的にはサイド情報をエントロピー符号化した後に、出力ビットストリーム内に送信される。出力ビットストリームのフォーマットは、例えば、SMPTE VC−1フォーマット、リアルタイムコミュニケーションズ(Real Time Communications)に適用されるSMPTE VC−1フォーマット、H.263フォーマット、H.264フォーマットまたは他の映像フォーマットであり得る。
一実施形態において、例えば、エンコーダ200およびデコーダ300は、ブロックベースであり、4:2:0のマクロブロックフォーマットを使用する。この各マクロブロックは、4つの8×8輝度ブロック(時には、1つの16×16マクロブロックとして扱われる)および2つの8×8色差ブロックを含む。代替として、エンコーダ200およびデコーダ300は、オブジェクト・ベースであり、異なるマクロブロックまたはブロックフォーマットを使用するか、または8×8ブロックおよび16×16マクロブロックとは異なるサイズまたは構造の画素の組で、動作を実行する。マクロブロックは、プログレッシブまたはインターレース映像コンテンツのどちらかを表示するために使用される。
種々の実施形態におけるスケーラブルビデオエンコードおよびデコード技術およびツールは、ビデオエンコーダおよび/またはデコーダで実現されることが可能である。ビデオエンコーダおよびデコーダは、その内部に異なるモジュールを含むことができ、この異なるモジュールは、多数のさまざまな方法でお互いに関連しあい通信することができる。後述されるモジュールおよび関係は、例であり制限ではない。所望の圧縮の実現およびタイプによって、ビデオエンコーダまたはビデオデコーダのモジュールは、追加、省略、多数のモジュールへの分割、他のモジュールへ結合および/または同様のモジュールとの交換が可能である。代替実施形態において、異なるモジュールおよび/または他の構造のモジュールを有するビデオエンコーダまたはビデオデコーダは、1つまたは複数の記載された技術を実行することができる。
一般に、映像圧縮技術は、イントラフレーム圧縮およびインターフレーム圧縮を含む。イントラフレーム圧縮技術は、典型的にはIフレーム、キーフレーム、または参照フレームと呼ばれる、個々のフレームを圧縮する。インターフレーム圧縮技術は、先行するおよび/または後行するフレームを参照してフレームを圧縮し、典型的には予測フレームと呼ばれる。予測フレームの例には、プレディクティブ(P)フレーム、スーパー・プレディクティブ(SP)フレーム、およびバイ・プレディクティブまたはバイ・ディレクショナル(B)フレームが含まれる。予測フレームは、1つまたは複数の他のフレームからの動き補償予測(または差)の観点から表される。予測残差は、予測されたフレームと元のフレームとの差である。対照的に、Iフレームまたはキーフレームは、他のフレームを参照せずに圧縮される。
ビデオエンコーダは、典型的にはカレントフレームを含む映像のシーケンスを受け取り、圧縮された映像情報を出力として生成する。エンコーダは、予測フレームおよびキーフレームを圧縮する。エンコーダの多くの構成要素は、キーフレームおよび予測フレームの両方を圧縮するために使用される。これらの構成要素によって実行される正確な動作は、圧縮されている情報のタイプによって変化することが可能である。
図2は、一般的なビデオエンコーダシステム200のブロック図である。エンコーダシステム200は、カレントフレーム205を含む映像フレームのシーケンスを受け取り、圧縮映像情報295を出力として生成する。ビデオエンコーダの特定の実施形態では、典型的には、変形または補足バージョンの汎用のエンコーダ200を使用する。
エンコーダシステム200は、予測フレームおよびキーフレームを圧縮する。提示の目的のため、図2は、エンコーダシステム200を通るキーフレーム用の経路と、前方予測フレーム用の経路を示す。エンコーダシステム200の多くの構成要素は、キーフレームおよび予測フレームの両方を圧縮するために使用される。それらの構成要素によって実行される正確な動作は、圧縮されている情報のタイプによって変化することが可能である。
予測フレーム(例えば、Pフレーム、SPフレーム、およびBフレーム)は、1つまたは複数の他のフレームからの予測(または差)の観点から表される。予測残差は、予測されたものと元のフレームとの差である。対照的に、キーフレーム(例えば、Iフレーム)は、他のフレームを参照せずに圧縮される。
カレントフレーム205が前方予測フレームの場合、動き推定器210は、カレントフレーム205のマクロブロックまたは他の画素の組(例えば、16×8、8×16または8×8ブロック)の動きを、参照フレームに対して推定する。参照フレームは、フレームストア220にバッファリングされた、再構成された前フレーム225である。代替実施形態において、参照フレームは後フレームであるか、またはカレントフレームは双方向に予測される。動き推定器210は、サイド情報として、動きベクトル等の動き情報215を出力する。動き補償器230は、動き情報215を再構成された前フレーム225に適用し、動き補償カレントフレーム235を形成する。予測は完璧であることはまれで、動き補償カレントフレーム235と元のカレントフレーム205間の差は予測残差245である。代替として、動き推定器および動き補償器は、別のタイプの動き推定器/補償器を適用する。
周波数変換機260は、空間ドメイン映像情報を周波数ドメイン(スペクトル)データに変換する。ブロックベースの映像フレームに対して、周波数変換器260は、離散コサイン変換(DCT)と同様の性質を有する、下記の項で記載される変換を適用する。いくつかの実施形態において周波数変換器260は、キーフレームに対する空間的予測残差のブロックに、周波数変換を適用する。周波数変成器260は、8×8、8×4、4×8または他のサイズの周波数変換を適用することができる。
そして、量子化器270が、スペクトルデータ係数のブロックを量子化する。量子化器は、フレーム単位にまたは他の単位によって変わるステップサイズで、スペクトルデータに均一なスカラー量子化を適用する。代替として、量子化器は、スペクトルデータ係数に別のタイプの量子化、例えば、均一でない量子化、ベクトル量子化、または非適応量子化を適用し、または周波数変換を使用しないエンコーダシステムにおいて、空間ドメインデータを直接量子化する。適応量子化に加え、エンコーダ200は、フレームドロップ、適応フィルタリング、またはレート制御のための他の技術を使うことができる。
再構成されたカレントフレームが、後続の動き推定/補償用に必要とされる場合、逆量子化器276が、量子化されたスペクトルデータ係数に対して逆量子化を実行する。次に、逆周波数変換器266が、周波数変換器260の動作の逆を実施し、(予測フレーム対する)再構成された予測残差、または再構成されたキーフレーム生成する。カレントフレーム205がキーフレームだった場合、再構成されたキーフレームは、再構成されたカレントフレームとみなされる。カレントフレーム205が予測フレームだった場合、再構成された予測残差が、動き補償されたカレントフレーム235に追加されて、再構成されたカレントフレームを形成する。フレームストア220が、次のフレームの予測に使用するために、再構成されたカレントフレームをバッファリングする。いくつかの実施形態では、エンコーダは、再構成されたフレームにデブロッキングフィルタを適用して、フレームのブロックにおける不連続を適合的に平滑化する。
エントロピーコーダ280が、量子化器270の出力、ならびに特定のサイド情報(例えば、動き情報215、量子化ステップサイズ)を圧縮する。典型的なエントロピー符号化技術は、算術符号化、差分符号化、ハフマン符号化、ランレングス符号化、LZ符号化、ディクショナリ符号化、および上記の組合せを含む。エントロピーコーダ280は典型的には、異なる種類の情報(例えば、DC係数、AC係数、異なる種類のサイド情報)に対して異なる符号化技術を使用し、ある特定の符号化技術において、多数のコードテーブルの中から選択を行うことができる。
エントロピーコーダ280は、バッファ290に、圧縮映像情報295を提供する。バッファレベル指示子は、ビットレート適応モジュールにフィードバックされることができる。圧縮映像情報295は、一定のまたは比較的一定のビットレートでバッファ290から使い切られ、そのビットレートで後続のストリーミングのために格納される。代替としてエンコーダ200は、圧縮映像情報を圧縮の直後に流す。
バッファ290の前または後で、圧縮映像情報295は、ネットワークを介した伝送用にチャネル符号化されることができる。チャネル符号化は、圧縮映像情報295に、誤差検出および修正データを加えることができる。
図3は、一般的なビデオデコーダシステム300のブロック図である。デコーダシステム300は、映像フレームの圧縮シーケンスに関する情報395を受け取り、再構成されたフレーム305を含む出力を生成する。ビデオデコーダの特定の実施形態では典型的には、変形または補足バージョンの汎用のデコーダ300を使用する。
デコーダシステム300は、予測フレームおよびキーフレームを解凍する。提示の目的のため、図3は、デコーダシステム300を通るキーフレーム用の経路、および前方予測フレーム用の経路を示す。デコーダシステム300の多くの構成要素は、キーフレームおよび予測フレーム両方の圧縮に使われる。それらの構成要素によって実行される正確な動作は、圧縮される情報のタイプによって変化することが可能である。
バッファ390は、圧縮されたビデオシーケンスに関する情報395を受け取り、受け取った情報をエントロピーデコーダ380が利用できるようにする。バッファ390は典型的には、長時間にわたって極めて一定のレートで情報を受け取り、帯域幅または伝送における短期間の変化を平滑化するジッタバッファを含む。バッファ390は、再生バッファおよび他のバッファを同様に含むことできる。代替として、バッファ390は、変動するレートで情報を受け取る。バッファ390の前または後で、圧縮映像情報は、チャネルデコードされ、誤差検出および修正のために処理されることができる。
エントロピーデコーダ380は、エントロピー符号化・量子化されたデータ、ならびにエントロピー符号化されたサイド情報(たとえば、動き情報、量子化ステップサイズ)をエントロピーデコードするが、典型的には、エンコーダにおいて実行されたエントロピーエンコードの逆を適用する。エントロピーデコード技術は、算術デコード、差分デコード、ハフマンデコード、ランレングスデコード、LZデコード、ディクショナリデコード、および上記の組合せを含む。エントロピーデコーダ380は頻繁に、異なる種類の情報(例えば、DC係数、AC係数、異なる種類のサイド情報)に対して異なるデコード技術を使用し、ある特定のデコード技術において、多数のコードテーブルの中から選択を行うことができる。
再構成されるべきフレーム305が前方予測フレームである場合、動き補償器330は、動き情報315を参照フレーム325に適用し、再構成されているフレーム305の予測335を形成する。例えば、動き補償器330は、マクロブロック動きベクトルを使用して、参照フレーム325内の対応するマクロブロックを見つける。予測335は従って、先にデコードされた映像フレームからの動きを補償されたビデオブロックの組である。フレームバッファ320は、参照フレームとして使用するために先に再構成されたフレームを格納する。代替として、動き補償器は別のタイプの動き補償を適用する。動き補償器による予測は、完璧であることはまれなので、デコーダ300は、予測残差も再構成する。
デコーダが、再構成されたフレームを後続の動き補償のために必要とする時は、フレームストア320は、次のフレームの予測に使用するために、再構成されたフレームをバッファリングする。いくつかの実施形態において、エンコーダは、デブロッキングフィルタを再構成されたフレームに適用して、フレームのブロックにおける不連続を適合的に平滑化する。
逆量子化器370は、エントロピーデコードされたデータを逆量子化する。一般に、逆量子化器は、フレーム単位または他の単位で変化するステップサイズで、エントロピーデコードされたデータに均一なスカラー逆量子化を適用する。代替として、逆量子化器は、別のタイプの逆量子化、例えば、均一でない量子化、ベクトル量子化、または非適応量子化をデータに適用し、あるいは逆周波数変換を使用しないデコーダシステムにおいて、空間ドメインデータを直接逆量子化する。
逆周波数変換器360は、量子化された、周波数ドメインデータを、空間ドメイン映像情報に変換する。ブロックベースの映像フレームに対して、逆周波数変換器360は、下記の項で記載される変換を適用する。いくつかの実施形態において、逆周波数変換器360は、キーフレームに対する空間的予測残差のブロックに逆周波数変換を適用する。逆周波数変換器360は、8×8、8×4、4×8、または他のサイズの逆周波数変換を適用することができる。
可変符号化解像度技術は、デコーダが所望の映像ディスプレイ解像度を保持することを許可し、一方で、ディスプレイ解像度とは異なる符号化された解像度の多様なレベルにおいて、映像の一部分またはいくつかの部分を符号化することを選択する柔軟性を、エンコーダに許可する。エンコーダは、低く符号化された解像度において、ビデオシーケンスのいくつかのピクチャを符号化し、より低く符号化されたビットレート、表示サイズまたは表示品質を実現することができる。より低い符号化解像度の使用が所望される時は、エンコーダは、ピクチャをより低い解像度にフィルタしダウンサンプルする。デコード時、デコーダは、ディスプレイ解像度で表示するために、より低い符号化解像度でビデオストリームのそれらの部分を選択的にデコードする。デコーダはまた、映像が大きな画素アドレス指定能力でスクリーンに表示される前に、映像の低い解像度をアップサンプルすることができる。同様に、エンコーダは、より高く符号化された解像度において、ビデオシーケンスのいくつかのピクチャを符号化し、より高く符号化されたビットレート、表示サイズまたは表示品質を実現することができる。より高い符号化解像度の使用が所望される時は、エンコーダフィルタは、元の映像解像度の多くの部分を維持する。これは、典型的には、大きな解像度を有する映像と、大きな解像度の映像のサイズに適合させるために補間されたより低い解像度のレイヤのバージョンとの間の差を表す追加レイヤを符号化することによってなされる。例えば、元の映像は、それぞれ640および480画素の、水平および垂直方向の画素解像度を持つことができる。符号化された基本レイヤは、160×120画素を持つことができる。第1空間的強化レイヤは、320×240画素の解像度を提供することができる。この空間的強化レイヤは、元の映像を、水平および垂直解像度を2分の1ダウンサンプルすることによって得られる。320×240の映像と、第1強化レイヤの320×240の解像度に適合させるために水平におよび垂直に2分の1に補間された160×120の基本レイヤとの間の差を、計算することによって符号化される。デコード時、デコーダは、ディスプレイ解像度で表示するために、またはディスプレイの解像度に関わらず映像の詳細を大きな度合いで提供するために、ベース解像度およびより高い空間的符号化解像度で、ビデオストリームのそれらの部分を選択的にデコードする。
種々の実施形態において、ビデオエンコーダ200は、フレーム単位または他の単位で可変符号化解像度を提供することができる。種々のレベルの符号化解像度は、多重ビデオレイヤの形式に体系化されることができ、各ビデオレイヤは、所定の組の映像情報のための空間的解像度および/または時間的解像度の異なるレベルを提供する。例えば、ビデオエンコーダ200は、映像情報を、ビデオストリーム内に基本レイヤおよび強化レイヤと共に符号化するようにされてもよい。映像情報は、例えば、1つまたは複数のフレームシーケンス、フレーム、画像、ピクチャ、スチル、ブロック、マクロブロック、画素の組、または他の定義された組の映像データ(まとめて「フレーム」と称される)を備えることができる。基本レイヤは、第1レベルの空間的解像度および第1レベルの時間的解像度を持つことができる。強化レイヤは、第1レベルの空間的解像度、第1レベルの時間的解像度、または両方を増加させることができる。多数の強化レイヤがあり得、所定の組の映像情報のための空間的解像度または時間的解像度を向上させる時に、所望のレベルの精度を提供する。ビデオレイヤは、図4を参照してさらに詳細に述べられる。
図4は、ビデオレイヤの階層の例示的な実施形態を図解する。図4は、ビデオストリーム内の符号化されたデジタル映像の、多数の独立したビデオレイヤ400の階層的表示を図解する。図4に示すように、ビデオレイヤ400は、基本レイヤ(BL)を備えることができる。BLは、ビデオストリームの空間的解像度の基本レベルおよび時間的解像度(例えば、フレームレート)の基本レベルを表すことができる。一実施形態において、例えば、時間的解像度の基本レベルは、Tフレーム/秒から成り、ここでT=15フレームである。映像の符号化は、後続のBL映像フレームのデコードが、同一のレイヤ(例えば、基本レイヤ内の、1つまたは複数のP、SPまたはBフレーム)から先行する映像フレームに依存するだけであるようになされる。
ビデオレイヤ400は、1つまたは複数の強化レイヤを備えることもできる。例えば、該強化レイヤは、第1空間的強化レイヤ(SL0)、第2空間的強化レイヤ(SLl)、および第3空間的強化レイヤ(SL2)等の、1つまたは複数の空間的強化レイヤを備えることができる。SL0は、BLに追加されてBLシーケンスとして同一のフレームレート(例えば、15フレーム/秒)でより高い解像度の映像を提供することができる、空間的強化レイヤを表す。SL1は、BLに追加されて、BLシーケンスより高い中間フレームレートで、より高い解像度の映像を提供することができる、空間的強化レイヤを表す。一実施形態において、例えば、中間フレームレートは、T=30フレームであるとすると、T/2フレーム/秒を備えることができる。SL2は、BLに追加されて、BLシーケンスよりさらに高い高フレームレートでより高い解像度の映像を提供することができる、空間的強化レイヤである。一実施形態において、例えば、高フレームレートは、Tフレーム/秒から成り、ここでT=60フレームである。Tに与えられる値は、例示のみのためのもので制限ではないことは理解されるであろう。
強化レイヤは、第1時間的強化レイヤ(TL1)および第2時間的強化レイヤ(TL2)等の、1つまたは複数の時間的強化レイヤを含むこともできる。TL1は、BLに追加されて、BLと同じ低解像度映像をBLフレームのフレームレートの2倍であるフレームレートで生成することができる、時間的強化レイヤを表す。その結果、動き表現が、このシーケンスで向上される。TL2は、BLおよびTL1のフレームレートを2倍にする時間的強化レイヤを表す。このレベルの動き表現は、BLまたはTL1より良い。
図4に破線矢印で示すような、基本レイヤおよび強化レイヤの使用のために利用可能な多くの組み合わせがある。いくつかの組み合わせは、例示の目的であり制限ではなく、下記の組み合わせを含む。

・BL
・BL+SL0
・BL+TL1
・BL+TL1+TL2
・BL+SL0+TL1+SL1
・BL+SL0+TL1+SL1+TL2+SL2

これらのおよび他のビデオレイヤの組み合わせは、映像品質が時間で整合することを確実にすることができる。場合によっては、映像品質が時間で整合するように、全ての時間的レイヤに対して同数の空間的強化レイヤを選択することが望ましい。
以下にさらに十分に述べられるように、エンコーダ200は、圧縮ビデオビットストリーム295(図2)内のシーケンスヘッダにおける最高解像度を特定する。コンテナファイルフォーマットまたは伝送搬送波フォーマットのヘッダ情報等の、ビットストリームの外側を搬送されるヘッダ情報に比べて、ビデオビットストリームのシーケンスヘッダ内の符号化解像度のレベルの符号化は、最高解像度が直接ビデオデコーダによってデコードされるという利点を有する。最高解像度は、コンテナファイルまたは伝送搬送波デコーダ(例えば、チャネルデコーダ152)によって、ビデオデコーダへ別個に渡される必要は無い。
エンコーダ200はさらに、ビデオビットストリーム内のエントリーポイントに続く1つまたは複数のピクチャのグループが、エントリーポイントヘッダ内の定義されたフラグまたはスタートコードを使用して、より低い解像度で符号化されることを、信号で伝える。いくつかの実施形態において、フラグがより低いまたはより高い符号化解像度を示す場合、符号化されるサイズはエントリーポイントヘッダ内に同様に符号化されうる。
圧縮ビデオビットストリーム295(図2)は、圧縮されたプログレッシブ映像フレームまたは他のピクチャ(例えば、インターレースフレームまたはインターレースフィールドフォーマットのピクチャ)のシーケンスのための情報を含む。ビットストリーム295は、図3のデコーダ300等のデコーダによりデコードされるいくつかの階層的レイヤに体系化される。最上位のレイヤは、フレームのシーケンス全体の情報を有するシーケンスレイヤである。加えて、各圧縮映像フレームは、3つの階層的レイヤすなわちピクチャ、マクロブロック、およびブロック(上位から下位)で構成される、データで作成される。可変符号化解像度技術を採用する代替の映像実現は、シンタックス要素の種々の異なる構成を有する、他のシンタックス構造を利用することができる。
さらに、圧縮ビデオビットストリームは、1つまたは複数のエントリーポイントを含有することができる。ビットストリーム内の有効なエントリーポイントは、媒体処理システムが、そこからビットストリーム内の先行する情報(ビット)を何ら必要とせずに、ビットストリームをデコードまたは処理することができる、基本ビットストリーム内の位置である。エントリーポイントヘッダ(ピクチャヘッダのグループとも呼ばれる)は典型的には、例えば、映像フレームの水平および垂直サイズ、要求される基本ストリームバッファの状態および量子化パラメータ等の、重要なデコーダ初期化情報を含有する。先行するフレームを参照することなしにデコードされることができるフレームは、独立フレームまたはキーフレームと称される。
エントリーポイントは、エントリーポイント指示子によってビットストリーム内に信号で伝えられる。エントリーポイント指示子の目的は、デコードを開始または再開する、ビットストリーム内の特定の位置の存在(例えば、そこでは、以前デコードされた映像フィールドまたはフレームに依存せず、エントリーポイント指示子の直後の映像フレームをデコードする)を、信号で伝えることである。エントリーポイント指示子および関連するエントリーポイント構造は、ビットストリーム内に規則的または不規則な間隔で挿入されることができる。従って、エンコーダは、ビットストリーム内へのエントリーポイント指示子の挿入を管理するための、異なる規定を採用することができる。典型的な動作は、エントリーポイント指示子および構造を、ビデオビットストリーム内の規則的なフレーム位置に挿入することだが、いくつかのシナリオ(例えば、エラー復旧または高速チャネル変更)では、エントリーポイント挿入の周期的な性質を変更することができる。例として、下記のようなVC−1ビデオ基本ストリーム内のエントリーポイントの構造を示す以下の表1を参照のこと。
Figure 2010501141
種々の実施形態において、エントリーポイント指示子は、所定の標準、プロトコル、またはアーキテクチャに従って定義されることができる。いくつかの場合、エントリーポイント指示子が定義されて、所定の標準プロトコルまたはアーキテクチャを拡張することができる。下記の表1および2において、種々のエントリーポイント指示子が、SMPTE421M(VC−1)ビットストリーム内に埋め込まれたビットストリームのセグメントに適合する、スタートコードサッフィクスおよび、これに対応する意味として、定義される。スタートコードは、基本レイヤおよび、1つまたは複数の強化レイヤ等の異なるビデオレイヤに対する異なるスタートコードで、一意的に識別可能であるべきである。しかしスタートコードは、パースと識別の簡素化のために、ビデオレイヤ間で同様な構造識別子を使用することができる。構造識別子の例には、シーケンスヘッダ、エントリーポイントヘッダ、フレームヘッダ、フィールドヘッダ、スライスヘッダ等が含まれることできるが、これに制限されない。従って、スタートコードエミュレーション技術は、所定のビデオレイヤに対するスタートコードが、ビデオストリーム内でランダムに発生する可能性を低減するために利用されることができる。
特定のスタートコードに応じて、各ビデオレイヤに対して特定の構造パーサ・デコーダが呼出され起動され、ビデオストリームから映像情報をデコードする。特定の構造パーサ・デコーダは、所定のビデオレイヤに適切な、必要とされる参照フレーム、量子化器、レートコントロール、動き補償モード等の、特定の組のデコーダツールを実装することができる。本実施形態は、この文脈に制限されない。
種々の実施形態において、スタートコードサフィックスは、現在のVC−1ビットストリームと下位互換性があり得るので、レガシーなVC−1デコーダは、VC−1ビットストリームがそのような新しいセグメントを含む場合でも、動作を継続することが可能である。スタートコードサフィックスは、SMPTE421Mビデオビットストリームの現在のフォーマットを拡張し構築するために使用される、スケーラブルな映像表現をサポートすることができる。
Figure 2010501141
表2に示すスタートコードサフィックスは、「0x000001」3バイトシーケンスの終わりに付加され、種々のスタートコードを作成する。そのようなスタートコードは、VC−1ビットストリーム内に統合され、ビデオデコーダがビットストリームのどの部分をパースするかをビデオデコーダに決定させる。例えば、シーケンススタートコードは、VC−1ビットストリーム内のシーケンスヘッダの発生を知らせる。スタートコードのように見えるビットシーケンスの発生は、そのようなシーケンスを、スタートコードをそれ以上エミュレートしない数片のビットストリームに分割する、スタートコードエミュレーション防止を通して排除されることができる。
種々の実施形態において、追加ビデオレイヤを表すビットストリームフラグメントの追加は、新しいスタートコードを追加してビットストリーム内の強化レイヤフラグメントの存在を識別して信号で伝えることによって、達成される。例えば、図4に図解される2つの空間的レイヤおよび3つの時間的レイヤでは、下記のサフィックスを割り当てて、これらが持つ、表3で下記に示すような内容に関連する種々のレイヤのビットストリームセグメントを、信号で伝えることができよう。
Figure 2010501141
フラグメントの挿入は、一組の定義された範囲の規則に従わなければならない。例えば、シーケンスレベルSL0情報は、シーケンスレベルBL情報等に従わなければならない。これについては、さらに詳細に図5から8を参照して述べられるが、そこでは元のVC−1ビットストリームは、例として、映像のBLレイヤのみである。
図5は、ビデオストリーム500のシンタックスダイアグラムである。図5は、映像フレームのみを有するVC−1ビットストリームを表すビデオストリーム500を図解し、コンテンツがプログレッシブ映像でありインターレース映像ではないことを意味する。これは、映像ソースが、ウェブ映像等のプログレッシブ映像のみを生成する、種々のリアルタイムコミュニケーションシナリオの典型的例である。
図5に示すように、ビデオストリーム500は、映像フレームのシーケンス用のシーケンススタートコードおよびシーケンスヘッダを含有する第1ブロックを含むことができる。第2ブロックは、エントリーポイントスタートコードおよびエントリーポイントヘッダを含有することができる。第3ブロックは、第1映像フレーム用のフレームスタートコードおよびフレームヘッダを含有することができる。第4ブロックは、実質的なフレームペイロードを含有することができる。第5ブロックは、第2映像フレーム用のフレームスタートコードおよびフレームヘッダを含有することができる。これは、所定の組のデジタル映像コンテンツ用のフレームのシーケンス内の各フレームに対して続く。
異なるビデオレイヤを使用して、多重解像度符号化を実現するために、表2および/または表3からの1つまたは複数のスタートコードが、ビデオストリーム500に挿入され、BL映像セグメントおよび強化レイヤ(例えば、SL0、SLl、SL2、TLl、TL2等)映像セグメントを提示または描写することができる。下部の矢印は、他のビデオレイヤに対する追加のシーケンスヘッダ、エントリーポイントヘッダ、フレームヘッダおよびペイロードがVC−1BLビットストリーム内に挿入される位置を示す。
図6は、ビデオストリーム600のシンタックスダイアグラムである。図6は、各フレームが一組の独立したスライスとして符号化されることを除いて、ビデオストリーム500と同様なVC−1ビットストリームを表すビデオストリーム600を図解する。スライス符号化は、パケット損失が起こり得る通信ネットワーク内に追加のエラー弾力性を提供するために使用される。スライド符号化では、全フレームではなく映像フレームの一部分のみが、パケット損失によって影響を受ける。図6に示すように、ビデオストリーム600内の、スライススタートコードおよびスライスヘッダ用の種々の位置が、上部の矢印によって示される。下部の矢印は、追加のビデオレイヤがスライスヘッダおよびスライスペイロードに対して挿入される位置を示す。
図7は、ビデオストリーム700のシンタックスダイアグラムである。図7は、インターレース映像を有するVC−1ビットストリームを表すビデオストリーム700を図解する。この場合、映像フレームは2つの映像フィールドから成る。BLの第1フィールドに関連するスケールのスタートコード、ヘッダおよび映像ペイロードは、BLの第2フィールドのスタートコードおよびヘッダの前の、VC−1ビットストリームに挿入される。BLの第2フィールドに関連するスケールのスタートコード、ヘッダおよび映像ペイロードは、次の映像フレームの始まりの前のVC−1ビットストリームに挿入される。
図8は、ビデオストリーム800のシンタックスダイアグラムである。図8は、各インターレースフレームが一組の独立したスライスに符号化されることを除いて、ビデオストリーム700に同様なVC−1ビットストリームを表すビデオストリーム800を図解する。追加のビデオレイヤに関するスライスのスタートコード、ヘッダおよび映像ペイロードが、図8の下部の矢印によって示される。BLの第2フィールドのフィールドヘッダは、BLの第1フィールドのBLおよび任意の追加のビデオレイヤデータを、BLの第2フィールドのBLおよび任意の追加のビデオレイヤデータから区別する。
上記実施形態の動作について、以下の図面および付随する例を参照してさらに述べられるであろう。図面のいくつかは、論理フローを含むことができる。ここに提示される図面は、特定の論理フローを含むことができるが、論理フローはここに記載されるような一般的機能がどのように実現されるかの例を、単に提供するに過ぎないことは理解されるであろう。さらに、所定の論理フローは、特に指摘されない限り、必ずしも提示された順番で実行される必要は無い。加えて、所定の論理フローは、ハードウェア要素、プロセッサによって実行されるソフトウェア要素、または任意のこれらの組み合わせによって実現され得る。本実施形態は、この文脈に制限されない。
図9は、論理デコーダフロー900の一実施形態を図解する。論理フロー900は、ビデオキャプチャ/再生システム100、ビデオエンコーダ200またはビデオデコーダ300等の、ここで述べられた1つまたは複数の実施形態により実行される動作の、代表的なものであり得る。図9に示すように、ビデオデコーダ300用のパーサは、ひし形902にてBLスタートコードのビデオストリームを測定する。パーサが、BLスタートコードを認識しない場合、認識されるまでひし形902を通ってループを続ける。パーサがBLスタートコードを認識すると、パーサはブロック904において、スタートコードに関連するヘッダまたはヘッダ+ペイロードを取得する。これが一度なされると、パーサは、ひし形906にて追加のビデオレイヤのスタートコードの存在をチェックする。パーサが、所定のビデオストリームまたは時間周期内に、追加のビデオレイヤの任意のスタートコードを認識しない場合、制御はひし形902へ渡される。パーサが、ひし形906にて追加のビデオレイヤのスタートコードを認識しない場合、パーサは、ブロック908にて追加のビデオレイヤに関連するヘッダまたはヘッダ+ペイロードを取得し、制御はひし形906へ戻される。ひし形906およびブロック908間の制御ループは、所定のVC−1ビットストリーム内で使用されている多くのビデオレイヤに対して続く。スタートコードがひし形906にて追加のビデオスケールの1つであると、認識されない時、パーサは、前に戻り、ひし形902にてVC−1基本レイヤに関するスタートコードの探索を開始する。
図10は、第1変形ビデオキャプチャ/再生システム100のブロック図を図解しており、ここで、映像ソース/エンコーダ120は暗号化モジュール1002を含み、多数のビデオプレーヤ/デコーダ150−1−pはそれぞれが復号化モジュール1004を含む。暗号化モジュール1002は、各ビデオレイヤを異なる暗号化キーで独立して暗号化するために使用されることができる。暗号化モジュール1002は、暗号化情報1012(例えば、復号化キーおよび暗号)各ビデオレイヤに提供することができる。この情報の配信は、帯域内でまたは他の外部通信チャネルによってなされる。暗号化情報1012は、動的であり、時間とともに変化してセキュリティを向上させることができる。図10に示すように、矢印1006−1−qは、基本レイヤを表すことができ、矢印1008−1−rは空間的強化レイヤを表すことができ、矢印1010−1−sは、時間的強化レイヤを表すことができる。暗号化モジュール1002から受け取られた復号化情報1012に基づいて、各受信機の復号化モジュール1004は、各ビデオレイヤを復号することができる(またはできない)。復号化キーの有用性は、通常はセキュリティ・ポリシーまたは予約/購入サービスにより供与される権利に結び付けられる。例えばビデオプレーヤ/デコーダ150−2は、ビデオストリームの基本レイヤおよび空間的強化レイヤを受け取り、復号化できるのみであり、一方、ビデオプレーヤ/デコーダ150−1は、基本レイヤのみデコードすることができる。破線矢印によって表わされるような認証されないビデオレイヤを受け取り、復号化する、ビデオプレーヤ/デコーダ150−1−pによる任意の試みは失敗するであろう。この方式で、映像ソース/エンコーダ120は、異なるサービスの支払いまたはアクセス権に付加される低解像度ビデオストリームおよび高解像度ビデオストリームを送信することができる。例えば、(例えば、テレビ会議電話用の)高解像度ビデオストリームの有用性は、サービスの割増の支払いに結び付けられる。
図11は、第2変形ビデオキャプチャおよび再生システム100のブロック図を図解しており、映像ソース/エンコーダ120は、デジタル著作権管理(DRM)サーバ1102を含み、多数のビデオプレーヤ/デコーダ150−1−pはそれぞれDRMモジュール1104を含む。DRMサーバ1102は、各ビデオレイヤに異なる組のデジタル著作権を割り当てることができる。マルチメディア会議ルータ1114を含む実装のために、各ビデオレイヤは特定の組のDRMガイドラインまたはポリシーと関連することができる。DRMサーバ1102の制御下では、マルチメディア会議ルータ1114は、各ビデオプレーヤ/デコーダ150−1−pに付与された権利に従って、ビデオレイヤを転送する。DRMサーバ1102は、各ビデオレイヤのDRM情報1112をビデオプレーヤ/デコーダ150−1−pに提供することができる。図11に示すように、矢印1106−1−qは、基本レイヤを表すことができ、矢印1108−1−rは空間的強化レイヤを表すことができ、矢印1110−1−sは、時間的強化レイヤを表すことができる。DRMサーバ1102から受け取られたDRM情報1112に基づいて、各受信機のDRMモジュール1104は、各ビデオレイヤを受け取りまたはそれにアクセスすることを認証される(または認証されない)。DRM情報1112の有用性は、通常DRMポリシーに結び付けられる。例えば、ビデオプレーヤ/デコーダ150−2は、ビデオストリームの基本レイヤおよび空間的強化レイヤを受け取り、それにアクセスすることができるのみであり、一方ビデオプレーヤ/デコーダ150−1は、基本レイヤのみを受け取り、それにアクセスできる。破線矢印によって表わされるような認証されないビデオレイヤを受け取り、それにアクセスする、ビデオプレーヤ/デコーダ150−1−pによる任意の試みは失敗するであろう。メディアルータ1114は、各ビデオプレーヤ/デコーダ150−1−p用のDRMポリシーの組に従って、ビデオストリームを送信する。ビデオソース/エンコーダ120により提供される多重符号化解像度は、リアルタイムな会議において参加者が持ち得るアクセス権における多様性の制御と管理を可能にする。
図12は、コンピュータ環境1200のブロック図を図解する。コンピュータ環境1200は、種々の実施形態の実現に適切な一般的なシステムアーキテクチャを表すことができる。コンピュータ環境1200は、多数の要素を含む。ある要素は、特定の動作を実行するために用意された任意の物理的または論理的構造を備えることができる。各要素は、所定の組の設計パラメータまたは性能制約に対して所望されるような、ハードウェア、ソフトウェア、またはこれらの任意の組み合わせとして実現されることができる。ハードウェア要素の例には、デバイス、構成要素、プロセッサ、マイクロプロセッサ、回路、回路素子(例えば、トランジスタ、抵抗、コンデンサ、インダクタ等)、集積回路、特定用途向け集積回路(ASIC)、プログラム可能論理回路(PLD)、デジタル・シグナル・プロセッサ(DSP)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、メモリユニット、論理ゲート、レジスタ、半導体デバイス、チップ、マイクロチップ、チップセット等が含まれ得る。ソフトウェアの例には、ソフトウェア構成要素、プログラム、アプリケーション、コンピュータプログラム、アプリケーションプログラム、システムプログラム、マシンプログラム、オペレーティングシステムソフトウェア、ミドルウェア、ファームウェア、ソフトウェアモジュール、ルーチン、サブルーチン、関数、メソッド、インターフェース、ソフトウェアインターフェース、アプリケーションプログラムインターフェース(API)、命令セット、コンピューティングコード、コンピュータコード、コードセグメント、コンピュータコードセグメント、言語、値、記号、ソフトウェアオブジェクト、またはこれらの任意の組み合わせが含まれ得る。図1に示されるコンピューティングデバイス1200は、特定の接続形態で制限された数の要素を持つが、コンピュータ環境1200は、所定の実装に対して所望される代替えの接続形態にて、より多くのまたはより少ない要素を含むことができることは、理解されよう。本実施形態は、この文脈に制限されない。
種々の実施形態において、コンピュータ環境1200は、メディア情報を処理するのに適したターゲットデバイスの一部として実現されることができる。ターゲットデバイスの例には、コンピュータ、コンピュータシステム、コンピュータサブシステム、ワークステーション、端末、サーバ、ウェブサーバ、仮想サーバ、パーソナルコンピュータ(PC)、デスクトップコンピュータ、ラップトップコンピュータ、薄型ラップトップコンピュータ、携帯型コンピュータ、ハンドヘルドコンピュータ、携帯情報端末(PDA)、モバイル・コンピューティング・デバイス、携帯電話、媒体装置(例えば、オーディオ装置、映像装置、テキスト装置等)、メディアプレーヤ、媒体処理装置、メディアサーバ、家庭用娯楽システム、家庭用電化製品、デジタル多用途ディスク(DVD)装置、ビデオ・ホーム・システム(VHS)装置、デジタルVHS装置、パーソナルビデオレコーダ、ゲーム機、コンパクトディスク(CD)プレーヤ、デジタルカメラ、デジタル・カムコーダ、監視テレビ装置、テレビ会議システム、テレビ電話システム、および任意の他の電子、電気機械、または電気装置、が含まれ得るが、これに限定されない。本実施形態は、この文脈に制限されない。
媒体処理装置として実現されるとき、コンピュータ環境1200はまた、媒体処理用の種々の標準および/またはプロトコルに従って動作するように、配置されることができる。媒体処理標準の例には、制限ではなく、SMPTE規格421M(VC−1)、リアルタイムコミュニケーションズのために実装されるVC−1、WMV−9および改良型として実装されるVC−1、地上デジタルテレビジョン放送(DVB−T)の放送規格、ITU/IECH.263規格、低ビットレート通信用ビデオ符号化方式、2000年11月に公表されたITU−T勧告H.263v3および/またはITU/IECH.264規格超低ビットレート通信用ビデオ符号化方式ビデオ、2003年5月に公表されたITU−T勧告H.264、モーション・ピクチャー・エクスパーツ・グループ(MPEG)規格(例えば、MPEG−1、MPEG−2、MPEG−4)、および/または高性能無線ローカルエリア・ネットワーク(HiperLAN)規格、が含まれる。媒体処理プロトコルの例には、制限ではなく、セッション記述プロトコル(SDP)、リアルタイム・ストリーミング・プロトコル(RTSP)、リアルタイム・データ転送プロトコル(RTP)、同期化マルチメディア統合言語(SMIL)プロトコル、MPEG−2転送およびMPEG−2プログラムストリーム、および/またはインターネット・ストリーミング・メディア・アライアンス(ISMA)プロトコル、が含まれる。ここに述べられるような多重解像度映像エンコードおよびデコード技術の実現の1つは、例えば、アメリカ合衆国ワシントン州レドモンドの本件特許出願人により配布およびライセンスされた、ウィンドウズ(登録商標)メディアビデオバージョン9(WMV−9)ビデオコーデック(後の改定版および改良型を含む)のアドバンスト・プロファイルに内蔵されることであり得る。本実施形態は、この文脈に制限されない。
図12を参照すると、コンピュータ環境1200は、少なくとも1つの処理ユニット1210およびメモリ1220を含む。図12では、この非常に基本的な構成1230は、破線内に含まれる。処理ユニット1210は、汎用のプロセッサ、専用のプロセッサ、メディアプロセッサ、コントローラ、マイクロコントローラ、組み込みプロセッサ、デジタル・シグナル・プロセッサ(DSP)等の、任意のタイプのソフトウェア実行可能なプロセッサであり得る。処理ユニット1210は、コンピュータ実行可能命令を実行しかつ、リアルまたは仮想プロセッサであり得る。マルチプロセシングシステムでは、マルチプロセシングユニットが、コンピュータ実行可能命令を実行し処理能力を増大させる。メモリ1220は、揮発性および不揮発性メモリを含む、データを記憶することができる任意の機械可読またはコンピュータ可読媒体を使用して、実現される。例えば、メモリ1220は、読み取り専用メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、ダイナミックRAM(DRAM)、ダブル・データ・レートDRAM(DDRAM)、シンクロナスDRAM(SDRAM)、スタティックRAM(SRAM)、プログラマブルROM(PROM)、消去可能プログラマブルROM(EPROM)、電気的消去可能プログラマブルROM(EEPROM)、フラッシュメモリ、強誘電性ポリマーメモリ等のポリマーメモリ、オボニック・メモリ、相変化または強誘電性メモリ、シリコン酸化窒化酸化シリコン(SONOS)メモリ、磁気または光カード、または情報を記憶するのに適した任意の他のタイプの媒体、を含むことができる。種々の実施形態において、メモリ1220は、スケーラブル映像エンコードおよび/またはデコード技術を実現するソフトウェア1280を記憶する。
コンピュータ環境は、追加の特徴を有することができる。例えば、コンピュータ環境1200は、記憶装置1240、1つまたは複数の入力装置1250、1つまたは複数の出力装置1260、および1つまたは複数の通信接続1270を含む。バス、コントローラ、またはネットワーク等の相互接続機構は、コンピュータ環境1200の構成要素を相互接続する。典型的には、オペレーティングシステムソフトウェアは、コンピュータ環境1200内で実行する他のソフトウェアに動作環境を提供し、コンピュータ環境1200の構成要素の動作を調整する。
記憶装置1240は、着脱可能または着脱不可能であり得、かつ磁気ディスク、磁気テープまたはカセット、コンパクトディスク読み取り専用メモリ(CD−ROM)、記録可能コンパクトディスク(CD−R)、書き換え可能コンパクトディスク(CD−RW)、光ディスク、磁気媒体、磁気光学媒体、着脱可能メモリカードまたはディスク、種々のタイプのデジタル多用途ディスク(DVD)、または情報の記憶に使用されることが可能でかつコンピュータ環境1200内でアクセスされることが可能な任意の他の媒体、を含む。記憶装置1240は、マルチ空間的解像度符号化および/またはデコード技術を実現するソフトウェア1280のための命令を記憶する。
入力装置1250は、キーボード、マウス、ペン、またはトラックボール等のタッチ入力装置、音声入力装置、スキャニング装置、ネットワーク・アダプタ、またはコンピュータ環境1200に入力を提供する別の装置であり得る。映像に対しては、入力装置1250は、テレビチューナーカード、ウェブ映像またはカメラ映像インターフェース、または、アナログまたはデジタル形式で映像入力を受け取る同様の装置、またはコンピュータ環境に映像入力を提供するCD−ROM/DVDリーダであり得る。出力装置1260は、ディスプレイ、プロジェクタ、プリンタ、スピーカ、CD/DVDライタ、ネットワーク・アダプタ、またはコンピュータ環境1200から出力を提供する別の装置であり得る。
種々の実施形態において、コンピュータ環境1200はさらに、コンピュータ環境1200が通信媒体1290を介して他のデバイスと通信することを可能にする1つまたは複数の通信接続1270を含むことができる。通信接続1270は、1つまたは複数の通信インターフェース、ネットワークインターフェース、ネットワークインターフェースカード(NIC)、ラジオ、無線送信機/受信機(送受信機)、有線および/または無線通信媒体、物理的連結装置等の、種々のタイプの標準通信要素を含むことができる。通信媒体1290は典型的には、コンピュータ可読命令、データ構造、プログラムモジュールまたは、搬送波または他の輸送機構等の変調されたデータ信号内の他のデータを具現化し、任意の情報配信媒体を含む。「変調されたデータ信号」という語は、その1つまたは複数の特性が、信号内の情報を符号化する方式で設定または変更された信号、を意味する。例として、制限ではなく、通信媒体1290は、有線通信媒体および無線通信媒体を含む。有線通信媒体の例には、ワイヤ、ケーブル、金属導線、プリント基板(PCB)、バックプレーン、スイッチファブリック、半導体物質、ツイストペア線、同軸ケーブル、光ファイバ、伝播信号等が含まれ得る。無線通信媒体の例には、音響、無線周波数(RF)スペクトル、赤外線、および他の無線媒体が含まれ得る。ここで使用される機械可読媒体およびコンピュータ可読媒体という語は、例として、制限ではなく、メモリ1220、記憶装置1240、通信媒体1290、および上記の任意の組み合わせを含むことが意図されている。
いくつかの実施形態は、プログラムモジュールに含まれ、かつターゲットのリアルまたは仮想プロセッサ上のコンピュータ環境にて実行されるような、コンピュータ実行可能命令の一般的な文脈で記載されることが可能である。一般的に、プログラムモジュールは、特定のタスクを実行し、特定の抽象データ型を実装する、ルーチン、プログラム、ライブラリ、オブジェクト、クラス、構成要素、データ構造、等を含む。プログラムモジュールの機能は、プログラムモジュール間で、種々の実施形態において所望の通りに組み合わせまたは分割されることができる。プログラムモジュールのコンピュータ実行可能命令は、ローカルまたは分散型コンピュータ環境内で実行されることができる。
多数の具体的な詳細がここに記載され、実施形態の完全な理解を提供する。当業者は理解するであろうが、本実施形態はこれらの具体的詳細無しで実践されることができる。別の例では、公知の動作、構成要素および回路は、本実施形態を不明瞭にしないようにするために、詳細には記載さなかった。ここに開示された特定の構造のおよび機能の詳細は、代表的なものであり、本実施形態の範囲を必ずしも制限するものではないことは理解されよう。
また、言及するに値することとして、「一実施形態」または「ある実施形態」への任意の参照は、本実施形態との関連において述べられる、特定の特徴、構造、または特性が、少なくとも1つの実施形態に含まれるということを意味する。本明細書内の様々な場所に「一実施形態において」というフレーズが現れることは、必ずしも全て同一の実施形態を参照することではない。
いくつかの実施形態は、「連結される」および「接続される」という表現をその派生語と共に使用して、記載されることができる。これらの語が、お互いに同義語として意図されてはいないことは、理解されるべきである。例えば、いくつかの実施形態は「接続される」という語を使用して記載され、2またはそれ以上の要素がお互いに、物理的または電気的に直接接触することを示す。別の例では、いくつかの実施形態は「連結される」という語を使用して記載され、2またはそれ以上の要素が、物理的または電気的に直接接触することを示す。しかし、「連結される」という語はまた、2またはそれ以上の要素がお互いに直接接触せず、しかしお互いに協働しまたは相互作用することをも意味することができる。本実施形態は、この文脈に制限されない。
いくつかの実施形態は、例えば、機械によって実行されると、実施形態に従って、機械に方法および/または動作を実行させる、命令または命令の組を格納することができる、機械可読媒体またはアーティクルを使用して、実現されることができる。そのような機械には、例えば、任意の適切な処理プラットフォーム、コンピュータプラットフォーム、コンピュータデバイス、コンピュータデバイス、コンピュータシステム、処理システム、コンピュータ、プロセッサ、等が含まれ得、ハードウェアおよび/またはソフトウェアの任意の適切な組み合わせを使用して実現される。機械可読媒体またはアーティクルは、例えば、任意の適切なタイプの、メモリユニット、メモリ装置、メモリアーティクル、メモリ媒体、記憶装置、記憶アーティクル、記憶媒体および/または記憶ユニット(例えば、メモリ、着脱可能または着脱不可能媒体、消去可能または消去不可能媒体、書き込み可能または書き換え可能媒体、デジタルまたはアナログ媒体、ハードディスク、フロッピーディスク(商標登録)、CD−ROM、CD−R、CD−RW、光ディスク、磁気媒体、磁気光学媒体、着脱可能メモリカードまたはディスク、種々のタイプのDVD、テープ、カセット等)を含むことができる。
主題が、構造の特徴および/または方法論的な動作に特有の言葉で記載されたが、添付の請求項で定義される主題は、必ずしも上述の特有の特徴または動作に限定されないことは理解されよう。むしろ、上述の特有の特徴および動作は、請求項を実現するための例示の形として開示される。

Claims (29)

  1. 映像情報を受け取るステップと、
    前記映像情報を、基本レイヤおよび強化レイヤを含む異なるビデオレイヤを有するビデオストリームに符号化するステップと、を含む方法であって、前記基本レイヤは第1レベルの空間的解像度および第1レベルの時間的解像度を有し、前記強化レイヤは前記第1レベルの空間的解像度または前記第1レベルの時間的解像度を増加させる、ことを特徴とする方法。
  2. 映像情報を、第2レベルの時間的解像度で第1時間的強化レイヤとして、前記ビデオストリームに符号化するステップを含むことを特徴とする、請求項1に記載の方法。
  3. 映像情報を、第2レベルの空間的解像度で第1空間的強化レイヤとして、前記ビデオストリームに符号化するステップを含むことを特徴とする、請求項1または2に記載の方法。
  4. 一意的に識別可能なスタートコードを挿入して、スタートポイントを前記ビデオストリーム内に前記強化レイヤに対して示すステップを含むことを特徴とする、請求項1から3のいずれか1項に記載の方法。
  5. 前記強化レイヤの種々の構造識別子およびペイロードを、前記基本レイヤの種々の構造識別子およびペイロードとマルチプレクスするステップを含むことを特徴とする、請求項1から4のいずれか1項に記載の方法。
  6. 各ビデオレイヤを異なる暗号化キーで暗号化するステップを含むことを特徴とする、請求項1から5のいずれか1項に記載の方法。
  7. 各ビデオレイヤに、異なる組のデジタル著作権を割り当てるステップを含むことを特徴とする、請求項1から6のいずれか1項に記載の方法。
  8. エンコードされたビデオストリームを受け取るステップと、
    映像情報を、前記エンコードされたビデオストリームの基本レイヤおよび強化レイヤを含む、異なるビデオレイヤからデコードするステップとを含む方法であって、前記基本レイヤは第1レベルの空間的解像度および第1レベルの時間的解像度を有し、前記強化レイヤは前記第1レベルの空間的解像度または前記第1レベルの時間的解像度を増大させる、ことを特徴とする方法。
  9. 映像情報を、第2レベルの時間的解像度で第1時間的強化レイヤからデコードするステップを含むことを特徴とする、請求項8に記載の方法。
  10. 映像情報を、第2レベルの空間的解像度で第1空間的強化レイヤからデコードするステップを含むことを特徴とする、請求項8または9に記載の方法。
  11. 前記ビデオストリームをパースするステップと、
    スタートコードを検索してスタートポイントを前記ビデオストリーム内に前記強化レイヤに対して示すステップを含むことを特徴とする、請求項8から10のいずれか1項に記載の方法。
  12. 前記強化レイヤの特定の構造パーサおよびデコーダを、強化レイヤのスタートコードの値に基づいて起動するステップを含むことを特徴とする、請求項8から11のいずれか1項に記載の方法。
  13. 前記強化レイヤと関連するスタートコードを認識し、前記強化レイヤのデコードツールの組を起動させるステップを含むことを特徴とする、請求項8から12のいずれか1項に記載の方法。
  14. 各ビデオレイヤを異なる暗号化キーで復号化するステップを含むことを特徴とする、請求項8から13のいずれか1項に記載の方法。
  15. 異なる組のデジタル著作権を各ビデオレイヤに対して検索するステップと、
    各ビデオレイヤからの映像情報へのアクセスを各組のデジタル著作権に従って制御するステップと、を含むことを特徴とする、請求項8から14のいずれか1項に記載の方法。
  16. 映像情報を前記基本レイヤから再現し、映像情報を前記強化レイヤから再現し、前記第1レベルの空間的解像度または前記第1レベルの時間的解像度をディスプレイ上で増大させるステップを含むことを特徴とする、請求項8から15のいずれか1項に記載の方法。
  17. 映像情報を、基本レイヤおよび強化レイヤを有するビデオストリームに符号化するビデオエンコーダ(200)を備える装置であって、前記基本レイヤは第1レベルの空間的解像度および第1レベルの時間的解像度を有し、前記強化レイヤは前記第1レベルの空間的解像度または前記第1レベルの時間的解像度を増大させる、ことを特徴とする装置。
  18. 前記ビデオエンコーダは、映像情報を、第2レベルの時間的解像度または第3レベルの時間的解像度で時間的強化レイヤとして前記ビデオストリームに符号化することを特徴とする、請求項17に記載の装置。
  19. 前記ビデオエンコーダは、映像情報を、第2レベルの空間的解像度、および前記第1レベルの時間的解像度、第2レベルの時間的解像度または第3レベルの時間的解像度で、空間的強化レイヤとして、前記ビデオストリームに符号化することを特徴とする、請求項17または18に記載の装置。
  20. 前記ビデオエンコーダに連結される暗号化モジュール(1002)から成り、前記暗号化モジュールが異なる暗号化キーで各レイヤを暗号化することを特徴とする、請求項17から19のいずれか1項に記載の装置。
  21. 前記ビデオエンコーダに連結されたデジタル著作権管理モジュール(1102)から成り、前記デジタル著作権管理モジュールが、各レイヤに異なる組のデジタル著作権を割り当てることを特徴とする、請求項17から20のいずれか1項に記載の装置。
  22. 映像情報を、符号化されたビデオストリームの基本レイヤおよび強化レイヤからデコードするビデオデコーダ(300)を備える装置であって、前記基本レイヤは第1レベルの空間的解像度および第1レベルの時間的解像度を有し、前記強化レイヤは前記第1レベルの空間的解像度または前記第1レベルの時間的解像度を増大させる、ことを特徴とする装置。
  23. 前記ビデオデコーダは、映像情報を、第2レベルの時間的解像度または第3レベルの時間的解像度で、時間的強化レイヤからデコードすることを特徴とする、請求項22に記載の装置。
  24. 前記ビデオデコーダは、映像情報を、第2レベルの空間的解像度、および前記第1レベルの時間的解像度、第2レベルの時間的解像度または第3レベルの時間的解像度で、空間的強化レイヤからデコードすることを特徴とする、請求項22または23に記載の装置。
  25. 前記ビデオデコーダに連結された復号化モジュール(1004)から成り、前記復号化モジュールが各レイヤを異なる復号化キーで復号化することを特徴とする、請求項22から24のいずれか1項に記載の装置。
  26. 前記ビデオデコーダに連結されたデジタル著作権管理モジュール(1104)から成り、前記デジタル著作権管理モジュールは各レイヤに割り当てられた異なる組のデジタル著作権を使用して、各レイヤからの映像情報へのアクセスを制御することを特徴とする、請求項22から25のいずれか1項に記載の装置。
  27. 前記ビデオデコーダに連結された表示装置(1260)から成り、前記表示装置は、前記基本レイヤから映像情報を表示し、前記強化レイヤから映像情報を表示し、前記第1レベルの空間的解像度または前記第1レベルの時間的解像度をディスプレイ上で増大させることを特徴とする、請求項22から26のいずれか1項に記載の装置。
  28. データ処理装置上で実行されるとき、請求項1から16のいずれか1項の方法を実現し、および/または請求項17から21のいずれか1項のビデオエンコーダを実現し、および/または請求項22から27のいずれか1項のビデオデコーダを実現するコンピュータプログラム要素から成る、コンピュータプログラム。
  29. 請求項28に記載のコンピュータプログラムを搬送する、コンピュータプログラム搬送媒体。
JP2009524766A 2006-08-16 2007-08-14 デジタル映像の可変解像度エンコードおよびデコード技術 Pending JP2010501141A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/504,843 US20080043832A1 (en) 2006-08-16 2006-08-16 Techniques for variable resolution encoding and decoding of digital video
PCT/US2007/075907 WO2008060732A2 (en) 2006-08-16 2007-08-14 Techniques for variable resolution encoding and decoding of digital video

Publications (1)

Publication Number Publication Date
JP2010501141A true JP2010501141A (ja) 2010-01-14

Family

ID=39101362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009524766A Pending JP2010501141A (ja) 2006-08-16 2007-08-14 デジタル映像の可変解像度エンコードおよびデコード技術

Country Status (10)

Country Link
US (1) US20080043832A1 (ja)
EP (1) EP2055106B1 (ja)
JP (1) JP2010501141A (ja)
KR (1) KR101354833B1 (ja)
CN (1) CN101507278B (ja)
AU (1) AU2007319699B2 (ja)
BR (1) BRPI0714235A2 (ja)
MX (1) MX2009001387A (ja)
RU (1) RU2497302C2 (ja)
WO (1) WO2008060732A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013255207A (ja) * 2011-11-11 2013-12-19 Sony Corp 画像データ送信装置、画像データ送信方法および画像データ受信装置
JP2015530025A (ja) * 2012-08-10 2015-10-08 エルジー エレクトロニクス インコーポレイティド 信号送受信装置および信号送受信方法
US9693033B2 (en) 2011-11-11 2017-06-27 Saturn Licensing Llc Transmitting apparatus, transmitting method, receiving apparatus and receiving method for transmission and reception of image data for stereoscopic display using multiview configuration and container with predetermined format

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7876978B2 (en) * 2005-10-13 2011-01-25 Penthera Technologies, Inc. Regions of interest in video frames
US8665967B2 (en) * 2006-02-15 2014-03-04 Samsung Electronics Co., Ltd. Method and system for bit reorganization and packetization of uncompressed video for transmission over wireless communication channels
EP1999883A4 (en) 2006-03-14 2013-03-06 Divx Llc FEDERATED DIGITAL RIGHTS MANAGEMENT SYSTEM COMPRISING CONFIDENCE SYSTEMS
US8773494B2 (en) * 2006-08-29 2014-07-08 Microsoft Corporation Techniques for managing visual compositions for a multimedia conference call
US8175041B2 (en) * 2006-12-14 2012-05-08 Samsung Electronics Co., Ltd. System and method for wireless communication of audiovisual data having data size adaptation
US8630355B2 (en) * 2006-12-22 2014-01-14 Qualcomm Incorporated Multimedia data reorganization between base layer and enhancement layer
US8566695B2 (en) * 2007-03-30 2013-10-22 Sandisk Technologies Inc. Controlling access to digital content
US8237776B2 (en) * 2007-10-19 2012-08-07 Warner Bros. Entertainment Inc. Method and apparatus for generating stereoscopic images from a DVD disc
US8068608B2 (en) * 2007-12-17 2011-11-29 Broadcom Corporation Video processing system for scrambling video streams with dependent portions and methods for use therewith
US9872066B2 (en) * 2007-12-18 2018-01-16 Ibiquity Digital Corporation Method for streaming through a data service over a radio link subsystem
US8130823B2 (en) * 2007-12-19 2012-03-06 Broadcom Corporation Channel adaptive video transmission system for use with layered video coding and methods for use therewith
US9143731B2 (en) * 2008-01-02 2015-09-22 Broadcom Corporation Mobile video device for use with layered video coding and methods for use therewith
US8176524B2 (en) * 2008-04-22 2012-05-08 Samsung Electronics Co., Ltd. System and method for wireless communication of video data having partial data compression
US8179983B2 (en) * 2008-05-20 2012-05-15 Broadcom Corporation Video processing system with layered video coding for fast channel change and methods for use therewith
JP5369893B2 (ja) * 2008-05-30 2013-12-18 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、動画像復号プログラム、動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラム
US8488680B2 (en) * 2008-07-30 2013-07-16 Stmicroelectronics S.R.L. Encoding and decoding methods and apparatus, signal and computer program product therefor
US20100064315A1 (en) * 2008-09-08 2010-03-11 Jeyhan Karaoguz Television system and method for providing computer network-based video
JP2012503416A (ja) * 2008-09-18 2012-02-02 トムソン ライセンシング ビデオ画像の刈り取り方法及び装置
US9342663B2 (en) * 2008-10-09 2016-05-17 Adobe Systems Incorporated Distributing media with variable resolution and format
US8300082B2 (en) 2008-12-15 2012-10-30 At&T Intellectual Property I, Lp Apparatus and method for video conferencing
KR101635876B1 (ko) 2009-01-07 2016-07-04 쏘닉 아이피, 아이엔씨. 온라인 콘텐츠를 위한 미디어 가이드의 단일, 공동 및 자동 생성
US20100262708A1 (en) * 2009-04-08 2010-10-14 Nokia Corporation Method and apparatus for delivery of scalable media data
US20110075537A1 (en) * 2009-09-25 2011-03-31 General Electric Company Holographic disc with improved features and method for the same
EP2507995A4 (en) 2009-12-04 2014-07-09 Sonic Ip Inc SYSTEMS AND METHODS FOR TRANSPORTING ELEMENTARY BIT TRAIN CRYPTOGRAPHIC MATERIAL
KR20110071707A (ko) * 2009-12-21 2011-06-29 삼성전자주식회사 동영상 컨텐트 제공 방법 및 그 장치, 동영상 컨텐트 재생 방법 및 그 장치
US8838954B2 (en) * 2010-02-02 2014-09-16 Futurewei Technologies, Inc. Media processing devices for adaptive delivery of on-demand media, and methods thereof
US20110191587A1 (en) * 2010-02-02 2011-08-04 Futurewei Technologies, Inc. Media Processing Devices With Joint Encryption-Compression, Joint Decryption-Decompression, And Methods Thereof
US8908774B2 (en) * 2010-02-11 2014-12-09 Mediatek Inc. Method and video receiving system for adaptively decoding embedded video bitstream
US8544103B2 (en) * 2010-05-04 2013-09-24 Intertrust Technologies Corporation Policy determined accuracy of transmitted information
US8731152B2 (en) 2010-06-18 2014-05-20 Microsoft Corporation Reducing use of periodic key frames in video conferencing
WO2012032502A1 (en) * 2010-09-10 2012-03-15 Nokia Corporation A method and apparatus for adaptive streaming
US20120082228A1 (en) * 2010-10-01 2012-04-05 Yeping Su Nested entropy encoding
US10104391B2 (en) 2010-10-01 2018-10-16 Dolby International Ab System for nested entropy encoding
CN101951518B (zh) * 2010-10-12 2012-05-16 高斯贝尔数码科技股份有限公司 一种低码率情形下的数字电视图像修正系统及修正方法
US8914534B2 (en) 2011-01-05 2014-12-16 Sonic Ip, Inc. Systems and methods for adaptive bitrate streaming of media stored in matroska container files using hypertext transfer protocol
US8838680B1 (en) 2011-02-08 2014-09-16 Google Inc. Buffer objects for web-based configurable pipeline media processing
US8681866B1 (en) 2011-04-28 2014-03-25 Google Inc. Method and apparatus for encoding video by downsampling frame resolution
US9106787B1 (en) 2011-05-09 2015-08-11 Google Inc. Apparatus and method for media transmission bandwidth control using bandwidth estimation
CN103597839B (zh) 2011-05-31 2017-10-20 杜比实验室特许公司 视频压缩方法、视频重构方法和系统、及编码器
US10873772B2 (en) * 2011-07-21 2020-12-22 V-Nova International Limited Transmission of reconstruction data in a tiered signal quality hierarchy
US10045089B2 (en) 2011-08-02 2018-08-07 Apple Inc. Selection of encoder and decoder for a video communications session
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
CN103999466B (zh) * 2011-12-17 2017-08-15 杜比实验室特许公司 多层交错帧相容增强分辨率视频传输
KR102331361B1 (ko) 2011-12-29 2021-12-01 엘지전자 주식회사 비디오 인코딩 및 디코딩 방법과 이를 이용하는 장치
US9185429B1 (en) 2012-04-30 2015-11-10 Google Inc. Video encoding and decoding using un-equal error protection
US9762903B2 (en) * 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
US9924181B2 (en) * 2012-06-20 2018-03-20 Hfi Innovation Inc. Method and apparatus of bi-directional prediction for scalable video coding
RU2737038C2 (ru) * 2012-06-22 2020-11-24 Сони Корпорейшн Устройство и способ обработки изображений
US9197685B2 (en) * 2012-06-28 2015-11-24 Sonic Ip, Inc. Systems and methods for fast video startup using trick play streams
WO2014015110A1 (en) 2012-07-18 2014-01-23 Verimatrix, Inc. Systems and methods for rapid content switching to provide a linear tv experience using streaming content distribution
US9804668B2 (en) 2012-07-18 2017-10-31 Verimatrix, Inc. Systems and methods for rapid content switching to provide a linear TV experience using streaming content distribution
BR112015005153A2 (pt) * 2012-09-12 2017-07-04 Koninklijke Philips Nv aparelho de transformação de imagem, servidor de fornecimento de dados de algoritmo de mapeamento predefinido, método de obtenção de uma primeira imagem (hdr_pred) de lumas para um primeiro alcance dinâmico de luminância a partir da segunda imagem (ldr_cont) de lumas para um segundo alcance dinâmico de luminância e método de fornecimento de dados de algoritmo de mapeamento predefinido (gam, gam_enc) para transformar uma segunda imagem (ldr_cont) graduada para renderização em um display de um segundo alcance dinâmico de luminância
US20140086328A1 (en) * 2012-09-25 2014-03-27 Qualcomm Incorporated Scalable video coding in hevc
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9172740B1 (en) 2013-01-15 2015-10-27 Google Inc. Adjustable buffer remote access
US9311692B1 (en) 2013-01-25 2016-04-12 Google Inc. Scalable buffer remote access
US9225979B1 (en) 2013-01-30 2015-12-29 Google Inc. Remote access encoding
US10397292B2 (en) 2013-03-15 2019-08-27 Divx, Llc Systems, methods, and media for delivery of content
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
US10063868B2 (en) * 2013-04-08 2018-08-28 Arris Enterprises Llc Signaling for addition or removal of layers in video coding
JP6457488B2 (ja) * 2013-04-15 2019-01-23 ロッサト、ルカ ハイブリッド上位互換性のあるデータストリームをデコードするための方法
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
US9247317B2 (en) 2013-05-30 2016-01-26 Sonic Ip, Inc. Content streaming with client device trick play index
US9967305B2 (en) 2013-06-28 2018-05-08 Divx, Llc Systems, methods, and media for streaming media content
CN103686177B (zh) * 2013-12-19 2018-02-09 中国科学院深圳先进技术研究院 一种图像压缩、解压的方法、装置及图像系统
US9432624B2 (en) * 2014-01-03 2016-08-30 Clearone Communications Hong Kong Ltd. Method for improving an MCU's performance using common properties of the H.264 codec standard
CN104281427B (zh) * 2014-03-10 2018-04-27 深圳深讯和科技有限公司 交互应用中的视频数据处理方法和系统
US9866878B2 (en) 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
WO2015176280A1 (en) * 2014-05-22 2015-11-26 Microsoft Technology Licensing, Llc Re-encoding image sets using frequency-domain differences
CN104902275B (zh) * 2015-05-29 2018-04-20 宁波菊风系统软件有限公司 一种控制视频通信质量甜点的方法
CN105739935B (zh) * 2016-01-22 2019-06-04 厦门美图移动科技有限公司 一种多终端联合显示方法、装置及系统
GB2547442B (en) * 2016-02-17 2022-01-12 V Nova Int Ltd Physical adapter, signal processing equipment, methods and computer programs
US10075292B2 (en) 2016-03-30 2018-09-11 Divx, Llc Systems and methods for quick start-up of playback
US10178394B2 (en) * 2016-06-10 2019-01-08 Apple Inc. Transcoding techniques for alternate displays
MX2022004787A (es) 2016-10-12 2022-12-01 Fraunhofer Ges Forschung Transmisión continua espacialmente desigual.
US10498795B2 (en) 2017-02-17 2019-12-03 Divx, Llc Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming
US10742708B2 (en) 2017-02-23 2020-08-11 Netflix, Inc. Iterative techniques for generating multiple encoded versions of a media title
US10715814B2 (en) 2017-02-23 2020-07-14 Netflix, Inc. Techniques for optimizing encoding parameters for different shot sequences
US11178204B1 (en) * 2017-02-23 2021-11-16 Cox Communications, Inc. Video processor to enhance color space and/or bit-depth
US11153585B2 (en) 2017-02-23 2021-10-19 Netflix, Inc. Optimizing encoding operations when generating encoded versions of a media title
US11166034B2 (en) 2017-02-23 2021-11-02 Netflix, Inc. Comparing video encoders/decoders using shot-based encoding and a perceptual visual quality metric
US10666992B2 (en) 2017-07-18 2020-05-26 Netflix, Inc. Encoding techniques for optimizing distortion and bitrate
CN111917558B (zh) * 2020-08-13 2021-03-23 南开大学 一种基于区块链的视频帧数据双认证与分级加密方法
CN114650426A (zh) * 2020-12-17 2022-06-21 华为技术有限公司 一种视频处理方法、装置以及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0698308A (ja) * 1992-07-02 1994-04-08 American Teleph & Telegr Co <Att> 係数選択による周波数スケーリング可能な効率的ビデオ符号化方法及び装置
JPH0946680A (ja) * 1995-07-25 1997-02-14 Canon Inc 画像伝送システムおよび通信装置
JP2001258004A (ja) * 2000-01-05 2001-09-21 Canon Inc 画像符号化装置及び画像復号装置とその方法
US6526177B1 (en) * 1997-07-08 2003-02-25 At&T Corp. Generalized scalability for video coder based on video objects
JP2003515987A (ja) * 1999-11-23 2003-05-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ハイブリッドな時間的/snr的微細粒状スケーラビリティビデオ符号化
JP2004140667A (ja) * 2002-10-18 2004-05-13 Canon Inc 情報処理方法
US20060072661A1 (en) * 2004-10-05 2006-04-06 Samsung Electronics Co., Ltd. Apparatus, medium, and method generating motion-compensated layers

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2756399B1 (fr) * 1996-11-28 1999-06-25 Thomson Multimedia Sa Procede et dispositif de compression video pour images de synthese
IL167288A (en) * 1997-04-01 2012-03-29 Sony Corp Image encryption device, image encryption method, image decryption device, image decryption method, and appropriate medium
US6057884A (en) * 1997-06-05 2000-05-02 General Instrument Corporation Temporal and spatial scaleable coding for video object planes
US6993201B1 (en) * 1997-07-08 2006-01-31 At&T Corp. Generalized scalability for video coder based on video objects
RU2201654C2 (ru) * 1997-12-23 2003-03-27 Томсон Лайсенсинг С.А. Способ низкошумового кодирования и декодирования
JP2000032393A (ja) * 1998-07-09 2000-01-28 Sony Corp 画像情報処理装置および方法、並びに提供媒体
US20020126759A1 (en) * 2001-01-10 2002-09-12 Wen-Hsiao Peng Method and apparatus for providing prediction mode fine granularity scalability
KR100783396B1 (ko) * 2001-04-19 2007-12-10 엘지전자 주식회사 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법
JP4703114B2 (ja) * 2002-01-22 2011-06-15 マイクロソフト コーポレーション 開始符号エミュレーションの防止およびデータ充填のための方法およびシステム
US20030215011A1 (en) * 2002-05-17 2003-11-20 General Instrument Corporation Method and apparatus for transcoding compressed video bitstreams
AU2003237279A1 (en) * 2002-05-29 2003-12-19 Pixonics, Inc. Classifying image areas of a video signal
US20040086041A1 (en) * 2002-10-30 2004-05-06 Koninklijke Philips Electronics N.V. System and method for advanced data partitioning for robust video transmission
AU2003285634A1 (en) * 2002-12-16 2004-07-09 Koninklijke Philips Electronics N.V. Method and apparatus to encrypt video data streams
JP2006511026A (ja) * 2002-12-19 2006-03-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多層化ビデオの特徴的ポイント情報(cpi)
US7313814B2 (en) * 2003-04-01 2007-12-25 Microsoft Corporation Scalable, error resilient DRM for scalable media
US7406176B2 (en) 2003-04-01 2008-07-29 Microsoft Corporation Fully scalable encryption for scalable multimedia
KR20060007418A (ko) * 2003-05-02 2006-01-24 코닌클리케 필립스 일렉트로닉스 엔.브이. 신규 표준으로의 멀티층 코딩 지원 이동
KR100965881B1 (ko) * 2003-10-10 2010-06-24 삼성전자주식회사 비디오 데이터 인코딩 시스템 및 디코딩 시스템
US7797454B2 (en) * 2004-02-13 2010-09-14 Hewlett-Packard Development Company, L.P. Media data transcoding devices
US20050254575A1 (en) * 2004-05-12 2005-11-17 Nokia Corporation Multiple interoperability points for scalable media coding and transmission
KR100662350B1 (ko) * 2004-08-23 2007-01-02 엘지전자 주식회사 영상 전송 장치 및 방법
US20060078049A1 (en) * 2004-10-13 2006-04-13 Nokia Corporation Method and system for entropy coding/decoding of a video bit stream for fine granularity scalability
KR100714689B1 (ko) 2005-01-21 2007-05-04 삼성전자주식회사 다 계층 구조 기반의 스케일러블 비디오 코딩 및 디코딩방법, 이를 위한 장치
US7668962B2 (en) * 2005-02-07 2010-02-23 Symantec Operating Corporation System and method for connection failover using redirection
US20060212542A1 (en) * 2005-03-15 2006-09-21 1000 Oaks Hu Lian Technology Development Co., Ltd. Method and computer-readable medium for file downloading in a peer-to-peer network
CN1319382C (zh) * 2005-04-07 2007-05-30 西安交通大学 可伸缩视频编解码器体系结构设计方法
US7953224B2 (en) * 2005-05-20 2011-05-31 Microsoft Corporation MPEG-4 encryption enabling transcoding without decryption
CN100358364C (zh) * 2005-05-27 2007-12-26 上海大学 基于h.264的精细颗粒可伸缩编码的码率控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0698308A (ja) * 1992-07-02 1994-04-08 American Teleph & Telegr Co <Att> 係数選択による周波数スケーリング可能な効率的ビデオ符号化方法及び装置
JPH0946680A (ja) * 1995-07-25 1997-02-14 Canon Inc 画像伝送システムおよび通信装置
US6526177B1 (en) * 1997-07-08 2003-02-25 At&T Corp. Generalized scalability for video coder based on video objects
JP2003515987A (ja) * 1999-11-23 2003-05-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ハイブリッドな時間的/snr的微細粒状スケーラビリティビデオ符号化
JP2001258004A (ja) * 2000-01-05 2001-09-21 Canon Inc 画像符号化装置及び画像復号装置とその方法
JP2004140667A (ja) * 2002-10-18 2004-05-13 Canon Inc 情報処理方法
US20060072661A1 (en) * 2004-10-05 2006-04-06 Samsung Electronics Co., Ltd. Apparatus, medium, and method generating motion-compensated layers

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNB199700412001; ITU-T ホワイトブック オーディオビジュアル/マルチメディア関連(Hシリーズ)勧告書 , 19950218, p.380,497,498, 財団法人新日本ITU協会 *
CSNG200001008005; 児玉 明、外2名: 'MSP通信サービスにおける動画像情報変換記述方式に関する検討' 電子情報通信学会技術研究報告 第98巻, 第681号, 19990319, p.59-64, 社団法人電子情報通信学会 *
JPN6013000310; ITU-T ホワイトブック オーディオビジュアル/マルチメディア関連(Hシリーズ)勧告書 , 19950218, p.380,497,498, 財団法人新日本ITU協会 *
JPN6013000311; 児玉 明、外2名: 'MSP通信サービスにおける動画像情報変換記述方式に関する検討' 電子情報通信学会技術研究報告 第98巻, 第681号, 19990319, p.59-64, 社団法人電子情報通信学会 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013255207A (ja) * 2011-11-11 2013-12-19 Sony Corp 画像データ送信装置、画像データ送信方法および画像データ受信装置
KR20140093168A (ko) * 2011-11-11 2014-07-25 소니 주식회사 화상 데이터 송신 장치, 화상 데이터 송신 방법 및 화상 데이터 수신 장치
US9693033B2 (en) 2011-11-11 2017-06-27 Saturn Licensing Llc Transmitting apparatus, transmitting method, receiving apparatus and receiving method for transmission and reception of image data for stereoscopic display using multiview configuration and container with predetermined format
KR102009048B1 (ko) * 2011-11-11 2019-08-08 소니 주식회사 화상 데이터 송신 장치, 화상 데이터 송신 방법 및 화상 데이터 수신 장치
JP2015530025A (ja) * 2012-08-10 2015-10-08 エルジー エレクトロニクス インコーポレイティド 信号送受信装置および信号送受信方法
US9451205B2 (en) 2012-08-10 2016-09-20 Lg Electronics Inc. Signal transceiving apparatus and signal transceiving method

Also Published As

Publication number Publication date
AU2007319699B2 (en) 2011-06-09
WO2008060732A2 (en) 2008-05-22
WO2008060732A3 (en) 2008-07-31
KR101354833B1 (ko) 2014-01-23
EP2055106A4 (en) 2013-01-30
EP2055106A2 (en) 2009-05-06
MX2009001387A (es) 2009-02-13
AU2007319699A1 (en) 2008-05-22
US20080043832A1 (en) 2008-02-21
CN101507278B (zh) 2011-08-03
KR20090051042A (ko) 2009-05-20
CN101507278A (zh) 2009-08-12
RU2497302C2 (ru) 2013-10-27
RU2009105072A (ru) 2010-08-20
BRPI0714235A2 (pt) 2013-04-02
EP2055106B1 (en) 2015-06-17

Similar Documents

Publication Publication Date Title
AU2007319699B2 (en) Techniques for variable resolution encoding and decoding of digital video
US10630938B2 (en) Techniques for managing visual compositions for a multimedia conference call
Srinivasan et al. Windows Media Video 9: overview and applications
US8918533B2 (en) Video switching for streaming video data
KR100557103B1 (ko) 데이터 처리방법 및 데이터 처리장치
TWI510097B (zh) 視頻編碼方法和系統
US20160127728A1 (en) Video compression apparatus, video playback apparatus and video delivery system
JP2008537427A (ja) 効率的なビデオ復号化アクセラレータ
Rusert et al. Guided just-in-time transcoding for cloud-based video platforms
US20110080944A1 (en) Real-time video transcoder and methods for use therewith
KR20120012089A (ko) 스케일러블 비디오 코딩기법을 활용하는 영상 제공 시스템 및 그 방법
Yanagihara et al. Scalable video decoder and its application to multi-channel multicast system
WO2022247452A1 (zh) 多媒体资源中轨道数据的处理方法、装置、介质及设备
Akramullah et al. Video Coding Standards
Janson A comparison of different multimedia streaming strategies over distributed IP networks State of the art report [J]
Ip et al. Macroblock-based algorithm for dual-bitstream MPEG video streaming with VCR functionalities
Roy Implementation of a Personal Digital Radio Recorder for Digital Multimedia Broadcasting by Adapting the Open-Source Personal Digital Video Recorder Software MythTV
Larbier AVC-I: Yet Another Intra Codec for Broadcast Contribution?
Ribas-Corbera Windows Media 9

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130411

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130712

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131126