JP2005176383A - 色空間の符号化フレームワーク - Google Patents

色空間の符号化フレームワーク Download PDF

Info

Publication number
JP2005176383A
JP2005176383A JP2004358958A JP2004358958A JP2005176383A JP 2005176383 A JP2005176383 A JP 2005176383A JP 2004358958 A JP2004358958 A JP 2004358958A JP 2004358958 A JP2004358958 A JP 2004358958A JP 2005176383 A JP2005176383 A JP 2005176383A
Authority
JP
Japan
Prior art keywords
stream
format
bit stream
information
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004358958A
Other languages
English (en)
Inventor
Feng Wu
ウー フェン
Jacky Shen
シェン ジャッキー
Lujun Yuan
ユアン ルジュン
Li Shipeng
リ シペン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005176383A publication Critical patent/JP2005176383A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/04Colour television systems using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/646Transmitting or storing colour television type signals, e.g. PAL, Lab; Their conversion into additive or subtractive colour signals or vice versa therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)

Abstract

【課題】 トランスコーダを使用せずに、2つまたは複数のビデオ・フォーマット間で変換する符号化フレームワークを提供する。
【解決手段】 第1の色空間サンプリング・フォーマットに従ってフォーマットされた色情報を含むビデオ情報ストリームは基本ストリームと拡張ストリームに分割される。基本ストリームは第2の色空間サンプリング・フォーマットに従ってフォーマットされる。拡張ストリームは、基本ストリームと組み合わせられたときに、第1フォーマットを復元する拡張情報を含む。符号化時に、拡張ストリームは、基本情報ストリームに関連付けられる空間情報を使用して符号化することができる。符号化された基本ストリームおよび符号化された拡張ストリームからなる出力ストリームは、インタリーブあるいは連結することができ、または符号化された基本ストリーム、および符号化された基本ストリーム用の独立したファイルを含むことができる。
【選択図】 図11

Description

本発明は、マルチメディアに関し、より詳細には、ビデオ・フォーマット(video formats;映像形式)を扱うための色空間の符号化フレームワーク(color space coding framework)に関する。
家電市場は、絶えず変化している。市場が絶えず変化している1つの理由は、消費者が、電子装置についてより高いビデオ品質を求めているからである。その結果、製造元は、より解像度の高いビデオ装置の設計を行っている。より高解像度のビデオ装置をサポートするために、よりよいビジュアル品質を実現する、より優れたビデオ・フォーマットが設計されつつある。
ビデオ・フォーマットの大部分がそこから導出されている2つの主要な色空間(color space )がある。第1の色空間は一般に、RGB(赤緑青)色空間(以下、RGBと称する)と呼ばれる。RGBは、コンピュータ・モニタ、カメラ、スキャナなどで使用される。RGB色空間は、それに関連する多数のフォーマットを有する。それぞれのフォーマットは、各ピクセルごとに、赤、緑および青のクロミナンスを表す値を含む。あるフォーマットでは、それぞれの値は、8ビット・バイトである。したがって、それぞれのピクセルは、24ビット(8ビット(R)+8ビット(G)+8ビット(B))を使う。別のフォーマットでは、それぞれの値は、10ビットである。したがって、それぞれのピクセルは、30ビットを使う。
テレビ・システムでは、別の色空間が広く使用されてきており、それは一般に、YCbCr色空間またはYUV色空間(以下、YUVと称する)と呼ばれる。YUVは、人間の目が、ピクセルの色の違いよりもその強度の違いにより敏感であることを考慮しているので、所与の帯域幅において、RGBと比較すると、多くの点で、優れたビデオ品質をもたらす。結果として、色差信号(color difference signal)をサブ・サンプリングして、帯域幅の節約を実現することができる。したがって、YUV色空間に関連付けられたビデオ・フォーマットはそれぞれ、各ピクセルごとに、輝度値()(Y)を有し、また2つあるいはそれ以上のピクセル間で、(UおよびVで表される)色値を共有することができる。U(Cb)の値は、B−Y間の青のクロミナンス差を表し、V(Cr)の値は、R−Y間の赤のクロミナンス差を表す。緑のクロミナンス値は、Y、UおよびVの値から導出され得る。ビデオ符号化の分野では、YUV色空間が、圧倒的に使用されてきた。
複数のYUVフォーマットが、現在存在している。図1〜5に、より一般的なYUVフォーマットのうちの5つ、すなわちYUV444、YUV422、YUV420、YUV411およびYUV410をそれぞれ示す。図1〜5に、配列(array)100〜500をそれぞれ図示する。図示される配列はそれぞれ、8×8のブロック配列である。しかし、これらの配列は、任意のディメンションのものでよく、また必ずしも正方形である必要はない。配列の各ブロック(点で表される)は、ピクセルの配列を表す。便宜上、また従来のビデオ技術に沿うように、以下の議論では、それぞれのブロックが1つのピクセル(ピクセルP〜Pなど)を表すものとして説明する。したがって、以下では、用語「ピクセル」は、配列100〜500に言及する場合に、用語「ブロック」と同義に(interchangeably)用いられる。ピクセルは、目標のビデオ・フォーマットに望まれるサンプリングに基づいて、マクロ・ブロック(マクロ・ブロックMB〜MBなど)にグループ化される。図1〜3では、それぞれが4ピクセル(ピクセルP〜Pなど)を含むマクロ・ブロックが示されている。図4〜5では、それぞれが16ピクセル(ピクセルP〜P16など)を含むマクロ・ブロックが示されている。次に、それぞれのYUVフォーマットについて、より詳細に説明する。
図1に、YUV444フォーマット(形式)を図示する。YUV444フォーマットでは、それぞれのピクセルは、Y、UおよびVの値で表される。たとえば、YUV444フォーマットは、Pでは、Y値について8ビット、U値について8ビット、V値について8ビットを含む。したがって、それぞれのピクセルは、24ビットで表される。このフォーマットでは、それぞれのピクセルについて、24ビットを使用するので、ビット数が減らされるように、他のフォーマットは、YUV444からダウン・サンプリングされる。ピクセル単位のビット数を減らすことによって、ストリーミング効率の向上がもたらされる。しかし、ダウン・サンプリングすると、結果として、それに対応するビデオ品質の低下が生じる。
図2に、YUV422フォーマット(形式)を示す。YUV422フォーマットでは、それぞれのピクセルは、Y値で表される。しかし、YUV444フォーマットとは異なり、そのUおよびVの値は、任意選択でフィルタリングされ、次いで、ダウン・サンプリングされる。フィルタリングおよびダウン・サンプリングは、既知の技術を使用して、同時に実施され得る。配列200で、水平方向に2ピクセルごとにサンプリングされているものを示すことによって、配列200に、ダウンダンプリングの結果を概念的に示す。サンプリングされたピクセルは、配列200内で、「X」で示される。したがって、ピクセルPおよびPはそれぞれ、24ビットで表される。しかし、ピクセルPおよびPはそれぞれ、8ビット(Y値のみ)で表される。YUV422フォーマットのピクセル単位の平均ビット数は、16ビット((24+24+8+8)/4)である。YUV422は、パックされたYUV色空間(packed YUV color space)であり、それは、Y、UおよびVサンプルが、インタリーブされていることを意味する。一般に、MPEG−2やMPEG−4など、YUV422フォーマットをサポートする標準は、すべてのクロミナンス・ブロックを一緒にコード化する。たとえば、MPEG−2用のYUV422フォーマットでは、YUV422データを、Y1 U1 Y2 V1として、メモリに格納し、ただし、Y1およびY2は、ピクセルPおよびPの輝度値をそれぞれ表す。Y1およびY2は、2つの輝度ブロックを表す。U1およびV1は、2つのクロミナンス・ロックを表す。
図3に、YUV420フォーマット(形式)を図示する。配列300で、水平方向に2ピクセルごとに、かつ縦方向に2ピクセルごとにサンプリングされているものを示すことによって、配列300に、YUV444フォーマットから、オプションでフィルタリングされ、またダウン・サンプリングされた結果を概念的に示す。この場合も、配列300で、サンプリングされたピクセルは、「X」で示される。したがって、YUV420フォーマットでは、ピクセルPだけが、24ビットで表される。しかし、ピクセルP〜Pはそれぞれ、8ビット(Y値のみ)で表される。YUV420フォーマットのピクセル単位の平均ビット数は、12ビット((24+8+8+8)/4)である。YUV420は、平面フォーマット(planar format)であり、パックされたフォーマットではない。したがって、YUV420データは、すべてのYデータがまず格納され、次いで、Uデータ、次いで、すべてのVデータが格納されるように、メモリに格納される。したがって、4つの輝度ブロック、1つのUクロミナンス・ブロック、および1つのVクロミナンス・ブロックがある。
図4に、YUV411フォーマット(形式)を図示する。配列400で、水平方向に4ピクセルごとにサンプリングされているものを示すことによって、配列400に、YUV444フォーマットから、オプションでフィルタリングされ、またダウン・サンプリングされた結果を概念的に示す。したがって、P、P、P、およびP13はそれぞれ、24ビットで、また他の12ピクセルは、8ビットで表される。YUV411フォーマットのピクセル単位の平均ビット数は、12ビットである。
図5に、YUV410フォーマット(形式)を図示する。配列500で、水平方向に4ピクセルごとに、かつ垂直方向に4ピクセルごとにサンプリングされているものを示すことによって、配列500に、YUV444フォーマットから、オプションでフィルタリングされ、またダウン・サンプリングされた結果を概念的に示す。したがって、Pだけは24ビットで、他の15個のピクセルは、8ビットで表される。YUV410フォーマットのピクセル単位の平均ビット数は、9ビットである。
したがって、望まれる品質、および使用可能な伝送帯域幅に基づいて、電子装置製造元は、電子装置を、こうしたおよび他のフォーマットのいずれかで動作するように設計することができる。しかし、後に、伝送帯域幅が増加し、および/または消費者がより高品質のビデオを求め始める場合に、既存の電子装置は、その、より高品質のビデオ・フォーマットをサポートしない可能性がある。たとえば、現在多くのデジタル・テレビ、セットトップボックスおよび他の装置が、YUV420ビデオ・フォーマットで動作するように設計されている。様々なカテゴリの消費者を満足させるために、これらの両方のビデオ・フォーマットに対処することが求められている。
テレビ局は、より高品質のビデオ・フォーマット(YUV422など)と、より低品質のビデオ・フォーマット(YUV420など)の両方をブロードキャストすることができる。しかし、このオプションは、2つの異なるチャネル上に、同じコンテンツを含むことを必要とし、このことは貴重なチャネル・リソースを消費するので、テレビ放送事業者にとって、高価なものである。したがって、現在、より高解像度のフォーマットは、サーバ側またはクライアント側で、より低解像度のフォーマットにトランスコード(transcode)されている。図6は、トランスコーディング・プロセスを示すブロック図である。トランスコーダ600は、フォーマット(形式)A(YUV422など)の入力フォーマットを受け付け、フォーマット(形式)B(YUV420など)の出力フォーマットを出力する。このトランスコーディング・プロセスにおいて、Y、UおよびV成分を含むビデオ入力・フォーマットの全体が復号される。UV成分は動き補償され、これに伴う動きベクトルは、Y成分を復号することによってしか得られないので、Y成分はUV成分とともに復号されなければならない。したがって、輝度ブロックおよびすべてのクロミナンス・ブロックを復号して、入力フォーマットによる元のビデオの復元されたバージョンが得られる。次いで、入力フォーマットを所望の出力フォーマットに変換するために、クロミナンス成分がダウンサンプルされる。最後に、新たに生成されたビデオが、再び符号化されて、出力フォーマット(フォーマットB)のビット・ストリームが生成される。このトランスコーディング・プロセスは一般に、エンコーダにデコーダを加えたものに等しいので、高価である。高速のトランスコーディング方法が存在するが、一般に、品質の低下がもたらされる。
トランスコーダ600は、クライアント側でも、サーバ側でも、また別の場所でも存在することができる。トランスコーディング・プロセスが、クライアント側で実施される場合、高品質ビデオのサービスに加入している消費者は、高品質ビデオにアクセスすることができ、他の消費者は、低品質ビデオにアクセスすることができる。トランスコーディング・プロセスが、サーバ側で実施される場合、どの消費者も、高品質のビデオにアクセスすることができない。トランスコーディング・プロセスは、非常に高価であり、一般に、品質の低下につながるので、どちらのオプションも、最適ではない。
したがって、既存のより低品質のビデオ装置で動作すること(operation)を維持しながら、高品質のビデオを提供するためのよりよい解決策が必要とされている。
この色空間符号化フレームワークは、トランスコーダを使用せずに、2つまたは複数のビデオ・フォーマット間で変換することを提供する。第1の色空間サンプリング・フォーマットに従ってフォーマットされた色情報を含むビデオ情報ストリームが、基本ストリームと拡張ストリームに分割される。基本ストリームは、第2の色空間サンプリング・フォーマットに従ってフォーマットされる。拡張ストリームは、基本ストリームと組み合わせられたときに、第1フォーマットを復元する拡張情報を含む。符号化時に、拡張ストリームは、基本情報ストリームに関連する空間情報を使用して符号化され得る。符号化された基本ストリーム、および符号化された基本ストリームの出力ストリームは、インタリーブされ連結されることができ、または符号化された基本ストリーム、および符号化された拡張ストリームのための独立したファイルを含むことができる。
簡潔に説明すると、この色空間符号化フレームワークは、入力ビデオ符号化フォーマットから、複数のデータ・ストリームを生成するための方法を提供する。複数のデータ・ストリームは、第2のビデオ符号化フォーマットに対応する基本ストリーム、および入力ビデオ符号化フォーマットから得られた拡張情報を含む、少なくとも1つの拡張ストリームを含む。本方法を使用することによって、マルチメディア・システムは、様々な電子装置をサポートするために、入力ビデオ・フォーマットを、他のビデオ・フォーマットにトランスコードする必要性を克服することができる。以下の説明を読んだ後に、より低品質のフォーマットを使用して動作するように構成された電子装置が、本発明の色空間符号化フレームワークを使用して、周期的なクロミナンス・ブロックを容易に切り捨てたり、また、結果として生じるビデオが依然として正確に表示されるようにしたりすることができることが理解されよう。以下の議論では、YUV422およびYUV420ビデオ・フォーマットを使用して、本符号化フレームワークについて説明する。しかし、この符号化フレームワークが、他のビデオ・フォーマットで、またビデオ・フォーマットの色ブロック(chromo block)内に含まれる情報に類似の情報を含むブロックに分割されることが可能な他のマルチメディア・フォーマットで動作し得ることが、ビデオ符号化分野の当業者には理解されよう。
したがって、以下の説明では、特定の例示的な符号化フレームワークについて説明する。他の例示的な符号化フレームワークは、この特定の実施形態の特徴、および/またはマルチメディア・フォーマット(ビデオ・フォーマットなど)をトランスコードする必要を取り除くことを目的とし、また電子装置に複数のメルチメディア・フォーマットを提供することを目的とする他の特徴を、含むことが可能である。
以下の詳細な説明は、複数の節に分けられる。第1の節では、本発明の符号化フレームワークを組み込む、例示的なコンピューティング装置について説明する。第2の節では、符号化フレームワーク内の個々の要素について説明する。第3の節では、本発明の色空間符号化フレームワークに従って符号化および復号される例示的なビット・ストリームについて説明する。
例示的なコンピューティング装置
図7に、例示的な本発明の符号化フレームワークを使用することができる例示的なコンピューティング装置を示す。コンピューティング装置の例は、テレビ受像機がインターネットとのインターフェイスになることを可能にしたり、またテレビ受像機がデジタル・テレビ(DTV:digital television)ブロードキャストを受信し復号することを可能にしたりするセットトップボックスを含む。他の構成では、例示的なコンピューティング装置は、セットトップボックスから分離され、セットトップボックスに入力を提供し得る。コンピューティング装置の別の例には、デジタル・カムコーダ(digital camcorder)やデジタル・カメラなどのビデオ記録装置が含まれる。非常に基本的な構成では、コンピューティング装置700は一般に、少なくとも1つの処理装置702、およびシステム・メモリ704を含む。厳密な構成およびコンピューティング装置のタイプに応じて、システム・メモリ704は、揮発性(RAMなど)でも、不揮発性(ROM、フラッシュ・メモリなど)でも、またその2つの組合せでもよい。システム・メモリ704は一般に、オペレーティング・システム705、1つまたは複数のプログラム・モジュール706を含み、またプログラム・データ707を含むことができる。ウェブ・ブラウザは、オペレーティング・システム705内に含まれることも、またプログラム・モジュール706のうちの1つであることもある。ウェブ・ブラウザによって、コンピューティング装置は、インターネットを介して通信することができる。
コンピューティング装置700は、追加の特徴または機能を有し得る。たとえば、コンピューティング装置700は、たとえば磁気ディスク、光ディスクまたはテープなど、追加のデータ記憶装置(取外し可能/取外し不可能)をも含むことができる。図7では、こうした追加の記憶装置は、取外し可能記憶装置709および取外し不可能記憶装置710で示される。コンピュータ記憶媒体は、コンピュータ可読命令、データ構造体、プログラム・モジュールまたは他のデータなど、情報を格納するための任意の方法または技術で実装された、揮発性および不揮発性、取外し可能および取外し不可能な媒体を含むことができる。システム・メモリ704、取外し可能記憶装置709および取外し不可能記憶装置710はすべて、コンピュータ記憶媒体の例である。コンピュータ記憶媒体には、それだけに限らないが、RAM、ROM、EEPROM、フラッシュ・メモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、あるいは所望の情報を格納するために使用することができ、またコンピューティング装置700からアクセスすることができる他の任意の媒体が含まれ得る。こうしたどのコンピュータ記憶媒体もが、装置700の一部であることが可能である。コンピューティング装置700は、キーボード、マウス、ペン、音声入力装置、タッチ入力装置などの入力装置712をも含むことが可能である。ディスプレイ、スピーカ、プリンタなどの出力装置714も含まれることが可能である。こうした装置は、当技術分野では周知であり、本明細書では、詳細に論じる必要はない。コンピューティング装置700は、ビデオおよびオーディオの復号のため、また本発明の符号化フレームワークに従って実施される処理のための1つまたは複数の装置(チップなど)をも含むことが可能である。
コンピューティング装置700は、それが他のコンピューティング装置718と、たとえばネットワークを介して通信できるようにする通信接続716をも含み得る。通信接続716は、通信媒体の一例である。通信媒体は、一般に、搬送波もしくは他の移送機構などの変調されたデジタル信号の形に、コンピュータ可読命令、データ構造体、プログラム・モジュール、または、他のデータを具現化することによって実施することができ、また任意の情報配信媒体を含む。用語「変調されたデータ信号」は、信号に情報を符号化するような形でその特性の1つまたは複数が設定または変更された信号を意味する。限定のためではなく、例を挙げると、通信媒体には、有線ネットワークや直接有線接続などの有線媒体、ならびに音響、RF、赤外線などの無線媒体、および他の無線媒体などが含まれ得る。したがって、通信媒体は、電話回線および電話ケーブルを含む。本明細書では、コンピュータ可読媒体という用語は、記憶媒体と通信媒体の両方を含む。
例示的な符号化フレームワーク
図8は、第1のビデオ符号化フォーマット(フォーマットAなど)を、複数のストリーム(基本フォーマットBのストリーム、および拡張フォーマットBのストリーム)に分離するためのクロマ分離器(chroma separator)800のブロック図である。フォーマットAから基本ストリームを分離するためのプロセスについて、次に説明する。ダウン・サンプリングされたフォーマットの品質を向上させるために、高解像度から低解像度にダウン・サンプリングする前に、ロー・パス・フィルタリングを実施する一般的な手順は当業者には理解されよう。したがって、クロマ分離器800は、オプションのロー・パス・フィルタ804を含むことになる。ロー・パス・フィルタは、様々な商用ロー・パス・フィルタのいずれかとすることができる。たとえば、MPEG−4用にMPEG(Moving Picture Experts Group)に提案されたロー・パス・フィルタを使用することができる。MPEG−4ロー・パス・フィルタの係数は、c=[5/32,11/32,11/32,5/32]である。あるいは、クロマ分離器800は、ロー・パス・フィルタ804を介してYUV値を処理せずに、YUV値を保持することもできる。フォーマットAから基本ストリームを分離するためのプロセスは、ダウン・サンプラー808をも含む。ダウン・サンプラー808は、所望の出力フォーマット用に指定された各行および列について、クロミナンス・ブロックを保持するように構成される。フォーマットAの基本フォーマットBへの変換は、当業者には周知であり、現在、一般的に実施されている。ダウン・サンプラー808の結果は、基本フォーマットBのストリーム(YUV420など)である。
別の実施形態では、フィルタ804およびダウン・サンプラー808は、組み合わせて、畳み込み演算(convolution operation)することができる。一般に、畳込みは、乗算、集計、およびシフトの組合せを含む。ある例示的な畳込み演算は、以下の通りである。 L=C 2k+C 2k+1+C 2k+2+C 2k+3 数式1
ただし、k=0,1,2,…n−1
=d 2k+d 2k+1+d 2k+2+d 2k+3
数式2
ただし、k=0,1,2,…n−1
境界ピクセルでは、ミラー拡張(mirror extension)を適用することができる。偶数のタップがある場合について、ミラー拡張を適用する例示的な一方法は、以下の通りである。
−2=f,f−1=f,f2n=f2n−1,f2n+1=f2n−2
式3
奇数のタップがある場合について、ミラー拡張を適用する例示的な別の方法は、以下の通りである。
−2=f,f−1=f,f2n=f2n−2,f2n+1=f2n−3 数式4
数式1〜4では、nは、UV信号の垂直ディメンションであり、fは、フォーマットAのクロミナンス・ロックの位置kにおけるピクセル値に対応する。LおよびHは、結果として生じる基本フォーマットBおよび拡張フォーマットBストリームの位置kにおけるピクセル値を表す。
次に、フォーマットAから拡張ストリームを分離するためのプロセスについて説明する。クロマ分離器800は、オプションのハイ・パス・フィルタ806を含むことになる。例示的なハイ・パス・フィルタ806は、係数d=[5/12、11/12、−11/12,−5/12]を含むことができる。あるいは、クロマ分離器800は、フィルタ806を適用せずに、第1ビデオ符号化フォーマットからのYUV値を保持することができる。フォーマットAから拡張ストリームを分離するためのプロセスは、ダウン・サンプラー810を含む。ある実施形態では、ダウン・サンプラー810は、ダウン・サンプラー808が保持しなかったすべての列を保持するように構成される。たとえば、YUV422からYUV420に変換する場合に、ダウン・サンプラー810は、ハイ・パス・フィルタの出力のすべての偶数列を保持し得る。過去では、トランスコード・プロセスの時に、こうした「余分の」クロミナンス・ブロックは、単純に切り捨てられていた。しかし、本発明の色空間符号化フレームワークによれば、こうした「余分の」クロミナンス・ブロックは、拡張フォーマットBストリームになる。以下で詳述するように、こうした「余分の」クロミナンス・ブロックを別個のストリーム内に維持することによって、2つのフォーマット間で変換するときに、非効率的なトランスコード・プロセスを、回避することができる。
別の実施形態では、フィルタ806およびダウン・サンプラー810は、組み合わせて、数式1〜4および関連する本文によって上記で説明した畳込み演算と同様な畳込み演算にすることができる。
別の例示的な実施形態では、ウェーブレット変換(すなわち分解およびダウン・サンプリング)が適用され、2つの所望の出力フォーマット、すなわち基本フォーマットBおよび拡張フォーマットBを生成する、得る。たとえば、変形9/7Daubechiesウェーブレット変換(modified 9/7 Daubechies wavelet transform)が適用され得る。9/7ウェーブレットについて説明している追加の情報は、JPEG−2000のリファレンスから取得することができる。標準の9/7Daubechiesウェーブレット変換(すなわちフィルタリングおよびダウン・サンプリング)は、フォーマットAを、フォーマットBおよび拡張フォーマットBに変換する。ロー・パス解析フィルタの係数、およびハイパス解析フィルタの係数は、以下の通りである。
L(9):
0.026748757411,
−0.016864118443,
−0.078223266529,
0.266864118443,
0.602949018236,
0.266864118443,
−0.078223266529,
−0.016864118443,
0.026748757411
Η (7):
0.045635881557,
−0.028771763114,
−0.295635881557,
0.557543526229,
−0.295635881557,
−0.028771763114,
0.045635881557
変換時の精度損失が最小になるように、整数リフティング方式が使用されて、9/7ウェーブレット変換が実現される。整数リフティング方式は、プロセスの間のあらゆる中間結果を取得し、その結果を、四捨五入(rounding)、切上げ整数化(ceiling)、切り捨て整数化(flooring)、あるいは切落し(clipping)によって、整数に変換する。図15に、例示的な整数リフティング構成(integer lifting structure)1500が示されている。処理は、左から右に実施される。図15で、点X〜Xは、フォーマットAの元のピクセルを表す。点l〜lは、フォーマットBのピクセルを表す。点h〜hは、拡張フォーマットBのピクセルを表す。湾曲した矢印は、ミラー拡張を表す。記号(アルファ、ベータなど)を伴う方向分岐は、適用可能な記号に関連付けられた係数である第1の乗数、およびそれが離れるノードの値である第2の乗数による、乗算演算の適用を表す。水平分岐は、スケーリングせずに、あるノードの値を次の段階に繰り上げる演算の適用を表す。あるノードで合流する分岐は、これらの分岐に運ばれたすべての値が合算されて、合流ノードの値が生成されることを意味する。フォーマットBの結果として生じる係数が、[0,255]の範囲内になるように、値kへの修正が、適用されることになる。
図10に、フォーマットAがYUV422に対応し、基本フォーマットがYUV420に対応する場合のクロマ分離器800の結果が示されている。図10に、図2に示す第1のビデオ符号化フォーマット(ビデオ符号化フォーマットYUV422など)に従ってサンプリングされた、配列200を示す。それぞれのマクロ・ブロック(マクロ・ブロックMBなど)は、4つの輝度ブロック、ならびにUについて1つ、Vについて1つの2つのクロミナンス・ブロックを含む。フォーマットYUV422の1つのマクロ・ブロックのメモリ・レイアウトは、4つの輝度ブロックおよび4つのクロミナンス・ブロックすなわちY1 Y2 Y3 Y4 U1 V1 U2 V2を伴う。このYUV422フォーマットが、(図3に示す)YUV420フォーマットを受け付ける電子装置によって使用される必要がある場合、過去では、YUV422フォーマットは、それぞれの色ブロックを復号し、色ブロックを演算し、次いで、色ブロックを再び符号化するトランスコーダに入力されていた。
しかし、本発明の色空間符号化フレームワークを使用して、YUV422は、配列1000にフォーマットBとして図示する新しいやり方で、符号化され、このフォーマットBは、基本Bおよび拡張Bを含んでいる。不要なクロミナンス・ブロックを切り捨てる従来の変換方法とは異なり、本発明の色空間符号化フレームワークは、出力が本質的に2つのあるいはそれ以上のストリームを有するように、クロミナンス・ブロックを再構成する。第1ストリームは、クロマ分離器800内で、オプションのロー・パス・フィルタ804、およびダウン・サンプラー808を用いて生成された、YUV420などの基本フォーマットのクロミナンス・ブロックを含む。第2ストリームは、入力フォーマットからの余分のクロミナンス・ブロックを含むが、これらのブロックは、基本フォーマットによっては使用されないブロックである。したがって、基本フォーマットが完全に自己完結であることを確実にするように、第1ストリームは、基本フォーマットに関連付けられたクロミナンス・ブロックの完全なセットを含む。第2ストリームは、クロマ分離器800内で、オプションのハイ・パス・フィルタ806、およびダウン・サンプラー810を用いて生成される。したがって、第2ストリームは、拡張ストリームを表し、この拡張ストリームは、第1ストリームと合わさって、入力ストリーム(フォーマットA)を復元(再構成)する。図示するように、基本ストリームと拡張ストリームの生成は、クロミナンス・ブロック(ピクセル)の移し替え(shuffling)によって行われ、それはクロミナンス成分のレイアウトを操作する。
図9は、基本フォーマットBストリームと拡張フォーマットBストリームをマージして、第1ビデオ符号化フォーマット(フォーマットAなど)にするためのクロマ複合器(chroma compositor)のブロック図である。クロマ複合器900は、アップ・サンプラー(up-sampler)904、およびクロマ複合器900への入力である基本フォーマットBストリーム処理するための、オプションの合成フィルタ908を含む。さらに、クロマ複合器900は、アップ・サンプラー906、およびクロマ複合器900への入力である拡張フォーマットBストリーム処理するための、オプションの合成フィルタ910を含む。クロマ複合器900は、アップ・サンプリングおよびフィルタリングの後に、出力をマージして、所望の第1ビデオ符号化フォーマットにする合成器(merger)912をも含む。YUV422フォーマットおよびYUV420フォーマットを必要とする例示的な一実施形態では、合成器912は、2つの合成フィルタの出力を合計して、YUV422ビデオ・ストリームを復元する。
アップ・サンプラー904は、必要に応じて、受信ストリームをパディング(pudding)する。オプションの合成フィルタ908は、係数c’=[−5/12,11/12,11/12,−5/12]を使用することができる。
アップ・サンプラー906も同様に、必要に応じて、受信ストリームをパディングする。オプションの合成フィルタ910は、係数d’=[−5/32,11/32,−11/32,5/32]を使用することができる。アップ・サンプラー904および合成フィルタ908は、マージして、以下の畳込み演算にすることができる。
2k=2(c+ck−1+d+dk−1) 数式5
ただし、k=0,1,2,…n−1
2k+1=2(c+ck−1+d+d k−1) 数式6
ただし、k=0,1,2,…n−1
アップ・サンプラー904および906は、ダウン・サンプラー808および810の全く逆の演算をそれぞれ実施する。806および810で切り捨てられた列については、904および906は、0を埋める。アップ・サンプラーの後に、信号が元の解像度に復元される。
境界ピクセルでは、ミラー拡張が適用され得る。偶数のタップが存在する場合について、ミラー拡張を適用するための1つの例示的な方法は、以下の通りである。
−1=L0,−1=H 数式7
奇数のタップが存在する場合について、ミラー拡張を適用するための別の例示的な方法は、以下の通りである。
−1=L1,−1=H 数式8
数式5〜8において、nは、UV信号の垂直ディメンションであり、fは、フォーマットAのクロミナンス・ブロックの位置kにおけるピクセル値に対応する。LおよびHは、結果として生じる基本フォーマットBおよび拡張フォーマットBストリームの位置kにおけるピクセル値を表す。
デコーダ1200の別の実施形態では、逆9/7ウェーブレット変換(すなわちアップ・サンプリングおよびフィルタリング)を実施して、基本フォーマットBおよび拡張フォーマットBから、フォーマットAのビデオが復元される。ロー・パス合成フィルタの係数およびハイパス合成フィルタの係数は、以下の通りである。
L (7):
−0.045635881557,
−0.028771763114,
0.295635881557,
0.557543526229,
0.295635881557,
−0.028771763114,
−0.045635881557
L(9):
0.026748757411,
0.016864118443,
−0.078223266529,
−0.266864118443,
0.602949018236,
−0.266864118443,
−0.078223266529,
0.016864118443,
0.026748757411
図16に、逆変形9/7Daubechiesウェーブレット変換に関連付けられた、対応する整数リフティング構成1600を図示する。図15について定義された記号によって、整数リフティング構成1600を説明している。
エンコーダ1100およびデコーダ1200は、様々なウェーブレット変換を使用して実装され得る。たとえば、変形5/3Daubechiesウェーブレット変換を使用することもできる。図17〜18に、変形5/3Daubechiesウェーブレット変換、および逆変形5/3Daubechiesウェーブレット変換にそれぞれ関連付けられた整数リフティング構成1700および1800を示す。
ここでも、図15について定義された記号によって、整数リフティング構成1700および1800を説明している。
対応するロー・パス解析フィルタの係数およびハイパス解析フィルタの係数は、以下の通りである。
L(5):−1/8,1/4,3/4,1/4,−1/8
H(3):−1/4,1/2,−1/4
ロー・パス合成フィルタの係数およびハイパス合成フィルタの係数は、以下の通りである。
L(3):1/4,1/2,1/4
H(5):−1/8,−1/4,3/4,−1/4,−1/8
別の例示的な実装では、7/5ウェーブレット変換が使用され得る。図19〜20に、7/5ウェーブレット変換、および逆7/5ウェーブレット変換にそれぞれ関連付けられた整数リフティング構成1900および2000を示す。ここでも、図15について定義された記号によって、整数リフティング構成1900および2000を説明している。
対応するロー・パス解析フィルタの係数およびハイパス解析フィルタの係数は、以下の通りである。
L (7):
0.0012745098039216
0.0024509803921569,
0.2487254901960785,
0.4950980392156863,
0.2487254901960785,
0.0024509803921569,
0.0012745098039216
L (5):
−0.1300000000000000,
−0.2500000000000000,
0.7600000000000000,
−0.2500000000000000,
−0.1300000000000000.
ロー・パス合成フィルタの係数およびハイパス合成フィルタの係数は、以下の通りである。
L (5):
−0.1300000000000000,
0.2500000000000000,
0.7600000000000000,
0.2500000000000000,
−0.1300000000000000
L (7):
−0.0012745098039216
0.0024509803921569,
−0.2487254901960785,
0.4950980392156863,
−0.2487254901960785,
0.0024509803921569,
−0.0012745098039216
図11は、本発明の色空間符号化フレームワークに従って動作する、エンコーダ1100のブロック図である。エンコーダ1100は、(ボックス1120内に一般的に表された)基本フォーマット・エンコーダ、(ボックス1140内に一般的に表された)拡張フォーマット・エンコーダ、および出力ビット・ストリーム形成器(output bit stream formulator)1160を含む。さらに、エンコーダ1100は、図8に示し、上述したクロマ分離器800を含むことができる。エンコーダ1100は、図7に示すようなコンピューティング装置であり、図12で示し後述する関連付けられたデコーダへの入力である所望のビット・ストリームを生成するような形で、基本フォーマット・エンコーダ、拡張フォーマット・エンコーダ、ビット・ストリーム形成器、およびオプションのクロマ分離器800の機能を、ハードウェア、ソフトウエアまたはハードウェア/ソフトウエアの任意の組合せで実装する。
概観すると、エンコーダ1100は、本発明の色空間符号化フレームワークに従って、2つのストリーム、基本ストリームおよび拡張ストリームを処理する。エンコーダ1100の1つの利点は、イントラおよびインター予測符号化モード(Intra and Inter prediction coding modes)とともに、追加の予測符号化モードの空間予測(SP:spatial prediction)を提供できることである。以下で詳述するように、エンコーダ1100は、同じフレームからの基本クロミナンス・ブロックを使用して、拡張クロミナンス・ブロックについての空間予測を提供する。拡張クロミナンス・ブロックと基本クロミナンス・ブロックの間の相関が高いので、この空間予測(SP)は、非常に効率のよい予測モードを提供することができる。
ある実施形態では、エンコーダ1100は、クロマ分離器800から生成された出力ストリームを受け付ける。別の実施形態では、クロマ分離器800は、エンコーダ1100内に含められる。どの実施形態でも、クロマ分離器800は、フォーマットAと称される第1符号化フォーマット1106で符号化された入力を受け付ける。第1符号化フォーマット1106の生成は、ビデオ符号化分野の当業者には知られている従来のやり方で実施される。状況によっては、第1符号化フォーマットの生成は、RGB色空間などの、別の色空間からフォーマットを変換することによって達成される。これが行われる場合、色空間変換器(CSC:color space converter)1104が使用される。色空間変換器1104は、他の色空間に関連付けられた入力1102(RGB入力など)を受け付ける。次いで、色空間変換器1104は、入力1102を、所望の第1符号化フォーマット1106に変換する。色空間変換器1104は、ある色空間から別の色空間に変換するために、任意の従来の機構を使用することができる。たとえば、RGB色空間とYUV色空間の間の変換であれば、色空間変換器1104は、3つの数式のセットによってまたは行列によってしばしば表される既知の変換を使用することができる。標準のうちの1つによって定義されるある既知の数式のセットは、以下の通りである。
Y=0.299xR+0.587xG+0.114xΒ
U=−0.299xR−0.587xG+0.886xΒ
V=0.701xR−0.587xG−0.114xΒ
この変換は、1組のYUV値が与えられると、1組のRGB値が取得され得るように、逆にすることもできる。色空間の変換が必要な場合、クロマ分離器800によって実施される処理は、色空間変換器1104内で実施される処理と組み合わせることができる。クロマ分離器800および色空間変換器1104は、エンコーダ1100の要素として含めることができる。あるいは、エンコーダ1100は、クロマ分離器800によって生成される出力を受け付けることができる。
図8に関連して上記で述べたように、クロマ分離器800は、基本フォーマット・ストリーム1108および少なくとも1つの拡張フォーマット・ストリーム1110を出力するように構成される。基本フォーマット・ストリーム1108は、基本エンコーダ1120を介して処理され、拡張フォーマット・ストリームは、拡張エンコーダ1140を介して処理される。
基本エンコーダ1120は、基本フォーマット・ストリーム1108用の任意の従来のエンコーダである。一般に、基本エンコーダ1120は、基本ビット・ストリーム(B−BS:base bit stream)として出力されるデータの量を最小限に抑えるように構成され、基本ビット・ストリームは、符号化されたビデオが再生され得るように、何らかの媒体を介して、通常、送信される。従来の基本エンコーダ1120は、離散コサイン変換(DCT)1122、量子化(Q)プロセス1124、可変長符号化(VLC:variable length coding)プロセス1126、逆量子化(Q−1:inverse quantization)プロセス1128、逆DCT(IDCT)1130、フレーム・バッファ1132、動き補償予測(MCP:motion compensated prediction)プロセス1134、および動き推定(ME:motion estimation)プロセス1136など、従来の要素を含む。基本エンコーダ1120の要素は、よく知られているが、本発明の色空間符号化フレームワークを理解する助けとなるように、その要素について、簡潔に説明する。
しかし、従来の基本エンコーダ1120について説明する前に、以下の議論を通して使用される用語について定義する。フレームは、画像を構成する複数のラインを指す。イントラ・フレーム(I−frame:Intraframe)は、1つのフレーム内からの情報だけを使用して符号化されるフレームを指す。インター・フレームは、予測フレーム(P−frame:Predicted frame)とも称され、複数のフレームからの情報を使用するフレームを指す。
基本エンコーダ1120は、基本フォーマット1108のフレームを受け付ける。フレームは、それ自体からの情報だけを使用して符号化される。したがって、そのフレームは、Iフレームと称される。このようにして、Iフレームは、IフレームをDCT係数に変換する離散コサイン変換(DCT)1122を通ってさらに進む。これらのDTC係数が、量子化プロセス1124内に入力されて、量子化されたDCT係数が形成される。次いで、量子化されたDCT係数が、可変長コーダ(VLC)1126内に入力されて、基本ビット・ストリーム(B−BS)の一部が生成される。量子化DCT係数は、また、逆量子化プロセス1128および逆DCT1130内に入力される。その結果は、Pフレームのための参照(reference)としての役目を果たすために、フレーム・バッファ1132内に格納される。
基本エンコーダ1120は、フレーム・バッファ1132に格納された結果に、動き推定(ME)プロセス1134を適用することによって、Pフレームを処理する。動き推定プロセス1134は、時間予測(TP:temporal prediction)を突き止めるように構成され、それは動き補償予測(MCP)1134と称される。MCP1134は、Iフレームと比較され、その差(すなわち残差)は、Iフレームと同じプロセスを通して進む。動きベクトル(MV:motion vector)の形における動き補償予測(MCP)1134は、可変長コーダ(VLC)1126に入力され、基本ビット・ストリーム(B−BS)の別の部分を生成する。最後に、逆量子化された差が、MCP1134に追加されて、復元されたフレームが形成される。フレーム・バッファは、復元されたフレームで更新され、次のPフレームのための参照(reference)としての役目を果たす。結果として生じる基本ビット・ストリーム(B−BS)は、基本ストリームBフォーマットを復号する、現在存在している装置で使用可能とされている従来のデコーダにとって、構文上は完全に互換性があるフォーマットであることに留意されたい。
拡張エンコーダ1140は、拡張ビット・ストリーム(E−BS:enhanced bit stream)として出力されるデータの量を最小限に抑えるように構成される。この拡張ビット・ストリームは一般に何らかの媒体を介して送信され、より高品質の符号化されたビデオを再生するために、任意選択で復号される。エンコーダ1100内に拡張エンコーダ1140を含むことは、以前には想定されていなかったが、拡張エンコーダ1140は、基本エンコーダについて述べたのと同じように動作する複数の従来要素を含む。この従来の要素は、離散コサイン変換(DCT)1142、量子化(Q)プロセス1144、可変長符号化(VLC)プロセス1146、逆量子化(Q−1)プロセス1148、逆DCT(IDCT)1150、フレーム・バッファ(frame buffer)1152、動き補償予測(MCP)プロセス1154を含む。拡張ストリームは、Y成分を収容する輝度ブロックを含まないので、動き推定プロセスは、拡張エンコーダ1140内に含まれないことに留意されよう。動きベクトル(MV)は、Y成分から導出される。しかし、本発明の色空間符号化フレームによれば、拡張エンコーダ1140は、Pフレームを選択的に予測する、モード選択スイッチ1158を含む。スイッチ1158は、フレーム・バッファ1152内に格納された、拡張ストリームから生成された前の参照(reference)から、Pフレームを予測することを選択することができ、または現在のフレームについてフレーム・バッファ1132内に格納された、基本ストリームからの参照(reference)を使用して、Pフレームを「空間的に」予測(SP)することを選択することができる。拡張ストリーム内の拡張クロミナンス・ブロック、と基本ストリーム内のクロミナンス・ブロックの間の相関が高いので、空間予測によって、非常に効率のよい予測モードがもたらされる。したがって、本発明の色空間符号化フレームによって、従来の符号化機構と比較して、予測符号化の効率が高まり、またパフォーマンスの向上がもたらされる。拡張エンコーダ1140の出力は、拡張ビット・ストリーム(E−BS)である。
基本エンコーダ1120および拡張エンコーダ1140内の従来の要素は、別個に示されているが、ある実施形態では、基本エンコーダ1120と拡張エンコーダ1140は、同じ従来要素のうちの1つまたは複数を共有することができる。たとえば、2つのDCT1122および1142を含むのではなく、1つのDCTが、基本エンコーダ1120と拡張エンコーダ1140の両方によって使用され得る。したがって、本発明の色空間符号化フレームワークよるエンコーダ1100の開発には、拡張ストリームに対処するためのハードウェア、ソフトウエア、または任意の組合せにおいて、最小限の追加の取り組みだけが必要である。さらに、基本エンコーダ1120用に開発された他の高度な符号化技術が、本発明の色空間符号化フレームワークに容易に適用されることが可能である。たとえば、本発明の色空間符号化フレームワークは、双方向に予測されたフレーム(B−frame:bi-directionally predicted frame)が存在する場合に、動作する。
出力ビット形成器1160は、拡張ビット・ストリーム(E−BS)を、基本ビット・ストリーム(B−BS)に結合して、最終の出力ビット・ストリームを形成する。最終の出力ビット・ストリームの例示的なフォーマットが、図13および14に示されており、それについて、それらの図に関連して説明する。
図12は、本発明の色空間符号化フレームワークを組み込むデコーダのブロック図である。概観すると、デコーダ1200は、一つのビット・ストリームの単純な切り捨て(simple bit stream truncation)を実施して、より低品質のビデオ・フォーマットを得ることができる。したがって、高価なトランスコード・プロセスは必要ない。一般に、デコーダ1200は、エンコーダ1100によって実施されるプロセスを逆に行う。デコーダ1200は、基本ビット・ストリーム(B−BS)および拡張ビット・ストリーム(E−BS)を受け付ける。基本ビット・ストリームおよび拡張ビット・ストリームは、デコーダ内に含まれるか、またはデコーダの外部にあるビット・ストリーム・パーサ(bit stream parser)1202によって構文解析されていることも可能である。デコーダ1200は、(ボックス1220内に一般的に表された)基本フォーマット・デコーダ、(ボックス1240内に一般的に表された)拡張フォーマット・デコーダを含む。基本デコーダ1220は、基本ビット・ストリームを処理し、拡張フォーマット・デコーダ1240は、拡張ビット・ストリームを処理する。さらに、デコーダ1200は、図9に示し上述した、クロマ複合器900を含むことができる。デコーダ1200は、図7に示すようなコンピューティング装置であり、所望のフォーマットA1260を生成するような形で、基本フォーマット・デコーダ、拡張フォーマット・デコーダ、およびオプションのクロマ複合器900の機能を、ハードウェア、ソフトウエアまたはハードウェア/ソフトウエアの任意の組合せで実装する。
概観すると、デコーダ1200は、本発明の色空間符号化フレームワークに従って生成された2つのストリーム、基本ビット・ストリーム(B−BS)および拡張ビット・ストリーム(E−BS)を処理する。デコーダ1200は、エンコーダ1100によって提供される予測符号化モード、空間予測(SP)を復号することができる。
ある実施形態では、デコーダ1200は、クロマ複合器900を含む。別の実施形態では、クロマ複合器900は、デコーダ1200とは別個の装置である。どの実施形態でも、クロマ複合器900は、基本フォーマットについての輝度ブロックおよびクロミナンス・ブロックの値、および拡張フォーマットについてのクロミナンス・ブロックの値を含む、2つのストリームを受け付け、それらをマージして、図9に関連して説明した、フォーマットA1260にする。状況によっては、フォーマットA1260は、RGB色空間などの別の色空間のフォーマットに変換される。これが行われる場合、色空間変換器(CSC)1262が使用される。色空間変換器1262は、入力として、フォーマットA1260を受け付け、入力1260を、他の色空間に関連する出力1264(RGB出力など)に変換する。色空間変換器1262は、ある色空間から別の色空間に変換するための任意の従来機構を使用し得る。たとえば、RGB色空間とYUV色空間の間で変換する場合、色空間変換器1262は、上述したように、周知の変換を適用し得る。色空間変換が必要な場合、クロマ複合器900によって実施される処理は、色空間コンバータ1262で実施される処理と組み合わせることができる。クロマ複合器900および色空間コンバータ1262は、デコーダ1200内の要素として含めることができる。あるいは、デコーダ1200は、外部のクロマ複合器900に、入力を供給することもできる。
基本デコーダ1220は、基本ビット・ストリーム(B−BS)用の任意の従来のデコーダである。一般に、基本デコーダ1220は、基本エンコーダ1120によって符号化されたYUV値を復元する。従来の基本デコーダ1220は、可変長復号(VLD:variable length decoding)プロセス1222、逆量子化(Q−1)プロセス1224、逆離散コサイン変換(IDCT)1226、フレーム・バッファ1228、動き補償予測(MCP)プロセス1230などの従来の要素を含む。この場合も、基本デコーダ1220の要素は、よく知られている。したがって、本発明の色空間符号化フレームワークを理解する助けとするために、その要素について簡潔に説明する。
基本デコーダ1220は、可変長復号(VLD)1222内に、基本ビット・ストリームを入力して、動きベクトル(MV)および量子化されたDCT係数を取り出す。量子化されたDCT係数は、逆量子化プロセス1224および逆DCT1226に入力されて、差分データが形成される。差分データは、その動き補償予測1230に加えられて、クロマ複合器900に入力される復元された基本ストリームが形成される。またその結果は、Pフレームの復号のための参照(reference)としての役目を果たすように、フレーム・バッファ1228内に格納される。
拡張デコーダ1240は、拡張エンコーダ1140によって符号化されたUV値を復元する。デコーダ1200内に拡張デコーダ1240を含むことは以前には想定されていなかったが、拡張デコーダ1240は、基本デコーダ1220について上述したのと同じように動作する複数の従来要素を含む。拡張デコーダ1240は、可変長復号(VLD)プロセス1242、逆量子化(Q−1)プロセス1244、逆離散コサイン変換(IDCT)1246、フレーム・バッファ1248および動き補償予測(MCP)プロセス1250などの従来の要素を含む。
モード情報スイッチ1252による判断に応じて、差分データが選択的に、その動き補償予測(MCP)に加えられることも、その空間予測(SP)に加えられることもあることを除けば、拡張デコーダ1240を通る拡張ビット・ストリームの流れは、基本デコーダ1220と同一である。拡張デコーダ1240の結果は、現在のフレームについての「余分の」クロミナンス・ブロックの値を含む、再現された拡張ストリームである。
次いで、フォーマットAを再現するために、基本ストリームおよび拡張ストリームは、上述したようにストリームを処理する、クロマ複合器に入力される。基本デコーダ1220および拡張デコーダ1240内の従来の要素は、別個に示されているが、ある実施形態では、基本デコーダ1220と拡張デコーダ1240は、同じ従来の要素のうちの1つまたは複数を共有することができる。たとえば、2つの逆DCT1226および1246を含むのではなく、1つの逆DCTが、基本デコーダ1220と拡張デコーダ1240の両方によって使用されるようにすることができる。したがって、本発明の色空間符号化フレームワークよるデコーダの開発には、拡張ストリームに対処するためのハードウェア、ソフトウエア、または任意の組合せにおいて、最小限の追加の取り組みだけが必要である。さらに、基本デコーダ1420用に開発された他の高度な復号技術が、本発明の色空間符号化フレームワークに容易に適用されることが可能である。たとえば、本発明の色空間符号化フレームワークは、双方向に予測されたフレーム(B−frame:bi-directionally predicted frame)が存在する場合に、動作する。
したがって、本発明の色空間符号化フレームワークを使用した符号化フォーマットによって、2つのフォーマット間の変換を、高価なトランスコード・プロセスではなく、ビットの切り捨て(bit truncation)によって実現することができる。したがって、フォーマットについて実施され、あるフォーマットから別のフォーマットに変換するトランスコード・プロセスは、存在しない。
例示的なビット・ストリーム
図11に示す出力ビット・ストリーム形成プロセス1160は、複数のやり方で、結果として生じる基本ビット・ストリーム(B−BS)および拡張ビット・ストリーム(E−BS)を構成することができることが想定される。図13および14に、2つの例示的なビット・ストリームを示す。便宜上、例示的なビット・ストリームでは、拡張ビット・ストリームとの関連で、基本ビット・ストリームの構成を示し、またパケット識別子、シーケンス番号など、トランスポート・ストリーム・パケット(transport stream packet)内に一般的に含まれる他の情報を省略してある。さらに、例示的なビット・ストリームは、ビット・ストリームがフォーマットAおよびフォーマットBをサポートすることを示す表示子(indicator)を含むことができる。
図13は、図11および12に示す複数のビット・ストリームを送信するための、例示的なビット・ストリーム1300の図である。概観すると、ビット・ストリーム1300は、基本ビット・ストリーム(B−BS)内に、拡張ビット・ストリーム(E−BS)を埋め込んでいる。したがって、ビット・ストリーム1300は、B−BS情報1302、1304および1306を、E−BS情報1312、1314および1316と交互に含んでいる。実際に、基本ビット・ストリームがYUV420フォーマットに対応し、拡張ビット・ストリームがYUV422フォーマットのクロミナンス・ブロックを含む場合、ビット・ストリーム1300は、YUV422デコーダが、すべてのフレームを順次、復号することを可能にする。しかし、ビット・ストリーム1300を復号するYUV420デコーダは、E−BSフレームをスキップしなければならない。ビット・ストリーム1300は、ストリーミング/ブロードキャスティングのアプリケーションに適している。
図14は、図11および12に示す複数のビット・ストリームを送信するための、別の例示的なビット・ストリーム1400の図である。概観すると、ビット・ストリーム1400は、拡張ビット・ストリーミングを、基本ビット・ストリームの末尾に連結している。したがって、ビット・ストリーム1400は、基本ビット・ストリームの連続するフレーム(フレーム1402、1404、1406など)と、それに続いて、拡張ビット・ストリームの連続するフレーム(フレーム1412、1414、1416など)を含む。実際に、基本ビット・ストリームがYUV420フォーマットに対応し、拡張ビット・ストリームがYUV422フォーマットのクロミナンス・ブロックを含む場合、ビット・ストリーム1400では、YUV420デコーダは、拡張ビットに遭遇せずに、すべてのフレームを順次、復号することができる。YUV420デコーダは、すべての基本ビット・ストリーム(フレーム1402、1404、1406など)が復号された後に、復号プロセスを終了することができる。しかし、YUV422デコーダは、次のフレームに進む前に、基本ビット・ストリームおよび拡張ビット・ストリームを探し出し、復号しなければならない。YUV422デコーダは、基本ビット・ストリームおよび拡張ビット・ストリームに順次アクセスするための2つのポインタを使用することができる。ビット・ストリーム1400は、ダウン・アンド・プレイ(down-and-play)アプリケーションに適している。
ビット・ストリーム1400は、異なる別個のファイルに分けることもできる。この実施形態では、基本ビット・ストリームは、独立したストリームであり、YUV420デコーダによって完全に復号可能であり、既存のYUV420デコーダのどんな修正をも必要としない。YUV422デコーダは、2つのビット・ストリーム・ファイルを同時に処理する。ビット・ストリーム1400は、デジタル・ビデオ・カムコーダなどのビデオ記録装置内に、都合良く実装することができる。ビット・ストリーム1400によって、高品質と低品質の両方のストリームを記録することができる。消費者が、追加の記録(additional recoding)をしたいけれども現在のメディアが使い果たしてしまったことに気付いたる場合、デジタル・ビデオ・カムコーダ上のオプションは、消費者が、都合よく、高品質のストリームを削除して低品質のストリームを保持することを可能に、その結果、追加の記録を再開することができるようになる。
上記の説明では、添付の特許請求の範囲中に列挙される要素を組み込む、色空間符号化フレームワークの特定の実施形態について述べている。法的な要件を満たすために、実施形態について、具体的に述べている。しかし、説明自体は、本特許の範囲を限定するものではなく、本発明人は、特許請求の範囲に記載されている発明が、他の現在または未来の技術に関連して、別の要素、またはこの文書で述べた要素に類似の要素の組合せを含むように、他のやり方で実施され得ることも企図している。
YUV色空間から導出された符号化フォーマットの図である。 YUV色空間から導出された符号化フォーマットの図である。 YUV色空間から導出された符号化フォーマットの図である。 YUV色空間から導出された符号化フォーマットの図である。 YUV色空間から導出された符号化フォーマットの図である。 2つの異なるビデオ・フォーマットの間で変換するためのトランスコーダのブロック図である。 例示的な本発明の符号化フレームワークを使用し得る、例示的なコンピューティング装置の図である。 例示的な色空間符号化フレームワークに従って、第1のビデオ符号化フォーマットを複数のストリームに分離するためのクロマ分離器の図である。 例示的な色空間符号化フレームワークに従って、複数のストリームをマージして、第1ビデオ符号化フォーマットにするためのクロマ複合器の図である。 第1ビデオ符号化フォーマット、ならびに図8に示すクロマ分離器によって、クロミナンス・ブロックが第1ビデオ符号化フォーマットから分離された後の複数のストリームを示す図である。 本発明の色空間符号化フレームワークを組み込む、エンコーダのブロック図である。 本発明の色空間符号化フレームワークを組み込む、デコーダのブロック図である。 図11および12に示す複数のビット・ストリームを送信するための例示的なビット・ストリームの図である。 図11および12に示す複数のビット・ストリームを送信するための別の例示的なビット・ストリームの図である。 図8および9に関連して使用するのに適した、例示的な整数リフティング構成を示す図である。 図8および9に関連して使用するのに適した、例示的な整数リフティング構成を示す図である。 図8および9に関連して使用するのに適した、例示的な整数リフティング構成を示す図である。 図8および9に関連して使用するのに適した、例示的な整数リフティング構成を示す図である。 図8および9に関連して使用するのに適した、例示的な整数リフティング構成を示す図である。 図8および9に関連して使用するのに適した、例示的な整数リフティング構成を示す図である。
符号の説明
P ピクセル
MB マクロ・ブロック
100 YUV444フォーマットの配列
200 YUV422フォーマットの配列
300 YUV420フォーマットの配列
400 YUV411フォーマットの配列
500 YUV410フォーマットの配列
600 トランスコーダ
700 コンピューティング装置
702 処理装置
704 システム・メモリ
705 オペレーティング・システム
706 プログラム・モジュール
707 プログラム・データ
709 取外し可能記憶装置
710 取外し不可能記憶装置
712 入力装置
714 出力装置
716 通信接続
718 他のコンピューティング装置
800 クロマ・セパレータ
804 ロー・パス・フィルタ
806 ハイ・パス・フィルタ
808 ダウン・サンプラー
810 ダウン・サンプラー
900 クロマ複合器
904 アップ・サンプラー
906 アップ・サンプラー
908 合成フィルタ
910 合成フィルタ
912 合成器
1000 配列
1100 エンコーダ
1102 RGB入力
1106 フォーマットA
1108 フォーマットB
1110 拡張A
1120 基本フォーマット・エンコーダ
1122 離散コサイン変換(DCT)
1124 量子化(Q)プロセス
1126 可変長符号化(VLC:variable length coding)プロセス
1128 逆量子化(Q−1:inverse quantization)プロセス
1130 逆DCT(IDCT)
1132 フレーム・バッファ
1134 動き補償予測(MCP:motion compensated prediction)プロセス
1136 動き推定(ME:motion estimation)プロセス
1140 拡張フォーマット・エンコーダ
1142 離散コサイン変換(DCT)
1144 量子化(Q)プロセス
1146 可変長符号化(VLC)プロセス
1148 逆量子化(Q−1)プロセス
1150 逆DCT(IDCT)
1152 フレーム・バッファ
1154 動き補償予測(MCP)プロセス
1158 モード選択スイッチ
1160 出力ビット・ストリーム形成器
SP 空間予測
TP 時間予測
MV 動きベクトル
1200 デコーダ
1202 入力ビット・ストリーム・パーサ
1220 基本フォーマット・デコーダ
1222 拡張フォーマット・デコーダ
1224 逆量子化(Q−1)プロセス
1226 逆離散コサイン変換(IDCT)
1228 フレーム・バッファ
1230 動き補償予測(MCP)プロセス
1242 可変長復号(VLD)プロセス
1244 逆量子化(Q−1)プロセス
1246 逆離散コサイン変換(IDCT)
1248 フレーム・バッファ
1250 動き補償予測(MCP)プロセス
1252 モード情報スイッチ
1260 フォーマットA
1262 色空間変換器(CSC)
1264 RGB出力
1300 ビット・ストリーム
1302 フレーム1−BBS情報
1304 フレーム2−BBS情報
1306 フレームN−BBS情報
1312、1314、1316 E−BS情報
1400 ビット・ストリーム
1402 フレーム1−BBS情報
1404 フレーム2−BBS情報
1406 フレームN−BBS情報
1412、1414、1416 拡張ビット・ストリームの連続するフレーム
1500 標準の9/7Daubechiesウェーブレット変換に関連付けられた、フォーマットAのピクセルからフォーマットBのピクセルへの例示的な、整数リフティング構成
1600 逆変形9/7Daubechiesウェーブレット変換に関連付けられた、対応する整数リフティング構成
1700 変形5/3Daubechiesウェーブレット変換に関連付けられた、フォーマットAのピクセルからフォーマットBのピクセルへの例示的な、整数リフティング構成1700
1800 逆変形5/3Daubechiesウェーブレット変換にそれぞれ関連付けられた整数リフティング構成
1900 変形7/5Daubechiesウェーブレット変換に関連付けられた、フォーマットAのピクセルからフォーマットBのピクセルへの例示的な、整数リフティング構成1700
2000 逆変形7/5Daubechiesウェーブレット変換にそれぞれ関連付けられた整数リフティング構成

Claims (34)

  1. 所定の数のビットを含む第1の色空間サンプリング・フォーマットに従ってフォーマットされた色情報を含むビデオ情報ストリームを受信すること、
    前記色情報を、前記所定の数のビットより少ないビットを含む第2の色空間サンプリング・フォーマットに従ってフォーマットされた基本情報ストリームと、拡張情報ストリームとに分割すること、および
    前記第1色空間サンプリング・フォーマットおよび前記第2色空間サンプリング・フォーマットに従ってビデオ情報を提供できることを示す表示子を、前記基本情報ストリームおよび前記拡張情報ストリームのうちの少なくとも1つと共に提供すること
    を備えることを特徴とする方法。
  2. 前記基本情報ストリームに関連する空間情報を使用して、前記拡張情報ストリームを符号化することをさらに備えることを特徴とする請求項1に記載の方法。
  3. 前記拡張情報ストリームを、前記基本情報ストリームに関連する空間情報を使用して、または前記拡張情報ストリームに関する以前の参照を使用して、選択的に符号化することをさらに備えることを特徴とする請求項1に記載の方法。
  4. 前記基本情報ストリームを、基本符号化ビット・ストリームに符号化し、前記拡張情報ストリームを、拡張符号化ビット・ストリームに符号化し、また前記基本符号化ビット・ストリームと前記拡張符号化ビット・ストリームを組み合わせて、出力ビット・ストリームにすることをさらに備えることを特徴とする請求項1に記載の方法。
  5. 前記出力ビット・ストリームは、前記拡張符号化ビット・ストリームおよび前記基本符号化ビット・ストリームからなるインタリーブされたストリームを備えることを特徴とする請求項4に記載の方法。
  6. 前記出力ビット・ストリームは、前記拡張符号化ビット・ストリームおよび前記基本符号化ビット・ストリームからなる連結されたストリームを備えることを特徴とする請求項4に記載の方法。
  7. 前記拡張符号化ビット・ストリームは、前記基本符号化ビット・ストリームの後に続くことを特徴とする請求項6に記載の方法。
  8. 前記出力ビット・ストリームは、前記拡張符号化ビット・ストリームのための第1のファイルと、前記基本符号化ビット・ストリームのための第2のファイルとを備えることとを特徴とする請求項4に記載の方法。
  9. 前記色情報は、クロミナンス・ブロックを含むことを特徴とする請求項1に記載の方法。
  10. 前記第1色空間サンプリング・フォーマットは、YUV422フォーマットを備え、前記第2色空間サンプリング・フォーマットは、YUV420フォーマットを備えることを特徴とする請求項1に記載の方法。
  11. コンピュータ実行可能命令を備えるコンピュータ可読媒体であって、
    前記命令は、第1のマルチメディア・フォーマットを基本ストリームと拡張ストリームとに変換することを備え、
    前記基本ストリームは、別のマルチメディア・フォーマットに対応し、前記拡張ストリームは、前記基本ストリームと組み合わせられたときに、前記第1マルチメディア・フォーマットを復元する情報を含む
    ことを特徴とするコンピュータ可読媒体。
  12. 前記マルチメディア・フォーマットは、符号化ビデオ・フォーマットを備えることを特徴とする請求項11に記載のコンピュータ可読媒体。
  13. 前記第1マルチメディア・フォーマットを、前記基本ストリームおよび前記拡張ストリームに変換することは、前記別のマルチメディア・フォーマットに関連するクロミナンス・ブロックを前記基本ストリーム内に、また前記別のマルチメディア・フォーマットに関連しないクロミナンス・ブロックを前記拡張ストリーム内に格納することを特徴とする請求項11に記載のコンピュータ可読媒体。
  14. 前記基本ストリームを、基本符号化ビット・ストリームに符号化し、前記拡張ストリームを、拡張符号化ビット・ストリームに符号化し、また前記基本符号化ビット・ストリームと前記拡張符号化ビット・ストリームを組み合わせて、出力ビット・ストリームにすることをさらに備えることを特徴とする請求項11に記載のコンピュータ可読媒体。
  15. 前記出力ビット・ストリームは、前記拡張符号化ビット・ストリームおよび前記基本符号化ビット・ストリームからなる、インタリーブされたストリームを備えることを特徴とする請求項14に記載のコンピュータ可読媒体。
  16. 前記出力ビット・ストリームは、前記拡張符号化ビット・ストリームとおよび前記基本符号化ビット・ストリームからなる、連結されたストリームを備えることを特徴とする請求項14に記載のコンピュータ可読媒体。
  17. 前記拡張符号化ビット・ストリームは、前記基本符号化ビット・ストリームの後に続くことを特徴とする請求項16に記載のコンピュータ可読媒体。
  18. 前記出力ビット・ストリームは、前記拡張符号化ビット・ストリームのための第1のファイルと、前記基本符号化ビット・ストリームのための第2のファイルとを備えることを特徴とする請求項14に記載のコンピュータ可読媒体。
  19. 第1の色空間サンプリング・フォーマットに従ってフォーマットされた基本情報ストリームを符号化基本エンコーダと、
    前記第1色空間サンプリング・フォーマットでは得られない色空間情報を備える拡張情報ストリームを符号化拡張エンコーダと
    を備えることを特徴とする装置。
  20. 前記拡張エンコーダは、基本情報ストリームに関連する空間情報を使用して、前記拡張情報を符号化することを特徴とする請求項19に記載の装置。
  21. 前記符号化された拡張情報ストリームと前記符号化された基本情報ストリームとを組み合わせて出力ストリームにする出力ストリーム形成器をさらに備えることを特徴とする請求項19に記載の装置。
  22. 前記出力ストリームは、前記符号化された基本情報ストリームとインタリーブされた、前記符号化された拡張情報ストリームを備えることを特徴とする請求項21に記載の装置。
  23. 前記出力ストリームは、前記符号化された基本情報ストリームに連結された、前記符号化された拡張情報ストリームを備えることを特徴とする請求項21に記載の装置。
  24. 前記出力ストリームは、前記符号化された拡張情報ストリームを備える第1のファイルと、前記符号化された基本ストリームを含む第2のファイルとを備えることを特徴とする請求項21に記載の装置。
  25. 前記装置は、デジタル・ビデオ・カメラを備えることを特徴とする請求項24に記載の装置。
  26. 第1の色空間サンプリング・フォーマットに関連する、符号化された基本ビット・ストリームを復号基本デコーダと、
    前記第1色空間サンプリング・フォーマットで得られない色空間情報を含む、符号化された拡張ビット・ストリームを復号拡張デコーダと
    を備えることを特徴とする装置。
  27. 前記拡張デコーダは、前記符号化された基本ビット・ストリームに関連する空間情報を使用して、前記符号化された拡張ビット・ストリームを復号することを特徴とする請求項26に記載の装置。
  28. 前記符号化された拡張ビット・ストリームおよび前記符号化された基本ビット・ストリームから、第2の色空間サンプリング・フォーマットを生成する複合器をさらに備えることを特徴とする請求項26に記載の装置。
  29. 前記装置は、セットトップボックスを備えることを特徴とする請求項26に記載の装置。
  30. ビデオ情報を受信入力と、
    色空間サンプリング・フォーマットに従って前記ビデオ情報の一部をフォーマットし、別のフォーマットに従って前記ビデオ情報の別の部分をフォーマット回路と、
    前記ビデオ情報の前記一部、および前記ビデオ情報の前記別の部分を格納回路と
    を備えることを特徴とする装置。
  31. 前記フォーマットのための回路は、プロブラマブルな回路を備えることを特徴とする請求項30に記載の装置。
  32. 前記格納のための回路は、プロブラマブルな回路を備えることを特徴とする請求項30に記載の装置。
  33. 前記入力は、センサを備えることを特徴とする請求項30に記載の装置。
  34. 前記入力は、少なくとも1つのCCDアレイを備えることを特徴とする請求項30に記載の装置。
JP2004358958A 2003-12-10 2004-12-10 色空間の符号化フレームワーク Pending JP2005176383A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/733,876 US20050129130A1 (en) 2003-12-10 2003-12-10 Color space coding framework

Publications (1)

Publication Number Publication Date
JP2005176383A true JP2005176383A (ja) 2005-06-30

Family

ID=34523073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004358958A Pending JP2005176383A (ja) 2003-12-10 2004-12-10 色空間の符号化フレームワーク

Country Status (10)

Country Link
US (1) US20050129130A1 (ja)
EP (1) EP1542476A3 (ja)
JP (1) JP2005176383A (ja)
KR (1) KR20050056857A (ja)
CN (1) CN1627830A (ja)
AU (1) AU2004229092A1 (ja)
BR (1) BRPI0404879A (ja)
CA (1) CA2486612A1 (ja)
MX (1) MXPA04011273A (ja)
RU (1) RU2004132772A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010531609A (ja) * 2007-06-27 2010-09-24 サムスン エレクトロニクス カンパニー リミテッド 映像データ符号化及び/または復号化の方法、記録媒体、及び装置
WO2013187334A1 (ja) * 2012-06-14 2013-12-19 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
JP2016500965A (ja) * 2012-10-22 2016-01-14 マイクロソフト テクノロジー ライセンシング,エルエルシー 高解像度クロマ・サンプリング・フォーマットのフレーム・パッキング/アンパッキングのための帯域分離フィルタリング/逆フィルタリング
DE112013000698B4 (de) * 2012-03-06 2016-03-03 International Business Machines Corporation Verfahren und Vorrichtung zur Bildsignalverarbeitung
US9979960B2 (en) 2012-10-01 2018-05-22 Microsoft Technology Licensing, Llc Frame packing and unpacking between frames of chroma sampling formats with different chroma resolutions
US10368080B2 (en) 2016-10-21 2019-07-30 Microsoft Technology Licensing, Llc Selective upsampling or refresh of chroma sample values

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1743298B1 (en) * 2004-04-27 2013-04-17 Callahan Cellular L.L.C. Method of down-sampling data values
JP4277793B2 (ja) * 2004-12-17 2009-06-10 ソニー株式会社 画像処理装置、符号化装置およびそれらの方法
JP4215014B2 (ja) * 2005-03-17 2009-01-28 ソニー株式会社 画像処理装置および画像処理プログラム
CN101248678B (zh) * 2005-08-26 2010-08-11 松下电器产业株式会社 多路复用方法及记录介质
CN1859576A (zh) * 2005-10-11 2006-11-08 华为技术有限公司 对空间分层编码视频图象的上采样方法及其系统
CA2636716C (en) * 2006-01-13 2014-12-23 Surmodics, Inc. Microparticle containing matrices for drug delivery
WO2007079781A1 (en) * 2006-01-13 2007-07-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Picture coding using adaptive colour space transformation
WO2007107170A1 (en) * 2006-03-22 2007-09-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding scheme enabling precision-scalability
CN101601305B (zh) 2006-10-20 2013-01-23 诺基亚公司 用于可伸缩多媒体的自适应路径的通用指示
KR101365597B1 (ko) 2007-10-24 2014-02-20 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
US8401071B2 (en) * 2007-12-19 2013-03-19 Sony Corporation Virtually lossless video data compression
PT3373582T (pt) 2010-12-21 2020-02-14 Ntt Docomo Inc Codificação melhorada de predição-intra utilizando representações planares
US8891894B2 (en) * 2011-09-30 2014-11-18 Apple Inc. Psychovisual image compression
CN102724472B (zh) * 2012-06-20 2015-07-08 杭州海康威视数字技术股份有限公司 用于图像处理的图像数据格式转换方法及其系统
EP2919471A4 (en) * 2012-11-12 2016-07-13 Lg Electronics Inc SIGNAL TRANSMITTING APPARATUS AND SIGNAL TRANSMITTING-RECEIVING METHOD
US8817179B2 (en) 2013-01-08 2014-08-26 Microsoft Corporation Chroma frame conversion for the video codec
US20140267919A1 (en) * 2013-03-15 2014-09-18 Quanta Computer, Inc. Modifying a digital video signal to mask biological information
US9609336B2 (en) * 2013-04-16 2017-03-28 Fastvdo Llc Adaptive coding, transmission and efficient display of multimedia (acted)
US20150124873A1 (en) * 2013-11-01 2015-05-07 Microsoft Corporation Chroma Down-Conversion and Up-Conversion Processing
US9749646B2 (en) 2015-01-16 2017-08-29 Microsoft Technology Licensing, Llc Encoding/decoding of high chroma resolution details
US9854201B2 (en) 2015-01-16 2017-12-26 Microsoft Technology Licensing, Llc Dynamically updating quality to higher chroma sampling rate
JP2017060004A (ja) * 2015-09-16 2017-03-23 株式会社東芝 エンコード装置、デコード装置、エンコードプログラム、デコードプログラム及びストリーミングシステム
CN107483942B (zh) * 2016-06-08 2023-07-14 同济大学 视频数据压缩码流的解码、视频数据的编码方法及装置
US10861405B2 (en) * 2018-07-09 2020-12-08 Samsung Display Co., Ltd. Color transform for RGBG subpixel format
CN112995664B (zh) * 2021-04-20 2021-08-13 南京美乐威电子科技有限公司 图像采样格式转换方法、计算机可读存储介质和编码器
CN117528098B (zh) * 2024-01-08 2024-03-26 北京小鸟科技股份有限公司 基于深压缩码流提升画质的编解码系统、方法及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11127138A (ja) * 1997-10-24 1999-05-11 Sony Corp 誤り訂正符号化方法及びその装置並びにデータ伝送方法
JP2003524904A (ja) * 1998-01-16 2003-08-19 サーノフ コーポレイション 階層mpegエンコーダ

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0134871B1 (ko) * 1992-07-17 1998-04-22 사또오 후미오 고능률 부호화 복호화 시스템
JP3381855B2 (ja) * 1992-12-28 2003-03-04 ソニー株式会社 画像信号符号化方法および画像信号符号化装置、並びに画像信号復号化方法および画像信号復号化装置
US6571016B1 (en) * 1997-05-05 2003-05-27 Microsoft Corporation Intra compression of pixel blocks using predicted mean
US6233017B1 (en) * 1996-09-16 2001-05-15 Microsoft Corporation Multimedia compression system with adaptive block sizes
US6639945B2 (en) * 1997-03-14 2003-10-28 Microsoft Corporation Method and apparatus for implementing motion detection in video compression
US6728775B1 (en) * 1997-03-17 2004-04-27 Microsoft Corporation Multiple multicasting of multimedia streams
US6091777A (en) * 1997-09-18 2000-07-18 Cubic Video Technologies, Inc. Continuously adaptive digital video compression system and method for a web streamer
US6340994B1 (en) * 1998-08-12 2002-01-22 Pixonics, Llc System and method for using temporal gamma and reverse super-resolution to process images for use in digital display systems
US6954214B2 (en) * 2000-10-30 2005-10-11 Microsoft Corporation Efficient perceptual/physical color space conversion
JP3762655B2 (ja) * 2001-04-06 2006-04-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報埋め込み装置、検出装置、データ処理方法、プログラム及び記憶媒体
US6803922B2 (en) * 2002-02-14 2004-10-12 International Business Machines Corporation Pixel formatter for two-dimensional graphics engine of set-top box system
US7116831B2 (en) * 2002-04-10 2006-10-03 Microsoft Corporation Chrominance motion vector rounding
US7136417B2 (en) * 2002-07-15 2006-11-14 Scientific-Atlanta, Inc. Chroma conversion optimization

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11127138A (ja) * 1997-10-24 1999-05-11 Sony Corp 誤り訂正符号化方法及びその装置並びにデータ伝送方法
JP2003524904A (ja) * 1998-01-16 2003-08-19 サーノフ コーポレイション 階層mpegエンコーダ

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010531609A (ja) * 2007-06-27 2010-09-24 サムスン エレクトロニクス カンパニー リミテッド 映像データ符号化及び/または復号化の方法、記録媒体、及び装置
DE112013000698B4 (de) * 2012-03-06 2016-03-03 International Business Machines Corporation Verfahren und Vorrichtung zur Bildsignalverarbeitung
WO2013187334A1 (ja) * 2012-06-14 2013-12-19 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
JP2013258651A (ja) * 2012-06-14 2013-12-26 Kddi Corp 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
GB2518088A (en) * 2012-06-14 2015-03-11 Kddi Corp Video encoding device, video decoding device, video encoding method, video decoding method, and program
US9979960B2 (en) 2012-10-01 2018-05-22 Microsoft Technology Licensing, Llc Frame packing and unpacking between frames of chroma sampling formats with different chroma resolutions
JP2016500965A (ja) * 2012-10-22 2016-01-14 マイクロソフト テクノロジー ライセンシング,エルエルシー 高解像度クロマ・サンプリング・フォーマットのフレーム・パッキング/アンパッキングのための帯域分離フィルタリング/逆フィルタリング
US10368080B2 (en) 2016-10-21 2019-07-30 Microsoft Technology Licensing, Llc Selective upsampling or refresh of chroma sample values

Also Published As

Publication number Publication date
US20050129130A1 (en) 2005-06-16
MXPA04011273A (es) 2005-08-16
BRPI0404879A (pt) 2005-08-30
CN1627830A (zh) 2005-06-15
KR20050056857A (ko) 2005-06-16
EP1542476A3 (en) 2008-02-20
CA2486612A1 (en) 2005-06-10
RU2004132772A (ru) 2006-04-27
AU2004229092A1 (en) 2005-06-30
EP1542476A2 (en) 2005-06-15

Similar Documents

Publication Publication Date Title
JP2005176383A (ja) 色空間の符号化フレームワーク
EP2123057B1 (en) Signaling and use of chroma sample positioning information
US8532187B2 (en) Method and apparatus for scalably encoding/decoding video signal
US20070160126A1 (en) System and method for improved scalability support in mpeg-2 systems
US20090003435A1 (en) Method, medium, and apparatus for encoding and/or decoding video data
US20030007567A1 (en) Method and apparatus for real-time editing of plural content streams
US6665343B1 (en) Methods and arrangements for a converting a high definition image to a lower definition image using wavelet transforms
US20020037053A1 (en) Video decoder with down conversion function and method for decoding video signal
WO2009073077A1 (en) An extension to the avc standard to support the encoding and storage of high resolution digital still pictures in parallel with video
JP2010263657A (ja) 複数記述符号化のための装置及び方法
JP2009302638A (ja) 情報処理装置および方法
KR101285168B1 (ko) 비디오 트랜스코딩을 위한 변환 도메인 서브-샘플링 방법및 장치
KR100323676B1 (ko) 디지털 동영상 수신 장치
US8873619B1 (en) Codec encoder and decoder for video information
US6868124B2 (en) Method and systems for compressing a video stream with minimal loss after subsampled decoding
JP4193252B2 (ja) 信号処理装置及び方法、信号復号装置、並びに信号符号化装置
KR0171749B1 (ko) 호환 부호기
JP4462071B2 (ja) スケーラブルトランスコード方法及び装置及びプログラム
FI116350B (fi) Menetelmä, laite ja tietokoneohjelma siirtovälineellä digitaalisen kuvan koodaamiseen
JPH10336650A (ja) ディジタル信号の周波数逓降変換装置及びディジタル信号の周波数逓降変換方法
JP2002077912A (ja) 画像符号化装置
JP2000092492A (ja) アップサンプリング装置およびアップサンプリング方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110426