JP2009510938A - H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法 - Google Patents

H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法 Download PDF

Info

Publication number
JP2009510938A
JP2009510938A JP2008533642A JP2008533642A JP2009510938A JP 2009510938 A JP2009510938 A JP 2009510938A JP 2008533642 A JP2008533642 A JP 2008533642A JP 2008533642 A JP2008533642 A JP 2008533642A JP 2009510938 A JP2009510938 A JP 2009510938A
Authority
JP
Japan
Prior art keywords
multimedia
samples
transform coefficients
restored
multimedia data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008533642A
Other languages
English (en)
Inventor
チェン、ペイソン
オグズ、セイフラー・ハリト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009510938A publication Critical patent/JP2009510938A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

変換符号化データの効率的部分復号化を可能にするマルチメディアデータ処理方法及び装置を説明する。復号化装置は、マルチメディアデータに関連する変換係数を受信する。復号化装置は、復元の対象となる1セットのマルチメディアサンプルを決定する。復元の対象となる1セットのサンプルは一態様において、変換済みマルチメディアサンプルの行列のサブセットである。復号化装置は、マルチメディアサンプルの復元に使用する1セットの変換係数を決定する。一態様においては、変換係数の生成に使われた符号化方法に関連する部分基底画像が変換係数を用いてスケーリングされ、復元マルチメディアサンプルがもたらされる。

Description

[関係出願の相互参照]
35 U.S.C. §119に基づく優先権の主張
本特許出願は、これの指定代理人へ指定され、ここでの参照によりここに明示的に援用される、2005年9月27日に提出された仮出願第60/721,377号、表題「ERROR CONCEALMENT(エラー隠蔽)」に対し優先権を主張する。
[発明の分野]
本発明は、マルチメディア信号処理を、より具体的には映像符号化及び復号化を、対象とする。
[関連する技術の説明]
映像符号器等のマルチメディア信号処理システムは、MPEG−x規格やH.26x規格等の国際規格に基づく符号化法を用いてマルチメディアデータを符号化できる。かかる符号化法は一般的に、マルチメディアデータを伝送及び/または格納のため圧縮するものである。圧縮とは広義に、データから冗長性を取り除くプロセスである。
映像信号は一連の画像として説明でき、これはフレーム(全体画像)またはフィールド(インタレース映像信号は奇数または偶数の交互の画像ラインのフィールドを備える)を含む。ここで用いる用語「フレーム」は画像、フレーム、またはフィールドを指す。映像符号化法は、無損失または有損失圧縮アルゴリズムを用いて各フレームを圧縮することによって映像信号を圧縮する。フレーム内符号化(ここでイントラ符号化と呼ぶ)は、フレームを、そのフレームを用いて、符号化することを指す。フレーム間符号化(ここでインター符号化と呼ぶ)は、フレームを、他の「基準」フレームに基づき、符号化することを指す。例えば、映像信号はしばしば空間的冗長性を呈し、同一フレームの中で互いに近い映像フレームサンプル部分は少なくとも、互いに一致するか少なくともほぼ一致する、部分を有する。
映像符号器等のマルチメディアプロセッサは、フレームをブロックまたは「マクロブロック」に、例えば16x16画素に、分割することによってフレームを符号化できる。符号器はさらに、各マクロブロックをサブブロックに分割できる。各サブブロックはさらに、さらなるサブブロックを備えることがある。例えば、1マクロブロックのサブブロックが16x8及び8x16サブブロックを含むことがある。8x16サブブロックのサブブロックは、8x8サブブロックを含むことがある。ここで用いる用語「ブロック」は、マクロブロックまたはサブブロックを指す。
開発過程にある業界規格に基づく圧縮技術ひとつに、通称「H.264」映像圧縮と呼ばれものがある。H.264技術は、符号化映像ビットストリームの構文と同ビットストリームの復号化方法を定めている。H.264符号化プロセスの一態様においては、入力映像フレームが符号化に差し出される。フレームは、元の画像に対応するマクロブロックの単位で処理される。各マクロブロックはイントラモードかインターモードで符号化できる。復元済みのフレームか、または同一フレーム内の因果的近傍(causal neighbor)と呼ばれる復元済みの近傍ブロックの部分に基づき予測マクロブロックが形成される。イントラモードでは、あらかじめ符号化され、復号化され、復元された注目フレーム内の因果的サンプルからマクロブロックが形成される。符号化される注目マクロブロックから1つ以上の因果的近傍マクロブロックのマルチメディアサンプル(multimedia sample)が差し引かれることによって残差または差分マクロブロック、Dが得られる。この残差ブロックDがブロック変換を用いて変換され、量子化されることにより、X、すなわち1セットの量子化変換係数(quantized transform coefficient)が得られる。これらの変換係数には配置換えとエントロピー符号化が行われる。エントロピー符号化係数は、マクロブロックを復号化するための他の情報とともに圧縮ビットストリームの一部となって受信装置へ送出される。
残念ながら、送信過程で1つ以上のマクロブロックにエラーが生じることがある。例えば、信号フェージング等の1つ以上の劣化伝送効果によって1つ以上のマクロブロックでデータの損失が生じることがある。このため、無線チャネルのようにエラーを被りやすいネットワーク上でマルチメディアコンテンツを送達する場合のエラー隠蔽(error concealment)が重要となっている。エラー隠蔽方式では映像信号に存在する空間的・時間的相関を利用する。エラーに遭遇する場合はエントロピー復号化のときにリカバリを行うことができる。例えばパケットエラーに遭遇すると、1つ以上のマクロブロックまたは映像スライス(通例隣接するマクロブロックのグループ)に関係するデータの全部または一部が失われることがある。1スライスの映像データが失われると、次のスライスで復号の再同期が行われ、損失スライスの不在ブロックは空間隠蔽(spatial concealment)により隠蔽できる。
復号化装置で利用できる復号化データは、あらかじめ復号化され復元された因果的近傍を含むので、空間隠蔽では通常、不在ブロックの隠蔽にあたって因果的近傍を使用する。損失ブロックの隠蔽にあたって因果的近傍を使用するひとつの理由は、特に高度にパイプライン化されたビデオハードウェア復号器コアを使用する場合に、次のスライスの不規則的復元(out-of-order reconstruction)とその後に続く注目スライスの損失部分の隠蔽がすこぶる非効率的だからである。非因果的近傍(non-causal neighbor)は空間隠蔽の改善にあたって有益な情報を提供できる。非因果的近傍マルチメディアサンプルの不規則的復元を提供する効率的方法が求められている。
[概要]
本発明のシステム、方法、及び装置は各々いくつかの態様を有し、ただひとつの態様が単独で本発明の望ましい属性を担うわけではない。添付の請求項によって表明される本発明の範囲を制限することなく、これより本発明の顕著な特徴を手短に説明する。この論述を検討した後には、特に「いくつかの態様の詳細な説明」と題された節を読んだ後には、本発明の代表的特徴から、エラー隠蔽の改善と効率の改善とを含む利点がマルチメディア符号化・復号化にいかに提供されるかが理解されるであろう。
マルチメディアデータを処理する方法が提供される。方法は、マルチメディアデータに関連する変換係数(transform coefficient)を受信することを含む。方法はさらに、復元の対象となる1セットのマルチメディアサンプルを決定することと、復元の対象となる前記マルチメディアサンプルに基づき1セットの受信変換係数(received transform coefficient)を決定することと、前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため変換係数の決定されたセットを処理することとを含む。
マルチメディアデータプロセッサが提供される。プロセッサは、マルチメディアデータに関連する変換係数を受信するよう構成される。プロセッサはさらに、復元の対象となる1セットのマルチメディアサンプルを決定し、復元の対象となる前記マルチメディアサンプルに基づき1セットの前記受信変換係数を決定し、且つ前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため前記1セットの決定された変換係数を処理するよう構成される。
マルチメディアデータを処理する装置が提供される。装置は、マルチメディアデータに関連する変換係数を受信する受信器を含む。装置はさらに、復元の対象となる1セットのマルチメディアサンプルを決定する第1の決定器(determiner)と、復元の対象となる前記マルチメディアサンプルに基づき1セットの前記受信変換係数を決定する第2の決定器と、前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため前記1セットの決定された変換係数を処理する生成器とを含む。
実行時にマシンにマルチメディアデータを処理させる命令を含むマシン可読媒体が提供される。命令は、マルチメディアデータに関連する変換係数を前記マシンに受信させる。命令はさらにマシンに、復元の対象となる1セットのマルチメディアサンプルを決定させ、復元の対象となる前記マルチメディアサンプルに基づき1セットの前記受信変換係数を決定させ、且つ前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため前記1セットの決定された変換係数を処理させる。
[特定の概念についての詳細な説明]
以降の詳細な説明は本発明の特定の代表的態様を対象とする。ただし本発明は、請求項によって規定され請求項の範囲に含まれる様々なやり方で具現できる。この説明では図面を参照するが、図面の全体を通じて同様の部分は同様の数字で示されている。
映像信号は、一連の画像、フレーム、またはフィールドの観点で特徴づけることができる。ここで用いる用語「フレーム」は、漸進的映像信号のフレームか、インタレース映像信号のフレームまたはフィールドを含む広義の用語である。
態様は、マルチメディア伝送システムの符号器と復号器とで処理を改善するシステム及び方法を含む。マルチメディアデータは、動画像、オーディオ、静止画像、または他の何らかの適当なタイプの視聴覚データの内1つ以上を含み得る。態様は、非因果的マルチメディアサンプル(non-causal multimedia sample)を復元することにより、そして復元されたサンプルを用いて損失または不正符号化マルチメディアデータの空間隠蔽を遂行することによりエラー隠蔽の改善を図りながら、映像データを効率的に復号化する装置及び方法を含む。例えば一態様に従い、損失または不正データのマルチメディア隠蔽データを推定する前に復元因果的及び/または非因果的近傍サンプルを生成すると、空間隠蔽の質を改善できることは判明している。いくつかの例においては、復元マルチメディアサンプルと、復元サンプルが当初符号化されたときの指向性インジケータ(directivity indicator)とをマルチメディア隠蔽データの推定に使用する。別の態様においては、空間エラー隠蔽(spatial error concealment)に用いるマルチメディアサンプル行列のサブセットを復元すると処理効率をさらに改善できることが判明している。いくつかの例においては、マルチメディアサンプルの復元とマルチメディア隠蔽データの推定とがプリプロセッサで遂行される。そして、効率的ビデオコアプロセッサで復号化される当初符号化された非因果的マルチメディアデータとともにマルチメディア隠蔽データを伝達でき、処理効率はさらに改善する。
マルチメディア通信システム
図1は、一態様に従いマルチメディア通信システム100を図解する機能ブロック図である。システム100は、ネットワーク140を介して復号化装置150と通信する符号化装置110を含む。符号化装置は一例において、外部ソース102からマルチメディア信号を受信し、その信号をネットワーク140上での送信のため符号化する。
この例の符号化装置110は、メモリ114とトランシーバ116とに結合されたプロセッサ112を備える。プロセッサ112はマルチメディアデータソースからのデータを符号化し、これをネットワーク140上での通信のためトランシーバ116へ提供する。
この例の復号化装置150は、メモリ154とトランシーバ156とに結合されたプロセッサ152を備える。プロセッサ152は、汎用プロセッサ、及び/またはデジタル信号プロセッサ、及び/または特定用途向けハードウェアプロセッサの内1つ以上を含み得る。メモリ154は、ソリッドステートまたはディスク方式ストレージ、または読み取り可能・書き込み可能ランダムアクセスメモリ装置の内1つ以上を含み得る。トランシーバ156はネットワーク140を介してマルチメディアデータを受信し、且つこれを復号化のためプロセッサ152に提供するよう構成される。トランシーバ156は一例において、無線トランシーバを含む。ネットワーク140は、イーサネット(登録商標)、電話(例えばPOTS)、ケーブル、電力線、及び光ファイバシステムの内1つ以上を含む有線または無線通信システム、及び/または符号分割多重アクセス(CDMAまたはCDMA2000)通信システム、周波数分割多重アクセス(FDMA)システム、GSM/GPRS(汎用パケット無線サービス)/EDGE(強化データGSM環境)等の時分割多重アクセス(TDMA)システム、TETRA(地上基盤無線)モバイル電話システム、広帯域符号分割多重アクセス(WCDMA)システム、高データレート(1xEV−DOまたは1xEV−DOゴールドマルチキャスト)システム、IEEE 802.11システム、MediaFLOシステム、DMBシステム、直交周波数分割多重アクセス(OFDM)システム、またはDVB−Hシステムの内1つ以上を備える無線システムの内、1つ以上を備えてよい。
図2Aは、図1に図解されたシステム100等のシステムで使用できる復号化装置150の一態様を図解する機能ブロック図である。この態様の復号器150は、受信素子202と、マルチメディアサンプル決定素子(sample determiner element)204と、変換係数決定素子206と、復元サンプル生成素子208と、マルチメディア隠蔽推定素子210とを備える。
受信器202は符号化映像データ(例えば、図1の符号器110によって符号化されたデータ)を受信する。受信器202は、図1のネットワーク140等、有線または無線ネットワーク上で符号化データを受信できる。一態様において、受信データはソースマルチメディアデータを表す変換係数を含む。変換係数は、近傍サンプルの相関性が大幅に減少する領域に変換される。例えば画像は通常、空間領域において高度な空間的相関を呈する。他方、変換された係数は通常、互いに直交し、ゼロの相関性を呈する。マルチメディアデータに使用できる変換のいくつかの例として、DCT(離散コサイン変換)、DFT(離散フーリエ変換)、アダマール(またはウォルシュ・アダマール)変換、離散ウェーブレット変換、DST(離散サイン変換)、ハール変換、スラント変換、KL(カルーネン・レーベ)変換、H.264で使われている整数変換等の整数変換があり、ただしこれらに限定されない。これらの変換はマルチメディアサンプルの行列または配列を変換するために使われる。二次元行列がよく使われるが、一次元配列が使われることもある。受信データはまた、符号化ブロックがどのように符号化されたかを伝える情報を含む。かかる情報は、動きベクトルやフレームシーケンス番号等のインター符号化参照情報、ブロックサイズや空間予測指向性インジケータを含むイントラ符号化参照情報、その他を含み得る。一部の受信データは、各々の変換係数がどのように四捨五入されたかを伝える量子化パラメータ、変換済み行列の中でゼロ以外の変換係数がいくつあるかを伝える非ゼロインジケータ、その他を含む。
マルチメディアサンプル決定器204は、復元の対象となるマルチメディアサンプルがどれかを決定する。マルチメディアサンプル決定器204は一態様において、隠蔽できる損失マルチメディアデータ領域に近い及び/または隣接する、近傍マルチメディアサンプルまたは画素を決定する。マルチメディアサンプル決定器は一例において、エラーやチャネル損失のためデータの一部が失われたスライスまたはブロックグループの境界に近接する画素を識別する。マルチメディアサンプル決定器204はいくつかの例において、決定された画素から空間的に予測される近傍ブロックの復元に関連する最小数の画素を識別する。例えば圧縮マルチメディアデータは、個々のブロック(例えば、8x8画素ブロック、及び/または4x4画素ブロック)または行列の変換がもたらす変換係数のブロックを備えることがある。マルチメディアサンプル決定器204は、復元の対象となる変換済みブロックのマルチメディアサンプルの特殊サブセットを識別でき、これは損失データの隠蔽に使われるか、それらのサンプルから予測される他のブロック内の他の符号化マルチメディアサンプルの復元に使われる。決定されたマルチメディアサンプルは、非因果的サンプル及び/または因果的サンプルを含むことがある。
変換係数決定器206は、マルチメディアサンプル決定器204によって復元対象と決定されたマルチメディアサンプルの一部または全部の復元に使われる1セットの変換係数を決定する。使用すべき変換係数がどれかの決定は、変換係数の生成に使われた符号化方法に依存する。変換係数決定はまた、復元されるマルチメディアサンプルがどれかと、値がゼロの変換係数の有無に依存する(これによりそれらを使用する必要をなくす)。マルチメディアサンプルを復元するにあたってどの変換係数が十分であるかの詳細は後述する。
復元サンプル生成器208は、マルチメディアサンプル決定器204によって決定されたサンプルに基づきマルチメディアサンプルを復元する。復元サンプルのセットは、全NxNサンプル行列等、セット全体であってよく、ここでNは整数である。サンプルのセットは、行、列、行または列の一部、対角線等、NxN行列のサンプルのサブセットであってよい。復元サンプル生成器208は、変換係数決定器206によって決定された変換係数をサンプルの復元に使用する。復元サンプル生成器208はまた、変換係数の符号化に使われた符号化方法に基づく情報をマルチメディアサンプルの復元に使用する。復元サンプル生成器208によって遂行される動作の詳細は後述する。
マルチメディア隠蔽推定器(multimedia concealment estimator)210は、送信/受信中のエラーに伴い失われた、または変化した、マルチメディアデータ領域を置き換えるため、または隠蔽するため、復元サンプル生成器208によって計算された復元サンプルを使って隠蔽マルチメディアサンプル(concealment multimedia sample)を形成する。マルチメディア隠蔽推定器210は一態様において、隠蔽マルチメディアサンプルを形成するため復元サンプル値を使用する。マルチメディア隠蔽推定器210は別の態様において、マルチメディア隠蔽データを推定するにあたって、復元サンプル値と、受信空間予測指向性モードインジケータ(directivity mode indicator)とを使用する。本願の被指定代理人に指定された出願第11/182,621号(現在の公開特許出願U.S. 2006/0013320)「METHODS AND APPARATUS FOR SPATIAL EROR CONCEALMENT(空間エラー隠蔽のための方法及び装置)」に空間エラー隠蔽のさらなる詳細を見ることができる。
いくつかの態様において、図2Aの復号器150の素子の内1つ以上は、配置を変える、及び/または組み合わせる、ことができる。これらの素子はハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、またはこれらの組み合わせによって実装できる。復号器150の素子によって遂行される動作の詳細は、後ほど図3及び4に図解された方法を参照しながら説明する。
図2Bは、図1に図解されたシステム等で使用できる復号化装置のコンピュータプロセッサシステムの一例を図解するブロック図である。この例の復号化装置150は、プリプロセッサ素子220と、ランダムアクセスメモリ(RAM)素子222と、デジタル信号プロセッサ(DSP)素子224と、ビデオコア素子226とを含む。
プリプロセッサ220は一態様において、図2Aの様々な素子によって遂行される動作の内1つ以上を遂行するため使用される。プリプロセッサは映像ビットストリームを解析し、データをRAM222へ書き込む。加えて、プリプロセッサ220は一態様において、マルチメディアサンプル決定器204、変換係数決定器206、復元サンプル生成器208、及びマルチメディア隠蔽推定器210の動作を実施する。これらのより効率的で演算上の負担がより少ない動作をプリプロセッサ220で遂行することにより、演算上の負担がより大きい映像復号化は効率性の高いビデオコア226で因果的順序(causal order)で果たすことができる。
DSP224はRAM222に格納された解析済み映像データを引き出し、これをビデオコア226で取り扱われる形に再編する。ビデオコア226は、脱量子化(dequantization)(リスケーリング(rescaling)またはスケーリング(scaling)とも呼ばれる)、逆変換・ブロック解除機能、その他の映像解凍機能を遂行する。ビデオコアは通常、高度に最適化・パイプライン化された形で実装される。このため映像データは、これが因果的順序で復号化される場合に、最も速く復号化できる。マルチメディアサンプルの不規則的復元とその後に続く空間隠蔽とをプリプロセッサで遂行することにより、ビデオコアにおける復号化にあたって因果的順序は維持され、全体的復号化性能の向上が可能となる。
図3は、図1に図解されたシステム等で映像ストリームの一部分を復号化する方法の一例を図解するフローチャートである。プロセス300は、図2A及び2Bに示された例等の復号化装置によって遂行できる。プロセス300は、選択されたマルチメディアサンプルの復元を可能にする。プロセス300は、マルチメディアサンプルを因果的順序で復元することに使用でき、ここで他の符号化マルチメディアデータは因果的データから推測され、それ自体の復元に先立ち因果的データの復元を必要とする場合がある。プロセス300は、マルチメディアサンプルを非因果的順序で復元することに使用できる。一態様においては非因果的データが復元されることにより、その後に続く全マルチメディアデータ(因果的及び非因果的)の復元をより効率的且つタイムリーに行うことができる。
プロセス300はブロック305で始まり、ここで復号化装置はマルチメディアデータビットストリームに関連する変換係数を受信する。復号化装置は、図1に示すネットワーク140等、有線及び/または無線ネットワーク上で変換係数を受信できる。変換係数は、クロミナンスやルミナンス等、色及び/または輝度パラメータを含むマルチメディアサンプルを表すことがある。変換係数の生成に用いる変換には、DCT(離散コサイン変換)、DFT(離散フーリエ変換)、アダマール(またはウォルシュ・アダマール)変換、離散ウェーブレット変換、DST(離散サイン変換)、ハール変換、スラント変換、KL(カルーネン・レーベ)変換、H.264で使われている整数変換等の整数変換があり、ただしこれらに限定されない。マルチメディアサンプルは、符号化中に変換係数が生成されるときに一次元配列及び/または二次元行列等のグループで変換できる。変換済み係数はイントラ符号化でき、空間予測を含む場合とそうでない場合とがある。変換係数の生成にあたって空間予測が使われた場合、変換係数は、基準値によって提供される予測子の誤差である残差値を表すことがある。変換係数は量子化できる。変換係数はエントロピー符号化できる。図2Aの受信素子202はブロック305の動作を遂行できる。
プロセス300は変換係数を受信した後にブロック310で継続し、ここで復号化装置は、復元の対象となる1セットのマルチメディアサンプルを決定する。復元の対象となるマルチメディアサンプルは、ルミナンスサンプルとクロミナンスサンプルを含むことがある。いくつかの例においては、ブロック305で受信するマルチメディアビットストリームを復号化するときに同期の喪失を受けて1セットの復元対象マルチメディアサンプルが決定される。同期の喪失は、不正受信によって、またはマクロブロックの第1のスライスの中にあるマルチメディアサンプルに対応する符号化データの一部または全部の損失によって、生じる。復元の対象となる決定されたマルチメディアサンプルがマクロブロックの第2のスライスの中に含まれることがある。マクロブロックの第2のスライスは、マクロブロックの第1のスライスの損失部分の少なくとも一部分には隣接する。決定されるマルチメディアサンプルは、上述したとおりマルチメディアサンプルの損失部分に対し因果的または非因果的である。
一態様において、ブロック310で復元対象として決定されるマルチメディアサンプルは、隠蔽すべき損失マルチメディアデータ部分に隣接する他のマルチメディアサンプルの復元を可能にする。例えば、ブロック310で復元対象として決定される1セットの決定されたマルチメディアサンプルを基準にして、別のマクロブロックスライスの底部にあるイントラ符号化マクロブロックを空間的に予測できる。したがって、イントラ符号化ブロックと強く相関する1セットの決定されたマルチメディアサンプルを復元することにより、隠蔽プロセスを通じてイントラ符号化ブロックそのものを復元できる。別の態様において、ブロック310で復元対象として決定されるマルチメディアサンプルは、スライス境界上にあるサンプルを、またはスライス境界の近くにあるサンプルを、備えることがある。復元対象サンプルは、符号化のときにグループとして変換された関連マルチメディアサンプルの行列全体を備えることがある。復元対象サンプルはまた、行、列、対角線、またはこれらの部分及び/または組み合わせ等、関連マルチメディアサンプル行列の一部分を備えることがある。図2Aのマルチメディアサンプル決定器204はブロック310の動作を遂行できる。復元されるマルチメディアサンプルのサブセットの詳細は後述する。
プロセス300はブロック315で継続し、ここで復号化装置は、ブロック310で復元対象として決定されたマルチメディアサンプルに関連する1セットの変換係数を決定する。復元に使用するべき変換係数がどれかの決定は、変換係数の生成に使われた符号化方法に依存する。変換係数決定はまた、復元されるマルチメディアサンプルがどれなのかに依存する。例えば、ブロック310で1セットのマルチメディアサンプルがそっくり復元の対象として決定されることもあれば、サブセットが復元対象として決定されることもある。ブロック315における変換係数決定はまた、値がゼロの変換係数の有無に依存する(これによりそれらを使用する必要をなくす)。マルチメディアサンプルを復元するにあたってどの変換係数が十分であるかの詳細は後述する。図2Aの変換係数決定器はブロック315の動作を遂行できる。
復元の対象となる1セットのマルチメディアサンプルをブロック310で決定し、さらに決定されたマルチメディアサンプルに関連する1セットの変換係数をブロック315で決定した後、プロセス300はブロック320へ進む。復号化装置はブロック320で、復元マルチメディアサンプルを生成するため1セットの決定変換係数を処理する。遂行される処理は、変換係数の生成に使われた符号化方法に依存する。処理は、変換係数を逆変換することを含み、ただしエントロピー復号化、脱量子化(リスケーリングまたはスケーリングとも呼ばれる)、その他を含みただしこれらに限定されない他の動作を含むこともある。ブロック320で遂行される処理の例の詳細は、後ほど図4を参照しながら説明する。
いくつかのシステム例において、プロセス300の動作の一部または全部は、図2Bに示すプリプロセッサ220等、プリプロセッサで遂行される。プロセス300のいくつかのブロックの組み合わせ、省略、配置換え、またはそれらの組み合わせが可能であることに注意されたい。
図4は、図1に図解されたシステム等で映像ストリームの一部分を復号化する方法のもうひとつの例をより詳細に図解するフローチャートである。プロセス例400は、プロセス300のブロック305乃至320で遂行される動作をすべて含む。ブロック305、310、及び315は、図3に示された上述の例と変わりない。プロセス400では、復元サンプルを生成するため変換係数の処理が行われるプロセス300のブロック320がより詳細に図解されており、ここで同プロセスは4つのブロック405、410、420、及び425を備える。プロセス400はまた、追加のブロックを、すなわち隠蔽マルチメディアサンプルを推定するブロック430と、推定された隠蔽マルチメディアサンプルに基づき変換係数を生成するブロック435とを含む。
復号化装置は、ブロック305、310、及び315の動作を、上述と同様のやり方で遂行する。ブロック320の詳細例が示されており、ここではマルチメディアサンプルを効率よく復元するため、変換係数に基底画像が関連づけられる。復号化装置はブロック405で変換係数をグループに分割し、ここで変換係数のグループは、ブロック305で復元の対象として決定されたマルチメディアサンプルに関連する。変換係数のグループは一態様において、復元の逆変換プロセスで共通の基底画像を修正(または重み付け)する変換係数を備える。変換係数がどのようにグループに分割されるかの詳細は、H.264を用いる一例との関係で後ほど説明する。
復号化装置はブロック410で、係数を生成した符号化方法に基づき各分割グループに関連する加重値を計算する。一態様において、重みは各グループのスケール化変換係数の和である。スケーリングは符号化方法の逆変換特性を再現する。加重値のスケーリングと計算の例は、H.264例との関係で後ほど説明する。
ブロック420では、符号化変換方法に基づき各グループの基底画像を決定する。基底画像は通常ならば二次元直交行列だが、一次元配列が使われることもある。二次元基底画像の部分が使用され、それらの部分はどのマルチメディアサンプルが復元されるかに依存する(ブロック310で決定)。ブロック410で各グループにつき計算される値は、ブロック425で関連基底画像を修正(または重み付け)するのに使われる。ブロック425では、全ての加重基底画像を組み合わせることによってマルチメディアサンプルが復元される。ブロック420及び425の詳細は、後ほどH.264の例を参照しながら説明する。
プロセス400は、復元マルチメディアサンプルを生成した後にブロック430で継続し、ここで復号化装置は、いくつかの例においては復元サンプルに基づき隠蔽マルチメディアサンプルを推定する。一態様においては、隠蔽マルチメディアデータを形成するため、マルチメディアサンプルの復元サンプル値を使用する。別の態様においては、マルチメディア隠蔽データを形成するため、復元サンプル値と受信空間予測指向性モードインジケータとを使用する。本願の被指定代理人に指定された出願第11/182/621号(現在の公開特許出願U.S. 2006/0013320)「METHODS AND APPARATUS FOR SPATIAL EROR CONCEALMENT(空間エラー隠蔽のための方法及び装置)」に空間エラー隠蔽のさらなる詳細を見ることができる。
いくつかの例においては、推定された隠蔽マルチメディアサンプルがそのまま使用され、表示される同一フレームの復元データを収容するフレームバッファに挿入される。別の例においては、ブロック435で推定隠蔽マルチメディアサンプル(estimated concealment multimedia sample)を表す変換係数を生成するため、符号化プロセスを再現するやり方で推定隠蔽マルチメディアサンプルが変換される。そして、これらの変換済み係数は、あたかもそれらが通常の符号化サンプルであるかのように、復号化されていない(まだ符号化されている)ビットストリームの中に挿入される。そして、図2Bのビデオコア226等の映像復号器コアへビットストリーム全体が転送され、復号化される。これらの例で、プロセス400の全部または一部は図2Bのプリプロセッサ220等のプリプロセッサで遂行できる。復元と隠蔽推定を遂行するこの方法は、非因果的部分の復元にとりわけ有効であり、復元された非因果的部分はその後、チャネルエラーのため失われた他のマルチメディアデータ部分を隠蔽するため使用される。これよりマルチメディアサンプル復元の効率を上げるための方法の詳細を、H.264符号化マルチメディアビットストリームとの関係で説明する。
H.264ビットストリームにおける高能率部分イントラ復号化
H.264の空間予測は近傍画素ブロックの空間相関を利用する。空間予測モードは、4x4、8x8、または16x16画素ブロックの左と上の因果的近傍を空間予測に使用する。H.264はルミナンス値のため2つの空間予測モードを、すなわち4x4画素ブロックのためのモード(ここでイントラ4x4符号化と呼ぶ)と、16x16画素マクロブロックのためのモード(ここでイントラ16x16符号化と呼ぶ)とを提供する。他の因果的及び非因果的近傍サンプルも空間予測に使用できることに注意されたい。
図5は、4x4画素ブロック502と、これを左と上とで取り囲む、504で概括的に示された、因果的近傍画素の詳細図を示す。例えばH.264符号化プロセスでは、ブロック502の画素を説明する様々な予測子、値、及び/またはパラメータを生成するため因果的近傍画素504を使用する。ブロック502は画素(p0〜p15)を備え、因果的近傍画素504は参照標識n3、n7、n11、n12、n13、n14、及びn15を用いて識別されており、ここでの数字はブロック502の画素の類似部分に対応する。
H.264で提供される空間予測モードは、様々な因果的近傍画素504からブロック502を空間的に予測するため様々な指向性モードを使用する。図6は、H.264におけるイントラ符号化ブロックの指向特性の説明に役立つ9つの指向性モード(0〜8)を図解する指向性モード図600を示す。ブロック502の空間予測の指向特性を説明するには9つの指向性モード(インジケータ)を使用する。例えば、モード0は垂直指向特性を説明し、モード1は水平指向特性を説明し、モード2はDC特性を説明し、この場合は使用可能因果的近傍画素の平均値を予測の基準として使用する。DCモードでは平均の計算にあたって同一スライス内の因果的近傍画素(4x4、8x8、または16x16画素ブロックのすぐ上と左に位置する画素)を使用する。例えば、もしも符号化されるブロックが上のスライスに隣接するなら、左の画素が平均化される。もしも符号化されるブロックが左と上の別のスライスに隣接するなら、DC平均として値128を使用する(H.264で提供される8ビット値範囲の半分)。指向性モード図600に図解されたモードは、H.264符号化プロセスでブロック502の予測値を生成するため使用される。
H.264のイントラ4x4符号化では、9つの指向性モードのいずれかを使用し、4x4ブロックの左と上の画素を基準にしてルミナンス値を符号化できる。イントラ16x16符号化では、16x16画素ブロック全体の左と上の画素を基準とし、4つのモード、すなわちi)垂直(モード0)、ii)水平(モード1)、iii)DC(モード2)、及びiv)平面(モード3)を使用し、ルミナンス値を符号化できる。平面予測モードでは、ルミナンス値がマクロブロックにわたって空間的に滑らかに変化すると仮定し、基準は平面式に基づき形成される。クロミナンスの場合は1つの予測モード、8x8がある。イントラ8x8クロミナンス符号化では、イントラ16x16符号化と同じモード、すなわちi)垂直(モード0)、ii)水平(モード1)、iii)DC(モード2)、及びiv)平面(モード3)で8x8ブロックを予測できる。これよりH.264で符号化される予測ブロックの復元の詳細を説明する。
予測(イントラまたはインター)符号化4x4(ルミナンスまたはクロミナンス)ブロックの中で復元される信号は次のとおりに表すことができ、
Figure 2009510938
ここでr、p、及び
Figure 2009510938
はそれぞれ復元信号(元の非圧縮信号sに対する近似)と、予測信号と、圧縮残差信号(元の非圧縮残差信号に対する近似:Δ=s−p、ここでsは元の信号)とを表し、いずれもこの例においては整数値の4x4行列である。残差値
Figure 2009510938
は、変換係数の逆変換によって復元できる。予測値pは、因果的近傍画素の符号化に用いる空間予測モードに応じて因果的近傍画素から得る。
スライス境界の直下に位置するイントラ4x4符号化マクロブロック内の画素(H.264における非因果的近傍)の復元にかかわる考察を以下に示す。16x16マクロブロックにおいて、これらのブロックはスライス境界の直下に位置する4つの最上位4x4ブロックを含む。例えば、図9に示す16x16画素マクロブロックで指標b0、b1、b4、及びb5を持つブロックは、スライス境界AA’の直下のブロックに相当する。
図7は、スライス境界の直下に位置するイントラ4x4符号化ブロックの一態様を示す。線AA’は言及したスライス境界をしるし、4x4ブロック702は復元される注目ブロックである。スライス境界線AA’の上にある、通常ならばイントラ4x4符号化で空間予測に使用できた9つの近傍画素704は、スライス境界の反対側に位置し、それ故別のスライスに属するから、使用できない。H.264では、スライスは再同期点として作用するので、スライス境界にまたがる空間予測やその他の予測符号化依存は許可されない。
図8は、近傍画素とイントラ4x4符号化ブロックの中にある画素の名称を図解する。スライス境界AA’の上にある画素は空間予測に使用できないから、予測に使用できるブロック702の近傍画素は画素{I,J,K,L}である。これは、4x4ブロック702の許容イントラ4x4符号化予測モードが、i)モード1(水平)、ii)モード2(DC)、及びiii)モード8(水平−上)であることを意味する。もしも図7の線BB’によってもうひとつのスライス境界がしるされるなら、画素{I,J,K,L}または{M,A,B,C,D,E,F,G,及びH}はいずれも空間予測に使用できなくなる。この場合の許容イントラ4x4符号化予測モードはモード2(DC)であり、ブロック702の全画素にとっての基準値は128である。
よって、スライス境界の直下に位置するイントラ4x4符号化ブロックの画素の一部または全部を復号化し復元するための情報は、最も一般的なケースで、
1.イントラ4x4予測モードインジケータと、
2.残差情報(量子化変換係数)と、
3.4x4ブロックの左真横に位置する4つの近傍画素{図8のI,J,K,L}の値とを含む。
この十分なデータセットにより、注目4x4ブロックの全画素値{図8のa,b,c,...,n,o,p}の復元は可能である。加えてこのデータセットは、画素サブセット{d,h,l,p}の値の復元にとっても十分であり、それらはさらに、右真横にある次の4x4ブロックの復元に使用できる。
スライス境界の直下に位置するイントラ16x16符号化マクロブロック内の画素(H.264における非因果的近傍)の復元にかかわる考察を以下に示す。ここでも関心は、スライス境界の直下に位置するイントラ16x16符号化マクロブロックの4つの最上位4x4ブロック(すなわち、図9でブロック指標b0、b1、b4、及びb5を持つもの)にある。
図9は、スライス境界の下に位置するイントラ16x16符号化マクロブロックの一態様を示す。線AA’は言及したスライス境界をしるし、b0、b1、b4、及びb5の標識を持つ4つの4x4ブロックは、復元にあたって検討される16x16マクロブロックの部分をなす。線AA’の上にある、通常ならばイントラ16x16空間予測に使用できた17個の近傍画素は、スライス境界の反対側に位置し、それ故別のスライスに属するから、使用できない。この例で線BB’の左真横に位置する16個の近傍画素の使用の見込みは、注目マクロブロックの許容イントラ16x16符号化空間予測モードが、i)モード1(水平)、及びii)モード2(DC)であることを意味する。例えば線BB’によってもうひとつのスライス境界(または映像フレームの左境界)がしるされる場合のように、線BB’の左真横に位置する16個の近傍画素も、線AA’の上に位置する17個の画素も使用できないなら、許容イントラ16x16予測モードはモード2(DC)である。
注目マクロブロックがイントラ16x16予測モード1(水平)を用いて符号化される場合は、注目16x16マクロブロックの中で4つの最上位4x4ブロックを復号化し復元するにあたって、線BB’の左真横、線AA’の下に位置する4つの最上位近傍画素で事足りる。これは、イントラ4x4符号化マクロブロックで4つの最上位4x4ブロックの復号化を可能にする上述の枠組みに一致する。
ただし、注目マクロブロックがイントラ16x16空間予測モード2(DC)を使って符号化され、これがスライス境界の右真横になく、左フレーム境界沿いにもなければ、注目MBの中で4つの最上位4x4ブロック(ならびに行内の他の全て)を復号化し復元するため、線BB’の左真横に位置する全16個の近傍画素が使われる。これは望ましくない状況である。一態様において、スライス境界の直下ではイントラ16x16空間予測モード2(DC)による符号化を避けると有利である。スライス境界の下にある画素(例えば図8の画素I、J、K、及びL)の復元には4つの最上位近傍画素を使用するのが望ましい。
一態様において、スライス境界の直下に位置するマクロブロックのイントラ16x16符号化は、それらがスライス境界の右真横に、または左フレーム境界に位置しない限り、空間予測モード1(水平)に限定するべきである。これにより、行内の全最上位4x4ブロックの右端の4つの画素で演算効率の高い復元が可能となる。さらにこれは、行内の全最上位4x4ブロックの4つの最上位画素で演算効率の高い復元を可能にする。
図10は、スライス境界の直下に位置する8x8クロミナンスブロックの一態様を示す。線AA’はスライス境界をしるし、線AA’のすぐ下、線BB’の右にある2つの4x4ブロックは、2つのクロミナンスチャネル(Cr及びCb)の一方のデータを構成する。この例で、スライス境界線AA’の上にある9つの近傍画素は、スライス境界の反対側に位置し、それ故別のスライスに属するから、空間予測に使用できない。線BB’の左真横に位置する8つの近傍画素を使用できることは、注目MBの許容クロミナンスチャネルイントラ予測モードが、i)モード0(DC)、及びii)モード1(水平)であることを意味する。線BB’もスライス境界か映像フレームの左境界なら、線BB’の左真横に位置する8つの近傍画素も、線AA’の直上に位置する9つの画素も空間予測に使用できない。この場合の許容クロミナンスチャネルイントラ予測モードはモード0(DC)である。
注目イントラ符号化マクロブロックのクロミナンスチャネルがイントラ8x8 クロミナンス水平予測モードを使って符号化される場合は、注目MBの中で2つの最上位4x4 クロミナンスブロックを復号化し復元するにあたって、線BB’の左真横に位置する4つの最上位近傍画素が必要となる。1つの16x16ルミナンスマクロブロックに対し2つの8x8クロミナンスブロックがあることに注意されたい。
同様に、注目イントラ符号化マクロブロッククロミナンスチャネル(Cr及びCb)がイントラ8x8クロミナンス予測モード2(DC)を使って符号化される場合は、2つの最上位4x4ブロックを復号化し復元するにあたって、線BB’の左真横に位置する8つの近傍画素で事足りる。これも上述した枠組みに一致する。
一態様において、スライス境界の直下に位置する、イントラ符号化マクロブロックのクロミナンスチャネル(Cr及びCb)のイントラ8x8符号化は、それらがスライス境界の右真横か左フレーム境界に位置しない限り、空間予測モード1(水平)に限定するべきである。これにより、行内の全最上位4x4ブロックの右端の4つの画素で演算効率の高い復元が可能となる。さらにこれは、行内の全最上位4x4ブロックの4つの最上位画素で演算効率の高い復元を可能にする。これは、イントラ符号化マクロブロックルミナンスチャネルで4つの最上位4x4ブロックの復号化を可能にする上述の枠組みに一致する(イントラ4x4符号化マクロブロックとイントラ16x16符号化マクロブロックの両方、上述したとおり16x16DC空間予測モードの使用には制約がある)。
H.264におけるイントラ符号化サンプルの効率的部分復号化
4x4画素ブロックの右端の4つの画素の部分復号化により、最初の4x4ブロックの右にあるイントラ符号化ブロックの画素の一部及び/または全部の復号化が可能になることを明らかにした。今度は、図8における位置{d,h,l,p}の最終画素値の復元に寄与する4x4イントラ符号化ブロックの残差成分の第4の、すなわち最後の、列を効率的に復号化する問題を取り上げる。この例ではH.264整数変換の基底画像を使用する。ただし、これ以外の変換の基底画像を同様に操作し、同様の効率的部分復号化が可能になることに注意されたい。これらの方法を用いて部分的に復号化できる変換は、DCT(離散コサイン変換)、DFT(離散フーリエ変換)、アダマール(またはウォルシュ・アダマール)変換、離散ウェーブレット変換、DST(離散サイン変換)、ハール変換、スラント変換、KL(カルーネン・レーベ)変換を含み、ただしこれらに限定されない。
一般的に、変換行列[T]を用いて変換係数行列[w]を求めるNxNマルチメディアサンプル行列「Y」の順方向変換は次の形をとる。
Figure 2009510938
マルチメディアサンプル行列[Y]を復元する逆変換は次の形をとる。
Figure 2009510938
等式(3)及び(4)によって表される変換はそれぞれ、二次元(2D)変換に帰結する2つの一次元(1D)変換と考えることができる。例えば、[Y][T]行列乗算は1D行変換と考えることができ、[T][Y]行列乗算は1D列変換と考えることができる。組み合わせによって2D変換が形成される。NxN行列[Y]の2D変換のもうひとつの考えかたとして、変換行列[T]によって特徴づけられる2D変換に対応する2D基底画像により[Y]のN内積を行うと、1セットの変換係数に等しい1セットのN値になる。
所与の変換[T]の基底画像は、変換係数のひとつを1に設定することにより、その他は全てゼロに設定することにより、そして係数行列の逆変換をとることにより、計算できる。例えば、4x4変換係数行列[w]を使用し、w11係数を1に設定し、その他は全てゼロに設定し、H.264整数変換[T]を使用すると、等式(4)は次のとおりになる。
Figure 2009510938
16の(N)基底画像を重み付け(スケーリング)するため[w]で個別の変換係数(重み)を使用することによって形成される16(N、ここでN=4)の行列を合計することにより、復元行列[Y]全体を計算できる。行列全体を計算するにあたり、これは高速変換法と比べて効率のよい方法ではない。ただし、行、列等のサブセットの復元は、基底画像の使用により高速変換より効率よく果たすことができる。
残差4x4ブロックのH.264 4x4整数変換プロセスと関連する16の基底画像は次のとおりになり、ここでsij(i,j∈{0,1,2,3})は、i番目の水平周波数チャネルとj番目の垂直周波数チャネルとに関連する基底画像である。
Figure 2009510938
これらの16の基底画像を念入りに調べると、スケール係数を除き、最後の列に4つの別個のベクトルがあることが分かる。4x1行列/ベクトルである最後の列は四次元ベクトル空間の中にあり、正確に4つの基底ベクトルで表すことができるから、これは直観的に明白である。
ビットストリームの中で受信された量子化変換係数(すなわちレベル、zij i,j∈{0,1,2,3})はリスケーリング(脱量子化)され、係数w’ij i,j∈{0,1,2,3}が生成される。これらの脱量子化変換係数w’ij i,j∈{0,1,2,3}は、逆変換プロセスを模擬するため(つまり、合成プロセスで基底画像に重み付けする重みを生成するため)、組み合わせのグループに分解でき、基底画像の最終列(またはベクトル)で乗算できる。この考察は、図8の位置{d h l p}に対応する4x4残差信号
Figure 2009510938
の最終列の復元式を次のとおりに書けることを意味する。
Figure 2009510938
上の4セットの括弧の中で4通りのスカラ量組み合わせw’ijを計算したら、右シフトと加算/減算を用いて各基底ベクトルのスケーリング/計算を完了できる。次に、復元サンプルの計算は単純である。フレームの左端かスライス境界の右真横から始めることにより、空間予測モード2(DC)を使用できること、そして全ての画素が128に等しい基準(または予測)値(上の等式(1)でpを参照せよ)を持つことは分かっている。よって、この第1の最左ブロックで位置{d h l p}に対応する復元サンプル[r]は次のとおりに計算できる。
Figure 2009510938
ここで、復元残差値
Figure 2009510938
は等式(7)で計算する。次に、このブロックの右にある4x4ブロックは、左にあるブロックからしかるべき復元値を使用することによって計算でき、等式(1)の予測信号成分pが生成される(生成される予測信号値は、復元する4x4ブロックの符号化に使われた空間予測モードがどれかに依存する)。今度は、スライス境界の下に位置する他の4x4ブロックで予測値を計算する例を説明する。
図11は、スライス境界の直下に位置するマルチメディアサンプルの一部分を図解する。画素はルミナンス値とクロミナンス値とを備えることができる。画素位置{q r s t}は、画素値[rを持つ復元済みの位置を表す(例えば上の等式7を用いて計算)。画素位置{d h l p}の残差信号成分値
Figure 2009510938
の復元後には、同じ位置{d h l p}の予測信号成分値[pが生成され、等式(1)による復元は締めくくられる。画素{d h l p}を収容するイントラ4x4符号化4x4ブロックがスライス境界の直下にあるなら、この4x4ブロックで予測信号の生成に使われたかもしれないイントラ4x4空間予測モードは次のいずれかになる。
1.イントラ4x4空間予測モード1(水平):
図11に関し、予測信号成分値は、0回の加算と、0回の算術シフトと、0回の乗算とを備える次式によって与えられる。
Figure 2009510938
2.イントラ4x4空間予測モード2(DC):
もしも位置{q r s t}の画素が使用できないなら、予測信号成分値は、0回の加算と、0回の算術シフトと、0回の乗算とを備える次式によって与えられる。
Figure 2009510938
もしも{q r s t}を使用できるなら、予測信号成分値は、4回の加算と、1回の算術シフトと、0回の乗算とを備える次式によって与えられる。
Figure 2009510938
ここでu=((r + r + r + r)+2)>>2
3.イントラ4x4空間予測モード8(水平−上):
予測信号成分値は、6回の加算、4回の算術シフト、及び0回の乗算、または8回の加算、2回の算術シフト、及び0回の乗算を備える次式によって与えられる。
Figure 2009510938
リスケーリングプロセス(w’ij i,j∈{0,1,2,3}を生成するためzij i,j∈{0,1,2,3}を脱量子化する)に関するもうひとつの考察は、演算上の大幅な節約につながるもうひとつの源泉を明らかにする。zij i,j∈{0,1,2,3}のスケーリングに使用するリスケーリング係数vij i,j∈{0,1,2,3}は、量子化パラメータに対するその依存性に加えて、4x4行列の中で以下の位置関係構造を持ち、
v 00 v 10 v 20 v 30
v 01 v 11 v 21 v 31
v 02 v 12 v 22 v 32
v 03 v 13 v 23 v 33
ここで、[v00, v20, v02, v22]、[v11, v31, v13, v33]、及び[v10, v30, v01, v21, v12, v32, v03, v23]を含む3グループのリスケーリング係数はそれぞれ、所与の量子化パラメータQPに対し同じ値を持つ。これは、zijからのw’ij生成に伴う乗算数を減らすため有利に利用できる。4x4残差信号の最終列を復元する上記の重み付き基底ベクトル総和式(等式7)において、基底ベクトル[1 1 1 1 1]を重み付けする第1の重みが、これら2つの重みの個々の値ではなく、w’00とw’20の和を含むことに注意されたい。したがって、2つの値w’00及びw’20を個別に計算し、それらを合計するなら、通常ならば2回の整数乗算を伴うことになるが、代わりにz00とz20を先に加算し、この和をv00=v20でリスケーリングすれば、(w’00+w’20)で1回の整数乗算により同じ最終値を得ることができる。
この部分復号化を実行する演算ステップの直接的な削減のほか、4x4残差信号の所望の最終列と最初(最上位)の行を計算する高速アルゴリズムを設計することもできる。
この部分復号化プロセスで演算ステップ数の削減をもたらすもうひとつの事実として、ほとんどの場合、残差信号ブロックの中の最大16の量子化係数の内、ごく僅かは、通常ならば5未満は、実際には非ゼロである。上述の内容と併せてこの事実を利用することにより、必要乗算数をさらに減らす(ほぼ半減させる)ことができる。
当業者なら、列、行、項、またはこれらの部分及び/または組み合わせを復元するため、上の等式(7)に類似する式を導き出せることを認めるであろう。例えば、基底画像の最上行の値(上の等式6a乃至6p)に対応する変換係数w’ijを組み合わせることにより、左のブロックの同じ4つの画素位置{d h l p}に依存する、スライス境界の直下にある画素を復元できる(図11で画素位置{A B C D}を参照せよ)。これらの方法を用いて復元できるマルチメディアサンプルの他のサブセットは、当業者にとって明白となるであろう。
図12は、図1に図解されたシステム等で使用できる復号化装置150のもうひとつの例を図解する機能ブロック図である。この態様は、マルチメディアデータに関連する変換係数を受信する手段と、復元の対象となる1セットのマルチメディアサンプルを決定する第1の決定手段(determiner means)と、復元の対象となるマルチメディアサンプルに基づき1セットの受信変換係数を決定する第2の決定手段と、1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため1セットの決定された変換係数を処理する生成手段とを含む。この態様のいくつかの例は、受信手段が受信器202を備える場合と、第1の決定手段がマルチメディアサンプル決定器204を備える場合と、第2の決定手段が変換係数決定器206を備える場合と、生成手段が復元サンプル生成器208を備える場合とを含む。
図13は、図1に図解されたシステム等で使用できる復号化装置150のもうひとつの例を図解する機能ブロック図である。この態様は、マルチメディアデータに関連する変換係数を受信する手段と、復元の対象となる1セットのマルチメディアサンプルを決定する第1の決定手段と、復元の対象となるマルチメディアサンプルに基づき1セットの受信変換係数を決定する第2の決定手段と、1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため1セットの決定された変換係数を処理する生成手段とを含む。この態様のいくつかの例は、受信手段が受信モジュール1302を備える場合と、第1の決定手段が復元対象サンプル決定モジュール1304を備える場合と、第2の決定手段が変換係数決定モジュール1306を備える場合と、生成手段が変換係数処理モジュール1308を備える場合とを含む。
当業者は、様々な技術・手法のいずれかを用いて情報と信号を表現できることを理解するであろう。例えば、上の説明の全体を通じて言及されているデータ、命令、コマンド、情報、信号、ビット、シンボル、及びチップは、電圧、電流、電磁波、磁場または磁性粒子、光場または光粒子、またはこれらの組み合わせによって表現できる。
当業者はさらに、ここに開示する例との関係で説明した様々な例証的論理ブロック、モジュール、及びアルゴリズムステップを、電子ハードウェア、ファームウェア、コンピュータソフトウェア、ミドルウェア、マイクロコード、またはこれらの組み合わせとして実装できることを認めるであろう。このハードウェア及びソフトウェアの互換性を明確に例証するため、様々な例証的コンポーネント、ブロック、モジュール、回路、及びステップを、概してそれらの機能の観点から、上述した。かかる機能をハードウェアまたはソフトウェアとして実装するか否かは、特定のアプリケーションとシステム全体にかかる制約次第で決まる。当業者は、説明した機能をアプリケーションごとに異なるやり方で実装できるが、かかる実装決定は、開示される方法の範囲からの逸脱を招くものと解釈されるべきではない。
ここに開示する例との関係で説明した様々な例証的論理ブロック、コンポーネント、モジュール、及び回路は、ここで説明した機能を遂行するよう設計された汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラム可能ゲートアレイ(FPGA)またはその他プログラム可能論理素子、個別ゲートまたはトランジスタロジック、個別ハードウェアコンポーネント、またはこれらの組み合わせにより実装または遂行できる。汎用プロセッサはマイクロプロセッサであってよく、ただし代案において、プロセッサは従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であってよい。プロセッサはまた、演算装置の組み合わせ、例えばDSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアまたはASICコアと連動する1つ以上のマイクロプロセッサ、または他の何らかのかかる構成として、実装できる。
ここに開示する例との関係で説明した方法またはアルゴリズムのステップは、ハードウェアで直接的に、プロセッサによって実行されるソフトウェアモジュールで、または両者の組み合わせで、具現できる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、光学式記憶媒体、または当技術で公知の他の何らかの形をとる記憶媒体の中にあってよい。代表的記憶媒体はプロセッサへ結合され、かくしてプロセッサは記憶媒体から情報を読み取ることができ、且つこれへ情報を書き込むことができる。代案において、記憶媒体はプロセッサへ一体化されてよい。プロセッサと記憶媒体は特定用途向け集積回路(ASIC)の中にあってよい。ASICは無線モデムの中にあってよい。代案において、プロセッサと記憶媒体は個別コンポーネントとして無線モデムの中にあってよい。
開示された例の先の説明は、当業者が開示された方法及び装置を製作または使用することを可能にするため提供されている。これらの例に対する様々な修正は当業者にとって容易く明白となるであろうし、ここに定める原理は他の例に応用でき、さらなる要素を追加できる。
以上、マルチメディアデータの高能率部分復号化を遂行する方法及び装置を説明した。
一態様に従いマルチメディア通信システムを図解するブロック図である。 図1に図解されたシステム等で使用できる復号化装置の一態様を図解するブロック図である。 図1に図解されたシステム等で使用できる復号化装置のコンピュータプロセッサシステムの一例を図解するブロック図である。 図1に図解されたシステム等で映像ストリームの一部分を復号化する方法の一例を図解するフローチャートである。 図1に図解されたシステム等で映像ストリームの一部分を復号化する方法のもうひとつの例をより詳細に図解するフローチャートである。 4x4ブロックとこれを取り囲む因果的近傍画素の詳細な図を示す。 H.264におけるブロックの指向特性の説明に役立つ9つの指向性モード(0−8)を図解する指向性モード図を示す。 1つ以上のスライス境界のすぐ下と右とに位置するイントラ符号化4x4画素ブロックの一例を図解する。 近傍画素とイントラ符号化4x4画素ブロックの中にある画素の名称を図解する。 スライス境界のすぐ下と右とに位置するイントラ符号化16x16 ルミナンスマクロブロックの一例を図解する。 スライス境界のすぐ下と右とに位置するイントラ符号化8x8 クロミナンスブロックの一例を図解する。 スライス境界のすぐ下に位置するマルチメディアサンプルの一部分を図解する。 図1に図解されたシステム等で使用できる復号化装置のもうひとつの例を図解するブロック図である。 図1に図解されたシステム等で使用できる復号化装置150のもうひとつの例を図解するブロック図。

Claims (65)

  1. マルチメディアデータを処理する方法であって、
    前記マルチメディアデータに関連する変換係数を受信することと、
    復元の対象となる1セットのマルチメディアサンプルを決定することと、
    復元の対象となる前記マルチメディアサンプルに基づき1セットの前記受信変換係数を決定することと、
    前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため前記1セットの決定された変換係数を処理することと、
    を備える方法。
  2. 処理することは、前記1セットの前記変換係数をスケーリングすることを備える、請求項1に記載の方法。
  3. 前記変換係数をスケーリングすることは、脱量子化することを備える、請求項2に記載の方法。
  4. 前記1セットの決定されたマルチメディアサンプルは、他のマルチメディアサンプルの符号化にあたって基準となるマルチメディアサンプルを備える、請求項1に記載の方法。
  5. 前記1セットの決定されたマルチメディアサンプルは、第2のマルチメディアデータスライスに隣接する第1のマルチメディアデータスライス内にマルチメディアサンプルを備える、請求項1に記載の方法。
  6. 前記受信変換済み係数は、1セットとして変換されるマルチメディアサンプル行列と関連し、前記復元サンプルは、前記マルチメディアサンプル行列のサブセットを備える、請求項1に記載の方法。
  7. 処理することは、前記1セットの決定された変換係数を複数のグループに分割することを備える、請求項1に記載の方法。
  8. 前記処理することはさらに、各グループにつき値を計算することを備え、ここで前記計算は、前記変換係数を生成した符号化方法に基づく、請求項7に記載の方法。
  9. 前記処理することはさらに、
    前記変換係数を生成した前記符号化方法に基づき各グループにつき配列を決定することと、
    前記値と前記配列とに基づき前記マルチメディアデータの前記1セットの復元サンプルを生成することとを備える、請求項8に記載の方法。
  10. 前記復元サンプルに基づき1セットの隠蔽マルチメディアサンプルを推定することをさらに備える、請求項1に記載の方法。
  11. 前記1セットの推定隠蔽マルチメディアサンプルに対応する1セットの変換係数を生成することをさらに備える、請求項10に記載の方法。
  12. 前記復元サンプルは、前記1セットの推定隠蔽マルチメディアサンプルに対し非因果的である、請求項10に記載の方法。
  13. さらに、
    各復元サンプルに関連する指向性モードインジケータを受信することと、
    前記復元サンプルと前記指向性モードインジケータとに基づき1セットの隠蔽マルチメディアサンプルを推定することとを備える、請求項1に記載の方法。
  14. マルチメディアデータプロセッサであって、
    マルチメディアデータに関連する変換係数を受信し、
    復元の対象となる1セットのマルチメディアサンプルを決定し、
    復元の対象となる前記マルチメディアサンプルに基づき1セットの前記受信変換係数を決定し、且つ
    前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため前記1セットの決定された変換係数を処理するよう構成される、
    マルチメディアデータプロセッサ。
  15. 前記マルチメディアデータプロセッサはさらに、前記1セットの決定された変換係数をスケーリングするよう構成される、請求項14に記載のマルチメディアデータプロセッサ。
  16. 前記マルチメディアデータプロセッサはさらに、前記1セットの変換係数を脱量子化するよう構成される、請求項14に記載のマルチメディアデータプロセッサ。
  17. 前記1セットのマルチメディアサンプルは、他のマルチメディアサンプルの符号化にあたって基準となるマルチメディアサンプルを備える、請求項14に記載のマルチメディアデータプロセッサ。
  18. 前記1セットの決定されたマルチメディアサンプルは、第2のマルチメディアデータスライスに隣接する第1のマルチメディアデータスライス内にマルチメディアサンプルを備える、請求項14に記載のマルチメディアデータプロセッサ。
  19. 前記受信変換済み係数は、1セットとして変換されるマルチメディアサンプル行列と関連し、前記復元サンプルは、前記マルチメディアサンプル行列のサブセットを備える、請求項14に記載のマルチメディアデータプロセッサ。
  20. 前記マルチメディアデータプロセッサはさらに、前記1セットの決定された変換係数を複数のグループに分割するよう構成される、請求項14に記載のマルチメディアデータプロセッサ。
  21. 前記マルチメディアデータプロセッサはさらに、各グループにつき値を計算するよう構成され、ここで前記計算は、前記変換係数を生成した符号化方法に基づく、請求項20に記載のマルチメディアデータプロセッサ。
  22. 前記マルチメディアデータプロセッサはさらに、
    前記変換係数を生成した前記符号化方法に基づき各グループにつき配列を決定し、且つ
    前記値と前記配列とに基づき前記マルチメディアデータの前記1セットの復元サンプルを生成するよう構成される、請求項21に記載のマルチメディアデータプロセッサ。
  23. 前記マルチメディアデータプロセッサはさらに、前記復元サンプルに基づき1セットの隠蔽マルチメディアサンプルを推定するよう構成される、請求項14に記載のマルチメディアデータプロセッサ。
  24. 前記マルチメディアデータプロセッサはさらに、前記1セットの推定隠蔽マルチメディアサンプルに対応する1セットの変換係数を生成するよう構成される、請求項23に記載のマルチメディアデータプロセッサ。
  25. 前記復元サンプルは、前記1セットの推定隠蔽マルチメディアサンプルに対し非因果的である、請求項23に記載のマルチメディアデータプロセッサ。
  26. 前記マルチメディアデータプロセッサはさらに、
    各復元サンプルに関連する指向性モードインジケータを受信し、且つ
    前記復元サンプルと前記指向性モードインジケータとに基づき1セットの隠蔽マルチメディアサンプルを推定するよう構成される、請求項14に記載のマルチメディアデータプロセッサ。
  27. マルチメディアデータを処理する装置であって、
    マルチメディアデータに関連する変換係数を受信する受信器と、
    復元の対象となる1セットのマルチメディアサンプルを決定する第1の決定器と、
    復元の対象となる前記マルチメディアサンプルに基づき1セットの前記受信変換係数を決定する第2の決定器と、
    前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため前記1セットの決定された変換係数を処理する生成器と、
    を備える、装置。
  28. 前記生成器は、前記1セットの決定された変換係数をスケーリングする、請求項27に記載の装置。
  29. 前記生成器は、前記1セットの決定された変換係数を脱量子化する、請求項27に記載の装置。
  30. 前記1セットのマルチメディアサンプルは、他のマルチメディアサンプルの符号化にあたって基準となるマルチメディアサンプルを備える、請求項27に記載の方法。
  31. 前記1セットの決定されたマルチメディアサンプルは、第2のマルチメディアデータスライスに隣接する第1のマルチメディアデータスライス内にマルチメディアサンプルを備える、請求項27に記載の方法。
  32. 前記受信変換済み係数は、1セットとして変換されるマルチメディアサンプル行列と関連し、前記復元サンプルは、前記マルチメディアサンプル行列のサブセットを備える、請求項27に記載の装置。
  33. 前記生成器は、前記1セットの決定された変換係数を複数のグループに分割する、請求項27に記載の装置。
  34. 前記生成器は、各グループにつき値を計算し、ここで前記計算は、前記変換係数を生成した符号化方法に基づく、請求項33に記載の装置。
  35. 前記生成器は、前記変換係数を生成した前記符号化方法に基づき各グループにつき配列を決定し、且つ前記値と前記配列とに基づき前記マルチメディアデータの前記1セットの復元サンプルを生成する、請求項34に記載の装置。
  36. 前記復元サンプルに基づき1セットの隠蔽マルチメディアサンプルを推定する推定器をさらに備える、請求項27に記載の装置。
  37. 前記推定器は、前記1セットの推定隠蔽マルチメディアサンプルに対応する1セットの変換係数を生成する、請求項36に記載の装置。
  38. 前記復元サンプルは、前記1セットの推定隠蔽マルチメディアサンプルに対し非因果的である、請求項36に記載の装置。
  39. 前記受信器は、各復元サンプルに関連する指向性モードインジケータを受信し、前記装置はさらに、前記復元サンプルと前記指向性モードインジケータとに基づき1セットの隠蔽マルチメディアサンプルを推定する推定器を備える、請求項27に記載の装置。
  40. マルチメディアデータを処理する装置であって、
    マルチメディアデータに関連する変換係数を受信する手段と、
    復元の対象となる1セットのマルチメディアサンプルを決定する第1の決定手段と、
    復元の対象となる前記マルチメディアサンプルに基づき1セットの前記受信変換係数を決定する第2の決定手段と、
    前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため前記1セットの決定された変換係数を処理する生成手段と、
    を備える、装置。
  41. 前記生成手段は、前記1セットの決定された変換係数をスケーリングする、請求項40に記載の装置。
  42. 前記生成手段は、前記1セットの決定された変換係数を脱量子化する、請求項40に記載の装置。
  43. 前記1セットのマルチメディアサンプルは、他のマルチメディアサンプルの符号化にあたって基準となるマルチメディアサンプルを備える、請求項40に記載のマルチメディアデータプロセッサ。
  44. 前記1セットのマルチメディアサンプルは、第2のマルチメディアデータスライスに隣接する第1のマルチメディアデータスライス内にマルチメディアサンプルを備える、請求項40に記載のマルチメディアデータプロセッサ。
  45. 前記受信変換済み係数は、1セットとして変換されるマルチメディアサンプル行列と関連し、前記復元サンプルは、前記マルチメディアサンプル行列のサブセットを備える、請求項40に記載の装置。
  46. 前記生成手段は、前記1セットの決定された変換係数を複数のグループに分割する、請求項40に記載の装置。
  47. 前記生成手段は、各グループにつき値を計算し、ここで前記計算は、前記変換係数を生成した符号化方法に基づく、請求項46に記載の装置。
  48. 前記生成手段は、前記変換係数を生成した前記符号化方法に基づき各グループにつき配列を決定し、且つ前記値と前記配列とに基づき前記マルチメディアデータの前記1セットの復元サンプルを生成する、請求項47に記載の装置。
  49. 前記復元サンプルに基づき1セットの隠蔽マルチメディアサンプルを推定する手段をさらに備える、請求項40に記載の装置。
  50. 前記推定手段は、前記1セットの推定隠蔽マルチメディアサンプルに対応する1セットの変換係数を生成する、請求項49に記載の装置。
  51. 前記復元サンプルは、前記1セットの推定隠蔽マルチメディアサンプルに対し非因果的である、請求項49に記載の装置。
  52. 前記受信手段は、各復元サンプルに関連する指向性モードインジケータを受信し、前記装置はさらに、前記復元サンプルと前記指向性モードインジケータとに基づき1セットの隠蔽マルチメディアサンプルを推定する手段を備える、請求項40に記載の装置。
  53. 命令を備えるマシン可読媒体であって、同命令は実行時にマシンに、
    マルチメディアデータに関連する変換係数を受信させ、
    復元の対象となる1セットのマルチメディアサンプルを決定させ、
    復元の対象となる前記マルチメディアサンプルに基づき1セットの前記受信変換係数を決定させ、且つ
    前記1セットの決定されたマルチメディアサンプルに対応する復元サンプルを生成するため前記1セットの決定された変換係数を処理させる、
    マシン可読媒体。
  54. 前記命令はさらに、前記マシンに、前記1セットの決定された変換係数をスケーリングさせる、請求項53に記載のマシン可読媒体。
  55. 前記命令はさらに、前記マシンに、前記1セットの決定された変換係数を脱量子化させる、請求項53に記載のマシン可読媒体。
  56. 前記1セットのマルチメディアサンプルは、他のマルチメディアサンプルの符号化にあたって基準となるマルチメディアサンプルを備える、請求項53に記載のマシン可読媒体。
  57. 前記1セットのマルチメディアサンプルは、第2のマルチメディアデータスライスに隣接する第1のマルチメディアデータスライス内にマルチメディアサンプルを備える、請求項53に記載のマシン可読媒体。
  58. 前記受信変換済み係数は、1セットとして変換されるマルチメディアサンプル行列と関連し、前記復元サンプルは、前記マルチメディアサンプル行列のサブセットを備える、請求項53に記載のマシン可読媒体。
  59. 前記命令はさらに、前記マシンに、前記1セットの決定された変換係数を複数のグループに分割させる、請求項53に記載のマシン可読媒体。
  60. 前記命令はさらに、前記マシンに、各グループにつき値を計算させ、ここで前記計算は、前記変換係数を生成した符号化方法に基づく、請求項59に記載のマシン可読媒体。
  61. 前記命令はさらに、前記マシンに、
    前記変換係数を生成した前記符号化方法に基づき各グループにつき配列を決定させ、且つ
    前記値と前記配列とに基づき前記マルチメディアデータの前記1セットの復元サンプルを生成させる、請求項60に記載のマシン可読媒体。
  62. 前記命令はさらに、前記マシンに、前記復元サンプルに基づき1セットの隠蔽マルチメディアサンプルを推定させる、請求項53に記載のマシン可読媒体。
  63. 前記命令はさらに、前記マシンに、前記1セットの推定隠蔽マルチメディアサンプルに対応する1セットの変換係数を生成させる、請求項62に記載のマシン可読媒体。
  64. 前記復元サンプルは、前記1セットの推定隠蔽マルチメディアサンプルに対し非因果的である、請求項62に記載のマシン可読媒体。
  65. 前記命令はさらに、前記マシンに、
    各復元サンプルに関連する指向性モードインジケータを受信させ、且つ
    前記復元サンプルと前記指向性モードインジケータとに基づき1セットの隠蔽マルチメディアサンプルを推定させる、請求項53に記載のマシン可読媒体。
JP2008533642A 2005-09-27 2006-09-27 H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法 Withdrawn JP2009510938A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72137705P 2005-09-27 2005-09-27
PCT/US2006/037996 WO2007038727A2 (en) 2005-09-27 2006-09-27 Video encoding method enabling highly efficient partial decoding of h.264 and other transform coded information

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012139624A Division JP2012231505A (ja) 2005-09-27 2012-06-21 H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法

Publications (1)

Publication Number Publication Date
JP2009510938A true JP2009510938A (ja) 2009-03-12

Family

ID=37835195

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008533642A Withdrawn JP2009510938A (ja) 2005-09-27 2006-09-27 H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法
JP2012139624A Pending JP2012231505A (ja) 2005-09-27 2012-06-21 H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2012139624A Pending JP2012231505A (ja) 2005-09-27 2012-06-21 H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法

Country Status (7)

Country Link
EP (1) EP1941742A2 (ja)
JP (2) JP2009510938A (ja)
KR (1) KR100984650B1 (ja)
CN (1) CN101310536B (ja)
AR (1) AR055185A1 (ja)
TW (1) TW200719726A (ja)
WO (1) WO2007038727A2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8660176B2 (en) 2008-09-26 2014-02-25 Qualcomm Incorporated Resolving geometric relationships among video data units
US8634457B2 (en) 2008-09-26 2014-01-21 Qualcomm Incorporated Determining availability of video data units
US8724697B2 (en) 2008-09-26 2014-05-13 Qualcomm Incorporated Locating motion vectors for video data units
KR101619972B1 (ko) * 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
CN113556556A (zh) * 2010-04-13 2021-10-26 Ge视频压缩有限责任公司 显著性图和变换系数块的编码
EP2727363B1 (en) 2011-06-28 2020-11-18 HFI Innovation Inc. Method and apparatus of intra mode coding
CN113411584A (zh) * 2020-03-17 2021-09-17 北京三星通信技术研究有限公司 视频编解码的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01141481A (ja) * 1987-11-27 1989-06-02 Matsushita Electric Ind Co Ltd 画像処理装置
JPH1032818A (ja) * 1996-07-18 1998-02-03 Sanyo Electric Co Ltd 画像表示方法
WO2004064397A1 (en) * 2003-01-10 2004-07-29 Thomson Licensing S.A. Spatial error concealment based on the intra-prediction modes transmitted in a coded stream
WO2004064406A1 (en) * 2003-01-10 2004-07-29 Thomson Licensing S.A. Defining interpolation filters for error concealment in a coded image

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2263373B (en) * 1992-01-09 1995-05-24 Sony Broadcast & Communication Data error concealment
US5532837A (en) * 1992-12-18 1996-07-02 Matsushita Electric Industrial Co., Ltd. Digital video signal processing apparatus
US5621467A (en) * 1995-02-16 1997-04-15 Thomson Multimedia S.A. Temporal-spatial error concealment apparatus and method for video signal processors
JP2001086504A (ja) * 1999-09-09 2001-03-30 Toshiba Digital Media Engineering Corp Mpegビデオ復号化装置
US6662329B1 (en) * 2000-03-23 2003-12-09 International Business Machines Corporation Processing errors in MPEG data as it is sent to a fixed storage device
EP1553782A3 (en) * 2002-05-28 2005-07-27 Sharp Kabushiki Kaisha Methods and systems for image intra-prediction mode estimation, communication, and organization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01141481A (ja) * 1987-11-27 1989-06-02 Matsushita Electric Ind Co Ltd 画像処理装置
JPH1032818A (ja) * 1996-07-18 1998-02-03 Sanyo Electric Co Ltd 画像表示方法
WO2004064397A1 (en) * 2003-01-10 2004-07-29 Thomson Licensing S.A. Spatial error concealment based on the intra-prediction modes transmitted in a coded stream
WO2004064406A1 (en) * 2003-01-10 2004-07-29 Thomson Licensing S.A. Defining interpolation filters for error concealment in a coded image

Also Published As

Publication number Publication date
KR20080066714A (ko) 2008-07-16
WO2007038727A2 (en) 2007-04-05
KR100984650B1 (ko) 2010-10-01
CN101310536B (zh) 2010-06-02
JP2012231505A (ja) 2012-11-22
EP1941742A2 (en) 2008-07-09
WO2007038727A3 (en) 2007-08-02
AR055185A1 (es) 2007-08-08
TW200719726A (en) 2007-05-16
CN101310536A (zh) 2008-11-19

Similar Documents

Publication Publication Date Title
US9055298B2 (en) Video encoding method enabling highly efficient partial decoding of H.264 and other transform coded information
US9058659B2 (en) Methods and apparatuses for encoding/decoding high resolution images
US8165195B2 (en) Method of and apparatus for video intraprediction encoding/decoding
US8761503B2 (en) Image encoding/decoding method and apparatus
RU2406255C2 (ru) Прогнозирование коэффициентов преобразования для сжатия изображения
JP2023179682A (ja) 隣接サンプル減少を伴う線形またはアフィン変換を使用するイントラ予測
JP5529537B2 (ja) 複数経路ビデオ符号化及び復号化のための方法及び装置
JP5918328B2 (ja) 画像符号化方法及び画像復号方法
CN107347154B (zh) 用于编码和解码图像的方法、编码和解码设备、以及相应的计算机程序
US20130089265A1 (en) Method for encoding/decoding high-resolution image and device for performing same
US7995848B2 (en) Method and apparatus for encoding and decoding image data
US9852521B2 (en) Image coding device, image decoding device, methods thereof, and programs
JP2012231505A (ja) H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法
JP2015156647A (ja) マッピングされた変換と走査モードとを使用するビデオコード化
EP1997317A1 (en) Image encoding/decoding method and apparatus
JP2007166617A (ja) 映像のイントラ予測符号化、復号化方法及び装置
WO2008020687A1 (en) Image encoding/decoding method and apparatus
US20110243227A1 (en) Moving picture decoding method and device, and moving picture encoding method and device
US8594189B1 (en) Apparatus and method for coding video using consistent regions and resolution scaling
US20130070846A1 (en) Motion vector encoding/decoding method and apparatus using a motion vector resolution combination, and image encoding/decoding method and apparatus using same
US20060146183A1 (en) Image processing apparatus, encoding device, and methods of same
Lee et al. A new intra prediction method using channel correlations for the H. 264/AVC intra coding
JP2006074520A (ja) 動きベクトル検出装置
JP2006060538A (ja) 符号化モード選択装置及び符号化モード選択プログラム
JP2012209873A (ja) 動画像符号化装置及び動画像符号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110304

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110311

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120621

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120629

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120717

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20120816