JP2008536451A - 空間スケーラブルビデオ符号化及び復号化向けスライス適応型動きベクトル符号化のための方法及び装置 - Google Patents

空間スケーラブルビデオ符号化及び復号化向けスライス適応型動きベクトル符号化のための方法及び装置 Download PDF

Info

Publication number
JP2008536451A
JP2008536451A JP2008506472A JP2008506472A JP2008536451A JP 2008536451 A JP2008536451 A JP 2008536451A JP 2008506472 A JP2008506472 A JP 2008506472A JP 2008506472 A JP2008506472 A JP 2008506472A JP 2008536451 A JP2008536451 A JP 2008536451A
Authority
JP
Japan
Prior art keywords
scalable
slice
motion vector
decoder
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008506472A
Other languages
English (en)
Inventor
イン,ペン
ボイス,ジル,マクドナルド
パンディット,パーヴィン,ビバス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2008536451A publication Critical patent/JP2008536451A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

スケーラブルビデオ符号化及び復号化向けの空間スケーラブルビデオエンコーダ及びデコーダ並びに対応する方法が提供される。空間スケーラブルビデオ符号化の方法は、スライス毎に動きベクトルのスケーラブル符号化とノンスケーラブル符号化の間で選択することを含む。

Description

本発明は、ビデオエンコーダ及びデコーダ全般に関し、より詳細には、空間スケーラブルビデオ符号化及び復号化向けのスライス適応型動きベクトル符号化のための方法及び装置に関する。
本出願は、2005年4月14日に提出された“SLICE ADAPTIVE MOTION VECTOR CODING FOR SPATIAL SCALABLE VIDEO CODING”と題された米国仮出願60/671,257号の利益を特許請求するものであり、その内容はその完全な形で引用により盛り込まれる。
スケーラブルビデオ符号化スキームは、サイマル放送の符号かのビットレートペナルティを受けることなしに、異なるアプリケーション及びデコーダ要件をサポートすることが望ましい。動き予測及び補償が時間的な冗長度を除くために適用される多くの既存のスケーラブル符号化スキームについて、動きベクトルを符号化するために使用される従来技術のアプローチは、問題を有している。一般に、ノンスケーラブル動きベクトル符号化及びスケーラブル動きベクトル符号化といった2つの方法は、動きベクトルを符号化するために使用されている。ノンスケーラブル動きベクトル符号化スキームでは、動きベクトルは、最も高いエンハンスメントレイヤの精度で符号化され、ベースレイヤに記憶される。次いで、下位レイヤについて、動きベクトルは、ダウンサンプリングされる必要がある。スケーラブル動きベクトル符号化スキームでは、下位レイヤの動きベクトルのリファインメントは、符号化された動きベクトルがその上位レイヤについての動きベクトルの精度を表すように、それぞれの上位レイヤで符号化される。全体のビットレートの符号化効率について、ノンスケーラブル動きベクトルの符号化は、スケーラブル動きベクトル符号化よりも良好な効率を有する。しかし、ノンスケーラブル動きベクトル符号化は、動きベクトルの全てのビットをベースレイヤに配置する。したがって、ビットレートスケーラビリティが必要とされる場合、ノンスケーラブル動きベクトル符号化は、ベースレイヤの品質を損傷する。ノンスケーラブル動きベクトル符号化は下位レイヤについてダウンサンプリングを必要とするので、規格に準拠しないベースレイヤの問題を引き起こす。デコーダのなかには、係る特徴をサポートすることができない場合がある。他方で、ビットレートスケーラビリティが要件ではないが、代わりにブロードキャストビデオアプリケーションにおけるように複雑さ及び全体のビットレート符号化効率が要件である場合、ノンスケーラブル動きベクトル符号化は、良好な符号化効率を有する。
多くの異なるスケーラビリティの方法は、MPEG−2及びMPEG−4規格のスケーラビリティプロファイルにおいて、SNRスケーラビリティ、空間スケーラビリティ、時間スケーラビリティ、及びファイングレインスケーラビリティを含めて、広く研究され、標準化されている。スケーラブル符号化における研究の大部分は、下位の解像度のレイヤが制限された帯域幅を有するビットレートスケーラビリティを狙いとしている。図1に示されるように、典型的な空間スケーラビリティシステムは、参照符号100により一般に示される。システム100は、ビデオ系列を受信するために複雑度スケーラブルなビデオエンコーダ110を含む。複雑度スケーラブルなビデオエンコーダ110の第一の出力は、シグナルコミュニケーションで、低帯域幅ネットワーク120及びマルチプレクサ130の第一の入力と接続される。複雑度スケーラブルビデオエンコーダ110の第二の出力は、シグナルコミュニケーションで、マルチプレクサ130の第二の入力と接続される。低帯域幅のネットワーク120の出力は、シグナルコミュニケーションで、低解像度のデコーダ140の入力と接続されている。マルチプレクサ130の出力は、シグナルコミュニケーションで、高帯域幅のネットワーク150の入力と接続される。高帯域幅のネットワーク150の出力は、シグナルコミュニケーションで、デマルチプレクサ160の入力と接続される。デマルチプレクサ160の第一の出力は、シグナルコミュニケーションで、高解像度デコーダ170の第一の入力と接続され、デマルチプレクサ160の第二の出力は、シグナルコミュニケーションで、高解像度デコーダ170の第二の入力と接続される。低解像度デコーダ140の出力は、ベースレイヤビットストリームのシステム100の出力として利用可能であり、高解像度デコーダ170の出力は、スケーラブルビットストリームについてシステム100の出力として利用可能である。
スケーラブル符号化は、エンコーダ及びデコーダの複雑度における大幅な増加のため、スケーラブルエンコーダの符号化効率がノンスケーラブルエンコーダの符号化効率以下で典型的に良好であるため、実際に広く適用されていない。
空間スケーラブルエンコーダ及びデコーダは、高解像度のスケーラブルエンコーダ/デコーダがノーマルの高解像度エンコーダ/デコーダに存在するよりも更なる機能を提供することを典型的に必要とする。MPEG−2空間スケーラブルエンコーダでは、予測が低解像度の参照ピクチャから行われるか、高解像度の参照ピクチャから行われるかに関する判定が行われる。MPEG−2空間スケーラブルデコーダは、低解像度の参照ピクチャ又は高解像度の参照ピクチャのいずれかから予測が可能である必要がある。MPEG−2空間スケーラブルエンコーダ/デコーダにより、2セットの参照ピクチャストアが必要とされ、一方は低解像度ピクチャ用であり、他方は高解像度ピクチャ用である。図2は、従来技術に係る2つのレイヤをサポートする低解像度の空間スケーラブルエンコーダ200のブロック図を示す。図3は、従来技術に係る、2つのレイヤをサポートする低い複雑度の空間スケーラブルデコーダ300のブロック図を示す。
図2に戻り、2つのレイヤをサポートする空間スケーラブルビデオエンコーダは、参照符号200により全般的に示される。ビデオエンコーダ200は、高解像度の入力ビデオ系列を受信するダウンサンプラ210を含む。ダウンサンプラ210は、低解像度のノンスケーラブルエンコーダ212とシグナルコミュニケーションで結合され、エンコーダ212は、低解像度フレームストア214とシグナルコミュニケーションで結合される。低解像度のノンスケーラブルエンコーダ212は、低解像度のビットストリームを出力し、低解像度のノンスケーラブルデコーダ220とシグナルコミュニケーションで更に結合される。
低解像度のノンスケーラブルデコーダ220は、アップサンプラ230とシグナルコミュニケーションで結合され、アップサンプラ230は、スケーラブル高解像度エンコーダ240とシグナルコミュニケーションで結合され、スケーラブル高解像度のエンコーダ240は、高解像度の入力ビデオ系列を受け、高解像度のフレームストア250とシグナルコミュニケーションで結合され、高解像度のスケーラブルビットストリームを出力する。低解像度のノンスケーラブルエンコーダ212の出力、及びスケーラブル高解像度エンコーダの出力は、空間スケーラブルビデオエンコーダ200の出力として利用可能である。
したがって、高解像度の入力ビデオ系列は、低い複雑度のエンコーダ200により受信され、低解像度のビデオ系列を形成するためにダウンサンプリングされる。低解像度のビデオ系列は、ノンスケーラブル低解像度のビデオ圧縮エンコーダを使用して符号化され、低解像度のビットストリームが形成される。低解像度のビットストリームは、ノンスケーラブルな低解像度ビデオ圧縮デコーダを使用してデコードされる。この機能は、エンコーダ内部で実行される。デコードされた低解像度系列はアップサンプリングされ、スケーラブル高解像度エンコーダへの2つの入力のうちの1つとして提供される。スケーラブル高解像度エンコーダは、高解像度のスケーラブルビットストリームを形成するためにビデオをエンコードする。
図3に戻り、2つのレイヤをサポートする空間スケーラブルビデオデコーダは、参照符号300により全般的に示される。ビデオデコーダ300は、低解像度フレームストア362とシグナルコミュニケーションで結合される、低解像度ビットストリームを受信するため低解像度デコーダ360を含み、低解像度ビデオ系列を出力する。低解像度デコーダ360は、アップサンプラ370とシグナルコミュニケーションで更に結合され、アップサンプラ370は、スケーラブル高解像度デコーダ380とシグナルコミュニケーションで結合される。
スケーラブル高解像度デコーダ380は、高解像度フレームストア390とシグナルコミュニケーションで更に結合される。スケーラブルな高解像度デコーダ380は、高解像度スケーラブルビットストリームを受信し、高解像度ビデオ系列を出力する。低解像度デコーダ360の出力及びスケーラブル高解像度デコーダの出力は、空間スケーラブルビデオデコーダ300の出力として利用可能である。
したがって、高解像度スケーラブルビットストリーム及び低解像度ビットストリームの両者は、低い複雑度のデコーダ300により受信される。低解像度のビットストリームは、低解像度のフレームストアを利用する、ノンスケーラブルな低解像度のビデオ圧縮デコーダを使用してデコードされる。デコードされた低解像度のビデオは、アップサンプリングされ、次いで、高解像度のスケーラブルデコーダに入力される。高解像度のスケーラブルデコーダは、高解像度のフレームストアのセットを利用し、高解像度の出力ビデオ系列を形成する。
図4に戻り、ノンスケーラブルビデオエンコーダは、参照符号400により全般的に示される。ビデオエンコーダ400への入力は、サミングジャンクション410の非反転入力とシグナルコミュニケーションで接続される。サミングジャンクション410の出力は、変換器/量子化器420とシグナルコミュニケーションで接続される。変換器/量子化器420の出力は、エントロピーコーダ440とシグナルコミュニケーションで接続される。エントロピーコーダ440の出力は、エンコーダ400の出力として利用可能である。変換器/量子化器420の出力は、逆変換器/逆量子化器450とシグナルコミュニケーションで更に接続される。逆変換/逆量子化器450の出力は、デブロックフィルタ460の入力とシグナルコミュニケーションで接続される。デブロックフィルタ460の出力は、参照ピクチャストア470とシグナルコミュニケーションで接続される。参照ピクチャストア470の第一の出力は、動き予測器480の第一の入力とシグナルコミュニケーションで接続される。エンコーダ400への入力は、動き予測器480の第二の入力とシグナルコミュニケーションで更に接続される。動き予測器480の出力は、動き補償器490の第一の入力とシグナルコミュニケーションで接続される。参照ピクチャストア470の第二の出力は、動き補償器490の第二の入力とシグナルコミュニケーションで接続される。動き予測器490の出力は、サミングジャンクション410の反転入力とシグナルコミュニケーションで接続される。
図5に戻り、ノンスケーラブルなビデオデコーダは、参照符号500により全般的に示される。ビデオデコーダ500は、ビデオ系列を受けるためにエントロピーデコーダ510を含む。エントロピーデコーダ510の第一の出力は、逆量子化器/逆変換器520の入力とシグナルコミュニケーションで接続される。逆量子化器/逆変換器520の出力は、サミングジャンクション540の第一の入力とシグナルコミュニケーションで接続される。
サミングジャンクション540の出力は、デブロックフィルタ590とシグナルコミュニケーションで接続される。デブロックフィルタ590の出力は、参照ピクチャストア550とシグナルコミュニケーションで接続される。参照ピクチャストア550は、動き予測器560の第一の入力とシグナルコミュニケーションで接続される。動き予測器560の出力は、サミングジャンクション540の第二の入力とシグナルコミュニケーションで接続される。エントロピーデコーダ510の第二の出力は、動き予測器560の第二の入力とシグナルコミュニケーションで接続される。デブロックフィルタ590の出力は、ビデオデコーダ500の出力として利用可能である。
H.264/MPEG AVCはRRU(Reduced Resolution Update)モードを使用するために拡張されることが提案されている。RRUモードは、フル解像度のピクチャの動き予測及び補償を実行しつつ、符号化されるべき残余のマクロブロック(MB)の数を低減することで、低ビットレートで符号化効率を改善する。図6に戻り、RRU(Reduced Resolution Update)は、参照符号600により全般的に示される。ビデオエンコーダ600への入力は、サミングジャンクション610の非反転入力とシグナルコミュニケーションで接続される。サミングジャンクション610の出力は、ダウンサンプラ612の入力とシグナルコミュニケーションで接続される。変換器/量子化器620の入力は、ダウンサンプラ612の出力、又はサミングジャンクション610の出力とシグナルコミュニケーションで接続される。変換器/量子化器620の出力は、エントロピーコーダ640とシグナルコミュニケーションで接続される。エントロピーコーダ640の出力は、ビデオエンコーダ600の出力として利用可能である。
変換器/量子化器620の出力は、逆変換器/逆量子化器650の入力とシグナルコミュニケーションで更に接続される。逆変換器/逆量子化器650の出力は、アップサンプラ655の入力とシグナルコミュニケーションで接続される。デブロックフィルタ660の入力は、逆変換器/逆量子化器650の出力又はアップサンプラ655の出力とシグナルコミュニケーションで接続される。デブロックフィルタ660の出力は、参照ピクチャストア670の入力とシグナルコミュニケーションで接続される。参照ピクチャストア670の第一の出力は、動き予測器680の第一の入力とシグナルコミュニケーションで接続される。エンコーダ600への入力は、動き予測器680の第二の入力とシグナルコミュニケーションで更に接続される。動き予測器680の出力は、動き補償器690の第一の入力とシグナルコミュニケーションで接続される。参照ピクチャストア670の第二の出力は、動き補償器690の第二の入力とシグナルコミュニケーションで接続される。動き補償器690の出力は、サミングジャンクション610の反転入力とシグナルコミュニケーションで接続される。
図7に戻り、RRU(Reduced Resolution Update)ビデオデコーダは、参照符号700により全般的に示される。ビデオデコーダ700は、ビデオ系列を受けるエントロピーデコーダ710を含む。エントロピーデコーダ710の出力は、逆量子化器/逆変換器720の入力とシグナルコミュニケーションで接続される。逆量子化器/逆変換器720の出力は、アップサンプラ722の入力とシグナルコミュニケーションで接続される。アップサンプラ722の出力は、サミングジャンクション740の第一の入力とシグナルコミュニケーションで接続される。
サミングジャンクション740の出力は、デブロックフィルタ790とシグナルコミュニケーションで接続される。デブロックフィルタ790の出力は、フル解像度の参照ピクチャストア750の入力とのシグナルコミュニケーションで接続される。デブロックフィルタ790の出力は、ビデオデコーダ700の出力として利用可能である。フル解像度の参照ピクチャストア750の出力は、動き補償器760とシグナルコミュニケーションで接続され、この動き補償器は、サミングジャンクション740の第二の入力とシグナルコミュニケーションで接続される。
複雑度のスケーラブルコーデックを設計するためにRRUコンセプトを使用することが提案されている。2つの異なるデコーダの複雑度及び解像度のレベルをサポートするシステムについて例が提供される。低解像度デコーダは、小型ディスプレイのサイズを有し、非常に厳密なデコーダの複雑度の制約を有する。フル解像度のデコーダは、大型ディスプレイのサイズを有し、厳密さは無いが重要なデコーダの複雑度の制約を有する。ブロードキャスト又はマルチキャストシステムは、ビットレートBRbaseをもつベースレイヤとビットレートBRenhanをもつエンハンスメントレイヤといった、2つのビットストリームを送信する。2つのビットレートは、互いに多重化され、単一のトランスポートストリームで送出される。図8に戻り、複雑度のスケーラビリティのブロードキャストシステムは、参照符号800により全般的に示される。システム800は、複雑度のスケーラブルなビデオエンコーダ、低解像度のデコーダ及びフル解像度のデコーダを含む。複雑度スケーラビリティブロードキャストシステム800は、複雑度のスケーラブルなビデオエンコーダ810を含む。複雑度のスケーラブルなビデオエンコーダ810の第一の出力は、マルチプレクサ820の第一の入力とシグナルコミュニケーションで接続される。複雑度のスケーラブルなビデオエンコーダ810の第二の出力は、マルチプレクサ820の第二の入力とシグナルコミュニケーションで接続される。マルチプレクサ820の出力は、ネットワーク830とシグナルコミュニケーションで接続される。ネットワーク830の出力は、第一のデマルチプレクサ840の入力及び第二のデマルチプレクサ850の入力とシグナルコミュニケーションで接続される。第一のデマルチプレクサ840の出力は、低解像度デコーダ850の入力とシグナルコミュニケーションで接続される。第二のデマルチプレクサ860の第一の出力は、フル解像度のデコーダ870の第一の入力とシグナルコミュニケーションで接続される。低解像度のデコーダ850の出力は、ベースレイヤビットストリームについてシステム800の出力として利用可能であり、フル解像度デコーダ870の出力は、スケーラブルビットストリームについてシステム800の出力として利用可能である。
低解像度デコーダ850は、ベースレイヤビットストリームのみを処理し、フル解像度のデコーダ870は、ベースレイヤビットストリーム及びエンハンスメントレイヤビットストリームの両者を処理する。RRUは、ベースレイヤで使用され、デコーダで異なる複雑度により低解像度及び高解像度系列の両者にデコードされる。エンハンスメントレイヤビットストリームは、フル解像度の動き補償と行われる、ベースレイヤビットストリームを復号化した結果に付加されることとなる、フル解像度のエラー信号を含む。エンハンスメントレイヤのビットレートは、ベースレイヤのビットレートがエンハンスメントレイヤのビットレートと比較して典型的に小さい典型的な空間スケーラビリティのケースとは異なる、ベースレイヤのビットレートよりも低いビットレートで終わる。フル解像度のエラー信号は、それぞれ符号化されたマクロブロック又はスライス/ピクチャについて必ずしも送出される必要はない。
従来技術のこれらの欠点及び問題点、並びに他の欠点及び問題点は、本発明により対処され、空間スケーラブルなビデオ符号化及び復号化向けのスライス適応型動きベクトル符号化のための方法及び装置に向けられる。
本発明の態様によれば、空間スケーラブルビデオ符号化の方法が提供される。本方法は、スライス毎に動きベクトルのスケーラブル符号化とノンスケーラブル符号化の間で選択することを含む。
本発明の別の態様によれば、空間スケーラブルなビデオエンコーダが提供される。空間スケーラブルなビデオエンコーダは、スライス毎に動きベクトルのスケーラブル符号化とノンスケーラブル符号化との間の選択を実行するエンコーダを含む。
本発明の更に別の態様によれば、ビットストリームの空間スケーラブルなビデオ復号化について方法が提供される。本方法は、ビットストリームのヘッダにおけるシンタックスフィールドに基づいて、ビットストリームで符号化された動きベクトルを使用するか、スケーリングファクタにより割られた動きベクトルの商を使用するかを判定することを含む。
本発明の更に別の態様によれば、ビットストリームを復号化する空間スケーラブルなビデオデコーダが提供される。空間スケーラブルなビデオデコーダは、ビットストリームのヘッダにおけるシンタックスフィールドに基づいて、ビットストリームで符号化された動きベクトルを使用するか、スケーリングファクタで割られた動きベクトルの商を使用するかを判定するデコーダを含む。
本発明のこれらの態様、特徴及び利点、並びに他の態様、特徴及び利点は、添付図面と共に例示的な実施の形態の以下の詳細な説明から明らかとなるであろう。
本発明は、以下の提示的な図面に従って良好に理解される。
本発明は、空間スケーラブルビデオ符号化及び復号化向けのスライス適合型動きベクトル符号化のための方法及び装置に向けられる。すなわち、動きベクトルのスケーラブル符号化とノンスケーラブル符号化の間でスライスに適合した選択(Slice Adaptive Selection)が実行される。本実施の形態で使用される「動きベクトルのスケーラブル符号化」は、下位レイヤの動きベクトルのリファインメントがそれぞれ上位レイヤで符号化され、符号化された動きベクトルがその上位レイヤの動きベクトルの精度を表す、スケーラブル動きベクトルのスキームを意味することを理解されたい。
スライスに適合した選択は、限定されるものではないが、ベースレイヤコンパチビリティ、ビットレートスケーラビリティ、トータルビットレート符号化効率及び複雑度を含めた考慮に基づいていることを理解されたい。本実施の形態で提供される本発明の原理の教示が与えられると、これらの考慮及び他の考慮は、本発明の原理の範囲を維持しつつ、本発明の原理に従って実現される場合もある。
動き予測及び補償が時間の冗長度を除くために適用される大部分のスケーラブルビデオ符号化スキームでは、動きベクトルの符号化のために講じられるアプローチは、当然の考慮として与えられるべきである。本発明の原理によれば、空間スケーラブルビデオエンコーダ及び/又はデコーダについて、ノンスケーラブル動きベクトル符号化とスケーラブル動きベクトル符号化との間でのスライスに適合した選択を可能にする方法及び装置が提供される。本実施の形態で開示する方法及び装置は、トータルビットレート符号化効率、ビットレート又は複雑度スケーラビリティ及びデコーダ要件の良好なトレードオフを提供する。
本実施の形態の説明は、本発明の原理を例示するものである。当業者であれば、本実施の形態で明示的に記載又は図示されないが、本発明の原理を実施し、本発明の精神及び範囲内に含まれる様々な装置を考案するであろうことが理解される。
本実施の形態で引用される全ての例及び条件付きの言語は、本発明の原理、及び当該技術を促進するために本発明者により寄与されるコンセプトを理解することにおいて読者を支援する教育の目的のために意図され、係る特に引用される例及び条件に対する制約がないものとして解釈されるべきである。
さらに、本発明の原理、態様及び実施の形態を引用する本実施の形態における全ての説明は、その特定の例と同様に、本発明の構造的かつ機能的な等価なものの両者を包含することが意図される。さらに、係る等価は、現在公知の等価なものと同様に将来的に開発される等価なもの、すなわち構造に関わらず、同じ機能を実行する開発されたエレメントとの両者を含むことが意図される。
したがって、たとえば、当業者により理解される。本実施の形態で提供されるブロック図は、本発明の原理を実施する例示的な回路の概念的なビューを表すことが理解される。同様に、フローチャート、フローダイアグラム、状態遷移図、擬似コード等は、コンピュータ読取り可能なメディアで実質的に表され、係るコンピュータ又はプロセッサが明示的に示されるか否かに関わらず、コンピュータ又はプロセッサにより実行される様々な処理を表すことを理解されたい。
図面に示される様々なエレメントの機能は、適切なソフトウェアとの関連においてソフトウェアを実行可能なハードウェアと同様に、専用ハードウェアの使用を通して提供される場合がある。プロセッサにより提供されたとき、機能は、単一の専用のプロセッサ、単一のシェアドプロセッサ、又は複数の個々のプロセッサにより提供され、そのうちの幾つかは、共有される場合がある。さらに、用語「プロセッサ」又は「コントローラ」の明示的な使用は、ソフトウェアの実行が可能なハードウェアを排他的に意味するように解釈されるべきではなく、制限されることなしに、デジタルシグナルプロセッサ(DSP)ハードウェア、ソフトウェアを記憶するためのリードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)、及び不揮発性ストレージを暗黙的に含む。
他のハードウェアは、コンベンショナル及び/又はカスタムも含まれる場合がある。同様に、図面に示されるスイッチは、概念的なものである。それらの機能は、プログラムロジックの動作を通して、専用ロジックを通して、プログラム制御と専用ロジックのインタラクションを通して、又は手動的に実行され、特定の技術は、コンテクストから更に詳細に理解されるように、実現者により選択可能である。
本発明の請求項では、規定された機能を実行する手段として表現されるエレメントは、たとえば、a)その機能を実行する回路エレメントの組み合わせ、b)その機能を実行するそのソフトウェアを実行する適切な回路と組み合わされる、ファームウェア、マイクロコード等を含む任意の形式におけるソフトウェアを含む、その機能を実行する任意のやり方を包含することが意図される。係る請求項により定義される本発明は、様々な引用される手段により提供される機能が結合され、請求項が求めるやり方で集約される事実にある。それら機能を提供することができる任意の手段は本実施の形態で示されるものに等価であるとみなされる。
先に述べたように、本発明の原理は、空間スケーラブルビデオ符号化及び/復号化向けのスライスに適合した動きベクトル(MV)の判定をサポートする方法及び装置に向けられる。例示的な目的のため、本発明の原理に係る方法及び装置は、ITU−T(International Telecommunication Union, Telecommunication Sector) H.264規格(以下「H.264規格」と呼ぶ)に関して本実施の形態で記載される。しかし、本発明の原理に係る実現は、H.264規格のみに制限されず、他のビデオ符号化及び復号化規格も本発明の原理に従って採用される。すなわち、本実施の形態で提供される本発明の原理の教示が与えられた場合、当業者は、本発明の範囲を維持しつつ、他のビデオ符号化及び復号化規格と同様にH.264規格に関連する本発明の原理の用途を予想するであろう。
図9に進み、低解像度の複雑度スケーラブルビデオエンコーダは、参照符号900により全体的に示されている。ビデオデコーダ900は、ビデオ系列を受けるエントロピーデコーダ910を含む。エントロピーデコーダ910の第一の出力は、逆量子化器/逆変換器920の入力とシグナルコミュニケーションで接続される。逆量子化器/逆変換器920の出力は、サミングジャンクション940の第一の入力とシグナルコミュニケーションで接続される。
サミングジャンクション940の出力は、デブロックフィルタ990とのシグナルコミュニケーションで接続される。デブロックフィルタの出力は、参照ピクチャストア950の入力とのシグナルコミュニケーションで接続される。デブロックフィルタ990の出力は、ビデオデコーダ900の出力として利用可能である。参照ピクチャストア950の出力は、動き補償器960の第一の入力とシグナルコミュニケーションで接続される。動き補償器960の出力は、サミングジャンクション940の第二の入力とシグナルコミュニケーションで接続される。エントロピーデコーダ910の第二の出力は、動きベクトル(MV)解像度リデューサ999の入力とシグナルコミュニケーションで接続される。MV解像度リデューサ999の出力は、動き補償器960の第二の入力とシグナルコミュニケーションで接続される。
デコーダ900において、ベースレイヤビットストリームはエントロピー復号化される。動きベクトルは、低解像度に対応する精度にそれらを低減するため、スケーリングされ、丸め処理される。この低解像度のスケーラブルデコーダの複雑度は、動きベクトルのスケーリングが非常に低い複雑度からなるので、ノンスケーラブルデコーダのそれに非常に類似している。ファクタ2が低解像度とフル解像度の間のそれぞれのディメンジョンにおける解像度の比において使用される場合、丸め処理は、ラウンディングアップ又はラウンディングダウンがシステムで選択されたかに依存して、ちょうど右シフト又は加算及び右シフトで実現される。
図10に進み、高解像度の複雑度スケーラブルビデオデコーダ1000は、参照符号1000により全体的に示される。ビデオデコーダ1000は、ベースレイヤビットストリームを受ける第一のエントロピーデコーダ1005を含む。第一のエントロピーデコーダ1005の出力は、第一の逆量子化器/逆変換器1010の入力とシグナルコミュニケーションで接続される。第一の逆量子化器/逆変換器1010の出力は、アップサンプラ1015の入力とシグナルコミュニケーションで接続される。アップサンプラ1015の出力は、第一のサミングジャンクション1020の第一の入力とシグナルコミュニケーションで接続される。
第一のサミングジャンクション1020の出力は、第二のサミングジャンクション1025の第一の入力とシグナルコミュニケーションで接続される。フル解像度の参照ピクチャストア1030の出力は、動き補償器1035の第一の入力とシグナルコミュニケーションで接続される。(動きベクトル(MV)を出力する)エントロピーデコーダ1005の第二の出力は、動き補償器1035の第二の入力とシグナルコミュニケーションで接続される。動き補償器1035の出力は、第一のサミングジャンクション1020の第二の入力とシグナルコミュニケーションで接続される。
第二のエントロピーデコーダ1040の入力は、エンハンスレイヤビットストリームを受けるためのものである。第二のエントロピーデコーダ1040の出力は、第二の逆量子化器/逆変換器1045の入力とシグナルコミュニケーションで接続される。第二の逆量子化器/逆変換器1045の出力は、第二のサミングジャンクション1025の第二の入力とシグナルコミュニケーションで接続される。
デブロックフィルタ1050への入力は、第一のサミングジャンクション1020の出力又は第二のサミングジャンクション1025の出力とシグナルコミュニケーションで接続される。デブロックフィルタ1050の出力は、フル解像度の参照ピクチャストア1030の入力とシグナルコミュニケーションで接続される。デブロックフィルタ1050の出力は、ビデオデコーダ1000の出力として利用可能である。
ベースレイヤビットストリームで動作するデコーダ1000の部分は、RRUデコーダに類似する。エントロピー復号化及び逆量子化及び逆変換の後、残余がアップサンプリングされる。フル解像度の予測を形成するため、フル解像度の参照ピクチャに動き補償が適用され、アップサンプリングされた残余は、予測に加えられる。フル解像度のエラー信号がエンハンスメントレイヤビットストリームに存在する場合、エントロピー復号化、逆量子化及び逆変換され、RRU再構成された信号に加えられる。デブロッキングフィルタが次いで適用される。
図11に進み、複雑度スケーラブルビデオエンコーダは、参照符号1100により全体的に示される。ビデオエンコーダ1100への入力は、第一のサミングジャンクション1105の非反転入力とシグナルコミュニケーションで接続される。第一のサミングジャンクション1105の出力は、ダウンサンプラ1112の入力とシグナルコミュニケーションで接続される。ダウンサンプラ1112の出力は、第一の変換器/量子化器1115の入力とシグナルコミュニケーションで接続される。第一の変換器/量子化器1115の出力は、第一のエントロピーコーダ1120の入力とシグナルコミュニケーションで接続される。第一のエントロピーコーダ1120の出力は、ベースレイヤビットストリームについてエンコーダ1100の出力として利用可能である。
第一の変換器/量子化器1115の出力は、第一の逆変換器/逆量子化器1125の入力とシグナルコミュニケーションで更に接続される。第一の逆変換器/量子化器1125の出力は、アップサンプラ1155の入力とシグナルコミュニケーションで接続される。アップサンプラ1155の出力は、第二のサミングジャンクション1160の反転入力及び第三のサミングジャンクション1165の第一の非反転入力とシグナルコミュニケーションで接続される。
ビデオエンコーダ1100への入力は、第二のサミングジャンクション1160の非反転入力とシグナルコミュニケーションで更に接続される。第二のサミングジャンクション1160の出力は、スイッチ1162の入力とシグナルコミュニケーションで接続される。スイッチ1162の出力は、第二の変換器/量子化器1170への入力とシグナルコミュニケーションで接続される。第二の変換器/量子化器1170の出力は、第二のエントロピーコーダ1175の入力とシグナルコミュニケーションで接続される。第二のエントロピーコーダ1175の出力は、エンハンスレイヤビットストリームについてエンコーダ1100の出力として利用可能である。第二の変換器/量子化器1170の出力は、第二の逆変換器/量子化器1180の入力とシグナルコミュニケーションで接続される。第二の逆変換器/量子化器1180の出力は、第三のサミングジャンクション1165の第二の非反転入力とシグナルコミュニケーションで接続される。
ビデオエンコーダ1100への入力は、動き予測器1185の第一の入力とシグナルコミュニケーションで更に接続される。動き予測器1185の出力は、動き補償器1190の第一の入力とシグナルコミュニケーションで接続される。動き補償器1190の出力は、第一のサミングジャンクション1105の反転入力とシグナルコミュニケーションで接続される。フル解像度の参照ピクチャストア1192の第一の出力は、動き予測器1185の第二の入力とシグナルコミュニケーションで接続される。フル解像度の参照ピクチャストア1192の第二の出力は、動き補償器1190の第二の入力とシグナルコミュニケーションで接続される。フル解像度の参照ピクチャストア1192の入力は、デブロックフィルタ1195の出力とシグナルコミュニケーションで接続される。デブロックフィルタ1195の入力は、スイッチ1191の出力とシグナルコミュニケーションで接続される。スイッチ1192の別の入力は、第三のサミングジャンクション1165の出力とシグナルコミュニケーションで接続される。
エンコーダ1100は、低解像度のビデオ品質よりはむしろフル解像度のビデオ品質を最適化するように試みる。動き予測は、フル解像度のビデオピクチャで実行される。入力ピクチャから動き補償された予測を減算した後、予測の残差はダウンサンプリングされるR。RRUコーデックとは異なり、低解像度デコーダが復号化すべきピクチャを常に有することができるように、ダウンサンプリングが全てのピクチャに適用される。ダウンサンプリングされた残差は、変換及び量子化され、エントロピー符号化される。これは、ベースレイヤビットストリームを形成する。逆量子化及び逆変換が適用され、次いで、符号化された残差は、フル解像度にアップサンプリングされる。エンコーダ1100は、そのピクチャ又はスライスについてエンハンスメントレイヤのフル解像度エラー信号を送出するか否かを選択する。一般に、エンハンスメントレイヤのフル解像度のエラー信号は全てのIスライスについて符号化され、フル解像度の入力ピクチャがデコードされたアップサンプリングされたものを減算するときにエラー信号の大きさに基づいてP及びBスライスを任意に送出することができる。エンハンスメントレイヤのフル解像度のエラー信号が符号化される場合、符号化されたベースレイヤのアップサンプリングされた符号化されたピクチャは、入力されたフル解像度のピクチャから減算される。次いで、差が量子化、変換、エントロピー符号化され、エンハンスメントレイヤビットストリームを形成する。エンハンスメントレイヤビットストリームは、イントラ符号化されたスライスのみを含むものとして見ることができる。したがって、このRRUに基づいた複雑度のスケーラブルなビデオ符号化スキームでは、動きベクトルは、ノンスケーラブルに符号化される。
図12に進み、本発明の原理に係る複雑度のスケーラビリティは、参照符号1200により全体的に示されている。複雑度のスケーラビリティ1200は、ベースレイヤ1210及びエンハンスメントレイヤ1220を含む。関与するピクチャタイプは、Iピクチャ1230、Pピクチャ1240、EIピクチャ1250、EPピクチャ1260、及びEBピクチャ1270を含む。両方のレイヤにおけるPピクチャ1240は、同じビットストリームから、異なる復号化技術により共に復号化される。
たとえば図13、図14、図15、図16A及び図16Bといった本発明の原理に係るビデオ信号データを符号化及び/又は復号化することに関して本実施の形態で記載される方法は、本発明の原理の様々な例示的な態様を説明するために記載されることを理解されたい。しかし、符号化及び/又は復号化に関する幾つかの公知及び/又は容易に確認できるステップは、明確さ及び手短さのために省略される場合があることが理解される。
図13に進み、空間スケーラブルビデオエンコーダ向けの適応型動きベクトル符号化の例示的な方法は、参照符号1300により全体的に示されている。開始ブロック1305は、ベースレイヤ符号化を開始し、判定ブロック1310に制御を移す。判定ブロック1310は、たとえばアプリケーション及び/又はデコーダ基準に基づいて(使用されるべき粗いスケーラビリティである)、スライス毎にノンスケーラブル符号化(又はスケーラブル符号化)を使用して動きベクトルを符号化するか否かを判定する。動きベクトルを符号化しない場合、機能ブロック1315に制御が移る。さもなければ、機能ブロック1325に制御が移る。
機能ブロック1315は、P動きベクトルをスケーラブルとして符号化し、B動きベクトルをノンスケーラブルとして符号化し、機能ブロック1320に制御を移す。機能ブロック1320は、non_scalable_ mv_coding_flagをPスライスヘッダで0に等しく設定し、Bスライスヘッダで1に等しく設定する。
機能ブロック1325は、P及びB動きベクトルをノンスケーラブルとして符号化し、機能ブロック1330に制御を移す。機能ブロック1330は、non_scalable_mv_coding_flagをP及びBスライスヘッダの両者で1に設定する。
図14に進み、空間スケーラブルビデオエンコーダの適応型動きベクトル符号化の別の例示的な方法は、参照符号1400により全体的に示される。開始ブロック1405は、ベースレイヤ符号化を開始し、機能ブロック1410に制御を移す。機能ブロック1410は、動きベクトル(MV)がスケーラブル符号化されるべきか、ノンスケーラブル符号化されるべきかを判定するため、レート歪み(RD)の判定を実行し、判定ブロック1415に制御を移す。判定ブロック1415は、粗いスケーラビリティが使用されるべきであるか否かを判定する。使用されるべきではないと判定した場合、機能ブロック1420に制御が移る。さもなければ、機能ブロック1425に制御が移る。
機能ブロック1420は、non_scalable_mv_coding_flagをスライスヘッダで0に設定する。機能ブロック1425は、non_scalable_mv_coding_flagをスライスヘッダで1に設定する。
図15に進み、空間スケーラブルビデオエンコーダの適合型動きベクトル符号化の更に別の例示的な方法は、参照符号1500により全体的に示される。開始ブロック1505は、ベースレイヤ符号化を開始し、機能ブロック1510に制御を移す。機能ブロック1510は、ノンスケーラブルとしてベースレイヤスライスについて動きベクトルを符号化し、機能ブロック1515に制御を移す。機能ブロック1515は、non_scalable_mv_coding_flagをスライスヘッダで1に等しく設定する。
図16Aに進み、空間スケーラブルビデオデコーダ向けの動きベクトル復号化のために例示的な方法は、参照符号1600により全体的に示されている。図16Aの方法1600は、本発明の原理に従ってスライスヘッダの分析に関する。
開始ブロック1605は、ベースレイヤ復号化を開始し、判定ブロック1610に制御を移す。判定ブロック1610は、
Profile_idoc==XX&&slice_type!=I_SLICE_&&slice_type!=SI_SLICE
が成り立つか否かを判定する。成り立つ場合、機能ブロック1615に制御が移る。さもなければ、機能ブロック1620に制御が移る。
機能ブロック1615は、non_scalable_mv_coding_flagを分析し、機能ブロック1620に制御を移す。機能ブロック1620は、スライスヘッダの他のエレメントを分析する。
図16Bに進み、空間スケーラブルビデオデコーダのためのスライスヘッダを分析する例示的な方法は、参照符号1650により全体的に示される。図16Bの方法1650は、本発明の原理に従ってマクロブロックの動きベクトルを復号化することに関する。
開始ブロック1655は、ベースレイヤ復号化を開始し、判定ブロック1660に制御を移す。判定ブロック1660は、non_scalable_mv_coding_flagが1に等しいか否かを判定する。1に等しい場合、機能ブロック1665に制御が移る。さもなければ、機能ブロック1670に制御が移る。
機能ブロック1665は、
Figure 2008536451
となるように、動きベクトル22でスケーリングし、機能ブロック1670に制御を移す。機能ブロック1670は、マクロブロックを復号化するのを継続する。
既存のH.264規格に関して、1つのシンタックスエレメントnon_scalable_mv_coding_flagは、H.264スライスヘッダに関連する表1で示されるように追加される。表1に関して記載される特徴は、たとえば、限定されるものではないが、H.264規格の将来のプロファイルでサポートされることが推定される。本発明の原理によれば、エンコーダは、たとえば後方互換及び符号化効率の要件に基づいて動きベクトルをスケーラブル符号化又はノンスケーラブル符号化するかを、たとえばスライス毎に判定するか、フレーム毎に判定する。本実施の形態で提供される本発明の教示が与えられた場合、本発明の原理の範囲を維持しつつ、スケーラブル符号化を使用した動きベクトルの符号化とノンスケーラブル符号化を使用した動きベクトルの符号化との間での適応的な選択を実行するため、他の基準及び他の要件も利用されることが理解される。
Figure 2008536451
Figure 2008536451
Figure 2008536451
non_scalable_mv_coding_flagが1に等しいとき、これは、動きベクトル(MV)が最も高いエンハンスメントレイヤについてノンスケーラブル符号化されていることを表す。下位レイヤについて、MVはダウンサンプリングされる必要があり、これは、2レイヤの空間スケーラビリティを想定して1加算と1右シフトで実現することができる。H.264規格におけるインター予測プロセスの定式は、以下のように変更される。
Figure 2008536451
non_scalable_mv_coding_flagが0に等しいとき、これは、MVがスケーラブル符号化されたことを表す。エンハンスメントレイヤでは、ベースレイヤMVがアップサンプリングされ、予測子として使用されるか、同じレイヤにおける近傍のMVが予測子として使用される。
本発明の原理によれば、MVは、たとえば異なるアプリケーション及びデコーダ要件に適合するために最適に符号化される。
本発明に係る1例では、図13に関して以下に記載されるように、ベースレイヤのH.264の互換性がデコーダに望まれる場合、MVの符号化はスケーラビリティの粗悪さに基づいて選択される。ベースレイヤについて、粗悪なスケーラビリティ又は低いフレームレートが望まれる場合、デコーダがIスライスのみをデコードする。次いで、ノンスケーラブルMV符号化は、P及びBスライスの両者について使用される。所望のフレームレートが高い場合、Pスライスは、スケーラブル動きベクトルを使用して符号化され、Bスライスは、ノンスケーラブルな動きベクトルを使用して符号化される。
本発明の原理に係る別の例では、図14に関して以下に記載されるように、ビットレートのスケーラビリティが望まれる場合、エンコーダは、動きベクトルがどのように符号化されるかを選択するためにレート歪み最適化方法を使用する。エンコーダがベースレイヤでP及びBスライスの両者を符号化する間、デコーダがベースレイヤ復号化についてBスライスをドロップする場合、エンコーダは、Pスライスについてスケーラブル動きベクトル符号化を使用するが、全体の符号化効率を改善するために、Bスライスについてノンスケーラブルな動きベクトル符号化を使用しない。
本発明の原理に係る第三の例では、図15に関して以下に記載され、複雑度のスケーラブル符号化に向けられ、全体のビットレート符号化効率及び複雑度が問題であるので、ノンスケーラブル動きベクトル符号化がP及びBスライスの両者について選択されるか、又はスケーラブル動きベクトル符号化がPスライスについて使用され、ノンスケーラブル動きベクトル符号化がBスライスについて使用される。代替的に、スケーラブル動きベクトル符号化は、Pスライスのサブセットについて使用され、ノンスケーラブルの動きベクトルの符号化は、残りのPスライスについて使用される。第三の例の1つの可能性のある実現は、図18の表2に示されている。
表2は、例示的な動きの符号化を説明する。先の第三の例に対応する表2の例示的な実施の形態に拠れば、ベースレイヤにおいて、全てのPピクチャは、スケーラブル動きベクトル符号化されるが、エンハンスメントレイヤにおいて、全てのPピクチャは、ノンスケーラブル動きベクトル符号化される。
Figure 2008536451
本発明の原理に係る、スケーラブル動きベクトル符号化とノンスケーラブルな動きベクトル符号化を結合する別の実現において、スケーラブルな動きベクトル符号化符号化は、ベースレイヤについて使用されるが、ノンスケーラブル動きベクトルの符号化は、2を超えるレベルの空間スケーラビリティがサポートされる場合に上位のエンハンスメントレイヤについて使用される。
ここで、本発明の多くの随伴的な利点/特徴を幾つかに関する説明が与えられる。たとえば、1つの利点/特徴は、スライス毎に動きベクトルのスケーラブル符号化とノンスケーラブル符号化の間で選択を実行するエンコーダを含む空間スケーラブルビデオエンコーダである。別の利点/特徴は、上述された空間スケーラブルビデオエンコーダであり、エンコーダは、意図されるアプリケーション及びビットストリームの後続する復号化について使用されるべきデコーダの少なくとも1つについての基準に基づいて選択を実行する。さらに、別の利点/特徴は、上述された基準に基づいて選択を実行する空間スケーラブルビデオエンコーダであり、エンコーダは、デコーダの基準がベースレイヤに準拠する復号化を規定するとき、ベースレイヤ復号化のためのデコーダに特化したスケーラビリティのフィットネスレベルに基づいて選択を実行する。さらに、別の利点/特徴は、デコーダの基準と上述されたベースレイヤ復号化のためのデコーダに特化したスケーラビリティのフィットネスとに基づいて選択を実行する空間スケーラブルビデオエンコーダであり、エンコーダは、P及びBスライスの両者における動きベクトルがノンスケーラブル符号化されるか、又はBスライスにおける動きベクトルのみがスケーラブル符号化されているPスライスにおける動きベクトルとノンスケーラブル符号化されるように、選択を実行する。また、別の利点/特徴は、上述された基準に基づいて選択を実行する空間スケーラブルなビデオエンコーダであり、エンコーダは、デコーダ基準がビットレートスケーラビリティを規定するとき、レート歪み最適化方法を使用して選択を実行する。さらに、別の利点/特徴は、基準に基づいて、上述されたレート歪み最適化方法を使用して選択を実行する空間スケーラブルビデオエンコーダであり、エンコーダは、空間スケーラブルビデオエンコーダがベースレイヤにおけるBスライスを符号化し、デコーダがBスライスをドロップするために構成されるとき、Bスライスにおける動きベクトルがノンスケーラブル符号化されるように選択を実行する。さらに、別の利点/特徴は、上述されたような基準に基づいて選択を実行する空間スケーラブルビデオエンコーダであり、エンコーダは、空間スケーラブルビデオエンコーダの符号化基準が全体のビットレート符号化効率及び複雑度を含むとき、P及びBスライスの両者における動きベクトルがノンスケーラブル符号化されるか、Bスライスにおける動きベクトルのみがスケーラブル符号化されているPスライスにおける動きベクトルとノンスケーラブル符号化されるように、選択を実行する。さらに、別の利点/特徴は、上述された基準に基づいて選択を実行する空間スケーラブルビデオエンコーダであり、エンコーダは、2を超えるレベルの空間スケーラビリティが空間スケーラブルビデオエンコーダによりサポートされるとき、スケーラブル符号化がベースレイヤについて動きベクトルに適用され、ノンスケーラブル符号化が全てのエンハンスメントレイヤについて動きベクトルに適用されるように、選択を実行する。また、別の利点/特徴は、上述された空間スケーラブルビデオエンコーダであり、エンコーダは、スライスにおける動きベクトルがスケーラブル符号化されるか、ノンスケーラブル符号化されるかを示すため、スライスヘッダにシンタックスフィールドを加える。さらに、別の利点/特徴は、ビットストリームを復号化するための空間スケーラブルビデオデコーダであり、空間スケーラブルビデオデコーダは、ビットストリームのヘッダにおけるシンタックスフィールドに基づいて、ビットストリームで符号化された動きベクトルを使用するか、スケーリングファクタで割られた動きベクトルの商を使用するかを判定するデコーダを含む。
本発明のこれらの特徴及び利点、並びに他の特徴及び利点は、本実施の形態での教示に基づいて当業者により容易に確認されるであろう。なお、本発明の教示は、ハードウェア、ソフトウェア、ファームウェア、特定用途向けプロセッサ、又はこれらの組み合わせからなる様々な形式で実現される場合があることに理解されたい。
最も好ましくは、本発明の教示は、ハードウェアとソフトウェアの組み合わせとして実現される。さらに、ソフトウェアは、プログラムストレージユニットで有形に実現されるアプリケーションプログラムとして実現される。アプリケーションプログラムは、適切なアーキテクチャを有するコンピュータにアップロードされ、コンピュータにより実行される。好ましくは、コンピュータは、1以上の中央処理ユニット(CPU)、ランダムアクセスメモリ(RAM)、及び入力/出力(I/O)インタフェースのようなハードウェアを有するコンピュータプラットフォームで実現される。コンピュータプラットフォームは、オペレーティングシステム及びマイクロインストラクションコードを含む場合がある。本実施の形態で記載された様々なプロセス及び機能は、CPUにより実行される場合がある、マイクロインストラクションコードの一部であるか、アプリケーションプログラムの一部、若しくはその組み合わせである場合がある。さらに、様々な他の周辺装置は、更なるデータストレージユニット及びプリンティングユニットのようなコンピュータプラットフォームに接続される場合がある。
添付図面に示される構成上のシステム要素及び方法のなかには、ソフトウェアで実現されることが好ましいものがあり、システム要素又はプロセスの機能ブロック間の実際の接続は、本発明がプログラムされる方式に依存して異なる場合があることを理解されたい。本実施の形態での教示が与えられると、当業者は、本発明のこれら及び類似の実現又はコンフィギュレーションを予想するであろう。
例示的な実施の形態は添付図面を参照して本明細書で記載されたが、本発明は、これら正確な実施の形態に制限されず、本発明の精神又は範囲から逸脱することなしに当業者により様々な変形及び変更が行われる場合があることを理解されたい。全ての係る変形及び変更は、特許請求の範囲に述べたように本発明の範囲内に含まれることが意図される。
従来技術に係る、典型的な空間スケーラビリティシステムのブロック図である。 従来技術に係る、2つのレイヤをサポートする空間スケーラブルエンコーダのブロック図である。 従来技術に係る、2つのレイヤをサポートする空間スケーラブルデコーダのブロック図である。 従来技術に係る、H.264/MPEG AVC規格で使用される通常のノンスケーラブルビデオエンコーダのブロック図である。 従来技術に係る、H.264/MPEG AVC規格で使用される通常のノンスケーラブルビデオデコーダのブロック図である。 従来技術に係る、RRU(Reduced Resolution Update)ビデオエンコーダのブロック図である。 従来技術に係る、RRU(Reduced Resolution Update)ビデオデコーダのブロック図である。 従来技術に係る、複雑度スケーラビリティブロードキャストシステムのブロック図である。 本発明の実施の形態に係る、本発明が適用される例示的な低解像度の複雑度のスケーラブルビデオデコーダのブロック図である。 本発明の実施の形態に係る、本発明が適用される例示的な高解像度の複雑度のスケーラブルビデオデコーダのブロック図である。 本発明の実施の形態に係る、本発明が適用される例示的な複雑度のスケーラブルビデオデコーダのブロック図である。 本発明の原理の例示的な実施の形態に係る複雑度のスケーラビリティのブロック図である。 本発明の原理に係る、空間スケーラブルなビデオエンコーダの適合型動きベクトル符号化の例示的な方法のフローチャートである。 本発明の原理に係る、空間スケーラブルなビデオエンコーダの適応型動きベクトル符号化の別の例示的な方法のフローチャートである。 本発明の原理に係る、空間スケーラブルなビデオエンコーダの適応型動きベクトル符号化の更に別の例示的な方法のフローチャートである。 本発明の原理に係る、空間スケーラブルなビデオデコーダのスライスヘッダを分析する別の例示的な方法のフローチャートである。 本発明の原理に係る、空間スケーラブルなビデオデコーダの動きベクトル復号化の例示的な方法のフローチャートである。

Claims (20)

  1. 空間スケーラブルビデオ符号化の方法であって、
    スライス毎に動きベクトルのスケーラブル符号化とノンスケーラブル符号化の間で選択するステップを含む、
    ことを特徴とする方法。
  2. 前記選択するステップは、ターゲットデコーダの復号化能力、及びターゲットデコーダのために利用される復号化規準の少なくとも1つに基づいて実行される、
    請求項1記載の方法。
  3. 前記選択するステップは、前記復号化規準がベースレイヤに準拠した復号化を規定するとき、ベースレイヤの復号化のためのデコーダに特化したスケーラビリティのフィットネスレベルに基づいて実行される、
    請求項2記載の方法。
  4. 前記選択するステップは、少なくとも第一のオプションと第二のオプションに関して実行され、
    Pスライス及びBスライスの両者における動きベクトルは、前記第一のオプションでノンスケーラブル符号化され、
    Bスライスにおける動きベクトルのみがノンスケーラブル符号化され、Pスライスにおける動きベクトルは、前記第二のオプションでスケーラブル符号化される、
    請求項3記載の方法。
  5. 前記選択するステップは、符号化規準がビットレート符号化効率及び複雑度を含むとき、少なくとも第一のオプションと第二のオプションに関して実行される、
    請求項4記載の方法。
  6. 前記選択するステップは、前記復号化規準がビットレートスケーラビリティを規定するとき、レート歪み最適化方法を使用して実行される、
    請求項2記載の方法。
  7. 前記選択するステップは、Bスライスがベースレイヤで符号化され、ターゲットデコーダがBスライスをドロップするために構成されるとき、Bスライスにおける動きベクトルがノンスケーラブル符号化されるように実行される、
    請求項2記載の方法。
  8. 前記選択するステップは、2を超えるレベルの空間スケーラビリティが当該方法を実現するために対応するエンコーダによりサポートされるとき、ベースレイヤの動きベクトルがスケーラブル符号化され、全てのエンハンスメントレイヤの動きベクトルがノンスケーラブル符号化されるように実行される、
    請求項2記載の方法。
  9. スライスにおける動きベクトルがスケーラブル符号化されたか、ノンスケーラブル符号化されたかを示すために、スライスヘッダにシンタックスフィールドを追加するステップを更に含む、
    請求項1記載の方法。
  10. スライス毎に動きベクトルのスケーラブル符号化とノンスケーラブル符号化の間で選択を実行するエンコーダを有する、
    ことを特徴とする空間スケーラブルビデオエンコーダ。
  11. 当該エンコーダは、ターゲットデコーダの復号化能力、及びターゲットデコーダのために利用される復号化規準の少なくとも1つに基づいて前記選択を実行する、
    請求項10記載の空間スケーラブルビデオエンコーダ。
  12. 当該エンコーダは、前記復号化規準がベースレイヤに準拠した復号化を規定するとき、ベースレイヤの復号化のためのデコーダに特化したスケーラビリティのフィットネスレベルに基づいて前記選択を実行する、
    請求項11記載の空間スケーラブルビデオエンコーダ。
  13. 当該エンコーダは、少なくとも第一のオプションと第二のオプションに関して前記選択を実行し、
    Pスライス及びBスライスの両者における動きベクトルは、前記第一のオプションでノンスケーラブル符号化され、
    Bスライスにおける動きベクトルのみがノンスケーラブル符号化され、Pスライスにおける動きベクトルは、前記第二のオプションでスケーラブル符号化される、
    請求項12記載の空間スケーラブルビデオエンコーダ。
  14. 当該エンコーダは、符号化規準がビットレート符号化効率及び複雑度を含むとき、少なくとも第一のオプションと第二のオプションに関して前記選択を実行する、
    請求項13記載の空間スケーラブルビデオエンコーダ。
  15. 当該エンコーダは、前記復号化規準がビットレートスケーラビリティを規定するとき、レート歪み最適化方法を使用して前記選択を実行する、
    請求項11記載の空間スケーラブルビデオエンコーダ。
  16. 空間スケーラブルビデオエンコーダがベースレイヤにおけるBスライスを符号化し、ターゲットデコーダがBスライスをドロップするために構成されるとき、当該エンコーダは、Bスライスにおける動きベクトルがノンスケーラブル符号化されるように前記選択を実行する、
    請求項11記載の空間スケーラブルビデオエンコーダ。
  17. 2を超えるレベルの空間スケーラビリティが当該空間スケーラブルビデオエンコーダによりサポートされるとき、当該エンコーダは、ベースレイヤの動きベクトルにスケーラブル符号化が適用され、全てのエンハンスメントレイヤの動きベクトルにノンスケーラブル符号化が適用されるように前記選択を実行する、
    請求項11記載の空間スケーラブルビデオエンコーダ。
  18. 当該エンコーダは、スライスにおける動きベクトルがスケーラブル符号化されたか、ノンスケーラブル符号化されたかを示すために、スライスヘッダにシンタックスフィールドを追加する、
    請求項10記載の空間スケーラブルビデオエンコーダ。
  19. ビットストリームの空間スケーラブルビデオ復号化の方法であって、
    前記ビットストリームのヘッダにおけるシンタックスフィールドに基づいて、前記ビットストリームで符号化された動きベクトルを使用するか、スケーリングファクタにより割られた動きベクトルの商を使用するかを決定するステップを含む、
    ことを特徴とする方法。
  20. ビットストリームを復号化する空間スケーラブルビデオデコーダであって、
    前記ビットストリームのヘッダにおけるシンタックスフィールドに基づいて、前記ビットストリームで符号化された動きベクトルを使用するか、スケーリングファクタにより割られた動きベクトルの商を使用するかを決定するデコーダを含む、
    ことを特徴とする空間スケーラブルビデオデコーダ。
JP2008506472A 2005-04-14 2006-03-20 空間スケーラブルビデオ符号化及び復号化向けスライス適応型動きベクトル符号化のための方法及び装置 Pending JP2008536451A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67125705P 2005-04-14 2005-04-14
PCT/US2006/009915 WO2006113019A1 (en) 2005-04-14 2006-03-20 Method and apparatus for slice adaptive motion vector coding for spatial scalable video encoding and decoding

Publications (1)

Publication Number Publication Date
JP2008536451A true JP2008536451A (ja) 2008-09-04

Family

ID=36604210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008506472A Pending JP2008536451A (ja) 2005-04-14 2006-03-20 空間スケーラブルビデオ符号化及び復号化向けスライス適応型動きベクトル符号化のための方法及び装置

Country Status (8)

Country Link
US (1) US8553777B2 (ja)
EP (1) EP1869894A1 (ja)
JP (1) JP2008536451A (ja)
KR (1) KR101292676B1 (ja)
CN (2) CN101662683B (ja)
BR (1) BRPI0610667A2 (ja)
MX (1) MX2007012646A (ja)
WO (1) WO2006113019A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009544176A (ja) * 2006-03-29 2009-12-10 ヴィドヨ,インコーポレーテッド スケーラブルビデオコーデックと非スケーラブルビデオコーデックとの間でトランスコードを行うためのシステム及び方法
JP2013531401A (ja) * 2010-07-16 2013-08-01 シャープ株式会社 低解像度データを用いて低解像度時の電力を削減するビデオデコーダ

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6882685B2 (en) 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US8780957B2 (en) * 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
US9197912B2 (en) * 2005-03-10 2015-11-24 Qualcomm Incorporated Content classification for multimedia processing
US7894523B2 (en) * 2005-09-05 2011-02-22 Lg Electronics Inc. Method for modeling coding information of a video signal for compressing/decompressing coding information
US8879856B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US8948260B2 (en) * 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US8654848B2 (en) 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US20070171280A1 (en) * 2005-10-24 2007-07-26 Qualcomm Incorporated Inverse telecine algorithm based on state machine
US9131164B2 (en) * 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
JP4747975B2 (ja) * 2006-07-14 2011-08-17 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
US9001899B2 (en) * 2006-09-15 2015-04-07 Freescale Semiconductor, Inc. Video information processing system with selective chroma deblock filtering
US9961372B2 (en) 2006-12-08 2018-05-01 Nxp Usa, Inc. Adaptive disabling of deblock filtering based on a content characteristic of video information
US9445128B2 (en) * 2006-12-08 2016-09-13 Freescale Semiconductor, Inc. System and method of determining deblocking control flag of scalable video system for indicating presentation of deblocking parameters for multiple layers
US8942289B2 (en) * 2007-02-21 2015-01-27 Microsoft Corporation Computational complexity and precision control in transform-based digital media codec
US8488680B2 (en) * 2008-07-30 2013-07-16 Stmicroelectronics S.R.L. Encoding and decoding methods and apparatus, signal and computer program product therefor
WO2010036772A2 (en) 2008-09-26 2010-04-01 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
JP2010288110A (ja) * 2009-06-12 2010-12-24 Sony Corp 画像処理装置および画像処理方法
CN102860008B (zh) * 2010-01-06 2016-05-11 杜比实验室特许公司 用于多层视频系统的复杂度自适应可伸缩解码及流处理
US8885714B2 (en) * 2010-01-14 2014-11-11 Texas Instruments Incorporated Method and system for intracoding in video encoding
EP3481066B1 (en) 2011-06-28 2021-05-19 LG Electronics Inc. Method for deriving a motion vector predictor
US11647197B2 (en) 2011-06-30 2023-05-09 Velos Media, Llc Context initialization based on slice header flag and slice type
US9338465B2 (en) 2011-06-30 2016-05-10 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
EP2868078A4 (en) * 2012-06-27 2016-07-27 Intel Corp PREDICTION OF RESIDUES BETWEEN LAYERS AND BETWEEN CHANNELS
US9743097B2 (en) * 2013-03-01 2017-08-22 Qualcomm Incorporated Spatial motion vector scaling for scalable video coding
US9311735B1 (en) * 2014-11-21 2016-04-12 Adobe Systems Incorporated Cloud based content aware fill for images
TWI762260B (zh) 2016-02-09 2022-04-21 弗勞恩霍夫爾協會 用於圖像/視訊資料串流而允許有效可縮減性或有效隨機存取之技術

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW358296B (en) 1996-11-12 1999-05-11 Matsushita Electric Ind Co Ltd Digital picture encoding method and digital picture encoding apparatus, digital picture decoding method and digital picture decoding apparatus, and data storage medium
US6018368A (en) * 1997-07-11 2000-01-25 Samsung Electro-Mechanics Co., Ltd. Scalable encoding apparatus and method with improved function of scaling motion vector
US6292512B1 (en) * 1998-07-06 2001-09-18 U.S. Philips Corporation Scalable video coding system
KR20020030101A (ko) 2000-06-30 2002-04-22 요트.게.아. 롤페즈 비디오 시퀀스의 압축을 위한 인코딩 방법
WO2002032143A2 (en) * 2000-10-09 2002-04-18 Snell & Wilcox Limited Compression of motion vectors
KR20040054744A (ko) * 2001-10-26 2004-06-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 적응 콘텐트 필터링을 사용하는 공간 스케일가능 압축 체계
US7068722B2 (en) * 2002-09-25 2006-06-27 Lsi Logic Corporation Content adaptive video processor using motion compensation
CN1225910C (zh) * 2002-09-26 2005-11-02 华为技术有限公司 一种视频编码方法
WO2004114672A1 (en) 2003-06-19 2004-12-29 Thomson Licensing S.A. Method and apparatus for low-complexity spatial scalable encoding
JP4965429B2 (ja) * 2004-04-02 2012-07-04 トムソン ライセンシング 複雑度スケーラブルなビデオエンコーダの方法及び装置
JP2008507194A (ja) * 2004-07-15 2008-03-06 サムスン エレクトロニクス カンパニー リミテッド 動き情報符号化装置及び方法、動き情報復号化装置及び方法、これを採用したスケーラブル映像符号化装置及び方法とスケーラブル映像復号化装置及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009544176A (ja) * 2006-03-29 2009-12-10 ヴィドヨ,インコーポレーテッド スケーラブルビデオコーデックと非スケーラブルビデオコーデックとの間でトランスコードを行うためのシステム及び方法
JP2013531401A (ja) * 2010-07-16 2013-08-01 シャープ株式会社 低解像度データを用いて低解像度時の電力を削減するビデオデコーダ

Also Published As

Publication number Publication date
WO2006113019A1 (en) 2006-10-26
MX2007012646A (es) 2007-12-13
CN101662683A (zh) 2010-03-03
US8553777B2 (en) 2013-10-08
KR101292676B1 (ko) 2013-08-02
CN101160975B (zh) 2012-05-30
KR20080006547A (ko) 2008-01-16
EP1869894A1 (en) 2007-12-26
CN101160975A (zh) 2008-04-09
BRPI0610667A2 (pt) 2010-07-13
US20090074070A1 (en) 2009-03-19
CN101662683B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
JP2008536451A (ja) 空間スケーラブルビデオ符号化及び復号化向けスライス適応型動きベクトル符号化のための方法及び装置
KR101277355B1 (ko) 복잡도 스케일러블 비디오 인코딩 및 디코딩을 위한 방법및 장치
US8116376B2 (en) Complexity scalable video decoding
CN108028931B (zh) 用于视频编解码的自适应帧间预测的方法及装置
US20090010333A1 (en) Method and Apparatus for Constrained Prediction for Reduced Resolution Update Mode and Complexity Scalability in Video Encoders and Decoders
US20060146931A1 (en) Method and apparatus for low-complexity spatial scalable encoding
US20060193384A1 (en) Method and apparatus for low-complexity spatial scalable decoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120124

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120522