JP5823430B2 - コンプレクシティスケーラブル映像符号化復号化方法及び装置 - Google Patents

コンプレクシティスケーラブル映像符号化復号化方法及び装置 Download PDF

Info

Publication number
JP5823430B2
JP5823430B2 JP2013044770A JP2013044770A JP5823430B2 JP 5823430 B2 JP5823430 B2 JP 5823430B2 JP 2013044770 A JP2013044770 A JP 2013044770A JP 2013044770 A JP2013044770 A JP 2013044770A JP 5823430 B2 JP5823430 B2 JP 5823430B2
Authority
JP
Japan
Prior art keywords
base layer
picture
reference picture
upsampling
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013044770A
Other languages
English (en)
Other versions
JP2013146092A (ja
Inventor
イン,ペン
ボイス,ジル,マクドナルド
パンディット,パーヴィン,ビバス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2013146092A publication Critical patent/JP2013146092A/ja
Application granted granted Critical
Publication of JP5823430B2 publication Critical patent/JP5823430B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

[関連出願の相互参照]
本出願は、そのすべてが参照することによりここに含まれる2004年10月13日に出願された米国仮出願第60/618,254号の利益を主張する。
[発明の分野]
本発明は、一般に映像符号化復号化に関し、より詳細には、スケーラブルコンプレクシティ映像符号化復号化方法及び装置に関する。
サイマルキャスト符号化のビットレートの不利益を受けることなく、ブロードキャスト映像アプリケーションが各種ユーザ装置に対するサポートを提供することが望ましい。映像復号化は複雑な処理であり、コンプレクシティは符号化される映像の解像度に大きく依存する。低電力の携帯装置は、典型的には、極めて厳格なコンプレクシティ制約及び低解像度ディスプレイを有する。異なる解像度に対応する2以上の映像ビットストリームのサイマルキャストブロードキャストは、低解像度装置のコンプレクシティ要求を解消するのに利用可能であるが、本発明によるコンプレクシティスケーラブルシステムより高いトータルビットレートを要求する。従って、高い映像符号化ビットレート効率を維持しながら、コンプレクシティスケーラブルデコーダを可能にする手段が必要とされる。
MPEG−2及びMPEG−4規格のスケーラビリティプロファイルにおいて、SNRスケーラビリティ、空間スケーラビリティ、時間スケーラビリティ及びファイングレインスケーラビリティを含む多数のスケーラビリティ方法が広範に研究及び規格化されてきた。スケーラブル符号化における研究の大部分は、低解像度レイヤが限られた帯域幅を有するビットレートスケーラビリティを対象としてきた。図1に示されるように、典型的な空間スケーラビリティシステムが、参照番号100により全体表示される。システム100は、映像シーケンスを受信するためのコンプレクシティスケーラブルビデオエンコーダ110を有する。コンプレクシティスケーラブルビデオエンコーダ110の第1出力は、低帯域幅ネットワーク120とマルチプレクサ130の第1入力とに信号通信接続される。コンプレクシティスケーラブルビデオエンコーダ110の第2出力は、マルチプレクサ130の第2入力と信号通信接続される。低帯域幅ネットワーク120の出力は、低解像度デコーダ140の入力と信号通信接続される。マルチプレクサ130の出力は、高帯域幅ネットワーク150の入力と信号通信接続される。高帯域幅ネットワーク150の出力は、デマルチプレクサ160の入力と信号通信接続される。デマルチプレクサ160の第1出力は、高解像度デコーダ170の第1入力と信号通信接続され、デマルチプレクサ160の第2出力は、高解像度デコーダ170の第2入力と信号通信接続される。低解像度デコーダ140の出力は、ベースレイヤビットストリームについてシステム100の出力として利用可能であり、高解像度デコーダ170の出力は、スケーラブルビットストリームについてシステム100の出力として利用可能である。
スケーラブル符号化は、エンコーダ及びデコーダコンプレクシティの大きな増大のため、またスケーラブルエンコーダの符号化効率は、典型的には、非スケーラブルエンコーダのものより低いため、実際的には広くは採用されていない。
空間スケーラブルエンコーダ及びデコーダは、典型的には、高解像度スケーラブルエンコーダ/デコーダが、通常の高解像度エンコーダ/デコーダより追加的機能を提供することを要求している。MPEG−2空間スケーラブルエンコーダでは、低解像度リファレンスピクチャ又は高解像度リファレンスピクチャから予測が実行される判断される。MPEG−2空間スケーラブルデコーダは、低解像度リファレンスピクチャ又は高解像度リファレンスピクチャの何れかから予測可能でなければならない。低解像度ピクチャについてのものと、高解像度ピクチャについてのものの2つのリファレンスピクチャセットが、MPEG−2空間スケーラブルエンコーダ/デコーダによって求められる。図2は、従来技術による2つのレイヤをサポートする低コンプレクシティ空間スケーラブルエンコーダ200のブロック図を示す。図3は、従来技術による2つのレイヤをサポートする低コンプレクシティ空間スケーラブルデコーダ300のブロック図を示す。
図2を参照するに、2つのレイヤをサポートする空間スケーラブルビデオエンコーダが、参照番号200により全体表示される。ビデオエンコーダ200は、高解像度入力映像シーケンスを受け付けるダウンサンプラ210を有する。ダウンサンプラ210は、低解像度非スケーラブルエンコーダ212と信号通信接続され、さらに低解像度非スケーラブルエンコーダ212は、低解像度フレームストア214に信号通信接続される。低解像度非スケーラブルエンコーダ212は、低解像度ビットストリームを出力し、さらに低解像度非スケーラブルデコーダ220と信号通信接続される。
低解像度非スケーラブルデコーダ220は、アップサンプラ230に信号通信接続され、さらにアップサンプラ230は、スケーラブル高解像度エンコーダ240に信号通信接続される。スケーラブル高解像度エンコーダ240はまた、高解像度入力映像シーケンスを受け付け、高解像度フレームストア250と信号通信接続され、高解像度スケーラブルビットストリームを出力する。低解像度非スケーラブルエンコーダ212の出力と、スケーラブル高解像度エンコーダの出力とは、空間スケーラブルビデオエンコーダ200の出力として利用可能である。
このため、高解像度入力映像シーケンスは、低コンプレクシティエンコーダ200により受け付けされ、低解像度映像シーケンスを生成するためダウンサンプリングされる。低解像度映像シーケンスは、非スケーラブル低解像度ビデオ圧縮エンコーダを用いて符号化され、低解像度ビットストリームを生成する。低解像度ビットストリームは、非スケーラブル低解像度ビデオ圧縮デコーダを用いて復号化される。この機能は、エンコーダの代わりに実行されてもよい。復号化された低解像度シーケンスは、アップサンプリングされ、スケーラブル高解像度エンコーダへの2つの入力の1つとして提供される。スケーラブル高解像度エンコーダは、高解像度スケーラブルビットストリームを生成するため、当該映像を符号化する。
図3を参照するに、2つのレイヤをサポートする空間スケーラブルビデオデコーダは、参照番号300により全体表示される。ビデオデコーダ300は、低解像度フレームストア362と信号通信接続される低解像度ビットストリームを受け付ける低解像度デコーダ360を有し、低解像度映像シーケンスを出力する。低解像度デコーダ360はさらに、アップサンプラ370と信号通信接続され、アップサンプラ370はさらに、スケーラブル高解像度デコーダ380と信号通信接続される。
スケーラブル高解像度デコーダ380はさらに、高解像度フレームストア390と信号通信接続される。スケーラブル高解像度デコーダ380は、高解像度スケーラブルビットストリームを受け付け、高解像度映像シーケンスを出力する。低解像度デコーダ360の出力とスケーラブル高解像度デコーダの出力とは、空間スケーラブルビデオデコーダ300の出力として利用可能である。
このため、高解像度スケーラブルビットストリームと低解像度ビットストリームは共に、低コンプレクシティデコーダ300により受け付けられる。低解像度ビットストリームは、低解像度フレームストアを利用する非スケーラブル低解像度ビデオ圧縮デコーダを用いて復号化される。復号化された低解像度映像は、アップサンプリングされ、その後に高解像度スケーラブルデコーダに入力される。高解像度スケーラブルデコーダは、高解像度フレームストアセットを利用し、高解像度出力映像シーケンスを生成する。
図4を参照するに、非スケーラブルビデオエンコーダが、参照番号400により全体表示される。ビデオエンコーダ400への入力は、加算結合部410の非反転入力と信号通信接続される。加算結合部410は、変換装置/量子化装置420と信号通信接続される。変換装置/量子化装置420の出力は、エントロピー符号化装置440と信号通信接続される。エントロピー符号化装置440の出力は、エンコーダ400の出力として利用可能である。
変換装置/量子化装置420の出力はさらに、逆変換装置/量子化装置450と信号通信接続される。逆変換装置/量子化装置450の出力は、デブロックフィルタ460の入力と信号通信接続される。デブロックフィルタ460の出力は、リファレンスピクチャストア470と信号通信接続される。リファレンスピクチャストア470の第1出力は、動き推定装置480の第1入力と信号通信接続される。エンコーダ400への入力がさらに、動き推定装置480の第2入力と信号通信接続される。動き推定装置480の出力は、動き補償装置490の第1入力と信号通信接続される。リファレンスピクチャストア470の第2出力は、動き補償装置490の第2入力と信号通信接続される。動き補償装置490の出力は、加算結合部410の反転入力と信号通信接続される。
図5を参照するに、非スケーラブルビデオデコーダが、参照番号500により全体表示される。ビデオデコーダ500は、映像シーケンスを受け付けるエントロピーデコーダ510を有する。エントロピーデコーダ510の第1出力は、逆量子化装置/変換装置520の入力と信号通信接続される。逆量子化装置/変換装置520の出力は、加算結合部540の第1入力と信号通信接続される。
加算結合部540の出力は、デブロックフィルタ590と信号通信接続される。デブロックフィルタ590の出力は、リファレンスピクチャストア550と信号通信接続される。リファレンスピクチャストア550は、動き補償装置560の第1入力と信号通信接続される。動き補償装置560の出力は、加算結合部540の第2入力と信号通信接続される。エントロピーデコーダ510の第2出力は、動き補償装置560の第2入力と信号通信接続される。デブロックフィルタ590の出力は、ビデオデコーダ500の出力として利用可能である。
H.264/MPEG AVCがRRU(Reduced Resolution Update)モードを利用するため拡張されることが提案されてきた。RRUモードは、フル解像度ピクチャの動き推定及び補償を実行しながら、符号化対象となる残差マクロブロック(MB)の個数を減少させることによって、ビットレートによる符号化効率を向上させる。図6を参照するに、RRUビデオエンコーダが、参照番号600により全体表示される。ビデオエンコーダ600への入力は、加算結合部610の非反転入力と信号通信接続される。加算結合部610の出力は、ダウンサンプラ612の入力と信号通信接続される。変換装置/量子化装置620の入力は、ダウンサンプラ612の出力又は加算結合部610の出力と信号通信接続される。変換装置/量子化装置620の出力は、エントロピー符号化装置640と信号通信接続される。エントロピー符号化装置640の出力は、ビデオエンコーダ600の出力として利用可能である。
変換装置/量子化装置620の出力はさらに、逆変換装置/量子化装置650の入力と信号通信接続される。逆変換装置/量子化装置650の出力は、アップサンプラ655の入力と信号通信接続される。デブロックフィルタ660の入力は、逆変換装置/量子化装置650の出力又はアップサンプラ655の出力と信号通信接続される。デブロックフィルタ660の入力は、リファレンスピクチャストア670の入力と信号通信接続される。リファレンスピクチャストア670の第1出力は、動き推定装置680の第1入力と信号通信接続される。エンコーダ600への入力はさらに、動き推定装置680の第2入力と信号通信接続される。動き推定装置680の出力は、動き補償装置690の第1入力と信号通信接続される。リファレンスピクチャストア670の第2出力は、動き補償装置690の第2入力と信号通信接続される。動き補償装置690の出力は、加算結合部610の反転入力と信号通信接続される。
図7を参照するに、RRUビデオデコーダが、参照番号700により全体表示される。ビデオデコーダ700は、映像シーケンスを受け付けるエントロピーデコーダ710を有する。エントロピーデコーダ710の出力は、逆量子化装置/変換装置720の入力と信号通信接続される。逆量子化装置/変換装置720の出力は、アップサンプラ722の入力と信号通信接続される。アップサンプラ722の出力は、加算結合部740の第1入力と信号通信接続される。
加算結合部740の出力は、デブロックフィルタ790と信号通信接続される。デブロックフィルタ790の出力は、フル解像度リファレンスピクチャストア750の入力と信号通信接続される。デブロックフィルタ790の出力はまた、ビデオデコーダ700の出力として利用可能である。フル解像度リファレンスピクチャストア750の出力は、動き補償装置760と信号通信接続され、動き補償装置760は、加算結合部740の第2入力と信号通信接続される。
RRUコンセプトを用いてコンプレクシティスケーラブルコーデックを設計することが提案されてきた。一例として、異なる2つのデコーダコンプレクシティ及び解像度のレベルをサポートするシステムが提供される。低解像度デコーダは、より小さな表示サイズを有し、大変厳しいデコーダコンプレクシティ制約を有する。フル解像度デコーダは、より大きな表示サイズを有し、あまり厳しくはないが依然として重要なデコーダコンプレクシティ制約を有する。ブロードキャスト又はマルチキャストシステムは、BRbaseのビットレートによるベースレイヤと、BRenhanのビットレートによるエンハンスメントレイヤとの2つのビットストリームを伝送する。これら2つのビットストリームは、一緒に多重化され、1つのトランスポートストリームにより送信されてもよい。図8を参照するに、コンプレクシティスケーラブルブロードキャストシステムが、参照番号800により全体表示される。システム800は、コンプレクシティスケーラブルビデオエンコーダ、低解像度デコーダ及びフル解像度デコーダを有する。コンプレクシティスケーラブルブロードキャストシステム800は、コンプレクシティスケーラブルビデオエンコーダ810を有する。コンプレクシティスケーラブルビデオエンコーダの第2出力は、マルチプレクサ820の第2入力と信号通信接続される。コンプレクシティスケーラブルビデオエンコーダ810の第2出力は、マルチプレクサ820の第2入力と信号通信接続される。マルチプレクサ820の出力は、ネットワーク830と信号通信接続される。ネットワーク830の出力は、第1デマルチプレクサ840の入力と第2デマルチプレクサ850の入力と信号通信接続される。第1デマルチプレクサ840の出力は、低解像度デコーダ850の入力と信号通信接続される。第2デマルチプレクサ860の第1出力は、フル解像度デコーダ870の第1入力と信号通信接続される。第2デマルチプレクサ860の第2出力は、フル解像度デコーダ870の第2入力と信号通信接続される。低解像度デコーダ850の出力は、ベースレイヤビットストリームについてシステム800の出力として利用可能であり、フル解像度デコーダ870の出力は、スケーラブルビットストリームについてシステム800の出力として利用可能である。
低解像度デコーダ850は、ベースレイヤビットストリームのみを処理し、フル解像度デコーダ870は、ベースレイヤビットストリームとエンハンスメントレイヤビットストリームの両方を処理する。RRUは、デコーダにおいて異なるコンプレクシティにより低解像度及び高解像度シーケンスの両方に復号化できるベースレイヤにおいて利用される。エンハンスメントレイヤビットストリームは、フル解像度動き補償により実行されたベースレイヤビットストリームの復号化の結果として追加されるべきフル解像度誤差信号を有する。エンハンスメントレイヤのビットレートは、ベースレイヤのものより最終的に低くなる可能性があり、ベースレイヤビットレートが典型的には、エンハンスメントレイヤビットレートと比較して小さくなる典型的な空間スケーラビリティのケースと異なる。フル解像度誤差信号は、すべての符号化されたマクロブロック又はスライス/ピクチャについて送信される必要はない。
従来技術の上記及び他の問題点及び欠点が、スケーラブルコンプレクシティ映像符号化及び復号化のための方法及び装置に関する本発明によって解決される。
本発明の特徴によると、ビデオビットストリームを復号化するスケーラブルコンプレクシティビデオデコーダが提供される。本ビデオデコーダは、第1合成装置と、第2合成装置と、デブロックフィルタとを有する。第1合成装置は、デブロック処理を適用することなく、表示用の再構成されたアップサンプリングベースレイヤピクチャを形成するため、フル解像度動き補償予測と復号化されたアップサンプリングベースレイヤ残差とを合成するためのものである。第2合成装置は、第1合成装置と信号通信し、再構成されたフル解像度エンハンスメントレイヤピクチャを形成するため、再構成されたアップサンプリングベースレイヤピクチャと復号化されたエンハンスメントレイヤ残差とを合成するためのものである。デブロックフィルタは、第2合成装置と信号通信し、表示用のフィルタリングされた再構成されたフル解像度エンハンスメントレイヤピクチャを出力するため、再構成されたフル解像度エンハンスメントレイヤピクチャのみに対してデブロック処理を実行するためのものである。
本発明の他の特徴によると、ビデオビットストリームを復号化する空間スケーラブルビデオデコーダが提供される。本ビデオデコーダは、アップサンプラとデブロックフィルタとを有する。アップサンプラは、アップサンプリング予測残差を形成するため、ビデオビットストリームに対応する符号化予測残差に対してアップサンプリング処理を実行するためのものである。デブロックフィルタは、アップサンプリング処理の前又は後に、デブロック処理を実行するためのものである。
本発明のさらなる他の特徴によると、ビデオビットストリームを復号化する空間スケーラブルビデオデコーダが提供される。本ビデオデコーダは、アップサンプラと、リファレンスピクチャストアとを有する。アップサンプルは、アップサンプリングされたベースレイヤ予測残差を形成するため、ベースレイヤ予測残差をアップサンプリングするためのものである。リファレンスピクチャストアは、アップサンプリングベースレイヤ予測残差と対応する前のフル解像度リファレンスピクチャとから形成されるアップサンプリングベースレイヤリファレンスピクチャを格納するためのものである。
本発明のさらなる他の特徴によると、複数のピクチャのビデオ信号データを符号化する空間スケーラブルビデオエンコーダが提供される。本ビデオエンコーダは、イントラ符号化手段と、インター符号化手段とを有する。イントラ符号化手段は、イントラ符号化ピクチャを形成するため、レイヤ化符号化技術を利用してイントラ符号化を実行するためのものである。インター符号化手段は、インター符号化ピクチャを形成するため、RRU(Reduced Resolution Update)を利用してインター符号化を実行するためのものである。インター符号化手段は、ダウンサンプリング低解像度予測残差を形成するため、予測残差をダウンサンプリングするダウンサンプラを有する。インター符号化手段はさらに、ダウンサンプラと信号通信し、ダウンサンプリング低解像度予測残差を符号化する変換装置/量子化装置を有する。
本発明のさらなる特徴によると、ビデオビットストリームを復号化するスケーラブルコンプレクシティ方法が提供される。本方法は、デブロック処理を適用することなく、表示用の再構成されたアップサンプリングベースレイヤピクチャを形成するため、フル解像度動き補償予測と復号化されたアップサンプリングベースレイヤ残差とを合成するステップを有する。本方法はさらに、再構成されたフル解像度エンハンスメントレイヤピクチャを形成するため、再構成されたアップサンプリングベースレイヤピクチャと復号化されたエンハンスメントレイヤ残差とを合成するステップを有する。本方法はまた、表示用のフィルタリングされた再構成されたフル解像度エンハンスメントレイヤピクチャを出力するため、再構成された解像度エンハンスメントレイヤピクチャのみに対してデブロック処理を実行するステップを有する。
本発明のさらなる他の特徴によると、ビデオビットストリームを復号化する空間スケーラブル方法が提供される。本方法は、アップサンプリング予測残差を形成するため、ビデオビットストリームに対応する符号化予測残差に対してアップサンプリング処理を実行するステップを有する。本方法はさらに、アップサンプリング処理の前又は後に、デブロック処理を実行するステップを有する。
本発明のさらなる特徴によると、ビデオビットストリームを復号化する空間スケーラブル方法が提供される。本方法は、アップサンプリングベースレイヤ予測残差を形成するため、ベースレイヤ予測残差をアップサンプリングするステップを有する。本方法はさらに、アップサンプリングベースレイヤ予測残差と対応する前のフル解像度リファレンスピクチャとから形成されるアップサンプリングベースレイヤリファレンスピクチャを格納するステップを有する。
本発明のさらなる他の特徴によると、複数のピクチャのビデオ信号データを符号化する空間スケーラブル方法が提供される。本方法は、イントラ符号化ピクチャを形成するため、レイヤ化符号化技術を利用してイントラ符号化を実行するステップを有する。本方法はさらに、インター符号化ピクチャを形成するため、RRU技術を利用してインター符号化を実行するステップを有する。インター符号化ステップは、ダウンサンプリング低解像度予測残差を形成するため、予測残差をダウンサンプリングするステップを有する。インター符号化ステップはさらに、ダウンサンプリング低解像度予測残差を符号化するステップを有する。
本発明によると、スケーラブルコンプレクシティ映像符号化及び復号化のための方法及び装置を提供することができる。本発明の上記及び他の特徴及び効果は、添付した図面と共に参照される以下の実施例の詳細な説明から明らかになるであろう。
図1は、従来技術による典型的な空間スケーラビリティシステムのブロック図を示す。 図2は、従来技術による2つのレイヤをサポートする空間スケーラブルエンコーダのブロック図を示す。 図3は、従来技術による2つのレイヤをサポートする空間スケーラブルデコーダのブロック図を示す。 図4は、従来技術によるH.264/MPEG AVC規格により用いられる通常の非スケーラブルビデオエンコーダのブロック図を示す。 図5は、従来技術によるH.264/MPEG AVC規格により用いられる通常の非スケーラブルビデオデコーダのブロック図を示す。 図6は、従来技術によるRRU(Reduced Resolution Update)ビデオエンコーダのブロック図を示す。 図7は、従来技術によるRRUビデオデコーダのブロック図を示す。 図8は、従来技術によるコンプレクシティスケーラブルブロードキャストシステムのブロック図を示す。 図9は、本発明が適用される低解像度コンプレクシティスケーラブルビデオデコーダのブロック図を示す。 図10は、本発明が適用される高解像度コンプレクシティスケーラブルビデオデコーダのブロック図を示す。 図11は、本発明が適用されるコンプレクシティスケーラブルビデオエンコーダのブロック図を示す。 図12は、本発明の原理によるコンプレクシティスケーラブルのブロック図を示す。 図13は、本発明の原理によるフル解像度により映像データを復号化する方法のフロー図を示す。 図14Aは、本発明の原理によるスライスヘッダシンタックスのテーブルを示す。 図14Bは、本発明の原理によるスライスヘッダシンタックスのテーブルを示す。 図14Cは、本発明の原理によるスライスヘッダシンタックスのテーブルを示す。 図14Dは、本発明の原理によるスライスヘッダシンタックスのテーブルを示す。 図15は、本発明の原理によるNALユニットタイプコードのテーブルを示す。 図16は、本発明の原理による低解像度により映像データを復号化する方法のフロー図を示す。 図17は、本発明の原理による映像データを符号化する方法のフロー図を示す。
本発明は、スケーラブルコンプレクシティ映像符号化及び復号化のための方法及び装置に関する。本発明の一実施例では、最も低い解像度レイヤを維持しながら、2以上のレイヤのトータルビットレートが最適化される。
本記載は、本発明の原理を説明する。従って、当業者は、ここで明示的には記載又は図示されないが、本発明の原理を実現し、その精神及び範囲内に含まれる各種構成を当業者が創出可能であるということを理解するであろう。
ここに記載されるすべての実施例及び条件付き言語は、本発明の原理及び発明者によって寄与した従来技術に対する進歩となるコンセプトを読者が理解するのに役立つことを意図したものであり、このように具体的に記載された実施例及び条件に制限されることなく解釈されるべきである。
さらに、本発明の原理、特徴及び実施例と共にその具体例を記載するここでのすべての記載は、それの構造的及び機能的な均等物を含むものと意図される。さらに、このような均等物は、現在知られている均等物と共に、将来開発される均等物、すなわち、構造に関係なく同一の機能を実行するよう開発された任意の要素を含むことが意図される。
従って、例えば、ここに与えられるブロック図が本発明の原理を実現する例示的回路の概念図を表すことが、当業者により理解されるであろう。同様に、フローチャート、フロー図、状態遷移図、擬似コードなどが、コンピュータ可読媒体により実質的に表現可能であり、このため、明示的に図示されていないかもしれないが、コンピュータ又はプロセッサにより実行可能である各種プロセスを表すことが理解される。
図面に示される各種要素の機能は、専用のハードウェアと共に適切なソフトウェアと連関してソフトウェアを実行可能なハードウェアを利用することにより提供されるかもしれない。プロセッサにより提供されるとき、当該機能は、単一の専用プロセッサ、単一の共有プロセッサ又はその一部が共有可能な複数の個別のプロセッサによって提供されてもよい。さらに、「プロセッサ」又は「コントローラ」という用語の明示的使用は、ソフトウェアを実行可能なハードウェアのみを表すものと解釈されるべきでなく、以下に限定されるものではないが、デジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを格納するROM(Read Only Memory)、RAM(Random Access Memory)及び不揮発性ストレージを非明示的に含むかもしれない。
他のハードウェア、従来のハードウェア及び/又はカスタムハードウェアもまた含まれるかもしれない。同様に、図示されるスイッチは、概念的なものである。それらの機能は、プログラムロジックの実行、専用ロジック、プログラムコントロールと専用ロジックのやりとりを介し、又は手動により実行されてもよく、実現者により選択可能な技術がここでの記載からより具体的に理解される。
その請求項において、指定された機能を実行する手段として表現される要素は、a)当該機能を実行する回路要素の組み合わせ、又はb)当該機能を実行するためソフトウェアを実行するのに適切な回路と共に、ファームウェア、マイクロコードなどを含む何れかの形式によるソフトウェアなどを含む、当該機能を実行する任意の方法を含むことが意図される。このような請求項によって規定されるような本発明は、記載された各手段によって提供される機能が、請求項が求める方法により合成されるという事実に属する。このため、当該機能を提供可能な要素はここに示されるものと均等であるとみなされる。
図9を参照するに、低解像度コンプレクシティスケーラブルビデオデコーダが、参照番号900により全体表示される。ビデオデコーダ900は、映像シーケンスを受け付けるエントロピーデコーダ910を有する。エントロピーデコーダ910の第1出力は、逆量子化装置/変換装置920の入力と信号通信接続される。逆量子化装置/変換装置920の出力は、加算結合部940の第1入力と信号通信接続される。
加算結合部940の出力は、デブロックフィルタ990と信号通信接続される。デブロックフィルタの出力は、リファレンスピクチャストア950の入力と信号通信接続される。デブロックフィルタ990の出力はまた、ビデオデコーダ900の出力として利用可能である。リファレンスピクチャストア950の出力は、動き補償装置960の第1入力と信号通信接続される。動き補償装置960の出力は、加算結合部940の第2入力と信号通信接続される。エントロピーデコーダ910の第2出力は、動きベクトル(MV)解像度低減装置999の入力と信号通信接続される。MV低減装置999の出力は、動き補償装置960の第2入力と信号通信接続される。
デコーダ900において、ベースレイヤビットストリームは、エントロピー復号化される。動きベクトルは、低解像度に対応する精度に低減するよう丸められる。この低解像度スケーラブルデコーダのコンプレクシティは、動きベクトルのスケーリングが大変低いコンプレクシティしか有しないため、非スケーラブルデコーダのものと大変類似している。2の係数が、低解像度とフル解像度との間の各サイズの解像度レシオで使用される場合、ラウンドアップ又はラウンドダウンがシステムにより選択されているかに依存して、丸め処理は左シフト又は右シフトのみにより実現可能である。
図10を参照するに、高解像度コンプレクシティスケーラブルビデオデコーダ1000が、参照番号1000により全体表示される。ビデオデコーダ1000は、ベースレイヤビットストリームを受け付ける第1エントロピーデコーダ1005を有する。第1エントロピーデコーダ1005の出力は、第1逆量子化装置/変換装置1010の入力と信号通信接続される。第1逆量子化装置/変換装置1010の出力は、アップサンプラ1015の入力と信号通信接続される。アップサンプラ1015の出力は、第1加算結合部1020の第1入力と信号通信接続される。
第1加算結合部1020の出力は、第2加算結合部1025の第1入力と信号通信接続される。フル解像度リファレンスピクチャストア1030の出力は、動き補償装置1035の第1入力と信号通信接続される。エントロピーデコーダ(動きベクトル(MV)を出力するための)1005の第2出力は、動き補償装置1035の第2入力と信号通信接続される。動き補償装置1035の出力は、第1加算結合部1020の第2入力と信号通信接続される。
第2エントロピーデコーダ1040の入力は、エンハンストレイヤビットストリームを受け付けるためのものである。第2エントロピーデコーダ1040の出力は、第2逆量子化装置/変換装置1045の入力と信号通信接続される。第2量子化装置/変換装置1045の出力は、第2加算結合部1025の第2入力と信号通信接続される。
デブロックフィルタ1050への入力は、第1加算結合部1020の出力又は第2加算結合部1025の出力に信号通信接続される。デブロックフィルタ1050の出力は、フル解像度リファレンスピクチャストア1030の入力と信号通信接続される。デブロックフィルタ1050の出力は、ビデオデコーダ1000の出力として利用可能である。
デコーダ1000のベースレイヤビットストリーム上で動作する部分は、RRUデコーダと類似している。エントロピー復号化、逆量子化及び逆変換の後、残差がアップサンプリングされる。フル解像度予測を生成するため、動き補償がフル解像度リファレンスピクチャに適用され、アップサンプリングされた残差が当該予測に追加される。フル解像度誤差信号がエンハンスメントレイヤビットストリームに存在する場合、それはエントロピー復号化、逆量子化及び変換され、その後、RRU再構成信号に追加される。デブロッキングフィルタがその後に適用される。
図11を参照するに、コンプレクシティスケーラブルビデオエンコーダが、参照番号1100により全体表示される。ビデオエンコーダ1100への入力は、第1加算結合部1105の非反転入力と信号通信接続される。第1加算結合部1105の出力は、ダウンサンプラ1112の入力と信号通信接続される。ダウンサンプラ1112の出力は、第1変換装置/量子化装置1115の入力と信号通信接続される。第1変換装置/量子化装置1115の出力は、第1エントロピー符号化装置1120の入力と信号通信接続される。第1エントロピー符号化装置1120の出力は、ベースレイヤビットストリームについてのエンコーダ1100の出力として利用可能である。
第1変換装置/量子化装置1115の出力はさらに、第1逆変換装置/量子化装置1125の入力と信号通信接続される。第1逆変換装置/量子化装置1125の出力は、アップサンプラ1155の入力と信号通信接続される。アップサンプラ1155の出力は、第2加算結合部1160の反転入力と第3加算結合部1165の第1非反転入力とに信号通信接続される。
ビデオエンコーダ1100への入力はさらに、第2加算結合部1160の非反転入力と信号通信接続される。第2加算結合部1160の出力は、スイッチ1162の入力と信号通信接続される。スイッチ1162の出力は、第2変換装置/量子化装置1170への入力と信号通信接続される。第2変換装置/量子化装置1170の出力は、第2エントロピー符号化装置1175の入力と信号通信接続される。第2エントロピー符号化装置1175の出力は、エンハンストレイヤビットストリームについてエンコーダ1100の出力として利用可能である。第2変換装置/量子化装置1170の出力はさらに、第2逆変換装置/量子化装置1180の入力と信号通信接続される。第2逆変換装置/量子化装置1180の出力は、第3加算結合部1165の第2非反転入力と信号通信接続される。
ビデオエンコーダ1100への入力はさらに、動き推定装置1185の第1入力と信号通信接続される。動き推定装置1185の出力は、動き補償装置1190の第1入力と信号通信接続される。動き補償装置1190の出力は、第1加算結合部1105の反転入力と信号通信接続される。フル解像度リファレンスピクチャストア1192の第1出力は、動き推定装置1185の第2入力と信号通信接続される。フル解像度リファレンスピクチャストア1192の第2出力は、動き補償装置1190の第2入力と信号通信接続される。フル解像度リファレンスピクチャストア1192の入力は、デブロックフィルタ1195の出力と信号通信接続される。デブロックフィルタ1195の入力は、スイッチ1191の出力と信号通信接続される。スイッチ1191の他の入力は、第3加算結合部1165の出力と信号通信接続される。
エンコーダ1100は、低解像度映像クオリティでなくフル解像度映像クオリティを最適化しようとする。動き推定は、フル解像度ビデオピクチャに対して実行される。動き補償された予測を入力ピクチャから減算した後、予測残差がダウンサンプリングされる。RRUコーデックと異なって、低解像度デコーダが常に復号化すべきピクチャを有することが可能となるように、ダウンサンプリングがすべてのピクチャに適用される。ダウンサンプリングされた残差は、変換、量子化及びエントロピー符号化される。これは、ベースレイヤビットストリームを構成する。逆量子化装置及び逆変換装置が適用され、その後、符号化された残差がフル解像度までアップサンプリングされる。エンコーダ1100は、エンハンスメントレイヤにピクチャ又はスライスのフル解像度誤差信号を送信するか否か選択することができる。一般に、すべてのIスライスについて、エンハンスメントレイヤフル解像度誤差信号が符号化され、フル解像度入力ピクチャが復号化されたアップサンプリングされたものを減算するとき、誤差信号の大きさに基づきP及びBスライスについて任意的に送信可能である。エンハンスメントレイヤフル解像度誤差信号が符号化される場合、符号化されたベースレイヤのアップサンプリングされた符号化ピクチャが、入力フル解像度ピクチャから減算される。その後、この差分が量子化、変換及びエントロピー符号化され、エンハンスメントレイヤビットストリームを形成する。エンハンスメントレイヤビットストリームは、イントラ符号化スライスのみを有するものとしてみることができる。
本発明の原理によると、新たなコンプレクシティスケーラブルビデオエンコーダ及びデコーダが説明される。すべてのタイプのスライスにRRUを利用する図8に関して図示及び説明された従来技術のアプローチと対照的に、本発明では、RRUはインターピクチャ(P及びB)についてベースレイヤで利用され、従来の空間スケーラビリティアプローチは、イントラピクチャ(I)について利用される。従って、インターピクチャについて、ベースレイヤは、デコーダのコンプレクシティレベルに基づき、低解像度又はフル解像度シーケンスの両方に復号可能である。すなわち、動き推定/補償の後に形成される映像残差を符号化するのに用いられるビットは、低解像度デコーダとフル解像度デコーダの両方において使用される。ベースレイヤビットストリームにより送信される動きベクトルは、低解像度デコーダとフル解像度デコーダの両方において使用されるが、低解像度デコーダよりフル解像度デコーダにおいてより高い精度により利用される。また、動き補償予測が、低解像度デコーダでは低い解像度により、高解像度デコーダでは高い解像度により実行される。低解像度フレームストアが低解像度デコーダにおいて使用され、高解像度フレームストアが高解像度デコーダにおいて使用される。Iピクチャがベースレイヤに存在するときに限って、エンハンスメントレイヤが送信される。
すべての復号化処理は低解像度により実行されるため(逆量子化/変換、動き補償、デブロック処理)、低解像度デコーダのデコーダコンプレクシティは低く維持される。しかしながら、ベースレイヤビットストリームのビットレートは、サイマルキャスト又は空間スケーラブルビットストリームと比較して高くなる傾向があり、エントロピーデコーダのコンプレクシティに影響を与える。エンハンスメントレイヤがベースレイヤのIピクチャについてのみ存在するよう制限される場合、1つのレイヤのみの復号化が非Iピクチャについて必要とされるため、フル解像度デコーダのコンプレクシティは典型的な空間スケーラビリティデコーダより小さくなる。
Iフレームは、H.263などの従来技術による空間スケーラブルアプローチを用いて符号化される。ベースレイヤのIフレームは、H.264イントラ符号化アプローチを用いて低解像度として符号化される。ベースレイヤIフレームのエンハンスメントレイヤについて、H.263におけるアプローチはH.264の新たな特徴を組み込むことによって利用される。エンハンスメントレイヤピクチャは、アップサンプリングされた時間的に同期したベースレイヤリファレンスピクチャと前のベースレイヤフル解像度リファレンスピクチャとから予測可能である。当該アップサンプリングは、半サンプル補間(half−sample interpolation)のためのH.264に規定される6タップ補間フィルタ{1,−5,20,20,−5,1}/32又は他のバイリニアフィルタによって実行可能である。エンハンスメントレイヤのピクチャは、それが対応するアップサンプリングされたベースレイヤリファレンスIピクチャから予測される場合にはEIと、それがシンプル予測によって前のベースレイヤフル解像度リファレンスピクチャとアップサンプリングされたリファレンスIピクチャの両方から予測される場合にはEPと、それがバイ予測によって前のベースレイヤフル解像度リファレンスピクチャとアップサンプリングされたリファレンスIピクチャの両方から予測される場合にはEBと呼ばれる。EIピクチャは、H.264のIスライスシンタックスを用いて符号化される。すなわち、EIはまず、動きベクトルがゼロであると仮定することによって、フル解像度ピクチャとそれの対応するアップサンプリングされたベースレイヤリファレンスピクチャの残差として生成される。その後、この残差がIピクチャとして正確に符号化される。より詳細には、現在のマクロブロックと(アップサンプリングされた)再構成されたベースレイヤからの近隣マクロブロックの残差が、128を加え、(0,255)にクリッピングすることによって調整され、その後、AVC(Advanced Video Coding Standard)のサブクローズ8.3に規定されるものなど、空間イントラ予測に利用される。その後、128の減算と(−256,255)へのクリッピングが実行される。レイヤ間イントラ予測残差が、その後、再構成されたエンハンスメントレイヤマクロブロックを形成するため、(アップサンプリング)再構成されたベースレイヤに加えられる。EIを符号化する他の方法は、MPEG−2/MPEG−4/H.263などと同様に、空間予測なしに残差ピクチャを符号化することである。エンハンスメントレイヤピクチャが符号化されたEPであるとき、アップサンプリングされたベースレイヤリファレンスピクチャとそれの前のレイヤフル解像度リファレンスピクチャがリファレンスピクチャリスト0におかれる。EPが符号化された後、アップサンプリングされたベースレイヤリファレンスピクチャがリファレンスピクチャバッファから削除できる。EPは、H.264においてPスライスシンタックスを用いて符号化される。エンハンスメントレイヤピクチャが符号化されたEBであるとき、アップサンプリングされたベースレイヤリファレンスピクチャとそれの前のベースレイヤフル解像度リファレンスピクチャの両方が、リファレンスピクチャリスト0及び1におかれる。リファレンスピクチャリスト1の最初の2つのピクチャのデフォルト順序は、リファレンスピクチャリスト0と異なっているべきである。EBが符号化された後、アップサンプリングされたベースレイヤリファレンスピクチャが、リファレンスピクチャバッファから削除可能である。EBは、H.264におけるBスライスシンタックスを用いて符号化される。他の方法はマクロブロックに基づくものであり、MBがマクロブロック適応的なものに基づきEI、EP及びEBにおいてどのように符号化されるか組み合わせる。すなわち、アップサンプリングされた再構成されたベースレイヤからのエンハンスメントレイヤ残差について空間イントラ予測を利用して、マクロブロックを符号化することが可能であり、又はマクロブロックは、イントラMBとして、又はリファレンスピクチャからのシングル予測又はバイ予測として符号化することが可能である。
図12を参照するに、本発明の原理によるコンプレクシティスケーラビリティが、参照番号1200によって全体表示される。コンプレクシティスケーラビリティ1200は、ベースレイヤ1210とエンハンスメントレイヤ1220とに関する。関連するピクチャタイプは、Iピクチャ1230、Pピクチャ1240、EIピクチャ1250、EPピクチャ1260及びEBピクチャ1270を含む。両方のレイヤにおけるPピクチャ1240は共に、異なる復号化技術によって同一のビットストリームから復号化される。
図13を参照するに、フル解像度によるピクチャの映像データを復号化する方法が、参照番号1300により全体表示される。
スタートブロック1302は、機能ブロック1305と1310にコントロールをわたす。機能ブロック1310は、エンハンスメントレイヤビットストリームを抽出し、機能ブロック1330にコントロールをわたす。機能ブロック1330は、エンハンスメントレイヤピクチャを復号化し、エンドブロック1335にコントロールをわたす。
機能ブロック1305は、ベースレイヤビットストリームを抽出し、判定ブロック1315にコントロールをわたす。判定ブロック1315は、現在のピクチャがINTER−RRU(符号化された)ピクチャであるか判断する。現在ピクチャがINTER−RRUピクチャでない場合、コントロールは機能ブロック1320にわたされる。そうでない場合、現在ピクチャはINTER−RRU(符号化された)ピクチャである場合、コントロールは機能ブロック1340にわたされる。
機能ブロック1320は、現在ピクチャをINTRA復号化し、コントロールを機能ブロック1325にわたす。機能ブロック1325は、現在ピクチャをアップサンプリングし、コントロールを機能ブロック1330にわたす。
機能ブロック1340は、現在ピクチャの残差をアップサンプリングし、コントロールを機能ブロック1345にわたす。機能ブロック1345は、フル解像度により現在ピクチャをINTER復号化し、コントロールをエンドブロック1335にわたす。
図13の方法1300は、図10のデコーダ1000などによって実現されてもよい。インターピクチャのためのベースレイヤビットストリームに対して動作するデコーダ1000の部分は、RRUデコーダである。エントロピー復号化1005並びに逆量子化及び逆変換1010の後、残差がアップサンプリング1015される。動き補償1035が、フル解像度予測を生成するため、フル解像度リファレンスピクチャに適用され、アップサンプリングされた残差が予測に加算1020される。イントラピクチャについて、ベースレイヤデコーダは、低解像度で動作するH.264デコーダである。デブロックフィルタ1050は、任意的なものである。デブロックフィルタ1050は、アップサンプリング前又は後に挿入可能である。アップサンプリングされた再構成されたベースレイヤピクチャは、予測のためリファレンスピクチャバッファ1030におかれる。エンハンスメントレイヤデコーダ1040は、フル解像度により動作するH.264デコーダである。EIピクチャがデコーダ1300に入力される場合、生成された残差ピクチャがアップサンプリングされたリファレンスピクチャに加えられ、その後デブロック処理される。EPピクチャがデコーダ1300に入力される場合、さらなるステップは不要である。
一般に、EP/EBは、EIより効率的に符号化することができる。しかしながら、チャネル変更や他のトリックモードなどのいくつかのアプリケーションでは、EIは高速アクセスに利用される必要がある。それにもかかわらず、Iピクチャは常にベースレイヤにおいて利用可能であるため、エンハンスメントレイヤにおけるEIピクチャの周波数は、フル解像度のドリフトを可能にすることによって、低減することが可能であり、その直後にチャネル変更される。すなわち、チャネル変更が行われ、エンハンスメントレイヤピクチャがEP/EBであるとき、アップサンプリングされたベースレイヤリファレンスピクチャが以降のピクチャの予測のためのリファレンスピクチャとして使用される。ドリフトを限定するため、IDRなどの制約が以降のインターピクチャに利用可能であり、すなわち、以降のインターピクチャはIピクチャの前にピクチャから予測することはできない。ドリフトは、次のEIピクチャまで完全に復元される。
従って、本発明の原理によるコンプレクシティスケーラブルビデオエンコーダ及びデコーダは、フル解像度について高い符号化効率をターゲットとし、低解像度の制限されたドリフト伝搬を許容する。低解像度及びフル解像度デコーダのデコーダコンプレクシティは、サイマルキャストについて可能であるように、非スケーラブルコーデックと極めて類似している。低解像度デコーダコンプレクシティは、非スケーラブル低解像度H.264/AVCデコーダと極めて類似している。フル解像度デコーダコンプレクシティは、残差アップサンプラの追加のみによって、非IピクチャについてH.264/AVCデコーダからほとんど変更されない。エンハンスメントレイヤは、Iピクチャのみについて復号化され、これにより、各解像度に1つ、従って2つのフレームストアである2つの動き補償が実行されることを典型的な空間スケーラビリティデコーダと異なって、1つのピクチャについて1回のみ実行される。
コンプレクシティスケーラブルビデオコーデックは、H.264にポート及び拡張可能である。新たなスライスパラメータ(reduced_resolution_update)が、現在スライスが32×32のサイズのマクロブロックに分割され、低解像度ピクチャのサイズがpic_width/2×pic_height/2とされることに従って加えられる。水平又は垂直方向の任意のレシオによる任意の低解像度をサポートするため、現在のスライスが(low_width_scale*16)×(low_height_scale*16)のサイズのマクロブロックに分割されることを可能にするよう加えられてもよい。対応する低解像度サイズは、(pic_width/low_width_scale×pic_height/low_height_scale)となる。他のパラメータcomplexity_scalable_enableは、現在スライスが2つのレイヤとして符号化されるか示すのに追加される。現在スライスがベースレイヤとして符号化される場合、パラメータenhancement_layer_flagは0に設定され、そうでない場合には、1に設定される。enhancement_layer_flagが1に設定され、slice_typeがIである場合、エンハンスメントレイヤはEIとして符号化される。enhancement_layer_flagが1であり、slice_typeがPである場合、エンハンスメントレイヤはEPとして符号化される。低解像度のサイズは、low_width_scale及びlow_height_scaleにより示される。図14を参照するに、スライスヘッダシンタックスのテーブルが、参照番号1400により全体表示される。ここで、slice_header()の具体例について2つのテーブルがあることに留意されたい。第1のテーブルは、任意の空間解像度スケーラビリティについて利用可能である。第2のテーブルは、空間スケーラビリティが2であることを前提とする。低解像度デコーダがエンハンスメントレイヤを迅速に通過するため、エンハンスメントレイヤについて新たなNALユニットタイプ(タイプ13)が、図15に図示されるように設けられる。図15を参照するに、NALユニットタイプコーデックのテーブルは、参照番号1500により全体表示される。
図16を参照するに、低解像度によりピクチャの映像データを復号化する方法が、参照番号1600により全体表示される。
スタートブロック1602は、機能ブロック1605にコントロールをわたす。機能ブロック1605は、ベースレイヤビットストリームを抽出し、判定ブロック1610にコントロールをわたす。判定ブロック1610は、現在ピクチャがINTER−RRU(符号化された)ピクチャであるか判断する。現在ピクチャがINTER−RRUピクチャでない場合、コントロールは機能ブロック1615にわたされる。そうでない場合、現在ブロックがINTER−RRUピクチャである場合、コントロールは機能ブロック1625にわたされる。
機能ブロック1615INTRAは現在ピクチャを復号化し、コントロールをエンドブロック1620にわたす。
機能ブロック1625は、現在ピクチャの動きベクトルをダウンサンプリングし、コントロールを機能ブロック1630にわたす。機能ブロック1630は、低解像度により現在ピクチャをINTER復号化し、コントロールをエンドブロック1620にわたす。
図17を参照するに、映像データを符号化する方法が、参照番号1700により全体表示される。
スタートブロック1702は、判定ブロック1704にコントロールをわたす。判定ブロック1704は、ベースレイヤがイントラ符号化されるべきか判断する。ベースレイヤがイントラ符号化されるべきでない場合、コントロールは機能ブロック1706にわたされる。そうでない場合、ベースレイヤがイントラ符号化されるべきである場合、コントロールが機能ブロック1710にわたされる。
機能ブロック1706は、フル解像度によりベースレイヤをRRUインター符号化し、コントロールを機能ブロック1708にわたす。機能ブロック1708は、ベースレイヤビットストリームを出力する。
機能ブロック1710は、ベースレイヤにおいてピクチャをダウンサンプリングし、コントロールを機能ブロック1720にわたす。機能ブロック1720は、低解像度によりイントラピクチャとしてピクチャを符号化し、コントロールを機能ブロック1708と1730にわたす。
機能ブロック1730は、イントラ符号化されたピクチャをアップサンプリングし、コントロールを機能ブロック1740にわたす。機能ブロック1740は、フル解像度によりピクチャを符号化し、コントロールを機能ブロック1750にわたす。機能ブロック1750は、エンハンスメントレイヤビットストリームを出力する。
本発明の多数の付随する効果/特徴が説明される。例えば、1つの効果/特徴は、デコーダがデブロック処理を利用することなくフル解像度映像シーケンスを形成するため、ベースレイヤビットストリームを復号化する復号化手段を有し、ベースレイヤビットストリームとエンハンスメントレイヤビットストリームを含む映像ビットストリームを復号化するスケーラブルコンプレクシティビデオデコーダである。他の効果/特徴は、フル解像度映像シーケンスを出力し、アップサンプリングの処理前又は処理後にデブロックフィルタを利用するスケーラブルコンプレクシティビデオデコーダである。さらなる他の効果/特徴は、フル解像度映像シーケンスを出力し、それの前のベースレイヤフル解像度リファレンスピクチャに加えて、アップサンプリングされたベースレイヤリファレンスピクチャを格納するリファレンスピクチャストアを有するスケーラブルコンプレクシティビデオデコーダである。さらなる他の効果/特徴は、イントラピクチャのためのレイヤ化符号化技術とインターピクチャのためのRRU技術を利用したスケーラブルコンプレクシティビデオエンコーダである。さらに、他の効果/特徴は、イントラピクチャがベースレイヤとエンハンスメントレイヤの両方を有し、インターピクチャがベースレイヤしか有しない上述したスケーラブルコンプレクシティビデオエンコーダである。さらに、他の効果/特徴は、イントラピクチャについて、対応するエンハンスメントレイヤがEI、EP及びEBを用いて符号化可能な上述したスケーラブルコンプレクシティビデオエンコーダである。また、他の効果/特徴は、動きベクトルをゼロと仮定し、Iスライスシンタックスを用いて符号化することによって、EIピクチャがフル解像度ピクチャとそれの対応するアップサンプリングされたベースレイヤリファレンスピクチャの残差として形成される、上述したスケーラブルコンプレクシティビデオエンコーダである。さらなる他の効果/特徴は、イントラピクチャのエンハンスメントレイヤが、EI、EP及びEBを利用して符号化可能であり、アップサンプリングされたベースレイヤリファレンスピクチャとそれの前のベースレイヤフル解像度リファレンスピクチャの両方が、シングル予測についてリファレンスピクチャリスト0に、又はバイ予測についてリファレンスリスト0及び1におくことができる、上述したスケーラブルコンプレクシティビデオエンコーダである。さらに、他の効果/特徴は、イントラピクチャのエンハンスメントレイヤがEI、EP及びEBを用いて符号可能であり、エンハンスメントレイヤがEBとして参照され、バイ予測が利用されるときは、Bスライスシンタックスを利用して符号化される、上述のスケーラブルコンプレクシティビデオエンコーダである。さらに、他の効果/特徴は、イントラピクチャのエンハンスメントレイヤがマクロブロックベースにより符号可能であり、MBがマクロブロック適応的にEI、EP及びEBにおいて符号化される方法を組み合わせる、上述したスケーラブルコンプレクシティビデオエンコーダである。
本発明の上記及び他の特徴及び効果は、ここでの教示に基づき当業者により容易に確認されるかもしれない。本発明の教示は、ハードウェア、ソフトウェア、ファームウェア、特定用途プロセッサ又はこれらの組み合わせの各種形式により実現可能であるということが理解されるべきである。
最も好ましくは、本発明の教示は、ハードウェアとソフトウェアの組み合わせとして実現される。さらに、ソフトウェアは、好ましくは、プログラムストレージユニット上で有形的に実現されるアプリケーションプログラムとして実現される。アプリケーションプログラムは、何れか適当なアーキテクチャを有するマシーンにアップロード及び実行されてもよい。好ましくは、当該マシーンは、1以上の中央処理ユニット(CPU)、RAM(Random Access Memory)、入出力(I/O)インタフェースなどのハードウェアを有するコンピュータプラットフォーム上で実現される。コンピュータプラットフォームはまた、オペレーティングシステムとマイクロ命令コードを有するかもしれない。ここに記載される各種プロセス及び機能は、CPUにより実行可能なアプリケーションプログラムの一部、マイクロ命令コードの一部又はそれらの任意の組み合わせであってもよい。さらに、追加的なデータストレージユニットと印刷ユニットなどの他の各種周辺ユニットが、コンピュータプラットフォームに接続されてもよい。
さらに、添付した図面に示されているシステムコンポーネント及び方法は、好ましくは、ソフトウェアにより実現されるため、本発明がプログラムされる方法に応じて、システムコンポーネント又はプロセス機能ブロックとの間の実際の接続は異なるかもしれない。ここでの教示が与えられると、当業者は本発明の上記及び類似の実現形態又は構成を検討することが可能であろう。
例示した実施例が添付した図面を参照して説明されたが、本発明は当該実施例に限定されず、本発明の範囲又は趣旨から逸脱することなく当業者により各種変更及び改良が可能であるということが理解されるべきである。このような変更及び改良のすべては、添付した請求項おいて与えられる本発明の範囲内に含まれることが意図される。
本発明の実施例に関し、更に以下の項目を開示する。
(付記1)ビデオビットストリームを復号化するスケーラブルコンプレクシティビデオデコーダであって、
デブロック処理を適用することなく、表示用の再構成されたアップサンプリングベースレイヤピクチャを形成するため、フル解像度動き補償予測と復号化されたアップサンプリングベースレイヤ残差とを合成する第1合成装置と、
前記第1合成装置と信号通信し、再構成されたフル解像度エンハンスメントレイヤピクチャを形成するため、前記再構成されたアップサンプリングベースレイヤピクチャと復号化されたエンハンスメントレイヤ残差と合成する第2合成装置と、
前記第2合成装置と信号通信し、前記再構成されたフル解像度エンハンスメントレイヤピクチャに対しデブロック処理を実行するデブロックフィルタと、
を有するデコーダ。
(付記2)ビデオビットストリームを復号化する空間スケーラブルビデオデコーダであって、
アップサンプリング予測残差を形成するため、前記ビデオビットストリームに対応する符号化された予測残差に対しアップサンプリング処理を実行するアップサンプラと、
前記アップサンプリング処理の前又は後に、デブロック処理を実行するデブロックフィルタと、
を有するデコーダ。
(付記3)ビデオビットストリームを復号化する空間スケーラブルビデオデコーダであって、
アップサンプリングベースレイヤ予測残差を形成するため、ベースレイヤ予測残差をアップサンプリングするアップサンプラと、
前記アップサンプリングベースレイヤ予測残差と対応する前のフル解像度リファレンスピクチャとから形成されるアップサンプリングベースレイヤリファレンスピクチャを格納するリファレンスピクチャストアと、
を有するデコーダ。
(付記4)複数のピクチャのビデオ信号データを符号化する空間スケーラブルビデオエンコーダであって、
イントラ符号化ピクチャを形成するため、レイヤ化符号化技術を利用してイントラ符号化を実行するイントラ符号化手段と、
インター符号化ピクチャを形成するため、RRU(Reduced Resolution Update)技術を利用してインター符号化を実行するインター符号化手段と、
を有し、
前記インター符号化手段は、ダウンサンプリング低解像度予測残差を形成するため、予測残差をダウンサンプリングするダウンサンプラと、前記ダウンサンプラと信号通信し、前記ダウンサンプリング低解像度予測残差を符号化する変換/量子化装置とを有するエンコーダ。
(付記5)前記イントラ符号化ピクチャは、ベースレイヤとエンハンスメントレイヤの両方を有するよう符号化され、
インター符号化ピクチャは、ベースレイヤのみを有するよう符号化される、付記4記載のエンコーダ。
(付記6)イントラ符号化ベースレイヤピクチャについて、エンハンスメントレイヤは、
該エンハンスメントレイヤのエンハンスメントレイヤ符号化ピクチャが、対応するアップサンプリングベースレイヤリファレンスピクチャから予測され、
前記エンハンスメントレイヤ符号化ピクチャが、前記アップサンプリングベースレイヤリファレンスピクチャと、前のベースレイヤフル解像度リファレンスピクチャの両方からシングル予測により予測され、
前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方からバイ予測により予測される、
ように符号化される、付記4記載のエンコーダ。
(付記7)前記対応するアップサンプリングベースレイヤリファレンスピクチャから予測される前記エンハンスメントレイヤ符号化ピクチャは、対応する動きベクトルをゼロとみなすことによって、前記対応するアップサンプリングベースレイヤリファレンスピクチャと現在のオリジナルフル解像度ピクチャの残差として形成され、Iスライスシンタックスを利用して符号化される、付記6記載のエンコーダ。
(付記8)前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方を、シングル予測についてはリファレンスピクチャ0に、バイ予測についてはリファレンスピクチャリスト1に配置する手段をさらに有する、付記6記載のエンコーダ。
(付記9)前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から、Pスライスシンタックスを利用してシングル予測により予測される、付記6記載のエンコーダ。
(付記10)前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から、Bスライスシンタックスを利用してバイ予測により予測される、付記6記載のエンコーダ。
(付記11)ビデオビットストリームを復号化するスケーラブルコンプレクシティ方法であって、
デブロック処理を適用することなく、表示用の再構成されたアップサンプリングベースレイヤピクチャを形成するため、フル解像度動き補償予測と復号化されたアップサンプリングベースレイヤ残差とを合成するステップと、
再構成されたフル解像度エンハンスメントレイヤピクチャを形成するため、前記再構成されたアンプサンプリングベースレイヤピクチャと復号化されたエンハンスメントレイヤ残差とを合成するステップと、
表示用のフィルタリングされた再構成されたフル解像度エンハンスメントレイヤピクチャを出力するため、前記再構成されたフル解像度エンハンスメントレイヤピクチャのみに対してデブロック処理を実行するステップと、
を有する方法。
(付記12)ビデオビットストリームを復号化する空間スケーラブル方法であって、
アップサンプリング予測残差を形成するため、前記ビデオビットストリームに対応する符号化された予測残差に対してアップサンプリング処理を実行するステップと、
前記アップサンプリング処理の前又は後に、デブロック処理を実行するステップと、
を有する方法。
(付記13)ビデオビットストリームを復号化する空間スケーラブル方法であって、
アップサンプリングベースレイヤ予測残差を形成するため、ベースレイヤ予測残差をアップサンプリングするステップと、
前記アップサンプリングベースレイヤ予測残差と対応する前のフル解像度リファレンスピクチャとから形成されるアップサンプリングベースレイヤリファレンスピクチャを格納するステップと、
を有する方法。
(付記14)複数のピクチャのビデオ信号データを符号化する空間スケーラブル方法であって、
イントラ符号化ピクチャを形成するため、レイヤ化符号化技術を利用してイントラ符号化を実行するステップと、
インター符号化ピクチャを形成するため、RRU(Reduced Resolution Update)技術を利用してインター符号化を実行するステップと、
を有し、
前記インター符号化ステップは、ダウンサンプリング低解像度予測残差を形成するため、予測残差をダウンサンプリングするステップと、前記ダウンサンプリングされた低解像度予測残差を符号化するステップとを有する方法。
(付記15)前記イントラ符号化ピクチャは、ベースレイヤとエンハンスメントレイヤの両方を有するよう符号化され、
前記インター符号化ピクチャは、ベースレイヤのみを有するよう符号化される、付記14記載の方法。
(付記16)イントラ符号化ベースレイヤピクチャについて、エンハンスメントレイヤは、
該エンハンスメントレイヤのエンハンスメントレイヤ符号化ピクチャが、対応するアップサンプリングベースレイヤリファレンスピクチャから予測され、
前記エンハンスメントレイヤ符号化ピクチャが、前記アップサンプリングベースレイヤリファレンスピクチャと、前のベースレイヤフル解像度リファレンスピクチャの両方からシングル予測により予測され、
前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方からバイ予測により予測される、
ように符号化される、付記14記載の方法。
(付記17)前記対応するアップサンプリングベースレイヤリファレンスピクチャから予測される前記エンハンスメントレイヤ符号化ピクチャは、対応する動きベクトルをゼロとみなすことによって、前記対応するアップサンプリングベースレイヤリファレンスピクチャと現在のオリジナルフル解像度ピクチャの残差として形成され、Iスライスシンタックスを利用して符号化される、付記16記載の方法。
(付記18)前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方を、シングル予測についてはリファレンスピクチャ0に、バイ予測についてはリファレンスピクチャリスト1に配置するステップをさらに有する、付記16記載の方法。
(付記19)前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から、Pスライスシンタックスを利用してシングル予測により予測される、付記16記載の方法。
(付記20)前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から、Bスライスシンタックスを利用してバイ予測により予測される、付記16記載の方法。
(付記21)RRU(Reduced Resolution Update)モードを利用して、ベースレイヤにおいてインター符号化を実行するステップと、
非RRUモードを利用して、ベースレイヤにおいてイントラ符号化を実行するステップと、
を有するビデオ符号化方法。
900,1000 ビデオデコーダ
1100 ビデオエンコーダ

Claims (20)

  1. ビデオビットストリームを復号化する空間スケーラブルビデオデコーダであって、
    インター符号化ピクチャについてベースレイヤにおいてRRU(Reduced Resolution Update)アプローチを適用する手段と、
    イントラ符号化ピクチャについて前記ベースレイヤにおいて非RRUアプローチを適用する手段と、
    復号化されたアップサンプリングベースレイヤ残差を形成するため、ベースレイヤピクチャをアップサンプリングするアップサンプラと、
    フル解像度リファレンスピクチャとベースレイヤの動きベクトルとを用いてフル解像度動き補償予測を形成する動き補償装置と、
    デブロック処理を適用することなく、表示用の再構成されたアップサンプリングベースレイヤピクチャを形成するため、前記フル解像度動き補償予測と前記復号化されたアップサンプリングベースレイヤ残差とを合成する第1合成装置と、
    前記第1合成装置と信号通信し、再構成されたフル解像度エンハンスメントレイヤピクチャを形成するため、前記再構成されたアップサンプリングベースレイヤピクチャと復号化されたエンハンスメントレイヤ残差とを合成する第2合成装置と、
    前記第2合成装置と信号通信し、前記再構成されたフル解像度エンハンスメントレイヤピクチャに対しデブロック処理を実行するデブロックフィルタと、
    を有するデコーダ。
  2. ビデオビットストリームを復号化する空間スケーラブルビデオデコーダであって、
    インター符号化ピクチャについてベースレイヤにおいてRRU(Reduced Resolution Update)アプローチを適用する手段と、
    イントラ符号化ピクチャについて前記ベースレイヤにおいて非RRUアプローチを適用する手段と、
    アップサンプリング予測残差を形成するため、前記ビデオビットストリームに対応する符号化された予測残差に対しアップサンプリング処理を実行するアップサンプラと、
    前記アップサンプリング処理の前又は後に、デブロック処理を実行するデブロックフィルタと、
    を有するデコーダ。
  3. ビデオビットストリームを復号化する空間スケーラブルビデオデコーダであって、
    インター符号化ピクチャについてベースレイヤにおいてRRU(Reduced Resolution Update)アプローチを適用する手段と、
    イントラ符号化ピクチャについて前記ベースレイヤにおいて非RRUアプローチを適用する手段と、
    アップサンプリングベースレイヤ予測残差を形成するため、ベースレイヤ予測残差をアップサンプリングするアップサンプラと、
    前記アップサンプリングベースレイヤ予測残差と対応する前のフル解像度リファレンスピクチャとから形成されるアップサンプリングベースレイヤリファレンスピクチャを格納するリファレンスピクチャストアと、
    を有するデコーダ。
  4. 複数のピクチャのビデオ信号データを符号化する空間スケーラブルビデオエンコーダであって、
    イントラ符号化ピクチャを形成するため、非RRU(Reduced Resolution Update)レイヤ化符号化技術を利用してイントラ符号化を実行するイントラ符号化手段と、
    インター符号化ピクチャを形成するため、RRU技術を利用してインター符号化を実行するインター符号化手段であって、前記インター符号化手段は、ダウンサンプリング低解像度予測残差を形成するため、予測残差をダウンサンプリングするダウンサンプラと、前記ダウンサンプラと信号通信し、前記ダウンサンプリング低解像度予測残差を符号化する変換/量子化装置とを有する、前記インター符号化手段と、
    を有するエンコーダ。
  5. 前記イントラ符号化ピクチャは、ベースレイヤとエンハンスメントレイヤの両方を有するよう符号化され、
    前記インター符号化ピクチャは、ベースレイヤのみを有するよう符号化される、請求項4記載のエンコーダ。
  6. イントラ符号化ベースレイヤピクチャについて、
    エンハンスメントレイヤは、
    該エンハンスメントレイヤのエンハンスメントレイヤ符号化ピクチャが、対応するアップサンプリングベースレイヤリファレンスピクチャから予測され、
    前記エンハンスメントレイヤ符号化ピクチャが、前記アップサンプリングベースレイヤリファレンスピクチャと、前のベースレイヤフル解像度リファレンスピクチャの両方から予測により予測され、及び
    前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から予測により予測される、
    の1つとなるように符号化される、請求項4記載のエンコーダ。
  7. 前記対応するアップサンプリングベースレイヤリファレンスピクチャから予測される前記エンハンスメントレイヤ符号化ピクチャは、対応する動きベクトルをゼロとみなすことによって、前記対応するアップサンプリングベースレイヤリファレンスピクチャと現在のオリジナルフル解像度ピクチャの残差として形成され、Iスライスシンタックスを利用して符号化される、請求項6記載のエンコーダ。
  8. 前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方を、予測についてはリファレンスピクチャリスト0に、予測についてはリファレンスピクチャリスト1に配置する手段をさらに有する、請求項6記載のエンコーダ。
  9. 前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から、Pスライスシンタックスを利用して予測により予測される、請求項6記載のエンコーダ。
  10. 前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から、Bスライスシンタックスを利用して予測により予測される、請求項6記載のエンコーダ。
  11. ビデオビットストリームを復号化する空間スケーラブル復号化方法であって、
    ベースレイヤにおいてRRU(Reduced Resolution Update)モードを用いてインター復号化を実行するステップと、
    前記ベースレイヤにおいて非RRUモードを用いてイントラ復号化を実行するステップと、
    デブロック処理を適用することなく、表示用の再構成されたアップサンプリングベースレイヤピクチャを形成するため、フル解像度動き補償予測と復号化されたアップサンプリングベースレイヤ残差とを合成するステップと、
    再構成されたフル解像度エンハンスメントレイヤピクチャを形成するため、前記再構成されたアンプサンプリングベースレイヤピクチャと復号化されたエンハンスメントレイヤ残差とを合成するステップと、
    表示用のフィルタリングされた再構成されたフル解像度エンハンスメントレイヤピクチャを出力するため、前記再構成されたフル解像度エンハンスメントレイヤピクチャのみに対してデブロック処理を実行するステップと、
    を有する方法。
  12. ビデオビットストリームを復号化する空間スケーラブル復号化方法であって、
    ベースレイヤにおいてRRU(Reduced Resolution Update)モードを用いてインター復号化を実行するステップと、
    前記ベースレイヤにおいて非RRUモードを用いてイントラ復号化を実行するステップと、
    アップサンプリング予測残差を形成するため、前記ビデオビットストリームに対応する符号化された予測残差に対してアップサンプリング処理を実行するステップと、
    前記アップサンプリング処理の前又は後に、デブロック処理を実行するステップと、
    を有する方法。
  13. ビデオビットストリームを復号化する空間スケーラブル復号化方法であって、
    ベースレイヤにおいてRRU(Reduced Resolution Update)モードを用いてインター復号化を実行するステップと、
    前記ベースレイヤにおいて非RRUモードを用いてイントラ復号化を実行するステップと、
    アップサンプリングベースレイヤ予測残差を形成するため、ベースレイヤ予測残差をアップサンプリングするステップと、
    前記アップサンプリングベースレイヤ予測残差と対応する前のフル解像度リファレンスピクチャとから形成されるアップサンプリングベースレイヤリファレンスピクチャを格納するステップと、
    有する方法。
  14. 複数のピクチャのビデオ信号データを符号化する空間スケーラブル符号化方法であって、
    イントラ符号化ピクチャを形成するため、非RRU(Reduced Resolution Update)レイヤ化符号化技術を利用してイントラ符号化を実行するステップと、
    インター符号化ピクチャを形成するため、RRU技術を利用してインター符号化を実行するステップであって、前記インター符号化を実行するステップは、ダウンサンプリング低解像度予測残差を形成するため、予測残差をダウンサンプリングするステップと、前記ダウンサンプリングされた低解像度予測残差を符号化するステップとを有する、前記インター符号化を実行するステップと、
    を有する方法。
  15. 前記イントラ符号化ピクチャは、ベースレイヤとエンハンスメントレイヤの両方を有するよう符号化され、
    前記インター符号化ピクチャは、ベースレイヤのみを有するよう符号化される、請求項14記載の方法。
  16. イントラ符号化ベースレイヤピクチャについて、
    エンハンスメントレイヤは、
    該エンハンスメントレイヤのエンハンスメントレイヤ符号化ピクチャが、対応するアップサンプリングベースレイヤリファレンスピクチャから予測され、
    前記エンハンスメントレイヤ符号化ピクチャが、前記アップサンプリングベースレイヤリファレンスピクチャと、前のベースレイヤフル解像度リファレンスピクチャの両方から予測により予測され、及び
    前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から予測により予測される、
    の1つとなるように符号化される、請求項14記載の方法。
  17. 前記対応するアップサンプリングベースレイヤリファレンスピクチャから予測される前記エンハンスメントレイヤ符号化ピクチャは、対応する動きベクトルをゼロとみなすことによって、前記対応するアップサンプリングベースレイヤリファレンスピクチャと現在のオリジナルフル解像度ピクチャの残差として形成され、Iスライスシンタックスを利用して符号化される、請求項16記載の方法。
  18. 前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方を、予測についてはリファレンスピクチャリスト0に、予測についてはリファレンスピクチャリスト1に配置するステップをさらに有する、請求項16記載の方法。
  19. 前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から、Pスライスシンタックスを利用して予測により予測される、請求項16記載の方法。
  20. 前記エンハンスメントレイヤ符号化ピクチャは、前記アップサンプリングベースレイヤリファレンスピクチャと前記前のベースレイヤフル解像度リファレンスピクチャの両方から、Bスライスシンタックスを利用して予測により予測される、請求項16記載の方法。
JP2013044770A 2004-10-13 2013-03-06 コンプレクシティスケーラブル映像符号化復号化方法及び装置 Expired - Fee Related JP5823430B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US61825404P 2004-10-13 2004-10-13
US60/618,254 2004-10-13

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007536800A Division JP2008516556A (ja) 2004-10-13 2005-10-12 コンプレクシティスケーラブル映像符号化復号化方法及び装置

Publications (2)

Publication Number Publication Date
JP2013146092A JP2013146092A (ja) 2013-07-25
JP5823430B2 true JP5823430B2 (ja) 2015-11-25

Family

ID=35709073

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007536800A Pending JP2008516556A (ja) 2004-10-13 2005-10-12 コンプレクシティスケーラブル映像符号化復号化方法及び装置
JP2013044770A Expired - Fee Related JP5823430B2 (ja) 2004-10-13 2013-03-06 コンプレクシティスケーラブル映像符号化復号化方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007536800A Pending JP2008516556A (ja) 2004-10-13 2005-10-12 コンプレクシティスケーラブル映像符号化復号化方法及び装置

Country Status (6)

Country Link
US (1) US8467459B2 (ja)
EP (1) EP1800494A1 (ja)
JP (2) JP2008516556A (ja)
KR (2) KR101407748B1 (ja)
CN (1) CN101040533B (ja)
WO (1) WO2006044370A1 (ja)

Families Citing this family (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7580461B2 (en) 2004-02-27 2009-08-25 Microsoft Corporation Barbell lifting for wavelet coding
US9560367B2 (en) * 2004-09-03 2017-01-31 Nokia Technologies Oy Parameter set and picture header in video coding
DE102004059978B4 (de) * 2004-10-15 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium
KR20070038396A (ko) * 2005-10-05 2007-04-10 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
CN101998123B (zh) * 2005-10-11 2015-03-18 诺基亚公司 用于有效的可伸缩流适配的系统和方法
KR100763194B1 (ko) * 2005-10-14 2007-10-04 삼성전자주식회사 단일 루프 디코딩 조건을 만족하는 인트라 베이스 예측방법, 상기 방법을 이용한 비디오 코딩 방법 및 장치
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
KR20080092372A (ko) 2006-01-09 2008-10-15 엘지전자 주식회사 영상 신호의 레이어 간 예측 방법
US8937997B2 (en) 2006-03-16 2015-01-20 Apple Inc. Scalable video coding/multiplexing compatible with non-scalable decoders
JP5590881B2 (ja) * 2006-05-03 2014-09-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディア表現からメディアを再構成する方法及び装置
US9332274B2 (en) 2006-07-07 2016-05-03 Microsoft Technology Licensing, Llc Spatially scalable video coding
US8130822B2 (en) * 2006-07-10 2012-03-06 Sharp Laboratories Of America, Inc. Methods and systems for conditional transform-domain residual accumulation
US8422555B2 (en) 2006-07-11 2013-04-16 Nokia Corporation Scalable video coding
US8155454B2 (en) * 2006-07-20 2012-04-10 Qualcomm Incorporated Method and apparatus for encoder assisted post-processing
EP2060123A4 (en) 2006-09-07 2016-05-04 Lg Electronics Inc METHOD AND DEVICE FOR DECODING / ENCODING A VIDEO SIGNAL
CN101578866B (zh) * 2006-10-20 2013-11-13 诺基亚公司 利用参考画面标记和参考画面列表对可缩放视频位流进行编解码的方法及装置
CN101888559B (zh) 2006-11-09 2013-02-13 Lg电子株式会社 用于解码/编码视频信号的方法及装置
US8873932B2 (en) 2007-12-11 2014-10-28 Cisco Technology, Inc. Inferential processing to ascertain plural levels of picture interdependencies
WO2008060127A1 (en) 2006-11-17 2008-05-22 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
WO2008071037A1 (en) * 2006-12-14 2008-06-19 Thomson Licensing Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability
EP2100461A2 (en) * 2006-12-20 2009-09-16 Thomson Research Funding Corporation Video data loss recovery using low bit rate stream in an iptv system
EP2153645A4 (en) * 2007-05-04 2011-07-27 Korea Electronics Telecomm METHOD AND APPARATUS FOR PROVIDING HIGH QUALITY MULTIMEDIA SERVICE IN DIGITAL MULTIMEDIA BROADCASTING (DMB) TRANSMISSION SYSTEM
US8737474B2 (en) * 2007-06-27 2014-05-27 Thomson Licensing Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability
KR20080114388A (ko) * 2007-06-27 2008-12-31 삼성전자주식회사 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법
US8750390B2 (en) 2008-01-10 2014-06-10 Microsoft Corporation Filtering and dithering as pre-processing before encoding
US8260952B2 (en) * 2008-01-31 2012-09-04 Microsoft Corporation Multi-rate peer-assisted data streaming
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
WO2009114557A1 (en) * 2008-03-10 2009-09-17 Vidyo, Inc. System and method for recovering the decoding order of layered media in packet-based communication
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US8886022B2 (en) 2008-06-12 2014-11-11 Cisco Technology, Inc. Picture interdependencies signals in context of MMCO to assist stream manipulation
US8971402B2 (en) 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US9479786B2 (en) 2008-09-26 2016-10-25 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
US8761266B2 (en) * 2008-11-12 2014-06-24 Cisco Technology, Inc. Processing latticed and non-latticed pictures of a video program
KR101676310B1 (ko) * 2009-04-27 2016-11-16 엘지전자 주식회사 방송 수신기 및 3d 비디오 데이터 처리 방법
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
KR101527085B1 (ko) * 2009-06-30 2015-06-10 한국전자통신연구원 인트라 부호화/복호화 방법 및 장치
CN102474620A (zh) * 2009-07-10 2012-05-23 三星电子株式会社 在分层视频编码中的空间预测方法和设备
KR101462959B1 (ko) * 2010-05-14 2014-11-20 삼성전자주식회사 확장 블록 필터링을 이용한 비디오 부호화, 복호화 방법 및 장치
US8548062B2 (en) * 2010-07-16 2013-10-01 Sharp Laboratories Of America, Inc. System for low resolution power reduction with deblocking flag
WO2012011744A2 (ko) 2010-07-20 2012-01-26 에스케이텔레콤 주식회사 디블록킹 필터링 방법 및 장치 및 이를 이용한 부호화 및 복호화 방법과 장치
CN105163118B (zh) * 2010-07-20 2019-11-26 Sk电信有限公司 用于解码视频信号的解码方法
US8553769B2 (en) * 2011-01-19 2013-10-08 Blackberry Limited Method and device for improved multi-layer data compression
EP2479994B1 (en) * 2011-01-19 2017-03-15 BlackBerry Limited Method and device for improved multi-layer data compression
US20120300838A1 (en) * 2011-05-26 2012-11-29 Sharp Laboratories Of America, Inc. Low resolution intra prediction
EP2723079A4 (en) * 2011-06-15 2015-03-04 Korea Electronics Telecomm MODULABLE VIDEO ENCODING AND DECODING METHOD AND DEVICE APPLYING THE SAME
US8977065B2 (en) * 2011-07-21 2015-03-10 Luca Rossato Inheritance in a tiered signal quality hierarchy
CN107295341B (zh) 2011-07-22 2020-02-28 Sk电信有限公司 视频编码方法
WO2013040170A1 (en) * 2011-09-16 2013-03-21 Dolby Laboratories Licensing Corporation Frame-compatible full resolution stereoscopic 3d compression and decompression
US9237356B2 (en) 2011-09-23 2016-01-12 Qualcomm Incorporated Reference picture list construction for video coding
KR101550726B1 (ko) 2011-10-17 2015-09-07 주식회사 케이티 영상 부호화/복호화 방법 및 그 장치
US20130107962A1 (en) 2011-10-26 2013-05-02 Intellectual Discovery Co., Ltd. Scalable video coding method and apparatus using inter prediction mode
EP2792146A4 (en) * 2011-12-17 2015-12-09 Dolby Lab Licensing Corp ENHANCED RESOLUTION VIDEO DISTRIBUTION COMPATIBLE WITH A FRAME, INTERLACED, MULTILAYER
EP2615579A1 (en) * 2012-01-12 2013-07-17 Thomson Licensing Method and device for generating a super-resolution version of a low resolution input data structure
EP2642755B1 (en) 2012-03-20 2018-01-03 Dolby Laboratories Licensing Corporation Complexity scalable multilayer video coding
US10091515B2 (en) * 2012-03-21 2018-10-02 Mediatek Singapore Pte. Ltd Method and apparatus for intra mode derivation and coding in scalable video coding
WO2013162450A1 (en) * 2012-04-24 2013-10-31 Telefonaktiebolaget L M Ericsson (Publ) Encoding and deriving parameters for coded multi-layer video sequences
US9420280B2 (en) * 2012-06-08 2016-08-16 Qualcomm Incorporated Adaptive upsampling filters
CN104396249B (zh) * 2012-06-20 2017-12-26 寰发股份有限公司 可伸缩视频编码的层间预测的方法和设备
WO2014000168A1 (en) * 2012-06-27 2014-01-03 Intel Corporation Cross-layer cross-channel residual prediction
CN102833542B (zh) * 2012-08-09 2015-12-02 芯原微电子(北京)有限公司 一种提高可伸缩视频编码质量增强层编码速度装置和方法
CA2807404C (en) * 2012-09-04 2017-04-04 Research In Motion Limited Methods and devices for inter-layer prediction in scalable video compression
KR102160242B1 (ko) 2012-09-09 2020-09-25 엘지전자 주식회사 영상 복호화 방법 및 이를 이용하는 장치
US10397616B2 (en) 2012-09-28 2019-08-27 Vid Scale, Inc. Cross-plane filtering for chroma signal enhancement in video coding
TW201424397A (zh) * 2012-09-28 2014-06-16 Samsung Electronics Co Ltd 可調式視訊解碼、編碼方法及其裝置與非暫時性電腦可讀記錄體
KR102194749B1 (ko) 2012-10-01 2020-12-23 지이 비디오 컴프레션, 엘엘씨 공간적 인트라 예측 파라미터들의 인터-레이어 예측을 이용한 스케일러블 비디오 코딩
CN103916673B (zh) * 2013-01-06 2017-12-22 华为技术有限公司 基于双向预测的编码方法、解码方法和装置
KR20140121315A (ko) * 2013-04-04 2014-10-15 한국전자통신연구원 참조 픽처 리스트를 이용한 다 계층 기반의 영상 부호화/복호화 방법 및 그 장치
US9380305B2 (en) * 2013-04-05 2016-06-28 Qualcomm Incorporated Generalized residual prediction in high-level syntax only SHVC and signaling and management thereof
US11438609B2 (en) * 2013-04-08 2022-09-06 Qualcomm Incorporated Inter-layer picture signaling and related processes
WO2014168561A1 (en) 2013-04-12 2014-10-16 Telefonaktiebolaget L M Ericsson (Publ) Constructing inter-layer reference picture lists
US9510001B2 (en) * 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
CN105453563B (zh) 2013-07-30 2019-08-16 株式会社Kt 支持多个层的图像编码和解码方法以及使用该方法的装置
US9894369B2 (en) 2013-07-30 2018-02-13 Kt Corporation Image encoding and decoding method supporting plurality of layers and apparatus using same
WO2015016535A1 (ko) * 2013-07-30 2015-02-05 주식회사 케이티 복수의 레이어를 지원하는 영상의 부호화 및 복호화 방법 및 이를 이용하는 장치
US9706221B2 (en) * 2013-10-29 2017-07-11 Vixs Systems Inc. Motion search with scaled and unscaled pictures
JP6435741B2 (ja) 2014-09-22 2018-12-12 トヨタ自動車株式会社 バンプストッパキャップ
JP6481457B2 (ja) * 2015-03-26 2019-03-13 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法
WO2016168529A1 (en) 2015-04-17 2016-10-20 Vid Scale, Inc. Chroma enhancement filtering for high dynamic range video coding
US10257524B2 (en) * 2015-07-01 2019-04-09 Mediatek Inc. Residual up-sampling apparatus for performing transform block up-sampling and residual down-sampling apparatus for performing transform block down-sampling
US10123044B2 (en) * 2015-07-16 2018-11-06 Mediatek Inc. Partial decoding circuit of video encoder/decoder for dealing with inverse second transform and partial encoding circuit of video encoder for dealing with second transform
GB2573486B (en) * 2017-12-06 2022-12-21 V Nova Int Ltd Processing signal data using an upsampling adjuster
GB2574575A (en) * 2018-04-27 2019-12-18 V Nova Int Ltd Video decoder chipset
GB201817784D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Methods,apparatuses, computer programs and computer-readable media
US20230055497A1 (en) * 2020-01-06 2023-02-23 Hyundai Motor Company Image encoding and decoding based on reference picture having different resolution

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06101841B2 (ja) * 1984-01-11 1994-12-12 日本電気株式会社 動画像信号の符号化方法およびその装置
US6301304B1 (en) * 1998-06-17 2001-10-09 Lsi Logic Corporation Architecture and method for inverse quantization of discrete cosine transform coefficients in MPEG decoders
FI120125B (fi) * 2000-08-21 2009-06-30 Nokia Corp Kuvankoodaus
US6631163B1 (en) * 2000-11-14 2003-10-07 Koninklijke Philips Electronics N.V. Dynamic adaptation of complexity in an MPEG-2 scalable decoder
US20020191698A1 (en) * 2001-06-15 2002-12-19 Solidstreaming, Inc. Video data CODEC system with low computational complexity
US6704362B2 (en) * 2001-07-06 2004-03-09 Koninklijke Philips Electronics N.V. Resource scalable decoding
KR100631777B1 (ko) * 2004-03-31 2006-10-12 삼성전자주식회사 다 계층의 모션 벡터를 효율적으로 압축하는 방법 및 장치
JP4965429B2 (ja) * 2004-04-02 2012-07-04 トムソン ライセンシング 複雑度スケーラブルなビデオエンコーダの方法及び装置
EP2051525A1 (en) * 2007-10-15 2009-04-22 Mitsubishi Electric Information Technology Centre Europe B.V. Bandwidth and content dependent transmission of scalable video layers

Also Published As

Publication number Publication date
CN101040533B (zh) 2010-10-06
CN101040533A (zh) 2007-09-19
US20070286283A1 (en) 2007-12-13
KR20070063539A (ko) 2007-06-19
KR20130036777A (ko) 2013-04-12
JP2013146092A (ja) 2013-07-25
JP2008516556A (ja) 2008-05-15
KR101407748B1 (ko) 2014-06-17
US8467459B2 (en) 2013-06-18
EP1800494A1 (en) 2007-06-27
WO2006044370A1 (en) 2006-04-27
KR101277355B1 (ko) 2013-06-20

Similar Documents

Publication Publication Date Title
JP5823430B2 (ja) コンプレクシティスケーラブル映像符号化復号化方法及び装置
JP5542786B2 (ja) 複雑度スケーラブルなビデオデコーダの方法及び装置
US20220329834A1 (en) Method for coding and decoding scalable video and apparatus using same
US20090010333A1 (en) Method and Apparatus for Constrained Prediction for Reduced Resolution Update Mode and Complexity Scalability in Video Encoders and Decoders
CN108111846B (zh) 用于可伸缩视频编码的帧间层预测方法及装置
US8553777B2 (en) Method and apparatus for slice adaptive motion vector coding for spatial scalable video encoding and decoding
US8867618B2 (en) Method and apparatus for weighted prediction for scalable video coding
US20070189392A1 (en) Reduced resolution update mode for advanced video coding
Choi et al. Scalable video coding based on high efficiency video coding (HEVC)

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140402

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140805

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141104

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150908

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151007

R150 Certificate of patent or registration of utility model

Ref document number: 5823430

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350