JP2008543130A - 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法 - Google Patents

複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法 Download PDF

Info

Publication number
JP2008543130A
JP2008543130A JP2008510212A JP2008510212A JP2008543130A JP 2008543130 A JP2008543130 A JP 2008543130A JP 2008510212 A JP2008510212 A JP 2008510212A JP 2008510212 A JP2008510212 A JP 2008510212A JP 2008543130 A JP2008543130 A JP 2008543130A
Authority
JP
Japan
Prior art keywords
base layer
coefficients
residue
layer
enhancement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008510212A
Other languages
English (en)
Other versions
JP4902642B2 (ja
Inventor
チェン、ペイソン
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008543130A publication Critical patent/JP2008543130A/ja
Application granted granted Critical
Publication of JP4902642B2 publication Critical patent/JP4902642B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法
【解決手段】複数の層に関係するマルチメディア・データを処理する方法が、開示される。本方法は、ベース層残余物を決定すること、及びベース層残余物の非ゼロ係数の数又はベース層残余物のゼロ係数の数のうちの少なくとも1つが第1の選択された条件を満足する場合に、エンハンスメント層残余物を生成するために層間予測を実行することを含むことができる。マルチメディア・ビットストリームをデコードする方法は、ベース層とエンハンスメント層とを有するマルチメディア・ビットストリームを受け取ること、及びエンハンスメント層が層内予測又は層間予測を使用してデコードされるべきであるかどうかを決定するためにベース層をデコードすることを含むことができる。
【選択図】図6

Description

関連文献
[米国特許法35§119による優先権の主張]
特許に関する本出願は、米国特許仮出願番号第60/789,271号、名称“スケーリング可能性を有するデータ処理(DATA PROCESSING WITH SCALABILITY)”、2006年4月4日出願、米国特許仮出願番号第60/677,607号、名称“ベース層ビデオ品質比較(BASE LAYER VIDEO QUALITY COMPARISON)”、2005年3月3日出願、米国特許仮出願番号第60/677,609号、名称“新たなMBモードの導入(INTRODUCING NEW MB MODES)”、2005年3月3日出願、米国特許仮出願番号第60/677,610号、名称“2層コーディングにおける情報共有(SHARING INFORMATION IN TWO LAYER CODING)”、2005年3月3日出願、及び米国特許仮出願番号第60/677,611号、名称“スケーリング可能なビデオ・エンコーディングにおけるMB間の層間予測(INTERLAYER PREDICTION FOR INTER MBS SCALABLE VIDEO CODING)”、2005年3月3日出願に優先権を主張し、そして本出願の譲受人に全て譲渡され、そして本明細書中に引用によってその全体が取り込まれている。
本発明は、オーディオ・データ、ビデオ・データ、又は両者を備えることができるマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングに係る。特に、本発明は、複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法に関する。
国際電気通信協会(ITU:International Telecommunication Union)は、ディジタル・ビデオ・エンコーディングのためのH.261、H.262、H.263及びH.264規格を既に公表してきている。これらの規格は、エンコードされたディジタル・ビデオ・データのシンタックスを規定し、そしてこのデータが表示のため又は再生のためにどのようにデコードされるかを規定する。しかしながら、これらの規格は、ディジタル・ビデオ・データを圧縮されないフォーマットから圧縮されたフォーマット又はデコードされたフォーマットに変換するために柔軟な方式で使用されるための様々な異なる技術(例えば、アルゴリズム又は圧縮ツール)を許容する。それゆえ、多くの異なるディジタル・ビデオ・データ・エンコーダが現在利用可能である。これらのディジタル・ビデオ・エンコーダは、異なるコスト及び品質レベルで様々な圧縮の程度を実現することが可能である。
スケーリング可能なビデオ・コーディングは、ビデオ・データのエンコーディングのために複数の層、例えば、ベース層とエンハンスメント層、を生成する。これらの2つの層は、異なる伝送特性を有する別のチャネル上で一般的に伝送され、結果として異なるパケット・エラー・レートになる。ベース層は、一般的にエンハンスメント層と比較したときにより低いパケット・エラー・レートを有する。ベース層は、一般に最も重要な情報を含み、そしてエンハンスメント層は、一般にベース層に対する改善を提供する。最もスケーリング可能なビデオ圧縮技術は、人間の視覚システムが画像のより平らな低周波数領域よりも高周波数領域において(圧縮に起因する)ノイズにより寛大であるという事実を活用する。それゆえ、ベース層は、主に低周波数情報を含み、そしてエンハンスメント層は、主に高周波数情報を含む。ネットワーク帯域幅が足りなくなるとき、コード化されたビデオの(エンハンスメント層がない)ベース層だけが受信される確率が高い。そのような状況では、再生されたビデオは、不鮮明であり、そしてデブロッキング・フィルタは、この効果を強調することさえある。
デコーダは、一般にベース層又はベース層とエンハンスメント層とをデコードする。ベース層とエンハンスメント層とをデコードするとき、複数層デコーダは、単一層デコーダと比較した場合に、計算上の複雑さの増加及びメモリの増加を必要とする。多くの移動デバイスは、計算上の複雑さの増加及びメモリの増加の要求のために複数層デコーダを利用しない。
サマリー
複数の層に関係するマルチメディア・データを処理する方法は、ベース層残余物を決定することを含むことができる。もし、ベース層残余物の非ゼロ係数の数又はベース層残余物のゼロ係数の数のうちの少なくとも1つが第1の選択された条件を満足する場合に、層間予測が、エンハンスメント層残余物を生成するために実行されることができる。第1の選択された条件は、しきい値よりも大きい、小さい、又はそれに等しいベース層残余物の非ゼロ係数の数又はゼロ係数の数であり得る。もし、ベース層残余物の非ゼロ係数の数又はベース層残余物のゼロ係数の数のうちの少なくとも1つが第2の選択された条件を満足する場合に、時間的予測が、エンハンスメント層残余物を生成するために実行されることができる。第2の選択された条件は、しきい値よりも大きい、小さい、又はそれに等しいベース層残余物の非ゼロ係数の数又はゼロ係数の数であり得る。
エンハンスメント層を予測するためにベース層を使用する方法が、開示される。マルチメディア・データのブロックは、複数のベース量子化された係数を含むベース残余物を生成するために使用されることができる。マルチメディア・データのブロックは、同様に、複数のエンハンスメント量子化された係数を含むエンハンスメント残余物を生成するために使用されることができる。第1の値は、複数のベース量子化された係数に基づいて決定されることができ、そして第2の値は、複数のエンハンスメント量子化された係数に基づいて決定されることができる。エンハンスメント層は、複数のベース量子化された係数又は複数のエンハンスメント量子化された係数のうちの少なくとも1つを使用することにより決定されることができる。
マルチメディア・ビットストリームをデコードする方法は、ベース層とエンハンスメント層とを有するマルチメディア・ビットストリームを受け取ることを含むことができる。エンハンスメント層が層内予測又は層間予測を使用してデコードされるべきであるかどうかを決定するために、ベース層は、デコードされることができる。
[詳細な説明]
本発明の特徴、目的、及び利点は、図面を使用して以下に述べる詳細な説明から、さらに明確になるであろう。
本発明の様々な特徴の実施形態を与えるシステム及び方法が、ここに図面を参照して説明される。図面及び関係する記述は、本発明の複数の実施形態を説明するために提供され、そして本発明の範囲を限定しない。図面全体を通して、参照番号は、複数の参照した要素間の対応を示すために再使用される。それに加えて、各参照番号の最初の桁は、その要素が最初に現れる図を示す。
図1は、マルチメディア(例えば、ビデオ、オーディオ又は両方)データをエンコードするため及びデコードするためのシステム100のブロック図である。システム100は、ビデオ・データ(例えば、画像及びビデオ・フレーム)をエンコードするため(例えば、圧縮するため)そしてデコードするため(例えば、逆圧縮するため)に構成されることができる。システム100は、サーバ105、デバイス110、及びサーバ105をデバイス110に接続する通信チャネル115を含むことができる。システム100は、ビデオ・データをエンコードするためそしてデコードするための以下に記載される方法を説明するために使用されることができる。システム100は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、又はそれらのいずれかの組み合わせによって与えられることができる。1又はそれより多くの要素は、再配列されるそして/又は組み合わされることが可能であり、そして別のシステムが、本発明の精神及び範囲をこれまで通り維持したままでシステム100の代わりに使用されることができる。追加の要素が、システム100に加えられることができる、又は本発明の精神及び範囲をこれまで通り維持したままでシステム100から取り除かれることができる。
サーバ105は、プロセッサ120、記憶媒体125、エンコーダ130、及びI/Oデバイス135(例えば、トランシーバ)を含むことができる。プロセッサ120及び/又はエンコーダ130は、ビデオ・フレームの系列の形式でビデオ・データを受け取るように構成されることができる。プロセッサ120及び/又はエンコーダ130は、アドバンストRISCマシーン(ARM:Advanced RISC Machine)、コントローラ、ディジタル信号プロセッサ(DSP:digital signal processor)、マイクロプロセッサ、又はデータを処理することが可能ないずれかの他のデバイスであり得る。プロセッサ120及び/又はエンコーダ130は、記憶のために記憶媒体125にビデオ・フレームの系列を伝送することができ、そして/又はビデオ・フレームの系列をエンコードすることができる。記憶媒体125は、コンピュータ命令を同様に記憶することができ、それはプロセッサ120そして/又はエンコーダ130によって使用されて、サーバ105の動作及び機能を制御する。記憶媒体125は、ビデオ・データを記憶するための1又はそれより多くのデバイス及び/又は情報を記憶するための他の機械読み取り可能な媒体を表すことができる。用語“機械読み取り可能な媒体”は、ランダム・アクセス・メモリ(RAM)、フラッシュ・メモリ、(読出し専用メモリ)ROM、EPROM、EEPROM、レジスタ、ハード・ディスク、脱着可能なディスク、CD−ROM、DVD、無線チャネル、及び(複数の)命令及び/又はデータを記憶すること、を含むこと又は搬送することが可能な様々な他の媒体を含むが、それらに限定されない。
エンコーダ130は、記憶媒体125から受け取られたコンピュータ命令を使用して、ビデオ・フレームの系列の並列処理及び直列処理(例えば、圧縮)の両者を実行するように構成されることができる。コンピュータ命令は、下記に説明されるような方法で実行されることができる。フレームの系列が一旦エンコードされると、エンコードされたデータは、通信チャネル115を介したデバイス110への送信のためにI/Oデバイス135に送られることができる。
デバイス110は、プロセッサ140、記憶媒体145、デコーダ150、I/Oデバイス155(例えば、トランシーバ)、及びディスプレイ・デバイス又はスクリーン160を含むことができる。デバイス110は、コンピュータ、ディジタル・ビデオ・レコーダ、手持ちデバイス(例えば、セルラ電話機、ブラックベリー、等)、セット・トップ・ボックス、テレビ、及びビデオ・フレームの系列を受け取ること、処理すること(例えば、逆圧縮すること)及び/又は表示することが可能な別のデバイスであり得る。I/Oデバイス155は、エンコードされたデータを受け取り、そしてエンコードされたデータを記憶媒体145にそして/又は逆圧縮のためにデコーダ150に送る。デコーダ150は、エンコードされたデータを使用してビデオ・フレームの系列を再生するために構成される。一旦デコードされると、ビデオ・フレームの系列は、記憶媒体145中に記憶されることができる。デコーダ150は、記憶媒体145から検索されたコンピュータ命令を使用して、エンコードされたデータの並列処理と直列処理(例えば、逆圧縮)の両方を実行し、ビデオ・フレームの系列を再生するように構成されることができる。コンピュータ命令は、以下に説明されるような方法で実行されることができる。プロセッサ140は、記憶媒体145及び/又はデコーダ150からビデオ・フレームの系列を受け取るように、そしてディスプレイ・デバイス160上にビデオ・フレームの系列を表示するように構成されることができる。記憶媒体145は、コンピュータ命令を同様に記憶することができ、それはプロセッサ140及び/又はデコーダ150によって使用され、デバイス110の動作及び機能を制御する。
通信チャネル115は、サーバ105とデバイス110との間でエンコードされたデータを伝送するために使用されることができる。通信チャネル115は、有線接続又は有線ネットワーク及び/若しくは無線接続又は無線ネットワークであり得る。例えば、通信チャネル115は、インターネット、同軸ケーブル、光ファイバ配線、衛星回線、地上波回線、無線回線、信号を伝播させることが可能な他の媒体、及びそれらのいずれかの組み合わせを含むことが可能である。
図2は、H.264ビデオ・データ・ビットストリーム200のブロック図である。ビットストリーム200は、複数のアクセス・ユニット205(例えば、アクセス・ユニット1、アクセス・ユニット2、アクセス・ユニット3、等)に配列される又は区分されることができる。各アクセス・ユニット205は、コード化されたビデオ・フレームに対応する情報を含むことができる。各アクセス・ユニット205は、複数のNALユニット210に配列される又は区分されることができる。各NALユニット210は、NALプリフィックス215、NALヘッダ220、及びデータのブロック225を含むことができる。NALプリフィックス215は、データのブロック225の開始を示しているビットの系列(例えば、00000001)であり得て、そしてNALヘッダ220は、NALユニット・タイプ230(例えば、Iフレーム、Pフレーム又はBフレーム)を含むことができる。データのブロック225は、ヘッダ235及びデータ240を含むことができる。データのブロック225は、データの16×16マクロブロック、全体のデータのフレーム、又はビデオ・データの一部(例えば、2×2ブロック又は4×4ブロック)に配列される又は区分されることができる。用語“マクロブロック”及び“ブロック”は、互換的に使用されることができる。
ヘッダ135は、モード245、参照画像リスト250、及びOP値255を含むことができる。モード245は、マクロブロックをどのようにして配列するか又は区分するか、動き情報をどのようにして決定するかそして伝送するか、及び残余情報をどのようにして決定するかそして伝送するか、をエンコーダ130に指示することができる。データ240は、動き情報(例えば、動きベクトル285)及び残余情報(例えば、DC残余物260とAC残余物265)を含むことができる。Iフレームに関して、データ240は、DC残余物260とAC残余物265とを含むことができる。AC残余物265は、コード化されたブロック・パターン(CBP:Coded Block Pattern)値270、追従物(trailing ones)の数275、及び残余量子化係数280を含むことができる。Iフレームが最初のフレームであるため、どんな動き情報もIフレームに対して必要とされないことがある。PフレームとBフレームに関して、データ240は、動きベクトル285、DC残余物290及びAC残余物295を含むことができる。
図3は、複数層をスケーリングすることが可能なエンコーダ130のベース層エンコーディング・モジュール300及びエンハンスメント層エンコーディング・モジュール305のブロック図である。複数層エンコーディングは、複数の時間的予測ループを導入する。例えば、2層コーディングは、2つの時間的予測ループを導入することができる。ビデオ・データは、2つの層の間で共有されて、2つの層に対してある種のビット割当てを可能にし、そしてオーバーヘッドを削減することができる。層間予測は、エンハンスメント層において使用されて、全コーディング・オーバーヘッドを削減することができる。ベース層エンコーディング・モジュール300は、ベース層ビデオに対して使用されることができ、そしてエンハンスメント層エンコーディング・モジュール305は、エンハンスメント層ビデオに対して使用されることができる。ある複数の実施形態では、ベース層ビデオは、エンハンスメント層ビデオと同じ又はほぼ同じであり得る。ビデオ・データは、ベース層エンコーディング・モジュール300及びエンハンスメント層エンコーディング・モジュール305により受け取られる前にエンコードされることができる。
エンコードされたビデオ・データは、入力310と315のところに与えられることができる。ベース層エンコーディング・モジュール300は、変換(T)モジュール320、量子化(Q)モジュール325、逆変換(T −1)モジュール330、及び逆量子化(Q −1)モジュール335を含むことができる。エンハンスメント層エンコーディング・モジュール305は、変換(T)モジュール340、量子化(Q)モジュール345、逆変換(T −1)モジュール350、及び逆量子化(Q −1)モジュール355を含むことができる。量子化モジュール325,335,345及び355は、1又はそれより多くの量子化パラメータを含むことができ、それは最終的な画像の品質を決定するために使用されることができる。一般に、ベース層エンコーディング・モジュール300に対する量子化パラメータは、エンハンスメント層エンコーディング・モジュール305に対する量子化パラメータよりも大きい。より大きな量子化パラメータは、より低い品質の画像を示す。ベース層エンコーディング・モジュール300は、ベース層に対する残余情報360を生成することができ、エンハンスメント層エンコーディング・モジュール305は、エンハンスメント層に対する残余情報365を生成することができる。ベース層エンコーディング・モジュール300とエンハンスメント層エンコーディング・モジュール305は、しかも、それぞれ予測モジュール370と375を含むことができる。予測モジュール370と375は、1つの予測モジュールへと統合されることができる。予測モジュール370と375は、マルチメディア・データの層内エンコーディング及び層間エンコーディングを実行するために使用されることができる。
Iフレームに関して、デコードされたベース層は、エンハンスメント層に対する参照として使用されることができる。PフレームとBフレームに関して、一緒に配置されたベース・フレームと参照は、1又はそれより多くの前のフレームを補償する動きにより計算され、エンハンスメント層に対して使用されることができる。層間予測は、マクロブロック・ベースで、ブロック・ベースで(例えば、4×4ブロック・ベースで)又はdct係数ベースで実行されることが可能である。
Pフレーム又はBフレーム中の各マクロブロックに関して、層間予測又は層内予測(例えば、時間的予測)が、様々な要因、例えば、レート−ひずみコスト、に応じて使用されることが可能である。層間予測が使用される場合に、エンハンスメント層マクロブロックは、収集されたベース層マクロブロックを使用することにより予測されることができる。ある複数の実施形態では、予測エラーは、エンコードされることができ、そしてその後デコーダ150に伝送されることができる。時間的予測が使用される場合に、エンハンスメント層マクロブロックは、参照として1又はそれより多くの前のフレーム及び/又は引き続くフレームからの1又はそれより多くのマクロブロックを使用することにより、そしてベース層からのマクロブロック・モード情報と動きベクトルとを使用する(例えば、コピーする)ことにより予測されることができる。
図4は、図3の予測モジュール370と375の一部であり得るモード決定モジュール(MDM:Mode Decision Module)400のフローチャートである。MDM400は、動き推定モジュール405及び決定モジュール410を含むことができる。MDM400は、プロセッサ120及び/又はエンコーダ130により与えられることができる。動き推定モジュール405は、様々なモードに対するエンハンスメント層の動き情報(例えば、動きベクトル)を生成する。そのモードは、ベース層及びエンハンスメント層からの情報(例えば、動きベクトル及び残余物)を使用することにより決定されることができる。複数のモードがH.264動き推定の中に存在する。例えば、モード“a”は、16×16マクロブロック(出力MVとMV)であることができ、モード“b”は、(各分割出力MVとMVに対する)2個の8×16ブロック又は2個の16×8ブロックであることができ、そしてモード“c”は、(各分割出力8×8部分分割モードに対する及び各部分分割出力MVとMVに対する)4個の8×8ブロックであり得る。各マクロブロック及び各ブロックは、それ自身の動き情報を有することができる。2層コーディングに関して、複数のモードは、ビット割当てにおける大きな自由度を可能にする。ある複数の実施形態では、エンハンスメント層ビデオがより高い品質であるという理由で、ベース層と比較したときに、エンハンスメント層は、より正確な動きベクトルを生成する。2層コーディングにおいて、ベース層とエンハンスメント層は、そのベース層に対応する同じ動き情報を両者ともに使用することができる。残余情報は、予測されたマクロブロックを使用することにより、そしてそれを現在のマクロブロックから差し引くことによって生成されることができる。
エンコーダ130は、層内予測モードであるスキップ・モードを選択することができる。スキップ・モードでは、エンコーダ130は、現在のマクロブロック又はブロックに関するいかなる動き情報及び残余情報もデコーダ150へ伝送しない。現在のブロックに関する動き情報は、1又はそれより多くの隣接するブロックから導き出されることができる。1つのモードでは、エンコーダ130は、動き情報を伝送することができ、そして残余情報を伝送しないことができる。これは、coded_block_patternを0に設定することによって実現されることができる。H.264規格では、coded_block_patternが0に設定されるときに、全ての変換係数は、0である。coded_block_pattern=0であるとき、エンコーダ130により送られようとしている残余情報がないことを、デコーダ150は知らされる。coded_block_pattern値をエンコードするために、表1に示されるようなコード番号が、coded_block_patternに割り当てられることができる。コード番号は、Exp−Golombコードを使用してコード化されることができる。デコーダ150は、エンコーダ130から表1に示されるようなコード番号を受け取ることができる。
Figure 2008543130
決定モジュール410は、モードを選択することができ、それは様々な要因、例えば、エンコーディング動き情報のビット・コスト、コーディング効率、動き精度、オーバーヘッド、出来栄え、レート−ひずみ最適化、等、に影響を及ぼす。1つのモードが、ベース層に対してより良い結果を生み出すことがあり、一方で、別のモードが、エンハンスメント層に対してより良い結果を生み出すことがある。したがって、ベース層とエンハンスメント層の両方に対する“最良のモード”又は“最適モード”を実現するために、ある種の妥協をすることが、必要であり得る。もし同じモードがベース層とエンハンスメント層の両方に対して最良の結果を生み出すのであれば、妥協する必要はない。最良のモードは、例えば、レート−ひずみの最適化に基づいて選択されることができ、それはレート−ひずみが動きの精度と動き情報エンコーディングのビット・コストとの間の最善の折り合いを表すためである。決定モジュール410は、最適化の目的のためにTECM500(図5参照)を利用することができる。そのモードは、プロセッサ120及び/又はエンコーダ130にガイドライン、機能、パラメータ、ルーチンの集合、又はそれらのいずれかの組み合わせを与えることができ、ビデオ・データのエンコーディングを実行する。
以下の説明は、3つの異なるモードa,bとcの例を与える。ベース層がモードaで最高の出来栄えを有し、そしてエンハンスメント層がモードbで最高の出来栄えを有すると仮定する。もし決定モジュール410がモードaを選択するのであれば、ΔRa_enhオーバーヘッドがエンハンスメント層において導入され、そしてベース層ではオーバーヘッドが導入されない。もし決定モジュール410がモードbを選択するのであれば、ΔRa_baseオーバーヘッドがベース層において導入され、そしてエンハンスメント層ではオーバーヘッドが導入されない。もし決定モジュール410がモードcを選択するのであれば、ΔRa_baseオーバーヘッドがベース層において導入され、そしてΔRa_enhオーバーヘッドがエンハンスメント層において導入される。これらの変数から、各層について各モードに対するオーバーヘッドのコストが、決定されることができる。
両方の層に対する総コストは、下記のように決定されることができる。基準1:総コストがC=ΔRx_baseとして定義される場合、ここでxはa,b又はcであり得る、そのときには、ベース層は最高のコーディング効率を有し、そしてエンハンスメント層の結果は重要ではない。基準2:総コストがC=ΔRx_enhとして定義される場合、ここでxはa,b又はcであり得る、そのときには、エンハンスメント層は最高のコーディング効率を有し、そしてベース層の結果は重要ではない。基準3:総コストがC=ΔRx_base/2+ΔRx_enh/2として定義される場合、ここでxはa,b又はcであり得る、そのときには、ベース層とエンハンスメント層の両方は、等しく又は同様に扱われる。基準4:ベース層フレームに対する全オーバーヘッドを5%未満にすべきである場合、そのときには、マクロブロック・ベースで定義される要求が、決定されることができる。例えば、ベース層におけるマクロブロックjがエンコードされるとき、許されるオーバーヘッドの上限は、上限=(Bj−1−Ej−1+b)*5%−Ej−1として計算されることができ、ここで、Bj−1は、前のj−1マクロブロックをエンコードするために使用したビットの総数であり、Ej−1は、Bj−1中のオーバーヘッド・ビットであり、そしてbは、ベース層におけるその最良のモードでマクロブロックjをエンコードするときの使用ビットである。マクロブロックjをエンコードした後で、BとEは、次のマクロブロックのために更新されることができる。
図5は、図3の予測モジュール370と375の一部であり得る変換+エントロピー・コーディング・モジュール(TECM:Transform+Entropy Coding Module)500のフローチャートである。TECM500は、ベース層エンコーディング・モジュール505、デコーディング・モジュール510、チェッキング・モジュール515、層間予測モジュール520、及び時間的予測モジュール525を含むことができる。TECM500は、プロセッサ120及び/又はエンコーダ130により与えられることができる。TECM500は、エンコードされたベース層を使用して、エンハンスメント層を予測する。ベース層エンコーディング・モジュール505は、ベース層に対する動き情報(例えば、動きベクトル)を決定するために使用されることができる。デコーディング・モジュール510は、層間予測に先立ってエンコードされたベース層をデコードするために使用されることができる。チェッキング・モジュール515は、変換されたベース層残余物中のゼロ係数の数及び/又は非ゼロ係数の数を決定するために使用されることができる。係数に応じて、層間予測(520)又は時間的予測(525)が、エンハンスメント層を予測するために選択されることができる。
図6は、マクロブロック・ベースでの又はブロック・ベースでの層間予測を説明するフローチャートである。層内予測は、マクロブロック・ベースで又はブロック・ベースで(すなわち、マクロブロックの任意の部分(例えば、4×4ブロック・ベース))で実行されることができる。4×4ブロック・ベースでの又は2×2ブロック・ベースでの層間予測に関して、ベース層中のマクロブロックからの動き情報及び/又は残余情報は、層間予測を使用するか時間的予測を使用するかどうかを決定するために使用されることができる。ベース層エンコーディング・モジュール505は、ベース層についての動き情報及び残余情報を決定することができる(605)。ベース層エンコーディング・モジュール505は、しかもエンハンスメント層に対する参照(例えば、マクロブロック又はフレーム)を得ることができる。ベース層エンコーディング・モジュール505は、ベース層についての残余情報の非ゼロ係数の数又はゼロ係数の数を決定することができる(610)。ベース層からの残余情報がエンハンスメント層からの参照よりも多くの情報を含んでいる場合に、ベース層中の残余情報は、エンハンスメント層に対して有用である。チェッキング・モジュール515は、非ゼロ係数の数又はゼロ係数の数が選択された条件を満足するかどうかを決定することができる(615)。例えば、チェッキング・モジュール515は、ベース層の残余情報を検査することができて、非ゼロ係数の数がしきい値(T)よりも大きいか、小さいか、又は等しいかどうか、又はゼロ係数の数がしきい値(T)よりも大きいか、小さいか、又は等しいかどうかを決定する。残余情報が全て非ゼロ係数又はいくつかの非ゼロ係数を含む場合に、ベース層中の残余情報は、エンハンスメント層に対して有用であり得て、そしてエンコーダ130は、エンハンスメント層中のマクロブロックを予測するために層間予測を使用することができる(625)。残余情報が全てゼロ又はいくつかのゼロを含む場合に、ベース層中の残余情報は、エンハンスメント層に対して有用ではなく、そしてエンコーダ130は、エンハンスメント層中のマクロブロックを予測するために時間的予測を使用することができる(620)。エンコーダ130は、エンコードされたマクロブロック又はエンコードされたブロックをデコーダ150に伝送することができる(630)。
図7は、dct係数毎のベースでの層間予測を説明するための変換ドメインにおける6個の4×4ブロックを示し、そして図8は、dct係数毎のベースでの層間予測の方法を説明する。上の行は、ベース層についての動き補償された予測(MCP:motion compensated prediction)ブロックすなわち参照ブロック700、残余ブロック705、再生されたブロック710を含む。下の行は、エンハンスメント層についてのMCPブロックすなわち参照ブロック715、残余ブロック720、再生されたブロック725を含む。MCPブロック及び残余ブロック700,705,715と720は、空間(例えば、ピクセル)ドメインから変換(例えば、周波数)ドメインへと既に変換されているように示されている(805)。MCPブロック700は、ベース層中の動き情報を使用することによって生成されることができる。再生されたブロック710は、MCPブロック700及び残余ブロック705からの係数を使用することによって形成されることができる。再生されたブロック725は、再生されたブロック710からの係数を使用する(例えば、コピーする)ことによって形成されることができる。
層間予測は、ベース層についての残余ブロック705中の非ゼロ係数に実行されることができる。図7において、X^b,tは、MCPブロック700中の係数を表し、そしてEt+1は、残余ブロック705中のエンコードされた非ゼロ係数を表す。再生されたブロック710についての再生された係数は、X^b,t+1=X^b,t+Et+1によって表されることができ、そして層間予測のために使用されることができる。エンハンスメント層についての同じ位置の再生された係数は、ベース層からの再生された係数のコピーであり得る。Et+1=0又はほぼ0である場合に、係数は、エンハンスメント層に対して有用でないことがあり、そして時間的予測モジュール525は、時間的予測を実行することができ、MCPブロック715及び残余ブロック720を使用することによって再生されたブロック725を生成する。E≠0又はほぼ0でない場合に、係数は、エンハンスメント層に対して有用であり得て、そして層間予測モジュール520は、その係数を使用して層間予測を実行することができる。これゆえ、エンハンスメント層についての再生された係数は、ベース層からコピーされることができる。各係数は、同様に、層間予測を使用するか又は時間的予測を使用するかどうかを決定するためにしきい値と比較されることができる。エンハンスメント層についての係数は、エンコーダ130からデコーダ150へ送られることができる。
用語“コード化されたブロック・パターン(CBP:Coded Block Pattern)”は、マクロブロック中の全ての非ゼロ係数の合計を呼ぶ。残余ブロック705中の残余係数を使用して、層間予測モジュール520は、ベース層に対するCBP(CBP)を決定することができる(810)。残余ブロック720中の残余係数を使用して、層間予測モジュール520は、エンハンスメント層に対するCBP(CBP)を決定することができる(815)。
CBP=0又はCBP<T(しきい値)である場合、層間予測モジュール520は、残余ブロック705中の全ての係数をゼロに指定することができ(820)、そして残余ブロック720をデコーダ150に伝送することができる(825)。ある複数の実施形態では、Tは、4(又はほぼ4)であることができ、そこでは全ての非ゼロ係数の合計は、マクロブロック705中の残余係数の位置に基づいて残余係数の線形和又は加重和により決定されることができる。
CBP+CBP≠0である場合、層間予測モジュール520は、ベース層の残余係数及びエンハンスメント層の残余係数を使用して最小の量子化された係数を決定することができる(830)。例えば、最小量子化係数は、式MQC(i,j)=C(i,j)−min[C(i,j),C(i,j)]を使用して決定されることができ、ここで、Cはエンハンスメント層の残余係数であり、そしてCはベース層の残余係数である。層間予測モジュール520は、MQC(i,j)をデコーダ150に伝送することができる(835)。
(i,j)の符号≠C(i,j)の符号の場合、層間予測モジュール520は、ベース層の全ての残余係数(C(i,j))をゼロに指定することができ(840)、そしてエンハンスメント層の全ての残余係数(C(i,j))をデコーダ150に伝送することができる(845)。
図9は、層内予測又は層間予測を使用してマルチメディア・ビットストリームをデコードする方法900のフローチャートである。プロセッサ140は、ベース層とエンハンスメント層とを有するマルチメディア・ビットストリームを受け取ることができる(905)。デコーダ150は、ベース層をデコードすることができ、エンハンスメント層が層内予測又は層間予測を使用してデコードされるべきであるかどうかを決定することができる(910)。ベース層は、複数のベース層係数を含むことができる。ある複数の実施形態では、エンハンスメント層が層内予測又は層間予測を使用してデコードされるべきであるかどうかを決定するために、デコーダ150は、複数のベース層係数が少なくとも1つの非ゼロ係数を含むかどうかを判断することができる。デコーダ150は、複数のベース層係数の全てがゼロ値を有するのであれば、層内予測を使用してベース層をデコードすることができ、そして複数のベース層係数のうちの少なくとも1つが非ゼロ値を有するのであれば、層間予測を使用してベース層をデコードすることができる。
図10は、層内予測及び層間予測を用いるデコーダ1000のブロック図である。デコーダ1000は、プロセッサ140及び/又はデコーダ1500の一部であることができ、そして図9の方法を実行するために使用されることができる。デコーダ1000は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、又はそれらのいずれかの組み合わせによって与えられることができる。デコーダ1000は、決定モジュール1005、層内予測モジュール1010及び層間予測モジュール1015を含むことができる。決定モジュール1005は、ベース層とエンハンスメント層とを有するマルチメディア・ビットストリームを受け取ることができ、そしてベース層をデコードして、エンハンスメント層が層内予測又は層間予測を使用してデコードされるべきであるかどうかを判断することができる。層内予測モジュール1010は、層内予測を使用してエンハンスメント層をデコードするために使用されることができる。層間予測モジュール1015は、層間予測を使用してエンハンスメント層をデコードするために使用されることができる。
本発明のある複数の実施形態では、複数の層に関係付けられるマルチメディア・データを処理するための装置が、開示される。本装置は、ベース層残余物を決定するための手段を含むことができる。このベース層残余物を決定するための手段は、プロセッサ120、エンコーダ130、ベース層エンコーディング・モジュール300、エンハンスメント層エンコーディング・モジュール305、予測モジュール370と375、動き推定モジュール405、決定モジュール410、及び/又はベース層エンコーディング・モジュール505であり得る。本装置は、層間予測を実行するための手段を含むことができ、ベース層残余物の非ゼロ係数の数又はベース層残余物のゼロ係数の数のうちの少なくとも1つが第1の選択された条件を満足する場合に、エンハンスメント層残余物を生成することができる。この層間予測を実行するための手段は、プロセッサ120、エンコーダ130、ベース層エンコーディング・モジュール300、エンハンスメント層エンコーディング・モジュール305、予測モジュール370と375、ベース層エンコーディング・モジュール505及び/又は層間予測モジュール520であり得る。本装置は、時間的予測を実行するための手段を含むことができ、ベース層残余物の非ゼロ係数の数又はベース層残余物のゼロ係数の数のうちの少なくとも1つが第2の選択された条件を満足する場合に、エンハンスメント層残余物を生成することができる。この時間的予測を実行するための手段は、プロセッサ120、エンコーダ130、ベース層エンコーディング・モジュール300、エンハンスメント層エンコーディング・モジュール305、予測モジュール370と375、ベース層エンコーディング・モジュール505及び/又は時間的予測モジュール525であり得る。
ある複数の実施形態では、マルチメディア・ビットストリームをデコードするための装置が、開示される。本装置は、ベース層及びエンハンスメント層を有するマルチメディア・ビットストリームを受け取るための手段を含むことができる。このマルチメディア・ビットストリームを受け取るための手段は、プロセッサ140、デコーダ150、及び/又は決定モジュール1005であり得る。本装置は、ベース層をデコードするための手段を含むことができ、エンハンスメント層が層内予測又は層間予測を使用してデコードされるべきであるかどうかを決定することができる。このデコードするための手段は、プロセッサ140、デコーダ150、決定モジュール1005、層内予測モジュール1010及び/又は層間予測モジュール1015であり得る。
本明細書中に開示された複数の例に関連して説明された様々な例示的な論理ブロック、モジュール、及びアルゴリズムのステップが、電子ハードウェア、コンピュータ・ソフトウェア、又は両者の組み合わせとして与えられることができることを、当業者は、認識するはずである。ハードウェアとソフトウェアのこの互換性を明確に説明するために、様々な例示的な複数の構成要素、ブロック、モジュール、回路、及びステップが、それらの機能性の面から一般的に上に説明されてきている。そのような機能性が、ハードウェア又はソフトウェアとして実装されるかどうかは、特定のアプリケーション及びシステム全体に課せられた設計の制約に依存する。知識のある者は、説明された機能性をそれぞれの特定のアプリケーションに対して違ったやり方で実装することができる。しかし、そのような実装の判断は、開示された方法の範囲からの逸脱を生じさせるように解釈されるべきではない。
本明細書中に開示された実施形態に関連して述べられた、様々な例示的な論理ブロック、モジュール、及び回路は、汎用プロセッサ、ディジタル信号プロセッサ(DSP:digital signal processor)、用途特定集積回路(ASIC:application specific integrated circuit)、フィールド・プログラマブル・ゲートアレイ(FPGA:field programmable gate array)又は他のプログラマブル論理デバイス、ディスクリート・ゲート論理回路又はトランジスタ論理回路、ディスクリート・ハードウェア・コンポーネント、又は本明細書中で説明された機能を実行するために設計されたこれらのいずれかの組み合わせを用いて、与えられる又は実行されることができる。汎用プロセッサは、マイクロプロセッサであり得るが、しかし代わりに、プロセッサは、いずれかの従来型のプロセッサ、コントローラ、マイクロコントローラ、又はステート・マシンであり得る。プロセッサは、演算装置の組み合わせとして与えられることができ、例えば、DSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサの組み合わせ、DSPコアとともに1又はそれより多くのマイクロプロセッサの組み合わせ、又はいずれかの別のそのような構成の組み合わせであり得る。
本明細書中に開示された複数の例に関連して説明された方法又はアルゴリズムのステップは、ハードウェアにおいて、プロセッサにより実行されるソフトウェア・モジュールにおいて、又は両者の組み合わせにおいて直接実現されることができる。ソフトウェア・モジュールは、RAMメモリ、フラッシュ・メモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハード・ディスク、脱着可能なディスク、CD−ROM、又はこの技術において公知のいずれかの他の記憶媒体の中に存在することができる。ある具体例の記憶媒体は、プロセッサが記憶媒体から情報を読み出し、そこに情報を書き込めることができるようにプロセッサと接続される。あるいは、記憶媒体は、プロセッサに集積されることができる。プロセッサ及び記憶媒体は、用途特定集積回路(ASIC)中に存在することができる。ASICは、無線モデム中に存在することができる。あるいは、プロセッサ及び記憶媒体は、無線モデム中の単体コンポーネントとして存在することができる。
開示された複数の例のこれまでの説明は、当業者が、開示された方法及び装置を作成する又は使用することを可能にするために提供される。これらの例への様々な変形は、当業者に容易に明白にされるであろう。そして、ここで規定された一般的な原理は、開示された方法及び装置の精神若しくは範囲から逸脱することなく、他の複数の例に適用されることができる。開示された実施形態は、限定的ではなく例示としてのみ観点で考慮されるべきであり、したがって、本発明の範囲は、前述の記載によるよりはむしろ特許請求の範囲によって示される。特許請求の範囲と等価な意味及び範囲になる全ての変更は、それらの範囲内に包含されるべきである。
図1は、マルチメディア・データをエンコードするため及びデコードするためのシステムのブロック図である。 図2は、H.264ビデオ・データ・ビットストリームのブロック図である。 図3は、層間予測を用いる複数層をスケーリング可能なエンコーダのブロック図である。 図4は、図3の予測モジュールの一部であり得るモード決定モジュール(MDM)のフローチャートである。 図5は、図3の予測モジュールの一部であり得る変換+エントロピー・コーディング・モジュール(TECM)のフローチャートである。 図6は、マクロブロック・ベースでの又はブロック・ベースでの層間予測を説明するフローチャートである。 図7は、dct係数毎のベースでの層間予測を説明するための変換ドメインにおける6個の4×4ブロックを示す。 図8は、dct係数毎のベースでの層間予測の方法を説明する。 図9は、層内予測又は層間予測を使用してマルチメディア・ビットストリームをデコードする方法のフローチャートである。 図10は、層内予測及び層間予測を用いるデコーダのブロック図である。
符号の説明
100…システム,205…アクセス・ユニット,210…NALユニット,260,290…DC残余物,265,295…AC残余物,285…動きベクトル,300…ベース層エンコーディング・モジュール,305…エンハンスメント層エンコーディング・モジュール305,320…変換(T)モジュール,325…量子化(Q)モジュール,330…逆変換(T −1)モジュール,335…逆量子化(Q −1)モジュール,340…変換(T)モジュール,345…量子化(Q)モジュール,350…逆変換(T −1)モジュール,355…逆量子化(Q −1)モジュール。

Claims (65)

  1. 複数の層と関係するマルチメディア・データを処理する方法であって、該方法は、
    ベース層残余物を決定すること;及び
    もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数が第1の選択された条件を満足するのであれば、エンハンスメント層残余物を生成するために層間予測を実行すること、
    を具備することを特徴とする、方法。
  2. 該第1の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項1の方法。
  3. 該第1の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項1の方法。
  4. 層間予測を実行することは、
    ベース層参照ブロックの係数及び該ベース層残余物の係数に基づいてベース層再生ブロックの係数を決定すること;及び
    該ベース層再生ブロックの該係数を使用することによりエンハンスメント層再生ブロックの係数を決定すること、
    を含む、請求項1の方法。
  5. もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数のうちの少なくとも1つが第2の選択された条件を満足するのであれば、該エンハンスメント層残余物を生成するために時間的予測を実行すること、
    をさらに具備する、請求項1の方法。
  6. 該第2の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項5の方法。
  7. 該第2の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項5の方法。
  8. 時間的予測を実行することは、
    該ベース層残余物の複数の非ゼロ係数をゼロに指定すること;及び
    エンハンスメント層参照ブロックの係数及びエンハンスメント層残余物の係数に基づいてエンハンスメント層再生ブロックの係数を決定すること、
    を含む、請求項5の方法。
  9. 該エンハンスメント層残余物が伝送されるべきでないことを指示するコードを設定することをさらに具備する、請求項1の方法。
  10. 複数の層と関係するマルチメディア・データを処理するためのプロセッサであって、該プロセッサは、
    ベース層残余物を決定するため;及び
    もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数が第1の選択された条件を満足するのであれば、エンハンスメント層残余物を生成するために層間予測を実行するため、
    に構成されることを特徴とする、プロセッサ。
  11. 該第1の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項10のプロセッサ。
  12. 該第1の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項10のプロセッサ。
  13. 層間予測を実行することは、
    ベース層参照ブロックの係数及び該ベース層残余物の係数に基づいてベース層再生ブロックの係数を決定すること;及び
    該ベース層再生ブロックの該係数を使用することによりエンハンスメント層再生ブロックの係数を決定すること、
    を含む、請求項10のプロセッサ。
  14. もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数のうちの少なくとも1つが第2の選択された条件を満足するのであれば、該エンハンスメント層残余物を生成するために時間的予測を実行するためにさらに構成される、請求項10のプロセッサ。
  15. 該第2の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項14のプロセッサ。
  16. 該第2の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項14のプロセッサ。
  17. 時間的予測を実行することは、
    該ベース層残余物の複数の非ゼロ係数をゼロに指定すること;及び
    エンハンスメント層参照ブロックの係数及びエンハンスメント層残余物の係数に基づいてエンハンスメント層再生ブロックの係数を決定すること、
    を含む、請求項14のプロセッサ。
  18. 該エンハンスメント層残余物が伝送されるべきでないことを指示するコードを設定するためにさらに構成される、請求項10のプロセッサ。
  19. 複数の層と関係するマルチメディア・データを処理するための装置であって、該装置は、
    ベース層残余物を決定するための動き推定モジュール;及び
    もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数が第1の選択された条件を満足するのであれば、エンハンスメント層残余物を生成するために層間予測を実行するための層間予測モジュール、
    を具備することを特徴とする、装置。
  20. 該第1の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項19の装置。
  21. 該第1の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項19の装置。
  22. 層間予測モジュールは、
    ベース層参照ブロックの係数及び該ベース層残余物の係数に基づいてベース層再生ブロックの係数を決定する;及び
    該ベース層再生ブロックの該係数を使用することによりエンハンスメント層再生ブロックの係数を決定する、
    ことを特徴とする、請求項19の装置。
  23. もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数のうちの少なくとも1つが第2の選択された条件を満足するのであれば、該エンハンスメント層残余物を生成するために時間的予測を実行するための時間的予測モジュール、
    をさらに具備する、請求項19の装置。
  24. 該第2の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項23の装置。
  25. 該第2の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項23の装置。
  26. 該時間的予測モジュールは、
    該ベース層残余物の複数の非ゼロ係数をゼロに指定する;及び
    エンハンスメント層参照ブロックの係数及びエンハンスメント層残余物の係数に基づいてエンハンスメント層再生ブロックの係数を決定する、
    ことを特徴とする、請求項23の装置。
  27. 該エンハンスメント層残余物が伝送されるべきでないことを指示するコードを設定する決定モジュールをさらに具備する、請求項19の装置。
  28. 複数の層と関係するマルチメディア・データを処理するための装置であって、該装置は、
    ベース層残余物を決定するための手段;及び
    もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数が第1の選択された条件を満足するのであれば、エンハンスメント層残余物を生成するために層間予測を実行するための手段、
    を具備することを特徴とする、装置。
  29. 該第1の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項28の装置。
  30. 該第1の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項28の装置。
  31. 該層間予測を実行するための手段は、
    ベース層参照ブロックの係数及び該ベース層残余物の係数に基づいてベース層再生ブロックの係数を決定すること;及び
    該ベース層再生ブロックの該係数を使用することによりエンハンスメント層再生ブロックの係数を決定すること、
    を含む、請求項28の装置。
  32. もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数のうちの少なくとも1つが第2の選択された条件を満足するのであれば、該エンハンスメント層残余物を生成するために時間的予測を実行するための手段、
    をさらに具備する、請求項28の装置。
  33. 該第2の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項32の装置。
  34. 該第2の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項32の装置。
  35. 該時間的予測を実行するための手段は、
    該ベース層残余物の複数の非ゼロ係数をゼロに指定すること;及び
    エンハンスメント層参照ブロックの係数及びエンハンスメント層残余物の係数に基づいてエンハンスメント層再生ブロックの係数を決定すること、
    を含む、請求項32の装置。
  36. 該エンハンスメント層残余物が伝送されるべきでないことを指示するコードを設定するための手段をさらに具備する、請求項28の装置。
  37. 複数の層と関係するマルチメディア・データを処理する方法を組み込んだ機械読み取り可能な媒体であって、該方法は、
    ベース層残余物を決定すること;及び
    もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数が第1の選択された条件を満足するのであれば、エンハンスメント層残余物を生成するために層間予測を実行すること、
    を具備することを特徴とする、機械読み取り可能な媒体。
  38. 該第1の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項37の機械読み取り可能な媒体。
  39. 該第1の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項37の機械読み取り可能な媒体。
  40. 該方法は、
    ベース層参照ブロックの係数及び該ベース層残余物の係数に基づいてベース層再生ブロックの係数を決定すること;及び
    該ベース層再生ブロックの該係数を使用することによりエンハンスメント層再生ブロックの係数を決定すること、
    をさらに具備することを特徴とする、請求項37の機械読み取り可能な媒体。
  41. 該方法は、もし該ベース層残余物の非ゼロ係数の数又は該ベース層残余物のゼロ係数の数のうちの少なくとも1つが第2の選択された条件を満足するのであれば、該エンハンスメント層残余物を生成するために時間的予測を実行すること、をさらに具備することを特徴とする、請求項37の機械読み取り可能な媒体。
  42. 該第2の選択された条件は、該ベース層残余物の該非ゼロ係数の数がしきい値よりも小さい又は等しい場合に満足される、請求項41の機械読み取り可能な媒体。
  43. 該第2の選択された条件は、該ベース層残余物の該ゼロ係数の数がしきい値よりも大きい又は等しい場合に満足される、請求項41の機械読み取り可能な媒体。
  44. 該方法は、
    該ベース層残余物の複数の非ゼロ係数をゼロに指定すること;及び
    エンハンスメント層参照ブロックの係数及びエンハンスメント層残余物の係数に基づいてエンハンスメント層再生ブロックの係数を決定すること、
    をさらに具備することを特徴とする、請求項41の機械読み取り可能な媒体。
  45. 該方法は、該エンハンスメント層残余物が伝送されるべきでないことを指示するコードを設定することをさらに具備することを特徴とする、請求項37の機械読み取り可能な媒体。
  46. エンハンスメント層を予測するためにベース層を利用する方法であって、該方法は、
    複数のベース量子化された係数を含んでいるベース残余物を生成するためにマルチメディア・データのブロックを使用すること;
    複数のエンハンスメント量子化された係数を含んでいるエンハンスメント残余物を生成するためにマルチメディア・データの該ブロックを使用すること;
    該複数のベース量子化された係数に基づいて第1の値を決定すること;
    該複数のエンハンスメント量子化された係数に基づいて第2の値を決定すること;及び
    該複数のベース量子化された係数又は該複数のエンハンスメント量子化された係数のうちの少なくとも1つを使用して該エンハンスメント層を決定すること
    を具備することを特徴とする、方法。
  47. 該第1の値が該第2の値に等しい場合に、該複数のベース量子化された係数の最小値を伝送することをさらに具備する、請求項46の方法。
  48. 該複数のベース量子化された係数及び該複数のエンハンスメント量子化された係数から最小値を決定することをさらに具備する、請求項46の方法。
  49. 第1の合計がしきい値よりも小さい場合に、該第1の値をゼロに設定することをさらに具備する、請求項46の方法。
  50. 該複数のベース量子化された係数の符号が該複数のエンハンスメント量子化された係数の符号に等しくない場合に、該複数のエンハンスメント量子化された係数を伝送することをさらに具備する、請求項46の方法。
  51. ベース動きベクトル及び該ベース残余物を生成するために時間的予測を使用することをさらに具備する、請求項46の方法。
  52. エンハンスメント動きベクトル及び該エンハンスメント残余物を生成するために時間的予測を使用することをさらに具備する、請求項46の方法。
  53. ベース動きベクトル及び該ベース残余物を生成するために層間予測を使用することをさらに具備する、請求項46の方法。
  54. エンハンスメント動きベクトル及び該エンハンスメント残余物を生成するために層間予測を使用することをさらに具備する、請求項46の方法。
  55. エンハンスメント層を予測するためにベース層を利用するための装置であって、該装置は、
    複数のベース量子化された係数を含んでいるベース残余物を生成するためにマルチメディア・データのブロックを使用するため及び複数のエンハンスメント量子化された係数を含んでいるエンハンスメント残余物を生成するためにマルチメディア・データの該ブロックを使用するための動き推定モジュール;及び
    該複数のベース量子化された係数に基づいて第1の値を決定するため、該複数のエンハンスメント量子化された係数に基づいて第2の値を決定するため、及び該複数のベース量子化された係数又は該複数のエンハンスメント量子化された係数のうちの少なくとも1つを使用して該エンハンスメント層を決定するための予測モジュール、
    を具備することを特徴とする、装置。
  56. 該予測モジュールは、該第1の値が該第2の値に等しい場合に、該複数のベース量子化された係数の最小値を伝送することさらに備える、請求項55の装置。
  57. 該予測モジュールは、該複数のベース量子化された係数及び該複数のエンハンスメント量子化された係数から最小値を決定することをさらに備える、請求項55の装置。
  58. 該予測モジュールは、第1の合計がしきい値よりも小さい場合に、該第1の値をゼロに設定することをさらに備える、請求項55の装置。
  59. マルチメディア・ビットストリームをデコードする方法であって、
    ベース層及びエンハンスメント層を有するマルチメディア・ビットストリームを受け取ること;及び
    該エンハンスメント層が層内予測又は層間予測を使用してデコードされるべきであるかどうかを決定するために該ベース層をデコードすること、
    を具備することを特徴とする、方法。
  60. 該層内予測は、N×Mブロック・ベース又は係数ベースで実行される、請求項59の方法。
  61. 該層間予測は、N×Mブロック・ベース又は係数ベースで実行される、請求項59の方法。
  62. 該層内予測又は該層間予測は、マクロブロック・ベース又は係数ベースで実行される、請求項59の方法。
  63. 複数のベース層係数が少なくとも1つの非ゼロ係数を含むかどうかを決定すること;
    該複数のベース層係数の全てがゼロ値を有する場合に、層内予測を使用して該ベース層をデコードすること;及び
    該複数のベース層係数のうちの少なくとも1つが非ゼロ値を有する場合に、層間予測を使用して該ベース層をデコードすること、
    をさらに具備する、請求項59の方法。
  64. マルチメディア・ビットストリームをデコードするための装置であって、該装置は、
    ベース層及びエンハンスメント層を有するマルチメディア・ビットストリームを受け取るための決定モジュール;及び
    該エンハンスメント層が層内予測又は層間予測を使用してデコードされるべきであるかどうかを決定するために該ベース層をデコードするための層間予測モジュール、
    を具備することを特徴とする、装置。
  65. 層内予測モジュールをさらに具備し、
    該決定モジュールは、複数のベース層係数が少なくとも1つの非ゼロ係数を含むかどうかを決定する;
    該層内予測モジュールは、該複数のベース層係数の全てがゼロ値を有する場合に、層内予測を使用して該ベース層をデコードする;及び
    該層間予測モジュールは、該複数のベース層係数のうちの少なくとも1つが非ゼロ値を有する場合に、層間予測を使用して該ベース層をデコードする、
    ことを特徴とする、請求項64の装置。
JP2008510212A 2005-05-03 2006-05-03 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法 Expired - Fee Related JP4902642B2 (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US67760905P 2005-05-03 2005-05-03
US67761005P 2005-05-03 2005-05-03
US67760705P 2005-05-03 2005-05-03
US67761105P 2005-05-03 2005-05-03
US60/677,610 2005-05-03
US60/677,611 2005-05-03
US60/677,607 2005-05-03
US60/677,609 2005-05-03
US78927106P 2006-04-04 2006-04-04
US60/789,271 2006-04-04
PCT/US2006/017179 WO2006119443A2 (en) 2005-05-03 2006-05-03 Scalable encoding and decoding using multiple layers

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011028942A Division JP5335833B2 (ja) 2005-05-03 2011-02-14 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法

Publications (2)

Publication Number Publication Date
JP2008543130A true JP2008543130A (ja) 2008-11-27
JP4902642B2 JP4902642B2 (ja) 2012-03-21

Family

ID=37308713

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008510212A Expired - Fee Related JP4902642B2 (ja) 2005-05-03 2006-05-03 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法
JP2011028942A Expired - Fee Related JP5335833B2 (ja) 2005-05-03 2011-02-14 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011028942A Expired - Fee Related JP5335833B2 (ja) 2005-05-03 2011-02-14 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法

Country Status (9)

Country Link
US (2) US8619860B2 (ja)
EP (1) EP1877959A4 (ja)
JP (2) JP4902642B2 (ja)
KR (1) KR100942396B1 (ja)
CN (3) CN101542926B (ja)
BR (1) BRPI0610903A2 (ja)
CA (1) CA2608279A1 (ja)
TW (1) TWI326186B (ja)
WO (1) WO2006119443A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010538534A (ja) * 2007-08-28 2010-12-09 トムソン ライセンシング チャネル変更遅延のないスタガーキャスティング

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7383421B2 (en) * 2002-12-05 2008-06-03 Brightscale, Inc. Cellular engine for a data processing system
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
US8619860B2 (en) * 2005-05-03 2013-12-31 Qualcomm Incorporated System and method for scalable encoding and decoding of multimedia data using multiple layers
US7451293B2 (en) * 2005-10-21 2008-11-11 Brightscale Inc. Array of Boolean logic controlled processing elements with concurrent I/O processing and instruction sequencing
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US20070201551A1 (en) * 2006-01-09 2007-08-30 Nokia Corporation System and apparatus for low-complexity fine granularity scalable video coding with motion compensation
EP1971958A2 (en) * 2006-01-10 2008-09-24 Brightscale, Inc. Method and apparatus for processing algorithm steps of multimedia data in parallel processing systems
WO2008027567A2 (en) * 2006-09-01 2008-03-06 Brightscale, Inc. Integral parallel machine
US20080059467A1 (en) * 2006-09-05 2008-03-06 Lazar Bivolarski Near full motion search algorithm
US8548056B2 (en) 2007-01-08 2013-10-01 Qualcomm Incorporated Extended inter-layer coding for spatial scability
US8700792B2 (en) * 2008-01-31 2014-04-15 General Instrument Corporation Method and apparatus for expediting delivery of programming content over a broadband network
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
KR101431545B1 (ko) * 2008-03-17 2014-08-20 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US8752092B2 (en) 2008-06-27 2014-06-10 General Instrument Corporation Method and apparatus for providing low resolution images in a broadcast system
US9571856B2 (en) * 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8213503B2 (en) * 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
US8306153B2 (en) * 2009-09-21 2012-11-06 Techwell Llc Method and system for tracking phase in a receiver for 8VSB
CN101742321B (zh) * 2010-01-12 2011-07-27 浙江大学 基于图层分解的视频编、解码方法及装置
KR101432771B1 (ko) 2010-03-05 2014-08-26 에스케이텔레콤 주식회사 영상 부호화 장치, 그 영상 부호화 방법, 영상 복호화 장치 및 그 영상 복호화 방법
US9357244B2 (en) 2010-03-11 2016-05-31 Arris Enterprises, Inc. Method and system for inhibiting audio-video synchronization delay
US9338458B2 (en) * 2011-08-24 2016-05-10 Mediatek Inc. Video decoding apparatus and method for selectively bypassing processing of residual values and/or buffering of processed residual values
FR2982447A1 (fr) 2011-11-07 2013-05-10 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
FR2982446A1 (fr) 2011-11-07 2013-05-10 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
GB2499865B (en) * 2012-03-02 2016-07-06 Canon Kk Method and devices for encoding a sequence of images into a scalable video bit-stream, and decoding a corresponding scalable video bit-stream
GB2501115B (en) 2012-04-13 2015-02-18 Canon Kk Methods for segmenting and encoding an image, and corresponding devices
KR20130107861A (ko) * 2012-03-23 2013-10-02 한국전자통신연구원 인터 레이어 인트라 예측 방법 및 장치
KR102001415B1 (ko) 2012-06-01 2019-07-18 삼성전자주식회사 다계층 비디오 코딩을 위한 레이트 제어 방법, 이를 이용한 비디오 인코딩 장치 및 비디오 신호 처리 시스템
EP2858350A4 (en) * 2012-07-06 2016-05-04 Samsung Electronics Co Ltd METHOD AND DEVICE FOR MULTILAYER VIDEO DICTIONING FOR DIRECT ACCESS AND METHOD AND DEVICE FOR MULTILAYER VIDEO DECODING FOR DIRECT ACCESS
TWI637625B (zh) 2012-08-29 2018-10-01 Vid衡器股份有限公司 可調整視訊編碼移動向量預測的方法及裝置
US10194158B2 (en) 2012-09-04 2019-01-29 Qualcomm Incorporated Transform basis adjustment in scalable video coding
US9906786B2 (en) 2012-09-07 2018-02-27 Qualcomm Incorporated Weighted prediction mode for scalable video coding
US9491459B2 (en) 2012-09-27 2016-11-08 Qualcomm Incorporated Base layer merge and AMVP modes for video coding
KR102447521B1 (ko) 2012-10-01 2022-09-26 지이 비디오 컴프레션, 엘엘씨 베이스 레이어로부터 예측을 위한 서브블록 세부분할의 유도를 이용한 스케일러블 비디오 코딩
US9602841B2 (en) * 2012-10-30 2017-03-21 Texas Instruments Incorporated System and method for decoding scalable video coding
US9247256B2 (en) 2012-12-19 2016-01-26 Intel Corporation Prediction method using skip check module
GB2509705B (en) * 2013-01-04 2016-07-13 Canon Kk Encoding and decoding methods and devices, and corresponding computer programs and computer readable media
KR20140092198A (ko) 2013-01-07 2014-07-23 한국전자통신연구원 계층적 비디오 부호화에서의 스케일러빌리티 정보 표현방식
US10616607B2 (en) 2013-02-25 2020-04-07 Lg Electronics Inc. Method for encoding video of multi-layer structure supporting scalability and method for decoding same and apparatus therefor
WO2014129873A1 (ko) * 2013-02-25 2014-08-28 엘지전자 주식회사 스케일러빌러티를 지원하는 멀티 레이어 구조의 비디오 인코딩 방법 및 비디오 디코딩 방법과 이를 이용하는 장치
US9807421B2 (en) * 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
EP2983363A4 (en) * 2013-04-05 2016-10-19 Samsung Electronics Co Ltd MULTI-LAYER VIDEO ENCODING METHOD FOR RANDOM ACCESS AND DEVICE THEREFOR, AND MULTI-LAYER VIDEO DECODING METHOD FOR RANDOM ACCESS AND DEVICE THEREOF
CN104604234B (zh) * 2013-07-12 2019-07-16 索尼公司 图像编码设备和方法
CN105659598A (zh) 2013-10-22 2016-06-08 株式会社Kt 用于对多层视频信号进行编码/解码的方法和装置
MX360338B (es) * 2013-10-29 2018-10-30 Kt Corp Metodo y dispositivo de codificacion/decodificacion de señal de video de multiples capas.
US9794558B2 (en) * 2014-01-08 2017-10-17 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US9712837B2 (en) * 2014-03-17 2017-07-18 Qualcomm Incorporated Level definitions for multi-layer video codecs
GB2538531A (en) * 2015-05-20 2016-11-23 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
CN113810711B (zh) * 2016-04-29 2024-05-10 世宗大学校产学协力团 用于对图像信号进行编码和解码的方法和装置
US11140368B2 (en) 2017-08-25 2021-10-05 Advanced Micro Devices, Inc. Custom beamforming during a vertical blanking interval
US11539908B2 (en) * 2017-09-29 2022-12-27 Advanced Micro Devices, Inc. Adjustable modulation coding scheme to increase video stream robustness
US11398856B2 (en) 2017-12-05 2022-07-26 Advanced Micro Devices, Inc. Beamforming techniques to choose transceivers in a wireless mesh network
US10904563B2 (en) * 2019-01-02 2021-01-26 Tencent America LLC Method and apparatus for improved zero out transform
US11699408B2 (en) 2020-12-22 2023-07-11 Ati Technologies Ulc Performing asynchronous memory clock changes on multi-display systems

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005167431A (ja) * 2003-12-01 2005-06-23 Nippon Telegr & Teleph Corp <Ntt> 階層符号化方法及びその装置と、階層復号方法及びその装置と、階層符号化プログラム及びそのプログラムを記録した記録媒体と、階層復号プログラム及びそのプログラムを記録した記録媒体
JP2006304307A (ja) * 2005-04-19 2006-11-02 Samsung Electronics Co Ltd エントロピーコーディングのコンテキストモデルを適応的に選択する方法及びビデオデコーダ

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04177992A (ja) 1990-11-09 1992-06-25 Victor Co Of Japan Ltd 階層性を有する画像符号化装置
US5515377A (en) * 1993-09-02 1996-05-07 At&T Corp. Adaptive video encoder for two-layer encoding of video signals on ATM (asynchronous transfer mode) networks
JP3788823B2 (ja) 1995-10-27 2006-06-21 株式会社東芝 動画像符号化装置および動画像復号化装置
KR100418141B1 (ko) * 1997-04-01 2004-06-09 소니 가부시끼 가이샤 화상부호화장치,화상부호화방법,화상복호화장치및화상복호화방법
KR100261254B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6233356B1 (en) * 1997-07-08 2001-05-15 At&T Corp. Generalized scalability for video coder based on video objects
US6731811B1 (en) * 1997-12-19 2004-05-04 Voicecraft, Inc. Scalable predictive coding method and apparatus
US6275531B1 (en) 1998-07-23 2001-08-14 Optivision, Inc. Scalable video coding method and apparatus
US6563953B2 (en) 1998-11-30 2003-05-13 Microsoft Corporation Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock
US6263022B1 (en) 1999-07-06 2001-07-17 Philips Electronics North America Corp. System and method for fine granular scalable video with selective quality enhancement
US6788740B1 (en) * 1999-10-01 2004-09-07 Koninklijke Philips Electronics N.V. System and method for encoding and decoding enhancement layer data using base layer quantization data
US6480547B1 (en) * 1999-10-15 2002-11-12 Koninklijke Philips Electronics N.V. System and method for encoding and decoding the residual signal for fine granular scalable video
US6985526B2 (en) * 1999-12-28 2006-01-10 Koninklijke Philips Electronics N.V. SNR scalable video encoding method and corresponding decoding method
US6700933B1 (en) 2000-02-15 2004-03-02 Microsoft Corporation System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding
US20020126759A1 (en) * 2001-01-10 2002-09-12 Wen-Hsiao Peng Method and apparatus for providing prediction mode fine granularity scalability
EP1442601A1 (en) * 2001-10-26 2004-08-04 Koninklijke Philips Electronics N.V. Method and appartus for spatial scalable compression
US7317759B1 (en) * 2002-02-28 2008-01-08 Carnegie Mellon University System and methods for video compression mode decisions
US6674376B1 (en) * 2002-09-13 2004-01-06 Morpho Technologies Programmable variable length decoder circuit and method
KR101052319B1 (ko) * 2002-11-15 2011-07-27 가부시키가이샤 에바라 세이사꾸쇼 기판처리장치 및 기판처리방법
KR20060105409A (ko) 2005-04-01 2006-10-11 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
US7406176B2 (en) * 2003-04-01 2008-07-29 Microsoft Corporation Fully scalable encryption for scalable multimedia
KR100505961B1 (ko) * 2003-09-09 2005-08-03 주식회사 엠투시스 슬라이딩 방식 개폐장치를 갖는 휴대용 단말기
KR101031588B1 (ko) * 2004-02-24 2011-04-27 주식회사 포스코 현열 회수가 가능한 미립 슬래그 제조장치
US20060008009A1 (en) * 2004-07-09 2006-01-12 Nokia Corporation Method and system for entropy coding for scalable video codec
KR20060059773A (ko) 2004-11-29 2006-06-02 엘지전자 주식회사 베이스 레이어 픽처의 벡터를 이용하는 영상신호의엔코딩/디코딩 방법 및 장치
KR20060101847A (ko) 2005-03-21 2006-09-26 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
KR100746007B1 (ko) * 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
US8619860B2 (en) * 2005-05-03 2013-12-31 Qualcomm Incorporated System and method for scalable encoding and decoding of multimedia data using multiple layers
KR100878811B1 (ko) 2005-05-26 2009-01-14 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 이의 장치
KR100682405B1 (ko) * 2005-07-29 2007-02-15 김재홍 폴리에틸렌 발포원단에 액상수지 코팅과 코팅층에 엠보싱되는 엠보싱 폴리에틸렌 발포원단의 제조장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005167431A (ja) * 2003-12-01 2005-06-23 Nippon Telegr & Teleph Corp <Ntt> 階層符号化方法及びその装置と、階層復号方法及びその装置と、階層符号化プログラム及びそのプログラムを記録した記録媒体と、階層復号プログラム及びそのプログラムを記録した記録媒体
JP2006304307A (ja) * 2005-04-19 2006-11-02 Samsung Electronics Co Ltd エントロピーコーディングのコンテキストモデルを適応的に選択する方法及びビデオデコーダ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010538534A (ja) * 2007-08-28 2010-12-09 トムソン ライセンシング チャネル変更遅延のないスタガーキャスティング

Also Published As

Publication number Publication date
EP1877959A4 (en) 2013-01-02
BRPI0610903A2 (pt) 2008-12-02
JP4902642B2 (ja) 2012-03-21
CN101542926A (zh) 2009-09-23
CN104079935A (zh) 2014-10-01
US8619860B2 (en) 2013-12-31
CN102724496A (zh) 2012-10-10
JP2011120281A (ja) 2011-06-16
KR100942396B1 (ko) 2010-02-17
TW200718214A (en) 2007-05-01
US20060262985A1 (en) 2006-11-23
CN101542926B (zh) 2012-07-04
TWI326186B (en) 2010-06-11
KR20080015830A (ko) 2008-02-20
WO2006119443A3 (en) 2009-04-16
JP5335833B2 (ja) 2013-11-06
US20120219060A1 (en) 2012-08-30
CA2608279A1 (en) 2006-11-09
EP1877959A2 (en) 2008-01-16
WO2006119443A2 (en) 2006-11-09
CN104079935B (zh) 2018-02-16
CN102724496B (zh) 2017-04-12

Similar Documents

Publication Publication Date Title
JP4902642B2 (ja) 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法
JP6416992B2 (ja) ビデオビットストリームをトランスコーディングする方法及び構成
JP4991699B2 (ja) ビデオ信号のスケーラブルなエンコーディング方法およびデコーディング方法
US8351502B2 (en) Method and apparatus for adaptively selecting context model for entropy coding
EP2319241B1 (en) Skip modes for inter-layer residual video coding and decoding
JP6158802B2 (ja) 復号装置および復号方法
JP6096204B2 (ja) 画像の符号化および復号のための方法、符号化および復号装置、ならびに対応するコンピュータプログラム
KR102517432B1 (ko) 이미지들을 인코딩 및 디코딩하기 위한 방법,인코딩 및 디코딩 디바이스,및 대응하는 컴퓨터 프로그램들
US7577200B2 (en) Extended range variable length coding/decoding of differential motion vector information
US20140092956A1 (en) Adaptive transform options for scalable extension
KR100694137B1 (ko) 동영상 부호화 장치, 동영상 복호화 장치, 및 그 방법과,이를 구현하기 위한 프로그램이 기록된 기록 매체
US20070171970A1 (en) Method and apparatus for video encoding/decoding based on orthogonal transform and vector quantization
WO2009035210A1 (en) Method, medium, and apparatus for encoding and/or decoding video
MXPA06002496A (es) Codificacion y descodificacion de plano de bit para estado de prediccion ac e informacion de tipo de codificacion de campo/marco de macrobloque.
WO2006112642A1 (en) Method and apparatus for adaptively selecting context model for entropy coding
GB2509901A (en) Image coding methods based on suitability of base layer (BL) prediction data, and most probable prediction modes (MPMs)
KR20070057618A (ko) 화소 단위 기반 영상 부호화 및 복호화 장치 및 방법
TW202236852A (zh) 高效視訊編碼器架構
US20150010083A1 (en) Video decoding method and apparatus using the same
KR20080013843A (ko) 동영상의 무손실 부호화, 복호화 방법 및 장치
KR20140048805A (ko) 다중 계층 비디오를 위한 계층 간 예측 방법 및 그 장치
RU2409857C2 (ru) Система и способ масштабируемого кодирования и декодирования мультимедийных данных с использованием множества уровней
KR20140048806A (ko) 공간 해상도에 기반한 계층 간 예측 장치 및 방법
AU2008201768A1 (en) Method and apparatus for adaptively selecting context model for entropy coding
JP2002374536A (ja) 符号化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101214

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110113

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111228

R150 Certificate of patent or registration of utility model

Ref document number: 4902642

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees