JP2009531990A - 映像圧縮におけるリファインメント係数符号化のための方法及び装置 - Google Patents

映像圧縮におけるリファインメント係数符号化のための方法及び装置 Download PDF

Info

Publication number
JP2009531990A
JP2009531990A JP2009503196A JP2009503196A JP2009531990A JP 2009531990 A JP2009531990 A JP 2009531990A JP 2009503196 A JP2009503196 A JP 2009503196A JP 2009503196 A JP2009503196 A JP 2009503196A JP 2009531990 A JP2009531990 A JP 2009531990A
Authority
JP
Japan
Prior art keywords
refinement
coefficients
encoding
variable length
symbols
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009503196A
Other languages
English (en)
Other versions
JP5248475B2 (ja
Inventor
イエ、ヤン
バオ、イリアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009531990A publication Critical patent/JP2009531990A/ja
Application granted granted Critical
Publication of JP5248475B2 publication Critical patent/JP5248475B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

圧縮された映像系列のSNR(信号対雑音比)スケーラブルなエンハンスメントレイヤにおけるリファインメント係数を符号化する方法が開示される。映像系列が受信される。その映像系列から、現在のフレームにおける元の映像信号の予測が構成される。現在のフレームにおける元の映像信号から、元の信号の予測を減算することによって残差信号が生成される。残差信号に対してある変換が適用される。複数の変換係数は、量子化される。リファインメント係数は、三値のリファインメント記号にマップされる。リファインメント記号は、ある符号化順序でグループ分けされる。リファインメント記号グループは、可変長符号を使用して符号化される。
【選択図】 図3

Description

関連技術
[米国特許法(35U.S.C.)第119条に基づく優先権主張]
本件特許出願は、本願の譲渡人にともに譲渡され、参照によって本明細書に組み込まれる、2006年3月27日の「Refinement Coefficient Coding for Fine Granularity Scalability」という名称の米国仮出願60/786,800及び2006年7月11日の「Methods and Systems for Refinement Coefficient Coding in Video Compression」という名称の米国仮出願60/839,199に基づいて優先権を主張するものである。
本件開示は、一般に映像処理に関連し、より詳細には、映像圧縮技法に関係する情報符号化及び復号のための方法及び装置に関する。
発明の背景
映像圧縮技法において、コンピュータ技術は進歩を続けてきた。映像圧縮とは、デジタル映像データの圧縮をいう。映像圧縮は、映像データを映像ファイルフォーマットに効率的に符号化し、及び映像フォーマットをストリーム化して放送することにとって、強く望まれる。圧縮とは、より少ないビット数を必要とするフォーマットへのデータ変換であって、通常はデータをより効率的に記憶又は伝送することができるようにするために行われる。伸張(圧縮の反対)とは、元のデータの複製を作ることをいう。
今日、多くの映像圧縮方法は、時間的予測技術又は空間的予測技術のいずれかによって生成される予測残差における残りの空間的冗長度を減らすために、離散コサイン変換のようなある種の離散変換を適用する。多くの映像圧縮技法はまた、量子化(スカラー量子化又はベクトル量子化のいずれか)を伴う。量子化後、量子化された係数は、エントロピー符号化され、圧縮映像ビットストリームに配置される。圧縮ビットストリームは次に復号器に送られ、復号器はビットストリームを復元して元のデータの近似を再生する。
映像圧縮技法は、多様な形式のメディアの消費者に利益をもたらす。例えば、放送エンジニアリングにおいては、映像圧縮によってデジタルテレビが実用的なものとされる。テレビ局はHDTVのみならず、同一の物理的チャネル上でのマルチプル仮想チャネルも放送することができる。デジタル映像放送は、MPEG-2規格の映像圧縮フォーマットを用いることができる。映像圧縮の新しい規格としてH.264/MPEG-4及びVC-1が登場しているところである。
残念なことに、映像情報を圧縮符号化する公知のシステム及び方法には様々な欠点がある。したがって、映像情報を圧縮符号化するためのシステム及び装置を改善することによって利益が実現される可能性がある。本明細書では、映像情報を圧縮符号化するためのいくつかのシステム及び方法が説明される。
発明の概要
圧縮された映像系列のSNR(信号対雑音比)スケーラブルなエンハンスメントレイヤ(enhancement layer)におけるリファインメント係数を符号化する方法が開示される。映像系列が受信される。その映像系列から、現在のフレームにおける元の映像信号の予測が構成される。現在のフレームにおける元の映像信号から、元の信号の予測を減算することによって残差信号が生成される。残差信号に対してある変換が適用される。複数の変換係数は、量子化される。リファインメント係数は、三値のリファインメント記号にマップされる。リファインメント記号は、ある符号化順序でグループ分けされる。リファインメント記号グループは、可変長符号を使用して符号化される。
異なるエンハンスメントレイヤについて可変長符号化テーブルが適応的に選択される。ある実施形態において、可変長符号化テーブルは、リファインメント記号の確率推定(probability estimation)に基づいて適応的に選択される。特定の可変長符号化テーブルの選択は、エンハンスメントレイヤのレベルに基づいて行われてよい。ある実施形態においては、特定の可変長符号化テーブルの選択は、係数が初めてリファインされているか、又はその係数が前のレイヤでリファインされたものであるかに基づいて行われる。
ある実施形態において、本方法は有意係数(significant coefficients)及びリファインメント係数(refinement coefficients)をインターリーブする。複数のブロックを含むスライスが識別される。複数のブロックは、リファインメント係数のグループ分けの前に走査されてよい。リファインメント係数が符号化される順序が決定される。リファインメント係数は、決定された順序にしたがって待ち行列(queue)に記憶されてよい。
ある実施形態では、固定された数のあらゆる連続的なリファインメント係数が可変長符号化テーブルを使用して一緒に符号化される。ある実施形態では、1つのスライスのリファインメント係数が一緒にグループ化される。フラッシュ(flush)オペレーションが行われてもよい。可変長符号化テーブルは、27項目の可変長符号化テーブルを含み、ここにおいてグループ長(group length)は3である。エンハンスメントレイヤにおいてはサブバンドベースの符号化順序が用いられる。
圧縮された映像系列のSNRスケーラブルなエンハンスメントレイヤにおけるリファインメント係数を符号化する方法を実行する電子デバイスも開示される。この電子デバイスは、プロセッサ、及びそのプロセッサと電子的に通信するメモリを含む。メモリに記憶された命令も含まれる。映像系列が受信される。その映像系列から、現在のフレームにおける元の映像信号の予測が行われる。現在のフレームにおける元の映像信号から、元の信号の予測を減算することによって残差信号が形成される。残差信号に対して、ある変換が適用される。複数の変換係数は、量子化される。リファインメント係数は、三値のリファインメント記号にマップされる。リファインメント記号は、ある符号化順序でグループ化される。リファインメント記号グループは、可変長符号を用いて符号化される。
圧縮された映像系列のSNRスケーラブルなエンハンスメントレイヤにおけるリファインメント係数を符号化する方法を実行する命令を含むコンピュータ可読媒体も開示される。映像系列が受信される。その映像系列から、現在のフレームにおける元の映像信号の予測が行われる。現在のフレームにおける元の映像信号から、元の信号の予測を減算することによって残差信号が形成される。残差信号に対して、ある変換が適用される。複数の変換係数は、量子化される。リファインメント係数は、三値のリファインメント記号にマップされる。リファインメント記号は、ある符号化順序でグループ化される。リファインメント記号グループは、可変長符号を用いて符号化される。
符号化された映像系列におけるリファインメント係数を復号する方法も開示される。符号化された映像系列が受信される。可変長符号化テーブルを用いて、リファインメント記号が復号される。リファインメント記号を用いて、リファインメント係数が復号される。ここにおいて、リファインメント係数は、ある符号化順序でグループ化されたものである。複数の変換係数が逆量子化される。リファインメント信号に対して逆の変換が適用される。映像系列が構成される。
ある実施形態では、符号化された映像ストリームは、インターリーブされた有意記号及びリファインメント記号を含む。要求されているリファインメント係数の場所が記憶される。対応するベースレイヤ係数(base layer coefficients)のサインが記憶される。なされた要求の数に関係するカウンタが1増やされる。ある実施形態では、カウンタが所定の値に達するかどうかが決定される。読み出し操作が実施され、その結果、通常の可変長符号化テーブル復号が実行される。リファインメント記号のグループが得られる。
詳細な説明
以下において本件開示の様々な実施形態が図を参照しつつ説明される。本明細書では、同類の参照番号は同一又は機能的に類似の要素を表示するものとする。本明細書において一般的に説明及び図示されるような本件開示の実施形態は、様々な異なる構成において配置及び設計することができる。したがって、図において表現されているような本件開示のいくつかの実施形態についての下記のさらに詳しい説明は、開示の範囲を限定することを意図したものではなく、たんに本件開示の実施形態を代表するものにすぎない。
本明細書において開示される実施形態の多くの特徴は、コンピュータソフトウェア、電子的ハードウェア、又は両者の組み合わせとして実装することができる。ハードウェアとソフトウェアのこの交換可能性を明確に示すために、様々な構成要素は、その機能性に置き換えて一般的に説明される。そのような機能性をハードウェアで実装するかソフトウェアで実装するかは、特定のアプリケーション及びシステム全体に課されるデザイン上の制約によって決定することができる。当業者であれば、各々の特定のアプリケーションのために、本明細書において説明される機能性を種々の手段で実装することができよう。しかし、かかる実装は、本明細書の範囲からの離脱を引き起こすものと解されてはならない。
本明細書において説明される機能性がコンピュータソフトウェアとして実装される場合、そのようなソフトウェアは、メモリデバイスに記憶され、及び/又はシステムバス又はネットワーク上を電子信号として送信される任意の形式のコンピュータ命令又は機械実行可能なコードを含む。本明細書において説明される構成要素と関連づけられた機能性を実行するソフトウェアは、単一の命令又は多くの命令からなるものであってよく、またいくつかの異なるコードセグメントの上で、異なるプログラムの間で、及びいくつかのメモリデバイスにわたって分散されるものであってもよい。
予測、変換、及び量子化のような一般的映像圧縮技法の後、次なるステップは、ビットストリームを形成するために、シンタックス要素及び量子化された係数に基づいて、エントロピー符号化を行うことである。シンタックス要素及び量子化された係数は、ビットストリームから復号される。次に、逆量子化及び逆変換ステップが実行される。最後に、映像信号を再構成するために、再構成された残差が予測に加えられる。
合同映像チーム(JVT)とは、ISO/IECのMPEG 及びIUT-TのVCEGの専門家からなるチームである。このチームは、H.264/AVCの拡張であるSVC(Scalable Video Coding)に取り組んでいる。JSVM(Joint Scalable Video Model)と呼ばれる共通ソフトウェアが参加者によって用いられている。JSVMは様々なスケーラビリティ特徴をサポートしている。SVCビットストリームは、高精細粒度スケーラビリティ、空間的スケーラビリティ、時間的スケーラビリティ又はその3つの任意の組み合わせを有することができる。
高精細粒度スケーラビリティ(Fine Granularity Scalability)、以下ではFGSというが、これは映像符号化にとって重要でかつ非常に強く望まれる特徴である。この特徴は、圧縮されたビットストリームをほぼ随意に切って短くすることを可能にすると同時に、その一方で、復号された映像の品質の最低保証機能(graceful degradation)をエンドユーザーに提供する。映像符号器がより多くのビットをFGSレイヤで受信し復号するので、より良い映像品質が作り出される。JSVMにおけるFGSは、映像品質における改善が映像フレームの一部の空間領域だけに集中されるやり方とは反対に、映像フレーム全体にわたって等しく広がるやり方で設計されてきた。なぜなら、前者のやり方は、エンドユーザーにとって映像的に不愉快なことであるからである。
FGSはビットプレーン符号化を用いることによって見事な映像品質の改善を実現する。もし、ベース又は前のレイヤの映像フレームが量子化パラメータQPを用いて量子化されるのであれば、現在のエンハンスメントレイヤの映像は、典型的にはQP-6前後の量子化パラメータを用いて量子化される。QP-6は量子化ステップサイズを効果的に半減する。量子化ステップサイズがより小さくなることの結果として、より多くの変換係数がエンハンスメントレイヤにおいて非ゼロ(nonzero)になる。エンハンスメントレイヤにおける非ゼロの係数は、非有意係数、有意係数、及びリファインメント係数の3つのタイプに分けられる。「非有意」係数とは、エンハンスメントレイヤのレベルにおいてゼロである係数をさし、ベース又は前のレイヤにおける対応する係数はゼロである。「有意」係数とは、ベース又は前のレイヤにおいて対応する係数がゼロであって、エンハンスメントレイヤにおいて非ゼロになる係数をさす。「リファインメント」係数とは、ベース又は前のレイヤにおいてすでに非ゼロ(すなわち有意)である係数をさす。これらの係数の値は、現在のエンハンスメントレイヤにおいてリファインされるであろう。
リファインメント係数は、他の係数とは異なる生起統計を有するので、FGSレイヤでは別に符号化される。H.264/AVCと同じように、SVCの勧告草案もまた、2つのエントロピー符号化モード、すなわち、CABAC(Context-based Adaptive Binary Arithmetic Coding)モード及びCAVLC(Context-based Adaptive Variable Length Coding)モードをサポートする。CAVLCモードにおける改善されたリファインメント係数符号化スキームについての詳細が示すところによれば、符号化の効率を改善するだけでなく、符号器及び復号器の双方についての計算量を著しく減らすことができる。
FGSレイヤにおいて、リファインメント係数は2つのシンタックス要素―coeff_refinement_flag及びcoeff_refinement_direction_flagを使用して送信される。第一のシンタックス要素coeff_refinement_flagは、リファインメント係数のレベルがゼロに等しいかどうかを特定する。一般性を失うことなく、もしcoeff_refinement_flag=0であれば、リファインメント係数レベルの値はゼロに等しく、一方、coeff_refinement_flag=1は、リファインメント係数レベルの値が−1又は1のいずれかであることを特定する、と仮定する。第二の要素coeff_refinement_direction_flagは、変換係数リファインメントレベルのサイン(正負)がそのベース又は前のレイヤ表現のサインと同じか違うかを特定する。一般性を失うことなく、もしcoeff_refinement_direction_flag=0であれば、変換係数リファインメントレベルのサインはベースレイヤにおいて対応する係数のサインに等しく、そうでなければ、リファインメントレベルは反対のサインを有する、と仮定する。
CAVLCモードでは、FGSレイヤにおけるリファインメント係数を符号化する1つの手段は、リファインメント係数をブロックごとに処理することである。いったん映像符号器がブロック内のリファインメント係数の符号化を始めると、現在のブロック内のすべてのリファインメント係数の符号化が終わるまで、他のブロックの係数の符号化は始まらない。かかるスキームは、かつてJSVMの1つのバージョンで採用された。
表1は、そのようなブロックベースのリファインメント符号化プロセスを擬似コードで要約したものである。
Figure 2009531990
リファインメント復号プロセスは、シンタックスcoeff_refinement_flag及びcoeff_refinement_direction_flagを再生するために逆の順序で実行される。ベース又は前のレイヤ係数とともに、これらの2つのフラグを用いることによって、復号器はリファインメント係数を再構成することができる。復号器はまた、符号器との同期を保つため、同じようにバッファ内の生起統計情報を維持し更新する。
表1において、VLCTab(VLCTab1又はVLCTab2)は3つの値の1つをとることができる。この3つの値は、リファインメントフラグシンタックスによるVLC符号化を行うための異なる方法を示すものである。もしVLCTab=0であれば、リファインメントシンタックスは1ビット単位で送られる(フラグ符号化)。もしVLCTab=1であれば、リファインメントシンタックスは、3ビットのグループで送信される。もしVLCTab=2であれば、リファインメントシンタックスは、4ビットのグループで送信される。VLCTabの値は、現在の映像スライスにおけるリファインメント係数の累積された統計にしたがって適応的に決定される。また、符号器及び復号器の双方とも、最も出現頻度の高い記号(Most Probable Symbol, MPS)の値を追跡し、MPSが0から1に変わった場合又はその逆の場合、符号化されている実際の記号を切り替える。
現在のCAVLCリファインメント符号化方法は、計算量が相対的に大きい。例えば、現在の方法は、2つのリファインメントシンタックス(レベルシンタックスと方向シンタックス)の累積された統計を維持及び更新することを必要とする。現在の方法はまた、VLCTab及びMPSの値を更新する必要がある。現在の方法は、0及び1についての確率カウントを必要なとき元のサイズに戻すことによって、そのカウントがオーバーフローしないように確実にしておく必要がある。グループ長を適応的に変えることもまた、実行を複雑にする。
現在のリファインメント符号化方法は、相対的に計算量が大きいにもかかわらず、非効率である可能性がある。シミュレーションによれば、ある系列について、CAVLCリファインメント符号化は、CABACリファインメント符号化に比べて、2倍のビット数を必要とすることがある(100%のペナルティ)。ところが、CABACの代わりにCAVLCモードを使うことの全体的ビットレートペナルティは、通常わずか15%程度か又はそれ以下である。この非効率性は、CAVLCリファインメント符号化が各ブロックの終わりでビットフラッシュオペレーションを2回実行する(1回目はレベルシンタックスのため、2回目は方向シンタックスのため)という事実に主な原因がある。もし1つのブロックが非常に少ない数のリファインメント係数(例えば、わずか1つ又は2つの係数)しか含んでいないのであれば、頻繁なフラッシュオペレーションは3又は4ビットを一緒にグループ化することを不可能にするかもしれず、このゆえ、重いビットペナルティを招くことになる。なぜなら、可変長符号化はこのスキームにしたがって使用することができないからである。
本明細書において使用されるように、「ある実施形態」「実施形態」「実施形態(複数)」「その実施形態」「その実施形態(複数)」「1つ又はそれ以上の実施形態」「いくつかの実施形態」「ある特定の実施形態」「1つの実施形態」「他の実施形態」及び類似の語は、明示的に特定しないかぎり、「開示されている開示の1つ又はそれ以上の(必ずしも全部というわけではない)実施形態」を意味する。
「決定すること」(及びそれの文法上の変形)という語は非常に広い意味で使われる。「決定すること」という語は様々なアクションを広く含むものであって、それゆえ、「決定すること」は、計算すること、コンピューティングすること、処理すること、導き出すこと、調査すること、調べること(例えば、表、データベース又はその他のデータ構造を調べること)、確かめること、及びその類義語のものを含む。「決定すること」はまた、受信すること(例えば、情報を受信すること)、アクセスすること(例えば、メモリ内のデータにアクセスすること)及びその類義語を含むことができる。「決定すること」はまた、解決すること、選択すること、選ぶこと、確立すること、及び同様の語をも含むことができる。
「に基づく」という語句は、明示的に特定しないかぎり、「のみに基づく」を意味するものではない。いいかえれば、「に基づく」という語句は、「のみに基づく」と「少なくとも〜に基づく」の双方をさす。
図1は、FGS(Fine Granularity Scalability)と呼ばれるスケーラブルな映像符号化ビットストリームの構造の1つの実施形態である。FGSにおいて、映像系列は少なくとも2つのレイヤ、すなわちベースレイヤ106及びエンハンスメントレイヤ104を用いて、単一のビットストリームに圧縮される。図示されているように、FGSはN個のエンハンスメントレイヤを含むことができる。
1つの実施形態において、ベースレイヤ106は、映像系列の非スケーラブルな符号化であって、典型的に、最も低い品質の映像系列を有するレイヤである。エンハンスメントレイヤ104乃至エンハンスメントレイヤN102は、ベースレイヤ106より上位の異なるレベルの品質を有する。ベースレイヤ106の後に符号化された追加的な各エンハンスメントレイヤを復号することによって、その結果として、高品質の映像系列を得ることができる。くわえて、FGSビットストリームは、符号化の最中又はその後、エンハンスメントレイヤ104乃至エンハンスメントレイヤN102に係るビットストリームをリアルタイムで適宜切って短くする(ビットレート及びそれゆえ復号ピクチャーの品質を削減する)ことができるという1つの意義ある利点をもっている。このことは、送信されるビットレートをフレキシブルに制御することを実現し、エンハンスメントレイヤ104乃至エンハンスメントレイヤN102を利用可能な送信ビットレートに適宜適応するよう調整することを可能にする。
図2は、ネットワークのブロック図200である。この図は、符号器208からネットワーク210を通って復号器212へ送信されるベースレイヤ202及びN個のエンハンスメントレイヤ204を示す。復号器212は、ベースレイヤ202及び、1つ又はそれ以上のエンハンスメントレイヤ204のうちの全部又は部分を復号及び使用することができる。復号器212は、元の映像系列206の最適近似214を構成する。1つの実施形態において、最適近似214は、コンピュータモニタ、PDA、プロジェクタ等のようなディスプレイ216に表示される。映像系列206は、ベースレイヤ202及び1つ又はそれ以上のエンハンスメントレイヤ204として符号化される。品質の低いベースレイヤ202は最低限の品質標準を表し、エンハンスメントレイヤ204の各々はベースレイヤ202のピクチャーの品質に対する改善である。1つの実施形態において、映像系列206は、図1で説明されるようなFGS映像符号化フォーマットを用いて符号化される。利用可能な送信帯域が事前にわかっていない場合、FGS映像符号化フォーマットは、映像のストリーミングや放送へのアプリケーションのために特に有益である。符号化の最中又はその後に、エンハンスメントレイヤ204は、利用可能な送信ビットレートに適合するよう任意に切って短くされることができる。利用可能なビットレートが変わるにつれて、エンハンスメントレイヤ204は、それに応じてリアルタイムで切って短くされ、現在の帯域幅に関して、最適品質の符号化された映像系列を提供することができる。例えば、ネットワーク200は、エンハンスメントレイヤ204を切って短くし、次に、異なった目的地に異なったビットレートでビットストリームを送信することができる。
図3は、情報を符号化する方法300を示す。1つの実施形態において、符号化されるべき情報は映像系列を含む。本方法300は映像符号器の中で実行されてよく、その方法300の逆は映像復号器によって実行されてよい。符号器とは、信号又はデータを符号に変えるために使用されるデバイスである。復号器は次に、当該符号から元の信号又は元の信号の近似を生成することができる。符号器と復号器は、まとめて映像CODECと呼ばれることがある。映像CODECは、ソースの画像又は映像の系列を圧縮形式に符号化し、これを復号して、ソース系列の複写又は近似を生成する。
本方法300は、はじめに(302)符号器が映像系列を受信する(304)。1つの実施形態において、映像系列は、圧縮されていない映像信号である。符号器は、近隣の映像フレームの間の類似度を活用して現在の映像信号の予測を構成する(306)ことによって、映像系列の圧縮を開始する。その予測は、1つ又はそれ以上の以前の又は以後のフレームから形成され、フレーム間の差の補償によってその予測は改善される。次に、現実の現在のフレームから予測フレームを減算することによって、残差信号が形成される(308)。符号器は、空間的冗長度を削減するために、予測残差の近隣のサンプルの間の類似度を利用する。
続いて本方法300は、残りの空間的冗長度を削減するために、残差信号にある種の変換を適用する(310)。この変換は、予測残差信号を、変換係数によってそれが表現される他のドメインに変換する。変換係数は非有意な値を除去するために量子化され(312)、残差サンプルをよりコンパクトに表現してくれる少数の有意な係数が残される。1つの実施形態において、係数はQP-6を用いて量子化される。これは量子化ステップサイズを効果的に半減する。量子化ステップサイズが小さくなる結果、より多くの量の変換係数が現在のフレームにおいて非ゼロになる。例えば、方法300を用いて符号化されている予測残差は、あるエンハンスメントレイヤの中にあるかもしれない。もし、映像フレームの前のレイヤ又は映像フレームのベースレイヤが量子化パラメータQPを用いて量子化(312)されるのであれば、現在のエンハンスメントレイヤはQP-6を用いて量子化(312)される。
1つの実施形態において、エンハンスメントレイヤにおける量子化された非ゼロの係数は、非有意係数、有意係数、又はリファインメント係数に分類することができる。「非有意」係数とは、ベース又は前のレイヤにおいてゼロであって、現在のエンハンスメントレイヤにおいてもゼロのままである係数をいう。「有意」係数とは、ベース又は前のレイヤにおいてゼロであって、現在のエンハンスメントレイヤにおいて非ゼロになる係数をいう。「リファインメント」係数とは、ベース又は前のレイヤにおいてすでに非ゼロである係数をいう。1つの実施形態において、各リファインメント係数は三値のリファインメント記号にマップされる(313)。三値のリファインメント記号とは、3つの値のうちの1つを有すものである。符号器は現在のエンハンスメントレイヤを走査して、リファインメント記号をある符号化順序でグループ分けする(314)。1つの実施形態において、符号器は、サブバンドベースの符号化順序において連続するリファインメント記号をグループ分けする(314)。リファインメント記号の各グループは、「リファインメント記号グループ」と呼ばれる。符号器は次に、リファインメント記号グループを符号化し(316)、これらの符号をビットストリームに加える。1つの実施形態において、符号器は可変長符号(VLC)テーブルの可変長符号を用いてリファインメント記号グループを符号化する(316)。他の実施形態においては、1つのリファインメント記号グループを符号化するために使用されるVLCテーブルは、リファインメント係数の統計分布の現在の推定に基づいて、VLCテーブルの集合からダイナミックに選択されることができる。
さらに他の実施形態では、符号器は、マルチプルエンハンスメントレイヤからリファインメント記号を符号化することができる。例えば、符号器は、FGS符号化フォーマットの下でマルチプルエンハンスメントレイヤを符号化することができる。1つの実施形態では、マルチプルFGSエンハンスメントレイヤからのリファインメント記号グループが、適応型VLCテーブル選択を使用して符号化される。他の実施形態では、VLCテーブルは、あるFGSレイヤについては固定されているが、他のFGSレイヤについては異なるVLCテーブルを利用することができる。
図4は、符号化された映像系列を復号するための方法400の1つの実施形態である。本件復号方法は、図3の符号化方法300と逆のものであってよい。復号方法400は、はじめに(402)復号器が符号化された映像系列(404)を受信する。符号化された映像系列はビットストリームとも呼ばれる。復号器はVLCテーブルを使用してリファインメント記号グループを復号する(406)。リファインメント記号グループがリファインメント係数の統計分布に基づいて適応型VLCテーブルを使用して符号化される場合、適正なVLCテーブルを選択するために、復号器においても同一の統計情報が使用される。マルチプルエンハンスメントレイヤから符号化されたリファインメント記号が復号器によって受信される場合、復号器は、リファインメント記号の復号に使用するVLCテーブルを該記号のそれぞれのエンハンスメントレイヤにしたがって適応的に選択することができる。
本方法400はさらに続き、復号器は、最近復号されたリファインメント記号を用いてリファインメント係数を復号する(408)。復号器は、次に進んで、復号されたリファインメント係数を逆量子化し(410)、その後、当該係数はベース又は前のレイヤの逆量子化された係数に加え戻される。方法400はさらに進んで、逆量子化された係数に逆変換を適用する。ある実施形態においては、逆変換は逆離散コサイン変換を含むことができる。復号器がリファインメント係数に逆変換を適用した後(412)、復号器は、図3の符号化方法300の前に存在していたような元の映像系列の近似を構成する(414)。
図5は、複数のマクロブロックに分割された映像フレーム500の1つの実施形態である。マクロブロックとは、復号プロセスの基本のデータ単位である。図示されているように、映像フレーム500は、マクロブロックの各々が映像フレーム500の1つのサンプルを含むように、複数の固定サイズのマクロブロックに分割される。1つの実施形態において、各マクロブロックは、16×16画素の1つのサンプルを含む。他の実施形態においては、各マクロブロックは、1つの輝度成分と2つの色差成分を含む。輝度成分は、特定のサンプルの明るさに関係し、色差成分はそのサンプルの色の性質に関係する。1つの実施形態において、映像フレーム500はさらに、複数のスライス、すなわちスライスA(502)、スライスB(504)、及びスライスC(506)に分割される。スライスとは、ある符号化順序で連続的に処理されるマクロブロックの系列である。例えば、スライスA(502)及びスライスA内に含まれるマクロブロックは、スライスB(504)及びスライスC(506)の前に符号化されて復号器に送信される。追加的な実施形態において、様々なスライス502、504及び506を符号化して復号器に送信する順序は任意でよい。例えば、スライスB(504)を他のスライスより前に符号化して復号器に送信してよい。同様に、スライスCを他の2つのスライスの前に符号化して復号器に送信してよい。N番目のエンハンスメントレイヤにおける各マクロブロックは、N-1番目のエンハンスメントレイヤ及びベースレイヤの各々におけるマクロブロックに対応する。
図6は、係数の分類のしかたの一例である。ベースレイヤ係数ブロック602及びエンハンスメントレイヤ係数ブロック604が与えられる。ベースレイヤ602及びエンハンスメントレイヤ604における空白のスペースはゼロの係数を表す。これらの係数は非有意係数と呼ばれる。残りのスペース606、608、608a、及び608bは各々、非ゼロ値を有する可能性のある係数を表す。1つの実施形態において、ベースレイヤ係数ブロック602は、FGS映像符号化フォーマットを用いる、前のエンハンスメントレイヤの中にある。前に説明したように、図3の符号化方法300の中で変換係数が量子化される。量子化の後、ベースレイヤ係数ブロック602における対応する係数がゼロであるところのエンハンスメントレイヤ係数ブロック604における非ゼロの係数は、有意係数606と呼ばれる。ベースレイヤにおける対応する係数が非ゼロであるこれらの係数は、リファインメント係数608と呼ばれる。有意係数606及びリファインメント係数608は異なる統計を有するので、FGS符号化フォーマットの後、エンハンスメントレイヤ604において別々に符号化される。
1つの実施形態において、有意係数606は、ベース又は前のレイヤにおける対応する係数606a及び606b(同じサブバンドを表す係数)がゼロである有意係数である。リファインメント係数608は、ベース又は前のレイヤにおける対応する係数608a及び608bが非ゼロのリファインメント係数である。
図7は、ブロックごとの符号化順序が用いられる現在のCAVLCリファインメント符号化スキームの欠点700を示す。ブロックごとによる順序は、本質的に、映像フレーム710の内部に空間的に均一でない品質改善を生じさせる。図7に示されるように、ビットストリーム708が切って短くされるとき、切り捨て704の前のビットストリーム708において表されるすべての映像ブロック(ブロック0,1、・・・、n−1)は、切り捨て714の最中にリファインメント係数が失われる映像ブロック706(ブロックn及びそれ以降)に比べて、より良い映像品質712を有するであろう。これらのリファインメント係数を符号化する比較的良い順序は、サブバンドベースの符号化順序を使うことである。これについては次の図面で詳述する。
図8は、サブバンドベースの符号化順序800の1つの実施形態である。1つの実施形態において、第1のブロック802、第2のブロック804、及び第3のブロック804は、同じエンハンスメントレイヤにおける3つの係数ブロックである。1つの実施形態において、ブロック802、804、及び806は、サブバンドベースのFGS符号化順序800が拡張されて第1のFGSレイヤの上で使用されるかもしれないような第1のFGSエンハンスメントレイヤにおける3つのブロックである。ブロックベースの順序に対比して、サブバンドベースの符号化順序800は、リファインメント係数をそれらが属す変換ドメインサブバンドにしたがって送信する。1つの実施形態において、ブロック802、804及び806に図示される記法Bx,yは、サブバンドyの中及びブロックxの中の係数であることを表すことができる。例えば、B0,0は、第1のサブバンド(サブバンド0)の中及び第1のブロック802の中の係数であることを表す。
1つの実施形態において、符号器は最初、ポジションB0,0、B1,0及びB2,0に在る任意のリファインメント係数を符号化する。符号器は次に、ポジションB0,1、B1,1及びB2,1等々に在る任意のリファインメント係数を符号化する。サブバンド符号化順序800は、リファインメント係数がそれらが属す変換ドメインサブバンドにしたがって符号化されて送信されるのを容易化する。サブバンド符号化順序800を使用すると、受信されるリファインメントビット数が増えるために、結果として、空間的に比較的均一な品質改善がもたらされる。
図9は、リファインメント符号化において用いられる2つのシンタックス、coeff_refinement_flag902及びcoeff_refinement_dir_flag904に関連づけられるリファインメント記号(ref_symbol)の1つの実施形態900である。前に説明したように、リファインメント係数が値ゼロを有するならば、シンタックス要素coeff_refinement_flag902は値ゼロが割り当てられる。したがって、ref_symbol906もまたゼロが割り当てられる。もしリファインメント係数が非ゼロを有するならば、coeff_refinement_flag902は値1が割り当てられる。もしリファインメント係数がベースレイヤ又は前のレイヤにおける対応するリファインメント係数と同じサインを有するのであれば、coeff_ref_dir_flag904は値ゼロが割り当てられる。もしベースレイヤ又は前のレイヤにおけるリファインメント係数のサインが、符号化されている現在のレイヤにおけるリファインメント係数のサインと反対であれば、coeff_ref_dir_flag904には値1が割り当てられる。他の実施形態においては、coeff_ref_dir_flag904の値を定義するパラメータは逆転させられる。
もしcoeff_ref_dir_flag904に値ゼロが割り当てられると、ref_symbol906には値1が割り当てられて、もしcoeff_ref_dir_flag904に値1が割り当てられると、ref_symbol906には値2が割り当てられる。ref_symbol906の値は、次に符号化されてビットストリームに含まれる。ref_symbol906の値の符号化の1つの実施形態が以下に与えられる。
図10は、図9において説明されたような参照記号の値の符号化のために使用される可変長符号化(VLC)テーブルの1つの実施形態である。サブバンド符号化順序の下で、連続するリファインメント記号は一緒にグループ分けされ、リファインメント記号グループ1002はVLCテーブル1000を用いて符号化される。テーブル1000は複数の項目(entries)を含む。各項目は、図9において説明したようなリファインメント記号グループ1002の値、特定の値のリファインメント記号グループ1002を符号化するための可変長符号の符号長1004、及び特定の値のリファインメントグループ記号1002を符号化するための可変長符号の符号語(code word)1006を有する。符号語1006は、次にビットストリームに含まれて復号器に送信される。
1つの実施形態において、テーブル1000のような単一のVLCテーブルがリファインメント符号化において使用され、符号器及び復号器は必ずしもコンスタントにリファインメント記号統計を累積及び更新する必要が無く、かくして計算量を著しく減らすことができる。他の実施形態においては、VLCテーブルがリファインメント係数の統計分布の推定に基づいてマルチプルテーブルから選択され、確率推定とテーブル選択という計算量の追加によってパフォーマンスを改善することができる。
次に、図11に関し、現在のSVC規格は、ディスクリートのベースレイヤ1102の上にマルチプルレイヤを可能ならしめる。第2のFGSレイヤ1106からスタートして上に行く1つ以上のFGSレイヤ1104及び1106があるとき、すべてのリファインメント係数は次の2つのクラスのうちの1つに属す。2つのクラスとは、1つは「古い」リファインメント係数であって、これは、前のFGSレイヤ1104においてすでにリファインメント係数を有するリファインメント係数のことである。他の1つは、「新しい」リファインメント係数であって、これは、前のFGSレイヤ1104においてはじめて有意になったものであって、現在のレイヤ1106においてまさにリファインメント段階に入ろうとしているリファインメント係数のことである。図11は、2つのFGSレイヤ1104及び1106を有する一例を与える。第1のFGSレイヤ1104は、リファインメント係数1110はもちろんのこと、有意係数1108を含む。第2のFGSレイヤ1106は、「新しい」リファインメント係数はもちろんのこと、「古い」リファインメント係数1112を有する。係数1116は、第2のFGSレイヤ1106における新しい有意係数である。残りの空白のポジションは、非ゼロの値を持たない非有意係数である。
2つのタイプのリファインメント係数1112及び1114は、異なる記号確率分布を持っている。それゆえ、1つの実施形態においては、両者を符号化するには異なるVLCテーブルを使用するほうが好ましい。さらに、現在のFGSレイヤのレベルに応じて異なるVLC符号化テーブルを使用することができる。例えば、第1のFGSレイヤ1104に含まれるリファインメント係数を符号化するために使用されるものとは異なるVLCテーブルを第2のFGSレイヤ1106に含まれるリファインメント係数の符号化のために使用することができる。そのような確率分布にもっと適応させられた符号化テーブルは、パフォーマンスの改善のために使われるべきである。そのようなVLCテーブルの適応は、大きな計算量を必要としない。というのは、それは、記号統計の収集や更新に依存するものではなく、単にリファインメント係数クラス及びFGSレイヤレベルのみに基づくからである。他の実施形態においては、VLCテーブルは、現在のFGSレイヤについてのリファインメント係数の統計分布の推定に基づいてダイナミックに選択をすることができる。
図12は、有意及びリファインメント符号化がインターリーブされるときリファインメント記号のグループ分けに起因して生じる問題に対する1つの解決の実施形態1200である。FGS符号化において、異なるブロックに対する有意符号化パス及びリファインメント符号化パスは通常一緒にインターリーブされる。このことについての1つの理由は、あるブロックは他のブロックより少ない数の有意係数を含むかもしれないからである。ある1つのブロックの有意符号化パスが終わると、次にこのブロックについてのリファインメントパスが始まる。その間に、このブロックの次のブロックは、有意符号化パスを通過することになる。1つの実施形態において、ブロックA 1202についての有意符号化(S0,0、及び次にEOB)は、2回のラウンド後に終わる。次に、R0,0(及び後にR0,1)のリファインメント符号化が始まる。しかし、同時に、ブロックB1204の有意符号化(係数S1,2及びEOB)はまだ続いている。
有意及びリファインメント符号化のインターリーブについてのもう1つの理由は、サブバンド符号化順序の使用である。図13は、有意符号化及びリファインメント符号化がインターリーブされるもう1つの実施形態1300を示すものである。1つの実施形態において、係数はサブバンドで走査される。例えば、0番目のサブバンド1306を走査するとき、ブロックA1302は有意係数S0,0を含む。このゆえ、S0,0の有意符号化が実行される。同様に、ブロックB1304の0番目のサブバンド1306が走査されるとき、リファインメント係数R1,0のリファインメント符号化が実行される。
インターリーブされた有意及びリファインメント符号化のこのふるまいは、リファインメント符号化がマルチプル(例えば、3つの)リファインメント係数のグループ分けによってなされる場合、問題を発生させる。符号器の側において、VLC符号語が送り出される前に、3つのリファインメント記号がバッファアップされる(一時記憶領域に移される)。しかし、復号器側では、リファインメント係数の復号に出くわすと必ず、復号器はビットストリームから、3つのリファインメント記号のグループを表すVLC符号語を読み取ろうとする。しかし、この符号語はまだ符号器の符号化バッファにバッファされていて、まだ送られていない。符号器と復号器の間のこの同期の損失は、そのような符号化スキーム(有意及びリファインメントパスがインターリーブされるときのリファインメント記号のグループ分け)が失敗することを意味する。この問題を解決するための2つの方法が下記に与えられる。
図14は、符号器の側には何の変更も要しない復号器ベースの解決方法1400を示す。符号器は、符号語を送出する前に、いつも3つのリファインメント記号ごとに一緒にグループ分けしようとするかもしれない。復号器の側では、リファインメント係数が要求されると、次の操作が実行される。本方法1400は、カウンタをゼロに初期化する(1404)ことによって始まる。要求されているリファインメント係数の場所が記憶され(1404)、対応するベースレイヤ係数のサインが記憶され(1406)、いくつ要求がなされたかを追跡するためのカウンタ(スライス符号化の開始時においてゼロに初期化)が1増やされ(1408)、このカウンタが3になると(1410)、読み出し操作が実行されて(1412)通常のVLC符号化が実施される。1つのグループの3つのリファインメント記号が戻され、次にその3つの記号は、以前に記憶されていたような対応する係数場所に戻されて(1414)、カウンタはゼロにリセットされる(1416)。カウンタがまだ3でなければ(1410)、本方法1400は、ステップ1402に戻って、さらに続く。
復号器サイドの解決方法が復号器により多くの負荷をかけるのに対し、符号器サイドの解決方法は復号器に与える計算量の影響が最小である。基本的なコンセプトは、符号器はつねに事前にマルチプル(例えば、3つの)リファインメント係数を送信し、復号器は、リファインメント係数が要求されるとき、十分なリファインメント記号をバッファ内に存在させることが保証されているということである。図15は、符号器ベースの解決方法の1つのタイプの方法1500を示すものである。符号器はスライスの中のある一定の数のブロックを予備走査し(1502)、実際の符号化段階においてすべてのリファインメント係数が送信される順序を決定する(1504)。このようにして、リファインメント係数は該符号化順序で待ち行列に記憶される(1506)。符号化の段階で、リファインメント係数が送信される必要があるとき、それはすでに前の係数と一緒にグループ分けされて送信済みであるかどうかが決定される(1508)。もしそうであれば、何のアクションもとられない(1510)。そうでない場合は、このリファインメント係数は、待ち行列の中のその係数の直後の2つの係数と一緒に送信される(1512)。本方法1500は、符号化パスが終わるまで続く。
以上の符号器ベース及び復号器ベースの双方の解決方法は、SVCの勧告草案において現在サポートされている2つの符号化順序を含み、かつそれらに限られることなく、異なるブロックからの有意パス及びリファインメントパスの任意の形式のインターリーブに適合することに注意せよ。これらの2つの解決方法は、任意の数のリファインメント記号のグループ分けに適用可能であって、3つの記号のグループ分けに限定されるものではない。
復号器ベース及び符号器ベースの双方の解決方法は、SVC共同勧告草案5(JD5)において定義されているようなブロックベースのリファインメント符号化にも適用可能であって、したがって、バッファ内に記憶されている残りのリファインメントビットを各ブロックの最後にフラッシュアウトする作業を不要にする、ということにも注意しておくべきである。復号器ベースの解決方法については、符号器におけるさらなる変更が符号器及び復号器の同期を保証することができる。JD5のブロックベースのリファインメント符号化のスキームはVLCテーブルに適応しているので、グループ分けされたリファインメント記号の数は、1、3、及び4の間で変化することができる。ブロックの最後において、符号器はVLCテーブルの適応を十分な数のリファインメント係数に出くわすまで中止するべきである(これはしばらくして符号器が後続のブロックのリファインメント符号化を実行するときに起きるであろう)。十分な数のリファイメント係数に出くわしてVLC符号語の書き込み操作が行われるとき、符号器は通常のVLCテーブルの適応を始めることができる。このスキームの下で、現在のリファインメント符号化において用いられるような頻繁なフラッシュオペレーション(ブロックごとに行われる)を最小化することができ、符号化パフォーマンスは非常に改善され得る。
ある数のリファインメント係数の符号化の最後に、もし残りのリファインメント係数の数が非ゼロで、かつ典型的な符号化プロセスにおいて用いられるグループサイズより小さい場合、フラッシュオペレーションが使用される可能性がある。フラッシュオペレーションをする1つの方法は、完全なグループを作るために最も出現頻度の高い記号(MPS)を加えて、最後のグループを他のグループとして符号化することである。例えば、典型的なグループサイズは3と仮定されていて、フラッシュオペレーションにおいて符号化されるべき残りの係数は1つで、その記号は2であると仮定せよ。三値の記号のセットの中で記号「0」が最も出現頻度の高い記号(MPS)であると仮定すると、グループ(2,0,0)が符号化される。復号器側では、パッドを入れられた記号は捨てられる。フラッシュオペレーションはまた、実行計算量を減らすために、もっと頻繁に行われる可能性がある。一緒に符号化される1つのグループのリファインメント係数は、異なる場所からのものである。同一のグループ内の係数の間の距離を限定することは、結果として、フラッシュオペレーションによって取り扱われる必要のある、いくつかのグループ分けされていない記号をもたらすことになる。他の実施形態では、復号器によって捨てられることになるMPS(最も出現頻度の高い記号)を加えることによって完全なグループを形成するかわりに、比較的小さなグループを符号化するために設計されたVLCテーブルが使われる。これはフラッシュされるべきリファインメント係数の数が復号器によって正確にわかっている場合に使うことができる。グループサイズは3で、ただ1つの係数「R」のみがフラッシュされるべきであると仮定せよ。3つの記号のグループの符号化のためにVLCテーブルを使ってグループ(R,0,0)を符号化するかわりに、ある特殊なVLCテーブルを使うほうがより効率的である。例えば、値「0」のリファインメント記号は「1」として符号化され、値「1」のリファインメント記号は「01」として符号化され、そして、値「2」のリファインメント記号は「00」として符号化される。同様にして、グループサイズが2で、フラッシュされるべき係数として2つの係数「R1」及び「R2」がある場合、グループ(R1、R2、0)を符号化するかわりに、比較的小さいグループ(R1、R2)の符号化のために、異なるVLCテーブルが用いられる。1つの実施形態において、R13+R2として計算されるグループのインデックスを符号化するために、指数ゴロム符号(Exponential-Golomb code)が使用される。符号化されたグループのインデックスはR1+R23として等しく形成されることができるということに注意すべきである。
図16は、デジタル画像及び/又はデジタル映像を処理するように構成されるデバイス1600である。デバイス1600は、デジタルテレビ、デジタル直接放送システム、無線通信デバイス、PDA(Personal Digital Apparatus)、ラップトップコンピュータ、デジタルカメラ、デジタル記録デバイス、ネットワーク可能型デジタルテレビ、セルラー電話又は衛星無線電話、又は映像電話能力のある任意の遠隔通信デバイスを表す、又はこれらの中で実施されることができる。
デバイス1600は、画像及び/又は映像のデータを処理し、符号化し、復号し、送信し及び/又は受信することができる。映像データは、映像取り込み装置(又は画像センサ)1612のようなビデオカメラによって取り込まれ、ビデオアーカイブから検索され、又は他のやり方で入手されることができる。デバイス1600の映像符号化部1610は、MPEG-4、ITU-TH.263、ITU-TH.264のような映像符号化規格、又はその他の任意の映像符号化規格を使うことができる。映像符号化部1610は、動き予測及び動き補償のようなインターフレーム符号化技術及び、空間予測及びイントラ予測符号化技術のようなイントラフレーム符号化技術をサポートする。
デバイス1600は、画像又は映像の系列を取り込み、取り込まれた画像又は映像の系列をメモリ1614に記憶するための、カメラ又はビデオカメラのような、画像/映像取り込みデバイス1612を含んでよい。画像/映像処理部1602は、画像及び/又は映像の系列を処理する。メモリ1604は、そのような処理の前又は後に画像及び/又は映像の系列を記憶する。
トランシーバ1614は、符号化された映像系列を受信し及び/又は他のデバイスに送信する。トランシーバ1614は、符号分割多重アクセス(CDMA)のような無線通信規格を使用してもよい。CDMA規格の例は、CDAM1xEV-DO、WCDMA等を含む。
デバイス1600の1つ又はそれ以上の要素は、通信バス1618を介して通信結合されてよい。図16に示される要素に加えて又は替えて、その他の要素がデバイス1600に含まれてよい。図16に示されるアーキテクチュアは単なる一例である。本明細書において説明される技術は他の様々なアーキテクチュアを用いて実装することができる。
メモリ1614は、相対的に大きなメモリ空間を有してよい。メモリ1614は、例えば、ダイナミックランダムアクセスメモリ(DRAM)、又はフラッシュメモリで構成することができる。メモリ1614は、NORゲート又はNANDゲートによるメモリ技術又はその他の任意のデータ記憶技術を用いて構成することができる。他の実施形態において、メモリ1614は、不揮発性メモリ又はその他のデータ記憶部により構成することができる。
画像/映像処理部1602は、移動型無線電話のためのチップセットにより構成することができる。これは、ハードウェア、ソフトウェア、ファームウェア、及び/又は1つ又はそれ以上のマイクロプロセッサ、デジタル信号プロセッサ(DSPs)、用途特定型集積回路(ASICs)、フィールドプログラマブルゲートアレイ(FPGAs)又はこれらの任意の組み合わせを含むことができる。処理部1602は、フロントエンドの画像/映像処理部1608及び画像/映像符号化部1610に結合されるローカルメモリ1604を含むことができる。符号化部1610は、デジタル映像データを符号化(又は圧縮)し及び復号(又は伸張)するための符号器/復号器(CODEC)により構成することができる。
ローカルメモリ1604は、メモリ1614に比べて小規模で高速のメモリ空間により構成することができる。例えば、ローカルメモリ1604は、同期型DRAM(SDRAM)により構成することができる。ローカルメモリ1604はまた、プロセッサ集約型の符号化プロセスの際にデータへの高速アクセスを実現するために、処理部1602の他の構成要素とともに集積化された「オンチップ」のメモリで構成することができる。しかしながら、メモリ1614及び1604は、結合して単一のメモリとすることもできるし、数多くのその他の構成において実装することもできる。メモリコントローラ1606は、ローカルメモリ1604に対するメモリフェッチ及びライトバック(write-back)を制御することができる。
フロントエンドの画像/映像処理部1608は、画像品質を改善し、もって映像系列の品質を改善することを目的として、映像系列のフレームの上で1つ又はそれ以上の画像処理技術を実行することができる。例えば、フロントエンドの画像/映像処理部1608は、デモザイキング、レンズロールオフ補正、スケーリング、色彩補正、色彩変換、及び空間フィルタリングなどの技術を実行することができる。フロントエンドの画像/映像処理部1608はまた、その他の技術も実行することができる。一般に画像/映像処理部1608によって実行される技術は、「フロントンエンド」の画像処理技術と呼ばれる。それは、その技術が画像/映像符号化部1610による符号化に先行するからである。
画像/映像取り込み部1612は、センサの表面にアレンジされた色彩フィルターアレイ(CFAs)を含む画像センサから構成することができる。画像/映像処理部1608によって実行されたフロントエンドの画像処理は、取り込み部1612によって取り込まれた映像系列の品質を改善することができる。例えば、フロントエンドの処理部1608及び/又は符号化部1610は、取り込み部1612によって取り込まれた画像を処理するようにプログラムされたデジタル信号プロセッサ(DSP)から構成することができる。メモリ1604(又はメモリ1614)の同じ領域をフロントエンドの画像処理目的及び他の記憶目的の双方のために使用することができる。
画像/映像符号化部1610は、画像及び/又は映像の符号化を実行するインターフレーム圧縮及び/又はイントラフレーム圧縮のような1つ又はそれ以上の映像圧縮技法を含むことができる。例えば、符号化部1610は、インターフレーム圧縮を実現することを目的として、時間的又はインターフレームデータ相関を活用するために、動き予測及び動き補償を実行することができる。代替的又は追加的に、符号化部1610は、イントラフレーム圧縮を実現することを目的として、空間的又はイントラフレームのデータ相関を活用するため、空間予測及びイントラ予測技術を実行することができる。動き補償(又はイントラ予測)の出力は、残差(residual)と呼ばれる。これは、符号化されるべき現在の映像ブロックと、動き予測又は空間予測によって特定される予測ブロックとの間の差を表すデータのブロックから構成することができる。
符号化部1610が残差を生成するために動き補償(又はイントラ予測)を実行した後、残差をさらに符号化し、データをさらに圧縮するための一連の追加的ステップが実行されてよい。一連の追加的ステップは、使用されている符号化規格に依存するかもしれないが、一般に「残差の符号化」と呼ばれる。符号化部1610は、トランシーバ1616を介して1つの映像系列を他のデバイスに通信するために必要とされるデータの量を減らすために、これらの映像圧縮技法の1つ又はそれ以上を実行してもよい。
情報及び信号は、様々の異なる技術及び技法のいずれかを使用して表すことができる。例えば、上記の説明を通じて参照されるデータ、命令、指令、情報、信号、ビット、記号、及びチップは、電圧、電流、電磁波、磁気的場又は粒子、光学的場又は粒子、又はこれらの任意の組み合わせによって表すことができる。
本明細書において開示される実施形態に関して記述される様々な例示的な論理ブロック、モジュール、回路及びアルゴリズムのステップは、電子的ハードウェア、コンピュータソフトウェア又は両者の組み合わせとして実装することができる。このハードウェアとソフトウェアの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路及びステップが上記において一般にその機能の観点から説明された。そのような機能性がハードウェア又はソフトウェアとして実施されるかは、特定の用途及びシステム全体に課せられる設計上の制約に依存する。当業者であれば、説明された機能性を特定の適用について異なる手段で実装することができる。しかし、そのような実装の決定が本件開示の範囲からの逸脱を生じるものとして解してはならない。
本明細書において開示される実施形態に関して説明される様々な例示的な論理ブロック、モジュール、回路及びアルゴリズムのステップは、汎用目的プロセッサ、デジタル信号プロセッサ(DSP)、用途特定型集積回路(ASIC)、フィールドプログラマブルゲートアレイ信号(FPGA)又は他のプログラマブル論理デバイス、ディスクリートゲート又はトランジスタ論理回路、ディスクリートハードウェア素子、又は本明細書において説明される機能を達成するように設計されたこれらのものの任意の組み合わせを用いて実装されてよい。汎用目的のプロセッサはマイクロプロセッサであってもよいが、代替として、該プロセッサは、在来型のプロセッサ、コントローラ、マイクロコントローラ、又は状態機械(ステートマシン)であってもよい。プロセッサは、コンピューティングデバイスの組み合わせ、例えば、DSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアとともに1つ又はそれ以上のマイクロプロセッサ、又は任意の他の同様の構成として、実装することもできる。
本明細書において開示される実施形態に関して説明される方法又はアルゴリズムのステップは、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、又は両者の組み合わせにおいて直接的に実施することができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD-ROM、又は当業界において知られている他の任意の形式の記憶媒体に入れておくことができる。代替として、該記憶媒体はプロセッサと一体的であってもよい。プロセッサ及び記録媒体は、1つのASICに入れておくことができる。ASICはユーザー端末に入れておくことができる。代替として、プロセッサ及び記憶媒体をディスクリート素子としてユーザー端末に入れておくこともできる。
本明細書において開示される方法は、説明されている方法を実現するための1つ又はそれ以上のステップ又はアクションからなる。方法のステップ及び/又はアクションは、本件開示の範囲から逸脱することなく、互いに入れ替え可能である。いいかえれば、ステップ又はアクションの特定の順序が実施形態の適切な操作にとって必要とされるのでなければ、特定のステップ及び/又はアクションの順序及び/又は使用は、本件開示の範囲を逸脱することなく修正可能である。
以上において本件開示の特定の実施形態及び応用が例示され説明されてきたが、本件開示は本明細書において開示された厳密な配置及び要素に限られるものではないということが理解されるべきである。本明細書において開示された本件開示の方法及びシステムの配列、操作、及び詳細において、本件開示の範囲を逸脱することなく、当業者にとって明白である様々な修正、変化、及び変形がなされてもよい。
スケーラブルな映像符号化ビットストリーム構造の実施形態を示す図。 ネットワーク上で符号器から復号器へ送信されるベースレイヤ及び複数のエンハンスメントレイヤの実施形態を示す図。 情報の符号化方法を示す図。 符号化された映像系列を復号するための方法の1つの実施形態を示す図。 複数のマクロブロックに分割されたピクチャーフレームの実施形態を示す図。 有意係数及びリファインメント係数を分類するための実施形態を示す図。 可変長符号化のリファインメント符号化スキームの欠点を示す図。 サブバンドベースの符号化順序の実施形態を示す図。 リファインメント符号化において用いられるシンタックスに関連するリファインメント記号の実施形態を示す図。 可変長符号化(VLC)テーブルを示す図。 マルチプルFGS(Fine Granularity Scalability)レイヤの実施形態を示す図。 有意及びリファインメント符号化がインターリーブされるときリファインメント係数のグループ分けによって生じる問題に対する解決方法の実施形態を示す図。 有意符号化及びリファインメント符号化がインターリーブされてサブバンドFGS符号化順序が用いられる他の実施形態を示す図。 復号器ベースの解決の方法の実施形態を示す図。 符号器ベースの解決の方法の実施形態を示す図。 デジタル画像及び/又はデジタル映像を処理するために典型的に利用される主なハードウェアの構成要素を示すブロック図を示す図。

Claims (30)

  1. 圧縮された映像系列のSNR(信号対雑音比)スケーラブルなエンハンスメントレイヤにおけるリファインメント係数を符号化する方法であって、
    映像系列を受信すること、
    前記映像系列から現在のフレームにおける元の映像信号の予測を構成すること、
    前記現在のフレームにおける前記元の映像信号から、前記元の映像信号の前記予測を減算することによって残差信号を生成すること、
    前記残差信号に対して変換を適用すること、
    複数の変換係数を量子化すること、
    リファインメント係数を三値のリファインメント記号にマップすること、
    リファインメント記号をある符号化順序でグループ分けすること、及び
    可変長符号を使用して前記リファインメント記号グループを符号化すること
    を備える方法。
  2. 異なるエンハンスメントレイヤについて適応的に選択される可変長符号化テーブルを使用することをさらに備える、請求項1に記載の方法。
  3. 前記リファインメント記号の確率推定に基づいて適応的に選択される可変長符号化テーブルを使用することをさらに備える、請求項1に記載の方法。
  4. 特定の可変長符号化テーブルの前記選択はエンハンスメントレイヤのレベルに基づいて行われる、請求項2に記載の方法。
  5. 前記特定の可変長符号化テーブルの前記選択は係数が初めてリファインされているか又はその係数が前のレイヤでリファインされたことがあるかに基づいて行われる、請求項4に記載の方法。
  6. 前記方法は有意係数及びリファインメント係数をインターリーブする、請求項1に記載の方法であって、
    複数のブロックを含むスライスを特定すること、
    前記リファインメント係数の前記グループ分けの前に前記複数のブロックを走査すること、
    リファインメント係数が符号化される順序を決定すること、及び
    決定された前記順序にしたがってリファインメント係数を待ち行列に記憶すること
    をさらに備える方法。
  7. 複数のブロックを含むスライスを特定することをさらに備える、請求項1に記載の方法。
  8. 前記リファインメント係数の前記グループ分けの前に前記複数のブロックを走査することをさらに備える、請求項1に記載の方法。
  9. 前記リファインメント係数が符号化される順序を決定することをさらに備える、請求項1に記載の方法。
  10. 決定された前記順序にしたがって前記リファインメント係数を待ち行列に記憶することをさらに備える、請求項1に記載の方法。
  11. 固定された数のあらゆる連続的リファインメント係数が前記可変長符号化テーブルを使用して一緒に符号化される、請求項1に記載の方法。
  12. スライスのリファインメント係数を一緒にグループ分けすることをさらに備える、請求項1に記載の方法。
  13. フラッシュオペレーションを行うことをさらに備える、請求項1に記載の方法。
  14. 前記フラッシュオペレーションは完全なグループを作るために1つ又はそれ以上の最も出現頻度の高い記号を1つ又はそれ以上のリファインメント記号に加えることを含む、請求項13に記載の方法。
  15. 前記フラッシュオペレーションは該フラッシュオペレーションにおいて処理されるべきリファインメント係数の数に基づいて選択される可変長符号化テーブルを使用することを含む、請求項13に記載の方法。
  16. 前記可変長符号化テーブルは27項目の可変長符号化テーブルを備え、グループ長は3である、請求項1に記載の方法。
  17. 前記エンハンスメントレイヤの上でサブバンドベースの符号化順序を使用することをさらに備える、請求項1に記載に方法、
  18. 圧縮された映像系列のSNR(信号対雑音比)スケーラブルなエンハンスメントレイヤにおけるリファインメント係数を符号化するように形成される電子デバイスであって、該デバイスは、
    プロセッサ、
    前記プロセッサと電子的に通信するメモリ、
    前記メモリに記憶される命令
    を備え、前記命令は、
    映像系列を受信し、
    前記映像系列から、現在のフレームにおける元の映像信号の予測を構成し、
    前記現在のフレームにおける前記元の映像信号から、前記元の映像信号の前記予測を減算することによって残差信号を生成し、
    前記残差信号に変換を適用し、
    複数の変換係数を量子化し、
    リファインメント係数を三値のリファインメント記号にマップし、
    リファインメント記号をある符号化順序でグループ分けし、及び
    可変長符号を使用して前記リファインメント記号グループを符号化する
    ことを実行可能とする電子デバイス。
  19. 前記命令は異なるエンハンスメントレイヤについて適応的に選択される可変長符号化テーブルを使用することをさらに実行可能とする、請求項18に記載の電子デバイス。
  20. 前記電子デバイスは有意係数及びリファインメント係数をインターリーブするように形成される、請求項18に記載の電子デバイスであって、かつ、前記命令は、
    複数のブロックを含むスライスを特定し、
    前記リファインメント係数の前記グループ分けの前に前記複数のブロックを走査し、
    前記リファインメント係数が符号化される順序を決定し、及び
    決定された前記順序にしたがってリファインメント係数を待ち行列に記憶する
    ことをさらに実行可能とする電子デバイス。
  21. 圧縮された映像系列のSNR(信号対雑音比)スケーラブルなエンハンスメントレイヤにおけるリファインメント係数を符号化するための実行可能な命令を備えるコンピュータ可読記録媒体であって、前記命令は、
    映像系列を受信すること、
    前記映像系列から、現在のフレームにおける元の映像信号の予測を構成すること、
    前記現在のフレームにおける前記元の映像信号から、前記元の映像信号の前記予測を減算することによって残差信号を生成すること、
    前記残差信号に変換を適用すること、
    複数の変換係数を量子化すること、
    リファインメント係数を三値のリファインメント記号にマップすること、
    リファインメント記号をある符号化順序でグループ分けすること、及び
    可変長符号を使用して前記リファインメント記号のグループを符号化すること
    を備えるコンピュータ可読記録媒体。
  22. 符号化された映像系列におけるリファインメント係数を復号する方法であって、
    符号化された映像系列を受信すること、
    可変長符号化テーブルを使用してリファインメント記号を復号すること、
    前記リファインメント記号を使用してリファインメント係数を復号すること、ここにおいて該リファインメント係数はある符号化順序でグループ分けされたものである、
    複数の変換係数を逆量子化すること、
    リファインメント信号に逆変換を適用すること、及び
    映像系列を構成すること
    を備える方法。
  23. 異なるエンハンスメントレイヤについて適応的に選択される異なる可変長符号化テーブルを使用することをさらに備える、請求項22に記載の方法。
  24. 前記符号化された映像ストリームはインターリーブされた有意記号及びリファインメント記号を含む、請求項22に記載の方法であって、
    要求されている前記リファインメント係数の場所を記憶すること、
    前記対応するベースレイヤ係数のサインを記憶すること、及び
    なされた要求の数に関係するカウンタを1進めること
    をさらに備える方法。
  25. 前記カウンタが所定の値に達するかどうかを決定すること、
    リファインメント記号のグループを得るために読み出し操作を実行して通常の可変長符号化テーブル復号を行うこと、
    をさらに備える、請求項24に記載の方法。
  26. リファインメント記号の前記グループを以前に記憶されていたような前記対応する場所に記憶することをさらに備える、請求項25に記載の方法。
  27. フラッシュオペレーションを行うことをさらに備える、請求項22に記載の方法。
  28. 前記フラッシュオペレーションはパッドされた記号を捨てることを含む、請求項27に記載の方法。
  29. 前記フラッシュオペレーションは該フラッシュオペレーションにおいて処理されるべきリファインメント係数の数に基づいて選択される可変長符号化テーブルを使用することを含む、請求項27に記載の方法。
  30. 圧縮された映像系列のSNR(信号対雑音比)スケーラブルなエンハンスメントレイヤにおけるリファインメント係数を符号化するように形成される電子デバイスであって、
    映像系列を受信する手段、
    前記映像系列から、現在のフレームにおける元の映像信号の予測を構成する手段、
    前記現在のフレームにおける前記元の映像信号から、前記元の映像信号の前記予測を減算することによって残差信号を生成する手段、
    前記残差信号に変換を適用する手段、
    複数の変換係数を量子化する手段、
    リファインメント係数を三値のリファインメント記号にマップする手段、
    リファインメント記号をある符号化順序でグループ分けする手段、及び
    可変長符号を使用して前記リファインメント記号グループを符号化する手段
    を備える電子デバイス。
JP2009503196A 2006-03-27 2007-03-26 映像圧縮におけるリファインメント係数符号化のための方法及び装置 Expired - Fee Related JP5248475B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US78680006P 2006-03-27 2006-03-27
US60/786,800 2006-03-27
US83019906P 2006-07-11 2006-07-11
US60/830,199 2006-07-11
US11/502,883 2006-08-10
US11/502,883 US8401082B2 (en) 2006-03-27 2006-08-10 Methods and systems for refinement coefficient coding in video compression
PCT/US2007/064912 WO2007112341A2 (en) 2006-03-27 2007-03-26 Methods and systems for refinement coefficient coding in video compression

Publications (2)

Publication Number Publication Date
JP2009531990A true JP2009531990A (ja) 2009-09-03
JP5248475B2 JP5248475B2 (ja) 2013-07-31

Family

ID=38533378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009503196A Expired - Fee Related JP5248475B2 (ja) 2006-03-27 2007-03-26 映像圧縮におけるリファインメント係数符号化のための方法及び装置

Country Status (9)

Country Link
US (1) US8401082B2 (ja)
EP (1) EP1999970A2 (ja)
JP (1) JP5248475B2 (ja)
KR (1) KR100987958B1 (ja)
CN (1) CN101411197B (ja)
BR (1) BRPI0709279A2 (ja)
CA (1) CA2643705C (ja)
TW (1) TWI393446B (ja)
WO (1) WO2007112341A2 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070077059A (ko) * 2006-01-19 2007-07-25 삼성전자주식회사 엔트로피 부호화/복호화 방법 및 장치
WO2008007929A1 (en) * 2006-07-14 2008-01-17 Samsung Electronics Co., Ltd Method and apparatus for encoding and decoding video signal of fgs layer by reordering transform coefficients
KR100809301B1 (ko) * 2006-07-20 2008-03-04 삼성전자주식회사 엔트로피 부호화/복호화 방법 및 장치
US9418450B2 (en) 2006-08-31 2016-08-16 Ati Technologies Ulc Texture compression techniques
US8250618B2 (en) * 2006-09-18 2012-08-21 Elemental Technologies, Inc. Real-time network adaptive digital video encoding/decoding
US7991236B2 (en) * 2006-10-16 2011-08-02 Nokia Corporation Discardable lower layer adaptations in scalable video coding
US8467449B2 (en) * 2007-01-08 2013-06-18 Qualcomm Incorporated CAVLC enhancements for SVC CGS enhancement layer coding
BRPI0720806B1 (pt) * 2007-01-18 2023-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Corrente de dados de vídeo de qualidade escalonável
US8594176B2 (en) * 2007-03-06 2013-11-26 Microsoft Corporation Streaming media codec with transform coefficient bounding
US8767834B2 (en) * 2007-03-09 2014-07-01 Sharp Laboratories Of America, Inc. Methods and systems for scalable-to-non-scalable bit-stream rewriting
WO2008136792A1 (en) * 2007-05-03 2008-11-13 Thomson Licensing Method and apparatus for improving throughput and error performance of rateless coding systems
US8184715B1 (en) 2007-08-09 2012-05-22 Elemental Technologies, Inc. Method for efficiently executing video encoding operations on stream processor architectures
US8121197B2 (en) * 2007-11-13 2012-02-21 Elemental Technologies, Inc. Video encoding and decoding using parallel processors
AU2007237313A1 (en) * 2007-12-03 2009-06-18 Canon Kabushiki Kaisha Improvement for error correction in distributed vdeo coding
US8891615B2 (en) * 2008-01-08 2014-11-18 Qualcomm Incorporated Quantization based on rate-distortion modeling for CABAC coders
US9008171B2 (en) * 2008-01-08 2015-04-14 Qualcomm Incorporated Two pass quantization for CABAC coders
CN102648583B (zh) * 2009-10-05 2015-05-20 法国电信 用于编码和解码图像的方法、对应的编码和解码装置
US20110194613A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
KR101638300B1 (ko) 2010-07-28 2016-07-08 노키아 코포레이션 복잡도 균형 엔트로피 코딩을 제공하는 방법 및 장치
US20120163471A1 (en) * 2010-12-23 2012-06-28 Qualcomm Incorporated Variable length coding of video block coefficients
US9490839B2 (en) 2011-01-03 2016-11-08 Qualcomm Incorporated Variable length coding of video block coefficients
FR2972588A1 (fr) * 2011-03-07 2012-09-14 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
FR2977111A1 (fr) 2011-06-24 2012-12-28 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US9516316B2 (en) 2011-06-29 2016-12-06 Qualcomm Incorporated VLC coefficient coding for large chroma block
US9445093B2 (en) * 2011-06-29 2016-09-13 Qualcomm Incorporated Multiple zone scanning order for video coding
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
IL299633B1 (en) * 2011-07-15 2024-03-01 Ge Video Compression Llc Array coding example for low delay
US10003803B1 (en) 2012-04-18 2018-06-19 Matrox Graphics Inc. Motion-based adaptive quantization
US10003802B1 (en) 2012-04-18 2018-06-19 Matrox Graphics Inc. Motion-based adaptive quantization
US9300984B1 (en) * 2012-04-18 2016-03-29 Matrox Graphics Inc. Independent processing of data streams in codec
WO2014053456A1 (en) * 2012-10-01 2014-04-10 Rwth Aachen Binary residual refinement coding for scalable video coding
US10142636B2 (en) 2014-06-09 2018-11-27 Sony Corporation Communication system with coding mechanism and method of operation thereof
US10356410B2 (en) 2014-10-28 2019-07-16 Sony Corporation Image processing system with joint encoding and method of operation thereof
US9357232B2 (en) 2014-10-28 2016-05-31 Sony Corporation Image processing system with binary decomposition and method of operation thereof
US10063889B2 (en) 2014-10-28 2018-08-28 Sony Corporation Image processing system with conditional coding and method of operation thereof
US9674554B2 (en) 2014-10-28 2017-06-06 Sony Corporation Image processing system with coding mode and method of operation thereof
US9294782B1 (en) 2014-10-28 2016-03-22 Sony Corporation Image processing system with artifact reduction mechanism and method of operation thereof
US9357237B2 (en) 2014-10-28 2016-05-31 Sony Corporation Image processing system with bitstream reduction and method of operation thereof
US10778990B2 (en) 2018-11-19 2020-09-15 Sony Corporation Embedded codec circuitry for randomized refinement of uncoded-bits
CN113727104B (zh) * 2020-05-22 2024-01-16 北京小米移动软件有限公司 编码方法及装置、解码方法及装置、以及存储介质
CN115376309B (zh) * 2022-06-29 2024-04-26 华南理工大学 一种基于多视角时间矩阵分解的缺失交通数据修复方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07504306A (ja) * 1992-02-26 1995-05-11 ゼネラル・エレクトリック・カンパニイ 重要度量子化装置を備えたデータ圧縮システム
JP2000201353A (ja) * 1999-01-08 2000-07-18 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法およびその装置およびそのプログラムを記憶した記憶媒体
JP2004186902A (ja) * 2002-12-02 2004-07-02 Sony Corp 画像符号化装置及び方法、並びにプログラム及び記録媒体
JP2009506710A (ja) * 2005-09-26 2009-02-12 サムスン エレクトロニクス カンパニー リミテッド エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置
JP2009523395A (ja) * 2006-01-11 2009-06-18 クゥアルコム・インコーポレイテッド 精細粒度空間スケーラビリティによるビデオ符号化

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4399467A (en) * 1981-10-13 1983-08-16 Ncr Canada Ltd. Method and apparatus for image data compression and decompression
JP3263807B2 (ja) 1996-09-09 2002-03-11 ソニー株式会社 画像符号化装置および画像符号化方法
AU1062999A (en) 1997-09-29 1999-04-23 Rockwell Semiconductor Systems, Inc. System and method for compressing images using multi-threshold wavelet coding
EP1135926B1 (en) 1998-12-04 2007-05-02 General Instrument Corporation Improvement of fine granularity scalability using bit plane coding of transform coefficients
US6980597B1 (en) * 1998-12-04 2005-12-27 General Instrument Corporation Fine granularity scalability using bit plane coding of transform coefficients
US20020118742A1 (en) * 2001-02-26 2002-08-29 Philips Electronics North America Corporation. Prediction structures for enhancement layer in fine granular scalability video coding
US6792044B2 (en) * 2001-05-16 2004-09-14 Koninklijke Philips Electronics N.V. Method of and system for activity-based frequency weighting for FGS enhancement layers
US20050213831A1 (en) * 2002-03-05 2005-09-29 Van Der Schaar Mihaela Method and system for encoding fractional bitplanes
KR101010722B1 (ko) 2002-04-02 2011-01-24 노키아 코포레이션 영상의 코딩 변환 계수/비디오 인코더 및/또는 디코더
US20040001547A1 (en) * 2002-06-26 2004-01-01 Debargha Mukherjee Scalable robust video compression
US20040005003A1 (en) * 2002-07-02 2004-01-08 Koninklijke Philips Electronics N.V. Quality improvement for FGS BL coding with U/V coarse quantization
CN1685731A (zh) * 2002-09-27 2005-10-19 皇家飞利浦电子股份有限公司 可分级视频编码
CN1202673C (zh) * 2003-08-07 2005-05-18 西安电子科技大学 增强型精细粒度可伸缩视频编码结构
US7227894B2 (en) * 2004-02-24 2007-06-05 Industrial Technology Research Institute Method and apparatus for MPEG-4 FGS performance enhancement
US20060008009A1 (en) 2004-07-09 2006-01-12 Nokia Corporation Method and system for entropy coding for scalable video codec
US20060133495A1 (en) 2004-12-22 2006-06-22 Yan Ye Temporal error concealment for video communications
US20070053425A1 (en) * 2005-07-21 2007-03-08 Nokia Corporation Variable length codes for scalable video coding
EP1922881A4 (en) 2005-09-06 2012-03-21 Samsung Electronics Co Ltd METHOD AND DEVICE FOR INCREASING THE PERFORMANCE OF ENTROPY CODING AND VIDEO CODING METHOD AND DEVICE FOR APPLYING THIS METHOD
US7348903B2 (en) * 2005-09-26 2008-03-25 Samsung Electronics Co., Ltd. Method and apparatus for enhancing performance of entropy coding, and video coding method and apparatus using the entropy coding performance enhancing method
US8750387B2 (en) 2006-04-04 2014-06-10 Qualcomm Incorporated Adaptive encoder-assisted frame rate up conversion

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07504306A (ja) * 1992-02-26 1995-05-11 ゼネラル・エレクトリック・カンパニイ 重要度量子化装置を備えたデータ圧縮システム
JP2000201353A (ja) * 1999-01-08 2000-07-18 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法およびその装置およびそのプログラムを記憶した記憶媒体
JP2004186902A (ja) * 2002-12-02 2004-07-02 Sony Corp 画像符号化装置及び方法、並びにプログラム及び記録媒体
JP2009506710A (ja) * 2005-09-26 2009-02-12 サムスン エレクトロニクス カンパニー リミテッド エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置
JP2009523395A (ja) * 2006-01-11 2009-06-18 クゥアルコム・インコーポレイテッド 精細粒度空間スケーラビリティによるビデオ符号化

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JPN6013011578; 小野定康(外1名): 「わかりやすい JPEG2000の技術」 第1版, 20030515, 第125〜131頁, 株式会社オーム社 *
JPN6013011579; Masato Shima: '"Complexity reduction for adaptive VLC"' Document: JVT-R021 , 20060110, [online], Joint Video Team (JVT) of ISO/IEC MPEG & *
JPN6013011580; Yan Ye, et.al.: '"Improvements to FGS layer Variable Length Coder"' Document: JVT-S066 , 20061220, [online], Joint Video Team (JVT) of ISO/IEC MPEG & *
JPN6013011581; "wftp3.itu.int - /av-arch/jvt-site/2006_04_Geneva/" , [online] *
JPN6013011582; "wftp3.itu.int - /av-arch/jvt-site/2006_01_Bangkok/" , [online] *

Also Published As

Publication number Publication date
KR100987958B1 (ko) 2010-10-18
US20070223580A1 (en) 2007-09-27
CA2643705C (en) 2013-06-18
TWI393446B (zh) 2013-04-11
BRPI0709279A2 (pt) 2011-07-12
CA2643705A1 (en) 2007-10-04
JP5248475B2 (ja) 2013-07-31
KR20090005075A (ko) 2009-01-12
CN101411197A (zh) 2009-04-15
EP1999970A2 (en) 2008-12-10
TW200742444A (en) 2007-11-01
WO2007112341A3 (en) 2008-01-10
US8401082B2 (en) 2013-03-19
WO2007112341A2 (en) 2007-10-04
CN101411197B (zh) 2012-09-05

Similar Documents

Publication Publication Date Title
JP5248475B2 (ja) 映像圧縮におけるリファインメント係数符号化のための方法及び装置
JP5139416B2 (ja) ビデオ圧縮における重要度係数符号化のための方法およびシステム
JP5231391B2 (ja) ビデオ圧縮に関連する情報を符号化および復号化する方法およびシステム
RU2452128C2 (ru) Адаптивное кодирование информации заголовка видеоблока
JP5307017B2 (ja) リファインメント係数符号化のためのビデオブロックに基づいた可変長符号化テーブル選択
KR101003320B1 (ko) 적응형 가변 길이 코드를 사용한 비디오 압축
KR100636229B1 (ko) 신축형 부호화를 위한 적응적 엔트로피 부호화 및 복호화방법과 그 장치
JP2009531992A5 (ja)
CA2673883C (en) Cavlc enhancements for svc cgs enhancement layer coding
KR100801967B1 (ko) 문맥 기반 적응적 가변 길이 부호화 인코더 및 디코더,문맥 기반 적응성 가변 길이 부호화하는 방법과 복호화하는방법 및 이를 이용한 동영상 전송 시스템.
RU2406259C2 (ru) Способы и системы для кодирования уточняющих коэффициентов при сжатии видеоданных
KR100947870B1 (ko) H.264/avc를 위한 엔트로피 복호기 및 이를 구비한복호화기

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120521

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120620

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121009

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130208

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130410

R150 Certificate of patent or registration of utility model

Ref document number: 5248475

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees