JP4659823B2 - 予測フレームにおける重み付き予測に関する方法及び装置 - Google Patents

予測フレームにおける重み付き予測に関する方法及び装置 Download PDF

Info

Publication number
JP4659823B2
JP4659823B2 JP2007511531A JP2007511531A JP4659823B2 JP 4659823 B2 JP4659823 B2 JP 4659823B2 JP 2007511531 A JP2007511531 A JP 2007511531A JP 2007511531 A JP2007511531 A JP 2007511531A JP 4659823 B2 JP4659823 B2 JP 4659823B2
Authority
JP
Japan
Prior art keywords
frame
weight parameter
region
bit
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007511531A
Other languages
English (en)
Other versions
JP2007536816A (ja
Inventor
ウォーカー、ケント・ジー.
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2007536816A publication Critical patent/JP2007536816A/ja
Application granted granted Critical
Publication of JP4659823B2 publication Critical patent/JP4659823B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本特許出願は、本特許出願の譲受人に対して譲渡されておりさらに本明細書において参照することによって明示で本明細書に組み入れられている、"Method and Apparatus for Weighted Prediction in Predictive Frames"(予測フレームにおける重み付き予測に関する方法及び装置)という題名の仮特許出願番号 60/568,154(出願日: 2004年5月4日) に対する優先権を主張するものである。
本発明は、符号化のために様々な重み付き予測方法が使用された圧縮映像データを復号する方法および装置に関するものである。
MPEG−1、MPEG−2、MPEG−4(総称してMPEG−xと呼ばれる)、H.261、H262、H263、及びH.264(総称してH.26xと呼ばれる)等のハイブリッド符号器においては、空間スケーラビリティ、時間スケーラビリティ及び信号対雑音比(SNR)スケーラビリティが存在する。ハイブリッド符号化においては、動き補償予測(MCP)によって時間的冗長性が除去される。映像は、典型的には、一連のピクチャグループ(GOP)に分割され、各GOPは、最初にイントラ符号化フレーム(I)が存在し、順方向または逆方向予測符号化フレーム(P)及び双方向予測フレーム(B)が後続する。Pフレーム及びBフレームは両方ともインターフレームである。
Bフレームは、ビットレートの有意な低下を提供し、さらに時間スケーラビリティ能力も提供する(すなわち、任意で、IフレームとPフレームの間のフレームに関して双方向予測を導入可能であり、さらにBフレームがなくてもビットストリームを再生可能であるが、復号及び再生の際にBフレームが含まれている場合は時間的平滑さとより高速なフレーム速度が観測されることになる)。Bフレームは複数のフレームから予測され、Bフレームを予測するためのフレームの単純平均から計算することが可能である。しかしながら、Bフレームは、時間に基づく加重平均や輝度等のパラメータに基づく加重平均のような重み付き予測を用いても計算される。重み付き予測は、フレームの1つまたはフレームの一定の特性により大きな重点を置くものであり、Bフレームをより効率的に予測するために使用される。異なるコーデックは、異なる方法で重み付き予測を実装する。Real Video9は、個々の順方向予測及び逆方向予測が乗じられる14ビットの符号なし重み付け係数を提供し、さらに、2つの参照フレームに関するBフレームの相対的時間的位置に基づいて時間的重みが導き出される直接モード機能を備える。単純なスケーラブルプロフィールにおけるMPEG4は、過去及び将来のフレームの単純平均化機能を備える。Windows(登録商標)Media Video9もMPEG−4と同じように単純平均化機能を備える。H.264重み付き予測は、過去及び将来のフレームの単純平均化、過去及び将来のフレームまでの時間的距離に基づく直接モード重み付け及び過去及び将来のフレームの輝度(又はその他のパラメータ)に基づく重み付き予測を備える。
上述されるように、異なるビデオコーデックの実装は、異なる重み付けモード、例えば、直接モード、輝度重み付け、単純平均化、及び重み付け係数に関する異なるビット割当て、等を各々が有することが可能である。複数の型の重み付き双方向予測映像ビットストリームの復号を処理するための単一の復号器設計が望まれており、その結果、効率が高くさらにこれまでよりも低コストのソフトウェア、ファームウェア及びハードウェアの設計が達成させることになる。
革新的なデジタル信号処理を用いることによる重み付き双方向予測符号化映像の復号を可能にする映像復号システムが説明される。効率的で革新的な復号器設計は、複数の重み付き双方向符号化方式を単一の復号器で復号するのを可能にする。プリプロセッサは、特定の符号化方式において用いられる重み付け係数を識別し、ユニバーサル公式を用いて復号するためにユニバーサルビット構成に適合するようにこれらの重み係数を修正する。
本明細書の例はプロセスとして説明することができ、該プロセスは、流れ図、流れ線図、構造図、又はブロック図として描かれることが注記される。流れ図は、動作を連続したプロセスとして表すことができるが、これらの動作の多くは並行して又は同時並行して行うことができ、さらに該プロセスは繰り返すことができる。さらに、これらの動作の順序は、再設定することができる。プロセスは、全動作が完了された時点で終了される。プロセスは、方法、機能、手順、サブルーチン、サブプログラム、等に相当することができる。プロセスが機能に相当するときには、該プロセスの終了は、該機能の呼び出し機能又は主機能に戻ることに相当する。
重み付き双方向予測映像データを再構築する方法、装置及びシステムが説明される。単一の復号器は、重み付き双方向予測の異なる実装を用いて符号化されている重み付き双方向予測映像データを復号することができる。さらに、コストを低減させることを目的として、重み付き双方向予測映像データの異なる実装を復号するために復号器のソフトウェア、ファームウェア又はハードウェアを最大限に再利用することによって復号器の複雑さが最低限の複雑さに維持される。
MPEG−x及びH.26xと呼ばれる一対の映像符号化基準は、固定長又は可変長ソース符号化技術を用いた映像、音声及びその他の情報の圧縮と配信に非常に適したデータ処理及び操作技術(本明細書においてはハイブリッド符号化と呼ばれる)について説明している。特に、上記基準、及びその他のハイブリッド符号化基準と技術は、フレーム内符号化技術(ランレングス符号化、ハフマン符号化、等)及びフレーム間符号化技術(順方予測符号化、逆方向予測符号化、動き補償、等)を用いて映像情報等のデータを圧縮する。具体的には、映像処理システムの場合は、ハイブリッド映像符号化システムは、フレーム内及び/又はフレーム間動き補償符号化を用いて予測に基く映像フレーム圧縮符号化を行うことが特徴である。
フレーム内符号化は、その他のピクチャを参照せずにピクチャ(フィールド又はフレーム)を符号化することであるが、イントラ符号化ピクチャは、その他のピクチャに関する参照ピクチャとして使用することができる。フレーム内、イントラ符号化フレーム及びIフレームという表現はすべて、イントラ符号化によって形成される映像−オブジェクト例であり、これらの例が本出願全体を通じて使用される。
インター符号化又は予測符号化は、他のピクチャを参照してピクチャ(フィールド又はフレーム)を符号化することである。インター符号化ピクチャ又は予測ピクチャは、イントラ符号化ピクチャと比較して、より高い効率で符号化することができる。本出願全体を通じて用いられるインター符号化ピクチャ例は、予測フレーム(順方向予測又は逆方向予測であり、Pフレームとも呼ばれる)、及び双方向予測フレーム(Bフレームとも呼ばれる)である。インター符号化に関するその他の表現は、ハイパス符号化、残留符号化、動き補償内挿、及び当業者によく知られているその他の表現を含む。
図1は、ストリーミングピクチャを符号化及び復号する一般的通信システムのブロック図である。システム100は、複数の型の符号化装置105、110及び115と、復号装置155と、を含む。前記符号化装置は、イントラ符号化・予測符号化モジュール120、125及び130をそれぞれ含む。これらの符号化モジュールは、上記のイントラ符号化ピクチャ及びインター符号化ピクチャを含む様々な型の符号化を行う。前記符号化装置は、異なる型の重み付き予測モジュール135、140及び145をそれぞれ含む。各重み付き予測モジュールは、複数の方法のうちの1つを用いて重み付き双方向予測を行う。これらの重み付き予測モジュールは、重み及びその他のパラメータを表す方法が異なる。符号化装置が生成するデータは、ネットワーク150を通じて送信される。ネットワーク150は、電話、ケーブル、及び光ファイバ等の有線システム、又は無線システムの一部であることができる。無線通信システムの場合は、ネットワーク150は、例えば、符号分割多重接続(CDMA又はCDMA2000)通信システムの一部を具備することが可能であり、代替として、システム100は、周波数分割多重接続(FDMA)システム、サービス産業のためのGSM/GPRS(汎用パケット無線サービス)/EDGE(拡張データGSM環境)又はTETRA(地上トランク無線)携帯電話技術、等の時分割多重接続(TDMA)システム、広帯域符号分割多重接続(WCDMA)、高データ速度(1xEV−DO又は1xEV−DOゴールドマルチキャスト)システム、又は一般的に、複数の技術の組合せを採用するいずれかの無線通信システムであることができる。
復号装置155は、様々な符号化データを、ネットワーク150を通じて直接受信すること、又は符号器又はその他の中間デバイスによってメモリモジュール175又は外部記憶モジュール180に格納された後にこれらのメモリモジュール又は外部記憶モジュールから受け取ることが可能である。復号装置155は、イントラ復号モジュール160と、予測復号モジュール165と、プリプロセッサ170と、メモリモジュール175と、通信コンポーネント190と、を含む。通信コンポーネント190は、ネットワーク150に関連して符号化データを受信するために用いられる論理と、外部記憶装置180又はメモリモジュール175から符号化データを受信するための論理と、を含む。イントラ復号モジュール160及び予測復号モジュール165は、受信されたイントラ復号データ及びインター復号データをそれぞれ復号する。予測復号モジュール165は、重み付き予測モジュール135、140及び145によって符号化された様々な型の重み付き予測をすべて復号する論理を含む。復号装置155は、様々な型の重み付き予測を復号するための別個の符号部分を有する代わりに、プリプロセッサモジュール170を利用して重み付き予測パラメータを処理するため、単一の復号方法を用いてすべての型の重み付き予測を復号することができる。復号装置155は、復号後は、ピクチャデータをメモリモジュール175又は外部記憶モジュール180に格納すること、又はディスプレイ185上に表示することができる。ディスプレイ185は、電話機又はパーソナルデジタルアシスタント(PDA)におけるように復号装置内に組み入れることができ、又は、別個の周辺装置であることができる。以下では、符号化装置及び復号装置によって行われる符号化、復号、前処理及び重み付き予測の各プロセスがさらに詳細に説明される。
典型的MPEG復号器内においては、予測符号化画素ブロック(すなわち、1つ以上の動きベクトル及び残留誤差成分を具備するブロック)が参照フレームに関して復号される(この場合、フレーム内フレーム又は他の予測フレームが参照フレームの役割を果たすことができる)。図2Aは、従来のMPEG−4シンプルプロフィールデータストリームを示した概略図であり、GOPに関するフレーム依存性が描かれている。GPO10は、最初のIフレーム12を含み、幾つかの順方向予測Pフレーム14が後続する。
図2Bは、双方向予測フレームを含む従来の符号化データストリームを示した概略図であり、GOPに関するフレーム依存性が描かれている。GOP20は、Iフレーム22A、順方向予測Pフレーム24、及び双方向予測Bフレーム26によって構成される。各フレームBは、Iフレーム22A又は予測Pフレーム24を参照した順方向動きベクトルと逆方向動きベクトル及び残留誤差を結合させることができる(逆方向予測Pフレームも使用可能であるが、本例においては示されていない)。Iフレーム22Bは、次のGOPの開始をマーキングする。
図3、4、5及び7は、Pフレーム、Bフレーム、重み付きBフレーム及びH.264予測フレームを構築するために用いられるプロセスを含む様々なインター符号化プロセスを示した図である。図1に描かれている符号化装置105、110及び115と復号装置155は、これらのプロセスを全部又は一部を実行することができる。
Pフレーム(又はいずれかのインター符号化部分)は、現在のピクチャ内の領域と参照ピクチャ内の最良マッチング予測領域との間における時間的冗長性を利用することができる。参照フレーム内における最良マッチング予測領域の位置は、動きベクトルで符号化することができる。現在の領域と最良マッピング参照予測領域との間の差は、残留誤差(又は予測誤差)と呼ばれる。図3は、例えばMPEG−4におけるPフレーム構築プロセス例を示した図である。プロセス300は、5×5マクロブロックによって構成される現在のピクチャ305を含み、この例におけるマクロブロック数は任意である。マクロブロックは、16×16画素によって構成される。画素は、1個の8ビット輝度値(Y)及び2個の8ビット彩度値(Cr及びCb)であると定義することができる。MPEGにおいては、Y、Cr及びCbの各成分は、4:2:0フォーマットで格納することができ、Cr成分及びCb成分は、X方向及びY方向に2だけダウンサンプリングされる。従って、各マクロブロックは、256のY成分、64のCr成分及び64のCb成分を具備することになる。現在のピクチャ305のマクロブロック315は、現在のピクチャ305と異なる時点において参照ピクチャ310から予測される。参照ピクチャ310内において探索が行われ、符号化対象となっている現在のマクロブロック315にY、Cr及びCbの値の点で最も近い最良マッチングマクロブロック320が突き止められる。参照ピクチャ310内における最良マッチングマクロブロック320の位置が動きベクトル325で符号化される。参照ピクチャ310は、復号器が現在のピクチャ305の構築前に再構築していることになるIフレーム又はPフレームであることができる。最良マッチングマクロブロック320が現在のマクロブロック315から減じられ(Y、Cr及びCgの各成分に関する差が計算され)、残留誤差330が得られる。残留誤差330は、2D離散コサイン変換(DCT)335を用いて符号化され、次に量子化340される。量子化340は、例えば、より多くのビットを低周波係数に割り当てる一方でより少ないビットを高周波係数に割り当てることによって空間圧縮を提供するために行うことができる。残留誤差330の量子化された係数は、動きベクトル325及び参照ピクチャ310識別情報とともに、現在のマクロブロック315を表す符号化された情報である。該符号化された情報は、将来使用するためにメモリに格納すること、又は例えば誤差補正又は画像エンハンスメントのために使用すること、又はネットワーク345を通じて送信することが可能である。
残留誤差330の符号化された量子化係数は、符号化された動きベクトル325とともに、後続する動きの推定及び補償に関する参照フレームの一部として使用するために符号器内において現在のマクロブロック315を再構築するのに使用することができる。符号器は、このPフレーム再構築に関する復号器の手順をエミュレーションすることができる。復号器のエミュレーションは、符号器と復号器の両方が同じ参照ピクチャを用いることになる。本明細書においては、さらなるインター符号化のために符号器内において行われるか又は復号器内において行われるかにかかわらず、再構築プロセスが説明される。Pフレームの再構築は、参照フレーム(又は参照されているピクチャ又はフレームの一部)が再構築された後に開始させることができる。符号化された量子化係数は、逆量子化350され、次に、2D逆DCT、又はIDCT、355が行われ、符号化された又は再構築された残留誤差360が得られる。符号化された動きベクトル325は、既に再構築されている参照ピクチャ310内の既に再構築されている最良マッチングマクロブロック365を探索するために復号されて使用される。次に、再構築された残留誤差360が再構築された最良マッチングマクロブロック365に加えられて再構築されたマクロブロック370が形成される。再構築されたマクロブロック370は、メモリに格納すること、単独で表示するか又はピクチャ内においてその他の再構築されたマクロブロックとともに表示すること、又は画像エンハンスメントのためにさらに処理することが可能である。
Bフレーム(又は双方向予測を用いて符号化されたいずれかの部分)は、現在のピクチャ内の領域と前ピクチャ内の最良マッチング予測領域と後続ピクチャ内の最良マッチング予測領域の間における時間的冗長性を利用することができる。後続する最良マッチング予測領域と逆方向最良マッチング予測領域が結合されて結合された双方向予測領域が形成される。現在のピクチャ領域と最良マッチング結合双方向予測領域との間の差は、残留誤差(又は予測誤差)と呼ばれる。後続する参照ピクチャ内における最良マッチング予測領域の位置及び前参照ピクチャ内における最良マッチング予測領域の位置は、2つの動きベクトルで符号化することができる。図4は、例えばMPEG−4におけるBフレーム構築プロセス例を示した図である。プロセス400は、5×5マクロブロックによって構成される現在のピクチャ405を含み、この例におけるマクロブロック数は任意である。現在のピクチャ405のマクロブロック415の符号化は、現在のピクチャ405よりも前の時点においては前参照ピクチャ410を参照して、及び後続する時点においては後続する参照ピクチャ475を参照して予測される。前参照ピクチャ410内において探索が行われ、符号化対象となっている現在のマクロブロック415に最も近い最良マッチングマクロブロック420を探索する。最良マッチングマクロブロック420の位置が動きベクトル425で符号化される。前参照ピクチャ410は、復号器が現在のピクチャ405の構築前に再構築していることになるIフレーム又はPフレームであることができる。後続する参照ピクチャ475において探索が行われ、現在のマクロブロック415に最も近い最良マッチングマクロブロック480が突き止められる。最良マッチングマクロブロック480の位置が動きベクトル485で符号化される。後続する参照ピクチャ475は、復号器が現在のピクチャ405の構築前に再構築していることになるIフレーム又はPフレームであることができる。最良マッチングマクロブロック420と最良マッチングマクロブロック480が平均されて結合された双方向マクロブロックが形成され、該双方向マクロブロックが現在のマクロブロック415から減じられて残留誤差430が得られる。これらの最良マッチングマクロブロックを結合させるその他の方法が以下において説明される。残留誤差430は、例えばDCT435を用いて符号化され(その他の2D変換は、アダマール変換又はH.264において用いられるような整数変換を含む)、次に量子化440される。残留誤差430の量子化された係数は、動きベクトル425と485及び参照ピクチャ識別情報とともに、現在のマクロブロック415を表す符号化された情報である。該符号化された情報は、将来使用するためにメモリに格納すること、又は例えば誤差補正又は画像エンハンスメントのために使用すること、又はネットワーク445を通じて送信することが可能である。
Bフレームは自己の時間スケーリングプロパティを保持するために参照フレームとして使用されないため、Bフレームに関するマクロブロック再構築は符号器において行う必要がない。復号器においては、Bフレーム部の再構築は、前参照フレーム(又は参照されているピクチャ又はフレームの一部分)及び後続参照フレーム(又は参照されているピクチャ又はフレームの一部分)の両方が再構築された後に開始させることができる。符号化された量子化係数が逆量子化450され、その後に2D IDCT455が行われて復号された又は再構築された残留誤差460が得られる。符号化された動きベクトル425及び485は、既に再構築されている前参照フレーム410内の既に再構築されている最良マッチングマクロブロック465を探索するために及び後続参照フレーム475内の既に再構築されている最良マッチング順方向マクロブロック490を探索するために復号されて使用される。再構築された最良マッチングマクロブロック465と490が平均されて結合された双方向マクロブロックが形成される。次に、再構築された残留誤差460が結合された双方向マクロブロックに加えられて再構築されたマクロブロック470が形成される。再構築されたマクロブロック470は、メモリに格納すること、単独で表示するか又はピクチャ内においてその他の再構築されたマクロブロックとともに表示すること、又は画像エンハンスメントのためにさらに処理することが可能である。
Bフレーム(又は、双方向予測によって符号化されたいずれかの部分)は、結合前に参照ピクチャの1つ又は両方に重み付け係数を適用することによって時間的冗長性をさらに利用することができる。重み付け係数は、現在のピクチャの部分とのより良いマッチングを可能にし、それによって残留誤差を低減させ、同時にビットレートを低下させることができる。さらに、重み付け係数は、1つの場面が他の場面内にフェードするとき、又は黒フェード又はクロスフェードへのフェージング及び/又は黒フェード又はクロスフェードからのフェージング等の漸進的な輝度変動が存在するときに有益になる。図5は、重み付きBフレーム構築プロセス例を示した図である。プロセス500は、5×5マクロブロックによって構成される現在のピクチャ505を含み、この例におけるマクロブロック数は任意である。現在のピクチャ505のマクロブロック515の符号化は、現在のピクチャ505よりも前の時点においては前参照ピクチャ510を参照し、後続する時点においては後続参照ピクチャ575を参照して予測される。前参照ピクチャ510内において探索が行われ、符号化対象となっている現在のマクロブロック515に最も近い最良マッチングマクロブロック520が突き止められる。最良マッチングマクロブロック520の位置が動きベクトル525で符号化される。前参照ピクチャ510は、復号器が現在のピクチャ505の構築前に再構築していることになるIフレーム又はPフレームであることができる。後続参照ピクチャ575内において探索が行われ、現在のマクロブロック515に最も近い最良マッチングマクロブロック580が突き止められる。最良マッチングマクロブロック580の位置が動きベクトル585で符号化される。順方向参照ピクチャは、復号器が現在のピクチャ505の構築前に再構築していることになるIフレーム又はPフレームであることができる。重み付け係数w及びwは、最良マッチング後続マクロブロックと最良マッチング前マクロブロックの重み付き線形結合を行った場合に図4のように等しい重みが用いられた場合よりも小さい残留誤差が得られることになるような重み付け係数を選択することができる。重み付け係数wに最良マッチングマクロブロック520のY、Cr及びCbの値が乗じられて重み付き最良マッチング前マクロブロックが形成され、重み付け係数wに最良マッチングマクロブロック580のY、Cr及びCbの値が乗じられて重み付き最良マッチング後続マクロブロックが形成される。重み付き最良マッチング順方向マクロブロック及び重み付き最良マッチング逆方向マクロブロックが結合されて重み付き結合双方向マクロブロックが形成され、該重み付き結合双方向マクロブロックが現在のマクロブロック515から減じられて残留誤差530が得られる。最良マッチング順方向マクロブロック及び最良マッチング逆方向マクロブロックを結合させるための重みを選択するその他の方法が以下において説明される。残留誤差530は、DCT535を用いて符号化され、その後に量子化540される。残留誤差530の量子化された係数、動きベクトル525と585、重み及び参照フレーム識別情報は、現在のマクロブロック515を表す符号化された情報である。該符号化された情報は、将来使用するためにメモリに格納すること、又は例えば誤差補正又は画像エンハンスメントのために使用すること、又はネットワーク545を通じて送信することが可能である。
Bフレーム部の再構築は、逆方向参照フレーム(又は参照されているピクチャ又はフレームの一部分)及び順方向参照フレーム(又は参照されているピクチャ又はフレームの一部分)の両方が再構築された後に開始させることができる。符号化された量子化係数が逆量子化550され、その後にIDCT555が行われて復号された又は再構築された残留誤差560が得られる。符号化された動きベクトル525及び585は、前参照ピクチャ510内の既に再構築されている最良マッチングマクロブロック565を探索するために及び後続参照ピクチャ575内の既に再構築されている最良マッチングマクロブロック590を探索するために復号されて使用される。符号化された重みwが復号されて再構築された最良マッチング前マクロブロック565に当てはめられ、符号化された重みwが復号されて再構築された最良マッチング後続マクロブロック590に当てはめられ、結合された重み付き予測マクロブロックが形成される。次に、再構築された残留誤差560が結合された重み付き予測マクロブロックに加えられて再構築されたマクロブロック570が形成される。再構築されたマクロブロック570は、メモリに格納すること、単独で表示するか又はピクチャ内においてその他の再構築されたマクロブロックとともに表示すること、又は画像エンハンスメントのためにさらに処理することが可能である。
図5における重みw及びwの当てはめは、最初に最良マッチング参照マクロブロック(すなわち、輝度(Y)、及び彩度CrとCb(パラメータ))に乗じ、乗じて得られたマクロブロックを加え、次に加えられた重みで割る(結合された重み付き予測の正規化)手順が示されている。これらの重みは、含められた正規化係数を用いて導き出すことも可能である。例えば、重みwは、w/(w+w)の値として導き出すことができ、wは、w/(w+w)の値として導き出すことができる。これらの正規化された重み付け係数は、参照ピクチャパラメータを修正するために使用することができ、これらの修正されたパラメータはいっしょに加えることができ、(w+w)による除算は不要である。図1のプリプロセッサモジュール170及び図8のプリプロセッサ810等の正規化手段は、正規化関数を実行することができる。
含まれている正規化係数を用いて重みを導き出すことは、除算を省略する。除算は、デジタル信号処理においては複雑な演算である。除算を行わずに正規化する他の方法は、ビットシフトを使用する方法である。重みは、公分母を用いて導き出すことができ、除算は、結合された重み付き予測を該分母の基底2対数に基づいたビット数だけ右シフトさせることによって表すことができる。例えば、wは12にすることができ、wは14にすることができ、分母は16にすることができる。分母16は、4ビットの右シフトになる。4ビットの右シフトは、16で割ることに相当し、従って、wは、0.75の正規化重みになり、wは0.25の正規化重みになる。
重みを導き出す他の方法は、H.264においては「直接モード」と呼ばれる双方向予測技術を実行するために使用することができる。直接モードにおいては、双方向予測中のマクロブロック(又はサブマクロブロック等のその他の領域)に関しては動きベクトルは送信されない。代わりに、これらの動きベクトルは、1方の参照フレームから他方の参照フレームへの共配置マクロブロックの動きベクトルから導き出される。動きベクトル及び重みの導出は、両方の参照フレームに対する現在のフレームの時間的位置に基づいて行うことができる。図6は、H.264の直接モード双方向予測において用いられる動きベクトル及び重みの時間的予測例を描いた図である。現在のフレーム630内に位置する現在のマクロブロック605は、後続参照フレーム635内に位置する1つのマクロブロックと前参照フレーム640内に位置する別のマクロブロックの2つのマクロブロックの線形結合によって形成される。順方向動きベクトルMV615及び逆方向動きベクトルMV620は、後続参照フレーム内の共配置マクロブロック610に関する前参照フレーム内の最良マッチングマクロブロックを探索する動きベクトルMV625から導き出される。順方向動きベクトル及び逆方向動きベクトルは次式のように計算される。
Figure 0004659823
ここで、TB645は、現在のフレームと前参照フレームとの間の時間的距離であり、TD650は、前参照フレームと後続参照フレームとの間の時間的距離である。一例においては、最良マッチング前マクロブロックは、重みwによって修正され、最良マッチング後続マクロブロックは、重みwによって修正され、w及びwは次式のように計算される。
Figure 0004659823
次に、上述されさらに図5において示されるように、修正されたマクロブロックが結合される。この例は、後続参照フレーム635内の共配置マクロブロックを使用したが、当業者が知ることになるように、前参照フレーム640内の共配置マクロブロックを、後続参照フレーム635を参照している動きベクトルとともに使用可能である。
さらに、双方向構築は、図4において示されている平均マクロブロック技術又は図5において示されるように両方の重みがゼロ以外である結合された重み付き予測マクロブロック技術の代わりに、(重みの1つがゼロに設定される)順方向最良マッチングマクロブロック又は逆方向最良マッチングマクロブロックのみに基づいて結合双方向予測を計算することが可能である。
H.264は、MPEG−4の上述されるPフレーム構築例及びBフレーム構築例に幾つかの選択肢を提供する。図7は、H.264におけるPフレーム構築プロセス例を示した図である。プロセス700は、5×5マクロブロックによって構成される現在のピクチャ705を含み、この例におけるマクロブロック数は任意である。現在のピクチャ705のマクロブロック715は、現在のピクチャ705と異なる時点において参照ピクチャ710から予測される。マクロブロックは、より小さいサブマクロブロック部分に分割することができ(例えば、この例においては4つのサブマクロブロックが描かれているが、H.264は、4×4画素という小さいサブマクロブロックパーティションを考慮しており、従って単一のマクロブロックに関して16の動きベクトルが存在できる)、各サブマクロブロック部分は、時間的冗長性に関して別々に利用することができる。参照ピクチャ内において探索が行われて各サブマクロブロックに関する最良マッチングサブマクロブロックを突き止められ、符号化対象となっている現在のマクロブロック715に最も近い複合最良マッチングマクロブロック720が得られる。参照ピクチャ内における最良マッチングマクロブロックの位置は、4つの動きベクトル725a乃至725dで符号化することができる。参照ピクチャは、復号器が現在のピクチャ705の構築前に再構築していることになるIフレーム又はPフレームであることができる。複合最良マッチングマクロブロック705が現在のマクロブロック715から減じられて残留誤差730が得られる。残留誤差730は、MPEG−4において用いられるDCTとは多少異なる順方向2D変換735を用いて符号化して量子化740することができる。残留誤差730の量子化された係数、動きベクトル725a乃至725d及び参照フレーム識別情報は、現在のマクロブロック715を表す符号化された情報である。複数のサブマクロブロック部分を有する重み付き双方向予測フレームの場合は、重みも符号化される。該符号化された情報は、将来使用するためにメモリに格納すること、又は例えば誤差補正又は画像エンハンスメントのために使用すること、又はネットワーク745を通じて送信することが可能である。
符号化された量子化係数、動きベクトル、重み及び残留誤差は、後続する動き推定及び補償に関して参照フレームの一部として使用するために符号器内において現在のマクロブロックを再構築するために使用することもできる。符号器は、このPフレーム再構築に関する復号器の手順をエミュレーションすることができる。復号器のエミュレーションは、符号器と復号器の両方が同じ参照ピクチャを用いることになる。本明細書においては、さらなるインター符号化のために符号器内において行われるか又は復号器内において行われるかにかかわらず、再構築プロセスが説明される。Pフレームの再構築は、参照フレーム(又は参照されているピクチャ又はフレームの一部)が再構築された後に開始させることができる。符号化された量子化係数は、逆量子化750され、次に2D逆変換755が行われ、符号化された又は再構築された残留誤差760が得られる。符号化された動きベクトル725a乃至725dは、既に再構築されている最良マッチング複合マクロブロック765を構成する既に再構築されている最良マッチングサブマクロブロックを探索するために復号されて使用される。次に、再構築された残留誤差760が再構築された最良マッチング複合マクロブロック760に加えられて再構築されたマクロブロック770が形成される。デブロッキングフィルタ775は、例えばマクロブロック又はサブマクロブロックのエッジに沿った画素エンハンスメントに関する符号化プロセスまたは復号プロセスの一部として使用することもできる。再構築されたマクロブロックは、メモリに格納すること、単独で表示するか又はピクチャ内においてその他の再構築されたマクロブロックとともに表示すること、又は画像エンハンスメントのためにさらに処理することが可能である。H.264における重み付き双方向予測を含むBフレーム構築は、同様の方法を用いる複数のサブマクロブロックを利用することも可能であることを当業者は理解するであろう。
異なる符号器が異なる方法で双方向予測を実装する。上述されるように、双方向予測は、2つのフレームの平均(両方の重みが1/2に等しい1つの形態の重み付き双方向予測)、2つのフレームの重み付き平均又は2つのフレームの時間的に導き出された重み付き平均として実装することができる。さらに、異なる符号器は、重みパラメータに関して異なる符号化ビット構成による重み付き双方向予測に対応することができる。重みパラメータビット構成は可変であり、例えば、ビット数が各重みを表す、符号付き又は符号なしの重みパラメータを用いる等である。幾つかの実装は、輝度値又は彩度値に加えられるオフセット値にも対応する。以下においてビット構成及びオフセットがさらに詳細に説明される。
多用途復号器、例えば図1に示される復号装置155、は、様々な符号化ビット構成及び様々な型の重み付き/重みなし予測方法を有する複数の実装によって符号化された映像を復号することができるべきである。この多様性を実現させる一方法は、異なる符号器実装に関して異なる復号器モジュールを有しさらに復号器への入力を1つの型または別の型であると単純に識別すること及び指定された符号器用に設計された復号器モジュールを使用することである。この方法は、効率的なく対費用効果も高くない。より効率的な復号器は、単一のモジュールを再利用して複数の符号器実装を復号する。この再利用は、後述されるように、開示される方法が有する再処理とモジュール設計に関する革新的な特長を通じて達成させることが可能である。
次に、最も一般的な重み付き双方向予測実装が説明される。この説明では、左ビットシフト(<<)及び右ビットシフト(>>)等のデジタル信号処理機能記号が幅広く使用される。これらの記号は、当業においてはよく知れられている。ビットシフト演算は、例えば乗算又は除算を通じてスケーリング係数を適用する等のその他の方法によって達成可能であることを当業者は理解するであろう。これらの実装は、MPEG−4シンプルスケーラブルプロフィールにおける双方向平均化例と、Real Video9.0符号器における重み付き双方向予測例と、Windows Media Video9.0符号器における重み付き双方向平均化例と、H.264における一般的重み付き双方向予測例と、を含む。これらの例は、開示される方法を利用して復号することができる重み付き双方向予測の実装例のみである。当業者が理解できるように、開示される方法の精神及び適用範囲から逸脱することなしに双方向予測のその他の実装に対応することがきる。
MPEG−4実装
MPEG−4シンプルプロフィールにおいてはBフレームに関するサポートは行われていない。しかしながら、MPEG−4シンプルスケーラブルプロフィールは、限定されたスケーラビリティをサポートするためにBフレームをサポートしている。2つの参照フレームからの予測を結合させるために以下の平均化機構が使用される。
Figure 0004659823
ここで、pred1ij及びpred2ijは、2つの参照フレーム(過去の参照フレームと将来の参照フレーム)からの予測ブロックからの8ビットの輝度サンプル及び彩度サンプルであり、predijは、残留誤差の復号された逆変換に加えるためにピクチャ再構築の際に使用される合成予測である。明らかなように、MPEG−4シンプルスケーラブルプロフィールにおけるBフレームの実装には重み付き予測はない。
RV9実装
Real Video9.0(RV9)は、Bフレームをサポートする非常に一般的な符号器である。RV9実装では、Bフレームにおいて使用するための合成予測を計算するために次式が使用される。
Figure 0004659823
ここで、pred1ij及びpred2ijは、2つの参照フレーム(過去の参照フレームと将来の参照フレーム)からの予測ブロックからの8ビットの輝度サンプル及び彩度サンプルであり、predijは、残留誤差の復号された逆変換に加えるためにピクチャ再構築の際に使用される合成予測である。RV9実装においては、重みw及びwは、個々の予測pred1ij及びpred2ijに乗じられる14ビットの符号なし重み(0乃至16383の範囲を有する)である。
直接モード双方向予測においては、マクロブロックに関する動きベクトルは送信されないが、これらの動きベクトルは、将来の参照フレームの共配置マクロブロックの動きベクトルから導き出すことができ、w及びwは、上述される2つの参照フレームに関するBフレームの相対的時間的位置として計算される。上述されさらに図5に示される直接モードに関して、式(6)において用いられる重みは次式のように計算される。
Figure 0004659823
ここで、Tは、現在のフレームと前参照フレームとの間の時間的距離であり、Tは、前参照フレームと後続参照フレームとの間の時間的距離である。
MPEG−4の単純平均化方法(5)は、式(6)を使用し、w及びwの両方を14ビット表示における1/2に相当する8192に設定することによってエミュレーションすることができる。
WMV9実装
Windows Media Video9.0(WMV9)は、Bフレームをサポートするもう1つの非常に一般的な映像符号器である。WMV9は、上式(5)を用いてMPEG−4と同様にBフレームを実装し、pred1ij及びpred2ijは、2つの参照フレーム(過去の参照フレームと将来の参照フレーム)からの予測ブロックからの8ビットの輝度サンプル及び彩度サンプルであり、predijは、残留誤差の復号された逆変換に加えるためにピクチャ再構築の際に使用される合成予測である。従って、WMV9平均化プロセスは、MPEG−4と同じである。
H.264実装
H.264映像圧縮基準は、単方向予測領域及び双方向予測領域の両方に関する重み付き予測及び重みなし予測を提供する。H.264においては、重み付き予測は、変数“predFlagL0”及び“predFlagL1”のうちの1つ又は両方を1に設定することによって呼び出される。重み付き予測が呼び出されないとき、又は“predFlagL0 = 0”及び“predFlagL1 = 0”であるときには、上記のMPEG−4等の単純平均化が次式のように行われる。
Figure 0004659823
ここで、pred0及びpred1は、2つの参照フレーム(過去の参照フレームと将来の参照フレーム)からの予測ブロックからの8ビットの輝度サンプル及び彩度サンプル(ルマ及びクロマとも呼ばれる)であり、Final_predは、残留誤差の復号された逆変換に加えるためにピクチャ再構築の際に使用される合成予測である。
2つの参照パーティションのうちの1つのみに重みを付ける場合は、最終的な予測サンプル値は次式のように導き出される。
Figure 0004659823
ここで、変数に関する説明、ビットサイズ及び値の範囲が表1に示されている。上記の事例1は、重み付き順方向Pフレーム予測であり、事例2は、重み付き逆方向Pフレーム予測である。上記のその他の重み付き予測実装においては、追加オフセットo及び0は提供されない。Clip1[ ]関数は次式のように定義される。
Figure 0004659823
2つの参照パーティションの両方に重みを付ける場合は、最終的な予測サンプル値は以下のように導き出される。
Figure 0004659823
変数に関する説明、ビットサイズ及び値の範囲が表1に示されている。
Figure 0004659823
輝度及び彩度(Cb及びCrの両方)のサンプル値は、上式(9)、(10)及び(13)を用いて評価される。重み変数w0、w1及びlogWDは、輝度パラメータに関して別々に導き出され、さらに彩度パラメータに関して別々に導き出される。
MPEG−9、RV9、WMV9及びH.264を満たす単一実装
上記の4つの実装はすべて、幅広く使用されさらに受け入れられている映像圧縮形態である。示されているように、各実装は、重み付き予測を各々独自の方法で実装し、これらの実装の一部は大きく異なる。下式(18)は、図1の復号器155等の復号装置のマイクロプロセッサ等の埋め込まれたハードウェアが4つのいずれかの実装において符号化された重み付き予測フレームを復号するために使用するユニバーサル公式例である。該ユニバーサル公式は、いずれかの標準フォーマットの映像圧縮データを、最小限の前処理を行いさらにソフトウェア、ファームウェア又はハードウェアを最大限に再利用することによって処理する。ユニバーサル公式を実装するためには、特定のビット構成を有するユニバーサル重み付き予測係数を、異なる圧縮基準によって利用される異なる重み係数から導き出さなければならない。
この例においては、外部DSP又はプリプロセッサ等のその他の型のプロセッサが、符号化された重みパラメータをユニバーサル重みパラメータに修正する。以下では、符号化された重みパラメータを修正することによってユニバーサル重みパラメータを導き出すためにプリプロセッサによって行われる計算が方程式の組(19)乃至(21)に関して説明される。式(14)乃至(17)において示されることは、予測フレームを復号するためのユニバーサル方程式(18)を導き出すことである。
H.264実装が最も複雑であり、最初に挙げる例として好例である。上式(9)、(10)及び(13)によって表される3つの事例は、重み付け係数変数及びオフセット変数を以下のように適切に処理することによって1つの方程式に単純化することができる。
Figure 0004659823
ここで、変数LWD、w0、w1、o0及びo1は、3つの事例に関して以下のように定義される。
Figure 0004659823
表1に示されているビットサイズを使用した場合、表2のビット幅演繹(deduction)は、式(14)から重み付き予測サンプルに関する8ビット値が得られることを示している。
Figure 0004659823
式(14)は、LWDビットの可変ビットシフトを取り除くために修正することができる。重みw0及びw1を修正すること及び外部デジタル信号プロセッサ(DSP)又はその他の型のプロセッサを有することは、修正された重みパラメータw0'及びw1'をプログラミングする。LWDは最大値8を有するため、表2の演算3における各々の項に28−LWDを乗じさらに表2の演算4の右ビットシフトを以下のように(8−LWD)ビットだけ増やすことによって、すべてのビットシフト演算の引数を正に維持しながら重み修正を達成させることができる。
Figure 0004659823
重みw0及びw1を修正された重み結果に置き換えると次式のようになる。
Figure 0004659823
式9、10及び13における事例1、2及び3は、DSP又はその他のプリプロセッサによって定義された以下の変数を用いて式(16)によって処理することができる。
Figure 0004659823
修正された重みに関する左ビットシフトを行うプリプロセッサに加えて、これらの重みのビット数を増やすことも可能である。このビット数の増加は、複数の実装との互換性を確保するために行うことができる。DSP又はプリプロセッサは、RV9実装におけるように符号なし変数の場合は重みをゼロ拡張することができ、H.264実装におけるように符号付き変数の場合は符号拡張することが可能である。表3は、8ビット符号付き重みを用いた式(16)の変数及び演算に関して結果的に得られるビット幅演繹を示した表であり、重みは9ビットに符号拡張される。表3のオフセット演算番号4は、プリプロセッサ内で行うことも可能である。
Figure 0004659823
表3に示されるビット幅及び表1に示される符号化変数を有する方程式16は、マイクロプロセッサに実装し、RV9実装を除く上記のすべての重み付き双方向予測実装を実装するために使用することができる。RV9の14ビット符号なし重みをサポートするためには式(16)をさらに修正する必要がある。
式(16)内の重みw0'及びw1'は、RV9重みの14ビットのビット幅をマッチングさせるために6ビットだけ左シフトすることができ、その結果次式のようになる。
Figure 0004659823
上式は以下のように表すことができる。
Figure 0004659823
ここで、w、w及びオフセットは、これらの重みパラメータを符号化するためにいずれの実装が用いられたかに基づいてプリプロセッサによって計算することができる(以下のプリプロセッサによる計算を参照)。表4は、上記のすべての重み付き予測例に対応することができる15ビットの重みwとw及び8ビットオフセットを用いた式(18)の変数及び演算に関するビット幅演繹例を示した表である。
Figure 0004659823
マイクロプロセッサ等の埋め込まれたハードウェアにおいて方程式18を実装しさらに符号化された重みパラメータを修正するためのプリプロセッサとして外部DSP又はその他の型のプロセッサを使用することは、重み付き予測の複数の実装を処理する上で対費用効果が高くさらに効率的な方法である。図1に示されるプリプロセッサ170及び図8に示されるプリプロセッサ810等のプリプロセッサは、符号化重みパラメータを修正するために使用可能である。該プリプロセッサは、記載されている様々な実装に関して、符号化重みパラメータを修正時には以下の計算を行い、修正された変数を埋込型マイクロプロセッサに提供する。
8ビット符号付き重みw0とw1、8ビット符号付きオフセットo0とo1、及びlogWDを用いたH.264符号化重み付き予測に基づく修正重み付き予測係数w及びwが以下の方程式の組(19)を用いて計算される。
方程式の組(19)
wA = sign_extend((w0' << 6), 15)
wB = sign_extend((w1' << 6), 15)
Offset = (o0 + o1 + 1) >> 1
w0' = w0 << (8 − LWD)
w1' = w1 << (8 − LWD)
ここで、LWD、w0及びw1は、上述されさらに式(9)、(10)及び(13)において示される上記の3つの事例に依存する。
事例1の場合: w1 = 0であり、w0は符号器によって決定される
o1 = 0であり、o0は符号器によって決定される
LWD = logWDであり、符号器によって決定される
符号器はpred0を決定する
事例2の場合: w0 = 0であり、w1は符号器によって決定される
o0 = 0であり、o1は符号器によって決定される
LWD = logWDであり、符号器によって決定される
符号器はpred1を決定する
事例3の場合: LWD = logWD + 1
符号器は、pred0、pred1、logWD、w0、w1、o0及びo1を決定する
14ビット符号なし重みw1とw2を用いたRV9符号化重み付き予測に基づく修正重み付き予測係数w及びwが以下の方程式の組(20)を用いて計算される。
方程式の組(20)
wA = zero_extend(w1,15)
wB = zero_extend((w2,15)
Offset = 0
pred0 = pred1ij
pred1 = pred2ij
WMV9又はMPEG−4符号化単純平均化予測に基づく修正重み付き予測係数w及びwが以下の方程式の組(21)を用いて計算される。
方程式の組(21)
wA = zero_extend(16383,15)
wB = zero_extend(16383,15)
Offset = 0
pred0 = pred1ij
pred1 = pred2ij
当業者が認識することになるように、その他の重み付き予測実装を同様の方法で実装可能である。式(18)における重み変数w及びwのビット構成は、14ビットを超える符号化重みに対応するためにより大きくなるようにすることが可能である。式(18)における重み変数w及びwのビット構成は、下位ビットを失うことが受入可能である場合は14ビットよりも小さくなるようにすることが可能である。さらに、異なる大きさのオフセットも同様の方法で対応することが可能である。上記のように、符号付き及び符号なしの両変数にも対応することが可能である。図1のプリプロセッサモジュール170等のビット構成選択手段は複数の符号化ビット構成を有する重み変数及びオフセットに対応するために必要な適切なビット構成を選択するために使用することができる。
図8は、重み付き双方向予測映像データの複数の符号器実装を復号する復号器プロセス例の流れ図である。プロセス800は、図1に示される復号装置155等の装置を用いて実行することができる。プロセス800は、予測復号コンポーネント165、予測復号コンポーネント165の外部のDSP等のプリプロセッサコンポーネント170、及び様々なデータを格納するための少なくとも1つのメモリモジュール175を含む3つの主コンポーネントによって行われる。予測復号コンポーネント165及び外部プリプロセッサコンポーネント175の組合せは、復号対象となっている符号器実装に依存して各実装ごとの計算がプリプロセッサ内において行われる幾つかの重み付き予測例を行うことができるマイクロプロセッサの単純なハードウェア設計を可能にする。
復号装置は、図1のネットワーク150等のネットワークを通じて、又は図1の外部格納コンポーネント180等の外部メモリから、符号化された映像データを受け取る。図1の通信コンポーネント190等の受信手段は、受信タスクを行うことができる。インター符号化ピクチャの復号は、参照ピクチャが既に復号されて図1のメモリモジュール175等のメモリに格納されているときに開始することができる。上述されるようにH.264実装において事例1又は事例2を実施時には(過去又は将来にかかわらず)1つの参照フレームしか存在しない。双方向予測復号を行うときには、過去及び将来の両方の参照ピクチャがメモリに格納される。検索ステップ810及び815は、第1の参照ピクチャ(例えば過去の参照ピクチャ)及び第2の参照ピクチャ(例えば将来の参照ピクチャ)にメモリからそれぞれアクセスする。画素内挿準備として復号ピクチャの境界のエッジに0を詰めることが行われる(反射(reflection)を使用することも可能である)。ステップ830において詰める行為は、複数のタップフィルタが不十分な数の画素が存在する境界域画素間において正確に内挿することを可能にする。ステップ835における画像内挿は、うごき補償に関してより良いマッチングの参照領域を達成させるために使用される。符号器は、画素内挿を行って最良マッチング参照マクロブロック(又はあらゆる大きさの部分)を突き止め、該画素又は内挿された画素を動きベクトルによって示すことができる。双方向予測の場合は、2つの動きベクトルが存在する。さらに、上述されるように直接モードを利用時には、復号器は、将来の参照ピクチャ内の共配置マクロブロックの動きベクトルの時間的内挿を通じて動きベクトルを計算する。復号器は、ステップ840においてこれらの動きベクトルを用いて動き補償領域の突き止めを行い、内挿された画素間における最良マッチング領域を探索する。以下ではステップ835の画素内挿がさらに詳細に説明される。ステップ845及び850において、ステップ840で出力された2つの最良マッチング予測領域の輝度値及び彩度値pred0及びpred1に修正重みw及びwがそれぞれ乗じられる(重み修正が以下において説明される)。これらの重みを当てはめた後に、ステップ855及び860において両方の重み付き領域が6ビットだけ右ビットシフトされ、ステップ865において丸め係数2に加えられ、次にステップ870において8ビットだけ右ビットシフトされ、結合された重み付き予測が形成される。図1の予測復号モジュール165等の計算手段は、結合された重み付き予測を計算するために、乗算ステップ845と850、ビットシフトステップ855、860及び870、及び追加ステップ865を行うことができる。ステップ820において、重み付き予測領域に対応する量子化残留誤差DCT係数がネットワークを通じてまたは外部記憶装置から受け取られる。ステップ875において逆量子化を行うこと及びステップ880において逆変換(例えば、逆DCT又は逆ウェーブレット変換)を行うことは、復号された残留誤差が得られ、ステップ885において該復号された残留誤差が結合された重み付き予測及びプリプロセッサ修正オフセット(オフセット修正は以下において説明される)に加えられて出力ピクチャが形成される。図1の予測復号モジュール165等の残留誤差とオフセットの結合手段は、追加ステップ885を行うことができる。ステップ825において、出力ピクチャは、メモリに格納すること及び/又は図1の表示コンポーネント等の表示手段で表示することができる。
ステップ827において、重み付き予測領域に対応する重みパラメータが受け取られる。ステップ852において、埋込型マイクロプロセッサ符号の設計対象となったユニバーサル重み予測係数のビット構成をマッチングさせるために、図1のプリプロセッサコンポーネント170等のプリプロセッサが用いられて受信符号化重みw及びwが修正される。該プリプロセッサは、埋込型マイクロプロセッサが使用することになる受信オフセットが埋込型マイクロプロセッサ符号の設計対象となったビット構成に適合するようにステップ852においてこれらの受信オフセットを修正するためにも使用される。これらの修正は、データを符号化するためにいずれの形態の重み付き予測が使用されたかに依存する(修正例が上記の方程式の組(19)乃至(21)において示されている)。前記プリプロセッサは、受信中である符号化データの型(例えば、H.264、RV9、WMV9又はMPEG−4符号化映像データ)を識別するフラグを入力ビットストリームから受け取ることができる。復号器に依存する重み及びオフセットの修正が、図8に示される例である方程式18に関連して上述されている。図1のプリプロセッサモジュール170等の修正手段は、重み及びオフセットの修正を行うことができる。上記のH.264実装における事例1又は事例2の場合のように重みの1つがゼロであるときには、図1のプリプロセッサモジュール170等のゼロ重み識別手段は、対応する重みパラメータをゼロに設定する。
幾つかの事情においては、映像符号器は、動き補償解析中にマクロブロックに関するヌル領域を指定することが可能である。ヌル領域は、対象となるマクロブロックに関する参照ピクチャが存在しないことを意味する。重み付き予測論理は、参照リストIDを検査して参照ピクチャの有無及び関係を確認することができる。ヌル領域の場合は、図1のプリプロセッサモジュール170等のヌル領域突き止め及び識別手段は、対応する重みをゼロに設定すること又は当業者に知られているその他のヌル領域処理動作を行うことができる。
画素内挿は、動き補償予測符号化の性能を向上させるために使用することができる。図9は、動き補償において用いるための半画素内挿例を示した図である。該例は、1つの内挿された画素が原整数画素の各々の間に位置する半画素内挿例である。整数画素910は、大文字“A”乃至“T”のラベルが付けられた円として描かれ、内挿された画素又は半画素920は、小文字“a”乃至“o”のラベルが付けられた正方形として描かれる。半画素内挿は、双線形フィルタ、例えば重み[0.5 0.5]を有する2タップFIRフィルタ、を用いて行うことができる。例えば、内挿画素922は、整数画素912と整数画素914の平均として計算することができ、内挿画素926は、2つの内挿画素(例えば、922と928又は924と930)の平均であることができる。輝度(Y)成分及び彩度(Cr及びCb)成分の両方をこの方法で内挿することができる。その他の画素内挿順序が様々な基準によってサポートされている。H.264は、1/4画素内挿及び1/8画素内挿をサポートする。当業者はこれらのその他の画素内挿方法を理解することになると思われるため、本明細書においてはこれ以上詳細には説明されない。
上記の実施形態例は、以下の方法および装置を含む。
予測されるピクチャを構築する方法であって、ビット構成に適合するように第1のフレームの領域に関連する第1の重みパラメータを修正することと、前記ビット構成に適合するように第2のフレームの領域に関連する第2の重みパラメータを修正することと、前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算することと、前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算することと、前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算すること、とを含む、方法。
予測されるピクチャを構築する装置であって、ビット構成に適合するように第1のフレームの領域に関連する第1の重みパラメータを修正する手段と、前記ビット構成に適合するように第2のフレームの領域に関連する第2の重みパラメータを修正する手段と、前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算する手段と、前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算する手段と、前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算する手段と、を含む、装置。
予測されるピクチャを構築する電子デバイスであって、ビット構成に適合するように第1のフレームの領域に関連する第1の重みパラメータを修正し、前記ビット構成に適合するように第2のフレームの領域に関連する第2の重みパラメータを修正し、前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算し、前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算し、前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算するように構成される、電子デバイス。
予測されるピクチャを構築する方法であって、ビット構成に適合するように第1のフレームの領域に関連する第1の重みパラメータを修正することと、前記ビット構成に適合するように第2のフレームの領域に関連する第2の重みパラメータを修正することと、前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算することと、前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算することと、前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算すること、とを含む方法をコンピュータに実行させる手段を具体化した、コンピュータによって読取可能な媒体。
当業者は、情報及び信号は様々な異なる技術のうちのいずれかを用いて表すことができることを理解するであろう。例えば、上記の説明全体を通じて参照されることがあるデータ、命令、コマンド、情報、信号、ビット、シンボル、及びチップは、電圧、電流、電磁波、磁場、磁気粒子、光学場、光学粒子、又はそのあらゆる組合せによって表すことができる。
本明細書において開示される例に関連させて説明されている様々な例示的論理ブロック、モジュール、及びアルゴリズム上のステップは、電子ハードウェアとして、コンピュータソフトウェアとして、又は両方の組合せとして実装できることを当業者はさらに理解するであろう。ハードウェアとソフトウェアのこの互換性を明確に例示するため、様々な例示的コンポーネント、ブロック、モジュール、回路、及びステップは、各々の機能の観点で一般的に説明されている。これらの機能がハードウェアとして又はソフトウェアとして実装されるかは、全体的システムに対する特定の用途上の及び設計上の制約事項に依存する。当業者は、説明されている機能を各特定用途に合わせて様々な方法で実装できるが、これらの実装決定は、開示される方法の適用範囲からの逸脱を生じさせるものであるとは解釈すべきでない。
本明細書において開示される例に関連させて説明されている様々な例示的な論理ブロック、モジュール、及び回路は、本明細書において説明されている機能を果たすように設計された汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、その他のプログラミング可能な論理デバイス、ディスクリートゲートロジック、ディスクリートトランジスタロジック、ディスクリートハードウェアコンポーネント、又はそのあらゆる組合せ、とともに実装又は実行することができる。汎用プロセッサは、マイクロプロセッサであることができるが、代替として、該プロセッサは、従来のどのようなプロセッサ、コントローラ、マイクロコントローラ、又はステートマシンであってもよい。プロセッサは、計算デバイスの組合せとして、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサとの組合せ、DSPコアと関係する1つ以上のマイクロプロセッサとの組合せ、又はその他のいずれかのコンフィギュレーションとして実装することもできる。
本明細書において開示される例と関連させて説明されている方法又はアルゴリズムのステップは、ハードウェア内において直接具体化させること、プロセッサによって実行されるソフトウェアモジュール内において具体化させること、又は両方の組合せ内において具体化させることができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、ERPOMメモリ、EERPOMメモリ、レジスタ、ハードディスク、取り外し可能ディスク、CD−ROM、又は当業において知られるその他のあらゆる形態の記憶媒体に常駐することが可能である。典型的記憶媒体は、プロセッサが該記憶媒体から情報を読み出すため及び該記憶媒体に情報を書き込むために該プロセッサに結合される。代替として、該記憶媒体は、プロセッサと一体化させることができる。該プロセッサ及び該記憶媒体は、特定用途向け集積回路(ASIC)内に常駐することができる。該ASICは、無線モデム内に常駐することができる。代替として、該プロセッサ及び記憶媒体は、無線モデム内の個別構成品として常駐することができる。
開示される例に関する上記の説明は、当業者が開示される例を製造又は使用できるようにすることを目的とするものである。これらの例に対する様々な修正が加えられた場合には、当業者は、該修正を容易に理解するであろう。本明細書において定められている一般原理は、開示される方法の精神及び適用範囲を逸脱しない形でその他の例に対しても適用することができる。
重み付き双方向予測の異なる実装を用いて符号化されている重み付き双方向予測映像データを再構築するための方法、装置及びシステムが説明されている。
ストリーミングピクチャを符号化及び復号するための一般的通信システムのブロック図である。 従来のMPEG−4単純プロフィールデータストリームを示した概略図である。 双方向予測フレームを含む従来の符号化データストリームを示した概略図である。 MPEG−4におけるPフレーム構築プロセス例を示した図である。 MPEG−4におけるBフレーム構築プロセス例を示した図である。 重み付きBフレーム構築プロセス例を示した図である。 H.264の直接モード双方向予測において用いられる重みの時間的予測例を示した図である。 H.264におけるPフレーム構築プロセス例を示した図である。 重み付き双方向予測映像データの複数の符号器実装を復号するための復号器プロセス例を示した流れ図である。 動き補償において用いられる半画素内挿例を示した図である。 一実施形態による流れ図である。

Claims (67)

  1. 各々が異なる符号化ビット構成及び異なる重み付き予測方法を有する複数の符号化方式によって符号化された映像データを復号する方法であって、
    第1のフレームの領域に関連する第1の重みパラメータを選択することと、
    第2のフレームの領域に関連する第2の重みパラメータを選択することと、
    複数の符号化方式に適用可能なユニバーサルな公式におけるビット構成に適合するように前記第1の重みパラメータを修正することと、
    前記ビット構成に適合するように前記第2の重みパラメータを修正することと、
    前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算することと、
    前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算することと、
    前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算すること、とを具備する、方法。
  2. 複数の符号化ビット構成に対応するように前記ビット構成を選択することをさらに具備し、前記複数の符号化ビット構成の少なくとも2つは異なるビット数を有する請求項1に記載の方法。
  3. 複数の符号化ビット構成に対応するように前記ビット構成を選択することをさらに具備し、前記複数の符号化ビット構成の少なくとも1つは符号付きであり、前記複数の符号化ビット構成の少なくとも1つは符号なしである請求項1に記載の方法。
  4. 第1の動きベクトルを用いて前記第1のフレームの前記領域を探索することと、
    第2の動きベクトルを用いて前記第2のフレームの前記領域を探索すること、とをさらに具備する請求項1に記載の方法。
  5. 前記第1のフレームと前記第2のフレームとの間における復号された動きベクトルの直接モード時間的内挿(temporal interpolation)を用いて前記第1のフレームの前記領域を探索すること及び前記第2のフレームの前記領域を探索することをさらに具備する請求項1に記載の方法。
  6. 前記第1のフレームの前記領域がヌル領域であることを識別することによって前記第1のフレームの前記領域を探索することと、
    前記第1の予測される成分が0に等しいことを計算すること、とをさらに具備する請求項1に記載の方法。
  7. 前記第2のフレームの前記領域がヌル領域であることを識別することによって前記第2のフレームの前記領域を探索することと、
    前記第2の予測される成分が0に等しいことを計算すること、とをさらに具備する請求項1に記載の方法。
  8. 前記第1の重みパラメータ及び前記第2の重みパラメータは同じ符号化ビット構成である請求項1に記載の方法。
  9. 前記第1の重みパラメータは0であることを識別することと、
    前記第1の予測される成分が0に等しいことを計算すること、とをさらに具備する請求項1に記載の方法。
  10. 前記第2の重みパラメータは0であることを識別することと、
    前記第2の予測される成分が0に等しいことを計算すること、とをさらに具備する請求項1に記載の方法。
  11. 前記第1の重みパラメータ及び前記第2の重みパラメータは符号付きである請求項1に記載の方法。
  12. 前記第1の重みパラメータ及び前記第2の重みパラメータと関連する分母の基底2対数に基づいたビット数だけ前記結合された重み付き予測をビットシフトすることによって前記結合された重み付き予測を正規化することをさらに具備する請求項1に記載の方法。
  13. 前記第1のフレームの前記領域に関連する第1のオフセットパラメータを受信することと、
    前記第2のフレームの前記領域に関連する第2のオフセットパラメータを受信すること、とをさらに具備する請求項1に記載の方法。
  14. 前記第1の重みパラメータ、前記第2の重みパラメータ、前記第1のフレームの前記領域及び前記第2のフレームの前記領域を表す符号化映像データをネットワークを通じて受信することをさらに具備する請求項1に記載の方法。
  15. 前記第1の重みパラメータ、前記第2の重みパラメータ、前記第1のフレームの前記領域及び前記第2のフレームの前記領域を表す符号化映像データを無線ネットワークを通じて受信することをさらに具備する請求項1に記載の方法。
  16. 前記結合された重み付き予測結果を表示することをさらに具備する請求項1に記載の方法。
  17. ビットシフト、符号拡張、ゼロ拡張及びスケーリング係数の当てはめによって構成されるグループから選択された動作を行うことによって前記第1の重みパラメータを修正することと、
    ビットシフト、符号拡張、ゼロ拡張及びスケーリング係数の当てはめによって構成されるグループから選択された動作を行うことによって前記第2の重みパラメータを修正すること、とをさらに具備する請求項1に記載の方法。
  18. 各々が異なるビット構成及び異なる重み付き予測方法を有する複数の符号化方式によって符号化された映像データを復号する装置であって、
    第1のフレームの領域に関連する第1の重みパラメータを選択する手段と、
    第2のフレームの領域に関連する第2の重みパラメータを選択する手段と、
    複数の符号化方式に適用可能なユニバーサルな公式におけるビット構成に適合するように前記第1の重みパラメータを修正する手段と、
    前記ビット構成に適合するように前記第2の重みパラメータを修正する手段と、
    前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算する手段と、
    前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算する手段と、
    前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算する手段と、を具備する、装置。
  19. 複数の符号化ビット構成に対応するように前記ビット構成を選択する手段をさらに具備し、前記複数の符号化ビット構成の少なくとも2つは異なるビット数を有する請求項18に記載の装置。
  20. 複数の符号化ビット構成に対応するように前記ビット構成を選択する手段をさらに具備し、前記複数の符号化ビット構成の少なくとも1つは符号付きであり、前記複数の符号化ビット構成の少なくとも1つは符号なしである請求項18に記載の装置。
  21. 動きベクトルを用いて前記第1のフレームの前記領域を探索する手段をさらに具備する請求項18に記載の装置。
  22. 動きベクトルを用いて前記第2のフレームの前記領域を探索する手段をさらに具備する請求項18に記載の装置。
  23. 前記第1のフレームと前記第2のフレームとの間における復号された動きベクトルの直接モード時間的内挿を用いて前記第1のフレームの前記領域を探索する手段及び前記第2のフレームの前記領域を探索する手段をさらに具備する請求項18に記載の装置。
  24. 前記第1のフレームの前記領域がヌル領域であることを識別することによって前記第1のフレームの前記領域を探索する手段と、
    前記第1の予測される成分が0に等しいことを計算する手段と、をさらに具備する請求項18に記載の装置。
  25. 前記第2フレームの前記領域がヌル領域であることを識別することによって前記第2のフレームの前記領域を探索する手段と、
    前記第2の予測される成分が0に等しいことを計算する手段と、をさらに具備する請求項18に記載の装置。
  26. 前記第1の重みパラメータ及び前記第2の重みパラメータは同じ符号化ビット構成である請求項18に記載の装置。
  27. 前記第1の重みパラメータは0であることを識別する手段と、
    前記第1の予測される成分が0に等しいことを計算する手段と、をさらに具備する請求項18に記載の装置。
  28. 前記第2の重みパラメータは0であることを識別する手段と、
    前記第2の予測される成分が0に等しいことを計算する手段と、をさらに具備する請求項18に記載の装置。
  29. 前記第1の重みパラメータ及び前記第2の重みパラメータは符号付きである請求項18に記載の装置。
  30. 前記結合された重み付き予測を正規化する手段をさらに具備する請求項18に記載の装置。
  31. 前記第1の重みパラメータ及び前記第2の重みパラメータと関連する分母の基底2対数に基づいたビット数だけ前記結合された重み付き予測をビットシフトすることによって前記結合された重み付き予測を正規化する手段をさらに具備する請求項18に記載の装置。
  32. 前記第1のフレームの前記領域に関連する第1のオフセットパラメータを受信する手段と、
    前記第2のフレームの前記領域に関連する第2のオフセットパラメータを受信する手段と、
    前記第1のオフセットパラメータ及び前記第2のオフセットパラメータを前記結合された重み付き予測と結合させる手段と、をさらに具備する請求項18に記載の装置。
  33. 前記結合された重み付き予測と関連する残留誤差を受信する手段と、
    前記残留誤差を前記結合された重み付き予測と結合させる手段と、をさらに具備する請求項18に記載の装置。
  34. 前記第1の重みパラメータ、前記第2の重みパラメータ、前記第1のフレームの前記領域及び前記第2のフレームの前記領域を表す符号化映像データをネットワークを通じて受信する手段をさらに具備する請求項18に記載の装置。
  35. 前記第1の重みパラメータ、前記第2の重みパラメータ、前記第1のフレームの前記領域及び前記第2のフレームの前記領域を表す符号化映像データを無線ネットワークを通じて受信する手段をさらに具備する請求項18に記載の装置。
  36. 前記結合された重み付き予測結果を表示する手段をさらに具備する請求項18に記載の装置。
  37. 前記第1の重みパラメータをビットシフトによって修正する手段と、
    前記第2の重みパラメータをビットシフトによって修正する手段と、をさらに具備する請求項18記載の装置。
  38. 前記第1の重みパラメータを符号拡張によって修正する手段と、
    前記第2の重みパラメータを符号拡張によって修正する手段と、をさらに具備する請求項18に記載の装置。
  39. 前記第1の重みパラメータをゼロ拡張によって修正する手段と、
    前記第2の重みパラメータをゼロ拡張によって修正する手段と、をさらに具備する請求項18に記載の装置。
  40. スケーリング係数を適用することによって前記第1の重みパラメータを修正する手段と、
    スケーリング係数を適用することによって前記第2の重みパラメータを修正する手段と、をさらに具備する請求項18に記載の装置。
  41. 各々が異なるビット構成及び異なる重み付き予測方法を有する複数の符号化方式によって符号化された映像データを復号する電子デバイスであって、第1のフレームの領域に関連する第1の重みパラメータを選択し、第2のフレームの領域に関連する第2の重みパラメータを選択し、複数の符号化方式に適用可能なユニバーサルな公式におけるビット構成に適合するように前記第1の重みパラメータを修正し、前記ビット構成に適合するように前記第2の重みパラメータを修正し、前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算し、前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算し、前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算するように構成される、電子デバイス。
  42. 前記ビット構成は、複数の符号化ビット構成に対応し、前記複数の符号化ビット構成の少なくとも2つは異なるビット数を有する請求項41に記載の電子デバイス。
  43. 前記ビット構成は、複数の符号化ビット構成に対応し、前記複数の符号化ビット構成の少なくとも1つは符号付きであり、前記複数の符号化ビット構成の少なくとも1つは符号なしである請求項41に記載の電子デバイス。
  44. 動きベクトルを用いて前記第1のフレームの前記領域を探索するようにさらに構成される請求項41に記載の電子デバイス。
  45. 動きベクトルを用いて前記第2のフレームの前記領域を探索するようにさらに構成される請求項41に記載の電子デバイス。
  46. 前記第1のフレームと前記第2のフレームとの間における復号された動きベクトルの直接モード時間的内挿を用いて前記第1のフレームの前記領域を突き止め、前記第2のフレームの前記領域を探索するようにさらに構成される請求項41に記載の電子デバイス。
  47. 前記第1のフレームの前記領域がヌル領域であることを識別することによって前記第1のフレームの前記領域を突き止め、前記第1の予測される成分が0に等しいことを計算するようにさらに構成される請求項41に記載の電子デバイス。
  48. 前記第2のフレームの前記領域がヌル領域であることを識別することによって前記第2のフレームの前記領域を突き止め、前記第2の予測される成分が0に等しいことを計算するようにさらに構成される請求項41に記載の電子デバイス。
  49. 前記第1の重みパラメータ及び前記第2の重みパラメータは同じ符号化ビット構成である請求項41に記載の電子デバイス。
  50. 前記第1の重みパラメータは0であることを識別し、前記第1の予測される成分が0に等しいことを計算するようにさらに構成される請求項41に記載の電子デバイス。
  51. 前記第2の重みパラメータは0であることを識別し、前記第2の予測される成分が0に等しいことを計算するようにさらに構成される請求項41に記載の電子デバイス。
  52. 前記第1の重みパラメータ及び前記第2の重みパラメータは符号付きである請求項41に記載の電子デバイス。
  53. 前記結合された重み付き予測を正規化するようにさらに構成される請求項41に記載の電子デバイス。
  54. 前記第1の重みパラメータ及び前記第2の重みパラメータと関連する分母の基底2対数に基づいたビット数だけ前記結合された重み付き予測をビットシフトすることによって前記結合された重み付き予測を正規化するようにさらに構成される請求項41に記載の電子デバイス。
  55. 前記第1のフレームの前記領域に関連する第1のオフセットパラメータを受信し、前記第2のフレームの前記領域に関連する第2のオフセットパラメータを受信し、前記第1のオフセットパラメータ及び前記第2のオフセットパラメータを前記結合された重み付き予測と結合させるようにさらに構成される請求項41に記載の電子デバイス。
  56. 前記結合された重み付き予測と関連する残留誤差を受信し、前記残留誤差を前記結合された重み付き予測と結合させるようにさらに構成される請求項41に記載の電子デバイス。
  57. 前記第1の重みパラメータ、前記第2の重みパラメータ、前記第1のフレームの前記領域及び前記第2のフレームの前記領域を表す符号化映像データをネットワークを通じて受信するようにさらに構成される請求項41に記載の電子デバイス。
  58. 前記第1の重みパラメータ、前記第2の重みパラメータ、前記第1のフレームの前記領域及び前記第2のフレームの前記領域を表す符号化映像データを無線ネットワークを通じて受信するようにさらに構成される請求項41に記載の電子デバイス。
  59. 前記結合された重み付き予測結果を表示するようにさらに構成される請求項41に記載の電子デバイス。
  60. 前記第1の重みパラメータをビットシフトによって修正し、前記第2の重みパラメータをビットシフトによって修正するようにさらに構成される請求項41に記載の電子デバイス。
  61. 前記第1の重みパラメータを符号拡張によって修正し、前記第2の重みパラメータを符号拡張によって修正するようにさらに構成される請求項41に記載の電子デバイス。
  62. 前記第1の重みパラメータをゼロ拡張によって修正し、前記第2の重みパラメータをゼロ拡張によって修正するようにさらに構成される請求項41に記載の電子デバイス。
  63. スケーリング係数を適用することによって前記第1の重みパラメータを修正し、スケーリング係数を適用することによって前記第2の重みパラメータを修正するようにさらに構成される請求項41に記載の電子デバイス。
  64. 各々が異なるビット構成及び異なる重み付き予測方法を有する複数の符号化方式によって符号化された映像データを復号するために、コンピュータを、
    第1のフレームの領域に関連する第1の重みパラメータを選択する手段と、
    第2のフレームの領域に関連する第2の重みパラメータを選択する手段と、
    複数の符号化方式に適用可能なユニバーサルな公式におけるビット構成に適合するように前記第1の重みパラメータを修正する手段と、
    前記ビット構成に適合するように前記第2の重みパラメータを修正する手段と、
    前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算する手段と、
    前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算する手段と、
    前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算する手段、
    として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  65. 複数の符号化ビット構成に対応するように前記ビット構成を選択することをさらに具備し、前記複数の符号化ビット構成の少なくとも2つは異なるビット数を有することをさらに具備する請求項64に記載のコンピュータによって読取可能な媒体。
  66. 複数の符号化ビット構成に対応するように前記ビット構成を選択することをさらに具備し、前記複数の符号化ビット構成の少なくとも1つは符号付きであり、前記複数の符号化ビット構成の少なくとも1つは符号なしである請求項64に記載のコンピュータによって読取可能な媒体。
  67. 各々が異なるビット構成及び異なる重み付き予測方法を有する複数の符号化方式によって符号化された映像データを復号するために、
    第1のフレームの領域に関連する第1の重みパラメータを選択することと、
    第2のフレームの領域に関連する第2の重みパラメータを選択することと、
    複数の符号化方式に適用可能なユニバーサルな公式におけるビット構成に適合するように前記第1の重みパラメータを修正することと、
    前記ビット構成に適合するように前記第2の重みパラメータを修正することと、
    前記修正された第1の重みパラメータを前記第1のフレームの前記領域に適用することによって第1の予測される成分を計算することと、
    前記修正された第2の重みパラメータを前記第2のフレームの前記領域に適用することによって第2の予測される成分を計算することと、
    前記第1の予測される成分と前記第2の予測される成分を結合させることによって結合された重み付き予測を計算すること、とを具備する方法を実行するように構成された少なくとも1つのプロセッサ。
JP2007511531A 2004-05-04 2005-05-04 予測フレームにおける重み付き予測に関する方法及び装置 Expired - Fee Related JP4659823B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US56815404P 2004-05-04 2004-05-04
PCT/US2005/015449 WO2005109898A1 (en) 2004-05-04 2005-05-04 Method and apparatus for weighted prediction in predictive frames

Publications (2)

Publication Number Publication Date
JP2007536816A JP2007536816A (ja) 2007-12-13
JP4659823B2 true JP4659823B2 (ja) 2011-03-30

Family

ID=34969071

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007511531A Expired - Fee Related JP4659823B2 (ja) 2004-05-04 2005-05-04 予測フレームにおける重み付き予測に関する方法及び装置

Country Status (8)

Country Link
US (1) US8731054B2 (ja)
EP (2) EP2230852A3 (ja)
JP (1) JP4659823B2 (ja)
KR (1) KR100866293B1 (ja)
CN (1) CN1981535B (ja)
CA (1) CA2565669A1 (ja)
TW (1) TW200607353A (ja)
WO (1) WO2005109898A1 (ja)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1843038B (zh) * 2003-08-26 2010-09-22 汤姆森特许公司 用于解码混合内部-相互编码块的方法和装置
US7991053B2 (en) * 2004-05-04 2011-08-02 Qualcomm Incorporated Method and apparatus to enable acquisition of media in streaming applications
US8085846B2 (en) * 2004-08-24 2011-12-27 Thomson Licensing Method and apparatus for decoding hybrid intra-inter coded blocks
CN101980540B (zh) * 2004-11-26 2012-04-25 松下电器产业株式会社 解码电路、解码装置及解码系统
US8457203B2 (en) * 2005-05-26 2013-06-04 Ntt Docomo, Inc. Method and apparatus for coding motion and prediction weighting parameters
US8239766B2 (en) * 2005-09-27 2012-08-07 Qualcomm Incorporated Multimedia coding techniques for transitional effects
KR100873636B1 (ko) 2005-11-14 2008-12-12 삼성전자주식회사 단일 부호화 모드를 이용하는 영상 부호화/복호화 방법 및장치
US7881320B1 (en) * 2005-12-12 2011-02-01 Xilinx, Inc. Parsing data from multiple digital bitstreams
EP1980112B1 (en) * 2006-02-02 2012-10-24 Thomson Licensing Method and apparatus for adaptive weight selection for motion compensated prediction
US8218640B2 (en) * 2006-10-31 2012-07-10 Sony Computer Entertainment Inc. Picture decoding using same-picture reference for pixel reconstruction
US8213518B1 (en) 2006-10-31 2012-07-03 Sony Computer Entertainment Inc. Multi-threaded streaming data decoding
US8218641B2 (en) * 2006-10-31 2012-07-10 Sony Computer Entertainment Inc. Picture encoding using same-picture reference for pixel reconstruction
US8494053B2 (en) * 2007-01-03 2013-07-23 International Business Machines Corporation Method and apparatus of temporal filtering for side information interpolation and extrapolation in Wyner-Ziv video compression systems
US20080260029A1 (en) * 2007-04-17 2008-10-23 Bo Zhang Statistical methods for prediction weights estimation in video coding
KR101366244B1 (ko) * 2007-04-24 2014-02-21 삼성전자주식회사 레지듀얼 데이터를 이용한 영상의 에러 은닉 방법 및 장치
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US8913000B2 (en) * 2007-06-15 2014-12-16 Ricoh Co., Ltd. Video playback on electronic paper displays
US8416197B2 (en) * 2007-06-15 2013-04-09 Ricoh Co., Ltd Pen tracking and low latency display updates on electronic paper displays
US8279232B2 (en) 2007-06-15 2012-10-02 Ricoh Co., Ltd. Full framebuffer for electronic paper displays
US8355018B2 (en) * 2007-06-15 2013-01-15 Ricoh Co., Ltd. Independent pixel waveforms for updating electronic paper displays
US8319766B2 (en) * 2007-06-15 2012-11-27 Ricoh Co., Ltd. Spatially masked update for electronic paper displays
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US8203547B2 (en) * 2007-06-15 2012-06-19 Ricoh Co. Ltd Video playback on electronic paper displays
KR101408698B1 (ko) * 2007-07-31 2014-06-18 삼성전자주식회사 가중치 예측을 이용한 영상 부호화, 복호화 방법 및 장치
US8306366B2 (en) * 2007-08-23 2012-11-06 Samsung Electronics Co., Ltd. Method and apparatus for extracting feature points from digital image
US8605786B2 (en) * 2007-09-04 2013-12-10 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
WO2009034488A2 (en) * 2007-09-10 2009-03-19 Nxp B.V. Method an apparatus for line based vertical motion estimation and compensation
US20090154567A1 (en) 2007-12-13 2009-06-18 Shaw-Min Lei In-loop fidelity enhancement for video compression
EP2154893A1 (en) * 2008-08-13 2010-02-17 Thomson Licensing Method for modifying a reference block of a reference image, method for encoding or decoding a block of an image by help of a reference block and device therefor and storage medium or signal carrying a block encoded by help of a modified reference block
US8325801B2 (en) 2008-08-15 2012-12-04 Mediatek Inc. Adaptive restoration for video coding
US9161057B2 (en) * 2009-07-09 2015-10-13 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
JP2011061320A (ja) * 2009-09-07 2011-03-24 Sony Corp 動き補償装置、符号化装置、復号装置、これらにおける処理方法およびプログラム
CN104618719B (zh) * 2009-10-20 2018-11-09 夏普株式会社 运动图像编码装置、运动图像解码装置、运动图像编码方法及运动图像解码方法
JP2011147049A (ja) * 2010-01-18 2011-07-28 Sony Corp 画像処理装置および方法、並びにプログラム
US8711933B2 (en) * 2010-08-09 2014-04-29 Sony Computer Entertainment Inc. Random access point (RAP) formation using intra refreshing technique in video coding
US9420294B2 (en) 2011-02-23 2016-08-16 Lg Electronics Inc. Intra-prediction method using filtering, and apparatus using the method
MX2013014726A (es) * 2011-06-24 2014-02-27 Ntt Docomo Inc Metodo y aparato para prediccion de compensacion de movimiento.
MX2014000159A (es) 2011-07-02 2014-02-19 Samsung Electronics Co Ltd Metodo y aparato para la codificacion de video, y metodo y aparato para la decodificacion de video acompañada por inter prediccion utilizando imagen co-localizada.
US9948938B2 (en) * 2011-07-21 2018-04-17 Texas Instruments Incorporated Methods and systems for chroma residual data prediction
EP3675497B1 (en) * 2011-10-17 2021-12-29 Kabushiki Kaisha Toshiba Encoding method and decoding method
US10390041B2 (en) * 2012-03-30 2019-08-20 Sun Patent Trust Predictive image coding and decoding using two reference pictures
ES2907510T3 (es) * 2012-05-14 2022-04-25 V Nova Int Ltd Descomposición de datos residuales durante la codificación, decodificación y reconstrucción de señales en una jerarquía escalonada
CN103813174B (zh) * 2012-11-12 2016-04-27 腾讯科技(深圳)有限公司 一种混合分辨率编解码方法和装置
EP3078196B1 (en) * 2013-12-06 2023-04-05 MediaTek Inc. Method and apparatus for motion boundary processing
US10419760B2 (en) 2014-09-29 2019-09-17 Sony Interactive Entertainment Inc. Picture quality oriented rate control for low-latency streaming applications
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
WO2017123487A1 (en) * 2016-01-15 2017-07-20 Vid Scale, Inc. System and method for enhanced motion compensation using adaptive filtering
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
CN106358041B (zh) * 2016-08-30 2019-05-10 北京奇艺世纪科技有限公司 一种帧间预测编码方法及装置
US10904568B2 (en) 2017-03-09 2021-01-26 Kt Corporation Video signal processing method and device for intra prediction of coding or prediction blocks based on sample position based parameters
JP7395580B2 (ja) * 2018-10-24 2023-12-11 ホアウェイ・テクノロジーズ・カンパニー・リミテッド ビデオデコーダおよび方法
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
US10803876B2 (en) 2018-12-21 2020-10-13 Microsoft Technology Licensing, Llc Combined forward and backward extrapolation of lost network data
US10784988B2 (en) * 2018-12-21 2020-09-22 Microsoft Technology Licensing, Llc Conditional forward error correction for network data
US11683501B2 (en) 2019-01-17 2023-06-20 Tencent America LLC Method and apparatus for video coding
CN110365583B (zh) * 2019-07-17 2020-05-22 南京航空航天大学 一种基于桥接域迁移学习的符号预测方法及系统
WO2021061020A1 (en) * 2019-09-23 2021-04-01 Huawei Technologies Co., Ltd. Method and apparatus of weighted prediction for non-rectangular partitioning modes
WO2020251423A2 (en) * 2019-10-07 2020-12-17 Huawei Technologies Co., Ltd. Method and apparatus of harmonizing weighted prediction and bi-prediction with coding-unit-level weight

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0897725A (ja) * 1994-03-24 1996-04-12 Discovision Assoc パイプラインシステム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151075A (en) * 1997-06-11 2000-11-21 Lg Electronics Inc. Device and method for converting frame rate
US6167084A (en) * 1998-08-27 2000-12-26 Motorola, Inc. Dynamic bit allocation for statistical multiplexing of compressed and uncompressed digital video signals
US6944226B1 (en) * 2000-10-03 2005-09-13 Matsushita Electric Corporation Of America System and associated method for transcoding discrete cosine transform coded signals
EP1467569A4 (en) 2002-01-18 2007-11-14 Toshiba Kk METHOD AND APPARATUS FOR ENCODING IMAGES IN MOTION, DECODING METHOD AND APPARATUS
US7469012B2 (en) 2002-05-14 2008-12-23 Broadcom Corporation System and method for transcoding entropy-coded bitstreams
US7376186B2 (en) * 2002-07-15 2008-05-20 Thomson Licensing Motion estimation with weighting prediction
PT2320659E (pt) 2002-08-08 2014-11-13 Panasonic Ip Corp America Método de codificação e método de descodificação de imagens em movimento
KR101011121B1 (ko) * 2002-10-01 2011-01-25 파나소닉 주식회사 화상 복호화 장치 및 그 방법
CN1190755C (zh) * 2002-11-08 2005-02-23 北京工业大学 基于感知器的彩色图像无损压缩方法
KR100604032B1 (ko) * 2003-01-08 2006-07-24 엘지전자 주식회사 복수 코덱을 지원하는 장치와 방법
US7327786B2 (en) * 2003-06-02 2008-02-05 Lsi Logic Corporation Method for improving rate-distortion performance of a video compression system through parallel coefficient cancellation in the transform

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0897725A (ja) * 1994-03-24 1996-04-12 Discovision Assoc パイプラインシステム

Also Published As

Publication number Publication date
CA2565669A1 (en) 2005-11-17
EP1747679A1 (en) 2007-01-31
KR100866293B1 (ko) 2008-10-31
CN1981535A (zh) 2007-06-13
EP2230852A2 (en) 2010-09-22
EP2230852A3 (en) 2011-12-28
CN1981535B (zh) 2012-05-30
WO2005109898A1 (en) 2005-11-17
US8731054B2 (en) 2014-05-20
US20050281334A1 (en) 2005-12-22
JP2007536816A (ja) 2007-12-13
KR20070036059A (ko) 2007-04-02
TW200607353A (en) 2006-02-16

Similar Documents

Publication Publication Date Title
JP4659823B2 (ja) 予測フレームにおける重み付き予測に関する方法及び装置
JP5280531B2 (ja) フィルタ選択によるビデオ符号化
US8073048B2 (en) Method and apparatus for minimizing number of reference pictures used for inter-coding
KR101197506B1 (ko) 비디오 유닛 내의 경계 아티팩트 정정
US7426308B2 (en) Intraframe and interframe interlace coding and decoding
KR101024231B1 (ko) 비디오 압축에서의 강화된 프레임 보간의 장치 및 방법
JP5497169B2 (ja) ビデオコーディングにおける単方向予測および双方向予測のための異なる重み付け
KR101365575B1 (ko) 인터 예측 부호화, 복호화 방법 및 장치
KR101377883B1 (ko) 비디오 인코딩에서 넌-제로 라운딩 및 예측 모드 선택 기법들
JP5061179B2 (ja) 照明変化補償動き予測符号化および復号化方法とその装置
US20110176614A1 (en) Image processing device and method, and program
US20060268166A1 (en) Method and apparatus for coding motion and prediction weighting parameters
KR100694137B1 (ko) 동영상 부호화 장치, 동영상 복호화 장치, 및 그 방법과,이를 구현하기 위한 프로그램이 기록된 기록 매체
US9392280B1 (en) Apparatus and method for using an alternate reference frame to decode a video frame
JP2009531980A (ja) デジタルビデオエンコーダの内部予測及びモード決定処理の計算を低減する方法
JP2004048552A (ja) 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置
JP2004518342A (ja) スケーラブルビデオトランスコーディング方法及び装置
WO2011121894A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
US20070133689A1 (en) Low-cost motion estimation apparatus and method thereof
JP2006100871A (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
US20160156905A1 (en) Method and system for determining intra mode decision in h.264 video coding
KR100757832B1 (ko) 1/4픽셀 움직임 벡터를 이용한 동영상 압축방법
KR20070063479A (ko) 1/4픽셀 움직임 벡터를 이용한 동영상 압축방법
JP2006340014A (ja) 低複雑度動き補償型時間方向フィルタ処理方法ならびに装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100825

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100901

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100921

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101130

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101227

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees