JP5524423B2 - 効率的なサンプル適応オフセットの装置及び方法 - Google Patents

効率的なサンプル適応オフセットの装置及び方法 Download PDF

Info

Publication number
JP5524423B2
JP5524423B2 JP2013535259A JP2013535259A JP5524423B2 JP 5524423 B2 JP5524423 B2 JP 5524423B2 JP 2013535259 A JP2013535259 A JP 2013535259A JP 2013535259 A JP2013535259 A JP 2013535259A JP 5524423 B2 JP5524423 B2 JP 5524423B2
Authority
JP
Japan
Prior art keywords
video data
distortion
sao
current pixel
processed video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013535259A
Other languages
English (en)
Other versions
JP2013541918A (ja
Inventor
フ,チー−ミン
チェン,チン−イー
ツァイ,チア−ヤン
ホアン,ユ−ウェン
レイ,シャウ−ミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US12/987,151 external-priority patent/US8660174B2/en
Priority claimed from US13/158,427 external-priority patent/US9055305B2/en
Priority claimed from US13/177,424 external-priority patent/US9161041B2/en
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of JP2013541918A publication Critical patent/JP2013541918A/ja
Application granted granted Critical
Publication of JP5524423B2 publication Critical patent/JP5524423B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオ処理に関する。特に、本発明は、サンプル適応オフセット補償の装置及び方法に関する。
ビデオ符号化システムでは、ビデオデータは、予測、変換、量子化、デブロッキング及び適応ループフィルタリングのような種々の処理を受ける。ビデオ符号化システムの処理経路に沿って、処理済みビデオデータの特定の特性は、ビデオデータに適用される操作により、元のビデオデータから変更され得る。例えば、処理済みビデオの平均値がシフトされ得る。強度シフトは、視覚的欠陥又はアーティファクトを生じ得る。これは、強度シフトがピクチャ毎に異なる場合に特に一層目立つ。したがって、ピクセル強度シフトは、アーティファクトを軽減するために、注意深く補償されるか修復されなければならない。幾つかの強度オフセットスキームが当分野で用いられている。HEVC(High-Efficiency Video Coding)のために提案された強度オフセットスキームは、処理済みビデオデータ内の各ピクセルを、選択されたコンテキストに従って複数のカテゴリのうちの1つに分類する。例えば、コンテキストは、処理済みビデオデータのピクセル強度であっても良い。或いは、コンテキストは、現在のピクセルとその周囲のピクセルとの組合せであっても良い。適応オフセットがどこに適用されるかに依存して、処理済みビデオデータは、再構成ビデオ、デブロックビデオ、適応ループフィルタリングされたビデオ、又は中間段階の他のビデオを表し得る。特性測定は、選択されたコンテキストに従って導出され、カテゴリは、測定された特性に従って決定される。カテゴリ毎に、元のピクセルと処理済みピクセルとの間の強度シフトが決定される。強度シフトは、本願明細書では「オフセット値」とも称される。したがって、オフセット値は、強度シフトを補償するために、カテゴリに属する処理済みピクセルに適用される。各ピクセルのカテゴリに基づく処理済みビデオデータに対する強度シフト補償又は修復の処理は、本願明細書では「サンプル適応オフセット(Sample Adaptive Offset:SAO)」と称される。
従来のSAOスキームは、ピクチャ毎又はスライス毎にピクセルのカテゴリを決定する場合が多い。しかしながら、ピクチャコンテンツは、動的である場合が多く、特性は1つのピクチャ内の領域によって変化し得る。それに応じて、サンプル適応オフセットスキームは、米国非仮特許出願番号13/158,427、名称「Apparatus and Method of Sample Adaptive Offset for Video Coding」、2011年6月12日出願に開示されている。この出願では、SAOタイプのグループが、領域内のピクセルを分類するために用いられ、各SAOタイプは、ピクセルを複数のカテゴリに分類する。幾つかのSAOタイプは、エッジオフセットに基づく分類に関連付けられる。ここで、現在のピクセルの分類は、近隣ピクセルを必要とする。複数のSAOタイプがあるので、エンコーダは、通常、オフセットを求め、オフセットをピクセルに加算し、そして1つのSAOタイプを有する各領域に対して歪みを計算する。したがって、SAOのモード決定処理は、ピクチャバッファに何回もアクセスする必要がある。このマルチパス符号化アルゴリズムは、多くの外部メモリアクセスを必要とし、結果として高い電力消費及び長い待ち時間をもたらし得る。追加ピクチャバッファアクセスを有しないでSAOのモード決定を実行することが望ましい。したがって、全てのSAOパラメータが導出された後、1つの追加パスのみがオフセット補償を実行するために必要なだけである。
SAO処理は、ピクチャの局所特性に適応するために、領域毎に行われることが望ましい。RDO(Rate-distortion optimization)は、モード決定(つまり、領域分割/領域マージ決定)を導くために用いられる場合が多い。RDO処理に関連する計算は、通常、非常に計算負荷が大きい。RDO処理を高速化する高速アルゴリズムを用いることが望ましい。
レート歪最適化(Rate-Distortion Optimization:RDO)を用いた処理済みビデオデータのサンプル適応オフセット(Sample Adaptive Offset:SAO)補償のためのモード決定の装置及び方法が開示される。本発明による方法は、前記処理済みビデオデータを受信するステップ、SAOモードを識別するステップ、歪み削減量の推定に従って前記モードの各々と関連付けられた歪みを決定するステップ、前記モードの各々の歪みに基づきレート歪み(Rate-Distortion:RD)コストを決定するステップ、前記モードの中から最適モードを選択するステップであって、前記最適モードは、最小RDコストを有する、ステップ、選択された前記最適モードに従って前記処理済みビデオデータにSAOを適用するステップ、を有する。前記歪み削減量の推定は、前記モードの各々のピクセル数(iCount)、前記モードの各々に属するピクセルに加算されるべきオフセット値(iOffset)、及び前記処理済みビデオデータに関連付けられた再構成信号と元の信号との間のオフセット値の和(iOffsetOrg)に関連する。さらに、前記歪み削減量の推定は、(iCount*iOffset*iOffset)-(iOffsetOrg*iOffset*2)に関連する。本発明の別の態様は、SAO領域分割又は領域マージのための高速アルゴリズムを扱い、該高速アルゴリズムでは、小さい領域の前記歪み削減量は、個々の大きい領域の歪み削減量を計算するために再利用される。
処理済みビデオデータのサンプル適応オフセット(Sample Adaptive Offset:SAO)補償の装置及び方法が開示される。本発明による方法は、処理済みビデオデータを受信するステップ、分類に基づくエッジオフセット(EO)に従って前記処理済みビデオデータの現在のピクセルのカテゴリを決定するステップであって、前記EOに基づく分類は、前記現在のピクセルと1又は複数の近隣ピクセルとに関連する、ステップ、補償された現在のピクセルを生成するために、前記カテゴリに関連付けられたオフセット値を用いて前記現在のピクセルを補償するステップ、前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係を格納するステップ、前記現在のピクセルのカテゴリを決定した後に、実質的に少数のピクセル期間内に、前記現在のピクセルを前記補償された現在のピクセルで置換するステップ、を有する。必要な計算を更に削減するため、前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係の少なくとも一部は、別のピクセルのカテゴリを決定するために用いられる。前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係はsign関数に基づき、前記現在のピクセルのgateゴリを決定するためにルックアップテーブルが用いられる。
デブロッキングフィルタと適応ループフィルタを有する再構成ループを備えた例示的なビデオエンコーダのシステムブロック図を示す。 デブロッキングフィルタと適応ループフィルタを有する例示的なビデオデコーダのシステムブロック図を示す。 ピクセルカテゴリに基づく適応オフセットの例を示し、ここで、カテゴリはピクセルC及びその近隣ピクセルn1−n4に従って決定される。 ビデオエンコーダの例示的なシステムブロック図を示し、ここで、サンプル適応オフセットはデブロッキングフィルタ後のビデオデータに適用される。 ビデオエンコーダの例示的なシステムブロック図を示し、ここで、サンプル適応オフセットは再構成後のビデオデータに適用される。 バンドオフセット(BO)に基づく2つのSAOタイプの例を示し、ここで、第1の種類は中央バンドを有し、第2のタイプはサイドバンドを有する。 ピクセルカテゴリの決定のための現在のピクセルとその近隣ピクセルの4つの線形構成を示す。 ビデオエンコーダのシステムブロック図を示し、ここで、サンプル適応オフセットは逆変換後のビデオデータに適用される。 ビデオエンコーダの例示的なシステムブロック図を示し、ここで、サンプル適応オフセットは予測信号に適用される。 ビデオエンコーダの例示的なシステムブロック図を示し、ここで、サンプル適応オフセットは逆量子化信号に適用される。 再帰的領域区分の例を示し、ここで、SAOタイプは領域毎に選択される。 1つの領域を水平及び垂直に略同数のLCUを有する4つのサブ領域に分割することによる、再帰的領域区分の例を示す。 分類の基づくエッジオフセット(EO)のための、前のピクセルからの部分的結果の再使用の例を示す。 サンプル適応オフセットのための領域分割/領域マージの例を示す。
ビデオ符号化システムでは、ビデオデータは、予測、変換、量子化、デブロッキング及び適応ループフィルタリングのような種々の処理を受ける。ビデオ符号化システムの処理経路に沿って、処理されたビデオデータの特定の特性は、ビデオデータに適用される操作により、元のビデオデータから変更され得る。例えば、処理されたビデオの平均値がシフトされ得る。強度シフトは、視覚的欠陥又はアーティファクトを生じ得る。これは、強度シフトがピクチャ毎に異なる場合に特に一層目立つ。したがって、ピクセル強度シフトは、アーティファクトを軽減するために、注意深く補償されるか修復されなければならない。処理済みビデオデータの特定の特性を変更させ得る種々の理由がある。処理済みビデオデータの特性の変化は、本質的に適用される操作に関連し得る。例えば、低域通過フィルタがビデオデータに適用されるとき、はっきりしたエッジに対応するピクセル値は少ない勾配を有するだろう。エッジの片側のピクセル値は増大し、エッジの他方の側のピクセル値は減少し得る。この例では、サンプル適応オフセットがエッジ特性を考慮できれば、ビデオ品質は向上し得る。オリジナルのHEVC(High-Efficiency Video Coding)に提案された適応オフセットスキームは、処理済みビデオデータ内の各ピクセルを、選択されたコンテキストに従って複数のカテゴリのうちの1つに分類する。例えば、コンテキストは、処理されるビデオデータのピクセル強度であっても良い。或いは、コンテキストは、現在のピクセルとその周囲のピクセルとの組合せであっても良い。適応オフセットがどこに適用されるかに依存して、処理済みビデオデータは、再構成ビデオ、デブロックビデオ、適応ループフィルタリングされたビデオ、又は中間段階の他のビデオを表し得る。特性測定は、選択されたコンテキストに従って導出され、カテゴリは、測定された特性に従って決定される。カテゴリ毎に、元のピクセルと処理済みピクセルとの間の強度シフトが決定される。強度シフトは、本願明細書では「オフセット値」とも称される。したがって、オフセット値は、強度シフトを補償するために、カテゴリに属する処理済みピクセルに適用される。各ピクセルのカテゴリに基づく処理済みビデオデータに対する強度シフト補償又は修復の処理は、本願明細書では「サンプル適応オフセット(Sample Adaptive Offset:SAO)」と称される。
従来のSAOスキームは、ピクチャ毎又はスライス毎にピクセルのカテゴリを決定する場合が多い。しかしながら、ピクチャコンテンツは、動的である場合が多く、特性は1つのフレーム内の領域によって変化し得る。したがって、処理済みビデオデータを異なるサイズを有する領域に適応して区分する領域区分スキームを用いてピクチャ内の動的特性を考慮可能なサンプル適応オフセットスキームを開発することが望ましい。さらに、従来のSAOスキームは、常に固定したコンテキストを用いて処理済みビデオデータのピクセルのカテゴリを決定する。例えば、SAOは、サンプル適応オフセットに固定した16バンドのバンドオフセット(BO)のみを用いる。別の例では、SAOは、3x3ウインドウ内のピクセルのみをコンテキストとして用いて処理済みビデオデータのピクセルのカテゴリを決定する。サンプル適応オフセットスキームは、SAOタイプのグループからSAOタイプを適応して選択し、SAO処理を処理済みビデオデータの特性に合わせ、良好な品質を達成することが望ましい。したがって、本願明細書では、処理済みビデオデータの動的特性を活用できるサンプル適応オフセットスキームが開示される。
図1に示す例示的なエンコーダは、イントラ/インター予測を用いるシステムを表す。イントラ予測110は、同一ピクチャ内のビデオデータに基づき予測データを提供する。インター予測では、動き推定(ME)及び動き補償(MC)112が用いられ、1又は複数の他のピクチャからのビデオデータに基づき予測データを提供する。スイッチ114は、イントラ予測又はインター予測データを選択する。選択された予測データは、加算器116に供給され、残差とも称される予測誤差を形成する。次に、予測誤差は、変換(T)118により、その次に量子化(Q)120により処理される。次に、変換され量子化された残差は、エントロピー符号化112により符号化され、圧縮ビデオデータに対応するビットストリームを形成する。変換係数に関連するビットストリームは、次に、動き、モード及び画像領域に関連する他の情報のようなサイド情報と共にパッキングされる。サイド情報も、必要帯域幅を減少させるためにエントロピー符号化を受けて良い。したがって、サイド情報に関連するデータは、図1に示すように、エントロピー符号化122に提供される。インター予測モードが用いられるとき、1又は複数の参照ピクチャは、エンコーダ端で再構成されなければならない。したがって、変換され量子化された残差は、逆量子化(IQ)124及び逆変換(IT)126により処理され、残差を復元させる。次に、残差は、再構成(REC)128において予測データ136に再び加算され、ビデオデータを再構成する。再構成ビデオデータは、参照ピクチャバッファ134に格納され、他のピクチャの予測のために用いられても良い。再構成ビデオデータが参照ピクチャバッファに格納される前に、ビデオ品質を向上させるために、デブロッキングフィルタ130及び適応ループフィルタ132が、再構成ビデオデータに適用される。適応ループフィルタ情報はビットストリーム内で送信され、デコーダが適応ループフィルタを適用するために必要な情報を正しく回復できるようにしても良い。したがって、ALF132からの適応ループフィルタ情報は、ビットストリームへの結合のためにエントロピー符号化122に提供される。図1に示すように、入力ビデオデータは、符号化システム内で一連の処理を受ける。REC128からの再構成ビデオデータは、この一連の処理による強度シフトを受け得る。再構成ビデオデータは、デブロッキング130及び適応ループフィルタ132により更に処理される。これは、更なる強度シフトを生じ得る。したがって、サンプル適応オフセットを組み込み、強度シフトを修復又は補償することが望ましい。
図2は、デブロッキングフィルタと適応ループフィルタを有する例示的なビデオデコーダのシステムブロック図を示す。エンコーダは、ビデオデータを再構成するためにローカルデコーダも有するので、幾つかのデコーダ構成要素は、エントロピー復号化222を除いてエンコーダで既に用いられている。さらに、動き補償212のみがデコーダ側で必要である。スイッチ214は、イントラ予測又はインター予測データを選択する。選択された予測データは、再構成(REC)128に供給され、復元された残差と結合される。圧縮ビデオデータにエントロピー復号化を実行するのに加え、エントロピー復号化222は、サイド情報のエントロピー復号化も担い、サイド情報を個々のブロックに提供する。例えば、イントラモード情報はイントラ予測110に供給され、インターモード情報は動き補償212に供給され、適応ループフィルタ情報はALF132に供給され、残差は逆量子化124に供給される。残差は、IQ124、IT126及び後続の再構成処理により処理され、ビデオデータを再構成する。また、図2に示すように、REC128からの再構成ビデオデータは、IQ124及びIT126を含む一連の処理を受け、強度シフトを受ける。再構成ビデオデータは、デブロッキングフィルタ130及び適応ループフィルタ132により更に処理される。これは、更なる強度シフトを生じ得る。したがって、サンプル適応オフセットを組み込み、強度シフトを補償することが望ましい。
オフセット問題を克服するために、McCann等は、「Samsung’s Response to the Call for Proposals on Video Compression Technology」、文献JCTVC-A124, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 1st Meeting: Dresden, DE, 15-23 April, 2010で、コンテンツ適応型の極端な補正及びバンド補正を開示している。近隣ピクセルに基づくコンテンツ情報の使用は、局所的なエッジ特性を探索でき、良好な視覚的品質又はビットレートの低減の点で性能を向上させ得る。McCann等は、図3に示すような近隣ピクセル構成を開示している。ここで、Cは現在のピクセル値であり、n1−n4はそれぞれ現在のピクセルの上、左、右及び下側の4つの近隣ピクセルである。McCann等によるピクセルを7個のカテゴリに分類する方法を表1に示す。
Figure 0005524423
カテゴリ0では、ピクセルCが極小であり、谷とも称される。カテゴリ5では、ピクセルCが極小であり、谷とも称される。カテゴリ1、2、3、4では、ピクセルCはオブジェクトエッジにある。各カテゴリのピクセルについて、処理済みビデオデータの平均と元のビデオデータの平均との間の差が計算され、デコーダに送信される。処理済みビデオデータは、REC128からの再構成ビデオデータ、DF130からのデブロッキングされたデータ、又はALF132からの適応ループフィルタリングされたデータであり得る。McCann等は、エッジ特性を「カテゴリ」に分類する。カテゴリは、「クラス」とも称される。図1及び2はビデオ符号化のためのサンプル適応オフセットが適用できる例示的なシステムを示すが、他のシステムも、強度シフト問題を克服するために本発明を用いることができる。例えば、カメラ画像処理システムでは、モザイク解除、ホワイトバランス、及び/又はエッジ強調により処理されたビデオデータも、強度シフトを受け得る。上述のように、McCann等は、第1の強度オフセットを適用して、基礎的ピクセルのエッジ特性に従ってDF130とALF132との間の処理済みデータを修復する。基礎的ピクセルのエッジ特性に基づく適応オフセットは、McCann等により極端な補正(Extreme Correction:EXC)と命名された。
McCann等によると、上述の極端な補正は、再構成ビデオデータに適用される。クラスcに対応する再構成平均強度値Vr(c)及びクラスcに対応する元の平均強度値Vo(c)は、ビデオピクチャに対して決定される。クラスcに対応するオフセットVd(c)は、次式に従って決定できる。
Vd(c)=Vo(c)-Vr(c)
上述のように計算されたオフセットVd(c)は、クラスcに属する再構成ビデオデータに加算される。つまり次式の通りである。
Vr’(c)=Vr(c)+Vd(c)
ここで、Vr’(c)は、オフセット補正されたビデオデータである。デコーダが個々のクラスに適正なオフセットを適用するために、全てのクラスのオフセットVd(c)の値がデコーダへ送信される必要がある。オフセットVd(c)値を組み込むために、適正なビットストリームシンタックスが必要である。
図4に示すように、McCann等によるEXCに基づく適応オフセット410は、DF130とALF132との間のビデオデータに適用される。McCann等は、基礎的なピクセルが属するバンドに従う別の適応オフセット補正を開示している。この方法は、バンド補正(band correction:BDC)とも称される。McCann等によると、バンドに基づく分類の主な動機は、再構成ビデオデータ及び元のビデオデータに対応する基礎的なデータの2つの異なる確率密度関数(PDF)を等しくすることである。McCann等は、ピクセルのp個の最上位ビットを用いることによるバンドに基づく分類を開示している。これは、強度を、均一な間隔を有する2個のクラスに分割することと等価である。ある実装では、McCann等は、p=4を選択し、強度を16個の等しい間隔のバンドに分割した。バンドはクラスとも称される。各バンド又はクラスでは、平均差が計算され、デコーダへ送信される。そして、オフセットがバンド毎に個々に補正され得る。バンドc又はクラスcに対応する再構成平均強度値Vr(c)、及びバンドc又はクラスcに対応する元の平均強度値Vo(c)は、ビデオピクチャに対して決定される。便宜上、EXCでは同一の数学的記号Vr(c)及びVo(c)が用いられている。エッジ特性に基づく適応オフセット補正は、対応するクラスcに関連するオフセットVd(c)は、次式に従って決定できる。Vd(c)=Vo(c)-Vr(c)上述のように計算されたオフセットVd(c)は、次に、クラスcに属する再構成ビデオデータに加算される。つまり次式の通りである。
Vr’(c)=Vr(c)+Vd(c)
ここで、Vr’(c)は、オフセット補正されたビデオデータである。McCann等は、バンド補正を、ALF132と参照ピクチャバッファ134(図示しない)との間の処理済みビデオデータに適用する。McCann等は、DF130とALF132との間、又はALF132と参照ピクチャバッファ134との間にAOを適用するが、図5に示すように、AO510は、REC128とDF130との間に適用されても良い。
バンド分類のための16個の均一なバンドに加えて、ゼロでない可能性を増大させるために、バンド分類のための32個の均一なバンドが、CE8 Subset3: Picture Quadtree Adaptive Offset、文献:JCTVC-D122, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 4th Meeting: Daegu, KR, 20-28 January, 2011、CE13: Sample Adaptive Offset with LCU-Independent Decoding、文献:JCTVC-E049, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 andI SO/IEC JTC1/SC29/WG11, 5th Meeting: Geneva, CH, 16-23 March, 2011、及び米国非仮特許出願番号12/987,151、名称「Apparatus and Method of Adaptive Offset for Video Coding、2011年1月9日出願に開示されている。(32オフセットから16に)サイド情報を減少させるために、図6に示すように、32個の均一なバンドは、2つのグループに分割される。中央の16個のバンドはグループ1に割り当てられ、両側の16個のバンドはグループ2に割り当てられる。したがって、オフセットの1つの集合は、中央の16個のバンド(グループ1)のために送られ、オフセットの1つの集合は、外側の16個のバンド(グループ2)のために送られる。
McCann等は、基礎的なピクセルのエッジ特性に関する適応処理を開示している。ピクセル分類はピクチャ全体に基づく。適応オフセットに基づく代替エッジは、係属中の米国特許出願番号12/987,151、名称「Apparatus and Method of Adaptive Offset for Video Coding」、2011年1月9日出願に開示されている。該特許出願では、2個の近隣ピクセルを用いる簡略化された線形ピクセル構成が用いられる。簡略化されたピクセル構成の使用は、必要な計算を減少させる。したがって、図7(A)―(D)に示すような、ピクセルパターンとも称される4個の簡略化されたピクセル構成が開示される。図7(A)―(D)は、それぞれ垂直線(90度)、水平線(0度)、135度線、45度線に対応する。短い線のように配置された各ピクセル構成は、その線に沿った強度遷移に応答する。例えば、水平エッジは、他の方向を有する線よりも、垂直線においてより目立ち易い強度遷移を生じる。同様に、垂直エッジは、他の方向を有する線よりも、水平線においてより目立ち易い強度遷移を生じる。ピクセル構成の選択は領域毎に決定でき、各領域にフラグが必要である。ピクセル構成に基づき、基礎的なピクセルは、表2に示すようにエッジ、ピーク、谷、それ以外に対応する6個のクラスに分類される。
Figure 0005524423
上述のSAOスキームはバンドオフセット(BO)コンテキスト又はエッジオフセット(EO)コンテキストを用いてピクセルをカテゴリに分類するが、本発明による実施形態は複数のSAOタイプを用いる。例えば、複数のSAOタイプは、BOコンテキスト及びEOコンテキストの両方を含んでも良い。各SAOタイプは、割り当てられた数のカテゴリを有する。例えば、上述の例では、16個のカテゴリ(つまり、16個のバンド)がグループ1BO及びグループ2BOに関連付けられる。6個のカテゴリは、4個のEO構成又はコンテキストの各々に関連付けられる。上述の例で言及したカテゴリの数は、説明を目的とし、本発明を限定するものと見なされるべきではない。本発明によるSAOタイプの総数は、予め定められるか又はユーザにより定められ得る。さらに、各SAOタイプのカテゴリの数は、予め定められるか、ユーザにより定められるか、又は画像サイズに依存し得る。複数のSAOタイプが用いられるとき、シンタックスの要素sao_type_idxは、選択されたSAOタイプを識別するために用いられても良い。表3は、BOコンテキスト及びEOコンテキストの両方を含む複数のSAOタイプの例を示す。
Figure 0005524423
サンプル適応オフセットは、ビデオ信号を修復するために、常に再構成後のビデオ信号に適用されるが、サンプル適応オフセットは、再構成前のビデオ信号に適用されても良い。例えば、図8に示すように、サンプル適応オフセット810は、再構成(REC)128の前の逆変換された残差に適用されても良い。逆変換(IT)126の出力における回復された残差信号は、変換118、量子化120、逆量子化124及び逆変換126により処理されている。したがって、残差信号は強度シフトを受けている可能性がある。強度シフトを修復するために適応オフセットが有用である。適応オフセットに関連するサイド情報は、エントロピー符号化され、ビットストリーム内に組み込まれる。別の例では、図9に示すように、サンプル適応オフセットは、予測子が元のビデオ信号から減算される前に、イントラ/インター予測子に適用される。イントラ又はインター予測に従って導出された予測子は、強度シフトを生じ得る種々の操作を受ける。したがって、強度シフトを修復するためにサンプル適応オフセットが有用である。更に別の例では、図10に示すように、サンプル適応オフセット1010は、逆量子化124と逆変換126との間のビデオ信号に適用されても良い。
McCann等による方法では、AOは、常にピクチャ全体又はピクチャのグループに基づく。特定のビデオデータでは、小さいピクチャエリアに対応する領域は、適応型処理では一層有利である。なぜなら、小さいピクチャエリアに関連付けられたカテゴリは、領域内の基礎的なビデオデータを厳密に特徴付けることができるからである。したがって、本発明では、複数レベルの領域区分が用いられる。各領域は、四分木を用いて4個のサブ領域に再帰的に分割できる。領域区分に関する情報は、シンタックスを用いて伝達できる。領域の境界は、符号化単位(coding unit:CU)に又は最大符号化単位(largest coding unit:LCU)に揃えることができる。上記の表に示したように、各領域は、2種類のバンドオフセット(BO)、4種類のエッジオフセット(EO)、及び処理されない(OFF)のようなサンプル適応オフセット(SAO)タイプのうちの1つを選択できる。図11は、領域に区分されたピクチャの例を示す。各領域はBO、EO又はOFFタイプを用いてSAOにより処理される。図11において、各小ブロックはLCUを表す。
SAOの領域区分は、ブロックに基づく。四分木区分における深さの数は、ブロックサイズに依存する。領域の幅又は領域の高さがブロックサイズより小さい場合、現在の領域の分割処理は終了する。最大の四分木深さは、ユーザにより定められた深さ、所定の深さ、又は画像サイズであり得る。ブロックサイズは、LCUサイズより小さい、それに等しい、又はそれより大きくても良い。図12は、LCUの位置に合わせられた領域区分の例を示す。領域はLCUサイズにより測定される。WidthInLCUは現在の領域の幅に対するLCUの数である。HeightInLCUは現在の領域の高さに対するLCUの数である。水平方向の区分は、WidthInLCUを幅Floor(WidthInLCU/2)及びWidthInLCU-Floor(WidthInLCU/2)を有する2個のサブ領域に分割する。ここでFloor(x)はフロア関数である。同様に、垂直方向の区分は、HeightInLCUを幅Floor(HeightInLCU/2)及びHeightInLCU-Floor(HeightInLCU/2)を有する2個のサブ領域に分割する。
1−Dエッジオフセット(EO)分類は、2−Dエッジオフセット(EO)分類よりも計算効率が良い。しかしながら、表2に記載した1−DEO分類アルゴリズムは、依然としてかなりの数の操作を必要とする。計算効率を更に向上させることが望ましい。したがって、本発明の一態様は、EOに基づく分類のための高速アルゴリズムを開示する。高速アルゴリズムは、現在のピクセルを2個の近隣ピクセルと比較する。比較の結果は、カテゴリを決定するためにルックアップテーブルに供給される。比較は、sign()関数として実施できる。例えば、図13に、0度EO1310の現在のピクセルCと2個の近隣ピクセルB及びDを示す。sign操作が(C−B)及び(C−D)に対して実行される。つまり、sign(C-B)及びsign(C-D)が実行され、ここで次式の通りである。
Figure 0005524423
ルックアップテーブル、つまりedge_tableを用いて、比較結果をカテゴリインデックスに変換できる。ここで、edge_table[x]={1,2,0,3,4}である。したがって、1−D EO分類のカテゴリ(Category)は、次式により得られる。
Category=edge_table[2+sign(C-B)+sign(C-D)]
th値が零のとき、ピクセル分類は表2と全く同じである。CとDの比較は、ピクセルCについて計算される。図13に示すように、DとCの比較は、1−D EO1320のピクセルDについて計算される。CとDの比較は、DとCの比較のために再利用されても良い。つまり、sign(D-C)=-sign(C-D)であり、これは幾つかの操作を省くことができる。sign()関数が現在のピクセルとその近隣ピクセルとの間の関係を決定する手段として用いられるが、他の計測も用いられても良い。0度1−D EOを一例として示したが、同じ高速アルゴリズムが45度、90度及び135度EOに適用できる。
本発明の別の態様は、SAO決定のための簡易レート歪最適化(rate-distortion optimization:RDO)に関する。RDO(rate-distortion optimization)は、良好な符号化効率を得るためにビデオ符号化で用いられる広く知られた技術である。RDOは、領域区分及び領域マージのようなSAOの決定に適用できる。例えば、図14は、SAOのための領域分割/領域マージの例を示す。種々の領域区分の中で最適なRD性能を達成するために、ピクチャ又は領域のようなピクチャエリアは、最大ピクチャエリアから首尾良く分割されても良い(トップダウン分割)。或いは、小さいピクチャ領域が、RDO技術を用いて、より大きい領域に首尾良くマージされても良い(ボトムアップマージ)。図14は、3レベルのピクチャ構造を示す。ここで、J0乃至J20は、個々の領域に関連するR−Dコストである。トップダウン分割法では、各領域に関連するコストは、対応する分割領域のコストと比較される。例えば、コストJ3は、コスト(J13+J14+J17+J18)と比較される。J3>(J13+J14+J17+J18)の場合、J3と関連付けられた領域が分割される。その他の場合、この領域は分割されない。同様に、J0>(J1+J2+J3+J3)の場合、J0と関連付けられた領域が分割される。その他の場合、この領域は分割されない。領域マージの処理は、個々の領域に関連付けられたコストとマージされた領域に関連付けられるコストを比較することにより同様に行うことができる。
RDO処理は、非常に計算負荷が大きい。RDO処理を高速化する手段を開発することが望ましい。例えば、領域分割及び領域マージにおいて、より大きい領域に関連付けられた統計値(つまり、レート及び/又は歪み)は、対応するより小さい領域から導出できる。さらに、SAOでは、1つのピクチャ内に複数の領域が存在し、領域毎にテストされるべき複数のSAOタイプが存在する。1つのSAOタイプを有する1つの領域が与えられる場合、エンコーダは、通常、オフセットを求め、オフセットをピクセルに加算し、そして歪みを計算する。したがって、SAOのモード決定処理は、ピクチャバッファに何回もアクセスする必要がある。このマルチパス符号化アルゴリズムは、多くの外部メモリアクセスを必要とし、結果として高い電力消費及び長い待ち時間をもたらし得る。追加ピクチャバッファアクセスを有しないでSAOのモード決定を実行することが望ましい。したがって、全てのSAOパラメータが導出された後、1つの追加パスのみがオフセット補償を実行するために必要なだけである。したがって、実際のレート及び/又は歪みの値を計算する代わりに、これらの値は推定され得る。例えば、SAOの歪みは次のように推定できる。
s(k)は、元の信号である。
x(k)は、再構成信号であり、デブロッキングされた信号であり得る。
εrec(k)は、再構成信号の推定歪みである。
εAO(k)は、SAO信号の推定歪みである。
Kは、フィルタにより処理されるべきピクセルのセットである。
Cは、1つの種類のAOカテゴリに属するピクセルのセットである。
Pは、SAOカテゴリのセットである。また、Pは、全てのSAOカテゴリの集合体である。
は、加算されるべきオフセット値である。
SAO信号の歪み削減量は、εSAO(k)−εrec(k)である。これは、それぞれSAOにより処理された信号及び再構成信号に対応する平均二乗誤差の差を表す。
εrec=再構成信号と元の信号との間の平均二乗誤差
Figure 0005524423
εSAO=オフセット信号と元の信号との間の平均二乗誤差
Figure 0005524423
dεSAO=εSAO−εrec=SAOが適用された後のオフセット信号の歪み削減量
Figure 0005524423
ここで、Nは現在のカテゴリのピクセルの数である。
csは、カテゴリkに属するピクセルに加算されるべきオフセット値である。
は、元の信号と再構成信号との間のオフセット値の和である。
上述の導出によると、SAOが適用された後のオフセット信号の歪み削減量dεSAOは、次式により推定できる。
Figure 0005524423
式(1)によると、SAOが適用された後のオフセット信号の歪み削減量dεSAOは、現在のカテゴリのピクセルの数、カテゴリkに属するピクセルに加算されるべきオフセット値、及び元の信号と再構成信号との間のオフセット値の和に基づき推定できる。RDO処理のコスト関数で用いられる歪みは、SAO処理された信号と元の信号との間で導出される。種々のSAOモードが、最適モードを選択するためにRDOに対して評価される。ここで、SAO処理が同じ再構成信号に適用される。したがって、歪み削減量dεSAOは、オフセット信号と元の信号との間の平均二乗誤差εSAOを置換するために用いることができる。式(1)に示すように、歪み削減量dεSAOの計算は、高速アルゴリズムを用いて推定できる。一方で、元の歪み削減量又はオフセット信号と元の信号との間の元の歪みに基づく導出は、元の信号の自己相関、再構成信号の自己相関、元の信号と再構成信号との間の相互相関の計算を含むだろう。したがって、歪み削減量の推定は、必要な計算及びピクチャバッファへのアクセスを大幅に低減できる。本発明による実施形態は、モード毎に歪み削減量の推定を計算し、推定した歪み削減量を用いてRDOコスト関数を評価する。モードは、最適化されるべき領域分割/領域マージに関連付けられた領域であり得る。モード候補に関連付けられたRDOコスト関数に従って、最適モードが選択される。
上述のような本発明によるサンプル適応オフセット補償の実施形態は、種々のハードウェア、ソフトウェアコード又はこれらの組合せで実装できる。例えば、本発明の実施形態は、本願明細書に記載した処理を実行するために、ビデオ圧縮チップに組み込まれた回路又は圧縮ソフトウェアに組み込まれたプログラムコードであり得る。本発明の実施形態は、本願明細書に記載した処理を実行するために、DSP(Digital Signal Processor)で実行されるプログラムコードであっても良い。本発明は、コンピュータプロセッサ、デジタル信号プロセッサ、マイクロプロセッサ又はFPGA(field programmable gate array)により実行される多数の機能を有しても良い。これらのプロセッサは、本発明により実現される特定の方法を定める機械可読ソフトウェアコード又はファームウェアコードを実行することにより、本発明による特定のタスクを実行するよう構成され得る。ソフトウェアコード又はファームウェアコードは、異なるプログラミング言語及び異なるフォーマット若しくはスタイルで開発されても良い。ソフトウェアコードは、異なるターゲットプラットフォームのためにコンパイルされても良い。しかしながら、ソフトウェアコード及び本発明に従ってタスクを実行するようコードを構成する他の手段の異なるコードフォーマット、スタイル及び言語は、本発明の精神及び範囲から逸脱するものではない。
本発明は、本発明の精神又は基本的特徴から逸脱することなく他の特定の形式で実施できる。説明した例は、あらゆる面で、単に説明であり限定的でないと考えられる。従って、本発明の範囲は、前述の説明によるのではなく、添付の特許請求の範囲により示される。請求項の等価物の意味及び範囲の範囲内で生じる全ての変化は、請求項の範囲内に包含される。
[関連出願の参照]
本発明は、米国仮特許出願番号61/432,482、2011年1月13日出願、名称「Picture Quadtree Adaptive Offset」、米国仮特許出願番号61/436,296、2011年1月26日出願、名称「Improved Offset Method」、米国仮特許出願番号61/466,083、2011年3月22日出願、名称「Sample Adaptive Offset」、米国非仮特許出願番号12/987,151、2011年1月9日出願、名称「Apparatus and Method of Adaptive Offset for Video Coding」、米国非仮特許出願番号13/177,424、2011年7月6日出願、名称「APPARATUS AND METHOD OF EFFICIENT SAMPLE ADAPTIVE OFFSET」、米国非仮特許出願番号13/158,427、2011年6月12日出願、名称「Apparatus and Method of Sample Adaptive Offset for Video Coding」の優先権を主張する。これらの米国仮特許出願及び米国非仮特許出願は、参照されることによりそれらの全体が本願明細書に組み込まれる。

Claims (16)

  1. レート歪最適化(Rate-Distortion Optimization:RDO)を用いて、所定の処理が行われた処理済みビデオデータのサンプル適応オフセット(Sample Adaptive Offset:SAO)補償のためのモード決定する方法であって、前記方法は、
    前記処理済みビデオデータを受信するステップ、
    SAOモードを識別するステップ、
    歪み削減量に従って前記モードの各々と関連付けられた歪みを決定するステップであって、前記歪み削減量は、第1の歪みと第2の歪みとの間の差に関連し、前記第1の歪みは、前記処理済みビデオデータと関連付けられた元の信号とSAO補償された信号とに関連し、前記第2の歪みは、前記処理済みビデオデータと関連付けられた元の信号と再構成信号とに関連する、ステップ、
    前記モードの各々の歪みに基づきレート歪み(Rate-Distortion:RD)コストを決定するステップ、
    前記モードの中から最適モードを選択するステップであって、前記最適モードは、最小RDコストを有する、ステップ、
    選択された前記最適モードに従って前記処理済みビデオデータにSAOを適用するステップ、
    を有し、
    前記SAO補償は、前記処理済みビデオデータに対して、強度シフトを補正、或いは修復するものであり、
    前記再構成信号は、再構成(reconstruction)が行われた信号である、方法。
  2. 前記歪み削減量は、前記モードの各々のピクセル数(iCount)、前記モードの各々に属するピクセルに加算されるべきオフセット値(iOffset)、及び前記処理済みビデオデータに関連付けられた再構成信号と元の信号との間のオフセット値の和(iOffsetOrg)に関連する、請求項1に記載の方法。
  3. 前記歪み削減量は、(iCount*iOffset*iOffset)-(iOffsetOrg*iOffset*2)に関連する、請求項2に記載の方法。
  4. 前記モードが領域分割又は領域マージと関連付けられるとき、小さい領域の前記歪み削減量は、個々の大きい領域の歪み削減量を計算するために再利用される、請求項1に記載の方法。
  5. 所定の処理が行われた処理済みビデオデータのサンプル適応オフセット(Sample Adaptive Offset:SAO)補償の方法であって、
    前記処理済みビデオデータを受信するステップ、
    分類に従って前記処理済みビデオデータの現在のピクセルのカテゴリを決定するステップであって、前記分類は、前記現在のピクセルと1又は複数の近隣ピクセルとに関連する、ステップ、
    補償された現在のピクセルを生成するために、前記カテゴリに関連付けられたオフセット値を用いて前記現在のピクセルを補償するステップ、
    前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係を格納するステップ、
    前記現在のピクセルのカテゴリを決定した後に、実質的に少数のピクセル期間内に、前記現在のピクセルを前記補償された現在のピクセルで置換するステップ、
    を有し、
    前記SAO補償は、前記処理済みビデオデータに対して、強度シフトを補正、或いは修復するものである、方法。
  6. 前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係の少なくとも一部は、別のピクセルのカテゴリを決定するために用いられる、請求項5に記載の方法。
  7. 前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係は、sign関数に基づく、請求項5に記載の方法。
  8. ルックアップテーブルが、前記現在のピクセルのカテゴリを決定するために用いられる、請求項5に記載の方法。
  9. レート歪最適化(Rate-Distortion Optimization:RDO)を用いて、所定の処理が行われた処理済みビデオデータのサンプル適応オフセット(Sample Adaptive Offset:SAO)補償のためのモードを決定する装置であって、前記装置は、
    前記処理済みビデオデータを受信する手段、
    SAOモードを識別する手段、
    歪み削減量に従って前記モードの各々と関連付けられた歪みを決定する手段であって、前記歪み削減量は、第1の歪みと第2の歪みとの間の差に関連し、前記第1の歪みは、SAO補償された信号と前記処理済みビデオデータと関連付けられた元の信号とに関連し、前記第2の歪みは、再構成信号と前記処理済みビデオデータと関連付けられた元の信号とに関連する、手段、
    前記モードの各々の歪みに基づきレート歪み(Rate-Distortion:RD)コストを決定する手段、
    前記モードの中から最適モードを選択する手段であって、前記最適モードは、最小RDコストを有する、手段、
    選択された前記最適モードに従って前記処理済みビデオデータにSAOを適用する手段、
    を有し、
    前記SAO補償は、前記処理済みビデオデータに対して、強度シフトを補正、或いは修復するものであり、
    前記再構成信号は、再構成(reconstruction)が行われた信号である、装置。
  10. 前記歪み削減量は、前記モードの各々のピクセル数(iCount)、前記モードの各々に属するピクセルに加算されるべきオフセット値(iOffset)、及び前記処理済みビデオデータに関連付けられた再構成信号と元の信号との間のオフセット値の和(iOffsetOrg)に関連する、請求項9に記載の装置。
  11. 前記歪み削減量は、(iCount*iOffset*iOffset)-(iOffsetOrg*iOffset*2)に関連する、請求項10に記載の装置。
  12. 前記モードが領域分割又は領域マージと関連付けられるとき、小さい領域の前記歪み削減量は、個々の大きい領域の歪み削減量を計算するために再利用される、請求項9に記載の装置。
  13. 所定の処理が行われた処理済みビデオデータのサンプル適応オフセット(Sample Adaptive Offset:SAO)補償の装置であって、
    前記処理済みビデオデータを受信する手段、
    分類に従って前記処理済みビデオデータの現在のピクセルのカテゴリを決定する手段であって、前記分類は、前記現在のピクセルと1又は複数の近隣ピクセルとに関連する、手段、
    補償された現在のピクセルを生成するために、前記カテゴリに関連付けられたオフセット値を用いて前記現在のピクセルを補償する手段、
    前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係を格納する手段、
    前記現在のピクセルのカテゴリを決定した後に、実質的に少数のピクセル期間内に、前記現在のピクセルを前記補償された現在のピクセルで置換する手段、
    を有し、
    前記SAO補償は、前記処理済みビデオデータに対して、強度シフトを補正、或いは修復するものである、装置。
  14. 前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係の少なくとも一部は、別のピクセルのカテゴリを決定するために用いられる、請求項13に記載の装置。
  15. 前記現在のピクセルと前記1又は複数の近隣ピクセルとの間の関係は、sign関数に基づく、請求項13に記載の装置。
  16. ルックアップテーブルが、前記現在のピクセルのカテゴリを決定するために用いられる、請求項13に記載の装置。
JP2013535259A 2011-01-09 2011-10-08 効率的なサンプル適応オフセットの装置及び方法 Active JP5524423B2 (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US12/987,151 US8660174B2 (en) 2010-06-15 2011-01-09 Apparatus and method of adaptive offset for video coding
US12/987,151 2011-01-09
US201161432482P 2011-01-13 2011-01-13
US61/432,482 2011-01-13
US201161436296P 2011-01-26 2011-01-26
US61/436,296 2011-01-26
US201161466083P 2011-03-22 2011-03-22
US61/466,083 2011-03-22
US13/158,427 2011-06-12
US13/158,427 US9055305B2 (en) 2011-01-09 2011-06-12 Apparatus and method of sample adaptive offset for video coding
US13/177,424 2011-07-06
US13/177,424 US9161041B2 (en) 2011-01-09 2011-07-06 Apparatus and method of efficient sample adaptive offset
PCT/CN2011/080536 WO2012092787A1 (en) 2011-01-09 2011-10-08 Apparatus and method of efficient sample adaptive offset

Publications (2)

Publication Number Publication Date
JP2013541918A JP2013541918A (ja) 2013-11-14
JP5524423B2 true JP5524423B2 (ja) 2014-06-18

Family

ID=46457216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013535259A Active JP5524423B2 (ja) 2011-01-09 2011-10-08 効率的なサンプル適応オフセットの装置及び方法

Country Status (4)

Country Link
EP (1) EP2661887A4 (ja)
JP (1) JP5524423B2 (ja)
CN (2) CN106454357A (ja)
WO (1) WO2012092787A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2882190B1 (en) 2011-04-21 2018-11-14 HFI Innovation Inc. Method and apparatus for improved in-loop filtering
US9008170B2 (en) * 2011-05-10 2015-04-14 Qualcomm Incorporated Offset type and coefficients signaling method for sample adaptive offset
RU2581553C2 (ru) * 2011-06-28 2016-04-20 Самсунг Электроникс Ко., Лтд. Способ кодирования видео с использованием регулирований смещения согласно классификации пикселов и устройство для этого, способ и устройство декодирования видео для этого
GB201119206D0 (en) 2011-11-07 2011-12-21 Canon Kk Method and device for providing compensation offsets for a set of reconstructed samples of an image
SG11201400670XA (en) 2012-01-17 2014-04-28 Genip Pte Ltd Method of applying edge offset
US10623759B2 (en) 2012-06-13 2020-04-14 Sony Corporation Decoupling enhancements in sample adaptive offset (SAO) for high efficiency video encoder (HEVC)
TWI625962B (zh) 2012-07-16 2018-06-01 三星電子股份有限公司 取樣自適應偏移解碼方法
JP6171584B2 (ja) * 2013-05-31 2017-08-02 富士通株式会社 動画像符号化装置、動画像符号化方法、および動画像符号化プログラム
CN103338374B (zh) 2013-06-21 2016-07-06 华为技术有限公司 图像处理方法及装置
CA2908323C (en) * 2013-07-15 2021-07-06 Mediatek Inc. Method of sample adaptive offset processing for video coding
KR102276914B1 (ko) * 2013-10-24 2021-07-13 삼성전자주식회사 비디오 인코딩 장치 그리고 이의 구동 방법
JP6289055B2 (ja) * 2013-11-27 2018-03-07 三菱電機株式会社 動画像符号化装置及び動画像復号装置
CN104735460B (zh) * 2013-12-24 2018-04-06 珠海全志科技股份有限公司 视频图像采样点自适应偏移处理方法及装置
KR101789954B1 (ko) * 2013-12-27 2017-10-25 인텔 코포레이션 차세대 비디오 코딩을 위한 콘텐츠 적응적 이득 보상된 예측
WO2015098231A1 (ja) * 2013-12-27 2015-07-02 ソニー株式会社 画像処理装置及び画像処理方法
EP3104615B1 (en) * 2014-02-03 2019-03-27 Mitsubishi Electric Corporation Moving image encoding device and moving image encoding method
CN106817583B (zh) * 2015-12-02 2020-01-10 福州瑞芯微电子股份有限公司 一种hevc sao计算方法和装置
CA3037411A1 (en) * 2016-09-20 2018-03-29 Mediatek Inc. Methods and apparatuses of sample adaptive offset processing for video coding
CN113099230B (zh) * 2021-02-22 2022-09-06 浙江大华技术股份有限公司 编码方法、装置、电子设备及计算机可读存储介质
CN112927324B (zh) * 2021-02-24 2022-06-03 上海哔哩哔哩科技有限公司 样点自适应补偿的边界补偿模式的数据处理方法、装置
CN114363613B (zh) * 2022-01-10 2023-11-28 北京达佳互联信息技术有限公司 滤波方法和滤波装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI116819B (fi) * 2000-01-21 2006-02-28 Nokia Corp Menetelmä kuvien lähettämiseksi ja kuvakooderi
US7450641B2 (en) * 2001-09-14 2008-11-11 Sharp Laboratories Of America, Inc. Adaptive filtering based upon boundary strength
KR100679026B1 (ko) * 2004-07-15 2007-02-05 삼성전자주식회사 비디오 코딩 및 디코딩을 위한 시간적 분해 및 역 시간적분해 방법과, 비디오 인코더 및 디코더
US20070070243A1 (en) * 2005-09-28 2007-03-29 Ali Corporation Adaptive vertical temporal flitering method of de-interlacing
CN100417228C (zh) * 2005-10-31 2008-09-03 连展科技(天津)有限公司 一种基于h.264/avc标准的帧图像的帧内预测模式选择方法
CN100566427C (zh) * 2007-07-31 2009-12-02 北京大学 用于视频编码的帧内预测编码最佳模式的选取方法及装置
DK2663076T3 (en) * 2009-04-20 2016-12-05 Dolby Laboratories Licensing Corp Filter Selection for video preprocessing of video applications
JP5416271B2 (ja) * 2009-04-20 2014-02-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 多層映像配信のための適応補間フィルタ
CN101640802B (zh) * 2009-08-28 2012-06-20 北京工业大学 基于宏块特征和统计特性的视频帧间压缩编码方法
CN101790092B (zh) * 2010-03-15 2013-02-06 河海大学常州校区 基于图像块编码信息的智能滤波器设计方法

Also Published As

Publication number Publication date
EP2661887A1 (en) 2013-11-13
EP2661887A4 (en) 2016-06-15
WO2012092787A1 (en) 2012-07-12
CN106454357A (zh) 2017-02-22
CN103404137B (zh) 2016-10-19
CN103404137A (zh) 2013-11-20
JP2013541918A (ja) 2013-11-14

Similar Documents

Publication Publication Date Title
JP5524423B2 (ja) 効率的なサンプル適応オフセットの装置及び方法
US9432670B2 (en) Apparatus and method of efficient sample adaptive offset
KR101547201B1 (ko) 비디오 부호화를 위한 샘플 적응 오프셋의 장치 및 방법
JP5792305B2 (ja) 適応ループフィルタリングの方法及び装置
US9615093B2 (en) Method and appartus of adaptive loop filtering
JP5391290B2 (ja) テクスチャレベルに基づく量子化調整
EP2708027B1 (en) Method and apparatus for reduction of in-loop filter buffer
JP5039777B2 (ja) Dcシフトアーチファクトに対する量子化調整
CN113785569B (zh) 视频编码的非线性适应性环路滤波方法和装置
US10681371B2 (en) Method and device for performing deblocking filtering
US9451271B2 (en) Adaptive filtering based on pattern information
JP2016015752A (ja) 映像符号化及び復号化のためのdcイントラ予測モードのための方法及び装置
CN105306957A (zh) 自适应环路滤波方法和设备
TW202325024A (zh) 影像處理裝置、及影像處理方法
JP2015080115A (ja) 画像符号化装置、画像符号化方法、及びプログラム
US20230199196A1 (en) Methods and Apparatuses of Frequency Domain Mode Decision in Video Encoding Systems
KR20050085368A (ko) 블록화 아티팩트들을 측정하는 방법
US20240236379A1 (en) System and method for reducing blocking artifacts and providing improved coding efficiency
Zhang et al. Textural and Directional Information Based Offset In-Loop Filtering in AVS3
KR20140078778A (ko) 영상 부호화 방법 및 장치
AU2014200419A1 (en) Method and apparatus of adaptive loop filtering

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140409

R150 Certificate of patent or registration of utility model

Ref document number: 5524423

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250