JP5165083B2 - ビデオコーディングの適応オフセットに用いる装置および方法 - Google Patents

ビデオコーディングの適応オフセットに用いる装置および方法 Download PDF

Info

Publication number
JP5165083B2
JP5165083B2 JP2011109151A JP2011109151A JP5165083B2 JP 5165083 B2 JP5165083 B2 JP 5165083B2 JP 2011109151 A JP2011109151 A JP 2011109151A JP 2011109151 A JP2011109151 A JP 2011109151A JP 5165083 B2 JP5165083 B2 JP 5165083B2
Authority
JP
Japan
Prior art keywords
pixels
video data
region
pixel
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011109151A
Other languages
English (en)
Other versions
JP2012005113A (ja
Inventor
智銘 傅
慶▲よう▼ 陳
毓文 黄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of JP2012005113A publication Critical patent/JP2012005113A/ja
Application granted granted Critical
Publication of JP5165083B2 publication Critical patent/JP5165083B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオ処理に関する。特に、本発明は適応オフセット復元(adaptive offset restoration)に用いる装置および方法に関するものである。
デジタルフォーマットのビデオデータは、従来のアナログフォーマットより多くの利点を提供しており、ビデオ記憶装置およびビデオ伝送のための主要なフォーマットとなっている。ビデオデータは、通常、サンプル当たり8ビットまたは10ビットなどの定数のビットによって示される整数にデジタル化される。また、カラービデオデータは、例えば赤緑青(RGB)の3原色の座標または輝度−色相システムなどの選択されたカラーシステムを用いてよく表される。デジタルビデオに一般的に用いられる輝度−色相のカラーシステムの1つは、周知のYCrCbカラーシステムであり、Yは、輝度成分といわれ、CrおよびCbは、色相成分といわれている。RGB成分およびY成分は、3原色の強度および輝度にそれぞれ関連しており、それらのデジタル表現は、デジタル表現のビット数と関連した範囲を有する整数によくマップ化される。例えば、8ビットビデオデータは、通常、強度レベル0〜255を表す。一方、CrおよびCbの色相成分は、異なるデータに対応し、それらのデジタル表現は、負値および正値を有する整数によくマップ化される。例えば、8ビットCr/Cbデータは、−128〜+127の色相のレベルを表す。
デジタルビデオシステムの処理経路に沿って処理されたビデオの平均値は、シフトされ、強度オフセットを起こす可能性がある。強度シフトは、フィルタリング、データラウンディング(data rounding)、量子化、または他の処理に起因する場合がある。強度オフセットとも呼ばれる強度シフトは、視覚障害またはアーチファクト(artifact)を引き起こす可能性があり、これは、強度シフトがフレームからフレームに変わる時、特に顕著である。よって、上述の潜在的な問題を避けるために、画素の強度オフセットは、注意深く復元(restore)されなければならない。しかしながら、画像コンテンツは、しばしばフレーム内で非常に動的である。画像内の動的コンテンツの特性を探求するために、画像の領域に用いられ得る適応オフセット復元の装置および方法を開発することが望ましい。また、領域内の基礎画素(underlying pixel)の特性をクラス(class)に分類することによって画素特性に用いられるオフセット復元を探求することが望ましい。よって、オフセット復元は、各クラスに適応して実行され得る。
適応オフセット復元の装置および方法を提供する。
適応オフセット復元の装置および方法が公開される。本発明に基づく方法は、処理されたビデオデータを受けるステップ、処理されたビデオデータの領域を選択するステップ、処理されたビデオデータの領域の画素のそれぞれのクラスを画素のそれぞれの特性測定に基づき、決定するステップ、前記処理されたビデオデータの領域の画素および元のビデオデータに関連する各領域の各画素に基づくクラスの強度オフセットを決定するステップ、およびクラスの強度オフセットに基づく処理されたビデオデータを補償するステップを含む。前記領域は、画像より小さいため、適応オフセットは、画像の動的な特性に適応することができる。適応オフセット復元は、デブロック処理前に再構成されたビデオデータに用いられ得る。本発明に基づく1つの実施の形態において、特性測定は、基礎画素の周囲の画素で構成される画素パターンに基づいており、特性測定は、基礎画素の関連したエッジ、最大値、または最小値である。本発明に基づくもう1つの実施の形態において、特性測定は、基礎画素の強度に基づき、強度は、分類のために複数の帯域に分割される。本発明に基づくもう1つの実施の形態において、適応オフセットは、適応ループフィルタのように同じ画素分類を共有する。
ビデオビットストリームに対応する再構成されたビデオ画像が適応オフセットによって処理される、ビデオビットストリームのデコーディングのための装置および方法が公開されている。ビデオビットストリームのデコーディングの方法であって、ビデオビットストリームに対応した再構成されたビデオ画像は、適応オフセットによって処理され、ビデオビットストリームを処理してビデオ画像を再構成して、処理されたビデオ画像を提供するステップ、処理されたビデオ画像の領域を選択するステップ、処理されたビデオ画像の領域の画素のそれぞれのクラスを、前記画素のそれぞれの特性測定に基づき決定するステップ、ビデオビットストリームに示されたクラスの強度オフセットを決定するステップ、およびクラスの強度オフセットに基づく処理されたビデオ画像の領域を補償するステップを含む。前記領域は、画像より小さいため、適応オフセットは、画像の動的な特性に適応することができる。適応オフセット復元は、デブロック処理前に再構成されたビデオデータに用いられ得る。本発明に基づく1つの実施の形態において、特性測定は、基礎画素の周囲の画素で構成される画素パターンに基づいており、特性測定は、基礎画素の関連したエッジ、最大値、または最小値である。本発明に基づくもう1つの実施の形態において、特性測定は、基礎画素の強度に基づき、強度は、分類のために複数の帯域に分割される。本発明に基づくもう1つの実施の形態において、適応オフセットは、適応ループフィルタのように同じ画素分類を共有する。
画像内のコンテンツの特性に用いられるオフセット復元を実現させることができる。
高効率動画像圧縮符号化(high efficiency video coding;HEVC)のための模範的なビデオエンコーダのシステムブロック図である。 高効率動画像圧縮符号化のための模範的なビデオデコーダのシステムブロック図である。 画素カテゴリ(category)に基づく、適応オフセットの実施例を説明するための図である。 本発明の実施の形態に基づく、適応オフセット復元を具現化する高効率動画像圧縮符号化のためのビデオエンコーダのシステムブロック図である。 強度範囲を16の等間隔のバンドに分割した実施例を説明するための図である。 強度範囲を12の不等間隔のバンドに分割した実施例を説明するための図である。 画素カテゴリを決定する現画素(current pixel)およびその隣接画素の構成を説明するための図である。 画素カテゴリを決定する現画素およびその隣接画素の別の構成を説明するための図である。 画素カテゴリを決定する現画素およびその隣接画素の種々の線形の構成を説明するための図である。 画素カテゴリを決定する現画素およびその隣接画素の種々の線形の構成を説明するための図である。 画素カテゴリを決定する現画素およびその隣接画素の種々の線形の構成を説明するための図である。 画素カテゴリを決定する現画素およびその隣接画素の種々の線形の構成を説明するための図である。
デジタルフォーマットのビデオデータは、従来のアナログフォーマットより多くの利点を提供しており、ビデオ記憶装置およびビデオ伝送のための主要なフォーマットとなっている。ビデオデータは、通常、サンプル当たり8ビットまたは10ビットなどのビットの定数によって示される整数にデジタル化される。また、カラービデオデータは、例えば赤緑青(RGB)の3原色の座標または輝度−色相システムなどの選択されたカラーシステムを用いてよく表される。デジタルビデオに一般的に用いられる輝度−色相のカラーシステムの1つは、周知のYCrCbカラーシステムであり、Yは、輝度成分といわれ、CrおよびCbは、色相成分といわれている。RGB成分およびY成分は、3原色の強度および輝度にそれぞれ関連しており、それらのデジタル表現は、デジタル表現のビット数と関連した範囲を有する整数によくマップ化される。例えば、8ビットビデオデータは、通常、強度レベル0〜255を表す。一方、CrおよびCbの色相成分は、異なるデータに対応し、それらのデジタル表現は、負値および正値を有する整数によくマップ化される。例えば、8ビットCr/Cbデータは、−128〜+127の色相のレベルを表す。
デジタルビデオシステムの処理経路に沿って、処理されたビデオの平均値は、シフトされ、強度オフセットを起こす可能性がある。強度シフトは、フィルタリング、データラウンディング(data rounding)、量子化、または他の処理に起因する場合がある。強度オフセットとも呼ばれる強度シフトは、視覚障害またはアーチファクト(artifact)を引き起こす可能性があり、これは、強度シフトがフレームからフレームに変わる時、特に顕著である。よって、上述の潜在的な問題を避けるために、画素の強度は、注意深くオフセット補正されなければならない。しかしながら、画像コンテンツは、フレーム間、およびフレーム内で非常に動的であり、時折変化する。動的なビデオ環境で、コンテンツ適応画素処理の利点を探求するために、定義済み設定といわれる、画像ユニットを選択し、基礎ビデオデータが処理されたビデオデータの品質を更に改善できるシステムおよび方法を開発することが望ましい。定義済み設定は、基礎ビデオデータの動的な特性を捕らえるのに用いられ得る。
図1に示される模範的なエンコーダは、イントラ/インター予測を用いたシステムを表している。イントラ予測110は、同じ画像のビデオデータに基づく予測データを提供するのに対応する。インター予測では、動き検出(ME)および動き補償(MC)112が他の画像または複数の画像からのビデオデータに基づく予測データを提供するのに用いられる。スイッチ114は、イントラ予測またはインター予測のデータを選択し、選択された予測データは、加算器116に提供され、残差(residues)とも呼ばれる予測エラーを形成する。次いで、予測エラーは、変換(T)118に続いて量子化(Q)120で処理される。次いで、変換されて量子化された残差は、エントロピーコーディング122によってコーディングされ、圧縮されたビデオデータに対応するビットストリームを形成する。次いで、変換係数と関連するビットストリームは、例えば、動き、モード、および画像領域と関連した他の情報などのサイド情報と圧縮される(packed)。サイド情報も、必要な帯域幅を減少するために、エントロピーコーディングされて、図1に示されるように、サイド情報と関連したデータがエントロピーコーディング122に提供され得る。インター予測モードが用いられた時、1つの参照画像または複数の参照画像がエンコーダ側(encoder end)で再構成されなくてはならない。この結果、変換されて量子化された残差は、残差を補うために、逆量子化(IQ)124および逆変換(IT)126によって処理される。次いで、残差は、再構成(REC)128で予測データ136に戻され、ビデオデータを再構成する。再構成されたビデオデータは、参照画像バッファ134に保存され、他のフレームの予測に用いられ得る。しかしながら、デブロックフィルタ(deblocking filter)130および適応ループフィルタ(ALF)132は、ビデオの品質を向上させるために、ビデオデータが参照画像バッファに保存される前に、再構成されたビデオデータに用いられる。適応ループフィルタの情報は、ビットストリームに伝送されなければならず、よって、デコーダが適応ループフィルタに適用するように、必要な情報を適正に補うことができる。よって、ALF132からの適応ループフィルタの情報は、エントロピーコーディング122に提供され、最終的なビットストリーム内に取り込まれる。図1に示されるように、入力ビデオデータは、エンコーディングシステムで一連の処理を行い、REC128からの再構成されたビデオデータは、一連の処理により強度オフセットの影響を受ける可能性がある。再構成されたビデオデータは、デブロックフィルタ130および適応ループフィルタ132によって更に処理され、更なる強度オフセットを起こす可能性がある。従って、オフセットの復元(オフセット補正とも言われる)を取り込み、強度オフセットを補うことが望ましい。
図2は、高効率動画像圧縮符号化(high efficiency video coding)のためのビデオデコーダのシステムブロック図を例示している。エンコーダもビデオデータを再構成する部分を含むため、いくつかのデコーダの部分は、エンコーダに既に用いられる。しかしながら、エントロピーデコーダ222は、エンコーダに用いられない。また、動き補償212だけがデコーダ側に必要である。スイッチ214は、イントラ予測またはインター予測を選択し、選択された予測データは、補われた残差と統合されるように、再構成(REC)128に提供される。圧縮したビデオデータにエントロピーデコーディングを実行する他に、エントロピーデコーディング222もサイド情報のエントロピーデコーディングに対応し、サイド情報を各ブロックに提供する。例えば、イントラ予測モード情報は、イントラ予測110に提供され、インター予測モード情報は、動き補償212に提供され、適応ループフィルタ情報は、ALF132に提供され、残差は、逆量子化124に提供される。残差は、IQ124、IT126、およびその後に続く再構成プロセスによって処理され、ビデオデータを再構成する。また、図2に示されるように、REC128からの再構成されたビデオデータは、IQ124およびIT126を含む一連の処理を行い、強度オフセットの影響を受ける。再構成されたビデオデータは、デブロックフィルタ130および適応ループフィルタ132によって更に処理され、更なる強度オフセットを起こす可能性がある。従って、オフセット補正を取り込み、強度オフセットを補うことが望ましい。
オフセットの問題を克服するために、McCann他は、ITU−T SG16 WP3およびISO/IEC JTC1/SC29/WG11の共同研究部会(JCT−VC)、第1回研究会:ドレスデン、ドイツ、2010年4月15日〜23日の開催で、文書:JCTVC−A124 、“Samsung’s Response to the Call for Proposals on Video Compression Technology”のコンテンツ適応の極限補正(extreme correction)および帯域補正を公開している。隣接画素に基づくコンテンツ情報を用いると、局所エッジの特性を探求することができ、より良い視覚品質またはビットレート縮小面で向上した性能が得られる。McCann他は、図3に示されるような隣接画素構成を公開しており、その中のCは、現画素値であり、n1〜n4は、現画素のそれぞれ上、左、右、および下側にある4つの隣接画素である。McCann他に基づいて画素を7つのカテゴリに分類する方法は、以下の表に表される。
Figure 0005165083
カテゴリ0では、画素Cは、局所最小であり、最小値(valley)とも言われる。カテゴリ5では、画素Cは、局所最大であり、最大値(peak)とも言われる。カテゴリ1、2、3、および4では、画素Cは、オブジェクトエッジである。各カテゴリの画素では、処理されたビデオデータの平均と元のビデオデータの平均との間の差が算出され、デコーダに伝送される。処理されたビデオデータは、REC128からの再構成されたビデオデータ、DF130からのデブロックしたデータ、またはALF132からの適応ループフィルタのデータであり得る。McCann他は、エッジ特性を“カテゴリ(categories)”に分類し、これは“クラス(classes)”とも呼ばれる。図1および図2は、ビデオコーディング用の適応オフセットが用いられ得る模範的なシステムを例示しているが、他のシステムも、本発明を具現化して強度オフセットの問題を克服し得る。例えば、カメラ画像処理システムでは、デモザイキング(demosaicing)によって処理されたビデオデータ、ホワイトバランス(white balancing)、および/またはエッジ強調も強度オフセットの影響を受ける可能性がある。上述のように、McCann他は、第1の強度オフセット補正を基礎画素のエッジ特性に基づいたDF130とALF132間の処理されたデータに適用する。基礎画素のエッジ特性に基づいた適応オフセット補正は、McCann他によって極限補正(Extreme Correction)と呼ばれる。
McCann他に基づき、上述の極限補正は、再構成されたビデオデータに用いられる。クラスcに対応する再構成された平均強度Vr(c)およびクラスcに対応する元の平均強度Vo(c)は、ビデオ画像用に決定される。クラスcに対応するオフセットVd(c)は、以下の式によって決まる。
Figure 0005165083
上述で計算されたオフセットVd(c)は、クラスc、即ち、Vr’(c)=Vr(c)+Vd(c)に属する再構成されたビデオデータに加えられる。Vr’(c)は、オフセット補正されたビデオデータである。デコーダに各クラスに適切なオフセットを提供させるために、全てのクラスのオフセットVd(c)値は、デコーダに伝送される必要がある。適切なビットストリームのシンタックスは、オフセットVd(c)値を取り込むのに必要となる。
McCann他は、極限補正をDF130とALF132間の処理されたビデオデータに適用し、帯域補正をALF132および参照画像バッファ134間の処理されたデータに適用しているが、適応オフセット補正もDF130が用いられる前に再構成されたデータに用いられてもよい。図4は、適応オフセット410が再構成128とDF130間の処理されたビデオデータに用いられる、本発明に基づく実施の形態を例示している。
McCann他は、基礎画素が属している帯域に基づいたもう1つの適応オフセット補正を公開している。この方法は、帯域補正(BDC)とも呼ばれる。McCann他によると、帯域ベースの分類の主な動機は、再構成されたビデオデータおよび元のビデオデータに対応した基礎データの2つの異なる確率密度関数(probability density function(PDF))を均等にすることである。McCann他は、画素のp最上位ビットを用いた帯域ベースの分類を公開しており、これは、強度を、等間隔の2クラスに分割することに相当する。一実施の形態において、McCann他は、p=4を選択して強度を16の等間隔の帯域に分割する(クラスとも呼ぶ)。各帯域、またはクラスでは、平均差が計算されてデコーダに伝送され、オフセットは、各帯域のために個別に補正され得る。帯域cまたはクラスcに対応する再構成された平均強度値Vr(c)、或いは帯域cまたはクラスcに対応する元の平均強度値Vo(c)は、ビデオ画像用に決定される。EXCの同じ数学記号Vr(c)およびVo(c)は、利便性のために用いられてきた。エッジ特性に基づく適応オフセット補正のように、クラスcに対応して関連したオフセットVd(c)は、Vd(c)=Vo(c)−Vr(c)に基づき、決定され得る。上述に計算されたようにオフセットVd(c)は、次いで、クラスc、即ち、Vr’(c)=Vr(c)+Vd(c)に属する再構成されたビデオデータに加えられる。Vr’(c)は、オフセット補正されたビデオデータである。McCann他は、帯域補正をALF132および参照画像バッファ134間の処理されたビデオデータに用いている。
McCann他は、隣接画素または強度帯域に関連した特性に基づく適応処理を公開しているが、画像内で動的な特性を探求する適応性がなく、1つの画像領域の特性は、もう1つの画像領域の特性と大きく異なる。McCann他による方法において、カテゴリまたは帯域の決定は、常に全てのフレームまたは画像のグループに基づく。いくつかのビデオデータでは、比較的小さい画像領域に関連したカテゴリまたは帯域は、領域の基礎ビデオデータをよりよく特性化できるため、より小さな画像領域に対応する領域は、適応性処理に更に有利である。しかしながら、比較的小さい画像領域は、例えばMcCann他によって公開された実施例の強度オフセット情報など、デコーダに伝送される必要のある、より多くのオーバーヘッド情報(overhead information)を必要とする可能性がある。よって、潜在的な性能向上と比較的小さい画像領域に関連したオーバーヘッド情報の増加との間にはトレードオフがある。よって、本開示に公開された画素強度処理は、本開示において領域(region)と呼ばれる比較的小さい画像領域を用いている。領域の大きさは、各ビデオ処理に用いられる画像領域、例えば圧縮システムのビデオ圧縮またはデジタルカメラのセンサ画像処理(sensor image processing)などと独立にすることができる。また、領域は、画像から画像に適応して構成することができる。本開示において、適応オフセット(AO)も適応オフセット補正または適応オフセット復元の省略形として用いられる。
本発明の他の実施の形態において、AOは、ALFと更に組み合わせられる。画像の各領域では、AO、ALF、またはAOおよびALFの組み合わせは、適応して領域に用いることができる。AOおよびALFが領域に選択的に用いられた時、平均のデコーディング時間は、コーディング効率を犠牲にすることなく、減少することができる。AO、ALF、またはAOおよびALFの組み合わせが領域に用いられるかどうかを知らせるために、フラグ(flag)が領域に用いられて選択を示すことができる。
McCann他は、全ての画像のために等間隔を用いた帯域補正を公開しているが、本発明に基づく実施の形態は、画像の領域に基づく高度帯域分類を公開している。画像は、まず、一定の大きさのブロック、または4分木のいずれかを用いてパーティション(partition)に分割される。各パーティションの分割は、上述のAOのケースのように、領域とも呼ばれる。次いで、各領域の画素は、高度帯域分類法に基づき、複数の帯域に分割される。高度帯域分類は、図5Aに示された16の等帯域または図5Bに示された12の不等帯域から1つの帯域分類を適応して選択する。帯域分類のタイプの選択は、領域ごとであり、フラグは選択を示すのに必要とされる。強度の最小および最大は、領域のために再構成されたビデオデータから得られる。よって、最小および最大は、デコーダと通信することを必要しない。各領域の帯域オフセットは、デコーダ側に伝送されるため、デコーダは領域の各帯域のために帯域オフセットを適切に補正することができる。高度帯域分類に基づくオフセット復元方法は、帯域オフセット復元または略して帯域オフセット(BO)と言われる。2つのタイプの帯域が模範的な実施の形態として用いられ、上述の実施例で本発明を実行しているが、他のタイプの帯域も用いられ得る。16の等帯域および12の不等帯域は、2つの模範的なタイプの帯域として用いられ、2つの模範的なタイプの帯域によって用いられる帯域数は、本発明を制限するものではない。等帯域および不等帯域のタイプは、ほぼ同じ帯域数を用いて本発明を実行し得る。
2つのタイプの帯域、即ち、16の等帯域および12の不等帯域が上述で公開されているが、代替の帯域分類が帯域オフセット補正に用いられることも可能である。この代替の帯域分類は、領域の画素をN帯域内に分類する。次いで、N帯域は、2つのグループに分割される。その中の1つのグループは、オフセット補正用であり、もう1つのグループは、オフセット補正用でない。例えば、領域の画素は、32の等帯域に分割することができる。[64、191]をカバーする中心の16帯域のパーディションは、第1のグループに割り当てられることができ、残りの強度をカバーする残りの16の帯域は、第2のグループに割り当てられることができる。オフセット補正用かオフセット補正用でないグループかの決定は、領域ごとに基づいて行われる。2つのグループが本発明を実行する実施例として用いられるが、他のグループも用いることができる。例えば、N帯域は、Mグループに分割することができる。Mは、2以上の整数である。Mグループの中では、Pグループは、オフセット補正用でないグループにすることができる。Pは、M以下である。その結果、残りの(M〜P)グループだけがオフセット補正を受け、これらの(M〜P)グループの強度オフセットは、オフセット補正のためにデコーダに提供される必要がある。
McCann他は、適応処理が基礎画素のエッジ特性に関連し、画素分類が全ての画像に基づくことを公開しているが、本発明に基づく実施の形態は、画素構成または画素パターンを選択し、領域ごとに適応して基づいたエッジ特性を測定する。フラグは、エッジ特性の決定のために各領域に用いられ、画素構成の選択を伝送するために用いられる。領域は、一定の大きさのブロック、または4分木のパーティションを用いて、画像を分割することで得られる。図6Aで示されたMcCann他によって公開された画素構造以外に、図6Bに示されたもう1つの画素構成も選択することができる。図6Aに示された十字の画素構成または十字の画素パターンは、水平エッジまたは垂直エッジにより対応する。また、画素パターンも基礎画素の最大値または最小値に対応する。一方、図6Bの対角の画素構造は、基礎画素で最大値または最小値と同様に、45°または135°で傾斜エッジに対応する。適応方法はまた、以下の表に示されるように、画素を7つのカテゴリに分類する。
Figure 0005165083
上述の画素パターンに基づく7つのカテゴリへの分類は、本発明を実行する実施例として用いられるもので、本発明を限定するものと解釈してはならない。ほとんどのカテゴリが用いられることができ、他の画素パターンも本発明を実行するのに用いられ得る。2次元の画素構造が上述に公開されてエッジの特性を決定しているが、2つの隣接画素を用いた簡易化した線状の画素構造も用いられ得る。簡易化した画素構造の使用は、必要な計算を減少する。よって、4つの簡易化された画素構造(これも画素パターンと呼ばれる)は、図7A〜7Dに示されように表示され、垂直線、水平線、135度傾斜線、および45°傾斜線にそれぞれ対応する。短線で配列された各画素構造は、線に沿って遷移強度(intensity transition)に対応する。例えば、水平エッジは、他の方向を有する線よりも、垂直線でより顕著な遷移強度を起こす。同様に、垂直エッジは、他の方向を有する線よりも、水平線でより顕著な遷移強度を起こす。画素構造の選択は、領域ごとに基づいて決定され、フラグは各領域に必要とされる。以下の表に示されるように、画素構造に基づき、基礎画素は、エッジ、最大値、最小値、および上述のいずれでもないものに対応して6つのクラスに分類される。
Figure 0005165083
基礎画素の周囲の2つの画素が短線画素パターンを形成するのに用いられるが、線状方向に沿ったより多くの画素も用いられ得る。例えば、基礎画素の各側の2つの画素が5画素線に対応して画素パターンを形成するのに用いることができる。また、ほぼ同じカテゴリを用いて本発明を実行し得る。
高効率動画像圧縮符号化(HEVC)に用いられるALFプロセスも画素分類を用いて各フィルタを選択する。ALFは、通常、ラプラシアンの和を用いて基礎画素のクラスを決定する。本発明に基づくもう1つの実施の形態において、適応オフセットは、ALFのように同じ分類を共有し得る。言い換えれば、適応オフセットは、ALFによって用いられた領域を選択し、これは最大コーディングユニット、スライス、スライスグループ、または他の部分的な画像とすることができる。ラプラシアンの和は、特性測定として、適応オフセットによって用いられ、基礎画素のクラスを決定する。よって、領域の各クラスのオフセットが決定され、デコーダに提供される。同様に、ALFは、BO/BDCのように同じ分類を共有し得る。BO/BDCは、画素強度に基づき、領域の画素をクラスに分類する。
エッジ特性と強度帯域は、基礎画素をクラスに分類する特性として用いられるが、他の特性も基礎画素をクラスに分類するように用いられ得る。例えば、コーディングユニットモード、予測ユニットサイズ、変換ユニットサイズ、量子化パラメータ、参照画像、動きベクトル、イントラ予測モード、残差、およびデブロック境界強度は、基礎画素をクラスに分類する特性として用いられ得る。例えば、各画素は、ラプラシアンの和に基づき、カテゴリまたはクラスに分類される。よって、各カテゴリまたはクラスの強度オフセットは、計算されて、各カテゴリまたはクラスのオフセットを補正するのに用いられ得る。
上述の本発明に基づく適応オフセット復元の実施の形態は、種々のハードウェア、ソフトウェアコード、またはその両方の組み合わせで実施され得る。例えば、本発明の実施の形態は、ビデオ圧縮チップに統合された回路、またはビデオ圧縮ソフトウェアに統合されたプログラムコードであり得、ここに述べられる処理を実行する。本発明の実施の形態は、デジタル信号プロセッサ(DSP)に実行されるプログラムコードでもあり得、ここに述べられる処理を実行する。本発明はまた、コンピュータプロセッサ、デジタル信号プロセッサ、マイクロプロセッサ、またはフィールドプログラマブルゲートアレイ(FPGA)によって実行される複数の機能も含み得る。これらのプロセッサは、本発明によって具現化される特定の方法を規定する機械可読のソフトウェアコードまたはファームウェアコードを実行することによって、本発明に基づく、特定のタスクを実行するように構成され得る。ソフトウェアコードまたはファームウェアコードは、異なるプログラミング言語および異なるフォーマットまたはスタイルで開発され得る。ソフトウェアコードは、異なるターゲットプラットフォームにも適用され得る。しかしながら、本発明に従ってタスクを実行するソフトウェアコードの異なるコードフォーマット、スタイル、および言語、および他の構成コードの手段は、本発明の精神および範囲を逸脱しない。
上述の本発明に基づく適応オフセット復元の実施の形態は、統合されたハードウェアまたは複数の処理ユニットに実施され得る。各処理ユニットは、適応オフセット復元の特定機能に対応する。例えば、第1の処理ユニットは、前記画素のそれぞれの特性測定に基づき、処理されたビデオデータの領域の画素のそれぞれのクラスを決定するように構成され得る。第2の処理ユニットは、前記各画素の特性測定に基づき、処理されたビデオデータの領域の画素および元のビデオデータに関連する各領域の各画素に基づくクラスの強度オフセットを決定するように構成され得る。第3の処理ユニットは、クラスの強度オフセットに基づく処理されたビデオデータの領域を補償するように構成され得る。複数の処理ユニットに基づくハードウェア実装の上述の例は、システム機能と処理ユニットとの間に1つのマッピングを例示している。とはいえ、特定の機能的パーティションおよびハードウェアマッピングは、本発明を限定するものと解釈してはならない。当業者は、システム機能に基づく、異なるパーティションを用い、且つ前記機能を異なるハードウェア処理ユニットにマッピングすることで本発明を実行し得る。上述の本発明に基づくデコーディングシステムの適応オフセット復元の実施の形態も、統合されたハードウェアまたは複数の処理ユニットに実施され得る。各処理ユニットは、適応オフセット復元の特定機能に対応する。例えば、第1の処理ユニットは、ビデオビットストリームからのビデオ画像を再構成し、処理されたビデオ画像を提供するように構成され得る。構成ユニット(configuration unit)は、処理されたビデオ画像の領域を構成するように用いられ得る。第2の処理ユニットは、前記画素のそれぞれの特性測定に基づき、処理されたビデオ画像の領域の画素のそれぞれのクラスを決定するように構成され得る。第3の処理ユニットは、ビデオビットストリームに示されたように、クラスの強度オフセットを決定するように構成され得る。第4の処理ユニットは、クラスの強度オフセットに基づく処理されたビデオ画像の領域を補償するように構成され得る。複数の処理ユニットに基づくデコーダシステムのハードウェア実装の上述の例は、システム機能と処理ユニットとの間に1つのマッピングを例示している。とはいえ、特定の機能的パーティションおよびハードウェアマッピングは、本発明を限定するものと解釈してはならない。当業者は、システム機能に基づく、異なるパーティションを用い、且つ前記機能を異なるハードウェア処理ユニットにマッピングすることで本発明を実行し得る。
以上、本発明の好適な実施例を例示したが、これは本発明を限定するものではなく、本発明の精神及び範囲を逸脱しない限りにおいては、当業者であれば行い得る少々の変更や修飾を付加することが可能である。従って、本発明が請求する保護範囲は、特許請求の範囲を基準とする。
110 イントラ予測
112 動き補償(MC)
114 スイッチ
116 加算器
118 変換(T)
120 量子化(Q)
122 エントロピーコーディング
124 逆量子化(IQ)
126 逆変換(IT)
128 再構成(REC)
130 デブロックフィルタ
132 適応ループフィルタ(ALF)
134 参照画像バッファ
136 予測データ
212 動き補償
214 スイッチ
222 エントロピーデコーディング
410 適応オフセット

Claims (13)

  1. 処理されたビデオデータを処理する適応オフセットの方法であって、前記方法は、
    前記処理されたビデオデータを受けるステップ、
    前記処理されたビデオデータの領域を選択するステップ、
    前記処理されたビデオデータの領域の画素のそれぞれのクラスを、前記画素のそれぞれの特性測定に基づき決定するステップ、
    前記処理されたビデオデータの領域の画素および元のビデオデータに関連する各領域の各画素に基づくクラスの強度オフセットを決定するステップ、および
    前記クラスの強度オフセットに基づく前記処理されたビデオデータの領域を補償するステップを含み、
    前記処理されたビデオデータは、デブロック処理前に再構成されたビデオデータに対応し、
    前記処理されたビデオデータの領域の画素のそれぞれのクラスを、前記画素のそれぞれの特性測定に基づき決定するステップは、領域に基づいて実行される
    方法。
  2. 前記処理されたビデオデータの領域の画素のそれぞれのクラスを、前記画素のそれぞれの特性測定に基づき決定するステップは、4つの線形画素パターンから、前記画素の画素パターンを選択するステップを含み、
    前記画素パターンは、前記特性測定に用いられる
    請求項1記載の方法。
  3. 前記4つの線形画素パターンは、垂直線、水平線、135度傾斜線、及び45度傾斜線に沿って、それぞれ配置される
    請求項2記載の方法。
  4. 前記領域の画素のそれぞれのクラスを決定するステップは、画素強度をN不均等帯域に分割するステップを含み、Nは整数である請求項1に記載の方法。
  5. 前記領域の画素のそれぞれのクラスを決定するステップは、画素強度をN不均等帯域またはM均等帯域に選択的に分割し、フラグをデコーダに提供し、N不均等帯域またはM均等帯域が選択されるかどうかを示すステップを含み、NおよびMは、整数である請求項1に記載の方法。
  6. 前記領域の画素のそれぞれのクラスを決定するステップは、画素強度を最小値と最大値の間のN帯域に分割するステップを含み、Nは、整数である請求項1に記載の方法。
  7. 前記領域の画素のそれぞれのクラスを決定するステップは、画素強度をN帯域に分割し、シーケンス、画像、またはスライスレベルでオフセット補正を受けないM帯域に関する情報を提供し、(N−M)帯域のそれぞれに強度オフセットを提供するステップを含み、NおよびMは、整数であり、MはN以下である請求項1に記載の方法。
  8. 前記領域の画素のそれぞれのクラスを決定するステップは、画素強度をN帯域に分割し、N帯域をMグループに分類し、オフセット補正を受けないPグループに関する情報を提供し、(M−P)グループの各帯域に強度オフセットを提供するステップを含み、N、M、およびPは、整数であり、Mは2以上であり、Pは、M以下である請求項1に記載の方法。
  9. 前記領域の画素のそれぞれのクラスを決定するステップは、画素パターンを選択し、前記選択された画素パターンを示すために、フラグをデコーダに提供する、ステップを含み、前記画素パターンは、特性測定に用いられる請求項1に記載の方法。
  10. 前記画素のそれぞれの前記特性測定は、コーディングユニットモード、予測ユニットサイズ、変換ユニットサイズ、量子化パラメータ、参照画像、動きベクトル、イントラ予測モード、残差、およびデブロック境界強度で構成されるグループから選択される請求項1に記載の方法。
  11. 固有フィルタを用いて前記領域の前記画素のそれぞれに適応ループフィルタを適用するステップを更に含み、前記固有フィルタは、前記画素のそれぞれのクラスに基づき決定される請求項1に記載の方法。
  12. 固有フィルタを用いて前記領域の前記画素のそれぞれに適応ループフィルタを適用するステップを更に含み、前記固有フィルタは、前記画素のそれぞれのクラスに基づき決定され、ラプラシアンの和は、前記画素のそれぞれの特性測定として用いられる請求項1に記載の方法。
  13. 処理されたビデオデータを処理する適応オフセットに用いる装置であって、前記装置は、
    前記処理されたビデオデータを受けるインターフェース、
    前記処理されたビデオデータの領域を選択する構成ユニット、
    前記処理されたビデオデータの前記領域の画素のそれぞれのクラスを、前記画素のそれぞれの特性測定に基づき決定する第1の処理ユニット、
    前記処理されたビデオデータの前記領域の画素および関連する元のビデオデータの各領域の各画素に基づくクラスの強度オフセットを決定する第2の処理ユニット、および
    前記クラスの前記強度オフセットに基づく前記処理されたビデオデータの前記領域を補償する第3の処理ユニットを備え、
    前記処理されたビデオデータは、デブロック処理前に再構成されたビデオデータに対応し、
    前記第1の処理ユニットは、
    前記画素のそれぞれの特性測定に基づく、前記処理されたビデオデータの領域の画素のそれぞれのクラスの決定を、領域に基づいて実行する
    装置。
JP2011109151A 2010-06-15 2011-05-16 ビデオコーディングの適応オフセットに用いる装置および方法 Active JP5165083B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US35478910P 2010-06-15 2010-06-15
US61/354,789 2010-06-15
US201113987151A 2011-01-09 2011-01-09
US12/987,151 2011-01-09

Publications (2)

Publication Number Publication Date
JP2012005113A JP2012005113A (ja) 2012-01-05
JP5165083B2 true JP5165083B2 (ja) 2013-03-21

Family

ID=44905286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011109151A Active JP5165083B2 (ja) 2010-06-15 2011-05-16 ビデオコーディングの適応オフセットに用いる装置および方法

Country Status (1)

Country Link
JP (1) JP5165083B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9161035B2 (en) * 2012-01-20 2015-10-13 Sony Corporation Flexible band offset mode in sample adaptive offset in HEVC
RS56675B1 (sr) 2012-06-11 2018-03-30 Samsung Electronics Co Ltd Postupak kodiranja video zapisa koji dele sao parametar prema komponenti boje
US10623759B2 (en) 2012-06-13 2020-04-14 Sony Corporation Decoupling enhancements in sample adaptive offset (SAO) for high efficiency video encoder (HEVC)
CN107249132B (zh) * 2012-07-02 2020-09-15 索尼公司 对于高效率视频编码器的采样自适应偏移的解耦增强
KR101413154B1 (ko) 2013-01-11 2014-07-02 한밭대학교 산학협력단 고효율 비디오 코딩 복호기에 적용되는 적응적 샘플 오프셋 보정장치
JP6171584B2 (ja) * 2013-05-31 2017-08-02 富士通株式会社 動画像符号化装置、動画像符号化方法、および動画像符号化プログラム
JP6174966B2 (ja) * 2013-10-17 2017-08-02 キヤノン株式会社 画像符号化装置、画像符号化方法、及びプログラム
JP6289055B2 (ja) * 2013-11-27 2018-03-07 三菱電機株式会社 動画像符号化装置及び動画像復号装置
JP6253406B2 (ja) 2013-12-27 2017-12-27 キヤノン株式会社 画像符号化装置、撮像装置、画像符号化方法、及びプログラム
JP6270472B2 (ja) * 2013-12-27 2018-01-31 キヤノン株式会社 画像符号化装置、画像符号化方法、及びプログラム
JP2017085496A (ja) 2015-10-30 2017-05-18 キヤノン株式会社 動画像符号化装置及びその制御方法、コンピュータプログラム

Also Published As

Publication number Publication date
JP2012005113A (ja) 2012-01-05

Similar Documents

Publication Publication Date Title
KR101433501B1 (ko) 비디오 코딩을 위한 적응적 오프셋 복원 장치 및 방법
JP5165083B2 (ja) ビデオコーディングの適応オフセットに用いる装置および方法
US11064209B2 (en) System and method for content adaptive clipping
US9641863B2 (en) Apparatus and method of sample adaptive offset for video coding
EP2708027B1 (en) Method and apparatus for reduction of in-loop filter buffer
KR101752612B1 (ko) 비디오 코딩을 위한 샘플 적응적 오프셋 프로세싱의 방법
WO2012092787A1 (en) Apparatus and method of efficient sample adaptive offset
CN114424574A (zh) 编解码块的缩放过程
WO2024017010A1 (en) Method and apparatus for adaptive loop filter with alternative luma classifier for video coding
WO2024055842A1 (en) Method and apparatus for adaptive loop filter with non-sample taps for video coding
WO2023274370A1 (en) Advanced bilateral filter in video coding
WO2022268185A1 (en) Bilateral filter in video coding
US9918096B2 (en) Method for selecting a pixel positioning solution to obtain an optimal visual rendition of an image

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121016

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5165083

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250