JP2011528873A - ブロックアーチファクトを平滑化することによって圧縮映像信号の品質を向上させるシステム及び方法 - Google Patents

ブロックアーチファクトを平滑化することによって圧縮映像信号の品質を向上させるシステム及び方法 Download PDF

Info

Publication number
JP2011528873A
JP2011528873A JP2011518992A JP2011518992A JP2011528873A JP 2011528873 A JP2011528873 A JP 2011528873A JP 2011518992 A JP2011518992 A JP 2011518992A JP 2011518992 A JP2011518992 A JP 2011518992A JP 2011528873 A JP2011528873 A JP 2011528873A
Authority
JP
Japan
Prior art keywords
region
smoothing
video
block
image frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011518992A
Other languages
English (en)
Inventor
ブルートン,レオナード,トーマス
ランカスター,グレッグ
ロウ,ダニー,ディ
シャーウッド,マット
Original Assignee
ワールドプレイ・(バルバドス)・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ワールドプレイ・(バルバドス)・インコーポレイテッド filed Critical ワールドプレイ・(バルバドス)・インコーポレイテッド
Publication of JP2011528873A publication Critical patent/JP2011528873A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20052Discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、圧縮映像信号の表示に必要な所与のデータ量に関して、典型的な人間の視聴者に知覚される際の、解凍され表示されたリアルタイム映像の品質を向上するシステム及び方法に関する。本明細書におけるシステム及び方法は、ブロック位置のアプリオリな知識を必ずしも有さず、ブロックの出現を減衰することによって、この向上を達成する。本明細書に記述される方法は、HVSによって知覚される際の、結果として得られるリアルタイム映像の品質が向上するように、それらのブロックの出現を減衰する。

Description

本開示は、デジタル映像信号に関し、特に、圧縮デジタル映像信号を非ブロック領域とディテール領域に分離することによって、また非ブロック領域を平滑化することによって、圧縮デジタル映像信号の品質を向上させるシステムおよび方法に関する。
映像信号が、テキスト情報または音声信号の表現に必要なデジタルデータの量と比べて、大量のデジタルデータによって表されることは周知である。それ故、デジタル映像信号は、高ビットレートで送信される場合および特にこれらのビットレートが映像表示デバイスで求められるリアルタイムデジタル映像信号に対応しなければならない場合に、相対的に広帯域を占める。
特に、ケーブルやファイバ等の通信チャネルを介する、大量の個別映像信号の同時送受信は、様々な通信チャネルにおける利用可能な帯域を共有する方法でこれらの映像信号を周波数分割多重化または時分割多重化することによって行われることが多い。
デジタル映像データは、通常、音声およびその他のデータと共に、国際的に合意されたフォーマット規格(例えば、MPEG2,MPEG4,H264)に従ってフォーマットされたメディアファイルに埋め込まれる。そのようなファイルは、通常、インターネットを通じて配信または多重化され、コンピュータ、携帯電話、デジタルビデオレコーダのデジタルメモリ内およびコンパクトディスク(CD)およびデジタルビデオディスク(DVD)上に夫々記憶される。これらのデバイスの多くは、物理的に且つ識別不能に併合して単一のデバイスになっている。
フォーマットされたメディアファイルを作成する過程では、ファイルデータは、それらの表示に必要なデジタルデータ量を減少させるために、様々なレベルおよび方式のデジタル圧縮を受け、それによって、多数のその他の映像ファイルと共に多重化される場合にそれらの正確な同時送信に必要な帯域だけでなく、必要なメモリストレージを減少させる。
インターネットは、映像データの配信の特に複雑な例を提供するが、そこでは、中央サーバからエンドユーザへのダウンロード送信中に、多様な方法および多様なチャネル(即ち、経路)を介して映像ファイルが多重化される。しかし、ほぼ全ての場合に、所与の元のデジタル映像ソースおよびエンドユーザが受信して表示する映像の所与の品質にとって、結果得られる映像ファイルが最小限のサイズに圧縮されることが望ましい。
フォーマットされた映像ファイルは、完全にデジタル化された映画を表示することができる。映画ファイルは、即時に表示してリアルタイムで視聴するため、またはデジタルビデオレコーダ等のエンドユーザ記録デバイスに記憶し、後にリアルタイムで視聴するための「オンデマンド」でダウンロードされてもよい。
従って、これらの映像ファイルの映像コンポーネントの圧縮は、送信上、帯域を節約するだけでなく、そのような映画ファイルを記憶するのに必要なメモリ全体を減少させる。
上記の通信チャネルの受信機端では、通常、単一ユーザ計算記憶デバイスが採用される。そのような単一ユーザデバイスの現在典型的な例は、パーソナルコンピュータおよびデジタルセットトップボックスであり、それらのいずれかまたは両方は、通常、エンドユーザの映像表示デバイス(例えば、テレビ)に出力接続され、且つ、直接的または間接的に、通信回線に接続された銅配線ケーブル線(即ち、ケーブルテレビ)に入力接続される。通常、このケーブルは、何百個もの多重化されたデジタル映像信号を同時に伝達し、ローカルの映像プログラム配信事業者からの地上波映像信号を伝達する光ファイバーケーブルに入力接続されることが多い。エンドユーザの衛星放送受信アンテナも放送映像信号の受信に使用される。エンドユーザが地上波ケーブルを介して配信される映像信号を採用しようと衛星を介して配信される映像信号を採用しようと、通常、エンドユーザデジタルセットトップボックスまたはそれらに相当するものを使用して、デジタル映像信号を受信し、視聴すべき特定の映像信号(即ち、いわゆるテレビチャンネルまたはテレビプログラム)を選択する。これらの送信されたデジタル映像信号は、圧縮されたデジタルフォーマットであることが多く、従ってエンドユーザによって受信後にリアルタイムで解凍されるはずである。
映像圧縮の多くの方法は、元の非圧縮映像信号のデジタル近似値のみを保持することによってデジタル映像データ量を減少させる。その結果、圧縮前の元の映像信号と解凍された映像信号の間には測定可能な差が存在する。この差は映像歪として定義される。映像圧縮の所与の方法では、圧縮された映像データのデータ量がこれらの方法に対して異なるパラメータを選択することによって減少するにつれて、映像歪の程度は大抵大きくなる。即ち、映像歪は、圧縮のレベルが増加するにつれて増加する傾向がある。
映像圧縮のレベルが増加するにつれて、映像歪は最終的に人間の視覚系(HVS)に視認可能になり、最終的にこの歪みは選ばれた表示デバイス上でリアルタイム映像の典型的な視聴者にとって視覚上不快になる。映像歪は、いわゆる映像アーチファクトとして観察される。アーチファクトは、元の非圧縮映像のシーンに属さないものとしてHVSによって解釈される、観察された映像コンテンツである。
圧縮中または圧縮後に、圧縮された映像から視覚上不快なアーチファクトを大幅に減衰する方法が存在する。これらの方法のほとんどは、ブロックベースの二次元(2D)離散コサイン変換(DCT)を採用する圧縮方法またはそれに近似するものにのみ適用する。以下において、本発明者らはこれらの方法をDCTベースと呼ぶ。このような場合、とりわけ視覚上不快なアーチファクトは、表示された映像のシーンにおけるアーチファクトブロックの出現である。
通常、これらのブロックを検索することによってまたはこれらのブロックが映像の各フレームの何処に位置しているかというアプリオリな知識を要求することによって、アーチファクトブロックを減衰する方法が存在する。
視覚上不快なアーチファクトの出現を減衰するという問題は、映像データが恐らく2回以上事前に圧縮および解凍されている、または映像データが事前にサイズ変更、再フォーマットまたは再混色されているというよくある場合に、特に難しい。例えば、映像データは、NTSCからPALフォーマットに再フォーマットされていたり、RGBからYCrCbフォーマットに変換されていたりする可能性がある。そのような場合、アーチファクトブロックの位置のアプリオリ知識はほぼ確実に不明であるため、この知識に依存する方法は機能しない。
映像アーチファクトの出現を減衰する方法は、圧縮された映像データの表示に必要な全データ量を大きく増加させてはならない。この制約が主要な設計課題である。例えば、表示された映像の各フレームにおける各ピクセルの三原色の各々は通常8ビットで表され、従って1カラーピクセルあたり24ビットになる。例えば、視覚上不快なアーチファクトが明確に認識できる圧縮の限界にまで達したとすると、H264(DCTベース)映像圧縮規格では、最低で1ピクセルあたり約1/40ビットに相当する映像データの圧縮が可能である。従って、これは40×24=960よりも優れた平均圧縮比に相当する。そのため、この圧縮比において、映像アーチファクトを減衰するいずれの方法も、1ピクセルあたり1/40ビットに対して僅かなビット数を追加しなければならない。圧縮比が高過ぎて1ピクセルあたりの平均ビット数が概して1/40ビット未満である場合にはブロックアーチファクトの出現を減衰する方法が必要である。
DCTベースおよびその他のブロックベース圧縮方法に関して、最も重大な視覚上不快なアーチファクトは、典型的には時間、サイズおよび方位によって映像シーンの局所的な時空間特性に依存する方法により変化する小さな矩形ブロックの形状である。特に、アーチファクトブロックの性質は、映像シーンにおけるオブジェクトの局所運動に依存し、これらのオブジェクトが含む空間的ディテール量に依存する。特定の映像に関して圧縮率が増加するにつれて、MPEGベースDCTベースビデオエンコーダは、各ブロック内のピクセルの輝度を表す、いわゆる量子化された基底関数に徐々に少ないビットを割当てる。各ブロックに割当てられるビット数は、HVSに関する幅広い心理視覚知識に基づいて決まる。例えば、ビデオオブジェクトの形状およびエッジならびにそれらの運動の平滑な時間軌跡は、心理視覚的に重要であり、従ってビットは、全てのMPEG DCTベースの方法と同様に、それらの忠実度を確保するように割当てられなければならない。
圧縮のレベルが増加するにつれ、上記忠実度を保持するという目的において、圧縮方法(いわゆるエンコーダにおける)は、最終的に、各ブロックに一定の(またはほぼ一定の)輝度を割当てるが、通常、最も視覚上不快なのがこのブロックアーチファクトである。ブロックアーチファクトの相対的均一輝度が、それらの直近のブロックの相対的均一輝度より3%超大きい場合、これらのブロックを含む空間領域は視覚上不快であると推測される。ブロックベースDCT型方法を使用して大きく圧縮されている映像シーンにおいては、多くのフレームの大領域がそのようなブロックアーチファクトを含む。
本発明は、圧縮映像信号の表現に必要な所与のデータ量に関して、典型的な人間の視聴者に知覚される際の、解凍され表示されたリアルタイム映像の品質を向上するシステム及び方法に関する。本明細書におけるシステム及び方法は、ブロック位置のアプリオリな知識を必ずしも有することなくブロックの出現を減衰することによって、この向上を達成する。幾つかの実施形態では、本明細書に記述された方法は、HVSによって知覚される際の、結果として得られるリアルタイム映像の品質が向上するように、それらのブロックの出現を減衰する。
圧縮映像と解凍映像との間の輝度の差の点では、ブロック状領域が、映像歪全体の数学的メトリックの最大の寄与因子ではない可能性がある。典型的には、映像の細かな領域には大幅な数学的歪が存在するが、HVSがブロックアーチファクトによる歪を知覚するほど即座にはその歪を知覚しないという事実の利点がある。
本明細書に記載の実施形態では、本方法の第1のステップが、各フレームのデジタル表現を、非ブロック領域とディテール領域と呼ばれる2つの部分に分離する。本方法の第2のステップは、ブロックアーチファクトが減衰するように非ブロック領域を処理して、平滑化された非ブロック領域を生じる。本方法の第3のステップが、平滑化された非ブロック領域とディテール領域を再結合する。
一実施形態において、非ブロック領域の同定は、候補領域の選択から始まり、
a.輝度の平滑性基準(F)、
b.不連続性基準(D)及び
c.先読み/後読み基準(L)
等の、一連の基準を使用して周囲の隣接領域に対して各候補領域を比較する。
上記では、以下の本発明の詳細な記述がより良く理解されるように、本発明の特徴および技術的利点をやや広範に概説している。本発明の更なる特徴および利点が以下に記述され、本発明の特許請求の主題を形成する。開示される概念および具体的な実施形態が、本発明と同一の目的を遂行するその他の構造を改良または設計する基礎として容易に利用可能であることは、当業者には理解されるはずである。また、そのような等価の構造物は、添付の特許請求の範囲に明記された発明の趣旨および範囲から逸脱するものでないことも、当業者には理解されるべきである。本発明の特徴と考えられる新規の特徴は、その構成および動作方法の両者について、更なる目的および利点と共に、添付の図面と関連して考察される以下の記述からより良く理解されるだろう。しかしながら、各図面は、図示および説明のみの目的で提供されており、本発明の限界を定義するものとしては意図されないことが明示的に理解される。
本発明のより完全な理解のために、添付の図面とともに以下の記述を参照する。
典型的なブロック状の画像フレームを示す図である。 図1に対応する非ブロック領域(黒色で表示)とディテール領域(白色で表示)を示す図である。 フレームにおける孤立したピクセルを選択する一例を示す図である。 互いにxピクセル離れ、非ブロック基準を満たさないためディテール領域DETに属する候補ピクセルCの拡大図を例示する図である。 9ピクセルによる十字マスクを使用することによってブロックを非ブロック領域に指定する方法の一実施形態を例示する図である。 画像フレーム内の特定の位置に使用された9ピクセルによる十字マスクの例を示す図である。 ビデオ画像品質を向上させる方法の一実施形態を示す図である。 本明細書に記載の概念の使用の一実施形態を示す図である。
開示される実施形態の一態様は、平滑性基準および不連続性基準を使用して映像信号の各フレームにおいて非ブロック化するための領域を同定することによってリアルタイムの映像信号におけるブロックアーチファクトの出現を減衰することである。ロバスト性を更に向上させるために、更に勾配基準を組み合わせることも出来る。これらの概念の使用により、映像ファイルのサイズ(または映像信号の送信に必要なビット数)を縮小することが出来、縮小したファイルサイズに関連するアーチファクトの視覚効果を減少することが出来る。
これらの概念を実行する方法の一実施形態は、映像信号の画像フレームに対する以下の3つの部分から構成される。
1.いわゆるディテール領域(DET)から非ブロック領域を識別する、非ブロック領域(DEB)を同定する処理
2.非ブロック領域DEBに適用される、非ブロック領域におけるブロックアーチファクトの出現を空間的平滑化により減衰する目的の演算
3.部分2において得られた平滑化非ブロック領域を、ディテール領域と結合する処理。
この実施形態の方法では、空間的平滑化演算は非ブロック領域外では動作しない。同様に、空間的平滑化演算はディテール領域内では動作しない。本明細書に記載のように、平滑化が非ブロック領域の外で起こらないように、空間的平滑化演算が非ブロック領域DEBの境界線に到達したことを判断する方法が採用される。
事前にブロックベース型の映像圧縮(例えば、DCTベースの圧縮)および解凍を受け、サイズ変更および/または再フォーマットおよび/または再混色を受けている可能性のある映像信号は、典型的には、事前の圧縮演算中に最初に発生したブロックアーチファクトの視覚上不快な残存物を含む。従って、ブロック起因性アーチファクトの除去は、最後または現行の圧縮演算において創出されたブロックの出現のみの減衰では、完全には達成されない。
多くの場合、事前に創出されたブロックの位置に関するアプリオリな情報は得られず、位置が不明のブロックは、不快なアーチファクトの一因となる場合が多い。この方法の実施形態は、ブロックの位置のアプリオリな知識を必要としない基準によって、非ブロック化されるべき領域を同定する。
一実施形態において、輝度の平滑性基準方法を採用し、且つ輝度不連続性基準および/または輝度勾配基準を使用して、個々のブロックの位置を明確に見つけるまたは同定することなく、非ブロック化されるべき各映像フレームの非ブロック領域を同定する。非ブロック領域は、典型的には、各フレームにおいて、様々なサイズおよび形状の多数の小領域で構成されている。この方法は、画像フレーム内の情報のみに依存し、その画像フレームにおける非ブロック領域を同定する。同定後、画像フレームの残りの領域はディテール領域として定義される。
映像シーンはビデオオブジェクトで構成される。これらのオブジェクトは、典型的には、輝度エッジの位置および運動、およびそれらの内部のテクスチャに関して、(HVSおよび関連する神経反応によって)識別および認識される。例えば、図1は、リアルタイムで表示された際に対応する映像クリップにおいて同様に出現する視覚上不快なブロックアーチファクトを含む典型的な画像フレーム10を示す。典型的には、瞬時に、HVSは対応する映像クリップにおける元のオブジェクトを知覚および認識する。例えば、顔オブジェクト101およびその目14や鼻15等のサブオブジェクトは、同様にリボン13やつば12等のサブオブジェクトを含む帽子とともに、HVSによって素早く同定される。HVSは、顔の広大なエリアを、ほぼディテールが無く、その色と滑らかな陰影によって特徴付けられる肌のテクスチャとして認識する。
図1の画像フレームでは明確には視認できないが、対応する電子表示されたリアルタイムの映像信号では明確に視認することが出来るブロックアーチファクトは、様々なサイズを有しており、その位置は、最後の圧縮演算中に創出されたブロックの位置に限定されない。最後の圧縮動作中に創出されたブロックのみの減衰では不十分であることが多い。
この方法は、HVSが、元の画像における略一定の輝度または滑らかに変化する画像輝度である画像の比較的広大なオープンエリアに位置するブロックアーチファクト(および関連するエッジ輝度不連続部)を特に認識し、且つそれに対して敏感であるという心理視覚性質を利用する。例えば、図1において、HVSは、帽子の縞模様の間に位置するブロックアーチファクトには比較的気付かないが、顔上の肌の広大な滑らかな陰影のある領域に出現するブロックアーチファクトは特に認識し、且つそれに対して敏感であり、また帽子のつば(の底部)左側の広大なオープンエリアにおけるブロックアーチファクトに対しても敏感である。
ブロックアーチファクトに対するHVSの感受性の他の例として、HVSが、光を照らされた壁等のむらなく着色された平坦な陰影のある表面を知覚した場合、約3%超のブロックエッジ輝度不連続部が視覚上不快である一方、高度なテクスチャの草原等の、高度なテクスチャのオブジェクトの映像イメージにおける同様なブロックエッジ輝度不連続部は、典型的には視認不可能である。高度な空間的ディテールの領域におけるブロックよりも広大でオープンな滑らかな輝度の領域におけるブロックを減衰する方がより重要である。この方法は、HVSのこの特性を利用する。
しかしながら、上記の壁が小さな孤立された領域を除く視野から遮蔽される場合、HVSはブロックアーチファクトに対して再び相対的に非認識になる。即ち、HVSはこれらのブロックにはあまり敏感ではない、というのも、これらの領域は滑らかな輝度の領域に位置しているが、十分に大きくはないからである。この方法は、HVSのこの特性を利用する。
画像フレームに対してこの方法を適用すると、結果として画像は少なくとも2つの領域、即ち非ブロック領域および残りのディテール領域に分離される。この方法は、階層においても適用出来るため、次に、上記の最初に同定されたディテール領域それ自体が第2の非ブロック領域と第2のディテール領域に分離する等、再帰的に実施される。
図2は、非ブロック領域(黒色で表示)とディテール領域(白色で表示)を同定した結果20を示す。目14、鼻15および口は、縞模様のきめ細かいテクスチャを有する帽子の右側領域のほとんどがそうであるように、顔オブジェクトのディテール領域(白色)に属している。しかしながら、帽子の左側のほとんどは、輝度が略一定の領域であるので、非ブロック領域に属しており、また、つば12のエッジは、明確な不連続部の領域であり、ディテール領域の細い線部に対応する。
以下に記述されるように、非ブロック領域は、HVSがブロックアーチファクトを最も感知し、またそれに対して敏感である領域であり、従って、非ブロック化されるべき領域であるということを確認する基準が採用される。ディテール領域は、従って、HVSがブロックアーチファクトに対してあまり敏感ではない領域である。この方法では、非ブロック領域の非ブロック化を、空間的な輝度平滑化によって達成することも出来る。空間的な輝度平滑化プロセスは、ローパスフィルタリングまたは他の手段によって達成することができる。輝度平滑化によって、平滑化されるべき領域のいわゆる高い空間周波数が大幅に減衰され、それによってブロックアーチファクトのエッジに関連する輝度のエッジ不連続部が大幅に減衰される。
この方法の一実施形態は、空間的不変ローパスフィルタを採用して、同定された非ブロック領域を空間的に平滑化する。このようなフィルタは、無限インパルス応答(IIR)フィルタまたは有限インパルス応答(FIR)フィルタもしくはこのようなフィルタの組み合わせであってよい。これらのフィルタは、典型的にはローパスフィルタであり、非ブロック領域のいわゆる高い空間周波数を減衰し、それによって輝度を平滑化してブロックアーチファクトの出現を減衰するために採用される。
非ブロック領域DEBおよびディテール領域DETの上記定義は、いずれかまたは両方の領域の更なる信号処理を妨げることはない。特に、この方法を使用して、DET領域を、新たな領域DET1およびDEB1へ更に分離することが出来、DEB1は、別の非ブロック化方法またはDEBを非ブロック化するのに使用される他のフィルタを使用する可能性がある非ブロック化に関する第2の領域である(DEB1∈DET)。DEB1およびDET1は、明らかにDETの小領域である。
非ブロック領域(DET)を同定することは、リアルタイムで映像を流す能力を有する同定アルゴリズムを必要とする場合が多い。このようなアプリケーションに関しては、ハイレベルな計算複雑性(例えば、1秒あたり多数の乗累算演算(MAC)を採用する同定アルゴリズム)は、比較的少数のMAC、および整数で演算する単純な論理ステートメントを採用する同定アルゴリズムに比べて、あまり望ましくない傾向にある。この方法の実施形態は、比較的少数のMACを使用する。同様に、この方法の実施形態は、オフチップメモリへのおよびオフチップメモリからの大量のデータのスワッピングを確実に最小限度に抑える。この方法の一実施形態において、領域DEB(およびそれによって領域DET)を決定するための同定アルゴリズムは、大幅に圧縮された映像クリップにおいて最も視覚上不快なブロックが、それらの内部全体に渡って略一定の輝度を有するという事実を利用する。
この方法の一実施形態において、非ブロック領域DEBの同定は、フレームにおける候補領域Cを選択することによって開始する。一実施形態において、これらの領域Cは、空間サイズにおける1ピクセルと同じくらい小さい。その他の実施形態では、サイズが1ピクセルよりも大きな候補領域Cを使用することも出来る。各候補領域Cは、一連の基準によって周囲の近隣領域に対して検査され、この基準を満たせば、Cは画像フレームの非ブロック領域DEBに属するものとして分類される。Cが非ブロック領域に属さなければ、Cはディテール領域DETに属するものとして設定される。これは、全Cの集合体がDEBに等しいことを意味するのではなく、単にそれらがDEBの部分集合を形成することを意味していることに留意すべきである。
この方法の一実施形態において、Cが非ブロック領域DEBに属するか否かを決定するために使用される一連の基準は、以下のように分類され得る。即ち、
a.輝度平滑性基準(F)、
b.不連続性基準(D)および
c.先読み/後読み基準(L)。
上記の基準(またはそれらのあらゆる有益な組み合わせ)が満たされれば、候補領域Cは非ブロック領域に指定される(即ち、C∈DEB)。そうでなければ、候補領域Cはディテール領域DETに指定される(C∈DET)。特定の映像クリップを非ブロック化する時等、特定の実行においては、全3種類の基準(F,DおよびL)が必要でない可能性もある。更に、これらの基準は、画像フレームの局所的な性質に基づいて改良してもよい。そのような局所的な性質は、統計に基づくものである可能性もあれば圧縮および解凍処理の一部として使用される量子化パラメータや運動パラメータ等の、エンコーダ/デコーダに関連する性質である可能性もある。
この方法の一実施形態において、計算の効率化のために、画像フレームにおいて候補領域Cがまばらに分布するように、候補領域Cが選択される。これは、各フレームにおける候補領域Cの数を大幅に減少し、それによってアルゴリズムの複雑性を減少させてアルゴリズムのスループット(即ち、速度)を増加させる効果を有する。
図3は、フレームの小領域に関して、前記基準に照らして図1の画像フレームをテストするのに採用可能な、選択されたまばらに分布したピクセルを示す。図3では、ピクセル31−1乃至31−6は、水平および垂直両方向に互いに7ピクセル分、離れている。これらのピクセルは、元の画像におけるピクセル数の約1/64を占め、非ブロック領域を同定するのに使用される任意のピクセルベースのアルゴリズムが、各フレームにおいてピクセル数の1/64にのみ動作し、それによって複雑性を減少させてピクセル毎に基準をテストする方法に比べてスループットを増加させることを意味している。
この説明例では、図1に対する非ブロック化基準を図3におけるまばらに分布した候補領域に適用すると、図4に例示するように、対応するまばらに分布したC∈DEBとなる。
この方法の一実施形態において、全非ブロック領域DEBは、上述のまばらに分布した候補領域C∈DEBから周囲領域へ「成長」する。
図2における非ブロック領域の同定は、例えば、Nを7ピクセルに設定することによって、図4のまばらに分布したCから「成長させ」、それによって、候補領域ピクセルCのまばらな分布を、切れ目なく結合される性質を有する図2の一層大きな非ブロック領域へ「成長」させる。
上記の成長処理は、まばらに分布したC∈DEBを空間的に接続し、全非ブロック領域DEBを形成する。
この方法の一実施形態において、上記の成長処理を、最も近い候補領域ピクセルCからのピクセルの水平または垂直距離である適切な距離メトリックに基づいて行う。例えば、垂直および水平方向に7ピクセル離れて選ばれた候補領域ピクセルCでは、結果として得られる非ブロック領域は図2に示す通りである。
一つの拡張として、ディテール領域DETを、予め決定した非ブロック領域内へ拡大するために、ディテール領域DETに成長処理を適用する。これは、空間的に不変のローパス平滑化フィルタの十字マスクが元のディテール領域内に突出することを防ぎ、それによって創出される可能性のある望ましくない「ハロー(halo)」効果を回避するために使用することが出来る。そうすることで、ディテール領域は、その拡大した境界線では、ブロック、またはそれらの一部分を減衰されずに含む可能性がある。これは、このようにディテール領域に最も近接したブロックアーチファクトに対してHVSが相対的に鈍感なため、現実には問題にならない。
代替の距離メトリックを採用してもよい。例えば、候補領域Cを中心とする所定の半径の円内の画像フレーム全領域に対応するメトリックを採用してもよい。
上記またはその他の成長処理によって得られる非ブロック領域は、画像フレームの非ブロック化されるべき部分を包含する(即ち空間的に覆う)性質を有する。
上記の成長処理を形式化すると、全非ブロック領域DEB(または全ディテール領域DET)は、周囲の成長した領域Gによって各候補領域C(基準C∈DEBまたはC∈DETを満たす)を包囲することによって決定することが出来る。ここで、全非ブロック領域DEB(または全ディテール領域DET)は、全Cおよび全Gの和集合である。
同様に、全非ブロック領域は論理的に、
Figure 2011528873
と表すことが出来、∪は領域の和集合であり、DETは単に画像フレームの残りの部分である。あるいは、
Figure 2011528873
に従って(CはDEBに属さない)を使用して候補領域を限定することから全ディテール領域DETを決定してもよい。
成長した周囲領域G(図3の32−1乃至32−N)が十分に大きければ、それらの領域は、画像フレームの拡大したエリアに接触した非ブロック領域DEBを創出するように隣同士が重複または接触するように配置されてもよい。
この方法の一実施形態は、図5に例示され、非ブロック領域にまたはディテール領域DETに指定されるべき候補領域ピクセルCを同定するための9ピクセルによる十字マスクを採用する。この実施形態では、候補領域Cは、1×1ピクセル(即ち、単一ピクセル)のサイズである。十字マスクの中心(ピクセル51)はピクセルx(r,c)にあり、(r,c)はそのピクセルの行列位置を示し、典型的に輝度xがx∈[0,1,2,3,...255]によって与えられる。この実施形態では、十字マスクが、+(十字)を形成する互いに垂直な2本の単一ピクセル幅の線で構成されることに留意すべきである。
図5において、8個の独立した平滑性基準をax、bx、cx、dx、ay、by、cyおよびdyとラベル付けし、その8個の対応するピクセル位置に適用する。以下では、十字マスク52の内側および適宜十字マスク52の外側に不連続性(即ち、輝度勾配)基準を適用する。
図6は、画像フレーム60内の特定の位置に使用された9ピクセルによる十字マスク52の一例を示す。十字マスク52は、特定の位置に関して例示されるが、一般に、画像フレームにおける多数位置において、基準に照らしてテストされる。画像フレーム60の位置61等、特定の位置に関して、十字マスク52の中心、および8個の輝度平滑性基準ax、bx、cx、dx、ay、by、cyおよびdyを、基準に照らして適用する。
これらの8個の平滑性基準に関して使用される特定の同定アルゴリズムは、同業者に周知のアルゴリズムの中の一つでもよい。8個の平滑性基準は、論理表記ax∈F、bx∈F、...、dy∈Fを書き込むことによって満たされる。満たされる場合、対応する領域は、どのような輝度平滑性基準を採用していても「十分に平滑」である。
以下の例示の論理条件を使用して各候補ピクセルx(r,c)に関して全体的な平滑性基準が満たされるか否かを決定してもよい。即ち、
(ax∈Fおよびbx∈F)または(cx∈Fおよびdx∈F) (1)
および、
(ay∈Fおよびby∈F)または(cy∈Fおよびdy∈F) (2)
ならば、
∈平滑である。
同様に、上記のブールステートメントは、以下の3つの条件のうち少なくとも一つの条件下で、C∈平滑というステートメントが真であるという結果をもたらす。即ち、
a)十字マスク52が、全体が十分に平滑な輝度である9ピクセル領域上に存在し、従って、十字マスク52が、完全にブロックの内側に存在する十分に平滑な領域を含む、
または、
b)十字マスク52が、(r+1,c)または(r+2,c)または(r−1,c)または(r−2,c)の4か所のうち1か所で不連続部上に存在するが、残りの3か所では平滑性を満たす、
または、
c)十字マスク52が(r,c+1)または(r,c+2)または(r,c−1)または(r,c−2)の4か所のうち1か所で不連続部上に存在するが、残りの3か所では平滑性を満たす。
候補ピクセルを同定するために必要とされる、上記の処理では、十字マスク52は、C∈平滑というステートメントが真であることを維持しながら、ブロックの位置に関わらず、ブロックの不連続な境界線、またはブロックの一部を空間的に覆う。
上記の論理の更に詳細な説明は以下の通りである。(1)および(2)における全ての括弧付きステートメントが真ならば、条件a)は真である。b)において与えられた位置のうち1か所に不連続部が存在すると仮定する。すると、括弧付きステートメントのうちの1つが真であるので、ステートメント(2)は真である。c)において与えられた位置のうちの一つに不連続部が存在すると仮定する。すると、括弧付きステートメントの一つが真であるので、ステートメント(1)は真である。
上記のブール論理を使用すると、十字マスク52が、その位置に関わらず、ブロックの境界線、またはブロックの一部を描く不連続部にまたがる場合、平滑性基準が満たされる。
(候補ピクセルCに適用される)平滑性基準Fを決定するための特定のアルゴリズムを採用することは、本方法にとって重要ではない。しかし、高スループット能力を達成するために、一例のアルゴリズムは、いわば「水平方向に隣接したピクセルと垂直方向に隣接したピクセル間の輝度の第1前方差分の大きさ」である、ax、bx、cx、dx、ay、by、cyおよびdyの単純な数学的平滑性基準を採用する。例えば、二次元シーケンスx(r,c)の垂直方向における第1前方差分は、単にx(r+1,c)−x(r,c)である。
上述の平滑性基準は、各映像信号に関する各フレームの各領域において領域DEBを同定するには不十分な場合もある。ここで、上記のC∈平滑という平滑性条件がCにおける候補ピクセルに関して満たされると仮定する。すると、この方法では、圧縮前後に、ブロックの境界線アーチファクトの一部である不連続部と元の画像に存在する所望のディテールに属する非アーチファクト不連続部との間の区別を向上させるため、マグニチュード不連続性基準Dを採用することも出来る。
マグニチュード不連続性基準方法は、単純な閾値Dを設定し、その閾値を下回れば、不連続部がブロック化のアーチファクトであると仮定する。輝度xに関してピクセルx(r,c)(61)をCに書き込むと、マグニチュード不連続性基準は、
dx<D
の形をとり、dxは、十字マスク52の中心(r,c)における輝度の不連続部のマグニチュードである。
Dの必要値は、圧縮アルゴリズムのイントラフレーム量子化ステップサイズから推察可能であり、同様に、デコーダおよびエンコーダから取得したり、既知の圧縮ファイルサイズから推定したりすることも出来る。このようにして、Dに等しいまたはDよりも大きい元の画像の変遷は、ブロック化アーチファクトの境界線と誤解され、誤って非ブロック化されることが無い。この条件を平滑性条件と組み合わせることで、より厳しい基準となる。
x(r,c)の輝度範囲の10%から20%に渡るDの値が、様々な異なる種類の映像シーンのブロックアーチファクトを十分に減衰することが分かっている。
∈平滑およびdx<D
非アーチファクト不連続部(従って非ブロック化されるべきではない)は、元の圧縮されていない画像フレームに含まれたものなので、ほぼ確実に存在する。このような非アーチファクト不連続部は、上記の基準に従うと、dx<Dを満たすことができ、周囲領域がC∈平滑をもたらす個所に存在することができ、従って、このような不連続部が上記の基準を満たし、それによって誤って非ブロック化に分類され、誤って平滑化されることに繋がる。しかしながら、このような非アーチファクト不連続部は、高度に局在した画像ディテールに相当する。実験によって、そのような誤った非ブロック化は、概して、HVSには不快ではないことが確認されている。しかしながら、そのような誤った非ブロック化という稀な例の可能性を大幅に減少させるために、本方法の以下の先読み(LA)および後読み(LB)の実施形態を採用してもよい。
特定のビデオ画像フレームにおいては、特別な数値的条件群が存在し、その条件下では、元の映像フレームにおいて必要な元のディテールが、上記の局所的平滑性および局所的不連続性の両方の条件を満たし、従って不正に同定される(即ち、不正な非ブロック化および不正な平滑化を受ける)ことが実験から判明している。同様に、ごく一部のCが、DETではなくDEBに誤って指定される可能性がある。この一例として、(圧縮されていない元の画像フレームにおける)オブジェクトのエッジの輝度の垂直配向の遷移は、非ブロック化の平滑性条件および不連続性条件の両方を満たす。これは、表示された対応するリアルタイムの映像信号における視覚上不快なアーチファクトに繋がる場合がある。
以下のLAおよびLB基準は任意であり、上記の特別な数値的条件を検討する。十字マスク52から十字マスク52の外側に適切に配置された位置までの画像の輝度変化を測定することによって検討を行う。
上記の基準C∈平滑およびdx<Dを満たし、また「先読みLA」閾値基準または「後読みLB」閾値基準Lを超えれば、候補Cピクセルは非ブロック領域に指定されない。導関数のマグニチュードに関して、LAおよびLBの一実施形態は、
(dxA≧L)または(dxB≧L)または(dxC≧L)または(dxD≧L)
ならば、
はDEBに属さない。
上記において、(dxA≧L)等の項は、単に、この場合、位置(r,c)から外側にピクセルAの位置までに測定されたLAマグニチュード勾配または変化基準dxのマグニチュードが閾値数L以上であることを意味する。他の3つの項は、位置B、CおよびDに関して同様の意味を有する。
上記のLAおよびLB基準の効果として、輝度マグニチュード変化の特定の距離L以内またはそれ以上の範囲内では非ブロック化され得ないことが保証される。
これらのLAおよびLBの制約は、不正な非ブロック化の可能性を減少するという所望の効果を有する。また、LAおよびLBの制約は、平滑性および不連続性基準に関わらず、輝度勾配のマグニチュードが高い個所に近い領域において望ましくない非ブロック化を防止するにも十分である。
のピクセルを非ブロック領域DEBに指定するために、上記3組の基準を組み合わせることによって得られる、組み合わせた基準の実施形態は、以下に一例の基準として表される。即ち、
∈平滑またはx<Dおよび((dxA<LおよびdxB<LおよびdxC<LおよびdxD<L))
ならば、
∈DEBである。
この方法の実施形態として、上記が真であることは、短整数で高速論理演算を使用するハードウェアで決定してもよい。異なる種類の多くの映像に対する上記基準の評価は、非ブロック領域DEB(およびそれによって補完的なディテール領域DET)を正確に同定する際のロバスト性を検証している。
多くの事前処理された映像は、「拡散した」ブロックエッジ不連続部を有する。視覚上不快でありながら、拡散したブロックエッジ不連続部は、垂直および/または水平方向の2個以上のピクセルにまたがる。これは、以下に例を用いて記述するように、非ブロック領域へのブロックエッジ不連続部の誤分類を招き得る。
例えば、基準不連続性閾値D=30で例えばx(r,c)=100からx(r,c+1)=140まで発生している、C∈平滑を満たす平滑な輝度領域を分離するマグニチュード40の水平な1ピクセル幅の不連続部を考える。この不連続部はマグニチュード40で、Dを超過し、ピクセルx(r,c)が非ブロック領域DEBに属さないことを意味している。マグニチュード40のこの同じ不連続部が、例えばx(r,c)=100からx(r,c+1)=120を経由してx(r,c+2)=140に至る拡散した不連続部の場合にどのように分類されるかを考える。この場合、(r,c)およびx(r,c+1)での不連続部は夫々マグニチュード20であり、値Dを超過しないので、誤った非ブロック化を発生させる。即ち、x(r,c)およびx(r,c+1)の両方が非ブロック領域DEBに誤って指定される。
同様の拡散したエッジ不連続部が垂直方向に存在する可能性がある。
最も一般的には、このような拡散した不連続部は2個のピクセルにまたがるが、大幅に圧縮された映像信号においては、3個のピクセルにまたがることが見られることもある。
拡散したエッジ不連続部を正確に分類するためのこの方法の一実施形態は、拡散した不連続部の境界線を同定し、それによって非ブロック化するのに使用可能な上記の9ピクセルによる十字マスク52の拡張型を採用することである。例えば、図5の9ピクセルによる十字マスク52において同定された全候補領域は1ピクセルのサイズであるが、同様の論理を採用して、十字マスクの全体が空間的に拡張される(即ち引き延ばされる)ことが出来ない理由はない。そのため、ax、bx、...等は、ピクセル2個分の間隔をあけ、2×2ピクセルの中心領域を包囲する。上記の組み合わせたピクセルレベルの非ブロック条件は有効なままであり、以下の3つの条件のうち少なくとも1つの条件下でC∈平滑であるように設計される。
d)十字マスク52(M)は、全体が十分に平滑な輝度である20個のピクセルによる領域上に存在し、従って、Mが完全にブロックの内側に存在する十分に平滑な領域を含む、
または、
e)十字マスク52は、(r+2:r+3,c)または(r+4:r+5,c)または(r−2:r+−1,c)または(r−4:r−3,c)の4か所の1×2ピクセル位置のうちの1か所で2ピクセル幅の不連続部上に存在し、残りの3か所では平滑性基準を満たす、
または、
f)十字マスク52は、(r,c+2:c+3)または(r,c+4:c+5)または(r,c−2:c−1)または(r,c−4:c−3)の4か所の1×2ピクセル位置のうちの1か所で2ピクセル幅の不連続部上に存在し、残りの3か所では平滑性基準を満たす。
このように、必要に応じて、十字マスクMは、それらの位置に関わらず、C∈平滑というステートメントが真であることを維持しつつ、ブロックの拡散した1ピクセル幅の境界線だけでなく2ピクセル幅の境界線も覆うことが出来る。20ピクセルによる十字マスクに必要な最低演算数は、9ピクセルの場合に必要な数と同じである。
上記の平滑性および不連続性基準を決定できる詳細事項には多くのバリエーションがある。例えば、「平滑性」の基準は、典型的には、追加的な計算コストおよびより遅いスループットの下では、分散、平均、標準偏差等の統計的尺度に加え、異常値の排除を含むことが出来る。同様に、不連続部の特定は、輝度の完全な変化よりも僅かな変化を伴うことが出来、十字マスクMは、不連続部が両方向にいくつかのピクセル上に拡散出来る様に拡張可能である。
上記基準の特定のバリエーションは、輝度の完全な変化よりも僅かな変化に関する。これは、HVSが輝度の僅かな変化に対してほぼ線形に応答するということが周知であるため重要である。僅かな変化に適応する上記の方法には、数多くの改良方法があり、それによって、特に画像フレームの暗領域において、非ブロック化に対する認識を向上させる。それらの方法は、
i.画像輝度x(r,c)を、候補ピクセルCとして平滑性および不連続性基準の直接の対象とせずに、輝度の対数C=logb(x(r,c))が一貫して使用され、底bは10または自然指数e=2.718...でもよい。
または
ii.輝度の差の大きさを直接採用せずに、僅かな差を、平滑性、不連続性、先読みおよび後読みの基準の全部または一部として直接使用する。例えば、平滑性基準は、
Figure 2011528873
における絶対輝度閾値eから、
Figure 2011528873
という式の相対閾値e等の、相対的輝度の項を含む閾値に修正してもよく、添付における例では、本発明者らは、e=3および、x(r,c)によって仮定出来る最大輝度であるIMAX=255を使用した。
候補領域Cは、アンダーサンプリングによってブロックアーチファクトのほとんどの境界線が見逃されないように、十分に密に画像フレームの二次元空間をサンプリングしなければならない。ブロックベースの圧縮アルゴリズムが、ほとんどのブロックのほとんどの境界線が両方向に少なくとも4ピクセルによって分離されることを保証すると仮定すると、この方法によって、ほぼ全てのブロック境界線の不連続部を見逃すことなく、各方向に4ピクセル置きに画像空間をサブサンプリングすることが可能である。各方向に8ピクセルまで実際に効果があることも分かっている。これは計算オーバーヘッドを大幅に減少させる。例えば、各方向に4ピクセル単位でのサブサンプリングは、非ブロック領域に属する不連続セットをもたらす。この方法の一実施形態は、このようなサブサンプリングを採用する。
候補ピクセル同士が両方向にLピクセル離れていると仮定する。すると、非ブロック領域は、まばらに分布した候補ピクセルから、L×Lの正方形ブロックで全候補ピクセルを包囲することによって得られる領域として定義してもよい。これは、効率的アルゴリズムによって容易に実行される。
一旦非ブロック領域が同定されると、視覚上不快なブロックノイズ(blockiness)の知覚を減衰するために非ブロック領域に適用可能な様々な非ブロック化方法が存在する。ある方法では、例えば、空間的不変ローパスIIRフィルタまたは空間的不変ローパスFIRフィルタまたはFFTに基づくローパスフィルタを使用することによって非ブロック領域に平滑化演算を適用する。
この方法の一実施形態は、平滑化演算の前に元の画像フレームをダウンサンプリングし、平滑化後に元の解像度にアップサンプリングする。この実施形態は、平滑化演算がより少数のピクセルに対して行われるので、より速い全体的平滑化を達成する。
再帰移動平均(即ち、ボックス)二次元フィルタ等の特定のフィルタを除いて、二次元FIRフィルタは、それらが実行しなければならない平滑化のレベルとともに増加する計算複雑性を有する。このようなFIR平滑化フィルタは、平滑化のレベルに略比例する多数のMACを必要とする。
(例えば量子化パラメータq>40を有する)高度に圧縮された映像は、典型的には、十分な平滑化効果を達成するために、11を超える次数のFIRフィルタを必要とし、これは1ピクセルにつき少なくとも11回の加算および最大10回の乗算に相当する。同レベルの平滑化は、はるかに小さい次数のIIRフィルタ、典型的には次数2のフィルタによって達成可能である。このような方法の一実施形態は、非ブロック領域を平滑化するためにIIRフィルタを採用する。
平滑化の他の方法は、空間的位置の関数として、フィルタの十字マスクを、ディテール領域に重複しないように変化させるように、平滑化フィルタを空間的に変化(即ち、空間的に適応)させることを除いて上記の方法と類似する。この方法では、フィルタの次数(ひいては十字マスクのサイズ)を、ディテール領域の境界に近づくにつれて適応するように減少させる。
計算コストは増加するが、必要なレベルの平滑化を達成するために、局所統計量に基づいて十字マスクのサイズも適応出来る。この方法は、フィルタの応答が、ディテール領域を上書きすること(それによって歪めること)、あるいは小さなディテール領域を貫通してディテール領域のエッジ周りに望ましくない「ハロー」効果を引き起こすことが出来ないように、空間的に異なるレベルの平滑化を採用する。
この方法の更なる改良形は、DETが境界線に沿って拡大するように、全キーフレームに関して上記のa)におけるディテール領域DETに「成長」処理を適用する。本文に記述された方法等、境界線を拡大するために成長に使用される方法、あるいは当業者に既知の別の方法を使用してもよい。この更なる改良形では、隣り合う画像フレーム同士に関するディテール領域として、結果として得られる拡大ディテール領域EXPDETを使用し、このディテール領域がこれらフレームのキャンバス画像CANを上書きする。これは、キーフレームにおけるディテール領域DET(およびその拡大領域EXPDET)を同定するだけでよいので、スループットを増加し、計算複雑性を減少させる。DETの代わりにEXPDETを使用する利点は、EXPDETが、DETによって覆うことが出来るものよりも高速移動するオブジェクトを効果的に覆うことである。これによって、所与の映像信号に関して、キーフレーム同士の間隔を更にあけることが出来、それによってスループットを向上して複雑性を減少させる。
この方法では、ディテール領域DETをその境界線で拡大し、非ブロック領域の非ブロック化に使用される平滑化演算によって引き起こされるあらゆる「ハロー」効果を空間的に覆い、それによって不可視にすることも出来る。
この方法の一実施形態において、二次元Z変換伝達関数
Figure 2011528873
を有する、空間的に異なる二次元の再帰移動平均フィルタ(即ちいわゆる二次元ボックスフィルタ)を採用し、二次元次数(L1,L2)の高速の再帰二次元FIRフィルタリングを促進する。対応する二次元再帰FIR入出力差分方程式は、
Figure 2011528873
であり、式中、yは出力、xは入力である。この実施形態は、演算複雑性が低く、平滑化のレベルとは無関係であるという利点を有する。
本方法の具体的な例では、次数パラメータ(L,L)は、空間的に変化する、即ち、上記の二次元FIR移動平均フィルタの空間性を、ディテール領域DETとの平滑化フィルタの応答の重複を回避するように適応させる。
図7は、本明細書に記載の概念を使用して向上したビデオ画像品質を達成するための、方法70等の方法の一実施形態を示す。この方法を実施するための一システムは、恐らく、プロセッサ82−1および/または84−1の制御下で、例えば、図8に示すシステム80で作動するソフトウェア、ファームウェア、またはASICが可能である。処理701は非ブロック領域を決定する。処理702によって決定されるように、全非ブロック領域を発見すると、次に、処理703が、全非ブロック領域、また暗に全ディテール領域を同定することが出来る。
次に、処理704は、平滑化を開始することが出来、処理705は、いつN番目の非ブロック領域の境界線に到達したか否かを決定し、処理706は、N番目の領域の平滑化がいつ完了したか否かを決定する。処理708は、値Nに1を加算することによってこの領域をインデックスし、全非ブロック領域が平滑化されたと処理707が決定するまで、処理704〜707を続ける。次に、処理709は、平滑化非ブロック領域を各ディテール領域に結合させ、向上した画像フレームに到達する。全非ブロック領域が平滑化するまで結合処理を始めるのを待つ必要はないことに留意すべきである。なぜならこれらの処理は、必要に応じて、並行して実行可能なためである。
図8は、本明細書に記載の概念の使用の一実施形態80を示す。システム80では、映像(および音声は、入力81として提供される。この映像は、図示しないローカルストレージからからでもよいし、または他の場所からの1つまたは複数の映像データストリームから受信される。この映像は、ライブビデオストリームや映像ファイル等の多くの形式で受信可能であり、エンコーダ82によって受信される前に事前圧縮されてもよい。エンコーダ82は、本明細書に記載の処理を使用して、プロセッサ82−1の制御下で映像フレームを処理する。エンコーダ82の出力は、ファイルストレージデバイス(図示せず)に対して接続されているか、デコーダ84等のデコーダに対して、恐らくネットワーク83を介して、ビデオストリームとして配信されてもよい。
2つ以上のビデオストリームがデコーダ84に配信される場合、デジタルストリームの様々なチャンネルは、本明細書に記載の処理に従ってデコーディングするためのチューナ84−2によって選択することが出来る。プロセッサ84−1は、このデコーディングを制御し、デコーディングされた出力ビデオストリームは、ストレージ85に格納する、または一つ以上のディスプレイ86によって表示する、あるいは、所望であれば、その他の場所に配信(図示せず)することが出来る。様々な映像チャンネルが、エンコーダ82等の一つの場所から、または図示しない異なる複数の場所から送信されることが出来る。デコーダからエンコーダへの送信は、送信媒体の帯域を節約しながら、有線送信または無線送信を使用するあらゆる周知の方法で実行可能である。
本発明およびその利点を詳細に記述したが、本明細書では、添付の特許請求項によって定義されるような本発明の趣旨および範囲から逸脱することなく、様々な変更、置換および改変が可能であることは理解されるはずである。更に、本出願の範囲を、本明細書に記述されたプロセス、機械、製造物、組成物、手段、方法およびステップの具体的な実施形態に制限する意図はない。当業者は、本明細書に記述された対応する実施形態と実質的に同じ機能を実行する、または実質的に同じ結果を達成する、現在存在するまたは後に開発されるプロセス、機械、製造物、組成物、手段、方法及またはステップを、本発明に従って利用してもよいことを、本発明の開示から容易に理解するだろう。従って、添付の特許請求項は、そのようなプロセス、機械、製造物、組成物、手段、方法またはステップを、それら請求項の範囲内に含むことを意図している。

Claims (51)

  1. HVSに対して視覚上の混乱を引き起こすアーチファクトを画像フレームから除去する方法であって、前記方法は、
    各画像フレームのデジタル表現を、非ブロック化されるべき非ブロック領域と、本質的に非ブロック化されないままであるべきディテール領域とに分離する工程を含む方法。
  2. 更に、
    各前記画像フレームの前記非ブロック領域を平滑化する工程、及び
    事前に分離された画像フレームと比較してHVSに対する視覚上の混乱が小さい新たな画像フレームを形成するために、前記平滑化された非ブロック領域と前記ブロック化していないディテール領域を結合する工程
    を含む、請求項1に記載の方法。
  3. 前記分離工程が、前記非ブロック領域を決定するために、輝度平滑性、不連続性、先読み、後読みのうちの少なくとも1つの基準を含む、請求項2に記載の方法。
  4. アーチファクトブロックの位置がアプリオリに未知である圧縮画像フレームに減衰が生じるように、前記基準のパラメータを選択する、請求項3に記載の方法。
  5. 前記アーチファクトブロックが、一度以上、事前に圧縮された、再フォーマットされた画像フレーム、混色された画像フレーム、サイズ変更された画像フレームのうち一つ以上に起因して前記圧縮映像フレームに生じる、請求項4に記載の方法。
  6. 前記輝度平滑性基準が、輝度の局所的分散および局所的平均からなる統計的尺度を採用する、請求項3に記載の方法。
  7. 輝度変化基準が輝度の僅かな変化に基づく、請求項3に記載の方法。
  8. 前記平滑化工程が、前記非ブロック領域を減衰するための空間的平滑化工程を含む、請求項2に記載の方法。
  9. 前記平滑化工程が、ブロックおよび前記非ブロック領域におけるその他のアーチファクトを減衰する工程を含む、請求項2に記載の方法。
  10. 前記分離工程が、DCTベースのエンコーダ内で生じる、請求項1に記載の方法。
  11. 前記平滑化工程が、FIRフィルタ、IIRフィルタの少なくとも一つを備える、請求項2に記載の方法。
  12. 前記フィルタが、空間的に可変または空間的に不変であるかのいずれかである、請求項11に記載の方法。
  13. 前記平滑化工程が、少なくとも1つの移動平均FIR二次元ボックスフィルタを備える、請求項11に記載の方法。
  14. 前記平滑化工程が、前記非ブロック領域の境界線の外側で平滑化が生じないことを確実にする手段を備える、請求項2に記載の方法。
  15. 前記分離工程が、前記画像フレームを非ブロック領域とディテール領域とに再帰的に分離する、請求項1に記載の方法。
  16. 前記分離工程が、
    候補領域を選択する工程、及び
    選択された候補領域毎に、選択された候補に関して、特定の基準に従って、選択された候補領域が前記非ブロック領域に属するか否かを決定する工程を含む、請求項1に記載の方法。
  17. 前記候補領域が各画像フレームにおいてまばらに位置する、請求項16に記載の方法。
  18. 前記ディテール領域周りにハロー効果を生じることなく前記非ブロック領域の空間的不変フィルタリングを可能にするように、分離されたディテール領域が拡大される、請求項17に記載の方法。
  19. 前記拡大が、各候補ピクセルを周囲矩形のピクセルに成長させることを含む、請求項18の方法。
  20. 前記ディテール領域周りにハロー効果を生じることなく前記非ブロック領域の空間的不変フィルタリングを可能にするように、分離されたディテール領域が拡大される、請求項1に記載の方法。
  21. 前記平滑化工程が、Nピクセルによる十字マスクの使用を含む、請求項2に記載の方法。
  22. Nが9に等しい、請求項21に記載の方法。
  23. 前記平滑化工程が、分散したエッジ不連続部を有する映像信号を非ブロック化するための膨張した十字マスクを使用することを含む、請求項2に記載の方法。
  24. 映像を表示するためのシステムであって、前記システムが、
    1ピクセルあたりの特定数のビットを有する第1の映像フレームを取得する入力を備え;前記特定数は、前記映像フレームがディスプレイに表示されると、前記ディスプレイが人間の視覚系(HVS)に知覚可能なアーチファクトを生じるような数であり、及び
    前記第1の映像フレームから第2の映像フレームを作成する回路を備え、前記第2の映像フレームが前記ディスプレイに表示されると前記HVSにあまり知覚可能でないアーチファクトを生じる、システム。
  25. 前記特定数が、最低0.1ビット/ピクセルにまで及ぶ、請求項24に記載のシステム。
  26. 前記特定数が、H.264エンコーダを使用して前記第1の映像フレームの圧縮によって提供されるビット数/ピクセルである、請求項24に記載のシステム。
  27. 前記特定数が、H.264エンコーダによって達成されるビット数の少なくとも1/2である、請求項25に記載のシステム。
  28. 前記作成する回路が、
    前記映像フレームをディテール領域と非ブロック領域とに分離する手段、及び
    前記第2の映像フレームを形成するために前記領域の結合前に前記非ブロック領域を平滑化する手段を備える、請求項24に記載のシステム。
  29. ユーザが、複数のデジタル映像フレームを含む複数のデジタルビデオストリームのうち一つを選択することを可能にするチューナを更に備える、請求項28に記載のシステム。
  30. 前記平滑化工程が、
    ある十字マスクサイズを有する空間的不変FIRフィルタ、及び
    前記空間的不変フィルタが前記ディテール領域を平滑化することを防止するプロセッサ
    を備える、請求項28に記載のシステム。
  31. 前記プロセッサが、前記十字マスクサイズの1/2にほぼ等しい距離だけ前記ディテール領域を拡大するように動作する、請求項30に記載のシステム。
  32. 前記平滑化手段が、空間的可変FIRフィルタを備える、請求項28に記載のシステム。
  33. 前記分離手段が、前記非ブロック領域を決定するために、輝度平滑性、不連続性、先読み、後読みのうち少なくとも一つの基準を使用する処理を含む、請求項28のシステム。
  34. アーチファクトブロックの位置がアプリオリに未知である圧縮画像フレームにアーチファクトの減衰が生じるように、前記基準のパラメータを選択する、請求項33に記載のシステム。
  35. 前記アーチファクトブロックが、一度以上、事前に圧縮された、再フォーマットされた画像フレーム、混色された画像フレーム、サイズ変更された画像フレームのうちの一つ以上に起因して前記圧縮映像フレームに生じる、請求項34に記載のシステム。
  36. 前記輝度平滑性基準が、輝度の局所的分散および局所的平均からなる統計的尺度を採用する、請求項33に記載のシステム。
  37. 輝度変化基準が輝度の僅かな変化に基づく、請求項33に記載のシステム。
  38. 前記平滑化手段が、前記非ブロック領域を減衰するために空間的に平滑化するように動作するプロセッサを備える、請求項28に記載のシステム。
  39. 前記平滑化手段が、前記非ブロック領域におけるブロック及びその他のアーチファクトを減衰するプロセッサを備える、請求項28に記載のシステム。
  40. 前記分離手段が、DCTベースのエンコーダの一部である、請求項28に記載のシステム。
  41. 前記平滑化手段が、FIRフィルタ、IIRフィルタのうち少なくとも1つを備える、請求項28に記載のシステム。
  42. 前記フィルタが、空間的可変又は空間的不変のいずれかであることが出来る、請求項41に記載のシステム。
  43. 前記平滑化手段が、少なくとも1個の移動平均FIR二次元ボックスフィルタを備える、請求項28に記載のシステム。
  44. 前記分離手段が、前記画像フレームを非ブロック領域とディテール領域とに再帰的に分離する、請求項28に記載のシステム。
  45. 前記分離手段が、
    候補領域を選択する手段、および
    選択された候補領域毎に、特定の基準に従って、選択された候補領域が前記非ブロック領域に属するか否かを決定する手段
    を備える、請求項28に記載のシステム。
  46. 前記候補領域が各画像フレームにおいてまばらに位置する、請求項45に記載のシステム。
  47. 映像の表示方法であって、前記方法は、
    1ピクセルあたり特定数のビット数を有する第1の映像フレームを取得する工程を含み、前記特定数は、前記映像フレームがディスプレイに表示されると、前記ディスプレイが人間の視覚系(HVS)に知覚可能なアーチファクトを生じるような数であり、
    前記第1の映像フレームから第2の映像フレームを作成する工程を含み、前記第2の映像フレームが前記ディスプレイに表示されると前記HVSにあまり知覚可能でないアーチファクトを生じる、方法。
  48. 前記特定数が、最低0.1ビット/ピクセルにまで及ぶ、請求項47に記載の方法。
  49. 前記作成工程が、
    各前記フレーム内のディテール領域と非ブロック領域を分離する工程、及び
    前記非ブロック領域を平滑化する工程、及び
    前記平滑化された非ブロック領域を前記分離されたディテール領域と結合する工程
    を含む、請求項47に記載の方法。
  50. 前記平滑化工程が、
    ある十字マスクサイズを有する空間的不変FIRフィルタを使用する工程、及び
    前記非ブロック領域とディテール領域との間の境界領域でのハロー効果を回避するように、少なくとも前記十字マスクサイズの1/2に等しい距離だけ前記ディテール領域を拡大する工程
    を含む、請求項49に記載の方法。
  51. 複数の前記デジタル映像フレームを有する複数のデジタルビデオストリームをデバイスで受信する工程を更に含む方法であって、
    前記取得工程が、前記デバイスで前記受信したデジタルビデオストリームのうちの一つを選択することを含む、請求項50に記載の方法。
JP2011518992A 2008-07-19 2009-07-16 ブロックアーチファクトを平滑化することによって圧縮映像信号の品質を向上させるシステム及び方法 Pending JP2011528873A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/176,371 2008-07-19
US12/176,371 US20100014596A1 (en) 2008-07-19 2008-07-19 Systems and methods for improving the quality of compressed video signals by smoothing block artifacts
PCT/CA2009/000998 WO2010009539A1 (en) 2008-07-19 2009-07-16 Systems and methods for improving the quality of compressed video signals by smoothing block artifacts

Publications (1)

Publication Number Publication Date
JP2011528873A true JP2011528873A (ja) 2011-11-24

Family

ID=41530274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011518992A Pending JP2011528873A (ja) 2008-07-19 2009-07-16 ブロックアーチファクトを平滑化することによって圧縮映像信号の品質を向上させるシステム及び方法

Country Status (13)

Country Link
US (1) US20100014596A1 (ja)
EP (1) EP2319012A4 (ja)
JP (1) JP2011528873A (ja)
KR (1) KR20110038142A (ja)
CN (1) CN102099831A (ja)
AU (1) AU2009273706A1 (ja)
BR (1) BRPI0916325A2 (ja)
CA (1) CA2731241A1 (ja)
MA (1) MA32494B1 (ja)
MX (1) MX2011000691A (ja)
TW (1) TW201016012A (ja)
WO (1) WO2010009539A1 (ja)
ZA (1) ZA201100639B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363978B2 (en) * 2009-03-03 2013-01-29 Samsung Electronics Co., Ltd. System and method for block edge location with varying block sizes and offsets in compressed digital video
US8891609B2 (en) * 2009-03-24 2014-11-18 Samsung Electronics Co., Ltd. System and method for measuring blockiness level in compressed digital video
JP2012256202A (ja) * 2011-06-09 2012-12-27 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム
US20140089806A1 (en) * 2012-09-25 2014-03-27 John C. Weast Techniques for enhanced content seek
CN103079029B (zh) * 2013-02-06 2016-07-13 上海风格信息技术股份有限公司 一种基于宏块边缘信息的数字电视马赛克识别方法
US9693063B2 (en) * 2015-09-21 2017-06-27 Sling Media Pvt Ltd. Video analyzer
US9749686B2 (en) 2015-09-21 2017-08-29 Sling Media Pvt Ltd. Video analyzer
CN109167959B (zh) * 2018-09-07 2020-04-03 浙江大华技术股份有限公司 一种视频采集设备、系统及视频信号传输方法
TWI832721B (zh) * 2023-03-08 2024-02-11 國立清華大學 影像的稀疏邊緣編碼及解碼方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006060286A (ja) * 2004-08-17 2006-03-02 Matsushita Electric Ind Co Ltd ブロックノイズ低減方法及びブロックノイズ低減装置
US20070058726A1 (en) * 2005-09-15 2007-03-15 Samsung Electronics Co., Ltd. Content-adaptive block artifact removal in spatial domain

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0935397B1 (en) * 1991-09-30 2005-07-27 Kabushiki Kaisha Toshiba Band-compressed signal recording/reproducing processing apparatus
US6760463B2 (en) * 1995-05-08 2004-07-06 Digimarc Corporation Watermarking methods and media
US5850294A (en) * 1995-12-18 1998-12-15 Lucent Technologies Inc. Method and apparatus for post-processing images
US6281942B1 (en) * 1997-08-11 2001-08-28 Microsoft Corporation Spatial and temporal filtering mechanism for digital motion video signals
US6470142B1 (en) * 1998-11-09 2002-10-22 Sony Corporation Data recording apparatus, data recording method, data recording and reproducing apparatus, data recording and reproducing method, data reproducing apparatus, data reproducing method, data record medium, digital data reproducing apparatus, digital data reproducing method, synchronization detecting apparatus, and synchronization detecting method
US6771836B2 (en) * 2001-06-21 2004-08-03 Microsoft Corporation Zero-crossing region filtering for processing scanned documents
US7079703B2 (en) * 2002-10-21 2006-07-18 Sharp Laboratories Of America, Inc. JPEG artifact removal
US7603689B2 (en) * 2003-06-13 2009-10-13 Microsoft Corporation Fast start-up for digital video streams
KR100936034B1 (ko) * 2003-08-11 2010-01-11 삼성전자주식회사 블록 단위로 부호화된 디지털 영상의 블로킹 현상을제거하는 방법 및 그 영상재생장치
US7822286B2 (en) * 2003-11-07 2010-10-26 Mitsubishi Electric Research Laboratories, Inc. Filtering artifacts in images with 3D spatio-temporal fuzzy filters
US7460596B2 (en) * 2004-04-29 2008-12-02 Mediatek Incorporation Adaptive de-blocking filtering apparatus and method for MPEG video decoder
CN100414997C (zh) * 2004-09-29 2008-08-27 腾讯科技(深圳)有限公司 一种视频数据压缩的量化方法
US8503536B2 (en) * 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US7995649B2 (en) * 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006060286A (ja) * 2004-08-17 2006-03-02 Matsushita Electric Ind Co Ltd ブロックノイズ低減方法及びブロックノイズ低減装置
US20070058726A1 (en) * 2005-09-15 2007-03-15 Samsung Electronics Co., Ltd. Content-adaptive block artifact removal in spatial domain

Also Published As

Publication number Publication date
AU2009273706A1 (en) 2010-01-28
MX2011000691A (es) 2011-04-11
MA32494B1 (fr) 2011-07-03
CA2731241A1 (en) 2010-01-28
US20100014596A1 (en) 2010-01-21
CN102099831A (zh) 2011-06-15
WO2010009539A1 (en) 2010-01-28
BRPI0916325A2 (pt) 2018-06-26
EP2319012A4 (en) 2012-12-26
TW201016012A (en) 2010-04-16
KR20110038142A (ko) 2011-04-13
EP2319012A1 (en) 2011-05-11
ZA201100639B (en) 2011-09-28

Similar Documents

Publication Publication Date Title
JP2011528873A (ja) ブロックアーチファクトを平滑化することによって圧縮映像信号の品質を向上させるシステム及び方法
US7620261B2 (en) Edge adaptive filtering system for reducing artifacts and method
KR101545005B1 (ko) 이미지 압축 및 압축해제
US6983078B2 (en) System and method for improving image quality in processed images
CN102714723B (zh) 使用胶片颗粒遮蔽压缩伪影
JP2011528825A (ja) フレーム全体を平滑化し、保存ディテールをオーバーレイすることによって圧縮映像信号の品質を向上させるシステムおよび方法
KR100853954B1 (ko) 비디오 화상의 분할-기반의 강조 수행 시스템 및 방법
US20090285308A1 (en) Deblocking algorithm for coded video
WO2003061295A2 (en) Sharpness enhancement in post-processing of digital video signals using coding information and local spatial features
US8630500B2 (en) Method for the encoding by segmentation of a picture
US10405032B2 (en) Video analyzer
KR20010081009A (ko) 디지털 비디오 화상들에서 블록화 현상들을 식별하는 방법및 디바이스
CN107707915B (zh) 采样点自适应偏移滤波的控制方法及其影像处理系统
US7424166B2 (en) Enhancing the quality of decoded quantized images
US20100150470A1 (en) Systems and methods for deblocking sequential images by determining pixel intensities based on local statistical measures
WO2006056940A1 (en) Reduction of compression artifacts in displayed images
GB2412530A (en) Reducing image artefacts in processed images
JPH09327005A (ja) 画像表示方法及び装置
KR20140042790A (ko) 시퀀스 내의 이미지의 압축
JPH07336685A (ja) 画像復号化方法および装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120712

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121206