本発明の特定の実施形態は、以下の特徴の少なくとも1つのための方法を提供しようとするものである:
o入力画像と比較した出力画像の品質尺度に基づき符号化の品質を制御しながら、サイズを縮小するための別個の圧縮画像の再符号化。
o最小類似性または許容差の品質尺度としての使用。
o「知覚上の同一性(perceptual identity)」または「定量的類似差(quantitative similarity difference)」の品質尺度としての使用。
oハードコードした品質閾値レベルの使用。
oシステムオペレーターによる品質閾値レベルの設定。
o追加アーチファクト性エッジ尺度を含む品質尺度、追加アーチファクト性エッジ尺度と別の品質尺度、追加アーチファクト性エッジ尺度とテクスチャ尺度、追加アーチファクト性エッジ尺度と類似性(例えば、PSNR)尺度、テクスチャ尺度と類似性尺度、テクスチャ尺度のみに基づく、例えば、RawからJPEGおよびJPEGからJPEGを含む反復画像圧縮。
oテクスチャ尺度閾値とPSNR尺度閾値との間の依存関係。
o符号化ブロック境界、特に、JPEGに対して8×8、H.264対して4×4、およびH.264 High Profileに対して8×8、に沿ったブロックノイズの識別。「ブロックノイズ(blockiness)」という用語は、(再)圧縮後には存在しているが、(再)圧縮プロセスに入る前は存在していない追加のアーチファクト性エッジの存在を表すか、または定量化することを目的とする。
o品質尺度閾値を維持しながらファイルサイズの削減を最大限にする圧縮レベルの設定。
o最高の圧縮レベルを見つけるための反復検索プロセスの使用。収束基準を考慮に入れ得る、最適化基準を用いた、検索の終了。
oパフォーマンス最適化のための、ブロックのサブセットに関する品質尺度の計算。
o例えば、H.264規格の要件に合致するため、場合により、少数の画素行/列による付け足し/トリミングで、出力画像の入力画像と同一または類似の解像度への設定。
oユーザーにより手動での、または記憶システムもしくは用途の要件に従った、解像度の設定。
o入力画像フォーマットとしてJPEG、または「汎用JPEG(generalized JPEG)」を使用すること。
oカメラにより2メガピクセルを超える解像度でキャプチャーされた高品質JPEGを入力フォーマットとして使用すること。
o入力画像は、PC、カメラ、携帯電話、ネットワーク、データセンターまたはローカルの記憶装置から受け取られ得る。
o入力画像は、例えば、YUV、RGB、BMP、PNGおよびTIFFなどのrawフォーマットに復号され得る。
o入力画像の復号は、例えば、周波数領域または画素領域へのように、部分的であり得る。例えば、JPEからYUV 4:2:0またはJPEGからDCT領域への復号。
oH.264のエンコーダーとしての使用。符号化のイントラ画像符号化部分のみを使用し、インター画像符号化を無効にする。
oJPEGのエンコーダーとしての使用。
oDCT係数ゼロ化方式の利用による局所適応JPEG圧縮の実行。
oSSIMを改善するための方法:
・滑らかな領域の識別、およびこれらの領域でSSIMへペナルティを課すこと
・ブロックベースのSIMおよび最もパフォーマンスの悪い領域の平均化
・性能を向上させるために、画像全体ではなく、ランダムに選択した画素上でのSSIMの実行
o以下の1つまたは複数が提供されることを特徴とする量子化行列の計算:
o再圧縮画像の量子化行列を取得するための元の画像の量子化行列のスケーリング。再圧縮画像の量子化行列を取得するため、所与の(例えば、デフォルトまたは画像に最適化した)量子化行列をスケーリングし、その後、随意に、それと元の画像の量子化行列を(加重平均を使用して)平均化する。
o画像に対する良いMQFの開始点をそれらの量子化行列に基づき選択する方法。
o画像の蓄積された知識に基づき、MQFの開始点およびステップ幅を動的に適合させる方法
素ブロックレベルの符号化画像(例えば、JPEG画像などがあるがそれに限定されない)の生成が知られているが、それらの画像は、先行画像(precursor image)での素ブロックの独立符号化(例えば、JPEG符号化などがあるがそれに限定されない)によって圧縮される。JPEG符号化は、デジタル画像業界全体にわたって、特にデジタルカメラにおいて、画像を符号化するために使用されている。デジタルカメラの解像度が10メガピクセル以上に増加するにつれて、画像ファイルのサイズが数メガバイトまで増加し、一方、デジタルカメラの使い易さにより、ユーザーは多数の写真を取ることが可能である。結果として、ユーザーのパーソナルコンピューター上またはオンラインフォトサービスで使用されるサーバー上のデジタルフォトアルバムに対して、膨大なストレージ要件をもたらす。
Winsoft Advanced JPEG CompressorおよびPegasus JPEG Wizardなどの商用ソフトウェアは、ユーザーが、再圧縮を使用してJPEG画像のファイルサイズを縮小できるようにし、コンピューターの画面上で元のファイルと再圧縮ファイルを目で見て比較して、恐らく、目に見えるアーチファクト(artifact)が出力画像に存在しないような方法で、ユーザーが出力(再圧縮)画像に対する品質を手動で設定できるようにする。当業者には、多数(例えば、数十、数百、数千など)の写真(例えば、ユーザーの写真)の再圧縮に対して手動による介入および構成を必要とするかかる再圧縮方法を使用することは理にかなっていないことは明らかであろう。
H.264符号化などのイントラ予測符号化が知られている。Choら[1]およびSimoneら[2]は、H.264イントラフレーム符号化は、恐らく、いくつかの点で、JPEG符号化よりも効率的であり得る、と報告している。JPEG画像のH.264画像またはJPEG画像への自動再圧縮は、人間の視覚システムの特性および出力画像品質評価に対するその感性を考慮に入れる客観的な品質尺度を必要とする。
JPEG圧縮の結果としてのリンギングおよびブロックノイズは、デジタル画像における周知の現象である。それ故、デジタル画像を再圧縮する際に、リンギングおよびブロックノイズアーチファクトを検出して削減するのが望ましい。
Juddに対して付与された米国特許5790717は、圧縮画像の主観的品質を予測するための装置および方法を記載している。その予測は、参照画像の対応するブロックの強化変化の既定割合よりも少ない強化変化をもつ圧縮画像内のブロック割合(%)に基づく、「強度変化損失(intensity variation loss)」の計算に基づく。
画像をJPEGフォーマットに圧縮する際に量子化行列を作成するために業界で一般的に行われているのは、スケーリング係数を使用して、JPEG規格に見られるデフォルトの量子化行列を均一にスケーリングすることである。この方法は、Independent JPEG Group(IJG)ソフトウェア、および他の一般的なJPEG符号化の実施態様で使用されている。いくつかの用途では、特定の用途に適していると考えられる異なる量子化行列にスケーリングする。しかし、この方法は、JPEGフォーマット画像から復号されている画像を再圧縮する際に、元のJPEG画像の量子化行列に存在していた周波数関係を考慮に入れない。
本発明の特定の実施形態は、第1デジタル画像を、第1の画像に対する第2の画像内のエッジの恒常性を定量化する構造尺度以外に、知覚的圧縮品質尺度によって決定された程度まで圧縮することにより、サイズを縮小した第2デジタル画像を第1デジタル画像から生成するコンピューターシステムを提供しようとする。
本発明の特定の実施形態は、例えば、デジタルカメラの出力を含み得る(例えば)JPEG画像を別の通常はより小さいJPEG画像に再圧縮するシステムを提供しようとし、その再圧縮は、所与またはデフォルトの量子化行列の値の全てまたは選択したサブセットにスケール係数を掛け、結果として生じた量子化行列と元のJPEG画像の量子化行列を、加重平均係数の行列を用いて平均化し、更新された量子化行列を使用して入力JPEG画像を出力JPEG画像に再符号化する。再圧縮の適用後、JPEGからJPEGへの品質尺度が、閾値または間隔などの基準と比較される。品質尺度が基準に達していない場合、スケーリング係数が修正され、再圧縮が繰り返されて、品質尺度が再計算される。品質尺度が基準を満足すると、プロセスが終了する。
「スケーリング」という用語は、本明細書では、スケーリング係数で乗ずることによって積を得、およびその積を、丸めまたは切り捨てなどの適切な処理によって近似整数によって概算することを含む。
本発明の他の実施形態は、例えば、デジタルカメラの出力を含み得る(例えば)JPEG画像を別の通常はより小さいH.264イントラフレーム画像に再圧縮するシステムを提供しようとし、その再圧縮は、入力画像の符号化のためにH.264 QP(品質パラメーター)の利用を含む。再圧縮の適用後、JPEGからH.264への品質尺度が、閾値または間隔などの基準と比較される。品質尺度が基準に達していない場合、QPが修正され、再圧縮が繰り返されて、品質尺度が再計算される。品質尺度が基準を満足すると、プロセスが終了する。
「反復圧縮」は、本明細書では、1回または複数回の繰返しを含む圧縮操作を意味するために使用されることを理解されたい。「圧縮」または「反復圧縮」は、本明細書では、1回目で、1つまたは複数の画像またはその一部が、本明細書に記載のとおり、QP(量子化パラメーター)またはスケーリング係数などの暫定的な圧縮パラメーターを用いて暫定的に圧縮される、一般的な反復プロセスを含むことを意図する。その後、暫定圧縮の結果が、どの程度満足できるものかを判断するために、分析(例えば、SSIM品質尺度または本明細書に記載のいずれかの品質尺度などの品質尺度の計算など)される。後続の繰返しでは、必要に応じて、1つもしくは複数の画像またはその部分が、1回目で暫定的に圧縮された画像もしくは一部と同じかまたは同じではないかも知れないが、その後、その分析から導出された分析後の圧縮パラメーターを用いて圧縮される。例えば、新しいQPまたはスケーリング係数値は、1回目で使用されたQPまたはスケーリング係数の関数、および分析中に計算された品質尺度の少なくとも1つの関数として計算され得る。各後続回は、言うまでもなく、いくつかの変形形態で、プロセスが反復になり得るように、追加の後続回に対する「1回目」として機能する。限定されないが単一パス圧縮、二重パス圧縮およびマルチパス圧縮等の反復圧縮の多くの変形が知られており、特定の繰返し方法は通常用途に依存する。
一般に、本明細書で使用される用語は、従来技術の文献に出現するそれらの定義に従うか、または明細書に従って、解釈され得る。
SSIMは、構造的類似性の従来の尺度である。つまり、SSIMは、圧縮画像における、エッジ、外部輪郭、および内部境界など、事前に圧縮された画像の構造的特徴の維持に焦点を合わせている。0.95以上のSSIM値は、知覚的に等しい画像を表す(例えば、上記の公表文献[3])と断定されてきた。しかし、0.95は、画像間の知覚的類似性の大域的評価に対する許容可能なSSIM値であると考えられてきたが、ほとんど0.98のSSIM値ですら、いくつかの画像では、圧縮画像の特定領域で顕著な知覚的劣化が起こることが分かった。SSIM尺度を用いて再圧縮した際に、使用したSSIM値が0.95である場合にさえ、顕著な知覚的劣化が起こり得る画像の種類の例には、空などの非常に滑らかな(非テクスチャ化)領域のある画像で、特にこれらの領域が大きい、暗い、または両方である場合、ならびに雀斑および肌のきめを描写する画像など、大幅なテクスチャ化(高周波の)表面を含む画像がある。
最先端画像圧縮システムの特定状態では、大きな懸案事項は、過度の深い圧縮によるテクスチャ損失であり、タンデム圧縮(tandem compression)のアーチファクトとして生成されたリンギングなどのテクスチャアーチファクトを回避することによる知覚的に可逆な圧縮を達成するための教示はない。タンデム圧縮では、初期圧縮の後に、高周波データを除去しない高品質の再圧縮が続くため、テクスチャの知覚的損失を生じないが、残念なことに、テクスチャアーチファクトを取り込む傾向があり得る。
従って、本発明の少なくとも1つの実施形態によれば、第1デジタル画像から第2の縮小サイズのデジタル画像を生成するための方法が提供され、その方法は、第2の画像での符号化ブロック境界に沿った追加のアーチファクト性エッジを定量化するブロックノイズ尺度によって決定される程度まで、第1デジタル画像を繰り返し圧縮することを含む。
さらに、本発明の少なくとも1つの実施形態によれば、再圧縮は、第2の画像を取得するための第1の画像のブロックベースの符号化を含み、それにより境界を有する符号化ブロックを定義し、そして、ブロックノイズ尺度が、符号化ブロック境界に沿って追加されたアーチファクト性エッジを識別することにより計算される。
一例として、ブロックノイズ尺度は、第1の画像と第2の画像との間の差分画像の計算、複数の画像ブロックを含む領域の差分画像内での定義、その領域内での2つの符号化ブロック間の各境界に対する、各境界に沿った追加のアーチファクト性エッジの程度を示す各追加のブロックノイズスコアの計算、その領域内で各境界について計算された追加のブロックノイズスコアに基づく領域品質スコアの計算、および少なくとも領域品質スコアに基づく知覚的品質基準が第2の画像によって満足されるか否かの判断を含み得る。小さい画像は、単一の領域のみを含み得ることを理解されたい。
さらに例として、ブロックノイズ尺度の実施は、各領域が複数の画像ブロックを含む、複数の領域を差分画像内で定義すること、その複数の領域の各々に対して領域品質スコアを計算して、各複数の領域品質スコアを生じること、および第2の画像に対する画像品質スコアをその複数の領域品質スコアに基づき計算することを含み得、知覚基準が第2の画像によって満足されているか否かの判断が、知覚的品質基準が第2の画像によって満足されているか否の少なくとも画像品質スコアに基づく判断を含む。
さらにまた別の例として、尺度の実施および知覚的品質基準が満足されているか否かの判断が、圧縮パラメーター検索の一部であり、その検索は、第2の画像に対する品質スコアが知覚的品質基準を満足しないと判断される場合に、第1の画像が異なる圧縮パラメーターを用いて再圧縮されて、第3画像を生じることをさらに含み、品質尺度の実施および知覚的品質基準が満足されているか否かの判断が第3画像に関して実施される。
さらにまた別の例として、圧縮および検索が繰り返して実施され、各繰返しにおいて、前回と比較して異なる量の圧縮が適用され、再圧縮された暫定出力画像を生じ、現在の再圧縮された暫定出力画像に対する品質スコアが知覚的品質基準を満足するとその検が終了する。
さらにまた別の例では、第1の画像は入力画像で、第2の画像は暫定圧縮画像であって、圧縮が暫定圧縮パラメーターを用いて実行され、第2の画像に対する品質スコアが知覚的品質基準を満足しないと判断されると、検索のさらなる繰返しが呼び出される。
さらなる別の例では、第2の画像に対する品質スコアが知覚的品質基準を満足しないと判断されると、暫定圧縮パラメーターが調整されて、暫定圧縮、検索および判断が繰り返される。また別の例では、暫定圧縮パラメーターの調整は、暫定圧縮パラメーターを用いた入力画像の圧縮および暫定圧縮の繰返しによって達成されると予期される、推定される追加の圧縮の評価、圧縮パラメーターの検索、および推定される追加の圧縮が圧縮閾値を超えている場合に限り知覚的品質基準が満足されるか否かの判断をさらに含む。
特定の実施形態によれば、第1圧縮画像が、例えば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮のための適切なプロセスにしたがって、量子化行列を用いて再圧縮され、その第1の画像はそれらに関連する少なくとも1つの第1の量子化行列を有する。例えば、そのプロセスは、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、新しい量子化行列の生成および前記独立した素ブロックレベル圧縮のための前記新しい量子化行列の使用を含む、再圧縮された第2の画像の生成を含み得、その新しい量子化行列は、少なくとも1つの第2の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることによって生成され、それにより少なくとも1つのスケーリングされた行列が提供され、その後、少なくとも1つの追加の量子化行列を、少なくとも1つのスケーリングされた行列と少なくとも1つの第1の量子化行列との加重平均として計算する。
上記で使用される量子化行列は、周知の技術を用いて、例えば、JPEG規格のデフォルトの量子化行列または周波数成分などの画像特性に適合するように選択された量子化行列をスケーリングすることにより形成され得る。通常、MQF(修正品質係数:Modified Quality Factor)は、実際に行列をスケーリングするスケーリング係数に変換され、従来型のJPEGの場合のように、QF(品質係数)は、実際に行列をスケーリングするスケーリング係数に変換される。
特定の実施形態によれば、前述のスケーリングプロセス用のスケーリング係数は、MQF値の関数であり得る。適切なMQF値の検索の実行は、初期MQFの提供、例えば、平均画像に対してうまく機能しているデフォルト値または、それらの量子化行列など第1の画像のいくつかの特性に適した値の提供を含み得る。初期MQFは、実際のところ、例えば、1〜100の間の任意の数であり得るが、下手な選択、例えば、単なるランダム選択は、不必要に検索プロセスを長くする。ステップ幅は、例えば、1〜100の範囲内で選択され得るが(例えば、10)、この場合も、下手な選択、例えば、単なるランダム選択は、検索プロセスを妨げる。検索は、その画像に対して見つけられる、良いまたは最良のMQF値を可能にして、課されている第1の画像と第2の画像との間の知覚的劣化の許容レベルを所与として、良いまたは最高の圧縮をもたらす。本明細書では「知覚的劣化」という用語は、画像の品質または正確性が再圧縮の結果として損なわれたという、人間のビューアーに対する見え方を指す。本明細書で使用する知覚的劣化は、画像の事前再圧縮の品質に関係なく、再圧縮によって実際に取り込まれた劣化にのみ関連する。
本明細書では「暫定圧縮パラメーター」という用語はMQF値を含むが、それに限定されない。
特定の実施形態によれば、初期MQF値が生成されてチェックされ、そのMQF値に基づく再圧縮の使用の結果として生じる知覚的劣化が、目標とする知覚的劣化範囲に含まれている場合、MQF選択プロセスが終了し、初期MQF値が最終として扱われる。そうでない場合、改善されたMQF値が、例えば、有効なMQF値の範囲(例えば、1〜100または50〜98)の下半分または上半分の二等分に基づき、初期値から計算される。二等分される半分の範囲は、初期MQF値ベースの再圧縮から生じた劣化が、目標とする知覚的劣化範囲を上回るかまたは下回るかによって決まる。代替として、正割(secant)ベース検索など、任意の他の検索スキームが採用され得る。
事前定義した距離もしくは許容範囲などの特定状態を前提として、より良い値または最高値の検索は、通常、用途に特化した有限の解像度、例えば、整数解像度、または、最も近い値を有する。必ずしもではないが通常、解像度は、本明細書に記載のとおり、知覚的誤差の面に投影される。
最良MQFの反復検索は、本明細書に記載のとおり、初期MQFを使用し得るが、必ずしも使用せず、代替として、任意の「デフォルト」初期MQFが採用され得ることを理解されたい。最良MQF、またはデフォルトを含む他のMQFもしくは代替係数は、本明細書に記載のとおり、新しい量子化行列の計算に使用され得、また、周知の通りおよび本明細書に記載のとおり、他の目的および用途にも使用され得る。
また、本発明の少なくとも1つの実施形態によれば、内部に具体化されたコンピューター可読プログラムコードを有するコンピューター使用可能媒体を含むコンピュータープログラム製品が提供され、そのコンピューター可読プログラムコードは、本明細書に示しかつ記載するいずれかの再圧縮方法を実施するために実行されるように構成される。
また、通常有形で、内部に具体化されたコンピューター可読プログラムコードを有する、コンピューター使用可能媒体またはコンピューター可読恒久記憶媒体(non−transitive storage medium)も提供され、そのコンピューター可読プログラムコードは、本明細書に示しかつ記載するいずれかまたは全ての方法を実施するために実行されるように構成される。本明細書に示しかつ記載するいずれかまたは全ての計算ステップはコンピューター実装され得ることを理解されたい。本明細書の技術によれば、操作は、所望の目的用に特別に構築されたコンピューターによって、またはコンピューター可読恒久記憶媒体内に格納されたコンピュータープログラムによって所望の目的用に特別に構成された汎用コンピューターによって実行され得る。
任意の適切なプロセッサー、ディスプレイおよび入力手段が、例えば、本明細書に示しかつ記載するいずれかの方法および装置で使用または生成される情報などの情報の、処理、(例えば、コンピューター画面または他のコンピューター出力装置への)表示、保存、および受け取りのために使用され得、上記のプロセッサー、ディスプレイおよび入力手段は、本発明のいくつかまたは全ての実施形態により、コンピュータープログラムを含む。本明細書に示しかつ記載する本発明のいずれかまたは全ての機能性は、処理用に使用される、汎用または特別構築のいずれかの、従来型のパーソナルコンピュータープロセッサー、ワークステーションもしくは他のプログラム可能装置もしくはコンピューターもしくは電子コンピューティング装置、表示用のコンピューターディスプレイ画面および/またはプリンターおよび/またはスピーカー、光ディスク、CD−ROM、磁気光ディスクもしくは他のディスクなどの機械可読メモリー、格納用のRAM、ROM、EPROM、EEPROM、磁気もしくは光もしくは他のカードまたはUSBフラッシュメモリーなどの装置、および受け取り用のキーボードまたはマウスによって実行され得る。上記で使用した「処理(process)」という用語は、例えば、コンピューターのレジスターおよび/またはメモリー内に生じるかまたは存在し得る物理的(例えば、電子的)現象として表現されるデータの、任意の種類の計算または操作または変換を含むことを意図する。
前述の装置は、例えば、有線もしくは携帯電話ネットワークまたはインターネットなどのコンピューターネットワークを経由した、いずれか従来型の有線または無線のデジタル通信手段を介して、任意で通信し得る。
本発明の装置は、本発明の特定の実施形態によれば、機械によって実行される時に、本明細書に示しかつ記載する本発明のいくつかまたは全ての装置、方法、特性および機能性を実施する命令のプログラムを含むか、または他の恒久的な方法で格納する、機械可読メモリーを含み得る。代替または追加として、本発明の装置は、本発明の特定の実施形態によれば、いずれか従来型プログラミング言語で記述され得る前述のプログラム、および任意で、例えば、本発明の技術に従って任意で構成または起動され得る汎用コンピューターなどだがこれに限定されず、そのプログラムを実行するためのコンピューターを含み得る。
上記で参照した実施形態および他の実施形態については、次の節で詳細に説明する。
本文または図中に現れるいずれの商標もその所有者の所有物であり、本明細書では、本発明の実施形態がどのように実施され得るかを示す一例を説明または図解するためにのみ現れる。
特に断りのない限り、以下の説明から明らかなように、本明細書の説明全体に渡り、「処理(processing)」、「計算(computing)」、「推定(estimating)」、「選択(selecting)」、「ランキング(ranking)」、「格付け(grading)」、「計算(calculating)」、「判断(determining)」、「生成(generating)」、「再評価(reassessing)」、「分類(classifying)」、「生成(generating)」、「生成(producing)」、「ステレオマッチング(stereo−matching)」、「登録(registering)」、「検出(detecting)」、「関連付け(associating)」、「スーパーインポーズ(superimposing)」、「取得(obtaining)」または同様の用語などの使用は、コンピューティングシステムのレジスターおよび/またはメモリー内の物理的(例えば、電子的)量として表現されるデータを、コンピューティングシステムのメモリー、レジスターまたは他のかかる情報の記憶、送信もしくは表示装置内の物理量として同様に表現される他のデータに操作および/または転送する、コンピューターもしくはコンピューティングシステム、またはプロセッサーもしくは同様の電子コンピューティング装置の動作および/または処理を指すことを理解されたい。「コンピューター」という用語は、限定されない例として、パーソナルコンピューター、サーバー、コンピューティングシステム、通信装置、プロセッサー(例えば、デジタル信号プロセッサー(DSP)、マイクロコントローラー、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、中央処理装置(CPU)など)および他の電子コンピューティング装置を含む、データ処理能力を備えた任意の種類の恒久的電子装置を含めるよう広く解釈されるべきである。
本発明は、単に分かり易くするために、特定のプログラミング言語、オペレーティングシステム、ブラウザー、システムのバージョン、個々の製品、および同様のものに特有な用語で説明され得る。この用語の使用は、例として、操作の一般原則を明瞭かつ簡潔に伝えることを意図するものであり、本発明の範囲をいずれか特定のプログラミング言語、オペレーティングシステム、ブラウザー、システムのバージョン、または個々の製品に限定することを意図していないことを理解されたい。
本発明の一態様によれば、したがって、第2の画像を生じる第1の画像の圧縮を含む、画像適応で知覚的に無損失なほぼ最大の画像圧縮、第1の画像と第2の画像との間の差分画像の計算を含む、符号ブロック境界に沿った追加のアーチファクト性エッジ尺度の実施、複数の画像ブロックを含む領域の差分画像内での定義、その領域内での2つの符号化ブロック間の各境界に対する、各境界に沿った追加のアーチファクト性エッジの程度を示す各追加のブロックノイズスコアの計算、領域内の各境界に対して計算された追加のブロックノイズスコアに基づく領域品質スコアの計算、および少なくとも領域品質スコアに基づく知覚的品質基準が第2の画像によって満足されているか否かの判断を可能にする方法を提供する。
本発明の一実施形態によれば、一方法が提供され、その方法では、実施が、各領域が複数の画像ブロックを含む、複数の領域を差分画像内で定義することと、その複数の領域の各々に対する領域品質スコアを計算して、それぞれ複数の領域品質スコアを生じることと、複数の領域品質スコアに基づき第2の画像に対する画像品質スコアを計算することとを含み、判断が、少なくとも画像品質スコアに基づく知覚的品質基準が第2の画像によって満足されているか否かの判断を含む。
本発明の一実施形態によれば、一方法がさらに提供され、その方法では、第1の画像が入力画像で、第2の画像が暫定圧縮画像であって、圧縮が暫定圧縮パラメーターを用いて実行され、第2の画像に対する品質スコアが所定の知覚的品質範囲内になければ、改善された圧縮パラメーターの追加の反復検索が呼び出される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法は、第2の画像に対する品質スコアが知覚的品質基準を満足していないと判断された場合、暫定圧縮パラメーターの再計算ならびに暫定圧縮、検索、および判断の繰返しを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第1の画像が入力画像であり、入力画像は、先行画像での素ブロックの独立符号化によって圧縮された素ブロックレベルの符号化画像である。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第2の画像は、第1の画像での素ブロックの独立符号化によって第1デジタル画像から生成された、素ブロックレベルの符号化画像である。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第1および第2の画像はJPEG画像である。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、圧縮は、反復の各繰返しにおいて、個々の繰返しの以前の少なくとも1つの繰返しに基づき圧縮パラメーターを適合することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、圧縮は、反復の各繰返しにおいて、個々の繰返しの以前の全繰返しに基づき圧縮パラメーターを適合することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法は、少なくとも部分的に領域品質スコアに基づき圧縮命令を提供することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも2つの領域品質スコアが、出力画像内の対応する少なくとも2つの領域の組に対して計算され、圧縮命令の提供は、少なくとも2つの領域品質スコアに少なくとも部分的に基づく。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、圧縮は、第2の画像のブロックノイズの有無を定量化するブロックノイズ尺度によって決定される程度まで、第1デジタル画像を第2の縮小サイズのデジタル画像に、繰り返し圧縮することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、ブロックノイズ尺度は、第1の画像と比較した第2の画像のブロックノイズの有無の尺度を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第1デジタル画像が繰り返して圧縮される程度は、ブロックノイズ尺度以外の品質尺度によっても決定される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、品質尺度は、第1の画像と第2の画像との間のテクスチャ類似性を定量化するテクスチャ尺度を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、品質尺度は、第1の画像と第2の画像との間の局所類似性を定量化する局所類似性尺度を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、反復圧縮が再圧縮プロセスを含むように、第1の画像が圧縮画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第1デジタル画像が、先行画像での素ブロックの独立符号化によって圧縮された素ブロックレベルの符号化画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第2デジタル画像が、第1の画像での素ブロックの独立符号化により第1デジタル画像から生成された素ブロックレベルの符号化画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、素ブロックレベルの符号化画像がJPEG符号化画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第2デジタル画像がイントラ予測符号化画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第1デジタル画像がイントラ予測符号化画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、イントラ予測符号化画像がH.264画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、圧縮は、局所類似性尺度を含む複数の品質尺度およびテクスチャ変化尺度によって決定される程度まで、第1デジタル画像を第2の縮小サイズのデジタル画像に、繰り返し圧縮することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、局所類似性尺度が高い場合は、第1の画像と第2の画像との間の第1テクスチャ変化が許容されるのに対し、局所類似性尺度が低い場合には、第1の画像と第2の画像との間の、第1テクスチャ変化より小さい、第2テクスチャ変化のみが許容されるように、その程度が決定される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、再圧縮は、第2の画像を取得するために第1の画像をブロックベースで符号化し、それにより境界を有する符号化ブロックを定義することを含み、ブロックノイズ尺度が、符号化ブロック境界に沿って追加されたアーチファクト性エッジを識別することにより計算される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、ブロックベースの符号化がJPEG符号化を含み、その符号化ブロックは8ピクセル×8ピクセルのブロックを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、ブロックベースの符号化がH.264符号化を含み、その符号化ブロックは4ピクセル×4ピクセルのブロックを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、ブロックベースの符号化がH.264 High Profile符号化を含み、その符号化ブロックは8ピクセル×8ピクセルのブロックを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、反復圧縮が再圧縮プロセスを含むように、第1の画像が圧縮画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、テクスチャ尺度が、第1デジタル画像と第2デジタル画像との間の対応する領域のテクスチャにおける変化の定量的尺度を含み、再圧縮が画素群を定義する画素群ベースの符号化を含み、画素群は対応する領域を定義する。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法は、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮を含み、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を持ち、その方法は、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、少なくとも1つの第1の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることにより、新しい量子化行列を生成すること、および独立した素ブロックレベルの圧縮に対してその新しい量子化行列を使用することを含む、再圧縮された第2の画像の生成を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、ブロックベースの符号化がH.264符号化を含み、その領域は4ピクセル×4ピクセルのブロックを含む。
本発明の一実施形態によれば、テクスチャ変化尺度によって決定される程度まで、第1デジタル画像を第2デジタル画像に繰り返し圧縮する、コンピューター化された方法がさらに提供され、その方法は、少なくとも1つの初期圧縮パラメーターを用いて少なくとも1回初期圧縮を実行することと、テクスチャ変化尺度を計算することにより初期圧縮を評価することと、テクスチャ変化尺度がテクスチャ変化尺度間隔内に含まれるか否かを判断することと、テクスチャ変化尺度がテクスチャ変化尺度間隔内に含まれる場合にその方法を終了し、そうでなければ、テクスチャ変化尺度がそれぞれテクスチャ変化尺度間隔の一方の側または別の側に位置する場合に、初期圧縮パラメーターより大きいかまたは小さい追加の圧縮パラメーターを用いてさらに圧縮することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法は、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮を含み、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を持ち、その方法は、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、少なくとも1つの第1の量子化行列を少なくとも1つのスケーリング係数でスケーリングすること、および独立した素ブロックレベルの圧縮に対してその新しい量子化行列を使用することにより、新しい量子化行列を生成することを含む、再圧縮された第2の画像の生成を含む。
本発明の一態様によれば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮のための方法がさらに提供され、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を持ち、その方法は、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、少なくとも1つの第1の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることにより新しい量子化行列を生成すること、および独立した素ブロックレベルの圧縮に対してその新しい量子化行列を使用することを含む、再圧縮された第2の画像の生成を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、独立した素ブロックレベルの再圧縮がJPEG−to−JPEG再圧縮を含み、独立した素ブロックレベルの再圧縮がJPEG操作を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、スケーリングが、少なくとも1つの量子化行列の全エントリを単一の数値で乗算することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、スケーリングが、積を取得するためにスケーリング係数によって乗算することと、その積を近似整数で概算することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法は、個々の独立した素ブロックレベルの再圧縮操作によって取得した知覚的品質の評価、および、満足できない場合は、個々の独立した素ブロックレベルの圧縮操作で使用されたものとは異なるスケーリング係数を使用しての、追加の独立した素ブロックレベルの圧縮操作の開始を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、知覚品質が、容認し難いほど低く、かつより高いスケーリング係数の使用を正当化するのに十分高い場合、知覚的品質が満足できないと見なされる。
本発明の一態様によれば、第1デジタル画像を、第2の画像のブロックノイズの有無を定量化するブロックノイズ尺度によって決定される程度まで繰り返し圧縮することにより、第2の縮小サイズのデジタル画像を第1デジタル画像から生成するコンピューターシステムがさらに提供される。
本発明の一態様によれば、第1デジタル画像を第2の縮小サイズのデジタル画像に、局所類似性尺度およびテクスチャ変化尺度によって決定される程度まで、繰り返し圧縮するコンピューターシステムがさらに提供される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、複数の品質尺度が相互に正規化され、その程度が積によって決まる。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、第1の画像が暫定圧縮パラメーターを用いて暫定的に圧縮され、その積が第1の閾値を超え、複数の品質尺度の少なくとも1つが無関係に第2の閾値を超えると、暫定圧縮パラメーターが次の圧縮に使用される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、実行は、スケーリング係数に対して初期値を使用することと、その初期値に基づき第1の画像に対する暫定的な独立した素ブロックレベルの圧縮操作を特徴付ける品質尺度を計算することと、品質尺度が目標の品質間隔の範囲に収まる場合にその方法を終了し、そうでなければ、品質尺度が目標の品質間隔のそれぞれ一方の側または別の側に位置する場合に、スケーリング係数に対して初期値より大きいかまたは小さい次の値を用いてさらに圧縮することとを含む。
本発明の一態様によれば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮のための方法がさらに提供され、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を持ち、その方法は、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、新しい量子化行列の生成および独立した素ブロックレベルの圧縮に対するその新しい量子化行列の使用を含む、再圧縮された第2の画像の生成を含み、その新しい量子化行列は、少なくとも1つの第2の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることによって生成され、それにより少なくとも1つのスケーリングされた行列が提供され、その後、少なくとも1つの追加の量子化行列を、少なくとも1つのスケーリングされた行列と少なくとも1つの第1の量子化行列との加重平均として計算する。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも1つの第2の量子化行列が、JPEG規格で規定された少なくとも1つのデフォルト量子化行列を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも1つの第2の量子化行列が、画像に対して計算された少なくとも1つの最適量子化行列を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも1つの第2の量子化行列が、少なくとも1つの第1の量子化行列と同じである。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、独立した素ブロックレベルの再圧縮がJPEGからJPEGへの再圧縮を含み、独立した素ブロックレベルの再圧縮がJPEG操作を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、スケーリングが、少なくとも1つの量子化行列の全エントリを単一の数値で乗算することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、スケーリングが、積を取得するためにスケーリング係数によって乗算することと、その積を近似整数で概算することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、加重平均が、第1加重要素を生成するために、少なくとも1つのスケーリングされた量子化行列の各エントリを、0と1との間の値を含む、少なくとも1つの重み行列の対応するエントリで乗算することと、第2加重要素を生成するために、少なくとも1つの第1の量子化行列の各エントリを、少なくとも1つの重み行列の対応するエントリの値を1から引いた値で乗算することと、少なくとも1つの追加の量子化行列の加重平均要素値を生成するために、第1加重要素を第2加重要素値に加算することによって計算される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも1つの重み行列の全要素が同一である。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも1つの重み行列の全要素が0.5に等しい。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも1つの重み行列の全要素が1に等しい。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法は、個々の独立した素ブロックレベルの再圧縮操作によって取得した知覚的品質を評価することと、満足できない場合は、個々の独立した素ブロックレベルの圧縮操作で使用されたものとは異なるスケーリング係数を使用して、追加の独立した素ブロックレベルの圧縮操作を開始することを含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、品質が、容認し難いほど低く、かつより高いスケーリング係数の使用を正当化するのに十分高い場合、知覚的品質が満足できないと見なされる。
本発明の一実施形態によれば、さらにまた別のシステムが提供され、そのシステムでは、第1デジタル画像が複数の反復により繰り返して圧縮される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、複数の品質尺度が相互に正規化され、その程度が、相互に正規化された複数の品質尺度の加重幾何平均によって決まる。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、イントラ予測符号化画像がH.264画像を含む。
本発明の一態様によれば、コンピュータープログラム製品がさらに提供され、その製品は、コンピューター可読プログラムコードが内部に具体化されているコンピューター使用可能な媒体を含み、そのコンピューター可読プログラムコードは、本明細書に示しかつ記載するいずれかの圧縮方法を実施するために実行されるように適合されている。
本発明の一実施形態によれば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮を含む、さらにまた別の方法が提供され、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を有し、その方法は、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、少なくとも1つの第1の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることによる新しい量子化行列の生成、および独立した素ブロックレベルの圧縮のためにその新しい量子化行列を使用することを含む、再圧縮された第2の画像を生成することを含む。
本発明の一態様によれば、少なくとも1つのパラメーターに基づく再圧縮プロセスを使用する様々な画像の再圧縮を含む、画像の再圧縮方法がさらに提供され、その方法では、様々な画像の中からの少なくとも1つの個別の画像の再圧縮が、そのパラメーターに適した値の組内での、その個別の第1の画像の再圧縮に使用される適切なパラメーター値の検索の(その個別の第1の画像の再圧縮にあまり適していないと考えられる少なくとも1つ以上の他のパラメーターのその組内での選択を含めて)実行を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、様々な画像の中からの少なくとも1つの個別の画像の再圧縮が、適切なMQF値の組内での、その個別画像に適したMQF値の検索の実行、およびその個別の第1の画像の再圧縮に使用される量子化行列のスケーリングでのそのMQF値の採用を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、検索が、その初期MQF値によって特徴付けられ、初期MQF値は、第1の画像の少なくとも1つの特性に少なくとも部分的に基づいて決定される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、検索が、そのステップ幅によって特徴付けられ、ステップ幅は、第1の画像の少なくとも1つの特性に少なくとも部分的に基づいて決定される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも1つの第1の画像の特性が、その第1の画像を特徴づける量子化行列を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、検索の少なくとも1つのパラメーターが、以前に実行された関連する画像の再圧縮プロセス中に蓄積された知識に少なくとも部分的に基づいて決定される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、パラメーターに初期MQF値を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、パラメーターにステップ幅を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、以前に実行された関連する画像の再圧縮プロセスが、少なくとも個別の第1の画像の量子化行列に類似した量子化行列を有する画像の再圧縮を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、個別の第1の画像の再圧縮に使用される量子化行列のスケーリングのための適切なMQF値の検索が、適切なMQF値の組内で、実行される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、量子化行列が、個別の第1の画像を再圧縮する最終量子化行列の計算に使用される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、画像の量子化行列の共有のために使用されるMQF値が、選択された初期MQF値の周りにどの程度近接して集まっているか、または散在しているかに基づいて、ステップ幅が小さくまたは大きくなるよう選択される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、個別の第1の画像の再圧縮に使用される量子化行列のスケーリングのための適切なMQF値の検索が、適切なMQF値の組内で、実行される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、個別の第1の画像の再圧縮に使用される量子化行列のスケーリングのための適切なMQF値の検索が、適切なMQF値の組内で、実行される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、個別の第1の画像の再圧縮に使用される量子化行列のスケーリングのための適切なMQF値の検索が、適切なMQF値の組内で、実行される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、個別の第1の画像の再圧縮に使用される量子化行列のスケーリングのための適切なMQF値の検索が、適切なMQF値の組内で、実行される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、個別の第1の画像の再圧縮に使用される量子化行列のスケーリングのための適切なMQF値の検索が、適切なMQF値の組内で、実行される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、個別の第1の画像を再圧縮する最終量子化行列を計算するために量子化行列が使用される。
本発明の一態様によれば、少なくとも1つの再圧縮パラメーターに基づき再圧縮プロセスを使用して様々な画像を再圧縮する画像再圧縮サブシステムを含む、画像再圧縮システムがさらに提供され、そのサブシステムは、そのパラメーターに適した値の組内で、様々な画像の中から少なくとも1つの個別の第1の画像の再圧縮に使用される適切なパラメーター値の検索を(1つのパラメータ値を、その組内でのその個別の第1の画像の再圧縮にあまり適していないと考えられる少なくとも1つ以上の他のパラメーターに対して優先して選択することを含めて)実行する再圧縮パラメーターデファイナー(definer)を含む。
本発明の一態様によれば、画像再圧縮システムがさらに提供され、そのシステムは、少なくとも1つの再圧縮パラメーターに基づき再圧縮プロセスを使用して様々な画像を再圧縮する画像再圧縮サブシステムと、そのパラメーター値を用いた再圧縮に適していると歴史的に考えられる画像の少なくとも1つの画像特性に関連する再圧縮パラメーター値のヒストリカルアーカイブ(historical archive)を含み、その再圧縮サブシステムは、ヒストリカルアーカイブ内で、個別の第1の画像の少なくとも1つの対応する画像特性に少なくとも類似した画像特性に関連する少なくとも1つの再圧縮パラメーター値を見つけることにより、様々な画像の中からの少なくとも1つの個別の第1の画像の再圧縮のための使用に適したパラメーター値を決定する。
本発明の一実施形態によれば、さらにまた別のシステムが提供され、そのシステムでは、再圧縮パラメーターは、より良いMQF値の検索を初期化する初期MQF値を含む。
本発明の一実施形態によれば、さらにまた別のシステムが提供され、そのシステムでは、画像特性は量子化行列を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、再圧縮パラメーターは、より良いMQF値の検索を特徴付けるステップ幅を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、反復圧縮は複数の繰返しを含む。
本発明の一実施形態によれば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮を含む、さらにまた別の方法が提供され、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を有し、独立した再圧縮は、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、新しい量子化行列の生成および独立した素ブロックレベルの圧縮のためにその新しい量子化行列の使用を含む、再圧縮された第2の画像の生成を含み、その新しい量子化行列は、少なくとも1つの第2の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることによって生成され、それにより少なくとも1つのスケーリングされた行列が提供され、その後、少なくとも1つの追加の量子化行列を、少なくとも1つのスケーリングされた行列と少なくとも1つの第1の量子化行列との加重平均として計算する。
本発明の一実施形態によれば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮を含む、さらにまた別の方法が提供され、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を有し、独立した再圧縮は、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、新しい量子化行列の生成および独立した素ブロックレベルの圧縮のためにその新しい量子化行列の使用を含む、再圧縮された第2の画像の生成を含み、その新しい量子化行列は、少なくとも1つの第2の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることによって生成され、それにより少なくとも1つのスケーリングされた行列が提供され、その後、少なくとも1つの追加の量子化行列を、少なくとも1つのスケーリングされた行列と少なくとも1つの第1の量子化行列との加重平均として計算する。
本発明の一実施形態によれば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮を含む、さらにまた別の方法が提供され、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を有し、独立した再圧縮は、第1の画像について少なくとも1回の独立した素ブロックレベルの反復圧縮操作を実行し、それにより、新しい量子化行列の生成および独立した素ブロックレベルの圧縮のためにその新しい量子化行列の使用を含む、再圧縮された第2の画像の生成を含み、その新しい量子化行列は、少なくとも1つの第2の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることによって生成され、それにより少なくとも1つのスケーリングされた行列が提供され、その後、少なくとも1つの追加の量子化行列を、少なくとも1つのスケーリングされた行列と少なくとも1つの第1の量子化行列との加重平均として計算する。
本発明の一実施形態によれば、さらにまた別のシステムが提供され、そのシステムでは、第1デジタル画像が、複数の反復により繰り返して圧縮される。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、素ブロックレベルの符号化画像がJPEG符号化画像を含む。
本発明の一実施形態によれば、さらにまた別の方法が提供され、その方法では、少なくとも1つの重み行列の全要素が1に等しい。
本明細書に示しかつ記載する局所適応方法は、
再圧縮する画像の少なくとも1つの画像面(image plane)内の各個別ブロックを圧縮することであって、
大域量子化行列を用いて、前記個別ブロックをJPEG符号化し、それにより、提案された整数の出力ブロックを取得することと、
その画像面内の少なくとも1つの個別領域に対して、
前記領域の制御された量より大きくはならない知覚的劣化を保証する領域固有の圧縮レベルを定義する領域圧縮パラメーターを生成することと、
前記領域圧縮パラメーターから領域量子化行列を生成することと、
前記個別領域内の少なくとも1つの特定ブロックに対して、前記特定ブロックに適用された前記JPEG符号化ステップが前記大域量子化行列ではなく前記領域量子化行列を使用した場合に少なくとも1つのエントリがゼロであったか否かを判断し、ゼロであった場合に、前記特定ブロックからJPEG符号化された提案された出力ブロック内の前記少なくとも1つのエントリをゼロに設定することとを含む、各個別ブロックの圧縮を含む、再圧縮方法を含むが、それに限定されない。
随意に、前記JPEG符号化は、前記個別ブロックをDCT変換すること、DCT変換した各ブロックを、その中の各エントリを大域量子化行列内の対応するエントリで割ることにより量子化し、それによりブロック数を取得すること、および提案された整数の出力ブロックを取得するために前記数を丸めることを含む。
随意に、前記領域圧縮パラメーターが、前記領域圧縮パラメーターに適した値の組内で、前記領域の再圧縮に使用される適切なパラメーター値の検索を実行することにより生成される。
随意に、その方法は、前記組内において、一つのパラメーター値を、前記領域の再圧縮にあまり適していないと考えられる少なくとも1つ以上の他のパラメーター値に対して優先して選択することを含む。
随意に、領域圧縮パラメーターはMQF値を含む。
随意に、前記検索は、少なくとも1つの第1領域について計算され、その後、前記少なくとも1つの第1領域に隣接した少なくとも1つの追加領域について計算され、検索が前記追加領域について実行される際に、前記検索を開始する前記適切なパラメーター値が、前記少なくとも1つの第1領域の前記検索によって生成された最終の領域圧縮パラメーター値に少なくとも部分的に基づく。
随意に、前記少なくとも1つの第1領域が、行に沿って前記追加領域に隣接する領域と、列に沿って前記追加領域に隣接する領域を含み、前記検索を開始する前記適切なパラメーター値が、前記行および前記列に沿って隣接する前記領域の前記検索によって生成された最終の領域圧縮パラメーター値の組み合わせに少なくとも部分的に基づく。
随意に、その方法は、複数の画像ブロックを含む第1領域に対して、前記領域固有の圧縮レベルが計算される計算も含み、現在の圧縮レベルを用いて、第1領域を圧縮して第2の画像を生じることと、前記第1領域に対する領域品質スコアを計算するために、符号化ブロック境界に沿って追加されたアーチファクト性エッジの尺度を使用することと、前記領域品質スコアが前記品質閾値よりそれぞれ高いかまたは低い場合に、前記現在の圧縮レベルを増減し、前記増加または減少させた圧縮レベルを現在のレベルとして使用することを含む前記圧縮に戻ることを含む、前記領域品質スコアを所望の品質閾値と比較することと、前記領域品質スコアが前記品質閾値に所定どおり近い場合に前記現在の圧縮レベルを前記領域固有の圧縮レベルとして使用することとを含む。
随意に、尺度の使用は、第1の画像と第2の画像との間の差分画像を計算することと、前記領域内で、2つの符号化ブロック間の各境界に対して、各境界に沿って追加されたアーチファクト性エッジの程度を示す各追加のブロックノイズスコアを計算することと、その領域内で各領域に対して計算された追加のブロックノイズスコアに基づき領域品質スコアを計算することとを含む。
随意に、前記尺度は局所類似性およびテクスチャの計算に基づく。
随意に、前記尺度は局所類似性およびテクスチャの計算にも基づく。
本明細書におけるMQFまたはQFへのどの参照も、所望であれば、必要に応じて、特定画像またはその一部に対する圧縮レベルを定義する任意の適切なパラメーターの使用によって置換され得、そのパラメーターは、その画像またはその一部の制御された量より大きくならない知覚的劣化を保証し、その劣化は、例えば、QS値の計算によって適切に操作可能にされ得る。知覚的劣化の制御された量は、ゼロであり得、その場合、知覚的可逆性がパラメーターで定義される圧縮レベルによって保証される。JPEGでは、そのパラメーターは通常、圧縮レベルを直接決定するJPEG量子化行列を生成するために、従来型のQF値として使用されることにより圧縮レベルを定義する。知覚的劣化は、例えば、局所類似性、テクスチャおよびブロックノイズのうちの1つまたは複数の任意の適切な組み合わせに基づき定義され得る。
本発明の一態様によれば、別個の入力画像を縮小サイズの別個の出力画像に処理するためのシステムが提供され、その方法は、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された別個の入力画像を受け取るように構成されたインタフェースと、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、出力画像と入力画像との間の目標とする定量的類似性尺度に関連するパラメーターを提供するように構成された品質パラメーターコントローラーと、入力画像を再符号化するように構成されたイントラ予測符号化コントローラーであって、再符号化がイントラ画像予測を含み、エンコーダーが符号化品質パラメーターに従って構成されている、イントラ予測符号化コントローラーとを含む。
さらに本発明の特定の実施形態によれば、別個の入力画像が標準のJPEG画像である。
さらにまた本発明の特定の実施形態によれば、出力画像が標準のH.264形式で提供される。
また、本発明の特定の実施形態によれば、別個の入力画像を縮小サイズの別個の出力画像に処理するためのシステムが提供され、そのシステムは、可逆または非可逆量子化を有するウェーブレットおよびブロック毎のビット面エントロピー符号化を利用する圧縮フォーマットで圧縮された別個の入力画像を受け取るように構成されたインタフェースと、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、出力画像と入力画像と間の目標とする定量的類似性尺度に関連するパラメーターを提供するように構成された品質パラメーターコントローラーと、入力画像を再符号化するように構成されたイントラ予測符号化コントローラーであって、再符号化がイントラ画像予測を含み、エンコーダーが符号化品質パラメーターに従って構成されている、イントラ予測符号化コントローラーとを備える。
さらにまた本発明の特定の実施形態によれば、別個の入力画像が標準のJPEG 2000画像である。
さらに本発明の特定の実施形態によれば、出力画像が標準のH.264形式で提供される。
また、本発明の特定の実施形態によれば、別個の入力画像を縮小サイズの別個の出力画像に処理するための方法が提供され、その方法は、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された別個の入力画像を受け取ることと、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、出力画像と入力画像と間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、入力画像を再符号化することであって、再符号化がイントラ画像予測、および符号化品質パラメーターに従って構成されている量子化ステップを含む、再符号化することとを含む。
さらに、本発明の特定の実施形態によれば、別個の入力画像を縮小サイズの別個の出力画像に処理するための方法が提供され、その方法は、可逆または非可逆量子化を有するウェーブレットおよびブロック毎のビット面エントロピー符号化を利用する圧縮フォーマットで圧縮された別個の入力画像を受け取ることと、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像と間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、入力画像を再符号化することであって、再符号化がイントラ画像予測、および符号化品質パラメーターに従って構成されている量子化ステップを含む、再符号化することとを含む。
さらにまた、本発明の特定の実施形態によれば、複数の入力画像を処理して、それぞれ複数の縮小サイズの出力画像を提供するシステムが提供され、そのシステムは、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビット面エントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の別個の入力画像を受け取るように構成されたインタフェースと、その複数の入力画像の各々に対して、各別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連するパラメーターを提供するように構成された品質パラメーターコントローラーと、複数の入力画像の各々を再符号化するように構成されたイントラ予測符号化コントローラーであって、再符号化がイントラ画像予測を含み、エンコーダーが、複数の入力画像の各々に対して提供された各符号化品質パラメーターに従って構成されている、イントラ予測符号化コントローラーとを備える。
さらに、本発明の特定の実施形態によれば、そのシステムは、品質パラメーターコントローラーで制御された複数の品質パラメーター制御インスタンスをさらに含み、その複数の品質パラメーター制御インスタンスの各々が複数の入力画像の1つまたは複数に割り当てられ、それに割り当てられた入力画像の各々に対して、各別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連する。
さらに、本発明の特定の実施形態によれば、そのシステムは、イントラ予測エンコーダーの複数のインスタンスをさらに含み、イントラ予測エンコーダーの複数のインスタンスの各々が、複数の入力画像の1つまたは複数に割り当てられて、それに割り当てられた入力画像の各々を再符号化し、その再符号化がイントラ画像予測を含み、そのエンコーダーが、そのエンコーダーのインスタンスに割り当てられた入力画像の各々に対して提供された各符号化品質パラメーターによって構成されている。
また、本発明の特定の実施形態によれば、複数の入力画像を処理するためのシステムが提供され、そのシステムは、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビット面エントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の別個の入力画像を受け取るように構成されたインタフェースと、その複数の入力画像の各々に対して、各別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連するパラメーターを提供するように構成された品質コントローラーと、複数の入力画像の各々を再符号化するように構成されたイントラ予測エンコーダーであって、その再符号化がイントラ画像予測を含み、複数の入力画像の各々に対して提供された各符号化品質パラメーターによって構成されているエンコーダーと、複数の入力画像に対して、複数の別個の入力画像に対応する複数のインデックス付き別個のオブジェクトを含む、単一の出力ファイルを提供するように構成されているビットストリームパッキングモジュールとを含む。
さらに本発明の特定の実施形態によれば、各オブジェクトは、複数の別個の入力画像のそれぞれ1つに対応する別個の画像を含む。
さらにまた本発明の特定の実施形態によれば、出力ファイルはMP4ファイルである。
また、本発明の特定の実施形態によれば、複数の入力画像を処理して、それぞれ複数の縮小サイズの出力画像を提供する方法が提供され、その方法は、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビット面エントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の別個の入力画像を受け取ることと、その複数の入力画像の各々に対して、各別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、複数の入力画像の各々を再符号化することであって、その再符号化がイントラ画像予測を含み、量子化ステップが、複数の入力画像の各々に対して提供された各符号化品質パラメーターによって構成されている、再符号化することとを含む。
また、本発明の特定の実施形態によれば、複数の入力画像を処理する方法が提供され、その方法は、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビット面エントロピー符号化を利用する圧縮フォーマットで圧縮されたか、またはイントラ予測符号化を利用する圧縮フォーマットで圧縮された、複数の別個の入力画像を受け取ることと、その複数の入力画像の各々に対して、各別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、複数の入力画像の各々を再符号化することであって、再符号化がイントラ画像予測を含み、量子化ステップが、複数の入力画像の各々に対して提供された各符号化品質パラメーターによって構成されている、再符号化することと、複数の入力画像に対して、複数の別個の入力画像に対応する複数のインデックス付き別個のオブジェクトを含む、単一の出力ファイルを提供することとを含む。
また、特定の実施形態によれば、別個の入力画像を、縮小サイズの別個の出力画像に処理するための方法およびシステムが提供される。いくつかの実施形態によれば、そのシステムは、インタフェース、品質パラメーターコントローラーおよびイントラ予測エンコーダーを含み得る。品質コントローラーは、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連している。イントラ予測エンコーダーは、入力画像を再符号化するように構成され、再符号化はイントラ画像予測を含み、エンコーダーは符号化品質パラメーターによって構成されている。
いくつかの実施形態によれば、目標とする定量的類似性尺度は、出力画像と入力画像との間の許容できる差を表す。さらに別の実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の最小限の類似性要件を表す。
いくつかの実施形態では、符号化品質パラメーターは、固定の事前定義値によって設定される。さらに別の実施形態では、符号化品質パラメーターは、事前定義した式によって計算される。さらにまた別の実施形態では、符号化品質パラメーターは、事前生成したルックアップテーブルから選択される。さらにまた別の実施形態では、符号化品質パラメーターは、事前定義した検索基準に基づく事前定義した反復検索プロセスによって判断される。
いくつかの実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の類似性に対する最小閾値を表す最小類似値によって示される。さらに別の実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の差異に対する最大閾値を表す最大差分値によって示される。さらにまた別の実施形態では、目標とする定量的類似性尺度は、それぞれ差異または類似性の範囲をもたらす、最小差分値または最大類似値によっても示される。
いくつかの実施形態では、最小類似値および/または最大差分値は、知覚的に同一の定量的類似性(または定量的差異)を示す。さらに別の実施形態では、最小類似値(または最大差分値)は、特定の構造的類似性(SSIM)指標値および関連するパラメーターの特定値によって示される。さらにまた別の実施形態では、最小類似値(または最大差分値)は、以下のパラメーターをもつ約0.95の構造的類似性(SSIM)指標値に対応するか、または実質的に等しい:つまり、シグマ=1.5の11×11ガウシアンフィルター、およびSSIM定数のデフォルト値−[0.01,0.03]。本発明のさらにまた別の実施形態では、品質パラメーターコントローラーは、以下のパラメーターまたはその相当物をもつ0.95以上のSSIM指標値を提供し、入力画像に対して実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成される。本発明のさらにまた別の実施形態では、品質パラメーターコントローラーは、約45dBのピーク信号対雑音比値に等しい符号化品質パラメーターを提供するように構成される。
いくつかの実施形態では、品質パラメーターコントローラーは、入力画像の定量的尺度に関連する入力画像品質パラメーターを取得するように構成される。品質パラメーターコントローラーは、入力画像の品質を特徴づけるために入力画像品質パラメーターを使用し得る。いくつかの実施形態では、入力画像品質パラメーターには、次のうちの1つまたは複数が含まれ得る:つまり、ビット/ピクセル、画像の品質表示、解像度および/またはファイルサイズである。いくつかの実施形態によれば、より高品質の入力画像に対して知覚的に可逆な圧縮を獲得するため、実質的により低値の符号化品質パラメーターが提供され得る。さらにまた別の実施形態では、入力画像品質パラメーターは、符号化品質パラメーター検索の一部として使用され得る。さらにまた別の実施形態では、入力画像品質パラメーターは、反復符号化品質パラメーター検索プロセスの初期化に使用され得る。
本発明のいくつかの実施形態では、品質コントローラーは、目標とする定量的類似性尺度により、出力画像と入力画像との間の類似性を維持しながら、別個の出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを提供するように構成される。さらに別の実施形態では、品質コントローラーが、出力画像と入力画像との間の類似性を最小類似値以上に維持しながら、別個の出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを提供するように構成される。さらにまた別の実施形態では、品質コントローラーが、出力画像と入力画像との間の差異を最大差分値以上に維持しながら、別個の出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを提供するように構成される。
さらに別の実施形態では、品質コントローラーは、出力画像と入力画像との間の類似性(または差異)を事前定義した類似性(または差異)の範囲内に維持しながら、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成される。
いくつかの実施形態によれば、品質コントローラーは、類似性評価モジュールを含み得る。類似性評価モジュールは、イントラ予測エンコーダーと連携して、符号化品質パラメーターの反復検索を実施するように構成され得、検索の各繰返しにおいて、収束基準が満足されるまで、符号化品質パラメーターが増分(減少)される。さらに別の実施形態によれば、収束基準は、1つまたは複数の以前の符号化品質パラメーターに関連するサイズ縮小と比較した現在の符号化品質パラメーターに関連するサイズ縮小の観点から、改善に関連する。
さらに別の実施形態では、収束基準は、1つまたは複数の以前の符号化品質パラメーターに関連するサイズ縮小と比較した現在の符号化品質パラメーターに関連するサイズ縮小の観点から、改善率に関連する。さらにまた別の実施形態では、符号化品質パラメーターの検索は、出力画像と入力画像との間の最小類似閾値(または最大差分閾値)によって制約される。
さらに別の実施形態によれば、類似性評価モジュールは、イントラ予測エンコーダーと連携して、反復符号化品質パラメーター検索を実施するように構成され得、各繰返しにおいて、入力画像の少なくとも1つのセグメントが、現在の繰返しに対して提供されている暫定符号化品質パラメーターを用いて圧縮された後、結果として生じた暫定圧縮出力画像と入力画像との間の類似性が評価される。いくつかの実施形態では、暫定圧縮出力画像と入力画像との間の類似性が基準を満足していると判断される場合、品質コントローラーは、出力として現在の暫定出力画像を提供するようにエンコーダーに指示し得る。いくつかの実施形態では、暫定圧縮出力画像と入力画像との間の類似性が類似性基準を満足していないと判断される場合、類似性評価モジュールは、調整された暫定符号化品質パラメーターを用いて入力画像の再圧縮を繰り返した後に、結果として生じた暫定圧縮出力画像と入力画像との間の類似性が評価されるように構成され得る。暫定符号化品質パラメーターの調整およびその調整済み暫定パラメーターを用いた入力画像の再圧縮の評価は、暫定圧縮出力画像と入力画像との間の類似性が類似性基準を満足するまで繰り返され得る。さらにまた別の実施形態では、検索基準も、暫定符号化品質パラメーターによって可能になるサイズ縮小に関連し得る。
さらに別の実施形態では、エンコーダーは、標準のH.264または標準のMPEG−4 part 10エンコーダーである。さらにまた別の実施形態では、エンコーダーは、インターフレーム(またはインター画像)予測を無効にし、符号化品質パラメーターによって量子化操作を実施するように構成される。さらにまた別の実施形態では、標準のH.264またはMPEG−4 part 10エンコーダーは、インループ非ブロック化フィルター(in−loop deblocking filter)を無効にするように構成される。いくつかの実施形態では、エンコーダーは、インループ非ブロック化フィルターを有効にするように構成され得る。また別の実施形態では、エンコーダーは、入力画像の品質に関連するパラメーターによって、インループ非ブロック化フィルターを有効にするかまたは無効にするかを判断し得る。また別の実施形態では、エンコーダーは、品質パラメーターコントローラーで提供される符号化品質パラメーターによって、インループ非ブロック化フィルターを有効にするかまたは無効にするかを判断し得る。例えば、エンコーダーは、比較的低品質によって特徴付けられる入力画像に対して、インループ非ブロック化フィルターを有効にするように構成され得る。
いくつかの実施形態によれば、エンコーダーは、別個の出力画像を含む標準のH.264またはMPEG−4 part 10ストリームを出力として提供するように構成される。さらにまた別の実施形態では、エンコーダーは、複数の別個の画像を含む標準のH.264またはMPEG−4 part 10ストリームを出力として提供するように構成される。さらにまた別の実施形態では、エンコーダーは、MPEG−4ファイルフォーマットに従ってフォーマットされた標準のMP4ファイルを出力として提供するように構成される。
本発明のさらにまた別の態様によれば、別個の入力画像を、縮小サイズの別個の出力画像に処理するためのシステムは、インタフェース、品質パラメーターコントローラーおよびエンコーダーを含み得、そのインタフェースは、可逆または非可逆量子化を有するウェーブレットおよびブロック毎のビット面エントロピー符号化を利用する圧縮フォーマットによって圧縮された別個の入力画像を受け取るように構成される。品質コントローラーは、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連する。イントラ予測エンコーダーは、入力画像を再符号化するように構成され、再符号化はイントラ画像予測を含み、エンコーダーは、符号化品質パラメーターによって構成される。
本発明のさらにまた別の態様によれば、別個の入力画像を縮小サイズの別個の出力画像に処理するための方法が提供され、その方法は、可逆または非可逆量子化を有するウェーブレットおよびブロック毎のビット面エントロピー符号化を利用する圧縮フォーマットで圧縮された別個の入力画像を受け取ることと、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、出力画像と入力画像との間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、入力画像を再符号化することであって、その再符号化がイントラ画像予測、および符号化品質パラメーターによって構成されている量子化ステップを含む、再符号化することとを含む。
本発明の一態様によれば、別個の入力画像を縮小サイズの別個の出力画像に処理するための方法およびシステムが提供される。いくつかの実施形態によれば、そのシステムは、インタフェース、品質パラメーターコントローラーおよびイントラ予測エンコーダーを含み得る。インタフェースは、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された別個の入力画像を受け取るように構成されている。品質コントローラーは、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連する。イントラ予測エンコーダーは、入力画像を再符号化するように構成され、再符号化はイントラ画像予測を含み、エンコーダーは符号化品質パラメーターによって構成されている。
さらにまた別の実施形態では、最小類似値(または最大差分値)は、修正されたSSIM品質尺度を用いて判断される。SSIM品質尺度は、画像の特定領域にペナルティを適用することにより適合され、修正されたSSIM品質尺度を生じる。これらの領域に対して計算されたSSIMスコアは、それぞれのペナルティに従ってペナルティを科される。一例では、ペナルティは、例えば、滑らかな領域で取得したSSIM値の二乗を伴い得る。さらに例として、滑らかな領域は、元の画像で局所的画像分散を計算し、その分散が閾値を下回る領域を滑らかと分類することにより、識別される。他のペナルティは、各領域に対するSSIM値について、異なる方法で使用および適用され得る。領域ペナルティ手順(regional penalty procedure)は、SSIMスコアリングプロセスと統合され得るか、またはSSIMスコアリングプロセスが完了した後に実施される追加のステップとして実施され得る。その上、他の種類の領域が存在し得、その識別は、局所的画像分散に加えて、さらなる技術を伴い得る。
さらにまた別の実施形態では、SSIM品質尺度が修正されて、局所的SSIMスコア全てを平均化する代わりに、事前定義した閾値によって判断されたとおり、最小SSIMをもつ領域に対して平均化が実行できるようになる。さらにまた別の実施形態では、画像がブロックに分割され、SSIM品質尺度が、各ブロックについて別々に計算された後、総合品質スコアがブロックスコアに基づいて計算され、システムによって使用される最小類似値が、ブロック毎の総合品質スコアに対応する。
さらに別の実施形態では、SSIM品質尺度の計算は、その計算を画像全体に対して実行する代わりに、入力画像の選択部分のピクセルおよび出力画像の対応するピクセルに対して実行することにより最適化され得る。
さらに別の実施形態では、最小類似値(または最大差分値)は、特定のピーク信号対雑音比(PSNR)指標値および関連するパラメーターの特定値によって示される。本発明のさらにまた別の実施形態では、品質パラメーターコントローラーは、約45dBのピーク信号対雑音比値に等しい符号化品質パラメーターを提供するように構成される。
さらに別の実施形態では、最小類似値(または最大差分値)は、入力画像に対して出力画像のブロックノイズの有無を定量化するブロックノイズ尺度、出力画像と入力画像との間のテクスチャ類似性を定量化するテクスチャ尺度、および出力画像と入力画像との間の局所類似性を定量化する局所類似性尺度を含む品質尺度によって示される。かかる品質尺度のさらなる詳細については、前述している。
本発明のさらに別の実施形態では、最小類似値(または最大差分値)は、特定の視覚情報忠実度(VIF:visual information fidelity)値および関連するパラメーターの特定値によって示される。本発明のさらに別の実施形態では、最小類似値(または最大差分値)は、特定の画質評価尺度(PQS:picture quality scale)指標値および関連するパラメーターの特定値によって示される。本発明のさらに別の実施形態では、最小類似値(または最大差分値)は、特定のビデオ品質メトリック(VQM:video quality metric)指標値および関連するパラメーターの特定値によって示される。本発明のさらに別の実施形態では、最小類似値(または最大差分値)は、特定の視覚的品質の知覚評価(PEVQ:perceptual evaluation of visual quality)指標値および関連するパラメーターの特定値によって示される。本発明のさらに別の実施形態では、最小類似値(または最大差分値)は、特定のモスクワ大学(MSU:Moscow State University)ブロックノイズ指標値および関連するパラメーターの特定値によって示される。本発明のさらに別の実施形態では、最小類似値(または最大差分値)は、特定のモスクワ大学(MSU)ぼかし(bluriness)指標値および関連するパラメーターの特定値によって示される。
いくつかの実施形態では、暫定符号化品質パラメーターは、符号化品質パラメーターの制限範囲について二等分(bi−section)を実行することにより更新される。さらに別の実施形態では、暫定符号化品質パラメーターの範囲は、ルックアップテーブルに指定されている符号化品質パラメーターの各値について二等分を実行することにより更新される。
本発明の特定の実施形態では、例えば、量子化誤差を増加させ得る量子化値を認識し、それらを回避することにより、圧縮された画像品質の単調性を圧縮の程度に応じて提供する、画像の再圧縮を提供しようとする。
本発明の特定の実施形態では、選択した程度の圧縮を提供するための機器と、量子化行列を用いて圧縮された画像の品質スコアが、選択した程度の圧縮に単調に関連するように、選択した品質係数から量子化行列を導出するための機器を含めて、およびその選択した程度の圧縮に従って画像を圧縮するための機器を備える、再圧縮システムを提供しようとする。圧縮の程度は、例えば、一般的なJPEG画像エンコーダーで一般に使用されるような、所与の量子化行列のスケーリングのためのスケーリング係数の導出に使用される品質係数(QF)尺度、または、本明細書に示しかつ記載するいずれかの方法で計算され得る、修正品質係数(MQF)によって表せられ得る。QFまたはMQFは、GUIなどの適切なユーザー入力装置を用いてユーザー選択されるか、コンピューターアルゴリズムによって生成されるか、またはテーブルに事前定義され得る。
本発明の一態様によれば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮のためのコンピューター化された方法も提供され、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を有し、その方法は、プロセッサーを用いて、第1の画像について少なくとも1回の独立した素ブロックレベルの圧縮操作を実行し、それにより、新しい量子化行列の生成および独立した素ブロックレベル圧縮のためのその新しい量子化行列の使用を含む、再圧縮された第2の画像を生成することを含み、その新しい量子化行列を利用する量子化プロセスで引き起こされた丸め誤差を計算することを含む。
本発明の一実施形態によれば、新しい量子化行列が、少なくとも1つの第2の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることにより生成されて、それにより少なくとも1つのスケーリングされた行列が提供され、その後、少なくとも1つの追加の量子化行列を、少なくとも1つのスケーリングされた行列と少なくとも1つの第1の量子化行列との加重平均として計算する方法が提供される。
本発明の一実施形態によれば、新しい量子化行列の少なくとも1つの値が、丸め誤差を最小化するように調整される方法がさらに提供される。
本発明の一実施形態によれば、再圧縮された第2の画像のリモート受信機への送信を含む方法がさらに提供される。
本発明の一実施形態によれば、調整が、量子化行列を提案された圧縮レベルに従って計算することと、量子化行列の各量子化値に対して、提案された量子化値および元の画像での量子化行列からの対応する量子化値を用いて丸め誤差を計算することと、丸め誤差が所与の閾値未満である任意の量子化値に対して、その丸め誤差が所定の閾値を上回るまで、所与の方向に、その値を1ずつ繰り返し変更することと、丸め誤差が閾値を上回ると、結果の量子化値を使用することとを含む方法がさらに提供される。
本発明の一実施形態によれば、JPEG規格の行列を含む、第1の量子化行列の提供を含む方法がさらに提供される。
本発明の一実施形態によれば、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮のためのコンピューターシステムが提供され、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を有し、そのシステムは、丸め誤差を削減する素ブロックレベルの圧縮装置(compressor)を備え、その圧縮装置は、第1の画像について少なくとも1回の独立した素ブロックレベルの圧縮操作を実行し、それにより、新しい量子化行列の生成および独立した素ブロックレベル圧縮のためのその新しい量子化行列の使用を含む、再圧縮された第2の画像を生成し、そのシステムは、新しい量子化行列内の少なくとも1つのエントリに対して丸め誤差を計算し、必要に応じて、その新しい量子化行列を利用する量子化プロセスで引き起こされた丸め誤差を削減するために、新しい量子化行列の値を調整することを含む。
本発明の一態様によれば、既知の第1の量子化行列を用いて圧縮された第1の画像を提供することと、候補の第2の量子化行列を提供することと、プロセッサーを用いて候補の量子化行列を修正して、その修正した量子化行列が、圧縮の程度に品質が比例する圧縮された画像を提供できるようにすることと、第1の画像を圧縮するために最終の第2の量子化行列を使用することとを含む、コンピューター化された圧縮方法がさらに提供される。
本発明の一実施形態によれば、修正が、最終の第2の量子化行列のための候補を使用して、それ自身と既知の第1の量子化行列との間の丸め誤差を評価することと、第1の行列内の1倍の対応値と第1の行列内の2倍の対応値との間に位置する問題のある値を検索することと、その検索で見つかった問題のある各値を第1の行列内の対応する値と置換し、それにより、最終の第2の量子化行列を取得することとを含む方法が、さらにまた提供される。
本発明の一実施形態によれば、修正が、候補の第2の量子化行列を提供することと、候補の第2の量子化行列内の各個別の要素に対して、第1の行列と候補の第2の行列との間に所与の関係が予期され得る丸め誤差を評価し、その丸め誤差がゼロからかけ離れている間、第2の行列の個別の要素を1ずつ繰り返し変更し、それにより、最終の第2の量子化行列を取得することとを含む方法が、さらにまた提供される。
本発明の一実施形態によれば、独立した素ブロックレベルの再圧縮がJPEGの再圧縮を含む方法がさらにまた提供される。
本発明の一実施形態によれば、丸め誤差の計算が、量子化行列内の対応する量子化値エントリの比率とその比率の丸め値との間の差の計算を含む方法がさらにまた提供される。
本発明の一実施形態によれば、丸め誤差が、量子化行列内の対応する2つの量子化値の比率の丸めの結果として生じたエラーを含む方法がさらにまた提供される。
本発明の一態様によれば、選択した程度の圧縮を提供するための機器と、量子化行列を用いて圧縮された画像の品質スコアが、選択した程度の圧縮に単調に関連するように、選択した品質係数から量子化行列を導出するための機器を含む、選択した程度の圧縮に従って画像を圧縮するためにプロセッサーを使用するための機器とを備える、コンピューター化された再圧縮システムがさらにまた提供される。
本発明の一実施形態によれば、圧縮の程度がQF尺度によって表されるシステムがさらにまた提供される。
本発明の一実施形態によれば、圧縮の程度がMQFによって表されるシステムがさらにまた提供される。
本発明の一態様によれば、少なくとも1つの第1の画像の圧縮に使用される既知の第1の量子化行列を収容するように候補の量子化行列を変更し、それにより、少なくとも1つの圧縮された第1の画像から再圧縮された、少なくとも1つの再圧縮画像を提供し得る修正された量子化行列を生成するための機器であって、その少なくとも1つの再圧縮画像の品質が、圧縮された第1の画像に対して再圧縮された画像の再圧縮の程度に比例する機器と、少なくとも1つの圧縮された第1の画像を再圧縮するために修正された量子化行列を使用するプロセッサーを採用するための機器を備える、コンピューター化された再圧縮システムがさらにまた提供される。
本発明の一態様によれば、選択した程度の圧縮を提供することと、量子化行列を用いて圧縮された画像の品質スコアが、選択した程度の圧縮に単調に関連するように、選択した品質係数から量子化行列を導出することを含め、プロセッサーを用いて、選択した程度の圧縮に従って画像を圧縮することと、画像を圧縮するために量子化行列を使用することとを含む、コンピューター化された再圧縮方法がさらにまた提供される。
本発明の一実施形態によれば、新しい量子化行列を利用する量子化プロセスで引き起こされた丸め誤差を削減するために、新しい量子化行列の少なくとも1つの値を調整するか否かを判断することと、調整する場合に、その新しい量子化行列を利用する量子化プロセスで引き起こされた丸め誤差を削減するために、新しい量子化行列の少なくとも1つの値を調整することを含む方法が、さらにまた提供される。
本発明の一実施形態によれば、圧縮レベルが、MQFおよびQF値の少なくとも1つを使用して、ユーザーにより選択される方法が、さらにまた提供される。
特許請求された主題の一態様によれば、例えば、そうでない場合とは対照的に高度な圧縮など、画像の圧縮レベルを分類するシステムおよび方法がさらに提供される。
本発明の特定の実施形態について、以下の図で説明する。
ここで図1を参照するが、図1は、本発明の特定の実施形態により、画像全体について計算され得る、局所類似性スコア、ブロックノイズスコアおよびテクスチャ歪みスコアのいくつかおよび好ましくは全ての組合わせなどを通常含む、品質尺度(本明細書では「品質スコア」とも呼ぶ)を採用する知覚的可逆な圧縮方法の簡略化した流れ図である。
本明細書に流れ図で示す方法は、例えば、図に示されるように、適切に順序付けられた図中のステップの一部または全てを含む任意の方法を含むことを意図する。
図1の方法に従って計算される品質尺度には、次の要素のいくつかまたは全てを含む:
a.一般的な局所類似性スコア
b.ブロックノイズスコア
c.テクスチャ歪みスコア
例えば、品質尺度は、スコア(b)のみ、またはスコア(c)のみ、またはスコア(a)と(b)、または3つのスコア(a)〜(c)の全てを含み得る。
局所的な類似性尺度は、正規化されたPSNRを含み得るが、これは制限することを意図しておらず、むしろ、局所類似性尺度は、例えば、圧縮前後の画像の、例えば、ピクセルなど、ごく一部に対応する、例えば、明度などの属性間の実質的な各差異の二乗和などだがこれに限定されず、任意の単調関数を含むことを意図し、例えば、減算の絶対値だがこれに限定されず、任意の適切な差分関数が使用される。ピクセル類似性値によるピクセルの平均平方の和の対数の使用は、限定することを意図しない、単なる1つの可能な局所的類似性尺度であることを理解されたい。局所類似性のレベルは、必ずしもピクセルレベルではなく、平均平方の和以外の他の結合関数なども使用され得る。
ブロックノイズ尺度は、第1の画像に比べて、第2の画像の追加のアーチファクト性エッジの有無の尺度を含む。ブロックノイズ尺度は、通常、例えば、符号化ブロック境界に沿ったエッジなどの、通常、第1デジタル画像になく、圧縮プロセスによって第2デジタル画像に取り込まれた、アーチファクト性エッジの存在を測定する。この尺度は、第1の画像と第2の画像の比較によって生成された差分画像でエッジを見つけ、定量化することにより操作可能にされ得る。
テクスチャ尺度(本明細書では「分散比」とも呼ぶ)は、第1の画像と第2の画像との間のテクスチャ類似性を定量化し、第1デジタル画像と第2デジタル画像との間の対応する領域のテクスチャにおける変化の定量的測定に基づく。通常、テクスチャベースの品質尺度を生じるテクスチャ変化が、事前定義した目標の間隔に含まれ、また、あまり大きくもあまり小さくもないことが求められる。
上述の品質尺度は例に過ぎず、限定することを意図するものでないことを理解されたい。通常、2つ以上の品質尺度が使用され、その場合、例えば、各品質尺度の可能な値が[0,1](1が可能な最良の質(圧縮前後の画像が実質的に同一である)を示し、0が最悪の質を示す)に含まれるように、品質尺度が相互に正規化される。
図1および本明細書の他の流れ図では、対応する方法は、適切に順序付けられているが、必ずしも図示されていない、以下のステップのいくつかまたは全てを含み得る。
ここで、JPEGのH.264への再圧縮品質スコア(本明細書では「品質尺度」とも呼ぶ)を計算するための図1の方法の使用について説明する。このタイプの再圧縮では、予期される品質劣化は、通常、特定の形態を有する。均一に広がっている可能性のあるピクセル値の差に加えて、H.264符号化の性質により、4×4ブロック内での詳細の損失および4×4グリッド上の追加のブロックノイズが予期され得る。本発明の特定の実施形態によれば、上述のタイプの歪みの程度が、知覚閾値を超えていないことを確認するために、それぞれ測定される。
信頼性があって容易に組み合わせられるスコアを獲得するため、その方法では、通常、スコアが[0,1](その入力画像から生成された再圧縮画像において、1が、入力JPEG画像の内容の「完全な」再圧縮を示す)の範囲にあることが確実になるように、例えば、スケーリングにより、正規化する。その方法はまた、通常、スコアが単調であること、すなわち、スコアが、量子化が粗くなるにつれて増加しないことも確認する。その方法は、通常、スコアが対称であること、すなわち、スコア(画像1,画像2)が、必ずしもスコア(画像2,画像1)と等しいことを必要としない。
ここで、図1のステップ10および図2に関連して、局所類似性スコア計算について説明する。全体的な画像歪みを評価するため、PSNRが使用され得る。PSNRは、特定のタイプのノイズおよび歪みの検出で信頼できないが、構造的歪みが別々に測定され、異常なノイズパターンも予期しない非線形歪みも通常追加されないため、PSNRは、一般的な局所類似性スコアとして使用され得る。[0,1]の範囲内のスコアを獲得するため、獲得したPSNRが正規化される。獲得したスコアは、従って、
PSNR>50dBの場合、PSNR=1
そうでない場合、 PSNR=PSNR/50
である。
本明細書で開示のとおり、局所類似性スコアは、第1の画像と第2の画像との間の知覚的類似性を評価するために、テクスチャ尺度と一緒に使用され得る。局所類似性尺度およびテクスチャ尺度の様々な例および変形例が本明細書で開示され、かかる例および変形例は、第1の画像と第2の画像との間の知覚的類似性を評価する方法の一部として、組み合わされ、実施され得る。
本明細書で開示のとおり、局所類似性スコアは、第1の画像と第2の画像との間の知覚的類似性を評価するために、ブロックノイズ尺度とも一緒に使用され得る。様々な例ならびに局所類似性尺度およびブロックノイズ尺度の変形例が本明細書で開示され、かかる例および変形例は、第1の画像と第2の画像との間の知覚的類似性を評価する方法の一部として、組み合わされ、実施され得る。
ここで、図1のステップ10および図3を参照して、ブロックノイズスコア計算について説明する。H.264符号化に起因するブロックノイズは、4×4グリッド上に出現することが分かっている。しかし、元のJPEG画像に存在し得るブロックノイズのアーチファクトのせいでスコアが低下するのは望ましくないため、再構築画像でブロックノイズを測定することは十分でない。
一例として、ブロックノイズ尺度は、以下を含み得る:すなわち、2つの符号化ブロック間の各境界に対し、各境界に沿って追加されたアーチファクト性エッジの程度を示す各追加のブロックノイズスコアを計算すること、各境界に対して計算された追加のブロックノイズスコアに基づき品質スコアを計算すること、および品質スコアに基づき知覚的品質基準が第2の画像によって満足されているか否かを判断することを含み得る。
例えば、本明細書に示しかつ記載する方法などだが、それに限定されず、ブロックノイズ推定のために任意の適切な方法が採用され得る。例えば、入力画像および再構築画像の両方においてブロックノイズを判断するため、H.264インループ非ブロック化フィルター方式が使用され得、その後、「追加された」ブロックノイズ量が評価され得る。本発明の特定の実施形態によれば、コーデック内に既に存在するブロックノイズ検出コードが、この目的を達成するために使用され得る。これには、コーデック内に既に存在するコードを再使用(最適化)し、また信頼できるブロックノイズインジケーターも使用するという利点がある。
別の実施形態では、差分画像のブロックノイズの計算を伴う。図34は、再圧縮画像に追加のアーチファクト性エッジがないことを示すスコアを獲得するプロセスを示す。差分画像を計算するため、輝度面など、2つの画像面のピクセル値が使用され、その差分画像は、その後、領域またはタイルに分割される。次に、符号化ブロック境界(すなわち、JPEGに対して8×8、またはH.264に対して4×4)に沿って、各領域またはタイルに対してスコアが計算される。
ブロックノイズスコアは、次のように計算され得る:
差分画像:imDiffを計算する。imDiff上で、符号化ブロックに沿ってグリッド(H.264に対して4×4およびJPEGに対して8×8)を実行し、水平または垂直ブロックエッジ上の各ポイントに対して、エッジの存在を確認する。
例えば:以下に示す、AブロックとBブロックとの間の垂直エッジに対して、
の場合、
A14とB11との間にエッジが存在する。
THRの可能な値は1.5であり、これは、ブロックエッジの両側での平均画素変化より3倍大きいブロックノイズに起因する画素変化に等しい。これは、例として図11に示すように、エッジが存在する位置に1を、存在しない位置に0を含む、二次元のエッジマップedgeValuesを生じる。その後、大域ブロックノイズスコアが[1−average(edgeValues)]として計算され、これは、1が再構築画像に新しい「エッジ」がないことを示す、[0,1]の範囲内のスコアである。上述のブロックノイズスコアが、空などの滑らかな領域、および特定の衣料品など若干のテクスチャ化領域でうまく実行されている。
本明細書で開示するとおり、ブロックノイズ類似性尺度(または追加のアーチファクト性エッジの有無)は、第1の画像と第2の画像との間の知覚的類似性を評価するために、他の類似性尺度と一緒に使用され得る。特に、本明細書に記載するかかる類似性尺度の様々な例および変形例を含め、本明細書に記載する特定の類似性尺度は、例えば、局所類似性尺度の様々な例および変形、ならびにテクスチャ尺度の様々な例および変形例、ならびに局所類似性尺度とテクスチャ尺度の組合わせに基づく類似性尺度の様々な例および変形例を含め、本明細書で開示するブロックノイズ尺度の様々な例および変形例と組み合わされ得る。
ここで、図1のステップ30および図4を参照して、テクスチャ歪みスコア計算について説明する。多数の画像について、テクスチャ詳細の憂慮すべき損失は、圧縮または再圧縮の結果として生じ得、継続する損失は、SSIMなどのいくつかの知覚スコアでは識別されない。例えば、皮膚領域でのかかる詳細損失は、圧縮または再圧縮画像で顕著であり得る。本発明の特定の実施形態によれば、局所テクスチャ歪みスコアは、例えば、ソース画像V1における各4×4ブロックでの分散が計算され、再構築画像V2における同じ4×4ブロックの分散と比較される。比率V1/V2が、例えば、[0.8,1.2]などの事前定義した範囲の外側にある場合、そのブロックに対するテクスチャ歪みスコアが1に設定される。その後、全体のテクスチャ歪みスコアが、全ての4×4ブロックについて、単純な、または適切に重み付けされた局所スコアの平均として計算され得る。重み付けは、例えば、テクスチャ歪みがより明らかな暗い領域に対してより大きな重みが使用され得る。分散計算のための適切なルーチン例は、次のとおりである:
Bの平均、値B[i][j](i=1,...,N、j=1,...N)のN×N(例えば、4×4または8×8)ブロックが
によって与えられる。
その後、Bの分散、値B[i][j](i=1,...,N、j=1,...N)のN×Nブロックが、
すなわち、ブロック値とブロック平均との間の絶対差の平均として計算される。
ここで、本発明の特定の実施形態による大域スコア計算(ステップ40)について説明する。3つの個別のスコア:つまり、前述の局所類似性、追加のアーチファクト性エッジの有無およびテクスチャスコアが、システム構成によって定義されたとおり、全体画像または全体画像の一部に対して各スコアを計算し、大域品質スコアを取得するために乗算または加重幾何平均を用いて、その3つの値を組み合わせることにより、大域スコアにプールされ得る。
タイルベースのアプローチでは、図5〜図7に示すように、画像がタイルに分割され、そのサイズは画像の寸法によって決まり得る。その後、上述の3つの全要素を組み合わせた、大域スコアが各タイルについて計算され、各タイルに対する値をもつ、1組のタイルスコアが提供される。その後、例えば、
0.5*({min{tilesores}+avg{tilescores})
式4
によって、全体画像または全体画像の一部に対する総合画像品質スコアが計算され得る。
代替として、タイルベースのスキームが採用され得、そこで、各3つのスコアが各可変サイズの画像タイル(32×32〜256×256)で計算され、タイルスコアの組を取得するために乗算または加重幾何平均を用いて組み合わされ得、そのタイルスコアの組は、その後、局所QP(量子化パラメーター)の適応または大域スコアを取得するための平均化のいずれかに使用され得る。平均化は、例えば、次のスキームのうちの1つを用いて実行され得る:1.画像またはその画像の一部における全てのブロックに対するmin{tilescore}(大域スコアは「最悪(worst)」ブロックのスコアである)、2.式0.5*(min{tilesores}+avg{tilescores})または任意の適切な加重平均式を用いて、画像もしくはその画像の一部における「最悪」ブロックと画像もしくはその画像の一部における全ブロックに対する平均ブロックスコアとの平均を大域スコアとする。
本明細書で開示のとおり、テクスチャ尺度は、第1の画像と第2の画像との間の知覚的類似性を評価するために、局所類似性尺度と一緒に使用され得る。テクスチャ尺度および局所類似性尺度の様々な例および変形例が本明細書で開示され、かかる例および変形例は、第1の画像と第2の画像との間の知覚的類似性を評価する方法の一部として、組み合わされ、実施され得る。
本明細書で開示のとおり、テクスチャ尺度は、第1の画像と第2の画像との間の知覚的類似性を評価するために、ブロックノイズ尺度とも一緒に使用され得る。テクスチャ尺度およびブロックノイズ尺度の様々な例および変形例が本明細書で開示され、かかる例および変形例は、第1の画像と第2の画像との間の知覚的類似性を評価する方法の一部として、組み合わされ、実施され得る。
組み合わされた類似性尺度、例えば、局所類似性尺度、テクスチャ尺度およびブロックノイズ尺度に基づく類似性尺度の例および変形例も本明細書に記載する。組み合わされた類似性尺度のかかる例および変形例は、変更すべきところは変更して、本明細書に記載するブロックノイズ尺度の例および変形例、およびテクスチャ尺度および局所類似性尺度に基づく、本明細書に記載する品質尺度の例および変形例に適用できる。
いくつかの実施形態によれば、本明細書で開示する、ブロックノイズ尺度に基づく品質スコア計算、および本明細書で開示するその例および変形例、ならびに、本明細書で開示する、局所類似性尺度のテクスチャ尺度との組み合わせに基づく品質スコア計算、および本明細書で開示するその例および変形例、ならびに、本明細書で開示する、ブロックノイズ尺度の局所類似性尺度とテクスチャ尺度との組み合わせに基づく品質スコア計算を含め、品質スコア計算が、タイルのサブセットについてのみ実行され得る。例えば、品質スコア計算が、入力画像に対して適用された2:1サブサンプリングについて実行され得るか、または今後の例で、品質スコア計算が、タイルの4:1サブサンプリングについて実行され得る。
図25aは、1つおきのタイルについて品質スコアを計算することにより、チェッカー盤のようなパターンを使用する、2:1のタイルのサブサンプリング例を示す図である。図25bは、4タイル毎の真ん中に配置されたタイルについて品質スコアが計算される、4:1のタイルのサブサンプリング一例を示す図である。
図26は、例として、サンプル画像について、全てのタイルについて計算した元の品質スコアと、修正品質係数(本明細書では「MQF」と省略する)の様々な値に関する2:1および4:1のタイルのサブサンプリングの結果として生じた品質スコアとを比較した図であり、サンプル画像についてこれらの最適化を実行する場合、品質スコアは著しく変化しないことを示す。修正品質係数(MQF)の詳細については、後述する。そのサブサンプリング方法は、後述する局所適応の再圧縮方法に対しても使用され得、その方法では、品質スコアが計算されていないタイルは、品質スコアが計算されている最も近いタイルのMQFを使用する。
3つのスコア(ブロックノイズ尺度スコア、局所類似性スコア、およびテクスチャ類似性スコア)を単一スコアに組み合わせた後、その単一スコアを閾値化するのではなく、ソフト閾値を3つの各スコアに対して別々に適用し、その後、全体画像または全体画像の一部に対する総合「合格/不合格」の判断を取得するため、用途に適した方法で2値化することが可能であることが理解されよう。
例として図1で示し、それに関して説明している再圧縮反復の品質スコアを見つけるための方法は、JPEGからJPEGへの再圧縮用途にも有用かつ適用可能であり、ここで説明する特定の違いを除いて、上述のように使用され得る。
図3のステップ220は、imDiff上で符号化ブロックに沿ってグリッド(JPEGに対して8×8)を実行すること、および水平または垂直ブロックエッジ上の各ポイントに対して、エッジを超えた差異と、エッジの両側での差異の合計との間のエッジ検出率を計算することにより、エッジの存在を確認することを含む。例えば、以下に示す、AブロックとBブロックとの間の垂直エッジについて、
|B11−A18|/(|B12−B11|+|A18−A17|)>THR
式5
の場合、A18とB11との間にエッジが存在する。
THRの可能な値は1.5である。これは、図15に示すように、エッジが存在する位置に1を、存在しない位置に0を含む、二次元のエッジマップを生じる。
図4のステップ310では、分散比V1/V2を取得するため、ソース画像における各8×8または4×4ブロックでの分散を示すV1が計算され、再構築画像における同じ8×8または4×4ブロックの分散を示すV2で割られる。図4のステップ320では、比率V1/V2が、例えば、[0.8,1.1]などの事前定義した範囲の外側にある場合、そのブロックに対するテクスチャ歪みスコアが1に設定される。この範囲は、同じ符号化スキームの使用によって予期されるテクスチャ歪みが少ないため、JPEGからH.264への再圧縮で使用される範囲よりも僅かに狭いことに留意されたい。
図1で示し、それに関して説明している方法のJPEGからJPEGへの再圧縮用途のための実施態様によって取得された品質スコアならびにその3つの要素(追加のアーチファクト性エッジスコアの有無、局所類似性スコア、およびテクスチャ類似性スコア)を評価するため、Matlabソフトウェアプログラムを使用してJPEG再圧縮が実行された。図1で示し、それに関して説明している方法のJPEGからJPEGへの再圧縮用途のための実施態様例およびその3つの要素を使用して、例えば、JPEG規格からのデフォルトの量子化画像のスケーリング係数を判断する品質係数が徐々に変更された。Matlab JPEGライターは、IJGコードに基づいている(MEXインタフェースを使用)。3つの画像例に対して取得した品質スコアのグラフが、品質係数の関数として、図8〜図10に例として示されている。それらのグラフは、3つの各スコアおよびそれらの大域スコアへの組み合わせを示す。それらのグラフは、ブロックベースのスコア計算を用いて作成された。考案者は、0.5の大域スコアが、人間のビューアーグループが元の画像と再圧縮画像を知覚的に同一であると判断することによって決定して、知覚的「等価性」と良く関連していることを発見した。例えば、図8〜図10のグラフのX軸上に示されるような「品質係数」という用語は、所望の符号化品質を示すJPEG(例えば)エンコーダーへの入力パラメーターを指すことを理解されたい。最も一般には、例えば、IJGにおいて、このパラメーターは、1〜100の間の値をもち、デフォルトの量子化行列に関するスケーリング係数に変換され、その量子化行列は、例えば、次の式:
MQF<50の場合、S=(5000/MQF)/100
そうでない場合、 S=(200−2*MQF)/100 (式6)
に従って、取得した品質を制御する。
「品質スコア」という用語は、本明細書では、例えば、圧縮または再圧縮の結果として生じた知覚的劣化を示す、計算された品質尺度を示すために使用し、通常、ブロックノイズ、テクスチャおよびPSNRのうちの1つまたは複数に基づき、また、デフォルトの量子化行列のスケーリング係数を設定することによって符号化JPEG画像の品質を判断するために、IJGエンコーダーで使用される品質係数(QF)と同義ではない。品質スコアは、通常、「元の」画像と「歪んだ」画像を比較し、それにより、元の画像に対して「歪んだ」画像の知覚的品質を評価することによって取得されるスコアを含み、例として、「元の」画像は入力画像であり得、「歪んだ」画像は、入力画像の圧縮または再圧縮したバージョンであり得る。例として、品質スコアは、[0,1]の範囲の値をもつか、または[0,1]の範囲にスケーリングされる。
JPEGからJPEGへの再圧縮、またはJPEGからH.264への再圧縮のための図1の方法の使用間の違いは、図1に示すように、使用するブロックサイズ(例えば、4×4または8×8)および分散比に対する閾値に限定され得る。
例として、次の2つのユーザー選択可能な再圧縮モード:つまり、全体画像または全体画像の一部に対する大域的なスコア計算を含むモード=0、および本明細書に記載のとおりブロックベースのスコアが計算されるモード=1(デフォルトのモードであり得る)が提供される。
随意に、再圧縮を相乗的に制御するため、局所類似性スコアおよびテクスチャスコアが使用され得る。例えば、局所類似性スコアがPSNRベースであって、PSNRスコアが、例えば0.95などの特定閾値を上回る場合、分散比の許容範囲は、[0.8,1.1](閾値未満のPSNRスコアに対して使用される)から[0.6,1,4]まで広げることができ、各方向に約25%多くの柔軟性を提供し得る。上述の例は、局所類似性、テクスチャおよびブロックノイズスコアのうちの任意の2つまたは3つ全ての間に、どのように用途に適した相乗効果が提供され得るかの可能な一例にすぎないことを理解されたい。
一般に、圧縮が、異なる画像ブロックに対して異なる深さまで実行される、特定のH.264用途などの用途に対しては、QP(量子化パラメーター)またはDCT閾値が各ブロックに対して別個に判断され得るように、画像レベルの品質尺度ではなく局所品質スコアが望ましい。図5〜図7は、本発明の特定の実施形態により、局所類似性スコア、ブロックノイズスコアおよびテクスチャ歪みスコアの全てまたはいくつかがブロックレベルで計算される図1の知覚的に可逆な圧縮方法に関する変形形態の簡略化した概ね自明の流れ図である。図5のステップ450では、特に、スコアは、いくつかの実施形態により、任意のイベントで局所的に計算され得るため、例えば、スコアをプールし、全体画像または全体画像の一部に対する大域QP(量子化パラメーター)を判断する代わりに、各領域に対して局所QPが使用される。タイルレベルのスコアが局所操作に使用され得る。
より一般的に、再圧縮システムのいくつかの操作モードの1つであり得る、本発明の一実施形態によれば、品質尺度が2つの完全な画像間で計算され得る。例えば、品質スコアが領域ごとに計算され得、全体画像に対する単一の品質スコアを生成するため、その結果がプールされ得る。同じシステムの第2の2つまたは数個のモードとして実施され得る、本発明の別の実施形態は、局所適応の再圧縮方法を実行するものであり、その圧縮では、品質尺度が各領域で評価され、圧縮パラメーターが各領域に対して別々に設定される。これは、例えば、H.264符号化でQPパラメーターを使用して、またはJPE符号化でDCT係数のゼロ化もしくは閾値化によって、実施され得る。
図5のステップ450では、特に、スコアは、いくつかの実施形態により、任意のイベントで局所的に計算され得るため、例えば、スコアをプールし、全体画像または全体画像の一部に対する大域QP(量子化パラメーター)を判断する代わりに、各領域に対して局所QPが使用される。タイトルレベルのスコアが局所操作に使用され得る。後述のように、各局所画像領域に対して異なる品質が要求される方法で、DCT係数の閾値を局所的に変更することにより、局所適応JPEG圧縮が実施され得る。
例えば、DCTの閾値を局所的に変化させることは、MQF(修正品質係数)行列Mの作成を含み得、その行列は各タイルに対するMQF値を保持する。図21は、本発明のいくつかの実施形態の一部として、局所適応JPEG圧縮プロセスの一部として使用される行列M(i,j)の値を設定するプロセスの流れ図である。いくつかの実施形態により、例として、ステップ2110で、行列M(i,j)の値を設定するプロセスの一部として、初期MQF値が設定される。さらに別の例として、第1タイルについて、初期MQF値がデフォルト値(例えば、約65)に設定される。かかる値は、参照画像に対して、最小数の繰返しとなる最良初期MQF値を判断するために、多数の画像で統計的分析を実行することにより、または、単にデフォルト値、つまりミッドレンジ値を使用することにより、選択され得る。さらに別の例として、後続のタイルで、初期MQF値が、現在のタイルの真上および左側のタイル(第1行のタイルに対しては、左側のタイルだけが使用され、第1列のタイルに対しては、真上のタイルだけが使用される)のMQF値の平均に設定される。
その後、図20A〜図20Bを参照して後述する符号化に類似する、異なるMQF値をもつ画像の反復符号化が、大域MQF方法で使用されるのと異なり得る、目標とする品質範囲に、品質が入るまで実行され、M(i,j)の値がこのプロセスを通して達するMQFに設定される。
一度このプロセスが全画像タイルに対して実行されると、各タイルに対する局所MQF値を保持する完全な行列Mが取得される。いくつかの実施形態では、タイルグリッドのエッジ上の値をタイルサイズより小さいエッジブロックまで拡張することにより、画像内の全てのブロックをカバーするように行列をパディングし、それにより、各8×8ブロックに対してMQF値を提供するように、パディング操作が実施され得る。
次に、最高量子化行列Qmaxが計算され得る。最高量子化行列Qmaxは、図19に関して本明細書に示しかつ記載するプロセスを使用して、最高のMQF値(max(M))に対応し得る。この量子化行列は、JPEGファイル自体に格納され得る。
DCT係数の量子化を実行するためにQmaxが使用され得るが、局所MQFに対応する量子化行列が使用された場合ゼロであった任意の係数を閾値化(DCT係数を閾値に制限する)またはゼロにする。図22は、本発明のいくつかの実施形態の一部として実施され得る、各8×8のDCTブロックに対する適応閾値をもつ量子化プロセスの流れ図である。図21の説明に従って取得される、各タイルに対して提案されたMQF値を保持する行列Mが、各タイルで適切な閾値化を実行するために使用される。その後、各8×8のDCTブロックに対して、1回は最大MQF値から導出された量子化行列を使用して(ステップ2210のブロック1)、1回はDCTブロックが属するタイルについて対応するMQF値を使用して(ステップ2230のブロック2)、2つの量子化プロセスが実行される。そして、画像で対応する8×8領域を表す量子化DCT係数の最終8×8のセットを取得するため、ステップ2240で、Qmax(ブロック1)を用いて量子化された8×8ブロックでのDCT値が閾値化される(閾値を上回る場合、閾値に設定される)か、または、局所MQFを用いて量子化されたDCT値がゼロ(ブロック2)の位置でゼロに設定される。これは、言うまでもなく、再圧縮画像で、各8×8のDCTブロックに対して繰り返される。
図37a〜図37gは、本発明の特定の実施形態による局所ゼロ化DCT係数の例を示す。一例として、解像度1944×2592ピクセルをもつ画像が入力画像として使用される。この画像は、本明細書で説明した局所適応の圧縮を実行するために、それぞれが256×256ピクセルのタイルに分割されて、完全な7行の完全な10タイルになる。図37aは、例として、各タイルに対して判断されたMQF値を示す。
最高量子化表に対応する、図37aに示す量列例M(i,j)の最大MQF値は、68(図37aの右下の隅に配置されている)である。従って、画像全体が、値68のMQF値に基づいて計算された量子化行列を使用して量子化される。この量子化表の値は、図37bに示されている。
ここで、例えば、図37aの右下隅のタイルの左側に隣接したタイルを参照すると、そのタイルは51のMQF値をもつ。MQF値51に対応する量子化行列が図37cに示されている。
ここで、例として、MQF値が51のタイルにある8×8ピクセルのブロックを参照されたい。かかるブロックのピクセル値の例を図37dに示す。図37eは、図37dのピクセルのDCT変換を、図37b(MQF=68)の量子化行列を使用して量子化した後の量子化DCT係数を示す。
図37fは、図37dのピクセルのDCT変換を、図37c(MQF=51)の量子化行列を使用して量子化した後の量子化DCT係数を示す。これらは、図37c(MQF=51)の粗い量子化行列が使用された場合に受け取られていたであろう係数である。
最後に、図37eのDCT係数行列が取得され、図37fの行列で、対応する値がゼロのどの係数もゼロに設定され、図37gのDCT係数行列が得られる。ゼロに設定されたDCT係数を太字で示す。このプロセスは、MQF値を51にすべきタイルの全ての8×8ピクセルのブロックに適用される。このようにして、たとえ画像の「大域」量子化行列が68の高いMQF値を有していても、51の低い局所MQF値がこのタイルでシミュレーションされ得る。
いくつかの実施形態によれば、図22に示すプロセスは、輝度チャンネルのみについて実行され得、クロマチャンネルはQmaxを使用して量子化され得るか、またはそのプロセスは、輝度チャンネルおよびクロマチャンネルの両方について実行され得る。
いくつかの実施形態の一部として実施され得る別の可能なDCT係数の修正は、DCT係数を、M(i,j)から導出された粗い量子化行列を用いた際、達したであろうレベルまで丸めること、すなわち、M(i,j)から導出された量子化行列を用いてそれらが達したであろう同じ量子化誤差を取得するために、非ゼロDCT値を丸めることを含む。
局所適応のJPEG圧縮に関連する本発明のいくつかの実施形態を説明してきたが、ここで、本発明のいくつかの実施形態により、局所的または大域的なスコアリングに使用され得る品質スコア計算のためのさらに別のブロックベースのアプローチについて説明する。図6のステップ520では、品質スコア計算のためのブロックベースまたはタイルベースのアプローチが採用され得る。ブロックまたはタイルのサイズは、入力画像のサイズによって決まり得る。例えば、特定の事前定義した画像サイズ範囲が提供され、事前定義した各画像サイズに対して、それぞれのブロックサイズが提供され得る。例として、ブロックまたはタイルのサイズは、サイズが0.25メガピクセル未満の小さい画像に対しては32×32に設定され、サイズが0.25〜1メガピクセルの中間の画像に対しては64×64に、また、サイズが1メガピクセルを上回る大きい画像に対しては128×128に設定される。場合により、滑らかな領域で品質スコア値を人為的に低くする滑らかな領域ペナルティをもつ、品質スコア値は、通常、ブロックまたはタイル内の各ピクセルに対して計算され、その後、1組のタイルスコアを得るために、ブロックまたはタイルについて平均化される。これらは、全体画像または全体画像の一部に対して、例えば、最低スコアmin{tilescores}をとるか、または次の式:
0.5*({min{tilescores}+avg{tilescores}) (式7)
(最悪ブロックと元の大域品質スコアとの平均に等しい)
で、最低スコアをスコアの平均と平均化することにより、単一の総合誤差に適切にプールされる。
それ故、総合スコア計算を取得するために、ブロックスコアの組み合わせが次のように実行される:各タイルについて計算した局所スコアをもつ、I×Jの2次元タイルスコアの配列TileScore[i][j]を仮定する。各タイルに対する単一のスコアは、そのタイルに対する上述の3つの品質スコア要素値(例えば、局所類似性スコア、ブロックノイズスコア、およびテクスチャ歪みスコア)を乗じることによって取得され得る。その後、総合スコアが次の方法のうちの1つを使用して計算され得る:
式中、重みw(i,j)およびノルム係数pは、事前定義されている。
さらに別の例として、ここで提供するもう1つ別の可能性は、PSNRベースのスコアを保持する配列、ブロックノイズスコアを保持する配列およびテクスチャスコアを保持する配列の、3つの2次元配列を維持することである。その後、上述した案の1つを使用して各尺度に対する大域スコアを取得し、その取得した3つのスコアを、それらを乗じることにより、最終スコアに組み合わせる。
ここで、図3で示す、ブロックノイズスコアの計算方法を実行するのに有用な計算例について説明する。この例では、説明を簡単にするため、4×4の画像ブロックが使用されている。図14Aおよび図14Bは、それぞれ、元の画像(入力画像)における2つの隣接する4×4ピクセルのブロック内、および再圧縮画像における2つの対応する4×4ピクセルのブロック内の輝度ピクセル値の例である。
図3のステップ210では、圧縮画像のピクセル値を元の画像のピクセル値から減算する(図14Aの値を図14Bの値から減算する)ことにより、図14Cの差分画像:imDiffを計算する。
次のステップ(図示せず)が、例えば、ステップ210の後に随意に提供され得る:
a:imDiff上で、例えば、JPEGからH.264への再圧縮用途に対して、4×4グリッドを実行し、例えば、JPEGからJPEGへの再圧縮用途に対して、8×8グリッドを実行し、水平または垂直ブロックエッジ上の各ポイントに対して、エッジの存在を確認する。
b:各ブロックエッジについて、各ブロックエッジに沿って追加されたアーチファクト性エッジの程度を示す、各追加のブロックノイズスコアを計算する。
c:エッジが存在する位置に1を、存在しない位置に0を含む、二次元のエッジマップedgeValuesを生成する。
特定の実施形態によれば、図3のステップ220で、imDiff上で、例えば、JPEGからH.264への再圧縮用途に対して、4×4グリッドを実行し、例えば、JPEGからJPEGへの再圧縮用途に対して、8×8グリッドを実行し、また、垂直エッジ(この例では、2つのブロックが垂直に隣接している)上の各ポイントに対して、エッジに渡る差異と、エッジの両側での差異の合計との間のエッジ検出率を計算する。第1行に対する次の式で、例を示すが、他の行も同様である:
これにより、次が得られる:
EdgeRatio1=|3−25|/(|(1−3|+|25−24)|)=22/(2+1)=7.33
EdgeRatio2=|0−2|/|((−23)−0)|+|2−7)|)=2/(23+5)=0.07
EdgeRatio3=|5−32|/(|3−5|+|32−28)|)=27/(2+4)=4.5
EdgeRatio4=|(−10)−13|/(|−21−(−10)|+|13−7)|)=23/(31+6)=0.62
例えば、閾値が3の場合、EdgeRatio1およびEdgeRatio3は、閾値を上回り、EdgeRatio2およびEdgeRatio4は、閾値未満である。それ故、この例のedgeValuesマップは、図15に示すとおりである。
図3のステップ230では、大域ブロックノイズスコアが[1−average(edgeValues)]として計算される。画像におけるブロックがこれら2つだけと仮定すると、average(edgeValues)は(1+0+1+0)/4=0.5であるため、この画像の大域スコアは0.5となる。
ここで、図4のテクスチャ歪みスコアの計算方法を実行するのに有用な計算例について説明する。次の例では、4×4ブロックの輝度ピクセルに対する分散(テクスチャ歪み)尺度が計算される。図16Aおよび図16Bは、それぞれ、元の画像(入力画像)における4×4ブロック内、および再圧縮画像における対応する4×4ブロック内の輝度ピクセル値の例である。
図4のステップ310で、次の式を使用して、各ブロックの平均が計算される:
Bの平均、値B[i][j](i=1,...,N、j=1,...N)のN×Nブロックが、
によって与えられ、
平均(オリジナル)=1332/16=83.25
平均(再圧縮後)=1211/16=75.69
である。
次に、各値から平均を減算し、それぞれ、図17Aおよび17Bに示すように、元の画像ブロックおよび再圧縮画像ブロックに対する正規化値を取得するため、この差の絶対値を取る。
最後に、次の式を使用して、図17Aおよび17Bの各ブロックの分散を計算する:
Bの分散、値B[i][j](i=1,...,N、j=1,...N)のN×Nブロックが、
として計算され、
V1=分散(オリジナル)=219.5/16=13.72
V2=分散(再圧縮後)=197/16=12.31
である。
図4のステップ320で、分散比(V1/V2)は、13.72/12.31=1.11である。事前定義した範囲が[0.8,1.2]であれば、分散比1.11は範囲内にあるので、このブロックに対するテクスチャ歪みスコアが0に設定される。他方、図35および36に示す例では、同じ計算で平均(再圧縮後B)=1293/16=80.81が得られ、従って、図17Bに示す、減算された値の絶対平均が得られる。その後、これの値は、分散の計算に使用され、V2B=分散(再圧縮後B)=165.4/16=10.34となる。
したがって、分散比(V1/V2B)は1.3であり、これは、上述の事前定義した範囲外であり、したがって、このブロックに対するテクスチャ歪みが1に設定される。図1〜図10を参照して本明細書で説明した知覚的品質尺度は、次のような幅広い種類の再圧縮用途をもつが、それらに限定されないことを理解されたい:
(a)JPEGからH.264への再圧縮用途、例えば、2009年10月5日に出願され、「A method and system for processing an image」という名称の、出願者の同時係属米国仮出願第61/248,521号に示されかつ記載されているものがあるが、これに限定されず、その技術が、本発明の特定の実施形態により適合され得る。
(b)JPEGからJPEGへの再圧縮用途、例えば、図12に関して本明細書で後述するものがあるが、これに限定されない。
(c)DCTまたは類似の変換を使用したブロックベースの符号化スキームを伴う他の再圧縮。
図1〜図10の方法で、JPEGおよびH.264画像からJPEGおよびH.264形式への再圧縮の評価、ならびに、本明細書に示しかつ記載する方法およびシステムに対して適用可能なほど、JPEGおよびH.264に十分に類似したフォーマットの再圧縮およびかかるフォーマットへの再圧縮の評価に適した知覚的品質尺度が提供されることを理解されたい。例えば、本明細書に示しかつ記載する方法およびシステムは、H.264と同一ではないが、H.264と共通する関連機能を有するフォーマットに適用でき得る。
さらに別の実施形態では、入力画像は、再圧縮の前に、異なる解像度にサイズ変更され、前記異なる解像度の再圧縮画像を取得するために再圧縮され得る。
さらに別の実施形態では、入力画像は再圧縮され得、その再圧縮画像は、前記異なる解像度の再圧縮画像を取得するために、再圧縮後に異なる解像度にサイズ変更され得る。
いくつかの実施形態では、画像が圧縮の前または後にサイズ変更される場合、観察者は、入力画像と出力画像が直接比較できないとき、主観的品質におけるより大きな損失を許容し得るため、目標の品質範囲が減少され得る。
図12は、本発明の特定の実施形態により、また、品質係数(QF)を使用するスケーリングによって先行画像の量子化行列から生成された量子化行列を使用して稼働する、画像の再圧縮のための方法の簡略化した流れ図である。通常、初期QFが、図1の方法により、最初の再圧縮反復に対して採用され、知覚的品質尺度が計算される。その尺度が目標の品質間隔範囲に入る場合、初期QFは満足できると判断される。尺度が間隔を上回る場合、品質は必要以上に良く、QFは通常、よりコンパクトな再圧縮を得るために減らされる。尺度が間隔を下回る場合は、必要以下の品質であり、QFは通常、再圧縮のコンパクトさを犠牲にして増やされる。その間隔は、後述のように設定されているが、限定する意図のない、数値例をもつ、1組のテスト画像の主観的評価によって得られる。
ここで、図12のステップ1050のための品質係数(QF)を得るための方法について、図13A〜図13Bを参照して説明する。その方法は、反復型で、通常、最適なJPEG品質係数を見出し、知覚尺度の性能を評価する。図13A〜図13Bの方法では、複雑さを軽減するため、品質係数が整数値に限定されるが、そうである必要はないことを理解されたい。再圧縮画像の品質は、本明細書に記載するJPEG品質スコアを使用して評価され得る。閾値は、0.05の許容範囲で0.5に設定され得、すなわち、[0.45,0.55]の範囲内の品質スコアを提供する画像が受け入れられ、さらなる再圧縮の繰返しは実行しない。画像が再圧縮の前または後にサイズ変更される場合、閾値は、0.05の許容範囲で0.425に削減され得、すなわち、[0.4,0.45]の範囲内の品質スコアを提供する画像が受け入れられ、さらなる再圧縮の繰返しは実行しない。入力画像がraw(未圧縮)フォーマットの場合、閾値が0.05の許容範囲で0.65に増加され得、すなわち、[0.6,0.7]の範囲内の品質スコアを提供する画像が受け入れられ、さらなる再圧縮の繰返しは実行しない。目標のQF(品質係数)は、図13A〜図13Bに示すように、反復型の二分法アプローチを使用して得られ得る。図13Bに示すように、初期化は、例えば、目標品質:qualTgt(=0.5)、および品質の許容範囲:qualTol(0.05)などの品質閾値を含み得る。最低および最高の許容QF値、例えば、minQFおよびmaxQFが設定され、また、図12のステップ1020で使用される品質係数に対する初期推測、QFnextが設定される。可能な値は:minQF=60、maxQF=98、QFnext=80である。初期化の後、画像がQF=QFnetを用いて符号化される。取得した画像品質:qualScoreを計算する。
|qualScore−qualTgt|<qualTol(または最大許容繰返し回数に達した)の場合、Target QF=QFで、プロセスが終了する。(maxQF−minQF==1)、すなわち、目標のQFが単一整数の範囲内で見つかった場合、QFnext=maxQF、minQF=maxQF(これが最後の繰返しであることを確実にするため)で、プロセスが画像符号化に戻る。(maxQF==minQF)、すなわち目標のQFが見つかった場合、Target QF=QFで、プロセスが終了する。qualScore<qualTgtの場合、minQF=QF、QFnext=QF+min(round(0.5*(maxQF−QF)),5)である。そうでない場合、maxQF=QF、QFnext=QF+min(round(0.5*(QF−minQF)),5)である。ここで、プロセスが画像符号化に戻る。
図13A〜図13Bのプロセスは、二分法検索(bi−section search)の一例であり、この検索では、QFに対する初期の許容範囲が決定され、各段階で、目標点が位置する「有効な」部分が二分される。次の特徴が提供され得るか、または提供され得ない:収束を確実にするための予防、すなわち、繰返しの最大回数の制限および目標QFの単一整数の範囲への限定(図13Aのステップ1130)が追加され得る。目標QFは、一般に、エッジ値よりも80に近いことが予期されるで、初期の繰返しにおいて、目標点を「踏み越える(over−step)」のを回避するために、ステップ幅が5に制限され得る。時々、反復プロセス中に、同じQF値が二度以上、検査される。複雑さを軽減するため、検査済みのQF値および取得した品質の組が、必要に応じて再使用するために保存され得る。
本明細書で説明した反復型の二分法検索アプローチに加えて、最適なQF値検索のもう1つ別の可能な方法は、割線法である。割線法は、例えば、次の式に従い、2つの最後の点を使用して、評価のための次の提案点を見つける:
式中、x
n+1は次の点であり、x
nおよびx
n−1は最後の2つの点であり、f(x
n)はQF値x
nにおける品質スコア−目標品質スコア(例えば0.5)である。
元の割線法は収束を加速し得るが、ルートがひとまとめにされない場合、すなわち、2つの以前の点が、所望の解の両側ではなく同じ側にある場合、うまく二分しない。そのため、別の可能な検索方法は、修正割線法(「挟み撃ち」法とも呼ばれる)であり、その方法では、目標点が角括弧で囲まれていると、すなわち、QF点に対する品質値がその両側にあれば、割線法が一度だけ適用される。さらに、結果が、QF値の許容範囲内に位置するように固定され得る。したがって、QFの反復検索プロセスは二分法検索方法を用いて開始し得、目標範囲を上回る品質スコアの1つの点と、目標範囲未満の値をもつ品質スコアの1つの点の、2つの点を取得すると、次の点を見つけるために、割線法が使用される。加えて、新しい提案QF値が以前の値に極めて近い場合は、収束を加速する二分法検索がその状況に対して使用される。
さらに別の例では、JPEG規格に見られるデフォルトの量子化行列を一様にスケーリングするためにスケーリング係数が使用され、その後、スケーリングされたデフォルトの量子化行列と元のJPEG画像の量子化行列との間で、単純な、または重み付けされた平均が計算される。通常、プロセス内の追加ステップが、新しい量子化行列内の各値が、元の画像の量子化行列内の対応値よりも決して小さくないことを確実にする。
図32aは、一例として、本発明の特定の実施形態により、また、先行画像の量子化行列と、例えば、JPEG規格で規定されているようなデフォルトの量子化行列などの第2の量子化行列とを組み合わせることにより生成された量子化行列を使用して稼働する、画像の再圧縮のためのシステムを示すブロック図である。
ここで、図23を参照されたい。いくつかの再圧縮実施形態によれば、再圧縮する第1の画像から導出された第1の量子化行列が、MQF(修正品質係数)と呼ばれる係数を使用してスケーリングされる第2の量子化行列と組み合わされ、再圧縮の実行に使用される「追加の量子化行列」を取得するために、第1の行列およびスケーリングされた第2の行列が組み合わされる。
独立した素ブロックレベルの圧縮に使用される、新しい量子化行列は、少なくとも1つの第2の量子化行列を少なくとも1つのスケーリング係数でスケーリングすることにより生成され、それにより少なくとも1つのスケーリングされた行列を提供し得、その後、少なくとも1つの追加の量子化行列を、前記少なくとも1つのスケーリングされた行列と少なくとも1つの第1の量子化行列との加重平均として計算する。加重平均は、次によって計算され得る:
a.第1加重要素を生成するために、少なくとも1つのスケーリングされた量子化行列内の各エントリを、少なくとも1つの重み行列(各エントリが0〜1の間の値を含む)の対応するエントリで乗じる
b.第2加重要素を生成するため、少なくとも1つの第1の量子化行列内の各エントリを、少なくとも1つの重み行列の対応エントリの値を1から引いた値によって乗じる
c.第1加重要素を第2加重要素に加算して、少なくとも1つの追加量子化行列の要素値の加重平均を得る。
図23は、例えば、図のように、適切に順序付けられたステップの一部または全てを含み得る、本発明の特定の実施形態により構築され稼働する再圧縮方法の簡略化した流れ図である。ステップ2360は、本明細書で詳細に説明するように、行列の組み合わせによる量子化行列の計算を含み得るか、またはその計算に使用され得る。
MQFの100は、通常、JPEGが提供し得る最高の再圧縮品質および、それ故、最低の再圧縮に対応する。MQFの1は、通常、最低のJPEG再圧縮品質および、それ故、最高の再圧縮に対応する。実際上、MQF 90が、多くの用途で非常に良い品質の再圧縮と見なされる。
再圧縮の深さは量子化行列の値の大きさに関連するため、通常、MQF値が高ければ、それだけ再圧縮品質が高くなり、かつ、取得する圧縮が少なくなるかまたは低くなるという点において、MQF値は、再圧縮の深さを制御またはスケーリングする。
2つの量子化行列の組み合わせである量子化行列を使用することの特定の利点は、かかる第1の行列が、再圧縮画像での、例えば、特定のブロックノイズまたはテクスチャをもつ、「特別な領域」に対する特定の適合性を含め、再圧縮する画像に特定的であり得る一方、かかる第2の行列は、一般に、画像の総合的な「集団(population)」に対するJPEG圧縮の前後での知覚的類似性を提供するために設計された標準のJPEG行列であり得る、ということである。この2つの単純な、または重み付けされた平均が、知覚的劣化の少ない、優れた圧縮をもたらす。
例えば、ここで、図18を参照すると、これは、本発明の特定の実施形態により、また、先行画像の量子化行列と、例えば、JPEG規格で規定されているようなデフォルトの量子化行列などの第2の量子化行列とを組み合わせることにより生成された量子化行列を使用して稼働する、画像の再圧縮のための方法の一例の簡略化した流れ図である。図18の方法は、通常、例えば、図のように、適切に順序付けられた次のステップの一部または全てを含む:
ステップ1810:関連する少なくとも1つの第1の量子化行列をもち、先行画像での素ブロックの独立符号化によって生成された、第1の画像を提供する。
ステップ1820:新しい量子化行列を、修正品質係数(MQF)から導出されたスケーリング係数を使用して、例えば、デフォルトのJPEG量子化行列などの第2の量子化行列をスケーリングすることにより生成し、その新しい量子化行列を、例えば、図19のように、加重平均化を使用して、入力JPEG画像の量子化行列と組み合わせる。
ステップ1830:ステップ1820で計算した新しい量子化行列を、第1の画像の暫定的な独立した素ブロックレベルの圧縮のために使用し、それにより、再圧縮した第2の画像を生じる。
ステップ1840:例えば、図1〜図10に関連して本明細書で説明した品質尺度のいくつかまたは全て、および本明細書で開示する、それら品質基準の変形を使用して、暫定圧縮のための品質尺度を計算する。
ステップ1850:品質尺度を使用して計算した値が目標の品質間隔の範囲に含まれる場合は、現在の再圧縮した第2の画像を出力し、そうでない場合には、例えば、図20A〜図20Bの方法を用いて計算され得、また、スケーリング係数に対して、品質尺度がテクスチャ変化尺度間隔の一方の側の側または別の側に位置する場合にそれぞれ初期値より大きいかまたは小さい、後続のMQF値を使用する。
図33および図19は、本発明の特定の実施形態により、図18のステップ1820で加重平均化を実行するための方法例の簡略化した流れ図である。図19の方法は、通常、例えば、図のように、適切に順序付けられた次のステップの一部または全てを含む:
ステップ1910:QOij(i,j=1..8)は、元の画像の量子化行列である。
QDij(i,j=1..8)は、第2の量子化行列であり、例えば、JPEG規格に記載されているデフォルトの量子化行列、画像に対して計算された最適JPEG量子化行列、元の画像の量子化行列、または画像の符号化用に選択された他の第2の量子化行列などである。
MQFは、再圧縮の現在の繰返しで使用される修正品質係数であり、図20Aおよび図20Bに関連して本明細書に記載のとおり計算され得る。
ステップ1915:第2の量子化行列QDijのスケーリングに使用されるスケーリングパラメーターのSを、次のように計算する:
QF<50の場合、S=(5000/QF)/100
そうでない場合、 S=(200−2*QF)/100
ステップ1920:スケーリングされた量子化行列QSij(i,j=1..8)を次のように計算する:
QSij=S*QDij(i,j=1..8)
ステップ1930:再構築した画像の一時的量子化行列QTij(i,j=1..8)を次のように生成する:
QTij=Wij*QSij+(1−Wij)*QOij(i,j=1..8)
ここで、Wij(i,j=1..8)は、0〜1の間の値をもつ、重み行列とする。
ステップ1940:再構築した画像の量子化行列QRij(i,j=1..8)を次のように生成する:
QTij>=QOijの場合、QRij=QTij
そうでない場合、QRij=QOij
全てのi,jに対してWij=0.5である場合、新しい量子化行列は、スケーリングされた量子化行列と元の量子化行列の平均である。通常、パラメーターSは、再圧縮の繰返し中に唯一変わる:すなわち、Sは、各繰返しで変わり、その後QRが計算され、QRを用いて新しい画像が圧縮され、その新しい画像の画像品質が、通常、例えば、本明細書で開示する任意の品質尺度および本明細書で開示するそのJPEG品質スコアの任意の変形例を含む、知覚的画像品質尺度を採用して評価され、そして、符号化が終了するか、または別の新しい画像が新しいSパラメーターを使用して再符号化される。
図39a〜図39dは、本発明の特定の実施形態により、新規の量子化行列生成を実行するための方法の一例を示す。図39aは、例として、入力JPEG画像の量子化行列を示す。図39bは、事前選択した量子化行列を示す。図39cは、例として、MQF値90から導出された、0.2のスケーリング係数を使用した、図39bの行列のスケーリング版を示す。図39dは、例として、図39cの行列を図39aの行列と平均化し、結果として生じた値を入力量子化行列の値に制限することにより作成された量子化行列を示す。
図38a〜図38gは、例として、デフォルトの量子化行列のスケーリング版のみの使用ではなく、入力量子化行列をデフォルト行列のスケーリング版と平均化することによる新規の量子化行列生成を実行するための本明細書で説明する方法の利点を図示説明する。
図38aは、元のJPEG画像の量子化行列の一例を示す。図39bは、例として、画像内の単一の8×8ブロックの量子化DCT係数を示す。図38cは、例として、図38bのブロックの再構築したピクセル値を示す。
この例では、目的は、約82の品質係数をもつ画像を再符号化することであると仮定する。図38dは、デフォルトのJPEG量子化行列を、82のQFに対応するスケーリング係数を使用してスケーリングすることにより得られた量子化行列を示す。図38eは、DCT、図38dの量子化行列を使用した量子化、逆量子化および逆DCT後に再構築されたピクセルを示す。
図38fは、例として、図38dの量子化行列とほぼ同様の品質係数をもつが、本発明の量子化行列生成方法の一例により、デフォルト行列のスケーリング版を元の量子化行列と平均化し、制限することにより作成された、量子化行列を示す。図38gは、例として、DCT、図38fの量子化行列を使用した量子化、逆量子化および逆DCT後に再構築されたピクセルを示す。
図38eの再構築したピクセルと図38cの元の再構築したピクセルとの間の平均平方誤差を計算すると、値15.84が得られる。図38gの再構築したピクセルと図38cの元の再構築したピクセルとの間の平均平方誤差を計算すると、値1.85が得られる。これらの値の差は、本明細書に記載する、新しい量子化行列を生成する方法を使用すると、量子化行列を生成するための標準的な方法を使用するよりも元の画像に近い画像が得られることを示す。
ここで、図20A〜図20Bを参照して、図18のステップ1850のための修正品質係数(MQF)を見つけるための反復型の方法について説明する。例として、通常、最適化MQFが取得され、知覚尺度の性能が評価される。図20A〜図20Bの方法では、複雑さを軽減するため、品質係数は整数値に限定されるが、そうである必要はないことを理解されたい。再圧縮画像の品質は、本明細書に記載するJPEG品質スコアを使用して評価され得る。例えば、閾値は、0.05の許容範囲で0.5に設定され得、すなわち、[0.45,0.55]の範囲内の品質スコアを提供する画像が受け入れられ、さらなる再圧縮の繰返しは実行しない。
画像内の各タイルの符号化に異なる品質が使用される局所適応再圧縮を使用する場合、総合スコアが最悪の動作のタイルとタイルの平均スコアとの平均であるため、目標品質が、例えば、約0.05の許容範囲の約0.45などの低い範囲に設定され得る。画像が再圧縮の前または後にサイズ変更される場合、異なる解像度をもつ画像内のアーチファクトをエンドユーザーが視覚的に比較および検出するのはより困難であるため、閾値は、0.025の許容範囲で0.425に削減され得る。入力画像がraw(未圧縮)フォーマットの場合、入力画像が圧縮されていない、したがって非常に高い品質をもつ場合、出力画像内のアーチファクトがより顕著となるため、閾値が0.05の許容範囲で0.65に増加され得る。
目標のMQFは、例として、図20A〜図20Bに示すように、反復型の二分法アプローチを使用して得られ得る。例として、図20Bに示すように、初期化は、例えば、目標品質:qualTgt(=0.5)、および品質の許容範囲:qualTol(0.05)などの品質閾値を含み得る。最低および最高の許容MQF値、例えば、minMQFおよびmaxMQFが設定され、また、図18のステップ1820で使用されるMQFに対する初期推測MQFnextが設定される。可能な値は:minMQF=35、maxMQF=95、MQFnext=70である。画像内の各タイルの符号化に異なる品質が使用される局所適応再圧縮を使用する場合、全体画像が「異なる」ブロックに対してもはやペナルティを課されないため、例として、初期MQF値がMQFnet=65に設定され得る。
初期化の後、画像がMQF=MQFnetを用いて符号化される。取得した画像品質:qualScoreを計算する。
|qualScore−qualTgt|<qualTol(または最大許容繰返し回数に達する)の場合、Target MQF=MQFで、方法が終了する。(maxMQF−minMQF==1)、すなわち、目標のMQFが単一整数の範囲内で見つかった場合、MQFnext=maxMQF、minMQF=maxMQF(これが最後の繰返しであることを確実にするため)で、方法が画像符号化に戻る。(maxMQF==minMQF)、すなわち目標のMQFが見つかった場合、Target MQF=MQFで、方法が終了する。qualScore<qualTgtの場合、minMQF=MQF、MQFnext=MQF+min(round(0.5*(maxMQF−MQF)),8)である。それ以外の場合、maxMQF=MQF、MQFnext=MQF+min(round(0.5*(MQF−minMQF)),8)である。ここで、方法が画像符号化に戻る。
図20A〜図20Bで示す方法は、二分法検索の一例であり、この検索では、MQFに対する初期の許容範囲が判断され、各段階で、目標点が位置する「有効な」部分が二分される。次の特徴が提供され得るか、または提供され得ない:収束を確実にするための予防、すなわち、繰返しの最大回数の制限および目標MQFの単一整数の範囲への限定(図20Aのステップ1130)が追加され得る。例として、目標MQFは、概ね、エッジ値よりも70に近いことが予期されるので、初期の繰返しにおいて、目標点を「踏み越える(over−step)」のを回避するために、ステップ幅が8に制限され得る。時々、反復プロセス中に、同じMQF値が二度以上、検査される。複雑さを軽減するため、検査済みのMQF値および取得した品質の組が、必要に応じて再使用するために保存され得る。
前述した反復型の二分法検索アプローチに加えて、もう1つ別の可能な検索方法が、割線法である。割線法は、次の式に従い、2つの最後の点を使用して、評価のための次の提案点を見つける:
式中、x
n+1は次の点であり、x
nおよびx
n−1は最後の2つの点であり、f(x
n)はQF値x
nにおける品質スコア−目標品質スコア(例えば0.5)である。
元の割線法は収束を加速し得るが、ルートがひとまとめにされていない場合、すなわち、2つの以前の点が、所望の解の両側ではなく同じ側にある場合、うまく二分しない。そのため、別の可能な検索方法は、修正割線法(「挟み撃ち」法とも呼ばれる)であり、その方法では、目標点が角括弧で囲まれていると、すなわち、MQF点に対する品質値がその両側にあれば、割線法が一度だけ適用される。さらに、結果が、MQF値の許容範囲内に位置するように固定される。したがって、MQFの反復検索プロセスは二分法検索方法を用いて開始し得、目標範囲を上回る品質スコアの1つの点と、目標範囲未満の値をもつ品質スコアの1つの点の、2つの点を取得すると、次の点を見つけるために、割線法が使用される。加えて、新しい提案MQF値が以前の値に極めて近い場合は、収束を加速する二分法検索がその状況に対して使用される。
使用した検索方法(二分法検索、割線法、または他の任意の方法)にかかわらず、検索に対する最適なMQF開始点およびステップ幅の選択は、検索の繰返し回数を減らすために、したがって、画像を再圧縮するための全体の処理時間を削減するために重要である。また、最適なMQF開始点およびステップ幅の選択は、必要な繰返し回数を増やすことなく、目標品質の範囲を減少することにより、より正確な作用点への収束も可能にし得る。
画像が再圧縮される際に、様々な画像について、適切な初期MQF値およびステップ幅に関するヒストリカル情報を蓄積する。特定の量子化行列または類似の行列を共有する画像は、同一または類似のMQF値が使用されると大抵うまく再圧縮されるため、かかる画像に対して歴史的に使用されたヒストリカルMQF値は、かかる画像に対する良いかまたは最高のMQF値は、そのヒストリカル値の周りに集まる傾向があるので、同一または類似の量子化行列をもつ新しい画像に対する初期値に対する良い推測である。ステップ幅は、その量子化行列または類似の行列を共有する画像に対して使用されたMQF値が、ヒストリカルMQF値の周りにどれほど近く集まっているかに基づいて選択され得る。
MQFなどの再圧縮パラメーターは、例えば、初期MQF値および/またはステップ幅など、自身のパラメーターが、例えば、圧縮する画像の量子化行列に関連する特性、および/またはテクスチャ特性などの任意の他の特性などに限る、圧縮する画像の任意の適切な特性から導出されている、検索によって得られ得る。
通常、過去に使用された再圧縮パラメーターは、同一または類似の特性をもつ後続の画像が、同一または類似の再圧縮パラメーターを使用して再圧縮され得るように、または、後続の画像に対する再圧縮パラメーターの検索が、同一または類似の画像に対して過去に使用された再圧縮パラメーターに基づきパラメーター化され得るように、再圧縮している画像の関連する特性に関連してアーカイブされる。再圧縮パラメーターは、実際の再圧縮プロセスの少なくとも1つのパラメーターを展開するために使用される検索パラメーターを含むことを理解されたい。例えば、MQFは、特定画像の再圧縮で実際に使用される量子化行列を展開するために使用され得、その画像の再圧縮パラメーターは、実際に、MQFだけでなく初期MQF、ステップ幅、または前述のように使用されるMQFの展開に使用される他の検索パラメーターを含む。
量子化行列間の類似性などの画像特性間の類似性を量子化するために任意の適切な行列が使用され得る。かかる行列は、少なくともいくつかの対応する行列要素または他の任意の適切な行列のユークリッド距離を含み得る。
図24は、図23の方法の実行に有用な、過去の画像の再圧縮に関するヒストリカルアーカイブを表す表である。
たとえ行列が、例えば、量子化行列間に、定義されていなくても、再圧縮する画像の量子化行列は、例えば、多数の画像を生成するために一人または多数のユーザーによって同じ画像装置または同一の画像装置および同じ設定(例えば、iPhoneなどの少数の設定をもつ商品)が使用される用途で、しばしば繰り返して現れるため、図24はそれでも、実際上、有用であることを理解されたい。
良いMQF開始点およびステップ幅を選択する1つの可能な方法は、入力画像の量子化行列に基づく。この方法は、まず、多数の画像を含む画像データベースの前処理をし、それを同じ量子化行列をもつグループ(通常、同じカメラにより同じ品質設定で撮られた画像)に分類することにより実行される。各グループについて、全画像に対する品質スコア対MQF値がプロットされる。その後、これらのグラフの挙動を観察することにより、反復検索の始まりで使用する、最適なMQF開始点および最適なMQFステップ幅が、各グループに対して決定され得る。このプロセスは、サイズ変更した画像に対して最適なMQF開始点およびMQFステップ幅を取得するため、既知の係数で画像のサイズ変更を実行している間、繰り返され得る。その最適値が第1の表に書き込まれ、対応する量子化行列が第2の表に書き込まれ得る。そして、再圧縮プロセスが、第2表に存在する既知の量子化行列に出合うと、そのプロセスは、MQF開始点およびMQFステップ幅の対応値を第1の表から使用する。このプロセスは、各画像に対して適切なMQFを判断する反復プロセスの高速収束を確実にする。
図27および図28は、様々な画像の組に対して取得した、品質スコア対MQFの例を提供する。図27は、例として、12の画像の組を示す。さらに例として、これらの画像のうちの10が、同じ量子化行列を共有し、それらの品質スコア対MQFが実線でプロットされている。さらにまた例として、残りの2つの各画像が異なる量子化行列をもち、それらの品質スコア対MQFが破線でプロットされている。図27は、実線は一様であるが、一方、各破線は異なっていて、品質対MQFグラフと、入力画像の量子化行列との間の相関関係を示している。
図28は、例として、9つの追加画像(またも例として、3つのグループに分類された)の品質対MQFの挙動の例を示し、各グループの3画像が同じ量子化行列を共有する。第1グループが実線でプロットされ、第2グループが破線でプロットされ、第3グループが鎖線でプロットされている。図28は、各3つのグループ内での一貫性が、これらのグラフの形状が、確かに、入力画像の量子化行列と極めて相互に関連していることを示している。
第2の方法は、取得した情報に基づき、所与の入力画像に対して、良いMQF開始点の判断を可能にする。第2の方法は、いかなる前処理も必要とせず、手動による介入なしで、完全に自動的に動作する。
第2の方法によれば、量子化行列または行列「クラス」の表が保持され、MQF開始値およびステップ幅が各行列に対して保存される。再圧縮前にサイズ変更される入力画像のMQF開始値およびステップ幅のための追加の列が存在し得る。初期値は、前項で説明したように、前処理した画像データベースから取られ得るか、または通常のMQF検索プロセスのデフォルト値が使用され得る(例えば、MQF=70、ステップ幅=8)。
各値の組に対して、信頼スコアおよび頻度スコアが保持され得る。信頼スコア(CS:confidence Score)は、提案された値が画像に対して今までどのようにうまく機能したかに基づいており、0または1回の繰返しの後にプロセスが収束した、すなわち、第1または第2MQFが、受け入れられた品質スコア範囲内に含まれる品質スコアをもたらしたのと同じ量子化行列をもつ、画像の割合として定義される。頻度スコア(FS:Frequency Score)は、このタイプの画像に今までいくつ出合ったか、すなわち、データベース内のそれらの頻度を示し、データベースがその最大容量に達した場合に、そのデータベース内でどのタイプの量子化行列を保持するかを判断するために使用される。
図29は、MQF開始点学習プロセスによって使用される表の例を示す。
例として、プロセスは、次のように実施され得る:量子化行列データベースに含まれていない画像クラス(量子化行列)に出合うと、この行列に対する新しいエントリが作成され、その値が、例えば、頻度スコア:10、信頼スコア:0.1、開始MQF:70、MQFステップ幅:8に初期化される。データベースに格納され得る量子化行列の最大数に達した場合、このエントリは、量子化行列のエントリを最低FSで置き換える。
画像の再圧縮後、例えば、図30に示すプロセスに従って、画像の量子化行列に対応するエントリが更新される。例えば、複数のサイズ変更値に起因して、複数エントリがある場合、それらの各々が、上述のプロセスに従って更新される。図30に示すプロセスは、可能な学習プロセスの単一の繰返し、すなわち、単一画像の再圧縮の終了時における、図29に示すような表内の値に対する更新を示している。入力画像の量子化行列が与えられると、適切なエントリが表内に作成されるか、または表内で選択され、対応するFS(頻度スコア)がステップ3100に従って更新され、他の全てのFSスコアはステップ3200に従って更新される。対応するエントリのMQF開始値、ステップ幅およびCS(信頼スコア)が全て、現在の画像に対して選択されたMQFおよび収束に必要な繰返し回数に従って値を更新することを目的とする、提示プロセスに従って更新される。例えば、ステップ3310で、結果として生じるMQFが、表に格納されているstartMQFと同じである場合、信頼スコアが増やされ、開始MQFは変更されない。そうでない場合は、ステップ3320〜3322に示すように、適応が実行される。
MQF開始点学習に関して前述の方法は、5つの異なる量子化行列をもつ182の画像のデータベースに関してテストされた。
図31aは、例として、MQF開始点およびステップ幅に対してデフォルト値を使用する場合、採用され得る繰返し回数をy軸上に、各画像の連番をx軸上に示す。図31bは、例として、前述したMQF開始点およびステップ幅学習プロセスを使用する場合、必要な繰返し回数をy軸上に、各画像の連番をx軸上に示す。
テストした画像データベースについて本明細書に記載する、適応MQF開始点およびステップ幅学習プロセスを使用すると、繰返しの総回数が1.33倍(305から229)だけ減少し、繰返しの最大回数は8から6に減少し、また、約50の入力画像を処理した後に、学習プロセスが安定した時、プロセスを使用しない場合の67画像とは対照的に、3つの画像だけが複数回の繰返しを必要とした。
図18〜図20Bの方法の多くの変形が可能であることを理解されたい。例えば、少なくとも1つの、通常は複数の繰返しが行われ、各繰返しは、所望であれば、知覚的に重み付けされ得る「対象の」量子化行列をスケーリングするために、修正スケーリング係数(MQF)から導出された現在の提案されたスケーリング係数を使用する。特に、対象の量子化行列は、特定の用途に対して、8×8のDCT二次元空間周波数ビンの各々に対して量子化係数を提供する8×8行列を含み、また、HVS(人間視覚システム)は、他よりも特定の周波数に対して他の周波数に対してより敏感でないので、「知覚的に重要な」周波数において、各周波数ビンでのHVSの感度に対応する、細かい(小さい)値をもつ、知覚的に重み付けされた量子化行列が使用され得る。
候補の量子化行列は、次いで、入力画像の量子化行列と、例えば、単純な、もしくは適切に重み付けされたか、他の平均化、または、例えば前述したようなプロセスの組み合わせによるが、それに限定されず、スケーリングされた対象行列との「間」にある行列を計算することにより生成される。代替として、本明細書に記載のとおり、候補の量子化行列は、入力行列とスケーリングされた「対象の」行列との間の平均ではなく、スケーリングされた入力行列であり得る。この候補の行列を使用して、対応する画像が生成され、取得した値が、例えば本明細書に記載するような方法であるがこれに限定されない任意の適切な方法で評価される。品質が不十分であると判断されると、例えば、特に本明細書に示しかつ記載する基準などであるがこれに限定されない適切な妥当性の基準を使用して、反復プロセスが通常、現在の提案されたMQF値を置き換えるために、「次の」提案MQF値を提案する。
図39a〜図39dは、本発明の特定の実施形態により、量子化行列生成を実行するための方法の一例を示す。
大規模の圧縮操作に対しては、専用装置が使用され得ることを理解されたい。
本発明の特定の実施形態の特別な利点は、圧縮は目標のビットレートに対してではなく、例えば、95などの、定数の品質係数を使用しないことである。代わりに、個々の各画像に対して「良い」MQFが生成され、良さは、通常、目標の知覚的劣化の範囲内に収まる知覚的劣化が生じ、また、例えば、所与の知覚的劣化範囲内で可能な限り高い、高圧縮をもたらすMQFとして定義される。
本明細書に記載のとおり、追加のアーチファクト性エッジの制御は、例えば、文献に記載のように、非ブロック化フィルターで実施されるブロックノイズの緩和などの、従来のブロックノイズの緩和に比べて、非常に有利である。従来技術では、アーチファクト性エッジを生じるような方法で画像を圧縮し、それから、かかるエッジを滑らかにする。本発明の特定の実施形態によれば、アーチファクト性エッジを生じ得る再圧縮は、先験的に使用されず、代わりに、特定の再圧縮パラメーターがもたらすような追加のアーチファクト性エッジの程度を評価し、許容できないアーチファクト性エッジが生じる場合は圧縮の程度を縮小することにより回避される。通常、評価は、全体的なアーチファクト性エッジではなく、追加のアーチファクト性エッジを識別する。従来型では、ブロックノイズは、例えば8×8ピクセルなど、ピクセルまたはブロック境界ごとに、局所的に識別され、識別された場合に緩和される。本発明の特定の実施形態によれば、アーチファクト性エッジは局所的に識別されず、代わりに、例えば、11以上のブロック(16×16ブロックなど)など、多数のブロックを含む領域について評価される。本発明の特定の実施形態によれば、追加のアーチファクト性エッジの存在を判断するためのプロセスが、図34に大まかに示されており、適切なプロセス例が図14〜図15に関連して本明細書に記載されている。
「入力画像」および「第1の画像という用語は、本明細書では、再圧縮するJPEG画像を指すために区別しないで使用される。
ここで、図32a〜図32bのシステムを参照されたい。図32aのシステムでは、例えば、所与の量子化行列をスケーリングして、それを入力量子化行列と平均化すること、または入力画像の量子化行列をスケーリングすることなどを含むが、これに限定されず、量子化行列を計算するために、任意の適切な方法が採用され得ることを理解されたい。
図32bのシステムは、入力画像の量子化行列を考慮に入れることなく、所定の量子化行列をスケーリングする、「標準の」エンコーダーを使用するJPEGからJPEGへの再圧縮用途に適している。入力量子化行列と平均化する代わりに、入力量子化行列は単に無視され得る。操作方法は、本明細書に詳細に記載するように、ブロックノイズおよびテクスチャ+PSNRなどの品質尺度を検査しながら、入力画像について標準のJPEGエンコーダーを繰り返し実行することを含む。
図40aは、図32aおよび図32bのMQF計算機によって実行され得る本発明の特定の実施形態により稼働する検索プロセスの簡略化した流れ図である。
図40bは、図40aの方法におけるステップ4240および4250の可能な実施態様の簡略化した流れ図である。
本明細書に示しかつ記載するように、「暫定的に」、すなわち、品質を評価し、その後、「最終の」圧縮プロセスのパラメーター化に関して判断するために圧縮する場合、暫定圧縮は完了し得ず、例えば、Y面(輝度)だけが圧縮され得る。最終のMQFが暫定圧縮の評価に基づいて選択されると、それは、その後、適宜圧縮されるクロマに対する量子化行列の作成に使用される。
図41は、画像適応で知覚的可逆なほぼ最大の画像圧縮を可能にする方法の簡略化した流れ図である。図41の方法は、通常、例えば、図のように適切に順序付けられた、次のステップのいくつかまたは全てを含む:
4410:第1(例えば、入力、JPEG)画像(または先行画像での素ブロックの独立符号化によって圧縮された他の素ブロックレベルの符号化画像)を、例えば、暫定圧縮パラメーターを使用して、圧縮し、第2(例えば、暫定的に圧縮された、JPEG)画像(または第1の画像での素ブロックの独立符号化によって前記第1デジタル画像から生成された他の素ブロックレベルの符号化画像)を得る。随意に、第2の画像に対する品質スコアが事前定義した知覚的品質範囲内にない場合、改善された圧縮パラメーターを検索する、さらなる繰返しが呼び出される(各繰返しは、随意に、前記個々の繰返しの前に、少なくとも1つの、例えば、全ての繰返しに基づく圧縮パラメーターの適合を含む)。
4420:符号化ブロック境界に沿って追加されたアーチファクト性エッジの尺度を実施する。
4430:少なくとも前記領域の品質スコアに基づき、知覚的品質基準が前記第2の画像によって満足されているか否かを判断し、例えば、随意に、少なくとも前記画像の品質スコアに基づき、知覚的品質基準が前記第2の画像によって満足されているか否かを判断する。
4440:随意に、第2の画像に対する品質スコアが知覚的品質基準を満足していないと判断される場合は、暫定圧縮パラメーターを再計算し、その再計算したパラメーターを使用して、暫定圧縮、検索および判断を繰り返す。
図42は、図41の実施ステップ4420の可能な実施態様の簡略化した流れ図である。図42の方法は、通常、例えば、図のように適切に順序付けられた、次のステップのいくつかまたは全てを含む:
4510:第1の画像と第2の画像との間の差分画像を計算する。
4520:前記差分画像内に領域を定義し、前記領域が複数の画像ブロックを含む。
4530:前記領域内で、2つの符号化ブロック間の各境界に対して、各境界に沿って追加されたアーチファクト性エッジの程度を示す、各追加のブロックノイズスコアを計算する。
4540:領域内の各境界に対して計算された追加のブロックノイズスコアに基づき、領域品質スコアを計算する。
図43は、実施ステップ4420のさらに別の代替実施態様の簡略化した流れ図である。図43の方法は、通常、例えば、図のように適切に順序付けられた、次のステップのいくつかまたは全てを含む:
4610:差分画像内に複数の領域を定義し、各領域が複数の画像ブロックを含む。
4620:前記複数の各領域に対して、例えば、出力画像での少なくとも2つの領域の対応する組に対して少なくとも2つの領域品質スコアを計算し、前記少なくとも2つの領域品質スコアに少なくとも一部基づき圧縮命令を提供することにより、領域品質スコアを計算し、それぞれ複数の領域品質スコアを得る。
4630:第2の画像に対して、前記複数の領域品質スコアに基づき画像品質スコアを計算する。
本明細書に示しかつ記載するシステムおよび方法は、特に、画像圧縮および再圧縮システムにおいて有用であり、VLSI、専用ハードウェア、DSPまたはCPUが組み込まれたシステム(コンピューター化された装置)、または汎用コンピューター上で完全に実行するソフトウェアでの実施を含め、ハードウェアまたはソフトウェアで実施され得る。
本明細書に示しかつ記載するシステムおよび方法を組み込む画像圧縮システムは、デジタルカメラ、ソフトウェアおよびハードウェア画像エンコーダー、ImageMagickおよびjpegtransなどのコマンド行PCアプリケーション、ならびにPhotoShop、Paint、Microsoft Office Picture Managerなどであるがこれに限定されない、圧縮画像をエクスポートする任意のPCソフトウェアアプリケーションを含み得る。
本明細書に示しかつ記載するシステムおよび方法を組み込む画像再圧縮および処理システムは、ソフトウェアおよびハードウェア画像エンコーダー、ImageMagickおよびjpegtransなどのコマンド行PCアプリケーション、ならびにPhotoShop、Paint、Microsoft Office Picture Managerなどであるがこれに限定されず、任意のPCイメージングソフトウェアを含み得る。
「品質スコア(quality score)」および「品質係数(quality factor)」という用語は、同義語ではないことを理解されたい。「品質係数」(QF)は、従来型のJPEGシステムによって、ユーザーが圧縮の程度、および、できれば、結果として生じる品質の程度を制御できるようにするために使用される。修正品質係数(MQF)については本明細書に記載されている。本発明の範囲は、圧縮(または再圧縮)の程度が、従来型のQFボタンのみによっではなく、通常はユーザー制御のMQFパラメーターまたはQFパラメーターによって制御される、JPEGシステムを含むことを意図している。
「品質スコア」または「品質尺度(quality measure)」は、例えば、、例えば、圧縮によって評価する画像が導出された、以前の画像に比べて、ユーザーの直接の画像品質の主観的評価に関連する式を提供しようとする。1つの原始的な品質スコアはPSNRであるが、より最新式の品質スコアを計算するための方法が、例えば、図1に関連してを参照して、本明細書に記載されている。
ここで図44aを参照すると、これは、本発明のいくつかの実施形態による、別個の入力画像処理システムの高レベルブロック図である。便宜上、図44aに示す実施形態、および本明細書で提供するその説明では、参照は、JPEG画像の再圧縮に対して行われる。いくつかの実施形態では、システム5010は、入力インタフェース5020、品質パラメーターコントローラー5030およびH.264エンコーダー5040を含み得る。
さらに図44bを参照すると、これは、本発明のいくつかの実施形態による、別個の入力画像の処理方法の流れ図である。プロセスは、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された別個の入力画像の受領から始まる。インタフェース4020は、図44aに例として示すような、JPEG規格に従って圧縮された別個のJPEG画像5012などの、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された別個の入力画像を受け取る(ブロック5210)ように構成される。いくつかの実施形態では、別個の入力画像は高品質JPEG画像である。
入力画像に対して可能な種々のソースには、デジタルカメラ5051、パーソナルコンピューター5052、モバイル通信装置5054またはデータセンター5056など、システム5010にネットワーク5050を介して接続されているリモート装置、およびローカルの記憶装置5058(例えば、ハードドライブディスク)などのローカル装置が含まれるが、それらに限定されない。
いくつかの実施形態では、インタフェース5020は、別個の入力画像をRAW画像フォーマットまたは可逆画像フォーマットに復号する(ブロック5220)ように構成されたデコーダーを含み得る。例えば、デコーダーは、圧縮画像を次のフォーマットのいずれか1つ:すなわち、YUV、RGB、BMP、PNGおよびTIFFに復号し得る。図44aに示す実施形態では、デコーダーは、入力JPEG画像をRAW画像に復号するように構成されているJPEGデコーダー5022である。別の実施形態では、デコーダーは、入力画像の部分復号を実行するように構成され得、圧縮画像をピクセル領域での表現に変換し得る。さらに別の実施形態では、デコーダーは、入力画像の部分復号を実行するように構成され得、圧縮画像を周波数領域での表現に変換し得る。さらにまた別の実施形態では、デコーダーは、前述のとおりJPEGデコーダー5022であり、JPEGデコーダー5022は、入力JPEG画像の部分復号を実行するように構成される。さらにまた別の実施形態では、JPEGデコーダー5022は、JPEG復号プロセスの一部として作成されたYUV 4:2:0サンプルを直接取り出し得る。
品質パラメーターコントローラー5030は、インタフェース5020に動作可能なように動作可能なように接続され得る。raw画像は、品質パラメーターコントローラー5030への入力として供給され得る。前述のとおり、品質パラメーターコントローラー5030は、別個の出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、パラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連する(ブロック5230)。いくつかの実施形態によれば、目標とする定量的類似性尺度は、そのシステムの出力画像と入力画像との間の許容できる差を表す。別の実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の最小類似要件を表す。
いくつかの実施形態では、品質パラメーターコントローラー5030は、固定の事前定義値によって符号化品質パラメーターを設定する(ブロック5231)ように構成され得る。別の実施形態では、品質パラメーターコントローラー5030は、事前定義した式に従って、符号化品質パラメーターを計算する(ブロック5232)ように構成され得る。さらに別の実施形態では、品質パラメーターコントローラー5030は、事前定義した検索基準に従って符号化品質パラメーターを選択するための事前定義した反復検索プロセスを実施し得る(ブロック5233)。さらにまた別の実施形態では、品質パラメーターコントローラー5030は、符号化品質パラメーターを事前生成した参照表から選択する(ブロック5234)ように構成され得る。前述の各選択肢に関する詳細については、後述する。
図44aおよび本発明のいくつかの実施形態によれば、例として、事前構成されたH.264エンコーダー5040は、イントラ予測エンコーダーとして使用される。いくつかの実施形態では、H.264エンコーダー5040は、イントラ画像予測を有効にし、インター画像(またはインターフレーム)予測を無効にする方法で事前構成され得る。
さらなる実施形態では、H.264エンコーダー5040は、インループ非ブロック化フィルターを無効にする方法で事前構成され得る。いくつかの実施形態では、H.264エンコーダー5040は、インループ非ブロック化フィルターを有効にする方法で事前構成され得る。さらに別の実施形態では、H.264エンコーダー5040は、入力画像の品質に関連するパラメーターによって、インループ非ブロック化フィルターを有効または無効のいずれにするかを決定するように構成され得る。さらにまた別の実施形態では、エンコーダーは、品質パラメーターコントローラーで提供される符号化品質パラメーターによって、インループ非ブロック化フィルターを有効または無効のいずれにするかを決定し得る。例えば、H.264エンコーダー5040は、比較的低品質によって特徴付けられる入力画像に対してインループ非ブロック化フィルターを有効にするように構成され得る。ある場合には、H.264非ブロック化の利用により、H.264エンコーダー5040で再符号化された出力画像の知覚的品質を改善し得る一方、非ブロック化の効果により、出力画像と入力画像との間の知覚類似性が減少し得る。
図44bの説明に戻ると、H.264エンコーダー5040は、品質パラメーターコントローラー5030に動作可能なように接続され得、符号化品質パラメーターがH.264エンコーダー5040に供給され得る。H.264エンコーダー5040は、符号化品質パラメーターによって構成され得る(ブロック5240)。H.264エンコーダー5040は、インタフェース5020にも動作可能なように接続され得、JPEGデコーダー5022などのデコーダーによって生成されるような入力画像の表現を追加の入力として受け取り得る。H.264 5040は、イントラ画像予測プロセスを使用して入力画像を再符号化するように構成され得、再符号化プロセスの少なくとも一部が、符号化品質パラメーターにしたがって構成され得る(ブロック5250)。再符号化プロセスに関する詳細について、以下で詳述する。
ここで図44cを参照すると、これは、本発明のいくつかの実施形態の一部として実施され得る反復符号化品質パラメーター検索プロセスの一例の流れ図である。検索プロセスの各繰返しで、類似性評価モジュール5032は、H.264エンコーダー5040に対する入力として提供される(ブロック5320)暫定符号化品質パラメーターを生成し得る(ブロック5310)。
いくつかの実施形態によれば、初期の暫定符号化品質パラメーターが事前定義され得る。例えば、初期の暫定符号化品質パラメーターは、H.264量子化パラメーター値5022に対応する値に事前設定され得る。さらなる実施形態では、初期の暫定符号化品質パラメーターは、システム5010のオペレーターによって選択され得る。例えば、システム5010のオペレーターは、2つ以上の選択肢を提示され得、各選択肢は、類似性と圧縮との間の異なるトレードオフを表し、それに応じて、各選択肢は、異なるH.264量子化パラメーター値に関連する。さらなる実施形態では、ユーザーの選択肢は、14と32の間のH.264量子化パラメーター値に対応する範囲をカバーする。さらに別の実施形態では、初期の暫定符号化品質パラメーターは、計算され得るか、または他の方法で判断され得る。例えば、初期の暫定符号化品質パラメーターは、入力画像の品質/解像度に関連するパラメーター、外部ユーザー選択パラメーターなどに基づき判断され得る。その上、例として、初期の暫定符号化品質パラメーターに対して可能な選択肢は、例えば、14と32の間のH.264量子化パラメーター値に対応する値のみが考慮され得る、事前定義した範囲によって制約され得る。
いくつかの実施形態では、検索終了基準は、最適化基準を含み得る。さらなる実施形態では、最適化基準に従い、暫定出力画像が、出力画像と入力画像との間の類似性(または差異)および別個の出力画像のサイズ縮小を最適化する場合に、評価モジュール5032は、符号化品質パラメーター検索を終了するように構成され得る。
別の実施形態では、例として、最適化基準は収束基準を考慮に入れ得、最適な出力画像は、その収束基準に従って、検索の現在の繰返しでの出力画像サイズの、1つまたは複数の以前の繰返しでの出力画像サイズとの比較による差異にも関連する。さらに例として、評価モジュール5032によって実施される収束基準は、1つまたは複数の以前の暫定符号化品質パラメーターに関連するサイズ縮小と比較した現在の暫定符号化品質パラメーターに関連するサイズ縮小の観点から、改善率に関連する。さらに別の実施形態では、符号化品質パラメーターの検索は、出力画像と入力画像との間の最小類似閾値によって(または最大差分閾値によって)制約され得る。
いくつかの実施形態によれば、現在の暫定出力画像が検索終了基準を満足すると判断される場合、類似性評価モジュール5032は、H.264エンコーダー5040に、現在の暫定出力画像に対応するH.264ビットストリームを再符号化プロセスの出力として提供するように指示し得る(ブロック5380)。
前述の説明では、符号化品質パラメーターに対する提案した検索が、複数の再符号化暫定出力画像の各1つに関して実施される。ここで、符号化品質パラメーターの検索プロセスの代替実施態様が提供されるが、それは、本発明のいくつかの実施形態により、画像のセグメント化およびその画像のセグメント(および、恐らくは各セグメント)での符号化品質パラメーターの実施に基づく。
ここで、図44dを参照すると、これは、本発明のいくつかの実施形態による、図44aのシステムをさらに詳細に示すブロック図である。前述のとおり、本発明のいくつかの実施形態では、イントラ予測エンコーダーは、H.264(またはMPEG−4 part 10)エンコーダー5440であり得る。いくつかの実施形態よれば、H.264エンコーダー5440は、システム5400で受け取った入力画像(または入力画像の表現)の再符号化の開始および再符号化された再圧縮出力画像の提供のため、品質パラメーターコントローラー5030からの(暫定符号化品質パラメーターを含む)符号化品質パラメーターの受領に応答し得る。
前述のとおり、H.264エンコーダー5440で実施される再符号化プロセスは、品質パラメーターコントローラー5030によって提供された符号化品質パラメーターに従って構成される。また、前述のように、H.264エンコーダー5440で実施される再符号化プロセスは、イントラ画像予測ステップを含む。ここで、H.264エンコーダー5440で実施され得る符号化プロセスの一可能な実施態様例が提供される。
品質パラメーターコントローラー5030から受け取った符号化品質パラメーターに加えて、H.264エンコーダー5440は、再符号化される入力画像(またはその表現)を受け取り得る。例えば、H.264エンコーダー5440は、JPEGデコーダー5022からの入力画像を、その入力画像のRAWフォーマット表現として受け取り得る。
いくつかの実施形態では、JPEGデコーダー5022は、入力JPEG画像を、その入力画像のRAWフォーマット表現に復号し得る。画像処理システム5410は、JPEGデコーダー5022によって提供されたRAWフォーマット表現をYCbCrフォーマット表現に変換するように構成され得る、YCbCrへのフォーマット変換モジュール5441を含み得る。さらに別の実施形態によれば、YCbCrへのフォーマット変換モジュール5441は、Cb成分およびCr成分の空間解像度を修正するようにも構成され得る。例として、YCbCrへのフォーマット変換モジュール5441は、Cb成分およびCr成分の空間解像度を水平および垂直方向に2倍に縮小するために、4:2:0のクロマサンプリングスキームを実施し得る。他のクロマサンプリングスキームが、本発明のさらなる実施形態の一部として使用され得る。JPEGビットストリームのYCbCrへのフォーマット変換は、標準JPEG復号の不可欠なプロセスであり、従って、YCbCrへのフォーマット変換モジュールは任意選択で、YCbCr表現はJPEGデコーダーから直接取得され得る。
H.264エンコーダー5440は、H.264イントラ予測機能を有効にし、インター予測機能を無効にするように構成され得る。H.264エンコーダー5440は、ダウンサンプリングされたYCbCr値をイントラ画像予測モジュール5442への入力として提供し得る。いくつかの実施形態によれば、イントラ画像予測モジュール5442は、入力画像の変換された表現を複数のマクロブロックに分割するように構成され得る。H.264の場合、マクロブロック分割は、規格によって規定される。H.264規格によれば、入力画像の変換表現は、16×16マクロブロックに分割される。
しかし、本発明のさらなる実施形態では、イントラ予測エンコーダーによって実施されるマクロブロック分割方法は、標準のH.264分割方法から離れ得るか、または異なり得る。例えば、イントラ画像エンコーダーは、H.264規格のイントラ予測と同様であるが8×8ブロックに適合されている概念を使用するイントラ予測で、JPEG画像を8×8ブロックに分割するように構成され得る。例として、この構成は、専用のエンコーダー(H.264規格に準拠していない)によって達成され得る。
図44dの説明を続けると、イントラ画像予測モジュール5442は、入力画像の変換表現内の1つまたは複数の16×16マクロブロックを、現在のマクロブロックを囲むマクロブロックの隣接するサンプルから予測するように構成され得る。H.264規格によれば、16×16マクロブロックが、予測されるブロックの左側および/または上側にある既に符号化されたマクロブロックの隣接するサンプルから予測され得る。さらにH.264規格によれば、予測がブロック全体について実行され得るか、または予測が各4×4ブロックについて別々に実行され得る。
他のブロックサイズの分割スキームを実施および使用し、異なるパターンに従ってブロックまたはサブブロックを予測する(例えば、現在のマクロブロック/ブロックの左側または上側にあるマクロブロック/ブロックからの予測に限定されない)イントラ予測エンコーダーの考案および実施が可能であることが理解されよう。
いくつかの実施形態によれば、イントラブロック予測に基づいてイントラ予測画像が決定され得、H.264エンコーダー5440の一部として実施されている、残差計算モジュール443が、イントラ予測画像および入力画像(またはエンコーダーで受信された入力画像の表現)に基づいて残差画像を計算するように構成され得る。
図44dの説明を続けると、予測および残差画像計算に続いて、これもH.264エンコーダー5440内に実施されている整数変換モジュール5444が、残差画像のピクセルの各4×4ブロックの各色成分を周波数領域に変換するために利用される。いくつかの実施形態によれば、H.264規格に準拠して、整数変換モジュール5444が、整数変換を実施するように構成され得る。他の変換技術を実施および使用するイントラ予測エンコーダーの考案および実施が可能であることが理解されよう。
変換された残差画像はその後、これもH.264エンコーダー5440の一部として統合されている量子化モジュール5446に渡される。本発明のいくつかの実施形態によれば、量子化モジュール5446は、品質パラメーターコントローラー5030によって提供された符号化品質パラメーターに従い、H.264エンコーダー5440によって構成され得る。いくつかの実施形態によれば、H.264エンコーダー5440は、品質パラメーターコントローラー5030によって提供された符号化品質パラメーターに従い、量子化モジュール5446によって使用される量子化パラメーター指標値を構成し得る。従って、量子化モジュール5446は、品質パラメーターコントローラー5030によって提供された符号化品質パラメーターに従い、残差データを量子化するように構成され得る。
量子化周波数領域表現行列は、エントロピー符号化モジュール5448に供給され得る。エントロピー符号化モジュール5448は、量子化変換係数を再順序付けするよう構成され得る。例えば、量子化変換係数の行列について、ジグザグ走査が実行され得る。一度再順序付けが行われると、エントロピー符号化モジュール5448は、エントロピー符号化を実行するように構成され得る。例として、エントロピー符号化モジュール5448は、H.264規格によって規定されるエントロピー符号化技術の1つを実施するように構成され得る:つまり、コンテキスト適応型可変長符号化(CAVLC)またはコンテキスト適応型2進算術符号化(CABAC)である。
いくつかの実施形態によれば、H.264エンコーダー5440によって生成された出力画像の符号化ビットストリーム表現は、別個の入力画像に関して知覚的に可逆な再圧縮された別個の出力画像を提供するために使用され得る。
H.264再符号化プロセスの構成のために適切な量子化パラメーターを使用すると、別個のJPEG入力画像に基づいている符号化H.264ビットストリームの生成、およびそのH.264ビットストリームに基づき、別個のJPEG入力画像に比べて知覚的に可逆(または知覚的に同一)な別個の出力画像の(例えば、H.264互換ファイルを介した)提供が可能であり、そして、別個の出力画像は、別個のJPEG入力画像に比べて実質的に縮小されたフットプリントによってさらに特徴付けられる。
図44a〜44dに示す実施形態および本明細書で提供されているその説明では、JPEG画像の再圧縮について言及されている。図44a〜図44dおよび本明細書での説明では、提案されたシステムの一実施態様例を提供する。さらに、本発明のさらなる実施形態は、JPEG画像の再圧縮に限定されず、図44a〜図44dに示すシステムに類似したシステムが、JPEG以外のフォーマット、および、特に、素ブロックの独立符号化を利用する圧縮フォーマットを用いて符号化された入力画像を再圧縮するため、当技術分野に精通した者によって容易に考案され得る。
その上、図44a〜図44dに示すいくつかの実施形態および本明細書で提供されているその説明で、H.264エンコーダーを使用する別個の入力画像の再圧縮について言及されている。図44a〜図44dおよび本明細書で提供されている説明では、提案されたシステムの一実施態様例を提供する。さらに、本発明のさらなる実施形態は、H.264形式(または、MPEG−4 part 10フォーマット)を使用する別個の入力画像の再圧縮に限定されず、図44a〜図44dに示すシステムに類似したシステムが、H.264以外のフォーマット、および、特に、イントラ画像予測および制御可能な量子化プロセスを利用する圧縮フォーマットに基づくイントラ予測エンコーダーを用いて入力画像を再圧縮するため、当技術分野に精通した者によって容易に考案され得る。
図45〜図55bは、圧縮の程度の関数として圧縮された画像品質の単調性を提供することを含む、画像を再圧縮するためのシステムおよび方法を示す。図45〜図55bを参照して後述するシステムおよび方法は、単独よび、例えば、図56a〜図56cに関連して後述するような、本発明の他の技術との併用の両方で有用である。
図45に示すように、次の再圧縮方法が、特定の実施形態に従って提供される。図45の方法は、例えば、図のように適切に順序付けられた、次のステップのいくつかまたは全てを含む:
ステップ6010:JPEG画像を入力する。
ステップ6020:再圧縮に使用する量子化行列を提供する。
ステップ6030:品質が圧縮の程度に比例する圧縮された画像を、単調化した量子化行列が提供するように、ステップ6020で提供される量子化行列のために単調性を増加するプロセスを実行する。
ステップ6040:入力JPEG画像を、ステップ6030で生成された単調化した量子化号列で圧縮する。
ステップ6050:圧縮したJPEG画像を出力する。
一般に、PSNRなどの品質スコアは、従来型のJPEGコーダーに適用される圧縮量に対して単調ではない。例えば、主観的評価において、時々、圧縮量が減少する場合に品質が低下する。
例えば、ある画像が、次の知覚的品質スコア(qualS)対MQFを生じることが分かった:
MQF:70 qualS:0.4069
MQF:80 qualS:0.38005
MQF:88 qualS:0.058504
MQF:92 qualS:0.86324
MQF:90 qualS:0.1638
MQF:91 qualS:0.79987
図46Aのグラフは、量子化値(すなわち、量子化行列の要素値)が12から1まで変化する場合に、値100(x)および90(o)を量子化する際に取得した実際の値を示す。より細かい量子化にもかかわらず、誤差が頻繁に増加している。例えば100について、Q=10では誤差がないが、Q=8では、4の誤差がある。
本発明の一実施形態によれば、量子化行列Q1を使用して圧縮した画像を再圧縮する場合、使用する量子化行列Q2は、その行列内のどのエントリに対しても、次の状況を回避するようなものでなければならない:
abs(Q1/Q2a−round(Q1/Q2a))=0.5
非単調性を引き起こすもの、すなわち、品質における下落は、絶対的な量子化誤差だけではなく、図47A〜図47Dに示すように、その位相であると考えられている。単調な品質の場合、ほぼ全ての量子化要素の誤差は、常に正である。それ故、絶対誤差を抑制する調整を実行するよりも、特定の閾値よりも低い丸めを引き起こす誤差を「無効にする」調整が採用され得る。
図48に示すループは、再圧縮のために提案された量子化行列を、本明細書に記載のとおり、または従来どおりに、値を計算しクリッピングした後に、計算する関数に追加され得る。図48の操作は、1回の繰返しにつき、8×8量子化行列内の64個の量子化値の各々に対して1回だけ実行され得る。
図49Aは、本発明の一実施形態により構築され稼働する再圧縮方法の簡略化した流れ図である。図49Aの方法は、通常、例えば、図のように適切に順序付けられた、次のステップのいくつかまたは全てを含む:
ステップ6510:既知の第1の量子化行列を使用して圧縮された第1の画像を提供する。
ステップ6520:例えば、修正品質係数の計算を含む反復プロセスを使用して、候補の第2の量子化行列を提供し、このMQFを使用して量子化行列を生成する。例えば、新しい量子化行列を生成するための方法の簡略化した流れ図である、図19のように、本発明の特定の実施形態により、入力JPEG画像の圧縮に使用された第1の量子化行列と、デフォルトのJPEG行列または圧縮中の画像に適した行列などのような第2の行列を含む、2つの行列が組み合わされ得る。MQFがスケーリング係数を計算するために使用され、第2の行列がスケーリングされ、結果として生じるスケーリングされた行列の加重平均および第1の行列が計算される。
ステップ6530:候補の第2の行列で、第1の行列内の1倍の対応値と第1の行列内の2倍の対応値との間に位置する「問題のある」値を検索する。問題のある各値を第1の行列内の対応値で置き換え、それにより、最終の第2の量子化行列を取得する。
ステップ6540:その最終の第2の量子化行列を使用して、第1の画像を圧縮する。
図49Bは、本発明の別の実施形態により構築され稼働する再圧縮方法の簡略化した流れ図である。図49Bの方法は、通常、例えば、図のように適切に順序付けられた、次のステップのいくつかまたは全てを含む:
ステップ6550:既知の第1の量子化行列を使用して圧縮された第1の画像を提供する。
ステップ6560:例えば、図19のように、候補の第2の量子化行列を提供する。
ステップ6570:候補の第2の量子化行列内の各要素に対して:
ステップ6580:第1の行列と候補の第2の行列との間の関係を考慮して、予期され得る丸め誤差を、例えば、図49Cの方法を用いて推定する。
ステップ6590:丸め誤差がゼロからかけ離れている(例えば、−0.1より小さいなど、大きな負値)場合、現在の第2の行列要素に対して1を加算/減算し、ステップ6580に戻る。
ステップ6600:候補の第2のq行列内の全要素に対して丸め誤差が申し分なく推定されたことを十分に確実にするよう、第2の行列内の全要素に対して1が加算/減算されると、この修正された候補の第2の量子化行列を使用して第1の画像を再圧縮する。
図49Cは、図49Bの丸め誤差推定ステップを実行するための方法の簡略化した流れ図である。図49Cの方法は、通常、例えば、図のように適切に順序付けられた、次のステップのいくつかまたは全てを含む:
ステップ6610:次のように「丸め誤差」を計算する:
Qr=Qv_input/Qv_proposedを計算する
ステップ6620:次の計算をする:Er=Qr−round(Qr)
ステップ6630:64個の要素の各々について、Er<−0.1の間(Erは、作成方法のために、−0.5未満にならない)、次の計算をする:Qv_proposed=Qv_proposed−1(または+1)、その後、もはやEr<−0.1が真でない場合を除いて、繰り返す。
本明細書で提案した方法のいくつかの実施形態を使用して再圧縮された多数の画像を検査した後、品質スコアと実際に認識された画像品質の両方が、MQFに対して単調ではないことが分かり、これは、反復型の、知覚的に可逆な再圧縮システムにおける最適なMQFの検索プロセスを拡張し得る。
この効果を示すため、V1を元のJPEGでの復号された量子化DCT値とし、Q1を元のJPEG量子化行列内の対応する量子化値とする。すると、逆量子化後に再構築された値は、V1*Q1である。Q2を、再圧縮プロセスで量子化行列によって使用される対応量子化値とする。すると、新しい量子化DCT値は、V2=round(V1*Q1/Q2)によって与えられる。この値は、その後、V2*Q2として、デコーダーで再構築され得る。
したがって、再量子化プロセスで取り込まれた誤差は次のとおりである:
Qe=(V1*Q1)−(V2*Q2)=V1*Q1−Q2*round(V1*Q1/Q2)
量子化率QRがQR=Q1/Q2として定義されると、これは、次の結果になり得る:
Qe=Q2*(V1*QR−round(V1*QR))
この誤差は、特定のDCT係数値によって決まるが、係数がランダムに分配されると仮定すると、誤差はQR−round(QR)に比例する、すなわち、QRが整数値から離れれば離れるほど、予期される誤差が高くなる。
さらに別の評価は、品質における主な下落が、この丸め誤差[QR−round(QR)]が大きな負値の場合に生じることを示している。それ故、丸め誤差が特定の閾値未満の新しい量子化行列を無効にする調整が採用され得る。
図50aおよび図50bは、ぞれぞれ、単調性改善プロセスがある場合とない場合に、画像例に対して取得した品質スコア対MQFの一例を示す。図50bに対して使用され、図50aに対して使用されていない単調性改善プロセスは、図51に示されている。図51の方法は、通常、例えば、図のように適切に順序付けられた、次のステップのいくつかまたは全てを含む:
ステップ6710:量子化行列Qを、例えば、図19のように、提案されたMQFに従って計算する。
ステップ6720:Q内の64個の各q値について、提案されたq値および、元の画像での量子化行列からの対応するq値を使用して、丸め誤差を計算する。
ステップ6730:丸め誤差が所与の閾値未満の任意のq値について、その丸め誤差が閾値を超えるまで、その値を1だけ繰り返して増加または減少する。
ステップ6740:丸め誤差が閾値を超えると、結果として生じたq値を使用する。
図51に示すプロセスは、次の2つの自由度を有する:つまり、許容できない丸め誤差に対する閾値の選択、および提案された量子化行列の値の増加または減少のいずれかによる修正である。図51に示すプロセスを実施する一方法は、例えば、約−0.1の閾値、量子化値減少アプローチを使用した閾値化であることが分かった。
さらなる実施形態によれば、非単調性問題に関連して、元の量子化値の2倍以下の提案されたq値、すなわち、q_new<=2*q_orgを特定すること、および量子化値をq_org、または1.1*q_orgに修正することを含む、代替プロセスが使用され得る。図50aおよび図50bは、それぞれ、図51の単調性修正を使用する場合と使用しない場合での、画像例に対して取得した品質スコア対MQFの一例をグラフで示す。
図52は、例えば、本明細書に示しかつ記載するように、新しい量子化行列を計算した後に、単調性修正(単調性改善)方法を適用する一例を示す。単調性修正によって影響を受ける値が太字で示されている。図53a〜図53gは、より細かい量子化にかかわらず丸め誤差の増加の例を示し、これは、本発明の特定の実施形態に従い、例えば、問題のある量子化値を無効にすることによって、画像品質対MQF関数の単調性を確実にするかまたは増加させることの重要性を示す。
特に、図53aは、逆量子化後の入力画像の元のDCT係数を示す。図53bは、入力画像の圧縮に使用される量子化行列の一例を示す。図53cは、図53bの行列、および逆行量子化を使用した量子化後に、結果として生じるDCT係数を示す。図53dは、図53cの値と図53aの値との間の絶対誤差を示す。
図53eは、入力画像の圧縮に使用される第2の量子化行列の一例を示し、これは、図53bの行列よりも細かくて、それ故、実際ではないが、理論的には、より高い品質画像を作成すると予測される。図53fは、図53eの行列、および逆行量子化を使用した量子化後に、結果として生じるDCT係数を示す。図53gは、図53fの値と図53aの値との間の絶対誤差を示す。
例えば、図53dの値の平均など、第1の量子化行列を使用した、再構築された係数と元の係数との間の平均絶対誤差は、1.1である。例えば、図53gの値の平均など、第1の量子化行列よりも細かい第2の量子化行列を使用した、再構築された係数と元の係数との間の平均絶対誤差は、1.5である。要約すれば、より細かい量子化行列を使用して圧縮すると、低品質の画像が生じ得、それ故、本明細書に示しかつ記載する、単調性を提供または増加する方法の有用性につながる。
図54A〜図54Eは、本明細書に示しかつ前述した方法と併用すると便利な量子化行列計算プロセスの段階を示す表である。
図54Aは、再圧縮する入力JPEG画像の生成に使用する量子化行列例を示す。
図54Bは、事前選択した量子化行列である。
図54Cは、MQF=90=>scf=0.2を使用する、スケーリングした量子化行列である。
図54Dは、次の式:
Max{QMinput,round[0.5*(QM1s+Qminput)]}
に基づき得る、平均化+クリッピング段階の出力である。
図54Eは、本明細書に示しかつ記載する単調性増加段階の出力であり、この段階で修正された行列要素が太字で示されている。
図55Aおよび図55Bは、まとめて、先行画像での素ブロックの独立符号化によって生成された第1の画像の独立した素ブロックレベルの再圧縮のためのコンピューター化された方法の簡略化した流れ図を形成し、第1の画像は、それに関連した少なくとも1つの第1の量子化行列を有し、その方法は、例えば、次のように、適切に順序付けられた図中のステップの一部または全てを含む。図55Aでは、次のとおりである:
ステップ6810:第1の画像について、プロセッサーを使用して、少なくとも1回の独立した素ブロックレベルの圧縮操作を実行し、それにより、新しい量子化行列の生成を含めて、再圧縮された第2の画像を生成する。
ステップ6820:行列内の少なくとも1つの、また、通常は全ての(行、列)位置に対して図55Bの方法を実行することを含めて、独立した素ブロックレベルの圧縮に対して新しい量子化行列を使用する。
図55Bでは:
ステップ6830:新しい量子化行列を利用する量子化プロセスによって引き起こされる丸め誤差を計算する。
ステップ6840:丸め誤差が、例えば、−0.1などであるがこれに限定されない、許容可能な丸め値の閾値より大きな負値である丸め誤差など、非受容性基準(unacceptability criterion)を満足する場合、新しい量子化行列を利用する量子化プロセスによって引き起こされる丸め誤差を削減するために、少なくとも1つの新しい量子化行列の値を調整する。
特定の実施形態によれば、量子化行列は、高い丸め誤差を引き起こす恐れがある状況においてのみ修正される。
本明細書に示しかつ記載する単調性改善方法は、画像の復号および再符号化を含め、とりわけ、1つまたは複数のJPEG画像を処理および圧縮する任意のシステムでの実施に適している。通常、かかるシステムは、JPEG画像を入力し、それを復号し、随意に、その復号した画像を画像処理し、その後、出力JPEG画像を取得するために符号化する。かかる画像処理システムの例には、PhotoShop、Windows Image and Fax Viewer、とりわけ写真回転機能がある。本明細書に示しかつ記載する単調性改善方法は、かかるシステムのJPEGエンコーダーで実施され得る。JPEGデコーダーおよびエンコーダーでの復号および符号化は、ピクセルレベルへの完全復号よりも、例えば、DCTレベルへの、それぞれ部分的のみの復号および符号化であり得る。
本明細書に示しかつ記載する再圧縮方法に対して、入力画像を提供、生成、送信および/または圧縮するために、任意の適切な入力装置が使用され得る。本明細書に示しかつ記載する再圧縮方法で生成された画像を表示するために、任意の適切な出力装置またはコンピューターディスプレイが使用され得る。入力画像を、本明細書に示しかつ記載する再圧縮システムに送信するため、またはそこからの出力画像を、例えば、一方では、出力画像の受信側と入力画像の供給側との間のクライアントサーバータイプの関係を、他方では、本明細書に示しかつ記載する再圧縮システムを使用する、補助コンピューターシステムへ送信するため、コンピューターネットワークが採用され得る。本明細書に示しかつ記載する計算機能のいずれかまたは全てを提供するために、任意の適切なコンピュータープロセッサーが採用され得、これら機能のいずれか、またはこれら機能の任意の組み合わせまたはこれら機能の任意の適切な部分は、かかるプロセッサーでのモジュールを含む。本明細書に示しかつ記載する再圧縮システムへの入力画像、またはそれによって生成された出力画像を格納するために、例えば、コンピューターメモリなど、コンピューターデータストレージの任意の適切な形式が採用され得る。
本明細書に示しかつ記載する方法およびシステムは、JPEGと同一ではないが、JPEGと共通な関連する機能を有するフォーマットに適用可能であり得る。
本明細書で使用される「圧縮の程度(degree of compression)」および「圧縮レベル(compression level)」という用語は、概ね同義語であり、両方とも(再)圧縮により画像にもたらされたサイズ縮小の程度を指し、これは、通常、q行列内の値の大きさによって制御され、それは、通常、ユーザー選択のMQFまたはQF値によって決定される。
図45〜図55bに関連して前述の、圧縮した画像品質の単調性の圧縮の程度に応じた提供を含む、画像圧縮のためのシステムおよび方法は、本発明の他の技術と併用して有用である。例えば、図56aは、例えば、図45〜図55bに関連して前述した任意の方法および装置を使用して、単調性を高める働きをする単調性増加器(monotony increaser)7065が提供されていることを除いて、図32aに類似している本発明の特定の実施形態により構築され稼働する再圧縮システムの簡略化した機能ブロック図である。図56bは、例えば、図45〜図55bに関連して前述した任意の方法および装置を使用して、単調性を高める同様の働きをする単調性増加器7650が提供されていることを除いて、図32bに類似している本発明の特定の実施形態により構築され稼働する再圧縮システムの簡略化した機能ブロック図である。図56cは、例えば、図45〜図55bに関連して前述した任意の方法および装置を使用して、単調性を高める働きをする単調性増加ステップ7925が提供されていることを除いて、図32bに類似している本発明の特定の実施形態により、量子化行列生成プロセスを実行するための方法の簡略化した流れ図である。
ここで、図57〜図64Bを参照して、画像の圧縮レベルを分類するためのシステムおよび方法について記載する。図57〜図64Bに関連して後述するシステムおよび方法は、単独でおよび、例えば、図65a〜図65cに関連して後述するような、本発明の他の技術との併用の両方で有用である。
後述の特許請求された主題の説明および各請求項では、「知覚的品質尺度」という用語および置き換え可能な「知覚的類似性尺度」という用語または同様の用語が参照されている。本明細書では、「知覚的品質尺度」または「知覚的類似性尺度」という用語は、参照画像と比較して、画像の主観的な知覚的品質または類似性を示す数値を提供する尺度に関連する。例として、知覚的類似性尺度/知覚的品質尺度は、参照画像と比較して評価される画像に対するDMOS(differential−mean−opinion−score)と大いに関係していると予測され得る。知覚的品質尺度の例には、PSNR(ピーク信号対雑音比)、SSIM(構造的類似性指標基準)、VIF(視覚情報忠実度)、MSU(モスクワ大学)ブロックノイズ、MSU(モスクワ大学)ぼかし、PQS(画質評価尺度)、VQM(ビデオ品質メトリック)およびPEVQ(視覚的品質の知覚評価)を含むが、これらに限定されない。さらに別の知覚的品質尺度のさらに別の例も本明細書に記載されている。
特許請求された主題の説明および各請求項の全体に渡り、「高度に圧縮された入力画像」という用語または手短に「高度に圧縮された画像」という用語または同様の用語が参照されている。「高度に圧縮された入力画像」という用語(および「高度に圧縮された画像」という用語も)は、記述および請求項で、推定される可能性のある追加の圧縮(本明細書では「再圧縮」とも呼ぶ)および、かかる追加の圧縮の結果としての推定される知覚的品質の損失の観点から入力画像の圧縮を特性化するために使用される。記述および請求項で、入力画像の圧縮は、所与の(既に)圧縮された入力画像に対して、任意のさらなる大幅な圧縮が、知覚的品質閾値を超えて、画像の知覚的品質を低下させるであろう場合に、「高い」と見なされるか、または分類される。これに関して、特許請求された主題に従って「高度に圧縮」されていると見なされる圧縮された入力画像は、知覚的類似性(または品質)制約を所与として、所与の知覚的品質制約を超えることなく、限られた程度の追加の圧縮(決して大幅ではない)だけが可能であると評価される、圧縮画像である。
これに関して、「高度に圧縮された入力画像」という用語での「高度な」という形容詞の使用は、入力画像の圧縮レベルを制限することも、それを特徴づけることも意図していないことを理解されたい。入力の圧縮画像の圧縮レベル、またはもっと正確には、追加の圧縮の可能性は、知覚的品質/類似性基準およびさらに別の圧縮基準によって特徴付けられ、これらの基準は、要望どおりに、または基礎となる用途に対して適切に設定され得る。例えば、特許請求された主題は、知覚的可逆または知覚的非可逆な再圧縮プロセスの一部としてまたはそれに関連して使用され得、また、知覚的品質制約を超えることなく、大幅な追加の圧縮が達成され得ることが、特許請求された主題に従って、プロセスにより判断される場合に限り、所与の圧縮された入力画像の再圧縮が可能になるように、これらのプロセスのどちらも制御し得る。知覚的類似性制約は、再圧縮プロセスが知覚的可逆であるべきことを必要とするか、または知覚的非可逆な圧縮を許可し、例えば、知覚的類似性が特定の知覚的類似性閾値を上回って維持されるように、再圧縮プロセスを制御するために使用され得る。
説明および特許請求の範囲の全体に渡り、圧縮された入力画像の圧縮レベルの評価が、特定の知覚的品質尺度およびその特定の知覚的品質尺度に対する特定の構成を使用して、実行される。異なる知覚的類似性尺度は、入力の圧縮画像に比較して、再圧縮された画像の知覚的品質損失(またはその欠如)の観点を含め、所与の画像の評価に使用される際に、異なる結果をもたらし得ることを理解されたい。したがって、説明および特許請求の範囲の全体に渡り、前述のとおり追加の圧縮の可能性対かかる追加の圧縮の結果としての知覚的品質の損失の観点から評価される、高度に圧縮された入力画像に対するいかなる参照も、特定の圧縮技術(またはアルゴリズム)および特定の構成の使用に関連する。
特許請求された主題の説明および各請求項の全体に渡り、「大幅な圧縮(significant compression)」および「大幅な追加の圧縮(significant further compression)」という用語または「大幅な圧縮の可能性(significant compression potential)」および「大幅な追加の圧縮の可能性(significant further−compression potential)」もしくは同様の用語は、区別しないで参照されている。これらの用語は、説明および特許請求の範囲において、最小限の追加の圧縮(の可能性)を特徴づけるために使用される。最小限の追加の圧縮の可能性は、知覚的品質/類似性基準と一緒に、基準として使用され得る。最小限の追加の圧縮の可能性基準は、知覚的品質/類似性基準と一緒に、所与の圧縮された入力画像が、知覚的品質/類似性基準を超えることなく、少なくとも、最小限の追加の圧縮の可能性基準によって定義される程度に、さらに圧縮され得るか否かを判断するために使用される。
特許請求された主題の説明および各請求項の全体に渡り、「圧縮された入力画像ファイル」という用語または同様の用語が参照されている。この用語は、説明および特許請求の範囲では、圧縮画像をレンダリングするためにコンピューターによって必要とされる任意の情報を格納および整理するために使用されるコンピューター資源に関連する。例として、圧縮された入力画像ファイルは、画像データおよびメタデータを含み得、メタデータは圧縮データを含み、圧縮データは、次いで、その画像に適用された圧縮に関連する詳細およびデータを含む。圧縮データは、画像の復号に必要であり得る。特定の圧縮画像に対して、圧縮データは、画像の最後の圧縮に対して使用され、画像の再構築に必要な、量子化行列および/またはスケーリング係数(例えば、スケーリングされた標準の量子化行列が使用された場合)を含み得る。
特許請求された主題の一態様により、画像の圧縮レベルを分類するシステムおよび方法が提供される。一例によれば、画像の圧縮レベルを分類する方法は、圧縮された入力画像から取り出されたDCT係数へ逆量子化を適用して、逆量子化DCT係数を生じること、事前定義した閾値をその逆量子化DCT係数に適用すること、事前定義した閾値が知覚的類似性尺度に関連すること、および事前定義した閾値と、逆量子化DCT係数のうちの少なくとも1つの間の関係に従って、圧縮画像に対して圧縮レベル分類を判断することを含み得る。便宜上、圧縮された入力画像を分類するこのプロセス、および本明細書で開示されているその変形例は、「分類プロセス(classification process)」と呼ばれることもある。
ここで、図57を参照すると、これは、特許請求された主題の一例により、画像の圧縮レベルを分類するシステムのブロック図である。一例によれば、画像の圧縮レベルを分類するシステム8100は、構成モジュール8010、DCT係数抽出器8020およびDCT領域圧縮分類器8030を含み得る。随意に、DCT領域圧縮分類器8030は、逆量子化器8025を含むか、またはそれに関連し得る。
ここで、図58を参照すると、これは、特許請求された主題の一例により、画像の圧縮レベルを分類する方法の流れ図である。ブロック8210で、圧縮された入力画像8102が取得される。例えば、圧縮された入力画像8102はJPEG画像である。さらに、分類閾値が取得され得る(ブロック8220)。例として、分類閾値は、最小絶対非ゼロDCT係数を含み得る。さらに後述するように、圧縮された入力画像からどのデータが検査されるべきかに関する構成など、分類プロセスに対して恐らくは追加可能な構成が取得され得る。
特許請求された主題の一例によれば、分類閾値は知覚的類似性尺度に関連する。例えば、分類閾値は、例えば、後述するように、知覚的類似性尺度を用いて判断される。さらに別の例として、知覚的類似性尺度は、許容可能な(許容できない)最小絶対非ゼロDCT係数を判断するために利用され得る。かかる閾値は、例えば、後述するように、入力の圧縮画像の逆量子化後に適用され得る。
例として、分類閾値は、構成モジュール8010内に記録され得、構成モジュール8010は、分類プロセスの初期化中に、適切な分類閾値を使用して、DCT領域圧縮分類器8030を初期化し得る。一例として、分類プロセスで使用するために、知覚的類似性尺度を使用して選択される閾値が、最小絶対非ゼロDCT係数に関連する場合、DCT領域圧縮分類器8030は、最小絶対非ゼロDCT係数に関連する特定値で構成され得る。この値は、圧縮された入力画像を、後述するように、「高度に圧縮されている」か否かとして分類するための閾値として使用され得る。
さらに例として、分類閾値は固定され得る、すなわち、分類閾値は、構成モジュール8010内に(または、DCT領域圧縮分類器8030内に)ハードコードされ得るか、または別の例では、分類閾値は動的であり得、また、DCT領域圧縮分類器8030は、随時、異なる値で再構成され得る。さらにまた別の例では、分類閾値を構成する値は、例えば、画像空間解像度、隣接ブロック間のDCT係数の変動性、例えばDCT係数ヒストグラムに見られるような画像の周波数成分など、圧縮された入力画像の特定の特性または特定の成分によって決まり得る。
例えば、閾値は、圧縮された入力画像の空間解像度に敏感に反応し得、また、それに従って適合され得る。さらに別の例として、低空間解像度をもつ画像に対して、より低い最小絶対非ゼロDCT値がかかる画像で識別される場合に、より高い空間解像度をもつ画像を高度に圧縮されているとして分類するために使用される最小絶対非ゼロDCT値と比較して、それらの画像が高度に圧縮されているとして分類されるように、閾値が適合され得る。別の例では、閾値は、非DC DCT係数の低エネルギーおよび/または分散に敏感に反応し得、また、それに従って適合され得る。さらに別の例として、非DC DCT係数の低エネルギーおよび/または分散によって特徴付けられる画像に対して、より低い最小絶対非ゼロDCT値がかかる画像で識別される場合に、非DC DCT係数のより高いエネルギーおよび/または分散によって特徴付けられる画像を高度に圧縮されているとして分類するために使用される最小絶対非ゼロDCT値と比較して、それらの画像が高度に圧縮されているとして分類されるように、閾値が適合され得る。
特許請求された主題の一例では、複数の閾値が、分類プロセスの一部として実施され得る。さらに別の例として、複数の閾値の各々は、知覚的類似性尺度に関連し得、また、圧縮された入力画像の異なる特性値または要素に関連し得る。例えば、また、後述のように、圧縮された入力画像の輝度およびクロマ成分の各々に対して閾値が提供され得、分類プロセスの一部として複数の閾値が使用され得る。
さらに別の例では、知覚的類似性尺度に関連する分類閾値に加えて、知覚的類似性尺度に関連していない、少なくとも1つの別の閾値が、分類プロセスの一部として使用され得る。例えば、知覚尺度によって課される制約に加えて、特定の閾値(一般に、知覚尺度制約によって取り込まれる閾値より高い)も、分類に使用され得る。例えば、任意の再圧縮プロセスに対して、使用する知覚的類似性基準にかかわらず、最低非ゼロDCT係数が所与の実質的に高い閾値を上回る場合、画像は必ず「高度に圧縮されて」いる。極端な例として、非ゼロ非DC DCT係数がない場合、画像は「高度に圧縮されている」として分類され得、この場合、閾値は本質的に無限大である。
分類プロセスの構成およびその閾値として利用され得る閾値の詳細について説明してきたが、ここで図57および図58に戻ると、ブロック8230で、DCT係数抽出器8020は、DCT係数を入力画像8102から抽出するために、それ自体が周知の方法で利用され得る。逆量子化器8025は、逆量子化を抽出DCT係数(ブロック8240)に、同じくそれ自体が周知の方法で、適用し得る。
一部の例では、高圧縮率は圧縮された入力画像の量子化行列を分析することにより識別され得る。特許請求された主題は、随意に、入力の圧縮画像ファイルの一部であるか、またはそうでなければそれに関連する量子化行列を調べることにより、高度に圧縮された入力画像を識別するための周知の方法を使用し得る。しかし、かかる分析は、前述のとおり、分類方法の任意選択の追加機能に過ぎず、また、特許請求された主題は、後述するように、少なくとも量子化DCT係数の分析を含み、後者の分析は逆量子化DCT係数について実行されるため、入力の圧縮画像ファイルの一部であるかそれに関連する量子化行列の影響を受けない。
逆量子化(ブロック8240)の後、最小絶対非ゼロ逆量子化DCT係数は、例えば、DCT領域圧縮分類器8030によって、識別され得る(ブロック8250)。次に、DCT領域圧縮分類器8030は、例えば、分類閾値を最小絶対非ゼロ逆量子化DCT係数に適用することにより(ブロック8260)、入力画像の圧縮を分類し得る。例として、閾値は、推定される潜在的な追加の圧縮および、かかる追加の圧縮の結果としての推定される知覚的品質の損失の観点から、入力画像(例えば、JPEG入力画像8102)の圧縮を特徴づけることを目的としている。さらに具体的に言うと、また、さらに別の例として、閾値は、圧縮された入力画像の圧縮が、特定の程度を超えて知覚的品質を劣化させることなく、その値を下回って(または上回って)いかなる大幅な追加の圧縮(再圧縮)もできそうにないと推定される、DCT係数値を規定し得る。さらに例として、閾値は、知覚的な観点から、知覚的類似性尺度で評価されるとおり、圧縮された入力画像の追加の圧縮が、圧縮された入力画像と再圧縮画像との間における知覚上の同一性を維持すると推定される程度に制限されるように構成され得る。分類閾値の用途に関するさらなる詳細について、後述する。
最後に、入力画像の圧縮の分類8104がその後、出力として提供され得る(ブロック8270)。
逆量子化DCT係数の分析を含む圧縮分類ルーチンを実行することにより、特許請求された主題による方法は、圧縮された入力画像または圧縮された入力画像の以前のバージョンに適用されていて、また、入力画像ファイルでの量子化行列によって反映されていない、圧縮および/または再圧縮ステップを識別し得る。例えば、特許請求された主題による方法は、入力画像のDCT係数への量子化行列の適用にかかわらず、入力画像でのDCT係数を修正した、圧縮および/または再圧縮ステップを識別し得る。
ここで、図59A〜図59Dを参照すると、これらは、まとめて、特許請求された主題の一例により、初期の粗い量子化行列が使用された後に細かい量子化行列を用いた再圧縮が行われる、16×16画素領域の再圧縮プロセスを示す。図59Aには、元のRAW画像の16×16画素領域へのズームを表す16×16行列の図が示されている。16×16画素行列8310内の値は、実際の輝度面のピクセル強度値を表す。
図59Aに16×16画素領域8310が示されているRAW画像は、圧縮を受け得る。例えば、圧縮の一部として、DCT変換が、RAW画像のピクセル値に適用され得、結果として生じるDCT係数が丸められ得る。図59Bは、図59Aに示すピクセル値の16×16行列について計算された、(丸められた)DCT係数8320の16×16行列の図である。一例として、図59Bに示すDCT係数8320の16×16行列は、それ自体が周知の方法で、JPEG規格で定義されたDCT変換に従って計算されている。図59Bに見られるように、DCT係数8320の16×16行列は、丸められた輝度面のDCT係数である。
図59Cには、粗い量子化を図59BのDCT係数の16×16行列に適用することにより計算された、量子化DCT係数の16×16行列が示されている。一例として、図59Cに示す量子化DCT係数8330の16×16行列は、それ自体が周知の方法で、JPEG規格に従い、また、規格で提供されているデフォルトの量子化行列およびスケーリング係数を使用して計算された。本質的に、量子化DCT係数8330の16×16行列は、入力の16×16ピクセル値行列8310に適用された第1圧縮プロセスの結果を表す。
図59Cに見られるように、量子化DCT係数8330の16×16行列は、粗い量子化行列で量子化した後の、図59Bに示されるDCT係数8320の16×16行列からの輝度面のDCT係数を含む。
DCT係数320の16×16行列(図59B)および量子化DCT係数8330の対応する16×16行列内の量子化値を見ると、圧縮画像がここでその圧縮レベルを判断するために分析された場合、それ自体が周知の方法で、入力の圧縮画像ファイルの一部であるか、またはそうでなければそれに関連する、(粗い)量子化行列を見ることにより、画像が高度に圧縮されていると判断することは可能であったかも知れない。
ここで図59Dを参照すると、これは、とりわけ、以前に第1圧縮プロセスで圧縮された圧縮画像に第2圧縮プロセスを適用することにより作成された、圧縮画像の逆量子化DCT係数の16×16行列の図である。前述とおり、16×16ピクセル値行列8310についてのDCT変換、および量子化DCT係数8330の16×16行列を生じたDCT係数8320の16×16行列の量子化は、粗い量子化行列が使用された第1圧縮プロセスの一部であった。図59Dの逆量子化DCT係数8340の行列は、第1圧縮プロセスの結果である圧縮画像に対して適用された第2圧縮プロセス(再圧縮)の結果である。
例として、第2圧縮プロセスの一部として、第1圧縮プロセス(粗い量子化行列が使用された)の結果である圧縮画像が、(粗い量子化行列を使用した)逆量子化、逆DCT変換、第2のDCT変換(第1圧縮プロセス中に適用されたDCTが第1のDCT変換である)、および第2の量子化プロセス(第1圧縮プロセス中の量子化が第1の量子化プロセスである)を受け、今度は、第2の量子化が、細かい量子化行列(例えば、全て「1」から構成される量子化行列)を使用して実行された。かかる状況では、第1圧縮プロセスの一部として元のRAW画像に適用された大幅な圧縮が、第2圧縮プロセス(再圧縮)の後、圧縮画像ファイルからは明らかでなく、また、細かい量子化行列が第2圧縮プロセスの一部として使用された場合、圧縮画像ファイルは、細かい量子化を含み、それ故、入力の圧縮画像8102に適用された圧縮のレベルを分類するための量子化行列を見るだけでは誤解を招き得ることを当業者には理解されたい。特許請求された主題は、少なくとも逆量子化DCT係数の分析を含み、また、この分析は逆量子化DCT係数について実行されるため、入力の圧縮画像ファイルの一部であるかまたはそれに関連する量子化行列の影響を受けない。
例として、圧縮(第1圧縮プロセス)およびそれに続く再圧縮(第2圧縮プロセス)を受けた、圧縮された入力画像8102が、例として、図59Aおよび図59Bに関連して前述したとおり、特許請求された主題による分類システム8100によって受け取られる場合、その分類は、少なくとも、入力画像8102の逆量子化DCT係数に基づく分析を含み、そして、逆量子化DCT係数に基づくため、この分析は、入力の圧縮画像ファイルの一部であるか、またはそれに関連する量子化行列の影響を受けず、これは、元の画像に適用された実際の圧縮を偽って伝え得る。
ここで、図60A〜図60Dに移ると、これらは、まとめて、特許請求された主題の一例により、ビットレートを削減するために低エネルギーDCT係数がゼロに設定され、修正されたDCT値行列が細かい量子化行列(例えば、全て1の行列)を用いて量子化される、16×16画素領域の圧縮プロセスを示す。図60Aには、元のRAW画像の16×16画素領域へのズームを表す16×16行列の図が示されている。16×16画素行列8410内の値は、実際の輝度面のピクセル強度値を表す。
図60Aに16×16画素領域が示されているRAW画像は、圧縮を受け得る。例えば、圧縮の一部として、DCT変換が、RAW画像のピクセル値に適用され得、結果として生じるDCT係数が丸められ得る。図60Bは、図60Aに示すピクセル値の16×16行列について計算された、(丸められた)DCT係数の16×16行列の図である。一例として、図60Bに示すDCT係数8420の16×16行列は、それ自体が周知の方法で、JPEG規格に従って計算されている。図60Bに見られるように、DCT係数8420の16×16行列は、低エネルギー領域での±1など、低い絶対値をもつ、いくつかの非ゼロDCT係数を含む。
図60A〜図60Dに示す圧縮プロセスの一部として、DCT係数はゼロに設定され得る。ここで、図60Cを参照すると、これは、図60Bに示すDCT係数の元の16×16行列からのいくつかの低エネルギーDCT係数がゼロに設定された後、DCT係数の修正された16×16行列の図である。一例として、図60Cに示すDCT係数の修正された16×16行列430では、全ての低エネルギーDCT係数が、4以下の絶対値をもつこの係数例で、ゼロに設定されている。低エネルギーDCT係数をゼロに設定することにより、標準のJPEGデコーダーとの互換性を維持しながら、画像(またはこの場合はその16×16画素領域)のファイルサイズまたはビットレートが削減され得ることを理解されたい。
一例として、DCT係数のゼロ化は、RAW入力画像の圧縮(符号化)プロセスの一部として実施され得、低エネルギーDCT係数に適用され得る。DCT係数のゼロ化は、例えば、JPEG圧縮ステップなど、標準の圧縮ステップと併用して、標準のJPEG画像など、標準の圧縮画像を生じ得ることを理解されたい。
DCT係数のゼロ化は、手動のルーチンとして実施され得て、オペレーターがどのDCT係数をゼロにすべきかを選択し得るが、別の例では、自動ルーチンが、JPEG圧縮プロセスなどの圧縮プロセスの一部として、DCT係数をゼロに設定するために実施され得る。DCT係数のゼロ化の詳細は、これに関して実装され得る任意の論理および/またはアルゴリズムを含め、特許請求された主題の範囲外であり、任意の現在周知の、または将来考案される、方法、技術もしくはルーチンを用いて実施され得る。
DCT係数のゼロ化が行われた後、元のRAW画像の各部分が実質的に圧縮されると、量子化プロセスが、例えば、JPEG規格に従って実施され得る。例として、細かい量子化行列(例えば、全て1)が、DCT係数の修正された16×16行列に適用され得る。細かい量子化行列が使用される場合でさえ、DCT係数のゼロ化に起因して大幅な圧縮がまだ生じ得ることを理解されたい。
ここで、図60Dを参照すると、これは、圧縮画像の逆量子化DCT係数の16×16行列の図であり、その圧縮画像は、とりわけ、図60Cに示す修正した16×16のDCT係数行列(DCT係数のゼロ化後)に細かい量子化行列(例えば、全て1)を適用することにより作成されたものである。前述のとおり、特許請求された主題による分類システム8100に対する入力の圧縮画像8102として提供され得る、圧縮画像は、元の画像(例えば、非圧縮画像)に適用された圧縮プロセスによって生成されているかも知れず、その圧縮プロセスは、とりわけ、元の画像のピクセル値(16×16ピクセル値行列8410によって上記で示した)に対するDCT変換の実行、DCT係数の行列に対するDCT係数ゼロ化の適用、修正したDCT係数の行列(修正したDCT係数の16×16行列8430によって上記で示した)の生成、および修正したDCT係数の行列に対する細かい量子化行列の適用を含んでいた。かかる状況では、DCT係数のゼロ化を通して(量子化によってではなく)元のRAW画像に適用された大幅な圧縮が、圧縮画像ファイルからは明らかでなく、また、細かい量子化行列が圧縮プロセスで使用された場合、圧縮画像ファイルは、細かい量子化行列を含み、それ故、入力の圧縮画像8102に適用された圧縮のレベルを分類するための量子化行列を見るだけでは誤解を招き得ることを当業者には理解されたい。特許請求された主題は、少なくとも逆量子化DCT係数の分析を含み、また、この分析は逆量子化DCT係数について実行されるため、入力の圧縮画像ファイルの一部であるかまたはそれに関連する量子化行列の影響を受けない。
例として、圧縮中にDCTゼロ化プロセスを受けた、圧縮された入力画像8102が、例として、図59Aおよび図59Bに関連して前述したとおり、特許請求された主題による分類システム8100によって受信される場合、その分類は、少なくとも、入力画像8102の逆量子化DCT係数に基づく分析を含み、そして、逆量子化DCT係数に基づくため、この分析は、入力の圧縮画像ファイルの一部であるか、またはそれに関連する量子化行列の影響を受けず、これは、元の画像に適用された実際の圧縮を偽って伝え得る。
既に前述のとおり、例として、分類閾値を構成する値は、圧縮された入力画像の特定の特性または特定の成分によって決まり得、例えば、その閾値は、その画像の輝度および/またはクロマ面に関連し得、また、その画像は、輝度および/またはクロマ面内のその逆量子化DCT係数を、輝度および/またはクロマ面内のDCT係数と特に関連する各閾値に対して比較することにより分類され得る。
さらに別の例として、また、前述のとおり、複数の閾値が分類プロセスの一部として実施され得る。さらにまた別の例として、複数の閾値の各々が、圧縮された入力画像の異なる特性または成分に関連し得る。例えば、閾値は、圧縮された入力画像の、輝度およびクロマ成分の各々に対して提供され得、複数の閾値が分類プロセスの一部として使用され得る。
ここで、画像の圧縮を分類する方法の一例を説明するが、その方法は、圧縮された入力画像の輝度およびクロマ面の各々における逆量子化DCT係数に対する閾値の実施を含む。ここで、図61を参照すると、これは、特許請求された主題の一例により、圧縮された入力画像の輝度およびクロマ面の各々における非量子化DCT係数に対する閾値の適用を含め、画像の圧縮レベルを分類する方法の流れ図である。図61に示すプロセスは、圧縮された入力画像(例えば、JPEG画像)の取得(ブロック8210)、および分類閾値の取得(ブロック8220)から始まる。これらのブロックは、図58に関して前述した各ブロックと同様であるが、ブロック8220で、圧縮された入力画像の輝度およびクロマ面の各々に対してそれぞれ1つの、複数の閾値が取得される、という違いがある。
次に、量子化DCT係数が、圧縮された入力画像(ブロック8230)から抽出され、その圧縮された入力画像の逆量子化DCT係数を取得するために逆量子化が適用され得る(ブロック8240)。これらのブロックも、図58に関して前述した各ブロックと同様であるが、DCT抽出が、圧縮された入力画像の輝度およびクロマ面の各々でのDCT係数の抽出に使用され、逆量子化が、輝度およびクロマ面の各々での量子化DCT係数に適用され、それにより、輝度およびクロマ面の各々での逆量子化DCT係数を生じる、という違いがある。
輝度およびクロマ面の各々で逆量子化DCT係数が取得されると、Y(輝度)面での最低非ゼロDCT係数が識別される(ブロック8505)。次に、Y面での最小絶対非ゼロDCT係数が第1の閾値(Y面での逆量子化DCT値に対応する第1の閾値)を上回っているか否かが判断される(ブロック8510)。例として、第1の閾値は、推定される可能性のある追加の圧縮および、かかる追加の圧縮の結果としての推定される知覚的品質の損失の観点から、入力画像(例えば、JPEG入力画像8102)の圧縮を特徴づけることを目的としている。さらに具体的に言うと、また、さらに別の例として、第1の閾値は、圧縮された入力画像の圧縮が、特定の程度を超えて知覚的品質を劣化させることなく、その値を上回って、いかなる大幅な追加の圧縮(再圧縮)もできそうにないと推定される、Y面でのDCT値を規定し得る。さらに例として、第1の閾値は、知覚的な観点から、知覚的類似性尺度で評価されるとおり、圧縮された入力画像の追加の圧縮が、圧縮された入力画像と再圧縮画像との間における知覚上の同一性を維持する程度に制限されるように構成され得る。
例として、ブロック8510で、Y面での最小絶対非ゼロDCT係数が第1の閾値を上回っていると判断されると、圧縮された入力画像の圧縮が「高い」と分類され(8535)、この分類が出力として提供され得る(ブロック8260)。Y面の逆量子化DCT係数は、Y面での最小絶対非ゼロDCT係数に基づいて圧縮が「高い」と分類される場合を示すが、図62Aで示されている。例えば入力の圧縮画像を分類するための閾値によれば、Y面の逆量子化DCT係数行列が、5未満のY面での絶対非ゼロ係数を含まない任意の圧縮画像は、図62Aに示すY面の逆量子化DCT係数行列に関連する圧縮された入力画像に比べて、この行列が絶対非ゼロ値が5未満の値を持たないため、高度に圧縮されていると分類されるとすることを表している。
例として、ブロック8510で、Y面での最小絶対非ゼロDCT係数が第1の閾値を上回っていないと判断されると、プロセスは、Y面での最小絶対非ゼロDCT係数が第2の閾値を上回っているか否かを判断するために進み、その第2の閾値は、第1の閾値より低い(ブロック8545)。例として、第2の閾値も、推定される潜在的な追加の圧縮および、かかる追加の圧縮の結果としての推定される知覚的品質の損失の観点から、入力画像(例えば、JPEG入力画像8102)の圧縮を特徴付けることを目的としているが、第2の閾値の場合は、圧縮された入力画像の圧縮が、特定の程度を超えて知覚的品質を劣化させることなく、その値を下回って、大幅な追加の圧縮(再圧縮)が可能であると推定される、Y面でのDCT値を規定し得る。
したがって、例として、ブロック8545で、Y面での最小絶対非ゼロDCT係数が第2の閾値を上回っていないと判断されると、圧縮された入力画像の圧縮が「低い」と分類され(8555)、この分類が出力として提供され得る(ブロック8260)。Y面の逆量子化DCT係数は、Y面での最小絶対非ゼロDCT係数に基づいて圧縮が「低い」と分類される場合を示すが、図62Bで示されている。例えば、入力の圧縮画像を分類するための閾値によれば、Y面の逆量子化DCT係数行列が、2未満(または1に等しい)のY面での絶対非ゼロ係数を含む任意の圧縮画像は、図62Bに示すY面の逆量子化DCT係数行列に関連する圧縮された入力画像に比べて、この行列が絶対非ゼロ値が1の値を持つため、高度に圧縮されていないと分類されるとすることを表している。
例として、しかし、ブロック8510で、Y面での最小絶対非ゼロDCT係数が第1の閾値を上回っていないと判断され、かつ、今度はブロック8545で、Y面での最小絶対非ゼロDCT係数が第2の閾値を上回っていると判断される場合、圧縮された入力画像のY面での逆量子化DCT係数は、任意の大幅な追加の圧縮(再圧縮)が特定の程度を超えて知覚的品質を劣化させるか否かの可能性を判断する能力の観点から、曖昧であると見なされる。
例として、少なくともある程度まで、この曖昧性を解決するため、分類プロセスはブロック8565に進み得、そこで、UおよびV(クロマ)の両方の面での最小絶対非ゼロDCT係数が識別され、その後、ブロック8575に進み、そこで、UおよびV(クロマ)の両方の面での最小絶対非ゼロDCT係数の両方がそれぞれの閾値を上回っているか否かが判断される。例として、U面での最小絶対非ゼロDCT係数に関連して、第3の閾値が提供され、また、V面での最小絶対非ゼロDCT係数に関連して、第4の閾値が提供される。さらに別の例として、第3および第4の閾値は、ある点で第1の閾値に類似しており、第3および第4の閾値の各々は、推定される潜在的な追加の圧縮および、かかる追加の圧縮の結果としての推定される知覚的品質の損失の観点から、入力画像(例えば、JPEG入力画像8102)の圧縮を特性化することを目的としている。さらに具体的に言うと、また、さらに別の例として、第3および第4の閾値の各々は、UおよびV面の各々に対して、それぞれのDCT値を規定し得、UおよびVの両方の面での最小絶対非ゼロDCT値がそれぞれの閾値を上回っている場合、圧縮された入力画像の圧縮が、特定の程度を超えて知覚的品質を劣化させることなく、いかなる大幅な追加の圧縮(再圧縮)もできそうにないと推定される。さらに例として、第3および第4の閾値は、知覚的な観点から、知覚的類似性尺度で評価されるとおり、圧縮された入力画像の追加の圧縮が、圧縮された入力画像とその再圧縮画像との間における知覚上の同一性を維持する程度に制限されるように構成され得る。さらに別の例として、クロマ成分UおよびVの両方に対して単一の閾値が提供され得、逆量子化UおよびV係数がそれぞれ単一の統一された判断(例えば、UおよびV(クロマ)面での最小の非ゼロDCT係数が第3の閾値を上回っているか(または上回っていないか))をもたらすか確認される。
ブロック8575で、UおよびV(クロマ)の両方の面での最小非ゼロDCT係数の少なくとも1つがそれぞれの閾値を下回っている場合、圧縮された入力画像の圧縮が「低い」と分類され(ブロック8585)、この分類が出力として提供され得る(ブロック8260)。入力画像のY、UおよびV面の各々に対する逆量子化DCT係数行列は、Y面に対する逆量子化DCT係数行列が曖昧な状況を示し、入力画像の圧縮がUおよびV面に対する逆量子化DCT係数行列に従って低いと分類されるが、図62Cで示されている。例えば、Y面行列8606での最小絶対非ゼロDCT係数が2で、その結果(前述した第1および第2の閾値により)ブロック8515で「いいえ」が返され、また、ブロック8545で「はい」が返されて(そして、それ故、Y面での逆量子化DCT係数行列が曖昧)、プロセスは、クロマ面での逆量子化DCT行列に基づいて分類へ進み得ることを表している。例えば、かかる場合、UまたはV面の逆量子化DCT係数行列の少なくとも1つが3以下の値を含む、任意の圧縮画像(または、Y面での逆量子化DCT係数行列が曖昧な任意の画像)が、それぞれUおよびV面8616および8626に対する逆量子化DCT係数行列に関連する圧縮された入力画像に比べて、UおよびV面8616および8626(この場合は両方)に対する逆量子化DCT係数行列が、絶対非ゼロ値が3の値を含むため、「低圧縮」画像と分類されるとすることを表している。
しかし、ブロック8575で、UおよびV(クロマ)の両方の面での最小非ゼロDCT係数が第3の閾値を上回っている場合、圧縮された入力画像の圧縮が「高い」と分類され(ブロック8595)、この分類が出力として提供され得る(ブロック8260)。この事例は図62Dで示され、そこでは、Y面に対する逆量子化DCT係数行列が曖昧で、入力画像の圧縮が、UおよびV面に対する逆量子化DCT係数行列に従って高いと分類される。例として、Y面行列8608が8606と同じで、同一の閾値が使用され、それで、ブロック8515で「いいえ」が返され、ブロック8545で「はい」が返されるが、今回は、例えば、UおよびV面8618および8628に対する行列内の最小絶対非ゼロDCT係数がそれぞれ7であり、また、UおよびV面の両方に対する逆量子化DCT係数行列の最小非ゼロ絶対値が3より大きい場合、そしてそれ故、UおよびV行列8618および8628の両方での最小絶対非ゼロDCT係数行列がそれぞれ7であるため、UおよびV面に対する閾値(ここでは、一例として、UおよびV面の両方に対して同一の閾値が使用される)に従い、圧縮された入力画像が、圧縮された入力画像に比べて、高度に圧縮されていると分類されることを表している。
特許請求された主題の例による画像の圧縮レベルを分類するプロセスの様々な可能な実施態様の詳細について説明してきたが、ここで、分類閾値の判断、および分類閾値の判断に知覚的類似性尺度を使用する方法の説明に焦点を合わせる。前述のとおり、推定される潜在的な追加の圧縮(再圧縮)および、かかる追加の圧縮の結果としての推定される知覚的品質の損失の観点から、入力画像の圧縮を特性化するために、知覚的類似性尺度が、特許請求された主題による分類プロセスで使用される。さらに具体的に言うと、また、さらに別の例として、閾値は、圧縮された入力画像の圧縮が、特定の程度を超えて知覚的品質を劣化させることなく、その値を下回って(または上回って)いかなる大幅な追加の圧縮(再圧縮)もできそうにないと推定される、DCT係数値を規定し得る。さらに例として、閾値は、知覚的な観点から、知覚的類似性尺度で評価されるとおり、圧縮された入力画像の追加の圧縮が、圧縮された入力画像と再圧縮画像との間における知覚上の同一性を維持すると推定される程度に制限されるように構成され得る。
例として、所与の(既に)圧縮された入力画像に対して、任意のさらなる大幅な圧縮が、知覚的品質閾値を超えて画像の知覚的品質を低下させると推定される場合、入力画像の追加の圧縮は「高い」と見なされるか、または分類される。これに関して、特許請求された主題に従って「高度に圧縮」されていると見なされる圧縮された入力画像は、知覚的類似性(または品質)制約を所与として、所与の知覚的品質制約を超えることなく、限られた程度の追加の圧縮(決して大幅ではない)だけが可能であると評価される、圧縮画像である。
特許請求された主題の一例の一部として、入力の圧縮画像の分類は、逆量子化DCT係数の1つまたは複数の閾値に対する評価に基づいており、その閾値は、知覚的類似性尺度に基づいて判断される。さらに別の例として、閾値は、圧縮された入力画像と再圧縮画像(入力画像の追加の圧縮によって生成される)との間で維持されるべき最小の知覚的類似性、および画像を圧縮することでかかる程度まで達成され得る、推定される追加の圧縮に関連し得る。したがって、例として、分類閾値判断プロセスは、知覚的品質/類似性基準とともに、最小のさらに別の圧縮基準に関連し得る。閾値は、どの圧縮された入力画像がさらに圧縮されるかを分類するために使用され得、分類は、知覚的品質/類似性基準を超えることなく、所与の圧縮された入力画像が、少なくとも、最小のさらに別の圧縮基準で定義される程度でさらに圧縮され得るかどうかに関して、推定と見なされ得る。
例として、分類閾値は最小非ゼロDCT係数に関連し、前述のとおり、逆量子化DCT係数に適用される。さらに別の例として、分類閾値は、例えば、圧縮された入力画像のY(輝度)、UまたはV(クロマ)面のいずれかなど、圧縮された入力画像の異なる特性または成分に関連し得る。
例として、分類閾値は、知覚的類似性基準に従って最大限まで再圧縮されていて、それらに対して獲得された再圧縮率がさらに別の圧縮基準より低かった、複数の再圧縮画像(既に圧縮されている画像の追加の圧縮の結果である圧縮画像)に関する統計値を経験的に評価することによって判断され得る。それ故、例えば、知覚的類似性基準が、再圧縮画像が圧縮された入力画像と知覚的に同一であることを必要とする場合、追加の圧縮が許可される程度は、再圧縮画像が、再圧縮プロセス前の画像と知覚的に同一であるよう維持されるという要件によって制約されるであろう。
例として、分類閾値が、知覚的類似性の制約下での追加の圧縮率がさらに別の圧縮基準に一致していなかった(例えば、低すぎた)、複数の再圧縮画像のみに関する統計値を経験的に評価することによって判断され得る。さらに別の例として、分類閾値が、知覚的類似性の制約下での追加の圧縮率がさらに別の圧縮基準を満足していた(例えば、十分に高かった)、複数の再圧縮画像のみに関する統計値を経験的に評価することによって判断され得る。さらにまた別の例として、分類閾値が、前述の両方の画像グループに関する統計値を経験的に評価することにより、また、場合により、例えば、複数の閾値が使用される場合における様々な「中間」画像など、他の画像グループに関する統計値を経験的に評価することによって判断され得る。
例として、複数の画像の各々に対して、再圧縮プロセス(前述の制約下で)を通じて達成された追加の圧縮の程度が記録される。入力画像における最小絶対非ゼロDCT係数も記録される。さらに別の例として、入力画像のY、UおよびV面の各々での最小絶対非ゼロDCT係数が記録される。複数の画像について前述のデータを記録するために使用され得るデータ構造の一例を図63に示す。
図64Aは、特許請求された主題の一例により、知覚的類似性基準に従って再圧縮され、その圧縮がさらに別の圧縮基準を使用して評価された画像のY面における最小非ゼロDCT値を用いて、分類閾値が定義され得る方法をグラフで表した図である。一例によれば、複数の画像が、圧縮された入力画像と再圧縮画像との間における知覚上の同一性を維持すると推定される最大程度まで再圧縮され得る。最小圧縮基準または閾値が、例えば、オペレーターにより手動で設定されて、複数の圧縮された入力画像に適用され、そして、圧縮された入力画像の記録された絶対非ゼロDCT値が、最小のさらに別の圧縮基準に従って分類される。
例えば、再圧縮率がさらに別の再圧縮基準によって規定された値を下回る画像のY面での最小絶対非ゼロDCT値が記録される。例として、この最小絶対非ゼロDCT値は、圧縮率が「高い」と見なされるべき圧縮された入力画像を識別するための(第1の)閾値として使用され得(例えば、ブロック8535で高度に圧縮されていると分類される画像を識別するために使用される第1の閾値)、最小絶対非ゼロDCT値が、選択した最小絶対非ゼロDCT値以上の圧縮された入力画像が高度に圧縮されていると分類されるであろう。
別の観点から見ると、例として、圧縮された入力画像を「高度に圧縮されている」と分類するための第1の閾値は、知覚的に可逆な追加の圧縮が制限され、特定の率を超えない、画像の最小絶対非ゼロDCT値によって特徴付けられ得る。図64Aを参照すると、さらに別の例として、知覚的に可逆な追加の圧縮が制限され、特定の率を超えない、画像の最小絶対非ゼロDCT値は3以上である。したがって、この例では、閾値が設定され得、それに従って、最小絶対非ゼロDCT値が3以上の任意の画像が高度に圧縮されていると分類される。
例として、再圧縮率が圧縮基準によって規定された値を下回る画像の最小絶対非ゼロDCT値の記録に加えて、再圧縮率が圧縮基準によって規定された値を上回る画像の最小絶対非ゼロDCT値が記録される。例として、この最小絶対非ゼロDCT値は、圧縮率が「低い」と見なされるべき圧縮された入力画像を識別するための(第2の)閾値として使用され得(例えば、ブロック8555で低圧縮画像として分類される画像の識別に使用される第2の閾値)、最小絶対非ゼロDCT値が選択した最小絶対非ゼロDCT値以下の圧縮された入力画像が低圧縮画像として分類されるであろう。
別の観点から見ると、例として、圧縮された入力画像を「低圧縮」と分類するための第2の閾値は、知覚的に可逆な追加の圧縮が特定の率を超える画像の最小絶対非ゼロDCT値によって特徴付けられ得る。図64Aを参照すると、さらに別の例として、知覚的に可逆な追加の圧縮が特定の率を超える画像の最小絶対非ゼロDCT値は1以下である。したがって、この例では、閾値が設定され得、それに従って、最小絶対非ゼロDCT値が1以下の任意の画像が低圧縮画像と分類される。図64Aに見られるように、第1の閾値(画像が高度に圧縮されているか否かの分類に使用される)と第2の閾値(画像が低圧縮画像か否かの分類に使用される)との間に、Y面での最小絶対非ゼロDCT係数が第1の閾値と第2の閾値との間の中間域に含まれる画像の中間グループが存在し得る。例として、中間域内にある最小絶対非ゼロDCT係数をもつ少なくともいくつかの画像が、圧縮された入力画像と再圧縮画像との間における知覚上の同一性を維持すると推定される最大程度まで圧縮された時に、追加の再圧縮基準によって規定された値を下回る圧縮率を提供し、中間域内にある絶対非ゼロDCT係数をもつ、いくつかの他の画像が、追加の再圧縮基準によって規定された値を上回る圧縮率を提供したので、対応する画像を高度に圧縮されている画像かまたは低圧縮画像と最終的に分類できない最小絶対非ゼロDCT係数が中間域内にあり、そのため、Y面での最小絶対非ゼロDCT係数の中間域内に曖昧さがある。
図64Aを参照すると、さらに別の例として、知覚的に可逆な追加の圧縮が曖昧と見なされる画像の最小絶対非ゼロDCT値の中間域は、1より大きく、3未満である。
例として、分類閾値は、知覚的類似性基準に従って再圧縮され、その圧縮がさらに別の圧縮基準を使用して評価された画像のクロマ、すなわち、UおよびV面での最小非ゼロDCT値を用いて定義され得る。UおよびV面での最小非ゼロDCT値に関する分類閾値は、前述のとおり、Y面でのDCT値に基づく分類が曖昧に終わる場合に使用され得る。
ここで図64Bを参照すると、これは、特許請求された主題の一例により、知覚的類似性基準に従って再圧縮され、その圧縮がさらに別の圧縮基準を使用して評価された画像のUおよびV面における最小非ゼロDCT値を用いて、分類閾値が定義され得る方法をグラフで表した図である。
例えば、再圧縮率がさらに別の再圧縮基準によって規定された値を下回る画像のUおよびV面での最小絶対非ゼロDCT値が記録される。例として、この最小絶対非ゼロDCT値は、圧縮率が「高い」かまたは「低い」と見なされるべき圧縮された入力画像を識別するための(第3の)閾値として使用され得る。必要に応じて、知覚的類似性基準およびさらに別の圧縮基準に従い、UおよびV面の各々に対して、2つの別個の閾値が提供され得るか、または同一の閾値が使用され得る。
例えば、図64Bを参照し、UおよびV面の両方に対する閾値を3と仮定すると、Y面での最小絶対非ゼロDCT値が曖昧で、U面およびV面の両方での最小絶対非ゼロDCT値が(両方の面で)3より大きい、任意の圧縮された入力画像は、高度に圧縮されていると見なされる。また、Y面での最小絶対非ゼロDCT値が曖昧で、UおよびV面の少なくとも1つでの最小非ゼロDCT値が3に等しい、任意の圧縮された入力画像は、低圧縮画像と見なされる。
図57〜図64Bに関連して前述した、高度に圧縮された画像を識別するためのシステムおよび方法は、本発明の他の技術と併用すると有用である。例えば、図65aは、例えば、図57〜図64Bに関連して前述した任意の方法および装置を使用して、高度に圧縮された画像を識別する働きをする圧縮レベル分類器9005が提供されていることを除いて、図32aに類似している本発明の特定の実施形態により構築され稼働する再圧縮システムの簡略化した機能ブロック図である。本発明の特定の実施形態によれば、圧縮レベル分類器が、入力画像が高度に圧縮された画像であると識別する場合、入力画像は全く再圧縮されない。圧縮レベル分類器以外、全ての他のブロックは、分類器からの適切な指示通りに何も実行せず、それ以上の処理をすることなく、入力画像が出力に直接コピーされる。
図65bは、本発明の特定の実施形態により、また、スケーリングによって先行画像の量子化行列から生成された量子化行列を使用して稼働する、画像の再圧縮のための方法の簡略化した流れ図である。図65bの方法は、例えば、図のように、適切に順序付けられた図中のステップの一部または全てを含み、図12の対応するステップ1012は通常、無条件に実行されるが、第1の画像が高度に圧縮されていると分類されない場合に限り、ステップ9012が実行されることを除いて、図12の方法と類似し得る。
図65cは、本発明の特定の実施形態により、また、先行画像の量子化行列と、JPEG規格で定められているものなどの第2の量子化行列とを組み合わせることによって生成された量子化行列を使用して稼働する、画像の再圧縮のための方法の簡略化した流れ図である。図65cの方法は、例えば、図のように、適切に順序付けられた図中のステップの一部または全てを含み、図18の対応するステップ1815は通常、無条件に実行されるが、第1の画像が高度に圧縮されていると分類されない場合に限り、ステップ9815が実行されることを除いて、図18の方法と類似し得る。
ここで、図66〜図71dに関連して、入力画像の圧縮プロセスにおけるクロマダウンサンプリングの効果を評価するためのシステムおよび方法について記載する。図66〜図71dに関連して後述するシステムおよび方法は、単独で、および、例えば、図72a〜図72dに関連して後述するような、本発明の他の技術との併用の両方で有用であり得る。
特許請求された主題の説明および各請求項の全体に渡り、「クロマダウンサンプリング」、「クロマサブサンプリング」および「クロマ空間解像度の低下」という用語、または同様の用語は、区別しないで参照されている。「クロマダウンサンプリング」、「クロマサブサンプリング」および「クロマ空間解像度の低下」という用語は、当技術分野で周知であり、利便性の目的のために提供されている。省略形の「CDS」が、説明および各請求項の全体に渡り、「クロマダウンサンプリング」、「クロマサブサンプリング」および「クロマ空間解像度の低下」という用語、または同様の用語の代わりに使用される。
特許請求された主題の説明および各請求項の全体に渡り、「CDS候補グループ(CDS candidates group)」という用語、または同様の用語が参照されている。「CDS候補グループ」という用語は、本明細書では、クロマダウンサンプリングを受けるための候補の入力画像内のブロックグループに関連する。例えば、4:2:0のクロマダウンサンプリングスキームが入力画像に適用される場合、クロマ成分が一緒にダウンサンプリングされて、単一のブロックで表される、入力画像内の4ブロックの各グループが、CDS候補グループを構成する。別の例では、4:2:2のクロマダウンサンプリングスキームが入力画像に適用される場合、クロマ成分が一緒にダウンサンプリングされて、単一のダウンサンプリングされたブロックで表される、入力画像内の2ブロックの各グループが、CDS候補グループを構成する。
特許請求された主題の説明および各請求項の全体に渡り、「対象のCDSブロック」という用語、または同様の用語が参照されている。「対象のCDSブロック」という用語は、本明細書では、クロマダウンサンプリングを、元の画像からのCDS候補グループ内のブロックに適用することによって生じるブロックに関連する。
特許請求された主題の説明および各請求項の全体に渡り、「圧縮された入力画像ファイル」という用語または同様の用語が参照されている。この用語は、説明および特許請求の範囲では、圧縮画像をレンダリングするためにコンピューターによって必要とされる任意の情報を格納および整理するために使用されるコンピューター資源に関連する。例として、圧縮された入力画像ファイルは、画像データおよびメタデータを含むことができ、メタデータは圧縮データを含み、圧縮データは、同様に、その画像に適用された圧縮に関連する詳細およびデータを含む。圧縮データは、画像の復号に必要であり得る。特定の圧縮画像に対して、圧縮データは、画像の最後の圧縮に対して使用され、その画像の再構築に必要な、量子化行列および/またはスケーリング係数(例えば、スケーリングされた標準の量子化行列が使用された場合)を含むことができる。
特許請求された主題の一態様により、入力画像の圧縮プロセスにおけるクロマダウンサンプリングの効果を評価するシステムおよび方法が提供される。特許請求された主題の一例によれば、入力画像の圧縮プロセスにおけるクロマダウンサンプリングの効果を評価する方法は、入力画像内の各CDS候補グループのUおよび/またはV面でのDCT係数の特性に基づき、さらに、入力画像内の各CDS候補グループのUおよび/またはV面でのDCT係数の多様性に基づく、対象のCDSブロックに対する誤差の計算、および複数の対象のCDSブロック誤差値に基づく入力画像に対するDCSの推定される知覚的効果の計算を含むことができる。
特許請求された主題のさらに別の例として、特性には、各DCS候補グループのUおよび/またはV面でのDCT係数の平均を含む。特許請求された主題のさらにまた別の例として、多様性は、各CDS候補グループの各1つのUおよび/またはV面でのDCT係数値と、各CDS候補グループのUおよび/またはV面でのDCT係数の平均との間の差異によって特徴付けられる。
ここで、特許請求された主題のさらに別の例を提供する。ここで、図66を参照すると、これは、特許請求された主題の一例により、入力画像の圧縮プロセスにおけるクロマダウンサンプリングの効果を評価するためのシステムのブロック図である。一例によれば、入力画像の圧縮プロセスにおけるクロマダウンサンプリングの効果を評価するためのシステム10100は、CDSモード識別器(mode identifier)10010、DCT係数抽出器10020、構成モジュール30およびCDS評価モジュール10040を含むことができる。さらに別の例として、システム10100は、本明細書で説明するとおり、入力画像10102を受信し、それを処理して、CDSルーチンの画像への適用に関して勧告(recommendation)を出すことができる。
ここで、さらに図67を参照すると、これは、特許請求された主題の一例により、JPEG入力画像の圧縮プロセスにおけるクロマダウンサンプリングの効果を評価する方法の流れ図である。例として、JPEG画像が取得され(ブロック10205)、入力としてシステム10100に提供され得る。入力画像10102が、その(現在の)CDSモードを判断する(ブロック10210)ために分析できる。これに関して、入力画像10102は、既にある程度のCDSを受けている画像であり得ることを理解されたい。例えば、図66の入力画像はJPEG画像であり得、その入力JPEG画像は、両方の軸でのCDS、水平軸または垂直軸の一方でのCDSを受けたかも知れず、または入力画像は、CDSを全く受けていないJPEG画像かも知れない。例として、JPEG入力画像に対するCDSモードの判断は、この情報が通常JPEGファイル自体から入手可能であるため、容易であり得る。他の種類の画像のCDSモードの判断に使用できるルーチン例について後述する。
例として、入力画像10102の現在のCDSモードに基づき、追加のCDSが可能か否かが判断できる(ブロック10215)。さらに別の例として、入力画像10102がJPEG画像である場合、JPEG画像が既に両方の軸でCDSを受けていれば、追加のCDSは適用できず、プロセスは終了する(ブロック10220)が、そうでなければ、プロセスはブロック10225に進み、そこで、どの軸についてCDSが評価されるかが判断される。どの軸についてCDSが評価されるかの判断に使用され得るルーチン例を以下で提供する。例として、ブロック10210、10215、および10225が、CDSモード識別器10010によって実行できる。
あるいは、どの軸についてCDSが評価されるかの判断のために実施されるルーチンと並行して、また、実際の評価プロセスに備えて、ブロック10230、10235、および10240が実施できる。ブロック10230で、入力JPEGの画像量子化行列が取得できる。JPEG画像については、この情報も通常JPEGファイル自体から入手可能である。ブロック10235で、入力画像のVおよび/またはUのDCT係数が取得できる。ブロック10240で、逆量子化が入力画像のVおよび/またはUのDCT係数に適用されて、Vおよび/またはU面での逆量子化DCT係数を生じ得る。
どの軸についてCDSが評価されるかが判断され、Vおよび/またはU面での逆量子化DCT係数が利用可能になると、プロセスは次のブロックに進むことができ、そこで、第1CDS候補グループが(評価されるために)選択される(ブロック10245)。例として、評価される第1CDS候補グループの選択が、構成モジュール10030によって実行できる。さらに別の例として、構成モジュール10030は、CDSの実行後、単一ブロックに統合される1組のブロックを選択するように構成できる。さらに別の例として、水平軸および垂直軸の両方に沿ったダウンサンプリングに対して評価が実行される場合、第1CDS候補グループは、一番上の一番左側のブロック、その右側のブロック、およびこれらの下の2つのブロックを含むことができる。次に、その後の各評価で、2×2ブロックの対応する組が評価に使用でき、そして、事前定義したパターンに従って、毎回、次のCDS候補グループが選択できる。異なる例では、例えば、水平軸のみに沿ったダウンサンプリングに対して評価が実行される場合、第1CDS候補グループは、一番上の一番左側のブロック、その右側のブロックを含むことができ、次の各CDS候補グループのブロックは、特定の事前定義したパターンに従って選択される同様の組のブロックを含む。
ここで、CDS評価ルーチン例について説明する。例として、評価ルーチンは、CDS評価モジュール10040によって実行できる。例として、評価ルーチンは、入力画像内の各CDS候補グループのUおよび/またはV面でのDCT係数の特性に基づく、また、入力画像内の各CDS候補グループのUおよび/またはV面でのDCT係数の多様性にさらに基づく、対象のCDSブロックに対する誤差の計算を含むことができる。入力画像に対するDCSの推定される知覚的効果が、複数の対象のCDSブロック誤差値に基づき計算できる。
特許請求された主題のさらに別の例として、特性には、各DCS候補グループのUおよび/またはV面でのDCT係数の平均を含む。特許請求された主題のさらにまた別の例として、多様性は、各CDS候補グループの各1つのUおよび/またはV面でのDCT係数値と、各CDS候補グループのUおよび/またはV面でのDCT係数の平均との間の差異によって特徴付けられる。
ここで、図67を参照しながら、評価ルーチンの一例に従ったさらなる詳細について説明する。例として、評価ルーチンの一部として、各CDS候補グループの各Uおよび/またはV面でのDCT DC係数の平均が計算され得る(ブロック10250)。さらに別の例として、各CDS候補グループの各1つのUおよび/またはV面でのDCT DC値と、各CDS候補グループのUおよび/またはV面でのDCT DC係数の平均との間の差異が計算され(ブロック10255)、各CDS候補グループの各1つのUおよび/またはV面でのDCT DC値と、各CDS候補グループのUおよび/またはV面でのDCT DC係数の平均との間の最大二乗差が選択される(ブロック10260)。便宜上、本明細書では、この最大二乗差が、CDS対象ブロックに対する誤差値と呼ばれることがある。
CDS対象ブロックに対する誤差値が閾値と比較され(ブロック10265)、CDS対象ブロックに対する誤差値が閾値を下回っている場合、評価すべきCDS候補グループが残っているか否かが判断される(ブロック10270)。CDS対象ブロックに対する閾値は、構成モジュール10030によって判断でき、CDS評価モジュール10040内にプログラム化できる。CDS評価モジュール10040は、閾値を各CDS候補グループの評価ルーチンの一部として使用できる。CDS対象ブロック誤差値に対する閾値を判断できる方法例について、後述する。
ブロック10265で、評価するCDS候補グループが残っていれば、次のCDS候補グループが、例えば、CDS評価モジュール10040によって選択され(ブロック10275)、プロセスはブロック10250に戻る。例として、次のCDS候補グループの選択は、事前定義したパターンに従って実行される。さらに別の例として、次のCDS候補グループの選択は、使用しているDCT面のラスター走査の継続およびCDS候補ブロックの次の対または4個組の選択によって実行される。
CDS候補グループのいずれかについて、ブロック100265で、各CDS対象ブロックに対する誤差値が閾値を上回っていると判断されると、このCDS候補グループは、CDSに対して安全でないと見なされ、CDSグループに対して安全でない数を数えるカウンターの値が増やされる(ブロック10280)。カウンターが増加された後、カウンターインデックスに関連する第2の閾値がカウンターインデックスの閾値に対してチェックされる(ブロック10285)。例として、誤差値の閾値と同様の方法で、カウンターインデックスの閾値が構成モジュール10030によって判断でき、CDS評価モジュール10040内にプログラム化できる。CDS評価モジュール10040は、カウンターインデックスの閾値を入力画像の評価ルーチンの一部として使用できる。カウンターインデックスに対する閾値を判断できる方法例について、後述する。
カウンターインデックスがカウンターインデックスの閾値を超えると、評価ルーチンに基づいて、DCSの実行を推奨しないことが判断されて、この効果に対する勧告が出される(ブロック10290)。しかし、カウンターが増加された後、カウンターインデックスがまだカウンターインデックスの閾値を超えていないと判断されると、プロセスはブロック10270に進み、そこで、評価するCDS候補グループが残っているか否かが判断される。評価するCDS候補ブロックのグループがまだ残っている場合、プロセスはブロック10250に戻り、次のグループが評価される。しかし、もう評価するグループが残っていない場合、評価ルーチンに基づき、CDSは、入力画像とそのクロマダウンサンプリングされた対応画像との間の知覚的類似性を甚だしく低下させていないと推定されると判断され、この効果に対する勧告が出される(ブロック10295)。
特許請求された主題の一例によれば、評価ルーチンは、V面のDCT DC値のみを使用して実行される。したがって、例として、ブロック10235では、V面でのDCT係数のみが抽出され、場合により、V面でのDCT DC係数のみが抽出される。ブロック10240では、逆量子化は、V面でのDCT係数のみ、またはV面でのDCT DC係数に制限できる。ブロック10250〜10265も、V面でのDCT係数またはV面でのDCT DC係数に関して、構成および適用され得る。
V面のDCT DC値について実施は、信頼性のある出力をなお提供しながら、評価アルゴリズムの複雑さを軽減できることが理解されるであろう。V成分は、「赤色のデータ」の大部分を含み、考案者は、V成分がクロマダウンサンプリングの知覚的効果の判定においてより高い重要性を示すことが分かった。特許請求された主題の別の例によれば、追加のDCT係数および/またはU面成分を使用すると、その上、より高い複雑さを犠牲にして、勧告のより細かな調整を可能にし得る。
さらに別の例として、入力画像からの4つのブロックがCDS候補グループ内にある場合、次のようにラベル付けされる:
B1=B{m,n}、B2=B{m+1,n}、B3=B{m,n+1}、B4=B{m+1,n+1}
クロマダウンサンプリングが垂直軸および水平軸の両方で実行されると仮定すると、その4つのブロックが単一のブロックになる。この組のV面での(丸められた)平均DCT DC値が、次のように計算される:
式1
後述するように、例として、入力画像が既に一方向でクロマダウンサンプリングされている場合は、2つの関連するブロックだけを使用して平均が計算される。
ブロックB1、B2、B3およびB4(CDS候補グループを表す)に対応するCDS対象ブロックに対する誤差値は、次のように計算できる:
式2
入力画像が既に一方向でダウンサンプリングされている場合は、{i=1,2}であり、mとnのどちらも二分されない。
ブロックB1、B2、B3およびB4から構成されるCDS候補グループに対するEm,n誤差値が第1の閾値を上回っている場合、このCDS候補グループは、CDSに対して安全でないと見なされ、CDSグループに対して安全でない数を数えるカウンターの値が増やされる。Em,n誤差値は、全体画像に対して計算される。随意に、例えば、画像の一部のみが分類プロセスの一部として処理されるように、事前定義したパターンが考案されて、CDS候補グループに対して特定のサブセットを提供するために使用される。一例として、分類プロセスが、偶数値のmおよびnについてのみ実行され得る。CDS候補グループの「CDSに対して安全でない」数を数えるカウンターが第2の閾値を超えるか、または言い換えれば、カウンターが、値Eが閾値を超えるN個のCDS候補グループを表す、値Nを超える場合、入力画像はクロマサブサンプリングを受けるべきでないと判断される。
非限定的な説明のため、大規模な画像データベースに関する特許請求された主題による方法の一例の評価は、所与のCDS候補グループがCDSに対して安全でないと見なされるべきか否かの判断に使用される閾値である、第1の閾値の値が、例えば、TE=10,000であり得ることを示している。前述のとおり、この閾値TEは、各CDS候補グループ内の各メンバーブロックのV面でのDCT DC値と、各CDS候補グループのV面でのDCT DC係数の平均との間の最大二乗差の評価に使用される。
さらに非限定的な例として、また、大規模な画像データベースに関する特許請求された主題による方法の一例のさらに別の評価によれば、カウンターインデックスに関連する第2の閾値は、例えば、N=10であり得る。一例では、入力画像内のCDS候補グループに対する誤差値、Eの評価は、N個のCDS候補グループが、Eが閾値を超えたことが分かった後、停止し得る。誤差値の閾値に対してTE=10,000を設定する閾値、およびカウンターインデックスの閾値に対してN=10を設定する閾値を使用すると、テスト画像の主観的な視覚的評価で評価されるように、良い区別が提供された。
ここで、図3を参照すると、これは、特許請求された主題の一例により、複数の画像ファイルに対して、主観的CDS分類の結果がリストされ、その複数の画像ファイルの各々に対して、CDS対象ブロック誤差を評価するための3つの異なる閾値の適用結果が記録される、データ構造図である。さらに詳細に後述するように、特許請求された主題の一例によれば、かかるデータを使用して、CDS対象ブロック誤差を評価するための閾値が実験的に判断できる。
さらに別の例として、テスト画像の集合(画像ファイル)に対するクロマダウンサンプリングの知覚的効果が評価可能である。例えば、一人または複数の人間の評価者が、テスト画像の集合に対するクロマダウンサンプリングの効果を評価するように依頼され得る。テスト画像の集合は、クロマダウンサンプリングされ得、人間の評価者が、彼/彼女の主観的印象に基づき、クロマダウンサンプリングされた画像とその対応する入力画像との間に知覚的な差異があるか否かを示すように依頼され得る。二人以上の評価者がいる場合は、それ自体が周知の方法で、共通の結果が任意の周知の統計的処理方法によって取得できる。図68では、かかる評価の結果が、左から2番目の列にまとめられ、そこでは、入力画像のクロマダウンサンプリングの結果として知覚的変化がなければ、各画像に対して「OK」が入力され、知覚的変化があれば、「OKでない」が入力されている。図68では、画像の知覚的類似性は、100%ズームで、両方のクロマ軸でのCDSに対して、評価されている。画像間の知覚的類似性の評価のために他の比率が使用できることを理解されたい。知覚的類似性は、1つの軸のみでのクロマダウンサンプリングに対しても評価できることも理解されたい。さらに、知覚的類似性は、可能な各クロマダウンサンプリングモード(例えば、両方のクロマ軸でのCDS、水平軸のみでのCDS、および垂直軸のみでのCDS)に対して評価できることを理解されたい。
人間の評価者を使う代わりに、または追加で、知覚的品質尺度が使用でき、そのプロセスは自動的または半自動的にできることを理解されたい。知覚的品質尺度に基づく自動的評価プロセスは、例えば、ダウンサンプリングしたクロマ面の元の空間解像度へのアップサンプリングを含むことができるが、これは、参照間、すなわち、元のクロマ面とダウンサンプリングした面間の調整に必要であり、その後に、例えば、PSNR(ピーク信号対雑音比)、SSIM(構造的類似性)またはVIF(視覚情報忠実度)などを含むが、これに限定されない、周知の歪み尺度の計算が続く。使用可能な知覚的品質尺度のさらに別の例には、追加のアーチファクト性エッジ尺度を含む知覚的類似性尺度、およびテクスチャ尺度および局所類似性尺度の組み合わせに基づく知覚的類似性尺度を含む。後者の知覚的品質尺度は前述のとおりである。
図68では、テストセット内の画像の各々1つに対して3つの異なるCDS対象ブロック誤差率を計算するために、CDS対象ブロック誤差を評価するための3つの異なる閾値が使用された。図68で使用された閾値に対して可能な値は、THR1=5000、THR2=10000およびTHR3=50000である。特許請求された主題の一例によれば、各CDS対象ブロックに対して、誤差値は、各CDS候補グループのV面でのDCT DC値と各CDS候補グループのV面でのDCT DC係数の平均との間の最大二乗差として計算できる。さらに、図68に示す例によれば、3つの閾値の各々に基づき(THR1=5000、THR2=10000およびTHR3=50000)、テストセット内の各画像に対して、誤差値が各閾値を超えている対象のCDSブロック数がデータ構造の各列に記録される。
3つの閾値の各々に対する結果がその後評価でき、CDSに対して「OK」と評価されている画像とCDSに対して「OKでない」と評価されている画像をうまく区別する閾値が選択される。3つの閾値の各々に対する結果の評価が手動または、この目的のために設計され、コンピューター上で実施された専用アルゴリズムを用いて実行できる。
例えば、図68で3つの閾値に対する結果を見ると、CDSを受けて知覚的に可逆であるか否かにかかわらず、THR1は低すぎて、多くのブロックがそれを超えている。THR3は高すぎて、CDSが知覚的損失を引き起こしている場合でさえ、ほとんどのブロックがそれを超えていないが、THR2は、CDSに対して推奨されないとして各誤差値が閾値を超える、少なくとも10個のCDS対象ブロックをもつ任意の画像を分類することにより、このテストセットに対する信頼性のある分類を可能にする。このようにして、CDS対象ブロック誤差を評価するための閾値がカウンターインデックス閾値を判断するために使用できる。前述のとおり、カウンターインデックス閾値は、誤差値が所与のCDS対象ブロック誤差閾値を上回っているかまたは下回っている、CDS対象ブロック(またはCDS候補グループ)数に基づき、入力画像がCDSに対して安全か否かを示すために使用される(そして、CDS対象ブロック誤差閾値はカウンターインデックス閾値に関連する)。
図68に示す例を参照すると、THR2=10000がCDS対象ブロック誤差閾値として選択でき、すると各カウンターインデックス閾値は10である。誤差値が対象のCDSブロック誤差閾値を超える、CDS対象ブロック数が10以上の任意の画像が、CDSに対して「OKでない」と見なされ、かかる画像に対して、CDSを実行しないように勧告が出される。同様に、誤差値が対象のCDSブロック誤差閾値を超える、CDS対象ブロック数が10未満の任意の画像が、CDSに対して「OK」と見なされ、かかる画像に対して、CDSを実行するように勧告が出される。
図68では、例として、データ構造内の基本的な値およびエントリの全ての評価は、両方の軸におけるCDSに関して実行された。各CDSモードに対して、CDS対象ブロック誤差閾値および各インデックスカウンター閾値が提供されるように、垂直軸のみでのCDSに対して、および水平軸のみでのCDSに対して、同様の評価が実行され得ることを理解されたい。特許請求された主題の一例によれば、クロマダウンサンプリングを分類するプロセスによって使用される、CDS対象ブロック誤差閾値および各インデックスカウンター閾値は、評価しているクロマダウンサンプリング方法に従って選択でき、複数のCDSモードが評価される場合には、閾値は、あるCDSモードから次への移行中に更新できる。
図68では、例として、小さいテストセットが示されている。より正確でより信用できる閾値を取得するために、もっと多くの画像が評価できることを理解されたい。さらに、例として、多かれ少なかれ3つ以上の候補対象のCDSブロック誤差閾値が(各CDSモードに対して)評価できる。
図67およびその説明では、入力画像はJPEG画像であった。JPEG画像では、Y、UおよびV面の各々でのDCT係数が、簡単な方法で、入力画像から抽出できる。ここで、図69を参照して説明するが、それは、特許請求された主題の一例により、入力画像の圧縮プロセスにおけるクロマダウンサンプリングの効果を評価する方法の流れ図であり、その方法は、画像のRAW Y、U、V成分への変換および評価でのRAW Y、U、V成分の使用を含む。
図67では、入力画像のRAW Y、UおよびVの各成分を取得するために、入力画像が処理される(ブロック10405)。一例では、画像のRAW Y、UおよびV成分への予備的変換が随意に実施できる(ブロック10402)。例えば、画像がRAW RGB画像である場合、RAW Y、UおよびV成分は、場合により、CCIR 601(別名ITU−T BT.601)で定義されるように、周知のRGBをYUVカラー変換に適用することにより計算できる。入力画像に対するRAW Y、UおよびV成分の計算は当業者には周知のプロセスであることを理解されたい。
RAW Y、UおよびV成分が取得されると、プロセスはブロック10410および10415に進むことができる。ブロック10410で、入力画像でのCDS比が、例えば、それらの空間解像度を比較することにより、RAW Y、UおよびV成分に基づき判断される。ブロック10415では、Vおよび/またはU面でのDCT係数を取得するために、8×8のDCT変換がVおよびU成分で実行される。前述のとおり、V面のみでのDCT係数の取得で十分である。DCは本質的に元の値をスケーリングした平均であるため、これで十分であり、複雑さが軽減されることを理解されたい。しかし、この手順は、DCTがどんな場合でも必要とされる(場合により、サイズ縮小した面に対してのみ、すなわち、クロマダウンサンプリング後ではあるが)、画像圧縮の状況で最も一般的に使用されるので、DCT変換はDCT行列全体に対して実行され得る。
特許請求された主題の一例によれば、入力画像でのCDS比がRAW Y、UおよびV成分に基づいて判断される、次のブロック10410では、ブロック10215に関連して前述したのと実質的に同じ方法で、追加のCDSが可能か否かが判断され得る。追加のCDSが可能でないと判断されると、ブロック10220に関連して前述したのと実質的に同じ方法で、プロセスが終了する。しかし、追加のCDSが可能であれば、プロセスは、前述したブロック10240〜10295に実質的に従い、また、Vおよび/またはU面でのDCT係数を使用し、入力画像でのCDS比に基づいて、進むことができ、CDSを実行するように勧告を出す(ブロック10295)かまたはCDSを実行しないように勧告を出す(ブロック10290)かが判断され得る。
V成分のみが計算されることは可能である(例えば、入力画像がRGBフォーマットの場合)が、多くの場合、YUV空間への完全変換はメインプロセス(例えば、CDSをまたはYUV空間への変換含む圧縮)の副産物であり得、分類プロセスが、メインプロセスの構成に使用される制御手段として実施され得ることを理解されたい。かかる状況では、YUV計算は、どんな場合にも実行する必要があるだろう。
ここで、図70を参照すると、これは、特許請求された主題の一例により、入力画像の圧縮プロセスにおけるクロマダウンサンプリングの異なるモードの効果を評価する方法の流れ図である。特許請求された主題の一例によれば、例えば、入力画像の圧縮プロセスでのクロマダウンサンプリングの効果を評価するプロセスは、ブロック10405に関連して前述したのと実質的に同じ方法で、入力画像に対応するRAW Y、UおよびV成分の入力から始まることを表している。Vおよび/またはU面でのDCT係数を取得するため、ブロック415に関連して前述したのと実質的に同じ方法で、8×8のDCT変換がUおよびV成分で実行される。図70に示すプロセスは、JPEG画像の分類にも使用でき、この場合は、例えば、ブロック10205はブロック10405を置き換えることができ、また、ブロック10230〜10240はブロック10415を置き換えることができることを理解されたい。
特許請求された主題の一例によれば、ブロック10415に加えて、および場合により並行して、CDSが入力画像の両方の軸に適用されたか否かが判断され得る(ブロック10515)。(入力画像でのCDS比を判断するための)ブロック10410を参照して説明したのと同様のルーチンが、CDSが入力画像の両方の軸に適用されたか否かの判断に使用できる。CDSが入力画像の両方の軸に適用されたと判断されると、プロセスは、ブロック10220に関連して前述したのと実質的に同じ方法で、終了する。しかし、CDSが入力画像の両方の軸に適用されていないと判断されると、プロセスはブロック10532に進み、そこで、どのCDSモードが入力画像に適用されたかが判断され、その後、どの軸に対して、入力画像へのCDS(または追加のCDS)の適用の効果を評価するのかが判断される(ブロック10540)。
ブロック10532に戻ると、例として、可能な入力画像CDSモードは、垂直軸でのCDS(ブロック10534)、水平軸でのCDS(ブロック10536)、またはCDSなし(ブロック10538)である。例えば、CDSが既に一方(例えば、垂直または水平)の軸で入力画像に適用されていれば、ブロック10540で他の軸でのCDSを評価することができる。さらに別の例として、CDSが入力画像に適用されていなければ(ブロック10538)、CDS評価モジュールは、最初は、入力画像に対して両方の軸でのCDSの効果を評価することができる。さらに別の例として、CDSが入力画像に適用されていない場合に(ブロック10538)、入力画像に対して両方の軸でのCDSの適用が推奨されないと判断されると、評価ルーチンは、そのルーチンが繰り返されるが、今度は、一方(例えば、垂直)の軸でのCDS適用の効果の評価に使用されるように再構成できる。さらにまた別の例として、CDSが入力画像に適用されていない場合に(ブロック10538)、入力画像に対して両方の軸でのCDSの適用が推奨されないと判断され、さらに、2つの軸の一方(例えば、水平)でのCDSの適用も推奨されないと判断されると、評価ルーチンは、そのルーチンが繰り返されるが、今度は、2つの軸の他方(例えば、垂直)でのCDS適用の効果の評価に使用されるように再構成できる。
ブロック10540で、CDS(または追加のCDS)の適用の効果を両方の軸または一方の軸(この場合は、どちらの軸)に対して評価するかが判断されると、プロセスは、前述したブロック10240〜10295に実質的に従って進むことができ、プロセスは、CDSを両方の軸またはそれぞれの軸で実行するように推奨するか(ブロック10295)または推奨しない(ブロック10290)かの評価を返すことができる。
ブロック10550で、評価すべき軸がまだあるか否かが判断され、ある場合には、ブロック10540で、次に評価する軸が判断されて、ブロック1024〜10295が繰り返される。かかる可能な追加の評価については、例として前述している。プロセスの終わりで、必要であれば、勧告が統合され得る。
ここで、図71A〜図71Dを参照すると、これらは、特許請求された主題の一例により、圧縮プロセスにおけるクロマダウンサンプリングの効果を評価する方法の特定態様の非限定的な実例を示す。初めに、逆量子化後、元のV面DCT値が取得される。図71Aおよび図71Bでは、4:2:0のCDSモードが評価され(両方の軸でのCDS)、一例として、4つの隣接するブロックのV面DCT値10605が示されている。4つの隣接するブロックがCDS候補グループを形成する。
V面での(丸めた)平均DCT DC値が、例えば、式1を使用して、計算され、この場合の結果は123である。例えば、式2を使用して、4つの二乗誤差が、CDS候補グループの各メンバーブロックに対して次のように計算され:(105−123)^2=324;(42−123)^2=6561;(182−123)^2=3481;(161−123)^2=1444、最大値:6561が特定される。これは対象CDSに対する比較的大きな誤差である。行列10610は、クロマダウンサンプリングが適用される前の対応するピクセルを示し、画像10615は、対応する画像の各部分を表す。図71Bでは、ダウンサンプリング後のピクセル10620が、対応するDCT値(量子化前)10625および対応する画像の各部分10630と一緒に、示されている。例えば、CDSサブサンプリングが両方の軸で実行される時にCDS対象ブロックに対する誤差値(6561)が高く、それが全体画像を表すと仮定すると、入力画像の両方の軸でCDSを適用しないよう勧告が出される。
説明のため、誤差値が閾値を上回る対象CDSブロックの数がカウンターインデックス閾値より大きいと仮定すると、この場合、CDSを両方の軸で実行しないように勧告され、プロセスは、CDSを水平軸に適用するよう勧告するか否かを判断するために進む。図71C〜図71Dでは、4:2:2のCDSモードが評価され(水平面でのCDS)、一例として、2つの水平に隣接するブロックのV面DCT値10635が示されている。2つの隣接するブロックがCDS候補グループを形成する。
V面での(丸めた)平均DCT DC値が、例えば、式1を使用して、計算され、この場合の結果は119である。例えば、式2を使用して、2つの二乗誤差が、CDS候補グループの各メンバーブロックに対して次のように計算され:(70−119)^2=2401;(167−119)^2=230、最大値:2401が特定される。これは対象CDSに対する比較的小さな誤差である。行列10640は、クロマダウンサンプリングが適用される前の対応するピクセルを示し、画像10645は、対応する画像の各部分を表す。図71Dでは、ダウンサンプリング後のピクセル10650が、対応するDCT値(量子化前)10655および対応する画像の各部分10660と一緒に、示されている。例えば、CDSサブサンプリングが水平軸で実行される時にCDS対象ブロックに対する誤差値(2401)が低く、それが全体画像を表すと仮定すると、CDSを入力画像に対して水平面で適用するよう勧告を出すことができる。
本発明によるシステムは、適切にプログラムされたコンピューターであり得ることが理解されよう。同様に、本発明は、コンピュータープログラムが、本発明の方法を実行するために、コンピューターによって理解できると考える。本発明はさらに、本発明の方法を実行するために、機械によって実行可能な命令のプログラムを明白に具体化する機械可読メモリーを考える。
図66〜図71dに関連して前述した入力画像の圧縮プロセスにおいてクロマダウンサンプリングの効果を評価するシステムおよび方法は、本発明の他の技術と併用すると有用である。例えば、図72aは、例えば、図66〜図71dに関連して前述した任意の方法および装置を使用して、入力画像(この場合は圧縮したJPEG画像)の再圧縮プロセスにおけるクロマダウンサンプリングの効果を評価する働きをするCDS判断モジュール10705が提供されていることを除いて、図32aに類似している本発明の特定の実施形態により、構築され稼働する再圧縮システムの簡略化した機能ブロック図である。本発明の特定の実施形態によれば、CDS判断モジュール10705は、再圧縮プロセスの一部として、CDSダウンサンプリングの適用に関する勧告を提供できる。さらに別の例として、CDS判断モジュール10705は、1つまたは複数の特定のCDSモードに関する勧告を提供することができ、構成モジュール3010は、入力画像の再圧縮中に使用されるかまたは使用されないCDSダウンサンプリングのモードが、CDS判断モジュール10705によって提供された勧告に一致するように、再圧縮プロセスを制御するように構成され得る。
さらに別の例では、図72bは、例えば、図66〜図71dに関連して前述した任意の方法および装置を使用して、入力画像(この場合はRAWフォーマット画像)の圧縮プロセスにおけるクロマダウンサンプリングの効果を評価する働きをするCDS判断モジュール10805が提供されていることを除いて、図32bに類似している本発明の特定の実施形態により、構築され稼働する圧縮システムの簡略化した機能ブロック図である。本発明の特定の実施形態によれば、CDS判断モジュール10805は、圧縮プロセスの一部として、CDSダウンサンプリングの適用に関する勧告を提供できる。さらに別の例として、CDS判断モジュール10805は、1つまたは複数の特定のCDSモードに関する勧告を提供することができ、構成モジュール3300は、入力画像の圧縮中に使用されるかまたは使用されないCDSダウンサンプリングのモードが、CDS判断モジュール10805によって提供された勧告に一致するように、圧縮プロセスを制御するように構成され得る。
図72cは、本発明の特定の実施形態により、また、スケーリングによって先行画像の量子化行列から生成された量子化行列を使用して稼働する、画像の再圧縮のための方法の簡略化した流れ図である。図72cの方法は、例えば、図12に示すように、適切に順序付けられた図中のステップの一部または全てを含み、ステップ10911および10912が追加されていることを除いて、図12に示す方法と類似し得る。したがって、第1の画像が10910で取得されると、10911でクロマダウンサンプリングエラーが第1の画像に対して判断でき、10912で第1の画像のクロマダウンサンプリングが、潜在的なクロマダウンサンプリングエラーとクロマダウンサンプリングエラー閾値との間の関係に基づいて制御できる。
図72dは、本発明の特定の実施形態により、また、先行画像の量子化行列と第2の量子化行列(例えば、JPEG規格で定められている量子化行列など)とを組み合わせることによって生成された量子化行列を使用して稼働する、画像の再圧縮のための方法の簡略化した流れ図である。図72dの方法は、例えば、図のように、適切に順序付けられた図中のステップの一部または全てを含み、ステップ10812および10815が追加されていることを除いて、図18に示す方法と類似し得る。したがって、第1の画像が10810で取得されると、10812でクロマダウンサンプリングエラーが第1の画像に対して判断でき、10815で第1の画像のクロマダウンサンプリングが、可能性のあるクロマダウンサンプリングエラーとクロマダウンサンプリングエラー閾値との間の関係に基づいて制御できる。
プログラムおよびデータを含む、本発明のソフトウェア要素は、所望であれば、CD−ROM、EPROMおよびEEPROMを含むROM(読み取り専用メモリー)形態内に実施され得るか、または、例えば、様々な種類のディスク、様々な種類のカードおよびRAMを含むが、これらに限定されず、他の任意の適切で、恒久的な、コンピューター可読媒体に格納され得ることを理解されたい。本明細書に記載するソフトウェアのような要素は、代替として、所望であれば、従来型の技術を使用して、全体的または部分的にハードウェア内に実施され得る。逆に、本明細書に記載するハードウェアのような要素は、代替として、所望であれば、従来型の技術を使用して、全体的または部分的にソフトウェア内に実施され得る。
本発明の範囲内には、とりわけ、任意の適切な順番で、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップを実行するためのコンピューター可読命令、任意の適切な順番で、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップを実行するための機械可読命令、任意の適切な順番で、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップを実行するために機械で実行可能な命令のプログラムを明白に具体化する、機械で可読な恒久的プログラム記憶装置、実行可能コードなどのコンピューター可読プログラムコードを有し、その中に具体化されているコンピューター使用可能な媒体を含み、かつ/または、任意の適切な順番で、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップを実行するためのコンピューター可読プログラムコードを含む、コンピュータープログラム製品、任意の適切な順番で実行される場合に、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップによってもたらされる任意の技術的効果、任意の適切な順番で、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップを、単独または共同して、実行するためにプログラムされた、適切な機器または装置またはかかる組み合わせ、各々がプロセッサーならびに協働する入力装置および/または出力装置を含み、本明細書に示しかつ記載するソフトウェア内の任意のステップを実行するように機能する電子装置、コンピューターまたは他の装置が、任意の適切な順番で、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップを実行するように構成されるようにする、ディスクまたはハードドライブなどの情報記憶装置または物理レコード、任意の適切な順番で、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップを具体化し、例えば、メモリー内またはインターネットなどの情報ネットワーク上に、ダウンロード前または後に、事前に格納されているプログラム、ならびにかかるプログラムをアップロードまたはダウンロードを行う方法、ならびにかかるプログラムを使用するためのサーバーおよび/またはクライアントを含むシステム、任意の適切な順番で、本明細書に示しかつ記載する任意の方法のいずれかまたは全てのステップを、単独またはソフトウェアとともに実行するハードウェアが含まれている。
本明細書に記載する任意の計算または他の分析形式は、適切なコンピューター化された方法で実行され得る。本明細書に記載する任意のステップはコンピューター実施され得る。本明細書に示しかつ記載する発明は、(a)本明細書に記載の任意の問題または任意の目的に対する解決法を特定するためのコンピューター化された方法の使用であって、その解決法が、随意に、本明細書に記載する問題または目的に、積極的な方法で影響を与える、本明細書に記載する判断、動作、製品、サービスまたは他の任意の情報のうちの1つを含む方法と、(b)その解決法の出力を含み得る。
別々の実施形態のコンテキストで説明した本発明の特徴は、単一の実施形態に組み合わせても提供され得る。逆に、簡潔にするため単一の実施形態のコンテキストでまたは特定の順序で説明される、方法の各ステップを含む、本発明の特徴は、別々に、または任意の適切な部分的組み合わせで、または異なる順序で提供され得る。本明細書では、「例えば(e.g.)」は、限定を意図しない特定例という意味で使用されている。任意の図と一緒に示されている装置、機器またはシステムは、実際には、特定の実施形態における単一のプラットフォームに統合され得るか、または、例えば、光ファイバー、イーサネット、無線LAN、HomePNA、電力線通信、携帯電話、PDA、Blackberry GPRS、UMTS、GPSを含む衛星、または他のモバイル配信などだがこれに限らない、任意の適切な有線または無線接続よって接続され得る。本明細書に示しかつ記載する説明および図では、システムおよびそのサブユニットとして説明または図示されている機能性も、その内部の方法およびステップとして提供され得、その内部の方法およびステップとして説明または図示されている機能性も、そのシステムおよびサブユニットとして提供され得ることを理解されたい。図中において、様々な要素を示すために使用される縮尺は、提示を明確にするために例示的および/または適切なものに過ぎず、限定を意図するものではない。