JP4450516B2 - 2つの信号配列間の視程差を評価するための方法及び装置 - Google Patents

2つの信号配列間の視程差を評価するための方法及び装置 Download PDF

Info

Publication number
JP4450516B2
JP4450516B2 JP2000601599A JP2000601599A JP4450516B2 JP 4450516 B2 JP4450516 B2 JP 4450516B2 JP 2000601599 A JP2000601599 A JP 2000601599A JP 2000601599 A JP2000601599 A JP 2000601599A JP 4450516 B2 JP4450516 B2 JP 4450516B2
Authority
JP
Japan
Prior art keywords
image
luminance
filter
contrast
chrominance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000601599A
Other languages
English (en)
Other versions
JP2002538528A (ja
Inventor
ジェフリー ルビン,
マイケル, ヘンリー ブリル,
Original Assignee
サーノフ コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/512,402 external-priority patent/US6308866B1/en
Application filed by サーノフ コーポレーション filed Critical サーノフ コーポレーション
Publication of JP2002538528A publication Critical patent/JP2002538528A/ja
Application granted granted Critical
Publication of JP4450516B2 publication Critical patent/JP4450516B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Processing Of Color Television Signals (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

【0001】
本出願は、1999年2月25日に出願され且つ参照することによって本願に組み入れられる米国仮出願第60/121,543号の利益を主張する。また、本出願は、参照することによって本願に組み入れられる1997年4月4日に出願された米国仮出願第60/043,050号及び1998年2月2日に出願された米国仮出願第60/073,435号の利益を主張する1998年4月3日に出願された米国特許出願第09/055,076号の一部継続出願である。
【0002】
本発明は、信号処理システムの性能を評価して向上させるための装置及びそれに付随する方法に関する。より詳細には、本発明は、2つの信号配列間の視程差を評価するための方法及び装置に関する。
【0003】
(発明の分野)
画像システム等の信号処理システムの設計者は、しばしば、コントラスト、解像度、圧縮/非圧縮(codec)プロセスにおけるビットレート効率といった物理的なパラメータに関して、その設計の性能を評価する。これらのパラメータは、簡単に測定することができるが、性能を評価するための正確な基準ではない場合がある。その理由は、一般に、画像システムのエンドユーザは、アーチファクトもしくは歪みの視認性といった主観的な視覚性能や、ある場合には、MRI(磁気共鳴イメージング)画像やCAT(コンピュータ支援断層影像)走査画像等の画像内の膨らみの存在といった情報を示すこれらの画像特徴の増加に対して非常に関心があるからである。
【0004】
例えば、2つの異なるcodec画像を形成するために、2つの異なるcodecアルゴリズムを使用して、入力画像を処理することができる。人間の視力の心理物理的な特性を考慮することなく、両方のcodec画像に平均2乗誤差(MSE)演算を行なうといったように、codec画像の信頼性の尺度がパラメータのみに基づいている場合には、低いMSE値を有する、codec画像は、実際には、高いMSE値を有するcodec画像の視認可能歪みよりも多い視認可能歪みを含んでいる場合がある。
【0005】
従って、この技術分野においては、画像システム等の信号処理システムの主観的な性能における物理的なパラメータの効果を評価する方法及び装置が必要である。すなわち、経時変化する視覚画像の2つの配列間の視程差を評価する方法及び装置の存在が要求される。
【0006】
(発明の開示)
本発明は、画像配列等の2つの信号配列間の視程差を評価するための装置及び方法である。装置は、入力信号処理部と、輝度処理部と、クロミナンス処理部と、知覚距離形成部とを有する知覚距離ジェネレータを備えている。
【0007】
入力信号処理部は、入力信号を、心理物理的に規定された量、例えば輝度成分及びクロミナンス成分に変換する。輝度処理部は、輝度成分を輝度知覚距離へと処理し、一方、クロミナンス処理部は、クロミナンス成分をクロミナンス知覚距離へと処理する。また、知覚距離形成部は、輝度知覚距離をクロミナンス知覚距離と関連付けて、統合された知覚画像距離、例えば最小可知差異(JND)マップにする。
【0008】
入力信号を処理するために、JNDマップは、独立の空間及び時間チャンネルを使用して形成される。装置の性能を高めるため、空間−時間フィルタを有するチャンネルが使用されて、信号内の点もしくラインのフリッカーに応答する。すなわち、純空間もしくは純時間信号に対する応答を変更することなく、ラインフリッカーに対する視覚応答をシミュレートするために、複数の画像領域にわたってフィルタリングが行なわれる。
【0009】
本発明の技術は、添付図面を参照しながら以下の詳細な説明を考慮することによって容易に理解できる。
【0010】
(詳細な説明)
図1は、本発明を利用する信号処理システム100を示している。信号処理システムは、信号受信部130と、信号処理部110と、入/出力装置120と、試験用システム140とから成る。
【0011】
信号受信部130は、画像装置からの一連の画像、あるいは、マイクロフォンや記録媒体からの音声信号のように時間に伴なって変化する信号のような入力データ信号を受けるようになっている。従って、以下、画像に関して本発明を説明するが、本発明は前述するような他の入力信号に適用できることは言うまでもない。
【0012】
信号受信部130は、データ受信部132と、データ記憶部134とを有している。データ受信部130は、モデムやAD変換器といった多くの装置を有していてもよい。モデムは、AD変換器がアナルグ信号をデジタル信号に変換している間に、バイナリ・データを電話線あるいは他の通信チャンネルを通じて送受信するための変調装置及び復調装置を備える良く知られた装置である。従って、信号受信部130は、入力信号を「オンライン」で受信しても良く、あるいは、「リアルタイム」で受信しても良く、また、必要に応じて、これらをデジタル形式に変換してもよい。この場合、受信部130は、コンピュータ、カメラ、ビデオ、様々な医療画像装置のような1又は複数の装置から信号を受けることができる。
【0013】
データ記憶部134は、データ受信部132から受けた入力信号を格納するように作用する。データ記憶部134は、ディスクドライブ、半導体メモリ、他の記憶媒体といった1又は複数の装置を有している。これらの記憶装置は、入力信号に遅延を付与するための手段、あるいは、次の処理のために入力信号を単に記憶するための手段を与える。
【0014】
好ましい実施形態において、信号処理部110は多目的コンピュータを備えており、この多目的コンピュータは、画像処理を容易にするため、知覚距離ジェネレータ(あるいは、視覚差異測定器(VDM)として知られている)112と、中央演算処理装置(CPU)114と、メモリ116とを有している。知覚距離ジェネレータ112は、各種のフィルタあるいは通信チャンネルを通じてCPUに接続されるプロセッサによって構成された物理装置であってもよい。また、知覚距離ジェネレータ112は、入/出力装置120もしくはメモリ116から呼び出され且つ信号処理部のCPUによって実行されるソフトウェアアプリケーションとして実現することもできる。この場合、本発明の知覚距離ジェネレータは、コンピュータで読み取ることができる媒体に記憶することができる。
また、信号処理部110は、キーボード、マウス、ビデオモニタ、あるいは、ハードディスクドライブやコンパクトディスクドライブ等の磁気光学ドライブやディスケットもしくはテープを含むがこれらに限定されない記憶装置といった複数の入/出力装置120に接続される。入力装置は、入力画像を処理するための信号処理部に入力(制御信号及びデータ)を与えるようになっており、一方、出力装置は、その結果を表示もしくは記録するようになっている。例えば、出力装置は、知覚距離をディスプレイ上に表示する。
【0015】
知覚距離ジェネレータ112を使用する信号処理システム100は、人間の被験者が2つの信号配列に対して割り当てる知覚率、例えば劣化していないカラー画像配列に対する劣化したカラー画像配列の比率を予測することができる。知覚距離ジェネレータ112は、入力画像の2つの配列すなわちストリーム間の視程差を評価すると共に、配列間の知覚差の信号距離を含む複数の異なる評価を形成する。これらの差は、モデルにされた人間の最小可知差異(JND)距離の単位で定量化される。この距離は、JND値や、JNDマップすなわち確率予測として表わすことができる。続いて、CPU114は、JND画像距離を使用して、デジタル画像圧縮、画質測定、目標検知を含むがこれらに限定されない各種の処理を最適化することができる。
【0016】
例えば、入力画像配列は、2つの異なる経路もしくはチャンネルを通じて信号処理システム100に送られる。入力画像配列は、処理されることなく信号処理部に直接に送られる一方の経路を通る(基準チャンネル又は基準画像配列)と共に、画像配列を幾つかの形式で処理する試験用システム140を通じて送られる他の経路も通る(チャンネル試験又は試験画像配列)。信号処理システム100は、2つの画像配列間の差異を示す知覚距離を形成する。試験用システム140によって形成される歪みは、しばしば、経済的な理由に直面する。例えば、試験用システム140は、オーディオエンコーダもしくはビデオエンコーダになり得る。実際に、試験用システム140は、任意の数の装置もしくはシステム、例えばデコーダ、送信チャンネルそれ自信、オーディオもしくはビデオレコーダ、スキャナ、ディスプレイ、トランスミッタになり得る。このように、信号処理システム100は、基準画像配列に対する試験画像配列の主観的な質を評価し、これによって、エンコード処理、デコード処理、送信チャンネルもしくは「試験用システム」の歪みに関する情報を与えるために使用することができる。知覚距離ジェネレータ112を使用することにより、人間の観察者を使用することなく、基準画像配列に対する試験画像配列の主観的な質を評価することができる。
【0017】
また、知覚距離は、経路150を介して試験用システムのパラメータを修正もしくは制御するために使用できる。改良された知覚率、例えば、エンコードされた画像がデコードされる時には殆ど目立たない歪みを有するエンコードされた画像を形成するために、エンコーダのパラメータを修正することができる。また、試験用システム140は別個の装置として図示されているが、当業者であれば分かるように、試験用システムは、信号処理部のメモリ116内に存在するソフトウェアとして、例えばビデオエンコード法として実現することもできる。
【0018】
図2は、知覚距離ジェネレータ112の概略的なブロック図を示している。好ましい実施形態において、知覚距離ジェネレータは、入力信号処理部210と、輝度処理部220と、クロミナンス処理部230と、輝度距離形成部240と、クロミナンス距離形成部250と、知覚距離形成部260とを備えている。
【0019】
入力信号処理部は、入力信号250を、心理物理的に規定された量、例えば画像信号に関する輝度成分及びクロミナンス成分に変換する。入力信号は、任意の長さを有する2つの画像配列である。図2には入力信号が1つだけ図示されているが、入力信号処理部が2つ以上の入力信号を同時に処理できることは言うまでもない。入力信号処理部210の目的は、入力画像信号を複数の光出力に変換し、その後、これらの光出力を、輝度及びクロミナンスを別個に特徴付ける心理物理的に規定された量に変換することである。
【0020】
より詳細には、各入力配列の各領域に関し、例えばD1テープから得られるY’,Cb’,Cr’と名付けられた3つのデータセットが図2の上側に示されている。続いて、Y,Cb,Crデータは、表示されたピクセル値を生じる電子銃電圧R’,G’,B’に変換される。入力信号処理部内において、R’,G’,B’電圧は、更に処理を受けて、次の処理段階又は処理部に送られる1つの輝度及び2つのクロミナンス画像に変換される。
【0021】
輝度処理部220は、ディスプレイの最大輝度の一部として表わされる輝度Yの2つの画像(試験画像及び基準画像)を受け入れる。これらの出力は、輝度JNDマップを形成する輝度距離形成部240に送られる。JNDマップは、対応するピクセル位置での試験画像と基準画像との間のJND数に対して階調が比例する画像である。
【0022】
同様に、クロミナンス処理部230は、入力信号のクロミナンス成分をクロミナンス知覚距離へと処理する。より詳細には、クロミナンス処理部230は、CIEL***均等色空間(各クロミナンス画像u*及びv*に関して生じる)に基づき且つディスプレイの最大クロミナンスの一部として表わされるクロミナンスの2つの画像(試験画像及び基準画像)を受け入れる。次に、クロミナンスJNBマップを形成するために、u*及びv*処理の出力は、クロミナンス距離形成部250によって受けられて合成される。
【0023】
また、クロミナンス及び輝度の両方の処理は、輝度画像の構造に依存するある程度視認可能な知覚差を伝える経路225を介して輝度チャンネルから送られる「マスキング」と呼ばれる入力によって影響される。マスキング(セルフ又はクロス)は、1つのチャンネル又は隣接するチャンネル内に存在する情報における感度の低下を示す。
【0024】
クロミナンス、輝度、合成されたルマ−クロマのJNDマップはそれぞれ、これらのマップから得られる僅かな数のサマリーメジャーと共に、知覚距離形成部260への出力として利用可能である。1つのJND値(JNDサマリー)出力は、試験配列における観察者の総歪み率を形成するために使用されるが、JNDマップは、アーチファクトの位置及び強度のより詳細なビューを与える。続いて、知覚距離形成部260は、輝度知覚距離とクロミナンス知覚距離とを関係付けて、統合された知覚画像距離、例えば総最小可知差異(JND)マップを形成する。
【0025】
2つの基本的な仮定が本発明の根底にあることに注意する必要がある。第1に、各ピクセルは、「正方形」であり、0.03°の視角の範囲を定める。この数は、480個のピクセルの画面高さ及び4つの画面高さの観察距離(“Rec.500”規格によって規定される最も近い観察距離)から得られた。4つの画面高さよりも長い観察距離で、知覚距離ジェネレータが人間の近くと比較される場合、知覚距離ジェネレータは、空間的な詳細内容に対する人間の感度を過大評価する場合がある。従って、観察距離に関する厳しい制約が無い場合、知覚距離ジェネレータは、“Rec.500”の推奨値内で、できるだけ感度が良くなるように調整される。しかしながら、知覚距離ジェネレータの感度は、特定の用途のために調整可能である。
【0026】
第2に、知覚距離ジェネレータは、0.01〜100ft−L(全感度が較正された)の画面輝度に適用されるが、最大でも20ft−L(時空的な周波数が較正された)の精度である。また、全ての時空的な周波数で輝度変化が比例感度の変化を招くことを前提としており、この前提は、別の較正が生じる20ft−Lの近傍ではあまり重要ではない。較正及び実験データを以下に示す。
【0027】
以下、図3、4、5、6,及び図7を参照しながら、図2に示された処理部について詳細に説明する。
【0028】
図3は、入力信号処理部210のブロック図を示している。好ましい実施形態において、各入力信号は、4つの領域から成るセット305内で処理される。図3の上側においでY’,Cb’,Cr’と名付けられた4つの領域から成るスタックは、試験画像配列もしくは基準画像配列からの4つの連続する領域のセットを示している。しかしながら、本発明は、そのような形態に限定されず、他の領域をグループ化する方法を使用することもできる。
【0029】
入力信号処理部210には、複数の変換が含まれている。簡単に言えば、入力信号処理部210は、Y’,Cb’,Cr’ビデオ入力信号を、最初に電子銃電圧に変換し、その後、3つの蛍光体の輝度値に変換し、最後に、輝度成分とクロミナンス成分とに分離する心理物理的な変数に変換する。以下に演算される三刺激値Yは、クロミナンス処理前に使用される「モデル強度値」を置換する。また、クロミナンス成分u*及びv*は、CIE均等色仕様に従って、1ピクセル毎に形成される。
【0030】
入力信号が既に容認できる均等色空間内にある場合には、入力信号処理部210は随意的に実施することができる。例えば、入力信号は、予め適当な形式に処理されて磁気もしくは光学ドライバ及びディスク等の記憶装置に記憶されてもよい。また、本発明は、国際標準均等色空間CIELUVにマッピングされたピクセルを用いて実行されるが、本発明は、他の空間にマッピングされる入力信号を処理するようになっていてもよい。
【0031】
第1の処理段階310は、Y’,Cb’,Cr’データをR’,G’,B’銃電圧に変換する。より詳細には、以下に概略的に示されるステップは、Y’,Cb’,Cr’画像フレームからCRTディスプレイを駆動するR’,G’,B’電圧信号への変換を示している。ここで、アポストロフィは、入力信号がエンコーダで予めガンマ補正されたことを示している。すなわち、これらの信号は、変換後、電圧―電流変換関数をガンマ非線形化によって概算できるCRTディスプレイ装置を駆動することができる。
【0032】
入力デジタル画像は4:2:2のフォーマットであることを前提としている。すなわち、輝度に関する全解像度がY’の相互関係を示し、クロミナンスに関する水平半解像度がCb’及びCr’の相互関係を示す。この場合、Y’,Cb’,Cr’データは、ANSI/SMPTE Std.125M−1992で指定された順序で記憶されることを前提としている。すなわち、
C’b0,Y’0,C’r0,Y’1,C’b1,Y’2,C’r1,Y’3,…,C’bn/2-1,Y’n-1,C’rn/2- 1,Y’n-2,…
以下に列挙されたステップには、クロミナンスアップサンプリングに関する2つの実施形態すなわち選択肢と、Y’,Cb’,Cr’からR’,G’,B’へのマトリクス変換に関する3つの実施形態すなわち選択肢とが存在する。これらの選択肢は、様々な共通の条件、例えば様々な用途で遭遇するデコード条件を網羅する。
【0033】
すなわち、クロミナンスアップサンプリングの第1の実施形態においては、1つのフレームからのY’,Cb’,Cr’配列が受けられる。この場合、Cb’,Cr’配列はY’画像の全解像度へ拡張される。Cb’,Cr’配列は、初めに、水平半解像度であり、その後、全解像度領域を形成するためにアップサンプルされる。すなわち、列内のCb’,Cr’ピクセルは、データストリーム内の偶数Y’iに割り当てられる。その後、偶数Y’iに関連付けられたCb’,Cr’の対は、(i)複製によって、あるいは、(ii)その隣りと加算平均される
ことによって、演算される。
【0034】
クロミナンスアップサンプリングの第2の実施形態においては、全解像度Y’,Cb’,Cr’配列が2つの領域に分配される。Y’の場合、第1の領域はY’配列の奇数ラインを含んでおり、第2の領域はY’配列の偶数ラインを含んでいる。第1及び第2のCb’,Cr’領域を形成するために、Cb’,Cr’に関して同一の処理が行なわれる。
【0035】
Y’,Cb’,Cr’からR’,G’,B’へのマトリクス変換において、対応するY’,Cb’,Cr’値は、2つの領域のそれぞれの各ピクセルのための銃入力値R’,G’,B’に変換される。Y’,Cb’,Cr’値は、以下の3つの選択的な方程式のうちの1つによって、R’,G’,B’値に関連付けられるように得られる。最初の2つの方程式は、1996年のサンディエゴのハイテキスト、ケースジャックによるV i deo Demystified(第3章、40〜42頁)に記載されている。方程式(3)は、1996年のC.A.ポイントンによるA Technical Introduction to D i gital V i deoの176頁にある方程式9.9に対応している(UをCbに置き換えると共に、VをCrに置き換えた)。好ましい実施形態において、方程式(2)は、対象のディスプレイの大きさが他を表示しない場合に使用されるべき初期値として選択される。
【0036】
【式3】
Figure 0004450516
【0037】
R’,G’,B’配列は、その後、入力信号処理部210内の第2の処理段階320によって受けられる。第2の処理段階320は、各R’,G’,B’画像に対して点非線形化を適用する。この第2の処理段階は、R’,G’,B’銃電圧をディスプレイ(最大輝度の一部)の強度(R,G,B)に変換する。また、非線形化は、ディスプレイによって各面内の低い輝度でクリッピングを行なう。
【0038】
すなわち、(R’,G’,B’)と(R,G,B)との間の変換は、2つの部分を含んでいる。そのうちの1つは、各ピクセル値を独立に変換し、他の1つは、変換されたピクセル値に関して空間的なフィルタリングを行なう。以下、これらの2つの部分について説明する。
【0039】
ピクセル値変換
最初に、入力R’に対応する最大輝度Rの一部が各ピクセルに関して演算される。同様に、部分輝度G,Bが入力G’,B’から演算される。各銃からの最大輝度は、入力値255に一致すると仮定する。以下の方程式は、(R’,G’,B’)から(R,G,B)への変換を示している。
【0040】
【式4】
Figure 0004450516
【0041】
初期値閾値tdは、ディスプレイの黒色レベルと一致するように16に選択される。また、γは2.5に初期設定される。
【0042】
dに関する値16は、約1000:1である(255/16)2.5のダイナミックレンジをディスプレイに与えるために選択される。このダイナミックレンジは、比較的大きく、周囲の輝度が最大表示白色の約1%である場合には必ずしも必要ない。従って、知覚ジェネレータが黒色レベルとして値16の代わりに100:1のダイナミックレンジを与える値40を使用する場合であっても、物理的な信頼性が維持される。実際に、低いダイナミックレンジは、演算サイクルを節約できる。例えば、処理中、1つ又は2つのビットを節約できる。
【0043】
ディスプレイについての2つの所見について以下に説明する。第1の所見は、絶対画面輝度への依存を含んでいる。知覚距離ジェネレータの予測は、知覚距離ジェネレータが較正された輝度レベルだけに暗に適用される。
【0044】
典型的な較正データ(J.J.Koenderink and A.J.van Doorn,"Spatiotemporal contrast detection threshold is bimodal."Optics Lett e rs 4,32-34(1979))に関し、直径2mmの初期設定の瞳孔を使用して、網膜輝度は200トロランドであった。これは、63.66cd/m2すなわち18.58ft−Lの画面輝度を示している。較正輝度は、主観的な評価テストで使用されるディスプレイの輝度と比較できる。例えば、2つの実験の最大白色輝度は71及び97ft−Lであったが、ピクセル値128での輝度はそれぞれ15及び21ft−Lであった。これらの値を考慮し、また、知覚距離ジェネレータの全感度が0.01ft−Lから100ft−Lに較正(F.L.van Nes, J.J.Koenderink, H.Nas, andM.A.Bouman,."Spatiotemporal modulation transfer in the human eye," J.Opt.Soc.Am.57,1082-1088(1967)のデータを使用して)された事実を考慮すると、知覚距離ジェネレータが約20〜100ft−Lの画面輝度に適用されると言える。
【0045】
第2の所見は、方程式(4)と他のモデルとの関係を含んでいる。オフセット電圧td(例えば、陰極とTV画面との間のグリッド設定からのオフセット電圧)は、方程式(4)をポイントン(C.A.Poynton, "Gamma" and its disguises: The nonlinear mapping of intensity in perception,CRTs, Film, and Video,SMPTE Journal, December 1993,pp1099-1108)によって提案されたモデルに変換するために使用できる。ここで、R=k[R’+b]γ(G及びBも同様)である。新しい電圧R’’=R’−tdを規定することによってポイントンのモデルが得られる。従って、R=k[R’’+tdγであり、G及びBも同様である。ポイントンの方程式ではなく、方程式(4)を書くことによって、オフセット電圧が−tdであると仮定する。また、周囲に照度が無いと仮定する。
【0046】
周囲に照度cが存在する場合、電圧オフセットを無視することができ、方程式(4)は、マイヤーによって提案されたモデル("The importance of gun balancing in monitor calibration," in Perceiving, Measuring, and Using Color (M.Brill,ed.),Proc.SPI,Vol.1250,pp.69-79(1990))と略等しくなる。すなわち、R=kR’γ+cとなる。同様の式がG及びBに適用される。周囲に照度が存在する場合には、方程式(4)はマイヤーのモデルに取って代えることができる。この場合、k=(1/255)γであり、c=0.01である。
【0047】
知覚距離ジェネレータは、各フレーム(連続画像内の)と奇数及び偶数領域(組合せ画像(インターレース画像)内の)とに関し、(R,G,B)画像の垂直表示を特定するために3つの選択を与える。
【0048】
選択1.フレーム
画像は、全高さであり、漸次走査される1つの画像を含む。
【0049】
選択2.全高組合せ(全高インターレース)
全高画像は、空白ラインで撒き散らされ、組み合わされた画像内にある時に全高さとなる。空白ラインは、後述するように、内挿法によって実質的に満たされる。
【0050】
選択3.半高組み合わせ(半高インターレース)
半分の高さの半高画像が直接に処理される。
【0051】
最初の2つの選択は、ビデオ画像構造に対して非常に信頼性がある。これに対し、3番目の選択は、処理時間及び記憶条件を50%低減できる利点がある。輝度及びクロミナンス処理は、全高画像上で演算するため、選択1及び選択2に関しては同じである。以下、これらの3つの選択について詳述する。
【0052】
空間的なプレフィルタリング
空間的な予備処理は、選択1及び選択3においては不要である。しかしながら、全高組合せの選択2に関しては、空間的なプレフィルタリングが存在する。
【0053】
1つの領域内でラインからライン間のピクセルへの光の広がりに対応するため、R,G,B領域画像にライン内挿(補間)処理が施される。4つの異なる内挿法が以下に示されているが、本発明はこれらの内挿法に限定されない。各方法においては、全てのフレームが読み取られ、その後、不活性領域に属するライン上の各ピクセルは、直ぐ上下のピクセルから演算される値に取って代えられる。方法(3)(4)においては、不活性領域からのピクセル値を使用して演算がなされる。
【0054】
inactiveは、内挿される不活性ラインピクセルを示し、Pabove及びPbelowは、活性ラインピクセルの上下のPinactiveをそれぞれ示している。4つの方法は、
(1)平均
【0055】
【式5】
Figure 0004450516
(2)いずれか一方
【0056】
【式6】
Figure 0004450516
(3)ハイブリッド平均
【0057】
【式7】
Figure 0004450516
(4)中間値
【0058】
【式8】
Figure 0004450516
【0059】
方法(1)の平均は初期値である。
【0060】
図3に戻ると、非線形処理に続いて、第3の処理段階330は、領域R,G,B内のライン間の値を上下から挿入された値で置き換えることにより、ライン間の位置に広がる垂直な電子ビームスポットを形成する。その後、領域内の各ピクセルのベクトル(R,G,B)は、CIE1931三刺激座標(X,Y,Z)に線形変換(ディスプレイ蛍光体に依存する)される。このベクトルの輝度成分Yは、前述したように、輝度処理部220に送られる。
【0061】
すなわち、部分輝度値R,G,Bが与えられると、各ピクセルに関してCIE1931三刺激値X,Y,Zが演算される。この処理は、ディスプレイ装置に依存する次の入力、すなわち、3つの蛍光体の色度座標(xr,yr),(xg,yg),(xb,yb)及びモニタ白色点(xw,yw)の色度を必要とする。
【0062】
白色点は、(xw,yw)=(0.3128,0.3292)(G.Wyszecki and W.S.Stiles,Color Science,2nded.,Wiley,1982,p.761を参照)となるような発光体D65に対応するものとして選択される。赤、緑、青のそれぞれの蛍光体に関する値(xr,yr)=(0.6245,0.3581)、(xg,yg)=(0.2032,0.716)、(xb,yb)=(0.1465,0.0549)は、NTSC蛍光体に非常に近似する現在入手可能な蛍光体に対応している。しかしながら、以下の表1は、他のディスプレイ蛍光体座標(蛍光体の主色度)の選択を示している。ITU―R BT.709(Rec.709)は初期値である。
【0063】
【表1】
Figure 0004450516
表1 ディスプレイ蛍光体座標オプション
【0064】
上記パラメータ値を使用すると、ピクセルの値X,Y,Zは、以下の方程式によって与えられる。
【0065】
【式9】
Figure 0004450516
【0066】
ここで、zr=(1−xr−yr),zg=(1−xg−yg),zb=(1−xb−yb)であり、Y0r,Y0g,Y0bは以下の方程式によって与えられる。
【0067】
【式10】
Figure 0004450516
ここで、zw=(1−xw−y)(D. Post, Colorimetric measurement, calibration, and characterization of self-luminous displays, in Color in Electronic Displays, H. Widdel and D. L. Post(eds), Plenum Press,1992,p.306を参照)である。
【0068】
装置の白色点の三刺激値Xn,Yn,Znも必要である。これらの値は、色度(xw,yw)に対応しており、全ての蛍光体が活性の時(R’=G’=B’=255)にY=1である。従って、白色点の三刺激値(Xn,Yn,Zn)=(xw/yw,1,zw/yw)となる。
【0069】
値X,Y,Zを得る随意的な最後の段階では、ディスプレイの画面からの光幕反射に依存する想定される周囲の光に対応するように調整することができる。この調整は以下の式を利用する。
【0070】
【式11】
Figure 0004450516
ここで、ユーザーが指定できる2つのパラメータLmax及びLdは、導入されて割り当てられるデフォルト値である。ディスプレイの最大輝度Lmaxは、市販のディスプレイに対応するように100cd/m2に設定される。水による光の消散Ldは、Rec500状態で測定される画面値に一致する5cd/m2に設定される。
周囲の光の色度は、ディスプレイの白色点のそれと同じであると仮定する。中点(Xn,Yn,Zn)を演算しない輝度のみの実施選択においては、方程式(6a)の代わりに、以下の調整がなされる。
【0071】
【式12】
Figure 0004450516
これは、Ynが常に1であるため、方程式(6a)のY成分と等しい。また、量Lmax *Yは、ディスプレイの輝度(cd/m2)である。
【0072】
図3に戻ると、等発光色差(isoluminant color difference)に対する色空間のおおよその知覚均一性を(各ピクセルで)確保するため、第4の処理段階340において、個々のピクセルが国際標準均等色空間CIELUV(Wyszecki and Stiles,1982を参照)にマッピングされる。この空間のクロミナンス成分u*,v*は、クロミナンス処理部230に送られる。
【0073】
すなわち、X,Y,Z値は、ピクセル毎に、1976CIELUV均等色システム(Wyszecki and Stiles,1982,p.165)に送られる。すなわち、
【0074】
【式13】
Figure 0004450516
【0075】
【式14】
Figure 0004450516
【0076】
座標L*は輝度処理部220に送られない。L*は、クロミナンス座標u*及びv*を演算する時だけに使用される。その結果、u*画像及びv*画像だけが更なる処理のために記憶される。
【0077】
図4は、輝度処理部220のブロック図を示している。図4は、輝度処理段階のフローチャートとして、あるいは、そのような輝度処理段階を実行するためのフィルタ等の複数のハードウェア部品、各種の回路部品、特定用途向け集積回路(ASIC)のブロック図として理解することができる。
【0078】
図4に示されるように、心理物理的及び生理学的に観察される入力視角信号の異なる空間的な周波数帯域412〜418への分解を形成するために、各輝度領域は、フィルタを通って、4つのレベルのガウスピラミッド410内にダウンサンプリングされる。分解後、次の随意的な処理が実行される。例えば、各ピラミッドレベルに適用される方向付けられたフィルタリングが行なわれる。
【0079】
次に、非線形化演算430がピラミッド分解の直後に行なわれる。この段階は、最も粗いピラミッドレベル内における最大輝度の(領域にわたる)時間に依存するウインドウ平均に基づいたゲイン(増幅率)設定操作(正規化)である。この正規化は、知覚距離ジェネレータの全てのゲインを設定し、明るいシーンから暗いシーンへの移行後の視覚感度損失といった効果を形成する。
【0080】
中間の正規化処理420は、中間値Inormを得るために実行される。Inorm値は、後述するように、4つの各ピラミッドレベルを縮尺するために使用される。
【0081】
正規化後、解像度が最も低いピラミッド画像418は、時間フィルタリング・コントラスト演算450を受ける。他の3つのレベル412〜416は、空間フィルタリング・コントラスト演算440を受ける。それぞれの場合、コントラストは、適切に縮尺された局所的な総和によって分割されるピクセル値の局所的な差異である。知覚距離ジェネレータの定式化において、これは、知覚距離ジェネレータの次の段階に進められる“1JND”の定義を定めた(後述する中間の知覚距離ジェネレータ段階で、較正が1−JNDの解釈を反復的に修正する)。それぞれの場合、コントラストエネルギとして知られているものを形成するために、コントラストが二乗される。コントラストの算術符号は、画像比較(JNDマップ演算)の直前の再付与のために保たれる。
【0082】
次の段階460,470(コントラストエネルギマスキング)は、更なるゲイン設定操作を構成する。このゲイン設定操作では、方向付けられた各応答(コントラストエネルギ)が全てのコントラストエネルギの関数によって割られる。他の局所定な応答による各応答のこの複合減衰は、“ビジー”画像領域内の歪みに対する感度の減少といった視覚的な“マスキング”効果を形成するために含まれている。知覚距離ジェネレータのこの段階では、空間的な差異をマスクするために時間的な構造が形成される。また、時間的な差異をマスクするために空間的な構造が形成される。また、後述するように、輝度マスキングはクロミナンス側にも適用される。
【0083】
マスクされたコントラストエネルギ(コントラストサインと共に)は、輝度JNDマップ480を形成するために使用される。簡単に言うと、輝度JNDマップは、1)各画像をプラス成分及びマイナス成分に分割する(半波長調整)ことによって、2)局所的なプーリングを行なう(心理物理的な実験で観察される局所空間的な合計(サム)を形成するために、加算平均及びダウンサンプリングする)ことによって、3)チャンネル毎に絶対画像差を評価することによって、4)閾値を設定する(コアリング)ことによって、5)コアリングされた画像差を電力へと引き上げることによって、6)同じ解像度(プーリング段階に起因して、原画像の解像度の半分である)までアップサンプリングすることによって形成される。
【0084】
図19は、輝度処理部220の他の実施形態を示している。より詳細には、図4の正規化段階420,430が輝度圧縮段階1900に取って代えられている。簡単に言うと、入力信号における各輝度値は、最初に、後述するように圧縮非線形化される。図19の他の段階は図4のそれと同様である。従って、これらの同様の段階については既に前述した。以下、異なる段階である図19の輝度処理部について、図20を参照しながら詳細に説明する。
【0085】
一般に言って、図19の輝度処理部は好ましい実施形態である。しかしながら、これらの2つの実施形態は、異なる特性を示すため、異なる用途においてはその性能が異なる場合がある。例えば、図4の輝度処理部は、低いダイナミックレンジと比較して、高いダイナミックレンジで、例えば10ビット入力画像で、良好に機能することが分かった。
【0086】
図5は、クロミナンス処理部230のブロック図を示している。図5は、クロミナンス処理段階のフローチャートとして、あるいは、そのようなクロミナンス処理段階を実行するためのフィルタ等の複数のハードウェア部品、各種の回路部品、特定用途向け集積回路(ASIC)のブロック図として理解することができる。幾つかの局面において、クロミナンス処理は輝度処理と平行する。CIELUV空間のクロミナンスの画像(u*502及びv*504)間の差異は、クロミナンス演算のための検出閾値を規定するために使用される。その方法に類似して、マイケルソンコントラスト(及びウェーバの法則)は、輝度処理部内で検出閾値を規定するために使用される。また、輝度演算と同様に、u*とv*との差によって規定される有色の“コントラスト”には、マスキング演算が成される。トランスデューサ非線形化は、2つの画像に共通するコントラストエネルギに依存する、一方の画像と他方の画像との間のコントラスト増の差異を形成する。
【0087】
より詳細には、図5は、輝度処理部と同様に、ピラミッド分解処理510が成される各クロミナンス成分u*502及びv*504を示している。しかしながら、好ましい実施形態においては、輝度処理が4つのピラミッドレベル分解を成していたが、クロミナンス処理は7つのレベルで行なわれる。このような実行は、クロミナンスチャンネルが輝度チャンネルよりも非常に低い空間周波数に対して感度がよい(K.T. Mullen, "The contrast sensitivity of human colour vision to red-green and blue-yellow chromatic grating," J. Physiol. 359,381-400,1985)という経験的な事実を示している。また、そのような分解は、広い均一な領域で色差を観察できるという直感的な事実を考慮に入れている。
【0088】
次に、フリッカーに対するクロミナンスチャンネルの固有の無感覚を反映するために、4つの画像領域にわたって加算平均することによって、時間的な処理520が成される。
【0089】
その後、u*及びv*に関して、ラプラスカーネルによる空間フィルタリング530が行なわれる。この演算は、最小可知色差と計量的に関連する(均等色空間によって)u*,v*内に色差を形成する。この段階の値1は、ウェーバの法則を基本とする輝度チャンネル内のコントラストの役割と同様に1つのJNDが達成されることを意味するために必要である(輝度処理の場合と同様に、1―JNDクロミナンス単位(ユニット)は、較正中において、再解釈されなければならない)。
【0090】
この色差値は、加重され、二乗されて、(コントラスト算術符号を用いて)コントラストエネルギマスキング段階540に送られる。このマスキング段階は、輝度処理部の場合と同じ機能を果たす。演算は、輝度チャンネル及び差異が評価されるクロミナンスチャンネルからだけ入力を受けるため、幾分簡単である。また、段階550でクロミナンスJNDマップを形成するために、マスクされたコントラストエネルギは、輝度処理部と同様に送られる。
【0091】
ビデオ配列内の各領域の比較において、輝度及びクロミナンスJNDマップは、最初に、1つの番号のサマリー、すなわち、輝度及びクロミナンスJND値まで減少される。それぞれの場合、マップから番号への減少は、ミンコフスキー加算によって全てのピクセル値を加算することによって行なわれる。その後、知覚距離形成部260によって処理される領域のためのJND評価を形成するために、輝度及びクロミナンスJND番号は、ミンコフスキー加算によって再び組み合わされる。ミンコフスキー感覚で、各領域に関するJND評価を加算することによって、ビデオ配列の多くの領域のための1つの性能指標270が決定される。
【0092】
図6は、図4の輝度処理部220の詳細なブロック図を示している。入力する試験領域画像及び基準領域画像がそれぞれI及びIref で示されている(k=0,1,2,3)。I及びIref のピクセル値はそれぞれ、I(i,j)及びIref (i,j)によって示されている。これらの値は、入力信号処理部210で演算された三刺激値Y605である。Iref の処理は同一であるため、以下、領域Iについてのみ説明する。K=3は、4領域配列内の最も新しい領域を示している。
【0093】
4つの分解レベルでの空間分割は、連続的に粗い解像度のレベルでそれぞれ2因子だけ画像を不鮮明にしてダウンサンプリングするピラミッド処理もしくはピラミッド分解と呼ばれる効率的な計算方法によって行なわれる。初期の全解像度画像は、ピラミッドの0レベル(レベル0)G0=Ij(i,j)と呼ばれる。低い解像度での次のレベルは、REDUCEと呼ばれる演算によって得られる。すなわち、不鮮明な画像を形成するために、加重(1,2,1)/4を有する3タップの低域フィルタ610が画像の各方向で連続的にG0に適用される。その結果得られた画像は、その後、(他のピクセルが除去される度に)2因子だけサブサンプルされて、次のレベルG1が形成される。
【0094】
1つのピラミッドレベルによってフィルタリング及びダウンサンプリングする演算をfds1()で表わすと、REDUCE処理は以下のように表わすことができる。
【0095】
【式15】
Figure 0004450516
【0096】
REDUCE処理は、新しい各レベルに対して帰納的に適用される(P. J. Burt and E. H. Adelson, "The Laplacian pyramid as a compact image code," IEEE Transactions on Communications, COM-31,532-540(1983)によって開示されているように適用される)。
【0097】
逆に、アップサンプルしてフィルタをかける演算EXPANDは、同じ3×3カーネルによって規定される。この演算は、usf1()によって示され、以下のように行なわれる。
【0098】
各方向(水平及び垂直)におけるfds1及びusf1フィルタカーネルはそれぞれ、kd{1,2,1}及びku{1,2,1}である。ここで、kd及びkuは、均一領域値が格納されるように選択される。fds1に関して、定数はkd=0.25であり、usf1に関して、定数はku=0.5(アップサンプルされた画像内の複数の0のため)。インプレース演算(in-place operation)としてusf1を実行するために、カーネルが等価な内挿法によって取って代えられ、0を置換する。しかしながら、概念的な簡素化のため、それを“アップサンプルフィルタ”と称することができる。
【0099】
次に、正規化が成される。この場合、中間値(I[v]3によって示される)は、4つの値、すなわち、各領域(k=0,1,2,3)におけるレベル3画像内の最大ピクセル値を加重平均することによって演算される。このステップは、ピラミッド分解処理固有のスムージングによって、全解像度(レベル0)画像におけるアウトライアー効果を和らげる。その後、I[v]3は、先のエポック(k=2)で使用された正規化因子Inormの減少された値と比較される。現在のエポック(k=3)におけるInormは、これら2つの値のうちの大きい方と等しく設定される。最新の領域における4つの全てのピラミッドレベルに関する画像は、その後、この新しい値Inormを使用することによって縮尺され、飽和非線形化(saturating nonlinearity)がなされる。
【0100】
以下の方程式はこのプロセスを示している。上からのピラミッドレベルがIM(i,j)である場合には、
【0101】
【式16】
Figure 0004450516
【0102】
ここで、3及び1は、最新の領域及びピラミッドレベルをそれぞれ示している。Icarm=[μIcarm・I]615であり、Icarmは、領域の3つのピラミッドレベルを正規化するために先のエポックで使用されたIcarmの値である。mは2に初期設定する。
【0103】
【式17】
Figure 0004450516
【0104】
Δtは領域周波数の逆数であり、thalf=1/2は、明るい刺激を除去した後の人間視覚システムの順応速度に関連付けられる。50Hz及び60Hzにおける値はそれぞれ0.9727、0.9772である。定数LDは、光の非存在下で存在する残留視覚応答(ノイズ)を示しており、0.01の値に初期設定される。方程式(14)における飽和非線形化は、生理学に基づくモデル(Shapley and Enroth-Cugell,1884を参照)から得られる。
【0105】
方向付けられた空間フィルタ(中心及び周囲)は、領域3におけるレベル0,1,2の画像に適用される。逆に、時間フィルタは、最も低い解像度レベル(レベル3)に適用される。すなわち、最初及び最後の領域対は、Early画像及びLate画像へとそれぞれ線形に組み合わされる。
【0106】
中心及び周囲のフィルタ625,627は、別個の3×3フィルタであり、方向の全ての組合せ、すなわち、中心垂直(CV)、中心水平(CH)、周囲垂直(SV)、周囲水平(SH)を形成する。フィルタカーネルは以下の通りである。
【0107】
【式18】
Figure 0004450516
【0108】
レベル3のEarly画像630及びLate画像632はそれぞれ以下の通りである。
【0109】
【式19】
Figure 0004450516
【0110】
60Hzにおける定数t0及びt1はそれぞれ、0.5161、0.4848であり、50Hzにおける定数t0及びt1はそれぞれ、0.70、0.30である。
【0111】
コントラスト演算における入力は、中心画像及び周囲画像CVi,CHi,SVi,SHi(ピラミッドレベル0,1,2に関してi=0,1,2)及びEarly画像E3及びLate画像L3(ピラミッドレベル3に関して)である。コントラスト比を演算するために使用される方程式は、マイケルソンコントラストに類似している。垂直方向及び水平方向において、ピクセル毎のコントラストはそれぞれ以下の通りである。
【0112】
【式20】
Figure 0004450516
【0113】
同様に、時間成分におけるコントラスト比は以下の通りである
【0114】
【式21】
Figure 0004450516
【0115】
生理学的な試験データを用いて較正することによって決定されるように、i=0,1,2,3におけるwiの値はそれぞれ、0.0015,0.0022、0.0015、0.003である。
【0116】
水平及び垂直のコントラストエネルギ画像640,642は、先の2つの方程式によって規定されるピクセル値を二乗することによって以下のように演算されて得られる。
【0117】
【式22】
Figure 0004450516
【0118】
同様に、時間コントラストエネルギ画像650は、ピクセル値を二乗することによって以下のように得られる。
【0119】
【式23】
Figure 0004450516
【0120】
二乗する前の各コントラスト比ピクセル値の算術符号は、後の使用のために保持される。
【0121】
コントラストエネルギマスキングは、方程式(21)(22)を用いて演算される各コントラストエネルギすなわち画像に適用される。マスキング演算は、試験画像配列における歪みの差異に関し、基準画像配列内に時空的構造の効果を形成する。
【0122】
例えば、試験画像及び基準画像は、振幅が小さい空間的な正弦波によって異なる。この差異は、両方の画像が均一の領域を有している場合よりも、両方の画像が共通に同じ空間周波数の中間コントラストの正弦波を有している時の方が良く視認できる、ことは知られている(Nachmias and Sansbury,1974)。しかしながら、共通の正弦波のコントラストが非常に大きい場合には、画像差を殆ど視認できなくなる。それは、他の空間周波数を有する正弦波が、コントラスト差の可視性に影響を及ぼすことができる場合である。このような性質は、低いコントラストエネルギではS字状を成す非線形化によって形成することができ、また、高いコントラストエネルギにおいては増大するべき関数によって形成することができる。また、以下の基準は、おおよそ人間の視力で観察することができる。各チャンネルはそれ自体をマスクし、高い空間周波数は低い空間周波数をマスクし(しかし、その逆ではない)、時間フリッカーは、空間的なコントラスト感度をマスクする(これは逆もあり得る)。前述した空間フィルタリングは、純空間画像もしくは純時間画像に対する応答を乱すことなく、複数の画像(例えば2つの画像領域)からの情報を処理することによって点もしくは線のフリッカーに対して応答できるように、高められ得る。
【0123】
方程式(19)を一般化すると、本発明は、方程式(16)によって規定されたカーネルCH,SH,CV,SVをそれぞれ領域2における画像ピラミッドに適用する結果として、ピラミッドCH2,SH2,CV2,SV2を規定すると共に、方程式(16)によって規定されたカーネルCH,SH,CV,SVをそれぞれ領域3における画像ピラミッドに適用する結果として、ピラミッドCH3,SH3,CV3,SV3を規定する。
【0124】
図28のブロック図に示されるように、本発明は、これら全ての演算子を、例えば4領域画像配列の最後の2つの領域(ピラミッドとして記憶されている)に適用する。演算子を適用する前に、ダウンサンプラー2802を使用して画像配列がダウンサンプリングされる。その後、ピラミッドレベルは、領域2及び領域3の情報が別個に形成される2804のような画像領域プロセッサ内で処理される。各領域はそれぞれ、領域2フィルタ2806及び領域3フィルタ2808に通される。すなわち、図6に関して説明したように、フィルタ625,627を使用して、前述した演算子が適用される。
【0125】
より詳細には、他の実施形態2800は、方程式(19)と全く同じ形態で、ピラミッドレベルi=0,1,2に関し、コントラストコンピュータ2810を使用して、以下の方向付けれたコントラストを規定することによって2つの領域からの情報を使用してコントラスト比較を行なう。
【0126】
【式24】
Figure 0004450516
【0127】
更に、コントラスト情報は、非線形プロセッサ2812によって送られる。プロセッサ2812は、時間フィルタ2814(図6において説明したと同様に演算する)の出力及びコントラスト情報の両者を処理して、輝度JNDマップ2816を形成するために使用される情報を形成する。以下、JNDマップを形成するために使用される処理について説明する。
【0128】
新しい係数wSTγを見出すために、複数の領域プロセスは、Koenderink and van Doorn(1979)のデータに関して較正される。これらの全てのコントラストは、純空間変動もしくは純時間変動を有する任意の刺激において0である。
【0129】
最後に、本発明は、他の空間チャンネルに関して既に使用されたと同じマスキング形式を組み込んでいる。
【0130】
人間の視力の特性に応じて、非線形化(ピクセル毎に適用される)660の以下の式が適用される。
【0131】
【式25】
Figure 0004450516
ここで、yはマスクされるコントラストエネルギ、すなわち、空間Hi又はVi(方程式(21))あるいは時間(T)(方程式(22))である。量Diは、yが属するピラミッドレベルiに依存する画像を示している(ピクセル毎に)。量β,σ,a,cは、知覚距離ジェネレータ較正によって見出され、それぞれ、1.17、1.00、0.0757、0.4753であった。また、dyは、それが二乗される前のコントラストyに固有の算術符号である。
【0132】
iの演算は、ピラミッド構成(フィルタリング及びダウンサンプリング)及びピラミッド再構成(フィルタリング及びアップサンプリング)の両方を必要とする。Diのこの演算が図6に示されている。最初に、H0及びV0の合計(サム)としてE0が演算される。この合計(サム)は、段階625によってフィルタに通されてダウンサンプリングされ、E1を与えるためにH1+V1に加えられる。次に、E1は、更に、フィルタに通されてダウンサンプリングされ、E1を与えるためにH2+V2に加えられる。続いて、E2がフィルタに通されてダウンサンプリングされ、E3が与えられる。一方、時間コントラストT3の画像は、mが掛け合わされて、mft3に加えられ、これによって、D3で示される合計(サム)が形成される。
【0133】
続いて、T2,T1,Tγを形成するために、D3は、段階654によって、繰り返しアップサンプリングされてフィルタに通される。最後に、画像Diは、Di=mii+Ti,i=0,1,2として規定される。ここで、mは、0.001と等しくなるように較正によって決定される。mftは0.0005と等しく設定され、mは0,05と等しく設定される。フィルタリングステップ、ダウンサンプリングステップ、アップサンプリングステップは、先に説明したものと同じである。
【0134】
前述したプロセスは、高い空間周波数が低い空間周波数をマスクし(なぜなら、Diは、i以下のピラミッドレベルによって影響されるからである)、時間チャンネルが全ての空間チャンネルによってマスクされることを示している。このマスキング演算は、一般に、心理物理的観察と一致している。また、量Di,i=0,1,2は、クロミナンスコントラストを以下のようにマスクする(逆ではない)。
【0135】
図20は、図19の輝度処理部の他の実施形態の詳細なブロック図を示している。図19の輝度処理部は図6の輝度処理部の段階と同様の多くの段階を含んでいるため、以下、異なる段階についてのみ説明する。
【0136】
1つの重要な違いは、図6の正規化段階が図20では輝度圧縮(圧縮非線形化)段階2000に置き換わっている点である。すなわち、非線形化は、定数によってオフセットされた減少するべき関数を備えている。最後の領域からの相対輝度配列をY3(i,j)とすると、以下のようになる。
【0137】
【式26】
Figure 0004450516
ここで、3は最後の領域を示している。ディスプレイの最大輝度Lmaxは、100cd/m2に設定される。従って、調整可能なパラメータm及びLDは、それぞれ0.65及び7.5cd/m2となる。すなわち、Ld及びmの値は、0.01〜100ft−Lの輝度レベルでコントラスト検出データと一致するように選択された(van Nes and Bouman,1967)。言い換えると、方程式(23a)により、絶対輝度に対して較正することが可能になる。例えば、ディスプレイの最大輝度の変化は、全輝度出力に影響を与える。方程式(23a)を他の方向から眺めると、この方程式によって、知覚距離ジェネレータは、輝度に依存するコントラスト感度関数を組み込むことができる。
【0138】
また、別の輝度圧縮段階2000(図20に破線で示されている)を各ピラミッドレベルに挿入して、知覚距離ジェネレータが輝度及び空間周波数の両方に応じてコントラスト感度を形成できるようにしてもよい。そうしないと、他の空間周波数を形成する場合に、2つのパラメータだけを用いた輝度圧縮段階2000の実行では不充分となる。
【0139】
より詳細には、各輝度画像のピラミッド分解後に、非線形化が各ピラミッドレベルkに適用される。その後、ピラミッドレベルkに関して、以下の式によって圧縮非線形化が与えられる。
【0140】
【式27】
Figure 0004450516
【0141】
ここで、再び、m(k)及びLD(k)は、0.01〜100ft−Lの輝度レベルでコントラスト検出データと一致するように選択される(van Nes and Bouman,1967)。値Laは、周囲の画面輝度におけるオフセットである(画面の大きさに基づいて5cd/m2に設定される)。また、Lmaxは、ディスプレイの最大輝度である(一般に、約100cd/m2である)。
【0142】
方程式(23b)を較正するためのデータは、以下のように、表にされている。
【0143】
【表1】
Figure 0004450516
【0144】
【表2】
Figure 0004450516
【0145】
上記表における各コントラスト変調Cは、空間周波数fsと網膜輝度I0とから成る正弦波の最小識別可能コントラストになる実験値である。2mmの人工瞳孔が較正に使用されるため、網膜輝度(I0トロランド)は、輝度値(Lcd/m2)を検索するように・で掛け合わされる。較正における良好な開始点は、全てのm(k)及びLD(k)に関して、8c/deg正弦波検出における初期値を使用することである。この場合、適当な指数mは0.65であり、適当なLDの値は7.5cd/m2である。
【0146】
輝度の空間及び時間フィルタリングは、図6及び図20の知覚距離ジェネレータの場合と同様である。しかしながら、図20の知覚距離ジェネレータにおける輝度コントラスト演算は、二乗演算することなく達成される。段階640,642,650は、図20では、段階2040,2042,2050に取って代えられている。
【0147】
より詳細には、コントラスト応答画像は、前記方程式(19)(20)によって規定される量の絶対値の短縮バージョンとして演算される。
【0148】
【式28】
Figure 0004450516
【0149】
絶対値演算の前における各コントラスト比ピクセル値の算術符号もまた、その後の使用のために保持しなければならない。
【0150】
図6の知覚距離ジェネレータと図20の知覚距離ジェネレータとの間の他の相違は、コントラストエネルギマスキングの実施である。図6と異なり、図20の知覚距離ジェネレータは、2つの別個の段階で、すなわち、水平チャンネル及び垂直チャンネルのそれぞれにおけるクロスマスキング段階とセルフマスキング段階とで、コントラストエネルギマスキング2060を実行する(図20参照)。セルフマスキングは、現在のチャンネル内の情報の存在下で、感度を減少する。一方、クロスマスキングは、隣りのチャンネル内の情報の存在下で、感度を減少する。実際に、これら2つの別個のマスキング段階の順序は逆であってもよい。これらのコントラストエネルギマスキングは、以下の形態を有している。
【0151】
【式29】
Figure 0004450516
【0152】
この場合、
【0153】
【式30】
Figure 0004450516
【0154】
ここで、yはマスクされるコントラストエネルギ、すなわち、空間Hi又はVi(方程式(23c))あるいは時間(T3)(方程式(24d))である。量Diは、yが属するピラミッドレベルiに依存する画像を示している(ピクセル毎に)。量b,a,c,m,mは、モデル較正によって見出され、それぞれ、1.4、3/32、5/32、10/1024、50である。また、dyは、絶対値を得る前に記憶されるコントラストyの算術符号である。
iの演算は、前述した図6のそれと同じである。すなわち、fds1()は、3×3フィルタリング後に1つのピラミッドレベルでダウンサンプリングすることを示しており、usf1()は、1つのピラミッドレベルでアップサンプリングした後に3×3フィルタリングを行なうことを示している。最初に、以下のようにしてE0が演算される。
【0155】
【式31】
Figure 0004450516
【0156】
次に、1,2に対してアレイEが各々演算される。
【0157】
【式32】
Figure 0004450516
【0158】
配列Eは、その後、以下のようなコントラスト分母配列Diを与えるために、時間コントラスト画像T3及び画像Tと組み合せられる。
【0159】
【式33】
Figure 0004450516
【0160】
ここで、パラメータmft=3/64は、時間(フリッカー)輝度チャンネルが全ての空間輝度チャンネルによってマスクされる強度を調整する。また、パラメータm=50は、各空間輝度チャンネルが時間(フリッカー)輝度チャンネルによってマスクされる強度を調整する。
【0161】
図7は、輝度距離形成部240の詳細なブロック図である。また、図7は、輝度距離形成ステップのフローチャートとして、あるいは、そのような輝度距離形成ステップを実行するためのフィルタ等の複数のハードウェア部品、各種の回路部品、特定用途向け集積回路(ASIC)のブロック図として理解することができる。以下に示す構成は、図6で形成されてマスクされた全てのコントラスト画像、すなわち、ピラミッドH,Vの画像(すなわち、画像H0,V0,H1,V1,H2,V2)、画像T3(レベル3の解像度を有する)、基準配列から得られる対応する画像(図6及び図7において上付き文字refで示される)に適用される。
【0162】
以下のプロセスにおける最初の4つのステップは、前記画像に個別に適用される。また、以下の説明において、Xは、試験配列から得られるこれらの画像のうちの任意の画像を示しており、Xrefは、基準配列から得られる対応する画像を示している。これらの表記を用いて、以下、ステップを説明する。
【0163】
ステップ(又は、段階)710では、画像Xが2つの半波長調整画像に分離される。これら2つの画像の一方はプラスのコントラスト712に関するものであり、他方はマイナスのコントラスト714に関するものである。プラスコントラスト画像(X+と称する)においては、Xコントラストからのサイン(前述したように、別個に記憶される)は、マイナスのコントラストを有するX+内の全てのピクセルに0を割り当てるために使用される。逆の演算がマイナスコントラスト画像X-に対しても行なわれる。
【0164】
ステップ(又は、段階)720では、各画像X+,X-に関し、3×3フィルタを適用することによって局所的なプーリング演算が行なわれ、これにより、0.25(1,2,1)のフィルタカーネルが画像に水平及び垂直に絡み付けられる。
【0165】
また、ステップ720では、その結果生じた画像が各方向で2因子だけダウンサンプリングされ、プーリング演算から生じた冗長部分が除去される。Xに適用された処理と同じ処理が、対応する基準画像Xrefに関して行なわれる。
【0166】
ステップ(又は、段階)730では、絶対差画像|X+−X+ ref|及び|X−X- ref|がピクセル毎に演算される。その結果生じた画像がJNDマップである。
【0167】
ステップ(又は、段階)740では、コアリング演算がJNDマップに関して行なわれる。すなわち、閾値tcよりも小さい全ての値が0に設定される。好ましい実施形態において、tcは値0.5に初期設定される。
【0168】
ステップ(又は、段階)750では、これらの画像のQ番目の電力が決定される。好ましい実施形態において、Qは、値2に初期設定する正の整数である。
【0169】
この処理が全てのX+,X+ ref対に関して完了すると、アップサンプリングとフィルタリングとを繰り返して、全ての画像を所望のレベルまで加算することにより、サマリーメジャーが決定される。これは、以下のようにして行なわれる。
【0170】
すなわち、まず、ステップ(又は、段階)760では、レベル2の画像を得るために、T3,T3 refから得られたレベル3の画像にアップサンプリングとフィルタリングとが適用される。
【0171】
ステップ(又は、段階)761では、ステップ760からのレベル2の画像と、H2,H2 ref,V2,V2 refから得られたレベル2の画像の合計に対してアップサンプリングとフィルタリングとが適用される。
【0172】
ステップ(又は、段階)762では、ステップ761からのレベル2の画像と、H1,H1 ref,V1,V1 refから得られたレベル2の画像の合計に対してアップサンプリングとフィルタリングとが適用される。
【0173】
ステップ(又は、段階)763では、ステップ762からのレベル2の画像と、H0,H0 ref,V0,V0 refから得られたレベル2の画像の合計に対してアップサンプリングとフィルタリングとが適用される。ステップ(又は、段階)763から延びる経路765上の出力は、輝度JNDマップである。
【0174】
最後のステップ763の前において、結果として生じた画像の解像度は、オリジナル画像(初期の画像)の解像度の半分である。同様に、この処理部内の各ピラミッドのレベル指数は、それが初期に得られたピラミッドレベル、すなわち、フィルタリング/ダウンサンプリング後のレベルに関する解像度の2倍を示している。
【0175】
前述のように、アップサンプリングとフィルタリングとを繰り返して処理を加重することによって形成される画像は、Q番目の電力JND画像である。レベル0の画像は、それが経路764上のサマリー処理に直接に送られる際、あるいは、表示目的のためにアップサンプリング及びフィルタリングが成されて初期の画像解像度を得る際の2つの局面で使用される。
【0176】
図21は、輝度距離形成部240の他の実施形態の詳細なブロック図である。図21の輝度距離形成部は、図7の輝度距離形成部と同じ多くの段階を含んでいるため、以下、異なる段階についてのみ説明する。
【0177】
すなわち、“コアリング”段階740及び“Q番目の電力への引き上げ”段階750が、チャンネル出力の実行合計及び実行最大を維持する複数のマックス・サム段階に取って代えられている。図21に示される処理は、段階730までは図7と同じであるため、以下、絶対差画像|X+−X+ ref|及び|X−X- ref|が決定される部分から説明を始めることにする。
【0178】
次に、処理が全てのX+,X+ ref対に関して完了すると、実行合計画像は、段階2140において、T3,T3 refから得られるレベル3の画像の合計を含むように初期化される。同様に、実行最大画像は、段階2142において、|X+−X+ ref|及び|X―X- ref|のポイント毎の最大として実行最大画像を含むように初期化される。
【0179】
次に、実行合計画像及び実行最大画像は、段階2140a及び段階2142aにおいてそれぞれ、2つのレベル2の画像を備えるようにアップサンプリング及びフィルタリングが施される。その後、実行合計画像は、段階2144において、H2,H2 ref,V2,V2 refから得られるレベル2の画像が加えられることによって更新される。同様に、実行最大画像は、段階2146において、H2,H2 ref,V2,V2 refから得られるレベル2の画像と比較されることによって更新される。
【0180】
次に、実行合計画像及び実行最大画像は、段階2144a及び段階2146aにおいてそれぞれ、レベル1の画像を備えるようにアップサンプリング及びフィルタリングが施される。その後、実行合計画像は、段階2148において、H1,H1 ref,V1,V1 refから得られるレベル1の画像が加えられることによって更新される。同様に、実行最大画像は、段階2150において、H1,H1 ref,V1,V1 refから得られるレベル1の画像と比較されることによって更新される。
【0181】
次に、実行合計画像及び実行最大画像は、段階2148a及び段階2148aにおいてそれぞれ、レベル0の画像を備えるようにアップサンプリング及びフィルタリングが施される。その後、実行合計画像は、段階2152において、H0,H0 ref,V0,V0 refから得られるレベル0の画像が加えられることによって更新される。同様に、実行最大画像は、段階2154において、H0,H0 ref,V0,V0 refから得られるレベル0の画像と比較されることによって更新される。
【0182】
最後に、段階2160において、実行合計画像及び実行最大画像のポイント毎の線形結合(一次結合)が行なわれる。これにより、以下の式に従う輝度JNDマップが形成される。
【0183】
【式34】
Figure 0004450516
【0184】
ここで、kL=0.783である。kの値は、ミンコフスキーのQ基準に近似させることによって決定される。Qの値及び得られる多くの画像Nが共に与えられると、比較された全てのエントリ(1つのピクセルで)が同じである場合、また、0でないエントリが1つだけ存在する場合に、値kL=[N−N1/Q]/[N−1]によって、おおよその大きさがQ基準と一致する。この場合、N=14(チャンネルの数)であり、Q=2である。
【0185】
この処理後において、結果として生じた画像の解像度は、オリジナル画像(初期の画像)の解像度の半分である。同様に、この処理における各ピラミッドのレベル指数は、それが初期に得られたピラミッドレベル、すなわち、フィルタリング/ダウンサンプリング後のレベルに関する解像度の2倍を示している。
【0186】
最後に、フィルタリング/ダウンサンプリングを繰り返し且つ加重/最大化処理を行なうことによって形成された全ての画像には、加重(重み)kL,1−kLが加えられ、これによって、JND画像を形成することができる。レベル0の画像は、それが経路2161によってJNDサマリー処理に直接に送られる際、あるいは、表示目的のために段階2170でアップサンプリング及びフィルタリングが成されて初期の画像解像度を得る際の2つの局面で処理することができる。
【0187】
一般に言って、図21の輝度距離形成部は好ましい実施形態であるのに対して、図7の輝度距離形成部は他の実施形態である。その理由の1つは、マックス・サム法は、演算的に安価だからである。従って、整数のダイナミックレンジの実施が望ましい場合には、図21の輝度距離形成部が望ましい。一方、浮動小数点プロセッサが使用される場合には、図7の輝度距離形成部が望ましい。
【0188】
半高輝度処理
記憶条件及び演算サイクルは重要な処理問題であるため、本発明は、例えばインターレース画像の上部領域及び底部領域といった半高画像を処理することができる知覚距離ジェネレータの他の実施形態を提供する。この実施形態によれば、全高画像を記憶するために必要な記憶スペースの量を減らすことができると共に、演算サイクルの数を減らすことができる。
【0189】
半高画像が直接にゼロ化することなく真の画像高さまで通過される場合には、固有の垂直解像度が固有の水平解像度のたった半分であることを示すように前述した輝度処理部220を変更しなければならない。図22及び図23は、半高画像を処理するための輝度距離形成部及び輝度処理部のブロック図である。
【0190】
これらの図(図22及び図23)及び全高インターレース画像に関する対応する図(図20及び図21)から明らかなように、多くの段階が同じである。従って、図22及び図23の以下の説明では、これら2つの実施形態の異なる点についてのみ説明する。
【0191】
まず、解像度が最も高い水平チャンネルH0が除去される。次に、加重(1/8,3/4,1/8)を有する3×1“ケル(Kell)”フィルタ(垂直フィルタ)2210を用いて、解像度が最も高い画像が低域フィルタに垂直に通される(すなわち、縦列)。このフィルタは、垂直寸法で半分の空間周波数でラインがサンプリングされるという事実に起因する効果を除去するためのアンチエイリアシングフィルタである。すなわち、これは、垂直方向で不鮮明にする低域フィルタである。垂直にフィルタに通されることによって生じた画像L0は、その後、1×3フィルタ2220(カーネル0.25[1,2,1])を用いて水平にフィルタリングされる。その結果生じた画像LP0は、低域フィルタに水平に通されたL0のバージョンである。
【0192】
次に、L0及びLP0は、方向付けられた他のチャンネルの(S−C)/(S+C)応答に類似する、バンドパス(LP0−L0)をローパス(LP0)で割って成る方向付けられた応答を形成する。
【0193】
続いて、段階2200において、画像LP0(720×240ピクセルの半高画像)が、全高半解像度画像(360×240)へと水平にダウンサンプリングされる。この時点で、アスペクト比は、この画像上及び残る3つのピラミッドレベルの全体にわたる処理を全高の場合と同様に続けることができるような値である。
【0194】
次に、段階2232での1×3フィルタリング/水平ダウンサンプリング(1×3filter & d.s.と名付けられている)及び段階2234での水平アップサンプリング(h.u.s.)/1×3フィルタリングをそれぞれ用いて、レベル0からの半高画像とレベル1の全高画像との間で、ダウンサンプリング及びアップサンプリングが行なわれる。水平ダウンサンプリングは、水平の寸法で2因子分の破壊を適用する。すなわち、他の縦列画像の全てを廃棄する。水平アップサンプリングは、存在する画像の2つの縦列間に0の縦列を挿入する。アップサンプリング後のフィルタカーネルは、前述した理由から、0.5[1,2,1]によって規定される。
【0195】
図23は、半高画像を処理するための輝度距離形成部を示している。最初に、解像度が最も高いチャンネルH0は存在しない。V0チャンネルに関しては、3×3フィルタリング・ダウンサンプリング段階を他のチャンネルで使用されるように置き換えるために、1×3フィルタリング・水平ダウンサンプリング段階2300が与えられる。
【0196】
0チャンネルが存在しないため、様々なパラメータ及び実行最大及び実行合計の「経路」が変更される。例えば、kを決定する値Nが12から4に変更される。全高及び半高の両方の処理に関しては、同じ値k=0.783が使用される。この値は、前述した方程式から演算される全高及び半高の定数の平均である。
【0197】
最後に、全高の実施形態と同様、サマリーメジャーに関する輝度マップを全画像解像度に対してその表示前に適用しなければならない。段階2310において、アップサンプリングした後、1×3フィルタリング(カーネル0.5[1,2,1])を施すことによって、表示の直前に、最後のJNDマップが水平方向で全解像度に適用される。垂直方向では、段階2320で、ライン・ダブリングが行なわれる。
【0198】
各空間フィルタは水平及び垂直の空間に依存しており、また、半高の実施形態には、全高の実施形態と比較して、幾つかの相違点がある。しかしながら、半高の実施形態は、主観的な評価に関して、僅かな摂動を示すにすぎない。従って、インターレースの実施形態の他の実施形態として、実行可能で且つ時間を節約できる非インターレースの実施形態を使用することもできる。
【0199】
図8は、クロミナンス処理部230の詳細なブロック図を示している。また、図8は、クロミナンス処理ステップのフローチャートとして、あるいは、そのようなクロミナンス処理ステップを実行するためのフィルタ等の複数のハードウェア部品、各種の回路部品、特定用途向け集積回路(ASIC)を有するクロミナンス処理部のブロック図として理解することができる。レベル0,1,2を有するピラミッドの他、クロミナンス処理部230は、u*802及びv*804に関し、レベル0,1…6を有するピラミッドを演算する。
【0200】
解像度は、レセプタ間の距離によってではなく、ピクセル間の距離によって駆動されるため、クロミナンスチャンネルの空間解像度(すなわち、ピラミッドレベルが最も高い解像度)は、輝度のそれと等しくなるように選択される。レセプタ間の距離は視角の0.007°であり、ピクセル間の距離は、その高さ内に480個のピクセルを有する画面からその高さの4倍で見て得られる0.03°である。一方、Mogan and Aiba(1985) は、赤−緑バーニア明瞭度が、等輝度で、3因子だけ、すなわち、他の種類の明瞭度におけるレセプタ間距離の3倍に等しい因子だけ、低下することを見出した。また、視角2’(すなわち、0.033°)よりも小さい範囲を定める光において視覚システムが第3色盲(青盲目)となるという事実(Wyszecki and Stiles. 1982. p.571を参照)によって、青−黄の有色チャンネルの解像度が制限される。視角0.03°のピクセル解像度は、これらの値のうち最も大きい値に非常に近い。その結果、輝度チャンネルのピクセル解像度とクロミナンスチャンネルのピクセル解像度とを同一視することが適当である。
【0201】
クロミナンスピラミッドはレベル6にまで達する。これは、大きな空間的に均一な色領域間の差異に観察者が気付くという証拠を裏付ける。この効果は、空間的に広げられたJNDマップを使用することによって扱うことができる。そのような低い空間周波数によるJNDへの寄与度に関する量的な証拠は、Mullen(1985)によって与えられている。
【0202】
図8に戻ると、輝度処理と同様に、7つの解像度レベルでの空間的な分解は、連続的に非常に粗い解像度レベルのそれぞれで2因子だけ画像を不鮮明にしてダウンサンプリングするピラミッド分解によって達成される。初期の全解像度画像は、0レベル(レベル0)のピラミッドと称される。次に低い解像度レベルは、REDUCEと呼ばれる演算によって得られる。すなわち、不鮮明画像を形成するために、加重(1,2,1)/4を有する3タップ低域フィルタ805が画像の各方向で0レベルに連続的に適用される。その結果生じた画像は、その後、次のレベルであるレベル1を形成するために、2因子だけサブサンプリングされる(他のピクセルが除去される度に)。
【0203】
ステップ(又は、段階)810では、各解像度レベルに関してu*画像上で、また、タップ加重(0.25,0.25,0.25,0.25)を有するv*画像上で、以下のような4領域平均が実行される。
【0204】
【式35】
Figure 0004450516
【0205】
ここで、jは領域の指標である。この平均演算は、有色チャンネルの固有の低域時間フィルタリングを反映しており、時間輝度チャンネルの“early−Late”処理に取って代わる。
【0206】
ステップ(又は、段階)820では、方向付けられていないラプラス空間フィルタ820がu*画像及びv*画像のそれぞれに適用される。フィルタは以下の3×3カーネルを有している。
【0207】
【式36】
Figure 0004450516
【0208】
このカーネルは、全加重0を有し、且つ、単位(ユニット)の値に差がある2つの均一領域間の任意のストレート・エッジに最大強度1をもって応答するように、選択される(最大応答は、水平エッジ又は垂直エッジによって達成される)。これによって、均一カラー空間(JND)ユニットで評価されたクロミナンス差のマップにU*画像とV*画像が組み込まれる。
【0209】
ステップ(又は、段階)830では、輝度処理部で演算されたマイケルソンコントラストと類似に解釈されるクロミナンスコントラストピラミッドとして、ステップ820から生じたu*画像及びv*画像に関して直接にコントラスト演算が行なわれる。輝度コントラストと同様に、クロミナンスコントラストは、ラプラスピラミッドによってもたらされる画像間比較によって演算される。空間平均で割られるラプラス差は、ウェーバの法則により1−JNDレベル(検出閾値)で一定値と見なされるマイケルソンコントラストを示しているため、u*画像及びv*画像に関するラプラスピラミッド演算は、1−JND解釈を有している。同様に、この解釈は、較正中に変更される。変更は、本発明の全ての部分の相互作用を反映していると共に、知覚距離ジェネレータに関しては1−JND応答を引き出す刺激が簡単ではないという事実を反映している。
【0210】
また、ステップ(又は、段階)830では、レベル毎のコントラストピラミッド画像が7つの定数q(i=0,…,6)で割られる。これらの定数の値は、較正によって決定され、それぞれ、1000、125、40、12.5、10、10、10となる。これらの定数は、輝度処理部における量wi(i=0,…,3)に類似している。
【0211】
ステップ(又は、段階)840では、u*コントラスト及びv*コントラストの全ての二乗が決定されるが、この場合も、算術符号はその後の使用のために維持される。このように、算術符号を維持すると、二乗演算での曖昧な符号の損失によって2つの異なる画像間で複数の0JNDを記録してしまうといった可能性を防止することができる。これによって、2つのクロミナンス二乗コントラストピラミッドCu,Cvが生じる。
【0212】
ステップ(又は、段階)850では、コントラストエネルギマスキングが行なわれる。最初に、分母ピラミッドレベルD(m=0,1,2)は、更に変更することなく、輝度処理部220からそのまま採用される。しかしながら、レベル3,…,6に関しては、輝度処理と同様の方法を使用して、D2が連続的にフィルタリングされてダウンサンプリングされる。しかし、新たな項は加えられない。輝度はJNDの非常に重要な決定子であるため、クロミナンスにおける輝度の効果の方が、輝度におけるクロミナンスの効果よりも重要であるという意味において、これらのD値は、摂動論の精神により、ステップ840で使用される。すなわち、大抵の場合、輝度効果は、クロミナンス効果よりも優勢であることが期待され、クロミナンス処理部は、輝度処理部における一次摂動と見なすことができる。従って、輝度の効果(D)は、クロミナンスをマスクするように形成され、その逆ではない。
【0213】
全てのピラミッドレベルm=0,1,2に関し、マスクされたクロミナンスコントラストピラミッドは、輝度チャンネル分母ピラミッドDと、クロミナンス二乗コントラストピラミッドをマスクするために輝度トランスデューサのために使用される同じ関数式とを使用して、以下のように形成される。
【0214】
【式37】
Figure 0004450516
【0215】
ステップ830で除去される算術符号は、因子sum,svmによって再び付与される。この演算は、u*,v*のためのマスクされたコントラストピラミッドを形成する。較正によって、値ac=0.15,cc=0.3,k=0.7,σc=1.0,ρc=1.17が決定される。また、mcを値1に設定すると、較正及び予測の全てにおいて十分な性能が得られた。
【0216】
図24は、クロミナンス処理部230の他の実施形態の詳細なブロック図である。図24のクロミナンス処理部は、図8のクロミナンス処理部の段階と類似する多くの段階を含んでいるため、以下、異なる段階についてのみ説明する。
【0217】
クロミナンスの空間及び時間フィルタリングは、図8及び図24の両方の知覚距離ジェネレータの場合と同様である。しかしながら、図24の知覚距離ジェネレータにおけるクロミナンスコントラスト演算は、二乗演算を行なうことなく達成される。すなわち、段階830は、図24においては、段階2400に取って代えられている。
【0218】
より詳細には、ステップ(又は、段階)830では、レベル毎のコントラストピラミッド画像が7つの定数q(i=0,…,6)で割られる。これらの定数は図8の定数と異なっていることに留意すべきである。これらの定数の値は、較正によって決定され、それぞれ、384、60、24、6、4、3、3となる。これらの定数は、輝度処理部における量wi(i=0,…,3)に類似している。
【0219】
次に、u*コントラスト及びv*コントラストの全ての短縮された絶対値が演算される(clip(x)=max(0,x−e))。この場合、e=0.75である。この場合も、算術符号は、その後の使用のために、維持されて再び付与される。これによって、絶対値演算での曖昧な符号の損失によって2つの異なる画像間で複数の0JNDを記録してしまうといった可能性を防止することができる。これによって、2つのクロミナンスコントラストピラミッドCu,Cvが生じる。
【0220】
図8の知覚距離ジェネレータと図24の知覚距離ジェネレータとの間の他の重要な差異は、コントラストエネルギマスキングの実施である。図8と異なり、図24の知覚距離ジェネレータは、2つの別個の段階で、すなわち、水平チャンネル及び垂直チャンネルのそれぞれにおけるクロスマスキング段階とセルフマスキング段階とで、コントラストエネルギマスキング2410を実行する(図24参照)。セルフマスキングは、現在のチャンネル内の情報の存在下で、感度を減少する。一方、クロスマスキングは、隣りのチャンネル内の情報の存在下で、感度を減少する。実際に、これら2つの別個のマスキング段階の順序は逆であってもよい。
【0221】
全てのピラミッドレベルDm=0,…,6に関し、輝度チャンネル分母ピラミッドDと、クロミナンスコントラストピラミッドをマスクするために輝度トランスデューサのために使用される同じ関数式とを使用すると、
【0222】
【式38】
Figure 0004450516
【0223】
i>2の時、Diは、D2のフィルタリングされてダウンサンプリングされたバージョンである。同様に、
【0224】
【式39】
Figure 0004450516
【0225】
前記除去された算術符号は、因子sum,svmによって再び付与される。この演算は、ui,viのためのマスクされたコントラストピラミッドを形成する。較正によって、値ac=1/2,cc=1/2,ρc=1.4,mc=mi=10/1024が決定される。一般的に言って、図24のクロミナンス処理部は好ましい実施形態であるのに対して、図8のクロミナンス処理部は他の実施形態である。
【0226】
図9は、クロミナンス距離形成部250のブロック図を示している。この場合も、図9は、クロミナンス距離形成ステップのフローチャートとして、あるいは、そのようなクロミナンス距離形成ステップを実行するためのフィルタ等の複数のハードウェア部品、各種の回路部品、特定用途向け集積回路(ASIC)を有するクロミナンス距離形成部のブロック図として理解することができる。クロミナンスJNDマップの構成は、図7に関して前述した輝度JNDマップの構成と類似している。クロミナンスの場合、プロセスは、前述した段階840で形成されるマスクされたコントラストクロミナンス画像の全て、すなわち、画像Cu0,Cv0,…,Cu6,Cv6及び、基準配列から得られる対応画像(図8及び図9に、上付き文字refで示されている)に適用される。
【0227】
以下のプロセスにおける最初の4つのステップは、前記画像に個別に適用される。また、以下の説明において、Xは、試験配列から得られるこれらの画像のうちの任意の画像を示しており、Xrefは、基準配列から得られる対応する画像を示している。これらの表記を用いて、以下、ステップを説明する。
【0228】
ステップ(又は、段階)910では、画像Xが2つの半波長調整画像に分離される。これら2つの画像の一方はプラスのコントラスト912に関するものであり、他方はマイナスのコントラスト914に関するものである。プラスコントラスト画像(X+と称する)においては、Xコントラストからのサイン(前述したように、別個に記憶される)は、マイナスのコントラストを有するX+内の全てのピクセルに0を割り当てるために使用される。逆の演算がマイナスコントラスト画像X-に対しても行なわれる。
【0229】
ステップ(又は、段階)920では、各画像X+,X-に関し、3×3フィルタを適用することによって局所的なプーリング演算が行なわれ、これにより、0.5(1,2,1)のフィルタカーネルが画像に水平及び垂直に絡み付けられる。
【0230】
また、ステップ920では、その結果生じた画像が各方向で2因子だけダウンサンプリングされ、プーリング演算から生じた冗長部分が除去される。Xに適用された処理と同じ処理が、対応する基準画像Xrefに関して行なわれる。
【0231】
ステップ(又は、段階)930では、絶対差画像|X+−X+ ref|及び|X―X- ref|がピクセル毎に演算される。その結果生じた画像がJNDマップである。
【0232】
ステップ(又は、段階)940では、コアリング演算がJNDマップに関して行なわれる。すなわち、閾値tcよりも小さい全ての値が0に設定される。好ましい実施形態において、tcは値0.5に初期設定される。
【0233】
ステップ(又は、段階)950では、これらの画像のQ番目の電力が決定される。好ましい実施形態において、Qは、値2に初期設定する正の整数である。
【0234】
この処理が全てのX+,X+ ref対に関して完了すると、アップサンプリングとフィルタリングとを繰り返して、全ての画像を所望のレベルまで加算することにより、サマリーメジャーが決定される。これは、以下のようにして行なわれる。
【0235】
すなわち、まず、ステップ(又は、段階)960では、レベル5の画像を得るために、Cu6,Cu6 ref,Cv6,Cv6 refから得られたレベル6の画像にアップサンプリングとフィルタリングとが適用される。
【0236】
次のステップ(又は、段階)では、ステップ960からのレベル5の画像と、Cu5,Cu5 ref,Cv5,Cv5 refから得られたレベル5の画像の合計に対してアップサンプリングとフィルタリングとが適用される。このプロセスはレベル0まで続けられる。
【0237】
輝度処理と同様に、最後の処理段階963の前において、結果として生じた画像の解像度は、オリジナル画像(初期の画像)の解像度の半分である。同様に、この処理部内の各ピラミッドのレベル指数は、それが初期に得られたピラミッドレベル、すなわち、フィルタリング/ダウンサンプリング後のレベルに関する解像度の2倍を示している。
【0238】
前述のように、アップサンプリングとフィルタリングとを繰り返して処理を加重することによって形成される画像は、Q番目の電力JND画像である。レベル0の画像は、それが経路964上のサマリー処理に直接に送られる際、あるいは、表示目的のために段階963でアップサンプリング及びフィルタリングが成されて初期の画像解像度を得る際の2つの局面で使用される。
【0239】
前述したように、出力サマリーステップに送られる輝度及びクロミナンスのJNDマップは、Q番目の電力JND画像であり、オリジナル画像(初期の画像)の解像度の半分の解像度を示す。これは、各マスクコントラスト段階で行なわれるプーリングが有する固有の冗長部分を利用する。以下のミンコフスキー加重によって全てのピクセルを加重平均することにより、これらの半解像度画像のそれぞれを1つのJND性能水準まで低下することができる。
【0240】
【式40】
Figure 0004450516
【0241】
NPは、JNDマップ及びJNDluminanceのそれぞれの数であり、JNDchrominanceは、サマリーメジャーである。また、LJND Q及びCJND Qは、輝度及びクロミナンスマップ構成からの半解像度マップである。それぞれの場合、合計は、画像内の全てのピクセルを超える。前述したように、ミンコフスキー指数Qの値は、2に初期設定される。
【0242】
輝度及びクロミナンスのサマリーメジャーから、1つの領域における1つの性能水準が、以下のミンコフスキー加重によって演算される。
【0243】
【式41】
Figure 0004450516
【0244】
ここで、Qは2に初期設定される。
【0245】
ミンコフスキーの意味において、各領域のためのJND値を加重することにより、ビデオ配列のN個の領域に関する1つの性能水準は、以下の通りである。Qは2に初期設定される。
【0246】
【式42】
Figure 0004450516
【0247】
図25は、クロミナンス距離形成部250の他の実施形態の詳細なブロック図である。図25のクロミナンス距離形成部は、図9のクロミナンス距離形成部と同じ多くの段階を含んでいるため、以下、異なる段階についてのみ説明する。
【0248】
すなわち、“コアリング”段階940及び“Q番目の電力への引き上げ”段階950が、チャンネル出力の実行合計及び実行最大を維持する複数のマックス・サム段階に取って代えられている。図25に示される処理は、段階930までは図9と同じであるため、以下、絶対差画像|X+−X+ ref|及び|X―X- ref|が決定される部分から説明を始めることにする。
【0249】
次に、処理が全てのX+,X+ ref対に関して完了すると、実行合計画像は、段階2540において、Cu6,Cu6 ref,Cv6,Cv6 refから得られるレベル6の画像の合計を含むように初期化される。同様に、実行最大画像は、段階2542において、|X+−X+ ref|及び|X―X- ref|のポイント毎の最大として初期化される。
【0250】
次に、実行合計画像及び実行最大画像は、段階2540a及び段階2542aにおいてそれぞれ、2つのレベル5の画像を備えるようにアップサンプリング及びフィルタリングが施される。その後、実行合計画像は、段階2544において、Cu5,Cu5 ref,Cv5,Cv5 refから得られるレベル5の画像が加えられることによって更新される。同様に、実行最大画像は、段階2546において、Cu5,Cu5 ref,Cv5,Cv5 refから得られるレベル5の画像と比較されることによって更新される。このプロセスはレベル0まで続けられる。
【0251】
最後に、前述したステップが行なわれると、実行合計画像及び実行最大画像のポイント毎の線形結合(一次結合)が行なわれる。これにより、以下の式に従うクロミナンスJNDマップが形成される。
【0252】
【式43】
Figure 0004450516
【0253】
ここで、kc=0.836である。kcの値は、ミンコフスキーのQ基準に近似させることによって決定される。Qの値及び得られる多くの画像Nが共に与えられると、比較された全てのエントリ(1つのピクセルで)が同じである場合、また、0でないエントリが1つだけ存在する場合に、値kc=[N−N1/Q]/[N−1]によって、おおよその大きさがQ基準と一致する。この場合、N=28(チャンネルの数)であり、Q=2である。
【0254】
輝度処理と同様、この処理後において、結果として生じた画像の解像度は、オリジナル画像(初期の画像)の解像度の半分である。この処理における各ピラミッドのレベル指数は、それが初期に得られたピラミッドレベル、すなわち、フィルタリング/ダウンサンプリング後のレベルに関する解像度の2倍を示している。
【0255】
フィルタリング/ダウンサンプリングを繰り返し且つ加重/最大化処理を行なうことによって形成された全ての画像には、加重(重み)kc,1−kcが加えられ、これによって、JND画像を形成することができる。レベル0の画像は、それがサマリー処理に直接に送られる際、あるいは、表示目的のために初期の画像解像度へとアップサンプリングされてフィルタリングされる際の2つの局面で処理することができる。
【0256】
一般に言って、図25のクロミナンス距離形成部は好ましい実施形態であるのに対して、図9の輝度距離形成部は他の実施形態である。その理由の1つは、マックス・サム法は、演算的に安価だからである。従って、整数のダイナミックレンジの実施が望ましい場合には、図25のクロミナンス距離形成部が望ましい。一方、浮動小数点プロセッサが使用される場合には、図9の輝度距離形成部が望ましい。
【0257】
半高クロミナンス処理
半高画像が直接にゼロ化することなく真の画像高さまで通過される場合には、固有の垂直解像度が固有の水平解像度のたった半分であることを示すように前述したクロミナンス処理部230を変更しなければならない。図26及び図27は、半高画像を処理するためのクロミナンス距離形成部及びクロミナンス処理部のブロック図である。
【0258】
これらの図(図26及び図27)及び全高インターレース画像に関する対応する図(図24及び図25)から明らかなように、多くの段階が同じである。従って、図26及び図27の以下の説明では、これら2つの実施形態の異なる点についてのみ説明する。
【0259】
第1に、解像度が最も高いクロミナンスチャンネルu0 *,v0 *が除去される。一般に、クロミナンス感度は高い空間周波数で低いため、これらのチャンネルの損失は重要ではない。
【0260】
第2に、解像度が次に最も高いクロミナンス画像u1 *,v1 *を形成するために、加重が(1/8,3/4,1/8)のカーネルを有する低域“ケル”フィルタ2600が垂直(すなわち、縦列に沿って)に適用される。この演算は、全高の実施形態の3×3フィルタの垂直成分によって行なわれるフィルタリングと、想定された非インターレースフィルタのフィルタリングとのジョイントフィルタリングに対応している。その結果生じた垂直にフィルタリングされた画像は、その後、加重0.25(1,2,1)のカーネルを有する1×3フィルタ2610を用いて水平にフィルタに通される。u*,v*画像のこのフィルタリングは、等方性解像度の半高画像を形成する。その解像度は、レベル1の全高ピラミッドの解像度である。
【0261】
図27は、半高画像を処理するためのクロミナンス距離形成部を示している。最初に、0レベルは存在しない。従って、各種のパラメータと、実行最大及び実行合計の「経路」とが変更される。例えば、kを決定する値Nが28から24に変更される。全高処理及び半高処理の両方には同じ値k=0.836が使用され、この値は、先に与えられた式から演算される全高定数と半高定数の平均である。
【0262】
クロミナンスの実施形態においては、ピラミッドレベル1で、最大ストリーム及び合計ストリームが全て累積されるため、サマリーメジャーに関するクロミナンスJNDマップは、全累積された輝度マップのたった半分のサイズ(水平及び垂直の両方で)である。従って、全JNDマップを形成するためにクロミナンスマップと輝度マップとを組み合せる前に、まず、クロミナンスマップを輝度マップと同じ解像度にしなければならない。この目的を果たすために、その後に3×3フィルタ2705を伴うアップサンプリングが行なわれ、サマリーメジャーに関するクロミナンスJNDマップが形成される。
【0263】
全高の実施形態と同様、サマリーメジャーに関するクロミナンスマップを、それが表示される前に、全画像解像度にしなければならない。輝度マップにおける類似する演算と一致させるため、段階2710でアップサンプリングを行なった後に1×3フィルタリング(カーネル0.5l1,2,1l)を行なうことにより、クロミナンスマップが水平方向で全解像度にされる。垂直方向では、段階2720において、ライン・ダブリングが行なわれる。
【0264】
JND出力サマリー
前述したように、出力サマリーステップに送られた輝度及びクロミナンスJNDマップは、JND画像であり、オリジナル画像(初期の画像)の解像度の半分の解像度を示す。これは、各マスクコントラスト段階で行なわれるプーリングに固有の冗長部分を利用する。
【0265】
次に、輝度及びクロミナンスJNDマップJNDL,JNDCは、1つの全領域JNDマップJNDTへと組み合わされる。この組合せは、マップJNDL,JNDCを形成するためにチャンネルを組み合せるのに類似する以下のミンコフスキー加重を用いて達成される。
【0266】
【式44】
Figure 0004450516
【0267】
ここで、kT=0.586である。kTの選択は、ミンコフスキーQ基準を近似することによって決定される。この場合、最大/合計に関して2つの項が存在し、Q=2である。
【0268】
続いて、各半解像度JND画像(各領域に関して3つ、すなわち、輝度、クロミナンス、全領域)は、以下のヒストグラム処理により、JAMと呼ばれる1つのJND性能メジャーへと減少される。
【0269】
第1に、JND値(ビンサイズ1/8JNDを有する)のヒストグラムが形成されるが、閾値レベルtc=1/2よりも低い値は含まれていない。100JND’sよりも大きい全ての値は、100JND’sとして記録される。
【0270】
第2に、JAMは、前記短縮されたヒストグラムからのJNDスコアの90番目の百分率として採用される。この形態では、3つの値JAMluma,JAMchroma,JAMtotalが、JNDL,JNDC,JNDTにそれぞれ対応するサマリーメジャーに関して演算される。これは、ビデオ配列内の各領域に関して行なわれる。
【0271】
ビデオ配列内のN個の1領域JAMfield値から、配列の長さに依存する2つの形態のうちの一方で、1つの性能メジャーJAMNが演算される。
N>10に関し
JAMNは、JAMfield値のヒストグラムの90番目の百分率に等しい。
N・10に関し
JAMNは、Nが増大する際の連続度を与える以下のプロセスによって決定される。より詳細には、第1に、JAMfield値のヒストグラムが形成される。第2に、このヒストグラムは、真のヒストグラムと同じ最大、最小、平均を有するが最小値もしくは最大値のいずれかで1つのビンピークを有する定数から成る“偽ヒストグラム”によって近似される。
【0272】
第3に、前記偽ヒストグラムからのJAMfieldスコアの90番目の百分率として、N領域JAMが採用される。
【0273】
主観的な評価データ(1/2秒よりも短い、あるいは、15フレームよりも短い)は、短いビデオ配列においては、ノイズであり、信頼できない。従って、JAM評価は、短い配列に関しては、主観的な評価と関連付ける必要はあまりない。
【0274】
画像ボーダー処理
この知覚距離ジェネレータにおいては、各段階でのボーダー反射によって輝度及びクロミナンスJNDマップ内にアーチファクトが伝搬されるため、これらのアーチファクトによってJNDマップが汚染されないようにクロッピングする必要がある。このような問題を扱うため、方法を発展させて、画面の縁を計り知れない程度の灰色ベゼル(表縁)で置き換えた。しかし、サイドの6つ以上のピクセルによって真の画像サイズを高めることなく操作する。この「仮想ベセル」を使用すると、ボーダーのアーチファクトを避けるためにJNDマップをクロッピングすることが不要になる。無限グレイベゼルは視覚状態をモデル化し、従って、非アーチファクトであると思われる。このような考え方により、全JNDマップは、アーチファクトによって汚染されず、画質分析器によって表示できる。
【0275】
以下の説明において、全てのサイドの6ピクセルで埋め込まれる(パッドされる)画像を「パッド画像」と称し、また、パッドされない画像あるいはパット画像内のその場所を「画像プロパー」と称する。
【0276】
画像演算は局所的であるため、仮想的に無限のベゼルを効果的に実施できる。画像プロパーの外側に十分離れると、無限ベゼルは、与えられた任意の段階で同一の一定値のセットになる。この一定領域で行なわれるフィルタリング等の画像演算の効果は、推測的に演算される。従って、狭いボーダー(この実施形態では、6ピクセル)は、画像プロパーから無限ベゼルへの適切な移行を与えることができる。
【0277】
入力で、ベゼルには、値Y’=90,U’=V’=0が与えられる(Y’=90の値は、最大画面輝度の15%のRec500バックグラウンド値と一致する)。しかしながら、ベゼルは、フロントエンド処理後まで必要とされない。なぜなら、画像ボーダーを超えて延びる空間的な相互作用がこの段階後まで生じないからである。輝度チャンネルにおいては、輝度圧縮後までボーダー(従って、ベゼル値も)が画像に付加されない。クロミナンスチャンネルにおいては、フロントエンド処理後にボーダーが付加される。
【0278】
輝度チャンネルにおいて、輝度圧縮後の最初のベゼル値は以下の通りである。
【0279】
【式45】
Figure 0004450516
【0280】
*,v*チャンネルにおいて、最初のベゼル値は両方共に0である。
【0281】
これらの値は、次の処理段階で、以下の3つの方法により送られる。
【0282】
1)新しいベゼル値を形成するために、ピクセル毎の関数が古いベゼル値を演算する。例えば、1.4べき関数から生じるベゼル値は、以下の通りである。
【0283】
【式46】
Figure 0004450516
【0284】
2)その縦列及び横列の合計がPである3×3空間フィルタは、出力ベゼル値を入力ベゼル×Pに設定する。
【0285】
3)コントラスト関数計算機及び4領域タイムフィルタ(0のタップ合計を有する)は、出力ベゼル値を0に設定する。
【0286】
コントラス段階では、次に、輝度及びクロミナンスチャンネル、すなわち、空間的に一定の配列における0合計線形カーネルを用いた演算の論理結果において、ベゼルに値0が与えられる。
【0287】
仮想ベゼルを形成するこの方法は、1997年12月23日に出願され且つ「画像ピラミッドボーダーを形成するための方法」と題された米国特許出願第08/997,267号に開示されている。この米国特許出願第08/997,267号は、これを参照することによって本願に組み込まれる。
【0288】
画像及びベゼルの一体化
モデルのピラミッド段階から始めると、ボーダーが供給される必要がある。N−by−M入力画像における最初のボーダー演算は、適当なベゼル値(圧縮された輝度画像に関しては第1輝度ベゼルであり、u*及びv*画像に関しては0)を有する6ピクセル(至る所の(全てのサイドの))で画像をパッドすることである。パッド画像は、寸法(N+12)×(M+12)を有している。k番目のピラミッドレベル(kは0〜7の範囲をとることができる)に関して、パッド画像は、寸法([N/2k]+12)x([M/2k]+12)を有している。この場合、“{x}”は、xの中で最も大きい整数を示している。
【0289】
全てのピラミッドレベルにおける画像は、画像プロパーの左上側の隅で、互いに対して記録される。画像プロパーのインデックスは、0・y・高さ、0・x・幅から続いている。画像プロパーの左上側の隅は、常に、インデックス(0,0)を有している。ベゼルピクセルのインデックスは、高さ及び幅において、0よりも小さい値をとる。例えば、左上側のベゼルピクセルは(−6,−6)である。幅w(画像+ベゼル幅w+12)の画像に関して、左縁部からx寸法に沿って見ると、ベゼルピクセルは、x=(−6,−5,…,−1)でインデックスが付与され、真の画像は、(0,1,…,w−1)でインデックスが付与され、右側のベゼルインデックスは(w,w+1,…,w+5)である。
【0290】
パッド画像が与えられると、次の処理段階に依存して起こり得る4つの事柄が存在する。これらの以下の演算の説明においては、空間処理(垂直方向で類似のイベントが起こることを理解して)を要約するために、1つの画像ラインを使用する。
【0291】
(a)ピクセル毎の演算。次の演算がピクセル毎に演算(例えば、非線形で)することである場合、パッド画像は単に演算を経るだけであり、出力画像の寸法は、入力画像の寸法と同じである。異なる領域もしくは異なるカラーバンド内の対応するピクセル間での演算の場合にも、同じことが起こる。
【0292】
(b)3×3空間フィルタ。パッドされていない入力画像が寸法Nkを有していると仮定する(1次元で)。また、パッド入力画像が寸法Nk+12を有し、パッド出力画像が寸法Nk+12を有している。出力ベゼル値は、最初に演算され、次の画像演算によって満たされない限り、少なくともこれらのベゼルピクセル内に書き込まれる。その後、パッド入力画像の左縁部から離れた1つのピクセルから始まって、3×3カーネルは、入力画像を演算し始めると共に、出力画像のベゼル値を上書きし、画像の右(又は、底部)縁部から離れた1つのピクセル(初期のベゼル値が残存する場所)で停止する。ベゼル値が予め書かれていれば、これらの値を演算するためにカーネル演算が初期の(パッドされた)画像の外側に達することはそもそも不要となる。
【0293】
(c)REDUCEにおけるフィルタリング及びダウンサンプリング。寸法Nk+12を有する入力パッド画像が与えられると、出力配列は、寸法[Nk/2]+12をもって割り当てられる。ベゼル値は、次のフィルタリング及びダウンサンプリング演算で満たされない限り、少なくともこれらのベゼルピクセル内に書き込まれる。その後、入力画像は、前記(b)にしたがってフィルタリングされる。しかし、フィルタは、入力画像が使い尽くされるまで、ピクセル−4,−2,0,2,4に適用される。また、出力値は、出力画像内にそれらのための更なる場所がなくなるまで、連続するピクセル−2,−1,0,1,2,…内に書き込まれる。新しい画像内におけるピクセル0の位置は、新しい画像の左端から7ピクセルである。フィルタの最後のピクセルの適用は、Nkが奇数の場合、入力ピクセルNk+3を出力ピクセル[Nk/2]+2とし、Nkが偶数の場合、入力ピクセルNk+4を出力ピクセル[Nk/2]+2とする(ここで、フィルタの入力ピクセルを、3ピクセルカーネルの中心に対応するピクセルと称する)。
【0294】
輝度の較正及び予測
心理物理的データは、2つの目的、すなわち、1)輝度処理部を較正するために(すなわち、特定の処理パラメータを決定するために)、また、2)輝度処理部が較正された後直ぐに輝度処理部の予測値を確かめるために、使用された。全ての場合において、輝度処理の直前に、知覚距離ジェネレータに刺激がY値画像として投入された。
【0295】
較正
輝度処理部220は、2つのデータセットを使用して、繰り返し較正することができる。一方のデータセットは、輝度処理部のステップ640,642,650において、プレマスキング定数(wi,te,tl)を調整するために使用される。他方のデータセットは、輝度処理部のステップ660において、マスキング段階定数σ,β,a,cを調整するために使用される。段階660の後にJND値が常に評価されるため、第2のデータセットを用いたステップ660での定数の調整は、第1のデータセットを用いたステップ640,642,650での定数の再調整を必要とした。これらの定数の再調整は、1つの繰り返しから次の繰り返しで更なる変化が生じなくなるまで続けられた。前述した繰り返しプロセスは、マスクされないコントラスト(ステップ640,642,650)の単位(ユニット)値を、視覚出力の1つのJNDとして解釈することにより始まるが、マスキングプロセスは、この解釈を混乱させる。調整の詳細については以下の小節で説明する。
【0296】
コントラスト正規化定数の調整(ステップ640,642,650)
マスキング前の空間及び時間コントラスト感度に関する知覚距離ジェネレータの予測は、Koenderink and Van Doorn(1979)によって与えられた正弦波に関するコントラスト感度データと一致した。知覚距離ジェネレータを基本とする曲線上に点を形成するため、知覚距離ジェネレータに対して低振幅の正弦波が試験画像として与えられた(空間的及び時間的に)。そして、1JND出力のためのコントラスト閾値が評価された。それぞれの場合において、基準画像は、同じ平均輝度を有する均一領域を試験領域として有していた。
【0297】
データに対する空間コントラスト感度の一致(最後の一致に関しては図10を参照)は、知覚距離ジェネレータのステップ640,642,650において、コントラストピラミッド感度パラメータw0.w1,w2を調整するために使用された。図10の破線は、全感度(実線)を備えた別個のピラミッドチャンネルの感度を示している。図10の空間モデルの一致は、15cycles/degを超えて延びず、前述した観察距離制限すなわち4つの画面高さの観察距離と一致する。僅かに異なる観察距離に対応するために、w0.w1,w2の同様の調整を行なうことができる。すなわち、非常に大きな観察距離は、低解像度のピラミッドレベルを必要とし、これらは、低い計算費で容易に組み込むことができる。
【0298】
データに対する時間コントラスト感度の一致(最後の一致に関しては図11を参照)は、時間フィルタタップパラメータte,tl及びコントラストピラミッド感度パラメータw3を調整するために使用される。これらのパラメータを一致させるために使用される方法は、空間コントラスト較正と類似する。様々な時間周波数でのKoenderink and Van Doornの最も低い周波数データは、空間的に均一な時間正弦波に関して演算された感度に対して一致する。それぞれの場合、視覚モデル領域評価は50Hz及び60Hzで時間正弦波をサンプリングした。また、これは、前述した別個のパラメータ値を生じさせた。
【0299】
コントラストのマスキングの調整(ステップ660)
マスクされたコントラストの差異を、Carlson and Cohen(1978)によって得られたデータと比較することにより、マスキングパラメータ値σ,β,a,c(知覚距離ジェネレータのステップ660)は一致された。最後の一致比較の結果が図12に示されている。Carlson-Cohenの調査から、一人の観察者のデータは、代表的で且つ十分なデータ点を有する基準に従って選択された。この場合、知覚距離ジェネレータの刺激は、試験領域及び基準領域内の所定のペデスタルコントラストの空間正弦波、及び、試験領域正弦波のコントラスト増分から成っていた。1JNDを達成するために必要なコントラスト増分は、各コントラストペデスタル値に関して知覚距離ジェネレータから決定され、その後、図12にプロットされた。
【0300】
予測
知覚距離ジェネレータの較正後、知覚距離ジェネレータの予測は、正弦波ではない刺激からの検出及び識別(差異)データと比較される。これは、より一般的な刺激に対する正弦波結果の伝達性をチェックするために行なわれる。公称空間周波数約10cycle/degを有するパターンに予測が提供されなかったことが図13,14,15から分かる。そのようなパターンは、空間周波数約15cycle/degでかなりのエネルギを有しており、ピクセルサンプリングレート(前述したように、1度につき30サンプル)を有するエイリアスを有している。
【0301】
第1の調査(図13)においては、試験領域内の低コントラストディスクが均一な基準領域に対して検知された。実験データはBlackwell and Blackwell(1971)からのものである。この特定の調査に関して知覚距離ジェネレータを実行する場合には、空間Q基準サマリーメジャーを最大値に取って代えることが必要であった。JND結果は、ディスクのバックグラウンドのサイズ(すなわち、画像サイズ)に対して敏感であった。
【0302】
第2の調査である低振幅のチェッカーボードの検知(図14)において、データは、未公表のSarnoffの調査で取得された。
【0303】
第3の調査(Carlson and Cohen,1980からのデータ)は、最初の2つと若干異なっていた。erf(ax)によって与えられる不鮮明なエッジが基準画像内に現われた。また、試験画像内でerf(a’x)によって与えられるエッジに対して識別が試みられた。ここで、xは、視度a=πf/{ln(2)}0.5,a’=π(f+Δf)/{ln(2)}0.5内の網膜距離である。また、fの単位はcycle/degである。また、Δfha,1つのJNDに必要なfの変化である。図15のプロットは、Δf/f対fである。
【0304】
4つの画面高さ観察距離での表示の空間周波数特性の範囲に関し、知覚距離ジェネレータの予測はデータと良く一致する。
【0305】
クロミナンス較正
輝度パラメータ較正と同様に、心理物理的データは、クロミナンスパラメータを較正するため(すなわち、ベストなモデル一致に関してそれらの値を調整するため)に使用された。全ての場合において、刺激は、4つの等しい領域であり、CIELUVへの変換直前にCIE X,Y,Zの画像として知覚距離ジェネレータ内に投入された。
【0306】
コントラスト正規化定数の調整(ステップ830)
マスキング前の有色コントラスト感度に関する知覚距離ジェネレータの予測は、Mullen(1985)によって与えられたコントラスト感度データと一致した。使用された試験配列は4つの等しい領域であり、各領域は、(X,Y,Z)値として投入される水平に変化する空間正弦波グレーティングを有している。較正に使用されるデータは、Mullenの図6からのものであり、各試験画像のどれが赤−緑等輝度正弦波であるかに対応していた。
【0307】
ピクセルiにおいて、試験画像正弦波は、以下によって与えられる三刺激値を有していた。
【0308】
【式47】
Figure 0004450516
【0309】
ここで、Δmは閾値増分識別コントラストであり、(xr,yr)=(0.636,0.364)は、赤干渉フィルタ(602nm)の色度であり、(xg,yg)=(0.122,0.823)は、緑干渉フィルタ(526nm)の色度であり、zr=1−xr−yr,zg=1−xg−yg,a=0.03deg/pixelである。基準画像は、方程式(28)によって表わされる均一な領域であるが、Δm=0である。知覚距離ジェネレータのため、Y0=1を設定すれば十分である。
【0310】
モデルを基本とする曲線上に点を形成するため、前述の刺激が様々な値fで与えられた。1JND出力に関するコントラスト閾値Δmが評価された。形成された有色コントラスト感度のデータに対する一致(最後の一致に関しては図16を参照)は、知覚距離ジェネレータ内でパラメータq(i=0,・・・,6)を調整するために使用された。
【0311】
マスキング定数の調整(ステップ840)
クロミナンスマスキングに関する知覚距離ジェネレータの予測は、Switkes.et al.(1988)によって与えられたデータと一致した。使用された試験配列は4つの等しい領域であり、各領域は、(X,Y,Z)値として投入される水平に変化する空間正弦波グレーティングを有している。その研究(クロミナンスのクロミナンスマスキング)の図4と一致させるため、ピクセルiにおいて、試験画像正弦波は、以下によって与えられる三刺激値を有していた。
【0312】
【式48】
Figure 0004450516
【0313】
ここで、Δmは閾値増分識別コントラストであり、(xr,yr)=(0.580,0.362)は、赤蛍光体の色度であり、(xg,yg)=(0.301,0.589)は、緑蛍光体の色度であり、zr=1−xr−yr,zg=1−xg−yg,fa=2c/deg*.03deg/pixel=.06である。基準画像正弦波は、試験画像正弦波と同じであるが、Δm=0である。知覚距離ジェネレータのため、Y0=1を設定すれば十分である。
【0314】
モデルを基本とする曲線上に点を形成するため、前述の刺激が様々なマスクコントラストの値mで与えられた。1JND出力に関するコントラスト閾値Δmが評価された。形成された有色コントラスト感度のデータに対する一致(最後の一致に関しては図17を参照)は、知覚距離ジェネレータ内でパラメータσc,βc,ac,cc,kを調整するために使用された。
【0315】
評価データとの比較
それぞれが様々な歪み度を有する4つの画像配列は、知覚距離ジェネレータをDSCQS評価データと比較するために使用された。その結果が図18にプロットされている。この結果は、知覚距離ジェネレータとデータとの間の相互関係0.9474を示している。各配列に関し、知覚距離ジェネレータは30領域を処理した(先のリリースを試験するために使用された4つの領域とは対照的に)。
【0316】
先のリリースで存在したプロットから複数のデータ点が除去された。これらの点は、以下の2つの理由により削除された。
【0317】
(1)全ての対象に関する「ウォームアップ」試験に対応した5つの点が削除された。配列内の最初の5つの試験は、それらが対象の判断の安定化を示すため、削除されるべきであることを、Rec500は暗示している。
【0318】
(2)“グエン”配列のうちの1つに関しては、試験と基準との間でフォアグラウンドが正確に位置合わせされた場合であっても、バックグラウンド内の3つの画像間で生じる基準配列に関して試験配列の僅かな変化が存在する。この特定の場合に時間位置合わせエラーを有する青画面ビデオが、試験及び基準に関して別個に導入された。
【0319】
JNDマップ解釈
JNDマップは、任意の空間もしくは時間ウインドウ内で複数のJNDを決定する次の処理に適した形式である。前述したように、マップ内の値はQ番目の電力まで引き上げられたJNDのユニットであり、単純なJNDユニットではない。ビデオストリームの任意の空間−時間領域に関する1つのJND値を得るためには、その領域内のJNDマップからの値を合計した後にQ番目のルート(root)をとるだけでよい。
【0320】
一対の例がこの処理を明確にする。各ピクセルに関して1JND値(大抵の場合、最も一般的に望ましい出力)を検索するため、JNDマップ内の各ピクセルのQ番目のルートをとる。
【0321】
しかしながら、一般的なMPEG−2エンコーダ解析の適用においては、各ピクセルに関してではなく、各16×16ピクセルマクロブロックに関する1つのJND値を有していることが有用である。マクロブロック毎にJNDを得るために、最初に、各マクロブロック内のJNDマップ出力の全てを合計し、その後、Q番目のルートをとる。その結果は、JND値のマクロブロック解像度マップとなる。
【0322】
ピラミッド構成:画像サイズ及びボーダー条件
大きな画像寸法N及び小さな画像寸法Mが以下の条件を満たしている場合には、ピラミッド方法の本実施形態は、画像寸法の問題に直面しない。
【0323】
1)Mは、少なくとも128である。
【0324】
2)Mは、商が64よりも小さくなるように、2で多数回(P回)割れる。
【0325】
3)Nは、2でP回割れる。
【0326】
知覚距離ジェネレータは、これらの条件を満たさない任意の画像を不正画像と見なす。これらのルールがどのようにして働くかの一例として、画像寸法N=720、M=480を考える。M>128であるため、条件(a)は満たしている。Mは2で3回割れ、且つ、3度の割り算で商が64よりも小さくなるため、条件(b)を満たす。最後に、Nは2で3回割れて整数になるため、条件(c)を満たす。
【0327】
インターレースの検討
以下の説明の目的は、本知覚距離ジェネレータでの領域インターレース(より詳細には、ライン間の空間)の扱いを明確にすることである。ライン間の空間は、ディスプレイを観察する人間によって視認できないが、それらがモデル形成された黒色値である場合には知覚距離ジェネレータ内で顕著な効果を形成する。知覚距離ジェネレータによる可視性の結果、任意の空間周波数での垂直な画像歪みが、高い周波数のライン構造によってマスクされる。また、ライン構造の可視性は、インターレースされた配列がインターレースされていない配列と比較される際に、JNDアーチファクトの主な原因となる。
【0328】
この問題に対する解決策は、ディスプレイモデルを変更して、ディスプレイそれ自身内で生じる空間及び時間における既知の加重平均を組み込むことである。そのような加重平均は、ライン間の空間を殆ど見えなくする。最初のステップは、これらの効果の大きさを規定して適当なモデルを決定することである。
【0329】
蛍光体は有限の減衰期間を有しているため、ディスプレイ内では時間加重平均が生じる。従って、例えば、領域Nからの偶数のラインからの初期の放射時に、領域N−1からの奇数のラインの減衰する残留物が常に存在する。しかしながら、領域間の間隔(16500×10-6秒)と比較すると、蛍光体の減衰期間は、一般に極めて短く、例えば、青蛍光体で70×10-6秒、緑蛍光体で100×10-6秒、赤蛍光体で700×10-6秒である。従って、ディスプレイモデルにおける時間加重平均は、ライン間のスムージングにそれほど寄与しない。
【0330】
ピクセルからの放射は公称ピクセル境界を越えて広がるため、ディスプレイ内では空間加重平均が生じる。インターレースされた表示において、電子ビームスポット構造は、インターレースアーキテクチャと共に設計された。その結果、ピクセルの広がりは、垂直方向で更に著しくなるように設計された。これにより、ライン間の空間を満たし、ライン間の空間を見えなくした。この広がりは、高い輝度値すなわち画像の最も目立つ部分に対応する高いビーム電流で特に顕著である。従って、ディスプレイ視野から、空間加重平均は、ライン間のスムージングに関して良好な物理モデルである。
【0331】
また、幾つかの時間加重平均は、ライン間のスムージングを達成するために使用できる。視覚システムそれ自体は、ライン間の空間を見えなくするのに十分な時間加重平均を達成するように見える。しかしながら、以下の説明から明らかなように、本知覚距離ジェネレータにおける眼球運動の欠如にって、知覚距離ジェネレータは、存在すべき時間加重平均的な動きから逸脱される。
【0332】
人間の視力は、空間−時間応答の2つの別個のクラス、すなわち、高い空間解像度を有するが低い時間解像度を有する「持続性(sustained)」と、高い時間解像度を有するが低い空間解像度を有する「一時性(transient)」とを有するミカニズムによって促進される。
【0333】
この知覚距離ジェネレータの1つの実施形態は、分離可能な空間/時間フィルタを使用して、2つのチャンネルの応答を形成する。このモデリング選択の直接の結果は、ディスプレイには一般的な60Hzの時間サンプリングレートと比較すると時間的に低域である持続性チャンネルにおける時間フィルタである。一時性応答であっても、60Hzのサンプリングレートに対して敏感ではない。しかしながら、持続性/一時性モデルを受け入れない1つの要素は、眼球運動の効果、特に、画像内の動作対象物を追跡する眼の能力の効果である。この追跡は、ある意味では制約された刺激を伴う心理物理的な実験に対して信頼できる知覚距離ジェネレータフィルタによって捕らえられない前記対象物における詳細に対する視覚感度を高める。
【0334】
画像配列内の歪み測定に関する動きの効果は重要となり得る。眼が画像内で動く対象物を追跡しなかった場合には、持続性時間応答から生じる画像のぼけが、多くの時間加重平均を1つのチャンネル内に有する知覚距離ジェネレータにおいて正確に反映される。しかしながら、眼は動く対象物を追跡するため、画像は不鮮明な動きではない。時間的な視覚応答を定量化したと称する知覚距離ジェネレータは、動く対象物を追跡する能力無くして、動きの不鮮明さを表示しなければならない。しかしながら、そのような不鮮明さは、正確なJNDマップの形成を妨げる。
【0335】
モデルを追跡することなくこの困難性を解決するために、妥協案として、領域の長い時間にわたる平均に関する演算としてではなく、最後の領域に関する演算として空間チャンネル(空間的な詳細に敏感な「持続性」チャンネルの役割を取得する)を示すことにした。このアプローチの結果、空間チャンネルは、画像配列内の対象物の動きを追跡した眼の場合のように、焦点が良く合ったJNDマップを示す。
【0336】
前記妥協案の精神に沿って、2つの領域すなわち1フレームにわたって平均化するように、空間チャンネルの「見かけのよい存在」性質を緩和することができる。この測定は、インターレースされた領域内の空白ラインの視認性を低下させ、「見かけのよい存在」解決策よりも物理的及び生理学的にもっともらしく見える。しかしながら、1つのアーチファクトは、2つの領域の時間加重平均をかわし、それは、滑らかな動作エッジがある「櫛」の出現である。
【0337】
2つの領域加重平均を有するモデル内に櫛が出現する理由を理解するためには、偶数領域(領域Nと称する)と奇数領域(領域N+1と称する)との間を所定の時間間隔で動く対象物を思い浮かべれば十分である。領域間で水平に5ピクセルを動かす垂直エッジを対象物が有していると仮定する。また、対象物のエッジが領域Nの偶数ラインのピクセルnにいると仮定する。その場合、このエッジは、領域N+1の奇数ラインのピクセルn+5に出現する。特定の領域のラスターライン間に「埋まり」が存在する場合、領域N及び領域N+1を加重平均すると、ピクセルnとピクセルn+5との間に居るもはや垂直ではないエッジが形成される。これが「櫛」効果である。
【0338】
実際の視覚システムがこの櫛効果を見ない理由を理解するため、眼が対象物を正確に追跡できるのに十分に対象物が興味深いと仮定する。それは、対象物が網膜上で静止していることを意味する。なぜなら、網膜は、次の領域内への対象物の動きを予期するからである。眼の対象物追跡は殆ど完璧であるため、対象物のエッジは、領域Nの偶数ラインのピクセルnにある場合、また、領域N+1の奇数ラインのピクセルnにもある。
【0339】
櫛及び他のインターレースアーチファクトを回避するため、知覚距離ジェネレータは、ディスプレイ内の各領域のライン間で空間的な埋め込みを行なってもよい。この垂直な加重平均によって、櫛効果を避けることができる。なぜなら、垂直な加重平均は、瞬間的な空間エッジの翻訳を提供するからである(時間的な加重平均ではない)。また、垂直な加重平均は、それが電子ビームスポット構造の既知の空間的広がりと矛盾しないという意味において、インターレースライン構造の視認性に関する初期の問題を解決する。
【0340】
以上、画像信頼性及び視対象適用を向上するため、2つの入力画像配列間の視程差を評価する新規な方法及び装置について説明したが、当業者であれば分かるように、本発明は、その明細書及びその実施形態を開示する添付図面を考慮すれば、多くの変更、修正、変形、他の使用及び用途が可能である。
【図面の簡単な説明】
【図1】 本発明の信号処理システムのブロック図である。
【図2】 知覚距離ジェネレータのブロック図である。
【図3】 入力信号処理部のブロック図である。
【図4】 輝度処理部のブロック図である。
【図5】 クロミナンス処理部のブロック図である。
【図6A】 輝度処理部の詳細なブロック図である。
【図6B】 輝度処理部の詳細なブロック図である。
【図7】 輝度距離形成部のブロック図である。
【図8】 クロミナンス処理部の詳細なブロック図である。
【図9】 クロミナンス距離形成部のブロック図である。
【図10】 輝度空間感度データを示すグラフである。
【図11】 輝度時間感度データを示すグラフである。
【図12】 輝度コントラスト識別データを示すグラフである。
【図13】 ディスク検出データを示すグラフである。
【図14】 チェッカーボード検出データを示すグラフである。
【図15】 エッジ鮮明度識別データを示すグラフである。
【図16】 クロミナンス空間感度データを示すグラフである。
【図17】 クロミナンスコントラスト識別データを示すグラフである。
【図18】 評価予測データを示すグラフである。
【図19】 輝度処理部の他の実施形態のブロック図である。
【図20A】 図19の輝度処理部の他の実施形態の詳細なブロック図である。
【図20B】 図19の輝度処理部の他の実施形態の詳細なブロック図である。
【図21】 輝度距離形成部の他の実施形態の詳細なブロック図である。
【図22A】 半高画像を処理するための輝度処理部のブロック図である。
【図22B】 半高画像を処理するための輝度処理部のブロック図である。
【図23】 半高画像を処理するための輝度距離形成部のブロック図である。
【図24】 クロミナンス処理部の他の実施形態の詳細なブロック図である。
【図25】 クロミナンス距離形成部の他の実施形態の詳細なブロック図である。
【図26】 半高画像を処理するためのクロミナンス処理部のブロック図である。
【図27】 半高画像を処理するためのクロミナンス距離形成部のブロック図である。
【図28】 輝度処理部の他の実施形態のブロック図である。
【符号の説明】
110 信号処理部
112 知覚距離ジェネレータ
114 CPU
116 メモリ
120 入/出力装置
130 信号受信部
132 データ受信部
134 データ記憶部
140 試験用システム
210 入力信号処理部
220 輝度処理部
230 クロミナンス処理部
240 輝度距離(JNDマップ)形成部
250 クロミナンス距離(JNDマップ)形成部
260 知覚距離形成部
410 ピラミッド分解(4レベル)
420 正規化演算
430 ピラミッド画像の正規化
440 空間フィルタリング及びコントラスト演算
450 時間フィルタリング及びコントラスト演算
460,470 コントラストエネルギマスキング
480 輝度JNDマップ
510 ピラミッド分解(7レベル)
520 時間処理
530 空間フィルタリング及びコントラスト演算
540 コントラストエネルギマスキング
550 クロミナンスJNDマップ
910 調整(半波長)
920 3×3フィルタ及びダウンサンプリング
950 Q番目の電力への引き下げ
963 アップサンプリング&3×3フィルタ
2802 ダウンサンプリング
2804 画像処理プロセッサ
2814 時間フィルタ
2810 コントラストコンピュータ
2812 非線形プロセッサ
2816 輝度JNDマップ。

Claims (5)

  1. 2つの信号配列間の視程差を評価するための装置において、
    輝度処理部と、
    クロミナンス処理部と、
    前記2つの処理部に接続され、画像距離を形成するための知覚距離形成部と、 を備え、
    前記輝度処理部は、ダウンサンプラーと、画像領域プロセッサと、複数の画像領域フィルタと、コントラストコンピュータと、非線形プロセッサとを備えており、
    前記画像領域フィルタが空間フィルタであり、
    前記空間フィルタは、2つの連続画像領域内の情報をフィルタリングすると共に、以下の制約下で3×3行列を有する中心フィルタ及び周辺フィルタである4つの空間フィルタ(CH,SH,CV,SV)を備え、前記制約において、
    CHは、中心水平フィルタリングを行なうフィルタカーネルが3×3行列の横列1,3内に全て0を有し且つ横列2内にプラスの数を有していることを示し、
    SHは、周辺水平フィルタリングを行なうフィルタカーネルが3×3行列の横列2内に全て0を有し、横列1内にプラスの数を有し、横列3が横列1と同じであることを示し、
    CVは、中心垂直フィルタリングを行なうフィルタカーネルが3×3行列のCHの転置行列であることを示し、
    SVは、周辺垂直フィルタリングを行なうフィルタカーネルが3×3行列のSHの転置行列であることを示しており、
    前記コントラストコンピュータは、以下の演算を行ない、
    Figure 0004450516
    この場合、iはダウンサンプリングされた画像のピラミッドレベルであり、2及び3は、ダウンサンプリングされた画像がカーネルSH,CH,SV,CVを使用するフィルタリングによって得られる連続画像領域を示し、wSTは較正因子である装置。
  2. 前記空間フィルタが中心フィルタ及び周辺フィルタであることを特徴とする請求項に記載の装置。
  3. 請求項1に記載の装置によって、2つの信号配列間の視程差を評価するための方法において、
    前記装置に含まれるダウンサンプラーによって、画像配列をダウンサンプリングして、ピラミッドレベルを有するダウンサンプリングされた画像を形成し、
    前記装置に含まれる画像領域プロセッサによって、ダウンサンプリングされた画像内の少なくとも2つの画像からの画像領域情報を処理し、
    前記装置に含まれる複数の画像領域フィルタによって、少なくとも2つの画像領域フィルタを使用して前記画像領域情報をフィルタリングして、フィルタリング画像を形成し、
    前記装置に含まれるコントラストコンピュータによって、前記フィルタリング画像に関するコントラスト情報を演算し、
    前記装置に含まれる非線形プロセッサによって、非線形処理を使用して前記コントラスト情報を処理し、
    空間フィルタが中心フィルタ及び周辺フィルタであり、
    前記演算するステップは、以下の演算を行ない、
    Figure 0004450516
    この場合、iはダウンサンプリングされた画像のピラミッドレベルであり、2及び3は、ダウンサンプリングされた画像がカーネルSH,CH,SV,CVを使用するフィルタリングによって得られる連続画像領域を示し、wSTは較正因子である方法。
  4. 画像領域フィルタが空間フィルタである請求項に記載の方法。
  5. 空間フィルタは、2つの連続画像領域内の情報をフィルタリングすると共に、以下の制約下で3×3行列を有する中心フィルタ及び周辺フィルタである4つの空間フィルタ(CH,SH,CV,SV)を備え、前記制約において、
    CHは、中心水平フィルタリングを行なうフィルタカーネルが3×3行列の横列1,3内に全て0を有し且つ横列2内にプラスの数を有していることを示し;
    SHは、周辺水平フィルタリングを行なうフィルタカーネルが3×3行列の横列2内に全て0を有し、横列1内にプラスの数を有し、横列3が横列1と同じであることを示し;
    CVは、中心垂直フィルタリングを行なうフィルタカーネルが3×3行列のCHの転置行列であることを示し;
    SVは、周辺垂直フィルタリングを行なうフィルタカーネルが3×3行列のSHの転置行列であることを示している請求項に記載の方法。
JP2000601599A 1999-02-25 2000-02-25 2つの信号配列間の視程差を評価するための方法及び装置 Expired - Fee Related JP4450516B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US12154399P 1999-02-25 1999-02-25
US60/121,543 1999-02-25
US09/512,402 US6308866B1 (en) 1998-09-28 2000-02-24 Foam forming liquid dispensing device
US09/512,402 2000-02-24
PCT/US2000/005010 WO2000051068A1 (en) 1999-02-25 2000-02-25 Method and apparatus for assessing the visibility of differences between two signal sequences

Publications (2)

Publication Number Publication Date
JP2002538528A JP2002538528A (ja) 2002-11-12
JP4450516B2 true JP4450516B2 (ja) 2010-04-14

Family

ID=26819567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000601599A Expired - Fee Related JP4450516B2 (ja) 1999-02-25 2000-02-25 2つの信号配列間の視程差を評価するための方法及び装置

Country Status (3)

Country Link
EP (1) EP1157354B1 (ja)
JP (1) JP4450516B2 (ja)
WO (1) WO2000051068A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2438661A (en) * 2006-06-02 2007-12-05 Tandberg Television Asa Recursive filtering of a video image including weighting factors for neighbouring picture elements

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2014935C (en) * 1989-05-04 1996-02-06 James D. Johnston Perceptually-adapted image coding system
US5053861A (en) * 1989-07-24 1991-10-01 Eastman Kodak Company Compression method and apparatus for single-sensor color imaging systems
US5463702A (en) * 1992-05-12 1995-10-31 Sony Electronics Inc. Perceptual based color-compression for raster image quantization
US5734432A (en) * 1994-07-15 1998-03-31 Lucent Technologies, Inc. Method of incorporating a variable rate auxiliary data stream with a variable rate primary data stream
EP0869685A3 (en) 1997-04-04 1998-11-18 Tektronix, Inc. Automatic measurement of subjective video quality

Also Published As

Publication number Publication date
EP1157354B1 (en) 2009-12-23
JP2002538528A (ja) 2002-11-12
WO2000051068A1 (en) 2000-08-31
EP1157354A1 (en) 2001-11-28
EP1157354A4 (en) 2005-01-19

Similar Documents

Publication Publication Date Title
US6654504B2 (en) Method and apparatus for assessing the visibility of differences between two signal sequences
US6137904A (en) Method and apparatus for assessing the visibility of differences between two signal sequences
US7684645B2 (en) Enhanced wide dynamic range in imaging
JP3328934B2 (ja) 像を融合する方法およびその装置
JP4047385B2 (ja) 2つの画像系列の差の可視性を評価する方法および装置
US8224085B2 (en) Noise reduced color image using panchromatic image
JP4352371B2 (ja) 適応モザイク減少法を実装するディジタル画像処理方法
US7280703B2 (en) Method of spatially filtering a digital image using chrominance information
US7876956B2 (en) Noise reduction of panchromatic and color image
Masry et al. A metric for continuous quality evaluation of compressed video with severe distortions
US5909516A (en) Method and apparatus for decomposing an image stream into units of local contrast
WO1997037324A1 (en) Apparatus for assessing the visibility of differences between two image sequences
US8587606B2 (en) Apparatus and method for processing image, and apparatus for displaying image
CN102696220A (zh) 将数字图像从低动态范围图像转换为高动态范围图像的方法与系统
US20040264799A1 (en) Method of processing an image to form an image pyramid
JP4611535B2 (ja) 符号化された画像を評価するための処理、装置及び、使用
JP2003264846A (ja) 液晶表示方法
JP4450516B2 (ja) 2つの信号配列間の視程差を評価するための方法及び装置
US20030035581A1 (en) Method and system for measuring perceptual distortion in images
Fales et al. Image gathering and digital restoration
US20130202199A1 (en) Using higher order statistics to estimate pixel values in digital image processing to improve accuracy and computation efficiency
KR100574595B1 (ko) 두개의 신호 시퀀스들 사이의 가시성 차이들을 평가하기 위한 방법 및 장치
Krupinski et al. MTF correction for optimizing softcopy display of digital mammograms: use of a vision model for predicting observer performance
Westen et al. Visual image quality model
Bharathi et al. The Removal of Random Valued Impulse Noise Using Contrast Enhancement and Decision Based Filter

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100119

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100126

R150 Certificate of patent or registration of utility model

Ref document number: 4450516

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140205

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees