JP2015501037A - デジタル画像に関する色解析 - Google Patents

デジタル画像に関する色解析 Download PDF

Info

Publication number
JP2015501037A
JP2015501037A JP2014543473A JP2014543473A JP2015501037A JP 2015501037 A JP2015501037 A JP 2015501037A JP 2014543473 A JP2014543473 A JP 2014543473A JP 2014543473 A JP2014543473 A JP 2014543473A JP 2015501037 A JP2015501037 A JP 2015501037A
Authority
JP
Japan
Prior art keywords
image
information
cpu
illumination
eigencomponent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014543473A
Other languages
English (en)
Other versions
JP5914688B2 (ja
Inventor
リチャード マーク フリードホフ
リチャード マーク フリードホフ
ケーシー アーサー スミス
ケーシー アーサー スミス
Original Assignee
タンデント ビジョン サイエンス インコーポレーティッド
タンデント ビジョン サイエンス インコーポレーティッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by タンデント ビジョン サイエンス インコーポレーティッド, タンデント ビジョン サイエンス インコーポレーティッド filed Critical タンデント ビジョン サイエンス インコーポレーティッド
Publication of JP2015501037A publication Critical patent/JP2015501037A/ja
Application granted granted Critical
Publication of JP5914688B2 publication Critical patent/JP5914688B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/50Lighting effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Abstract

本発明の例示的な第1実施形態では、画像を処理するための自動化されコンピュータ化された方法が提供される。本発明の1つの特徴によれば、この方法は、画像を示す画像ファイルをコンピュータメモリに提供するステップと、画像に関する空間スペクトル情報に応じて固有成分情報を決定するステップと、固有成分情報に応じて解析情報を計算するステップとを含む。

Description

本発明は、デジタル画像に関する色解析に関する。
現代のコンピュータ技術の多くの有意義な、かつ商業的に重要な用途は、画像に関するものである。これらには、画像処理、画像解析、及びコンピュータビジョンアプリケーションが含まれる。例えば、物体認識や光学文字認識などのコンピュータビジョンアプリケーションにおいては、画像の照明アスペクトと物質(素材)アスペクトの分離により、コンピュータパフォーマンスの精度を大幅に改良することができることが判明している。画像の照明アスペクトと物質アスペクトに関係する重要な先駆的な発明は、Richard Mark Friedhoffに付与された「Differentiation Of Illumination And Reflection Boundaries」という名称の特許文献1、及びRichard Mark Friedhoffらに付与された「Method And System For Identifying Illumination Flux In An Image」という名称の特許文献2に開示されている(これらの特許を、本明細書では以後、Friedhoff特許と総称する)。
米国特許第7,873,219号明細書 米国特許第7,672,530号明細書
本発明は、Friedhoff特許の根本の教示内容に対する改良及び向上を提供し、照明成分及び物質反射成分を含む画像の固有成分を識別し、固有成分から導出される解析情報を提供するための方法を含む。
本発明の例示的な第1実施形態では、画像を処理するための自動化されコンピュータ化された方法が提供される。本発明の1つの特徴によれば、この方法は、画像を示す画像ファイルをコンピュータメモリに提供するステップと、画像に関する空間スペクトル情報に応じて固有成分情報を決定するステップと、固有成分情報に応じて解析情報を計算するステップとを含む。
本発明の例示的な第2実施形態では、コンピュータシステムが提供される。コンピュータシステムは、CPUと、画像を含む画像ファイルを記憶するメモリとを備える。本発明の1つの特徴によれば、CPUは、画像に関する空間スペクトル情報に応じて固有成分情報を決定し、固有成分情報に応じて解析情報を計算するためのルーチンを実行するように配置され構成される。
本発明の例示的な第3実施形態では、コンピュータ可読媒体に実装されたコンピュータプログラム製品が提供される。コンピュータプログラム製品は、画像を示す画像ファイルをコンピュータメモリに提供し、画像に関する空間スペクトル情報に応じて固有成分情報を決定し、固有成分情報に応じて解析情報を計算するようにコンピュータを制御するように動作可能なコンピュータ実行可能プロセスステップを含む。
本発明の例示的な第4実施形態では、デバイスが提供される。このデバイスは、CPUと、画像を含む画像ファイルを記憶するメモリとを備え、CPUが、画像に関する空間スペクトル情報に応じて固有成分情報を決定し、固有成分情報に応じて解析情報を計算するためのルーチンを実行するように配置され構成され、デバイスはさらに、解析情報を表示するためのCPUに結合されたディスプレイを備える。
本発明の第5の例示的実施形態では、ディスプレイデバイスが提供される。このディスプレイデバイスは、画像の固有成分情報に応じて計算される解析情報を表示するように配置され構成される。
本発明の更なる実施形態によれば、上述した方法を行うように構成された(例えばプログラムされた)1つ又は複数のコンピュータを含むコンピュータシステムが提供される。本発明の他の実施形態によれば、上述した実施形態を実施するためにコンピュータを制御するように動作可能なコンピュータ実行可能プロセスステップを記憶している非一時的なコンピュータ可読媒体が提供される。本発明は、例えば集積回路チップにおけるようなハードウェア回路として実装される命令を含む、本発明の方法を実行するためにコンピュータで使用可能な情報を実施する任意の製品として、コンピュータ可読媒体を企図する。自動化されコンピュータ化された方法は、デジタルコンピュータ、アナログコンピュータ、光センサ、状態機械、シーケンサ、又は、本発明の方法のステップを実施するように設計もしくはプログラムすることができる任意のデバイスもしくは装置によって行うことができる。
画像に関係付けられた操作/動作を行うように配置され構成されたコンピュータシステムのブロック図である。 図1のコンピュータシステムに記憶されている画像に関するn×m画素/ピクセルアレイ画像ファイルを示す図である。 本発明の例示的実施形態に従う、図1に示される色解析ボックスの制御及び表示パネルの図である。 本発明の1つの特徴に従う、色解析ボックス上に表示するために色解析を実施するためのフローチャートである。 本発明の1つの特徴に従う、画像に関する照明強度ヒストグラム情報を解析するためのフローチャートである。 本発明の1つの特徴に従って図2の画像ファイル内のタイプCトークン領域を識別するためのフローチャートである。 タイプCトークンの識別において一例として使用される元の画像/オリジナル画像を示す図である。 図5bの画像内のタイプCトークン領域を示す図である。 本発明の1つの特徴に従って図5cのタイプCトークンから生成されるタイプBトークンを示す図である。 本発明の1つの特徴に従って図5aのフローチャートのルーチンによって識別されたタイプCトークンをテスト/試験するためのルーチンに関するフローチャートである。 本発明の1つの特徴による対数色空間色度面のグラフィック表現の図である。 入力画像に示される色のリストを決定/判定するためのフローチャートである。 対数色度空間に関する向きを決定するためのフローチャートである。 図8のルーチンの実行により決定された入力画像の色に関する対数色度座標を決定するためのフローチャートである。 図10のルーチンの実行により決定された対数色度座標を増強/増補するためのフローチャートである。 本発明の1つの特徴による、対数色度座標をクラスタリングするためのフローチャートである。 本発明の1つの特徴による空間ハッシュに関するグリッドの例示図である。 図12のルーチンの実行により決定されたクラスタに対数色度座標を割り当てるためのフローチャートである。 対数色度クラスタリングに基づいて均一な反射率の領域を検出するためのフローチャートである。 固有画像を生成するために、同一物質制約に従って画像の照明アスペクトと物質アスペクトとを識別及び分離するために使用される[A][x]=[b]行列関係の表現を示す図である。 図5bの元の画像に対応する照明画像と物質画像を含む固有画像を例示する図である。 本発明の1つの特徴による、図16に例示される固有画像に適用されるエッジ保存ぼかし後処理技法に関するフローチャートである。 本発明の1つの特徴による、図16に例示される固有画像に適用されるアーチファクト減少後処理技法に関するフローチャートである。 本発明の1つの特徴による、図16に例示される固有画像に適用されるBIDRモデル施行後処理技法に関するフローチャートである。 二光源二色性反射モデルによって予測される、完全陰影色値から完全照明色値への物質に関する色を示す、RGB色空間内でのグラフである。
次に図面を参照し、まず図1を参照すると、画像に関係する操作を行うように配置され構成されたコンピュータシステム10のブロック図が示されている。CPU12は、例えばUSBポートを介して、例えばデジタルカメラ14などのデバイスに結合される。デジタルカメラ14は、ビデオカメラを備えることができ、カメラ14にローカルに記憶された画像をCPU12にダウンロードするように動作する。CPU12は、ダウンロードされた画像を画像ファイル18としてメモリ16に記憶する。モニタ20に表示するため、又はプリンタ22で印刷するために、画像ファイル18にCPU12がアクセスすることができる。さらに、CPU12は、色解析ボックス24に結合される。色解析ボックス24は、CPU12によって計算及び出力される照明及び色情報を表示する。色解析ボックス24は、個別の構成要素でよく、又はコンピュータシステム10に組み込むことができる。
あるいは、CPU12は、例えばデジタルカメラ14やロボットなどのデバイスに埋め込まれたマイクロプロセッサとして実装することができる。また、例えばロボット操作やユーザとの対話操作に関連して、画像に関係するリアルタイム操作のためのリアルタイム操作システムをCPU12に備え付けることもできる。
図2に示されるように、各画像ファイル18は、n×mの画素アレイ/ピクセルアレイを備える。各画素pは、全体の画像の別々の部分に対応するピクチャ要素である。全ての画素が合わさって、画像ファイル18によって表現される画像を定義する。各画素は、ピクチャ要素の1組のカラーバンド、例えば赤色、緑色、及び青色成分(RGB)に対応するデジタル値を備える。本発明は、各バンドが電磁スペクトルの一部に対応する任意のマルチバンド画像に適用可能である。画素アレイは、n行m列を含み、画素p(1,1)から始まり、画素p(n,m)で終わる。画像を表示又は印刷するとき、CPU12は、一般に知られているように、対応する画像ファイル18をメモリ16から検索し、画像ファイル18内の画素のデジタル値に応じて、場合によりモニタ20又はプリンタ22を動作させる。
画像操作中、CPU12は、例えば、画像の固有成分、例えば画像ファイル18に示される画像の照明特性及び物質反射特性などを識別することなど、様々な目的を実現するために、記憶されている画像ファイル18の画素のRGB値を解析するように動作する。Friedhoff特許に開示されて特許請求されている、本発明の基本的な発見の根底にある根本的な観察は、画像が2つの成分、すなわち物質成分と照明成分とを備えることである。画像内の全ての変化は、これらの成分の一方又は他方によって引き起こされる。画像の照明特性及び物質反射特性に関する知識により、例えば、画像処理、画像解析、及びコンピュータビジョンアプリケーションの改良された、より正確な処理を実現することができる。
例えば、画像が2つの成分、すなわち物質成分と照明成分を備えるという根本的な観察に基づいて、コンピュータシステム10は、空間スペクトル情報の認識及び解析により、例えば物体縁部など画像の物質アスペクトと照明境界とを区別するように動作させることができる。空間スペクトル情報は、カラーバンドに関する連続する画素間のスペクトル関係(例えば画素のRGB値)や画素スペクトル特性の空間的広がりなど、画像ファイル18に示される画像の連続する画素に関連する情報である。空間スペクトル情報は、例えば、画像に示される単一物質領域や、画像に影響を及ぼす照明など、画像の固有の特性に関連する様式で、CPU12によって処理される。本発明の教示によれば、例えば照明に関連する空間スペクトル情報を使用して、例えば放送及び映像制作環境でのシーン解析で使用するための重要な解析情報を導出することができる。
このために、空間スペクトル情報の一例は、入射又は直接光源と周囲光源との相互作用によって引き起こされるスペクトルシフトに関連する情報であり、それらの光源は、画像ファイル18に示される画像がデジタルカメラ14によって記録される時点に存在する照明を合わさって構成する。入射光源と周囲光源に関するスペクトルは互いに異なることがある。Friedhoff特許の教示の1つによれば、陰影を引き起こす照明境界に関するスペクトルシフト情報は、入射光源と周囲光源の相互作用によって生成される特性スペクトル比によって表される。
陰影によって引き起こされるスペクトルシフト、すなわち入射光源の強度の減少は、画像に示されるシーン内に存在する異なる物質にわたって実質的に不変となる。したがって、決定されるとき、陰影を定義する照明境界に関するスペクトル比は、処理される画像に示される複数の物質にわたる照明変化に特有のものとなり、以下に論じるように、解析情報を導出するために適用することができる。
スペクトル比は、画像に示されるシーンの2つの領域間の色又は強度の相違に基づく比であり、そのような相違は、異なる物質、照明変化、又はそれら両方によって引き起こされることがある。特性スペクトル比は、照明境界に関するスペクトル比であり、これを使用して、画像全体にわたる照明境界の識別など、画像に関する照明情報を識別することができる。一般に、特性スペクトル比は、(周囲照明によって照明される)照明境界の暗色側と、(周囲照明+直接照明によって照明される)境界の明色側との相対色情報を提供する。Friedhoff特許は、以下により詳細に述べるように、画像に関する特性スペクトル比を決定するための自動プロセスを教示する。
さらに、空間スペクトル情報は、固有画像を生成するために使用することができる技法を実現可能にする。固有画像は、元の画像、例えば入力された画像ファイル18内に示される画像に対応する。固有画像は、例えば、画像内に示される表面上の各点に入射する光の強度及び色を捕捉するための照明画像と、画像内に示される表面の反射特性(表面が反射する光の各波長のパーセンテージ)を捕捉するための物質反射画像とを含む。固有画像内で物質から照明を分離することによって、より効果的であり正確な更なる色及び照明解析のために最適化された画像がCPU12に提供される。
本発明の1つの特徴によれば、空間スペクトル情報(例えば特性スペクトル比)と、CPU12によって決定及び生成される、空間スペクトル情報に基づく任意の得られる情報(例えば固有画像)とが、処理される画像に関する解析情報を導出するために使用される。処理される画像は、ビデオの一連の画像でよい。解析情報は、デジタルカメラ14によって記録されるシーンのアスペクト、例えば、放送スタジオのセットに関する照明強度及び相対キーライト及びフィルライト(fill light)情報に関する。解析情報は、例えばセット照明の制御において例えば放送担当者が使用するために、CPU12に結合された色解析ボックス24の制御及び表示パネル上にリアルタイムで表示される。
本発明の例示的実施形態に従って計算される、照明強度や相対キーライト/フィルライト情報などの解析情報は、セット照明の制御において多くの利点を提供する。例えば、連続性を改良するために、解析情報を使用することができる。特定のシーンが数日にわたって記録されるとき、シーンが記録されている環境、例えば屋外環境での照光は、日毎に変化することがある。解析結果は、一貫したフィルライト/キーライト関係を有するようにシーンに関する照明を修正することができるように、照明デザイナーを支援することができる。例えば、照明デザイナーは、同じ深さ及び色で陰影を保つために、解析結果に基づいて照明を修正する。
多くの映像制作において、演者は、グリーンスクリーンの前で演じ、次いで、別の背景に合成される。最良の結果を得るために、演者に対する照明が、背景に対する照明に合致しなければならない。各演者と背景とに関する照明が同じであることを保証するために、照明デザイナーがシーン解析結果を使用することができる。解析結果の同様の有利な用途は、テレプレゼンスに関する。数人のニュースアナウンサーが、しばしば異なる場所におり、同じ場所にいるように見えるように合成される。合成結果は、照明を合致させるために各場所からの解析情報を使用することによって最適化される。
図3は、本発明の例示的実施形態による、図1に示される色解析ボックス24の制御及び表示パネルの例示である。入力画面26は、CPU12によって現在処理されている入力画像、例えば図16に例示されるような元の画像を表示する。固有画像画面28は、CPU12によって計算されて、任意選択で(図示されるように、図16の照明画像からの)固有照明画像、又は任意選択で物質反射画像(例えば図16の物質画像)、又はそれら両方を表示する。
色解析ボックス24のパネル上に一連のユーザ制御機能30を取り付けることができ、ユーザ制御機能30はそれぞれ、適切な制御回路(図示せず)に結合される。例えば、固有画像画面28上の表示を照明画像から物質反射画像に変えるトグルスイッチにユーザ制御機能の1つを結合させることができる。出力画面32は、CPU12による、解析中の現在の画像に関する空間スペクトル情報の処理から導出される解析情報を表示する。本発明の例示的実施形態では、統計量出力画面32に表示される解析情報は、照明強度ヒストグラム、陰影深さ表示、及び相対フィルライト色(relative fill light color)の表示を含む。
図4aは、本発明の1つの特徴による、色解析ボックス24上に表示するために色解析結果を決定するためのプロセスを実施するためのフローチャートである。ステップ1000で、CPU12は、入力として画像ファイル18を受信し、画像ファイル18は、単一画像、又はビデオでの一連の画像の1つを表す。任意選択で、ステップ1002で、CPU12は、入力画像を使用して、照明画像と物質反射画像とを生成する。例示的実施形態では、CPU12は、対数色度クラスタリング及び空間スペクトル演算子/制約/ソルバ技法を実行して、固有画像を生成する。
本発明の1つの特徴によれば、固有画像処理は、トークンレベルで行われる。トークンは、画像の連接領域を定義する空間スペクトル演算子であり、この領域の画素は、物質と照明の識別など、画像の特徴及び特性の識別に関連する様式で互いに関係付けられている。トークンの画素は、例えば画素間の色の密接な相関など均質性因子に関して、又はRGB空間などの色空間内で幾何学的に関係する異なる色値(一般にテクスチャと呼ばれる)など不均質性因子に関して関係付けることができる。本発明は、トークン領域を識別するために、画像ファイル18内に示される画像の連続する画素に関連する空間スペクトル情報を利用する。上述したように、空間スペクトル情報は、画素のカラーバンドに関する連続する画素間のスペクトル関係(例えば画素のRGB値)と、単一の物質に関連する画素スペクトル特性の空間的な広がりとを含む。
本発明の1つの例示的実施形態によれば、トークンはそれぞれ、タイプAトークン、タイプBトークン、又はタイプCトークンとして分類される。タイプAトークンは、連続する画素を備える連接画像領域であり、これらの画素は、シーン内で単一の物質(均一な反射率)を含む取り得る最大の画像領域を表す。タイプBトークンも、連続する画像を備える連接画像領域であり、これらの画素は、シーン内で単一の物質を含む画像領域を表すが、必ずしもその物質に対応する均一な反射率の最大領域ではない。また、タイプBトークンは、どれも同一の反射率(物質の色)を有するが、必ずしもその物質の色に対応する全ての画素ではない、1つ又は複数の画像領域又は画素の集合と定義することもできる。タイプCトークンは、トークンの連続する画素が類似の画像性質を有する連接画像領域を備え、ここで、類似性は、画像を記録するために使用される撮像システムに関する雑音モデルに関して定義される。
次に図5aを参照すると、本発明の1つの特徴による、図2の画像ファイル18に示されるシーン内でタイプCトークン領域を識別するためのフローチャートが示されている。本発明の1つの特徴によれば、図5aのステップを利用して、タイプCトークンを画像内で容易に識別し、次いで解析及び処理して、タイプBトークンを構成することができる。
1次の均一かつ均質なタイプCトークンは、画像の連続する画素間で単一のロバストな色測定値を備える。識別ルーチンの開始時、CPU12は、メモリ内の領域マップをセットアップする。ステップ100で、CPU12は、領域マップをクリアし、領域IDを割り当てる。領域IDは、始めは1に設定される。画素数に対応するルーチンに関する反復数が、i=0に設定され、トークンを決定するためにシードとして使用するためのN×N画素アレイに関する数値が、初期値N=Nstartに設定される。Nstartは、任意の整数>0でよく、例えば11又は15画素に設定することができる。
ステップ102で、シードテストが開始される。CPU12は、例えば第1の画素i=1、すなわち画素(1,1)(図2参照)、すなわち画像ファイル18の第1のN×Nサンプルの左上隅の画素を選択する。次いで、決定ブロック104で、この画素がテストされて、選択された画素が良好なシードの一部であるか判断される。このテストは、選択された画素の色値と、予め選択された数の、シードとしての隣接画素(例えばN×Nアレイ)の色値との比較を含むことができる。色値の比較は、画素の複数のカラーバンド値(本発明者らの例ではRGB)に関するものでよい。比較の結果、シード内の画素に関して(記録デバイスの雑音レベル内で)ほぼ等しい値ではない場合、CPU12は、次のN×Nシードサンプルに関してIの値を増分し(ステップ106)、例えばI=2、すなわち画素(1,2)とし、次いで、I=imaxであるか判断するためにテストする(決定ブロック108)。
画素値がimaxである場合、結果の改良のためにシードサイズを減少させることを決定するためのしきい値として選択される値Nが、例えばN=15からN=12に減少される(ステップ110)。本発明の1つの例示的実施形態では、imaxは、図2に示されるように画素(n,m)で終了する画像内の画素の数に設定することができる。このようにして、図5aのルーチンは、減少されたN値に関するルーチンを繰り返す前に、最初のN値で画像全体をパースする。
シードサイズの減少後、ルーチンはステップ102に戻り、トークンシードに関してテストを続ける。ステップ110で、解析が完了したかどうか判断するために、Nstop値(例えばN=2)もチェックされる。Nの値がNstopである場合、CPU12は、画像画素アレイの調査を完了して、ルーチンから出る。
iの値がimax未満であり、NがNstopよりも大きい場合、ルーチンは、ステップ102に戻り、トークンシードに関するテストを続ける。
良好なシード(ほぼ等しい画素値を有するN×Nアレイ)が見出されると(ブロック104)、そのシードからトークンが成長される。ステップ112で、CPU12は、シードからの画素を待ち行列にプッシュする。待ち行列(キュー)内の画素は全て、領域マップ内で現行領域(現在の領域)IDでマークされている。次いで、CPU12は、待ち行列が空かどうか問い合わせる(決定ブロック114)。待ち行列が空でない場合、ルーチンはステップ116に進む。
ステップ116で、CPU12は、先頭の画素/フロントピクセルを待ち行列から抜き出し(ポップアップし)、ステップ118に進む。ステップ118で、CPU12は、対象画素の周りの「良好な」隣接画素、すなわち対象画素と色値がほぼ等しい隣接画素を現行領域IDでマークする。マークされた良好な隣接画素は全て領域マップ内に配置され、やはり待ち行列にプッシュされる。次いで、CPU12は決定ブロック114に戻る。待ち行列が空になるまでステップ114、116、118のルーチンが繰り返される。そのとき、現行領域内のトークンを形成する画素は全て、領域マップ内でタイプCトークンとして識別されてマークされる。
待ち行列が空であるとき、CPU12はステップ120に進む。ステップ120で、CPU12は、次のトークンの識別で使用するために領域IDを増分する。次いで、CPU12は、ステップ106に戻り、新たな現行トークン領域に関してルーチンを繰り返す。
N=Nstopに達する(図5aのフローチャートのステップ110)と、又は画像と一致する領域マップが完成すると、ルーチンは、トークン生成タスクを完了する。図5bは、トークンの識別における一例として使用される元の画像である。画像は、青色領域及び陰影付きの青色領域、ならびに青緑色領域及び陰影付きの青緑色領域を示す。図5cは、図5bの画像に関して、例えば図5aのルーチンの実行により識別された領域マップに対応するトークン領域(タイプCトークン)を示す。トークン領域は、図5bの画像のトークン作成を示すためにカラーコード化され、画像の完全な青色及び青緑色の領域と色付き領域の陰影との間の半影領域を含む。
各タイプCトークンが、画像の連続する画素間で単一のロバストな色測定値を有する画像領域を備える一方で、トークンは、物質境界をまたいで成長することができる。典型的には、異なる物質が、ネック領域を介して一体につながって1つのタイプCトークンを成し、ネック領域は、多くの場合、陰影境界に位置されるか、又は類似の色調であるが異なる強度を有する、異なる物質を横切る照明の変化を含む領域内に位置される。ネック画素は、隣接する画素の特性を検査することによって識別することができる。ある画素が、対応するトークン内部にない2つの連続する画素を両側に有し、かつ対応するトークン内部にある2つの連続する画素を両側に有するとき、その画素はネック画素と定義される。
図6は、タイプCトークンに関するネックテストに関するフローチャートを示す。ステップ122で、CPU12は、識別されたトークンの各画素を検査して、検査中の画素の任意のものがネックを形成するかどうか判断する。図6のルーチンは、図5aのルーチンの実行中に特定のトークンが識別された直後に、サブルーチンとして実行することができる。ネックとして識別される全ての画素が「成長不可能」とマークされる。決定ブロック124で、CPU12は、任意の画素がマークされたかどうか判断する。
マークされていない場合、CPU12は、図6のルーチンから出て、図5aのルーチンに戻る(ステップ126)。
マークされている場合、CPU12は、ステップ128に進み、シードサイズ及び領域IDに関するカウントを変えずに、図5aのルーチンに従って、現行のトークンのマークされていない画素の中から選択されたシード位置からトークンを再成長させるように動作する。再成長プロセス中、CPU12は、「成長不可能」と事前にマークされた画素は含まない。トークンが再成長された後、事前にマークされた画素がマークを外され、したがって、他のトークンがそれらの画素に成長することができる。
事前にマークされた画素を含まないトークンの再成長後、CPU12は、ステップ122に戻り、新たに再成長されたトークンをテストする。ネックテストは、物質境界を横切るタイプCトークンを識別し、識別されたトークンを再成長させて、タイプBトークンを作成するために使用するのに適した単一物質タイプCトークンを提供する。
図5dは、本発明の1つの特徴に従って図5cのタイプCトークンから生成されたタイプBトークンを示す。本発明は、画像ファイル18に関するタイプBトークンを構成するために、対数色度クラスタリング/クラスタ化を使用する新規の例示的な技法を提供する。対数色度は、照明不変色度空間を開発するための技法である。
対数色度表現を使用して照明と反射とを分離するための方法及びシステムは、参照により本明細書に明示的に援用する米国特許第7,596,266号明細書に開示されている。米国特許第7,596,266号明細書に教示されている技法を使用して、例えばタイプCトークンによって表現される画像の各色に関する照明不変対数色度表現値を提供することができる。画像画素のカラーバンド値の対数値が、対数色空間グラフにプロットされる。次いで、米国特許第7,596,266号明細書に教示されているように、対数値が、二光源二色性反射モデル(BIDRモデル)に応じて方向付けられた対数色度投影面に投影されて、各画素に関する対数色度値を提供する。BIDRモデルは、色変化が、画像内に示されるシーンの単一の物質にわたって陰影を形成する照明変化によるものであるとき、異なる色測定値が、正の傾きに沿った暗色端部(陰影)から明色端部(照明端部)へのRGB空間内の円筒形内に入ると予測する。
図7は、米国特許第7,596,266号明細書に開示されている発明の1つの特徴による対数色空間、二照明色度面のグラフィック表現である。色度面のアライメントは、色度面に垂直なベクトルNによって決定され、N=log(Brightvector)−log(Darkvector)=log(l+1/Svector)と定義される。平面の座標u,vは、u軸としての色度面上への緑色軸の投影と、v軸として定義されるuとNの外積とによって定義することができる。本発明者らの例では、図7に示されるように、物質A、B、Cに関する各対数値が色度面上に投影され、したがって平面内で対応するu,v座標値(色度値)を有する。
したがって、米国特許第7,596,266号明細書に開示されている技法に従って、CPU12によって、図7に示されるように、画像ファイル18内の各画素のRGB値を、画像ファイル値p(n,m,R,G,B)から対数値にマッピングし、次いで色度面への投影によって、対応するu,v値にマッピングすることができる。次いで、CPU12によって、画像ファイル18内の各画素p(n,m,R,G,B)が、2次元の色度値:p(n,m,u,v)によって置き換えられて、元のRGB画像の色度表現を提供する。一般に、Nバンド画像に関して、N個の色値が、N−1個の色度値によって置き換えられる。色度表現は、真に正確な照明不変表現である。なぜなら、その表現が基づくBIDRモデルが、元の画像を引き起こした照明光束を正確かつ適正に表現するからである。
本願の関連出願である、2010年11月10日出願の「System and Method for Identifying Complex Tokens in an Image」という名称の米国特許出願第12/927,244号明細書(参照により本明細書に明示的に援用し、本明細書では以後「関連発明」と呼ぶ)で開示されて特許請求されている発明によれば、均一な反射率の領域(タイプBトークン)の識別のために、CPU12に入力された画像ファイル18内に示される各色に関して、対数色度値が計算される。例えば、タイプCトークンの各画素は、画像を記録するために使用される機器の雑音レベル内で、同一のタイプCトークンの全ての他の成分画素と(例えばRGB値に関して)ほぼ同一の色値である。したがって、各特定のタイプCトークンの成分画素に関する色値の平均を使用して、対数色度解析におけるそれぞれのタイプCトークンに関する色値を表すことができる。
図8は、入力画像、例えば画像ファイル18に示される色のリストを決定するためのフローチャートである。ステップ200で、入力画像ファイル18が、処理のためにCPU12に入力される。ステップ202及び204で、CPU12は、入力画像ファイル18内に示される色を決定する。ステップ202で、CPU12は、色のリストのために、上述した図5aのルーチンの実行によりCPU12によって決定される各タイプCトークンに関する平均色を計算する。CPU12は、解析のために、トークンの成分画素の数に関して最小のトークンサイズ、又は図5aのルーチンに従ってタイプCトークンを決定するために使用される最小のシードサイズ(N×Nアレイ)を任意選択で要求するように動作させることができる。最小サイズ要件は、画像に関する色のリスト内の色測定値が、入力された画像に示されるシーン内の色の正確な描写であり、ブレンド画素のアーチファクトではないことを保証するように実装される。
ブレンド画素は、異なる色の2つの画像領域の間の画素である。2つの領域の間の色がRGB空間内にプロットされる場合、色間に線形遷移があり、1つの領域から次の領域に向かう各ブレンド画素は、2つの領域の色の重み付け平均である。したがって、各ブレンド画素は、画像の真の色を表現しない。ブレンド画素が存在する場合、ブレンド画素からなる比較的小さいタイプCトークンを、2つの別の色の領域の間の画像の領域に関して識別することができる。サイズ最小値を要求することによって、CPU12は、ブレンド画素からなるトークンを解析から省くことができる。
ステップ204で、CPU12は、代替として、画素レベルでの色、すなわち、図2に示されるような入力画像ファイル18の画素のRGB値を収集することができる。CPU12は、より正確な色のリストのために、解析で使用される画像ファイル18の各画素が、フィルタ出力による最小の安定性又は局所標準偏差を有することを任意選択で要求するように動作させることができる。例えば、第2次導関数エネルギーを使用して、画像の画素の安定性を示すことができる。
この手法では、CPU12は、ガウス微分(Difference of Gaussians)、ガウスのラプラシアン(Laplacian of Gaussian)、又は同様のフィルタを使用して、入力画像ファイル18内に示される画像の全ての照明条件を網羅するように画像全体にわたって分配された各画素又は画素の部分集合での第2次導関数を計算する。次いで、検査される各画素に関する第2次導関数エネルギーを、CPU12によって、各色バンドでの第2次導関数の絶対値(又はグレースケール画像での単一の値の絶対値)の平均として、各色バンドでの第2次導関数の値の平方和(又はグレースケール画像での単一の値の平方和)として、色バンドにわたる最大平方第2次導関数値(又はグレースケール画像での単一の値の平方)として、又は任意の同様の方法で計算することができる。各画素に関する第2次導関数エネルギーの計算後、CPU12は、画素のエネルギー値を解析する。第2次導関数エネルギーと画素安定性との反比例関係が存在し、エネルギーが高ければ高いほど、対応する画素は不安定になる。
ステップ206で、CPU12は、(ステップ202及び/又は204の一方又は両方の実行後に)色のリストを出力する。関連発明の1つの特徴によれば、更なる処理は全て、各ステップ202又は204からのリストを使用して実行することができ、又は各後続のステップで使用されるリスト(ステップ202又は204からのリストの一方又は他方)を変えることができる。
図9は、関連発明の1つの特徴による、対数色度表現に関する向きを決定するためのフローチャートである。例えば、CPU12は、図7に示されるように、対数色度面に対する垂線Nに関する向きを決定する。ステップ210で、CPU12は、図8のルーチンのステップ206で出力されたリストなど、入力ファイル18に関する色のリストを受信する。ステップ212で、CPU12は、対数色度空間に関する向きを決定する。
米国特許第7,596,266号明細書に教示されるように、また上述したように、色度面の向きは、Nによって表現され、Nは、色度表現、例えば図7の色度面に垂直なベクトルである。向きは、CPU12によって、いくつかの技法の任意の1つの実行により推定される。
例えば、CPU12は、米国特許第7,596,266号明細書に完全に開示されているように、エントロピー最小化、ユーザによる同一物質の照明/陰影領域の手動選択、又は入力画像ファイル18の画像に関する(向きNに対応する)特性スペクトル比の使用に基づいて推定値を決定することができる。特性スペクトル比は、Friedhoff特許で完全に開示されている様々な技法の任意の1つの実施することによって、CPU12によって自動的に決定することができる。これらの技法は、画像内でX−junctionを識別することを含む。X−junctionは、物質縁部と照明境界が互いに交差する画像の領域であり、空間スペクトル情報の優れた一例である。Friedhoff特許に開示されている技法によれば、スペクトル比は、識別されたX−junctionによって定義される画像の領域内で、照明境界に関して決定される。
より高い次元の色セット、例えばRYGB空間(赤色、黄色、緑色、青色)に関しては、対数色度垂線Nは、入力された空間よりも1次元低い次元を有する下位空間を定義する。したがって、4次元のRYGB空間では、垂線Nは、3次元の対数色度空間を定義する。4次元RYGB値が3次元対数色度空間に投影されるとき、対数色度空間内部の投影された値は、照明変化によって影響を及ぼされない。
ステップ214で、CPU12は、垂線Nに関する向きを出力する。図7の例で例示されるように、垂線Nは、3次元RGB空間内でのu,v平面に対する向きを定義する。
図10は、図8のルーチンのステップ202又は204で識別されるように入力画像の色に関する対数色度座標を決定/判定するためのフローチャートである。ステップ220で、色のリストが、CPU12に入力される。色のリストは、図8のルーチンのステップ202の実行により生成されたリスト、又はステップ204の実行により生成されたリストを備えることができる。ステップ222で、図9のルーチンの実行により決定された垂線Nに関する対数色度向きも、CPU12に入力される。
ステップ224で、CPU12は、色のリスト内の各色に関する対数値を計算するように動作して、図7に例示されるように、対数値をそれぞれの(logR,logG,logB)座標で3次元対数空間内にプロットする。物質A、B、及びCは、ステップ220でCPU12に入力された色のリストからの特定の色に関する対数値を表す。また、CPU12によって、u,v座標と、ステップ222でCPU12に入力されたNによって設定される向きとを用いて、3次元対数空間内で対数色度面が計算される。対数色度面での各u,v座標も、3次元対数空間内の対応する(logR,logG,logB)座標によって表すことができる。
関連発明の1つの特徴によれば、CPU12は、次いで、各色に関するu,v対数色度座標を決定するために、色A、B、及びCに関する対数値を対数色度面上に投影する。各u,v対数色度座標は、3次元対数空間内の対応する(logR,logG,logB)座標によって表現することができる。CPU12は、ステップ226で、対数色度座標のリストを出力する。リストは、各色と、u,v対数色度座標、及び(解析で使用される色のリストに応じて(ステップ202(トークン)又は204(画素)))それぞれの色を有する画素(又はタイプCトークン)とを相互参照する。
図11は、関連発明の1つの特徴による、更なる次元を用いて画素又はタイプCトークンに関する対数色度座標を任意選択で増強/増補するためのフローチャートである。ステップ230で、図10のルーチンの実行により入力画像の色に関して決定された対数色度座標のリストが、CPU12に入力される(所与される)。ステップ232で、CPU12は、増補での使用のために、入力画像ファイル18にアクセスする。
ステップ234で、CPU12は、任意選択で、各対応する画素(又はタイプCトークン)に関するトーンマッピング強度を用いて各対数色度座標を増補するように動作する。トーンマッピング強度は、任意の既知のトーンマッピング技法を使用して決定される。トーンマッピング強度情報を用いた増補は、同様の対数色度座標と同様のトーンマッピング強度との両方に従ってグループ化される画素又はトークンをクラスタリングするための基礎を提供する。これは、クラスタリングステップの精度を改良する。
ステップ236で、CPU12は、任意選択で、対応する画素に関するx,y座標(又はタイプCトークンの成分画素に関するx,y座標の平均)を用いて各対数色度座標を増補するように動作する(P(1,1)からP(N,M)への画素配置を示す図2参照)。したがって、x,y座標情報を用いたクラスタリングステップは、その特性が望まれるときには、空間的に制限された配置でグループを提供する。
各ステップ234及び236において、増補された情報は、各場合にそれぞれ因子w、及びw、wによって重み付けすることができ、増補された座標における異なる次元の相対的な重要性及びスケールを指定する。重み付け因子w、及びw、wは、ユーザ指定される。したがって、画素又はタイプCトークンに関する(logR,logG,logB)座標は、(logR,logG,logB,T,x,y)に増補され、ここで、T、x、及びyは、それぞれ、トーンマッピングされた強度、x座標、y座標である。
ステップ238で、CPU12は、増補された座標のリストを出力する。増補された対数色度座標は、画素の正確な照明不変表現を提供し、又は、例えばタイプCトークンなど入力画像の指定された領域的配置を提供する。関連発明及び本発明の1つの特徴によれば、対数色度座標の照明不変特性は、例えばタイプBトークンなど、単一の物質又は反射率の画像の領域を識別するための基礎として依拠される。
図12は、本発明の1つの特徴に従って対数色度座標をクラスタリング/クリスタ化するためのフローチャートである。ステップ240で、増補された対数色度座標のリストが、CPU12に入力される。ステップ242で、CPU12は、対数色度座標をクラスタリングするように動作する。関連発明の教示によれば、クラスタリングステップは、例えば既知のk平均法(k-means clustering)によって実施することができる。関連発明によれば、任意の既知のクラスタリング技法を使用して、対数色度座標をクラスタリングして、同様の対数色度座標値のグループを決定することができる。関連発明及び本発明のそれぞれの教示によれば、CPU12は、各対数色度座標を、それぞれの座標が属するグループに相関させる。
本発明の1つの特徴によれば、クラスタリングステップ242は、データベース管理で使用されるタイプのインデックス、例えば、ハッシュインデックス、空間ハッシュインデックス、B木(b-trees)、又はデータベース管理システムで一般に使用される任意の他の既知のインデックスに応じて実施される。インデックスに応じてクラスタリングステップ242を実施することによって、画像の各画素又はトークンに関するクラスタグループを識別するのに必要とされる比較の数が最小化される。したがって、クラスタリングステップは、CPU12によって最小時間量で実行することができ、全体の画像処理を速める。
図12aは、本発明の例示的実施形態の1つの特徴による、空間ハッシュに関するグリッドの例示である。図12aに示されるように、空間ハッシュは、処理された画像をバケットのグリッドに分割し、各バケットは、spatial Thresh×spatial Threshとなるように寸法設定される。グリッドは、クラスタグループに関するu,v対数色度値のヒストグラムを表す。各クラスタが作成されるとき、クラスタへの参照が、グリッドの適当なバケットに配置される。
処理された画像の各新たな画素又はトークンは、要素(画素又はトークン)がクラスタリングプロセスでの新たなグループであるかのように、グリッド内に、それが占有するバケット内に配置される。次いで、画素又はトークンは、検査される要素が占めるバケットを取り囲む3×3のバケットグリッド内で、クラスタに関して検査される。要素は、例えば、要素がcluster Meanに関するしきい値内にある場合、3×3グリッド内のクラスタグループに追加される。
また、CPU12は、クラスタリングステップで識別される各グループに関する中心を計算するように動作する。例えば、CPU12は、(logR,logG,logB,logT)空間に対する各グループに関する中心を決定することができる。
ステップ244で、CPU12は、(対応する画素又はタイプCトークンに相互参照される)対数色度座標に関するクラスタグループメンバーシップのリスト、及び/又はクラスタグループ中心のリストを出力する。
本発明の更なる特徴によれば、クラスタグループメンバーシップのリストを、画像特性のユーザ入力を用いて増補することができる。例えば、ユーザは、同一の物質反射率である画像の画素又は領域を指定することができる。CPU12は、ユーザ指定された同一の反射率の画素又は領域を、クラスタリンググループメンバーシップ情報にオーバーレイするように動作する。
上述したように、クラスタリング方法の実行時、CPU12は、図6のルーチンのステップ202の実行により生成されたリスト、又はステップ204の実行により生成されたリストからの色のリストを使用することができる。識別されたクラスタグループを入力画像に適用する際、クラスタリング方法で使用されるのと同一の色セット(ステップ202に対応する色のリスト、又はステップ204に対応する色のリストの一方)を使用するようにCPU12を動作させることができ、又は、異なる色セット(ステップ202に対応する色のリスト、又はステップ204に対応する色のリストの他方)を適用するように動作させることができる。異なる色セットが使用される場合、CPU12は、図11のルーチンを実行するように進行する。
図13は、本発明の1つの特徴による、クラスタグループの識別後に異なる色リストが使用されるときの、図12のルーチンの実行により決定されたクラスタに対数色度座標を割り当てるためのフローチャートである。ステップ250で、CPU12は、ここでは新たな色のリストに対して、図10のルーチンを再び実行する。例えば、ステップ202で生成される色(タイプCトークンに基づく色)のリストを使用してクラスタグループを識別し、次いで、CPU12が、ステップ204で生成された色(画素に基づく色)のリストに基づいてクラスタグループに対して対数色度座標を分類するように動作する場合、図13のルーチンのステップ250が実行されて、入力画像ファイル18内の画素の色に関する対数色度座標を決定する。
ステップ252で、クラスタ中心のリストが、CPU12に入力される。ステップ254で、CPU12は、ステップ250で識別された各対数色度座標を、最も近いクラスタグループ中心に従って分類するように動作する。ステップ256で、CPU12は、新たな色リストに基づいて、対数色度座標に関するクラスタグループメンバーシップのリストを出力し、ステップ250で使用された色のリスト(ステップ202で生成された色のリスト又はステップ204で生成された色のリスト)に応じて、対応する画素又はタイプCトークンと相互参照する。
図14は、本発明の1つの特徴による、対数色度クラスタリングに基づいて均一な反射率の領域を検出するためのフローチャートである。ステップ260で、入力画像ファイル18が、CPU12に再び提供される。ステップ262で、ステップ250で使用された色のリストに応じた画素又はタイプCトークンの1つが、CPU12に入力される。ステップ264で、ステップ244又は256からのクラスタメンバーシップ情報が、CPU12に入力される。
ステップ266で、CPU12は、同一のクラスタグループメンバーシップを有する各画素、又は例えばタイプCトークンなど入力画像の指定された領域をマージして単一の画像領域にし、均一な反射率の領域(タイプBトークン)を表すように動作する。CPU12は、場合により、入力画像ファイル18に関する画像又はトークン全てに関してそのようなマージ操作を行う。ステップ268で、CPU12は、均一な反射率の(及び、対数色度座標がステップ234及び/又は236で増補された場合には、同様のトーンマッピング強度及びx,y座標も)全ての領域のリストを出力する。関連発明の特徴に従って決定される均一な反射率の各領域(タイプBトークン)が、場合によっては、領域にわたる大きな照明変化を伴うことに留意すべきである。
米国特許出願公開第2010/0142825号明細書は、同一物質制約に基づく最適化されたソリューションを含む、画像内の照明と物質を分離するための空間スペクトル演算子/制約/ソルバモデルを教示している。米国特許出願公開第2010/0142825号明細書に教示されている同一物質制約は、関連発明の教示に従って決定することができるタイプCトークン及びタイプBトークンを利用する。この制約関係は、同一のタイプBトークンの一部である全てのタイプCトークンが、同一物質に制約されるというものである。この制約は、タイプBトークンの定義、すなわち、連続する画素を備える連接画像領域であって、シーン内で単一の物質を包含する画像の領域を表現するが、必ずしもその物質に対応する最大領域ではない連接画像領域という定義を施行する。したがって、同一のタイプBトークン内にあるタイプCトークンは全て、タイプBトークンに課される定義によって、同一物質のものであるが、必ずしも同一照明ではない。したがって、タイプCトークンは、異なる照明によって引き起こされる観察される見た目の差に対応するように制約される。
図15は、米国特許出願公開第2010/0142825号明細書に教示されているように、同一物質制約に従って画像の照明アスペクトと物質アスペクトとを識別及び分離するために使用される[A][x]=[b]行列関係の表現である。基本式I=ML(I=画像ファイル18に記憶されている、記録された画像値、M=物質反射、及びL=照明)に基づいて、log(I)=log(ML)=log(M)+log(L)である。これは、i=m+lと書き換えることができ、ここで、iはlog(I)を表し、mはlog(M)を表し、lはlog(L)を表す。同一物質の制約関係では、(図15に示される)3つのタイプCトークンa、b、及びcが、a、b、及びcによって定義される対応するタイプBトークンによって定義される単一の反射率の領域内にある一例では、m=m=mである。この例において、各タイプCトークンに関するI値は、トークンの成分画素の記録された色値に関する平均色値である。a、b、及びc、すなわちこの例のタイプCトークンは、図5dに例示される青色のタイプBトークンに対応することがある。
=i−l、m=i−l、及びm=i−lであるので、これらの数学的関係は、同一物質制約では、(1)l+(−1)l+(0)l=(i−i)、(1)l+(0)l+(−1)l=(i−i)、及び(0)l+(1)l+(−1)l=(i−i)と表現することができる。
したがって、図15の行列式において、[b]行列でのlog(I)に関する様々な値(i、i、i)は、隣接するタイプCトークンa、b、及びcの成分画素に関する記録された平均画素色値から分かる。0、1、及び1からなる[A]行列は、上述したように、同一物質制約を表現する方程式の組によって定義される。[A]行列内で上から下への行の数は、トークンに課される実際の制約の数に対応し、この場合は3であり、すなわち3つの隣接するタイプCトークン間での同一物質制約である。[A]行列内で左から右への列の数は、求解すべき未知数の数に対応し、この場合、やはり3つのトークンに関する3つの照明値である。したがって、CPU12によって、[x]行列における各タイプCトークンa、b、及びcの照明成分に関する値をこの行列式で求解することができる。各値は、本発明者らの例のカラーバンド(赤色、緑色、及び青色など)に対応する3つの値のベクトルであり、又は、例えばグレースケール画像では単一の値でもよいことに留意すべきである。
照明値が分かると、CPU12によって、式I=MLを使用して物質の色を計算することができる。ここで、トークンa、b、及びcによって定義される領域に関して、元の画像での各画素をそれぞれ計算された照明値及び物質値によって置き換えることによって、固有照明画像及び固有物質画像を生成することができる。図3bに示される元の画像に対応する照明画像と物質画像の一例が図16に例示されている。
本発明による対数色度クラスタリング技法によって得られるタイプCトークン及びタイプBトークンを利用する、米国特許出願公開第2010/0142825号明細書の技法及び教示による制約/ソルバモデルの実装は、元の入力画像に対応する固有画像を生成するための非常に効果的かつ効率的な方法を提供する。固有画像は、画像処理、画像解析、及びコンピュータビジョンアプリケーションの精度及び効率を向上させるために使用することができる。
しかし、本発明の例示的実施形態の実施により生成される固有画像は、処理された画像内に示されるシーンの見た目を歪めるアーチファクトを含むことがある。アーチファクトは、本発明の固有画像生成方法の実行により、又は上述した画像特性のユーザ入力などユーザ変更により導入されることがある。したがって、本発明の1つの特徴によれば、アーチファクトを減少させるために様々な後処理技法を実施することができる。
図17は、固有画像内に示される照明アスペクト及び物質反射アスペクトの質を改良するための、本発明の1つの特徴による、図16に例示される固有画像に適用されるエッジ保存ぼかし後処理技法に関するフローチャートである。ステップ300で、CPU12は、入力として、元の画像(画像ファイル18)と、上述したように図15に示される行列式を解くことによりCPU12によって決定された対応する固有物質反射画像及び固有照明画像とを受信する。
ステップ302で、CPU12は、エッジ保存平滑化フィルタを適用することによって、照明画像内の照明のエッジ保存ぼかしを行うように動作する。エッジ保存平滑化フィルタは、例えば、双方向フィルタ、ガイデットフィルタ、ミーンシフトフィルタ(mean-shift filter)、メジアンフィルタ、異方性分散など、既知のフィルタの任意の1つでよい。フィルタは、照明画像に1回又は複数回適用することができる。例示的実施形態では、双方向フィルタが、照明画像に2回適用される。さらに、複数の異なるタイプのフィルタを連続して適用することもでき、例えば、メジアンフィルタと、それに続く双方向性フィルタである。
ステップ304で、CPU12は、式I=MLに基づいて、かつ画像ファイル18の元の画像と、ステップ302で修正された照明画像とを使用して、固有物質反射画像を再計算する。ステップ306で、CPU12は、図17のルーチンの実行によりCPU12によって修正された固有物質反射画像及び固有照明画像を出力する。
照明画像に適用される平滑化フィルタは、例えばコンピュータグラフィックスなどのアプリケーションで使用されるときに、固有画像の見た目にいくつかの改良をもたらす。例えば、コンピュータグラフィックスでは、いくつかの特別な効果を実現するためにテクスチャマッピングが使用される。アーティストは、テクスチャマッピングの実施において、何らかのファインスケールテクスチャが物質反射画像内で照明を生み出すようにすることが望ましいと考える。ステップ302で照明画像を平滑化することによって、以下に述べるステップ304での物質画像の再計算後、ファインスケールテクスチャが物質反射画像に移される。
さらに、ステップ302での照明の平滑化は、陰影照明のいくらか(表面の湾曲による照明強度変化)を物質反射画像に戻し、何らかの湾曲表現を物質画像に与える。これは、コンピュータグラフィックスアプリケーションでのアーティスティックレンダリング(artistic rendering)のためにより適した、改良された物質の描写をもたらす。
さらに、小さな反射率変化は、時として、誤って照明画像に入る。ステップ302での平滑化は、反射率変化を物質画像に戻す。
図18は、固有画像内に示される照明アスペクト及び物質反射アスペクトの質を改良するための、本発明の1つの特徴による、図16に例示される固有画像に適用されるアーチファクト減少後処理技法に関するフローチャートである。ステップ400で、CPU12は、入力として、元の画像(画像ファイル18)と、上述したように図15に示される行列式を解くことによりCPU12によって決定された対応する固有物質反射画像及び固有照明画像とを受信する。任意選択で、固有画像は、図17のルーチンの実行によりCPU12によって事前に修正することができる。
ステップ402で、CPU12は、元の画像と物質反射画像とのそれぞれの画素に関して導関数(隣接する画素の差)を計算するように動作する。水平方向及び垂直方向での隣接する画素間の変化は、元の画像に示されるシーン内の照明変化及び異なる物質によって引き起こされる。CPU12が、元の画像を固有照明画像及び固有物質反射画像に分解するように動作するとき、いくらかの変化が照明画像内で生じ、いくらかの変化が物質反射画像内で生じる。理想的には、照明画像内の変化の全てが、照明の変化に起因し、物質反射画像内の変化の全てが、異なる物質に起因する。
したがって、照明変化を除去することによって、物質反射画像の変化は、元の画像の変化よりも真に小さいはずである。しかし、固有画像を生成するためのプロセスの不正確さが、物質反射画像に現れる新たなエッジをもたらすことがある。
ステップ404で、CPU12は、物質反射画像に関する導関数を元の画像に関する導関数と比較することによって、新たに現れるエッジによって引き起こされるアーチファクトを識別するように動作する。CPU12は、物質反射画像の各導関数に関して、符号は保存されるが、大きさは、元の画像と物質反射画像との導関数の大きさの最小値に設定されるように、物質反射画像の導関数を修正する。修正は、以下の式によって表現することができる。
新たな反射画像の導関数=(前の反射画像の導関数の絶対値と、元の画像の導関数の絶対値との小さい方)×(前の反射画像の導関数の符号)
ステップ406で、CPUは、修正された導関数を積分して、新たな物質反射画像を計算する。新たな画像は、アーチファクトに起因する新たに現れるエッジを含まない物質反射画像である。積分を行うために、任意の既知の技法を実施することができる。例えば、CPU12は、離散コサイン変換を使用して2次元ポアソン方程式を解くことによって、数値的2D積分を行うように動作することができる。
ステップ408で、CPU12は、式I=MLに基づいて、かつ画像ファイル18の元の画像と、ステップ404及び406で修正された物質反射画像とを使用して、固有照明画像を再計算する。ステップ408で、CPU12は、図18のルーチンの実行によりCPU12によって修正された固有物質反射画像及び固有照明画像を出力する。
図19は、固有画像内に示される照明アスペクト及び物質反射アスペクトの質を改良するための、本発明の1つの特徴による、図16に例示される固有画像に適用されるBIDRモデル施行後処理技法に関するフローチャートである。
上述したように、BIDRモデルは、完全な陰影から完全な照明への半陰影で、物質に関する正しい色を予測する。図20に示されるように、BIDRモデルの予測によれば、例えばRGB色空間内での、完全陰影色値から完全照明色値への物質に関する色は、色空間内で概してライン(線)を成す。完全陰影では、物質は周囲光源によって照明され、完全照明時には、物質は、周囲光源と、画像ファイル18のデジタル画像が記録された時点でシーン内に存在した直接又は入射光源によって照明される。
BIDRモデルによれば、画像内の照明値も、周囲光源の色から、周囲光源と直接光源との複合の色まで延びる直線を定義する。対数色空間では、BIDRモデルによって予測される照明ラインが、図5に例示される対数色空間色度面の垂線Nに対応する。
上述したように、固有照明画像及び固有物質画像の生成時の様々な不正確さは、例えば、BIDRモデルによって予測される照明値に関するラインから逸脱する、生成された固有照明画像内の照明値をもたらすこともある。本発明によれば、BIDRモデルの照明ライン予測を使用して、log(RGB)空間内で線形であるように照明を修正することによって、そのような不正確さを補正する。
図19を再び参照すると、ステップ500で、CPU12は、図7に例示される垂線Nに対応するBIDR照明向きを入力として受信する。本発明の例示的実施形態では、上述したように、Nは、CPU12によって図9のルーチンの実行により決定される。その場合、図9のルーチンの実行により決定されるNは、上述したクラスタリングプロセスと、図19に例示されるBIDRモデル施行後処理技法との両方で使用される。
照明画像及び物質反射画像が、例示的実施形態の対数色度クラスタリング技法とは異なる方法によって生成される場合、向きNは、CPU12によって、図9のルーチンの実行により、図19のルーチンの実行前に別個のステップで決定される。Nが別個のステップで決定されるとき、CPU12は、元の画像又は照明画像に対して操作することができる。さらに、上述したように処理がユーザ入力に基づくとき、ユーザは、元の画像又は照明画像から選択を行うことができる。
さらに、ステップ500で、CPU12は、ここでも、入力として、元の画像(画像ファイル18)と、やはり上述したように図13に示される行列式を解くことによりCPU12によって決定された対応する固有物質反射画像及び固有照明画像とを受信する。任意選択で、固有画像は、図17及び図18の一方又は両方のルーチンの実行によりCPU12によって事前に修正することができる。
ステップ502で、CPU12は、照明画像内の完全照明色を決定する。完全照明色(周囲+直接)は、照明画像内で示される最も明るい色値でよい。しかし、最も明るい値は、画像内の雑音又は他の外れ値により不正確であることがある。本発明の好ましい例示的実施形態では、予め選択された強度パーセンタイル範囲(例えば、87〜92パーセンタイル)内の全ての照明色値を見つけ、それらの値の平均を計算することによって、より正確な決定が行われる。平均は、完全照明色値として使用される。そのような手法は、固有照明画像内の照明変化の明色端部のロバストな推定値を提供する。
ステップ504で、CPU12は、照明画像内の画素によって示される全ての照明色を、(ステップ500でCPU12に入力された)向きNを有し、ステップ302で決定された完全照明色を通過するライン上の最も近い点に投影することによって、照明画像の画素全てを修正するように動作する。したがって、照明画像の各画素の色は、BIDRモデル予測によって要求される最も近い値に適合するように修正される。
ステップ502で計算されたときに完全照明色値よりも大きい強度を有する照明画像の画素に関して、特殊なケースが存在する。この特殊なケースは、いくつかの異なる方法に従ってCPU12によって取り扱うことができる。第1の方法では、各高強度画素を照明ライン上の最も近い値に投影することによって、全ての他の画素と同様に修正が完了される。第2の方法では、各高強度画素が、完全照明色値に設定された画素によって置き換えられる。第3の方法によれば、各高強度画素が、元の画像と同様の色値で保たれる。
追加の方法は、各高強度画素に関して、第1の方法と第3の方法に従って決定された値、又は第2の方法と第3の方法に従って決定された値の重み付け平均を使用することによって実施される。値が、ステップ502で計算された完全照明色値よりも大幅には明るくない高強度画素と同様であるとき、重みは、第1又は第2の方法に従って計算された値を優先する。高強度画素に関する値が完全照明色値よりも大幅に明るいときには、第3の方法によって計算された値が優先される。そのような重み付け方式は、画像特性に関する式I=MLが、例えば鏡面反射の存在下で不正確であるときに有用である。
照明値に関する相対重みを決定するために、任意の既知の技法を実施することができる。本発明の例示的実施形態では、シグモイド関数が構成され、それにより、高強度画素の強度が完全照明色値又はその付近であるときには、全ての重みが第1又は第2の方法に従って決定された値にかかり、強度が増加するにつれて、第1又は第2の方法に従って決定された値と第3の方法に従って決定された値との間で、均等に重み付けされた値へ滑らかに移行する。その後、強度が完全照明色値を大幅に超えて増加するとき、第3の方法に従って決定された値に重みが完全にかかるまで、更なる滑らかな移行が生じる。
ステップ506で、CPU12は、式I=MLに基づいて、かつ画像ファイル18の元の画像と、ステップ504で修正された照明画像とを使用して、固有物質反射画像を再計算する。ステップ508で、CPU12は、BIDRモデルの予測に厳密に従うように修正された固有物質反射画像及び固有照明画像を出力する。
最良の結果を得るために、上述した後処理技法を、log(RGB)空間で実行することができる。また、様々な技法を上述した順序で実行することができる。1つ又は複数の後処理技法が実行された後、最終的な修正された固有画像は、CPU12によって、望みに応じてホワイトバランス処理及び/又はスケール調整して、出力することができる。
本発明の例示的実施形態の別の特徴によれば、CPU12によって、カメラ14によって記録されたシーン内に示される顔に対して、追加の処理が実施される。米国特許出願公開第2011/0150338号明細書が、単一反射技法を使用して固有画像を生成するための方法を教示する。いくつかの画像ファイル18に示される画像は、単一物質、例えば人間の顔の皮膚によって占められている。そのような場合、米国特許出願公開第2011/0150338号明細書に開示されている方法は、固有画像の生成に関連するコンピュータ処理を改良するために、単一反射領域が画像を占めていることを利用する。
本発明の例示的実施形態では、CPU12は、画像内で顔を位置特定するために、既知の目の検出器又は他の顔標識点の位置特定機能を実行し、次いで、各検出された顔領域に対して、米国特許出願公開第2011/0150338号明細書によって教示される単一反射技法を適用して、皮膚画素からなる単一物質領域を識別する。CPU12は、検出された目又は他の顔特徴点の周りで、所定のサイズの領域を切り取るように動作させることができ、顔領域を画定し、切り取られた領域に米国特許出願公開第2011/0150338号明細書の技法を適用する。CPU12によって識別される皮膚画素の各領域に関して、CPU12は、各検出された顔領域の皮膚に関する物質反射、例えば特定の顔領域に関する94〜97パーセンタイルの最も明るい皮膚画素の平均を推定することができる。式I=MLに基づいて、CPU12は、次いで、皮膚画素及び物質反射性推定値に関する記録された値を使用して、各顔にわたる照明を推定することができる。
図4aをもう一度参照すると、照明画像と物質反射画像の生成(ステップ1002)後、CPU12はステップ1004に進む。ステップ1004で、CPU12は、照明強度ヒストグラム、陰影深さ表示、及び相対フィルライト色の表示を含む、出力画面32上に表示するために解析情報を決定するために使用される様々な統計量を計算するように動作する。
本発明の例示的実施形態では、統計量は、固有画像に対して、又は元の画像から決定される。さらに、画像内の各顔に関する統計量は、米国特許出願公開第2011/0150338号明細書によって教示される技法を実施してCPU12によって決定された、顔に関する物質及び照明推定値に基づくことができる。任意選択で、CPU12は、画像全体に関する適切な推定値について、顔に関する結果を画像の残りの部分に関する結果に対して滑らかに補間することができる。
例えば、相対フィルライト情報は、特性スペクトル比を決定することによって、元の画像から導出することができる。本発明の好ましい実施形態では、特性スペクトル比は、Dark/(Bright−Dark)の比によって表現され、ここで、Darkは、照明境界の暗色側での色であり、Brightは、境界の明色側での色である。上述したように、暗色側では、画像は周囲照明によって照明され、明色側では、画像は周囲照明+直接照明によって照明される。式I=MLに関して、特性スペクトル比Sは、以下の式によって表現することができる。
S=周囲光源*反射率/((周囲光源+直接光源)*反射率−周囲光源*反射率)
S=周囲光源/直接光源
ブロードキャストに関して、フィルライトは、周囲照明に対応し、キーライトは、直接照明に対応する。したがって、特性スペクトル比は、相対フィルライト/キーライトの情報の表現を提供する。
CPU12が、上述した対数色度クラスタリング技法を使用して固有画像を生成する(ステップ1002)、及び/又はBIDR施行後処理技法を実施する場合、図9のルーチンの実行によって決定されるN値(これは特性スペクトル比に対応する)は、相対フィルライト/キーライト情報の表現として使用することができる。そうでない場合、向きNは、CPU12によって、別個のステップで決定されて、図9のルーチンを実行する。
ステップ1004で、CPU12はまた、照明強度ヒストグラムを計算するように動作する。本発明の例示的実施形態では、CPU12は、ステップ1002で生成された照明画像の対数色空間表現に対してヒストグラム計算を実施し、ビン数のリストを作成することによってヒストグラム処置を開始し、リストでの各ビン数は、0に初期化される。各ビン数は、特定の強度での照明画像内の画素の数のカウントを表す。ビンの数は、ユーザによって設定することができる。
本発明の例示的実施形態では、ビン数は100に設定される。100のビン数は、−5.0〜0.0の対数色空間内の範囲をカバーする。−5.0〜0.0の範囲に関する100のビン数の場合、最初のビンは、−5.0〜−4.95の強度を有する照明画像内の全ての画素のカウントであり、第2のビンは、−4.95〜−4.90に関するカウントであり、以下同様に続き、最後のビンは、−0.05〜0.0の範囲に関するカウントである。
ビン数が設定された後、CPU12は、照明画像内の全ての画素にわたってループする。本発明の好ましい実施形態では、特定の画素はカウントされない。例えば、人間の顔に関して、顔マスクを使用して、解析中の画像内に示される各顔を参照することができ、顔マスク内部の画素のみが、ヒストグラム処置中にカウントされる。さらに、目や口などの顔特徴点を示す画素を無視することができる。これらの特徴点は、適応形状モデルや、各顔マスク内部の所定の形状によって輪郭を取るなどの技法によって決定することができる。上述したように、各それぞれの顔に関する推定された照明及び物質反射を使用して、各検出された顔に関して、個別の照明強度ヒストグラムを計算することができる。
照明画像の各画素がカウントされるように、CPU12は、画素の強度を検査して、増分すべきヒストグラムの対応するビンを決定する。カウントすべき全ての画素の検査の完了後、リストのビンによって表される各強度範囲内の画素の数に関する整数カウントのヒストグラムが決定される。
ステップ106で、CPU12は、ステップ1004で計算された統計量の表示となる出力を生成するように動作する。例えば、相対フィルライト色を表す特性スペクトル比は、RGB空間内にあるとき、以下のような3次元ベクトルを備える。
V=(Dred/(Bred−Dred),Dgreen/(Bgreen−Dgreen),Dblue/(Bblue−Dblue))
ここで、Bredは、明色側の色での色測定値の赤色チャネルであり、Dredは、暗色側での赤色チャネル色であり、Bgreen及びBblueは、それぞれ明色側での緑色及び青色チャネル色を表し、Dgreen及びDblueは、それぞれ暗色側での緑色及び青色チャネル色を表す。
したがって、S=周囲光源/直接光源の関係により、CPU12は、特性スペクトル比のベクトル表現を使用して、相対フィルライト/キーライト情報を表す色に関するRGB値を導出することができる。RGB値は、色、及び/又は色相/彩度の円上の位置として表示することができる。強度に関係しないフィルライトの相対的な色を表示するために、特性スペクトル比に関するベクトル表現を、単位長さを有するように正規化することができ、又は例えば、色相や彩度など別の標準的な色度表現に変換することができる。図3を参照すると、色は、出力画面32の左下隅で画面ディスプレイに示され、位置は、出力画面32の右下隅に示される、色相/彩度の円を横切る2つのラインの交点によって示される。
さらに、ステップ1006で、CPU12は、ステップ1004で計算されたヒストグラム値をプロットするために、標準的なプロット技法を実行するように動作する。各検出される顔に関して個別の照明強度ヒストグラムが計算された場合、各顔に関して個別のプロットを行うことができる。図3に示されるように、水平軸に沿ったプロットは、対数スケール又は線形スケールでプロットされた強度である。上述した例示的実施形態では、−5.0〜0.0の対数範囲を使用した。この範囲は調節可能であることがあり、例えば、ユーザ制御30の1つを、CPU12に範囲情報を提供するように構成することができる。したがって、シーン内の陰影が浅い場合には、ユーザは、−2.0〜0.0の範囲を指定することができ、又は陰影が深い場合には、−10.0〜0.0の範囲を指定することができる。ステップ1004での照明強度ヒストグラム計算は、ユーザ指定範囲を使用して実行される。任意選択で、水平軸の範囲は、自動的に設定することができる。例えば、この範囲は、解析中の画像の照明強度範囲と一致するように設定することができる。
垂直軸上で、プロットは、水平軸に沿ってプロットされる各特定の強度レベルでの画素の数を示す。垂直軸は、ヒストグラム内の最大数の画素がプロットでカバーされるようにスケール調整される。
ステップ1006の実行を続けるために、図4bは、陰影深さ表示などの出力を導出するために、照明強度ヒストグラム情報を解析するためのフローチャートを示す。ステップ1010で、照明強度ヒストグラムがCPU12に入力される。ステップ1012で、CPU12は、任意選択でヒストグラムを平滑化する。ステップ1014で、CPUは、ヒストグラムを検査して、予め指定された隔離基準に見合うピーク値を位置特定する。
隔離基準は、トポグラフィでの技術用語であり、ピークによる占有半径に関係し、あるピーク値から、最も近い、より高いピーク値への距離を指定する。隔離値が設定されると、CPU12は、ヒストグラムを示すグラフ内で、最も明るい隔離ピークと最も暗い隔離ピークとを見出す。最も明るい隔離ピークの位置は、完全照明の照明強度を提供し、最も暗い隔離ピークの位置は、完全陰影の照明強度を提供する。
ステップ1016で、CPU12は、陰影深さを計算する。2つの隔離ピークの強度値の比(又は対数値の差)が、陰影深さの尺度である。グラフ内にただ1つの隔離ピークしか存在しない場合には、シーン内に陰影は存在せず、陰影深さは1.0に設定される。ステップ1018で、CPU12は、ステップ1006の実行を完了するために、陰影深さ情報を出力する。
図4aを再び参照すると、ステップ1008で、CPU12は、図4a及び図4bのルーチンの実行により計算される色解析情報を出力する。図1に示されるように、CPU12の出力は、照明強度ヒストグラム、陰影深さ、及び相対フィルライト色を含む色解析情報の表示のために、色解析ボックス24に結合される。図3に示されるように、表示はまた、解析中の元の画像、及び計算された固有画像を含むこともできる。代替実施形態では、色解析情報は、モニタ20上に表示される。
以上の明細書において、本発明を、その特定の例示的実施形態及び例を参照して説明してきた。しかし、添付の特許請求の範囲に記載する本発明のより広範な精神及び範囲から逸脱することなく、様々な修正及び変更をそれらに加えることができることは明らかであろう。したがって、明細書及び図面は、限定的な意味ではなく例示的なものとみなすべきである。

Claims (20)

  1. 画像を処理するための自動化されコンピュータ化された方法であって、
    画像を示す画像ファイルをコンピュータメモリに提供するステップと、
    前記画像に関する空間スペクトル情報に応じて固有成分情報を決定するステップと、
    前記固有成分情報に応じて解析情報を計算するステップと
    を備えて構成される方法。
  2. 計算された解析情報を表示する追加のステップを含む、請求項1に記載の方法。
  3. 固有成分情報が照明画像を含む、請求項1に記載の方法。
  4. 前記固有成分情報に応じて解析情報を計算する前記ステップが、前記照明画像の照明強度ヒストグラムを計算することによって行われる、請求項3に記載の方法。
  5. 前記照明強度ヒストグラムに応じて陰影深さ表示を計算する追加のステップを含む、請求項4に記載の方法。
  6. 前記空間スペクトル情報が特性スペクトル比を備える、請求項1に記載の方法。
  7. 前記固有成分情報に応じて解析情報を計算する前記ステップが、相対フィルライト色を表現するために、前記特性スペクトル比に固有の固有成分情報を使用することによって行われる、請求項6に記載の方法。
  8. CPUと、画像を含む画像ファイルを記憶するメモリとを備えるコンピュータシステムであって、
    前記CPUが、前記画像に関する空間スペクトル情報に応じて固有成分情報を決定し、前記固有成分情報に応じて解析情報を計算するためのルーチンを実行するように配置され構成される、コンピュータシステム。
  9. コンピュータ可読媒体に実装されたコンピュータプログラム製品であって、画像を示す画像ファイルをコンピュータメモリに提供し、前記画像に関する空間スペクトル情報に応じて固有成分情報を決定し、前記固有成分情報に応じて解析情報を計算するようにコンピュータを制御するように動作可能なコンピュータ実行可能プロセスステップを含む、コンピュータプログラム製品。
  10. 計算された解析情報を表示する更なるプロセスステップを含む、請求項9に記載のコンピュータプログラム製品。
  11. 前記固有成分情報が照明画像を含む、請求項9に記載のコンピュータプログラム製品。
  12. 前記固有成分情報に応じて解析情報を計算するための前記プロセスステップが、前記照明画像の照明強度ヒストグラムを計算することによって行われる、請求項11に記載のコンピュータプログラム製品。
  13. 前記照明強度ヒストグラムに応じて陰影深さ表示を計算する追加のプロセスステップを含む、請求項12に記載のコンピュータプログラム製品。
  14. 前記空間スペクトル情報が特性スペクトル比を備える、請求項9に記載のコンピュータプログラム製品。
  15. 前記固有成分情報に応じて解析情報を計算するための前記プロセスステップが、相対フィルライト色を表現するために、前記特性スペクトル比に固有の固有成分情報を使用することによって行われる、請求項14に記載のコンピュータプログラム製品。
  16. CPUと、画像を含む画像ファイルを記憶するメモリとを備えるデバイスであって、
    前記CPUが、前記画像に関する空間スペクトル情報に応じて固有成分情報を決定し、前記固有成分情報に応じて解析情報を計算するためのルーチンを実行するように配置され構成され、デバイスがさらに、前記解析情報を表示するため前記CPUに結合されたディスプレイを備える、デバイス。
  17. 前記解析情報が、照明強度ヒストグラム、陰影深さ、及び相対フィルライト色情報を含む、請求項16に記載のディスプレイ。
  18. 前記画像に関する空間スペクトル情報に応じて固有成分情報を決定する前記ステップが、前記画像内に示される顔に関する固有成分情報を決定することによって行われる、請求項1に記載の方法。
  19. 前記画像に関する空間スペクトル情報に応じて固有成分情報を決定するための前記プロセスステップが、前記画像内に示される顔に関する固有成分情報を決定することによって行われる、請求項9に記載のコンピュータプログラム製品。
  20. 前記CPU12が、前記画像内に示される顔に関する固有成分情報を決定することによって、前記画像に関する空間スペクトル情報に応じて固有成分情報を決定するための前記ステップを実行する、請求項16に記載のデバイス。
JP2014543473A 2011-11-21 2012-10-09 デジタル画像に関する色解析 Active JP5914688B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/301,129 2011-11-21
US13/301,129 US8249342B1 (en) 2011-11-21 2011-11-21 Color analytics for a digital image
PCT/US2012/059343 WO2013077946A2 (en) 2011-11-21 2012-10-09 Color analytics for a digital image

Publications (2)

Publication Number Publication Date
JP2015501037A true JP2015501037A (ja) 2015-01-08
JP5914688B2 JP5914688B2 (ja) 2016-05-11

Family

ID=46641638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014543473A Active JP5914688B2 (ja) 2011-11-21 2012-10-09 デジタル画像に関する色解析

Country Status (4)

Country Link
US (1) US8249342B1 (ja)
EP (1) EP2783325A4 (ja)
JP (1) JP5914688B2 (ja)
WO (1) WO2013077946A2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8391601B2 (en) * 2009-04-30 2013-03-05 Tandent Vision Science, Inc. Method for image modification
US8798392B2 (en) * 2010-11-10 2014-08-05 Tandent Vision Science, Inc. Method and system for generating intrinsic images using a smooth illumination constraint
US8503777B2 (en) * 2010-12-16 2013-08-06 Sony Corporation Geometric feature based image description and fast image retrieval
US8553979B2 (en) * 2011-11-07 2013-10-08 Tandent Vision Science, Inc. Post processing for improved generation of intrinsic images
US8811732B2 (en) * 2012-08-17 2014-08-19 Tandent Vision Science, Inc. Weighted entropy minimization for optimizing a log-chromaticity normal for use in an image process
US8849018B2 (en) * 2012-08-17 2014-09-30 Tandent Vision Science, Inc. Log-chromaticity clustering pipeline for use in an image process
US8897378B2 (en) * 2013-03-12 2014-11-25 Tandent Vision Science, Inc. Selective perceptual masking via scale separation in the spatial and temporal domains using intrinsic images for use in data compression
US20140269943A1 (en) * 2013-03-12 2014-09-18 Tandent Vision Science, Inc. Selective perceptual masking via downsampling in the spatial and temporal domains using intrinsic images for use in data compression

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070242878A1 (en) * 2006-04-13 2007-10-18 Tandent Vision Science, Inc. Method and system for separating illumination and reflectance using a log color space
JP2008529169A (ja) * 2005-01-27 2008-07-31 タンデント ビジョン サイエンス インコーポレーティッド 画像内の照明光束を識別する方法およびシステム
JP2009524885A (ja) * 2006-01-27 2009-07-02 タンデント ビジョン サイエンス インコーポレーティッド 画像処理用の二光源二色性反射モデル
JP2009524884A (ja) * 2006-01-27 2009-07-02 タンデント ビジョン サイエンス インコーポレーティッド 画像内の照明域を識別する方法及びシステム
US20110150338A1 (en) * 2009-12-18 2011-06-23 Tandent Vision Science, Inc. Method and system for generating intrinsic images using single reflectance technique

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870097A (en) * 1995-08-04 1999-02-09 Microsoft Corporation Method and system for improving shadowing in a graphics rendering system
JP4609559B2 (ja) * 2008-09-02 2011-01-12 ソニー株式会社 フィルタ装置、画像補正回路、画像表示装置および画像補正方法
US8139850B2 (en) * 2008-12-05 2012-03-20 Tandent Vision Science, Inc. Constraint generation for use in image segregation
US8139867B2 (en) 2008-12-05 2012-03-20 Tandent Vision Science, Inc. Image segregation system architecture
US8391601B2 (en) * 2009-04-30 2013-03-05 Tandent Vision Science, Inc. Method for image modification
US8525847B2 (en) * 2009-06-01 2013-09-03 Apple Inc. Enhancing images using known characteristics of image subjects
US9563815B2 (en) * 2009-09-15 2017-02-07 Tandent Vision Science, Inc. Method and system for processing an image received from a remote source

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008529169A (ja) * 2005-01-27 2008-07-31 タンデント ビジョン サイエンス インコーポレーティッド 画像内の照明光束を識別する方法およびシステム
JP2009524885A (ja) * 2006-01-27 2009-07-02 タンデント ビジョン サイエンス インコーポレーティッド 画像処理用の二光源二色性反射モデル
JP2009524884A (ja) * 2006-01-27 2009-07-02 タンデント ビジョン サイエンス インコーポレーティッド 画像内の照明域を識別する方法及びシステム
US20070242878A1 (en) * 2006-04-13 2007-10-18 Tandent Vision Science, Inc. Method and system for separating illumination and reflectance using a log color space
US20110150338A1 (en) * 2009-12-18 2011-06-23 Tandent Vision Science, Inc. Method and system for generating intrinsic images using single reflectance technique

Also Published As

Publication number Publication date
JP5914688B2 (ja) 2016-05-11
WO2013077946A3 (en) 2014-05-30
WO2013077946A2 (en) 2013-05-30
US8249342B1 (en) 2012-08-21
EP2783325A2 (en) 2014-10-01
EP2783325A4 (en) 2016-10-05

Similar Documents

Publication Publication Date Title
JP5914688B2 (ja) デジタル画像に関する色解析
US9330337B2 (en) Color analytics for a digital image
US8542917B2 (en) System and method for identifying complex tokens in an image
US8559714B2 (en) Post processing for improved generation of intrinsic images
US20130342694A1 (en) Method and system for use of intrinsic images in an automotive driver-vehicle-assistance device
US8577150B2 (en) System and method for removing specularity from an image
US8983183B2 (en) Spatially varying log-chromaticity normals for use in an image process
US8913829B2 (en) Automatic processing scale estimation for use in an image process
US8428352B1 (en) Post processing for improved generation of intrinsic images
JP5860970B2 (ja) 固有画像の生成を改良するための後処理
US8655099B2 (en) Relationship maintenance in an image process
US8842907B2 (en) Method for performing a multi-clustering merge for use in an image process
US20140050399A1 (en) Log-chromaticity clustering pipeline for use in an image process
US8811732B2 (en) Weighted entropy minimization for optimizing a log-chromaticity normal for use in an image process
US8879836B2 (en) System and method for identifying complex tokens in an image
WO2014028355A2 (en) Log-chromaticity clustering pipeline for use in an image process

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150918

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20151022

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160404

R150 Certificate of patent or registration of utility model

Ref document number: 5914688

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250