JP2007518199A - 多重線形独立要素分析を使用した画像認識の方法、システム、記憶媒体、及びデータ構造 - Google Patents

多重線形独立要素分析を使用した画像認識の方法、システム、記憶媒体、及びデータ構造 Download PDF

Info

Publication number
JP2007518199A
JP2007518199A JP2006549695A JP2006549695A JP2007518199A JP 2007518199 A JP2007518199 A JP 2007518199A JP 2006549695 A JP2006549695 A JP 2006549695A JP 2006549695 A JP2006549695 A JP 2006549695A JP 2007518199 A JP2007518199 A JP 2007518199A
Authority
JP
Japan
Prior art keywords
image
data
tensor
processing device
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006549695A
Other languages
English (en)
Inventor
マニュエラ・アレックス・オー・ヴァシレスク
デメトリ・ターゾポロス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New York University NYU
Original Assignee
New York University NYU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New York University NYU filed Critical New York University NYU
Publication of JP2007518199A publication Critical patent/JP2007518199A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/169Holistic features and representations, i.e. based on the facial image taken as a whole
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • G06F18/21342Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis using statistical independence, i.e. minimising mutual information or maximising non-gaussianity

Abstract

画像認識に関連する画像処理の方法、システム、コンピュータ読み込み可能メディア、及びデータ構造が提供される。基礎テンソルへの画像応答は、画像がそれに適応した後、決定される。画像応答は平坦化される。係数ベクトルは、画像応答から抽出される。係数ベクトルは、マトリクスの係数行に記録された複数の異なるパラメータと比較される。

Description

本発明は、主に画像認識に関する。特に、本発明はデータを獲得する論理装置、データ構造、システム、及び方法に係わり、更に詳しくは物体の少なくとも1つの特質を描くデータを獲得し、新しいデータを合成し、獲得したデータを認識し、物体(例えば人間)の1つまたはそれ以上の特質を描くデータの量を減少させる論理装置、データ構造、システム、及び方法に係わる。
パターン認識と信号処理のためのデータ分析の1つの重要な問題は、適切な表現を見つけることである。歴史的かつ計算的な単純さのために、データの特定の統計特性を最適にコード化する線形モデルが望まれていた。特に、「アイゲンフェイス」として知られる線形、及び外観ベースの顔認識方法は、顔画像集合の主要素分析(PCA)技術に基づく。この参照により両方とも本発明と一体となるL. Sirovich et al., "Low dimensional procedure for the characterization of human faces," Journal of the Optical Society of America A., 4:519-524, 1987と、M.A. Turk and A.P. Pentland, "Face recognition using eigenfaces," Proceedings IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 586-590, Hawaii, 1991を見ると、PCA技術は、画素間と、二次統計量間と、連続する画像の組み合わせの相関構造間とのそれぞれの関係をコード化するが、高次の画素関係の全てと、高次の統計的従属値の全てを無視する。対照的に、独立要素分析(ICA)技術として知られるPCA技術の一般化は、上記の相互関係に加えて、連続データの高次従属値を分析することにより統計的独立要素の集合を確認する。この参照により両方とも本発明と一体となるA. Hyvarinen et al., Independent Component Analysis, Wiley, New York, 2001と、M.S. Bartlett et al., "Face recognition by independent component analysis," IEEE Transactions on Neural Networks, 13(6):1450-1464, 2002を見ると、逆にICA技術は画像形態固有の異なる要素、つまり場面構造と照明と及び画像化に属する要素から生ずる高次統計値を区別しない。
ICA技術は顔認識において使用され、PCA技術のように人間の同一性が変化の許される唯一の要素であるとき、それは最も機能する。この参照により両方とも本発明と一体となるM.S. Bartlett, "Face Image Analysis by Unsupervised Learning," Kluwer Academic, Boston, 2001と、M.S. Bartlett et al., "Face recognition by independent component analysis," IEEE Transactions on Neural Networks, 13(6):1450-1464, 2002を見ると、もし更なる要因、例えば照明、視点、及び表現、が顔画像を修正できるならば、認識率が劇的に減少する可能性がある。問題は、M.A.Oで提案された特定の認識アルゴリズム以外は、多重線形分析により対処される。Vasilescu et al. "Multilinear analysis for facial image recognition," In Proc. Int. Conf on Pattern Recognition, Quebec City, August 2002は、線形代数を基礎とし、そのアルゴリズムは多重線形アプローチを完全に有効には利用していない。
本発明の典型的な実施形態の目的の1つは、上記の欠陥を克服することである。本発明の別の目的は、物体記述子を生成する方法、システム、記憶媒体、及びデータ構造を提供することである。
本発明の典型的な実施形態によれば、基礎テンソルの画像の応答を計算する段階と、画像応答を平坦化する段階と、画像応答から係数ベクトルを引き出す段階と、引き出された係数と係数マトリックスの列に記憶される複数の異なるパラメータとを比較する段階とを具備する方法である。
本発明の別の典型的な実施形態において、記憶装置(例えばメモリ)と、画像に関するデータが受信でき、上記記憶装置と通信できる処理装置とを備えるコンピュータシステムが提供されうる。上記記憶装置は、データ処理方法を実行するために、コンピュータ実行可能な指示を記憶することができる。例えば、基礎テンソルの画像の応答が決定される可能性があり、画像応答は平坦化されることができ、係数ベクトルは画像応答から引き出される可能性があり、引き出された係数は係数マトリックスの列に記憶された複数の異なるパラメータと比較される可能性がある。
本発明のさらに別の典型的な実施形態において、方法を実行するために、コンピュータ実行可能な指示を記憶したコンピュータ読取り可能媒体が提供される。上記方法は、基礎テンソルの画像の応答を計算する段階と、上記画像応答を平坦化する段階と、上記画像応答から係数ベクトルを引き出す段階と、引き出された係数と係数マトリックスの列に記憶する複数の異なるパラメータと比較する段階とを具備するものとする。
本発明のさらに別の典型的な実施形態において、データ処理方法が提供される。上記方法は、要因コードを生成するために、多重線形独立要素分析を画像データに適用する段階と、人々、視点、及び照明をコード化する係数の複数の集合を有するデータの表現を生成する段階とを具備し、上記集合は統計的独立であるものとする。
本発明のさらに別の典型的な実施形態において、目標画像のために係数ベクトルの集合を有するデータ構造が提供される。特に、上記ベクトルは目標の記述子、目標の視点、及び目標の照明方向を具備するものとする。
本発明の更なる目的、特徴、及び効果は、本発明の実施形態を示す添付の図面と関連づけられた以下の詳細な説明から明らかにされる。
全ての図を通して、同じ参照番号と文字は、特に明記しない限り、同様の特徴、要素、構成要素または図示された実施形態の部分を示すために使用される。さらに、本発明は図面に関連して詳細に記載されるが、それは図示された実施形態と関連して記載される。添付のクレームにより定義されるように、本発明の主題の真の範囲と精神から逸脱することなく、変更及び修正が記載された実施形態になされることが所望される。
以下の記載において、イタリック体のAは〔斜A〕と示し、太字のAは〔太A〕と示し、太字斜体のAは〔太斜A〕と示し、カリグラフィック体のAは〔書A〕と示すものとする。また、テンソルの添え字は〔A 〕と示すものとする。
本発明の典型的な実施形態は、従来のICA技術を一般化する画像組み合わせの非線形かつ多元的なモデルに関連し、利用する可能性がある。ICA技術が線形(マトリックス)代数学を使用するのに対し、本発明による多重線形ICA(MICA)手順の典型的な実施形態は、多重線形(テンソル)代数学を使用する。その従来の線形な同等物とは異なり、MICA手順は、画像形態固有の多重因子の相互作用を確認することができ、別々にこれらの因子のそれぞれの高次統計量をコード化することができる。画像形態固有の異なる要素と関連する2次統計量だけをコード化する「テンソルフェイス」として示される、「アイゲンフェイス」の多重線形一般化と異なり、MICA手順は異なる要素と関連するより高次の従属値をコード化することもできる。
本発明の典型的な実施形態の多重線形ICA手順は、PCA、多重線形PCA、及びICA技術の計算の前後関係において理解されることが可能である。
例えば、〔斜I〕画像の組み合わせの主要素分析は、列が「中心化」された画像の「ベクトル化」された〔斜I〕画素である〔斜I〕×〔斜I〕のマトリクス〔太D〕上の特異値分解(SVD)を実施することにより決定される。図1Aは、全ての画像を通じて変化量の主軸である典型的なPCAアイゲンベクトル300(アイゲンフェイス)を図示している。図1Bは、〔斜T〕=〔斜Z〕×〔太U〕pixelsとして獲得されたテンソル〔書D〕の75×6×6×8560のテンソルフェイス表現310の部分視覚化を示す。それぞれのベクトル化しかつ中心化した画像は、それぞれの入力画像から組み合わせの中間の画像を減算し、かつ結果として生じる画素を縦ベクトルにほぼ同様に配置することにより、獲得される。マトリックス〔太D〕∈〔太I〕〔太R〕〔斜I〕1×〔斜I〕2は、2つの関連するベクトル空間、すなわち横列スペースと縦列スペースを有する2モード数学的オブジェクトである。
マトリックス〔太D〕の要素分析において、SVD技術は、これら2つの空間を直交させ、式1としてマトリックスを分解する。
Figure 2007518199
左のマトリックス〔太U〕∈〔太I〕〔太R〕〔斜I〕1×〔斜J〕1によってあらわされる直交横列空間と、マトリクスDの単数型値と呼ばれる対角項目σ≧σ≧…≧σ≧0によるΣ∈〔太I〕〔太R〕〔斜J〕1×〔斜J〕2の対角単数型値と、右のマトリックス〔太V〕∈〔太I〕〔太R〕〔斜I〕2×〔斜J〕2により表現される直交行空間とから生成されている。アイゲンベクトル〔太U〕は、マトリックス〔太D〕の「主要素」(またはKarhunen-Loeve)方向と呼ばれる。マトリックスの主要素分析の典型的に最適な次元の減少は、単数型値分解の切捨てにより獲得される(すなわち、最小の特異値に関連するアイゲンベクトルを削除すること)。
場面構造、照明、及び視点に関連した多重要素の集合から生じる画像の組み合わせの分析は、多重線形代数学の問題である。M.A.Q. Vasilescu et al., "Multilinear analysis of image ensembles: Tensorfaces," In Proc. European Conf. on Computer Vision (ECCV 2002), pp. 447-460, Copenhagen, Denmark, May 2002を見ると、この数学的な構成の範囲内で、画像の組み合わせは、高次テンソルとして表現されることが可能である。この画像データテンソルDは、構成要素を分割し、極度に倹約して表現するために分解されるべきである。このため、NモードSVD手順は上記の従来のマトリックスSVD技術の多重線形拡張として使用される可能性がある。
n方向配列または多次元マトリックスまたはnモードマトリックスとしても知られているテンソルは、ベクトル(第1階テンソル)とマトリックス(第2階テンソル)のより高い階数の一般化である。テンソルの詳細な説明と使用は、この参照により完全にここに述べられているように本発明と一体となる、2002年12月6日に出願され、「合成、認識、圧縮のための多モードデータの組み合わせの多重線形表現のための論理装置、データ構造、システム、及び方法」と題する国際特許出願WO03/055119A3号公報にさらに詳細に記載されている。例えば、テンソルはベクトル空間の集合上の多重線形写像として、定義されことが可能である。テンソルは以下の手順で表現されることができる。〔書A〕∈〔書I〕〔書R〕〔斜I〕1×〔斜I〕2×…×〔斜I〕〔斜N〕、ここで〔書A〕はテンソルであり、テンソル〔書A〕の階数は〔斜N〕である。1つのテンソルは基本要素の1群により構成される。それぞれの基本要素は、モードベクトルの集合であり、例えば第1基本要素はモード1ベクトルの集合であり、第2基本要素はモード2ベクトルであり、n番目の基本要素はモード斜nベクトルである、等のようになる。別の実施形態において、基本要素は、マトリックスの行ベクトル、マトリックスの縦列ベクトル、ベクトルの指数等である可能性がある。テンソル〔書A〕の要素は、〔書A〕〔斜I〕1…〔斜I〕n…〔斜I〕Nあるいは、〔斜a〕〔斜I〕1…〔斜I〕n…〔斜I〕N、あるいは1≦〔斜I〕n≦〔斜I〕nとして示される可能性がある。スカラは、小文字(〔斜a〕,〔斜b〕,…)で示され、ベクトルは太字小文字(〔太a〕,〔太b〕,…)で示され、マトリックスは太字大文字(〔太A〕,〔太B〕,…)で示され、高階テンソルは、イタリック太字大文字(〔太斜A〕,〔太斜B〕,…)あるいはカリグラフィック体大文字(〔書A〕,〔書B〕,…)で示される。
テンソル用語で、列ベクトルはモード1ベクトルと称される可能性があり、行ベクトルはモード2ベクトルと称される。N階のテンソル〔書A〕∈〔斜I〕〔斜R〕〔斜I〕1×〔斜I〕2×…×〔斜I〕Nモード〔斜n〕ベクトルは他のインデックスを固定して維持している間に指数〔斜I〕nを可変させることによりテンソル〔斜A〕から獲得された〔斜I〕次元ベクトルである。モード〔斜n〕ベクトルは、図7A〜7Fに示されるように、平面化したテンソル〔書A〕から生じる可能性があるマトリックス〔太A〕(n)∈〔斜I〕〔斜R〕〔斜I〕n×(〔斜I〕1〔斜I〕2…〔斜I〕n−1〔斜I〕n+1…〔斜I〕N)の列ベクトルである。平面化手順は、以下にさらに詳細に記載される。〔斜R〕で示されるテンソル〔書A〕∈〔斜I〕〔斜R〕〔斜I〕1×〔斜I〕2×…×〔斜I〕Nのnランクは、モード〔斜n〕ベクトルにより生成されるベクトル空間の次元として定義される。
Figure 2007518199
図7A〜7Cは、それぞれ外形寸法I×I×Iを有する第3次テンソル1200、1210、1220を示す。図7Dは、第3次テンソル1200のモード1ベクトルを具備するマトリックス1250を獲得するためにモード1を平坦化した後の第3次テンソル1200を示す。マトリックス1250が1指数、例えばマトリックス1250の範囲内で(ある程度)埋め込まれたI、を有する二次元形式の構造である一方、図7Aの第3次テンソル1200は立方体形式構造である。図7Eは、モード2を平坦化した後の第3次テンソル1210のモード2ベクトルを具備するマトリックス1260を示す。マトリックス1260が1指数、例えばそのデータの範囲内で(ある程度)埋め込まれたI、を有する二次元形式の構造である一方、この第3次テンソル1210は立方体形式構造である。図7Fは、第3次テンソル1220のモード3ベクトルを具備するマトリックス1270を得るためにモード3を平坦化した後の第3次テンソル1220を示す。マトリックス1270組織が1指数、例えばそのデータの範囲で(ある程度)埋め込まれたI、を有する二次元形式の構造である一方、そのような第3次テンソルは立方体形式構造である。
2つのマトリックスの積の一般化は、テンソルとマトリックスの積である可能性がある。〔書A〕×〔太M〕で示されるマトリックス〔太M〕∈〔斜I〕〔斜R〕〔斜J〕n×〔斜I〕nによるテンソル〔書A)∈〔斜I〕〔斜R〕〔斜I〕1×〔斜I〕2×…×〔斜I〕n×…×〔斜I〕Nのモード〔斜n〕積は、記載事項が〔書B〕〔斜I〕1…〔斜I〕n−1〔斜J〕n〔斜I〕n+1…〔斜I〕N=Σ〔斜I〕n〔斜a〕〔斜I〕1…〔斜I〕n−1〔斜I〕n+1…〔斜I〕〔斜N〕 〔斜m〕〔斜J〕〔斜n〕〔斜I〕〔斜n〕であるテンソル〔書B〕∈〔斜I〕〔斜R〕〔斜I〕1×…×〔斜I〕n−1×〔斜J〕n―1×〔斜J〕n×〔斜J〕n+1×…×〔斜I〕Nである。テンソル〔書B〕の記載事項は以下の式により計算される。
Figure 2007518199
モード〔斜n〕積は、〔書B〕=〔書A〕X〔太M〕として、あるいは〔太B〕(n)=〔太M〕〔太A〕(n)として平坦化されたマトリックスに関して表現される可能性がある。テンソルとマトリックスのモード〔斜n〕積は、多重線形代数学とテンソル分析の内積の特例である。モード〔斜n〕積は、アインシュタイン要約表記法を使用してしばしば示されるが、わかりやすくするために、モード〔斜n〕積シンボルが使用される可能性がある。モード〔斜n〕積は、以下の特性を有する可能性がある。
1.テンソル〔書A〕∈〔斜I〕〔斜R〕〔斜I〕1×…×〔斜I〕N×…×〔斜I〕m…と、以下の特性を真に保つ2つのマトリックス、〔太U〕∈〔斜I〕〔斜R〕Jm×Imと、〔太V〕∈〔斜I〕〔斜R〕Jn×Inが与えられる。
Figure 2007518199
2.テンソル〔書A〕∈〔斜I〕〔斜R〕〔斜I〕1×…×〔斜I〕N×…×〔斜I〕mと、以下の特性を真に保つ2つのマトリックス、〔太U〕∈〔斜I〕〔斜R〕Jn×Inと、〔太V〕∈〔斜I〕〔斜R〕Kn×Jnが与えられる。
Figure 2007518199
N階テンソル〔書A〕∈〔斜I〕〔斜R〕〔斜I〕1×〔斜I〕2×…×〔斜I〕Nは、それがNベクトルの外積として、〔書A〕=〔太U〕〇〔太U〕〇…〇〔太U〕と表現されるとき、ランク1を有する。テンソル要素は、〔斜a〕ij…m=〔斜u〕1i〔斜u〕2j…〔斜u〕Nmとして表され、ここで〔斜u〕1iは〔太U〕のi番目のコンポーネント等である。R=rank(〔書A〕)として示されるN階のテンソル〔書A〕のランクは、一次結合で〔斜A〕を与える最小の数のランク1テンソルである。
Figure 2007518199
以下の単純な例で示されるように、特異値分解(SVD)はランク分解として表現されることが可能である。
Figure 2007518199
SVDが組合せ直角ランク分解である可能性があるが、逆が真でない点に留意する必要がある。一般に、ランク分解が必ずしも特異値分解であるというわけではない。また、NモードSVDは相互に直角ランク1テンソルの拡大として以下の通りに表現することができる。
Figure 2007518199
ここで、〔太U〕(in) は、マトリックス〔太U〕の〔斜I〕列ベクトルであり、これは次式に類似している。
Figure 2007518199
例えば、2より大きいN階のテンソル、あるいはN方向配列〔書D〕は、N空間から構成されるN階マトリックスである。NモードSVDは、従来のマトリックスつまり2モードのSVDの「一般化」である。それはこれらのN空間を直交させることができ、以下に示すようにN直交空間のXnとして示されるモード〔斜n〕積としてテンソルを分解することができる。
Figure 2007518199
コアテンソルとして知られるテンソル〔斜Z〕は、それが簡単な対角線構造を有していない従来のマトリックスSVDにおいて、対角線の特異値マトリックスに類似している。モード〔斜n〕積を使用して、式1の従来のSVDは、〔太D〕=Σ×〔太U〕×〔太V〕として書き直されることができる。コアテンソルは、モードマトリックス〔太U〕,…,〔太U〕の間の相互作用を支配する。モードマトリックス〔太U〕は、〔書D〕のモード〔斜n〕平坦化から生ずるマトリックス〔太D〕(n)の列空間の全域に及ぶ直交ベクトルを具備する。
NモードSVD技術は、式2に従い〔書D〕を分解させるために使用される。
1.平坦化されたマトリックス〔太D〕(n)のSVDを計算し、かつ〔太U〕をSVDの左側マトリックスであるように設定することにより、n=1〜Nとして式2のマトリックス〔太U〕nを計算する。〔太D〕(n)が非正方行列であるとき、特異値分解(SVD)〔太D〕(n)=〔太U〕nΣ〔太V〕 のUの計算は、〔太D〕(n)のどの外形寸法がより小さいかに従い、それぞれの〔太D〕(n)〔太D〕 (n)=〔太U〕Σ〔太U〕 を分解し、次いで〔太V〕 =Σ+〔太U〕 〔太D〕(n)を計算することにより、あるいは、〔太D〕 (n)〔太D〕(n)=〔太V〕Σ〔太V〕 を分解し、次いで〔太U〕=〔太D〕(n)〔太V〕Σ+を計算することにより、効果的に実行されることができる。
2.コアテンソルは以下の式3のように解決する。
Figure 2007518199
線形事例の寸法縮小は、瑣末な多重線形対応物を有していない。Sのテンソルに役立つ一般化は、与えられたテンソルのそれぞれのモードを繰り返して最適化する最適ランク(R,R,…,R)近似を具備することができ、ここでそれぞれの最適化段階は、可能な準定対照マトリックスの最もランクを減少させた近似を具備する。以下の参考文献L. de Lathauwer et al., "On the best rank-1 and rank-(RI, R2,..., Rn) approximation of higher order tensors," SIAM Journal of Matrix Analysis and Applications, 21(4):1324-1342, 2000を見ると、この技術は、マトリックスの直交繰り返しの高階の拡張である。図2Bは、ここでさらに論ぜられるように多重線形PCAに関連するテンソル基礎330を示す。
多変量データの独立要素分析(ICA)技術は、投影データができるだけガウス分布からかけ離れていないような、一連の投影を探す。ICA技術は、2つの典型的な方法に適用されることが可能である。構造Iは、それぞれの行が異なるベクトル化された画像である〔太D〕へのICA技術に適用し、顔の局所特性を反映する空間的に独立した基礎セットを見つける。一方、構造IIはICA技術を〔太D〕に適用し、基礎が顔の全体的な特性を反映する間、統計的独立である1組の係数を見つける。
構造I:ICA技術は基本的に、予め書き込まれたデータ集合の式1で示される要素分析法あるいはPCA解決法から開始し、それらが独立した構成要素となるように、主要構成要素の回転を計算する。J. Friedman et al., "The Elements of Statistical Learning: Data Mining, Inference, and Prediction," Springer, New York, 2001を見ると、図2Aは画像データ320のために独立構成要素〔太C〕pixelsを図示する。ICA技術は、以下のように、式1の主要構成要素方向〔太U〕を回転させることができる。
Figure 2007518199
〔太D〕の全ての列が異なる画像である所、〔太W〕はICA技術により計算される可逆変換であり、〔太C〕=〔太U〕〔太W〕は、図2Aに示される独立要素であり、〔太K〕=〔太W〕−TΣ〔太V〕は係数である。相互情報、エントロピー、高次累積率やその他を基礎とするこれらのような様々な目的機能は、これらの目的機能を極める異なる最適方法に沿って独立要素を計算する典型的な手順の使用を表現することができる。ICA技術による次元低下は、通常PCA前処理段階で実行される。次の段落でより多く提供される上記の表現を意味する数学的に等価な方法は、以下の通りである。
Figure 2007518199
代わりに、構造IIで、ICAは〔太D〕に適応することができ、以下に示すように、係数が統計的に独立である主要構成要素方向を回転する。
Figure 2007518199
このとき〔太C〕は基礎であり、〔太K〕は独立係数である。〔太C〕、〔太K〕、及び〔太W〕は2つの異なる構造で別に計算されることに注意する。
図5は、本発明によるMICA手順を実行するために使用される本発明によるコンピュータシステム100の典型的実施形態のブロック図を示す。例えば、システム100は、処理装置130と通信する画像捕捉システムを具備することができる。システムは、さらに処理装置130と通信する記憶装置(例えばメモリ110等)を更に具備する可能性がある。メモリ110は、画像捕捉システム120により捕捉されたデータ上の処理装置130により実行されるコンピュータ実行可能指示を具備するMICAアプリケーション112を記憶する可能性がある。メモリ110は、MICA手順によって処理される画像データを比較するのに使用される画像データベースをさらに格納する可能性がある。
図6は、本発明の方法200のフローチャートの典型的な実施形態を示す。例えば、図6で示すように、基礎テンソルへの画像応答が計算される(ステップ210)。画像応答は、平坦化される(ステップ220)。係数ベクトルは、画像応答(ステップ230)から引き出される可能性がある。引き出された係数は、マトリックス(ステップ240)の係数列に格納される複数の異なるパラメータと比較される可能性がある。
上述されるように、本発明による典型的なMICA手順は本発明の典型的な実施形態で実装される可能性がある。例えば、構造IはMICA手順を適用することができ、階乗コードに終わる可能性がある。それは、人々、視点、照明、その他をコード化する係数のそれぞれの集合が統計的独立である表現の場所を見つけることができる。構造IIは、人々、視点、照明、その他全体で一組の独立したベースを見つける。
構造I 第n番目のモードで平坦化されたデータテンソル〔書D〕を送信し、4−8の場合のようにICAを計算する。
Figure 2007518199
ここで〔太C〕=〔太U〕〔太W〕 である。このように、私たちは以下のようにNモードSVD2から、NモードICAを引き出すことができる。
Figure 2007518199
ここで、コアテンソル〔斜S〕=〔斜Z〕×〔太W〕−T …×〔太W〕−T である。モードマトリックス〔太C〕〔斜I〕、ここで〔斜I〕は1…Nであり、のそれぞれと関連した列は統計的独立である。
多重線形ICA分解は、ベクトル化された連続画像〔太D〕〔斜d〕のテンソル〔書D〕に実行される。
Figure 2007518199
一組のモードマトリックス、すなわち、それぞれの人々〔斜p〕の係数の列ベクトル〔太c〕〔斜T〕 〔斜p〕を具備するマトリックス〔斜C〕people、それぞれの表示方向〔斜v〕の係数の列ベクトル〔太c〕〔斜T〕 〔斜v〕を具備するマトリックス〔斜C〕views、及びそれぞれの照明方向〔斜l〕の係数の列ベクトル〔太c〕〔斜T〕 〔斜l〕を具備するマトリックス斜Cillums、と図2Bにより図示されるように、異なるモードマトリックス間の相互作用を支配するMICAの基礎テンソル〔斜B〕=〔斜S〕×〔太C〕pixels、とを引き出す。図2Bは、〔書B〕=〔斜S〕×〔太C〕pixelsとして獲得された、〔書D〕の75×6×6×8560MICA表現の部分視覚化330を示す。
構造Iでは、モードマトリックスの各々は一組の統計的独立な係数を具備するが、構造IIが、人々、視点、照明、その他に渡る一組の独立な基礎を生産する。
構造II:MICAは式(15)のように同じ数学的な形式を有する。しかしながら、コアテンソル〔斜S〕とモードマトリックス〔太C〕…〔太C〕は、式(9)〜(11)により計算される。この構造は、異なるモードに渡って統計的独立である一組の基礎ベクトルを生ずる。
PCAまたは「アイゲンフェイス」において、既知の「連続する」顔画像〔太D〕〔斜d〕は、減少された次元の基礎マトリックス〔太B〕PCAと、それぞれのベクトル化された画像〔太D〕〔斜d〕と関連する係数〔太c〕〔斜d〕のベクトルを具備するマトリックス〔太C〕に分解される。未知の顔の画像〔太D〕newがあれば、射影演算子〔太B〕−1 PCAは、この新しい画像を画像係数〔太c〕new=〔太B〕−1 PCA〔太D〕newの減少された次元空間に線形に投影する。
すぐ後に続く引用で記載される認識手順は、この線形射影アプローチに基づき、このためそれは多重線形構造を完全には利用しない。M.A.O. Vasilescu et al. "Multilinear analysis for facial image recognition," In Proc. Int. Conf on Pattern Recognition, Quebec City, August 2002を参照する。本発明の1つの典型的な実施形態は、特性、照明、視点、及びラベルのないテスト画像の表現ラベルを推論する基本的な問題に対処する。この問題の解決があれば、ICAの統計的独立特性とテンソル構造の多重線形構造とに基づく単純な認識アルゴリズムが得られる。
図3Aは、画像を表現するためにMICA手順により使用される係数ベクトルの集合である典型的な画像表現340を示す。
第1係数ベクトルは、人の特性をコード化し、第2は視点をコード化し、第3は照明をコード化し、その他同様にコード化する。
図3Bは、基礎テンソルへの新しい画像の画像応答350を示す。新しい画像が、人、視点、及び照明方向が決定されないままであれば、基礎テンソル〔書B〕=〔書S〕×4〔太C〕pixelsx4Cpixelsへの画像応答は、式(17)のように計算されることが可能である。
Figure 2007518199
ここで、〔書R〕は、画像を作る異なる要素の多モード応答である。このテンソルの応答は、〔太d〕newと関連する人々パラメータを引き出すために利用されることができる、図3Bに示される特定の構造を有する。更に詳しくは、この画像は、以下に示す、照明係数ベクトル〔太c〕、視点係数ベクトル〔太c〕、及び人係数ベクトル〔太c〕、の係数ベクトルの未知の集合から造られる。顔認識の問題は、計算された人係数ベクトルの分類である。
Figure 2007518199
画像応答Rは、列が式(18)の人々パラメータ〔太c〕〔斜p〕の倍数であるマトリックスとして再編成されることが可能である。画像応答の再編成は、人々モードに沿って平坦化することにより達成される。さらに詳しく調べてみると、マトリックス〔太R〕(people)はランク1を有し、その列は〔太c〕の倍数である。それゆえ、〔書R〕の人々ランクは1であり、それゆえ〔太R〕(people)のSVDは、〔太C〕を引き出すことができる。同様に視点モードあるいは照明モードその他に沿って平坦化することがマトリックス〔太R〕(viewpoints)と〔太R〕(illumination)を生じることは、その列がそれぞれの〔太c〕と〔太c〕の複数であることが観察されることができる。これらの係数ベクトル、視点係数ベクトル、照明係数ベクトル等がそれぞれのマトリックスで特異値分解を計算することにより引き出される。
それゆえ、上記したように、テスト画像と関連する全ての構成要因と全ての係数ベクトルは、ランク(〔斜R〕,〔斜R〕,…,〔斜R〕)=ランク(1,1,…,1)である多モード応答テンソル〔書R〕上でNモードSVDを計算することにより引き出されることが可能である。
引き出された〔太c〕を使用し、個人の認識を実行することが可能である。それは、正規化された最も近い隣人と等価なコサイン関数を使用し、〔太C〕peopleの列に記憶される人々パラメータに対して比較されることが可能である。画像要因のうちの1つが表情であるならば、人は同様に表現認識をすることができる。このように、画像と関連する全ての要因は認識できる。本発明の1つの典型的な実施形態において、典型的な手順は75の主題のグレイレベル顔画像に適用されることができる。それぞれの主題は、15の異なる視点(水平面φ=0°上の5°ステップのθ=−35°から+350°)から、15の異なる照明(傾斜面φ=45°上の5°ステップのθ=−35°から+350°)の下で、撮像することができる。図4Aは主題照明が垂直に配置され、視点が水平に配置され他状態で物体の1つのために225の典型的な画像の360の完全な集合を示す。箱に入れられる画像が連続させるために使用される可能性がある。画像集合360は図4Bの左上走査として示される主題の3D走査370から描画される可能性がある。図4Bに示される75の走査は、CyberwareTM 3030PSレーザースキャナを使用して記録される可能性があり、フライブルグ大学で創造された3D可変顔データベースの一部である。
Figure 2007518199
要約すると、独立要素分析(ICA)技術は、トレーニング画像の組み合わせの表現構成要素の統計的依存性を最小にする可能性がある。しかし、ICA技術は一般に画像形成に固有の場面構造、照明、及び画像化に関連する異なる要素を区別することができない。本発明による非線形な多元的なICA手順は、上述したように、ICA技術を一般化することを役立たせることができる。例えば、画像組み合わせの本発明による典型的な多重線形ICA(MICA)手順は、複数の要素の統計的独立要素を突き止めることができる。ICA技術が線形(マトリックス)代数学を使用するのに対して、本発明によるMICA手順は一般に多重線形(テンソル)代数学を利用する可能性がある。顔画像組み合わせのこの文脈において、私たちは典型的なMICA手順により学ばれる統計的規則性が立ち向かうことができる自動顔認識を改善する情報を捕捉することができることを実証する。この文脈において、私たちはラベルのないテスト画像のモードラベル(人、視点、照明、表現、その他)の干渉に対する多重線形フレームワークに、基本的な問題にも立ち向かう。
発明は好ましい実施形態に関連付けて記載されるが、上記の好ましい実施形態の他の変化と修正が発明の範囲から逸脱することなくなされる可能性があることは当業者によく理解される。他の実施形態は、ここに開示される発明の明細書あるいは慣例を考慮することにより当業者にとって明らかである。明細書と記載された例題は、典型的であるのみであり、以下に示されるクレームにより示される発明の真の範囲と精神の範囲内であることが意図される。さらに、完全にここで示されるように、ここに引用される全ての引用文献はこの参照によりここに取り入れられる。
全ての画像の貫く変化の主軸である、典型的な主要素分析(PCA)固有ベクトル(例えば、アイゲンフェイス)を示す図である。 典型的な「テンソルフェイス」表現の部分視覚化を示す図である。 本発明の典型的な実施形態で使用されることができる画像データの独立要素を示す図である。 本発明の典型的な実施形態で使用されることができる典型的な多重線形独立要素分析(MICA)表現の部分視覚化を示す図である。 本発明の典型的な実施形態で使用される特定画像を表現するための「テンソルフェイス」あるいはMICA表源のどちらかが使用される係数ベクトルの集合の画像表現を示す図である。 基礎テンソルへの新しい画像の画像応答を示す図である。 本発明の典型的な実施形態で使用される水平に配列される視点と垂直に配列される照明で対象の1つのための画像の完全な集合を示す図である。 描かれた図4Aの画像からの対象の走査を示す図である。 本発明によるMICA手順を実行するコンピュータシステムの1つの典型的な実施形態のブロック図を示す。 本発明による多重線形独立要素分析を使用する画像データを処理する方法の1つの典型的な実施形態のブロック図を示す。 本発明の典型的な実施形態によるサンプルのテンソルを示す構成図である。 本発明の典型的な実施形態によるモード1で平坦化されたテンソルを示す構成図である。 本発明の典型的な実施形態によるサンプルのテンソルを示す構成図である。 本発明の典型的な実施形態によるモード2で平坦化されたテンソルを示す構成図である。 本発明の典型的な実施形態によるサンプルのテンソルを示す構成図である。 本発明の典型的な実施形態によるモード3で平坦化されたテンソルを示す構成図である。
符号の説明
100 コンピュータシステム
110 メモリ
112 MICAアプリケーション
114 画像データベース
120 画像捕捉システム
130 処理装置

Claims (31)

  1. 画像に関連する画像データを基礎テンソルに適用する段階と、
    画像データの基礎テンソルへの適用に基づき応答データを獲得する段階と、
    応答データから係数ベクトルを引き出す段階を備えることを特徴とするデータ処理方法。
  2. 上記応答データが、画像を構成する要素への多様な応答に関連することを特徴とする上記請求項1に記載の方法。
  3. 上記応答データに対応する画像の画像部分を平坦化する段階を更に備えることを特徴とする上記請求項1に記載の方法。
  4. 上記平坦化する段階が、更なるマトリクス中に応答データを配置するために、予め定められたモードを使用し、画像部分を平坦化する段階を備えることを特徴とする上記請求項3に記載の方法。
  5. 上記平坦化する段階が、画像の画像パラメータの倍数であるコラムを有する更なるマトリクス中に応答データを配置するために、予め定められたモードを使用し、画像部分を平坦化する段階を備えることを特徴とする上記請求項3に記載の方法。
  6. 上記平坦化する段階が、人間モードに基づき応答データを平坦化する段階を備えることを特徴とする上記請求項3に記載の方法。
  7. 上記引き出す段階が、応答データから人間係数ベクトルを引き出す段階を備えることを特徴とする上記請求項1に記載の方法。
  8. 上記引き出す段階が、特異値分解手順を使用し係数ベクトルを引き出す段階を備えることを特徴とする上記請求項1に記載の方法。
  9. 上記引き出された係数ベクトルと更なる画像に関連する更なるデータのマトリクス中に備えられた複数のパラメータとを比較する段階を更に備えることを特徴とする上記請求項1に記載の方法。
  10. 上記比較する段階が、引き出された人間係数ベクトルとマトリクスの人間係数列に記憶される複数の人間パラメータとを比較する段階を備えることを特徴とする上記請求項9に記載の方法。
  11. 上記比較する段階が、規格化された最近傍とほぼ等価であるコサイン関数を使用して実行されることを特徴とする上記請求項10に記載の方法。
  12. 画像に関連するデータを受信可能とする処理装置と、
    処理装置と通信するように配置され、コンピュータ実行可能な指示セットを記憶する記憶装置とを備え、
    上記指示セットは、
    1)第1セットは、処理装置が画像に関連する画像データを基礎テンソルに適用することを可能とするように構成され、
    2)第2セットは、処理装置が画像データの基礎テンソルへの適用に基づき応答データを獲得することを可能とするように構成され、
    3)第3セットは、処理装置が応答データから係数ベクトルを引き出すことを可能とするように構成されることを特徴とするコンピュータシステム。
  13. 上記応答データが、画像を構成する要素への多様な応答に関連することを特徴とする上記請求項12に記載のコンピュータシステム。
  14. 上記指示セットは、処理装置が上記応答データに対応する画像の画像部分を平坦化することを可能とするように構成される第4セットを更に備えることを特徴とする上記請求項12に記載のコンピュータシステム。
  15. 上記第4セットは、処理装置が更なるマトリクス中に応答データを配置するために、予め定められたモードを使用し、画像部分を平坦化する構成とすることを可能とすることを特徴とする上記請求項14に記載のコンピュータシステム。
  16. 上記画像部分は、画像の画像パラメータの倍数であるコラムを有する更なるマトリクス中に応答データを配置するために、予め定められたモードを使用し、平坦化されることを特徴とする上記請求項14に記載のコンピュータシステム。
  17. 上記画像部分は、人間モードに基づいて使用し、平坦化されることを特徴とする上記請求項14に記載のコンピュータシステム。
  18. 上記第3セットは、処理装置を応答データから人間係数ベクトルを引き出すように構成することを特徴とする上記請求項12に記載のコンピュータシステム。
  19. 上記第3セットは、処理装置を特異値分解手順を使用し係数ベクトルを引き出すように構成することを特徴とする上記請求項12に記載のコンピュータシステム。
  20. 上記指示セットは、処理装置が上記引き出された係数ベクトルと更なる画像に関連する更なるデータのマトリクス中に備えられた複数のパラメータとを比較することを可能とするように構成される第5セットを更に備えることを特徴とする上記請求項12に記載のコンピュータシステム。
  21. 上記第4セットは、処理装置が引き出された人間係数ベクトルとマトリクスの人間係数列に記憶される複数の人間パラメータとを比較するように構成されることを特徴とする上記請求項20に記載のコンピュータシステム。
  22. 上記比較は、規格化された最近傍とほぼ等価であるコサイン関数を使用して実行されることを特徴とする上記請求項21に記載のコンピュータシステム。
  23. コンピュータ実行可能な指示セットを記憶し、
    上記指示セットは、
    1)第1セットは、処理装置が画像に関連する画像データを基礎テンソルに適用することを可能とするように構成され、
    2)第2セットは、処理装置が画像データの基礎テンソルへの適用に基づき応答データを獲得することを可能とするように構成され、
    3)第3セットは、処理装置が応答データから係数ベクトルを引き出すことを可能とするように構成されることを特徴とするコンピュータ読取り可能媒体。
  24. 階乗コードを生成するために、多重線形独立要素分析手順を画像データに適用し、
    上記適用段階の結果に基づき、物、視点、及び照明と関連する複数の係数のセットを有する画像データの表現を生成し、
    上記セットのそれぞれはお互いに統計的に独立していることを特徴とするデータを処理する方法。
  25. 画像に関連する係数ベクトルのセットを備え、
    上記ベクトルは、画像の識別子、画像の視点、及び画像の照明方向を具備することを特徴とする記憶装置に記憶することが可能なデータ構造。
  26. 上記画像は、人間の画像であることを特徴とする上記請求項21に記載のデータ構造。
  27. 上記画像は、人間の顔の画像であることを特徴とする上記請求項21に記載のデータ構造。
  28. 上記係数ベクトルセットは、マトリックスで配置されることを特徴とする上記請求項21に記載のデータ構造。
  29. 複数の画像に関連する情報を獲得し、
    上記情報に関連する基礎テンソルを決定し、
    上記基礎テンソルが、
    a)統計的に独立であること、
    b)係数セットを具備し、上記セットのそれぞれは統計的に独立であること
    のうち少なくとも1つであることを特徴とするデータ処理方法。
  30. 画像に関連するデータを受信可能な処理装置と、
    上記処理装置と通信するように配置され、コンピュータ実行可能指示セットを記憶した記憶装置とを備え、
    上記指示セットは、
    1)上記処理装置が複数の画像に関連する情報を獲得可能とするように構成される第1セットと、
    2)上記処理装置が上記情報と関連する基礎テンソルを決定可能とするように構成される第2セットとを備え、
    上記基礎テンソルが
    a)統計的に独立であること、
    b)係数セットを具備し、上記セットのそれぞれは統計的に独立であること
    のうち少なくとも1つであることを特徴とするコンピュータシステム。
  31. コンピュータ実行可能な指示セットを記憶し、
    上記指示セットは、
    1)上記処理装置が複数の画像に関連する情報を獲得可能とするように構成される第1セットと、
    2) 2)上記処理装置が上記情報と関連する基礎テンソルを決定可能とするように構成される第2セットとを備え、
    上記基礎テンソルが
    a)統計的に独立であること、
    b)係数セットを具備し、上記セットのそれぞれは統計的に独立であること
    のうち少なくとも1つであることを特徴とするコンピュータ読取り可能媒体。
JP2006549695A 2004-01-13 2005-01-13 多重線形独立要素分析を使用した画像認識の方法、システム、記憶媒体、及びデータ構造 Pending JP2007518199A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US53621004P 2004-01-13 2004-01-13
PCT/US2005/001671 WO2005067572A2 (en) 2004-01-13 2005-01-13 Method, system, storage medium, and data structure for image recognition using multilinear independent component analysis

Publications (1)

Publication Number Publication Date
JP2007518199A true JP2007518199A (ja) 2007-07-05

Family

ID=34794392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006549695A Pending JP2007518199A (ja) 2004-01-13 2005-01-13 多重線形独立要素分析を使用した画像認識の方法、システム、記憶媒体、及びデータ構造

Country Status (5)

Country Link
US (1) US7693299B2 (ja)
EP (1) EP1709572A2 (ja)
JP (1) JP2007518199A (ja)
CA (1) CA2553452A1 (ja)
WO (1) WO2005067572A2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7609859B2 (en) * 2005-06-14 2009-10-27 Mitsubishi Electric Research Laboratories, Inc. Method and system for generating bi-linear models for faces
US7609860B2 (en) * 2005-06-14 2009-10-27 Mitsubishi Electric Research Laboratories, Inc. Bilinear illumination model for robust face recognition
JP4856181B2 (ja) * 2005-08-11 2012-01-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像データセットからのビューのレンダリング
US8331662B2 (en) * 2009-01-21 2012-12-11 Xerox Corporation Imaging device color characterization including color look-up table construction via tensor decomposition
US8442330B2 (en) 2009-03-31 2013-05-14 Nbcuniversal Media, Llc System and method for automatic landmark labeling with minimal supervision
US9681147B2 (en) * 2014-01-20 2017-06-13 Board Of Trustees Of Michigan State University Compression of image ensembles using tensor decomposition
US10198498B2 (en) * 2015-05-13 2019-02-05 Rovi Guides, Inc. Methods and systems for updating database tags for media content
US10217018B2 (en) * 2015-09-15 2019-02-26 Mitsubishi Electric Research Laboratories, Inc. System and method for processing images using online tensor robust principal component analysis
US10360163B2 (en) 2016-10-27 2019-07-23 Google Llc Exploiting input data sparsity in neural network compute units
US10175980B2 (en) 2016-10-27 2019-01-08 Google Llc Neural network compute tile
US9959498B1 (en) * 2016-10-27 2018-05-01 Google Llc Neural network instruction set architecture
CN107194410B (zh) * 2017-03-30 2020-01-14 西北大学 一种基于多线性ica的光谱张量降维的分类方法
US10229092B2 (en) 2017-08-14 2019-03-12 City University Of Hong Kong Systems and methods for robust low-rank matrix approximation
US11567816B2 (en) * 2017-09-13 2023-01-31 Hrl Laboratories, Llc Transitive tensor analysis for detection of network activities

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6441821B1 (en) * 1998-07-03 2002-08-27 Hitachi, Ltd. Method and apparatus for displaying three-dimensional image by use of tensor rendering
WO2003055119A2 (en) * 2001-12-06 2003-07-03 New York University Logic arrangement, data structure, system and method for multilinear representation of multimodal data ensembles for synthesis, recognition and compression

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US647060A (en) * 1899-08-25 1900-04-10 Lyman B Wood Potato-planter.
US1876681A (en) * 1931-02-17 1932-09-13 Irwin John Stamm Combination reading desk and bookcase
US1996191A (en) * 1934-10-22 1935-04-02 Seymour S Cook Portable adjustable reader's desk
US2136701A (en) * 1937-08-09 1938-11-15 Manierre George Book holder for reading stands
US2595682A (en) * 1948-06-11 1952-05-06 Crispin H Lipa Holder for books
US2572731A (en) * 1949-03-07 1951-10-23 Keith Arthur Raymond Book- and copyholder
US4380947A (en) * 1980-06-20 1983-04-26 Nippon Gakki Seizo Kabushiki Kaisha Portable electronic musical instrument having separable controlling panel and keyboard
US4372630A (en) * 1980-11-14 1983-02-08 Fuhri William F Portable easel device
US4471933A (en) * 1981-08-21 1984-09-18 Nelson Donald R Music stand
US5321816A (en) 1989-10-10 1994-06-14 Unisys Corporation Local-remote apparatus with specialized image storage modules
US5301350A (en) 1989-10-10 1994-04-05 Unisys Corporation Real time storage/retrieval subsystem for document processing in banking operations
US5301284A (en) 1991-01-16 1994-04-05 Walker-Estes Corporation Mixed-resolution, N-dimensional object space method and apparatus
EP0496494A3 (en) 1991-01-22 1993-05-12 International Business Machines Corporation Software maintenance system
US5232274A (en) * 1991-04-15 1993-08-03 Tom Johan Hamper for disposable waste bag
US5347653A (en) 1991-06-28 1994-09-13 Digital Equipment Corporation System for reconstructing prior versions of indexes using records indicating changes between successive versions of the indexes
US5170455A (en) 1991-10-30 1992-12-08 At&T Bell Laboratories Optical connective device
DE4326487C2 (de) * 1992-09-16 1995-02-09 Konrad Michael Dipl Ing Weigl Adaptives Filter
US5560003A (en) 1992-12-21 1996-09-24 Iowa State University Research Foundation, Inc. System and hardware module for incremental real time garbage collection and memory management
US5428731A (en) 1993-05-10 1995-06-27 Apple Computer, Inc. Interactive multimedia delivery engine
CA2117314C (en) * 1994-06-09 1999-09-28 Andre Lafond Biological specimen cassette
US5784294A (en) 1995-06-09 1998-07-21 International Business Machines Corporation System and method for comparative molecular moment analysis (CoMMA)
US5577628A (en) * 1995-09-13 1996-11-26 Tucker Housewares Hamper with bi-directional opening lid
US5740425A (en) 1995-09-26 1998-04-14 Povilus; David S. Data structure and method for publishing electronic and printed product catalogs
US5717919A (en) 1995-10-02 1998-02-10 Sybase, Inc. Database system with methods for appending data records by partitioning an object into multiple page chains
DE19538240A1 (de) 1995-10-13 1998-08-06 Annette Brueckner Informationssystem und Verfahren zur Speicherung von Daten in einem Informationssystem
US5884056A (en) 1995-12-28 1999-03-16 International Business Machines Corporation Method and system for video browsing on the world wide web
ATE301716T1 (de) * 1996-02-21 2005-08-15 Univ Texas Vmp-ähnliche sequenzen von pathogener borrelia
US5890152A (en) 1996-09-09 1999-03-30 Seymour Alvin Rapaport Personal feedback browser for obtaining media files
US5974418A (en) 1996-10-16 1999-10-26 Blinn; Arnold Database schema independence
US5799312A (en) 1996-11-26 1998-08-25 International Business Machines Corporation Three-dimensional affine-invariant hashing defined over any three-dimensional convex domain and producing uniformly-distributed hash keys
US5802525A (en) 1996-11-26 1998-09-01 International Business Machines Corporation Two-dimensional affine-invariant hashing defined over any two-dimensional convex domain and producing uniformly-distributed hash keys
US6724931B1 (en) 1996-12-02 2004-04-20 Hsu Shin-Yi Compilable plain english-like language for extracting objects from an image using a primitive image map
US5823500A (en) * 1996-12-04 1998-10-20 La Coste; Lee Clipboard drafting system
US5765799A (en) * 1996-12-10 1998-06-16 Weber; Barbara Portable collapsible stand for facilitating holding book pages open
US5794256A (en) 1996-12-12 1998-08-11 Microsoft Corporation Pointer swizzling facility using three-state references to manage access to referenced objects
US5870749A (en) 1996-12-19 1999-02-09 Dset Corporation Automatic translation between CMIP PDUs and custom data structures
US5845285A (en) 1997-01-07 1998-12-01 Klein; Laurence C. Computer system and method of data analysis
IL120136A0 (en) * 1997-02-03 1997-06-10 Yissum Res Dev Co Synthesizing virtual two dimensional images of three dimensional space from a collection of real two dimensional images
US5995999A (en) 1997-03-12 1999-11-30 Fujitsu Limited Naming system for hierarchically named computer accessible objects
US6631364B1 (en) 1997-03-26 2003-10-07 National Research Council Of Canada Method of searching 3-Dimensional images
US6003038A (en) 1997-03-31 1999-12-14 Sun Microsystems, Inc. Object-oriented processor architecture and operating method
US5893546A (en) * 1997-04-03 1999-04-13 Renfroe; Curtis Adjustable book holder
US6029169A (en) 1997-05-01 2000-02-22 Stratum Technologies Corporation Universal software structure for representing model structures
EP0990209A4 (en) 1997-06-04 2004-09-15 Gary L Sharp DATABASE STRUCTURE AND ASSOCIATED MANAGEMENT
US5884889A (en) * 1997-07-01 1999-03-23 Crosby; Tom Adjustable book support with arm clearance recesses
US6404743B1 (en) 1997-11-04 2002-06-11 General Instrument Corporation Enhanced simple network management protocol (SNMP) for network and systems management
US5974416A (en) 1997-11-10 1999-10-26 Microsoft Corporation Method of creating a tabular data stream for sending rows of data between client and server
US6631403B1 (en) 1998-05-11 2003-10-07 At&T Corp. Architecture and application programming interfaces for Java-enabled MPEG-4 (MPEG-J) systems
US5944209A (en) * 1998-06-09 1999-08-31 Lucent Technologies Dual use cover
US6535919B1 (en) 1998-06-29 2003-03-18 Canon Kabushiki Kaisha Verification of image data
US6381507B1 (en) 1998-07-01 2002-04-30 Sony Corporation Command pass-through functionality in panel subunit
US6591004B1 (en) 1998-09-21 2003-07-08 Washington University Sure-fit: an automated method for modeling the shape of cerebral cortex and other complex structures using customized filters and transformations
US6721454B1 (en) 1998-10-09 2004-04-13 Sharp Laboratories Of America, Inc. Method for automatic extraction of semantically significant events from video
US6408321B1 (en) * 1999-03-24 2002-06-18 International Business Machines Corporation Method and apparatus for mapping components of descriptor vectors to a space that discriminates between groups
US6349265B1 (en) 1999-03-24 2002-02-19 International Business Machines Corporation Method and apparatus for mapping components of descriptor vectors for molecular complexes to a space that discriminates between groups
JP3763992B2 (ja) 1999-03-30 2006-04-05 富士通株式会社 データ処理装置及び記録媒体
US6549943B1 (en) 1999-06-16 2003-04-15 Cisco Technology, Inc. Network management using abstract device descriptions
US6501857B1 (en) * 1999-07-20 2002-12-31 Craig Gotsman Method and system for detecting and classifying objects in an image
US6691096B1 (en) 1999-10-28 2004-02-10 Apple Computer, Inc. General purpose data container method and apparatus for implementing AV/C descriptors
US6470360B1 (en) 1999-12-20 2002-10-22 Sybase, Inc. Database system with improved methodology for page allocation
US6789128B1 (en) 2000-03-11 2004-09-07 Oracle International Corporation System and method for reducing network traffic between two computing devices
US6738356B1 (en) 2000-08-10 2004-05-18 Convedia Corporation Object oriented video merging system
US7130484B2 (en) 2001-10-15 2006-10-31 Jonas August Biased curve indicator random field filters for enhancement of contours in images
US7085426B2 (en) 2001-10-15 2006-08-01 Jonas August Volterra filters for enhancement of contours in images
WO2004075685A2 (en) * 2003-02-27 2004-09-10 Phifer Wire Products, Inc. Reading stand

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6441821B1 (en) * 1998-07-03 2002-08-27 Hitachi, Ltd. Method and apparatus for displaying three-dimensional image by use of tensor rendering
WO2003055119A2 (en) * 2001-12-06 2003-07-03 New York University Logic arrangement, data structure, system and method for multilinear representation of multimodal data ensembles for synthesis, recognition and compression

Also Published As

Publication number Publication date
US7693299B2 (en) 2010-04-06
WO2005067572A3 (en) 2005-12-22
US20080247608A1 (en) 2008-10-09
EP1709572A2 (en) 2006-10-11
WO2005067572A2 (en) 2005-07-28
CA2553452A1 (en) 2005-07-28

Similar Documents

Publication Publication Date Title
JP2007518199A (ja) 多重線形独立要素分析を使用した画像認識の方法、システム、記憶媒体、及びデータ構造
Eickeler et al. Recognition of JPEG compressed face images based on statistical methods
Zangeneh et al. Low resolution face recognition using a two-branch deep convolutional neural network architecture
Vasilescu et al. Multilinear independent components analysis
Bryt et al. Compression of facial images using the K-SVD algorithm
US8842891B2 (en) Ultra-low dimensional representation for face recognition under varying expressions
EP1418507A2 (en) Method and system for multiple cue integration
US7103225B2 (en) Clustering appearances of objects under varying illumination conditions
Agarwal et al. Anubhav: recognizing emotions through facial expression
US20120063689A1 (en) Object recognition in an image
US7848544B2 (en) Robust face registration via multiple face prototypes synthesis
Prates et al. Kernel cross-view collaborative representation based classification for person re-identification
Moeini et al. 2D facial expression recognition via 3D reconstruction and feature fusion
Georgy et al. Data dimensionality reduction for face recognition
Ebrahimpour-Komleh et al. Robustness to expression variations in fractal-based face recognition
Penev Dimensionality reduction by sparsification in a local-features representation of human faces
Vasilescu et al. Multilinear (tensor) ICA and dimensionality reduction
Roshna et al. Multimodal low resolution face recognition using SVD
Nguyen et al. Face recognition based on Low-Rank matrix Representation
Srinivasan et al. Pseudo 2D Hidden Markov Model Based Face Recognition System Using Singular Values Decomposition Coefficients
Vijay et al. Analysis Of Face Recognition-A Case Study On Feature Selection And Feature Normalization
Rohban et al. Face virtual pose generation using multi resolution subspaces
Nourbakhsh et al. Learning of graph compressed dictionaries for sparse representation classification
Quanxue et al. Directional principal component analysis for image matrix
Sepas-Moghaddam et al. Face recognition in colour JPEG compressed domain

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100316

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100810