JP2005149507A - テクストンを用いる対象物認識方法及び装置 - Google Patents
テクストンを用いる対象物認識方法及び装置 Download PDFInfo
- Publication number
- JP2005149507A JP2005149507A JP2004331174A JP2004331174A JP2005149507A JP 2005149507 A JP2005149507 A JP 2005149507A JP 2004331174 A JP2004331174 A JP 2004331174A JP 2004331174 A JP2004331174 A JP 2004331174A JP 2005149507 A JP2005149507 A JP 2005149507A
- Authority
- JP
- Japan
- Prior art keywords
- texton
- image data
- digital image
- interest
- normalized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/422—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
- G06V10/424—Syntactic representation, e.g. by using alphabets or grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
- G06V10/464—Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
【解決手段】デジタル画像データにおける対象物を自動的に認識する方法であって、入力されたデジタル画像データにおける関心対象物を検出するステップ(S310)と、正規化関心対象物を得るステップ(S320)と、前記正規化関心対象物のテクストン表現を割り当て付与して第一のテクストンアレイを形成するステップ(S330)と、前記テクストン表現と少なくとも一つの他の対象物についての前以て決定されているテクストン表現の間の類似性を決定するステップ(S340)と、を有する。
【選択図】図3
Description
図2に示されるように、この実施態様における画像処理ユニット120は、メモリー210、対象物検出ユニット220、正規化ユニット230、テクストン処理ユニット240、類似性決定ユニット250、および画像処理コントロールユニット260を有している。この図2の種々の構成要素は一つ一つ分離した要素として図示されているが、この図示は説明を容易にするためであり、当然のことながら、種々の構成要素のある幾つかの作用操作は同じ物理的デバイスによって、たとえばパソコンのマイクロプロセッサーによって実行され、あるいは複数の汎用および/または特定目的のプロセッサーに分散実施され得るものである。当業者はまた、示されている各機能ユニットは部分的にまたは全面的にソフトウエアー、ハードウエアーおよび/またはファームウエアー、あるいはそれらのいかなる組合せによっても実行されることを理解するだろう。画像処理ユニット120の複数構成要素の作用操作は、以下の図を参照して説明される。
種々の異なる条件下での多数の対象物を見た後で、人間は対象物がその外観をどのように変化させるかということについての暗黙の内的モデルを構築することが出来る。この内的モデルを用いて、人間は新たな条件の下で対象物がどのように見える(外観)かを想像することが出来る。たとえば人間は一つの正面像をみただけでも、次に横からその人を見て容易に認識することが出来る。また、たとえば人間はかなり長年月会わなかった場合でも友人を認識することができる。本発明の幾つかの実施態様は、種々のイメージング条件下における対象物、特に顔の認識能力についてスポットを当てている。これらの実施態様は人間の視覚に大まかに似ているアルゴリズムモデルを用いることが出来る。すなわち、異なるイメージング条件下で対象物の外観がどのように変化するかを予測するモデル構築するために、アルゴリズムフレームワークが用いられる。一実施態様においてはこの課題を実現するために、テクストン相関モデル(Texton Correlation Model)が用いられる。テクストンは対象物の別々の(離散した)代表的な局部的特徴の集合(セット)である。テクストン相関モデルは、イメージング条件が変化するときにどのようにテクストンが変化するかを効率的に符号化する。一旦これらの変化が考慮されると、イメージング条件に対してセンシティブでない画像の間の類似性尺度が実行できる。このテクストン相関モデルを用いることで、たった一つの人の顔から、広範囲にわたる照明やポーズや、あるいはまた何年も歳を取ったあとにおける顔を認識することが出来る。別の実施態様ではフィッシャーテクストンモデルを用いる。フィッシャーテクストンモデルは、同一個人の顔画像から別の個人の顔画像を最も良く判別する線形ベクトルのセットを算出するために、線形判別分析(Linear Discriminant Analysis)を利用する。テクストン相関モデルに似て、フィッシャーテクストンモデルは、広範囲にわたる照明やポーズや年齢の変化を乗り越えて顔を認識するために用いられる。
テクストンは学習によって得られたフィルター出力の共起(性)(co-occurrences)として定義される。特にフィルターはたとえばガウス微分フィルター(Gaussian derivative filter)のような線形畳み込みオペレーターの形をとる。グレイスケール画像処理で用いられるテクストンに対する同様の定義は、 “Representing and Recognizing the Visual Appearance of Materials using three-dimensional Textons、" T. Leung and J. Malik、 Int. J. Computer Vision、 43(1): 5-24、 1195、に記載されており、上記文献は出願のための援用がされる。
化された基準対象物画像の各々について形成する。各フィルター応答420azはおよそM×N画素を有する画像である。フィルター応答420azにおける画素数は正規化された対象画像410における画素数とはフィルターオーバーハングの所為で多少異なる。フィルター応答420azを形成するために使用されるフィルターの詳細は図5に関連して説明される。
一旦テクストンが正規化された関心対象物410に対し生成されると、それらの類似性が他のクラス間あるいはクラス内関心対象物についての他のテクストンと比較される。このタスクは、2つの関心画像を与えられてそれらが同一対象物に属するか否かを決定するということになる。顔の認識および照合の問題においては、このタスクは2つの顔画像が同一人物に属するかどうかを決定することである。本発明の実施態様に従って2つのアプローチ、ここで言うテクストン相関モデルおよびフィッシャーテクストンについて、以下詳細に説明される。しかしながら当業者は対象物の認識および/または照合を実行するために、他の手法が画像化された(imaged)対象物のテクストン表現と関連して使用することができることは理解するであろう。
異なる条件下で画像化された対象物の比較を行う一つのアプローチは、変化するイメージング(画像化)条件の結果として生ずるテクストン変化を表現できるモデルを開発することである。そのようなモデルは対象物クラス内、すなわち、たとえば照明とかポーズとかその他の変化、での認識および/または照合を可能にする。テクストン相関モデルは確率的アプローチであり、それは種々の変化するイメージング条件下で対象物がその外観をどのように変化させるかを決定し、種々の条件下、たとえば広範囲にわたる照明、ポーズおよび何年もの年月経過、での人の単一の画像から顔を認識する。テクストン相関モデルには2つの異なる段階がある。最初の段階はトレーニングとみなされ、2つ目の段階は認識とみなされる。トレーニング段階では、2つの条件付確率表が対象物画像に関するデータベースから学習によって得られる。顔の認識と照合の場合、このデータベースは異なる人々の顔画像を有する。学習によって得られたこれらの確率表は、関心対象物の他の事例に対して適用される。顔に関しては、これらの確率表は2つの顔画像がどの位類似しているかを教え、どの位の確かさでそれらが同一人物から来ているかに関する類似性尺度を与える。認識段階においては、この確率表は2つの識別可能な画像に含まれる対象物表現は同じ対象物によって作られていたという尤度(確からしさ)を決定するために用いられる。
ここまでで示された条件付テクストン分布モデルは、テクストン割り当て付与は位置について独立しているという仮定をしている。これは通常正確な仮定ではない。たとえば左目と右目の外観は明らかに相互に関連がある。しかしながらこの仮定は尤度比が効率的に計算できることを可能にする。フィッシャーテクストンでは対象物の特徴間の相互関連を無視しない。特にフィッシャーテクストンは2次の相関も考慮する(すなわち位置的な相関は2次項として捉えられる)。しかしながらイメージング条件の相関は同様に2次項にしか捉えられない。一方、条件付テクストン分布モデルの方は、変化するイメージング条件下での正確なテクストン分布を捉えるために、位置依存性を犠牲にしている。
Claims (42)
- デジタル画像データにおける対象物を自動的に認識する方法であって、
入力されたデジタル画像データにおける関心対象物を検出するステップと、
正規化関心対象物を得るステップと、
前記正規化関心対象物のテクストン表現を割り当て付与して第一のテクストンアレイを形成するステップと、
前記テクストン表現と少なくとも一つの他の対象物についての前以て決定されているテクストン表現の間の類似性を決定するステップと、
を有することを特徴とするデジタル画像データ対象物の自動認識方法。 - 複数の画像から複数の基準対象物を検出して正規化するステップと、
前記複数の正規化基準対象物を形成している画素に基づいて第一の複数のフィルター応答を得るステップと、
前記第一の複数フィルター応答に基づいて第一の複数ベクトルを形成するステップと、
前記第一の複数ベクトルを複数のグループにクラスター化するステップと、を更に有し、
各グループはテクストンラベルを付与されることを特徴とする請求項1記載のデジタル画像データ対象物の自動認識方法。 - 前記正規化関心対象物を形成する画素に基づいて第二の複数のフィルター応答を得るステップと、
前記第二の複数フィルター応答に基づいて第二の複数ベクトルを形成するステップと、
前記正規化関心対象物を形成する画素の各々にテクストンラベルを割り当て付与することにより第一のテクストンラベルアレイを作成するステップと、
を更に有することを特徴とする請求項2記載のデジタル画像データ対象物の自動認識方法。 - 前記第一および第二の複数フィルター応答が複数の循環対称ガウスフィルターの水平および垂直導関数を用いて得られ、更に前記複数のガウスフィルターは複数のスケールを有することを特徴とする請求項3記載のデジタル画像データ対象物の自動認識方法。
- 前記ガウスフィルターは分離可能であることを特徴とする請求項4記載のデジタル画像データ対象物の自動認識方法。
- 前記第一および第二の複数ベクトルの各々は、前記第一および第二のフィルター応答を得るために用いられるフィルターの数に基づく長さを有することを特徴とする請求項4記載のデジタル画像データ対象物の自動認識方法。
- 前記クラスター化ステップはK-ミーンズ・クラスター化アルゴリズムを有することを特徴とする請求項2記載のデジタル画像データ対象物の自動認識方法。
- 前記複数の正規化基準対象物からのトレーニング用セットに属する画像から複数のテクストンアレイを形成するステップと、
前記複数のテクストンアレイから一対のテクストンアレイを選択するステップと、
前記一対のテクストンアレイにおける各要素に対して、前記テクストンラベルの一対が同一クラスにあるかどうかを決定するステップと、
前記テクストンラベルの一対が同一のクラスにあると決定することに基づいて第一の条件付確率表において要素を1つ増加するステップと、
前記テクストンラベルの一対が異なるクラスにあると決定することに基づいて第二の条件付確率表において要素を1つ増加するステップと、
前記選択するステップ、前記決定するステップおよび各増加するステップを前記テクストンアレイの全ての一対が処理されるまで繰り返すステップと、
前記第一および第二の条件付確率表を正規化するステップと、
を更に有することを特徴とする請求項2記載のデジタル画像データ対象物の自動認識方法。 - 前記トレーニング用セットはクラス内画像変動に基づいていることを特徴とする請求項8記載のデジタル画像データ対象物の自動認識方法。
- 前記トレーニング用セットは異なるイメージング条件下における同一対象物の画像に基づいていることを特徴とする請求項8記載のデジタル画像データ対象物の自動認識方法。
- 前記第一および第二の条件付確率表は、テクストンラベルは前記関心対象物における位置に独立であるという仮定に基づいて計算されることを特徴とする請求項8記載のデジタル画像データ対象物の自動認識方法。
- 前記類似性は前記第一および第二確率の尤度比に基づいていることを特徴とする請求項8記載のデジタル画像データ対象物の自動認識方法。
- 第二のテクストンアレイを形成するためにプローブ画像にテクストンラベルを割り当て付与するステップと、
前記第一および第二テクストンアレイにおける各位置に対して、前記正規化関心対象物と前記プローブ画像のテクストン値が同じである第一の確率を前記第一の条件付確率表を用いて決定するステップと、
全ての前記第一の確率を掛けることによって全体類似性の確率を決定するステップと、
前記第一および第二テクストンアレイにおける各位置に対して、前記正規化関心対象物と前記プローブ画像のテクストン値が異なっている第二の確率を前記第二の条件付確率表を用いて決定するステップと、
全ての前記第二の確率を掛けることによって全体非類似性の確率を決定するステップと、
前記全体類似性確率と全体非類似性確率を用いて尤度比を計算するステップと、
前記正規化関心対象物と前記モデル画像の類似性を前記尤度比を用いて決定するステップと、を更に有する、
ことを特徴とする請求項8記載のデジタル画像データ対象物の自動認識方法。 - 複数のテクストンアレイを作成するために、テクストンラベルを前記複数の正規化基準対象物に割り当て付与するステップと、
前記複数のテクストンアレイをベクトルに変換するステップと、
前記ベクトルを用いて線形判別分析を計算して基準ベクトルを形成するステップと、
を更に有することを特徴とする請求項2記載のデジタル画像データ対象物の自動認識方法。 - 前記線形判別分析はフィッシャー線形判別分析であり、前記基準ベクトルはフィッシャーテクストンであることを特徴とする請求項14記載のデジタル画像データ対象物の自動認識方法。
- 前記第一テクストンアレイを用いて第一のベクトルを生成するステップと、
前記第一ベクトルを前記フィッシャーテクストン上へ射影することによって第一射影を決定するステップと、
テクストンラベルをプローブ画像へ割り当て付与して第二テクストンアレイを形成するステップと、
前記第二テクストンアレイを用いて第二のベクトルを生成するステップと、
前記第二ベクトルを前記フィッシャーテクストン上へ射影することによって第二射影を決定するステップと、
前記第一および第二射影を用いて前記正規化関心対象物と前記プローブ画像の類似性を決定するステップと、
を更に有することを特徴とする請求項15記載のデジタル画像データ対象物の自動認識方法。 - 前記関心対象物は顔であり、
前記デジタル画像データ対象物の自動認識方法は、顔認識を実行するステップを更に有する、
ことを特徴とする請求項1記載のデジタル画像データ対象物の自動認識方法。 - 前記関心対象物は顔であり、
前記デジタル画像データ対象物の自動認識方法は、顔照合を実行するステップを更に有する、
ことを特徴とする請求項1記載のデジタル画像データ対象物の自動認識方法。 - 前記関心対象物は顔であり、
前記テクストン表現は顔の特徴を符号化する、
ことを特徴とする請求項1記載のデジタル画像データ対象物の自動認識方法。 - クラス内で識別できる顔の特徴を区別するトレーニング用セットを生成するステップを有する、
ことを特徴とする請求項8記載のデジタル画像データ対象物の自動認識方法。 - 少なくともひとつの異なるクラスにわたって識別できる顔の特徴を区別するトレーニング用セットを生成するステップを更に有する、
ことを特徴とする請求項8記載のデジタル画像データ対象物の自動認識方法。 - デジタル画像データにおける対象物を自動的に認識するための装置であって、
メモリーと機能的処理ユニットに操作可能に接続されていて認識処理を制御するための画像処理制御ユニットを有し、
前記機能的処理ユニットは、
入力デジタル画像データにおける関心対象物の検出のための対象物検出ユニットと、
正規化された関心対象物を得るための正規化ユニットと、
第一のテクストンアレイを形成するために正規化された関心対象物のテクストン表現を割り当て付与するためのテクストン生成ユニットと、
前記テクストン表現と少なくとも一つの他の対象物についての前以て決定されているテクストン表現の間の類似性を決定するための類似性ユニットと、
を有することを特徴とするデジタル画像データ対象物の自動認識装置。 - 前記検出ユニットおよび正規化ユニットはそれぞれ複数の画像からの複数の基準対象物を検出、正規化し、
更に前記テクストン生成ユニットは、前記複数の正規化基準対象物を形成している画素に基づいて第一の複数のフィルター応答を得、
前記第一の複数フィルター応答に基づいて第一の複数ベクトルを形成し、
前記第一の複数ベクトルを複数のグループにクラスター化し、各グループはテクストンラベルを付与される、
ことを特徴とする請求項22記載のデジタル画像データ対象物の自動認識装置。 - 前記テクストン生成ユニットは、前記正規化関心対象物を形成する画素に基づいて第二の複数のフィルター応答を得、
前記第二の複数フィルター応答に基づいて第二の複数ベクトルを形成し、
前記正規化関心対象物を形成する画素の各々にテクストンラベルを割り当て付与することにより第一のテクストンラベルアレイを作成する、
ことを特徴とする請求項23記載のデジタル画像データ対象物の自動認識装置。 - 前記第一および第二の複数フィルター応答が複数の循環対称ガウスフィルターの水平および垂直導関数を用いて得られ、
前記複数のガウスフィルターは複数のスケールを更に有する、
ことを特徴とする請求項24記載のデジタル画像データ対象物の自動認識装置。 - 前記ガウスフィルターは分離可能であることを特徴とする請求項25記載のデジタル画像データ対象物の自動認識装置。
- 前記第一および第二の複数ベクトルの各々は、前記第一および第二のフィルター応答を得るために用いられるフィルターの数に基づく長さを有することを特徴とする請求項25記載のデジタル画像データ対象物の自動認識装置。
- 前記クラスター化はK-ミーンズ・クラスター化アルゴリズムを更に有する、
ことを特徴とする請求項23記載のデジタル画像データ対象物の自動認識装置。 - 前記テクストン生成ユニットは、前記複数の正規化基準対象物からのトレーニング用セットに属する画像から複数のテクストンアレイを形成し、
更に前記類似性決定ユニットは、前記複数のテクストンアレイから一対のテクストンアレイを選択し、
前記一対のテクストンアレイにおける各要素に対して、前記テクストンラベルの一対が同一クラスにあるかどうかを決定し、
前記テクストンラベルの一対が同一のクラスにあると決定することに基づいて第一の条件付確率表において要素を1つ増加し、
前記テクストンラベルの一対が異なるクラスにあると決定することに基づいて第二の条件付確率表において要素を1つ増加し、
前記選択し、前記決定し、および各増加することを前記テクストンアレイの全ての一対が処理されるまで繰り返し、
前記第一および第二の条件付確率表を正規化する、
ことを特徴とする請求項23記載のデジタル画像データ対象物の自動認識装置。 - 前記トレーニング用セットはクラス内画像変動に基づいている、
ことを特徴とする請求項29記載のデジタル画像データ対象物の自動認識装置。 - 前記トレーニング用セットは異なるイメージング条件下における同一対象物の画像に基づいている、
ことを特徴とする請求項30記載のデジタル画像データ対象物の自動認識装置。 - 前記第一および第二の条件付確率表は、テクストンラベルは前記関心対象物における位置に独立であるという仮定に基づいて計算される、
ことを特徴とする請求項29記載のデジタル画像データ対象物の自動認識装置。 - 前記類似性は前記第一および第二確率の尤度比に基づいている、
ことを特徴とする請求項29記載のデジタル画像データ対象物の自動認識装置。 - 前記類似性決定ユニットは
第二のテクストンアレイを形成するためにプローブ画像にテクストンラベルを割り当て付与し、
前記第一および第二テクストンアレイにおける各位置に対して、前記正規化関心対象物と前記プローブ画像のテクストン値が同じである第一の確率を前記第一の条件付確率表を用いて決定し、
全ての前記第一の確率を掛けることによって全体類似性の確率を決定し、
前記第一および第二テクストンアレイにおける各位置に対して、前記正規化関心対象物と前記プローブ画像のテクストン値が異なっている第二の確率を前記第二の条件付確率表を用いて決定し、
全ての前記第二の確率を掛けることによって全体非類似性の確率を決定し、
前記全体類似性確率と全体非類似性確率を用いて尤度比を計算し、
前記正規化関心対象物と前記モデル画像の類似性を前記尤度比を用いて決定する、
ことを特徴とする請求項22記載のデジタル画像データ対象物の自動認識装置。 - 前記テクストン生成ユニットは、複数のテクストンアレイを作成するために、テクストンラベルを前記複数の正規化基準対象物に割り当て付与し、
前記類似性決定ユニットは、前記複数のテクストンアレイをベクトルに変換し、前記ベクトルを用いて線形判別分析を計算して基準ベクトルを形成する、
ことを特徴とする請求項23記載のデジタル画像データ対象物の自動認識装置。 - 前記線形判別分析は、フィッシャー線形判別分析であり、前記基準ベクトルはフィッシャーテクストンであることを特徴とする請求項35記載のデジタル画像データ対象物の自動認識装置。
- 前記類似性決定ユニットは、
前記第一テクストンアレイを用いて第一のベクトルを生成し、
前記第一ベクトルを前記フィッシャーテクストン上へ射影することによって第一射影を決定し、
テクストンラベルをプローブ画像へ割り当て付与して第二テクストンアレイを形成し、
前記第二テクストンアレイを用いて第二のベクトルを生成し、
前記第二ベクトルを前記フィッシャーテクストン上へ射影することによって第二射影を決定し、
前記第一および第二射影を用いて前記正規化関心対象物と前記プローブ画像の類似性を決定する、
ことを特徴とする請求項36記載のデジタル画像データ対象物の自動認識装置。 - 前記関心対象物は顔であり、前記類似性決定ユニットは顔認識を実行する、
ことを特徴とする請求項22記載のデジタル画像データ対象物の自動認識装置。 - 前記関心対象物は顔であり、前記類似性決定ユニットは顔照合を実行する、
ことを特徴とする請求項22記載のデジタル画像データ対象物の自動認識装置。 - 前記関心対象物は顔であり、前記テクストン表現は顔の特徴を符号化する、
ことを特徴とする請求項22記載のデジタル画像データ対象物の自動認識装置。 - 前記類似性決定ユニットは、クラス内で識別できる顔の特徴を区別するトレーニング用セットを生成する、
ことを特徴とする請求項29記載のデジタル画像データ対象物の自動認識装置。 - 前記類似性決定ユニットは、少なくともひとつの異なるクラスにわたって識別できる顔の特徴を区別するトレーニング用セットを生成する、
ことを特徴とする請求項29記載のデジタル画像データ対象物の自動認識装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US51963903P | 2003-11-14 | 2003-11-14 | |
US10/979,175 US7680330B2 (en) | 2003-11-14 | 2004-11-03 | Methods and apparatus for object recognition using textons |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005149507A true JP2005149507A (ja) | 2005-06-09 |
JP4505733B2 JP4505733B2 (ja) | 2010-07-21 |
Family
ID=34704214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004331174A Expired - Fee Related JP4505733B2 (ja) | 2003-11-14 | 2004-11-15 | テクストンを用いる対象物認識方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7680330B2 (ja) |
JP (1) | JP4505733B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293783A (ja) * | 2005-04-12 | 2006-10-26 | Fuji Photo Film Co Ltd | 画像処理装置及び画像処理プログラム |
WO2008126790A1 (ja) * | 2007-04-09 | 2008-10-23 | Nec Corporation | 物体認識システム、物体認識方法および物体認識用プログラム |
CN108681710A (zh) * | 2018-05-16 | 2018-10-19 | 北京理工大学 | 基于宽波段-高光谱红外图像融合方法的海天背景下舰船识别方法及装置 |
JP2022066540A (ja) * | 2016-06-03 | 2022-04-28 | マジック リープ, インコーポレイテッド | 拡張現実識別検証 |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4824411B2 (ja) * | 2005-01-20 | 2011-11-30 | パナソニック株式会社 | 顔抽出装置、半導体集積回路 |
US7813526B1 (en) | 2006-01-26 | 2010-10-12 | Adobe Systems Incorporated | Normalizing detected objects |
US8259995B1 (en) * | 2006-01-26 | 2012-09-04 | Adobe Systems Incorporated | Designating a tag icon |
US7978936B1 (en) | 2006-01-26 | 2011-07-12 | Adobe Systems Incorporated | Indicating a correspondence between an image and an object |
US7636450B1 (en) | 2006-01-26 | 2009-12-22 | Adobe Systems Incorporated | Displaying detected objects to indicate grouping |
US7716157B1 (en) | 2006-01-26 | 2010-05-11 | Adobe Systems Incorporated | Searching images with extracted objects |
US7706577B1 (en) | 2006-01-26 | 2010-04-27 | Adobe Systems Incorporated | Exporting extracted faces |
US7813557B1 (en) | 2006-01-26 | 2010-10-12 | Adobe Systems Incorporated | Tagging detected objects |
US7694885B1 (en) | 2006-01-26 | 2010-04-13 | Adobe Systems Incorporated | Indicating a tag with visual data |
US7720258B1 (en) | 2006-01-26 | 2010-05-18 | Adobe Systems Incorporated | Structured comparison of objects from similar images |
US7711145B2 (en) * | 2006-01-27 | 2010-05-04 | Eastman Kodak Company | Finding images with multiple people or objects |
US7870140B2 (en) * | 2006-06-12 | 2011-01-11 | D&S Consultants, Inc. | System and method of incorporating user preferences in image searches |
US7840060B2 (en) * | 2006-06-12 | 2010-11-23 | D&S Consultants, Inc. | System and method for machine learning using a similarity inverse matrix |
US8027549B2 (en) * | 2006-06-12 | 2011-09-27 | D&S Consultants, Inc. | System and method for searching a multimedia database using a pictorial language |
US7840059B2 (en) * | 2006-09-21 | 2010-11-23 | Microsoft Corporation | Object recognition using textons and shape filters |
US8504546B2 (en) * | 2006-11-29 | 2013-08-06 | D&S Consultants, Inc. | Method and system for searching multimedia content |
US20080123901A1 (en) * | 2006-11-29 | 2008-05-29 | D&S Consultants, Inc. | Method and System for Comparing Images Using a Pictorial Edit Distance |
US7921120B2 (en) | 2006-11-30 | 2011-04-05 | D&S Consultants | Method and system for image recognition using a similarity inverse matrix |
US7773811B2 (en) * | 2006-12-06 | 2010-08-10 | D & S Consultants, Inc. | Method and system for searching a database of graphical data |
JP4639208B2 (ja) | 2007-03-16 | 2011-02-23 | 富士フイルム株式会社 | 画像選択装置、画像選択方法、撮像装置及びプログラム |
US7844085B2 (en) * | 2007-06-07 | 2010-11-30 | Seiko Epson Corporation | Pairwise feature learning with boosting for use in face detection |
JP5261376B2 (ja) * | 2007-09-21 | 2013-08-14 | パナソニック株式会社 | 画像符号化装置および画像復号化装置 |
WO2009139161A1 (ja) * | 2008-05-15 | 2009-11-19 | 株式会社ニコン | 画像処理装置、画像処理方法、処理装置、処理方法およびプログラム |
JP5522044B2 (ja) * | 2008-08-08 | 2014-06-18 | 日本電気株式会社 | クラスタリング装置、パターン判定方法、およびプログラム |
FR2939325B1 (fr) * | 2008-12-04 | 2015-10-16 | Parrot | Systeme de drones munis de balises de reconnaissance |
CN102483745B (zh) * | 2009-06-03 | 2014-05-14 | 谷歌公司 | 共同选择图像分类 |
US20110251493A1 (en) * | 2010-03-22 | 2011-10-13 | Massachusetts Institute Of Technology | Method and system for measurement of physiological parameters |
US8639008B2 (en) | 2010-04-20 | 2014-01-28 | Athero Point, LLC | Mobile architecture using cloud for data mining application |
US8313437B1 (en) | 2010-06-07 | 2012-11-20 | Suri Jasjit S | Vascular ultrasound intima-media thickness (IMT) measurement system |
US8485975B2 (en) | 2010-06-07 | 2013-07-16 | Atheropoint Llc | Multi-resolution edge flow approach to vascular ultrasound for intima-media thickness (IMT) measurement |
US8708914B2 (en) | 2010-06-07 | 2014-04-29 | Atheropoint, LLC | Validation embedded segmentation method for vascular ultrasound images |
US8532360B2 (en) | 2010-04-20 | 2013-09-10 | Atheropoint Llc | Imaging based symptomatic classification using a combination of trace transform, fuzzy technique and multitude of features |
KR20120085476A (ko) * | 2011-01-24 | 2012-08-01 | 삼성전자주식회사 | 영상 재생 방법, 영상 재생 장치, 및 컴퓨터 판독가능 저장매체 |
US8306257B2 (en) * | 2011-01-31 | 2012-11-06 | Seiko Epson Corporation | Hierarchical tree AAM |
WO2012104830A1 (en) * | 2011-02-03 | 2012-08-09 | Vizi Labs Inc. | Systems and methods for image-to-text and text-to-image association |
US8903167B2 (en) | 2011-05-12 | 2014-12-02 | Microsoft Corporation | Synthesizing training samples for object recognition |
JP5828552B2 (ja) * | 2011-12-22 | 2015-12-09 | 本田技研工業株式会社 | 物体分類装置、物体分類方法、物体認識装置及び物体認識方法 |
US8942468B1 (en) | 2012-04-17 | 2015-01-27 | Google Inc. | Object recognition |
US9008429B2 (en) * | 2013-02-01 | 2015-04-14 | Xerox Corporation | Label-embedding for text recognition |
US9262443B2 (en) | 2013-05-15 | 2016-02-16 | Canon Kabushiki Kaisha | Classifying materials using texture |
US9384423B2 (en) * | 2013-05-28 | 2016-07-05 | Xerox Corporation | System and method for OCR output verification |
US9524447B2 (en) * | 2014-03-05 | 2016-12-20 | Sizhe Tan | Searching 2D image based on transformed 1D data matching |
US9626594B2 (en) | 2015-01-21 | 2017-04-18 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
WO2020014778A1 (en) * | 2018-07-16 | 2020-01-23 | Element Ai Inc. | Selecting unlabeled data objects to be processed |
CN109360170B (zh) * | 2018-10-24 | 2020-08-14 | 北京工商大学 | 基于高级特征的人脸修复方法 |
CN112418197B (zh) * | 2021-01-22 | 2021-05-07 | 北京世纪好未来教育科技有限公司 | 简化图像获取模型训练、图像文本识别方法及相关装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003088132A1 (en) * | 2002-04-12 | 2003-10-23 | Agency For Science, Technology And Research | Robust face registration via multiple face prototypes synthesis |
JP2003317101A (ja) * | 2002-04-23 | 2003-11-07 | Samsung Electronics Co Ltd | データベース自動更新方法を用いた顔検証方法及びそのシステム |
US20030210808A1 (en) * | 2002-05-10 | 2003-11-13 | Eastman Kodak Company | Method and apparatus for organizing and retrieving images containing human faces |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6028960A (en) * | 1996-09-20 | 2000-02-22 | Lucent Technologies Inc. | Face feature analysis for automatic lipreading and character animation |
US7149368B2 (en) * | 2002-11-19 | 2006-12-12 | Microsoft Corporation | System and method for synthesis of bidirectional texture functions on arbitrary surfaces |
US7436986B2 (en) * | 2003-03-25 | 2008-10-14 | Bausch & Lomb Incorporated | Positive patient identification |
-
2004
- 2004-11-03 US US10/979,175 patent/US7680330B2/en not_active Expired - Fee Related
- 2004-11-15 JP JP2004331174A patent/JP4505733B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003088132A1 (en) * | 2002-04-12 | 2003-10-23 | Agency For Science, Technology And Research | Robust face registration via multiple face prototypes synthesis |
JP2003317101A (ja) * | 2002-04-23 | 2003-11-07 | Samsung Electronics Co Ltd | データベース自動更新方法を用いた顔検証方法及びそのシステム |
US20030210808A1 (en) * | 2002-05-10 | 2003-11-13 | Eastman Kodak Company | Method and apparatus for organizing and retrieving images containing human faces |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293783A (ja) * | 2005-04-12 | 2006-10-26 | Fuji Photo Film Co Ltd | 画像処理装置及び画像処理プログラム |
WO2008126790A1 (ja) * | 2007-04-09 | 2008-10-23 | Nec Corporation | 物体認識システム、物体認識方法および物体認識用プログラム |
JP4858612B2 (ja) * | 2007-04-09 | 2012-01-18 | 日本電気株式会社 | 物体認識システム、物体認識方法および物体認識用プログラム |
US8478055B2 (en) | 2007-04-09 | 2013-07-02 | Nec Corporation | Object recognition system, object recognition method and object recognition program which are not susceptible to partial concealment of an object |
JP2022066540A (ja) * | 2016-06-03 | 2022-04-28 | マジック リープ, インコーポレイテッド | 拡張現実識別検証 |
CN108681710A (zh) * | 2018-05-16 | 2018-10-19 | 北京理工大学 | 基于宽波段-高光谱红外图像融合方法的海天背景下舰船识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20050147302A1 (en) | 2005-07-07 |
US7680330B2 (en) | 2010-03-16 |
JP4505733B2 (ja) | 2010-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4505733B2 (ja) | テクストンを用いる対象物認識方法及び装置 | |
US11657525B2 (en) | Extracting information from images | |
CN108460356B (zh) | 一种基于监控系统的人脸图像自动处理系统 | |
JP5801601B2 (ja) | 画像認識装置、画像認識装置の制御方法、およびプログラム | |
EP1886255B1 (en) | Using photographer identity to classify images | |
JP5121506B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP2001307096A (ja) | 画像認識装置及び方法 | |
JP2005149506A (ja) | 対象物自動認識照合方法および装置 | |
JP2008538998A (ja) | 画像に含まれる人物を認識する際の時刻の利用 | |
JP2004152297A (ja) | 複数のキューを統合するための方法及びシステム | |
JP2006012130A (ja) | 画像を表現する方法、この方法の使用により導出される記述子、この記述子の送信、受信、および記憶のいずれかを含む使用ないし記述子の記憶装置、顔の認識、検出、または分類を行う方法及び装置ないしそのコンピュータプログラム及びコンピュータ読み取り可能な記憶媒体 | |
US11176679B2 (en) | Person segmentations for background replacements | |
JP2011100229A (ja) | 画像処理装置、画像処理方法 | |
JP2014041477A (ja) | 画像認識装置及び画像認識方法 | |
JP5241606B2 (ja) | オブジェクト識別装置及びオブジェクト識別方法 | |
CN111783748A (zh) | 人脸识别方法、装置、电子设备及存储介质 | |
JP4511135B2 (ja) | データ分布を表現する方法、データ要素を表現する方法、データ要素の記述子、照会データ要素を照合または分類する方法、その方法を実行するように設定した装置、コンピュータプログラム並びにコンピュータ読み取り可能な記憶媒体 | |
CN108509925A (zh) | 一种基于视觉词袋模型的行人重识别方法 | |
CN111079648A (zh) | 数据集清洗方法、装置和电子系统 | |
JP5755046B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
CN111666976A (zh) | 基于属性信息的特征融合方法、装置和存储介质 | |
CN114170690A (zh) | 活体识别和构建活体识别模型的方法、装置 | |
CN108427923B (zh) | 一种掌纹识别方法及装置 | |
CN107480628B (zh) | 一种人脸识别方法及装置 | |
Nahar et al. | Twins and Similar Faces Recognition Using Geometric and Photometric Features with Transfer Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20070110 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100401 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100414 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |