JP2015507271A

JP2015507271A - オブジェクト認識方法及びオブジェクト認識装置

Info

Publication number: JP2015507271A
Application number: JP2014551513A
Authority: JP
Inventors: ファヌ・ウエイ; 明洋皆川; スヌ・ジュヌ; 堀田　悦伸; 悦伸堀田; 直井　聡; 聡直井
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2012-01-13
Filing date: 2013-01-10
Publication date: 2015-03-05
Anticipated expiration: 2033-01-10
Also published as: WO2013104322A1; CN103208005A; JP5958557B2

Abstract

本発明は、オブジェクト認識方法及びオブジェクト認識装置を開示する。本発明に従うオブジェクト認識方法は、特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するために使用される。方法は、入力画像における輪郭をその色分布特性に従って抽出するステップと、輪郭特性及び色分布特性に従って抽出された輪郭を用いて走査窓を決定するステップと、決定された走査窓に対応する画像の部分を分類し、画像のその部分がオブジェクトを含むかどうかを決定するステップとを含む。

Description

本発明は、概して、画像処理及びパターン認識に関する。特に、本発明は、画像においてオブジェクトを認識することができる方法及び装置と、そのような装置が配置されるモバイル端末とに関する。

ヒューマン−マシン・インタラクション技術は、近年劇的に発展してきた。特に、非接触式のヒューマン−マシン・インタラクションの決定的な技術は、画像又は映像に基づくジェスチャの自動認識である。手検出は、ジェスチャ認識システムのフロントエンドのモジュールである。高速且つ効率的な手検出の方法は、計算能力が限られている携帯電話機、タブレット型コンピュータ、及び他のモバイル機器にとって特に重要である。

先行技術における手検出方法によれば、処理されるべき画像窓は、訓練された二分法分類器によって手又は手以外のカテゴリに分類される。正確な手のポジショニングは、分類器の出力応答が最大である位置についてサイズ可変のスライディング（走査）窓において画像全体を走査することで実行される。画像には多数の候補窓が存在するので、窓毎に判断するこの検索手法は、計算負担の著しい増加を生じることがある。例えば、３２０×２４０ピクセルのＱＶＧＡ画像は、１００万を超える候補窓を含む。ｎ×ｎの画像に関し、候補窓の数は、ｎの４乗（ｎ^４）倍で増大する。様々なサイズ及び位置を有する多数の候補窓から生じる途方もない計算量は、計算能力が限られているモバイル機器には明らかに耐え難いものである。手検出の実時間特性の悪さは、ユーザの経験を低下させる。

本発明の幾つかの態様の基本的な理解を提供するよう、本発明の概要が以下で与えられる。概要は、本発明の網羅的な記載でないことが留意される。本発明のキーポイントになる又は重要な部分を定義することは意図されず、また、本発明の適用範囲を定義することも意図されない。それは、単に、以下の詳細な説明に対する序文として、簡約された形で幾つかの概念を与えることを狙っている。

先行技術における上記の問題を鑑み、本発明の目的は、画像においてオブジェクトを認識することができる方法及び装置を提案することである。この解決法は、特定の色分布特性及び特定の輪郭特性を有するオブジェクトを画像において高速に且つ正確に認識することができる。

上記の目的を達成するために、本発明の態様に従って、特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識方法であって、入力画像における輪郭をその前記色分布特性に従って抽出し、前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定し、前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定するオブジェクト認識方法が提供される。

本発明の特定の実施形態に従って、前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、前記輪郭を抽出することは、ピクセルＸの色応答値ｖを該ピクセルＸの色値（ｒ，ｇ，ｂ）の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値ｖに基づき抽出することを含む。

本発明の特定の実施形態に従って、前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、前記輪郭を抽出することは、色値（ｒ，ｇ，ｂ）を有するピクセルＸについてＲＧＢ空間における軸ベクトルＤＲへのベクトルＯＸの投影を計算し、候補となるオブジェクト輪郭を投影値ｖに基づき抽出することを含み、前記ベクトルＯＸは、前記ＲＧＢ空間の原点（０，０，０）で始まり、前記ピクセルＸに対応する点（ｒ，ｇ，ｂ）で終わり、前記軸ベクトルＤＲは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値ｖに基づき最大限に区別され得る投影軸を表す。

本発明の特定の実施形態に従って、前記走査窓を決定することは、様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブすることを含む。

本発明の特定の実施形態に従って、前記特定の輪郭特性は、前記抽出された輪郭と前記走査窓との特定の位置関係が存在することを含み、前記特定の色分布特性は、前記走査窓における特定の領域が特定の色を有するか否かを含む。

本発明の特定の実施形態に従って、前記オブジェクトは、開いた手を含み、前記特定の位置関係は、前記走査窓の中心点との特定の位置関係を有する点が前記抽出された輪郭内にあることを含み、前記色分布特性は、前記中心点に対応するピクセルが肌色を有することを含む。

本発明の他の態様に従って、特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識装置であって、入力画像における輪郭をその前記色分布特性に従って抽出するよう構成される輪郭抽出手段と、前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定するよう構成される走査窓決定手段と、前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定するよう構成されるオブジェクト決定手段とを有するオブジェクト認識装置が提供される。

本発明の特定の実施形態に従って、前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、前記輪郭抽出手段は、ピクセルＸの色応答値ｖを該ピクセルＸの色値（ｒ，ｇ，ｂ）の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値ｖに基づき抽出するよう構成される。

本発明の特定の実施形態に従って、前記走査窓決定手段は、様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブするよう構成される。

本発明の更なる他の態様に従って、本発明に従うオブジェクト認識装置を含むモバイル端末が更に提供される。

更に、本発明の更なる態様に従って、情報処理装置での実行時に該情報処理装置に本発明に従う上記の方法を実行させる機械可読プログラムコードを含む記憶媒体が更に提供される。

加えて、本発明のまた更なる態様に従って、情報処理装置での実行時に該情報処理装置に本発明に従う上記の方法を実行させる機械実行可能命令を含むプログラムプロダクトが更に提供される。

本発明の上記及び他の目的、特徴及び利点は、図面を参照して本発明の実施形態の下記の説明からより容易に理解されるようになるであろう。図面における構成要素は、単に、本発明の原理を説明するよう意図される。図面において、同じ又は類似する技術的特徴又は構成要素は、同じ又は類似する参照符号を用いて表される。

本発明の実施形態に従うオブジェクト認識方法の夫々のステップと、それらの処理結果の例とを表す。

カラー画像の肌色応答値の射影計算の例を表す。

走査窓を決定するための基準において考慮されるシナリオの説明図を表す。

手分類器を訓練するフローチャートを表す。

本発明の実施形態に従うオブジェクト認識方法の詳細なフローチャートを表す。

図６におけるステップＳ６０１の詳細なフローチャートを表す。

本発明の実施形態に従うオブジェクト認識装置の構造ブロック図を表す。

本発明の実施形態に従う方法及び装置が具現され得るコンピュータの略ブロック図を表す。

本発明の実例となる実施形態は、添付の図面とともに以下で記載される。明りょうさ及び簡潔さのために、実際の実施の全ての特徴が明細書において記載されているわけではない。しかし、当然ながら、如何なるそのような実際の実施の開発の間にも、多数の実施に特有の決定が、開発者の具体的な目標を達成するよう、例えば、実施ごとに様々であるそれらのシステム及びビジネスに関連した制約条件に従うよう、なされるべきである。加えて、やはり当然ながら、そのような開発業務は複雑であり且つ時間がかかるが、本開示から恩恵を受ける当業者にとっては単に日常的業務であり得る。

更に、本発明の解決法に関わりが深いそれらの装置構造及び／又は処理ステップしか図面において表されず、一方、本発明にほとんど無関係の他の詳細は、それらの不必要な詳細により本発明を不明瞭にしないように省略される点が、留意されるべきである。その上、１つの図面又は本発明の１つの実施において記載される要素及び特徴は、１以上の他の図面又は実施において説明される要素及び特徴と組み合わされ得る点が、更に留意されるべきである。

本発明の実施形態に従うオブジェクト認識方法のフローは、図６を参照して以下で記載される。

図６は、本発明の実施形態に従うオブジェクト認識方法の詳細なフローチャートを表す。図６に表されるように、本発明の実施形態に従うオブジェクト認識方法は、特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するために使用され、この方法は、入力画像における輪郭をその色分布特性に従って抽出するステップ（ステップＳ６０１）と、輪郭特性及び色分布特性に従って前記抽出された輪郭を用いて走査窓を決定するステップ（ステップＳ６０２）と、前記決定された走査窓に対応する画像の部分を分類し、画像のその部分がオブジェクトを含むかどうかを決定するステップ（ステップＳ６０３）とを含む。任意に、方法は、分類の結果に従ってオブジェクトの位置を出力するステップ（ステップＳ６０４）を更に含む。

本発明において認識されるべきオブジェクトは、特定の色分布特性及び特定の輪郭特性を有するべきであり、すなわち、オブジェクトが存在するかどうかは、そのオブジェクトの色分布特性及び輪郭特性に従って画像又はビデオにおいて一意に決定され得る。例えば、中国人の開いた手の色は黄色人種の肌色であり、この肌色は比較的安定している色分布範囲を有する。そして、開いた手自体は特定の輪郭特性を有し、例えば、５本の指及びそれらの指の間の継ぎ目は、手の領域の上に位置する凸凹部位を有する平坦でない輪郭を見せる。他の例では、白色人種の人によってなされるＶ形ジェスチャの色は白色人種の肌色であり、この肌色は比較的安定している色分布範囲を有する。そして、Ｖ形ジェスチャは特定の輪郭特性を有する。当業者には当然ながら、本発明は、オブジェクトが特定の色分布特性及び特定の輪郭特性を有し、それらの両方が認識のために使用され得るという条件で、他のオブジェクトにも適用可能であり得る。例えば、握り拳の色は肌色であり、その輪郭特性は、手の領域の上に位置し且つ低い起伏を有する凸凹部位にある。他の例では、人の顔の色は肌色であり、その輪郭特性は、顔の領域の上端に対して中間に位置する肌色を除いた２つの穴（両目に対応）、顔の領域の上端に対して中間で両側の端に位置する夫々の突起部（両耳に対応）、等にある。更なる例では、工場内の作業場という状況で運搬ベルトにある製品は、通常、不変の色、形状、等を有する。当業者は、オブジェクトを認識するのに十分な色分布特性及び輪郭特性のための対応する認識規則を策定することによって、簡単にオブジェクトを認識することができる。下記の詳細な説明から明らかなように、本発明は、認識されるべき具体的なオブジェクトに制限されず、オブジェクトの輪郭に沿った走査を通じて特定の色分布特性及び輪郭特性を有するオブジェクトを認識する速度を改善することができる。

図６におけるステップＳ６０１は、図１、図２及び図７を参照して以下で詳細に記載される。

図１は、本発明の実施形態に従うオブジェクト認識方法の夫々のステップと、それらの処理結果の例とを表す。

図２は、カラー画像の肌色応答値の射影計算の例を表す。

図７は、図６におけるステップＳ６０１の詳細なフローチャートを表す。

最初に、入力画像が肌色応答画像に変換される（ステップＳ７０１）。

例えば、入力画像は、図１における（ａ）である。

肌色応答画像において、非肌色領域におけるピクセルの肌色応答値は０であり、肌色領域におけるピクセルの肌色応答値は、そのピクセルが肌色カテゴリに属するとの確かさを反映する。肌色応答値が大きければ大きいほど、そのピクセルが肌色カテゴリに属する可能性はますます高い。

一例としてカラー画像である入力画像によれば、入力画像の各ピクセルＸは（ｒ，ｇ，ｂ）と表され得る。本発明者は、大規模な実験及び調査を通じて、オブジェクトピクセル及び非オブジェクトピクセルが投影値に基づき最大限に区別され得るところの投影軸が、比較的安定している色分布範囲を有するオブジェクトについて見つけられ得ることを発見した。例として、肌色ピクセル及び非肌色ピクセルが投影値に基づき最大限に区別され得るところの投影軸は、夫々の特定の肌色について見つけられ得る。具体的に、黄色い肌の肌色ピクセルは、図２に表されるＲＧＢ空間における軸
（外１）
（以降、「ベクトルＤＲ」と称する。）上の投影値に基づき、非肌色ピクセルから最大限に区別され得る。よって、軸ベクトルＤＲ上へのベクトル
（外２）
（以降、「ベクトルＯＸ」と称する。）の投影は、ピクセルＸが黄色い肌の肌色カテゴリに属するとの確かさを反映することができ、このとき、ピクセルＸのピクセル値は、（ｒ，ｇ，ｂ）であり、軸ベクトルＤＲは、点Ｄ（０，−ｋ_２／ｋ_１，−ｋ_３／ｋ_１）及び点Ｒ（ｒ，０，０）並びにＤからＲまでの点を通る。ベクトルＯＸは、ＲＧＢ空間の原点（０，０，０）で始まり、ピクセルＸに対応する点（ｒ，ｇ，ｂ）で終わり、このとき、係数ｋ_１、ｋ_２及びｋ_３は、０．８≦ｋ_１≦１．２、−０．４≦ｋ_２≦−０．６、及び−０．４≦ｋ_３≦−０．６を満足する。望ましくは、ｋ_１＝１、ｋ_２＝−０．５及びｋ_３＝−０．５である。

軸ベクトルＤＲ上へのベクトルＯＸの投影を計算するための相当の計算量を鑑み、下記の式１における簡単化されたアルゴリズムが、改善された計算速度のために使用され得る。

ｖ＝ｋ_１×ｒ＋ｋ_２×ｇ＋ｋ_３×ｂ（１）

上記の式１において、ｖは、ピクセル値（ｒ，ｇ，ｂ）を有するピクセルＸの肌色応答値を表し、係数ｋ_１、ｋ_２及びｋ_３は、０．８≦ｋ_１≦１．２、−０．４≦ｋ_２≦−０．６、及び−０．４≦ｋ_３≦−０．６を満足する。望ましくは、ｋ_１＝１、ｋ_２＝−０．５及びｋ_３＝−０．５である。すなわち、ピクセルＸの色応答値ｖは、ピクセルＸの色値（ｒ，ｇ，ｂ）の線形結合によって計算され得る。

本発明者は、調査を通じて、式１で計算される肌色応答値（又は軸ベクトルＤＲ上へのベクトルＯＸの投影）が、赤色セグメントに偏っている値及び負の値（赤色セグメントからあまりに懸け隔たっている）を除去するよう後処理されるべきであり、それにより、肌色応答値は、ピクセルＸが黄色い肌の肌色カテゴリに属するとの確かさをより正確に反映することができることを発見した。

後処理は、下記の式２において表され得る。

上記の式２において、ｖは、式１で計算される肌色応答値、又は軸ベクトルＤＲ上へのベクトルＯＸの投影を表し、ｓは、後処理後の肌色応答値を表す。

上記の式２において、閾値Ｔは、肌色の多数の収集されたトレーニングサンプルの統計分析から導出され得る。

他の肌色について、肌色の多数の収集された肌色トレーニングサンプルの統計分析は、その肌色について、肌色ピクセルが非肌色ピクセルから最大限に区別され得る軸（すなわち、統計分析から導出される係数ｋ_１、ｋ_２及びｋ_３）と、閾値Ｔ’とを導出するために行われ得る点が、留意されるべきである。その肌色についてのピクセルＸの肌色応答値は、軸上へのベクトルＯＸの投影を計算し且つ同様に（閾値Ｔ’に対して）後処理することを通じて、計算され得る。

同様に、他の肌色の投影値が計算される簡単化された計算式１’は、式１においてｒ、ｇ及びｂの係数（ｋ_１、ｋ_２及びｋ_３）を調整することによって、求められ得る。

肌色応答を計算する上記の方法は、好ましい計算方法及びその簡単化されたアルゴリズムであり、それらの両方が本発明者の調査のおかげで提案される点が、留意されるべきである。当該技術において肌色応答値を計算する如何なる他の方法も、計算される肌色応答値が、ピクセルＸが特定の肌色カテゴリに属するとの確かさを反映することができる限りは、ここで適用可能であり得る。

グレースケール画像に関し、例えば、グレースケール値の特定の範囲に属するピクセルは、肌色ピクセルと判断され得る。カラー画像に関し、特定の区間に夫々属する色空間の３つのピクセル値ｒ、ｇ及びｂを有するピクセル（ｒ，ｇ，ｂ）は、肌色ピクセルと判断され得る。

入力画像に対応する、肌色応答値から成る肌色応答画像、例えば、図１の（ｂ）は、ステップＳ７０１を通じて取得される。

次に、ステップＳ７０２で、肌色応答画像は２値化される。２値化は、画像処理の分野における何らかの２値化アルゴリズム、例えば、大津の大域的な２値化アルゴリズムを用いることによって、実行され得る。

肌色マスク、例えば、図１の（ｃ）は、ステップＳ７０２における処理を通じて取得され得る。例えば、肌色マスクにおける１の値を有するピクセルは、肌色ピクセルである画像ピクセルに対応し、肌色マスクにおける０の値を有するピクセルは、肌色ピクセルでない画像ピクセルに対応する。

次に、ステップＳ７０３で、ステップＳ７０２で取得された２値化画像内のより小さな面積を有するノイジーな肌色ブロックが除去され、肌色ブロックにおける穴が埋められる。

当該技術で知られているノイズ除去及び穴埋めの方法は、ステップＳ７０３で適用され得る。

被加工肌色マスク、例えば、図１の（ｄ）は、ステップＳ７０３における処理を通じて取得され得る。

ここまで、入力画像に対応する肌色応答画像及び被加工肌色マスクは、ステップＳ７０１〜Ｓ７０３における処理を通じて取得される。

次に、ステップＳ７０４で、肌色領域の輪郭が、ステップＳ７０３で取得された被加工肌色マスクに基づき抽出され得る。大きな結合範囲が被加工肌色マスクにおいて形成されているので、結合範囲の輪郭は、当該技術における何らかの抽出方法を用いて肌色領域の輪郭として抽出され得る。

肌色領域の輪郭は、結合範囲の縁部の周囲の複数のピクセルを含み、すなわち、ピクセルの閉じられた線の代わりに、閉じられたピクセルストリップを形成する点が、留意されるべきである。これは、特定の位置にあるピクセルが輪郭内にあるかどうかに関する後のステップにおける判断で特定の可変閾範囲を伴う輪郭を有することを目的とし、すなわち、結合範囲の縁部上又はその上にある全てのピクセルが輪郭の部分と見なされる。

例えば、図１の（ｅ）に表されるような、肌色領域の輪郭は、ステップＳ７０４を通じて取得され得る。

ここまで、入力画像における輪郭は、ステップＳ７０１〜Ｓ７０４を通じて抽出される。

ステップＳ６０１の具体的な実施は、上記のステップＳ７０１〜Ｓ７０４の導入において記載されてきたが、先に与えられているステップは、単に実例となる好ましいステップである点が、留意されるべきである。当業者は、代替的に、先行技術における他の方法を用いて入力画像において輪郭を抽出することができる。例えば、入力画像の縁部が検出可能であり、検出された縁部は輪郭へと結合され得る。

図６におけるステップＳ６０２は、図１、図３及び図４を参照して以下で詳細に記載される。

図３は、走査窓を決定するための基準において考慮されるシナリオの説明図を表す。

図４は、走査窓を決定するための基準において考慮されるシナリオの説明図を表す。

上述されたように、様々なサイズ及び位置を有する走査窓を使い尽くし、次いで、それらの走査窓を先行技術における走査のために使用することは、典型的である。計算の量は、画像を走査するための走査窓の選択的使用の欠如により、途方もないことがある。

本発明者は、有効に計算量を減らすよう候補走査窓が選択され得ることを発見した。よって、走査窓は、ステップＳ６０２において輪郭特性及び色分布特性に従って決定される。

下記の説明は、なお依然として中国人の開いた手を例として与えられる。しかし、当業者には当然ながら、走査窓は、認識されるべきオブジェクトが色分布特性及び色輪郭特性を有し、それらの両方がオブジェクトを認識するのに十分である限り、特定の色分布特性及び特定の輪郭特性を用いて決定され得る。

開いた手について、走査窓は、次の規則１又は規則２の下で決定され得る。

規則１の下で、ｗ×ｈピクセルのサイズを有する各候補窓について、ステップＳ６０２で、中心点Ｃからの距離ｄ_１＝（３／８）ｈで候補走査窓の中心点Ｃの上に位置するピクセルＰ_１と、中心点Ｃからの距離ｄ_２＝（１／８）ｈで候補走査窓の中心点Ｃの上に位置するピクセルＰ_２とが、抽出された輪郭内にあるかどうかが決定される。Ｐ_１は、開いた手の中指の先端点に対応し、Ｐ_２は、開いた手の人差し指及び中指の継ぎ目に対応する。例えば、ｗ及びｈの最小値は２４であり、それらの最大値は入力画像の幅及び高さにおけるピクセルの個数である。

ピクセルＰ_１及びＰ_２のうちの少なくとも１つが輪郭内にある場合は、候補走査窓は、決定された走査窓としてリザーブされ、そうでない場合は、候補走査窓は無視される。

図３に表されるように、ｄ_１は、指がまとめられている場合を検出する目的のために設定され、ｄ_２は、指が分けられている場合を検出する目的のために設定される。すなわち、開いた手は図３に表される特定の輪郭特性を有するので、その特性を特性化するための基準が特定され得、検出は基準の通りに実行され得る。

指がまとめられている場合及び指が分けられている場合を認識するためにピクセルＰ_１及びＰ_２の両方が定義されるが、ピクセルＰ_１及びＰ_２の両方を検出する必要はない点が、留意されるべきである。開いた手はまた、ピクセルＰ１及びＰ２のうちのいずれか一方を検出すること、例えば、開いた手の検出比低下にかかわらず、指がまとめられている手のみを検出することによっても検出され得る。

規則１の下で、輪郭が含まれない対応するピクセル領域を有する走査窓、開いた手とは異なる輪郭特性を有する輪郭が含まれる対応するピクセル領域を有する走査窓、等は、除外される。

図４に表されるシナリオを鑑み、規則１に対する改善として規則２は、不必要な走査窓の数を更に減らすように提案されている。

ｗ×ｈピクセルのサイズを有する各候補窓について、ステップＳ６０２で、中心点Ｃからの距離ｄ_１＝（３／８）ｈで候補走査窓の中心点Ｃの上に位置するピクセルＰ_１と、中心点Ｃからの距離ｄ_２＝（１／８）ｈで候補走査窓の中心点Ｃの上に位置するピクセルＰ_２とが、抽出された輪郭内にあるかどうかが決定され、更に、中心点Ｃが肌色ピクセルであるかどうかが決定される。

ピクセルＰ_１及びＰ_２のうちの少なくとも１つが輪郭内にあり且つ中心点Ｃが肌色ピクセルである場合は、候補走査窓は、決定された走査窓としてリザーブされ、そうでない場合は、候補走査窓は無視される。

処理された肌色マスクにより、中心点Ｃが肌色ピクセルであるかどうかは決定される。例えば、処理された肌色マスクにおいて１の値を有するピクセルは、肌色ピクセルである画像ピクセルに対応する。

手以外の他の領域の部分は、更に高速にスキップされ得、輪郭特性が部分的には検出されたオブジェクトに従うが色分布特性が検出されたオブジェクトに従わないピクセル領域に対応する走査窓は、その窓の中心点Ｃが肌色の結合範囲内になければならないことを求めることで除外され得る。

すなわち、様々なサイズ及び位置を有する候補走査窓について、それに対応するピクセル領域が認識されるべきオブジェクトの特定の色分布特性及び特定の輪郭特性を満足するかどうかが決定され、対応するピクセル領域が特定の色分布特性及び特定の輪郭特性を満足するところの候補走査窓が、決定された走査窓としてリザーブされる。

輪郭特性は、抽出された輪郭と走査窓との特定の位置関係が存在することを含む。色分布特性は、走査窓における特定の領域が特定の色を有するか否かを含む。

候補走査窓は輪郭特性及び色分布特性によって選択されるので、決定された走査窓は全て、認識されるべき対象（例えば、中国人の開いた手）の輪郭に沿って分布する。よって、オブジェクトは、輪郭によって検索され、それにより、認識結果の品質を犠牲にすることなしに計算の量を大いに減らすことができる。

上述されたように、対応する規則は、オブジェクトがそのオブジェクトを認識するのに十分な色分布特性及び輪郭特性を有する限り、オブジェクトを認識するよう設計され得る。例えば、握り拳の色は肌色であり、その輪郭特性は開いた手の分けられた指のそれと類似しており、対応する規則は、ｄ_２の適切な値が統計的に選択される限り、ピクセルＰ_２（ｗ×ｈのサイズを有する候補走査窓について、中心点Ｃからの距離ｄ_２で候補走査窓の中心点Ｃの上に位置するピクセル点）のために設計され得る。

人の顔、工場の作業場における運搬ベルト上の製品若しくは半製品、交通カメラ、交通信号ランプ、車両のライセンスプレート及び他のオブジェクトに関し、対応する規則は、オブジェクトの比較的安定している色分布範囲及び輪郭特性により設計され、それによりオブジェクトを認識することができる。

図６におけるステップＳ６０２は、図５を参照して以下で詳細に記載される。

図５は、手分類器を訓練するフローチャートを表す。

ステップＳ６０３で、決定された走査窓に対応する画像の部分が分類され、画像のその部分がオブジェクトを含むかどうかが決定される。ステップＳ６０３は、訓練された分類器を用いることによって実行され得る。

分類器への入力は、走査窓に対応するピクセル領域であり、それは、訓練されている場合に分類器によって受信され且つ使用されている場合に訓練された分類器によって受信される入力が同じタイプの画像である限り、原入力画像又は図１の（ｂ）に表されるような肌色応答画像であることができる。肌色応答画像は、認識されるべきオブジェクトの色分布特性を反映するので、分類器の分類結果は、それへの入力である肌色応答画像により、より正確であり得る。

分類器の出力は、オブジェクト（例えば、中国人の開いた手）が走査窓に対応するピクセル領域に含まれるとの確かさを含む。

分類器は、次のステップにおいて予めオフラインで訓練され得る。

最初に、多数の訓練画像が収集され、分類され、ポジティブ・サンプル（positive sample）及びネガティブ・サンプル（negative sample）としてマークされる。オブジェクトが中国人の開いた手である場合に、ポジティブ・サンプルは、中国人の開いた手を含む様々なサンプルであり、ネガティブ・サンプルは、中国人の開いた手を含まないあらゆる背景画像である。

次に、望ましくは、色訓練画像は、肌色応答画像へ変換される。

その場合に、分類器は、何らかの既知の訓練アルゴリズムにおいて構成される。分類器を訓練するためのアルゴリズムは、例えば、ＡｄａＢｏｏｓｔ、ＳＶＭ等を含む。ＡｄａＢｏｏｓｔは、Ｖｉｏｌａ，Ｐ．（２００２）．Ｒｏｂｕｓｔｒｅａｌ−ｔｉｍｅｄｅｔｅｃｔｉｏｎ．ＩＪＣＶから利用可能であり得る。ＳＶＭは、Ｐ．Ｈ．Ｃｈｅｎ，Ｃ．Ｊ．Ｌｉｎ，及びＢ．Ｓｃｈｏｌｋｏｐｆ，Ａｔｕｔｏｒｉａｌｏｎ ν−ｓｕｐｐｕｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｓ，Ａｐｐｌ．Ｓｔｏｃｈ．Ｍｏｄｅｌｓ．Ｂｕｓ．Ｉｎｄ．２００５，２１，１１１−１３６から利用可能であり得る。

訓練された分類器は、ステップＳ６０３において、決定された走査窓に対応する画像の部分を分類し、画像のその部分がオブジェクトを含むかどうかを決定するために使用され得る。

走査窓に対応する画像の部分がステップＳ６０３で分類された後、オブジェクトの位置がステップＳ６０４で分類の結果に従って出力される。

分類器の最も高い出力応答を有する走査窓は、オブジェクトが位置する領域と考えられ得、あるいは、オブジェクトを含むとして分類された走査窓に対応するピクセル領域は、オブジェクトが位置する領域として結合され得る。

図８は、本発明の実施形態に従うオブジェクト認識装置の構造ブロック図を表す。図８に表されるように、この実施形態に従うオブジェクト認識装置８００は、特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するために使用され、オブジェクト認識装置８００は、入力画像における輪郭をその色分布特性に従って抽出するよう構成される輪郭抽出手段８０１と、輪郭特性及び色分布特性に従って前記抽出された輪郭を用いて走査窓を決定するよう構成される走査窓決定手段８０２と、前記決定された走査窓に対応する画像の部分を分類し、画像のその部分がオブジェクトを含むかどうかを決定するよう構成されるオブジェクト決定手段８０３とを含む。

任意に、オブジェクト認識装置８００は、分類の結果に従ってオブジェクトの位置を出力するよう構成されるオブジェクト位置出力手段８０４を更に含む。

輪郭抽出手段８０１は、ピクセルＸの色応答値ｖを該ピクセルＸの色値（ｒ，ｇ，ｂ）の線形結合によって計算し、候補となるオブジェクト輪郭を色応答値ｖに基づき抽出するよう構成される。

あるいは、輪郭抽出手段８０１は、色値（ｒ，ｇ，ｂ）を有するピクセルＸについてＲＧＢ空間における軸ベクトルＤＲへのベクトルＯＸの投影を計算し、候補となるオブジェクト輪郭を投影値ｖに基づき抽出するよう構成され、このとき、ベクトルＯＸは、ＲＧＢ空間の原点（０，０，０）で始まり、ピクセルＸに対応する点（ｒ，ｇ，ｂ）で終わり、軸ベクトルＤＲは、オブジェクトピクセル及び非オブジェクトピクセルが投影値ｖに基づき最大限に区別され得る投影軸を表す。

輪郭抽出手段８０１は更に、次の式：
に従って投影値又は色応答値ｖを後処理し、該後処理された投影値又は色応答値ｓに基づき前記候補となるオブジェクト輪郭を抽出するよう構成される。なお、Ｔは所定の閾値を表す。

走査窓決定手段８０２は、様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が特定の色分布特性及び特定の輪郭特性を満たすかどうかを決定し、且つ、対応するピクセル領域が特定の色分布特性及び特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブするよう構成される。

本発明に従うオブジェクト認識装置８００に含まれる輪郭抽出手段８０１、走査窓決定手段８０２、オブジェクト決定手段８０３及びオブジェクト位置出力手段８０４における処理は、上記のオブジェクト認識方法のステップＳ６０１〜Ｓ６０４における処理と夫々同様であるから、それらの手段の詳細な説明は、便宜上ここでは省略される。

本発明に従うモバイル端末は、上記のオブジェクト認識装置を含む。

加えて、上記の装置における夫々の構成モジュール及びユニットは、ソフトウェア、ファームウェア、ハードウェア又はそれらのあらゆる組み合わせにおいて構成され得る点が、留意されるべきである。利用可能な具体的な構成手段又はアプローチは、当業者によく知られており、それらの繰り返される説明は、ここでは省略される。ソフトウェア又はファームウェアにおいて具現される場合に、ソフトウェア又はファームウェアを構成するプログラムは、記憶媒体又はネットワークから、様々なプログラム片がインストールされる場合に様々な機能を実行することができる専用のハードウェア構造を備えたコンピュータ（例えば、図９に表される汎用コンピュータ９００）へインストールされ得る。

図９は、本発明の実施形態に従う方法及び装置が具現され得るコンピュータの略ブロック図を表す。

図９において、中央演算処理装置（ＣＰＵ；Central Processing Unit）９０１は、読み出し専用メモリ（ＲＯＭ；Read Only Memory）９０２に記憶されているプログラム、又は記憶部９０８から、ＣＰＵ９０１が様々な処理を実行する場合等に必要とされるデータが必要に応じて更に記憶され得るランダムアクセスメモリ（ＲＡＭ；Random Access Memory）９０３にロードされるプログラムに従って、様々な処理を実行する。ＣＰＵ９０１、ＲＯＭ９０２及びＲＡＭ９０３は、入出力インターフェース９０５が更に接続されているバス９０４を介して互いに接続されている。

次の構成要素が入出力インターフェース９０５へ接続されている。すなわち、入力部９０６（キーボード、マウス等を含む。）出力部９０７（ディスプレイ、例えば、陰極線管（ＣＲＴ；Cathode Ray Tube）、液晶ディスプレイ（ＬＣＤ；Liquid Crystal Display）等、スピーカ等を含む。）、記憶部９０８（ハードディスク等を含む。）、及び通信部９０９（ネットワークインターフェースカード、例えば、ＬＡＮカード、モデム等を含む。）である。通信部９０９は、ネットワーク、例えば、インターネット上で通信処理を実行する。ドライブ９１０がまた、必要に応じて入出力インターフェース９０５へ接続され得る。取り外し可能な（removable）媒体９１１、例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等は、それらからフェッチされるコンピュータプログラムが必要に応じて記憶部９０８にインストールされ得るように、必要に応じてドライブ９１０にインストールされ得る。

上記の一連の処理がソフトウェアにおいて具現される場合に、そのソフトウェアを構成するプログラムは、ネットワーク、例えば、インターネット等、又は記憶媒体、例えば、取り外し可能な媒体９１１等からインストールされ得る。

当業者には当然ながら、そのような記憶媒体は、プログラムが記憶されており且つユーザにプログラムを提供するよう装置とは別に配布される、図９に表される取り外し可能な媒体９１１に制限されない。取り外し可能な媒体９１１の例は、磁気ディスク（フロッピー（登録商標）ディスクを含む。）、光ディスク（コンパクトディスク読み出し専用メモリ（ＣＤ−ＲＯＭ）及びデジタルバーサタイルディスク（ＤＶＤ）を含む。）、及び半導体メモリを含む。代替的に、記憶媒体は、プログラムが記憶されており且つその記憶媒体を含む装置とともにユーザに配布されるＲＯＭ９０２、記憶部９０８に含まれるハードディスク等であることができる。

加えて、本発明は、機械により読み出し可能な命令コードが記憶されるプロダクトプログラムを更に提案する。命令コードは、機械によって読み出されて実行されると、本発明の実施形態に従う方法を実行することができる。

これに対して、機械により読み出し可能な命令コードが記憶されるプロダクトプログラムを担持する記憶媒体も本発明の開示に包含される。記憶媒体は、フロッピー（登録商標）ディスク、光ディスク、光磁気ディスク、メモリカード、メモリスティック等を含むが、それらに限られない。

本発明の特定の実施形態の上記の説明において、一実施に関して説明及び／又は図解される特徴は、他の実施における特徴と組み合わせて又はそれに代えて、１以上の他の実施において全く同じように又は同様に使用され得る。

本文脈において使用される語「含む／有する」は、特徴、要素、ステップ又はコンポーネントの存在を示すが、１以上の他の特徴、要素、ステップ又はコンポーネントの存在又は追加を除外しない点が、強調されるべきである。

加えて、本発明に従う方法は、必ずしも、明細書において記載される順次的な順序において実行されず、代替的に、他の順次的な順序において同時に又は別々に実行され得る。従って、本発明の技術的範囲は、方法が明細書において記載されるように実行される順序に制限されない。

本発明は、本発明の特定の実施形態の説明において先に開示されてきたが、当然ながら、上記の全ての実施形態及び例は実例であり制限でない。当業者は、添付の特許請求の範囲の精神及び適用範囲から逸脱することなしに本発明に対する様々な変更、改善又は均等を構成することができる。それらの変更、改善又は均等はまた、本発明の請求される範囲内にあると解釈されるべきである。

（付記１）
特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識方法であって、
入力画像における輪郭をその前記色分布特性に従って抽出し、
前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定し、
前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定する
オブジェクト認識方法。
（付記２）
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭を抽出することは、ピクセルＸの色応答値ｖを該ピクセルＸの色値（ｒ，ｇ，ｂ）の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値ｖに基づき抽出することを含む、
付記１に記載のオブジェクト認識方法。
（付記３）
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭を抽出することは、色値（ｒ，ｇ，ｂ）を有するピクセルＸについてＲＧＢ空間における軸ベクトルＤＲへのベクトルＯＸの投影を計算し、候補となるオブジェクト輪郭を投影値ｖに基づき抽出することを含み、
前記ベクトルＯＸは、前記ＲＧＢ空間の原点（０，０，０）で始まり、前記ピクセルＸに対応する点（ｒ，ｇ，ｂ）で終わり、
前記軸ベクトルＤＲは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値ｖに基づき最大限に区別され得る投影軸を表す、
付記１に記載のオブジェクト認識方法。
（付記４）
Ｔは所定の閾値を表すとして、次の式：
に従って前記投影値又は色応答値ｖを後処理し、該後処理された投影値又は色応答値ｓに基づき前記候補となるオブジェクト輪郭を抽出する、
付記２又は３に記載のオブジェクト認識方法。
（付記５）
前記走査窓を決定することは、
様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、
対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブする
ことを含む、付記１に記載のオブジェクト認識方法。
（付記６）
前記特定の輪郭特性は、前記抽出された輪郭と前記走査窓との特定の位置関係が存在することを含み、
前記特定の色分布特性は、前記走査窓における特定の領域が特定の色を有するか否かを含む、
付記５に記載のオブジェクト認識方法。
（付記７）
前記オブジェクトは、開いた手を有し、
前記特定の位置関係は、前記走査窓の中心点との特定の位置関係を有する点が前記抽出された輪郭内にあることを含み、
前記色分布特性は、前記中心点に対応するピクセルが肌色を有することを含む、
付記６に記載のオブジェクト認識方法。
（付記８）
Ｐ_１が前記開いた点の中指の先端点に対応するとして、ｗ×ｈピクセルのサイズを有する夫々の候補走査窓について、前記走査窓の前記中心点との前記特定の位置関係を有する点は、前記中心点Ｃからの距離ｄ_１＝（３／８）ｈで前記走査窓の前記中心点Ｃの上に位置するピクセルＰ_１を有する、
付記７に記載のオブジェクト認識方法。
（付記９）
Ｐ_２が前記開いた手の人差し指及び中指の結合点に対応するとして、ｗ×ｈピクセルのサイズを有する夫々の候補走査窓について、前記走査窓の前記中心点との前記特定の位置関係を有する点は、前記中心点Ｃからの距離ｄ_２＝（１／８）ｈで前記走査窓の前記中心点Ｃの上に位置するピクセルＰ_２を有する、
付記７に記載のオブジェクト認識方法。
（付記１０）
前記オブジェクトは、握り拳、人の顔、工場における製品若しくは半製品、交通カメラ、交通信号ランプ、又は車両のライセンスプレートを有する、
付記５又は６に記載のオブジェクト認識方法。
（付記１１）
前記分類の結果に従って前記オブジェクトの位置を出力する、
付記１に記載のオブジェクト認識方法。
（付記１２）
特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識装置であって、
入力画像における輪郭をその前記色分布特性に従って抽出するよう構成される輪郭抽出手段と、
前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定するよう構成される走査窓決定手段と、
前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定するよう構成されるオブジェクト決定手段と
を有するオブジェクト認識装置。
（付記１３）
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭抽出手段は、ピクセルＸの色応答値ｖを該ピクセルＸの色値（ｒ，ｇ，ｂ）の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値ｖに基づき抽出するよう構成される、
付記１２に記載のオブジェクト認識装置。
（付記１４）
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭抽出手段は、色値（ｒ，ｇ，ｂ）を有するピクセルＸについてＲＧＢ空間における軸ベクトルＤＲへのベクトルＯＸの投影を計算し、候補となるオブジェクト輪郭を投影値ｖに基づき抽出するよう構成され、
前記ベクトルＯＸは、前記ＲＧＢ空間の原点（０，０，０）で始まり、前記ピクセルＸに対応する点（ｒ，ｇ，ｂ）で終わり、
前記軸ベクトルＤＲは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値ｖに基づき最大限に区別され得る投影軸を表す、
付記１２に記載のオブジェクト認識装置。
（付記１５）
前記走査窓決定手段は、
様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、
対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブする
よう構成される、付記１２に記載のオブジェクト認識装置。
（付記１６）
前記分類の結果に従って前記オブジェクトの位置を出力するよう構成されるオブジェクト位置出力手段
を更に有する、付記１２に記載のオブジェクト認識装置。
（付記１７）
付記１２乃至１６のうちいずれか一項に記載のオブジェクト認識装置を有するモバイル端末。

Claims

特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識方法であって、
入力画像における輪郭をその前記色分布特性に従って抽出し、
前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定し、
前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定する
オブジェクト認識方法。
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭を抽出することは、ピクセルＸの色応答値ｖを該ピクセルＸの色値（ｒ，ｇ，ｂ）の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値ｖに基づき抽出することを含む、
請求項１に記載のオブジェクト認識方法。
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭を抽出することは、色値（ｒ，ｇ，ｂ）を有するピクセルＸについてＲＧＢ空間における軸ベクトルＤＲへのベクトルＯＸの投影を計算し、候補となるオブジェクト輪郭を投影値ｖに基づき抽出することを含み、
前記ベクトルＯＸは、前記ＲＧＢ空間の原点（０，０，０）で始まり、前記ピクセルＸに対応する点（ｒ，ｇ，ｂ）で終わり、
前記軸ベクトルＤＲは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値ｖに基づき最大限に区別され得る投影軸を表す、
請求項１に記載のオブジェクト認識方法。
Ｔは所定の閾値を表すとして、次の式：
に従って前記投影値又は色応答値ｖを後処理し、該後処理された投影値又は色応答値ｓに基づき前記候補となるオブジェクト輪郭を抽出する、
請求項２又は３に記載のオブジェクト認識方法。
前記走査窓を決定することは、
様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、
対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブする
ことを含む、請求項１に記載のオブジェクト認識方法。
前記特定の輪郭特性は、前記抽出された輪郭と前記走査窓との特定の位置関係が存在することを含み、
前記特定の色分布特性は、前記走査窓における特定の領域が特定の色を有するか否かを含む、
請求項５に記載のオブジェクト認識方法。
前記オブジェクトは、開いた手を有し、
前記特定の位置関係は、前記走査窓の中心点との特定の位置関係を有する点が前記抽出された輪郭内にあることを含み、
前記色分布特性は、前記中心点に対応するピクセルが肌色を有することを含む、
請求項６に記載のオブジェクト認識方法。
Ｐ_１が前記開いた点の中指の先端点に対応するとして、ｗ×ｈピクセルのサイズを有する夫々の候補走査窓について、前記走査窓の前記中心点との前記特定の位置関係を有する点は、前記中心点Ｃからの距離ｄ_１で前記走査窓の前記中心点Ｃの上に位置するピクセルＰ_１を有する、
請求項７に記載のオブジェクト認識方法。
Ｐ_２が前記開いた手の人差し指及び中指の結合点に対応するとして、ｗ×ｈピクセルのサイズを有する夫々の候補走査窓について、前記走査窓の前記中心点との前記特定の位置関係を有する点は、前記中心点Ｃからの距離ｄ_２で前記走査窓の前記中心点Ｃの上に位置するピクセルＰ_２を有する、
請求項７に記載のオブジェクト認識方法。
前記オブジェクトは、握り拳、人の顔、工場における製品若しくは半製品、交通カメラ、交通信号ランプ、又は車両のライセンスプレートを有する、
請求項５又は６に記載のオブジェクト認識方法。
前記分類の結果に従って前記オブジェクトの位置を出力する、
請求項１に記載のオブジェクト認識方法。
特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識装置であって、
入力画像における輪郭をその前記色分布特性に従って抽出するよう構成される輪郭抽出手段と、
前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定するよう構成される走査窓決定手段と、
前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定するよう構成されるオブジェクト決定手段と
を有するオブジェクト認識装置。
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭抽出手段は、ピクセルＸの色応答値ｖを該ピクセルＸの色値（ｒ，ｇ，ｂ）の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値ｖに基づき抽出するよう構成される、
請求項１２に記載のオブジェクト認識装置。
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭抽出手段は、色値（ｒ，ｇ，ｂ）を有するピクセルＸについてＲＧＢ空間における軸ベクトルＤＲへのベクトルＯＸの投影を計算し、候補となるオブジェクト輪郭を投影値ｖに基づき抽出するよう構成され、
前記ベクトルＯＸは、前記ＲＧＢ空間の原点（０，０，０）で始まり、前記ピクセルＸに対応する点（ｒ，ｇ，ｂ）で終わり、
前記軸ベクトルＤＲは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値ｖに基づき最大限に区別され得る投影軸を表す、
請求項１２に記載のオブジェクト認識装置。
前記走査窓決定手段は、
様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、
対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブする
よう構成される、請求項１２に記載のオブジェクト認識装置。
前記分類の結果に従って前記オブジェクトの位置を出力するよう構成されるオブジェクト位置出力手段
を更に有する、請求項１２に記載のオブジェクト認識装置。
請求項１２乃至１６のうちいずれか一項に記載のオブジェクト認識装置を有するモバイル端末。