JP2010086549A - 画像認識装置およびプログラム - Google Patents

画像認識装置およびプログラム Download PDF

Info

Publication number
JP2010086549A
JP2010086549A JP2009279081A JP2009279081A JP2010086549A JP 2010086549 A JP2010086549 A JP 2010086549A JP 2009279081 A JP2009279081 A JP 2009279081A JP 2009279081 A JP2009279081 A JP 2009279081A JP 2010086549 A JP2010086549 A JP 2010086549A
Authority
JP
Japan
Prior art keywords
subject
image
recognition
person
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009279081A
Other languages
English (en)
Other versions
JP4661980B2 (ja
Inventor
Tetsuya Kuromatsu
哲也 黒松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2009279081A priority Critical patent/JP4661980B2/ja
Publication of JP2010086549A publication Critical patent/JP2010086549A/ja
Application granted granted Critical
Publication of JP4661980B2 publication Critical patent/JP4661980B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

【課題】撮影画像内に含まれている複数の被写体を個別に認識する場合に、各被写体同士の関連性をも考慮して各被写体を効率良く認識できるようにする。
【解決手段】カメラ付き携帯端末において、CPU1は、人物データベース内に登録画像に対応してその人物属性(人間関係)が記憶管理されている状態において、カメラ装置7によって撮影された撮影画像内に含まれている複数の人物を順次指定してその各々を個別に認識する過程で、ある人物を指定してその認識を行った際に、この人物に対応する属性に基づいて同一属性を持つ登録画像を比較対象として優先的に選択して比較対象範囲の絞り込みを行う。この選択範囲内の各登録画像と他の人物とを比較することによって当該人物を認識する。
【選択図】 図1

Description

この発明は、撮影画内に含まれている被写体部分と予め被写体認識用として登録されている登録画像とを比較することによって当該被写体を認識する画像認識装置およびプログラムに関する。
従来、カメラ撮影された撮影画像を解析し、その中に写っている人物部分を抽出し、その人物は誰かを認識する技術として、たとえば、輝度変化などに影響されずに目、鼻などの特徴点を安定的に抽出して人物認証を高精度で行うようにした人物認証装置が知られている(特許文献1参照)。また、画像認識された人物の名前あるいは撮影年の情報をその画像に関連付けて表示するようにした画像処理装置が知られている(特許文献2参照)。
特開平09−251534号公報 特開2003−150932号公報
しかしながら、上述した特許文献1、2の技術にあっては、撮影画像内の人物部分と比較される比較対象の全ての画像(辞書画像/参照画像)と比較する必要があるため、比較対象の画像数が膨大であればある程、認識時間が長くなって認識効率が悪くなると共に、比較対象の画像同士が類似し合うことも多くなり、誤認識および認識率の低下を招くという問題があった。
ところで、複数の人物を集合撮影する際に、被写体である各人物は、たとえば、家族関係、交友関係、会社関係、親戚関係など撮影者にとって共通の人間関係にある場合が多く、集合撮影する各人物同士は、撮影者を通して関連付けられている可能性が高い。
第1の発明の課題は、撮影画像内に含まれている複数の被写体を個別に認識する場合に、各被写体同士の関連性をも考慮して各被写体を効率良く認識できるようにすることである。
第2の発明の課題は、撮影画像内に含まれている複数の被写体を個別に認識する場合に、各被写体同士の関連性をも考慮して各被写体を精度良く認識できるようにすることである。
請求項1記載の発明(第1の発明)は、撮影画内に含まれている被写体部分と予め被写体認識用として登録されている登録画像とを比較することによって当該被写体を認識する画像認識装置であって、被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報を記憶管理する被写体情報記憶手段と、撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、ある被写体を指定してその認識を行った際に、この被写体に対応する属性情報に基づいて同一属性を持つ登録画像を比較対象として優先的に選択し、この選択範囲内の各登録画像と他の被写体部分とを比較することによって当該被写体を認識する認識手段とを具備したことを特徴とする。
更に、コンピュータに対して、上述した請求項1記載の発明に示した主要機能を実現させるためのプログラムを提供する(請求項5記載の発明)。
なお、請求項1記載の発明は次のようなものであってもよい。
前記認識手段は、撮影画像内に含まれている複数の被写体のうち、撮影画像の中央部に含まれている被写体を最初に指定する(請求項2記載の発明)。
前記認識手段は、撮影画像内に含まれている複数の被写体のうち、最大サイズあるいは写り具合が最良の被写体を最初に指定する(請求項3記載の発明)。
前記被写体情報記憶手段は、登録画像に対応してその属性情報と共に、この被写体の識別情報を記憶管理し、前記認識手段によって認識された被写体に対応する識別情報を取得して出力する(請求項4記載の発明)。
請求項6記載の発明(第2の発明)は、撮影画内に含まれている被写体部分と予め被写体認識用として登録されている登録画像とを比較することによって当該被写体を認識する画像認識装置であって、被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報を記憶管理する被写体情報記憶手段と、撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、各被写体毎に複数の認識候補を得ると共に、各被写体毎に得られた複数の認識候補の中から各被写体に共通する属性情報を持つ認識候補を各被写体の認識結果として決定する認識手段とを具備したことを特徴とする。
更に、コンピュータに対して、上述した請求項6記載の発明に示した主要機能を実現させるためのプログラムを提供する(請求項7記載の発明)。
請求項1記載の発明(第1の発明)によれば、被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報が記憶管理されている状態において、撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、ある被写体を指定してその認識を行った際に、この被写体に対応する属性情報に基づいて同一属性を持つ登録画像を比較対象として優先的に選択し、この選択範囲内の各登録画像と他の被写体部分とを比較することによって当該被写体を認識するようにしたから、撮影画像内に含まれている複数の被写体を個別に認識する場合に、各被写体同士の関連性をも考慮しながら比較対象を絞り込むことができる。たとえば、複数の人物を集合撮影する際に、被写体である各人物は、家族関係、交友関係、会社関係、親戚関係など撮影者にとって共通の人間関係にある場合が多いために、各被写体同士の関連性に基づいて比較対象を絞り込むことができ、登録画像の数が膨大であっても、各被写体を効率良く認識することが可能となる。なお、被写体は、人物に限らず、たとえば、複数のペット、または観光地内の複数の建物などであってもよい。
請求項2記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、撮影画像内に含まれている複数の被写体のうち、撮影画像の中央部に含まれている被写体を最初に指定するようにしたから、各被写体同士の関連性を判断する際にその基準となる被写体を容易に特定することが可能となる。
請求項3記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、撮影画像内に含まれている複数の被写体のうち、最大サイズあるいは写り具合が最良の被写体を最初に指定するようにしたから、各被写体同士の関連性を判断する際にその基準となる被写体を容易に特定することが可能となる。
請求項4記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、登録画像に対応してその属性情報と共にこの被写体の識別情報が記憶管理されている状態において、認識された被写体に対応する識別情報を取得して出力するようにしたから、たとえば、認識された被写体の名前、メールアドレスなどの送付先を取得して出力することができる。すなわち、撮影画像を電子メールに添付して相手先に送付する際に、撮影画像をその相手先に適切に送付することができ、撮影画像毎に何が写っているかを確認しながら各送付先を探し出すという面倒な作業が不要となると共に、画像送付を忘れることを防ぐことが可能となる。
請求項6記載の発明(第2の発明)によれば、被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報が記憶管理されている状態において、撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、各被写体毎に複数の認識候補を得ると共に、各被写体毎に得られた複数の認識候補の中から各被写体に共通する属性情報を持つ認識候補を各被写体の認識結果として決定するようにしたから、撮影画像内に含まれている複数の被写体を個別に認識する場合に、各被写体同士の関連性をも考慮しながら各被写体を認識することができる。たとえば、複数の人物を集合撮影する際に、被写体である各人物は、家族関係、交友関係、会社関係、親戚関係など撮影者にとって共通の人間関係にある場合が多いために、各人物に共通する人間関係を考慮して各人物を認識することができ、類似する登録画像が多くても、各被写体を精度良く認識することが可能となる。なお、被写体は、人物に限らず、たとえば、複数のペット、または観光地内の複数の建物などであってもよい。
カメラ付き携帯端末の基本的構成要素を示したブロック図。 登録データベースを構成する登録レコードRTの内容を示した図。 画像ファイルGFの内容を示した図。 送付データベースを構成する送付レコードADの内容を示した図。 カメラ撮影および撮影画像のメール送信に関する処理を示したフローチャート。 図5に続く、フローチャート。 図6に続く、フローチャート。 図5に続く、フローチャート。 第2実施形態において、各人物毎に得られた複数の認識候補を例示した図。 第2実施形態の特徴部分を示すフローチャート。
(第1実施例)
以下、図1〜図8を参照して本発明の第1実施例を説明する。
図1は、この実施形態におけるカメラ付き携帯端末の基本的構成要素を示したブロック図である。
このカメラ付き携帯端末は、カメラ付きの携帯電話、PDA等の携帯端末であり、ネットワーク網(地上系/衛星系移動体通信網、インターネット網)を介して撮影画像を電子メールにて送信する機能を有している。この場合、TCP/IP通信プロトコルを利用したHTTPプロトコル等によって、カメラ付き携帯端末と送付先端末との間でデジタル化(パケット化)された撮影画像の送受信を行うようにしている。
なお、この実施形態の特徴部分を詳述する前に、この実施形態のハードウェア上の構成について以下、説明しておく。
CPU1は、記憶装置2内のオペレーティングシステム、各種アプリケーションソフトに応じてこのカメラ付き携帯端末の全体動作を制御する中央演算処理装置である。記憶装置2は、プログラム記憶領域とデータ記憶領域とを有し、磁気的、光学的、半導体メモリ等、その駆動系によって構成されている。この記録装置2はハードディスク等の固定的なメモリのほか、CD−ROM、DVD等の着脱自在な記憶媒体を装着可能な構成であってもよい。この記憶装置2内のプログラム領域には、後述する図5〜図8に示す動作手順に応じて本実施例を実現するためのアプリケーションプログラムが格納され、また、そのデータ領域には、後述する図2〜図4に示すデータ(人物データベース、画像ファイル、送付データベース)が格納されている。この記憶装置2内のプログラム、データは、必要に応じてRAM(たとえば、スタティックRAM)3にロードされたり、RAM3内のデータが記憶装置2にセーブされる。なお、RAM3は、プログラム実行領域と作業領域とを有している。
一方、CPU1にはその入出力周辺デバイスである通信装置4、入力装置5、表示装置6、カメラ装置7がバスラインを介して接続されており、入出力プログラムに応じてCPU1はそれらの動作を制御する。入力装置5には、通常備えられているシャッターボタン等の各種ボタンのほか、この実施形態特有のボタンとして、後述する特殊モードボタン、画像登録ボタン、送信設定ボタン、送信ボタン等が備えられている。カメラ装置7は、CCDイメージセンサ等を撮像素子として使用するデジタルスチルカメラであり、このカメラ置7によって撮影された撮影画像(カラー画像)は、記憶装置2内に保存されるほかに、電子メールに添付されて送付先端末に送信される。
図2は、人物データベースを構成する各人物登録レコードRTの内容を示した図である。
人物登録レコードRTは、予め登録されている被写体(人物)毎に、その被写体画像と送付先とを対応付けて記憶管理するもので、人物毎に「人物画像」、「名前」、「メールアドレス」、「人物ID」、「人物属性」の各項目を有している。この「人物画像」、「名前」、「メールアドレス」は、たとえば、送付先メールアドレス帳(図示せず)から任意に読み出して人物登録レコードRT内にセットされたものであり、「人物画像」は、人物の顔を中心として撮影された顔画像であり、人物認識用として人物毎に予め登録されている登録画像である。「人物ID」は、人物登録レコードRTが生成される毎に発行された人物識別情報(登録レコード識別情報)である。「人物属性」は、ユーザ(撮影者)と被写体となる人物との人間関係を示すもので、その属性値”00”は親族関係、その属性値”01”は学校時代関係、その属性値”02”は会社関係、その属性値”03”は取引関係、‥‥を示している。この場合、何れかの属性値を1つ登録する場合に限らず、たとえば、学校時代関係、取引関係のように、2以上の属性値を登録するようにしてよい。
図3は、画像ファイルGF、図4は、送付データベースを構成する送付レコードADの内容を示した図である。
画像ファイルGFは、撮影された各撮影画像を1画像1ファイル形式で記憶管理するもので、撮影毎に更新される撮影No(一連No)に対応付けて各撮影画像を記憶管理する構成となっている。送付レコードADは、各撮影画像を人物ID別に分類管理するもので、「人物ID」に対応して複数の「撮影No」を記憶可能な構成となっている。ここで、カメラ付き携帯端末は、撮影画像を解析することによって人物登録レコードRT内に登録されている「人物画像」が撮影画像内に含まれているか否かを認識し、登録画像が含まれていれば、この人物IDに対応付けてその「撮影No」を送付レコードAD内にセットするようにしている。また、送付レコードAD内の各「撮影No」に基づいて画像ファイルGFをアクセスして該当する撮影画像を読み出すと共に、送付レコードAD内の「人物ID」に基づいて人物登録レコードRTをアクセスして該当する「メールアドレス」を読み出し、各撮影画像をこのメールアドレス宛に送付するようにしている。
次ぎに、この第1実施形態におけるカメラ付き携帯端末の動作概念を図5〜図8に示すフローチャートを参照して説明する。ここで、これらのフローチャートに記述されている各機能は、読み取り可能なプログラムコードの形態で格納されており、このプログラムコードにしたがった動作を逐次実行する。また、伝送媒体を介して伝送されてきた上述のプログラムコードにしたがった動作を逐次実行することもできる。このことは後述する他の実施形態においても同様であり、記録媒体の他、伝送媒体を介して外部供給されたプログラム/データを利用してこの実施形態特有の動作を実行することもできる。
図5〜図8は、カメラ撮影時および撮影画像のメール送信時に関する処理を示したフローチャートである。
先ず、CPU1は、通常の撮影モードから特殊モードに移行させるボタン操作の有無をチェックし(図5のステップS1)、特殊モードボタンが操作された場合には、他のボタン操作の有無をチェックする(ステップS2)。なお、この特殊モードは、特殊モードボタンが操作される毎にセット/リセットが繰り返されるもので、特殊モードにおいて、画像登録ボタン、送信設定ボタン、送信ボタンの何れかが操作された場合には(ステップS2でYES)、この操作ボタンの種類を判別し、画像登録ボタンであれば(ステップS3)、送付先メールアドレス帳の内容を一覧表示させる(ステップS4)。
この一覧表示の中から任意の人物が選択指定された場合には(ステップS5)、このアドレス帳から指定人物対応の「人物画像」、「名前」、「メールアドレス」を読み出すと共に(ステップS6)、「人物ID」を生成発行し(ステップS7)、この「人物画像」、「名前」、「メールアドレス」、「人物ID」を含む新たな人物登録レコードRTを生成して記憶管理する(ステップS8)。以下、登録終了が指示されるまで(ステップS9)、上述の登録レコード生成処理が1レコード毎に繰り返される(ステップS5〜A9)。
このようにして人物対応の各登録レコードが生成管理されている状態において、送信設定ボタンが操作された場合には(ステップS10)、現在、送信モードにセットされているか否かを調べる(ステップS11)。この送信モードは、撮影画像を送信可能な状態にセットする動作モードであり、送信設定ボタンが操作される毎に、そのセット/リセットが繰り返される。いま、送信モードにセットされている状態において、送信設定ボタンが操作された場合には、送信モードをリセットするが(ステップS13)、送信モードがリセットされている状態において、送信設定ボタンが操作された場合には、送信モードにセットする(ステップS12)。
一方、上述の特殊モードが解除(リセット)されている状態において、シャッターボタンが操作された場合には(ステップS14)、それに応答して画像撮影が行われると共に(図6のステップS21)、撮影Noを更新して新たな撮影Noを発行し(ステップS22)、この撮影Noを付加した撮影画像を画像ファイルGFとして保存する(ステップS23)。そして、送信モードがセットされているか否かを調べ(ステップS24)、それがリセットされていれば、図5の最初のステップS1に戻るが、送信モードがセットされていれば、この撮影画像を解析することによって(ステップS25)、撮影画像内に含まれている全人物の顔部分の抽出を行う(ステップS26)。
そして、上述のようにして抽出した全ての人物の顔部分を順次指定しながら個別に各人物を認識する処理を行うが、それに先だって認識対象として最初に指定する人物を特定するための処理が行われる(ステップS27〜A33)。先ず、抽出した全ての顔部分を評価し、顔の向き、顔の隠れ状態などが極端に悪いものを除いた写りの良い顔画像(人物)を選択する(ステップS27)。そして、選択した各顔画像のうち、当該撮影画像の中央部に顔画像が位置しているか否かを判別し(ステップS28)、撮影画像の中央部に顔画像が有れば(ステップS29でYES)、この顔画像の人物を最初の認識対象として指定する(ステップS30)。
また、撮影画像の中央部に顔画像が無ければ(ステップS29でNO)、選択した各顔画像の大きさを比較し、その大きさにかなりの差が有るかをチェックする (ステップS31)。ここで、選択した各顔画像の大きさに差が有れば、その中から最大サイズの顔画像を選択して(ステップS32)、当該顔画像の人物を最初の認識対象として指定するが(ステップS30)、各顔画像の大きさが略同様であれば(ステップS31でNO)、選択した各顔画像の中から最も写りの良い顔画像を選択して(ステップS33)、当該顔画像の人物を最初の認識対象として指定する(ステップS30)。
このようにして最初の認識対象としての人物が指定されると、この顔画像に基づいて人物データベースを構成する各人物登録レコードRTを検索し、その登録画像としての各「人物画像」と比較する(ステップS34)。この場合、画像の顔の向き、大きさにを補正した後、顔の輪郭、目、口、鼻、額等の形、位置、大きさ、髪型、メガネの有無と種類等を個別に比較するほか、それらを総合比較することによって画像比較を行う(以下、同様)。この結果、両人物が特徴的に一致することが認識されて当該人物が特定されると、この登録画像に対応付けられている「人物ID」および「人物属性」をその人物登録レコードRTから読み出して、「人物ID」および「人物属性」を特定する(ステップS35)。
次ぎに、図7のステップS36に移り、撮影画像内から抽出した各顔画像のうち、未指定の顔画像が有るかを調べるが、最初は、1番目の顔画像を指定した場合であるから、未指定の顔画像のうち、その何れか1つを2番目の認識対象として指定する(ステップS38)。そして、指定した顔画像に基づいて人物認識を行うが、2番目以降の人物認識時には、上述した1番目の人物認識時に得られた人物属性を考慮した人物認識が行われる(ステップS39)。すなわち、1番目の人物認識時に得られた人物属性に基づいて人物データベースを構成する各人物登録レコードRTを検索し、同一の人物属性を持つ各登録画像を比較対象として選択し、この選択範囲内の各登録画像と2番目に指定された顔画像とを比較することによって人物認識を行う。言い換えれば、人物データベース内の全ての登録画像を比較対象とするのではなく、1番目の人物認識時に得られた人物属性(人間関係)に基づいて絞り込まれた範囲内の比較対象を参照して人物認識を行う。
この結果、1番目の人物の人間関係に基づいて絞り込まれた範囲内の何れかの登録画像と2番目に指定された顔画像とが所定レベル以上の一致し、当該人物が特定されると(ステップS40でYES)、この登録画像に対応付けられている「人物ID」をその人物登録レコードRTから読み出して「人物ID」を特定する(ステップS41)。一方、絞り込まれた範囲内の各登録画像には2番目に指定された顔画像に一致する人物を含まれていない場合には(ステップS40でNO)、通常と同様(1番目の人物と同様)に、人物データベース内の全登録画像を比較対象として人物認識を行い(ステップS42)、その結果、人物が特定されると、当該登録画像に対応付けられている「人物ID」をその人物登録レコードRTから読み出して「人物ID」を特定する(ステップS41)。
以下、ステップS36に戻り、未指定の顔画像の有無を調べ、全ての顔画像を指定し終わるまで上述の動作が繰り返される。ここで、全ての顔画像を指定し終わった場合には、特定された各人物ID毎に、その撮影Noを人物対応の送付レコードAD内にセットする(ステップS37)。その後、図5の最初のステップS1に移る。この場合、特定された人物対応の送付レコードADが存在していれば(作成済みであれば)、この撮影Noを該当レコード内に追加登録するが、該当レコードADが存在していなければ、特定された人物対応の送付レコードADを新規作成するようにしている。
他方、上述の特殊モードにセットされている状態において、送信ボタンが操作された場合には(図8のステップS51)、1つの送付レコードADを指定し、この送付レコードAD内の「人物ID」に基づいて人物登録レコードRTをアクセスし、該当する「メールアドレス」を読み出してメール宛先としてセットする(ステップS52)。次に、指定した送付レコードAD内から各「撮影No」を読み出し、この「撮影No」に基づいて該当する画像ファイルGFを取得し(ステップS53)、この各撮影画像ファイルを圧縮ファイルに変換して当該メールに添付する(ステップS54)。そして、メール送信を行った後に(ステップS55)、この送信済みの送付レコードADを削除する(ステップS56)。以下、他の送付レコードADがあれば(ステップS57でYES)、この送付レコードADを順次指定しながら上述の送付処理を繰り返す(ステップS51〜A57)。
以上のように、この第1実施例のカメラ付き携帯端末において、CPU1は、人物データベース内に登録画像(人物顔画像)に対応してその人物属性が記憶管理されている状態において、カメラ装置7によって撮影された撮影画像内に含まれている複数の人物を順次指定してその各々を個別に認識する過程で、ある人物を指定してその認識を行った際に、この人物に対応する属性に基づいて同一属性を持つ登録画像を比較対象として優先的に選択し、この選択範囲内の各登録画像と他の人物とを比較することによって当該人物を認識するようにしたから、撮影画像内の複数の人物を個別に認識する場合において、各人物同士の人間関係(家族関係、交友関係、会社関係、親戚関係など)に基づいて比較対象を絞り込むことができ、登録画像の数が膨大であっても、各人物を効率良く認識することが可能となる。
この場合、CPU1は、撮影画像内に含まれている複数の人物のうち、撮影画像の中央部に含まれている人物を最初に指定したり、撮影画像内に含まれている複数の人物のうち、最大サイズあるいは写り具合が最良の人物を最初に指定するようにしたから、各人物同士の関連性を判断する際にその基準となる人物を容易に特定することが可能となる。
人物データベース内に登録画像に対応してその人物属性と共にこの人物の名前、メールアドレスが記憶管理されている状態において、認識された人物に対応する名前、メールアドレスを取得してメール送信するようにしたから、撮影画像を電子メールに添付して相手先に送付する際に、撮影画像をその相手先に適切に送付することができ、撮影画像毎に何が写っているかを確認しながら各送付先を探し出すという面倒な作業が不要となると共に、画像送付を忘れることを防ぐことが可能となる。
なお、上述した第1実施例においては、その属性値として親族関係、学校時代関係、会社関係、取引関係、‥‥を例示したが、たとえば、学校時代関係を大学時代、高校時代の友人関係、サークル関係などのように、より詳細な関係を登録したり、階層構造でその関係を関連付けてもよい。この場合、下位階層から上位階層に比較対象を段階的に選択するようにしてもよい。
また、上述した第1実施例においては、被写体として、人物を例示したが、たとえば、複数のペット、または観光地内の複数の建物などであってもよく、また、撮影画像内の複数の被写体は、人物同士、ペット同士に限らず、たとえば、人物とペットであってもよい。また、撮影画像内の複数の被写体を認識した後にその認識結果を選択候補として案内表示するようにしてもよい。
一方、コンピュータに対して、上述した各手段を実行させるためのプログラムコードをそれぞれ記録した記録媒体(たとえば、CD−ROM、フレキシブルディスク、RAMカード等)を提供するようにしてもよい。すなわち、コンピュータが読み取り可能なプログラムコードを有する記録媒体であって、被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報を記憶管理する機能と、撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、ある被写体を指定してその認識を行った際に、この被写体に対応する属性情報に基づいて同一属性を持つ登録画像を比較対象として選択し、この選択範囲内の各登録画像と他の被写体部分とを優先的に比較することによって当該被写体を認識する機能とを実現させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体を提供するようにしてもよい。
(実施例2)
以下、この発明の第2実施例について図9および図10を参照して説明する。
なお、上述した第1実施例においては、最初の人物を指定してその認識を行った際に、この人物に対応する属性に基づいて同一属性を持つ登録画像を比較対象として優先的に選択することによって比較対象範囲を絞り込むようにしたが、この第2実施例においては、撮影画像内に含まれている複数の人物を個別に認識する場合に、類似する登録画像が多くても各人物を精度良く認識できるようにしたものである。すなわち、この第2実施例においては、各人物毎に複数の認識候補を得ると共に、各人物毎に得られた複数の認識候補の中から各人物に共通する属性を持つ認識候補を各人物の認識結果として決定することにより各人物を精度良く認識できるようにしたものである。
ここで、両実施例において基本的あるいは名称的に同一のものは、同一符号を付して示し、その説明を省略すると共に、以下、第2実施例の特徴部分を中心に説明するものとする。
図9は、各人物毎に得られた複数の認識候補を例示した図である。
この場合、人物A、B、Cに対応して複数の人物IDとその属性を認識候補として得た場合を示している。すなわち、複数の人物を個別に認識する際に、人物毎に類似度の高い複数個の登録画像を認識候補として特定し、人物登録レコードRTから各登録画像対応の人物IDと人物属性を読み出したものである。この各人物対応の認識候補の中から人物属性が共通する人物IDを選択して各人物の認識結果として決定するようにしている。たとえば、図9の例では、人物A、B、Cに共通する人物属性は「001」であるため、この人物属性「001」に対応付けられている人物IDが各人物の認識結果として決定される。
図10は、この第2実施例の特徴部分を示すフローチャートであり、上述した図5〜図8のうち、図6に代わるフローチャートであり、図5、図7、図8は、上述した第1実施例と同様であるため、以下、図10を参照して、この第2実施例の特徴部分を説明するものとする。
先ず、CPU1は、特殊モードが解除(リセット)されている状態において、シャッターボタンが操作された場合には(図5のステップS14)、それに応答して画像撮影が行われると共に(図10のステップS61)、撮影Noを更新して新たな撮影Noを発行し(ステップS62)、この撮影Noを付加した撮影画像を画像ファイルGFとして保存する(ステップS63)。そして、送信モードがセットされているか否かを調べ(ステップS64)、それがリセットされていれば、図5の最初のステップS1に戻るが、送信モードがセットされていれば、この撮影画像を解析することによって(ステップS65)、撮影画像内に含まれている全人物の顔部分の抽出を行う(ステップS66)。
そして、抽出した全ての人物の顔部分を順次指定しながら個別に各人物を認識する処理を行う。先ず、抽出した各人物の顔部分のうち、その何れか1つの顔画像を認識対象として指定した後(ステップS67)、この顔画像に基づいて人物データベースを構成する各人物登録レコードRTを検索し、その登録画像としての各「人物画像」と比較する(ステップS68)。この場合、特徴的に一致する一致度(類似度)が所定レベル以上の登録画像の有無をチェックし、該当する類似画像が1つも存在していなければ(ステップS69でNO)、次のステップS71に移るが、該当する類似画像が1つでも存在していれば、一致度(類似度)の高い順に3つの人物IDおよび人物属性をその人物登録レコードRTから読み出して当該人物の認識候補として特定する(ステップS70)。
次ぎに、未指定の顔画像が有るかを調べるが(ステップS71)、最初は、1番目の顔画像を指定した場合であるから、未指定の顔画像のうち、その何れか1つを2番目の認識対象として指定する(ステップS67)。以下、全ての顔画像を指定し終わるまで上述の動作が繰り返される(ステップS67〜A71)。ここで、全ての顔画像を指定し終わった場合には、各人物毎に特定した複数の人物ID(認識候補)のうち、各人物に共通する人物属性を特定すると共に(ステップS72)、この人物属性対応の人物IDを特定する(ステップS73)。これによって特定された各人物ID毎に、その撮影Noを人物対応の送付レコードAD内にセットする(ステップS74)。その後、図5の最初のステップS1に移る。
以上のように、この第2実施例においては、のカメラ付き携帯端末において、CPU1は、人物データベース内に登録画像(人物顔画像)に対応してその人物属性が記憶管理されている状態において、カメラ装置7によって撮影された撮影画像内に含まれている複数の人物を順次指定してその各々を個別に認識する過程で、各人物毎に複数の認識候補を得ると共に、各人物毎に得られた複数の認識候補の中から各人物に共通する属性を持つ認識候補を各人物の認識結果として決定するようにしたから、各人物に共通する人間関係(家族関係、交友関係、会社関係、親戚関係など)を考慮して各人物を認識することができ、類似する登録画像が多くても、各人物を精度良く認識することが可能となる。
なお、上述した第2実施例においても、その属性値として親族関係、学校時代関係、会社関係、取引関係などに限らず、たとえば、大学時代、高校時代の友人関係、サークル関係などのように、より詳細な関係であってもよい。被写体としては、人物に限らず、複数のペット、または観光地内の複数の建物などであってもよく、また、撮影画像内の複数の被写体は、人物同士、ペット同士に限らず、たとえば、人物とペットであってもよい。
一方、コンピュータが読み取り可能なプログラムコードを有する記録媒体であって、被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報を記憶管理する機能と、撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、各被写体毎に複数の認識候補を得ると共に、各被写体毎に得られた複数の認識候補の中から各被写体に共通する属性情報を持つ認識候補を各被写体の認識結果として決定する機能とを実現させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体を提供するようにしてもよい。
その他、上述した第1および第2実施形態においては、シャッター操作が行われる毎に、撮影画像を解析することによって画像認識して送付レコードADを作成するようにしたが、このような画像解析および送付レコードADの作成は、シャッター操作毎に行わず、例えば、シャッター非操作時の空き時間において、保存されている各撮影画像を順次読み出して実行するようにしてもよい。
また、上述した第1および第2実施形態においては、登録レコードRT内に1人物に対応して1種類の画像を登録するようにしたが、画像比較時の認識率を向上させる為に、撮影方向等が異なる複数の画像を登録するようにしてもよい。
上述した第1および第2実施形態においては、撮影画像をメールに添付して送信するようにしたが、カラー印刷された撮影画像をファクシミリ装置にてFAX送信するようにしてもよく、送信形態は問わない。また、送付する撮影画像は、静止画に限らず、動画であってもよい。
上述した第1および第2実施形態においては、カメラ付き携帯端末に適用した場合を例示したが、他のカメラ装置によって撮影された各撮影画像を受信取得して、送付先に送信するようにした画像送信装置であってもよい。
1 CPU
2 記憶装置
4 通信装置
5 入力装置
6 表示装置
7 カメラ装置
RT 登録レコード
GF 画像ファイル
AD 送付レコード

Claims (7)

  1. 撮影画内に含まれている被写体部分と予め被写体認識用として登録されている登録画像とを比較することによって当該被写体を認識する画像認識装置であって、
    被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報を記憶管理する被写体情報記憶手段と、
    撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、ある被写体を指定してその認識を行った際に、この被写体に対応する属性情報に基づいて同一属性を持つ登録画像を比較対象として優先的に選択し、この選択範囲内の各登録画像と他の被写体部分とを比較することによって当該被写体を認識する認識手段と、
    を具備したことを特徴とする画像認識装置。
  2. 前記認識手段は、撮影画像内に含まれている複数の被写体のうち、撮影画像の中央部に含まれている被写体を最初に指定する、
    ようにしたことを特徴とする請求項1記載の画像認識装置。
  3. 前記認識手段は、撮影画像内に含まれている複数の被写体のうち、最大サイズあるいは写り具合が最良の被写体を最初に指定する、
    ようにしたことを特徴とする請求項1記載の画像認識装置。
  4. 前記被写体情報記憶手段は、登録画像に対応してその属性情報と共に、この被写体の識別情報を記憶管理し、
    前記認識手段によって認識された被写体に対応する識別情報を取得して出力する、
    ようにしたことを特徴とする請求項1記載の画像認識装置。
  5. コンピュータに対して、
    被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報を記憶管理する機能と、
    撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、ある被写体を指定してその認識を行った際に、この被写体に対応する属性情報に基づいて同一属性を持つ登録画像を比較対象として選択し、この選択範囲内の各登録画像と他の被写体部分とを優先的に比較することによって当該被写体を認識する機能と、
    を実現させるためのプログラム。
  6. 撮影画内に含まれている被写体部分と予め被写体認識用として登録されている登録画像とを比較することによって当該被写体を認識する画像認識装置であって、
    被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報を記憶管理する被写体情報記憶手段と、
    撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、各被写体毎に複数の認識候補を得ると共に、各被写体毎に得られた複数の認識候補の中から各被写体に共通する属性情報を持つ認識候補を各被写体の認識結果として決定する認識手段と、
    を具備したことを特徴とする画像認識装置。
  7. コンピュータに対して、
    被写体認識用として被写体毎に登録されている登録画像に対応してその被写体の属性を示す属性情報を記憶管理する機能と、
    撮影画像内に含まれている複数の被写体を順次指定してその各々を個別に認識する過程で、各被写体毎に複数の認識候補を得ると共に、各被写体毎に得られた複数の認識候補の中から各被写体に共通する属性情報を持つ認識候補を各被写体の認識結果として決定する機能と、
    を実現させるためのプログラム。
JP2009279081A 2009-12-09 2009-12-09 画像認識装置およびプログラム Expired - Fee Related JP4661980B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009279081A JP4661980B2 (ja) 2009-12-09 2009-12-09 画像認識装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009279081A JP4661980B2 (ja) 2009-12-09 2009-12-09 画像認識装置およびプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004154420A Division JP4501531B2 (ja) 2004-05-25 2004-05-25 画像認識装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2010086549A true JP2010086549A (ja) 2010-04-15
JP4661980B2 JP4661980B2 (ja) 2011-03-30

Family

ID=42250358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009279081A Expired - Fee Related JP4661980B2 (ja) 2009-12-09 2009-12-09 画像認識装置およびプログラム

Country Status (1)

Country Link
JP (1) JP4661980B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015232759A (ja) * 2014-06-09 2015-12-24 キヤノン株式会社 人物推定装置、人物推定方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164560A (ja) * 2005-12-15 2007-06-28 Sony Corp 画像処理装置および方法、並びにプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164560A (ja) * 2005-12-15 2007-06-28 Sony Corp 画像処理装置および方法、並びにプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015232759A (ja) * 2014-06-09 2015-12-24 キヤノン株式会社 人物推定装置、人物推定方法及びプログラム
US9367768B2 (en) 2014-06-09 2016-06-14 Canon Kabushiki Kaisha Image processing device, image processing method, and storage medium computer-readably storing program therefor

Also Published As

Publication number Publication date
JP4661980B2 (ja) 2011-03-30

Similar Documents

Publication Publication Date Title
US11714523B2 (en) Digital image tagging apparatuses, systems, and methods
US9912870B2 (en) Method for transmitting image and image pickup apparatus applying the same
US8189927B2 (en) Face categorization and annotation of a mobile phone contact list
US10459968B2 (en) Image processing system and image processing method
JP4103683B2 (ja) 撮影画像送信装置およびプログラム
US20140129981A1 (en) Electronic Device and Method for Handling Tags
US9639778B2 (en) Information processing apparatus, control method thereof, and storage medium
JP2006072614A (ja) 画像ファイルの保存方法およびその関連技術
US20150189118A1 (en) Photographing apparatus, photographing system, photographing method, and recording medium recording photographing control program
JP4501531B2 (ja) 画像認識装置およびプログラム
US9195312B2 (en) Information processing apparatus, conference system, and information processing method
US8300256B2 (en) Methods, systems, and computer program products for associating an image with a communication characteristic
JP5532180B1 (ja) 画像処理装置及びプログラム
JP5788447B2 (ja) 保険証券の情報取得システム
JP2004356985A (ja) カメラ撮影装置およびプログラム
US9854132B2 (en) Image processing apparatus, data registration method, and data registration program
JP4661980B2 (ja) 画像認識装置およびプログラム
KR101231156B1 (ko) Qr 코드를 이용하는 사진 폴더 관리 시스템 및 사진 폴더 관리 방법
JP2012070222A (ja) 撮像装置、撮像方法、及び撮像プログラム
JP2009049886A (ja) 画像検索装置、撮影装置、画像検索方法及びプログラム
JP5743017B2 (ja) 画像管理装置及びプログラム
KR20120080379A (ko) 디지털 카메라의 이미지 어노테이션 처리 방법 및 장치
JP2010009303A (ja) 記録画像の分類処理システム
JP6006841B2 (ja) 画像取扱装置、画像取扱方法、およびプログラム
US20240040232A1 (en) Information processing apparatus, method thereof, and program thereof, and information processing system

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101220

R150 Certificate of patent or registration of utility model

Ref document number: 4661980

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140114

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees