JP4444633B2 - 画像分類装置、画像分類方法、および、プログラム - Google Patents

画像分類装置、画像分類方法、および、プログラム Download PDF

Info

Publication number
JP4444633B2
JP4444633B2 JP2003382303A JP2003382303A JP4444633B2 JP 4444633 B2 JP4444633 B2 JP 4444633B2 JP 2003382303 A JP2003382303 A JP 2003382303A JP 2003382303 A JP2003382303 A JP 2003382303A JP 4444633 B2 JP4444633 B2 JP 4444633B2
Authority
JP
Japan
Prior art keywords
person
image
subject
important
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003382303A
Other languages
English (en)
Other versions
JP2005148900A (ja
Inventor
理絵 山田
恭子 数藤
裕子 高橋
賢一 荒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003382303A priority Critical patent/JP4444633B2/ja
Publication of JP2005148900A publication Critical patent/JP2005148900A/ja
Application granted granted Critical
Publication of JP4444633B2 publication Critical patent/JP4444633B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Description

本発明は、ユーザが撮影した画像を、画像中の被写体の重要度によって分類する画像の被写体分類技術に関する。
カメラ付携帯電話やデジタルカメラの普及に伴って、個人の撮影画像枚数が急速に増大し、アルバム作成やメール配信、プリントアウト等がなされている。
しかしながら、ユーザがメール配信やプリントアウトのために被撮影人物ごとに画像を分類するには、対象となる画像数が増えるほど作業負担が増大してしまう。
現在のところ、画像を被写人物別に分類する方法としては、例えば、分類対象としたい人物の画像を送信して登録作業を行った後、その人物に関しての分類を行う方法(例えば、特許文献1参照。)が知られている。
また、映像に対して事前に番組表を用いたり、検索者が登録することで、登場人物シーンを分類する方法(例えば、特許文献2参照。)も知られている。
しかし、事前の登録作業を行わなければならず、後に別の人物での検索を行いたい場合には、再登録、再分類を行わなければならなかった。
これに対し、入力された人物の登録を行わずに人物毎に分類を行うためには、入力人物の顔の特徴を特徴空間に写像したものを1パターンとしてクラスタリングする方法が考えられる。
一般的に用いられているクラスタリング手法として、最近傍法等が知られている(例えば、非特許文献1参照。)。
例えば、N個の入力パターンをそれぞれP1〜PNとするとき、最近傍法では、パターンP1〜PNが順番に特徴空間中に写像されるとする。このときの処理手順を以下に説明する。
(1)パターンP1を代表パターンとするクラスタC1をつくり、i=2とする。(2)パターンP1と、既存の各クラス他の代表パターンとの距離を調べ、クラスタCjまでの距離Dijが最小で合った場合、Dijの値によって、
(i)Dij≦Tのとき、PiはクラスタCjに属する(Tは閾値)。
(ii)Dij>Tのとき、Piを代表パターンとする新しいクラスタを作る。(3)i=Nなら処理を終了し、その他のときはiを1増やして(2〉に戻る。
以上により、パターンを各クラスタに分類することができる。
しかし、この手法では、個々のパターンの重要度は処理結果に反映されていない。つまり、主要人物を選びたい場合には、ユーザが各クラスタの人物を確認するか、所属パターン数によって判断する必要がある。例えば、偶然撮影された通行人も1つのクラスタとなり、1度しか撮影されなかった重要な人物のクラスタとの重要度の区別がつかない。そのため、ユーザはクラスタごとに重要な人物であるかを確認しなければならない。また、被撮影頻度を重要度とした場合には、同じ通行人が数回撮影されると、この通行人の方が主要人物よりも重要人物とされてしまうため、被写体としての重要度を誤って、分類してしまう恐れがあった。
特開2003−209798号公報 特開2001−167110号公報 C言語による画像処理入門、安居院猛、長尾智晴共著、昭晃堂、ISBN4−7856−3124−4、2000年11月20日初版1刷発行
このように、従来から、ユーザが分類基準をあらかじめ登録したり、画像中から対象物を抽出し、類似画像をクラスタリングすることで、対象物ごとに画像を分類する手法が知られている。
しかし、前者では分類基準が多いほどユーザの負担が大きい。また、後者では、人物の顔領域を個人ごとにクラスタリングした場合、各個人の被写体としての重要度、すなわちその人物を対象として撮影したか否かは不明であった。
本発明はかかる事情に鑑みなされたもので、その目的は、被写体の形態から被写体の重要度を求め、被写体ごとに画像を分類する装置、方法、及びプログラムを提供することにある。
そこで、前記課題を解決するために、請求項1に記載の画像分類装置は、入力画像を該画像中の重要人物の判定に基づいて分類する画像分類装置であって、入力画像から人物の顔の領域及び前記人物の個人識別情報を抽出し、前記顔の領域が前記入力画像中に占める割合、前記顔の向き、前記顔の表情、前記顔の領域の鮮明度のいずれか複数の被写形態情報を取得する顔領域検出手段と、前記抽出された顔の領域毎に、前記被写形態情報それぞれに対し所定値による重要度の重み付けを行った和が所定の閾値より大きい場合に、前記顔の人物を重要人物と判定する重要被写体抽出手段と、前記重要被写体抽出手段により、重要人物と判定された人物を入力パターンとしてクラスタリングを行い、前記重要人物毎のクラスを作成する被写体種別分類手段と、前記被写体種別分類手段によって作成されたクラス毎に前記入力画像を分類する被写体分類手段と、を有することを特徴とする。
前記被写形態情報は被写体の重要度の指標となるものであり、請求項1では、被写形態情報により重要度を判断し、重要な被写体ごとに画像を分類することができる。前記重要度の重みは、前記重要度の指標となる特徴を、それぞれどの程度重要視するかを決めるパラメータであり、該重要度の重み付けはユーザにより可変であるため、ユーザの目的に応じて画像分類を行なうことができる。また、本装置は被写体の分類を行う被写体分類装置として使用することもできる。
また、請求項2に記載の画像分類方法は、入力画像を該画像中の重要人物の判定に基づいて分類する画像分類方法であって、顔領域検出手段が、入力画像から人物の顔の領域及び前記人物の個人識別情報を抽出し、前記顔の領域が前記入力画像中に占める割合、前記顔の向き、前記顔の表情、前記顔の領域の鮮明度のいずれか複数の被写形態情報を取得する顔領域検出ステップと、重要被写体抽出手段が、前記抽出された顔の領域毎に、前記被写形態情報それぞれに対し所定値による重要度の重み付けを行った和が所定の閾値より大きい場合に、前記顔の人物を重要人物と判定する重要被写体抽出ステップと、被写体種別分類手段が、前記重要被写体抽出手段により、重要人物と判定された人物を入力パターンとしてクラスタリングを行い、前記重要人物毎のクラスを作成する被写体種別分類ステップと、被写体分類手段が、前記被写体種別分類手段によって作成されたクラス毎に前記入力画像を分類する被写体分類ステップと、を有することを特徴とする。
前記被写形態情報は被写体の重要度の指標となるものであり、請求項2では、被写形態情報により重要度を判断し、重要な被写体ごとに画像を分類することができる。前記重要度の重みは、前記重要度の指標となる特徴を、それぞれどの程度重要視するかを決めるパラメータであり、該重要度の重み付けはユーザにより可変であるため、ユーザの目的に応じて画像分類を行なうことができる。また、本方法は被写体の分類を行う被写体分類方法として使用することもできる。
また、請求項3に記載のプログラムは、請求項1に記載の画像分類装置としてコンピュータを機能させるためのプログラムを特徴とする。
請求項3では、前記請求項1記載の画像分類装置に記載の作用効果を奏するプログラムを実現できる。
なお、前記画像分類装置に、画像入力装置と分類結果表示装置とを接続して一のシステムとして構成すること、または、画像入力手段と分類結果表示手段とを接続して一の装置として構成することが可能である。
また、分類結果表示としては、ディスプレイに表示する方法、結果をプリントアウトする方法等がある。
また、重要度の重みパラメータは、装置に予め設定しておくことができるが、分類の要求ごとにユーザが設定することが可能である。
本発明によれば、被写形態情報により重要度を判断し、重要な被写体ごとに画像を分類することができる。また、顔以外の入力パターンであっても、画像中での被写体の大きさ、向き、鮮明度等の被写形態の情報を利用することにより、同様の処理が可能である。さらに、重要度の重み付けはユーザにより可変であるため、ユーザの目的に応じた画像分類を行うことができる。
図1は、本発明の実施形態1を示す画像の画像分類装置の構成を示す図である。図1に示すように画像の画像分類装置は、被写体重要度設定部11、被写体テーブル作成部12、重要被写体抽出部13、被写体種別分類部14、被写体分類部15から構成される。
被写体重要度設定部11では、被写体の撮影対象としての重要度を判断するため、あらかじめ被写体の重要度の重みパラメータを設定しておく。
被写体テーブル作成部12では、ユーザからの少なくとも1枚以上の画像群を入力し、画像毎に被写体を抽出する。また、抽出した被写体を、各被写体の抽出元画像情報と重要度の指標となる被写形態情報とを関連付け、被写体データ群テーブルを作成する。
重要被写体抽出部13では、被写体データ群と前記設定された重要度の重みパラメータにより、各被写体の重要度を判断し、重要な被写体の抽出を行う。
被写体種別分類部14では、抽出された重要な被写体について、同種の被写体を同一のものとして分類し、種類別仮名称を設定する(詳しくは、図7に記述)。
被写体分類部15では、重要な被写体の分類によって設定された被写体の種類ごとに、被写体データ群を分類する(詳しくは、図7に記述)。
図2は、本発明の実施形態2を示す画像の画像分類装置の構成を示す図である。画像の画像分類装置は、被写体重要度設定部21、被写体テーブル作成部22、被写体種別分類部23、重要被写体抽出部24から構成される。
被写体重要度設定部21では、被写体の撮影対象としての重要度を判断するため、あらかじめ被写体の重要度の重みパラメータを設定しておく。
被写体テーブル作成部22では、ユーザからの少なくとも1枚以上の画像群を入力し、画像毎に被写体を抽出する。また、抽出した被写体を、各被写体の抽出元画像情報と重要度の指標となる被写形態情報とを関連付け、被写体データ群テーブルを作成する。
被写体種別分類部23では、抽出された被写体データ群を、同種の被写体を同一のものとして分類し、種類別仮名称を設定する(詳しくは、図8に記述)。
重要被写体抽出部24では、種類別に分類した後の被写体データ群から、前記設定された重要度の重みパラメータにより、各被写体の重要度を判断し、重要な被写体の抽出を行う(詳しくは、図8に記述)。
ここで、重要度の指標となる被写形態情報は、被写体がもつ画像中での大きさや向き、鮮明度等の特徴であるものとし、被写体の重要度の重みパラメータは、重要度の指標となる特徴を、それぞれどの程度重要視するかを決めるパラメータをさす。例えば、被写体の画像中での大きさを鮮明度よりも重視した場合には、前者の重みを大きくするため、大きさのパラメータを鮮明度のパラメータよりも大きくする。こうしたパラメータは、デフォルトの値を設定し、この既定値を利用してもよいし、ユーザが必要に応じて変えられるものとしてもよい。重要な被写体の判断は、重要度の指標となる特徴を重み付けし、判別関数(詳細は図4で記述)を用いて決定することができる。被写体は、個々に抽出元画像情報と被写形態情報とを持つものとし、被写体データ群テーブル(詳細は図5に記述)に登録されるものとする。
次に被写体テーブル作成部について詳しく説明する。図3は、本発明における画像の画像分類装置の被写体テーブル作成部12、22の構成例を示す図である。図3に示すように被写体テーブル作成部12、22は、顔領域検出部31、人物領域検出部32、テーブル作成部33で構成される。
さらに、顔領域検出部31は、顔領域面積取得部34、鮮明度識別部35、表情識別部36、顔向き識別部37、年齢識別部38、性別識別部39から構成される。
また、人物領域検出部32は、服装識別部40、姿勢識別部41からなる。
分類対象となる画像については、顔領域抽出部31により顔領域の抽出を行い、該顔領域から個人特有の特徴(以下、個人識別情報と記す)を示す情報抽出及び、画像中に占める顔領域の大きさ、画像中に占める割合、顔の上下左右の向き、鮮明度、表情、年齢、性別等の被写形態情報の取得を行う。
ここで、鮮明度には、画像のぼけや、照明の方向、影の有無などを含むものとしてもよい。
次に、人物領域検出部32により人物領域を検出し、この人物領域から人物の服装、姿勢等の被写形態情報を抽出する。
以上抽出した情報は、抽出元画像情報とともに、顔領域の個人識別情報に関連づけて、被写体データ群テーブルに登録する。このとき、被写体データ群テーブルに、画像にあらかじめ付与されている時刻等のメタデータを加えてもよい。
顔抽出から被写体データ群テーブル作成までの処理は、入力された全画像の処理が終了するまで繰り返されるものとする。
また、被写形態情報は、重要度の重み付けパラメータを用いた関数(詳細は図4に記述)により、人物の重要度を算出する際に用いるものである。
なお、顔検出においては、例えば、H.Schneiderman,T.Kanade.’’A Statistical Method for 3D Object Detection Applied to Faces and Cars’’.IEEE Conference on Computer Vision and Pattern Recognition(CVPR 2000 Volume1 June 13−15,2000)による手法などを用いても良い。
また、画像から人物領域を検出する手法に関しては、例えば特開2002−298142号公報に記載された手法などを用いてもよい。
また、検出された顔画像の向きは、例えば特開2001−250121号公報に記載された手法を用いてもよい。また、同手法や特開2003−141551号公報に記載された手法を用いて計算してもよい。
また、表情識別に関しては、聞えば、松野勝弘、李七雨、辻三郎、’’ポテンシャルネットとKL展開を用いた顔表情の認識’’、信学論(D−II)、vo1.J77−D−II,no.8,pp.1591−1600,Aug.1994.による手法などを用いてもよい。
また、年齢、性別に関しては、例えば、細井聖、瀧川えりな、川出雅人、’’ガボールウェーブレット変換とサポートベクタマシンによる性別・年代推定システム’’第8回画像センシングシンポジウム講演論文集C−1による手法などを用いてもよい。
次に、重要被写体抽出部における処理手順について説明する。図4は、本発明による画像の画像分類装置における重要被写体抽出部13、24の処理手順を例を用いて詳しく示す図である。具体的なステップは以下の通りである。
図4において、ステップ1では、重要度の重みづけのデフォルト値を設定する。
ステップ2では、被写形態情報と重要度重み付けパラメータを用いた判別関数により、人物の重要度を算出する。
ステップ3では、算出した重要度があらかじめ定めた閾値以上であるかを比較し、閾値以上であれば、ステップ4へ、それ以外はステップ5ヘすすむ。
ステップ4では、閾値以上の対象人物を重要人物として設定する。
ステップ5では、閾値に満たない対象人物を非重要人物として設定する。
ステップ6では全抽出人物の処理が終了するまで、ステップ2〜4または5を行う。
実施形態1の例の場合、重要人物は、人物別に分類した後に人物別仮名称設定する。抽出人物(重要でないと判断した人物を含む)はこの人物別に分類される。
実施形態2の例の場合、被写人物は、人物別に分類した後に人物別仮名称設定する。各人物が重要人物であるか否かは、分類後人物別に判断される。
被写体が重要であるかを判断する判別関数は、顔領域の画像中に占める割合、顔の左右方向の向き、目の開閉状態の特徴を用いる場合には、例えば以下のようなものであってもよい。
対象となる画像の顔領域の割合をx、対象となる人物の顔の左右方向の回転をy、対象となる人物の目の開閉状態をzとするとき、該人物の被写人物としての重要度を示す判別関数f(x,y,z)は、
と表す。このとき、f(x,y,z)≧T(T:閾値)であれば、重要人物と判定する。
ここで、a〜cは重要度を左右するパラメータx〜zの重み付けを決定する係数であり、装置側ではデフォルトを設定した上で、装置使用時には既定値を利用してもよいし、ユーザによって設定し直してもよい。さらに、判別関数には、笑顔であるか否かといった表情のパラメータ等、その他の被写形態情報を加えてもよい。また、この判別関数は線形である必要はない。
次に、パラメータのユーザ入力画面について説明する。図5は、本発明による画像の画像分類装置における画像中の人物の重要度を決めるパラメータのユーザ入力画面の一例を示す図である。重要度は、画像中から検出された顔の大きさ、向き、鮮明度、表情等により決定されるものとし、この重要度を決定する関数のパラメータは、あらかじめ装置側でデフォルト値を設定してある。ただし、装置使用時にユーザによって変えられるものであってもよい。
図5中の画面1〜5はこれらパラメータの設定画面の一例である。例えば、画像中に占める顔の割合が20%を超えるものに関して、デフォルトで設定してある値から変更しようとする場合、割合別に複数用意された選択肢の中から、20%を超える画像を選択し、スライドバーでパラメータを調整することができる。また、こうしたパラメータ調整及び判別関数の閾値は、ユーザが検出したい画像を例にあげ、出力結果を見ながら、必要に応じてその値を変化させられるようにしてもよい(画面5)。
次に、被写体テーブル作成部で作成されるテーブルについて説明する。図6は、本発明による画像の画像分類装置における被写体テーブル作成部12、22で作成されるテーブルの一例を示す図である。被写体テーブルには、画像から抽出された顔の個人識別情報に、抽出元画像情報、その他抽出人物に付随する顔領域の画像中に占める割合や顔の向きといった被写形態情報を関連付けてデータベース化してあるものとする。
次に、被写体種別分類部および被写体分類部で行われる入力パターンの分類について説明する。図7、8は、本発明による画像の画像分類装置における被写体種別分類部14、23、および被写体分類部15で行われる入力パターンの分類例を示す図である。
抽出された人物は、画像中にしめる大きさや顔の向き、鮮明度等によって、被写人物としての重要度が変化する。具体的には、画像中にしめる割合が大きく、正面向きで、ぼけることなく人物が写し出されている画像は、その人物を撮影対象として撮影した画像である可能性が高い。つまり、該画像において、該人物の重要度は高く、後刻検索を行おうとする場合には、その人物に関する情報が重要になる。そこで、検出された人物の画像中にしめる大きさや顔の向き、鮮明度等をパラメータ化し、閾値以上であれば重要な人物であるとする。
実施形態1による例では、重要な人物であった場合には、その人物を入力パターンとしたクラスタリングを行い、人物ごとの分類を行う。また、クラスタごとに仮称を設定し、人物名とする(図7(a))。また、同一画像中に1人の人物が複数含まれる可能性は低いことから、画像1枚の中に含まれている複数の顔は必ず別クラスタとして分類できることになる。
さらに、このクラスタごとに重要でない人物(以下、非重要人物と記す)を含めた抽出人物の分類を行う。
図7中の実線の円で囲まれたクラスタは●が重要人物パターン、Oが非重要人物パターンである。このとき、クラスタAAは、重要人物パターン●を代表パターンとして形成される。ただし、重要人物パターン●の分類を行った後に、その他人物の分類を行うため、クラスタBBのように別画像から抽出された同一人物の重要人物パターン●が複数存在する場合もある。
さらに、本手法では、重要人物である代表パターンが存在しない限り、クラスタは形成されない。同様の理由から、重要人物パターンが1つであってもクラスタCCは形成される。(図7(b))。
具体的な例として、ツアー旅行の写真において、撮影対象となっていないツアーメンバーは複数画像の背景中に含まれる可能性があるが、図7(b)中の領域71のような状態で、クラス化されない。しかし、1度しか撮影されていなくても、撮影対象となったツアーガイドさんはクラスタCCという情報を付与される。
実施形態2による例では、抽出された人物を人物別に分類を行う。また、人物ごと仮称を設定し、人物名とする(図8(a))。ただし、認証を行うことができない解像度の人物等のクラスは形成されない。また、この場合も、同一画像中に1人の人物が複数含まれる可能性は低いことから、画像1枚の中に含まれている複数の顔は必ず別クラスタとして分類できることになる。
さらに、このクラスタごとに重要人物の抽出を行う。図8中で実線の円で囲まれたクラスタは●が重要人物パターン、○が非重要人物パターンである。このとき、クラスタAAからは、重要人物パターン●を代表パターンとして抽出される。重要人物パターン●が1つでも検出されたクラスタは、重要人物として設定し、1つも検出されなかったクラスタは非重要人物とする。
なお、人物別の分類に関しては、例えば特開2003−76990号公報に記載の手法を用いてもよい。
これにより、抽出順に顔特徴を代表パターンとし、この顔特徴に類似する顔の検索を行い、検出された顔をもつ人物を同一人物として分類することができる。2人目以降の分類では、分類されていない人物を代表パターン及び検索対象とすることを繰り返し、被写人物の分類を行ってもよい。
次に、被写体テーブル作成部の処理について説明する。図9は、本発明による画像の画像分類装置における被写体テーブル作成部12、22の処理の一部を示す図である。
入力された画像(図9(a))について、まず顔検出を行う。次に、顔領域から、該顔領域を含む人物の個人識別情報、画像における該顔領域の割合、顔の向き、鮮明度、表情、年齢、性別等といった特徴を抽出する。また、人物領域から該人物の服装、姿勢等を認識する(図9(b))。個人識別情報は、個人に特有の特徴、例えば顔部位配置等から求める(図9(c))。
また、画像中の人物の顔の位置を識別し、画像中における位置情報とする。その際、画像を複数の領域に分け、顔領域がある面積以上を占めている領域を顔がある領域として識別し、該画像中の位置情報とする(図9(d))。
次に、画像分類装置における出力について説明する。図10、11は、本発明による画像の画像分類装置における出力の一例を示す図である。本発明による被写体分類の処理後は重要とされる被写人物毎に、画像情報や人物に付随する特徴が分類されている(図10)。したがって、これをもとに画像毎のインデクスを作成することも可能である(図11(a))。また、人物に付随する情報のいずれか1つをもとにディレクトリ分けできるものとする。
例えば、画像中に存在する人物ごとに分け、1人当たりのファイル数やサイズ等の管理を行うことができる(図11(b))。また、こうした情報をデータベース化して出力もよい(図11(c)(d))。
次に、画像検索時のユーザ入力画面について説明する。図12、13は、本発明による画像の画像分類装置を利用した画像検索時のユーザ入力画面の一例を示す図である。ユーザは画像検索依頼時に、検索キーワードを入力するが、対象となる画像は、まず被写体ごとの分類を行い、検索はその後に行うものとする(図12(a))。
画像検索依頼時、検索した画像群を入力すると同時に、図12(b)中の画面2において、検索したい画像の属するキーワードを入力する。ここで、人物に関するキーワード、撮像情報、例示画像といった検索項目を1つ以上任意に選択し、送信することによって検索条件の指定を行うものとする(画面2)。
検索結果はサムネイル画像を、図12(b)中の画面3のようにリスト表示してユーザに提示する(画面3)。
また、図12(c)は、画像検索時のキーワード指定画面の例を示す。例えば、はじめに人物画像の検索を行いたいか、人物以外の画像の検索を行いたいかを選択する(画面4)。
次に、画像を取得した日時が既知の場合には、画面5に示されるようなインターフェースを利用して、カレンダー等から日時指定入力を行う。画像中の人物構図が既知の場合にも、画像6に示されるように選択指定する。
さらに、特定の人が撮影されている画像が欲しい場合には、既存の画像中の人物の情報をもとに、例えば、画面7に示すように分類人物別のリストを作成しその人物を選択すると、選択された1人または複数の人物を含む画像データを表示させることができる(画面3)。
ここで使用する分類人物別のリストは、事前に登録を行わないため、人物の個人名ではなく、代表画像や同一人物としてクラスタリングされた画像クラスの仮名称とする。代表画像は、1つのクラスタを形成した際の代表パターンを使用して作成するものとする。複数の代表パターンが存在する場合には、いずれか1つの代表パターンとし、画像ファイル名のアルファベット順でもっとも早いもの等で決定してもよい。また、人物の表情、顔の向き、年齢、性別、。服装、姿勢等の情報が分かっている場合にも、同様の手段により選択入力できるものとする(画面8〜14)。
このとき、画面7〜14の情報は、画面6と関連付けて、人数に合わせて人物ごとの入力ができるものとし、人数分の反復処理を行う。これにより、2人写っている人物のうち、左側は30代女性、右側は10歳未満で赤い服をきてVサインをしている男の子、といった情報を入力することができる。
ただし、画面5〜14に示される人物情報は、既知の情報のみ使用することができるものとする。
なお、本発明は図1〜3に示した装置の一部又は全部の処理機能をプログラムとして構成してコンピュータを用いて実現すること、あるいは図4〜13で示した処理手順をプログラムとして構成してコンピュータに実行させることができる。また、コンピュータでその各部の処理機能を実現するためのプログラム、あるいはコンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、フレキシブルディスク、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることが可能であり、また、インターネットのような通信ネットワークを介して配布したりすることが可能である。
実施形態1を示す画像の画像分類装置の構成を示す図。 実施形態2を示す画像の画像分類装置の構成を示す図。 本発明における画像の画像分類装置の被写体テーブル作成部12、22の構成例を示す図。 画像の画像分類装置における重要被写体抽出部13、24の処理手順を詳しく示す図。 画像の画像分類装置における画像中の人物の重要度を決めるパラメータのユーザ入力画面の一例を示す図。 画像の画像分類装置における被写体テーブル作成部12、22で作成されるテーブルの一例を示す図。 画像の画像分類装置における入力パターンの分類例を示す図。 画像の画像分類装置における入力パターンの分類例を示す図。 画像の画像分類装置における被写テーブル作成部12、22の処理の一部を示す図。 本発明による画像の画像分類装置における出力の一例を示す図。 本発明による画像の画像分類装置における出力の一例を示す図。 画像の画像分類装置を利用した画像検索時のユーザ入力画面の一例を示す図。 画像の画像分類装置を利用した画像検索時のユーザ入力画面の一例を示す図。
符号の説明
11…被写体重要度設定部
12…被写体テーブル作成部
13…重要被写体抽出部
14…被写体種別分類部
15…被写体分類部
21…被写体重要度設定部
22…被写体テーブル作成部
23…被写体種別分類部
24…重要被写体抽出部
31…顔領域抽出部
32…人物領域検出部
33…テーブル作成部
34…顔領域面積取得部
35…鮮明度識別部
36…表情識別部
37…顔向き識別部
38…年齢識別部
39…性別識別部
40…服装識別部
41…姿勢識別部

Claims (3)

  1. 入力画像を該画像中の重要人物の判定に基づいて分類する画像分類装置であって、
    入力画像から人物の顔の領域及び前記人物の個人識別情報を抽出し、前記顔の領域が前記入力画像中に占める割合、前記顔の向き、前記顔の表情、前記顔の領域の鮮明度のいずれか複数の被写形態情報を取得する顔領域検出手段と、
    前記抽出された顔の領域毎に、前記被写形態情報それぞれに対し所定値による重要度の重み付けを行った和が所定の閾値より大きい場合に、前記顔の人物を重要人物と判定する重要被写体抽出手段と、
    前記重要被写体抽出手段により、重要人物と判定された人物を入力パターンとしてクラスタリングを行い、前記重要人物毎のクラスを作成する被写体種別分類手段と、
    前記被写体種別分類手段によって作成されたクラス毎に前記入力画像を分類する被写体分類手段と、
    を有することを特徴とする画像分類装置。
  2. 入力画像を該画像中の重要人物の判定に基づいて分類する画像分類方法であって、
    顔領域検出手段が、入力画像から人物の顔の領域及び前記人物の個人識別情報を抽出し、前記顔の領域が前記入力画像中に占める割合、前記顔の向き、前記顔の表情、前記顔の領域の鮮明度のいずれか複数の被写形態情報を取得する顔領域検出ステップと、
    重要被写体抽出手段が、前記抽出された顔の領域毎に、前記被写形態情報それぞれに対し所定値による重要度の重み付けを行った和が所定の閾値より大きい場合に、前記顔の人物を重要人物と判定する重要被写体抽出ステップと、
    被写体種別分類手段が、前記重要被写体抽出手段により、重要人物と判定された人物を入力パターンとしてクラスタリングを行い、前記重要人物毎のクラスを作成する被写体種別分類ステップと、
    被写体分類手段が、前記被写体種別分類手段によって作成されたクラス毎に前記入力画像を分類する被写体分類ステップと、
    を有することを特徴とする画像分類方法。
  3. 請求項1に記載の画像分類装置としてコンピュータを機能させるためのプログラム。
JP2003382303A 2003-11-12 2003-11-12 画像分類装置、画像分類方法、および、プログラム Expired - Fee Related JP4444633B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003382303A JP4444633B2 (ja) 2003-11-12 2003-11-12 画像分類装置、画像分類方法、および、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003382303A JP4444633B2 (ja) 2003-11-12 2003-11-12 画像分類装置、画像分類方法、および、プログラム

Publications (2)

Publication Number Publication Date
JP2005148900A JP2005148900A (ja) 2005-06-09
JP4444633B2 true JP4444633B2 (ja) 2010-03-31

Family

ID=34691414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003382303A Expired - Fee Related JP4444633B2 (ja) 2003-11-12 2003-11-12 画像分類装置、画像分類方法、および、プログラム

Country Status (1)

Country Link
JP (1) JP4444633B2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4510718B2 (ja) * 2005-08-09 2010-07-28 キヤノン株式会社 画像出力装置及びその制御方法
JP4844053B2 (ja) * 2005-08-31 2011-12-21 セイコーエプソン株式会社 画像選択装置および画像選択方法
JP2007122112A (ja) * 2005-10-25 2007-05-17 Fujifilm Corp 重要度設定装置および方法並びにプログラム
JP4738976B2 (ja) * 2005-10-25 2011-08-03 富士フイルム株式会社 重要度設定装置および方法並びにプログラム
JP2007164301A (ja) 2005-12-09 2007-06-28 Sony Computer Entertainment Inc 情報処理装置、データ解析方法、プログラム及び情報記憶媒体
JP4731303B2 (ja) * 2005-12-09 2011-07-20 株式会社ソニー・コンピュータエンタテインメント 画像表示装置、画像表示方法、プログラム及び情報記憶媒体
JP4808512B2 (ja) * 2006-03-01 2011-11-02 富士フイルム株式会社 カテゴリ重要度設定装置および方法、画像重要度設定装置および方法並びにプログラム
US8116573B2 (en) 2006-03-01 2012-02-14 Fujifilm Corporation Category weight setting apparatus and method, image weight setting apparatus and method, category abnormality setting apparatus and method, and programs therefor
JP2007272604A (ja) * 2006-03-31 2007-10-18 Omron Corp 情報処理装置および方法、並びにプログラム
JP4685712B2 (ja) * 2006-05-31 2011-05-18 日本電信電話株式会社 話者顔画像決定方法及び装置及びプログラム
JP4697106B2 (ja) * 2006-09-25 2011-06-08 ソニー株式会社 画像処理装置および方法、並びにプログラム
US8031914B2 (en) * 2006-10-11 2011-10-04 Hewlett-Packard Development Company, L.P. Face-based image clustering
JP4859057B2 (ja) * 2007-03-16 2012-01-18 株式会社リコー 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP4957462B2 (ja) * 2007-08-30 2012-06-20 セイコーエプソン株式会社 画像処理装置
US20100166303A1 (en) * 2008-12-31 2010-07-01 Ali Rahimi Object recognition using global similarity-based classifier
JP5200959B2 (ja) * 2009-01-27 2013-06-05 株式会社ニコン デジタルカメラ
US8121358B2 (en) * 2009-03-06 2012-02-21 Cyberlink Corp. Method of grouping images by face
US8531478B2 (en) 2009-03-19 2013-09-10 Cyberlink Corp. Method of browsing photos based on people
EP2528034B1 (en) * 2010-01-22 2019-03-06 Panasonic Intellectual Property Corporation of America Image management device, image management method, program, recording medium, and integrated circuit
JP2012073998A (ja) * 2010-08-31 2012-04-12 Casio Comput Co Ltd 画像配信システム、画像表示装置、画像配信サーバー、及びプログラム
CN102859525A (zh) * 2011-02-24 2013-01-02 松下电器产业株式会社 图像处理装置以及图像处理方法
JP6103826B2 (ja) * 2012-06-08 2017-03-29 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
CN104685861B (zh) * 2012-10-05 2018-08-21 索尼公司 内容获取装置、便携装置、服务器、信息处理装置及存储介质
KR102158751B1 (ko) * 2014-03-18 2020-09-22 에스케이플래닛 주식회사 사용자 장치, 그 제어 방법 및 컴퓨터 프로그램이 기록된 기록매체
JP6775308B2 (ja) * 2016-03-17 2020-10-28 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム
JP6742186B2 (ja) * 2016-07-28 2020-08-19 ヤフー株式会社 決定装置、決定方法、及び決定プログラム

Also Published As

Publication number Publication date
JP2005148900A (ja) 2005-06-09

Similar Documents

Publication Publication Date Title
JP4444633B2 (ja) 画像分類装置、画像分類方法、および、プログラム
JP6723909B2 (ja) 画像処理方法、画像処理装置、及びプログラム
EP1886255B1 (en) Using photographer identity to classify images
JP7286392B2 (ja) 画像処理装置、画像処理方法、及びプログラム
KR100601997B1 (ko) 인물기반 디지털 사진 클러스터링 방법 및 장치와 이를이용한 인물기반 디지털 사진 앨버밍 방법 및 장치
US8553949B2 (en) Classification and organization of consumer digital images using workflow, and face detection and recognition
JP4897042B2 (ja) 複数の画像の集合における固有のオブジェクトの識別
KR100996066B1 (ko) 얼굴화상 등록 장치, 얼굴화상 등록 방법, 및 기록 매체
CN106454064B (zh) 图像处理装置以及图像处理方法
US20170083756A1 (en) Apparatus, image processing method, and computer-readable storage medium
KR20180066863A (ko) 제어방법 및 기억매체
US20170078611A1 (en) Camera user input based image value index
JP2009533725A (ja) 画像コレクション間の接続の形成
JP2018097480A (ja) 画像処理装置、制御方法、及びプログラム
JP6529314B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2010211261A (ja) 画像検索装置及び画像検索方法
WO2020136795A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2012048400A (ja) オブジェクト認識装置およびその認識方法
US11783192B2 (en) Hybrid deep learning method for recognizing facial expressions
JP2010271861A (ja) オブジェクト識別装置及びオブジェクト識別方法
JP2018097481A (ja) 画像処理装置、制御方法、及びプログラム
JP2005250712A (ja) 人物属性識別方法およびそのシステム
JP2024045460A (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
JP6606374B2 (ja) 画像処理装置および方法およびプログラム
JP5933396B2 (ja) 画像分類装置、画像分類方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060406

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100112

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100114

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees