JP2010521024A - 階層的クラスタリングによる代表画像選定 - Google Patents

階層的クラスタリングによる代表画像選定 Download PDF

Info

Publication number
JP2010521024A
JP2010521024A JP2009550913A JP2009550913A JP2010521024A JP 2010521024 A JP2010521024 A JP 2010521024A JP 2009550913 A JP2009550913 A JP 2009550913A JP 2009550913 A JP2009550913 A JP 2009550913A JP 2010521024 A JP2010521024 A JP 2010521024A
Authority
JP
Japan
Prior art keywords
cluster
image
group
feature
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009550913A
Other languages
English (en)
Other versions
JP2010521024A5 (ja
JP5261724B2 (ja
Inventor
アンドリュー シー ブローズ
アレクサンダー シー ルイ
Original Assignee
イーストマン コダック カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン コダック カンパニー filed Critical イーストマン コダック カンパニー
Publication of JP2010521024A publication Critical patent/JP2010521024A/ja
Publication of JP2010521024A5 publication Critical patent/JP2010521024A5/ja
Application granted granted Critical
Publication of JP5261724B2 publication Critical patent/JP5261724B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本方法では、コンピュータを利用し代表画像を求めるに当たり、画像レコードを時空間情報に基づき分類し、そのグループ毎にレコードをクラスタに振り分け最上位階層のクラスタを認定する。その振分は、そのレコードが階層構造上で上位の有特徴クラスタに係る突出特徴のうちいずれかを有しているならそのクラスタに、またそのクラスタに係る突出特徴は有していないがより下位の有特徴クラスタに係る突出特徴のうちいずれかを有しているなら後者のクラスタに、そしてそれらのクラスタに係るどの突出特徴も欠くなら残り物クラスタに、という要領で、有特徴クラスタ毎に一種類又は複数種類、都合複数種類ある所定の突出特徴に基づき行う。そして、そのグループの最上位クラスタが有特徴クラスタならそのクラスタの突出特徴に基づき、また残り物クラスタならどの突出特徴とも無関係に、そのグループのレコードから代表画像を選定する。

Description

本発明はディジタル画像の整頓及び管理、特に階層的クラスタリング(hierarchical clustering)による代表画像選定に関する。
ディジタルスチルカメラ、ビデオカメラ、カメラ付携帯電話等のランダムアクセス型ディジタル撮像装置を使用して画像を撮影した場合、その画像のデータ(ディジタル画像)はひとまずその装置内に保存され、ユーザからの指示を待ってパーソナルコンピュータ(PC)のディスク乃至メモリ上又はオンラインストレージ上に移されるのが普通である。撮像装置内の画像やPC上/オンラインストレージ上にある画像は、ユーザ自身のマニュアル操作や自動処理によって、アルバム、フォルダ等と呼ばれる“入れ物”に入れて整頓することができる。更に、画像の“入れ物”に他の“入れ物”を入れ子にすることで、ディジタル画像群を階層的に整頓することができる。なかでも、誕生会、祝日パーティ等のような実生活上のイベントに従い画像を整頓するやり方が、多くのディジタル写真撮影者に常用されているやり方である。
その階層的ディジタル画像群から目的とする画像を探してブラウズすることができるようにするため、ディジタル撮像装置、PC、オンラインストレージ等で稼働するファイルシステム、画像整頓用ソフトウェア等では、種々の画像の内容をアイコンやサムネイルで表示させることが多い。特に、サムネイルはその画像群を代表する画像の縮小画像であるので、その画像群が多数の画像を含んでいる場合でも、ユーザは対応するサムネイルの外観からその画像群の内容及びそれにまつわるイベントを知ることができる。こうした点で、サムネイル表示は画像群名表示やアイコン表示より重宝である。また、サムネイルの基になる画像は、その画像群を代表する画像という意味で、代表画像(representative image)又はキー画像(key image)と呼ばれる。動画を構成する複数個のフレームを代表するフレームは、同様の名称のほか、キーフレーム(key frame)等の名称でも呼ばれる。
また、ディジタル静止画データ、動画データ、マルチメディアデータ等を包括する用語としては画像レコード(image record)なる用語が知られている。画像レコードとディジタル画像との関係は1対1に限られず、1個の画像レコードに複数個のディジタル画像が含まれることもある。更に、画像レコード中に画像以外のデータ、例えば音声又はテキストによる注釈を表現するメタデータが含まれることもある。画像レコードと画像データファイルとも関係も1対1に限られず、1個の画像レコードを複数個のデータファイルに分割して保存しそれらを相互に関連付ける処置を執ることもある。メタデータを対応するディジタル画像と同一のファイルに入れることもあるし別のファイルにすることもある。多スペクトラム画像、スキャナレスレンジ画像、ディジタルアルバム内頁画像、マルチメディアプレゼンテーション用動画等も画像レコードとして扱える。動画データの場合、その動画データ全体を1個の画像レコードとして扱えるほか、その動画データを構成する個々のフレーム(静止画)のデータも各1個の画像レコードとして扱える。そして、本願ではディジタルカメラで撮影された画像レコードを主たる例にして説明を行うが、ディジタルカメラ以外の撮像装置で撮影したものや、写真フィルムで撮影してディジタル化したものも、画像レコードとして扱うことができる。即ち、本願では、ディジタル的に保存された画像データ(及びそれに随伴する情報)のことを画像レコードと呼んでいる。
ユーザの多くは、こうした画像レコードをエピソード別に、即ち出来事別に収集する。その分類の際にも、日時、場所等の時空間情報を利用するか、一歩進んでイベント及びそのサブイベントに着目することで、エピソード別の分類を行うことが多い。イベント及びサブイベントに着目するやり方は多くのユーザにとって至便であるが難点もある。例えば、複数個の画像レコードにて形成されるグループ及びそのサブグループの主題を、その分類のされ方から察知できない場合がある。適切な画像が代表画像に選ばれていれば、その画像からそのグループ乃至サブグループの主題を察知することもできようが、そうした画像を決めるのは結構面倒なことである。無論、同様の被写体が写った画像ばかりを集めてグループ乃至サブグループを形成すれば、そのグループ乃至サブグループ内のどの画像も、そのグループ乃至サブグループの代表画像になりうる。例えば、新生児写真ばかり集めたグループなら、どのグループ内写真にも新生児が写っているので、どのグループ内写真もそのグループの代表画像として使用することができる。但し、これは例外的なことである。
そのため、一般に、グループ内筆頭画像レコードをそのグループの代表画像とする方式が採られている。ただ、筆頭にあるといっても、通常はその撮影時期が最も古いというだけであるので、グループ内諸画像の由緒や内容を的確に表しているとは限らない。例えば、実際にそのイベントが始まる前に、使用するカメラの調子を確かめるため画像を撮影したとする。そうした試し撮り画像はグループの筆頭にくることが多いが、試し撮りでは何を撮影してもよいので、その画像に写っている事物がそのイベント本番での撮影内容と関係があるとは限らない。また、イベント自体が長時間に亘る場合、そのイベントの初っぱなに撮影されたためそのイベント全体の設定や流れを正しく反映していない画像が、そのグループの筆頭にきてしまうこともある。
なお、特許文献8(発明者:Savakis et al.)に記載の方法では、画像を複数のグループに分類してそのグループの代表画像を決定する際に、そのグループに属する画像の内容(意味的(semantic)突出特徴)を利用している。特許文献7(発明者:Qian et al.)に記載の方法では、動画を解析することによって意味的突出特徴等の突出特徴(saliency feature)を調べて要約文を生成している。これらの方法はいずれも有益なものであるが、おしなべて、それを実行するための情報処理が多量且つ複雑になりがちである。
米国特許第6282317号明細書(B1) 米国特許第6351556号明細書(B1) 米国特許第6606411号明細書(B1) 米国特許第6654506号明細書(B1) 米国特許第6661907号明細書(B2) 米国特許第6697502号明細書(B2) 米国特許第6721454号明細書(B1) 米国特許第6847733号明細書(B2) 米国特許第6915011号明細書(B2) 米国特許第7035456号明細書(B2) 米国特許第7062085号明細書(B2) 米国特許第7162102号明細書(B2) 米国特許出願公開第2003/0128389号明細書(A1) 米国特許出願公開第2003/0210808号明細書(A1) 米国特許出願公開第2004/0179719号明細書(A1) 米国特許出願公開第2006/0104520号明細書(A1) 米国特許出願公開第2006/0126944号明細書(A1) 米国特許第6360234号明細書(B2) 米国特許第6463444号明細書(B1) 米国特許第6549643号明細書(B1) 米国特許第6567980号明細書(B1) 米国特許第6738100号明細書(B2) 米国特許第6807306号明細書(B1) 米国特許第6833865号明細書(B1) 米国特許第6877134号明細書(B1) 米国特許出願公開第2003/0048950号明細書(A1) 米国特許出願公開第2005/0033758号明細書(A1)
"An automatic facial feature finding system for portrait images", by Bolin and Chen in the Proceedings of IS&T PICS conference, 2002
本発明の目的の一つは、上述した如き難点がない方法及びシステムを提案することにある。
本発明の構成は別紙特許請求の範囲に記載の通りである。その好適な実施形態は、撮影により得られた1個又は複数個のディジタル画像をそれぞれ含む画像レコードの集まりである画像レコード群について、その画像レコード群の代表画像を求める方法及びシステムである。その実施形態では、まず、それらの画像レコードを時空間情報に基づき複数のグループに分類する。次いで、その画像レコードが階層構造上で比較的上位の有特徴(feature)クラスタに係る一種類又は複数種類の所定の突出特徴のうちいずれかを有している場合は当該比較的上位の有特徴クラスタに、また当該比較的上位の有特徴クラスタに係る突出特徴は有していないが階層構造上でより下位の有特徴クラスタに係る一種類又は複数種類の所定の突出特徴のうちいずれかを有している場合は当該より下位の有特徴クラスタに、そしてそれら複数個の有特徴クラスタに係る都合複数種類の突出特徴をいずれも有していない場合は残り物(remainder)クラスタに、という要領で、各グループの画像レコードを、その突出特徴に基づき、有特徴クラスタ複数個及び残り物クラスタからなり階層構造を形成する一群のクラスタに振り分ける。更に、グループ毎に、そのグループに存するクラスタのなかで最上位階層のクラスタを以てそのグループの最上位(highest)クラスタと認定する。そして、そのグループの最上位クラスタが有特徴クラスタである場合はその最上位クラスタに係る突出特徴に基づき、またそのグループの最上位クラスタが残り物クラスタである場合は上記突出特徴のいずれとも無関係に、各グループの代表画像をそのグループを構成する画像レコードのなかから選定する。
即ち、本発明の好適な実施形態に係る方法及びシステムによれば、画像レコードのグループからそのグループを代表する画像レコードを、そのための処理の難度をそのグループに属する画像レコードの種類に相応するレベルに抑えながら、効率的に選定することができる。
一例手順を示すフローチャートである。 一例システムを示す模式図である。 別例システムを示す模式図である。 画像群のイベント別及びサブイベント別グループ化を示す図である。 図1に示した手順のうち振分ステップを示すより詳細なフローチャートである。 図1に示した手順のうち認定ステップ及び選定ステップを示すより詳細なフローチャートである。
以下、本発明の好適な実施形態に関し別紙図面を参照しつつ説明する。これを参照することにより、上記以外のものを含め本発明の諸特徴、諸目的及びその実現形態を、より好適に理解することができよう。
これから説明する方法及びシステムでは、時空間情報に基づき画像レコードを複数のグループに分類し、各グループの代表画像をそのグループの画像レコードのなかからある有限個数の突出特徴に基づき選定する。こうした手法を採るのは、その主題が異なる様々な場面で撮影した画像を、場面毎の主題の違いを無視してひとまとめにしてしまうことがしばしばあるからである。例えば、祝日パーティに人物写真を撮影し又は他人からそれをもらい、それらの人物写真だけをより分けておくことがある反面、休暇中に撮影した風景写真の大半をひとまとめにしてしまうことも多いものである。そうした雑多な写真のなかから代表画像を選定するには、それらの写真のコンテンツを意味論的に詳細に解析し、特定の撮影場面の総体的主題に基づき代表画像を決めるようにすればよいが、そうしたやり方を採ると情報処理負荷が非常に重くなってしまう。これは、どういった種類の画像レコードでも概ね同様であり、一般に、解析対象が多ければ多いほど上昇処理負荷は重くなる。なお、便宜上以下の説明では各画像レコード中のディジタル画像が1個であるとするが、そうした構成を採らない画像レコードについても以下と同様の説明が成り立つ。例えば、複数個のフレームから構成される動画であれば、各フレームを個別のディジタル画像と見なし、フレーム毎に処理を繰り返せばよい。
また、突出特徴とは、人間の介在無しでその画像のデータから導出できる客観的画像特性のことである。これには意味的突出特徴と構造的(structural)突出特徴がある。意味的突出特徴の方は、その画像に情報として含まれている個々の事物の意味、特にその画像を閲覧した人間がその事物の意味として理解するであろうものに相応している。例えば、人間の目に“一対の目”として映るような光陰パターンがある画像中に存している場合、“一対の目が写っている”という意味的突出特徴がその画像に備わっていると称することができる。意味的突出特徴のなかには、サイズ、場所等といった条件乃至制約を伴うものもある。更に、意味的突出特徴が往々にして比較的複雑な情報処理で導出される特徴であるのに対し、構造的突出特徴の方はその画像に備わる特性のなかでも比較的簡単な情報処理で導出できるものであることが多く、意味的突出特徴と違いその画像を見た人が直ちに理解できる情報に相応しないことが多い。また、ある光景にある特定の主題が存していること等は、例えば既存の画像処理アルゴリズム及び画像解釈アルゴリズムを用い迅速に識別することが可能である。本願では、更に突出特徴同士の組合せのことも突出特徴と呼ぶ。その組合せを形成している突出特徴のなかに1個でも意味的突出特徴が含まれていれば、その組合せたる突出特徴も意味的突出特徴になる。特許文献1(出願日:1998年12月31日、発明者:Luo et al.)に記載の方法等では、主被写体(main subject)に備わる組合せ的意味的突出特徴を自動判別するのに、肉体、顔、空、草等の意味的突出特徴を、色、模様、輝度等の構造的突出特徴と併せ利用している。
そして、以下の説明では、幾つかの部材をソフトウェア(プログラム)で実現した例を示しているが、本件技術分野で習熟を積まれた方々(いわゆる当業者)には自明な通り、ソフトウェアではなくハードウェアによってそうした部材を実現することもできる。また、画像を取り扱うためのアルゴリズムやそれを実行できるシステムは周知であるので、本願では本発明の実施形態に係る方法を構成し又はそれと密接に関連するアルゴリズム及び要素に重点を置いて説明を行っている。即ち、本発明の実施形態に係る方法は周知な要素で構成されている周知のコンピュータシステムで実施することができるので、本願ではそうしたシステム及び構成要素のうち当該方法と直に関連するものを中心に説明を行っている。例えば、画像信号の生成乃至処理に関わるアルゴリズム、装置、ハードウェア乃至ソフトウェアのうち、本願中に具体的な記載や説明がないものについては、本件技術分野で既知のシステム、アルゴリズム、部材乃至要素のなかで相応しいものを選べばよい。いわゆる当業者であれば、本願での説明を参照し、本願記載のものとは異なるソフトウェア/ハードウェアを使用又は追加し本発明を実施することができよう。
図2にシステム構成の一例を示す。このシステムは、ハウジング22、画像群記憶用のメモリ24、プロセッサ26、並びにそのプロセッサ26に接続されている入力ユニット28及び出力ユニット30を備えている。このシステムのユーザインタフェースはユニット28,30又はその一部により形成されており、例えばユニット28のうち何個かにはユーザ操作部、ユニット30のうち1個にはディスプレイを使用している。また、この図示例では、構成要素間を接続する信号経路及びその信号経路によって接続される諸構成要素がハウジング22内に収まっているが、信号経路や構成要素のうち何個かが部分的に又は丸ごとハウジング外にある形態のシステムにすることもできる。例えば図3に示す別例では、汎用コンピュータに様々な周辺機器を接続することによってシステムが構成されている。更に、システムを構成する様々な部材を互いに全く別体にしてもよいし、同一のハードウェア乃至ソフトウェアをシステム構成部材間で共用するようにしてもよい。
まず、プロセッサは、所与のソフトウェア及びデータに基づき動作し、入力ユニットから供給される信号に応じて他のシステム構成部材を稼働させる。プロセッサとしては、ディジタルコンピュータ、マイクロプロセッサ又はロジックプロセッサ等のプログラマブルなデバイスや、一群の電子回路、それを集積回路化したもの又は一群のディスクリート部品を使用する。
プロセッサは、システム稼働に必要な諸機能を提供するほか、メモリ上に格納されているプログラムに従い、且つ自動的に又はユーザの指令に応じ、画像の操作を実行する。実行される操作の例としては、まず、ディジタル静止画像に補間やエッジ強調を施すディジタル信号処理がある。次に、グレースケール、色域、白バランス等、ディスプレイ仕様に適合するよう画像を調整乃至加工する操作がある。更に、表示画像をクロッピングし、或いはその解像度又はコントラスト値を落とす等、画像データの一部が表示されないようにする操作がある。ファイル転送に関連する変形、例えばJPEG圧縮やファイルフォーマット変更といった操作もある。そして、これ以外の種類の画像変形乃至強調を施すこと、例えばメタデータ等の非画像情報をその画像に追加又は修正することもできる。
メモリは、半導体メモリ、磁気メモリ等の物理メモリ上で提供される適当なサイズの論理ユニット(群)である。本システムでは、コンピュータ可読記録媒体等に格納されているコンピュータプログラム乃至そのユニットをそのメモリ上にロードして実行する。データを格納しうるデバイスであればその種類を問わないので、固体メモリ、磁気メモリ、光学メモリ等、既知のあらゆる種類のメモリを使用することができる。システム内固定配設型でもリムーバブル型でもよい。従って、メモリとしては、SDRAM、フラッシュEPROM等の内蔵型メモリデバイスの他に、CF(Compact Flash)カード、SD(Secure Digital)カード、PCカード、MMC(MultiMedia Card)等のようにソケットに差しメモリインタフェース経由でプロセッサに接続するリムーバブルメモリカードや、内蔵型ハードディスク、外付け型ハードディスクドライブ等のリムーバブルディスクも使用可能であり、更にはそれらの併用も可能である。例えば図3に示すシステムでは、ハードディスクドライブや、光ディスク、磁気ディスク等のディスク型メモリに対応しているリムーバブルディスクドライブ(図示せず)や、リムーバブルメモリカード等のリムーバブルメモリが随時装填されるメモリカードスロット(及びそのリムーバブルメモリと交信すべく搭載されているリムーバブルメモリインタフェース)を、使用することができる。更に、制御プログラム、ディジタル画像、メタデータ等の画像乃至非画像情報を記憶させるメモリとしてリモートメモリ、即ちPC、コンピュータネットワーク等のディジタルシステム上に遠隔配設されているメモリも使用可能である。
入力ユニットはユーザから情報を受け取りプロセッサで利用可能な形態に変換する装置乃至トランスデューサであり、出力ユニットは人間が知覚可能な信号やコンピュータ可読な信号乃至プログラムといった形態で情報を出力する装置である。入力ユニット及び出力ユニットとして使用できる装置には多様な種類があり、ローカルに配設することもリモート配設することもできる。入力ユニット乃至出力ユニットを構成するハードウェア乃至ソフトウェアが参加する有線又は無線通信システムを、システム内に設けてもよい。
入力ユニットとしては、第1に、様々な方式のユーザインタフェースを形成するユニットがある。例えば、タッチスクリーン入力、タッチパッド入力、4ウェイスイッチ、6ウェイスイッチ、8ウェイスイッチ、スタイラス、トラックボール、ジョイスティック、音声認識、ジェスチャ認識、キーボード、リモートコントローラ等のシステムである。入力ユニットとしては、第2に、本システムが置かれている環境の状態を検知しその結果をプロセッサで利用可能な形態に変換するセンサとして機能するものがある。本件技術分野ではその種のセンサとして光センサ、音響センサ、バイオメトリックセンサ等が知られており、本システムではそれらのセンサを適宜併用することもできる。光センサとは、通常のカメラや、多スペクトラムセンサや、それらの任意の組合せのことである。音響センサは音響を捉えることが可能なセンサである。バイオメトリックセンサは、不随意的な心身反応を計測するタイプのセンサであり、音声抑揚センサ、身体運動センサ、眼球運動センサ、瞳孔散大センサ、体温センサ、p4000波センサ等がこれに該当する。
出力ユニットはディスプレイ、プリンタ、メモリライタ等の装置である。プリンタとは記録媒体上に画像を記録する装置のことであり、本システムでは既知の様々な方式のプリンタを使用することができる。例えば、原色別四色オフセット印刷をはじめとする接触方式や、シルクスクリーン方式、乾式電子写真方式、サーマル印刷方式、ドロップオンデマンドインクジェット方式、連続インクジェット方式等のプリンタである。使用できる乾式電子写真方式プリンタの例は、米国ニューヨーク州ロチェスター所在のEastman Kodak Companyにより市販されているNexPress(登録商標)2100である。以下の説明では記録用紙上にカラー画像を発現させるタイプのプリンタを採り上げるが、本発明の方法及び装置にとってこれは必須な事項ではなく、例えば白黒画像、グレースケール画像、セピアトーン画像等の単色画像を印刷するタイプのプリンタや、紙以外の媒体上に印刷するタイプのプリンタでも、その実施には特に支障がない。
通信システムとしては、画像等のデータをリモートメモリ、リモートディスプレイ等のリモートデバイスへと搬送可能な光信号、無線周波数信号等の信号形態へと変換する光トランスデューサ、無線周波数トランスデューサ等の回路乃至回路群や、図示しないホスト乃至サーバコンピュータ乃至ネットワーク、リモートメモリシステム乃至リモート入力装置等からディジタル画像等のデータを受信する回路乃至回路群や、その双方を有するシステム等を使用する。プロセッサ26は、この通信システムで受信された信号から情報や指令を抽出することや、その通信システムを介し通信網に接続してリモートメモリ等と通信することができる。使用できる通信網例えば既存の遠隔通信/データ伝送網には、インターネット、セルラ、ピアトゥピア等の形態によるモバイル通信網、有線LAN(local area network)、無線LAN等のローカル通信網、従来からある他の種類の有線乃至無線データ伝送システム等、様々な種類がある。
そして、本システムに対する画像レコードの供給源としては、適切なディジタルデータをプロセッサに供給可能な様々な種類の(電子)回路乃至システム、例えば画像レコードを構成する画像データを撮影によって取得するカメラ等の撮像装置や、他の装置で撮影され又は調達された画像レコードを取得する装置を、使用することができる。後者の例としては、種々のドッキングステーションや、随時接続される外部ディジタル撮像乃至表示機器や、無線通信システムとの接続手段や、無線通信網との無線接続に利用できる携帯電話乃至無線ブロードバンドトランシーバや、それらの組合せ等がある。その他の例としては、ケーブル通信網に接続するためのケーブル接続手段や、衛星通信システムに接続するためのdish(商標)衛星受信機や、リモートサーバ上のリモートメモリに接続するためのインターネット接続手段や、光ディスク上に記録されている画像へのアクセスに使用可能なディスクプレイヤ/レコーダがある。
次に、本発明のコンピュータ利用実施形態について説明する。これから説明する実施形態では、ディジタルカメラ等の撮像装置乃至周辺装置を1個又は複数個、またPC等のコンピュータを1台又は複数台使用し、本発明に係る方法を実施可能なシステムを構成している。図3に、その種の実施形態に係るコンピュータシステム110を示す。本システム110は、図中デスクトップPCの本体として描かれているプロセッサ112や、それに接続されているディスプレイ114、キーボード116、マウス118等を有している。プロセッサ112は、プログラムを読み込み実行する等、種々の処理及び制御機能を担っている。ディスプレイ114は、そのプログラムの実行に伴い発生する情報のうち、ユーザに提示すべき情報を、例えばGUI(graphical user interface)を用いて表示する。キーボード116及びマウス18は、そのプログラムを実行させるべく必要な情報を入力する際、ユーザが操作する装置である。例えば、マウス118を操作することで、本件技術分野にて周知の通り、ディスプレイ114の画面上でカーソル120を動かすことができ、またそのカーソル120でポイントされている項目を選択することができる。なお、便宜上、図2と図3では異なる参照符号が使用されているが、符号が違っていても名称が同じなら同様の機能を有するものと理解されたい。また、このシステム110は本発明の好適な実施形態に係るものである。即ち、本発明は、このシステム110と異なるタイプの電子情報処理システムでも実施することができる。そうしたシステムの例としては、ディジタルカメラ、カメラ付携帯電話等のモバイルデバイスに内蔵されているシステムや、ホームコンピュータシステムや、現像サービススタンド(キオスク)、現像サービス店、写真仕上げ工場等にある写真仕上げシステム等がある。ディジタル画像処理機能を有するものならどのようなシステムでもよい。
リムーバブルメモリとしては様々な形態のものを使用できるが、この図ではCD−ROM124、フロッピー(商標)ディスク126及びメモリカード130が例示されている。それらのうちCD−ROM124はCD(compact disk)の形態を採るROM(read only memory)である。例えば、プログラム等の情報が格納されているCD−ROM124をマイクロプロセッサベースのユニットに挿入することで、そのユニットを構成するプロセッサにプログラムやデータをロードすることができる。データの書き込み先としては、ディスク126、カード130等を含め、複数種類のリムーバブルメモリのなかから適当な種類のものを選んで使用することができる。メモリとしては、この他、有線又は無線接続を介し直接に或いはLANや広域網(インターネット等)経由でアクセス可能な外付けメモリを、利用することもできる。プロセッサ112をLAN、インターネット等の外部ネットワークに接続するには、電話回線、無線リンク等のネットワーク接続手段127を使用すればよい。そして、本件技術分野で周知の通り、プロセッサ112自体にプログラムを書き込んでおくこともできる。
画像データを入力する手段としては、CD−ROM124、フロッピー(商標)ディスク126、メモリカード130、ネットワーク接続手段127、ディジタルカメラ134等を使用している。例えば、画像を表すディジタルデータが電子的に書き込まれているカード130を、プロセッサ112又はそれに接続されている外付け型のカードリーダ132に差し込むことで、その画像データをそのプロセッサ112に入力することができる。また、こうしてCD−ROM124、ディスク126、カード130等のリムーバブルメモリから或いは接続手段127経由で入力される画像データは、元々はディジタルカメラ、スキャナ等といった画像データ源から供給されたものである。そうした画像データ源、例えばディジタルカメラ134からプロセッサ112へと直に画像データを入力するには、そのカメラ134を、そのプロセッサ112に接続されているカメラドッキングポート136に接続してもよいし、接続用ケーブル138でプロセッサ112に接続してもよいし、無線伝送路138を経由してプロセッサ112に接続してもよい。ディスプレイ114の画面上には、入力された画像データに基づき画像を可視表示させることができる。
プロセッサ112には、更にプリンタ等の出力装置128も接続されている。これは、本システム110から変換処理後の画像等を得るための装置である。例えば、画像に適当な変換処理を施した上で紙等の媒体上にその画像を印刷即ちハードコピーして出力するプリンタや、そうした画像をディジタルファイルの形態で出力する装置や、それらハードコピー出力及びファイル出力の両機能を併有する装置等を、装置128として使用する。ファイル出力先媒体としては、パーソナルメディアプレイヤ、フラットパネルテレビジョン受像機等、様々な種類の家庭用・個人用視聴機器で再生可能な記憶ユニット、例えばCD、DVD(登録商標)等を使用する。
そして、プロセッサ112では、ディジタル画像に対する処理を実行する。その目的の一つは、多々ある出力装置のうちの指定された出力装置、例えばディジタル写真プリンタやソフトコピーディスプレイで印刷、表示等される画像の見栄えをよくすることである。即ち、プロセッサ112では、その出力装置から出力される画像がより見栄えのする画像になるよう、ディジタル画像を処理してその画像の輝度、階調スケール、構図等を総合的に調整する。なお、いわゆる当業者には自明な通り、本発明はこうした画像処理機能の子細により限縮解釈されるべきものではない。
次に、本発明のカメラ依拠実施形態について説明する。これは、図2に基づき概説したシステムをカメラ内に構築したものである。本カメラは、その筐体内又は筐体上に種々の部材を実装し、それらの部材をその筐体で構造的に支持及び保護する構成を採っている。支持乃至保護される部材の一つは電子撮像ユニットである。これは、撮像用のレンズや、そのレンズに対して位置決めされている電子式のイメージセンサアレイを備えるユニットである。電子撮像ユニットでは、イメージセンサアレイで電子的に捉えた画像に増幅、A/D(analog-to-digital)変換等の処理を施し、1個又は複数個の画像レコードを生成する。
本カメラは、ユーザインタフェースを形成する入出力部材として、ユーザ(撮影者)向けに画像を表示する画像表示用ディスプレイのほか、ユーザによる情報入力のためのユーザ操作部を1個又は複数個備えている。ユーザ操作部とは、シャッタのレリース、レンズユニットによるズームイン/ズームアウト等を制御するためユーザが操作する部材のことであり、ボタン、ロッカースイッチ、ジョイスティック、ロータリダイアル、タッチスクリーン、ユーザ発音声指令認識用マイクロホン/プロセッサ、それらの組合せ等で形成されている。ユーザ発の方法を受け取る部材としては、こうしたユーザ操作部の他に、イメージセンサ、ガルバニックレスポンスセンサ、音声指令認識用マイクロホン等、ユーザの反応を捉えてその情報を暫時保存するユーザ反応追跡器を設けることができる。こうしたユーザ反応追跡器で得られた情報を、同じくそのユーザインタフェースを形成しているユーザ反応解析モジュールによって解析することによって、適切なメタデータを生成することができる。ユーザ反応追跡によるメタデータ生成については特許文献13(発明者:Matraszek et al.)の記載を参照されたい。
本カメラは、画像表示用ディスプレイの他に情報表示用ディスプレイを1個又は複数個備えている。ユーザ(撮影者)は、情報表示用ディスプレイの画面を見ることで、露光レベル、残り撮影可能枚数、電池残量、フラッシュ状態等のカメラ状態情報を得ることができる。更に、カメラ設定等の非画像情報は、情報表示用ディスプレイに限らず画像表示用ディスプレイにも表示させることができる。例えば、画像表示用ディスプレイのGUIを利用しメニューを表示させることができる。ユーザは、そのメニューに含まれるオプション、例えば撮影済画像閲覧モードについてのオプションのなかから、任意のものを選択することができる。更に、画像表示用ディスプレイと類似乃至共通する機能を有するディジタルビューファインダディスプレイ(図示せず)を設けることもできる。ディジタルビューファインダディスプレイか画像表示用ディスプレイの一方で足りるなら他方を省略してもよい。以上のほか、ユーザインタフェースを形成する部材としては、音声入力用のマイクロホンや音声出力用のスピーカ(いずれも図示せず)等を設けることができる。
本カメラは、外光条件等の環境条件を調べてシャッタ速度、絞り設定等の光景パラメタを決定する機能を有している。環境条件はイメージャ等のセンサで調べることができる。画像表示用ディスプレイの画面上には、その設定下で得られた光像をユーザ向け表示画像として発現させることができる。
本カメラは、露光制御要素等のカメラ構成部材を制御乃至調整し、画像や信号の伝送を司り、またその画像に関わる処理を実行するプロセッサを備えている。このプロセッサは、システムコントローラ、タイミング発生器、アナログ信号プロセッサ、A/Dコンバータ、ディジタル信号プロセッサ、専用メモリ等の部材を内蔵又は随伴しており、先に説明したプロセッサと同じく、単体のデバイスとして構成することも複数のデバイスで形成することも可能である。例えば、データ操作用及び一般プログラム実行用のRAMを有する内蔵型マイクロプロセッサ等、相応の構成を有するマイクロプロセッサを、このカメラのプロセッサとして用いるとよい。プロセッサは、所与のプログラムを実行することによって、自分につながっている種々のユーザインタフェース形成部材を稼働させ、またドライバ、メモリ等の部材も稼働させる。カメラを構成する種々の電子部品の動作タイミングは、タイミング発生器からの制御信号に従い揃えることができる。
そして、本カメラは、撮影で得られた画像データについての補足的な情報を取得する手段を備えている。具体的には、方向/姿勢センサや、リアルタイムクロックや、GPS(global positioning system)受信機や、ユーザによる表題等の情報入力に使用できるキーパッド等の入力装置である。
加えて、本発明の諸実施形態に係る方法及び装置では、上記以外のソフトウェア乃至ハードウェアも使用する。特に、データ検知/整理用のソフトウェア/ハードウェアである。例えば、顔検知、肌検知、人物検知等の被写体検知を行えるソフトウェア/ハードウェアは、バースデイパーティの写真に写っているバースデイケーキを検知する等、画像に写っている光景の解釈や、医用画像に写っている特定の身体部分を調べる等、画像の精査に使用することができる。
なお、本願に記載されているどの回路もいわゆる当業者にとり周知の様々な手法に従い変形可能であることや、本願中で実体のある回路として説明されているどの部材もファームウェア、ソフトウェア或いはその組合せに置換可能であること等を、ご理解頂きたい。本願中で互いに別体のユニットとして構成されている部材を全体的又は部分的に一体化させることや、種々の部材を互いに別々の場所に分散して配置することもできる。
また、画像ファイルを自動パターン分類に供する際に、本発明では、ルールベースシステム、意味知識ネットワーク、フレームベース知識システム、ニューラルネットワーク、ファジー論理ベースシステム、遺伝的アルゴリズム機構、ヒューリスティックベースシステム、その任意の組合せ等の技術を使用することができる。但し、特に明示のない限り、自動パターン分類にどのような手法を用いるかに関して本発明を限縮解釈すべきでないことを、ご理解頂きたい。
更に、本願におけるディジタル画像は、複数個の画素を行列配置した二次元画素アレイとして捉えることができる。個々の画素はそれぞれある物理的空間に対応しており、その画素値は撮像装置がその空間から受光した光量に相応している。複数のチャネルを有する画像、例えばレッド、グリーン及びブルーの各色成分(チャネル)からなるカラー画像の場合は、そのチャネル毎に二次元画素アレイが形成される。動画は、一群のディジタル画像のシーケンスで表現することができる。但し、いわゆる当業者にはご理解頂けるように、本発明は、どのような用途に係るディジタル画像乃至チャネルにも適用することができる。例えば、本願では画素群を二次元アレイ状に行列配置したもので説明を行っているが、本発明は非矩形画素アレイに対しても遜色無しに適用することができる。
また、念のために述べると、本発明は、ソフトウェアでも、ハードウェアでも、その組合せでも、実施することができる。装置間の物理的な接続形態の如何や、諸装置の配設場所の異同には影響されない。例えば、図2及び図3に示した諸装置のうち1個又は複数個を他の装置とは別の場所に配置しネットワーク経由で接続するようにしてもよい。部材間の接続を無線接続、例えば直接の又はネットワーク経由での無線周波数リンクによる接続にしてもよい。
更に、本発明は様々な利用環境及び設備で採用することができる。その例としては、写真仕上げ工場、現像サービス店、家庭内のデスクトップコンピュータ、職場にあるコンピュータ、現像サービススタンド、モバイルデバイス、(インターネットや携帯電話通信網等を介し接続できる)ネットワーク上のサービスサイト等がある。
そして、表示機能のある可搬型の装置、例えばDVD(登録商標)プレイヤ、PDA(personal digital assistant)、カメラ、携帯電話等の装置で本発明を実施するには、いわゆる当業者にとり自明な諸部材乃至機能の他に、本発明を実施するのに必要な部材乃至機能をその装置に設ければよい。また、本願でいうカメラとはスチルカメラやビデオカメラのことである。ご理解頂けるように、スチルカメラには、静止画撮影専用のカメラのほか、静止画動画両用のカメラや静止画撮影機能を備えた他種装置も含まれ、ビデオカメラには、動画撮影専用のカメラのほか、静止画動画両用のカメラや動画撮影機能を備えた他種装置も含まれる。これもまたご理解頂けるように、そのカメラに他の様々な部材乃至機能を持たせることもできる。例えば着脱可能なレンズや複数個の撮像ユニット等であるが、本願ではこれらについて詳細には説明しないこととする。携帯型のカメラでも固定配設型のカメラでも使用できる。本願で説明していない機能を備えるものであってもよい。撮影に関係ない機能を備えていてもよい。カメラ付携帯電話等、カメラ機能と通信機能を併有する装置であってももよい。ポータブルコンピュータや、ポータブルな装置といえない編集スタジオ、フォトサービススタンド等のシステムでもよい。
加えて、本発明は、その利用環境を問わずスタンドアローン的な形態でも大規模システム構成要素の形態でも実施することができる。更に、入力乃至スキャン、ディジタル処理、ユーザ向け表示、随時行われるユーザからのリクエスト乃至処理指令の入力、それに対する出力等といった対人インタフェース機能を、単一の装置に兼ねさせてもよいし複数の装置に分担させてもよい。当該複数の装置を一個所にまとめて配置してもよいし様々な場所に分散して配置してもよい。装置間乃至場所間での通信は、公衆又は専用ネットワーク接続を介して、或いは媒体の引渡で行えばよい。本発明の趣旨に反しない限り、本発明に係る方法は、全自動的な形態でも、部分的に又は全面的にマニュアルでのユーザ入力を受ける形態でも、ユーザ乃至オペレータが閲覧して処理結果を認否する形態でも、或いはメタデータで補足される形態でも、実施することができる。そのメタデータは、ユーザから供給されるものでも、カメラ等の計測装置から供給されるものでも、或いはアルゴリズム的に生成されるものでもよい。更に、諸アルゴリズムとユーザとのやりとりは様々な方式の作業用ユーザインタフェースで行うことができる。
図1に、本発明の一実施形態に係る手順を示す。この手順では、諸画像レコードをまず時空間情報に基づき複数のグループに分類する(ステップ10)。例えば、それらの画像レコードをイベント別に仕分け(ステップ12)、その結果を更にそのイベントのサブイベント別に仕分ける(ステップ14)ことで、サブイベント別のグループを生成する。イベントとは個々の出来事のことであり、サブイベントとはそれを細分したもののことである。但し、出来事等に関するユーザの主観的な認識そのものではなく、それとできるだけ整合するようコンピュータ上の処理で設定した客観的な分類乃至範疇のことである。この手順では、次いで、各グループの画像レコードを一群のクラスタに振り分ける(ステップ16)。即ち、ある種の階層構造を形成している複数個の有特徴クラスタ及び1個の残り物クラスタのうちいずれかへと、ある所定の突出特徴に基づき画像レコードを振り分ける。有特徴クラスタに振り分けられるのは、それらの突出特徴のうちそのクラスタに対応する1個又は複数個の突出特徴を備える画像レコードであり、残り物クラスタに振り分けられるのは、それら所定の突出特徴のいずれも備えていない画像レコードである。階層構造上で比較的上位の有特徴クラスタに係る突出特徴を備えている画像レコードは当該比較的上位の有特徴クラスタに振り分けられるので、各有特徴クラスタに振り分けられるのは、その有特徴クラスタに係る突出特徴を備える画像レコード(その有特徴クラスタより階層構造上で下位の有特徴クラスタに係る突出特徴を備えているものでもよい)のうち、その有特徴クラスタより上位の有特徴クラスタに係る突出特徴を備えていないもののみである。更に、本願では、個々の有特徴クラスタに係る突出特徴のうち、階層構造におけるそのクラスタの順位を決定づけるある1個の突出特徴のことをそのクラスタの一次(primary)突出特徴と呼んでおり、それ以外の諸突出特徴のことをそのクラスタの二次(secondary)突出特徴と呼んでいる。
その一次突出特徴としては、同じグループを形成しているクラスタ間で互いに異なるものを使用する。後に各グループの代表画像を好適に選定することができるよう、クラスタの個数は4個以上にした方がよい。但し、個々のグループ内に実際に生じるクラスタの個数は上掲の振分処理にて決まり、またそのグループに属する画像レコードの個数によって左右される。従って、個々のグループ内には、最も多い場合は、突出特徴毎にその突出特徴に係る有特徴クラスタが生じ、更に残り物クラスタが生じる。逆に、最も少ない場合は、有特徴クラスタのうち1個か、残り物クラスタが生じるのみ、即ち1個のクラスタが生じるのみである。
クラスタへの振分が済んだら、グループ毎に、そのグループで生じたクラスタのうち最上位階層のものを最上位クラスタとして認定し(ステップ18)、更にそのグループの代表画像を選定する(ステップ20)。その際、最上位クラスタが有特徴クラスタであるグループについては、その最上位クラスタに係る一次突出特徴に基づきそのグループの代表画像を選定する。最上位クラスタが残り物クラスタであるグループについては、予め複数種類定められている突出特徴のいずれとも無関係に、そのグループの代表画像を選定する。
図4に、一群の画像レコードとイベント及びサブイベントとの関係を示す。この図では、矢印線300に沿い撮影日時順に一群の画像レコードを並べてある。それらの画像レコードには、イベント310に属するものとイベント320に属するものとがある。イベント310はサブイベント330、340及び350を含んでおり、イベント320はサブイベント360、370及び380を含んでいる。このように、一群の画像レコードをイベント別に仕分け、その結果を更にそのイベントのサブイベント別に仕分けてサブイベント別のグループを形成することができる(ステップ14)。更に、時空間情報に基づくこうしたイベント別・サブイベント別のグループ分類には、既に知られている様々なイベント別分類法を使用することができる。例えば特許文献3(発明者:A.Loui and E.Pavie、名称:イベント別画像自動分類方法(原題A Method for Automatically Classifying Images into Events)、発行日:2003年8月12日)及び特許文献2(発明者:A.Loui and E.Pavie、名称:イベント別分類対象画像コンテンツ自動比較方法(原題A Method for Automatically Comparing Content of Images for Classification into Events)、発行日:2002年2月26日)には、イベント毎及びサブイベント毎に画像コンテンツを分類するアルゴリズムが記載されている。特許文献16(発明者:B.Kraus and A.Loui、名称:イベント別多段画像分類(原題Multi-Tiered Image Clustering by Event)、発行日:2006年5月18日)及び特許文献17(発明者:A.Loui and B.Kraus、名称:分散ベースイベント別分類(原題Variance-Based Event Clustering)、発行日:2006年1月15日)には、イベント別に画像を自動分類する手法が記載されている。特許文献9(発明者:A.Loui,M.Jeanson and Z.Sun、名称:前景背景セグメント化によるイベント別画像分類(原題Event Clustering of Images Using Foreground and Background Segmentation)、発行日2005年7月5日)には、イベント別に画像を自動整頓する手法が記載されている。どういった手法を用い時空間情報による分類を行うかは、個々の手法の長所に基づき決めればよい。対象となる画像群の性質から見て好都合なものを選んでもよい。
図5に、クラスタへの振分手法の一例を示す。この図の手法では、各グループの画像レコードを有特徴クラスタと無特徴(non-feature)クラスタとに振り分ける二分岐クラスタリング(two-way clustering)を何回か繰返して実行している。即ち、この手法では、個々の有特徴クラスタに突出特徴を1個ずつ関連付けた上で、“その有特徴クラスタに係る突出特徴を備えている画像レコードはその有特徴クラスタに振り分け、備えていない画像レコードは無特徴クラスタに振り分ける”という二分岐クラスタリングを、調べる突出特徴を変えて繰返し実行している。具体的には、ステップ14におけるサブイベント別グループの生成を待ち(ステップ13)、生成されたら次の手順で個々のグループを処理する(ステップ15)。この処理では、まず、そのサブイベントに係る全ての画像レコードを対象に第1回二分岐クラスタリングを実行する。このクラスタリングでは、それらの画像レコードが第1突出特徴を備えているか否かを判別し(ステップ16A)、備えているとされた画像レコードを階層構造上で最上位のクラスタ101に振り分け、残りを無特徴クラスタに振り分ける。次いで、この第1回二分岐クラスタリングで無特徴クラスタに振り分けられた画像レコードを対象に第2回二分岐クラスタリングを実行する。このクラスタリングでは、それらの画像レコードが第2突出特徴を備えているか否かを判別し(ステップ16B)、備えているとされた画像レコードを階層構造上で第2位のクラスタ102に振り分け、残りを無特徴クラスタに振り分ける。更に、この第2回二分岐クラスタリングで無特徴クラスタに振り分けられた画像レコードを対象に第3回二分岐クラスタリングを実行する。このクラスタリングでは、それらの画像レコードが第3突出特徴を備えているか否かを判別し(ステップ16C)、備えているとされた画像レコードを階層構造上で第3位のクラスタ103に振り分け、残りを無特徴クラスタに振り分ける。二分岐クラスタリングの回数、ひいては突出特徴の個数及びその階層構造上のクラスタ数は更に増やしてもよい。最終回の二分岐クラスタリングまでにいずれの有特徴クラスタにも振り分けられず無特徴クラスタに残った画像レコードは残り物クラスタ104に振り分けられる。以上の処理を全てのサブイベントについて実行し終えたら(ステップ19)ステップ18に移行する(ステップ21)。
この手順で突出特徴として使用するのは、ユーザにとり何らかの意味がある特徴である。そうした特徴を使用し上掲の手順を実行することにより、ユーザ自身が画像を整頓する際の分け方に対応するよう、複数個のクラスタからなる階層構造を生成することができる。多くのユーザが重宝するであろう主要な突出特徴としては、人物の存否、顔の存否、主被写体の存否、主被写体のカラフル度、主被写体の中心度、重複する画像レコードの存否、画像の利用回数(電子メール添付、印刷、閲覧等の回数)等がある。
例えば、第1回二分岐クラスタリングを顔指標、第2回二分岐クラスタリングを主被写体指標、そして第3回二分岐クラスタリングを重複画像レコード指標に基づき実行するようにすれば、好適にも、ユーザにとって重要度の高いことが多い特徴に基づき代表画像を選定することができる。しかも、全ての画像レコードについてその細かな意味を調べること、例えば主被写体の主題を識別することが不要になる。また、顔指標としては画像における顔の存否、主被写体指標としては画像における主被写体の存否、重複画像レコード指標としては重複する画像レコードの存否を使用ことができる。それらの指標に基づく二分岐クラスタリングは、それらの指標の値をその指標に対応する所定のしきい値と比較する動作、例えばしきい値超過判別を行いその結果に基づき行えばよい。更に、検知した顔が所定のリストに掲載されている特定の人物の顔か否かを識別する顔認識処理を実行すれば、どのような画像レコードが代表画像として選定されるかをユーザの好みに応じ調整することや、ある特定の人物のものを代表画像に選定されやすくすることができる。
それらのうち人間の「顔」は、本件技術分野で既知の顔検知手法に則り画像から検知することができる。例えば特許文献15(発明者:S.Chen,H.Nicponski and L.Ray、名称:ディジタル画像内顔検知方法及びシステム(原題Method and System for Face Detection in Digital Images)、発行日:2004年9月16日)、特許文献10(発明者:F.Lestideau、名称:複雑な背景を伴うカラー画像における顔検知(原題Face Detection in Color Images with Complex Background)、発行日:2006年4月25日)、特許文献5(発明者:E.Ho and J.Lennon、名称:ディジタル画像内顔検知(原題Face Detection in Digital Images)、発行日:2003年12月9日)等に記載の手法である。こうした顔検知では、その画像におけるその顔の位置やその画像に占める顔の大きさを求めることができる。本件技術分野で既知の人物検知法、例えば特許文献6(発明者:J.Luo、名称:ディジタル画像内人物画像検知用画像処理方法(原題Image Processing Method for Detecting Human Figures in a Digital Image)、発行日:2004年2月17日)に記載の手法で人物やその集まりを検知するようにしてもよい。
顔認識は顔検知と共に又はそれに続き行えばよい。顔認識は、画像レコードに含まれる個々の顔に識別子を割り当てる処理、並びに画像に写っている人間の顔をその識別子に基づき人物別に分類する処理からなる自動処理によって、実行することができる。その前半の識別子割当には、例えば非特許文献1に記載の能動形状モデルベース顔面特徴点ファインダ法を使用できる。後半の人物別顔分類には、米国特許出願第10/143,272号(発明者:Chen et al.、名称:人面含有画像整頓再生方法及び装置(原題Method and Apparatus for Organizing and Retrieving Images Containing Human Faces)、出願日:2002年5月10日、この参照を以て本願に繰入)に記載の顔類似度別分類法を使用できる。その際、全面的な顔認識処理を全画像レコードについて行う必要はない。例えば、ある画像レコードにある人物の顔が写っているなら、その画像レコードと同じグループに属する他の画像レコード、即ち同じサブイベントで撮影された他の画像レコードにも、その人物の顔が写っている蓋然性が高いといえよう。従って、あるグループに属するある画像レコードからある人物の顔が認識された場合、そのグループに属する他の画像レコードに対しては、同じやり方で顔認識を行ってもよいけれども、それを一部変形したやり方、即ち顔面特徴点、着衣等といた特徴点が完全には共通していなくても先の画像で認識した顔と同じ人物の顔と認識されるようなやり方で、顔認識を行うことができる。
顔指標としては、この他にも、グループ内画像のクラスタ間振分に適するものであれば様々な種類のものを使用することができる。クラスタ間振分に使用する指標としてどのような指標が適切か、またそのしきい値としてどのような値が適切かについては、他の指標に基づくクラスタ間振分と同様に、ユーザ画像その他の画像からなるグループに対する評価結果から見出すことができる。例えば、その画像群に属する画像中で顔を含む画像が占める比率の計算値を顔指標として用い、その比率がある所定のしきい値を上回っている場合にその群に属する画像を丸ごと人物指向クラスタに振り分けるようにしてもよい。そのしきい値としては、予め設定されている値を使用してもよいし、ユーザが随時設定する値を使用してもよい。例えばしきい値=50%にすれば、顔を含む画像が多数を占める画像群が人物指向クラスタに振り分けられることとなる。
次に、「主被写体」とは写真等の分野でいう主被写体のことである。即ち、撮影した画像で光景の一部を構成していて、その光景の残りの部分(背景)から何らかの手段で弁別できる1個又は風数個の事物のことである。主被写体を背景から弁別する手段としては、まず遠近法を使用することができる。例えば、消失点への収束具合(線遠近法)、重複関係、視界深さ、照明/色キュー等や、状況によっては運動遠近法、運動視差等を、遠近法に基づく弁別に使用できる。更に、主被写体を背景から弁別する手段として、距離情報を利用できる場合もある。例えば、メタデータの一部を構成しているカメラレンジファインダデータや、スキャナレスレンジ撮像でもたらされる画素別のレンジデータである。
主被写体の存否は、様々な手法で検知することができる。例えば、メタデータの一部を構成し又はその基となっている撮影時のカメラレンジファインダデータや、自動ズーム/クロップ処理でもたらされるデータを、その検知に利用することができる。例えば、サブイベント別に分類されている個々の画像レコードに対して自動ズーム/クロップ処理を施す際には、特許文献1(発明者:J.Luo,S.Etz and A.Singhal、名称:写真画像内主被写体自動判別方法(原題Method for Automatic Determination of Main Subjects in Photographic Images)、発行日;2001年8月28日)、特許文献11(発明者:J.Luo and A.Singhal、名称:画像内被写体領域検知方法(原題Method for Detecting Subject Matter Regions in Images)、発行日;2006年6月13日)等に記載のアルゴリズムに従い画像中の主被写体を自動識別し、次に、その主被写体識別結果に基づき且つ特許文献4(発明者:J.Luo and R.Gray、名称:クロッピング版及びズーミング版写真画像自動生成方法(原題Method for Automatically Creating Cropped and Zoomed Versions of Photographic Images)、発行日;2003年11月11日)等に記載のアルゴリズムに従いその画像をズーム/クロップする。更に、こうしたズーム/クロップ処理でもたらされる様々な種類のデータのうち、例えばズーム率やクロップ部分面積といったデータを用い、或いはそうしたデータから別の数値例えばクロッピングされた部分が画像全体に占める面積比(クロップ部分比率)を求め、主被写体の存否を客観的に判別する。例えば、そのグループに属する個々の画像レコードについてクロップ部分比率を算出し、予め定めてある一対のしきい値にそのクロップ部分比率を照らすことで、その画像における主被写体の存否を判別することができる。使用するしきい値のうち一方はクロップ部分比率の下限についてのしきい値、他方は上限についてのしきい値である。クロップ部分比率が下限しきい値未満の場合、即ちクロップ部分が画像全体に比して狭すぎる場合や、クロップ部分比率が上限しきい値超の場合、即ちクロップ部分が画像全体に比して広すぎる場合は、そのクロップ部分については主被写体でないと判別する。これは、狭すぎ又は広すぎるクロップ部分は背景とあまり違いがないからである。また、ある実施形態について調べたところ、上限しきい値としては0.80(=80%)、下限しきい値としては0.20(=20%)が適しているとの結果が得られた。
クラスタ間振分用の主被写体指標としては、他にも様々な種類のものを使用することができる。例えば、主被写体が写っている画像レコードがその所属先グループ内でどういった個数比率を占めるかを算出し、算出した比率が所定のしきい値を上回っていたらそのグループに属する画像を丸ごと被写体指向クラスタに振り分けるようにしてもよい。その際使用するしきい値としては、ユーザが指定する値を使用してもよいし、50%超の適当な値を予め設定しておいてもよい。
更に、主被写体の識別は他種計測値の導出時にも行われうる。例えば、主被写体のカラフル度、主被写体の中心度等を算出する際である。そうした値を算出するには、例えば特許文献1(発明者:Luo et al.)及び特許文献12(発明者:N.Cahill and L.Ray、名称:クロッピング版画像生成用画像合成方法及びシステム(原題Method and System for Compositing Images to Produce a Cropped Image)、この参照を以て本願に繰入)に記載の手法を用いればよい。
そして、個々のグループにおける「重複画像レコード」の存否は、互いに全く又はほぼ同一のコンテンツ及び構図を呈しており、且つ互いに全く又はほぼ同一の角度及び距離から撮影されている画像レコードを、そのグループ内で探すことによって判別することができる。例えば特許文献2(発明者:A.Loui and E.Pavie、名称:イベント別分類用画像コンテンツ自動比較方法(原題A Method for Automaticall Comparing Content of Images for Classification into Events)、この参照を以て本願に繰入)に記載の手法では、画像毎にブロックベース色ヒストグラムを算出し、更にそれらのヒストグラムを他の画像と比較することによって類似度スコアを求めている。この手法を、同一グループ内のあらゆる画像レコード対に適用して類似度スコアを求め、予め定められているしきい値より大きな高い類似度スコアを呈する画像レコード対を探し、その画像レコード対を形成している各画像レコードを重複画像レコードと判別すればよい。類似度スコアを特許文献2に従い算出する場合、そのしきい値としては例えば90%を使用すればよい。
こうして1個又は複数個の有特徴クラスタを含むグループが形成されたら、それらのグループそれぞれについて、そのグループの最上位クラスタに係る一次突出特徴に基づき、そのグループの代表画像を選定する。この選定は、一組の所定ルールに従い判別する、というやり方で行えばよい。使用するルールは、例えば、顔等のように最も重要な突出特徴に係るクラスタの画像をまず使用し、次いでその次に重要な別の突出特徴に係るクラスタの画像を使用し、というように、突出特徴の重要度順にクラスタを採用するものである。個々の用途で個々の突出特徴がどの程度重要かは、例えばユーザによる試行等を通じ見出すようにすればよい。
図6に、最上位クラスタ認定手法及び代表画像選定手法の一例を示す。この例では、その最上位クラスタが有特徴クラスタであるグループについてはその最上位クラスタに係る突出特徴に基づき、またその最上位クラスタが残り物クラスタであるグループについてはどの突出特徴とも無関係に、そのグループの代表画像を選定するようにしている。具体的には、ステップ16におけるクラスタ間振分を待ち(ステップ17)、振分が済んだら個々のサブイベント別グループを次の手順で調べる(ステップ15)。この手順では、まず、そのサブイベント別グループ内に実際に生じているクラスタのなかで最上位階層のクラスタはどれかを調べる。図示例は、顔の存否、主被写体の存否、重複する画像レコードの存否の順に判別を行うことでサブイベント別グループ内の画像レコードを三種類の有特徴クラスタに振り分け、そのグループ内の残りの画像レコードを残り物クラスタに振り分ける処理(図5)に続き実行される処理であるので、そのサブイベント別グループ内に実際に生じているクラスタのなかで、顔の存否に係るクラスタが最上位階層なら(ステップ18A)そのクラスタ即ち人物指向クラスタをそのグループの最上位クラスタと認定し、主被写体の存否に係るクラスタが最上位階層なら(ステップ18B)そのクラスタ即ち被写体指向クラスタをそのグループの最上位クラスタと認定し、重複する画像レコードの存否に係るクラスタが最上位階層なら(ステップ18C)そのクラスタ即ちテーマ指向クラスタをそのグループの最上位クラスタと認定し、いずれにも該当しない場合は残り物クラスタが最上位クラスタであると認定している。図5におけるクラスタ間振分の順序と図6における最上位クラスタ認定の順序は同じであるので、いわゆる当業者には自明な通り、クラスタ間振分及び最上位クラスタ認定がサブイベント毎に一括実行されるよう、図5に示した手順と図6に示す手順とを合体させることも可能である。例えば、ステップ16Aの後ステップ18A、ステップ16Bの後ステップ18B、ステップ16Cの後ステップ18Cを実行し、残り物クラスタ104について認定ステップ20Dを実行するようにすればよい。
クラスタ間振分で生じたクラスタのなかで顔の存否に係るクラスタがグループ内最上位クラスタである場合、そのグループの代表画像は、当該最上位クラスタに属する個々の画像レコード中の顔面積を評価し、顔面積が最大の画像レコードのうち1個、例えば顔面積が最大の画像レコードのうちその画質(鮮明さやコントラスト)が所定の条件を満たすものを選ぶことで、選定することができる。或いは、当該最上位クラスタに属する個々の画像レコードに含まれる顔を認識し、誰の顔か認識できた画像レコードのうち1個を選ぶことでも選定することができる。これらのやり方を組み合わせること、例えば画像レコードのうち誰の顔か認識できた顔の顔面積が最大でその画質が所定の条件を満たすものを代表画像に選定するようにすることも可能である。
クラスタ間振分で生じたクラスタのなかで主被写体の存否に係るクラスタがグループ内最上位クラスタである場合、そのグループの代表画像は、当該最上位クラスタに属する個々の画像レコードにおける主被写体相対サイズを算出し、主被写体相対サイズが中庸な画像レコードのうち1個を選ぶことで、選定することができる。その“中庸”な画像レコードは、例えばその最上位クラスタに属する画像レコードのうちその主被写体相対サイズが画像レコード間の平均値又はメディアン値に最も近い画像レコードを選ぶ、というように、所定のルールに従い選べばよい。また、“中庸”ではなく“最大”の主被写体相対サイズを有する画像レコードを画像を選ぶようにしてもよい。このやり方で選定される代表画像は、携帯電話の表示画面等のように画面が小さな装置に表示させるのに適している。或いは、主被写体エリアの画質に基づき選別、選定してもよい。
クラスタ間振分で生じたクラスタのなかで重複画像レコードの存否に係るクラスタがグループ内最上位クラスタである場合、そのグループの代表画像は、当該最上位クラスタから互いに重複する複数個の画像レコードの組を1個又は複数個識別し、いずれかの組に係る重複画像レコードのうち1個、例えば最多個数の重複レコードを含む組に係る重複画像レコードのうち1個を選ぶことで、選定することができる。重複レコードを選別する際には、鮮明さ、コントラスト等の画質を計測し、得られた値が所定の条件を満たすものを選んでもよい。
クラスタ間振分で生じたクラスタのなかで残り物クラスタがグループ内最上位クラスタである場合、そのグループの代表画像は、そのクラスタ内で時空間的に又は時間的に中庸な1個又は複数個の画像レコードから1個を選ぶことで、選定することができる。このやり方を採ることで、イベントの始まり頃又は終わり頃の画像、即ち過渡的なコンテンツになりがちな画像が代表画像になることを、回避することができる。
イベント及びそのサブイベントがそれぞれ複数ある場合は、まず各サブイベントの代表画像を選定し、それらサブイベントの代表画像のなかからその所属先イベントの代表画像を選定するようにするとよい。例えば、各イベントのサブイベントのなかからそのサブイベントに関わる画像レコードが最も多いものを探し、探し当てたサブイベントの代表画像を以て、そのサブイベントが属するイベントの代表画像に任ずるようにする。このようにすると、好適なことに、そのイベントでの画像撮影枚数から見てそのユーザにとり最も肝要そうなサブイベントから、そのイベントの代表画像が選定されることが多くなる。また、最も高い画質を呈する画像が属するグループから、対応するサブイベント乃至グループの代表画像を選定するようにしてもよい。或いは、最も多数の顔を検知できた画像が属するグループや、ユーザが知っている人物の顔を最も多く認識できた画像が属するグループから、対応するサブイベント乃至グループの代表画像を選定するようにしてもよい。
選定された代表画像は、平易な索引若しくは要約として使用することができる。場合によっては、DVD(登録商標)等のディジタル媒体におけるチャプタアイコンのように、階層構造化して提示することもできる。代表画像は、修正せずに使用してもよいし、画像サイズ修正、画質拡張等の修正を施して使用してもよい。例えば、その表示画面のサイズが小さいハンドヘルドデバイス等で使用する場合、顔又は主被写体が写っている画像領域が残るよう、代表画像を適切な規模へとクロッピングするとよい。

Claims (18)

  1. 撮影により得られた1個又は複数個のディジタル画像をそれぞれ含む画像レコードの集まりである画像レコード群について、コンピュータを利用しその画像レコード群の代表画像を求める方法であって、
    それらの画像レコードを時空間情報に基づき複数のグループに分類する分類ステップと、
    その画像レコードが階層構造上で比較的上位の有特徴クラスタに係る一種類又は複数種類の所定の突出特徴のうちいずれかを有している場合は当該比較的上位の有特徴クラスタに、また当該比較的上位の有特徴クラスタに係る突出特徴は有していないが階層構造上でより下位の有特徴クラスタに係る一種類又は複数種類の所定の突出特徴のうちいずれかを有している場合は当該より下位の有特徴クラスタに、そしてそれら複数個の有特徴クラスタに係る都合複数種類の突出特徴をいずれも有していない場合は残り物クラスタに、という要領で、各グループの画像レコードを、その突出特徴に基づき、有特徴クラスタ複数個及び残り物クラスタからなり階層構造を形成する一群のクラスタに振り分ける振分ステップと、
    グループ毎に、そのグループに存するクラスタのなかで最上位階層のクラスタを以てそのグループの最上位クラスタと認定する認定ステップと、
    そのグループの最上位クラスタが有特徴クラスタである場合はその最上位クラスタに係る突出特徴に基づき、またそのグループの最上位クラスタが残り物クラスタである場合は上記突出特徴のいずれとも無関係に、各グループの代表画像をそのグループを構成する画像レコードのなかから選定する選定ステップと、
    を有する方法。
  2. 請求項1記載の方法であって、上記振分ステップが、各グループの画像レコードを有特徴クラスタと無特徴クラスタに振り分ける二分岐クラスタリングを繰返し実行するステップを含み、最終回の無特徴クラスタを以て残り物クラスタとする方法。
  3. 請求項1記載の方法であって、その最上位クラスタが残り物クラスタであるグループについて、上記選定ステップにて、そのクラスタ内で時空間的に中庸な1個又は複数個の画像レコードからそのグループの代表画像を選定する方法。
  4. 請求項1記載の方法であって、上記分類ステップが、画像レコードをイベント別に仕分け、その結果を更にそのイベントのサブイベント別に仕分ける仕訳ステップを含み、それによってサブイベント別のグループを形成する方法。
  5. 請求項4記載の方法であって、上記選定ステップが、サブイベント別に代表画像を選定するステップと、それらの代表画像のなかからイベント別に代表画像を選定するステップと、を含む方法。
  6. 請求項4記載の方法であって、上記選定ステップが、
    各イベントのサブイベントのなかからそのサブイベントに関わる画像レコードが最も多いものを探すステップと、
    探し当てたサブイベントの代表画像を以てそのサブイベントが属するイベントの代表画像に任ずるステップと、
    を含む方法。
  7. 請求項4記載の方法であって、上記突出特徴として、人物の存否、顔の存否、主被写体の存否、主被写体のカラフル度、主被写体の中心度、重複する画像レコードの存否、並びに画像利用情報のうち少なくともいずれかを使用する方法。
  8. 請求項4記載の方法であって、上記仕訳ステップが、
    (a)各サブイベントの画像レコードを顔指標に基づき第1有特徴クラスタと第1無特徴クラスタに振り分けるステップと、
    (b)その第1無特徴クラスタに画像レコードが1個又は複数個含まれる場合に、それらの画像レコードを主被写体指標に基づき第2有特徴クラスタと第2無特徴クラスタに振り分けるステップと、
    (c)その第2無特徴クラスタに画像レコードが1個又は複数個含まれる場合に、それらの画像レコードを重複画像レコード指標に基づき第3有特徴クラスタと残り物クラスタに振り分けるステップと、
    を含む方法。
  9. 請求項8記載の方法であって、顔の存否という突出特徴を顔指標、主被写体の存否という突出特徴を主被写体指標、そして重複する画像レコードの存否という突出特徴を重複画像レコード指標として用い、且つその指標が対応する所定のしきい値を上回る値か否かを判別することによってその指標に基づく上記振分を行う方法。
  10. 請求項9記載の方法であって、その最上位クラスタが第1有特徴クラスタであるグループについて、上記選定ステップにて、
    その最上位クラスタに属する個々の画像レコード中の顔面積を評価し、
    その顔面積が最大の画像レコードのうち1個を代表画像に選定する方法。
  11. 請求項10記載の方法であって、その最上位クラスタが第1有特徴クラスタであるグループについて、上記選定ステップにて、
    その最上位クラスタに属する画像レコード中の顔を認識し、
    顔が1個以上写っている画像レコードのうち1個を代表画像に選定する方法。
  12. 請求項11記載の方法であって、その最上位クラスタが第2有特徴クラスタであるグループについて、上記選定ステップにて、
    その最上位クラスタに属する個々の画像レコードにおける主被写体相対サイズを判別し、
    主被写体相対サイズが中庸な画像レコードのうち1個を代表画像に選定する方法。
  13. 請求項12記載の方法であって、代表画像の選定に当たり各画像レコードの画質を勘案する方法。
  14. 請求項12記載の方法であって、その最上位クラスタが第3有特徴クラスタであるグループについて、上記選定ステップにて、
    その最上位クラスタから互いに重複する複数個の画像レコードの組を1個又は複数個識別し、
    いずれかの組に係る重複画像レコードのうち1個を代表画像に選定する方法。
  15. 請求項14記載の方法であって、そのサブイベントに係る重複画像レコードの組のうち最多個数の画像レコードを含む組に係る重複画像レコードのうち1個を代表画像に選定する方法。
  16. 請求項14記載の方法であって、その最上位クラスタが残り物クラスタであるクラスタについて、上記選定ステップにて、
    その最上位クラスタ中で時空間的に中庸な1個又は複数個の画像レコードを判別し、
    それら時空間的に中庸な画像レコードのうち1個を代表画像に選定する方法。
  17. 撮影により得られた1個又は複数個のディジタル画像をそれぞれ含む画像レコードの集まりである画像レコード群について、その代表画像を求めるコンピュータプログラムを、コンピュータ可読記録媒体上に記録した製造物であって、そのコンピュータプログラムを実行することにより、
    それらの画像レコードを時空間情報に基づき複数のグループに分類する分類ステップと、
    その画像レコードが階層構造上で比較的上位の有特徴クラスタに係る一次突出特徴を有している場合は当該比較的上位の有特徴クラスタに、また当該比較的上位の有特徴クラスタに係る一次突出特徴は有していないが階層構造上でより下位の有特徴クラスタに係る一次突出特徴を有している場合は当該より下位の有特徴クラスタに、そしてそれら複数個の有特徴クラスタに係る突出特徴をいずれも有していない場合は残り物クラスタに、という要領で、各グループの画像レコードを、都合複数種類あり有特徴クラスタ毎に異なる所定の一次突出特徴に基づき、有特徴クラスタ複数個及び残り物クラスタからなり階層構造を形成する一群のクラスタに振り分ける振分ステップと、
    グループ毎に、そのグループに存するクラスタのなかで最上位階層のクラスタを以てそのグループの最上位クラスタと認定する認定ステップと、
    そのグループの最上位クラスタが有特徴クラスタである場合はその最上位クラスタに係る一次突出特徴に基づき、またそのグループの最上位クラスタが残り物クラスタである場合は上記突出特徴のいずれとも無関係に、各グループの代表画像をそのグループを構成する画像レコードのなかから選定する選定ステップと、
    が実行される製造物。
  18. 1個又は複数個のディジタル画像をそれぞれ含む画像レコードの集まりである画像レコード群に索引を付するシステムであって、
    それらの画像レコードを時空間情報に基づき複数のグループに分類する手段と、
    その画像レコードが階層構造上で比較的上位の有特徴クラスタに係る一次突出特徴を有している場合は当該比較的上位の有特徴クラスタに、また当該比較的上位の有特徴クラスタに係る一次突出特徴は有していないが階層構造上でより下位の有特徴クラスタに係る一次突出特徴のうちいずれかを有している場合は当該より下位の有特徴クラスタに、そしてそれら複数個の有特徴クラスタに係る突出特徴をいずれも有していない場合は残り物クラスタに、という要領で、各グループの画像レコードを、都合複数種類あり有特徴クラスタ毎に異なる所定の一次突出特徴に基づき、有特徴クラスタ複数個及び残り物クラスタからなり階層構造を形成する一群のクラスタに振り分ける手段と、
    グループ毎に、そのグループに存するクラスタのなかで最上位階層のクラスタを以てそのグループの最上位クラスタと認定する手段と、
    そのグループの最上位クラスタが有特徴クラスタである場合はその最上位クラスタに係る一次突出特徴に基づき、またそのグループの最上位クラスタが残り物クラスタである場合は上記突出特徴のいずれとも無関係に、各グループの代表画像をそのグループを構成する画像レコードのなかから選定する手段と、
    各イベント及びサブイベントの索引としてその代表画像を表示するディスプレイと、
    を備えるシステム。
JP2009550913A 2007-02-22 2008-02-21 階層的クラスタリングによる代表画像選定 Expired - Fee Related JP5261724B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/677,617 US7869658B2 (en) 2006-10-06 2007-02-22 Representative image selection based on hierarchical clustering
US11/677,617 2007-02-22
PCT/US2008/002293 WO2008103412A1 (en) 2007-02-22 2008-02-21 Representative image selection based on hierarchical clustering

Publications (3)

Publication Number Publication Date
JP2010521024A true JP2010521024A (ja) 2010-06-17
JP2010521024A5 JP2010521024A5 (ja) 2012-04-05
JP5261724B2 JP5261724B2 (ja) 2013-08-14

Family

ID=39495998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009550913A Expired - Fee Related JP5261724B2 (ja) 2007-02-22 2008-02-21 階層的クラスタリングによる代表画像選定

Country Status (4)

Country Link
US (1) US7869658B2 (ja)
EP (1) EP2122498A1 (ja)
JP (1) JP5261724B2 (ja)
WO (1) WO2008103412A1 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1859368A1 (en) * 2005-03-10 2007-11-28 Koninklijke Philips Electronics N.V. Summarization of audio and/or visual data
US8639028B2 (en) * 2006-03-30 2014-01-28 Adobe Systems Incorporated Automatic stacking based on time proximity and visual similarity
TWI337321B (en) * 2007-05-15 2011-02-11 Htc Corp Electronic device with switchable user interface and accessable touch operation
JP4375442B2 (ja) * 2007-06-04 2009-12-02 ソニー株式会社 画像管理装置、画像管理方法および画像管理プログラム
GB2451483B (en) * 2007-07-31 2012-05-30 Hewlett Packard Development Co Image processing method, system and computer readable medium
GB2456494A (en) * 2007-07-31 2009-07-22 Hewlett Packard Development Co Photographic montage creation using automatic cropping controlled by characteristics of the images
US20090164512A1 (en) * 2007-12-19 2009-06-25 Netta Aizenbud-Reshef Method and Computer Program Product for Managing Media Items
US8190623B2 (en) * 2008-06-05 2012-05-29 Enpulz, L.L.C. Image search engine using image analysis and categorization
US20090297045A1 (en) * 2008-05-29 2009-12-03 Poetker Robert B Evaluating subject interests from digital image records
US8682085B2 (en) * 2008-10-06 2014-03-25 Panasonic Corporation Representative image display device and representative image selection method
US8374462B2 (en) * 2008-11-14 2013-02-12 Seiko Epson Corporation Content-aware image and video resizing by anchor point sampling and mapping
US8611677B2 (en) * 2008-11-19 2013-12-17 Intellectual Ventures Fund 83 Llc Method for event-based semantic classification
US8538966B2 (en) 2008-11-21 2013-09-17 Randall Reese Machine, program product, and computer-implemented method for file management, storage, and access utilizing a user-selected trigger event
US9239847B2 (en) * 2009-03-12 2016-01-19 Samsung Electronics Co., Ltd. Method and apparatus for managing image files
US8180773B2 (en) * 2009-05-27 2012-05-15 International Business Machines Corporation Detecting duplicate documents using classification
RU2012101280A (ru) * 2009-06-15 2013-07-27 Конинклейке Филипс Электроникс Н.В. Способ и устройство для выбора типичного изображения
US20100325552A1 (en) * 2009-06-19 2010-12-23 Sloo David H Media Asset Navigation Representations
JP2011003156A (ja) * 2009-06-22 2011-01-06 Nec Corp データ分類装置、データ分類方法及びデータ分類プログラム
US8571331B2 (en) * 2009-11-30 2013-10-29 Xerox Corporation Content based image selection for automatic photo album generation
US9465993B2 (en) * 2010-03-01 2016-10-11 Microsoft Technology Licensing, Llc Ranking clusters based on facial image analysis
US8724910B1 (en) * 2010-08-31 2014-05-13 Google Inc. Selection of representative images
JP2012060239A (ja) * 2010-09-06 2012-03-22 Sony Corp 動画像処理装置、動画像処理方法およびプログラム
US20120275714A1 (en) * 2011-04-27 2012-11-01 Yuli Gao Determination of an image selection representative of a storyline
CN103917986A (zh) * 2011-09-07 2014-07-09 法雷奥开关和传感器有限责任公司 用于检测车辆风挡上的雨滴的方法和摄像头组件
US8958645B2 (en) * 2012-04-19 2015-02-17 Canon Kabushiki Kaisha Systems and methods for topic-specific video presentation
TW201344546A (zh) * 2012-04-20 2013-11-01 Primax Electronics Ltd 相片資料夾之代表縮圖之自動選擇方法及自動選擇系統
US20140328570A1 (en) * 2013-01-09 2014-11-06 Sri International Identifying, describing, and sharing salient events in images and videos
US8891883B2 (en) 2012-05-15 2014-11-18 Google Inc. Summarizing a photo album in a social network system
US9405962B2 (en) * 2012-08-14 2016-08-02 Samsung Electronics Co., Ltd. Method for on-the-fly learning of facial artifacts for facial emotion recognition
US9224071B2 (en) * 2012-11-19 2015-12-29 Microsoft Technology Licensing, Llc Unsupervised object class discovery via bottom up multiple class learning
US20140143730A1 (en) * 2012-11-22 2014-05-22 Afolio Inc. Setting key image of online album
US8983150B2 (en) 2012-12-17 2015-03-17 Adobe Systems Incorporated Photo importance determination
US8897556B2 (en) 2012-12-17 2014-11-25 Adobe Systems Incorporated Photo chapters organization
US9411831B2 (en) * 2013-03-01 2016-08-09 Facebook, Inc. Photo clustering into moments
US11080318B2 (en) * 2013-06-27 2021-08-03 Kodak Alaris Inc. Method for ranking and selecting events in media collections
US9070048B2 (en) * 2013-10-17 2015-06-30 Adobe Systems Incorporated Method and apparatus for automatically identifying a representative image for an image group
US10599669B2 (en) * 2014-01-14 2020-03-24 Ayasdi Ai Llc Grouping of data points in data analysis for graph generation
WO2015109030A1 (en) 2014-01-14 2015-07-23 Ayasdi, Inc. Consensus sequence identification
US20150331930A1 (en) * 2014-05-16 2015-11-19 Here Global B.V. Method and apparatus for classification of media based on metadata
WO2015200350A1 (en) 2014-06-24 2015-12-30 Google Inc. Ranking and selecting images for display from a set of images
CN106095465B (zh) * 2016-06-23 2019-12-27 北京小米移动软件有限公司 设置身份图像的方法及装置
US10402642B2 (en) * 2017-05-22 2019-09-03 Microsoft Technology Licensing, Llc Automatically converting ink strokes into graphical objects
CN107426088A (zh) * 2017-07-20 2017-12-01 北京小米移动软件有限公司 图片信息处理方法及装置
US11190410B2 (en) * 2018-07-16 2021-11-30 Cable Television Laboratories, Inc. Proactive operations platform
US11508392B1 (en) 2020-06-05 2022-11-22 Meta Platforms Technologies, Llc Automated conversation content items from natural language
US11934445B2 (en) 2020-12-28 2024-03-19 Meta Platforms Technologies, Llc Automatic memory content item provisioning
US20220335538A1 (en) * 2021-04-19 2022-10-20 Facebook Technologies, Llc Automated memory creation and retrieval from moment content items
CN116386119A (zh) * 2023-05-09 2023-07-04 北京维艾狄尔信息科技有限公司 基于健身步道的身份识别方法、系统、终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004118573A (ja) * 2002-09-26 2004-04-15 Fuji Photo Film Co Ltd 画像整理装置およびプログラム
JP2006171942A (ja) * 2004-12-14 2006-06-29 Fuji Photo Film Co Ltd 重要度設定装置および方法並びにプログラム
JP2006172090A (ja) * 2004-12-15 2006-06-29 Fuji Photo Film Co Ltd 代表画像選択装置および方法並びにプログラム
JP2006229682A (ja) * 2005-02-18 2006-08-31 Fuji Photo Film Co Ltd プリント推奨画像選択装置、方法およびプログラム

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8107015B1 (en) * 1996-06-07 2012-01-31 Virage, Incorporated Key frame selection
US6360234B2 (en) * 1997-08-14 2002-03-19 Virage, Inc. Video cataloger system with synchronized encoders
US6463444B1 (en) * 1997-08-14 2002-10-08 Virage, Inc. Video cataloger system with extensibility
US6567980B1 (en) * 1997-08-14 2003-05-20 Virage, Inc. Video cataloger system with hyperlinked output
AUPP400998A0 (en) * 1998-06-10 1998-07-02 Canon Kabushiki Kaisha Face detection in digital images
US6833865B1 (en) * 1998-09-01 2004-12-21 Virage, Inc. Embedded metadata engines in digital capture devices
US6606411B1 (en) * 1998-09-30 2003-08-12 Eastman Kodak Company Method for automatically classifying images into events
US6721454B1 (en) * 1998-10-09 2004-04-13 Sharp Laboratories Of America, Inc. Method for automatic extraction of semantically significant events from video
US6351556B1 (en) * 1998-11-20 2002-02-26 Eastman Kodak Company Method for automatically comparing content of images for classification into events
US6282317B1 (en) * 1998-12-31 2001-08-28 Eastman Kodak Company Method for automatic determination of main subjects in photographic images
US6807306B1 (en) * 1999-05-28 2004-10-19 Xerox Corporation Time-constrained keyframe selection method
US6549643B1 (en) * 1999-11-30 2003-04-15 Siemens Corporate Research, Inc. System and method for selecting key-frames of video data
US6654506B1 (en) * 2000-01-25 2003-11-25 Eastman Kodak Company Method for automatically creating cropped and zoomed versions of photographic images
US6697502B2 (en) * 2000-12-14 2004-02-24 Eastman Kodak Company Image processing method for detecting human figures in a digital image
US6915011B2 (en) * 2001-03-28 2005-07-05 Eastman Kodak Company Event clustering of images using foreground/background segmentation
US6847733B2 (en) * 2001-05-23 2005-01-25 Eastman Kodak Company Retrieval and browsing of database images based on image emphasis and appeal
AUPR541801A0 (en) * 2001-06-01 2001-06-28 Canon Kabushiki Kaisha Face detection in colour images with complex background
US7062085B2 (en) * 2001-09-13 2006-06-13 Eastman Kodak Company Method for detecting subject matter regions in images
US7162102B2 (en) * 2001-12-19 2007-01-09 Eastman Kodak Company Method and system for compositing images to produce a cropped image
US20030128389A1 (en) * 2001-12-26 2003-07-10 Eastman Kodak Company Method for creating and using affective information in a digital imaging system cross reference to related applications
US20030210808A1 (en) * 2002-05-10 2003-11-13 Eastman Kodak Company Method and apparatus for organizing and retrieving images containing human faces
US7508961B2 (en) * 2003-03-12 2009-03-24 Eastman Kodak Company Method and system for face detection in digital images
US20050033758A1 (en) * 2003-08-08 2005-02-10 Baxter Brent A. Media indexer
US7653249B2 (en) * 2004-11-17 2010-01-26 Eastman Kodak Company Variance-based event clustering for automatically classifying images
US7643686B2 (en) * 2004-11-17 2010-01-05 Eastman Kodak Company Multi-tiered image clustering by event
US7783115B2 (en) * 2004-12-14 2010-08-24 Fujifilm Corporation Apparatus and method for setting degrees of importance, apparatus and method for representative image selection, apparatus and method for printing-recommended image selection, and programs therefor
JP2008040851A (ja) * 2006-08-08 2008-02-21 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004118573A (ja) * 2002-09-26 2004-04-15 Fuji Photo Film Co Ltd 画像整理装置およびプログラム
JP2006171942A (ja) * 2004-12-14 2006-06-29 Fuji Photo Film Co Ltd 重要度設定装置および方法並びにプログラム
JP2006172090A (ja) * 2004-12-15 2006-06-29 Fuji Photo Film Co Ltd 代表画像選択装置および方法並びにプログラム
JP2006229682A (ja) * 2005-02-18 2006-08-31 Fuji Photo Film Co Ltd プリント推奨画像選択装置、方法およびプログラム

Also Published As

Publication number Publication date
US20080205772A1 (en) 2008-08-28
WO2008103412A1 (en) 2008-08-28
EP2122498A1 (en) 2009-11-25
US7869658B2 (en) 2011-01-11
JP5261724B2 (ja) 2013-08-14

Similar Documents

Publication Publication Date Title
JP5261724B2 (ja) 階層的クラスタリングによる代表画像選定
JP2010506297A (ja) 画像レコードアクセス用異分類クラスタランキング
US9336443B2 (en) Method and apparatus for organizing digital media based on face recognition
JP5364573B2 (ja) 不完全なデータからの評価指標
US8078618B2 (en) Automatic multimode system for organizing and retrieving content data files
US8704914B2 (en) Apparatus to automatically tag image and method thereof
US20070182829A1 (en) Composite imaging method and system
US20110022982A1 (en) Display processing device, display processing method, and display processing program
JP2013225327A (ja) カメラへのユーザ入力に基づく画像値インデックス
KR101475939B1 (ko) 이미지 처리 장치의 제어 방법과 이미지 처리 장치, 이미지파일
US20080085032A1 (en) Supplying digital images from a collection
JP3649468B2 (ja) 撮影機能付き電子アルバムシステム
JP2007133838A (ja) 画像表示方法及び画像表示プログラム
JP5402026B2 (ja) 電子カメラおよび画像処理プログラム
JP5213506B2 (ja) 画像処理装置、画像処理装置の制御方法及びプログラム
US20100166316A1 (en) Method and apparatus for processing a digital image including a face detection finction
JP2009089046A (ja) 画像データ処理方法及び撮影装置
JP4554007B2 (ja) 撮影装置、撮影方法、及び記録媒体
JP2010187119A (ja) 撮像装置および撮像装置用プログラム
JP2007288409A (ja) 画像データ分類機能を備えた撮像装置およびプログラム
JP2001054010A (ja) 撮影装置、撮影方法、及び記録媒体
JP2007013936A (ja) 撮像装置、表示装置、撮像方法、表示方法、およびプログラム
JP2007241722A (ja) 画像処理装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120313

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120502

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120529

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20130403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130404

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees