JP5403838B2 - 顔を相関させることによるデジタル画像の編成 - Google Patents

顔を相関させることによるデジタル画像の編成 Download PDF

Info

Publication number
JP5403838B2
JP5403838B2 JP2011544642A JP2011544642A JP5403838B2 JP 5403838 B2 JP5403838 B2 JP 5403838B2 JP 2011544642 A JP2011544642 A JP 2011544642A JP 2011544642 A JP2011544642 A JP 2011544642A JP 5403838 B2 JP5403838 B2 JP 5403838B2
Authority
JP
Japan
Prior art keywords
profile
image
images
face
received image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011544642A
Other languages
English (en)
Other versions
JP2012514795A (ja
Inventor
グレッグ ジリー
ジョシュア デイヴィッド ファガンス
ニキル バート
ジャン−フランスワ アルブーズ
シメオン ライファー
ティモシー ビー マーティン
グレゴリー チャールズ リンドレイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Inc filed Critical Apple Inc
Publication of JP2012514795A publication Critical patent/JP2012514795A/ja
Application granted granted Critical
Publication of JP5403838B2 publication Critical patent/JP5403838B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、画像に表現された1つ以上の顔を相関させることによりデジタル画像のような画像を編成することに係る。
関連出願の相互参照:本出願は、2009年5月5日に出願された米国特許出願第12/436,069号、及び2009年1月5日に出願された米国プロビジョナル特許出願第61/142,606号の利益を主張するものである。
写真は、人気のある娯楽である。デジタル写真を通して発生されたデジタル画像を含む画像が広く行き渡っている。又、画像は、グラフィック編集ソフトウェア(例えば、画像編集又は製図ソフトウェア)、ビデオ装置、レンダリングシステム、スキャナ、断層撮影スキャナ、及び無線望遠鏡によって発生することもできる。
画像は、しばしば、人を表し、特に、人の顔を表す。顔の検出は、画像が1つ以上の顔を表すかどうか決定することに関する。顔認識(又は認識)は、画像に表された個人を識別することに関する。認識は、グラフィックの顔からの選択された顔の特徴を顔のデータベースと比較することにより行うことができる。顔認識アルゴリズムは、画像から顔の特徴に対応する目印を抽出することにより顔を識別することができる。例えば、あるアルゴリズムは、目、鼻、頬骨及び顎の相対的な位置、サイズ及び形状を分析することができる。認識アルゴリズムは、固有顔、フィッシャー顔、隠れマルコフモデル及び神経的に動機付けされる動的リンクマッチングを含む。
本開示は、顔を相関させることによりデジタル画像のような画像を編成するための技術について説明する。
ここに述べる技術を実施するシステムは、ユーザが、コンピュータ読み取り可能な記憶装置に記憶されたメディアのような画像を編成できるようにする。画像は、メディアに現れる1つ以上の顔の相関に基づいて特定の記憶位置へ論理的及び/又は物理的に自動的に指定することができる。例えば、特定の個人に対応するアルバムを、その個人を表すデジタル画像で自動的にポピュレートすることができる。アルバムに含まれる画像を相関させねばならない程度は、ユーザの仕様等に基づいて変更できる。
一般的に、本書に述べる要旨の1つの特徴は、画像を編成するためのコンピュータ実施方法において実施することができ、このコンピュータ実施方法は、人間の顔の表現を含む画像を受け取る段階と、人間の顔を含む1つ以上のプロフィール画像に関連した記憶された顔プロフィールに人間の顔が対応する見込みを指示する相関値を発生する段階と、受け取った画像及び発生された相関値を評価して、その評価の結果に基づき、画像がその記憶された顔プロフィールに対応するかどうか決定する段階と、受け取った画像を記憶された顔プロフィールに関連付ける段階と、その関連付けの指示を記憶する段階と、を備えている。又、この要旨の態様は、システム、コンピュータプログラム製品、並びに関連プロセッサ及び装置において実施することもできる。
これら及び他の実施は、次の特徴の1つ以上を任意に含むことができる。相関値は、画像が別の記憶された顔プロフィールに対応することを指示し、そして評価は、画像の第1メタデータ及び1つ以上のプロフィール画像の第2メタデータを評価することを含む。又、前記方法は、1つ以上のプロフィール画像、及びその1つ以上のプロフィール画像に関連したプロフィール情報をアドレス帳アプリケーションから得る段階と、1つ以上のプロフィール画像及びプロフィール情報に基づいて記憶された顔プロフィールを発生する段階とを含む。又、前記方法は、前記評価に基づいて、人間の顔が記憶された顔プロフィールに対応することを確認するようユーザを促す段階と、そのように促すことに応答して、人間の顔が記憶された顔プロフィールに対応するという確認を受け容れる段階とを含む。その受け容れは、肯定応答オプション及び否定応答オプションを有するユーザインターフェイスを経て受け容れることを含む。
又、この実施は、次の特徴の1つ以上を任意に含むこともできる。この方法は、画像が人間の顔を表す見込みが90%未満であることを指示する検出情報にアクセスする段階と、画像が皮膚トーンカラー及び鮮明な画像細部を描写することを確立する段階と、その確立に基づいて、画像が人間の顔を表すことを確認する段階とを含む。又、この方法は、検出情報、画像又は相関値の1つ以上に基づき画像をキー画像として選択する段階と、そのキー画像を、記憶された顔プロフィールのアイコンとして表示する段階とを含む。画像は、鮮明さの指示、捕獲日付、又は画像の解像度の1つ以上を含む。検出情報は、人間の顔から画像に描写された別の人間の顔までの距離、又は画像に対する人間の顔の角度、の1つ以上を含む。人間の顔は、第1の人間の顔を含み、そして前記方法は、画像に表された第2の人間の顔と、記憶された顔プロフィールとの間の潜在的な対応性を導出する段階と、記憶された顔プロフィールに対応する第1の人間の顔及び相関値に基づいてその導出された潜在的な対応性を無視する段階とを含む。
又、前記方法は、人間の顔を表す非分類画像、非分類画像情報、及び人間の顔が記憶された顔プロフィールに対応する見込みを指示する非分類相関値を受け取る段階と、初期相関値スレッシュホールドを確立する段階と、その初期相関値スレッシュホールド及び非分類相関値に基づく非分類画像をグループ化する段階と、一緒にグループ化された非分類画像の量及び非分類画像のグループの総数に基づいて改訂された相関スレッシュホールドを導出する段階と、その改訂された相関スレッシュホールド及び非分類の相関値に基づいて非分類画像を再グループ化する段階と、その非分類画像の1つ以上のグループを、再グループ化に基づいて記憶された顔プロフィールに関連付ける段階と、を含む。記憶された顔プロフィールは、第1の記憶された顔プロフィールを含み、そして人間の顔は、第1の人間の顔を含む。前記方法は、第1の記憶された顔プロフィール及び第2の記憶された顔プロフィールをユーザインターフェイスに提示する段階であって、第2の記憶された顔プロフィールが第2の人間の顔を表す1つ以上の画像を含むような段階と、第1の記憶された顔プロフィールを第2の記憶された顔プロフィールに関連付ける指示をユーザインターフェイスにおいて受け取る段階と、第1の記憶された顔プロフィール及び第2の記憶された顔プロフィールから1つ以上のプロフィール画像を含む合成アルバムを発生する段階と、を含む。
本書に述べる技術は、次の潜在的な利点の1つ以上を実現化するように実施することができる。顔を相関させることは、画像を、フォルダ又はアルバムのような1つ以上の記憶構造体へと自動的に分類できるように実施することができる。更に、その要旨は、グラフィックな顔定義又はプロフィールが定義されていないところの新たな個人を識別できるように実施することができる。更に、その要旨は、付加的な画像と個人との関連付けに基づいて、顔の関連付けに使用される基準、例えば、定義又はプロフィールを洗練化できるように実施することができる。
以下、添付図面を参照して1つ以上の実施形態を詳細に述べる。他の特徴及び効果は、以下の説明、図面及び特許請求の範囲から明らかとなるであろう。
グラフィックの顔を相関させる規範的な概略を示す。 グラフィックの顔を相関させる規範的なシステムを示す。 規範的な相関システムを示すフローチャートである。 適応相関スレッシュホールドをセットするための規範的プロセスを示すフローチャートである。 認識をテストするための規範的プロセスを示すフローチャートである。 規範的な検出排除プロセスを示すフローチャートである。 規範的な相関排除プロセスを示すフローチャートである。 相関された顔を表示するための規範的なユーザインターフェイスを示す図である。 ユーザ入力を受け取るための規範的ユーザインターフェイスの図である。 ユーザ入力を受け取るための規範的ユーザインターフェイスの図である。 ユーザ入力を受け取るための規範的ユーザインターフェイスの図である。 アルバムを生成するための規範的ユーザインターフェイスの図である。 ユーザ入力を受け取るための規範的ユーザインターフェイスの図である。 規範的な相関技術を示す図である。 アルバムカバーの選択を示す図である。
明細書及び図面全体を通じて同じ要素が同じ参照番号で示されている。
顔を相関させることによる画像の編成は、画像にわたる同じ個人の表現を関連付けることを含む。画像に表現された人による画像の編成は、多数の潜在的な利点を与える。例えば、このような編成スキームは、画像システムのユーザにとって直観的なもので、ユーザがシステムの機能を素早く理解できるようにする。更に、多数の画像を手で編成する負担を実質的に排除することができ又は軽減することができる。更に、画像は、画像に表された個人に基づいて正確にグループ分けすることができる。画像を正確にグループ分けすることで、ユーザによる画像のアクセス、編成及び使用を改善することができる。
図1は、グラフィックの顔を相関する規範的な概略を示す。一般的に、画像は、カメラからコンピュータへ伝送することができる。コンピュータは、相関システムを備えることができる。相関システムは、同じ個人の画像をグループ化することにより画像を相関させることができる。
デジタルカメラ102は、デジタル画像を捕獲するカメラである。デジタルカメラ102は、電子画像センサを経て画像を記録することにより、ビデオ画像、静止画像又はその両方を捕獲することができる。デジタルカメラ102は、スタンドアローン型のデジタルカメラでもよいし、又は多数の装置のいずれかに合体されてもよい。例えば、デジタルカメラ102は、パーソナルデジタルアシスタント(PDA)、移動電話、又はウェブカメラに合体されてもよい。更に、デジタルカメラ102は、取り外し可能な記憶媒体を使用して、捕獲した画像データを記憶することもできる。例えば、デジタルカメラ102は、取り外し可能なフラッシュメモリ装置(例えば、コンパクトフラッシュ及びセキュアなデジタルカード)に画像を記憶することができる。デジタルカメラ102は、画像を種々のフォーマット(例えば、生のフォーマット、又はジョイントホトグラフィックエクスパートグループ(JPEG)の規格に基づいて)で記憶することができる。又、デジタルカメラ102は、コンピュータと通信するための1つ以上のインターフェイスを含むことができる。例えば、デジタルカメラ102は、ユニバーサルシリアルバス(USB)又はFireWireのようなワイヤードインターフェイス、及び/又は赤外線又は高周波のようなワイヤレスインターフェイスを含むことができる。
画像104は、デジタルカメラ(例えば、デジタルカメラ102)によって発生されたデジタル画像である。画像104は、顔を表す。又、画像104は、他のアイテムの表現を含むこともできる。例えば、画像104は、目印の前に立っている個人の画像であり、ビルや、木や、空、等を表すことができる。更に、画像104は、圧縮フォーマット(例えば、JPEG)又は非圧縮フォーマット(例えば、RAW)のような種々のフォーマットで記憶することができる。画像104は、グラフィックデータ及びメタデータを含むことができる。メタデータは、交換可能な画像ファイルフォーマット(Exif)仕様に適合することができる。Exifデータは、アパーチャー、露光時間、日付及び時刻、場所及び画像104に関する他の情報を含むことができる。
デジタルカメラ102は、画像を捕獲することができる。例えば、画像106、108及び110は、画像104のような他の画像でよい。又、画像106、108及び110の各々は、グラフィックの顔を表すこともできる。
コンピュータシステム112は、デジタルカメラ102のようなデジタルカメラから転送された画像を受け取るように構成される。コンピュータシステム112は、コンピュータ(例えば、デスクトップ、ラップトップ、サーバー、等)、移動電話(例えば、ブラックベリー)、PDA、又は他のそのような装置である。コンピュータシステム112は、1つ以上のソフトウェアアプリケーションを実行するように構成されたハードウェアを含むことができる。更に、コンピュータシステム112は、ランダムアクセスメモリ(RAM)、フラッシュメモリ及びハードドライブのような電子記憶メディアを含むことができる。更に、コンピュータシステム112は、画像のようなデジタル情報を受け取ることのできる1つ以上の通信インターフェイスを含むことができる。1つ以上の通信インターフェイスは、ワイヤードでもワイヤレスでもよい。
相関システム114は、画像に表現されたグラフィックの顔を相関させるように構成することができる。相関システム114は、画像に表されたグラフィックの顔を相関させるように構成できる。相関システム114は、コンピュータシステム(例えば、コンピュータシステム112)で実行されるソフトウェア、コンピュータシステムの含まれるハードウェア、又はその組み合わせで具現化することができる。相関システム114は、画像(例えば、デジタル画像)にアクセスし、それらの画像に関連したデータを分析し、そして共通のグラフィックの顔を表すように決定された2つ以上の画像を相関させることができる。例えば、デジタル画像を分析し、そして同じ個人を含む画像を互いに関連させて画像グループを形成することができる。
相関システム114は、画像104、106、108及び110を処理し、そして1つ以上の画像グループを発生することができる。画像グループ116は、各々が同じ個人に対応する顔を表すデジタル画像を含む。画像グループ116のような画像グループは、非常に大きな画像グループ(例えば、数百個又は数千個の画像)、小さな画像グループ(例えば、数個又は数十個の画像)、或いは1つの画像でもよい。更に、同じ画像が複数の画像グループに属することもできる。例えば、ジャックという名の個人と、メリーという名の別の個人とを含む画像を、ジャックに関連した画像グループ及びメリーに関連した異なる画像グループの両方に含ませることができる。
画像グループ118は、1つの画像しか含まない。画像グループ118は、個人が1つの画像でしか表されない、画像に顔が現れた個人がまだ相関システム114に定義されていない、又は画像内の個人が相関システム114に既に定義されている誰かとして認識されない、等、の種々の理由で、1つの画像しか含まない。同様に、画像グループ120も、1つの画像しか含まない。
動作中に、画像104、106、108、110は、デジタルカメラ102からコンピュータシステム112へ伝送することができる。相関システム114は、コンピュータシステム112において動作することができ、例えば、ユーザから受け取られたコマンドに応答して、又は画像の送信に応答して自動的に、画像104、106、108及び110を処理することができる。コンピュータシステム112は、画像106及び画像110が同じ個人に対応する顔を表すと決定し、従って、画像106及び画像110を一緒に画像グループ116にグループ化することができる。又、画像グループ116は、同じ個人を表すコンピュータシステム112に既に記憶された画像を含むことができる。更に、相関システム114は、画像104及び画像108のような画像において1つ以上の顔を認識しないことがあり、従って、画像グループ118及び画像グループ120のような単一の画像しか含まない画像グループを生成することができる。認識されない顔を含む画像は、シングルトンと称することができる。ある実施形態において、相関システム114は、幾つかの又は全部のシングルトンを画像グループにグループ化することができる。
図2は、グラフィックの顔を相関させるための規範的システム200を示す。この相関は、種々のハードウェア及びソフトウェアコンポーネントを伴う。画像及び識別情報のような入力を受け取り、それを使用して、デジタル画像に表された顔を相関させることができる。更に、相関プロセスの結果は、付加的な入力を受け取りそして付加的な相関を行うことにより繰り返し改善することができる。
図2に示すように、システム200は、デジタルカメラ202を含むことができる。このデジタルカメラ202は、図1のデジタルカメラ102と同様である。
コンピュータシステム204は、図1のコンピュータシステム112と同様である。更に、コンピュータシステム204は、ネットワーク(例えば、ネットワーク206)を経て情報を受信及び送信するためのハードウェア及びソフトウェアを含むことができる。又、コンピュータシステム204は、記憶装置(例えば、記憶装置210)へ情報を送信し及びそこから情報を受信するように構成することもできる。
相関システム212は、デジタル画像に現れる顔を相関させるように構成することができる。相関システム212は、ソフトウェア及び/又はハードウェアコンポーネントを含むことができる。更に、相関システム212は、スタンドアローンソフトウェアアプリケーションでもよいし、又は大きなソフトウェアアプリケーションの一部分として実施することもできる。相関システム212は、バックグランドにおいて実行されるよう構成することができる。それとは別に、又はそれに加えて、相関システム212は、ユーザが1つ以上の管理及び/又は処理機能をアクティブに遂行できるようにするユーザインターフェイス214を含むことができる。
ユーザインターフェイス214は、例えば、グラフィックユーザインターフェイス(GUI)、コマンドラインインターフェイス、触覚インターフェイス、又はリモートユーザから入力を受け取るためのネットワークインターフェイスである。ユーザインターフェイス214は、コマンド及びデジタル画像を含むデータを入力及び出力するためのメカニズムを含むことができる。例えば、ユーザは、相関システム212を操作するためにコマンド及び他の情報を入力することができる。又、ユーザインターフェイス214は、1つ以上のインターフェイススクリーンを通してユーザに情報を出力することもできる。
ユーザ入力モジュール216は、外部ソースからの入力を受け取り、記憶しそして処理するように構成することができる。例えば、ユーザ入力モジュール216は、デジタル画像における個人を識別するユーザからの入力を受け取ることができる。その識別は、その後、同じ個人の他の画像を識別する上で使用することができる。更に、入力は、関連情報を有する他のアプリケーションから受け取ることができる。例えば、アドレス帳アプリケーションからのデータを使用することができる。データは、画像、名前、e−メールアドレス、等を含むことができる。データを使用して、システムを名前でシードすることができる。ユーザが人を識別するときには、システムは、アドレス帳から名前を示唆することができる。更に、データを使用して、システムを名前付きの顔でシードすることができる。データは、名前と顔との間の関連性を含むことができる。好都合にも、データを使用してユーザへの名前の示唆を開始した後、ユーザが確実に識別された誰かを得ることができるようにする(例えば、ユーザは、アドレス帳における連絡先の画像を得て、その情報を使用して、連絡先を表す画像を示唆することができる)。
又、ユーザ入力は、リモートサーバー208(例えば、ウェブサイト)からネットワーク206(例えば、インターネット)を通して受け取ることもできる。例えば、ユーザがソーシャルネットワークサイト(例えば、フェースブック)へ画像をアップロードする場合には、ユーザ及びユーザの友人は、画像において顔を識別することができる。識別は、入力として受け取ることができ、画像の相関に使用することができる。ネットワークを通して受け取られた入力に異なる信頼レベルを指定することができる(例えば、ユーザによる識別は、ユーザの友人による識別に確実に依存する)。
前処理モジュール218は、顔分析エンジン220へ画像を通す前に画像を処理するように構成することができる。前処理モジュール218は、顔分析エンジン220の性能を改善できるルール及びヒューリスティクスを含む機能を遂行することができる。例えば、前処理モジュール218は、個人が画像に一度しか現れないことを述べるルールを適用することができる。
顔分析エンジン220は、画像に現れる1つ以上の顔を検出しそして認識するように構成することができる。顔分析エンジン220は、画像及び設定を受け取り、そして画像が個人に対応する顔を表すかどうか検出することができる。設定は、顔分析エンジン220の動作に影響するパラメータ、例えば、顔分析エンジン220が(例えば、後処理モジュール222に)検出に関する情報を与える前に検出に関して得なければならない信頼性レベルを指示するスレッシュホールドを含むことができる。
更に、顔分析エンジン220は、グラフィックの顔を他のグラフィックの顔と比較してそれらが同じ個人に属するものであるかどうか決定することにより顔を相関することもできる。顔分析エンジン220は、固有顔又はフィッシャー顔のようなアルゴリズム、又は神経ネットワークのような技術を使用して、顔認識を遂行するように構成することができる。更に、顔分析エンジン220は、イリノイ州シャウムブルクのOMRON社によってOKAOビジョンスイーツにおいて提供されたツールのような顔分析ツールのライブラリーとして実施することができる。
後処理モジュール222は、顔分析エンジン220からの情報を受け取るよう構成することができる。更に、後処理モジュール222は、エンジン220から受け取られた入力に基づいてルールを適用し、エンジン220の性能を改善することができる。例えば、後処理モジュール222は、画像を分析して、顔分析エンジン220により顔であると断言される画像の一部分が皮膚トーンであるか又は鮮明に見えるか決定することができる。これら条件の一方又は両方が欠陥である場合には、モジュール222は、顔の検出を無視することができる。皮膚トーン及び鮮明さは、図4を参照して以下に詳細に述べる。更に、モジュール222は、後処理に基づき新たな設定で再び処理するようにエンジン220へ情報を再提出することができる。
帰納的モジュール224は、帰納的推理を使用して、顔が誰に属するかについて山を掛けることができる。例えば、帰納的モジュール224が、2つの画像が(例えば、後処理モジュール222から受け取られた)同じ個人の顔を表し且つユーザが(例えば、ユーザ入力モジュール216から受け取られた)1つの画像における個人を識別すると信じる場合に、帰納的モジュール224は、他の画像も同じ個人のものであると帰納することができる。
相関モジュール226は、相関システム212に含まれた1つ以上の他のモジュールにより与えられる情報を使用して、デジタル画像に現れる顔を相関させるように構成することができる。相関プロセスは、画像を、画像に表された顔に基づいてグループへと編成することを含む。特に、ある個人に属すると分かるか又はそのように考えられる、システムにアクセス可能な全ての画像を含むグループを形成することができる。
図3は、規範的な相関プロセス300を示すフローチャートである。この相関プロセス300は、相関スレッシュホールドを繰り返し調整して、受け容れられる数の画像グループを発生する。グループは、「バケット」とも称される。各バケットは、同じ個人を表すと考えられる画像を含むことができる。相関スレッシュホールドが非常に高くセットされた場合には、プロセス300は、2つの画像が同じ個人の顔を表すと実質上確認されない限り2つの画像を相関させない。従って、相関スレッシュホールドが非常に高くセットされた場合には、同じ個人の幾つかの画像がおそらく相関されないので、より少数の画像を各々伴うより多くのバケットが発生されることになる。相関スレッシュホールドが非常に低くセットされた場合には、プロセス300は、同じ個人に対応しない顔を頻繁に相関させることができる。従って、相関スレッシュホールドを低い値にセットすることで、より多くの画像を各々伴うより少数のバケットを発生することができる。しかしながら、同じ個人に対応する顔を表さない2つの画像が相関される見込みが高まる。バケットは、同じ個人の画像をできるだけ多数含み、そしてその個人を表さない画像は少数又は全く含まないのが理想的である。
顔を表す画像を受け取ることができる(302)。更に、スレッシュホールドをデフォールト値にセットすることができる(304)。デフォールト値は、中間値である。デフォールト値がセットされると、画像を相関させることができ、同じ個人の顔を表すと考えられる画像が単一のバケットに関連付けられる(306)。次いで、発生されたバケットの数が受け容れられるかどうか決定することができる(308)。バケットの数が受け容れられる場合には(例えば、実質的に画像と同数のバケットが存在せず、且つ画像の数に対して非常に少ないバケットでもない)、プロセス300は、残っているシングルトンが多過ぎるかどうか決定することができる(310)。シングルトンは、対応する個人をプロセス300で識別できないところの1つ以上の顔を含む画像である。シングルトンが多過ぎることは、スレッシュホールド値が高くセットされ過ぎ、従って、その顔が、同じ個人の顔を含む他の画像と適切に相関されないという兆候である。
バケットが少な過ぎると決定された場合には、スレッシュホールド値を高めることができる(314)。スレッシュホールド値を高めるには、バケット内の顔が同じ個人に属することの付加的な信頼性をプロセス300で得ることが必要である。スレッシュホールド値が高められると、プロセス300は、画像の相関をもう一度遂行する(306)。
バケットが多過ぎると決定された場合には、スレッシュホールド値を下げることができる(316)。更に、プロセス300が、310において、シングルトンが多過ぎる(例えば、バケットに画像を指定するのに必要な信頼性の程度が高過ぎることを指示する)と決定した場合にも、スレッシュホールド値を下げることができる(316)。スレッシュホールド値を下げると、プロセス300は、低い信頼性の程度に基づいて画像を相関させることができる。スレッシュホールド値が下げられると、プロセス300は、画像の相関をもう一度遂行する(306)。
受け容れられる数のシングルトンがある(例えば、全画像数に対して)と決定された場合には、プロセス300は、ユーザ入力を受け取る(312)ことにより続けることができる。例えば、ユーザ入力は、1つ以上の画像に誰の顔が表されるかの情報を含むことができる。
図3Bは、適応相関スレッシュホールドをセットするための規範的プロセス350を示すフローチャートである。相関信頼性についてのスレッシュホールド値は、バケットごとにセットすることができる。最初、スレッシュホールドは、中間値にセットすることができる(352)。バケットサイズを増加することができる(354)。例えば、より多くの画像をシステムに追加することができ、又は画像内のより多くの顔を所与の個人として識別することができる。バケットサイズが増加するにつれて、スレッシュホールドを高くし(356)、特定のバケットに対する顔の相関をより困難なものとすることができる(低いスレッシュホールドに対して)。
図3Cは、潜在的な相関をテストするための規範的なプロセス370を示すフローチャートである。バケットに対する画像内の顔の潜在的な相関を検査することができる(372)。この検査は、潜在的な相関に対する信頼値が、所与のバケットに画像を含ませるためのスレッシュホールド要求のすぐ(例えば、僅かに)下であるかどうか決定することを含む(374)。信頼値がスレッシュホールドのすぐ下である場合には、メタデータテストを実行することができる(376)。このテストは、例えば、ソース画像のヒストグラム、露光値、及び捕獲日付・時刻を比較することを含む。時間的に接近して且つ同様のヒストグラム及び露光値で撮影された画像は、同じ要旨及び人を含むことができる。メタデータが同様であると決定された場合には(378)(例えば、画像が、バケットに既にある他の画像と同時に撮影されたことを指示する)、顔をバケットと相関させることができる(382)。全画像のヒストグラムを比較するのに加えて又はそれに代わって、画像が複数の顔を表すときは、顔エリアのみのヒストグラムをテストに使用することができる。
他方、信頼値がスレッシュホールドのすぐ下でないか(例えば、10%のような所定の設定に対して)、又は換言すれば、スレッシュホールドより著しく下であると決定される場合には、相関を無視することができる。又、メタデータが同様でないと決定された場合にも(378)、相関を無視することができる。
図4Aは、規範的な検出排除プロセス400を示すフローチャートである。あるインスタンスにおいて、検出エンジンは、推定では顔を表す(即ち、検出)が、実際には顔を表さない画像のエリアを検出する。プロセス400は、このような偽の肯定検出を排除することができる。
この検出排除プロセス400は、検出信頼性を受け取ることにより開始される(402)。検出信頼性は、分析エンジンによって与えられる値で、実際に行われている顔の検出に関してエンジンがどれほど信頼できるか指示する値である。
プロセス400は、鮮明さ及び皮膚トーンの検出についてテストすることにより続けられる(404)。鮮明さは、画像において顔が鮮明に表れるかどうか分析することを含む。実際の鮮明さ又は見掛け上の鮮明さのいずれか又は両方が欠けると、ボケが生じる。例えば、実際の鮮明さが欠けることは、カメラの焦点が不適切であるか、又は撮影時にカメラ又は対象物が動くことから生じる。見掛け上の鮮明さは、画像のアキュタンス(即ち、縁コントラスト)を指す。アキュタンスは、スペースに対する輝度の導関数の振幅に関連している。高いアキュタンスの画像は、より鮮明に見え、たとえ画像が、低いアキュタンスの画像より高い解像度又は実際の鮮明さを有していなくても、ユーザにより強く訴えるものとなる。鮮明でないマスキングのような画像処理技術は、画像のアキュタンスを高めるが、同時に、実際の鮮明さを下げることがある。実際の及び見掛け上の鮮明さは、検出がぼけているかどうか決定するように評価することができる。
又、プロセス400は、検出が潜在的な皮膚トーンを表すかどうか決定することができる(404)。皮膚トーンは、対象の色素、照明及びカメラの露出により、例えば、画像において決定される人間の皮膚の色の範囲に対応するカラーである。例えば、明るい緑の色合いを表す検出が顔に対応することはあり得ない。
プロセス400は、検出の信頼性が比較的高いかどうか決定することにより続けられる(406)。この決定は、検出の信頼性を表す値と所定の値との比較に基づいて行うことができる。例えば、1000は、検出が顔を表すところの最も高い信頼性を示すことができる。800より上の信頼値は、高いと決定することができる。
検出の信頼性が高い場合には、プロセス400が続けられ、そして検出が有効であるかどうかの評価の予想において(412)、鮮明さ及び皮膚トーンテストを信頼性に対して小さく重み付けする(408)。検出の信頼性が高い場合には、プロセス400が続けられ、そして再び、検出が有効であるかどうかの評価の予想において(412)、鮮明さ及び皮膚トーンテストを信頼性に対して大きく重み付けする(410)。
プロセス400は、検出が有効であるかどうか決定することにより続けられる(412)。この決定は、信頼性の値と、鮮明さ及び皮膚トーンテストの結果とに基づいて行うことができる。信頼性の値が高いと決定されたときには(406)、鮮明さ及び皮膚トーンテストは、その決定において小さく重み付けされる(408)。対照的に、信頼性の値が低いと決定されたときには(406)、鮮明さ及び皮膚トーンテストは、その決定において大きく重み付けされる(410)。規範的なプロセス400は、検出信頼性が高いこと(406)に関してバイナリ決定を使用するが、ある実施形態では、検出の信頼性及びグラフィックテストの結果をそれらの相対値に基づいて比例的に要因として考慮する。その結果は、グラフィックテストに与えられる重みが、低から高までのスケール上のどこに検出信頼性があるかに依存するスライディングスケールである(例えば、最も高い信頼性の場合に、テストは、信頼性に対して非常に小さく重み付けされる)。
鮮明さ及び皮膚トーンテストに加えて、ある実施形態では、検出が正しいかどうか決定するのに他の要因を使用することができる。例えば、検出エンジンは、検出された顔が画像に対して見える角度に関する情報を与える。画像が複数の顔を表しそして顔の1つが他の顔に対して上下逆である場合には、上下逆の検出が有効である見込みが低いと考えられる。他の要因は、正しい検出が与えられたときに、めったに生じない環境のように、決定に影響を及ぼす。
プロセス400は、有効でないと決定された(412)検出を排除することにより(414)続けられる。この排除は、例えば、メモリから検出を削除し、検出を抑制指示に関連付け、又は検出を偽の肯定のリストに記憶することを含む。
検出が有効であると決定される場合(412)、又は無効検出が排除された後に(414)、プロセス400は、終了となる。
図4Bは、規範的な相関排除プロセス450を示すフローチャートである。画像が他の画像にも現れる個人に対応する顔を表すという指示に基づいて画像を他の画像と相関させることができる。相関を検査することで、おそらく発生しない状態を明らかにし、そして相関を排除する基礎をなすことができる。好都合なことに、おそらく生じないと決定された相関を排除することで、ユーザに与えられる情報のクオリティを改善することができる。例えば、同じ画像に現れる2つの顔は、同じ個人に相関させることができる。画像は、同じ個人に対応する2つの顔を表すことがめったにないので、(例えば、識別信頼性スコアにより決定される)見込みの低い相関を排除することで、おそらく無効となる相関を排除することができる。従って、排除は、全体的な相関の精度を改善することができる。
相関排除プロセス450は、顔を相関させることにより開始する(452)。一般に、顔を相関させることは、顔を潜在的に識別する画像において特徴を抽出することを含む。次いで、特徴を、他の顔の特徴と比較し、どちらの顔が同じ個人に対応するか識別することができる。特に、相関は、同じ顔キー(例えば、独特の識別子)を2つ以上の顔に与えることを含む。潜在的に、同じ顔キーを有する各顔が同じ個人に対応する。同じ顔キーを有する顔のグループをバケットと称する。又、相関は、顔のオリジナル画像を識別するために各顔に画像キーを与えることも含む。ある実施において、顔の相関(402)は、画像ごとに行われる。このようにすることで、バケットを更新する前に無効の相関を排除することができる。
又、顔の相関は、ユーザにより行うこともできる。例えば、ユーザは、グラフィックの顔を識別することができる。顔は、異なる個人のもので、ユーザにより与えられた情報と一致しないバケットにグループ化されると既に考えられている。
相関を検査することができる(454)。相関の検査は、顔キーと画像キーとを比較することを含む。この検査で、起こり得ない相関を発見することができる。幾つかの相関が起こり得ないと決定される場合には(456)、それら相関を排除することができる(458)。排除は、メモリから相関を削除し、相関を抑制指示に関連付け、又は相関を偽の肯定のリストに記憶することを含む。相関が起こり得ないものではないと決定され(456)、又は起こり得ない相関が排除された場合には(458)、プロセス450が終了となる。
例えば、顔を相関させることで、同じ画像からの2つの顔に同じ顔キーが指定される。画像が、同じ個人に対応する2つの顔を表すことはめったにないので、起こり得ない相関(例えば、信頼性の値で決定される)を排除することができる。更に、顔がバケット(例えば、相関システムにより指定された)に属するが、ユーザにより除去される場合には、バケットに残された顔も、誤って相関されることがあり、例えば、再評価することができる。
図5は、相関された顔を表示するための規範的なユーザインターフェイス502の図である。ユーザは、ユーザインターフェイス502に表示された1つ以上の画像に示された顔に関する情報を与えることができる。ユーザによって与えられるこの肯定識別は、1人以上の個人の画像をグループ化する基礎となる。更に、相関システムは、ユーザが情報を与えていない他の画像がおそらく既知の個人を表すことを決定する。肯定的に識別される画像のグループに画像を追加するのではなく、相関された画像をユーザインターフェイスの個別のエリアに与えることができる。好都合にも、ユーザは、自己相関の利益を得ると同時に、相関システムの決定を受け容れる必要がない。
ユーザインターフェイス502は、ユーザが相関システムからの情報を受け取ることができるようにする。ユーザインターフェイス502は、ユーザに提示されるグラフィック、テキスト及び/又は聴覚情報を含むことができ、又、ユーザから制御シーケンス(例えば、コンピュータキーボードでのキーストローク、コンピュータマウスの移動、及びタッチスクリーンでの選択)を受け取るメカニズムを含むことができる。ユーザインターフェイス502は、グラフィックユーザインターフェイス(GUI)であり、コンピュータキーボード及びマウスのような装置を経て入力を受け容れることができ、且つコンピュータディスプレイ(例えば、液晶ディスプレイ(LCD)モニタ)のような1つ以上の出力装置にグラフィック出力を与えることができる。又、ユーザインターフェイス502は、ウェブベースのユーザインターフェイス又はウェブユーザインターフェイス(WUI)でもあり、入力を受け容れると共に、ウェブページを発生することにより出力を与え、それらウェブページは、インターネットを経て送信され、ユーザにより、ウェブブラウザ(例えば、マイクロソフトインターネットエクスプローラ)を使用して見られる。又、ユーザインターフェイス502は、他の形式の出力を補足し又はそれを触覚型フィードバックに置き換える触覚インターフェイスを含むように実施することもできる。又、ユーザインターフェイス502は、合成入力・出力装置としてタッチスクリーンディスプレイを使用するタッチインターフェイスでもよく又はそれを含んでもよい。
ユーザインターフェイス502に表示されたメニュー516は、ユーザが相関システムの顔表示機能にアクセスするための手段を与えることができる。例えば、ユーザは、メニュー516の顔オプション518をクリックし、システムに既に利用できる個人のリスト(図示せず)が提示される。更に、ユーザは、個人のリストからある個人を選択し、個人の顔を含む画像を見ることができる。又、顔オプション518が選択されると、ユーザインターフェイスは、システムに表示された個人の1人以上を表示することができる。
ユーザインターフェイス502の顔表示エリア512は、所与の個人に関連した1つ以上の画像を含むことができる。規範的な顔表示エリア512は、個人の名前「ジェームス(James)」に関連付けられ、ジェームスに対応する2つの画像504及び506を含む。エリア512は、個人の画像を0(例えば、個人のプロフィールが生成されたが、それに対応する画像が識別されない場合)、1、又は多数含むことができる。更に、画像504及び506の一方又は両方は、ユーザによりジェームスと肯定的に識別された顔を含むことができる。ユーザにより肯定的に識別される顔に加えて、エリア512は、ユーザからの入力なしに相関システムにより識別された顔(例えば、高い信頼度でシステムにより識別された顔)を含むこともできる。
相関表示エリア514は、顔表示エリア512に含まれた画像に表示された同じ個人をおそらく表すと相関システムが決定した1つ以上の画像を含むことができる。ユーザは、ジェームスに対応する1つ以上の画像を肯定的に識別することができる。又、ユーザは、各画像における各顔を肯定的に識別する必要なく個人のより多くの画像を見る便利な手段としてエリア514にシステム識別画像を単に残すこともできる。これは、ユーザが数千の画像を自分のコンピュータに有するとすれば、多大な時間節約を許す。例えば、画像508は、たとえユーザが画像508における顔をジェームスに対応するものとして肯定的に識別しなかったとしても、ジェームスの他の画像と共に表示されるジェームスの画像である。或いは又、画像510は、ジェームスではない顔を表すことができ、ユーザは、その顔をジェームスではないとして否定的に識別することができる。このようにして、大多数の決定を正しく行う相関システムでは、ユーザは、ある顔を肯定的に識別し、その後、不一致画像だけを否定的に識別することにより、付加的な時間を節約することができる。
相関表示エリア514に対する画像は、バケットを使用して選択することができる。例えば、バケット内のある顔が肯定的に識別される場合には、バケット内の残りの顔を相関表示エリア514に表示することができる。というのは、それらが同じ個人に対応すると考えられるからである。
図6Aは、ユーザ入力を受け取るための規範的なユーザインターフェイス602の図である。一般的に、システムが画像内の顔を見出したこと及びシステムがその顔に対応する個人を潜在的に識別したことの両方を指示するユーザインターフェイスを提供することができる。
ユーザインターフェイス602は、個人606の顔を含む画像を表示することができる。長方形又は他のそのような輪郭であるマーカー604を使用して、画像内に顔があると考えられる場所を指示することができる。ユーザインターフェイス602は、個人(例えば、ジェームス)のアイデンティティを確認するダイアログボックス608を通して入力するか、さもなければ、識別情報を与えるようにユーザを促すことができる。ある実施形態では、ダイアログボックス608は、「イエス」オプション610及び「ノー」オプション612を含み、顔がジェームスに属するかどうかユーザが指示できるようにする。確認オプション610及び612のみを与えるダイアログボックス608は、相関システムが図示された個人606のアイデンティティに関して非常に確信があるときに与えることができる。ユーザがオプション610及び612の一方を選択すると、相関システムは、情報を使用して(例えば、それから学習して)、将来、より正確な相関を行えるようにする。又、このシステムは、新たな情報に基づいて既になされた決定を再評価することもできる。
図6Bは、ユーザ入力を受け取るための規範的なユーザインターフェイス652の図である。一般的に、このユーザインターフェイス652は、システムが画像内の顔を見出したことを指示し、そしてその顔の1つ以上の潜在的なアイデンティティを示唆するように構成することができる。
ユーザインターフェイス652は、個人656の顔を含む画像を表示することができる。マーカー654を使用して、顔が位置すると考えられる画像内の場所を指示することができる。ユーザインターフェイス652は、顔がまだ識別されていないことを指示し且つシステムにおける1つ以上の潜在的な一致の名前を示唆するダイアログボックス658を通してユーザから入力を要求することができる。例えば、ダイアログボックス658は、名前を示す選択可能な「ジェームス(James)」オプション660及びジェームスに関連した小さなサムネール又は他のそのようなアイコンを含むことができる。又、システムが、顔がウイリアム(William)に属するとも考える場合には、選択可能なウイリアムオプション662を設けることができる。画像に示された個人がシステムにおいてまだ識別されない場合には、新個人生成オプション664を設けることができる。新個人生成オプション664を選択すると、ユーザは、画像に対応する個人の名前及び他の情報を入力して、その後に画像をグループ化するのに使用できるプロフィールを生成することができる。又、ダイアログボックス608は、ユーザが表示された個人に対応する入力を与えることを望まない場合に無視オプション668を含むこともできる。
図6Cは、ユーザ入力を受け取るための規範的なユーザインターフェイス672の図である。一般的に、このユーザインターフェイス672は、顔のアイデンティティに関する入力を受け取るように構成することができる。
ユーザインターフェイス672は、個人676の顔を含む画像を表示することができる。顔は、相関システムにより又はユーザにより画像に位置付けることができる。例えば、ユーザは、システムが画像内の顔を発見しない場合には、個人676の顔をクリックすることができる。このようなケースでは、システムは、自動認識のために生じる情報をもたない。しかしながら、顔の位置をユーザが指示した後に、システムは、その位置を使用して、分析プロセスを再実行することができる。このプロセスは、顔の存在に関して潜在的に低い信頼性しか要求しない。というのは、ユーザは、顔がエリア内に存在することを指示するからである。又、顔は、例えば、ユーザ入力なしにシステムへロードされるのに応答して、システムにより検出することもできる。
マーカー674は、画像において特定の顔を指示するのに使用することができる。マーカー674は、画像が複数の顔を表すときに顔を他の顔から区別することができる。ユーザは、マーカー674に関連したX680をクリックすることによりマーカー674を却下することができる。ユーザは、例えば、システムが顔を正確に表さない何かを顔として誤って識別するときにマーカー674を却下することを望む。
ユーザインターフェイス672は、ユーザからダイアログボックス678を通して入力を要求することができる。例えば、システムは、個人がシステムにとって未知であるときに入力を要求することができる。ユーザがテキストボックス682にタイプし始めると、システムは、ユーザがタイプしたものと一致する人をシステムにリストするオプションメニュー684を与えることができる。例えば、ユーザがテキストボックス682に“ja”をタイプした場合に、システムは、“Jack”及び“James”をリストするオプションメニュー684を与えることができる。というのは、両方の名前がユーザによりタイプされた“ja”に一致するからである。次いで、ユーザは、一方の名前、例えば、名前ジャック(Jack)686をクリックし、名前で個人676を識別する。ダイアログボックス678は、例えば、顔マーカー674に関連したX680をユーザがクリックすることにより、ユーザが名前を入力せずに、却下することができる。又、ダイアログボックス678は、右上隅のX(図示せず)のような、却下のためのメカニズムを含むこともできる。
図7は、1つ以上のアルバムを生成するための規範的ユーザインターフェイス702の図である。アルバムは、特定の個人又は個人のグループのようなテーマに基づく画像のグループである。例えば、親は、両方の子供を示す画像のアルバム(即ち、an “and” album)を形成することができる。従って、アルバムの各画像は、両方の子供を表す。更に、親は、2人の子供のいずれかを示す画像のアルバム(即ち、an “or” album)も形成できる。従って、アルバムの各画像は、2人の子供の少なくとも一方を表す。
ユーザインターフェイス702は、ユーザがユーザインターフェイス702内をナビゲートできるように構成されたメニュー704を含むことができる。又、ユーザインターフェイス702は、2人の識別された個人708及び710のような1人以上の個人を含むこともできる。ジェームスのアルバム708は、彼の名前“James”と、彼が描写された画像(例えば、写真)の枚数14とを与える情報712と共に示されている。又、ジェームスアルバム708のカバー画像713も表示することができる。カバー画像は、ユーザにより選択することもできるし、或いは検出された顔の画質、又は画像が見られた回数のような1つ以上の基準に基づいて自動的に選択することができる。バートのアルバム710も、同様に、彼の名前と、アルバムに含まれる画像(例えば、写真)の枚数とを与える情報714と共に示されている。
動作中に、ジェームスアルバム708及びバートアルバム710の両方からの画像を含む新たなスマートアルバムを生成するため、ユーザは、ジェームスアルバム708をメニューのスマートアルバムエリア706へドラグし(716)、そしてジェームスアルバム708をドロップすることができる。又、ユーザは、バートアルバム710をスマートアルバムエリア706へドラグし(718)、そしてバートアルバム710もそこにドロップすることができる。両アルバム708及び710をドラグすることにより、システムは、両方の人を一緒に含む写真アルバム又はいずれかの人を含む写真アルバムのいずれかを生成することができる。名前付き個人に関連したアルバムがスマートアルバムエリア706にドロップされたときには、デフォールトにより一形式のアルバム又は他のものを生成することができる。或いは又、ユーザは、生成されるアルバムの形式を選択するように促されてもよい。
図8は、ユーザ入力を受け取るための規範的なユーザインターフェイス802の図である。一般的に、相関システムは、同じ個人を表現すると考えられる画像を単一のバケットへ一緒にグループ化することができる。バケットを、例えば、同じ個人の画像を各々含む合成された2つのバケットへと変更するためのユーザインターフェイス802を設けることができる。ある実施形態は、図8に示すバケットコンセプトを含むが、バケットを変更するか又はバケットと対話するためのユーザインターフェイス(例えば、ユーザインターフェイス802)は含まない。
ユーザインターフェイス802は、このユーザインターフェイス802をナビゲートするためのメニュー818を含むことができる。メニュー818においてバケットオプション820を選択することで、表示されるべき1つ以上のバケットを変更するためのインターフェイス802となる。例えば、相関プロセスは、3つのバケット804、806及び808を発生することができる。ユーザは、第1のバケット804を、特定の個人(例えば、ジェームス)の画像を有するものとして識別してもよい。インターフェイス802は、名前付き個人に関する情報810、例えば、その名前及び画像(例えば、写真)の枚数を第1バケット804に表示することができる。又、第1バケット804は、個人を表示するアイコン822を含むこともできる。同様に、インターフェイス802は、第2バケット806に対応するアイコン824及び情報812と、第3バケット808に対応するアイコン826及び情報814とを表示することができる。
動作中に、ユーザは、第3バケット808を、別のバケット、例えば、第1バケット804へドラグ(816)して、バケットを合体することができる。2つの画像グループを合併するのに加えて、第1バケット804を第3バケット808に合体することで、付加的な情報をシステムに与えることもできる。例えば、システムは、ジェームスに関連した認識基準を、第3バケット808に含まれた付加的な画像に基づいて洗練化することができる。2つのバケットに矛盾する名前が付いている場合には、標準的な合体ルールを使用することができる(例えば、結果的に得られる合体されたバケットに対してどの名前が正しいかユーザが選択することを必要とする)。
図9は、規範的な相関技術を示す図である。バケット内の画像をグループ化することにより、相関システムは、帰納推理を使用して、バケットの個々のメンバーについて知っている情報からバケット全体に関して決定することができる。
画像のグループ902は、相関システムにより処理することができる。画像のグループ902は、個人の顔を表現することができる。相関プロセス904の間に、画像のグループ902は、分割されて、バケット906、908又は910へ指定される。画像のグループ902の各画像は、バケット906、908及び910の1つのようなバケットに指定される。潜在的に、画像のグループ902の1つ以上を複数のバケットに指定することができる(例えば、1つの画像が2人以上の人を表す場合)。
相関904の後に、バケットA906は、画像1 912、画像3 914、画像4 916及び画像5 918を含む。これら画像各々は、スレッシュホールド信頼性レベルに基づいて、同じ個人の顔を表現する。更に、バケットB 908は、画像2 920、画像6 922及び画像8 924を含む。更に、バケットC 910は、画像7 926及び画像9 928を含む。これらバケット906、908及び910の各々は、同じ相関基準に基づいて生成することができる。
動作中、相関システムは、ユーザに画像1 912を提示することができる(930)。ユーザは、画像1 912を見ることを要求するか、又は画像1 912で促される。画像1 912が提示されると、ユーザは、それに応答する(934)。この応答は、例えば、ユーザインターフェイスを通してユーザに提示されたダイアログボックス(例えば、図6Bに示すダイアログ658)内のオプションをクリックすることを含む。又、この応答は、画像1 912における顔の肯定的識別(ID)932も含む。次いで、この肯定的ID932を使用して、例えば、画像3 914が同じ個人のものであると決定することができる。従って、確立された信頼性レベルに基づき、バケット内の1つの画像の識別を使用して、そのバケット内の残りの画像の各々を識別することができる。同様に、相関システムは、ユーザに画像7 926を提示することができる。ユーザは、それに応答し(946)、画像7 926内の顔の肯定的ID944を与えることができる。次いで、肯定的ID944を使用して、例えば、画像9 928が、識別944でアイデンティティが確認された同じ個人のものであることを決定する。
更に、相関システムは、ユーザに画像2 920を提示することができる(936)。ユーザは、それに応答し(940)、そして画像2 920における顔が特定の個人のものでないことを指示する否定的ID938を与えることができる。このID938を使用して、例えば、画像6 922も、識別された個人938でないことを決定することができる。
又、相関システムは、ユーザにより与えられる肯定的及び否定的情報の一方又は両方を合成して、更なる決定を行うこともできる。例えば、肯定的ID932及び944が同じ個人のものである場合には、画像9 928及び画像3 914が潜在的に同じ個人であると決定することができる。更に、否定的ID938が、肯定的ID932と同じ個人のものである場合には、画像6 922は、おそらく、画像3 914に示された同じ個人ではないと決定することができる。
図10は、アルバムカバーの選択を示す図である。アルバムは、テーマに基づく画像のグループである。例えば、名前付きの個人は、その個人の全ての画像1034のアルバム1001を有することができる。ユーザは、カバーされるべきアルバムから画像1004の1つ(例えば、アルバムをグラフィックで識別するのに使用される画像)を選択することができる。或いは又、第1の画像のように、アルバムカバーを、アルバム1002から自動的に選択することができる。しかしながら、ユーザが画像を選択しないときには、第1の画像は、カバーとして使用するための個人の最良の表現ではないことがある。従って、ユーザ入力なしに画像を特徴づけるデータに基づいて満足なカバー画像を選択することができる。ある実施形態では、カバー画像は、アルバムに関連した個人の顔を強調するためにカバー画像を自動的に切断することもできる。
動作中に、アルバム1002内の画像1034に関して知られている情報を使用してカバーを選択することができる。例えば、画像1004は、画像データ1006を含むことができる。グラフィックデータ1012、メタデータ1020、及び分析データ1028のような複数の形式の画像データ1006が存在する。グラフィックデータ1012は、例えば、画像の解像度1008、及び画像に表された顔の鮮明さ1010を含む。解像度の高い画像は、解像度の低い画像より良好に見える。同様に、鮮明な(例えば、焦点の合った)顔は、ぼけた顔より良好に見える。
メタデータ1020は、画像が撮影された日付1014と、格付け1016と、ウェブポスティングログ1018とを含むことができる。日付1014は、画像が比較的最近のもので、一時的であり且つアルバムの他の画像に対するものであるかどうか決定するのに使用できる。格付け1016は、画像の1つ以上のユーザ評価を指示する格付けである。ウェブポスティングログ1018は、例えば、ユーザが画像をソーシャルネットワークウェブサイトへアップロードすることに関する情報を含み、これは、次いで、ユーザが画像をより上位に考えることを指示する。
分析データ1028は、画像1004内の他の顔からの距離1022、信頼性1024(例えば、認識又は検出の)及び顔角度1026を含むことができる。距離1022は、顔をカバーのために自動的に切断する場合に有用である。1つ以上の他の顔に接近した顔を自動的に切断すると、他の誰かの顔の一部分がカバーに表現されるか、又は対象者の顔が窮屈に切断され過ぎることになる。信頼性1024は、顔が実際に当該対象者に対応する可能性がどれほどあるかを指示することができる。従って、アルバムカバーは、ユーザにより肯定的に識別された顔ではなく対象者の顔を表すために相関システムにより決定される画像である。更に、たとえ画像がユーザにより肯定的に識別されたときでも、信頼性1024は、画像がアルバム1002内の他の画像にどれほど密接に相関するかを評価することにより画像が個人を表すものであるかどうか決定する上で助けとなる。更に、顔の角度1026を使用すると、例えば、プロフィールではなく、ビューワーに直接向いた顔を選択する上で助けとなる。
アルバムにおける種々の画像1034は、例えば、各画像に対する画像データのコンポーネントを使用して、比較することができる(1030)。この比較1030に基づいて、視覚に訴えそして画像のグループ1034を表すカバーを選択することができる(1032)。
本書に述べる要旨及び機能的オペレーションは、電子回路、コンピュータソフトウェア、ファームウェア又はハードウェア、或いはその組み合わせ又は等効物において実施することができる。要旨は、マシン読み取り可能な記憶装置又はマシン読み取り可能な記憶メディアを含む装置又はメディアで有形に実施される1つ以上のコンピュータプログラムのような1つ以上のコンピュータプログラム製品として実施することができる。マシン読み取り可能とは、光学的に読み取り可能であることを含み、例えば、光の助けで読み取り可能な基板上に作られた光学的に読み取り可能な物理的マークを含む。又、マシン読み取り可能とは、磁化可能な材料で作られた物理的パターンを伴う磁気的に解釈可能な記憶又は記録も含む。1つ以上のプロセッサ又はコンピュータを含むデータ処理装置により実行するための、又はそのオペレーションを制御するための、コンピュータプログラム製品を使用することもできる。データ処理装置は、ハードウェア、プロセッサファームウェア、プロトコルスタック、データベースマネージメントシステム、及びオペレーティングシステムのいずれかを含むことができる。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション又はコードとしても知られている)は、コンパイルされ又は解釈された言語を含むプログラミング言語で書くことができ、そしてスタンドアローンプログラム又はモジュール、コンポーネント、サブルーチン、或いはコンピューティング環境に使用するのに適した他のユニットとして含まれる種々のフォーマットで展開することができる。コンピュータプログラムは、必ずしも、ファイルに対応しない。コンピュータプログラムは、他のプログラム又はデータを保持するファイルの一部分、当該プログラムに専用の単一のファイル、或いは複数の整合されたファイル(例えば、1つ以上のモジュール、サブプログラム、又はコードの部分を記憶するファイル)に記憶することができる。コンピュータプログラムは、1つのコンピュータ、1つのサイトにおける複数のコンピュータ、又は複数のサイトにわたって分散されて、ネットワーク又はネットワークのインターネットワーク(例えば、インターネット)のような通信ネットワークで相互接続された複数のコンピュータにおいて実行することができる。
本書に述べるプロセス及びロジックフローは、入力データに対して動作して出力を発生するコンピュータプログラム製品により遂行することができる。コンピュータプログラム製品の実行に適したプロセッサは、汎用及び特殊目的マイクロプロセッサ、並びに1つ以上のコンピュータプロセッサを含む。プロセッサは、リードオンリメモリ、ランダムアクセスメモリ、又はその両方からインストラクション及びデータを受け取り、検索し及び実行することができる。
コンピュータは、インストラクションを実行するためのプロセッサと、インストラクション及びデータを記憶するための1つ以上のメモリ装置とを含むことができる。又、コンピュータは、データを記憶するための1つ以上の大量記憶装置、例えば、磁気ディスク、磁気−光学ディスク、又は光学ディスクも備え、或いはそこからデータを受け取り、そこへデータを転送し、又はその両方を行うように作動的に結合される。コンピュータは、別の装置、例えば、移動電話、デジタルカメラ、デジタルスキャナ、デジタルビデオレコーダ、パーソナルデジタルアシスタント(PDA)、移動オーディオプレーヤ、或いはグローバルポジショニングシステム(GPS)受信器において実施することができる。コンピュータプログラムインストラクション及びデータを実施するのに適したマシン読み取り可能な記憶装置又は記憶メディアは、不揮発性メモリ、例えば、半導体メモリ装置(例えば、EPROM、EEPROM及びフラッシュメモリ装置)、磁気ディスク(例えば、内部ハードディスク又は取り外し可能なディスク)、磁気−光学ディスク、並びにCD−ROM及びDVD−ROMディスクを含む。プロセッサ及びメモリは、特殊目的のロジック回路により捕捉され又はそこに合体される。
ユーザ双方向作用は、ユーザに情報を表示するためのディスプレイ装置、例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタと、ユーザが入力を与えるために使用する任意の形式の入力装置、例えば、キーボード、及びポインティング装置、例えば、マウス又はトラックボールと、を有するコンピュータ又は他の装置において実施することができる。他の種類の装置を使用して、ユーザとの双方向作用を与えることもでき、例えば、ユーザに与えられるフィードバックは、任意の形態の感覚フィードバック、例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックであり、そしてユーザからの入力は、音響、スピーチ又は触覚入力を含む任意の形態で受け取ることができる。
幾つかの実施形態をここに開示した。それでも、本発明の精神及び範囲から逸脱せずに種々の変更がなされ得ることが理解されよう。従って、特許請求の範囲内で他の実施形態も考えられる。
102:デジタルカメラ
104、106、108、110:画像
112:コンピュータシステム
114:相関システム
116、118、120:画像グループ
200:システム
202:デジタルカメラ
204:コンピュータシステム
206:ネットワーク
208:リモートサーバー
210:記憶装置
212:相関システム
214:ユーザインターフェイス
216:ユーザ入力モジュール
218:前処理モジュール
220:顔分析エンジン
222:後処理モジュール
224:帰納的モジュール
226:相関モジュール
300:相関プロセス

Claims (20)

  1. 画像を編成するためのコンピュータ実施方法において、
    人間の顔の表現を含む画像を受け取る段階と、
    受け取った画像に表された人間の顔が、記憶された顔プロフィールに対応する見込みを指示する相関値を発生する段階であって、記憶された顔プロフィールが、同じ個人に対応する人間の顔の表現をそれぞれ含む2つ以上のプロフィール画像に関連している、段階と、
    受け取った画像及び発生された相関値を評価して、その評価の結果に基づき、受け取った画像がその記憶された顔プロフィールに対応するかどうか決定する段階と、
    受け取った画像がその記憶された顔プロフィールに対応することの決定に応答して、受け取った画像を記憶された顔プロフィールに関連付ける段階と、
    その関連付けの指示を記憶する段階と、を備え、さらに、
    人間の顔を表す非分類画像、非分類画像情報、及び人間の顔が前記記憶された顔プロフィールに対応する見込みを指示する非分類相関値を受け取る段階と、
    初期相関値スレッシュホールドを確立する段階と、
    その初期相関値スレッシュホールド及び非分類相関値に基づき非分類画像をグループ化する段階と、
    一緒にグループ化された非分類画像の量及び非分類画像のグループの総数に基づき改訂された相関スレッシュホールドを導出する段階と、
    その改訂された相関スレッシュホールド及び非分類の相関値に基づいて非分類画像を再グループ化する段階と、
    その非分類画像の1つ以上のグループを、再グループ化に基づいて前記記憶された顔プロフィールに関連付ける段階と、
    を備えたコンピュータ実施方法。
  2. 前記相関値は、受け取った画像が別の記憶された顔プロフィールに対応することを指示し、前記評価は、受け取った画像の第1メタデータ及び2つ以上のプロフィール画像の第2メタデータを評価することを更に含む、請求項1に記載のコンピュータ実施方法。
  3. 2つ以上のプロフィール画像、及びその2つ以上のプロフィール画像に関連したプロフィール情報をアドレス帳アプリケーションから得る段階と、
    2つ以上のプロフィール画像及びプロフィール情報に基づいて前記記憶された顔プロフィールを発生する段階と、
    を更に備えた請求項1に記載のコンピュータ実施方法。
  4. 前記評価に基づいて、受け取った画像に表された人間の顔が前記記憶された顔プロフィールに対応することを確認するようユーザを促す段階と、
    そのように促すことに応答して、受け取った画像に表された人間の顔が前記記憶された顔プロフィールに対応するという確認を受け容れる段階と、
    を更に備えた請求項1に記載のコンピュータ実施方法。
  5. 前記受け容れは、肯定応答オプション及び否定応答オプションを有するユーザインターフェイスを経て受け容れることを更に含む、請求項4に記載のコンピュータ実施方法。
  6. 画像が人間の顔を表す見込みが90%未満であることを指示する検出情報にアクセスする段階と、
    画像が皮膚トーンカラー及び鮮明な画像細部を描写することを確立する段階と、
    その確立に基づいて、画像が人間の顔を表すことを確認する段階と、
    を含む請求項1に記載のコンピュータ実施方法。
  7. 検出情報、受け取った画像又は相関値の1つ以上に基づき、受け取った画像をキー画像として選択する段階と、
    そのキー画像を、記憶された顔プロフィールのアイコンとして表示する段階と、
    を含む請求項6に記載のコンピュータ実施方法。
  8. 受け取った画像は、鮮明さの指示、捕獲日付、又は受け取った画像の解像度の1つ以上を含む、請求項7に記載のコンピュータ実施方法。
  9. 前記検出情報は、受け取った画像に表された人間の顔から、受け取った画像に描写された別の人間の顔までの距離、又は受け取った画像に対する人間の顔の角度、の1つ以上を含む、請求項7に記載のコンピュータ実施方法。
  10. 人間の顔は、第1の人間の顔を含み、そして前記コンピュータ実施方法は、更に、
    受け取った画像に表された第2の人間の顔と、前記記憶された顔プロフィールとの間の潜在的な対応性を導出する段階と、
    前記記憶された顔プロフィールに対応する第1の人間の顔及び前記相関値に基づき前記導出された潜在的な対応性を無視する段階と、
    を含む請求項1に記載のコンピュータ実施方法。
  11. 前記記憶された顔プロフィールは、第1の記憶された顔プロフィールを含み、受け取った画像に表された前記人間の顔は、第1の人間の顔を含み、前記コンピュータ実施方法は、
    第1の記憶された顔プロフィール及び第2の記憶された顔プロフィールをユーザインターフェイスに提示する段階であって、第2の記憶された顔プロフィールが第2の人間の顔を表す1つ以上の画像を含むような段階と、
    前記第1の記憶された顔プロフィールを前記第2の記憶された顔プロフィールに関連付ける指示をユーザインターフェイスにおいて受け取る段階と、
    前記第1の記憶された顔プロフィール及び前記第2の記憶された顔プロフィールから1つ以上のプロフィール画像を含む合成アルバムを発生する段階と、
    を備えた請求項1に記載のコンピュータ実施方法。
  12. ユーザインターフェイス装置と、
    実行可能なソフトウェアインストラクション及び画像データを記憶するように動作できる記憶装置と、
    前記ユーザインターフェイス装置及び前記記憶装置と対話し、且つ
    人間の顔の表現を含む画像を受け取り、
    受け取った画像に表された人間の顔が、記憶された顔プロフィールに対応する見込みを指示する相関値を発生し、記憶された顔プロフィールが、同じ個人に対応する人間の顔の表現をそれぞれ含む2つ以上のプロフィール画像に関連しており、
    受け取った画像及び発生された相関値を評価して、その評価の結果に基づき、画像がその記憶された顔プロフィールに対応するかどうか決定し、
    受け取った画像がその記憶された顔プロフィールに対応することの決定に応答して、前記ユーザインターフェイス装置を使用して、前記受け取った画像を前記記憶された顔プロフィールに関連して表示する、
    ことを含むオペレーションを遂行するように動作できる1つ以上のコンピュータと、を備えたシステムであって、さらに、
    人間の顔を表す非分類画像を、人間の顔が前記記憶された顔プロフィールに対応する見込みを指示する関連相関値と共に受け取り、
    初期相関値スレッシュホールドを確立し、
    その初期相関値スレッシュホールド及び前記関連相関値に基づき非分類画像をグループ化し、
    一緒にグループ化された非分類画像の数及び非分類画像のグループの総数に基づき改訂された相関スレッシュホールドを導出し、
    その改訂された相関スレッシュホールド及び非分類相関値に基づいて非分類画像を再グループ化し、
    その非分類画像の1つ以上のグループを、再グループ化に基づいて前記記憶された顔プロフィールに関連付ける、ことを含むシステム
  13. データを受け取り、且つ
    前記2つ以上のプロフィール画像及びその2つ以上のプロフィール画像に関連したプロフィール情報を、外部入力を経て得る、
    ことを含む入力オペレーションを遂行するように動作できる外部入力を更に備えた、請求項1に記載のシステム。
  14. 前記オペレーションは、更に、
    前記得られた2つ以上のプロフィール画像及びプロフィール情報に基づいて前記記憶された顔プロフィールを発生する、
    ことを含む請求項1に記載のシステム。
  15. 前記外部入力は、前記2つ以上のプロフィール画像及びプロフィール情報をアドレス帳アプリケーションから得るためのアドレス帳アプリケーションアダプタを備えた、請求項1に記載のシステム。
  16. 前記オペレーションは、更に、
    前記決定に基づき、受け取った画像に表された人間の顔が前記記憶された顔プロフィールに対応することを確認するよう前記ユーザインターフェイス装置を経てユーザを促し、 そのように促すことに応答して、受け取った画像に表された人間の顔が前記記憶された顔プロフィールに対応するという前記ユーザインターフェイス装置を経ての確認を受け容れる、
    ことを含む請求項1に記載のシステム。
  17. 前記オペレーションは、更に、
    受け取った前記画像又は相関値の1つ以上に基づいて、受け取った前記画像をキー画像として選択し、
    前記キー画像を前記記憶された顔プロフィールに関連したアイコンとして表示する、
    ことを含む請求項1に記載のシステム。
  18. 受け取った前記画像は、鮮明さの指示、捕獲日付、又は受け取った画像の解像度の1つ以上を含む、請求項1に記載のシステム。
  19. 受け取った画像に表された前記人間の顔は、第1の人間の顔を含み、前記オペレーションは、更に、
    受け取った画像に表された第2の人間の顔と、前記記憶された顔プロフィールとの間の潜在的な対応性を導出し、
    前記記憶された顔プロフィールに対応する第1の人間の顔及び前記相関値に基づき前記導出された潜在的な対応性を無視する、
    ことを含む請求項1に記載のシステム。
  20. 前記記憶された顔プロフィールは、第1の記憶された顔プロフィールを含み、受け取った画像に表された前記人間の顔は、第1の人間の顔を含み、前記システムは、更に、
    第1の記憶された顔プロフィール及び第2の記憶された顔プロフィールを、前記ユーザインターフェイス装置を通して提示し、第2の記憶された顔プロフィールが第2の人間の顔を表す1つ以上の画像を含み、
    前記第1の記憶された顔プロフィールを前記第2の記憶された顔プロフィールに関連付ける指示を、前記ユーザインターフェイス装置を通して受け取り、
    前記第1の記憶された顔プロフィール及び前記第2の記憶された顔プロフィールから1つ以上のプロフィール画像を含む合成アルバムを発生する、
    ことを含む請求項1に記載のシステム。
JP2011544642A 2009-01-05 2010-01-04 顔を相関させることによるデジタル画像の編成 Active JP5403838B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US14260609P 2009-01-05 2009-01-05
US61/142,606 2009-01-05
US12/436,069 US9495583B2 (en) 2009-01-05 2009-05-05 Organizing images by correlating faces
US12/436,069 2009-05-05
PCT/US2010/020040 WO2010078553A2 (en) 2009-01-05 2010-01-04 Organizing digital images by correlating faces

Publications (2)

Publication Number Publication Date
JP2012514795A JP2012514795A (ja) 2012-06-28
JP5403838B2 true JP5403838B2 (ja) 2014-01-29

Family

ID=42232602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011544642A Active JP5403838B2 (ja) 2009-01-05 2010-01-04 顔を相関させることによるデジタル画像の編成

Country Status (8)

Country Link
US (1) US9495583B2 (ja)
EP (1) EP2384484A2 (ja)
JP (1) JP5403838B2 (ja)
KR (1) KR101346539B1 (ja)
CN (1) CN102365645B (ja)
AU (1) AU2010203220B2 (ja)
GB (1) GB2480177B (ja)
WO (1) WO2010078553A2 (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600174B2 (en) 2005-09-28 2013-12-03 Facedouble, Inc. Method and system for attaching a metatag to a digital image
US8639028B2 (en) * 2006-03-30 2014-01-28 Adobe Systems Incorporated Automatic stacking based on time proximity and visual similarity
US7831141B2 (en) 2007-03-29 2010-11-09 Sony Ericsson Mobile Communications Ab Mobile device with integrated photograph management system
US8316096B2 (en) 2008-04-29 2012-11-20 Kota Enterprises, Llc Facemail
US9514355B2 (en) * 2009-01-05 2016-12-06 Apple Inc. Organizing images by correlating faces
US10706601B2 (en) 2009-02-17 2020-07-07 Ikorongo Technology, LLC Interface for receiving subject affinity information
US9210313B1 (en) 2009-02-17 2015-12-08 Ikorongo Technology, LLC Display device content selection through viewer identification and affinity prediction
US9727312B1 (en) 2009-02-17 2017-08-08 Ikorongo Technology, LLC Providing subject information regarding upcoming images on a display
US20100216441A1 (en) * 2009-02-25 2010-08-26 Bo Larsson Method for photo tagging based on broadcast assisted face identification
US8301996B2 (en) * 2009-03-19 2012-10-30 Microsoft Corporation Annotating images with instructions
US8460215B2 (en) * 2009-06-08 2013-06-11 The Brigham And Women's Hospital, Inc. Systems and methods for predicting potentially difficult intubation of a subject
US9003290B2 (en) * 2009-12-02 2015-04-07 T-Mobile Usa, Inc. Image-derived user interface enhancements
US9465993B2 (en) * 2010-03-01 2016-10-11 Microsoft Technology Licensing, Llc Ranking clusters based on facial image analysis
WO2011154031A1 (en) * 2010-06-07 2011-12-15 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for organizing images
US8774561B2 (en) 2010-09-01 2014-07-08 Apple Inc. Consolidating information relating to duplicate images
US8630494B1 (en) 2010-09-01 2014-01-14 Ikorongo Technology, LLC Method and system for sharing image content based on collection proximity
KR101429962B1 (ko) * 2010-11-22 2014-08-14 한국전자통신연구원 기억 회상용 데이터 처리 시스템 및 그 방법
KR101029160B1 (ko) * 2011-02-07 2011-04-13 (주)올라웍스 이미지 데이터베이스에 신규 이미지 및 이에 대한 정보를 추가하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
US9251854B2 (en) 2011-02-18 2016-02-02 Google Inc. Facial detection, recognition and bookmarking in videos
US9317530B2 (en) 2011-03-29 2016-04-19 Facebook, Inc. Face recognition based on spatial and temporal proximity
US9552376B2 (en) 2011-06-09 2017-01-24 MemoryWeb, LLC Method and apparatus for managing digital files
US8873813B2 (en) * 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
US9256620B2 (en) * 2011-12-20 2016-02-09 Amazon Technologies, Inc. Techniques for grouping images
KR101339900B1 (ko) * 2012-03-09 2014-01-08 한국과학기술연구원 2차원 단일 영상 기반 3차원 몽타주 생성 시스템 및 방법
US8422747B1 (en) 2012-04-16 2013-04-16 Google Inc. Finding untagged images of a social network member
US8666123B2 (en) 2012-04-26 2014-03-04 Google Inc. Creating social network groups
CN103513890B (zh) * 2012-06-28 2016-04-13 腾讯科技(深圳)有限公司 一种基于图片的交互方法、装置和服务器
KR101731404B1 (ko) * 2013-03-14 2017-04-28 인텔 코포레이션 음성 및/또는 안면 인식 기반 서비스 제공
JP5859471B2 (ja) * 2013-03-19 2016-02-10 富士フイルム株式会社 電子アルバム作成装置および電子アルバムの製造方法
US9378768B2 (en) * 2013-06-10 2016-06-28 Htc Corporation Methods and systems for media file management
US9910865B2 (en) 2013-08-05 2018-03-06 Nvidia Corporation Method for capturing the moment of the photo capture
US20150085146A1 (en) * 2013-09-23 2015-03-26 Nvidia Corporation Method and system for storing contact information in an image using a mobile device
US9811245B2 (en) * 2013-12-24 2017-11-07 Dropbox, Inc. Systems and methods for displaying an image capturing mode and a content viewing mode
KR102230267B1 (ko) 2014-09-04 2021-03-19 삼성전자주식회사 영상 표시 장치 및 방법
CN104573642B (zh) * 2014-12-26 2018-09-04 小米科技有限责任公司 人脸识别方法及装置
SG10201912947XA (en) 2015-10-21 2020-02-27 15 Seconds Of Fame Inc Methods and apparatus for false positive minimization in facial recognition applications
CN105426485A (zh) * 2015-11-20 2016-03-23 小米科技有限责任公司 图像合并方法和装置、智能终端和服务器
CN105678266A (zh) * 2016-01-08 2016-06-15 北京小米移动软件有限公司 一种合并人脸相册的方法及装置
JP6779683B2 (ja) * 2016-07-06 2020-11-04 オリンパス株式会社 画像検索装置、画像検索方法及びプログラム
EP3639194A1 (en) * 2017-06-12 2020-04-22 Intergraph Corporation System and Method for Generating a Photographic Police Lineup
CN108182714B (zh) * 2018-01-02 2023-09-15 腾讯科技(深圳)有限公司 图像处理方法及装置、存储介质
US11432982B2 (en) * 2018-03-26 2022-09-06 Augustine Biomedical + Design, LLC Relocation module and methods for surgical equipment
US10936856B2 (en) 2018-08-31 2021-03-02 15 Seconds of Fame, Inc. Methods and apparatus for reducing false positives in facial recognition
US10936178B2 (en) 2019-01-07 2021-03-02 MemoryWeb, LLC Systems and methods for analyzing and organizing digital photos and videos
US11010596B2 (en) 2019-03-07 2021-05-18 15 Seconds of Fame, Inc. Apparatus and methods for facial recognition systems to identify proximity-based connections
US11283937B1 (en) 2019-08-15 2022-03-22 Ikorongo Technology, LLC Sharing images based on face matching in a network
US11341351B2 (en) 2020-01-03 2022-05-24 15 Seconds of Fame, Inc. Methods and apparatus for facial recognition on a user device
US11468869B2 (en) * 2020-08-18 2022-10-11 Micron Technology, Inc. Image location based on perceived interest and display position
CN112395037B (zh) * 2020-12-07 2024-01-05 深圳云天励飞技术股份有限公司 一种动态封面的选取方法、装置、电子设备及存储介质
KR20230033530A (ko) * 2021-09-01 2023-03-08 김병석 이미지 획득 장치 및 그 방법
US20230196832A1 (en) * 2021-12-21 2023-06-22 Western Digital Technologies, Inc. Ranking Images in an Image Group
US20230196831A1 (en) * 2021-12-21 2023-06-22 Western Digital Technologies, Inc. Image Group Classifier in a User Device

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450504A (en) * 1992-05-19 1995-09-12 Calia; James Method for finding a most likely matching of a target facial image in a data base of facial images
AUPP400998A0 (en) * 1998-06-10 1998-07-02 Canon Kabushiki Kaisha Face detection in digital images
WO2001015086A1 (fr) 1999-08-19 2001-03-01 Sony Corporation Processeur d'images, procede de traitement d'images et support enregistre
US6940545B1 (en) * 2000-02-28 2005-09-06 Eastman Kodak Company Face detecting camera and method
KR100438841B1 (ko) 2002-04-23 2004-07-05 삼성전자주식회사 이용자 검증 및 데이터 베이스 자동 갱신 방법, 및 이를이용한 얼굴 인식 시스템
US20050031173A1 (en) 2003-06-20 2005-02-10 Kyungtae Hwang Systems and methods for detecting skin, eye region, and pupils
US8948468B2 (en) 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US8189927B2 (en) * 2007-03-05 2012-05-29 DigitalOptics Corporation Europe Limited Face categorization and annotation of a mobile phone contact list
US7844076B2 (en) * 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US7286723B2 (en) * 2003-06-27 2007-10-23 Hewlett-Packard Development Company, L.P. System and method for organizing images
US7190829B2 (en) 2003-06-30 2007-03-13 Microsoft Corporation Speedup of face detection in digital images
US7274822B2 (en) * 2003-06-30 2007-09-25 Microsoft Corporation Face annotation for photo management
KR100816607B1 (ko) 2003-10-21 2008-03-24 닛본 덴끼 가부시끼가이샤 화상 대조 시스템, 화상 대조 방법 및 컴퓨터로 판독가능한 기록 매체
JP2006011935A (ja) * 2004-06-28 2006-01-12 Sony Corp 個人情報管理装置,個人情報ファイル作成方法,および個人情報ファイル検索方法
KR100668303B1 (ko) * 2004-08-04 2007-01-12 삼성전자주식회사 피부색 및 패턴 매칭을 이용한 얼굴 검출 방법
JP2006072614A (ja) 2004-09-01 2006-03-16 Matsushita Electric Ind Co Ltd 画像ファイルの保存方法およびその関連技術
US20060222217A1 (en) 2005-03-31 2006-10-05 Fuji Photo Film Co., Ltd. Method, apparatus, and program for discriminating faces
KR100724932B1 (ko) 2005-08-02 2007-06-04 삼성전자주식회사 얼굴 검출 장치 및 방법
JP4218711B2 (ja) 2006-08-04 2009-02-04 ソニー株式会社 顔検出装置、撮像装置および顔検出方法
JP2008117271A (ja) 2006-11-07 2008-05-22 Olympus Corp デジタル画像の被写体認識装置、プログラム、および記録媒体
JP2008141740A (ja) 2006-11-07 2008-06-19 Fujifilm Corp 撮影装置および方法並びにプログラム
JP4845715B2 (ja) * 2006-12-22 2011-12-28 キヤノン株式会社 画像処理方法、画像処理装置、プログラム、及び記憶媒体
US8189880B2 (en) * 2007-05-29 2012-05-29 Microsoft Corporation Interactive photo annotation based on face clustering
JP4434236B2 (ja) 2007-06-11 2010-03-17 ソニー株式会社 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム
US9639740B2 (en) * 2007-12-31 2017-05-02 Applied Recognition Inc. Face detection and recognition
CA2897227C (en) * 2007-12-31 2017-01-10 Applied Recognition Inc. Method, system, and computer program for identification and sharing of digital images with face signatures
WO2010006367A1 (en) * 2008-07-16 2010-01-21 Imprezzeo Pty Ltd Facial image recognition and retrieval
US7916905B2 (en) 2009-02-02 2011-03-29 Kabushiki Kaisha Toshiba System and method for image facial area detection employing skin tones
JP6089577B2 (ja) * 2012-10-19 2017-03-08 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム

Also Published As

Publication number Publication date
JP2012514795A (ja) 2012-06-28
GB2480177B (en) 2015-07-22
CN102365645B (zh) 2014-08-20
AU2010203220B2 (en) 2014-06-12
US20100172550A1 (en) 2010-07-08
WO2010078553A3 (en) 2010-08-26
EP2384484A2 (en) 2011-11-09
US9495583B2 (en) 2016-11-15
KR101346539B1 (ko) 2013-12-31
AU2010203220A1 (en) 2011-08-25
WO2010078553A2 (en) 2010-07-08
GB201113493D0 (en) 2011-09-21
GB2480177A (en) 2011-11-09
CN102365645A (zh) 2012-02-29
KR20110124223A (ko) 2011-11-16

Similar Documents

Publication Publication Date Title
JP5403838B2 (ja) 顔を相関させることによるデジタル画像の編成
US9977952B2 (en) Organizing images by correlating faces
JP7458328B2 (ja) マルチ分解能登録を介したマルチサンプル全体スライド画像処理
EP2567536B1 (en) Generating a combined image from multiple images
US9554030B2 (en) Mobile device image acquisition using objects of interest recognition
CN107408212B (zh) 用于识别存储在设备上的不需要的照片的系统和方法
JP4516778B2 (ja) データ処理システム
US10403014B2 (en) Image processing apparatus and image processing method
US20140164927A1 (en) Talk Tags
US20110243397A1 (en) Searching digital image collections using face recognition
US20030161506A1 (en) Face detection computer program product for redeye correction
US9558212B2 (en) Apparatus, image processing method and computer-readable storage medium for object identification based on dictionary information
US9690980B2 (en) Automatic curation of digital images
JP2020140557A (ja) 画像処理装置、制御方法、及びプログラム
JP4928346B2 (ja) 画像検索装置および画像検索方法ならびにそのプログラムおよび記憶媒体
JP2020140555A (ja) 画像処理装置、制御方法、及びプログラム
JP7409427B2 (ja) 情報処理装置、情報処理システム、及びプログラム
WO2020208955A1 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
JP2021501432A (ja) 画像分類装置及び方法
JP5214043B2 (ja) 画像処理装置およびプログラム
CN114840694A (zh) 一种图片处理方法、装置、电子设备及存储介质
JP2020140558A (ja) 画像処理装置、制御方法、及びプログラム
JP2020140556A (ja) 画像処理装置、制御方法、及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130927

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20131002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131028

R150 Certificate of patent or registration of utility model

Ref document number: 5403838

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250