JP2012244634A - 画像クラスタリング方法 - Google Patents
画像クラスタリング方法 Download PDFInfo
- Publication number
- JP2012244634A JP2012244634A JP2012116884A JP2012116884A JP2012244634A JP 2012244634 A JP2012244634 A JP 2012244634A JP 2012116884 A JP2012116884 A JP 2012116884A JP 2012116884 A JP2012116884 A JP 2012116884A JP 2012244634 A JP2012244634 A JP 2012244634A
- Authority
- JP
- Japan
- Prior art keywords
- time
- images
- distance
- data
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000003384 imaging method Methods 0.000 claims abstract description 29
- 238000010606 normalization Methods 0.000 claims abstract description 8
- 238000004590 computer program Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 230000000737 periodic effect Effects 0.000 claims 1
- 230000015654 memory Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004092 self-diagnosis Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Abstract
【課題】複数の画像を1つ以上のイベントの部分集合に判定する方法を提供する。
【解決手段】各画像は、撮像装置による画像の撮像の時間及び位置を特定する時間及び位置のデータと関連付けられる。この方法は、画像の撮像時間順リスト(605)にて隣接する対の画像の時間変数を、当該隣接する対の画像の時間データに基づき判定する(611)。次に、その撮像時間順リストにおける隣接する対毎の距離変数を、当該対の画像と関連付けられた位置データに基づいて判定する(615)。そして、この方法は、複数の画像の各画像の撮像の時間及び位置において撮像装置の速度データを判定する(621)。その後、順序付けされた画像のリストは、速度データに対して重み付けされる時間変数及び距離変数の正規化(625)に従って判定されるコスト関数(631)に基づいて1つ以上のイベントの部分集合に区分される(641)。
【選択図】図6
【解決手段】各画像は、撮像装置による画像の撮像の時間及び位置を特定する時間及び位置のデータと関連付けられる。この方法は、画像の撮像時間順リスト(605)にて隣接する対の画像の時間変数を、当該隣接する対の画像の時間データに基づき判定する(611)。次に、その撮像時間順リストにおける隣接する対毎の距離変数を、当該対の画像と関連付けられた位置データに基づいて判定する(615)。そして、この方法は、複数の画像の各画像の撮像の時間及び位置において撮像装置の速度データを判定する(621)。その後、順序付けされた画像のリストは、速度データに対して重み付けされる時間変数及び距離変数の正規化(625)に従って判定されるコスト関数(631)に基づいて1つ以上のイベントの部分集合に区分される(641)。
【選択図】図6
Description
本発明は、画像をクラスタリングすることに関し、特にイベントに基づいて画像をクラスタリングすることに関する。
従来の多くの写真クラスタリングアルゴリズムは、時間情報に依存して写真をグループに編成するものである。例えば写真は、撮影された日付又は時間により順序付けされた写真のリストにおける大きい時間差を識別することでグループ化されることが多い。時間はイベント境界を判定するための重要な標識であるが、単独で使用されると導出される値が制限される。例えば、1時間以上が経過した時、写真撮影者は、60km離れた新しい場所にいる可能もあるし、又は同一の場所にいる可能性もある。それは、新しいイベントが発生したか否かを識別できる移動距離情報という付加情報である。
時間情報は、通常、カメラ等の撮像装置と一体化されたリアルタイムクロックが生成したタイムスタンプを使用して撮像画像と関連付けられる。地理的データ、ジオデータ又はジオタグとしても既知である位置データは、一般に、全地球測位システム(GPS)デバイス等の衛星位置決め/ナビゲーションデバイスを使用して判定される。そのようなデバイスもカメラと一体化される。そのような情報は、撮像画像と関連付けられる場合のメタデータであり、一般に画像のJPEG(.jpg)ファイルのEXIFコンポーネントにおいて編成される。
時間及び位置の情報に基づいて写真をグループに配列する技術は、長年存在しているが、ジオタグ及びタイムスタンプを供給するカメラが主に使用されるようになってきたのはつい最近のことである。GPS情報を写真のEXIFデータに組み込むカメラがなければ、ユーザは、手動で写真へのGPS情報に注釈を付けるか、あるいはGPSログ上のタイムスタンプと写真上のタイムスタンプとを相互参照することにより、後で写真に対してGPS情報を提供するGPSロガーを写真と共に保持する必要がある。これらの方法は、双方とも不便で時間がかかる。手動で写真をジオタグ付けするかあるいはGPSログと相互参照するオーバヘッドは、写真をクラスタリングするために位置情報を使用することで得られる潜在的利益をはるかに上回ることが示される。その結果、写真をジオタグ付けするオーバヘッドは時間を意味しており、場所に基づくクラスタリングアルゴリズムは広範に採用されていない。しかし、写真上でジオタグを提供するカメラが更に普及するにつれ、時間及びGPSの情報を使用して写真をグループ化する写真クラスタリングアルゴリズムはより広範に使用されるようになる。その結果、EXIFデータにジオタグを提供するカメラの普及が予想されることに伴い、そのような情報は、フォトコレクションをイベントにグループ化するために利用される。
イベントを識別する既知の方法は、時間により順序付けされた写真のリストの隣接する写真間の時間差及び距離差に注目し、時間外れ値及び距離外れ値を識別しようとする。この手法は、写真撮影者が同一のイベントに対して2組の写真、すなわち1つの場所において1つの写真及び同日のより遅い時間に同一の場所で更なる写真を撮影する場合の状況において常に有用ではない。第1の組の最後の写真と第2の組の最初の写真との間の境界においては、時間の大きな変化のために時間外れ値であると考えられるが、同一の領域にあったために距離外れ値であるとは考えられない。
他の技術は、時間差又は距離差外れ値が発生する時点を識別しようとする。これらの手法の欠点は、時間又は距離のみを考慮することで新しいイベントが間違って検出される可能性があることである。例えば、バス又は自動車で移動している間に写真が撮影される等の移動イベントの場合、大きな距離差が外れ値として検出される結果、移動イベントは誤って多数のイベントに分解される。また、1つの場所において撮影された高速連写の写真があるが、連写間の時間が外れ値であると考えられる場合、イベントは誤って多数のイベントに分解される。
また、双方の従来技術は、事前定義された数のクラスタを容易に生成できない。クラスタの数は、外れ値を構成するものに対する閾値を変更することで調整される。しかし、そのような手法は不便であり、作成されるクラスタの数を容易に設定できない。
各写真と関連付けられた時間及び位置の情報等のメタデータに基づいて一組の写真をイベントにグループ化する方法を本明細書において開示する。時間及び位置の情報は、新しいイベントが始まる場所に対する重要な標識である。多くの場合、ユーザが撮影した2つの写真間の時間の著しい変化及び/又は距離の著しい変化は、新しいイベントの始まりを示す。方法は、写真撮影者がある領域を歩き回っている時に写真が撮影されたイベントと共に移動イベントをグループ化する。
写真等のメディアオブジェクトは、多くの場合、ユーザがそれらを容易に編成、レビュー及び探索するのを支援するためにイベントにグループ化される。そのような要求は、デジタル写真の普及及びユーザが撮影する大量の写真に起因している。現在のフォトアルバム作成アプリケーションにおいて、ユーザがフォトコレクションからイベントを思い出したり識別したりするのを支援するために、写真はイベントにグループ化され、イベントは有用な地理情報でラベル付けされる。これらの特徴は、ユーザがフォトコレクションからイベントを見つけて選択し、フォトアルバムを作成するのを支援する。本発明は、現在のフォトアルバム作成ソフトウェアのグループ化の態様に関する。
本発明の一態様によれば、複数の画像を1つ以上のイベントの部分集合に判定する方法が提供される。各画像は、撮像装置による画像の撮像の時間及び位置を特定する時間及び位置のデータと関連付けられる。方法は、撮像時間順リストにおける隣接する対の画像の時間変数を、その隣接する対の画像の時間データに基づいて判定する。次に、撮像時間順リストにおける隣接する対毎の距離変数を、当該対の画像と関連付けられた位置データに基づいて判定される。そして、方法は、複数の画像の各画像の撮像の時間及び位置において撮像装置の速度データを判定する。その後、撮像時間順リストを、速度データに対して重み付けされる時間変数及び距離変数の正規化に従って判定されるコスト関数に基づいて1つ以上のイベントの部分集合に区分される。
他の態様も開示する。
次に、以下の図面を参照して、本発明の少なくとも1つの実施形態を説明する。
本発明者等によれば、時間及び距離の量が非常に異なるため、双方ともマージ可能な状態になる前に変換される必要があることに注視する。単に双方が追加されると、多くの場合、一方の量が他方の量より数桁大きいために最終的に一方の量のみが考慮される。従来技術は、これらの異なる量を有用に合成する方法についての指示又は指導を本発明者に提供していない。
デジタル写真の普及に伴い、ユーザが撮影する画像の数は大幅に増加している。しかし、撮影された写真の数が増加するにつれ、フォトコレクションで画像を管理し、ソートし、見つけることがより困難になる。そこで、編成し且つユーザがフォトコレクションの種々の部分を認識するのを支援するためにフォトコレクションを認識可能なイベントにグループ化する方法を開示する。この方法は、ユーザのコレクションがイベントに編成され、ユーザがフォトアルバムに使用するイベントを選択するフォトアルバム作成アプリケーションにおいて使用されることが好ましい。
以下の説明は、フォトコレクションをトラベルイベントに対応する1つ以上のグループに分解するシステムを開示する。写真撮影者が高速で移動していた場合、例えば自動車又はバスに乗っている間、あるいは遊園地又は博物館等の領域を歩き回っている間に写真が撮影された場合でも、システムはフォトコレクションを適切なトラベルイベントにグループ化する。トラベルイベントを検出する場合、訓練データを必要とする機械学習を使用する従来技術もある。訓練データを必要とする危険性は、システムがデータに過度に適合するようになり、任意のデータの集合に関して良好な結果をもたらすには一般的でないことである。現在のシステムは訓練データを必要としない。
また、リアルタイムクロック及びGPS位置デバイスを有し、時間記録及びGPSログを形成するカメラ装置で画像を撮像するのが望ましいが、説明される処理は、一般に、撮像画像及び関連付けられたメタデータがダウンロードされるフォトアルバムアプリケーションを実行するコンピュータ又は同様のシステム上で後処理環境において実行される。図15A及び図15Bは、ここで説明される種々の構成が実施される汎用コンピュータシステム1500を示している。
図15Aに示されるように、コンピュータシステム1500は、コンピュータモジュール1501、キーボード1502、マウスポインタデバイス1503、スキャナ1526、カメラ1527及びマイク1580等の入力デバイス、並びにプリンタ1515、表示装置1514及びスピーカ1517を含む出力デバイスを備える。外部変復調器(モデム)送受信機デバイス1516は、接続1521を介して通信ネットワーク1520と通信するためにコンピュータモジュール1501により使用される。通信ネットワーク1520は、インターネット、セルラ電気通信ネットワーク等のワイドエリアネットワーク(WAN)又は専用WANである。接続1521が電話線である場合、モデム1516は従来の「ダイヤルアップ」モデムである。あるいは、接続1521が大容量(例えば、ケーブル)接続である場合、モデム1516はブロードバンドモデムである。無線モデムは、通信ネットワーク1520に無線接続するために更に使用される。
コンピュータモジュール1501は、一般に、少なくとも1つのプロセッサユニット1505及びメモリユニット1506を含む。例えばメモリユニット1506は、半導体ランダムアクセスメモリ(RAM)及び半導体読み出し専用メモリ(ROM)を有する。コンピュータモジュール1501は、ビデオディスプレイ1514、スピーカ1517及びマイク1580に結合するオーディオ/ビデオインタフェース1507、キーボード1502、マウス1503、スキャナ1526、カメラ1527及び選択的にジョイスティック又はヒューマンインタフェースデバイス(不図示)に結合する入出力(I/O)インタフェース1513、並びに外部モデム1516及びプリンタ1515用のインタフェース1508を含む複数のI/Oインタフェースを更に含む。いくつかの実現例において、モデム1516は、インタフェース1508等のコンピュータモジュール1501内に組み込まれる。コンピュータモジュール1501は、接続1523を介してコンピュータシステム1500がローカルエリアネットワーク(LAN)として既知であるローカルエリア通信ネットワーク1522に接続できるようにするローカルネットワークインタフェース1511を更に有する。図15Aに示されるように、ローカル通信ネットワーク1522は、一般にいわゆる「ファイアウォール」デバイス又は同様の機能性を備えたデバイスを含むワイドネットワーク1520に接続1524を介して更に結合する。ローカルネットワークインタフェース1511は、Ethernet(TM)回路カード、Bluetooth(TM)無線装置又はIEEE802.11無線装置を備えるが、多数の他の種類のインタフェースがインタフェース1511に対して実施されてもよい。
I/Oインタフェース1508及び1513は、直列接続性及び並列接続性のいずれか一方又は双方を提供する。一般に直列接続性は、USB(Universal Serial Bus)規格に従って実現され、対応するUSBコネクタ(不図示)を有する。記憶装置1509が提供され、一般にハードディスクドライブ(HDD)1510を含む。フロッピディスクドライブ及び磁気テープドライブ(不図示)等の他の記憶装置が更に使用されてもよい。オプションのディスクドライブ1512は、一般に、データの不揮発性ソースとして動作するように提供される。例えば、光ディスク(例えば、CD−ROM、DVD、Blu−ray Disc(TM))、USB−RAM、取り外し可能な外部ハードドライブ及びフロッピディスク等のポータブルメモリ装置は、システム1500に対する適当なデータのソースとして使用される。
コンピュータモジュール1501の構成要素1505〜1513は、一般に、相互接続バス1504を介して通信し、結果として当業者に既知であるコンピュータシステム1500の動作の従来のモードから得られる方法で通信する。例えばプロセッサ1505は、接続1518を使用してシステムバス1504に結合される。同様に、メモリ1506及び光ディスクドライブ1512は、接続1519によりシステムバス1504に結合される。説明する構成が実施可能なコンピュータの例には、IBMのPC及び互換性のあるもの、Sun Sparcstations、Apple Mac(TM)又は同様のコンピュータシステムが含まれる。説明される構成において、画像及びメタデータは、カメラ1527から、あるいはネットワーク1520及び/又は1522を介してダウンロードされ、HDD1510等のコンピュータ1510に格納される。
画像クラスタリングの方法は、コンピュータシステム1500を使用して実現される。ここで説明される図4〜図9及び図11〜図14の処理は、コンピュータシステム1500内で実行可能な1つ以上のソフトウェアアプリケーションプログラム1533として実現される。特に、画像クラスタリングの方法のステップは、コンピュータシステム1500内で実行されるソフトウェア1533で命令1531(図15Bを参照)により実施される。ソフトウェア命令1531は、各々が1つ以上の特定のタスクを実行する1つ以上のコードモジュールとして形成される。ソフトウェアは2つの別個の部分に更に分割され、第1の部分及び対応するコードモジュールは画像クラスタリングの方法を実行し、第2の部分及び対応するコードモジュールは、第1の部分とユーザとの間のユーザインタフェースを管理する。
例えばソフトウェアは、以下に説明する記憶装置を含むコンピュータ可読媒体に格納される。ソフトウェアは、コンピュータ可読媒体からコンピュータシステム1500にロードされ、コンピュータシステム1500により実行される。そのようなソフトウェアを有するコンピュータ可読媒体又はコンピュータ可読媒体上に記録されたコンピュータプログラムは、コンピュータプログラム製品である。コンピュータシステム1500においてコンピュータプログラムを使用することにより、画像クラスタリングに有利な装置を実施することが好ましい。
一般にソフトウェア1533は、HDD1510又はメモリ1506に格納される。ソフトウェアは、コンピュータ可読媒体からコンピュータシステム1500にロードされ、コンピュータシステム1500により実行される。従って、例えばソフトウェア1533は、光ディスクドライブ1512により読み出される光学的に読み出し可能なディスク記憶媒体(例えば、CD−ROM)1525上に格納される。
いくつかの例において、アプリケーションプログラム1533は、1つ以上のCD−ROM1525上でユーザが符号化したものに供給され、対応するドライブ1512を介して読み出されるか、あるいはユーザによりネットワーク1520又は1522から読み出される。また、ソフトウェアは、他のコンピュータ可読媒体からコンピュータシステム1500に更にロードされる。コンピュータ可読記憶媒体は、実行及び/又は処理するために記録された命令及び/又はデータをコンピュータシステム1500に提供するあらゆる非一時的な有形記憶媒体を示す。そのような記憶媒体の例には、フロッピディスク、磁気テープ、CD−ROM、DVD、Blu−ray Disc、ハードディスクドライブ、ROM又は集積回路、USBメモリ、光磁気ディスク、あるいは例えばPCMCIAカード等のコンピュータ可読カードが含まれ、そのようなデバイスは、コンピュータモジュール1501の内部又は外部にある。ソフトウェア、アプリケーションプログラム、命令及び/又はデータをコンピュータモジュール1501に提供することに更に関係する一時的又は非一時的なコンピュータ可読伝送媒体の例には、無線送信チャネル又は赤外線送信チャネル及び別のコンピュータ又はネットワーク化されたデバイスへのネットワーク接続、並びに電子メール送信及びウェブサイト上等に記録された情報を含むインターネット又はイントラネットが含まれる。
上述したアプリケーションプログラム1533の第2の部分及び対応するコードモジュールは、ディスプレイ1514上にレンダリングされるかあるいは表される1つ以上のグラフィカルユーザインタフェース(GUI)を実現するように実行される。一般にキーボード1502及びマウス1503を操作することにより、コンピュータシステム1500及びアプリケーションのユーザは、GUIと関連付けられたアプリケーションに制御コマンド及び/又は入力を提供するように機能的に適応可能な方法でインタフェースを操作する。他の形式の機能的に適応可能なユーザインタフェース、例えばスピーカ1517を介して出力された音声プロンプト及びマイク1580を介して入力されたユーザボイスコマンドを利用するオーディオインタフェースが更に実現されてもよい。
図15Bは、プロセッサ1505及び「メモリ」1534を示す詳細な概略ブロック図である。メモリ1534は、図15Aのコンピュータモジュール1501によりアクセスされる全てのメモリモジュール(HDD1510及び半導体メモリ1506を含む)の論理的な集約を示す。
コンピュータモジュール1501の電源が最初に投入されると、自己診断(POST)プログラム1550が実行する。一般にPOSTプログラム1550は、図15Aの半導体メモリ1506のROM1549に格納される。ソフトウェアを格納するROM1549等のハードウェアデバイスは、ファームウェアと呼ばれる場合もある。POSTプログラム1550は、コンピュータモジュール1501内のハードウェアを調査して適切に機能することを保証し、一般に、正しく動作するためにROM1549に更に格納されたプロセッサ1505、メモリ1534(1509、1506)及び基本入出力システム(BIOS)ソフトウェアモジュール1551をチェックする。POSTプログラム1550が正常に実行したら、BIOS1551は図15Aのハードディスクドライブ1510を起動する。ハードディスクドライブ1510を起動することにより、ハードディスクドライブ1510上に常駐するブートストラップローダプログラム1552がプロセッサ1505を介して実行する。これにより、オペレーティングシステム1553は、RAMメモリ1506にロードされると動作を開始する。オペレーティングシステム1553は、プロセッサ1505により実行可能なシステムレベルのアプリケーションであり、プロセッサ管理、メモリ管理、デバイス管理、ストレージ管理、ソフトウェアアプリケーションインタフェース及び汎用ユーザインタフェースを含む種々のハイレベルな機能を遂行する。
オペレーティングシステム1553は、メモリ1534(1509、1506)を管理し、コンピュータモジュール1501上で実行する処理又はアプリケーションの各々が別の処理に割り当てられたメモリと衝突することなく実行する十分なメモリを有することを保証する。また、図15Aのシステム1500で使用可能な種々のメモリは、各処理が効率的に実行できるように適切に使用される必要がある。従って、集約メモリ1534は、メモリの特定の部分が割り当てられる方法を示すことを意図せず(特に記載されない限り)、コンピュータシステム1500によりアクセス可能なメモリの概略図及びそのようなメモリが使用される方法を提供する。
図15Bに示されるように、プロセッサ1505は、制御ユニット1539、演算論理装置(ALU)1540及びキャッシュメモリと呼ばれることもあるローカルメモリ又は内部メモリ1548を含む多数の機能モジュールを含む。一般にキャッシュメモリ1548は、レジスタ部に複数の記憶レジスタ1544〜1546を含む。1つ以上の内部バス1541は、これらの機能モジュールを機能的に相互接続する。一般にプロセッサ1505は、接続1518を使用してシステムバス1504を介して外部デバイスと通信する1つ以上のインタフェース1542を更に有する。メモリ1534は、接続1519を使用してバス1504に結合される。
アプリケーションプログラム1533は、条件付き分岐命令及びループ命令を含む一連の命令1531を含む。プログラム1533は、プログラム1533を実行するために使用されるデータ1532を更に含む。命令1531及びデータ1532は、それぞれ、記憶場所1528、1529、1530及び1535、1536、1537に格納される。命令1531及び記憶場所1528〜1530の相対的な大きさに依存して、特定の命令は、記憶場所1530に示された命令により示されたように単一の記憶場所に格納される。あるいは、命令は、記憶場所1528及び1529に示された命令部分により示されたように、各々が別個の記憶場所に格納される多数の部分にセグメント化される。
一般にプロセッサ1505には、実行すべき命令セットが与えられる。プロセッサ1505は、別の命令セットを実行することにより自身が反応する後続の入力を待つ。各入力は、入力デバイス1502、1503の1つ以上により生成されたデータ、ネットワーク1520、1502のうちの一方を介して外部ソースから受信したデータ、記憶装置1506、1509のうちの一方から検索したデータ又は対応する読み取り装置1512に挿入された記憶媒体1525から検索したデータを含む多数のソースのうちの1つ以上から提供され、その全てが図15Aに示される。いくつかの例において、命令セットを実行した結果、データが出力される。実行することは、データ又は変数をメモリ1534に格納することを更に含む。
開示される画像クラスタリング構成は、対応する記憶場所1555、1556、1557においてメモリ1534に格納される入力変数1554を使用する。画像クラスタリング構成は、対応する記憶場所1562、1563、1564においてメモリ1534に格納される出力変数1561を生成する。中間変数1558は、記憶場所1559、1560、1566及び1567に格納される。
図15Bのプロセッサ1505を参照すると、レジスタ1544、1545、1546、演算論理装置(ALU)1540及び制御ユニット1539は、プログラム1533を構成する命令集合において命令毎に「取り込み、復号化及び実行」サイクルを実行するのに必要なマイクロ動作のシーケンスを実行するように共に動作する。取り込み、復号化及び実行サイクルの各々は、以下を含む。
(a)記憶場所1528、1529、1530からの命令1531を取り込むかあるいは読み取る取り込み動作(fetch operation)。
(b)制御ユニット1539が取り込まれた命令を判定する復号化動作(decode operation)。
(c)制御ユニット1539及び/又はALU1540が命令を実行する命令動作(execute operation)。
(a)記憶場所1528、1529、1530からの命令1531を取り込むかあるいは読み取る取り込み動作(fetch operation)。
(b)制御ユニット1539が取り込まれた命令を判定する復号化動作(decode operation)。
(c)制御ユニット1539及び/又はALU1540が命令を実行する命令動作(execute operation)。
その後、次の命令に対する更なる取り込み、復号化及び実行サイクルが実行される。同様に、制御ユニット1539が値を記憶場所1532に格納するかあるいは書き込むことにより、格納サイクルが実行される。
図4〜図9及び図11〜図13の処理におけるステップ又はサブ処理の各々は、プログラム1533の1つ以上の部分と関連付けられ、プログラム1533の示された部分に対して命令集合において命令毎に取り込み、復号化及び実行サイクルを実行するようにプロセッサ1505のレジスタ部1544、1545、1547、ALU1540及び制御ユニット1539が共に動作することで実行される。
図1は、コレクションの全て又は一部を形成する順序付けされた写真P1〜P8のリスト103を示す。各写真は、画像の撮像の時間、及び、撮像の位置を特定するため、対応する時間データ(tn)及び位置データ(ジオタグ、xn)を有する。対処されるのが望ましい一般的な問題は、関連付けられた時間及びジオタグのメタデータから推測されたイベントに基づいてリスト103の写真の部分集合を共にクラスタリングするか、グループ化するかあるいは形成することである。この例に示されるように、写真のグループ105、111及び115は、それぞれ、識別可能なイベント及び結果として関連付けられたイベント境界と関連付けられることを示している。
図2に示されるようないくつかの従来技術の手法は、隣接する写真間の時間差205のみを時間により順序付けされたリストとして考えている。写真は、時間に基づいて、すなわち例えば写真間の大きな時間差を識別することでクラスタに分解される。図3に示されるような他の従来技術の手法は、隣接する写真間の時間差305及び距離差311を考慮する。イベント境界は、隣接する写真間の大きい時間差及び/又は距離差を識別することで見つけられる。距離差は、2つの経度点/緯度点の間の何らかの適切な距離計測値である。例えば距離差は、地理的距離(地球の周りの2つの経度点/緯度点の間の距離)、L1ノルム又はマンハッタン距離(|x1−x2|+|y1−y2|)、あるいはL2ノルム(sqrt((|x1−x2|)2+(|y1−y2|)2)))である。
本発明に従って採用される手法は、時間差及び距離差を「コスト」として既知である1つのスカラ量に合成することである。図4に示されるように、時間差403、距離差406及び速度データ409は、順序付けされたリストの隣接する写真間で考えられる。時間及び距離は、新しいイベントが始まる場所に対する重要な標識である。時間及び/又は距離の変化が大きいほど、その境界において新しいイベントが始まる可能性が高くなる。時間差及び距離差は、正規化される(410)ため、状態412になり、マージ可能である(414)。重み416が速度データに依存する(420)場合、コスト418は正規化された距離の加重和であり、正規化された距離が取得される。このコスト関数は、イベント境界が発生する場所を判定するために使用される。
図5に示されるように、コスト関数は、時間により順序付けされたフォトコレクションの新しいイベントの始まりに対応するピーク505を有する。本発明の手法は、写真をソートし、隣接する写真間のコストを算出し、ピークが発生する場所を識別する手法である。ピーク検出は、標準的なピーク検出法を使用して又は所定の数の写真クラスタを識別することで実行される。イベント境界において、コスト関数が特定の閾値を上回る場合、新しいイベントが発生する。コスト関数が閾値を下回る場合、写真は現在の既存のクラスタに割り当てられ、新しいイベントは発生しない。
時間及び距離を共に考慮する利点は、新しいイベントが発生する尤度に関して写真間の境界がランク付けされることである。これは、生成されるクラスタの数を変動できるようにするため有利である。
図6は、本発明に従って画像をクラスタリングする方法600を示す概略的なフローチャートである。この方法600は、大きなフォトアルバムアプリケーションの構成要素であるアプリケーションプログラム1533等のソフトウェアとして実現されるのが望ましい。方法600を実現するアプリケーション1533は、HDD1510等に格納されたフォトコレクション及び関連付けられたメタデータ上で動作する。方法600はステップ601において開始し、タイムスタンプ及びジオタグ付けされる写真のリスト103がプロセッサ1505によりHDD1510から検索される。写真は、例えば写真Pj毎にタイムスタンプtjで時間ソートされ、以下の関係は写真の順序に当てはまる。
P1,P2, ... ,Pn ⇔ t1≦t2≦ ... ≦tn
ゴールは、写真をイベントEiに分解することであり、図1の例において3つのイベントが発生する場合となる。
E1={P1,P2,P3}105、E2={P4,P5}111及びE3={P6,P7,P8}115
ゴールは、写真をイベントEiに分解することであり、図1の例において3つのイベントが発生する場合となる。
E1={P1,P2,P3}105、E2={P4,P5}111及びE3={P6,P7,P8}115
クラスタリングは時間順を維持する。すなわち、クラスタの全ての写真は、時間により順序付けされ、より大きなタイムスタンプを含む以前のクラスタの写真を有さない。
処理はエントリステップ601において開始し、クラスタ処理(クラスタリング)のために写真が供給又は検索される。ステップ605は、写真が撮像された順(時間順)に順序付けされることをチェックするように動作する。一般に、JPEG画像と関連付けられたEXIFデータはリアルタイムの撮像を含み、殆どの写真管理システムは撮像順に写真を維持する。また、多くの撮像装置は各写真をファイル名で考え、ファイル名は英数字で順序付けされている。一般に、自動的に割り当てられた英数字名は時間により順序付けされる。そのような例において、ステップ601で受信した写真は既に時間により順序付けされているため、ステップ605で写真をソートするように動作する必要はない。しかし、写真は、無作為に供給されるかあるいは他の何らかの方法で順序付けされる場合もある。例えば、ユーザは、写真画像のファイル名を編集することであらゆる自動的に割り当てられた英数字順を不要にするか、あるいは写真は、写真撮影者が基準点から移動した距離又は他の何らかの適切な計測値等の他の何らかのパラメータに従って順序付けされる。そのような場合、ステップ605は、各写真の撮像の時間順に従って配列されたリストに受信した写真を写真の特徴に従ってソートするように動作する。
以下のステップ611において、隣接する写真間の時間変数は、プロセッサ1505により算出され、メモリ1506に格納される。一般にこれは、順序付けされたリストの隣接する写真のタイムスタンプ間の差にすぎない。しかし、時間変数は、特定の結果を達成する可能性を高めるために何らかのオプションの処理を更に含めることができる。例えば、15分未満の時間差は、ゼロに縮小させて一緒にグループ化されやすくする。24時間以上の時間差は、更に24時間にクランプされ、データのダイナミックレンジを縮小する。
具体的に、好適な一実現例において、以下が成り立つ。
ステップ611の処理は、上記の動作に限定されない。例えば、ある特定の範囲の時間値は変倍される。また、他の適切な変倍が別の実現例において実行可能である。
次に、隣接する写真間の距離変数が、ステップ615でプロセッサ1505により算出され、その値がメモリ1506に格納される。好適な一実現例において、地理的距離(地球の周囲に沿う2つの経度点/緯度点間の距離)が使用される。すなわち、2つの経度点/緯度点(longitude/latitude)間の距離は、
l1=(lat1,long1)、l2=(lat2,long2)
地理的距離(geo-distance)=cos-1(sin(lat1)sin(lat2)+cos(lat1)cos(lat2)cos(long2−long1))×地球の半径
l1=(lat1,long1)、l2=(lat2,long2)
地理的距離(geo-distance)=cos-1(sin(lat1)sin(lat2)+cos(lat1)cos(lat2)cos(long2−long1))×地球の半径
他の実現例は、経度点/緯度点間の平均二乗距離又は何らかの適切な距離計測値を使用する。距離変数は、時間変数のような何らかのオプションの変倍を有する。例えば、本発明の実施形態において、20km以上の全ての時間変数は20kmにクランプされる。
ステップ621において、プロセッサ1505は、写真の隣接する対の間の速度変数を算出する。好適な実現例において、これは時間変数で除算された距離変数である。
ここで、写真撮影者/写真撮像装置(カメラ1527)は、隣接する写真間を平均速度で移動していたと推定する。速度データを導出又は算出する好適な処理を図8に示す。最初にステップ805において、2つの隣接する写真間の距離は、プロセッサ1505によりステップ615で判定された距離を有するメモリ1506から検索される。ステップ811において、ステップ611で判定されたような時間差が同様に検索される。ステップ815において、プロセッサ1505は、距離差を時間差で除算し、写真間の写真撮影者の平均速度を推定する。この速度を推定する方法は、簡単であり、テストされたフォトコレクションに対して有効であることが本発明者により判明した。更なる精度が必要な場合、例えば方法は、写真撮影者の位置を周期的にサンプリングし、サンプリング間の速度を算出し、写真間の速度値を平均化することで改善される。更に速度変数は、使用可能なデータから算出される必要はない。例えば速度変数は、カメラ撮像装置1527で判定され、画像に対するJPEGファイル内のEXIFデータに格納される。EXIFデータは、特定のアプリケーションに従ってカスタマイズされるか、あるいは将来のJPEG規格に含まれる。従って、これは、写真が撮影された時及び/又は写真間における写真撮影者/撮像装置の速度に依存する速度変数を示す。更にカメラ1527は、ある期間にわたりカメラ1527の場所のGPS座標位置のログを維持する。それにより、より正確な速度変数を算出できる。そのような速度ログデバイスは、アプリケーションが受信するために速度データ又はログ記録された速度データから判定された速度値を単に送信する。
取得した時間変数及び距離変数の量は大きく異なるものである。標準化された単位で示せば、一方は数mであり、他方は秒である。故に、これら変数は、容易にマージできない。変数が単に追加される場合、一方のデータの集合は、他方のデータの集合より数桁大きくなり、コスト関数を支配する。従って、ステップ625において、双方のデータの集合は、プロセッサ1505により同一の大きさに正規化される。好適な一実現例において、平均分散正規化は、時間及び距離の各々を同一の大きさとなるように移動するかあるいは配置するために使用される。
図7は、ステップ625のこのような好適な実現例を示す。平均分散正規化(mean-variance normalisation)において、ステップ705でデータセットの平均を算出し、ステップ711でデータセットの標準偏差を算出する。本発明の実現例において、時間変数の集合及び距離変数の集合毎に平均及び標準偏差が算出される。時間平均及び距離平均の各々は、ステップ715で対応するデータセット中の各要素から減算され、次にデータセット中の各要素は、ステップ721で対応する時間又は距離の標準偏差で除算される。これにより、時間及び距離が同一の大きさとなるように各々を動かす。データセットを同一の大きさとなるようにに動かす他の技術が他の実現例において使用される。そのような技術は、機能ワーピング/ヒストグラム平坦化又はMAP適応を含む。いくつかのデータセットにとって、全ての時間値及び距離値が正となるように正規化されたデータセットの各々の最小値において減算することが必要である。
各データセットを最大値で除算することは外れ値に対するロバスト性を有さないため、そのような方法から良好な結果は得られない。多くのフォトコレクションは、例えば日にちの空いた写真又は地球の反対側で撮影される写真を含む場合、時間差外れ値及び距離差外れ値(time and distance difference outliers)を含む。時間差が上述のオプションの変倍からクランプされても、データセットには依然として大きな変動性がある。クランプに対する値がいくらか低かった場合、変動性は低下するが、ダイナミックレンジが非常に圧縮される危険性があり、新しいイベントが発生する時点を検出することがより困難になる。
図6に戻り、データセットが正規化されると、次にステップ631でコスト関数が算出される。コスト関数は、正規化された時間変数及び正規化された距離変数の加重和であり、図9で詳細に説明する。最初に、プロセッサ1505により判断ステップ905が行われ、写真が撮影される間に写真撮影者又はカメラ1527が高速で移動していたかあるいは逆に低速で移動していたかを判定する。ステップ905で写真撮影者が低速で移動していた(No)と判定する場合、ステップ911は、コスト関数が正規化された時間変数に対して10%及び正規化された距離変数に対して90%の時に重み付けされる場合に実行される。写真撮影者が高速で移動している(Yes)場合、ステップ915は、コスト関数が時間に対して純粋に重み付けされる場合に実行される。このように、時間変数及び距離変数は、速度データに対して重み付けされる。これは、移動イベントが距離の大きな変化のために多数のイベントに分解されることを阻止するためである。この重みは、他の実現例の場合には異なってもよい。
正規化された時間変数に時間重みを乗算するステップ921が後続する。そして、次にステップ925において、正規化された距離変数に距離重みを乗算する。その後、ステップ931で乗算が合計され、コスト(Cost)を生成する。
従って、具体的に、
Costi+1,i=W1θnormalise(ti+1−ti)+w2Θnormalise(distance(xi+1,xi))
ここで、式中、θnormaliseは時間変数を正規化する関数であり、Θnormaliseは距離変数を正規化する関数であり、distance(xi+1,xi)は2つの経度点/緯度点間の距離計測値、すなわち本発明の実施形態では地理的距離である。写真撮影者が高速で移動している(トラベルイベント)場合、正規化された時間変数の100%及び正規化された距離の0%が使用される。具体的に、重み変数は以下の通りである。
Costi+1,i=W1θnormalise(ti+1−ti)+w2Θnormalise(distance(xi+1,xi))
ここで、式中、θnormaliseは時間変数を正規化する関数であり、Θnormaliseは距離変数を正規化する関数であり、distance(xi+1,xi)は2つの経度点/緯度点間の距離計測値、すなわち本発明の実施形態では地理的距離である。写真撮影者が高速で移動している(トラベルイベント)場合、正規化された時間変数の100%及び正規化された距離の0%が使用される。具体的に、重み変数は以下の通りである。
他の重みが他の実現例において使用されてよい。写真撮影者は、速度変数が10ms-1を上回った場合に高速で移動すると考えられ、それ以外の場合は低速で移動すると考えるものとする。すなわち、以下が成り立つ。
トラベルイベントを判定するための速度変数に対するあらゆる適切な閾値が他の実現例において使用されてもよい。他の実現例は、使用された重みと速さとの間により複雑な関係を有する。コストが隣接する写真の全ての対に対して導出されると、次にステップ635で、ピーク(例えば、図5のピーク505)が検出される。ピークは、新しいイベントが発生する時点を示す。ステップ635でピークが識別されると、次にステップ641は、隣接するピーク間の写真の部分集合又はクラスタに対応する各イベントでピークにおいて順序付けされた写真のリストを区分することにより、イベントが発生するように動作する。
コスト関数のピークを識別するために標準的な技術が使用される。好適な実現例において、ユーザは、所望のワークフローに適したある特定の数のイベントを規定する。ある意味では、イベントの数は任意である。例えばバースデーパーティーは、多数のサブイベント、すなわちプールにいる人、ケーキの切り分け及びゲームをする人を有する。このバースデーパーティーは、1つ、2つ又は3つのイベントに分解される。好適な実現例は、写真1日あたり平均で約1.2クラスタ〜1.4クラスタを生成することを目標とする。この値又は値の範囲は、他の実現例に対して変更されてもよい。
好適な実現例の場合、クラスタの数Nが推定され、次にコストがソートされる。N番目に大きいコストが選択され、閾値(threshold)を確立する。
閾値=ソートされた_コスト_降順[N]
ここで、Nを推定するために、累積コストが算出される。
累積_コスト[n]=ソートされた_コスト_昇順[n]+累積_コスト[n−1]
閾値=ソートされた_コスト_降順[N]
ここで、Nを推定するために、累積コストが算出される。
累積_コスト[n]=ソートされた_コスト_昇順[n]+累積_コスト[n−1]
累積コストが最終値の99.9%になる点が見つけられ、その点は、新しいイベントを判定するものに対する閾値として使用される。99.9%以外の他のパラメータが他の実現例において使用されてよい。この閾値は、結果として1日当たり平均1.2を下回るクラスタが作成される場合、少なくとも1日当たり平均1.2クラスタを作成するように調整される。1日当たり平均1.4を上回るクラスタが作成される場合、閾値は、1日当たり平均1.4以下のクラスタを作成するように調整される。作成される1日当たりのクラスタの数が1.2〜1.4である場合、閾値は調整されない。2つの写真間のコストが閾値を上回る場合、新しいイベントが開始される。コストが閾値を上回らない場合、写真は前の写真クラスタに置かれる。コスト及び閾値が判定されると、イベントが発生する。コストが閾値を上回る度に、新しいイベントが発生する。尚、この手法を用いると、移動イベントがグループ化されるだけであり、前のクラスタ又は次のクラスタに結合しないことが必須である場合、次のクラスタは、速度変数が高速と低速との間及び低速と高速との間を遷移する間に行われるべきである。これは、コスト関数が移動イベントの最初又は最後に閾値を下回る場合の予防措置である。
一例において、本発明の一実施形態は、速度に従って適応される重みを含むテスト画像セット及びその重みを含まないテスト画像セットに適用された。テスト画像セットは、2つの飛行機旅行で撮影された写真から構成される。写真位置を図10Aに示し、各画像位置は×印で示される。重みが速度に従って適応されない場合、各飛行機旅行は、図10Bに示されるように多数のイベントに分解される(異なる形状は、それぞれ異なるイベントを示す。尚、形状の集合は反復する)。重みが本発明に準拠して速度に従って適応される場合、写真は、図10Cに示されるように2つの飛行経路、すなわち2つの移動イベントに適切にグループ化される。一方の飛行経路は正方形で示され、他方の飛行経路は円で示される。
図11は、本発明において開示されるクラスタリング方法が使用されるフォトアルバム作成ソフトウェアからディスプレイ1514上に再現されたGUI1100を示すスクリーンショットである。本明細書において説明される写真クラスタリングアルゴリズムは、画像をイベント1105にグループ化するために使用される。ユーザのフォトストリーム又はフォトコレクション全体は、ユーザがイベントを識別するのを支援するために、イベントに分割され、例示的な文章1107等の有用な地理情報(代表的な文章)でラベル付けされる。各イベントの写真の数は、代表的な文章の下に表示されるのが望ましい。例えば、1109において識別されるのはTrocaderoにおける185枚の写真である。ユーザは、フォトアルバムに含みたいイベントを選択する。選択されたイベントは、10番目、14番目、15番目及び16番目のイベントのより暗い陰影1111で示されるように強調表示される。ユーザのフォトアルバムの写真1113等のいくつかの代表的な写真は、選択され、代表的な文章1107の上に表示される。ユーザがマウス1503を代表的な写真のグループに合わせる場合、写真はアニメーションで「ファンアウト」又は「スプレッド」する。そのように「ファンアウト」の結果を表示する(1121)。更なるイベントがある場合、スクロールバー1131を使用してそれらを表示する。
ユーザは、フォトブック又はフォトアルバムに含みたいイベントを選択した場合、マウス1503等を使用して「フォトブック編集」アイコン1125を選択する。この結果、図12に示すGUI画面1200が表示される。提案されたフォトブックは、既にユーザに対して提示されている。フォトブックのページ数は、例えば1203のように対応するページの下に表示される。写真が撮影されたイベントを説明する代表的な文章1204は、対応する見開きページ1202の上に表示される。ユーザは、例えばマウスを見開きページに合わせ、「+」アイコン1211をクリックすることで更なるページ1205を追加する。ユーザは、「x」アイコン1215をクリックすることで見開きページを削除する。ユーザは、「印刷」アイコン1225をクリックすることでフォトブックを印刷する。ユーザは、「イベント選択に戻る」アイコン1231をクリックすることでイベント選択画面(図11)に戻る。
ユーザは、見開きページ上でクリックすることで見開きページを編集し、図13に示されるようなGUI1300を表示する。これにより、選択された見開きページと関連付けられたフォトブックの特定のページをディスプレイ1514上に表示する。ページは、推奨レイアウト1302に従って且つ例えば画像1303等の代表的な画像を含んで提示される。ページ数1304は、見開きページの下に表示されるのが好ましく、現在の見開きページに対応するイベントの写真のリスト1305は、ページレイアウト1302の下に表示される。そのイベントに対する代表的な文章1307は、リスト1305の上に表示される。選択される写真は、チェックマーク「レ」1311を含む。写真が使用された回数は、例えば1313において示されるように更に表示される。この例において、写真は1度使用されているため、「x1」でラベル付けされる。見開きページの写真は、マウス1503でイベントから写真を選択し、置換される写真1315の上部に選択された写真をドラッグアンドドロップすることで置換される。他のイベントからの写真は、同様にイベント1321上でクリックし、写真を選択することで選択される。他のイベントは、スクロールバー1323を使用して見つけられる。種々の見開きページは上部パネル1324を使用して選択され、より多くの見開きページは、上部パネル1327を拡張するためのスクロールバー1328を使用して見つけられる。選択された見開きページ1329は、より暗い陰影で上部パネル1327において強調表示される。ユーザは、「<」アイコン1325をクリックすることで前の見開きページに移動し、「>」アイコン1331をクリックすることで次の見開きページに移動する。
画像が提示されるテンプレートは、図14に示されたGUIディスプレイ1400を使用して修正される。写真用のテンプレートは、ページレイアウトタブ1405を選択し、別のテンプレートをページレイアウト上にドラッグ1411アンドドロップ1412することで変更される。ページに対するより多くのレイアウトは、スクロールバー1413を使用して見つけられる。種々の見開きページは、上部パネル1415から選択される。前の見開きページは、戻る矢印アイコン1421をクリックすることで選択され、次の見開きページは、進む矢印アイコン1422をクリックすることで選択される。ユーザは、アイコン1425をクリックすることで前の画面に戻る。
クラスタリングにおいて時間及び位置の情報を考慮する従来技術もあるが、写真撮影者が高速で移動していたかあるいは領域を低速で動き回っていた場合に写真を適切にセグメント化すると共に移動イベントを適正にグループ化する方法は特定されていない。本明細書において説明した構成は、機械学習技術を使用せずに、すなわち訓練データを必要とせずに移動イベントを検出する。構成は、写真撮影者が写真を撮影しながら領域を低速で動き回るため、相対的に短期間にわたり距離の変化が少ない状況にも適応する。そのような構成は、種々のアトラクションが場合によっては数時間又は終日等の長期間にわたり異なる場所であるが一般に近接する場所で撮像される動物園又はカントリフェアにおいて適用可能である。
説明された構成は、コンピュータ産業及びデータ処理産業、並びに特にコレクションを形成する写真の管理及び識別可能なイベントと関連付けられた写真のセグメント化及びクラスタリングに適用可能である。
上記の記述は本発明のいくつかの実施形態のみを説明し、本発明の範囲及び趣旨から逸脱せずに、変形及び/又は変更がいくつかの実施形態に対して行なわれてもよい。実施形態は、限定するものではなく例示するものである。
Claims (18)
- 複数の画像を1以上の部分集合に判定する方法であって、ここで、各々の画像は撮像装置による撮像時間を特定するための時間データ及び位置を特定するための位置データと関連付けられる、
前記複数の画像の撮像時間順リストにて隣接する対の画像の時間変数を、当該隣接する対の画像の時間データに基づき判定するステップと、
前記撮像時間順リスト順にて隣接する対の画像の位置変数を、当該隣接する対の画像の位置データに基づき判定するステップと、
前記複数の画像の各画像の撮像の前記時間及び前記位置において前記撮像の速度データを生成するステップと、
前記画像における前記撮像時間順リストをコスト関数に基づいて1以上のイベントの部分集合に区分するステップとを有し、
前記コスト関数は、前記速度データに対して重み付けされる前記時間変数及び前記距離変数の正規化に従って判定されることを特徴とする方法。 - 速度データを判定するステップは、
(i)前記画像と関連付けられたメタデータから前記速度データを算出するステップ、
(ii)速度ログデバイスから前記速度データを受信するステップ
の少なくとも1つを含むことを特徴とする請求項1に記載の方法。 - 前記時間変数は前記撮像装置の前記速度が所定の閾値を超える場合に前記距離変数よりも大きく重み付けされ、
前記距離変数は前記撮像装置の前記速度が前記所定の閾値を下回る場合に前記時間変数よりも大きく重み付けされる
ことを特徴とする請求項1に記載の方法。 - 前記重み付けすることは、前記時間又は前記距離のいずれかを選択することを含むことを特徴とする請求項1に記載の方法。
- 前記重み付けすることは、前記速度データが速度閾値を下回る場合に90%の距離及び10%の距離であり、前記速度データが前記速度閾値を上回る場合に100%の時間であることを特徴とする請求項4に記載の方法。
- 前記速度データは、前記時間変数及び前記距離変数から判定されることを特徴とする請求項1に記載の方法。
- 画像の前記撮像時間順リストを作成するために前記画像の特徴により前記複数の画像を順序付けするステップを更に備えることを特徴とする請求項1記載の方法。
- 前記画像の前記特徴は、撮像時間、ファイル名及び基準点からの距離のうちの少なくとも1つであることを特徴とする請求項7に記載の方法。
- 前記速度データは、速度情報の周期サンプリング又は前記カメラの前記位置のGPSログのうちの少なくとも1つから導出されることを特徴とする請求項1に記載の方法。
- 前記コスト関数は、前記時間変数及び前記距離変数の加重平均であることを特徴とする請求項1に記載の方法。
- 前記時間変数及び前記距離変数の前記加重平均に対する重みは、前記速度データから導出されることを特徴とする請求項10に記載の方法。
- 画像と関連付けられた前記コスト関数がコスト閾値を上回る場合に新しく区分された部分集合が作成され、前記コスト関数が前記コスト閾値を下回る場合に前記画像が既存の部分集合に割り当てられるように、前記画像は前記コスト閾値に基づいて前記部分集合に区分されることを特徴とする請求項1に記載の方法。
- 前記時間変数及び前記距離変数は、前記順序付けされた画像のセットの隣接する画像から導出されることを特徴とする請求項1に記載の方法。
- 前記時間変数は前記隣接する画像間の時間差、前記距離変数は前記隣接する画像間の距離計測値であることを特徴とする請求項13に記載の方法。
- 前記速度データは、前記写真撮影者/撮像装置の前記2つの画像間の前記速度、及び、前記画像が撮影された時の前記撮像装置の前記速度のうちの少なくとも1つから導出されることを特徴とする請求項1に記載の方法。
- 前記正規化は、平均分散正規化、機能ワーピング/ヒストグラム平坦化又はMAP適応のうちの1つを含むことを特徴とする請求項1に記載の方法。
- 請求項1乃至16のいずれか1項に記載の方法を実行するようにコンピュータ化装置により実行されるコンピュータプログラムを記録したことを特徴とする非一時的なコンピュータ可読記憶媒体。
- 請求項1乃至16のいずれか1項に記載の方法を実行するように構成されることを特徴とするコンピュータ化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2011202609A AU2011202609B2 (en) | 2011-05-24 | 2011-05-24 | Image clustering method |
AU2011202609 | 2011-05-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012244634A true JP2012244634A (ja) | 2012-12-10 |
JP5386007B2 JP5386007B2 (ja) | 2014-01-15 |
Family
ID=47198989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012116884A Expired - Fee Related JP5386007B2 (ja) | 2011-05-24 | 2012-05-22 | 画像クラスタリング方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8818113B2 (ja) |
JP (1) | JP5386007B2 (ja) |
CN (1) | CN102799890A (ja) |
AU (1) | AU2011202609B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016517555A (ja) * | 2013-03-01 | 2016-06-16 | フェイスブック,インク. | モーメントへの写真クラスタリング |
JP2018045623A (ja) * | 2016-09-16 | 2018-03-22 | 富士フイルム株式会社 | 画像分類装置、画像分類方法及びプログラム |
US20180218527A1 (en) * | 2017-01-31 | 2018-08-02 | Canon Kabushiki Kaisha | Image processing apparatus for laying out image on template and image processing method |
JP2020144874A (ja) * | 2016-09-29 | 2020-09-10 | 富士フイルム株式会社 | ページ画像表示制御システム,ページ画像表示制御方法およびそのプログラム |
US11080913B2 (en) | 2016-09-29 | 2021-08-03 | Fujifilm Corporation | Page image display control system, page image display control method, and program therefor |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9025810B1 (en) | 2010-04-05 | 2015-05-05 | Google Inc. | Interactive geo-referenced source imagery viewing system and method |
WO2013128061A1 (en) * | 2012-02-27 | 2013-09-06 | Nokia Corporation | Media tagging |
US9092455B2 (en) * | 2012-07-17 | 2015-07-28 | Microsoft Technology Licensing, Llc | Image curation |
US9483475B2 (en) * | 2012-12-26 | 2016-11-01 | Htc Corporation | Content recommendation method |
US9582546B2 (en) | 2013-02-27 | 2017-02-28 | Here Global B.V. | Specificity for naming based on location |
US9202143B2 (en) | 2013-04-29 | 2015-12-01 | Microsoft Technology Licensing, Llc | Automatic photo grouping by events |
US9674650B2 (en) * | 2013-07-26 | 2017-06-06 | Here Global B.V. | Familiarity measure to group objects |
JP6081323B2 (ja) * | 2013-09-05 | 2017-02-15 | 富士フイルム株式会社 | イベントの撮像画像配置装置ならびにその制御方法およびその制御プログラム |
US9046996B2 (en) * | 2013-10-17 | 2015-06-02 | Google Inc. | Techniques for navigation among multiple images |
USD781318S1 (en) | 2014-04-22 | 2017-03-14 | Google Inc. | Display screen with graphical user interface or portion thereof |
USD781317S1 (en) | 2014-04-22 | 2017-03-14 | Google Inc. | Display screen with graphical user interface or portion thereof |
US9972121B2 (en) * | 2014-04-22 | 2018-05-15 | Google Llc | Selecting time-distributed panoramic images for display |
US9934222B2 (en) | 2014-04-22 | 2018-04-03 | Google Llc | Providing a thumbnail image that follows a main image |
USD780777S1 (en) | 2014-04-22 | 2017-03-07 | Google Inc. | Display screen with graphical user interface or portion thereof |
US10002310B2 (en) | 2014-04-29 | 2018-06-19 | At&T Intellectual Property I, L.P. | Method and apparatus for organizing media content |
US20150331930A1 (en) * | 2014-05-16 | 2015-11-19 | Here Global B.V. | Method and apparatus for classification of media based on metadata |
US10678412B2 (en) | 2014-07-31 | 2020-06-09 | Microsoft Technology Licensing, Llc | Dynamic joint dividers for application windows |
US9836464B2 (en) | 2014-07-31 | 2017-12-05 | Microsoft Technology Licensing, Llc | Curating media from social connections |
US10592080B2 (en) | 2014-07-31 | 2020-03-17 | Microsoft Technology Licensing, Llc | Assisted presentation of application windows |
US10254942B2 (en) | 2014-07-31 | 2019-04-09 | Microsoft Technology Licensing, Llc | Adaptive sizing and positioning of application windows |
CN104133917B (zh) * | 2014-08-15 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 照片的分类存储方法及装置 |
CN106155508B (zh) * | 2015-04-01 | 2021-01-01 | 腾讯科技(上海)有限公司 | 一种信息处理方法及客户端 |
AU2015203570A1 (en) * | 2015-06-26 | 2017-01-19 | Canon Kabushiki Kaisha | Method, system and apparatus for segmenting an image set to generate a plurality of event clusters |
CN105045582B (zh) * | 2015-07-07 | 2018-01-02 | 西北工业大学 | 一种基于手机拍照行为的事件定位方法 |
CN105608109A (zh) * | 2015-11-16 | 2016-05-25 | 广州优视网络科技有限公司 | 拍照日志的处理方法、装置、系统、服务器以及智能设备 |
US10140516B2 (en) * | 2015-12-16 | 2018-11-27 | Samsung Electronics Co., Ltd. | Event-based image management using clustering |
US10217283B2 (en) | 2015-12-17 | 2019-02-26 | Google Llc | Navigation through multidimensional images spaces |
CN105653676B (zh) * | 2015-12-28 | 2019-09-10 | Tcl集团股份有限公司 | 一种景点推荐方法及系统 |
CN106161628B (zh) | 2016-07-13 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 拍摄文件上传方法及装置 |
US10049431B2 (en) * | 2016-07-18 | 2018-08-14 | Qualcomm Incorporated | Locking a group of images to a desired level of zoom and an object of interest between image transitions |
CN107633043B (zh) * | 2017-09-14 | 2020-12-04 | Oppo广东移动通信有限公司 | 图片提醒方法、装置、终端设备及存储介质 |
US11057573B2 (en) * | 2017-12-20 | 2021-07-06 | Texas Instruments Incorporated | Multi camera image processing |
US10647453B2 (en) | 2018-02-23 | 2020-05-12 | ExoAnalytic Solutions, Inc. | Systems and visualization interfaces for identification and display of space object imagery |
US10467783B2 (en) | 2018-02-23 | 2019-11-05 | ExoAnalytic Solutions, Inc. | Visualization interfaces for real-time identification, tracking, and prediction of space objects |
GB2601678B (en) | 2019-07-25 | 2024-03-06 | Exoanalytic Solutions Inc | Systems and Visualization interfaces for orbital paths and path parameters of space objects |
US11409788B2 (en) * | 2019-09-05 | 2022-08-09 | Albums Sas | Method for clustering at least two timestamped photographs |
CN112149624B (zh) * | 2020-10-16 | 2022-06-10 | 腾讯科技(深圳)有限公司 | 一种交通标识图像处理方法和装置 |
CN113343008A (zh) * | 2021-06-29 | 2021-09-03 | 维沃软件技术有限公司 | 图像排序方法、图像排序装置、电子设备和可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293985A (ja) * | 2005-03-15 | 2006-10-26 | Fuji Photo Film Co Ltd | アルバム作成装置、アルバム作成方法、及びプログラム |
JP2006344005A (ja) * | 2005-06-09 | 2006-12-21 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
JP2007122110A (ja) * | 2005-10-25 | 2007-05-17 | Fujifilm Corp | 画像分類装置および方法並びにプログラム |
JP2008521133A (ja) * | 2004-11-17 | 2008-06-19 | イーストマン コダック カンパニー | 分散ベースのイベント・クラスタリング |
WO2010070804A1 (ja) * | 2008-12-19 | 2010-06-24 | パナソニック株式会社 | 画像検索装置及び画像検索方法 |
JP2010257266A (ja) * | 2009-04-27 | 2010-11-11 | Sharp Corp | コンテンツ出力システム、サーバー装置、コンテンツ出力装置、コンテンツ出力方法、コンテンツ出力プログラム、及びコンテンツ出力プログラムを記憶した記録媒体 |
JP2011024196A (ja) * | 2009-06-18 | 2011-02-03 | Panasonic Corp | 画像選択装置、画像選択方法、及び画像選択システム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4457660B2 (ja) * | 2003-12-12 | 2010-04-28 | パナソニック株式会社 | 画像分類装置、画像分類システム、画像分類に関するプログラム、およびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US8116573B2 (en) * | 2006-03-01 | 2012-02-14 | Fujifilm Corporation | Category weight setting apparatus and method, image weight setting apparatus and method, category abnormality setting apparatus and method, and programs therefor |
WO2009070841A1 (en) * | 2007-12-05 | 2009-06-11 | It Au0801806Rsity Of Technology | Social multimedia management |
US8972177B2 (en) | 2008-02-26 | 2015-03-03 | Microsoft Technology Licensing, Llc | System for logging life experiences using geographic cues |
US8477207B2 (en) * | 2008-06-06 | 2013-07-02 | Sony Corporation | Image capturing apparatus, image capturing method, and computer program |
US8611678B2 (en) * | 2010-03-25 | 2013-12-17 | Apple Inc. | Grouping digital media items based on shared features |
-
2011
- 2011-05-24 AU AU2011202609A patent/AU2011202609B2/en not_active Ceased
-
2012
- 2012-05-22 JP JP2012116884A patent/JP5386007B2/ja not_active Expired - Fee Related
- 2012-05-22 US US13/477,955 patent/US8818113B2/en not_active Expired - Fee Related
- 2012-05-24 CN CN201210163641XA patent/CN102799890A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008521133A (ja) * | 2004-11-17 | 2008-06-19 | イーストマン コダック カンパニー | 分散ベースのイベント・クラスタリング |
JP2006293985A (ja) * | 2005-03-15 | 2006-10-26 | Fuji Photo Film Co Ltd | アルバム作成装置、アルバム作成方法、及びプログラム |
JP2006344005A (ja) * | 2005-06-09 | 2006-12-21 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
JP2007122110A (ja) * | 2005-10-25 | 2007-05-17 | Fujifilm Corp | 画像分類装置および方法並びにプログラム |
WO2010070804A1 (ja) * | 2008-12-19 | 2010-06-24 | パナソニック株式会社 | 画像検索装置及び画像検索方法 |
JP2010257266A (ja) * | 2009-04-27 | 2010-11-11 | Sharp Corp | コンテンツ出力システム、サーバー装置、コンテンツ出力装置、コンテンツ出力方法、コンテンツ出力プログラム、及びコンテンツ出力プログラムを記憶した記録媒体 |
JP2011024196A (ja) * | 2009-06-18 | 2011-02-03 | Panasonic Corp | 画像選択装置、画像選択方法、及び画像選択システム |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016517555A (ja) * | 2013-03-01 | 2016-06-16 | フェイスブック,インク. | モーメントへの写真クラスタリング |
JP2018045623A (ja) * | 2016-09-16 | 2018-03-22 | 富士フイルム株式会社 | 画像分類装置、画像分類方法及びプログラム |
JP2020144874A (ja) * | 2016-09-29 | 2020-09-10 | 富士フイルム株式会社 | ページ画像表示制御システム,ページ画像表示制御方法およびそのプログラム |
US11080913B2 (en) | 2016-09-29 | 2021-08-03 | Fujifilm Corporation | Page image display control system, page image display control method, and program therefor |
US20180218527A1 (en) * | 2017-01-31 | 2018-08-02 | Canon Kabushiki Kaisha | Image processing apparatus for laying out image on template and image processing method |
CN108377351A (zh) * | 2017-01-31 | 2018-08-07 | 佳能株式会社 | 用于在模板上布局图像的图像处理装置和图像处理方法 |
JP2018124780A (ja) * | 2017-01-31 | 2018-08-09 | キヤノン株式会社 | プログラム、画像処理装置、および画像処理方法 |
KR20200067260A (ko) * | 2017-01-31 | 2020-06-12 | 캐논 가부시끼가이샤 | 화상을 템플릿에 레이아웃하기 위한 화상 처리장치 및 화상 처리방법 |
US10943376B2 (en) * | 2017-01-31 | 2021-03-09 | Canon Kabushiki Kaisha | Image processing apparatus for laying out image on template and image processing method |
CN108377351B (zh) * | 2017-01-31 | 2021-03-23 | 佳能株式会社 | 用于在模板上布局图像的图像处理装置和图像处理方法 |
KR102269889B1 (ko) * | 2017-01-31 | 2021-06-28 | 캐논 가부시끼가이샤 | 화상을 템플릿에 레이아웃하기 위한 화상 처리장치 및 화상 처리방법 |
Also Published As
Publication number | Publication date |
---|---|
AU2011202609A1 (en) | 2012-12-13 |
JP5386007B2 (ja) | 2014-01-15 |
US8818113B2 (en) | 2014-08-26 |
AU2011202609B2 (en) | 2013-05-16 |
US20120301039A1 (en) | 2012-11-29 |
CN102799890A (zh) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5386007B2 (ja) | 画像クラスタリング方法 | |
US20230063920A1 (en) | Content navigation with automated curation | |
JP5801395B2 (ja) | シャッタクリックを介する自動的メディア共有 | |
US9256808B2 (en) | Classifying and annotating images based on user context | |
US8594440B2 (en) | Automatic creation of a scalable relevance ordered representation of an image collection | |
US8655889B2 (en) | Autonomous mobile blogging | |
US7107520B2 (en) | Automated propagation of document metadata | |
US9418482B1 (en) | Discovering visited travel destinations from a set of digital images | |
JP4881034B2 (ja) | 電子アルバム編集システム、電子アルバム編集方法、及び電子アルバム編集プログラム | |
US20110225178A1 (en) | Automatic discovery of metadata | |
US20140047386A1 (en) | Digital asset tagging | |
EP1990744B1 (en) | User interface for editing photo tags | |
US20150086123A1 (en) | Photo Grouping System, Photo Grouping Method- and Non-Transitory Computer-Readable Storage Medium | |
CN111373724B (zh) | 电子装置及其控制方法 | |
WO2015185479A1 (en) | Method of and system for determining and selecting media representing event diversity | |
US7646939B2 (en) | Electronic album editing system, electronic album editing method and electronics album editing program | |
JP7188478B2 (ja) | 検索装置、検索方法、およびプログラム | |
JP2006120058A (ja) | 電子アルバム作成アプリケーションソフト | |
EP3038108A1 (en) | Method and system for generating a video album | |
JP2016072918A (ja) | 情報処理装置、映像ファイルの共有方法、コンピュータプログラム | |
CN116450587A (zh) | 文件的管理方法及其装置 | |
AU2010219397A1 (en) | Method, system and apparatus for classifying a set of captured images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131004 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5386007 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |