JP5537557B2 - 事象毎に意味論的に分類する方法 - Google Patents

事象毎に意味論的に分類する方法 Download PDF

Info

Publication number
JP5537557B2
JP5537557B2 JP2011536321A JP2011536321A JP5537557B2 JP 5537557 B2 JP5537557 B2 JP 5537557B2 JP 2011536321 A JP2011536321 A JP 2011536321A JP 2011536321 A JP2011536321 A JP 2011536321A JP 5537557 B2 JP5537557 B2 JP 5537557B2
Authority
JP
Japan
Prior art keywords
event
image
belonging
category
level content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011536321A
Other languages
English (en)
Other versions
JP2012509522A5 (ja
JP2012509522A (ja
Inventor
マディラクシィ ダス
アレクサンダー シー ルイ
マーク ディー ウッド
Original Assignee
インテレクチュアル ベンチャーズ ファンド 83 エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インテレクチュアル ベンチャーズ ファンド 83 エルエルシー filed Critical インテレクチュアル ベンチャーズ ファンド 83 エルエルシー
Publication of JP2012509522A publication Critical patent/JP2012509522A/ja
Publication of JP2012509522A5 publication Critical patent/JP2012509522A5/ja
Application granted granted Critical
Publication of JP5537557B2 publication Critical patent/JP5537557B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はディジタル画像処理、特にディジタル画像を意味論的カテゴリへと分類する方法に関する。
ディジタルカメラやスキャナの普及は画像のディジタル化を促し、大規模な私的画像コレクションを発生させた。今や、多くの人が画像(静止画や動画;以下同様)の整頓・検索に悩み始めている。通常の人々の許にあるディジタル画像コレクションの規模は、今のところは数年分程度であるが、それはおしなべて延びていくはずである。整頓・検索に関する悩みがそれにつれ募り、効率的且つ自動的な画像付索・検索ツールを望む声が強まるものと思われる。
画像内容に基づく検索に役立つ画像分類手法としては、色、模様等の低位特徴に基づく画像分類手法が数多く提案されている。低位内容利用技術に関する研究(非特許文献1)で判明した通り、内容に基づく画像検索には様々な手法を利用することができる。また、低位特徴とは、一般に、色、局所的形状特性(方向別色微分及びスケール空間表現から導出されるもの)、画像内の模様、画像変換係数(例えばJPEGコーディングで使用される余弦変換係数)、画像セグメントから検出される特性(例えば形状や輪郭や幾何学的不変量)等の特徴のことである。これらの特徴は、効率的且つ確実に導出・照合できる反面、意味論的画像内容との関連性に乏しいのが常である。
画像から意味論的特徴を検出する試みもなされている。まず、特許文献3では、主立った画像内領域に備わる可視特性に基づき画像が分類される。可視特性の数値計測結果だけでなく、「空」「肌」等の意味論的語彙を用いた画像内領域の分類にニューラルネットワークも使用される。所与画像の特性と符合する画像を容易に発見できるよう、コレクション内画像に備わる領域別特性に付索される。次に、特許文献1に記載の手法では、画像内の主要な被写体をクラスタリングセンタとして画像の分類や検索が行われる。所与の未分類画像と符合する画像が見つかるよう、当該所与画像に写っている主要な被写体に基づき検索事項の形式が整えられる。そして、特許文献2では、「都市景観」等、幾つかある所定のカテゴリ候補のなかから画像のカテゴリが特定される。
米国特許第6240424号明細書(B1) 米国特許出願公開第2003/0195883号明細書(A1) 国際公開第WO01/37131号パンフレット(A2) 米国特許第6606411号明細書 米国特許第6351556号明細書 米国特許第6915011号明細書 米国特許第6504951号明細書 米国特許出願公開第2005/0105776号明細書 米国特許出願公開第2005/0105775号明細書 米国特許第5781650号明細書 米国特許出願公開第2008/0112621号明細書 米国特許出願公開第2007/0177805号明細書 米国特許出願公開第2007/0098303号明細書
A.W.M.Smeulders et al., "Content-based Image Retrieval at the End of the Early Years," IEEE Trans. on Pattern Analysis and Machine Intelligence, 22(12) Dec. 2000 Han and Kamber, "Data Mining Concepts and Techniques," Elsevier, 2006, pg. 418-420 "Review of the state of the art in semantic scene classification," Computer Science TR 799, University of Rochester, 2002 Carneiro et al., "Supervised learning of semantic classes for image annotation and retrieval," IEEE Transactions on PAMI, March 2007 Boutell et al., "Learning multi-label scene classification," Pattern Recognition 37(2004) M.J.Jones, P.Viola, "Fast Multi-view Face Detection," IEEE Conference on Computer Vision and Pattern Recognition(CVPR), June 2003 Duda, Hart and Stork, "Pattern Classification," 2nd ed., John Wiley and sons, 2000 Judea Pearl, Morgan Kaufmann, "Probabilistic Reasoning in Intelligent Systems," 1988
こうした意味論的特徴は、ユーザにとり唯一の自コレクション内画像呼出・検索手段ではない。ユーザによる画像呼出は、その画像が撮影された出来事をもとに行われることも多い。例えば、写真を「グランドキャニオン旅行」「お母さんのバースデイパーティ」「ジョーの野球リーグ」等々と区別するものである。既存のソフトウェアのなかには、写真の区別に役立つタグ・字幕をアニュアル入力可能な仕組みを備えるものもある。しかしながら、これは手間暇のかかるプロセスである。そのため、画像に予めタグ付けしておくことなく、ユーザが一般的事象種別で画像を検索できるよう、そのプロセスを自動化することが求められている。更に、ユーザが事象種別を他の意味論的特徴、例えばその画像に写っている人数、場所乃至行為と組み合わせ、関連画像検索範囲を絞れるようにすることも求められている。
本願では、私的なディジタル画像コレクションに属する画像を事象別に幾つかのカテゴリに分類する、という目的を達成するため、そのコレクションに属する画像を自動分類する方法として、
(a)そのディジタル画像コレクションの事象表現を生成するステップと、
(b)その事象表現に属する事象毎に大域的な時間的特徴を検出するステップと、
(c)当該事象表現に属する事象にて画像毎に内容的特徴を検出するステップと、
(d)画像毎の内容的特徴を同一事象同士で組み合わせて事象毎の内容的特徴を検出するステップと、
(e)事象毎の時間的特徴及び内容的特徴に基づき個々の事象を所定の意味論的カテゴリのうちいずれかに分類するステップと、
を有する方法を提案する。
画像の整頓・検索は多くの人にとり悩みの種であり、画像内容を自動認識してその意味論的内容(事象、人物、場所等)に基づきディジタル画像コレクション内画像を検索可能とするツールが求められている。ここに、本発明では、コレクション内画像が事象毎に意味論的カテゴリへと自動分類される。従って、特定の事象を示すことで、ユーザは、自コレクション内画像を検索・閲覧することができる。事象毎の意味論的カテゴリを示す事象ラベルを画像に自動付与し、事象別のクリエイティブメディア出力を自動生成させることも可能となる。本発明は、コレクション内画像のうち特定の意味論的カテゴリに属するものを指定しユーザが画像を検索する構成にすることができる。更に、本発明は、画像に事象ラベルを自動付与させ、それを用いクリエイティブメディア出力を事象別に自動生成させる構成にすることができる。
本発明の一実施形態に係る手順を示すフローチャートである。 ディジタル画像コレクションの階層的事象表現を生成する手順を示すフローチャートである。 時間的特徴及び内容的特徴を利用する事象分類器内ベイジアンネットワークを示す図である。 拡張特徴セットを利用する事象分類器内ベイジアンネットワークを示す図である。 事象分類器内ベイジアンネットワークの出力をルールに基づき修正する手段を示す図である。 事象分類器内ベイジアンネットワークを訓練する手順を示すフローチャートである。 図1に示した事象分類器120の内部構成を示す図である。
本件技術分野で習熟を積まれた方々(いわゆる当業者)にとり自明な通り、本発明はコンピュータシステム上で実施可能である。その好適な実施形態についてこれから詳細に説明するが、それに対し本発明の技術的範囲内で様々な変形乃至修正を施せることをご理解頂きたい。キーフレーム画像の集まりである動画も、以下の説明では「画像」の一種として扱っている。
まず、図1中の事象検出器110は、ユーザのディジタル画像コレクション105を分類してその事象表現を生成する。図2に示した手順では、その事象表現として、上位事象、事象及び下位事象の三階層を有する階層的事象表現を生成する。この手順では、まず、事象・下位事象検出器225がコレクション105を時間軸沿いに分類して事象及び下位事象を検出する。この事象・下位事象検出には、本願出願人を譲受人とする特許文献4及び5に記載の画像内容クラスタリングアルゴリズム(この引用を以てその内容を本願に繰り入れることとする)を使用することができる。特許文献4によれば、事象とはその色分布に一貫性があり撮影時背景が同じと見られる画像の集まり、下位事象とはそれらの背景がいずれも同じ色・模様を有する画像の集まりである。いずれも特定の出来事(事象に対応)やその細目(下位事象に対応)に対するユーザの主観的認識のことではなく、そうした主観的認識と符合させることを狙ったコンピュータ媒介型処理の客観的処理結果のことである。特許文献4及び5に記載のアルゴリズムを応用することにより、ディジタル画像コレクション内の画像を時間軸に沿いそれら事象別、下位事象別に分類することができる。簡潔に言えば、画像の集まりのうち他の集まりとの時間差が大きいものが事象であり、その時間差が事象環境界に対応しているので、コレクション内画像に対する時間別、日付別又は日時別クラスタリングで画像の集まりを探し、見つかった集まりのうち他の集まりとの時間差が大きい方から幾つかを、事象として他の集まりから分離させることで、コレクション内画像を幾つかの事象に分類することができる。また、事象のうち幾つかの下位事象を含むものからは、特許文献5記載の如く、その色ヒストグラム情報を相連続する画像間で比較することで、そうした下位事象を検出することができる。各画像を複数個のブロックに分割し、ブロック毎に色ヒストグラムを求め、特許文献5記載のブロック別色ヒストグラム相関付け処理を実行して下位事象間境界を検出すればよい。また、事象検出には、本願出願人を譲受人とする特許文献6(この引用を以てその内容を本願に繰り入れることとする)に記載の画像自動整頓手法も使用することができる。簡潔に言えば、特許文献6に例示されている手法では、前景及び背景のセグメント化を伴う事象別クラスタリングにより、グループをなす画像を類似事象別に分類している。即ち、まず個々の画像を複数ブロックに分割してブロック単位画像を生成し、ブロック間比較を通じ個々のブロック単位画像をセグメント化して前景、背景等の領域に分け、個々の領域から光度、色、位置又は寸法上の特徴を幾つか抽出し、抽出した特徴に基づき前景、背景等の領域の類似性をグループ内の相連続する画像間で推定・比較し、それら相連続する画像間の総合的類似性指標ひいては画像間距離を求め、そしてその画像間距離に基づき事象別のクラスタを生成する。
こうして検出した事象を古いものから新しいものへと時間順に並べ替えると、上述の手法では単一の事象として検出されない出来事に係る複数の事象が、日付の変更を挟み連なることがある。例えば、長い期間乃至日数に亘っていて様々な行為・状況を包含している出来事(例えば複数の行き先を巡る休暇旅行)、数時間程度間をおき開催される複数のパートを有する出来事(例えば複数の試合からなるスポーツ行事や結婚式)等である。夜間に相当する撮影中断期間も、事象としての連続性を阻害する原因となる。従って、日付の変更を挟み連なる複数の事象のまとまり、即ち上位事象を検出するため更なる処理を実行する必要がある。
そのため、図2中の事象間隔算出器230では検出済の事象毎に事象間隔を導出する。事象間隔とは、連綿と続く時間軸に沿い、先行する事象で最後に撮影された画像と、それに後続する事象で最先に撮影された画像との間にある期間のことである。時間軸に沿い事象間隔で隔てられている個々の事象は、単一の点として扱うことができる。密度利用分類器235は、非特許文献2記載の密度利用クラスタリング法をそれらの点に適用する。この手法は、十分に高い点密度を有する領域をクラスタへと成長させるアルゴリズムに則っている。従って、その適用により、それらを隔てる事象間隔が割合に短い(例えば18時間未満の)点を統合的にクラスタリングし、そのクラスタを上位事象として検出することができる。上位事象として検出されるのは、典型的には、そのユーザのディジタル画像コレクション内で、比較的長期間に亘っている出来事や、複数の部分に亘っている出来事である。事象間隔が短めの事象や、孤立している事象は、ノイズとして扱われるため統合されずに残される。そして、事象階層生成器240が、上位事象、事象及び下位事象を含む三階層の階層的事象表現を生成する。なお、以下の説明では、その階層的事象表現で最上位に位置するものを「事象」と呼ぶこととする。従って、上位事象がその名で呼ばれることもある。
次に、図1中の内容的特徴検出器群112は、個々のコレクション内画像に相応のアルゴリズムを適用してその内容的特徴を検出する。内容的特徴とは、画素群から導出される特徴のうち画像内容の指標となりうる特徴のことであり、色、模様等のように低位なものから、顔や被写体の検出結果のように階層的に高位なものまで含んでいる。本願出願人を譲受人とする特許文献7に記載の手法によれば、画像から空を検出することができる。本願出願人を譲受人とする特許文献8によれば、撮影時メタデータ及び画像内容に基づき画像を場面別(屋内か屋外か等)に分類することができる。非特許文献3によれば、市街、野原、自然等の場面別に画像を分類することができる。非特許文献4によれば、水、草、雪、山、建物等、複数の意味論的階級を検出可能となるよう教師付学習を施すことができる。本願出願人を譲受人とする特許文献9によれば、事象の時間的内容に基づき画像の内容的特徴を検出することができる。非特許文献5に記載の手法によれば、複数の有効な階級で画像を記述することができる。加えて、ディジタル画像処理の分野で周知の顔検出法を用い、画像に現れている人面の個数、概略寸法及び位置を求めることができる。例えば、非特許文献6に記載の顔検出手法によれば、人間の顔を画像から探し出すことができる。特許文献10に記載の手法によれば、加齢につれ骨格構造ひいては顔寸法比計測値が変化する、という既知の事実に基づき、個々の顔に年齢別カテゴリを割り当てることができる。
表1に、既存のアルゴリズムで検出しうる内容的特徴を例示列挙する。既知の通り、これらは事象別の意味論的カテゴリに強く関連する特徴である。まず、この表の第1列に記されているのは特徴の名称、第2列に記されているのはその特徴の顕著度である。最も単純な特徴では、例えば「ある」「ない」の二通りしか顕著度が生じ得ない。また、内容的特徴検出器の出力を定量的に調べて複数通りの顕著度を割り振り、その特徴に係る量又は信頼度を表現することもできる。特徴の種類によっては、しきい値を実験的に決定してその存否判別に利用することもできる。例えば、表1記載の例では、画素のうち25%超が水を示す画素として検出されているなら水の顕著度を「ある」にしている。このように、特徴のうち画像の有意な構成部分をなすものの顕著度を「ある」にすればよい。こうして画像毎の内容的特徴を検出したら、同一事象同士で画像毎の内容的特徴を組み合わせて事象毎の内容的特徴を検出する。(0以外の)顕著度を有する画像が同一事象内で十分な比率を占めることとなる特徴を、その事象の内容的特徴とすればよい。表1の第3列に記されているのは、その比率を示す事象内画像枚数しきい値である。例えば、同じ事象に属する画像のうち15%超で特徴「草」の顕著度が「ある」になっていなければ、その事象の特徴「草」についての顕著度は「ある」にならない。
更に、図1中の時間的特徴検出器群114は、そのコレクションに属する事象毎に大域的な時間的特徴を検出する。時間的特徴とは、画像のEXIFヘッダから得られる撮影日時情報又はそれに類する他フォーマットのメタデータに基づき導出される特徴のことであり、大域的な時間的特徴とは、その事象に属する画像の撮影日時情報から事象毎に導出される時間的特徴のことである。表2に時間的特徴の諸例を示す。例示されているのは事象継続期間、事象間隔(隣り合う事象同士を隔てている時間)、画像枚数、日内時期(朝、午後、夜等)及び年内時期である。事象継続期間は、カメラ内で撮影時に画像のEXIFヘッダ内に埋め込まれた撮影時刻に基づき、その事象で最先に撮影された画像の撮影時刻と、最後に撮影された画像の撮影時刻との差として求めることができる。事象間隔は、先行する事象で最後に撮影された画像の撮影時刻と、後続する事象で最先に撮影された画像の撮影時刻との差として求まる。日内時期は、その事象の時間的拡がりの半ばにある画像からわかる。年内時期は、年を主立った時節に分けたものであり、その事象の撮影月からわかる。このようにして、事象毎の時間的特徴が検出される。表2の第3列に記されているのは、時間的特徴毎の顕著度判別に使用されるしきい値である。
そして、典型的なコンシューマが写真を撮影する機会についての研究結果によれば、撮影された画像のうち80〜90%がカバーされるよう、事象の分類先として幾つかの意味論的カテゴリを予め定めておくことができる。表3に示したのは、そうした意味論的カテゴリのうち最上位のもの4個とその下位カテゴリの例である。図1中の事象分類器120は、特徴検出器112,114から入力として供給される特徴検出結果に基づき、その出力たる事象ラベル(群)122を生成する。一組の特徴入力に応じ有限個数の分類出力を生成するよう訓練可能な分類器は文献にて複数提案されている。その例としては、非特許文献7に記載の通り、サポートベクタマシン、ニューラルネットワーク及びベイジアンネットワークがある。図1中の事象分類器120を図7の如く二段構成とする場合、そのうちの確率論的分類器710として(サポートベクタマシン、ニューラルネットワーク等の他種分類器も使用可能だが)非特許文献8記載のベイジアン信念ネットワーク(BBN)を使用するのが望ましい。BBNは、不確実性についてのモデリング及び理由付けを可能とする確率論的グラフィカルモデリングの一形態であり、変数を表すノードと、変数間の確率論的依存性を捕捉する条件付確率を表す弧と、を含む無閉路有向グラフで表すことができる。訓練時には、BBNを構成する個々の弧に対応する条件付確率と、事象ラベル出力のアプリオリ確率とを学習させておく。訓練後は、そのBBNに特徴検出結果を与えることで、特徴検出結果に対する各事象ラベル出力の確率をその出力ノードから得ることができる。このように、BBNを用いることで、不完全な情報をそつなく取り扱うことができる。
図3にそのBBNの一例構成を示す。このBBNは、時間的特徴検出器群114によって検出される時間的特徴(表2に示した継続期間310等)を入力するノード、内容的特徴検出器群112によって検出された内容的特徴(表1に示した被写人数315、屋外判定320等)を入力するノード、並びに画像の時間的特徴及び内容的特徴に基づき付与した事象ラベル(群)305を出力するノードを有している。
事象分類器の精度を高めるため、撮影が行われた事象に直接的又は間接的に関連する補助事実情報のデータベース116(図1参照)を踏まえるようにしてもよい。その補助事実情報の例としては、人物間の家族関係に関する知識、各人の経歴、地理的情報、常識的知識に属するデータ等を掲げることができる。また、補助事実情報として、周知ファイル形式で記録されている画像の撮影時メタデータ(EXIF等)から画像内容と無関係な撮影時メタデータ、例えば対被写体距離やカメラシーンモードを読み出し使用することもできる。これらの補助事実情報は、いずれも、事象分類器で付与された分類の精細化・検証に使用できるので、それを含む拡張特徴セットを生成して使用するのが望ましい。
それらの補助事実情報は、システム上でBBNの一部として適用することができる。図4にその種の情報を分類に役立てる手法を示す。図中の出力ノードでは、拡張特徴セット、即ち対被写体距離410、GNIS特徴階級415等のほか図3中の出力ノードで得られる情報305(前述した時間的特徴及び内容的特徴の影響を示す情報)からなるセットに基づき事象ラベル群405を生成し、最大確率を呈する階級に係る事象ラベルをその事象に付与する。こうしたBBNの精度を更に高めるには、例えば、対被写体距離が大きい事象は一家団欒や社交会合よりもスポーツや余暇休暇に関連している蓋然性が高い、等といった事柄を示す教師データで訓練しておけばよい。また、カメラで付与されたメタデータを補助的な知識ベースと組み合わせてBBN入力を多様化することも可能である。例えば、昨今のディジタル撮影装置では撮影時にGPS座標が検出されることが多い。マニュアル入力で画像に地理的データを関連付けることもできる。それら、事象が発生した場所の緯度及び経度に基づき、米国地質調査所の地名情報システム(GNIS)等といった補助データベースを参照し、その事象を地理的特徴別の階級、例えば水域別の階級や施設別の階級(学校等)に分類することも可能である。ご存じの通り、スポーツ行事が墓地よりも学校で、また社交会合が空港よりも教会で行われることが多いからである。
使用するBBNには、ラベル付入出力データ(教師データ)を与え、そのBBNの個別の弧で条件付確率を算出させる訓練を施しておく。その際、その教師データに基づきアプリオリ確率(群)も学習させておく。即ち、図6に示すように、まず複数年に亘る訓練用ディジタル画像コレクション602を複数のコンシューマから収集する。次いで、図1に示した階層的事象検出器110を用い、そのコレクション602から事象及び上位事象を検出する。更に、表3に列挙した所定の意味論的カテゴリのうちいずれか(該当するものがなければ「他」)に分類されることとなるよう、事象ラベル付与担当者607が事象にラベルを付与する。次いで、図1に示した内容的特徴検出器群112及び時間的特徴検出器群114を備える関連特徴検出器群610が、前述した諸特徴を事象毎に検出する。これにより、そのBBN向けの教師データが生成される。そして、事象分類器訓練部材620が、事象の最上位カテゴリ(例えば余暇休暇、スポーツ、一家団欒及び社交会合)を特定する訓練をそのBBNに施す。下位カテゴリの特定は後述のルール利用システムに任せることができる。
Figure 0005537557
Figure 0005537557
Figure 0005537557
使用する拡張特徴セットには、その条件付確率を教師データから得ることが困難又は不可能な特徴も含まれうる。従って、相応のヒューリスティクス乃至ルールをシステム上で適用し、図4に示したBBNの出力を検証又は精細化するのが望ましい。そのため、図7に示した構成では、BBN利用型の確率論的分類器710から、図5に詳示するルール利用分類器520へと出力を供給している。そこで適用されるルールの例は、関連領域知識、不定形常識知識、定型化常識知識ベース(Cyc(サイク)やOpen Mind Common Sense)等に基づくルールである。例えば、ある事象がBBNにて「一家団欒」に分類されている場合、この分類結果を検証するには、本システムのユーザから見て家族に当たることがわかっている人物が一人又は複数人、その事象に係る画像に写っていることを求めるルールを、その事象に適用すればよい。この条件が満たされなければ、その事象の分類先を「社交会合」へと修正することができる。また、この種のルールを適用するには、特許文献11〜13に記載の人認識アルゴリズムを用い、その事象に係る画像に写っている人物の素性を識別した上で、図1に示した補助事実データベース116を参照し、本システムのユーザとその人物との関係を特定する必要がある。これは、ユーザと他の人物との関係がユーザと人物との組合せ毎に登録されているデータベースを利用し行うことができる。或いは、法的乃至概略的な関係のみをシステム上で保持しておき、必要に応じ具体的乃至詳細な関係を推論するようにしてもよい。
適用されるルールの別例は、事象別のカテゴリをその下位カテゴリへと精細化するルールである。例えば、その事象が多々ある下位カテゴリのどれに属するのかをBBNにてはっきりと特定できない場合でも、補助データを補強するルールを適用することにより、その事象の下位カテゴリを特定できることがある。BBNにてある事象の最上位カテゴリが「社交会合」であると特定されているなら、人認識アルゴリズムの適用結果(その事象に係る画像に写っている人物)に基づき常識ルール、例えば「その事象に係る画像に写っている人物の誕生日がその事象のそれと同じ又は近い時期であればその社交会合はバースデイパーティである」というルールを適用すれば、その下位カテゴリを「社交会合−誕生日」と特定することができる。個々の人物の誕生日についての情報は、図1に示した補助事実データベース116に登録しておけばよい。なお、相応のアプリオリ確率を図4に示したBBNに学習させておくことでも同様の分類を行える可能性があるが、そうしたアプリオリ確率の導出にはかなりの教師データが必要となる。常識ルールを使用すればそれらの教師データが不要になる。
従って、本発明を実施する際には、図4に示したBBNを使用し個々の事象に係るカテゴリの候補及びそれに係る確率を導出し、図7に示す如く図1中の事象分類器120の二段目たるルール利用分類器520にて図5に示す諸ステップを実行することで、BBNで生成された事象別の諸カテゴリを検証乃至精細化するルール群を適用するのが望ましい。そのルール利用分類器520上で適用されるルールには検証ルール群510と精細化ルール群515がある。これらは、図1に示した内容的特徴検出器群112、時間的特徴検出器群114等、特徴抽出器群530から情報としてもたらされる追加的な特徴や、図1に示した補助事実情報116のデータベースからもたらされる情報に基づき適用される。検証ルール群510の適用により事象ラベル群405が検証され、検証を通過した最高確率のカテゴリがその事象に係る階級として出力される。精細化ルール群515の適用により事象ラベル群405が精細化され、その事象に係る意味論カテゴリの下位カテゴリが特定される。例えば、まず図4に示したBBNにて最上位カテゴリを特定した上で、次に示す諸ルールを図5に示すルール利用システムで適用し、その下位カテゴリを特定するようにすればよい:
[余暇休暇]:その事象の継続期間が単一の暦日内に収まるなら「日帰り外出」、週末期間に収まるなら「週末旅行」、4日を超える長期間に亘るなら「逃避行」、長期休暇の時期と重なっていてその場所がユーザの自宅付近でなさそうなら「長期休暇」、というように下位カテゴリを特定する;
[スポーツ]:特徴「野原」及び「草」に関し肯定的な検出結果が得られているなら「フィールド」、特徴「水」に関し肯定的な検出結果が得られているなら「ウォータ」、特徴「屋内外」に関し屋内との検出結果が得られているなら「インドア」、上述したいずれの特徴検出器でも肯定的な結果が得られていないなら「他」、というように下位カテゴリを特定する;
[一家団欒]:画像から認識された人物とユーザとの関係に基づき下位カテゴリを特定する;
[社交会合]:ユーザの経歴情報から見て妥当なら「結婚式」乃至「誕生日」、ユーザの地理的位置での暦及び休日から見て妥当なら「長期休暇」、人認識アルゴリズムに則り認識された人数が大勢で且つそれらの人物がそのユーザのコレクションによく登場する人物である(見ず知らずではない)なら「パーティ」、というように下位カテゴリを特定する。
また、図7中の確率論的分類器710が省略されており、ルール利用分類器520が拡張特徴セットに基づく事象ラベル群405(図4参照)を参照せずにルール群を適用する形態にて、本発明を実施することもできる。同様に、ルール利用分類器520を備えておらず、確率論的分類器710のみで事象ラベル群が付与される形態にて、本発明を実施することもできる。
ユーザは、事象種別による検索・閲覧を行えるのに加え、事象の意味論的カテゴリに基づき自分用のクリエイティブ出力を作成することができる。また、そうした意味論的情報を他の文脈的情報、例えば画像のメタデータ、日時、GPS、位置又はその任意の組合せと共に自動アルバム化システムに入力し、検出された事象の種別に基づく私的なテーマ別アルバムを作成することができる。例えば、その事象が欧州での長期休暇である場合なら、休暇先の文化的特性及び地域的特性を反映したテーマ及び相応の背景デザインを使用し、アルバムを作成することができる。その事象がパーティである場合なら、快活で滑稽なテーマ及びムードを使用しアルバムを作成することができる。事象に関する情報に基づき他のカスタム出力、例えばコラージュ、カップ、Tシャツ、音声/音楽入りマルチメディアDVD/CD等を作成することもできる。更に、事象に関する意味論的情報に基づきユーザのコレクションを効率的に検索・閲覧可能な構成とすることもできる。例えば、ユーザが簡便にテキスト検索することができるよう、諸事象に注釈が自動付与されるシステム構成にするとよい。そして、検出された事象に応じ狙いを定め広告する用途で本発明を使用することもできる。例えば、検出された行事がアウトドアスポーツであるなら、関連するスポーツグッズの広告をそのユーザ向けに提供する、といった用途である。
以上、その好適な実施形態を参照し本発明を詳細且つ具体的に説明したが、それらに変形や修正を施せること及びそれを本発明の技術的範囲内で行いうることを了解頂きたい。
105 ディジタル画像コレクション、110 階層的事象検出器、112 内容的特徴検出器群、114 時間的特徴検出器群、116 補助事実データベース、120 事象分類器、122 事象ラベル、225 事象・下位事象検出器、230 事象間隔算出器、235 密度利用分類器、240 事象階層生成器、305 画像特徴に基づく事象ラベル群、310 継続期間、315 被写人数、320 屋外判定、405 拡張特徴セットに基づく事象ラベル群、410 対被写体距離、415 GNIS特徴階級、510 検証ルール群、515 精細化ルール群、520 ルール利用分類器、530 特徴抽出器群、602 訓練用ディジタル画像コレクション、607 事象ラベル付与担当者、610 関連特徴検出器群、620 事象分類器訓練部材、710 確率論的分類器。

Claims (11)

  1. 私的なディジタル画像コレクションに属する画像を自動分類するシステムの制御方法であって、該システムのプロセッサによって、
    (a)そのディジタル画像コレクションの事象表現を生成するステップと、
    (b)その階層的事象表現に属する事象毎に大域的な時間的特徴を検出するステップと、
    (c)当該階層的事象表現に属するある事象画像毎に画像レベルの内容的特徴を検出するステップと、
    (d)画像毎の画像レベルの内容的特徴を同一事象同士で組み合わせて事象レベルの内容的特徴を生成するステップと、
    (e)事象継続期間、事象間隔、又は事象内画像枚数のうちの少なくとも一つを含む時間的特徴及び事象レベルの内容的特徴に基づき個々の事象を所定の上位レベルの事象カテゴリのセットからあるカテゴリに分類するステップと、
    (f)ルール利用システムを用いて、関連するカテゴリに属する個々の事象を事象レベルの内容的特徴に基づいて検証するステップと、
    (g)事象レベルの内容的特徴に基づいて、少なくとも一つの事象のカテゴリを下位カテゴリに精細化するステップと、
    を有する制御方法。
  2. 1つ以上の電子プロセッサを有するシステムであって:
    前記プロセッサが:
    画像コレクションの事象表現を生成し;
    階層的事象表現に属する事象毎に大域的な時間的特徴を検出し;
    当該階層的事象表現に属するある事象の画像毎に画像レベルの内容的特徴を検出し;
    画像毎の画像レベルの内容的特徴を同一事象同士で組み合わせて事象レベルの内容的特徴を生成し;
    事象継続期間、事象間隔、又は事象内画像枚数のうちの少なくとも一つを含む時間的特徴及び事象レベルの内容的特徴に基づき、個々の事象を所定の上位レベルの事象カテゴリのセットからあるカテゴリに分類し;
    ルール利用システムを用いて、関連するカテゴリに属する個々の事象を事象レベルの内容的特徴に基づいて検証し;
    事象レベルの内容的特徴に基づいて、少なくとも一つの事象のカテゴリを下位カテゴリに精細化する;ように構成された、
    システム。
  3. 1つ以上のプロセッサは、各事象を検証するために、画像コレクションにおいて識別された被写体に関連する補助事実情報のデータベースを参照するようにさらに構成される、
    請求項2に記載のシステム。
  4. 1つ以上のプロセッサは、少なくとも一つの事象のカテゴリを精細化するために、画像コレクションにおいて識別された被写体に関連する補助事実情報のデータベースを参照するようにさらに構成される、
    請求項2に記載のシステム。
  5. 1つ以上のプロセッサは、階層的事象表現に属するある事象の画像毎に被写体距離を検出するようにさらに構成されており、各事象を分類することは、前記被写体距離に基づく、
    請求項2に記載のシステム。
  6. 1つ以上のプロセッサは、階層的事象表現に属するある事象の画像毎の位置を決定するようにさらに構成されており、各事象を分類することは、前記位置に基づく、
    請求項5に記載のシステム。
  7. 内部に格納された複数の命令を有する非一時的なコンピュータ可読媒体であって、
    前記命令が、
    画像コレクションの事象表現を生成する命令と、
    階層的事象表現に属する事象毎に大域的な時間的特徴を検出する命令と、
    階層的事象表現に属するある事象の画像毎に画像レベルの内容的特徴を検出する命令と、
    画像毎の画像レベルの内容的特徴を同一事象同士で組み合わせて事象レベルの内容的特徴を生成する命令と、
    事象継続期間、事象間隔、又は事象内画像枚数のうちの少なくとも一つを含む時間的特徴及び事象レベルの内容的特徴に基づき、個々の事象を所定の上位レベルの事象カテゴリのセットからあるカテゴリに分類する命令と、
    ルール利用システムを用いて、関連するカテゴリに属する個々の事象を事象レベルの内容的特徴に基づいて検証する命令と、
    事象レベルの内容的特徴に基づいて、少なくとも1つの事象のカテゴリを下位カテゴリに精細化する命令と、を含む、
    非一時的なコンピュータ可読媒体。
  8. 各事象を検証する命令は、画像コレクションにおいて識別された被写体に関連する補助事実情報のデータベースを参照する命令を含む、
    請求項7に記載の非一時的なコンピュータ可読媒体。
  9. 少なくとも一つの事象のカテゴリを精細化する命令は、画像コレクションにおいて識別された被写体に関連する補助事実情報のデータベースを参照する命令を含む、
    請求項7に記載の非一時的なコンピュータ可読媒体。
  10. 各事象を分類する命令は、階層的事象表現に属するある事象の画像毎に被写体距離を検出する命令を含み、各事象を分類することは、前記被写体距離に基づく、
    請求項7に記載の非一時的なコンピュータ可読媒体。
  11. 各事象を分類する命令は、階層的事象表現に属するある事象の画像毎の位置を決定する命令を含み、各事象を分類することは、前記位置に基づく、
    請求項10に記載の非一時的なコンピュータ可読媒体。
JP2011536321A 2008-11-19 2009-11-12 事象毎に意味論的に分類する方法 Expired - Fee Related JP5537557B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/273,600 2008-11-19
US12/273,600 US8611677B2 (en) 2008-11-19 2008-11-19 Method for event-based semantic classification
PCT/US2009/006064 WO2010059188A2 (en) 2008-11-19 2009-11-12 Method for event-based semantic classification

Publications (3)

Publication Number Publication Date
JP2012509522A JP2012509522A (ja) 2012-04-19
JP2012509522A5 JP2012509522A5 (ja) 2012-11-01
JP5537557B2 true JP5537557B2 (ja) 2014-07-02

Family

ID=41650455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011536321A Expired - Fee Related JP5537557B2 (ja) 2008-11-19 2009-11-12 事象毎に意味論的に分類する方法

Country Status (4)

Country Link
US (2) US8611677B2 (ja)
EP (2) EP2405371A1 (ja)
JP (1) JP5537557B2 (ja)
WO (1) WO2010059188A2 (ja)

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8942483B2 (en) 2009-09-14 2015-01-27 Trimble Navigation Limited Image-based georeferencing
US8131012B2 (en) 2007-02-08 2012-03-06 Behavioral Recognition Systems, Inc. Behavioral recognition system
US8064695B2 (en) * 2007-09-27 2011-11-22 Behavioral Recognition Systems, Inc. Dark scene compensation in a background-foreground module of a video analysis system
US8300924B2 (en) * 2007-09-27 2012-10-30 Behavioral Recognition Systems, Inc. Tracker component for behavioral recognition system
US8200011B2 (en) 2007-09-27 2012-06-12 Behavioral Recognition Systems, Inc. Context processor for video analysis system
US8463053B1 (en) 2008-08-08 2013-06-11 The Research Foundation Of State University Of New York Enhanced max margin learning on multimodal data mining in a multimedia database
US9152292B2 (en) * 2009-02-05 2015-10-06 Hewlett-Packard Development Company, L.P. Image collage authoring
WO2010101186A1 (ja) * 2009-03-04 2010-09-10 公立大学法人大阪府立大学 画像検索方法、画像検索プログラム及び画像登録方法
US8649594B1 (en) 2009-06-04 2014-02-11 Agilence, Inc. Active and adaptive intelligent video surveillance system
US20120109901A1 (en) * 2009-07-01 2012-05-03 Nec Corporation Content classification apparatus, content classification method, and content classification program
US8806331B2 (en) 2009-07-20 2014-08-12 Interactive Memories, Inc. System and methods for creating and editing photo-based projects on a digital network
US8644624B2 (en) * 2009-07-28 2014-02-04 Samsung Electronics Co., Ltd. System and method for indoor-outdoor scene classification
US8897541B2 (en) 2009-09-14 2014-11-25 Trimble Navigation Limited Accurate digitization of a georeferenced image
US9324003B2 (en) 2009-09-14 2016-04-26 Trimble Navigation Limited Location of image capture device and object features in a captured image
US8675066B2 (en) * 2009-10-02 2014-03-18 Alarm.Com Incorporated Image surveillance and reporting technology
US9009163B2 (en) * 2009-12-08 2015-04-14 Intellectual Ventures Fund 83 Llc Lazy evaluation of semantic indexing
US9497581B2 (en) 2009-12-16 2016-11-15 Trimble Navigation Limited Incident reporting
US8698762B2 (en) 2010-01-06 2014-04-15 Apple Inc. Device, method, and graphical user interface for navigating and displaying content in context
US8339094B2 (en) * 2010-03-11 2012-12-25 GM Global Technology Operations LLC Methods, systems and apparatus for overmodulation of a five-phase machine
US8463790B1 (en) 2010-03-23 2013-06-11 Firstrain, Inc. Event naming
US9760634B1 (en) 2010-03-23 2017-09-12 Firstrain, Inc. Models for classifying documents
ES2384928B1 (es) * 2010-06-25 2013-05-20 Telefónica, S.A. Método y sistema para la identificación rápida y robusta de productos específicos en imágenes.
US20120011115A1 (en) * 2010-07-09 2012-01-12 Jayant Madhavan Table search using recovered semantic information
CN102549579B (zh) * 2010-08-04 2016-06-08 松下电器(美国)知识产权公司 图像分类装置、方法以及集成电路
US8634662B2 (en) * 2010-08-25 2014-01-21 Apple Inc. Detecting recurring events in consumer image collections
US20120106854A1 (en) * 2010-10-28 2012-05-03 Feng Tang Event classification of images from fusion of classifier classifications
US8923607B1 (en) * 2010-12-08 2014-12-30 Google Inc. Learning sports highlights using event detection
US8631002B2 (en) * 2010-12-09 2014-01-14 Microsoft Corporation Web-relevance based query classification
US8612441B2 (en) 2011-02-04 2013-12-17 Kodak Alaris Inc. Identifying particular images from a collection
US20120213404A1 (en) 2011-02-18 2012-08-23 Google Inc. Automatic event recognition and cross-user photo clustering
US9082452B2 (en) 2011-02-21 2015-07-14 Kodak Alaris Inc. Method for media reliving on demand
US8879890B2 (en) 2011-02-21 2014-11-04 Kodak Alaris Inc. Method for media reliving playback
US8914483B1 (en) 2011-03-17 2014-12-16 Google Inc. System and method for event management and information sharing
CN102959551B (zh) * 2011-04-25 2017-02-08 松下电器(美国)知识产权公司 图像处理装置
US20130022282A1 (en) * 2011-07-19 2013-01-24 Fuji Xerox Co., Ltd. Methods for clustering collections of geo-tagged photographs
US8634660B2 (en) * 2011-09-07 2014-01-21 Intellectual Ventures Fund 83 Llc Event classification method using lit candle detection
US20130058577A1 (en) * 2011-09-07 2013-03-07 Peter O. Stubler Event classification method for related digital images
US8634661B2 (en) 2011-09-07 2014-01-21 Intellectual Ventures Fund 83 Llc Event classification method using light source detection
US20130096946A1 (en) * 2011-10-13 2013-04-18 The Board of Trustees of the Leland Stanford, Junior, University Method and System for Ontology Based Analytics
US8774504B1 (en) * 2011-10-26 2014-07-08 Hrl Laboratories, Llc System for three-dimensional object recognition and foreground extraction
US9280545B2 (en) * 2011-11-09 2016-03-08 Microsoft Technology Licensing, Llc Generating and updating event-based playback experiences
US20130144814A1 (en) * 2011-12-05 2013-06-06 International Business Machines Corporation Conditional probability operator for event processing systems
US9230187B2 (en) * 2012-03-15 2016-01-05 Qualcomm Incorporated System and method for robust estimation of color dependent measurements
US20140328570A1 (en) * 2013-01-09 2014-11-06 Sri International Identifying, describing, and sharing salient events in images and videos
US9391792B2 (en) 2012-06-27 2016-07-12 Google Inc. System and method for event content stream
KR101993241B1 (ko) * 2012-08-06 2019-06-26 삼성전자주식회사 이미지에 대한 부가 정보 태깅 및 검색 방법과 시스템, 기기와 그 기록 매체
US9111547B2 (en) * 2012-08-22 2015-08-18 Kodak Alaris Inc. Audio signal semantic concept classification method
US8971639B2 (en) * 2012-09-27 2015-03-03 Hewlett-Packard Development Company, L.P. Semantic theme based shape collage representation for an image collection
SE538062C2 (sv) 2012-09-27 2016-02-23 Silex Microsystems Ab Kemiskt pläterad metallvia genom kisel
US9420121B2 (en) 2012-09-28 2016-08-16 Interactive Memories Inc. Method for tracking theme-based digital assets for clients engaged in image-based project creation through an electronic interface
US8799756B2 (en) 2012-09-28 2014-08-05 Interactive Memories, Inc. Systems and methods for generating autoflow of content based on image and user analysis as well as use case data for a media-based printable product
US8799829B2 (en) 2012-09-28 2014-08-05 Interactive Memories, Inc. Methods and systems for background uploading of media files for improved user experience in production of media-based products
US9418370B2 (en) 2012-10-23 2016-08-16 Google Inc. Obtaining event reviews
US8990194B2 (en) * 2012-11-02 2015-03-24 Google Inc. Adjusting content delivery based on user submissions of photographs
DE102013007248A1 (de) 2013-04-19 2014-10-23 Rainer Lutze Verfahren zur Erfassung, Aggregation, Aktualisierung und Verbreitung von nach Zeit- und Raumbezug geprüften, bewertbaren, inhaltlich korrigier- und verifizierbaren Nachrichten über öffentliche Ereignisse von allgemeinem Interesse
US9760803B2 (en) * 2013-05-15 2017-09-12 Google Inc. Associating classifications with images
US9026551B2 (en) * 2013-06-25 2015-05-05 Hartford Fire Insurance Company System and method for evaluating text to support multiple insurance applications
US11080318B2 (en) 2013-06-27 2021-08-03 Kodak Alaris Inc. Method for ranking and selecting events in media collections
US9420237B2 (en) * 2013-07-09 2016-08-16 Globalfoundries Inc. Insight-driven augmented auto-coordination of multiple video streams for centralized processors
TWI550419B (zh) * 2013-12-30 2016-09-21 宏達國際電子股份有限公司 用於經由主動學習來搜索相關影像的方法、電子裝置及用戶介面
US9614724B2 (en) 2014-04-21 2017-04-04 Microsoft Technology Licensing, Llc Session-based device configuration
US9639742B2 (en) 2014-04-28 2017-05-02 Microsoft Technology Licensing, Llc Creation of representative content based on facial analysis
US9773156B2 (en) 2014-04-29 2017-09-26 Microsoft Technology Licensing, Llc Grouping and ranking images based on facial recognition data
US9384334B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content discovery in managed wireless distribution networks
US9384335B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content delivery prioritization in managed wireless distribution networks
US10111099B2 (en) 2014-05-12 2018-10-23 Microsoft Technology Licensing, Llc Distributing content in managed wireless distribution networks
US9430667B2 (en) 2014-05-12 2016-08-30 Microsoft Technology Licensing, Llc Managed wireless distribution network
US20150331930A1 (en) * 2014-05-16 2015-11-19 Here Global B.V. Method and apparatus for classification of media based on metadata
US9874914B2 (en) 2014-05-19 2018-01-23 Microsoft Technology Licensing, Llc Power management contracts for accessory devices
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US11170037B2 (en) * 2014-06-11 2021-11-09 Kodak Alaris Inc. Method for creating view-based representations from multimedia collections
KR102223205B1 (ko) 2014-06-11 2021-03-08 삼성전자주식회사 이미지 분류 장치, 이의 동작 방법 및 이를 포함하는 전자 시스템
US11023737B2 (en) 2014-06-11 2021-06-01 Arris Enterprises Llc Detection of demarcating segments in video
US9367490B2 (en) 2014-06-13 2016-06-14 Microsoft Technology Licensing, Llc Reversible connector for accessory devices
US9460493B2 (en) 2014-06-14 2016-10-04 Microsoft Technology Licensing, Llc Automatic video quality enhancement with temporal smoothing and user override
US9652745B2 (en) * 2014-06-20 2017-05-16 Hirevue, Inc. Model-driven evaluator bias detection
US9373179B2 (en) 2014-06-23 2016-06-21 Microsoft Technology Licensing, Llc Saliency-preserving distinctive low-footprint photograph aging effect
WO2016007972A1 (en) 2014-07-11 2016-01-14 ProSports Technologies, LLC Ticket upsell system
US8923551B1 (en) 2014-07-16 2014-12-30 Interactive Memories, Inc. Systems and methods for automatically creating a photo-based project based on photo analysis and image metadata
US8935322B1 (en) 2014-07-16 2015-01-13 Interactive Memories, Inc. Methods and systems for improved uploading of media files for use in media-rich projects
US8958662B1 (en) 2014-08-20 2015-02-17 Interactive Memories, Inc. Methods and systems for automating insertion of content into media-based projects
US8990672B1 (en) 2014-08-25 2015-03-24 Interactive Memories, Inc. Flexible design architecture for designing media-based projects in a network-based platform
US9417090B2 (en) 2014-09-11 2016-08-16 ProSports Technologies, LLC System to offer coupons to fans along routes to game
US9646387B2 (en) 2014-10-15 2017-05-09 Comcast Cable Communications, Llc Generation of event video frames for content
US9219830B1 (en) 2014-10-31 2015-12-22 Interactive Memories, Inc. Methods and systems for page and spread arrangement in photo-based projects
US9077823B1 (en) 2014-10-31 2015-07-07 Interactive Memories, Inc. Systems and methods for automatically generating a photo-based project having a flush photo montage on the front cover
US9507506B2 (en) 2014-11-13 2016-11-29 Interactive Memories, Inc. Automatic target box in methods and systems for editing content-rich layouts in media-based projects
US20160203137A1 (en) * 2014-12-17 2016-07-14 InSnap, Inc. Imputing knowledge graph attributes to digital multimedia based on image and video metadata
EP3809045A1 (en) 2015-05-05 2021-04-21 June Life, Inc. A method for cooking
US9329762B1 (en) 2015-06-02 2016-05-03 Interactive Memories, Inc. Methods and systems for reversing editing operations in media-rich projects
US9916075B2 (en) 2015-06-05 2018-03-13 Apple Inc. Formatting content for a reduced-size user interface
CN105138963A (zh) * 2015-07-31 2015-12-09 小米科技有限责任公司 图片场景判定方法、装置以及服务器
EP3274878A1 (en) 2015-09-28 2018-01-31 Google LLC Sharing images and image albums over a communication network
US10140516B2 (en) 2015-12-16 2018-11-27 Samsung Electronics Co., Ltd. Event-based image management using clustering
US11741522B2 (en) 2015-12-31 2023-08-29 Kodak Alaris, Inc. Method for image product recommendation
DK201670609A1 (en) 2016-06-12 2018-01-02 Apple Inc User interfaces for retrieving contextually relevant media content
AU2017100670C4 (en) 2016-06-12 2019-11-21 Apple Inc. User interfaces for retrieving contextually relevant media content
US20170357672A1 (en) 2016-06-12 2017-12-14 Apple Inc. Relating digital assets using notable moments
US10412148B2 (en) 2016-07-21 2019-09-10 Microsoft Technology Licensing, Llc Systems and methods for event aggregation to reduce network bandwidth and improve network and activity feed server efficiency
JP6698216B2 (ja) 2016-09-23 2020-05-27 アップル インコーポレイテッドApple Inc. アバターの作成及び編集に関する米国特許商標局への特許出願
EP3577651A1 (en) 2017-02-06 2019-12-11 Kodak Alaris Inc. Method for creating audio tracks for accompanying visual imagery
EP3568787B1 (en) 2017-05-17 2024-04-10 Google LLC Automatic image sharing with designated users over a communication network
US12002010B2 (en) 2017-06-02 2024-06-04 Apple Inc. Event extraction systems and methods
CN108235765B (zh) 2017-12-05 2021-10-15 华为技术有限公司 一种故事相册的显示方法及装置
US11163941B1 (en) * 2018-03-30 2021-11-02 Snap Inc. Annotating a collection of media content items
US10789284B2 (en) * 2018-04-13 2020-09-29 Fuji Xerox Co., Ltd. System and method for associating textual summaries with content media
US11086935B2 (en) 2018-05-07 2021-08-10 Apple Inc. Smart updates from historical database changes
US11243996B2 (en) 2018-05-07 2022-02-08 Apple Inc. Digital asset search user interface
DK180171B1 (en) 2018-05-07 2020-07-14 Apple Inc USER INTERFACES FOR SHARING CONTEXTUALLY RELEVANT MEDIA CONTENT
US11157524B2 (en) 2018-05-18 2021-10-26 At&T Intellectual Property I, L.P. Automated learning of anomalies in media streams with external feed labels
US10846343B2 (en) 2018-09-11 2020-11-24 Apple Inc. Techniques for disambiguating clustered location identifiers
US10803135B2 (en) 2018-09-11 2020-10-13 Apple Inc. Techniques for disambiguating clustered occurrence identifiers
US11442985B2 (en) 2018-09-20 2022-09-13 Nokia Technologies Oy Apparatus and a method for artificial intelligence
JP7155074B2 (ja) 2019-07-03 2022-10-18 富士フイルム株式会社 情報提案システム、情報提案方法、プログラムおよび記録媒体
US11138477B2 (en) * 2019-08-15 2021-10-05 Collibra Nv Classification of data using aggregated information from multiple classification modules
US11948276B2 (en) 2020-01-16 2024-04-02 Samsung Electronics Co., Ltd. Apparatus and method for enhancing videos
WO2021184003A1 (en) 2020-03-13 2021-09-16 June Life, Inc. Method and system for sensor maintenance
US11593717B2 (en) * 2020-03-27 2023-02-28 June Life, Inc. System and method for classification of ambiguous objects
CN113077051B (zh) * 2021-04-14 2024-01-26 南京零洞数智科技有限公司 网络模型训练方法、装置、文本分类模型及网络模型

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5781650A (en) 1994-02-18 1998-07-14 University Of Central Florida Automatic feature detection and age classification of human faces in digital images
US6240424B1 (en) 1998-04-22 2001-05-29 Nbc Usa, Inc. Method and system for similarity-based image classification
US6606411B1 (en) 1998-09-30 2003-08-12 Eastman Kodak Company Method for automatically classifying images into events
US6351556B1 (en) 1998-11-20 2002-02-26 Eastman Kodak Company Method for automatically comparing content of images for classification into events
US7272593B1 (en) * 1999-01-26 2007-09-18 International Business Machines Corporation Method and apparatus for similarity retrieval from iterative refinement
US6882997B1 (en) * 1999-08-25 2005-04-19 The Research Foundation Of Suny At Buffalo Wavelet-based clustering method for managing spatial data in very large databases
AU1401401A (en) 1999-11-16 2001-05-30 At & T Laboratories Cambridge Limited Method of and apparatus for classifying an image
US6504951B1 (en) 1999-11-29 2003-01-07 Eastman Kodak Company Method for detecting sky in images
US6865302B2 (en) * 2000-03-16 2005-03-08 The Regents Of The University Of California Perception-based image retrieval
US6915011B2 (en) 2001-03-28 2005-07-05 Eastman Kodak Company Event clustering of images using foreground/background segmentation
US20020186875A1 (en) * 2001-04-09 2002-12-12 Burmer Glenna C. Computer methods for image pattern recognition in organic material
US7043474B2 (en) 2002-04-15 2006-05-09 International Business Machines Corporation System and method for measuring image similarity based on semantic meaning
US7337214B2 (en) * 2002-09-26 2008-02-26 Yhc Corporation Caching, clustering and aggregating server
US7242809B2 (en) * 2003-06-25 2007-07-10 Microsoft Corporation Digital video segmentation and dynamic segment labeling
US7636733B1 (en) * 2003-10-03 2009-12-22 Adobe Systems Incorporated Time-based image management
US7555165B2 (en) 2003-11-13 2009-06-30 Eastman Kodak Company Method for semantic scene classification using camera metadata and content-based cues
US7680340B2 (en) 2003-11-13 2010-03-16 Eastman Kodak Company Method of using temporal context for image classification
AU2004233453B2 (en) * 2003-12-03 2011-02-17 Envysion, Inc. Recording a sequence of images
US20050163345A1 (en) * 2003-12-03 2005-07-28 Safehouse International Limited Analysing image data
GB0406512D0 (en) * 2004-03-23 2004-04-28 British Telecomm Method and system for semantically segmenting scenes of a video sequence
EP1589444A3 (en) * 2004-04-21 2008-03-12 Samsung Electronics Co., Ltd. Method, medium, and apparatus for detecting situation change of digital photos and method, medium, and apparatus for situation-based photo clustering in digital photo album
KR100738069B1 (ko) * 2004-10-04 2007-07-10 삼성전자주식회사 디지털 사진 앨범의 카테고리 기반 클러스터링 방법 및시스템
US7643686B2 (en) * 2004-11-17 2010-01-05 Eastman Kodak Company Multi-tiered image clustering by event
JP2006171888A (ja) 2004-12-13 2006-06-29 Konica Minolta Holdings Inc 画像管理装置、画像管理方法、および画像管理プログラム
US7849116B2 (en) * 2005-05-23 2010-12-07 Picateer, Inc. System and method for automated layout of collaboratively selected images
JP4577173B2 (ja) * 2005-09-29 2010-11-10 ソニー株式会社 情報処理装置および方法、並びにプログラム
US20070098303A1 (en) 2005-10-31 2007-05-03 Eastman Kodak Company Determining a particular person from a collection
US20070141545A1 (en) * 2005-12-05 2007-06-21 Kar-Han Tan Content-Based Indexing and Retrieval Methods for Surround Video Synthesis
US7711145B2 (en) 2006-01-27 2010-05-04 Eastman Kodak Company Finding images with multiple people or objects
JP4976036B2 (ja) * 2006-03-29 2012-07-18 パナソニック株式会社 画像検索支援装置
JP2007317077A (ja) 2006-05-29 2007-12-06 Fujifilm Corp 画像分類装置および方法ならびにプログラム
US7869658B2 (en) * 2006-10-06 2011-01-11 Eastman Kodak Company Representative image selection based on hierarchical clustering
US7792868B2 (en) * 2006-11-10 2010-09-07 Microsoft Corporation Data object linking and browsing tool
US8315463B2 (en) 2006-11-14 2012-11-20 Eastman Kodak Company User interface for face recognition
US7877696B2 (en) 2007-01-05 2011-01-25 Eastman Kodak Company Multi-frame display system with semantic image arrangement
WO2008112216A1 (en) * 2007-03-08 2008-09-18 Microscan Systems, Inc. Detection and segmentation of a two-dimensional code
US8229875B2 (en) * 2007-04-11 2012-07-24 Oracle International Corporation Bayes-like classifier with fuzzy likelihood
US8358856B2 (en) * 2008-06-02 2013-01-22 Eastman Kodak Company Semantic event detection for digital content records
US8724909B2 (en) * 2008-06-03 2014-05-13 Kooaba Ag Method and system for generating a pictorial reference database using geographical information
US8488863B2 (en) * 2008-11-06 2013-07-16 Los Alamos National Security, Llc Combinational pixel-by-pixel and object-level classifying, segmenting, and agglomerating in performing quantitative image analysis that distinguishes between healthy non-cancerous and cancerous cell nuclei and delineates nuclear, cytoplasm, and stromal material objects from stained biological tissue materials
US8213725B2 (en) * 2009-03-20 2012-07-03 Eastman Kodak Company Semantic event detection using cross-domain knowledge

Also Published As

Publication number Publication date
WO2010059188A3 (en) 2010-08-05
US8611677B2 (en) 2013-12-17
EP2405371A1 (en) 2012-01-11
WO2010059188A2 (en) 2010-05-27
US20100124378A1 (en) 2010-05-20
US20140046914A1 (en) 2014-02-13
JP2012509522A (ja) 2012-04-19
EP2347349A2 (en) 2011-07-27

Similar Documents

Publication Publication Date Title
JP5537557B2 (ja) 事象毎に意味論的に分類する方法
US20220004573A1 (en) Method for creating view-based representations from multimedia collections
JP5318115B2 (ja) 場所別画像分類
KR101417548B1 (ko) 사진 콜렉션에서 이벤트들을 생성하고 라벨링하는 방법 및 시스템
KR100813170B1 (ko) 사진 의미 인덱싱 방법 및 그 시스템
US8611678B2 (en) Grouping digital media items based on shared features
US20180357211A1 (en) Constructing a Narrative Based on a Collection of Images
JP5934653B2 (ja) 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置
JP5524219B2 (ja) 対話式画像選択方法
US20080002864A1 (en) Using background for searching image collections
WO2021120818A1 (en) Methods and systems for managing image collection
WO2006073299A1 (en) Method and apparatus for clustering digital photos based on situation and system and method for albuming using the same
JP2012530287A (ja) 代表的な画像を選択するための方法及び装置
JP2007513413A (ja) 強調画像を選択するための内容認識
JP2008257460A (ja) 情報処理装置、情報処理方法、およびプログラム
KR100647337B1 (ko) 지역 분할 템플릿을 이용한 카테고리 기반 사진 클러스터링방법 및 시스템
JP2014092955A (ja) 類似コンテンツ検索処理装置、類似コンテンツ検索処理方法、およびプログラム
KR100790865B1 (ko) 상황기반 디지털 사진 클러스터링 방법 및 장치와 이를이용한 디지털 사진 앨범 시스템 및 방법
Tankoyeu et al. Event detection and scene attraction by very simple contextual cues
Oliveira-Barra et al. Leveraging activity indexing for egocentric image retrieval
Guo et al. Event recognition in personal photo collections using hierarchical model and multiple features
CN114708653A (zh) 基于行人重识别算法的指定行人动作检索方法
Van Gool et al. Mining from large image sets
Souza et al. Generating an Album with the Best Media Using Computer Vision
CA2626323A1 (en) Automated tagging of photo images

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120913

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120913

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20130403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140425

R150 Certificate of patent or registration of utility model

Ref document number: 5537557

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees