JP3842994B2 - 画像の統合された注釈及び検索のためのエージェント - Google Patents
画像の統合された注釈及び検索のためのエージェント Download PDFInfo
- Publication number
- JP3842994B2 JP3842994B2 JP2001311928A JP2001311928A JP3842994B2 JP 3842994 B2 JP3842994 B2 JP 3842994B2 JP 2001311928 A JP2001311928 A JP 2001311928A JP 2001311928 A JP2001311928 A JP 2001311928A JP 3842994 B2 JP3842994 B2 JP 3842994B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- images
- annotation
- text
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
- Digital Computer Display Output (AREA)
Description
【発明の属する技術分野】
本発明は一般的な画像処理の分野に関し、特に、データベースから選択された画像の注釈及び検索に関する。
【0002】
【従来の技術】
デジタル写真の出現により、消費者は、彼らの日常にわたる大量の画像を今や容易に蓄積することができる。これらの画像は、「シューボックス」(又は等価な電子装置)に格納される。該画像は稀に見られ、折りにアルバムに入れられるが数年間使用されず、見られることもなく、通常は置きっぱなしにされる。
【0003】
この「シューボックス」の問題は、特に適切である。これは、「シューボックス」が現在失われている共有される記憶を伝達するための口をつけていない源であるためである。(現像した又はコンピュータにダウンロードされたフィルムから画像が戻った後に)画像を最初に見た後、多くの人は、大きな略式の、書庫コレクションに彼らの画像を蓄積する。ハードコピー写真又はプリント出力の場合、これらの写真は、便利なサイズにされたシューボックス又はアルバムに蓄積されることがある。シューボックスにおける画像、又はフォルダ或いは取り外し可能なメディアにおける等価な電子装置は、特定の画像の検索、管理不可能な大量のコレクションのブラウジング、及びそれらの編成の困難さのために、(非常に稀に見るか又は)決して再び見ることはない。典型的に、雑な逆の年代順から離れた編成は、通常決して実行されないユーザ側に関する努力を含む。結果的に、検索は、多くの、大部分が関連性のない画像の労力を要する再検討に通常基づいた特別な成果である。
【0004】
勿論、潜在的に、画像をテキストのラベルで注釈してリレーショナルデータベースに格納し、キーワードで検索することができる。しかし、画像を自動的に分析することができる点にコンピュータビジョンが到達するまで、殆どの自動的な画像検索は、特定の画像に手動で付された原文のキーワードに依存している。しかし、キーワードで画像を注釈することは退屈な仕事であり、現在のインタフェースでは、通常の人は、将来の検索を容易にするために全ての彼らの画像を注釈するための大量の正直な努力を当然の事として考えることができない。加えて、画像を自動的に解釈することができたとしても、画像の多くの突出した特徴はユーザの記憶にのみ存在し、画像を索引付けするために、どうにかしてマシンに伝達することが必要となる。したがって、画像の原文注釈に基づいた検索は、予見しうる将来にとっても依然として重要である。
【0005】
さらに、検索プリケーションそれ自身は、ユーザが便利なライブラリから画像を探す場合に使用されないことがあるほど扱い難い。たとえば、検索それ自身は、オーバヘッドの開始、アプリケーションの終了及びキーワードの入力のみであっても、それ自身が処理にオーバヘッドを課すサーチエンジン又は他のアプリケーションを扱うことを含んでいる。このオーバヘッドのために、画像を使用するための機会が見落とされるか、又は無視されることがある。
【0006】
消費者の画像撮影の利用についての主な機会は、画像及びイベントについて彼らが語る話を通して人々を繋ぐことにある。画像は、言葉にはできないようなやり方で感情を伝達する。たとえば、最近出席した結婚式を想像し、友人に送られるかも知れないイベントを記述した結果的な電子メールのメッセージを考える。イベントの画像及び関連する人々の画像、過去における場所及びイベントの画像を含むことにより話を図示することができる場合、メールは大いに向上される。これを達成するために何が必要とされるか?ここで、人がしなければならないことの例を示す。
【0007】
・結婚式における重要なイベントで画像を撮影する。誓約の交換、ケーキカット、カップルのキッス等。それぞれのディナーテーブル、人々のダンス、会話等で画像を撮影する。
【0008】
・画像をコンピュータに取り込む。これは、以下を含む。カメラからの記憶媒体(メモリカード、フロッピーディスク)の取出し、及びそのリーダへの挿入。ケーブルを有するリーダ装置又はカメラをコンピュータへの可能な接続。通信ソフトウェアの起動又は転送を実行するためのモードの設定。画像を転送すべきコンピュータ上の場所の選択。その画像が何であるかを忘れないように画像セットについての名前の選択。
【0009】
・画像表示/操作/カタログプログラム(たとえば、Adobe PhotoshopTM,PicturePageTM)。画像の初期操作、及び成功していない露光である「失敗(duds)」の除去。その内容を記述するための個々の画像のファイル名の可能な変更。画像のデータベースを有する場合、個々の画像又は画像セットに対してキーワードを付してもよい。画像上の画像操作(切取り、明るさ調整等)の可能な実行。記憶のための画像のハードコピーの可能なプリント出力、又は他への送出。他への画像の可能な電子メーリング、又はWebページ上でのポスティング。
【0010】
・数週間又は数ヶ月後に、結婚式に関する友人又は家族への電子メールメッセージを作成している時に、該画像を使用したくなる。電子メールアプリケーションそれ自身の起動及び動作に加えて、画像ビューア/カタログ/サーチアプリケーションの様な別のアプリケーションを起動しなければならない。ファイルシステムの周りをサーチし、ブラウジング又はファイル名による検索のいずれかにより、関連する画像を含むフォルダを見つけるかも知れない。Webブラウザの起動、及びURLのタイプ入力、サーチエンジンの使用を必要として、関連する画像が、あなた自身所有の又はあなたの知人のWebページ上に記憶されているかも知れない。キーワードを介して画像データベースをサーチするかも知れない。必要に応じて、アプリケーション間でスイッチバック及びスイッチフォースする。画像を発見することに成功した場合、イメージアプリケーションから画像を切取り、それを電子メールエディタに貼り付ける。
【0011】
たとえば、将来異なる人に関連する話を離そうとする場合に、このインタラクションに関することは容易なことではなく、次回このタスクをより容易に行うようにするものはない。この問題を緩和するための1つのアプローチは、エージェントの使用によるものである。エージェントとは、バックグランドでタスクを収集又は処理するある情報を実行するプログラムである。典型的に、エージェントは、非常に小さく及び上手く定義されたタスクで与えられる。より詳細には、この関係において有効な2つのタイプのエージェントは、インタフェースエージェント、すなわちインタラクティブインタフェースの動作において能動的にユーザを支持するソフトウェアであり、及び自律的なエージェント、すなわちユーザの介入なしに動作を行い、ユーザがアイドル状態又は他の動作を行っている間のいずれであっても、同時に動作するソフトウェアである。
【0012】
自律的なインタフェースエージェントは、自然言語通信の分野を記憶拡張の分野に拡張している。たとえば、1996年のProc.of the First International Conference on the Practical Application of Intelligent Agents and Multi Agent Technologyに見られるB.J.Rhodes等による論文“Remembrance Agent:A Continuously Running Automated Information Retrieval System”より、記憶エージェントは、ユーザのデータ入力を監視するための連続的に動作する自動化された情報検索システムを提供することにより、システムユーザを自動的に支持することができる、ユーザの思考プロセスが知られている。たとえば、システムは、ユーザのタイプ入力動作の周りのウィンドウにおけるテキストを連続的に監視する記憶エージェントを提供する。該エージェントは、問合せテキスト及び参照文書に共通の言葉の頻度に基づいて、電子メール書庫のような記憶された個人文書のデータベースに対するウィンドウにおけるテキストの整合を周期的に実行する。該エージェントは、k個の最も関連する入力について(kはユーザにより設定される)、ユーザのスクリーンの下部でのランク付けされたリストの提案を現在の動作に与える。ユーザは、容易に検索して入力テキストを見ることができる。記憶エージェントは、書庫の人間による前処理を必要としない。しかし、記憶エージェントは、記憶されたテキスト入力を走査するために設計されており、画像マテリアルを検索することをそれ自身に与えておらず、かかるマテリアルの注釈を容易にしていない。
【0013】
Webブラウザのための自律的なインタフェースエージェント(“Letizia”と呼ばれる)は、International Joint Conference on Artificial Intelligence, Montreal 1995に見られる“Letizia:An Agent that Assists Web Browsing”、及びProceeding of CHI'97,Atlanta,GA,March 1997,pp.67-74に見られる“Autonomous Interface Agents”を含むH.Liebermanによる幾つもの論文において記載されている。Letiziaは、ユーザブラウザWorld Wide Webを支持するユーザインタフェースエージェントである。Letiziaは、ユーザにより選択されたURLを記録し、ユーザの興味のプロファイルを編集するためにページを読む。結果的に、ユーザが典型的なWebブラウザを動作する時、エージェントはユーザの操作を追跡し、ユーザの現在の位置からのリンクの同時で自動的な調査を行うことにより、興味の項目を予想しようとする。エージェントは、ブラウザの動きからユーザの興味を学習的に推論することにより議論されるベストファーストサーチから構成されるブラウザ方法を自動化する。Letiziaは、エージェントブラウザのページがユーザの興味を引くと思われる独立なウィンドウを使用して、その結果を与えるために、ブラウザが所有のインタフェースを使用する。しかし、記憶エージェントに関して、Letiziaは、画像マテリアルの検索のために設計されておらず、かかるマテリアルの注釈を容易にはしない。
【0014】
J.Budzik及びK.Hammond等による論文“Watson:Anticipating and Contextualizing Information Needs”,Proc Of the Sixty-second Annual Meeting of the American Society for Information Science(1999)、Information Today,Inc.:Medford,N.J.,では、情報管理アシスタント(“Watson”と呼ぶ)は、文書構造の文脈において特定目的のサーチを実行するための機会を検出する。たとえば、ユーザが彼らの文書において画像なしで表題を挿入してそれを満たす時、Watsonは、表題においてリストに載せられた言葉の停止を使用し、画像サーチエンジンに対して問い合わせを形成する。ユーザは、表示されている画像をドラッグして文書にドロップする。しかし、記憶エージェントに関して、かかるマテリアルの注釈を容易にするための努力が行われていない。
【0015】
認識構造と知覚構造とを混合することにより、より効果的な情報調査ツールを構築することができることが認識されている。A.Kuchinskyによる論文“Multimedia Information Explolation”CHI98 Workshop on Information Explolation,FX Palo Alto Laboratory,Inc.:Palo Alto CA(1998)に見られるように、物語りのツールがスタンドアローンとして扱われていないばかりか、情報注釈及び検索についてのフレームワーク内に埋め込まれていない場合、かかるツールは、ユーザからメタデータを引き出すための伝達手段として作用することができる。しかし、この潜在的なパスフォワードの考察は、電子メールのようなアプリケーションにおける画像の文脈上の使用から分離し、ユーザからの考察的な学習を提案していない。
【0016】
異なるアプローチを試みるための上述した主張にもかかわらず、典型的なビューは、注釈及び検索が2つの完全に分離した動作であることのままであり、互いに及び画像が使用されるいずれかのアプリケーションから独立に動作するアプリケーションにより述べられる。これにより、ユーザには入力する負担が残され、専用される時のアプリケーション、及び通常カットアンドペーストを介してあるアプリケーションから別のアプリケーションへの詳細な転送データが残される。ユーザは、アプリケーション及び転送データに反して、彼ら自身のタスクについて考えるようになる。電子メールメッセージの送出のようなそれぞれのユーザのタスクは、共に作用するデータ、利用可能なツール、目的地等を含んでいる文脈を転送する。これらは、他のアプリケーションの文脈から自然に分離する傾向にある。
【0017】
【発明が解決しようとする課題】
結果的に、消費者の画像撮影の典型的な使用との関連における原文注釈及び検索処理を十分に自動化するよりもむしろ容易にすることにおいて、ユーザインタフェースエージェントのための役割が必要とされる。エージェントの役割は、注釈及び検索の自動的な実行にあるのみでなく、注釈及び検索のための機会を検出し、それらの機会にユーザに通知することである。また、エージェントは、専用する時に動作を完成することをできるだけ容易にするべきである。確かに、ユーザの日常の作業の文脈において、画像注釈及び画像検索のための機会を事前に能動的に発見するユーザインタフェースエージェントが特に必要とされている。
【0018】
【課題を解決するための手段】
本発明は、上述した1つ又は複数の問題を克服することに向けられる。要約すると、本発明による1態様によれば、記憶された画像の統合された検索及び注釈のための方法は、テキストにより表現される文脈を分離するために、ユーザにより入力されたテキストが連続的に監視されるユーザアプリケーションを実行することを含んでいる。
【0019】
文脈は、記憶画像と関連するメタデータと整合される。したがって、1つ又は複数の整合された画像が提供され、該整合画像が検索され、該テキストの近くに表示される。文脈は、整合画像との後続する関連についてある示唆された注釈を選択する能力と共に、整合画像について示唆された注釈をユーザに提供するために利用される。さらなる拡張では、本方法は、整合画像のうちの選択された1つをアプリケーションのテキストに挿入する能力をユーザに提供する。さらに、本方法は、整合された画像についてメタデータを自動的に更新することを提供する。
【0020】
本発明により講じられるアプローチは、画像の注釈、検索、及び1つのアプリケーションへの使用を統合することを試みることである。ユーザ中心の設計プロセスに従えば、最も重要なことは使用である。1実施の形態では、テキスト編集、特に電子メールのメッセージの編集では、画像ライブラリからの画像検索が使用を自然に見つけるようなアプリケーションとして選択される。この実施の形態において、検索及び注釈アプリケーションは統合され、分離アプリケーションを有することの文脈の切り替えの混同が回避される。
【0021】
問題解決におけるいわゆる「知的な」の多くは、実は、現在の問題解決の文脈において何が関連しており、何が重要であるかを識別するための能力であり、かんばん方式で使用するために利用するようにするための能力である。統合されたアプリケーションにおけるエージェントの仕事は、関連するテキスト及び画像について適切な文脈を利用できるようにし、及び便利にアクセス可能にすることである。
【0022】
電子メールメッセージの編集のタスクについて、テキスト記述をタイプ入力することにより、その文脈に関連する画像の検索が適切である意味に関する文脈が設定される。この文脈はすなわち、人間の識別作用に対応し、ユーザに個人的に価値がある点での情報を表す文脈である。同様に、現在の文脈において存在するあるテクスチャ記述を適用するための文脈を画像が設定することを考えると、注釈のための機会を設定する。これらの理由のために、本明細書ではインタフェースが記載され、簡単なクリック操作のみで両方向について、これら機会を利用する。
【0023】
本発明のこれら及び他の態様、目的、特徴及び利点は、より明確に理解され、以下の好適な実施の形態の詳細な記載及び特許請求の範囲のレビュー、及び添付図面の参照により、評価される。
【0024】
本発明の利点は、1つの簡単なプロセスにおける注釈と検索との結合であり、ユーザが時間を取ることを望まず、彼らの画像を注釈するためのエネルギーを望まないという問題を述べている。このプロセスは退屈であり、最も流通しているアプリケーションは扱い難く、使用することが難しい。したがって、殆どの画像は注釈されていない。加えて、互いに独立に動作し、他のアプリケーションが使用される場合がある注釈と検索が2つの分離した動作である定式的な視野では、ユーザにとって高い経費の状況をつくり、注釈を実行しない理由が追加される。
【0025】
本発明のさらなる利点は、使用する画像で注釈と検索とを統合するための能力にあり、ユーザのテキストエディタ入力を再試行し、リアルタイムの画像推薦及び注釈を提供する。
【0026】
より詳細には、本発明は、ユーザインタフェースエージェントを提供する。該エージェントは、ユーザの日常作業の文脈において、画像注釈及び画像検索のための機会を先取りして探すことにより、ユーザを支持する。本発明の1つの変形例は、ユーザの電子メールエディタを代理し、連続的にタイプ入力を監視する。
【0027】
連続的に、ランク付けされたサーチは、画像ライブラリから自動的に実行される。現在のテキストに関連する画像は、簡単なクリックで挿入することができる。電子メールにおいて物語の話のために入力される画像の記述は、画像注釈のための生の材料として継ぎ目なく使用することができる。画像注釈及び検索プロセスを完全に自動化していないが、本発明は、ユーザインタフェースの経費を大幅に低減することができ、良好に注釈された画像ライブラリ、及び画像の使用についての機会の喪失をより少なくすることができる。
【0028】
【発明の実施の形態】
処理エージェントを使用したデータ処理システムがよく知られているので、ここでの記載は、本発明によるシステム及び方法の部分の構成、又はより直接な協力に特に帰することに向けられる。本明細書で特に示されていないか、又は記載されていない特性は、当該技術分野において知られている特性から選択される。
【0029】
以下の記載では、本発明の好適な実施の形態は、通常ソフトウェアとして実現されるが、かかるソフトウェアと等価なハードウェアで構成されてもよいことは、当業者であれば容易に認識されよう。
【0030】
以下のマテリアルにおける本発明により記載されるようなシステム及び方法を仮定した場合、本発明の実現のために有用な、本明細書で特に示されず、示唆されず又は記載されないソフトウェアは、典型的なものであり、かかる技術分野において通常の技術内のものである。
【0031】
本発明がコンピュータプログラムとして実現される場合、プログラムは、典型的なコンピュータ読み取り可能な記憶媒体に記憶されてもよい。該媒体は、たとえば、磁気ディスク(たとえば、ハードディスクドライブ又はフロッピーディスク)又は磁気テープのような磁気記憶媒体、光ディスク、光テープ又は機械読み取り可能なバーコードのような光記憶媒体、ランダムアクセスメモリ(RAM)、又はリードオンリメモリ(ROM)、又はコンピュータプログラムを記憶するために使用されるいずれかの物理的装置或いは媒体のような固体電子記憶装置、を備えていてもよい。
【0032】
はじめに図1を参照して、図1は、本発明の例示的な実施の形態におけるソフトウェアアプリケーションの機能ブロック図である。たとえば、電子メールテキストエディタであるユーザアプリケーション2は、プロセッサユニット4上で動作する。該ユニットは、プロセッサ、メモリ、電力供給、入力/出力回路、大容量記憶装置、及びコンピュータにおいて見られる他の回路及び装置を含んでいる典型的なパーソナルコンピュータであってもよい。
【0033】
加えて、注釈及び検索エージェント6は、プロセッサユニット4上で動作する。必要条件ではないが、この例示的な実施の形態において、2つのエージェントが同じプロセッサユニット4上で動作するように示されている。プロセッサユニット4は、グラフィカルユーザインタフェース8及びピクチャアーカイブ14に接続されている。
【0034】
グラフィカルユーザインタフェース8は、ディスプレイ10を有する機能的インタフェースを提供する。ディスプレイ10は、ユーザへのビジュアルインタフェースとしての役割を果たし、限定されないが陰極線管、マトリクスディスプレイ、LCDディスプレイ、TFTディスプレイ等を含み、典型的にはキーボードであるがタッチスクリーン、文字認識システム、マウス、トラックボール、タッチパッドのような他の入力装置、或いはヒューマンインタフェース装置又は周辺装置とすることもできる入力装置12を有しているコンピュータビジュアルディスプレイ装置で一般に使用されるいずれかであってもよい。
【0035】
注釈及び検索アプリケーション6は、グラフィカルマテリアルデータベースと通信する。好適な実施の形態において、データベースは、デジタルピクチャアーカイブ14であり、該アーカイブは、スチル画像のアーカイブを記憶する。代替的に又は加えて、データベースは、動きビデオ系列を記憶するデジタルビデオデータベースを含むことができる。
【0036】
かかるデータベースは、サーチ機能によりアクセス可能な複数のデジタルグラフィカル及び/又は画像マテリアルを備えている。典型的に、データベースは、複数のインデックスにより索引付けされたリレーショナルデータベースである。かかるデータベースをサーチするための典型的なアプローチは、1つ又は複数の優先付けされたキーワードを設けることである。データベースは、複数のヒットを列挙するサーチ結果でかかる要求に応答する。
【0037】
アーカイブ14のようなデータベースがより洗練されたインデックス方法を使用してもよく、かかるデータベースが本発明に適用することは、当業者には理解される。たとえば、画像がキーワードよりもむしろ画像コンテンツ記述子に基づいて索引付けされていてもよい。また、キーワードは、画像の周囲の状況、すなわち、誰が、何を、何処で、何時、及び何処でといったパラメータを記述していてもよい。コンテンツ記述子は、デジタルグラフィカルマテリアル内のデータを現実に記述する。かかる要素は、画像そのものから引き出され、カラーヒストグラム、テクスチャデータ、解像度、明るさ、コントラスト等を含んでいてもよい。
【0038】
フィルムスキャナ又はデジタルカメラのような典型的な画像発生装置のみならず、画像マテリアルは、ストックフォトデータベース又はプライベートデータベースのような実在するデータベースから発生されてもよい。また、公共の場は、かかるグラフィカル及び/又は画像マテリアルの配信のために発展するであろうことは予知できる。
【0039】
ピクチャアーカイブ14は、パーソナルコンピュータの大容量のメモリにおいて、プロセッサユニット4と共に存在してもよいし、又はピクチャアーカイブ14がプロセッサユニット4の外部にあってもよい。後者の場合、プロセッサユニット4は、ネットワークインタフェース15を介して、ピクチャアーカイブ14に接続されていてもよい。
【0040】
ネットワークインタフェース15は、プロセッサユニット4の外側にあるものとして例示されているが、プロセッサユニット4の内側に配置されていていてもよい。ネットワークインタフェースは、プロセッサユニット4をインターネットのような外部ネットワークにインタフェースするためのいずれかの装置、又は簡単な電導回路とすることができる。しかし、利用されるネットワークは、プライベートネットワーク、インターネット、商業ネットワーク又はグラフィカルデータのデータベースを運営する他のネットワークとすることができる。
【0041】
ネットワークインタフェース装置15に関して、これは、本明細書で記載されるように、典型的なダイアルアップモデム、ADSLモデム、ISDNインタフェース、ケーブルモデム、ディレクトハードウェア、無線モデム、光モデム、又はプロセッサユニット4を外部ネットワークに相互接続するに適したいずれか他の装置とすることができる。
【0042】
図2を参照して、注釈及び検索統合エージェント(ARIA)6は、以下の幾つかの論理的なコンポーネントを備えている。ピクチャアーカイブ14は、先に記載されており、画像の表現及びそれらの関連するメタデータを含んでいるピクチャオブジェクトの記憶を提供する。メタデータは、画像に関連するキーワード又は他のキー情報(たとえば、コンテンツ情報)を含んでいる。
【0043】
自動インポートエージェント16は、新たなピクチャコンテンツについて、特定のソース入力を周期的に走査し、このコンテンツをピクチャアーカイブ14に自動的に組込む。たとえば、特定のソース入力は、たとえば、プロセッシングユニット4に取り付けられたデジタルカメラからのフラッシュカードのような取り外し可能なメモリ、又はネットワークインタフェース15にわたり外部データベースへの接続であってもよい。
【0044】
明らかに、通常の技術の1つである他のソース入力は、本実施の形態に従い使用されてもよい。ピクチャデータベースビューア18は、ディスプレイ10上のピクチャアーカイブ14のコンテンツを見るためにナビゲーションの容易さを提供し、小さな選択された画像、及び関連するキーワードのようなその関連するメタデータの両者を表示する。検索エージェント20のような他のエージェントは、表示されるビューを更新する。または、ピクチャデータベースビューア18により、ピクチャをドラッグ及びドロップすることができ、さもなければユーザアプリケーション2のウィンドウに移動することができる。
【0045】
言語アナライザ22は、ユーザアプリケーション2により発生された単語を分析し、アーカイブ14からの画像の選択のために、文脈情報を検索エージェント20に提供する。
【0046】
ユーザアプリケーション20は、電子メール、ウェブページポスティング、ワードプロセッシング、プレゼンテーションソフトウェア、カレンダリング等のような異なる形式をとる。以下の記載のために、電子メールテキストエディタは、典型的な応用に使用される。
【0047】
言語アナライザ22は、電子メールの応用に入力されているユーザ入力を分析し、コンテンツ情報を検索エージェント20に提供する。典型的な使用において、冠詞、接続詞等のような共通の英語の単語は無視される。検索エージェント20は、言語アナライザ22から入力を受ける。検索エージェント20は、文脈として該入力を使用し、関連性に従いデータベース14における画像をランク付けし、ピクチャデータベースビューア18によりディスプレイ10上に示されるようなビューを更新する。
【0048】
ユーザが、画像を更新されたビューからアプリケーションウィンドウにドラッグ及びドロップ、又は移動するのに入力装置12を援用する時、画像がドロップされる周囲からの文脈は言語アナライザ22により分析され、ピクチャアーカイブ14における画像に付属するために自動的に提案されるキーワードが抽出される。
【0049】
実在する注釈は、ピクチャアーカイブ14においてもしあれば、言語アナライザ22により抽出されるキーワードの現在のセットにより、手動的又は自動的に注釈される。たとえば、注釈エージェント24は、ピクチャデータベースビューア18からユーザにより明確に援用することができる。ユーザは、提案されたキーワードを受けるか、又は手動で編集して画像に対してキーワードを付すことができる。代替的に又は加えて、注釈エージェント24は、ピクチャアーカイブ14により抽出されたキーワードの全てで自動的に増加する。
【0050】
後者の場合、自動的に抽出されたキーワードは、自動的に抽出されたキーワードにより低い信頼度を割当てることにより、手動により付加されたキーワードから区別することができる。これらの構成要素は、注釈及び検索統合エージェント6を構成し、このサブシステムは、電子メールアプリケーションのような1つ又は複数のターゲットアプリケーションに統合されるように設計される。
【0051】
図3は、注釈及び検索統合エージェント6により実行される検索動作の基本的な論理フローを示している。ステップ30において、検索エージェント20は、言語アナライザ22により抽出された新たな文脈を受ける。文脈は、現実的に時間的(たとえば、「昨日」、又は「日曜日」)であるか否かに依存する異なるやり方で扱われてもよい。
【0052】
ステップ32において、アーカイブ文脈が時間的な参照であると判定された場合、次いで、ステップ34において、整合のためにピクチャアーカイブ14がサーチされる。たとえば、デジタル画像は、メタデータとして日付−時間スタンプを有して捕捉される。参照される時間点、すなわち同じ日又は同じ月のいずれかに整合する画像が発見された場合に、整合が行われる。
【0053】
整合する場合、次いで、ステップ36において、参照時間点からの時間的な距離に従って画像はランク付けされる。ディスプレイ10上のピクチャデータベースビューア18により示されるビューは、ステップ38に従い更新される。たとえば、高くランク付けされた画像は、より低くランク付けされた画像よりもリストの更に上の方に上げることができる。
【0054】
ステップ32において、文脈が時間的な参照ではないと判定された場合、次いで、ステップ40において、特定の画像への関連性に従い画像はランク付けされ、ピクチャデータベースビューア18により示されるビューは、ステップ38に従い更新される。画像のランク付けは、文脈において提供されているどの位のキーワードがピクチャオブジェクトに付されるキーワードに整合するかにより判定される。考慮される文脈のサイズは、プログラム変数である。
【0055】
たとえば、抽出された文脈が単語「海岸」及び「フロリダ」を含んでいる場合、それに付されている両キーワードを有する画像は、高くランク付けされ、それに付されているたった1個のキーワードを有する画像が続いてランク付けされる。
【0056】
他のランク付けを定義することができる。たとえば、空間的なランク付けである(ここでは、言語アナライザ22により抽出された文脈において高められる参照位置名からの距離に従い画像がランク付けされる)。さらには、手動で注釈された画像にはより高い信頼度が割当てられるので、ランク付けもまた、抽出されたキーワードが自動的に提供されるか、又は抽出されたキーワードが手動で選択されるか、を考慮することができる。
【0057】
加えて、画像が時間的及び非時間的な参照の混合を有していてもよいので、整合機能は、時間的な文脈に従い整合される画像とキーワードの文脈に従い整合される画像との交差に注目してもよい。この場合において、該交差を有する画像が検索及びランク付けされてもよく、又は該交差を有する画像を両方の参照を有していない画像よりも高くランク付けすることができる。
【0058】
注釈及び検索統合エージェント6の例示的な実現は、図4〜図6の画面構成において示されている。最初の実現は、カスタムビルト(custom-built)画像検索及び注釈アプリケーションを含んでいる窓52に結合される、標準Java Swing Text Editorのような標準的なテキストエディタ50を備えている。
【0059】
テキストエディタ50の下には、ボックス54において、エディタのカーソル56を囲んでいるテキストから取られた検索用語表示されている。テキストエディタ50の右に、検索窓58において検索された画像60の列が表示されている。この列は、動的に更新される。それぞれの画像60の右に、該画像に付属する注釈キーワードのリスト62が現れている。
【0060】
ユーザは、テキストエディタ50において、自由にタイプ入力することができる。テキスト編集操作は、図4において示されるように、注釈及び検索統合エージェント6により記録される。注釈及び検索統合エージェント6は、連続的に動作し、テキストエディタ50においてユーザのタイプ入力を観察する。
【0061】
注釈及び検索統合エージェント6への入力は、言語アナライザ22により分析され、テキストカーソル56の周辺の文脈におけるキーワードを抽出する。テキスト分析を実行する異なる典型的な方法が存在するが、確かなアプローチは、情報検索の用語頻度−逆文書頻度(TFIDF)方法、のような、一般的な情報抽出発見、一般的な単語除去(word elimination)を使用することである。
【0062】
たとえば、TFIDF方法は、あるユーザと通信している全ての人々によりその単語がどのくらい希に使用されているかに関連して、ある人からの電子メール通信を該単語がどのくらいよく特徴付けているかに加えて、その言葉が問い合わせにおいてどのくらい重要であるかを考慮している。
【0063】
カーソル56への1つ又は複数のより近いキーワードは、テキストエディタ窓52の下のボックス54において連続的に表示される。ここでは、言語アナライザ22により考慮される文脈のサイズに依存して、多数のキーワードが表示されている。キーワードは、ピクチャアーカイブ14における画像データベースに問い合わせするために使用され、画像60のランク付けされたリストが、関連性の順に、列58において右にグラフィカルに表示される。キーワードは、キーストローク毎に再計算される。
【0064】
たとえば、図4において示されるように、ユーザは、テキストエディタに電子メールメッセージ、“Dear Karen, Last Week Joe and kids made a birthday”をタイプ入力することにより開始し、エージェントはキーワード“birthday”を抽出する。さしあたり、少なくとも1つの画像がこの単語で予め注釈されていると仮定すると、この単語は、イベントの画像を検索するのに十分なものであり、列58におけるテキストエディタ50の右へ現れている。
【0065】
この時点で、電子メールメッセージについての良好な例示となる画像60aを作る可能性が高く、列58における更新されたビューから画像をドラッグして、テキストエディタ50のアプリケーション窓52にドロップしてもよい。代替的に、たとえば、画像60aへの簡単なクリックにより、画像をカーソル56の点に挿入することができる。
【0066】
次いで、図6において示されるような電子メールに画像60aが挿入されて、ユーザは、テキストエディタに電子メールメッセージ、“Dear Karen, Last Week Joe and kids made a birthday party for me. They made me wear a party hat. I got a motorcycle for a present…”をタイプ入力し続け、注釈及び検索統合エージェント6は、キーワード“party”、“hat”及び“motorcycle”を抽出する。
【0067】
上述したように、画像がこれらの単語で注釈されていると仮定すると、これらに単語は、このイベントの画像を検索するのに十分なものである。該画像は、列58におけるテキストエディタ50の右に現れている。先のように、この時点で、電子メールメッセージについて良好な例示となる1つ又は複数の画像を作る可能性が高く、ドラッグ及びドロップ動作(又は画像上での1回のクリック)により、画像がカーソル56の点でエディタに挿入される。
【0068】
このインタラクションが、典型的な画像検索からどのくらい異なるかを理解することは重要である。たとえば、画像検索アプリケーションにスイッチする必要がない。キーワードの問い合わせをタイプする必要がなく、ファイルダイアログボックスをプルダウンする必要がない。
【0069】
さらに、電子メールにおいて画像を使用するために、カットアンドペーストを必要としない。最も重要なことは、全体のユーザインタラクションは、僅か簡単な動き、すなわちワンクリックであることが好ましい。勿論、所望の画像は、即時に現れない場合があるが、その場合、適切な画像を発見するまでリストを通してスクロールし、ダイアログボックスを呼び出して他の画像セット等をロードする。その場合であっても、典型的なアプローチと比較して若干のインタラクションをなお節約することができるが、重要なことは、最も可能性のある場合が我々の指先での訂正であり、平均的なインタラクションがより低減される。
【0070】
検索を援用するために使用されるタイプ入力されたテキストにおいて現れる他の種類の情報がある。1つの情報の種類は、時間的な参照である。多くの場合、自動インポートエージェント16によりインポートされる画像は、捕捉した日付及び時間を含んでおり、注釈及び検索統合エージェント6は、かかる時間的な情報を利用するために設計される。
【0071】
たとえば、タイプ入力“Last week”により、システムは、先週に関連する日付の範囲を判定することができ、該範囲と画像毎にタイムスタンプされた日付とを比較することができ、該日付の範囲内の画像を検索することができる。この能力には、特定及び相関的な日付、間隔、「約」等を含んでいる時間参照の大量のボキャブラリが含まれる。
【0072】
別の情報の種類は、位置的な参照である。デジタルカメラは、現在手に入れることができ、画像と共にグローバルポジショニング(GPS)データを捕捉する。たとえば、“San Francisco”と位置をタイプ入力することで、システムは、対応するGPS座標を探し出し、この情報を画像が撮影された位置に関連付けし、次いで同じ座標を有する画像を検索する。
【0073】
所望の画像が未だ注釈されていないと仮定すると、たとえば、デジタルカメラで通常使用されるコンパクトフラッシュカードのような画像記憶メディアを挿入することにより、画像が自動インポートエージェント16により最初にロードされている場合の通りとなる。
【0074】
フラッシュカードメディアがコンピュータに挿入されるとすぐに、注釈及び検索統合エージェント6は、フラッシュカード上の画像をピクチャアーカイブ14に即時にロードする。注釈及び検索統合エージェント6は起動して、数秒毎に到来する入力について、自動的にポーリングされる。これは些細な事のように思えるが、ファイルダイアログボックスがポップアップされるのを待ち、ファイルシステムにおいて画像を送るべき場所を見つけ、該画像を何と呼ぶべきか及び次回検索することができるように該呼び名を覚える、といった「画像をロードする」動作を援用するための必要が無くなる。挿入されたばかりの画像は、ユーザが直ぐに見ることを望む可能性があるので検索ウィンドウ58の一番上に即時に移動される。
【0075】
上記タイプ入力された文字の開始文を例示するために画像を通してスクロールして検索する一方で、ユーザは、画像が、該画像を記述するために適切な多くのキーワードを含んでいるテキストの隣のテキストエディタ50において在位して今現れていることに注目する。これは、次回に検索がより簡単になるように、存在するテキストを使用して画像を注釈するための機会を表している。
【0076】
たとえば、ユーザは、テキストエディタ50から単語“hat”、“party”等のいずれかを画像60aにドラッグして、該画像に関する注釈を配置することができる。たとえば、図6に示されるように、ユーザは、画像60aに注釈“hat”を加えるために選定される。
【0077】
図5において示されるように、注釈及び検索統合エージェント6は、周囲のテキストから候補となるキーワードを提案するダイアログボックス70(記述子が画像の前に、後に現れることがあるが、通常閉じている)を表示することにより、整合に応答することができる。これにより、ユーザは、(ボックス74をチェックすることにより)1つ又は複数の適切なキーワードを直ぐに選択することができ、関連のないキーワードを避けることができる。次いで、選択されたキーワードは、ADDボタン76上をクリックすることにより、該画像についての注釈に追加される。
【0078】
また一方、インタラクションは、注釈アプリケーション内又は外での文脈スイッチに加えて、タイプ入力及びカットアンドペースト又はキーワードの外部リストからの選択、典型的な画像注釈アプリケーションにおけるものを基準にして合理化される。
【0079】
要約すると、注釈及び検索統合エージェントは、典型的な電子メールエディタ及び典型的な検索アプリケーションの結合であり、幾つかの特徴は、電子メールのメッセージを作成する間に画像注釈及び検索のために一般に使用される動作を実行するために、ユーザにとってより便利なものとなっている。
【0080】
電子メールエディタにより、ユーザは、メッセージをタイプ入力することができ、インターネットのようなネットワークにわたり該メッセージを送出することができる。画像検索アプリケーションは、画像のデータベースを記憶しており、それぞれの画像とキーワードのセットを関連付ける。これにより、ユーザは、新たなキーワードを画像に付属させるか、存在するキーワードを削除するか、又はキーワードのセットに基づいてデータベースにおける画像のセットを検索するか、のいずれかを行うことができる。
【0081】
キーワードのセットのそれぞれについて、画像検索アプリケーションは、ユーザのキーワードに最も整合したものが最初に現れる順序に順序化されたリストを戻す。画像と電子メールメッセージをより便利に結合するために、注釈及び検索統合エージェントは、電子メールメッセージにおいて最近タイプ入力されたキーワードに基づいて、画像を検索する。
【0082】
画像は、画像検索アプリケーションから電子メールアプリケーションにドラッグされてもよく、この場合には、電子メールメッセージに挿入される。電子メールメッセージからの単語は、電子メールアプリケーションから画像検索アプリケーションにおける画像にドラッグされてもよく、この場合には、それらの単語は、画像検索アプリケーションデータベースにおける該画像に関連付けられる。
【0083】
電子メールメッセージにおいて現れている画像上で左クリックすると、画像を囲んでいる単語から取られたキーワードのセットがチェックボックスにおいて表示され、対応するボックスがチェックされると、該単語は画像検索アプリケーションデータベースにおける該画像と記憶される。
【図面の簡単な説明】
【図1】本発明の例示的な実施の形態における、注釈及び検索エージェントを含むソフトウェアアプリケーションの機能ブロック図である。
【図2】本発明による注釈及び検索エージェントの機能ブロック図である。
【図3】図2において示される注釈及び検索エージェントの基本的なロジックフローのフローチャートである。
【図4】本発明の実施の形態による注釈及び検索エージェントのアプリケーションを示す、電子メールテキストエディタのメインウィンドウのスクリーンレイアウトの例である。
【図5】図4において示されるメインウィンドウにおいて現れるキーボードダイアログボックスの例である。
【図6】最後に電子メールが書かれ、送出準備がなされた図4において示されるメインウィンドウの例である。
【符号の説明】
2:ユーザアプリケーション
4:プロセッシングユニット
6:注釈及び検索統合ユニット
8:グラフィカルユーザインタフェース
10:ディスプレイ
12:入力装置
14:ピクチャアーカイブ
15:ネットワークインタフェース
16:自動インポートエージェント
18:ピクチャデータベースビューア
20:検索エージェント
22:言語アナライザ
24:(手動)注釈エージェント
30:新たな文脈分析ステップ
32:時間的な判定ステップ
34:時間的なステップへのマッピング
36:時間的なランク付けステップ
38:更新ビューステップ
40:キーワードランク付けステップ
50:テキストエディタ
52:窓
54:ボックス
56:カーソル
58:検索ウィンドウ
60:画像
60a:選択された画像
62:注釈キーワードのリスト
70:ダイアログボックス
72:示唆される注釈
74:注釈選択チェックボックス
76:ADDボタン
Claims (1)
- テキスト入力機能を有するアプリケーションプログラムに入力されたテキストを使用して、画像と該画像についての注釈とを得るためのコンピュータシステムを動作する方法であって、
複数の画像と該複数の画像のそれぞれに関連するデータとを記憶手段に記憶するステップと、
入力手段を介してテキストを入力し、入力されたテキストを前記アプリケーションプログラムの表示領域のうちで前記テキスト入力機能が提供するテキスト表示領域に表示するステップと、
前記テキスト表示領域で表示されているテキストを分析し、前記テキスト表示領域で表示されているテキストの文脈に基づいてキーワードを抽出するステップと、
前記記憶手段に記憶されている画像から、抽出されたキーワードに対応するデータを有する画像を検索し、検索された画像を画像表示領域に表示するステップと、
前記テキスト表示領域で表示されているテキストから抽出されたキーワードに基づいて決定される少なくとも1つの注釈のためのキーワードを提案するための注釈表示領域を提供し、前記入力手段を使用して、提案されるキーワードのうちの少なくとも1つを前記検索された画像の1つ以上と関連付けするステップと、
前記注釈表示領域により関連付けされた画像とキーワードとを前記記憶手段に記憶するステップと、を備える方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US685112 | 2000-10-10 | ||
US09/685,112 US7028253B1 (en) | 2000-10-10 | 2000-10-10 | Agent for integrated annotation and retrieval of images |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002207749A JP2002207749A (ja) | 2002-07-26 |
JP3842994B2 true JP3842994B2 (ja) | 2006-11-08 |
Family
ID=24750824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001311928A Expired - Fee Related JP3842994B2 (ja) | 2000-10-10 | 2001-10-09 | 画像の統合された注釈及び検索のためのエージェント |
Country Status (4)
Country | Link |
---|---|
US (1) | US7028253B1 (ja) |
EP (1) | EP1197879B1 (ja) |
JP (1) | JP3842994B2 (ja) |
DE (1) | DE60112212T2 (ja) |
Families Citing this family (102)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8954432B2 (en) | 2000-11-15 | 2015-02-10 | Mark Frigon | Users tagging users in photos online |
US6842761B2 (en) * | 2000-11-21 | 2005-01-11 | America Online, Inc. | Full-text relevancy ranking |
US8078545B1 (en) | 2001-09-24 | 2011-12-13 | Aloft Media, Llc | System, method and computer program product for collecting strategic patent data associated with an identifier |
US7305625B1 (en) | 2001-09-24 | 2007-12-04 | Aloft Media, Llc | Data networking system and method for interfacing a user |
US7287064B1 (en) * | 2001-11-20 | 2007-10-23 | Sprint Spectrum L.P. | Method and system for determining an internet user's interest level |
GB0129787D0 (en) * | 2001-12-13 | 2002-01-30 | Hewlett Packard Co | Method and system for collecting user-interest information regarding a picture |
GB2383247A (en) * | 2001-12-13 | 2003-06-18 | Hewlett Packard Co | Multi-modal picture allowing verbal interaction between a user and the picture |
US20030128389A1 (en) | 2001-12-26 | 2003-07-10 | Eastman Kodak Company | Method for creating and using affective information in a digital imaging system cross reference to related applications |
US20040205547A1 (en) * | 2003-04-12 | 2004-10-14 | Feldt Kenneth Charles | Annotation process for message enabled digital content |
US20060288006A1 (en) * | 2003-10-23 | 2006-12-21 | Xerox Corporation | Methods and systems for attaching keywords to images based on database statistics |
US7676739B2 (en) * | 2003-11-26 | 2010-03-09 | International Business Machines Corporation | Methods and apparatus for knowledge base assisted annotation |
JP2005285038A (ja) | 2004-03-31 | 2005-10-13 | Nec Corp | 携帯電話機、そのメッセージ作成方法及びプログラム |
US20060031201A1 (en) * | 2004-08-06 | 2006-02-09 | Microsoft Corporation | Life moment tagging and storage |
US20060080286A1 (en) * | 2004-08-31 | 2006-04-13 | Flashpoint Technology, Inc. | System and method for storing and accessing images based on position data associated therewith |
US7685209B1 (en) * | 2004-09-28 | 2010-03-23 | Yahoo! Inc. | Apparatus and method for normalizing user-selected keywords in a folksonomy |
JP4367355B2 (ja) * | 2005-02-24 | 2009-11-18 | セイコーエプソン株式会社 | 写真画像検索装置、写真画像検索方法、記録媒体、およびプログラム |
JP4588642B2 (ja) * | 2005-03-15 | 2010-12-01 | 富士フイルム株式会社 | アルバム作成装置、アルバム作成方法、及びプログラム |
WO2006114880A1 (ja) * | 2005-04-22 | 2006-11-02 | Yamatake Corporation | 情報連携ウィンドウシステム |
US7734644B2 (en) * | 2005-05-06 | 2010-06-08 | Seaton Gras | System and method for hierarchical information retrieval from a coded collection of relational data |
US20060287996A1 (en) * | 2005-06-16 | 2006-12-21 | International Business Machines Corporation | Computer-implemented method, system, and program product for tracking content |
US7539934B2 (en) * | 2005-06-20 | 2009-05-26 | International Business Machines Corporation | Computer-implemented method, system, and program product for developing a content annotation lexicon |
US20070005592A1 (en) * | 2005-06-21 | 2007-01-04 | International Business Machines Corporation | Computer-implemented method, system, and program product for evaluating annotations to content |
US7702681B2 (en) * | 2005-06-29 | 2010-04-20 | Microsoft Corporation | Query-by-image search and retrieval system |
EP1938225A2 (en) * | 2005-09-30 | 2008-07-02 | Koninklijke Philips Electronics N.V. | Method and apparatus for browsing of images |
US20070118509A1 (en) * | 2005-11-18 | 2007-05-24 | Flashpoint Technology, Inc. | Collaborative service for suggesting media keywords based on location data |
US7822746B2 (en) * | 2005-11-18 | 2010-10-26 | Qurio Holdings, Inc. | System and method for tagging images based on positional information |
US7584411B1 (en) * | 2005-12-22 | 2009-09-01 | Adobe Systems, Inc. | Methods and apparatus to identify graphical elements |
US7822846B1 (en) * | 2006-01-26 | 2010-10-26 | Sprint Spectrum L.P. | Method and system for brokering media files |
US9892196B2 (en) * | 2006-04-21 | 2018-02-13 | Excalibur Ip, Llc | Method and system for entering search queries |
US7467222B2 (en) * | 2006-05-12 | 2008-12-16 | Shutterfly, Inc. | Image ranking for imaging products and services |
US8166418B2 (en) * | 2006-05-26 | 2012-04-24 | Zi Corporation Of Canada, Inc. | Device and method of conveying meaning |
US7783622B1 (en) | 2006-07-21 | 2010-08-24 | Aol Inc. | Identification of electronic content significant to a user |
US8631012B2 (en) * | 2006-09-29 | 2014-01-14 | A9.Com, Inc. | Method and system for identifying and displaying images in response to search queries |
US8661035B2 (en) * | 2006-12-29 | 2014-02-25 | International Business Machines Corporation | Content management system and method |
JP4270404B2 (ja) * | 2007-01-16 | 2009-06-03 | ソニー・エリクソン・モバイルコミュニケーションズ株式会社 | 携帯端末装置、表示制御装置、表示制御方法、及び表示制御プログラム |
US8055271B2 (en) * | 2007-02-05 | 2011-11-08 | Yahoo! Inc. | Intelligent location-to-cell mapping using annotated media |
US7739304B2 (en) * | 2007-02-08 | 2010-06-15 | Yahoo! Inc. | Context-based community-driven suggestions for media annotation |
US20080229186A1 (en) * | 2007-03-14 | 2008-09-18 | Microsoft Corporation | Persisting digital ink annotations as image metadata |
US8189880B2 (en) * | 2007-05-29 | 2012-05-29 | Microsoft Corporation | Interactive photo annotation based on face clustering |
US20080313541A1 (en) * | 2007-06-14 | 2008-12-18 | Yahoo! Inc. | Method and system for personalized segmentation and indexing of media |
TW200905496A (en) * | 2007-07-16 | 2009-02-01 | Nanya Technology Corp | Methods and systems for searching information, and machine readable medium thereof |
US7725454B2 (en) * | 2007-07-20 | 2010-05-25 | Microsoft Corporation | Indexing and searching of information including handler chaining |
US7849065B2 (en) * | 2007-07-20 | 2010-12-07 | Microsoft Corporation | Heterogeneous content indexing and searching |
US20090049018A1 (en) * | 2007-08-14 | 2009-02-19 | John Nicholas Gross | Temporal Document Sorter and Method Using Semantic Decoding and Prediction |
US20090199093A1 (en) * | 2007-09-04 | 2009-08-06 | Tridib Chakravarty | Image Capture And Sharing System and Method |
US8571850B2 (en) * | 2007-09-13 | 2013-10-29 | Microsoft Corporation | Dual cross-media relevance model for image annotation |
US8457416B2 (en) * | 2007-09-13 | 2013-06-04 | Microsoft Corporation | Estimating word correlations from images |
US20090112830A1 (en) * | 2007-10-25 | 2009-04-30 | Fuji Xerox Co., Ltd. | System and methods for searching images in presentations |
US20090164572A1 (en) * | 2007-12-20 | 2009-06-25 | Motorola, Inc. | Apparatus and method for content item annotation |
US20090287782A1 (en) * | 2008-05-14 | 2009-11-19 | Daniel Brian Odess | Interactive Multimedia Timeline |
US9529820B2 (en) * | 2008-05-23 | 2016-12-27 | International Business Machines Corporation | Automated content tracking and conversion |
US8150170B2 (en) | 2008-05-30 | 2012-04-03 | Microsoft Corporation | Statistical approach to large-scale image annotation |
US8510646B1 (en) * | 2008-07-01 | 2013-08-13 | Google Inc. | Method and system for contextually placed chat-like annotations |
US8638858B2 (en) | 2008-07-08 | 2014-01-28 | Intellectual Ventures Fund 83 Llc | Method, apparatus and system for converging images encoded using different standards |
US8468178B2 (en) * | 2008-08-05 | 2013-06-18 | International Business Machines Corporation | Providing location based information in a virtual environment |
US8463053B1 (en) | 2008-08-08 | 2013-06-11 | The Research Foundation Of State University Of New York | Enhanced max margin learning on multimodal data mining in a multimedia database |
US8520979B2 (en) * | 2008-08-19 | 2013-08-27 | Digimarc Corporation | Methods and systems for content processing |
JP5051080B2 (ja) * | 2008-09-25 | 2012-10-17 | 富士通株式会社 | 情報表示装置、情報表示方法、及びプログラム |
US8131734B2 (en) * | 2008-10-09 | 2012-03-06 | Xerox Corporation | Image based annotation and metadata generation system with experience based learning |
US8024311B2 (en) * | 2008-12-05 | 2011-09-20 | Eastman Kodak Company | Identifying media assets from contextual information |
US8452794B2 (en) * | 2009-02-11 | 2013-05-28 | Microsoft Corporation | Visual and textual query suggestion |
US8244706B2 (en) * | 2009-12-18 | 2012-08-14 | International Business Machines Corporation | Method and apparatus for semantic just-in-time-information-retrieval |
US8780130B2 (en) | 2010-11-30 | 2014-07-15 | Sitting Man, Llc | Methods, systems, and computer program products for binding attributes between visual components |
US9715332B1 (en) | 2010-08-26 | 2017-07-25 | Cypress Lake Software, Inc. | Methods, systems, and computer program products for navigating between visual components |
US8661361B2 (en) | 2010-08-26 | 2014-02-25 | Sitting Man, Llc | Methods, systems, and computer program products for navigating between visual components |
US10397639B1 (en) | 2010-01-29 | 2019-08-27 | Sitting Man, Llc | Hot key systems and methods |
EP2619967B1 (en) * | 2010-09-21 | 2018-06-20 | Sony Mobile Communications Inc. | System and method of enhancing messages |
US9195679B1 (en) * | 2011-08-11 | 2015-11-24 | Ikorongo Technology, LLC | Method and system for the contextual display of image tags in a social network |
US8731339B2 (en) | 2012-01-20 | 2014-05-20 | Elwha Llc | Autogenerating video from text |
US9489636B2 (en) | 2012-04-18 | 2016-11-08 | Tagasauris, Inc. | Task-agnostic integration of human and machine intelligence |
US9225936B2 (en) * | 2012-05-16 | 2015-12-29 | International Business Machines Corporation | Automated collaborative annotation of converged web conference objects |
KR102100952B1 (ko) | 2012-07-25 | 2020-04-16 | 삼성전자주식회사 | 데이터 관리를 위한 방법 및 그 전자 장치 |
KR102072113B1 (ko) | 2012-10-17 | 2020-02-03 | 삼성전자주식회사 | 사용자 단말 장치 및 제어 방법 |
US9317531B2 (en) * | 2012-10-18 | 2016-04-19 | Microsoft Technology Licensing, Llc | Autocaptioning of images |
KR102083209B1 (ko) * | 2012-11-22 | 2020-03-02 | 삼성전자 주식회사 | 데이터 제공 방법 및 휴대 단말 |
US9098532B2 (en) | 2012-11-29 | 2015-08-04 | International Business Machines Corporation | Generating alternative descriptions for images |
US9165009B1 (en) | 2013-03-14 | 2015-10-20 | Emc Corporation | Lightweight appliance for content storage |
US9552432B1 (en) * | 2013-03-14 | 2017-01-24 | EMC IP Holding Company LLC | Lightweight appliance for content retrieval |
JP6112968B2 (ja) | 2013-05-23 | 2017-04-12 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | コマンド生成方法、装置及びプログラム |
US10642928B2 (en) * | 2013-06-03 | 2020-05-05 | International Business Machines Corporation | Annotation collision detection in a question and answer system |
JP5916666B2 (ja) * | 2013-07-17 | 2016-05-11 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | テキストによる視覚表現を含む文書を分析する装置、方法およびプログラム |
GB2524074A (en) | 2014-03-14 | 2015-09-16 | Ibm | Processing data sets in a big data repository |
US10324733B2 (en) | 2014-07-30 | 2019-06-18 | Microsoft Technology Licensing, Llc | Shutdown notifications |
US10254942B2 (en) | 2014-07-31 | 2019-04-09 | Microsoft Technology Licensing, Llc | Adaptive sizing and positioning of application windows |
US9836464B2 (en) * | 2014-07-31 | 2017-12-05 | Microsoft Technology Licensing, Llc | Curating media from social connections |
US10678412B2 (en) | 2014-07-31 | 2020-06-09 | Microsoft Technology Licensing, Llc | Dynamic joint dividers for application windows |
US9787576B2 (en) | 2014-07-31 | 2017-10-10 | Microsoft Technology Licensing, Llc | Propagating routing awareness for autonomous networks |
US10592080B2 (en) | 2014-07-31 | 2020-03-17 | Microsoft Technology Licensing, Llc | Assisted presentation of application windows |
US9414417B2 (en) | 2014-08-07 | 2016-08-09 | Microsoft Technology Licensing, Llc | Propagating communication awareness over a cellular network |
US9514368B2 (en) | 2014-11-14 | 2016-12-06 | Telecommunications Systems, Inc. | Contextual information of visual media |
US10324975B2 (en) * | 2014-12-19 | 2019-06-18 | Smugmug, Inc. | Bulk keyword management application |
US10460015B1 (en) * | 2015-03-27 | 2019-10-29 | Open Text Corporation | Assimilation in multi model webpage composition |
US9872061B2 (en) | 2015-06-20 | 2018-01-16 | Ikorongo Technology, LLC | System and device for interacting with a remote presentation |
US10503738B2 (en) * | 2016-03-18 | 2019-12-10 | Adobe Inc. | Generating recommendations for media assets to be displayed with related text content |
US10223067B2 (en) * | 2016-07-15 | 2019-03-05 | Microsoft Technology Licensing, Llc | Leveraging environmental context for enhanced communication throughput |
WO2018222247A1 (en) * | 2017-06-02 | 2018-12-06 | Apple Inc. | Device, method, and graphical user interface for annotating content |
US10387487B1 (en) | 2018-01-25 | 2019-08-20 | Ikorongo Technology, LLC | Determining images of interest based on a geographical location |
KR102481910B1 (ko) | 2018-08-31 | 2022-12-27 | 구글 엘엘씨 | 동적 키보드 인터페이스내의 애니메이션 이미지 포지셔닝 방법 및 시스템 |
US11163777B2 (en) | 2018-10-18 | 2021-11-02 | Oracle International Corporation | Smart content recommendations for content authors |
JP7380113B2 (ja) * | 2019-11-15 | 2023-11-15 | 富士フイルムビジネスイノベーション株式会社 | 文書管理装置、文書管理システム及びプログラム |
US11823476B2 (en) | 2021-05-25 | 2023-11-21 | Bank Of America Corporation | Contextual analysis for digital image processing |
CN115862831B (zh) * | 2023-03-02 | 2023-05-12 | 山东远程分子互联网医院有限公司 | 一种智能在线预约诊疗管理系统及方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0382541B1 (en) | 1989-02-09 | 1996-09-25 | Canon Kabushiki Kaisha | Electronic filing apparatus and method of retrieving image information |
US5404295A (en) * | 1990-08-16 | 1995-04-04 | Katz; Boris | Method and apparatus for utilizing annotations to facilitate computer retrieval of database material |
JP2903904B2 (ja) | 1992-10-09 | 1999-06-14 | 松下電器産業株式会社 | 画像検索装置 |
US5546502A (en) | 1993-03-19 | 1996-08-13 | Ricoh Company, Ltd. | Automatic invocation of computational resources without user intervention |
GB9315448D0 (en) | 1993-07-26 | 1993-09-08 | Rank Xerox Ltd | Recording and retrieval of information relevant to the activities of a user |
US5493677A (en) | 1994-06-08 | 1996-02-20 | Systems Research & Applications Corporation | Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface |
US6108674A (en) * | 1994-06-28 | 2000-08-22 | Casio Computer Co., Ltd. | Image output devices which automatically selects and outputs a stored selected image in correspondence with input data |
JPH08314953A (ja) | 1995-05-15 | 1996-11-29 | Olympus Optical Co Ltd | 画像検索表示装置及び仮名漢字変換装置 |
US5870770A (en) * | 1995-06-07 | 1999-02-09 | Wolfe; Mark A. | Document research system and method for displaying citing documents |
US5873107A (en) * | 1996-03-29 | 1999-02-16 | Apple Computer, Inc. | System for automatically retrieving information relevant to text being authored |
US6374260B1 (en) * | 1996-05-24 | 2002-04-16 | Magnifi, Inc. | Method and apparatus for uploading, indexing, analyzing, and searching media content |
US5909679A (en) | 1996-11-08 | 1999-06-01 | At&T Corp | Knowledge-based moderator for electronic mail help lists |
JPH10301953A (ja) | 1997-04-28 | 1998-11-13 | Just Syst Corp | 画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
AUPO960197A0 (en) * | 1997-10-03 | 1997-10-30 | Canon Information Systems Research Australia Pty Ltd | Multi-media editing method and apparatus |
-
2000
- 2000-10-10 US US09/685,112 patent/US7028253B1/en not_active Expired - Fee Related
-
2001
- 2001-09-28 EP EP01203708A patent/EP1197879B1/en not_active Expired - Lifetime
- 2001-09-28 DE DE60112212T patent/DE60112212T2/de not_active Expired - Lifetime
- 2001-10-09 JP JP2001311928A patent/JP3842994B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE60112212T2 (de) | 2006-05-24 |
EP1197879A2 (en) | 2002-04-17 |
US7028253B1 (en) | 2006-04-11 |
DE60112212D1 (de) | 2005-09-01 |
EP1197879A3 (en) | 2003-07-09 |
JP2002207749A (ja) | 2002-07-26 |
EP1197879B1 (en) | 2005-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3842994B2 (ja) | 画像の統合された注釈及び検索のためのエージェント | |
US8812945B2 (en) | Method of dynamically creating real time presentations responsive to search expression | |
US6301586B1 (en) | System for managing multimedia objects | |
CN100426292C (zh) | 数据管理方法和系统 | |
Schwartz | Web search engines | |
US8156123B2 (en) | Method and apparatus for processing metadata | |
CN101320391B (zh) | 数据管理方法和系统 | |
Lieberman et al. | Aria: An agent for annotating and retrieving images | |
JP5511292B2 (ja) | 表示方法、システムおよびプログラム | |
CN101430697B (zh) | 用于搜索和存储数据的方法和系统 | |
US7930647B2 (en) | System and method for selecting pictures for presentation with text content | |
US20100199166A1 (en) | Image Component WEB/PC Repository | |
US20040064455A1 (en) | Software-floating palette for annotation of images that are viewable in a variety of organizational structures | |
US20040098379A1 (en) | Multi-indexed relationship media organization system | |
US20020075310A1 (en) | Graphical user interface adapted to allow scene content annotation of groups of pictures in a picture database to promote efficient database browsing | |
US20090217149A1 (en) | User Extensible Form-Based Data Association Apparatus | |
US6694302B2 (en) | System, method and article of manufacture for personal catalog and knowledge management | |
Al-Hawamdeh et al. | Compound document processing system | |
Jones et al. | Searching and browsing in a digital library of historical maps and newspapers | |
Suh | Image management using pattern recognition systems | |
JPH0786890B2 (ja) | 治験例記憶装置 | |
O’Sullivan et al. | Context-oriented image retrieval | |
Nakazato et al. | Group-based interface for content-based image retrieval | |
US20150074005A1 (en) | Method and apparatus for facilitating patent searching | |
Gargi | Unifying browse and search in information hierarchies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040713 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050524 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20050824 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20050829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060110 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060410 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060414 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060811 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090818 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100818 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110818 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110818 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120818 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120818 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130818 Year of fee payment: 7 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |