JP2005202939A - Xmlファイルの作成方法 - Google Patents

Xmlファイルの作成方法 Download PDF

Info

Publication number
JP2005202939A
JP2005202939A JP2004358987A JP2004358987A JP2005202939A JP 2005202939 A JP2005202939 A JP 2005202939A JP 2004358987 A JP2004358987 A JP 2004358987A JP 2004358987 A JP2004358987 A JP 2004358987A JP 2005202939 A JP2005202939 A JP 2005202939A
Authority
JP
Japan
Prior art keywords
image
document
xml file
image document
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004358987A
Other languages
English (en)
Inventor
Amit Chakraborty
キャクラボーティ アーミット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Corporate Research Inc
Original Assignee
Siemens Corporate Research Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Corporate Research Inc filed Critical Siemens Corporate Research Inc
Publication of JP2005202939A publication Critical patent/JP2005202939A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • G06F16/835Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Abstract

【課題】簡単な検索法であるが、従来技術の問題点を回避した方法を提供することである。
【解決手段】イメージ文書と関連するXMLファイルの作成方法において、a)XMLファイルに対する階層を定義する文書タイプ定義(DTD)を作成し、b)イメージ文書に対するイメージカテゴリーを同定し、c)イメージ分析を使用して、イメージ文書の優勢パラメータを抽出し、d)該イメージ文書に対するイメージカテゴリーを同定し、e)該イメージ文書に対する少なくとも1つのサブカテゴリーを同定し、f)オブジェクトを該イメージから抽出し、g)前記ステップb)〜f)から得られた情報を格納するためにXMLファイルを作成する。
【選択図】図3

Description

本発明は、イメージ画像を備えるXMLファイルの作成方法、XMLファイルの検索方法、より詳細にはヒエラルキーおよびコンテント技術を使用したイメージ文書の復元方法に関する。
情報技術の急速な発展と共に、マルチメディア情報の量が爆発的に上昇している。従ってマルチメディアデータ、とりわけ画像の膨大なコレクションを検索し、ブラウザするための効率的なツールが大きな注意を引いている。イメージ画像の検索技術はビデオサーチと共通の基礎技術である。なぜならビデオはしばしば複数のキーフレームにより提示されるからである。イメージおよびビデオサーチでの最も大きな困難性は、視覚情報でのローレベル提示と、基礎となるハイレベルコンセプトとの間にギャップから生じる。コンピュータは色、テクスチャ、形状などのローレベルフューチャ(視覚フューチャ)を理解することができるが、人間は画像を意味的に知覚する。すなわちセマンティックスまたは内容の真の意味に基づいて知覚する。しかし意味論的なレベルフューチャを、コンピュータビジョンおよびイメージ理解の枠内でイメージ画像から現在の技術により直接抽出することは非常に困難である。
コンテンツベースの画像検索は、画像データベース分野でのリサーチと開発の有望な分野の1つであると考えられる。しかしこれまで取り扱われた主たる手法は画像に関連するキーワードを使用することによるものであり、これは伝統的なデータベース管理システム(DBMS)技術に対して使用されているものである。または色、テクスチャ等の画像フューチャマッチングを直接的に使用することによるものである。しかし両方の方法とも視覚的対象物に関して人間が情報を検索することを模倣することはできない。視覚的対象物では、バックグランド、時間および単なる画像特性以外の情報などのコンテンツが重要である。
さらに反復的関連性フィードバックを含む種々の方法が試みられている。ここではユーザが検索されるアイテムにコメントする。ユーザの質問は所望の画像の記述または画像のクラスを提供する。この記述は多数の形態を有する。これは注釈された画像データベースの場合はキーワードの集合、または画像のスケッチ、画像例、または全体的明度、特別な色のピクセルのパーセントなどの量的画像フューチャを表す値の集合である。しかし残念なことに、ユーザにはこのような記述を特定するのがしばしば困難であり、ましてコンピュータプログラムがこれらの記述を理解することも困難である。さらにユーザが良い初期質問を提供しても、データベースをどのようにナビゲートするかという問題は残る。
オリジナルのローレベル視覚フューチャ空間を、ユーザによるハイレベルコンセプトを反映する空間に写像できるようにすることも困難である。従って検索システムの性能は学習構造のモデルおよびユーザフィードバックからの適合に依存する。いくつかの検索システムはハイレベル類似性メトリックに対するユニモードモデルを使用する。すなわち次の質問ポイントはターゲット画像に最も類似する画像の評価位置であり、他の画像の類似性はこのポイントへの距離が増大すると低下する。しかしこのモデルはユーザの所望のハイレベル・セマンティックスを発見するのには不適当である。基本的にセマンティックスベースのサーチはカテゴリーサーチの一種である。ユーザは、花、動物などの基本カテゴリーに所属する画像をサーチする。
上記方法のすべては所定の目的のために使用され、人間的な質問を作成するレベルに至るが、あるべきものとして編成された質問を作成したり、人間がしばしば無意識に実行しているようにコラージュから所定の画像を探したりするものとは遠くかけ離れている。重要なことは、ユーザがコンテンツベースのサーチを行うことができ、画像を階層的に編成できるようにすることである。さらにわれわれは、画像をそのサブコンポーネントとサブコンポーネント間の関連により記述することを構想する。
例えばライオンの子供、またはより条件を付けてブロンクス動物園のライオンの子供を捜すための質問が存在するとする。そしてデータベースは応答が迅速で正確であるように編成されていなければならない。画像が適切に注釈されていれば、質問を適合することができるが、いずれかの構造がなければ検索時間が長くなることがある。またそれ以上の条件がなければ、注釈付きの質問であっても失敗することがある。なぜなら一度ブロンクス動物園を訪問したライオンの子供、またはブロンクス動物園で育てられたライオンの子供、またはブロンクス動物園にいるライオンの子供の画像が挙げられることになるからである。我々のターゲットは明らかに一番最後のものである。画像記述を直接的にマッチングするにしても、これもまた困難なタスクである。なぜならライオンの子供をスケッチすることができ、また体色についての詳細が正しくても、ポーズやライティング、背景については確かでないことがあり、このことはハイレベル・セマンティックス編成なしでは不可能ではないにしてもサーチを非常に困難にするであろう。
本発明の課題は、簡単な検索法であるが、伝統的サーチ方法により直面する前記問題を回避する方法を提供することである。
この課題は、
a)XMLファイルに対する階層を定義する文書形式定義(DTD)を作成し、
b)イメージ文書に対するイメージカテゴリーを同定し、
c)イメージ分析を使用して、イメージ文書の優勢パラメータを抽出し、
d)該イメージ文書に対するイメージカテゴリーを同定し、
e)該イメージ文書に対する少なくとも1つのサブカテゴリーを同定し、
f)オブジェクトを該イメージから抽出し、
g)前記ステップb)〜f)から得られた情報を格納するためにXMLファイルを作成することにより解決される。
発明の要約
本発明は、階層的画像編成方法とデータベースマッピング方法を使用する。データベースマッピング方法は質問を関連するテキストベースのサーチストラテジーに変換する。一度、意図する結果が検索されると、さらなるリファインが直接的画像記述と関連のフィードバックを使用することにより達成される。
イメージ文書と関連するXMLファイルの作成方法が開示される。文書形式定義(DTD)が形成され、これがXMLファイルに対して階層を定義する。イメージ文書に対するイメージ画像分類が得られる。イメージ分析処理がイメージ文書の特徴パラメータの抽出に使用される。イメージ文書に対するイメージカテゴリーが同定される。イメージ文書に対する少なくとも1つのイメージサブカテゴリーが同定される。イメージからのオブジェクトが抽出され、XMLファイルが作成され、すべての情報が記憶される。
本発明はまた、1つまたは複数の文書をサーチするためのXMLファイルの検索方法に関する。イメージ文書に対するコンテンツベースの検索は広く受け入れられている。コンテンツベースの検索はXpath質問に変換される。XPath質問はSQLストリングにマッピングされる。1つまたは複数の文書がSQLストリングを使用してサーチされる。SQLストリングの基準にマッチする1つまたは複数のイメージ文書が検索され、ユーザに表示される。
本発明は、階層およびコンテンツ技術を使用するイメージ文書の検索方法を指向する。図1は、本発明を実現するためのネットワークアーキテクチャを例として示す。パーソナルコンピュータ(PC)102,104,106はローカルエリアネットワーク(LAN)の一部であるか、または独立して通信ネットワーク110に接続されている。当業者であればパーソナルコンピュータ102,104,106を種々異なるやり方で通信ネットワーク110に接続することができよう。例えばPC102はモデム108を使用してインターネットサービスプロバイダ(ISP)109に接続することができ、サービスプロバイダ109はPC102を通信ネットワーク110に接続する。モデム108はダイヤルアップモデム、ケーブルモデムまたはデジタル加入者ライン(DSL)用に使用されるモデムとすることができ、PC102を通信ネットワーク110に接続する。通信ネットワーク110はシングルネットワークであるか、または公衆回線電話網(PSTN)、ケーブルネットワーク、デジタル加入者ライン(DSL)、インターネットまたはイントラネットの組合せとすることができる。
通信ネットワーク110には1つまたは複数のウェッブサーバ112,118が接続されている。ウェッブサーバ112,118は、例えばSun Microsystems, Inc. により製造されたSPARCステーションである。各ウェッブサーバは1つまたは複数のウェッブサイトのホストである。各ウェッブサーな112,118に関連して1つまたは複数のデータベース114,116,120,122がマルチメディアデータを含んでいる。このデータはテキスト文書、イメージ文書、XML文書、および他のメディアを含む。当業者であれば、図1に示されたPC、ウェッブサーバおよびデータベースの数は単に説明のための例であり、実際はそれ以上の数であることは理解されよう。
本発明と関連してPCのユーザはイメージ文書要求を、通信ネットワークを介してウェッブサーバの1つまたは複数に対して要求することができる。択一的にユーザは自分のPCに常駐する文書、またはPCのLANないに含まれる文書を要求することができる。イメージ画像要求はテキスト要求、コンテンツ要求、または両方の形式の要求の組合せとして作成することができる。
図2は、イメージ文書202を編成し、イメージ文書をXML文書208と関連付けるための処理を示す。後で詳細に説明するように、XML文書208は、文書タイプ定義(DTD)206を使用して階層およびイメージ文書の記述シンタックスを定義する文法に従う。DTDの複雑性は、基礎となるアプリケーションの複雑性および問題のイメージデータベースにより定義される。
いったんDTDが選択されると、次のステップは認定XML文書204をイメージの各々またはイメージの群と関連付ける。これは実質的にイメージ、階層におけるイメージの位置、所定のフォーマットでのイメージの内容、およびDTDにより定義される他のフューチャを記述する。これらのXML文書は後での検索のために関連データベース212にマッピング210される。
検索側での第1のステップでは、自然またはユーザ質問220を取り上げ、これを関連ステートメントにマッピングする。この関連ステートメントは理解し、解釈することができる。続いて実際の質問が、イメージファイルを配置するデータベースのXML部分で実行される。そしていったん、多重マッチング214が発見されると、この質問はイメージ記述に直接的に作用する別の修飾子、例えば色、テクスチャ等によりリファインされる。多重マッチングがまだ存在すると、関連フィードバック216がリファインのためにさらに使用され、実際のターゲットイメージへと洗練される。
上に示したように本発明の重要な側面はDTDである。文書タイプ定義(DTD)は階層に対するシンタクスと特徴付けに対する言語を定義するように形成される。特徴付けはイメージ文書と関連するXMLファイルを定義するために使用される。明らかに検索能力は、DTDが構造化され、良好に定義されると向上する。しかしDTDの選択と関連する複雑性は明らかに基礎となるイメージデータベースの複雑性と自然分類により定義される。またDTDはスケーラブルであるべきであり、これによりDTDは形成されるより多くのデータに適合することができる。そしてさらなる分類化を、DTDを変化させる必要なしに実行すべきである。
例としてのDTDの実施例を以下に説明する。XMLファイルのルーツエレメントはAIUDocとして同定される。このAIUDocは3つのエレメント、すなわちDocHeader、ImageDocXおよびDocFooterから以下のようにしてなる。
Figure 2005202939
イメージファイルの名称を含むDocHeaderの定義は以下のとおりである。
Figure 2005202939
DocFooterの定義は次のとおりである。
Figure 2005202939
本発明によれば、キー定義はImageDocXの定義である。カテゴリーおよび分類の他に、キー定義はオブジェクトと、その相対的または絶対的位置に関する情報を含む。また特定のオブジェクトがフォアーグランドにあるかバックグランドにあるかの情報も含む。カテゴリーおよびサブカテゴリーの数はアプリケーションに依存するから、DTD定義を反復的に適応する必要がある。ImageDocXの定義は以下のとおりである。
Figure 2005202939
ImageDocXは、ImageClassの主定義、著者に関する情報(画家、写真家等)およびイメージデータを含む。ImageClass情報は、ImageCategoryエレメントを含み、このImageCategoryエレメントは自己再帰的である。集合の個数は分類化の深さに依存する。ImageClassはまたテクスチャに関する情報および他のローイメージを有する。ローイメージはイメージ処理アルゴリズムを使用して発生することのできる格納情報に関連する。ImageClassはまたImageObjectフィールドを有し、このImageObjectフィールドは反復的であり、名称、位置などの属性を有する。これらは特定のオブジェクトがイメージの左または右または他の角にあることを定義する。ImageObjectフィールドはまた使用可能であれば正確な画像座標を定義する他の属性を有する。Referenceは、オブジェクトがフォアーグランドにあるかバックグランドにある、または閉塞されているかを定義する。イメージに関するさらなる情報は格納することができ、必要ならさらなるエレメントおよび属性を形成することができる。
図3は、関連XMLファイルの形成ステップのシーケンスを示す。このXMLファイルは上記のシンタクスに基づくイメージに関する情報を含む。イメージファイルが検索され(302)、イメージに関する情報が手動または自動的に収集され、関連XMLファイルに格納される(328)。収集された情報タイプの例はイメージ分類(例えば自然、人工等)、著者、データ情報(304)である。次にIDおよび名称がイメージに割り当てられる(306)。wavelet分析(310)およびカラーヒストグラム発生(314)のようなイメージ分析法が実行され、イメージの主要パラメータが抽出され格納される(31T2,316)。
次にイメージカテゴリー(例えば動物、植物等)がイメージに対して同定される(318)。サブカテゴリー(例えば陸生生物、水生生物等)が各同定されたイメージカテゴリーに対して形成される(320)。イメージカテゴリー内の付加的サブカテゴリーが適切である限り形成される(322)。オブジェクトがイメージから抽出される(324)。オブジェクトがイメージ処理アルゴリズム、例えば境界ファインディングを使用して手動または自動で抽出される。付加的にオブジェクト情報が抽出される(326)。オブジェクト情報の例は個所、位置、オブジェクトの座標等の属性を含む。いったんすべてのイメージデータとオブジェクトデータが収集されると、XMLファイルが形成され、特定イメージに関するこの情報のすべてが格納される。
上記方法と関連し、ブロンクス動物園のライオンの子供の画像の例で、このようなイメージ画像に関連するXMLファイルの例は以下のとおりである。
Figure 2005202939
本発明は、XML情報とイメージデータの両方を検索することのできるデータベースの作成方法に関するものである。本発明の実施例では、2つのデータベースが作成される。第1のデータベースはイメージファイルを有し、第2のデータベースは上記のXMLファイルを有する。データベースは一般的に次のようにして作成される。適用のためには、DTDは必要なエレメントと属性の同定により簡素化されることを考慮すべきである。次に別個のテーブルが各エレメントと関連付けられる。このエレメントはチャイルドノードまたは属性を有する。プライマリーキーおよび異種キーが作成され、異なるテーブル間の関係を確立する。エレメントと属性値はXMLファイルから抽出され、データベースの作成に使用される。
本発明はまた通常の質問を行い、これをシステムに適合したものにマッチングする方法に関する。XMLは階層的言語であり、質問を行うための非常に構造化された文法に適する。データ構造および上記のデータベースをこのような質問により効率的に動作させるため、質問はSQLステートメントにマッピングされる。ここでは適切なエントリーが文書から抽出され、使用される。XML文書を質問するのには複数のやり方がある。XML文書のアドレス部分に対する1つの共通の基準はXpathである。しかし当業者であれば、本発明の技術思想を逸脱することなく他の言語をXML文書のアドレス部分に使用することができよう。いったん質問結果が受信されれば、多重イメージが選択された場合、ピクセルベースのイメージ処理方法を、サーチを狭めるために使用することができる。さらにサーチ結果のフィルタリングが関連フィードバックを使用して実行される。
イメージ文書を得るためにXMLファイルの質問を実行するための方法が一般的に図4と5に示されている。まず質問が受信され、質問の形式が検出される(402)。質問がキーワードに対する単純なテキスト質問であれば(404)、この質問は単純なデータベースにマッピングされる。このマッピングはSELECTおよびWHERE節とORを使用して行われ、この質問はすべてのテーブルのすべてのコラムからのサーチに結合される。このことはシステムのデータベース部分に対して動作する。テキストサーチはまたXML文書が格納されているシステムの残りの部分に対しても実行される。マッチが存在すると、XMLツリーのすべてのサブノードがマッチポイントに引き出される。
質問が高等サーチ質問であれば、種々のコラムからのマルチフィールドが特定される(40)。この質問は、SELECTおよびWHERE節とANDを使用してデータベースサーチにマッピングされ、すべてのサーチの公差が発見される。もう一度、これはシステムのデータベースマッピング部分にだけを処理する。
本発明によれば、最も重要なサーチはXpathステートメントを使用するサーチである。文脈質問が受信される(412)。データの階層についての多くのコンテクストベースサーチはXpathステートメントに変換することができる(416)。これらのステートメントはルーツから出発し、エレメントまたは属性の値を特定するすべてのやり方に追従することができる。またはこれらのステートメントは、ツリーのいずれかのポイントでスタートし、サブツリーでエレメントまたは属性の値を特定する。従って第1のステップは質問でのスタートタグの位置を同定することである。
例えばライオンの子供を捜すための質問、またはより的確にはブロンクス動物園のライオンの子供を捜す質問の場合、質問はXpathステートメントとして次のように組み立てることができる。
Figure 2005202939
いったんXpath質問が得られると、Xpath質問はSQLストリングにマッピングされる(418)。DTDへの参照が形成され、特定の階層がどのようにテーブルにマッピングされ、そして適切なテーブルを同定するかが決定される。この場合、これは値が既知である最も高いレベルのエレメントまたは属性へ接続されたテーブルの同定を意味する。このことはこの場合、ImageCategoryエレメントである(420)。このテーブルに対する異種キーが同定され、これはImageObjectテーブルへ導く。このImageObjectテーブルは相応するプライマリーキーを有しており、プライマリーキーは適切なオブジェクトを決定する(422)。
いったんテーブルが同定されると、このテーブルは特定される相応のエレメントおよび属性値についてサーチされる(428)。実際のサーチは、Xpath質問サブストリングを高等サーチとして変換することにより実行される。この変換は上記のようにSQLを使用して行われる。そしてイメージ集合にリターンする(424)。
複数のイメージマッチが存在する場合(430)、さらなる情報が提供されるかについての決定が行われる。さらなる情報が存在すれば、付加的質問が形成される。そのために例イメージが既知であれば、色とテクスチャパラメータが抽出され、ユークリッド距離が例イメージの色およびテクスチャパラメータと検索されるイメージのそれとの間で計算される(508)。最初のNの最適マッチがユーザに示される(512,514)。このポイントでユーザは自分の選択を最良に描写するイメージの1つを選択することができる。このイメージは例イメージと置換され、サーチが繰り返され、再び選択されたイメージの中での最適のNのマッチがXMLデータベースサーチを介して反復される。このステップの第1の目標は、ユーザに簡単には記述できないプロパティに対する自分のサーチを適切にする能力を提供することである。
本発明による例としてのネットワークアーキテクチャの概略図である。
本発明によりデータベースがどのように形成され、どのように編成されるかを示すフローチャートである。
イメージ文書に対するXMLファイルがどのように作成されるかを示すフローチャートである。
本発明によりイメージ文書がどのように検索されるかを示すフローチャートである。
本発明によりイメージ文書がさらにどのように検索されるかを示すフローチャートである。

Claims (19)

  1. イメージ文書と関連するXMLファイルの作成方法において、
    a)XMLファイルに対する階層を定義する文書タイプ定義(DTD)を作成し、
    b)イメージ文書に対するイメージカテゴリーを同定し、
    c)イメージ分析を使用して、イメージ文書の優勢パラメータを抽出し、
    d)該イメージ文書に対するイメージカテゴリーを同定し、
    e)該イメージ文書に対する少なくとも1つのサブカテゴリーを同定し、
    f)オブジェクトを該イメージから抽出し、
    g)前記ステップb)〜f)から得られた情報を格納するためにXMLファイルを作成する、
    ことを特徴とするXMLファイルの作成方法。
  2. 請求項1記載の方法において、DTDはさらにXMLファイルにルーツエレメントをAIUDocとして定義する方法。
  3. 請求項2記載の方法において、AIUDocはイメージ文書の名称を有する方法。
  4. 請求項2記載の方法において、AIUDocはImageDocXを有する方法。
  5. 請求項4記載の方法において、ImageDocXはイメージ文書に対するテクスチャパラメータを含む方法。
  6. 請求項4記載の方法において、ImageDocXはイメージ文書に対するカラーパラメータを含む方法。
  7. 請求項4記載の方法において、ImageDocXはオブジェクト情報を含む方法。
  8. 請求項7記載の方法において、オブジェクト情報はオブジェクトに対する位置を有する方法。
  9. 請求項7記載の方法において、オブジェクト情報はオブジェクトに対する座標情報を有する方法。
  10. 請求項7記載の方法において、オブジェクト情報はオブジェクトに対するリファレンス情報を有する方法。
  11. 請求項1記載の方法において、イメージ文書に対する著者情報を得るステップをさらに有する方法。
  12. 請求項1記載の方法において、イメージ文書に対するデータ情報をさらに得るステップを有する方法。
  13. 請求項1記載の方法において、ステップc)はイメージ文書上でwavelet分析を実行するステップをさらに有する方法。
  14. 請求項1記載の方法において、ステップc)はイメージ文書上でカラーヒストグラム発生を実行するステップをさらに有する方法。
  15. 1つまたは複数のイメージ文書を検索するためにXMLファイルを質問する方法において、
    イメージ文書に対するコンテンツベースの質問を受信し、
    コンテンツベースの質問をXpath質問に変換し、
    Xpath質問をSQLストリングにマッピングし、
    1つまたは複数のイメージ文書を、SQLストリングを使用してサーチし、
    SQLストリングのサーチ基準にマッチする1つまたは複数のイメージ文書を検索し、
    ユーザに1つまたは複数の検索されたイメージ文書を表示する、
    ことを特徴とする方法。
  16. 請求項15記載の方法において、コンテンツベースの質問をXpath質問に変換するステップはさらに、コンテンツベースの質問におけるスタートタグの位置を同定するステップを有する方法。
  17. 請求項15記載の方法において、Xpath質問をSQLストリングにマッピングするステップはさらに、
    XPath質問の最高位レベル属性を含むテーブルを同定し、
    該同定されたテーブルに対する異種キーを同定し、
    該同定された異種キーに基づくプライマリーキーを同定することによって、適切なオブジェクトを含む第2のテーブルを同定するステップを有する方法。
  18. 請求項17記載の方法において、1つまたは複数のイメージ文書を検索するステップはさらに、
    1つまたは複数の検索されたイメージ文書に対して、色およびテクスチャパラメータを抽出し、
    例イメージに対する色およびテクスチャパラメータと、検索されたイメージ画像の色およびテクスチャパラメータとの間のユークリッド距離を計算するステップを有する方法。
  19. 請求項15記載の方法において、検索されたイメージ文書の選択をユーザから受信し、
    例イメージを選択されたイメージ文書と置換し、
    イメージ文書を選択されたイメージ文書とSQLストリングを使用して検索するステップをさらに有する方法。
JP2004358987A 2003-12-10 2004-12-10 Xmlファイルの作成方法 Pending JP2005202939A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/732,004 US20050132269A1 (en) 2003-12-10 2003-12-10 Method for retrieving image documents using hierarchy and context techniques

Publications (1)

Publication Number Publication Date
JP2005202939A true JP2005202939A (ja) 2005-07-28

Family

ID=34652788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004358987A Pending JP2005202939A (ja) 2003-12-10 2004-12-10 Xmlファイルの作成方法

Country Status (3)

Country Link
US (1) US20050132269A1 (ja)
JP (1) JP2005202939A (ja)
DE (1) DE102004057862A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100933270B1 (ko) * 2007-12-24 2009-12-22 엔에이치엔(주) 이미지 정보에 기초하여 웹 검색을 수행하기 위한 방법,시스템 및 컴퓨터 판독 가능한 기록 매체
KR101100270B1 (ko) 2009-06-01 2011-12-30 변영완 프로파일을 이용한 온라인 이미지 문서관리 방법
JP2012203458A (ja) * 2011-03-23 2012-10-22 Fuji Xerox Co Ltd 画像処理装置及びプログラム
KR101329102B1 (ko) * 2012-02-28 2013-11-14 주식회사 케이쓰리아이 레이아웃 기술자와 이미지 특징점을 이용한 실시간 증강현실 이미지 검색시스템

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734622B1 (en) * 2005-03-25 2010-06-08 Hewlett-Packard Development Company, L.P. Media-driven browsing
GB2432927A (en) * 2005-10-25 2007-06-06 Thomas Donnelly Image search engine
US7974964B2 (en) * 2007-01-17 2011-07-05 Microsoft Corporation Context based search and document retrieval
CN106506502B (zh) * 2016-11-15 2017-09-22 合肥工业大学 一种多模态移动电子病历系统及其工作方法
US10380175B2 (en) 2017-06-06 2019-08-13 International Business Machines Corporation Sketch-based image retrieval using feedback and hierarchies
CN109446356A (zh) * 2018-09-21 2019-03-08 深圳市九洲电器有限公司 一种多媒体文件检索方法及装置
US11080324B2 (en) * 2018-12-03 2021-08-03 Accenture Global Solutions Limited Text domain image retrieval

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6988093B2 (en) * 2001-10-12 2006-01-17 Commissariat A L'energie Atomique Process for indexing, storage and comparison of multimedia documents
US7275087B2 (en) * 2002-06-19 2007-09-25 Microsoft Corporation System and method providing API interface between XML and SQL while interacting with a managed object environment

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100933270B1 (ko) * 2007-12-24 2009-12-22 엔에이치엔(주) 이미지 정보에 기초하여 웹 검색을 수행하기 위한 방법,시스템 및 컴퓨터 판독 가능한 기록 매체
KR101100270B1 (ko) 2009-06-01 2011-12-30 변영완 프로파일을 이용한 온라인 이미지 문서관리 방법
JP2012203458A (ja) * 2011-03-23 2012-10-22 Fuji Xerox Co Ltd 画像処理装置及びプログラム
KR101329102B1 (ko) * 2012-02-28 2013-11-14 주식회사 케이쓰리아이 레이아웃 기술자와 이미지 특징점을 이용한 실시간 증강현실 이미지 검색시스템

Also Published As

Publication number Publication date
US20050132269A1 (en) 2005-06-16
DE102004057862A1 (de) 2005-07-14

Similar Documents

Publication Publication Date Title
JP4854799B2 (ja) ドキュメント推奨を行う方法
US6567797B1 (en) System and method for providing recommendations based on multi-modal user clusters
US6598054B2 (en) System and method for clustering data objects in a collection
US6922699B2 (en) System and method for quantitatively representing data objects in vector space
US6728752B1 (en) System and method for information browsing using multi-modal features
US6564202B1 (en) System and method for visually representing the contents of a multiple data object cluster
US6941321B2 (en) System and method for identifying similarities among objects in a collection
US7904455B2 (en) Cascading cluster collages: visualization of image search results on small displays
Chen et al. Web mining for web image retrieval
US6411724B1 (en) Using meta-descriptors to represent multimedia information
JP4108961B2 (ja) イメージ検索システムおよびその方法
JPH1166106A (ja) マルチメディアデータベース及びデータベースからの情報抽出方法
Lewis et al. An integrated content and metadata based retrieval system for art
JP2011507099A (ja) イメージ検索における対話型概念学習
WO2008008213A2 (en) Interactively crawling data records on web pages
JP2005202939A (ja) Xmlファイルの作成方法
Yoon et al. Engineering an image‐browsing environment: re‐purposing existing denotative descriptors
CN113672768A (zh) 用于内容发现的人工智能
Hove Improving image retrieval with a thesaurus for shapes. The VORTEX prototyp.
Jayaratne Enhancing retrieval of images on the web through effective use of associated text and semantics from low-level image features.
Sjöberg Content-based retrieval of hierarchical objects with PicSOM
Andreatta Ontology based viso-semantic similarity for image retrieval