JP4236116B2 - 画像特徴抽出方法及び装置 - Google Patents

画像特徴抽出方法及び装置 Download PDF

Info

Publication number
JP4236116B2
JP4236116B2 JP2006013982A JP2006013982A JP4236116B2 JP 4236116 B2 JP4236116 B2 JP 4236116B2 JP 2006013982 A JP2006013982 A JP 2006013982A JP 2006013982 A JP2006013982 A JP 2006013982A JP 4236116 B2 JP4236116 B2 JP 4236116B2
Authority
JP
Japan
Prior art keywords
image
document
document image
feature extraction
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006013982A
Other languages
English (en)
Other versions
JP2006216031A (ja
Inventor
エフ カレン ジョン
ジェー ハル ジョナサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2006216031A publication Critical patent/JP2006216031A/ja
Application granted granted Critical
Publication of JP4236116B2 publication Critical patent/JP4236116B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

本発明は、文書画像データベース検索などに好適な画像特徴抽出技術に関する。
低コスト、大容量の文書画像記憶装置が増加したため、量的にも種類においても絶えず増加し続ける文書を、これまでのようにハードコピーの形で保管するのではなく、オンライン電子情報として保存できるようになった。このような記憶装置技術の革新によって、文書の記憶コストは下がったが、その一方で、膨大なオンライン文書からユーザが関心のある特定の文書を見つけ出すための、より効率のよい検索方法が必要になってきた。
関心のある文書を見つけ出す方法は色々とあるが、どうみても不完全であった。一般的に、これらの方法では、文書がスキャンされてコンピュータに取り込まれ、光学的文字認識(OCR)プログラムで、その画像をテキストファイルに変換する。次に、ある形式のキーワード一致検索が行われ、システムは全文書のテキスト全体をスキャンするか、あるいは、文書を最初に分類した人間によって文書を表すものとして注意深く選択されたキーワードの集合をスキャンする。この1番目の方法の問題点は、大量の文書を全体にわたってスキャンするため、検索コストが高いことである。2番目の方法の難点は、人によって、ファイリング及び検索のためのカテゴリーが違ってくることである。データベース内の文書の種類が増加するに従って、これら従来の検索方法の信頼性は悪化する。
文書の画像部分の情報内容を利用することの有利性に気づき、文書中の小画像のマッチングによって文書を検索する試みがいろいろとなされてきた。例えば、M.Y.Jaisimha,A Bruce及びT.Nguyenは、彼らの著作“DocBrows:A system for Textual and Graphical Querying on Degraded Document Iamage Data”において、レターヘッド中の会社ロゴを利用して文書を検索するシステムについて述べている。D.Doermann らは、“Development of a General Framework for Intelligent Document Retrieval”において、文書の低レベルの特徴及び高レベルの構造を記述する画像記述子の生成及びマッチングに基づいた文書のマッチングシステムについて概説している。しかし、残念ながら、この方法は、強力な画像情報処理を必要し、このことが一般的な市販アプリケーションへの利用を非常に難しくしている。
以上の方法は、画像の特徴ベクトルの要素マッチングによる文書検索の手段を提供するが、大規模な文書画像データベースを編成するための有効な方法を提供するものではない。このような欠点から分かることは、文書画像データベースの効率的な検索方法及び装置と、そのような効率的な検索のための文書画像データベースの編成方法及び装置こそが必要とされるものである。同時に、そのための文書画像などの特徴抽出方法及び装置が必要とされる。
本発明の目的は、画像の特徴ベクトルの要素マッチングによる文書画像データベース検索などに好適な画像特徴抽出方法及び装置を提供することにある。ただし、本発明の画像特徴抽出方法及び装置の適用は文書画像データベース検索に限定されない。
本発明の画像特徴抽出方法及び装置は、文書画像をウェーブレット圧縮アルゴリズムによって、低周波画像情報と高周波画像情報とに分離する機能と、前記分離された前記低周波画像情報から画素値の平均と分散を生成する機能と、前記分離された高周波画像情報から画素の連結成分を検出し、該連結成分に基づき、ワード数、絵の数及びコラムの数を生成する機能と、前記画素値の平均と分散、ワード数、絵の数及びコラムの数を統合して特徴ベクトルを生成する機能とを有する。
本発明によれば、文書画像から効率よく特徴情報を抽出することができ、画像の特徴マッチングによる文書画像データベース検索やその他の、広範囲の利用が可能である。
以下、添付図面を参照し、本発明の実施の形態を説明する。
[本発明の実施に適した典型的なシステム構成]
本発明は専用のハードウェアによって実施することも可能であることは当然であるが、通常、本発明は、図1に示すような基本的なサブシステムからなるコンピュータシステム上で実施されるであろう。
図1において、コンピュータシステム10はバス12を含み、このバス12は主要なサブシステム、例えば中央プロセッサ14、システムメモリ16、入出力(I/O)コントローラ18、パラレルポート22を介してプリンタなどの外部装置20、ディプレイアダプタ26を介してディスプレイ24、シリアルポート28、キーボード30、固定ディスクドライブ32、フロッピーディスク33Aを挿入して動作可能なフロッピーディスクドライブ33を相互に接続する。その他、多くのデバイスを接続可能であり、例えば、外部インターフェース36を介してスキャナ装置34を接続でき、シリアルポート28を介してマウス38を接続でき、タッチスクリーン40を直接接続できる。これ以外に、多くのデバイスあるいはサブシステム(不図示)を同様の方法で接続してもよい。また、後述のように、図1に示した全てのデバイスが必ずしも本発明の実施のために必要なわけではない。また、システムの動作を損なわない限り、デバイス及びサブシステムの相互接続を図1に示した方法と異なった方法で行っても構わない。図1に示すようなコンピュータシステムの動作は、当該技術分野では自明であるので、ここでは詳述しない。本発明を実行するためのソースコードは、システムメモリ16に動作可能に配置されるか、あるいは、固定ディスク(32)やフロッピーディスク33Aなどの記録媒体に格納されであろう。また、画像データベースも固定ディスク(32)に格納されるであろう。
ディスプレイ24は、CRTディスプレイつまりモニタを採用したパソコン、ワークステーション、メインフレームコンピュータなどの一般的なコンピュータに使用されるものと同様なものである。様々な種類のユーザ入力デバイスを本発明に使用できる。例えば、ユーザの手の動きに従ってディスプレ24の画面上に表示されたポインタを移動させることができるマウス38は、標準的なユーザ入力デバイスである。マウスは表面に1つ又はそれ以上のボタンがあり、ユーザはマウスを動かして画面上のオブジェクトを指し示し、マウスの1つ又はそれ以上のボタンを押すことにより、そのオブジェクトを選択し、あるいは起動することができる。あるいは、タッチスクリーン40を用いれば、ユーザは、画面上でオブジェクトを指し示すことにより1つのオブジェクトを選択し、その選択されたオブジェクトをポインティング操作によって画面上の別の位置へ移動させることができる。マウス又はタッチスクリーンを利用して起動させるための様々なボタンやコントロールを、画面に表示できる。固定ディスクドライブ32は、ハードディスクドライブ又は光ディスクドライブ、あるいは、文書画像データベースの格納に適した任意の媒体である。
[画像データベースに対して行われる照会動作の概要]
本発明の一実施例の独特かつ革新的な特徴の一つは、直観的に理解できるやり方で、データベース中の文書に対し画像ベースの検索を行うことができ、また、検索を高速化するため、文書画像の視覚的特徴によってデータベースを編成することである。また、従来技術で必要とされたような代表文書画像をユーザが作る必要がない。この点に関しては、例えば本出願人が特願平9−23429号(特開平9−237282号)で既に提案した文書画像データベース検索方法では、「模範文書」をユーザが用意もしくは生成しなければならない。
本発明の一実施例によるデータベース検索編成処理手順が図2に示されている。この実施例においては、OCRスキャンニングによって、文書のテキスト成分が文書画像から抽出され、それがデータベース内で利用可能とされる。このデータベースは、コンピュータシステム内の固定ディスク(32)やシステムメモリ16など、任意の1つまたは複数の記憶媒体に置かられる。
検索手続きは最初の照会ステップ102から始まる。この照会ステップ102において、ユーザは、キーボード30などの入力デバイスとディスプレイ24を利用して、1つ又はそれ以上のキーワード(すなわち、文字列又は文字列の組合せ)をシステムに入力する。
データベース中の文書のテキスト成分に含まれる前記文字列を探すための検索が、テキスト・ベース検索ステップ104で行われる。このテキスト・ベース検索で、ユーザが関心を持っている文書が見つかった場合には、ユーザは、ステップ106で、それ以上の処理を停止させることができる。関心を持っている文書が見つからなかった場合には、前記文字列を含んでいる文書が画像ベース検索のための基礎になる。好適な実施例においては、文書画像の圧縮画像から抽出された特徴がデータベース内に用意されている。テキスト・ベース検索の条件を満たした文書は、分類ステップ108において、各文書画像から抽出された特徴の類似度に基づいて分類され、複数のクラスタが生成される。ステップ110において、分類ステップ108で生成された各文書画像クラスタ毎に、1つの代表文書画像が選択される。
表示ステップ112で、代表文書画像がディスプレイ24によってユーザに表示される。好適な実施例においては、図12に示すように、ウェブ・ブラウザー1004をユーザインターフェースとして利用して、各代表文書画像の圧縮表現がアイコン1006として表示される。関連した実施例では、圧縮されない代表文書画像を表示する。好適な実施例においては、ユーザは、あるクラスタをさらなる検索のための基礎として選択でき、この選択は、ステップ114で、マウス38又は他の入力デバイスを使って、さらなる検索の基礎とすべきクラスタの代表文書アイコンを指示することによって行う。
選択された文書クラスタに分類ステップを適用することによって検索を続行し、当該クラスタを新しい1組のクラスタに分割する(ステップ108)。その各クラスタは新しい1つの代表文書画像を持つ。検索は、文書が見つかるまで(ステップ106)、あるいはユーザが検索の停止を選択するまで(ステップ116)継続する。
本発明の他の実施例によるデータベース検索編成処理手順が図3にフローチャートとして示されている。この例では、各文書画像の圧縮表現がデータベース内に用意される。これらの圧縮表現から特徴が抽出されるが、この抽出のステップ107は文書完了ステップ106と分類ステップ108の間に挿入される。検索は、図2に関連して説明した例におけると同様に分類ステップ108に進む。関連した実施例では、図示しないが、分類ステップ108を最初に適用する前に、あるいはデータベースのナビゲーション中、分類ステップ108を新たに適用する前に随時、ユーザが希望するクラスタ数を選択できるようにするステップも含む。
本発明によるもう一つの実施例によるデータベース検索編成処理手順が図4に示されている。この実施例においても、前述の実施例と同様、文書画像の圧縮画像から抽出された特徴をデータベース内に用意しておくのが望ましい。分類ステップ208で、文書は各文書画像から抽出された特徴の類似度に基づいて分類され、クラスタを生成する。分類ステップ208で生成された各文書画像クラスタ毎に、ステップ210で1つの代表文書画像が選択される。代表文書画像は、表示ステップ212で、ディスプレイ24によってユーザに表示される。好適な実施例においては、ステップ214で、システムはユーザから入力パラメータを受け入れる。この入力パラメータに基づいて、さらに検索が続けられる。検索は、ユーザが停止を選択するまで(ステップ216)続く。
関連した実施例を図5に示す。この実施例では、各文書画像の圧縮表現がデータベース内に用意される。分類ステップ208の前の抽出ステップ207で、これらの圧縮表現から特徴が抽出される。検索は、図4に関連して説明した実施例と同様、分類ステップ208に進む。
もう一つの関連実施例は、分類ステップ208を最初に適用する前に、あるいはデータベースのナビゲーション中、分類ステップ208を新たな適用する前に随時、ユーザが希望するクラスタ数を選択できるようにするステップも含む。
図6乃至図11は、検索技術の基礎をなす画像処理技術の利用について説明する図である。特に図6乃至図10は本発明の画像特徴抽出技術の実施例を説明する図で、図6は画像圧縮、図7、図8、図9及び図10は特徴抽出の説明図である。図11は分類の説明図である。図12は、表示及びユーザインターフェースの部分を実現するためのウェブ・ブラウザーの利用法を示すものである。
[圧縮技術]
圧縮により、データベースの大量の文書画像の記憶コストが削減される。各文書画像は、圧縮技術によって、例えば、ウェーブレット圧縮(IEEE Data Compression Conference,CREW:Compression with Reversible Embedded Wavelets,March 1995 を参照。これは、ここに引用によって本出願に全面的に編入される)や、従来から知られている任意の圧縮技術によって圧縮される。
図6はウェーブレット圧縮を説明するものである。ウェーブレット圧縮の処理では、画像データ402にピラミッド変換を再帰的に適用し、画像を4分の1の大きさの高周波情報404,406,408と4分の1の大きさの低周波情報410に分割する。本出願において、CREWはいくつかの利点がある。すなわち、CREWは、かなり高速に、画像をハイパス成分とローパス成分に分解する。CREWは、目立ちやすい画像劣化を最小に押さえて、20:1のロッシー圧縮が可能である。最終的に、低周波領域の左上コーナーにローパス・サブバンド画像412が生成される。このサブバンド画像412は、文書の内容確認が可能なアイコン表現を提供する。このような文書の視覚的に確認可能な表現は、効率よくアクセス可能であり、文書情報のインデックスとして便利である。
[文書画像の圧縮から特徴抽出までの処理の流れ]
図7は、本発明の一実施例の2値形式の文書画像の圧縮から特徴抽出までの処理フローの一例を図示したものである。
2値形式の文書画像500が、処理ステップ501で、5×5のガウシアン平滑フィルタによって処理され、文書画像の濃淡表現502が生成される。文書画像が濃淡画像として記憶されている場合には、この処理ステップ501は不要である。
なお、多くのシステムは文書画像の記憶に2値画像表現を採用している。
2値画像の利点はコンピュータの記憶媒体の比較的小さい領域しか占有しないことである。これに対し、濃淡画像の主たる利点は、縮小されても文書画像の認識可能な構造が維持されることである。濃淡画像の主な欠点は、その記憶のための記憶媒体のコストであった。しかし、デジタル媒体のコストが下がるにつれ、この欠点は以前より重要でなくなった。また、圧縮技術の進歩により、画像の記憶容量の差を打ち消すのに十分な高い圧縮率で濃淡画像を記憶することが可能になっている。
この濃淡表現502は、ウェーブレット圧縮アルゴリズム503によって、圧縮表現504に変換される。ローパスフィルタ・ステップ505で、圧縮表現504から低周波画像情報(ローパス画像)506が分離される。同じように、ハイパスフィルタ・ステップ509で、圧縮表現504から高周波画像情報(ハイパス画像)510が分離される。特徴抽出ステップ507が低周波画像情報506に対し実行され、画像の画素値の統計的モーメントとして、画素値の平均と分散という特徴508が生成される。同様に、特徴抽出ステップ511が高周波画像情報510に対し実行され、ワード数、絵の数及びコラムの数という特徴512が生成される。これらの低周波特徴情報508と高周波特徴情報512はステップ513で併合されて、特徴ベクトル514が作られる。
[特徴抽出]
圧縮ステップで得られた低周波画像情報に対する特徴抽出(図7のステップ807に相当)によって、図8に示すように画像の画素値の統計的モーメントを生成する。本発明のある実施例においては、図7に関連して述べたように、その統計的モーメントとして、画素値の平均(Xmean)602と分散(Xvariance)604が、図8中に示し計算式によって計算される。ただし、Xj(j=1,2,...,N)は、低周波画像中の各画素の値である。
図9及び図10は、圧縮ステップで得られた高周波画像情報に対し適用される特徴抽出(図7のステップ511に相当)を説明するものである。高周波画像情報に対する特徴抽出は、連結成分を検出することによってなされる。処理の最初のステップはヒストグラム平準化を行うことであり、濃淡値の最小値と最大値が計算され、濃淡値の範囲が0と255の間の値をとるように調整される。ヒストグラム平準化は当業者に周知の標準的な画像処理技術の一つである。最終的に連結成分アルゴリズムが、好適な実施例では4連結成分アルゴリズムが、適用される。
4連結成分アルゴリズムによれば、連結成分を探索する際に、ある特定の画素の上下左右を観察し同様の濃淡レベルを持つ他の画素を探す。注目している画素の上下左右のいずれかにある隣接画素が統合されて1つの連結成分が作られる。一方、8連結成分アルゴリズムでは、連結成分の探索の際に、画素の上下左右だけでなく、画素の4つの頂点のどれかに隣接する画素も調べることになる。
本発明のある実施例では、連結成分が確認されたならば、その連結成分情報から、前述のようにテキスト・ワード702、絵704及びテキスト・コラム802の総数などの特徴が抽出される。テキスト・ワードの総数という特徴は、あるしきい値サイズ未満の連結成分の総数を調べることによって決定される。このしきい値は、テキストに属している連結成分と絵に関係した連結成分領域を識別するために設定される。しきい値未満の連結成分の個数がワード数である。しきい値を超える連結成分の個数が絵の個数である。
図10は、テキスト・カラム数の決定の基礎となる処理を表している。図10のグラフ804に、連結成分(y軸)対位置(x軸)のプロットが示されている。図10のプロット802は、グラフ804の遷移数(y軸)対連結成分数(x軸)を表している。プロット802において、遷移数は画像中のカラムの個数を示す。
グラフ802中の主要な台地部を観測することにより、文書中の主要なカラム数を判断できる。グラフ802の場合、大きな絵があるために大勢としては1コラムの文書と判断される。しかし、第2の台地部分が、その文書中に3つのコラムもまた存在することを示す。かなり大きい数でピークが検出されたが、これはワード境界のノイズを示し、この点を超えたところでは、もうカラム情報は検出できない。
ある実施例においては、前述の如く、抽出された特徴を統合して「特徴ベクトル」を作る。この特徴ベクトルを文書データベース内の対応した文書画像の検索に利用できる。
[文書画像のクラスタへの分類]
文書画像は特徴情報に基づいて分類され、文書画像のクラスタが作られる。各クラスタには類似した特徴を有する文書画像が含まれる。分類を行う方法の一つは、k−平均アルゴリズムを利用することである。図11に示す本発明の一実施例によれば、図11に示すように、キーワード検索などで絞り込まれた複数の文書画像900は、予め選んだ個数のクラスタ(グループ)、例えば3個のクラスタ902,904,906に分類される。検索の細かさと、混乱することなく追跡可能なクラスタ数との兼ね合いをユーザが判断して、望ましいクラスタ数をユーザが選ぶようにしてもよい。任意のクラスタ内の文書に対し分類を再帰的に行うことにより、データベース内に階層構造を作ることができる。
[代表文書画像の表示]
ユーザに表示するための代表文書画像は、システムによって自動的に各文書画像クラスタから選び出される。本発明の一実施例においては、分類ステップで生成された各クラスタについて、中心が計算され、その中心に最も近い画像が特性画像、すなわち代表文書画像としてラベル付けされる。
本発明の好適な実施例においては、ウェブ・ブラウザーをユーザ・インターフェースとして利用して、代表文書画像を表示し、どの文書画像クラスタをさらなる検索の基礎とすべきかユーザが指示できるようにする。図12(a)に示すようなウェブ・ブラウザー1004をユーザ・インターフェースとして利用し、図12(b)に示すように、ある検索の段階における文書画像クラスタそれぞれの代表文書画像の圧縮表現がアイコン1006としてウェブ・ブラウザー1004に表示される。関連した実施例では、圧縮しない代表文書画像が表示される。好適な実施例では、ユーザが、ある特定のクラスタをさらなる検索の基礎として選択することができ、この選択は、ユーザがマウス38又はその他の入力デバイスを用いて、さらなる検索の基礎としようとするクラスタの代表文書アイコン1006をシステムに指示することによって行う。検索が続けられ、選択された文書クラスタに対し分類ステップを適用し、このクラスタを新たな1組のクラスタに分割するが、その各クラスタに1つの代表文書画像がある。図12(c)に示すように、それら代表文書画像の圧縮表現がアイコン1008として表示される。他の実施例では、これら代表文書画像は圧縮されないものがウェブ・ブラウザー1004に表示される。
[ワールド・ワイド・ウェブからの文書画像検索]
関連した実施例においては、ワールド・ワイド・ウェブの検索エンジン、例えばAltavistaやInfoseekより引き出された文書が、本発明の方法により閲覧される。通常、ユーザは、単純なテキスト・ベースの照会に対し返された、様々なソースからの多数の文書を受信する。どの文書が実際に関心のあるものか、判断が難しい。しかし、外観から区別可能な特定の種類の文書、例えば、大抵は2コラムのテキストを含む科学論文を求めているユーザは、本発明の技術を利用すれば、そのような文書だけを素早く手に入れることができる。
特定の実施例に関連して本発明を説明した。それ以外の実施例も当業者には明かになろう。したがって、特許請求の範囲の各請求項によって指摘されたこと以外、本発明は限定されるべきではない。
本発明の実施に適した典型的なコンピュータシステムを示すブロック図である。 本発明の一実施例によるデータベース検索編成処理手順を示すフローチャートである。 本発明の他の実施例によるデータベース検索編成処理手順を示すフローチャートである。 本発明の別の実施例によるデータベース検索編成処理を示すフローチャートである。 本発明の他の実施例によるデータベース検索編成処理を示すフローチャートである。 文書画像のウェーブレット圧縮の説明図である。 本発明の一実施例の2値形式の文書画像の圧縮から特徴抽出までの流れを説明する図である。 低周波画像情報からの特徴抽出の説明図である。 高周波画像情報からのワード及び絵の連結成分の抽出の説明図である。 高周波画像情報からのコラムの連結成分の抽出の説明図である。 文書画像のクラスタリングの説明図である。 ユーザ・インターフェースのためのウェブ・ブラウザーの利用を説明するための図である。
符号の説明
10 コンピュータシステム
14 中央プロセッサ
16 システムメモリ
24 ディスプレイ
30 キーボード
32 固定ディスクドライブ
33A フロッピーディスク
38 マウス
1004 ウェブ・ブラウザー
1006,1008 代表文書画像のアイコン
500 文書画像
504 圧縮表現
506 低周波画像情報
508 低周波特徴情報
510 高周波画像情報
512 高周波特徴情報

Claims (2)

  1. 文書画像から特徴を抽出する画像特徴抽出方法であって、
    前記文書画像をウェーブレット圧縮アルゴリズムによって、低周波画像情報と高周波画像情報とに分離するステップと、
    前記分離された前記低周波画像情報から画素値の平均と分散を生成するステップと、
    前記分離された高周波画像情報から画素の連結成分を検出し、該連結成分に基づき、ワード数、絵の数及びコラムの数を生成するステップと、
    前記画素値の平均と分散、ワード数、絵の数及びコラムの数を統合して特徴ベクトルを生成するステップと、
    を有することを特徴とする画像特徴抽出方法。
  2. 文書画像から特徴を抽出する画像特徴抽出装置であって、
    前記文書画像をウェーブレット圧縮アルゴリズムによって、低周波画像情報と高周波画像情報とに分離する手段と、
    前記分離された前記低周波画像情報から画素値の平均と分散を生成する手段と、
    前記分離された高周波画像情報から画素の連結成分を検出し、該連結成分に基づき、ワード数、絵の数及びコラムの数を生成する手段と、
    前記画素値の平均と分散、ワード数、絵の数及びコラムの数を統合して特徴ベクトルを生成する手段と、
    を有することを特徴とする画像特徴抽出装置。
JP2006013982A 1997-09-24 2006-01-23 画像特徴抽出方法及び装置 Expired - Fee Related JP4236116B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/936,336 US5995978A (en) 1997-09-24 1997-09-24 Navigation system for document image database

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP10263041A Division JPH11149485A (ja) 1997-09-24 1998-09-17 文書画像データベース検索方法、文書画像データベース編成方法、記録媒体、及び、文書画像データベース編成装置

Publications (2)

Publication Number Publication Date
JP2006216031A JP2006216031A (ja) 2006-08-17
JP4236116B2 true JP4236116B2 (ja) 2009-03-11

Family

ID=25468487

Family Applications (2)

Application Number Title Priority Date Filing Date
JP10263041A Pending JPH11149485A (ja) 1997-09-24 1998-09-17 文書画像データベース検索方法、文書画像データベース編成方法、記録媒体、及び、文書画像データベース編成装置
JP2006013982A Expired - Fee Related JP4236116B2 (ja) 1997-09-24 2006-01-23 画像特徴抽出方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP10263041A Pending JPH11149485A (ja) 1997-09-24 1998-09-17 文書画像データベース検索方法、文書画像データベース編成方法、記録媒体、及び、文書画像データベース編成装置

Country Status (5)

Country Link
US (1) US5995978A (ja)
JP (2) JPH11149485A (ja)
CN (1) CN1101969C (ja)
DE (1) DE19843445A1 (ja)
GB (1) GB2330930B (ja)

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6869023B2 (en) 2002-02-12 2005-03-22 Digimarc Corporation Linking documents through digital watermarking
US6522770B1 (en) 1999-05-19 2003-02-18 Digimarc Corporation Management of documents and other objects using optical devices
US8094949B1 (en) 1994-10-21 2012-01-10 Digimarc Corporation Music methods and systems
US7986806B2 (en) 1994-11-16 2011-07-26 Digimarc Corporation Paper products and physical objects as means to access and control a computer or to navigate over or act as a portal on a network
US6577746B1 (en) 1999-12-28 2003-06-10 Digimarc Corporation Watermark-based object linking and embedding
US7051086B2 (en) 1995-07-27 2006-05-23 Digimarc Corporation Method of linking on-line data to printed documents
US7505605B2 (en) 1996-04-25 2009-03-17 Digimarc Corporation Portable devices and methods employing digital watermarking
US7024016B2 (en) * 1996-05-16 2006-04-04 Digimarc Corporation Digital watermarking apparatus and methods
US6735253B1 (en) 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
US8527882B2 (en) * 1998-06-12 2013-09-03 Gregory J. Swartz System and method for iconic software environment management
US6285995B1 (en) * 1998-06-22 2001-09-04 U.S. Philips Corporation Image retrieval system using a query image
US8332478B2 (en) 1998-10-01 2012-12-11 Digimarc Corporation Context sensitive connected content
US6363381B1 (en) * 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching
US7143434B1 (en) 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US20020032734A1 (en) 2000-07-26 2002-03-14 Rhoads Geoffrey B. Collateral data combined with user characteristics to select web site
US6647381B1 (en) * 1999-10-27 2003-11-11 Nec Usa, Inc. Method of defining and utilizing logical domains to partition and to reorganize physical domains
US6381510B1 (en) 1999-11-19 2002-04-30 Eruggallery.Com Methods and apparatus for facilitating electronic commerce in area rugs
US20020052803A1 (en) * 1999-11-19 2002-05-02 Rahim Amidhozour Methods and apparatus for facilitating electronic commerce in area rugs
JP2002007413A (ja) * 2000-06-20 2002-01-11 Fujitsu Ltd 画像検索装置
US7657064B1 (en) 2000-09-26 2010-02-02 Digimarc Corporation Methods of processing text found in images
US7099860B1 (en) * 2000-10-30 2006-08-29 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
US6970860B1 (en) * 2000-10-30 2005-11-29 Microsoft Corporation Semi-automatic annotation of multimedia objects
US7987186B1 (en) 2000-11-06 2011-07-26 Navteq North America, Llc Method and system for wavelet-based representation and use of cartographic data
JP2002230012A (ja) * 2000-12-01 2002-08-16 Sumitomo Electric Ind Ltd ドキュメントクラスタリング装置
US8103877B2 (en) 2000-12-21 2012-01-24 Digimarc Corporation Content identification and electronic tickets, coupons and credits
US6965683B2 (en) 2000-12-21 2005-11-15 Digimarc Corporation Routing networks for use with watermark systems
DE10105928A1 (de) * 2001-02-09 2002-08-29 Koenig & Bauer Ag Verfahren zum Auffinden von Elementen in einer Datenbank
US7552139B2 (en) * 2001-03-19 2009-06-23 Xerox Corporation Represented object groups
US20030018667A1 (en) * 2001-07-18 2003-01-23 Eastman Kodak Company Website using images as a navigational tool for user-created photopages on the internet
US7130864B2 (en) * 2001-10-31 2006-10-31 Hewlett-Packard Development Company, L.P. Method and system for accessing a collection of images in a database
AU2002351310A1 (en) 2001-12-06 2003-06-23 The Trustees Of Columbia University In The City Of New York System and method for extracting text captions from video and generating video summaries
US6817530B2 (en) 2001-12-18 2004-11-16 Digimarc Id Systems Multiple image security features for identification documents and methods of making same
JP2003203090A (ja) * 2002-01-07 2003-07-18 Ricoh Co Ltd 画像空間表示方法
US8370761B2 (en) * 2002-02-21 2013-02-05 Xerox Corporation Methods and systems for interactive classification of objects
JP2003330941A (ja) * 2002-05-08 2003-11-21 Olympus Optical Co Ltd 類似画像分類装置
US7824029B2 (en) 2002-05-10 2010-11-02 L-1 Secure Credentialing, Inc. Identification card printer-assembler for over the counter card issuing
JP4817585B2 (ja) * 2002-06-21 2011-11-16 株式会社日本総合研究所 属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラム
GB2391648A (en) * 2002-08-07 2004-02-11 Sharp Kk Method of and Apparatus for Retrieving an Illustration of Text
GB2395805A (en) * 2002-11-27 2004-06-02 Sony Uk Ltd Information retrieval
US8356019B1 (en) 2002-12-11 2013-01-15 Altera Corporation Method and apparatus for utilizing patterns in data to reduce file size
US7194106B2 (en) * 2003-04-03 2007-03-20 Digimarc Corporation Creating electronic forms through digital watermarking
EP1671235A4 (en) * 2003-09-23 2007-10-24 Amazon Com Inc CUSTOMIZED RESEARCH BANK WITH HIGH-PERFORMANCE CAPABILITIES FOR ACCESSING ELECTRONIC TEXT IMAGES ON THE BASIS OF MEMBERSHIP OF THE CORRESPONDING PHYSICAL TEXT
US7496560B2 (en) * 2003-09-23 2009-02-24 Amazon Technologies, Inc. Personalized searchable library with highlighting capabilities
US7382903B2 (en) * 2003-11-19 2008-06-03 Eastman Kodak Company Method for selecting an emphasis image from an image collection based upon content recognition
DE102004001212A1 (de) * 2004-01-06 2005-07-28 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zum Durchsuchen einer Datenbank in zwei Suchschritten
US20050187842A1 (en) * 2004-02-24 2005-08-25 First Data Corporation System for transaction processing
JP2006023944A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP2006023945A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP2006025129A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP4208780B2 (ja) * 2004-07-07 2009-01-14 キヤノン株式会社 画像処理システム及び画像処理装置の制御方法並びにプログラム
DE102004050348B3 (de) * 2004-10-15 2006-05-18 Siemens Ag Verfahren zur Initialisierung eines Datennetzes
US20060106760A1 (en) * 2004-10-29 2006-05-18 Netzer Moriya Method and apparatus of inter-document data retrieval
JP4252030B2 (ja) * 2004-12-03 2009-04-08 シャープ株式会社 記憶装置およびコンピュータ読取り可能な記録媒体
US8566705B2 (en) * 2004-12-21 2013-10-22 Ricoh Co., Ltd. Dynamic document icons
WO2006096612A2 (en) 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
EP1887473A4 (en) * 2005-05-31 2008-09-03 Science Park Corp MONITORING PROCEDURE, MONITORING SYSTEM, SYSTEM PROGRAM AND RECORDING MEDIUM CONTAINING THE PROGRAM
JP2007026386A (ja) * 2005-07-21 2007-02-01 Fuji Xerox Co Ltd 画像検索システム及び方法
JP2007080061A (ja) * 2005-09-15 2007-03-29 Univ Of Tsukuba Webページの検索方法及びWebページのクラスタリング方法
WO2007066704A1 (ja) * 2005-12-09 2007-06-14 Nec Corporation テキストマイニング装置、テキストマイニング方法、および、テキストマイニングプログラム
US8683314B2 (en) * 2006-01-13 2014-03-25 Ricoh Co., Ltd. Tree pruning of icon trees via subtree selection using tree functionals
AU2007296443B2 (en) 2006-09-15 2011-09-22 The Nielsen Company (Us), Llc Methods and apparatus to identify images in print advertisements
CN100414548C (zh) * 2006-09-22 2008-08-27 南京搜拍信息技术有限公司 综合利用图像及文字信息的搜索系统及搜索方法
KR100898454B1 (ko) * 2006-09-27 2009-05-21 야후! 인크. 통합 검색 서비스 시스템 및 방법
US8117210B2 (en) 2006-10-06 2012-02-14 Eastman Kodak Company Sampling image records from a collection based on a change metric
JP4809198B2 (ja) * 2006-11-29 2011-11-09 株式会社リコー 画像処理機器,記事画像選択方法,プログラム,および記録媒体
US8676802B2 (en) * 2006-11-30 2014-03-18 Oracle Otc Subsidiary Llc Method and system for information retrieval with clustering
US20090064008A1 (en) * 2007-08-31 2009-03-05 Matsushita Electric Industrial Co., Ltd. User interaction for content based storage and retrieval
JP4811433B2 (ja) * 2007-09-05 2011-11-09 ソニー株式会社 画像選択装置、画像選択方法、およびプログラム
US20090112830A1 (en) * 2007-10-25 2009-04-30 Fuji Xerox Co., Ltd. System and methods for searching images in presentations
WO2009126785A2 (en) 2008-04-10 2009-10-15 The Trustees Of Columbia University In The City Of New York Systems and methods for image archaeology
FR2931974B1 (fr) * 2008-06-02 2010-07-30 Sagem Comm Procede et dispositif de numerisation
WO2009155281A1 (en) * 2008-06-17 2009-12-23 The Trustees Of Columbia University In The City Of New York System and method for dynamically and interactively searching media data
JP2010033358A (ja) 2008-07-29 2010-02-12 Sony Corp 情報処理装置、情報処理方法、プログラム、および情報処理システム
US8671069B2 (en) 2008-12-22 2014-03-11 The Trustees Of Columbia University, In The City Of New York Rapid image annotation via brain state decoding and visual pattern mining
JP5164901B2 (ja) * 2009-03-17 2013-03-21 ヤフー株式会社 画像検索装置
WO2011001584A1 (ja) * 2009-06-29 2011-01-06 日本電気株式会社 情報分類装置、情報分類方法及び情報分類プログラム
AU2010292988B2 (en) * 2009-09-11 2016-09-29 Someones Group Intellectual Property Holdings Pty Ltd Database searching method, system and controller
JP5025782B2 (ja) * 2010-02-17 2012-09-12 キヤノン株式会社 画像検索装置及び画像検索方法
CN102193934B (zh) * 2010-03-11 2013-05-29 株式会社理光 用于寻找图像集合中的代表性图像的系统和方法
US10956475B2 (en) 2010-04-06 2021-03-23 Imagescan, Inc. Visual presentation of search results
US20110246453A1 (en) * 2010-04-06 2011-10-06 Krishnan Basker S Apparatus and Method for Visual Presentation of Search Results to Assist Cognitive Pattern Recognition
US9361130B2 (en) * 2010-05-03 2016-06-07 Apple Inc. Systems, methods, and computer program products providing an integrated user interface for reading content
US9772999B2 (en) 2011-10-24 2017-09-26 Imagescan, Inc. Apparatus and method for displaying multiple display panels with a progressive relationship using cognitive pattern recognition
US11010432B2 (en) 2011-10-24 2021-05-18 Imagescan, Inc. Apparatus and method for displaying multiple display panels with a progressive relationship using cognitive pattern recognition
US10198175B2 (en) * 2012-03-02 2019-02-05 Sony Corporation Information processing apparatus for recognizing an inputted character based on coordinate data series
US10783400B2 (en) * 2018-04-06 2020-09-22 Dropbox, Inc. Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks
US11645295B2 (en) 2019-03-26 2023-05-09 Imagescan, Inc. Pattern search box

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0341347A (ja) * 1989-04-13 1991-02-21 Mitsubishi Rayon Co Ltd 欠陥検査方法およびその装置
US4974034A (en) * 1989-12-05 1990-11-27 Xerox Corporation Post-collation duplex copying system
US5761655A (en) * 1990-06-06 1998-06-02 Alphatronix, Inc. Image file storage and retrieval system
JPH0490054A (ja) * 1990-08-03 1992-03-24 Toshiba Corp 画像記憶検索装置
JPH04106460A (ja) * 1990-08-28 1992-04-08 Toshiba Corp 欠陥検出方法
JPH0589176A (ja) * 1991-09-25 1993-04-09 Dainippon Printing Co Ltd 画像検索装置
US5483650A (en) * 1991-11-12 1996-01-09 Xerox Corporation Method of constant interaction-time clustering applied to document browsing
US5590317A (en) * 1992-05-27 1996-12-31 Hitachi, Ltd. Document information compression and retrieval system and document information registration and retrieval method
JPH0627774A (ja) * 1992-06-29 1994-02-04 Ricoh Co Ltd 用紙選択機能付き画像形成装置
US5499108C1 (en) * 1992-07-29 2001-01-16 Primax Electronics Ltd Document-driven scanning input device communicating with a computer
JP2900209B2 (ja) * 1992-10-12 1999-06-02 セイコーインスツルメンツ株式会社 光学的パターン認識方法および光学的パターン認識装置
JPH06215036A (ja) * 1992-12-10 1994-08-05 Xerox Corp ドキュメントコレクションの探索方法
JPH06189064A (ja) * 1992-12-17 1994-07-08 Tokyo Electric Co Ltd 光学式読取装置
US5553277A (en) * 1992-12-29 1996-09-03 Fujitsu Limited Image search method for searching and retrieving desired image from memory device
JP2721107B2 (ja) * 1993-02-23 1998-03-04 日本電信電話株式会社 映像特徴処理方法
JPH06303425A (ja) * 1993-04-15 1994-10-28 Ricoh Co Ltd 像域分離方法
JPH0721344A (ja) * 1993-06-16 1995-01-24 Ricoh Co Ltd 画像形成記憶装置
CA2175187A1 (en) * 1993-10-28 1995-05-04 William K. Thomson Database search summary with user determined characteristics
US5748780A (en) * 1994-04-07 1998-05-05 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression
US5668897A (en) * 1994-03-15 1997-09-16 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression merge/purge techniques for document image databases
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
JPH07283906A (ja) * 1994-04-07 1995-10-27 Fujitsu Ltd 画像読み取り装置におけるデータ転送方法及びデータ転送装置並びにデータ転送装置付き画像読み取り装置
JP3634419B2 (ja) * 1994-07-25 2005-03-30 セイコーエプソン株式会社 画像処理方法および画像処理装置
US5604824A (en) * 1994-09-22 1997-02-18 Houston Advanced Research Center Method and apparatus for compression and decompression of documents and the like using splines and spline-wavelets
US5748931A (en) * 1994-10-24 1998-05-05 Infosis Group Ltd. Information display system for simultaneously displaying graphical images and text of a publication
JP3282937B2 (ja) * 1995-01-12 2002-05-20 日本アイ・ビー・エム株式会社 情報検索方法及びシステム
JPH0923429A (ja) * 1995-07-07 1997-01-21 Hudson Soft Co Ltd アニメ調画像データ圧縮方法
JP3733161B2 (ja) * 1995-08-01 2006-01-11 キヤノン株式会社 画像処理装置および方法
JPH09218957A (ja) * 1995-12-05 1997-08-19 Advantest Corp 画像処理方法
AUPN727295A0 (en) * 1995-12-21 1996-01-18 Canon Kabushiki Kaisha Zone segmentation for image display
US5933823A (en) * 1996-03-01 1999-08-03 Ricoh Company Limited Image database browsing and query using texture analysis

Also Published As

Publication number Publication date
JP2006216031A (ja) 2006-08-17
JPH11149485A (ja) 1999-06-02
US5995978A (en) 1999-11-30
CN1216382A (zh) 1999-05-12
GB2330930A (en) 1999-05-05
CN1101969C (zh) 2003-02-19
DE19843445A1 (de) 1999-05-20
GB9820556D0 (en) 1998-11-11
GB2330930B (en) 2000-04-05

Similar Documents

Publication Publication Date Title
JP4236116B2 (ja) 画像特徴抽出方法及び装置
US6006226A (en) Method and system for document image feature extraction
JP4335335B2 (ja) ドキュメント画像のソート方法
JP3942290B2 (ja) ドキュメント画像のクライアント・ワークステーションへの送信方法
US5832474A (en) Document search and retrieval system with partial match searching of user-drawn annotations
JP4422290B2 (ja) 文書検索装置、コンピュータシステム、文書検索処理方法及び記憶媒体
JPH09237282A (ja) 文書画像データベース検索方法、画像特徴ベクトル抽出方法、文書画像閲覧システム、機械読み取り可能な媒体及び画像表示方法
JP2816241B2 (ja) 画像情報検索装置
US9092458B1 (en) System and method for managing search results including graphics
US6606623B1 (en) Method and apparatus for content-based image retrieval with learning function
US20090150376A1 (en) Mutual-Rank Similarity-Space for Navigating, Visualising and Clustering in Image Databases
US20040220898A1 (en) Information processing apparatus, method, storage medium and program
JP2006179002A (ja) 動的な文書アイコン
EP1400902A1 (en) Information storage and retrieval
Salih et al. An improved content based image retrieval technique by exploiting bi-layer concept
Johansson A survey on: Contents based search in image databases
Wang SIMPLIcity: a region-based retrieval system for picture libraries and biomedical image databases
Cheikh MUVIS-a system for content-based image retrieval
White et al. ImageGREP: Fast visual pattern matching in image databases
Grana et al. Picture extraction from digitized historical manuscripts
JPH07160879A (ja) 画像処理方法
JP2000259658A (ja) 文書分類装置
Farooque Image indexing and retrieval
Kauniskangas Document image retrieval with improvements in database quality
Chen et al. The content-driven preprocessor of images for MPEG-7 descriptions

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081211

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131226

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees