JP2008242543A - 画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム - Google Patents

画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム Download PDF

Info

Publication number
JP2008242543A
JP2008242543A JP2007078107A JP2007078107A JP2008242543A JP 2008242543 A JP2008242543 A JP 2008242543A JP 2007078107 A JP2007078107 A JP 2007078107A JP 2007078107 A JP2007078107 A JP 2007078107A JP 2008242543 A JP2008242543 A JP 2008242543A
Authority
JP
Japan
Prior art keywords
page
image
image data
layout
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007078107A
Other languages
English (en)
Other versions
JP2008242543A5 (ja
Inventor
Akihiro Yoshitani
明洋 吉谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007078107A priority Critical patent/JP2008242543A/ja
Priority to US12/049,016 priority patent/US20080244384A1/en
Publication of JP2008242543A publication Critical patent/JP2008242543A/ja
Publication of JP2008242543A5 publication Critical patent/JP2008242543A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Abstract

【課題】入力された文書画像データを記憶手段に蓄積して保存し、検索できるようにした画像検索装置において、ユーザが所望の文書画像データの検索を簡便な操作で効率よく行なえるようにする。
【解決手段】入力され保存される各ページの文書画像301について、それに含まれる画像の属性に応じて複数の領域1〜5に分割し、各領域のレイアウト解析データを生成する。更にその解析データに基づいて各ページの画像データを複数のクラスタのいずれかに所属するように分類する。検索時には各クラスタでの1ページのレイアウトの代表的な画像の夫々を表示する。ユーザは夫々の代表的な画像の内でレイアウトが自ら記憶している検索したい文書画像のページのレイアウトに最も近いものを選択して指定する。これによりクラスタが指定され、そのクラスタに所属するページの画像データが検索され、出力される。
【選択図】図3

Description

本発明は、スキャナなどの画像入力手段によって文書画像データを入力してハードディスクなどの記憶手段に蓄積して保存しておき、ユーザの指定に応じて、記憶手段内の文書画像データの内から特定の文書画像データを検索して出力する画像検索装置に関する。さらに、画像検索装置の画像検索方法、及びその制御プログラムに関するものである。
ハードディスクなどの安価で大容量の記憶装置と、文書画像データを電子的に取り込むためのスキャナなどの画像入力手段が広く普及することにより、大規模な文書画像データベースの構築および格納が可能になった。このような文書画像データベースは、電子図書、医用文書、行政記録、電子スクラップ、地図、行政府書式、マニュアル等々のデータベースとして適用される。今日では、一般に、文書画像を読み取って電子式媒体に格納する方が、その文書をそのまま保管するよりも費用が少ないので、文書画像データベースのシステムが普及している。
ところで、上記のような文書画像データベースシステムにおいて、データ量が大きくなりがちな画像データを圧縮して効率的に管理する手法が下記の特許文献1で提案されている。その手法では、まず入力された文書画像データの各ページの画像をそれに含まれる画像の属性(テキスト・線図形・表・絵など)に応じて複数の領域に分割する。そして各領域の画像について、その属性に応じて異なる圧縮処理を行うことで、ページ全体のデータ量を削減するようにしている。これは、具体的には以下のような手順に従って行われる。
1)文書1ページ分のデジタル画像データ(多値画像データ)を画像処理装置の内部に取り込む。取り込み手段としては、装置に付属した画像読取装置(スキャナ)を用いて文書の画像を光学的に読み取ってデジタル画像データに変換したり、ネットワークなどのインターフェース手段を通じて外部から文書画像データを取り込んだりする。
2)取り込んだ1ページの画像データから二値画像データを生成する。
3)2値画像データに基づいて、1ページの文書画像に含まれる画像の属性を判別し、1ページの画像をその属性に応じて複数の領域に分割する。なお、属性を判別して複数の領域に分割する方法は例えば下記の特許文献2に記載されている。その方法では、1ページの二値画像データの画像を多数の小領域に分割し、各小領域ごとに画像データの特性からその属性を判別する。そして、同じ属性(例えばテキストどうし)で連続する小領域の集合をその属性の領域として抽出する。
4)前記の各属性の領域ごとに、その属性に応じて、二値画像データあるいは多値画像データを選択して、それぞれのための異なる圧縮手法で圧縮する。
5)前記1ページ分の各領域の圧縮データを、その領域の属性と位置の座標値、サイズなどの情報と共にまとめて、該ページの圧縮データとして保存する。
なお、1ページ分の画像の再生は、分割された各属性の領域ごとに圧縮データの伸張処理を行い、伸張されたデータを、原画像ページ内のその領域の座標位置に貼り付けることにより行う。
さて、大規模な文書画像データベースシステムにおいては、所望の文書を識別して検索することを効率的に行う必要がある。所望の文書をデータベースに照会する方法の一つは、所望の文書中に見つかると思われるテキスト文字列またはその組み合わせを検索する方法である。しかしこの方法は、正確な光学的文字認識処理を前提とするため、実用化は困難である。
この他の方法として、検索するユーザが、自分の探そうとする文書の体裁について多少は知っていることを前提とした技術もある。この体裁情報を文書画像データベースの照会に利用する方法が、特許文献3に開示されている。これは、以下のような方法である。
はじめに簡単なカテゴリ選択などによって、目的の文書と大まかな体裁が類似した模範文書画像を生成し、その画像特徴情報を取得する。次に、前記の画像特徴情報を利用してデータベースを検索し、体裁が模範文書画像に類似した文書を複数見つけて検索結果として表示する。次に、ユーザが表示された検索結果の中から、目的の文書に体裁が最も近いものを次の検索のためのキーに選び、そのキーで検索が実行される。この繰り返しにより最終的に目的の文書を見つける。
特開2000−324331号公報 特開平8−161350号公報 特開平9−237282号公報
特許文献3においては、最初の検索キーとして用いる模範文書画像を、画像データベースシステムにどう提示するかに関して、以下の3つの方法を提案している。
1)別の検索手段により、所望の画像に体裁の似た画像をデータベースからまず1枚見つける。
2)ユーザがすでに模範画像を紙の状態で持っていることを前提として、読み取り装置を使って、その模範画像を読み取る。
3)ユーザが所望画像の体裁をグラフィカルユーザインターフェースにより描画して指定する。
しかしながら、これらの方法の何れにしても、ユーザにとって負担が大きく、所望の文書画像の検索を簡便な操作で効率よく行うことができない。そこで本発明の課題は、技術分野の項で述べた種類の画像検索装置において、ユーザが所望の文書画像データの検索を簡便な操作で効率よく行なえるようにすることにある。
上記の課題を解決するため、本発明による画像検索装置は、
文書画像データを入力する画像入力手段と、
入力された文書画像データを蓄積して保存するための記憶手段と、
入力された文書画像データの各ページについて該ページの画像に含まれる画像の属性に応じて複数の領域に分割し、それぞれの領域のレイアウト情報を生成するレイアウト解析手段と、
入力された各ページの画像データと、前記レイアウト解析手段により生成された各ページのレイアウト情報を関連付けて前記記憶手段に保存する手段と、
前記記憶手段に保存された各ページの画像データを該画像データに関連付けて保存されたレイアウト情報に基づいて複数のクラスタのいずれかに所属するように分類するクラスタリング処理手段と、
ユーザが検索したい文書画像データのページのレイアウトによって該ページの画像データが所属するクラスタを指定するための入力を行う指定入力手段と、
該指定入力手段からの入力により指定されたクラスタに所属するページの画像データを前記記憶手段に蓄積して保存された文書画像データの内から検索して出力する検索手段を有することを特徴とする。
また、本発明では、上記の本発明による画像検索装置の構成に対応する画像検索装置の画像検索方法及び制御プログラムの構成を採用した。
本発明によれば、ユーザは、検索したい文書画像データのページのレイアウトの記憶を利用して、そのレイアウトによって検索したいページの画像データが所属するクラスタを指定するだけで、検索処理を実行させることができる。したがって、ユーザが所望の文書画像データの検索を極めて簡便な操作で効率よく行なえるという優れた効果が得られる。
以下、添付した図を参照して本発明を実施するための最良の形態の実施例を説明する。
図1は本実施例の画像検索装置の構成を概略的に示すブロック図である。同図において、以下の101〜108の各部が互いにバス109によって接続されている。
101は、大量(多数)の文書画像データを蓄積して保存できる大容量の記憶手段としての大容量記憶装置であり、ハードディスク装置などで構成される。この大容量記憶装置101内において、大量の文書画像データが後述するページの画像のレイアウトによる検索が可能な文書画像データベースを構成するように蓄積される。
102は、画像検索装置のシステム全体を統括して制御する制御手段としてのCPUである。CPU102は、後述のように入力される文書画像データの各ページの画像のレイアウト解析を行うレイアウト解析手段でもある。また、そのレイアウト解析で得られたレイアウト情報(レイアウト解析データ)に基づいて、レイアウトによる各ページの画像データのクラスタリングを行うクラスタリング処理手段でもある。さらに、ユーザによるページのレイアウトによる指定に応じて文書画像データを検索する検索手段でもある。
103は、CPU102が実行する制御プログラムを格納したROMである。その制御プログラムには、後述する図2及び図6のフローチャートの制御手順のそれぞれに対応した制御プログラムが含まれる。
104は、CPU102が処理する各種データを一時的に記憶しておくために用いられるRAMである。
105は、ビットマップ画像データの表示が可能な液晶表示装置などからなる表示手段(出力手段)としての表示部である。
106は、ユーザが本装置を操作するための各種入力を行う各種入力キーを備えた操作部である。入力キーの一部(図5中のカーソルキー501と決定キー502)は、後述のようにユーザが文書画像データの検索のためにページのレイアウトによりクラスタを指定する入力を行う指定入力手段として用いられる。
107は、文書画像データを入力する画像データ入力手段としての画像入力部である。これは、具体的には、原稿の文書の画像を電子的に読み取って画像データに変換するスキャナ装置や、或いは不図示の外部機器から適当なインターフェース経由で文書画像データを受信するインターフェース装置として構成される。
108は、検索結果として得られた文書画像データの画像を用紙に印刷して出力する出力手段としてのプリンタである。
以上の構成において、CPU102は、ユーザのキー操作による操作部106からのキー入力に応じて全体を制御し、例えば画像入力部107により文書画像データを入力して大容量記憶装置101に登録する、すなわち蓄積して保存する動作を行う。また、ユーザが指定する条件に該当する文書画像データを大容量記憶装置101から検索して取り出し、表示部105に表示させたり、プリンタ108でプリントアウトさせるなどして出力する動作を行う。
ここで上記の登録動作では、入力される各ページのテキストの領域とそれ以外の画像の領域とのレイアウトにより各ページの画像データを複数のクラスタ(グループ)のいずれかに所属するように分類するクラスタリングを行なう。また、検索動作では、ユーザが検索したい文書のページのレイアウトの記憶を利用して、検索したいページの画像データが所属するクラスタをそのページの画像のレイアウトにより指定させる。そして、その指定されたクラスタに所属するページの画像データを検索して出力する。
このような各ページの画像のレイアウトによるクラスタリング処理を伴う文書画像データの登録動作と、ページのレイアウトによるクラスタの指定に応じた文書画像データの検索動作の詳細を以下に説明する。
図2は、上記各ページの画像のレイアウトによるクラスタリング処理を伴う文書画像データの登録時にCPU102が行う処理の制御手順を示すフローチャート図である。この処理は入力される文書画像データの1ページ分についての処理であり、この処理が逐次入力される各ページの画像データについてなされる。
文書画像データの登録時には、まずステップS201において、CPU102の制御のもとに、画像入力部107が1ページの文書画像データを例えば24ビットの多値カラー画像データとして入力する。この多値画像データはRAM104に一時的に格納される。
次にステップS202において、その入力された多値画像データを二値画像データに変換する。なお、ここでの変換は二値画像データを別に生成するという意味であり、多値画像データも後で利用するためにとっておく。
次にステップS203において、CPU102は、レイアウト解析手段として、上記二値画像データを元に、その1ページの文書画像に含まれる画像の属性に応じたレイアウト解析を行う。すなわち、まず1ページの画像に含まれる画像の属性(テキスト、線図形、表、絵や写真など)を判別し、その1ページの画像をその属性に応じて複数の領域に分割し、その領域数nのデータを求める。そして分割した各領域について、始点(左上の角の点)のx,y座標、幅、高さというレイアウト情報のデータと属性のデータ(以下、これらのデータと前記領域数nのデータの全体をレイアウト解析データという)を生成する。このレイアウト解析については先述の特許文献1に記載されている。また、最初に行う1ページの画像の属性の判別は、例えば先述の特許文献2に記載されたように、1ページの画像を多数の小領域に分割して行う。
このステップS203で行うレイアウト解析処理の一例を図3に示してある。入力画像が図3(a)のような1ページの文書画像301である場合、この画像301がレイアウト解析によりそれに含まれる画像の属性に応じて図3(b)の領域1〜5に分割される。この場合、領域1及び4は属性がテキスト、領域2、3、5は属性が線図形である。そして図3(c)のようなレイアウト解析データが生成される。ここで領域数nは5である。そして領域1〜5のそれぞれについて、領域ID、始点X座標、始点Y座標、幅、高さ、及び属性のデータが生成される。属性データは、例えば各属性の識別番号のデータであり、テキストが1、線図形が2、絵・写真が3、表が4とする。
このようにレイアウト解析を行った後、図2のステップS204において、レイアウト解析結果をもとにして、1ページの各領域の(図3では領域1〜5)の画像データを、その属性に応じた条件で、大容量記憶装置101に保存する。具体的には、その領域の属性がテキストや線図形であれば二値画像データとして、また、絵・写真の領域であれば24ビットカラー画像データとして保存する。ここで、二値画像データと、24ビットカラー画像データについて、それぞれに適した圧縮方法で圧縮してから保存してもよい。こうすればページ全体のデータ量を削減できる。また、その1ページの各領域のレイアウト解析データも各領域の画像データに関連付けて共に保存する。
次にステップS205において、保存した1ページの画像データについて、これに関連付けて保存された1ページの上記複数領域のレイアウト解析データ(レイアウト情報)に基づいて、レイアウトによるクラスタリング処理を行う。本実施例におけるクラスタリングでは、まず1ページ内を縦2×横2の4領域に等分し、その4領域のそれぞれについて、テキストまたは空白領域の面積と、テキスト以外の画像領域の面積とのどちらが大きいかを判断する。その判断の結果として、テキストまたは空白領域の面積が大きい領域をテキストまたは空白部とし、テキスト以外の画像領域の面積が大きい領域をテキスト以外の画像部とする。そして、そのページにおける4領域それぞれの前記の判断結果の組み合わせが、図4に示す(1)〜(16)のレイアウト画像のパターンのどれに当てはまるかを判断する。そして、そのページの画像を当てはまるパターンのクラスタ(グループ)に所属させるように分類する。いかなる1ページの画像であってもこの16通りのパターンのいずれかに該当する。なお、この16通りの各パターンは、各クラスタにおける1ページの文書画像の代表的なレイアウトを示すレイアウト画像であり、以下、レイアウト代表画像と呼び、符号400を付す。
上記クラスタリング処理により、上記1ページの画像のレイアウトが(1)〜(16)のレイアウト代表画像400の内のどのレイアウトに当てはまるかという情報が得られる。すなわち、その1ページの画像データがレイアウトによって分類されて所属させられたクラスタの識別情報が得られる。この識別情報を以下ではページレイアウトクラスタといい、ここでは各レイアウト代表画像に付して示した1〜16の数値とする。たとえば、図3(a)のような1ページの文書画像301では、1ページを縦2×横2に分割した4領域のうち、右下領域において線図形領域の占める面積が大きく、残りの領域ではテキスト領域の占める面積が大きい。このため、ページレイアウトクラスタの数値は5となる。なお、ここではページレイアウトクラスタを数値で示しているが数値以外でもよいことは勿論である。
次にステップS206において、ステップS205の処理で得た1ページの画像のページレイアウトクラスタの数値データを、既に保存してあるこのページのレイアウト解析データに関連付けて大容量記憶装置101に保存する。すなわち既に保存してあるこのページの画像データに関連付けて保存する。
次にステップS207において、上記レイアウトによるクラスタリングの分類結果をユーザに通知するために、図4の16通りの内で上記1ページの画像データが分類されて所属させられたクラスタのレイアウト代表画像を表示部105に表示する。たとえば、図3(a)のような文書画像301の場合、ページレイアウトクラスタの数値は5であるから、表示部105には図5のようにクラスタ5のレイアウト代表画像が表示される。こうしてユーザにレイアウトによる分類結果が通知される。この処理を行うことで、ユーザがあとでこのページを検索する際に、指定するレイアウトの選択を行い易くなる。このようなステップS207の処理が終了したら1ページの文書画像の登録処理を終了する。以上のような処理を逐次入力される各ページの画像データについて行う。
次に、図6は、ユーザがある文書のあるページの文書画像を、そのページのレイアウトに関する記憶をもとにレイアウトによりクラスタを指定して絞込み検索する際の検索動作を制御するCPU102の処理の制御手順を示すフローチャート図である。
まずステップS601において、ユーザが操作部106の入力キーを操作して検索処理を指示する入力を行うことに応じて、大容量記憶装置101に蓄積されている文書画像データの検索処理を開始する。
次にステップS602において、図4の16通りのレイアウト代表画像400を表示手段である表示部103に一覧表示させる。
次にステップS603において、ユーザは、自分の検索したい文書画像のページのテキスト部とそれ以外の画像部とのレイアウトがステップS602で表示された16通りのレイアウト代表画像400のレイアウトの内のどれに最も近いかを判断する。そして操作部106のカーソルキー501や決定キー502(図5参照)などを用いて、最も近いと判断したレイアウト代表画像を選択して指定する指定入力を行う。これにより、ユーザが検索したい文書のページ画像のレイアウトによってそのページの画像データが所属するクラスタが間接的に指定されることになる。
次にステップS604において、CPU102は、上記レイアウト代表画像の指定によって指定されたクラスタに所属するページの画像データを検索する。すなわち、まず大容量記憶装置101に保存されている各ページの文書画像のページレイアウトクラスタの数値データの内でステップS603でユーザが選択したレイアウト代表画像のクラスタの数値と同じものを検索する。そして検索されたページレイアウトクラスタの数値データに関連付けて保存されている1ないし複数ページの文書画像データを検索して読み出す。
次に、ステップS605において、ステップS604で読み出した1ないし複数ページの画像データを、表示部103に出力して、そのページの画像を表示させ、その後、処理を終了する。
ユーザは、表示された1ないし複数ページの画像データの画像を見て、所望のページの画像データを選択し、プリントアウトさせるなどの操作を行う。検索されたページの数が多くて必要なら、読み出された多数のページの画像データに対し、別の手法でさらに絞り込み検索を行なわせる操作を行う。
以上のように、本実施例の画像検索装置によれば、ユーザが所望の文書画像データを検索しようとする際に、複数ページのレイアウト代表画像が表示される。そして、ユーザは、表示された複数ページのレイアウト代表画像の内で、テキストまたは空白の領域とそれ以外の画像の領域のレイアウトが、記憶している検索したい文書のページのレイアウトに最も近いものを選択して指定するだけで検索処理が実行される。したがって、ユーザが検索したい文書画像のページのレイアウトの記憶を利用して、検索を極めて簡便な操作で効率よく行なうことができる。
以上説明した実施例では、レイアウト代表画像の数、すなわちページの画像のレイアウトによるクラスタの数は16としたが、これに限らないことは勿論である。またレイアウト代表画像のレイアウトのパターンも図4に示したものに限らないことは勿論である。
本発明の実施例における画像検索装置の構成を示すブロック図である。 実施例の画像検索装置において入力された1ページの文書画像データを登録して保存する動作の制御手順を示すフローチャート図である。 実施例の画像検索装置において文書画像データを登録する際に行うレイアウト解析を説明する説明図である。 実施例の画像検索装置において文書画像データをテキスト領域とそれ以外の画像領域のレイアウトによってクラスタリングする場合の各クラスタのレイアウト代表画像を示した説明図である。 実施例の画像検索装置に新たに1ページの文書画像データを登録する際に、そのレイアウトが該当するクラスタのレイアウト代表画像を表示部に表示した様子を表す説明図である。 実施例の画像検索装置における文書画像データのレイアウトによる検索動作の制御手順を示すフローチャート図である。
符号の説明
101 大容量記憶装置
102 CPU
103 ROM
104 RAM
105 表示部
106 操作部
107 画像入力部
108 プリンタ
109 バス
301 1ページの文書画像
400 レイアウト代表画像
501 カーソルキー
502 決定キー

Claims (9)

  1. 文書画像データを入力する画像入力手段と、
    入力された文書画像データを蓄積して保存するための記憶手段と、
    入力された文書画像データの各ページについて該ページの画像に含まれる画像の属性に応じて複数の領域に分割し、それぞれの領域のレイアウト情報を生成するレイアウト解析手段と、
    入力された各ページの画像データと、前記レイアウト解析手段により生成された各ページのレイアウト情報を関連付けて前記記憶手段に保存する手段と、
    前記記憶手段に保存された各ページの画像データを該画像データに関連付けて保存されたレイアウト情報に基づいて複数のクラスタのいずれかに所属するように分類するクラスタリング処理手段と、
    ユーザが検索したい文書画像データのページのレイアウトによって該ページの画像データが所属するクラスタを指定するための入力を行う指定入力手段と、
    該指定入力手段からの入力により指定されたクラスタに所属するページの画像データを前記記憶手段に蓄積して保存された文書画像データの内から検索して出力する検索手段を有することを特徴とする画像検索装置。
  2. 前記複数のクラスタのそれぞれにおける1ページの文書画像の代表的なレイアウトを示す複数のレイアウト画像を表示する表示手段を有し、
    ユーザが前記指定入力手段によって前記表示手段に表示された前記複数のレイアウト画像のいずれかを選択して指定することにより、ユーザが検索したいページの画像データが所属するクラスタが指定されることを特徴とする請求項1に記載の画像検索装置。
  3. 前記クラスタリング処理手段が1ページの画像データを複数のクラスタのいずれかに所属するように分類した後に、該1ページの画像データの所属するクラスタをユーザに通知する情報を出力する出力手段を有することを特徴とする請求項1に記載の画像検索装置。
  4. 前記出力手段は、前記1ページの画像データの所属するクラスタにおける1ページの文書画像の代表的なレイアウトを示すレイアウト画像を表示する表示手段であることを特徴とする請求項3に記載の画像検索装置。
  5. 文書画像データを入力する画像入力工程と、
    入力された文書画像データの各ページについて該ページの画像に含まれる画像の属性に応じて複数の領域に分割し、それぞれの領域のレイアウト情報を生成するレイアウト解析工程と、
    入力された各ページの画像データと、前記レイアウト解析工程で生成された各ページのレイアウト情報を関連付けて記憶手段に保存する工程と、
    前記記憶手段に保存された各ページの画像データを該画像データに関連付けて保存されたレイアウト情報に基づいて複数のクラスタのいずれかに所属するように分類するクラスタリング処理工程と、
    ユーザが検索したい文書画像データのページのレイアウトによって該ページの画像データが所属するクラスタを指定するための入力を行う指定入力工程と、
    該指定入力工程での入力により指定されたクラスタに所属するページの画像データを前記記憶手段に蓄積して保存された文書画像データの内から検索して出力する検索工程を実行することを特徴とする画像検索装置の画像検索方法。
  6. 前記指定入力工程では、前記複数のクラスタのそれぞれにおける1ページの文書画像の代表的なレイアウトを示す複数のレイアウト画像を表示手段に表示し、ユーザが表示された前記複数のレイアウト画像のいずれかを選択して指定することにより、ユーザが検索したいページの画像データが所属するクラスタが指定されることを特徴とする請求項5に記載の画像検索装置の画像検索方法。
  7. 前記クラスタリング処理工程で1ページの画像データが複数のクラスタのいずれかに所属するように分類された後に、該1ページの画像データの所属するクラスタをユーザに通知する情報を出力するクラスタの通知工程を実行することを特徴とする請求項5に記載の画像検索装置の画像検索方法。
  8. 前記クラスタの通知工程では、前記1ページの画像データの所属するクラスタにおける1ページの文書画像の代表的なレイアウトを示すレイアウト画像を表示手段に表示することを特徴とする請求項7に記載の画像検索装置の画像検索方法。
  9. 画像検索装置の動作を制御する制御手段が請求項5から8までのいずれか1項に記載の画像検索装置の画像検索方法による動作を実行するように制御するための制御手順を含むことを特徴とする画像検索装置の制御プログラム。
JP2007078107A 2007-03-26 2007-03-26 画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム Pending JP2008242543A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007078107A JP2008242543A (ja) 2007-03-26 2007-03-26 画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム
US12/049,016 US20080244384A1 (en) 2007-03-26 2008-03-14 Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007078107A JP2008242543A (ja) 2007-03-26 2007-03-26 画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム

Publications (2)

Publication Number Publication Date
JP2008242543A true JP2008242543A (ja) 2008-10-09
JP2008242543A5 JP2008242543A5 (ja) 2010-05-13

Family

ID=39796422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007078107A Pending JP2008242543A (ja) 2007-03-26 2007-03-26 画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム

Country Status (2)

Country Link
US (1) US20080244384A1 (ja)
JP (1) JP2008242543A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017094202A1 (ja) * 2015-12-01 2017-06-08 アイマトリックス株式会社 画像処理を応用した文書構造解析装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5222126B2 (ja) * 2008-12-25 2013-06-26 キヤノン株式会社 画像処理方法、画像処理装置及びプログラム
CN101930444A (zh) * 2009-06-18 2010-12-29 鸿富锦精密工业(深圳)有限公司 影像搜寻系统及方法
JP5743443B2 (ja) * 2010-07-08 2015-07-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US8687886B2 (en) 2011-12-29 2014-04-01 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for document image indexing and retrieval using multi-level document image structure and local features
KR102013240B1 (ko) * 2012-02-02 2019-08-22 삼성전자주식회사 영역별 특성에 기초한 영상 부호화 방법 및 그 장치, 그리고 영상 복호화 방법 및 그 장치
US10372981B1 (en) * 2015-09-23 2019-08-06 Evernote Corporation Fast identification of text intensive pages from photographs
US11438477B2 (en) * 2020-01-16 2022-09-06 Fujifilm Business Innovation Corp. Information processing device, information processing system and computer readable medium
US11361025B2 (en) * 2020-02-03 2022-06-14 ZenPayroll, Inc. Automated field placement for uploaded documents

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259669A (ja) * 1999-03-12 2000-09-22 Ntt Data Corp 文書分類装置及びその方法
JP2004192121A (ja) * 2002-12-09 2004-07-08 Seiko Epson Corp 画像検索装置、画像分類方法、画像検索方法、及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5907835A (en) * 1994-11-18 1999-05-25 Canon Kabushiki Kaisha Electronic filing system using different application program for processing drawing commands for printing
US5848186A (en) * 1995-08-11 1998-12-08 Canon Kabushiki Kaisha Feature extraction system for identifying text within a table image
US5933823A (en) * 1996-03-01 1999-08-03 Ricoh Company Limited Image database browsing and query using texture analysis
US5999664A (en) * 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
US6562077B2 (en) * 1997-11-14 2003-05-13 Xerox Corporation Sorting image segments into clusters based on a distance measurement
US6970267B1 (en) * 2001-01-12 2005-11-29 Scan-Optics Inc. Gray scale optical mark reader
US7715640B2 (en) * 2002-11-05 2010-05-11 Konica Minolta Business Technologies, Inc. Image processing device, image processing method, image processing program and computer-readable recording medium on which the program is recorded
US7324711B2 (en) * 2004-02-26 2008-01-29 Xerox Corporation Method for automated image indexing and retrieval
JP2005352696A (ja) * 2004-06-09 2005-12-22 Canon Inc 画像処理装置及びその制御方法、プログラム
JP4510535B2 (ja) * 2004-06-24 2010-07-28 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259669A (ja) * 1999-03-12 2000-09-22 Ntt Data Corp 文書分類装置及びその方法
JP2004192121A (ja) * 2002-12-09 2004-07-08 Seiko Epson Corp 画像検索装置、画像分類方法、画像検索方法、及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017094202A1 (ja) * 2015-12-01 2017-06-08 アイマトリックス株式会社 画像処理を応用した文書構造解析装置
JPWO2017094202A1 (ja) * 2015-12-01 2017-11-30 アイマトリックス株式会社 画像処理を応用した文書構造解析装置
US10163005B2 (en) 2015-12-01 2018-12-25 Imatrix Corp. Document structure analysis device with image processing

Also Published As

Publication number Publication date
US20080244384A1 (en) 2008-10-02

Similar Documents

Publication Publication Date Title
JP2008242543A (ja) 画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム
JP5033580B2 (ja) 画像処理装置及び画像処理方法
JP3694149B2 (ja) 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2816241B2 (ja) 画像情報検索装置
JP4181892B2 (ja) 画像処理方法
EP0555027B1 (en) Information processing apparatus and method utilising useful additional information packet
CN101419612B (zh) 图像处理设备和图像处理方法
US7610274B2 (en) Method, apparatus, and program for retrieving data
US20090110288A1 (en) Document processing apparatus and document processing method
EP1993064A2 (en) Image processing apparatus and image retrieval method
JPWO2007004519A1 (ja) 検索システム及び検索方法
JP4111198B2 (ja) 画像検索システム、画像検索プログラムおよび記憶媒体、並びに画像検索方法
JPH0314184A (ja) 文書画像再配置ファイリング装置
US8400466B2 (en) Image retrieval apparatus, image retrieving method, and storage medium for performing the image retrieving method in the image retrieval apparatus
JP2002183166A (ja) ドキュメントファイリングシステムおよび方法
JP4261988B2 (ja) 画像処理装置及び方法
JPH10254901A (ja) 画像検索方法および装置
JP2005234790A (ja) 手書き帳票処理システム、手書き帳票処理方法
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP7160432B2 (ja) 画像処理装置、画像処理方法、プログラム
JPH10162024A (ja) 電子ファイリング方法及び電子ファイリング装置
JP2006252525A (ja) 文書ファイル管理装置、文書ファイル管理方法、および文書ファイル管理プログラム
JPH10340272A (ja) 類似画像検索装置及び方法
JP2001101213A (ja) 情報処理装置、ドキュメント管理装置、情報処理システム、情報管理方法、及び記憶媒体
JP2007048057A (ja) 画像処理装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100325

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100325

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120605