JP2001319231A - Device and method for processing image, and recording medium - Google Patents

Device and method for processing image, and recording medium

Info

Publication number
JP2001319231A
JP2001319231A JP2000136158A JP2000136158A JP2001319231A JP 2001319231 A JP2001319231 A JP 2001319231A JP 2000136158 A JP2000136158 A JP 2000136158A JP 2000136158 A JP2000136158 A JP 2000136158A JP 2001319231 A JP2001319231 A JP 2001319231A
Authority
JP
Japan
Prior art keywords
image
search
registered
area
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000136158A
Other languages
Japanese (ja)
Other versions
JP3937687B2 (en
Inventor
Masami Hisagai
正己 久貝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000136158A priority Critical patent/JP3937687B2/en
Publication of JP2001319231A publication Critical patent/JP2001319231A/en
Application granted granted Critical
Publication of JP3937687B2 publication Critical patent/JP3937687B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To suitably retrieve an image approximate to or coincident with a new image in an image database and to prevent double registration in the image database. SOLUTION: With respect to an image to be registered, an area dividing processing is executed (step S202) and a registered image having the coincident number of divided areas is retrieved. Besides, narrowing based on a distance between images is performed as needed (steps S204 and S205). Finally, when there is the coincident or approximate registered image, any image is not newly registered (step S206).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、画像の処理に関
し、特に、画像のファイリング及びファイリングされた
画像の検索に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to image processing, and more particularly, to filing an image and retrieving the filed image.

【0002】[0002]

【従来の技術】従来、文書等を含む画像を蓄積するイメ
ージファイリングシステムにおいては、イメージスキャ
ナで取り込んだ画像に検索用のキーワードのインデック
スを付加して蓄積し、検索時の便宜を図っていた。
2. Description of the Related Art Conventionally, in an image filing system for storing an image including a document or the like, an image captured by an image scanner is added with an index of a keyword for search and stored, thereby facilitating a search.

【0003】[0003]

【発明が解決しようとする課題】しかし、従来のファイ
リングシステムにおいては、新たに登録しようとする画
像が、既に登録、蓄積された登録画像と二重に登録され
ないようにするためには、蓄積してある登録画像を、キ
ーワード検索したり、すべての登録画像を一覧表示する
などして手作業で探し出し、新たに登録しようとする画
像との一致を人間が目でみて確認しなければならなず、
手間がかかった。このため、二重登録を許してしまうよ
うな事態も生じていた。
However, in the conventional filing system, in order to prevent the newly registered image from being registered twice with the already registered and stored registered image, it is necessary to store the newly registered image. The registered images must be searched manually by keyword search or by displaying a list of all registered images, and humans must visually confirm that they match the images to be newly registered. ,
It took time. For this reason, a situation has arisen in which double registration is permitted.

【0004】すなわち、従来のファイリングシステムに
おいては、新たな画像と近似するか又は一致する登録画
像の検索機能が、ユーザにおいて使い勝手のよいもので
はなかった。
That is, in the conventional filing system, the function of searching for a registered image that approximates or matches a new image is not user-friendly.

【0005】従って、本発明の目的は、新たな画像と近
似するか又は一致する画像を好適に検索し、また、ひい
て、二重登録を防止し得る画像処理装置及び画像処理方
法、記録媒体を提供することにある。
Accordingly, an object of the present invention is to provide an image processing apparatus, an image processing method, and a recording medium capable of suitably searching for an image that is close to or coincident with a new image, and preventing double registration. Is to provide.

【0006】[0006]

【課題を解決するための手段】本発明によれば、与えら
れた画像を登録画像として保存する画像処理装置であっ
て、与えられた画像に対して、領域分割処理を実行し、
少なくとも分割した領域の数を算出する処理手段と、前
記画像と近似するか又は一致する前記登録画像を検索す
る検索手段と、前記画像を前記登録画像として保存する
か否かを判定する判定手段と、登録画像として保存する
と判定された前記画像を、前記処理手段により得られた
領域の数と共に保存する保存手段と、を備え、前記判定
手段は、前記検索手段により、前記画像と近似するか又
は一致する前記登録画像が検索された場合には、該画像
を前記登録画像として保存しないと判定し、前記検索手
段は、前記画像の前記領域の数と、前記領域の数が一致
する前記登録画像を第1の検索候補として検索すること
を特徴とする画像処理装置が提供される。
According to the present invention, there is provided an image processing apparatus for storing a given image as a registered image, wherein the image processing apparatus performs a region dividing process on the given image.
Processing means for calculating at least the number of divided areas; search means for searching for the registered image that is similar or identical to the image; and determining means for determining whether to save the image as the registered image. A storage unit for storing the image determined to be stored as a registered image, together with the number of regions obtained by the processing unit, wherein the determination unit approximates the image by the search unit or When the matching registered image is searched, it is determined that the image is not stored as the registered image, and the search unit determines that the number of the areas of the image matches the number of the areas. Is searched as a first search candidate.

【0007】また、本発明によれば、予め登録された登
録画像の中から、与えられた画像に近似又は一致する画
像を検索する画像処理装置であって、前記登録画像を、
該画像に対して領域分割処理を実行することにより得ら
れた領域の数と共に記録した記録手段と、与えられた画
像に対して、領域分割処理を実行し、少なくとも分割し
た領域の数を算出する処理手段と、与えられた前記画像
について前記処理手段により得られた領域の数と、領域
の数が一致する前記登録画像を第1の検索候補として検
索する検索手段と、を備えたことを特徴とする画像処理
装置が提供される。
Further, according to the present invention, there is provided an image processing apparatus for retrieving an image that is similar or identical to a given image from registered images registered in advance.
A recording unit that records the number of areas obtained by executing the area division processing on the image, and executes the area division processing on the given image to calculate at least the number of divided areas Processing means; and a search means for searching, as a first search candidate, the registered image in which the number of areas obtained by the processing means for the given image matches the number of areas, as a first search candidate. Is provided.

【0008】また、本発明によれば、与えられた画像を
登録画像として保存する画像処理方法であって、与えら
れた画像に対して、領域分割処理を実行し、少なくとも
分割した領域の数を算出する処理工程と、前記画像と近
似するか又は一致する前記登録画像を検索する検索工程
と、前記画像を前記登録画像として保存するか否かを判
定する判定工程と、登録画像として保存すると判定され
た前記画像を、前記処理工程において得られた領域の数
と共に保存する保存工程と、を含み、前記判定工程で
は、前記検索工程において、前記画像と近似するか又は
一致する前記登録画像が検索された場合には、該画像を
前記登録画像として保存しないと判定し、前記検索工程
では、前記画像の前記領域の数と、前記領域の数が一致
する前記登録画像を第1の検索候補として検索すること
を特徴とする画像処理方法が提供される。
Further, according to the present invention, there is provided an image processing method for storing a given image as a registered image, wherein a region dividing process is performed on the given image and at least the number of divided regions is determined. A calculating step, a search step of searching for the registered image that approximates or matches the image, a determining step of determining whether to save the image as the registered image, and a determination of saving as the registered image And storing the obtained image together with the number of regions obtained in the processing step. In the determining step, in the searching step, the registered image that approximates or matches the image is searched. If it is determined that the image is not stored as the registered image, in the search step, the number of the region of the image and the registered image in which the number of the region matches the registered image Image processing method characterized by retrieving a first search candidates is provided.

【0009】また、本発明によれば、予め登録された登
録画像の中から、与えられた画像に近似又は一致する画
像を検索する画像処理方法であって、前記登録画像を、
該画像に対して領域分割処理を実行することにより得ら
れた領域の数と共に記録した記録工程と、与えられた画
像に対して、領域分割処理を実行し、少なくとも分割し
た領域の数を算出する処理工程と、与えられた前記画像
について前記処理工程において得られた領域の数と、領
域の数が一致する前記登録画像を第1の検索候補として
検索する検索工程と、を含むことを特徴とする画像処理
方法が提供される。
Further, according to the present invention, there is provided an image processing method for retrieving an image which is similar or identical to a given image from registered images registered in advance.
A recording step in which the image is recorded together with the number of areas obtained by executing the area division processing; and executing the area division processing on the given image to calculate at least the number of divided areas. A processing step; and a search step of searching, as a first search candidate, the number of areas obtained in the processing step for the given image and the registered image having the same number of areas as a first search candidate. An image processing method is provided.

【0010】また、本発明によれば、与えられた画像を
登録画像として保存するために、コンピュータを、与え
られた画像に対して、領域分割処理を実行し、少なくと
も分割した領域の数を算出する処理手段、前記画像と近
似するか又は一致する前記登録画像を検索する検索手
段、前記画像を前記登録画像として保存するか否かを判
定する判定手段、登録画像として保存すると判定された
前記画像を、前記処理手段により得られた領域の数と共
に保存する保存手段、として機能させるプログラムを記
録した記録媒体であって、前記判定手段は、前記検索手
段により、前記画像と近似するか又は一致する前記登録
画像が検索された場合には、該画像を前記登録画像とし
て保存しないと判定し、前記検索手段は、前記画像の前
記領域の数と、前記領域の数が一致する前記登録画像を
第1の検索候補として検索することを特徴とする記録媒
体が提供される。
According to the present invention, in order to store a given image as a registered image, a computer executes a region dividing process on the given image and calculates at least the number of divided regions. Processing means for performing the search, a search means for searching for the registered image that approximates or matches the image, a determination means for determining whether to save the image as the registered image, and the image determined to be stored as the registered image Is a storage medium storing a program functioning as a storage unit for storing the number of regions obtained by the processing unit, wherein the determination unit approximates or matches the image by the search unit. When the registered image is searched, it is determined that the image is not stored as the registered image, and the search unit determines the number of the areas of the image, Recording medium characterized by retrieving the registered image number of frequency matches the first search suggestions are provided.

【0011】また、本発明によれば、予め登録された登
録画像の中から、与えられた画像に近似又は一致する画
像を検索するために、コンピュータを、前記登録画像
を、該画像に対して領域分割処理を実行することにより
得られた領域の数と共に記録した記録手段、与えられた
画像に対して、領域分割処理を実行し、少なくとも分割
した領域の数を算出する処理手段、与えられた前記画像
について前記処理手段により得られた領域の数と、領域
の数が一致する前記登録画像を第1の検索候補として検
索する検索手段、として機能させるプログラムを記録し
た記録媒体が提供される。
Further, according to the present invention, in order to search for an image that is similar or identical to a given image from registered images registered in advance, a computer is used to search the registered image for the image. A recording unit that records the number of areas obtained by executing the area division processing, a processing unit that executes the area division processing on a given image, and calculates at least the number of divided areas, A recording medium is provided which records a program functioning as a search unit for searching, as a first search candidate, the registered image having the same number of regions as the number of regions obtained by the processing unit with respect to the image.

【0012】[0012]

【発明の実施の形態】以下、本発明の好適な実施の形態
について、添付図面を参照して説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of the present invention will be described below with reference to the accompanying drawings.

【0013】図6は、本発明の一実施形態に係るイメー
ジファイリングシステムが実現されるハードウェアの一
例を示した図である。図6に示すように、本システム
は、一般的なコンピュータシステム上で実現可能であ
る。
FIG. 6 is a diagram showing an example of hardware for realizing the image filing system according to one embodiment of the present invention. As shown in FIG. 6, the present system can be realized on a general computer system.

【0014】図6において、600はアドレス信号を伝
えたり、データを伝達させるバス、601は制御を行う
CPU、602はBIOSやOSをブートするためのプ
ログラムを記憶するROM、603はOSや各種プログ
ラムをロードしたり作業領域に使用するRAMである。
In FIG. 6, reference numeral 600 denotes a bus for transmitting address signals and data, 601 a CPU for control, 602 a ROM for storing a program for booting a BIOS or an OS, and 603 for an OS or various programs. Is a RAM used for loading a file and a work area.

【0015】また、604は画像データベースを蓄積し
たり、OSや各種プログラムを記憶したり、あるいは作
業データの一時ファイルを記憶する外部記憶装置、60
5は、文書画像や各種メッセージなどを表示するディス
プレイ、606はイメージスキャナインターフェースで
あり、607は文書を読み込み文書画像にするイメージ
スキャナである。
An external storage device 604 stores an image database, stores an OS and various programs, or stores a temporary file of work data.
Reference numeral 5 denotes a display for displaying a document image, various messages, and the like. Reference numeral 606 denotes an image scanner interface. Reference numeral 607 denotes an image scanner that reads a document and converts it into a document image.

【0016】図1は、新たな画像の登録処理を説明する
フローチャートである。以下、本実施形態において、説
明の便宜上、新たに登録するために与えられた画像を入
力画像と称し、既に登録され、蓄積された画像を登録画
像と称する。
FIG. 1 is a flowchart for explaining a new image registration process. Hereinafter, in the present embodiment, for convenience of explanation, an image provided for new registration is referred to as an input image, and an image that has been registered and stored is referred to as a registered image.

【0017】入力画像は、例えば、イメージスキャナ6
07によって文書等が読み込まれ、カラー画像、また
は、白黒多値画像または二値画像として外部記憶装置6
04等に記憶される。
The input image is, for example, an image scanner 6
07, a document or the like is read and stored as a color image or a monochrome multi-valued image or a binary image in the external storage device 6.
04 or the like.

【0018】また、入力画像は、アプリケーションソフ
トで作られた文書データをビットマップ形式等の画像に
変換することによっても得られる。
The input image can also be obtained by converting document data created by application software into an image in a bitmap format or the like.

【0019】図8は、アプリケーションソフトで作られ
た文書データの場合、それをビットマップ形式の画像に
変換するステップを説明している。
FIG. 8 illustrates steps for converting document data created by application software into a bitmap image.

【0020】ステップS802では、入力された文書デ
ータを(ステップS801)、ワープロソフト等のアプ
リケーションソフト(例えばMicrosoft社のWord、一太
郎:共に登録商標)がGDI形式803に変換する(ス
テップS803)。
In step S802, the input document data (step S801) is converted into a GDI format 803 by application software such as word processing software (for example, Microsoft Word, Ichitaro: both are registered trademarks) (step S803).

【0021】そして、ステップS804では、プリンタ
ドライバないしFAXドライバなどが、ビットマップ形
式の画像に変換する(ステップS805)。
In step S804, the printer driver or facsimile driver converts the image into a bitmap image (step S805).

【0022】次に、図1に戻り、ステップS101で
は、入力画像に対して領域分割処理を実行する。領域分
割処理とは、画像を、その内容の種別に従ったブロック
(領域)に分割する処理である。例えば、画像中のテキ
スト部分、イメージ部分、表部分等の種別に従ったブロ
ックに分割する処理である。このような領域分割処理の
具体的内容は種々提案されており、例えば、特開平06
−068301号公報等において開示されている。
Next, returning to FIG. 1, in step S101, a region dividing process is performed on the input image. The region dividing process is a process of dividing an image into blocks (regions) according to the type of the content. For example, it is a process of dividing the image into blocks according to types such as a text portion, an image portion, and a table portion. Various specific contents of such a region dividing process have been proposed.
-068301 and the like.

【0023】図7は、領域分割処理を行った一例を示す
図である。図7において、701は画像全体、702,
703,704は、テキストブロック、705,706
はイメージブロックを示している。なお、ブロック70
3と704の中の太線は文字列を簡略化して表したもの
である。図7の例では、ブロックの種類を、テキストと
イメージとの二種類に分けているが、ブロックの種類を
もっと多くの種類に細分してもよいことはいうまでもな
い。
FIG. 7 is a diagram showing an example of the area division processing. In FIG. 7, reference numeral 701 denotes an entire image;
703 and 704 are text blocks, 705 and 706
Indicates an image block. Note that block 70
The bold lines in 3 and 704 represent simplified character strings. In the example of FIG. 7, the types of blocks are divided into two types, that is, text and images. However, it goes without saying that the types of blocks may be subdivided into more types.

【0024】入力画像を領域分割した結果は、図1の1
1のブロック情報としてRAM603に記憶される。図
4はこのブロック情報を説明した図である。
The result of area division of the input image is shown in FIG.
It is stored in the RAM 603 as one block information. FIG. 4 is a diagram illustrating this block information.

【0025】ブロック情報は、ブロック情報ヘッダと、
領域分割された各ブロックのブロック情報データ1〜ブ
ロック情報データnからなる。
The block information includes a block information header,
It consists of block information data 1 to block information data n of each of the divided blocks.

【0026】ブロック情報ヘッダには、例えば、総ブロ
ック数、テキストブロック数、イメージブロック数、判
別不能なブロック数、に係る情報が含まれる。また、各
ブロック情報データには、例えば、ブロックID、ブロ
ック種別、ブロックの座標情報、ブロックの横幅、ブロ
ックの高さ、に係る情報が含まれる。なお、本実施形態
では、ブロックの座標情報として、ブロックの中心の座
標を用いるが、中心以外の座標(例えば、ブロック左上
頂点の座標)を用いてもよい。図4の下方に示したプロ
グラムは、ブロック情報ヘッダ及びブロック情報データ
の内容についてC言語で記述したプログラムの例を示し
ている。
The block information header includes, for example, information on the total number of blocks, the number of text blocks, the number of image blocks, and the number of indistinguishable blocks. In addition, each block information data includes, for example, information relating to a block ID, a block type, block coordinate information, a block width, and a block height. In the present embodiment, the coordinates of the center of the block are used as the coordinate information of the block, but coordinates other than the center (for example, the coordinates of the upper left vertex of the block) may be used. The program shown in the lower part of FIG. 4 is an example of a program in which the contents of a block information header and block information data are described in C language.

【0027】以下、領域分割してできる各ブロックを、
B1,B2,B3,…,Bnとする。上述した通り、ブ
ロックは、テキストブロックとイメージブロックに区別
され、また、ブロックBiの中心座標をCX(Bi),CY
(Bi)とする。
In the following, each block obtained by dividing the area is represented by
B1, B2, B3,..., Bn. As described above, blocks are classified into text blocks and image blocks, and the center coordinates of the block Bi are represented by CX (Bi) and CY.
(Bi).

【0028】そして、テキストブロックを、その中心座
標CX(Bi)を第1キー、その中心座標CY(Bi)を第2
キーとしてソートする。ソートされた結果のテキストブ
ロックをTB1,TB2,…,TBmとする。
Then, the text block has its center coordinate CX (Bi) as the first key and its center coordinate CY (Bi) as the second key.
Sort as key. Assume that the sorted text blocks are TB1, TB2,..., TBm.

【0029】同様にイメージブロックをソートし、ソー
トされた結果を、IB1,IB2,…,IBkとする。
図4のブロック情報データには、テキストブロックをT
B1,TB2,…,TBm、イメージブロックIB1,
IB2,…,Ibkの順に記録される。
Similarly, the image blocks are sorted, and the sorted results are IB1, IB2,..., IBk.
The block information data of FIG.
B1, TB2,..., TBm, image block IB1,
IB2,..., Ibk.

【0030】そして、外部記憶装置604に蓄積、構成
されている画像データベースに、入力画像は登録画像と
してブロック情報11と対にして記憶保管されるととも
に、その記憶位置を一時的にRAM603に記憶する。
The input image is stored as a registered image in a pair with the block information 11 in an image database stored and configured in the external storage device 604, and the storage position is temporarily stored in the RAM 603. .

【0031】画像データベースには、図3で示されてい
るページテーブルが記憶されている。図3においてペー
ジIDは登録画像を一意的に決定できる番号であり、例
えば登録画像を登録した順番につけた順序番号である。
図3でm,kは、それぞれ各登録画像を領域分割して抽
出したテキストブロックの個数とイメージブロックの個
数とを示している。図において、インスタンスポインタ
は、対応する登録画像とブロック情報の対が記録されて
いる外部記憶装置604内の記録位置を示している。
A page table shown in FIG. 3 is stored in the image database. In FIG. 3, the page ID is a number that can uniquely determine a registered image, and is, for example, an order number assigned in the order in which the registered images are registered.
In FIG. 3, m and k indicate the number of text blocks and the number of image blocks extracted by dividing each registered image into regions. In the figure, the instance pointer indicates the recording position in the external storage device 604 where the pair of the corresponding registered image and block information is recorded.

【0032】ステップS102では、まず、今回登録し
た画像についてのページIDと,テキストブロック及び
イメージブロックの個数m+k,イメージブロックの個
数k、インスタンスポインタをページテーブルに追加記
録する。次に、ステップS103では、このテーブル
を、m+kを第1キー、kを第2キーとしてソートす
る。
In step S102, the page ID, the number m + k of text blocks and image blocks, the number k of image blocks, and the instance pointer of the image registered this time are additionally recorded in the page table. Next, in step S103, this table is sorted using m + k as a first key and k as a second key.

【0033】このようにして、入力画像は登録画像とし
て保存される。しかし、入力画像が既存の登録画像と同
一である場合には、二重登録を防止する必要がある。ま
た、既存の登録画像と著しく近似する場合は、ユーザに
おいてその登録を希望しない場合もある。そこで、本シ
ステムでは、図2のフローチャートに従って二重登録を
防止する登録処理がなされる。
As described above, the input image is stored as a registered image. However, if the input image is the same as the existing registered image, it is necessary to prevent double registration. Further, when the registered image is very similar to the existing registered image, the user may not wish to register the image. Therefore, in the present system, registration processing for preventing double registration is performed according to the flowchart of FIG.

【0034】ステップS202では、入力画像に対し
て、領域分割処理を実行する。この処理は、図1の場合
と同じである。その結果、図4に示すようなブロック情
報が得られる。
In step S202, a region dividing process is performed on the input image. This process is the same as in FIG. As a result, block information as shown in FIG. 4 is obtained.

【0035】ステップS203では、入力画像のテキス
トブロック数m、イメージブロック数kとから、総ブロ
ック数m+k=nを計算し、ページテーブルを参照して
総ブロック数nと一致する登録画像を第1の検索候補と
して絞り込みを行う。なお、第1の検索候補が一つしか
ない場合等には、これを最終的な候補としてもよい。
In step S203, the total number of blocks m + k = n is calculated from the number of text blocks m and the number of image blocks k of the input image, and the registered image which matches the total number of blocks n is referred to by referring to the page table. Refine as search candidates for. If there is only one first search candidate, this may be the final candidate.

【0036】ステップS204では、これら第1の検索
候補の各登録画像と入力画像との間の一致度を求める。
本実施形態では、各登録画像と入力画像との一致度とし
て、各ブロックの大きさ、位置に基づき、両者の距離を
求める。ここでは、登録画像と入力画像との距離を以下
のようにして求める。
In step S204, the degree of coincidence between each registered image of the first search candidates and the input image is determined.
In the present embodiment, the distance between each registered image and the input image is determined based on the size and position of each block. Here, the distance between the registered image and the input image is obtained as follows.

【0037】入力画像について、上述した方法でソート
されたテキストブロックを、 TB’1,TB’2,…,TB’m’ イメージブロックを IB’1,IB’2,…,IB’k’ また、登録画像のテキストブロックを、 TB1,TB2,…TBm イメージブロックを IB1,IB2,…IBk とする。更に、テキストブロックTBiの幅、高さを、
W(TBi),H(TBi)、イメージブロックIBjの
幅、高さを、W(IBj),H(IBj)と表す。
With respect to the input image, the text blocks sorted by the above-described method are denoted by TB′1, TB′2,..., TB′m ′, and the image blocks are denoted by IB′1, IB′2,. , TB1, TB2,..., TBm, image blocks IB1, IB2,. Furthermore, the width and height of the text block TBi are
W (TBi), H (TBi) and the width and height of the image block IBj are represented as W (IBj) and H (IBj).

【0038】2つの画像の距離Dは、以下のように計算
される。
The distance D between two images is calculated as follows.

【0039】[0039]

【数1】 (Equation 1)

【0040】ここで、級数の項数mtは、 mt=min(m,m’) である。Here, the term mt of the series is mt = min (m, m ').

【0041】[0041]

【数2】 (Equation 2)

【0042】ここで、級数の項数kiは、 ki=min(k,k’) である。そして、 D=Dt+αDi として距離D(以下、第1識別関数と呼ぶ。)を計算す
る。ここで、αは画像の識別がもっともよくなるように
あらかじめ実験的に決めておいた定数である。一般に、
テキストブロックよりイメージブロックのほうが精度よ
く求められると考えられるので、例えば、経験的に2ぐ
らいの値にしておいてもよい。つまり、DiのほうがDt
よりも識別に有効に働くわけである。
Here, the term number ki of the series is as follows: ki = min (k, k '). Then, a distance D (hereinafter, referred to as a first identification function) is calculated as D = Dt + αDi. Here, α is a constant which is experimentally determined in advance so that the image can be identified best. In general,
Since it is considered that an image block is more accurately obtained than a text block, for example, a value of about 2 may be empirically set. In other words, Di is Dt
It works more effectively for identification.

【0043】このようにして、第1の検索候補に係る各
登録画像と入力画像との距離Dを求めたら、距離Dの小
さいほうからいくつかの登録画像を選ぶことにより、検
索候補を絞り込む。たとえば、距離Dの小さいほうから
3つだけを選ぶ、あるいは、第1検索候補の数がある割
合(たとえば1/5)に減るように距離Dの小さいほう
から選ぶことにより絞込みを行う。こうして絞り込みを
行い、第2の検索候補とする。この第2の検索候補の集
合をS2とする。
When the distance D between each registered image relating to the first search candidate and the input image is obtained in this way, the search candidates are narrowed down by selecting some registered images from the smaller distance D. For example, narrowing down is performed by selecting only three from the smaller distance D, or by selecting from the smaller distance D such that the number of first search candidates is reduced to a certain ratio (for example, 1/5). In this way, the search is narrowed down and set as a second search candidate. This set of second search candidates is defined as S2.

【0044】なお、この段階で、距離Dが最小な登録画
像を1つだけに絞り込み、これを最終候補としてもよ
い。
At this stage, the registered images having the minimum distance D may be narrowed down to only one, and this may be used as the final candidate.

【0045】次にステップS205では次のようにさら
に絞り込みを行う。
Next, in step S205, further narrowing down is performed as follows.

【0046】この集合S2のなかから、入力画像にもっ
とも近いものを以下のように選び出す。上記検索では、
双方の対応するブロックについて、ブロック位置とブロ
ックサイズを比較し、距離計算を行った。今度は、各対
応するブロックの中身の比較をして、さらに距離計算を
行う。それには、テキストブロック同士の比較とイメー
ジブロック同士の比較がある。入力画像と登録画像との
対応するテキストブロックをTXTB2,TXTBとす
る。対応付けは、ブロックの中心のX座標を第1キー、
Y座標を第2キーとしてソートした場合に同順位にある
ブロックを対応させることで行う。これらのテキストブ
ロックを2値化してOCR(光学的文字認識)を行えば
文字列が得られる。そしてTXTB2の文字列とTXT
Bの文字列をDPマッチング(Dynamic Programming:
動的計画法)の手法で比較することにより、 TXTB2にあって、TXTBにない文字の個数:n1 TXTB2になくて、TXTBにある文字の個数:n2 TXTB2とTXTBと対応する文字列が異なっている
文字の個数:n32,n3(n32は、TXTB2のほ
うの文字数、n3はTXTBのほうの文字数である) が求められる。DPマッチングは、例えば、情報科学講
座「音声認識」(新美康永著、共立出版)の107ペー
ジにも開示されている公知の技術である。
An image closest to the input image is selected from the set S2 as follows. In the above search,
For both corresponding blocks, the block position and the block size were compared to calculate the distance. This time, the contents of each corresponding block are compared, and further distance calculation is performed. There are comparisons between text blocks and comparisons between image blocks. Text blocks corresponding to the input image and the registered image are TXTB2 and TXTB. For the correspondence, the X coordinate of the center of the block is set to the first key,
This is performed by associating blocks having the same rank when sorting using the Y coordinate as the second key. A character string can be obtained by binarizing these text blocks and performing OCR (optical character recognition). And the character string of TXTB2 and TXT
DP matching of the character string of B (Dynamic Programming:
By dynamic programming), the number of characters in TXTB2 but not in TXTB: n1 The number of characters in TXTB but not in TXTB2: n2 The character strings corresponding to TXTB2 and TXTB differ. The number of characters present: n32, n3 (n32 is the number of characters in TXTB2, n3 is the number of characters in TXTB). DP matching is a known technique that is also disclosed, for example, on page 107 of the information science course “Speech Recognition” (written by Yasunaga Niimi, Kyoritsu Shuppan).

【0047】図5は、TXTB2とTXTBの各文字列
をDPマッチングした例の説明図である。図で各文字列
は太線で表されている。Eの部分は、文字列が一致した
部分、Xの部分は上記1(TXTB2にあって、TXT
Bにない文字)の部分、Yの部分は上記2(TXTB2
になくて、TXTBにある文字)の部分、Zの部分は上
記3(TXTB2とTXTBと対応する文字列が異なっ
ている文字)の部分である。
FIG. 5 is an explanatory diagram of an example in which each character string of TXTB2 and TXTB is DP-matched. In the figure, each character string is represented by a thick line. The part E is the part where the character strings match, and the part X is the above 1 (TXTB2, TXT
(The character not in B) and Y are the above 2 (TXTB2
, And the Z portion is the above 3 (a character in which the character string corresponding to TXTB2 and TXTB is different).

【0048】この結果、2つのテキストブロックTXT
B2とTXTBの距離を次のように計算できる。
As a result, two text blocks TXT
The distance between B2 and TXTB can be calculated as follows.

【0049】D(TXTB2,TXTB)=(n1+n
2+n32+n3)/NC ここで、NCはTXTB2の文字数とTXTBの文字数
の合計である。
D (TXTB2, TXTB) = (n1 + n
2 + n32 + n3) / NC Here, NC is the sum of the number of characters of TXTB2 and the number of characters of TXTB.

【0050】このようにして、対応するテキストブロッ
クについて距離が求まる。また、入力画像と登録画像と
の間で、テキストブロック数が一致しない場合も考えら
れる。たとえば、入力画像のほうがテキストブロック数
が多くて、TXTB2に対応する登録画像のテキストブ
ロックがないならば、距離は1となる。このようにし
て、すべてのテキストブロックについて求まった距離を
合計したものをテキストブロック距離と呼ぶことにす
る。
Thus, the distance is obtained for the corresponding text block. It is also conceivable that the number of text blocks does not match between the input image and the registered image. For example, if the input image has a larger number of text blocks and there is no text block of the registered image corresponding to TXTB2, the distance is 1. The sum of the distances obtained for all the text blocks in this way is called a text block distance.

【0051】今度は、イメージブロックについて入力画
像と登録画像との比較である。入力画像のイメージブロ
ックIMGB2と登録画像のイメージブロックIMGB
が対応するものとする。対応付けは、ブロックの中心の
X座標を第1キー、Y座標を第2キーとしてソートした
場合に同順位にあるブロックを対応させることで行う。
IMGB2を二値化してできる画像について、全画素数
に対する黒画素数の比(すなわち、黒画素数÷全画素
数)ratio(IMGB2)を求める。同様にして、ratio
(IMGB)を求める。
This time, comparison is made between the input image and the registered image for the image block. Image block IMGB2 of the input image and image block IMGB of the registered image
Shall correspond. The association is performed by associating blocks having the same rank when the X coordinate of the center of the block is sorted as the first key and the Y coordinate as the second key.
For an image obtained by binarizing IMGB2, the ratio of the number of black pixels to the total number of pixels (that is, the number of black pixels ÷ the number of all pixels) ratio (IMGB2) is determined. Similarly, ratio
(IMGB) is obtained.

【0052】 |ratio(IMGB2)−ratio(IMGB)| をIMGB2とIMGBとの距離とする。対応するイメ
ージブロックがない場合は、距離は最大値の1とする。
そして、全イメージブロックについての距離の合計値を
イメージブロック距離と呼ぶことにする。
| Ratio (IMGB2) −ratio (IMGB) | is the distance between IMGB2 and IMGB. If there is no corresponding image block, the distance is set to the maximum value of 1.
Then, the total value of the distances for all the image blocks is referred to as an image block distance.

【0053】さて、入力画像と登録画像との詳細識別距
離dを d=テキストブロック距離+β×イメージブロック距離 で求める。ここで、βは前に述べたαと同様で、イメー
ジブロック距離にかける重みづけファクターである。画
像の識別がうまくいくように実験的にβをもとめるのが
望ましいが、イメージブロックのほうがテキストブロッ
クよりも精度良く抽出できる(つまり信頼性が高い)の
で、おおまかに1より大きい値(たとえば2)にしても
よい。上記dを第2識別関数と呼ぶ。
Now, the detailed identification distance d between the input image and the registered image is obtained by d = text block distance + β × image block distance. Here, β is the same as α described above, and is a weighting factor applied to the image block distance. It is desirable to experimentally determine β so that the image can be identified well, but since the image block can be extracted with higher accuracy (that is, higher reliability) than the text block, it is roughly a value larger than 1 (for example, 2). It may be. The above d is referred to as a second identification function.

【0054】さて、集合S2のすべての登録画像と入力
画像との詳細識別距離dを求め、ステップS206で
は、最小の詳細識別距離d0について、所定の値δと比
較する。δよりd0が小さければ、このd0を与える集
合S2の登録画像を入力画像と一致する登録画像だと判
定する。
Now, the detailed identification distance d between all the registered images of the set S2 and the input image is obtained, and in step S206, the minimum detailed identification distance d0 is compared with a predetermined value δ. If d0 is smaller than δ, it is determined that the registered image of the set S2 giving d0 is a registered image that matches the input image.

【0055】ここで、δはあらかじめの実験で求める値
である。たとえば、ひとつの画像を条件を変えてイメー
ジスキャナで何回も読み込んでできる1000個の画像
のものと、ある条件で読み込んだ画像との詳細距離(1
000個ある)をもとめ、この1000個の数値の最大
値をδとする。
Here, δ is a value obtained by a preliminary experiment. For example, a detailed distance (1) between an image of 1000 images that can be read many times by an image scanner under different conditions and an image read under certain conditions
000), and the maximum value of the 1,000 numerical values is defined as δ.

【0056】ステップS206で一致するものがあれば
入力画像は画像データベースには登録しない。一致する
ものがなければ、ステップS207へ進む。
If there is a match in step S206, the input image is not registered in the image database. If there is no match, the process proceeds to step S207.

【0057】ステップS207は、図1で説明したS1
02からS103までの文書登録処理とまったく同じで
ある。
Step S207 is performed in step S1 described with reference to FIG.
This is exactly the same as the document registration process from 02 to S103.

【0058】以上、本発明の好適な実施形態について説
明したが、上述した第1及び第2識別関数は、登録画像
と入力画像との距離を計算するものとしたが、距離では
なく類似度を計算してもよい。例えば、距離の逆数を計
算すれば、すなわち類似度となることは明白である。識
別関数を類似度とした場合は、候補の選択は、類似度の
大きいものから順番に絞り込むことになる。
Although the preferred embodiment of the present invention has been described above, the first and second discriminant functions described above calculate the distance between the registered image and the input image. It may be calculated. For example, it is obvious that the reciprocal of the distance is calculated, that is, the similarity is obtained. When the similarity is used as the identification function, the selection of candidates is narrowed down in descending order of similarity.

【0059】また、上記実施形態は、画像の二重登録を
避けるためのものであったが、同様の処理を応用して他
の用途、例えば、画像検索装置としても用いることがで
きる。画像の検索を行う場合、入力画像に対してステッ
プS202乃至S206の処理を施すことにより、一致
する登録画像をデータベースから探し出すことができる
ので、その後、一致する登録画像を取り出す処理を行う
ことにより、画像検索が可能となる。
In the above embodiment, double registration of images is avoided. However, the same processing can be applied to other uses, for example, an image search device. When performing an image search, a matching registered image can be found from the database by performing the processing of steps S202 to S206 on the input image. Thereafter, by performing a process of extracting the matching registered image, Image search becomes possible.

【0060】たとえば、文書画像を検索したい場合、手
元に探し出したい文書画像とほとんど同じであるが、少
し違っている文書画像があり、原本の文書画像をデータ
ベースから取り出したいという用途がある。この場合、
データベースが前記実施形態のように構成されていれ
ば、手元にある文書画像ともっとも似通った文書画像の
検索を、手作業によらず、行うことができる。このよう
な用途としては、手元の文書画像は原本を何回もコピー
したものによるものであるために、印刷状態が悪くなっ
たものであった場合、原本から再び印刷状態の良好な文
書を取り出したいというケースがある。
For example, when a document image is to be searched, there is a document image which is almost the same as the document image to be found at hand, but is slightly different, and there is a use for extracting the original document image from the database. in this case,
If the database is configured as in the above embodiment, a search for a document image most similar to a document image at hand can be performed without manual work. In such an application, since the document image at hand is the result of copying the original multiple times, if the printing condition has deteriorated, a good-printed document must be extracted from the original again. There are cases where you want to.

【0061】なお、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
An object of the present invention is to supply a storage medium (or a recording medium) in which program codes of software for realizing the functions of the above-described embodiments are recorded to a system or an apparatus, and to provide a computer (a computer) of the system or the apparatus. It is needless to say that the present invention can also be achieved by a CPU or an MPU) reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention. Also,
When the computer executes the readout program code, not only the functions of the above-described embodiments are realized, but also the operating system (OS) running on the computer based on the instructions of the program code.
It goes without saying that a case where the functions of the above-described embodiments are implemented by performing some or all of the actual processing, and the processing performs the functions of the above-described embodiments.

【0062】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
Further, after the program code read from the storage medium is written in the memory provided in the function expansion card inserted into the computer or the function expansion unit connected to the computer, the program code is read based on the instruction of the program code. Needless to say, the CPU included in the function expansion card or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0063】[0063]

【発明の効果】以上、本発明によれば、新たな画像と近
似するか又は一致する画像を好適に検索し、また、ひい
て、二重登録を防止することができる。
As described above, according to the present invention, it is possible to suitably search for an image that is similar to or coincides with a new image, and to prevent double registration.

【図面の簡単な説明】[Brief description of the drawings]

【図1】新たな画像の登録処理を説明するフローチャー
トである。
FIG. 1 is a flowchart illustrating a registration process of a new image.

【図2】二重登録を防止しつつ新たな画像の登録処理を
説明するフローチャートである。
FIG. 2 is a flowchart illustrating a registration process of a new image while preventing double registration.

【図3】ページテーブルの説明図である。FIG. 3 is an explanatory diagram of a page table.

【図4】ブロック情報の説明図である。FIG. 4 is an explanatory diagram of block information.

【図5】テキストブロックのDPマッチングの説明図で
ある。
FIG. 5 is an explanatory diagram of DP matching of a text block.

【図6】本発明の一実施形態に係るイメージファイリン
グシステムが実現されるハードウェアの一例を示した図
である。
FIG. 6 is a diagram illustrating an example of hardware for realizing an image filing system according to an embodiment of the present invention.

【図7】領域分割処理を行った一例を示す図である。FIG. 7 is a diagram illustrating an example in which a region division process is performed.

【図8】文書データから入力画像を得る場合の処理のフ
ローチャートである。
FIG. 8 is a flowchart of a process for obtaining an input image from document data.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06K 9/20 340 G06K 9/20 340C G06T 1/00 200 G06T 1/00 200E 200D 7/40 100 7/40 100A 100C 7/60 110 7/60 110 Fターム(参考) 5B029 AA01 CC29 5B050 AA09 BA10 BA15 BA16 BA20 CA07 EA06 EA18 FA02 GA08 5B075 ND06 NR03 NR14 PR06 QM08 5L096 AA06 BA20 DA02 EA43 FA44 FA45 FA53 FA54 FA59 FA69 GA28 HA08 JA03 KA09 KA15──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G06K 9/20 340 G06K 9/20 340C G06T 1/00 200 G06T 1/00 200E 200D 7/40 100 7 / 40 100A 100C 7/60 110 7/60 110 F-term (reference) 5B029 AA01 CC29 5B050 AA09 BA10 BA15 BA16 BA20 CA07 EA06 EA18 FA02 GA08 5B075 ND06 NR03 NR14 PR06 QM08 5L096 AA06 BA20 DA02 EA43 FA44 FA03 FA53 FA53 FA53 FA53 KA09 KA15

Claims (30)

【特許請求の範囲】[Claims] 【請求項1】 与えられた画像を登録画像として保存す
る画像処理装置であって、 与えられた画像に対して、領域分割処理を実行し、少な
くとも分割した領域の数を算出する処理手段と、 前記画像と近似するか又は一致する前記登録画像を検索
する検索手段と、 前記画像を前記登録画像として保存するか否かを判定す
る判定手段と、 登録画像として保存すると判定された前記画像を、前記
処理手段により得られた領域の数と共に保存する保存手
段と、を備え、 前記判定手段は、前記検索手段により、前記画像と近似
するか又は一致する前記登録画像が検索された場合に
は、該画像を前記登録画像として保存しないと判定し、 前記検索手段は、前記画像の前記領域の数と、前記領域
の数が一致する前記登録画像を第1の検索候補として検
索することを特徴とする画像処理装置。
1. An image processing apparatus for storing a given image as a registered image, performing a region division process on the given image, and calculating at least the number of divided regions; A search unit that searches for the registered image that is similar to or coincides with the image; a determination unit that determines whether to save the image as the registered image; and the image that is determined to be stored as the registered image, Storage means for storing together with the number of regions obtained by the processing means, wherein the determination means, when the registered image that is close to or coincident with the image is searched by the search means, It is determined that the image is not stored as the registered image, and the search means searches for the registered image in which the number of the areas of the image matches the number of the areas as a first search candidate. An image processing apparatus, comprising:
【請求項2】 前記処理手段は、分割した各々の前記領
域の位置及び大きさをも算出し、 前記保存手段は、登録画像として保存すると判定された
前記画像を、前記処理手段により得られた領域の数、位
置及び大きさと共に保存し、 前記検索手段は、前記第1の検索候補が複数ある場合
に、更に、前記第1の検索候補のうち、前記画像の各前
記領域の位置及び大きさと、前記領域の位置及び大きさ
が近似する前記登録画像を第2の検索候補として検索す
ることを特徴とする請求項1に記載の画像処理装置。
2. The processing unit also calculates a position and a size of each of the divided areas, and the storage unit obtains the image determined to be stored as a registered image by the processing unit. When the plurality of first search candidates are present, the search means further stores the position and size of each of the regions in the image among the first search candidates. The image processing apparatus according to claim 1, wherein the registered image in which the position and the size of the area are similar is searched as a second search candidate.
【請求項3】 前記画像及び前記第2の検索候補に係る
前記登録画像の前記領域のうち、テキスト領域に対して
文字認識処理を実行し、前記画像と前記第2の検索候補
に係る前記登録画像との間で、対応する前記テキスト領
域の一致度を算出する手段を備え、 前記検索手段は、前記第2の検索候補が複数ある場合
に、算出された前記テキスト領域の一致度が高いものを
検索することを特徴とする請求項2に記載の画像処理装
置。
3. A character recognition process is performed on a text area of the area of the registered image related to the image and the second search candidate, and the registration related to the image and the second search candidate is performed. Means for calculating the degree of coincidence of the text area corresponding to an image, wherein the search means has a high degree of coincidence of the calculated text area when there are a plurality of second search candidates. The image processing apparatus according to claim 2, wherein is searched for.
【請求項4】 前記画像及び前記第2の検索候補に係る
前記登録画像の前記領域のうち、イメージ領域に対して
イメージ特徴抽出手段により特徴データを抽出し、前記
画像と前記第2の検索候補に係る前記登録画像との間
で、対応する前記イメージ領域の一致度を算出する手段
を備え、 前記検索手段は、前記第2の検索候補が複数ある場合
に、算出された前記イメージ領域の一致度が高いものを
検索することを特徴とする請求項2に記載の画像処理装
置。
4. An image feature extracting unit extracts feature data from an image region among the regions of the registered image relating to the image and the second search candidate, and extracts the image and the second search candidate. Means for calculating the degree of coincidence of the corresponding image area with the registered image according to the above, wherein the search means, when there are a plurality of the second search candidates, matches the calculated image area The image processing apparatus according to claim 2, wherein a search is made for a high degree.
【請求項5】 前記イメージ特徴抽出手段は、イメージ
領域に対して2値化処理を実行すると共に、全画素数に
対する黒画素数の比を算出し、該黒画素数の比を特徴デ
ータとなすことを特徴とする請求項4に記載の画像処理
装置。
5. The image feature extraction means executes a binarization process on an image area, calculates a ratio of the number of black pixels to the total number of pixels, and uses the ratio of the number of black pixels as feature data. The image processing apparatus according to claim 4, wherein:
【請求項6】 予め登録された登録画像の中から、与え
られた画像に近似又は一致する画像を検索する画像処理
装置であって、 前記登録画像を、該画像に対して領域分割処理を実行す
ることにより得られた領域の数と共に記録した記録手段
と、 与えられた画像に対して、領域分割処理を実行し、少な
くとも分割した領域の数を算出する処理手段と、 与えられた前記画像について前記処理手段により得られ
た領域の数と、領域の数が一致する前記登録画像を第1
の検索候補として検索する検索手段と、を備えたことを
特徴とする画像処理装置。
6. An image processing apparatus for searching for an image that is similar or identical to a given image from registered images registered in advance, and executes a region division process on the registered image. Recording means for recording together with the number of areas obtained by performing the above, processing means for executing area division processing on a given image and calculating at least the number of divided areas, The registered image in which the number of areas obtained by the processing means matches the number of areas is first registered.
An image processing apparatus, comprising: a search unit that searches as a search candidate of (i).
【請求項7】 前記記録手段は、前記登録画像を、該画
像に対して領域分割処理を実行することにより得られた
領域の数、位置及び大きさと共に記録し、 前記検索手段は、前記第1の検索候補が複数ある場合
に、更に、前記第1の検索候補のうち、前記画像の各前
記領域の位置及び大きさと、前記領域の位置及び大きさ
が近似する前記登録画像を第2の検索候補として検索す
ることを特徴とする請求項6に記載の画像処理装置。
7. The recording unit records the registered image together with the number, position, and size of an area obtained by executing an area dividing process on the image. In the case where there are a plurality of one search candidates, further, among the first search candidates, the registered image in which the position and size of each area of the image are similar to the position and size of the area is set to the second search candidate. The image processing apparatus according to claim 6, wherein a search is performed as a search candidate.
【請求項8】 前記画像及び前記第2の検索候補に係る
前記登録画像の前記領域のうち、テキスト領域に対して
文字認識処理を実行し、前記画像と前記第2の検索候補
に係る前記登録画像との間で、対応する前記テキスト領
域の一致度を算出する手段を備え、 前記検索手段は、前記第2の検索候補が複数ある場合
に、算出された前記テキスト領域の一致度が高いものを
検索することを特徴とする請求項7に記載の画像処理装
置。
8. A character recognition process is performed on a text region of the region of the registered image related to the image and the second search candidate, and the registration related to the image and the second search candidate is performed. Means for calculating the degree of coincidence of the text area corresponding to an image, wherein the search means has a high degree of coincidence of the calculated text area when there are a plurality of second search candidates. The image processing apparatus according to claim 7, wherein is searched.
【請求項9】 前記画像及び前記第2の検索候補に係る
前記登録画像の前記領域のうち、イメージ領域に対して
イメージ特徴抽出手段により特徴データを抽出し、前記
画像と前記第2の検索候補に係る前記登録画像との間
で、対応する前記イメージ領域の一致度を算出する手段
を備え、 前記検索手段は、前記第2の検索候補が複数ある場合
に、算出された前記イメージ領域の一致度が高いものを
検索することを特徴とする請求項7に記載の画像処理装
置。
9. An image feature extracting unit extracts feature data from an image area of the registered image related to the image and the second search candidate, and extracts the image and the second search candidate. Means for calculating the degree of coincidence of the corresponding image area with the registered image according to the above, wherein the search means, when there are a plurality of the second search candidates, matches the calculated image area The image processing apparatus according to claim 7, wherein a search is performed for a high degree.
【請求項10】 前記イメージ特徴抽出手段は、イメー
ジ領域に対して2値化処理を実行すると共に、全画素数
に対する黒画素数の比を算出し、該黒画素数の比を特徴
データとなすことを特徴とする請求項9に記載の画像処
理装置。
10. The image feature extraction means executes a binarization process on an image area, calculates a ratio of the number of black pixels to the total number of pixels, and uses the ratio of the number of black pixels as feature data. The image processing apparatus according to claim 9, wherein:
【請求項11】 与えられた画像を登録画像として保存
する画像処理方法であって、 与えられた画像に対して、領域分割処理を実行し、少な
くとも分割した領域の数を算出する処理工程と、 前記画像と近似するか又は一致する前記登録画像を検索
する検索工程と、 前記画像を前記登録画像として保存するか否かを判定す
る判定工程と、 登録画像として保存すると判定された前記画像を、前記
処理工程において得られた領域の数と共に保存する保存
工程と、を含み、 前記判定工程では、前記検索工程において、前記画像と
近似するか又は一致する前記登録画像が検索された場合
には、該画像を前記登録画像として保存しないと判定
し、 前記検索工程では、前記画像の前記領域の数と、前記領
域の数が一致する前記登録画像を第1の検索候補として
検索することを特徴とする画像処理方法。
11. An image processing method for storing a given image as a registered image, comprising: performing a region dividing process on the given image to calculate at least the number of divided regions; A search step of searching for the registered image that is similar to or matching the image; a determining step of determining whether to save the image as the registered image; and the image determined to be saved as the registered image, And a saving step of saving together with the number of regions obtained in the processing step, wherein in the determining step, in the search step, if the registered image that is close to or matching the image is searched, It is determined that the image is not stored as the registered image. In the search step, the registered image having the same number of regions as the number of regions in the image is defined as a first search candidate. An image processing method characterized by performing a search.
【請求項12】 前記処理工程では、分割した各々の前
記領域の位置及び大きさをも算出し、 前記保存工程では、登録画像として保存すると判定され
た前記画像を、前記処理工程において得られた領域の
数、位置及び大きさと共に保存し、 前記検索工程では、前記第1の検索候補が複数ある場合
に、更に、前記第1の検索候補のうち、前記画像の各前
記領域の位置及び大きさと、前記領域の位置及び大きさ
が近似する前記登録画像を第2の検索候補として検索す
ることを特徴とする請求項11に記載の画像処理方法。
12. In the processing step, a position and a size of each of the divided areas are also calculated. In the storing step, the image determined to be stored as a registered image is obtained in the processing step. In the search step, when there are a plurality of the first search candidates, the position and the size of each area of the image in the first search candidates are further stored in the search step. 12. The image processing method according to claim 11, wherein the registered image in which the position and the size of the area are similar is searched as a second search candidate.
【請求項13】 前記画像及び前記第2の検索候補に係
る前記登録画像の前記領域のうち、テキスト領域に対し
て文字認識処理を実行し、前記画像と前記第2の検索候
補に係る前記登録画像との間で、対応する前記テキスト
領域の一致度を算出する工程を含み、 前記検索工程では、前記第2の検索候補が複数ある場合
に、算出された前記テキスト領域の一致度が高いものを
検索することを特徴とする請求項12に記載の画像処理
方法。
13. A character recognition process is performed on a text region of the region of the registered image related to the image and the second search candidate, and the registration related to the image and the second search candidate is performed. Calculating a degree of coincidence of the text area corresponding to an image, wherein in the search step, when there is a plurality of second search candidates, the degree of coincidence of the calculated text area is high The image processing method according to claim 12, wherein is searched.
【請求項14】 前記画像及び前記第2の検索候補に係
る前記登録画像の前記領域のうち、イメージ領域に対し
てイメージ特徴抽出工程により特徴データを抽出し、前
記画像と前記第2の検索候補に係る前記登録画像との間
で、対応する前記イメージ領域の一致度を算出する工程
を含み、 前記検索工程では、前記第2の検索候補が複数ある場合
に、算出された前記イメージ領域の一致度が高いものを
検索することを特徴とする請求項12に記載の画像処理
方法。
14. An image feature extracting step of extracting image data from an image area of the area of the registered image related to the image and the second search candidate, wherein the image and the second search candidate are extracted. Calculating the degree of coincidence of the corresponding image area with the registered image according to the above. In the search step, when there is a plurality of the second search candidates, the calculated image area coincidence 13. The image processing method according to claim 12, wherein a search is made for a high degree.
【請求項15】 前記イメージ特徴抽出工程では、イメ
ージ領域に対して2値化処理を実行すると共に、全画素
数に対する黒画素数の比を算出し、該黒画素数の比を特
徴データとなすことを特徴とする請求項14に記載の画
像処理方法。
15. In the image feature extraction step, a binarization process is performed on the image area, a ratio of the number of black pixels to the total number of pixels is calculated, and the ratio of the number of black pixels is used as feature data. 15. The image processing method according to claim 14, wherein:
【請求項16】 予め登録された登録画像の中から、与
えられた画像に近似又は一致する画像を検索する画像処
理方法であって、 前記登録画像を、該画像に対して領域分割処理を実行す
ることにより得られた領域の数と共に記録した記録工程
と、 与えられた画像に対して、領域分割処理を実行し、少な
くとも分割した領域の数を算出する処理工程と、 与えられた前記画像について前記処理工程において得ら
れた領域の数と、領域の数が一致する前記登録画像を第
1の検索候補として検索する検索工程と、を含むことを
特徴とする画像処理方法。
16. An image processing method for retrieving an image that approximates or matches a given image from registered images registered in advance, wherein the registered image is subjected to a region division process on the image. A recording process of recording the number of areas obtained by performing the above-mentioned process, a process of executing a region dividing process on a given image, and calculating at least the number of divided regions; An image processing method comprising: a search step of searching, as a first search candidate, the number of areas obtained in the processing step and the registered image having the same number of areas as a first search candidate.
【請求項17】 前記記録工程では、前記登録画像を、
該画像に対して領域分割処理を実行することにより得ら
れた領域の数、位置及び大きさと共に記録し、 前記検索工程では、前記第1の検索候補が複数ある場合
に、更に、前記第1の検索候補のうち、前記画像の各前
記領域の位置及び大きさと、前記領域の位置及び大きさ
が近似する前記登録画像を第2の検索候補として検索す
ることを特徴とする請求項16に記載の画像処理方法。
17. In the recording step, the registered image is
The number, the position, and the size of the area obtained by executing the area division processing on the image are recorded. In the search step, when there are a plurality of the first search candidates, the first 17. The search image of claim 16, wherein the registered image in which the position and size of each area of the image and the position and size of the area are similar is searched as a second search candidate. Image processing method.
【請求項18】 前記画像及び前記第2の検索候補に係
る前記登録画像の前記領域のうち、テキスト領域に対し
て文字認識処理を実行し、前記画像と前記第2の検索候
補に係る前記登録画像との間で、対応する前記テキスト
領域の一致度を算出する工程を含み、 前記検索工程では、前記第2の検索候補が複数ある場合
に、算出された前記テキスト領域の一致度が高いものを
検索することを特徴とする請求項17に記載の画像処理
方法。
18. A character recognition process is performed on a text area in the area of the registered image related to the image and the second search candidate, and the registration related to the image and the second search candidate is performed. Calculating a degree of coincidence of the text area corresponding to an image, wherein in the search step, when there is a plurality of second search candidates, the degree of coincidence of the calculated text area is high 18. The image processing method according to claim 17, wherein is searched.
【請求項19】 前記画像及び前記第2の検索候補に係
る前記登録画像の前記領域のうち、イメージ領域に対し
てイメージ特徴抽出工程により特徴データを抽出し、前
記画像と前記第2の検索候補に係る前記登録画像との間
で、対応する前記イメージ領域の一致度を算出する工程
を含み、 前記検索工程では、前記第2の検索候補が複数ある場合
に、算出された前記イメージ領域の一致度が高いものを
検索することを特徴とする請求項17に記載の画像処理
方法。
19. An image area of the registered image related to the image and the second search candidate, wherein feature data is extracted by an image feature extraction step, and the image and the second search candidate are extracted. Calculating the degree of coincidence of the corresponding image area with the registered image according to the above. In the search step, when there is a plurality of the second search candidates, the calculated image area coincidence 18. The image processing method according to claim 17, wherein a search is performed for a high degree.
【請求項20】 前記イメージ特徴抽出工程では、イメ
ージ領域に対して2値化処理を実行すると共に、全画素
数に対する黒画素数の比を算出し、該黒画素数の比を特
徴データとなすことを特徴とする請求項19に記載の画
像処理方法。
20. In the image feature extraction step, a binarization process is performed on the image area, a ratio of the number of black pixels to the total number of pixels is calculated, and the ratio of the number of black pixels is used as feature data. 20. The image processing method according to claim 19, wherein:
【請求項21】 与えられた画像を登録画像として保存
するために、コンピュータを、 与えられた画像に対して、領域分割処理を実行し、少な
くとも分割した領域の数を算出する処理手段、 前記画像と近似するか又は一致する前記登録画像を検索
する検索手段、 前記画像を前記登録画像として保存するか否かを判定す
る判定手段、 登録画像として保存すると判定された前記画像を、前記
処理手段により得られた領域の数と共に保存する保存手
段、として機能させるプログラムを記録した記録媒体で
あって、 前記判定手段は、前記検索手段により、前記画像と近似
するか又は一致する前記登録画像が検索された場合に
は、該画像を前記登録画像として保存しないと判定し、 前記検索手段は、前記画像の前記領域の数と、前記領域
の数が一致する前記登録画像を第1の検索候補として検
索することを特徴とする記録媒体。
21. A computer for executing a region dividing process on the given image to calculate at least the number of divided regions, in order to store the given image as a registered image. Search means for searching for the registered image that is similar to or matched with, determining means for determining whether to save the image as the registered image, and processing the image determined to be stored as the registered image by the processing means. A storage medium storing a program functioning as a storage unit for storing the number of obtained regions together with the number of obtained regions, wherein the determination unit searches for the registered image that is similar to or matches the image by the search unit. If the number of areas is equal to the number of areas in the image, the search unit determines that the image is not stored as the registered image. A storage medium for searching for the registered image as a first search candidate.
【請求項22】 前記処理手段は、分割した各々の前記
領域の位置及び大きさをも算出し、 前記保存手段は、登録画像として保存すると判定された
前記画像を、前記処理手段により得られた領域の数、位
置及び大きさと共に保存し、 前記検索手段は、前記第1の検索候補が複数ある場合
に、更に、前記第1の検索候補のうち、前記画像の各前
記領域の位置及び大きさと、前記領域の位置及び大きさ
が近似する前記登録画像を第2の検索候補として検索す
ることを特徴とする請求項21に記載の記録媒体。
22. The processing means also calculates the position and size of each of the divided areas, and the storage means obtains the image determined to be stored as a registered image by the processing means. When the plurality of first search candidates are present, the search means further stores the position and size of each of the regions in the image among the first search candidates. 22. The recording medium according to claim 21, wherein the registered image in which the position and size of the area are similar is searched as a second search candidate.
【請求項23】 前記プログラムが、コンピュータを、 前記画像及び前記第2の検索候補に係る前記登録画像の
前記領域のうち、テキスト領域に対して文字認識処理を
実行し、前記画像と前記第2の検索候補に係る前記登録
画像との間で、対応する前記テキスト領域の一致度を算
出する手段、として機能させるプログラムを含み、 前記検索手段は、前記第2の検索候補が複数ある場合
に、算出された前記テキスト領域の一致度が高いものを
検索することを特徴とする請求項22に記載の記録媒
体。
23. The program, comprising: executing a character recognition process on a text area of the area of the registered image relating to the image and the second search candidate; Means for calculating the degree of coincidence of the text area corresponding to the registered image relating to the search candidate of the search candidate, the search means, when there is a plurality of the second search candidates, 23. The recording medium according to claim 22, wherein a search is made for a text area having a high degree of coincidence.
【請求項24】 前記プログラムが、コンピュータを、 前記画像及び前記第2の検索候補に係る前記登録画像の
前記領域のうち、イメージ領域に対して特徴データを抽
出するイメージ特徴抽出手段、 前記画像と前記第2の検索候補に係る前記登録画像との
間で、対応する前記イメージ領域の一致度を算出する手
段、として機能させるプログラムを含み、 前記検索手段は、前記第2の検索候補が複数ある場合
に、算出された前記イメージ領域の一致度が高いものを
検索することを特徴とする請求項22に記載の記録媒
体。
24. The program according to claim 24, wherein the program causes a computer to extract feature data for an image area of the area of the registered image related to the image and the second search candidate. Means for calculating the degree of coincidence of the corresponding image area with the registered image relating to the second search candidate, the search means comprising a plurality of the second search candidates 23. The recording medium according to claim 22, wherein in that case, a search is made for a high degree of coincidence between the calculated image areas.
【請求項25】 前記イメージ特徴抽出手段は、イメー
ジ領域に対して2値化処理を実行すると共に、全画素数
に対する黒画素数の比を算出し、該黒画素数の比を特徴
データとなすことを特徴とする請求項24に記載の記録
媒体。
25. The image feature extracting means executes a binarization process on an image area, calculates a ratio of the number of black pixels to the total number of pixels, and uses the ratio of the number of black pixels as feature data. The recording medium according to claim 24, wherein:
【請求項26】 予め登録された登録画像の中から、与
えられた画像に近似又は一致する画像を検索するため
に、コンピュータを、 前記登録画像を、該画像に対して領域分割処理を実行す
ることにより得られた領域の数と共に記録した記録手
段、 与えられた画像に対して、領域分割処理を実行し、少な
くとも分割した領域の数を算出する処理手段、 与えられた前記画像について前記処理手段により得られ
た領域の数と、領域の数が一致する前記登録画像を第1
の検索候補として検索する検索手段、として機能させる
プログラムを記録した記録媒体。
26. A computer executes a region division process on the registered image in order to search for an image that is similar or identical to a given image from registered images registered in advance. Recording means for recording together with the number of areas obtained by the above, processing means for performing area division processing on a given image, and calculating at least the number of divided areas, and said processing means for the given image The registered image in which the number of regions obtained by
A recording medium on which a program functioning as a search means for searching as a search candidate is recorded.
【請求項27】 前記記録手段は、前記登録画像を、該
画像に対して領域分割処理を実行することにより得られ
た領域の数、位置及び大きさと共に記録し、 前記検索手段は、前記第1の検索候補が複数ある場合
に、更に、前記第1の検索候補のうち、前記画像の各前
記領域の位置及び大きさと、前記領域の位置及び大きさ
が近似する前記登録画像を第2の検索候補として検索す
ることを特徴とする請求項26に記載の記録媒体。
27. The recording unit records the registered image together with the number, position, and size of regions obtained by executing region division processing on the image. In the case where there are a plurality of one search candidates, further, among the first search candidates, the registered image in which the position and size of each area of the image are similar to the position and size of the area is set to the second search candidate. The recording medium according to claim 26, wherein a search is performed as a search candidate.
【請求項28】 前記プログラムが、コンピュータを、 前記画像及び前記第2の検索候補に係る前記登録画像の
前記領域のうち、テキスト領域に対して文字認識処理を
実行し、前記画像と前記第2の検索候補に係る前記登録
画像との間で、対応する前記テキスト領域の一致度を算
出する手段して機能させるプログラムを含み、 前記検索手段は、前記第2の検索候補が複数ある場合
に、算出された前記テキスト領域の一致度が高いものを
検索することを特徴とする請求項27に記載の記録媒
体。
28. The program, wherein the computer executes a character recognition process on a text area of the image and the area of the registered image related to the second search candidate, and executes the character recognition processing on the image and the second search candidate. A program that functions as a unit that calculates the degree of coincidence of the corresponding text area with the registered image related to the search candidate, wherein the search unit includes a plurality of second search candidates. 28. The recording medium according to claim 27, wherein a search is made for a text area having a high degree of coincidence.
【請求項29】 前記プログラムが、コンピュータを、 前記画像及び前記第2の検索候補に係る前記登録画像の
前記領域のうち、イメージ領域に対して特徴データを抽
出するイメージ特徴抽出手段、 前記画像と前記第2の検索候補に係る前記登録画像との
間で、対応する前記イメージ領域の一致度を算出する手
段、として機能させるプログラムを含み、 前記検索手段は、前記第2の検索候補が複数ある場合
に、算出された前記イメージ領域の一致度が高いものを
検索することを特徴とする請求項27に記載の記録媒
体。
29. The program according to claim 29, wherein the program causes the computer to: extract image feature data for an image area of the image and the area of the registered image relating to the second search candidate; Means for calculating the degree of coincidence of the corresponding image area with the registered image relating to the second search candidate, the search means comprising a plurality of the second search candidates 28. The recording medium according to claim 27, wherein, in such a case, a search is made for one having a high degree of coincidence between the calculated image areas.
【請求項30】 前記イメージ特徴抽出手段は、イメー
ジ領域に対して2値化処理を実行すると共に、全画素数
に対する黒画素数の比を算出し、該黒画素数の比を特徴
データとなすことを特徴とする請求項29に記載の記録
媒体。
30. The image feature extraction means executes a binarization process on an image area, calculates a ratio of the number of black pixels to the total number of pixels, and uses the ratio of the number of black pixels as feature data. 30. The recording medium according to claim 29, wherein:
JP2000136158A 2000-05-09 2000-05-09 Image processing apparatus, image processing method, and recording medium Expired - Fee Related JP3937687B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000136158A JP3937687B2 (en) 2000-05-09 2000-05-09 Image processing apparatus, image processing method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000136158A JP3937687B2 (en) 2000-05-09 2000-05-09 Image processing apparatus, image processing method, and recording medium

Publications (2)

Publication Number Publication Date
JP2001319231A true JP2001319231A (en) 2001-11-16
JP3937687B2 JP3937687B2 (en) 2007-06-27

Family

ID=18644145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000136158A Expired - Fee Related JP3937687B2 (en) 2000-05-09 2000-05-09 Image processing apparatus, image processing method, and recording medium

Country Status (1)

Country Link
JP (1) JP3937687B2 (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348706A (en) * 2003-04-30 2004-12-09 Canon Inc Information processing device, information processing method, storage medium, and program
JP2005316813A (en) * 2004-04-30 2005-11-10 Konica Minolta Business Technologies Inc Image processing method, image processing program, and image processor
EP1669908A2 (en) 2004-12-07 2006-06-14 Canon Kabushiki Kaisha Image search apparatus, image search method, program, and storage medium
JP2006330863A (en) * 2005-05-24 2006-12-07 Hitachi Ltd Electronic document storage system
JP2007148487A (en) * 2005-11-24 2007-06-14 Fuji Xerox Co Ltd Image processor, image processing system, image processing program, and image processing method
US7233945B2 (en) 2003-05-29 2007-06-19 Canon Kabushiki Kaisha Document processing apparatus
JP2008060721A (en) * 2006-08-29 2008-03-13 Fuji Xerox Co Ltd Information processing apparatus and program
US7515754B2 (en) 2003-12-04 2009-04-07 Konica Minolta Holdings, Inc. Image control apparatus, image control method and program
US7548916B2 (en) 2003-04-30 2009-06-16 Canon Kabushiki Kaisha Calculating image similarity using extracted data
JP2010211413A (en) * 2009-03-09 2010-09-24 Fujifilm Corp Case image registration device, method, program and case image retrieval device, method, program, and system
JP2011159283A (en) * 2009-12-29 2011-08-18 Konica Minolta Laboratory Usa Inc Method and apparatus for authenticating printed document using image comparison at a plurality of levels based on document characteristic
JP2012059200A (en) * 2010-09-13 2012-03-22 Konica Minolta Business Technologies Inc Image retrieval apparatus, image reader, image retrieval system, database generation method and database generation program
CN114359533A (en) * 2021-11-18 2022-04-15 珠海读书郎软件科技有限公司 Page number identification method based on page text and computer equipment

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348706A (en) * 2003-04-30 2004-12-09 Canon Inc Information processing device, information processing method, storage medium, and program
US7548916B2 (en) 2003-04-30 2009-06-16 Canon Kabushiki Kaisha Calculating image similarity using extracted data
US7593961B2 (en) 2003-04-30 2009-09-22 Canon Kabushiki Kaisha Information processing apparatus for retrieving image data similar to an entered image
US7233945B2 (en) 2003-05-29 2007-06-19 Canon Kabushiki Kaisha Document processing apparatus
US7515754B2 (en) 2003-12-04 2009-04-07 Konica Minolta Holdings, Inc. Image control apparatus, image control method and program
JP2005316813A (en) * 2004-04-30 2005-11-10 Konica Minolta Business Technologies Inc Image processing method, image processing program, and image processor
JP4569162B2 (en) * 2004-04-30 2010-10-27 コニカミノルタビジネステクノロジーズ株式会社 Image processing method, image processing program, and image processing apparatus
EP1669908A2 (en) 2004-12-07 2006-06-14 Canon Kabushiki Kaisha Image search apparatus, image search method, program, and storage medium
EP1669908A3 (en) * 2004-12-07 2007-04-25 Canon Kabushiki Kaisha Image search apparatus, image search method, program, and storage medium
US7508998B2 (en) 2004-12-07 2009-03-24 Canon Kabushiki Kaisha Image search apparatus, image search method, program, and storage medium
JP4561474B2 (en) * 2005-05-24 2010-10-13 株式会社日立製作所 Electronic document storage system
JP2006330863A (en) * 2005-05-24 2006-12-07 Hitachi Ltd Electronic document storage system
JP2007148487A (en) * 2005-11-24 2007-06-14 Fuji Xerox Co Ltd Image processor, image processing system, image processing program, and image processing method
US7965400B2 (en) 2005-11-24 2011-06-21 Fuji Xerox Co., Ltd. Image processing apparatus, image processing system, computer readable medium, and image processing method
JP4721111B2 (en) * 2005-11-24 2011-07-13 富士ゼロックス株式会社 Image processing apparatus, image processing system, image processing program, and image processing method
JP2008060721A (en) * 2006-08-29 2008-03-13 Fuji Xerox Co Ltd Information processing apparatus and program
US8102576B2 (en) 2006-08-29 2012-01-24 Fuji Xerox Co., Ltd. Method, apparatus, and system of detecting duplicated scanned data of a document
JP2010211413A (en) * 2009-03-09 2010-09-24 Fujifilm Corp Case image registration device, method, program and case image retrieval device, method, program, and system
JP2011159283A (en) * 2009-12-29 2011-08-18 Konica Minolta Laboratory Usa Inc Method and apparatus for authenticating printed document using image comparison at a plurality of levels based on document characteristic
JP2012059200A (en) * 2010-09-13 2012-03-22 Konica Minolta Business Technologies Inc Image retrieval apparatus, image reader, image retrieval system, database generation method and database generation program
US8548276B2 (en) 2010-09-13 2013-10-01 Konica Minolta Business Technologies, Inc. Image search apparatus, image scanning apparatus, image search system, database creation method, and database creation program
CN114359533A (en) * 2021-11-18 2022-04-15 珠海读书郎软件科技有限公司 Page number identification method based on page text and computer equipment

Also Published As

Publication number Publication date
JP3937687B2 (en) 2007-06-27

Similar Documents

Publication Publication Date Title
JP2957375B2 (en) Data processing system and method for correcting character recognition errors in digital images of document format
US5745745A (en) Text search method and apparatus for structured documents
JP4366108B2 (en) Document search apparatus, document search method, and computer program
US7788089B2 (en) Document based character ambiguity resolution
US20040267734A1 (en) Document search method and apparatus
EP2172856A2 (en) Image processing apparatus, image processing method and program
JP3937687B2 (en) Image processing apparatus, image processing method, and recording medium
US7979438B2 (en) Document management method and apparatus and document search method and apparatus
US7277584B2 (en) Form recognition system, form recognition method, program and storage medium
US5905811A (en) System for indexing document images
JPH10289240A (en) Image processor and its control method
JP3727995B2 (en) Document processing method and apparatus
JP2586372B2 (en) Information retrieval apparatus and information retrieval method
JP3673553B2 (en) Filing equipment
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
JP2009140478A (en) Image processing apparatus and image processing method
JP2020047031A (en) Document retrieval device, document retrieval system and program
JP3902825B2 (en) Document search system and method
JP3955410B2 (en) Similar information collating device, similar information collating method, and recording medium recording similar information collating program
JPH113401A (en) Information processor and its method
US6625606B1 (en) System and method for filing/searching data having a full-text function and media for recording the method
JPH11187231A (en) Image retrieving device and image retrieval method
JP4261831B2 (en) Character recognition processing method, character recognition processing device, character recognition program
JP2021105911A (en) Information processing device, control method, and program
JP2000311173A (en) Device and method for retrieving similar document

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040614

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20040614

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040614

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070319

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110406

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120406

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140406

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees