JPH0934903A - File retrieval device - Google Patents

File retrieval device

Info

Publication number
JPH0934903A
JPH0934903A JP7181850A JP18185095A JPH0934903A JP H0934903 A JPH0934903 A JP H0934903A JP 7181850 A JP7181850 A JP 7181850A JP 18185095 A JP18185095 A JP 18185095A JP H0934903 A JPH0934903 A JP H0934903A
Authority
JP
Japan
Prior art keywords
character
character string
similar
image data
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7181850A
Other languages
Japanese (ja)
Inventor
Norihisa Kojima
島 紀 久 児
Makoto Okazaki
崎 誠 岡
Toshifumi Shintani
谷 敏 文 新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP7181850A priority Critical patent/JPH0934903A/en
Priority to CN96190752A priority patent/CN1165571A/en
Priority to PCT/JP1996/001954 priority patent/WO1997004409A1/en
Publication of JPH0934903A publication Critical patent/JPH0934903A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a file retrieval device capable of easily storing information written in documents or the like and easily and surely performing retrieval. SOLUTION: This device is provided with an image input means 1 for inputting characters, symbols and graphics as image data, a storage means 2 for storing the image data read by the image input means 1 as they are as the image data, a display means 3 for displaying the image data in the form of a file with an index for displaying one piece of the image data on one page, a range specifying means 4 for specifying the prescribed part of the image data displayed by the display means 3 as a range, a character recognition means 5 for converting the array of picture elements within the range specified by the range specifying means 4 to character data and an editing means 7 for editing the character data converted by the character recognition means 5 as the character data.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、書類等に記載され
た情報をコンピュータのデータとしてコンピュータに取
り込み、コンピュータの機能を利用してそれらの情報を
整理および活用するファイル検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a file search apparatus for importing information described in a document or the like into a computer as computer data and organizing and utilizing the information by utilizing the function of the computer.

【0002】[0002]

【従来の技術】近年のコンピュータ技術の発達により、
書類等に記載された情報をコンピュータのデータとして
コンピュータに取り込み、書類等の保管場所を減少させ
るとともに、情報の有効活用を図る技術の開発が行われ
ている。
2. Description of the Related Art With the recent development of computer technology,
Information has been developed into a computer by taking information described in a document or the like into a computer as data of the computer to reduce the storage place of the document and the like and effectively utilizing the information.

【0003】上記技術開発の結果として、イメージスキ
ャナを内蔵し、書類等に記載した情報をイメージデータ
として入力して格納しておくファイル検索装置が既に提
案されている。この従来のファイル検索装置は、イメー
ジスキャナによって書類をスキャンし、一回のスキャン
によって得られたイメージデータを1イメージデータと
し、各イメージデータごとに、あるいは所定数のイメー
ジデータ群ごとに検索用のキーワードをユーザに入力さ
せ、各イメージデータを検索用のキーワードとともに格
納するものであった。
As a result of the above technical development, there has already been proposed a file search apparatus which incorporates an image scanner and inputs and stores information described in a document or the like as image data. This conventional file search device scans a document with an image scanner, and sets image data obtained by one scan as one image data, and searches for each image data or for each predetermined number of image data groups. The user inputs a keyword, and each image data is stored together with the keyword for searching.

【0004】この従来のファイル検索装置によれば、所
定の書類のイメージデータを検索するときは、ユーザが
検索したいキーワードを入力し、ファイル検索装置に備
えた検索手段によって検索したいキーワードと同一また
は部分的に同一の検索用キーワードを有するイメージデ
ータを検索することによって、所望のイメージデータを
探し出すようにしていた。
According to this conventional file searching apparatus, when searching for image data of a predetermined document, the user inputs a keyword to be searched, and the same or part as the keyword to be searched by the searching means provided in the file searching apparatus. By searching for image data having the same search keyword, desired image data is searched for.

【0005】部分的に同一の検索用キーワードを検索す
るとは、たとえば、イメージデータ格納時に「〇〇株式
会社」と入力した検索用キーワードは、部分的に同一の
「〇〇」なるキーワードによっても検索されるというよ
うなものであった。
Searching for partially identical search keywords means, for example, that the search keyword entered as "XX Co., Ltd." when the image data is stored is also searched for by partially identical "XX" keywords. It was like being done.

【0006】また、これに関連して類似のキーワードを
検索する技術も多数提案されている。たとえば、「AB
C株式会社」なるキーワードが入力された場合、「エー
ビーシー株式会社」、「株式会社 ABC」、「(株)
ABC」等の一般的な表現方法を考慮した類似の検索用
キーワードも検索される技術が提案されていた。
[0006] In connection with this, many techniques for retrieving similar keywords have been proposed. For example, "AB
If the keyword "C Co., Ltd." is entered, "BC Co., Ltd.", "ABC Co., Ltd."
A technique has been proposed in which similar search keywords are searched for in consideration of a general expression method such as "ABC".

【0007】さらに上記ファイル検索装置の改良装置と
して、格納するデータの量を圧縮する目的で、文字認識
装置を内蔵したファイル検索装置も提案されていた。
Further, as an improved device of the file search device, a file search device incorporating a character recognition device has been proposed for the purpose of compressing the amount of data to be stored.

【0008】この文字認識装置を内蔵したファイル検索
装置は、書類等に記載された情報を取り込むときに、書
面の文章部分と写真、図面等の部分を自動判別し、文章
部分については文字認識装置によって文字データに変換
し、写真、図面等の部分はイメージデータとして取り込
み、文章部分を文字データに変換することによって、少
ない記憶容量で書類等の情報を格納するようにしたもの
であった。このファイル検索装置においても、イメージ
データと文字データを格納するときに、将来それを検索
する場合の検索用キーワードを入力するようにしてい
た。
A file search device incorporating this character recognition device automatically discriminates a text part of a document from a part such as a photograph or a drawing when fetching information described in a document or the like, and the character recognition device for the text part. The image data is converted into character data, the part such as a photograph and a drawing is captured as image data, and the text part is converted into character data so that information such as a document can be stored with a small storage capacity. Also in this file search device, when the image data and the character data are stored, a search keyword for future search is input.

【0009】[0009]

【発明が解決しようとする課題】しかしながら、上記従
来のファイル検索装置は、イメージデータ等を格納する
際に検索用キーワードを入力しなければならなかった
が、この検索用キーワードの入力作業は人手と時間がか
かるため、迅速な情報の格納の妨げとなっていた。
However, in the above-mentioned conventional file search apparatus, a search keyword must be input when storing image data or the like. However, this search keyword input operation is manually performed. This takes time, which hinders the rapid storage of information.

【0010】また、部分的に同一の検索用キーワード
や、表現上類似のキーワード等が検索可能とは言え、ユ
ーザは、将来の検索時のキーワードの可能性を考慮しつ
つ、各イメージデータにもっとも相応しい検索用キーワ
ードを入力しなければならなかったため、情報を格納す
る時のユーザの負担が大きかった。また、キーワードの
設定の巧拙によっても、検索が困難に、あるいは容易に
なった。
Although it is possible to search for partially identical search keywords or expressions that are similar to each other, the user is most likely to search each image data while considering the possibility of keywords in future searches. Since it was necessary to input an appropriate search keyword, the burden on the user when storing information was large. Also, due to skillful setting of keywords, search became difficult or easy.

【0011】また、上記キーワードの設定の巧拙の問題
を除いても、従来のファイル検索装置では、予想しなか
ったキーワードによって検索したい要望に応えることが
できなかった。このため、すでに格納した情報の柔軟な
活用を図ることが困難であった。
Further, even if the problem of skillful setting of the keyword is eliminated, the conventional file search device cannot meet the demand for searching with an unexpected keyword. Therefore, it is difficult to flexibly utilize the information already stored.

【0012】一方、上記一部文字データに変換して格納
する従来のファイル検索装置は、情報を取り込むとき
に、文字認識装置による変換の結果をユーザによって確
認または修正しなければならなかった。この文字認識の
確認および修正のために、情報を格納するのに時間と労
力がかかっていた。また、万一誤った文字認識のまま情
報が格納された場合には、元の情報が失われる危険性も
あった。
On the other hand, in the conventional file retrieval apparatus which converts and stores the partial character data, the result of conversion by the character recognition apparatus must be confirmed or corrected by the user when capturing information. It took time and effort to store the information to check and correct this character recognition. In addition, if information is stored with incorrect character recognition, the original information may be lost.

【0013】上記種々の点から、従来のファイル検索装
置では、情報の格納が容易ではなく、また、所望の情報
を的確かつ迅速に探し出すことができないという課題が
あった。
From the above-mentioned various points, the conventional file search apparatus has a problem that it is not easy to store information and desired information cannot be searched accurately and quickly.

【0014】そこで、本発明が解決しようとする課題
は、書類等に記載した情報を容易に格納でき、かつ、検
索が容易・確実なファイル検索装置を提供することにあ
る。
Therefore, an object of the present invention is to provide a file search device that can easily store information described in documents and the like and that can be searched easily and reliably.

【0015】[0015]

【課題を解決するための手段】上記課題を解決するため
に、本願請求項1に係るファイル検索装置は、文字、記
号、および図形をイメージデータとして入力するイメー
ジ入力手段と、前記イメージ入力手段によって読み込ま
れたイメージデータを、イメージデータのまま記憶する
記憶手段と、前記イメージデータを、1ページに1イメ
ージデータを表示する見出し付きのファイルの形式で表
示する表示手段と、前記表示手段によって表示されたイ
メージデータの所定部分を範囲として指定する範囲指定
手段と、前記範囲指定手段によって指定された範囲内の
画素の配列を文字データに変換する文字認識手段と、前
記文字認識手段によって変換された文字データを文字デ
ータとして編集する編集手段と、を有していることを特
徴とするものである。
In order to solve the above problems, a file search apparatus according to claim 1 of the present invention comprises an image input means for inputting characters, symbols and figures as image data, and the image input means. Storage means for storing the read image data as image data, display means for displaying the image data in the form of a file with a headline for displaying one image data per page, and display means for displaying the image data. Range specifying means for specifying a predetermined portion of the image data as a range, character recognizing means for converting an array of pixels within the range specified by the range specifying means into character data, and characters converted by the character recognizing means. And an editing means for editing the data as character data. .

【0016】本願請求項2に係るファイル検索装置は、
請求項1のファイル検索装置において、所定の文字列に
類似する文字列を生成する類似文字列生成部を有し、ユ
ーザに検索しようとする文字列を入力させ、入力された
文字列と、この入力された文字列に対して前記類似文字
列生成手段によって生成された類似文字列とを検索対象
として、前記範囲指定手段と文字認識手段とによって範
囲指定および文字変換された文字データから、前記検索
対象の文字列を検索する検索手段を備えたことを特徴と
するものである。
The file search device according to claim 2 of the present application is
The file search device according to claim 1, further comprising a similar character string generation unit that generates a character string similar to a predetermined character string, allowing a user to input a character string to be searched, and input the character string and The similar character string generated by the similar character string generation means with respect to the input character string is used as a search target, and the search is performed from the character data subjected to range specification and character conversion by the range specification means and the character recognition means. It is characterized in that a search means for searching a target character string is provided.

【0017】本願請求項3に係るファイル検索装置は、
請求項2のファイル検索装置において、前記類似文字列
生成部は、所定の文字列に類似する文字列に類似の確率
に応じて順位を付し、前記検索手段は、前記ユーザによ
って入力された文字列を第一候補とし、前記類似文字列
生成部によって生成された類似文字列を順位付きの候補
として、候補の順位に文字列を検索することを特徴とす
るものである。
The file search device according to claim 3 of the present application is
3. The file search device according to claim 2, wherein the similar character string generator assigns a rank to a character string similar to a predetermined character string according to the probability of similarity, and the search means is a character input by the user. A character string is searched for in a candidate rank by using the string as a first candidate, the similar character string generated by the similar character string generation unit as a ranked candidate.

【0018】本願請求項4に係るファイル検索装置は、
請求項2のファイル検索装置において、前記類似文字列
生成部は、所定の文字とそれに類似する文字の対応ファ
イルを参照して類似文字列を生成することを特徴とする
ものである。
A file search device according to claim 4 of the present application is
The file search device according to claim 2, wherein the similar character string generation unit generates a similar character string by referring to a corresponding file of a predetermined character and a character similar thereto.

【0019】本願請求項5に係るファイル検索装置は、
請求項2のファイル検索装置において、前記類似文字列
生成部は、形状類似のルールにより、入力された文字と
形状が類似する文字を検索して類似文字列を生成するこ
とを特徴とするものである。
The file search device according to claim 5 of the present application is
3. The file search device according to claim 2, wherein the similar character string generation unit searches for a character having a shape similar to the input character and generates a similar character string according to a shape similarity rule. is there.

【0020】本願請求項6に係るファイル検索装置は、
請求項2のファイル検索装置において、前記類似文字列
生成部は、印刷・読み取りによる文字変形ルールによ
り、入力された文字に類似する文字を検索して類似文字
列を生成することを特徴とするものである。
The file search device according to claim 6 of the present application is
3. The file search device according to claim 2, wherein the similar character string generation unit searches for a character similar to the input character and generates a similar character string according to a character transformation rule by printing / reading. Is.

【0021】本願請求項7に係るファイル検索装置は、
請求項1のファイル検索装置において、前記範囲指定手
段によって指定した範囲のイメージを前記文字認識手段
によって文字列に変換し、この変換した文字列を検索対
象として、前記範囲指定手段と文字認識手段とによって
範囲指定および文字変換された文字データから、前記検
索対象の文字列を検索する検索手段を備えたことを特徴
とするものである。
The file search device according to claim 7 of the present application is
2. The file search device according to claim 1, wherein an image of a range designated by the range designating means is converted into a character string by the character recognizing means, and the converted character string is used as a search target, the range designating means and the character recognizing means It is characterized by comprising a searching means for searching the character string to be searched from the character data which has been subjected to range specification and character conversion.

【0022】本願請求項8に係るファイル検索装置は、
請求項1ないし7のいずれかのファイル検索装置におい
て、前記範囲指定手段は、一つのイメージデータの範囲
を指定することにより、すべてのイメージデータの同一
の範囲を指定することを特徴とするものである。
A file search device according to claim 8 of the present application is
8. The file search device according to claim 1, wherein the range designating unit designates a range of one image data, thereby designating the same range of all image data. is there.

【0023】[0023]

【発明の実施の形態】次に本発明の実施の形態について
添付の図面を用いて以下に説明する。図1は、本発明の
一実施形態によるファイル検索装置の構成とその処理の
流れを示している。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the accompanying drawings. FIG. 1 shows the configuration of a file search device according to an embodiment of the present invention and the flow of processing thereof.

【0024】本実施形態のファイル検索装置は、イメー
ジ入力手段1と、記憶手段2と、表示手段3と、範囲指
定手段4と、文字認識手段5と、検索手段6と、編集手
段7と、を有している。イメージ入力手段1は、種々の
構成が可能であり、書類等に記載した情報をイメージデ
ータとして入力可能なものなら、イメージスキャナ1
a、他のコンピュータやネットワークに接続したケーブ
ル1b、図示しないファックスとコピー機の複合機等の
いずれでもよい。
The file search device of this embodiment comprises an image input means 1, a storage means 2, a display means 3, a range designation means 4, a character recognition means 5, a search means 6, an editing means 7, have. The image input means 1 can have various configurations, and if the information described in a document or the like can be input as image data, the image scanner 1
a, a cable 1b connected to another computer or a network, or a multifunction machine of a fax machine and a copy machine (not shown).

【0025】本実施形態の表示手段3は、モニター等の
表示装置8と別個独立のものであって、表示装置8に画
像データを送って表示制御を行う制御手段として以下に
説明するが、表示手段としては表示装置を含むものであ
ってもよい。
The display means 3 of this embodiment is independent of the display device 8 such as a monitor, and will be described below as a control means for sending image data to the display device 8 to perform display control. The means may include a display device.

【0026】また同様に、本実施形態の範囲指定手段4
と検索手段6と編集手段7は、キーボードやマウス等の
入力装置9と独立のものであって、それぞれ範囲指定、
検索、編集を行う制御手段として以下に説明するが、そ
れぞれキーボード等の入力手段を含むものであってもよ
い。
Similarly, the range designating means 4 of the present embodiment.
The searching means 6 and the editing means 7 are independent of the input device 9 such as a keyboard and a mouse, and specify a range,
The control means for searching and editing will be described below, but each may include input means such as a keyboard.

【0027】次に上記構成のファイル検索装置の処理の
流れについて、以下に説明する。本実施形態のファイル
検索装置では、書類等に記載した情報をすべてイメージ
データとして取り込む。具体的には、書類等をイメージ
スキャナ1a等のスキャニング面に載せ、イメージスキ
ャナ1aの光学的な読み取りによって書類等に記載され
た文字、図形、写真等をすべてイメージデータ(画素の
配列を記録したデータ)として記憶手段2のイメージデ
ータファイル10に格納する。この場合、イメージスキ
ャナ1aの1回のスキャニングによって取得するイメー
ジデータを1イメージデータとして格納する。イメージ
スキャナ1aによらない場合、すでにイメージデータ化
した情報をケーブル1bを介してイメージデータファイ
ル10に入力してもよい。
Next, the flow of processing of the file search device having the above configuration will be described below. The file search device according to the present embodiment takes in all the information described in a document or the like as image data. Specifically, a document or the like is placed on the scanning surface of the image scanner 1a or the like, and all the characters, figures, photographs, etc. written on the document or the like by the optical reading of the image scanner 1a are image data (the pixel arrangement is recorded. The data is stored in the image data file 10 of the storage means 2. In this case, the image data acquired by one scanning of the image scanner 1a is stored as one image data. When not using the image scanner 1a, information already converted into image data may be input to the image data file 10 via the cable 1b.

【0028】ここで、注目すべきこととしては、本実施
形態のファイル検索装置によれば、情報を取り込むとき
に、将来イメージデータを検索するための検索用キーワ
ードを入力しなくてもよいことが挙げられる。これによ
り、ユーザは大量の書類を機械的に素早く格納すること
ができる。なお、このようにして格納した情報の検索に
ついては後述する。
It should be noted here that, according to the file search apparatus of this embodiment, it is not necessary to input a search keyword for searching image data in the future when information is fetched. Can be mentioned. This allows the user to mechanically store large amounts of documents quickly. The search for the information stored in this way will be described later.

【0029】表示手段3は、イメージデータファイル1
0からイメージデータを取り出し、表示装置8によって
これを表示する。この表示手段3による表示は、図2に
例示するように、1イメージデータを1ページとして表
示し、所定の分類に従って見出しを付したファイル形式
で表示する。このファイル形式の表示は、見出しをマウ
ス等でクリックすることにより、素早く所望のイメージ
データの部分を開くことができる。
The display means 3 is the image data file 1
The image data is taken out from 0 and displayed on the display device 8. As shown in FIG. 2, the display means 3 displays one image data as one page and displays it in a file format with a heading according to a predetermined classification. In the display of this file format, a desired image data portion can be quickly opened by clicking a headline with a mouse or the like.

【0030】また、好ましくは、表示手段3は、「高速
ページめくり」、「拡大縮小・回転・ブラウジング」、
「マーキング」、「コメント」等の諸機能を備えるよう
にする。
Also, preferably, the display means 3 is "high-speed page turning", "enlargement / reduction / rotation / browsing",
Provide various functions such as "marking" and "comment".

【0031】次に所定の情報、すなわち、所定のイメー
ジデータを検索する方法について以下に説明する。本実
施形態のファイル検索装置による検索では、最初に範囲
指定手段4によってイメージデータの検索される部分を
指定する。実際には、ユーザが表示装置8を見ながら、
マウス等の入力手段を用いて、イメージデータ上に図2
に示すような検索範囲の枠11を指定する。これは、帳
票等の定型的な書類では、たとえばタイトルは所定の位
置に記載されており、タイトルに検索しようとするキー
ワードが含まれている場合は、その部分のみを検索範囲
の枠11によって囲めば、少ない検索量によって効率的
に検索を行うことができる。
Next, a method for retrieving predetermined information, that is, predetermined image data will be described below. In the search by the file search device according to the present embodiment, the range specifying means 4 first specifies the searched part of the image data. In reality, while the user is looking at the display device 8,
Using an input means such as a mouse, the image data is displayed as shown in FIG.
The frame 11 of the search range as shown in is designated. This is because in a typical document such as a form, the title is written at a predetermined position, and if the title contains a keyword to be searched, only that part is surrounded by the search range frame 11. If so, it is possible to efficiently perform a search with a small search amount.

【0032】求めるキーワードが決まった部分(位置)
に記載されていない場合には、範囲指定手段4によって
イメージデータの全体を検索範囲の枠11によって囲む
ようにすれば、各イメージデータのすべての部分につい
て検索を行うことができる。
The part (position) where the desired keyword is determined
If not described in (1), if the range specifying means 4 surrounds the entire image data with the frame 11 of the search range, it is possible to perform a search for all parts of each image data.

【0033】なお、本実施形態による範囲指定手段4
は、一つのイメージデータの範囲を指定することによ
り、すべてのイメージデータの同一の範囲を指定するこ
とができる。この機能を利用することにより、上記した
帳票の場合、一つの帳票のタイトル部分を検索範囲の枠
11によって囲むことにより、すべての帳票のタイトル
部分を検索することができる。この機能は、定型の書類
のイメージデータのみを格納しているイメージデータフ
ァイル10を検索するときに特に有効である。このよう
にして、指定された検索範囲は、記憶手段2の範囲指定
ファイル12に格納される。
The range specifying means 4 according to the present embodiment
Can specify the same range of all image data by specifying the range of one image data. By using this function, in the case of the above-mentioned form, by enclosing the title part of one form with the frame 11 of the search range, the title parts of all the forms can be searched. This function is particularly effective when searching the image data file 10 that stores only the image data of a standard document. In this way, the designated search range is stored in the range designation file 12 of the storage means 2.

【0034】次に、範囲指定手段4によって範囲指定さ
れた部分の画素の配列を、文字認識手段5によって文字
データに変換する。文字認識手段5は、範囲指定ファイ
ル12を参照して、イメージデータファイル10からイ
メージデータを取り出し、指定された検索範囲内の画素
の配列を、辞書ファイル13を参照しながら文字データ
に変換する。変換された文字データは、文字データファ
イル14に格納される。これらの変換された文字データ
は、検索される文字列の集合となる。
Next, the character recognizing means 5 converts the array of pixels in the area specified by the range specifying means 4 into character data. The character recognition unit 5 refers to the range designation file 12, extracts image data from the image data file 10, and converts the pixel array within the designated search range into character data while referring to the dictionary file 13. The converted character data is stored in the character data file 14. These converted character data form a set of searched character strings.

【0035】次に、検索手段6によって、検索しようと
する文字列をユーザに入力させ、上記文字データファイ
ル14の文字列の集合から、入力された文字列、および
入力された文字列に類似する文字列を検索する。
Next, the search means 6 causes the user to input the character string to be searched, and the input character string and the input character string are resembled from the character string set of the character data file 14. Search for a string.

【0036】図3は、検索手段6による検索の流れを示
している。本実施形態の検索手段6は、入力された文字
列のみならず、入力された文字列に類似する文字列も検
索する点に特徴がある。このことを具体的な例を示して
以下に説明する。
FIG. 3 shows the flow of retrieval by the retrieval means 6. The search means 6 of the present embodiment is characterized in that not only the input character string but also a character string similar to the input character string is searched. This will be described below by showing a concrete example.

【0037】たとえば、「中間決算」という文字列を含
むイメージデータを検索しようとする場合、「中間決
算」なる文字列は、上記文字認識手段5によって誤って
認識されて文字データファイル14に格納されている可
能性がある。たとえば、「中」は「牛」、「午」、
「甲」等に、「間」は「問」、「関」、「門」等に、
「決」は「法」、「沫」、「洟」等に、「算」は
「筧」、「箟」等に認識される可能性がある。
For example, when an image data including a character string “interim settlement” is searched, the character string “interim settlement” is erroneously recognized by the character recognition means 5 and stored in the character data file 14. There is a possibility that For example, "medium" means "cow", "noon",
"Kou" etc., "Ma" to "Q", "Seki", "Gate", etc.
There is a possibility that "decision" will be recognized as "law,""drop,""raise," etc., and "calculation" will be recognized as "kei,""masu," and the like.

【0038】したがって、「中間決算」なる文字列は上
記文字の組合せとして文字データファイル14に格納さ
れている可能性がある。これら誤って認識されている文
字列は、「中間決算」という文字列によって検索されな
い。
Therefore, the character string "interim settlement" may be stored in the character data file 14 as a combination of the above characters. These erroneously recognized character strings are not searched by the character string "interim settlement".

【0039】これに対して、本装置の検索手段6は、入
力された文字列に類似する文字列を生成する類似文字列
生成部15を有している。この類似文字列生成部15
は、たとえば「中」の文字が入力されたとすると、これ
に類似する「牛」、「午」、「甲」等を選出し、類似文
字列を構成する要素とする。
On the other hand, the search means 6 of this apparatus has a similar character string generator 15 for generating a character string similar to the input character string. This similar character string generation unit 15
For example, if the character "medium" is input, "cow", "noon", "instep", etc., which are similar to this, are selected as elements that form a similar character string.

【0040】上記類似文字を選出する方法として、ここ
では3つの方法がある。第1の類似文字選出方法は、所
定の文字とそれに類似する文字の対応ファイルを予め用
意しておき、この対応ファイルを参照して類似文字を選
出する。たとえば、「中」に対しては「午」、「牛」、
「甲」等を予め誤認される文字として対応ファイルに格
納しておき、「中」なる文字が入力された場合に、
「午」、「牛」、「甲」等の文字を選出する。この対応
ファイルは、文字認識手段5と共用できる場合は、これ
を共用する。
There are three methods for selecting the above-mentioned similar characters. In the first similar character selection method, a corresponding file of a predetermined character and a character similar thereto is prepared in advance, and the similar character is selected by referring to this corresponding file. For example, "medium" means "noon", "cow",
If "Kou" etc. is stored in the corresponding file in advance as misidentified characters and the character "Middle" is entered,
Select characters such as "noon", "cow", and "instep". If the corresponding file can be shared with the character recognition means 5, this file is also shared.

【0041】第2の類似文字選出方法は、文字の輪郭、
線密度等によって文字を確定する文字形状のルールを使
って、入力された文字に形状が類似する文字を選出す
る。たとえば、「中」なる文字が入力された場合に、こ
れに形状が類似する「午」、「牛」、「甲」等を形状類
似のルールによって選出する。この文字判読のルール
も、文字認識手段5と共用できる場合は、これを共用す
る。
The second similar character selection method is the outline of characters,
Characters that are similar in shape to the input character are selected using the character shape rule that determines the character according to the line density and the like. For example, when the character "medium" is input, "noon", "cow", "instep", etc., which are similar in shape to this, are selected by the rule of shape similarity. If the character recognition rule can be shared with the character recognition means 5, the rule is also shared.

【0042】第3の類似文字選出方法は、印刷・読み取
りによる文字変形例を多数用意した文字変形ルールによ
り、入力された文字に類似する文字を選出する。たとえ
ば、「1」なる文字は、印刷・読み取りの具合によって
「i」、「l(エル)」、「(」等に誤認されることが
あるので、「1」が入力された場合は「i」、「l(エ
ル)」、「(」を類似文字として選出する。
In the third similar character selection method, a character similar to the input character is selected according to the character modification rule which prepared many character modification examples by printing and reading. For example, the character "1" may be mistaken for "i", "l", "(", etc. depending on the printing / reading condition. , “L” and “(” are selected as similar characters.

【0043】このようにして、「中間決算」なる文字列
が検索対象の文字列として入力された場合は、本装置の
検索手段6は、「中間決算」の他に、類似の「牛間決
算」、「中問決算」、「中間法算」、…をも検索対象の
文字列とする。これら検索対象の文字列については、逐
一文字データファイル14の文字列と照合し、同一文字
列を検索する。
In this way, when the character string "interim settlement" is input as the character string to be searched, the searching means 6 of the present apparatus, in addition to "interim settlement", the similar "cattle settlement" , “Medium-term settlement”, “Intermediate calculation”, and so on are also search target character strings. These character strings to be searched are collated with the character strings in the character data file 14 one by one, and the same character string is searched.

【0044】この場合、検索手段6は好ましくは、所定
の文字の誤認の可能性を確率値として有し、類似文字列
に順位を付しておく。これにより、最も誤認される可能
性が高い類似文字列から検索し、結果を表示する際にも
誤認の可能性について何らかの表示をする。
In this case, the search means 6 preferably has a probability of erroneous recognition of a predetermined character as a probability value and ranks the similar character strings. As a result, the similar character string that is most likely to be misidentified is searched for, and when the result is displayed, some possibility of misidentification is displayed.

【0045】検索結果は、図3に示すように、該当する
文字列が含まれるイメージデータn1 ,n2 ,n3 …を
表示し、該当する文字列の部分を強調表示する。これら
の検索された結果は、記憶手段2の検索データファイル
16(図1参照)に格納される。
As the search result, as shown in FIG. 3, image data n1, n2, n3 ... Containing the corresponding character string are displayed, and the corresponding character string portion is highlighted. The results of these searches are stored in the search data file 16 (see FIG. 1) of the storage means 2.

【0046】上記検索方法によれば、イメージデータの
検索キーワードが含まれる部分のみを文字認識し、か
つ、文字認識の結果の正否を検討することなく、検索の
ために入力した文字列と、これに類似文字列とを検索対
象として、該当する文字列を含むイメージデータを検出
する。これにより、第一に文字認識の処理量を少なく
し、第二に文字認識の結果を検討する労力を省き、第三
に検索しようとする文字列を含むイメージデータを漏れ
なく検出することができる。
According to the above search method, only the part of the image data containing the search keyword is character-recognized, and the character string input for the search and the character string input for the search are examined without considering whether the result of the character recognition is correct or not. The image data including the corresponding character string is detected by using the similar character string as a search target. As a result, firstly, the processing amount of character recognition can be reduced, secondly the labor for examining the result of character recognition can be saved, and thirdly, the image data including the character string to be searched can be detected without omission. .

【0047】なお、上記説明では、検索手段6は検索し
ようとする文字列の全体に類似する類似文字列を検索し
ているが、本発明はこれに限られず、検索手段6は、検
索のために入力した文字列の一部分について検索対象や
類似文字列を生成するようにすることもできる。
In the above description, the searching means 6 searches for a similar character string that is similar to the entire character string to be searched, but the present invention is not limited to this, and the searching means 6 is for searching. It is also possible to generate a search target or a similar character string for a part of the character string input to.

【0048】すなわち、たとえば検索しようとするキー
ワードが「ABC株式会社」だとすると、「AB」や
「ABC」や「A****会社」や「A」のみの入力文
字によって「ABC株式会社」検索するようにすること
ができる。
That is, for example, if the keyword to be searched is "ABC Co., Ltd.", "ABC Co., Ltd." is searched by using only the input characters "AB", "ABC", "A *** company" and "A". You can

【0049】また、類似文字列についても、たとえば検
索しようとするキーワードが「中間決算」だとすると、
「中間決算」の「中」を指定し、「中」に類似する
「午」、「牛」、「甲」を含む文字列「午間決算」、
「牛間決算」、「甲間決算」等を類似文字列として検索
するようにすることができる。むろん、上記文字の指定
は、ユーザの指定によって任意の2文字あるいは3文字
を類似文字に置き換えるようにすることができる。
Also for the similar character string, if the keyword to be searched is "interim settlement",
Specify "Medium" in "Interim settlement", and the string "Hourly settlement" similar to "Medium" including "Noon", "Cow", "A",
It is possible to search for "Ushima settlement", "Kosama settlement", etc. as similar character strings. As a matter of course, in the above-mentioned character designation, any two or three letters can be replaced with similar characters according to the designation by the user.

【0050】また、本ファイル検索装置によれば、異な
る方法の検索も可能である。この検索方法は、所定のイ
メージデータ中の所定の文字列に注目し、この文字列と
同一の文字列を有するイメージデータを検索する方法で
ある。以下に、その異なる検索方法について説明する。
Further, according to the file search apparatus, it is possible to search by different methods. This search method is a method of paying attention to a predetermined character string in predetermined image data and searching for image data having the same character string as this character string. The different search methods will be described below.

【0051】この検索では、検索される文字列の集合1
4を形成するところまでは、上記文字列を入力する検索
と全く同様である。次に、検索しようとする文字列を範
囲指定手段4および文字認識手段5によって文字データ
に変換する。この場合、文字認識手段5によって認識さ
れた文字列をそのまま、誤って認識された場合も含めて
そのまま検索対象の文字列とする。
In this search, a set of character strings to be searched 1
Up to the point where 4 is formed, it is exactly the same as the search for inputting the character string. Next, the character string to be searched is converted into character data by the range designation means 4 and the character recognition means 5. In this case, the character string recognized by the character recognizing means 5 is used as it is as the character string to be searched, including the case where it is erroneously recognized.

【0052】たとえば、「中間決算」なる文字列を検索
しようとする場合、「中間決算」が文字認識手段5によ
って「牛間決算」に認識されたとすると、「牛間決算」
のまま検索対象の文字列とする。これは、検索される方
の文字列の集合14においても「中間決算」は同一の文
字認識手段5によって「牛間決算」と誤認されている確
率が極めて高く、「牛間決算」を検索すれば所望のイメ
ージデータを探し当てることができるからである。検索
結果の表示と格納は上記文字列を入力する検索と全く同
様に行う。
For example, when searching for a character string "interim settlement", if "interim settlement" is recognized by the character recognizing means 5 as "cattle settlement", "cattle settlement"
Use the string as it is for the search. This is because even in the set of character strings 14 to be searched, there is a very high probability that the "interim settlement" is mistakenly recognized as "inter-financial settlement" by the same character recognizing means 5. This is because it is possible to find the desired image data. The display and storage of the search result are performed in exactly the same manner as the search for inputting the character string.

【0053】以上が本ファイル検索装置による検索であ
る。ところで、本ファイル検索装置は、文字認識手段5
によってイメージデータ中の所定の画素の配列を文字デ
ータ変換し、これを利用して、ワープロの文中にコピー
するなど編集を行うことができる。
The above is the search by the file search device. By the way, this file search device is provided with the character recognition means 5
According to this, the arrangement of a predetermined pixel in the image data is converted into character data, which can be used for editing such as copying in the text of a word processor.

【0054】図1に示すように、本装置の編集手段7
は、表示手段3によって表示されたイメージデータを参
照しながら、範囲指定手段4によって所定範囲を指定
し、これを文字認識手段5によって文字データに変換す
る。この文字データは編集データファイル17に格納さ
れ、ワープロ等の文章の編集に使用することができる。
また、範囲指定手段4によってイメージデータの所定範
囲を切り取り、これをそのまま編集データファイル17
に格納し、ワープロ等の文章への編入に供することもで
きる。
As shown in FIG. 1, the editing means 7 of this device.
While referring to the image data displayed by the display means 3, the range designation means 4 designates a predetermined range, and the character recognition means 5 converts it into character data. This character data is stored in the edit data file 17 and can be used for editing a text of a word processor or the like.
Further, a predetermined range of the image data is cut out by the range designating means 4, and this is directly used as the edit data file 17
It can also be stored in a file and used for incorporation into a text such as a word processor.

【0055】これにより、イメージデータとして格納さ
れた各種書類上の情報を活用でき、必要に応じて、従来
の情報から新しい情報を作成することができる。
As a result, information on various documents stored as image data can be utilized, and new information can be created from conventional information as needed.

【0056】[0056]

【発明の効果】以上の説明から明らかなように、本発明
によるファイル検索装置は、イメージ入力手段によって
各種の書類の情報をそのままイメージデータの形で格納
でき、従来のように情報格納時に検索用キーワードを付
したり、文字認識を行ったりする必要がない。このた
め、機械的に書類の情報を格納でき、大量の情報を素早
く格納することができる。
As is apparent from the above description, the file retrieval apparatus according to the present invention can store the information of various documents in the form of image data as it is by the image input means, and can be used for retrieval when storing the information as in the conventional case. There is no need to add keywords or perform character recognition. Therefore, the information of the document can be mechanically stored, and a large amount of information can be stored quickly.

【0057】また、本発明によるファイル検索装置は、
範囲指定手段によって検索される範囲を指定し、その範
囲内の画素の配列について文字認識手段によって文字認
識を行う。文字認識の結果は、その正否を検査・修正す
ることなく、検索される文字列とする。一方、検索手段
によって検索用に入力された文字列と、これに類似する
文字列とを検索対象の文字列とし、これらに相当する文
字列を前記検索される文字列の中から検出する。これに
より、文字認識の処理量を少なくし、かつ、文字認識の
結果を検査する労力を省き、さらに検索しようとする文
字列を含むイメージデータをすべて漏れなく検出するこ
とができる。
Further, the file search device according to the present invention is
A range to be searched is designated by the range designating means, and character recognition is performed by the character recognizing means on an array of pixels within the range. The result of character recognition is a character string to be searched without checking / correcting its correctness. On the other hand, a character string input for search by the search means and a character string similar thereto are set as character strings to be searched, and character strings corresponding to these are detected from the searched character strings. As a result, the processing amount of character recognition can be reduced, the labor for inspecting the result of character recognition can be saved, and all the image data including the character string to be searched can be detected without omission.

【0058】また、イメージデータ中の文字列を指定
し、これと同一の文字列を含むイメージデータを検索す
る検索によれば、印刷や読み取りの具合による文字認識
の誤りをそのまま利用し、少ない処理量によって確実に
求めるイメージデータを探し当てることができる。
Further, according to the search in which the character string in the image data is designated and the image data containing the same character string is searched, the character recognition error due to the printing or reading condition is used as it is, and a small amount of processing is performed. It is possible to find the image data to be surely found by the amount.

【0059】さらに、本ファイル検索装置によれば、必
要に応じてイメージデータの所定部分を切り取り、その
部分をイメージデータとしてのみでなく、文字認識手段
によって文字データに変換し、編集手段によってこれを
容易に活用することができる。
Further, according to the file searching apparatus, a predetermined portion of the image data is cut out if necessary, and the portion is converted into the character data by the character recognizing means not only as the image data, but also by the editing means. It can be used easily.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明によるファイル検索装置の一構成例とそ
の処理の流れを示したブロック図。
FIG. 1 is a block diagram showing a configuration example of a file search device according to the present invention and a processing flow thereof.

【図2】本発明のファイル検索装置の表示手段3による
一画面例を示した図。
FIG. 2 is a diagram showing an example of a screen displayed by a display unit 3 of the file search device according to the present invention.

【図3】本発明のファイル検索装置の検索手段6による
検索の処理を示した説明図。
FIG. 3 is an explanatory diagram showing a search process by a search means 6 of the file search device of the present invention.

【符号の説明】[Explanation of symbols]

1 イメージ入力手段 1a イメージスキャナ 1b ケーブル 2 記憶手段 3 表示手段 4 範囲指定手段 5 文字認識手段 6 検索手段 7 編集手段 8 表示装置 9 入力装置 10 イメージデータファイル 11 検索範囲の枠 12 範囲指定ファイル 13 辞書ファイル 14 文字データファイル 15 類似文字列生成部 16 検索データファイル 17 編集データファイル 1 Image Input Means 1a Image Scanner 1b Cable 2 Storage Means 3 Display Means 4 Range Specifying Means 5 Character Recognition Means 6 Search Means 7 Editing Means 8 Display Devices 9 Input Devices 10 Image Data Files 11 Search Range Frames 12 Range Designating Files 13 Dictionaries File 14 Character data file 15 Similar character string generator 16 Search data file 17 Edit data file

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/62 330A ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Office reference number FI technical display location G06F 15/62 330A

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】文字、記号、および図形をイメージデータ
として入力するイメージ入力手段と、 前記イメージ入力手段によって読み込まれたイメージデ
ータを、イメージデータのまま記憶する記憶手段と、 前記イメージデータを、1ページに1イメージデータを
表示する見出し付きのファイルの形式で表示する表示手
段と、 前記表示手段によって表示されたイメージデータの所定
部分を範囲として指定する範囲指定手段と、 前記範囲指定手段によって指定された範囲内の画素の配
列を文字データに変換する文字認識手段と、 前記文字認識手段によって変換された文字データを文字
データとして編集する編集手段と、を有していることを
特徴とするファイル検索装置。
1. An image input means for inputting characters, symbols, and graphics as image data; a storage means for storing the image data read by the image input means as image data; Display means for displaying one image data on a page in the form of a file with a heading, range designating means for designating a predetermined portion of the image data displayed by the display means as a range, and designation by the range designating means. A file search characterized by having a character recognition means for converting an array of pixels within a range into character data, and an editing means for editing the character data converted by the character recognition means as character data. apparatus.
【請求項2】所定の文字列に類似する文字列を生成する
類似文字列生成部を有し、 ユーザに検索しようとする文字列を入力させ、入力され
た文字列と、この入力された文字列に対して前記類似文
字列生成手段によって生成された類似文字列とを検索対
象として、前記範囲指定手段と文字認識手段とによって
範囲指定および文字変換された文字データから、前記検
索対象の文字列を検索する検索手段を備えたことを特徴
とする請求項1に記載のファイル検索装置。
2. A similar character string generation unit for generating a character string similar to a predetermined character string, allowing a user to input a character string to be searched, the input character string and the input character string. A character string to be searched from the character data range-designated and character-converted by the range designating unit and the character recognizing unit with a similar character string generated by the similar character string generating unit as a search target for a string 2. The file search device according to claim 1, further comprising a search means for searching.
【請求項3】前記類似文字列生成部は、所定の文字列に
類似する文字列に類似の確率に応じて順位を付し、 前記検索手段は、前記ユーザによって入力された文字列
を第一候補とし、前記類似文字列生成部によって生成さ
れた類似文字列を順位付きの候補として、候補の順位に
文字列を検索することを特徴とする請求項2に記載のフ
ァイル検索装置。
3. The similar character string generator assigns a rank to a character string similar to a predetermined character string according to the probability of similarity, and the searching means first selects the character string input by the user. The file search device according to claim 2, wherein the similar character string generated by the similar character string generation unit is used as a candidate and a character string is searched for in the rank of the candidate as a ranked candidate.
【請求項4】前記類似文字列生成部は、所定の文字とそ
れに類似する文字の対応ファイルを参照して類似文字列
を生成することを特徴とする請求項2に記載のファイル
検索装置。
4. The file search device according to claim 2, wherein the similar character string generation unit generates a similar character string by referring to a corresponding file of a predetermined character and a character similar thereto.
【請求項5】前記類似文字列生成部は、形状類似のルー
ルにより、入力された文字と形状が類似する文字を検索
して類似文字列を生成することを特徴とする請求項2に
記載のファイル検索装置。
5. The similar character string generating unit generates a similar character string by searching a character having a shape similar to that of an input character according to a shape similarity rule. File search device.
【請求項6】前記類似文字列生成部は、印刷・読み取り
による文字変形ルールにより、入力された文字に類似す
る文字を検索して類似文字列を生成することを特徴とす
る請求項2に記載のファイル検索装置。
6. The similar character string generating unit generates a similar character string by searching a character similar to an input character according to a character transformation rule by printing / reading. File search device.
【請求項7】前記範囲指定手段によって指定した範囲の
イメージを前記文字認識手段によって文字列に変換し、
この変換した文字列を検索対象として、前記範囲指定手
段と文字認識手段とによって範囲指定および文字変換さ
れた文字データから、前記検索対象の文字列を検索する
検索手段を備えたことを特徴とする請求項1に記載のフ
ァイル検索装置。
7. The image in the range designated by the range designating means is converted into a character string by the character recognizing means,
This converted character string is used as a search target, and a search means is provided for searching the character string to be searched from the character data that has been subjected to range specification and character conversion by the range specification means and the character recognition means. The file search device according to claim 1.
【請求項8】前記範囲指定手段は、一つのイメージデー
タの範囲を指定することにより、すべてのイメージデー
タの同一の範囲を指定することを特徴とする請求項1な
いし7のいずれかに記載のファイル検索装置。
8. The range specifying means specifies the same range of all image data by specifying a range of one image data, according to any one of claims 1 to 7. File search device.
JP7181850A 1995-07-18 1995-07-18 File retrieval device Pending JPH0934903A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP7181850A JPH0934903A (en) 1995-07-18 1995-07-18 File retrieval device
CN96190752A CN1165571A (en) 1995-07-18 1996-07-12 File searching device
PCT/JP1996/001954 WO1997004409A1 (en) 1995-07-18 1996-07-12 File searching device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7181850A JPH0934903A (en) 1995-07-18 1995-07-18 File retrieval device

Publications (1)

Publication Number Publication Date
JPH0934903A true JPH0934903A (en) 1997-02-07

Family

ID=16107922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7181850A Pending JPH0934903A (en) 1995-07-18 1995-07-18 File retrieval device

Country Status (3)

Country Link
JP (1) JPH0934903A (en)
CN (1) CN1165571A (en)
WO (1) WO1997004409A1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11191112A (en) * 1997-12-25 1999-07-13 Ebara Corp Character extracting method by template
JP2001034627A (en) * 1999-07-19 2001-02-09 Hitachi Ltd Method and system for receipt inspection and storage medium storing receipt inspecting program
JP2002063197A (en) * 2000-06-06 2002-02-28 Matsushita Electric Ind Co Ltd Retrieving device, recording medium and program
US6944344B2 (en) 2000-06-06 2005-09-13 Matsushita Electric Industrial Co., Ltd. Document search and retrieval apparatus, recording medium and program
JP2014026660A (en) * 2013-09-12 2014-02-06 Toppan Printing Co Ltd Data generation device and data generation method

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643641B1 (en) 2000-04-27 2003-11-04 Russell Snyder Web search engine with graphic snapshots
CN100370459C (en) * 2005-12-08 2008-02-20 华为技术有限公司 Method and apparatus for reducing paging data retrieve time
KR20150006740A (en) * 2013-07-09 2015-01-19 류중하 Method for Composing Mark Image Corresponding Letter, and Method for Analyzing Mark Image About Corresponding Letter

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2550068B2 (en) * 1987-05-13 1996-10-30 株式会社日立製作所 How to search and display information
JPH0512345A (en) * 1991-06-28 1993-01-22 Toshiba Corp Image storage device
JP3025724B2 (en) * 1992-11-24 2000-03-27 富士通株式会社 Synonym generation processing method
JPH07121547A (en) * 1993-10-21 1995-05-12 Matsushita Electric Ind Co Ltd Information retrieving device
JPH07152774A (en) * 1993-11-30 1995-06-16 Hitachi Ltd Document retrieval method and device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11191112A (en) * 1997-12-25 1999-07-13 Ebara Corp Character extracting method by template
JP2001034627A (en) * 1999-07-19 2001-02-09 Hitachi Ltd Method and system for receipt inspection and storage medium storing receipt inspecting program
JP2002063197A (en) * 2000-06-06 2002-02-28 Matsushita Electric Ind Co Ltd Retrieving device, recording medium and program
US6944344B2 (en) 2000-06-06 2005-09-13 Matsushita Electric Industrial Co., Ltd. Document search and retrieval apparatus, recording medium and program
JP2014026660A (en) * 2013-09-12 2014-02-06 Toppan Printing Co Ltd Data generation device and data generation method

Also Published As

Publication number Publication date
CN1165571A (en) 1997-11-19
WO1997004409A1 (en) 1997-02-06

Similar Documents

Publication Publication Date Title
JP4118349B2 (en) Document selection method and document server
US6671684B1 (en) Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
US7552381B2 (en) Check boxes for identifying and processing stored documents
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
EP1473641B1 (en) Information processing apparatus, method, storage medium and program
US6766069B1 (en) Text selection from images of documents using auto-completion
CN101178725B (en) Device and method for information retrieval
JP2006085733A (en) Filing/retrieval device and filing/retrieval method
US20050160115A1 (en) Document imaging and indexing system
JP2006146954A (en) Information processor and method for retrieving document
JPH05250408A (en) Method for interpolating important part of selected document without decoding document image through fetched information
Baird Difficult and urgent open problems in document image analysis for libraries
US20040034832A1 (en) Method and apparatus for foward annotating documents
JP4261988B2 (en) Image processing apparatus and method
JP2006202081A (en) Metadata creation apparatus
JPH0934903A (en) File retrieval device
JP2008040753A (en) Image processor and method, program and recording medium
JP2000322417A (en) Device and method for filing image and storage medium
JPH0793336A (en) Image storage device and image storage and retrieval device
JPH08180068A (en) Electronic filing device
JPH11238072A (en) Document keeping device
JP2022185874A (en) Information processing device, information processing system, information processing method, and program
JP2000020549A (en) Device for assisting input to document database system
JP4480109B2 (en) Image management apparatus and image management method
JP4823049B2 (en) Document image retrieval apparatus and program