JP2002123815A - Filing device - Google Patents

Filing device

Info

Publication number
JP2002123815A
JP2002123815A JP2000316409A JP2000316409A JP2002123815A JP 2002123815 A JP2002123815 A JP 2002123815A JP 2000316409 A JP2000316409 A JP 2000316409A JP 2000316409 A JP2000316409 A JP 2000316409A JP 2002123815 A JP2002123815 A JP 2002123815A
Authority
JP
Japan
Prior art keywords
item
data
item data
character
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000316409A
Other languages
Japanese (ja)
Inventor
Hiroyuki Masai
宏之 政井
Koichi Higuchi
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000316409A priority Critical patent/JP2002123815A/en
Publication of JP2002123815A publication Critical patent/JP2002123815A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To improve the efficiency and accuracy of the correcting work of character errors by retrieving item data in the range of identity from a plurality of documents respectively and comparatively displaying the item data on a screen. SOLUTION: The document image data read by an image reading section 110 are stored in an image data storage section 101 and an image database 120. A structure analyzing section 102 conducts the character recognition of a layout in the document image data and stores a recognition result in a structural analysis result database 130. When an item specifying section 103 accepts the specification of an item name from an operator, an item data acquiring section 104 acquires the item data corresponding to the item name from the structural analysis result database 130. When the operator specifies the item data, an item data collating section 106 extracts the item data in the range of the specified identity from the item data acquiring section 104 and concurrently displays the item data on the screen.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、文書などの書類
を画像データとして保存するファイリング装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a filing apparatus for storing a document such as a document as image data.

【0002】[0002]

【従来の技術】ファイリング装置は、画像読取装置で画
像データに変換された文書、帳票、図面などの書類を、
光磁気ディスクなどの記憶媒体に保存する装置である。
このファイリング装置によれば、1台の装置で大量の書
類を保存・管理することができるので、文書保管設備の
省スペース化等を図ることができる。
2. Description of the Related Art A filing apparatus converts documents, forms, drawings, etc., converted into image data by an image reading apparatus.
This is a device that stores data in a storage medium such as a magneto-optical disk.
According to this filing device, a large amount of documents can be stored and managed by one device, so that space saving of the document storage facility can be achieved.

【0003】ファイリング装置を用いて書類を保存・管
理する場合、記憶媒体に蓄積された書類群の中から、利
用者が意図する書類を検索する作業が必要になる。特
に、保管される書類が大量である場合には、この作業を
効率よく行うための機能が要求される。
[0003] When documents are stored and managed using a filing device, it is necessary to search for a document intended by the user from a group of documents stored in a storage medium. In particular, when a large number of documents are stored, a function for efficiently performing this operation is required.

【0004】保管書類の検索機能としては、例えば、キ
ーワードや分類コードを用いるものが知られている。こ
の検索機能では、操作者が、書類をファイリング装置に
格納する際に、キーワードや分類コードを入力する。各
書類は、格納時に入力されたキーワードや分類コードと
対応づけて、装置内の記憶媒体に蓄積される。そして、
書類検索時に、操作者が任意のキーワードあるいは分類
コードを入力すると、このキーワードなどに対応する書
類の一覧が作成され、画面に表示される。
As a search function of stored documents, for example, a function using a keyword or a classification code is known. In this search function, an operator inputs a keyword or a classification code when storing a document in a filing device. Each document is stored in a storage medium in the apparatus in association with a keyword or a classification code input at the time of storage. And
When the operator inputs an arbitrary keyword or classification code during document search, a list of documents corresponding to the keyword or the like is created and displayed on the screen.

【0005】また、キーワードを用いた検索技術の一種
として、ファイリング装置に格納された書類の全文から
任意の文字列を検索する技術が提案されている(特開平
8−87528号公報参照)。この技術では、画像読取
装置で読み取られた書類から文字矩形を抽出して、文字
認識技術を用いてテキストデータに変換し、画像データ
と対応づけて装置内に格納する。そして、書類検索時に
は、かかるテキストデータを用いて文字検索を行い、検
索文字列を含む書類の画像データを画面に表示する。
[0005] As a kind of search technique using a keyword, a technique for searching for an arbitrary character string from the entire text of a document stored in a filing device has been proposed (see Japanese Patent Application Laid-Open No. 8-87528). In this technique, a character rectangle is extracted from a document read by an image reading device, converted into text data using a character recognition technology, and stored in the device in association with the image data. At the time of document search, a character search is performed using the text data, and image data of the document including the search character string is displayed on the screen.

【0006】[0006]

【発明が解決しようとする課題】書類中の文字部分をテ
キストデータに変換して検索に利用しようとする場合、
文字認識の誤りが問題になる場合がある。このため、特
開平8−87528号公報に開示されたファイリング装
置(上述)では、文字認識処理時に候補となったテキス
トデータのすべてを、検索用のテキストデータとして装
置内に記憶することとしている。例えば、「ー」、
「一」、「−」は、文字認識技術で区別することは困難
である。このため、上記公報に開示されたファイリング
装置では、画像データ「サーチ」を検索用のテキストデ
ータに変換する場合には、「サーチ」、「サ一チ」、
「サ−チ」のいずれでも検索できるようにしている。こ
れにより、上記公報のファイリング装置では、文字認識
の誤りがあっても、ある程度の精度で書類検索を行うこ
とができる。
When a character portion in a document is converted into text data and is used for search,
Incorrect character recognition can be a problem. For this reason, in the filing apparatus (described above) disclosed in Japanese Patent Application Laid-Open No. 8-87528, all the text data candidates during the character recognition processing are stored in the apparatus as search text data. For example, "-",
"One" and "-" are difficult to distinguish by character recognition technology. Therefore, in the filing apparatus disclosed in the above publication, when the image data “search” is converted into text data for search, “search”, “search”,
It is possible to search for any of "search". Thus, the filing apparatus disclosed in the above publication can perform a document search with a certain degree of accuracy even if there is an error in character recognition.

【0007】しかしながら、このような検索機能を備え
ているファイリング装置でも、文字認識の誤りを修正し
たい場合がある。かかる場合、上記公報のファイリング
装置では、書類およびテキストデータを画面に表示し
て、操作者が目視で文字誤りをチェックしなければなら
なかった。このため、修正作業の効率が悪く、修正作業
の正確さにも限界があった。
However, even in a filing apparatus having such a search function, there are cases where it is desired to correct an error in character recognition. In such a case, in the filing apparatus of the above publication, the document and the text data must be displayed on the screen, and the operator must visually check for a character error. Therefore, the efficiency of the correction work is low, and the accuracy of the correction work is limited.

【0008】このような理由から、文字誤りの修正作業
を効率良く正確に行うことができるファイリング装置が
嘱望されていた。
For these reasons, there has been a demand for a filing apparatus capable of efficiently and accurately correcting a character error.

【0009】[0009]

【課題を解決するための手段】この発明に係るファイリ
ング装置は、文書画像データを外部から取り込んで一時
的に記憶するとともに、この文書画像データを外部の画
像データ蓄積手段に格納する画像データ記憶手段と、こ
の画像データ記憶手段に格納された文書画像データから
レイアウトを抽出し、このレイアウトの項目名記載欄お
よび項目データ記載欄を判別し、項目名記載欄および項
目データ記載欄から文字矩形を抽出し、且つ、これらの
文字矩形の文字認識を行って、この文字認識によって得
られた項目名および項目データを外部の構造解析結果蓄
積手段に格納する構造解析手段と、操作者に項目名の1
種類または複数種類を指定させるための項目指定手段
と、この項目指定手段によって指定された項目名に対応
する項目データを、構造解析結果蓄積手段から取得する
項目データ取得手段と、この項目データ取得手段によっ
て取得された項目データの1種類または複数種類を操作
者に指定させ、且つ、指定されたと同一性の範囲内にあ
る項目データを、項目データ取得手段が取得した項目デ
ータから抽出して、画面に表示させる項目データ照合手
段とを備える。
A filing apparatus according to the present invention fetches document image data from the outside and temporarily stores the document image data, and stores the document image data in an external image data storage means. Extract the layout from the document image data stored in the image data storage means, determine the item name entry field and the item data entry field of the layout, and extract the character rectangle from the item name entry field and the item data entry field And a structure analysis unit that performs character recognition of these character rectangles and stores the item names and item data obtained by the character recognition in an external structure analysis result storage unit.
Item designation means for designating a type or a plurality of types; item data acquisition means for acquiring item data corresponding to the item name designated by the item designation means from the structural analysis result accumulation means; and item data acquisition means The operator designates one or more types of item data acquired by the operator, and extracts item data within a range of the same as the designated item data from the item data acquired by the item data acquiring means. And item data collation means for displaying the data.

【0010】このような構成によれば、操作者が項目名
および項目データを指定し、これらの指定に対応する項
目データを抽出して、同時に画面に表示させることがで
きる。したがって、複数の書類の項目データを画面上で
対比させることができるので、文字認識の誤りを効率よ
く正確に修正することができる。
According to such a configuration, the operator can specify an item name and item data, extract the item data corresponding to these specifications, and simultaneously display the item data on the screen. Therefore, item data of a plurality of documents can be compared on the screen, so that an error in character recognition can be corrected efficiently and accurately.

【0011】[0011]

【発明の実施の形態】以下、この発明の実施の形態につ
いて、図面を用いて説明する。なお、図中、各構成成分
の大きさ、形状および配置関係は、本発明が理解できる
程度に概略的に示してあるにすぎず、また、以下に説明
する数値的条件は単なる例示にすぎない。
Embodiments of the present invention will be described below with reference to the drawings. In the drawings, the size, shape and arrangement relationship of each component are only schematically shown to the extent that the present invention can be understood, and the numerical conditions described below are merely examples. .

【0012】図1は、この実施の形態に係るファイリン
グ装置の構成を概念的に示すブロック図である。
FIG. 1 is a block diagram conceptually showing the configuration of a filing apparatus according to this embodiment.

【0013】図1に示したように、このファイリング装
置100は、画像読取部110、画像データベース12
0、構造解析結果データベース130および画像表示部
140に接続されている。また、このファイリング装置
100は、画像データ記憶部101、構造解析部10
2、項目指定部103、項目データ取得部104、項目
データ記憶部105、項目データ照合部106および項
目データ後処理部107を備えている。
As shown in FIG. 1, the filing apparatus 100 includes an image reading unit 110, an image database 12
0, connected to the structural analysis result database 130 and the image display unit 140. The filing apparatus 100 includes an image data storage unit 101, a structure analysis unit 10
2, an item specifying unit 103, an item data obtaining unit 104, an item data storage unit 105, an item data collating unit 106, and an item data post-processing unit 107.

【0014】画像読取部110は、帳票などの書類を光
学的に読み取り、この読み取りによって得られた光情報
を、量子化された電気信号(すなわち画像データ)に変
換する。
The image reading section 110 optically reads a document such as a form, and converts optical information obtained by the reading into a quantized electric signal (ie, image data).

【0015】画像データベース120は、例えば、光デ
ィスク、光磁気ディスク、ハードディスクなどの記憶媒
体を有する。画像データベース120は、画像データ記
憶部101から画像データおよびIDを受け取って、こ
の記憶媒体に蓄積する(後述)。
The image database 120 has a storage medium such as an optical disk, a magneto-optical disk, and a hard disk. The image database 120 receives the image data and the ID from the image data storage unit 101 and stores the image data and the ID in the storage medium (described later).

【0016】構造解析結果データベース130は、例え
ば光ディスク、光磁気ディスク、ハードディスクなど
の、記憶媒体を有する。構造解析結果データベース13
0は、構造解析部102から構造解析結果を受け取っ
て、この記憶媒体に蓄積する(後述)。
The structural analysis result database 130 has a storage medium such as an optical disk, a magneto-optical disk, and a hard disk. Structural analysis result database 13
No. 0 receives the structure analysis result from the structure analysis unit 102 and stores it in this storage medium (described later).

【0017】画像表示部140は、CRT(Cathode Ray
Tube)等の表示手段を備えており、項目データ照合部1
06や項目データ後処理部107等から入力したデータ
を表示する。
The image display unit 140 is a CRT (Cathode Ray).
Tube) etc., and the item data collating unit 1
06 and the data input from the item data post-processing unit 107 and the like.

【0018】画像データ記憶部101は、内部に、イメ
ージメモリ(図示せず)を備えている。また、画像デー
タ記憶部101は、画像読取部110から画像データを
入力して、このイメージメモリに一時的に格納するとと
もに、各画像データにIDを付与する。各画像データと
IDとは、画像データベース120に送られる。
The image data storage unit 101 has an image memory (not shown) inside. The image data storage unit 101 receives image data from the image reading unit 110, temporarily stores the image data in the image memory, and assigns an ID to each image data. Each image data and ID are sent to the image database 120.

【0019】構造解析部102は、画像データ記憶部1
01に格納された文書画像データの構造解析等を行う。
この解析によって、「項目名」、「項目データ」等のデ
ータが得られる。これらのデータは、文字の場合は文字
認識によって得られたテキストデータであり、文字でな
い場合は書類上の位置を示す座標データである。例え
ば、図2に示したような帳票の画像データの場合、項目
名としては、「住所」、「氏名」、「年齢」、「性
別」、「印鑑」がテキストデータとして得られ、これら
の項目名にそれぞれ対応する項目データとして、「○○
県△△市□□町××番地」、「日本太郎」、「26」、
「男」のテキストデータおよび捺印画像の位置を示す座
標データが得られる。文字認識の結果、候補文字が複数
個ある場合は、これら複数個の候補文字と、これらの候
補文字の候補順位とが、構造解析結果となる。また、候
補文字が0個の場合は、すべての文字が候補文字である
として扱う。構造解析の詳細については、後述する。こ
の構造解析によって得られたデータは、構造解析結果デ
ータベース130に送られる。
The structure analysis unit 102 includes the image data storage unit 1
For example, a structural analysis of the document image data stored in the storage unit 01 is performed.
Through this analysis, data such as “item name” and “item data” can be obtained. These data are text data obtained by character recognition in the case of a character, and are coordinate data indicating a position on a document in the case of not a character. For example, in the case of image data of a form as shown in FIG. 2, "address", "name", "age", "sex", and "seal" are obtained as text data as item names, and these items are obtained. As item data corresponding to each name, "XX
Prefecture △△ City □□ Town XX Address ”,“ Nippon Taro ”,“ 26 ”,
The text data of "male" and the coordinate data indicating the position of the seal image are obtained. As a result of character recognition, if there are a plurality of candidate characters, the plurality of candidate characters and the candidate order of these candidate characters become a structural analysis result. If there are no candidate characters, all the characters are treated as candidate characters. The details of the structural analysis will be described later. The data obtained by this structural analysis is sent to the structural analysis result database 130.

【0020】項目指定部103は、検索時に、操作者に
よる項目名の指定を受け付ける。指定される項目名は、
複数であってもよい。
The item designation section 103 accepts designation of an item name by an operator during a search. The specified item name is
There may be more than one.

【0021】項目データ取得部104は、項目指定部1
03で受け付けられた項目名に対応する項目データを、
構造解析結果データベース130に格納されたすべての
構造解析結果の中から検索し、該当する項目データをす
べて抽出する。項目指定部103で受け付けられた項目
名が複数である場合は、指定された項目名のすべてにつ
いて、同様の検索処理を行う。
The item data acquisition unit 104 is provided with the item designation unit 1
03, the item data corresponding to the item name received in
A search is made from all the structural analysis results stored in the structural analysis result database 130, and all relevant item data is extracted. When there are a plurality of item names accepted by the item designation unit 103, the same search processing is performed for all of the designated item names.

【0022】項目データ記憶部105は、内部に、イメ
ージメモリ(図示せず)を備えている。この項目データ
記憶部105は、項目データ取得部104の検索によっ
て得られた項目データが座標データであった場合に、こ
の座標に対応する部分画像データを画像データベース1
20から読み出して、このイメージメモリに一時的に格
納する。例えば図2の例の場合であれば、項目指定部1
03が受け付けた項目名が「印鑑」である場合、項目デ
ータ取得部104の検索によって捺印の位置を示す座標
データが得られ、さらに、項目データ記憶部105のイ
メージメモリに捺印の画像データが一時的に格納され
る。
The item data storage unit 105 has an image memory (not shown) inside. When the item data obtained by the search by the item data acquisition unit 104 is coordinate data, the item data storage unit 105 stores the partial image data corresponding to the coordinates in the image database 1.
20 and temporarily stored in the image memory. For example, in the case of the example of FIG.
In the case where the item name received in “03” is “seal”, coordinate data indicating the position of the seal is obtained by searching the item data acquisition unit 104, and the image data of the seal is temporarily stored in the image memory of the item data storage unit 105. Is stored.

【0023】項目データ照合部106は、操作者による
項目データの指定を受け付ける。操作者は、項目指定部
103で受け付けられた項目名に対応する項目データ
(すなわち、項目データ取得部104が取得した項目デ
ータ、または、項目データ記憶部105のイメージメモ
リに格納された項目データ)の中から、1個または複数
個の項目データを指定する。項目データ照合部106
は、照合処理を行うことによって、この指定と同一性の
範囲内にある項目データ(テキストデータおよび画像デ
ータ)を、項目データ取得部104および項目データ記
憶部105から抽出する。抽出された項目データは、す
べて、画像表示部140に表示される。テキストデータ
の候補文字が複数ある場合には、候補順位が1位の文字
が表示される。照合処理の詳細については、後述する。
The item data collating unit 106 receives designation of item data by an operator. The operator selects the item data corresponding to the item name received by the item designation unit 103 (that is, the item data acquired by the item data acquisition unit 104 or the item data stored in the image memory of the item data storage unit 105). , One or a plurality of item data are designated. Item data collation unit 106
Extracts the item data (text data and image data) within the range of the same as the designation from the item data acquisition unit 104 and the item data storage unit 105 by performing the collation processing. All of the extracted item data are displayed on the image display unit 140. When there are a plurality of candidate characters for the text data, the character having the first candidate rank is displayed. Details of the matching process will be described later.

【0024】項目データ後処理部107は、画像表示部
140に表示された項目データを修正する処理を行う。
操作者は、画像表示部140に表示された文字が誤りで
あると判断した場合は、図示しない入力手段等を用い
て、その文字の候補順位を変更し、正しい文字を候補順
位1位に設定する。
The item data post-processing unit 107 performs a process of correcting the item data displayed on the image display unit 140.
If the operator determines that the character displayed on the image display unit 140 is incorrect, the operator changes the candidate order of the character using input means (not shown) or the like and sets the correct character to the first candidate order. I do.

【0025】次に、図1に示したファイリング装置10
0の動作について説明する。図3は、ファイリング装置
100の動作を説明するためのフローチャートである。
Next, the filing apparatus 10 shown in FIG.
The operation of 0 will be described. FIG. 3 is a flowchart illustrating the operation of filing apparatus 100.

【0026】まず、操作者が、画像読取部110を操作
して書類を読み取らせると、この書類の画像データが画
像データ記憶部101に送られる。画像データ記憶部1
01は、この画像データを受け取って、画像格納処理を
行う(S301)。この画像格納処理では、まず、受け
取った画像データが内部のイメージメモリに格納され、
さらに、この画像データにIDが付されて画像データベ
ース120に格納される。
First, when an operator operates the image reading unit 110 to read a document, image data of the document is sent to the image data storage unit 101. Image data storage unit 1
01 receives this image data and performs image storage processing (S301). In this image storing process, first, the received image data is stored in an internal image memory,
Further, the image data is stored in the image database 120 with an ID.

【0027】次に、構造解析部102が、以下のような
構造解析処理を実行する(S302)。
Next, the structure analysis unit 102 executes the following structure analysis processing (S302).

【0028】まず、構造解析部102は、画像データ記
憶部101に格納された画像データを水平方向および垂
直方向に投影し、投影結果として得られる黒画素の塊の
輪郭外接矩形を求める。そして、この輪郭外接矩形の水
平方向の長さおよび垂直方向の長さが所定値を越える場
合は、この輪郭外接矩形が表矩形であると判定する。一
方、これらの長さが所定値以下である場合は、この輪郭
外接矩形が文字矩形であると判定する。例えば図2の画
像データの場合、「帳」、「票」、「A」の部分は文字
矩形であると判定され、表枠で囲まれた部分は表矩形で
あると判定される。
First, the structure analysis unit 102 projects the image data stored in the image data storage unit 101 in the horizontal direction and the vertical direction, and obtains a contour circumscribed rectangle of a black pixel block obtained as a projection result. When the horizontal length and the vertical length of the outline circumscribed rectangle exceed predetermined values, it is determined that the outline circumscribed rectangle is a table rectangle. On the other hand, when these lengths are equal to or smaller than the predetermined value, it is determined that the outline circumscribed rectangle is a character rectangle. For example, in the case of the image data of FIG. 2, the “book”, “vote”, and “A” portions are determined to be character rectangles, and the portion surrounded by the table frame is determined to be a table rectangle.

【0029】輪郭外接矩形が文字矩形である場合は、こ
の文字矩形を切り出して、文字認識を実行する。この文
字認識では、各文字矩形に対して0個以上の候補文字が
選定される。これらの候補文字と候補順位とは、帳票名
に関する構造解析結果になる。そして、各文字矩形につ
いての候補文字のうち、候補順位が1位の候補文字を組
み合わせたものが、帳票名のテキストデータとして採用
される。例えば、図2において、文字矩形「帳」の候補
文字が1位「帳」、2位「張」であり、文字矩形「票」
の候補文字が1位「票」、2位「要」であり、文字矩形
「A」の候補文字が1位「A」、2位「△」である場
合、帳票名のテキストデータは「帳票A」になる。後述
するように、帳票名のテキストデータ「帳票A」と、2
位以下の候補文字「張」、「要」、「△」および各候補
文字の候補順位とは、構造解析結果として、構造解析結
果データベース130に格納される。なお、候補文字が
0個である場合は、その旨のデータが、構造解析結果と
なる。例えば、文字矩形「票」に対して候補文字が0個
であった場合は、「帳?A」が、帳票名のテキストデー
タになる(?は不特定の一文字であることを示してい
る)。
When the outline circumscribed rectangle is a character rectangle, the character rectangle is cut out and character recognition is performed. In this character recognition, zero or more candidate characters are selected for each character rectangle. These candidate characters and candidate rankings are the result of a structural analysis on the form name. Then, of the candidate characters for each character rectangle, a combination of the candidate characters having the first candidate rank is adopted as the text data of the form name. For example, in FIG. 2, the candidate characters of the character rectangle “book” are the first place “book” and the second place “zhang”, and the character rectangle “vote”
Is the first place “vote” and the second place “necessary”, and the candidate character of the character rectangle “A” is the first place “A” and the second place “△”, the text data of the form name is “form A ". As will be described later, the form name text data “Form A” and 2
The candidate characters “Zhang”, “Necessary”, “$” and the candidate rank of each candidate character below the order are stored in the structure analysis result database 130 as the structure analysis result. If the number of candidate characters is 0, data indicating that is the structure analysis result. For example, if there are no candidate characters for the character rectangle “vote”, “book? A” becomes the text data of the form name (? Indicates an unspecified character). .

【0030】輪郭外接矩形が表矩形である場合は、この
表矩形を水平方向および垂直方向に投影する。そして、
投影結果として得られる黒画素の塊の長さが所定値以上
である場合に、この塊を罫線であると判断し、さらに、
水平/垂直方向の2本ずつの罫線で囲まれた領域を、表
枠矩形であると判断する。次に、表枠矩形の頂点座標か
ら表枠構造を求める。そして、この表枠構造に含まれる
表枠矩形のうち、最左列の各表枠矩形が項目名矩形であ
り、他の列の各表枠矩形は項目データ矩形であると判定
する。
If the outline circumscribed rectangle is a table rectangle, the table rectangle is projected in the horizontal and vertical directions. And
If the length of the black pixel block obtained as a projection result is equal to or greater than a predetermined value, the block is determined to be a ruled line, and
An area surrounded by two ruled lines in the horizontal / vertical directions is determined to be a table frame rectangle. Next, a table frame structure is obtained from the vertex coordinates of the table frame rectangle. Then, among the table frame rectangles included in this table frame structure, it is determined that each table frame rectangle in the leftmost column is an item name rectangle, and each table frame rectangle in the other columns is an item data rectangle.

【0031】次に、各項目名矩形に対して、文字認識を
実行する。この文字認識でも、上述の帳票名の場合と同
様、各文字矩形に対して0個以上の候補文字が選定さ
れ、これらの候補文字と候補順位とが構造解析結果にな
る。そして、各文字矩形についての候補文字のうち、候
補順位が1位の候補文字を組み合わせたものが、項目名
のテキストデータとして採用される。図2の場合、例え
ば、「住所」、「氏名」、「年齢」、「性別」および
「印鑑」が、項目名となる。後述するように、これらの
項目名と、2位以下の候補文字および各候補文字の候補
順位とは、構造解析結果として、構造解析結果データベ
ース130に格納される。なお、候補文字が0個である
場合は、その旨のデータが、構造解析結果となる。例え
ば、文字矩形「所」の候補文字が0個であった場合、
「住?」が、項目名になる。
Next, character recognition is executed for each item name rectangle. In this character recognition as well, as in the case of the above-mentioned form name, zero or more candidate characters are selected for each character rectangle, and these candidate characters and the candidate order become a structural analysis result. Then, of the candidate characters for each character rectangle, a combination of the candidate characters having the first candidate rank is adopted as the text data of the item name. In the case of FIG. 2, for example, "address", "name", "age", "sex" and "seal" are the item names. As will be described later, these item names, the candidate characters in the second and lower positions and the candidate rank of each candidate character are stored in the structure analysis result database 130 as the structure analysis result. If the number of candidate characters is 0, data indicating that is the structure analysis result. For example, if there are no candidate characters for the character rectangle “place”,
“House?” Is the item name.

【0032】続いて、各項目データ矩形の処理を実行す
る。項目データ矩形の処理では、この項目データ矩形が
文字に係るものである場合は、上述と同様の文字認識を
行い、候補順位が1位の候補文字を組み合わせたものを
項目データとする。一方、項目データ矩形が文字に係る
ものでない場合は、この項目データ矩形に対応する書類
(画像データ)のID(上記S301参照)と、この項
目データ矩形の頂点座標値とを、項目データとする。例
えば、対応する書類のIDをAAとし、項目データ矩形
の左上頂点座標を(X1 ,Y1 )とし、右下頂点座標を
(X2 ,Y2 )とすると、項目データは「ID=AA,
座標=(X1 ,Y1 ,X2 ,Y2)」となる。図2の場
合、例えば「○○県△△市□□町××番地」、「日本太
郎」、「26」、「男」が文字認識によって得られた項
目データとなり、捺印部分がIDおよび座標値による項
目データとなる。なお、候補文字が0個である場合は、
その旨のデータが、構造解析結果となる。例えば、文字
矩形「太」の候補文字が0個であった場合、「日本?
郎」が、項目データになる。
Subsequently, processing of each item data rectangle is executed. In the processing of the item data rectangle, if the item data rectangle is related to characters, the same character recognition as described above is performed, and the combination of the candidate characters having the first candidate rank is set as the item data. On the other hand, if the item data rectangle does not relate to characters, the ID of the document (image data) corresponding to the item data rectangle (see S301) and the vertex coordinate values of the item data rectangle are used as the item data. . For example, if the ID of the corresponding document is AA, the upper left vertex coordinates of the item data rectangle are (X 1 , Y 1 ), and the lower right vertex coordinates are (X 2 , Y 2 ), the item data is “ID = AA” ,
Coordinates = (X 1 , Y 1 , X 2 , Y 2 ) ”. In the case of FIG. 2, for example, “XX prefecture XX town XX address”, “Nippon Taro”, “26”, and “male” are item data obtained by character recognition, and the stamped portion is the ID and coordinates. Item data by value. If there are no candidate characters,
The data to that effect is the result of the structural analysis. For example, if there are no candidate characters for the character rectangle “thick”, “Japan?
Is the item data.

【0033】以上の構造解析処理によって得られた構造
解析結果は、構造解析結果データベース130に格納さ
れる。図4は、図2の画像データに対する構造解析結果
のうち、帳票名、項目名および項目データを示してい
る。この例では、項目名「住所」と項目データ「○○県
△△市□□町××番地」、項目名「氏名」と項目データ
「日本太郎」、項目名「年齢」と項目データ「26」、
項目名「性別」と項目データ「男」および項目名「印
鑑」と項目データ「ID=AA,座標=(X1 ,Y 1
2 ,Y2)」が、それぞれ、対応づけて格納される。
これらに加えて、構造解析結果には、文字認識によって
得られた他の候補文字およびこれらの候補文字の候補順
位が含まれる。これら候補文字および候補順位も、該当
する1位の候補文字に対応づけて、格納される。
The structure obtained by the above structure analysis processing
The analysis results are stored in the structural analysis result database 130.
It is. FIG. 4 is a structural analysis result for the image data of FIG.
Form name, item name and item data
You. In this example, the item name “address” and the item data “
△△ city □ town XX address ”, item name“ name ”and item data
"Taro Nippon", item name "age" and item data "26",
Item name "sex", item data "male" and item name "mark"
Kan ”and item data“ ID = AA, coordinates = (X1, Y 1,
XTwo, YTwo) "Are stored in association with each other.
In addition to these, the structural analysis results include character recognition
Other candidate characters obtained and the candidate order of these candidate characters
Rank is included. These candidate characters and candidate rankings are also applicable.
Is stored in association with the first candidate character.

【0034】次に、項目指定部103が、項目指定を受
け付ける(S303)。操作者は、図示しない入力手段
等を用いて、1個または複数個の項目名を指定する。以
下の説明では、操作者が、項目名として、「印鑑」およ
び「氏名」を指定した場合について説明する。
Next, the item specification section 103 receives the item specification (S303). The operator specifies one or a plurality of item names using input means or the like (not shown). In the following description, a case will be described in which the operator designates “seal” and “name” as item names.

【0035】続いて、項目データ取得部104が、上記
S303で指定された項目名に対応する項目データを、
構造解析結果データベース130から取得する(S30
4)。ここで、指定された項目名を含む構造解析結果が
複数格納されている場合には、すべての構造解析結果か
ら、この項目名に対応する項目データがすべて取得され
る。例えば、項目名「氏名」に対して、項目データとし
て「日本太郎」以外のテキストデータが多数取得される
場合もある。同様に、項目名「印鑑」に対しても、複数
種類の項目データ(上述の「ID=AA,座標=
(X1 ,Y1 ,X2 ,Y2)」の形式で表される項目デ
ータ)が取得される場合がある。
Subsequently, the item data obtaining unit 104 stores the item data corresponding to the item name specified in S303.
Acquired from the structural analysis result database 130 (S30
4). Here, when a plurality of structural analysis results including the designated item name are stored, all item data corresponding to the item name is obtained from all the structural analysis results. For example, a large number of text data items other than “Nippon Taro” may be acquired as item data for the item name “name”. Similarly, a plurality of types of item data (“ID = AA, coordinate =
(X 1 , Y 1 , X 2 , Y 2 ) ”in some cases).

【0036】次に、項目データ記憶部105が、上記S
304で取得された項目データのうち、テキストでない
項目データ(すなわち、上述の「ID=AA,座標=
(X1,Y1 ,X2 ,Y2)」の形式で表される項目デー
タ)に対応する部分画像データを、画像データベース1
20から取り込んで、内部のイメージメモリに格納する
(S305)。例えば項目名「印鑑」を含む構造解析結
果が複数個ある場合には、それぞれの部分画像データ
が、各書類から取り込まれる。
Next, the item data storage unit 105 stores the S
Of the item data obtained in step 304, item data that is not text (that is, “ID = AA, coordinate =
(X 1 , Y 1 , X 2 , Y 2 ) ”in the image database 1.
20 and stored in the internal image memory (S305). For example, when there are a plurality of structural analysis results including the item name “seal”, each partial image data is taken in from each document.

【0037】次に、項目データ照合部106が、項目デ
ータ照合処理を実行する(S306)。
Next, the item data collating unit 106 executes an item data collating process (S306).

【0038】この項目データ照合処理では、まず、項目
データの指定が受け付けられる。操作者は、項目データ
取得部104によって取得された項目データの中から、
1個または複数個を指定する。この指定は、例えば、こ
れらの項目データをテキストデータ或いは部分画像デー
タとして画像表示部140に表示させて操作者に選択さ
せることにより、行うことができる。
In this item data collation processing, first, designation of item data is received. The operator selects, from the item data acquired by the item data acquiring unit 104,
Specify one or more. This designation can be performed, for example, by displaying these item data as text data or partial image data on the image display unit 140 and allowing the operator to select them.

【0039】項目データが指定されると、項目データ照
合部106が、検索処理を行う。
When the item data is specified, the item data collating unit 106 performs a search process.

【0040】指定された項目データが部分画像データ
(すなわち、文字でない項目データ)である場合、この
検索処理では、この部分画像データを、項目データ記憶
部105に格納された部分画像データと順次イメージ照
合し、一致する部分画像データを探し出す。そして、一
致すると判断された部分画像データと同じ構造解析結果
に含まれ且つ項目名「氏名」に対応する項目データが、
項目データ取得部104から抽出される。照合処理によ
って得られた各部分画像データと、これらの部分画像デ
ータに対応する項目データとは、対応関係が明確になる
ようなフォーマットで、画像表示部140に表示され
る。図5は、この画面表示の一例を示す概念図である。
図5に示した例では、照合処理によって4個の部分画像
データが得られ、これらの部分画像データに対応させ
て、同じ構造解析結果内の項目データ(項目名「氏名」
に対応するもの)が、表示されている。
When the designated item data is partial image data (that is, non-character item data), in this search processing, the partial image data is sequentially converted into the partial image data stored in the item data storage unit 105 and the partial image data. The matching is performed, and matching partial image data is searched for. Then, the item data included in the same structural analysis result as the partial image data determined to match and corresponding to the item name “name” is
It is extracted from the item data acquisition unit 104. Each of the partial image data obtained by the collation processing and the item data corresponding to the partial image data are displayed on the image display unit 140 in a format that makes the correspondence clear. FIG. 5 is a conceptual diagram showing an example of this screen display.
In the example shown in FIG. 5, four pieces of partial image data are obtained by the matching process, and the item data (item name “name”) in the same structural analysis result is associated with these partial image data.
) Are displayed.

【0041】一方、指定された項目データがテキストデ
ータである場合、この検索処理では、この項目データ
を、項目データ取得部104によって同時に取得された
各項目データと順次照合し、同一性の範囲内にある項目
データを探し出す。この明細書で、「同一性の範囲内」
とは、候補順位が2位以降の候補文字や候補文字が0個
のものを含む場合も同一であるとみなすことを意味す
る。例えば、指定された項目データが「日本太郎」であ
る場合、例えば「大」の候補順位が1位であり且つ
「太」の候補順位が2位である項目データも(この項目
データは例えば「日本大郎」となる)、同一性の範囲内
にある項目データとして扱われる。また、「日本?郎」
(?は候補文字が0個であることを示す)も、同一性の
範囲内にある項目データとして扱われる。次に、同一性
の範囲内にあると判断された項目データと同じ画像デー
タに含まれ且つ項目名「印鑑」に対応する部分画像デー
タが、項目データ記憶部105のイメージメモリから抽
出される。照合処理によって得られた各項目データと、
これらの項目データに対応する部分画像データとは、対
応関係が明確になるようなフォーマットで、画像表示部
140に表示される。
On the other hand, when the designated item data is text data, in this search processing, the item data is sequentially collated with each item data simultaneously acquired by the item data acquiring unit 104, and within the range of the identity. Find the item data in. In this specification, "within the scope of identity"
This means that the same is applied to the case where the candidate character including the second or subsequent candidate character or the candidate character including 0 candidate character is included. For example, when the designated item data is “Nippon Taro”, for example, the item data in which the candidate ranking of “Large” is first and the candidate ranking of “Fat” is second (for example, this item data is “ "Nippon Dairo") is treated as item data within the range of the identity. Also, "Japan?"
(? Indicates that there are no candidate characters) is also treated as item data within the sameness range. Next, partial image data included in the same image data as the item data determined to be within the sameness range and corresponding to the item name “seal” is extracted from the image memory of the item data storage unit 105. Each item data obtained by the matching process,
The partial image data corresponding to these item data is displayed on the image display unit 140 in a format that makes the correspondence clear.

【0042】次に、項目データ後処理部107が、項目
データ後処理を実行する(S307)。操作者は、画像
表示部140の表示(図5参照)を目視して、文字認識
等の誤りを探す。図5の例では、項目名「氏名」に対応
する項目データのうち、1個のみが「日本大郎」であ
り、他は「日本太郎」である。したがって、操作者は、
「日本大郎」の「大」を「太」の誤りであると、容易に
気付くことができる。操作者は、図示しない入力手段等
を用いて、「日本大郎」の「大」は「太」に修正する。
項目データ後処理部107は、この修正を受け付ける
と、「太」の候補順位を1位に変更し、「大」の候補順
位を例えば2位に変換する。
Next, the item data post-processing unit 107 executes the item data post-processing (S307). The operator looks at the display (see FIG. 5) on the image display unit 140 and searches for an error such as character recognition. In the example of FIG. 5, among the item data corresponding to the item name “name”, only one is “Nippon Taro” and the other is “Nippon Taro”. Therefore, the operator:
It is easy to notice that "large" in "Nihon Dairo" is an error of "thick". The operator corrects "large" of "Nihon Daro" to "thick" using input means (not shown) or the like.
Upon receiving this correction, the item data post-processing unit 107 changes the candidate ranking of “thick” to first and converts the candidate ranking of “large” to, for example, second.

【0043】以上説明したように、この実施の形態に係
るファイリング装置によれば、同一性の範囲内にある項
目データを複数の書類から探し出して、対比させて表示
することができる。したがって、文字誤りの修正作業を
効率良く正確に行うことができる。
As described above, according to the filing apparatus of this embodiment, item data within the same range can be searched for from a plurality of documents and displayed in comparison. Therefore, the correcting operation of the character error can be efficiently and accurately performed.

【0044】また、この実施の形態に係るファイリング
装置によれば、項目データが画像データである場合にも
検索・照合を行うことができ、この点でも、修正作業を
効率良く正確に行うことができる。
Further, according to the filing apparatus according to the present embodiment, search / collation can be performed even when the item data is image data, and in this regard, the correction work can be performed efficiently and accurately. it can.

【0045】なお、この実施の形態の構造解析処理で
は、水平/垂直方向の投影によって得られた黒画素の塊
の長さを用いて罫線を判断したが、例えば、水平/垂直
方向のランレングスにおける連結黒画素数を用いて罫線
の判断を行ってもよい。また、この実施の形態の構造解
析処理では、罫線に囲まれた領域を表枠矩形であると判
断したが、予め入手した、文書固有のフォーマット情報
を使用して表枠矩形の判断を行ってもよい。
In the structure analysis processing of this embodiment, ruled lines are determined using the lengths of black pixel clusters obtained by horizontal / vertical projection. For example, horizontal / vertical run lengths are determined. The ruled line may be determined using the number of connected black pixels in. In the structure analysis processing of this embodiment, the area surrounded by the ruled lines is determined to be a table frame rectangle. However, the table frame rectangle is determined using document-specific format information obtained in advance. Is also good.

【0046】さらに、この実施の形態では、上述のよう
にして罫線の判断および表枠矩形の判断を行った後で、
項目データは項目名の右に位置するという前提で構造解
析を行ったが、文書構造のレイアウト規則を文書モデル
として構造解析を行ってもよい(例えば特願平7−23
2285号公報参照)。
Further, in this embodiment, after the determination of the ruled line and the determination of the table frame rectangle as described above,
Although the structural analysis is performed on the premise that the item data is located to the right of the item name, the structural analysis may be performed using the layout rule of the document structure as a document model (for example, Japanese Patent Application No. 7-23).
No. 2285).

【0047】加えて、この実施の形態では、項目データ
照合部に部分画像データの照合とテキストデータの照合
とを行わせることとしたが、項目データが部分画像デー
タかテキストデータかが明らかである環境で使用する場
合には、部分画像データまたはテキストデータの一方の
みを照合するようにファイリング装置を構成してもよ
い。
In addition, in this embodiment, the item data matching section is made to perform the matching of the partial image data and the matching of the text data. However, it is clear whether the item data is the partial image data or the text data. When used in an environment, the filing apparatus may be configured to match only one of the partial image data and the text data.

【0048】[0048]

【発明の効果】以上詳細に説明したように、本発明によ
れば、一致する項目データを複数の書類から探し出して
対比表示させることができ、且つ、画像データによる検
索を行うことができるので、文字誤りの修正作業を効率
良く正確に行うことができる。
As described in detail above, according to the present invention, matching item data can be searched for from a plurality of documents and displayed in a contrasting manner, and a search using image data can be performed. Correction of character errors can be performed efficiently and accurately.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施の形態に係るファイリング装置の全体構成
を概略的に示すブロック図である。
FIG. 1 is a block diagram schematically showing an overall configuration of a filing apparatus according to an embodiment.

【図2】実施の形態に係るファイリング装置に読み込む
書類の一例を示す概念図である。
FIG. 2 is a conceptual diagram showing an example of a document to be read into a filing device according to the embodiment.

【図3】実施の形態に係るファイリング装置の動作を説
明するためのフローチャートである。
FIG. 3 is a flowchart for explaining the operation of the filing apparatus according to the embodiment.

【図4】実施の形態に係るファイリング装置の動作を説
明するための概念図である。
FIG. 4 is a conceptual diagram for explaining the operation of the filing apparatus according to the embodiment.

【図5】実施の形態に係るファイリング装置の画面表示
例を示す概念図である。
FIG. 5 is a conceptual diagram showing a screen display example of the filing apparatus according to the embodiment.

【符号の説明】[Explanation of symbols]

100 ファイリング装置 101 画像データ記憶部 102 構造解析部 103 項目指定部 104 項目データ取得部 105 項目データ記憶部 106 項目データ照合部 107 項目データ後処理部 110 画像読取部 120 画像データベース 130 構造解析結果データベース 140 画像表示部 Reference Signs List 100 filing device 101 image data storage unit 102 structure analysis unit 103 item specification unit 104 item data acquisition unit 105 item data storage unit 106 item data collation unit 107 item data post-processing unit 110 image reading unit 120 image database 130 structure analysis result database 140 Image display

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 文書画像データを外部から取り込んで一
時的に記憶するとともに、この文書画像データを外部の
画像データ蓄積手段に格納する画像データ記憶手段と、 この画像データ記憶手段に格納された前記文書画像デー
タからレイアウトを抽出し、このレイアウトの項目名記
載欄および項目データ記載欄を判別し、前記項目名記載
欄および前記項目データ記載欄から文字矩形を抽出し、
且つ、これらの文字矩形の文字認識を行って、この文字
認識によって得られた前記項目名および前記項目データ
を外部の構造解析結果蓄積手段に格納する構造解析手段
と、 操作者に前記項目名の1種類または複数種類を指定させ
るための項目指定手段と、 この項目指定手段によって指定された前記項目名に対応
する前記項目データを、前記構造解析結果蓄積手段から
取得する項目データ取得手段と、 この項目データ取得手段によって取得された前記項目デ
ータの1種類または複数種類を前記操作者に指定させ、
且つ、指定されたと同一性の範囲内にある前記項目デー
タを、前記項目データ取得手段が取得した前記項目デー
タから抽出して、画面に表示させる項目データ照合手段
と、 を備えることを特徴とするファイリング装置。
1. An image data storage means for fetching and temporarily storing document image data from the outside, and storing the document image data in an external image data storage means; Extracting a layout from the document image data, determining an item name entry field and an item data entry field of the layout, extracting a character rectangle from the item name entry field and the item data entry field,
And a structure analysis unit that performs character recognition of these character rectangles and stores the item names and the item data obtained by the character recognition in an external structure analysis result storage unit. Item designation means for designating one or more kinds; item data acquisition means for acquiring the item data corresponding to the item name designated by the item designation means from the structural analysis result accumulation means; Causing the operator to specify one or more types of the item data obtained by the item data obtaining unit;
And item data collating means for extracting the item data within the specified range of the identity from the item data acquired by the item data acquiring means and displaying the extracted item data on a screen. Filing device.
【請求項2】 前記項目データの記載が文字矩形でない
場合に、前記構造解析手段が、この記載の位置を特定す
るための座標データを生成して、前記構造解析結果蓄積
手段に格納することを特徴とする請求項1に記載のファ
イリング装置。
2. When the description of the item data is not a character rectangle, the structure analysis means generates coordinate data for specifying the position of the description and stores the coordinate data in the structure analysis result storage means. The filing apparatus according to claim 1, wherein
【請求項3】 前記項目データの記載が文字矩形でない
場合に、前記項目データ照合手段が、前記座標データを
用いて前記画像データ蓄積手段から抽出された画像を前
記画面に表示させることを特徴とする請求項2に記載の
ファイリング装置。
3. When the description of the item data is not a character rectangle, the item data matching means displays an image extracted from the image data storage means using the coordinate data on the screen. The filing apparatus according to claim 2, wherein
【請求項4】 前記構造解析手段の文字認識の結果、同
一の前記文字矩形に対する候補文字が複数ある場合に、
これらの複数の候補文字と候補順位とが前記構造解析結
果蓄積手段に記憶されることを特徴とする請求項1〜3
のいずれかに記載のファイリング装置。
4. As a result of character recognition by said structure analysis means, when there are a plurality of candidate characters for the same character rectangle,
4. A method according to claim 1, wherein said plurality of candidate characters and candidate ranks are stored in said structural analysis result storage means.
The filing apparatus according to any one of the above.
【請求項5】 前記照合手段が、前記項目データとし
て、前記候補順位が一位の文字を画面に表示させること
を特徴とする請求項4に記載のファイリング装置。
5. The filing apparatus according to claim 4, wherein the collating means displays the character having the first candidate rank on the screen as the item data.
【請求項6】 前記候補文字の前記候補順位を変更する
ための項目データ後処理手段をさらに備えることを特徴
とする請求項5に記載のファイリング装置。
6. The filing apparatus according to claim 5, further comprising item data post-processing means for changing the candidate order of the candidate character.
JP2000316409A 2000-10-17 2000-10-17 Filing device Withdrawn JP2002123815A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000316409A JP2002123815A (en) 2000-10-17 2000-10-17 Filing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000316409A JP2002123815A (en) 2000-10-17 2000-10-17 Filing device

Publications (1)

Publication Number Publication Date
JP2002123815A true JP2002123815A (en) 2002-04-26

Family

ID=18795363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000316409A Withdrawn JP2002123815A (en) 2000-10-17 2000-10-17 Filing device

Country Status (1)

Country Link
JP (1) JP2002123815A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058624A (en) * 2005-08-25 2007-03-08 Fuji Xerox Co Ltd Information processor, information processing method, and computer program
US7925082B2 (en) 2006-03-03 2011-04-12 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, computer readable medium, and computer data signal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058624A (en) * 2005-08-25 2007-03-08 Fuji Xerox Co Ltd Information processor, information processing method, and computer program
US7925082B2 (en) 2006-03-03 2011-04-12 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, computer readable medium, and computer data signal

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
JP5402099B2 (en) Information processing system, information processing apparatus, information processing method, and program
US8577882B2 (en) Method and system for searching multilingual documents
JPH11161681A (en) Device and method for displaying retrieval result, and computer-readable recording medium where series of instructions are recorded to output retrieval result
JP2004234228A (en) Image search device, keyword assignment method in image search device, and program
US20060047732A1 (en) Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program
JP2004334334A (en) Document retrieval system, document retrieval method, and storage medium
US20050097080A1 (en) System and method for automatically locating searched text in an image file
US20220222292A1 (en) Method and system for ideogram character analysis
CN110659346A (en) Table extraction method, device, terminal and computer readable storage medium
JPH1115834A (en) Picture processor and its controlling method
CN116225956A (en) Automated testing method, apparatus, computer device and storage medium
JP2002123815A (en) Filing device
JPH10289245A (en) Image processor and its control method
JP3792759B2 (en) Character recognition method and apparatus
US10095802B2 (en) Methods and systems for using field characteristics to index, search for, and retrieve forms
CN112560849A (en) Neural network algorithm-based grammar segmentation method and system
JPH08153110A (en) Device and method for filing document
JPH08180066A (en) Index preparation method, document retrieval method and document retrieval device
JP3233803B2 (en) Hard-to-read kanji search device
JP2013182459A (en) Information processing apparatus, information processing method, and program
JPH05120471A (en) Character recognizing device
JPH06162107A (en) Electronic filing system
JP2002342711A (en) Image recognizing device and image recognizing method and program for realizing the image recognizing method and recording medium recorded with its program
KR20030018519A (en) The Easy Chinese Character Input and Correction Method using Image Retrieval Technologies

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080108