JPH1055405A - Device and method for reading directory - Google Patents

Device and method for reading directory

Info

Publication number
JPH1055405A
JPH1055405A JP8209829A JP20982996A JPH1055405A JP H1055405 A JPH1055405 A JP H1055405A JP 8209829 A JP8209829 A JP 8209829A JP 20982996 A JP20982996 A JP 20982996A JP H1055405 A JPH1055405 A JP H1055405A
Authority
JP
Japan
Prior art keywords
address book
data
address
character
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8209829A
Other languages
Japanese (ja)
Inventor
Takafumi Ito
隆文 伊藤
Hideki Yabe
秀樹 矢部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8209829A priority Critical patent/JPH1055405A/en
Publication of JPH1055405A publication Critical patent/JPH1055405A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To generate directory data by reading a directory recorded in an original and easily and surely dividing it into each directory datum. SOLUTION: A directory reading device for reading a character concerning the directory recorded in the original and generating directory data is provided with an image reading control part 34 which reads image data by optical scanning the original where plural kinds of directory data consisting of the characters concerning the directory about plural items are arranged and recorded, a character recognition control part 36 which recognizes the character based on read image data, in item recognition control part 38 which detects the character concerning the directory corresponding to the specified item from the recognized character and a directory recognition control part 30 which detects the division of directory data every datum as against the character based on the character concerning the detected directory.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、原稿に記録された
住所録を光学的に読取り、1件毎の住所データに区切ら
れた住所録データを作成する住所録読み取り装置及び住
所録読み取り方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an address book reading apparatus and an address book reading method for optically reading an address book recorded on a manuscript and creating address book data divided into address data for each case. .

【0002】[0002]

【従来の技術】光学式文字読み取り(OCR)は、紙に
印刷された文字等を光学的に走査することによってイメ
ージデータを検出し、このイメージデータをもとに文字
を認識して文字コード化する技術である。このOCRの
応用技術の一つに、住所録が記録された原稿からイメー
ジデータを検出して、自動的にパーソナルコンピュー
タ、ワードプロセッサ、携帯型電子機器などにおいて利
用できる住所録データ(アドレスデータ)に変換する住
所録読取りの機能がある。
2. Description of the Related Art In optical character reading (OCR), image data is detected by optically scanning characters or the like printed on paper, and characters are recognized based on the image data to form a character code. Technology. One of the applied technologies of OCR is that image data is detected from a document in which an address book is recorded and automatically converted to address book data (address data) that can be used in personal computers, word processors, portable electronic devices, and the like. Address book reading function.

【0003】住所録は、複数の項目(氏名、住所、電話
番号等)のそれぞれに対応する内容(文字列)から構成
される複数の住所データが配列されており、各項目毎の
住所録に関する文字を読取りデータ化するされる。
In the address book, a plurality of address data composed of contents (character strings) corresponding to a plurality of items (name, address, telephone number, etc.) are arranged. Characters are read and converted into data.

【0004】原稿に記録された住所録を読み取って、住
所録データに変換する場合、1件分の(一人分)の住所
データに区切り必要がある。従来では、1件毎の区切り
位置の検出を次のようにして行なっていた。
When an address book recorded on a manuscript is read and converted into address book data, it is necessary to divide the data into address data for one case (for one person). Conventionally, the detection of a break position for each case has been performed as follows.

【0005】(1)原稿中に罫線がある場合、実際の住
所データ範囲の開始位置を指定して、この開始位置から
下にある住所録ののうち、例えば横罫線を認識、抽出
し、この横罫線で区切られた位置によって1件分の住所
データとする。
(1) When a ruled line exists in a document, a start position of an actual address data range is designated, and, for example, a horizontal ruled line is recognized and extracted from an address book below the start position. One piece of address data is determined based on positions separated by horizontal ruled lines.

【0006】(2)原稿中に罫線がない原稿、原稿全体
のイメージを読取って、住所録のイメージを表示し、表
示画面上において1件毎の住所データの区切り位置を手
動によって指定することによって区切り位置を決定す
る。
(2) By reading an image of an original having no ruled lines in the original and the entire original, displaying an image of an address book, and manually specifying a delimiter position of each address data on a display screen. Determine the break position.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、従来の
技術においては、以下のような問題があった。 (1)罫線をもとに住所データの区切り位置を決定する
方法の場合、比較的単純に横罫線の存在のみで区切って
いたので、例えば図13に示すように、原稿中に横罫線
が設けられている場合には、1件毎の住所データの区切
り位置を正しく検出することができず、正しい住所録の
読取りが行なわれなかった。
However, the prior art has the following problems. (1) In the method of determining the break position of the address data based on the ruled line, the rule is relatively simply divided only by the existence of the horizontal ruled line. For example, as shown in FIG. 13, a horizontal ruled line is provided in the document. In this case, the delimiter position of the address data for each case could not be correctly detected, and the address book could not be read correctly.

【0008】すなわち、図13(a)に示す例では、本
来、図中Bの範囲を1つの住所データとして扱うべきで
あるが、住所と会社名、また電話番号とファクス番号と
の間に横罫線(実線)が設けられているために、場合に
よっては図中Aを住所データとして扱ってしまう場合が
ある。
That is, in the example shown in FIG. 13 (a), the range B in the figure should be handled as one piece of address data, but the range between the address and the company name or between the telephone number and the fax number should be used. Since ruled lines (solid lines) are provided, A in the figure may be treated as address data in some cases.

【0009】図13(b)に示す例では、同様にして本
来、図中Dの範囲を1つの住所データとして扱うべき中
に他と異なる線種の横罫線(点線)が設けられているた
めに、この位置を住所データの区切りとしてしまう場合
がある。
In the example shown in FIG. 13 (b), similarly, a horizontal ruled line (dotted line) of a line type different from the others is provided while the range D in the figure should be treated as one piece of address data. In some cases, this position is used as a delimiter for address data.

【0010】(2)住所録の1件毎の住所データの区切
り位置の指定を入力する方法では、作業負担が大きく、
特に大量の住所録について住所録データを作成する場合
には、膨大な作業が必要となってしまう。
(2) In the method of inputting the designation of the break point of the address data for each address book, the work load is large,
In particular, when creating address book data for a large number of address books, an enormous amount of work is required.

【0011】本発明は前記のような事情を考慮してなさ
れたもので、原稿に記録された住所録を読取り、簡単か
つ確実に1件毎の住所データに区切って住所録データを
作成することが可能な住所録読み取り装置及び住所録読
み取り方法を提供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above-described circumstances, and is intended to read an address book recorded on a manuscript and to easily and surely divide the address data into individual address data to create address book data. It is an object of the present invention to provide an address book reading device and an address book reading method capable of reading an address book.

【0012】[0012]

【課題を解決するための手段】本発明は、原稿に記録さ
れた住所録に関する文字を読み取り、住所録データを作
成する住所録読み取り装置において、複数個の項目につ
いての住所録に関する文字からなる住所データが複数個
配列されて記録された原稿を光学的に走査することによ
ってイメージデータを読み込むイメージ読込み手段と、
前記イメージ読込み手段によって読み込まれたイメージ
データをもとに文字を認識する文字認識手段と、前記文
字認識手段によって認識された文字から、特定の項目に
対応する住所録に関する文字を検出する項目認識手段
と、前記項目認識手段により検出された住所録に関する
文字をもとに、この文字に対する1件毎の住所データの
区切りを検出する住所録認識手段とを具備したことを特
徴とする。
SUMMARY OF THE INVENTION According to the present invention, there is provided an address book reading apparatus for reading characters related to an address book recorded on a document and creating address book data. Image reading means for reading image data by optically scanning a document on which a plurality of data are arranged and recorded,
Character recognition means for recognizing characters based on the image data read by the image reading means; and item recognition means for detecting, from the characters recognized by the character recognition means, characters relating to an address book corresponding to a specific item. And address book recognizing means for detecting a break of address data for each character on the basis of characters related to the address book detected by the item recognizing means.

【0013】これにより、罫線によって住所データが区
切られていない、文字だけからなる住所録が記録された
原稿からであっても、記録された文字自体の内容をもと
に、1件毎の住所データに区切ることができ操作性が向
上される。
[0013] Thus, even if the address data is not separated by ruled lines, even from a document in which an address book consisting only of characters is recorded, the address of each case is determined based on the contents of the recorded characters themselves. The operability can be improved by dividing the data.

【0014】また本発明は、原稿に記録された住所録に
関する文字を読み取り、住所録データを作成する住所録
読み取り装置において、複数個の項目についての住所録
に関する文字からなる住所データが複数個配列されて記
録された原稿を光学的に走査することによってイメージ
データを読み込むイメージ読込み手段と、前記イメージ
読込み手段によって読み込まれたイメージデータをもと
に文字を認識する文字認識手段と、前記イメージ読込み
手段によって読み込まれたイメージデータをもとに線成
分を認識する線認識手段と、前記線認識手段によって認
識された線成分の特徴から、一定の条件を満たす線成分
を抽出する有効線検出手段と、前記有効線検出手段によ
って抽出された線成分をもとに、前記文字認識手段によ
って認識された文字に対する1件毎の住所データの区切
りを検出する住所録認識手段とを具備したことを特徴と
する。
Further, according to the present invention, in an address book reading apparatus for reading characters related to an address book recorded on a document and creating address book data, a plurality of address data consisting of characters related to the address book for a plurality of items are arranged. Image reading means for reading image data by optically scanning the recorded document, character recognition means for recognizing characters based on the image data read by the image reading means, and image reading means Line recognition means for recognizing a line component based on the image data read by, and an effective line detection means for extracting a line component satisfying a certain condition from the characteristics of the line component recognized by the line recognition means, The sentence recognized by the character recognition unit based on the line component extracted by the effective line detection unit. Characterized by comprising the address book recognition means for detecting a break address data for each 1 against.

【0015】これにより、罫線等が含まれる住所録が記
録された原稿について、住所データの区切り位置を表さ
ない線が混在する場合であっても、不要なセグメンテー
ションが除去され、有効な線のみに基づいて住所データ
の区切り位置が検出されるので、確実かつ簡単に住所録
データが作成される。
[0015] With this, even in a case where a line on which an address book including ruled lines or the like is recorded is mixed with a line that does not represent a delimiter position of address data, unnecessary segmentation is removed and only valid lines are removed. , The address data delimiter position is detected, so that address book data can be created reliably and easily.

【0016】また、前記有効線検出手段は、線成分の特
徴として、少なくとも直線の種類または線の長さの何れ
か一方を利用することを特徴とする。例えば、住所録に
よっては、住所データの区切りを示す線(例えば実線)
と住所データ中の区切りを示す線(点線)とを使い分け
ている場合があり、線成分の特徴を利用することで確実
に住所データの区切り位置を確定できる。また、住所デ
ータの区切りを表す線であれば、住所データの文字列の
長さよりも長いことが考えられ、こうした特徴を利用す
ることで、同様に確実に住所データの区切り位置を確定
できる。
Further, the effective line detecting means uses at least one of a line type and a line length as a characteristic of a line component. For example, depending on the address book, a line (for example, a solid line) indicating a division of address data
And a line (dotted line) indicating a break in the address data may be used properly, and the break position of the address data can be definitely determined by using the feature of the line component. In addition, a line representing a delimiter of address data may be longer than the length of the character string of the address data, and by using such a feature, the position of the delimiter of the address data can be similarly reliably determined.

【0017】また、前記イメージ読込み手段によって読
み込まれたイメージデータをもとに線成分を認識する線
認識手段をさらに具備し、前記住所録認識手段は、前記
線認識手段によって認識された線成分の特徴と、前記項
目認識手段によって検出された住所録に関する文字をも
とに、1件毎の住所データの区切りを検出することを特
徴とする。
Further, the image processing apparatus further comprises a line recognition means for recognizing a line component based on the image data read by the image reading means, wherein the address book recognition means comprises a It is characterized in that a break of address data for each case is detected based on a feature and characters related to the address book detected by the item recognition means.

【0018】これにより、住所録が記録された原稿中に
住所データを区切る線を含む場合に、線の特徴と住所録
の項目に対応する内容(文字列)の両方を組合わせて、
住所データの分割位置を決定することで、分割の精度が
向上される。
[0018] With this configuration, when a manuscript in which an address book is recorded includes a line that separates address data, both the characteristics of the line and the content (character string) corresponding to the address book item are combined.
By determining the division position of the address data, the division accuracy is improved.

【0019】また、前記線認識手段による線成分の特徴
をもとにして1件毎の住所データを区切った後、前記住
所データ中に一定の特定の項目に対応する住所録に関す
る文字が含まれているか否かによって、区切り位置が有
効か否かを判断することを特徴とする。
Further, after dividing the address data for each case based on the characteristics of the line components by the line recognition means, the address data includes characters related to an address book corresponding to a certain specific item. It is characterized in that it is determined whether or not the delimiter position is valid depending on whether or not there is a break position.

【0020】これにより、住所録に含まれる線を利用し
て決定した区切り位置を、特定の項目に対応する住所録
に関する文字を利用して正当性を確認するので、2段階
の判断により、住所データの区切り位置の精度が向上さ
れる。
In this way, the validity of the delimiter position determined using the lines included in the address book is confirmed using characters related to the address book corresponding to the specific item. The accuracy of the data break position is improved.

【0021】また、前記住所録認識手段によって住所デ
ータの区切りを検出する前に、前記文字認識手段によっ
て認識された文字から、特定項目を表す文字を予め除去
することを特徴とする。
Further, before detecting a break of address data by the address book recognizing means, a character representing a specific item is removed from the characters recognized by the character recognizing means in advance.

【0022】これにより、住所録中に含まれている住所
データに含まれない文字列、例えば原稿のタイトルとな
っている「住所録」「アドレス帳」などの文字列を予め
除去することで、不要な文字列がその後の住所データを
分割するための処理に悪影響を及ぼすことを防ぎ、住所
データの分割、認識精度が向上される。
By removing character strings not included in the address data included in the address book, for example, character strings such as "address book" and "address book", which are the titles of the manuscript, in advance, Unnecessary character strings are prevented from adversely affecting subsequent processing for dividing address data, and the accuracy of dividing and recognizing address data is improved.

【0023】また本発明、複数個の項目についての住所
録に関する文字からなる住所データが複数個配列されて
記録された原稿から文字を読み取り、住所録データを作
成する住所録読み取り装置において、原稿から読み取ら
れた文字に対して、1件の住所データ毎に区切り位置を
検出する区切り位置検出手段と、前記区切り位置検出手
段によって検出された区切り位置を任意に与えられる指
示に応じて変更する区切り位置訂正手段とを具備したこ
とを特徴とする。
Further, according to the present invention, in an address book reading apparatus for reading characters from a document on which a plurality of address data including characters related to an address book for a plurality of items are arranged and recorded and creating address book data, A delimiter position detecting means for detecting a delimiter position for each piece of address data for a read character, and a delimiter position for changing a delimiter position detected by the delimiter position detector according to an instruction given arbitrarily Correction means.

【0024】これにより、装置によって自動的に検出さ
れた住所データの区切り位置が正しくない場合には、必
要に応じて手動操作によって任意に区切り位置を変更す
ることができ、自動による区切り位置の検出精度に応じ
た必要最低限の操作によって確実に住所データの区切り
位置の設定ができる。
[0024] With this, if the delimiter position of the address data automatically detected by the device is incorrect, the delimiter position can be arbitrarily changed by a manual operation as needed, and the delimiter position is automatically detected. The delimiter position of the address data can be reliably set by the minimum required operation according to the accuracy.

【0025】また、前記区切り位置訂正手段は、前記区
切り位置検出手段によって検出された区切り位置の訂正
を1件分行ない、その後に、1件毎の区切り位置の変更
を行なうか否かを確定することを特徴とする。
Further, the delimiter position correcting means corrects the delimiter position detected by the delimiter position detection means for one case, and thereafter determines whether or not to change the delimiter position for each case. It is characterized by the following.

【0026】これにより、装置によって自動的に検出さ
れた住所データの区切り位置を変更する場合、操作が判
りやすくなり、また1件分の訂正によって、この訂正内
容に応じて以下同様の規則によって区切り位置を決定で
きれば、1件毎の区切り位置の変更を省略することもで
きる。
This makes it easy to understand the operation of changing the delimiter position of the address data automatically detected by the apparatus. In addition, by correcting one case, the delimiter position is changed according to the same rule as described below. If the position can be determined, the change of the break position for each case can be omitted.

【0027】また、前記項目認識手段による各項目に対
応する文字の検出状況に応じて項目の表示優先度を決定
して、検出された文字に対する編集対象を変更する優先
度変更手段を具備することを特徴とする。
[0027] Further, there is provided priority changing means for determining the display priority of the item in accordance with the detection state of the character corresponding to each item by the item recognizing means, and changing the editing target for the detected character. It is characterized by.

【0028】これにより、住所録から読み取った各項目
に対応する内容(文字列)の検出状況に応じて、内容の
記載が少ない項目の表示優先度を下げることで、編集対
象とする項目を効率的に選択されるため操作性が向上さ
れる。
Thus, the display priority of an item with a small content is reduced according to the detection status of the content (character string) corresponding to each item read from the address book. Operability is improved due to the selective selection.

【0029】[0029]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図1は本実施形態に係わる
住所録読み取り装置の構成を示すブロック図である。住
所録読み取り装置は、例えば記憶媒体に記録されたプロ
グラムを読込み、このプログラムによって動作が制御さ
れるコンピュータによって実現される。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a configuration of an address book reading device according to the present embodiment. The address book reading device reads a program recorded on a storage medium, for example, and is realized by a computer whose operation is controlled by the program.

【0030】図1に示すように、CPU10、ROM1
2、RAM14、フロッピーディスク装置(FDD)1
6、カラースキャナ装置18、キーボード(KB)2
0、ディスプレイコントローラ22、VRAM(Video
RAM)24、カラーディスプレイ装置26、カラープ
リンタ装置28によって構成されている。
As shown in FIG. 1, a CPU 10 and a ROM 1
2, RAM 14, floppy disk drive (FDD) 1
6, color scanner device 18, keyboard (KB) 2
0, display controller 22, VRAM (Video
RAM) 24, a color display device 26, and a color printer device 28.

【0031】CPU10は、装置全体を制御するもの
で、ROM12及びRAM14に格納されたプログラム
に従う動作によりイメージを含む文書を作成する機能を
制御する。
The CPU 10 controls the entire apparatus, and controls a function of creating a document including an image by an operation according to a program stored in the ROM 12 and the RAM 14.

【0032】ROM12は、CPU10を制御するため
のプログラムや固定的なデータを記憶している。RAM
14は、CPU10を制御するためのプログラムの他、
各種データを一時的に記憶させるバッファメモリとして
使用される。
The ROM 12 stores programs for controlling the CPU 10 and fixed data. RAM
14 is a program for controlling the CPU 10,
It is used as a buffer memory for temporarily storing various data.

【0033】フロッピーディスク装置(FDD)16
は、文書やイメージ等のファイル等のフロッピーディス
クに対する読み書きや、装置の動作を制御するためのプ
ログラムのファイルの読出し等を行なう。
Floppy disk drive (FDD) 16
Performs reading and writing of a file such as a document and an image on a floppy disk, reading of a file of a program for controlling an operation of the apparatus, and the like.

【0034】カラースキャナ装置18は、住所録等が記
録された原稿を光学的に読み取ってイメージデータに変
換する。キーボード(KB)20は、文字の入力やカラ
ープリンタ装置28に対する操作を含む特定の指示を行
なうための入力装置である。キーボード12には、「文
字」キー、「数値」キーをはじめ、「カーソル」キー等
の他、「印刷」キー、「イメージ入力」キー等が割り当
てられている。
The color scanner 18 optically reads a document on which an address book or the like is recorded and converts the document into image data. The keyboard (KB) 20 is an input device for inputting characters and performing specific instructions including operations on the color printer device 28. The keyboard 12 is assigned a "print" key, an "image input" key, and the like, in addition to a "character" key, a "numerical value" key, a "cursor" key, and the like.

【0035】ディスプレイコントローラ22は、CPU
10の制御のもとでVRAM24に展開される表示デー
タをについてカラーディスプレイ装置26に表示させ
る。VRAM24は、カラーディスプレイ装置26にお
いて表示されるべき表示データが展開される。
The display controller 22 has a CPU
The display data developed in the VRAM 24 under the control of 10 is displayed on the color display device 26. In the VRAM 24, display data to be displayed on the color display device 26 is expanded.

【0036】カラーディスプレイ装置26は、ディスプ
レイコントローラ22の制御によってVRAM24にお
いて展開された表示データをもとにしたイメージや文書
等の表示を行なう。
The color display device 26 displays images, documents, and the like based on the display data developed in the VRAM 24 under the control of the display controller 22.

【0037】カラープリンタ装置28は、RAM14に
格納された住所録やイメージ等のデータをもとに印刷を
行なう。図2は、図1に示す構成によって実現される住
所録読み取り装置の機能構成(ソフトウェア)を示す図
である。
The color printer device 28 performs printing based on data such as an address book and images stored in the RAM 14. FIG. 2 is a diagram showing a functional configuration (software) of the address book reading device realized by the configuration shown in FIG.

【0038】各部は、CPU10によってメモリに格納
されたプログラムを実行することによって実現される機
能である。図2に示すように、住所録読み取り装置は、
住所録認識制御部30、住所録編集制御部32、イメー
ジ読込制御部34、文字認識制御部36、項目認識制御
部38、キーワード辞書40、及び線認識制御部42に
よって構成される。
Each section is a function realized by the CPU 10 executing a program stored in the memory. As shown in FIG. 2, the address book reading device includes:
It is composed of an address book recognition control unit 30, an address book edit control unit 32, an image reading control unit 34, a character recognition control unit 36, an item recognition control unit 38, a keyword dictionary 40, and a line recognition control unit 42.

【0039】住所録認識制御部30は、住所録読み取り
動作全体の制御を司るもので、後述する図5及び図6に
示すフローチャートの手順に従って各部を制御する。住
所録認識制御部30には、区切り位置訂正部30aが設
けられている。区切り位置訂正部30aは、文字認識制
御部36、項目認識制御部38、及び線認識制御部42
における処理をもとに区分された、原稿から読み取られ
た住所データについて、1件毎の区切り位置を例えばK
B20から任意に与えられる指示に応じて変更する。
The address book recognition control section 30 controls the entire operation of reading the address book, and controls each section in accordance with the procedures of flowcharts shown in FIGS. 5 and 6 described later. The address book recognition control unit 30 is provided with a break position correction unit 30a. The break position correction unit 30a includes a character recognition control unit 36, an item recognition control unit 38, and a line recognition control unit 42.
In the address data read from the document, which is classified based on the processing in
It is changed according to an instruction arbitrarily given from B20.

【0040】住所録編集制御部32は、原稿から読み取
られた住所録データに対して、表示画面に表示させた上
で編集(内容訂正、新規入力等)を行なう。また、住所
録編集制御部32には優先度変更部32aが設けられて
いる。優先度変更部32aは、住所録中の各項目に対応
する文字の検出状況に応じて項目の表示優先度を決定し
て、検出された文字に対する編集対象を設定する。すな
わち、優先度変更部32aは、原稿において内容の記載
が少ない項目の表示優先度を下げるように制御する。
The address book editing control unit 32 edits (edits contents, newly inputs, etc.) the address book data read from the manuscript after displaying it on the display screen. The address book editing control section 32 is provided with a priority changing section 32a. The priority changing unit 32a determines the display priority of the item according to the detection state of the character corresponding to each item in the address book, and sets an editing target for the detected character. That is, the priority changing unit 32a controls so as to lower the display priority of an item whose content is less described in the document.

【0041】イメージ読込制御部34は、カラースキャ
ナ装置18を制御して、複数個の項目についての住所録
に関する文字からなる住所データが複数個配列されて記
録された原稿を光学的に走査することによってイメージ
データを読み込む。
The image reading control unit 34 controls the color scanner device 18 to optically scan an original on which a plurality of address data including characters related to an address book for a plurality of items are recorded and arranged. Read the image data.

【0042】文字認識制御部36は、イメージ読込制御
部34の制御によって読み込まれたイメージデータをも
とに文字を認識して文字コード化する。この際、文字認
識制御部36は、各文字について複数の候補文字も求め
る。
The character recognition control unit 36 recognizes characters based on the image data read under the control of the image reading control unit 34 and converts them into character codes. At this time, the character recognition control unit 36 also obtains a plurality of candidate characters for each character.

【0043】項目認識制御部38は、文字認識制御部3
6によって認識された文字から、特定の項目に対応する
住所録に関する文字を、キーワード辞書40に登録され
た辞書データ(キーワード)を参照して検出する。項目
認識制御部38は、文字認識制御部36によって認識さ
れた文字列の各文字に対応する複数の候補文字を組合わ
せて生成される文字列が、キーワード辞書40に登録さ
れたキーワードと一致するかどうかを識別することによ
って、特定の項目に対応する住所録に関する文字である
か否かを検出する。
The item recognition control unit 38 includes the character recognition control unit 3
6, characters related to an address book corresponding to a specific item are detected by referring to dictionary data (keywords) registered in the keyword dictionary 40. The item recognition control unit 38 determines that a character string generated by combining a plurality of candidate characters corresponding to each character of the character string recognized by the character recognition control unit 36 matches a keyword registered in the keyword dictionary 40. By detecting whether or not the character is a character related to the address book corresponding to the specific item.

【0044】キーワード辞書40は、項目認識制御部3
8における処理によって住所録に関する文字列を認識す
るための辞書であり、住所録に用いられる各項目に対応
する文字列毎に辞書データ(キーワード)が登録されて
いる。
The keyword dictionary 40 includes the item recognition control unit 3
8 is a dictionary for recognizing a character string relating to the address book by the processing in 8, and dictionary data (keyword) is registered for each character string corresponding to each item used in the address book.

【0045】線認識制御部42は、イメージ読込制御部
34によって原稿から読み取られたイメージデータをも
とに、原稿上における罫線等の線成分を抽出する。線認
識制御部42は、線成分としてイメージデータに含まれ
る直線の位置、線種(実線、破線、点線等)、長さを特
徴として検出する。また線認識制御部42には、有効線
検出部42aが設けられている。有効線検出部42a
は、線成分の特徴から、または線成分の特徴とイメージ
読込制御部34によって読み込まれたイメージ中の文字
位置との対応関係(線と文字の相対位置等)から、一定
の条件を満たす線成分を抽出するもので、線成分の特徴
として少なくとも直線の種類または線の長さの何れか一
方を利用する。
The line recognition control unit 42 extracts line components such as ruled lines on the document based on the image data read from the document by the image reading control unit 34. The line recognition control unit 42 detects, as features, the position, type (solid line, broken line, dotted line, etc.) and length of a straight line included in the image data as a line component. Further, the line recognition control unit 42 is provided with an effective line detection unit 42a. Effective line detector 42a
The line component satisfying a certain condition is obtained from the feature of the line component or the correspondence between the feature of the line component and the character position in the image read by the image reading control unit 34 (the relative position between the line and the character). And at least one of the type of the straight line and the length of the line is used as the feature of the line component.

【0046】本実施形態では、例えば図3または図4に
示すような住所録が記録された原稿(住所録用紙)から
住所録に関する文字を読取り、1件毎の住所データに区
分して住所録データを作成するものとする。
In this embodiment, characters related to the address book are read from a document (address book sheet) on which the address book is recorded as shown in FIG. 3 or FIG. Data shall be created.

【0047】図3に示す住所録用紙は罫線が含まれた住
所録であり、横方向に複数の項目が配列され、各項目に
対応する内容(文字列)からなる住所データが縦方向に
配列されて記録されている。図3において、「NO.」
[氏名」「〒」「住所」「備考」が項目である。罫線
は、項目行及び各住所データの行を区分する位置と、各
項目と対応する内容を区分する位置に設けられている。
The address book sheet shown in FIG. 3 is an address book including ruled lines, in which a plurality of items are arranged in a horizontal direction, and address data including contents (character strings) corresponding to each item are arranged in a vertical direction. Has been recorded. In FIG. 3, "NO."
[Name], [@], [Address] and [Remarks] are items. The ruled line is provided at a position for dividing the item line and the line of each address data, and a position for dividing the contents corresponding to each item.

【0048】図4に示す住所用紙は罫線を含まない住所
録であり、項目と各項目に対応する住所データの配列
は、図3の罫線を除いた形態と同じである。次に、本実
施形態における住所録データ作成の動作について、図5
及び図6に示すフローチャートを参照しながら説明す
る。
The address sheet shown in FIG. 4 is an address book not including ruled lines, and the arrangement of items and address data corresponding to each item is the same as that of FIG. 3 except for the ruled lines. Next, the operation of creating the address book data in the present embodiment will be described with reference to FIG.
And a flowchart shown in FIG.

【0049】まず、住所録データ作成の実行が指示され
ると住所録認識制御部30が起動される。住所録認識制
御部30は、はじめに住所録読取りの対象とする原稿
が、図3に示すような罫線付きの原稿か(罫線つきモー
ド)、図4に示すような文字のみによる原稿であるか
(罫線なしモード)の指定を、使用者の操作により例え
ばKB20より入力する(ステップA1)。
First, when an instruction to create address book data is issued, the address book recognition control unit 30 is started. The address book recognition control unit 30 first determines whether the document to be read in the address book is a document with ruled lines as shown in FIG. 3 (ruled line mode) or a document with only characters as shown in FIG. The designation of the ruled lineless mode) is input by the user through, for example, the KB 20 (step A1).

【0050】住所録認識制御部30は、イメージ読込制
御部34に対して原稿からのイメージデータの読込みの
実行を指示する。イメージ読込制御部34は、カラース
キャナ装置18を制御して、カラースキャナ装置18に
セットされた原稿を光学的に走査することによって1ペ
ージ分のイメージデータを読み取る(ステップA2)。
The address book recognition control unit 30 instructs the image reading control unit 34 to execute reading of image data from a document. The image reading control unit 34 controls the color scanner 18 to read one page of image data by optically scanning a document set on the color scanner 18 (step A2).

【0051】ここで、住所録認識制御部30は、ステッ
プA1において罫線付きモードが指定されている場合
(ステップA3)、線認識制御部42によって原稿のイ
メージデータ中から直線成分を検出させる(ステップA
4)。
When the mode with a ruled line is specified in step A1 (step A3), the address book recognition control section 30 causes the line recognition control section 42 to detect a linear component from the image data of the document (step A3). A
4).

【0052】線認識制御部42は、直線成分として線の
位置、線種、長さなどを検出する。なお、こうした成分
を検出する手法としては、既存の技術を用いることがで
きるので詳細な説明を省略する。
The line recognition control unit 42 detects a line position, a line type, a length and the like as a straight line component. In addition, as a technique for detecting such components, an existing technique can be used, and thus detailed description is omitted.

【0053】また住所録認識制御部30は、文字認識制
御部36によって原稿のイメージデータ中から文字を認
識させる(ステップA5)。文字認識制御部36は、例
えばイメージデータから文字の領域を抽出し、1文字毎
の文字パターンを切り出し、文字パターン認識用辞書パ
ターンとマッチングすることによって文字を認識する。
The address book recognition control unit 30 causes the character recognition control unit 36 to recognize characters from the image data of the document (step A5). The character recognition control unit 36, for example, extracts a character area from image data, cuts out a character pattern for each character, and matches the character pattern with a character pattern recognition dictionary pattern to recognize a character.

【0054】項目認識制御部38は、文字認識制御部3
6による文字認識結果から、住所録に用いられてる特定
の項目に対応する文字列(キーワード)を、キーワード
辞書40を用いて抽出する(ステップA6)。
The item recognition control unit 38 includes the character recognition control unit 3.
6, a character string (keyword) corresponding to a specific item used in the address book is extracted using the keyword dictionary 40 (step A6).

【0055】例えば、原稿に「住所」という文字列が存
在し、これらの文字列に対して文字認識を行なった結
果、図7に示すように、各文字に3つの文字候補が得ら
れたとする。すなわち、第1文字目に対する文字候補と
して「往」「住」「個」、第2文字目に対する文字候補
として「所」「祈」「折」である。項目認識制御部38
は、第1文字目の文字候補と第2文字目の文字候補との
組み合わせによって生成される各文字列が、キーワード
としてキーワード辞書40に登録されているかを調べ
る。
For example, it is assumed that a character string "address" exists in a document, and as a result of performing character recognition on these character strings, three character candidates are obtained for each character as shown in FIG. . That is, the character candidates for the first character are “go”, “house”, and “individual”, and the character candidates for the second character are “place”, “pray”, and “fold”. Item recognition control unit 38
Checks whether each character string generated by combining the first character candidate and the second character candidate is registered in the keyword dictionary 40 as a keyword.

【0056】キーワード辞書40に「住所」が登録され
ていると、第1文字目の第2候補と第2文字目の第1候
補の組み合わせの文字列が「住所」となるので、「住
所」がキーワードとして抽出される。
If "address" is registered in the keyword dictionary 40, the character string of the combination of the second candidate for the first character and the first candidate for the second character is "address". Is extracted as a keyword.

【0057】キーワード辞書には、図8に示すように、
姓名データ、住所キーワードデータ、所属データ、肩書
きデータ、特定キーワードデータ等、住所録において使
用される各項目に対応する辞書データ(キーワード)が
登録されている。
In the keyword dictionary, as shown in FIG.
Dictionary data (keywords) corresponding to each item used in the address book, such as first and last name data, address keyword data, affiliation data, title data, and specific keyword data, are registered.

【0058】姓名データには「伊藤」「山田」「太郎」
…などの姓名に使用されるキーワード、住所キーワード
データには「東京(都)」「**県」「**市」「**
町」「**丁目」などの住所に使用されるキーワード、
所属データには「会社」「研究所」「**庁」「**
課」「**会社」「**小学校」といったキーワード、
肩書きデータには「課長」「部長」「係長」といったキ
ーワード、特定キーワードデータには「住所」「氏名」
「電話番号」「アドレス」「TEL」「FAX」「住所
録」「アドレス帳」といった住所録の項目やタイトルに
使用されるキーワードが含まれる(なお、以上の「*」
は任意の文字を表す)。
The first and last name data include "Ito", "Yamada", and "Taro".
Keywords used for first and last names such as… and address keyword data include “Tokyo (Tokyo)”, “** Prefecture”, “** City”, and “**”.
Keywords used for addresses such as "town" and "** chome"
Affiliation data includes “Company”, “Laboratory”, “** Agency”, “**”
Section, "** company", "** elementary school"
For title data, keywords such as “section manager”, “department manager”, “section manager”, and for specific keyword data, “address”, “name”
It includes keywords used for the items and titles of the address book such as "telephone number", "address", "TEL", "FAX", "address book", and "address book" (note that "*"
Represents any character).

【0059】さらに項目認識制御部38は、「***」
「***−**」といった文字列があれば郵便番号、
「***−****」「***(****)****」
といった文字列があれば電話番号であることも検出する
(なお、以上の「*」は任意の数字を表す)。
Further, the item recognition control unit 38 outputs “***”
If there is a character string such as "***-**", the postal code,
"***-***""*** (***) ***"
If there is such a character string, it is also detected that it is a telephone number (note that "*" represents an arbitrary number).

【0060】項目認識制御部38は、文字認識結果から
のキーワードの抽出を完了すると、抽出したキーワード
中の住所録データとして不要なキーワードを削除する
(ステップA7)。
When the extraction of the keyword from the character recognition result is completed, the item recognition control unit 38 deletes an unnecessary keyword as address book data in the extracted keyword (step A7).

【0061】住所録原稿にはタイトルとして、図9に示
すような語(「住所録」)が入っている場合がある。こ
の種の文字列は、住所録データとしては不要な語であ
り、その後の1件毎に住所データを区分するための処理
や、住所録項目に対する対応づけに悪影響(不正な処理
結果となる)を及ぼすので、文字認識結果の文字列から
削除する。「住所録」の他にも、「アドレス帳」「名
簿」などの文字列が不要なキーワードとして検出され
る。
In some cases, the address book document contains a word (“address book”) as shown in FIG. 9 as a title. This type of character string is a word that is unnecessary as address book data, and has an adverse effect on subsequent processing for separating address data on a case-by-case basis and correspondence with address book items (incorrect processing results). Is deleted from the character string of the character recognition result. Character strings such as “address book” and “list” other than “address book” are detected as unnecessary keywords.

【0062】一方、線認識制御部42は、イメージデー
タ中から検出した直線成分の中から1件毎の住所データ
を区分するための直線成分(有効罫線)を、有効線検出
部42aによって一定の条件に基づいて抽出する(ステ
ップA8)。
On the other hand, the line recognition control unit 42 uses the effective line detection unit 42a to convert a straight line component (effective ruled line) for dividing address data for each address from the straight line components detected from the image data into a constant. Extraction is performed based on conditions (step A8).

【0063】具体的には、以下の条件(以下、有効罫線
条件と称する)を満たす直線成分を有効罫線とみなす。
第1に原稿の形状に対してほぼ水平である(ただし、縦
方向に住所データが区分される場合には、ほぼ垂直であ
ること)、第2に線種が予め決められた種類と一致する
(例えば実線など)、第3に原稿用紙の縦または横方向
の長さや文字列の長さに対して、一定以上の割合の長さ
がある、などである。
Specifically, a straight line component satisfying the following condition (hereinafter referred to as an effective ruled line condition) is regarded as an effective ruled line.
First, it is substantially horizontal to the shape of the document (however, if the address data is divided in the vertical direction, it should be almost vertical), and second, the line type matches the predetermined type. Thirdly, the length of the original paper is longer than a certain ratio with respect to the length in the vertical or horizontal direction or the length of the character string.

【0064】有効罫線条件の第3条件は、例えば住所デ
ータを区分するための線成分であれば、通常、文字列よ
りも長く、また原稿用紙の縦または横方向の大部分の範
囲に渡って設けられた線成分であれば住所データを区分
するために設けられたものとみなすことができるといっ
たことをもとにしている。
The third condition of the effective ruled line condition is, for example, a line component for separating address data, which is usually longer than a character string and extends over most of the range in the vertical or horizontal direction of the document paper. This is based on the fact that a line component provided can be regarded as provided for classifying address data.

【0065】図13(a)に示す例では、住所と電話番
号の間に渡る線成分は、文字列の長さ(「伊藤〜9999」
までの範囲」)よりも短いので、第3条件により無効と
判定される。また、図13(b)に示す例では、有効な
線種が実線である場合、点線については第2条件により
無効と判定される。
In the example shown in FIG. 13A, the line component extending between the address and the telephone number is the length of the character string (“Ito-9999”).
The range is shorter than “up to”), and is determined to be invalid according to the third condition. In the example shown in FIG. 13B, when the valid line type is a solid line, the dotted line is determined to be invalid according to the second condition.

【0066】有効線検出部42aで用いられる有効罫線
条件は、例えば住所録読み取り処理に関する各種モード
設定において、予め任意に指定できるようにしても良い
(線方向、線種、線の長さの原稿サイズに対する割合
等)し、デフォルトで決定されていても良い。
The valid ruled line conditions used by the valid line detecting section 42a may be arbitrarily specified in advance in, for example, various mode settings related to the address book reading process (a document having a line direction, a line type, and a line length). The ratio may be determined by default.

【0067】有効線検出部42aの処理により、本来、
1件毎の住所録データの区切りではない線成分を除去
し、線成分に基づく住所データの区切りの精度を向上さ
せることができる。
By the processing of the effective line detecting section 42a,
It is possible to remove a line component that is not a delimiter of the address book data for each case, thereby improving the accuracy of the delimitation of the address data based on the line component.

【0068】次に、住所録認識制御部30は、線認識制
御部42によって検出された有効線分のみによって1件
毎の住所データの区分が可能であるか否かを、以下の条
件(以下、分割可能条件と称する)に基づいて判定する
(ステップA9)。
Next, the address book recognition control unit 30 determines whether or not it is possible to classify address data on a case-by-case basis only by the valid line segments detected by the line recognition control unit 42 under the following conditions (hereinafter, referred to) (Referred to as a dividable condition) (step A9).

【0069】住所録認識制御部30は、1ページ中のそ
れぞれの有効罫線で区切られた文字列の中に、項目認識
制御部38によって認識された以下のキーワード(1)
(2)が存在すれば有効罫線のみで分割可能、存在しな
ければ不可能と判定する。
The address book recognition control unit 30 includes the following keywords (1) recognized by the item recognition control unit 38 in the character strings delimited by the respective effective ruled lines in one page.
If (2) exists, it is determined that division is possible only with the valid ruled line, and if it does not exist, it is impossible.

【0070】(1)姓名と判定されたキーワードが一定
範囲の数だけ(例えば主と副の2つ)存在する、(2)
住所または電話番号と判定されたキーワードが一定範囲
の数だけ存在する。
(1) There are a certain number of keywords determined as first and last names (for example, two main and secondary keywords). (2)
There are a certain number of keywords determined to be addresses or telephone numbers.

【0071】すなわち、一般に、住所データに姓名のデ
ータが含まれないことはなく、また住所または電話番号
の何れかが対応づけて登録されることをもとにしてい
る。この住所録認識制御部30における処理により、有
効罫線を用いて住所データの区分を行なっても問題がな
いかどうかを判定することで、住所データの区分位置の
精度を向上させることができる。
That is, in general, the address data does not include the data of the first and last names, and is based on the fact that either the address or the telephone number is registered in association with each other. By performing the processing in the address book recognition control unit 30, it is determined whether or not there is no problem even if the division of the address data is performed using the effective ruled line, so that the accuracy of the division position of the address data can be improved.

【0072】住所録認識制御部30は、ステップA9に
おいて、分割可能と判定した場合には、検出した有効罫
線に基づいて文字認識制御部36による文字認識結果を
仮に分割して1件毎の住所データとする(ステップA1
4)。すなわち、住所録認識制御部30は、文字認識結
果(文字)のイメージデータ中における位置と有効罫線
との位置との関係によって、住所データに対する仮の区
分位置が決定される。
If the address book recognition control unit 30 determines in step A9 that division is possible, the character recognition result by the character recognition control unit 36 is provisionally divided based on the detected effective ruled line, and the address is recognized for each address. Data (Step A1)
4). That is, the address book recognition control unit 30 determines the temporary division position for the address data based on the relationship between the position of the character recognition result (character) in the image data and the position of the effective ruled line.

【0073】一方、ステップA9において、分割不可能
と判定した場合には、住所録認識制御部30は、有効罫
線のみをもとにした分割が信頼性の低いものとみなし、
項目認識制御部38によって認識されたキーワードを利
用して分割する(ステップA13)。
On the other hand, if it is determined in step A9 that the division is impossible, the address book recognition control unit 30 regards the division based on only the effective ruled lines as having low reliability, and
The image is divided using the keyword recognized by the item recognition control unit 38 (step A13).

【0074】住所録認識制御部30は、項目認識制御部
38によって認識されたキーワードから以下の条件(以
下、仮区切り条件と称する)を満たす位置を1件分の住
所データの区切り位置として判定して、その位置を仮の
区切り位置とする。
The address book recognition control unit 30 determines, from the keywords recognized by the item recognition control unit 38, a position that satisfies the following condition (hereinafter, referred to as a temporary break condition) as a break position of one piece of address data. Then, that position is set as a temporary break position.

【0075】具体的な条件としては、第1に姓名と住所
または電話番号のキーワードが一定範囲の数だけ(例え
ば2つ)存在する、第2に複数の項目のそれぞれに対応
するキーワードが同様の順番で並んでいる、第3に1件
分とみなせるキーワードが記録された面積がほぼ同様と
なっていることである。住所録認識制御部30は、以上
の仮区切り条件を満たす位置を検出して、1件分の住所
データの仮の区切り位置とする。
As specific conditions, first, keywords of a first and last name and an address or a telephone number exist in a certain range (for example, two), and second, keywords corresponding to a plurality of items are the same. Thirdly, the area in which keywords that can be regarded as one for one third are recorded is almost the same. The address book recognition control unit 30 detects a position that satisfies the above provisional division condition, and sets it as a provisional division position of one piece of address data.

【0076】住所録認識制御部30によるキーワードを
もとにした処理により、有効罫線のみからでは正しく1
件分の住所データの区切り位置が確定できない場合であ
っても、住所録における住所データの自動区切りが可能
となる。
According to the processing based on the keyword by the address book recognition control unit 30, 1 is correctly obtained only from the effective ruled line.
Even if the delimiter position of the address data for the case cannot be determined, the address data in the address book can be automatically delimited.

【0077】一方、ステップA3において、住所録認識
制御部30は、罫線なしモードが指定されていると、文
字認識制御部36によって原稿のイメージデータ中から
文字を認識させ(ステップA10)、この文字認識結果
から項目認識制御部38によってキーワードを認識させ
る(ステップA11)。さらに、住所録認識制御部30
は、項目認識制御部38によって不要なキーワードを削
除させる(ステップA12)。なお、ステップA10〜
A12における処理は、前述したステップA5〜A7の
処理と同様にして行なわれるので詳細な説明を省略す
る。
On the other hand, in step A3, if the ruled lineless mode is designated, the address book recognition control section 30 causes the character recognition control section 36 to recognize characters from the image data of the original (step A10). The keyword is recognized by the item recognition control unit 38 from the recognition result (step A11). Further, the address book recognition control unit 30
Causes the item recognition control unit 38 to delete unnecessary keywords (step A12). Step A10
The processing in A12 is performed in the same manner as the processing in steps A5 to A7 described above, and a detailed description thereof will be omitted.

【0078】罫線なしモードでは、住所録認識制御部3
0は、無条件に項目認識制御部38によって認識された
キーワードを利用し、前述した仮区切り条件に基づいて
住所データの仮の区切り位置を決定する(ステップA1
3)。
In the ruled lineless mode, the address book recognition control unit 3
0 uses the keyword unconditionally recognized by the item recognition control unit 38 and determines a temporary break position of the address data based on the above-described temporary break condition (step A1).
3).

【0079】この住所録認識制御部30によるキーワー
ドをもとにした処理により、住所録用紙に罫線がない場
合であっても、用紙に記録された文字(キーワード)の
みをもとにして住所録における住所データの自動区切り
が可能となる。
By the processing based on the keyword by the address book recognition control unit 30, even if there is no ruled line on the address book paper, the address book is based on only the characters (keywords) recorded on the paper. Address data can be automatically separated.

【0080】1件毎の住所データの仮の区切り位置が決
定されると、住所録認識制御部30は、文字認識制御部
36によって得られた認識文字列と仮の区切り位置を明
示する画面をカラーディスプレイ装置26において表示
させ(ステップA15)、かつ住所録中の最初の1件分
の仮分割の範囲(1件分の住所データの文字列の領域)
を反転表示させる(ステップA16)。
When the provisional separation position of the address data for each case is determined, the address book recognition control unit 30 displays a screen for specifying the recognition character string obtained by the character recognition control unit 36 and the provisional separation position. Display on the color display device 26 (step A15), and the range of the temporary division of the first one in the address book (character string area of one address data)
Is highlighted (step A16).

【0081】図10(a)には、最初の1件分の住所デ
ータの範囲が反転された状態の表示状態を示している。
図10(a)に示すように、住所録読み取りの対象とな
った原稿における文字列の配置と同じ配列によって文字
認識結果(文字列)が表示され、仮の区切り位置を一点
鎖線によって表している。また、2列分の文字列によっ
て1件分の住所データとしているので、2列分の文字列
の領域が反転表示されている。
FIG. 10A shows a display state in which the range of the address data of the first case is inverted.
As shown in FIG. 10A, the character recognition result (character string) is displayed in the same arrangement as the arrangement of the character strings in the original from which the address book is read, and the temporary break positions are indicated by dashed lines. . In addition, since the address data for one case is represented by two character strings, the area of the character strings for two columns is highlighted.

【0082】ここで、住所録認識制御部30は、カラー
ディスプレイ装置26において、例えば「反転部分を1
件分の住所データとしますか?」というメッセージを表
示し、使用者に対して確認入力させる。
Here, the address book recognition control section 30 controls the color display device 26 to, for example,
Address data? Is displayed and the user is asked to confirm.

【0083】1件目の仮の区切り位置が正しくない場
合、その旨の指示が入力され(ステップA17)、反転
範囲を変更する指示が入力される。すなわち、使用者に
よってKB20の上下方向の「カーソル」キーが押下さ
れると、住所録認識制御部30の区切り位置訂正部30
aは、反転範囲の下端位置を1行毎に上下に変更させる
(ステップA18)。例えば、下方向の範囲変更が指示
されると、区切り位置訂正部30aは、図10(b)に
示すように反転範囲を変更する。こうして反転範囲が所
望の1件分の住所データの範囲に変更された後、区切り
位置の確定の指示が入力される。
If the first temporary break position is not correct, an instruction to that effect is input (step A17), and an instruction to change the reversal range is input. That is, when the user presses the “cursor” key in the vertical direction of the KB 20, the break position correction unit 30 of the address book recognition control unit 30
“a” changes the lower end position of the reversal range up and down line by line (step A18). For example, when a downward range change is instructed, the break position correcting unit 30a changes the inversion range as shown in FIG. After the reversal range is changed to the range of one desired address data, an instruction to determine the break position is input.

【0084】この動作により、ステップA14までの処
理において自動で区切られた位置が正しくなかった場合
でも、手動操作によって任意に区切り位置を簡単に変更
することができる。
By this operation, even if the position automatically divided in the processing up to step A14 is incorrect, the division position can be easily changed arbitrarily by manual operation.

【0085】こうして、1件分の住所データの区切り位
置が確定されると、住所録認識制御部30は、以下の住
所データに対する区切り位置の確定を自動的に行なう
か、あるいは1件目と同じような1件毎の区切り位置の
確認動作を継続するか否かを使用者に確認入力させる。
When the break position of one piece of address data is determined in this way, the address book recognition control unit 30 automatically determines the break position for the following address data, or the same as the first case. The user is asked to confirm whether or not to continue the operation of confirming the break position for each case.

【0086】ここで、1件毎の区切り位置の確認動作を
継続する場合には、住所録認識制御部30は、残りのデ
ータについて、現在の1件分の住所データの次の行か
ら、次の仮の区切り位置(仮自動分割行)までを1件分
樹データとして判定表示して(ステップA22)、前述
と同様にして、判定範囲の変更指示と区切り位置の確定
の指示を入力しながら区切り位置を決定していく。
Here, in the case where the operation of confirming the break position for each case is continued, the address book recognition control unit 30 checks the remaining data from the next line of the address data of the current case to the next line. Is displayed as one piece of tree data up to the temporary break position (temporary automatic division line) (step A22), and in the same manner as described above, while inputting an instruction to change the determination range and an instruction to determine the break position, Determine the break position.

【0087】一方、今後の確認動作が不要であることが
指示されると、住所録認識制御部30は、2件目以降の
住所データについては、全て仮の区切り位置を最終的な
1件毎の住所データの区切り位置として確定する(ステ
ップA20)。この動作により、住所録全体が精度良
く、自動的に1件の住所データ毎に区切られている場合
には、1件ごとの修正確認操作が不要となり操作性が向
上する。
On the other hand, when it is instructed that the future confirmation operation is unnecessary, the address book recognition control section 30 sets the temporary break positions for the second and subsequent address data every final one. (Step A20). With this operation, when the entire address book is automatically separated for each piece of address data with high accuracy, the correction confirmation operation for each piece is unnecessary, and the operability is improved.

【0088】以上で、1件毎の住所データの区切り位置
が確定される。次に、住所録認識制御部30は、1件毎
に区切られた住所データに含まれる文字列を、項目認識
制御部38による項目認識結果に従って、各項目に対応
する内容毎に分類して保存して、住所録データを作成す
る(ステップA23)。
As described above, the break position of the address data for each case is determined. Next, the address book recognition control unit 30 classifies and stores the character strings included in the address data delimited for each case according to the item recognition result by the item recognition control unit 38 for each content corresponding to each item. Then, address book data is created (step A23).

【0089】すなわち、住所録認識制御部30は、項目
認識結果について、住所録データとして必要な項目、例
えば氏名、郵便番号、住所、電話番号、役職、備考等に
分類し、RAM14中のそれぞれの項目に対応するアド
レス位置に格納する。
That is, the address book recognition control section 30 classifies the item recognition results into items necessary as address book data, for example, names, postal codes, addresses, telephone numbers, posts, remarks, and the like. Store in the address position corresponding to the item.

【0090】なお、郵便番号、住所、電話番号は会社用
と自宅用の2つを持ち、キーワードから何れのデータで
あるかを判定する。例えば、「会社」「仕事」「**会
社」「**ビル」といったキーワードがある住所は会社
の住所と判断し、その前後にある郵便番号、電話番号も
会社用と判断する。図11には、RAM14に住所録デ
ータが格納された状態のデータ構造の一例を示してい
る。
The postal code, address, and telephone number have two types, one for business use and one for home use, and it is determined which data is from the keyword. For example, an address having a keyword such as "company", "job", "** company", and "** building" is determined to be a company address, and postal and postal codes and telephone numbers before and after it are also determined to be for a company. FIG. 11 shows an example of a data structure in a state where the address book data is stored in the RAM 14.

【0091】データバッファとしては、図11に示すよ
うに、会社情報と自宅情報の2種類の情報を記録できる
が、一般の住所録原稿では両方記録されているもの、大
部分が自宅情報のもの、逆に大部分が会社情報のものな
ど各種のものがある。
As shown in FIG. 11, the data buffer can record two kinds of information, that is, company information and home information. On the other hand, there are various types of information, most of which are company information.

【0092】そこで、住所録編集制御部32の優先度変
更部32aは、住所録認識制御部30において確定され
た複数の住所データからなる1枚の住所録の中で、会社
情報と自宅情報の何れの情報が多いかを判断し、多い方
の情報の表示を優先するモードに設定する。
Therefore, the priority changing unit 32a of the address book editing control unit 32 determines whether the company information and the home information are included in one address book composed of a plurality of address data determined by the address book recognition control unit 30. It is determined which information is larger, and a mode is set to give priority to the display of the larger information.

【0093】例えば、住所録データ中に自宅情報の方が
多い場合、優先度変更部32aによって自宅情報の表示
が優先され、住所録編集制御部32は、編集対象を自宅
情報として図12(a)に示すようにして表示する(ス
テップA24,A26)。自宅情報が表示された状態で
は、住所録編集制御部32は、KB20からの各項目に
対する入力に応じて、住所録データの確認、修正や追加
登録等の住所録データの編集を行なう(ステップA2
7)。
For example, when there is more home information in the address book data, display of the home information is prioritized by the priority changing unit 32a, and the address book editing control unit 32 sets the home information as the edit target in FIG. ) (Steps A24 and A26). In a state where the home information is displayed, the address book editing control unit 32 edits the address book data such as confirmation, correction, and additional registration of the address book data according to the input for each item from the KB 20 (step A2).
7).

【0094】同様にして、会社情報の方が多い場合、住
所録編集制御部32は、編集対象を会社情報として図1
2(b)に示すようにして表示する(ステップA24,
A25)。
Similarly, if there is more company information, the address book editing control unit 32 sets the editing target as company information in FIG.
2 (b) (Step A24,
A25).

【0095】これにより、住所録用紙において記述され
た情報が多い方を初期の表示モードとすることができ、
表示切替えの操作量を低減することができ、操作性が向
上される。
Thus, the one with more information described in the address book can be set as the initial display mode.
The operation amount of the display switching can be reduced, and the operability is improved.

【0096】勿論、住所録編集制御部32は、住所録デ
ータの編集状態にある際に、KB20から優先モードの
切替指示が「切替」キーに対する操作によって入力され
ると、自宅情報用の編集画面(図12(a))と会社情
報用の編集画面(図12(b))とを相互に切替えるこ
ともできる。
Of course, when the address book editing control unit 32 is in the editing state of the address book data and inputs a priority mode switching instruction from the KB 20 by operating the “switch” key, the home information editing screen is displayed. (FIG. 12A) and the editing screen for company information (FIG. 12B) can be switched between each other.

【0097】こうして、編集、訂正された住所録データ
は、例えばFDD16においてフロッピーディスクにフ
ァイルとして保存される。なお、本発明は、ワードプロ
セッサやパーソナルコンピュータの周辺機器としての住
所録読み取り装置として応用する他、ワードプロセッサ
での組み込み機能、あるいはパーソナルコンピュータの
アプリケーションソフトウェアに応用することができ
る。
The edited and corrected address book data is stored as a file on a floppy disk by the FDD 16, for example. The present invention can be applied not only to an address book reader as a peripheral device of a word processor or a personal computer but also to a built-in function of a word processor or application software of a personal computer.

【0098】また、住所録だけでなく、購入品リストな
どのように、複数個の項目からなるデータが複数配列さ
れたリストの原稿を読み込んで認識する際の1件当りの
データの自動分割に利用することもできる。
In addition, not only an address book but also an automatic division of data per case when reading and recognizing a manuscript of a list in which a plurality of items of data are arranged, such as a list of purchased items, is performed. Can also be used.

【0099】また、前述した実施形態において記載した
手法は、コンピュータに実行させることのできるプログ
ラムとして、磁気ディスク(フロッピーディスク、ハー
ドディスク等)、光ディスク(CD−ROM、DVDな
ど)、半導体メモリなどの記録媒体に格納して提供する
ことができる。本実施形態における住所録読み取り装置
を実現するコンピュータは、記録媒体に記録されたプロ
グラムを読み込み、このプログラムによって動作が制御
されることにより、前述した処理を実行する。
Further, the method described in the above-described embodiment can be implemented as a program that can be executed by a computer, such as a magnetic disk (floppy disk, hard disk, etc.), an optical disk (CD-ROM, DVD, etc.), a semiconductor memory, etc. It can be provided stored in a medium. The computer that realizes the address book reading device according to the present embodiment reads the program recorded on the recording medium, and executes the above-described processing by controlling the operation of the program.

【0100】[0100]

【発明の効果】以上詳述したように本発明によれば、原
稿に記録された住所録を読取り、簡単かつ確実に1件毎
の住所データに区切って住所録データを作成することが
可能となるものである。
As described above in detail, according to the present invention, it is possible to read an address book recorded on a manuscript, and to easily and surely divide the address book into individual address data to create address book data. It becomes.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施形態に係わる住所録読み取り装置
の構成を示すブロック図。
FIG. 1 is a block diagram showing a configuration of an address book reading device according to an embodiment of the present invention.

【図2】図1に示す構成によって実現される住所録読み
取り装置の機能構成(ソフトウェア)を示す図。
FIG. 2 is a diagram showing a functional configuration (software) of the address book reading device realized by the configuration shown in FIG. 1;

【図3】本実施形態において扱われる罫線が含まれた住
所録の一例を示す図。
FIG. 3 is a view showing an example of an address book including ruled lines handled in the embodiment.

【図4】本実施形態において扱われる罫線が含まれない
住所録の一例を示す図。
FIG. 4 is a diagram showing an example of an address book that does not include a ruled line handled in the embodiment.

【図5】本実施形態における住所録データ作成の動作の
一部を説明するためのフローチャート。
FIG. 5 is a flowchart for explaining a part of the operation of creating address book data in the embodiment.

【図6】本実施形態における住所録データ作成の動作の
一部を説明するためのフローチャート。
FIG. 6 is a flowchart for explaining a part of an operation of creating address book data in the embodiment.

【図7】本実施形態における項目認識制御部のキーワー
ド認識の処理を説明するための図。
FIG. 7 is an exemplary view for explaining a keyword recognition process performed by an item recognition control unit according to the embodiment.

【図8】本実施形態におけるキーワード辞書に登録され
るデータの一例を説明するための図。
FIG. 8 is a view for explaining an example of data registered in a keyword dictionary according to the embodiment.

【図9】住所録原稿に含まれるタイトルの一例を示す
図。
FIG. 9 is a diagram illustrating an example of a title included in an address book document.

【図10】本実施形態における最初の1件分の住所デー
タの範囲が反転された状態の表示例を示す図。
FIG. 10 is an exemplary view showing a display example of a state in which the range of the address data of the first case is reversed in the embodiment;

【図11】本実施形態におけるRAMに格納された住所
録データのデータ構造の一例を示す図。
FIG. 11 is a view showing an example of a data structure of address book data stored in a RAM according to the embodiment.

【図12】本実施形態における優先モードに応じた各情
報の表示形態の一例を示す図。
FIG. 12 is a view showing an example of a display mode of each information according to a priority mode in the embodiment.

【図13】従来の住所データの区切り方法を説明するた
めの図。
FIG. 13 is a view for explaining a conventional address data dividing method.

【符号の説明】[Explanation of symbols]

10…CPU 12…ROM 14…RAM 16…フロッピーディスク装置(FDD) 18…カラースキャナ装置 20…キーボード(KB) 22…ディスプレイコントローラ 24…VRAM(Video RAM) 26…カラーディスプレイ装置 28…カラープリンタ装置 30…住所録認識制御部 30a…区切り位置訂正部 32…住所録編集制御部 32a…優先度変更部 34…イメージ読込制御部 36…文字認識制御部 38…項目認識制御部 40…キーワード辞書 42…線認識制御部 42a…有効線検出部 Reference Signs List 10 CPU 12 ROM 14 RAM 16 Floppy disk device (FDD) 18 Color scanner device 20 Keyboard (KB) 22 Display controller 24 VRAM (Video RAM) 26 Color display device 28 Color printer device 30 ... address book recognition control section 30a ... break position correction section 32 ... address book edit control section 32a ... priority change section 34 ... image reading control section 36 ... character recognition control section 38 ... item recognition control section 40 ... keyword dictionary 42 ... line Recognition control unit 42a: valid line detection unit

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 原稿に記録された住所録に関する文字を
読み取り、住所録データを作成する住所録読み取り装置
において、 複数個の項目についての住所録に関する文字からなる住
所データが複数個配列されて記録された原稿を光学的に
走査することによってイメージデータを読み込むイメー
ジ読込み手段と、 前記イメージ読込み手段によって読み込まれたイメージ
データをもとに文字を認識する文字認識手段と、 前記文字認識手段によって認識された文字から、特定の
項目に対応する住所録に関する文字を検出する項目認識
手段と、 前記項目認識手段により検出された住所録に関する文字
をもとに、この文字に対する1件毎の住所データの区切
りを検出する住所録認識手段とを具備したことを特徴と
する住所録読み取り装置。
1. An address book reading device for reading characters related to an address book recorded on a manuscript and creating address book data, wherein a plurality of address data including characters related to an address book for a plurality of items are arranged and recorded. Image reading means for reading image data by optically scanning the read original, character recognition means for recognizing characters based on the image data read by the image reading means, and character recognition means for recognizing the characters. Item recognition means for detecting a character associated with an address book corresponding to a specific item from the extracted characters; and, based on the character associated with the address book detected by the item recognition means, separating address data for each character. Address book reading device, comprising: an address book recognizing means for detecting an address book.
【請求項2】 原稿に記録された住所録に関する文字を
読み取り、住所録データを作成する住所録読み取り装置
において、 複数個の項目についての住所録に関する文字からなる住
所データが複数個配列されて記録された原稿を光学的に
走査することによってイメージデータを読み込むイメー
ジ読込み手段と、 前記イメージ読込み手段によって読み込まれたイメージ
データをもとに文字を認識する文字認識手段と、 前記イメージ読込み手段によって読み込まれたイメージ
データをもとに線成分を認識する線認識手段と、 前記線認識手段によって認識された線成分の特徴から、
一定の条件を満たす線成分を抽出する有効線検出手段
と、 前記有効線検出手段によって抽出された線成分をもと
に、前記文字認識手段によって認識された文字に対する
1件毎の住所データの区切りを検出する住所録認識手段
とを具備したことを特徴とする住所録読み取り装置。
2. An address book reading apparatus for reading characters related to an address book recorded on a manuscript and creating address book data, wherein a plurality of address data comprising characters related to an address book for a plurality of items are arranged and recorded. Image reading means for reading image data by optically scanning the read original, character recognition means for recognizing characters based on the image data read by the image reading means, and character reading means for reading characters by the image reading means. Line recognition means for recognizing a line component based on the image data obtained, from the characteristics of the line component recognized by the line recognition means,
Effective line detecting means for extracting a line component satisfying a certain condition; and dividing address data for each character for the character recognized by the character recognizing means based on the line component extracted by the effective line detecting means. Address book reading device, comprising: an address book recognizing means for detecting an address book.
【請求項3】 前記有効線検出手段は、 線成分の特徴として、少なくとも直線の種類または線の
長さの何れか一方を利用することを特徴とする請求項2
記載の住所録読み取り装置。
3. The effective line detection means uses at least one of a line type and a line length as a characteristic of a line component.
Address book reader as described.
【請求項4】 前記イメージ読込み手段によって読み込
まれたイメージデータをもとに線成分を認識する線認識
手段をさらに具備し、 前記住所録認識手段は、 前記線認識手段によって認識された線成分の特徴と、前
記項目認識手段によって検出された住所録に関する文字
をもとに、1件毎の住所データの区切りを検出すること
を特徴とする請求項1記載の文書作成装置。
4. The image processing apparatus according to claim 1, further comprising: a line recognition unit configured to recognize a line component based on the image data read by the image reading unit; 2. The document creation apparatus according to claim 1, wherein a break of address data for each case is detected based on a feature and characters related to the address book detected by the item recognition unit.
【請求項5】 前記線認識手段による線成分の特徴をも
とにして1件毎の住所データを区切った後、前記住所デ
ータ中に一定の特定の項目に対応する住所録に関する文
字が含まれているか否かによって、区切り位置が有効か
否かを判断することを特徴とする請求項4記載の文書作
成装置。
5. After segmenting address data for each case on the basis of the characteristics of line components by the line recognition means, the address data includes characters relating to an address book corresponding to a certain specific item. 5. The document creation apparatus according to claim 4, wherein whether or not the separation position is valid is determined based on whether or not the document is separated.
【請求項6】 前記住所録認識手段によって住所データ
の区切りを検出する前に、前記文字認識手段によって認
識された文字から、特定項目を表す文字を予め除去する
ことを特徴とする請求項1または請求項2記載の文書作
成装置。
6. The method according to claim 1, wherein a character representing a specific item is removed from characters recognized by said character recognizing means in advance before detecting a break of address data by said address book recognizing means. The document creation device according to claim 2.
【請求項7】 複数個の項目についての住所録に関する
文字からなる住所データが複数個配列されて記録された
原稿から文字を読み取り、住所録データを作成する住所
録読み取り装置において、 原稿から読み取られた文字に対して、1件の住所データ
毎に区切り位置を検出する区切り位置検出手段と、 前記区切り位置検出手段によって検出された区切り位置
を任意に与えられる指示に応じて変更する区切り位置訂
正手段とを具備したことを特徴とする文書作成装置。
7. An address book reading device for reading characters from a document on which a plurality of address data including characters related to an address book for a plurality of items are arranged and recorded, and creating address book data, wherein: Delimiter position detecting means for detecting a delimiter position for each piece of address data for each character, and delimiter position correcting means for changing a delimiter position detected by the delimiter position detector in accordance with an arbitrary instruction A document creation device comprising:
【請求項8】 前記区切り位置訂正手段は、 前記区切り位置検出手段によって検出された区切り位置
の訂正を1件分行ない、その後に、1件毎の区切り位置
の変更を行なうか否かを確定することを特徴とする請求
項7記載の文書作成装置。
8. The delimiter position correcting means corrects the delimiter position detected by the delimiter position detection means for one case, and thereafter determines whether or not to change the delimiter position for each case. The document creation device according to claim 7, wherein
【請求項9】 前記項目認識手段による各項目に対応す
る文字の検出状況に応じて項目の表示優先度を決定し
て、検出された文字に対する編集対象を変更する優先度
変更手段を具備したことを特徴とする請求項1記載の文
書作成装置。
9. A system according to claim 1, further comprising a priority changing unit for determining a display priority of the item according to a detection state of a character corresponding to each item by the item recognizing unit, and changing an editing target for the detected character. 2. The document creation device according to claim 1, wherein:
【請求項10】 原稿に記録された住所録に関する文字
を読み取り、住所録データを作成する住所録読み取り方
法において、 複数個の項目についての住所録に関する文字からなる住
所データが複数個配列されて記録された原稿を光学的に
走査することによってイメージデータを読み込み、 この読み込まれたイメージデータをもとに文字を認識
し、 この認識された文字から、特定の項目に対応する住所録
に関する文字を検出し、 この検出された住所録に関する文字をもとに、この文字
に対する1件毎の住所データの区切りを検出することを
特徴とする住所録読み取り方法。
10. An address book reading method of reading characters related to an address book recorded on a manuscript and creating address book data, wherein a plurality of address data consisting of characters related to an address book for a plurality of items are arranged and recorded. Image data is read by optically scanning the scanned document, characters are recognized based on the read image data, and characters related to an address book corresponding to a specific item are detected from the recognized characters. A method of reading an address book, comprising detecting, based on the detected characters related to the address book, a break of address data for each character with respect to each character.
【請求項11】 原稿に記録された住所録に関する文字
を読み取り、住所録データを作成する住所録読み取り方
法において、 複数個の項目についての住所録に関する文字からなる住
所データが複数個配列されて記録された原稿を光学的に
走査することによってイメージデータを読み込み、 この読み込まれたイメージデータをもとに文字を認識す
ると共に、線成分を認識し、 この認識された線成分の特徴から、一定の条件を満たす
線成分を抽出し、 この抽出された線成分をもとに、認識された文字に対す
る1件毎の住所データの区切りを検出することを特徴と
する住所録読み取り方法。
11. An address book reading method for reading characters related to an address book recorded on a manuscript and creating address book data, wherein a plurality of address data including characters related to an address book for a plurality of items are arranged and recorded. The scanned original is scanned optically to read image data, recognize characters based on the read image data, and recognize line components. A method of reading an address book, comprising extracting a line component satisfying a condition, and detecting a segment of address data for each recognized character based on the extracted line component.
【請求項12】 原稿に記録された住所録に関する文字
を読み取り、住所録データを作成するためのプログラム
であって、 複数個の項目についての住所録に関する文字からなる住
所データが複数個配列されて記録された原稿を光学的に
走査することによってイメージデータを読み込み、 この読み込まれたイメージデータをもとに文字を認識
し、 この認識された文字から、特定の項目に対応する住所録
に関する文字を検出し、 この検出された住所録に関する文字をもとに、この文字
に対する1件毎の住所データの区切りを検出するように
コンピュータを制御するためのプログラムを格納したコ
ンピュータ読取可能な記録媒体。
12. A program for reading characters related to an address book recorded on a manuscript and creating address book data, wherein a plurality of address data including characters related to an address book for a plurality of items are arranged. Image data is read by optically scanning the recorded document, characters are recognized based on the read image data, and characters related to an address book corresponding to a specific item are recognized from the recognized characters. A computer-readable recording medium storing a program for detecting and detecting a break of address data for each character based on the detected character of the address book.
JP8209829A 1996-08-08 1996-08-08 Device and method for reading directory Pending JPH1055405A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8209829A JPH1055405A (en) 1996-08-08 1996-08-08 Device and method for reading directory

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8209829A JPH1055405A (en) 1996-08-08 1996-08-08 Device and method for reading directory

Publications (1)

Publication Number Publication Date
JPH1055405A true JPH1055405A (en) 1998-02-24

Family

ID=16579313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8209829A Pending JPH1055405A (en) 1996-08-08 1996-08-08 Device and method for reading directory

Country Status (1)

Country Link
JP (1) JPH1055405A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007206985A (en) * 2006-02-01 2007-08-16 Sharp Corp Character string extractor, character string extraction method, its program, and recording medium
KR20100095266A (en) * 2009-02-20 2010-08-30 팅크웨어(주) Device and method for extracting document address

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007206985A (en) * 2006-02-01 2007-08-16 Sharp Corp Character string extractor, character string extraction method, its program, and recording medium
KR20100095266A (en) * 2009-02-20 2010-08-30 팅크웨어(주) Device and method for extracting document address

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
US9740692B2 (en) Creating flexible structure descriptions of documents with repetitive non-regular structures
US8233714B2 (en) Method and system for creating flexible structure descriptions
JP4332356B2 (en) Information retrieval apparatus and method, and control program
US20050024679A1 (en) Information input device
JP2835178B2 (en) Document reading device
JPH11272654A (en) Document editing device and method
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JPH1166196A (en) Document image recognition device and computer-readable recording medium where program allowing computer to function as same device is recorded
JPH1055405A (en) Device and method for reading directory
JPH08180068A (en) Electronic filing device
JP2007328432A (en) Business form processor, business form processing method, and program
JP3484446B2 (en) Optical character recognition device
JP6303742B2 (en) Image processing apparatus, image processing method, and image processing program
JP2932667B2 (en) Information retrieval method and information storage device
JPH10134141A (en) Device and method for document collation
JP3928739B2 (en) Document filing system
JPH07152856A (en) Optical character reader
JPH0757040A (en) Filing device provided with ocr
JP3412998B2 (en) Image processing apparatus and method
JP2002014981A (en) Document filing device
JPH04302070A (en) Character recognizing device
JPH06251187A (en) Method and device for correcting character recognition error
JP2000112955A (en) Picture display method, picture filing device and record medium
JPH0678119A (en) Picture filing device and picture reading and processing device