JPH11306321A - Method and device for document management and recording medium storing document management program - Google Patents

Method and device for document management and recording medium storing document management program

Info

Publication number
JPH11306321A
JPH11306321A JP10113151A JP11315198A JPH11306321A JP H11306321 A JPH11306321 A JP H11306321A JP 10113151 A JP10113151 A JP 10113151A JP 11315198 A JP11315198 A JP 11315198A JP H11306321 A JPH11306321 A JP H11306321A
Authority
JP
Japan
Prior art keywords
resolution
document management
image data
character recognition
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10113151A
Other languages
Japanese (ja)
Inventor
Tamotsu Maeda
保 前田
Yukiya Sugiyama
幸也 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10113151A priority Critical patent/JPH11306321A/en
Publication of JPH11306321A publication Critical patent/JPH11306321A/en
Pending legal-status Critical Current

Links

Landscapes

  • Image Input (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a document management device, a document management method, and a recording medium storing document management program which reduce the volume of data to be registered. SOLUTION: Character recognition is performed based on picture data of a high resolution inputted from an input device, and picture data of the high resolution is converted into that of a low resolution after the end of character recognition. Only the character recognition result and low-resolution picture data are preserved in a storage device as the object of document management, thereby reducing the storage capacity required in the storage device.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、原稿を画像データ
として読み取り、文字認識した文書データを保存する文
書管理装置および文書管理方法ならびに文書管理プログ
ラムを記録した記録媒体に関するものである。
[0001] 1. Field of the Invention [0002] The present invention relates to a document management apparatus and a document management method for reading document data as image data and storing text-recognized document data, and a recording medium storing a document management program.

【0002】[0002]

【従来の技術】新聞社では、過去の新聞紙面を高精度の
カメラで撮影し、マイクロフィルム等に記録していた。
その際にタイトルやキーワードを付与して、検索用に用
いていた。
2. Description of the Related Art In a newspaper company, newspaper paper in the past was photographed with a high-precision camera and recorded on a microfilm or the like.
At that time, a title and a keyword were given and used for searching.

【0003】しかし、原稿の撮影や、タイトルおよびキ
ーワードの入力に要する工数が膨大となる上、人為によ
る作業なので記入漏れや記入誤りなども多く、検索の精
度を高めることが困難であった。
However, the man-hours required for photographing a document and inputting a title and a keyword become enormous, and because the work is performed by humans, there are many omissions and errors in entry, and it has been difficult to improve the accuracy of retrieval.

【0004】そこで、登録する原稿記事をスキャナで画
像データとして入力し、前記画像データをOCR(Opti
cal Character Reader)でコード化し、得られたテキス
トと画像データとを組み合わせて登録することにより、
記事内容の全文検索を可能とするシステムが提案されて
いる。
Therefore, a manuscript article to be registered is input as image data by a scanner, and the image data is input to an OCR (Opti
cal Character Reader), and register the combined text and image data.
A system that enables full-text search of article contents has been proposed.

【0005】しかし、OCRでの認識精度を高めるため
にはスキャナで入力する画像データの解像度を高くする
必要があり、登録するデータのサイズが大きくなるとい
う問題がある。
[0005] However, in order to improve the recognition accuracy in OCR, it is necessary to increase the resolution of image data input by a scanner, and there is a problem that the size of data to be registered increases.

【0006】[0006]

【発明が解決しようとする課題】従来の文書管理装置で
は、スキャナから入力された画像データをそのまま記憶
装置に記憶する構成となっている。OCRのために高解
像度で取り込んだ画像データを保存した場合、画像デー
タは記憶装置内において多くの記憶領域を占有するため
に、大容量の記憶装置を用意する必要がある。一方、O
CRでは高解像度の画像データが必要であるが、画像デ
ータをモニタ等で見るだけならば、そこまでの解像度は
必要がない。
In a conventional document management apparatus, image data input from a scanner is stored in a storage device as it is. When image data captured at a high resolution is stored for OCR, the image data occupies a large storage area in the storage device, so that a large-capacity storage device needs to be prepared. On the other hand, O
CR requires high-resolution image data, but if the image data is only viewed on a monitor or the like, the resolution up to that point is not required.

【0007】本発明は、登録するデータ量を低減させる
ことのできる文書管理装置および文書管理方法ならびに
文書管理プログラムを記録した記録媒体を提供すること
を目的とする。
An object of the present invention is to provide a document management apparatus, a document management method, and a recording medium on which a document management program is recorded, which can reduce the amount of data to be registered.

【0008】[0008]

【課題を解決するための手段】この課題を解決するため
に本発明は、スキャナ等から入力される高解像度の画像
データを基にして文字認識を行い、文字認識が終了した
後に高解像度の画像データを低解像度の画像データに変
換する。文書管理の対象として記憶装置に保存するの
は、文字認識結果と低解像度画像データのみとすること
により、記憶装置に要求される記憶容量を低減する。
SUMMARY OF THE INVENTION In order to solve this problem, the present invention performs character recognition based on high-resolution image data input from a scanner or the like and, after the character recognition is completed, a high-resolution image. Convert data to low resolution image data. The storage capacity required for the storage device is reduced by storing only the character recognition result and the low-resolution image data in the storage device as a document management target.

【0009】これにより、データサイズを低減させた文
書管理装置が得られる。
Thus, a document management device with a reduced data size can be obtained.

【0010】[0010]

【発明の実施の形態】本発明の請求項1に記載の発明
は、原稿を第1の解像度で二値の画像データに電子化す
る手段と、電子化された画像データに対して文字認識を
行う手段と、文字認識後に画像データを、第1の解像度
よりも低い第2の低解像度に変換する手段と、文字認識
結果および第2の解像の度画像データを保存する手段
と、を有する構成としたことにより、保存するデータの
記憶容量を低減させることが可能となる。
DESCRIPTION OF THE PREFERRED EMBODIMENTS According to the first aspect of the present invention, there is provided means for digitizing an original into binary image data at a first resolution, and performing character recognition on the digitized image data. Means for converting, after character recognition, image data to a second low resolution lower than the first resolution, and means for storing the character recognition result and the second resolution degree image data. With this configuration, the storage capacity of data to be stored can be reduced.

【0011】以下、本発明の一実施の形態について、図
面を参照しながら説明する。 (実施の形態)図1は本発明の一実施の形態における文
書管理装置の回路ブロック図であり、ハードウェアによ
る構成について示したものである。
An embodiment of the present invention will be described below with reference to the drawings. (Embodiment) FIG. 1 is a circuit block diagram of a document management apparatus according to an embodiment of the present invention, and shows a hardware configuration.

【0012】図1において、10は装置の制御を行う中
央処理装置(CPU)である。11はCPU10による
処理の経過や結果を表示するカソード・レイ・チューブ
(CRT)であり、本発明の表示装置を構成する。
In FIG. 1, reference numeral 10 denotes a central processing unit (CPU) for controlling the apparatus. Reference numeral 11 denotes a cathode ray tube (CRT) for displaying the progress and results of processing by the CPU 10, and constitutes a display device of the present invention.

【0013】12はマウス、13はキーボード、14は
画像入力装置であり、これらは本発明の入力装置を構成
する。
Reference numeral 12 denotes a mouse, 13 denotes a keyboard, and 14 denotes an image input device, which constitute an input device of the present invention.

【0014】15はランダム・アクセス・メモリ(RA
M)であり、RAM15は、画像データを一時的に保存
する画像記憶領域16、文字認識処理の結果を保存する
文字認識結果記憶領域17を有する。
Reference numeral 15 denotes a random access memory (RA).
M), and the RAM 15 has an image storage area 16 for temporarily storing image data and a character recognition result storage area 17 for storing the result of character recognition processing.

【0015】18はハードディスクであり、ハードディ
スク18は、後述する図3のフローチャートに従う文字
認識プログラムを記憶するプログラム記憶領域19、文
字認識処理の際に参照する文字認識辞書記憶領域20、
オペレーティング・システムを記憶するOS記憶領域2
1、文字認識結果と画像データを記憶する文書保存領域
22を有する。
Reference numeral 18 denotes a hard disk. The hard disk 18 has a program storage area 19 for storing a character recognition program according to a flowchart shown in FIG. 3 to be described later, a character recognition dictionary storage area 20 to be referred to at the time of character recognition processing,
OS storage area 2 for storing an operating system
1. It has a document storage area 22 for storing character recognition results and image data.

【0016】23はリード・オンリ・メモリ(ROM)
であり、ROM23は起動プログラム領域24を有す
る。
Reference numeral 23 denotes a read only memory (ROM)
The ROM 23 has a boot program area 24.

【0017】なお、プログラム記憶領域19に本実施の
形態の文書管理装置の処理内容を記憶されているが、こ
れはOS記憶領域21中のオペレーティング・システム
上で動作する。また、このオペレーティング・システム
が動作するためには起動プログラム記憶領域24中の起
動プログラムが必要である。
Although the processing contents of the document management apparatus according to the present embodiment are stored in the program storage area 19, it operates on the operating system in the OS storage area 21. In addition, in order for this operating system to operate, a boot program in the boot program storage area 24 is required.

【0018】さらに、CPU10が実行するプログラム
は、ハードディスク18のプログラム記憶領域19に記
憶されているものとしているが、CD−ROMなどの記
録媒体に記録された形態であっても良い。すなわち、プ
ログラムの記録された記録媒体から、ドライブ装置を介
して、ハードディスク18のプログラム記憶領域19に
インストールし、CPU10が実行する形態であっても
良い。このような形態とすることで、本発明の汎用コン
ピュータでも容易に実現可能とすることができる。
Further, the program executed by the CPU 10 is stored in the program storage area 19 of the hard disk 18, but may be stored in a storage medium such as a CD-ROM. That is, the program may be installed in the program storage area 19 of the hard disk 18 from the recording medium on which the program is recorded via the drive device and executed by the CPU 10. With such a configuration, it is possible to easily realize the general-purpose computer of the present invention.

【0019】図2は本発明の一実施の形態における文書
管理装置の機能ブロック図であり、機能手段による構成
について示したものである。
FIG. 2 is a functional block diagram of the document management apparatus according to the embodiment of the present invention, and shows the configuration of functional units.

【0020】図2において、100は画像入力部、10
1は文字認識部、102は文字認識結果修正部、103
は解像度変換部、104は文書管理部であり、いずれも
ハードディスク18のプログラム領域19に記憶された
処理プログラムをCPU10が実行することによって実
現される。
In FIG. 2, reference numeral 100 denotes an image input unit;
1 is a character recognition unit, 102 is a character recognition result correction unit, 103
Denotes a resolution conversion unit, and 104 denotes a document management unit, each of which is realized by the CPU 10 executing a processing program stored in the program area 19 of the hard disk 18.

【0021】以上のように構成された文書管理装置につ
いて、以下に動作を説明する。図3は本発明の一実施の
形態における文書管理装置の動作フローチャートであ
り、CPU10がハードディスク18のプログラム記憶
領域19に記憶された文書管理プログラムを実行する様
子について示したものである。
The operation of the thus configured document management apparatus will be described below. FIG. 3 is an operation flowchart of the document management apparatus according to the embodiment of the present invention, showing how the CPU 10 executes the document management program stored in the program storage area 19 of the hard disk 18.

【0022】図4は本発明の一実施の形態における文書
管理装置の領域情報テーブルを示す図であり、原稿上の
文字領域に関する情報を表す方法について示したもので
ある。
FIG. 4 is a diagram showing an area information table of the document management apparatus according to an embodiment of the present invention, and shows a method of representing information on a character area on a document.

【0023】図5は本発明の一実施の形態における文書
管理装置において、原稿上の文字領域についての概念に
ついて示したものである。
FIG. 5 shows the concept of a character area on a document in the document management apparatus according to an embodiment of the present invention.

【0024】図6は本発明の一実施の形態における文書
管理装置の文字認識結果ファイルのデータ構造図であ
る。
FIG. 6 is a data structure diagram of a character recognition result file of the document management apparatus according to one embodiment of the present invention.

【0025】図7は本発明の一実施の形態における文書
管理装置の文書管理テーブルを示す図であり、画像デー
タと文字認識結果を管理する方法について示したもので
ある。
FIG. 7 is a view showing a document management table of the document management apparatus according to an embodiment of the present invention, and shows a method for managing image data and character recognition results.

【0026】図3において、ステップ1では、ハードデ
ィスク18のプログラム領域19に記憶された文書管理
プログラムが起動されると、ステップ2で原稿の高解像
度入力が行われる。ここで入力された画像データはステ
ップ3において行われる文字認識で使用される。入力さ
れた画像データは、RAM15の画像記憶領域16に記
憶される。文字認識部101において高い文字認識率を
得るためには、画像データの解像度が重要なので、本実
施の形態では、ステップ2で入力される画像の解像度は
400dpiとする。画像の形式は二値形式とする。
In FIG. 3, when the document management program stored in the program area 19 of the hard disk 18 is started in step 1, the high-resolution input of the original is performed in step 2. The input image data is used in character recognition performed in step 3. The input image data is stored in the image storage area 16 of the RAM 15. In order to obtain a high character recognition rate in the character recognition unit 101, the resolution of the image data is important. Therefore, in the present embodiment, the resolution of the image input in step 2 is 400 dpi. The image format is a binary format.

【0027】ステップ3では、ステップ2で画像記憶領
域16に記憶された画像データを読み出して文字認識を
行い、文字認識結果を文字認識結果記憶領域17に記憶
する。文字認識は、画像データを文字データに変換する
公知の技術であり、本発明はその手法については問わな
い。従って、ここでは簡単な説明にとどめておく。
In step 3, the image data stored in the image storage area 16 in step 2 is read to perform character recognition, and the character recognition result is stored in the character recognition result storage area 17. Character recognition is a known technique for converting image data into character data, and the present invention does not matter about the method. Therefore, only a brief description will be given here.

【0028】文字認識は、レイアウト情報の解析を行
い、文字領域・表領域・図形領域などに区分し、文字領
域は縦書き領域か、横書き領域に分ける。縦書き領域で
あれば、例えば新聞のように、右上の領域から左下の領
域に向かって、各矩形の読み取り順序を決め、文字認識
辞書記憶領域20に記憶された辞書を用いて文字認識処
理を行い、この順序に出力された文字列を得ればよい。
横書き領域の場合には左上の領域から右下の領域に向か
って読み取る。
In character recognition, layout information is analyzed and divided into a character area, a table area, a graphic area, and the like, and the character area is divided into a vertical writing area and a horizontal writing area. If it is a vertical writing area, for example, like a newspaper, the reading order of each rectangle is determined from the upper right area to the lower left area, and the character recognition process is performed using the dictionary stored in the character recognition dictionary storage area 20. It is sufficient to obtain the character strings output in this order.
In the case of a horizontal writing area, reading is performed from the upper left area to the lower right area.

【0029】ステップ4では、文字認識結果中の誤読文
字をキーボード13からの入力によって修正する。
In step 4, the misread characters in the character recognition result are corrected by input from the keyboard 13.

【0030】ステップ5では、画像記憶領域16に記憶
された画像データを読み出し、画像データを低解像度化
して再び画像記憶領域16に記憶させるので、ステップ
5以前に画像記憶領域16に記憶されていた高解像度の
画像データはステップ5の実行によって低解像度の画像
データに置換される。
In step 5, the image data stored in the image storage area 16 is read out, the resolution of the image data is reduced, and the image data is stored again in the image storage area 16. Therefore, the image data was stored in the image storage area 16 before step 5. The high-resolution image data is replaced with the low-resolution image data by performing step 5.

【0031】ステップ5で低解像度化する際の解像度は
200dpiとする。このステップにより400dpi
時に約2メガバイトであった画像データ容量が約0.5
メガバイトにまで減少する。
The resolution when the resolution is reduced in step 5 is 200 dpi. This step allows 400 dpi
Sometimes about 2 megabytes image data capacity is about 0.5
Reduced to megabytes.

【0032】ステップ6では、RAM15の画像記憶領
域16に記憶された低解像度画像データを文書保存領域
22に画像ファイルとして保存し、文字認識結果記憶領
域17に記憶された文字認識結果を同じく文書保存領域
22に文字認識結果ファイルとして保存する。さらに前
記画像ファイルと文字認識結果ファイルを一括管理する
ために図7に示すような文書管理テーブルを作成する。
文書管理テーブルの管理番号一つに対して画像ファイル
一つと文字認識結果ファイル一つが対応付けられ、文書
を検索する際には、管理番号をキーにして文書管理テー
ブルを検索し、当該ファイルを発見することが可能とな
る。
In step 6, the low-resolution image data stored in the image storage area 16 of the RAM 15 is stored as an image file in the document storage area 22, and the character recognition result stored in the character recognition result storage area 17 is also stored in the document. It is stored in the area 22 as a character recognition result file. Further, a document management table as shown in FIG. 7 is created for collectively managing the image file and the character recognition result file.
One image file and one character recognition result file are associated with one management number in the document management table, and when searching for a document, the document management table is searched using the management number as a key to find the file It is possible to do.

【0033】文字認識結果は、原稿上の文字の領域毎に
その位置情報と文字認識されたテキスト情報とで構成さ
れる。文字領域とは、図5に示すように、文字の集合体
を指す。
The character recognition result is composed of the position information and the text information of the recognized character for each character area on the document. The character area refers to a set of characters as shown in FIG.

【0034】文字領域情報を表す手段として、図4に示
すような領域情報管理テーブルを用いる。ページ番号
は、文書が複数ページで構成される場合のページ番号を
表す。X座標・Y座標・幅・高さは、領域の原稿上にお
ける位置とサイズを表す。文字組方向は、領域内の文字
の記述方向すなわち縦書きか横書きかを表す。テキスト
へのポインタは、領域内の文字認識結果が記憶されてい
る記憶位置アドレスを表す。参照時にはこのアドレスを
用いてテキストデータを参照できる。次領域へのポイン
タは、文書内の次の領域情報が記憶されている記憶位置
アドレスを表す。次領域へのポインタを辿ることにより
文書内の全ての領域の情報を参照することが可能とな
る。
As means for representing character area information, an area information management table as shown in FIG. 4 is used. The page number indicates a page number when the document is composed of a plurality of pages. The X coordinate, Y coordinate, width, and height indicate the position and size of the area on the document. The character set direction indicates the description direction of the character in the area, that is, whether it is vertical writing or horizontal writing. The pointer to the text indicates the storage location address where the result of character recognition in the area is stored. At the time of reference, text data can be referenced using this address. The pointer to the next area indicates the storage location address where the next area information in the document is stored. By following the pointer to the next area, it is possible to refer to information of all areas in the document.

【0035】図6に領域情報とテキスト情報との参照関
係を示す。領域1の領域情報が持つテキストへのポイン
タを辿れば領域1のテキストデータを参照できる。領域
1の次領域へのポインタを辿れば領域2の領域情報を参
照できる。領域2の領域情報が持つテキストへのポイン
タを辿れば領域1のテキストデータを参照できる。領域
2の次領域へのポインタには0が入っているのでこれ以
上の領域情報が存在しないことがわかる。
FIG. 6 shows a reference relationship between the area information and the text information. If the pointer to the text included in the area information of the area 1 is traced, the text data of the area 1 can be referred to. By following the pointer to the area next to the area 1, the area information of the area 2 can be referred to. If the pointer to the text included in the area information of the area 2 is traced, the text data of the area 1 can be referred to. Since 0 is contained in the pointer to the area next to the area 2, it is understood that there is no more area information.

【0036】このように文字認識結果ファイルには、画
像データを文字認識することにより得たテキストデータ
と元原稿上の位置を記憶しているために、全文検索時に
高速且つ確実に目的の記事を探索することが可能とな
り、画像データを低解像度化して保存しても原稿内容が
正しく保存されているために低解像度化の悪影響を受け
ることがない。
As described above, the character recognition result file stores the text data obtained by character recognition of the image data and the position on the original document. The search can be performed, and even if the image data is stored at a reduced resolution, the contents of the document are correctly stored, so that there is no adverse effect of the reduction in the resolution.

【0037】ステップ7では画像入力装置14に読込む
べき原稿がセットされているか否かを判定する。原稿が
セットされている場合はステップ2へ処理を移す。原稿
がセットされていなければ文書管理プログラムの動作を
終了する。
In step 7, it is determined whether a document to be read is set in the image input device 14. If a document is set, the process proceeds to step S2. If the original is not set, the operation of the document management program ends.

【0038】本実施の形態において、原稿の高解像度入
力時の解像度と、画像の低解像度変換時の解像度を固定
値としているが、これらの解像度を予めユーザーが自由
に設定する手段、または入力された高解像度画像データ
を文字認識した際に得られる文字画像のサイズから画像
上で文字を判別し得る最小の解像度を求めて低解像度値
を設定する手段を用いることも可能である。
In this embodiment, the resolution at the time of inputting a high-resolution document and the resolution at the time of low-resolution conversion of an image are fixed values. It is also possible to use a means for obtaining a minimum resolution capable of distinguishing characters on an image from the size of a character image obtained when character recognition is performed on high-resolution image data and setting a low resolution value.

【0039】以上のように本実施の形態によれば、画像
データを低解像度化することで記憶装置の記憶容量低減
が可能である。また、画像データの低解像度化による画
像品質の劣化については文字認識結果が記憶されている
ことにより原稿内容を確実に読み出すことが可能であ
る。
As described above, according to the present embodiment, the storage capacity of the storage device can be reduced by reducing the resolution of the image data. In addition, regarding the deterioration of image quality due to the reduction in resolution of image data, the document contents can be reliably read because the character recognition result is stored.

【0040】[0040]

【発明の効果】以上のように本発明は、原稿を第1の解
像度で二値の画像データに電子化する手段と、電子化さ
れた画像データに対して文字認識を行う手段と、文字認
識後に画像データを、第1の解像度よりも低い第2の低
解像度に変換する手段と、文字認識結果および第2の解
像の度画像データを保存する手段と、を有する構成とし
たことにより、保存するデータの記憶容量を低減させる
ことができるので、画像データの記憶領域を低減した文
書管理装置が実現できる。
As described above, the present invention provides a means for digitizing a document into binary image data at a first resolution, a means for performing character recognition on the digitized image data, and a method for character recognition. The image data is converted into a second lower resolution lower than the first resolution later, and the character recognition result and the second resolution image data are stored. Since the storage capacity of the data to be saved can be reduced, a document management device with a reduced storage area for image data can be realized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施の形態における文書管理装置の
回路ブロック図
FIG. 1 is a circuit block diagram of a document management apparatus according to an embodiment of the present invention.

【図2】本発明の一実施の形態における文書管理装置の
機能ブロック図
FIG. 2 is a functional block diagram of the document management apparatus according to the embodiment of the present invention;

【図3】本発明の一実施の形態における文書管理装置の
動作フローチャート
FIG. 3 is an operation flowchart of the document management apparatus according to the embodiment of the present invention;

【図4】本発明の一実施の形態における文書管理装置の
領域情報テーブルを示す図
FIG. 4 is a diagram showing an area information table of the document management apparatus according to the embodiment of the present invention;

【図5】本発明の一実施の形態における文書管理装置の
文字領域概念図
FIG. 5 is a conceptual diagram of a character area of the document management apparatus according to the embodiment of the present invention;

【図6】本発明の一実施の形態における文書管理装置の
文字認識結果ファイルのデータ構造図
FIG. 6 is a data structure diagram of a character recognition result file of the document management apparatus according to the embodiment of the present invention;

【図7】本発明の一実施の形態における文書管理装置の
文書管理テーブルを示す図
FIG. 7 is a view showing a document management table of the document management apparatus according to the embodiment of the present invention;

【符号の説明】[Explanation of symbols]

10 中央処理演算装置(CPU) 11 カソード・レイ・チューブ(CRT) 12 マウス 13 キーボード 14 画像入力装置 15 ランダム・アクセス・メモリ(RAM) 16 画像記憶領域 17 文字認識結果記憶領域 18 ハードディスク 19 プログラム記憶領域 20 文字認識辞書記憶領域 21 OS記憶領域 22 文書保存領域 23 リード・オンリ・メモリ(ROM) 24 起動プログラム記憶領域 100 画像入力部 101 文字認識部 102 文字認識結果修正部 103 解像度変換部 104 文書管理部 Reference Signs List 10 Central processing unit (CPU) 11 Cathode ray tube (CRT) 12 Mouse 13 Keyboard 14 Image input device 15 Random access memory (RAM) 16 Image storage area 17 Character recognition result storage area 18 Hard disk 19 Program storage area Reference Signs List 20 Character recognition dictionary storage area 21 OS storage area 22 Document storage area 23 Read-only memory (ROM) 24 Start-up program storage area 100 Image input unit 101 Character recognition unit 102 Character recognition result correction unit 103 Resolution conversion unit 104 Document management unit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】原稿を第1の解像度で二値の画像データに
電子化する手段と、 前記電子化された画像データに対して文字認識を行う手
段と、 文字認識後に前記画像データを、第1の解像度よりも低
い第2の低解像度に変換する手段と、 前記文字認識結果および前記第2の解像の度画像データ
を保存する手段と、を有することを特徴とする文書管理
装置。
A means for digitizing a document into binary image data at a first resolution; a means for performing character recognition on the digitized image data; A document management apparatus, comprising: means for converting to a second lower resolution lower than one resolution; and means for storing the character recognition result and the second resolution degree image data.
【請求項2】前記文字認識結果を修正する手段を有する
ことを特徴とする請求項1記載の文書管理装置。
2. The document management apparatus according to claim 1, further comprising means for correcting the character recognition result.
【請求項3】原稿を電子化して保存管理する文書管理方
法であって、 原稿を第1の解像度で二値の画像データに電子化し、 前記画像データを文字認識し、 前記画像データを、第1の解像度よりも低い第2の解像
度に変換し、 前記文字認識結果および前記第2の解像度の画像データ
を保存するように制御することを特徴とする文書管理方
法。
3. A document management method for digitizing and saving and managing a document, comprising: digitizing a document into binary image data at a first resolution; character-recognizing the image data; A document management method, comprising: converting the resolution to a second resolution lower than the first resolution; and controlling to save the character recognition result and the image data of the second resolution.
【請求項4】原稿を電子化して保存管理する文書管理プ
ログラムを記録した記録媒体であって、 原稿を第1の解像度で二値の画像データに電子化し、 前記画像データを文字認識し、 前記画像データを、第1の解像度よりも低い第2の解像
度に変換し、 前記文字認識結果および前記第2の解像度の画像データ
を保存するように制御することを特徴とする文書管理プ
ログラムを記録した記録媒体。
4. A recording medium storing a document management program for digitizing a document and storing and managing the document, wherein the document is digitized into binary image data at a first resolution, and the image data is character-recognized. A document management program for converting the image data into a second resolution lower than the first resolution, and controlling to save the character recognition result and the image data of the second resolution. recoding media.
JP10113151A 1998-04-23 1998-04-23 Method and device for document management and recording medium storing document management program Pending JPH11306321A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10113151A JPH11306321A (en) 1998-04-23 1998-04-23 Method and device for document management and recording medium storing document management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10113151A JPH11306321A (en) 1998-04-23 1998-04-23 Method and device for document management and recording medium storing document management program

Publications (1)

Publication Number Publication Date
JPH11306321A true JPH11306321A (en) 1999-11-05

Family

ID=14604871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10113151A Pending JPH11306321A (en) 1998-04-23 1998-04-23 Method and device for document management and recording medium storing document management program

Country Status (1)

Country Link
JP (1) JPH11306321A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014060761A (en) * 2013-10-31 2014-04-03 Fuji Xerox Co Ltd Service processing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014060761A (en) * 2013-10-31 2014-04-03 Fuji Xerox Co Ltd Service processing system

Similar Documents

Publication Publication Date Title
US7081975B2 (en) Information input device
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
JP4251629B2 (en) Image processing system, information processing apparatus, control method, computer program, and computer-readable storage medium
JP4366108B2 (en) Document search apparatus, document search method, and computer program
JP4533273B2 (en) Image processing apparatus, image processing method, and program
JPH0750483B2 (en) How to store additional information about document images
US7929772B2 (en) Method for generating typographical line
JP4227432B2 (en) Image processing method
CN116092108A (en) Method, system and storage medium for generating PDF file by scanning entity document
US8065321B2 (en) Apparatus and method of searching document data
JP2008108114A (en) Document processor and document processing method
JP2000322417A (en) Device and method for filing image and storage medium
JP2004334341A (en) Document retrieval system, document retrieval method, and recording medium
JPH11306321A (en) Method and device for document management and recording medium storing document management program
JP2007328432A (en) Business form processor, business form processing method, and program
JP4823049B2 (en) Document image retrieval apparatus and program
JPH08153110A (en) Device and method for filing document
US20230102476A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
JP2806340B2 (en) Form management device
JPH0793348A (en) Image information processor
JP2008181223A (en) Electronic document management system, electronic document management method, program, and recording medium
JPH0793485A (en) Image filing device
JPH08161350A (en) Method and device for electronic filing
JP3424942B2 (en) Bilingual image forming device
JP2008181383A (en) Character recognition apparatus, and method and program for controlling the same