JPH1097606A - Filing system connected with ocr device and filing method - Google Patents
Filing system connected with ocr device and filing methodInfo
- Publication number
- JPH1097606A JPH1097606A JP8248334A JP24833496A JPH1097606A JP H1097606 A JPH1097606 A JP H1097606A JP 8248334 A JP8248334 A JP 8248334A JP 24833496 A JP24833496 A JP 24833496A JP H1097606 A JPH1097606 A JP H1097606A
- Authority
- JP
- Japan
- Prior art keywords
- image
- file
- filing
- registration
- text file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Processing Or Creating Images (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、帳票等の紙媒体に
記録された内容をイメージデータとして保存するOCR
装置と連携したファイリングシステム及びファイリング
方法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an OCR for storing contents recorded on a paper medium such as a form as image data.
The present invention relates to a filing system and a filing method in cooperation with an apparatus.
【0002】[0002]
【従来の技術】一般に、ファイリングシステムは、帳票
等の紙媒体に記録された内容をスキャナ等によって読み
込み、読み込んだイメージ(ファイル)に対してキーワ
ードを付して保存する。ファイリングシステムに保存さ
れた多数のイメージから必要なイメージを読み出す場合
には、保存する際に付したキーワードを指定することで
所望するイメージを特定することができる。2. Description of the Related Art In general, a filing system reads contents recorded on a paper medium such as a form using a scanner or the like, and saves the read image (file) with a keyword attached thereto. When reading a required image from a large number of images stored in the filing system, a desired image can be specified by specifying a keyword assigned at the time of storage.
【0003】従来のファイリングシステムにおいてキー
ワードは、帳票に記録されている特徴的な文字列、例え
ば帳票番号や表題等の内容を選択して、キーボードの操
作によって入力されている。In a conventional filing system, a keyword is input by operating a keyboard by selecting a characteristic character string recorded in a form, such as a form number or a title.
【0004】ところで、帳票等の紙媒体に記録された内
容を読み込む装置として、他にOCR装置(光学的文字
読取装置)がある。OCR装置では、帳票等のイメージ
を読み込み、このイメージに対して帳票に記録されてい
る帳票番号や表題等を表す文字を認識して、文字コード
からなるテキストファイルを出力することができる。ま
た、文字認識のために読み込んだイメージそのものを、
イメージファイルとして出力することができる。There is another OCR device (optical character reading device) as a device for reading contents recorded on a paper medium such as a form. The OCR device can read an image of a form or the like, recognize a character representing a form number, a title, or the like recorded on the form with respect to the image, and output a text file including a character code. Also, the image itself read for character recognition,
It can be output as an image file.
【0005】[0005]
【発明が解決しようとする課題】しかしながら、従来の
ファイリングシステムでは、大量の帳票等をファイリン
グする場合、帳票を1枚毎にスキャナで読み込み、その
都度、キーボードからキーワードを入力しなければなら
なかった。However, in the conventional filing system, when filing a large number of forms, etc., it is necessary to read the forms one by one with a scanner and input a keyword from a keyboard each time. .
【0006】また、OCR装置では、帳票に記録されて
いる帳票番号や表題等を表す文字を文字認識した結果を
テキストファイルとして出力し、帳票に対して読み込ん
だイメージをイメージファイルとして出力するだけであ
って、各ファイルを体系的に保存するものではなかっ
た。従来、OCR装置によって得られたテキストファイ
ルとイメージファイルを体系的に保存するためには、テ
キストファイルとイメージファイルを再度、ファイリン
グシステムに入力する作業が必要であった。In the OCR apparatus, the result of character recognition of characters representing the form number and title recorded on the form is output as a text file, and the image read from the form is output as an image file. There was no systematic saving of each file. Conventionally, in order to systematically save a text file and an image file obtained by an OCR device, it is necessary to input the text file and the image file to the filing system again.
【0007】ファイリングシステムを利用した場合、あ
るいはOCR装置を利用した場合の何れであっても、簡
単な操作によって、イメージファイルに適切なキーワー
ドを付して体系的に保存することができず、操作に非常
に手間がかかっていた。[0007] Regardless of whether a filing system is used or an OCR device is used, an image file cannot be systematically saved with an appropriate keyword by a simple operation. Was very time consuming.
【0008】本発明は前記のような事情を考慮してなさ
れたもので、帳票等の紙媒体に記録された内容を表すイ
メージを適当なキーワードを付して簡単にファイリング
することが可能なOCR装置と連携したファイリングシ
ステム及びファイリング方法を提供することを目的とす
る。The present invention has been made in view of the above-mentioned circumstances, and an OCR capable of easily filing an image representing the content recorded on a paper medium such as a form with an appropriate keyword attached thereto. An object of the present invention is to provide a filing system and a filing method in cooperation with an apparatus.
【0009】[0009]
【課題を解決するための手段】本発明は、紙媒体に記録
された内容をイメージによって読取ってイメージファイ
ルを作成すると共に、前記イメージ中に含まれる文字に
ついて文字認識処理を施してテキストファイルを作成す
るOCR装置と、前記OCR装置によって作成された前
記イメージファイルと前記テキストファイルとを読み込
んで、体系的にファイリングするための登録制御を行な
う登録機能を有するホストシステムと、前記ホストシス
テムの登録機能による登録制御により、前記イメージフ
ァイルと前記テキストファイルとをファイリングシステ
ムとをファイリングするファイリングシステムとを具備
したことを特徴とする。According to the present invention, an image file is created by reading the contents recorded on a paper medium using an image, and a character file is created by performing a character recognition process on the characters included in the image. OCR device, a host system having a registration function of reading the image file and the text file created by the OCR device and performing registration control for systematically filing, and a registration function of the host system. A filing system for filing the image file and the text file with a filing system by registration control.
【0010】このような構成により、OCR装置からの
出力ファイルをファイリングシステムに登録することが
できるので、文字認識処理の処理結果(テキストファイ
ル)と帳票等の紙媒体から読み取られたイメージを、体
系的にファイリングしておくことができる。With such a configuration, an output file from the OCR device can be registered in the filing system. Therefore, the processing result (text file) of the character recognition process and the image read from a paper medium such as a form can be systematized. Can be filed in advance.
【0011】また本発明は、紙媒体に記録された内容を
イメージによって読取ってイメージファイルを作成する
と共に、前記イメージ中に含まれる文字について文字認
識処理を施してテキストファイルを作成するOCR装置
と、前記OCR装置によって作成された前記イメージフ
ァイルと前記テキストファイルとを読み込んで、前記テ
キストファイルの内容を利用して紙媒体の1枚毎にキー
ワードを作成し、このキーワードを紙媒体の1枚に対応
する前記イメージファイルと前記テキストファイルとに
付して体系的にファイリングするための登録制御を行な
う登録機能を有するホストシステムと、前記ホストシス
テムの登録機能による登録制御により、前記イメージフ
ァイルと前記テキストファイルとをファイリングシステ
ムとをファイリングするファイリングシステムとを具備
したことを特徴とする。According to the present invention, there is provided an OCR apparatus for reading a content recorded on a paper medium by using an image to create an image file, and performing a character recognition process on a character included in the image to create a text file. The image file and the text file created by the OCR device are read, and a keyword is created for each sheet of paper using the contents of the text file, and the keyword corresponds to one sheet of paper. A host system having a registration function of performing registration control for systematically filing the image file and the text file with the image file and the text file, and performing the registration control by the registration function of the host system. And the filing system and the filing Characterized by comprising a filing system.
【0012】このような構成により、複数枚の紙媒体を
1度に読み込んでも、イメージ読み込みと同時に、ファ
イリングシステムにおいて検索対象を特定するためのキ
ーワードが1枚の紙媒体毎に自動作成され、1枚の紙媒
体のイメージファイルとテキストファイルを1書類とし
てファイリングシステムに登録することができるので、
キーワード登録のための操作を行なうことなく、紙媒体
から得られるイメージファイルとテキストファイルを簡
単にファイリングすることができる。With such a configuration, even when a plurality of paper media are read at once, a keyword for specifying a search target is automatically created for each paper medium by the filing system at the same time as the image is read. You can register an image file and a text file of a sheet of paper as one document in the filing system.
An image file and a text file obtained from a paper medium can be easily filed without performing an operation for registering a keyword.
【0013】また本発明は、紙媒体に記録された内容を
イメージによって読取ってイメージファイルを作成する
と共に、前記イメージ中に含まれる文字について文字認
識処理を施してテキストファイルを作成するOCR装置
と、前記OCR装置によって作成された前記イメージフ
ァイルと前記テキストファイルとを読み込んで、前記テ
キストファイルの複数の紙媒体中の先頭の紙媒体の内容
を利用してキーワードを作成し、このキーワードを複数
の紙媒体に対応する前記イメージファイルと前記テキス
トファイルとに付して体系的にファイリングするための
登録制御を行なう登録機能を有するホストシステムと、
前記ホストシステムの登録機能による登録制御により、
前記イメージファイルと前記テキストファイルとをファ
イリングシステムとをファイリングするファイリングシ
ステムとを具備したことを特徴とする。According to the present invention, there is provided an OCR apparatus for reading a content recorded on a paper medium by using an image to create an image file, and performing a character recognition process on characters included in the image to create a text file. The image file and the text file created by the OCR device are read, and a keyword is created by using the content of the first paper medium among the plurality of paper media of the text file, and the keyword is written to a plurality of paper media. A host system having a registration function of performing registration control for systematically filing the image file and the text file corresponding to a medium;
By the registration control by the registration function of the host system,
A filing system for filing the image file and the text file with a filing system.
【0014】このような構成により、複数枚の紙媒体を
1度に読み込んでも、イメージ読み込みと同時に、ファ
イリングシステムにおいて検索対象を特定するためのキ
ーワードがテキストファイルの先頭の紙媒体の内容から
自動作成され、複数枚の紙媒体のイメージファイルとテ
キストファイルを1書類としてファイリングシステムに
登録することができるので、キーワード登録のための操
作を行なうことなく、紙媒体から得られるイメージファ
イルとテキストファイルを簡単にファイリングすること
ができる。With this configuration, even when a plurality of paper media are read at once, a keyword for specifying a search target in the filing system is automatically created from the contents of the head paper medium of the text file at the same time as the image is read. In addition, since image files and text files of a plurality of paper media can be registered as one document in the filing system, image files and text files obtained from paper media can be easily saved without performing an operation for keyword registration. Can be filed.
【0015】また本発明は、紙媒体に記録された内容を
イメージによって読取ってイメージファイルを作成する
と共に、前記イメージ中に含まれる文字について文字認
識処理を施してテキストファイルを作成するOCR装置
と、前記OCR装置によって作成された前記イメージフ
ァイルと前記テキストファイルとを読み込んで、前記テ
キストファイルの複数の紙媒体群中の各群の先頭の紙媒
体の内容を利用してキーワードを作成し、このキーワー
ドを対応する紙媒体群に対応する前記イメージファイル
と前記テキストファイルとに付して体系的にファイリン
グするための登録制御を行なう登録機能を有するホスト
システムと、前記ホストシステムの登録機能による登録
制御により、前記イメージファイルと前記テキストファ
イルとをファイリングシステムとをファイリングするフ
ァイリングシステムとを具備したことを特徴とする。According to the present invention, there is provided an OCR apparatus for reading a content recorded on a paper medium using an image to create an image file, and performing a character recognition process on characters included in the image to create a text file. The image file and the text file created by the OCR device are read, and a keyword is created by using the contents of the first paper medium of each of the plurality of paper medium groups of the text file. A host system having a registration function of performing registration control for systematically filing the image file and the text file corresponding to the corresponding paper medium group, and registration control by the registration function of the host system. File from the image file and the text file Characterized by comprising a filing system for filing and Gushisutemu.
【0016】このような構成により、内容的に関連する
複数の紙媒体からなる紙媒体群が複数含まれる複数枚の
紙媒体を1度に読み込んでも、イメージ読み込みと同時
に、ファイリングシステムにおいて検索対象を特定する
ためのキーワードがテキストファイルの各紙媒体群の先
頭の紙媒体の内容から自動作成され、各紙媒体群毎の複
数枚の紙媒体のイメージファイルとテキストファイルを
1書類としてファイリングシステムに登録することがで
きるので、キーワード登録のための操作を行なうことな
く、紙媒体から得られるイメージファイルとテキストフ
ァイルを簡単にファイリングすることができる。With such a configuration, even if a plurality of paper media including a plurality of paper media groups including a plurality of paper media related in terms of content are read at one time, an image is read and a search target is searched in the filing system at the same time. A keyword for specifying is automatically created from the content of the first paper medium of each paper medium group of the text file, and image files and text files of a plurality of paper mediums for each paper medium group are registered as one document in the filing system. Therefore, it is possible to easily file an image file and a text file obtained from a paper medium without performing an operation for registering a keyword.
【0017】[0017]
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図1は本実施形態に係わる
OCR装置と連携したファイリングシステムの構成を示
すブロック図である。図1に示すように、本実施形態に
おけるOCR装置と連携したファイリングシステムは、
OCR装置10、ホストシステム12、及びファイリン
グシステム14によって構成されている。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a filing system in cooperation with the OCR device according to the present embodiment. As shown in FIG. 1, the filing system in cooperation with the OCR device in the present embodiment
It comprises an OCR device 10, a host system 12, and a filing system 14.
【0018】OCR装置10は、帳票、文書、本、新聞
等の紙媒体に記録された内容を読取ってイメージファイ
ルを作成すると共に、イメージ中に含まれる文字につい
て文字認識処理を施してテキストファイル(認識結果フ
ァイル)を作成する。また、OCR装置10は、イメー
ジファイルとテキストファイルとの関係を示すデータを
含むカタログファイルを作成する。The OCR device 10 reads an image recorded on a paper medium such as a form, a document, a book, and a newspaper to create an image file, and performs a character recognition process on characters included in the image to execute a text file ( (Recognition result file). Further, the OCR device 10 creates a catalog file including data indicating the relationship between the image file and the text file.
【0019】ホストシステム12は、OCR装置10に
おける処理を制御し、処理結果(イメージファイル、テ
キストファイル、カタログファイル)を保存すると共
に、処理結果をファイリングシステム14において体系
的に登録するための処理を行なう。ホストシステム12
の詳細な構成については後述する。The host system 12 controls the processing in the OCR device 10, stores processing results (image files, text files, catalog files), and performs processing for systematically registering the processing results in the filing system 14. Do. Host system 12
The detailed configuration will be described later.
【0020】ファイリングシステム14は、OCR装置
10によって作成されたイメージファイルとテキストフ
ァイルとをホストシステム12の制御のもとで読み込ん
で、体系的にファイリングするもので、コントローラ3
0、スキャナ32、プリンタ34、ディスプレイ36、
キーボード38、ファイル記憶ユニット39を含んで構
成されている。The filing system 14 reads the image file and the text file created by the OCR device 10 under the control of the host system 12 and systematically filings them.
0, scanner 32, printer 34, display 36,
It includes a keyboard 38 and a file storage unit 39.
【0021】コントローラ30は、ファイリングシステ
ム14の全ての機能を制御するもので、プロセッサシス
テム、画像処理システム、フロッピーディスク装置やハ
ードディスク装置等の外部記憶装置が設けられている。The controller 30 controls all functions of the filing system 14, and includes a processor system, an image processing system, and an external storage device such as a floppy disk device or a hard disk device.
【0022】スキャナ32は、ファイリングシステム1
4においてファイリングしようとするイメージの読取り
を行なう。プリンタ34は、ファイリングされた各種フ
ァイル(イメージ、テキスト)の内容等を印刷出力す
る。The scanner 32 has a filing system 1
At step 4, the image to be filed is read. The printer 34 prints out the contents of the filed various files (image, text) and the like.
【0023】ディスプレイ36は、ファイリングされた
各種ファイル(イメージ、テキスト)の内容表示やガイ
ド表示等に使用される。キーボード38は、ファイリン
グシステム14に対する動作制御用の命令の入力や、フ
ァイリングされるイメージに対して付加するキーワード
やファイル検索のためのキーワードの入力等に使用され
る。The display 36 is used for displaying the contents of various filed files (images and texts) and for displaying guides. The keyboard 38 is used for inputting an operation control command to the filing system 14, inputting a keyword to be added to an image to be filed, a keyword for searching a file, and the like.
【0024】ファイル記憶ユニット39は、例えば光デ
ィスクドライブユニットによって構成され、各種ファイ
ルを記憶するものである。ファイル記憶ユニット39に
ファイリングされたイメージファイル及びテキストファ
イルは、キーワードをもとにして特定され読み出され
る。The file storage unit 39 is composed of, for example, an optical disk drive unit and stores various files. The image file and the text file filed in the file storage unit 39 are specified and read based on the keyword.
【0025】次に、ホストシステム12は、図1に示す
ように、OCR装置制御部20、ファイリングOCR登
録部22、及び記憶部24を含んで構成されている。O
CR装置制御部20は、OCR装置10における処理を
制御すると共に、処理結果を入力して、記憶部24に記
憶させる。Next, as shown in FIG. 1, the host system 12 includes an OCR device control unit 20, a filing OCR registration unit 22, and a storage unit 24. O
The CR device control unit 20 controls the processing in the OCR device 10, inputs the processing result, and stores the result in the storage unit 24.
【0026】ファイリングOCR登録部22は、OCR
装置10における処理結果をファイリングシステム14
において体系的に登録するための処理を行なう。ファイ
リングOCR登録部22の詳細な構成については後述す
る(図2)。The filing OCR registration unit 22 stores the OCR
Filing system 14 for processing results in device 10
Performs a systematic registration process. The detailed configuration of the filing OCR registration unit 22 will be described later (FIG. 2).
【0027】記憶部24は、OCR装置10における処
理結果(各ファイル)や、一時記憶領域24aにおいて
ファイリングOCR登録部22での処理過程における一
時的なデータ等を記憶する。The storage unit 24 stores the processing results (each file) in the OCR device 10 and the temporary data in the process of the filing OCR registration unit 22 in the temporary storage area 24a.
【0028】次に、ファイリングOCR登録部22は、
図2に示すように、登録方法判別部40、タイトル登録
部42、イメージ登録部44、認識結果ファイル登録部
46、通信部48の各機能が設けられている。Next, the filing OCR registration unit 22
As shown in FIG. 2, each function of a registration method determination unit 40, a title registration unit 42, an image registration unit 44, a recognition result file registration unit 46, and a communication unit 48 is provided.
【0029】登録方法判別部40は、OCR装置10に
おける処理結果をファイリングシステム14に登録(フ
ァイリング)する方法を判別するもので、本実施形態で
は3通り方法から選択するものとする。The registration method discriminating section 40 discriminates a method of registering (filing) a processing result in the OCR apparatus 10 into the filing system 14, and in this embodiment, selects one of three methods.
【0030】3通りの方法には、第1に無条件に1帳票
1書類として登録する方法(1帳票1書類登録)、第2
に無条件に全帳票を1書類として登録する方法(全帳票
1書類登録)、第3にOCR装置10における処理によ
って帳票毎に付されるID番号に応じて登録する方法
(ID番号利用登録)がある。The three methods include a method of unconditionally registering one form and one document (one form and one document registration) and a second method.
First, a method of unconditionally registering all forms as one document (one form, one document registration), and third, a method of registering according to an ID number assigned to each form by processing in the OCR apparatus 10 (ID number use registration) There is.
【0031】タイトル登録部42は、登録方法判別部4
0における判別に応じて、OCR装置10からのテキス
トファイル(認識結果ファイル)をもとに、ファイリン
グシステム14においてキーワードとして用いられるタ
イトルを作成し、通信部48を介してファイリングシス
テム14に登録する。The title registration unit 42 includes a registration method discrimination unit 4
In accordance with the determination at 0, a title used as a keyword in the filing system 14 is created based on the text file (recognition result file) from the OCR device 10 and registered in the filing system 14 via the communication unit 48.
【0032】イメージ登録部44は、登録方法判別部4
0における判別に応じて、OCR装置10からのイメー
ジファイルを、通信部48を介してファイリングシステ
ム14に登録する。The image registration unit 44 includes a registration method discrimination unit 4
According to the determination at 0, the image file from the OCR device 10 is registered in the filing system 14 via the communication unit 48.
【0033】認識結果ファイル登録部46は、必要に応
じて、OCR装置10からのテキストファイル(認識結
果ファイル)を、通信部48を介してファイリングシス
テム14に登録する。The recognition result file registration unit 46 registers the text file (recognition result file) from the OCR device 10 in the filing system 14 via the communication unit 48 as needed.
【0034】通信部48は、タイトル登録部42、イメ
ージ登録部44、認識結果ファイル登録部46によるフ
ァイリングすべき内容をファイリングシステム14へ送
信する。The communication unit 48 transmits the contents to be filed by the title registration unit 42, the image registration unit 44, and the recognition result file registration unit 46 to the filing system 14.
【0035】次に、本実施形態におけるファイリングの
概念について説明する。本実施形態におけるファイリン
グシステム14では、図3に示すように、ファイルの最
小単位を頁(1枚の帳票)とし、1帳票1書類登録では
1つの頁(イメージファイル)を1書類として扱い、全
帳票1書類登録では、複数の頁を1書類として扱う。I
D番号利用登録では、各頁に付されるID番号に応じ
て、タイトル登録部42によってタイトルが作成される
頁を含む任意の数の頁を1書類として扱う。図4には、
本実施形態におけるファイリングシステム14に登録
(ファイリング)する形態を示している。さらに、ファ
イリングシステム14では、複数の書類をバインダとし
て、複数のバインダをキャビネットとして管理すること
ができる。Next, the concept of filing in this embodiment will be described. In the filing system 14 according to the present embodiment, as shown in FIG. 3, the minimum unit of a file is a page (one form), and in one form and one document registration, one page (image file) is treated as one document. In one form document registration, a plurality of pages are treated as one document. I
In the D number use registration, an arbitrary number of pages including a page in which a title is created by the title registration unit 42 are handled as one document according to an ID number assigned to each page. In FIG.
A mode of registering (filing) in the filing system 14 in the present embodiment is shown. Furthermore, the filing system 14 can manage a plurality of documents as a binder and a plurality of binders as a cabinet.
【0036】次に、本実施形態におけるOCR装置と連
携したファイリングシステムのファイリング方法につい
て、図5、図6、図7、図8に示すフローチャートを参
照しながら説明する。Next, a filing method of the filing system in cooperation with the OCR apparatus according to the present embodiment will be described with reference to flowcharts shown in FIGS. 5, 6, 7 and 8.
【0037】まず、OCR装置10において、例えば帳
票群に対する文字認識処理が実行される。処理対象とす
る帳票群は、ID番号利用登録を行なう場合には、帳票
群中の各1書類とする束の先頭の頁にタイトルとする文
字列が記録されている条件があるが、1帳票1書類登
録、全帳票1書類登録を行なう場合には、任意に配列さ
れた帳票群を処理対象とすることができる。First, in the OCR device 10, for example, a character recognition process is performed on a form group. In the case of performing registration using an ID number, a form group to be processed has a condition that a character string as a title is recorded on the first page of a bundle of each document in the form group. When registering one document and all forms, one document can be processed by arbitrarily arranged form groups.
【0038】OCR装置10は、帳票群に対する処理結
果として、イメージファイル、テキストファイル(認識
結果ファイル)、カタログファイルを作成して、ホスト
システム12に出力する。ホストシステム12のOCR
装置制御部20は、OCR装置10における処理結果を
記憶部24に記憶させる。The OCR device 10 creates an image file, a text file (recognition result file), and a catalog file as processing results for the form group, and outputs them to the host system 12. OCR of host system 12
The device control unit 20 causes the storage unit 24 to store the processing result of the OCR device 10.
【0039】認識結果ファイルは、ファイリングシステ
ム14においてファイリングする際のキーワードとして
いる文字列の認識結果を含み、例えば図9に示すような
内容を含んでいる。The recognition result file includes a recognition result of a character string used as a keyword at the time of filing in the filing system 14, and includes, for example, contents as shown in FIG.
【0040】すなわち、認識結果ファイルには、複数の
帳票のそれぞれから読み取られた認識結果が1行毎に登
録され、フィールドの区切りがTabによって表されて
いる。本実施形態では、タイトルの構造(タイトル構造
情報)が、先頭からのキー数によって定義される(後述
する)。That is, in the recognition result file, the recognition result read from each of the plurality of forms is registered for each line, and the delimiter of the field is represented by Tab. In the present embodiment, the title structure (title structure information) is defined by the number of keys from the beginning (described later).
【0041】カタログファイルは、図10に示すよう
に、各帳票毎にID番号、イメージデータ数、イメージ
ファイル名が対応づけて登録されている。ID番号は、
ID番号利用登録を行なう際に用いられるもので、OC
R装置10における認識処理の結果を用いて、タイトル
とイメージを登録対象とすることを示す「1」、タイト
ルのみを登録対象とする「2」、イメージのみを登録対
象とする「2」が設定される。As shown in FIG. 10, in the catalog file, an ID number, the number of image data, and an image file name are registered in association with each form. The ID number is
It is used when registering ID number use, and is used for OC
Using the result of the recognition processing in the R device 10, "1" indicating that a title and an image are to be registered, "2" being only a title to be registered, and "2" being an image only to be registered are set. Is done.
【0042】OCR装置10は、処理対象とする帳票群
に対して、タイトルとすべき文字を認識するためのフォ
ーマットに基づいて認識処理を行ない、正しく認識でき
た場合には、登録すべきタイトルを含む帳票であると判
別して、ID番号を「1」または「2」とする。The OCR device 10 performs a recognition process on a group of forms to be processed based on a format for recognizing a character to be a title. It is determined that the form includes the ID number, and the ID number is set to “1” or “2”.
【0043】イメージデータ数は、1帳票に含まれるイ
メージの数である。区分された複数のイメージ領域が存
在した場合に、各領域毎にイメージが読み取られる。ホ
ストシステム12のファイリングOCR登録部22は、
OCR装置10における処理結果が記憶部24に記憶さ
れると、ファイリングシステム14にデータを送信する
ため、ファイリングシステム14との間で論理的な通信
経路を設定する(ステップS1)。The number of image data is the number of images included in one form. When there are a plurality of divided image areas, an image is read for each area. The filing OCR registration unit 22 of the host system 12
When the processing result in the OCR device 10 is stored in the storage unit 24, a logical communication path is set with the filing system 14 to transmit the data to the filing system 14 (step S1).
【0044】ファイリングOCR登録部22は、通信経
路が確保されると、ファイリングシステム14において
予め設定されているタイトル構造情報を取得する(ステ
ップS3)。ここでは、タイトル構造情報が3、すなわ
ち認識結果ファイル中の先頭から3つめまでのキー数を
タイトルとすることが設定されているものとする。When the communication path is secured, the filing OCR registration unit 22 acquires title structure information preset in the filing system 14 (step S3). Here, it is assumed that the title structure information is set to 3, that is, the title number is set to the third key from the beginning in the recognition result file.
【0045】ファイリングOCR登録部22は、記憶部
24に記憶されているカタログファイル、認識結果ファ
イルをOPENする(ステップS4)。ここで、ファイ
リングOCR登録部22の登録方法判別部40は、OC
R装置10による処理結果をファイリングシステム14
に登録するための帳票登録方法が3つの方法の何れであ
るかをチェックする(ステップS5)。帳票登録方法
は、OCR装置10における処理を開始する前に予め設
定されていても良いし、処理開始時に任意に指定しても
良い。登録方法判別部40は、帳票登録方法に応じた処
理の実行を、タイトル登録部42、イメージ登録部4
4、認識結果ファイル登録部46に対して指示する。The filing OCR registration unit 22 opens the catalog file and the recognition result file stored in the storage unit 24 (Step S4). Here, the registration method determination unit 40 of the filing OCR registration unit 22 is
Filing system 14 stores the processing result of R device 10
It is checked which of the three methods is the form registration method for registering the form (step S5). The form registration method may be set in advance before starting the processing in the OCR device 10, or may be arbitrarily specified at the start of the processing. The registration method discriminating unit 40 executes the processing according to the form registration method by the title registration unit 42 and the image registration unit 4.
4. Instruct the recognition result file registration unit 46.
【0046】帳票登録方法が1帳票1書類登録であった
場合、タイトル登録部42は、記憶部24中のカタログ
ファイルと認識結果ファイルを読み込むと共に、認識結
果ファイルの対象とする帳票についての認識結果を用い
て、タイトル構造情報に応じてタイトルを作成する(ス
テップS6,S9)。タイトル登録部42は、作成した
タイトルを通信部48を介してファイリングシステム1
4へ登録する(ステップS10)。When the form registration method is one form and one document registration, the title registration unit 42 reads the catalog file and the recognition result file from the storage unit 24 and recognizes the recognition result of the form to be included in the recognition result file. To create a title according to the title structure information (steps S6 and S9). The title registration unit 42 stores the created title in the filing system 1 via the communication unit 48.
4 (step S10).
【0047】一方、イメージ登録部44は、記憶部24
中のイメージファイルを通信部48を介してファイリン
グシステム14へ登録する(ステップS11)。1帳票
に複数のイメージが含まれている場合、イメージ登録部
44は、イメージファイル数分のイメージファイルの登
録を繰り返す。On the other hand, the image registration unit 44
The inside image file is registered in the filing system 14 via the communication unit 48 (step S11). When one form includes a plurality of images, the image registration unit 44 repeats registration of image files for the number of image files.
【0048】ここで、認識結果ファイルの登録の実行が
指示されている場合、認識結果ファイル登録部46は、
記憶部24中の認識結果ファイル(テキストファイル)
を通信部48を介してファイリングシステム14へ登録
する(ステップS12,S13)。認識結果ファイルの
登録の有無は、OCR装置10における処理を開始する
前に予め設定されていても良いし、処理開始時に任意に
指定しても良い。Here, when execution of registration of the recognition result file is instructed, the recognition result file registration unit 46
Recognition result file (text file) in storage unit 24
Is registered in the filing system 14 via the communication unit 48 (steps S12 and S13). Whether or not the recognition result file is registered may be set before starting the processing in the OCR apparatus 10 or may be arbitrarily specified at the start of the processing.
【0049】以下、同様にして、カタログファイルに登
録されているデータが示す各帳票に対応するイメージフ
ァイルについて同様の処理を実行してファイリングシス
テム14にタイトルとイメージファイルとを、必要に応
じて認識結果ファイルを付加してファイリングする。In the same manner, the same processing is performed for the image file corresponding to each form indicated by the data registered in the catalog file, and the filing system 14 recognizes the title and the image file as necessary. File the result file.
【0050】全てのデータに対する処理が終了すると
(ステップS7)、通信部48は、ファイリングシステ
ム14との間の切断処理を行なう(ステップS8)。図
11には1帳票1書類登録を行なう場合の各ファイルの
簡単な具体例を示している。図11に示すように、カタ
ログファイルには、2枚の帳票に対する処理結果(イメ
ージファイル)が存在することを示している。なお、1
帳票1書類登録の場合にはID番号を使用しない。ま
た、認識結果ファイルには、2枚の帳票からそれぞれ認
識されたテキストの内容(テキストデータ)が登録され
ている。When the processing for all data is completed (step S7), the communication unit 48 performs a disconnection process with the filing system 14 (step S8). FIG. 11 shows a simple specific example of each file when one form and one document are registered. As shown in FIG. 11, the catalog file indicates that processing results (image files) for two sheets exist. In addition, 1
In the case of registering one form, no ID number is used. In the recognition result file, text contents (text data) recognized from the two forms are registered.
【0051】ファイリング登録結果は、1帳票1書類登
録であるため、2枚の帳票分の各書類毎に、タイトル
と、頁1として1枚の帳票分のイメージファイル、頁2
として認識結果ファイルの内容がファイリングされてい
る。Since the filing registration result is one form and one document registration, a title, an image file for one form as page 1 and a page 2 for each of two forms
The contents of the recognition result file are filed.
【0052】次に、ステップS5において、登録方法判
別部40によって、全帳票1書類登録が指定されている
と判別された場合、タイトル登録部42は、記憶部24
中のカタログファイルと認識結果ファイルを読み込むと
共に、認識結果ファイルの対象とする帳票についての認
識結果を用いて、先頭の帳票に対する処理結果について
タイトル構造情報に応じてタイトルを作成する(ステッ
プS14,S16)。タイトル登録部42は、作成した
タイトルを通信部48を介してファイリングシステム1
4へ登録する(ステップS17)。Next, in step S5, when the registration method discriminating unit 40 determines that the registration of all forms 1 document has been designated, the title registering unit 42 stores in the storage unit 24.
In addition to reading the catalog file and the recognition result file therein, a title is created for the processing result for the first form in accordance with the title structure information by using the recognition result of the form targeted by the recognition result file (steps S14 and S16). ). The title registration unit 42 stores the created title in the filing system 1 via the communication unit 48.
4 (step S17).
【0053】一方、イメージ登録部44は、記憶部24
中のイメージファイルを通信部48を介してファイリン
グシステム14へ登録する(ステップS18)。1帳票
に複数のイメージが含まれている場合、イメージ登録部
44は、イメージファイル数分のイメージファイルの登
録を繰り返す。On the other hand, the image registration unit 44
The image file inside is registered in the filing system 14 via the communication unit 48 (step S18). When one form includes a plurality of images, the image registration unit 44 repeats registration of image files for the number of image files.
【0054】先頭の帳票に対する処理が完了すると、2
枚目以降の帳票に対してはタイトル登録部42による処
理を行なわず、イメージ登録部44によるイメージファ
イルの登録が、先頭以外の帳票の処理結果について行わ
れる(ステップS18)。When the processing for the first form is completed, 2
The processing by the title registration unit 42 is not performed on the subsequent sheets, and the registration of the image file by the image registration unit 44 is performed on the processing results of the forms other than the first form (step S18).
【0055】以下、同様にして、カタログファイルに登
録されているデータが示す各帳票に対応するイメージフ
ァイルを、同様の処理を実行してファイリングシステム
14にファイリングする。In the same manner, an image file corresponding to each form indicated by the data registered in the catalog file is similarly processed to be filed in the filing system 14.
【0056】全てのデータに対する処理が終了すると
(ステップS15)、認識結果ファイル登録部46は、
認識結果ファイルの登録の実行が指示されているか否か
を判別する(ステップS19)。When the processing for all data is completed (step S15), the recognition result file registration unit 46
It is determined whether registration of the recognition result file has been instructed (step S19).
【0057】認識結果ファイルの登録の実行が指示され
ている場合、認識結果ファイル登録部46は、記憶部2
4中の認識結果ファイル(テキストファイル)を通信部
48を介してファイリングシステム14へ登録する(ス
テップS20)。When execution of registration of a recognition result file is instructed, the recognition result file registration unit 46
4 is registered in the filing system 14 via the communication unit 48 (step S20).
【0058】通信部48は、ファイリングシステム14
との間の切断処理を行なう(ステップS21)。図12
には全帳票1書類登録を行なう場合の各ファイルの簡単
な具体例を示している。図12に示すように、カタログ
ファイルには、2枚の帳票に対する処理結果(イメージ
ファイル)が存在することを示している。なお、全帳票
1書類登録の場合にはID番号を使用しない。また、認
識結果ファイルには、2枚の帳票からそれぞれ認識され
たテキストの内容(テキストデータ)が登録されてい
る。The communication unit 48 includes the filing system 14
(Step S21). FIG.
Shows a simple specific example of each file when registering one document for all forms. As shown in FIG. 12, the catalog file indicates that processing results (image files) for two sheets exist. It should be noted that the ID number is not used in the case of registering one document for all forms. In the recognition result file, text contents (text data) recognized from the two forms are registered.
【0059】ファイリング登録結果は、全帳票1書類登
録であるので、先頭の帳票から得られた認識結果ファイ
ルの内容から作成したタイトルと、頁1、頁2として、
先頭の帳票を含む他の全てのイメージファイル、頁3と
して全ての帳票から得られた認識結果ファイルの内容が
ファイリングされている。Since the filing registration result is the registration of all forms 1 document, the title created from the contents of the recognition result file obtained from the first form and the page 1 and page 2
All other image files including the first form, and the contents of the recognition result files obtained from all forms as page 3 are filed.
【0060】次に、ステップS5において、登録方法判
別部40によって、ID番号利用登録が指定されている
と判別された場合、タイトル登録部42は、記憶部24
中のカタログファイルを読出し、対象とする帳票につい
てのID番号をもとにして、登録方法をチェックする
(ステップS24)。Next, in step S5, when the registration method judging section 40 judges that the ID number use registration is designated, the title registering section 42 stores in the storage section 24
The catalog file is read out, and the registration method is checked based on the ID number of the target form (step S24).
【0061】ここで、対象とする帳票に対するID番号
が「1」である場合、タイトルとイメージが登録対象と
なる。認識結果ファイル登録部46は、認識結果ファイ
ルの登録の実行が指示されているか否かを判別し(ステ
ップS25)、この結果、認識結果ファイルの登録の実
行が指示されている場合、記憶部24の一時記憶領域2
4aに記憶されている認識結果Tempファイルをファ
イリングシステム14に登録する。ただし、先頭の帳票
に対する処理の際には、一時記憶領域24aには何も記
憶されておらず実際には登録されない。Here, when the ID number of the target form is "1", the title and the image are registered. The recognition result file registration unit 46 determines whether or not execution of registration of the recognition result file has been instructed (step S25). As a result, if execution of registration of the recognition result file has been instructed, the storage unit 24 Temporary storage area 2
The recognition result Temp file stored in 4a is registered in the filing system 14. However, at the time of processing for the first form, nothing is stored in the temporary storage area 24a and is not actually registered.
【0062】タイトル登録部42は、認識結果ファイル
を読み込み、認識結果ファイルの対象とする帳票につい
ての認識結果を用いて、先頭の帳票に対する処理結果に
ついてタイトル構造情報に応じてタイトルを作成する
(ステップS27)。タイトル登録部42は、作成した
タイトルを通信部48を介してファイリングシステム1
4へ登録する(ステップS28)。The title registration unit 42 reads the recognition result file, and creates a title according to the title structure information for the processing result for the first form, using the recognition result of the form to be the target of the recognition result file (step). S27). The title registration unit 42 stores the created title in the filing system 1 via the communication unit 48.
4 (step S28).
【0063】一方、イメージ登録部44は、記憶部24
中のイメージファイルを通信部48を介してファイリン
グシステム14へ登録する(ステップS29)。1帳票
に複数のイメージが含まれている場合、イメージ登録部
44は、イメージファイル数分のイメージファイルの登
録を繰り返す。On the other hand, the image registration unit 44
The image file inside is registered in the filing system 14 via the communication unit 48 (step S29). When one form includes a plurality of images, the image registration unit 44 repeats registration of image files for the number of image files.
【0064】認識結果ファイル登録部46は、認識結果
ファイルの登録の実行が指示されているか否かを判別し
(ステップS30)、この結果、認識結果ファイルの登
録の実行が指示されている場合、記憶部24中の認識結
果ファイル(テキストファイル)を、記憶部24の一時
記憶領域24aに認識結果Tempファイルとしてして
一時的に書き込む(ステップS31)。The recognition result file registration section 46 determines whether or not execution of registration of the recognition result file is instructed (step S30). As a result, if execution of registration of the recognition result file is instructed, The recognition result file (text file) in the storage unit 24 is temporarily written as a recognition result Temp file in the temporary storage area 24a of the storage unit 24 (step S31).
【0065】先頭の帳票に対する処理が完了すると、カ
タログファイルに登録された次の帳票についての処理結
果について、同様にしてID番号をもとにして登録方法
をチェックする(ステップS24)。When the processing for the first form is completed, the registration method is similarly checked based on the ID number for the processing result for the next form registered in the catalog file (step S24).
【0066】ID番号利用登録を用いる場合、通常、図
4(c)に示すように、1書類とすべきイメージを登録
対象とする帳票がタイトルの登録対象となった帳票に連
続している。ステップS24におけるチェックにおい
て、対象とする帳票に対するID番号が「3」である場
合、イメージが登録対象となる。When the ID number registration is used, usually, as shown in FIG. 4C, a form in which an image to be made into one document is to be registered is continuous with a form in which a title is to be registered. If the ID number for the target form is “3” in the check in step S24, the image is to be registered.
【0067】イメージ登録部44は、先にタイトル登録
が実施されているか否かを判別し、この結果、登録され
ていない場合には、ID番号利用登録できる状態となっ
ていないものとして処理を中止する。ファイリングOC
R登録部22は、エラー処理を実行し、通信部48によ
ってファイリングシステム14との間の接続を切断する
(ステップS45,S46)。The image registration unit 44 first determines whether or not title registration has been performed. If the result is that the title has not been registered, the image registration unit 44 determines that it is not in a state where ID number use registration can be performed, and stops processing. I do. Filing OC
The R registration unit 22 executes an error process, and disconnects the connection with the filing system 14 by the communication unit 48 (Steps S45 and S46).
【0068】先にタイトル登録が実施されている場合、
イメージ登録部44は、記憶部24中のイメージファイ
ルを通信部48を介してファイリングシステム14へ登
録する(ステップS42)。1帳票に複数のイメージが
含まれている場合、イメージ登録部44は、イメージフ
ァイル数分のイメージファイルの登録を繰り返す。If the title has been registered first,
The image registration unit 44 registers the image file in the storage unit 24 with the filing system 14 via the communication unit 48 (Step S42). When one form includes a plurality of images, the image registration unit 44 repeats registration of image files for the number of image files.
【0069】認識結果ファイル登録部46は、認識結果
ファイルの登録の実行が指示されているか否かを判別し
(ステップS30)、この結果、認識結果ファイルの登
録の実行が指示されている場合、記憶部24中の認識結
果ファイル(テキストファイル)を、記憶部24の一時
記憶領域24aに認識結果Tempファイルとしてして
一時的に書き込む(ステップS31)。The recognition result file registration unit 46 determines whether or not execution of registration of the recognition result file has been instructed (step S30). As a result, if execution of registration of the recognition result file has been instructed, The recognition result file (text file) in the storage unit 24 is temporarily written as a recognition result Temp file in the temporary storage area 24a of the storage unit 24 (step S31).
【0070】以下、イメージを登録対象とする帳票(I
D番号=3)が連続していれば、各イメージファイルに
ついて同様の処理を繰り返す。一方、対象とする帳票に
対するID番号が「2」である場合、タイトルのみが登
録対象となる。Hereinafter, a form (I
If D number = 3) is continuous, the same processing is repeated for each image file. On the other hand, when the ID number of the target form is “2”, only the title is registered.
【0071】認識結果ファイル登録部46は、認識結果
ファイルの登録の実行が指示されているか否かを判別し
(ステップS35)、この結果、認識結果ファイルの登
録の実行が指示されている場合、記憶部24の一時記憶
領域24aに記憶されている認識結果Tempファイル
をファイリングシステム14に登録する(ステップS3
6)。The recognition result file registration section 46 determines whether or not execution of registration of the recognition result file has been instructed (step S35). As a result, if execution of registration of the recognition result file has been instructed, The recognition result Temp file stored in the temporary storage area 24a of the storage unit 24 is registered in the filing system 14 (step S3).
6).
【0072】すなわち、処理対象とする帳票の処理結果
からタイトルを登録するということは、その直前の帳票
までが1書類であるので、その1書類中の各帳票に対応
する認識結果ファイルの内容をさきに登録したタイトル
とイメージファイルに伏して登録する。In other words, registering a title from the processing result of a form to be processed means that the form up to the form immediately before it is one document, and the contents of the recognition result file corresponding to each form in the one document are stored. Register with the title and image file registered earlier.
【0073】タイトル登録部42は、認識結果ファイル
を読み込み、認識結果ファイルの対象とする帳票につい
ての認識結果を用いて、次の書類用のタイトルをタイト
ル構造情報に応じてタイトルを作成する(ステップS3
7)。タイトル登録部42は、作成したタイトルを通信
部48を介してファイリングシステム14へ登録する
(ステップS38)。The title registration unit 42 reads the recognition result file, and creates a title for the next document according to the title structure information using the recognition result of the form to be the target of the recognition result file (step). S3
7). The title registration unit 42 registers the created title in the filing system 14 via the communication unit 48 (Step S38).
【0074】認識結果ファイル登録部46は、認識結果
ファイルの登録の実行が指示されているか否かを判別し
(ステップS39)、この結果、認識結果ファイルの登
録の実行が指示されている場合、記憶部24中の認識結
果ファイル(テキストファイル)を、記憶部24の一時
記憶領域24aに認識結果Tempファイルとしてして
一時的に書き込む(ステップS40)。The recognition result file registration unit 46 determines whether or not execution of registration of the recognition result file is instructed (step S39). As a result, if execution of registration of the recognition result file is instructed, The recognition result file (text file) in the storage unit 24 is temporarily written as a recognition result Temp file in the temporary storage area 24a of the storage unit 24 (step S40).
【0075】こうして、全てのデータに対する処理が終
了すると(ステップS23)、認識結果ファイル登録部
46は、認識結果ファイルの登録の実行が指示されてい
るか否かを判別し(ステップS32)、この結果、認識
結果ファイルの登録の実行が指示されている場合、記憶
部24の一時記憶領域24aに記憶されている認識結果
Tempファイルをファイリングシステム14に登録す
る(ステップS33)。When the processing for all data is completed (step S23), the recognition result file registration unit 46 determines whether or not execution of registration of the recognition result file is instructed (step S32). If execution of registration of the recognition result file is instructed, the recognition result Temp file stored in the temporary storage area 24a of the storage unit 24 is registered in the filing system 14 (step S33).
【0076】通信部48は、ファイリングシステム14
との間の切断処理を行なう(ステップS34)。図13
にはID番号利用登録を行なう場合の各ファイルの簡単
な具体例を示している。図13に示すように、カタログ
ファイルには、6枚の帳票に対する処理結果(イメージ
ファイル)が存在することを示している。そして、3枚
毎に1書類を構成するものとする。また、認識結果ファ
イルには、6枚の帳票からそれぞれ認識されたテキスト
の内容(テキストデータ)が登録されている。The communication unit 48 includes the filing system 14
Is performed (step S34). FIG.
Shows a simple specific example of each file in the case of performing ID number use registration. As shown in FIG. 13, the catalog file indicates that processing results (image files) for six sheets exist. Then, one document is composed of every three sheets. In the recognition result file, text contents (text data) recognized from the six forms are registered.
【0077】ファイリング登録結果は、ID番号利用登
録であるので、書類1については、先頭の帳票から得ら
れた認識結果ファイルの内容から作成したタイトルと、
頁1、頁2、頁3として、3つのイメージファイル、頁
4として3つの帳票から得られた認識結果ファイルの内
容がファイリングされている。同様にして、書類2つい
ては、4番目の帳票から得られた認識結果ファイルの内
容から作成したタイトルと、頁1、頁2として、タイト
ルのみが登録対象となったイメージファイルを除く2つ
のイメージファイル、頁3として3つの帳票から得られ
た認識結果ファイルの内容がファイリングされている。Since the filing registration result is the registration using the ID number, for the document 1, the title created from the contents of the recognition result file obtained from the top form,
The contents of three image files as page 1, page 2 and page 3 and the contents of the recognition result file obtained from three forms as page 4 are filed. Similarly, for the document 2, the title created from the contents of the recognition result file obtained from the fourth form and the two image files except for the image file in which only the title is registered as the page 1 and the page 2 The contents of the recognition result file obtained from three forms as page 3 are filed.
【0078】このようにして、OCR装置10における
処理結果である認識結果ファイルの内容を、ファイリン
グシステム14への登録方法に応じたイメージファイル
に対して、ファイリングシステム14におけるキーワー
ドとして付加することができるので、大量の帳票等をフ
ァイリングする場合であっても、キーボードからキーワ
ードを逐次入力する必要がなく作業負担が大幅に軽減さ
れる。In this manner, the contents of the recognition result file, which is the processing result in the OCR device 10, can be added as a keyword in the filing system 14 to the image file according to the method of registration in the filing system 14. Therefore, even when filing a large number of forms and the like, it is not necessary to input keywords one by one from the keyboard, and the work load is greatly reduced.
【0079】また、OCR装置10における処理結果で
ある認識結果ファイル(テキストファイル)もイメージ
ファイルと共に体系的にファイリングされるので、テキ
ストファイルについてもキーワードによる検索が可能で
ある。Further, the recognition result file (text file), which is the processing result in the OCR apparatus 10, is systematically filed together with the image file, so that the text file can be searched for by the keyword.
【0080】なお、前述した実施形態におけるOCR装
置10をFAX−OCRシステムとし、このFAX−O
CRシステムと連携したファイリングシステムとするこ
とで、通信回線を介して受信した内容中の宛先や表題等
を文字認識し、それらをキーワードとしてイメージファ
イルと共にファイルシステムへ自動登録することも可能
である。Note that the OCR device 10 in the above-described embodiment is a FAX-OCR system,
By using a filing system in cooperation with the CR system, it is possible to recognize the destination, title, and the like in the content received via the communication line, and to automatically register them in the file system together with the image file as keywords.
【0081】また、実施形態においてファイリングOC
R登録部22によって実行される処理手法は、コンピュ
ータに実行させることのできるプログラムとして、磁気
ディスク(フロッピーディスク、ハードディスク等)、
光ディスク(CD−ROM、DVDなど)、半導体メモ
リなどの記録媒体に格納して提供することができる。コ
ンピュータは、記録媒体に記録されたプログラムを読み
込み、このプログラムによって動作が制御されることに
より、前述した処理を実行する。In the embodiment, the filing OC is used.
The processing method executed by the R registration unit 22 is a program that can be executed by a computer, such as a magnetic disk (floppy disk, hard disk, etc.),
It can be provided by being stored in a recording medium such as an optical disk (CD-ROM, DVD, etc.) and a semiconductor memory. The computer reads the program recorded on the recording medium, and executes the above-described processing by controlling the operation of the program.
【0082】[0082]
【発明の効果】以上詳述したように本発明によれば、O
CR装置における処理結果を、ファイリングシステムへ
の登録形態に応じて処理した上でファイリングシステム
に登録することで、帳票等の紙媒体に記録された内容を
表すイメージを適当なキーワードを付して簡単にファイ
リングすることが可能となるものである。As described in detail above, according to the present invention, O
By processing the processing result in the CR device according to the registration form in the filing system and then registering it in the filing system, images representing the contents recorded on paper media such as forms can be easily attached with appropriate keywords. Can be filed.
【図1】本発明の実施形態に係わるOCR装置と連携し
たファイリングシステムの構成を示すブロック図。FIG. 1 is a block diagram showing a configuration of a filing system in cooperation with an OCR device according to an embodiment of the present invention.
【図2】図1中に示すファイリングOCR登録部22の
構成を示すブロック図。FIG. 2 is a block diagram showing a configuration of a filing OCR registration unit 22 shown in FIG.
【図3】本実施形態におけるファイリングの概念につい
て説明するための図。FIG. 3 is an exemplary view for explaining the concept of filing according to the embodiment;
【図4】本実施形態におけるファイリングシステム14
に登録(ファイリング)する形態を示す図。FIG. 4 is a filing system 14 according to the embodiment.
The figure which shows the form which is registered (filing) in.
【図5】本実施形態における動作の一部を説明するため
のフローチャート。FIG. 5 is a flowchart for explaining a part of the operation in the embodiment.
【図6】本実施形態における動作の一部を説明するため
のフローチャート。FIG. 6 is a flowchart for explaining a part of the operation in the embodiment.
【図7】本実施形態における動作の一部を説明するため
のフローチャート。FIG. 7 is a flowchart for explaining a part of the operation in the embodiment.
【図8】本実施形態における動作の一部を説明するため
のフローチャート。FIG. 8 is a flowchart for explaining a part of the operation in the embodiment.
【図9】本実施形態における認識結果ファイルを説明す
るための図。FIG. 9 is an exemplary view for explaining a recognition result file according to the embodiment;
【図10】本実施形態におけるカタログファイルを説明
するための図。FIG. 10 is an exemplary view for explaining a catalog file according to the embodiment;
【図11】本実施形態における1帳票1書類登録を行な
う場合の各ファイルの簡単な具体例を示す図。FIG. 11 is a view showing a simple specific example of each file when registering one form and one document in the embodiment.
【図12】本実施形態における全帳票1書類登録を行な
う場合の各ファイルの簡単な具体例を示す図。FIG. 12 is a diagram showing a simple specific example of each file when registering one document in all forms in the embodiment.
【図13】本実施形態におけるID番号利用登録を行な
う場合の各ファイルの簡単な具体例を示す図。FIG. 13 is a view showing a simple specific example of each file when registering ID number use in the embodiment.
10…OCR装置 12…ホストシステム 14…ファイリングシステム 20…OCR装置制御部 22…ファイリングOCR登録部 24…記憶部 24a…一時記憶領域 30…コントローラ 32…スキャナ 34…プリンタ 36…ディスプレイ 38…キーボード 39…ファイル記憶ユニット 40…登録方法判別部 42…タイトル登録部 44…イメージ登録部 46…認識結果ファイル登録部 48…通信部 DESCRIPTION OF SYMBOLS 10 ... OCR apparatus 12 ... Host system 14 ... Filing system 20 ... OCR apparatus control part 22 ... Filing OCR registration part 24 ... Storage part 24a ... Temporary storage area 30 ... Controller 32 ... Scanner 34 ... Printer 36 ... Display 38 ... Keyboard 39 ... File storage unit 40: Registration method determination unit 42: Title registration unit 44: Image registration unit 46: Recognition result file registration unit 48: Communication unit
Claims (8)
って読取ってイメージファイルを作成すると共に、前記
イメージ中に含まれる文字について文字認識処理を施し
てテキストファイルを作成するOCR装置と、 前記OCR装置によって作成された前記イメージファイ
ルと前記テキストファイルとを読み込んで、体系的にフ
ァイリングするための登録制御を行なう登録機能を有す
るホストシステムと、 前記ホストシステムの登録機能による登録制御により、
前記イメージファイルと前記テキストファイルとをファ
イリングシステムとをファイリングするファイリングシ
ステムとを具備したことを特徴とするOCR装置と連携
したファイリングシステム。1. An OCR device for reading an image recorded on a paper medium using an image to create an image file, and performing a character recognition process on characters included in the image to create a text file. By reading the image file and the text file created by the, a host system having a registration function of performing registration control for systematic filing, by the registration control by the registration function of the host system,
A filing system cooperating with an OCR apparatus, comprising: a filing system for filing the image file and the text file with a filing system.
って読取ってイメージファイルを作成すると共に、前記
イメージ中に含まれる文字について文字認識処理を施し
てテキストファイルを作成するOCR装置と、 前記OCR装置によって作成された前記イメージファイ
ルと前記テキストファイルとを読み込んで、前記テキス
トファイルの内容を利用して紙媒体の1枚毎にキーワー
ドを作成し、このキーワードを紙媒体の1枚に対応する
前記イメージファイルと前記テキストファイルとに付し
て体系的にファイリングするための登録制御を行なう登
録機能を有するホストシステムと、 前記ホストシステムの登録機能による登録制御により、
前記イメージファイルと前記テキストファイルとをファ
イリングシステムとをファイリングするファイリングシ
ステムとを具備したことを特徴とするOCR装置と連携
したファイリングシステム。2. An OCR device for reading a content recorded on a paper medium using an image to create an image file, and performing a character recognition process on characters included in the image to create a text file. The image file and the text file created by the above are read, and a keyword is created for each sheet of paper using the contents of the text file, and the keyword is assigned to the image corresponding to one sheet of paper. A host system having a registration function of performing registration control for systematically filing a file and the text file, and by the registration control by the registration function of the host system,
A filing system for filing the image file and the text file with a filing system, wherein the filing system cooperates with an OCR apparatus.
って読取ってイメージファイルを作成すると共に、前記
イメージ中に含まれる文字について文字認識処理を施し
てテキストファイルを作成するOCR装置と、 前記OCR装置によって作成された前記イメージファイ
ルと前記テキストファイルとを読み込んで、前記テキス
トファイルの複数の紙媒体中の先頭の紙媒体の内容を利
用してキーワードを作成し、このキーワードを複数の紙
媒体に対応する前記イメージファイルと前記テキストフ
ァイルとに付して体系的にファイリングするための登録
制御を行なう登録機能を有するホストシステムと、 前記ホストシステムの登録機能による登録制御により、
前記イメージファイルと前記テキストファイルとをファ
イリングシステムとをファイリングするファイリングシ
ステムとを具備したことを特徴とするOCR装置と連携
したファイリングシステム。3. An OCR device for reading a content recorded on a paper medium using an image to create an image file, and performing a character recognition process on characters included in the image to create a text file. The image file and the text file created by the above are read, and a keyword is created by using the content of the first paper medium among the plurality of paper media of the text file, and the keyword corresponds to a plurality of paper media. A host system having a registration function of performing registration control for systematically filing the image file and the text file, and registration control by the registration function of the host system,
A filing system for filing the image file and the text file with a filing system, wherein the filing system cooperates with an OCR apparatus.
って読取ってイメージファイルを作成すると共に、前記
イメージ中に含まれる文字について文字認識処理を施し
てテキストファイルを作成するOCR装置と、 前記OCR装置によって作成された前記イメージファイ
ルと前記テキストファイルとを読み込んで、前記テキス
トファイルの複数の紙媒体群中の各群の先頭の紙媒体の
内容を利用してキーワードを作成し、このキーワードを
対応する紙媒体群に対応する前記イメージファイルと前
記テキストファイルとに付して体系的にファイリングす
るための登録制御を行なう登録機能を有するホストシス
テムと、 前記ホストシステムの登録機能による登録制御により、
前記イメージファイルと前記テキストファイルとをファ
イリングシステムとをファイリングするファイリングシ
ステムとを具備したことを特徴とするOCR装置と連携
したファイリングシステム。4. An OCR device that reads contents recorded on a paper medium by an image to create an image file, and performs a character recognition process on characters included in the image to create a text file. The image file and the text file created by the above are read, and a keyword is created by using the content of the leading paper medium of each group among the plurality of paper medium groups of the text file, and the keyword is corresponded. A host system having a registration function of performing registration control for systematically filing the image file and the text file corresponding to a paper medium group, and registration control by the registration function of the host system,
A filing system cooperating with an OCR apparatus, comprising: a filing system for filing the image file and the text file with a filing system.
に記録された内容が読み取られてたイメージを含むイメ
ージファイルと、前記イメージ中に含まれる文字につい
て文字認識処理を施して得られたテキストを含むテキス
トファイルとを、ファイリングシステムにおいて体系的
にファイリングするための登録制御を行なうことを特徴
とするファイリング方法。5. An image file containing an image whose content recorded on a paper medium has been read and created by an OCR device, and a text obtained by performing character recognition processing on characters contained in the image. A filing method characterized by performing registration control for systematically filing a text file including the text file in a filing system.
に記録された内容が読み取られてたイメージを含むイメ
ージファイルと、前記イメージ中に含まれる文字につい
て文字認識処理を施して得られたテキストを含むテキス
トファイルとを読み込み、 前記テキストファイルの内容を利用して紙媒体の1枚毎
にキーワードを作成し、 このキーワードを紙媒体の1枚に対応する前記イメージ
ファイルと前記テキストファイルとに付してファイリン
グシステムにおいて体系的にファイリングするための登
録制御を行なうことを特徴とするファイリング方法。6. An image file created by an OCR device, the image file including an image from which contents recorded on a paper medium have been read, and a text obtained by performing a character recognition process on characters included in the image. A text file including the text file, creating a keyword for each sheet of paper using the contents of the text file, and attaching the keyword to the image file and the text file corresponding to one sheet of paper medium. A registration method for systematically performing filing in a filing system.
に記録された内容が読み取られてたイメージを含むイメ
ージファイルと、前記イメージ中に含まれる文字につい
て文字認識処理を施して得られたテキストを含むテキス
トファイルとを読み込み、 前記テキストファイルの複数の紙媒体中の先頭の紙媒体
の内容を利用してキーワードを作成し、 このキーワードを複数の紙媒体に対応する前記イメージ
ファイルと前記テキストファイルとに付してファイリン
グシステムにおいて体系的にファイリングするための登
録制御を行なうことを特徴とするファイリング方法。7. An image file containing an image of which contents recorded on a paper medium have been read and created by an OCR device, and a text obtained by performing a character recognition process on characters included in the image. A text file containing the text file, a keyword is created using the contents of the first paper medium among the plurality of paper media of the text file, and the keyword is stored in the image file and the text file corresponding to the plurality of paper media. A registration method for systematically performing filing in a filing system.
に記録された内容が読み取られてたイメージを含むイメ
ージファイルと、前記イメージ中に含まれる文字につい
て文字認識処理を施して得られたテキストを含むテキス
トファイルとを読み込み、 前記テキストファイルの複数の紙媒体群中の各群の先頭
の紙媒体の内容を利用してキーワードを作成し、 このキーワードを対応する紙媒体群に対応する前記イメ
ージファイルと前記テキストファイルとに付してファイ
リングシステムにおいて体系的にファイリングするため
の登録制御を行なうことを特徴とするファイリング方
法。8. An image file created by an OCR device, the image file including an image of which contents recorded on a paper medium have been read, and a text obtained by performing a character recognition process on characters included in the image. A text file containing the text file, and creating a keyword using the contents of the first paper medium of each of the plurality of paper medium groups of the text file, and the image file corresponding to the paper medium group corresponding to the keyword. And filing a text file to perform registration control for systematically filing in a filing system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8248334A JPH1097606A (en) | 1996-09-19 | 1996-09-19 | Filing system connected with ocr device and filing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8248334A JPH1097606A (en) | 1996-09-19 | 1996-09-19 | Filing system connected with ocr device and filing method |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1097606A true JPH1097606A (en) | 1998-04-14 |
Family
ID=17176549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8248334A Pending JPH1097606A (en) | 1996-09-19 | 1996-09-19 | Filing system connected with ocr device and filing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1097606A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100707943B1 (en) | 2005-04-27 | 2007-04-18 | 최철규 | System and Method for recognition of financial statement using optical character recognition |
JP2009271663A (en) * | 2008-05-02 | 2009-11-19 | Nec Electronics Corp | Management system, management device, management method and management program |
CN115116068A (en) * | 2022-07-05 | 2022-09-27 | 江苏永山窍档案管理服务有限公司 | Archive intelligent filing system based on OCR |
-
1996
- 1996-09-19 JP JP8248334A patent/JPH1097606A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100707943B1 (en) | 2005-04-27 | 2007-04-18 | 최철규 | System and Method for recognition of financial statement using optical character recognition |
JP2009271663A (en) * | 2008-05-02 | 2009-11-19 | Nec Electronics Corp | Management system, management device, management method and management program |
CN115116068A (en) * | 2022-07-05 | 2022-09-27 | 江苏永山窍档案管理服务有限公司 | Archive intelligent filing system based on OCR |
CN115116068B (en) * | 2022-07-05 | 2024-05-10 | 江苏永山窍档案管理服务有限公司 | Archive intelligent archiving system based on OCR |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH03161873A (en) | Electronic filing device having data base constructing function | |
US7081975B2 (en) | Information input device | |
US6594650B2 (en) | File management system and its method and storage medium | |
JPH06332953A (en) | Data filing device | |
US20020118382A1 (en) | Method for selecting a finishing device for digital printing | |
US20220068276A1 (en) | Information processor, print system, and control method | |
JPH07200631A (en) | Electronic filing device | |
JPH1097606A (en) | Filing system connected with ocr device and filing method | |
JP3458001B2 (en) | Image file device | |
JP2004213304A (en) | Data processor, data processing method, recording medium, and program | |
JPH10187388A (en) | Job processor | |
JPS62154847A (en) | Electronic file system | |
JPH0236478A (en) | Information processing system | |
JPH1013642A (en) | Image information processor | |
JPH06251083A (en) | Method and system for registering image data on optical disk | |
JPH10187517A (en) | Document registration device and method therefor | |
JPH04153879A (en) | Automatic retrieval system for document control information | |
JPH03263182A (en) | Electronic filing system | |
JPH08101842A (en) | Image filing device | |
JP3368108B2 (en) | Image processing device | |
JPH07200634A (en) | Image reading device | |
JPH06149889A (en) | Electronic filing system | |
JP2004259031A (en) | Document management device | |
JPH1055405A (en) | Device and method for reading directory | |
JP2578893B2 (en) | Document file device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070105 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070306 |