JP2003308325A - Device, method and program for registering data, and recording medium - Google Patents

Device, method and program for registering data, and recording medium

Info

Publication number
JP2003308325A
JP2003308325A JP2002114349A JP2002114349A JP2003308325A JP 2003308325 A JP2003308325 A JP 2003308325A JP 2002114349 A JP2002114349 A JP 2002114349A JP 2002114349 A JP2002114349 A JP 2002114349A JP 2003308325 A JP2003308325 A JP 2003308325A
Authority
JP
Japan
Prior art keywords
data
image data
document
tag
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002114349A
Other languages
Japanese (ja)
Inventor
Masayuki Takeuchi
雅幸 竹内
Shinichi Kito
信一 鬼頭
Takeshi Yoshino
毅 吉野
Hideo Izumisawa
秀雄 泉澤
Masami Sugiura
雅巳 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INTER COM KK
P & P Software Kk
Sony Corp
Original Assignee
INTER COM KK
P & P Software Kk
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INTER COM KK, P & P Software Kk, Sony Corp filed Critical INTER COM KK
Priority to JP2002114349A priority Critical patent/JP2003308325A/en
Publication of JP2003308325A publication Critical patent/JP2003308325A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To automatically form a document data into an image data, and to automatically register a keyword, when the document data is registered in a DB. <P>SOLUTION: When a printing start command for the document data is issued from a GDI, a data of which the printing data is clusterized in the GDI is converted into the image data, and the printing data is stored in a memory when the data is a text data. When page printing is finished, the image data and the text data are transferred to a direct converter. When a printing finish command is issued from the GDI, the image data into which the document data is converted by the direct converter is registered in the DB, and the text data stored in the memory is registered as the keyword for the document data. An error in keyword registration is eliminated since the keyword is registered automatically from a printing data. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、文書データと画
像データとを同一のデータベースで管理する際に用いて
好適なデータ登録装置、データ登録方法、データ登録プ
ログラムおよび記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data registration device, a data registration method, a data registration program and a recording medium suitable for use when managing document data and image data in the same database.

【0002】[0002]

【従来の技術】近年では、オフィスなどで取り扱われ
る、例えばドキュメント、資料、マニュアル、報告書と
いった文書は、大部分が電子データとして作成される。
文書データを電子データとして作成することで、ペーパ
ーレス化、省スペース化が図られると共に、文書データ
の再利用が容易になる。
2. Description of the Related Art In recent years, most documents such as documents, materials, manuals, and reports handled in offices are created as electronic data.
By creating the document data as electronic data, paperless and space saving can be achieved, and the document data can be easily reused.

【0003】文書データの中には、テキストデータと画
像データとが混在して用いられるものも多い。従来、こ
のような、テキストデータと画像データとが同一文書内
に混在した文書データをデータベースに登録する際に
は、文書データを一旦画像データに変換してから、画像
データとしてデータベースに登録していた。
In many document data, text data and image data are mixedly used. Conventionally, when registering such document data in which text data and image data are mixed in the same document in a database, the document data is first converted into image data and then registered as image data in the database. It was

【0004】例えば、テキストデータと画像データとが
混在した文書データがプリンタ装置により紙に印刷され
る。印刷された文書は、イメージスキャナなどでスキャ
ンされて画像データに変換され、コンピュータ装置に取
り込まれる。印刷された文書データが複数ページからな
る場合には、ページ毎にこの作業が行われる。一方、文
書データに対するキーワードがコンピュータ装置から入
力される。このキーワードが対応する画像データに付加
されて、文書データのデータベース登録が行われる。デ
ータベースに登録された文書データは、キーワードを入
力することで検索され、画像データとして出力される。
For example, document data in which text data and image data are mixed is printed on paper by a printer device. The printed document is scanned by an image scanner or the like, converted into image data, and loaded into a computer device. If the printed document data is composed of multiple pages, this operation is performed for each page. On the other hand, the keyword for the document data is input from the computer device. This keyword is added to the corresponding image data to register the document data in the database. The document data registered in the database is searched by inputting a keyword and output as image data.

【0005】[0005]

【発明が解決しようとする課題】従来では、このよう
に、テキストデータと画像データとが混在した文書デー
タをデータベース化する場合に、ページ毎に逐一画像デ
ータ化を行う必要があった。そのため、例えば膨大な量
の文書データをデータベースに登録するような場合に、
処理に非常に手間がかかるという問題点があった。
Conventionally, in the case where the document data in which the text data and the image data are mixed as described above is made into a database, it is necessary to make the image data for each page. Therefore, for example, when registering a huge amount of document data in the database,
There is a problem that processing is very troublesome.

【0006】また、実際に文書データをデータベースに
登録する際のキーワード入力は、人手によって行われて
いた。そのため、キーワード入力の際に、実際の文書の
内容に相応しくないキーワードが入力されてしまうおそ
れがあるという問題点があった。
[0006] Further, the keyword input when actually registering the document data in the database is manually performed. Therefore, when inputting a keyword, there is a problem that a keyword that is not suitable for the content of the actual document may be input.

【0007】さらに、従来では、こういった、文書デー
タの画像データ化やキーワード登録を自動処理により行
うような装置やシステムは、存在しなかったという問題
点があった。例えば、文書データを画像データ化してデ
ータベースに登録する際に、文書データの画像データに
対応する縮小された画像データおよび各ページに付与さ
れたタグを、登録される文書データに関連付けて管理す
る電子ファイリング装置が既に提案されている。しかし
ながら、この電子ファイリング装置においても、タグの
登録は、オペレータによるマニュアル操作により行われ
ていた。
Further, there has been a problem in the prior art that no apparatus or system for converting image data of document data into images or registering keywords by automatic processing has existed. For example, when converting document data into image data and registering the same in a database, an electronic device that manages reduced image data corresponding to the image data of the document data and tags attached to each page in association with the registered document data Filing devices have already been proposed. However, even in this electronic filing apparatus, the registration of the tag has been performed manually by the operator.

【0008】この電子ファイリング装置によれば、文書
データの登録は、次のようにして行われる。先ず、1以
上のページからなる文書がスキャナで読み取られ、ディ
ジタルデータ化される。そして、コンピュータ装置上の
所定のプログラムに従い、この読み取られた文書に対し
て文書IDが付与される。また、プログラムにより、デ
ィジタルデータに基づき各ページ毎のイメージデータお
よび縮小イメージデータが生成され、文書IDに関連付
けられて、例えばコンピュータ装置のハードディスクド
ライブ(HDD)に記憶される。
According to this electronic filing apparatus, registration of document data is performed as follows. First, a document including one or more pages is read by a scanner and converted into digital data. Then, according to a predetermined program on the computer device, a document ID is given to the read document. Further, the program generates image data and reduced image data for each page based on the digital data, and stores the image data and the reduced image data in association with the document ID in, for example, a hard disk drive (HDD) of a computer device.

【0009】このとき、コンピュータ装置に接続される
表示装置上に、縮小イメージが表示される。オペレータ
により、この表示装置に表示された各ページに対応する
縮小イメージが参照され、各ページに対応するタグが付
与される。例えば、各ページの縮小イメージの所定部分
をマウスを用いてクリックすることにより、文字列の入
力が可能とされる。その後、オペレータにより、キーボ
ードからその画像イメージに対して適切な文字列、例え
ば目次、項目名、要約が入力され、且つ、タグに対応す
るレベルが例えば最上位のレベル「1」乃至最下位のレ
ベル「4」から選択されて指定される。指定されたタグ
データは、文書IDと関連付けられて、例えばHDDに
記憶される。
At this time, the reduced image is displayed on the display device connected to the computer device. The operator refers to the reduced image corresponding to each page displayed on this display device, and attaches a tag corresponding to each page. For example, a character string can be input by clicking a predetermined portion of the reduced image on each page with a mouse. Thereafter, the operator inputs an appropriate character string, for example, a table of contents, an item name, or a summary for the image from the keyboard, and the level corresponding to the tag is, for example, the highest level "1" to the lowest level. It is selected and designated from "4". The designated tag data is associated with the document ID and stored in, for example, the HDD.

【0010】このように記憶された文書データの検索
は、例えば次のようにしてなされる。ユーザにより文書
IDが指定されると、指定された文書IDに対応した縮
小画像イメージまたはタグデータがHDDから読み出さ
れる。そして、読み出された縮小画像イメージまたはタ
グデータに基づく画像(目次画像)がコンピュータ装置
に接続された表示装置に表示される。
The retrieval of the document data stored in this way is performed as follows, for example. When the user specifies the document ID, the reduced image image or tag data corresponding to the specified document ID is read from the HDD. Then, the read reduced image image or the image (table of contents image) based on the tag data is displayed on the display device connected to the computer device.

【0011】この表示装置に対する表示に基づき、ユー
ザにより、例えば複数の縮小画像イメージのうち所望の
ページや範囲が指定される。表示装置に目次画像が表示
されている場合は、ユーザにより、表示された目次画像
から、所望のタグに対応する文字列が指定される。コン
ピュータ装置では、指定されたページや範囲、あるい
は、指定されたタグに対応する文書の画像データがHD
Dから読み出され表示装置に表示されることで、ユーザ
は、所望の文書を閲覧することができる。
Based on the display on this display device, the user designates a desired page or range among a plurality of reduced image images, for example. When the table of contents image is displayed on the display device, the user specifies the character string corresponding to the desired tag from the displayed table of contents image. In the computer, the image data of the document corresponding to the specified page or range or the specified tag is HD.
The user can browse the desired document by reading out from D and displaying it on the display device.

【0012】また、閲覧したい文書に関連する文字列を
指定し、指定された文字列を含むタグデータを検索する
こともできる。検索されたタグデータに対応する文書I
Dを有する文書の画像データがHDDから読み出され表
示装置に表示されることで、ユーザは、所望の文書を閲
覧することができる。
It is also possible to specify a character string related to the document to be browsed and search for tag data containing the specified character string. Document I corresponding to the retrieved tag data
By reading the image data of the document having D from the HDD and displaying it on the display device, the user can browse the desired document.

【0013】このように、この従来技術による電子ファ
イリング装置では、文書に関連付けられたタグデータに
基づき文書の検索を行うことができる。しかしながら、
この従来技術による電子ファイリング装置においても、
タグデータは、文書を登録するオペレータにより入力さ
れていたため、上述したような、キーワード入力の際
に、実際の文書の内容に相応しくないキーワードが入力
されてしまうおそれがあるという問題は、解決できなか
った。
As described above, the electronic filing apparatus according to this conventional technique can search for a document based on the tag data associated with the document. However,
Even in the electronic filing device according to this conventional technique,
Since the tag data was input by the operator who registered the document, the problem that there is a possibility that a keyword that is not suitable for the actual content of the document may be input when the keyword is input cannot be solved. It was

【0014】したがって、この発明の目的は、文書デー
タをデータベースに登録する際に、文書データの画像デ
ータ化およびキーワード登録が自動的に処理されるよう
なデータ登録装置、データ登録方法、データ登録プログ
ラムおよび記録媒体を提供することにある。
Accordingly, an object of the present invention is to provide a data registration device, a data registration method, and a data registration program that automatically process image data conversion and keyword registration of document data when registering the document data in a database. And to provide a recording medium.

【0015】[0015]

【課題を解決するための手段】この発明は、上述した課
題を解決するために、文書データを画像データに変換し
てデータベースに登録するデータ登録装置において、文
書データがオペレーションシステムの印刷制御部により
印刷可能なようにページ単位でラスタライズ処理された
ラスタデータを所定のフォーマットによる画像データに
変換する変換手段と、印刷制御部から印刷データとして
渡されたテキストデータを保持するようにされたプリン
タドライバと、変換手段により変換された画像データ
と、プリンタドライバにより保持されたテキストデータ
とを対応付けてデータベースに登録する登録手段とを有
することを特徴とするデータ登録装置である。
In order to solve the above-mentioned problems, the present invention provides a data registration device for converting document data into image data and registering the same in a database, wherein the document data is processed by a print control unit of an operation system. A conversion unit that converts raster data rasterized in page units so as to be printable into image data in a predetermined format, and a printer driver configured to hold the text data passed as print data from the print control unit. A data registration device comprising: a registration unit that registers image data converted by the conversion unit and text data held by the printer driver in a database in association with each other.

【0016】また、この発明は、文書データを画像デー
タに変換してデータベースに登録するデータ登録方法に
おいて、文書データがオペレーションシステムの印刷制
御部により印刷可能なようにページ単位でラスタライズ
処理されたラスタデータを所定のフォーマットによる画
像データに変換する変換のステップと、印刷制御部から
印刷データとして渡されたテキストデータを、プリンタ
ドライバにより保持するステップと、変換のステップに
より変換された画像データと、プリンタドライバにより
保持されたテキストデータとを対応付けてデータベース
に登録する登録のステップとを有することを特徴とする
データ登録方法である。
Further, according to the present invention, in a data registration method for converting document data into image data and registering it in a database, raster data is rasterized in page units so that the document data can be printed by the print control unit of the operation system. A step of converting the data into image data in a predetermined format; a step of holding the text data passed as print data from the print control unit by a printer driver; an image data converted by the conversion step; A registration step of registering the text data held by the driver in a database in association with the text data.

【0017】また、この発明は、文書データを画像デー
タに変換してデータベースに登録するデータ登録方法を
コンピュータ装置に実行させるデータ登録プログラムに
おいて、文書データがオペレーションシステムの印刷制
御部により印刷可能なようにページ単位でラスタライズ
処理されたラスタデータを所定のフォーマットによる画
像データに変換する変換のステップと、印刷制御部から
印刷データとして渡されたテキストデータを、プリンタ
ドライバにより保持するステップと、変換のステップに
より変換された画像データと、プリンタドライバにより
保持されたテキストデータとを対応付けてデータベース
に登録する登録のステップとをコンピュータ装置に実行
させることを特徴とするデータ登録プログラムである。
Further, according to the present invention, in a data registration program for causing a computer device to execute a data registration method of converting document data into image data and registering it in a database, the document data can be printed by a print control unit of the operation system. A conversion step of converting the raster data rasterized in page units into image data of a predetermined format, a step of holding the text data passed as print data from the print control section by the printer driver, and a step of conversion. The data registration program is characterized by causing a computer device to execute a registration step of registering in the database the image data converted by the above and the text data held by the printer driver in association with each other.

【0018】また、この発明は、文書データを画像デー
タに変換してデータベースに登録するデータ登録方法を
コンピュータ装置に実行させるデータ登録プログラムが
記録された記録媒体において、文書データがオペレーシ
ョンシステムの印刷制御部により印刷可能なようにペー
ジ単位でラスタライズ処理されたラスタデータを所定の
フォーマットによる画像データに変換する変換のステッ
プと、印刷制御部から印刷データとして渡されたテキス
トデータを、プリンタドライバにより保持するステップ
と、変換のステップにより変換された画像データと、プ
リンタドライバにより保持されたテキストデータとを対
応付けてデータベースに登録する登録のステップとをコ
ンピュータ装置に実行させるデータ登録プログラムが記
録されたことを特徴とする記録媒体である。
Further, according to the present invention, in a recording medium recording a data registration program for causing a computer to execute a data registration method of converting document data into image data and registering the image data in a database, the document data is a print control of an operating system. A printer driver holds the conversion step of converting raster data rasterized in page units so that it can be printed by a copy unit into image data in a predetermined format, and the text data passed as print data from the print control unit. A data registration program for causing a computer device to execute a step and a registration step of registering the image data converted by the conversion step and the text data held by the printer driver in a database in association with each other is recorded. Special Which is a recording medium to be.

【0019】上述したように、この発明は、文書データ
がオペレーションシステムの印刷制御部により印刷可能
なようにページ単位でラスタライズ処理されたラスタデ
ータを所定のフォーマットによる画像データに変換する
と共に、印刷制御部から印刷データとして渡されたテキ
ストデータをプリンタドライバにより保持し、変換され
た画像データと、プリンタドライバにより保持されたテ
キストデータとを対応付けてデータベースに登録するよ
うにしているため、テキストデータに基づきデータベー
スに登録された文書データを検索することができる。
As described above, according to the present invention, the rasterization processing is performed on the page data so that the document data can be printed by the print control unit of the operation system. The printer driver retains the text data passed as print data from the printer, and the converted image data and the text data retained by the printer driver are registered in the database in association with each other. Based on this, the document data registered in the database can be searched.

【0020】[0020]

【発明の実施の形態】以下、この発明の実施の一形態
を、図面を参照しながら説明する。この発明では、文書
データの印刷イメージを画像データとして生成すると共
に、文書データ中のキャラクタデータを抽出するように
された仮想のプリンタドライバを用いる。この仮想プリ
ンタドライバにより、登録しようとする文書データを画
像データ化すると共に、文書データ中のテキストデータ
を自動的に抽出する。そして、抽出された文書データを
キーワードとすることで、文書データのデータベース登
録の際の文書データの画像化およびキーワード登録を自
動的に行うようにしている。
BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of the present invention will be described below with reference to the drawings. According to the present invention, a virtual printer driver adapted to generate a print image of document data as image data and to extract character data from the document data is used. The virtual printer driver converts the document data to be registered into image data and automatically extracts the text data from the document data. Then, by using the extracted document data as a keyword, imaging of the document data and keyword registration at the time of registering the document data database are automatically performed.

【0021】図1は、この発明の実施の一形態による文
書データ管理システムの一例の構成を概略的に示す。ネ
ットワーク1に対してサーバ2およびクライアント4、
4、・・・が接続される。サーバ2は、文書データが登
録され管理されるデータベース3を有する。データベー
ス3は、実質的にデータが格納されるデータベース部と
データベース部に格納されたデータを管理するDBMS
(Data Base Management System)とからなる。これに限
らず、データベース3がデータベース部そのもので、D
BMSをサーバ2が担当するようにしてもよい。
FIG. 1 schematically shows a configuration of an example of a document data management system according to an embodiment of the present invention. Server 2 and client 4 for network 1,
4, ... are connected. The server 2 has a database 3 in which document data is registered and managed. The database 3 is a database unit that substantially stores data and a DBMS that manages the data stored in the database unit.
(Data Base Management System). Not limited to this, the database 3 is the database unit itself, and
The server 2 may be in charge of BMS.

【0022】ネットワーク1は、例えば同一組織内部な
どで構築されるイントラネットである。勿論、これに限
らず、ネットワーク1をインターネットとしてもよい。
サーバ2およびクライアント4、4、・・・は、それぞ
れコンピュータ装置であって、ネットワーク1を介して
互いに通信することができる。
The network 1 is an intranet constructed within the same organization, for example. Of course, the network 1 is not limited to this, and may be the Internet.
The server 2 and the clients 4, 4, ... Are computer devices and can communicate with each other via the network 1.

【0023】ネットワーク1に対して、プリンタ装置5
を接続することができる。サーバ2やクライアント4、
4、・・・からプリンタ装置5に、ネットワーク1を介
して所定の印刷指示および印刷データを送信すること
で、プリンタ装置5に印刷を行わせることができる。な
お、プリンタ装置5は、この例に限らず、サーバ2に接
続したり、クライアント4、4、・・・の何れかに対し
て接続するようにもできる。なお、この実施の一形態に
おいては、プリンタ装置5は、必ずしも必要とされるも
のではない。
A printer device 5 for the network 1
Can be connected. Server 2 and client 4,
It is possible to cause the printer device 5 to perform printing by transmitting predetermined print instructions and print data from the printers 4, ... To the printer device 5 via the network 1. The printer device 5 is not limited to this example, and may be connected to the server 2 or to any one of the clients 4, 4, .... Note that the printer device 5 is not always necessary in this embodiment.

【0024】このような構成において、例えば、クライ
アント4で、テキストデータと画像データとが混在され
た文書データが作成される。この文書データは、クライ
アント4において上述した仮想プリンタドライバにより
印刷されることにより、画像データ化されると共に、テ
キストデータが抽出される。これら文書データに基づく
画像データおよびテキストデータは、クライアント4か
らネットワーク1を介してサーバ2に送られる。サーバ
2では、送られたテキストデータが全文検索用のキーワ
ードとして画像データに関連付けられて、データベース
3に登録される。これにより、クライアント4で作成さ
れた文書データのデータベース3への登録が行われる。
In such a configuration, for example, the client 4 creates document data in which text data and image data are mixed. The document data is printed by the virtual printer driver described above in the client 4 to be converted into image data and text data is extracted. Image data and text data based on these document data are sent from the client 4 to the server 2 via the network 1. In the server 2, the sent text data is associated with the image data as a keyword for full-text search and registered in the database 3. As a result, the document data created by the client 4 is registered in the database 3.

【0025】図2は、クライアント4の一例の構成を示
す。バス10に対して、CPU(Central Processing Un
it)11、ROM(Read Only Memory)12、RAM(Rand
om Access Memory)13およびビデオインターフェイス
(以下、ビデオI/F)14がそれぞれ接続される。ま
た、バス10に対して、ハードディスクドライブ(以
下、HDD)16、CD−ROM(Compact Disc-Read O
nly Memory)ドライブ17および入力インターフェイス
(以下、入力I/F)18がそれぞれ接続される。入力
I/F18には、例えばキーボード19やマウス20と
いった入力デバイスが接続される。
FIG. 2 shows an example of the structure of the client 4. CPU (Central Processing Un
it) 11, ROM (Read Only Memory) 12, RAM (Rand
om Access Memory) 13 and a video interface (hereinafter referred to as video I / F) 14 are respectively connected. Further, for the bus 10, a hard disk drive (hereinafter, HDD) 16 and a CD-ROM (Compact Disc-Read O)
An nly memory) drive 17 and an input interface (hereinafter, input I / F) 18 are connected to each other. An input device such as a keyboard 19 or a mouse 20 is connected to the input I / F 18.

【0026】HDD16には、プログラムやデータが格
納される。CPU11により、例えばHDD16に格納
されたプログラムが読み出され、RAM13をワークメ
モリとして読み出されたプログラムが実行される。キー
ボード19やマウス20などの入力デバイスから、ユー
ザの操作に応じた制御信号が出力され、この出力信号が
入力I/F18、バス10を介してCPU11に供給さ
れる。CPU11では、例えばこの制御信号に応じて、
プログラムに基づく様々な処理が行われる。
The HDD 16 stores programs and data. The CPU 11 reads the program stored in the HDD 16, for example, and executes the read program using the RAM 13 as a work memory. A control signal according to a user operation is output from an input device such as the keyboard 19 or the mouse 20, and the output signal is supplied to the CPU 11 via the input I / F 18 and the bus 10. In the CPU 11, for example, in response to this control signal,
Various processes based on the program are performed.

【0027】また、プログラムに基づく処理に応じて、
CPU11により表示制御信号が生成される。この表示
制御信号は、バス10を介してビデオI/F14に供給
され、例えばCRT(Cathode Ray Tube)やLCD(Liqui
d Crystal Display)といった表示デバイスからなるモニ
タ15に表示可能な信号に変換され、モニタ15に供給
される。
Further, according to the processing based on the program,
A display control signal is generated by the CPU 11. This display control signal is supplied to the video I / F 14 via the bus 10, and is used, for example, in a CRT (Cathode Ray Tube) or an LCD (Liquid).
The signal is converted into a signal that can be displayed on the monitor 15 including a display device such as a d crystal display, and is supplied to the monitor 15.

【0028】さらに、バス10に対して、通信インター
フェイス(以下、通信I/F)21が接続される。通信
I/F21は、例えば上述したネットワーク1に接続さ
れる。通信I/F21により、このクライアント4とネ
ットワーク1との通信が制御される。
Further, a communication interface (hereinafter, communication I / F) 21 is connected to the bus 10. The communication I / F 21 is connected to the network 1 described above, for example. The communication I / F 21 controls communication between the client 4 and the network 1.

【0029】CD−ROMドライブ17は、所定に装填
されたCD−ROMからデータを読み出すことができ
る。読み出されたデータは、バス10を介して例えばC
PU11やRAM13に供給される。なお、CD−RO
Mドライブ17は、外部記憶媒体の読み取りドライブの
一例であって、この例に限定されない。例えばFD(フ
レキシブルディスク)の読み取り/書き込みが可能なF
DD(FDドライブ)やMO(光磁気ディスク)の読み
取り/書き込みが可能なMOドライブを接続するように
してもよい。複数種類のドライブ装置を接続することも
できる。
The CD-ROM drive 17 can read data from a CD-ROM loaded in a predetermined manner. The read data is transferred to, for example, C via the bus 10.
It is supplied to the PU 11 and the RAM 13. In addition, CD-RO
The M drive 17 is an example of a read drive for an external storage medium, and is not limited to this example. For example, an F that can read / write an FD (flexible disk)
An MO drive capable of reading / writing a DD (FD drive) or an MO (magneto-optical disk) may be connected. It is also possible to connect multiple types of drive devices.

【0030】なお、クライアント4は、GUI(Graphic
al User Interface)が適用され、マウス20などのポイ
ンティングデバイスを用いたユーザによる直感的な操作
が可能とされている。例えば、画面に所定に配置され表
示されたボタンなどを、ポインティングデバイスから出
力される座標情報に基づき指示し、ポインティングデバ
イスに対して所定の操作を行うことで、表示されたボタ
ンに割り当てられた機能を実行させることができる。以
下、このポインティングデバイスを用いたボタン表示に
対する一連の処理を、「ボタンを操作する」、「ボタン
を押す」などと表現する。勿論、ポインティングデバイ
スだけでなく、例えばキーボード19などの他の入力手
段を用いて所定の機能を実行させるようにもできる。
The client 4 uses a GUI (Graphic).
al User Interface) is applied, and an intuitive operation by a user using a pointing device such as the mouse 20 is possible. For example, by indicating a button or the like that is arranged and displayed on the screen on the basis of the coordinate information output from the pointing device and performing a predetermined operation on the pointing device, the function assigned to the displayed button Can be executed. Hereinafter, a series of processes for displaying a button using this pointing device will be referred to as “operating a button”, “pressing a button”, and the like. Of course, not only the pointing device but also other input means such as the keyboard 19 may be used to execute the predetermined function.

【0031】サーバ2は、一般的なコンピュータ装置を
適用することが可能であり、その構成は、上述のクライ
アント4の構成と概略的には同様であるため、繁雑さを
避けるため、説明を省略する。
A general computer device can be applied to the server 2, and its configuration is substantially the same as the configuration of the client 4 described above. Therefore, the description thereof is omitted to avoid complexity. To do.

【0032】図3は、クライアント4において、例えば
プリンタ装置5に対して印刷を指示する際のアーキテク
チャを概略的に示す。なお、この図3の構成は、米国マ
イクロソフト社により開発されたOS(Operasting Syst
em)であるWindowsNT(登録商標)に基づくも
のである。
FIG. 3 schematically shows the architecture of the client 4 for instructing printing to the printer device 5, for example. The configuration shown in FIG. 3 is based on an operating system (OS) developed by Microsoft Corporation in the United States.
em), which is based on Windows NT (registered trademark).

【0033】アプリケーション30は、OS上で動作す
るソフトウェアであって、GUI(Graphical User Inte
rface)などのユーザインターフェイスを有する。アプリ
ケーション30では、このユーザインターフェイスを用
いてユーザによりなされた指示に基づき、プリンタ装置
5による印刷などの処理が設定される。API(Applica
tion Programming Interface)31は、アプリケーショ
ン30からOS(図示しない)の機能を呼び出すインタ
ーフェイスである。
The application 30 is software that runs on the OS, and is a GUI (Graphical User Interface).
rface) and other user interfaces. In the application 30, processing such as printing by the printer device 5 is set based on an instruction made by the user using this user interface. API (Applica
An option programming interface 31 is an interface for calling a function of an OS (not shown) from the application 30.

【0034】API31のうち、印刷や画面表示など、
描画に関する機能を受け持つのがGDI(Graphics Devi
ce Interface)32である。すなわち、アプリケーショ
ン30による、画面表示や印刷など描画に関する全ての
操作に関して、アプリケーション30からGDI32に
対して命令が発行される。例えばモニタ15の画面への
表示やプリンタ装置5といったGDI32による描画対
象は、デバイスコンテキストと称される。GDI32に
より、デバイスコンテキストへの命令が画面やプリンタ
装置5のプリンタドライバへの要求に変換され、対応す
るデバイスコンテキストに対する描画命令が発行され
る。
Of the API 31, printing, screen display, etc.
GDI (Graphics Devi) is responsible for drawing-related functions.
ce Interface) 32. That is, the command is issued from the application 30 to the GDI 32 for all the operations related to the drawing such as screen display and printing by the application 30. For example, the display target on the screen of the monitor 15 and the drawing target by the GDI 32 such as the printer device 5 are referred to as device context. The GDI 32 converts the command to the device context into a request to the screen or the printer driver of the printer device 5, and issues a drawing command to the corresponding device context.

【0035】GDI32は、直線、円、多角形、文字な
どの描画機能を有する。アプリケーション30から渡さ
れた描画命令は、GDI32により、GDI32が有す
る直線、円、多角形、文字などの描画機能に対応した描
画コマンドに基づき画面やプリンタドライバ33への要
求に変換される。
The GDI 32 has a drawing function of a straight line, a circle, a polygon, a character and the like. The drawing command passed from the application 30 is converted by the GDI 32 into a request to the screen or the printer driver 33 based on the drawing command corresponding to the drawing function of the straight line, the circle, the polygon, the character and the like which the GDI 32 has.

【0036】プリンタドライバ33内には、GDI32
から呼び出される印刷処理に必要なエントリが複数設け
られる。例えば、「印刷開始」、「印刷終了」、「ペー
ジ印刷の開始」、「ページ印刷の終了」、「画像データ
の出力」、「線データの出力」、「テキストデータの出
力」などの処理に応じたエントリが設けられる。プリン
タドライバ33では、これらのエントリにより、受動的
に処理が進められる。すなわち、GDI32により、プ
リンタドライバ33への要求がその内容に応じてこれら
のエントリに振り分けられ、プリンタドライバ33に渡
される。
In the printer driver 33, the GDI 32
A plurality of entries required for print processing called from are provided. For example, for processes such as "start printing", "end printing", "start page printing", "end page printing", "output image data", "output line data", and "output text data". A corresponding entry is provided. The printer driver 33 passively proceeds with these entries. That is, the GDI 32 distributes the request to the printer driver 33 to these entries according to the contents, and passes it to the printer driver 33.

【0037】プリンタドライバ33では、GDI32か
ら渡された要求がプリンタを制御するためのプリンタ制
御コードに変換される。プリンタ制御コードは、GDI
32に渡され、プリンタ制御コードに基づきラスタライ
ズ処理がなされ、印刷データがラスタデータに変換され
る。ラスタライズ処理は、印刷データをページデータに
変換する処理である。
In the printer driver 33, the request passed from the GDI 32 is converted into a printer control code for controlling the printer. The printer control code is GDI
Then, the print data is converted to raster data by being rasterized based on the printer control code. The rasterization process is a process of converting print data into page data.

【0038】このような構成における印刷処理は、例え
ば次のように行われる。アプリケーション30におい
て、文書データの印刷が指定されると、文書データに基
づき画像データ、テキストデータ、線データ、テキスト
データの印字に用いられるフォント情報、ページ区切り
情報などの印刷データが出力される。出力された印刷デ
ータは、GDI32によりプリンタドライバ33への要
求に変換され、プリンタドライバ33に渡される。プリ
ンタドライバ33では、この要求に基づき、印刷データ
をプリンタ制御コードに変換し、GDI32に渡す。G
DI32では、渡されたプリンタ制御コードに基づきラ
スタライズ処理がなされ、印刷データが画像として展開
される。例えば、ラスタライズ処理により、テキストデ
ータのキャラクタがフォント情報に基づきドットイメー
ジに展開される。このドットイメージが最終的にプリン
タ装置に渡され、実際の印刷が行われる。
The printing process in such a configuration is performed as follows, for example. When printing of document data is designated in the application 30, print data such as image data, text data, line data, font information used for printing text data, page break information, etc. is output based on the document data. The output print data is converted into a request to the printer driver 33 by the GDI 32 and passed to the printer driver 33. Based on this request, the printer driver 33 converts the print data into a printer control code and passes it to the GDI 32. G
In the DI 32, rasterization processing is performed based on the passed printer control code, and print data is developed as an image. For example, the rasterization process develops the characters of the text data into dot images based on the font information. This dot image is finally passed to the printer device for actual printing.

【0039】この発明では、プリンタドライバ33によ
って印刷データが変換されたプリンタ制御コードに基づ
く実際のプリンタ装置の制御を行わない。すなわち、プ
リンタドライバ33は、仮想のプリンタドライバとされ
る。したがって、文書データをこの仮想プリンタドライ
バに渡すことにより、実際の印刷は行われずに、文書デ
ータがラスタライズ処理されたラスタデータが画像デー
タに変換される。そして、仮想プリンタドライバにおい
て、印刷データをプリンタ制御コードに変換する際に、
上述のGDI32の機能を利用して印刷データからテキ
ストデータを抽出する。そして、抽出されたテキストデ
ータを、文書データを検索する際のキーワードとして用
いる。
In the present invention, the actual printer device is not controlled based on the printer control code obtained by converting the print data by the printer driver 33. That is, the printer driver 33 is a virtual printer driver. Therefore, by passing the document data to the virtual printer driver, the raster data obtained by rasterizing the document data is converted into image data without actual printing. Then, in the virtual printer driver, when converting the print data into the printer control code,
The text data is extracted from the print data using the function of the GDI 32 described above. Then, the extracted text data is used as a keyword when searching the document data.

【0040】なお、以下では、繁雑さを避けるために、
仮想プリンタドライバを用いてなされる仮想的な印刷
を、単に「印刷」と表現する。
In the following, in order to avoid complexity,
Virtual printing performed using the virtual printer driver is simply referred to as "printing".

【0041】図4は、この実施の一形態による仮想プリ
ンタドライバでの一例の印刷処理を示すフローチャート
である。先ず、所定のアプリケーション30において、
テキストと画像が混在した文書データの印刷が指示され
ると、その指示がGDI32に渡される。ステップS1
0で、この指示に基づきGDI32から仮想プリンタド
ライバに対して印刷開始命令が出される。次に、ステッ
プS11で、仮想プリンタドライバからダイレクトコン
バータに対して、印刷が開始されたことが通知される。
FIG. 4 is a flow chart showing an example of print processing by the virtual printer driver according to this embodiment. First, in the predetermined application 30,
When an instruction is given to print the document data in which the text and the image are mixed, the instruction is passed to the GDI 32. Step S1
At 0, the GDI 32 issues a print start command to the virtual printer driver based on this instruction. Next, in step S11, the virtual printer driver notifies the direct converter that printing has started.

【0042】ダイレクトコンバータは、仮想プリンタド
ライバによりテキストデータを抽出されると共に画像デ
ータ化された文書データを、データベース3に登録する
ためのソフトウェアである。このダイレクトコンバータ
により、データベース3に登録される文書データに対す
る名前の設定や、文書データの内容に対する目次に相当
するタグインデックスの設定などを行うことができる。
ダイレクトコンバータの詳細については、後述する。
The direct converter is software for registering the text data extracted by the virtual printer driver and converted into image data into the database 3. With this direct converter, it is possible to set the name for the document data registered in the database 3 and the tag index corresponding to the table of contents for the content of the document data.
Details of the direct converter will be described later.

【0043】ステップS11でダイレクトコンバータに
対して印刷開始が通知されると、処理は、ステップS1
2に移行される。GDI32から仮想プリンタドライバ
に対して、文書データに基づく印刷データが渡される。
印刷データは、例えば1ページへの印刷の順序に応じ、
順次渡される。このとき、上述したように、GDI32
により、印刷データは、その内容に基づき、仮想プリン
タドライバのエントリに対応するように振り分けられ
て、仮想プリンタドライバに渡される。仮想プリンタド
ライバでは、印刷データが渡されたエントリに応じて各
種の判断が行われる。
When the start of printing is notified to the direct converter in step S11, the process proceeds to step S1.
Moved to 2. Print data based on the document data is passed from the GDI 32 to the virtual printer driver.
The print data is, for example, according to the printing order on one page,
Passed sequentially. At this time, as described above, GDI32
Thus, the print data is distributed so as to correspond to the entry of the virtual printer driver based on the content, and is passed to the virtual printer driver. The virtual printer driver makes various determinations according to the entry to which the print data is passed.

【0044】ステップS12において、仮想プリンタド
ライバにより、1ページの印刷が終了したか否かが判断
される。例えば、GDI32から仮想プリンタドライバ
に対してページ区切り情報が渡されたか否かにより、こ
の判断がなされる。若し、1ページの印刷が終了してい
ないと判断されたら、処理はステップS13に移行し、
GDI32から印刷データを受け取り、上述したよう
に、印刷データをプリンタ制御コードに変換し、GDI
32に渡す。GDI32では、このプリンタ制御コード
に基づきラスタライズ処理が行われ、ラスタデータが生
成される。
In step S12, the virtual printer driver determines whether the printing of one page is completed. For example, this determination is made depending on whether or not the page division information is passed from the GDI 32 to the virtual printer driver. If it is determined that the printing of one page is not completed, the process proceeds to step S13,
The print data is received from the GDI 32, the print data is converted into the printer control code as described above, and the GDI
Pass it to 32. The GDI 32 performs rasterization processing based on the printer control code to generate raster data.

【0045】このラスタデータは、例えば1ページ単位
のピクセル情報より成るデータである。ラスタデータ
は、仮想プリンタドライバにより、所定のフォーマット
の画像データに変換される。例えば、仮想プリンタドラ
イバがカラーに対応している場合には、JPEG(Joint
Photographic Experts Group)形式の画像フォーマット
の画像データに変換される。また、仮想プリンタドライ
バがモノクロにしか対応していない場合には、Wind
owsのビットマップ形式の画像フォーマットの画像デ
ータに変換される。
This raster data is, for example, data consisting of pixel information for each page. The raster data is converted into image data of a predetermined format by the virtual printer driver. For example, if the virtual printer driver supports color, JPEG (Joint
It is converted into image data of the image format of Photographic Experts Group). If the virtual printer driver only supports monochrome, Wind
It is converted into image data of an image format of ows bitmap format.

【0046】この画像データは、メモリ(RAM13)
上に所定に割り当てられた領域に保存される。HDD1
6に一時的に保存するようにしてもよい。
This image data is stored in the memory (RAM 13).
It is stored in the area allocated above. HDD1
6 may be temporarily stored.

【0047】次のステップS14では、仮想プリンタド
ライバにより、GDI32から受け取った印刷データが
テキストデータ(キャラクタデータ)であるか否かが判
断される。若し、受け取った印刷データがテキストデー
タだと判断されれば、ステップS15で、そのデータが
メモリ(RAM13)の所定の領域に保存される。テキ
ストデータは、1回のテキスト出力が1行とされてメモ
リ上へ順番に蓄えられる。
In the next step S14, the virtual printer driver determines whether the print data received from the GDI 32 is text data (character data). If it is determined that the received print data is text data, the data is stored in a predetermined area of the memory (RAM 13) in step S15. The text data is stored in order on the memory with one line of text output as one line.

【0048】一方、ステップS14で、受け取った印刷
データがテキストデータではないと判断されれば、処理
はステップS12に戻される。
On the other hand, if it is determined in step S14 that the received print data is not text data, the process returns to step S12.

【0049】上述のステップS12において、若し、1
ページの印刷が終了したと判断されれば、処理はステッ
プS16に移行する。ステップS16では、仮想プリン
タドライバにより印刷データに基づきラスタライズされ
た画像データが、仮想プリンタドライバから上述のダイ
レクトコンバータに渡され、ダイレクトコンバータに対
してページ印刷が終了されたことが通知される。
In step S12 above, if 1
If it is determined that the printing of the page is completed, the process proceeds to step S16. In step S16, the image data rasterized by the virtual printer driver based on the print data is passed from the virtual printer driver to the above-described direct converter, and the direct converter is notified that the page printing is completed.

【0050】次のステップS17では、GDI32から
仮想プリンタドライバに対して印刷終了命令が渡された
か否かが判断される。若し、印刷終了命令が渡されてい
ないと判断されれば、処理はステップS12に戻され、
次のページの印刷が行われる。
In the next step S17, it is determined whether the GDI 32 has given a print end command to the virtual printer driver. If it is determined that the print end command has not been passed, the process returns to step S12,
The next page is printed.

【0051】一方、ステップS17で、GDI32から
仮想プリンタドライバに対して印刷終了命令が渡された
と判断されれば、処理はステップS18に移行する。ス
テップS18では、仮想プリンタドライバからダイレク
トコンバータに対して、印刷終了の旨が通知される。
On the other hand, if it is determined in step S17 that the print end command has been passed from the GDI 32 to the virtual printer driver, the process proceeds to step S18. In step S18, the virtual printer driver notifies the direct converter of the end of printing.

【0052】このようにして、仮想プリンタドライバに
よる文書データの印刷処理が終了すると、処理は、文書
データのダイレクトコンバータによるデータベース3へ
の登録処理に移行する。
When the printing process of the document data by the virtual printer driver is completed in this way, the process shifts to the registration process of the document data in the database 3 by the direct converter.

【0053】図5は、文書データのデータベース3への
登録処理を行うダイレクトコンバータの一例の画面表示
を示す。ダイレクトコンバータ画面40において、入力
部41により、仮想プリンタドライバを用いて印刷され
た文書の属する文書グループが指定される。入力部42
により、印刷された文書に対して文書番号が指定され、
ボタン43を押すことにより、登録済みの文書の文書番
号が一覧表示される。
FIG. 5 shows a screen display of an example of the direct converter for performing the registration process of the document data in the database 3. On the direct converter screen 40, the input unit 41 specifies the document group to which the document printed using the virtual printer driver belongs. Input unit 42
Specifies the document number for the printed document,
By pressing the button 43, a list of document numbers of registered documents is displayed.

【0054】入力部44にチェックを入れることでタグ
編集ボタン45が有効な状態とされ、印刷された当該文
書に対してタグインデックスを設定することができるよ
うになる。タグは、上述したように、文書データの内容
に対する目次に相当するものである。入力部44にチェ
ックが入れられ、タグ編集ボタン45が有効にされた状
態でタグ編集ボタン45を押すと、当該文書に対してタ
グインデックスを設定するタグインデックス登録画面が
表示される(図示しない)。
By checking the input section 44, the tag edit button 45 is activated and the tag index can be set for the printed document. As described above, the tag corresponds to the table of contents for the contents of the document data. If the tag edit button 45 is pressed while the input section 44 is checked and the tag edit button 45 is enabled, a tag index registration screen for setting the tag index for the document is displayed (not shown). .

【0055】タグインデックス登録画面は、例えば、当
該文書の変換された画像データがページ毎に所定に縮小
されて表示される。そして、マウス20などのポインテ
ィングデバイスを用いて、タグを設定したいページを指
定し、そのページに応じたタグ情報をテキスト入力でき
るような構成とする。目次、項目名、要約などがタグ情
報として入力される。また、タグには例えば1乃至4ま
でのレベルが設定可能とされ、レベルの高いタグがレベ
ルのより低いタグを包含するように構成することができ
る。
In the tag index registration screen, for example, the converted image data of the document is reduced in size for each page and displayed. A pointing device such as the mouse 20 is used to specify a page to which a tag is to be set, and tag information corresponding to the page can be input as text. A table of contents, item name, summary, etc. are input as tag information. Further, the tags can be set to levels of, for example, 1 to 4, and high-level tags can be configured to include lower-level tags.

【0056】入力部46により、当該文書に対して機密
レベルが設定される。機密レベルは、文書の機密度に応
じて、例えば機密度の高い方からレベル「4」〜「1」
が設定できる。機密レベル「1」に設定された文書は、
機密レベル「1」以上(すなわち、「1」〜「4」全
て)のアクセス権を持つユーザによりアクセス可能であ
る。一方、機密レベル「4」に設定された文書は、機密
レベル「4」以上(すなわち、機密レベル「4」のみ)
のアクセス権を持つユーザによりアクセス可能とされ
る。すなわち、機密レベル「4」に設定された文書は、
極めて限られた者だけが閲覧可能などとされる。
The input unit 46 sets the security level for the document. The confidentiality level is, depending on the confidentiality level of the document, for example, the level “4” to “1” from the higher confidentiality level.
Can be set. Documents set to confidentiality level "1"
It can be accessed by a user who has an access right of confidentiality level “1” or higher (that is, all “1” to “4”). On the other hand, documents set to confidentiality level "4" are confidentiality level "4" or higher (that is, only confidentiality level "4").
It can be accessed by a user who has the access right of. That is, the document set to the confidential level "4" is
It is supposed that only a very limited number of people can browse.

【0057】例えば、データベース3にログインする際
のユーザIDおよびパスワードの組み合わせで、個人毎
のアクセス権限を設定することが可能である。例えば、
ユーザ毎に、ユーザIDおよびパスワードの組み合わせ
に対して機密レベルが設定されたテーブルを、サーバ2
が持つ。データベース3に対してユーザのアクセスがあ
ったときに、このテーブルを参照することで、当該ユー
ザに対して、設定された機密レベルに応じたアクセス権
を与えることができる。
For example, it is possible to set the access authority for each individual by the combination of the user ID and the password when logging in to the database 3. For example,
The table in which the confidential level is set for the combination of the user ID and the password for each user is stored in the server 2
Has. When a user accesses the database 3, by referring to this table, it is possible to give the user an access right according to the set confidentiality level.

【0058】入力部47により、当該文書に対して文書
名および文書の仮想的な格納場所が指定される。
The input unit 47 specifies the document name and the virtual storage location of the document for the document.

【0059】ダイレクトコンバータ画面40において、
必要とされる情報が全て入力され、登録ボタン48が押
されると、当該文書データがデータベース3に登録され
る。例えば、クライアント4において登録ボタン48が
押されると、メモリに格納されていた画像データおよび
テキストデータと、ダイレクトコンバータ画面40にお
いて各項目に入力されたデータがネットワーク1を介し
てサーバ2に送信される。サーバ2では、送信されたこ
れらのデータを、データベース3のデータフォーマット
に従いデータベース3に登録する。このとき、必要に応
じて、送信されたデータに対する変換処理や、管理情報
の生成が行われる。この、文書データのデータベース3
への登録処理の詳細は、後述する。
On the direct converter screen 40,
When all the necessary information is input and the registration button 48 is pressed, the document data is registered in the database 3. For example, when the registration button 48 is pressed on the client 4, the image data and text data stored in the memory and the data input to each item on the direct converter screen 40 are transmitted to the server 2 via the network 1. . The server 2 registers these transmitted data in the database 3 according to the data format of the database 3. At this time, conversion processing for the transmitted data and generation of management information are performed as necessary. This document data database 3
The details of the registration process to the will be described later.

【0060】このようにしてダイレクトコンバータ画面
40からデータベース3に登録された文書データは、図
6に一例が示されるようなディレクトリ構造に基づき管
理される。
The document data thus registered in the database 3 from the direct converter screen 40 is managed based on the directory structure as shown in FIG.

【0061】データベース3は、ルートディレクトリと
して文書グループディレクトリ50を有しており、複数
のデータとして、上述した図4のフローチャートのステ
ップS13においてメモリ上に保存された複数の画像デ
ータを管理する機能を有する。なお、データベース3
は、これに限らず、例えば紙に印刷された文書がスキャ
ナで読み取られた画像データを管理することもできる。
The database 3 has a document group directory 50 as a root directory, and has a function of managing a plurality of image data stored in the memory in step S13 of the flowchart of FIG. 4 described above as a plurality of data. Have. Database 3
However, the present invention is not limited to this, and it is also possible to manage image data in which a document printed on paper is read by a scanner.

【0062】文書グループディレクトリ50の下層に
は、グループバージョンディレクトリ51、DOCディ
レクトリ52、STGディレクトリ55、BINディレ
クトリ58およびTMPディレクトリ60が形成されて
いる。グループバージョンディレクトリ51は、作成さ
れた文書グループディレクトリ50のバージョン情報を
格納するためのディレクトリである。DOCディレクト
リ52には、文書毎に複数の画像データに関する情報が
格納されている。
Below the document group directory 50, a group version directory 51, a DOC directory 52, an STG directory 55, a BIN directory 58 and a TMP directory 60 are formed. The group version directory 51 is a directory for storing version information of the created document group directory 50. The DOC directory 52 stores information regarding a plurality of image data for each document.

【0063】STGディレクトリ55の下層には、第1
文書STGディレクトリ56、第2文書STGディレク
トリ57、・・・が形成されている。この第1文書ST
Gディレクトリ56には、第1文書STGディレクトリ
56に格納される画像データなどの情報と1対1で管理
される添付ファイルが格納されている。なお、実際に
は、ある文書に対する添付ファイルが1対1で管理され
ているとすると、それぞれのページに対して1対1では
持っておらず、例えば文書単位で持っている。この添付
ファイルには、例えば第1文書STGディレクトリ56
の画像データなどの情報を解析した結果に関する表グラ
フなどが含まれている。
Below the STG directory 55, the first
A document STG directory 56, a second document STG directory 57, ... Are formed. This first document ST
The G directory 56 stores information such as image data stored in the first document STG directory 56 and attached files managed on a one-to-one basis. Actually, if the attached file for a certain document is managed on a one-to-one basis, it does not have a one-to-one correspondence for each page, but has it for each document, for example. In this attached file, for example, the first document STG directory 56
It includes a table graph and the like related to the result of analyzing information such as image data of.

【0064】BINディレクトリ58は、複数の画像デ
ータに関して全文検索を行うためのインデックス保存用
のディレクトリである。TMPディレクトリ60は、一
時的にデータを格納するためのディレクトリである。
The BIN directory 58 is a directory for storing an index for performing a full text search for a plurality of image data. The TMP directory 60 is a directory for temporarily storing data.

【0065】DOCディレクトリ52の下層には、第1
文書ディレクトリ53、第2文書ディレクトリ54、・
・・が形成されている。例えば第1文書ディレクトリ5
3には、図7に一例が示されるように、インデックスフ
ァイル70(関連情報集合体)、アクチュアルファイル
71(データ集合体)が格納され、好ましくはサムネイ
ルファイル72、タグファイル73、共通アノテーショ
ンファイル、ページ要約ファイル74および添付リスト
ファイル75が格納されている。
Below the DOC directory 52 is a first
Document directory 53, second document directory 54, ...
.. is formed. For example, the first document directory 5
3, an index file 70 (related information group) and an actual file 71 (data group) are stored in the file 3, preferably a thumbnail file 72, a tag file 73, a common annotation file, A page summary file 74 and an attachment list file 75 are stored.

【0066】データベース3により、例えば複数の画像
データがインデックスファイル70およびアクチュアル
ファイル71として管理され、好ましくは、サムネイル
ファイル72、タグファイル73、共通アノテーション
ファイル、ページ要約ファイル74および添付リストフ
ァイル75も管理される。
The database 3 manages, for example, a plurality of image data as an index file 70 and an actual file 71, and preferably also manages a thumbnail file 72, a tag file 73, a common annotation file, a page summary file 74 and an attachment list file 75. To be done.

【0067】なお、アクチュアルファイル71は、仮想
プリンタドライバで印刷された実サイズの画像データが
格納されるファイルであって、複数の画像データを含む
ことができる。一方、インデックスファイル70は、ア
クチュアルファイル71に関する情報を示している。例
えばアクチュアルファイル71が複数の画像データを含
んでいるとすれば、インデックスファイル70は、アク
チュアルファイル71に含まれる画像データの解像度な
どに関する情報を有する。これら、インデックスファイ
ル70およびアクチュアルファイル71についての詳細
は後述する。
The actual file 71 is a file in which real size image data printed by the virtual printer driver is stored and can include a plurality of image data. On the other hand, the index file 70 shows information about the actual file 71. For example, if the actual file 71 includes a plurality of image data, the index file 70 has information about the resolution of the image data included in the actual file 71. Details of the index file 70 and the actual file 71 will be described later.

【0068】これに対して、サムネイルファイル72
は、アクチュアルファイル71に含まれる画像データの
サイズが縮小された縮小版画像データが格納される。デ
ータベース3から文書データを検索する際に、サムネイ
ルファイル72に格納されたサムネイル画像所定のソフ
トウェアで表示させることで、当該文書の全体を概略的
に把握することができる。
On the other hand, the thumbnail file 72
Stores reduced version image data in which the size of the image data included in the actual file 71 is reduced. When the document data is searched from the database 3, the thumbnail image stored in the thumbnail file 72 is displayed by predetermined software, so that the entire document can be roughly grasped.

【0069】また、タグファイル73は、上述のダイレ
クトコンバータ画面40で設定されたタグインデックス
が格納される。すなわち、このタグファイル73は、当
該文書の各画像データの索引を扱うためのファイルであ
る。このタグファイル73については、詳細は後述す
る。
The tag file 73 stores the tag index set on the direct converter screen 40 described above. That is, the tag file 73 is a file for handling the index of each image data of the document. The details of this tag file 73 will be described later.

【0070】共通アノテーションファイルは、当該文書
の注釈が示される。ページ要約ファイル74は、アクチ
ュアルファイル71の要約情報を示すデータである。添
付リストファイル75は、上述の第1文書STGディレ
クトリ56に格納されている添付ファイルのリストを示
す。
The common annotation file shows the annotation of the document. The page summary file 74 is data indicating the summary information of the actual file 71. The attachment list file 75 shows a list of attachment files stored in the above-described first document STG directory 56.

【0071】図8Aは、上述したアクチュアルファイル
71の一例のデータ構成例を示し、図8Bは、上述した
インデックスファイル70の一例のデータ構成を示す。
この図8では、アクチュアルファイル71に4つの画像
ファイルが含まれる例が示されている。
FIG. 8A shows an example data structure of the above-mentioned actual file 71, and FIG. 8B shows an example data structure of the above-mentioned index file 70.
In FIG. 8, an example in which the actual file 71 includes four image files is shown.

【0072】データベース3により、図8Aに示される
ように、複数のデータとしての例えば4つの画像データ
80A〜80D(第1画像データ80A、第2画像デー
タ80B、第3画像データ80Cおよび第4画像データ
80D)を、区切り情報としてのタグ81(それぞれタ
グ81A、81Bおよび81C)で結合して一体化した
構成として管理される。
As shown in FIG. 8A, the database 3 allows, for example, four image data 80A to 80D (first image data 80A, second image data 80B, third image data 80C and fourth image) as a plurality of data. The data 80D) is managed as a configuration in which tags 81 (tags 81A, 81B and 81C, respectively) as delimiter information are combined and integrated.

【0073】具体的には、第1画像データ80Aと第2
画像データ80Bの間にはタグ81Aが設けられてお
り、第2画像データ80Bと第3画像データ80Cの間
にはタグ81Bが設けられており、第3画像データ80
Cと第4画像データ80Dの間にはタグ81Cが設けら
れている。したがって、画像データ80A、80B、8
0Cおよび80Dは、それぞれタグ81A、81Bおよ
び81Cによって区切られているので、タグ81A、8
1Bおよび81Cを基準として容易に分離することもで
きる。
Specifically, the first image data 80A and the second image data 80A
A tag 81A is provided between the image data 80B, and a tag 81B is provided between the second image data 80B and the third image data 80C.
A tag 81C is provided between C and the fourth image data 80D. Therefore, the image data 80A, 80B, 8
0C and 80D are separated by tags 81A, 81B and 81C, respectively, so tags 81A and 8D
It can also be easily separated based on 1B and 81C.

【0074】また、図8Bに一例が示されるように、イ
ンデックスファイル70は、先頭にヘッダ85が設けら
れると共に、アクチュアルファイル71に含まれる画像
データ80A、80B、・・・にそれぞれ対応したボデ
ィ86A〜86D(第1ボディ86A、第2ボディ86
B、第3ボディ86Cおよび第4ボディ86D)を有す
る。
Further, as an example is shown in FIG. 8B, the index file 70 has a header 85 at the beginning and a body 86A corresponding to the image data 80A, 80B, ... Contained in the actual file 71. ~ 86D (first body 86A, second body 86
B, a third body 86C and a fourth body 86D).

【0075】インデックスファイル70において、ヘッ
ダ85は、各インデックスファイル70を図示しない他
のインデックスファイルと識別するための情報である。
ボディ86A〜86Dは、それぞれ、アクチュアルファ
イル71に含まれる画像データ80A、80B、・・・
に関する情報を表すデータである。具体的には、第1ボ
ディ86Aは、第1画像データ80Aに関する解像度な
どの関連情報を含んでいる。
In the index file 70, the header 85 is information for distinguishing each index file 70 from other index files (not shown).
The bodies 86A to 86D respectively include image data 80A, 80B, ... Which are included in the actual file 71.
It is data representing information regarding. Specifically, the first body 86A includes related information such as the resolution regarding the first image data 80A.

【0076】図9は、図8Bのインデックスファイル7
0の一例のデータフォーマットを示す。なお、図9で
は、図8Bに示すインデックスファイル70における第
1ボディ86A以外のボディ86B、86C、・・・
は、繁雑さを避けるため省略している。
FIG. 9 shows the index file 7 of FIG. 8B.
An example of a data format of 0 is shown. Note that in FIG. 9, bodies 86B, 86C, ... Other than the first body 86A in the index file 70 shown in FIG. 8B.
Are omitted to avoid complexity.

【0077】インデックスファイル70は、主に「IN
DEX」タグ、「IDX_HEAD」タグ、「IDX_
BODY」タグを有する。「INDEX」タグに続く
「IDX_HEAD{IDX_BODY}(*)」は、
「IDX_HEAD」タグ及び「IDX_BODY」タ
グが1つ以上存在していることを示している。
The index file 70 is mainly composed of "IN
"DEX" tag, "IDX_HEAD" tag, "IDX_
It has a BODY "tag. "IDX_HEAD {IDX_BODY} (*)" following the "INDEX" tag is
This indicates that one or more "IDX_HEAD" tags and "IDX_BODY" tags exist.

【0078】図9における「DTAG_OFF」は、タ
グ81A、81B、・・・からのオフセットを示してい
る。「DTAG_COUNT」は、図8Aに示すタグ8
1A、81B、・・・の個数を示している。したがてっ
て、「DTAG_COUNT」を参照すると、アクチュ
アルファイル71に含まれる画像データ80の数を把握
することができる。
"DTAG_OFF" in FIG. 9 indicates an offset from the tags 81A, 81B, .... “DTAG_COUNT” is the tag 8 shown in FIG. 8A.
The number of 1A, 81B, ... Therefore, by referring to “DTAG_COUNT”, the number of image data 80 included in the actual file 71 can be grasped.

【0079】「DABS_OFF」は、上述した図7の
ページ要約ファイル75の先頭からのオフセットを示し
ている。「DABS_LEN」は、図7のページ要約フ
ァイル75のバイト数を示している。なお、ここでいう
バイト数には、例えばページ要約ファイル75内のヘッ
ダは含まれないものとする。
"DABS_OFF" indicates an offset from the head of the page summary file 75 of FIG. 7 described above. “DABS_LEN” indicates the number of bytes of the page summary file 75 in FIG. 7. The number of bytes referred to here does not include the header in the page summary file 75, for example.

【0080】また、「IDX_BODY」タグは、「D
EG」タグ、「ACT_WIDTH」タグ、「ACT_
HEIGHT」タグ、「ACT_DPI」タグ、「AC
T_CMP」タグ、「ACT_OFF」タグ、「ACT
_LEN」タグ、「THUMB_WIDTH」タグ、
「THUMB_HEIGHT」タグ、「THUB_CM
P」タグ、「THUMB_OFF」タグ、「THUMB
_LEN」タグ、「TAG_OFF」タグ、「TAG_
NUM」タグ、「ANN_OFF」タグ、「ANN_N
UM」タグ、「ABS_OFF」タグ、「ABS_LE
N」タグ、「ABS_REGD」タグ、「RESV1」
タグ、「RESV2」タグ、「RESV3」タグを含ん
でいる。
The "IDX_BODY" tag is "D
"EG" tag, "ACT_WIDTH" tag, "ACT_
"HEIGHT" tag, "ACT_DPI" tag, "AC
"T_CMP" tag, "ACT_OFF" tag, "ACT
_LEN ”tag,“ THUMB_WIDTH ”tag,
"THUMB_HEIGHT" tag, "THUB_CM
"P" tag, "THUMB_OFF" tag, "THUMB"
_LEN ”tag,“ TAG_OFF ”tag,“ TAG_
NUM ”tag,“ ANN_OFF ”tag,“ ANN_N
"UM" tag, "ABS_OFF" tag, "ABS_LE"
"N" tag, "ABS_REGD" tag, "RESV1"
It includes tags, "RESV2" tags, and "RESV3" tags.

【0081】「DEG」タグは、画像データ80A、8
0B、・・・の回転角を示している。「ACT_WID
TH」タグおよび「ACT_HEIGHT」タグは、上
述した図7のページ要約ファイル75の先頭からのオフ
セットを示している。「ACT_DPI」タグは、画像
データ(実イメージ)の解像度を示している。「ACT
_CMP」タグは、画像データの圧縮方式の一例を示し
ている。「ACT_OFF」タグは、アクチュアルファ
イル71の先頭からのオフセットを示している。「AC
T_LEN」タグは、画像データのバイト数を示してい
る。
The "DEG" tag is used for the image data 80A, 8A.
The rotation angles of 0B, ... "ACT_WID
The “TH” tag and the “ACT_HEIGHT” tag indicate the offset from the beginning of the page summary file 75 of FIG. 7 described above. The “ACT_DPI” tag indicates the resolution of image data (actual image). "ACT
The “_CMP” tag indicates an example of the image data compression method. The “ACT_OFF” tag indicates an offset from the beginning of the actual file 71. "AC
The “T_LEN” tag indicates the number of bytes of image data.

【0082】「THUMB_WIDTH」タグおよび
「THUMB_HEIGHT」タグは、サムネイルファ
イル72のドットサイズを示している。「THUMB_
CMP」タグは、サムネイルファイル72の圧縮率を示
している。「THUMB_OFF」タグは、サムネイル
ファイル72の先頭からのオフセットを示している。
「THUMB_LEN」タグは、サムネイルファイル7
2のバイト数を示している。
The "THUMB_WIDTH" tag and the "THUMB_HEIGHT" tag indicate the dot size of the thumbnail file 72. "THUMB_
The “CMP” tag indicates the compression rate of the thumbnail file 72. The “THUMB_OFF” tag indicates an offset from the beginning of the thumbnail file 72.
The "THUMB_LEN" tag is the thumbnail file 7
2 indicates the number of bytes.

【0083】「TAG_OFF」タグは、図8Aに示す
タグ81A、81B、・・・の先頭からのオフセットを
示している。「TAG_NUM」タグは、タグ81A、
81B、・・・の個数を示している。
The "TAG_OFF" tag indicates the offset from the beginning of the tags 81A, 81B, ... Shown in FIG. 8A. The "TAG_NUM" tag is the tag 81A,
81B, ...

【0084】「ANN_NUM」タグは、注釈の個数を
示している。「ABS_OFF」タグは、ページ要約フ
ァイル75の先頭からのオフセットを示している。「A
BS_LEN」タグは、ページ要約ファイル75のバイ
ト数を示している。「ABS_REGD」タグは、要約
ファイル75を登録済みか否かを示している。このタグ
は、OCR(Optical Charactar Reader)などで利用され
る。
The "ANN_NUM" tag indicates the number of annotations. The “ABS_OFF” tag indicates an offset from the top of the page summary file 75. "A
The “BS_LEN” tag indicates the number of bytes of the page summary file 75. The “ABS_REGD” tag indicates whether or not the summary file 75 has been registered. This tag is used in OCR (Optical Character Reader) or the like.

【0085】タグファイル73について説明する。タグ
ファイル73におけるタグは、図10に一例が示される
ように、文書の各ページに所望のように割り当てる文字
列であり、各ページの目次として利用することができる
他、検索のために利用することができる。また、タグに
は、1乃至4の何れかのレベルを割り当てることがで
き、これにより、文書の階層的な目次を自動的に作成す
ることが可能となる。
The tag file 73 will be described. The tag in the tag file 73 is a character string that is assigned to each page of the document as desired, as shown in FIG. 10, and can be used as a table of contents of each page and used for searching. be able to. In addition, any level of 1 to 4 can be assigned to the tag, which makes it possible to automatically create a hierarchical table of contents of the document.

【0086】図11は、タグファイル73の一例のデー
タ構成を示す。図11において、各列はタグファイル7
3のデータ項目を示し、各行は、それぞれのタグを示
す。タグファイル37には、タグの日付を示す第1のタ
グ内容90、タグに付与された文字列を示す第2のタグ
内容91、設定されたタグの階層を示すタグ階層情報9
2、このタグに関するページのうち最初のページを示す
開始ページ情報93および最後のページを示す終了ペー
ジ情報94が含まれる。なお、タグ階層情報92は、上
述したタグに設定されたレベルに対応する。なお、図1
1の例では、タグに付与された文字列が格納される項目
は、第2のタグ内容91の1項目しか用意されていない
が、これはこの例に限らず、複数の項目を設けることが
できる。
FIG. 11 shows an example of the data structure of the tag file 73. In FIG. 11, each row is a tag file 7
3 shows data items, and each line shows each tag. In the tag file 37, the first tag content 90 indicating the date of the tag, the second tag content 91 indicating the character string attached to the tag, and the tag hierarchy information 9 indicating the hierarchy of the set tag.
2. The start page information 93 indicating the first page and the end page information 94 indicating the last page are included among the pages related to this tag. The tag hierarchy information 92 corresponds to the level set in the above-mentioned tag. Note that FIG.
In the first example, only one item of the second tag content 91 is prepared as an item in which the character string given to the tag is stored, but this is not limited to this example, and a plurality of items may be provided. it can.

【0087】次に、データベース3に対する文書データ
の登録処理について概略的に説明する。上述したダイレ
クトコンバータ画面40により登録処理がなされると、
文書データが変換された画像データ、文書データから抽
出されたテキストデータ、画面40による登録時に入力
された情報などに基づき、図8Bに示されるようなイン
テックスファイル70が生成される。また、このとき、
文書データが変換された画像データに基づきサムネイル
ファイル72が生成される。
Next, the process of registering the document data in the database 3 will be briefly described. When the registration process is performed by the direct converter screen 40 described above,
An intex file 70 as shown in FIG. 8B is generated based on image data obtained by converting the document data, text data extracted from the document data, information input at the time of registration on the screen 40, and the like. Also, at this time,
A thumbnail file 72 is generated based on the image data obtained by converting the document data.

【0088】画像ファイルは、後述するようにアクチュ
アルファイル71とされる。図7に示すアクチュアルフ
ァイル71およびサムネイルファイル72のサイズ情報
は、それぞれ、例えば図9に示すインデックスファイル
70の「ACT_LEN」および「THUMB_LE
N」に登録される。そして、図6に示す全文検索用イン
デックス保存ディレクトリ59には、このアクチュアル
ファイル71について全文キーワード検索用のキーワー
ドが格納される。
The image file is an actual file 71 as described later. The size information of the actual file 71 and the thumbnail file 72 shown in FIG. 7 are, for example, “ACT_LEN” and “THUMB_LE” of the index file 70 shown in FIG. 9, respectively.
N ”is registered. The full-text search index storage directory 59 shown in FIG. 6 stores keywords for full-text keyword search for this actual file 71.

【0089】このキーワードとして、上述の仮想プリン
タドライバで文書データ印刷の際に抽出されたテキスト
データを用いることができる。テキストデータは、上述
した図4のフローチャートに基づき、文書データの各ペ
ージ毎に抽出される。各ページ毎のテキストデータは、
1文書分にまとめられ、当該文書データに対応付けられ
て全文検索用インデックス保存ディレクトリ59に格納
される。これに限らず、各ページ毎のテキストデータ
を、文書データの対応するページに関連付けてそれぞれ
格納するようにしてもよい。
As this keyword, the text data extracted when the document data is printed by the above virtual printer driver can be used. The text data is extracted for each page of the document data based on the flowchart of FIG. 4 described above. The text data for each page is
One document is collected and stored in the full-text search index storage directory 59 in association with the document data. Not limited to this, the text data of each page may be stored in association with the corresponding page of the document data.

【0090】図8を用いて上述したように、複数の画像
データは、結合され1つのアクチュアルファイル71と
される。画像データ同士を結合するために、図8Aに示
すアクチュアルファイル71におけるタグ81A、81
B、・・・情報を変更する。このようにするための具体
的な方法としては、例えば、図9に示すインデックスフ
ァイル70において、「DTAG_COUNT」のデー
タを、挿入する元の「DTAG_COUNT」分増や
す。一方、アクチュアルファイル71においては、図8
Aに示すように、例えば、挿入しようとするタグ81C
と第4画像データ80Dとで一組とされ、第3画像デー
タ80Cの後に結合される。
As described above with reference to FIG. 8, a plurality of image data are combined into one actual file 71. Tags 81A and 81 in the actual file 71 shown in FIG. 8A are used to combine the image data.
B ... Change information. As a specific method for doing this, for example, in the index file 70 shown in FIG. 9, the data of “DTAG_COUNT” is increased by the amount of “DTAG_COUNT” from which it is inserted. On the other hand, in the actual file 71, as shown in FIG.
As shown in A, for example, the tag 81C to be inserted
And the fourth image data 80D form a set, and are combined after the third image data 80C.

【0091】このように、データベース3により、複数
のデータとしての例えば4枚の画像データが、上述の図
8Aに示す画像データ80A、80B、・・・のよう
に、それぞれの間を、区切り情報としてのタグ81A、
81B、・・・によって結合したアクチュアルファイル
71として管理される。画像データ80A、80B、・
・・が結合されて管理されるため、画像データ80A、
80B、・・・が一体化されて管理され、これらの画像
データが別々とならないような管理をする手間が省かれ
る。
In this way, the database 3 separates, for example, four pieces of image data as a plurality of data from each other like the image data 80A, 80B, ... Shown in FIG. 8A described above. As tags 81A,
It is managed as an actual file 71 combined by 81B, .... Image data 80A, 80B, ...
.. are combined and managed, so image data 80A,
, 80B, ... Are integrated and managed, and the trouble of managing such image data not to be separate is saved.

【0092】データベース3では、アクチュアルファイ
ル71以外にも、アクチュアルファイル71に関する情
報としてのインデックスファイル70が管理される。こ
のインデックスファイル70は、画像データ80A、8
0B、・・・にそれぞれ対応するボディ86A、86
B、・・・およびヘッダ85を有する。つまり、ボディ
86A、86B、・・・は、それぞれ画像データ80
A、80B、・・・に対応する解像度などに関する情報
を示している。このようにすると、ボディ86A、86
B、・・・についても、一体的に管理できる。
In addition to the actual file 71, the database 3 manages an index file 70 as information about the actual file 71. This index file 70 includes image data 80A, 8
Body 86A, 86 corresponding to 0B, ...
.. and a header 85. That is, the bodies 86A, 86B, ...
Information about resolutions corresponding to A, 80B, ... In this way, the bodies 86A, 86
B, ... Can be managed in an integrated manner.

【0093】文書データの検索の際には、例えば検索の
ために入力されたキーワードに基づき全文検索用インデ
ックス保存ディレクトリ59に格納されたテキストデー
タが全文検索される。入力されたキーワードと一致する
部分を有するテキストデータが検索されたら、そのテキ
ストデータに対応付けられた文書データの画像データが
データベース3から出力される。検索結果として複数の
候補が出力されたら、さらにキーワードを入力して絞り
込み検索を行うこともできる。出力された画像データ
は、例えばクライアント4のモニタ15に表示される。
画像データとしてサムネイルファイル72を出力するよ
うにすると、検索された文書データの概要を容易に把握
でき、好ましい。勿論、アクチュアルファイル71を出
力するようにしてもよい。
When the document data is searched, the full-text search is performed on the text data stored in the full-text search index storage directory 59 based on the keyword input for the search, for example. When the text data having the portion that matches the input keyword is searched, the image data of the document data associated with the text data is output from the database 3. When a plurality of candidates are output as the search result, a keyword can be further input to narrow down the search. The output image data is displayed on the monitor 15 of the client 4, for example.
It is preferable to output the thumbnail file 72 as the image data because the outline of the retrieved document data can be easily grasped. Of course, the actual file 71 may be output.

【0094】データベース3に登録された文書データ
に、当該文書の1ページとしての画像データを追加する
場合について、図12〜図14を用いて説明する。な
お、以下の類似の図において、点線は、データがリンク
していることを示す。
A case where image data for one page of the document is added to the document data registered in the database 3 will be described with reference to FIGS. In the following similar figures, dotted lines indicate that the data are linked.

【0095】画像データを追加前のアクチャルファイル
71は、例えば図12Aに示すように、画像データA
1、タグ81、画像データA2、タグ81、画像データ
A3およびエンドオブファイル(以下、EOF)を有す
る。また、追加前のインデックスファイル70には、例
えば図12Bに示すように、ボディ86A、86Bおよ
び86Cとしての順序に関する情報(例えば「1」、
「2」、「3」)が格納されている。
The actual file 71 before the image data is added is, for example, as shown in FIG.
1, tag 81, image data A2, tag 81, image data A3, and end of file (EOF). Further, in the index file 70 before the addition, as shown in FIG. 12B, for example, information regarding the order of the bodies 86A, 86B, and 86C (for example, “1”,
“2” and “3”) are stored.

【0096】図12Aに示すアクチュアルファイル71
の画像データA2と画像データA3の間に、図13に示
す画像データB1を追加する場合について、説明する。
先ず、アクチュアルファイル71には、図14Aに示す
ように、タグ81を介して画像データB1が追加され、
最後にEOFが付される。このように、アクチュアルフ
ァイル71においては、画像データA2と画像データA
3との間を切り離して画像データB1を追加すること
は、行われない。すなわち、アクチュアルファイル71
においては、画像データB1が末尾側に追加されるだけ
なので、高速に処理することができる。
The actual file 71 shown in FIG. 12A.
A case where the image data B1 shown in FIG. 13 is added between the image data A2 and the image data A3 will be described.
First, as shown in FIG. 14A, image data B1 is added to the actual file 71 via a tag 81,
Finally, EOF is added. Thus, in the actual file 71, the image data A2 and the image data A2
The image data B1 is not added while being separated from the data No. 3 and No. 3. That is, the actual file 71
In, since the image data B1 is only added to the end side, high speed processing is possible.

【0097】一方、インデックスファイル70では、追
加される画像データB1に対応する分だけ長さが延長さ
れ、図14Bに示すように、画像データB1が挿入され
るページなどの位置がボディ86Dに「3」と設定され
る。それと共に、ボディ86Cは、画像データA3の位
置を示す「4」と設定される。
On the other hand, in the index file 70, the length is extended by the amount corresponding to the image data B1 to be added, and as shown in FIG. 14B, the position of the page or the like into which the image data B1 is inserted is "" in the body 86D. 3 ”is set. At the same time, the body 86C is set to "4" indicating the position of the image data A3.

【0098】図15は、画像データの追加に伴うインデ
ックスファイル70の一例の修正を示す。図15Aは、
画像データ追加前のインデックスファイル70の設定を
示す。上述した追加処理に伴い、インデックスファイル
70が修正され、図15Bに示すような設定とされる。
以上のようにして、追加処理(挿入処理)が完了する。
FIG. 15 shows modification of an example of the index file 70 accompanying addition of image data. FIG. 15A shows
The setting of the index file 70 before image data addition is shown. The index file 70 is modified in accordance with the above-described additional processing, and the settings are set as shown in FIG. 15B.
As described above, the addition process (insertion process) is completed.

【0099】データベース3に登録された文書データか
ら、当該文書の1ページとしての画像データを削除する
場合について、図16および図17を用いて説明する。
削除前のアクチュアルファイル71は、例えば図16A
に示すように、画像データA1、タグ81、画像データ
A2、タグ81、画像データA3、タグ81、画像デー
タB1およびEOFを有する。また、削除前のインデッ
クスファイル70には、例えば図16Bに示すように、
ボディ86A、86B、86Cおよび86Dとしての順
序に関する情報(例えば「1」、「2」、「4」、
「3」)が格納されている。
A case where the image data as one page of the document is deleted from the document data registered in the database 3 will be described with reference to FIGS. 16 and 17.
The actual file 71 before deletion is, for example, FIG. 16A.
As shown in, the image data A1, the tag 81, the image data A2, the tag 81, the image data A3, the tag 81, the image data B1 and the EOF are included. In addition, in the index file 70 before deletion, as shown in FIG. 16B, for example,
Information about the order as bodies 86A, 86B, 86C and 86D (eg "1", "2", "4",
“3”) is stored.

【0100】図16Aに示されるアクチュアルファイル
71から画像データB1を削除する場合について、説明
する。先ず、アクチュアルファイル71においては、画
像データB1を実際に削除することは行われない。一
方、インデックスファイル70では、削除される画像デ
ータB1に対応するボディ86Dに、無効にされたこと
を示す情報、例えば図17Bに一例が示されるように記
号「×」が設定される(削除処理)。
A case where the image data B1 is deleted from the actual file 71 shown in FIG. 16A will be described. First, in the actual file 71, the image data B1 is not actually deleted. On the other hand, in the index file 70, information indicating the invalidation, for example, the symbol “x” is set in the body 86D corresponding to the image data B1 to be deleted (for example, the deletion process as shown in FIG. 17B). ).

【0101】図18は、画像データの削除に伴うインデ
ックスファイル70の一例の修正を示す。図18Aは、
画像データ削除前のインデックスファイル70の設定を
示す。上述した削除処理に伴い、インデックスファイル
70が修正され、図18Bに示すような設定とされる。
以上のようにして、削除処理が完了する。
FIG. 18 shows modification of an example of the index file 70 accompanying deletion of image data. FIG. 18A shows
The setting of the index file 70 before image data deletion is shown. The index file 70 is modified in accordance with the above-described deletion processing, and the settings are set as shown in FIG. 18B.
The deletion process is completed as described above.

【0102】データベース3に登録された文書データを
分割する処理について、図19〜図21を用いて説明す
る。分割前のアクチュアルファイル71は、例えば図1
9Aに示すように、画像データA1、タグ81、画像デ
ータA2、タグ81、画像データA3、タグ81、画像
データB1およびを有する。また、分割前のインデック
スファイル70には、例えば図19Bに示すように、ボ
ディ86A〜ボディ86Dとしての順序に関する情報
(例えば「1」、「2」、「4」、「3」)が格納され
ている。
The process of dividing the document data registered in the database 3 will be described with reference to FIGS. The actual file 71 before division is, for example, as shown in FIG.
As shown in 9A, the image data A1, the tag 81, the image data A2, the tag 81, the image data A3, the tag 81, and the image data B1 are included. Further, the index file 70 before division stores information (for example, “1”, “2”, “4”, “3”) regarding the order of the bodies 86A to 86D as shown in FIG. 19B, for example. ing.

【0103】図19Aに示すアクチュアルファイル71
から画像データB1を分割する場合について、説明す
る。先ず、アクチュアルファイル71においては、図2
0Aに示されるように、画像データB1を削除すること
は行われない。そのため、アクチュアルファイル71で
は、高速に削除処理することができる。そして、インデ
ックスファイル70では、図20Bに示されるように、
削除される画像データB1に対応するボディ86Dに、
無効にされたことを示す情報、例えば記号「×」が設定
される。
The actual file 71 shown in FIG. 19A.
The case where the image data B1 is divided from will be described. First, in the actual file 71, as shown in FIG.
As shown in 0A, the image data B1 is not deleted. Therefore, the actual file 71 can be deleted at high speed. Then, in the index file 70, as shown in FIG. 20B,
In the body 86D corresponding to the image data B1 to be deleted,
Information indicating that it has been invalidated, for example, the symbol “x” is set.

【0104】また、アクチュアルファイル71の画像デ
ータB1は、図21Aに示すように、コピーされ、後部
にEOFが付されたアクチュアルファイル71とされ
る。また、図21Aに示すアクチュアルファイル71に
関連したインデックスファイル70が、図21Bに示す
ように、生成される。
Further, the image data B1 of the actual file 71 is copied as shown in FIG. 21A to be the actual file 71 having EOF added to the rear part thereof. Further, an index file 70 related to the actual file 71 shown in FIG. 21A is generated as shown in FIG. 21B.

【0105】図22は、文書の分割に伴うインデックス
ファイル70の一例の修正を示す。図22Aは、分割前
のインデックスファイル70の設定を示す。上述した分
割処理に伴い、インデックスファイル70が修正され、
図22Bに示すような設定とされる。以上のようにし
て、分割が完了する。
FIG. 22 shows an example of modification of the index file 70 accompanying the division of a document. FIG. 22A shows the setting of the index file 70 before division. The index file 70 is modified in accordance with the above-mentioned division processing,
The settings are as shown in FIG. 22B. The division is completed as described above.

【0106】従来の文書データ管理システムでは、検索
用のデータは、対象となる文書をOCR(Optical Chara
ctar Reader)により読み取り、電子データに変換するこ
とで作成されていた。しかしながら、OCRの精度によ
り、OCRで読み取られたデータが完全に認識できるこ
とは殆ど無く、検索用データが劣化していた。
In the conventional document data management system, the data to be searched is the OCR (Optical Chara
It was created by reading with ctar Reader) and converting it into electronic data. However, due to the accuracy of the OCR, the data read by the OCR is rarely completely recognizable, and the search data is deteriorated.

【0107】これに対して、この発明の実施の一形態に
よる文書データ管理システムでは、検索用のデータとし
て、印刷時に印刷データから直接的に抽出されたテキス
ト情報がそのまま用いられている。そのため、品質が劣
化すること無く検索用データを作成することが可能であ
るという利点がある。
On the other hand, in the document data management system according to the embodiment of the present invention, the text information directly extracted from the print data at the time of printing is directly used as the search data. Therefore, there is an advantage that the search data can be created without deteriorating the quality.

【0108】なお、仮想プリンタドライバおよびダイレ
クトコンバータは、それぞれを実行させるためのプログ
ラムファイルが例えばCD−ROMといった記録媒体に
記録されて供給される。仮想プリンタドライバおよびダ
イレクトコンバータを実行させるためのプログラムファ
イルが記録されたCD−ROMをクライアント4のCD
−ROMドライブ17に装填し、クライアント4に対し
て所定の操作を行うことで、仮想プリンタドライバおよ
びダイレクトコンバータを実行させるためのプログラム
ファイルがHDD16に所定に格納され、仮想プリンタ
ドライバおよびダイレクトコンバータがクライアント4
にインストールされる。HDD16からこれらのプログ
ラムファイルを読み出して、例えばRAM13上に展開
することで、CPU11により実行が可能な状態とされ
る。
The virtual printer driver and the direct converter are supplied with the program files for executing them recorded in a recording medium such as a CD-ROM. The CD-ROM in which the program file for executing the virtual printer driver and the direct converter is recorded is the CD of the client 4.
A program file for executing the virtual printer driver and the direct converter by loading the ROM drive 17 and performing a predetermined operation on the client 4 is stored in the HDD 16 in a predetermined manner, and the virtual printer driver and the direct converter are executed by the client. Four
Installed on. By reading out these program files from the HDD 16 and expanding them on the RAM 13, for example, the CPU 11 can be executed.

【0109】仮想プリンタドライバおよびダイレクトコ
ンバータは、それぞれ互いに異なる記録媒体上に記録さ
れて提供されるようにしてもよい。仮想プリンタドライ
バおよびダイレクトコンバータが記録される記録媒体
は、CD−ROMに限られず、FD(フレキシブルディ
スク)、MO(光磁気ディスク)など、クライアント4
が読み取り可能な記録媒体であれば、他の種類のもので
もよい。また、仮想プリンタドライバおよびダイレクト
コンバータは、ネットワーク1を介してクライアント4
に供給されるようにしてもよい。さらに、仮想プリンタ
ドライバおよびダイレクトコンバータは、サーバ2上で
動作するプログラムとし、クライアント4からサーバ2
に対して仮想プリンタドライバおよびダイレクトコンバ
ータの機能を呼び出して実行するようにもできる。
The virtual printer driver and the direct converter may be recorded on different recording media and provided. The recording medium in which the virtual printer driver and the direct converter are recorded is not limited to the CD-ROM, and the client 4 such as an FD (flexible disk) or MO (magneto-optical disk) can be used.
Other types of recording media may be used as long as they are readable recording media. In addition, the virtual printer driver and the direct converter are connected to the client 4 via the network 1.
May be supplied to. Further, the virtual printer driver and the direct converter are programs that run on the server 2, and the clients 4 to 2
It is also possible to call and execute the functions of the virtual printer driver and the direct converter.

【0110】なお、上述では、この文書データ管理シス
テムがネットワーク1を介した、サーバ2/クライアン
ト4、4、・・・間で構成されるように説明したが、こ
れはこの例に限定されない。スタンドアロンで稼働する
パーソナルコンピュータとしてのクライアント4に単独
で構成することができる。この場合には、データベース
3は、HDD16内に構成される。
In the above description, the document data management system is described as being configured between the servers 2 / clients 4, 4, ... Through the network 1, but this is not limited to this example. The client 4 as a personal computer that operates standalone can be independently configured. In this case, the database 3 is configured in the HDD 16.

【0111】また、上述では、GDI32によりラスタ
ライズ処理されたラスタデータを、仮想プリンタドライ
バにより画像データに変換しているが、これはこの例に
限られない。例えば、ラスタデータを画像データに変換
する処理は、他のプログラムにより行ってもよい。また
例えば、ラスタデータをRAM13やHDD16に一時
的に保存し、仮想プリンタドライバによる文書データの
全ページの印刷が終了してから、保存されたラスタデー
タを他のプログラムで一時にまとめて画像データに変換
することもできる。
Further, in the above description, the raster data rasterized by the GDI 32 is converted into the image data by the virtual printer driver, but this is not limited to this example. For example, the process of converting raster data into image data may be performed by another program. Further, for example, the raster data is temporarily stored in the RAM 13 or the HDD 16, and after the virtual printer driver finishes printing all the pages of the document data, the stored raster data is temporarily collected by another program into image data. It can also be converted.

【0112】[0112]

【発明の効果】以上説明したように、この発明は、文書
データを、印刷データ中のテキストデータを抽出しメモ
リに保存し、文書データがラスタライズされた画像デー
タをメモリに保存するようにされた仮想プリンタドライ
バを用いて印刷し、メモリに保存された画像データをデ
ータベースに登録すると共に、メモリに保存されたテキ
ストデータを当該文書データを全文検索する際のキーワ
ードとしてデータベースに登録するようにしている。そ
のため、テキストデータと画像データとを同一のデータ
ベースに登録する際に、キーワード登録の抜けや誤りが
生じることがないという効果がある。
As described above, according to the present invention, the text data in the print data is extracted from the document data and stored in the memory, and the image data in which the document data is rasterized is stored in the memory. Image data stored in the memory is printed in the database by using the virtual printer driver, and text data stored in the memory is registered in the database as a keyword for full-text search of the document data. . Therefore, when the text data and the image data are registered in the same database, there is an effect that a keyword registration omission or an error does not occur.

【0113】また、この発明の実施の一形態による文書
データ管理システムでは、検索用のデータとして、印刷
時に抽出されたテキスト情報がそのまま用いられている
ため、品質が劣化すること無く検索用データを作成する
ことが可能であるという利点がある。
Further, in the document data management system according to the embodiment of the present invention, since the text information extracted at the time of printing is used as it is as the search data, the search data can be stored without deterioration in quality. It has the advantage that it can be created.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の実施の一形態による文書データ管理
システムの一例の構成を概略的に示す略線図である。
FIG. 1 is a schematic diagram schematically showing a configuration of an example of a document data management system according to an embodiment of the present invention.

【図2】クライアントの一例の構成を示す略線図であ
る。
FIG. 2 is a schematic diagram illustrating a configuration of an example of a client.

【図3】クライアントでプリンタ装置に対して印刷を指
示する際の概略的なアーキテクチ図である。
FIG. 3 is a schematic architecture diagram when a client instructs a printer to perform printing.

【図4】この実施の一形態による仮想プリンタドライバ
での一例の印刷処理を示すフローチャートである。
FIG. 4 is a flowchart showing an example of print processing by the virtual printer driver according to the embodiment.

【図5】ダイレクトコンバータの一例の画面表示を示す
略線図である。
FIG. 5 is a schematic diagram showing a screen display of an example of a direct converter.

【図6】文書データが管理される一例のディレクトリ構
造を示す略線図である。
FIG. 6 is a schematic diagram showing an example directory structure in which document data is managed.

【図7】文書ディレクトリに格納されるファイルの例を
示す略線図である。
FIG. 7 is a schematic diagram illustrating an example of files stored in a document directory.

【図8】アクチュアルファイルおよびインデックスファ
イルの構成例を示す略線図である。
FIG. 8 is a schematic diagram illustrating a configuration example of an actual file and an index file.

【図9】インデックスファイルの一例のデータフォーマ
ットを示す略線図である。
FIG. 9 is a schematic diagram showing a data format of an example of an index file.

【図10】タグファイルにおけるタグを説明するための
図である。
FIG. 10 is a diagram for explaining tags in a tag file.

【図11】タグファイルの一例のデータ構成を示す略線
図である。
FIG. 11 is a schematic diagram showing a data structure of an example of a tag file.

【図12】登録された文書データに文書の1ページとし
ての画像データを追加する処理を説明するための図であ
る。
FIG. 12 is a diagram illustrating a process of adding image data as one page of a document to registered document data.

【図13】登録された文書データに文書の1ページとし
ての画像データを追加する処理を説明するための図であ
る。
FIG. 13 is a diagram illustrating a process of adding image data as one page of a document to registered document data.

【図14】登録された文書データに文書の1ページとし
ての画像データを追加する処理を説明するための図であ
る。
FIG. 14 is a diagram illustrating a process of adding image data as one page of a document to registered document data.

【図15】画像データの追加に伴うインデックスファイ
ルの一例の修正を示す略線図である。
FIG. 15 is a schematic diagram illustrating modification of an example of an index file accompanying addition of image data.

【図16】登録された文書データから文書の1ページと
しての画像データを削除する処理を説明するための図で
ある。
FIG. 16 is a diagram illustrating a process of deleting image data as one page of a document from registered document data.

【図17】登録された文書データから文書の1ページと
しての画像データを削除する処理を説明するための図で
ある。
FIG. 17 is a diagram illustrating a process of deleting image data as one page of a document from registered document data.

【図18】画像データの削除に伴うインデックスファイ
ルの一例の修正を示す略線図である。
FIG. 18 is a schematic diagram showing modification of an example of an index file accompanying deletion of image data.

【図19】登録された文書データを分割する処理を説明
するための図である。
FIG. 19 is a diagram illustrating a process of dividing registered document data.

【図20】登録された文書データを分割する処理を説明
するための図である。
FIG. 20 is a diagram illustrating a process of dividing registered document data.

【図21】登録された文書データを分割する処理を説明
するための図である。
FIG. 21 is a diagram for explaining a process of dividing registered document data.

【図22】文書の分割に伴うインデックスファイルの一
例の修正を示す略線図である。
FIG. 22 is a schematic diagram showing modification of an example of an index file accompanying document division.

【符号の説明】[Explanation of symbols]

1・・・ネットワーク、2・・・サーバ、3・・・デー
タベース、4・・・クライアント、11・・・CPU、
13・・・RAM、16・・・HDD、21・・・通信
インターフェイス、30・・・アプリケーション、31
・・・API、32・・・GDI、33・・・プリンタ
ドライバ、40・・・ダイレクトコンバータ画面、50
・・・文書グループディレクトリ、53・・・第1文書
ディレクトリ、59・・・全文検索用インデックス保存
ディレクトリ、70・・・インデックスファイル、71
・・・アクチュアルファイル、73・・・タグファイル
1 ... Network, 2 ... Server, 3 ... Database, 4 ... Client, 11 ... CPU,
13 ... RAM, 16 ... HDD, 21 ... Communication interface, 30 ... Application, 31
... API, 32 ... GDI, 33 ... Printer driver, 40 ... Direct converter screen, 50
... Document group directory, 53 ... First document directory, 59 ... Full text search index storage directory, 70 ... Index file, 71
... Actual file, 73 ... Tag file

───────────────────────────────────────────────────── フロントページの続き (72)発明者 竹内 雅幸 東京都品川区北品川4丁目7番35号 ソニ ーインフォメーションシステムソリューシ ョンズ株式会社内 (72)発明者 鬼頭 信一 東京都品川区北品川4丁目7番35号 ソニ ーインフォメーションシステムソリューシ ョンズ株式会社内 (72)発明者 吉野 毅 東京都品川区北品川4丁目7番35号 ソニ ーインフォメーションシステムソリューシ ョンズ株式会社内 (72)発明者 泉澤 秀雄 東京都台東区北上野1丁目10番地14号 住 友上野ビル5号館 株式会社インターコム 内 (72)発明者 杉浦 雅巳 東京都品川区南大井6丁目27番地28号 小 林ビル4F 株式会社ピー・アンド・ピー ソフトウェア内 Fターム(参考) 5B021 AA01 CC06 CC07 DD00 5B075 ND06 NK06 NK13 UU06 5C073 AB01 AB07 AB11    ─────────────────────────────────────────────────── ─── Continued front page    (72) Inventor Masayuki Takeuchi             4-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Soni             -Information system solution             Within the corporation (72) Inventor Shinichi Kitou             4-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Soni             -Information system solution             Within the corporation (72) Inventor Takeshi Yoshino             4-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Soni             -Information system solution             Within the corporation (72) Inventor Hideo Izumisawa             1-10-10 Kita-Ueno, Taito-ku, Tokyo             Tomo Ueno Building No. 5 Intercom Co., Ltd.             Within (72) Inventor Masami Sugiura             6 27-28 Minamioi, Shinagawa-ku, Tokyo Small             Hayashi Building 4F P & P Co., Ltd.             In software F-term (reference) 5B021 AA01 CC06 CC07 DD00                 5B075 ND06 NK06 NK13 UU06                 5C073 AB01 AB07 AB11

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 文書データを画像データに変換してデー
タベースに登録するデータ登録装置において、 文書データがオペレーションシステムの印刷制御部によ
り印刷可能なようにページ単位でラスタライズ処理され
たラスタデータを所定のフォーマットによる画像データ
に変換する変換手段と、 上記印刷制御部から印刷データとして渡されたテキスト
データを保持するようにされたプリンタドライバと、 上記変換手段により上記変換された上記画像データと、
上記プリンタドライバにより上記保持された上記テキス
トデータとを対応付けてデータベースに登録する登録手
段とを有することを特徴とするデータ登録装置。
1. A data registration device for converting document data into image data and registering it in a database, wherein predetermined raster data is rasterized in page units so that the document data can be printed by a print control unit of an operation system. Conversion means for converting into image data according to a format, a printer driver adapted to hold the text data passed as print data from the print control section, the image data converted by the conversion means,
A data registration device, comprising: a registration unit configured to register the text data held by the printer driver in the database in association with each other.
【請求項2】 請求項1に記載のデータ登録装置におい
て、 上記テキストデータは、上記文書データを検索する際の
キーワードとして上記データベースに登録されることを
特徴とするデータ登録装置。
2. The data registration device according to claim 1, wherein the text data is registered in the database as a keyword when searching the document data.
【請求項3】 請求項1に記載のデータ登録装置におい
て、 上記変換手段は、上記プリンタドライバに含まれること
を特徴とするデータ登録装置。
3. The data registration device according to claim 1, wherein the conversion unit is included in the printer driver.
【請求項4】 文書データを画像データに変換してデー
タベースに登録するデータ登録方法において、 文書データがオペレーションシステムの印刷制御部によ
り印刷可能なようにページ単位でラスタライズ処理され
たラスタデータを所定のフォーマットによる画像データ
に変換する変換のステップと、 上記印刷制御部から印刷データとして渡されたテキスト
データを、プリンタドライバにより保持するステップ
と、 上記変換のステップにより上記変換された上記画像デー
タと、上記プリンタドライバにより上記保持された上記
テキストデータとを対応付けてデータベースに登録する
登録のステップとを有することを特徴とするデータ登録
方法。
4. A data registration method for converting document data into image data and registering the same in a database, wherein rasterized data is rasterized in page units so that the document data can be printed by a print control unit of the operation system. A step of converting into image data according to a format; a step of holding the text data passed as print data from the print control unit by a printer driver; the image data converted above by the conversion step; And a registration step of registering the stored text data in the database in association with each other by the printer driver.
【請求項5】 文書データを画像データに変換してデー
タベースに登録するデータ登録方法をコンピュータ装置
に実行させるデータ登録プログラムにおいて、 文書データがオペレーションシステムの印刷制御部によ
り印刷可能なようにページ単位でラスタライズ処理され
たラスタデータを所定のフォーマットによる画像データ
に変換する変換のステップと、 上記印刷制御部から印刷データとして渡されたテキスト
データを、プリンタドライバにより保持するステップ
と、 上記変換のステップにより上記変換された上記画像デー
タと、上記プリンタドライバにより上記保持された上記
テキストデータとを対応付けてデータベースに登録する
登録のステップとをコンピュータ装置に実行させること
を特徴とするデータ登録プログラム。
5. A data registration program for causing a computer to execute a data registration method of converting document data into image data and registering the image data in a database, in a page unit so that the document data can be printed by a print control unit of the operation system. The conversion step of converting the rasterized raster data into image data in a predetermined format, the step of holding the text data passed as print data from the print control unit by the printer driver, and the step of conversion described above. A data registration program for causing a computer to execute a registration step of registering the converted image data and the text data held by the printer driver in the database in association with each other.
【請求項6】 文書データを画像データに変換してデー
タベースに登録するデータ登録方法をコンピュータ装置
に実行させるデータ登録プログラムが記録された記録媒
体において、 文書データがオペレーションシステムの印刷制御部によ
り印刷可能なようにページ単位でラスタライズ処理され
たラスタデータを所定のフォーマットによる画像データ
に変換する変換のステップと、 上記印刷制御部から印刷データとして渡されたテキスト
データを、プリンタドライバにより保持するステップ
と、 上記変換のステップにより上記変換された上記画像デー
タと、上記プリンタドライバにより上記保持された上記
テキストデータとを対応付けてデータベースに登録する
登録のステップとをコンピュータ装置に実行させるデー
タ登録プログラムが記録されたことを特徴とする記録媒
体。
6. A recording medium having a data registration program for causing a computer apparatus to execute a data registration method of converting document data into image data and registering the image data in a database, the document data being printable by a print control unit of the operation system. A step of converting the raster data rasterized in page units into image data in a predetermined format; a step of holding the text data passed as print data from the print control unit by the printer driver; A data registration program is recorded which causes a computer device to execute a registration step of registering the image data converted by the conversion step and the text data held by the printer driver in the database in association with each other. A recording medium characterized in that
JP2002114349A 2002-04-17 2002-04-17 Device, method and program for registering data, and recording medium Pending JP2003308325A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002114349A JP2003308325A (en) 2002-04-17 2002-04-17 Device, method and program for registering data, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002114349A JP2003308325A (en) 2002-04-17 2002-04-17 Device, method and program for registering data, and recording medium

Publications (1)

Publication Number Publication Date
JP2003308325A true JP2003308325A (en) 2003-10-31

Family

ID=29396196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002114349A Pending JP2003308325A (en) 2002-04-17 2002-04-17 Device, method and program for registering data, and recording medium

Country Status (1)

Country Link
JP (1) JP2003308325A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006129676A1 (en) 2005-05-31 2006-12-07 Science Park Corporation Monitoring method, monitoring system, system program, and recording medium containing the program
JP2009245061A (en) * 2008-03-31 2009-10-22 Mars Flag Corp Retrieval server and computer program
JP2012181747A (en) * 2011-03-02 2012-09-20 Jetrun Technology Corp Table-of-content generation system for electronic book
US9063674B2 (en) 2011-11-08 2015-06-23 Seiko Epson Corporation Image registration method, recording medium, and data processing device

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006129676A1 (en) 2005-05-31 2006-12-07 Science Park Corporation Monitoring method, monitoring system, system program, and recording medium containing the program
US7945917B2 (en) 2005-05-31 2011-05-17 Science Park Corporation Monitoring method, monitoring system, system program and recording medium having program recorded thereon
JP4911530B2 (en) * 2005-05-31 2012-04-04 サイエンスパーク株式会社 Surveillance system, system program, and recording medium recording the program
JP2009245061A (en) * 2008-03-31 2009-10-22 Mars Flag Corp Retrieval server and computer program
JP2012181747A (en) * 2011-03-02 2012-09-20 Jetrun Technology Corp Table-of-content generation system for electronic book
US9063674B2 (en) 2011-11-08 2015-06-23 Seiko Epson Corporation Image registration method, recording medium, and data processing device

Similar Documents

Publication Publication Date Title
US7930292B2 (en) Information processing apparatus and control method thereof
US5771380A (en) Method for information retrieval with scaled down images
US20180241894A1 (en) Image processing apparatus, control method therefor, and control program therefor
US8326090B2 (en) Search apparatus and search method
US7603618B2 (en) Document processing apparatus, control method therefor, and computer program
US8456654B2 (en) Process for electronic document redaction
US7379950B2 (en) Document processing method, program and apparatus for processing a document file in pages
US8456662B2 (en) Control for display of multiple versions of a printable document for locked print
US8300245B2 (en) Device to edit documents for printout and method thereof
JP2010170568A (en) Information storage and retrieval system for storing and retrieving visual form of information from application in database
US8176025B2 (en) Information processing apparatus for storing documents with partial images
US7761433B2 (en) Document processing apparatus, method and program
JP2007200320A (en) Method and system for accessing file system
JP3832978B2 (en) Print control apparatus and print control method
US7203898B2 (en) Document processing method and apparatus
US20020067502A1 (en) Methods for digitally printing composite documents
JP2001337994A (en) Thumbnail display system and method and recording medium with processing program therefor recorded therein
JPH11143661A (en) Printing system
JP2003308325A (en) Device, method and program for registering data, and recording medium
JP2006331274A (en) Network document management system, control method for it, and storage medium
JP2001078018A (en) Data editing device
JP2001256256A (en) Device and method for retrieving electronic document
JPH10240724A (en) Document managing device and system and method therefor
JP2003036260A (en) Data management system, control method thereof, program, and storage medium
JPH11259458A (en) Document processor