JP2001297104A - Data storage device and method and storage medium - Google Patents

Data storage device and method and storage medium

Info

Publication number
JP2001297104A
JP2001297104A JP2000109817A JP2000109817A JP2001297104A JP 2001297104 A JP2001297104 A JP 2001297104A JP 2000109817 A JP2000109817 A JP 2000109817A JP 2000109817 A JP2000109817 A JP 2000109817A JP 2001297104 A JP2001297104 A JP 2001297104A
Authority
JP
Japan
Prior art keywords
file
data
data file
information
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000109817A
Other languages
Japanese (ja)
Inventor
Makoto Takaoka
真琴 高岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000109817A priority Critical patent/JP2001297104A/en
Publication of JP2001297104A publication Critical patent/JP2001297104A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide data storage device and method and a storage medium by which high retrieving efficiency can be assured over a long time and overlapped registration is easily evaded at reregistration after retrieval/correction. SOLUTION: Retrieving information to be a key for retrieving a data file after registration is prepared on the basis of the data file 101 to be registered, dropped into a certain file format of a container document 109 described by an XML and collectively managed by the document 109. The data file 101 is built in by a test format, document image data 105 are built in by encoding image compression data and text information 107 is built in by the text format as it is. Layout information 106 is built in as it is in the case of the text format, and in the case of the data format, the information 106 is encoded and built in. In retrieval, index information 108 is added to the container document 109 for managing the retrieved data file 101 and provided.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術の分野】本発明は、アプリケーショ
ンで作成する等により得た電子文書等のデータファイル
をコンピュータ等の記憶装置にデータベース化して登
録、保管するデータ保管装置、方法及び記憶媒体に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data storage device, a method, and a storage medium for registering and storing a data file such as an electronic document obtained by creating an application in a database such as a computer in a database.

【0002】[0002]

【従来の技術】従来、ワープロソフト等のアプリケーシ
ョンで作成したり、外部から受信したりして得た電子文
書等のデータファイル(ドキュメント)をデータベース
化してサーバコンピュータの記憶装置等に登録、保管す
るデータ保管装置が知られている。アプリケーションは
多数あり、フォーマットも各社各様であるので、データ
ファイルの保管時には検索時の便宜を考慮した工夫がな
されている。
2. Description of the Related Art Conventionally, a data file (document) such as an electronic document created by an application such as word processing software or received from an external device is converted into a database and registered and stored in a storage device of a server computer. Data storage devices are known. There are many applications and formats of each company. Therefore, when storing data files, a device has been devised in consideration of convenience at the time of retrieval.

【0003】図10は、従来の第1のデータ保管装置に
おけるデータファイルの保管の手順を示す図である。
FIG. 10 is a diagram showing a procedure for storing a data file in a first conventional data storage device.

【0004】A社のワープロソフトで作成した電子ドキ
ュメントであるデータファイル100がオリジナルとし
て所定のフォルダに保管されると共に、そのインデック
ス情報202がインデックスファイルに記録される。イ
ンデックス情報202は、インデックス登録処理(ステ
ップS201)により付加される情報であり、各データ
ファイルのキーワード、作成者、保管日時等で構成され
る。
A data file 100, which is an electronic document created by word processing software of Company A, is stored as an original in a predetermined folder, and index information 202 thereof is recorded in the index file. The index information 202 is information added by the index registration process (step S201), and includes a keyword, a creator, a storage date and time, and the like of each data file.

【0005】図11は、従来の第1のデータ保管装置に
おける複数種類のデータファイルの保管の手順を示す図
である。データファイルには、A社のワープロソフトで
作成したもののほか、例えばB社のワープロソフトで作
成した文書データやC社のドローソフトでグラフィック
スを描いた画像データ、D社のCADソフトで作成した
CADデータ、ファクシミリにより受信して得たファク
シミリデータ等、各種フォーマットのデータファイルが
ある。従来のデータ保管装置では、データファイルの内
容にかかわらず、上記インデックス情報202を各デー
タファイルから抽出またはユーザによる入力によりイン
デックスファイルに登録するようにしていた。この装置
において、保管したデータファイルを検索する場合は、
インデックス情報を手がかりに所望のデータファイルを
検索するようにしていた。
FIG. 11 is a diagram showing a procedure for storing a plurality of types of data files in a first conventional data storage device. In addition to the data files created by the company A's word processing software, the data files include document data created by the company B's word processing software, image data drawn with graphics by the company C's drawing software, and data created by the company's CAD software. There are various formats of data files such as CAD data and facsimile data received and received by facsimile. In the conventional data storage device, the index information 202 is extracted from each data file or registered in the index file by input by a user, regardless of the contents of the data file. When searching stored data files on this device,
A desired data file is searched based on the index information.

【0006】このような保管の手法では、保管されるデ
ータファイルが大量になるとインデックス情報の内容の
重要性が高くなり、より詳細な分類が可能なように項目
数は多い方が望ましい。しかしその一方、インデックス
情報202の作成はユーザが介在することが多く、全デ
ータファイルについてキーワード等のインデックス情報
を詳細に付加する作業は繁雑である。このような事情か
ら、文書全体を検索の対象とする全文検索手法が従来取
られるようになってきた。
In such a storage method, when the number of data files to be stored becomes large, the importance of the contents of the index information increases, and it is desirable that the number of items is large so that more detailed classification is possible. However, on the other hand, creation of the index information 202 is often performed by a user, and the work of adding index information such as keywords in detail to all data files is complicated. Under such circumstances, a full-text search method for searching the entire document has been conventionally used.

【0007】図12は、従来の第2のデータ保管装置に
おけるデータファイルの保管の手順を示す図である。図
13は、従来の第2のデータ保管装置における複数種類
のデータファイルの保管の手順を示す図である。
FIG. 12 is a diagram showing a procedure for storing a data file in the second conventional data storage device. FIG. 13 is a diagram showing a procedure for storing a plurality of types of data files in the second conventional data storage device.

【0008】各社固有のドキュメントフォーマットのま
ま登録しただけでは、全種のフォーマットに対応しなけ
ればならず、処理が困難である。そこで、図12に示す
共通文書フォーマット処理(ステップS301)により
各種フォーマットからプレーンテキストを抽出し、共通
文書303として登録するようにしている。従って、オ
リジナルのデータファイル100と、インデックス登録
処理(ステップS302)を経て得たインデックス情報
304のほかに、さらにプレーンテキストである共通文
書303が登録される。
[0008] Simply registering a document format unique to each company has to deal with all kinds of formats, and it is difficult to process. Therefore, plain text is extracted from various formats by the common document format process (step S301) shown in FIG. Therefore, in addition to the original data file 100 and the index information 304 obtained through the index registration process (step S302), a plain text common document 303 is further registered.

【0009】図13に示すように、データファイルが複
数種類存在する場合でも、プレーンテキストの抽出は各
データファイル毎に行われ、各データファイル毎にオリ
ジナルのデータファイル100、インデックス情報30
4、及び共通文書303が登録される。これにより、デ
ータファイルが大量となっても全文検索により検索が可
能になる。
As shown in FIG. 13, even when there are a plurality of types of data files, plain text is extracted for each data file, and the original data file 100 and index information 30 are extracted for each data file.
4 and the common document 303 are registered. As a result, even if the data file becomes large, a search can be performed by full-text search.

【0010】[0010]

【発明が解決しようとする課題】しかしながら、上記従
来の第2のデータ保管装置であっても、次の問題があっ
た。
However, the above-mentioned conventional second data storage apparatus has the following problems.

【0011】まず、アプリケーションの動作環境は変遷
するため、保管時には流通しているソフトウェアであっ
ても検索時(例えば10年後)には動作環境がなくな
り、データファイルを開けない可能性がある。しかも、
画像データ等は共通文書303による全文検索では検索
すらできない可能性もある。
First, since the operating environment of the application changes, there is a possibility that even if the software is distributed at the time of storage, the operating environment is lost at the time of searching (for example, 10 years later), and there is a possibility that the data file cannot be opened. Moreover,
Image data and the like may not even be able to be searched by full-text search using the common document 303.

【0012】また、保管されるデータファイルが大量に
なると、インデックス検索や全文検索のみでは簡易迅速
な検索ができない可能性がある。
When a large number of data files are stored, there is a possibility that simple and quick search cannot be performed only by index search or full-text search.

【0013】さらに、従来の保管装置では、再保管時の
便宜を考慮していないため、データファイルを検索して
取り出した後、修正等して再保管する際、新規登録とす
ると、インデックスファイルや共通文書は残存したまま
となり、修正前のデータファイルと共に重複登録となる
状況が生じやすい。
Further, in the conventional storage device, since the convenience at the time of re-storage is not taken into consideration, when the data file is searched and taken out, and then modified and stored again, when the data file is newly registered, the index file or the The common document remains, and a situation is likely to occur in which the common document is duplicately registered together with the data file before correction.

【0014】特に、近年、個人ベースで単にファイリン
グをするだけでなく、業務上複数の者が後日利用できる
ようにデータファイルを長期に亘り保管、管理し、検索
性、可読性を保証することの重要性が増している。例え
ば、ある人がアイデアを記述した文書を作成し、個人レ
ベルで保管しているだけでは、数年後に裁判等による調
査の必要が生じたとき、その文書の存在や内容が保証さ
れない。従って、長期に亘って内容の可読性、検索性を
維持するような保管手法が要請される。しかもデータフ
ァイルは将来更新される場合もあるので、更新の処理の
円滑化をも考慮したものでなければならない。
In particular, in recent years, it is important not only to file files on an individual basis, but also to store and manage data files for a long period of time so that a plurality of persons can use the files at a later date, and to ensure searchability and readability. Sex is increasing. For example, if a person creates a document describing an idea and keeps it at an individual level, the existence and content of the document cannot be guaranteed when a need arises for an investigation by a trial several years later. Therefore, there is a demand for a storage method that maintains the readability and searchability of the contents over a long period of time. Moreover, since the data file may be updated in the future, it is necessary to consider the smoothness of the update process.

【0015】本発明は上記従来技術の問題を解決するた
めになされたものであり、その目的は、長期に亘って良
好な検索性を保証すると共に、検索、修正後の再登録時
において重複登録を容易に回避することができるデータ
保管装置、方法及び記憶媒体を提供することにある。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems of the prior art, and it is an object of the present invention to ensure good searchability over a long period of time, and to perform duplicate registration when re-registering after searching and correcting. It is an object of the present invention to provide a data storage device, a method and a storage medium which can easily avoid the problem.

【0016】[0016]

【課題を解決するための手段】上記目的を達成するため
に本発明の請求項1のデータ保管装置は、データファイ
ルをデータベースに登録して保管するデータ保管装置に
おいて、前記データファイルを検索するための検索情報
を該データファイルに基づいて複数種類作成する検索情
報作成手段と、該検索情報作成手段により作成された複
数種類の検索情報を前記データファイルと対応付けて該
データファイルと共に前記データベースに登録する登録
手段とを備えたことを特徴とする。
According to a first aspect of the present invention, there is provided a data storage apparatus for registering and storing a data file in a database. Search information creating means for creating a plurality of types of search information based on the data file; and registering the plurality of types of search information created by the search information creation means with the data file in the database together with the data file. And registration means for performing the registration.

【0017】同じ目的を達成するために本発明の請求項
2のデータ保管装置は、上記請求項1記載の構成におい
て、前記登録手段は、前記データファイルに対応する管
理文書ファイルを作成し、前記複数種類の検索情報の各
々を規定するための規定情報を前記管理文書ファイル内
に記述し、該管理文書ファイルを前記データファイル及
び前記複数種類の検索情報と共に前記データベースに登
録することを特徴とする。
According to a second aspect of the present invention, there is provided a data storage device according to the first aspect, wherein the registration means creates a management document file corresponding to the data file, Specifying information for specifying each of a plurality of types of search information in the management document file, and registering the management document file in the database together with the data file and the plurality of types of search information. .

【0018】同じ目的を達成するために本発明の請求項
3のデータ保管装置は、上記請求項1記載の構成におい
て、前記登録手段は、前記データファイルに対応する管
理文書ファイルを作成し、前記複数種類の検索情報の各
々を規定するための規定情報を前記管理文書ファイル内
に記述すると共に前記データファイル及び前記複数種類
の検索情報を該管理文書ファイルに組み込み、該管理文
書ファイルを前記データベースに登録することを特徴と
する。
According to a third aspect of the present invention, there is provided a data storage apparatus according to the first aspect, wherein the registration means creates a management document file corresponding to the data file, The definition information for defining each of a plurality of types of search information is described in the management document file, the data file and the plurality of types of search information are incorporated in the management document file, and the management document file is stored in the database. It is characterized by registering.

【0019】同じ目的を達成するために本発明の請求項
4のデータ保管装置は、上記請求項2記載の構成におい
て、前記検索情報に基づいてデータファイルを検索する
検索手段を備え、前記登録手段は、前記管理文書ファイ
ルを特定するための管理情報を該管理文書ファイルと共
に登録し、前記検索手段は、前記検索情報に基づいて検
索されたデータファイルに対応する管理文書ファイルに
前記管理情報を付加して該管理文書ファイル、前記検索
されたデータファイル及び対応する検索情報をユーザに
提供することを特徴とする。
In order to achieve the same object, a data storage device according to a fourth aspect of the present invention, in the configuration according to the second aspect, further comprises a search means for searching for a data file based on the search information, and the registration means Registers management information for specifying the management document file together with the management document file, and the search means adds the management information to a management document file corresponding to the data file searched based on the search information. And providing the user with the management document file, the searched data file, and the corresponding search information.

【0020】同じ目的を達成するために本発明の請求項
5のデータ保管装置は、上記請求項3記載の構成におい
て、前記検索情報に基づいてデータファイルを検索する
検索手段を備え、前記登録手段は、前記管理文書ファイ
ルを特定するための管理情報を該管理文書ファイルと共
に登録し、前記検索手段は、前記検索情報に基づいて検
索されたデータファイルが組み込まれている管理文書フ
ァイルに前記管理情報を付加して該管理文書ファイルを
ユーザに提供することを特徴とする。
In order to achieve the same object, a data storage device according to a fifth aspect of the present invention, in the configuration according to the third aspect, includes a search unit for searching a data file based on the search information, Registers the management information for specifying the management document file together with the management document file, and the search means stores the management information in a management document file in which the data file searched based on the search information is incorporated. And providing the management document file to the user.

【0021】同じ目的を達成するために本発明の請求項
6のデータ保管装置は、上記請求項2〜5のいずれか1
項に記載の構成において、前記規定情報は、前記複数種
類の検索情報の各々が保管されているアドレスであるこ
とを特徴とする。
To achieve the same object, a data storage device according to claim 6 of the present invention provides a data storage device according to any one of claims 2 to 5 above.
In the configuration described in the paragraph, the specification information is an address where each of the plurality of types of search information is stored.

【0022】同じ目的を達成するために本発明の請求項
7のデータ保管装置は、上記請求項6記載の構成におい
て、再登録手段を備え、該再登録手段は、前記検索手段
により検索された後に修正されたデータファイルを再登
録する際、元のデータファイルの保管アドレスの記述を
前記修正されたデータファイルが新たに保管される保管
アドレスに書き換えることを特徴とする。
To achieve the same object, a data storage device according to claim 7 of the present invention, in the configuration according to claim 6, further comprises a re-registration unit, and the re-registration unit is searched by the search unit. When re-registering the corrected data file later, the description of the storage address of the original data file is rewritten to a storage address at which the corrected data file is newly stored.

【0023】同じ目的を達成するために本発明の請求項
8のデータ保管装置は、上記請求項7記載の構成におい
て、前記再登録手段は、前記管理情報に基づいて前記デ
ータベースに登録されている元のデータファイルを検索
し、該検索した元のデータファイルを削除することを特
徴とする。
In order to achieve the same object, a data storage device according to claim 8 of the present invention, in the configuration according to claim 7, wherein the re-registration means is registered in the database based on the management information. An original data file is searched, and the searched original data file is deleted.

【0024】同じ目的を達成するために本発明の請求項
9のデータ保管装置は、上記請求項4記載の構成におい
て、再登録手段を備え、該再登録手段は、前記検索手段
により検索された後に修正されたデータファイルを再登
録する際、前記管理情報に基づいて前記データベースに
登録されている元のデータファイルを検索し、該検索し
た元のデータファイルを前記修正されたデータファイル
に書き換えることを特徴とする。
According to a ninth aspect of the present invention, in order to achieve the same object, the data archiving apparatus further comprises a re-registration unit, wherein the re-registration unit is searched by the search unit. When re-registering the corrected data file later, search the original data file registered in the database based on the management information, and rewrite the searched original data file with the corrected data file. It is characterized by.

【0025】同じ目的を達成するために本発明の請求項
10のデータ保管装置は、上記請求項4記載の構成にお
いて、再登録手段を備え、該再登録手段は、前記検索手
段により検索された後に修正されたデータファイルを再
登録する際、該修正されたデータファイルに基づいて複
数種類の検索情報を新たに作成し、前記管理情報に基づ
いて前記データベースに登録されている元の検索情報を
検索し、該検索した元の検索情報を前記新たに作成した
検索情報に書き換えることを特徴とする。
According to a tenth aspect of the present invention, there is provided a data storage apparatus according to the fourth aspect of the present invention, further comprising a re-registration unit, wherein the re-registration unit is searched by the search unit. When re-registering the corrected data file later, a plurality of types of search information are newly created based on the corrected data file, and the original search information registered in the database is created based on the management information. Searching, and rewriting the searched original search information with the newly created search information.

【0026】同じ目的を達成するために本発明の請求項
11のデータ保管装置は、上記請求項5記載の構成にお
いて、再登録手段を備え、該再登録手段は、前記検索手
段により検索された後に修正されたデータファイルを再
登録する際、前記管理情報に基づいて前記提供された管
理文書ファイルに組み込まれている元のデータファイル
を検索し、該検索した元のデータファイルを前記修正さ
れたデータファイルに書き換え、該管理文書ファイルを
前記データベースに再登録することを特徴とする。
In order to achieve the same object, a data storage apparatus according to claim 11 of the present invention, in the configuration according to claim 5, further comprises a re-registration unit, and the re-registration unit is searched by the search unit. When re-registering the corrected data file later, the original data file incorporated in the provided management document file is searched based on the management information, and the searched original data file is corrected. It is characterized in that the management document file is re-registered in the database by rewriting to a data file.

【0027】同じ目的を達成するために本発明の請求項
12のデータ保管装置は、上記請求項5記載の構成にお
いて、再登録手段を備え、該再登録手段は、前記検索手
段により検索された後に修正されたデータファイルを再
登録する際、該修正されたデータファイルに基づいて複
数種類の検索情報を新たに作成し、前記管理情報に基づ
いて前記提供された管理文書ファイルに組み込まれてい
る元の検索情報を検索し、該検索した元の検索情報を前
記新たに作成した検索情報に書き換え、該管理文書ファ
イルを前記データベースに再登録することを特徴とす
る。
According to a twelfth aspect of the present invention, in order to achieve the same object, the data archiving apparatus further comprises a re-registration unit, wherein the re-registration unit is searched by the search unit. When re-registering the corrected data file later, a plurality of types of search information are newly created based on the corrected data file, and are incorporated in the provided management document file based on the management information. The original search information is searched, the searched original search information is rewritten with the newly created search information, and the management document file is re-registered in the database.

【0028】同じ目的を達成するために本発明の請求項
13のデータ保管装置は、上記請求項1〜12のいずれ
か1項に記載の構成において、前記複数種類の検索情報
には、前記データファイルを文書画像化した画像デー
タ、前記データファイルから抽出したテキストデータ、
及び前記データファイルのレイアウト情報の少なくとも
一つが含まれることを特徴とする。
According to a thirteenth aspect of the present invention, in order to achieve the same object, in the data storage device according to the first aspect, the plurality of types of search information include Image data obtained by converting a file into a document image, text data extracted from the data file,
And at least one of the layout information of the data file.

【0029】同じ目的を達成するために本発明の請求項
14のデータ保管装置は、上記請求項13記載の構成に
おいて、前記画像データは、画像化後に読み取り可能な
範囲内の低解像度で前記データファイルを画像化して得
られることを特徴とする。
In order to achieve the same object, a data storage device according to a fourteenth aspect of the present invention is the data storage device according to the thirteenth aspect, wherein the image data has a low resolution within a readable range after imaging. It is characterized by being obtained by imaging a file.

【0030】同じ目的を達成するために本発明の請求項
15のデータ保管装置は、上記請求項13または14記
載の構成において、前記テキストデータは、前記データ
ファイルから直接抽出して得られることを特徴とする。
In order to achieve the same object, a data storage device according to claim 15 of the present invention is characterized in that, in the configuration according to claim 13 or 14, the text data is obtained by directly extracting from the data file. Features.

【0031】同じ目的を達成するために本発明の請求項
16のデータ保管装置は、上記請求項13または14記
載の構成において、前記検索情報作成手段は、文字認識
手段及びレイアウト解析手段を備え、前記テキストデー
タは、レイアウト解析によりテキスト領域と認識された
領域に対して文字認識処理を行うことにより得られるこ
とを特徴とする。
In order to achieve the same object, a data storage device according to claim 16 of the present invention, in the configuration according to claim 13 or 14, wherein the search information creating means includes a character recognition means and a layout analysis means, The text data is obtained by performing character recognition processing on an area recognized as a text area by layout analysis.

【0032】同じ目的を達成するために本発明の請求項
17のデータ保管装置は、上記請求項13〜16のいず
れか1項に記載の構成において、前記検索情報作成手段
は、レイアウト解析手段を備え、前記レイアウト情報
は、前記データファイルを文書画像化した画像データに
対してレイアウト解析を行うことにより得られることを
特徴とする。
In order to achieve the same object, a data storage device according to claim 17 of the present invention is the data storage device according to any one of claims 13 to 16, wherein the search information creation means includes a layout analysis means. Wherein the layout information is obtained by performing a layout analysis on image data obtained by converting the data file into a document image.

【0033】同じ目的を達成するために本発明の請求項
18のデータ保管装置は、上記請求項13〜17のいず
れか1項に記載の構成において、前記登録手段は、前記
画像データの作成及び前記データベースへの登録を、ユ
ーザの所望により前記データファイルの登録処理がなさ
れた後に行うことを特徴とする。
In order to achieve the same object, a data storage device according to claim 18 of the present invention is the data storage device according to any one of claims 13 to 17, wherein the registration unit is configured to generate and store the image data. The registration in the database is performed after the registration processing of the data file is performed as desired by the user.

【0034】同じ目的を達成するために本発明の請求項
19のデータ保管方法は、データファイルをデータベー
スに登録して保管するデータ保管方法において、前記デ
ータファイルを検索するための検索情報を該データファ
イルに基づいて複数種類作成する検索情報作成工程と、
該検索情報作成工程により作成された複数種類の検索情
報を前記データファイルと対応付けて該データファイル
と共に前記データベースに登録する登録工程とを含むこ
とを特徴とする。
To achieve the same object, a data storage method according to claim 19 of the present invention is a data storage method for registering and storing a data file in a database, wherein search information for searching the data file is stored in the data file. A search information creation step of creating a plurality of types based on the file,
A registration step of associating a plurality of types of search information created in the search information creation step with the data file and registering the search information in the database together with the data file.

【0035】同じ目的を達成するために本発明の請求項
20のデータ保管方法は、上記請求項19記載の構成に
おいて、前記登録工程は、前記データファイルに対応す
る管理文書ファイルを作成し、前記複数種類の検索情報
の各々を規定するための規定情報を前記管理文書ファイ
ル内に記述し、該管理文書ファイルを前記データファイ
ル及び前記複数種類の検索情報と共に前記データベース
に登録することを特徴とする。
In order to achieve the same object, according to a twentieth aspect of the present invention, in the data storage method according to the twelfth aspect, the registration step includes creating a management document file corresponding to the data file, Specifying information for specifying each of a plurality of types of search information in the management document file, and registering the management document file in the database together with the data file and the plurality of types of search information. .

【0036】同じ目的を達成するために本発明の請求項
21のデータ保管方法は、上記請求項19記載の構成に
おいて、前記登録工程は、前記データファイルに対応す
る管理文書ファイルを作成し、前記複数種類の検索情報
の各々を規定するための規定情報を前記管理文書ファイ
ル内に記述すると共に前記データファイル及び前記複数
種類の検索情報を該管理文書ファイルに組み込み、該管
理文書ファイルを前記データベースに登録することを特
徴とする。
In order to achieve the same object, according to a twenty-first aspect of the present invention, in the data storage method according to the twenty-first aspect, the registering step creates a management document file corresponding to the data file, The definition information for defining each of a plurality of types of search information is described in the management document file, the data file and the plurality of types of search information are incorporated in the management document file, and the management document file is stored in the database. It is characterized by registering.

【0037】同じ目的を達成するために本発明の請求項
22のデータ保管方法は、上記請求項20記載の構成に
おいて、前記検索情報に基づいてデータファイルを検索
する検索工程を含み、前記登録工程は、前記管理文書フ
ァイルを特定するための管理情報を該管理文書ファイル
と共に登録し、前記検索工程は、前記検索情報に基づい
て検索されたデータファイルに対応する管理文書ファイ
ルに前記管理情報を付加して該管理文書ファイル、前記
検索されたデータファイル及び対応する検索情報をユー
ザに提供することを特徴とする。
In order to achieve the same object, a data storage method according to a twenty-second aspect of the present invention, in the configuration according to the twentieth aspect, includes a search step of searching for a data file based on the search information, Registers the management information for specifying the management document file together with the management document file, and the search step adds the management information to the management document file corresponding to the data file searched based on the search information. And providing the user with the management document file, the searched data file, and the corresponding search information.

【0038】同じ目的を達成するために本発明の請求項
23のデータ保管方法は、上記請求項21記載の構成に
おいて、前記検索情報に基づいてデータファイルを検索
する検索工程を含み、前記登録工程は、前記管理文書フ
ァイルを特定するための管理情報を該管理文書ファイル
と共に登録し、前記検索工程は、前記検索情報に基づい
て検索されたデータファイルが組み込まれている管理文
書ファイルに前記管理情報を付加して該管理文書ファイ
ルをユーザに提供することを特徴とする。
[0038] To achieve the same object, a data storage method according to claim 23 of the present invention, in the configuration according to claim 21, further comprising a search step of searching for a data file based on the search information, Registers the management information for specifying the management document file together with the management document file, and the search step includes storing the management information in a management document file in which the data file searched based on the search information is incorporated. And providing the management document file to the user.

【0039】同じ目的を達成するために本発明の請求項
24のデータ保管方法は、上記請求項20〜23のいず
れか1項に記載の構成において、前記規定情報は、前記
複数種類の検索情報の各々が保管されているアドレスで
あることを特徴とする。
According to a twenty-fourth aspect of the present invention, in order to achieve the same object, the data storage method according to any one of the twentieth to twenty-third aspects is characterized in that the specified information includes Are stored addresses.

【0040】同じ目的を達成するために本発明の請求項
25のデータ保管方法は、上記請求項24記載の構成に
おいて、再登録工程を含み、該再登録工程は、前記検索
工程により検索された後に修正されたデータファイルを
再登録する際、元のデータファイルの保管アドレスの記
述を前記修正されたデータファイルが新たに保管される
保管アドレスに書き換えることを特徴とする。
In order to achieve the same object, according to a twenty-fifth aspect of the present invention, in the data storage method according to the twenty-fourth aspect, a re-registration step is performed, and the re-registration step is performed by the search step. When re-registering the corrected data file later, the description of the storage address of the original data file is rewritten to a storage address at which the corrected data file is newly stored.

【0041】同じ目的を達成するために本発明の請求項
26のデータ保管方法は、上記請求項25記載の構成に
おいて、前記再登録工程は、前記管理情報に基づいて前
記データベースに登録されている元のデータファイルを
検索し、該検索した元のデータファイルを削除すること
を特徴とする。
In order to achieve the same object, according to the data storage method of claim 26 of the present invention, in the configuration of claim 25, the re-registration step is registered in the database based on the management information. An original data file is searched, and the searched original data file is deleted.

【0042】同じ目的を達成するために本発明の請求項
27のデータ保管方法は、上記請求項22記載の構成に
おいて、再登録工程を含み、該再登録工程は、前記検索
工程により検索された後に修正されたデータファイルを
再登録する際、前記管理情報に基づいて前記データベー
スに登録されている元のデータファイルを検索し、該検
索した元のデータファイルを前記修正されたデータファ
イルに書き換えることを特徴とする。
In order to achieve the same object, a data storage method according to claim 27 of the present invention has the configuration according to claim 22, including a re-registration step, wherein the re-registration step is searched by the search step. When re-registering the corrected data file later, search the original data file registered in the database based on the management information, and rewrite the searched original data file with the corrected data file. It is characterized by.

【0043】同じ目的を達成するために本発明の請求項
28のデータ保管方法は、上記請求項22記載の構成に
おいて、再登録工程を含み、該再登録工程は、前記検索
工程により検索された後に修正されたデータファイルを
再登録する際、該修正されたデータファイルに基づいて
複数種類の検索情報を新たに作成し、前記管理情報に基
づいて前記データベースに登録されている元の検索情報
を検索し、該検索した元の検索情報を前記新たに作成し
た検索情報に書き換えることを特徴とする。
In order to achieve the same object, a data storage method according to claim 28 of the present invention, in the configuration according to claim 22, includes a re-registration step, wherein the re-registration step is searched by the search step. When re-registering the corrected data file later, a plurality of types of search information are newly created based on the corrected data file, and the original search information registered in the database is created based on the management information. Searching, and rewriting the searched original search information with the newly created search information.

【0044】同じ目的を達成するために本発明の請求項
29のデータ保管方法は、上記請求項23記載の構成に
おいて、再登録工程を含み、該再登録工程は、前記検索
工程により検索された後に修正されたデータファイルを
再登録する際、前記管理情報に基づいて前記提供された
管理文書ファイルに組み込まれている元のデータファイ
ルを検索し、該検索した元のデータファイルを前記修正
されたデータファイルに書き換え、該管理文書ファイル
を前記データベースに再登録することを特徴とする。
In order to achieve the same object, a data storage method according to claim 29 of the present invention, in the configuration according to claim 23, includes a re-registration step, wherein the re-registration step is searched by the search step. When re-registering the corrected data file later, the original data file incorporated in the provided management document file is searched based on the management information, and the searched original data file is corrected. It is characterized in that the management document file is re-registered in the database by rewriting to a data file.

【0045】同じ目的を達成するために本発明の請求項
30のデータ保管方法は、上記請求項23記載の構成に
おいて、再登録工程を含み、該再登録工程は、前記検索
工程により検索された後に修正されたデータファイルを
再登録する際、該修正されたデータファイルに基づいて
複数種類の検索情報を新たに作成し、前記管理情報に基
づいて前記提供された管理文書ファイルに組み込まれて
いる元の検索情報を検索し、該検索した元の検索情報を
前記新たに作成した検索情報に書き換え、該管理文書フ
ァイルを前記データベースに再登録することを特徴とす
る。
In order to achieve the same object, a data storage method according to claim 30 of the present invention, in the configuration according to claim 23, includes a re-registration step, wherein the re-registration step is searched by the search step. When re-registering the corrected data file later, a plurality of types of search information are newly created based on the corrected data file, and are incorporated in the provided management document file based on the management information. The original search information is searched, the searched original search information is rewritten with the newly created search information, and the management document file is re-registered in the database.

【0046】同じ目的を達成するために本発明の請求項
31のデータ保管方法は、上記請求項19〜30のいず
れか1項に記載の構成において、前記複数種類の検索情
報には、前記データファイルを文書画像化した画像デー
タ、前記データファイルから抽出したテキストデータ、
及び前記データファイルのレイアウト情報の少なくとも
一つが含まれることを特徴とする。
To achieve the same object, a data storage method according to claim 31 of the present invention is the data storage method according to any one of claims 19 to 30, wherein the plurality of types of search information include Image data obtained by converting a file into a document image, text data extracted from the data file,
And at least one of the layout information of the data file.

【0047】同じ目的を達成するために本発明の請求項
32のデータ保管方法は、上記請求項31記載の構成に
おいて、前記画像データは、画像化後に読み取り可能な
範囲内の低解像度で前記データファイルを画像化して得
られることを特徴とする。
To achieve the same object, a data storage method according to a thirty-second aspect of the present invention is the data storage method according to the thirty-first aspect, wherein the image data has a low resolution within a readable range after imaging. It is characterized by being obtained by imaging a file.

【0048】同じ目的を達成するために本発明の請求項
33のデータ保管方法は、上記請求項31または32記
載の構成において、前記テキストデータは、前記データ
ファイルから直接抽出して得られることを特徴とする。
To achieve the same object, a data storage method according to claim 33 of the present invention is characterized in that, in the structure according to claim 31 or 32, the text data is obtained by directly extracting from the data file. Features.

【0049】同じ目的を達成するために本発明の請求項
34のデータ保管方法は、上記請求項31または32記
載の構成において、前記検索情報作成工程は、文字認識
工程及びレイアウト解析工程を含み、前記テキストデー
タは、レイアウト解析によりテキスト領域と認識された
領域に対して文字認識処理を行うことにより得られるこ
とを特徴とする。
To achieve the same object, a data storage method according to claim 34 of the present invention is the data storage method according to claim 31 or 32, wherein the search information creation step includes a character recognition step and a layout analysis step, The text data is obtained by performing character recognition processing on an area recognized as a text area by layout analysis.

【0050】同じ目的を達成するために本発明の請求項
35のデータ保管方法は、上記請求項31〜34のいず
れか1項に記載の構成において、前記検索情報作成工程
は、レイアウト解析工程を含み、前記レイアウト情報
は、前記データファイルを文書画像化した画像データに
対してレイアウト解析を行うことにより得られることを
特徴とする。
To achieve the same object, a data storage method according to claim 35 of the present invention is the data storage method according to any one of claims 31 to 34, wherein the search information creation step includes a layout analysis step. Wherein the layout information is obtained by performing a layout analysis on image data obtained by converting the data file into a document image.

【0051】同じ目的を達成するために本発明の請求項
36のデータ保管方法は、上記請求項31〜35のいず
れか1項に記載の構成において、前記登録工程は、前記
画像データの作成及び前記データベースへの登録を、ユ
ーザの所望により前記データファイルの登録処理がなさ
れた後に行うことを特徴とする。
To achieve the same object, a data storage method according to claim 36 of the present invention is the data storage method according to any one of claims 31 to 35, wherein the registration step includes the steps of: The registration in the database is performed after the registration processing of the data file is performed as desired by the user.

【0052】同じ目的を達成するために本発明の請求項
37の記憶媒体は、データファイルをデータベースに登
録して保管するデータ保管方法で使用されるプログラム
を記憶した記憶媒体において、前記データファイルを検
索するための検索情報を該データファイルに基づいて複
数種類作成する検索情報作成工程のコードと、該検索情
報作成工程のコードにより作成された複数種類の検索情
報を前記データファイルと対応付けて該データファイル
と共に前記データベースに登録する登録工程のコードと
を記憶したことを特徴とする。
To achieve the same object, a storage medium according to claim 37 of the present invention is a storage medium storing a program used in a data storage method for registering and storing a data file in a database, wherein the data file is stored in a storage medium. A code of a search information creation step of creating a plurality of types of search information for searching based on the data file, and a plurality of kinds of search information created by the code of the search information creation step are associated with the data file. A code of a registration step for registering in the database together with the data file is stored.

【0053】同じ目的を達成するために本発明の請求項
38の記憶媒体は、上記請求項37記載の構成におい
て、前記登録工程のコードは、前記データファイルに対
応する管理文書ファイルを作成し、前記複数種類の検索
情報の各々を規定するための規定情報を前記管理文書フ
ァイル内に記述し、該管理文書ファイルを前記データフ
ァイル及び前記複数種類の検索情報と共に前記データベ
ースに登録することを特徴とする。
In order to achieve the same object, the storage medium according to claim 38 of the present invention is the storage medium according to claim 37, wherein the code of the registration step creates a management document file corresponding to the data file, Defining information for defining each of the plurality of types of search information in the management document file, and registering the management document file in the database together with the data file and the plurality of types of search information. I do.

【0054】同じ目的を達成するために本発明の請求項
39の記憶媒体は、上記請求項37記載の構成におい
て、前記登録工程のコードは、前記データファイルに対
応する管理文書ファイルを作成し、前記複数種類の検索
情報の各々を規定するための規定情報を前記管理文書フ
ァイル内に記述すると共に前記データファイル及び前記
複数種類の検索情報を該管理文書ファイルに組み込み、
該管理文書ファイルを前記データベースに登録すること
を特徴とする。
In order to achieve the same object, the storage medium according to claim 39 of the present invention is the storage medium according to claim 37, wherein the code of the registration step creates a management document file corresponding to the data file, A description information for defining each of the plurality of types of search information is described in the management document file, and the data file and the plurality of types of search information are incorporated in the management document file.
The management document file is registered in the database.

【0055】[0055]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0056】(第1の実施の形態)図1は、本発明の第
1の実施の形態に係るデータ保管装置の構成を示すブロ
ック図である。
(First Embodiment) FIG. 1 is a block diagram showing a configuration of a data storage device according to a first embodiment of the present invention.

【0057】本装置は、例えばパーソナルコンピュータ
として構成され、ワープロソフト等のアプリケーション
で作成等したデータファイルをデータベースに登録して
保管するものである。本装置は、操作部11、記憶部1
2、検索情報作成部13(検索情報作成手段)、登録処
理部14(登録手段)、検索処理部15(検索手段)及
び再登録処理部16(再登録手段)から構成される。
The present apparatus is configured as, for example, a personal computer, and registers and stores data files created by an application such as word processing software in a database. The device includes an operation unit 11, a storage unit 1,
2. It comprises a search information creation unit 13 (search information creation means), a registration processing unit 14 (registration means), a search processing unit 15 (search means), and a re-registration processing unit 16 (re-registration means).

【0058】記憶部12はハードディスク等の記憶媒体
を備え、データベースを記憶する。データファイルの保
管処理は、所定のプログラムに基づいてなされ、その処
理プログラムは上記記憶部12に予め記憶されている。
The storage unit 12 includes a storage medium such as a hard disk and stores a database. The storage processing of the data file is performed based on a predetermined program, and the processing program is stored in the storage unit 12 in advance.

【0059】なお、本装置をサーバコンピュータとLA
N等で接続し、データベースをサーバコンピュータ内の
記憶装置に集中的に記憶するようにしてもよい。また、
保管処理のプログラムは、CD−ROM等の記憶媒体に
記憶しておき、これを本装置に読み込んで動作させるよ
うにしてもよい。
It should be noted that this apparatus is connected to a server computer and an LA
N and so on, and the database may be centrally stored in a storage device in the server computer. Also,
The storage processing program may be stored in a storage medium such as a CD-ROM, and may be read and operated by the present apparatus.

【0060】なお、これらの場合の記憶媒体としては、
CD−ROMのほかに、ROM、フロッピディスク、ハ
ードディスク、光ディスク、CD−R、磁気テープ、不
揮発性のメモリカード等を用いることができる。
The storage medium in these cases includes:
In addition to the CD-ROM, a ROM, a floppy disk, a hard disk, an optical disk, a CD-R, a magnetic tape, a nonvolatile memory card, and the like can be used.

【0061】検索情報作成部13は、後述する検索情報
の作成処理を実行する。登録処理部14は、データファ
イルの新規登録の処理を実行する。検索処理部15は、
データベースに登録されたデータファイルの検索の処理
を実行する。再登録処理部16は、データベースから取
り出したデータファイルに修正を加える等して再度登録
する処理を実行する。操作部11は、上記各処理におい
てユーザが入力するのに用いられる。
The search information creation unit 13 executes search information creation processing described later. The registration processing unit 14 executes a process for newly registering a data file. The search processing unit 15
Executes the process of searching for data files registered in the database. The re-registration processing unit 16 executes a process of re-registering the data file taken out of the database by modifying the data file. The operation unit 11 is used for a user to input in each of the above processes.

【0062】図2は、本実施の形態に係るデータ保管装
置におけるデータファイルの保管の手順を示す図であ
る。
FIG. 2 is a diagram showing a procedure for storing a data file in the data storage device according to the present embodiment.

【0063】同図に示すように、A社のワープロソフト
で作成したデータファイル101(ドキュメント)をデ
ータベースに登録する上で、各データファイルにつき、
オリジナルのデータファイル101のほか、文書画像デ
ータ105、レイアウト情報106、テキスト情報10
7、及びインデックス(index)情報108が登録され
る。これらは、登録後にデータファイルを検索するため
の手がかりとなる検索情報となる。データファイル10
1、文書画像データ105、レイアウト情報106及び
テキスト情報107は、後述するコンテナ文書(管理文
書ファイル、コンテナドキュメント)109と称するフ
ァイルに対応付けられて登録される。
As shown in the figure, when registering the data file 101 (document) created by the word processing software of Company A in the database, for each data file,
In addition to the original data file 101, document image data 105, layout information 106, text information 10
7 and index information 108 are registered. These are search information that is a key to search for a data file after registration. Data file 10
1. The document image data 105, the layout information 106, and the text information 107 are registered in association with a file called a container document (management document file, container document) 109 described later.

【0064】データファイル101は、オリジナルのま
まの保管される。文書画像データ105は、文書画像化
処理(ステップS102)によりデータファイル101
を画像フォーマット化して作成される。すなわち、デー
タファイル101の内容をビットマップ展開し、画像と
して保管する。その際の解像度は目視で認識可能な程度
で十分であり、例えば300〜400dpiに設定され
る。これにより、データファイル101の文書フォーマ
ットそのものが年数の経過によって読み取りできない環
境になった場合であっても、画像として認識可能にな
り、可読性を長期間保証することができる。
The data file 101 is kept as it is. The document image data 105 is converted into the data file 101 by the document imaging process (step S102).
Is created by image formatting. That is, the contents of the data file 101 are developed into a bitmap and stored as an image. The resolution at this time is sufficient to be visually recognizable, and is set to, for example, 300 to 400 dpi. As a result, even when the document format of the data file 101 becomes unreadable due to the lapse of years, it can be recognized as an image, and readability can be guaranteed for a long time.

【0065】この処理は、プリンタドライバがプリンタ
用にビットマップ展開するのと同じように画像ファイル
化するようなものであり、将来解像度の高い画像ハンド
リングが可能な環境になったとしても、文字や画像の再
現には300〜400dpi程度の解像度で十分である
し、記憶容量を節約する上でもこの程度が最適と思われ
る。
This process is similar to a process in which a printer driver develops an image file in the same way as a bitmap expansion for a printer. A resolution of about 300 to 400 dpi is sufficient for reproducing an image, and this level seems to be optimal for saving storage capacity.

【0066】なお、作成した画像データは、そのまま保
管すると容量が大きいため、画像圧縮を施して保管する
のがより好ましいが、その場合でも、将来的に適用可能
な方式を採用すべきであり、例えば標準機関で定められ
たjpegやMMR(Modified Modified Read)等の圧
縮方式を採用すればよい。
It should be noted that since the created image data has a large capacity if stored as it is, it is more preferable to store the image data after compressing the image. However, even in such a case, a method applicable in the future should be adopted. For example, a compression method such as jpeg or MMR (Modified Modified Read) determined by a standard organization may be adopted.

【0067】レイアウト情報106は、レイアウト解析
処理(ステップS103)(レイアウト解析手段)によ
り作成される。レイアウト解析処理(ステップS10
3)では、データファイル101を文書画像化処理(ス
テップS102)により画像化したものに対してレイア
ウト解析処理を行う。
The layout information 106 is created by a layout analysis process (step S103) (layout analysis means). Layout analysis processing (step S10
In 3), a layout analysis process is performed on the data file 101 imaged by the document imaging process (step S102).

【0068】図3は、レイアウト解析処理前のデータフ
ァイルの内容の一部の一例を示す図である。図4は、図
3に示すデータファイルの内容の一部について行ったレ
イアウト解析処理の結果の一例を示した図である。
FIG. 3 is a diagram showing an example of a part of the contents of the data file before the layout analysis processing. FIG. 4 is a diagram illustrating an example of a result of a layout analysis process performed on a part of the contents of the data file illustrated in FIG.

【0069】レイアウト解析処理では、領域の属性を判
定してレイアウト情報106を作成する。属性として
は、文字を含む文字領域「Text領域」、写真画像等
を含む画像領域「Picture領域」、枠線を含む領
域「frame領域」、線画を含む線画領域「Line
領域」、表を含む表領域「Table領域」、表題を示
す領域「Title領域」等である。この処理をデータ
ファイル101の内容の全てに対して行いレイアウト情
報106として保管する。これにより、フォーム検索に
よるデータファイルの検索手段が確保される。フォーム
検索は、文書の定型フォームを検索する手段であり、主
に定型文書や帳票形式の電子文書を検索するのに有用で
ある。
In the layout analysis processing, the attributes of the area are determined and the layout information 106 is created. Attributes include a text area “Text area” including characters, an image area “Picture area” including a photographic image, an area “frame area” including a frame, and a line drawing area “Line” including a line drawing.
Area, a table area including a table, a table area, a title area indicating a title, and the like. This processing is performed on all the contents of the data file 101 and stored as layout information 106. As a result, means for searching the data file by the form search is secured. The form search is a means for searching for a fixed form of a document, and is useful mainly for searching for a fixed form document or an electronic document in a form.

【0070】なお、データファイル101から対象とす
るレイアウト情報106を作成する処理は、多用な文書
フォーマットからその情報をすべて共通に取り出すこと
になるから困難を伴う。しかし、本実施の形態では、文
書画像化処理(ステップS102)により一旦文書画像
化したものに対してレイアウト解析処理を行うことにし
たので、全文書を同一の処理系で扱え、有利である。認
識という不確定要素はあるものの、スキャナ読み込み等
に比べれば遙かに精度の高い情報を得ることができる。
そのため、十分な情報を作成でき、多様なフォーマット
を解析してレイアウト情報106を抽出する際に生じ易
いミスを回避し、安全確実にレイアウト情報106を作
成することができる。
The process of creating the target layout information 106 from the data file 101 involves difficulties because all the information is commonly extracted from various document formats. However, in the present embodiment, since the layout analysis processing is performed on the document image once formed by the document image processing (step S102), all the documents can be handled by the same processing system, which is advantageous. Although there is an uncertain factor of recognition, it is possible to obtain information with much higher accuracy compared to scanner reading or the like.
Therefore, sufficient information can be created, mistakes that are likely to occur when the layout information 106 is extracted by analyzing various formats can be avoided, and the layout information 106 can be created securely and reliably.

【0071】図2に戻り、テキスト情報107は、テキ
スト抽出処理(ステップS104)によりデータファイ
ル101からテキスト部を抽出することにより作成され
る。いかなる電子文書についてもテキスト領域のテキス
ト部を抽出できるわけではなく、本装置がサポートする
ドキュメント作成文書でなければ抽出できない。従っ
て、本装置は、データファイル101の保管時におい
て、該データファイル101を扱うソフトウェアを実行
可能にしておく必要がある。しかし、例えばマイクロソ
フト社のソフトウェア「WORD」のように、プレーン
テキストコードを出力する機能が各種ワープロソフトウ
ェアに一般的に備えられているので、その場合はその機
能を利用すればよい。
Returning to FIG. 2, the text information 107 is created by extracting a text part from the data file 101 by a text extraction process (step S104). The text portion of the text area cannot be extracted from any electronic document, and cannot be extracted unless the document is a document creation document supported by this apparatus. Therefore, when the data file 101 is stored, the present apparatus needs to be able to execute software that handles the data file 101. However, various word processing softwares generally have a function of outputting a plain text code, such as Microsoft's software "WORD". In that case, the function may be used.

【0072】テキスト情報107を保管することで、全
文検索によるファイル検索が可能になり、また、テキス
ト情報も将来に亘って可読性が保証されているので、動
作環境の変化に対する検索手段を確保することができ
る。
By storing the text information 107, it is possible to perform a file search by full-text search, and since the readability of the text information is guaranteed in the future, it is necessary to secure a search means for a change in the operating environment. Can be.

【0073】図5は、本実施の形態におけるコンテナ文
書の一例を示す図である。
FIG. 5 is a diagram showing an example of a container document according to the present embodiment.

【0074】同図は、コンテナ文書109にデータファ
イル101等を含ませないで複数ファイル管理形式で登
録する場合を例示したものであり、当該コンテナ文書を
コンテナ文書109Aと記す。同図では、コンテナ文書
109をXML(ExtensionMarkup Language)で簡易的
に記述し、概要を示すためほとんどの記述を省略してい
る。
FIG. 9 illustrates a case where the data file 101 and the like are not included in the container document 109 and the container document is registered in a multiple file management format. The container document is referred to as a container document 109A. In the figure, the container document 109 is simply described in XML (Extension Markup Language), and most of the description is omitted to show the outline.

【0075】コンテナ文書109Aにはデータファイル
101、文書画像データ105、テキスト情報107及
びレイアウト情報106が関連付けられ、これらのファ
イルの保管先がコンテナ文書109A本体に記述されて
いる。例えば、同図に示す「オリジナルdocument」とい
うTAGは、データファイル101の情報を示すMet
a Data(Document Information)、例えば作成日
時、作者、文書フォーマット等の情報とデータファイル
101の実体を示すリンク先乃至保管アドレス(規定情
報)を表している。「文書画像document」というTAG
は、文書画像データ105についてMeta Data
とリンク先を表している。同様に、「プレーンTEXT
document」というTAGは、テキスト情報107につい
て、「レイアウトdocument」というTAGは、レイアウ
ト情報106について、それぞれMeta Dataと
リンク先を表している。
The data file 101, the document image data 105, the text information 107, and the layout information 106 are associated with the container document 109A, and the storage destinations of these files are described in the body of the container document 109A. For example, a TAG “original document” shown in FIG.
a Data (Document Information), for example, information such as creation date and time, author, document format, etc., and a link destination to a storage address (regulation information) indicating the entity of the data file 101. TAG "document image document"
Describes the Meta Data for the document image data 105.
And the link destination. Similarly, "plain TEXT
The TAG “document” indicates the text information 107, and the TAG “layout document” indicates the Meta Data and the link destination for the layout information 106, respectively.

【0076】データファイル101の保管時には、この
ように複数の検索情報がコンテナ文書109Aによって
一括的に管理されてデータベースに登録される。
When the data file 101 is stored, a plurality of pieces of search information are collectively managed by the container document 109A and registered in the database.

【0077】ファイルの保管時には、コンテナ文書10
9にはインデックス情報108も付加される(図2)。
インデックス情報108は、データファイル101に対
応する情報であり、各データファイルのキーワード、作
成者、保管日時等で構成される。インデックス情報10
8も上記文書画像データ105等のファイルと共にコン
テナ文書109を介して一括管理される。
When storing the file, the container document 10
9, index information 108 is also added (FIG. 2).
The index information 108 is information corresponding to the data file 101 and includes a keyword, a creator, a storage date and time, and the like of each data file. Index information 10
8 are also managed together with the files such as the document image data 105 via the container document 109.

【0078】従来では保管するファイルそのものにはイ
ンデックス情報等の管理情報を付加できないため、保管
したファイルを一旦取り出して再登録する場合に、元の
ファイルとの整合性を取るのが困難であった。しかし、
コンテナ文書109で保管することにより、保管してい
たインデックス情報108をコンテナ文書109内に組
み込むことが可能であるので、一旦取り出した電子文書
を再登録する際にインデックス情報108を利用して整
合性を取ることが容易となる。
Conventionally, management information such as index information cannot be added to a file to be stored itself. Therefore, when the stored file is once taken out and re-registered, it is difficult to maintain consistency with the original file. . But,
Since the stored index information 108 can be incorporated in the container document 109 by storing it in the container document 109, the index information 108 is used to re-register the electronic document once taken out. It is easy to take.

【0079】図6は、本実施の形態におけるコンテナ文
書の他の一例を示す図である。
FIG. 6 is a diagram showing another example of the container document according to the present embodiment.

【0080】同図は、コンテナ文書109にデータファ
イル101等を含ませ一ファイル管理形式で登録する場
合を例示したものであり、当該コンテナ文書をコンテナ
文書109Bと記す。
FIG. 9 illustrates a case where the data file 101 and the like are included in the container document 109 and registered in a file management format, and the container document is referred to as a container document 109B.

【0081】完全に管理され、一旦保管されたファイル
を利用したり内容を更新したりすることがほとんど無い
ような使用態様であれば、上記図5に示すコンテナ文書
109Aのように各データファイル101等がコンテナ
文書109の外部において管理される方式で足りるが、
データファイルの再利用や更新が多いと想定される場合
は、各データファイル101等はバラバラになっている
よりも1つにまとまっている方が扱いやすい。
If the usage mode is completely managed and the file stored once is hardly used or the content is updated, each data file 101 is used as in the container document 109A shown in FIG. And the like are managed outside the container document 109,
When it is assumed that the data files are frequently reused or updated, it is easier to handle the data files 101 and the like as one unit rather than being separated.

【0082】そこで、本実施の形態の装置は、コンテナ
文書109として図5にすコンテナ文書109Aだけで
なく図6に示すコンテナ文書109Bも扱えるように構
成されている。なお、図5または図6に示すもののいず
れか一方に統一してもよい。
Therefore, the apparatus according to the present embodiment is configured to handle not only the container document 109A shown in FIG. 5 but also the container document 109B shown in FIG. In addition, you may unify to either one shown in FIG. 5 or FIG.

【0083】図6に示すように、コンテナ文書109B
では、データファイル101もデータとして扱われ、コ
ンテナ文書109B内に組み込まれる。本例のようにX
MLで記述されている場合は、TEXT形式に符号化し
て組み込む。文書画像データ105は、画像圧縮データ
を符号化して組み込む。テキスト情報107は、TEX
T形式であるため、そのまま組み込む。レイアウト情報
106は、その記述がTEXT形式の場合はそのまま組
み込んでもよいが、データ形式の場合は符号化して組み
込む。その他の点は、図5に示すコンテナ文書109A
と同様である。このようにして、各データを1つのファ
イル形式に落とし込む。
As shown in FIG. 6, the container document 109B
In this case, the data file 101 is also treated as data and is incorporated in the container document 109B. X as in this example
When described in ML, it is encoded and incorporated in the TEXT format. The document image data 105 encodes and incorporates the compressed image data. Text information 107 is TEX
Since it is in the T format, it is incorporated as it is. The layout information 106 may be directly incorporated when the description is in the TEXT format, but may be encoded and incorporated in the case of the data format. Other points are the container document 109A shown in FIG.
Is the same as In this way, each data is converted into one file format.

【0084】なお、コンテナ文書109はXMLで記述
するものとしたが、これに限るものでなく、ドキュメン
トを追加する仕組みがあれば他の方式を採用してもよ
い。
Although the container document 109 is described in XML, the present invention is not limited to this, and another method may be adopted as long as there is a mechanism for adding a document.

【0085】図6に示すコンテナ文書109Bのよう
に、各データが一旦1つのファイル形式になると、扱い
が非常に簡単である。各データの保管先の移動も自由に
行える。画像データを内部の持つので冗長にはなるが、
ファイルを取り出した後に削除等の処理を行えば電子文
書の実体が得られるのでそれほど問題ではない。むし
ろ、再登録をする際のメリットが大きい点に価値があ
る。
As in the container document 109B shown in FIG. 6, once each data is in one file format, it is very easy to handle. The storage location of each data can be moved freely. It is redundant because it has image data inside,
If a process such as deletion is performed after the file is taken out, the substance of the electronic document can be obtained, so this is not a problem. Rather, the merits of re-registration are great.

【0086】図7は、本実施の形態に係るデータ保管装
置における複数種類のデータファイルの保管の手順を示
す図である。データファイルには、A社のワープロソフ
トで作成したもののほか、例えばB社のワープロソフト
で作成した文書データやC社のドローソフトでグラフィ
ックスを描いた画像データ、D社のCADソフトで作成
したCADデータ、ファクシミリにより受信して得たフ
ァクシミリデータ、その他各種の手法で入手したビット
マップデータ等、各種フォーマットのデータファイルが
ある。
FIG. 7 is a diagram showing a procedure for storing a plurality of types of data files in the data storage device according to the present embodiment. In addition to the data files created by the company A's word processing software, the data files include document data created by the company B's word processing software, image data drawn with graphics by the company C's drawing software, and data created by the company's CAD software. There are data files of various formats, such as CAD data, facsimile data received by facsimile, and bitmap data obtained by various methods.

【0087】同図に示すように、各データファイル10
1の夫々について、オリジナルのデータファイル10
1、文書画像データ105、レイアウト情報106、テ
キスト情報107が作成され、1つのデータファイル1
01に対応して1つのコンテナ文書109が作成され
る。そして、インデックス情報108が各コンテナ文書
109に付加され、記憶部12にデータベース化されて
登録される。
As shown in FIG.
1 for each of the original data files 10
1, document image data 105, layout information 106, and text information 107 are created, and one data file 1
01, one container document 109 is created. Then, the index information 108 is added to each container document 109, and is stored in the storage unit 12 as a database and registered.

【0088】図8は、本実施の形態における検索取り出
し、再登録指示、及び再登録の各処理の手順を示す図で
ある。同図(a)は検索処理を示し、同図(b)は再登
録指示処理を示し、同図(c)は再登録処理を示す。
FIG. 8 is a diagram showing a procedure of each process of retrieval and retrieval, re-registration instruction, and re-registration in the present embodiment. FIG. 7A shows a search process, FIG. 7B shows a re-registration instruction process, and FIG. 7C shows a re-registration process.

【0089】データファイルの検索、取り出しは、文書
画像データ105やテキスト情報107等の検索情報に
基づいてなされる。例えば全文検索によりある語句を含
むデータファイルの検索を実行すると、同図(a)に示
すように、求めるデータファイルを管理するコンテナ文
書109を検索し(ステップS701)、次いで検索し
たコンテナ文書109の取り出し処理を行う(ステップ
S702)。取り出し処理では、対応する管理情報をコ
ンテナ文書109に付加する。ここで付加する管理情報
は、コンテナ文書109を特定するための保管日時、著
者、保管者、会社名、キーワード等の情報であり、本実
施の形態ではインデックス情報108を用いる。
The search and retrieval of the data file are performed based on the search information such as the document image data 105 and the text information 107. For example, when a search for a data file containing a phrase is performed by full-text search, as shown in FIG. 10A, a container document 109 that manages the desired data file is searched (step S701). An extraction process is performed (step S702). In the extraction process, the corresponding management information is added to the container document 109. The management information added here is information such as a storage date and time, an author, a custodian, a company name, and a keyword for specifying the container document 109. In the present embodiment, the index information 108 is used.

【0090】次いで、コンテナ文書109及びインデッ
クス情報108をユーザに提供する(ステップS70
3)。その際、図5に示す複数ファイル管理形式のコン
テナ文書109Aか図6に示す一ファイル管理形式のコ
ンテナ文書109Bのいずれかをユーザに選択してもら
い、選択された形式でユーザに渡す。
Next, the container document 109 and the index information 108 are provided to the user (step S70).
3). At this time, the user selects either the container document 109A in the multiple file management format shown in FIG. 5 or the container document 109B in the single file management format shown in FIG. 6, and hands it to the user in the selected format.

【0091】以下、図8(b)、(c)では、図6に示
す一ファイル管理形式のコンテナ文書109Bが選択さ
れた場合を主体に説明する。
8 (b) and 8 (c), the case where the container document 109B of one file management format shown in FIG. 6 is selected will be mainly described.

【0092】ユーザは、渡されたコンテナ文書109か
ら必要とするデータファイル101の実体を抽出する
(ステップS704)。この作業は、「オリジナルdocu
ment」というTAGから追っていくことにより容易にで
きる。コンテナ文書109はTEXT形式であるため、
プログラムで抽出するだけでなく、カット&ペーストの
ような作業でもデータファイル101の取りだしが可能
である。
The user extracts the necessary data file 101 from the passed container document 109 (step S704). This work is described in "Original docu
This can be easily done by following the TAG “ment”. Since the container document 109 is in the TEXT format,
The data file 101 can be taken out not only by program extraction but also by operations such as cut and paste.

【0093】次いで、ユーザによりデータファイル10
1の修正がなされる(ステップS705)。次にこの修
正文書(データファイル101)のコンテナ文書109
への再組み込みを行う(ステップS706)。具体的に
は、「オリジナルdocument」というTAGの、オリジナ
ル文書の実体のリンク先を示すところに、修正版のデー
タファイル101のリンク先を追加記述する。この手法
では、修正前の文書と修正後の文書の双方を持つことに
なるが、作業は容易である。なお、後に修正前のデータ
ファイル101を削除するようにしてもよい。
Next, the user inputs the data file 10
1 is made (step S705). Next, the container document 109 of this modified document (data file 101)
Is re-incorporated (step S706). Specifically, the link destination of the modified version of the data file 101 is additionally described in the TAG “Original document” indicating the link destination of the entity of the original document. In this method, both the document before modification and the document after modification are provided, but the operation is easy. The data file 101 before correction may be deleted later.

【0094】なお、コンテナ文書109内の修正前のデ
ータファイル101と修正後のデータファイル101と
を入れ替えるようにしてもよい。この場合は、コンテナ
文書109内の修正前のデータファイル101を削除し
てから、修正後のデータファイル101を符号化してコ
ンテナ文書109に組み込む。その際、リンク先に変動
が生じる場合は、データファイル101のリンク先の記
述を修正前のものから修正後のものへと変更する。この
作業は、削除や組み込んだ電子文書によりアドレスの変
更が生じたものについては全て行う必要がある。さら
に、入れ替えた情報を書き込む必要もある。この処理に
よれば、再登録時、データファイル101の重複登録を
回避しつつ容易な処理で確実に更新することができる。
The data file 101 before correction and the data file 101 after correction in the container document 109 may be exchanged. In this case, the data file 101 before correction in the container document 109 is deleted, and then the data file 101 after correction is encoded and incorporated into the container document 109. At this time, if the link destination fluctuates, the description of the link destination in the data file 101 is changed from the description before correction to the description after correction. It is necessary to perform this operation for all electronic documents whose addresses have been changed due to deletion or insertion. Further, it is necessary to write the replaced information. According to this processing, at the time of re-registration, it is possible to reliably update the data file 101 by simple processing while avoiding duplicate registration.

【0095】次いで、変更後のコンテナ文書109の再
登録指示を行う(ステップS707)。
Next, an instruction for re-registering the changed container document 109 is issued (step S707).

【0096】再登録指示がなされると、コンテナ文書1
09の内容の確認を行う。すなわち、オリジナルのデー
タファイル101のリンク先を確認した後、修正後にお
けるデータファイル101のリンク先の記述を確認す
る。修正後のデータファイル101は外部ファイルであ
り、その存在も確認する。その後、ステップS708
で、コンテナ文書109内に保管されていた修正前のデ
ータファイル101、文書画像データ105、レイアウ
ト情報106及びテキスト情報107を外部に出すため
復号化処理を行う。そして、復号化した各データをファ
イル化してそれぞれのリンク先をコンテナ文書109内
に記述する。復号化の際にコンテナ文書109内に管理
されていたデータは削除しておく。そして、修正後のデ
ータファイル101に基づいて、新規登録時の処理と同
様に文書画像データ105、レイアウト情報106及び
テキスト情報107を新たに作成し、新たなコンテナ文
書109を得る。
When the re-registration instruction is issued, the container document 1
09 is confirmed. That is, after checking the link destination of the original data file 101, the description of the link destination of the data file 101 after correction is checked. The modified data file 101 is an external file, and its existence is also confirmed. After that, step S708
Then, a decryption process is performed to output the unmodified data file 101, document image data 105, layout information 106, and text information 107 stored in the container document 109 to the outside. Then, each of the decrypted data is converted into a file, and each link destination is described in the container document 109. The data managed in the container document 109 at the time of decryption is deleted. Then, based on the corrected data file 101, the document image data 105, the layout information 106, and the text information 107 are newly created in the same manner as the processing at the time of new registration, and a new container document 109 is obtained.

【0097】次に、ステップS709で、コンテナ文書
109内に管理されていたインデックス情報108に基
づき、修正前のコンテナ文書109が保管されていたア
ドレスを検出し、そのアドレスにあるコンテナ文書10
9全体を、新たに得たコンテナ文書109と入れ替え
る。これで、コンテナ文書109の更新がなされる。
Next, in step S709, based on the index information 108 managed in the container document 109, the address where the container document 109 before correction is stored is detected, and the container document 10 at that address is detected.
9 is replaced with the newly obtained container document 109. Thus, the container document 109 is updated.

【0098】一方、前記ステップS703で、ユーザに
より、図5に示す複数ファイル管理形式のコンテナ文書
109Aが選択された場合は、データファイル101の
実体は外部にあるのでそのまま利用可能である。利用す
る際にはこの形式で受け取った方が扱い容易であるが、
ファイルが分割されているため管理には十分な配慮が必
要となる。また、前記ステップS706に相当する処理
では、取り出し修正したデータファイル101を修正前
のものと入れ替えるだけで作業が終わる。さらに、複数
ファイル管理形式のコンテナ文書109Aでは、既に保
管されているコンテナ文書109との入れ替えが指示さ
れると、コンテナ文書109内に管理されていた管理情
報に基づき修正前のコンテナ文書109を検出する(ス
テップS800)。その後、一ファイル管理形式のコン
テナ文書109Bの場合と同様に、修正後のデータファ
イル101に基づいて、新たなコンテナ文書109を得
て、再登録を行う。
On the other hand, if the user selects the container document 109A in the multiple file management format shown in FIG. 5 in step S703, the data file 101 can be used as it is because it is external. It is easier to use this format when you receive it,
Since the files are divided, sufficient care must be taken for management. In the process corresponding to step S706, the work is completed only by replacing the data file 101 that has been taken out and corrected with the data file 101 before correction. Further, in the container document 109A in the multiple file management format, when the replacement with the already stored container document 109 is instructed, the container document 109 before correction is detected based on the management information managed in the container document 109. (Step S800). Thereafter, as in the case of the container document 109B in the one file management format, a new container document 109 is obtained based on the corrected data file 101, and re-registered.

【0099】本実施の形態によれば、検索手段としてイ
ンデックス情報108やオリジナルデータファイル10
1のほかに、文書画像データ105、レイアウト情報1
06及びテキスト情報107等の検索情報を作成し、コ
ンテナ文書109に対応させてデータベースに登録する
ようにしたので、長期間経過後にアプリケーションの動
作環境が変化しても、固有のフォーマットに依存するこ
となく検索情報の種類に応じて複数の手段で検索でき、
良好な検索性及び内容の可読性を長期間保証することが
できる。特に、適当な解像度による文書画像データ10
5を保管することで、画像を手がかりに検索でき、過大
な記憶容量を要することなく可検索性及び可読性を保証
することができる。また、テキスト情報107を保管す
ることで、全文検索による検索性及び長期に亘る可読性
を保証することができる。さらに、レイアウト情報10
6を保管することで、定型文書や帳票形式の電子文書を
フォーム検索により円滑に検索することができる。
According to the present embodiment, index information 108 and original data file 10
1, document image data 105, layout information 1
06 and search information such as text information 107 are created and registered in the database in association with the container document 109. Therefore, even if the operating environment of the application changes after a long period of time, it depends on a specific format. Search by multiple means depending on the type of search information,
Good searchability and readability of contents can be guaranteed for a long time. In particular, the document image data 10 having an appropriate resolution
By storing 5, images can be searched for as clues, and searchability and readability can be guaranteed without requiring an excessive storage capacity. In addition, by storing the text information 107, searchability by full-text search and long-term readability can be guaranteed. Further, the layout information 10
By storing the file 6, a standard document or an electronic document in a form can be smoothly searched by a form search.

【0100】また、本実施の形態では、コンテナ文書1
09により各データを一括管理することで、検索や更新
時におけるデータ同士の関連づけを維持して重複登録等
を回避すると共に、検索時におけるデータファイルの取
り出しを容易にすることができる。特に、検索情報をコ
ンテナ文書109内に組み込むことで(図6)、登録や
検索時にコンテナ文書109単位で扱えるので、扱いを
より容易にすることができる。
In the present embodiment, the container document 1
By collectively managing each data by 09, it is possible to maintain the association between the data at the time of search and update, avoid duplicate registration, and facilitate the retrieval of the data file at the time of search. In particular, by incorporating the search information into the container document 109 (FIG. 6), the registration and search can be handled in the unit of the container document 109, so that the handling can be made easier.

【0101】また、検索時には、コンテナ文書109に
インデックス情報108を付加してユーザに提供するよ
うにしたので、修正、再登録時等に重複登録を回避する
のが容易となる等、元のデータファイルとの整合性を確
保するのに便利であり、管理上好都合である。さらに、
テキスト情報107等の検索情報をリンク先(保管アド
レス)の記述により規定するようにしたので、修正や再
登録時等の処理が容易である。
Also, at the time of retrieval, index information 108 is added to the container document 109 and provided to the user, so that it is easy to avoid duplicate registration at the time of correction, re-registration, etc. This is convenient for ensuring consistency with the file, and is convenient for management. further,
Since the search information such as the text information 107 is defined by the description of the link destination (storage address), processing at the time of correction, re-registration, and the like is easy.

【0102】また、レイアウト情報106は、データフ
ァイル101を画像化した文書画像に対してレイアウト
解析を行うことにより得るようにしたことで、全てのデ
ータファイルについて統一された処理系で扱うので、レ
イアウト解析の精度を高めることができる。
The layout information 106 is obtained by performing a layout analysis on a document image obtained by converting the data file 101 into an image, so that all data files are handled by a unified processing system. The accuracy of analysis can be improved.

【0103】このように、長期に亘って良好な検索性を
保証すると共に、検索、修正後の再登録時において重複
登録を容易に回避することができる。
As described above, good searchability can be ensured over a long period of time, and duplicate registration can be easily avoided at the time of re-registration after search and correction.

【0104】なお、本実施の形態では、データファイル
101の登録時に文書画像データ105を一律に作成、
保管するようにしたが、文書画像データ105の作成及
びデータベースへの登録をするか否かを、ユーザの所望
により決定するようにしてもよい。画像データは容量が
大きいので、あまり重要でないデータについては文書画
像データ105の保管をしないことにより、記憶部12
の記憶容量を節約することができる。また、タイマを用
いて、文書画像データ105の作成及びデータベースへ
の登録がデータファイルの登録処理がなされた後、所定
期間経過後に自動的に行われるように構成してもよい。
これにより、データファイルの登録処理の負担を軽減で
きる。
In this embodiment, the document image data 105 is created uniformly when the data file 101 is registered.
Although the document is stored, whether or not to create the document image data 105 and register it in the database may be determined as desired by the user. Since the image data has a large capacity, the document image data 105 is not stored for data that is not so important.
Storage capacity can be saved. Alternatively, the timer may be used to automatically create the document image data 105 and register it in the database after a predetermined period has elapsed after the data file registration process.
As a result, the load on the data file registration process can be reduced.

【0105】なお、コンテナ文書109に、その登録や
検索等の履歴やアクセスの状況等を示す情報を付加する
ようにしてもよい。例えば、検索して取り出したデータ
ファイルを再登録する際、文書を残す等の再登録の条件
を示す情報を付加すれば、再更新JOBがそれに従い再
登録を行うということも可能になる。
Note that information indicating the history of registration and search, access status, and the like may be added to the container document 109. For example, when re-registering a data file retrieved and retrieved, if information indicating conditions for re-registration, such as leaving a document, is added, the re-update job can perform re-registration accordingly.

【0106】(第2の実施の形態)本発明の第2の実施
の形態に係るデータ保管装置は、データファイルの保管
の手順が第1の実施の形態と異なり、図2に代えて図9
に示す手順で保管処理を行う。その他の構成は第1の実
施の形態と同様である。
(Second Embodiment) A data archiving apparatus according to a second embodiment of the present invention differs from the first embodiment in the procedure for storing a data file.
The storage process is performed according to the procedure shown in. Other configurations are the same as those of the first embodiment.

【0107】図9は、本実施の形態に係るデータ保管装
置におけるデータファイルの保管の手順を示す図であ
る。図2の手順と相違する点は、テキスト情報107
を、テキスト抽出処理(ステップS104)によりデー
タファイル101からテキスト部を抽出する代わりに、
文字認識処理(ステップS402)(文字認識手段)に
より作成するようにした点である。従って、テキスト抽
出処理(ステップS104)を削除すると共に、レイア
ウト解析処理(ステップS103)の後に文字認識処理
(ステップS402)を追加した。
FIG. 9 is a diagram showing a procedure for storing a data file in the data storage device according to the present embodiment. The difference from the procedure of FIG.
Instead of extracting the text part from the data file 101 by the text extraction process (step S104),
The point is that it is created by the character recognition processing (step S402) (character recognition means). Therefore, the text extraction processing (step S104) was deleted, and the character recognition processing (step S402) was added after the layout analysis processing (step S103).

【0108】文字認識処理(ステップS402)では、
レイアウト解析処理(ステップS103)の結果、TE
XT領域と認識した領域に対して公知の手法で文字認識
を行って、テキスト情報107を得る。その際、候補文
字も認識結果に含めて保管するようにする。これによ
り、文字の誤認識がなされても、全文検索時にヒットす
る確立が高くなり、検索漏れを少なくすることができ
る。このテキスト情報107もコンテナ文書109内に
管理される点は、第1の実施の形態と同様である。
In the character recognition process (step S402),
As a result of the layout analysis processing (step S103), TE
Character recognition is performed on the area recognized as the XT area by a known method to obtain text information 107. At that time, the candidate characters are also stored in the recognition result. As a result, even if a character is erroneously recognized, the probability of hitting during full-text search increases, and search omission can be reduced. This text information 107 is also managed in the container document 109, as in the first embodiment.

【0109】本実施の形態によれば、第1の実施の形態
と同様の効果を奏するだけでなく、特にデータファイル
101が画像データである場合でも容易に対応でき、全
文検索やフォーム検索による検索手段を活用することが
できる。
According to the present embodiment, not only the same effects as those of the first embodiment can be obtained, but also particularly when the data file 101 is image data, it can be easily dealt with. Means can be utilized.

【0110】[0110]

【発明の効果】以上説明したように、本発明によれば、
長期に亘って良好な検索性を保証すると共に、検索、修
正後の再登録時において重複登録を容易に回避すること
ができる。
As described above, according to the present invention,
In addition to ensuring good searchability over a long period of time, duplicate registration can be easily avoided during re-registration after search and correction.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態に係るデータ保管装
置の構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a data storage device according to a first embodiment of the present invention.

【図2】同形態に係るデータ保管装置におけるデータフ
ァイルの保管の手順を示す図である。
FIG. 2 is a diagram showing a procedure for storing a data file in the data storage device according to the embodiment.

【図3】同形態ににおいてレイアウト解析処理前のデー
タファイルの内容の一部の一例を示す図である。
FIG. 3 is a diagram showing an example of a part of the content of a data file before a layout analysis process in the embodiment.

【図4】図3に示すデータファイルの内容の一部につい
て行ったレイアウト解析処理の結果の一例を示した図で
ある。
FIG. 4 is a diagram illustrating an example of a result of a layout analysis process performed on a part of the content of the data file illustrated in FIG. 3;

【図5】同形態におけるコンテナ文書の一例を示す図で
ある。
FIG. 5 is a diagram illustrating an example of a container document according to the embodiment.

【図6】同形態におけるコンテナ文書の他の一例を示す
図である。
FIG. 6 is a diagram showing another example of the container document in the same form.

【図7】同形態に係るデータ保管装置における複数種類
のデータファイルの保管の手順を示す図である。
FIG. 7 is a diagram showing a procedure for storing a plurality of types of data files in the data storage device according to the same embodiment.

【図8】同形態における検索取り出し、再登録指示、及
び再登録の各処理の手順を示す図である。
FIG. 8 is a diagram showing a procedure of each process of retrieval and retrieval, a re-registration instruction, and re-registration in the same embodiment.

【図9】第2の実施の形態に係るデータ保管装置におけ
るデータファイルの保管の手順を示す図である。
FIG. 9 is a diagram showing a procedure for storing a data file in the data storage device according to the second embodiment.

【図10】従来の第1のデータ保管装置におけるデータ
ファイルの保管の手順を示す図である。
FIG. 10 is a diagram showing a procedure for storing a data file in a conventional first data storage device.

【図11】従来の第1のデータ保管装置における複数種
類のデータファイルの保管の手順を示す図である。
FIG. 11 is a diagram showing a procedure for storing a plurality of types of data files in a conventional first data storage device.

【図12】従来の第2のデータ保管装置におけるデータ
ファイルの保管の手順を示す図である。
FIG. 12 is a diagram showing a procedure for storing a data file in a second conventional data storage device.

【図13】従来の第2のデータ保管装置における複数種
類のデータファイルの保管の手順を示す図である。
FIG. 13 is a diagram showing a procedure for storing a plurality of types of data files in a conventional second data storage device.

【符号の説明】[Explanation of symbols]

11 操作部 12 記憶部 13 検索情報作成部(検索情報作成手段) 14 登録処理部(登録手段) 15 検索処理部(検索手段) 16 再登録処理部(再登録手段) 101 データファイル 105 文書画像データ 106 レイアウト情報 107 テキスト情報 108 インデックス情報 109 コンテナ文書(管理文書ファイル) Reference Signs List 11 operation unit 12 storage unit 13 search information creation unit (search information creation means) 14 registration processing unit (registration means) 15 search processing unit (search means) 16 re-registration processing unit (re-registration means) 101 data file 105 document image data 106 Layout information 107 Text information 108 Index information 109 Container document (management document file)

Claims (39)

【特許請求の範囲】[Claims] 【請求項1】 データファイルをデータベースに登録し
て保管するデータ保管装置において、 前記データファイルを検索するための検索情報を該デー
タファイルに基づいて複数種類作成する検索情報作成手
段と、 該検索情報作成手段により作成された複数種類の検索情
報を前記データファイルと対応付けて該データファイル
と共に前記データベースに登録する登録手段とを備えた
ことを特徴とするデータ保管装置。
1. A data storage device for registering and storing a data file in a database, a search information creating means for creating a plurality of types of search information for searching the data file based on the data file, A data storage device comprising: a registration unit that associates a plurality of types of search information created by a creation unit with the data file and registers the search information in the database together with the data file.
【請求項2】 前記登録手段は、前記データファイルに
対応する管理文書ファイルを作成し、前記複数種類の検
索情報の各々を規定するための規定情報を前記管理文書
ファイル内に記述し、該管理文書ファイルを前記データ
ファイル及び前記複数種類の検索情報と共に前記データ
ベースに登録することを特徴とする請求項1記載のデー
タ保管装置。
2. The management unit creates a management document file corresponding to the data file, and describes, in the management document file, definition information for defining each of the plurality of types of search information. 2. The data storage device according to claim 1, wherein a document file is registered in the database together with the data file and the plurality of types of search information.
【請求項3】 前記登録手段は、前記データファイルに
対応する管理文書ファイルを作成し、前記複数種類の検
索情報の各々を規定するための規定情報を前記管理文書
ファイル内に記述すると共に前記データファイル及び前
記複数種類の検索情報を該管理文書ファイルに組み込
み、該管理文書ファイルを前記データベースに登録する
ことを特徴とする請求項1記載のデータ保管装置。
3. The registration means creates a management document file corresponding to the data file, and describes, in the management document file, definition information for defining each of the plurality of types of search information, 2. The data storage device according to claim 1, wherein a file and the plurality of types of search information are incorporated in the management document file, and the management document file is registered in the database.
【請求項4】 前記検索情報に基づいてデータファイル
を検索する検索手段を備え、前記登録手段は、前記管理
文書ファイルを特定するための管理情報を該管理文書フ
ァイルと共に登録し、前記検索手段は、前記検索情報に
基づいて検索されたデータファイルに対応する管理文書
ファイルに前記管理情報を付加して該管理文書ファイ
ル、前記検索されたデータファイル及び対応する検索情
報をユーザに提供することを特徴とする請求項2記載の
データ保管装置。
4. A search means for searching a data file based on the search information, wherein the registration means registers management information for specifying the management document file together with the management document file, and wherein the search means Adding the management information to a management document file corresponding to the data file searched based on the search information, and providing the user with the management document file, the searched data file, and the corresponding search information. 3. The data storage device according to claim 2, wherein
【請求項5】 前記検索情報に基づいてデータファイル
を検索する検索手段を備え、前記登録手段は、前記管理
文書ファイルを特定するための管理情報を該管理文書フ
ァイルと共に登録し、前記検索手段は、前記検索情報に
基づいて検索されたデータファイルが組み込まれている
管理文書ファイルに前記管理情報を付加して該管理文書
ファイルをユーザに提供することを特徴とする請求項3
記載のデータ保管装置。
5. A search unit for searching a data file based on the search information, wherein the registration unit registers management information for specifying the management document file together with the management document file, and wherein the search unit includes 4. The method according to claim 3, wherein the management information is added to a management document file in which the data file searched based on the search information is incorporated, and the management document file is provided to the user.
Data storage device as described.
【請求項6】 前記規定情報は、前記複数種類の検索情
報の各々が保管されているアドレスであることを特徴と
する請求項2〜5のいずれか1項に記載のデータ保管装
置。
6. The data storage device according to claim 2, wherein the definition information is an address at which each of the plurality of types of search information is stored.
【請求項7】 再登録手段を備え、該再登録手段は、前
記検索手段により検索された後に修正されたデータファ
イルを再登録する際、元のデータファイルの保管アドレ
スの記述を前記修正されたデータファイルが新たに保管
される保管アドレスに書き換えることを特徴とする請求
項6記載のデータ保管装置。
7. Re-registering means for re-registering a data file corrected after being searched by the searching means, the re-registering means rewriting the storage address description of the original data file. 7. The data storage device according to claim 6, wherein the data file is rewritten to a storage address that is newly stored.
【請求項8】 前記再登録手段は、前記管理情報に基づ
いて前記データベースに登録されている元のデータファ
イルを検索し、該検索した元のデータファイルを削除す
ることを特徴とする請求項7記載のデータ保管装置。
8. The system according to claim 7, wherein the re-registration unit searches for the original data file registered in the database based on the management information, and deletes the searched original data file. Data storage device as described.
【請求項9】 再登録手段を備え、該再登録手段は、前
記検索手段により検索された後に修正されたデータファ
イルを再登録する際、前記管理情報に基づいて前記デー
タベースに登録されている元のデータファイルを検索
し、該検索した元のデータファイルを前記修正されたデ
ータファイルに書き換えることを特徴とする請求項4記
載のデータ保管装置。
9. Re-registering means for re-registering a data file corrected after being searched by the search means, based on the management information, wherein the re-registering means 5. The data storage device according to claim 4, wherein the data file is searched for, and the searched original data file is rewritten with the corrected data file.
【請求項10】 再登録手段を備え、該再登録手段は、
前記検索手段により検索された後に修正されたデータフ
ァイルを再登録する際、該修正されたデータファイルに
基づいて複数種類の検索情報を新たに作成し、前記管理
情報に基づいて前記データベースに登録されている元の
検索情報を検索し、該検索した元の検索情報を前記新た
に作成した検索情報に書き換えることを特徴とする請求
項4記載のデータ保管装置。
10. A re-registration unit, comprising:
When re-registering a corrected data file after being searched by the search means, a plurality of types of search information are newly created based on the corrected data file and registered in the database based on the management information. 5. The data storage device according to claim 4, wherein the retrieved original search information is searched, and the searched original search information is rewritten with the newly created search information.
【請求項11】 再登録手段を備え、該再登録手段は、
前記検索手段により検索された後に修正されたデータフ
ァイルを再登録する際、前記管理情報に基づいて前記提
供された管理文書ファイルに組み込まれている元のデー
タファイルを検索し、該検索した元のデータファイルを
前記修正されたデータファイルに書き換え、該管理文書
ファイルを前記データベースに再登録することを特徴と
する請求項5記載のデータ保管装置。
11. A re-registration unit, comprising:
When re-registering the corrected data file after being searched by the search means, the original data file incorporated in the provided management document file is searched based on the management information, and the searched original file is searched. 6. The data storage device according to claim 5, wherein a data file is rewritten with the corrected data file, and the management document file is re-registered in the database.
【請求項12】 再登録手段を備え、該再登録手段は、
前記検索手段により検索された後に修正されたデータフ
ァイルを再登録する際、該修正されたデータファイルに
基づいて複数種類の検索情報を新たに作成し、前記管理
情報に基づいて前記提供された管理文書ファイルに組み
込まれている元の検索情報を検索し、該検索した元の検
索情報を前記新たに作成した検索情報に書き換え、該管
理文書ファイルを前記データベースに再登録することを
特徴とする請求項5記載のデータ保管装置。
12. A re-registration means, comprising:
When re-registering a corrected data file after being searched by the search means, a plurality of types of search information are newly created based on the corrected data file, and the provided management is performed based on the management information. Searching for original search information embedded in the document file, rewriting the searched original search information with the newly created search information, and re-registering the management document file in the database. Item 6. The data storage device according to Item 5.
【請求項13】 前記複数種類の検索情報には、前記デ
ータファイルを文書画像化した画像データ、前記データ
ファイルから抽出したテキストデータ、及び前記データ
ファイルのレイアウト情報の少なくとも一つが含まれる
ことを特徴とする請求項1〜12のいずれか1項に記載
のデータ保管装置。
13. The plurality of types of search information include at least one of image data obtained by converting the data file into a document image, text data extracted from the data file, and layout information of the data file. The data storage device according to claim 1.
【請求項14】 前記画像データは、画像化後に読み取
り可能な範囲内の低解像度で前記データファイルを画像
化して得られることを特徴とする請求項13記載のデー
タ保管装置。
14. The data storage device according to claim 13, wherein the image data is obtained by imaging the data file at a low resolution within a readable range after imaging.
【請求項15】 前記テキストデータは、前記データフ
ァイルから直接抽出して得られることを特徴とする請求
項13または14記載のデータ保管装置。
15. The data storage device according to claim 13, wherein the text data is obtained by directly extracting the text data from the data file.
【請求項16】 前記検索情報作成手段は、文字認識手
段及びレイアウト解析手段を備え、前記テキストデータ
は、レイアウト解析によりテキスト領域と認識された領
域に対して文字認識処理を行うことにより得られること
を特徴とする請求項13または14記載のデータ保管装
置。
16. The search information creating means includes a character recognizing means and a layout analyzing means, and the text data is obtained by performing a character recognizing process on an area recognized as a text area by layout analysis. The data storage device according to claim 13 or 14, wherein:
【請求項17】 前記検索情報作成手段は、レイアウト
解析手段を備え、前記レイアウト情報は、前記データフ
ァイルを文書画像化した画像データに対してレイアウト
解析を行うことにより得られることを特徴とする請求項
13〜16のいずれか1項に記載のデータ保管装置。
17. The method according to claim 17, wherein the search information creating unit includes a layout analyzing unit, and the layout information is obtained by performing a layout analysis on image data obtained by converting the data file into a document image. Item 17. The data storage device according to any one of Items 13 to 16.
【請求項18】 前記登録手段は、前記画像データの作
成及び前記データベースへの登録を、ユーザの所望によ
り前記データファイルの登録処理がなされた後に行うこ
とを特徴とする請求項13〜17のいずれか1項に記載
のデータ保管装置。
18. The apparatus according to claim 13, wherein said registering means performs the creation of the image data and the registration in the database after the registration processing of the data file is performed as desired by a user. 2. The data storage device according to claim 1.
【請求項19】 データファイルをデータベースに登録
して保管するデータ保管方法において、 前記データファイルを検索するための検索情報を該デー
タファイルに基づいて複数種類作成する検索情報作成工
程と、 該検索情報作成工程により作成された複数種類の検索情
報を前記データファイルと対応付けて該データファイル
と共に前記データベースに登録する登録工程とを含むこ
とを特徴とするデータ保管方法。
19. A data storage method for registering and storing a data file in a database, wherein a search information creating step of creating a plurality of types of search information for searching the data file based on the data file; A registration step of associating a plurality of types of search information created in the creation step with the data file and registering the information together with the data file in the database.
【請求項20】 前記登録工程は、前記データファイル
に対応する管理文書ファイルを作成し、前記複数種類の
検索情報の各々を規定するための規定情報を前記管理文
書ファイル内に記述し、該管理文書ファイルを前記デー
タファイル及び前記複数種類の検索情報と共に前記デー
タベースに登録することを特徴とする請求項19記載の
データ保管方法。
20. The registration step, wherein a management document file corresponding to the data file is created, and definition information for defining each of the plurality of types of search information is described in the management document file. 20. The data storage method according to claim 19, wherein a document file is registered in the database together with the data file and the plurality of types of search information.
【請求項21】 前記登録工程は、前記データファイル
に対応する管理文書ファイルを作成し、前記複数種類の
検索情報の各々を規定するための規定情報を前記管理文
書ファイル内に記述すると共に前記データファイル及び
前記複数種類の検索情報を該管理文書ファイルに組み込
み、該管理文書ファイルを前記データベースに登録する
ことを特徴とする請求項19記載のデータ保管方法。
21. The registration step, wherein a management document file corresponding to the data file is created, definition information for defining each of the plurality of types of search information is described in the management document file, and 20. The data storage method according to claim 19, wherein a file and the plurality of types of search information are incorporated in the management document file, and the management document file is registered in the database.
【請求項22】 前記検索情報に基づいてデータファイ
ルを検索する検索工程を含み、前記登録工程は、前記管
理文書ファイルを特定するための管理情報を該管理文書
ファイルと共に登録し、前記検索工程は、前記検索情報
に基づいて検索されたデータファイルに対応する管理文
書ファイルに前記管理情報を付加して該管理文書ファイ
ル、前記検索されたデータファイル及び対応する検索情
報をユーザに提供することを特徴とする請求項20記載
のデータ保管方法。
22. A search step for searching for a data file based on the search information, wherein the registration step registers management information for specifying the management document file together with the management document file, and the search step includes Adding the management information to a management document file corresponding to the data file searched based on the search information, and providing the user with the management document file, the searched data file, and the corresponding search information. The data storage method according to claim 20, wherein:
【請求項23】 前記検索情報に基づいてデータファイ
ルを検索する検索工程を含み、前記登録工程は、前記管
理文書ファイルを特定するための管理情報を該管理文書
ファイルと共に登録し、前記検索工程は、前記検索情報
に基づいて検索されたデータファイルが組み込まれてい
る管理文書ファイルに前記管理情報を付加して該管理文
書ファイルをユーザに提供することを特徴とする請求項
21記載のデータ保管方法。
23. A search step for searching a data file based on the search information, wherein the registration step registers management information for specifying the management document file together with the management document file, and the search step includes 22. The data storage method according to claim 21, wherein the management information file is provided to a user by adding the management information to a management document file in which a data file searched based on the search information is incorporated. .
【請求項24】 前記規定情報は、前記複数種類の検索
情報の各々が保管されているアドレスであることを特徴
とする請求項20〜23のいずれか1項に記載のデータ
保管方法。
24. The data storage method according to claim 20, wherein the definition information is an address where each of the plurality of types of search information is stored.
【請求項25】 再登録工程を含み、該再登録工程は、
前記検索工程により検索された後に修正されたデータフ
ァイルを再登録する際、元のデータファイルの保管アド
レスの記述を前記修正されたデータファイルが新たに保
管される保管アドレスに書き換えることを特徴とする請
求項24記載のデータ保管方法。
25. A re-registration step, comprising:
When re-registering a corrected data file after being searched in the search step, the description of the storage address of the original data file is rewritten to a storage address where the corrected data file is newly stored. The data storage method according to claim 24.
【請求項26】 前記再登録工程は、前記管理情報に基
づいて前記データベースに登録されている元のデータフ
ァイルを検索し、該検索した元のデータファイルを削除
することを特徴とする請求項25記載のデータ保管方
法。
26. The re-registering step, wherein an original data file registered in the database is searched based on the management information, and the searched original data file is deleted. Data storage method described.
【請求項27】 再登録工程を含み、該再登録工程は、
前記検索工程により検索された後に修正されたデータフ
ァイルを再登録する際、前記管理情報に基づいて前記デ
ータベースに登録されている元のデータファイルを検索
し、該検索した元のデータファイルを前記修正されたデ
ータファイルに書き換えることを特徴とする請求項22
記載のデータ保管方法。
27. A re-registration step, comprising:
When re-registering a data file corrected after being searched in the search step, the original data file registered in the database is searched based on the management information, and the searched original data file is corrected. 23. A data file which is rewritten to a data file.
Data storage method described.
【請求項28】 再登録工程を含み、該再登録工程は、
前記検索工程により検索された後に修正されたデータフ
ァイルを再登録する際、該修正されたデータファイルに
基づいて複数種類の検索情報を新たに作成し、前記管理
情報に基づいて前記データベースに登録されている元の
検索情報を検索し、該検索した元の検索情報を前記新た
に作成した検索情報に書き換えることを特徴とする請求
項22記載のデータ保管方法。
28. A re-registration step, comprising:
When re-registering a corrected data file after being searched in the search step, a plurality of types of search information are newly created based on the corrected data file, and registered in the database based on the management information. 23. The data storage method according to claim 22, further comprising: searching for the original search information, and rewriting the searched original search information with the newly created search information.
【請求項29】 再登録工程を含み、該再登録工程は、
前記検索工程により検索された後に修正されたデータフ
ァイルを再登録する際、前記管理情報に基づいて前記提
供された管理文書ファイルに組み込まれている元のデー
タファイルを検索し、該検索した元のデータファイルを
前記修正されたデータファイルに書き換え、該管理文書
ファイルを前記データベースに再登録することを特徴と
する請求項23記載のデータ保管方法。
29. A re-registration step, comprising:
When re-registering a corrected data file after being searched by the search step, the original data file incorporated in the provided management document file is searched based on the management information, and the searched original 24. The data storage method according to claim 23, wherein a data file is rewritten with the corrected data file, and the management document file is re-registered in the database.
【請求項30】 再登録工程を含み、該再登録工程は、
前記検索工程により検索された後に修正されたデータフ
ァイルを再登録する際、該修正されたデータファイルに
基づいて複数種類の検索情報を新たに作成し、前記管理
情報に基づいて前記提供された管理文書ファイルに組み
込まれている元の検索情報を検索し、該検索した元の検
索情報を前記新たに作成した検索情報に書き換え、該管
理文書ファイルを前記データベースに再登録することを
特徴とする請求項23記載のデータ保管方法。
30. A re-registration step, comprising:
When re-registering the corrected data file after being searched in the search step, a plurality of types of search information are newly created based on the corrected data file, and the provided management is performed based on the management information. Searching for original search information embedded in the document file, rewriting the searched original search information with the newly created search information, and re-registering the management document file in the database. Item 24. The data storage method according to Item 23.
【請求項31】 前記複数種類の検索情報には、前記デ
ータファイルを文書画像化した画像データ、前記データ
ファイルから抽出したテキストデータ、及び前記データ
ファイルのレイアウト情報の少なくとも一つが含まれる
ことを特徴とする請求項19〜30のいずれか1項に記
載のデータ保管方法。
31. The plurality of types of search information include at least one of image data obtained by converting the data file into a document image, text data extracted from the data file, and layout information of the data file. The data storage method according to any one of claims 19 to 30, wherein
【請求項32】 前記画像データは、画像化後に読み取
り可能な範囲内の低解像度で前記データファイルを画像
化して得られることを特徴とする請求項31記載のデー
タ保管方法。
32. The data storage method according to claim 31, wherein the image data is obtained by imaging the data file at a low resolution within a readable range after imaging.
【請求項33】 前記テキストデータは、前記データフ
ァイルから直接抽出して得られることを特徴とする請求
項31または32記載のデータ保管方法。
33. The data storage method according to claim 31, wherein the text data is obtained by directly extracting the text data from the data file.
【請求項34】 前記検索情報作成工程は、文字認識工
程及びレイアウト解析工程を含み、前記テキストデータ
は、レイアウト解析によりテキスト領域と認識された領
域に対して文字認識処理を行うことにより得られること
を特徴とする請求項31または32記載のデータ保管方
法。
34. The search information creating step includes a character recognition step and a layout analysis step, and the text data is obtained by performing a character recognition process on an area recognized as a text area by layout analysis. 33. The data storage method according to claim 31, wherein:
【請求項35】 前記検索情報作成工程は、レイアウト
解析工程を含み、前記レイアウト情報は、前記データフ
ァイルを文書画像化した画像データに対してレイアウト
解析を行うことにより得られることを特徴とする請求項
31〜34のいずれか1項に記載のデータ保管方法。
35. The search information creating step includes a layout analyzing step, wherein the layout information is obtained by performing a layout analysis on image data obtained by converting the data file into a document image. Item 36. The data storage method according to any one of Items 31 to 34.
【請求項36】 前記登録工程は、前記画像データの作
成及び前記データベースへの登録を、ユーザの所望によ
り前記データファイルの登録処理がなされた後に行うこ
とを特徴とする請求項31〜35のいずれか1項に記載
のデータ保管方法。
36. The method according to claim 31, wherein in the registering step, the creation of the image data and the registration in the database are performed after the registration processing of the data file is performed as desired by a user. 2. The data storage method according to claim 1.
【請求項37】 データファイルをデータベースに登録
して保管するデータ保管方法で使用されるプログラムを
記憶した記憶媒体において、 前記データファイルを検索するための検索情報を該デー
タファイルに基づいて複数種類作成する検索情報作成工
程のコードと、 該検索情報作成工程のコードにより作成された複数種類
の検索情報を前記データファイルと対応付けて該データ
ファイルと共に前記データベースに登録する登録工程の
コードとを記憶したことを特徴とする記憶媒体。
37. A storage medium storing a program used in a data storage method for registering and storing a data file in a database, wherein a plurality of types of search information for searching the data file are created based on the data file. And a code of a registration step of registering a plurality of types of search information created by the code of the search information creating step with the data file and registering the same in the database together with the data file. A storage medium characterized by the above-mentioned.
【請求項38】 前記登録工程のコードは、前記データ
ファイルに対応する管理文書ファイルを作成し、前記複
数種類の検索情報の各々を規定するための規定情報を前
記管理文書ファイル内に記述し、該管理文書ファイルを
前記データファイル及び前記複数種類の検索情報と共に
前記データベースに登録することを特徴とする請求項3
7記載の記憶媒体。
38. The code of the registration step, wherein a management document file corresponding to the data file is created, and definition information for defining each of the plurality of types of search information is described in the management document file; 4. The management document file is registered in the database together with the data file and the plurality of types of search information.
7. The storage medium according to 7.
【請求項39】 前記登録工程のコードは、前記データ
ファイルに対応する管理文書ファイルを作成し、前記複
数種類の検索情報の各々を規定するための規定情報を前
記管理文書ファイル内に記述すると共に前記データファ
イル及び前記複数種類の検索情報を該管理文書ファイル
に組み込み、該管理文書ファイルを前記データベースに
登録することを特徴とする請求項37記載の記憶媒体。
39. The code of the registration step creates a management document file corresponding to the data file, and describes definition information for defining each of the plurality of types of search information in the management document file. The storage medium according to claim 37, wherein the data file and the plurality of types of search information are incorporated in the management document file, and the management document file is registered in the database.
JP2000109817A 2000-04-11 2000-04-11 Data storage device and method and storage medium Withdrawn JP2001297104A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000109817A JP2001297104A (en) 2000-04-11 2000-04-11 Data storage device and method and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000109817A JP2001297104A (en) 2000-04-11 2000-04-11 Data storage device and method and storage medium

Publications (1)

Publication Number Publication Date
JP2001297104A true JP2001297104A (en) 2001-10-26

Family

ID=18622437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000109817A Withdrawn JP2001297104A (en) 2000-04-11 2000-04-11 Data storage device and method and storage medium

Country Status (1)

Country Link
JP (1) JP2001297104A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100484138B1 (en) * 2002-05-08 2005-04-18 삼성전자주식회사 XML indexing method for regular path expression queries in relational database and data structure thereof.
JP2011159185A (en) * 2010-02-03 2011-08-18 Hitachi Ltd Data management method
JP2014106744A (en) * 2012-11-27 2014-06-09 Canon Marketing Japan Inc Information processing device, information processing method, program, and information processing system
JP2014171053A (en) * 2013-03-01 2014-09-18 Sky Com:Kk Electronic document container data file, electronic document container data file generating apparatus, electronic document container data file generating program, server apparatus, and electronic document container data file generating method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100484138B1 (en) * 2002-05-08 2005-04-18 삼성전자주식회사 XML indexing method for regular path expression queries in relational database and data structure thereof.
JP2011159185A (en) * 2010-02-03 2011-08-18 Hitachi Ltd Data management method
JP2014106744A (en) * 2012-11-27 2014-06-09 Canon Marketing Japan Inc Information processing device, information processing method, program, and information processing system
JP2014171053A (en) * 2013-03-01 2014-09-18 Sky Com:Kk Electronic document container data file, electronic document container data file generating apparatus, electronic document container data file generating program, server apparatus, and electronic document container data file generating method

Similar Documents

Publication Publication Date Title
US6895550B2 (en) Computer-implemented PDF document management
US7698258B2 (en) Searchable storage system
US7072983B1 (en) Scheme for systemically registering meta-data with respect to various types of data
US7130867B2 (en) Information component based data storage and management
US20020049731A1 (en) Information processing method and apparatus
US7072889B2 (en) Document retrieval using index of reduced size
US20060190815A1 (en) Structuring data for word processing documents
US20060277452A1 (en) Structuring data for presentation documents
US20070038676A1 (en) Information storage and retrieval system for storing and retrieving the visual form of information from an application in a database
KR20080033945A (en) Intelligent container index and search
JPH08255155A (en) Device and method for full-text registered word retrieval
KR20060070420A (en) File formats, methods, and computer program products for representing documents
US6985894B2 (en) Document management method and computer-readable storage medium storing program code for executing the same
US20030182262A1 (en) Apparatus, system, method and computer program product
JP2001067348A (en) Method and device for compressing structured documents and computer-readable recording medium recording structured document compressing program
US20110078552A1 (en) Transclusion Process
US20050234987A1 (en) Smart archive for jar files
US6629101B1 (en) Data processing method and apparatus, and storage medium
JP2001297104A (en) Data storage device and method and storage medium
US20020120612A1 (en) Document management system, document management method, and computer-readable storage medium including the same
JP2008084341A (en) Structured document compressing method, compressing device, and computer-readable recording medium recording structured document compressing program
WO2006133136A2 (en) Structuring data for word processing documents
JP4480109B2 (en) Image management apparatus and image management method
JP4521413B2 (en) Database management system and program
US20040164989A1 (en) Method and apparatus for disclosing information, and medium for recording information disclosure program

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060308

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070703