JP2000200206A - Device and method for data management and recording medium - Google Patents

Device and method for data management and recording medium

Info

Publication number
JP2000200206A
JP2000200206A JP10376930A JP37693098A JP2000200206A JP 2000200206 A JP2000200206 A JP 2000200206A JP 10376930 A JP10376930 A JP 10376930A JP 37693098 A JP37693098 A JP 37693098A JP 2000200206 A JP2000200206 A JP 2000200206A
Authority
JP
Japan
Prior art keywords
information
data
item
database
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10376930A
Other languages
Japanese (ja)
Inventor
Akihiko Matsuoka
彰彦 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Railway Technical Research Institute
Original Assignee
Railway Technical Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Railway Technical Research Institute filed Critical Railway Technical Research Institute
Priority to JP10376930A priority Critical patent/JP2000200206A/en
Publication of JP2000200206A publication Critical patent/JP2000200206A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To make easily performable design, construction, and alter of a data base. SOLUTION: The data structure of the data base is defined only with items and their contents. The same management number, i.e., a record number 1 in this case is assigned to a number '00', a name 'Yamada', an age '30', and height '165' and the same record number, i.e., a record number 2 is assigned for a next number '01', a name 'Satoh', an age '25', and height '160'. Items are retrieved with a retrieval key 1 and contents are retrieved with a retrieval key 2 respectively to obtain sets of management numbers. Data whose contents of the items specified with the retrieval key 1 match the retrieval key 2 can be retrieved from a set of the management numbers obtained by ANDing the respective management numbers.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、データ管理装置お
よびデータ管理方法、並びに記録媒体に関し、特に、デ
ータ構造の制約をなくすことにより、不特定のデータ項
目を対象とするデータベースを効率的に作成することが
できるデータ管理装置およびデータ管理方法、並びに記
録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data management device, a data management method, and a recording medium, and more particularly, to a database for an unspecified data item efficiently by eliminating a restriction on a data structure. The present invention relates to a data management device, a data management method, and a recording medium that can perform the operations.

【0002】[0002]

【従来の技術】従来のデータベース管理システム(DB
MS(database management sy
stem))は、利用者やアプリケーションプログラム
との間でデータやスキーマをアクセスさせるための基本
機能として、データベース定義言語、データベース操作
言語、問い合わせ言語等の実行機能を有している。
2. Description of the Related Art A conventional database management system (DB)
MS (database management sy)
) has execution functions such as a database definition language, a database operation language, and an inquiry language as basic functions for accessing data and schema between a user and an application program.

【0003】データベース定義言語は、格納するデータ
の構造を定義するためのものであり、例えば、リレーシ
ョナルデータベースでは、図7に示すように、番号、名
前、性別、年齢、身長などのような項目(フィールド)
を持つデータ構造を、例えば、次にように定義する。
[0003] The database definition language is used to define the structure of data to be stored. For example, in a relational database, items such as numbers, names, genders, ages, and heights (see FIG. 7) are used. field)
Is defined as follows, for example.

【0004】 create table person ( number integer, {番号:整数型} name char(10), {名前:文字型(10)} sex char(2), {性別:文字型(2)} age integer, {年齢:整数型} height float {身長:小数型} );Create table person (number integer, {number: integer type} name char (10), {name: character type (10)} sex char (2), {sex: character type (2)} age integer, { Age: integer type} height float {height: decimal type});

【0005】データベース操作言語は、上記のように定
義されたデータ構造に基づいて、データの登録、削除、
及び追加を行ったり、データベースの結合、分割などを
行うことができる。
[0005] The database operation language is used to register, delete, and register data based on the data structure defined as described above.
And addition, or combining and dividing databases.

【0006】また、問い合わせ言語は、データベースと
利用者の間のインタフェース言語であり、利用者が目的
の情報をデータベースから検索するとき、用いられる。
[0006] The query language is an interface language between the database and the user, and is used when the user searches for desired information from the database.

【0007】このように、従来のデータベース管理シス
テムにおいては、データベース設計によって、格納する
データの枠組み(スキーマ)を予め設定しておく必要が
あった。
As described above, in the conventional database management system, it is necessary to previously set the framework (schema) of the data to be stored by designing the database.

【0008】[0008]

【発明が解決しようとする課題】このように、従来の既
存のほとんどのデータベース管理システムは、データベ
ース定義言語で定義されたデータ構造に基づいて、情報
の登録、削除、検索などの操作を行っており、データ構
造に変更が発生すると、変更前のデータ構造に基づいて
開発されたアプリケーションプログラムも変更する必要
があり、面倒である課題があった。
As described above, most of the existing database management systems perform operations such as registration, deletion, and retrieval of information based on a data structure defined in a database definition language. Therefore, when a change occurs in the data structure, it is necessary to change the application program developed based on the data structure before the change, which has been a troublesome problem.

【0009】また、これまで、データ構造を定義すると
きは、データベースの蓄積装置の記憶容量や処理能力な
どに制約があるため、なるべく、蓄積装置の記憶領域の
空きを少なくし、取り扱うデータの型を明示的に記述す
る必要があった。ところが、現在では、大容量の記憶装
置が安価で提供され、コンピュータの処理能力も飛躍的
に向上しており、記憶容量や処理能力などの物理的な制
約が、データベースの仕様にほとんど影響を及ぼさない
状況になっている。
In the past, when defining a data structure, there are restrictions on the storage capacity and processing capacity of the storage device of the database. Had to be written explicitly. However, nowadays, large-capacity storage devices are provided at low cost, and the processing capacity of computers has been dramatically improved. Physical limitations such as storage capacity and processing capacity have little effect on database specifications. There is no situation.

【0010】本発明はこのような状況に鑑みてなされた
ものであり、データ構造の制約をなくし、煩雑なデータ
ベース設計を行うことなく、効率的にデータベースの設
計及び構築を行うことができるようにするものである。
The present invention has been made in view of such circumstances, and has been made in view of the above circumstances. Thus, it is possible to eliminate the restriction on the data structure and efficiently design and build a database without complicated database design. Is what you do.

【0011】[0011]

【課題を解決するための手段】請求項1に記載のデータ
管理装置は、少なくとも、第1の項目のデータと第2の
項目のデータとからなり、第1の項目のデータと第2の
項目のデータとがタグによって識別可能な1または複数
の第1の情報から構成される第2の情報を入力する入力
手段と、入力手段によって入力された第2の情報を記憶
する第1の記憶手段と、第2の情報からタグを除いた第
3の情報を記憶する第2の記憶手段と、第2の記憶手段
に記憶された第3の情報に対して、少なくとも、第1の
項目に対する第1の検索キーと第2の項目に対する第2
の検索キーに基づいて検索を行う検索手段と、検索手段
によって検索された第1の情報を構成要素とする第2の
情報を出力する出力手段とを備えることを特徴とする。
また、文書データをタグ付きの第2の情報に変換する変
換手段をさらに設けるようにすることができる。また、
第1の項目のデータは、第1の情報の種類を表し、第2
の項目のデータは、第1の情報の内容を表すようにする
ことができる。請求項4に記載のデータ管理方法は、少
なくとも、第1の項目のデータと第2の項目のデータと
からなり、第1の項目のデータと第2の項目のデータと
がタグによって識別可能な1または複数の第1の情報か
ら構成される第2の情報を入力し、入力された第2の情
報を記憶し、第2の情報からタグを除いた第3の情報を
記憶し、記憶された第3の情報に対して、少なくとも、
第1の項目に対する第1の検索キーと第2の項目に対す
る第2の検索キーに基づいて検索を行い、検索された第
1の情報を構成要素とする第2の情報を出力することを
特徴とする。請求項5に記載の記録媒体は、請求項4に
記載のデータ管理方法を実行可能なプログラムが記録さ
れていることを特徴とする。本発明に係るデータ管理装
置およびデータ管理方法、並びに記録媒体においては、
少なくとも、第1の項目のデータと第2の項目のデータ
とからなり、第1の項目のデータと第2の項目のデータ
とがタグによって識別可能な1または複数の第1の情報
から構成される第2の情報を入力し、入力された第2の
情報を記憶し、第2の情報からタグを除いた第3の情報
を記憶し、記憶された第3の情報に対して、少なくと
も、第1の項目に対する第1の検索キーと第2の項目に
対する第2の検索キーに基づいて検索を行い、検索され
た第1の情報を構成要素とする第2の情報を出力する。
According to a first aspect of the present invention, there is provided a data management apparatus comprising at least a first item data and a second item data, wherein the first item data and the second item data. Means for inputting second information composed of one or more pieces of first information whose data can be identified by a tag, and first storage means for storing the second information input by the input means And second storage means for storing third information obtained by removing the tag from the second information; and at least third information for the first item with respect to the third information stored in the second storage means. 1 search key and 2nd item for 2nd item
A search unit that performs a search based on the search key, and an output unit that outputs second information having the first information searched by the search unit as a component.
Further, it is possible to further provide a conversion means for converting the document data into tagged second information. Also,
The data of the first item indicates the type of the first information,
Can represent the contents of the first information. The data management method according to claim 4 includes at least data of a first item and data of a second item, and the data of the first item and the data of the second item can be identified by a tag. Inputting second information composed of one or a plurality of first information, storing the input second information, storing third information obtained by removing a tag from the second information; At least for the third information
A search is performed based on a first search key for a first item and a second search key for a second item, and second information having the searched first information as a component is output. And A recording medium according to a fifth aspect is characterized by recording a program capable of executing the data management method according to the fourth aspect. In the data management device, the data management method, and the recording medium according to the present invention,
At least, data of the first item and data of the second item are included, and the data of the first item and the data of the second item are composed of one or a plurality of pieces of first information that can be identified by a tag. Input second information, store the input second information, store third information obtained by removing a tag from the second information, and at least store the third information with respect to the stored third information. A search is performed based on a first search key for the first item and a second search key for the second item, and second information having the searched first information as a component is output.

【0012】[0012]

【発明の実施の形態】図1は、本発明のデータベース管
理装置の一実施の形態の構成例を示すブロック図であ
る。同図に示すように、本実施の形態は、データベース
を管理するためのドキュメント管理サーバ(WS(ワー
クステーション))1と、それにアクセスするための各
アプリケーションからなるドキュメント管理クライアン
ト(PC(パーソナルコンピュータ))10によって構
成されている。
FIG. 1 is a block diagram showing a configuration example of an embodiment of a database management apparatus according to the present invention. As shown in FIG. 1, in the present embodiment, a document management server (WS (work station)) 1 for managing a database and a document management client (PC (personal computer)) including applications for accessing the document management server (WS (work station)) ) 10.

【0013】ドキュメント管理サーバ1は、文書管理デ
ータベース2と、図表管理データベース3と、全文デー
タベース4とを有している。文書管理データベース2と
図表管理データベース3は、ファイル管理を行うための
ものであり、リレーショナルデータベースを用いて索引
情報等を管理するようになされている。
The document management server 1 has a document management database 2, a chart management database 3, and a full-text database 4. The document management database 2 and the chart management database 3 are for performing file management, and manage index information and the like using a relational database.

【0014】また、文書管理データベース2では、オリ
ジナル文書(例えば、各種ワープロ文書)と構造化文書
(例えば、SGML(Standard Genera
lized Markup Language)に準拠
したタグ付き文書)による2種類の管理形式があり、後
者には図表管理データベース3に記憶されている図表デ
ータファイルへのリンク情報なども組み込まれている。
In the document management database 2, original documents (for example, various word processing documents) and structured documents (for example, SGML (Standard Genera) are stored.
There are two types of management formats based on a tagged document (compliant with a sized markup language), and the latter incorporates link information to a chart data file stored in the chart management database 3.

【0015】一方、全文データベース4には、文書内の
全文に対して、フリーワードによる検索が行えるよう
に、構造化文書の全テキスト情報(タグを除く)を登録
管理するようになされている。
On the other hand, in the full-text database 4, all text information (excluding tags) of the structured document is registered and managed so that a free word search can be performed for all the text in the document.

【0016】PC上で稼働するドキュメント管理クライ
アント10は、ドキュメント管理サーバ1上の各データ
ベースへのデータの登録を行う登録用アプリケーション
11と、後述する検索アプリケーション13によって検
索された検索結果を利用して文書を作成する編集用アプ
リケーション12と、文書管理データベース2、図表管
理データベース3、及び全文データベース4のデータを
検索する検索用アプリケーション13より構成されてい
る。
A document management client 10 running on a PC uses a registration application 11 for registering data in each database on the document management server 1 and a search result searched by a search application 13 described later. The system includes an editing application 12 for creating a document, and a search application 13 for searching data in the document management database 2, the diagram management database 3, and the full-text database 4.

【0017】また、登録用、検索用の各アプリケーショ
ン11,13には、それぞれがアクセスする各データベ
ースに対応するクライアントが用意されており、個々の
データベース毎にアプリケーションを構築することがで
きるようになされている。
Each of the registration and search applications 11 and 13 is provided with a client corresponding to each database to be accessed, so that an application can be constructed for each database. ing.

【0018】ここで、文書管理データベース2に記憶さ
れるオリジナル文書ファイルは、対応するアプリケーシ
ョンを使用することにより、再利用(編集、印刷)がで
きる文書ファイルのことをいう。また、図表データファ
イルを併せ持つワープロ文書等については、それらを1
つのファイルにまとめて、オリジナル文書とすることも
できる。文書管理データベース2には、システムが自動
付与する管理番号とともに、表題、著者名などの索引情
報、オリジナル文書ファイルの格納情報が登録される。
ただし、オリジナル文書ファイルの実体は、各利用者毎
に定められたWS上に分散して格納される。
Here, the original document file stored in the document management database 2 is a document file that can be reused (edited and printed) by using a corresponding application. In addition, for word processing documents that also have chart data files,
It can be combined into a single file to create an original document. In the document management database 2, index information such as a title and an author name, and storage information of an original document file are registered together with a management number automatically given by the system.
However, the entity of the original document file is distributed and stored on the WS defined for each user.

【0019】また、図表データファイルとは、図、写真
などのイメージデータファイル、或いは、ロータス(L
otus)(Lotusは、Lotus Develo
pment Corporationの登録商標)、エ
クセル(Excel)(Excelは、米国Micro
soft Corporationの米国及びその他の
国における商標)等の表データファイルをオリジナル文
書ファイルとは独立した個々のデータとしてデータベー
スに登録したものをいう。図表データを登録する場合に
は、文書データを登録する場合と同様に、索引情報を図
表データに付与する必要がある。
A chart data file is an image data file such as a figure or a photograph, or a Lotus (L
otus) (Lotus is Lotus Develo)
pment Corporation), Excel (Excel is a US Micro
(Trademark of Soft Corporation in the United States and other countries) is registered in a database as individual data independent of the original document file. When registering chart data, it is necessary to add index information to chart data as in the case of registering document data.

【0020】構造化文書は、オリジナル文書、又は、O
CR等で読みとった印刷文書をベースにして、テキスト
部分を抜き出した後、文章構造解析プログラムを介して
タグ情報を付与する等の編集処理を施すことによって作
成される。作成された構造化文書は、索引情報が付与さ
れた後、単独、或いはオリジナル文書を伴って、文書管
理データベース2に登録される。また、登録された構造
化文書のテキストデータは、自動的に、全文データベー
ス4に登録されるようになされている。
The structured document is an original document or O
It is created by extracting a text portion based on a print document read by a CR or the like and then performing an editing process such as adding tag information via a sentence structure analysis program. The created structured document is registered in the document management database 2 alone or together with the original document after the index information is added. Further, the text data of the registered structured document is automatically registered in the full-text database 4.

【0021】登録文書に付与される管理番号には、形式
(オリジナル文書、構造化文書、全文データベース文
書)が異なる同一文書を管理する共通文書番号と、各文
書毎に固有な個別文書番号の2つがあり、文書管理デー
タベース2では、各索引情報をキーとして、共通文書番
号が検索される。また、共通文書番号をキーとして、オ
リジナル文書、構造化文書をダウンロードすることがで
きるようになされている。
The management numbers assigned to the registered documents include a common document number for managing the same document having different formats (original document, structured document, full-text database document) and an individual document number unique to each document. In the document management database 2, a common document number is searched using each index information as a key. The original document and the structured document can be downloaded using the common document number as a key.

【0022】図表管理データベース3は、索引情報をキ
ーとして、図形データ番号を検索し、これを元に図表デ
ータファイルをダウンロードすることができるようにな
されている。また、文書管理データベース2において検
索された構造化文書の図表データへのリンク情報を用い
て、同様に図表データを検索することもできる。
The chart management database 3 retrieves a graphic data number using index information as a key, and can download a chart data file based on the figure data number. Further, the chart data can be similarly searched using the link information to the chart data of the structured document searched in the document management database 2.

【0023】全文データベース4に記憶されている登録
文書の検索は、利用者が入力した文字列を登録文書の中
から探し出し、共通文書番号、又はその文脈(又は段
落)のテキストを検索クライアントに送信することによ
り、行うことができる。
In the search of the registered document stored in the full-text database 4, a character string input by the user is searched from the registered document, and the common document number or the text of the context (or paragraph) is transmitted to the search client. Can be performed.

【0024】図2は、本発明のデータベース管理装置が
扱うデータのデータ構造の例を示している。同図に示す
ように、データは「項目」と「その内容」の形式を必ず
有している。この例の場合、データ1は、項目「番号」
の内容が「00」であり、項目「名前」の内容が「山
田」である。また、項目「年齢」の内容が「30」、項
目「身長」の内容が「165」である。データ2は、項
目「番号」の内容が「01」、項目「名前」の内容が
「佐藤」、項目「年齢」の内容が「25」、項目「身
長」の内容が「160」である。
FIG. 2 shows an example of a data structure of data handled by the database management device of the present invention. As shown in the figure, data always has a format of "item" and "contents". In the case of this example, data 1 is the item “number”
Is “00”, and the content of the item “name” is “Yamada”. The content of the item “age” is “30”, and the content of the item “height” is “165”. In the data 2, the content of the item "number" is "01", the content of the item "name" is "Sato", the content of the item "age" is "25", and the content of the item "height" is "160".

【0025】このデータ構造は、従来のRDB(rel
ational database)の場合においても
同様である。例えば、データ1の「名前」項目の内容
は、「山田」である。RDBの場合のデータ1(番号が
00、名前が山田、性別が男、年齢が30、身長が16
5)が、本実施の形態の項目「番号」乃至項目「身長」
に該当する。
This data structure corresponds to a conventional RDB (rel
It is the same in the case of the national database. For example, the content of the “name” item of data 1 is “Yamada”. Data 1 for RDB (number is 00, name is Yamada, gender is male, age is 30, height is 16
5) are the items “number” to “height” in the present embodiment.
Corresponds to.

【0026】このように、本実施の形態では、データ構
造は、次のような形式、即ち、項目と内容のみで定義さ
れる。(フィールド1 項目 文字列)、(フィールド
2項目 文字列/バイナリ)、・・・、(フィールドN
項目 文字列)。
As described above, in the present embodiment, the data structure is defined by the following format, that is, only items and contents. (Field 1 item character string), (field 2 item character string / binary), ..., (field N
Item string).

【0027】データが項目とその内容のみで構成される
ため、データを作成するときには、データベースの定義
を意識することなく、以下のように、タグ付きのテキス
ト情報(構造化文書)を作成すればよい。
Since data is composed of only items and their contents, when creating data, it is possible to create tagged text information (structured document) as described below without regard to the definition of the database. Good.

【0028】 [0028]

【0029】ここで、文字列「<data>」は、デー
タの始まりを示すタグである。文字列「<item>」
は、次に続く文字列が項目の種類を表す文字列であるこ
とを示すタグである。文字列「<content>」
は、次に続く文字列が直前の項目の内容を表す文字列で
あることを示すタグである。また、文字列「</ite
m>」は、項目の種類を表す文字列の終わりを示すタグ
である。文字列「</content>」は、項目の内
容を表す文字列の終わりを示すタグである。文字列「<
/data>」は、データの終わりを示すタグである。
Here, the character string "<data>" is a tag indicating the start of data. Character string "<item>"
Is a tag indicating that the following character string is a character string representing the type of item. Character string "<content>"
Is a tag indicating that the following character string is a character string representing the content of the immediately preceding item. In addition, the character string “</ item
m>"is a tag indicating the end of a character string representing the type of item. The character string “</ content>” is a tag indicating the end of the character string representing the content of the item. The string "<
/ Data>"is a tag indicating the end of data.

【0030】作成したタグ付きのテキスト情報(構造化
文書)は、図3に示すように、構造化文書解釈プログラ
ムによって、項目とその内容に分けられ、その後、管理
情報(識別情報等)と全文DB(データベース)に分け
て保管される。即ち、項目とその内容は、全文データベ
ース4に格納され、各項目に対応するレコード番号など
の管理情報は、図示せぬ記憶部に格納される。
The created tagged text information (structured document) is divided into items and their contents by a structured document interpretation program, as shown in FIG. 3, and then management information (identification information and the like) and full text Stored separately in DB (database). That is, the items and their contents are stored in the full-text database 4, and management information such as a record number corresponding to each item is stored in a storage unit (not shown).

【0031】このようにして保管されたデータを検索す
る場合、まず、ユーザは、項目として「○○」を、ま
た、内容として「××」を検索キーとしてそれぞれ指定
する。検索用アプリケーション13の検索クライアント
は、指定された各検索キーを用いて、全文データベース
4から、該当するデータをそれぞれ検索する。検索の方
法は、完全一致、又は部分一致とすることができる。そ
して、検索されたデータに対応する管理情報、この例の
場合、レコード番号の集合を得る。
When retrieving data stored in this manner, the user first designates "OO" as an item and "XX" as a content as a retrieval key. The search client of the search application 13 uses the specified search keys to search the full-text database 4 for relevant data. The search method can be an exact match or a partial match. Then, management information corresponding to the searched data, in this case, a set of record numbers is obtained.

【0032】例えば、項目に対する検索キー「○○」を
「年齢」とし、内容に対する検索キーを「30」とする
と、項目が「年齢」であるデータのレコード番号の集合
{1,25,44,75,89,111,・・・}と、
内容が「30」であるデータのレコード番号の集合
{1,33,44,57,76,89,93,・・・}
が得られる。
For example, assuming that the search key “OO” for an item is “age” and the search key for content is “30”, a set of record numbers {1, 25, 44, 75, 89, 111,...
Set of record numbers of data whose content is "30" {1, 33, 44, 57, 76, 89, 93, ...}
Is obtained.

【0033】ここで、各検索キーによって検索された各
レコード番号に対して、論理積(AND)演算を施すこ
とにより、項目が「年齢」で、かつ、内容が「30」の
データ、即ち、レコード番号の集合{1,44,89,
・・・}を得ることができる。このようにして、年齢が
30となっているデータを検索することができる。
Here, by performing a logical product (AND) operation on each record number searched by each search key, data having an item of “age” and a content of “30”, that is, Set of record numbers $ 1,44,89,
...} can be obtained. In this manner, data whose age is 30 can be searched.

【0034】このように、本実施の形態の場合、全文デ
ータベース4に対して検索を行っているため、高速な処
理が可能となっている。同様の処理を、項目とその内容
の2つのフィールドからなるデータを登録したリレーシ
ョナルデータベースに対して行うと、大量のデータに対
しては、検索時間が相当かかってしまう。一般に、全文
データベースシステムには、学習と呼ばれる前処理(文
書データを変換して独自のデータ構造にして蓄積する処
理)を行い、検索エンジンと呼ばれるアプリケーション
による高速検索を行う仕組みが用意されており、本実施
の形態ではこれを用いるようにしている。なお、学習の
方法や検索エンジンについての詳細な説明はここでは省
略する。
As described above, in the case of the present embodiment, since the full-text database 4 is searched, high-speed processing is possible. If the same processing is performed on a relational database in which data composed of two fields of items and their contents are registered, it takes a considerable amount of time to search a large amount of data. Generally, a full-text database system is provided with a mechanism for performing pre-processing called learning (processing for converting document data into a unique data structure and storing it) and performing high-speed search by an application called a search engine. In the present embodiment, this is used. A detailed description of the learning method and the search engine is omitted here.

【0035】次に、社員情報管理データベースを例に、
本実施の形態についてさらに詳細に説明する。例えば、
ある企業で、図4に示すような個人情報カードが、例え
ば、MicrosoftWord(Microsoft
は、米国マイクロソフト Corporationの米
国及び他の国における登録商標)等のワープロソフトを
用いて作成され、これを基に、社員情報の管理データベ
ースが作成されるものとする。そして、このカードは、
社員全員により記入され、毎年、4月に更新されるもの
とする。
Next, taking an employee information management database as an example,
This embodiment will be described in more detail. For example,
In a certain company, a personal information card as shown in FIG.
Is created using word processing software such as Microsoft Corporation in the United States and other countries), and a management database of employee information is created based on this. And this card,
Completed by all employees and updated annually in April.

【0036】まず、データを登録するために、構造化文
書(ここではSGML文書)を作成する。各社員から提
出されたWord文書ファイル(Microsoft
Wordを用いて作成された文書ファイル)、例えば、
社員番号を利用して、ファイル名が7198235.D
OCなどとなっているファイルを基に、タグ情報を付与
し、ファイル名が「7198235.SGM」というフ
ァイルを作成する。
First, in order to register data, a structured document (here, an SGML document) is created. Word document file (Microsoft) submitted by each employee
Document file created using Word), for example,
Using the employee number, the file name is 7198235. D
Tag information is added based on the file such as OC, and a file having a file name “7198235.SGM” is created.

【0037】管理情報は、想定するアプリケーションに
より異なるが、上記例の場合、登録時に付与すべき情報
としては、登録日と受領者(管理者)の社員番号又は氏
名などとすることができる。しかしながら、データベー
スの管理用の情報を加えると、管理情報は次のようなも
のが必要となる。
The management information varies depending on the assumed application. In the case of the above example, the information to be given at the time of registration may be the registration date and the employee number or name of the recipient (manager). However, when the information for managing the database is added, the following management information is required.

【0038】・管理番号(登録時にシステムが自動採番
するもので、レコード番号に対応する) ・登録日 ・受領者(管理者の社員番号)又は氏名 ・オリジナルファイル名(例えば、7198235.D
OC) ・SGMLファイル名(例えば、7198235.SG
M) ・各ファイルのアクセス権限 ・データ削除フラグ
Management number (automatically assigned by the system at the time of registration, corresponding to the record number) Registration date Recipient (administrator's employee number) or name Original file name (for example, 7198235.D)
OC) • SGML file name (for example, 7198235.SG
M)-Access authority of each file-Data deletion flag

【0039】また、システムの管理情報は、次のような
ものとすることができる。
The management information of the system can be as follows.

【0040】・オリジナルファイル格納ディレクトリ
(マシン(WSやPCなど)名等を含む) ・SGMLファイル格納ディレクトリ(マシン名等を含
む)
Directory for storing original files (including machine (WS, PC, etc.) names, etc.) Directory for storing SGML files (including machine names, etc.)

【0041】次に、上記管理情報の構造について説明す
る。管理情報は、システム管理情報と、データベースの
管理情報とからなる。
Next, the structure of the management information will be described. The management information includes system management information and database management information.

【0042】システム管理情報は、ファイルの格納場所
を示す情報であり、管理方法はどのような形式でもかま
わないが、例えば、管理ファイル(SYSTEM.IN
I)を作成して、次のように、グローバル変数として管
理する方法などがある。
The system management information is information indicating the storage location of the file. The management method may be in any format. For example, the system management information may be a management file (SYSTEM.IN).
There is a method of creating I) and managing it as a global variable as follows.

【0043】 $ORG_FILE = WS1:/home/ORG $SGM_FILE = WS2:/home/SGML$ ORG_FILE = WS1: / home / ORG $ SGM_FILE = WS2: / home / SGML

【0044】データベースの管理情報は、通常のデータ
ベースの場合と同様に、図5に示すようなテーブル形式
で管理する。即ち、管理番号、登録日、管理者、オリジ
ナルファイル名、SGMLファイル名、権限、及び削除
の有無などの項目からなるテーブルを用いて、管理情報
を管理する。この管理情報の管理には、従来のデータベ
ースを用いてもよいし、管理ファイルからドキュメント
管理サーバ1のサーバプログラムに読み込んでサーバプ
ログラムが管理するようにしてもよい。
The management information of the database is managed in a table format as shown in FIG. 5, as in the case of a normal database. That is, management information is managed using a table including items such as a management number, a registration date, an administrator, an original file name, an SGML file name, authority, and whether or not there is a deletion. For the management of the management information, a conventional database may be used, or the management information may be read from a management file into the server program of the document management server 1 and managed by the server program.

【0045】全文データベース4の作成にあたっては、
上記管理番号とSGMLファイルを用いて、内部的に
は、図6に示すような索引情報を構築する。即ち、管理
番号に対応づけて、項目(職員番号、記入年月、氏名、
ふりがな、所属など)と、その内容とからなる索引情報
を作成し、これを全文データベース4とする。
In preparing the full-text database 4,
Using the management number and the SGML file, index information as shown in FIG. 6 is internally constructed. That is, the items (staff number, date and time, name,
Index information composed of phonetic characters, affiliations, etc.) and their contents is created, and this is used as the full-text database 4.

【0046】図5及び図6から分かるように、管理情報
と全文データベース4とは、管理番号によってリンクさ
れている。即ち、この例の場合、リンク情報は管理番号
ということになる。従って、全文データベース4を項目
及び内容で検索し、得られた管理番号の集合から、AN
D処理などによって目的とするデータを検索することが
できる。また、管理情報から、検索された管理番号に対
応するオリジナルファイル名などが分かるため、オリジ
ナルファイルを表示したりすることができる。
As can be seen from FIGS. 5 and 6, the management information and the full-text database 4 are linked by a management number. That is, in this example, the link information is a management number. Therefore, the full-text database 4 is searched for by item and content, and from the set of obtained management numbers,
The target data can be searched by the D processing or the like. In addition, the original file name or the like corresponding to the searched management number can be known from the management information, so that the original file can be displayed.

【0047】以上説明したように、上記実施の形態にお
いては、検索に全文データベースを用いるため、データ
ベースの設計を容易にすることができる。また、従来の
データベース管理システム(DBMS)においては、デ
ータベースの変更に伴って、プログラムの修正等が必要
となるが、本実施の形態の場合、データ構造そのものは
変更されることがない(常に、項目とその内容とからな
る)ため、データベースに新たな項目を自由に追加した
り、或いは、項目を自由に削除することができる。
As described above, in the above embodiment, since the full-text database is used for the search, the design of the database can be facilitated. Further, in a conventional database management system (DBMS), it is necessary to modify a program in accordance with a change in the database, but in the case of the present embodiment, the data structure itself is not changed (always, Therefore, a new item can be freely added to the database or an item can be freely deleted.

【0048】なお、上記実施の形態において用いた、<
data>、</data>、<item>、</it
em>、<content>、</content>な
どのタグは、例であってこれに限定されるものではな
い。
It should be noted that the <
data>, </ data>, <item>, </ it
The tags such as <em>, <content>, and </ content> are examples, and the present invention is not limited thereto.

【0049】また、上記実施の形態においては、ドキュ
メント管理サーバをワークステーション(WS)で構成
するようにしたが、これに限定されるものではなく、パ
ーソナルコンピュータ(PC)で構成するようにしても
よい。
In the above embodiment, the document management server is constituted by the workstation (WS). However, the present invention is not limited to this, and the document management server may be constituted by a personal computer (PC). Good.

【0050】また、上記実施の形態においては、文書管
理データベースにおいて、SGMLで記述された構造化
文書を記憶するようにしたが、SGMLは一例であり、
HTML(Hyper Text Markup La
nguage)等の他の構造化文書であってもかまわな
い。
In the above embodiment, the structured document described in SGML is stored in the document management database. However, SGML is an example.
HTML (Hyper Text Markup La)
nstructure), and other structured documents.

【0051】また、上記実施の形態においては、本発明
をクライアント/サーバ型のシステムに応用する場合に
ついて説明したが、これに限定されるものではなく、ス
タンドアロン型のシステムに適用することもできる。
In the above embodiment, the case where the present invention is applied to a client / server type system has been described. However, the present invention is not limited to this, and may be applied to a stand-alone type system.

【0052】さらに、上記実施の形態のサーバプログラ
ム及びクライアントにおける各アプリケーションソフト
ウェアは、CD−ROM(compact disc
read only memory)、DVD(dig
ital video disc)、FD(flopp
y disc)、又はその他の記録媒体に記録して提供
することかできる。
Further, each application software in the server program and the client in the above embodiment is a compact disc (CD-ROM).
read only memory), DVD (dig)
ital video disc), FD (flopp
y disc) or other recording medium.

【0053】[0053]

【発明の効果】以上の如く、本発明に係るデータ管理装
置およびデータ管理方法、並びに記録媒体によれば、少
なくとも、第1の項目のデータと第2の項目のデータと
からなり、第1の項目のデータと第2の項目のデータと
がタグによって識別可能な1または複数の第1の情報か
ら構成される第2の情報を入力し、入力された第2の情
報を記憶し、第2の情報からタグを除いた第3の情報を
記憶し、記憶された第3の情報に対して、少なくとも、
第1の項目に対する第1の検索キーと第2の項目に対す
る第2の検索キーに基づいて検索を行い、検索された第
1の情報を構成要素とする第2の情報を出力するように
したので、データ構造の制約をなくし、煩雑なデータベ
ース設計を行うことなく、効率的にデータベースの設計
及び構築を行うことができる。従って、データベースへ
の項目の追加や削除を容易に行うことができる。また、
データ構造に制約がないため、不特定のデータ項目を対
象とするデータベースを効率的に作成することができ
る。
As described above, according to the data management apparatus, the data management method, and the recording medium of the present invention, at least the data of the first item and the data of the second item are provided. Inputting second information composed of one or more pieces of first information in which the data of the item and the data of the second item are identifiable by a tag, storing the input second information, The third information obtained by removing the tag from the information of is stored, and at least the stored third information is
A search is performed based on a first search key for a first item and a second search key for a second item, and second information having the searched first information as a component is output. Therefore, it is possible to efficiently design and construct a database without restricting the data structure and without complicated database design. Therefore, it is possible to easily add or delete items from the database. Also,
Since there is no restriction on the data structure, a database for unspecified data items can be efficiently created.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のデータ管理装置の一実施の形態の構成
例を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration example of a data management device according to an embodiment of the present invention.

【図2】本発明のデータ管理装置で用いられるデータ構
造の例を示す図である。
FIG. 2 is a diagram showing an example of a data structure used in the data management device of the present invention.

【図3】テキスト情報を管理情報と全文データベースに
分けて保管する手順を示す図である。
FIG. 3 is a diagram showing a procedure for storing text information separately in management information and a full-text database.

【図4】個人情報カードの例を示す図である。FIG. 4 is a diagram showing an example of a personal information card.

【図5】データベースの管理情報を管理するためのテー
ブルを示す図である。
FIG. 5 is a diagram showing a table for managing management information of a database.

【図6】全文データベースの例を示す図である。FIG. 6 is a diagram illustrating an example of a full-text database.

【図7】従来のリレーショナルデータベースのデータ構
造の例を示す図である。
FIG. 7 is a diagram showing an example of a data structure of a conventional relational database.

【符号の説明】[Explanation of symbols]

1 ドキュメント管理サーバ 2 文書管理データベース 3 図表管理データベース 4 全文データベース 11 登録用アプリケーション 12 編集用アプリケーション 13 検索用アプリケーション 1 Document Management Server 2 Document Management Database 3 Chart Management Database 4 Full Text Database 11 Registration Application 12 Editing Application 13 Search Application

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 少なくとも、第1の項目のデータと第2
の項目のデータとからなり、前記第1の項目のデータと
前記第2の項目のデータとがタグによって識別可能な1
または複数の第1の情報から構成される第2の情報を入
力する入力手段と、 前記入力手段によって入力された前記第2の情報を記憶
する第1の記憶手段と、 前記第2の情報から前記タグを除いた第3の情報を記憶
する第2の記憶手段と、 前記第2の記憶手段に記憶された前記第3の情報に対し
て、少なくとも、前記第1の項目に対する第1の検索キ
ーと前記第2の項目に対する第2の検索キーに基づいて
検索を行う検索手段と、 前記検索手段によって検索された前記第1の情報を構成
要素とする前記第2の情報を出力する出力手段とを備え
ることを特徴とするデータ管理装置。
At least a first item data and a second item data
, The data of the first item and the data of the second item can be identified by a tag.
Or input means for inputting second information composed of a plurality of first information; first storage means for storing the second information input by the input means; and A second storage unit for storing third information excluding the tag; and a first search for at least the first item with respect to the third information stored in the second storage unit. Search means for performing a search based on a key and a second search key for the second item; and output means for outputting the second information having the first information searched by the search means as a component. A data management device comprising:
【請求項2】 文書データをタグ付きの前記第2の情報
に変換する変換手段をさらに備えることを特徴とする請
求項1に記載のデータ管理装置。
2. The data management apparatus according to claim 1, further comprising a conversion unit configured to convert document data into the tagged second information.
【請求項3】 前記第1の項目のデータは、前記第1の
情報の種類を表し、前記第2の項目のデータは、前記第
1の情報の内容を表すことを特徴とする請求項1に記載
のデータ管理装置。
3. The data of the first item indicates a type of the first information, and the data of the second item indicates a content of the first information. A data management device according to claim 1.
【請求項4】 少なくとも、第1の項目のデータと第2
の項目のデータとからなり、前記第1の項目のデータと
前記第2の項目のデータとがタグによって識別可能な1
または複数の第1の情報から構成される第2の情報を入
力し、 入力された前記第2の情報を記憶し、 前記第2の情報から前記タグを除いた第3の情報を記憶
し、 記憶された前記第3の情報に対して、少なくとも、前記
第1の項目に対する第1の検索キーと前記第2の項目に
対する第2の検索キーに基づいて検索を行い、 検索された前記第1の情報を構成要素とする前記第2の
情報を出力することを特徴とするデータ管理方法。
4. At least the data of the first item and the second item
, The data of the first item and the data of the second item can be identified by a tag.
Or inputting second information composed of a plurality of first information; storing the input second information; storing third information obtained by removing the tag from the second information; The stored third information is searched based on at least a first search key for the first item and a second search key for the second item. And outputting the second information having the above information as a constituent element.
【請求項5】 請求項4に記載のデータ管理方法を実行
可能なプログラムが記録されている記録媒体。
5. A recording medium on which a program capable of executing the data management method according to claim 4 is recorded.
JP10376930A 1998-12-28 1998-12-28 Device and method for data management and recording medium Pending JP2000200206A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10376930A JP2000200206A (en) 1998-12-28 1998-12-28 Device and method for data management and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10376930A JP2000200206A (en) 1998-12-28 1998-12-28 Device and method for data management and recording medium

Publications (1)

Publication Number Publication Date
JP2000200206A true JP2000200206A (en) 2000-07-18

Family

ID=18507971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10376930A Pending JP2000200206A (en) 1998-12-28 1998-12-28 Device and method for data management and recording medium

Country Status (1)

Country Link
JP (1) JP2000200206A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016189155A (en) * 2015-03-30 2016-11-04 新日鉄住金ソリューションズ株式会社 Information processing apparatus, information processing system, information processing method, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016189155A (en) * 2015-03-30 2016-11-04 新日鉄住金ソリューションズ株式会社 Information processing apparatus, information processing system, information processing method, and program

Similar Documents

Publication Publication Date Title
US6094649A (en) Keyword searches of structured databases
US7797336B2 (en) System, method, and computer program product for knowledge management
US7130867B2 (en) Information component based data storage and management
JP4227033B2 (en) Database integrated reference device, database integrated reference method, and database integrated reference program
JP2896634B2 (en) Full-text registered word search device and full-text registered word search method
US8260815B2 (en) System and method for accessing non-compatible content repositories
US6904454B2 (en) Method and apparatus for content repository with versioning and data modeling
US7254570B2 (en) Query resolution system and service
US7353236B2 (en) Archive system and data maintenance method
US20030193994A1 (en) Method of managing media components
US6915303B2 (en) Code generator system for digital libraries
US8200702B2 (en) Independently variably scoped content rule application in a content management system
JPH11242676A (en) Method for registering structured document, method for retrieving structured document, and portable medium used in these methods
US20060053169A1 (en) System and method for management of data repositories
JP2005190163A (en) Method, apparatus and program for retrieving structured data
KR19990038731A (en) Metadata Model and Modeling Method for Electronic Documents, Metadata Management System and Management Method
JP3842576B2 (en) Structured document editing method and structured document editing system
US20080082478A1 (en) System, method, and apparatus for retrieving structured document and apparatus for managing structured document
JP2000200206A (en) Device and method for data management and recording medium
JPH09218880A (en) Document data retrieval system
JP4034503B2 (en) Document search system and document search method
JP3239845B2 (en) Full-text search apparatus and method
JP2003288365A (en) Additive information management method and additive information management system
JP4242701B2 (en) Storage search device, storage search program, and storage search program recording medium
JP2001297104A (en) Data storage device and method and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080805

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081028

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090203