JP2000122903A - Method for processing information and computer system - Google Patents

Method for processing information and computer system

Info

Publication number
JP2000122903A
JP2000122903A JP11283048A JP28304899A JP2000122903A JP 2000122903 A JP2000122903 A JP 2000122903A JP 11283048 A JP11283048 A JP 11283048A JP 28304899 A JP28304899 A JP 28304899A JP 2000122903 A JP2000122903 A JP 2000122903A
Authority
JP
Japan
Prior art keywords
information
database
grammar
schema
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11283048A
Other languages
Japanese (ja)
Inventor
Guepner Juan Roldan
フアン・ロルダン・グェプナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2000122903A publication Critical patent/JP2000122903A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method for processing structured information which is to be stored in the data base of a computer system. SOLUTION: In the method, grammar 14 describing the structure of information is decided and a data base schemer 10 is derived from the grammar 14. A mapping rule is generated from the grammar 14 and structured information 16 is stored in a data base 12 in accordance with the schemer and the mapping rule. The method can be used for transferring data to the data base 12 and reading data from the data base 12.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、一般に、情報を処
理するための方法に関し、特に、データベースに記憶す
べき構造化情報を処理するための方法およびこのような
情報をデータベースに転送するための方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates generally to a method for processing information, and more particularly, to a method for processing structured information to be stored in a database and a method for transferring such information to a database. About the method.

【0002】[0002]

【従来の技術】当事者Aから発信される所与の量の情報
を当事者Bが読み取って処理しなければならない場合は
非常に多い。このような情報は膨大な種類の形式で存在
する可能性があり、数字、単語、文章、ならびにフリー
・テキスト、テーブルなどの様々な変形を含む可能性が
ある。現代では、このような情報は大量に発生し、受取
り側が迅速かつ確実に処理し理解する必要がある。ま
た、このような情報は、データ転送の受取り側のデータ
ベースに供給される場合が多い。このような情報を複数
の異なるサイトから受け取り、このような情報を大規模
データベース・システムに記憶している人は、まず、デ
ータベースからその情報を読み取らなければならず、そ
の後、記憶した「パッケージ」またはより一般的には大
量の情報を解析しなければならない。次にその人は、そ
の情報を理解することができる。情報を解析するこのよ
うなステップがなければ、記憶した情報には、データ・
キャリアに記憶されること以外の真の価値はない。この
ような情報パッケージはBLOBS(=2進大型オブジ
ェクト, Binary Large Object)として知られている。
このようなBLOBSは解析しなければならず、したが
って、その構造は判明済みであると判定されなければ、
誰もそれを読み取って、BLOBSに含まれる情報を理
解することはできない。
BACKGROUND OF THE INVENTION Very often, a given amount of information originating from party A must be read and processed by party B. Such information can exist in a huge variety of formats and can include numbers, words, sentences, and various variations of free text, tables, and the like. In modern times, such information is generated in large quantities and needs to be quickly and reliably processed and understood by the recipient. In addition, such information is often supplied to a database on the data transfer receiving side. A person receiving such information from a number of different sites and storing such information in a large database system must first read the information from the database, and then store the "package" Or, more generally, a large amount of information must be analyzed. The person can then understand the information. Without such a step of analyzing the information, the stored information would contain data,
There is no real value other than being remembered in the carrier. Such an information package is known as BLOBS (= Binary Large Object).
Such a BLOBS must be analyzed and, therefore, if its structure is not determined to be known,
No one can read it and understand the information contained in BLOBS.

【0003】多くのBLOBSの内容を読み取り、デー
タベースの内容について行ったのと同様の方法でそれを
評価することが必要な場合に問題が発生する。このよう
な評価は、データベースの所与の内容に選択的にアクセ
スし、その結果が詳細な形式の照会済み情報のリストに
なり、個々の基準によって記憶されるような照会を含
む。複数のBLOBSをデータベースに記憶する場合、
従来技術の技法では、各BLOBSごとに個々の解析プ
ロセスを実行しなければならず、それを事前に解析せず
に複数のBLOBSに対して直ちに照会を向けることは
不可能である。したがって、大量の記憶情報に関する評
価はどのようなものでも多くの作業になり、大量の時間
を要するが、その情報は電子的に読取り可能な形式で記
憶される。
A problem arises when it is necessary to read the contents of many BLOBS and evaluate them in the same way as was done for the contents of the database. Such evaluations include queries that selectively access a given content of a database, the result of which is a detailed list of queried information that is stored by individual criteria. When storing multiple BLOBS in a database,
With prior art techniques, a separate parsing process must be performed for each BLOBS, and it is not possible to immediately direct queries to multiple BLOBS without pre-parsing it. Thus, any assessment of a large amount of stored information can be a lot of work and time consuming, but the information is stored in an electronically readable form.

【0004】上記を考慮すると、より快適かつより迅速
にコンピュータ・システムのデータベースに記憶すべき
大量の構造化情報を処理するための方法に対する必要性
が存在することは明らかなはずである。
In view of the above, it should be apparent that a need exists for a method for processing large amounts of structured information that should be stored in a database of a computer system more comfortably and more quickly.

【0005】[0005]

【発明が解決しようとする課題】したがって、本発明の
一目的は、コンピュータ・システムのデータベースに記
憶すべき構造化情報を処理するための改良された方法を
提供することにある。
SUMMARY OF THE INVENTION It is, therefore, one object of the present invention to provide an improved method for processing structured information to be stored in a computer system database.

【0006】本発明の他の目的は、外部サイトからデー
タベース内に情報を転送するための改良された方法を提
供することにある。
It is another object of the present invention to provide an improved method for transferring information from an external site into a database.

【0007】本発明のさらに他の目的は、本発明による
処理方法を実現するコンピュータ・プログラムを実行す
るように構成されたデータベース管理システムがインス
トールされたコンピュータ・システムを提供することに
ある。
It is still another object of the present invention to provide a computer system in which a database management system configured to execute a computer program for realizing the processing method according to the present invention is installed.

【0008】[0008]

【課題を解決するための手段】上記の目的を達成するた
めの主な考え方は、転送すべきファイル内容の構造を特
徴付ける所与の文法(grammar)からデータベース・ス
キーマ情報を直接導き出すことと、その文法からデータ
ベース・スキーマを直接作成することである。前記スキ
ーマ情報は、文法の助けを借りて解析する間に導き出さ
れる。マッピング規則は、所与の文法を固守する内容を
マッピングする方法を示すものであり、スキーマ情報を
導き出すのと同時に導き出される。
The main idea to achieve the above object is to directly derive database schema information from a given grammar that characterizes the structure of the file contents to be transferred. Creating a database schema directly from the grammar. The schema information is derived during parsing with the help of grammar. The mapping rules indicate how to map content that adheres to a given grammar, and are derived at the same time as the schema information is derived.

【0009】[0009]

【発明の実施の形態】次に添付図面を全般的に参照し、
特に図1を参照すると、所与の量の構造化情報100に
ついては、本発明の処理方法への対象になるものとして
説明する。前記量の情報を処理するために記述すべきス
テップはこの方法の一部であり、有利なことに一部は送
り側のコンピュータ・システムで実行され、一部は受取
り側のコンピュータ・システムで実行される。これらの
コンピュータ・システムは、前記ステップを実行できる
ようにするためのプログラムとツールを備えている。
BRIEF DESCRIPTION OF THE DRAWINGS FIG.
With particular reference to FIG. 1, a given amount of structured information 100 will be described as being subject to the processing method of the present invention. The steps to be described for processing said quantity of information are part of the method, advantageously partly performed on the sending computer system and partly performed on the receiving computer system Is done. These computer systems include programs and tools that enable the above steps to be performed.

【0010】情報100は、電子(コンピュータ可読)
ファイルに含まれている。
The information 100 is electronic (computer readable)
Included in the file.

【0011】文法は、たとえば、所与のファイル拡張子
などの命名規則を使用するかまたは側面情報により、情
報量100に応じて決定される(ステップ110)。
The grammar is determined according to the amount of information 100, using, for example, a naming convention such as a given file extension or by side information (step 110).

【0012】文法に対応するデータベース・スキーマ
(ここではリレーショナル・データベース用)は、ステ
ップ120に示すようにこの文法から導き出される。
A database schema corresponding to the grammar (here for a relational database) is derived from this grammar as shown in step 120.

【0013】次に、追加ステップ130では、文法によ
って記述された情報の構造化内容をデータベース・スキ
ーマからなる複数のテーブルにマッピングする方法を決
定するマッピング規則が生成される。
Next, in an additional step 130, a mapping rule is generated which determines how to map the structured content of the information described by the grammar to a plurality of tables comprising a database schema.

【0014】最後に、ステップ140では、データベー
ス・スキーマならびにあらかじめ確立した文法規則に対
応する情報をデータベースに充填することができる。
Finally, at step 140, the database can be filled with information corresponding to the database schema and pre-established grammar rules.

【0015】その結果、この「文法ベース・マッピン
グ」の場合、情報はリレーショナル・データベース・シ
ステムのテーブル内に構造化形式で記憶される。本発明
による上記の方法の利点として、データベースのユーザ
は、データベースの内容を照会し、所望のすべての情報
をソートされた形式で持ち出すような詳細な照会を作成
することができ、どのようなデータベースのテーブルも
一般に意味的単一体(semantic unities)なので理解し
やすいものである。したがって、情報の解析は、従来技
術の技法の場合と同様に、そのデータベースへの読取り
アクセスの一部である必要はない。
As a result, in the case of this "grammar-based mapping", the information is stored in a structured format in a table of a relational database system. An advantage of the above method according to the present invention is that the database user can query the contents of the database and create a detailed query that brings up all the desired information in a sorted format, Tables are also easy to understand because they are generally semantic unities. Thus, parsing the information need not be part of the read access to the database, as in the prior art techniques.

【0016】次に図2を参照すると、この処理方法の第
1の単純な実施の形態には、いわゆる「単純文法ベース
・マッピング」が記載されている。
Referring now to FIG. 2, a first simple embodiment of the processing method describes a so-called “simple grammar-based mapping”.

【0017】単純文法ベース・マッピングでは、構造化
情報ファイル内容16を記述する文法14からデータベ
ース12の完全なスキーマ10が導き出され、生成され
る。マッピング規則18は、この文法を固守する内容
を、導き出されたスキーマが記述するデータベースにマ
ッピングする方法を示すものであり、同じくこの文法に
よって静的に導き出される。
In simple grammar-based mapping, the complete schema 10 of the database 12 is derived and generated from a grammar 14 describing the structured information file contents 16. The mapping rule 18 indicates a method of mapping the content that adheres to the grammar to the database described by the derived schema, and is also derived statically by the grammar.

【0018】以下の文法例は、この技法の数多くの応用
例の可能性の1つにすぎない。これは、たとえば、特殊
なコンピュータ言語用のネスト可能なレコード構造を記
述するための単純な文法である。
The following grammar example is just one of many possible applications of this technique. This is, for example, a simple grammar for describing nestable record structures for special computer languages.

【0019】[0019]

【表1】 [Table 1]

【0020】この例証的な文法は、レコードがその構造
の任意選択名から始まり、次にキーワード「STRUC
T」と0個またはそれ以上のMEMBERが続き、キー
ワード「END」で終わることを示している。MEMB
ERは、IDENTIFIERとそれに続くTYPEか
らなる。次にIDENTIFIERは1つまたは複数の
英字の連結であり、TYPEはキーワード「STRIN
G」または「INTEGER」のいずれか一方であるか
あるいはネストされたレコードである。
This illustrative grammar shows that a record starts with an optional name of its structure, and then the keyword "STRUC"
"T" followed by zero or more MEMBERs, ending with the keyword "END". MEMB
ER consists of IDENTIFIER followed by TYPE. Next, IDENTIFIER is a concatenation of one or more alphabetic characters, and TYPE is the keyword "STRIN".
G "or" INTEGER "or a nested record.

【0021】この文法から導き出されるリレーショナル
・スキーマとしては、以下のものが考えられる。
The following relational schema can be derived from this grammar.

【0022】[0022]

【表2】 [Table 2]

【0023】対応するマッピング規則は以下のようにな
るだろう。
The corresponding mapping rule would be as follows:

【0024】この文法の「RECORD」規則が適用さ
れた場合、テーブルRECORD_TABLEに新しい
行を挿入し、そのレコードを識別する固有の番号を生成
し、この番号をその行のrecord_keyフィールドに入れ
る。次に、レコードの名前があればその名前と、実際の
MEMBERの数をその行の列record_nameおよびnumbe
r_of_membersに入れる。すべてのMEMBERについ
て、このレコードのrecord_key値によってフィールドpa
rent_recore_keyを更新することにより、対応する行を
更新する。ENDIF
If the "RECORD" rule of this grammar is applied, a new row is inserted into the table RECORD_TABLE, generating a unique number identifying the record, and placing this number in the record_key field of that row. Next, the name of the record, if any, and the actual number of MEMBERs are entered in the columns record_name and numbe of that row.
Put in r_of_members. For all MEMBERs, field pa by record_key value of this record
Update the corresponding row by updating rent_recore_key. ENDIF

【0025】この文法のMEMBER規則が適用された
場合、テーブルMEMBER_TABLEに新しい行を
挿入し、このテーブル内で固有の番号を生成し、それを
その行のmember_keyフィールドに入れる。「IDENT
IFIER」の値をその行のmember_nameに入れる。こ
のメンバの型が「STRING」である場合、simple_t
ypeフィールドに0を入れ、complex_typeフィールドに
NULLを入れる。型が「INTEGER」である場
合、simple_typeフィールドに1を入れ、complex_type
フィールドにNULLを入れる。次にその型がレコード
構造である場合、それに対応するデータベース項目のre
cord_key値をcomplex_typeフィールドに入れ、simple_t
ypeフィールドにNULLを入れる。ENDIF
If the MEMBER rule of this grammar is applied, insert a new row in the table MEMBER_TABLE, generate a unique number in this table and put it in the member_key field of that row. "IDENT
Put the value of "IFIER" in the member_name of that row. If this member is of type "STRING", simple_t
Put 0 in the ype field and NULL in the complex_type field. If the type is "INTEGER", enter 1 in the simple_type field and enter complex_type
Put NULL in the field. Next, if the type is a record structure, the re
Put the cord_key value in the complex_type field and use simple_t
Put NULL in the ype field. ENDIF

【0026】次の例は、上記のマッピングを実証するも
のである。以下の内容は個人データを記述するものであ
り、その構造は所与の文法を固守している。
The following example demonstrates the above mapping. The following describes personal data, the structure of which adheres to a given grammar.

【0027】[0027]

【表3】 [Table 3]

【0028】上記によるマッピング規則の場合、文法ベ
ース・マッピングの結果は以下のようになるだろう。
For a mapping rule according to the above, the result of the grammar-based mapping would be:

【0029】[0029]

【表4】 [Table 4]

【0030】したがって、上記による文法14によって
一般化し記述することができる構造を有する複数の異な
る量またはパッケージの情報をデータベースに充填する
場合、まず従来技術に対応すると思われる同じ複数のB
LOBを解析する必要なしに、完全な最新の照会を含む
データベースからの快適な読取りまたは照会を実行する
ことができる。
Thus, when filling a database with information of a plurality of different quantities or packages having a structure that can be generalized and described by the grammar 14 according to the above, first the same plurality of Bs, which would correspond to the prior art,
A comfortable read or query from a database containing a complete up-to-date query can be performed without having to analyze the LOB.

【0031】図3に概要を示す本発明の処理方法の第2
の実施の形態には、いわゆる「複合文法ベース・マッピ
ング」が記載されている。
FIG. 3 shows a second embodiment of the processing method of the present invention.
In this embodiment, a so-called “compound grammar-based mapping” is described.

【0032】複合文法ベース・マッピングでは、スキー
マ10は必ずしも文法14によって完全に導き出される
わけではなく、その文法の所与の規則が内容に適用され
る場合は文法といわゆるメタ文脈(meta-context)20
の両方によって導き出される。スキーマ10は一部は文
法から導き出すことができ、解析中はスキーマ拡張とデ
ータベースへの情報のマッピングの両方を行うことがで
きる。
In a compound grammar-based mapping, the schema 10 is not always completely derived by the grammar 14, but if a given rule of the grammar applies to the content, the grammar and the so-called meta-context 20
Derived by both. The schema 10 can be derived, in part, from the grammar, and can both perform schema extension and map information to a database during parsing.

【0033】それをより詳細に説明するため、上記の例
である「record」では、文脈によって各レコードごとに
それ自体のテーブルを生成し、生成した各テーブルを登
録テーブルに登録することが望ましいだろう。この文脈
は、たとえば、所与のユーザまたはアプリケーションの
要求を反映することになるだろう。
In order to explain this in more detail, in the above-mentioned "record", it is desirable to generate its own table for each record depending on the context and register each generated table in the registration table. Would. This context would reflect, for example, the needs of a given user or application.

【0034】どのテーブルが作成されるかは解析時にし
か分からない。この例では、以下の文法から1つのテー
ブルだけが静的に導き出される。RECORD_REGISTRY_TABL
Eは、そのテーブルが存在するすべてのレコードを含
む。テーブル「RECORD_REGISTRY_TABLE」は列「record_
table_name」を有し、これはこのテーブルの主キーであ
る。
The table to be created can be known only at the time of analysis. In this example, only one table is statically derived from the following grammar. RECORD_REGISTRY_TABL
E includes all records where the table exists. Table "RECORD_REGISTRY_TABLE" has column "record_
table_name ", which is the primary key for this table.

【0035】したがって、この規則は、「単純文法ベー
ス・マッピング」に比べ、スキーマ拡張情報、たとえ
ば、追加のデータベース・テーブルを生成するかあるい
はすでに作成されたテーブル内の追加の行またはフィー
ルドを作成するなどの規則も含むことができる。
Thus, this rule creates schema extension information, eg, additional database tables, or creates additional rows or fields in already created tables, as compared to “simple grammar-based mapping”. And other rules.

【0036】この例の場合、1組の規則は以下のように
なる。
In this example, a set of rules is as follows.

【0037】この文法の「RECORD」規則が適用さ
れた場合、スキーマ内に新しいテーブルを作成する。そ
のテーブルの名前は解析されたレコードの名前によって
示される。そのテーブルの列は(varcharとしてのmembe
r_name、integerとしてのsimple_type、varcharとしての
complex_type)になる。member_nameは1次キーであ
る。レコード名(IDENTIFIERの値)をREC
ORD_REGISTRY_TABLEテーブルに入れ
る。レコード名が一切示されない場合、固有のものを作
成する。 ENDIF この文法のMEMBER規則が適用された場合、このメ
ンバが属すレコードに対応するテーブルに新しい行を挿
入する。IDENTIFIERの値をその行のmember_n
ameに入れる。このメンバの型が「STRING」であ
る場合、simple_typeフィールドに0を入れ、complex_t
ypeフィールドにNULLを入れる。型が「INTEG
ER」である場合、simple_typeフィールドに1を入
れ、complex_typeフィールドにNULLを入れる。次に
その型がレコード構造である場合、そのレコード名をco
mplex_typeフィールドに入れ、simple_typeフィールド
にNULLを入れる。 ENDIF
When the "RECORD" rule of this grammar is applied, a new table is created in the schema. The name of the table is indicated by the name of the parsed record. The columns of that table are (membe as varchar
r_name, simple_type as integer, varchar
complex_type). member_name is a primary key. Record name (IDENTIFIER value) to REC
Put in ORD_REGISTRY_TABLE table. If no record name is given, create a unique one. ENDIF When the MEMBER rule of this grammar is applied, a new row is inserted into the table corresponding to the record to which this member belongs. Set the value of IDENTIFIER to member_n of the row
Put in ame. If the type of this member is "STRING", put 0 in the simple_type field, and
Put NULL in the ype field. If the type is "INTEG
If "ER", enter 1 in the simple_type field and NULL in the complex_type field. Next, if the type is a record structure, change the record name to co
Put in mplex_type field and put NULL in simple_type field. ENDIF

【0038】以下の例を解析する。The following example is analyzed.

【0039】[0039]

【表5】 [Table 5]

【0040】このスキーマは、テーブル「PersonData」
および「SubRecord1」によって拡張することができる。
すなわち、ネストされたレコードについてレコード名が
一切示されていないので、その名前として「SubRecord
1」が作成されることになる。
This schema has a table "PersonData"
And can be extended by "SubRecord1".
In other words, no record name is shown for nested records, so the name "SubRecord
1 "will be created.

【0041】[0041]

【表6】 [Table 6]

【0042】解析後、テーブルは以下のデータを含むこ
とになる。
After analysis, the table will contain the following data:

【0043】[0043]

【表7】 [Table 7]

【0044】上記の第1の実施の形態で説明したよう
に、事前にBLOBを解析せずにデータベースからの快
適な読取りまたは照会を実行することができる。
As described in the first embodiment, comfortable reading or querying from the database can be performed without analyzing the BLOB in advance.

【0045】次に図4および図5を参照すると、事前に
情報を解析せずにデータベース12への直接読取り/照
会アクセスを実行できる、本発明による処理方法の応用
に関する例が示されている。
Referring now to FIGS. 4 and 5, there is shown an example relating to the application of the processing method according to the invention, in which direct read / query access to the database 12 can be performed without prior analysis of the information.

【0046】受取り側当事者B(図5の右側)は、複数
の同じ型の情報パッケージ、すなわち、共通の一般的な
構造を有する情報パッケージを様々な当事者から受け取
ることになっており、そのうちの1つ(当事者A)は図
5の左側に示されている。
The receiving party B (right side of FIG. 5) is to receive a plurality of information packages of the same type, ie, information packages having a common general structure, from various parties, one of which. One (party A) is shown on the left side of FIG.

【0047】Bは、所与の量の患者データを医師Aの診
療所のコンピュータから受け取る病院のデータベースに
することができる。Aの患者のそれぞれについて、同じ
型のデータ、すなわち、情報パッケージが転送されると
予想される。
B can be a hospital database that receives a given amount of patient data from physician A's clinic computer. It is expected that the same type of data, ie, the information package, will be transferred for each of the patients in A.

【0048】当事者Aは、転送すべき情報量の内容に関
し、それを特徴付ける文法規則を含む1つまたは1組の
いわゆるDTD(文書型宣言)を設計または使用する
(400)。
Party A designs or uses (400) one or a set of so-called DTDs (Document Type Declarations) containing the grammatical rules that characterize the content of the information to be transferred.

【0049】次に、ステップ410では、DTDファイ
ル30の1つがBに送られる。これは、いずれかの電子
形式またはAからBに書状として送られる書類の形式に
なる可能性がある。
Next, at step 410, one of the DTD files 30 is sent to B. This can be in any electronic form or in the form of a document sent as a letter from A to B.

【0050】次に、ステップ420では、BがDTDフ
ァイル30を受け取り、そのDTDファイルに含まれる
情報に応じてデータベース・スキーマ10を生成する。
Next, in step 420, B receives the DTD file 30, and generates the database schema 10 according to the information contained in the DTD file.

【0051】図5の上部にも示されているように、Aは
図4のステップ410でDTDファイルをBに送る。デ
ータベース記号12から分かるように、データベース・
スキーマ10はDTDファイル内容から導き出され、デ
ータベース12内の4つの「ダミー」ポイントによって
示されるようにDTDファイルを受け取ると動的に生成
される。データベース・スキーマ10が完成し、データ
ベース12が常駐するコンピュータ・システムがデータ
を受け取れる状態になると、データ転送を開始すること
ができる。
As shown at the top of FIG. 5, A sends the DTD file to B in step 410 of FIG. As can be seen from the database symbol 12, the database
Schema 10 is derived from the DTD file contents and is dynamically generated upon receipt of the DTD file as indicated by the four “dummy” points in database 12. Once the database schema 10 is complete and the computer system on which the database 12 resides is ready to receive data, data transfer can begin.

【0052】図5の次の行では、情報パッケージがAか
らBに送られる。この情報は、受取り側Bの例証的なデ
ータベース・スキーマを表す4つのテーブル内に分割さ
れる。したがって、すべての情報はデータベース内のそ
の正確な場所に記憶される。この送出プロセスは所与の
回数繰り返され、Bのデータベースに記憶された情報の
量はますます大きくなる。第三者CもBのデータベース
に同じ型の情報を送るように示されている。
In the next line of FIG. 5, the information package is sent from A to B. This information is split into four tables representing the recipient B's illustrative database schema. Thus, all information is stored at its exact location in the database. This sending process is repeated a given number of times, and the amount of information stored in B's database is growing. Third party C is also shown to send the same type of information to B's database.

【0053】図5の下部右側に示されているように、B
のデータベースから所望のテーブル内容を選択する最新
の照会によって、記憶された情報全体にアクセスするこ
とができる。現況技術の場合のように、BLOBSの解
析は不要である。
As shown in the lower right part of FIG.
The entire stored information can be accessed by an up-to-date query that selects the desired table contents from the database. BLOBS analysis is not required as in the state of the art.

【0054】図4に戻ると、ステップ430では、A
は、Bのコンピュータ・システム内にセットアップされ
る文法規則およびデータベース・スキーマに応じて所与
の量の情報(ファイル、電子メールなどの複数の情報パ
ッケージ)を送る。これは、図5の第2の「行」として
示されている。
Returning to FIG. 4, in step 430, A
Sends a given amount of information (files, multiple information packages such as emails) depending on the grammar rules and database schema set up in B's computer system. This is shown as the second "row" in FIG.

【0055】次のステップ440では、Bのコンピュー
タ・システムがその情報量を受け取り、データベース・
スキーマ10に応じてそれをデータベース・テーブル3
2に自動的に記憶する。図4に示すループから分かるよ
うに、Aの送出プロセスは必要なだけ頻繁に繰り返すこ
とができる。あるいは、他の当事者C(他の医師の診療
所)は、図5の第3の行に示す同じ型の追加量の情報を
送ることができる。次に、後者の情報はAの情報と同じ
ように構造化されているので、同じように記憶される。
In the next step 440, B's computer system receives the amount of information and
Database table 3 according to schema 10
2 automatically stored. As can be seen from the loop shown in FIG. 4, the sending process of A can be repeated as often as necessary. Alternatively, the other party C (another doctor's clinic) can send an additional amount of the same type of information shown in the third row of FIG. Next, since the latter information is structured in the same way as the information of A, it is stored in the same manner.

【0056】その結果、受取り側のデータベース12
は、正しく構造化され、対応するデータベース・テーブ
ル32に記憶された情報で充填される。したがって、個
々の照会は転送された情報パッケージの全体量にわたっ
てBのスタッフによって直ちにかつ快適にセットアップ
することができ、データベースからデータを読み取った
ときにいかなるBLOB解析も不要である。したがっ
て、データベースからデータを読み取って理解するため
に必要な時間量は最小限になる。
As a result, the receiving side database 12
Are correctly structured and filled with the information stored in the corresponding database table 32. Thus, individual queries can be set up immediately and comfortably by B's staff over the entire volume of information package transferred, without the need for any BLOB analysis when reading data from the database. Thus, the amount of time required to read and understand data from the database is minimized.

【0057】次に、本発明の方法の主な応用部分を形成
するいわゆる文脈自由文法を特に参照し、図1のステッ
プ120およびステップ130について、より詳細に説
明する。ファイル内容の構造、あるいはより一般的に表
すと本出願の用語における情報パッケージまたは量の構
造は、文脈自由文法によって記述される場合が多い。こ
の場合、その文法の非端末(non-terminals)はリレー
ショナル・データベース・システムのテーブルにマッピ
ングされる。非端末は通常、意味的エンティティ・グル
ープを構文上記述するために使用するので、これは自然
なマッピングである。次に、このようなエンティティ・
グループをテーブルにマッピングすることができる。
Steps 120 and 130 of FIG. 1 will now be described in more detail, with particular reference to the so-called context-free grammar which forms the main application part of the method of the invention. The structure of the file contents, or more generally, the structure of the information package or quantity in the terms of the present application, is often described by a context-free grammar. In this case, the non-terminals of the grammar are mapped to tables in a relational database system. This is a natural mapping, since non-terminals are typically used to describe a semantic entity group syntactically. Next, such an entity
Groups can be mapped to tables.

【0058】普遍性を失わずに、文脈自由文法の規則は
以下の形式になると想定される。
Without loss of universality, the rules of a context-free grammar are assumed to be of the form

【0059】 [1] ls ==> rs1 rs2 ... rsN または [2] ls ==> rs1 rs2 ... rsN または [3] ls ==> (rs)+ または [4] ls ==> (rs)*[1] ls ==> rs1 rs2 ... rsN or [2] ls ==> rs1 rs2 ... rsN or [3] ls ==> (rs) + or [4] ls ==> (rs) *

【0060】lsは「左側」を表し、rsは「右側」を
表す。lsは常に非端末を表し、rsは端末、空端末
(empty-terminal)、非端末のいずれかを表す。
Ls represents “left side”, and rs represents “right side”. ls always represents a non-terminal, and rs represents any of a terminal, an empty-terminal, and a non-terminal.

【0061】[1]は構造の連結と呼ばれ、左側が右側
の1つまたは複数の端末または非端末によって連結によ
って構成されることを意味する。
[1] is referred to as a structure connection, and means that the left side is formed by connection of one or more terminals or non-terminals on the right side.

【0062】[2]は構造の選択と呼ばれ、左側が右側
の1つの端末または非端末から正確に構成されることを
意味する。
[2] is referred to as structure selection and means that the left side is correctly composed of one terminal or non-terminal on the right side.

【0063】[3]は構造の1繰返しと呼ばれ、左側が
rsの1回または複数回の繰返しによって構成されるこ
とを意味する。
[3] is called one repetition of the structure, and means that the left side is constituted by one or more repetitions of rs.

【0064】[4]は構造の0繰返しと呼ばれ、左側が
rsの0回またはそれ以上の繰返しによって構成される
ことを意味する。
[4] is called zero repetition of the structure and means that the left side is constituted by zero or more repetitions of rs.

【0065】各文脈自由文法は、それぞれが上記4通り
のパターンの1つを固守する規則の有限セットによって
記述することができる。さらに、普遍性を失わずに、各
非端末が規則の左側に正確に1回ずつ現れると想定する
ことができる。正規表現は、特殊なサブクラスの文脈自
由文法であり、したがって、これらのパターンを固守す
る1組の規則によって記述することができる。実際に
は、非端末は、トークンクラスと実非端末とに分割され
る。前者は字句解析プログラムによって認識され、後者
は構文解析プログラムによって認識される。上記の例で
は、これらのグループは、'名前'、'A'、'0'、':'の
ように端末用の引用符と、<STRING>、<IDE
NTIFIER>、<NUMBER>のようにトークン
クラス用の<>と、ADDRESS、EMPLOYER
_NUMBERのように非端末用の接頭辞または接尾辞
のない大文字単語によって区別される。
Each context-free grammar can be described by a finite set of rules, each of which adheres to one of the above four patterns. Further, without loss of universality, it can be assumed that each non-terminal appears exactly once on the left side of the rule. Regular expressions are a special subclass of context-free grammar, and can therefore be described by a set of rules that adhere to these patterns. In practice, non-terminals are divided into token classes and real non-terminals. The former is recognized by the lexical analyzer, and the latter is recognized by the parser. In the above example, these groups are quoted for the terminal, such as 'name', 'A', '0', ':', and <STRING>, <IDE
<> For token class such as NTIFIER>, <NUMBER>, ADDRESS, EMPLOYER
It is distinguished by an uppercase word without a prefix or suffix for non-terminals, such as _NUMBER.

【0066】「実非端末(Real non-terminal)」は非
端末という。
"Real non-terminal" is called a non-terminal.

【0067】このような規則の「単純文法ベース・マッ
ピング」は以下のようになるだろう。
The "simple grammar-based mapping" of such a rule would be as follows:

【0068】各非端末ごとにテーブルが作成される。さ
らに、各テーブルごとに自動的に1次キーが作成される
ことになる。これは行を明確に識別する数字にすぎな
い。このキーは、テーブルに挿入される新しい行ごとに
自動的に増分される。
A table is created for each non-terminal. Further, a primary key is automatically created for each table. This is just a number that clearly identifies the line. This key is automatically incremented for each new row inserted into the table.

【0069】パターン[1]に一致する各規則ごとに、
規則の右側の各非端末の外部キーを表す列が規則の左側
の非端末に対応するテーブルに追加される。規則の右側
の各トークンクラスごとに、varchar型の列が追加され
る。解析時に規則が一致した場合、その規則の右側の各
非端末ごとに適切な列に外部キーが入れられ、各トーク
ンクラスごとに適切な列にその具体的な値が入れられ
る。
For each rule that matches pattern [1],
A column representing the foreign key of each non-terminal on the right of the rule is added to the table corresponding to the non-terminal on the left of the rule. A varchar column is added for each token class on the right side of the rule. If the rule matches during parsing, the foreign key is placed in the appropriate column for each non-terminal to the right of the rule, and the specific value is placed in the appropriate column for each token class.

【0070】たとえば、文法規則は以下の通りとする。For example, the grammar rules are as follows.

【0071】[0071]

【表8】 [Table 8]

【0072】その結果、以下のスキーマ拡張が行われ
る。
As a result, the following schema extension is performed.

【0073】[0073]

【表9】 [Table 9]

【0074】文字列「Name: John Miller No: 00000
7」、「Name: Liz Parker No: 000011」、「Name: Cind
y Smith No: 000003」の解析後、以下の項目が生成され
ることになる。
The character string "Name: John Miller No: 00000"
7 "," Name: Liz Parker No: 000011 "," Name: Cind
After parsing "y Smith No: 000003", the following items will be generated.

【0075】[0075]

【表10】 [Table 10]

【0076】テーブルEMPLOYEEの列「name」の
値はテーブルNAMEの行を参照することに留意された
い。
Note that the value of column "name" of table EMPLOEEEE refers to a row of table NAME.

【0077】パターン[2]に一致する各規則ごとに、
規則の右側の各非端末の外部キーを表す列が規則の左側
の非端末に対応するテーブルに追加される。各トークン
クラスごとに、varchar型の列が生成され、右側に端末
がある場合は「terminal_value」という名前のvarchar
型の列が生成される。解析時に規則が非端末と一致した
場合、その規則の右側の一致した非端末について適切な
列に外部キーが入れられ、他のすべての列はNULLに
設定される。規則がトークンクラスと一致した場合、そ
の具体的な値が適切な列に入れられ、他のすべての列は
NULLに設定される。端末が右側で一致する場合、そ
の端末の値が「terminal」列に入れられ、他のすべての
列はNULLに設定される。
For each rule that matches pattern [2],
A column representing the foreign key of each non-terminal on the right of the rule is added to the table corresponding to the non-terminal on the left of the rule. For each token class, a varchar column is generated, and if there is a terminal on the right, a varchar named "terminal_value"
A type column is generated. If the rule matches a non-terminal during parsing, the foreign key is placed in the appropriate column for the matching non-terminal on the right of the rule, and all other columns are set to NULL. If the rule matches the token class, its specific value is placed in the appropriate column, and all other columns are set to NULL. If a terminal matches on the right side, the value of that terminal is placed in the "terminal" column and all other columns are set to NULL.

【0078】他の例証的な潜在的ファイル内容では、文
法規則は以下の通りとする。
For another illustrative potential file content, the grammar rules are as follows:

【0079】[0079]

【表11】 [Table 11]

【0080】その結果、以下のスキーマ拡張が行われ
る。
As a result, the following schema extension is performed.

【0081】[0081]

【表12】 [Table 12]

【0082】文字列「A: Dog」、「P: Oak」、「P: Ald
er」、「A: Squirrel」の解析時に以下の項目が生成さ
れることになる。
Character strings "A: Dog", "P: Oak", "P: Ald
The following items will be generated when analyzing "er" and "A: Squirrel".

【0083】[0083]

【表13】 [Table 13]

【0084】完全に理解するために他の例を示す。この
例では、顧客は名前または顧客番号によって識別するこ
とができる。注文の対象は、テーブル、イス、またはS
UBJECTテーブルのany_other_subject列に対応す
る他のものにすることができる。文法規則は以下の通り
とする。
Another example is provided for a thorough understanding. In this example, customers can be identified by name or customer number. Order can be placed on a table, chair, or S
It can be another one corresponding to the any_other_subject column of the UBJECT table. The grammar rules are as follows.

【0085】[0085]

【表14】 [Table 14]

【0086】その結果、以下のスキーマ拡張が行われ
る。
As a result, the following schema extension is performed.

【0087】[0087]

【表15】 [Table 15]

【0088】文字列「Order from: John Miller Subjec
t is: Table」、「Order from: 000918 Subject is: Wa
ter」、「Order from: Liz Parker Subject is: Ca
r」、「Order from: Cindy Smith Subject is: Chair」
の解析時に以下の項目が生成されることになる。
The character string "Order from: John Miller Subjec"
t is: Table '', `` Order from: 000918 Subject is: Wa
ter '', `` Order from: Liz Parker Subject is: Ca
r "," Order from: Cindy Smith Subject is: Chair "
The following items will be generated when analyzing.

【0089】[0089]

【表16】 [Table 16]

【0090】パターン[3]に一致し、右側に非端末を
有する各規則ごとに、1次キー目的の列が規則の左側の
非端末に対応するテーブルに追加される。また、カウン
ト目的の列もこのテーブルに追加され、1次キーの一部
としても機能する。右側の非端末について、外部キーの
列がテーブルに追加される。解析時に規則が一致した場
合、右側の各インスタンス化ごとに、その項目の順序番
号および外部キーを含む行が作成され、テーブルに挿入
される。
For each rule that matches pattern [3] and has a non-terminal on the right, a column for primary key purposes is added to the table corresponding to the non-terminal on the left of the rule. Also, a column for counting purposes is added to this table and functions as a part of the primary key. For the right non-terminal, a foreign key column is added to the table. If the rule matches during parsing, a row containing the item's sequence number and foreign key is created and inserted into the table for each instantiation on the right.

【0091】たとえば、文法規則は以下の通りとする。For example, the grammar rules are as follows.

【0092】[0092]

【表17】 [Table 17]

【0093】その結果、以下のスキーマ拡張が行われ
る。
As a result, the following schema extension is performed.

【0094】[0094]

【表18】 [Table 18]

【0095】文字列「John Miller Liz Parker Cindy S
mith」および「Elvis Presley Sandra Brown」の解析時
に以下の項目が生成されることになる。
The string "John Miller Liz Parker Cindy S"
The following items will be generated when analyzing "mith" and "Elvis Presley Sandra Brown".

【0096】[0096]

【表19】 [Table 19]

【0097】パターン[3]に一致し、右側にトークン
クラスを有する各規則ごとに、1次キー目的の列が規則
の左側の非端末に対応するテーブルに追加される。ま
た、カウント目的の列もこのテーブルに追加され、それ
が1次キーの一部としても機能する。右側のトークンク
ラスについて、varchar型の列がテーブルに追加され
る。解析時にその規則が適用された場合、右側の各イン
スタンス化ごとに、その項目の順序番号および具体的な
トークンクラス値を含む行が作成され、テーブルに挿入
される。
For each rule that matches pattern [3] and has a token class on the right, a column for primary key purposes is added to the table corresponding to the non-terminal on the left of the rule. A column for counting purposes is also added to this table, which also functions as a part of the primary key. For the token class on the right, a varchar column is added to the table. If the rule was applied during parsing, for each instantiation on the right, a row containing the item's sequence number and specific token class value is created and inserted into the table.

【0098】たとえば、文法規則は以下の通りとする。For example, the grammar rules are as follows.

【0099】[0099]

【表20】 [Table 20]

【0100】その結果、以下のスキーマ拡張が行われ
る。
As a result, the following schema extension is performed.

【0101】[0101]

【表21】 [Table 21]

【0102】文字列「John Liz Cindy」および「Elvis
Sandra」の解析時に以下の項目が生成されることにな
る。
The strings "John Liz Cindy" and "Elvis
The following items will be generated when analyzing "Sandra".

【0103】[0103]

【表22】 [Table 22]

【0104】パターン[3]に一致し、右側に端末を有
する各規則ごとに、1次キー目的の列が規則の左側の非
端末に対応するテーブルに追加される。また、カウント
目的の列もこのテーブルに追加される。解析時にその規
則が適用された場合、端末の出現数を含む行が作成さ
れ、テーブルに挿入される。
For each rule that matches pattern [3] and has a terminal on the right, a column for primary key purposes is added to the table corresponding to the non-terminal on the left of the rule. A column for counting purposes is also added to this table. If the rule is applied during parsing, a row containing the number of occurrences of the terminal is created and inserted into the table.

【0105】たとえば、文法規則は以下の通りとする。For example, the grammar rules are as follows.

【0106】[0106]

【表23】 [Table 23]

【0107】その結果、以下のスキーマ拡張が行われ
る。
As a result, the following schema extension is performed.

【0108】[0108]

【表24】 [Table 24]

【0109】文字列「0000000000」、「00
0」、「000000」の解析時に以下の項目が生成さ
れることになる。
Character strings "000000000000", "00"
The following items are generated when “0” and “000000” are analyzed.

【0110】[0110]

【表25】 [Table 25]

【0111】パターン[4]に一致する各規則について
は、[3]の場合と同じものが適用される。
For each rule that matches pattern [4], the same rule as in case of [3] is applied.

【0112】本発明による処理および転送方法は、有利
なことに、XML(拡張可能マークアップ言語, Extens
ible Markup Language)文書とともに適用することがで
きる。というのは、各XML文書は任意選択で文書型宣
言ファイル(DTD)を参照するからである。当技術分
野で既知の通り、DTDは、他の構成体の中でも主に正
規表現を使用して、XMLファイルの構造を記述する。
以下のサンプルDTDは、XMLで作成されたDTDを
本発明による処理および転送方法に適用できることを立
証するためのものである。このDTDは、従業員のリス
トの構造を含む。
The processing and forwarding method according to the invention is advantageously implemented in XML (Extensible Markup Language, Extens
ible Markup Language) documents. This is because each XML document optionally references a document type declaration file (DTD). As is known in the art, DTD describes the structure of an XML file using primarily regular expressions, among other constructs.
The following sample DTD demonstrates that a DTD created in XML can be applied to the processing and forwarding method according to the present invention. This DTD contains the structure of the list of employees.

【0113】[0113]

【表26】 [Table 26]

【0114】上記のDTDを固守するXML文書は以下
のようになる可能性がある。
An XML document that adheres to the above DTD may be as follows.

【0115】[0115]

【表27】 [Table 27]

【0116】このXML文書は、それぞれの名前と相互
の関係を含む従業員のリストを記述するものである。こ
のXML文書の構造がDTDによって示され、DTDが
正規表現によって文法のようにこの構造を記述している
ことを強調しなければならない。
This XML document describes a list of employees including their names and mutual relationships. It must be emphasized that the structure of this XML document is indicated by the DTD and that the DTD describes this structure like a grammar by regular expressions.

【0117】DTDの規則は以下のように解釈しなけれ
ばならない。
The DTD rules must be interpreted as follows.

【0118】[0118]

【表28】 [Table 28]

【0119】この規則では、従業員のリストが1人また
は複数の従業員を含み、このようなリストはタグ<list_
of_employees>および</list_of_employees>によって囲
まなければならないことを示している。
According to this rule, the list of employees includes one or more employees, and such a list has the tag <list_
of_employees> and </ list_of_employees>.

【0120】[0120]

【表29】 [Table 29]

【0121】これらの規則では、1人の従業員が1つの
名前を含まなければならず、複数の電子メール・アドレ
スを含むことができ、任意選択で指定のリンクを有する
こともできることを示している。さらに、従業員は固有
のIDを持っていなければならない。内容ファイル内の
従業員項目は<employee>および</employee>によってタ
グを付けなければならない。
These rules indicate that one employee must include one name, may include multiple e-mail addresses, and may optionally have a designated link. I have. In addition, employees must have unique IDs. Employee items in the content file must be tagged with <employee> and </ employee>.

【0122】[0122]

【表30】 [Table 30]

【0123】これらの規則では、名前が姓と洗礼名から
なり、それが任意の文字列からなることを示している。
内容ファイル内の名前項目は<name>および</name>によ
ってタグを付けなければならない。また、姓および洗礼
名は<family>、</family>、および<given>、</given>に
よってタグを付けなければならない。
These rules indicate that the name is composed of a surname and a baptismal name, and that it is composed of an arbitrary character string.
Name entries in the content file must be tagged with <name> and </ name>. Last names and baptisms must also be tagged with <family>, </ family>, and <given>, </ given>.

【0124】[0124]

【表31】 [Table 31]

【0125】この規則では、電子メールが任意の文字列
からなることを示している。電子メール項目は<email>
および</email>によってタグを付けなければならない。
This rule indicates that an electronic mail is composed of an arbitrary character string. Email item is <email>
And </ email>.

【0126】[0126]

【表32】 [Table 32]

【0127】これらの規則では、1つのリンクが2つの
任意選択属性を有し、一方が管理者を参照し、もう一方
が部下のリストを参照することを示している。
These rules indicate that one link has two optional attributes, one referring to the manager and the other referring to the list of subordinates.

【0128】各<!ELEMENT...>項目は要素型と呼ばれ
る。上記の例は、list_of_employees、employee、emai
l、name、family、given、linkという7通りの要素型を
示している。
Each <! ELEMENT ...> item is called an element type. In the above example, list_of_employees, employee, emai
It shows seven element types, l, name, family, given, and link.

【0129】文書要素は所与の要素型の構造を固守し、
属性(同じくDTDに定義されている)を有することが
できる。これらの属性は<!ATTLIST...>項目によって記
述される。
A document element adheres to the structure of a given element type,
It can have attributes (also defined in the DTD). These attributes are described by <! ATTLIST ...> items.

【0130】ここで、本発明の方法は、要素型定義を固
守する要素のマッピングを記述することにより、リレー
ショナル・データベースに適用できることが分かる。
Here, it can be seen that the method of the present invention can be applied to a relational database by describing element mappings that adhere to element type definitions.

【0131】このマッピング技術の単純な実施態様の1
つは、文脈自由文法の場合とまったく同じ手法であるデ
ータベース・スキーマで各要素型ごとにテーブルを作成
することになるだろう。
One of the simple embodiments of this mapping technique
One would create a table for each element type in a database schema, exactly the same way as in context-free grammar.

【0132】したがって、以下のテーブルを生成するこ
とができる。
Accordingly, the following table can be generated.

【0133】[0133]

【表33】 [Table 33]

【0134】上記のテーブルの列は、要素型自体の定義
およびその属性に対応する。この例では、文脈自由文法
の場合とまったく同じ規則が使用され、したがって、以
下のテーブル定義が得られる。
The columns in the above table correspond to the definition of the element type itself and its attributes. In this example, exactly the same rules are used as in the context-free grammar, so we get the following table definition:

【0135】[0135]

【表34】 [Table 34]

【0136】上記の明細書では、特定の例証的な実施の
形態に関連して本発明を説明してきた。しかし、特許請
求の範囲に記載した本発明のより広範囲の趣旨および範
囲を逸脱せずに様々な修正および変更を加えることがで
きることは明らかになるだろう。したがって、明細書お
よび添付図面は、限定的意味ではなく、例証と見なすべ
きものである。
In the foregoing specification, the invention has been described with reference to specific illustrative embodiments. It will be apparent, however, that various modifications and changes may be made without departing from the broader spirit and scope of the invention as set forth in the appended claims. Accordingly, the specification and accompanying drawings are to be regarded in an illustrative, rather than a restrictive, sense.

【0137】また、本発明による処理方法は、構造化情
報を記憶するためのオブジェクト指向データベースにも
適合可能である。
The processing method according to the present invention is also applicable to an object-oriented database for storing structured information.

【0138】まとめとして、本発明の構成に関して以下
の事項を開示する。
In summary, the following items are disclosed regarding the configuration of the present invention.

【0139】(1)コンピュータ・システムのデータベ
ースに記憶すべき構造化情報(100)を処理するため
の方法であって、情報の構造を記述する文法を決定する
ステップ(110)と、前記文法からデータベース・ス
キーマを導き出すステップ(120)と、前記文法から
マッピング規則を生成するステップ(130)と、スキ
ーマおよびマッピング規則に応じて前記データベースに
構造化情報を記憶するステップ(140)とを含む方
法。 (2)リレーショナル・データベース(12)のテーブ
ル(32)に文法の非端末をマッピングするステップを
特徴とする、上記(1)に記載の方法。 (3)文脈自由文法を使用して構造化情報(100)を
記述するステップを特徴とする、上記(2)に記載の方
法。 (4)文脈自由文法を使用して構造化情報(100)を
記述し、複数の情報パッケージ(100)の構造化内容
を反映する文書記述ファイル30を生成し、前記文書記
述ファイル(30)から前記データベース・スキーマ
(12)を導き出すステップを特徴とする、上記(3)
に記載の方法。 (5)XMLを使用して構造化情報(100)を記述す
るステップを特徴とする、上記(4)に記載の方法。 (6)オブジェクト指向データベース・システムの構造
要素に文法の非端末をマッピングするステップを特徴と
する、上記(5)に記載の方法。 (7)ある量の情報を外部サイトからデータベース内に
転送する方法であって、その量の情報が、共通の一般的
な情報構造によって一般化可能な複数の少なくとも同様
に構造化された情報パッケージ(100)を含み、前記
方法が、転送すべき情報パッケージ(100)の一般的
な構造を特徴付ける文書記述ファイル(30)(DT
D)を1回生成するステップと、文書記述ファイル(3
0)に応じて受取り側データベース(10)内にデータ
ベース・スキーマ(10)を1回生成するステップと、
前記複数の情報パッケージ(100)を受取り側データ
ベース(12)に送るステップと、スキーマ(10)に
対応するデータベース(12)に情報を書き込むステッ
プとを含む方法。 (8)上記(1)ないし上記(6)に記載の方法を実現
するコンピュータ・プログラムを実行できるかまたは上
記(7)に記載の方法の実行を支援できるように構成さ
れた少なくとも1つのデータベース管理システムがイン
ストールされたコンピュータ・システム。 (9)上記(1)に記載の方法を実現するコンピュータ
・プログラムをインストールするため、または上記
(7)に記載の方法の実行を支援するために使用可能な
データを記憶する電子データ・キャリア。
(1) A method for processing structured information (100) to be stored in a database of a computer system, comprising the steps of: (110) determining a grammar describing the structure of the information; A method comprising: deriving a database schema (120); generating mapping rules from the grammar (130); and storing structured information in the database according to the schema and mapping rules (140). (2) The method according to the above (1), characterized by mapping a grammar non-terminal to the table (32) of the relational database (12). (3) The method according to (2), wherein the structured information (100) is described using a context-free grammar. (4) The structured information (100) is described using a context-free grammar, and a document description file 30 reflecting the structured content of the plurality of information packages (100) is generated. (3) characterized in that the database schema (12) is derived.
The method described in. (5) The method according to (4), wherein the structured information (100) is described using XML. (6) The method according to the above (5), wherein a grammar non-terminal is mapped to a structural element of the object-oriented database system. (7) A method of transferring a certain amount of information from an external site into a database, wherein the amount of information is a plurality of at least similarly structured information packages that can be generalized by a common general information structure. (100), wherein the method characterizes the general structure of the information package (100) to be transferred.
D) once, and a document description file (3)
Generating a database schema (10) once in the receiving database (10) in response to 0);
A method comprising: sending the plurality of information packages (100) to a receiving database (12); and writing information to a database (12) corresponding to a schema (10). (8) At least one database management configured to execute a computer program for implementing the method described in (1) to (6) or to support the execution of the method described in (7). Computer system on which the system was installed. (9) An electronic data carrier for storing data usable for installing a computer program for implementing the method according to (1) or for supporting the execution of the method according to (7).

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の処理方法の概略流れ図である。FIG. 1 is a schematic flowchart of a processing method of the present invention.

【図2】本発明の処理方法の第1の実施の形態の基本態
様を示す包括的な概略図である。
FIG. 2 is a comprehensive schematic diagram showing a basic mode of the first embodiment of the processing method of the present invention.

【図3】本発明の処理方法の第2の実施の形態の基本態
様を示す包括的な概略図である。
FIG. 3 is a comprehensive schematic diagram showing a basic mode of a second embodiment of the processing method of the present invention.

【図4】本発明により情報を転送するための方法の概略
ブロック図である。
FIG. 4 is a schematic block diagram of a method for transferring information according to the present invention.

【図5】本発明の方法による情報転送を示す包括的な概
略図である。
FIG. 5 is a comprehensive schematic diagram illustrating information transfer according to the method of the present invention.

【符号の説明】[Explanation of symbols]

10 スキーマ 12 データベース(db) 14 文法 16 ファイル内容 18 マッピング規則 20 メタ文脈 30 DTDファイル 32 dbテーブル 100 情報パッケージ 110 文法を決定する 120 文法からdbスキーマを導き出す 130 文法からマッピング規則を生成する 140 スキーマおよびマッピング規則に応じてデータ
ベースに情報を記憶する 400 プロトタイプ情報 410 情報を解析する 420 DTDを生成する 430 BにDTDを送る 440 DTDを受け取り、dbスキーマを生成する 450 複数の情報パッケージを送る 460 情報を受け取る
Reference Signs List 10 schema 12 database (db) 14 grammar 16 file contents 18 mapping rule 20 metacontext 30 DTD file 32 db table 100 information package 110 determining grammar 120 deriving db schema from grammar 130 generating mapping rules from grammar 140 schema and Store information in database according to mapping rules 400 Prototype information 410 Analyze information 420 Generate DTD 430 Send DTD to B 440 Receive DTD and generate db schema 450 Send multiple information packages 460 Send information receive

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】コンピュータ・システムのデータベースに
記憶すべき構造化情報(100)を処理するための方法
であって、 情報の構造を記述する文法を決定するステップ(11
0)と、 前記文法からデータベース・スキーマを導き出すステッ
プ(120)と、 前記文法からマッピング規則を生成するステップ(13
0)と、 スキーマおよびマッピング規則に応じて前記データベー
スに構造化情報を記憶するステップ(140)とを含む
方法。
A method for processing structured information (100) to be stored in a database of a computer system, the method comprising: determining a grammar describing the structure of the information (11).
0), deriving a database schema from the grammar (120), and generating mapping rules from the grammar (13)
0) and storing (140) structured information in the database according to the schema and the mapping rules.
【請求項2】リレーショナル・データベース(12)の
テーブル(32)に文法の非端末をマッピングするステ
ップを特徴とする、請求項1に記載の方法。
2. The method according to claim 1, characterized in that grammar non-terminals are mapped to tables (32) of the relational database (12).
【請求項3】文脈自由文法を使用して構造化情報(10
0)を記述するステップを特徴とする、請求項2に記載
の方法。
3. Structured information (10) using a context-free grammar.
Method according to claim 2, characterized by the step of describing 0).
【請求項4】文脈自由文法を使用して構造化情報(10
0)を記述し、複数の情報パッケージ(100)の構造
化内容を反映する文書記述ファイル30を生成し、前記
文書記述ファイル(30)から前記データベース・スキ
ーマ(12)を導き出すステップを特徴とする、請求項
3に記載の方法。
4. Structured information (10) using a context-free grammar.
0), generating a document description file 30 reflecting the structured contents of the plurality of information packages (100), and deriving the database schema (12) from the document description file (30). The method of claim 3.
【請求項5】XMLを使用して構造化情報(100)を
記述するステップを特徴とする、請求項4に記載の方
法。
5. Method according to claim 4, characterized in that the structured information (100) is described using XML.
【請求項6】オブジェクト指向データベース・システム
の構造要素に文法の非端末をマッピングするステップを
特徴とする、請求項5に記載の方法。
6. The method according to claim 5, characterized in that grammar non-terminals are mapped to structural elements of the object-oriented database system.
【請求項7】ある量の情報を外部サイトからデータベー
ス内に転送する方法であって、その量の情報が、共通の
一般的な情報構造によって一般化可能な複数の少なくと
も同様に構造化された情報パッケージ(100)を含
み、前記方法が、 転送すべき情報パッケージ(100)の一般的な構造を
特徴付ける文書記述ファイル(30)(DTD)を1回
生成するステップと、 文書記述ファイル(30)に応じて受取り側データベー
ス(10)内にデータベース・スキーマ(10)を1回
生成するステップと、 前記複数の情報パッケージ(100)を受取り側データ
ベース(12)に送るステップと、 スキーマ(10)に対応するデータベース(12)に情
報を書き込むステップとを含む方法。
7. A method for transferring a quantity of information from an external site into a database, said quantity of information being at least a plurality of at least similarly structured generalizable by a common general information structure. An information package (100), said method comprising: once generating a document description file (30) (DTD) characterizing the general structure of the information package (100) to be transferred; Generating a database schema (10) once in a receiving database (10) in response to: sending the plurality of information packages (100) to a receiving database (12); Writing information to a corresponding database (12).
【請求項8】請求項1ないし請求項6に記載の方法を実
現するコンピュータ・プログラムを実行できるかまたは
請求項7に記載の方法の実行を支援できるように構成さ
れた少なくとも1つのデータベース管理システムがイン
ストールされたコンピュータ・システム。
8. At least one database management system configured to execute a computer program for realizing the method according to claim 1 or to support the execution of the method according to claim 7. Computer system on which is installed.
【請求項9】請求項1に記載の方法を実現するコンピュ
ータ・プログラムをインストールするため、または請求
項7に記載の方法の実行を支援するために使用可能なデ
ータを記憶する電子データ・キャリア。
9. An electronic data carrier storing data usable for installing a computer program for implementing the method according to claim 1 or for supporting the execution of the method according to claim 7.
JP11283048A 1998-10-10 1999-10-04 Method for processing information and computer system Pending JP2000122903A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP98119175 1998-10-10
EP98119175.2 1998-10-10

Publications (1)

Publication Number Publication Date
JP2000122903A true JP2000122903A (en) 2000-04-28

Family

ID=8232774

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11283048A Pending JP2000122903A (en) 1998-10-10 1999-10-04 Method for processing information and computer system

Country Status (4)

Country Link
JP (1) JP2000122903A (en)
DE (1) DE19948030A1 (en)
SG (1) SG85680A1 (en)
TW (1) TW571203B (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006126906A (en) * 2004-10-26 2006-05-18 Daikin Ind Ltd Data management system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5291583A (en) * 1990-12-14 1994-03-01 Racal-Datacom, Inc. Automatic storage of persistent ASN.1 objects in a relational schema

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006126906A (en) * 2004-10-26 2006-05-18 Daikin Ind Ltd Data management system

Also Published As

Publication number Publication date
DE19948030A1 (en) 2000-04-13
TW571203B (en) 2004-01-11
SG85680A1 (en) 2002-01-15

Similar Documents

Publication Publication Date Title
Bernstein et al. Information integration in the enterprise
US6799184B2 (en) Relational database system providing XML query support
US6721727B2 (en) XML documents stored as column data
US6763499B1 (en) Methods and apparatus for parsing extensible markup language (XML) data streams
US8484210B2 (en) Representing markup language document data in a searchable format in a database system
US6240407B1 (en) Method and apparatus for creating an index in a database system
US7783614B2 (en) Linking elements of a document to corresponding fields, queries and/or procedures in a database
US7370270B2 (en) XML schema evolution
Jensen et al. Converting XML DTDs to UML diagrams for conceptual data integration
US8190991B2 (en) XSD inference
US9626368B2 (en) Document merge based on knowledge of document schema
US7370028B2 (en) Method of and system for providing namespace based object to XML mapping
US20110131200A1 (en) Complex path-based query execution
US20030225811A1 (en) Automatically deriving an application specification from a web-based application
JP2001282594A (en) Corporate work integration system and method for integrating a plurality of data sources
JP2008541254A (en) Method for dynamically generating an XML document from a database
US6915303B2 (en) Code generator system for digital libraries
JP2001034619A (en) Store and retrieval method of xml data, and xml data retrieval system
US20050050056A1 (en) Mechanism to enable evolving XML schema
US20040019589A1 (en) Driver for mapping standard database queries and commands to markup language documents
US8196033B2 (en) Converting between data sources and XML
US20040220954A1 (en) Translation of data from a hierarchical data structure to a relational data structure
Pluempitiwiriyawej et al. A classification scheme for semantic and schematic heterogeneities in XML data sources
JP2000122903A (en) Method for processing information and computer system
US20060136483A1 (en) System and method of decomposition of multiple items into the same table-column pair

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040127