JP2001195406A - データベース管理システム - Google Patents

データベース管理システム

Info

Publication number
JP2001195406A
JP2001195406A JP2000000867A JP2000000867A JP2001195406A JP 2001195406 A JP2001195406 A JP 2001195406A JP 2000000867 A JP2000000867 A JP 2000000867A JP 2000000867 A JP2000000867 A JP 2000000867A JP 2001195406 A JP2001195406 A JP 2001195406A
Authority
JP
Japan
Prior art keywords
data
attribute
stored
search
attribute item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000000867A
Other languages
English (en)
Inventor
Atsushi Sakakibara
淳 榊原
Mikio Oda
美樹男 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Media Fusion Co Ltd
Original Assignee
Media Fusion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Media Fusion Co Ltd filed Critical Media Fusion Co Ltd
Priority to JP2000000867A priority Critical patent/JP2001195406A/ja
Priority to US09/750,856 priority patent/US6701328B1/en
Publication of JP2001195406A publication Critical patent/JP2001195406A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 XMLブロックデータをそのまま記憶できる
データベース管理システムを提供する。 【解決手段】 データ群記憶手段5は、複数の属性項目
についてデータが記憶され、かつ各属性項目が構造的に
定められたブロックデータを、複数記憶する。補助デー
タ記憶手段7は、複数のブロックデータの各属性項目に
属するデータの存在位置情報を含む検索補助データを記
憶する。検索手段3は、検索する属性項目を含む検索命
令が与えられると、補助データ記憶手段7に記憶された
検索補助データを参照にして、データ記憶手段5に記憶
されたデータを検索する。したがって、各属性項目が構
造的に定められているブロックデータを、そのまま、複
数記憶しても、高速にデータ検索が可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベース管理
システムに関し、特に、データ構造の自由度の向上に関
する。
【0002】
【従来技術】一般に、データベース管理システムにおい
ては、複数のレコードを有しており、各レコードは複数
のフィールドから構成されている。かかるフィールドの
データ構造(データ型、データ長など)は予め定められ
ている。このように各フィールドのデータをあらかじめ
定義しておくことにより、高速検索が可能となる。
【0003】ところで、今日、構造記述型データとして
XMLデータが注目されている。かかるXMLデータは
データ自体に属性を付加させることができるので、与え
られたデータがどのフィールドにデータであるかを自動
抽出できる。例えば、図3に示すXMLデータであれ
ば、コンピュータは、各項目のタグを参照することによ
り、データ「山田一郎」をフィールド「名前」に、デー
タ「課長」をフィールド「役職」に記憶させることがで
きる。
【0004】
【発明が解決しようとする課題】しかしながら、上記デ
ータベース管理システムにおいては、以下のような問題
があった。各レコードを固定長とした場合、各レコード
毎のフィールド数およびフィールド長は固定長となる。
したがって、新たにフィールドの追加やフィールド長を
変更する場合には、データ構造を再構築しなければなら
ない。すなわち、新たな属性を含むXMLデータが与え
られても、当該属性のデータは無視される。データベー
ス管理システムが管理するデータ量は膨大なものが多
く、例えば100万レコードのうちの1レコードだけが
有する新たなフィールドの為に、全データ構造について
変更するのは非常に煩雑な処理となる。
【0005】また、当該フィールドにデータが存在しな
い場合でも、当該データ構造にあわせたデータ(nullな
ど)をデータ入力しておかなければならず、無駄な領域
が発生する。
【0006】かかる問題を解決するために、各レコード
を可変長とすることも考えられるが、この場合でも、各
フィールドのフィールド長を可変長とすることができる
だけで、各レコードのフィールド数はあらかじめ定める
必要がある。したがって、新たなフィールドの追加はで
きない。
【0007】すなわち、従来のデータベース管理システ
ムでは、データ自身に属性を付加できるというXMLデ
ータのメリットを十分活用する構造となっていなかっ
た。また、XMLデータは前記タグを用いて、各項目の
関係構造を記述することができるが、従来のデータベー
ス管理システムではかかる関係構造をそのまま記憶する
ことができなかった。
【0008】この発明は上記問題を解決し、属性可付加
型の記述型データについて、その特性を十分に生かすこ
とのできる柔軟なデータベース管理システムを提供する
ことを目的とする。
【0009】
【課題を解決するための手段】1)本発明にかかるデー
タベース管理システムは、複数の属性項目についてデー
タが記憶されており、かつ、各属性項目がツリー構造で
構成されたXMLブロックデータを、コンピュータを用
いて管理するデータベース管理システムであって、1)前
記XMLブロックデータを当該構造を保持したまま、第
1の記憶領域にXMLブロックデータごとに記憶すると
ともに、各XMLブロックデータの各属性項目に属する
データの存在位置情報を各属性毎にまとめて記憶する検
索用インデックスデータを、第2の記憶領域に記憶して
おき、2)新たなXMLブロックデータが与えられると、
以下の処理を行うこと、A)前記XMLブロックデータを
当該ツリー構造を保持したまま、前記第1の記憶領域に
追加記憶するとともに、B)前記新たに与えられたXML
ブロックデータの属性項目のうち、前記検索用インデッ
クスデータの属性項目と一致する属性項目については、
当該属性項目のデータの存在位置情報を前記第2の記憶
領域に追加し、前記検索用インデックスデータの属性項
目に存在しない属性項目については、新たな属性項目と
して前記第2の記憶領域に追加するとともに、当該属性
項目のデータの存在位置情報を前記第2の記憶領域に追
加する。したがって、各属性項目がツリー構造で構成さ
れたXMLブロックデータを、当該構造を崩すことなく
記憶できる。さらに、追加のXMLブロックデータを当
該構造を崩すことなくすべて記憶することができる。ま
た、前記検索用インデックスデータは各属性毎にまとめ
られているので、ある属性のデータを高速に検索でき
る。これにより、各データに属性を付加できるというX
MLデータの特性を活用できるデータベース管理システ
ムを提供することができる。
【0010】2)本発明にかかるデータベース管理シス
テムにおいては、1)複数の属性項目についてデータが記
憶されたデータ群であって、各属性項目が構造的に定め
られているデータ群を、当該構造を崩すことなく複数記
憶するデータ群記憶手段、2)前記複数のデータ群の各属
性項目に属するデータの存在位置情報を各属性毎にまと
めて記憶する検索補助データを記憶する補助データ記憶
手段、3)複数の属性項目についてデータが記憶されたデ
ータ群が新たに与えられると、前記データ記憶手段に追
加記憶するとともに、前記新たに与えられたデータ群の
属性項目のうち、前記検索補助データの属性項目と一致
する属性項目については、当該属性項目のデータの存在
位置情報を追加し、前記検索補助データの属性項目に存
在しない属性項目については、新たな属性項目として追
加するとともに、当該属性項目のデータの存在位置情報
を追加する追加データ群処理手段を備えている。
【0011】したがって、各属性項目が構造的に定めら
れているデータ群を、当該構造を崩すことなく記憶でき
る。さらに、追加のデータ群を当該構造を崩すことなく
すべて記憶することができる。また、前記検索補助デー
タは各属性毎にまとめられているので、ある属性のデー
タを高速に検索できる。これにより、各データに属性を
付加できるという属性付加型データの特性を活用できる
データベース管理システムを提供することができる。
【0012】3)本発明にかかるデータベース管理シス
テムにおいては、前記各属性項目の構造はツリー構造で
ある。したがって、ツリー構造の属性項目を有するデー
タ群をデータベースとして管理することができる。
【0013】4)本発明にかかるデータベース管理シス
テムは、1)複数の属性項目についてデータが記憶された
データ群であって、各属性項目が構造的に定められてい
るデータ群を、当該構造を崩すことなく複数記憶するデ
ータ群記憶手段、2)前記複数のデータ群の各属性項目に
属するデータの存在位置情報を各属性毎にまとめて記憶
する検索補助データを記憶する補助データ記憶手段、3)
検索する属性項目を含む検索命令が与えられると、前記
補助データ記憶手段に記憶された検索補助データを参照
にして、データ記憶手段に記憶されたデータを検索する
検索手段を備えている。このように、各属性項目が構造
的に定められているデータ群に存在する所望のデータ
を、前記検索補助データを用いて検索することにより、
構造的に構成されたデータ群をそのまま記憶した場合で
も、高速にデータ検索が可能となる。
【0014】5)本発明にかかるデータベース管理シス
テムにおいては、前記補助データ記憶手段は、前記各属
性項目の構造を記憶しており、前記検索手段は、各属性
項目の構造を参照にしてデータ記憶手段に記憶されたデ
ータを検索する。したがって、検索命令として検索する
属性項目だけが与えられても、高速検索が可能となる。
【0015】6)本発明にかかるデータを記録したデー
タ記録媒体においては、A)複数の属性項目についてデ
ータが記憶されたデータ群であって、各属性項目が構造
的に定められているデータ群を、当該構造を崩すことな
く複数記憶するデータ群記憶領域、B)前記複数のデー
タ群の各属性項目に属するデータの存在位置情報を記憶
する検索補助データを各属性毎にまとめて記憶する補助
データ記憶領域を有する。したがって、各属性項目が構
造的に定められているデータ群を、当該構造を崩すこと
なく複数記憶しても、前記検索補助データを用いて、高
速検索することができる。
【0016】7)本発明にかかるコンピュータを用いて
データを検索するデータ検索方法においては、1)複数の
属性項目についてデータが記憶されたデータ群であっ
て、各属性項目が構造的に定められているデータ群を、
当該構造を崩すことなく複数、第1の記憶領域に記憶し
ておき、2)前記複数のデータ群の各属性項目に属するデ
ータの存在位置情報を各属性毎にまとめて記憶する検索
補助データを第2の記憶領域に記憶しておき、3)検索す
る属性項目を含む検索命令が与えられると、前記検索補
助データを参照にして、前記第1の記憶領域に記憶され
たデータ群を検索する。このように、各属性項目が構造
的に定められているデータ群に存在する所望のデータ
を、前記検索補助データを用いて検索することにより、
構造的に構成されたデータ群から高速にデータ検索が可
能となる。
【0017】8)本発明にかかるコンピュータを用いた
データ管理方法においては、複数の属性項目についてデ
ータが記憶されたデータ群であって、各属性項目が構造
的に定められているデータ群を、当該構造を崩すことな
く複数第1の記憶領域に記憶しておき、前記複数のデー
タ群の各属性項目に属するデータの存在位置情報を各属
性毎にまとめて記憶する検索補助データを第2の記憶領
域に記憶しておき、複数の属性項目についてデータが記
憶されたデータ群が新たに与えられると、前記第1の記
憶領域に追加記憶するとともに、前記新たに与えられた
データ群の属性項目のうち、前記検索補助データの属性
項目と一致する属性項目については、当該属性項目のデ
ータの存在位置情報を追加し、前記検索補助データの属
性項目に存在しない属性項目については、あたらな属性
項目として追加するとともに、当該属性項目のデータの
存在位置情報を前記第2の記憶領域に追加する。したが
って、各属性項目が構造的に定められているデータ群
を、当該構造を崩すことなく複数記憶することができ
る。また、追加のデータ群を当該構造を崩すことなくす
べて記憶することができる。
【0018】「属性可付加型の記述型データ」とは、実
施形態では,XMLデータを採用したが、これに限定さ
れず、属性が付加できるデータであればどのようなもの
であってもよい。また、属性付加の手法についてはXM
Lデータのようにタグで指定する方式以外であってもよ
い。
【0019】
【発明の実施の形態】1.機能ブロック図の説明 本発明の一実施形態を図面に基づいて説明する。図1に
示すデータベース管理システム1は、データ群記憶手段
5、補助データ記憶手段7、検索手段3、および追加デ
ータ群処理手段9を備えている。
【0020】データ群記憶手段5は、複数の属性項目に
ついてデータが記憶されたデータ群であって、各属性項
目が構造的に定められているデータ群を、当該構造を崩
すことなく複数記憶する。補助データ記憶手段7は、前
記複数のデータ群の各属性項目に属するデータの存在位
置情報を属性毎にまとめて記憶する検索補助データを記
憶する。検索手段3は、検索する属性項目を含む検索命
令が与えられると、補助データ記憶手段7に記憶された
検索補助データを参照にして、データ記憶手段5に記憶
されたデータを検索する。
【0021】したがって、構造的に構成されたデータ群
から高速にデータ検索が可能となる。また、検索補助デ
ータは属性毎にまとめて前記存在位置情報を記憶してい
るので、より高速検索が可能となる。
【0022】追加データ群処理手段9は、複数の属性項
目についてデータが記憶されたデータ群が新たに与えら
れると、データ記憶手段5に追加記憶するとともに、前
記新たに与えられたデータ群の属性項目のうち、前記検
索補助データの属性項目と一致する属性項目について
は、当該属性項目のデータの存在位置情報を追加し、前
記検索補助データの属性項目に存在しない属性項目につ
いては、あたらな属性項目として追加するとともに、当
該属性項目のデータの存在位置情報を前記補助データ記
憶手段7に追加記憶する。したがって、各属性項目が構
造的に定められているデータ群を、当該構造を崩すこと
なくそのまま、複数記憶することができる。また、追加
のデータ群を当該構造を崩すことなくすべて記憶するこ
とができる。
【0023】2.ハードウェア構成 図2に、図1に示すデータベース管理システム1を、C
PUを用いて実現したハードウェア構成の一例を示す。
データベース管理システム1は、CPU23、メモリ2
7、ハードディスク26、FDD25、モニタ32、キ
ーボード28,マウス31およびバスライン29を備え
ている。
【0024】CPU23は、ハードディスク26に記憶
されたプログラムにしたがいバスライン29を介して、
各部を制御する。このプログラムは、FDD25を介し
て、プログラムが記憶されたフレキシブルディスク25
aから読み出されてハードディスク26にインストール
されたものである。なお、フレキシブルディスク以外
に、CD−ROM、ICカード等のプログラムを実体的
に一体化したコンピュータ可読の記録媒体から、ハード
ディスクにインストールさせるようにしてもよい。さら
に、通信回線を用いてダウンロードするようにしてもよ
い。
【0025】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。
【0026】ハードディスク26には、制御プログラム
およびオペレーティングシステム(OS)を記憶する。
オペレーティングシステムとしては、例えば、(株)マ
イクロソフト社製のWindowsNT(商標)を採用
することができる。
【0027】ハードディスク26には、さらに、コンテ
ナボックス26cおよび検索用インデックスデータ26i
が記憶されている。コンテナボックス26cには、図3
に示すような各データに属性が付加されたXMLデータ
が、その属性の構造関係を崩さないまま複数記憶され
る。具体的に説明すると、図3Aに示すXMLデータ
は、各属性の構造関係は図4に示すようなツリー構造で
表される。かかるツリー構造をそのまま記憶するため
に、図5に示すように、各属性に関する実データがどの
領域に記憶されているかを示すポインタが記憶されてい
る。例えば、属性「名前」については、実データ「山田
一郎」の先頭アドレスを示すポインタP1が記憶されて
いる。また、本実施形態においては、各属性の構造関係
はツリー構造で表されているので、属性「所属」にさら
に、属性「部」が所属しており、その実データはポイン
タP5に記憶されており、さらに、この場合、ポインタ
P5で指し示される領域には属性「課」が記憶されてお
り、属性「課」の実データはポインタP6で指し示され
る領域に記憶されている。本実施形態においては、1の
XMLデータのデータ群をブロックデータと呼ぶ。コン
テナボックス26cには、かかるブロックデータが複数
記憶されている。
【0028】検索用インデックスデータ26iについ
て、図7を用いて説明する。検索用インデックスデータ
26iは、コンテナボックス26cに記憶された複数のブ
ロックデータを検索するためのインデックスデータであ
り、コンテナボックス26cに記憶された複数のブロッ
クデータの各属性のツリー構造を統合した統合ツリー構
造で記憶されている。さらに、統合ツリー構造のすべて
の属性について、当該属性についてデータを有するブロ
ックデータについて、実データのコンテナidと先頭アド
レス(インデックス情報)が属性毎にまとめて記憶され
ている。
【0029】統合ツリー構造について説明する。統合ツ
リー構造とは、全ブロックデータのツリー構造につい
て、OR演算を行ったことにより、全ブロックデータの
ツリー構造が統合されたツリー構造をいう。例えば、図
6に示すように、図6Aに示すツリー構造と、図6Bに
示すツリー構造と図6Cに示すツリー構造があった場
合、図6Dが統合ツリー構造となる。
【0030】かかる統合ツリー構造の各属性には、当該
属性にデータを有するブロックデータの実データのブロ
ックidおよび先頭アドレス(インデックス情報)が記憶
されている。例えば、統合ツリー構造は、属性「名前」
には、ブロックid=0のブロックデータにおける属性
「名前」の実データ「山田一郎」が格納されているブロ
ックidとコンテナボックスにおけるアドレス0001、
ブロックid=1のブロックデータにおける属性「名前」
の実データ「田中次郎」が格納されているブロックid=
1とコンテナボックスにおけるアドレス0021・・・
・というように、検索用のデータが記憶されている。か
かる検索用アドレスの用い方については後述する。
【0031】なお、統合ツリー構造であるので、あるブ
ロックデータについては、当該属性についてデータを有
しない場合もある。例えば、ブロックid=2のデータ
が、属性「所属」に属性「総務部」だけで、属性「課」
が存在しない場合には、属性「課」には、ブロックid=
2のデータは存在しないので、そのインデックスは記憶
されない。
【0032】このようにコンテナボックス26cに記憶
されたブロックデータは、各属性項目の構造はツリー構
造であり、各属性についてデータが存在するブロックデ
ータを検索するためのインデックスデータが属性毎にま
とめて記憶されている。
【0033】メモリ27には、各種の演算結果等が記憶
される。
【0034】キーボード28およびマウス31は各種の
データまたは命令を入力する入力手段である。モニタ3
2には検索結果等が表示される。
【0035】3.フローチャート (3.1)データ追加記憶処理について ハードディスク26へのデータ記憶処理について図8を
用いて説明する。データ追加は、コンテナボックス26
cに新たなブロックデータが追加されるとともに、検索
用インデックス26iにインデックスデータが追加され
る。ここでは、図4に示す統合ツリー構造が既に記憶さ
れている場合に、図9Aに示すXMLデータが与えられ
たものとする。CPU23は、与えられたXMLデータ
をその属性の構造を崩さないままコンテナボックス26
cに、記憶する(ステップS1)。これにより、ブロッ
クデータが1つ追加される。
【0036】CPU23は、かかるXMLデータから図
9Bに示すツリー構造を抽出する(ステップS3)。こ
れはXMLデータのタグの関係構造を抽出することによ
り実現できる。例えば、図9Aからタグ「社員」の下位
には、タグ「名前」「所属」、「役職」、「電話番号」
が位置しており、さらに、タグ「役職」の下位にはタグ
「部」が位置しており、さらにタグ「部」の下位にはタ
グ「課」が位置していることがわかる。これにより、図
9Bに示すように、各属性のツリー構造が抽出できる。
【0037】CPU23は、処理番号iを初期化し(ス
テップS5)、i番目の属性を注目属性とする(ステッ
プS7)。CPU23は注目属性について、既に統合ツ
リー構造に存在するか否か判断する(ステップS9)。
この場合、属性「名前」は既に、図7の統合ツリー構造
に存在するので、ステップS13に進み、当該属性に属
するデータ「鈴木太郎」の前記コンテナボックスにおけ
る先頭アドレスを、前記統合ツリー構造の属性「名前」
に当該ブロックidとともに、記憶する。
【0038】CPU23は検討していない注目属性が存
在するか否か判断し(ステップS15)、存在している
場合には、処理番号iをインクリメントし(ステップS
17)、ステップS7以下の処理を行う。この場合、残
りの属性「所属」、「部」、「課」、「役職」、「電話
番号」については、すべて既に存在するので、同様にし
て新しいアドレスデータのみ記憶し(ステップS1
3)、すべての項目について検討すると処理を終了す
る。
【0039】なお、属性が存在するか否かは、その上位
の属性が異なる場合には、既に存在しないと判断すれば
よい。すなわち、完全一致の場合に既に存在すると判断
すればよい。例えば、この場合、属性「課」は、属性
「部」の下部に位置するが、所属の下に属性「課」が存
在する場合には、異なる属性であると判断すればよい。
【0040】このようにして、新しいXMLデータは、
その属性の構造関係を崩すことなく、記憶され、さら
に、検索用インデックス26iに追加記憶される。
【0041】つぎに、既に存在する属性ではない属性が
与えられた場合について、具体例を用いて説明する。図
7に示す統合ツリー構造が既に記憶されている場合に、
図10に示すXMLデータが与えられると、CPU23
は、与えられたXMLデータをその属性の構造を崩さな
いままコンテナボックス26cに、記憶する(図8ステ
ップS1)。かかる処理は、存在するか否かに関わりな
く同じである。つぎに、CPU23は、かかるXMLデ
ータから図11に示すツリー構造を抽出する(ステップ
S3)。CPU23は、処理番号iを初期化し(ステッ
プS5)、i番目の属性を注目属性とする(ステップS
7)。CPU23は注目属性について、既に統合ツリー
構造に存在するか否か判断する(ステップS9)。この
場合、属性「名前」は既に、図4の統合ツリー構造に存
在するので、ステップS13に進み、当該属性に属する
データ「佐藤五郎」の前記コンテナボックスにおける先
頭アドレスを、前記統合ツリー構造の属性「名前」に当
該ブロックidとともに、記憶する。
【0042】CPU23は、属性「所属」、「部」、
「課」について、同様の処理を行う。つぎに属性「係」
については、図7に示す統合ツリー構造には存在しない
ので、図8ステップS9にて、対象の属性が存在しない
として、新しい属性として統合ツリー構造に追加する
(ステップS11)。
【0043】属性「電話番号(携帯)」についても同様
にして、統合ツリー構造に追加される。これにより、統
合ツリー構造は図12に示すように、属性「係」、「電
話番号(携帯)」が追加される。
【0044】(3.2)データ検索処理について データ検索処理について図13のフローチャートを用い
て説明する。検索命令が与えられると、CPU23は検
索用インデックス26iから統合ツリー構造の構造を取
得する(ステップS21)。ここでは、検索命令とし
て、営業部第1課に所属する社員の名前を抽出する検索
命令が与えられたものとして説明する。
【0045】CPU23は、前記統合ツリー構造を参照
にして、検索対象の属性は属性「所属」の下位の属性
「部」のさらに下位の属性「課」であると判断して、当
該属性「課」に記憶されているインデックスデータ(ブ
ロックidおよび先頭アドレス)を読み出す(ステップS
23)。図7に示す例であれば、「ブロックid=0,ア
ドレス0008」、「ブロックid=1,アドレス002
0」「ブロックid=3,アドレス0035」・・・が読
み出される。CPU23はかかるインデックスデータか
ら、コンテナボックス26cを検索して、実データを読
み出す(ステップS25)。
【0046】CPU23は、読み出された実データのう
ち、検索条件に合致するものを選択する(ステップS2
7)。選択されたデータからブロックidを特定して、コ
ンテナボックスから抽出すればよい。具体的には、検索
用インデックスデータの前記属性「名前」に記憶された
インデックスデータのブロックidと、前記特定されたブ
ロックidとが一致するブロックについての、先頭アドレ
スを取得して、コンテナボックスから抽出するようにす
ればよい。
【0047】このように、本実施形態においては、前記
各属性項目の構造を記憶しておき、CPU23は、各属
性項目の構造を参照にして記憶コンテナ部26cに記憶
されたデータを検索する。したがって、XMLデータに
ついてデータ構造を崩さないまま記憶した場合でも、高
速検索が可能となる。
【0048】また、統合ツリー構造を記憶しているの
で、ある属性の上位の属性までが検索条件として与えら
れなくても、検索が可能となる。
【0049】なお、検索命令として検索対象の属性とと
もに、その上位の属性が与えられた場合には、ステップ
S21の処理は不要である。
【0050】なお、データ削除する場合には、追加とは
逆の処理をすればよい。すなわち、コンテナボックスか
ら削除するとともに、検索用インデックスから該当する
データを削除すればよい。
【0051】また、既に記憶されているブロックデータ
について、新しい属性を追加する場合には、一旦該当す
るデータを破棄して、新たに、かかる属性を追加したX
MLデータを与えればよい。しかし、これ以外にも、既
に存在する属性およびその値については無視して、追加
すべき属性のみブロックデータおよび検索用インデック
スに追加するようにしてもよい。例えば、社員「山田一
郎」について、新たな属性である属性「携帯電話」を追
加する場合には、図14に示すXMLデータが与えられ
ると、CPU23は、コンテナボックスを検索して、同
じブロックが存在するか否か判断して、存在する場合に
は、異なる属性を抽出して、当該ブロックデータに追加
するとともに、検索用インデックスに属性「電話番号
(携帯)」を追加すればよい。
【0052】このように、本実施形態においては、デー
タベースのデータ形式を従来の検索に適した形であるレ
コード形式ではなく、XMLデータの構造をそのまま記
憶するとともに、各属性毎にデータの存在位置を示す検
索用インデックスを採用している。したがって、データ
形式の変更等が自由である柔軟なデータベース管理シス
テムを提供することができる。また、各項目の属性がツ
リー構造となっているデータ群のデータ管理に適したデ
ータベース管理システムを提供することができる。
【0053】なお、本実施形態においては、属性を構造
的に特定されたデータとしてXMLデータを用いた場合
について説明したが、属性を構造的に特定されたデータ
であればそのデータ形式に任意である。
【0054】なお、前記各プログラムのうち一部を、オ
ペレーティングシステム(OS)プログラムが実行する
ようにしてもよい。すなわち、プログラム単独で行って
も、オペレーティングシステムと分担して、実現するよ
うにしてもよい。
【0055】なお、本実施形態においては、図1に示す
機能を実現する為に、CPU23を用いソフトウェアに
よってこれを実現している。しかし、一部をハードウェ
アで実現してもよい。また、ハードウェアとソフトウェ
アの棲み分けについては任意の組み合わせが可能であ
る。
【図面の簡単な説明】
【図1】本発明にかかるデータベース管理システム1の
機能ブロック図である。
【図2】データベース管理システム1をCPUを用いて
構成したハードウェア構成の一例を示す図である。
【図3】入力されるXMLデータの一例を示す図であ
る。
【図4】図3のXMLデータにおける属性の構造(ツリ
ー構造)示す。
【図5】図3のXMLデータをブロックデータとして記
憶した場合の各データの関係を示す。
【図6】統合化ツリー構造を示す図である。
【図7】検索用インデックスデータのデータ構造であ
る。
【図8】データ記憶処理のフローチャートである。
【図9】追加入力されるXMLデータの一例を示す図で
ある。
【図10】追加入力されるXMLデータの一例を示す図
である。
【図11】図10のXMLデータの属性の構造を示す図
である。
【図12】追加後の検索用インデックスデータのデータ
構造である。
【図13】データ検索処理のフローチャートである。
【図14】追加入力されるXMLデータの一例を示す図
である。
【符号の説明】
1・・・データベース管理システム 23・・・・CPU 26・・・・ハードディスク 26i・・・・検索用インデックス 26c・・・・コンテナボックス
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B075 NK43 NK46 NR05 5B082 GA07 GC04

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】複数の属性項目についてデータが記憶され
    ており、かつ、各属性項目がツリー構造で構成されたX
    MLブロックデータを、コンピュータを用いて管理する
    データベース管理システムであって、 前記XMLブロックデータを当該構造を保持したまま、
    第1の記憶領域にXMLブロックデータごとに記憶する
    とともに、各XMLブロックデータの各属性項目に属す
    るデータの存在位置情報を各属性毎にまとめて記憶する
    検索用インデックスデータを、第2の記憶領域に記憶し
    ておき、 新たなXMLブロックデータが与えられると、以下の処
    理を行うこと、 A)前記XMLブロックデータを当該ツリー構造を保持し
    たまま、前記第1の記憶領域に追加記憶するとともに、 B)前記新たに与えられたXMLブロックデータの属性項
    目のうち、前記検索用インデックスデータの属性項目と
    一致する属性項目については、当該属性項目のデータの
    存在位置情報を前記第2の記憶領域に追加し、前記検索
    用インデックスデータの属性項目に存在しない属性項目
    については、新たな属性項目として前記第2の記憶領域
    に追加するとともに、当該属性項目のデータの存在位置
    情報を前記第2の記憶領域に追加する、 を特徴とするデータベース管理システム。
  2. 【請求項2】複数の属性項目についてデータが記憶され
    たデータ群であって、各属性項目が構造的に定められて
    いるデータ群を、当該構造を崩すことなく複数記憶する
    データ群記憶手段、 前記複数のデータ群の各属性項目に属するデータの存在
    位置情報を各属性毎にまとめて記憶する検索補助データ
    を記憶する補助データ記憶手段、 複数の属性項目についてデータが記憶されたデータ群が
    新たに与えられると、前記データ記憶手段に追加記憶す
    るとともに、前記新たに与えられたデータ群の属性項目
    のうち、前記検索補助データの属性項目と一致する属性
    項目については、当該属性項目のデータの存在位置情報
    を追加し、前記検索補助データの属性項目に存在しない
    属性項目については、新たな属性項目として追加すると
    ともに、当該属性項目のデータの存在位置情報を追加す
    る追加データ群処理手段、 を備えたデータベース管理システム。
  3. 【請求項3】請求項2のデータベース管理システムにお
    いて、 前記各属性項目の構造はツリー構造であること、 を特徴とするもの。
  4. 【請求項4】複数の属性項目についてデータが記憶され
    たデータ群であって、各属性項目が構造的に定められて
    いるデータ群を、当該構造を崩すことなく複数記憶する
    データ群記憶手段、 前記複数のデータ群の各属性項目に属するデータの存在
    位置情報を各属性毎にまとめて記憶する検索補助データ
    を記憶する補助データ記憶手段、 検索する属性項目を含む検索命令が与えられると、前記
    補助データ記憶手段に記憶された検索補助データを参照
    にして、データ記憶手段に記憶されたデータを検索する
    検索手段、 を備えたデータベース管理システム。
  5. 【請求項5】請求項4のデータベース管理システムにお
    いて、 前記補助データ記憶手段は、前記各属性項目の構造を記
    憶しており、 前記検索手段は、各属性項目の構造を参照にしてデータ
    記憶手段に記憶されたデータを検索すること、 を特徴とするもの。
  6. 【請求項6】A)複数の属性項目についてデータが記憶
    されたデータ群であって、各属性項目が構造的に定めら
    れているデータ群を、当該構造を崩すことなく複数記憶
    するデータ群記憶領域、 B)前記複数のデータ群の各属性項目に属するデータの
    存在位置情報を記憶する検索補助データを各属性毎にま
    とめて記憶する補助データ記憶領域、を有するデータ記
    録媒体。
  7. 【請求項7】コンピュータを用いてデータを検索するデ
    ータ検索方法であって、 複数の属性項目についてデータが記憶されたデータ群で
    あって、各属性項目が構造的に定められているデータ群
    を、当該構造を崩すことなく複数、第1の記憶領域に記
    憶しておき、 前記複数のデータ群の各属性項目に属するデータの存在
    位置情報を各属性毎にまとめて記憶する検索補助データ
    を第2の記憶領域に記憶しておき、 検索する属性項目を含む検索命令が与えられると、前記
    検索補助データを参照にして、前記第1の記憶領域に記
    憶されたデータ群を検索すること、 を特徴とするデータ検索方法。
  8. 【請求項8】コンピュータを用いたデータ管理方法であ
    って、 複数の属性項目についてデータが記憶されたデータ群で
    あって、各属性項目が構造的に定められているデータ群
    を、当該構造を崩すことなく複数第1の記憶領域に記憶
    しておき、 前記複数のデータ群の各属性項目に属するデータの存在
    位置情報を各属性毎にまとめて記憶する検索補助データ
    を第2の記憶領域に記憶しておき、 複数の属性項目についてデータが記憶されたデータ群が
    新たに与えられると、前記第1の記憶領域に追加記憶す
    るとともに、前記新たに与えられたデータ群の属性項目
    のうち、前記検索補助データの属性項目と一致する属性
    項目については、当該属性項目のデータの存在位置情報
    を追加し、前記検索補助データの属性項目に存在しない
    属性項目については、あたらな属性項目として追加する
    とともに、当該属性項目のデータの存在位置情報を前記
    第2の記憶領域に追加すること、 を特徴とするデータ管理方法。
  9. 【請求項9】あらかじめ第1の記憶領域に、複数の属性
    項目についてデータが記憶されたデータ群であって、各
    属性項目が構造的に定められているデータ群を、当該構
    造を崩すことなく複数記憶するとともに、第2の記憶領
    域に前記複数のデータ群の各属性項目に属するデータの
    存在位置情報を各属性毎にまとめて記憶する検索補助デ
    ータを記憶したコンピュータをデータベース管理装置と
    して実現するプログラムを記憶した記憶媒体であって、 検索する属性項目を含む検索命令が与えられると、前記
    検索補助データを参照にして、前記第1の記憶領域に記
    憶されたデータ群を検索する処理を前記コンピュータに
    実行させるためのプログラムを記憶した記憶媒体。
JP2000000867A 2000-01-06 2000-01-06 データベース管理システム Pending JP2001195406A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000000867A JP2001195406A (ja) 2000-01-06 2000-01-06 データベース管理システム
US09/750,856 US6701328B1 (en) 2000-01-06 2000-12-29 Database management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000000867A JP2001195406A (ja) 2000-01-06 2000-01-06 データベース管理システム

Publications (1)

Publication Number Publication Date
JP2001195406A true JP2001195406A (ja) 2001-07-19

Family

ID=18530151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000000867A Pending JP2001195406A (ja) 2000-01-06 2000-01-06 データベース管理システム

Country Status (2)

Country Link
US (1) US6701328B1 (ja)
JP (1) JP2001195406A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178084A (ja) * 2002-11-25 2004-06-24 Systems Engineering Constructions Co Ltd Xmlデータの格納方法及び格納装置、並びにプログラムおよびプログラムを記録した記録媒体
WO2005119516A1 (ja) 2004-06-03 2005-12-15 Turbo Data Laboratories Inc. 配列の生成方法、情報処理装置、及び、プログラム
JP2007265387A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2007265383A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2007265384A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2009015484A (ja) * 2007-07-03 2009-01-22 Hitachi Ltd 情報登録方法、プログラム、記録媒体および情報登録装置
US7627604B2 (en) 2004-03-16 2009-12-01 Turbo Data Laboratories, Inc. Method for handling tree-type data structure, information processing device, and program
US7937399B2 (en) 2005-01-25 2011-05-03 Turbo Data Laboratories, Inc. Method, information processing apparatus, and program of searching for, aggregating and sorting trees

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8429205B2 (en) * 1995-07-27 2013-04-23 Digimarc Corporation Associating data with media signals in media signal systems through auxiliary data steganographically embedded in the media signals
US20030005407A1 (en) * 2000-06-23 2003-01-02 Hines Kenneth J. System and method for coordination-centric design of software systems
US7099886B2 (en) * 2000-07-20 2006-08-29 Microsoft Corporation Method and apparatus for identifying programming object attributes
US20020163535A1 (en) * 2000-12-11 2002-11-07 Mitchell Kathryn L. System and method for generating a graphical user interface from a template
WO2015047251A1 (en) * 2013-09-25 2015-04-02 Hewlett-Packard Development Company, L.P. Flexible data format for database management systems

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02297284A (ja) * 1989-03-22 1990-12-07 Hitachi Ltd 文書処理システム
JPH0484271A (ja) * 1990-07-26 1992-03-17 Nippon Telegr & Teleph Corp <Ntt> 文書内情報検索装置
JPH0628403A (ja) * 1992-07-09 1994-02-04 Mitsubishi Electric Corp 文書検索装置
JPH10240752A (ja) * 1997-02-26 1998-09-11 Hitachi Ltd 構造化文書の登録方法,検索方法、およびそれに用いられる可搬型媒体

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4574346A (en) * 1982-09-29 1986-03-04 International Business Machines Corporation Method and apparatus for peripheral data handling hierarchies
US4839799A (en) * 1985-07-29 1989-06-13 Hitachi, Ltd. Buffer control method for quickly determining whether a required data block is in the buffer
US5018060A (en) * 1989-01-26 1991-05-21 Ibm Corporation Allocating data storage space of peripheral data storage devices using implied allocation based on user parameters
US5991876A (en) * 1996-04-01 1999-11-23 Copyright Clearance Center, Inc. Electronic rights management and authorization system
US6263332B1 (en) * 1998-08-14 2001-07-17 Vignette Corporation System and method for query processing of structured documents
JP3980768B2 (ja) * 1998-09-02 2007-09-26 株式会社日立製作所 分散処理システム及びその協調方法
US6366934B1 (en) * 1998-10-08 2002-04-02 International Business Machines Corporation Method and apparatus for querying structured documents using a database extender
US6754648B1 (en) * 1999-09-30 2004-06-22 Software Ag Method for storing and managing data
US20020116371A1 (en) * 1999-12-06 2002-08-22 David Dodds System and method for the storage, indexing and retrieval of XML documents using relation databases
JP3871949B2 (ja) * 2002-03-27 2007-01-24 株式会社東芝 マスクデータ作成装置及びマスクデータ作成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02297284A (ja) * 1989-03-22 1990-12-07 Hitachi Ltd 文書処理システム
JPH0484271A (ja) * 1990-07-26 1992-03-17 Nippon Telegr & Teleph Corp <Ntt> 文書内情報検索装置
JPH0628403A (ja) * 1992-07-09 1994-02-04 Mitsubishi Electric Corp 文書検索装置
JPH10240752A (ja) * 1997-02-26 1998-09-11 Hitachi Ltd 構造化文書の登録方法,検索方法、およびそれに用いられる可搬型媒体

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178084A (ja) * 2002-11-25 2004-06-24 Systems Engineering Constructions Co Ltd Xmlデータの格納方法及び格納装置、並びにプログラムおよびプログラムを記録した記録媒体
US7627604B2 (en) 2004-03-16 2009-12-01 Turbo Data Laboratories, Inc. Method for handling tree-type data structure, information processing device, and program
WO2005119516A1 (ja) 2004-06-03 2005-12-15 Turbo Data Laboratories Inc. 配列の生成方法、情報処理装置、及び、プログラム
US7962494B2 (en) 2004-06-03 2011-06-14 Turbo Data Laboratories, Inc. Method, information processing apparatus, and program for generating array
US7937399B2 (en) 2005-01-25 2011-05-03 Turbo Data Laboratories, Inc. Method, information processing apparatus, and program of searching for, aggregating and sorting trees
JP2007265387A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2007265383A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2007265384A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2009015484A (ja) * 2007-07-03 2009-01-22 Hitachi Ltd 情報登録方法、プログラム、記録媒体および情報登録装置

Also Published As

Publication number Publication date
US6701328B1 (en) 2004-03-02

Similar Documents

Publication Publication Date Title
US8886617B2 (en) Query-based searching using a virtual table
US7542968B2 (en) Attribute data management system
US6804680B2 (en) Extensible database
US20020116402A1 (en) Information component based data storage and management
US9477729B2 (en) Domain based keyword search
CN109902130A (zh) 一种数据存储方法、数据查询方法和装置、存储介质
JPH0765035A (ja) 構造化文書検索装置
EP1315103B1 (en) File search method and apparatus, and index file creation method and device
EP1808780B1 (en) Determination of database statistics using application logic
JP2001195406A (ja) データベース管理システム
JP2925042B2 (ja) 情報リンク生成方法
WO2011099082A1 (ja) データベース管理システム
JP2004126770A (ja) 構造化文書検索方法、構造化文書検索システム及び構造化文書データベース管理装置
JP4825504B2 (ja) データ登録・検索システムおよびデータ登録・検索方法
JP4521413B2 (ja) データベース管理システム及びプログラム
JP6627809B2 (ja) データベース処理装置、システム、方法およびプログラム
JP4461151B2 (ja) 構造化文書管理システム及びプログラム
JP3980326B2 (ja) データ管理方法およびコンピュータ読み取り可能な記録媒体
JP4228267B2 (ja) 集合属性検索システム、集合属性検索方法および集合属性検索プログラム
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
KR20050041898A (ko) 데이터 백업 시스템 및 방법과 그 기록 매체
JP2000207402A (ja) 情報検索システム,情報検索方法および情報検索用プログラム記録媒体
JPH09305619A (ja) 階層インデックス検索装置、及び文書検索方法
JPH02278439A (ja) 追記型デバイスのデータ管理方式
JP2003323448A (ja) データベース検索装置および検索方法