JPH1115711A - データ管理装置 - Google Patents

データ管理装置

Info

Publication number
JPH1115711A
JPH1115711A JP9169941A JP16994197A JPH1115711A JP H1115711 A JPH1115711 A JP H1115711A JP 9169941 A JP9169941 A JP 9169941A JP 16994197 A JP16994197 A JP 16994197A JP H1115711 A JPH1115711 A JP H1115711A
Authority
JP
Japan
Prior art keywords
data
attribute
attributes
dependency
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9169941A
Other languages
English (en)
Inventor
Yoshinori Sato
嘉則 佐藤
Katsumi Omori
勝美 大森
Toyohisa Morita
豊久 森田
Akira Maeda
章 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9169941A priority Critical patent/JPH1115711A/ja
Publication of JPH1115711A publication Critical patent/JPH1115711A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】蓄積された属性情報から典型的なデータアクセ
スパターンを抽出し、データベース管理で利用者が用い
るための情報を提供することを課題とする。 【解決手段】クライアント装置101からデータベース
サーバ装置102に格納されたデータへの参照が発生す
ると、クライアント装置101から発行された参照命令
はデータベースサーバ装置102と、データ管理装置4
00の両方に渡す。データベース装置102は受け取っ
た命令を処理し、結果をクライアント装置101へ返
す。データ管理装置400が受け取った命令は、まずS
QL解析装置によって命令中の属性参照情報が抽出さ
れ、次に抽出された情報が属性参照情報蓄積装置109
に格納される。利用者が着目したい1個以上の属性、依
存関係の強さの最小値等のパラメータを入力装置107
により指定すると、属性依存関係解析装置106によ
り、パラメータを満たす属性間の依存関係が抽出され
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベースシス
テムののアクセス記録を用いて、データ定義構造を作成
するための有益な情報を利用者に提供方法と、データ定
義構造を自動的に再編成する方法に係わり、データベー
スシステム管理の自動化、データベースへのアクセス効
率向上に関する。
【0002】
【従来の技術】近年の計算機技術の発達、LAN、WA
N等ネットワークインフラストラクチャの整備に従い、
これまで以上に大量、多種のデータを蓄積、利用する動
きが活発化しており、単にデータを蓄積して定型的な業
務に利用するだけでなく、分析業務などの非定型な業務
にデータベースを利用するケースが現れてきた。
【0003】従来はDB(DataBase)システムに備わ
った検索機能を利用して、データの集計、加工を行って
きた。現在はDBシステムはRDB(Relational Da
tabase)を用いたものが最も普及しており、RDBでは
SQLと呼ばれる言語をベースに機能が提供される。S
QLにより、複数の表形式のデータに対する演算操作と
して各種集計機能が提供される。RDB,SQLに関し
ては「データベースシステム概論、C.J.Date著、
藤原譲訳、丸善株式会社」に詳しい。以下RDBを従来
技術1と呼ぶ。
【0004】また、現在、非定型業務に関わるデータ利
用形態として、データウェアハウス(Data Warehous
e)と呼ばれるデータ利用システムが着目されている。
データウェアハウスとは、情報検索、意志決定支援など
ユーザのニーズに合わせて作られるデータベースのこと
である。複数のサーバ上に目的別に重複を許されたデー
タ群があり、原則として更新は夜間等に定期的行われる
だけで、逐次的な更新処理はされず、データの元は基幹
系システム上のデータベースから抜き出されたデータ群
(スナップショット)である。現在データウェアハウ関
連製品は多数発売されている。以下、データウェアハウ
ス構築、支援技術を従来技術2と呼ぶ。データウェアハ
ウスの記述に関しては、「初めてのデータウェアハウス
構築、W.H.Inmon著、藤本康英、小畑喜一監訳、オ
ーム社」に詳しい。
【0005】
【発明が解決しようとする課題】分析業務などの非定型
業務にデータベースを活用する場合、高いレスポンス性
能が要求されるため、ユーザ数の増加、データの更新、
データの使われ方の変化に従って、データの蓄積構造を
変えていく必要があり、システム全体のメインテナンス
は不可欠である。
【0006】従来技術1は、データをテーブルとして定
義して管理する機能と、テーブルを検索するための機能
を提供する。またデータを効率的に蓄積するため、実際
にはデータが重複しないようにテーブルを分割して蓄積
し、ユーザがデータを参照する際に、分割したテーブル
を仮想的な1個のテーブルへ結合し、出力する機能が利
用される。しかし大規模なデータベースの場合、アクセ
スの度に複数テーブルへの結合が発生すると、結果が得
られるまでのレスポンスタイムが低下するため、現実に
は非定型業務での運用が難しくなる。そこで、アクセス
頻度が高いデータに関しては重複を許して蓄積するか、
元データのコピーである、スナップショットを持ったデ
ータベースを別途構築しておく。
【0007】ところが、顧客購買パターン分析などの非
定型業務の場合、設計時に予めアクセスパターンを全て
予測することは困難であり、またユーザ数の増加、使い
方の変化が生じると、テーブル構造を変更したり、スナ
ップショットを追加する必要が出てくる。従来技術1に
は、蓄積されているデータの蓄積構造自体を自動で更新
する機能はない。またデータベースサーバが受け付けた
要求をログとして保存する機能はあるが、ログを分析
し、データ構造を変更するための情報を抽出する作業は
データベース管理者の手作業によるしかなく、従ってデ
ータベースのレスポンス低下を防ぐための管理負荷が増
大する。また、データベースが大規模化すると、手作業
のみでは適切なデータ構造を決定することが困難になる
ため、エンドユーザに対してレスポンス性能を保証する
ことが難しくなる。
【0008】従来技術2は、スナップショットや、複数
のデータベースシステムを一括管理するためのデータ管
理ツールを提供する。しかしシステムの運用自体はシス
テム管理者の手作業により行われ、データ構造の変更を
自動化する手段を提供できないため、管理負荷の増加を
招く。また大規模データベースのデータ構造を適切に決
定することは困難である。
【0009】
【課題を解決するための手段】本発明の望ましい第1の
実施形態においては、互いに依存関係を持つ1個以上の
属性からなる属性組をデータ参照命令から抽出する手段
と、前記抽出された属性組を蓄積する手段と、着目する
1個以上の属性を利用者が入力する手段と、上記蓄積し
たデータから、上記入力された属性を含む属性間の依存
関係の強さを算出する手段と、前記算出した依存関係の
強さを出力する手段を有する。
【0010】第1の実施形態では、同時に用いられた属
性情報を蓄積、分析し、依存関係を抽出し、出力するこ
とが可能なため、どの様なテーブルを新たに作る際に必
要となる情報を利用者に提供することができる。
【0011】本発明の望ましい第2の実施形態において
は、互いに依存関係を持つ1個以上の属性からなる属性
組をSQL文から抽出する手段と、前記抽出された属性
組を蓄積する手段と、着目する1個以上の属性を利用者
が入力する手段と、上記蓄積したデータから、上記入力
された属性を含む属性間の依存関係の強さを算出する手
段と、前記算出した依存関係の強さを用いて新たなテー
ブルを定義するSQL文を発行する手段を有する。
【0012】第2の実施形態では、算出された属性間の
依存関係を用いて自動的に新しいテーブルを作成するこ
とができる。
【0013】
【発明の実施の形態】以下、図面を用いて本発明の第1
の実施形態を説明する。図1はデータ管理装置100の
構成とデータの流れを示している。図1において、10
1、103はクライアント装置、102はデータベース
サーバ装置、104はデータ管理装置、105はSQL
解析装置、106は属性依存関係解析装置、107は入
力装置、108は解析結果出力装置、109は属性参照
情報蓄積装置であり、装置105、106、107、1
08、109はデータ管理装置104に内包されてい
る。また110は各装置を接続するネットワークであ
る。
【0014】またデータ管理装置が必要とする手段は、
クライアント装置、サーバ装置に分散して構築されてい
ても構わない。図2はクライアント装置とサーバ装置に
それぞれ実装したデータ管理装置200の構成を示して
いる。図2において、211はサーバ装置、201、2
02はクライアント装置、203、204はクライアン
ト装置に構築されたSQL解析装置、205はデータ管
理装置、206属性参照情報蓄積装置、207は属性依
存関係解析装置、208は入力装置、209は解析結果
出力装置である。装置206、207、208、209
はデータ管理装置205に内包されている。210は各
装置を接続するネットワークである。
【0015】図3はデータベースサーバ装置に各手段が
構築されているデータ管理装置300を示している。図
3において、301、302はクライアント装置、30
3はデータベースサーバ装置、304はデータ管理装
置、305はSQL解析装置、306は属性依存関係解
析装置、307は入力装置、308は属性参照情報蓄積
装置、309は解析結果出力装置である。装置305、
306、307、308、309、309はデータ管理
装置304に内包されている。310は各装置を接続す
るネットワークである。
【0016】各装置が提供する機能、装置間のデータの
流れは原理的に、装置100、200、300に共通で
あるため、便宜上、本実施形態では図1を説明に用い
る。以下、図1に従って本実施形態の概要を説明する。
【0017】クライアント装置101からデータベース
サーバ装置102に格納されたデータへの参照が発生す
ると、クライアント装置101から発行された参照命令
はデータベースサーバ装置102と、データ管理装置1
04の両方に渡される。データベース装置102は受け
取った命令を処理し、結果をクライアント装置101へ
返す。データ管理装置104が受け取った命令は、まず
SQL解析装置105によって命令中の属性参照情報が
抽出され、次に抽出された情報が属性参照情報蓄積装置
109に格納される。データが蓄積された時点で、利用
者が着目したい1個以上の属性、依存関係の強さの最小
値等のパラメータを入力装置107により指定すると、
属性依存関係解析装置106により、パラメータを満た
す属性間の依存関係が抽出される。
【0018】図4はデータ管理装置104と接続された
データ表示装置400を示している。
【0019】図400において、401はデータ管理装
置であり、図1中の装置104と同じものである。40
2はデータ表示装置、403はしきい値入力装置、40
4は解析結果表示装置、405は解析結果表示制御装
置、406は出力合成装置、407はメタデータ表示装
置、408はデータベースサーバ装置であり、図1中の
装置102と同じものである。なお、ここで言うメタデ
ータとは、データベースサーバ装置内の、データ構造の
定義情報を意味する。
【0020】図6はデータベース装置102に蓄積され
ているデータ600を示している。図6において、60
1は部品名と、部品の値段、供給元の関係を示すテーブ
ル、602は供給元の所在地を表すテーブルを示してい
る。603は部品名と供給元の関係を表すテーブルを示
しているが、テーブル603の実体はデータベースサー
バ装置102にはなく、テーブル602とテーブル60
3から仮想的に作ったものがユーザに提供される。ここ
では、テーブル601、602の様に実体があるものを
ベーステーブル、テーブル603のような仮想的なテー
ブルをビューと呼ぶ。通常、ユーザからはベーステーブ
ルとビューの違いを意識する必要はなく、クライアント
装置からは等価に見える仕組みになっている。
【0021】以下の説明では、単にテーブルとした場
合、ベーステーブルもしくはビューのどちらかを指すこ
ととする。
【0022】図7はクライアント装置101からデータ
ベースサーバ装置102に渡される1回分の命令700
を示している。700は、データ600にあるテーブル
601、602を参照し、供給元が東京にある部品の名
前を検索するための命令である。
【0023】図8はクライアント装置101からデータ
ベースサーバ装置102に渡される命令800を示して
いる。命令800は命令700と同様の意味を持つが、
参照するのはビュー603である点が異なる。以下の説
明では、601、602、603をそれぞれテーブル
S、P、SPと呼ぶ。
【0024】図15はSQL解析装置105がクライア
ント装置101からの命令を解析した結果であるデータ
1500を示しており、属性参照情報蓄積装置109に
蓄積されている。501は解析を行った際、属性参照情
報蓄積装置109が命令に割り振った識別子、502は
解析した命令が含んでいた属性名称を示している。属性
名称は、テーブル名と属性名の組からなり、例えばS.
CITYはテーブルSにある属性CITYを意味する。
データ1500は過去同時に参照された属性の組を表し
ており、例えば同じ識別子を持つS.CITYとP.P
ARTが一回の命令で同時に参照されたことを意味す
る。
【0025】図9は属性依存関係解析装置106の解析
結果である、データ900を表している。ここで1個以
上の属性組Xに着目したとき、同時に1個以上の属性組
Yが参照されるという属性間の依存関係はルールX→Y
で表され、Xを条件部、Yを結論部と呼ぶことにする。
データ900の各行は1個のルールであり、901は条
件部、902は結論部、903は条件部と結論部の依存
関係の強さを示している。
【0026】図11はデータ表示装置400の出力11
00を示している。出力1100は、データ900中の
ルールと、データベースサーバ装置102に格納されて
いるテーブル定義情報との関連性を表している。110
1はテーブルPの定義情報で、属性P.P#、P.PA
RT、P.COST、P.SUPPLIERが一つのベ
ーステーブルとして定義されていることを意味する。1
102はテーブルSの定義情報であり、属性S.S#、
S.SUPPLIER、S.CITYが一つのベーステ
ーブルとして定義されていることを意味する。110
3、1104はそれぞれデータ900にあるルールを表
している。1103、1104のそれぞれの左側は条件
部、右側は結論部である。上下段を結ぶ矢印は、ルール
に現れる各属性がどのベーステーブル中の属性を参照し
ているかを表している。
【0027】図13はデータ900中のルールがビュー
を参照している場合の、データ表示装置400の出力1
300を示している。出力1300は、データ900と
して格納されている属性間の依存関係と、データベース
サーバ装置102に格納されているテーブル、及びビュ
ー定義情報との関連性を表している。1301、130
2はベーステーブルの定義情報であり、出力1100中
の1101、1102と同じものである。1303はビ
ューの定義情報、1304、1305はデータ900に
あるルールを表している。例えば、1305はSP.P
ART→SP.CITYの関係なり、SP.PARTと
SP.CITYは1個のビュー、1303を参照してい
るが、ビュー1303の実体はベーステーブル130
1、1302のデータを抜き出し、統合したものである
ことが分かる。
【0028】出力1100、1300により、参照頻度
が高く、その際に同時に参照されるような複数の属性が
別々のベーステーブルにあることが分かる。そのため、
データベースのレスポンスを向上させたい場合、どの属
性を抜き出して新たなベーステーブルを作成すれば良い
のかを、データベース管理者は容易に知ることができ
る。
【0029】このように、データ管理装置104に、S
QL解析装置105、属性依存関係解析装置106、属
性参照情報蓄積装置109を設けることにより、ベース
テーブル、ビューへの参照パターン調べ、データベース
管理に必要な情報を利用者へ提供する点に本実施形態の
特徴がある。
【0030】以下図16に従い、本実施形態の処理の詳
細を説明する。
【0031】図16は属性の参照情報を蓄積する処理の
流れを示したものである。処理1601で、クライアン
ト装置からデータベースサーバ装置へ渡されたデータ参
照命令と同じものが、データ管理装置に渡される。また
データ参照命令はSQLで記述されている。
【0032】処理1602によりデータ参照命令中のS
ELECT節から、属性情報を抽出する。なお、ここで
言う属性情報とは、テーブル名、属性名から一意に定ま
る属性の名称である。SELECT節にはどのテーブル
中の、どの属性を結果として受け取るかが「SELEC
T テーブル名.属性名」という形式で記述される。ま
たテーブル名が明らかなときは単に「SELECT 属
性名」という形式で記述される。
【0033】処理1603ではデータ参照命令中のFR
OM節からテーブル名を抽出する。
【0034】FROM節にはどのテーブルを用いて検索
を行うかが、「FROM テーブル名」という形式で記
述される。
【0035】処理1604ではWHERE節から属性情
報を抽出するための条件判定を行う。
【0036】通常WHERE節には検索条件が記述さ
れ、テーブル名、属性名のどちらも含まれうるが、また
WHERE節がSELECT〜FROM〜WHERE等
の一連の命令を含む、入れ子構造も許されているので、
処理1604では入れ子構造の判定を行う。
【0037】処理1604で入れ子構造が検出された場
合、内側のブロックに含まれる命令の解析をするため処
理1602に戻る。処理1605で入れ子構造が検出さ
れない場合、処理1605で属性情報の抽出を行う。
【0038】なお、SQLはこの他のコマンドを扱うこ
とが可能だが、説明の便宜上、本実施形態ではSELE
CT、WHERE、FROM節をのみを解析対象とす
る。
【0039】処理1606では抽出した属性名称と、S
ELECT、FROM、WHERE節の位置関係から、
属性の指定でテーブル名が省略されている場合に、テー
ブル名と属性名を対応づけ、さらに重複する属性を削除
する。
【0040】処理1607ではデータ1500の形式で
蓄積する。
【0041】データベースシステムの運用を続けると、
処理1600によりデータ管理装置104内に属性参照
に関する情報が蓄積されていく。利用者は任意の時点
で、蓄積された属性参照情報の解析を行うことができ
る。また蓄積データ量に応じて属性依存関係の解析処理
を自動的に起動することもできる。
【0042】図17は処理1600で蓄積されたデータ
から、属性間の依存関係が強いものをルールとして抽出
する、解析処理1700を示している。依存関係の強さ
は、条件部が、クライアントから発行されるデータベー
ス参照命令1回あたりに出現する確率と、条件部の条件
付きで結論部が出現する確率の関数で評価されるものと
する。ここでは説明の便宜上、前者の確率をカバー率、
後者をヒット率と呼ぶ。
【0043】処理1701では、解析処理で利用者が着
目する1個以上の属性が入力される。
【0044】着目する属性は利用者が与えても良いし、
例えば出現頻度が大きい属性組を自動的に与えても良
い。
【0045】処理1702では、抽出される依存関係が
必ず満たすべき条件として、カバー率の最小値が入力さ
れる。また必要ならば、条件部が含みうる属性数の最大
値を指定する。
【0046】処理1703から処理1710のループで
実際の依存関係の探索処理が行われる。まずどの様な属
性が存在するかを調べ、次にその属性の組合せについて
調べる。終了条件は、最小カバー率を満たす条件部の候
補が無くなった場合か、条件部が含む属性数が最大値を
超えた場合である。
【0047】まず、処理1703では前回の探索で、指
定された条件を満たす属性組があったかを判定する。残
っている場合は処理1704に、そうでない場合には処
理1710に移る。処理1702から移ってきた最初の
判定では、無条件で次の処理1704に移る。
【0048】処理1704では、前回の探索結果を元に
次の条件部の候補を作成する。なお、処理1701で指
定された属性が、条件部になるのか、結論部になるのか
により条件部の候補の作り方は異なる。条件部を指定し
た場合は、指定された属性を含む全ての属性組が条件部
の候補となり、このとき結論部となるべき1個の属性の
候補も同時に探索される。
【0049】例えば着目する条件部として{A}が指定
されていて、探索の結果{B},{C},{D}という
3つの属性が最小カバー率を満たしているものとする。
またヒット率の大きさを考慮して、この{A}→B、
{A}→Cを依存関係として採択したとする。このと
き、{A,B}→D,{A,C}→Dが次の探索の候補
となる。
【0050】結論部が指定された場合は、結論部は固定
して、これにつながる条件部を探索する。
【0051】例えば結論部として{A}が指定されてい
て、探索の結果{B},{C},{D}が最小カバー率
を満たしていたものとする。このときは、{B,C},
{C,D},{B,D}が次の条件部の候補となる。
【0052】処理1705では探索候補のカバー率を見
て、実際に探索すべきかどうかを決定する。今、ルール
X→Yが見つかっていて、Xの生起確率(カバー率)P
(X)、Yの生起確率P(Y)、XとYの同時生起確率
P(X&Y)が与えられているものとする。このとき、
Xに新たな属性を1個加えた、条件部の条件部の候補
X’のカバー率の最大値は、P(X&Y)/P(Y)で
算出することができる。P(Y)は蓄積データから、簡
単に見つけることができ、またP(X&Y)はヒット率
を算出するため、前回の探索で常に探索されるので、こ
れを利用することができる。また条件部カバー率は、組
合わせる属性の数が多くなるほど単調に減少する。従っ
て、もし、ある条件部の候補のカバー率の最大値が、予
め指定されている最小カバー率よりも小さければ、この
候補の探索を省略することができる。 処理1706で
は探索を行い、探索候補のカバー率、ヒット率を算出す
る。
【0053】処理1707では探索した結果を元に評価
し、ルールとして出力するべきかどうかを決定する。例
えば、カバー率は最小カバー率以上あり、かつルールX
→Yのヒット率P(Y|X)が、Y単独の生起確率P
(Y)以上である場合は、有益な情報を含む属性の関係
であると見なす。
【0054】処理1708では算出されたルールを蓄積
する。
【0055】処理1709では、条件部が含む属性の数
が、利用者の指定した最大値に達したかどうかを判定
し、達していないならば処理1703に移る。ただし何
も指定されていない場合は、無条件で処理1703に移
る。それ以外の場合は探索を終了する。
【0056】次に、表示装置400の処理の詳細を図1
8に従って説明する。
【0057】図18はルールを表示する処理1800を
示している。処理1801で利用者が表示したいルール
の条件を入力する。ここではルール評価値の最低値、ル
ールの重複削除処理を制御するパラメータ、及び表示す
るルールの最大数が入力される。処理1802では処理
1700で抽出、蓄積しておいたルールを読み込む。処
理1803では重複するルールを省略する。処理の例と
しては、結論部が同じルール群の条件部に含まれている
属性組の包含関係を調べ、あるルールの条件部中の属性
組Xと、別のルールの属性組X’が、X⊂X’の関係に
あるとき、ルールの評価値が低い方を省略するといった
方法がある。ただし、ルール評価値の最低値が評価値が
低くなっても良いから、できるだけ多くの属性を条件組
に含むルールが欲しい場合は、処理1801の重複削除
処理制御パラメータの入力で指定しておく。処理180
4ではデータベースサーバ装置102からテーブル定義
情報を表す、メタデータを読み込む。処理1805では
メタデータのテーブル定義情報と、重複省略処理後のル
ール群を関連付けて、出力1100、1300の形式で
表示する。
【0058】このように、頻繁に使われる属性組と、デ
ータベースサーバ中に定義されているテーブルの関係を
用いて、新たなテーブルを作成する上で有用な情報を利
用者に提示できる点に本実施例の特徴がある。
【0059】次に、本発明の第2の実施形態を説明す
る。図5は本実施形態で説明する、データ管理装置50
0の構成とデータの流れを示している。501はデータ
管理装置、502はテーブル作成装置、503はパラメ
ータ入力装置、504はテーブル作成制御装置、505
はテーブル間依存関係解析装置、507はデータベース
サーバ装置である。装置501は図1中のデータ管理装
置104と、装置507はデータベースサーバ装置10
2と同じものである。
【0060】図10はデータ管理装置500の出力の結
果、データベースサーバ装置507に新たに作成された
テーブルを示している。
【0061】以下、図5に従って本実施形態の概要を説
明する。パラメータ入力装置503から、新規テーブル
を作成するための基準値を利用者が入力する。テーブル
作成制御装置504は、装置503で入力された値を用
いてテーブル間依存関係解析装置506を制御する。ま
た、テーブル間依存関係解析装置506には、データ管
理装置501から属性間の依存関係を表すルールが、デ
ータベースサーバ装置507からメタデータが渡され
る。テーブル間依存関係解析装置506は、現在あるテ
ーブルに対して、過去どの様なパターンでアクセスされ
ていたかを解析し、結果をテーブル定義変更装置502
に渡す。テーブル定義変更装置502はテーブル定義を
変更するためのSQL命令をデータベースサーバ装置5
07に対して発行する。
【0062】データ管理装置501とデータベースサー
バ装置507から与えられるメタデータとルールから、
図11に示すような関係が得られる場合の、装置500
の実行結果を図12に示す。図11は、別々のベーステ
ーブルにある属性P.PARTとP.CITYが同時に
参照されることが多い、というアクセスパターンを表し
ている。装置500はアクセスパターンから、P.PA
RTとS.CITYを持つベーステーブルを作成するた
めの命令をデータベースサーバ装置507へ発行する。
図12中、1201、1202は既存のベーステーブル
定義、1203、1204は同時に参照されることが多
い属性組を表すルール、矢印はルールが含む属性がどの
ベーステーブルにあるのかを示すリンク情報、1205
は新しく作られたベーステーブルである。
【0063】データ管理装置501とデータベースサー
バ装置507からえられるメタデータとルールから、図
13に示すような関係が得られる場合の、装置500の
実行結果を図14に示す。図13はビューに関する定義
を含んでおり、この場合は新しいテーブルが作成される
だけでなくビューの定義が変更される。1401、14
02は既存のベーステーブル定義、1403は変更され
たビュー定義、1404、1405は同時に参照される
ことが多い属性組を表すルール、矢印はルールビュー、
ベーステーブルに含まれる属性間の関係を示すリンク情
報、1406は新しく作られたベーステーブルである。
図13では、ビュー1303は二つのベーステーブルを
参照していたが、装置500の実行結果、ビュー140
4は新たに作られた一つのテーブルを参照するように変
更されている。
【0064】以下図19に従って、本実施形態の処理の
詳細を説明する。
【0065】処理1901では装置503より、ルール
評価値の最低値が、テーブル定義変更のしきい値、ルー
ル重複削除処理の方法の指定が入力される。処理190
2では装置501よりルールが入力される。処理190
3では、入力されたしきい値以上の評価値を持つルール
を対象として、重複するルールの削除処理が行われる。
【0066】この削除処理は、処理1800中の180
3と同様である。処理処理1904では装置507より
メタデータが入力される。処理1905ではルールとメ
タデータに含まれる属性を調べ、図11、13に示す関
係を算出する。処理1906では、処理1905で算出
した結果から、追加定義すべきテーブルを決定し、その
ための命令をデータベース装置507に発行する。ただ
し、作成に用いたルールが既存のビュー定義に関係があ
る場合、処理1908においてこのビュー定義を変更す
る命令をサーバ装置に発行する。
【0067】このように、頻繁に使われる属性組と、デ
ータベースサーバ中に定義されているテーブルの関係を
用いて、利用者のデータへのアクセスパターンに適した
テーブル定義を自動生成する点に本実施形態の特徴があ
る。
【0068】
【発明の効果】以上、本発明ではデータ参照命令解析装
置、属性参照情報蓄積装置、属性依存関係解析装置を設
けることにより、データ参照パターンを調べ、データベ
ース管理に必要な情報を利用者へ提供すると共に、エン
ドユーザのアクセスパターンに適したデータ構造を自動
生成する。これによりシステム管理者の負荷を低減、ア
クセススピードの向上を図ることができる。
【図面の簡単な説明】
【図1】データ管理装置の全体構成である。
【図2】データ管理装置の全体構成である。
【図3】データ管理装置の全体構成である。
【図4】データ表示装置の構成である。
【図5】テーブル作成装置の構成である。
【図6】データベースサーバ装置に蓄積されているデー
タである。
【図7】クライアント装置から発行されるデータ参照命
令である。
【図8】クライアント装置から発行されるデータ参照命
令である。
【図9】データ管理装置によるデータ参照パターン解析
結果である。
【図10】テーブル作成装置により定義されたデータで
ある。
【図11】データ表示装置の出力である。
【図12】データ表示装置の出力である。
【図13】データ表示装置の出力である。
【図14】データ表示装置の出力である。
【図15】データ管理装置により蓄積されるデータ参照
ログである。
【図16】データ参照パターン蓄積処理である。
【図17】蓄積されたデータ参照パターンの解析処理で
ある。
【図18】データ表示装置の表示処理である。
【図19】テーブル作成装置のテーブル定義処理であ
る。
フロントページの続き (72)発明者 前田 章 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】データ参照命令を発行する1個以上のクラ
    イアント装置と、参照命令を解釈し実行する1個以上の
    データベースサーバ装置からなり、前記クライアント装
    置と前記サーバ装置がネットワークで接続されているデ
    ータベースシステムにおいて、互いに依存関係を持つ1
    個以上の属性からなる属性組を参照命令から抽出する手
    段と、前記抽出された属性組をネットワークに接続され
    たデータベース管理装置に蓄積する手段と、着目する1
    個以上の属性を利用者が入力する手段と、上記蓄積した
    データから、上記入力された属性を含む属性間の依存関
    係の強さを算出する手段と、前記算出した依存関係の強
    さをに対して出力する手段からなることを特徴とするデ
    ータ管理装置。
  2. 【請求項2】請求項1に記載のデータ管理装置におい
    て、互いに依存関係を持つ1個以上の属性からなる属性
    組をデータ参照命令から抽出する手段と、前記抽出され
    た属性組を蓄積する手段と、着目する1個以上の属性を
    利用者が入力する手段と、上記蓄積したデータから、上
    記入力された属性を含む属性間の依存関係の強さを算出
    する手段と、前記算出した依存関係の強さを出力する手
    段は、ネットワークに接続されたデータベース管理装置
    に構築されていて、前記データベース管理装置は上記ク
    ライアント装置と上記サーバ装置の間の通信内容を中継
    する手段を備えることを特徴とするデータ管理装置。
  3. 【請求項3】請求項1に記載のデータ管理装置におい
    て、上記互いに依存関係を持つ1個以上の属性からなる
    属性組をデータ参照命令から抽出する手段は上記クライ
    アント装置上にあり、前記抽出された属性組を蓄積する
    手段と、上記着目する1個以上の属性を利用者が入力す
    る手段と、上記蓄積したデータから、上記入力された属
    性を含む属性間の依存関係の強さを算出する手段と、前
    記算出した依存関係の強さを出力する手段は、ネットワ
    ークに接続されたデータベース管理装置に構築されてい
    ることを特徴とするデータ管理装置。
  4. 【請求項4】請求項1に記載のデータ管理装置におい
    て、互いに依存関係を持つ1個以上の属性からなる属性
    組をデータ参照命令から抽出する手段と、前記抽出され
    た属性組を蓄積する手段と、着目する1個以上の属性を
    利用者が入力する手段と、上記蓄積したデータから、上
    記入力された属性を含む属性間の依存関係の強さを算出
    する手段と、前記算出した依存関係の強さを出力する手
    段は、データベースサーバ装置に含まれていることを特
    徴とするデータ管理装置。
  5. 【請求項5】データ参照命令を発行する1個以上のクラ
    イアント装置と、参照命令を解釈し実行する1個以上の
    データベースサーバ装置からなり、前記クライアント装
    置と前記サーバ装置がネットワークで接続されているデ
    ータベースシステムにおいて、互いに依存関係を持つ1
    個以上の属性からなる属性組を参照命令から抽出する手
    段と、前記抽出された属性組を蓄積する手段と、着目す
    る1個以上の属性を利用者が入力する手段と、上記蓄積
    したデータから、上記入力された属性を含む属性間の依
    存関係の強さを算出する手段と、前記算出した依存関係
    の強さを用いて新たなテーブルを定義するデータ参照命
    令を発行する手段とからなることを特徴とするデータ管
    理装置。
JP9169941A 1997-06-26 1997-06-26 データ管理装置 Pending JPH1115711A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9169941A JPH1115711A (ja) 1997-06-26 1997-06-26 データ管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9169941A JPH1115711A (ja) 1997-06-26 1997-06-26 データ管理装置

Publications (1)

Publication Number Publication Date
JPH1115711A true JPH1115711A (ja) 1999-01-22

Family

ID=15895746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9169941A Pending JPH1115711A (ja) 1997-06-26 1997-06-26 データ管理装置

Country Status (1)

Country Link
JP (1) JPH1115711A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1154352A1 (en) * 1999-01-29 2001-11-14 Digitaldesign, Co., Ltd. Data transmission method, computer-readable medium, and data transmission apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1154352A1 (en) * 1999-01-29 2001-11-14 Digitaldesign, Co., Ltd. Data transmission method, computer-readable medium, and data transmission apparatus
EP1154352A4 (en) * 1999-01-29 2009-09-30 Digitaldesign Co Ltd DATA TRANSMISSION PROCEDURE, COMPUTER READABLE MEDIA AND DATA TRANSMISSION DEVICE

Similar Documents

Publication Publication Date Title
US9792327B2 (en) Self-described query execution in a massively parallel SQL execution engine
US7015911B2 (en) Computer-implemented system and method for report generation
US6292797B1 (en) Method for determining actionable patterns in a database
RU2398273C2 (ru) Объединение многомерных выражений и расширений глубинного анализа данных для извлечения информации из кубов olap
WO2017183065A1 (ja) リレーショナルデータベースのチューニング装置及び方法
JP2002297602A (ja) 構造化文書検索方法および構造化文書検索装置および構造化文書管理装置およびプログラムおよび記録媒体
US20060129609A1 (en) Database synchronization using change log
Derakhshan et al. Optimizing machine learning workloads in collaborative environments
CN109213826B (zh) 数据处理方法和设备
CN109313640A (zh) 用于数据库优化的方法和系统
JPH07244605A (ja) データベースシステム及びその更新方法
US7707211B2 (en) Information management system and method
JP2004213447A (ja) 支援装置及び支援方法及び支援プログラム
JPH1115711A (ja) データ管理装置
JP2004234582A (ja) 辞書構築方法,システム及び画面
JP2002297601A (ja) 構造化文書管理方法および構造化文書管理装置およびプログラム
EP1993050A2 (en) System and method for sparsity removal
JP3842574B2 (ja) 情報抽出方法および構造化文書管理装置およびプログラム
JP2000259723A (ja) 情報関係チューニング装置及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JPH09305611A (ja) データベースの検索装置
JPH0668183A (ja) 設計支援装置
JP2000322295A (ja) データベースストアドサブプログラム用プログラミング支援方法ならびに装置
KR100331106B1 (ko) 실시간데이터베이스처리방법및그장치
JP4228267B2 (ja) 集合属性検索システム、集合属性検索方法および集合属性検索プログラム
JP6801195B2 (ja) 検索処理方法、検索処理装置及び検索処理プログラム