JPH06259478A - 分散データベースのデータ再配置方式 - Google Patents
分散データベースのデータ再配置方式Info
- Publication number
- JPH06259478A JPH06259478A JP5041465A JP4146593A JPH06259478A JP H06259478 A JPH06259478 A JP H06259478A JP 5041465 A JP5041465 A JP 5041465A JP 4146593 A JP4146593 A JP 4146593A JP H06259478 A JPH06259478 A JP H06259478A
- Authority
- JP
- Japan
- Prior art keywords
- data
- site
- access
- condition
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】本発明は、一旦配置されたデータに対して、計
算機リソース状況とアクセス分布に従ったデータベース
の分割条件を設定し、この分割条件に従う再配置を行な
うことで、負荷を効率良く分散することを特徴とする。 【構成】全サイトの計算機リソース状況を格納する計算
機リソース管理手段21と、全サイトのアクセスログか
らデータのアクセス回数の分布を得るアクセス分布生成
手段17と、計算機リソース管理手段21によって得ら
れる計算機リソース状況と上記アクセス分布生成手段に
よって得られるアクセス分布とをもとに分割条件を生成
する分割条件生成手段18と、分割条件生成手段18生
成されたデータ分割条件に合致するようにデータを移動
させるデータ移動手段19とを具備してなることを特徴
とする。
算機リソース状況とアクセス分布に従ったデータベース
の分割条件を設定し、この分割条件に従う再配置を行な
うことで、負荷を効率良く分散することを特徴とする。 【構成】全サイトの計算機リソース状況を格納する計算
機リソース管理手段21と、全サイトのアクセスログか
らデータのアクセス回数の分布を得るアクセス分布生成
手段17と、計算機リソース管理手段21によって得ら
れる計算機リソース状況と上記アクセス分布生成手段に
よって得られるアクセス分布とをもとに分割条件を生成
する分割条件生成手段18と、分割条件生成手段18生
成されたデータ分割条件に合致するようにデータを移動
させるデータ移動手段19とを具備してなることを特徴
とする。
Description
【0001】
【産業上の利用分野】本発明は、複数の計算機サイトに
データを分割配置する分散データベース管理システムに
適用される分散データベースのデータ再配置方式に係
り、特に計算機リソース状況とアクセス分布に従ってデ
ータベースの分割条件を設定し、この分割条件に従う再
配置を行なうことで、複数の各計算機サイトに効率良く
負荷を分散配置する負荷分散機能を実現した分散データ
ベースのデータ再配置方式に関する。
データを分割配置する分散データベース管理システムに
適用される分散データベースのデータ再配置方式に係
り、特に計算機リソース状況とアクセス分布に従ってデ
ータベースの分割条件を設定し、この分割条件に従う再
配置を行なうことで、複数の各計算機サイトに効率良く
負荷を分散配置する負荷分散機能を実現した分散データ
ベースのデータ再配置方式に関する。
【0002】
【従来の技術】電子計算機システムにより実現される分
散データベースシステムは、物理的に分かれたデータベ
ースを協調して利用することで、より高度な情報を得、
計算機の負荷を分散させることができるといった利点が
ある。データの分割/配置の方法によって、計算機の負
荷を効果的に分散し、計算機の性能を充分に活かすこと
ができることが可能となる。従来の技術による、データ
ベースの分散配置の例を示す。データの分割は、インデ
ックスの値による条件を定め、その条件に基づいて分散
する。
散データベースシステムは、物理的に分かれたデータベ
ースを協調して利用することで、より高度な情報を得、
計算機の負荷を分散させることができるといった利点が
ある。データの分割/配置の方法によって、計算機の負
荷を効果的に分散し、計算機の性能を充分に活かすこと
ができることが可能となる。従来の技術による、データ
ベースの分散配置の例を示す。データの分割は、インデ
ックスの値による条件を定め、その条件に基づいて分散
する。
【0003】データに、サイトに依存する情報が含まれ
るかあるいは検索方法が定まる場合、各サイトに依存性
の高いデータを配置するように、データベースの分割配
置方式を決めることができる。例えば、銀行データベー
スなどでは、各口座に対してその口座のある支店に基づ
いてデータを配置する。分割条件は、支店(通常は支店
コード)によって各サイトへのデータの配置が決まる。
これにより、ある口座に関するデータへのアクセスがあ
る場合、その口座の支店コードを識別することで上記口
座に関するデータの存在するサイトを知ることができ
る。
るかあるいは検索方法が定まる場合、各サイトに依存性
の高いデータを配置するように、データベースの分割配
置方式を決めることができる。例えば、銀行データベー
スなどでは、各口座に対してその口座のある支店に基づ
いてデータを配置する。分割条件は、支店(通常は支店
コード)によって各サイトへのデータの配置が決まる。
これにより、ある口座に関するデータへのアクセスがあ
る場合、その口座の支店コードを識別することで上記口
座に関するデータの存在するサイトを知ることができ
る。
【0004】しかし、データにサイトへの依存性がない
場合、データベース管理者(DBA)はデータの分割/
配置条件を決定し、カタログ等に格納し管理する。その
条件も、インデックスの値を用い、DBAが適当に決
め、直接カタログに書き込む。
場合、データベース管理者(DBA)はデータの分割/
配置条件を決定し、カタログ等に格納し管理する。その
条件も、インデックスの値を用い、DBAが適当に決
め、直接カタログに書き込む。
【0005】例えば、図2のような通信路により相互に
接続された3つのサイト(サイトA,サイトB,サイト
C)に、既存のデータを配置する。データベースに於い
て、最も良く利用されるインデックスをI(1≦I≦1
00万)とする。DBAはデータをIの値を基に、 サイトA: I= 1〜 330,000 サイトB: I=330,001〜 660,000 サイトC: I=660,001〜1,000,000 のように等分割するように決めたとする。DBAはこの
条件をカタログに登録し、データはこの条件に合うよう
に配置される。一般に、サイト数がN個であったとき、
各サイトに均等に配置するように、DBAが次のインデ
ックスiに基づく分割条件を作成し格納しておく。
接続された3つのサイト(サイトA,サイトB,サイト
C)に、既存のデータを配置する。データベースに於い
て、最も良く利用されるインデックスをI(1≦I≦1
00万)とする。DBAはデータをIの値を基に、 サイトA: I= 1〜 330,000 サイトB: I=330,001〜 660,000 サイトC: I=660,001〜1,000,000 のように等分割するように決めたとする。DBAはこの
条件をカタログに登録し、データはこの条件に合うよう
に配置される。一般に、サイト数がN個であったとき、
各サイトに均等に配置するように、DBAが次のインデ
ックスiに基づく分割条件を作成し格納しておく。
【0006】インデックスiのデータは、mod(i/
N)番目のサイトに格納し、入力されたデータは、その
都度、どのサイトに配置されるかがこの分割条件に基づ
いて計算され、そのサイトに送られて格納される。
N)番目のサイトに格納し、入力されたデータは、その
都度、どのサイトに配置されるかがこの分割条件に基づ
いて計算され、そのサイトに送られて格納される。
【0007】しかし、計算機の性能がサイトによって異
なる場合、負荷を効率良く分散して、計算機を使用する
ことができないので、各サイトの計算機の性能に応じ
て、データベースの処理量を分散するようにデータを配
置する分散データベースのデータ分割方式として、既に
同一出願人により出願された特願平4−35090号
(分散データベースのデータ分割管理方式)がある。こ
の方式では、例えば、3つのサイトからなる分散データ
ベースに於いて、そのそれぞれの計算機の主記憶量が次
のようになっていたとする。
なる場合、負荷を効率良く分散して、計算機を使用する
ことができないので、各サイトの計算機の性能に応じ
て、データベースの処理量を分散するようにデータを配
置する分散データベースのデータ分割方式として、既に
同一出願人により出願された特願平4−35090号
(分散データベースのデータ分割管理方式)がある。こ
の方式では、例えば、3つのサイトからなる分散データ
ベースに於いて、そのそれぞれの計算機の主記憶量が次
のようになっていたとする。
【0008】処理の速度は、おおよそ主記憶量が大きく
なるほど速くなる。よって、各サイトにある同じ処理を
させると、サイトAで10msecで行なわれる処理は、サ
イトBで100msec、サイトCで1msecで行なわれるこ
とになる。データへのアクセスがデータによって均等で
ある場合、各サイトに於けるデータベースの処理量はデ
ータ量に比例するので、主記憶量に比例して全てのデー
タを配置することを選択したとする。サイト毎の主記憶
の比率は、 A:B:C=10:1:100 となっており、データをこの比率で分散する。良く使用
されるインデックスIを抽出し、Iの値が1≦I≦10
00万であることと、上記の比を用い、分割条件生成手
段は サイトA: I= 1〜 900,000 サイトB: I= 900,001〜 1,000,000 サイトC: I=1,000,001〜 10,000,000 のように、データベース処理の性能を負荷分散できるよ
うな配置のための分散条件を決定する。データ量とデー
タベース処理量は比例するので、サイトごとのデータベ
ース処理量の比率も、 A:B:C=10:1:100 となる。各サイトに於いてある処理を行なった場合の処
理時間は、通常、主記憶量に反比例するので、 A:B:C=10:100:1 となる。
なるほど速くなる。よって、各サイトにある同じ処理を
させると、サイトAで10msecで行なわれる処理は、サ
イトBで100msec、サイトCで1msecで行なわれるこ
とになる。データへのアクセスがデータによって均等で
ある場合、各サイトに於けるデータベースの処理量はデ
ータ量に比例するので、主記憶量に比例して全てのデー
タを配置することを選択したとする。サイト毎の主記憶
の比率は、 A:B:C=10:1:100 となっており、データをこの比率で分散する。良く使用
されるインデックスIを抽出し、Iの値が1≦I≦10
00万であることと、上記の比を用い、分割条件生成手
段は サイトA: I= 1〜 900,000 サイトB: I= 900,001〜 1,000,000 サイトC: I=1,000,001〜 10,000,000 のように、データベース処理の性能を負荷分散できるよ
うな配置のための分散条件を決定する。データ量とデー
タベース処理量は比例するので、サイトごとのデータベ
ース処理量の比率も、 A:B:C=10:1:100 となる。各サイトに於いてある処理を行なった場合の処
理時間は、通常、主記憶量に反比例するので、 A:B:C=10:100:1 となる。
【0009】ある時間内に、サイトAで100件の処理
が1件平均10msecで行われたとすると、サイトBでは
10件の処理が100msecで、サイトCでは1000件
の処理が平均1msecで行われたことになる。因って、各
サイトのデータベース処理にかかる時間は、それぞれ約
1msecとなり、効率良く負荷分散がなされていると言え
る。しかし、データへのアクセスがデータによって不均
等で、ある一定時間での各サイトのデータベース処理件
数が、 サイトA: 500万件 サイトB: 30万件 サイトC: 250万件 のようになっていたとすると、データベースの処理量は
データ量に一致せず、データベース処理にかかる時間
は、それぞれ、 サイトA: 50 sec サイトB: 30 sec サイトC: 2.5sec となり、最適な負荷分散がなされていない。
が1件平均10msecで行われたとすると、サイトBでは
10件の処理が100msecで、サイトCでは1000件
の処理が平均1msecで行われたことになる。因って、各
サイトのデータベース処理にかかる時間は、それぞれ約
1msecとなり、効率良く負荷分散がなされていると言え
る。しかし、データへのアクセスがデータによって不均
等で、ある一定時間での各サイトのデータベース処理件
数が、 サイトA: 500万件 サイトB: 30万件 サイトC: 250万件 のようになっていたとすると、データベースの処理量は
データ量に一致せず、データベース処理にかかる時間
は、それぞれ、 サイトA: 50 sec サイトB: 30 sec サイトC: 2.5sec となり、最適な負荷分散がなされていない。
【0010】また、一旦分散配置したデータを、再配置
する際、DBAが、分散条件に合うように、移動するデ
ータの決定や、移動場所等を決定し、手動で移動させな
ければならないことから、作業が繁雑であるという問題
があった。
する際、DBAが、分散条件に合うように、移動するデ
ータの決定や、移動場所等を決定し、手動で移動させな
ければならないことから、作業が繁雑であるという問題
があった。
【0011】
【発明が解決しようとする課題】このように従来の負荷
分散方式では、データへのアクセスがデータによって均
等でない場合に、負荷を効率良く分散して計算機を効率
良く利用することができないという問題があった。ま
た、一旦配置したデータを移動する作業がDBAにとっ
て繁雑であるという問題があった。
分散方式では、データへのアクセスがデータによって均
等でない場合に、負荷を効率良く分散して計算機を効率
良く利用することができないという問題があった。ま
た、一旦配置したデータを移動する作業がDBAにとっ
て繁雑であるという問題があった。
【0012】本発明は上記実情に鑑みなされたもので、
複数の計算機サイトにデータを分割配置する分散データ
ベース管理システムに於いて、システムで認識したリソ
ース状況とアクセス分布に従ってデータベースの分割条
件を設定し、この分割条件に従う再配置を行なうこと
で、各計算機サイトに負荷を効率良く分散配置すること
ができ、DBAにかかる作業負担を大幅に軽減できる分
散データベースのデータ再配置方式を提供することを目
的とする。
複数の計算機サイトにデータを分割配置する分散データ
ベース管理システムに於いて、システムで認識したリソ
ース状況とアクセス分布に従ってデータベースの分割条
件を設定し、この分割条件に従う再配置を行なうこと
で、各計算機サイトに負荷を効率良く分散配置すること
ができ、DBAにかかる作業負担を大幅に軽減できる分
散データベースのデータ再配置方式を提供することを目
的とする。
【0013】
【課題を解決するための手段】この発明による分散デー
タベースでは、全サイトの計算機リソース状況を格納す
る計算機リソース管理手段と、自サイトのデータへのア
クセス記録(ログ)を蓄えるアクセスログ蓄積手段と、
全サイトのアクセスログからデータのアクセス回数の分
布を得るアクセス分布生成手段と、上記計算機リソース
管理手段によって得られた計算機リソース状況と上記ア
クセス分布生成手段によって得られるアクセス分布から
分割条件を生成する分割条件生成手段と、データ分割条
件生成手段によって導かれるデータの分割条件を格納す
る分割条件記憶手段と、データ分割条件に合致するよう
にデータを移動させるデータ移動手段とを備え、システ
ムが計算機リソース状況とアクセス分布に従って負荷分
散を図るような再分割/配置管理を行うことを特徴とす
る。
タベースでは、全サイトの計算機リソース状況を格納す
る計算機リソース管理手段と、自サイトのデータへのア
クセス記録(ログ)を蓄えるアクセスログ蓄積手段と、
全サイトのアクセスログからデータのアクセス回数の分
布を得るアクセス分布生成手段と、上記計算機リソース
管理手段によって得られた計算機リソース状況と上記ア
クセス分布生成手段によって得られるアクセス分布から
分割条件を生成する分割条件生成手段と、データ分割条
件生成手段によって導かれるデータの分割条件を格納す
る分割条件記憶手段と、データ分割条件に合致するよう
にデータを移動させるデータ移動手段とを備え、システ
ムが計算機リソース状況とアクセス分布に従って負荷分
散を図るような再分割/配置管理を行うことを特徴とす
る。
【0014】
【作用】上記した本発明の構成において、システムは、
計算機リソース管理手段から取り出した各サイトのリソ
ース状況と、アクセス分布生成手段で得たアクセス分布
から、分割条件生成手段によって分割条件を生成し、分
割条件記憶手段に格納して、この分割条件に合致するよ
うにデータを移動させる。
計算機リソース管理手段から取り出した各サイトのリソ
ース状況と、アクセス分布生成手段で得たアクセス分布
から、分割条件生成手段によって分割条件を生成し、分
割条件記憶手段に格納して、この分割条件に合致するよ
うにデータを移動させる。
【0015】このように、リソース状況とアクセスログ
から分割条件を生成するので、計算機リソース状況とデ
ータのアクセス回数に応じた、負荷分散のバランスが図
られ、各サイトの性能を十分に活かすことができる。
から分割条件を生成するので、計算機リソース状況とデ
ータのアクセス回数に応じた、負荷分散のバランスが図
られ、各サイトの性能を十分に活かすことができる。
【0016】
【実施例】以下図面を用いて本発明の実施例を説明す
る。図1は実施例に於けるシステム内のサイトの構成を
示すブロック図である。
る。図1は実施例に於けるシステム内のサイトの構成を
示すブロック図である。
【0017】システム内の計算機サイト11には、計算
機リソース状況を格納し管理する計算機リソース管理手
段21と、自サイトのデータへのアクセス記録(ログ)
を蓄えるアクセスログ蓄積手段16と、全サイトのアク
セスログからデータのアクセス回数の分布を得るアクセ
ス分布生成手段17と、上記計算機リソース管理手段に
よって得られた計算機リソース状況と上記アクセス分布
生成手段17によって得られるアクセス分布から分割条
件を生成する分割条件生成手段18と、上記分割条件生
成手段18によって導かれるデータ分割条件を格納する
分割条件記憶手段22と、データ分割条件に合致するよ
うにデータを移動させるデータ移動手段19とが設けら
れる。尚、12は他の計算機サイトとの間のデータ授受
に供される通信路、13は通信路12を介して他の計算
機サイトとの間でデータを送受する通信手段、14は計
算機サイト11のシステム制御を司るCPU、15はデ
ータベース(DB)、20はアクセスログである。
機リソース状況を格納し管理する計算機リソース管理手
段21と、自サイトのデータへのアクセス記録(ログ)
を蓄えるアクセスログ蓄積手段16と、全サイトのアク
セスログからデータのアクセス回数の分布を得るアクセ
ス分布生成手段17と、上記計算機リソース管理手段に
よって得られた計算機リソース状況と上記アクセス分布
生成手段17によって得られるアクセス分布から分割条
件を生成する分割条件生成手段18と、上記分割条件生
成手段18によって導かれるデータ分割条件を格納する
分割条件記憶手段22と、データ分割条件に合致するよ
うにデータを移動させるデータ移動手段19とが設けら
れる。尚、12は他の計算機サイトとの間のデータ授受
に供される通信路、13は通信路12を介して他の計算
機サイトとの間でデータを送受する通信手段、14は計
算機サイト11のシステム制御を司るCPU、15はデ
ータベース(DB)、20はアクセスログである。
【0018】図2は上記実施例のシステム構成例を示し
たもので、図中、23A,23B,23Cはそれぞれ通
信路24、及び通信ネットワーク25を介して相互に接
続された計算機サイト(サイトA,B,C)であり、そ
れぞれ図1に示すような、CPUをそれぞれにもつ計算
機サイト11と同等の構成をなす。尚、図1に示す計算
機リソース管理手段21は少なくともシステム内のいず
れかのサイトに設けた構成であってよい。図3は上記実
施例の処理動作を説明するためのフローチャートであ
る。
たもので、図中、23A,23B,23Cはそれぞれ通
信路24、及び通信ネットワーク25を介して相互に接
続された計算機サイト(サイトA,B,C)であり、そ
れぞれ図1に示すような、CPUをそれぞれにもつ計算
機サイト11と同等の構成をなす。尚、図1に示す計算
機リソース管理手段21は少なくともシステム内のいず
れかのサイトに設けた構成であってよい。図3は上記実
施例の処理動作を説明するためのフローチャートであ
る。
【0019】図3に於いて、S1 は全サイトのアクセス
ログを収集しデータのアクセス回数の分布を得るステッ
プであり、アクセス分布生成手段17の処理により実現
される。S2 はアクセス分布と計算機リソースの状況か
ら分割条件を生成するステップであり、分割条件生成手
段18の処理により実現される。S3 は生成した分割条
件をカタログ等へ蓄積し格納するステップであり、分割
条件記憶手段22により実現される。S4 は新しく得ら
れた分割条件に沿ってデータを移動する処理ステップで
あり、データ移動手段19の処理により実現される。図
4は上記実施例に於いて負荷分散を主記憶の大きさに従
って行なう場合の処理動作の流れを説明するための図で
ある。ここで、上記各図を参照して本発明の実施例に於
ける動作を説明する。
ログを収集しデータのアクセス回数の分布を得るステッ
プであり、アクセス分布生成手段17の処理により実現
される。S2 はアクセス分布と計算機リソースの状況か
ら分割条件を生成するステップであり、分割条件生成手
段18の処理により実現される。S3 は生成した分割条
件をカタログ等へ蓄積し格納するステップであり、分割
条件記憶手段22により実現される。S4 は新しく得ら
れた分割条件に沿ってデータを移動する処理ステップで
あり、データ移動手段19の処理により実現される。図
4は上記実施例に於いて負荷分散を主記憶の大きさに従
って行なう場合の処理動作の流れを説明するための図で
ある。ここで、上記各図を参照して本発明の実施例に於
ける動作を説明する。
【0020】ここでは、本発明の実施例に於ける動作に
ついて、図4の例を用いて説明する。ここで用いる分散
データベースは、図2に示すように、通信路により相互
に接続された3つのサイト(サイトA,B,C)からな
るものとする。
ついて、図4の例を用いて説明する。ここで用いる分散
データベースは、図2に示すように、通信路により相互
に接続された3つのサイト(サイトA,B,C)からな
るものとする。
【0021】まず、従来例で述べたように、データベー
ス処理を主に行なっているシステムの場合、データベー
ス処理に割り当てた主記憶量が取りが多いシステムのほ
うがデータベース処理性能が高いという傾向がある。そ
こで、主記憶量に比例して、全てのデータを配置すると
いうことで、負荷分散を図る。 計算機リソース管理手段からわかるサイトごとの主記憶
の比率 A:B:C=2:3:5 に従って、データを分散していたとする。例えば、分割
条件を、良く使用されるインデックスI(1≦I≦10
0万)の値を基に、 サイトA: I= 1〜 200,000 サイトB: I=200,001〜 500,000 サイトC: I=500,001〜1,000,000 のように、設定されていたとする。
ス処理を主に行なっているシステムの場合、データベー
ス処理に割り当てた主記憶量が取りが多いシステムのほ
うがデータベース処理性能が高いという傾向がある。そ
こで、主記憶量に比例して、全てのデータを配置すると
いうことで、負荷分散を図る。 計算機リソース管理手段からわかるサイトごとの主記憶
の比率 A:B:C=2:3:5 に従って、データを分散していたとする。例えば、分割
条件を、良く使用されるインデックスI(1≦I≦10
0万)の値を基に、 サイトA: I= 1〜 200,000 サイトB: I=200,001〜 500,000 サイトC: I=500,001〜1,000,000 のように、設定されていたとする。
【0022】各サイトに於いては、それぞれのデータに
対するアクセス回数をアクセスログ20に記録してお
く。すると、ある期間の間、この分散データベースを利
用することで、データのアクセス頻度がわかる。本発明
に於いては、使用中の分散データベースに対して、最適
負荷分散が成されるように、再配置を行なう。この再配
置は、一定時間や一定アクセス回数などを目安に、定期
的に実行するか、DBAの命令で実行することができ
る。
対するアクセス回数をアクセスログ20に記録してお
く。すると、ある期間の間、この分散データベースを利
用することで、データのアクセス頻度がわかる。本発明
に於いては、使用中の分散データベースに対して、最適
負荷分散が成されるように、再配置を行なう。この再配
置は、一定時間や一定アクセス回数などを目安に、定期
的に実行するか、DBAの命令で実行することができ
る。
【0023】本発明の実施例に於ける再分割方法の決定
の手順を説明する。まず、図3に示すステップS1 の処
理で、各サイトのアクセスログを集め、集められたアク
セスログからアクセス分布を生成し、ここで、インデッ
クスIの値によって、 サイトA: I= 1〜 100.000 :200万回 I=100,001〜 200,000 :100万回 サイトB: I=200,001〜 300,000 : 50万回 I=300,001〜 400,000 : 50万回 I=400,001〜 500,000 : 50万回 サイトC: I=500,001〜 600,000 : 50万回 I=600,001〜 700,000 : 50万回 I=700,001〜 800,000 :100万回 I=800,001〜 900,000 :300万回 I=900,001〜1000,000 : 50万回 のようにアクセス回数があったとする。次に、図3に示
すステップS2 の処理で、各サイトのアクセス回数の合
計は A:B:C=300万:150万:550万 = 6 : 3 : 11 となっており、主記憶量の比が A:B:C= 2 : 3 : 5 であるので、この分割条件では最適負荷分散がなされて
いない。集められたアクセスログから、アクセス回数の
合計は1000万回であり、これを主記憶量に比例させ
ると、 A:B:C=200万:300万:500万 のようになる。このようなアクセス回数となるように、
アクセス分布を用いて、分割条件を求め、 サイトA: I= 1〜 100,000 サイトB: I=100,001〜 600,000 サイトC: I=600,001〜1,000,000 のように設定する。
の手順を説明する。まず、図3に示すステップS1 の処
理で、各サイトのアクセスログを集め、集められたアク
セスログからアクセス分布を生成し、ここで、インデッ
クスIの値によって、 サイトA: I= 1〜 100.000 :200万回 I=100,001〜 200,000 :100万回 サイトB: I=200,001〜 300,000 : 50万回 I=300,001〜 400,000 : 50万回 I=400,001〜 500,000 : 50万回 サイトC: I=500,001〜 600,000 : 50万回 I=600,001〜 700,000 : 50万回 I=700,001〜 800,000 :100万回 I=800,001〜 900,000 :300万回 I=900,001〜1000,000 : 50万回 のようにアクセス回数があったとする。次に、図3に示
すステップS2 の処理で、各サイトのアクセス回数の合
計は A:B:C=300万:150万:550万 = 6 : 3 : 11 となっており、主記憶量の比が A:B:C= 2 : 3 : 5 であるので、この分割条件では最適負荷分散がなされて
いない。集められたアクセスログから、アクセス回数の
合計は1000万回であり、これを主記憶量に比例させ
ると、 A:B:C=200万:300万:500万 のようになる。このようなアクセス回数となるように、
アクセス分布を用いて、分割条件を求め、 サイトA: I= 1〜 100,000 サイトB: I=100,001〜 600,000 サイトC: I=600,001〜1,000,000 のように設定する。
【0024】各サイトに於いて、ある処理を行なった場
合の処理時間は、主記憶量に反比例するので、サイトA
では、200件の処理が平均15msecで行なわれたとす
ると、サイトBでは、300件の処理が1件平均10ms
ecで、サイトCでは、500件の処理が平均6msecで行
なわれることになり、各サイトのデータベース処理にか
かる時間は、それぞれ3msecとなり、効率良く負荷分散
が行なわれることになる。このように新しい分割条件が
求まったならば、図3に示すステップS4 の処理によ
り、データ移動手段19を用いて再配置を行なう。ま
ず、前の分割条件、 サイトA: I= 1〜 200,000 サイトB: I=200,001〜 500,000 サイトC: I=500,001〜1,000,000 と、新しい分割条件、 サイトA: I= 1〜 100,000 サイトB: I=100,001〜 600,000 サイトC: I=600,001〜1,000,000
合の処理時間は、主記憶量に反比例するので、サイトA
では、200件の処理が平均15msecで行なわれたとす
ると、サイトBでは、300件の処理が1件平均10ms
ecで、サイトCでは、500件の処理が平均6msecで行
なわれることになり、各サイトのデータベース処理にか
かる時間は、それぞれ3msecとなり、効率良く負荷分散
が行なわれることになる。このように新しい分割条件が
求まったならば、図3に示すステップS4 の処理によ
り、データ移動手段19を用いて再配置を行なう。ま
ず、前の分割条件、 サイトA: I= 1〜 200,000 サイトB: I=200,001〜 500,000 サイトC: I=500,001〜1,000,000 と、新しい分割条件、 サイトA: I= 1〜 100,000 サイトB: I=100,001〜 600,000 サイトC: I=600,001〜1,000,000
【0025】を比較し、I=100,001〜200,
000のデータをサイトAからサイトBへ、I=50
0,001〜600,000のデータをサイトCからサ
イトBへ移動することを決定する。次に、移動する、サ
イトAのI=100,001〜200,000と、サイ
トCのI=500,001〜600,000のデータに
参照ロックをかける。サイトBにI=100,001〜
200,000と、I=500,001〜600,00
0のデータをコピーする。この際、分割条件記憶手段2
2に於ける分割条件の古いものを消去し、新しい分割条
件とする。
000のデータをサイトAからサイトBへ、I=50
0,001〜600,000のデータをサイトCからサ
イトBへ移動することを決定する。次に、移動する、サ
イトAのI=100,001〜200,000と、サイ
トCのI=500,001〜600,000のデータに
参照ロックをかける。サイトBにI=100,001〜
200,000と、I=500,001〜600,00
0のデータをコピーする。この際、分割条件記憶手段2
2に於ける分割条件の古いものを消去し、新しい分割条
件とする。
【0026】サイトAからI=100,001〜20
0,000のデータ、サイトCからI=500,001
〜600,000のデータをそれぞれ消去する。ここ
で、データの移動が完成し、上記参照ロックを解放す
る。よって、システム運用中であっても、データの再配
置を行なうことができる。
0,000のデータ、サイトCからI=500,001
〜600,000のデータをそれぞれ消去する。ここ
で、データの移動が完成し、上記参照ロックを解放す
る。よって、システム運用中であっても、データの再配
置を行なうことができる。
【0027】また、データの物理的な配置は分割条件記
憶手段22で管理するため、アプリケーションプログラ
ムはデータの物理的な配置を知る必要がなく実行でき、
再配置を行なった後も、アプリケーションプログラムを
変更する必要はない。
憶手段22で管理するため、アプリケーションプログラ
ムはデータの物理的な配置を知る必要がなく実行でき、
再配置を行なった後も、アプリケーションプログラムを
変更する必要はない。
【0028】データベース処理性能に関わる計算機リソ
ース状況には、CPU性能、外部記憶装置、通信性能等
があり、DBAがデータの特性にあわせて、どの条件を
使用するか決定することができる。例えば、CPU性能
によって、データを分散するとし、各サイトのMIPS
値の比 A:B:C=3:2:5 に基づいて、データを分散する。この時、アクセス回数
の合計1000万回が A:B:C=300万:400万:300万 となるように分割条件を生成すると、 サイトA: I= 1〜 200,000 サイトB: I=200,001〜 600,000 サイトC: I=600,001〜1,000,000 となり、この分割条件に基づいて、再配置を行なう。
ース状況には、CPU性能、外部記憶装置、通信性能等
があり、DBAがデータの特性にあわせて、どの条件を
使用するか決定することができる。例えば、CPU性能
によって、データを分散するとし、各サイトのMIPS
値の比 A:B:C=3:2:5 に基づいて、データを分散する。この時、アクセス回数
の合計1000万回が A:B:C=300万:400万:300万 となるように分割条件を生成すると、 サイトA: I= 1〜 200,000 サイトB: I=200,001〜 600,000 サイトC: I=600,001〜1,000,000 となり、この分割条件に基づいて、再配置を行なう。
【0029】上記したように、一旦配置されたデータに
対し、計算機リソース状況に従ったデータベースの分割
条件を設定でき、この分割条件に従う再配置を行なうこ
とで、負荷を効率良く分散することができる。
対し、計算機リソース状況に従ったデータベースの分割
条件を設定でき、この分割条件に従う再配置を行なうこ
とで、負荷を効率良く分散することができる。
【0030】
【発明の効果】以上詳述したように、本発明によれば、
複数の計算機サイトにデータを分割配置する分散データ
ベース管理システムに於いて、一旦、配置されたデータ
に対して、計算機リソース状況に従ったデータベースの
分割条件を設定でき、この分割条件をもとに再配置する
ことで、負荷を効率良く分散することができる。
複数の計算機サイトにデータを分割配置する分散データ
ベース管理システムに於いて、一旦、配置されたデータ
に対して、計算機リソース状況に従ったデータベースの
分割条件を設定でき、この分割条件をもとに再配置する
ことで、負荷を効率良く分散することができる。
【図1】本発明の一実施例に於ける計算機サイトの構成
を示すブロック図。
を示すブロック図。
【図2】上記実施例のシステム構成例を示すブロック
図。
図。
【図3】上記実施例に於ける処理動作を説明するための
フローチャート。
フローチャート。
【図4】上記実施例に於いて負荷分散を主記憶の大きさ
に従って行なう場合の処理動作の流れを説明するための
図。
に従って行なう場合の処理動作の流れを説明するための
図。
11…計算機サイト、12…通信路、13…通信手段、
14…CPU、15…データベース(DB)、16…ア
クセスログ蓄積手段、17…アクセス分布生成手段、1
8…分割条件生成手段、19…データ移動手段、20…
アクセスログ、21…リソース管理手段、22…分割条
件記憶手段、23a…サイトA、23b…サイトB、2
3c…サイトC、24…通信路、25…通信ネットワー
ク。
14…CPU、15…データベース(DB)、16…ア
クセスログ蓄積手段、17…アクセス分布生成手段、1
8…分割条件生成手段、19…データ移動手段、20…
アクセスログ、21…リソース管理手段、22…分割条
件記憶手段、23a…サイトA、23b…サイトB、2
3c…サイトC、24…通信路、25…通信ネットワー
ク。
Claims (1)
- 【請求項1】 通信路を介して相互に接続される複数の
計算機サイト上に構築され、自サイトのデータへのアク
セスログを記録するアクセスログ蓄積手段、及びデータ
を分割する条件を格納する分割条件記憶手段を有して、
上記分割条件記憶手段に格納された条件に従い上記計算
機サイトにデータを分割配置する分散データベースシス
テムに於いて、 全サイトの計算機リソース状況を格納する計算機リソー
ス管理手段と、 全サイトのアクセスログからデータのアクセス回数の分
布を得るアクセス分布生成手段と、 上記計算機リソース管理手段によって得られる計算機リ
ソース状況と上記アクセス分布生成手段によって得られ
るアクセス分布とをもとに分割条件を生成する分割条件
生成手段と、 上記分割条件生成手段で生成されたデータ分割条件に合
致するようにデータを移動させるデータ移動手段とを具
備してなることを特徴とする分散データベースのデータ
再配置方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5041465A JPH06259478A (ja) | 1993-03-02 | 1993-03-02 | 分散データベースのデータ再配置方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5041465A JPH06259478A (ja) | 1993-03-02 | 1993-03-02 | 分散データベースのデータ再配置方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06259478A true JPH06259478A (ja) | 1994-09-16 |
Family
ID=12609128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5041465A Pending JPH06259478A (ja) | 1993-03-02 | 1993-03-02 | 分散データベースのデータ再配置方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06259478A (ja) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231144A (ja) * | 1996-02-28 | 1997-09-05 | Mitsubishi Electric Corp | データファイル管理方法およびデータファイル管理装置 |
JP2002202992A (ja) * | 2000-12-28 | 2002-07-19 | Speed System:Kk | ホームページ検索システム |
JP2007502464A (ja) * | 2003-08-14 | 2007-02-08 | オラクル・インターナショナル・コーポレイション | データベースの自動的および動的な提供 |
JP2009288979A (ja) * | 2008-05-28 | 2009-12-10 | Internatl Business Mach Corp <Ibm> | 決定装置、データベース装置、プログラムおよび決定方法 |
JP2010061261A (ja) * | 2008-09-02 | 2010-03-18 | Fujitsu Ltd | 認証システムおよび認証方法 |
US7689545B2 (en) | 2004-11-09 | 2010-03-30 | Hitachi, Ltd. | System and method to enable parallel text search using in-charge index ranges |
JP2011044054A (ja) * | 2009-08-24 | 2011-03-03 | Fuji Xerox Co Ltd | 情報処理システム、情報処理装置、及びプログラム |
JP2012114748A (ja) * | 2010-11-25 | 2012-06-14 | Ntt Docomo Inc | 電話番号管理システム及び電話番号管理方法 |
JP2012164190A (ja) * | 2011-02-08 | 2012-08-30 | Hitachi Solutions Ltd | 排他制御装置および排他制御方法 |
WO2013046664A1 (ja) * | 2011-09-27 | 2013-04-04 | 日本電気株式会社 | 情報システム、管理装置、データ処理方法、データ構造、プログラム、および記録媒体 |
JP2013061739A (ja) * | 2011-09-12 | 2013-04-04 | Fujitsu Ltd | データ管理装置、データ管理システム、データ管理方法、及びプログラム |
WO2013153620A1 (ja) * | 2012-04-10 | 2013-10-17 | 株式会社日立製作所 | データ処理システム及びデータ処理方法 |
JP2016018225A (ja) * | 2014-07-04 | 2016-02-01 | 富士通株式会社 | データ分割制御プログラム、データ分割制御方法、及び、データ分割制御装置 |
US9489429B2 (en) | 2011-11-16 | 2016-11-08 | Hitachi, Ltd. | Computer system, data management method, and program |
JP2017126250A (ja) * | 2016-01-15 | 2017-07-20 | 富士通株式会社 | チケット販売プログラム、装置、及び方法 |
US9773061B2 (en) | 2012-05-24 | 2017-09-26 | Hitachi, Ltd. | Data distributed search system, data distributed search method, and management computer |
WO2019188695A1 (ja) * | 2018-03-28 | 2019-10-03 | 日本電信電話株式会社 | 性能影響評価装置及び性能影響評価方法 |
-
1993
- 1993-03-02 JP JP5041465A patent/JPH06259478A/ja active Pending
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231144A (ja) * | 1996-02-28 | 1997-09-05 | Mitsubishi Electric Corp | データファイル管理方法およびデータファイル管理装置 |
JP2002202992A (ja) * | 2000-12-28 | 2002-07-19 | Speed System:Kk | ホームページ検索システム |
JP2007502464A (ja) * | 2003-08-14 | 2007-02-08 | オラクル・インターナショナル・コーポレイション | データベースの自動的および動的な提供 |
JP4856541B2 (ja) * | 2003-08-14 | 2012-01-18 | オラクル・インターナショナル・コーポレイション | データベースの自動的および動的な提供 |
US7689545B2 (en) | 2004-11-09 | 2010-03-30 | Hitachi, Ltd. | System and method to enable parallel text search using in-charge index ranges |
JP2009288979A (ja) * | 2008-05-28 | 2009-12-10 | Internatl Business Mach Corp <Ibm> | 決定装置、データベース装置、プログラムおよび決定方法 |
US9864777B2 (en) | 2008-05-28 | 2018-01-09 | International Business Machines Corporation | Table partitioning and storage in a database |
US10169420B2 (en) | 2008-05-28 | 2019-01-01 | International Business Machines Corporation | Table partitioning and storage in a database |
JP2010061261A (ja) * | 2008-09-02 | 2010-03-18 | Fujitsu Ltd | 認証システムおよび認証方法 |
JP2011044054A (ja) * | 2009-08-24 | 2011-03-03 | Fuji Xerox Co Ltd | 情報処理システム、情報処理装置、及びプログラム |
JP2012114748A (ja) * | 2010-11-25 | 2012-06-14 | Ntt Docomo Inc | 電話番号管理システム及び電話番号管理方法 |
JP2012164190A (ja) * | 2011-02-08 | 2012-08-30 | Hitachi Solutions Ltd | 排他制御装置および排他制御方法 |
JP2013061739A (ja) * | 2011-09-12 | 2013-04-04 | Fujitsu Ltd | データ管理装置、データ管理システム、データ管理方法、及びプログラム |
WO2013046664A1 (ja) * | 2011-09-27 | 2013-04-04 | 日本電気株式会社 | 情報システム、管理装置、データ処理方法、データ構造、プログラム、および記録媒体 |
JPWO2013046664A1 (ja) * | 2011-09-27 | 2015-03-26 | 日本電気株式会社 | 情報システム、管理装置、データ処理方法、データ構造、プログラム、および記録媒体 |
US9489429B2 (en) | 2011-11-16 | 2016-11-08 | Hitachi, Ltd. | Computer system, data management method, and program |
WO2013153620A1 (ja) * | 2012-04-10 | 2013-10-17 | 株式会社日立製作所 | データ処理システム及びデータ処理方法 |
US9773061B2 (en) | 2012-05-24 | 2017-09-26 | Hitachi, Ltd. | Data distributed search system, data distributed search method, and management computer |
JP2016018225A (ja) * | 2014-07-04 | 2016-02-01 | 富士通株式会社 | データ分割制御プログラム、データ分割制御方法、及び、データ分割制御装置 |
JP2017126250A (ja) * | 2016-01-15 | 2017-07-20 | 富士通株式会社 | チケット販売プログラム、装置、及び方法 |
WO2019188695A1 (ja) * | 2018-03-28 | 2019-10-03 | 日本電信電話株式会社 | 性能影響評価装置及び性能影響評価方法 |
JP2019175067A (ja) * | 2018-03-28 | 2019-10-10 | 日本電信電話株式会社 | 性能影響評価装置及び性能影響評価方法 |
US11526416B2 (en) | 2018-03-28 | 2022-12-13 | Nippon Telegraph And Telephone Corporation | Performance impact evaluation device and performance impact evaluation method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH06259478A (ja) | 分散データベースのデータ再配置方式 | |
US5345584A (en) | System for managing data storage based on vector-summed size-frequency vectors for data sets, devices, and residual storage on devices | |
US5960431A (en) | Method and apparatus for adding data storage bins to a stored computer database while minimizing movement of data and balancing data distribution | |
US7096337B2 (en) | Disk storage accessing system and method for changing access path to storage devices | |
JP3510042B2 (ja) | データベース管理方法及びシステム | |
US20050050050A1 (en) | Database management methods and equipment and database management program storage media | |
JPS62180429A (ja) | 多重処理環境でのロツク管理方法 | |
CA2275399A1 (en) | Computer executable workflow control system | |
JPH04165541A (ja) | ファイル再配置方法 | |
JPS6310250A (ja) | 仮想論理ボリユ−ム管理方式 | |
US20070143367A1 (en) | Attribute based resource allocation | |
JPS59146355A (ja) | 直接アクセス記憶装置のデ−タセツト再編成方法 | |
US6505217B1 (en) | Method and apparatus for file placement | |
US20050086430A1 (en) | Method, system, and program for designating a storage group preference order | |
JPH05233390A (ja) | 分散データベースのデータ分割管理方式 | |
JPS62163154A (ja) | 仮想論理ボリユ−ム方式 | |
US7293032B1 (en) | Compressing decimal types | |
JP2000148549A (ja) | データ格納管理装置 | |
JPH0267621A (ja) | ファイル再配置方式 | |
JP2000112793A (ja) | データベース拡張方法、データベース検索システムおよび記録媒体 | |
JP2000348063A (ja) | データベース管理方法およびシステム | |
JP2508607B2 (ja) | ファイルシステム管理方法 | |
JPH0245842A (ja) | データファイル管理方式 | |
JPH01106217A (ja) | 並列格納・読出し方式データ処理装置 | |
JP2522161B2 (ja) | 仮想計算機システムにおけるボリュ―ム資源管理方式 |