JPH11312150A

JPH11312150A - 並列処理方法および並列処理システム、ならびに並列処理プログラムを記録した記録媒体

Info

Publication number: JPH11312150A
Application number: JP10119789A
Authority: JP
Inventors: Hiroshi Arimichi; 啓史有道; Yoshihiro Yoshida; 芳浩吉田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1998-04-30
Filing date: 1998-04-30
Publication date: 1999-11-09

Abstract

(57)【要約】【課題】分散したテーブルを作成するスクリプトを自動
作成でき、データベースにアクセスするアプリケーショ
ンからテーブルの分散を隠蔽でき、データベースへのア
クセス性能を向上させる。【解決手段】分散対象となるクラスを親クラスとして定
義し（１７，２７）、属性全てを継承する子クラスを定
義して、分散テーブルを作成するスクリプトの自動作成
を行い（１８，２８）、親クラスに対するグローバル検
索機能（２５）を備えて、検索時のテーブル分散の隠蔽
を行い、かつ分散テーブルを識別するための分散ＩＤ払
い出し用の分散管理手段（３）を設け、分散管理手段
（３）により分散ＩＤ払出しロジックを自由に設定し、
値域を利用したテーブル分割やハッシュ関数を利用した
テーブル分割（１１〜１３，２１〜２３）を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、料金処理や利用ロ
グの統計処理等の多量のデータを高速に処理する必要の
あるデータ処理の分野において、処理するデータを分散
して蓄積した後、処理を並列に行う並列処理方法および
並列処理システム、ならびに並列処理プログラムを記録
した記録媒体に関する。

【０００２】

【従来の技術】従来より、料金処理や利用ログの統計処
理等の多量のデータを高速に処理する必要があるシステ
ムにおいては、データを分散してデータ蓄積装置に蓄積
してから、それらのデータを並列に処理する方法が、処
理速度、設備コストおよび作業量から有効である。ま
た、その場合に、データ蓄積装置をアクセスするアプリ
ケーションとしては、分散されたデータを意識すること
なくアクセスできる仕組みが要求される。上記要求条件
を満たす技術として、例えばＯＲＡＣＬＥ社のＯＲＡＣ
ＬＥデータベースで提供されるパーティショニングとい
う技術がある。この技術では、データベースの１つのテ
ーブルをある属性の値域毎に小さな単位に分割して、そ
れをあたかも１つのテーブルのように見せることによ
り、アプリケーションがテーブルの分割を意識せずにア
クセスできるようにするものである。いま、あるテーブ
ルを月毎に１月、２月、３月、・・・・１２月と作成
し、パーティショニングでこれらを１月から１２月まで
の１つのテーブルに見せることで、アクセスすることが
可能である。この技術により、１つのテーブル当りのデ
ータ量を少なくすることができ、データ蓄積時にはイン
サート処理によるインデックス再作成負荷の軽減によっ
て蓄積性能を向上することができ、また検索時には値域
分割に使用した属性をキーに検索することにより、検索
範囲をテーブル単位に絞ることで検索性能を向上させる
ことができる。

【０００３】

【発明が解決しようとする課題】しかしながら、パーテ
ィショニングを利用したテーブルの分割は、属性の値域
毎の小さな単位への分割であり、属性の値域指定である
ために、並列処理時にデータを複数のテーブルへ均等に
分散したい場合には、属性の選択と値域の選択が難しい
という問題がある。また、パーティションテーブルを作
成するためのスクリプトは、テーブルの数だけデータベ
ース管理者が作成する必要があり、作業量が多くなると
いう問題もある。そこで、本発明の目的は、このような
従来の課題を解決し、分散したテーブルを作成するスク
リプトを自動作成することができ、かつ効率的にデータ
を蓄積でき、さらにデータベースにアクセスするアプリ
ケーションからテーブルの分散を隠蔽して、データベー
スへのアクセス性能を向上させることが可能な並列処理
方法および並列処理システム、ならびに並列処理プログ
ラムを記録した記録媒体を提供することにある。

【０００４】

【課題を解決するための手段】上記目的を達成するた
め、本発明の並列処理方法では、クラス定義を蓄積し
ているリポジトリ（ＣＡＳＥツール）において、分散対
象となるクラスを親クラスとして定義し、その属性の全
てを継承する子クラスを分散数分だけ定義することによ
り、分散したテーブルを作成するスクリプトを自動作成
する。また、親クラスに対するグローバル検索機能を持つこ
とにより、検索時のテーブル分散の隠蔽を可能にしてい
る。また、アプリケーションからテーブルの分散を意識す
ることなく蓄積・更新処理できるようにするため、分散
テーブルを識別するための分散ＩＤを払い出す分散管理
手段を設置している。上記分散管理手段において、分散ＩＤの払い出しロジ
ックを自由に設定できるようにして、値域を利用したテ
ーブル分割やハッシュ関数を利用したテーブル分割等を
可能にしている。

【０００５】

【発明の実施の形態】以下、本発明の実施例を、図面に
より詳細に説明する。図１は、本発明の一実施例を示す
並列処理方法の説明図であって、３分散のときにクラス
ＡとクラスＢが並列数３で処理を行う場合の機能ブロッ
クを示している。先ず、データベースの各々のテーブル
について説明すると、クラスＡ分散１からクラスＡ分散
３（１１〜１３）、およびクラスＢ分散１からクラスＢ
分散３（２１〜２３）は、クラスＡおよびクラスＢの属
性を全て継承する子クラスとしてリポジトリ上で定義す
ることにより、スクリプト自動作成手段１８，２８で作
成されたテーブル定義スクリプト（ＤＤＬ：Ｄａｔａ
ＤｅｆｉｎｉｔｉｏｎＬａｎｇｕａｇｅ）により作成
されたテーブルを表す。クラスＡ拡張ビュー１０および
クラスＢ拡張ビュー２０は、クラスＡおよびクラスＢを
検索するときに、分散を意識することなく検索処理を実
行することができるビューであり、スクリプト自動作成
手段１８，２８により作成される。

【０００６】次に、図１により処理フローを説明する。
処理データ７が蓄積系アプリケーシヨン８に送られる
と、蓄積系アプリケーション８では、この処理データの
各レコードに対して分散管理手段３に対して蓄積処理を
依頼する。分散管理手段３は、処理するデータを分割す
るときのキー情報となる分散対象ＩＤを基に、アクセス
するテーブルを決定するための分散ＩＤを決定して、そ
の分散ＩＤを基にクラスＡ分散１からクラスＡ分散３
（１１〜１３）のいずれかにそれらのレコードを蓄積す
る。集計手段１４〜１６は、クラスＡからクラスＢを作
成する手段であって、クラスＡのレコードを集計してク
ラスＢに蓄積する。この集計手段１４〜１６は、分散の
数だけ並列に動作することができる（ここでは並列
３）。クラスＡおよびクラスＢを検索する検索系アプリ
ケーション２５は、クラスＡ拡張ビュー１０およびクラ
スＢ拡張ビュー２０に対して検索を行うことにより、分
散を意識することなく検索処理が行える。クラスＡおよ
びクラスＢに対して蓄積や更新を行う蓄積更新系アプリ
ケーション５ａ，５ｂは、前述の蓄積系アプリケーショ
ン８と同じように、分散管理手段３に蓄積更新処理を依
頼することにより、クラスＡ分散１からクラスＡ分散３
（１１〜１３）、あるいはクラスＢ分散１からクラスＢ
分散３（２１〜２３）のいずれかに蓄積更新処理を行
う。これにより、テーブルの分散を意識することなく、
アクセスすることができる。

【０００７】図２は、本発明における値域分割の方法を
示すブロック図であり、図３は、本発明におけるハッシ
ュ関数による分割の方法を示すブロック図である。図２
および図３により、分散ＩＤを払い出すための分散管理
手段の処理を説明する。図２では、分散対象ＩＤの値域
分割で分散ＩＤを発行する方法の例が示されている。図
２に示すように、分散管理データベース６では、最小分
散対象ＩＤ、最大分散対象ＩＤ、および分散ＩＤを属性
としてデータを保持している。分散管理手段３は、蓄積
更新系アプリケーション５から蓄積更新処理を依頼され
ると、分散対象ＩＤをキーとして分散管理データベース
６を検索して分散ＩＤを取得し、アクセスするテーブル
を決定するとともに、蓄積更新処理を実行する。すなわ
ち、分散管理手段３によりｎ並列に分散されたクラスｍ
分散ｎ４に対して蓄積更新処理を実行する。この方法で
は、分散対象ＩＤがシーケンシャルに払い出されている
場合には、分散管理手段３が取得する分散ＩＤに偏りが
生じるため、特定のテーブルにアクセスが集中する危険
があり、適切な方法ではない。

【０００８】図３では、分散対象ＩＤから独自のハッシ
ュ関数等を使用して分散ＩＤを発行する方法が示されて
いる。分散ＩＤ払出手段９ではハッシュ関数等を実装し
ており、分散対象ＩＤを基にして分散ＩＤを払い出す。
ここでは、分散対象ＩＤを分散数で割った余りを返却す
る関数を用いるものとする。例えば、分散数が３の場合
で、分散対象ＩＤが１００であれば、分散ＩＤは１００
／３＝３３・・・１であるため返却は１となる。蓄積更
新系アプリケーション５から蓄積更新処理を分散管理手
段３に依頼すると、分散管理手段３は、分散対象ＩＤを
キーとして分散ＩＤ払出手段９の関数を呼出して分散Ｉ
Ｄを取得し、アクセスするテーブルを決定して、クラス
ｍ分散ｎ４に対して蓄積更新処理を実行する。なお、分
散対象ＩＤがシーケンシャルに払い出される場合でも、
この方法では複数テーブルに均一にアクセスが分散す
る。

【０００９】図４は、ＯＲＡＣＬＥのパーティショニン
グ機能と本発明におけるハッシュ関数による分割の併用
時のテーブルの概念図である。すなわち、図４では、図
３で説明した実施例とＯＲＡＣＬＥのパーティショニン
グ技術を併用した場合の例を示している。ＯＲＡＣＬＥ
のパーティショニング技術は値域分割が可能であるた
め、時系列データの月分割に適している。一方、図３に
示すハッシュ関数を用いた方法は、シーケンシャルに割
り当てられたＩＤを用いて複数テーブルに均等に蓄積す
る場合に適している。これらを併用すると、各分散テー
ブルをさらに月分割することが可能となり、さらに並列
性を高めることが可能となる。図４では、各分散テーブ
ルを有するクラスｍ分散ｎ４が、さらに１月〜１２月
（４１〜４３，・・・）に月分割されている。

【００１０】図５は、本発明におけるリポジトリの情報
をＯＭＴ法で表現した図である。ＯＭＴ法は、オブジェ
クト指向を使用してシステム分析や設計を進めるオブジ
ェクト指向分析／設計開発方法論の１つである。なお、
参考文献としては、例えば、『オブジェクト指向方法論
ＯＭＴモデル化と設計』Ｊ．ランボー／Ｍ．ブラハ／
Ｗ．プレメラニ／Ｆ．エディ／Ｗ．ローレンセン著、羽
生田栄一監訳、トッパン、ＩＳＢＮ４−８１０１−８５
２７−３がある。ここで、ＣｌａｓｓＡ（６０）は、Ｃ
ｌａｓｓＡｄｉｓｔ１（６１）、ＣｌａｓｓＡｄｉｓｔ
２（６２）、およびＣｌａｓｓＡｄｉｓｔ３（６３）を
サブクラスに持つクラスである。また、ＣｌａｓｓＡ
（６０）は属性として、ｉｔｅｍ１，ｉｔｅｍ２を持っ
ており、これらの属性は各サブクラス６１〜６３にも継
承される。なお、ｉｔｅｍ１はキー属性とする。

【００１１】図６は、図５に示すクラス定義を基に、ス
クリプト自動作成手段を用いて作成したデータベースの
テーブル定義スクリプトの図である。図６において、最
初の〜は、ＣｌａｓｓＡｄｉｓｔ１，ＣｌａｓｓＡ
ｄｉｓｔ２，ＣｌａｓｓＡｄｉｓｔ３の各テーブルを作
成する部分であって、それぞれにｉｔｅｍ１，ｉｔｅｍ
２が記述されている。次の〜は、ＣｌａｓｓＡｄｉ
ｓｔ１，ＣｌａｓｓＡｄｉｓｔ２，およびＣｌａｓｓＡ
ｄｉｓｔ３のｉｔｅｍ１をユニークキーとするインデッ
クスを作成する部分である。次のは、ＣｌａｓｓＡ配
下の検索機能を提供する拡張ビューを作成する部分であ
る。この拡張ビューを用いることにより、分散をまたが
った検索が可能である。このように、リポジトリ上で分
散対象となるクラスを親クラスとして、その属性を全て
継承する子クラスを分散対象数分定義することによっ
て、並列処理に使用するテーブル定義スクリプトを自動
的に作成することが可能になる。なお、図１の太線で囲
まれた部分１，２、つまりクラスＡ，Ｂ拡張ビュー１
０，２０、クラスＡ分散１，２，３（１１〜１３）、お
よびクラスＢ分散１，２，３（２１〜２３）は、このテ
ーブル定義スクリプトを実行することにより作成された
ことを示している。

【００１２】図１に示すような本発明の並列処理方法、
すなわち処理データ７を蓄積系アプリケーシヨン８に送
出することにより、蓄積系アプリケーション８は、この
処理データの各レコードに対して分散管理手段３に対し
て蓄積処理を要求し、分散管理手段３は、処理するデー
タを分割するときのキー情報となる分散対象ＩＤを基
に、アクセスするテーブルを決定するための分散ＩＤを
決定して、その分散ＩＤを基にクラスＡ分散１からクラ
スＡ分散３（１１〜１３）のいずれかにそれらのレコー
ドを蓄積し、集計手段１４〜１６は、クラスＡからクラ
スＢを作成することにより、クラスＡのレコードを集計
してクラスＢに蓄積する、という一連の処理ステップを
プログラムに変換した後、この並列処理プログラムを記
録媒体に格納する。この記録媒体を設置した任意の場所
でこのプログラムを実行することにより、容易に本発明
の並列処理方法が実現される。

【００１３】

【発明の効果】以上説明したように、本発明によれば、
分散管理手段によりデータベーステーブルの値域分割
やハッシュ関数等による分割が可能となるので、容易に
並列処理が行える。また、分割された複数のテーブル
に対して、アプリケーションは意識することなくアクセ
スが可能となる。さらに、クラス情報を保持するリポ
ジトリにおいてクラス定義を行うことにより、並列処理
に用いるデータベースに複数のテーブルを作成するため
のスクリプトを自動作成することが可能になる。

【図面の簡単な説明】

【図１】本発明の一実施例を示す並列処理方法の機能ブ
ロック図である。

【図２】本発明における値域分割の説明図である。

【図３】本発明におけるハッシュ関数による分割の説明
図である。

【図４】ＯＲＡＣＬＥのパーティショニング機能と本発
明におけるハッシュ関数による分割の併用時のテーブル
の概念図である。

【図５】本発明のリポジトリの情報をＯＭＴ法で表現し
た図である。

【図６】図５におけるクラス定義を、スクリプト自動作
成手段を用いて作成した場合のデータ定義スクリプトの
図である。

【符号の説明】

１，２…テーブル定義スクリプトを実行することにより
作成された並列処理、３…分散管理手段、４…クラスｍ
分散ｎ、５…蓄積更新系アプリケーション、６…分散管
理データベース、７…処理データ、８…蓄積系アプリケ
ーション、１０…クラスＡ拡張ビュー、１１〜１３…ク
ラスＡ分散１，２，３、２０…クラスＢ拡張ビュー、２
１〜２３…クラスＢ分散１，２，３、５ａ，５ｂ…蓄積
更新系アプリケーション、１４，１５，１６…集計手
段、１７，２７…リポジトリ定義クラスＡ，Ｂ、９…分
散ＩＤ払出手段、１８，２８…スクリプト自動作成手
段、２５…検索系アプリケーション、４１，４２，４３
…月分割された分散テーブル、６０…クラス、６１〜６
３…サブクラス。

Claims

【特許請求の範囲】

【請求項１】蓄積装置に分散してデータを蓄積し、該
蓄積装置から読み出したデータを演算処理部により並列
に処理する並列処理方法において、クラス定義を蓄積しているリポジトリにより、分散対象
となるクラスを親クラスとして定義し、かつ該親クラス
が持つ属性全てを継承する子クラスを分散数分定義する
ことにより、分散したテーブルを作成するスクリプトを
自動的に作成し、該親クラスに対するグローバル検索を行うことにより、
検索時のテーブル分散を隠蔽し、該分散テーブルを識別するための分散ＩＤを払い出す分
散管理手段により、アプリケーションからテーブルの分
散を意識させることなく蓄積あるいは更新処理を行うこ
とを特徴とする並列処理方法。
【請求項２】請求項１に記載の並列処理方法におい
て、前記分散管理手段は、分散ＩＤの払出しにハッシュ関数
を利用することを特徴とする並列処理方法。
【請求項３】蓄積装置に分散してデータを蓄積し、該
蓄積装置から読み出したデータを演算処理部により並列
に処理する並列処理システムにおいて、複数のテーブルを隠蔽し、アプリケーションに意識させ
ることなく分散テーブルにアクセスさせるため、該分散
テーブルを識別するための分散ＩＤを払い出す分散管理
手段と、並列処理に使用される複数のテーブルをデータベース上
に作成するためのスクリプトを自動的に作成するため、
クラス情報を保持するリポジトリにおいてクラス定義を
行うことにより自動作成するスクリプト自動作成手段と
を有することを特徴とする並列処理システム。
【請求項４】請求項１または２に記載の並列処理方法
に記述した各処理ステップをプログラムに変換し、該並
列処理プログラムを格納することを特徴とする記録媒
体。