JP3003440B2 - 負荷分散制御方法および分散処理システム - Google Patents
負荷分散制御方法および分散処理システムInfo
- Publication number
- JP3003440B2 JP3003440B2 JP5006430A JP643093A JP3003440B2 JP 3003440 B2 JP3003440 B2 JP 3003440B2 JP 5006430 A JP5006430 A JP 5006430A JP 643093 A JP643093 A JP 643093A JP 3003440 B2 JP3003440 B2 JP 3003440B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- business
- processing
- load
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2035—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/466—Transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/40—Network security protocols
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
Description
機で分担して処理する分散処理システムに関し、特にオ
ンラインの計算機負荷をオーバヘッドなしに調整する負
荷分散制御方式に関する。
を持つ複数の業務を処理する計算機システムに好適であ
る。例えば、株取引業務では、取引開始後の一定時間帯
または取引終了前の一定時間帯の取引量は、通常時の取
引量に比べ2倍以上となる。そこで、計算機の能力に余
裕のある通常時間帯に、他の負荷の重い計算機から株取
引を処理する計算機に業務を移動して処理させる。これ
により、分散計算機システムの効率の良い運用が可能に
なる。
業務は、業務毎の負荷最大値をもとにシステム設計によ
って決定し、各業務を処理する計算機は基本的に固定さ
れているものが多い。この場合の負荷分散は、予め各計
算機の処理可能な業務を登録しておき、その交代可能な
範囲において、外部からの業務を最も実行負荷の低い計
算機に分担したり(特開昭62−245361号公報)、一定期
間ごとに各計算機の負荷率を求めて均等化するように業
務分担を変更したり(特開平1−283663 号公報)してい
る。
計算機がどの業務でも処理できるようにシステム構成し
ておき、発生した業務の処理開始前に、各計算機の負荷
率を比較し最も低い計算機の該当タスクを起動するもの
(特開昭58−151666号公報)などがある。
計算機の関係が固定的な場合は、業務処理の遅延,レス
ポンス低下を避けるために、計算機の負荷が常に100
%以内になるようにハード構成を取る(例えば1計算機
に1業務タスクを割り当てるなど)必要があり、システ
ムのコストパフォーマンスが低下する。
合には、実行中の各計算機の負荷率をそのつど求め、負
荷分散するように業務分担の決定や変更を行うので、決
定や変更が頻繁に行われる場合にはこの処理時間が無視
できなくなる。特に外部から発生したトランザクション
を負荷の低い計算機に転送する場合には、転送先計算機
を判断する判断ノードが必要で、このノードに処理が集
中して処理遅れを発生させるため、オンラインリアルタ
イム処理を要求される分野では適用できない。本発明の
目的は、オンラインでの業務分担の決定や変更に判断を
要しない、瞬時に処理できる負荷分散制御方法を提供す
ることにある。
ムの状態などに的確に対応して業務分担の決定や変更が
できる負荷分散制御方法を提供することにある。
理業務が相違する場合にも、計算機と業務の分担を自動
的に変更でき、コストパフォーマンスの高い、リアルタ
イム処理可能な分散処理システムを提供することにあ
る。
て明らかになる。
複数の業務と複数の計算機の組合わせを予め定めた組合
わせパターンを複数用意し、使用する組合わせパターン
を選択データによって瞬時に変更できるようにしたとこ
ろにある。
である運行管理データに、複数の組合わせパターンの使
用予定時間を設定しておき、各計算機は使用予定時間に
対応する所定の組合わせパターンから、自己の処理業務
を自律的に選択できるようにしたところにある。
負荷などの場合にバックアップする組合わせパターンを
複数用意しておき、該当計算機に応じて所要の組合わせ
パターンに変更できるように、選択データを定めている
ところに特徴がある。
の所定の計算機に、計算機各々の処理可能な登録業務に
基づいて、各計算機へ業務を割当る複数の業務マッピン
グテーブルと、所要の業務マッピングテーブル群を予め
定めた選択データによって自動的に選択,配送する業務
割当機能を設けているところにある。選択データには、
使用する業務マッピングテーブルを時間的に定義した運
行管理テーブルがある。
の計算機の1つに、業務マッピングテーブルや運行管理
テーブルの定義機能、及びこれらの定義を容易にするた
めに、収集した処理実績データに基づく負荷特性定義機
能、さらには定義内容のシミュレート機能を有する運行
計画作成支援機能を具備しているところにある。
ように構成される。
となる複数の計算機でネットワークを構成し、管理ノー
ドからの業務割当データに従い複数の業務を各処理ノー
ドで分担して処理する分散処理システムにおいて、前記
管理ノードは、業務と処理ノードの組合せを定めた複数
の業務マッピッグテーブルと該業務マッピングテーブル
の使用を時系列に定めた運行管理テーブルを記憶する運
行計画記憶手段と、前記運行管理テーブルと該テーブル
に名称が設定されている所定の業務マッピングテーブル
群を選択し、これらの業務割当データを各処理ノードに
配送する業務割当機能を有する処理手段を具備し、前記
処理ノードは、前記配送された業務割当データを記憶す
る業務割当データ記憶手段と、該記憶手段の運行管理テ
ーブルに基づいて所定の業務マッピングテーブルを参照
し、受信したトランザクションを自ノードで処理すべき
か否かを自律的に判断する処理業務選択機能を有する処
理手段とを具備している。
ーブルを記憶し、前記業務割当機能は設定される運行管
理テーブル選択データに基づいて配送する運行管理テー
ブルを選択する。その際の選択データの1は曜日であ
り、前記業務割当機能は曜日に対応する運行管理テーブ
ルを自動選択可能に構成する。
ドで実行中の業務に異常を検出した場合に、前記業務マ
ッピングテーブルから当該業務の登録を取消して各処理
ノードに再送する縮退機能を有している。また、処理手
段は、自動編集される負荷特性(負荷率)を参照して、
業務マッピングテーブルや運行管理テーブルを画面表示
しながら定義する運行計画作成支援機能を具備する。
は、業務マッピングテーブルを選択する運行管理テーブ
ルに代えて、所定の計算機が障害や過負荷の場合に、こ
の計算機の業務をバックアップする業務マッピングテー
ブルを選択するデータを設定可能に構成する。
計算機は組合せパターン、例えば業務マッピングテーブ
ルを参照することにより、実行すべき業務を自律的に選
択する。この業務マッピングテーブルは、異なる業務割
当てのパターンを定義した複数のものが用意され、各計
算機は参照する業務マッピングテーブルを適宜変更し、
各計算機が処理する業務をダイナミックに変更する。
ピングテーブルの変更を自動的に選択する手段として、
たとえば時間的に選択順序を定めた運行管理テーブルに
従って、参照する業務マッピングテーブルを変更し、実
行すべき業務を時間の推移に応じて変更する。この時間
のスケールは分,時間,日など任意に取ることができ、
通常は1日単位で設定し、これを曜日などによる負荷特
性の特異日ごとに複数のテーブルに記憶し、自動/手動
により設定される曜日や祭日などの選択データによって
運用当日の使用テーブルを決定する。
当該計算機をバックアップするマッピングテーブルの関
係を定めておき、イベントの発生によって参照する業務
マッピングテーブルを変更する。これにより、業務タス
クの処理継続が可能となり、システムの耐障害性を向上
することができる。
性を処理実績から自動的に定義するとともに、この負荷
特性を参照してユーザが定義した各テーブルを検証する
ために、定義テーブルによる各計算機への負荷分散状況
をシミュレートする。ユーザは、負荷分散状況をシミュ
レートしながら、対話的に業務マッピングテーブル,運
行管理テーブルを定義することが可能となる。
説明する。図1は本発明を実現するシステム構成図であ
る。計算機1〜5は伝送路6で接続され、分散処理シス
テムを構成している。計算機1はシステム全体の負荷分
散の管理を行う管理ノードで、入出力インターフェイス
となるコンソール7と記憶装置8を具備している。計算
機2〜5は実際の業務処理を行う処理ノードである。こ
こで負荷分散管理も1つの業務として扱えば、管理業務
を実行するノードを他のノードに変更することができ、
また、1つの処理ノードに管理業務と通常の業務の処理
を共存させることも可能である。
いる業務割当データを選択して各処理ノードに配送する
業務割当て機能9と、負荷特性定義機能11a,業務マ
ッピング定義機能11b,運行管理テーブル定義機能1
1c及び負荷シミュレーション機能11dを有して複数
の業務割当データを定義する運行計画作成支援機能11
と、各処理ノードの処理実績を収集して負荷特性を演
算,編集する負荷特性編集機能12と、業務異常や処理
ノードの異常や過負荷などを検出するシステム稼働状態
監視機能13を備えている。業務割当機能9には、業務
異常に応じて当該業務を縮退させる縮退機能10を有し
ている。なお、本実施例における業務割当データとは、
業務マッピングテーブル及び運行管理テーブルに定義さ
れるデータからなる。
記憶装置15を具備している。記憶装置15はファイル
AとファイルBを有し、管理ノード1から受信した業務
割当データは後述する業務割当データ更新機能16によ
り、現用と更新用に切替可能に記憶される。
タから各時間帯で自系が処理する業務を選択し、受信し
たトランザクションの処理要否を判断する処理業務選択
機能17、後述する負荷特性定義の基礎データを得る負
荷測定機能18を有している。
的に説明するもので、縦軸に業務名、横軸に処理ノード
をとり、各業務を処理するノードにフラグを設定(○
印)して、システム内業務分担の組合わせパターンを定
義する。この組合わせパターンは任意に複数の定義がで
き、a1〜aiのテーブルを記憶する。
テムが各時間帶で使用する業務マッピングテーブル名
(a1〜ai)を定義している。運行管理テーブルも、b
1〜bjの複数パターンが用意され、たとえば特異日など
の負荷特性に応じて定義される。時間のスケールは任意
にとり得るが、通常は一日単位で作成することが多い。
次に、本システムの動作を説明する。図4は、管理ノー
ド1の業務割当て機能9と、処理ノードの業務割当デー
タ更新機能16相互の処理フローの概略を示したもので
ある。
定された運行管理テーブル名称(b1〜bj)を受信し
(s101)、記憶装置8から該当の運行管理テーブル
を読みだす(s102)。運行管理テーブル名称はコン
ソール7からの指定によらず、たとえばテーブル名称と
使用曜日の対応表などを備えて自動的に指定することも
可能である。読みだされた運行管理テーブルbjに登録
されている複数の業務マッピングテーブル名から、対応
する業務マッピングテーブルa1〜aiを読みだし(s1
03)、これらbj,a1〜aiのテーブル群を処理ノード
1〜nに送信する(s104)。
ド1から受信した運行管理テーブルbjと業務マッピン
グテーブルa1〜aiを、最初はファイルAに、つぎは更
新用ファイルBに格納する(s105)。そして、管理ノ
ード1からの変更通知(A→B)の受信によってアクセ
スするファイルを現用から更新用へ切替る(s106)。
切替後はファイルBの割当データが現用として参照され
る。一方、ファイルAは更新用とされ、必要に応じ上記
s101〜s105の手順で更新される。
イルA,Bを切替ることで瞬時に実現でき、オンライン
状態を維持したままで可能になる。従って、本システム
の処理ノードは予め全てのテーブルをもっている必要は
なく、たとえば当日分をファイルAに、翌日分を切替前
の適当な時期(業務の閑なときなど)にファイルBに配
送しておけばよい。もちろん、ファイルを多数用意し、
切替のタイミングや切替の対象をさらに細分化すること
も可能である。
る新定義テーブル群の配送を例に、s104〜s106
の具体的な手続を示したものである。管理ノード1はテ
ーブル群変更通知を各処理ノードに通知し、各ノードか
らのアンサーを受信する(s201)。修正した業務マ
ッピングテーブルや運行管理テーブルを各ノードに配信
する(s202)。各処理ノードでは、現用テーブル群と
は別領域(ファイルB)に新テーブル群を蓄積し、完了
後、蓄積完了通知を管理ノード1に送信する(s20
3)。管理ノードは全ノードからの蓄積完了通知を受信
した後、同期を取る(s204)。管理ノードは、テーブ
ル群変更終了通知を送出する(s205)。各ノードはテ
ーブル群変更終了通知を受信後、現用テーブル群エリア
への業務処理アクセスを抑止し(s206)、現用テー
ブル群番号を新ファイル名(A→B)に変更(s20
7)し、現用テーブルエリアへの業務処理アクセス抑止
を解除する(s208)。この例で、ファイルBは全テ
ーブルの更新をされるが、管理ノード1から変更テーブ
ル名を送信しそのテーブルのみ更新するようにし、その
他のテーブルは自系内でファイルAから転送するように
してもよい。
s208でアクセス先を切換える間の極めて短時間です
み、各処理ノードはオンライン処理を維持しながら、新
テーブル群による処理へ移行することができる。これに
よって、トラフイック仕様変更が頻繁なシステムの稼働
率を向上できる。
画作成支援機能11(ブロック1)と負荷特性編集機能
12(ブロック3)及び、処理ノード2〜5の処理業務
選択機能17(ブロック2)の手続を相互関係で示した
ものである。
務マッピングテーブル8aや運行管理テーブル8bの作
成を支援する。まず、記憶装置8の負荷特性データファ
イル8cから負荷特性データを読出して、この内容ある
いはユーザによる修正を行って業務毎の負荷特性を定義
する(s301)。つぎにユーザの入力に従って、複数
の業務マッピングテーブル(s302)、所定の運行管
理テーブルの定義がおこなわれる(s303)。この結
果を合成して各ノードの負荷状態をシミュレートし(s
304)、各ノード間の負荷バランスが妥当であれば
(s305)、業務マッピングテーブルファイル8aと
運行管理テーブルファイル8bを更新する(s30
6)。なお、s307は上記の業務割当て機能9による
処理である。
理ノード1から送信され自系の業務割当データ記憶装置
15に格納されている業務マッピングテーブル8a,運
行管理テーブル8bに従い、処理すべき業務を選択す
る。まず、自系が受信したトランザクションを取り出す
(s401)。つぎにシステム時刻に基づいて運行管理
テーブルを参照し、当該時刻の業務マッピグテーブルを
選択する(s402)。受信したトランザクションが、
当該マッピングテーブルに割当られている本ノードの業
務であるか判断し(s403),対象業務であれば処理
する(s405)。なお、処理すべき業務のトランザク
ションでなければ受け捨てる。
は、運行管理及び業務マッピングの2つのテーブルデー
タとなっている。しかし、管理ノード1で予め、運行管
理テーブルから必要な業務マッピングテーブルを選択
し、これを配信するようにしてもよい。この場合の業務
マッピングテーブルの変更は、運行管理テーブルに基づ
いて変更時刻に、管理ノードから各処理ノードに選択デ
ータ(変更テーブル名称)を送信して行う。
り、運行計画を定義する場合の具体的な手順を説明す
る。図7は、運行計画の手順を画面1〜5で示したもの
で、図6のブロック1と対応する。
性データファイル8cから読みだされた内容が表示さ
れ、必要に応じユーザが変更する。
面で、画面1を参照しながら、業務と処理ノードの組合
わせパターンが定義される。この場合、異なる組合わせ
のパターンも複数定義される。また、1ノードが複数の
業務を並行処理したり、1業務を複数のノードで分担す
るようにも定義できる。
画面1,2を参照しながら、各時間帯で実行する業務マ
ッピングテーブルを定義する。画面2と3は相互に関連
しているので、試行錯誤される場合もあり定義順序は固
定的なものではない。
負荷特性,運行管理テーブル及び業務マッピングテーブ
ルを基に、各ノードの業務負荷率の時間推移を編集して
表示する。これより、定義された業務計画による各ノー
ドの負荷状態が一目瞭然となる。この結果、ノード間の
負荷の片寄りが目立つ場合には、上記の手続を繰り返し
て再定義し、負荷バランスを修正する。修正が終わる
と、管理ファイル8の格納内容を新テーブルに更新す
る。
り、ユーザはこの画面を介して上記の操作を繰り返した
り、他の画面を参照したりする。また、画面1〜画面3
を同時に表示するようにしてもよい。
ブル及び運行管理テーブルは、管理ノード1から全処理
ノードへと配信される。この配信は、システム立ち上げ
以外はオンラインで処理される。各処理ノードは、業務
割当データ更新機能16で配信されたテーブルを現用に
切替、ブロック2(図6)の処理業務選択機能17にし
たがい自系が処理する業務を選択,処理する。このと
き、s402の処理の度に業務マッピングテーブルを選
択するのではなく、運行管理テーブルに基づき業務マッ
ピングテーブル名の変更時刻に、対応する業務マッピン
グテーブル(当該ノードの業務)を予め選択しておくこ
とで、s402の処理時間を短縮できる。なお、ノード
間で業務を移動するにはリソースの引継が必要となる。
しかし、本実施例では各ノードの移動業務は予めテーブ
ルにより設定されるので、ノードの所有するリソースの
範囲で、すなわち、ノードの処理能力に応じて分担すれ
ばよく、リソースの引継ぎは必要ない。これによりシス
テム構成が柔軟になり、コストパフォーマンスも向上で
きる。もちろん、データベースサーバ等のデータ共有ノ
ードをシステム内に確保し、データをどこからでも取り
出せるシステム構成とすることにより、リソース引継を
不要とすることもできる。
は、業務を分散システム内の計算機間で適宜移動させる
ことにより、計算機のリソースを有効に利用しながら、
各計算機にバランスよく負荷を分散し、システムを効率
よく稼働できる。
量が変更される場合にも柔軟に対応できる。図8は業務
1〜3の処理システムにおいて、業務2の負荷が従来の
2倍に拡張される例を示している。本実施例によれば、
業務3の割当てをノード1に変更することにより、すな
わち、現用の業務マッピングテーブルAを、運行計画作
成支援機能によりメンテナンスされた新たな業務マッピ
ングテーブルA′に更新するのみで、システム拡張に簡
単に対応できる。この例の運行管理テーブルは、使用す
る業務マッピングテーブルがAのみなので変更はない。
能である。管理ノード1は周知のシステム稼働状態監視
機能13により、実行中の業務nに異常を検知(図9の
業務マッピングテーブル参照)すると、業務割当機能9
を補足する縮退機能10により、該当する業務マッピン
グテーブルについて、業務nの処理ノードを取り消す
(○→−)。そして当該テーブルを各処理ノードに転送
し入れ替えを行う。これにより、ある業務に異常が検知
された場合の機能縮退が可能となる。なお、縮退する業
務nを管理ノード1の縮退機能13から各処理ノードに
通知し、各処理ノードの処理業務選択機能17は業務n
が選択される場合に、これを実行しないようにしてもよ
い。
がら説明する。同図は処理ノードダウン時のバックアッ
プノードを付加した業務マッピングテーブルを示す。
「○」は処理ノードが当該業務を行うことを示す。処理
ノード1を例に取ると、これは業務1のみを行うよう定
義してある。「△」はバックアップとして当該業務を行
うことを示す。例えば、業務1を処理するのは処理ノー
ド1であるが、そのダウン時には処理ノード2が業務1
をバックアップすることを示している。「−」はその業
務に関しては何も行わないことを示す。
は、自系の業務を図6のブロック2(s402)に従っ
て判断し、自ノードが当該業務のバックアップノードに
指定されていれば(△指定)、本来の処理ノードがダウ
ンしている場合のみ当該トランザクションを処理する
(s403,404)。なお、処理ノードのダウンは、
管理ノードのシステム状態監視機能13により検出さ
れ、連絡される。これにより、障害を起こした処理ノー
ドで処理されていた業務のバックアップを行うことが可
能になり、分散システムの耐障害性が向上する。このよ
うな業務マッピングテーブルを複数備え、運行管理テー
ブルによって選択可能に構成することは、第1の実施例
の場合と同じである。
特性編集機能12を、図6のブロック3のフローによっ
て説明する。負荷特性編集機能12は、各処理ノードの
処理実績をネットワーク6を介して定期的に収集する
(s501)。なお、各処理ノードは負荷測定機能18
を備え、自ノードで処理したトランザクションの処理実
績(所定時間毎の業務処理回数)を蓄積(s406)し
ている。
(数1)により、時刻ti における平均負荷率ρi (%)
を算出し(s502)、これを時系列の負荷特性データ
として編集しファイル8cに格納する(s503)。こ
の例を図10に示す。
荷率(テスト段階で計測の数値)このように本実施例で
は、管理ノード1に負荷特性編集機能12を備え、各処
理ノードの実績データに基づく負荷特性が自動的に収集
され、業務毎に演算,編集されている。したがって、運
行計画を作成するときの負荷特性定義は、過去の実績を
ファイル8cから読出すのみで自動的に定義できる。
ピングテーブルの変更は、時間的に定めた運行管理テー
ブルで行うように構成されているが、これに限られるも
のではない。業務マッピングテーブルなど、業務と計算
機の関係を定めた複数の組合わせパターンの選択は、各
処理ノードの負荷率のリミットオーバ(過負荷)やダウ
ン(障害)などのイベント種別に応じて、予めノードと
選択すべき組合わせパターン(名称)の関係を定めてお
き、イベントの発生時に該当ノードに対応する組合わせ
パターンを選択するようにしても可能である。この選択
は管理ノード1で行われ、選択データ(パターン名称)
が各処理ノードに通知される。
処理ノードの負荷測定機能18は当該ノードの負荷率が
所定時刻毎に求めていて、予め定めた上限値を超える場
合に管理ノード1に通知する。管理ノード1はこの状態
をシステム監視機能13で検知し、業務割当機能9を起
動する。機能9は機能13から負荷率オーバの処理ノー
ドを連絡され、当該ノードの所定業務を分散する他の業
務マッピングテーブルを選択し、変更通知とともに送信
する。当該テーブルが既に配送されている場合は変更テ
ーブル名を送信する。各処理ノードの業務割当データ更
新機能16や処理業務選択機能17によって、上記の業
務の変更処理がオンラインで実行される。
1の監視機能13で常時監視されているので、過負荷の
場合と同様に処理できる。これ以外にも、所定の目的を
達成する複数の条件ごとに組合わせパターン(業務マッ
ピングテーブル)を用意しておき、条件の検知または設
定によって対応するパターンを選択する構成とすること
で、広範なアプリケーションへの適用が可能になる。
よって管理しているが、これに限られるものではない。
複数の業務と複数の計算機の割当を、推論ルール群やプ
ログラムを用いて決定することも可能である。
前に決まるため、高トラフィック,高レスポンスの負荷
分散処理が可能になる。
可能とし、システムリソースを有効に利用することがで
き、コストパフォーマンスの高い分散処理システムを実
現できる。
フトウエア(テーブル)の変更により簡単に行えるの
で、システム構成が柔軟になる。
ップあるいは処理業務異常時の機能縮退も、マッピング
テーブルの変更で簡単に実行できるので、システムの耐
障害性が向上する。
収集し、このデータに基づいて負荷を分散する業務割当
計画の作成を支援するので、業務計画が容易で、システ
ム効率のよい負荷分散が可能となる。
図。
理を説明するフローチャート。
理業務選択機能を説明するフローチャート。
管理テーブルの定義を、ユーザが対話的に行う場合の画
面遷移図。
テーブルの概念図。
性の一例を示すタイムチャート。
9…業務割当機能、11…運行計画作成支援機能、16
…業務割当データ更新機能、17…処理業務選択機能。
Claims (9)
- 【請求項1】管理ノードとなる1の計算機と処理ノード
となる複数の計算機でネットワークを構成し、管理ノー
ドの指示に従い複数の業務を各処理ノードで分担して処
理する分散処理システムにおいて、 前記管理ノードは、業務と処理ノードの組合わせを定め
た複数の組合わせパターンを記憶する運行計画記憶手段
と、所定の選択データにより前記複数の組合わせパター
ンの中から所定の組合わせパターンを選択し各処理ノー
ドに配送する業務割当手段を具備し、 前記処理ノードは、前記管理ノードから配送された組合
わせパターンに基づいて、受信したトランザクションを
自ノードで処理すべきか否か判断する処理業務選択手段
を具備していることを特徴とする分散処理システム。 - 【請求項2】前記選択データは、所定の計算機が障害の
場合に、この計算機の業務をバックアップする所定の組
合わせパターンを選択するものであることを特徴とする
請求項1記載の分散処理システム。 - 【請求項3】前記選択データは、所定の計算機の負荷率
が所定の基準を超える場合に、この計算機の負荷を他に
分散させる所定の組合わせパターンを選択するものであ
ることを特徴とする請求項1記載の分散処理システム。 - 【請求項4】前記選択データは、負荷分散によって所定
の目的を達成するための条件が複数ある場合に、設定さ
れた所定の条件に対応する所定の組合わせパターンを選
択するものであることを特徴とする請求項1記載の分散
処理システム。 - 【請求項5】管理ノードとなる1の計算機と処理ノード
となる複数の計算機でネットワークを構成し、管理ノー
ドからの業務割当データに従い複数の業務を各処理ノー
ドで分担して処理する分散処理システムにおいて、 前記管理ノードは、業務と処理ノードの組合わせを定め
た複数の業務マッピッグテーブルと該業務マッピングテ
ーブルの使用を時系列に定めた運行管理テーブルを記憶
する運行計画記憶手段と、前記運行管理テーブルと該テ
ーブルに名称が設定されている所定の業務マッピングテ
ーブル群を選択し、これらの業務割当データを各処理ノ
ードに配送する業務割当手段を具備し、 前記処理ノードは、前記配送された業務割当データを記
憶する業務割当データ記憶手段と、該記憶手段の運行管
理テーブルに基づいて所定の業務マッピングテーブルを
参照し、受信したトランザクションを自ノードで処理す
べきか否かを判断する処理業務選択手段を具備している
ことを特徴とする分散処理システム。 - 【請求項6】前記運行計画記憶手段は複数の運行管理テ
ーブルを記憶し、前記業務割当手段は設定される運行管
理テーブル選択データに基づいて配送する所定の運行管
理テーブルを選択することを特徴とする請求項5記載の
分散処理システム。 - 【請求項7】前記業務割当手段は、各処理ノードで処理
中の業務の異常を検出した場合に、前記業務マッピング
テーブルから当該業務の登録を取消して各処理ノードに
再送する縮退機能を有していることを特徴とする請求項
5記載の分散処理システム。 - 【請求項8】前記管理ノードは、各処理ノードから収集
される処理実績に基づいて業務ごとの時系列負荷特性
(負荷率)を定義し、該負荷特性を参照して前記業務マ
ッピングテーブルおよび/または前記運行管理テーブル
を画面表示しながら定義する運行計画作成支援手段を具
備していることを特徴とする請求項5記載の分散処理シ
ステム。 - 【請求項9】前記処理ノードは、前記管理ノードから新
たな業務マッピングテーブルおよび/または運行管理テ
ーブルを受信した場合に、前記業務割当データ記憶装置
の既に記憶しているテーブルとは別領域に記憶するよう
になし、前記管理ノードからの切替通知により以後のア
クセス先を前記別領域とする業務割当データ更新手段を
有することを特徴とする請求項5記載の分散処理システ
ム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5006430A JP3003440B2 (ja) | 1993-01-19 | 1993-01-19 | 負荷分散制御方法および分散処理システム |
GB9400167A GB2274345B (en) | 1993-01-19 | 1994-01-06 | A method of exeucuting a plurality of transactions and a distributed processing system for performing such a method |
US08/787,357 US5778224A (en) | 1993-01-19 | 1997-01-22 | Method of executing a plurality of transactions and a distributed processing system for performing such a method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5006430A JP3003440B2 (ja) | 1993-01-19 | 1993-01-19 | 負荷分散制御方法および分散処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06214962A JPH06214962A (ja) | 1994-08-05 |
JP3003440B2 true JP3003440B2 (ja) | 2000-01-31 |
Family
ID=11638180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5006430A Expired - Fee Related JP3003440B2 (ja) | 1993-01-19 | 1993-01-19 | 負荷分散制御方法および分散処理システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US5778224A (ja) |
JP (1) | JP3003440B2 (ja) |
GB (1) | GB2274345B (ja) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123747A (ja) * | 1994-10-20 | 1996-05-17 | Fujitsu Ltd | 施設管理システムにおける分散処理方式 |
US5687372A (en) * | 1995-06-07 | 1997-11-11 | Tandem Computers, Inc. | Customer information control system and method in a loosely coupled parallel processing environment |
US5630133A (en) * | 1995-06-07 | 1997-05-13 | Tandem Computers, Incorporated | Customer information control system and method with API start and cancel transaction functions in a loosely coupled parallel processing environment |
US7130823B1 (en) | 1995-09-14 | 2006-10-31 | Citibank Aktiengesellschaft | Computer system for data management and method for operation of the system |
JP3847364B2 (ja) * | 1996-02-14 | 2006-11-22 | 富士通株式会社 | ロードシェアシステム |
US6128657A (en) * | 1996-02-14 | 2000-10-03 | Fujitsu Limited | Load sharing system |
JPH09305551A (ja) * | 1996-05-10 | 1997-11-28 | Toshiba Corp | 並列計算機システム |
JPH1049579A (ja) * | 1996-07-31 | 1998-02-20 | Mitsubishi Electric Corp | 業務代行システム |
US6026404A (en) * | 1997-02-03 | 2000-02-15 | Oracle Corporation | Method and system for executing and operation in a distributed environment |
US6710786B1 (en) | 1997-02-03 | 2004-03-23 | Oracle International Corporation | Method and apparatus for incorporating state information into a URL |
US6845505B1 (en) * | 1997-02-03 | 2005-01-18 | Oracle International Corporation | Web request broker controlling multiple processes |
US6098067A (en) * | 1997-05-02 | 2000-08-01 | Kabushiki Kaisha Toshiba | Remote computer management system |
JPH1153326A (ja) * | 1997-07-30 | 1999-02-26 | Internatl Business Mach Corp <Ibm> | 分散処理システム、クライアントノード、サーバノードおよび分散処理方法 |
US6334114B1 (en) | 1997-10-31 | 2001-12-25 | Oracle Corporation | Method and apparatus for performing transactions in a stateless web environment which supports a declarative paradigm |
US6393409B2 (en) | 1997-10-31 | 2002-05-21 | Morgan Stanley Dean Witter & Co. | Computer method and apparatus for optimizing portfolios of multiple participants |
JPH11261702A (ja) * | 1998-03-06 | 1999-09-24 | Fujitsu Ltd | 負荷予測によるシステム最適化制御装置 |
US6345240B1 (en) * | 1998-08-24 | 2002-02-05 | Agere Systems Guardian Corp. | Device and method for parallel simulation task generation and distribution |
US6502148B1 (en) | 1999-04-30 | 2002-12-31 | Imagex.Com, Inc. | System for scaling an application server system |
US6618742B1 (en) | 2000-01-10 | 2003-09-09 | Imagex.Com, Inc. | Method for job impact learning |
US6618820B1 (en) | 2000-01-10 | 2003-09-09 | Imagex.Com, Inc. | Method for configuring an application server system |
US6539445B1 (en) | 2000-01-10 | 2003-03-25 | Imagex.Com, Inc. | Method for load balancing in an application server system |
US6704782B1 (en) * | 1999-12-09 | 2004-03-09 | International Business Machines Corporation | System and methods for real time progress monitoring in a computer network |
US6718330B1 (en) | 1999-12-16 | 2004-04-06 | Ncr Corporation | Predictive internet automatic work distributor (Pre-IAWD) and proactive internet automatic work distributor (Pro-IAWD) |
US6775831B1 (en) * | 2000-02-11 | 2004-08-10 | Overture Services, Inc. | System and method for rapid completion of data processing tasks distributed on a network |
US6928482B1 (en) | 2000-06-29 | 2005-08-09 | Cisco Technology, Inc. | Method and apparatus for scalable process flow load balancing of a multiplicity of parallel packet processors in a digital communication network |
US7970686B1 (en) | 2000-09-15 | 2011-06-28 | Citigroup Global Markets, Inc. | System and method of interfacing for client application programs to access a data management system |
US20020188552A1 (en) * | 2001-06-07 | 2002-12-12 | Lawrence Kavounas | Devices, softwares and methods for automated execution of conditional securities trade orders and interfaces for entering the same |
JP2004005249A (ja) * | 2002-05-31 | 2004-01-08 | Fujitsu Ltd | 負荷分散型マルチプロセッサに対する信号振分装置 |
JP2004046658A (ja) * | 2002-07-15 | 2004-02-12 | Hitachi Ltd | データ転送方法 |
US20050021511A1 (en) * | 2003-07-24 | 2005-01-27 | Etagon Israel Ltd. | System and method for load balancing in database queries |
DE10346303B3 (de) * | 2003-10-06 | 2005-03-24 | Sap Ag | Verfahren zur Bearbeitung von aufeinanderfolgenden Anfragen eines externen Computers in einem Computersystem mit mindestens einem ersten Computer und einem zweiten Computer, sowie Computerprogramm und Computersystem |
GB2423209B (en) | 2003-10-31 | 2008-04-23 | Fujitsu Ltd | Moving image distributing apparatus, moving image distributing system, and moving image distributing program |
JP2005141441A (ja) * | 2003-11-06 | 2005-06-02 | Hitachi Ltd | 負荷分散システム |
JP4679167B2 (ja) | 2004-03-05 | 2011-04-27 | 株式会社東芝 | コンピュータシステム解析装置 |
JP2005332025A (ja) * | 2004-05-18 | 2005-12-02 | Hitachi Ltd | 中断シナリオの生成方法、サーバ装置及びそのプログラム |
JP4160093B2 (ja) * | 2004-05-19 | 2008-10-01 | Kddi株式会社 | コンテンツ配信制御システム及びその配信スケジュール作成方法、コンピュータプログラム |
US20080270460A1 (en) * | 2007-04-27 | 2008-10-30 | Hepner Daniel W | Creating a data structure that specifies relationships between networked objects |
WO2009057208A1 (ja) * | 2007-10-31 | 2009-05-07 | Fujitsu Limited | 資源割当プログラム、管理ノード、資源割当方法、および並列計算機システム |
JP5339230B2 (ja) * | 2008-03-24 | 2013-11-13 | 公益財団法人鉄道総合技術研究所 | 配船計画作成装置、プログラム及び配船計画作成方法 |
JP2009237859A (ja) * | 2008-03-27 | 2009-10-15 | Nec Corp | 仮想マシン管理システム |
JP5332006B2 (ja) * | 2009-08-07 | 2013-11-06 | 株式会社日立製作所 | 計算機システム、プログラム及びシミュレーションに使用する計算資源を割り当てる方法 |
JP2011209948A (ja) * | 2010-03-29 | 2011-10-20 | Canon Inc | 情報処理装置、情報処理方法、プログラム及び記憶媒体 |
JP5614182B2 (ja) * | 2010-09-02 | 2014-10-29 | 富士通株式会社 | データ割振り装置、データ割振り方法及びデータ割振りプログラム |
JP2012094030A (ja) | 2010-10-28 | 2012-05-17 | Hitachi Ltd | 計算機システム及び処理制御方法 |
JP5821578B2 (ja) * | 2011-11-30 | 2015-11-24 | 富士通株式会社 | サーバ装置、データ順序保証プログラム、およびデータ順序保証方法 |
US20150081400A1 (en) * | 2013-09-19 | 2015-03-19 | Infosys Limited | Watching ARM |
JP2017111662A (ja) * | 2015-12-17 | 2017-06-22 | 日立オートモティブシステムズ株式会社 | 電子制御装置 |
CN107241380B (zh) * | 2016-03-29 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 用于基于时间调整的负载均衡的方法和设备 |
US11308100B2 (en) | 2019-06-25 | 2022-04-19 | Amazon Technologies, Inc. | Dynamically assigning queries to secondary query processing resources |
US11762860B1 (en) | 2020-12-10 | 2023-09-19 | Amazon Technologies, Inc. | Dynamic concurrency level management for database queries |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4356546A (en) * | 1980-02-05 | 1982-10-26 | The Bendix Corporation | Fault-tolerant multi-computer system |
FR2476349A1 (fr) * | 1980-02-15 | 1981-08-21 | Philips Ind Commerciale | Systeme de traitement de donnees reparti |
JPS58151666A (ja) * | 1982-03-05 | 1983-09-08 | Hitachi Ltd | マルチコンピユ−タシステムにおける自動負荷配分方法 |
JPS6024647A (ja) * | 1983-07-20 | 1985-02-07 | Hitachi Ltd | システムの自律化資源管理方式 |
JPS62245361A (ja) * | 1986-04-17 | 1987-10-26 | Nec Corp | ネツトワ−クジヨブ実行の自動負荷分散方式 |
EP0272836B1 (en) * | 1986-12-22 | 1994-03-02 | AT&T Corp. | Controlled dynamic load balancing for a multiprocessor system |
JP2638065B2 (ja) * | 1988-05-11 | 1997-08-06 | 富士通株式会社 | 計算機システム |
US5283897A (en) * | 1990-04-30 | 1994-02-01 | International Business Machines Corporation | Semi-dynamic load balancer for periodically reassigning new transactions of a transaction type from an overload processor to an under-utilized processor based on the predicted load thereof |
US5404515A (en) * | 1992-04-30 | 1995-04-04 | Bull Hn Information Systems Inc. | Balancing of communications transport connections over multiple central processing units |
JP3208870B2 (ja) * | 1992-10-30 | 2001-09-17 | 株式会社日立製作所 | データ分割パタンの評価方法 |
-
1993
- 1993-01-19 JP JP5006430A patent/JP3003440B2/ja not_active Expired - Fee Related
-
1994
- 1994-01-06 GB GB9400167A patent/GB2274345B/en not_active Expired - Lifetime
-
1997
- 1997-01-22 US US08/787,357 patent/US5778224A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US5778224A (en) | 1998-07-07 |
GB9400167D0 (en) | 1994-03-02 |
GB2274345B (en) | 1997-04-30 |
JPH06214962A (ja) | 1994-08-05 |
GB2274345A (en) | 1994-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3003440B2 (ja) | 負荷分散制御方法および分散処理システム | |
EP1410566B1 (en) | Improved event database management method and system for network event reporting system | |
US6820122B1 (en) | Maintenance of free resource information in a distributed system | |
JP4923008B2 (ja) | ストレージ管理装置、ストレージ管理方法およびストレージ管理プログラム | |
US8250400B2 (en) | Method and apparatus for monitoring data-processing system | |
US6963828B1 (en) | Metafarm sizer configuration optimization method for thin client sizing tool | |
JPH07334436A (ja) | ソフトウエア自動配布方式 | |
CN111414241A (zh) | 批量数据处理方法、装置、系统、计算机设备及计算机可读存储介质 | |
US20080068464A1 (en) | System for delivering images, program for delivering images, and method for delivering images | |
CN1954295A (zh) | 用于控制分布式处理环境中作业执行的计算机系统、方法及程序 | |
EP0917055B1 (en) | Method of managing the operation of a computer system | |
CN1330124C (zh) | 虚拟化网络资源的方法和装置 | |
CN113766004A (zh) | 一种基于多云平台的灾备系统、方法及存储介质 | |
EP1109413B1 (en) | Summary building block, system and method for network management | |
CN113051063B (zh) | 分布式任务的任务调度方法、装置及电子设备 | |
Coates et al. | A generic coordination approach applied to a manufacturing environment | |
CN109388502A (zh) | 一种业务标识分配方法及装置 | |
JP3443579B1 (ja) | 監視システム、監視装置および監視プログラム | |
EP1197858A1 (en) | Method and device for offering resources in an internet appliance | |
JP3984948B2 (ja) | 計算機システムの運用管理方法 | |
JP3513550B2 (ja) | トランザクション続行方法およびそのためのリソースマネージャ | |
JP3377125B2 (ja) | ネットワーク負荷平滑化方法 | |
CN117389749B (zh) | 基于双主板的任务处理方法、装置、设备及存储介质 | |
JP3815494B2 (ja) | 計算機システムおよびその運用管理方法 | |
JP2002244714A (ja) | 生産計画立案方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071119 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081119 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081119 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091119 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101119 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101119 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111119 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |