JPH10511785A - 分散形コンピュータシステムの構成機構 - Google Patents

分散形コンピュータシステムの構成機構

Info

Publication number
JPH10511785A
JPH10511785A JP8517547A JP51754796A JPH10511785A JP H10511785 A JPH10511785 A JP H10511785A JP 8517547 A JP8517547 A JP 8517547A JP 51754796 A JP51754796 A JP 51754796A JP H10511785 A JPH10511785 A JP H10511785A
Authority
JP
Japan
Prior art keywords
processor
distribution
processors
load
capacity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8517547A
Other languages
English (en)
Inventor
ナエミィ インゲボルグ ホルテ−ロスト,アンナ
ビルギッタ アンデルソン,ソフィア
アレグザンダー ラルイ,ラモン
Original Assignee
テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲツト エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Publication of JPH10511785A publication Critical patent/JPH10511785A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5019Workload prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Steering Control In Accordance With Driving Conditions (AREA)
  • Surgical Instruments (AREA)
  • Lock And Its Accessories (AREA)
  • Undergarments, Swaddling Clothes, Handkerchiefs Or Underwear Materials (AREA)
  • Switches With Compound Operations (AREA)
  • Computer And Data Communications (AREA)
  • Paper (AREA)
  • Water Treatment By Sorption (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Telephonic Communication Services (AREA)
  • Exchange Systems With Centralized Control (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 本発明は、分散形コンピュータシステムを構成する方法に関する。本方法は、どれだけのプロセッサ容量がシステム上で実行する各応用副機能によって要求されるか、及びいくつのプロセッサ上で各応用副機能がランしなけばならないかをシステムに入力することを含む。これらのプロセッサは、冗長領域を形成する。分布単位(D.U.)として一緒に群にまとめられた全てのリソースは、プロセッサの容量に比例してかつ前記冗長領域内のプロセッサ上の期待されるロードを計算に入れて、これらのプロセッサにわたって分布される。期待されるロードは、オプショナルにプロセッサロードの履歴データに基づく。冗長性再配置方式は、システム内のロードイムバランス又は他の機能不良に起因して他のプロセッサにD.U.を割り当てる必要がある場合に、前記冗長領域内の少なくとも1つの他のプロセッサを各D.U.に割り当てることによって作り出される。

Description

【発明の詳細な説明】 分散形コンピュータシステムの構成機構 定義 本願の文脈の中で、次の用語は以下に定義された意味を有する。 「リソース」は、分散形システム(distributed system) 内に割り当てられてよく、かつ人がこれにアクセスを取ることを望むもの、した がって、アドレス指定可能な或るものを意味する。各リソース又は各リソース表 現(Resource Representation)はそれに関連した識別 子を有し、前記識別子は分布単位(Distribution Unit)(詳 細な説明における定義参照)に属する全てのオブジェクトに共通である。各リソ ース又は各リソース表現は、[通信チャンネル、回線インタフェース回路(Li ne Interface Circuit;LIC)のような]「ハードウェ アリソース(Hardware Resource)」と(加入者データのよう な)「ソフトウェアリソース(Software Resource)」とに副 分割されてよい。ハードウェアリソースは、普通、ソフトウェア表現を有し、こ のソフトウェア表現が、事実上、これと人がアクセスを取ることを望むものなの である。したがって、このようなソフトウェア表現は、ソフトウェアリソースに なり、かつ分布単位の概念の下に取り扱われてよいオブジェクトの1つを構成す る。それゆえ、本願の目的上、「リソース」は、ソフトウェアリソースである。 「分布単位」(D.U.)は、単一リソース又はリソースの群を意味する。D .U.内のリソースをもとにしてD.U.の識別(identity)を見付け ることを可能にするマッピングが行われる。電気通信システム以外では、分布単 位は、なんらかのデータベース(車、人の健康状態等に関する情報)中のなんら かのオブジェクト、又はハードウェアを表現するプロセス割当てオブジェクト( process allocated object)を含むこともある。電気 通信システム内の「分布単位」は、例えば、加入者の電話番号に同じ2つの最 後の数字を有する全ての加入者であってよい。これは、合計100分布単位を作 り出す。もっとも、その場合、もちろん、各分布単位は非常に多くの実際の加入 者を表現する。一般化した場合、分布単位はほとんどなんでも含むと云ってよく 、正確には、その含むものは問題にしている応用に依存している。D.U.はシ ステム設計中に定義され、かつD.U.に関する情報が、すなわち、正確にはそ れが含むものが、初期始動に当たってシステム内へロードされる。D.U.は、 また、システムの動作中ランタイム内に追加されることがある。 上に定義されたように、分布単位はいくつものリソースを含んでよく、かつ分 布単位が実際に含むものは問題にしている応用に依存している。それゆえ、分布 単位は、ハードウェアを表現するプロセス割当てオブジェクトを処理するために 、データベース内のオブジェクトの群からのほとんどいかなるものであってもよ い。電気通信システムでは、分布単位を組織する極く普通のオブジェクトは、電 気通信システムに接続された個々の加入者を表現するデータの群である。 各分布単位は特有の識別を有し、その分布単位をアドレス指定する応用副機能 (application subfunction)がこの識別を使用するこ とができる。この識別は、問題にしている分布単位が関連している応用副機能を 識別する1つの部分と、この応用副機能内の分布単位を識別する1つの部分とか ら構成されている。 これは、応用がISDNでありかつ応用副機能が「呼アクセス」であることで 以て例証されると云ってよい。もし分布単位がこの応用副機能内の第12分布単 位であるならば、その識別はISDN、「呼アクセス」12であろう。 電気通信システム内の加入者の場合、分布単位のオブジェクトに対する共通識 別は電話番号の最後の2つの数字であってよく、これらは100分布単位を作り 出すであろう。 更に、各分布単位をプロセッサに独立に割り当てることができる。 応用によって定義される分布単位の数は、この応用の分布を受けるかもしれな いプロセッサの最大数を決定する。本発明に想定されるD.U.の使用の利点は 、単に、取り扱う少数の単位しか存在しないと云う理由から、膨大な量のデータ の取り扱いが容易になると云うことである。また、プロセッサの喪失は、オペレ ー タの従事を要せず、システム自体によって取り扱われる。 他の利点は、改善されたアドレス指定容量である。なぜならばアドレス指定機 構内のリストの長さが劇的に短くされるからである。 「冗長領域(Redundancy Domain)」は、問題にしている副 機能がこの冗長領域内の全てプロセッサ上で実行されると云うように、1つのか つ同じ応用副機能に対するコードをロードされるプロセッサの指定数を意味する 。 「ロード」は、所与の時間におけるシステム内のプロセッサの相対利用を意味 する。 「ロードイムバランス(Lord imbalance)」は、再構成をトリ ガすることがある所望ロードからの偏差を意味する。それゆえ、所定限界内の最 少イムバランスが許容される。 「応用」は、分散形コンピュータシステム、例えば、電気通信システム上で実 行する或るものを意味する。「応用」の例は、電話呼び出しシステム、ISDN である。 「応用副機能」は、応用(例えば、「オフフック」機能及び「呼アクセス」機 能、コード受信機能等)を一緒に形成する要素プロセス又は基本プロセスを意味 する。各副機能用コードは、いくつかのプロセッサ上で実行されてよい。各プロ セッサは、異なるD.U.を取り扱う。 本発明の分野 本発明は、1態様において、分散形コンピュータシステム内の、特に電気通信 システム内の、ソフトウェアリソースの構成及び再構成、及びこのようなリソー スの実行の構成及び再構成方法に関する。他の態様において、本発明は、このよ うな構成及び再構成用組込み機能性を有する電気通信システムに関する。 本発明の背景 膨大な数の加入者を擁する電気通信システムのような、分散形コンピュータシ ステムでは、全ての加入者に関するデータ、単一プロセッサ上に位置指定された 全ての加入者に関する実行機能及び制御機能を有することは不可能である。すな わち、或る1つの機能は、いくつかのプロセッサ上で並列に実行する能力を有さ なくてはならない。更に、構成活動は、これらのプロセッサを可能な限り効率的 に使用するためにソフトウェアリソースの分布を伴う。このような構成及び再構 成は、各応用リソースによって使用されるロード(容量)を推定することが困難 な場合には、非常に複雑な活動である。それゆえ、いくつものプロセッサにわた ってこれらのリソースを分布するツールの必要が存在する。 たとえ「最適」として特徴付けることができるシステムの初期構成を作り出す ことが可能であったとしても、この条件は個々のプロセッサ上で実行する応用リ ソースに起因して、又はプロセッサの喪失(例えば、プロセッサ壊滅、保守のた めのプロセッサの交換等)によって、時間と共に変化すると云ってよいので、余 り長くは続かないであろう。 これまでならば、或る1つのプロセッサが喪失した場合、前記プロセッサ上で 実行するプロセスは、そのハードウェアが修理済みになる又は新ハードウェアと 交換されるまで停止されるであろう。このような動作は、数10分又は数時間も の長さを要することもあり、問題にしているシステムのアクセス可能性の面にお いて今日の要件から見て許容不可能になっている。 したがって、このようなシステムが動作不能になっている時間を数秒の又は長 くとも2、3分の時間枠に短縮すると云ったように、これらのシステムの非常に 敏速な再構成の必要が広がっている。 また、特にオペレータが介入できるようになるまでにかなりの時間を要する遠 隔位置で問題が再構成の必要を引き起こす場合、もし再構成を敏速にそれもオペ レータの介入を要せずに達成できるならば、保守目的上有利であろう。 再構成の「ランタイム調節」のためのこのような機構は、システム内の、例え ば、ロードバランスの面でシステムの状態について情報を連続的に供給すること に依存している。この情報は、長期間にわたって特定のいくつかのパラメータに 関してシステムを監視することによって捕捉することができる。このような測定 からのデータは、その時間にわたるプロセッサのロードの変化、例えば、或るい くつかのプロセッサがその時間のほとんどにわたって他のプロセッサよりも重く ロードされていると云うことを通告するであろう。このような情報は、保守技術 者によるか又はシステムに「組み込まれた」機能性によるかのどちらかで、シス テム内の再構成を開始させるのに使用されてよい。このようなランタイム再構成 を行うことを可能とする一方、システムの動作を擾乱させないことに関連する要 件を満たすために、このような再構成を支援し、かつ応用によって適用される強 力な機構が動作システム内に存在する必要がある。 先行技術 米国特許第5,165,018号は、分散形メッセージベースオペレーティン グシステム内のノードの自己構成を開示している。ランタイム構成は、リソース 定義メッセージに含まれた情報に従ってノードベース構成管理プロセスによって 遂行される。 本発明の要約 上に論じた所望機構は、冗長領域内でシステム内のプロセッサ上にリソースを 分布することについての、本発明の請求の範囲第1、3、7、8、11項に定義 されたように、本発明による方法によって、及びこのような機能性を組み込んで いる、請求の範囲第13項による電気通信交換機によって、提供される。 この方法におけるリソースの分布の計算は、この発明の目的のために考えられ ている「分布単位」(D.U.)の概念によって支援される。D.U.の定義は 、上で「定義」の下に与えられている。 本発明の利点は、その改善された取り扱いである。D.U.の分布がオペレー ティングシステムによって支援されるので、システムを構成するのがより簡単に なる。OSは、ランタイム内のロードバランシングを支援するので、完全初期構 成を要件とすることがさほど求められなくなる。緊急オペレータ行為への要求が 少なくなる。また、OSはプロセッサ喪失に当たって冗長性再配置(Redun dancy Relocation)を支援するので、サービス人員がその場所 を直ちに訪問する必要はない。冗長性再配置用機構は、本願と同じ譲受者を有し かつ本願と同じ日に出願された「分散形システムにおけるプロセッサ冗長性(P rocessor Redundancy in a Distributed System)」と題するスエーデン特許第95XXXXXX−X号の主題で ある。 本発明のなお他の利点は、その固有の堅牢性にある。すなわち、そのシステム は、特定のいくつかの型式の異常性、例えば、プロセッサ壊滅等に起因するロー ドイムバランスを自動的に始末することができる。システム上の擾乱は減少させ られ、かつ残りのプロセッサにわたってのロード分布が維持される。組込み冗長 性再配置は、機能が、例えば、プロセッサ喪失に起因して利用不能である時間を 短縮する。 組込みロードバランシングによって都合よいことにプロセッサ利用度が改善さ れるので、組込みロードバランシングが効いてまたコストを下げることになる。 いくつものプロセッサにわたってリソースをより効率的に分布することによって システム内のこれらのプロセッサの数を減少させることさえも可能であると云っ てよい。 図面の簡単な説明 添付図面中 第1図は電気通信交換機の概観を示すブロック回路図であって、この交換機内 で本発明が実現される。 第1b図は冗長領域を形成する3つのプロセッサの部分を示すブロック回路図 である。 第1c図は冗長領域にわたる分布単位の分布方式(Scheme of Di stribution)を示すブロック図である。 第2a図は本発明による初期構成機構を示す流れ図である。 第2b図は冗長性再配置方式を示すブロック図である。 第3a図は本発明による分布単位の追加設置/除去を示す流れ図である。 第3b図は旧分布方式を新分布方式と一緒に示し、かつ新方式を達成するため に遂行される動作を示すブロック図である。 第4a図は本発明による(システム開始された)ロードバランシング(Loa d Balancing)を示す流れ図である。 第4b図は本発明による(オペレータ開始された)ロードバランシングを示す 流れ図である。 第4c図は旧分布方式及び新分布方式、及びロードバランシングに当たっての 動作を示すブロック図である。 第5a図はプロセッサの手動ブロッキングを示す流れ図である。 第5b図は旧分布方式及び冗長性再配置方式に加えて新分布方式を示すブロッ ク図である。新分布方式を達成するのに要する動作もまた示されている。 第6a図はプロセッサの自動ブロッキングを示す流れ図である。 第6b図は旧分布方式及び冗長性再配置方式に加えて新分布方式を示すブロッ ク図である。新分布方式を達成するのに要する動作もまた示されている。 第7a図はプロセッサのデブロッキング(deblocking)を示す流れ 図である。 第7b図は旧分布方式及び新分布方式を示すブロック図である。新分布方式を 達成するのに要する動作もまた示されている。 第7c図はプロセッサの追加を示すブロック図である。 本発明の詳細な説明 本発明をこれらの添付図面及び発明の概念を使用することができる或るいくつ かの異なった状況を参照して例証する。2つの基本的状況がある。すなわち、 A. (システムを始動するときの)初期構成。 B. (システムが或る時間にわたり動作しているとき技術者によって開始さ れた又はシステム自体によって開始された)再構成。 状況Bは、立ち代わってまた次のようないくつもの異なる状況に適用される。 a. 分布単位の追加設置 b. 分布単位の除去 c. ロードバランシング(手動又は自動) d. プロセッサの手動ブロッキング e. プロセッサの自動ブロッキング(プロセッサ壊滅) f. ブロッキング後のプロセッサの復帰及びプロセッサの追加を含むプロ セッサのデブロッキング。 この機構が、前提条件とされた機構と一緒に支援する分布単位の(再)構成の 二、三の異なった場合がある。 前提条件とされた機構は、 − D.U.をアドレス指定する能力を有するOS内に名前アドレス指定機 構があること。 − OSが、「安全データベース」を有し、このデータベース内に構成デー タ及び方式が記憶されること。それゆえ、これらはプロセッサ壊滅後も生き残る こと。データベースは、全てのプロセッサからアクセス可能であること。 − データを「旧」プロセスから「新」プロセスへ転送する「状態」転送が 行われること。 (再)構成の各々の場合毎に、2つの方式が計算される。冗長領域内のプロセ ッサ上の分布単位の分布の第1方式、すなわち、方式1は、各プロセッサの容量 を決定するパラメータ、オプショナルにはロードの測定値を計算に入れて、(こ こに先に定義されたように)分布単位として群にまとめられた、システムのリソ ースをシステム内のプロセッサにわたっていかに分布するかを説明する。 冗長性再配置の他の方式、すなわち、方式2は、ブロッキングのゆえのプロセ ッサの喪失の場合いかに分布単位を移動させるかを説明する。 この方式は、後の段の再構成の場合に、例えば、上の状況a〜fに、各分布単 位毎にそれをどのプロセッサへ再配置するかをアウトポイント(outpoin t)する。 いま、われわれは、一例、及び或る1つの領域内のプロセッサにわたるD.U .の分布を示す図面を参照して基本的状況を取り扱う。矢印は冗長方式を示す。 イタリックは再構成後に達成される方式を示す。 例: それぞれの場合のi.a流れ図及び相当する再配置を示す添付図面において、 イタリックで記された組は、再構成動作が呼び起こされ後に達成される分布の再 計算された方式を指示する。 第1a図に、電気通信システムの簡単化概観が示されている。それは、各々が 少なくとも1つの電話機1を有するいくつかの加入者を含む。各電話機は云わゆ るLIC(回線インタフェース回路)を経由してシステムに接続され、LICは 立ち代わってスイッチ2に接続され、スイッチ2はそのシステム内の全ての単位 間の通信に責任を持つ。システム内の全てのプロセッサ3上に実行する1つ以上 の副機能がある。また、加入者データ等を含むデータベース4が備わっている。 データベースはプロセッサ上で実行するオペレーティングシステムの部分であり 、かつ主記憶装置内に駐在する(プロセッサの或るものはまたディスクを備えて おり、このディスクがデータベースを含むことがある)。これらのディスクは、 そうでなければ、ローディング媒体としてかつバックアップ目的に主として使用 されるが、しかしまた他の機能を有することもある。 第1b図に、第1a図のシステム内の、先に定義された、冗長領域(破線で指 示されている)を形成する3つのプロセッサ3が示されている。各プロセッサは 、データベースを含む、応用副機能APPL及びオペレーティングシステムOS 用コードをロードされる。 この「副」システムが応用で以て再構成されようとしていると仮定しよう。応 用副機能は、実行する30分布単位を有する。これらの単位は、或る順番(0〜 29)(組)に番号を振られている。 寸法決定(dimensioning)の結果、第1c図に示された3つのプ ロセッサからなる冗長領域を生じている。 この簡単化の例において、われわれは、プロセッサが全て等しいこと、及び冗 長領域内のプロセッサ上で他の応用は実行中でない、すなわち、分布単位は冗長 領域内のプロセッサにわたって(初期的に)平等に分布されていると仮定する。 A. 初期構成 電気通信システムをセットアップするに当たって、もちろん、そのシステムを 期待される利用に寸法決定しなければならないが、しかしこれは標準的な手順の 問題で、本発明の部分を形成せず、それゆえ、ここでは論じない。したがって、 システムの寸法決定が行われるとき、システム上で実行しようとしている各応用 副機能によってどれだけの容量が必要であるかを決定しなければならない。この プロセスにおいて、また、例えば、プロセッサ壊滅又は保守目的等のための1つ のプロセッサの除去のような、プロセッサの他の喪失に起因する実行容量の喪失 の場合を考慮しなければならない。これは、いくつプロセッサをシステムが含む べきかを決定しなければならないことを意味する。 その後、各応用を実行するプロセッサはいくつであるか決定しなければならな い、すなわち、「冗長」の初期構成を作り出さなければならない。それゆえ、各 応用毎に、同じコードをロードされるプロセッサの数を決定し、かつプロセッサ のこの群は問題にしている各応用副機能毎に冗長領域を構成する。この結果は、 各冗長領域内の全てのプロセッサがこの冗長領域に関連した応用副機能を実行す ることができると云うことである。それゆえ、応用副機能用コードは、この領域 内の全てのプロセッサにロードされる。 冗長領域が初期的に構成されるとき、応用内の分布単位は、冗長領域に割り当 てられる。プロセッサの数、プロセッサ容量、プロセッサ速度、ロードバランス 、分布単位の数等のような入力データに基づいて、この領域内のプロセッサにわ たっていかに分布単位を分布するかを決定するのは、(分布関数 D=f(P0…Pn,L0…Ln,DU0…x) ここに、P=プロセッサ、L=ロード、n=プロセッサ指示、DUx=冗長領域 内の第x分布単位、に従って動作する)(再)構成機構である。 われわれの例の応用副機能(第1c図)では、0〜29の順番に識別子を備え る30分布単位が定義されている。この例では、定義された冗長領域内に3つの 等しいプロセッサがあるので、これらの単位は(平等に分布された)3つの群に 分割されている。 これらのプロセッサ間の分布単位の分布方式(第2b図)が初期的に計算され るとき、分布単位の冗長性再配置方式がまた計算され、それであるから各分布単 位は、アウトポイントされた領域内の或る1つのプロセッサを有する。 この方式は、分布単位の組を可能な最大限度まで連続順序に維持するために計 算される。 第2a図は、初期構成の簡単な流れ図である。 第1ステップで、データの入力中(通常、データはファイルに書き込まれ、こ のファイルが次いでO.S.によって読み出される)、オペレーティングシステ ムは、どの応用副機能を構成が取り扱うべきか、いかに冗長領域を定義するか、 及びこの構成内に分布するべき分布単位の組についての情報を供給される。前記 データに応答して、オペレーティングシステムは、冗長領域内の活性プロセッサ にわたってD.U.の分布方式を計算する。 次いで、応用副機能用コードが問題にしている冗長領域内のプロセッサにロー ドされ、その後DUが先に計算された分布方式に従って設置される、それによっ て応用分布単位がその領域内のプロセッサにわたって分布され(かつ始動される )。 所与の応用に対する前記分布方式の計算は、先に定義された分布単位の概念に よって支援される。この目的のために、多少複雑なアルゴリズムが使用されるこ とがある。 最も簡単なアルゴリズムは、冗長領域内の活性プロセッサにわたって可能な限 り平等に分布単位を分布することである。しかしながら、そのアルゴリズムは、 また、プロセッサのメモリ容量、プロセッサの実行容量、及びプロセッサ上で実 行する他の応用によって使用される容量を既に初期的に考慮することがある。そ れゆえ、個々のプロセッサへ割り当てられた分布単位の数は、このような考慮に 比例して加重されることになる。 最終的に、冗長性再配置方式が計算される。 次の図(第2b図)は、プロセッサに割り当てられた分布単位をどのようにし て組に分割するか、プロセッサのブロッキングの場合に、いかにこの分布単位を 依然動作している最も適当なプロセッサへ移動させるかを示す。図中の矢印は、 プロセッサ喪失の場合にいかにDUを或る1つのプロセッサから他のプロセッサ へ移動させるかを指示する。 更に、再構成中分布単位が他のプロセッサへ再配置されるとき、これらの分布 単位が可能な最大限度まで順番に各プロセッサ上で分布単位の識別を維持するた めに配置されると云ったように、分布アルゴリズムは、好適には、順番にプロセ ッサに割り当てられた分布単位の識別を維持する(下に更に論じられかつ例証さ れる)。このようにしてアドレス指定が更に敏速化されるが、それはアドレステ ーブル内に順番を付けることによってこれらのテーブル内に少数の線(line )しか生じないからである。 プロセッサ間の分布単位(0…29)の分布は、プロセッサ当たり10分布単 位の組(0…9)、(10…19)、(20…29)を生じている。これらの組 の各1つ(0…9)、…は、2つの等しい大きさの部分に分割され、これらの部 分は、プロセッサブロッキングの場合、2つの残りのプロセッサへ別々に移動さ せられる。 プロセッサ間に固有の不等性がある場合には、もしプロセッサP1がプロセッ サP2の容量の2倍を有するならば、P2のおそらく2倍ほどの数の分布単位を P1へ再配置すると云うように、もちろん、再配置の目的のための副分割がこれ を考慮に入れなければならない。 自動冗長性再配置方式は、冗長性再配置の遂行の後、かつ分布に影響する他の 再構成の各種類の後に再計算される。 応用副機能の動作及び保守のために、インタフェースが要求される。このよう なインタフェースは、分布単位の初期設置用施設(INSTALL)、分布単位 の除去用施設(REMOVE)、及び1つのプロセッサ上で実行する1つの応用 副機能から他のプロセッサ上で実行する他の副機能へ分布単位を移動させるため の施設[後者は、ここに列挙することによってその内容が本明細書に組み入れら れた同時係属スエーデン特許出願第9503339−5号、「平滑システム高度 化中状態転送を可能にする同期(Synchonisation allowi ng states transfer during smooth sys tem upgrade)」の主題である]を有する。列挙されたこの同時係続 出願に定義された機能又は命令は、SHUTDOWN及びTAKEOVERであ る。前記機能は、特定のいくつかの活動をトリガするプログラムとして基本的に 実現され、かつ下に短く説明される。 SHOUTDOWNは、終了(termination)及び次に起ころうと する引き渡し(take over)の準備をする。TAKEOVERは、旧静 的プロセス内のリソースオブジェクトの制御を新静的プロセスへ転送する。 B 再構成の場合 再構成は、例えば、ロード内の特定のいくつかの限界値を超えるようなとき、 オペレータによって手動で又はシステム自体によって自動でのいずれかで行われ る。手動再構成は非常に複雑であり、したがって、ここに開示された方法はオペ レーティングシステム内で実現される。 この目的のために、システム内のプロセッサのロードバランスについての、す なわち、1つ以上のプロセッサが他のプロセッサより重くロードされているかど うかを検出するための、連続測定がシステム内で行われることがある(このよう な測定機構はオペレーティングシステム内で利用可能であり、かつ発明の部分を 本質的に形成しない。したがって、それらをここでは論じない)。それらの測定 の結果が考慮され、かつ次いで、このような再構成の目的のために新分布の計算 に含められる。これは、許容ロード、偏差に対する予め定義されたしきい値を必 要とし、再構成をこれらのしきい値からトリガすることになるであろう。 ランタイム内に保守技術者によって開始される活動は、次のとおりである。 ・ 追加分布単位の設置。分布単位を冗長領域に割り当てる。 ・ 分布単位の除去。分布単位を冗長領域から除去する。 ・ ロードバランシング。不良ロードバランスゆえのオペレータ開始再構成 。 ・ プロセッサの手動ブロッキング。プロセッサを或る理由によってサービ スから外す。このプロセッサ上で実行する全ての分布単位を冗長領域内の他のプ ロセッサへ移動させなければならない。 ・ プロセッサのデブロッキング(手動)。冗長領域内のプロセッサをサー ビスに投入する。プロセッサをサービスに投入しかつロードをバランスさせるた めに分布単位を移動させる。 システム自体によって開始される活動は、次のとおりである。 ・ ロードバランシング。長期測定が不良バランスを通告する。いつイムバ ランスに到達するかを定義するしきい値を定義する。良ロードバランスを達成す るために分布単位を移動させる。 ・ 自動ブロッキング。プロセッサ壊滅によって開始された分布単位の再構 成。 ・ プロセッサの自動デブロッキング。冗長領域内のプロセッサをサービス に投入する。プロセッサをサービスに投入しかつロードをバランスさせるために 分布単位を移動させる。 分布単位の追加設置 追加分布単位が冗長領域に追加される(第3a図)(1例は、電気通信システ ム内の加入者の数を増やすことでもあり得る)。これは、分布(及び冗長性再配 置)の新方式を引き起こす。第3b図に、われわれの例に適用された分布単位 (30〜39)の追加設置が示されている。 それゆえ、起こる第1のことは、10新分布単位(30〜39)が追加される 旨をシステムに「報せる」なければならないことである。先に説明したように、 データはファイルに書き込まれ、このファイルがオペレーティングシステムによ って読み出される。次いで、その領域内のプロセッサ間の分布単位の分布方式が 、入力データに応答してオペレーティングシステムによって再計算される(0… 12)、(13…26)、(27…29)。再計算された方式を達成するために 、新分布方式に従って(「旧」プロセスに向けての「SHUTDOWN」、及び 「新」プロセスに対する「TAKEOVER」で以て、追加(新)分布単位が設 置(INSTALLED)され、かつ他(元の)分布単位がプロセッサへ移動さ せられる。旧DUの除去に場合、もちろん、INSTALLではなく、REMO VEが要求される。再分布が実施済みになったとき、新冗長性再配置方式がシス テムを表現するデータ(プロセッサの数、プロセッサ容量等)に基づいて(自動 的に)計算される。 ロードバラシング プロセッサ2がオーバロードされており(例として測定が30%オーバロード していることを指示し、かつオペレーティングシステムがそれに従って通告され る)、それであるから割り当てられた分布単位のうちの4つをプロセッサ2から 再配置すべきであると仮定しよう。その領域内のプロセッサ間の分布単位の分布 方式(第4c図参照)が、まず、計算される(0…11)、(12…17)、( 18…29)。次いで、再計算された方式を達成するために、分布単位が(「旧 」プロセスに向けての「SHUTDOWN」、及び「新」プロセスに対する「T AKEOVER]で以て)移動させられる。分布が完了したとき、新冗長性再配 置が計算される。 プロセッサの手動ブロッキング プロセッサを手動ブロックしようとしているとき、例えば、プロセッサを保守 のために除去しようとしているとき、われわれはそのプロセッサ内で実行する全 ての分布単位を可能な限り敏速に移動させようと望む。この場合、初期的に計算 された冗長性再配置方式が使用される。自動冗長性再配置方式を達成するために 、 プロセッサ2に割り当てられた分布単位が、「旧」プロセスに向けての「SHU TDOWN」、及び「新」プロセスに対する「TAKEOVER]で以てプロセ ッサ1(10…14)及びプロセッサ(15…19)へ移動させられる(第5a 図及び第5b図)。 プロセッサの自動ブロッキング(プロセッサ壊滅) 例えば、プロセッサ壊滅に起因して、プロセッサが自動的にブロックされると き、全てのプロセス割り当てデータは喪失し、それであるから係わったプロセス 間の状態転送は考えられない。したがって、ブロックされたプロセッサに割り当 てられた分布単位は、「SHUTDOWN」−「TAKEOVER」で以て移動 させられないで、実行を引き渡すプロセス内で「再設置」される。 オペレーティングシステムは、自明の機構によって壊滅を検出する。壊滅が検 出されたとき、喪失プロセッサに割り当てられたDUは、初期再構成に当たって 計算された冗長性再配置方式に従って、又は他の理由により或る事象が再構成を トリガした場合には最新の更新方式で以て、直ちに設置(INSTALLED) される。もっと複雑な状況では、更に、依然活性のプロセッサ上の或るいくつか のDUを、例えば、ロードバランス判定基準を満足するために移動させなければ ならないことがある。 第6b図は、プロセッサの自動ブロッキング(プロセッサ壊滅)によって引き 起こされる分布単位の自動再配置の例を示す。 自動冗長性再配置方式を達成するために、プロセッサ2に割り当てられた分布 単位は、「新」プロセッサに対する「INSTALL」で以てプロセッサ1(D U10…14)及びプロセッサ3(DU15…19)に割り当てられるように移 動させられる。 プロセッサの追加 新プロセッサを追加するプロセスが第7c図に示されている。第1ステップで 、システムは、初期構成の場合と同様に、すなわち、どんな応用副機能が使用さ れるか、及び冗長領域は何であるかについて報せを受けなければならない。次い で、新プロセッサが、問題にしている応用副機能用コードをロードされ、最終的 にそのプロセッサがブロックされる。 プロセッサの追加を含むブロッキング後のプロセッサの復帰(デブロッキング ) プロセッサがブロッキングから復帰するとき、冗長領域内の活性プロセッサ間 の分布単位の分布方式が計算される。第7a図は、プロセッサがブロックされた 後再び動作に投入されるとき起こるステップの順番を示す。まず、オペレーティ ングシステムは、プロセッサが追加された又は再設置された(両場合ともオペレ ーティングシステムの観点からは同等である)ことを検出する。検出を実施する やり方は不適当で、かつこれらのやり方をオペレータの行為によってか又はプロ セッサが存在するか否かについて利用可能なスロットを検査するソフトウェアに よって果たすこともできる。熟練者は、この機能を達成する多くのやり方がある ことを認めるであろう。新プロセッサ又は再設置されたプロセッサが検出される や否や、オペレーティングシステムは、デブロックされたプロセッサを含む新分 布方式を計算する。 新分布方式が計算されると、システムは前記方式に従ってDUを移動させるこ とを始動する。 第7b図は、新分布方式を達成するために、(「旧」プロセスに向けての「遮 断(shutdown)」、及び「新」プロセスに対する「引き渡し(take over)」で以て)、係わったプロセッサ間にいかに分布単位(10…14) 及び(15…19)を移動させるかを示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ラルイ,ラモン アレグザンダー スウェーデン国 エス−741 31 クニブ スタ,アペルシンベーゲン 21

Claims (1)

  1. 【特許請求の範囲】 1. 分散形コンピュータシステムの構成方法であって、 a) 冗長領域内のプロセッサ上の期待されるロードを計算に入れて、前記 プロセッサの容量に比例して前記プロセッサにわたって、分布単位(D.U.) として一緒に群にまとめられた全てのリソースを分布するステップであって、前 記期待されるロードがオプショナルにプロセッサロードの履歴データに基づいて いる、前記分布するステップ、 b) システム内のロードイムバランス又は他の機能不良に起因して他のプ ロセッサへD.U.を再配置する必要がある場合に、各D.U.に前記冗長領域 内の少なくとも1つの他のプロセッサを割り当てることによって冗長性再配置を 作り出すステップ を含む方法。 2. 請求の範囲第1項に記載の方法であって、どれだけのプロセッサ容量が 前記システム上で実行する各応用副機能によって要求されるかの初期決定を含み 、かつ各応用副機能をランしなければならないプロセッサの数を決定し、プロセ ッサの前記数が冗長領域を形成する、方法。 3. 請求の範囲第1項又は第2項に記載の方法において、前記D.U.が連 続番号を振られ、及び可能な限り前記DUが前記他のプロセッサ上に順番に順序 付けられるように、他のプロセッサの前記DUへの割り当てが行われる、方法。 4. 分散形コンピュータシステム内のプロセッサ容量のより効率的な利用を 動的に達成する方法において、応用副機能が前記システム内のいくつかのプロセ ッサ又は全てのプロセッサにロードされ、或る1つの副機能を実行するプロセッ サがそれによって冗長領域を形成し、前記方法であって、 a) プロセッサロードが合理的にバンラスされるように分布方式に従って リソースの群(分布単位)を分布するステップ、 b) 前記プロセッサ間のロードイムバランスを引き起こすロードの変化を 検出するために動作中各プロセッサの状態を連続的に監視するステップ、 c) 検出されたイムバランスに応答して、前記プロセッサにわたる前記分 布単位の新分布方式を計算するステップであって、前記計算された分布が前記プ ロセッサのロードバランスの前記変化に比例して加重される、前記計算するステ ップ、 d) 前記計算された新分布に従って、重くロードされたプロセッサから他 のより軽くロードされたプロセッサへDUを再配置するステップ、及び e) 前記重くロードされたプロセッサから前記より軽くロードされたプロ セッサへ処理を転送するステップ を含む方法。 5. 請求の範囲第4項に記載の方法において、DUを前記再配置するステッ プが前記重くロードされたプロセッサからより軽くロードされたプロセッサへの DUを複写することを伴う一方、元のデータが前記重くロードされたプロセッサ 内で依然動作する、方法。 6. 請求の範囲第5項に記載の方法において、前記分布単位が連続番号を振 られかつ最初に各プロセッサ上に順番に分布され、及び前記番号順番が可能最大 限度まで連続するように、前記計算された新分布が他のプロセッサへ分布単位を 再配置する、方法。 7. 請求の範囲いずれかの先行項に記載の方法において、予め定義された限 界を超える場合に限り前記ロードの変化が考慮される、方法。 8. 分散形コンピュータシステム内のプロセッサ上で実行するリソースのも う1つのプロセッサ又は他のプロセッサへの再配置方法において、前記リソース が分布単位として一緒に群にまとめられ、前記分布単位が前記システム内の各プ ロセッサの容量を決定するパラメータに従って前記システム内の前記プロセッサ 間に分布され、前記方法であって、 a) 動作中各プロセッサの状態を監視し、かつプロセッサ喪失によって引 き起こされた変化を検出するステップ、 b) 冗長性再配置方式に従って新プロセッサ上に喪失プロセッサに関連し た分布単位を設置するステップ、 c) 新冗長性再配置方式を計算するステップ を含む方法。 9. 分散形コンピュータシステム内の複数のプロセッサ上で同時に実行する ソフトウェアリソースの分布方法であって、前記プロセッサが冗長領域を形成し 、分布単位としてソフトウェアリソースを群にまとめることを含み、かつ前記シ ステム内の各プロセッサの容量を決定するパラメータに基づき導出されかつ計算 された分布方式に従って前記冗長領域内のプロセッサにわたってこのような分布 単位の群を分布する、方法。 10. 請求の範囲第9項に記載の方法において、前記分布が、前記プロセッ サ間に前記分布単位を平等に分布することによって計算される、方法。 11. 請求の範囲第9項に記載の方法において、ステップa)で検出された ような重いロードを持つプロセッサ、又はより低い固有容量を持つプロセッサと 少数の分布単位しか、関連しないように、プロセッサに関連したDUの数を加重 することによって、前記分布が計算される、方法。 12. 分散形コンピュータシステムに内のプロセッサ容量のより効率的な利 用を達成する方法であって、 a) 計算された分布が前記プロセッサの容量の差に比例して加重されるよ うに、各プロセッサの容量を決定するパラメータを計算に入れて、前記プロセッ サにわたる分布単位の分布方式を計算するステップ、 b) 分布の前記方式に従って、プロセッサロードが合理的にバランスされ るように、前記システム内の(冗長領域を形成する)プロセッサの選択された数 にわたってリソースの群(分布単位)を分布するステップ、 c) 応用副機能が前記選択されたプロセッサの全ての上で実行されるよう に、前記システム内の各冗長領域のプロセッサに応用副機能に対するコードをロ ードするステップ、 d) 分布の前記方式に従って分布単位を設置するステップ、及び e) 前記システムをランさせるステップ を含む方法。 13. 請求の範囲いずれかの先行項に記載の方法において、前記分散形シス テムが電気通信交換機である、方法。 14. 電気通信交換機であって、複数のプロセッサを含み、各プロセッサが 請求の範囲いずれかの先行項に記載の方法を実行する機能性を含むオペレーティ ングシステムを有する、交換機。 15. 分散形コンピュータシステム、特に分散形電気通信システムの構成方 法であって、 例えば、プロセッサ壊滅に起因する容量の喪失を考慮に入れて、どれだけの容 量が各応用副機能によって必要であるか決定するステップ、 各応用副機能を実行するのはいくつのプロセッサであるか決定するステップで あって、冗長領域内の全てのプロセッサが問題にしている応用副機能を実行でき 、それによって全ての前記プロセッサに前記応用副機能用コードをロードするよ うに、前記プロセッサが前記冗長領域を形成する、前記決定するステップ、及び これらのプロセッサ上で実行する応用プロセスにリソースを分布するステップ を含む方法。
JP8517547A 1994-12-09 1995-12-08 分散形コンピュータシステムの構成機構 Pending JPH10511785A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9404295-9 1994-12-09
SE9404295A SE9404295D0 (sv) 1994-12-09 1994-12-09 Sätt och anordning vid telekommunikation
PCT/SE1995/001484 WO1996018149A2 (en) 1994-12-09 1995-12-08 Configuration mechanism

Publications (1)

Publication Number Publication Date
JPH10511785A true JPH10511785A (ja) 1998-11-10

Family

ID=20396281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8517547A Pending JPH10511785A (ja) 1994-12-09 1995-12-08 分散形コンピュータシステムの構成機構

Country Status (17)

Country Link
EP (1) EP0796463B1 (ja)
JP (1) JPH10511785A (ja)
KR (1) KR100331492B1 (ja)
CN (1) CN1132097C (ja)
AT (1) ATE202225T1 (ja)
AU (1) AU716774B2 (ja)
BR (1) BR9509895A (ja)
CA (1) CA2206373A1 (ja)
DE (1) DE69521337T2 (ja)
DK (1) DK0796463T3 (ja)
ES (1) ES2161918T3 (ja)
FI (1) FI972407A0 (ja)
GR (1) GR3036045T3 (ja)
MX (1) MX9703872A (ja)
NO (1) NO972597L (ja)
SE (1) SE9404295D0 (ja)
WO (1) WO1996018149A2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2206737C (fr) * 1997-03-27 2000-12-05 Bull S.A. Architecture en reseau de machine informatique
US6038677A (en) * 1997-03-31 2000-03-14 International Business Machines Corporation Automatic resource group formation and maintenance in a high availability cluster configuration
FR2773239A1 (fr) * 1997-12-30 1999-07-02 Bull Sa Configuration d'un systeme informatique multinodal
ATE438243T1 (de) * 2002-06-28 2009-08-15 Nokia Corp Lastausgleicheinrichtung und verfahren dafür
CN100334554C (zh) * 2002-12-31 2007-08-29 中兴通讯股份有限公司 全分布处理系统中的备份和负荷控制方法
US7574708B2 (en) * 2004-03-04 2009-08-11 International Business Machines Corporation Mechanism for enabling the distribution of operating system resources in a multi-node computer system

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5165018A (en) * 1987-01-05 1992-11-17 Motorola, Inc. Self-configuration of nodes in a distributed message-based operating system
US5274838A (en) * 1987-06-03 1993-12-28 Ericsson Ge Mobile Communications Inc. Fail-soft architecture for public trunking system
CA1318409C (en) * 1988-10-27 1993-05-25 Dennis L. Debruler Multiprocessor load sharing arrangement
DE59310083D1 (de) * 1993-09-24 2000-09-07 Siemens Ag Verfahren zum Lastausgleich in einem Multiprozessorsystem

Also Published As

Publication number Publication date
GR3036045T3 (en) 2001-09-28
DK0796463T3 (da) 2001-09-03
KR100331492B1 (ko) 2002-08-22
AU4277196A (en) 1996-06-26
AU716774B2 (en) 2000-03-09
CA2206373A1 (en) 1996-06-13
KR980700611A (ko) 1998-03-30
CN1132097C (zh) 2003-12-24
CN1169191A (zh) 1997-12-31
MX9703872A (es) 1997-08-30
NO972597D0 (no) 1997-06-06
EP0796463A2 (en) 1997-09-24
EP0796463B1 (en) 2001-06-13
BR9509895A (pt) 1997-11-25
NO972597L (no) 1997-08-05
WO1996018149A2 (en) 1996-06-13
ATE202225T1 (de) 2001-06-15
FI972407A (fi) 1997-06-06
FI972407A0 (fi) 1997-06-06
WO1996018149A3 (en) 1996-08-15
SE9404295D0 (sv) 1994-12-09
DE69521337D1 (de) 2001-07-19
ES2161918T3 (es) 2001-12-16
DE69521337T2 (de) 2001-10-11

Similar Documents

Publication Publication Date Title
US5574914A (en) Method and apparatus for performing system resource partitioning
EP3522013B1 (en) Method and system for migration of containers in a container orchestration platform between compute nodes
US5778224A (en) Method of executing a plurality of transactions and a distributed processing system for performing such a method
CN101533417B (zh) 一种实现etl调度的方法及系统
JP4205066B2 (ja) マルチノード型コンピュータ・システムにおいてリソースを管理する装置、方法、およびプログラム
JP2502467B2 (ja) デ―タ処理装置および方法
JP4650203B2 (ja) 情報システム及び管理計算機
JP2003022209A (ja) 分散サーバーシステム
JPH06202978A (ja) 論理経路スケジューリング装置及び実行方法
JP2012094030A (ja) 計算機システム及び処理制御方法
CN101663646A (zh) 计算机系统及其控制方法
CN105939389A (zh) 负载均衡方法及装置
JPH03257644A (ja) 主メモリ管理方法
JPH10511785A (ja) 分散形コンピュータシステムの構成機構
JP2001209627A (ja) 情報処理システム
KR19990043986A (ko) 업무 인계 시스템
EP0830791A1 (en) Resource availability in intelligent telecommunications networks
CN115202810A (zh) 一种Kubernetes工作节点分配方法及系统
CN110795151A (zh) 算子并发度调整方法、装置和设备
AU699695B2 (en) A computer controlled system
WO2024038605A1 (ja) 管理サーバ、管理方法、および、管理プログラム
CN107786365B (zh) 一种集群扩容方法及装置
JPH06231091A (ja) 物理プロセッサのハント方式
JPH0619858A (ja) 共有資源自動返却方式
AU693373C (en) Resource availability in intelligent telecommunications networks