JPH01130252A - コンピユータ集合体結合装置 - Google Patents

コンピユータ集合体結合装置

Info

Publication number
JPH01130252A
JPH01130252A JP63226714A JP22671488A JPH01130252A JP H01130252 A JPH01130252 A JP H01130252A JP 63226714 A JP63226714 A JP 63226714A JP 22671488 A JP22671488 A JP 22671488A JP H01130252 A JPH01130252 A JP H01130252A
Authority
JP
Japan
Prior art keywords
network
nam
node
message
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63226714A
Other languages
English (en)
Inventor
Nagui Halim
ナーギイー・ハーリム
Christos N Nikolaou
クリストス・ニコラス・ニコロウ
Jr John A Pershing
ジヨン・アーサー・パーシング、ジユニア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH01130252A publication Critical patent/JPH01130252A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A8産業上の利用分野 本発明は一般にコンピュータ・ネットワークに関し、さ
らに具体的には、複数のコンピュータを備えたコンピュ
ータ・センタ用のコンピュータ・ネットワークに単一ノ
ードのイメージを提示するための方法及び装置に関する
ものである。
B、従来技術及びその問題点 端末及び知能ワークスチーシロンは一般にデータ・セン
タに連結され、データ・センタは他のデータ・センタに
連結される。したがって、エンド・ユーザは構内の高性
能コンピュータ・システムに対してアクセスすることが
できるだけでなく、地理的に遠隔のユーザによるアプリ
ケーション及びデータに対するアクセスを実現し、さら
にワークステーション相互の通信を可能にするために、
世界中に設置されたデータ・センタの高性能コンピュー
タ・システムに対してアクセスすることができる。銀行
ネットワーク、POSネットワーク及び航空産業にその
例が見られる。
そのようなデー°夕・センタ(またはコンピュータ・セ
ンタ)で必要とされる、計算及び記憶量が急速に増大し
ている。幾つかのシステムでは、数万のユーザがコンピ
ュータ・センタと対話し、毎秒当たり数千のトランザク
ションを必要とし、その上1.2秒の応答時間を必要と
する。
最大の能力及び可用度をもたらすため、複数のコンピュ
ータ・システムが1つのデータ・センタ内で互いに結合
されることがよくある。コンピュータを互いに結合する
ことにより、データ・センタ内の最も強力な1台のコン
ピュータで通常得ることができる以上の能力を必要とす
るデータ処理ジョブもそのまま処理することができる。
なぜならば、処理負荷を複数のコンピュータ間に分配す
ることができるからである。さらに、複数のコンピュー
タが利用できると、故障または他の障害の場合に別のシ
ステムまたはコンピュータに引き継ぐことができるので
、故障に対する許容性が増大する。
既存の結合方式は、単一システム設計に比べて能力及び
可用度の上で種々の程度の利点をもたらすが、さらに重
要なことに、システム内で実行中のプログラムに、単一
システムのイメージを与える。したがって、プログラム
は通常、どのコンピュータ・システムで実行されている
かを知らず、または気にか先すない。
たとえ、結合されたコンピュータ・システムの集合体(
complex)が、集合体内で実行されているプログ
ラムから見て単一システムに見えたとしても、自分の端
末からコンピュータ・ネットワークを介して集合体にア
クセスするユーザには、依然として別々のコンピュータ
・システムををする多重システムに「見える」。ユーザ
は数台のコンピュータ・システムのうちの1台に対して
「ログ」オンしなければならない。このことは、選択さ
れたシステムがオーバロードになったり、たまたま故障
した場合は、ユーザにとってネックになる可能性がある
サラに、単一ノード・イメージをもつ単一データ・セン
タをネットワークに提供しないと、ネットワークの複雑
性が増大する。データ・センタ内の多数のプロセッサは
ネットワークに対してトランスペアレントすなわち透過
でなければならないが、既存のネットワークではそうで
はない。
既知のネットワークでは、新しいフンピユータをデータ
・センタに追加したとき、ネットワークにそのことを知
らせなければならず、新しいコンピュータをネットワー
ク・ノードとして使って新しいネットワーク経路を定義
しなければならず、したがって、ネットワークの制御ト
ラフィックを生成しなければならない。その場合、デー
タ・センタ内の特定プロセッサ上で負荷を均衡させるの
にもネットワークがかかわってくる。なぜならば、仮想
回路(セツション)を制御する処理を、過負荷を課され
たプロセッサから遊休プロセッサに再配置しなければな
らないからである。しかし、各プロセッサがそれぞれ異
なるネットワーク・ノードを表わす場合は、仮想回路を
再配置するのに、1つのノードでそれを終了させ、別の
ノード(プロセッサ)で再活動化させることが必要にな
る。
そのような再配置は、大きなネットワーク・オーバーヘ
ッド及び破壊を伴うことになる。そのような再配置を回
避できれば、ネットワークの処理能力が向上するので望
ましい。
IBM社のJES2またはJES3プログラムの制御下
にあるMVSシステムの集合体、UCLAのローカス(
Locus)システムのもとで結合されたUNIXシス
テムの集合体、及びIBM社のVM(仮想計算機)シス
テムを使用した集合体を含めて、そのような結合の例が
すでに幾つか存在している。これらのシステムは単一シ
ステムと比べて能力及び可用度の上で種々の度合いの改
善をもたらしている。さらに重要なことには、これらの
システムでは、プログラムは通常、どのコンピュータ・
システム上で実行されているか「知らず」、または「気
にかけない」。しかし、従来技術では、コンピュータの
集合体が、この集合体に接続されたネットワークにとっ
て単一ノードに見えることが可能なシステムは示されて
いない。
次に、本発明を実質上IBMシステム・ネットワーク体
系(SNA)に基づく環境で説明する。
ただし、本発明は特定の種類のネットワークに限定され
るものではない。代表的なSNAネットワークは、IB
M社の解説書rSNAの概念とプロダクト(SHA C
oncepts and Products) J s
 I B M社刊行物GC30−3072,!:、IB
M社の刊行物rSNAの技術的概説(SHA Tech
nicalOverview) J 、GC30−30
73に記載されている。
C0問題を解決するための手段 したがって、本発明の目的は、結合されたシステムがネ
ットワークならびにネットワークを介して集合体にアク
セスするユーザに単一ネットワーク・ノードのイメージ
を与えるように、結合されたシステムの集合体を1つの
または複数のネットワークに接続するためのシステム及
び方法を提供することである。
本発明の目的には、結合された集合体の拡張された能力
及び可用度がネットワークで使用可能になるような形の
、ネットワーク接続を提供することも含まれる。
本発明のその他の目的、利点及び特徴は、添付の明細書
及び図面を参照することにより一層明らかになるであろ
う。
本発明の好ましい例示的な実施例では、1つのノードに
複数の結合されたプロセッサを有するコンピュータ集合
体を結合するための装置が提供される。コンピュータ集
合体は、本発明の結果として、ネットワークにとって単
一ノードに見える。
このノードは、複数のノード、及びこれらのノード相互
を連結する複数の通信回線を有するデータ通信ネットワ
ークに結合される。通信回線は伝送グループに分けられ
、各伝送グループは少なくとも1本の通信回線を含む。
集合体中のプロセッサの1つは制御プロセッサと呼ばれ
、1つのノード内の機能を制御するための資源管理機構
を含む。
他のプロセッサは非制御プロセッサと呼ばれる。
非制御プロセッサは、その中に動作可能なネットワーク
・アクセス方式(NAM)を含み、データ移送機能をノ
ードの内外に向けるための資源を含む。ノード用のデー
タ移送機能は複数のNAMの間に含まれる。ネットワー
ク内の少なくとも1つのプロセッサは、制御プロセッサ
に命令を送ってネットワークを管理するシステム・サー
ビス制御点プログラムを含む。
D、実施例 単純化したネットワークを示す第2図を参照する。この
説明では、このネットワークは5つのノード8.10,
12.14.16と5本のリンク9.11.13.15
.17.18を有するものとする。リンク9.11.1
3.15.17.18は論理通信リンクであり、2つ以
上の物理的接続を含むことができる。
選択された任意の2つのノード間の通信は、通常幾つか
の経路をとることができる。たとえば、ノード10はリ
ンク11、ノード12及びリンク13を介して、あるい
はリンクエ8、ノード16及びリンク15を介して、あ
るいはその他の経路でノード14と通信することができ
る。ノード8はリンク9及びノード16を介してのみネ
ットワーク内の他のノードと通信することができる。
アーキテクチャ上、ネットワーク・ノードは1本または
複数の遠隔通信回線の終了点にすぎな、い。
通常は、1つのノードは1台のコンピュータと等価であ
る。しかし、本発明を使用すれば、複数の結合されたシ
ステムの集合体も1つのノードと見なすことができる。
本発明は、結合されたシステムの集合体をIBM社のシ
ステム・ネットワーク体系(SNA)等の仮想回路本位
のネットワークに接続するための方法及び装置について
説明される。仮想回路(またはセツション)は、活動化
して種々のプロトコルをもたらすように修正することが
でき、要求に応じて非活動化することができる2人のネ
ットワーク・ユーザの間の論理的接続であると定義され
る。
セツション活動化要求及び応答が、データ交換の速度及
び同時性、競合及びエラー回復の制御、及びデータ・ス
トリームの特性等に関係するオプションを決定すること
ができる。
コンピュータ・ネットワークとその構成要素が実行しな
ければならない機能の定義が、そのアーキテクチャであ
る。これらの機能を実行するソフトウェア・コードまた
はハードウェアが、インプリメンテーションである。ネ
ットワーク・アーキテクチャは通常、第1図に示すアー
キテクチャと一般に類似する層状の対等アーキテクチャ
で記述される。これらは物理層ではないが、その代わり
にプログラミング及びハードウェアの動作全体を理解す
るための概念上の枠組みを与えるために使用される。さ
らに重要なことは、あらかじめ定義したインターフェー
スを層間に有する標準化された層状アーキテクチャを使
用する構造を採用することにより、他の層に変更を加え
る必要なしに、1つの層に変更を加えることができる。
プロセッサまたは記憶サブシステム・アーキテクチャと
は違って、ネットワーク・アーキテクチャは、2つのパ
ーティの対としての対話を常に伴う。
たとえば、後の説明で一層明らかになるように、あるノ
ードにあるデータ・リンク制御(DLC)要素は別のノ
ードのDLCと対話し、同様に、2つのノードにある経
路指定機能は互いに対話し、以下同様である。
対としての対話のそれぞれに対する一組の規則はプロト
コルと呼ばれ、したがって、ネットワーク・アーキテク
チャは、対等レベルの層の対相互間の通信用のプロトコ
ルに関して指定される。ネットワーク・プロトコルは3
つの要素からなる。すなわち、(1)構文、すなわち、
フィールド形式(ヘッダ・ビット)または文字列のいず
れかの形のコマンド及び応答の構造、(2)意味論、す
なわち、出される要求、実行される動作、及びいずれか
のパーティから返される応答の組、及び(3)タイミン
グ、すなわち、事象の指定及び順序である。
第1図はSNAの層状アーキテクチャの概略図である。
中間ノードは示されていないが、実際には、1つまたは
複数の中間ノードが存在することがある。さらに、一端
にある層が、2つ以上の物理ボックス内にあってもよい
。たとえば、ホスト側で、すべての機能がホスト内にあ
っても、または、DLC及び経路制御に対応する機能が
別個の通信制御装置のソフトウェア中に存在し、残りの
機能がホストに存在してもよい。また、すべてのアクセ
ス経路機能をフロント・エンド通信プロセッサに移し、
ホスト・プロセッサをアプリケーションの処理に集中で
きるように空けておくことも可能である。端末側では、
図に示したすべての機能が知能端末内の同じボックスに
あってもよく、最上層を除くすべての層が、幾つかのダ
ム(dumb)端末をサポートする集合制御装置内にあ
ってもよい。
物理的制御層(層1)は、最終ユーザと最終受信者の間
の実際の物理的リンクをもたらす。この層は、モデム、
電話回線等の種々のハードウェア構成要素を含む。この
層は、2台のDTE (データ端末装置)間またはDT
EとDCE (データ回路終端装置)の間で電気的接続
を確立、維持及び切断するのに必要とされる電気的特性
を定義する。
データ・リンク制御(DLC)層(層2)は、しばしば
雑音を含む伝送設備を横切ってデータ・パケット(通常
、フレームと呼ばれる)を完全な状態で転送する。接続
された回線20−2.5(第4図に示し、以下相説明す
る)のそれぞれについて1つのDLC要素(DLCE)
がある。DLCはエラー検出及び訂正を含むことがある
。DLC機能は、やはり第4図に示す回線アダプタ3〇
−35によって実行される。
経路制御(PC)層(B3)は、入力データ・パケット
を適当な出力DLCEまたは同一モード内の正しい地点
に送ることを担当する。この届はデータ・パケットのア
ドレッシングを処理し、データ・パケットが特定のアド
レスに到達するために取る経路を識別する。アーキテク
チャによっては、これはネットワーク層と呼ばれること
もある。−般に、1ノード当り1つの経路制御要素があ
る。
経路制御層はまた、ネットワークを横切ってユーザ・ノ
ード間で制御権をやりとりする端末間移送層を含む。こ
の層はアドレッシング、データ保証、フロー制御等のネ
ットワーク渋滞制御を含む。
経路制御層はセツション層と共にデータ移送機能を構成
する。経路制御層は、伝送グループ(TG)、仮想経路
(VR)及び明示経路(ER)の各別層すなわち機能を
含む。VR副眉は、データ・パケットの端末間連続性を
制御するために使用される。V R=+I PIはそれ
をシステムの渋滞とデータの優先順位に基づいて行なう
。ER副層は、データ・パケットが取る実際の物理的経
路を具体的に示す。たとえば、第2図で、データ・パケ
ットをノード8とノード12の間で転送する必要がある
ものとする。これは、リンク9−ノード16−リンク1
7−ノード12を介して行なうことができ、明示経路(
8,9、工6.17.12)として定義することができ
る。
(制御プロセッサ46によって)プロセッサ40.42
及び44上で独立して実行される通信ソフトウェアまた
はネットワーク・アクセス方式(NAM)に遠隔通信回
線20−25を割り当てることは、考察中のSNAでは
多重リンク伝送グループ(TG)が存在するために制限
されている。
TGは実質上、複数の物理回線から成る1本の論理的遠
隔通信回線である。様々な性能上考慮すべき点があるた
め、1つのTGを複数のプロセッサに分配することは実
用的でないが、複数のTGを1台のプロセッサに割り当
てることは可能である。
したがって、1つのTGの一部であるすべての回線が1
台のプロセッサに割り当てられ、さらに、TGは、NA
M間に分配されるネットワーク負荷の単位量になる。
この開示の残りの部分では、論理リンク、または単にリ
ンクという用語は、TG (TGプロトコルを使用する
とき)、ならびに遠隔通信回線(TGプロトコルを使用
しないとき)を指すものとする。
セツション層(層5)は、伝送制御(TC)及びデータ
・フロー制御(DFC)の各副層を含む。
セツション制御層は、エンド・ユーザ間でのデータ転送
用の論理的接続を活動化、維持及び非活動化する。
伝送制御は、歩調合せ(フロー制御)を管理し、さらに
エンド・ユーザのために他の機能(たとえば、暗号)を
実行する。1つのセツション及び1人のエンド・ユーザ
当り1つの伝送制御要素(TCE)がある。各TCEは
通信ネットワークに対する1つのエンド・ユーザ・セツ
ションの「フロント・オフィス」と考えることができる
データ・フロー制御(DFC)は、エンド・ユーザ間の
対話制御を実行する。たとえば、ユーザが要求するメツ
セージ方向及び断続性の独自性に対処する。これらの独
自性には、ユーザが全2重方式で通信したいのかそれと
も半2重方式で通信したいのか、あるいは別々のメツセ
ージが、エンド・ユーザから見えるより大きな仕事の単
位の一部なのかどうかがある。1つのエンド・ユーザ・
セラシロン当り1つのDFCがある。
提示す−ビスCPS’)層(層6)は、データ形式、及
び必要とされるデータ変換をもたらす。対になったノー
ドにある28層の対は、エンド・ユーザ及びアクセスさ
れているアプリケーションから見て異なる端末インター
フェースに対処するジョブを有する。
最後の層はアプリケーション層(層7)である。
ネットワークを使用しようとする人間または処理(エン
ド・ユーザ)がこの機能を行なう。厳密に言えば、工(
ンド・ユーザはSNAネットワークの一部ではなく、む
しろこのネットワークのユーザである。
ネットワーク・トラフィックは、結合されたシステムの
集合体という観点から以下の2つの種類にまとめること
ができる。
集合体から発する、または集合体に向かう終点トラフィ
ック・ 起点及び宛先がネットワーク外にあり、集合体を「単に
通過する」中間ネットワーク・ノード(INN))ラフ
イック。
たとえば、第2図では、8から出発してノード12に向
かうトラフィックは、ノード12では終点トラフィック
であるが、ノード16ではINNトラフィックである。
多重プロセッサ・ネットワーク・ノードの容量特性は、
これら2種類のネットワーク・トラフィックの混合の度
合に関係している。
終点トラフィックはNAMプロセッサの増加に応じて直
線的に増大するが、INN)ラフイックは、プロセッサ
数が増加するにつれて減少する傾向がある。
本発明は、「終点」ネットワーク・トラフィック(すな
わち、このノードから出発してネットワークに向かうト
ラフィック、及びこのネットワークから出発してこのノ
ードに向かうトラフィック)では、所与のTGと、vR
及び半セツションの集合との間に完全な類縁性があると
いう認識を利用したものである。所与のTGは幾つかの
ER終点をサポートする。どのER終点も1つのTGの
みによってサポートされる。所与のER終点は幾つかの
VRをサポートする。どのVRも1つのER終点のみに
よってサポートされる。所与のVRは幾つかの半セツシ
ョンをサポートする。どの半セツションも1つのVRの
みによってサポートされる。
もちろん、各TGはいつでも一定数のDLCに結合され
るが、1つのDLCが複数のTGによって同時に共用さ
れることはない。
したがって、TGに基づいてデータ移送機能を分割する
ことが可能である。限定的な事例では、ノード中でサポ
ートされる各車−TGについて1つの区画が可能である
が、複数のTGを含む区画も考慮されている。データ移
送機能のこれらの区画はネットワーク・アクセス方式(
NAM)のインスタンスである。
通常のメツセージは、ヘッダ域及びデータ域を含む。そ
の形式を第5図に示す。ヘッダ域90では、種々の情報
が含まれている。図のように、これらはDLC92、伝
送グループ94、明示経路′96、仮想経路98、及び
セツション99に関係づけられる。その後に、100で
データを見つけることができる。
この形式を用いると、ノードの特定の屑が、それぞれそ
の層に関連するデータを除去または前置することができ
る。すべての層がメツセージ・パケットを処理した後に
、処理または伝送に必要なデータが残る。
次に第3図を参照する。SNAノードの機能は3つの重
複した広いカテゴリに細分することができる。これらは
データ移送機能、制御機能及びネットワーク・アドレス
可能ユニット(NAU)を含む。
データ移送機能(「送受信経路」とも呼ばれる)は、ネ
ットワークと終点の間でのデータの移動(すなわち、以
下に説明するNAU)に関するものである。これらの機
能は、第3図で点線20で囲んである。データ転送機能
は、すでに考察したSNAネットワークのデータ・リン
ク制御(DLC22)、経路制御(TGC24、ERC
2B、及びVRC28) 、及び半セッシ日ン(TC及
びDFC)の各層である。
技術的には、各半セツションは1つのNAU中にあり、
DLC及び経路制御機能はすべてのNAUによって等し
く共用される。とは言え、実際のインプリメンテーシヨ
ンでは、セツションを含むデータ移送機能は、すべての
NAUによって共用される1つのコード群によりすべて
提供されるので、それらをNAUからまったく独立し、
たちのと見なすと好都合なことに留意されたい。
制御機能は、種々のデータ移送機能の活動化及び非活動
化に関係する。これらの機能は実際には管理機能である
。ノード内で大部分のデータ移送機能では多くのインス
タンス(たとえば、大型の本体システムでは50000
を超えるセツション)が発生するが、概念的には、所与
のノード内で制御/管理機能のただ1つのインスタンス
だけが発生する。
ネットワーク・アドレス可能ユニット(NAU32.3
4.3B、38)はネットワークのノードの終点を表わ
す。3種類のNAUがある。すなわち、エンド・ユーザ
を表わす論理ユニット(LU)と、幾つかのノード中の
みにありネットワーク制御/管理機能を実行するシステ
ム・サービス制御点(SSCP)と、すべてのSNAノ
ードにありそのノードに対する種々の制御機能がアーキ
テクチャ上具体化されたものである物理ユニット(PU
)である。制御機能は一般にPU中にある(制御プロセ
ッサ46内の機能)。
ネットワーク制御/管理機能(SSCP)とノード制御
/管理機能(PU)の違いに留意されたい。
どちらも当技術分野では漠然と「制御機能」または「制
御点」と呼ばれている。
5scpは、「タイプ5」のSNAN−ノード中にある
NAUである。5scpはネットワーク全体の一部分(
SSCPの定義域)の動作を制御し、ネットワーク全体
を管理するため他の5SCPと対話する。5scpはど
のネットワーク・ノードをも(それ自体のノードさえも
)直接制御せず、種々のノードにあるPUに対して要求
を送り、実際にはそれらのPUがノードに固宵な制御を
行なう。
PUは、ネットワーク内のすべてのノードにあるNAU
である。PUは1つまたは複数の5SCP (PUがr
タイプ5」以外のノードにある場合は、遠隔ノード内に
あってもよい)の指示のもとてそのノードの動作を制御
する。
第4図は、複数のプロセッサを有し、本発明を組み込ん
だデータ・センタの概略図である。遠隔通信回線20−
25 (物理層)はそれぞれ専用の回線アダプタ30−
35を介してデータ・センタに入る。回線アダプタ30
−35は回線制御機能(「データ・リンク制御J−DL
C)を実行し、回線切換え機構37を介して種々のプロ
セッサ40.42.44.46にインターフェース接続
する。
回線アダプタ30−35は、遠隔通信リンクを介して記
憶域から(データの)フレームを送るために、または遠
隔通信リンクを介してフレームを記憶域内に受は取るた
めに必要な、低レベルの物理的作業を実行する。受信の
場合は、この作業は、ビット遷移に関して回線を走査す
ること、伝送エラーを検出すること、エラーが検出され
た場合に再伝送を要求すること、バイト組立て、フレー
ム組立て、最後に、フレーム全体が到着したことを他の
ソフトウェア構成要素に知らせることを含む。
送信の場合は、この作業は、データを直列化してそれを
一時に1ビツトずつ遠隔通信回線に提示すること、CR
Cまたはブロック検査等のエラー検査コードを構成する
こと、及びリンク・レベルの肯定応答を受は取ったとき
、ソフトウェア構成要素に伝送の完了を知らせることを
含む。可用度及び構成可能性のため、回線切換え機構3
7は、NAMを含むある機械から別の機械へ回線の経路
を切り換えることができる。このことは、第1の機械が
故障した場合に特に重要である。
容量(負荷均衡)及び可用度の要件を満たすため、遠隔
通信回線20−25を各回線が複数の個別システムの間
で切り換えできるように、多重システム・データ・セン
タにする。これは回線切換え機構37を使って行なうこ
とができる。すべてのシステムに対してすべての回線を
完全に相互接続することはどうしても必要なものではな
いが、この説明ではそうであるものと仮定する。通常、
各回線はプロセッサの1台に「静的に」割り当てられる
。ただし、システムの負荷の均衡をとり直すため、また
はプロセッサ40.42またハ44のうちの1台の故障
から回復するため、これらの「静的な」割当てを、経時
的に変更することができる。
集合体内通信用に使用される「結合機構J50は、通常
のネットワーク接続に比べて高速かつ待ち時間が少ない
。結合機構50は、本発明を費用効率の点で魅力的なも
のにする基本ハードウェア/ソフトウェア機構の一部で
ある。
DLC層(第1図参照)よりも「上層」にあるすべての
データ移送機能は、第4図の結合された各プロセッサ4
0,42及び44の間に分配され、ネットワーク・アク
セス方式(NAM)と呼ばれるプログラムによって実行
される。IBM社のSNAでは、NAMは伝送グループ
(TG)、明示経路(ER)、仮想経路(VR)、及び
セツションの各プロトコルを含む。NAMは各プロセッ
サ40.42.44及び46中にあり、これらの各プロ
トコルを実現する。各NAMは他のNAMとは独立して
曇(が、それぞれ別のNAMと通信することができる。
データ移送機能は(ネットワーク制御/管理機能とは対
照的に)定常状態の動作中に大多数の処理要求を引き起
こす。
ネットワーク・アクセス方式(NAM)は、次のような
4つの独立したソフトウェアを介して到着するメツセー
ジを処理する。
1)  NAM−NAM間イフィンターフエース2アプ
リケーション(SSCPを含む)−NAM間イフィンタ
ーフエ ース データ・リンク制御−NAM間イフィンターフエ ース  NAM−制御プロセッサ間インターフェース これらのインターフェースはそれぞれかなり多数の異な
るメツセージ・タイプ、形式、及び機能をサポートする
。これらのインターフェースについて以下に説明する。
入力側では、NAMは、−度DLCによって正しいかど
うか検査されたメツセージをリンクから受は取ることを
担当する。任意の1つのDLCからのメツセージは、T
G層の1つのインスタンスが受は取り、そこで組み合わ
されて1つの論理ストリームになり、経路指定のために
ER層に送られる。その時点で、メツセージはINN)
ラフイックの場合はネットワークに送り返され、または
メツセージがそれらの宛先に到着したという判定が行な
われる。後者の場合は、メツセージは、最終的にアプリ
ケーションに到達するまで、「アーキテクチャ化された
」プロトコルに従ってネットワークの各層を通って進む
出力側では、NAMは伝送すべき個々のパケットをDL
Cに割り振ることを担当する。NAMはまた、保留中の
伝送を別のDLCに割り当てし直すことにより、DLC
が故障した場合に処理を行ない、また実際には幾つかの
独立した物理リンクから構成される論理リンクに単一の
外観を与えるために一般に必要なプロトコルを処理する
最も複雑なインターフェースは、NAM−制御プロセッ
サ(PU)間のインターフェースである。
このインターフェースは、NAM中で定常状態のネット
ワーク・プロトコルをサポートするために必要ナセット
アップ及びティクダウンを制御する。
このイン、ターフエースは、リンク活動化、ネットワー
ク経路制御、セツション・サービス及びアプリケージ日
ン・サービスの各機能を処理する。
幾つかのインターフェースがこのソフトウェアの構成に
とって重要である。そうしたインターフェースには、N
AM−アプリケーション間、NAM−NAM間、NAM
−3SCP間、NAM−DLC間、5SCP−DLC間
、及び5scp−PU間のインターフェースがある。こ
れらの論理インターフェースは、一般に、機械境界を横
切り、低レベルの総称移送インターフェースによって実
現される。これらのインターフェースの形式及びプロト
コルは、以下の例外を除き、公表されたSNA体系の範
囲に含まれるか、またはそれによって暗示される。NA
M−NAM間イフィンターフエースしいもので、2つ以
上のNAMが存在するために必要である。NAM−アプ
リケージジン間インターフェースは、分配されたアプリ
ケーションをサポートするために微妙に変更される。N
AM−NAM間イフィンターフエースNAM−アプリケ
ージeン間インターフェースに対する変更については後
で説明する。ただし、本発明には、各NAM及び各DL
C中で実現された機構が含まれており、それにより、こ
れらのインターフェースの任意の1つに属する各メツセ
ージがそういうものとして認識され、適宜経路指定され
る。NAM及びDLC中での経路指定は、やはり遠隔ネ
ットワーク資源(遠隔PU及びLU等)を出力TG(N
AM)または通信回線(DLC)にマツプし、ローカル
・ネットワーク資源を所WNAMにマツプするテーブル
を使って行なわれる。
NAM−PU間及びPU−DLC間イフィンターフエー
ス本発明により、ローカル・ネットワーク資源を所有N
AM及びDLCにマツプするテーブルの保守を含むよう
に拡張される。PUはこうした保守を担当する。ただし
、これらのインターフェースは特定の(論理的)副区域
ノードにとって内在的であり、他のネットワーク・ノー
ドとのその対話に影響を及ぼさないことに留意されたい
最も簡単なインターフェースは、NAM−NAM間イフ
ィンターフエースる。このインターフェースは、このノ
ード宛でないメツセージの到着を処理する。そのような
メツセージが到着したときは、次にそのメツセージがど
のノードに送られるかがER層によって判定される。そ
のノードへの経路は、多分、データを受は取るNAMと
は異なるNAMによって所有されるあるTGを経由する
。そうである場合、そのメツセージは他の作業なしに、
単に結合機構50を介して受信NAMから目[NAMに
送られる。
アプリケーション−NAM間イフィンターフエース際に
は複雑であるが、概念的には簡単である。
その概念は、端末にいるネットワーク内のエンド・ユー
ザが、このインターフェースを介してアプリケーション
に「ログオン」シ、次に、このインターフェースを横切
る個々のメツセージを送受信することにより、そのアプ
リケーションとの対話を進めるというものである。メツ
セージの内容は、アプリケーション及びエンド・ユーザ
の責任であり、メツセージの流れの管理及び、順序、配
送、メツセージ・ボリュームの保証はNAMの責任であ
る。
このインターフェースが複雑なのは、実際には、オペレ
ーティング・システムが、要求が妥当かどうかを検査し
、アプリケーションまたはNAMの実行のスケジュール
を立て、さらに、一般に、このインターフェースの両端
間であるレベルの保全性及び保護をもたらさなければな
らないことからくるものである。アプリケーションが先
に進む前にユーザからの応答を待つか否か等、ネットワ
ーク・プロトコルまたは本発明に直接関係しない幾つか
のオプシeンがスケジューリングのために利用できる。
制御プロセッサ46は、システム・サービス制御点(S
SCP)に基づくセツション、すなわち、5SCP−8
SCP1SSCP−PU、及び5SCP−LUセツショ
ンを使って、「ネットワーク・サービス要求ユニット(
RU)Jを他のノードにある制御点と交換することによ
り、ネ・ソトワーク動作を制御する。上記セツションで
、P’Uはノードにある物理ユニットであり、LUは論
理ユニットまたはエンド・ユーザである。ネットワーク
・サービスRUのカテゴリには、以下のものがある。
(1)リンクを活動化及び非活動化し、ノードをロード
及びダンプし、ネットワーク・アドレスの構内アドレス
への割当て等の動的再構成を実行し、さらに、一般に、
物理的構成と関連する資源を制御するために5SCP−
PUセツションでサポートされる構成サービス。
(2)LU−LUセツションを活動化する際にLUを支
援するために5scp−sscp及び5SCP−LUセ
ツションでサポートされるセツション・サービス。これ
には、そのセツション開始要求でLUによって提示され
るネットワーク名の5SCPによるネットワーク・アド
レスの分解、エンド・ユーザのパスワード及びアクセス
許可の検査、及びセツション・パラメータの選択と突合
せ等の動作が含まれる。
(3)テスト及び追跡を実行し、ネットワーク資源に関
する統計を記録するために5SCP−PU及び5SCP
−LUセッシeンでサポートされる保守及び管理サービ
ス。
(4)将来の定義用に取って置かれるネットワーク・サ
ービスのカテゴリである測定サービス。現在、測定デー
タの全集合は、LU−LUセツションを使って定義され
たインプリメンテ−シコンである。
SNAに固有のネットワーク・サービスの種々のカテゴ
リに関するさらに詳しい情報は、rSNAの形式及びプ
ロトコル解説書:アーキテクチャ論理(SNA For
mat and Protocol Referenc
eManual: Architectural Lo
gic) J N S C30−3112の第7章、第
8章及び第9章に記載されている。ネットワーク・サー
ビス要求ユニット(RU)であるメツセージは、受信N
AMがそういうものとして認識できるので、入力ネット
ワーク・サービスRUは受信NAMがそれを制御プロセ
ッサに正しく経路指定することができる。一方、(制御
プロセッサ上で稼働する)PUは、5SCP−8SCP
%5SCP−PU及び5SCP−LUセッシ瞠ンを、遠
隔5SCP1PU及びLUに対する個々のNAMに属す
る出力TGにマツプするテーブルを(本発明の一部とし
て)備える。構内PU及びLUの場合は、上記テーブル
は、5SCP−PU及び5SCP−LUを、PUまたは
LUを所有する個々のNAMにマツプする。
NAMまたは制御点が(別の)NAMまたは制御点と通
信することを可能にするプロセッサープロセッサ間送受
信機構が必要である。この機構はネットワーク回線と比
べて妥当な速度でなければならず、メツセージを送られ
た順序通り正しく伝達しなければならない。
システム内の他のソフトウェア構成要素を探し出すため
のシステム全体にわたるディレクトリ・サービス、と、
送受信機構が使用するソフトウェア構成要素相互間の論
理的経路を確立するための機構も必要である。これは一
般に以下のように実現される。すなわち、結合機構50
内の低レベルのデータベース・サービスが、機械相互間
での情報パケットの伝達を行なう。ハードウェアまたは
ソフトウェアの形の高レベルのプロトコルがその伝送に
ついてエラーの有無を検査し、必要なら再伝送し、順序
の狂ったパケットを並べ直す。この層は、基本ハードウ
ェアから要求された場合、長いメツセージをより小さな
パケットに分割することも担当することがある。大域デ
ィレクトリ・サービスは、データベースを更新し探索す
る分散または集中ソフトウェア構成要素を用いて、名前
を含む集中データベース上に構築される。その後、この
構成要素は、ソフトウェア構成要素名を、論理的経路を
セットアツプするために使用される低レベル・ハードウ
ェア・アドレスにマツプすることができる。
それぞれのネットワーク制御/管理機能(SSCP)は
副区域ノード制御/管理機能(PU)と同様に一体構造
のままであり、プロセッサ46(制御点とも呼ばれる)
上にある。制御プロセッサ46は集合体の結合機構50
を介して種々のNAMと通信し、その動作を指示する。
制御プロセッサ46は通常のデータ移送機能に関係して
いないことに留意されたい。制御プロセッサ4Bは「セ
ットアツプ」及び「ティクダウン」活動にかかわる。
たとえば、遠隔通信回線が活動状態になったとき、制御
プロセッサ46中にあるPUは、どのNAMがこの回線
を扱うかを判断し、回線切換え機構を介して回線を「捕
捉」するようにそのNAMに指示する。
本発明は、ホスト副区域ノードの機能を、データ処理集
合体の複数の通信機能プロセッサ(CFP)に分配する
ものである。
第3図に示すように、すべてのネットワーク・ノードに
、ネットワーク資源(たとえば、セツション、VR,T
GlDLC)及び管理機構がある。
管理機構はそれらのノードにある資源の活動化及び非活
動化を担当し、−まとめにしてPUと呼ばれる。本発明
では、管理機構はすべて制御点プロセッサ46内に入れ
られ、残りのネットワーク資源はすべて集合体内で定義
されたNAMの間に分散される。
本発明では、資源エージェントが使用される。
資源エージェントとは、あるNAMに含まれるプログラ
ムであり、別のNAMにある資源を表わす。
資源エージェントの唯一の目的は、それが代表している
資源に対するメツセージを受は取り、それをその資源を
含むNAMに転送することである。
資源からNAMへのマツピングは動的であり、(制御プ
ロセッサ内の)当該の管理機構により資源初期設定時に
行なわれる。
資源とは、NAM及びPU内に存在するエンティティで
ある。管理資源及び非管理資源の両方があり得る。非管
理資源は、ネットワーク内の他の任意の資源が識別のた
めに使うネットワーク・アドレスを有する。非管理資源
には、物理資源(リンク、回線アダプタ、ノード等)及
び論理資源(セツション、伝送グループ、仮想経路、明
示経路、データ・リンク制御)の両方が含まれる。PU
内の資源は管理資源である。管理資源は特定のPUの支
援のもとて非管理資源を制御する。
管理機構はIPL時に初期設定され、新しいNAMが集
合体に追加される度にそのことを知らされる。すべての
資源管理機構を代表するエージェントが、そのNAMで
作成される。非管理資源であるネットワーク資源を表わ
すエージェントは、特定のNAMでそれに対する必要が
生じたときに作成される。リンク・エージェントは必要
でないが、各NAMにリンク管理機構エージェントがあ
る。
たとえば、その集合体から出発せず、また集合体に向か
うものでもないが、第1の伝送グループ(TGI)から
その集合体に入って別の伝送グループ(TG5)から出
るERが活動化され、かつ第1の伝送グループ(TGI
)が現在、たとえば、HAM3によって所有され、第2
の伝送グループ(TG5)が現在NAM7によって所有
されている場合、このER上を移動し、第1の伝送グル
ープ(TGI)を介して集合体に入るすべての通過メツ
セージを受は取るため、NAMS上のTG5に等しい識
別(id)をもつエージェントが作成される。これらの
メツセージは次にこのエージェントTG5によってHA
M7に転送され、そこで集合体から出る。エージェント
にそのエージェントが代表する資源と同じidを付与す
ることにより、既存の単一物理副区域ノード通信ソフト
ウェアを新しい環境で十分再使用可能にすることが可能
になる。なぜならば、エージェントは、あたかも資源で
あるかのように作用するからである。エージェントを使
用すると、資源自体はNAMにないという事実がおおい
隠され、資源の所在場所が通信ソフトウェアに対してト
ランスペアレントになる。
上記のことを実現するプログラムを、以下に記載するフ
ローチャート及び擬似コードで説明し図示する。擬似コ
ードは、他の多数のコンピュータ言語と類似する汎用言
語であり、一般に説明のために使用される。
第6図は、< N A M −i d >という名前を
有するネットワーク・アクセス方式のフローチャートで
ある。ステップ150で、in− messageと呼ばれるメツセージを受は取る。
ステップ152でN  in  messageメツセ
ージが当該のエージェントまたは資源に送られ、そこで
処理される。この動作は経路153を経て反復される。
第7図に、たとえば第6図のフローチャートからi n
−me s s ageを受は取る非管理資源の省略し
たフローチャートを示す。ステップ160で、メツセー
ジを受は取り、ステップ162で、そのメツセージが資
源を所有するNAMに送られる。この動作も経路163
を経て反復される。この機能を記述する擬似フードは以
下の通りである。
<resource−id>=   procedur
e  (in  message)do foreve
r receive (in−message);/”ow
ner returns the HAM−id cu
rrentlyown ing’/ /”the resource <resource−
id>’/5end  in  message、  
to  owner  (<resource  id
>);end; この擬似コードは、各メソセージが、前述のように、そ
のメツセージを到着時に処理するために呼び出される一
連の資源idをそのヘッダに含むものと仮定している。
また、たとえば、リンク−1d1TG−ids ER−
t ds VR−idl及びセラシロン−idである。
メツセージが物理的に伝送されるまで、メツセージが下
位層から上位層に進むに従ってヘッダの一部が除去され
、メツセージが上位層から下位層に進む場合にヘッダの
一部が追加されるようになった層状ネットワーク・アー
キテクチャであると仮定されている。
さらに、資源抽出idがヘッダから資源を抽出するもの
と仮定されている。
第8図に非管理資源のフローチャートを示す。
ステップ172でメツセージ(in− me s s age)を受は取り、ステップ174で
、このメツセージがインバウンドであるか否かの判断が
行なわれる。インバウンドである場合は、処理は176
に分岐し、176でヘッダ・メッセージの外側部分が除
去され、178でメツセージ自体が処理される。その後
で、180でメツセージはすぐ上位の資源に送られる。
次に、処理はステップ172に戻り、別のメツセージを
受は取る。
一方、メツセージがインバウンドでない場合は、アウト
バウンドであるはずであり、処理はステップ182に進
み、メツセージが処理される。ステップ184でメツセ
ージのヘッダの外側部分に対して追加が行なわれ、18
6でメツセージはすぐ下位の資源に送られる。その後、
処理はステップ172に戻り、反復する。
この処理を表わす擬似フードを以下に記載する。
<resource−id>?   procedur
e  (in  message)do foreve
r receive (in message);ase when in message is 1nboun
degin peel off outer part of he
ader (in message)i/’proce
ssing of the in message f
ollowsdependir+g”/ /”on  the  particular”/pr
ocess  (in−message);5end 
 in message t。
extract resource  id  (in
 message);end; when  in message  is outb
oundegin process (in−message);add 
an outerpart to header  (
in message。
<resource  id>); /’the message  is 5ent to
 the  immediately1oweS/ /”1ayer resource that 5er
ves the requestof”/ /” <resource−7d>、  For ex
ample+  if<resource−7d>’/ /’is a 5ession、 then my 5
erver resource 1dis  ”/ /’ the VRon which this 5e
ssion  is mapped’/5end  i
n−message to my 5erver−re
source−id;end 1 endcase; end; 第9図は、PUの一部として制御点プロセッサ上にある
管理機構を示したもので、管理資源のフローチャートで
ある。ステップ190でメツセージを受は取る。ステッ
プ192で、このメツセージが資源活動化要求であるか
どうか判定が行なわれる。そうである場合、処理はステ
ップ194に進み、そこで新しい資源があるNAMに割
り振られる。その後、ステップ196で、資源を作成す
るためにメツセージがそのNAM上のこの管理機構のエ
ージェントに送られる。ステップ198で、その資源に
対するエージェントが他のNAMで必要とされる場合(
たとえば、TGが所有NAM以外のものからINNメツ
セージを受は取る場合)、管理機構エージェントにメツ
セージが送られる。
その後、処理はループ200を経て、ステップ190に
戻り反復する。
資源活動化要求でない場合は、非活動化要求であるはず
であり、したがって、ステップ202でその資源はNA
Mに対する割振りを解除される。
その後、ステップ204で、NAM上の資源を破壊する
ためにメツセージがエージェントに送うれ、ステップ2
06で、その資源に対するエージェントが他のNAM上
にある場合、同様にそれらを破壊するためにメツセージ
が送られる。その後、経路200を経て処理が反復する
上記のことを表わす擬似コードを以下に記載する。
<manager−resource−id>:  p
rocedure  (in message)do 
forever receive  (in−message);ase when in message is resour
ce activation−request egin a目ocate new resource to 5
ovae HAM(in−message、  RAM
−ID);/”the manager 5ends 
a message to its agentin”
/ /”the NAM where the new r
esource was created。
6/ /”informing it of the fac
t、  Note that the ”//’hea
der of the message has th
e manager’s id”/ /” which  is also the  id
 of  its agent”/5end  ’<m
anager−resource−id>、  cre
ate  newresource、  <resou
rce  id>’  to NAMJD;/’In 
the case of resources vft
h agents the ”//”manager 
has to notify  its agent 
on the HAM0/ /”where the resource agen
t  is to be created。
0/ end; when  in message is resou
rce−inactivation−request egin deallocate resource from 
HAM  (in−message。
NAMJD) 1 send’<manager−resource−id
>、  destroyresource、  <re
source−id>’  to  HAM  ID)
iend; endcase; end i 管理機構のエージェントは、その管理機構からメツセー
ジを受は取ると、ローカルNAM中で資源(及びその関
連プログラム)を作成し、また資源がローカルNAMに
よって所有されていない場合はその資源のエージェント
を破壊する。他のメツセージはすべて単に管理機構に転
送される。
第10図に、この動作を説明するフローチャートを示す
。ステップ210で、メツセージを受は取る。次に、ス
テップ212で、それが管理機構からのメツセージであ
るか、それともこのNAMにあるある資源からのメツセ
ージであるかが判定される。このNAMにある資源から
のメツセージである場合は、ステップ214で、そのメ
ツセージが管理機構に転送され、その後、動作はステッ
プ210に戻る。しかし、メツセージが管理機構からの
ものである場合は、ステップ216で、それが活動化要
求であるかどうかが判定される。活動化要求である場合
は、ステップ218で、資源(またはそのエージェント
)が活動化される。活動化要求でない場合は、ステップ
220で、資源またはそのエージェントが非活動化され
る。その後、処理はステップ210で反復される。
最後に、NAMメツセージ処理のための擬似フードを示
す。
HAM−id (in message)do for
ever receive(in message);5end 
in message to extract res
ource 1d(in message); end : この手順では、まずあるメツセージを受は取り、次にそ
のメツセージが適当な資源または資源エージェントに送
られるという形で、メツセージが連続的に受は取られる
以下に初期設定時以降の本発明の通常の動作の一例を示
す。「開始」時には、本発明による単一ノード・イメー
ジでは何も活動状態にない。最初に、制御プロセッサ4
6にある制御/管理機構(PU)が活動化される。この
考察では、これらの機能を「制御プロセッサ内の制御/
管理機構」ではなく「制御プロセッサ」と呼ぶ。
制御プロセッサ46については、他のプロセッサ40−
44と比べて特別なことは何も必要ではない。最初に現
われるものが「勝ち」、制御プロセッサとなる。他の手
段を使って制御プロセッサを指定することもできるが、
そのような手段は本発明の範囲には含まれず、当業者に
とって明らかである。
制御プロセッサ46は、やはり本発明の範囲に含まれな
い手段を用いてデータ・センタの他のプロセッサにそれ
自体を知らせる。そのような手段は結合機構50を介し
て他のプロセッサに対してその存在をいわば「同報通信
」するものとすることができ、もう1つの方法は、中央
で維持され、または分配されたあるディレクトリにその
存在を「登録する」ことである。
他の通信プロセッサ40−44が活動化されるとき、そ
れらは結合機構50を介してそれ自体を制御プロセッサ
46に対して識別する。制御プロセッサは、すべての活
動状態の通信プロセッサのリストを他の関連情報(たと
えば、どれだけの「負荷」が通信プロセッサの各々に割
り当てられているか)と共に維持する。プロセッサが最
初にそれ自体を制御プロセッサに対して識別するとき、
制御プロセッサは他の通信プロセッサに関連する初期設
定情報を送る。ノードの状態に変更が加えられる(たと
えば、経路が活動化または非活動化される)とき、制御
プロセッサは必要に応じて追加の関連情報を通信プロセ
ッサに送る。
初期設定時に1.制御プロセッサ46は回線切換え機構
87に、すべての回線アダプタ30−35をそれ自体に
接続するように指示する。この時点で、回線アダプタは
まだ動作していないことに留意されたい。
SNAネットワーク中で、回線アダプタは制御プロセッ
サの指示のもとて活動化される。しかし、回線アダプタ
が他の手段によって活動化される状況も容易に想像でき
、その場合は、回線アダプタは(回線アダプタを制御プ
ロセッサに接続するようにセットアツプされた回線切換
え機構を介して)直ちにそれ自体を制御プロセッサに対
して識別する。いずれにしても、回線アダプタが最初に
活動状態になるとき、制御プロセッサと直接通信する。
各回線アダプタが活動状態になるとき、制御プロセッサ
内のリンク管理機能(PUの一部、第3図参照)は、新
たに活動化された回線アダプタと通信し、そのDLC機
能を初期設定する際に回線アダプタの支援を行なう。S
 N A IJンクの場合、それにDLCと制御プロセ
ッサの間の識別情報の交換が必要であり、さらに、リン
クの他端にある対等DLC機能との(” X I D″
(識別交換)と呼ばれるメツセージを用いた)識別情報
の交換が必要である。この初期設定処理の一部として、
制御プロセッサは、このリンクが結合される伝送グルー
プを決定する。これは(たとえば、静的に「情報を与え
られた」テーブルによって)事前に決定することも、ま
たXID処理を用いて動的に決定することもできる。T
Gプロトコルがこのリンクに使用されない場合は、この
リンクがTG″内の唯一のリンク(すなわち、「縮退T
GJ ’)である点以外は、TGが使用される場合と同
じである。
2つの可能性がある。すなわち、TGが既に活動状態に
ある(1本または複数のリンクが既に「結合されている
」)か、あるいは現在活動状態にない。TGが活動状態
にある場合は、TGはNAM処理の段階の1つに既に割
り当てられており、そのNAM処理はプロセッサ40−
44の1台に割り当てられている。この場合、制御プロ
セッサ46は、そのプロセッサ内のNAM処理と(結合
機構50を介して)通信して、回線アダプタ内のDLC
機能の活動化をそれに知らせる。制御プロセッサ46は
次に、新たに活動化された回線アダプタをNAM処理を
含むプロセッサに接続するように、回線切換え機構37
に指示する。この時点で、NAM処理内にあるTGイン
スタンスが回線アダプタの制御権を受は取る。DLCは
このとき「アップ」であり、ネットワーク・トラフィッ
クを隣接のネットワーク・ノードに渡す際に、このTG
内の他のリンクを結合する。
TGが活動状態にない場合(または、このリンクがTG
プロトコルを使用しない場合)は、TGインスタンスが
まず活動化される必要があるので、残りの活動化処理は
やや複雑である。本発明の範囲に含まれない方法(たと
えば、負荷均衡アルゴリズム)を使って、制御プロセッ
サはNAM処理の既存のインスタンスに新しいTGを割
り当てるか、それともTGのために新しいNAMを作成
するかを決定する。後者の場合は、制御プロセッサはN
AMのためのプロセッサを選択し、(たとえば、プロセ
ッサのオペレーティング・システムと通信することによ
り)NAM処理をそのプロセッサ上で開始させる。NA
M処理が選択されると、制御プロセッサはNAMと通信
して、TGインスタンスを作成するようNAMに指示し
、関連情報(たとえば、TGの識別、その特性、TGが
接続されるネットワーク・ノードの識別)を送る。次に
、リンクの制御権が、前述のように、このNAM処理を
含むプロセッサに移る。さらに、他のすべてのNAMは
、この新たに活動化されたTGのことを知らされ、した
がって必要に応じてINNトラフィックをこのリンクに
経路指定するために、どのプロセッサにTGがあるかを
「知っている」ことになる。
以上、単一ノード・イメージをどのように活動化するか
について説明してきた。従来の単一コンビニータSNA
ノードとこの多重コンピュータSNAノードの間には、
SNAプロトコルに関して実質的な変更はないので、S
NAによって指示される活動化の手順及びプロトコルに
ついては省略したことに留意されたい。
それぞれのSNA資源インスタンス(たとえば、TG、
ER終点、VR,セツション)は、必要に応じて制御プ
ロセッサ内のそれに対応する資源管理機構(たとえば、
TG管理機構、ER管理機構、VR管理機構、セツショ
ン管理機構)と通信する。
この通信は、結合機構50を本発明にとって特に重要で
はない適当な低レベルのソフトウェア機構と組み合わせ
て用いて行なわれる。各NAM処理は各資源管理機構の
「エージェント」 (たとえば、TG管理機構エージェ
ント等)を含み、この通信はこのエージェントを介して
流れる。制御プロセッサがNAM上に新しい資源(たと
えば、新しいTGインスタンス)を作成する必要がある
ときは、NAM内の当該のエージェント(たとえば、T
G管理機構エージェント)にメツセージを送り、そのエ
ージェントが実際の作成及び初期設定を媒介する。
さらに、通常の動作中に、これらの資源インスタンスの
1つがネットワークから特定の「監視」メツセージを受
は取ったときは(たとえば、ER居による経路更新メツ
セージの到着)、そのメツセージはエージェントを介し
て制御プロセッサ内の当該の管理機構に転送される(た
とえば、経路更新メツセージはER管理機構エージェン
トに渡され、ER管理機構エージェントはそれを結合機
構を介して制御プロセッサ内のER管理機構に送る)。
同様に、制御プロセッサ内の管理機構で生成された「監
視」メツセージは、逆の経路を介して当該の資源インス
タンスに送られ(ネットワークに伝達される。)管理機
構は結合機構50を介してメツセージを当該のNAM内
の管理機構のエージェントに送る(たとえば、ER管理
機構は経路更新メツセージを生成し、ER層に伝達し最
終的にネットワークに伝送するためにそれを当該のER
管理機構に送る)。
セツションの活動化は、セツションがエンド・ユーザに
対するネットワーク・ノードの接続であるため、幾分独
自の問題を提起する。これらのエンド・ユーザはノード
の制御下にない(かつ本発明の範囲には含まれない)。
最初に、これらのエンド・ユーザ(SNAネットワーク
ではネットワーク・アドレス可能ユニットと呼ばれる)
について説明する。
概念的には、エンド・ユーザは、多少とも明確に定義さ
れたあるインターフェース・セットを介してネットワー
ク・ノードと通信する別のプログラムである。これらの
インターフェースは一般に「アプリケーション・プログ
ラム・インターフェースJ(API)と呼ばれ、エンド
・ユーザを表わすプログラムは「アプリケーション」 
(これは層7:アプリケーシヨン層である)と呼ばれる
。ネットワーク・ノードのAPIは実質的にはネットワ
ークの「境界」であり、本発明の環境では、本発明の範
囲の「境界」である。
単一ネットワーク・ノードを多数のプロセッサに分配す
る手段について本発明で示したのと同様にして、単一ア
プリケーションを多数のプロセッサに分配するための同
様な手段が他の作業で示されるものと仮定する。本発明
では、水平的成長を実現するために、分配された各アプ
リケーションの断片が各プロセッサ40−46内にある
ようにエンド・ユーザ・アプリケ−シロンの大部分が分
散されるものと仮定する。そのようなアプリケーション
を、本書では「完全に分散されたアプリケーション」と
呼ぶ。
しかし、完全には分散されないアプリケーションが必ず
ある。1部分的に分散される」だけのアプリケージジン
も、全く分散されないアプリケージ日ソもある。明らか
なように、これらは単に同じ問題の程度の差にすぎない
。この考察では、分散されない、「一体的」アプリケ−
シロンについてのみ考える。本発明では、物理ユニット
(エンド・ユーザであるが、非常に特殊なエンド・ユー
ザではない)はそのような一体的アブリケージロンの1
つである。
各一体的アプリケーションは1台のプロセッサ(のみ)
に存在し、ネットワーク・ノードとの(したがってネッ
トワークとの)その通信は、すべてそのプロセッサ上で
実行されるNAM処理の1つによってもたらされるAP
Iを介するものと仮定する(各プロセッサは複数のNA
Mを有することがあることに留意されたい)。
さらに、完全に分散された各アプリケーションは、すべ
てのNAMのAPIと通信するアプリケーション・イン
スタンスがすべてのプロセッサ中にあるように、各プロ
セッサ中にそれ自体のインスタンスを少なくとも1個有
するものと仮定する。
次に、セツション初期設定の2つの場合を考察する。「
イ也の」あるエンド・ユーザがセツションを単一ノード
・イメージのアプリケーションの1つに結合しようとし
く「インバウンド」の場合)、単一ノード・イメージの
アプリケージジンの1つがセッシ式ンを「他の」あるエ
ンド・ユーザに結合しようとする(「アウトバウンド」
の場合)。
ノードの1つのアプリケージジンがセツションをそのノ
ードの別のアプリケーションに結合することが可能なこ
とに留意されたい。これは単に両方の場合を組み合わせ
たものである。
まず「インバウンド」の場合であるが、新しいセツショ
ンの作成の試みは、1つまたは複数の「セラシロン作成
」メツセージの到着によって予告される。SNAネット
ワークでは、これは「セツション層合」メツセージであ
り、通常のネットワーク移送機構を介してノードに到着
する。具体的に言うと、セラシロン開始メツセージがあ
るリンクまたはリンクの伝送グループを経て到着し、回
線アダプタ(30−35)を介して、その回線アダプタ
があらかじめ接続されている特定のプロセッサに転送さ
れる。通常のノード処理機能が、このメツセージがセツ
ション層に達するまで、ネットワーク層を介してこのメ
ツセージを上方に渡させ、そのセラ21フ層でメツセー
ジは「監視」メツセージとして認識され、(セツション
管理機構エージェントを介して)制御プロセッサ46内
のセツション管理機構に転送される。
セツション管理機構は、(たとえば、アクセス制御また
は安全保護のため)そのセツション作成要求を即座に拒
絶することも、セツションを仮に受は入れることもある
。セツションが受は入れられた場合は、制御プロセッサ
は、(たとえば、アプリケージ日ソの名前をセツション
作成メツセージから取り出すことにより)このセツショ
ンがどのエンド・ユーザ・アプリケーション向けのもの
であるか決定する。アプリケージジンが完全に分散され
ている場合、セツション管理機構は、そのセツション作
成メツセージが到着したNAMに、先に進んで、セツシ
ョンを作成するように指示する。NAMはセツション・
インスタンスヲ作成シ、新しいセツションがそこにある
ことをAPIを介してエンド・ユーザ・アプリケーショ
ンに知らせる。アプリケ−シロンはセツションを拒絶す
ることを選ぶこともできる。そうでない場合は、セツシ
ョンは使用に投入され、ネットワークを介して情報を送
受信するために使用できるようになる。
この時点以後、情報は制御点または他のどのNAMから
のかかわりももたずに、セッシ日ン上を流れる。
アプリケーションが一体的である場合は、制御プロセッ
サは、アプリケーションの1つのインスタンスがたまた
まセツション作成メツセージが到着したNAMと関連づ
けられていることを発見することができる。この場合は
、完全に分散された場合と全く同様に処理される。しか
し、十中へ九は、アプリケ−シーンが「他の」あるNA
M上にあり、制御プロセッサは、rNAM向はセツショ
ン」、すなわち、ネットワークから1つのNAM上に到
着するが、他のあるNAM上でそのアプリケーションに
結合されているセツションの構築を媒介しなければなら
ない。
NAM間セッシロンは、制御プロセッサ内の管理機構の
「エージェント」と非常によく似た機構によって実現さ
れる。制御プロセッサは、セツション作成メツセージが
到着したNAMに、「セツション・エージェント」を作
成するように指示する。
同時に、制御プロセッサは、一体内アプリケーションが
結合されているNAMに、NAM間セツションを作成す
るように指示する。セツション・エージェント及びNA
M間セッシロンは、(制御プロセッサにより)互いの存
在について知らされ、それらの間での(結合機構50を
介する)通信経路の確立に着手する。その後、ネットワ
ークからこのセツションに対する到着した情報がセツシ
ョン・エージェントに伝達され、セツション・エージ、
エンドは「他のJ NAM処理中の「本当のJ NAM
間セツションにその情報を転送する。同様に、(一体内
)アプリ・ケーションによって生成された情報は、「本
当のJ NAM間セッシロンによってセツション・エー
ジェントに転送され、セッシ゛ロン・エージェントはこ
の情報をネットワークに伝達する。
次に、ノードの(完全に分散された、または−体内な)
アプリケーションがセツションを「他」のあるエンド・
ユーザに結合しようとする、「アウトバウンド」のセツ
ション開始の場合について考察する。このアプリケーシ
ョンはAPIを使って、ノードに新しいセツションを作
成するように要求する。種々のNAMプロセッサのどれ
にでも要求を出すことができる、完全に分散されたアプ
リケーションの場合、そのような要求には2種類あると
仮定する。すなわち、要求が行なわれたのと同じNAM
上でセツションが作成されることが必要な「移動−不能
」要求と、(定義により、アプリケ−シロンはすべての
NAMに対してインターフェースを有するので)任意の
NAM上でセツションが作成できる「移動可能」要求で
ある。(IBM社のSNAモードの″ACF/VTAM
″インプリメンテーシeンでは、「移動不能」要求は「
開放宛先/獲得(Open Destnation/A
cquire) J要求で代表され、「移動可能」要求
は「ログオン・シミュレート」要求で代表される。) 一体内アプリケーションの場合、セツションが「移動」
できる宛先のNAMは他にないので、「移動可能」要求
は「移動不能」要求に変化する。
どちらの種類のセツション開始要求も処理のために制御
プロセッサに転送される。制御プロセッサは、ネットワ
ークによってアーキテクチャ化される方法を使って、セ
ツション開始要求がどのNAMから出されたかに拘らず
、セツションのための最適経路を決定する。選ばれた経
路は、ある特定リンク、またはあるNAM (必ずしも
セツション開始要求が出されたNAMではない)に結合
されたリンクの伝送グループ上で単一ノード・イメージ
から出る。この時点で、「通常の」セツションまたはr
NAM向」セツションが制御プロセッサの指示のもとで
適切に構築される。完全に分散されたアプリケージタン
からの「移動可能」要求に対しては、「通常の」セツシ
ョンを常に構築することができ、それを介してセツショ
ンが送られる伝送グループ(リンク)を制御するNAM
以外のあるNAM上で出された「移動不能」要求には、
rNAM向」セッシ躍ンを作成しなければならない。
多重プロセッサ・システムの容量はプロセッサ間通信の
量と形式に関係する。プロセッサが互いに完全に独立し
ている(すなわち、プロセッサ間通信がない)場合、シ
ステムの容量はプロセッサ数の増加につれてほぼ直線的
に増大する。プロセッサの数が倍になると、容゛量が倍
になる。明示的または臨時に大量のプロセッサ間通信が
ある場合、システムの容量はプロセッサ数の増加につれ
て直線的には増大゛しない。実検には、プロセッサが追
加されたとき、容量はわずかだけ増大する(または、実
際には減少する)ことがある。
本発明ではプロセッサ間通信がないので、終点トラフィ
ックのための容量は直線的に増大する。
これは、仮想回路本位のネットワーク(SNA等)のプ
ロトコル層の厳密に階層的な構成に基づくものである。
各論理リンクは、多重プロセッサ集合体に終点を有する
幾つかのネットワーク経路を含む。各ネットワーク経路
は幾つかの仮想回路を含み、各仮想回路は幾つかのセツ
ションを含む。したがって、すべての終点トラフィック
(セツション、仮想回路、経路の終点トラフィック)は
、そこから集合体に出入りするための論理リンクに従っ
て分割することができる。リンク20を介してアクセス
可能な端末との間でセツションを開始する必要がある場
合、そのセツションは、リンク20が割り当てられるV
Rによって処理される。可能なリンクの選択肢がいくつ
かある(たとえば、端末がリンク20とりンク21の両
方を介してアクセス可能である)場合は、このセツショ
ンを搬送するリンクを(したがって、vRを)選ぶとき
、負荷均衡等の他の要素を考慮に入れることができる。
終点トラフィックのための容量がこのように直線的に増
大するのは「定常状態」のトラフィックの場合のみであ
る。接続(セツション、仮想回路、経路)の開始及び終
了は制御プロセッサ46によって処理され、したがって
過大な量の接続開始及び終了があるとき(たとえば、ネ
ットワーク起動または遮断時)、それがネックになる可
能性があることに留意されたい。
INN)ラフイックのための容量は、プロセッサ間通信
の量によりプロセッサの数が増大するに従って減少する
。定義により、INN)ラフイックはある論理リンクを
介して多重プロセッサ集合体に入り、別のリンクを介し
て集合体を出ることに留意されたい。N台のNAMプロ
セッサがある場合、第1に、N A M nに割り当て
られたリンクを介してINNメツセージが入る確率は、
やはりNAMnに割り当てられたリンクを介して集合体
から出る(したがって、プロセッサ間通信を回避する)
確率の1/Nにすぎない。アウトバウンド・リンクが他
のあるNAMn ’に割り当てられ、NAMnとNAM
n’の間の通信が必要となる確率はN−1/Nである。
INNメツセージ毎のプロセッサ間通信(干渉)が行な
われる尤度はプロセッザ数の増加につれて増大する。
回線アダプタ30−35は故障が起こる唯一の点である
。回線アダプタを二重にし、別の相互接続交換機を介し
て遠隔通信回線を接続することも可能であるが、遠隔通
信回線(ならびに相互接続交換機)自体は引き続き単一
の故障点である。回線障害には、(上記の多重リンク伝
送グループ等の)高レベル通信プロトコルによって対処
しなければならない。
従来技術のSNA体系では、故障したNAMの回復は「
すべでもしくは無」である。すなわち、(ネットワーク
の隣接ノードから見て)正確な状態が完全に復元される
か、あるいは、NAMが自分で担当していたセツション
、仮想回路、及び経路を破壊し、それらを1つずつ初期
設定し直すことにより、故障を(ネットワークに)示さ
ねばならない。しかし、この状況は見かけほど悪(ない
既知の障害検出、分離、及び回復機能をうまく使うこと
により、大部分の障害を単一のセツションまたは小さな
セツション・グループに限定することができ名。破局的
なNAMの故障(たとえば、その状態の完全な崩壊)さ
えも、NAMによって処理されていた全ネットワーク負
荷の一部分に影響を及ぼすだけである。多重プロセッサ
集合体がN台のNAMプロセッサを使用している場合は
、単一のNAMの破局的故障によってネットワークの約
1/Nが影響を受は葛ことになる。
集合体中でどんな結合機構が使用可能かに応じて、ある
プロセッサが障害NAMに取って代わり、ネットワーク
負荷に対する影響を最小限にしつつ処理を続行すること
が可能なこともある。それには、結合された集合体内に
含まれる回復技術(たとえば、様々なチエツクポイント
技術やジャーナリング技術の使用)あるいは、取って代
わったNAMが特別な再同期化メツセージをネットワー
クに送るという、いわゆる「端末間」回復技術が必要な
こともある。このような回復方式の詳細は本発明の範囲
を超えている。しかし、本発明によって提案される構造
は、そのような回復技術を実施するための確実な基礎を
提供することに留意されたい。
E0発明の効果 本発明により、結合されたシステムがネットワークやネ
ットワークを介して集合体にアクセスするユーザに単一
ネットワーク・ノードのイメージを与えるように、結合
されたシステムの集合体を1つのまたは複数の4ネツト
ワークに接続するための装置が提供される。
【図面の簡単な説明】
第1図は、本発明を組み込んだネットワーク・アーキテ
クチャを示す。 第2図はネットワーク内のノードの結合を示す。 第3図はノードの論理構造を示す。 第4図は、コンピュータの結合集合体のブロック・ダイ
ヤグラムである。 第5図は、メツセージと関連するヘッダの構造の概略図
である。 第6図は管理機構または資源エージェントのフローチャ
ートである。 第7図は管理資源のフローチャートである。 第8図は非管理資源のフローチャートである。 第9図はネットワーク・アクセス方式(NAM)のフロ
ーチャートである。 第10図は非管理資源のフローチャートである。 8.10.12.14.16・・・・ノード、9.11
.13.15.17.18・・・・リンク、22゜・・
・・データ・リンク制御、24・・・・経路制御、26
・・・・明示経路制御、30−35・・・・回線アダプ
タ、32.34.3B、38・・・・ネットワーク・ア
ドレス可能ユニット、37・・・・回線切換え機構、4
0.42.44・・・・プロセッサ、46・・・・制御
プロセッサ、50・・・・結合機構。 第6図          第7図

Claims (1)

  1. 【特許請求の範囲】 1つのノードに複数の結合されたプロセッサを有するコ
    ンピュータ集合体を結合するための装置であって、 前記ノードは、複数のノード及び該複数のノードを連結
    する複数の通信回線を有するデータ通信ネットワークに
    結合され、前記通信回線は伝送グループに分けられ、各
    伝送グループは少なくとも1本の前記通信回線を含み、
    前記プロセッサのうちの1つは、制御プロセッサとして
    、前記ノードのうちの1つのノード内の機能を制御する
    ための資源管理機構を含み、前記プロセッサのうちのそ
    の他は、非制御プロセッサとして、少なくとも1つの動
    作可能なネットワーク・アクセス方式を含むと共に、デ
    ータ移送機能を前記ノードの内外に向けるための資源を
    含み、前記ノードの前記データ移送機能は複数の前記ネ
    ットワーク・アクセス方式の間に含まれ、前記ネットワ
    ーク内の少なくとも1つのプロセッサは、前記ネットワ
    ークを管理するシステム・サービス制御点プログラムを
    含む、コンピュータ集合体結合装置。
JP63226714A 1987-11-03 1988-09-12 コンピユータ集合体結合装置 Pending JPH01130252A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11642487A 1987-11-03 1987-11-03
US116424 1993-09-02

Publications (1)

Publication Number Publication Date
JPH01130252A true JPH01130252A (ja) 1989-05-23

Family

ID=22367119

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63226714A Pending JPH01130252A (ja) 1987-11-03 1988-09-12 コンピユータ集合体結合装置

Country Status (4)

Country Link
EP (1) EP0314909B1 (ja)
JP (1) JPH01130252A (ja)
CA (1) CA1310428C (ja)
DE (1) DE3853257T2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6309454B1 (en) 2000-05-12 2001-10-30 Johnson & Johnson Medical Limited Freeze-dried composite materials and processes for the production thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6188353A (ja) * 1984-10-05 1986-05-06 Nippon Telegr & Teleph Corp <Ntt> 通信制御プロセツサによるシステム制御方式
US4677588A (en) * 1983-11-14 1987-06-30 International Business Machines Corp. Network interconnection without integration

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE448919B (sv) * 1983-03-04 1987-03-23 Ibm Svenska Ab Metod for att overfora informationsenheter i ett datornetsystem, samt datornetsystem for genomforande av metoden

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4677588A (en) * 1983-11-14 1987-06-30 International Business Machines Corp. Network interconnection without integration
JPS6188353A (ja) * 1984-10-05 1986-05-06 Nippon Telegr & Teleph Corp <Ntt> 通信制御プロセツサによるシステム制御方式

Also Published As

Publication number Publication date
DE3853257D1 (de) 1995-04-13
CA1310428C (en) 1992-11-17
EP0314909A3 (en) 1991-10-30
EP0314909B1 (en) 1995-03-08
DE3853257T2 (de) 1995-09-14
EP0314909A2 (en) 1989-05-10

Similar Documents

Publication Publication Date Title
US5191651A (en) Apparatus and method for making of interconnected processors act like a single node in a multinode communication system
US7711831B2 (en) Methods, systems and computer program products for source address selection
US7120697B2 (en) Methods, systems and computer program products for port assignments of multiple application instances using the same source IP address
US6999998B2 (en) Shared memory coupling of network infrastructure devices
US5805924A (en) Method and apparatus for configuring fabrics within a fibre channel system
US7444405B2 (en) Method and apparatus for implementing a MAC address pool for assignment to a virtual interface aggregate
US7526549B2 (en) Cluster data port services for clustered computer system
US6535990B1 (en) Method and apparatus for providing fault-tolerant addresses for nodes in a clustered system
US20040073683A1 (en) Method and apparatus for providing an integrated cluster alias address
US7133929B1 (en) System and method for providing detailed path information to clients
US6934952B2 (en) Method and apparatus for managing multiple instances of server code on a machine
US6370583B1 (en) Method and apparatus for portraying a cluster of computer systems as having a single internet protocol image
US20130332767A1 (en) Redundancy and load balancing in remote direct memory access communications
US20110090804A1 (en) Staged Port Initiation of Inter Switch Links
CN102027732A (zh) 经由因特网协议网络提供对服务器应用程序的访问
US6327621B1 (en) Method for shared multicast interface in a multi-partition environment
US5805572A (en) Single-system image network subsystem in a clustered system
US6173319B1 (en) Using a systems network architecture logical unit activation request unit as a dynamic configuration definition in a gateway
JPH01130252A (ja) コンピユータ集合体結合装置
US6389465B1 (en) Using a systems network architecture logical unit activation request unit as a dynamic configuration definition in a gateway
Cisco Configuring APPN
Cisco Configuring APPN
Cisco Configuring APPN
Cisco Configuring APPN
Cisco Configuring APPN