JP2675928B2 - 速度差が大きい協同プロセッサ間のメッセージ・キュー処理 - Google Patents

速度差が大きい協同プロセッサ間のメッセージ・キュー処理

Info

Publication number
JP2675928B2
JP2675928B2 JP3165260A JP16526091A JP2675928B2 JP 2675928 B2 JP2675928 B2 JP 2675928B2 JP 3165260 A JP3165260 A JP 3165260A JP 16526091 A JP16526091 A JP 16526091A JP 2675928 B2 JP2675928 B2 JP 2675928B2
Authority
JP
Japan
Prior art keywords
message
list
processor
lock
queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3165260A
Other languages
English (en)
Other versions
JPH04233653A (ja
Inventor
ジョン・ランドルフ・ディスブロー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH04233653A publication Critical patent/JPH04233653A/ja
Application granted granted Critical
Publication of JP2675928B2 publication Critical patent/JP2675928B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は速度差の大きいプロセッ
サ間で低速のメッセージ交換を避けるためのメッセージ
転送方法及び装置に関する。前記メッセージ転送はCP
Uと外部記憶サブシステム、例えばDASD(同期直接
アクセス記憶装置)アレイとの間の実行と同時に行なわ
れる。
【0002】
【従来の技術】最近の高速処理又はスーパー計算はかな
り低速の専用プロセッサ、例えばDASDアレイ制御装
置を非定期的に参照する複数のプロセッサでおよそ10
億命令/秒(MIPS)の座標計算を実現する。それで
もプロセッサ間の同期はロック(lock)とメッセージの組
合せを必要とする。ロックは資源をタスクに固定するの
に役立つが、メッセージ及びその処理自体は同期事象と
して動作する。最近のシステムでは、タスク指向メッセ
ージは資源にエンキュー(enqueue) される。キュー(que
ue) されたアクセスは大域ロックによって制御される。
従って、動作はロックされた前記キューのアクセスを取
得する最も低速のプロセッサによって進行する。
【0003】[プロセッサ、共有内部メモリ、メッセー
ジ及びキュー]一般に、1つのCPU即ちプロセッサは
局所オペレーティング・システム(OS)、RAMで実
現された内部メモリ、前記内部メモリから作られた局所
命令及びデータのキャッシュ、外部記憶、並びにロッ
ク、キャッシュ、及び記憶資源マネジャを含む。しかし
ながら、高速又はスーパー計算は幾つかのプロセッサで
実行されるアプリケーションを含む。前記アプリケーシ
ョンはOS命令(読取/書込)の形式でタスクを開始す
る。前記タスクはそれらを処理する資源に対してキュー
される。この場合、前記資源は高速の汎用及び専用プロ
セッサのシステムである。タスクは、プロセッサが共有
する内部メモリの共通にアクセス可能な部分の中のキュ
ーにあるメッセージのように、それらが配列された位置
によって相互に相対的に同期される(順序付けられ
る)。
【0004】メッセージ(タスク)は一定のアドレス範
囲で定められたカプセル化動作として表示される。メッ
セージが外部記憶のアクセスに関連する場合、それらは
プロセッサによって共有メモリにエンキューされ、記憶
サブシステムによるデキュー(dequeue) 及び実行を待
つ。同時に、変更されたか又は終了した記憶アクセス・
タスクを表わすメッセージも記憶サブシステムにより共
有メモリにエンキューされ、プロセッサによるデキュー
及び実行を待つ。前記キューをロックすることにより、
最も低速のプロセッサ例えば外部記憶(アレイ制御装
置)が全体の動作を進めることができる。
【0005】[不整合の多発]前述のように、普通は一
定の形式のロックによって制御されたキューの中のアク
セス・メッセージを用いて、プロセッサとタスクの間の
同期が達成される。しかしながら、能力の不均衡が処理
されていない場合、かなり速度の遅いプロセッサに現に
制約(ロック)されたキューのアクセスを待つ間に、速
度の速いプロセッサは多くの時間を無駄にするかもしれ
ない。
【0006】プロセッサが遅延を伴わずに外部DASD
記憶をアクセスする場合でさえも、データ速度に著しい
不整合が生じることがある。例えば、100 MIPS
及び100メガバイト/秒のデータ転送速度で実行する
並列プロセッサは、1〜3メガバイトの転送速度及び1
0ミリ秒のアクセス時間を有する1ギガバイトDASD
との通信を試みる。
【0007】Patterson et al, "A Case for Redundant
Arrays of Inexpensive Disk(RAID)", ACM SIGMOD Con
ference, Chicago Illinois, June 1-3, 1988(以下、
文献1と呼ぶ)は N 同期DASDを並列アクセスする
方式でデータ速度を整合する一般的な解決方法について
記載している。同期動作は N DASDが同じrpmで
回転し、同じ角オフセットを有し且つ同時に同じ方法で
アクセスする必要がある。
【0008】[インターロック及びロック可能バッフ
ァ]前記文献1の同期DASDを介した並列データ通信
の代替として、データ速度不整合はインターロック即ち
ロック可能バッファによって管理された。バッファのサ
イズ及び費用は依然として障害になっている。
【0009】米国特許第3336582号は、速度の遅
いプロセッサが速度の速いプロセッサからの転送を調整
するインターロックを開示している。即ち、速度の遅い
プロセッサ、例えば記憶制御装置(IBM 3880) は
要求応答インタフェースを介してCPU/チャネル(S
/370)をストローブ(strobe)し、それが次の情報単
位の処理に使用できることを示す。
【0010】米国特許第4454595号はアドレス・
レジスタ操作によって管理される多重ポートのランダム
・アクセス・メモリを非同期区画循環バッファとして開
示している。データは循環順序で一度に1区画の連続R
AMアドレスから読取られるか又は前記アドレスに書込
まれる。区画/ブロックはトラック・セクタのデータを
保持するサイズを持つ一定数の連続RAMアドレスから
成り、前記RAMバッファは少なくとも2つの前記区画
に相当する容量を有する。
【0011】米国特許第4454595号のバッファで
は、ワードプロセッサのメイン・メモリ(DMA)と接
続DASDの間で、一定のブロックのデータの移送速度
が整合される。DASD書込み又は読取りコマンドはデ
ータをDMA又はDASDトラック・セクタから第1の
RAM区画に移送する。RAM動作は非同期であるの
で、第2のRAM区画からの要求転送は、実行中のコマ
ンド(DASD読取り又は書込み)のアトミック(atmi
c) 部分として第1の移送と並行して行なうことができ
る。
【0012】Knuth, "The Art of Computer Programmi
ng", Second Edition, copyrightAddition-Wesley Pu
b. Co. 1968, 1973, Vol.1 Fundamental Algorithm, pa
ges234-239, 531-534(以下、文献2と呼ぶ)では、"デキ
ュー(deque)" は、全ての挿入及び削除が前記リストの
エンド(end) で行なわれる線形リストとして記述されて
いる。更に、文献2(Sec.2.2.1 Exercise 1)では、 "入
力禁止デキュー" は、項目を1つのエンドに挿入し他の
エンドから削除することができる線形リストとして定義
されている。
【0013】
【発明が解決しようとする課題】本発明の目的は速度の
異なるプロセッサが互いに且つ同時にキューをアクセス
してメッセージを付加又は削除すること(配列位置処
理)ができる方法及び装置を提供することである。
【0014】更に本発明の目的は、前記方法及び装置が
単一のメタ・プロセッサの従来のロック操作命令を利用
することである。ちなみに、 "メタ・プロセッサ" は全
てのプロセッサに使用可能であることを意味する。
【0015】
【課題を解決するための手段】前述の目的に関して、異
なる速度のプロセッサ、例えばキューにメッセージを入
れるCPU及び外部記憶サブシステムは、メッセージを
デキューする他のプロセッサ又はサブシステムによりセ
ットされたキュー・ロックでもはや待機する必要はな
い。これは、両エンドが連結されたリスト又は分離/参
照点(ヌル/ブランク)を持つメッセージのキューの使
用により実現され、エンキューされるリストのエンド
(BOQ/BOQL)は、デキューされるリストのエン
ド(TOQ/TOQL)とは無関係にロックしアクセス
することができる。ロック操作命令は従来の検査及びセ
ットのようなアトミック・タイプ多重プロセッサ・ロ
ックであるかもしれない。
【0016】更に詳細に説明すれば、本発明の目的は、
共有メモリによって対話できるように結合された複数の
高速プロセッサ及び外部記憶サブシステムの間で、タス
ク指向メッセージを渡す方法により遂行される。前記方
法は(a)前記共有メモリで第1及び第2の密に連結さ
れた線形リストを定義し、各リストは独立してロック可
能なその第1及び第2のエンドを取得するステップ、
(b)使用可能なとき、プロセッサにより前記第1のリ
ストの第1のエンドで第1のロックを取得し、前記第1
のエンドと最後のメッセージの間にメッセージを挿入し
連結するステップ、(c)使用可能なとき、前記サブシ
ステムにより前記第1のリストの第2のエンドで他のロ
ックを取得し、前記リスト上の任意の場所からメッセー
ジを削除し前記他のロックを解除するステップ、(d)
第2のリストの第1及び第2のエンドで記憶サブシステ
ム及びプロセッサによりステップ(b)及び(c)をそ
れぞれ反復するステップを含む。
【0017】
【実施例】本発明の良好な実施例は速度の遅い外部記憶
と対話する高速多重プロセッサ・ホストを用いる。前記
外部記憶は同期する N DASDのアレイ及びアレイ制
御装置として例示される。本発明で用いるような前記外
部記憶形式についての認識を高めるために、前記アレイ
のデータ構成(ストライプ)及び情報冗長度(パリティ
・ブロック、ECC)の使用について簡単に説明する。
【0018】[文献1のRAIDタイプ3のDASDア
レイの外部記憶]文献1のタイプ3のDASDアレイは
N DASDの読書動作をカラム(列)の大きい順に同期
して行なう。しかしながら、(N−1) DASD はデ
ータを含み、1つのDASDは他のデータDASDに及
ぶ範囲のパリティを含む。即ち、前記グループのために
1つの検査DASDが用意される。障害のあるDASD
の内容は次に述べる米国特許第4092732号に示す
方法で再構築することができる。
【0019】[ブロック内及びブロック間のパリティ・
コードのブロック]米国特許第4092732号明細書
(以下、文献3と呼ぶ)は(N−1)DASDのストリ
ングの全域で同じ論理ファイルからのデータ・ブロック
の展開と、N番目のDASDに他の(N−1)ブロック
のパリティ内容のXORであるパリティ・ブロックの記
録について開示している。どれか1つのアクセスできな
いDASDからの内容も、そのパリティ・ブロックをア
クセスする残りの(N−2)DASDに記憶されたブロ
ックとXORすることにより回復できる。もしそのパリ
ティ・ブロックが使用できなくても同様の結果が達成さ
れる。
【0020】一般に、ブロック指向データでは、各デー
タ・ブロックにパリティ接尾部又は同等のもの(ハミン
グ、CRC)が付加される。従って、各パリティ接尾部
を呼出してブロック内の誤りを検出/訂正することがで
きる。文献3に記述されているように、(N−1)シー
ケンスの1以上のブロックが使用できないとき、論理に
基づいて(N−1)ブロック・シーケンスをスパンする
パリティ・ブロックは残りのブロックに関連して使用さ
れ、前記使用できないデータ・ブロックを再構築する。
効率的なコード(ハミング、巡回冗長検査、リード・ソ
ロモン)それ自体は前記文献3の他の部分で扱われ、後
で説明するように、本発明に従属するものとみなされ
る。
【0021】[複数のプロセッサ・ホスト/外部記憶構
造]図1は外部記憶として同期DASDアレイ3に結合
するプロセッサ・アレイ1のシステムを示す。プロセッ
サ5、7、9は並行動作したとき100MIPS強程度
の処理速度を有する高性能のものである。DASDアレ
イ3を構成する低速の専用プロセッサはアダプタ15に
よりプロセッサ・アレイ1に結合される。同様に、ロー
カル・エリア・ネットワーク、印刷装置又は表示装置の
ような他の情報処理入口又は出口も対応するアダプタ1
7により結合される。
【0022】プロセッサ・アレイ1内の高速のプロセッ
サと低速のプロセッサは専用メッセージ記憶部として共
有内部RAM 13 の部分を用いる超高速バス11によ
って通信する。これらのプロセッサは、中央オペレーテ
ィング・システム又はプロセス制御を持たない対等結合
分散システムを構成する。内部メモリ、割込み機能及び
大域レジスタ(図示せず)のような全ての資源は、外部
記憶即ちDASDアレイ・サブシステム(DAS)3を
含むどのプロセッサにも使用できる。
【0023】例えば、前記文献1及び米国特許出願第0
7/528999号(1990年5月24出願)明細書
に示すように、DAS 3 はRAID3タイプのDAS
Dアレイ及び関連したアレイ制御装置を含むことが望ま
しい。DASは、たとえそれが他のプロセッサと対等結
合関係で動作しても、他のプロセッサ又は資源に対して
タスク指向メッセージをキューする。現在の動作を停止
するようなキュー内の変更又は他の活動要求は専用信号
(タップ信号)によって指示される。
【0024】DASは専用キューの形式で配列された制
御ブロックを介してタスクをメッセージとして受取りタ
スク処理の結果を伝える。図2に示すように、このキュ
ーはホスト1の内部メモリ13に残存する。ちなみに、
システムはシステム優先順位の変更によりキューを再配
列する機能を含む。
【0025】図1には、更に、チャネル・アダプタ15
を介してホスト・バス11に結合されるアレイ制御装置
(エレメント19〜31)が示される。この経路はメモ
リ13、大域レジスタ、及びDAS 3 のためのタップ
信号を含む全ての資源に対するアクセスを可能にする。
アダプタ15は単信方式、メガバイト速度の受信インタ
フェース19及び送信インタフェース21の対によって
DASに結合することが望ましい。前記インタフェース
は高性能並列インタフェース(HIPPI)として知ら
れ、ANSI Draft Standard of 8/29/1989, X3T9/88-127,
Revision6.8.に記述されている。これは、いわゆるタ
ップ信号のホストからの受取り及びDASによって開始
されたホストのアクセスを容易にする。
【0026】DASに使用できるホスト又はシステム機
能は内部メモリ13の読取/書込、内部メモリ13での
ロック動作のアトミック検査及びセット、大域レジスタ
上のアトミック動作、他のプロセッサ又はシステムのエ
レメントからのタップ信号の受取り及び解釈、並びにシ
ステム又はホストへのタップ信号の生成を含む。
【0027】DAS 3 はDASD 33、35、37
のうちの1つのアドレス可能なアレイを動作させる。こ
れらのアレイの各々は同期回路39を介して同期され、
同じrpmで回転し、同じオフセット角を持ち且つ同時
に同じようにアクセスされる。この方式はデータ転送速
度を最大化する。これは高速の順次又はスキップ順次D
ASDデータ転送を可能にする。
【0028】ホスト/DAS方向のデータ移送は内部メ
モリ13から開始しバス11を介してアダプタ15及び
受信装置19を通り、ストライプ及びパリティ・ロジッ
ク23で終了する。ロジック23は、所要のディジタル
及びタイミング回路を含み、(N−1)のデータ・ブロ
ックをXORして対応するブロックをバッファ及びEC
C回路27、29及び31の1つに転送することによ
り、パリティ・ブロックを計算する。各ブロックはブロ
ック内で誤り検査及び訂正のためのECCバイトをそれ
に付加することによっても保護される。N DASD の
アクセスは従来の方法で同期して行なわれる。対応部分
はDAS/ホスト方向にデータ移送が行なわれる時に取
得する。
【0029】[DAS I/O 動作]DASD制御ブロ
ック又はDCBと呼ばれる制御ブロックでタスク又は要
求が定義される。ホストで、プロセッサは内部メモリ1
3にDAS DCB を構築する。そして、ホストはDC
BをDASの待機キューに連結し、エンキュー動作の信
号を出す。次に、DASはDCBを活動状態のリストに
移送し、DCBが要求した機能を実行し、当該DCBを
更新し、そしてそれを終了キューに入れる。I/O終了
の検出後、ホストは前記更新されたDCBを終了キュー
からデキューして前記DCBが指定した動作の結果を確
かめる。
【0030】換言すれば、DAS I/O 要求はプロセ
ッサ5〜9のどれかに応答して、そのOSから読取/書
込を呼出す。DCBが構築され、内部メモリ13にある
待機キューに入れられる。そしてタップ信号はDASに
送られる。DASも、幾つかの作業管理アルゴリズム
(FIFO、FILO、LIFO等)のどれか1つを用
いて、次にキューされたDCBキューを検査する。DA
Sは優先順位事象のようにタップ信号に応答する必要は
ない。
【0031】図2で、システムはDAS "タスク待機キ
ュー" が優先順位順に配列される。要求は、それがDA
Sによって活動状態にされる前に任意の時点で、他のタ
スク又はDCBに関して前記キュー内で再配置すること
ができる。本発明では、後で説明するように、前記再配
列は特殊なデキュー動作機能である。活動状態/待機状
況の優先順位を連結するキューの変更に関係なくDCB
は同じ内部メモリ13の実アドレスに残存する。
【0032】対等結合プロセッサの属性の1つは、初期
化中に設定された内部メモリ13内のアンカー・ポイン
タの読取りにより次にキューされたDCBを見つけ、最
初の待機中のDCB状況を "待機中" から "活動状態"
に変更することにより、DASがタップ信号又はその作
業管理アルゴリズムの受取りに応答することである。図
2に示すように、これは活動状態のリストへのDCBの
移送によって達成される。これはDASが内部メモリ・
アクセス動作のシーケンスの実行により遂行される。ひ
とたびDCBが "活動状態" になれば、DASはDC
B、従って前記DCBに含まれた機能コードを処理す
る。関連して、DCB内のアドレス情報は転送すべきデ
ータの範囲を定める。ちなみに、前記データ転送はチャ
ネル・アダプタ15を通してDASが開始する動作によ
り遂行される。
【0033】各DCBは3つの状態、即ち "活動状
態"、"待機中" 又は "終了" のうちの1つを仮定するこ
とが分かる。
【0034】データ転送動作が終了すると、図2に示す
ように、DASは終了状況をDCBに書込み、DCB状
態を "活動状態" から "終了" に変更し、そして関連し
た終了キューに前記DCBをエンキューする。また、D
ASは多数のDCBが指定した終了通知原始を実行する
ことができる。重要なことは、内部メモリ及びDASへ
(から)のデータ転送がDASの制御の下に行なわれる
ことである。
【0035】[キューの定義]図2には幾つかのDCB
のキューが示されている。ちなみに、一般にQELと呼
ばれるキュー・エレメントの各々は、どちらのプロセッ
サ等級も共有メモリ13から取出して共有メモリ13に
記憶できるメモリ内の隣接するワードのセットである。
QELはメッセージ・ワードならびにキューするために
必要なリンク・ポインタ・ワードを含む。各QELの長
さは異なることがあるが、都合よく単純なシステムはた
ぶん一定サイズ、各々が32ワードのQELを使用す
る。関連して、本発明の目的のために、各共有メモリ・
ワードそれ自身は、少なくとも他のどのワードのアドレ
スを含むのにも十分なビット位置から成る。例えば、共
有メモリの各ワードは64ビットの長さにすることがあ
る。
【0036】本明細書及び図2で用いるように、用語 "
ポインタ"はアドレスを指すか、又は前記アドレスが見
つかる場所を指す。前後の状況によりどちらを意味する
かを決める。関連して、QELを指すポインタは当該Q
EL内のワードの1つのアドレスである。指定されたワ
ード、リンク・ポインタ・ワードは、普通は他のQEL
のアドレスを含むが、全ビット・オフのような所定のヌ
ル値、又は全ビット・オンを含むこともできる。
【0037】図2に示すように、ブランクQELはその
リンク・ポインタ・ワードがヌルであるQELである。
キューは単一のブランクQELか、又は先頭QELから
末尾QELに至るポインタにより1つずつ次々にリンク
されたQELのセットから作ることもできる。末尾ポイ
ンタがロックされていない時、後者は常にブランクQE
Lである。
【0038】キューは、参加している全ての多重プロセ
ッサ等級に使用できる多重プロセッサ同期ロック動作を
用いてロックされる。ロック定数を共有メモリのワード
に記憶する例は従来の検査及びセット動作である。もし
同じアトミック動作の部分である先行する取出しが前記
ロック定数以外の値を返すならば、検査及びセット動作
はロック・ワードをうまくロックしたことを示す。
【0039】更に図2で、キュー見出しは下記に示すよ
うに共有メモリ内の4つのワードから成る。 TOQ キュー・ポインタの先頭:キュー内の先頭Q
ELのリンク・ポインタ・ワードの共有メモリ・アドレ
ス BOQ キュー・ポインタの末尾:キュー内の末尾Q
ELのリンク・ポインタ・ワードの共有メモリ・アドレ
ス TOQL TOQロック・ワード:例えば、検査及びセ
ット・ロツク・ワード;TOQロックの保持者だけがT
OQポインタか、又はBOQによって指定されたQEL
より前方のリンクされたQELの内容のどれかを変更で
きる。(BOQポインタはTOQがロックされている間
に変更できる。BOQLを参照されたい。) BOQL BOQロック・ワード:BOQロックの保持
者だけがキューの末尾でQELの内容を変更でき、多分
それを非ブランクにする。BOQLプロセッサ/保持者
だけが、そして新しい値が有効なブランクQELのアド
レスである場合にだけBOQポインタ値を変更できる。
【0040】BOQポインタの変更はエンキュー・プロ
セスとデキュー・プロセスの間の分離点を移す。ひとた
びBOQが変更されると、BOQロック保持者の更新権
限は新しいブランクQEL及びBOQポインタに減少さ
れる。TOQロック保持者は常に任意のQELを、BO
Qによって指定されたQELの1つ前までの後方のQE
Lを、BOQがロックされているかどうかに関係なく、
自由に更新できる。
【0041】前記定義は図2に適用され、各DCBが分
解されねばならない3つの状態(待機、活動状態、終
了)を表わす。待機又は終了と区分されたDCBはエン
キューされるが、活動状態のDCBは処理中である。各
々のキューで、各DCBはチェイン内の次のDCBを指
すポインタを有する。BOQはキュー末尾として動作す
るヌル即ちブランクDCBを指すのに対し、TOQは追
加された最新のキューを指す。
【0042】[エンキュー動作]図3はキューの末尾の
ブランクQELにメッセージをロードし、キューの末尾
に追加のQELを新しいブランクQELとして付加する
エンキュー動作を示す。エンキュー動作は 1. キューが使用可能になるまで待機して条件付きでB
OQをロックし、 2. 付加されたQEL、 "新しいブランク" のリンク・
ポインタにヌルを書込み、 3. 古いブランクのリンク・ポインタに新しいブランク
のメモリ・アドレスを書込み、 4. 前のブランクQEL、 "古いブランク" にメッセー
ジをロードし、 5. 新しいブランクのメモリ・アドレスをBOQポイン
タ・ワードに入れ、 6. BOQのロックを解除するステップを含む。
【0043】最初のキューは最初のブランクQELの内
容を除き変更されてはいない。最初のブランクQELは
最初はキューの末尾にあった。TOQロックのプロセッ
サ/保持者はキューのオン・ブランクQELを変更する
ことができる。
【0044】エンキューするプロセッサは2以上のQE
Lを加えることができる。エンキューの準備に際し、付
加QELは先頭付加QELから末尾付加QELまで1つ
ずつリンクされる。前記ステップは良好に作られたキュ
ーを絶えず維持する順序で以下に列挙する。 "良好に作
られたキュー" はTOQ−BOQ対及びそれに関連した
キューを指し、前記定義に適合する。 1. BOQをロックして多分それが使用可能になるまで
待機し、 2. 末尾付加QELのリンク・ポインタにヌルを入れて
それを新しいブランクにし、 3. メッセージを古いブランク、及び新しいブランクを
除く全ての付加QELにロードし、 4. 先頭に付加されたメモリ・アドレスを古いブランク
のリンク・ポインタに入れ、 5. 新しいブランクのアドレスをBOQに入れ、 6. BOQのロックを解除する。
【0045】[デキュー動作]図4はキューの先頭から
1つのQELが削除されるデキュー動作を用いる2つの
例を示す。プロセッサはキュー内の最初のQELからリ
ンク・ポインタの内容をTOQに複写する。連続してリ
ンクされたQELのシーケンスを削除するために、プロ
セッサは削除されるQELの周りを指すようにTOQポ
インタ、又は1つのQELリンク・ポインタを変更す
る。良好に作られたキューを絶えず維持するデキュー・
ステップは以下に一定の順序で列挙する。 1. IF TOQ = BOQ、キューは空の非ブランクあるのでロ
ックせずに脱出し、 2. それが使用可能になるまで待機した後、条件付きで
TOQをロックし、 3. 当該アドレスでBOQ、QELをどれか読取り、即
ちそれを越えたリンクは不適格とし、 4. 1以上の適格のQELをキューのどこかから削除
し、且つ 5. TOQのロックを解除する。
【0046】BOQによって指定されたQELは、BO
Qが読取られると、不適格として処理される。BOQロ
ック保持者はこれを有効なQELとみなし、BOQを変
更することができるのに対し、当該QELはこのエンキ
ュー即ち再配列の実行には不適格のままである。
【0047】[再配列動作]再配列は先ずQELを適格
のQELチェインからデキューし、次にそれを前記適格
のQELチェインに再挿入する2つのステップのプロセ
スである。再配列を行なうプロセッサは前記2つのステ
ップの期間中はTOQロックを保持する。従って、キュ
ーの先頭に対する1つのQELを削除する("QEL移
送"と呼ばれる)ために、前述のように、プロセッサは
QELをデキューしてから、QEL移送のリンク・ポイ
ンタをTOQにある値に変更することによりそれを再挿
入し、QEL移送のアドレスをTOQに入れる。
【0048】類似の方法で、プロセッサは任意の数の適
格なQELをデキューし、それらを1以上のフラグメン
ト(断片)チェインで相互連結し、前記フラグメントを
キューに再挿入することができる。再挿入は下記のステ
ップで実行し、良好に作られたキューを維持することが
できる。 1. フラグメントの最後のQELのリンク・ポインタ
を、キューの中でフラグメントの次にくるQELのアド
レスにセットし、 2. TOQポインタ、又はフラグメントの前にくる予定
のQELのリンク・ポインタを、フラグメントの中の最
初のQELのアドレスにセットする。
【0049】[拡張]良好に作られたキューを絶えず維
持する動作では、共有メモリ内の個々のワード記憶のポ
インタの更新は完全に終了する必要がある。もしプロセ
スが所与の順序の動作のステップに従うならば、キュー
は良好に作られたままである。大抵のハードウェア故
障、又は早すぎたプロセス終了の場合、移送中のQEL
の一部はキューに入っていないことがあるが、キュー自
体は良好に作られたままである。他のプロセスはこのよ
うなキューとともに作業を続けることができる。
【0050】最初の例では、共有メモリの割振りはプロ
セッサだけの機能である。これは、終了状況を報告する
QELとして各作業キュー・エレメントを制御装置に再
使用させることによって達成することができる。
【0051】
【発明の効果】本発明によれば、速度の異なるプロセッ
サが互いに且つ同時にキューをアクセスしてメッセージ
を付加又は削除することができる。
【図面の簡単な説明】
【図1】共有内部メモリ、高性能チャネル・インタフェ
ース(HPCI)、アレイ制御装置及びDASDを強調
してCPU/DASDアレイのデータの流れを示す図で
ある。
【図2】どちらかのエンドを選択してロックできるDA
SD制御ブロック(DCB)の待機キュー、活動状態の
リスト及び終了キューを示す図である。
【図3】DCB待機キュー及び終了キューでのエンキュ
ー動作を示す図である。
【図4】それぞれの第1及び第2の例のDCB待機キュ
ー及び終了キューでのデキュー動作を示す図である。
【符号の説明】
1 プロセッサ・アレイ/ホスト 3 DASDアレイ/DAS 5 プロセッサ1 7 プロセッサ2 9 プロセッサN 11 バス 13 RAM/内部メモリ 15 アダプタ 17 アダプタ 19 受信装置 21 送信装置 23 ストライピング及びパリティ・ロジック 27 バッファ及びECC回路 29 バッファ及びECC回路 31 バッファ及びECC回路 33 DASD 1 35 DASD 2 37 DASD N 39 同期回路

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】共有メモリ上で通信できるように結合され
    た複数の高速プロセッサと外部記憶サブシステム間で、
    メッセージを移送する方法であって、 (a)各々が独立してロックできる第1及び第2のエン
    ドを有する第1及び第2のリストを前記共有メモリで定
    義するステップと、 (b)前記第1のリストが使用可能なとき、プロセッサ
    により前記第1のリストの第1のエンドで第1のロック
    を取得し、前記第1のエンドと最後に連結されたメッセ
    ージの間にメッセージを挿入して前記第1のロックを解
    放するステップと、 (c)前記第1のリストが使用可能なとき、前記サブシ
    ステムにより前記第1のリストの第2のエンドで他のロ
    ックを取得し、前記リスト上の任意の場所のメッセージ
    を削除し、前記他のロックを解放するステップと、 (d)前記第2のリストの第1及び第2のエンドで、前
    記記憶サブシステムとプロセッサによりステップ(b)
    及び(c)をそれぞれ反復するステップと、 を含むタスク指向メッセージ移送方法。
  2. 【請求項2】複数の高速プロセッサ、外部記憶サブシス
    テム、共有内部メモリ、及び内部記憶を利用する手段を
    有するシステムでタスク指向メッセージを移送する方法
    であって、第1の方向でメッセージを前記プロセッサに
    よってエンキューするとともに前記記憶サブシステムに
    よってメッセージをデキューし、且つ第2の方向でメッ
    セージを前記記憶サブシステムによってエンキューする
    とともに前記プロセッサによりメッセージをデキュー
    し、各プロセッサはロックワードの検査及びセットを行
    うためのロック操作命令をアクセスし、 (a)前記共有内部メモリ内に第1及び第2の相互連結
    されたリスト、前記リスト上に参照点、及び演算子セッ
    トを定義し、各演算子セットはリストの先頭(TOQ)
    及びリストの末尾(BOQ)を指すポインタと、リスト
    の先頭のロックワード(TOQL)と、リストの末尾の
    ロックワード(BOQL)とを含むステップと、 (b)前記プロセッサの1つにより前記ロック操作命令
    を実行した結果と前記BOQLを比較し、両者が一致す
    れば、前記1つのプロセッサにより前記第1のリストの
    参照点エンド(第1のエンド)で第1のロックを取得
    し、前記リストで前記参照点と最後に結合されたメッセ
    ージの間にメッセージを埋込み、前記第1のロックを解
    放するステップと、 (c)前記サブシステムにより前記ロック操作命令を実
    行した結果と前記TOQLを比較し、両者が一致すれ
    ば、前記サブシステムにより前記第1のリストの非参照
    点エンド(第2のエンド)で他のロックを取得し、1以
    上のメッセージを前記リストから削除し、前記他のロッ
    クを解放するステップと、 (d)前記第2のリストでステップ(b)及び(c)を
    前記記憶サブシステム及びプロセッサによりそれぞれ反
    復するステップと、 を含むタスク指向メッセージ移送方法。
  3. 【請求項3】前記他のロック(TOQL)を保持するプ
    ロセッサだけが前記リストの非参照エンドを指すポイン
    タ又は前記リストの参照点エンドにあるメッセージの何
    れかを指すポインタを変更することができ、更に前記第
    1のロック(BOQL)を保持するプロセッサだけが前
    記リストで前記参照点を示すポインタをどれも変更する
    ことができる請求項2のタスク指向メッセージ移送方
    法。
  4. 【請求項4】サブシステムは前記第1のリストから削除
    されたメッセージを処理し、各メッセージを更新し、前
    記更新されたメッセージを前記第2のリストにエンキュ
    ーし、前記生成するプロセッサは外部規律(LIFO、
    FILO、FIFO)又は前記第2のリストの優先順位
    再配列ないしはその一部分により各更新されたメッセー
    ジを前記第2のリストからデキューして処理する請求項
    1又は請求項2のタスク指向メッセージ移送方法。
  5. 【請求項5】共有メモリによって外部記憶サブシステム
    と通信するように結合された複数の高速プロセッサを有
    するシステムであって、 選択されたプロセッサから生成されるメッセージに応答
    して前記メッセージを前記共有メモリに書込み、前記メ
    ッセージを待機キューに相互連結し、前記記憶サブシス
    テムに通知する手段、 前記記憶サブシステムで前記通知に非定期的に応答して
    前記待機キューから前記メッセージをデキューし、前記
    デキューされたメッセージを処理し、前記処理されたメ
    ッセージを前記共有メモリ内の終了キューにエンキュー
    して前記システムに通知する手段、及び 前記サブシステムの信号に非定期的に応答して前記終了
    キューから前記処理されたメッセージをデキューする手
    段を含み、前記システムは更に別々にロックできるエン
    ドを有する相互連結されたリストの対を共有メモリ内で
    定義する手段、及び プロセッサ又は前記サブシステムにより各リスト上のメ
    ッセージをエンキューして、高速及び低速のプロセッサ
    の間で移送されるメッセージをサポートする、相互に他
    のリストに対向するキューとして前記リストを動作さ
    せ、前記各リストは (i) 前記プロセッサがメッセージをエンキューする場合
    には前記サブシステムによるメッセージのデキュー動
    作、又は (ii)前記サブシステムが同じリスト上のメッセージをエ
    ンキューする場合には前記プロセッサによるメッセージ
    のデキュー動作と無関係にロックできる手段を含む高速
    プロセッサ・システム
JP3165260A 1990-07-13 1991-06-11 速度差が大きい協同プロセッサ間のメッセージ・キュー処理 Expired - Fee Related JP2675928B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/553,203 US5224215A (en) 1990-07-13 1990-07-13 Message queue processing among cooperative processors having significant speed differences
US553203 1990-07-13

Publications (2)

Publication Number Publication Date
JPH04233653A JPH04233653A (ja) 1992-08-21
JP2675928B2 true JP2675928B2 (ja) 1997-11-12

Family

ID=24208520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3165260A Expired - Fee Related JP2675928B2 (ja) 1990-07-13 1991-06-11 速度差が大きい協同プロセッサ間のメッセージ・キュー処理

Country Status (3)

Country Link
US (1) US5224215A (ja)
EP (1) EP0466339A3 (ja)
JP (1) JP2675928B2 (ja)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5442785A (en) * 1991-10-08 1995-08-15 Unisys Corporation Method and apparatus for passing messages between application programs on host processors coupled to a record lock processor
GB9323241D0 (en) * 1993-11-11 1994-01-05 Int Computers Ltd Message handler
EP0654740A1 (de) * 1993-11-22 1995-05-24 Siemens Aktiengesellschaft Bussteuerung
US5659784A (en) * 1994-01-28 1997-08-19 Nec Corporation Multi-processor system having communication register modules using test-and-set request operation for synchronizing communications
US6029205A (en) * 1994-12-22 2000-02-22 Unisys Corporation System architecture for improved message passing and process synchronization between concurrently executing processes
US5602998A (en) * 1994-12-22 1997-02-11 Unisys Corporation Dequeue instruction in a system architecture for improved message passing and process synchronization
US5555396A (en) * 1994-12-22 1996-09-10 Unisys Corporation Hierarchical queuing in a system architecture for improved message passing and process synchronization
US5797005A (en) * 1994-12-30 1998-08-18 International Business Machines Corporation Shared queue structure for data integrity
CA2167633A1 (en) * 1995-01-23 1996-07-24 Leonard R. Fishler Apparatus and method for efficient modularity in a parallel, fault tolerant, message based operating system
US5671365A (en) * 1995-10-20 1997-09-23 Symbios Logic Inc. I/O system for reducing main processor overhead in initiating I/O requests and servicing I/O completion events
US5687390A (en) * 1995-11-14 1997-11-11 Eccs, Inc. Hierarchical queues within a storage array (RAID) controller
US5802547A (en) * 1996-10-15 1998-09-01 International Business Machines Corporation Data storage system with streamlined data exchange path to cached data
US5922057A (en) * 1997-01-10 1999-07-13 Lsi Logic Corporation Method for multiprocessor system of controlling a dynamically expandable shared queue in which ownership of a queue entry by a processor is indicated by a semaphore
US6341301B1 (en) 1997-01-10 2002-01-22 Lsi Logic Corporation Exclusive multiple queue handling using a common processing algorithm
US5966547A (en) * 1997-01-10 1999-10-12 Lsi Logic Corporation System for fast posting to shared queues in multi-processor environments utilizing interrupt state checking
US7111293B1 (en) * 1998-06-03 2006-09-19 Ants Software, Inc. Method for increased concurrency in a computer system
US6229813B1 (en) * 1998-11-25 2001-05-08 Alcatel Canada Inc. Pointer system for queue size control in a multi-task processing application
US6704801B1 (en) * 1999-02-18 2004-03-09 Nortel Networks Limited Atomic transmission of multiple messages in a virtual synchrony environment
US6636883B1 (en) * 1999-02-22 2003-10-21 International Business Machines Corporation Mechanism for passing information between queuing and de-queuing processes
FI991334A (fi) * 1999-06-10 2000-12-11 Nokia Networks Oy Menetelmä kaksisuuntaisen jonon toteuttamiseksi muistissa ja muistijär jestely
US7000234B1 (en) * 2000-01-20 2006-02-14 Sun Microsystems, Inc. Maintaining a double-ended queue as a linked-list with sentinel nodes and delete flags with concurrent non-blocking insert and remove operations using a double compare-and-swap primitive
US7539849B1 (en) 2000-01-20 2009-05-26 Sun Microsystems, Inc. Maintaining a double-ended queue in a contiguous array with concurrent non-blocking insert and remove operations using a double compare-and-swap primitive
AU2001227533A1 (en) * 2000-01-20 2001-07-31 Sun Microsystems, Inc. Double-ended queue in a contiguous array with concurrent non-blocking insert andremove operations
US7017160B2 (en) 2000-04-18 2006-03-21 Sun Microsystems, Inc. Concurrent shared object implemented using a linked-list with amortized node allocation
US6826757B2 (en) 2000-04-18 2004-11-30 Sun Microsystems, Inc. Lock-free implementation of concurrent shared object with dynamic node allocation and distinguishing pointer value
US7117502B1 (en) 2000-11-10 2006-10-03 Sun Microsystems, Inc. Linked-list implementation of a data structure with concurrent non-blocking insert and remove operations
US7246187B1 (en) * 2000-11-28 2007-07-17 Emc Corporation Method and apparatus for controlling exclusive access to a shared resource in a data storage system
US7299242B2 (en) * 2001-01-12 2007-11-20 Sun Microsystems, Inc. Single-word lock-free reference counting
US7769791B2 (en) * 2001-01-12 2010-08-03 Oracle America, Inc. Lightweight reference counting using single-target synchronization
US6880071B2 (en) 2001-04-09 2005-04-12 Sun Microsystems, Inc. Selective signalling of later reserve location memory fault in compound compare and swap
US7185340B1 (en) * 2001-10-11 2007-02-27 Ants Software, Inc. Multiphase system and method of performing operations on data structures
US7194495B2 (en) * 2002-01-11 2007-03-20 Sun Microsystems, Inc. Non-blocking memory management mechanism for supporting dynamic-sized data structures
US7779165B2 (en) * 2002-01-11 2010-08-17 Oracle America, Inc. Scalable method for producer and consumer elimination
US7836228B1 (en) 2004-06-18 2010-11-16 Oracle America, Inc. Scalable and lock-free first-in-first-out queue implementation
US9052944B2 (en) 2002-07-16 2015-06-09 Oracle America, Inc. Obstruction-free data structures and mechanisms with separable and/or substitutable contention management mechanisms
US7685583B2 (en) * 2002-07-16 2010-03-23 Sun Microsystems, Inc. Obstruction-free mechanism for atomic update of multiple non-contiguous locations in shared memory
US7293143B1 (en) * 2002-09-24 2007-11-06 Sun Microsystems, Inc. Efficient non-blocking k-compare-single-swap operation
US7814488B1 (en) 2002-09-24 2010-10-12 Oracle America, Inc. Quickly reacquirable locks
US7424477B1 (en) 2003-09-03 2008-09-09 Sun Microsystems, Inc. Shared synchronized skip-list data structure and technique employing linearizable operations
US7137033B2 (en) * 2003-11-20 2006-11-14 International Business Machines Corporation Method, system, and program for synchronizing subtasks using sequence numbers
US7296273B2 (en) * 2003-12-04 2007-11-13 International Business Machines Corporation System, method and program tool to reset an application
US10049127B1 (en) 2003-12-19 2018-08-14 Oracle America, Inc. Meta-transactional synchronization
US8074030B1 (en) 2004-07-20 2011-12-06 Oracle America, Inc. Using transactional memory with early release to implement non-blocking dynamic-sized data structure
US7703098B1 (en) 2004-07-20 2010-04-20 Sun Microsystems, Inc. Technique to allow a first transaction to wait on condition that affects its working set
US7395382B1 (en) 2004-08-10 2008-07-01 Sun Microsystems, Inc. Hybrid software/hardware transactional memory
US7711909B1 (en) 2004-12-09 2010-05-04 Oracle America, Inc. Read sharing using global conflict indication and semi-transparent reading in a transactional memory space
US7680986B1 (en) 2004-12-30 2010-03-16 Sun Microsystems, Inc. Practical implementation of arbitrary-sized LL/SC variables
US7577798B1 (en) 2004-12-30 2009-08-18 Sun Microsystems, Inc. Space-adaptive lock-free queue using pointer-sized single-target synchronization
US7533221B1 (en) 2004-12-30 2009-05-12 Sun Microsystems, Inc. Space-adaptive lock-free free-list using pointer-sized single-target synchronization
US7509463B2 (en) * 2005-12-01 2009-03-24 Sony Computer Entertainment, Inc. Cell processor atomic compare and swap using dedicated synergistic processor element
WO2007138250A2 (en) * 2006-05-25 2007-12-06 Solarflare Communications Incorporated Computer system with lock- protected queues for sending and receiving data
US7949815B2 (en) * 2006-09-27 2011-05-24 Intel Corporation Virtual heterogeneous channel for message passing
US8904064B2 (en) * 2008-10-24 2014-12-02 International Business Machines Corporation Managing an out-of-order asynchronous heterogeneous remote direct memory access (RDMA) message queue
GB2512086A (en) 2013-03-20 2014-09-24 Ibm Transaction capable queuing
US9471522B2 (en) * 2013-12-04 2016-10-18 International Business Machines Corporation Resource allocation by virtual channel management and bus multiplexing
US20150186180A1 (en) * 2013-12-30 2015-07-02 David W. Schroth Systems and methods for affinity dispatching based on network input/output requests
CN105404546A (zh) * 2015-11-10 2016-03-16 上海交通大学 基于rdma和htm的分布式并发控制方法
CN107025184B (zh) * 2016-02-01 2021-03-16 深圳市中兴微电子技术有限公司 一种数据管理方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3336582A (en) * 1964-09-01 1967-08-15 Ibm Interlocked communication system
US4092732A (en) * 1977-05-31 1978-05-30 International Business Machines Corporation System for recovering data stored in failed memory unit
US4454595A (en) * 1981-12-23 1984-06-12 Pitney Bowes Inc. Buffer for use with a fixed disk controller
US4482956A (en) * 1982-11-04 1984-11-13 International Business Machines Corporation Parallel queueing method
US4649473A (en) * 1985-06-17 1987-03-10 International Business Machines Corporation Flexible data transmission for message based protocols
EP0273083B1 (en) * 1986-12-30 1993-10-06 International Business Machines Corporation Non-locking queueing mechanism
US4807111A (en) * 1987-06-19 1989-02-21 International Business Machines Corporation Dynamic queueing method

Also Published As

Publication number Publication date
EP0466339A3 (en) 1993-08-11
JPH04233653A (ja) 1992-08-21
EP0466339A2 (en) 1992-01-15
US5224215A (en) 1993-06-29

Similar Documents

Publication Publication Date Title
JP2675928B2 (ja) 速度差が大きい協同プロセッサ間のメッセージ・キュー処理
US5787304A (en) Multipath I/O storage systems with multipath I/O request mechanisms
US6542960B1 (en) System and method for parity caching based on stripe locking in raid data storage
US5712970A (en) Method and apparatus for reliably storing data to be written to a peripheral device subsystem using plural controllers
US5101492A (en) Data redundancy and recovery protection
US4995041A (en) Write back buffer with error correcting capabilities
US4672535A (en) Multiprocessor system
US4849978A (en) Memory unit backup using checksum
US8108583B2 (en) Direct memory access controller system with message-based programming
US6851022B2 (en) Raid controller and control method thereof
US5978856A (en) System and method for reducing latency in layered device driver architectures
US5522065A (en) Method for performing write operations in a parity fault tolerant disk array
JPH07504527A (ja) 高性能の不揮発性ram保護式の書き込みキャッシュアクセラレータシステム
JP2557199B2 (ja) インターフェース・システムおよび方法
US20040186931A1 (en) Transferring data using direct memory access
EP1087296B1 (en) Word width selection for SRAM cache
US5136718A (en) Communications arrangement for digital data processing system employing heterogeneous multiple processing nodes
US6681291B2 (en) Storage controller and control method thereof
US7143206B2 (en) Method for controlling data transfer unit having channel control unit, storage device control unit, and DMA processor
JPH06131244A (ja) 共有メモリの非同期アクセス方式
US5838892A (en) Method and apparatus for calculating an error detecting code block in a disk drive controller
EP0430500B1 (en) System and method for atomic access to an input/output device with direct memory access
EP1128253A2 (en) Method and apparatus to concurrently operate on multiple data movement transactions in a disk array subsystem
JP2710587B2 (ja) 情報処理システム
JP3141948B2 (ja) 計算機システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees