JP2006216068A - コンピュータ・システムの異なるパーティション中で複数のオペレーティング・システムを動作させ、異なるパーティションが共用メモリを介して相互に通信できるようにするコンピュータ・システムおよび方法 - Google Patents

コンピュータ・システムの異なるパーティション中で複数のオペレーティング・システムを動作させ、異なるパーティションが共用メモリを介して相互に通信できるようにするコンピュータ・システムおよび方法 Download PDF

Info

Publication number
JP2006216068A
JP2006216068A JP2006049063A JP2006049063A JP2006216068A JP 2006216068 A JP2006216068 A JP 2006216068A JP 2006049063 A JP2006049063 A JP 2006049063A JP 2006049063 A JP2006049063 A JP 2006049063A JP 2006216068 A JP2006216068 A JP 2006216068A
Authority
JP
Japan
Prior art keywords
partition
memory
window
computer system
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006049063A
Other languages
English (en)
Inventor
Robert C Gulick
シィー.グリック ロバート
Douglas E Morrissey
イー.モリシー ダグラス
Charles Raymond Caldarale
レイモンド カルダレール チャールズ
Bruce Alan Vessey
アラン ビッセー ブルース
Craig F Russ
エフ.ラス クレイグ
Eugene W Troxell
ダブリュ.トロクセル ユージーン
Hans Christian Mikkelsen
クリスチャン ミッケルセン ハンス
Sharon M Mauer
エム.マウアー シャロン
Maureen P Connell
ピー.コンネル モーリーン
James R Hunter
アール.ハンター ジェームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisys Corp
Original Assignee
Unisys Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisys Corp filed Critical Unisys Corp
Publication of JP2006216068A publication Critical patent/JP2006216068A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Hardware Redundancy (AREA)
  • Storage Device Security (AREA)

Abstract

【課題】コンピュータシステム上の異なるパーティション中で複数のオペレーティングシステム(OS)を動作させ、各々が共用メモリを介して相互に通信可能にすること
【解決手段】各パーティションに構成できる複数の処理モジュールとメインメモリ(MM)を含む。各パーティションは別々のOSの制御下で動作する。少なくとも1つの共用メモリ・ウインドウ(MW)がMM内に規定され、複数のパーティションがそこへの共用アクセス権を有する。各パーティションには排他メモリウインドウ(MW)も割り当てる。異なるパーティション上で実行するプログラムコードにより、各パーティションは共用MWを介して相互通信可能である。各パーティション中のプロセッサの物理アドレス空間を各パーティションの各排他MWにマッピングする手段も提供され、各パーティションの排他MWはそこで実行する各OSにはすべて同じベース・アドレスで開始するように見える。
【選択図】図3

Description

本発明は、一般にコンピュータ・システムに関し、より詳細には、コンピュータ・システム上の異なるパーティション中で複数のオペレーティング・システムを動作させ、異なるパーティションが共用メモリを介して相互に通信できるようにするコンピュータ・システムに関する。
コンピュータ・システムは通常、プロセッサ、メイン・メモリ、および入出力装置(例えばプリンタ、ネットワーク・インターフェース、グラフィック・ディスプレイ(図形表示)インターフェース)を含む。コンピュータ・システムは、データ項目のソースまたは宛先を指定するためのアドレス指定方式を用いる。データのアクセスを含めたメモリ管理機能、ならびに他の管理機能は、オペレーティング・システムを介して制御される。様々なオペレーティング・システムが市販されており、それぞれは、それ自体の独自の特徴および能力を有している。従来のコンピュータ・システムは、通常、単一のオペレーティング・システムを採用する。
現代のコンピュータ・システムが発展し、ユーザーの要求が増すにつれ、複数のオペレーティング・システムを採用する必要性が増している。残念ながら、複数のオペレーティング・システムは、コンピュータ・システムの動作の複雑さをかなり増大させる。
異なるオペレーティング・システムを含めた複数のオペレーティング・システムが、コンピュータ・システム上の個々のパーティション中で動作できるようにし、個々のパーティション中で稼動するオペレーティング・システムおよびその他のクライアントとを含む個々のパーティションが、共用メモリを介して相互に通信できるようにするコンピュータ・システムおよび方法が必要とされている。
特許文献1には、ハード・ワイヤードのメモリ区分化方式が開示されており、この方式では、4つのプロセッサ「クラスタ」のそれぞれに固有のクラスタ番号が割り当てられ、次いでその番号が、プロセッサ・メモリ参照と共に、ハード・ワイヤードで柔軟性のない変換機構に従って変形されるが、この変換機構は、前述のことを達成するのに必要なフレキシビリティおよびプログラム可能性に欠けている。特許文献2および特許文献3には、システム間通信技術が記述されているが、これらには、単独でも特許文献1との組み合わせでも、望まれる種類のシステムは記述されていない。
米国特許第5590301号明細書 米国特許第5142683号明細書 欧州特許出願公開第0444376号明細書
本発明は、複数のオペレーティング・システムが単一のコンピュータ・アーキテクチャ内の個々のパーティション中で動作できるようにし、個々のパーティションが共用メモリを介して相互に通信できるようにする、コンピュータ・システムおよび方法を対象とする。
本発明の第1の態様によれば、このコンピュータ・システムは、複数の処理モジュールと、メイン・メモリとを含み、各処理モジュールは、メイン・メモリのすべてにわたりプロセッサ・メモリ待ち時間が各処理モジュールごとに同じになるように、メイン・メモリに接続される。1つまたは複数の処理モジュールのグループが、コンピュータ・システム内の別々のパーティションとして構成され、各パーティションは、別々のオペレーティング・システムの制御下で動作する。さらに本発明のこの第1の態様によれば、メイン・メモリは、少なくとも1つの共用メモリ・ウインドウをその中に規定し、この共用メモリ・ウインドウへは、少なくとも2つの異なるパーティションが共用アクセス権を有する。異なるパーティション上で実行されるプログラム・コードにより、これらの異なるパーティションは、共用メモリ・ウインドウを介して相互に通信することができる。
メイン・メモリはさらに、コンピュータ・システム内で構成された異なるパーティションごとに、排他メモリ・ウインドウをその中に規定することもできる。この排他メモリ・ウインドウへは、そのパーティションだけしかアクセス権を有さず、そのパーティションのオペレーティング・システムがその中で実行される。異なる2つのパーティション上にある別々のオペレーティング・システムは、異なるオペレーティング・システムでもよく、同じオペレーティング・システムの異なるインスタンスでもよい。
一実施形態では、パーティション間通信を(共用メモリ・ウインドウのリソースを管理することにより)可能にするプログラム・コードは、送信するパーティションがプロセッサ間割込みを受信するパーティション上で生成して、共用メモリ・ウインドウを介して受信するパーティションに情報が転送されていることを受信するパーティションに信号(signal)で知らせるための、プロセスを実装する。この実施形態によれば、共用メモリ・ウインドウは、各パーティションに関連付けられた入力待ち行列のセットを含み、所与のパーティションに関連するセット中の各入力待ち行列は、別のパーティションに対応し、その別のパーティションからの通信を表すエントリを格納する。あるパーティション(送信するパーティション)が別のパーティション(受信するパーティション)と通信するようにするために、送信するパーティション上のプログラム・コードは、(i)受信するパーティションの、送信するパーティションに対応する入力待ち行列中にエントリを作成するようにし、次いで、(ii)受信するパーティション上でプロセッサ間割込みを生成して、その入力待ち行列中にエントリが作成されたことを受信するパーティションに信号(signal)で知らせるようにする。
共用メモリのプロセッサ間割込みを他のパーティションから受け取るための割込みベクトルが各パーティションに1つだけしか割り当てられていない一実施形態を仮定すると、受信するパーティション上でプロセッサ間割込みが検出されたとき、受信するパーティション上のプログラム・コードは、(i)その入力待ち行列それぞれを検査して、どの入力待ち行列が他のパーティションからの通信を表すエントリを含んでいるかを決定するようにし、(ii)そのようなエントリを、それらを含む入力待ち行列から抽出するようにする。各入力待ち行列は、その待ち行列中にあるエントリの数のカウントを含むことが好ましい。
別法として、各パーティションが、プロセッサ間割込みをそれから受け取る可能性のある他のパーティションそれぞれに別々の割込みベクトルを割り当て、送信するパーティションが、プロセッサ間割込みを受信するパーティションに送るときに、それに割り当てられた割込みベクトルを指定する一実施形態では、受信するパーティションは、指定された割込みベクトルを使用して送信するパーティションに関連付けられた入力待ち行列を識別し、それを直接処理することができる。この場合、その入力待ち行列すべてを循環すること(各パーティションが共用メモリのプロセッサ間割込みに割込みベクトルを1つだけしか割り当てない場合のように)は必要ではない。
さらにこの第1の実施形態では、共用メモリ・ウインドウはさらに、複数のメモリ・ページも含む。これらを必要に応じてパーティションに割り振って、それらの間における情報の通信を容易にすることができる。送信するパーティションと受信するパーティションの間の通信を表す入力待ち行列エントリは、共用メモリ・ウインドウの、割り振られた1つまたは複数のページに対するハンドルを含むこともできる。送信するパーティションは、割り振られた1つまたは複数のページを使用して、受信するパーティションに通信すべきメッセージを表すデータを格納することができる。
さらにこの第1の実施形態では、各入力待ち行列は、事前定義された数のエントリを格納することができ、入力待ち行列が一杯になったときに設定されるオーバーフロー・フラグを含む。送信するパーティションは、入力待ち行列中にエントリが作成されたことによってその入力待ち行列が一杯になった場合に、その入力待ち行列のオーバーフロー・フラグが設定されるようにする。受信する側では、オーバーフロー・フラグが設定された入力待ち行列に受信するパーティションが遭遇した場合、受信するパーティションはその待ち行列を空にし、次いでオーバーフロー・フラグをリセットする。次いで受信するパーティションは、送信するパーティションに通信を返信して、入力待ち行列がもはや一杯ではないことを送信するパーティションに知らせることができる。一杯になった入力待ち行列を介して通信が送信されようとした場合は、送信するパーティションは、エラーを返すことができる。別法として、各パーティションは、指定された入力待ち行列のオーバーフロー・フラグが以前に設定されたせいでその入力待ち行列中に配置できなかった入力待ち行列エントリを格納するために、その排他メモリ・ウインドウ中の、ある位置を保持しておくこともできる。この排他メモリ・ウインドウ位置に記憶されたエントリは、指定された入力待ち行列のオーバーフロー・フラグが受信するパーティションによってリセットされるまで、そこに留めておくことができる。
好ましい実施形態ではさらに、共用メモリ・ウインドウは、共用メモリ・ウインドウの割り振り可能な各ページごとに、そのページが使用されているか、それとも割り振り(allocation)に利用可能かを判定するためのテーブルをさらに含む。割り振りに利用可能なページは、相互にリンクさせて、利用可能なページのリンク・リストを形成するのが好ましい。少なくともいくつかのタイプのページでは、1つまたは複数のパーティションによるページの所有権(ownership)を、そのページ自体の内にあるヘッダ中に含まれる情報によって示すのが好ましい。その他のタイプのページの所有権は、各ページの利用可能度も指定するテーブル中の情報によって示すことができる。
各ページのヘッダはさらに、ロック・フィールドを含むこともでき、このロック・フィールドにより、あるパーティションが、例えばあるページのヘッダ中の所有権情報を更新するために、そのページへの排他アクセス権を獲得することができる。このフィールドは、本発明のより広範なロック機構の一部であり、このロック機構により、異なるパーティションが必要に応じて、かつ一貫した方式で、共用メモリ・ウインドウの様々な構造、ページ、およびテーブルへのアクセスをロックして、一度に1つのパーティションだけしか所与の構造、ページ、またはテーブルを修正できないようにする(すなわち、これらの構造へのアクセスの同期をとる)ことができる。本発明のロック機構の重要な機能の1つによれば、メモリ・ページが最初に割り振られるとき、割り振るパーティションは、割り振りの間にそのページへのアクセスをロックするために、システム全体のロックを獲得しなければならない。しかし、割り振られた1つまたは複数のページの所有権を拡張するか、または他のパーティションに移転するときは、関係するページのロックを獲得するだけでよい。この目的で、これらのページ中のロック・フィールドが使用される。これにより、システム全体をロックするための競合がなくなるので、パーティション間の通信のスループットを増大させることが容易になる。
第2の実施形態によれば、各パーティション上のプログラム・コードはポーリング・プロセスを実装するが、このポーリング・プロセスにより、各パーティションは、共用メモリ・ウインドウ内のエリアをポーリングして、それに向けられた通信が別のパーティションから共用メモリ・ウインドウ中に配置されたかどうかを決定する。この実施形態では、各パーティションによってポーリングされるエリアは複数の出力待ち行列を含み、これはパーティションごとに1つである。所与のパーティション用の出力待ち行列は、そのパーティションが、他のパーティションに向けた通信を共用メモリ・ウインドウ中に配置したかどうかを示す。各パーティションは、他のパーティションの出力待ち行列をポーリングして、それらのパーティションがそれに向けた通信を共用メモリ・ウインドウ中で配置したかどうかを決定する。各パーティションには、メッセージ・バッファの別々のプールが割り振られ、このバッファ中に、他のパーティションに向けた通信を出すことができる。送信するパーティションは、それに割り振られたバッファの1つの中に受信するパーティションに向けた通信を配置すると、次いで、その出力待ち行列中でそのバッファの位置を指定する。
より詳細には、所与のパーティションの出力待ち行列は、1つまたは複数のノード・ツー・ノード(node-to-node)待ち行列を含み、1つのノード・ツー・ノード待ち行列は、通信を渡す先となる可能性のある他の各パーティションに関連する。各ノード・ツー・ノード待ち行列は、関連するパーティションに向けられた通信が共用メモリ中に出されたかどうかを示す。したがって各パーティションは、他の各パーティションの出力待ち行列中で、それに関連するノード・ツー・ノード待ち行列をポーリングして、これら他のパーティションがそれに向けた通信を共用メモリ・ウインドウ中に配置したかどうかを決定する。送信するパーティションからバッファ中に出されたメッセージ・データに対し、受信するパーティションに関連するノード・ツー・ノード待ち行列は、受信するパーティションがメッセージ・データを取り出すことができるようにバッファの位置を指定することになる。
本発明の第2の態様によれば、このコンピュータ・システムはまた、各パーティション中のプロセッサの物理アドレス空間を、そのパーティションに割り当てられたそれぞれの排他メモリ・ウインドウにマッピングする手段も備える。具体的には、このマッピングする手段は、所与のパーティション上にあるプロセッサの物理アドレス空間内の位置への参照を、そのパーティションに割り当てられた排他メモリ・ウインドウ内の対応する位置に再配置する手段を備える。このようにして、メイン・メモリの異なるエリア中に物理的に配置された、各パーティションの排他メモリ・ウインドウを、それぞれのオペレーティング・システムにはメイン・メモリ中の同じベース物理アドレスを有すると見えるようにすることができる(例えばベース・アドレス0)。このことは、ある種のオフザ・シェルフ(off-the-shelf)オペレーティング・システム(例えばUnix、WindowsNTなど)を異なるパーティション中で稼動させるのに必要である。というのは、これらのオペレーティング・システムは、メイン・メモリがアドレス0で開始することを前提としているからである。各パーティション中のプロセッサ・アドレス空間をその排他メモリ・ウインドウにマッピングすることにより、オペレーティング・システムは、それらが実行されているプロセッサの物理アドレス空間中でそれらが通常するようにメモリを参照し続けることができる。したがって、オペレーティング・システムの修正は必要ない。
好ましい一実施形態では、再配置する手段は、メイン・メモリのベース物理アドレスから所与のパーティションに割り当てられた排他メモリ・ウインドウの開始までのオフセット(R OS)を保持するレジスタと、そのパーティション中のプロセッサによるその物理アドレス空間内の位置への各参照にこのオフセット(R OS)を加算する加算器と備える。この結果、これらの参照は、そのパーティションの排他メモリ・ウインドウ内のこれらに対応する位置に再配置される。
本発明の別の特徴によれば、所与のパーティションのプロセッサの物理アドレス空間が、メモリ記憶に利用不可能なアドレスの範囲(例えば、メモリ・マップされたI/0(入出力)に専用になっている範囲)、このようなメモリ・ホールと規定する範囲を含み、コンピュータ・システムはさらに、パーティションの排他メモリ・ウインドウの、通常ならそのメモリ・ホールに対応することになるその部分を、他の用途に再利用する手段も備えることができる。より具体的には、コンピュータ・システムは、メモリ・ホールを認識し、そのメモリ・ホールよりも上のアドレスをハイ・メモリ範囲と規定し、そのメモリ・ホールよりも低いアドレスをロー・メモリ範囲と規定する。メイン・メモリのベース物理アドレスから、所与のパーティションに割り当てられた排他メモリ・ウインドウの開始までのオフセット(R OS)に加えてまた、メモリ・ホールのサイズを指定する値(R OS)も記憶される。次いで、(i)所与のパーティション中のプロセッサによるその物理アドレス空間のロー・メモリ範囲内の位置への各参照にオフセット(R OS)を加え(それにより、これらの参照を排他メモリ・ウインドウ内のこれらに対応する位置に再配置し)、(ii)オフセットからメモリ・ホールのサイズを表す値を引いたもの((R OS−R OS)を、所与のパーティション中のプロセッサによるその物理アドレス空間のハイ・メモリ範囲内の位置への各参照に加える(それにより、これらの参照を排他メモリ・ウインドウ内のこれらに対応する位置に再配置すると同時に、排他メモリ・ウインドウの、通常ならメモリ・ホールに対応することになる部分を再利用する(reclaiming))ことにより、再配置および再利用が達成される。
本発明のこの態様の別の特徴によれば、共用メモリ・ウインドウもまた考慮することができる。具体的には、前述のように、各パーティションごとの排他メモリ・ウインドウに加えて共用メモリ・ウインドウも規定することができる。このウインドウへのアクセス権を共用するために、各パーティションは、そのプロセッサの物理アドレス空間の一部を、メイン・メモリ内の共用メモリ・ウインドウに対応するものとして指定する。次いで本発明によれば、各パーティション上にあるプロセッサの物理アドレス空間の指定部分は、メイン・メモリ中の同じ共用メモリ・ウインドウにマッピングされる。好ましい一実施形態でこれは、各パーティション中で、(i)パーティション上にあるプロセッサの物理アドレス空間のベース・アドレスから、物理アドレス空間の、共用メモリ・ウインドウに対応するものとして指定された部分の開始までのオフセット(SBASE OS)を記憶し、(ii)メイン・メモリのベース・アドレスから、メイン・メモリ内の共用メモリ・ウインドウの開始までの別のオフセット(SBASE MSU)を記憶し、(iii)オフセット間の差(SBASE MSU−SBASE OS)を、そのパーティション中のプロセッサによる指定部分内の位置への各参照に加え、それにより、これらの参照を、メイン・メモリ中の共用メモリ・ウインドウ内のこれらに対応する位置に再配置することにより達成される。
本発明の方法は、コンピュータ・システムの様々な動作に反映される。
本発明のコンピュータ・システムおよび方法の他の特徴および利点、ならびに本発明の様々な実施形態の構造および動作を、添付の図面を参照しながら以下に詳細に述べる。
本発明は、図を参照することにより最もよく理解されるが、これらの図では、同じ参照番号は、同一要素または機能的に類似する要素を示す。また、左端の桁は、添付の図面の中で最初にその参照が出ている図を指す。
(好ましい実施形態の詳細な説明)
目次
I.概要
II.コンピュータ・システム・プラットフォーム
A.メモリ・ウインドウ(再配置および再利用)
B.メモリのインターリービングおよびスタッキング(変換)
C.ブート時における初期化
III.グローバル共用メモリを管理するための方法(パーティション間通信)
A.パーティション間通信のためのポーリング
B.割込み主導共用メモリ通信
1.共用メモリ・レイアウト
2.空きページ・リスト
3.クライアント・ディレクトリ・テーブル
4.共用メモリ・ページ・タイプ
5.制御構造ヘッダ
6.割り振り(アロケーション)構造
7.信号(signals)
8.入力待ち行列および入力待ち行列ヘッダ
9.プロセッサ間割込み機構
10.コア・サービスAPI
11.クライアントによって供給されるインターフェース
12.例としてのオペレーション
13.他の機能
IV.パーティション間の通信を円滑にする本発明のコンピュータ・システムおよび方法の例としての使用
A.共用メモリ・デバイス・ドライバ
B.ワイヤによる通信の外観を維持すること
V.結論
I.概要
本発明は、マルチプロセッサ・コンピュータ・システムを対象としており、このマルチプロセッサ・コンピュータ・システムは、1つまたは複数のプロセッサ・モジュールと1つまたは複数のメモリ記憶装置を備えるメイン・メモリを有して、コンピュータ・システムの異なるパーティション内で複数のオペレーティング・システムを並行に実行し、かつその異なるパーティションが共用メモリを通じて相互に通信することを可能にしている。そのメイン・メモリは、複数のメモリ記憶装置(memory storage units - MSUと呼ぶ)に分割される。メイン・メモリは、異なるパーティション間に割り当てられる。データの一貫性および整合性はそれらのパーティション間で維持される。
コンピュータ・システムの一発明態様によると、アドレス・マッピング関数fpaは、プロセッサ・モジュールの1つのプロセッサから生成されるアドレス要求と、メイン・メモリのウインドウ中のそれに対応するアドレスの(関係として)間に規定される。このアドレス・マッピング関数fpaは、概念上は、ウインドウイング(windowing)、再利用(reclamation)、変換(translation)という3つの別個の部分を持つと考えることができる。
メイン・メモリは連続的なアドレス空間を有する。本発明によると、各パーティション(およびそれに関連づけられたオペレーティング・システム)には、メイン・メモリのアドレス空間内で排他的なメモリ・ウインドウが割り当てられる。共用メモリ・ウインドウは、複数のパーティションが共用アクセス権を有することが可能なメイン・メモリ内に定義してもよい。ウインドウイング機能は、各パーティション内のプロセッサの物理アドレス空間を、それらのパーティションに割り当てられた各排他メモリ・ウインドウにマップする。この方式では、各パーティションの排他メモリ・ウインドウが、その各オペレーティング・システムにとって、メイン・メモリ中で同一のベース物理アドレス(例えばアドレス・ゼロ)を持つように見せている。市販のオペレーティング・システム(例えばUnix、Windows NTなど)は、通常、物理メモリがアドレス・ゼロで開始することを予期しているので、ウインドウイング機能は、コンピュータ・システム上の異なるパーティション内で市販のオペレーティング・システムを実行するために必要とされる。
再利用は、例えばPeripheral Component Interface(PCI)、Advanced Programmable Interrupt Controller(APIC)、およびメモリ・マップされた基本システム、および入出力装置(例えばフロッピー・コントローラ、シリアル・ポート、パラレル・ポートなど)によって占められる、メモリ・マップされたI/O(入出力)アドレス空間の背後に位置するメイン・メモリを再利用するが、再配置されない場合これはコンピュータ・システムにとって使用不可能になる。言い換えれば、各オペレーティング・システムによって入出力装置に割り当てられるメモリ・アドレスが再利用されると、オペレーティング・システムは、メイン・メモリ中に追加のメモリ空間を持つように見える。
変換は、メモリ参照を指定のメモリ記憶装置にマップする。システム・メモリ・アドレスは、コンピュータ・システムにどのようにメモリ記憶装置が実装(populate)されているかにより、メモリ記憶装置間でインターリーブするかまたはスタックすることができる。
例示的実施形態では、コンピュータ・システムは複数の処理モジュールを含む。処理モジュールは、PodでもサブPodでもよい。Podは2つのサブPodを備える。好ましい実施形態では、コンピュータ・システムの最大構成には、4つのPodすなわち8つのサブPodが含まれる。本発明によると、コンピュータ・システムは、PodおよびサブPodどちらの境界上でもパーティションに区分することができる。したがって、最大構成が8つのサブPodからなる好ましい実施形態では、コンピュータ・システムは最大で8つのパーティションに区分することができ、それぞれは別々のサブPodによって定義される。本発明によるとさらに、各パーティションは、それ自体のオペレーティング・システムの制御下で動作する。異なるパーティション上で実行されるオペレーティング・システムは、異なるオペレーティング・システムでも、同一オペレーティング・システムの異なるインスタンスでもよい。
本発明はさらに、コンピュータ・システム上のパーティション間でデータを共用するための、グローバル共用メモリ・アプローチを提供する。一実施形態では、グローバル共用メモリ・アプローチは、各パーティションのためにメイン・メモリ内に排他メモリ・ウインドウを提供し、さらに、複数のパーティションがアクセスできる共用メモリ・ウインドウを提供する。パーティションと、そのオペレーティング・システムおよび/またはそのパーティション内で実行される他のクライアントは、共用メモリ・ウインドウを通じて相互に通信することができる。
共用メモリを通じたパーティション間の通信は、種々のどの方法によっても管理することができる。一実施形態では、共用メモリを通じてのパーティション間通信は、割込み駆動技術(interrupt-driven technique)によって管理される。別の実施形態では、共用メモリによる通信を管理するのにポーリング技術が使用される。
本明細書で使用する用語「コンピュータ・システム」とは、電子的構成要素および機械的構成要素を含むハードウェアと、アプリケーション・プログラムおよびオペレーティング・システムを含むソフトウェアを指す。一般には、オペレーティング・システムには、命令と、コンピュータがそのタスクを実行するのに処理するデータが含まれる。ハードウェアは基本的な計算資源を供給する。ソフトウェアは、それらの資源をユーザーの計算問題を解くために使用する方式を定義する。
本明細書で使用する用語「オペレーティング・システム」とは、多様なユーザーに向けた多様なアプリケーション・プログラム間におけるハードウェアの使用を制御し、調整するプログラム・コードを指す。オペレーティング・システムは、コンピュータ・システムをオン(turn on)にしてから、コンピュータ・システムのメイン・メモリにロードされる最初のプログラム・コードである。オペレーティング・システムの中核(central core)は、常にメモリ空間内にある。本明細書で使用する用語「オペレーティング・システム・アドレス」は、コンピュータ・システムのプロセッサの物理アドレス空間(メモリおよび入出力)を意味し、そのコンピュータ・システム上で実行されるオペレーティング・システムから見ると、従来のコンピュータ・システムのアドレス空間になる。
本明細書で使用する用語「コンピュータ・アーキテクチャ」とは、ユーザーから見た、コンピュータの構造および動作を指す。これはプロセッサやメモリなどさまざまな機能モジュールの仕様に関連し、それらを合わせてコンピュータ・システムに構造化する。コンピュータ・アーキテクチャはハードウェアを利用して実施される。
本明細書で使用する用語「メモリ記憶装置」とは、情報を格納することのできるメモリ空間を指す。各メモリ記憶装置には、時にDRAM(ダイナミックRAM)と呼ばれる複数のメモリ記憶装置が含まれる。本明細書で使用する用語「メモリ記憶装置アドレス」とは、コンピュータ・システムから見たアドレス位置を指す。
本明細書で使用する用語「パーティション」とは、オペレーティング・システムの単一インスタンス(instance)の制御下にある、1つまたは複数の処理モジュールを指す。本明細書で使用する用語「パーティション」とは、パーティションの処理モジュール、パーティション上で実行されるオペレーティング・システム、パーティションに割り当てられた任意の排他メモリ・ウインドウ、パーティション上で実行される他のクライアントまたはアプリケーション・プログラム、あるいはこれらの任意の組み合わせのすべてあるいは一部を指す。
本明細書で使用する用語「処理モジュール」は、連係して動作する複数のプロセッサを意味する。下記の好ましい実施形態の説明で例示するように、PodおよびサブPodはどちらも処理モジュールの例である。1つまたは複数のPodまたはサブPod(すなわち1つまたは複数の処理モジュール)を、コンピュータ・システム内のパーティションとして定義してもよい。
本明細書で使用する用語「プログラム・コード」は、コンピュータ・システムやプロセッサなどの機械(machine)によって実行されると、コンピュータ・システムやプロセッサに何らかの操作(operation)を実行させる命令セットを意味する。ただし、コンピュータ・システム中のいくつかの動作または機能性は、動作や機能を実行する回路の形でハード・コード化するか、あるいは実行可能命令と回路の組み合わせによって実行してもよいことを認識すると、用語「プログラム・コード」には、上記のような回路や実行可能命令と回路の組み合わせも含まれることになる。
II.コンピュータ・システム・プラットフォーム
図1は、プロセッサ・モジュール110、112、114を含むマルチ・プロセッサ・システムを示している。プロセッサ・モジュール110、112、114は、同程度の互換性がある。ただし本発明では、異種(heterogeneous)のプロセッサおよび/またはオペレーティング・システムが共存することをさらに意図している。各プロセッサ・モジュール110、112、114は自己充足型(self-contained)である。プロセッサ・モジュール110、112、114は、それぞれ複数のプロセッサを含むことができる。プロセッサ・モジュール110、112、114のうち2つ以上は、通常はシステム相互接続130などシステム相互接続メカニズムを通じて、メイン(またはグローバル)メモリ160および/またはI/O装置120、122、124へのアクセスを共有している。プロセッサ・モジュール110、112、114は、メイン・メモリ160を通じて(共通データ・エリア中に残されるメッセージおよびステータス情報により)相互に通信することができる。
本発明によると、1つまたは複数のプロセッサ・モジュールをコンピュータ・システム内で別々のパーティションとして構成して、複数のパーティションをコンピュータ・システム内に存在させ、各パーティションが別々のオペレーティング・システムの制御下で動作するようにしてもよい。例えば、図1の各プロセッサ・モジュール110、112、114は、個々のオペレーティング・システム170、172、174を介して制御される個々のパーティションとして定義することができる。各オペレーティング・システム170、172、174は、それぞれがメイン・メモリ160にアクセスする唯一の存在であるかのように、メイン・メモリを別々に見ている。
マルチ・プロセッサ・システムとマルチ・コンピュータ・システムは、区別しなければならない。マルチ・コンピュータ・システムは、コンピュータが通信線を介して互いと相互接続され、コンピュータ・ネットワークを形成するシステムである。このコンピュータは自立走行式(autonomous)であり、相互に通信してもしなくてもよい。コンピュータ間の通信は、固定経路を介するか、あるいは何らかのメッセージ交換メカニズムを介して行われる。それに対して、従来型のマルチ・プロセッサ・システムは、プロセッサ間の相互作用を提供する1つのオペレーティング・システムによって制御され、問題の解法を求める際にはシステムのすべての構成要素が協働する。
図2に、本発明によるコンピュータ・システム200の好ましい実施形態の詳細図を示す。コンピュータ・システム200には、図にメイン・メモリ160として示すメイン・メモリと、各第3レベル・キャッシュ・モジュール230およびクロスバー相互接続290を介してメイン・メモリに接続された複数の処理モジュール240が含まれる。この実施形態では、処理モジュールおよびメイン・メモリは対称的な多重処理アーキテクチャで構成されており、したがってプロセッサからメモリへの待ち時間は、メイン・メモリのすべてにおいて、各処理モジュールにとって同一である。
当実施形態では、メイン・メモリ160はディレクトリ・ベースのメモリ・システムであり、例えばUNIX/NTシステムで用いられるメモリ整合性モデルなど、さまざまなメモリ整合性モデルをサポートすることができる。メイン・メモリ160には、メモリ記憶装置220A、220B、220C、220Dなど複数のメモリ記憶装置(MSU)220が含まれる。各メモリ記憶装置220A、220B、220C、220Dは、少なくとも8ギガバイトのメモリを含むことが好ましい。各メモリ記憶装置220A、220B、220C、220Dは、4本の2倍幅データバスおよび8本の単方向アドレスバスを共用する、16個の準独立型バンクを含むことが好ましい。
第3レベル・キャッシュ・モジュール230Aから230Dなど複数の第3レベル・キャッシュ・モジュール230には、TST270Aから270Hなど、複数の第3レベル・キャッシュ・アプリケーション固有の集積回路(すなわちTCT)が含まれる。当実施形態では、対をなすプロセッサ(例えば240Aと240B)は、所与のTLC(例えば230A)内に単一TCT(例えば270A)をもった共通バス(例えば280A)を共用している。各TCT270は、下記でより完全に述べるように、アドレスの再配置、再利用、およびそれが接続されるプロセッサによって発行されるメモリ・アドレスの変換を実行する。
第3レベル・キャッシュ・モジュール230Aから230Dは、それぞれ、各複数プロセッサ(MP)240Aから240Sに接続される。具体的には、当実施形態では、各TLC230は4つのプロセッサに接続される。各TLC230およびその個々の4つのプロセッサは、サブPodを定義する。当実施形態によるとさらに、2つのサブPodは、クロスバー相互接続(例えばクロスバー相互接続290Aまたは290B)を介して接続されてPodを形成する。したがって図2の実施形態では、それぞれクロスバー相互接続290Aおよび290Bを介して接続されたサブPodが4つあり、2つのPodを形成している。
クロスバー相互接続290は、第3レベル・キャッシュ230を通じて、プロセッサ240をメモリ記憶装置220にインターフェースしている。クロスバー相互接続290はクロスバー・メモリ・アプローチを用いており、それにより、複数のクロスポイントが、プロセッサ240とメモリ記憶装置220の間の共通部分に置かれる。クロスポイント内には、プロセッサ・バス280からメモリ記憶装置220への経路を決定するスイッチがある。各スイッチ・ポイントは、プロセッサ240とメイン・メモリ160の間に転送経路をセットアップする制御論理を有する。この制御論理は、プロセッサ・バス280上に置かれるアドレスを調べ、その特定メモリ記憶装置220のアドレスが指定されているかどうかを決定する。制御論理はまた、同一のメモリ記憶装置220への複数のアクセス要求を、あらかじめ定められた優先順位で解決する。各クロスバー相互接続290は、下記により詳細に述べるように、ペアになった第3レベル・キャッシュ・メモリ・インターフェース・アプリケーション固有集積回路(TCM)285をさらに備え、これは、アドレス再配置、再利用、I/O装置からのメモリ要求の変換を実行する。
コンピュータ・システム200にはさらに、入出力バス210Aから210Dと、ダイレクト入出力ブリッジ(DIB)250Aから250Dなどダイレクト入出力ブリッジを介して接続された、PCI260Aから260Dなど複数の周辺コンポーネント相互接続(PCI)とが含まれる。
動作に際しては、メモリ記憶装置220は、クロスバー相互接続290を通じて、第3レベル・キャッシュ・モジュール230と双方向で通信する。クロスバー相互接続290は、入出力バス210を介してダイレクト入出力ブリッジ250と双方向に通信し、またTCT270を通じてプロセッサ240と通信する。ダイレクト入出力ブリッジ250は、周辺構成要素相互接続260と双方向に通信する。
当実施形態では、プロセッサ(MP)240は、Intelプロセッサ(例えばPentium Pro、Pentium II Xeon、Merced)や、Unisys E−modeスタイル・プロセッサ(Unisys A Series および Clearpath HMP NXエンタプライズ・サーバで使用される)や、Unisys 2200スタイル・プロセッサ(Unisys 2200およびClearpath HMP IX エンタプライズ・サーバで使用される)を備えることが可能である。所与のサブPodは、同一タイプの4つのプロセッサを用いることが好ましい。ただし本発明では、異なるサブPodが、異なるタイプのプロセッサを用いてもよいことを意図している。例えば1つのサブPodが4つのIntelプロセッサを用い、一方で別のサブPodが4つのUnisys E−modeスタイル・プロセッサを用いることが可能である。このような構成では、Intelプロセッサを用いるサブPodを1つのパーティションとして定義し、UnixまたはWindows NTのバージョンなど、Intelとの互換性があるオペレーティング・システムの制御下で実行し、その一方でUnisys E−modeスタイル・プロセッサを用いるサブPodは別のパーティションとして定義し、UnisysMCPオペレーティング・システムの制御下で実行することが可能である。別の代替策として、異なる2つのパーティション中のサブPodはどちらもIntelプロセッサを用いることができるが、1つのパーティションはIntelと互換性のあるオペレーティング・システム(例えばWindows NT)の制御下で実行するのに対し、もう一方のパーティションは、そのパーティション内のIntelプロセッサ上のUnisys A Seriesコンピュータ・アーキテクチャのエミュレーションを通じて、Unisys MCPオペレーティング・システムの制御下で実行することが可能である。
図2のコンピュータ・システム200の好ましい実施形態のアーキテクチャの追加詳細は、これに先立つ同時係属の、本出願の譲受人に譲渡された出願中の「他出願への相互参照」と題するセクション中に記載して提供され、各項はすべて参照として本明細書に組み込まれる。
上記のように本発明によると、コンピュータ・システム200は、PodおよびサブPodの境界で区分することができる。図28に示すように、コンピュータ・システム200の部分2801は、PodとサブPodの境界を含んでいる。Pod2802には、クロスバー相互接続290A、第1サブPod2804A、第2サブPod2804Bが含まれる。サブPod2804Aおよび2804Bは、実質的に互いと同種である。例えばサブPod2804Aには、TCT270Aおよび270Bを含む第3レベル・キャッシュ230Aが含まれる。サブPod2804には、さらに、プロセッサ240A〜240Dが含まれる。したがってPod2802には、2つのTLC230、4つのTCT270、8つのプロセッサ240、およびクロスバー相互接続290が含まれることになる。
当実施形態では、上記のように、コンピュータ・システム200の最大構成には4つのPod2802が含まれ、Pod2802にはそれぞれ2つのサブPod2804が含まれる。したがって最大構成において、コンピュータ・システム200には、(4Pod)x(Podごとに8つずつのプロセッサ)=32のプロセッサが含まれる。コンピュータ・システム200は、PodまたはサブPodのどのような境界の組み合わせでも区分することができる。ただし本発明では、他の多重処理環境および構成を意図していることを理解されたい。例えばコンピュータ・システム200は、さらに多くのメモリ記憶装置220およびさらに多くのPodまたはサブPodと接続する(plug in)ことにより、拡張することができる。
ある実施形態では、Pod2802は、ダイレクト入出力ブリッジ250Aおよび250Bを含むように定義される。ある実施形態では、サブPod2804および2806は、ダイレクト入出力ブリッジ250Aおよび250Bをそれぞれ含むように定義される。
さらに本発明によると、コンピュータ・システム内の複数パーティションは、それぞれが1つまたは複数のPodまたはサブPodを備えることができ、それぞれが別のオペレーティング・システムの制御下で動作する。異なるパーティション上で実行されるオペレーティング・システムは、同一でも異なっていてもよい。例えば本発明では、オペレーティング・システムの少なくとも2つが異なっていて、1つのオペレーティング・システムが、2番目のオペレーティング・システムを制御または管理しない環境を意図している。
図5は、本発明の区分可能なフィーチャによる、図2のコンピュータ・システムで生成することのできる例示的メモリ構成を示している。この例では、3つのオペレーティング・システム(OS)はそれぞれ、それ自体のアドレス空間502(すなわち、それらのオペレーティング・システムが実行される各処理モジュールの物理アドレス空間)を持っている。メイン・メモリ160はアドレス空間504を有する。本発明によると、各オペレーティング・システム(すなわちパーティション)ごとに1つの3つの排他メモリ・ウインドウ540A、540B、540Cと、3つのオペレーティング・システム540A、540B、540C(すなわちパーティション)のすべてからアクセス可能な1つの共用メモリ・ウインドウ537が、メイン・メモリ160のアドレス空間504内に定義される。
例えばOS#1には、ロー・メモリ・ウインドウ511などロー・メモリ・ウインドウ、ロー・メモリ・ホール512などロー・メモリ・ホール、ハイ・メモリ・ウインドウ513などハイ・メモリ・ウインドウ、共用メモリ・ウインドウ514など共用メモリ・ウインドウとして定義された部分、ハイ・メモリ・ホール515などハイ・メモリ・ホールが、そのアドレス空間内に含まれる。ロー・メモリ・ウインドウ511、ロー・メモリ・ホール512、ハイ・メモリ・ウインドウ513、ハイ・メモリ・ホール515は、オペレーティング・システムOS#1にとって排他的である。共用メモリ・ウインドウ514として定義されるアドレス空間部分は、共用されるよう意図されている。
本明細書で使用する「ハイ・メモリ・ホール」とは、関連付けられたアドレスが入出力装置に割り当てられているために、データや命令の記憶には使用できない、メモリ記憶装置のハイ・アドレス範囲中のメモリ空間を指す。本明細書で使用する「ロー・メモリ・ホール」とは、関連付けられたアドレスが入出力装置に割り当てられているために、データや命令の記憶には使用できない、メモリ記憶装置の低アドレス範囲中のメモリ空間を指す。本明細書で使用する「ウインドウ」とは、上限および下限のあるアドレス範囲である。ウインドウの可視性、すなわち、ウインドウへのアクセスは、所有権(ownership rights)によって管理される。本明細書で使用する「共用ウインドウ」とは、少なくとも2つのオペレーティング・システムが合同で所有するアドレス範囲を指す。すなわち、複数のオペレーティング・システムが、共用ウインドウへの可視性およびアクセス権を有する。本明細書で使用する用語「排他ウインドウ」とは、1つのオペレーティング・システムだけが所有するアドレス範囲を指す。すなわち、1つのオペレーティング・システムだけが、排他ウインドウを見ることができ、それにアクセスすることができる。それでも、データの一貫性および整合性はオペレーティング・システム間で維持される。
OS#2およびOS#3のアドレス空間は、オペレーティング・システムOS#1と同様の構造を有する。説明を簡潔にするために、これらのアドレス空間については詳細には説明しない。
多数のプロセッサのアドレス空間は、メイン・メモリおよびメモリ・マップされた入出力(I/O)アドレスの両方からなる。メイン・メモリのトランザクションは、主記憶装置に向けられる。I/Oトランザクションは、I/Oサブシステムに転送される。I/Oアドレスは主記憶装置の外側の追加メモリにアクセスするので、このシステムには、2つのメモリ位置を参照するプロセッサ・アドレスがあるということになる。整合性のためには、これらのメモリ位置のうち1つを使用不可能にしなければならない。これらの主記憶位置を使用不可能にすることにより、メイン・メモリのアドレス指定においてホールが形成され、その結果、メモリ内に不使用部分が残される。I/Oメモリ・アドレス空間が大きい場合、相当のメモリブロックが使用できないままになる。複数のOSパーティションがシステムに追加されると、複数のI/Oホールが生成され、その結果おそらくは多数のホールがメイン・メモリのアドレス空間中に散在することになる。本発明によると、図5に示すように、ロー・メモリ・ホール511、541、571などロー・メモリ・ホールと、ハイ・メモリ・ホール515、545、575などハイ・メモリ・ホールは、図にMSUメモリ空間504として描写したような連続したアドレス空間に再利用されリマップされる。MSUメモリ空間504は、メイン・メモリ160の概念視点である。再利用(reclamation)については下記で詳細に説明する。
例えば、MSUアドレス空間504の連続アドレス空間には、ロー・メモリ531、533、535などロー・メモリと、ハイ・メモリ532、534、536などハイ・メモリと、共用メモリ537など共用メモリが含まれる。ロー・メモリ531およびハイ・メモリ532は、オペレーティング・システムOS#1にとって排他的な排他ウインドウを備える。ロー・メモリ533およびハイ・メモリ534は、OS#2にとって排他的な排他ウインドウを備える。ロー・メモリ535およびハイ・メモリ536は、オペレーティング・システムOS#3にとって排他的な排他ウインドウを備える。メイン・メモリ160中にはメモリ・アドレス・ホールがない。メイン・メモリ160の連続アドレス空間は、メモリ拡張、参照変換のタイプ(下記で詳細に説明する)、あるいは共用メモリ環境とは無関係に維持される。
A.メモリ・ウインドウ(再配置および再利用)
ウインドウは、(アドレスの)上限および下限を境界としたアドレス範囲である。この空間へのアクセスおよびこの空間の可視性は、所有権(ownership rights)によって制限される。本発明では、排他と共用の2タイプのウインドウを提供する。
排他ウインドウは、単一のパーティション/オペレーティング・システムによって所有される。オペレーティング・システムのすべてのインスタンスは、それ自体のウインドウの制限内で動作しなければならない。このウインドウのアドレス空間は可視ではなく、他のパーティション/オペレーティング・システムにアクセスすることもできない。好ましい実施形態では、すべてのウインドウは、a mod 32MBで表されるアドレス境界で始まる。ただし本発明では他の境界も意図される。オペレーティング・システム、特にUnixおよびWindows NTのような市販のオペレーティング・システムから見ると、そのアドレス空間(すなわちそれが実行されるプロセッサの物理アドレス空間)は常に、図5の左部分に示すようにアドレス・ゼロで始まる(すなわちその下限はゼロである)。メイン・メモリ160から見ると、アドレス範囲は、再配置(R)値で始まる。R値については下記で詳細に説明する。好ましい実施形態では、排他ウインドウの上限は、共用ウインドウのベース・アドレスSBASE OSに対比して設定される。
共用ウインドウは上限および下限によって境界が定められるアドレス範囲であり、この空間は、複数のオペレーティング・システム(すなわちパーティション)にとって、それ自体の排他ウインドウでそれぞれが実行されているときに、可視でありアクセスすることができる。共用ウインドウは、例えばそのオペレーティング・システムを含む異なる部分が通信し、データを共用できる共通エリアである。好ましい実施形態ではこのエリアも、a mod 32MBのアドレス境界で開始する。共用ウインドウのサイズは、Nx32MBにすることができる。共用ウインドウと関連付けられた構成パラメータは2つある。1つのパラメータには、オペレーティング・システムのアドレス空間内で共用ウインドウとして定義される部分のベース・アドレス、SBASE OSが含まれる(すなわち、それぞれOS#1、OS#2、OS#3のための部分514、544、574のベース・アドレス)。もう一方のパラメータは、メイン・メモリ160のアドレス空間504内の、それに対応する共用エリアのベース・アドレスSBASE MSUを保持する。好ましい実施形態では、各オペレーティング・システムの共用エリアの上限は、そのオペレーティング・システムの「メモリのトップ」値である。下限SBASE OSは、a mod 32MBアドレス境界上になければならない。排他エリアが使用可能にされる場合、MSUメモリ空間504内の共用メモリ537の位置は、このエリアを共用しているすべてのオペレーティング・システムの各排他ウインドウの上になければならない。この最後の要件は、ハードウェア設計のトレードオフとして実施される。共用エリアは上限TOSを境界とするが、この上限は、オペレーティング・システムのアドレス指定の観点から見るとオペレーティング・システムのメモリ参照のトップになる。TOSより上のアドレスはトラップされ、メイン・メモリ160に渡されることはない。したがって、共用メモリ537は完全に境界を定められる。
本明細書で企図される他の構成では、各オペレーティング・システムは、完全に共用された空間内で他のオペレーティング・システムと共存することができる。MSUブロック全体を共用するように設定する場合がその例である。この場合、他のオペレーティング・システムのアドレス空間を見ることができるように、各オペレーティング・システムを構成することができる。この方式で構成されると、メモリの個々のページへのアクセス権を維持する重荷が、協働するオペレーティング・システムに課される。ハードウェアはもはや、アクセス権および可視性を個々のオペレーティング・システムに対して制限しない。プロセスがメモリを破壊するのを防ぐために、オペレーティング・システムは、プロセッサ・ページ制御または何らかの他の手段により、メモリ・ページ・アクセス権を制御しなければならない。この操作法は、連携オペレーティング・システムによって使用される。オペレーティング・システムは、別のオペレーティング・システムのメモリ・ページから直接読み出しをすることができる。また1つのオペレーティング・システム・インスタンスは、別のオペレーティング・システムを宛先とするデータを、一時的バッファリングをいずれも回避して、他のオペレーティング・システムのデータ・エリアに直接ロードすることができる。図10は、このタイプの構成例を示している。図10を参照すると、各オペレーティング・システムの構成は、それ自体のオペレーティング・システム・インスタンスのコピーを含む、MSUメモリ全体のビューをその共用エリアが提供するような方式で行われている。以降、このエイリアス・アドレスをシャドー・アドレスと呼ぶ。各オペレーティング・システムのビュー内の共用エリアの下にあるアドレス範囲は、ローカルアドレスと呼ぶ。
当実施形態で、本発明は、排他ウインドウを関連付ける共用ウインドウを最大で1つまでに制限する。ただし、他の実施形態では、排他ウインドウを複数の共用ウインドウと関連付けることもできる。この場合、そのような共用ウインドウそれぞれのために、SBASE MSUおよびSBASE OSの値が別個にあることになる。
本発明によると、各パーティションの処理モジュールの物理アドレス(すなわち、そのパーティション上のオペレーティング・システムから見たアドレス空間)は、メイン・メモリ160のアドレス空間504内のそのパーティションに割り当てられた、それに対応する排他メモリ・ウインドウにマップあるいは再配置される。メイン・メモリ160のアドレス空間は、説明のために、単一のメモリブロックと見なすべきである。ただし本発明ではさらに、メモリ記憶装置220間でアドレス・インタリービングを生成するために、アドレスを個々のメモリ記憶装置220に追加的にマップする変換機能(下記で説明する)を企図している。
別の例として、図4に、それぞれがメイン・メモリ160内で2GBのメモリ空間を占める、2つのオペレーティング・システムOS0およびOS1を含む単純なシステムを示す。各オペレーティング・システムのアドレス空間は、それ自体のメモリ・マップされたI/O(入出力)空間415および435を有する。この例では、メモリ・マップI/O(入出力)と関連付けられたホールは、DRAMメモリ・エリアをオーバーレイしない。
ここで、用語「再配置(Relocation - R)」および「再利用(Reclamation)R」についてさらに説明することができる。再配置とは、ベース・アドレスを排他メモリ・ウインドウに割り当てることである。このベース・アドレスは、メイン・メモリ160のアドレス空間内におけるこのウインドウの開始アドレス(すなわちアドレス・ゼロからのオフセット)であり、a mod 32MBアドレス境界上になければならない。図4を参照すると、オペレーティング・システム・ウインドウ430(OS0)のためのR値は、このウインドウがメイン・メモリ160のボトムで始まるのでゼロになる。オペレーティング・システム・ウインドウ410(OS1)は、2GBで始まるメイン・メモリ160のアドレス空間にその物理アドレス・ゼロ位置が再配置されているので、2GBのR値を有する。
再利用とは、メモリ・マップI/Oアドレス空間の背後にあたるメモリ位置を再利用するために、ウインドウ内のアドレス空間をリマップすることである。再利用がアクティブではなく、メモリ・トップの下にあたる部分にI/O範囲が割り当てられたメモリ・マップI/Oをウインドウが有する場合、ウインドウ・メモリ・アドレス空間内にホールが生成される。図4の例では、メモリ・マップI/Oに関連付けられたホールがDRAMメモリ・エリアをオーバーレイしていないので、再利用は必要ではない。ただし図5を参照すると、ロー・メモリ・ホール512、542、572(すなわち、32ビットメモリ・マップI/O装置がマップされている)に対しては再利用を実行することができる。再利用は、ホール・サイズと等しいホール上部の使用可能メモリ・アドレス空間を増大するものと見ることができる。好ましい実施形態では、再利用は、ホール・サイズが128MBまたはそれ以上である場合にのみ実行される。これはハードウェア・トレードオフである。また設計トレードオフの理由から、オペレーティング・システム・インスタンスにつき1つのアドレス・ホールだけが再利用される。ただし本発明では、上記の2つの設計トレードオフを実行せずにコンピュータ・システムを実施できることを企図している。再利用については下記で詳細に説明する。
再び図5を参照すると、3つのオペレーティング・システム・アドレス空間OS#1、OS#2、OS#3はすべて、メモリ・アドレス空間をオーバーレイするメモリ・マップI/Oを含んでいる。ただし、オペレーティング・システム・アドレス空間OS#1のロー・メモリ・ホール512が最低128MBのブロック・サイズよりも小さいので、再利用は実行されない。ただしロー・メモリ・ホールは、その他の2つのオペレーティング・システムのためにそれらの排他ウインドウ540Aおよび540B内でそれぞれ再利用される。
図3は、4つのオペレーティング・システム・ウインドウ(すなわちインスタンス)を含んだ、別の可能な構成を示している。この場合OS#1およびOS#4は共通エリアを共用し、一方でOS#2およびOS#3は別の共通エリアを共用する。メイン・メモリ160のアドレス空間への個々のウインドウの配置が、R変数によって制御されることに留意されたい。図3は、これらのウインドウをMSUメモリ空間350へマップする多くの可能な方式のうち1つだけを示している。
当実施形態によると、各オペレーティング・システム・ウインドウは、それに、構成パラメータセットR OS、R OS、SBASE OS、SBASE MSUを供給する構成レジスタを関連付けている。単純にオペレーティング・システム・ウインドウの構成パラメータを変更することにより、異なるウインドウ・マッピングが容易に生成される。
表Aは、図5に示した各オペレーティング・システム・ウインドウのための構成レジスタ値を示している。メモリ・ホールの再利用は、構成レジスタの内容によって決まる。表Aには、当該の各オペレーティング・システムについての行が含まれる。再配置フィールドR OSは、メモリ記憶装置220中で再配置された、当該のオペレーティング・システム・ウインドウのベース(すなわち開始)アドレスを格納する。再利用フィールドR OSは、当該のオペレーティング・システム・ウインドウ中のロー・メモリ・ホールのサイズに対応するアドレス範囲を格納する。共用ベースOSフィールドSBASE OSは、共用部分として指定されたオペレーティング・システム・アドレス空間部分のベース・アドレスを格納する。共用ベースMSUフィールドSBASE MSUは、メモリ記憶装置メモリ220のアドレス空間内の共用ウインドウ537のベース・アドレスを格納する。
Figure 2006216068
当実施形態では、本明細書に述べるように、プロセッサ240の各ペアのためのTCT270は、そのTCTにインターフェースされたプロセッサによって発行されるアドレスに対して再配置、再利用、変換を実行するための、構成レジスタ、他のレジスタ、および論理を含む。TCM285は、各DIB250を介してI/Oプロセッサ(例えばPCIカード)から受信したメモリ要求に対して、同一の再配置、再利用、変換を実行しなければならないので、これらのレジスタおよび論理はクロスバー相互接続290のTCM285内でも複写される。
各パーティションのプロセッサの物理アドレス空間内で、そのパーティションのTCT270は、ロー・メモリ、ハイ・メモリ、ロー・メモリ・ホール、ハイ・メモリ・ホール、および共用メモリのためにアドレス範囲を決定する。例えば、オペレーティング・システムOS#3のアドレス空間内で、ロー・メモリ・ウインドウ571はアドレス位置0.000で開始し、3.875ギガバイトのメモリ空間を含む。ハイ・メモリ・ウインドウ573は、アドレス位置1.5000.000で開始し、5.250ギガバイトのメモリ空間を含む。ロー・メモリ・ホール572は、再利用されるべき125メガバイトの不使用メモリ空間を含む。ハイ・メモリ・ホール575は、再利用されるべき250メガバイトの不使用メモリを含む。
そのウインドウイング機能を実行する際、本発明の各TCT270はさらに、メイン・メモリ160のアドレス空間504内の排他メモリ・ウインドウをそのパーティションに割り当てる。各排他メモリ・ウインドウ内には、ロー・メモリおよびハイ・メモリのためのアドレス範囲がある。例えば排他ウインドウ540Bでは、ロー・メモリ・ウインドウ533はアドレス位置1.4000.0000で開始し、5.000ギガバイトのメモリ空間を含む。ハイ・メモリ・ウインドウ534はアドレス位置2.8000.000で開始し、排他ウインドウ540B内のトータルで10.500ギガバイトのメモリ空間に対し10.000ギガバイトを含む。排他ウインドウ540Aでは、ロー・メモリ・ウインドウ535はアドレス位置2.A000.0000で開始し、5.125ギガバイトのメモリ空間を含む。ハイ・メモリ・ウインドウ534はアドレス位置3.E800.000で開始し、1.625ギガバイトのメモリ空間を含む。
所与のパーティションの処理モジュールのプロセッサの1つがそのアドレス・ライン上にアドレス(「参照アドレス」あるいは「プロセッサ・アドレス」)を発行すると、そのプロセッサのためのTCT270は、必要に応じて任意の再配置、再利用、または共用ウインドウイングのためにそのアドレスを調整して、メイン・メモリ160内のそれに対応する位置のアドレスを生成する。構成レジスタのさまざまなフィールドの値(表A)はこのプロセス中に使用される。具体的には、参照されるアドレスが、共用ウインドウとして指定されたオペレーティング・システム・アドレス空間の部分内にある場合、その参照アドレスは、構成レジスタの共用ベースOSフィールドおよび共用ベースMSUフィールド内に含まれる値によってオフセット(offset)される。参照アドレスがオペレーティング・システムのアドレス空間のハイ・メモリ・ウインドウ内にある場合、その参照アドレスは、構成レジスタの再配置フィールドおよび再利用フィールドに含まれる値でオフセット(offset)される。参照アドレスがオペレーティング・システムのアドレス空間のロー・メモリ・ウインドウ内にある場合、その参照アドレスは、構成レジスタの再配置フィールドに含まれる値でオフセット(offset)される。したがって本明細書で述べるように、TCT270は、各パーティション内のプロセッサの物理アドレス空間を各パーティションに割り当てられた各排他メモリ・ウインドウにマップする手段を提供し、より具体的には、各パーティション上のプロセッサの物理アドレス空間内の位置への参照を、そのパーティションに割り当てられた排他メモリ・ウインドウ内のそれに対応する位置に再配置する手段を提供する。上記のように、同様の方式で、TCM285は、DIBおよびTCMを介して通信するI/Oプロセッサ(例えばPCIカード)から受信するしたメモリ・アドレスに必要とされる任意の再配置または再利用をメイン・メモリに対して実行する。
表Bには、オペレーティング・システム・アドレス空間(すなわち異なるパーティションのプロセッサの物理アドレス空間)を、メイン・メモリ中のそれに対応する排他メモリ・ウインドウに再配置および再利用することを実施するための擬似コードを示す。一般に、メモリ・マップI/OアドレスはTCT270によって除外(filter out)され、メイン・メモリ160への参照だけが残される。残りのアドレスは次いで、下記で詳細に述べるように表Bに示すアルゴリズムを通じて渡される。最終的に、再配置されたメモリ参照はメイン・メモリ160に渡される。
Figure 2006216068
図8は、アドレス・ウインドウイング・アルゴリズムの流れ図を示している。説明では表Aも参照する。ステップ810に示すように、参照アドレス(すなわち、所与のオペレーティング・システムを実行している所与のパーティション内の処理モジュールのプロセッサの1つによって発行されるアドレス)OSADRが、共用メモリ・ウインドウとして指定されたオペレーティング・システムのアドレス空間の部分内にあるかどうかを決定するためにチェックが行われる。部分内にあれば、参照されるアドレスはステップ815に示すように、式:OSADR+[SBASE MSU−SBASE OS]に基づくアドレスに再配置される。このアドレスは再配置アドレス(relocated address)と呼ばれ、メイン・メモリ160にアクセスするために使用される。再配置アドレスは、メイン・メモリ160内に定義される共用メモリ・ウインドウ内の対応する位置のアドレスである。
部分内にない場合は、参照アドレスが、オペレーティング・システム・アドレス空間のハイ・メモリ部分(例えばハイ・メモリ513、543、573)内にあるかどうかを決定するためにチェックが実行される。これはステップ820に示している。ハイ・メモリ部分内にある場合、ステップ825に示すように、参照アドレスが、式:OSADR+[R OS−R OS]に基づくアドレスに再配置される。再配置アドレスは、そのパーティションのための排他メモリ・ウインドウ内のそれに対応する位置を識別する。
上記の部分内にない場合、アルゴリズムはステップ830に示すように、参照アドレスがオペレーティング・システム・アドレス空間のロー・メモリ部分(例えばロー・メモリ511、541、571)内にあたるものと推定する。この場合、参照アドレスは、式:OSADR+[R OS]に基づくアドレスに再配置される。したがって、パーティション内のプロセッサの物理アドレス空間(すなわちオペレーティング・システムによって見られるアドレス空間)内でのアドレス参照は、メイン・メモリ中でそのパーティションのために定義された排他メモリ・ウインドウ内のそれに対応する位置か、またはメイン・メモリ中で定義された共用メモリ・ウインドウ内のそれに対応する位置に再配置される。
図33は、好ましい実施形態による、上記の再配置および再利用機能を実行するための、レジスタおよび論理の形の装置を表すブロック図である。この論理は各TCT270内に提供され、TCT270にインターフェースされたプロセッサ(MP)240によって発行されるメモリ・アドレスに対して、本発明の再配置機能および再利用機能を実行する。上記のように、各DIB250を介してI/Oプロセッサによって発行されたメモリ・アドレスの再配置および再利用を実行する目的で、この論理は各TCM285中でも複写される。
図33の好ましい実施形態によると、所与のプロセッサ240のアドレス・ライン上で発行された(または各DIB250を介してI/Oプロセッサによって発行された)メモリ・アドレスは、Processor_Addressレジスタ3310内でキャプチャされる。好ましい実施形態では、メイン・メモリは8バイトビットのワードでアドレス指定可能であり(1ワード=8バイト=64ビット)、したがってプロセッサ・アドレスの最下位3ビットは、調整済みアドレスの生成には必要ではない。したがって図に示すように、ビット[35:3]だけがProcessor_Addressレジスタ3310でキャプチャされる。好ましい実施形態ではさらに、メイン・メモリは8ワード(8ワード=64バイト)のブロックでキャッシュされるので、ビット[35:6]は有効キャッシュ・ブロック・アドレスを表す。図に示すように、これらのビットは後続のCache_Block_Addressレジスタ3312でキャプチャされる。
上記でさらに述べたように、好ましい実施形態では、すべてのメモリ・ウインドウは「排他」も「共用」もa mod 32MBアドレス境界で開始しなければならない。その結果、プロセッサ・アドレスを特定の排他メモリ・ウインドウまたは共用メモリ・ウインドウに再配置する際に、計算に必要なのは、プロセッサ・アドレスのビット[35:25]だけになる。したがって、図に示すようにこれらのビットはテンポラリ・レジスタ3314にキャプチャされる。
値SBASE MSU、SBASE OS、R OS、R OSは、各レジスタ位置3318、3320、3330、3340に記憶される。これらのレジスタ位置は集合的に、上記の構成レジスタを構成する。実際には、これらのレジスタ位置は、単一のより大きなレジスタの別々のフィールドを構成することができ、あるいは4つの別々のレジスタとして実施することができる。プロセッサ・アドレスが、共用メモリ・ウインドウとして指定されたプロセッサのアドレス空間の部分内にあたる場合は、減算器3405が、レジスタ位置3318内のSBASE MSU値からレジスタ位置3320内のSBASE OS値を減算し、その結果得られるオフセット値をレジスタ3350に格納する。プロセッサ・アドレスが、そのプロセッサが属するパーティションに割り当てられた排他メモリ・ウインドウのハイ・メモリ部分内にあたる場合は、減算器3410が、レジスタ3330内のR OS値からレジスタ3340内のR OS値を減算し、その結果得られるオフセット値をレジスタ3370に格納する。さらに示すように、R OS値の5ビットは(追加機能3400を使用して)、最下位ビット位置中の2論理ゼロビット、および最上位ビット位置中の4論理ゼロビットで埋められ、R OS値のビットからの減算のためにビットを適切に位置合わせする。本発明では、再利用は128MBの単位でしか実行できないと上記で述べたことを思い出されたい。プロセッサの排他メモリ・ウインドウのロー・メモリ部分内にあたるプロセッサ・アドレスの場合、レジスタ3330内のR OS値は必要とされるオフセットであり、したがって、この値はレジスタ3360に直接記憶される。
アドレス範囲比較論理3390は、プロセッサによって発行されたアドレスが共用メモリ・ウインドウに指定されたプロセッサのアドレス空間の部分内にあたるかどうか、またはそのアドレスが、プロセッサが属する部分に割り当てられた排他メモリ・ウインドウのロー・メモリ内またはハイ・メモリ内にあたるかどうかを判定する上記のステップを実行する。この比較に基づき、レジスタ3350、3360、3370のうち1つからの適切なオフセットが、3:1セレクタ3380によって選択される。次いで加算器3420は、選択されたオフセット値を、レジスタ3314に記憶されているプロセッサ・アドレスのビット[35:25]に加算し、その結果がレジスタ3430に記憶される。次いでレジスタ3430中のビットは、キャッシュ・ブロック・アドレスのビット[24:6]の最初に付加されて、調整済みのアドレスを形成し、このアドレスはAdjusted_Partition_Addressレジスタ3316に記憶される。レジスタ3316中の調整済みアドレスは、次いで、メイン・メモリにアクセスするために使用される(下記で説明する本発明のインターリービング機構による変換の後に)。
再び図5を参照すると、すでに上記で述べたように、メモリ・マップI/Oに割り当てられたアドレスは再利用することができる。このアドレスは、ロー・メモリ・ホール512などロー・メモリ・ホールと呼ばれる。好ましい実施形態では、ロー・メモリ・ホールは常に4GBのすぐ下で開始し、・ホール・サイズに等しい、関連するオペレーティング・システムのアドレス空間内で下方に拡張する。明らかなように、ロー・メモリ・ホールの配置は設計変更(design choice)である。メモリの再利用を使用すべきなのは、インストールされたメモリ量に対して、メモリ・アドレスのトップがメモリオーバーラップ領域のボトム(すなわち4GB−(マイナス)オーバーラップ・ホール・サイズ)よりも大きい場合だけである。言い換えれば、再利用は、PCI APIC範囲とインストールされたDRAMメモリ間にオーバーラップがないシステムでは使用すべきではない。
オーバーレイされたすべてのメモリ、およびそのすぐ上のメモリはいずれも、プロセッサ/オペレーティング・システム・アドレス空間内で上にスライドしていると考えることができる。したがって、ホールのボトムの後ろにありそこで開始するメモリは、アドレス4GBで開始しこのポイントから上に拡張することになる。メモリ・アドレス指定はなお4GB開始アドレスから連続しており、新しいメモリ・トップ、すなわち元のメモリ・トップとホール・サイズの合計まで拡張する。
図11は、アドレス範囲のマップの仕組みを具体的な例を用いて示している。4GBあるいはそれ以下のメモリを備え、PCI APIC範囲と部分的にメモリ・オーバーレイがあるシステムの場合には、再利用を使用することができる。このシステムでは、オーバーラップされたメモリは4GBで開始するようにマップされる。図12はこの点を表している。サブPodはプロセッサの調整済みメモリ要求アドレスを受け取り、それが4GB境界よりも上にあることを判定すると、そのアドレスから固定値を減算する。このメモリ・アドレスは、PCI APIC範囲のシステム・アドレス空間への挿入を反映する。したがって、調整オフセットはPCI APIC範囲のホール・サイズと等しく、上記のように128MBのブロックごとに固定される。
以下に提供するのは、さらにいくつかの本発明による再配置および再利用の例である。図5および表Aを参照する。最初の例は、排他ウインドウ内のアドレス参照を扱うものである。2番目の例は共用ウインドウを参照する。
図5に示すように、オペレーティング・システム・アドレス空間OS#3は、メインメモリアドレス10.5GBに再配置(R)されている。再利用は、ロー・メモリ・ホール572の後ろの128MB(0.125GB)を回復するように設定される。OSADR=1.5000.0000をメモリ参照として使用することにより、TCT270は関数OSADR+[R−R]を実行して、MSUメモリ空間504内にアドレスを生成する。RおよびRの値は表Aに挙げる。したがって、OSADR+[R−R]は、1.5000.0000+[2.A000.0000−0.0800.0000]になる。これは1.5000.0000+2.9800.0000になり、これは3.E800.0000(15.625GB)になる。このアドレスは、オペレーティング・システムOS#3と関連付けられた排他ウインドウ540A内の位置に相当する。単純な計算により、このアドレスは、4GBのハイメモリエリアベース・アドレスからのオフセット1.25GBであることが分かる。上記で計算されたアドレスは、OS#3の再配置ハイ・メモリ・ベース・アドレス(14.375GB)からのオフセット1.25GBでもある。
OS#2が実行されているパーティション内のプロセッサが同一のアドレス1.5000.0000を発行する場合、代って再配置アドレスが、そのパーティション(すなわちウインドウ540B)に割り当てられた排他メモリ・ウインドウ内にあたることになる。したがってOSADR+[R−R]は、1.5000.0000+[1.4000.0000−0.1000.0000]になる。これは1.5000.0000+1.3000.0000になり、これは2.8000.0000(10.00GB)になる。このアドレスは明らかにメイン・メモリ160のハイ・メモリ・エリア534内にあたり、これはOS#2を実行するパーティションに割り当てられた排他メモリ・ウインドウ(540B)の部分である。この例では、異なる2つのパーティション内のオペレーティング・システムにはそれぞれ、そのアドレス空間があたかも同一のベース・アドレス(すなわちアドレス・ゼロ)で開始するように見えるが、それらのアドレス空間内でのアドレス参照は、メイン・メモリ内の各パーティションに割り当てられた排他メモリ・ウインドウ内のそれに対応する位置に適切に再配置されることを実証している。言うまでもなく、本発明の再配置フィーチャは、異なるパーティション上でオーバーラップする物理アドレス空間をどれでも2つ(両方がアドレス・ゼロで始まるものに限らず)、メイン・メモリ内の各排他メモリ・ウインドウにマップするのに使用することができる。
第2の例では、OS#3と関連付けられた共用ウインドウ575へのメモリ参照を使用する。この例では、OS#3が、アドレス1.B900.0000(6.890GB)への参照を試みると想定する。TCT270は、このアドレスが共用メモリの範囲内にあると決定する。したがって、本発明はマッピングする関数OSADR+[SBASE MSU−SBASE OS]を適用して、MSUメモリ空間504にアクセスするのに適したアドレスを生成する。したがってマップ関数は、1.B9000.0000+[4.5000.0000−1.B8000.0000]になる。これは、1.B9000.0000+2.98000.0000になり、これは4.5100.0000(17.2656GB)になる。このアドレスは、MSUメモリ空間504の共用メモリ・ウインドウ537の範囲内にあたる。
同一のアドレスオフセット0.0156GBを使用し、それをオペレーティング・システムOS#2の共用ベース・アドレスに適用することにより、これに相当するアドレスをOS#2について計算することができる。OSADRは5.750GB+0.0156GBに等しく、これは5.7656GB(1.7100.0000)に等しい。このマップ関数OSADR+[SBASE MSU−SBASE OS]を適用すると、1.7100.0000+[4.5000.0000−1.7000.0000]が得られる。したがって、このマップ関数は、4.5100.0000(17.2656GB)のメモリ・アドレスを生成する。したがって、1.B900.0000(6.8906GB)のオペレーティング・システムOS#3によるメモリ参照と、1.7100.0000(5.7656GB)のオペレーティング・システムOS#2によるメモリ参照はどちらも、アドレス4.5100.0000(17.2656GB)においてメイン・メモリ160にアクセスする。
B.メモリのインターリービングおよびスタッキング(変換)
変換は、メモリ参照(再配置後の、および適切な場合には再利用後の)をメイン・メモリ160内の特定のメモリ記憶装置にマップするプロセスである。図2を参照すると、メイン・メモリ160は、概念上、複数のMSUペア222および224(MSU_PAIRと呼ぶ)に分割されている。MSU_Pair内の個々のMSU220は、一意的には接続されていない。図2には2つのMSU_PAIR222、224のみを説明のためだけに示している。本発明では、2つ以上のMSU_PAIRを企図している。
コンピュータ・システム200は、再配置中、また当てはまる場合には再利用中、に生成された調整済みアドレス(すなわちメモリ参照)を利用し、次いでメモリ記憶装置ペア222、224間で、調整済みメモリ参照をインターリーブまたはスタックする。本発明の目標は、各プロセッサ240と関連付けられたメイン・メモリ要求をそれぞれ、メイン・メモリ160のグローバル・アドレス空間(すなわち全DRAMアドレス空間)にわたって分配して、メモリ資源の競合を最小にするために、連続したメモリ・アクセスが異なるメモリ記憶装置220間で分配することである。インターリービングを実行できない場合には、メモリ・アドレスが連続的な順序でメモリ記憶装置のペアに向けられ、本明細書ではこれをスタッキングと呼ぶ。
例示的実施形態では、4つのメモリ記憶装置、すなわちメモリ記憶装置ペア222およびメモリ記憶装置ペア224など2組のメモリ記憶装置がある。各メモリ記憶装置ペア(以降MSU_Pairと呼ぶ)には、メモリ記憶装置220Aおよび220Bなど2つのメモリ記憶装置が含まれる。インターリービングはメモリ記憶装置ペア222および224間で達成される。次いで、メモリ記憶装置ペア222および224内のメモリ記憶装置220間でそれぞれインターリービングが達成される。有効な結果は、4重(four-way)インターリービングである。
例えば、メモリ記憶装置220Aおよびメモリ記憶装置220Bなど、2つのメモリ記憶装置があるとする。メモリへの参照は、メモリ記憶装置220Aとメモリ記憶装置220Bの間で交互に行われる(ping-pong)ことが最適である。すなわち、メモリへの最初の参照はメモリ記憶装置220Aにアクセスするのに対し、2番目の参照はメモリ記憶装置220Bにアクセスする。メモリ記憶装置220Aが1つだけのバンクを移植(populate)しているのに対して、メモリ記憶装置220Bが8つのバンクを移植(populate)していて、メモリ記憶装置220Aとメモリ記憶装置220Bを交互に用いる場合、ある時点で、メモリ記憶装置220Aはメモリ空間を使い果たしてしまう。この場合は、メモリ記憶装置220B内の残りのメモリにスタックされる。すなわち、メモリ記憶装置220Bの連続的アドレス指定(または参照)を手段とする。
メモリ記憶装置の特徴の1つは、特定のメモリ記憶装置「ペア」内に、1つのメモリ記憶装置があっても複数のメモリ記憶装置があってもよいことである。さらにメモリ記憶装置は、異なる比率で移植(populate)することができる。すなわち、1つのメモリ記憶装置は1つのDRAMバンクを移植(populate)させ、別のメモリ記憶装置は8つのDRAMバンクを移植(populate)させることができる。
本発明によると、変換プロセスには、メモリ記憶装置ペア222とメモリ記憶装置ペア224の間およびMSU220の間において、メモリ参照のインターリービングおよびスタッキングを用いる。このプロセスは、プロセッサ(MP)240から発行されるメモリ要求に対しては、各TCT270によって実行される。DIBを介してI/Oプロセッサ(例えばPCIカード)から発行されるメモリ要求に対しては、このプロセスは各TCM285によって実行される。
TCT270の動作を考慮すると、どのMSU_PairまたはどのMSU220が、最初のキャッシュ・ライン・アドレス(すなわちTCT270からのアドレス)を受け取るべきかを初期化時に指定する機構が提供される。TCT270は、プロセッサのメモリ書き込み/読み取りアドレスを(任意の再配置後および/または再利用後に)受け取り、アドレス変換機能を通じてそれをパスする。好ましい実施形態では、メモリ記憶装置220は28ビットのキャッシュ・ライン・アドレス(すなわちメモリ参照)、および8バイトのコンテナアドレスを、16ギガバイトのメモリ空間を表すマルチサイクル信号から受信する。下記で説明するアドレス変換オプションの設定に基づき、変換機能は、要求を受け取るメモリ記憶装置と関連付けられたMSU数を、28ビットMSUマップアドレスの上位10ビットとともに生成する。TCT270はMSUのマップアドレスの下位18ビットも供給するが、これらのビットは変換機能によって変更されない。
TCT270は、MSU_Pairごとのメモリ・アクセスおよび個々のMSU220間でのメモリ・アクセスの、インターリービングおよびスタッキングの多様な組み合わせを可能にする。表Cには、MSU_PAIRおよびその個々のMSU220間での、メモリのインターリービング/スタッキングの8つの組み合わせを挙げる。
Figure 2006216068
表CのIIIモードを参照すると、アルゴリズムは、キャッシュ・ラインを1つおきに交互のMSU_PAIRに分配している(例えばキャッシュ・ライン・アドレス0はMSU_PAIR222に転送される)。アルゴリズムはさらに、MSU_PAIRに向けられたキャッシュ・ラインを1つおきに、MSU_PAIR222、224内の交互のMSU220に分配する(例えばキャッシュ・ライン・アドレス0は、下位数のMSU220に向けられる)。
ISI、ISS、またはIISモードでは、このアルゴリズムは、キャッシュ・ラインを1つおきに交互のMSU_PAIR222、224に分配する(例えばキャッシュ・ライン・アドレス0はMSU_PAIR222に転送される)。本発明によりスタックされたMSU_PAIR222、224内のMSU220の場合、アルゴリズムはさらに、もう一方のMSU220を連続的に満たす前にそのMSU220が一杯になるまで、選択されたMSU_PAIR222、224の下位数のMSU220に、連続的にアドレス指定されたアクセスを向ける。本発明によりインターリーブされたMSU_PAIR222、224内のMSU220の場合、アルゴリズムはさらに、MSU_PAIR222、224に向けられたキャッシュ・ラインを1つおきに、交互のMSU220に分配する(すなわち、キャッシュ・ライン・アドレス0は、MSU_PAIR222、224内の下位数のMSU220に向けられる)。
SSSモードでは、本発明は、もう一方のMSU_PAIR222、224を順次満たす前にそのMSU_PAIR222、224が一杯になるまで、下位数のMSU_PAIR222、224(構成レジスタによって決定される)を連続的に充填する。このアルゴリズムはさらに、もう一方のMSU220を連続的に充填する前にそのMSU220が一杯になるまで、選択されたMSU_PAIR222、224内の下位数のMSU220に連続的にアクセスを向ける。
SSI、SII、SISモードでは、アルゴリズムは、もう一方のMSU_PAIR222、224を順次満たす前にそのMSU_PAIR222、224が一杯になるまで、下位数のMSU_PAIR222、224を連続的に充填する。スタックされたMSU_PAIR222、224内のMSU220の場合、本発明は、もう一方のMSU_PAIR222、224を連続的に充填する前にそのMSU_PAIR222、224が一杯になるまで、選択されたMSU_PAIR222、224のローMSU220のアドレスを連続的に指定する。インターリーブされるMSU_PAIR222、224内のMSU220の場合、本発明は、MSU_PAIR222、224のキャッシュ・ラインを1つおきに、交互のMSU220に分配する。キャッシュ・ライン・アドレス0は、そのMSU_PAIR222、224内の下位数のMSU220に向けられる。
例えば、ISSオプションに従うと、インターリービングはキャッシュ・ラインが1つおきに実行され、メモリ記憶装置ペアに対して交互に実行される、。すなわち、最初のキャッシュ・ライン・アドレスはメモリ記憶装置ペア222に転送され、次のキャッシュ・ライン・アドレスはメモリ記憶装置224に転送される。本発明では、メモリ記憶装置220Aが一杯になるまで、メモリ参照をメモリ記憶装置220A内に連続的にスタックする。メモリ記憶装置220Aが一杯になると、本発明は次いで、メモリ記憶装置220Bが一杯になるまでそこにメモリ参照を連続的にスタックする。同様に、メモリ記憶装置220Cが一杯になると、本発明は次いで、メモリ記憶装置220Dが一杯になるまでそこにメモリ参照をスタックする。
表Dは、変換および再利用レジスタを定義している。この表には、変換および再利用レジスタ内の当該の各アドレス・ビットについての行が含まれる。各行には機能フィールドおよびデフォルト値フィールドが含まれる。機能フィールドは、当該のアドレス・ビットの機能を表す。デフォルト値フィールドは、初期化の際にアドレス・ビットがデフォルトとして選択する値である。メモリ・アドレス変換および再利用レジスタ内のビット・ステータスは、メモリ・アドレス空間の再利用が使用可能であるかどうか、およびアドレス変換が使用可能であるかどうかを決定する。これはまた、どのメモリ記憶装置ペアを選択するか、およびどのメモリ記憶装置を変換プロセスのために選択するかを指定する。
Figure 2006216068
MSU_PAIR222、224およびMSU220のバンク間でインターリーブすることは、メモリ・コントローラ(図示せず)の責任である。
コンピュータ・システム200がインターリービングを実施するかどうかは、複数レジスタ内の設定によって決まる。例えば、表EおよびFは、第1メモリ記憶装置ペアおよび第2メモリ記憶装置ペアにそれぞれ対応する、メモリ・アドレス変換レジスタの初期化時における内容を示している。メモリ・アドレス変換レジスタには、当該の各ビットのための行が含まれる。各行には、機能フィールドおよびデフォルト値フィールドが含まれる。機能フィールドは、当該のアドレス・ビットの機能を含む。デフォルト値フィールドは、アドレス・ビットが初期化時にデフォルトとして選択する値である。
Figure 2006216068
Figure 2006216068
表EおよびFに示すメモリ・アドレス変換レジスタ内のビット・ステータスは、メモリ記憶装置の特定ペアに対するインターリービングが使用可能であるかどうか、またはスタッキングが使用可能であるかどうかを決定する。メモリ・アドレス変換レジスタ内のビット・ステータスはさらに、メモリ記憶装置ペアの2つのメモリ記憶装置のうち小さい方を示す。
表Gは、フォワードおよびリバースのアドレス変換のために初期化時に必要とされる構成情報を示す。表Gは図2と次のように関連している。MSU_Pair0はMSU_Pair222、MSU_Pair1はMSU_Pair224,MSU#0はMSU220A、MSU#1はMSU220B、MSU#2はMSU220C、およびMSU#3はMSU220Dである。
Figure 2006216068
Figure 2006216068
Figure 2006216068
:このレジスタ・サイズはこの表では指定されない。これは実装固有(implementation specific)であり、変換アルゴリズムを理解するためには必要ではない。
:メモリ・サイズは、最大メモリ・アドレス+1に等しい。例えば、単一の128MBバンクは、000_0000から700_0000のアドレス範囲を有するが、そのサイズは800_0000である。このサイズを36ビット[35:0]に拡張すると、0_800_0000になる。このサイズに最上位の9ビット[35:27]を使用すると、この例のサイズレジスタは000000001または001でロードされる。
上記のように、フォワードのアドレス変換機能を実施する論理およびレジスタは、TCM285(各DIBを介した出入力プロセッサからのメモリ要求に対して)およびTCT270(プロセッサ240からのメモリ要求に対して)の両方にある。アルゴリズムは2つのステップで実行される。第1ステップでは、どのMSU_PAIRを選択するべきかを決定し、第2ステップでは、アドレスを送るために、選択されたペアのどちらのMSUを選択すべきかを決定する。AppendixAに示すのは、フォワード・アドレス変換アルゴリズムの単純化した擬似コードである。この擬似コードには、MSU_PAIRSの数、またはMSU_PAIRごとのMSUの数などの基準を検証するチェックは含まれない。当分野の技術者には直ちに明らかであるように、これらのチェックは、変換プロセスをより容易に理解できるように擬似コードから意図的に除外した。
フォワード・アドレス変換アルゴリズムは、入力TEMP_ADDRを受け取り(take as)、レジスタPAIR_MODE、SMALLEST_PAIR_SZおよびPAIR_SELを使用する。このアルゴリズムは、任意の必要な調整後のアドレスである出力TEMP_ADDRを生成し、また、どのMSU_PAIRが選択されているかを示すRCVING_PAIRを生成する。最初、TEMP_ADDR[29:0]は、任意のアドレス再配置が実行された後のアドレスである。TEMP_ADDR[29:0]はADDR_IN[35:6]に等しい。TOP_OF_INTRLV_RANGEは、インターリービングのためのメモリがもう残っていないアドレス値である。すなわち、これはメモリ・アドレスのスタッキングが開始するアドレスである。TOP_OF_INTRLV_RANGEは、SMALLEST_PAIR_SZの2倍に等しい。
図9は、フォワード・アドレス変換アルゴリズムの流れ図を示している。MSU_Pairの選択は段階900に示される。段階902では、ペア間のインターリービングが使用可能であるかどうかを決定する。使用可能である場合段階904に示すように、このアルゴリズムはまず、インターリーブされたメモリ範囲内にアドレスがあるかどうかを調べる。キャッシュ・ライン・アドレスがインターリーブ範囲の上にある場合、ステップ910に示すように、本発明は大きい方のMSU_PAIRにスタックする。インターリーブ範囲の上にない場合、流れはステップ906へと続き、複数のMSU_PAIRの中からどのMSU_PAIRを選択するかを決定する。好ましい実施形態では、低位のキャッシュ・ライン・アドレス・ビット、TEMP_ADDR[0]がMSU_PAIRを選択するために使用される。
ペア間のインターリービングが使用可能でない場合、本発明は次いで、キャッシュ・ライン・アドレスをスタックする。好ましい実施形態では、本発明は、キャッシュ・ライン・アドレスをMSU_PAIR0にスタックし始める。MSU_PAIR0(すなわちMSU_Pair222)が一杯になると、スタッキング・プロセスはMSU_PAIR1(すなわちMSU_Pair224)に進行する。スタッキングは、最上位のMSU_PAIRが一杯になるまで続行する。これは一般にステップ912に示される。
流れは次いでステップ908に進行し(ブロック906、910、912のいずれから)、キャッシュ・ライン・アドレスが再調整される。この調整の方法は、インターリービングまたはスタッキングが選択されているかどうかによって決まる。インターリービングの場合、キャッシュ・ライン・アドレス(TEMP_ADDR)は、アドレスを右に1位置ずらし、最上位のアドレス・ビットをゼロ充填することにより再調整される。スタッキングの場合、キャッシュ・ライン・アドレスは同じままであるか、または擬似コードから明らかなように、TEMP_ADDR−SMALLEST_PAIR_SZと等しくなるようにセットされる。
MSU_PAIRがスタッキングのために選択されると、本発明は段階920に進行する。このアルゴリズム段階は、入力TEMP_ADDRを有するが、これはステップ908で調整されていることもありうる。段階920では次のレジスタを使用する:PAIR0_MODE、PAIR0_SMALLEST_MSU_SZ、PAIR_SEL。段階920からの出力は、必要とされる任意の調整後のキャッシュ・ライン・アドレスであるTEMP_ADDRと、どのMSUがキャッシュ・ライン・アドレスを受け取るかを示すRCVING_MSUである。初期化時において、PAIR0_TOP_OF_INTLV_RANGEは、MSU_PAIR0のMSU間のインタリービングのためにメモリがもう残っていないアドレス値である。PAIR1_TOP_OF_INTLV_RANGEは、MSU_PAIR1のMSU間のインターリービングのためにメモリがもう残っていないアドレス値である。
段階900でMSU_Pair0が選択された場合、次いで段階920では、RCVING_PAIRがMSU0またはMSU1に等しいかどうかを決定する。同様に、段階900でMSU_Pair1を選択した場合は、次いで段階920で、RCVING_PAIRがMSU2またはMSU3と等しいかどうかを決定する。説明を簡潔にするために、MSU0とMSU1間の選択だけを説明する。
ステップ924では、MSU_PAIRの複数MSU間のインターリービングが使用可能であるかどうかを決定する。インターリービングが使用可能である場合、ステップ926に示すように、アルゴリズムはまず、キャッシュ・ライン・アドレスがインターリーブされたメモリ範囲内にあるかどうかを判定する。キャッシュ・ライン・アドレスがインターリーブされたメモリ範囲内にある場合、ステップ928に示すように、低位のキャッシュ・ライン・アドレス・ビットが、適切なMSUを選択するために使用される。次いでそのキャッシュ・ライン・アドレスは、ステップ930に示すように、キャッシュ・ライン・アドレス・ビットを右に1位置ずらし、最上位のアドレス・ビットをゼロ充填することにより再調整される。
それに対し、キャッシュ・ライン・アドレスがインタリーブ・メモリ範囲の上にある場合、ステップ932に示すように、アルゴリズムは大きい方のMSUにスタックする。流れは次いでステップ930に進行し、TEMP_ADDRをTEMP_ADDR_PAIR0_SMALLEST_MSU_SZに設定することにより、アドレスがスタッキングのために調整される。
MSU_PAIR0のMSU間のインターリービングが使用可能でない場合、ステップ934に示すように、本発明はまずMSU0にスタックし、次いで残りをMSU1にスタックする。再度、アドレスは、ローMSUまたはハイMSUのどちらが最初に使用されるかに基づいてステップ930で調整される。ローMSUが最初に使用される場合、TEMP_ADDRは変更されないままである。ハイMSUが最初に使用される場合、TEMP_ADDRはTEMP_ADDR_PAIR0_SMALLEST_MSU_SZに設定される。
上記のように、MSU_PAIR1内のMSU2とMSU3間の選択も同様の手順に従って行われる。
最終的には、ステップ940に示すように、MSU_ADDR[29:0]が調整済みのTEMP_ADDR[29:0]に割り当てられ、RCVING_PAIRはRCVING_MSU標識と連結されて、MSU_SEL[1:0]を形成する。これにより、フォワード・アドレス変換アルゴリズムが完了する。
AppendixBに示すのは、リバース変換アルゴリズムのための擬似コードである。リバース・アドレス変換機能は、MSUコントローラ(図示せず)内だけにある。
図6を参照して、フォワード・アドレス変換アルゴリズムの例を実証する。図6は、2つのMSU_PAIR610、640を有するメイン・メモリ600を示している。MSU_Pair610が2つのMSU620、630を有するのに対し、MSU_Pair640は単一のMSU650を有する。MSU620は1つの128メガバイト・メモリ・バンク1020を有し、MSU630は2つの128メガバイト・バンク1030(すなわち256メガバイトのメモリ空間)を有し、MSU650は4つの128メガバイト・バンク1040(すなわち512メガバイトのメモリ空間)を有する。MSU620のトップは80.0000である。これは、80.0000が、インターリービングのためにメモリが残っていないアドレス位置であることを意味する。MSU630のトップは100.0000である。したがって、MSU_Pair610は180.0000Hのペア・サイズを有する。MSU650のトップは200.0000である。したがって、MSU_Pair610は200.0000のペア・サイズを有する。MSU_Pair640は単一のMSU650しか含まないものの、概念上は1組のMSUとして扱われることに留意されたい。
4つのキャッシュ・ライン・アドレス0.0000.0000、0.0000.0040、0.0000.0080、および0.0000.00C0があり、それぞれが、任意のアドレス再配置実行後の、4つのオペレーティング・システムからの4つのメモリ参照を表していると想定する。この例では、メイン・メモリは図6に示すように構成される。この構成が、この数のメモリ・バンクに対する最も効率のよいメモリ構成ではないことに留意されたい。
この例のレジスタ・セット・アップは次のようになる。PAIR_MODEは0(インターリーブ)に等しく、PAIR0_MODEは0(インターリーブ)に等しく、PAIR1_MODEは1(スタック)に等しく、SMALLEST_PAIR_SZは003に等しく、PAIR0_SMALLEST_MSU_SZは001に等しく、PAIR1_SMALLEST_MSU_SZは004に等しく、PAIR_SELは1に等しく、PAIR0_SELは1に等しく、PAIR_SELは0に等しい。上記のセットアップは変換のIISオプションを表す。
このレジスタ設定を使用し、最初のアドレスをアルゴリズムに提供すると、次の結果が得られる。
両位相のための初期化:
PROCESSOR_ADDR[35:0]=000000000
TEMP_ADDR[29:0]=00000000
TOP_OF_INTRLV_RANGE=003
PAIR0_TOP_OF_INTLV_RANGE=002
PAIR1_TOP_OF_INTLV_RANGE=004
MSU_Pair選択位相:
In
TEMP_ADDR[29:0]=00000000
Results:
RCVING_MSU=0(MSU_PAIR0)
TEMP_ADDR[29:0]=00000000
MSU#選択位相:
In
TEMP_ADDR[29:0]=00000000
Results:
RCVING_MSU=0(MSU#0)
TEMP_ADDR[29:0]=00000000
the final results(最終結果):
MSU_ADDR[29:0]=000000000
MSU_SEL[1:0]=00(MSU_PAIR0 のMSU#0)
第2アドレスの処理
初期化:
PROCESSOR_ADDR[35: 000000040
0]=
TEMP_ADDR[29:0]=00000001
RCVING_PAIR=1(MSU_PAIR1)
TEMP_ADDR[29:0]=00000000
RCVING_MSU=0(MSU#2)
TEMP_ADDR[29:0]=00000000
最終結果:
MSU_ADDR[29:0]=00000000
MSU_SEL[1:0]=10(MSU_PAIR1 のMSU#2)
第3のアドレスからは次が得られる
初期化:
PROCESSOR_ADDR[35: 000000080
0]=
TEMP_ADDR[29:0]=00000002
RCVING_PAIR=1(MSU_PAIR1)
TEMP_ADDR[29:0]=00000001
RCVING_MSU=0(MSU#2)
TEMP_ADDR[29:0]=00000000
最終結果:
MSU_ADDR[29:0]=00000000
MSU_SEL[1:0]=01(MSU_PAIR0のMSU#1)
以上に対し第4アドレスからは最終結果が得られる
初期化:
PROCESSOR_ADDR[35: 0000000C0
0]=
TEMP_ADDR[29:0]=00000003
RCVING_PAIR=1(MSU_PAIR1)
TEMP_ADDR[29:0]=00000001
RCVING_MSU=0(MSU#2)
TEMP_ADDR[29:0]=00000000
最終結果:
MSU_ADDR[29:0]=00000000
MSU_SEL[1:0]=01(MSU_PAIR1 のMSU#2)
図7はこの例の結果を示している。
本発明の実施形態は、ハードウェア、ソフトウェア、またはその両方の組み合わせで実施できることを理解されたい。このような実施形態では、本発明の機能を実行するために、種々の構成要素およびステップを、ハードウェアおよび/またはソフトウェアで実施してよい。現在使用可能な、あるいは将来開発されるコンピュータ・ソフトウェア言語および/またはハードウェア構成要素を、本発明の上記の実施形態に用いることができる。特に、上記で説明し、上記および以下の付表中に提供する擬似コードは、ソフトウェア実施形態を作成するのに特に有用である。
C.ブート時における初期化
例示的実施形態では、処理モジュールおよびメモリ160を含むコンピュータ・システム200のパーティションへの区分は、本発明により、ブート時に実行される。メモリをパーティションに区分化し、マップし、インターリービングをセットアップする例示的プロセスを以下で説明する。これらの初期化操作は、MIP高速走査インターフェースを介して、Basic Input/Output System(BIOS)およびManagement Interface Processor(MIP)によりブート時に実行することができる。MIPは、管理アプリケーション・プラットフォーム(MAP)のハードウェア・インターフェース部分であり、コンピュータ・システム200の初期化およびエラー回復を実行する。例示的実施形態では、MIP高速走査インターフェースはIEEE TAP Linker Specification1149.1に準ずる。
本明細書で使用する用語「パーティション」は、ウインドウの代わりに使用されることがある。本明細書で使用する場合、この2つの用語は同義であり、オペレーティング・システムの1インスタンスによって制御されるシステムの部分を指す。
ブート時にパーティション区分を達成する方式は、システム・アドミニストレータが決定してMAP上にあるデータベースに入力することができる。パーティション区分情報は、特定ウインドウに割り当てるべきシステム資源と、ウインドウ内でロードするオペレーティング・システムのタイプと、2つのパーティションが共用メモリを介して通信するかどうかと、また通信する際はどのように通信するかを識別する。図2の例示的実施形態では、パーティションへの区分はサブPodおよびダイレクトI/Oブリッジ(DIB)の境界上で行われることが好ましい。
一般に、各オペレーティング・システムは、一定のハードウェア要件を有する。例えば、Windows NTおよびUnixware(Santa Cruz Operation社から入手可能)などの市販のオープンアーキテクチャのオペレーティング・システムは、ディスク・コントローラ(SCSIファイバ・チャンネルなど)、VGAコントローラ、互換性PCIボード、互換性周辺装置(CD−ROM、テープ、およびディスク)を必要とする。これらの適切なハードウェアはシステム上になければならず、システムはこれらの要件を確実に満たす方式でパーティションに区分するべきである。このことは、パーティション情報をMAP上のデータベースに入力する際に考慮に入れすべきである。
図13に、例示的初期化プロセスを説明するためにプロセス流れ図を提供する。
処理はステップ1310で開始し、MIPがBIOSをメイン・メモリにロードする。
ステップ1312で、MIPはBIOS構成データ・エリアをメイン・メモリ内でロードする。この情報は、構成データベースに記憶されていたものを部分的に反映する。
ステップ1314で、MIPは、各サブPodをリセットから1つずつ解放する。サブPodが調停し、1つのサブPodがBIOSサブPod(BSP)になることが好ましい。BSP内では、1つのプロセッサがマスタになり、このプロセッサがBIOSコードを実行する。本明細書の残りの部分にわたって、BIOSを実行するプロセッサはBSPと呼ぶことができる。このBSPは、下記の複数の機能を実行する。
ステップ1316で、BSPは各PCUバスを初期化する。BSPはシステム中の各PCIバスへのアクセス権を得、これはBSPのサブPod内のクロスバー相互接続からMSUに延び、別のサブPod上の別のクロスバー相互接続を通じて最終的にインターフェースを通ってDIBに通じる経路を通る。BSPは、MSUにアクセスせずに、それ自体のサブPodと関連付けられたDIBにアクセスすることができる。
ステップ1318で、BSPは、上記のステップ1312でメイン・メモリにロードされた構成データを読み出して、どのDIBがどのパーティションにあるのかを決定する。BSPは、上記の経路を使用して、各互換性DIB内の「パーティション・レジスタ内のDIB」にパーティションID(PID)を書き込む。このPIDは、通常のシステム動作中に、メッセージがDIBによって受け取られる際に使用される。メッセージは、DIBがメッセージと同じPIDを有する場合にのみ処理される。PIDは、同一のオペレーティング・システムの下で実行されているパーティション中のすべてのユニットが相互に対話することを許可し、また、PIDは共用メモリを通じてメッセージを送るためにも使用される。
任意選択のステップ1320で、BSPは、各PCIカード中のPCIレジスタを読み出すことにより、ハイ・メモリ・ホールおよびロー・メモリ・ホールのサイズを計算して、各PCIカードに対する入出力およびメモリ要件を決定する。I/O空間をメイン・メモリにオーバーレイすることは、Intel Multi−Processor Specificationにより、またある市販PCIカードは64ギガバイト以上のアドレスを認識できないという事実から必要である。
ステップ1322で、BIOSは、各PCIカードが必要とするメモリ・マップI/O空間の量を、MIPに知らせる。これは、BIOS−MIP間の割込み、および関連するメール・ボックスを介して行われる。この情報はMIPと関連付けられた構成データベース内に含まれているので、MIPは、メイン・メモリのサイズ、およびオペレーティング・システム間で共用されることになるメモリ量をすでに知っている。したがって、必要な入出力空間量がMIPに知らされると、MIPはTclスクリプトを使用して次の情報を計算することができる。
a.ハイ・メモリ・ホールおよびロー・メモリ・ホールの位置
b.再利用エリアの位置
c.共用メモリの位置
Tclは、ハードウェア設計者がシミュレーション・スクリプトを書くのに使用する業界標準のシミュレーション言語である。シミュレーション・スクリプトはまた、ハードウェアの初期化を達成するためにMIPにポートされる。
ステップ1324で、MIPは、上記で計算されたメモリ・アドレスを、構成データベース中に置かれたデータと合わせて使用して、サブPod(TCT)、クロスバー相互接続(TCM)、メモリ記憶装置(MSU)内のレジスタを設定する。TCMを初期化すると、パーティションへの区分、DIBのためのアドレス変換、DIBのためのメモリ・アドレス変換レジスタが設定される。これらの定数は、インターリーブ機能およびメモリ再利用に使用することができる。
例示的実施形態では、各DIBに1つずつ、少なくとも2つのレジスタ・セットが各TCM中にある。これには、範囲レジスタおよびブロードキャスト・レジスタが含まれる。
DIBのための範囲レジスタには、パーティション定義に従い、各DIBのための正当な(legal)メモリ範囲が含まれる。TCM内のインターフェースは、パーティション定義に従って、使用可能/使用不可能にされる。
TCT情報レジスタは、特に、パーティションを識別するパーティションIDで初期化される。このレジスタは、特定のサブPodがメッセージに対して動作すべきかを決定するために使用される。このレジスタ内と同じパ−ティションIDを持つメッセージは受信されることになる。
ブロードキャスト・レジスタはパーティションIDを含み、パーティションにわたるブロードキャスト・メッセージのために使用される。ブロードキャスト・メッセージには、このレジスタで識別されるパーティションIDによりタグがつけられる。
エージェント・テーブルはパーティションIDとともにロードされ、特定ウインドウのプロセッサへの割込みを有効にするために使用される。
DIBで、PCIカード用の範囲レジスタは、各PCIバスのメモリ・マップされた空間に対するアドレス範囲を含んでいる。パーティションIDレジスタは、そのDIBへのメッセージだけが受信されるように、パーティションIDを含む。
MSUでは、MSU_PairA/PairB構成レジスタが、MSUのバンク間のインターリーブを設定する。MIPは、インターリーブ操作を設定するために、メモリ・アドレス変換レジスタ(表EおよびF参照)を初期化する。このインターリーブ操作は、初期化の前にユーザーによって指定される。
MIPは、BIOSから受信されたメモリ・マップI/O空間の長さを使用して、メモリ・マップI/O空間の位置、共用メモリ開始アドレス、再利用開始アドレス、および新しいメモリ・トップを計算する。MIPは、MIPとBIOS間の割込みおよびメイン・メモリ内の関連するメール・ボックスを使用して、これらの開始アドレスをBIOSに戻す。MIPはさらに、ユーザー指定の構成データと合わせてこの情報を使用して、構成レジスタ(上の表A)、変換および再利用レジスタ(上の表D)を初期化する。これらのレジスタおよびメモリ・アドレス変換レジスタ(上の表EおよびF)に記憶されている初期化データは、ウインドウイング、再利用、アドレス変換機能を実行するためにアドレス変換論理によって必要とされる。上記のように、これらのレジスタと関連する論理のコピーは各TCT270内に位置し(プロセッサ240からのメモリ要求について)、また各TCM285中にも位置する(DIBを介した入出力プロセッサからのメモリ要求について)。MIPはさらに、各DIB、入出力ポート、APICメモリ・マップ空間、メモリ・アドレス空間のためのメモリ・マップ空間のための有効なアドレス範囲で、プロセッサ用の範囲レジスタを初期化する。
BIOSはこの情報を使用して、各パーティション/オペレーティング・システムのための、メモリ内の構成テーブルをセットアップする。この情報は、共用メモリの位置を各パーティションに通信する。構成テーブルはどのユーザー定義のフォーマットでもよい。例示的実施形態では、Intel社から入手可能なMultiProcessor Specificationで定義されるMP構成テーブルを使用する。MP構成テーブル内の「OEMテーブル・ポインタ」と呼ばれるフィールドは、共用メモリ・エリアの位置および長さを含むユーザー定義のエリアをポイントするのに使用される。UnixwareおよびNTドライバは、メモリ割り当ての目的と、待ち行列位置を決定する目的でこの情報を使用する。
BIOSはさらに、選択されたプロセッサ内でレジスタをセットアップする。MIPはこのレジスタへのアクセス権を持っていないので、BIOSはこのレジスタをセットアップする。例示的実施形態では、これはIntelプロセッサのために行われ、例えばオペレーティング・システムに通信する各プロセッサ内のトップ・オブ・メモリ・レジスタ(top of memory register - TOMR)に、メモリ・トップがどこにあるかを示すために、各プロセッサ中でレジスタを書き込むことが伴う。オペレーティング・システムは、TOMR値以上のメモリへのアクセスを試みることは許可されない。
レジスタにはまた、どのタイプのメモリが種々のメモリ範囲(例えばマップされたI/O、APIC割込み空間、メイン・メモリなど)内に存在するかをプロセッサに通信するメモリタイプ範囲レジスタ(memory type range register - MTRR)も含むことができる。MTRRは、どのようにメモリ・アクセスを処理するかをプロセッサに伝えるのに使用される。例えば、メモリ・マップI/O空間に指定されるメモリ範囲へのプロセッサ読み出し操作は、プロセッサのキャッシュには入れられない。オペレーティング・システムのインスタンスを実行しているプロセッサは、同じ値をその各MTRRにロードすべきである。
ステップ1326で、任意の追加初期化機能を実行した後、BIOSは、各オペレーティング・システムのブートセクタを、構成データベース内の情報によって決定されたメモリ内の適切な位置に読み込む。
ステップ1328で、BIOSは、各パーティション内のプロセッサの1つに割込みを発行し、これらのプロセッサは、指定された入出力装置から関連するオペレーティング・システムをロードし始める。これが完了すると、オペレーティング・システムは、そのウインドウ内の資源の制御を引き受ける。これにより、BIOSによるオペレーティング・システムの遷移および処理が完了する。
III.グローバル共用メモリを管理するための方法(パーティション間通信)
前述のグローバル共用メモリ手法は、各パーティションごとの専用メモリ空間を提供することができ、それに加えて、パーティションのすべてがアクセスすることのできる共用メモリ領域を提供することができる。共用メモリ領域は1つまたは複数の読み出し専用領域を含むことができる。パーティションは、そのパーティション上で動作しているオペレーティング・システムおよび他のクライアントを含め、この共用メモリを介して互いに通信を行うことができる。
この共用メモリは、例えば、パーティション上で動作するオペレーティング・システムの一部によって、またはパーティション上に常駐することが可能な他のソフトウェアおよび/またはハードウェアによって管理され得る。共用メモリ領域は、Microsoft Corp.から市販されるWindows NT、The Santa Cruz Operation Inc.(SCO)から市販されるUNIXWARE、Unisys Corp.から市販される、A―Seriesファミリーのコンピュータ・システムに取って代るUNISYS Clearpath HMP NXコンピュータ・システムに対して適合されたオペレーティング・システムであり、やはりUnisys Corp.から市販されるMaster Control Program(MCP)、またはUNISYS Clearpath HMP IXコンピュータ・システムに対して適合されたオペレーティング・システムであるOS2200を含むが、それらには限定されない様々なオペレーティング・システムによって管理され得る。
本発明により共用メモリ領域を管理するための代替の実施形態を下記に説明する。実施形態は、本明細書では、例示の目的で記載しており、制限するためにではない。他の実施形態(本明細書に記載する実施形態の等価形態、変形形態、偏倚形態などを含む)は、本明細書に含まれる教示に基づいて、関連分野の技術者には明白となる。本発明は、そうした代替の実施形態を含むことを意図し、そのように適合されている。
A.パーティション間通信のためのポーリング
一実施形態では、コンピュータ・システム上で、それ独自のパーティション(例えば、1つまたは複数のPodまたはサブPod)内で動作している各オペレーティング・システムには、共用メモリ160の一部分が関連付けられている、または割り振られている。オペレーティング・システムは、共用メモリのそれが関連する部分に書き込み、またそこから読み取ることができるが、他のオペレーティング・システムと関連するメモリの部分に書き込むことはできない。ただし、すべてのオペレーティング・システムは、共用メモリ全体から読み取ることができる。
好ましくは、各パーティションまたはオペレーティング・システムには、そのパーティションまたはそのオペレーティング・システムに専用の排他メモリ・ウインドウ(これ以降、時として、その「ローカル・モリ空間」とも呼ぶ)が割り当てられる。オペレーティング・システムまたはそのオペレーティング・システムと関連するアプリケーションが、メッセージを別のオペレーティング・システムまたはそのオペレーティング・システムに関連するアプリケーションに送信するとき、この送信するエンティティは、そのメッセージが、ネットワークを介して転送されるように作成されたとすれば、行われたであろう方式と同じ方式で、そのローカル・メモリ空間内のバッファにメッセージを作成する。送信するエンティティは、次に、このメッセージの一部分またはすべてを共用メモリ160のその割り振られた部分にコピーする。
共用メイン・メモリ160の送信するオペレーティング・システムの関連部分から読み取ることはできるが、そこに書き込むことのできない目標パーティション/オペレーティング・システムは、新しいメッセージが入手可能であることを検出して、そのメッセージを共用メイン・メモリからその独自のローカル・メモリ(その排他メモリ・ウインドウ)内にコピーする。
例としての実施形態では、オペレーティング・システムのためのコードおよびほとんどのデータ構造は、そのオペレーティング・システムのためのローカル・メモリ空間内に常駐する。いくつかの新しいデータ構造は、好ましくは、共用メモリ160内に常駐する。
例としての実施形態では、2つのタイプのデータ構造を使用して、パーティション間またはオペレーティング・システム間の通信を円滑にする。第1タイプは、メッセージ・データを格納するメッセージ記憶構造を含み、この構造は、出力メッセージ・バッファに組み込まれている。第2タイプは、メッセージ待ち行列領域内に記憶される待ち行列構造を含み、この構造は、関連する出力メッセージ・バッファ内に記憶されたメッセージ・データに対するポインタを含む。好ましくは、これら2つのタイプのデータ構造は、共用メイン・メモリ160内に記憶して、他方、様々なオペレーティング・システムおよび関連するアプリケーション・プログラムによって利用される他のコードおよび他のデータ構造は、関連するローカル・メモリ空間内に常駐する。これはシステム保全性を保護する。
図14は、出力メッセージ・バッファ・プール領域1402およびメッセージ待ち行列領域1414を含んだ、共用メモリ160の部分を図示している。一般的に、出力メッセージ・バッファ・プール領域1402は、各パーティションと関連付けられている。メッセージが同報通信されたとき、バッファ1410が、メッセージに対して割り振られ、そこに1つまたは複数の待ち行列エンティティがポイントする。
一般的に、すべてのパーティションが、すべての出力メッセージ・バッファ・プール領域1402に対する読み取りアクセスを有する。しかし、各パーティションは、その関連する出力メッセージ・バッファ・プール領域1402内のバッファ1410にのみ、書き込みアクセスを有する。
メッセージ待ち行列領域1414は、そのそれぞれが異なるパーティション専用であるn個のノード出力待ち行列1412に分割されている。すべてのパーティションは、メッセージ待ち行列領域1414全体に対する読み取りアクセスを有するが、パーティションは、その関連するノード出力待ち行列1412のみを変更することができる。このアクセス制御は、ハードウェア内で実施することができ、ハードウェアロックを不必要にして、これにより、回復オペレーションおよび点検オペレーションを単純化する。
図15Aは、8個のノード出力待ち行列1412を有するメッセージ待ち行列領域1414の例としての実施形態を図示している。ノード出力待ち行列1412aは、各パーティションごとのノード間待ち行列1510を含んでいるのが図示されている。本明細書で使用する「ノード」という用語は、「パーティション」という用語と等価である。
図16Aおよび16Bは、ノード出力待ち行列1412内に含まれる例としての情報を図示している。例としてのノード出力待ち行列1412の最初の16ワードは、関連するノードについての制御情報を含み、この情報は、後述するとおり、ノード・オペレーティング・システム・タイプ(Node_OS_ID)1610、ノード・メディア・アクセス制御(MAC)アドレス1612、および回復中に使用する様々なリセット・フラグ(例えば、Reset_OK)を含む。
制御情報は、そのそれぞれがオフセットをそれぞれの異なるノードのノード出力待ち行列に格納する8つのDequeued_offsetフィールドをさらに含み、下記に説明するとおり、どれが、それぞれの異なるノードから受信すべき新しいメッセージであるかを示す。
図16Aおよび16Bの例としての実施形態では、ノード間待ち行列1510が、制御情報の最初の16ワードに続く。各ノード間待ち行列1510は、メッセージを指定の異なるノードに送信するために、関連するオペレーティング・システムによって使用される。例えば、ノード0−ノード1間待ち行列1510aは、メッセージをノード1に送信するために、ノード0によって使用される。単純にするため、ノード間待ち行列1510は、各ノードごとに、それ自体にメッセージを送信するために提供することができる。
図16Aおよび16Bでは、各ノード間待ち行列1510内の第1ワードが、「Need_Reset」フラグおよび「Enqueue_offset」を含んだ制御情報を含む。Need_Resetは、送信するノードが、ノード間待ち行列のうちの1つをリセットしようとするとき、Reset_OKフラグのうちの選択した1つと併せて使用する。「Enqueue_offset」は、例えば、1と511の間の数を含み、それぞれのノード間待ち行列1510内での次に利用可能なエントリにポイントするのに使用する。ノード間待ち行列1510の残りのワード(例えば、511ワード)のそれぞれは、関連する出力メッセージ・バッファ1410内の関連するメッセージ・データ構造1416にポイントするオフセット・ポインタを含む。
好ましい実施形態では、このオフセットは、それぞれのノードの出力メッセージ・バッファ1410の開始からの64ビット・ワードの数である。ポインタは、実アドレスまたは仮想アドレスからではなく、なんらかのベース・アドレスからのオフセットでなければならない。ポインタは、仮想アドレスに基づくものであってはならない。というのは、ノードが異種ノードであるとき、それらが、共通仮想アドレス変換を有さない可能性があるからである。ポインタは、実アドレスに基づくものであってはならない。というのは、前述のアドレス変換方式の結果、1つのノードによって使用される実アドレスは、一般的に、別のアドレスによって使用される実アドレスと一致しないからである。
例としての実施形態では、ポインタは、各ノードまたは各オペレーティング・システムが、ノード初期設定中に、前述の管理アプリケーション・プラットフォーム(MAP)から受信した情報から計算することのできるアドレスからのオフセットである。
ノード出力待ち行列1412内の8つのノード間待ち行列1510のそれぞれは、例えば、図16Aおよび16Bに図示するとおり、512ワード長であることが可能であり、各ノード出力待ち行列1412が、16+8(512)ワード長になるようになっている。
この待ち行列の深さは、メッセージを共用メモリに転送するのに利用可能となったとき、関連する待ち行列がいっぱいにならないのを確実にすることを助ける。待ち行列の深さは、初期設定中に、マネージャ・アプリケーション・プラットフォーム(MAP)によって指定され得る。前述のとおり、MAPは、コンピュータ・システム200に対する初期設定およびエラー回復を実行するためのサポートシステムである。
柔軟性を追加するため、MAPは、初期設定時に待ち行列容量を示すように設計することができる。このデータは、構成テーブルのそれぞれへのエントリとして追加することができ、このテーブルは、システム内の各オペレーティング・システム・インスタンスごとに、MAPによって提供されて、それぞれのオペレーティング・システムに共用メイン・メモリの場所などの必要なシステム・パラメータを知らせるデータ構造である。
図17は、メッセージ・データ構造1416の例としての実施形態を図示している。各メッセージ・データ構造1416は、好ましくは、0のオフセットで関連する出力メッセージ・バッファ1410内に配置され、ヘッダ領域1710およびメッセージ・データ領域1712を含む。ヘッダ領域1710は、ワード0〜nを占有することが図示されており、バッファ長、ヘッダ長、およびカウント情報を含む。カウント情報は、好ましくは、2200オペレーティング・システム(すなわち、Unisys Corporationから市販される2200型プロセッサに対して適合されたオペレーティング・システム)によってメッセージを書き込むために含まれる。というのは、2200オペレーティング・システムによってメモリに書き込まれたメッセージは、連続するメモリ・ロケーションを占有しないからである。2200オペレーティング・システムを実行するノードが、共用メモリ内にメッセージ・データを記録するとき、各64ビット・メイン・メモリ・ワードは、せいぜい32ビットのデータを格納するに過ぎず、これは、各64ビット・メイン・メモリ・ワードの最下位ビットに配置されることになる。いくつかのワードは、メッセージがワード境界で開始または終了しない場合、より少ないビットを格納する可能性がある。したがって、第1バイト・スキップ・カウントが、プロトコル・ヘッダとメッセージ・データ間でスキップされるべきバイト数を示す。バイト転送カウントは、関連する有効メッセージ・フィールドのバイト長を示す。バイト・スキップ・カウントとバイト転送カウントの合計は、(バッファ長−ヘッダ長)4に等しいか、それより少なくなければならない。
イーサネット環境では、最大メッセージ・セグメント・サイズは、メッセージに対して1500バイト・ワード、つまり37564ビットワードである。一実施形態では、本発明は、ネットワーク入力/出力処理アーキテクチャ(NIOP)を含み、これは、米国特許第5659794に記載され、Unisysに譲渡された、Unisys Corporationによって開発されたメッセージ・ハンドラであり、これは、50の別々のデータストリームを1つのメッセージ・セグメントに結合して、ネットワークを介して送信することを可能にする。したがって、427ワードの出力メッセージ・バッファ・サイズは、2200オペレーティング・システムが、イーサネットLAN環境の場合と同じように、本発明の共用メモリ環境で機能し続けることを可能にすることになる。511の待ち行列の深さおよび427ワードのバッファ・サイズを所与として、(5114278)//4096=1748992ワードのノード・バッファ・プール・サイズである。したがって、共用メモリ環境当たり必要な合計共用メモリは、(65536+17489928)//4096=14057472ワードである。
これらのデータ構造の使用は、例によって説明することができる。第1オペレーティング・システムOS1が、第2オペレーティング・システムOS2にメッセージを送信しようとしていると想定する。OS1−OS2間ノード出力待ち行列1412は、いっぱいになっていないとさらに想定して、OS1は、OS1出力メッセージ・バッファ領域1410a内の利用可能なメッセージ・データ構造(すなわち、バッファ)1416aを得る。バッファ1410aは上述のとおり、好ましくは、アドレス・オフセット・ポインタによって識別される。OS1は、そのメッセージに対するプロトコル・ヘッダ1710を作成して、このヘッダ1710およびメッセージ1712をOS2のローカル・メイン・ストーレッジからこの利用可能なメッセージ・バッファ1416aに転送する。次に、OS1は、OS1−OS2間待ち行列1510a内のEnqueued_offsetの内容を増分して、OS1−OS2間待ち行列1510a内の次に利用可能なエントリにポイントする。OS1は、メッセージ・データ構造(すなわち、バッファ)1416aにポイントするオフセット・ポインタをこの次の利用可能なエントリにコピーする。好ましい実施形態では、Enqueued_offsetは、巡回待ち行列として維持される。
OS2は、メッセージがOS1から入手可能であるかを決定するためにポーリングする。これは、OS2のノード出力待ち行列1412aの制御領域内に記憶されているOS2に関する適切なDequeued_offsetの内容を、OS1のノード出力待ち行列1412bのOS1−OS2間出力待ち行列内に記憶されている適切なEnqueued_offsetに比較することによって行われる。好ましい実施形態では、Dequeued_offsetは、巡回待ち行列として維持される。
8つのDequeued_offset(例としての実施形態では)のそれぞれは、ノードのノード出力待ち行列1412のうちの対応する送信する待ち行列内のエントリにポイントする1と511の間の値を格納する。例えば、OS2の出力待ち行列のワード8内に記憶されているDequeued_offsetは、OS1のノード出力待ち行列1412a内の「ノード0−ノード1間待ち行列」にポイントするオフセット値を格納する。同様に、OS2のノード出力待ち行列1412のワード15内に記憶されているDequeued_offsetは、「ノード7−ノード1間待ち行列」にポイントするオフセット値を格納する。前述のとおり、データ構造は、ノード出力待ち行列1412、および各ノードまたは各オペレーティング・システムが、それ自体にメッセージを送信することを可能にする、関連するDequeued_offset、例えば、OS1−OS1間ノード出力待ち行列を含む。
現行の例では、OS2ノード出力待ち行列1412のワード8内のDequeued_offsetフィールドが、OS1−OS2間待ち行列内のEnqueued_offsetフィールドに比較される。この2つのオフセット・エントリが同じである場合、その待ち行列は、空である。Enqueued_offsetがDequeued_offsetとは異なる場合、1つまたは複数のエントリが、OS1−OS2待ち行列上に存在する。
OS1は、メッセージが入手可能であると決定した場合、Dequeued_offsetの内容を使用して、そのメッセージをリトリーブして、次に、Dequeued_offsetを増分する。メッセージ・オフセット・ポインタを使用してメッセージをリトリーブして、それをローカル・ストーレッジ内に格納する。
送信するノードまたは送信するオペレーティング・システムは、前述のポーリング機構と同様の機構を使用して、エントリを適切な待ち行列に追加するのに先立って、待ち行列がいっぱいであるかどうかを決定することができる。つまり、受信側待ち行列内のDequeued_offsetが、送信するノードの出力待ち行列内の適切なEnqueued_offsetに比較される。Enqueued_offsetの内容が、Dequeued_offsetの内容と同じである場合、その待ち行列は、いっぱいになっており、その時点で何もメッセージを追加することができない。Enqueued_offsetおよびDequeued_offsetは、すべてのオペレーティング・システムが、他のすべてのオペレーティング・システムの待ち行列領域を読み取ることができるが、オペレーティング・システムは、それ独自の待ち行列領域のみを変更することができるという想定に適合する。
仮想メモリ・システム内では、コードおよび/またはデータ構造は、メイン・メモリから大容量ストーレッジに、そのメイン・メモリ内に追加の空間を作るというオペレーティング・システムの指示の下で、転送または「ページ送り」され得る。本発明の例としての実施形態では、ページ送りは、ローカル・メモリ領域内に記憶されているコードおよび/データに対して許されるが、共用メモリ160内に常駐するデータ構造に対しては許されない。この制約は、共用メモリ空間160を使用するオペレーティング・システムが、共用メモリ空間160内に記憶されているデータ構造の場所と内容について、前提を有することを可能にする。
例としての実施形態では、2200オペレーティング・システム・アプリケーションが、Intelベースのアプリケーション(例えば、Intelプラットフォーム上でWindows NTのために書かれたアプリケーション)と通信を行い、そこでは、唯一の実質的なオペレーティング・システムの関与は、共用メモリを管理すること(例えば、メッセージ待ち行列の初期設定を要求すること)だけである。この例としての実施形態では、2200オペレーティング・システムは、Intelノードのためにサービスを要求する、またはサービスを実行することをしない。代わりに、サービスは、アプリケーション間要求を介して実行される。関連分野の技術者は、2200オペレーティング・システムを、別法として、直接にIntelノードのサービスを要求するように変更するのが可能であることを理解されよう。
例としての実施形態では、グローバル共用メモリ機構は、2200オペレーティング・システム・アプリケーション・プログラムとNTアプリケーション・プログラムおよび/またはUnixアプリケーション・プログラムとの間で通信を行うことを可能にする。これは、MCPオペレーティング・プログラムの下で動作するアプリケーションとNTオペレーティング・システムおよび/またはUnixオペレーティングとの間での通信を円滑にするのにも使用することができ、またオペレーティング・システム間の通信のためにも使用することができる。同様に、これは、NTオペレーティング・システムの関連する異なるインスタンスの下で動作するアプリケーション間の通信を円滑にするのに、また、Unixオペレーティング・システムの関連する異なるインスタンスの下で動作するアプリケーション間の通信のために使用することができる。共用メモリ機構は、2200オペレーティング・システムとMCPオペレーティング・システムの間の通信を円滑にするのに使用することができる。
例としての実施形態では、共用メイン・メモリに書き込まれたメッセージは、通常、ASCII文字であるが、1バイト、2バイト、または4バイトの正の整数などの正の整数およびビット情報も含み得る。2200オペレーティング・システムは、36ビットワード上で動作して、ASCII文字を9ビット・バイト内の8ビットとして表す。Intelプラットフォームは、IA32アーキテクチャまたはIA64アーキテクチャを使用して、それぞれ、32ビット・ワードまたは64ビット・ワード上で動作して、ASCII文字を8ビット・バイト内の8ビットとして表す。したがって、共用メモリに書き込まれた、またはそこから読み取られたデータは、変換処理を受けなければならない。この変換は、2200オペレーティング・システム・ハードウェア命令によって実行され得る。2200型プロセッサは、ブロック転送圧縮(Block Transfer Pack)(BTP)命令を使用して、ASCIIデータを9ビットから8ビット・バイトに圧縮して、メイン・メモリの64ビットワード内の最上位の32ビットをゼロ充填する。
通常、Intelプラットフォーム上で動作するアプリケーションは、メッセージ・データが連続するバイト内に含まれることを予期する。2200オペレーティング・システムのブロック転送圧縮(BTP)命令は、メッセージ・データを共用メモリ内の連続するバイト内に入力しない(ワード内の4バイトが、通常、使用されない)ので、Intelプラットフォーム上で動作するデバイス・ドライバは、メッセージを処理できるようにするには、まず、そのメッセージ・データをローカル・メイン・メモリ内の連続するバイト内に移動しなければならない。同様に、2200型プロセッサは、メッセージを受信したとき、ブロック転送圧縮解除(Block Transfer Unpack)(BTU)命令を使用して、共用メイン・メモリからASCIIデータを圧縮解除して、それを関連するローカル・メモリ内に移動する。ブロック転送圧縮命令およびブロック転送圧縮解除命令は、また、ビッグ・エンディアン(big−endian)/リトル・エンディアン(little−endian)変換も実行する。2200―Intel間メッセージ、Intel−2200間メッセージ、およびIntel−Intel間メッセージに関する、共用メモリ414への、またそこからのデータ移動の例を下記に提供する。
好ましくは、グローバル共用メモリ通信機構は、システム上で動作するソフトウェアには、できる限りトランスペアレントにして、ソフトウェア変更が最小限に抑えられ、またシステムが、様々なオープン・システム規格とできる限り互換性を有するようにする。例えば、本発明の一態様によれば、システムは、あたかもワイヤによる通信が維持されているかのように、ソフトウェアの上層から現れるようにすることができる(下記のセクションIV.B.を参照)。例としての実施形態では、システムは、イーサネット・プロトコルを使用する。関連分野の技術者は、ATMプロトコルなどの他のプロトコルを使用できることを理解されよう。
NT/UNIXノードの場合、共用メモリ・インターフェースは、好ましくは、NICデバイス・ドライバ内で可視であり、このドライバは、オープン規格相互接続(OSI)通信モデルのLLC/MACレベルに存在する。LLC/MACは、OSIレベル2通信モデルの2つの副層である。LLCは、層2と層3の間のインターフェースであり得る。MACは、イーサネット、トークンリング、トークンバスなどの様々なLANを扱うIEEE副層である。
2200オペレーティング・システムでは、この可視性は、また、LLC/MACレベルでも起きる。この設計上の選択は、また、他のパーティションがワイヤによる通信を維持する一方で、いくつかのパーティションが共用メモリを介して通信するのを容易にもする。この2つのタイプの通信は、ソフトウェアの上層からは同一であると見られる。
イーサネット・プロトコルは、伝送当たり1500バイトの制限を課すので、大きなメッセージは、いくつかのセグメントに分割して、複数のメッセージ転送オペレーション中に転送しなければならない。
イーサネットは、1回の伝送でのデータの量に対して、1500バイトの制限を有する。したがって、イーサネット接続が、共用メモリで置き換えられた場合、1500バイトが、別のノードに対する出力のために待ち行列に入れられるバッファ内にどれだけのデータを入れることができるかに対する制限となる。すべての通信プロトコルの場合と同様に、任意サイズのメッセージを送信することができるが、それは、いくつかの別々の伝送(バッファ)で送信しなければならない可能性がある。
2200型プロセッサは、前述のブロック転送圧縮命令を使用して、メッセージ・データを共用メモリ内に転送することができる。
B.割込み主導共用メモリ通信(Interrupt Driven Shared Memory Communication)
割込み主導共用メモリ管理の実施を、代替実施形態として、次に説明する。これには、この代替実施形態により、どのように共用メモリ領域、または区域にアクセスし、またこれを管理するかの説明も含まれる。この実施形態では、共用メモリ・ウインドウの管理は、各パーティション上に常駐するコア・サービス・ソフトウェアとして実現されたプログラム・コードによって実行される。各パーティション上のコア・サービス・ソフトウェアは、アプリケーション・プログラム・インターフェース(API)を提供し、これは、そのパーティション内で動作するクライアントが呼び出して、ある共用メモリ・サービスを要求することができ、これは、例えば、別のパーティション上のクライアントとの、共用メモリ・ウインドウを介する通信などである。本明細書および請求項で使用する「クライアント」は、オペレーティング・システム、デバイス・ドライバ、アプリケーション・プログラム、または共用メモリ・ウインドウの使用を必要とする、パーティション上で動作する任意の他のソフトウェア・コードまたはプログラム・コードであり得る。また、本明細書および請求項で使用する「通信」という用語は、信号(後述する)、データの形式でのメッセージ(これは、共用メモリ・ウインドウ内で割り振られたバッファ内に記憶されることも、記憶されないこともあり得る)、または任意の目的で、パーティション間で通信される任意の他の形式の情報またはデータを意味することが可能である。ポーリング技法を使用して、通信がパーティション間で転送されるかどうかを決定する前の実施形態の場合とは異なり、この実施形態は、下記により十分に説明するとおり、プロセッサ間割込み機構を使用して、パーティション間の通信を行う。
前の実施形態の場合と同様に、この実施形態は、異なるオペレーティング・システム(例えば、Unisys MCP、Unisys OS2200、Windows NT、Unixなど)の制御下で動作するパーティション間、または同一オペレーティング・システムの異なるインスタンスの制御下で動作するパーティション間の通信を円滑にするのに使用することができる。
1.共用メモリ・レイアウト
図19は、この代替の実施形態による共用メモリ・ウインドウのレイアウトを図示している。示すとおり、制御構造1900は、共用メモリ・ウインドウのベースに常駐して、それに共用メモリ・ウインドウの残りの部分1916が続き、これは、別々のページに分割されている。本実施形態では、各ページは、4Kバイトを含む。ただし、このサイズは、他の実施形態では異なり得る。各ページは、使用中、使用可能、使用不可であり得る。後述のとおり、クライアントは、例えば、バッファを定義するために、共用メモリ・ウインドウの一部分がそれに割り振られることを要求することができ、コア・サービス・ソフトウェアが、必要な数のページを割り振って、その要求を満たす。
共用メモリ制御構造1900は、ヘッダ1910と、割り振り構造(Allocation structure)1912と、関連するヘッダ1914を有する複数のパーティション入力待ち行列とを含む。制御構造内の情報は、専用である。この情報への直接アクセスは、コア・サービス・ソフトウェアのクライアントには提供されない。代わりに、コア・サービス・ソフトウェアAPIは、クライアント関連情報をクライアントに、手続きパラメータを介して戻すコールを提供する。本実施形態では、制御構造内のワードは、64ビットを含み、そこでの上位32ビットは、異なるプロセッサ・アーキテクチャによって使用される異なるサイズのワードを考慮に入れて、0である。
2.空きページ・リスト
本実施形態では、使用可能な共用メモリ・ページ、すなわち既に使用中ではないものを追跡するために、使用可能ページは、各ページの第1ワード内のポインタを介してリンクされて、使用可能ページのリンク済みリストを形成する。使用可能ページのリンク済みリストは、本明細書では、空きページ・リストと呼ぶ。制御構造1900が、リンクされるリストの第1ページ(すなわち、空きページ・リストの始め)に対するポインタを提供する。
3.クライアント・ディレクトリ・テーブル
コア・サービス・ソフトウェアが、共用メモリ・ウインドウの1つまたは複数のページを割り振って、クライアント・ディレクトリ・テーブル(図示せず)を格納する。クライアント・ディレクトリ・テーブルは、共用メモリ・ウインドウを使用している各パーティション上のクライアントの登録である。より詳細には、本実施形態では、任意のパーティション上のコア・サービス・ソフトウェアの各クライアントが、コア・サービス・ソフトウェアにクライアント・グループのメンバとして登録しなければならない。同一パーティション上の2つのクライアントが、同一クライアント・グループのメンバであることはできない。コア・サービス・ソフトウェアの複数のクライアントが存在する場合、それぞれが、異なるクライアント・グループのメンバとして登録しなければならない。各クライアント・グループは、関連する名前(クライアント・グループ名)および識別子(クライアント・グループID)を有する。クライアント・ディレクトリ・テーブルは、クライアント・グループ名を指定する各クライアント・グループごとのエントリを含み、そのグループのメンバとして登録されたクライアントを有する各パーティションをリストする。クライアントが、コア・サービス・ソフトウェアに特定のクライアント・グループのメンバとして登録したとき、コア・サービス・ソフトウェアは、クライアント・グループIDをそのクライアントに戻す。このクライアント・グループIDは、後述のとおり、メッセージが、共用メモリ・ウインドウを介して渡されたとき、送信するクライアントおよび受信するクライアントを識別するのに使用する。
4.共用メモリ・ページ・タイプ
コア・サービス・ソフトウェアは、それ自体の使用ため、あるいは共用メモリのいくらかの部分を割り振るクライアント要求のために、共用メモリの1つまたは複数のページを割り振ることができる。本実施形態では、4つの異なるページ・タイプを定義する。
a.タイプ1メモリ・ページ
本実施形態のタイプ1メモリ・ページは、パーティション上のコア・サービス・ソフトウェアによる使用のためのみに割り振ることができる。クライアントがタイプ1ページの割り振りを要求するのを可能にするインターフェースは、存在しない。一例として、前述のクライアント・ディレクトリ・テーブルは、コア・サービス・ソフトウェアによって割り振られた1つまたは複数のタイプ1ページ内に記憶される。コア・サービス・ソフトウェアが、タイプ1メモリ・ページを割り振ったとき、コア・サービス・ヘッダが、そのページの始めに作成される。図32Aは、本実施形態による、タイプ1ページに対するコア・サービス・ヘッダの内容を図示している。
第1フィールド(パーティション所有権マスク)は、どのパーティションが、そのページに対するアクセス権を有するかの指示を格納するのに使用する。詳細には、パーティション所有権マスクは、コンピュータ・システム内でそれぞれの可能なパーティションごとに1ビットの、8ビットを含む。そのページに対する所有権を有する各パーティションは、その対応するビットをパーティション所有権マスクセット内に有することになる。クライアント・ディレクトリ・テーブルの場合、例えば、このテーブルにアクセスを要求する各パーティションは、このテーブルのすべてまたは一部を含んだ各ページ内で、パーティション所有権マスクのそのビットを有することになる。
本実施形態では、クライアントがタイプ1ページの割り振りを要求するのを可能にするインターフェースは存在しないが、クライアントがタイプ1ページを要求するのを可能にする、望まれ得るさらなる実施形態に対応すると、タイプ1ページ内のコア・サービス・ヘッダは、クライアント・グループIDフィールドをさらに含むことになる。このIDフィールドは、そのページに対する所有権を有するクライアントのクライアント・グループIDを保持するのに使用されることになる。ただし、本実施形態では、このフィールドは、使用しない。
DeallocationLockフィールドは、ページの所有権の変更を調整するのに使用する。このフィールドは、コア・サービス・ソフトウェアを介して実施される、本発明のより広いロック機構の一部であり、この機構は、異なるパーティションが、必要に応じて、共用メモリ・ウインドウの様々な構造、ページ、およびテーブルに対するアクセスを整合性のある方式でロックするのを可能にして、一度に1つのパーティションだけが、任意の構造、ページ、またはテーブルを変更できることを確実にする(すなわち、これらの構造に対するアクセスを同期化するため)。
DeallocationLockフィールド、ならびに後述する他のすべてのロック・フィールドは、ワード0およびワード1と呼ばれる、2つの64ビット・ワードから成る。ワード0は、ロック・ステータス・ワードを定義し、ワード1は、所有者ワードを定義する。ワード0の下位ビットは、「使用中」ビットを定義する。このビットを設定することは、ロック済みステータスを示す。ワード1は、ロックを獲得するパーティションのパーティションIDを格納するのに使用して、そのロックの所有者を判定できるようにする。
ほとんどのオペレーティング・システムおよびそれらがその上で動作するプロセッサは、オペレーティング・システムおよびこれらのオペレーティング・システムの下で動作するクライアントが、それによって任意のデータ構造に対するロックを獲得することができる方法を提供する。本明細書で使用するロック・フィールド形式は、例えば、Windows NT、UnixWare、およびUnisys MCPを含むいくつかのオペレーティング・システムと互換性がある。任意のパーティション上のコア・サービスは、そのパーティションのオペレーティング・システムおよびプロセッサ・アーキテクチャに対して調整されなければならない。
本発明のロック機構の重要な特徴によれば、タイプ1メモリ・ページが最初に割り振られたとき、割り振りを行うパーティションは、割り振り中にそのページに対するアクセスをロックするためにシステム・ワイド・ロック(system wide lock)(後述する割り振り構造のフィールド)を獲得しなければならない。ただし、1つまたは複数の割り振り済みページの所有権が、他のパーティションに拡張または移転されたとき、関与するページに対するロックだけを獲得すればよい。これらのページ内のDeallocationLockフィールドが、この目的で使用される。これは、パーティション間の通信のより大きなスループットを容易にする。というのは、システム・ワイド・ロックに対する競合が回避されるからである。
b.タイプ2メモリ・ページ
このタイプのメモリ・ページの割り振りは、例えば、メッセージ・データを別のパーティション上のクライアントに渡すためのバッファを定義するために、クライアントによって要求され得る。タイプ1ページの場合と同様に、タイプ2メモリ・ページが、任意のクライアントに割り振られたとき、コア・サービス・ヘッダが、そのページの始めに作成される。図32Bは、本実施形態による、タイプ2ページに対するコア・サービス・ヘッダの内容を図示している。
パーティション所有権マスク・フィールドおよびクライアント・グループIDフィールドは、タイプ1ページに対するヘッダ内の対応するフィールドと同一である。つまり、パーティション所有権マスクは、どのパーティションが、そのページに対する所有権を有し、クライアントIDフィールドは、そのページに対する所有権を有するクライアントのクライアント・グループIDを含む。そのページが最初に割り振られたとき、このフィールドは、その割り振りを要求したクライアントのクライアント・グループIDを含むことになる。
DeallocationLockフィールドは、タイプ1ページのヘッダ内の対応するフィールドと同様に、ページの所有権の変更を調整するのに使用する。ページの所有権の変更を実現しようとするどのパーティションも、まず、DeallocationLockフィールドを介して、そのページに対するロックを獲得しなければならない。
タイプ3ページカウントフィールドおよびタイプ3ページ参照フィールドは、本発明の追加の特徴に関連し、これにより、タイプ2メモリ・ページを割り振る要求の一環として、その割り振り要求でのバッファ・サイズを満たすために、ゼロまたは複数のタイプ3ページをタイプ2要求と関連して割り振ることができる。タイプ3ページ・カウント・フィールドは、タイプ2ページと関連するタイプ3メモリ・ページの総数を指定し、またタイプ3ページ参照フィールドは、関連するタイプ3ページへの参照(すなわち、ポインタ)を含むタイプ2ページ内の位置を指定する。
c.タイプ3メモリ・ページ
前述のとおり、このタイプのメモリ・ページは、タイプ2メモリ・ページと併せて使用する。タイプ3ページは、クライアント・データを含み、クライアント・グループによって所有されている。ただし、タイプ3ページは、明示的なクライアント・グループ情報を含まない。代わりに、タイプ3ページのクライアント・グループ所有権は、その関連するタイプ2メモリ・ページの所有権によって、そのタイプ2ページのコア・サービス・ヘッダのクライアント・グループIDフィールド内に指定されるとおり、管理されている。タイプ3ページの所有権は、その関連するタイプ2ページの所有権が変更されたときはいつでも、暗黙的に変更される。
d.タイプ4メモリ・ページ
このタイプのメモリ・ページは、1つまたは複数のパーティションによる静的所有権のためのものである。タイプ1、2、3メモリ・ページとは異なり、タイプ4メモリ・ページの所有権は、後述する割り振りテーブル内で指定される。したがって、タイプ4ページの所有権に対するすべての変更は、システム・ワイド・ロックの獲得を必要とする。
5.制御構造ヘッダ
図20は、本実施形態による制御構造ヘッダ1910の内容を図示している。バージョンIDフィールドは、コンピュータ上で動作しているコア・サービス・ソフトウェアの特定のリリース、つまりバージョンを識別する。共用メモリ・ステータス・フィールドは、共用メモリのステータス(例えば、「未初期設定」、「初期設定中」、「初期設定済み」、および「クリーンアップ」)を示す。マスタ・パーティションのパーティションIDフィールドは、どのパーティションが、共用メモリ・ウインドウの「マスタ(Master)」として指定されているかを識別する。マスタ・パーティションは、下記により十分に説明するとおり、共用メモリ・ウインドウを管理するための責任(responsibilities)を追加している。共用メモリパーティション・チェックイン間隔フィールドは、パーティションが、その時点で、あるステータス情報を更新して、他のパーティションにそれがアクティブであることを示すことが必要となる時間間隔を指定する。クライアント・ディレクトリ・テーブル・ヘッダ・フィールドは、クライアント・ディレクトリ・テーブルの始めに対するポインタ、および本発明のロック機構に従って、そのテーブルへのアクセスを調整するのに使用するロック・フィールドを含む。
制御構造ヘッダ1910は、コンピュータ・システム内のパーティションのそれぞれに関する情報で終了し、これは、そのパーティション上で動作しているオペレーティング・システムのタイプ(例えば、NT、UnixWare、MCPなど)、およびそのパーティションに対してプロセッサ間割込みを発行するのに必要な情報を含む。
6.割り振り構造
本実施形態によれば、共用メモリ・ページの管理は、割り振りテーブル(図示せず)を介して円滑になっている。共用メモリ・ウインドウ内の各割り振りページは、この割り振りテーブル内のエントリによって表されている。各エントリは、対応するページが、「使用中(in use)」、「使用可能(available)」であるかどうかを示し、あるいは使用不可であるメモリを参照し、また、ページ・タイプの指定も行い得る。タイプ4メモリ・ページの場合、エントリは、タイプ1メモリ・ページおよびタイプ2メモリ・ページのヘッダ内に見られるようなパーティション所有権マスクの形式で、どのパーティションが、そのページに所有権を有するかをさらに指定する。したがって、この点では、タイプ4ページの所有権は、タイプ1ページ、タイプ2ページ、およびタイプ3ページの場合(所有権情報が、ページ自体のコア・サービス・ヘッダ内に常駐する)とは異なる方式で維持される。割り振りテーブルは、クライアント・ディレクトリ・テーブルと同様に、それ自体、共用メモリ・ウインドウの1つまたは複数のページを占有する。
共用メモリ・ウインドウのベースにある割り振り構造1912は、割り振りテーブルおよび他の構造に関連するいくつかのパラメータを制御する。図21は、本発明の実施形態による割り振り構造の内容を図示している。ロック・フィールド(割り振りロック)が、割り振りテーブルに対するアクセスを制御するのに使用される。これは、前述したシステム・ワイド・ロック(タイプ1ページおよびタイプ2ページのヘッダ内の個々のページ・ロックに対比される)である。パーティションは、ページのどの初期割り振りについても、このロックを獲得しなければならない。このロックは、タイプ4ページの所有権のどの後続の変更にも要求されなければならない。というのは、タイプ4ページの所有権は、そのそれぞれの割り振りテーブル・エントリ内で維持されているからである。ただし、前述のとおり、タイプ1ページおよびタイプ2ページの所有権の後続の変更には、それらのページ自体のヘッダ内にある個々のページ・ロックだけを獲得すればよい。個々のページ(タイプ1および2)をロックできるこの機能は、パーティション間のより大きなスループットを容易にする。というのは、システム・ワイド・ロック(割り振りロック)に対する競合が除去されるからである。
共用メモリ領域フィールドの長さフィールドは、共用メモリ・ウインドウ内の割り振り可能ページの数を指定する。共用メモリ・ページ・ポインタ・フィールドは、割り振りページの始めに対するポインタを提供する。空きページ・リスト・ヘッダは、空きページ・リストの始めに対するポインタを提供し、また割り振りテーブル・ヘッダは、割り振りテーブルの始めに対するポインタを提供する。
7.信号(signal)
この実施形態での通信の基本単位は、信号である。本実施形態では、2つの主なカテゴリの信号が存在する。(1)パーティション間のコア・サービス間信号、および(2)パーティション間のクライアント間信号である。コア・サービス間信号は、異なるパーティション上で動作するコア・サービス・ソフトウェア間で送信されるものである。クライアント間信号は、異なるパーティション上のクライアント間で送信されるものである。各カテゴリの信号は、1つまたは複数の信号サブ・タイプを有する。各信号は、コア・サービス情報セクションおよびクライアント情報セクションを含む。これらのセクションのそれぞれは、いくつかのワードを含み、その定義は、そのタイプに依存する。
コア・サービス間信号サブ・タイプの場合、クライアント情報セクションは、定義されない。すべての情報は、コア・サービス情報セクションに含まれる。下記のコア・サービス間信号サブ・タイプが、本実施形態で定義される。
(1)メンバシップ変更信号:クライアントが、パーティション上のコア・サービス・ソフトウェアに登録または登録抹消したときはいつでも、コア・サービス・ソフトウェアは、同一クライアント・グループに登録しているクライアントを有する、それぞれの他のパーティション上のコア・サービス・ソフトウェアに、この信号を送信して、それらに、そのクライアントが登録する/登録抹消することを知らせなければならない。この信号のコア・サービス情報セクションは、クライアントがそこに登録する/そこから登録抹消するクライアント・グループのクライアント・グループIDを含むことになる。
(2)送信再開信号:この信号は、受信するパーティションによって、送信するパーティション上のコア・サービス・ソフトウェアに、それに対する信号送信を再開できることを警報するのに使用される(この信号の使用は、各入力待ち行列のオーバーフロー・フラグの説明に関連して、下記にさらに説明する)。
(3)You Have Been Marked Dead信号:この信号は、マスタ・パーティション上のコア・サービス・ソフトウェアによって、マスタが機能していないと決定したパーティションに送信される。
クライアント間信号サブ・タイプでは、コア・サービス情報セクションとクライアント情報セクションの両方が定義される。本実施形態では、下記のクライアント間信号サブ・タイプだけが定義されている。これは、信号送達信号である。下記にさらに詳細に説明するとおり、1つのパーティション上のクライアントが、別のパーティション上のクライアントに信号を送信する(また、多分、メッセージ・データのバッファを渡す)ことを望むとき、このクライアントは、コア・サービスAPIの信号送信インターフェースを呼び出す。これに応答して、コア・サービス・ソフトウェアは、信号送達信号を、クライアントがその上で動作しているパーティションに送信する。信号送達信号のコア・サービス情報セクションは、送信するクライアントおよび受信するクライアントのクライアント・グループIDを含み、また、例えば、受信するパーティションに向けられた共用メモリ・オブジェクトを含んだバッファを定義するため、クライアントに割り振られている共用メモリの1つまたは複数のページに対するハンドル(すなわち参照)も含み得る。共用メモリ・オブジェクトの例は、クライアント・メッセージ、クライアント・データストリーム、クライアント・イベント、およびコア・サービス・イベントである。クライアント情報セクションは、コア・サービス・ソフトウェアには不透明であるが、送信するクライアントおよび受信するクライアントにより、任意の所望の目的で使用され得る。例えば、クライアント情報セクションは、クライアント間の短いメッセージの通信を行うのに使用することが可能である。本実施形態では、クライアント情報セクションは、最大で5つのワードを含む。
8.入力待ち行列および入力待ち行列ヘッダ
入力待ち行列機構は、下記のプロセッサ間割込み機構と併せて、受信するパーティションにデータが入手可能であることを合図するのに使用する。各パーティションは、コンピュータ・システム内のそれぞれの他の可能なパーティションごとに、別々の入力待ち行列を有する。本発明では、各パーティションは、また、それ自体に対する入力待ち行列も有し、これは、例えば、パーティション上のコア・サービス・ソフトウェアが、同一パーティション上のクライアントに信号を送信する必要がある場合、使用される。したがって、コンピュータ・システムを最大で8つの別々のパーティションに分けて構成することのできる(すなわち、8つのサブPODのそれぞれが、別個のパーティションを定義する)本実施形態では、各パーティションは、8つの別々の入力待ち行列(他の7つのパーティションのそれぞれに1つ、およびそれ自体に1つ)を有し、合計では、64個の入力待ち行列になる。これらの入力待ち行列は、ヘッダとともに、共用メモリ制御構造1900の部分1914内に常駐する。信号は、1つのパーティション上のコア・サービス・ソフトウェアによって生成されて、別のパーティション上のコア・サービス・ソフトウェアに、それらの間の対応する入力待ち行列を介して送達される。
図29は、本実施形態による入力待ち行列ヘッダの内容を図示している。入力待ち行列ポインタ・フィールドは、実際の入力待ち行列の始めに対するポインタを保持する。入力待ち行列数フィールドは、入力待ち行列領域1914内の入力待ち行列の数(本実施形態では、64)を指定する。入力待ち行列長さフィールドは、各入力待ち行列の長さ(ワード数での)を指定する。本実施形態では、この長さは、2048ワードと指定されている。入力待ち行列信号サイズ・フィールドは、各信号の全体の長さ(コア・サービス情報セクション+クライアント情報セクション)を指定する。各信号の全体サイズは、同一であり、固定されている。最後に、入力待ち行列内信号数フィールドは、各入力待ち行列が一度に収容できる可能な信号の総数を指定する。
図30は、本実施形態による各入力待ち行列の内容を図示している。図示するとおり、各入力待ち行列は、その入力待ち号列に対するアクセスを、待ち行列内の情報を更新している間、ロックするのにコア・サービス・ソフトウェアによって使用されるロック・フィールド3010、その待ち行列内の現行の信号数を指定するカウント・フィールド3012、およびその待ち行列が容量に達しているが、空間が使用可能になり次第、すぐにその待ち行列に転送されるべき追加の信号が存在することを示すのに使用されるオーバーフロー・フラグ3014を有する。これらのフィールドには、その後に、固定数の信号(入力待ち行列ヘッダの入力待ち行列内信号数フィールドのなかで指定される、図29参照)のための空間3016が続く。
本実施形態では、64個の入力待ち行列が、制御構造1900の入力待ち行列領域1914内に連続してグループ化される。つまり、この構造内の最初の8つの入力待ち行列は、第1パーティションに属し、8つの入力待ち行列の後続グループは、他の7つのパーティションの後続のものに属する。
a.好ましいオペレーション
オペレーションでは、コア・サービス・ソフトウェアは、クライアントから、別のパーティションに信号を送信する要求を受けたときはいつでも、そのクライアントによって供給された情報に基づいて信号を作成して、その信号を、受信するパーティションに対する適切な入力待ち行列内の使用可能なエントリに入れようとする。使用可能なエントリがない場合には、入力待ち行列のオーバーフロー・フラグ3014を設定して、転送されるのを待っているが、入力待ち行列が一杯であるために、転送され得なかった信号が存在することを受信するパーティションに警報して、そのクライアントにエラーを戻す。そうした場合、受信するパーティションが、その後に入力待ち行列を空けたとき、オーバーフロー・フラグ3014をクリアして、送信再開信号を送信するパーティションに送り返し、この送信するパーティションに、そのクライアントによって発行されたどの後続の信号も、現時点で、受信するパーティションに対する通信のための入力待ち行列に対して送信できることを警報する。
受信側では、受信するパーティション上のコア・サービス・ソフトウェアは、送信するパーティションからプロセッサ間割込みを受信したとき、関連する入力待ち行列のそれぞれのなかのカウント・フィールドを検査して、どの入力待ち行列が入手可能な信号を有するかを決定する。コア・サービス・ソフトウェアは、入手可能な信号を有する入力待ち行列を見つけたとき、それらをその排他メモリ・ウインドウ内のローカル処理バッファに転送して、入力待ち行列内のカウントをリセットする。所与の入力行列から抽出された各受信信号は、次に、適切なクライアントに(その信号内のクライアント・グループIDに基づいて)、すべてのクライアントが、それを実装することを要求されている信号受信コールバック・インターフェースを介して渡される。
b.代替オペレーション
代替の実施形態では、送信要求に応答して、様々な入力待ち行列内にクライアント信号をより効率的に移動させるために、各パーティション上のコア・サービス・ソフトウェアは、それぞれの可能な宛先パーティションごとに、その排他メモリ・ウインドウ内にパーティション送信待ち行列(すなわち、バッファ)(図示せず)をセットアップする。この代替実施形態では、パーティション上のコア・サービス・ソフトウェアは、入力待ち行列にそれが追加の信号を入れることを妨げるいっぱいの入力待ち行列に遭遇したときはいつでも、オーバーフロー・フラグをその入力待ち行列内に設定して、次に、その待ち行列内でエントリが再び使用可能になるまで、それらの信号要求を適切なローカル送信待ち行列内に入れる。
さらに、受信側では、各パーティション上のコア・サービス・ソフトウェアは、ローカル・クライアント信号タンク待ち行列をその排他メモリ・ウインドウ内に、コア・サービス・ソフトウェアに対して自ら識別を明らかにしたクライアントごとに1つ、セットアップする。受信するパーティションの所与の入力待ち行列から抽出した各受信信号は、指定受信するクライアント(やはり、その信号内のクライアント・グループIDに基づく)に対応するクライアント信号タンク(tank)待ち行列に転送される。タンク待ち行列内の各信号は、最終的に、指定受信するクライアントに、クライアントの信号受信インターフェースへのコールを介して渡される。
この代替実施形態でのローカル送信待ち行列およびタンク待ち行列は、前述のオーバーフロー・フラグの使用と併せて、コア・サービス・ソフトウェアのクライアントのすべてに、共用メモリ・リソースの効率的で平等な使用を提供することを目的としている。各クライアントの信号は、ローカル方式で待ち行列に入れられるので、共用メモリ・ウインドウ内の入力待ち行列は、通信のために効率的な方式で空けておかれる。入力待ち行列が容量に達したとき、失われる信号がなく、また、入力待ち行列が迅速に空けられて、信号が所与の送信待ち行列内で待つ時間を最小限に抑える。
9.プロセッサ間割込み機構
前述のとおり、プロセッサ間割込み機構は、信号がその入力待ち行列のうちの1つのなかに、送信するパーティションによって入れられたことを受信するパーティションに警報するのに使用する。詳細には、本実施形態では、各パーティションは、すべての他のパーティションがそれにプロセス間割込みを送信するのにそれを使用する、単一割込みベクトルを確立する。送信するパーティションが、信号を所与の受信するパーティションに対する入力待ち行列内に入れて、これが入力待ち行列を空状態(カウント=0)から空ではない状態(カウント>0)に移行させるときはいつでも、送信するパーティション上のコア・サービス・ソフトウェアは、受信するパーティションのプロセッサのうちの1つに対するプロセッサ間割込みを生成する。受信するパーティションのプロセッサは、そのパーティション上のコア・サービス・ソフトウェアの割込みサービス・ルーチン(図示せず)を呼び出すことによって、この割込みに応答する。各パーティションは、他のパーティションからの割込みの受信に対して、単一の割込みベクトルだけを割り当てるので、受信するパーティション上のコア・サービス・ソフトウェアは、どの他のパーティションが、プロセッサ割込みを発行したか分からない。したがって、受信するパーティション上のコア・サービス・ソフトウェアは、それらの待ち行列のうちのどれかで入手可能な信号がないかどうか決定するために、その入力待ち行列のそれぞれのなかのカウント・フィールド3012を検査しなければならない。
入力待ち行列が入手可能な信号を有する場合、コア・サービス・ソフトウェアは、それらの信号を受信するパーティションの排他メモリ・ウインドウ内のローカル処理バッファに転送して、その入力待ち行列内のカウント・フィールド3012をリセットする。特定の入力待ち行列のオーバーフロー・フラグ3014もまた、設定されている場合、コア・サービス・ソフトウェアは、オーバーフロー・フラグをリセットして、前述のとおり、送信再開信号を送信するパーティションに送り返す。次に、コア・サービス・ソフトウェアは、ローカル処理バッファを走査して、各受信信号を抽出し、その信号内のクライアント・グループIDから宛先クライアントを判定して、次にその信号をその宛先クライアントに、そのクライアントの信号受信コールバック・インターフェースを介して送達する。次に、コア・サービスは、やはり入手可能な信号を有する(すなわち、カウント>0)それぞれの他の入力待ち行列に対して、これらのステップを繰り返す。
a.例としてのIntel/Windows NT実施形態
プロセッサレベルおよびオペレーティング・システム・レベルでは、プロセッサ間割込み機構は、プロセッサとオペレーティング・システムの両方に依存する。一例として、以下は、Intel Pentiumファミリーのマイクロプロセッサを使用し、Microsoft Windows NTオペレーティング・システムを実行するパーティションの場合に、本実施形態により、どのようにプロセッサ間割込みが生成され、使用されるかの説明である。
本実施形態により、Microsoft Windows NTオペレーティング・システムのハードウェア抽象化層(HAL)を変更して、任意のパーティション上でのHALの初期設定中、HALが、そのパーティションによる共用メモリ・プロセッサ間割込みの受信に対して、まず、プロセッサ間割込みベクトルを選択するようにする。割込みベクトルは、Windows NTオペレーティング・システムのHALによって着信割込みハードウェア信号に割り当てられた数である。例えば、割込みベクトルは、通常、HALにより、システム上の様々なデバイスI/Oハードウェア割込み信号に割り当てられる。プロセッサ間割込みは、1つのプロセッサから別のプロセッサに(I/Oデバイスからプロセッサに、に対比して)送信される特別タイプのハードウェア割込み信号である。一般のI/O割込みの場合と同様に、HALも、すべてのプロセッサ間割込み信号にベクトルを割り当てなければならない(I/O割込みベクトルが選択されているのと同じ数空間から)。したがって、本実施形態では、変更したHALが、そのパーティション上のローカル・コア・サービス・ソフトウェアによって受信されるプロセッサ間割込みに対して、割込みベクトルを割り当てて、その入力待ち行列のうちの少なくとも1つのなかで、1つまたは複数の信号が入手可能であることをこのソフトウェアに警報する。
Intelマイクロプロセッサの場合、プロセッサ間割込みは、実際には、このプロセッサと関連する高機能プログラム済み割込みコントローラ(APIC)によって生成され、受信される。送信するプロセッサに関連するAPICが、受信するプロセッサに関連するAPICに対するハードウェア信号を生成する。複数のプロセッサが割込みを受信することになる場合には、送信するプロセッサのAPICは、それぞれの指定受信側のAPICに対して、ハードウェア信号を生成する。各受信するプロセッサのAPICは、このハードウェア信号を受信して、対応する割込みベクトルを処理のためにプロセッサに送達する。
さらに、本実施形態によれば、他のパーティションからのプロセッサ間割込みの受信に対して割込みベクトルを割り当てることに加えて、変更したHALは、そうした割込みを処理する、そのパーティション内の1つまたは複数のプロセッサを指定する。本実施形態では、複数のサブPODを含むパーティションの場合、指定されるプロセッサは、それらのサブPODのうちの単一のもののメンバでなければならない(これは、コンピュータ・システム・プラットフォームの本実施形態によって課された制限であり、他の実施形態での制限ではない可能性がある)。サブPOD上の複数のプロセッサが指定されたとき、着信割込みは、それらのプロセッサのそれぞれのローカルAPICで受信されることになる。次に、これらのAPICが、調停して、プロセッサのうちのどれがその割込みを処理するかを決定する。この調停処理に関するさらなる詳細は、Intel Corporationから入手可能なPentium Pro Family Developer′s Guide:Volume3で提供されている。APICに関する追加の情報は、やはりIntelから入手可能なIntel MultiProcessor Specification,version1.4で見ることができる。
さらに、本実施形態によれば、コア・サービス・ソフトウェアがパーティション上で初期設定されたとき、コア・サービス・ソフトウェアは、カスタム・インターフェースを介して、そのパーティション上のNTオペレーティング・システムのHALを照会して、割込みベクトル、およびそのパーティションに着信する共用メモリ・プロセッサ間割込みを処理するために、HALによって指定されたプロセッサに関する情報を得る。次に、コア・サービス・ソフトウェアは、この情報を制御構造ヘッダ1910のパーティション情報セクション内に格納する(図20を参照)。これは、その情報を他のパーティション上のコア・サービス・ソフトウェアにアクセス可能にする。次に、コア・サービス・ソフトウェアは、HALに、別のインターフェースを介して、コア・サービス・ソフトウェアの一部である割込みサービス・ルーチンに対する参照を供給する。そのパーティション上の指定されたプロセッサは、指定された割込みベクトルを有するプロセッサ間割込みを受信した場合、その割込みサービス・ルーチンを実行して、コア・サービス・ソフトウェアがその割込みに応答することができるようにする。
オペレーションでは、プロセッサ間割込みを生成して、信号がその入力待ち行列のうちの1つに入れられたことを受信するパーティションに通知するため、送信するパーティション上のコア・サービス・ソフトウェアが、制御構造ヘッダ1910内で、指定受信するパーティションのプロセッサ間割込み情報をルックアップする。次に、コア・サービス・ソフトウェアは、そのパーティション上のHALに対する別のカスタム・インターフェースを呼び出して、HALに受信するパーティションに関するプロセッサ間割込み情報を供給する。この情報を使用して、送信するパーティション上のHALは、そのプロセッサのうちの1つのAPIC上の登録を操作して、プロセッサ間割込み信号が、そのAPICから、そうしたプロセッサ間割込みを受信する受信するパーティション上の、HALによって指定された各プロセッサのAPICに対して生成されるようにする。次に、受信するパーティション上のこれらのAPICが、その割込みを処理するように調停して、この調停に勝ったプロセッサが、受信するパーティション上のコア・サービス・ソフトウェアの割込みサービス・ルーチンを呼び出すことになる。
b.代替実施形態−複数の割込みベクトル
前述の実施形態では、各パーティションには、他のパーティションのうちのどれかからの共用メモリ・プロセッサ間割込みの受信に対して、単一の割込みベクトルが割り当てられる。このため、受信するパーティションは、他のどのパーティションが受信した割込みを生成したのか分からない。したがって、受信するパーティションは、その入力待ち行列のそれぞれを順番に検査して、その割込みを生成した送信するパーティションから信号を受信することを確実にしなければならない。
代替実施形態として、各パーティションは、それぞれの他のパーティションからの共用メモリ・プロセッサ間割込みの受信に対して、別々の割込みベクトルを割り当てる。次に、送信するパーティションが、受信するパーティションによってそれに割り当てられた対応する割込みベクトルを使用して、受信するパーティションに対するプロセッサ間割込みを生成することになる。この実施形態の利点は、受信するパーティションが、他のパーティションが生成した割込みベクトルから、着信割込みを知ることである。次に、受信するパーティション上のコア・サービス・ソフトウェアは、適切な入力待ち行列にアクセスして、前述の実施形態のように入力待ち行列のすべてを巡回することなく、着信信号をリトリーブすることが可能である。
10.コア・サービスAPI
前述の機能性をコア・サービス・ソフトウェアのクライアントに提供するため、コア・サービス・ソフトウェアは、クライアントが、コア・サービス・ソフトウェアのサービスを起動するために呼び出すことのできるインターフェース(すなわち、呼び出し可能なメソッド)を提供する定義済みアプリケーション・プログラミング・インターフェース(API)を有する。下記は、前述の機能を実行するためにコア・サービスAPIの一部として提供されるインターフェースのリストである。
クライアント・ソフトウェア初期設定: このインターフェースはコア・サービス・ソフトウェアにそれ自体を識別するためにクライアントによって使用される。コア・サービス・ソフトウェアはクライアント・リファレンス識別子をクライアントに返す。
クライアント・ソフトウェア未初期設定: このインターフェースは、それが共用メモリのユーザーとしてもはや参加していないことをコア・サービス・ソフトウェアに知らせるために、クライアントによって使用される。
クライアント登録: このインターフェースは、コア・サービス・ソフトウェアに任意のクライアント・グループのメンバとして登録するために、クライアントによって使用される。各クライアントは、共用メモリがそれに割り振られることを要求できるようになるには、登録しなければならない。クライアントは、所望のクライアント・グループ名およびそのクライアント参照識別子をそのコールの一部として供給する。次に、コア・サービス・ソフトウェアが、その所望のクライアント・グループへのこのクライアントの追加を反映するように、クライアント・ディレクトリ・テーブルに適切な変更を加えることになる。次に、インターフェースが、クライアントIDをそのクライアントに戻す。
クライアント登録抹消: このインターフェースは、特定のクライアント・グループから登録抹消するために、クライアントによって使用される。
共用メモリ割り振り: このインターフェースは、共用メモリ・ウインドウの1つまたは複数のページの割り振りを要求するために、クライアントによって使用される。クライアントは、そのクライアントID、および要求しているバッファ・サイズ(バイト数での)供給する。コア・サービス・ソフトウェアは、割り振りテーブルをロックし、その要求を満たす十分なページが空きページ・リスト内で入手可能であるかどうかを決定して、次に、それらのページを空きページ・リストから除去する。各割り振り済みページに対する割り振りページエントリは、それらのページが「使用中(in use)」であることを反映するように更新される。タイプ1ページおよびタイプ2ページの場合、コア・サービス・ヘッダが、ページ内に作成されて、これは、前述のとおり、パーティションおよびクライアントによるそのページの所有権を示す。タイプ2ページに関連するどのタイプ3ページも、タイプ2ページのヘッダ内で参照付けられる。タイプ4ページの場合、パーティション所有権は、対応する割り振りテーブル・エントリ内に反映される。次に、コア・サービス・ソフトウェアが、ハンドルをクライアントに戻し、これをクライアントが、後で、割り振り済みバッファを含むページを参照するのに使用する。
共用メモリ割り振り解除: このインターフェースは、任意のハンドルに関連するすべてのページが割り振り解除されることを要求するために、クライアントによって使用される。その要求するパーティションが、割り振り解除されるべきページの唯一の所有者である場合には、そのページは、空きページ・リストに戻される(これを行うためには、システム・ワイド・ロックを獲得しなければならない)。そうではない場合には、所有権情報のみが(タイプ1ページまたはタイプ2ページのコア・サービス・ヘッダ内、またはタイプ4ページに対する割り振りテーブル・エントリ内で)更新される。
信号(signal)送信: これは、受信するパーティションの入力待ち行列内に信号を挿入させるために、クライアントが使用するインターフェースである。このインターフェースを呼び出すクライアントは、(i)受信するクライアントおよびそれがそのメンバであるクライアント・グループのクライアント・グループIDと、(ii)どのパーティションが、信号を受信することになるクライアントを有するかの指示(任意のパーティション上の1つのクライアントのみが、特定クライアント・グループのメンバであり得るため、この指示およびクライアント・グループIDだけが、各パーティション上の受信するクライアントを識別するのに必要な一片の情報である)と、(iii)クライアント情報セクション内で、信号と共に供給される実際の情報と、(iv)これがポイント間信号、またはマルチキャスト信号のいずれであるかを示すフラグ(ポイント間は、1つだけの受信するパーティションを有し、他方、マルチキャストは、複数の受信するパーティションを有する)と、(v)クライアント・メッセージを含んだバッファ(1つまたは複数の共用メモリ・ページ)などの、共用メモリ・オブジェクトに対するオプションのハンドルを提供する。信号送信コールに応答して、コア・サービス・ソフトウェアは、(i)信号のコア・サービス情報セクションおよびクライアント情報セクションを作成し、(ii)共用メモリのステータスを検査し、(iii)信号を適切な入力待ち行列に挿入して、その信号が空の待ち行列に入れられた場合、(iv)受信するパーティション上でプロセッサ間割込みを生成する。指定受信するパーティションの入力待ち行列がいっぱいである場合、または指定受信するパーティションがダウンしている場合、適切なエラー指示が戻されることになる。
11.クライアントによって供給されるインターフェース
コア・サービス・ソフトウェアによって供給される前述のインターフェースに加えて、コア・サービス・ソフトウェアの任意のクライアントは、クライアントにあるイベントを通知するためにコア・サービス・ソフトウェアが起動することのできるいくつかのコールバック・インターフェースを実装しなければならない。本実施形態では、こられのコールバック・インターフェースは、(i)信号が受信されたことをクライアントに通知するためのインターフェース(「信号受信インターフェース」)と、(ii)そのクライアント・グループ内でメンバシップ変更があったことをクライアントに通知するためのインターフェースと、(iii)共用メモリが、「アップ」または「ダウン」であることをクライアントに通知するためのインターフェースと、(iv)コア・サービス・ソフトウェアがシャットダウンしていることをクライアントに通知するためのインターフェースと、(v)1つまたは複数の共用メモリ・ページがメモリエラーを有することをクライアントに通知するためのインターフェースとを含む。
12.例としてのオペレーション
前述の割込み主導共用メモリ機構のオペレーションをさらに例示するため、図31Aおよび31Bが、2つのパーティション上のクライアントおよびコア・サービス・ソフトウェアによって、一方のクライアントから他方のクライアントにメッセージを通信するために実行されるステップを図示する流れ図を含んでいる。
図31Aは、送信するパーティションに対して実行されるステップを図示している。ステップ3110で、クライアントが、コア・サービスAPIの共用メモリ割り振りインターフェースを呼び出し、メッセージを受信するパーティション上のクライアントに転送するのに使用することになるバッファを要求する。この例では、クライアントは、タイプ2ページが割り振られることを要求する。クライアントは、その要求とともに必要なバッファ・サイズを提供する。これに応答して、ステップ3112で、コア・サービス・ソフトウェアが、要求されたバッファを満たすのに必要となる共用メモリ・ページの数(すなわち、タイプ2ページとともに、追加のタイプ3ページを割り振るかどうか)を決定する。ステップ3114で、コア・サービス・ソフトウェアが、(i)システムワイド割り振りロックを獲得し、(ii)空きページ・リストから、必要な数のページが入手可能であるかどうかを決定し、入手可能であると想定して、(iii)それらのページをクライアントに割り振る。コア・サービス・ソフトウェアは、割り振りテーブルを更新して、それらのページが「使用中(in use)」であることを示し、次に、それらのページの所有権をタイプ2ページのコア・サービス・ヘッダ内で示す。ステップ3116で、コア・サービス・ソフトウェアが、割り振り済みページに対するハンドルをクライアントに戻して、割り振りロックを解放する。
次に、ステップ3118で、クライアントが、割り振られたバッファをメッセージ・データで埋める。次に、ステップ3120で、クライアントが、コア・サービスAPIの信号送信インターフェースを呼び出して、(i)クライアント・グループIDおよび受信するパーティション(これらが一緒に、受信するクライアントを識別する)と、(ii)信号のクライアント情報セクション内で提供すべき任意の情報と、(iii)割り振り済みバッファに対するハンドルと、(iv)これが、マルチキャスト要求ではなく、ポイント間要求であることを示すフラグと提供する。前述の内容から、クライアントは、本発明のマルチキャスト機能を使用して、複数のパーティションに信号を送信するオプションを有することを想起されたい。
信号送信要求に応答して、ステップ3122で、コア・サービス・ソフトウェアが、指定された受信するパーティションに基づいて適切な入力待ち行列を識別する。次に、コア・サービス・ソフトウェアは、その入力待ち行列をロックして(ステップ3124)、カウント・フィールドを増分し(ステップ3126)、入力待ち行列内に信号をその待ち行列内のエントリとして作成する(ステップ3128)。次に、その入力待ち行列が、その前に空であった(すなわち、カウントが、ゼロから1になった)場合には(ステップ3130)、コア・サービス・ソフトウェアが、受信するパーティション上でプロセッサ間割込みを生成する(ステップ3123)。入力待ち行列のカウント・フィールドが、既に非ゼロの場合、コア・サービス・ソフトウェアは、割込みを生成する必要がない。次に、コア・サービス・ソフトウェアは、入力待ち行列に対するロックを解放する(ステップ3131またはステップ3133)。
次に、図31Bを参照すると、受信するパーティション上で実行されるステップが示されている。ステップ3134で、そのパーティションの事前指定されたサブPOD上のAPICのうちの1つが、そのプロセッサのために調停し、またそれに送信するパーティションによって生成されたプロセッサ間割込みを送達する。これに応答して、プロセッサは、コア・サービス・ソフトウェアの割込みサービス・ルーチン(図示せず)を呼び出す。割込みサービス・ルーチンの一環として、コア・サービス・ソフトウェアは、ステップ3136で、その入力待ち行列のうちの最初のものを検査し始める(本実施形態では、各パーティションごとに8つの入力待ち行列が存在する)。ステップ3138で、コア・サービス・ソフトウェアが、その入力待ち行列のカウント・フィールドを検査する。そのカウントがゼロであった場合には、その入力待ち行列に対応する送信するパーティションから送信された信号は存在せず、コア・サービス・ソフトウェアは、次の入力待ち行列に進む。
ただし、所与の入力待ち行列のカウントがゼロよりも大きい場合には、信号が存在し、制御は、ステップ3140に移る。ステップ3140で、コア・サービス・ソフトウェアはが、入力待ち行列内の各信号をローカル処理バッファにコピーして、次に、ステップ3142で、カウントをゼロにリセットする。次に、ステップ3143で、コア・サービス・ソフトウェアが、入力待ち行列内にオーバーフロー・フラグが設定されているかどうかを決定する。オーバーフロー・フラグが設定されている場合、コア・サービス・ソフトウェアは、そのオーバーフロー・フラグをリセットして、次に、送信再開信号を送信するパーティションに送信し、これにより、入力待ち行列がもはやいっぱいではないことを送信するパーティションに警報する。
次に、ステップ3144および3146が、ローカル処理バッファ内にコピーされた各信号に対して実行される。詳細には、ステップ3144で、コア・サービス・ソフトウェアが、信号をローカル処理バッファから抽出する。ステップ3146で、コア・サービス・ソフトウェアが、受信するクライアント(信号内のクライアント・グループIDによって識別された)の信号受信インターフェースを呼び出して、クライアント情報セクションおよびその信号に関連する割り振り済みバッファ(それが存在すれば)に対するハンドルを渡す。ステップ3148で、クライアントが、例えば、ハンドルを使用して、参照付けされたバッファ内のメッセージ・データにアクセスすることも含めて、信号を処理する。ステップ3144および3146は、ローカル処理バッファ内の各信号ごとに繰り返す。これが終了したとき、コア・サービス・ソフトウェアが、ステップ3136ないし3146を、その他の入力待ち行列のそれぞれに対して繰り返す。本実施形態では、図31Bに図示していないが、受信するパーティション上のコア・サービス・ソフトウェアは、待ち信号を全く見つけることなく(すなわち、カウント>0を有するもの無く)、入力待ち行列のすべてを完全にパススルーするまで、その入力待ち行列のなかを巡回し続ける。次に、入力待ち行列処理は、別のプロセッサ間割込みが受信されるまで停止する。
送信処理および受信処理の追加の態様(図示せず)は、割り振り済み共用メモリ・ページの割り振り解除である。送信するクライアントが、バッファ(すなわち、1つまたは複数の共用メモリ・ページ)の割り振りを要求し、そのハンドルを受信するパーティションに信号を介して渡すことによって、そのバッファを受信するパーティションに転送するとき、送信するパーティションは、(i)そのバッファのページに対する所有権を受信するクライアントに拡張する(この場合、両方のクライアントが所有権を有することになる)か、あるいは(ii)所有権を受信するパーティションに移転する(この場合、送信するクライアントは、所有権を放棄する)かのオプションを有する。どちらのオプションを選択するかにかかわらず、なんらかの時点で、クライアントは、割り振り済みページの割り振り解除を所望することがあり得る。これは、共用メモリ割り振り解除インターフェースを使用して行われる。詳細には、クライアントが、共用メモリ割り振り解除インターフェースを呼び出して、割り振り解除すべきページに対するハンドルを渡す。それらのページの所有者である他のクライアントが存在しない場合には、それらのページは、空きページ・リストに戻されて、その対応する割り振りテーブル・エントリが、それらの可用性を反映するように更新される。ただし、他のクライアントもそれらのページに対する所有権を有する場合には、これらのページは、まだ、空きページ・リストに戻すことができない。代わりに、コア・サービス・ソフトウェアが、それらのページをロック・ダウン(lock down)して、タイプ2ページのコア・サービス・ヘッダ内の所有者情報を更新する。
13.他の機能
前述の内容に加えて、割込み主導共用メモリ管理機構の下記の追加機能が提供される。
a.初期設定およびシャットダウン
コア・サービス・ソフトウェアは、パーティション上で動作を開始したとき、まず、共用メモリ・ウインドウの可用性およびステータスを確認して、次に、適切なプラットフォームのインターフェースを起動して、下記の情報を得る。それは、共用メモリの物理アドレスおよびサイズ、パーティション識別子(各パーティションは、関連する識別子を有する)、そのパーティションに対するプロセッサ間割込みを生成するのに、他のパーティションによって必要とされる情報、およびそのパーティション上で動作しているオペレーティング・システムのタイプおよびバージョンである。コア・サービス・ソフトウェアは、コピーをそのパーティションの排他メモリ・ウインドウ内、ならびに例えば、制御構造ヘッダ1910のパーティション情報フィールドおよび割り振り構造1912の共用メモリ領域の長さフィールドなどの、共用メモリ制御構造1900の様々なフィールド内に、この情報のコピーを格納する。
共用メモリ・ウインドウにアクセスして、これを使用する上で、あるパーティションが他のパーティションに加わるためには、そのパーティションは、共用メモリ・ウインドウを使用して、それ自体を他のパーティションに認知させなければならない。現行のマスタ・パーティションが存在しない場合には、それらは、それら自体のなかで調停を行って、マスタ・パーティションを選択しなければならない。この目的で、コア・サービスは、「チェック・イン」機構を有する。この「チェック・イン」機構は、ロックを使用することなく、各パーティションが、制御構造ヘッダ内の共用メモリ・ステータス・フィールドの妥当性を決定して、アクティブなマスタが存在しないとき、新しいマスタを動的に選択することができるようにする。
パーティションが自主的に共用メモリ・ウインドウを離れるときはいつでも、共用メモリをクリーンな方式でエグジット(exit)するのも、コア・サービス・ソフトウェアの責任である。このことは、マスタ・パーティションと非マスタ・パーティションの両方に該当する。どの離れていく(leave)パーティションにも共通の責任は、(i)適切なクライアント・コールバック・インターフェースを呼び出すことによって、共用メモリ・ウインドウが消え去ることをそのローカル・クライアントに通知すること、(ii)それがロックしたどのデータ構造もロック解除すること(例えば、割り振りテーブル、入力待ち行列など)、(iii)その入力待ち行列をクリーンアップすること、(iv)それが所有するどの共用メモリ・ページも割り振り解除すること、(v)それが所有するどのローカル・メモリも戻すこと、および(vi)制御構造ヘッダ1910内でのそのステータスを「未初期設定」に変更することである。
離れていくパーティション(departing partition)が、マスタ・パーティションであり、他に活動しているパーティションが存在しない場合には、それは、共用メモリ・ウインドウをシャットダウンして、通知がMIPに送信される。離れていくパーティション(departing partition)が、マスタ・パーティションであり、共用メモリ・ウインドウとまだ通信中である少なくとも1つの他のパーティションが存在する場合には、新しいマスタ・パーティションが、その残っているアクティブなパーティションによって選択される。
b.マスタ・パーティション責務
マスタ・パーティションは、共用メモリが初期設定されたとき、非マスタ・パーティションが活動を止めたとき、および共用メモリがシャットダウンしたとき、特定の責任を有する。下記の責務が、マスタ・パーティションのために予約されている。
(1)制御構造ヘッダ、割り振り構造、割り振りテーブル、空きページ・リスト、入力待ち行列ヘッダ、入力待ち行列、クライアント・ディレクトリ・テーブル・ヘッダ、およびクライアント・ディレクトリ・テーブルを含む共用メモリ構造を初期設定することと、
(2)パーティションが活動を止めたとき、共用メモリ構造および使用中の共用メモリ・ページに対して、ハウスクリーニング・オペレーションを実行することと、
(3)共用メモリがシャットダウンしたとき、共用メモリ構造に対してハウスクリーニング・オペレーションを実行する、
ことである。
c.非マスタ・パーティションの責務
マスタ・パーティションを含むすべてのパーティションは、下記の責務を有する。
(1)所定の共用メモリパーティション・チェックイン間隔で他のパーティションのステータスを監視することと、
(2)新しいマスタ・パーティションを選択する必要があるかを決定することと、
(3)共用メモリ構造内の適切な領域を更新して、共用メモリ・ウインドウを離れることを選択した場合には、所有しているどの共用メモリ・ページも割り振り解除することと、
(4)クライアントが、共用メモリ・ウインドウへの参加から離脱した場合、またはクライアントに障害が起きた場合、そのクライアントによって所有されるどの共用メモリ・ページも割り振り解除する
ことである。
本明細書で説明するとおり、この代替実施形態の割込み主導共用メモリ通信機構を実施するプログラム・コードは、オペレーティング・システム・コード(例えば、HALに対する変更)と別個のコンピュータ・プログラム(例えば、コア・サービス・ソフトウェア)の両方の組み合わせとして実装される。ただし、他の実施形態では、このプログラム・コードは、添付の請求項によって定義される本発明の趣旨および範囲を逸脱することなく、完全にオペレーティング・システム・コードとしてか、あるいは完全に別個のコンピュータ・プログラムとして実装することが可能である。さらに、プログラム・コードは、ハード・ワイヤド回路で、またはハード・ワイヤド回路およびソフトウェア・コードの組み合わせで実装することもできる。前述のとおり、「プログラム・コード」という用語は、すべてのそうした可能性を包括するものとする。
IV.パーティション間の通信を円滑にする本発明のコンピュータ・システムおよび方法の例としての使用
オペレーティング・システム間および/またはそのオペレーティング・システムの下で動作するアプリケーション間の通信を円滑にするための、前述のコンピュータ・システムの例としての使用を、その共用メモリ管理機能も含めて、下記に説明する。これらの使用の例としての実施形態は、下記に、例示の目的で説明するものであり、制限するためにではない。代替実施形態(本明細書に記載する実施形態の等価形態、拡張形態、変形形態、逸脱形態などを含め)は、本明細書に含まれる教示に基づき、関連分野の技術者には明白となる。本発明は、そうした代替実施形態を含むことを意図し、それに適合している。
A.共用メモリ・デバイス・ドライバ
下記の共用メモリネットワーク・ドライバ・インターフェース仕様(NDIS)デバイス・ドライバを実装して、標準市販アプリケーションが、前述の複数パーティション・システム上で動作できるようにすることが可能である。共用メモリNDISデバイス・ドライバは、例えば、類似のLAN構成上でよりも高速な帯域通過および短い待ち時間を有するネットワーク機能インターフェースおよび/またはクラスタ化インターフェースを提供する。この共用メモリNDISデバイス・ドライバは、セクションIII.B.で前述した割込み主導共用メモリ管理機構のコア・サービス・ソフトウェアの上に構築され、またそれを利用する。
図18は、例としての共用メモリNDISデバイス・ドライバ1802を図示している。斜線のないボックスは、標準Windows NT構成要素を表している。斜線を引いたボックスは、本発明の一環として実装され得る構成要素を表している。
共用メモリNDISデバイス・ドライバ1802は、上端(upper-edge)インターフェースおよび下端(lower-edge)インターフェースをサポートする。上端インターフェース上で、共用メモリNDISドライバ1802は、標準ネットワーク・プロトコル・ドライバに対する標準NDISインターフェースをサポートする。共用メモリNDISデバイス・ドライバ1802は、NDIS階層化ドライバとして機能する。より詳細には、共用メモリNDISデバイス・ドライバ1802は、NDISミニポート・インターフェースに適合して、NDISインターフェースを使用してNDISデバイス・ドライバを介して通信を行う任意のネットワーク・プロトコルをサポートする。例えば、TCP/IPプロトコルおよびSPX/IPXプロトコルを実施することができる。
共用メモリNDISデバイス・ドライバ1802のための下端インターフェースは、セクションIII.B.に記載したコア・サービス・ソフトウェアに対する専用インターフェースであり、これは、グローバル共用メモリ機能を直接にサポートする。このインターフェースは、通常の階層化IOドライバ・インターフェース(IRP)と密結合IOドライバ・インターフェース(直接手続きコール)の混成を含む。IRPは、非同期機能のために使用する。密結合IOドライバ・インターフェースは、同期機能のために使用する。
共用メモリNDISデバイス・ドライバ1802の主要な機能は、NDISインターフェースをコア・サービスAPI上にマップすることである。ネットワーキング・パケット(NDISパケット)を含んだローカル・システム・バッファが、NDISインターフェースを介して、共用メモリNDISデバイス・ドライバ1802に渡される。共用メモリNDISデバイス・ドライバ1802が、ネットワーク・パケットをローカル・システム・バッファ(パーティション排他メモリ・ウインドウ内の)から共用メモリ・バッファにコピーする。共用メモリ・バッファに対する参照が、ネットワーク・パケット内の宛先MACアドレスによって選択された別のパーティション内の適切な共用メモリNDISデバイス・ドライバに対する待ち行列に入れられる。同報通信またはマルチキャストのMACアドレスを有するパケットが、共用メモリNDISデバイス・ドライバ1820の共用メモリグループ内のデバイス・ドライバをサポートする各パーティションに対して直接に送信を行うのに、必要とされるだけの共用メモリ・バッファにコピーされ、これにより、同報通信/マルチキャストをシミュレートする。共用メモリから受信したバッファは、NDISパケットに再び圧縮され、NDISインターフェースに提供されて、そこでそれらは、ネットワーク・プロトコル・ドライバによって処理される。このNDISパケットは、共用メモリNDISデバイス・ドライバ1802に戻される。
共用メモリNDISデバイス・ドライバ1802は、SendListと呼ばれる各パーティションごとの共用メモリ・バッファのリストを維持して、コア・サービス・ソフトウェアを介して共用メモリ・バッファを割り振ることと割り振り解除することのオーバーヘッドを抑える。共用メモリ・バッファは、ネットワーク・パケット情報を別のパーティションに送信するために、SendListから選択される。受信するパーティションは、発信パーティションSendListに対応するハンドルのRevListを有することになる。受信するパーティションは、メッセージ処理を終了したとき、バッファがSendList内で使用可能状態に戻されるべきであることを示すメッセージを送信する。SendList内のバッファの数が、最小値よりも低下したとき、追加のバッファが、コア・サービス・ソフトウェアから割り振られる。SendList内のバッファの数が最大で、すべてが使用されていないとき、バッファは、割り振り解除されて、コア・サービス・ソフトウェアに戻される。最小SendListサイズおよび最大SendListサイズは、コード内で所定のデフォルト値を有するが、これらは、登録内の特定キーを設定することによってオーバーライドされ得る。
共用メモリNDISデバイス・ドライバ1802は、そのパーティション1804上でコア・サービス・ソフトウェアを使用して、共用メモリNDISデバイス・ドライバ1802のコピーを実行しているすべてのパーティション間のFDDI LANをシミュレートする。共用メモリNDISデバイス・ドライバ1802は、FDDI LANの基本セマンティックスをサポートする。これはポイント間メッセージ交換、同報通信メッセージ交換、マルチキャスト・メッセージ交換、および4491バイトメッセージのサイズを含む。
B.ワイヤによる通信の外観を維持すること
コンピュータ・システムの別の例としての適用形態およびそのグローバル共用メモリ管理では、パーティション間(すなわち、Pod、サブPod、またはオペレーティング・システム)でのメモリの共用が、ワイヤによる通信の外観を維持しながら達せられる。これは、従来のアプリケーション・プログラム、従来のアプリケーション・プログラム・インターフェース(API)、ならびに従来の通信ハードウェアおよびソフトウェアを使用して、データを共用メモリに送信することを可能にする。この適用形態は、セクションIII.A.で記載した機構の上に構築され、そこでは、パーティション間通信は、ポーリング技法に従って管理される。
図22は、本発明のコンピュータ・システム200の例としての構成であり、これは、パーティション間またはオペレーティング・システム間でのワイヤによる通信の外観を得るのに必要な追加のソフトウェア構成要素を含む。図22では、2つのパーティション2202aおよび2202nが示され、そのそれぞれは、例えば、単一のサブPodを含んでいる。各サブPod2202は、別個のオペレーティング・システム2206の制御下で動作する。オペレーティング・システム2206は、同一オペレーティング・システムの別々のインスタンスであり得る、またはそれらは、異なるオペレーティング・システムであり得る。1つまたは複数のアプリケーション・プログラム2208が、各パーティション2202上で、そのパーティション上で動作するオペレーティング・システム2206の下で動作することができる。
1つまたは複数のアプリケーション・プログラム・インターフェース(API)モジュール2210が、メッセージを送信するために、1つまたは複数のアプリケーション・プログラム2208に関連付けられていることが可能である。例えば、サブPod2202a上で、アプリケーション・プログラム2208aは、API2208aを使用して、メッセージ送信オペレーションを開始することができる。API2208aは、ネットワーク通信インターフェース・モジュール2212に対する入力のためにメッセージを準備する。
ネットワーク・インターフェース通信インターフェース2212は、ネットワークを介するなどして、パーティション間で互いにインターフェースを取る従来のシステムであり得る。ネットワーク・インターフェース通信モジュール2212は、ネットワーク・ドライバ2216を介して従来のネットワーク型ワイヤ2214上で、他のパーティション2202に転送するため、メッセージをフォーマットする。例としての実施形態では、ネットワーク・インターフェース通信モジュール2212は、メッセージを、あたかもそれらが従来のネットワーク型ワイヤ転送システム2214に向かうかのように、回線2220aおよび2220b上に出力する。したがって、この時点まで、パーティション2202aからのメッセージの送信は、従来方式で実行される。
すべてのメッセージを回線2220aおよび2220b上で、ネットワーク通信インターフェース・モジュール2212から従来のネットワーク・ドライバ2216に送信する代わりに、共用メモリ160に向けられたメッセージは、共用メモリ・ドライバ2218を介して処理される。例としての実施形態では、宛先アドレスが、各メッセージに関連付けられている。アドレスが、ワイヤ2214に結合されたコンピュータまたは他の宛先に対応する場合には、メッセージは、ネットワーク・ドライバ2216を介してワイヤ2214に送信される。しかし、そのアドレスが共用メモリ160内のアドレスに対応する場合、そのメッセージは、共用メモリ・ドライバ2218にダイレクトされる。
共用メモリ・ドライバ2218は、共用メモリ160への転送およびそこへの記憶のために、メッセージを受信して、再フォーマットする。再フォーマットは、例えば、他のパーティション2202上で動作するアプリケーション・プログラム2208によって認識され得る標準形式にメッセージを再フォーマットすることを含み得る。再フォーマットは、また、例えば、共用メモリ160に関連する仕様に従った再フォーマットも含み得る。
図23を参照すると、システム2200のさらなる詳細が図示されている。この例としての実施形態では、パーティション2202a上のオペレーティング・システム2206aは、Unisys Corporationから市販される2200オペレーティング・システムとして図示され、またパーティション2202n上のオペレーティング・システム2206nは、Windows NTまたはUNIXオペレーティング・システムとして図示されている。
図23の例としての実施形態では、ネットワーク通信インターフェース・モジュール2212が、オープン・システム相互接続(OSI)7層通信モデルの従来のトランスポート層(すなわち、層4)を実施する1つまたは複数のソフトウェア・モジュール2310を含む。OSI7層通信モデルは、関連分野の技術者にはよく知られている。このトランスポート層は、いくつかの異なるプロトコルを使用して実施することが可能であり、これは、伝送制御プロトコル(TCP)およびユーザー・データグラム・プロトコル(User Datagram Protocol - UDP)を含む。選択されたプロトコルは、その後の通信オペレーション中の信頼性および重複の可能性を決定することになる。例としての実施形態では、TCPを利用して、確実な重複のないデータ送達を提供することができる。
トランスポート層2310を実施するソフトウェア・モジュールは、7層OSIプロトコルの層3であるネットワーク層2312を実施するソフトウェア・モジュールとインターフェースを取る。これは、例えば、業界承認のインターネット・プロトコル(IP)およびインターネット制御メッセージ・プロトコル(ICMP)を使用して実行することができる。IPは、データ転送のために使用されるプロトコルを指定する。ICMPは、エラーの処理と分析が実行される方式を定義する。
層3 2312を実施するソフトウェア・モジュールは、通信ハンドラ2314とインターフェースを取る。通信ハンドラ2314は、メッセージ・データをパケットにフォーマットする。フォーマットは、いくつかの通信プロトコルのうちの選択されたものに準拠することが可能である。これらのプロトコルは、例えば、イーサネット、トークンリング、ファイバ分散データ・インターフェース(FDDI)、非同期転送モード(ATM)などを含み得る。例としての実施形態では、イーサネット・プロトコルを実施するイーサネット・ハンドラが使用される。
ローカル・メモリ内でメッセージがフォーマットされた後、通信ハンドラ2314が、デバイス・ドライバを呼び出す。「通常の(normal)」通信シナリオの最中、I/Oドライバが呼び出されて、ネットワークを介して通信を実行する。例としての実施形態では、これは、Unisys Corporationから市販されるネットワーク入力/出力デバイス・ドライバ(NIOP)2316である。NIOP2316は、OSIモデルの層2および1を実施し、これらは、それぞれ、このモデルのデータリンクおよび物理層である。
通信が、ネットワークを介してではなく、共用メモリ160を介して実行されるとき、共用メモリ・ドライバ2218が呼び出される。例えば、パーティション2202a上で、通信が、ネットワークを介してではなく、共用メモリ160を介して実行されるとき、通信ハンドラ2314が、NIOPドライバ2316の代わりに、HMP共用メモリ・ドライバ2318を呼び出すことができる。通信ハンドラ2314は、NIOPドライバ2316に対するコールとHMP共用メモリ・ドライバ2318に対するコールを区別する必要がない。通信ハンドラ2314の視点からは、すべてのメッセージは、ネットワークを介して転送される。オペレーティング・システムが、下記にさらに説明するとおり、これら2つのタイプのコールのうち、どちらを行うかを決定する。HMP共用メモリ・ドライバ内に含まれる機能性を下記に説明する。
パーティション2202a上の2200オペレーティング・システム・ソフトウェア・モジュール内に含まれる機能性は、パーティション2202nのNTまたはUnixのオペレーティング・システム内に常駐する同様のモジュール内に含まれる。図23で、これらのモジュールは、API2210n(Winsock/Socketとして示される)およびネットワーク通信インターフェース・モジュール2212(TCP/UDP/IPS2310n、IP/ICMP2312n、およびイーサネット・ハンドラ2314nとして示される)を含み得る。メモリ160との通信は、HMP共用メモリNICデバイス・ドライバ2320を介する。2200オペレーティング・システム・ソフトウェア・モジュールの場合と同様に、APIおよび通信ソフトウェアを含むアプリケーション・プログラムにインターフェースを取るソフトウェアの層は、ネットワーク通信または共用メモリ通信の間で区別をしない。これらのソフトウェア構成要素は、すべての通信オペレーションが、ネットワークを介して行われているものと見なす。
図24は、本発明の例としての実施形態による、Windows NT環境内に実装されたHMP共用メモリ・ドライバ2320のさらなる詳細を提供する。図24では、NTユーザー・アプリケーション2410が、動的リンク・ライブラリ2412に対するインターフェースを取る。動的リンク・ライブラリ2412は、Windows Socket2414とインターフェースを取る。Windows Socket2414は、NTシステムのためのMicrosoft定義のAPIであるトランスポート・ドライバ・インターフェース(TDI)2416とインターフェースを取る。API2416は、OSI通信モデルの層3および4を実行するTCP/IPモジュール2418に対してインターフェースを取る。TCP/IPモジュール2418は、Microsoftおよび3Com Corporationsによって開発されたネットワーク・ドライバ・インターフェース仕様(NDIS)に従って設計されたAPI2420を介して、デバイス・ドライバとインターフェースを取ることができる。デバイス・ドライバは、例えば、イーサネット・ネットワークを介してメッセージ伝送を実行するCOSTイーサネット・デバイス・ドライバ2422などの市販のドライバであり得る、またはHMP共用メモリNICデバイス・ドライバ2320であり得る。API2420がデバイス・ドライバにコールを行うとき、API2420は、2つのタイプのコールの間で区別を行わず、すべての通信は、ネットワークを介して実行されているように見える。
HMP共用メモリNICデバイス・ドライバ2320は、例えば、VLAN2424モジュール、CONTROL2426モジュール、SHM2428モジュール、およびBIOS2430モジュールを含み得る。これらのモジュールの動作および機能性を下記に説明する。
図25は、本発明による図22〜24に図示したソフトウェア構成要素の動作のさらなる詳細を図示する処理の流れ図である。このプロセスは、ステップ2510で開始し、そこで、アプリケーション・プログラムが、メッセージおよび関連するヘッダ情報をローカル・メモリ内に作成する。
ステップ2511で、アプリケーション・プログラムが、関連するAPIを呼び出す。プログラムは、APIに、メッセージの長さ、目標ホストのIPアドレス、およびメッセージ・データに対する1つまたは複数のポインタを渡す。メッセージがネットワークを介して渡される場合、IPアドレスは、NIOP(2200オペレーティング・システム側の)またはイーサネットLAN NICデバイス・ドライバ(NT側またはUNIX側の)などのデバイス・ドライバを指定する。メッセージが共用メモリを介して渡される場合、IPアドレスは、関連するHMP共用メモリ・ドライバが使用されるべきことを示す。
ステップ2512で、OSIモデルの層3および4を実行するソフトウェア・モジュールが、様々なヘッダをメッセージに追加して、選択された通信プロトコルの要件に適合するようにメッセージ・データをフォーマットする。例えば、イーサネット・プロトコルは、単一のメッセージ伝送が1500バイトより多くを含み得ないことを必要とする。したがって、より長いメッセージは、複数のメッセージ伝送を介して送信されるように、複数のバッファにフォーマットしなければならない。
ステップ2514で、通信ハンドラ(これは、例としての実施形態では、イーサネット・ハンドラである)が、デバイス・ドライバのアドレスを求めて、オペレーティング・システム(OS)に対してコールを行う。関連分野の技術者は、例えば、より大きなネットワーク・データ・パケット・サイズを有するプロトコルを含め、他のプロトコルを使用するのが可能であることを理解されよう。
一般的に、通信ハンドラは、伝送のため、いかなるアプリケーション・メッセージも受信される前に、デバイス・ドライバに接続することになる。通信ハンドラは、それ自体の「同報通信(broadcast)」メッセージをネットワーク介して発信して、皆がその識別で応答するように求める。これは、結果として、TCP/IPの場合、IPアドレスが戻されることになる。このようにして、通信ハンドラは、どのIPアドレスにアクセスできるかを知る。
ステップ2516で、オペレーティング・システムが、その特定のIPアドレスに関連するデバイス・ドライバア・ドレスを選択して、そのアドレスを通信ハンドラに渡す。例としての実施形態では、オペレーティング・システムは、IPアドレスを様々なデバイス・ドライバにマップするテーブルを維持する。デバイス・ドライバア・ドレスは、ネットワーク通信を実行するデバイス・ドライバ(NIOPドライバまたはイーサネットLAN NICドライバなどの)を指定することができる。別法では、デバイス・ドライバは、共用メモリを介して通信を実行するデバイス・ドライバを指定することができる。通信ハンドラは、2つのタイプのアドレスの間で区別を行うことができない。共用メモリのための2200オペレーティング・システム・デバイス・ドライバは、Unisysに譲渡された米国特許第5659794号に記載されるとおり、2200オペレーティング・システムNIOPから適合することができる。
ステップ2518〜2528では、通信が共用メモリを介して実行されるべきことをアドレスが示すとき、HMP共用メモリ・ドライバ(2200オペレーティング・システム)2318またはHMP共用メモリNICデバイス・ドライバ(NT/UNIX)2320が呼び出される。呼び出されたドライバは、まず、目標ホストIDをノードのうちの1にマップする。これは、送信するノードの出力待ち行列内にある待ち行列のうちのどれが利用されるかを決定する。
ステップ2518で、目標(受信)システムのための待ち行列がリセットを必要とするかどうかを呼び出されたドライバが決定する。目標システムのための待ち行列がリセットを必要とする場合、処理は、ステップ2526に進み、そこで、送信するシステム(または送信する「ノード」)が、メッセージを廃棄して、目標システム(または目標「ノード」)のための待ち行列内にNeed_Resetフラグを設定する。Need_Resetフラグが設定されたとき、リセット手続きを実行することができる。
UDPではなくTCPプロトコルを使用する場合、メッセージは、メッセージの損失なしに廃棄することができる。これは、メッセージが受信されたことを示す受信するシステムからの肯定応答をTCPが待つためである。これは、メッセージIDを使用して追跡される。各メッセージは、関連する肯定応答が受信されるまで、送信するシステムのローカル・ストーレッジ内に保持される。肯定応答が所定の期間内に受信されなかった場合、そのメッセージを再送信するように、別のコールがオペレーティング・システムに対して行われる。TCPではなくUDPを利用する場合、メッセージは、失われる。というのは、UDPは、受信するシステムからの肯定応答の受信を追跡しないからである。
通常、送信するアプリケーションが、UDPを使用するか、またはTCPを使用するかを決定する。この決定は、共用メモリにはトランスペアレントである。例としての実施形態では、本発明の共用メモリは、共用メモリを扱うデバイス・ドライバと接続するUDPプロトコル、TCPプロトコル、およびより高い層のプロトコルをサポートする。通信ハンドラの視点からは、本発明の共用メモリは、余り多くのノードが接続されていない、単にもう1つのLANに過ぎない。
目標待ち行列がリセットを必要としない場合、処理は、ステップ2520に進み、そこで、送信するシステムは、目標待ち行列がいっぱいであるかをチェックして決定する。例としての実施形態では、これは、適切なEnqueued_offset(送信するノードの出力待ち行列内の)内に記憶されている値を関連するDequeued_offset(受信するノードの入力待ち行列内の)に比較することによって行われる。新しいエントリを目標出力待ち行列内に入れることが、Enqueued_offsetをDequeued_offsetに等しくする場合には、目標出力待ち行列はいっぱいである。
目標出力待ち行列がいっぱいであるとき、処理は、ステップ2528に進み、そこで、メッセージが廃棄される。メッセージは、ステップ2518および2526に関連して前述したとおり、後に再送信することができる。
目標出力待ち行列がいっぱいではないとき、処理は、ステップ2522に進み、そこで、共用メモリ内のメッセージ・バッファが、送信するノードのメッセージ・バッファ・プールから得られる。関連分野の技術者は、これは様々な方式で実施するのが可能なことを理解されよう。例としての実施形態では、メモリ管理モジュールは、空のバッファを追跡するために、各ノード上の共用メモリ・デバイス・ドライバに関連付けられている。
好ましくは、各出力待ち行列ごとに、例えば、少なくとも511バッファを含んだバッファ・プールが利用可能となる。各バッファは、例えば、427個の8バイト・ワードの長さであり得る。例としての実施形態では、各バッファ・プールは、各ワードが8バイト長である4Kワードページ境界で開始する。つまり、新しいバッファ・プールは、各4Kバイトページ境界ごとに開始することが可能である。これは、より効率的なメモリ管理を可能にする。
例えば、各バッファ・プールは、5114278//4096=1748992ワード長であり、ここで、511は、待ち行列エントリの数であり、427は、1500バイト長のメッセージを扱うのに必要なワード数および2200オペレーティング・システム要件を扱うのに必要なエクストラ・ヘッダである。1500を4で割ると375に等しく、これに50個の最大部分およびバッファ長およびヘッダ長として2を足して、合計427になる。8は、パーティションの最大数であり、4096は、保護の理由でページ境界まで切り上げるためのものである。
バッファを得た後、処理は、ステップ2524に進み、そこで、ローカル・メモリから共用メモリ・バッファにコピーすることによって、メッセージが出力待ち行列に入れられる。この処理中、ヘッダが生成されて、これが、OSIモデルの物理層、層1で定義されるヘッダとして機能する。
共用メモリ・バッファ内のヘッダは、物理層と見なすことができる。というのは、MAC層およびLLC層は、共用メモリ・デバイス・ドライバによって受信されたとき、メッセージ上にあるからである。これらのヘッダは、少なくともLLC層が、受信するノードで行われ得る経路指定のために必要なため、残ることになる。バッファ内のヘッダは、2200型プロセッサおよびIntelプラットフォームの異なるメモリ・アクセス特性のために必要であり、物理層でデータがどのようであるかを表す。
2200オペレーティング・システムが、メッセージ送信オペレーションを実行しているとき、ブロック転送圧縮(BTP)ハードウェア命令が、メッセージ・データをローカルから共用メモリに移動するのに使用される。この命令は、メッセージ・データを9ビット・バイトから8ビット・バイトに変換して、ゼロ充填オペレーションおよびビッグ・エンディアン(2200型プロセッサ)−リトル・エンディアン(Intel)変換を実行する。別法として、この変換は、ソフトウェア内で実行することが可能である。
例としての実施形態では、メッセージ・バッファに対するポインタを出力待ち行列内の適切な位置に追加して、次に、適切なEnqueued_offsetを送信するノードの出力待ち行列で増分することによって、メッセージが出力待ち行列に追加される。このポインタは、送信するノードのバッファ領域の始めからのオフセットである。好ましくは、すべてのノードが共用メモリ内の同一アドレスに達し得るように、実アドレスまたは仮想アドレスではなく、オフセットを使用する。(受信するノードの仮想アドレスまたは実アドレスは、必ずしも、別のノードの仮想アドレスまたは実アドレスとして同一ロケーションにマップされない。)
図23および24に関して前述したとおり、2200オペレーティング・システム・ノードがメッセージを送信しているとき、デバイス・ドライバア・ドレスを求めて、オペレーティング・システムに対してコールが行われる。2200オペレーティング・システムは、IPアドレスを使用して、通信オペレーション中にNIOPデバイス・ドライバが利用されるべきか、またはHMP共用メモリ・ドライバが利用されるべきかを判断する。NTノードがメッセージを送信している場合、同様の機能性が提供される。VLAN構成要素が、NDISからメッセージ送信コールを受信する。VLANは、このコールをCONTROLに渡して、これが、そのメッセージ送信オペレーションに関連するIPアドレスをイーサネット・デバイス・ドライバにマップするか、またはSHMデバイス・ドライバにマップするかを決定して、適切なデバイスコールを行う。SHMモジュールが、ステップ2518〜2528で図示される機能性を実行する。
メッセージを受信するために、システム内の各ノードは、システム内の各ノードごとの出力待ち行列を検査するループを実行する。例としての実施形態では、各ノードは、より少ないノードが利用可能な場合でさえ、あたかもシステムが最大数の8つのノードで完全に構成されているかのように、この検査を実行する。利用可能ではないノードの出力待ち行列は、入手可能なメッセージが存在しないように見えるように、初期設定することができる。各ノードは、それ自体の出力待ち行列を検査して、それがそれ自体にメッセージを送信しているかを、それが一般的には発生しないにしても、決定する。これらは、コードを単純化するために実施することが可能な設計判断である。
別法では、利用可能なノードの数および識別は、実際に存在するノードの出力待ち行列だけが検査されるように、システム初期設定中に、各ノードに対して通信され得る。この実施形態では、共用メモリに参加するノード数の各変更が、その変更が発生したときに、参加ノードに通信される。
図26は、各パーティションごとに実行される例としてのメッセージ受信処理を図示している。この処理は、ステップ2610で開始し、そこで、メッセージ受信ノードが、別のサブPodの出力待ち行列内のNeed_Resetフラグを検査する。例えば、ノード0が、ノード1出力待ち行列内のノード1−ノード0間待ち行列内のNeed_Resetフラグを検査する。Need_Resetフラグが設定されている場合、処理は、ステップ2612に進み、そこで、初期設定シーケンスが実行される。
Need_Resetフラグが設定されていない場合、処理は、ステップ2614に進み、そこでメッセージ受信するサブPodが、適切なEnqueued_offsetフラグをそれ自体の出力待ち行列内のそれ自体のDequeued_offsetフラグと比較する。例えば、図16Aおよび16Bでは、ノード0が、ノード1出力待ち行列内のノード1−ノード0間待ち行列内のEnqueued_offsetフラグをそれ自体の出力待ち行列(Dequeued_offsetのワード1)内のノード1に対するDequeued_offsetに比較する。その2つのフィールド内に記憶されている値が等しい場合、その待ち行列は空であり、処理は、ステップ2624に進み、そこでルーチンをエグジット(終了)する。
メッセージが入手可能である場合、処理は、ステップ2616に進み、そこで利用可能なバッファが、ローカル・メモリ内で得られる。共用メモリ・ドライバのためのバッファ・プールは、下記に説明するとおり、通信ハンドラと協力して、オペレーティング・システムによって維持され得る。バッファが利用可能でない場合、待ちループ2617を実行することができる。ステップ2618で、バッファが得られて、共用メモリに対するポインタをリトリーブするのに、待ち行列に入れるオフセットとしてDequeued_offsetを使用する。このポインタは、好ましくは、送信するサブPodのバッファ・プールの始めからのオフセットである。このポインタを使用して、共用メモリ内の送信するサブPodのメッセージ・バッファのうちの1つから、メッセージ・データをリトリーブする。
ステップ2620で、メッセージ・データが、ローカル・バッファにコピーされる。2200オペレーティング・システムからメッセージを受信するNT/UNIXサブPod上で、短縮処理を実行することができ、これは、メッセージバイトをワードのすべてのビット(例えば、64ビット)を使用する連続するロケーションに移動する。これは、2200オペレーティング・システムのメッセージ・データが、ワードの最下位4バイトのみを占有し、残りがゼロ充填されているため、好ましい。2200オペレーティング・システム側では、メッセージ・データは、ハードウェア・ブロック転送圧縮解除(BTU)命令を使用して、共用メモリからコピーすることができ、この命令は、メッセージ・データを8ビット・バイトから9ビット・バイトに変換して、リトル・エンディアン(Intel)−ビッグ・エンディアン(2200型プロセッサ)変換を実行する。この変換は、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせで実行することができる。
別法では、メッセージは、共用メモリ内に2200型プロセッサ形式で格納することができ、これにより、メッセージ受信するIntelプラットフォームが、ビッグ・エンディアンとリトル・エンディアンの間で変換を行って、2200型プロセッサによって必要とされるエキストラ・ビットを追加/除去することになる。
メッセージ・データがローカル・バッファにコピーされた後、処理は、ステップ2622に進み、そこで、共用メモリ・ドライバが、メッセージをローカル・メモリ待ち行列に追加する。共用メモリ・ドライバは、次に、受信処理(例えば、アプリケーション2208)が、メッセージを処理するのに使用可能であることを知る検査をする。2200オペレーティング・システム側では、共用メモリ・ドライバが、Unisys Corporationによって開発された協調処理通信プログラム(co-operative processing communications program - CPCOMM)が「スリープ(sleeping)」状態であることをフラグが示しているかを知る検査をする。CPCOMMは、メッセージが送信されたときに、通信プロトコル層を扱う。CPCOMMがスリープ状態にある場合、共用メモリ・ドライバは、新しく待ち行列に入れたメッセージでCPCOMMを起こすために、オペレーティング・システムに対してコールを行う。別法では、メッセージがローカル・メモリ内で入手可能かを決定するために、ポーリングを利用することが可能である。
図27は、受信メッセージを処理する2200オペレーティング・システム側でのCPCOMMのための例としての処理を図示している。送信するメッセージの場合と同様に、CPCOMMは、受信メッセージが、共用メモリを介して転送されたことを知らない。CPCOMMの視点からは、メッセージは、ネットワークを介して送信/受信される。
CPCOMMは、割込みが2200オペレーティング・システムから受信されたとき、「スリープ」状態にあることが可能である。この割込みは、メッセージがCPCOMMのローカル・メッセージ待ち行列に入れられたことを示す共用メモリ・ドライバからのコールをオペレーティング・システムが受信したことの結果である。CPCOMMに割込みがあったとき、それは、処理ループ2708に入る。この処理は、ステップ2710で開始し、そこでバッファが、ローカル・メモリ内で獲得される。ステップ2712で、CPCOMMが、2200オペレーティング・システムを呼び出して、バッファ・アドレスを渡す。2200オペレーティング・システムは、そのバッファを、必要に応じて、デバイス・ドライバのうちの1つに関連するバッファ・プールのうちの1つに入れる。共用メモリ・デバイス・ドライバは、これらのバッファ・プールのうちの1つに関連付けられている。これらのプール内のバッファが、次に、受信メッセージ・データに対して使用可能である。
バッファ・アドレスがオペレーティング・システムに渡された後、処理は、ステップ2714に進み、そこで、メッセージがその入力待ち行列で入手可能であるかをCPCOMMが知る検査をする。CPCOMMが、オペレーティング・システムから割り込まれたと想定すると、メッセージは、入手可能である。
ステップ2716で、メッセージが入手可能であるとき、CPCOMMが、そのメッセージをその待ち行列から待ち行列解除して、それをコードの上層に渡す。処理は、次に、ステップ2710に戻り、そこでCPCOMMが、別のバッファを獲得する。
ステップ2714で、CPCOMMが、他に入手可能なメッセージがないと分かった場合、処理は、ステップ2718に進み、そこで、十分な空のバッファが、様々なデバイス・ドライバによる使用のために利用可能であるかどうかをCPCOMMが決定する。十分なバッファが利用可能である場合、処理は、ステップ2720に進み、そこで、CPCOMMは再び、スリープ状態に入る。
V.結論
本発明の実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせで実施できることを理解されたい。そうした実施形態では、様々な構成要素およびステップをハードウェア、ファームウェア、および/またはソフトウェアに実装して、本発明の機能を実行することができる。現在、入手可能である、または将来開発されるコンピュータ・ソフトウェア言語および/またはハードウェア構成要素を本発明のそうした実施形態で使用することができる。詳細には、前記に、また下記の添付に議論し、提供する疑似コードが、そのソフトウェア実施形態を作成するために特に役立つ。
本発明は、その好ましい実施形態に関連して示し、説明してきたが、本発明の趣旨および範囲を逸脱することなく、そこで様々な形態および詳細の変更を加え得ることが、当分野の技術者によって理解されよう。
Figure 2006216068
Figure 2006216068
Figure 2006216068
Figure 2006216068
Figure 2006216068
Figure 2006216068
Figure 2006216068
Figure 2006216068
Figure 2006216068
Figure 2006216068
本発明の好ましい一実施形態を実施するのに適した一環境のブロック図である。 本発明の好ましい一実施形態によるコンピュータ・システムのブロック図である。 排他メモリ・ウインドウと2つの共用ウインドウへのアクセス権とをそれぞれが有する4つのパーティションを伴った一例におけるメモリの図である。 排他メモリ・ウインドウをそれぞれが有する2つのパーティションを伴った一例におけるメモリの図である。 排他メモリ・ウインドウと1つの共用ウインドウへのアクセス権とをそれぞれが有する3つのパーティションを伴った一例におけるメモリの図である。 本発明を動作において実証するのに用いられる例示的なメモリ構成を示す図である。 図6に示すメモリ構成に本発明を適用した結果を示す図である。 フォワード・ウインドウイング・アルゴリズムを示すフローチャートである。 フォワード変換アルゴリズムを示すフローチャートである。 本発明による、メモリ・システムが単一の共用ウインドウを含む一実施形態を示す図である。 本発明の適用例を示す図である。 本発明の適用例を示す図である。 本発明による、例示的な初期化プロセスのためのプロセス・フローチャートを示す図である。 本発明の共用メモリ管理方法の第1の実施形態による、共用メモリに使用できるデータ構造を示す図である。 第1の実施形態による、メッセージ待ち行列エリアの例示的な一実施形態を示す図である。 第1の実施形態による、ノード出力待ち行列データ構造中に含めることのできる例示的な情報を示す図である。 第1の実施形態による、ノード出力待ち行列データ構造中に含めることのできる例示的な情報を示す図である。 第1の実施形態による、例示的なメッセージ・データ構造を示す図である。 共用メモリを介してパーティション間で通信するための本発明のコンピュータ・システムおよび方法の例示的な使用を示す図である。 本発明の共用メモリ管理方法の代替実施形態による共用メモリ・ウインドウのレイアウトを示す図である。 代替実施形態による制御構造ヘッダのコンテンツを示す図である。 代替実施形態による割り振り構造のコンテンツを示す図である。 本発明を利用するソフトウェアにより、オペレーティング・システム同士が、ワイヤで通信する様相を維持しながらも共用メモリによって通信することができる、本システムのコンピュータ・システムおよび方法の別の例示的な使用を示すブロック図である。 図22に示すソフトウェアをさらに詳細に示す図である。 図22に示すソフトウェアであって、WindowsNT環境で実行されるように設計されたソフトウェアをさらに詳細に示す図である。 図22に示すソフトウェアであって、WindowsNT環境で実行されるように設計されたソフトウェアをさらに詳細に示すプロセス・フローチャートである。 図22に示すソフトウェアであって、2200オペレーティング・システム環境で実行されるように設計されたソフトウェアをさらに詳細に示すプロセス・フローチャートである。 図22に示すソフトウェアであって、協調処理通信(CPCOMM)ソフトウェアプログラムの詳細を含むソフトウェアをさらに詳細に示すプロセス・フローチャートである。 図2に示すコンピュータ・システムをさらに詳細に示す図である。 図19に示す代替実施形態による入力待ち行列ヘッダのコンテンツを示す図である。 代替実施形態による入力待ち行列のコンテンツを示す図である。 代替実施形態によるコンピュータ・システムの動作をさらに示す流れ図である。 代替実施形態によるコンピュータ・システムの動作をさらに示す流れ図である。 代替実施形態によるタイプ1共用メモリ・ページのヘッダのコンテンツを示す図である。 代替実施形態によるタイプ2共用メモリ・ページのヘッダのコンテンツを示す図である。 本発明の好ましい一実施形態による、本発明のアドレス再配置方法および再利用方法を実施するための装置のブロック図である。

Claims (30)

  1. 複数の処理モジュールであって、各処理モジュールは複数のプロセッサを備え、1つまたは複数の処理モジュールのグループは、コンピュータ・システム内の別々のパーティションとして構成され、各パーティションは、別々のオペレーティング・システムの制御下で動作する処理モジュールと、
    メイン・メモリであって、各パーティションに排他メモリ・ウインドウはメイン・メモリ内で割り当てられており、排他メモリ・ウインドウへは、そのパーティションの処理モジュールだけしかアクセス権を有さず、排他メモリ・ウインドウ中では、そのパーティションのオペレーティング・システムが動作する、メイン・メモリとを備えるコンピュータ・システムであって、
    各処理モジュールは、さらに、
    前記メイン・メモリのベース(基底)物理アドレスから、前記処理モジュールが一部をなす前記パーティションに割り当てられた前記排他メモリ・ウインドウの開始までのオフセット(R OS)を保持するレジスタと、
    その処理モジュールのプロセッサによるその物理アドレス空間内の位置への各参照に前記オフセット(R OS)を加算し、それにより、これらの参照を前記排他メモリ・ウインドウ内のこれらに対応する位置に再配置する加算器と
    を備えることを特徴とするコンピュータ・システム。
  2. 各排他メモリ・ウインドウは、それぞれのオペレーティング・システムには0のベース(基底)物理アドレスを有すると見えるようにされることを特徴とする請求項1に記載のコンピュータ・システム。
  3. 所与のパーティションの前記プロセッサの前記物理アドレス空間は、メモリ記憶に利用不可能なアドレスの範囲を含むことができ、前記利用不可能な範囲はメモリ・ホールを規定し、前記メモリ・ホールより上のアドレスはハイ・メモリ範囲を規定し、メモリ・ホールより下のアドレスはロー・メモリ範囲を規定し、前記コンピュータ・システムはさらに、前記所与のパーティションの前記排他メモリ・ウインドウの、通常ならメモリ・ホールに対応することになる部分を他の用途に再利用する手段を備えることを特徴とする請求項1に記載のコンピュータ・システム。
  4. 前記再利用する手段は、前記パーティションの各処理モジュールごとに、前記メモリ・ホールのサイズを表す値(R OS)を保持するレジスタを備え、前記加算器は、
    (i)その物理アドレス空間の前記ロー・メモリ範囲内の位置への、前記パーティション中のプロセッサによる各参照に前記オフセット(R OS)を加算し、それにより、これらの参照を前記排他メモリ・ウインドウ内のこれらに対応する位置に再配置し、
    (ii)前記オフセットから前記メモリ・ホールのサイズを表す値を引いた値(R OS−R OS)を、その物理空間のハイ・メモリ範囲内の位置への、前記パーティション中のプロセッサによる各参照に加算し、
    それにより、これらの参照を、前記排他メモリ・ウインドウ内のこれらに対応する位置に再配置して、前記排他メモリ・ウインドウの、通常なら前記メモリ・ホールに対応することになる部分を再利用する
    ことを特徴とする請求項3に記載のコンピュータ・システム。
  5. 前記メイン・メモリはさらに、前記排他メモリ・ウインドウとは別の共用メモリ・ウインドウを含み、
    所与のパーティションの各処理モジュールは、さらに、
    前記所与のパーティション中にある前記プロセッサの前記物理アドレス空間の前記ベース(基底)アドレスから、その物理アドレス空間の、前記共用メモリ・ウインドウがマッピングされることになる指定部分の前記開始までのオフセット(SBASE OS)を保持するレジスタと、
    前記メイン・メモリの前記ベース(基底)アドレスから、前記メイン・メモリ内の前記共用メモリ・ウインドウの前記開始までのオフセット(SBASE MSU)を保持するレジスタと
    を備え、
    前記加算器は、前記2つのオフセット間の差(SBASE MSU−SBASE OS)を、前記所与のパーティション中のプロセッサによる前記指定部分内の位置への各参照に加え、それにより、これらの参照を、前記メイン・メモリの前記共用メモリ・ウインドウ内のこれらに対応する位置に再配置する
    ことを特徴とする請求項1に記載のコンピュータ・システム。
  6. 前記パーティションの1つ1つは、異なるオペレーティング・システムの前記制御下で動作することを特徴とする請求項1に記載のコンピュータ・システム。
  7. 前記パーティションの1つ1つは、同じオペレーティング・システムの異なるインスタンスの前記制御下で動作することを特徴とする請求項1に記載のコンピュータ・システム。
  8. (i)複数の処理モジュールであって、各処理モジュールは複数のプロセッサを備え、1つまたは複数の処理モジュールのグループは、コンピュータ・システム内の別々のパーティションとして構成され、各パーティションは、別々のオペレーティング・システムの制御下で動作する処理モジュールと、(ii)メイン・メモリであって、各パーティションに排他メモリ・ウインドウがメイン・メモリ内で割り当てられており、前記排他メモリ・ウインドウへは、そのパーティションだけしかアクセス権を有さず、排他メモリ・ウインドウ中では、そのパーティションのオペレーティング・システムが動作する、メイン・メモリとを備えるコンピュータ・システムにおいて、各パーティションの前記排他メモリ・ウインドウを、それぞれのオペレーティング・システムには、メイン・メモリ中の同じベース(基底)物理アドレスを有すると見えるようにする方法であって、
    各パーティションごとに、
    前記メイン・メモリの前記ベース(基底)物理アドレスから、そのパーティションに割り当てられた前記排他メモリ・ウインドウの前記開始までのオフセットを(R OS)表す値を格納するステップと、および
    そのパーティション中のプロセッサによるその物理アドレス空間内の位置への各参照に前記オフセット(R OS)を加算し、それにより、これらの参照を前記排他メモリ・ウインドウ内のこれらに対応する位置に再配置するステップ
    を備えることを特徴とする方法。
  9. 所与のパーティションの前記プロセッサの前記物理アドレス空間は、メモリ記憶に利用不可能なアドレスの範囲を含むことができ、前記利用不可能な範囲はメモリ・ホールを規定し、前記メモリ・ホールより上のアドレスはハイ・メモリ範囲を規定し、前記メモリ・ホールより下のアドレスはロー・メモリ範囲を規定し、前記方法はさらに、前記再配置するステップの結果として、前記所与のパーティションの前記排他メモリ・ウインドウの、通常なら前記メモリ・ホールに対応することになる部分を他の用途に再利用することを備えることを特徴とする請求項8に記載の方法。
  10. 前記再配置するステップと再利用するステップは、各パーティションごとに、
    前記メイン・メモリの前記ベース(基底)物理アドレスから、そのパーティションに割り当てられた前記排他メモリ・ウインドウの前記開始までのオフセット(R OS)を表す値を格納するステップと、
    前記メモリ・ホールのサイズを表す値(R OS)を格納するステップと、
    そのパーティション中のプロセッサによるその物理アドレス空間の前記ロー・メモリ範囲内の位置への各参照にオフセット(R OS)を加算し、それにより、これらの参照を前記排他メモリ・ウインドウ内のこれらに対応する位置に再配置するステップ、および
    前記オフセットから前記メモリ・ホールの前記サイズを引いた値(R OS−R OS)を、そのパーティション中のプロセッサによるその物理空間の前記ハイ・メモリ範囲内の位置への各参照に加算し、それにより、これらの参照を、前記排他メモリ・ウインドウ内のこれらに対応する位置に再配置して、前記排他メモリ・ウインドウの、通常なら前記メモリ・ホールに対応することになる部分を再利用するステップと、
    を備えることを特徴とする請求項9に記載の方法。
  11. 前記メイン・メモリはさらに、前記排他メモリ・ウインドウとは別個の共用メモリ・ウインドウを備え、前記方法はさらに、
    各パーティション上で、そのパーティションの前記プロセッサの前記物理アドレス空間の一部を前記メイン・メモリ内の前記共用メモリ・ウインドウに対応するように指定するステップと、および
    パーティションのプロセッサによるその物理アドレス空間の前記指定部分内の位置への参照を、前記メイン・メモリ内の前記共用メモリ・ウインドウ内の前記対応する位置に再配置するステップと
    を備えることを特徴とする請求項8に記載の方法。
  12. パーティション上のプロセッサによるその物理アドレスの前記指定部分への参照を、前記共用メモリ・ウインドウ中の前記対応する位置に再配置する前記ステップは、
    そのパーティション上にある前記プロセッサの前記物理アドレス空間の前記ベース(基底)アドレスから、その物理アドレス空間の前記指定部分の前記開始までのオフセット(SBASE OS)を表す値を格納するステップと、
    前記メイン・メモリの前記ベース(基底)アドレスから、前記メイン・メモリ内の前記共用メモリ・ウインドウの前記開始までのオフセット(SBASE MSU)を表す値を格納するステップと、および
    格納したオフセット間の前記差(SBASE MSU−SBASE OS)を、そのパーティション中のプロセッサによる前記指定部分内の位置への参照に加算するステップを備え、それにより、これらの参照を、前記メイン・メモリの前記共用メモリ・ウインドウ内のこれらに対応する位置に再配置するステップと
    を備えることを特徴とする請求項11に記載の方法。
  13. 各排他メモリ・ウインドウは、それぞれのオペレーティング・システムには0のベース(基底)物理アドレスを有すると見えるようにされることを特徴とする請求項8に記載の方法。
  14. 前記複数のパーティション上で実行され、それらのパーティションが前記共用メモリ・ウインドウを介して相互に通信できるようにするプログラム・コードをさらに備えることを特徴とする請求項5に記載のコンピュータ・システム。
  15. 前記パーティションの1つ1つは、前記異なるオペレーティング・システムの制御下で動作することを特徴とする請求項14に記載のコンピュータ・システム。
  16. 前記パーティションの1つ1つは、同じオペレーティング・システムの異なるインスタンスの制御下で動作することを特徴とする請求項14に記載のコンピュータ・システム。
  17. 前記プログラム・コードは、送信するパーティションがプロセッサ間割込みを受信するパーティション上で生成して、共用メモリ・ウインドウを介して情報が受信するパーティションに転送されていることを前記受信するパーティションに信号で知らせるための、プロセスを実装することを特徴とする請求項14に記載のコンピュータ・システム。
  18. 前記共用メモリ・ウインドウは、各パーティションに関連づけられた入力待ち行列のセットを含み、所与のパーティションに関連づけられた前記セットの各入力待ち行列が、別のパーティションに対応し、その別のパーティションからの通信を表すエントリを格納することを特徴とする請求項17に記載のコンピュータ・システム。
  19. 前記共用メモリ・ウインドウはさらに、パーティション間の情報の通信を容易にするために必要に応じて前記パーティションに割り振ることのできる複数のメモリ・ページを備えることを特徴とする請求項18に記載のコンピュータ・システム。
  20. 各パーティションは特定のページにおける所有権を有することができ、前記ページは、どのパーティションが前記ページにおける所有権を有するかを指定する情報を含むヘッダを有することを特徴とする請求項19に記載のコンピュータ・システム。
  21. 前記ページの前記ヘッダはさらにロック・フィールドを備え、前記ロック・フィールドにより、あるパーティションが、あるページの前記ヘッダ中の所有権情報を更新するために前記ページへの排他アクセス権を獲得することができ、それにより、異なるパーティションから前記ページへの複数アクセスの同期をとる機構が提供されることを特徴とする請求項20に記載のコンピュータ・システム。
  22. 前記共用メモリ・ウインドウは、それに関連づけられた、システム全体のロック・フィールドを有し、前記ロック・フィールドにより、あるパーティションは、1つまたは複数のページを割り振るために前記共用メモリ・ページへの排他アクセスを獲得することができ、それにより、異なるパーティションからの複数のメモリ・ページ割り振り要求の同期をとる機構が提供されることを特徴とする請求項21に記載のコンピュータ・システム。
  23. あるページの所有権情報は、そのページの前記ロック・フィールドを獲得することにより、前記システム全体のロック・フィールドを獲得する必要なしに更新することができることを特徴とする請求項21に記載のコンピュータ・システム。
  24. あるパーティション(送信するパーティション)が別のパーティション(受信するパーティション)と通信するようにするために、前記送信するパーティション上の前記プログラム・コードは、
    (i)送信するパーティションに対応する、受信するパーティションの前記入力待ち行列中に前記エントリを作成するようにし、
    (ii)前記受信するパーティション上でプロセッサ間割込みを生成して、その入力待ち行列中にエントリが作成されたことを前記受信するパーティションに信号で知らせるようにする
    ことを特徴とする請求項18に記載のコンピュータ・システム。
  25. 前記受信するパーティション上で前記プロセッサ間割込みが検出されたとき、前記受信するパーティション上の前記プログラム・コードは、
    (i)その各入力待ち行列を検査して、前記入力待ち行列が他のパーティションからの通信を表すエントリを含んでいるかを決定するようにし、
    (ii)そのようなエントリを、それらを含む前記入力待ち行列から抽出するようにする
    ことを特徴とする請求項24に記載のコンピュータ・システム。
  26. 各入力待ち行列は、事前定義された数のエントリを格納することができ、前記入力待ち行列が一杯になったときに設定されて、前記入力待ち行列からエントリが抽出されたときに受信するパーティションによってリセットされるオーバーフロー・フラグを含むことを特徴とする請求項18に記載のコンピュータ・システム。
  27. 前記プログラム・コードはポーリング・プロセスを実装し、当該ポーリング・プロセスにより、各パーティションが、前記共用メモリ・ウインドウ内のエリアをポーリングして、それに向けられた通信が別のパーティションから前記共用メモリ・ウインドウ中に配置されたかどうかを決定することを特徴とする請求項14に記載のコンピュータ・システム。
  28. 前記エリアは、各パーティションに1つずつ複数の出力待ち行列を含み、所与のパーティション用の出力待ち行列は、そのパーティションが前記他のパーティションに向けた通信を前記共用メモリ・ウインドウ中に配置したかどうかを示し、各パーティションは、前記他のパーティションの前記出力待ち行列をポーリングして、それら他のパーティションがそれに向けた通信を前記共用メモリ・ウインドウ中に配置したかどうかを決定することを特徴とする請求項27に記載のコンピュータ・システム。
  29. 送信するパーティションから前記共用メモリ・ウインドウ中に配置され、別のパーティションに受け取られるように意図された通信に対し、前記送信するパーティションの前記出力待ち行列が、前記共用メモリ・ウインドウ内の、その通信を含むバッファの前記位置を指定することを特徴とする請求項28に記載のコンピュータ・システム。
  30. 各パーティションに、他のパーティションに向けた通信をその中に配置することのできるメッセージ・バッファの別々のプールが割り当てられることを特徴とする請求項29に記載のコンピュータ・システム。
JP2006049063A 1998-12-18 2006-02-24 コンピュータ・システムの異なるパーティション中で複数のオペレーティング・システムを動作させ、異なるパーティションが共用メモリを介して相互に通信できるようにするコンピュータ・システムおよび方法 Pending JP2006216068A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/215,424 US6314501B1 (en) 1998-07-23 1998-12-18 Computer system and method for operating multiple operating systems in different partitions of the computer system and for allowing the different partitions to communicate with one another through shared memory

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000588687A Division JP2002532806A (ja) 1998-12-18 1999-12-17 コンピュータ・システムの異なるパーティション中で複数のオペレーティング・システムを動作させ、異なるパーティションが共用メモリを介して相互に通信できるようにするコンピュータ・システムおよび方法

Publications (1)

Publication Number Publication Date
JP2006216068A true JP2006216068A (ja) 2006-08-17

Family

ID=22802929

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2000588687A Pending JP2002532806A (ja) 1998-12-18 1999-12-17 コンピュータ・システムの異なるパーティション中で複数のオペレーティング・システムを動作させ、異なるパーティションが共用メモリを介して相互に通信できるようにするコンピュータ・システムおよび方法
JP2006049063A Pending JP2006216068A (ja) 1998-12-18 2006-02-24 コンピュータ・システムの異なるパーティション中で複数のオペレーティング・システムを動作させ、異なるパーティションが共用メモリを介して相互に通信できるようにするコンピュータ・システムおよび方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2000588687A Pending JP2002532806A (ja) 1998-12-18 1999-12-17 コンピュータ・システムの異なるパーティション中で複数のオペレーティング・システムを動作させ、異なるパーティションが共用メモリを介して相互に通信できるようにするコンピュータ・システムおよび方法

Country Status (8)

Country Link
US (2) US6314501B1 (ja)
EP (1) EP1145122B1 (ja)
JP (2) JP2002532806A (ja)
AT (1) ATE359550T1 (ja)
BR (1) BR9916308A (ja)
CA (1) CA2355065C (ja)
DE (1) DE69935805T2 (ja)
WO (1) WO2000036509A2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217591A (ja) * 2007-03-06 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像形成装置、画像形成システム、アドレス変換処理プログラム
JP2010009567A (ja) * 2008-06-27 2010-01-14 Internatl Business Mach Corp <Ibm> 動的にマージされた物理パーティションを含む情報処理システムおよびこれを動作させる方法
JP2011118900A (ja) * 2009-11-30 2011-06-16 Internatl Business Mach Corp <Ibm> システムの立ち上げ時間を早めるための方法、装置およびコンピュータ・プログラム
US9928185B2 (en) 2015-01-30 2018-03-27 Fujitsu Limited Information processing apparatus and computer-readable recording medium having program recorded therein
KR20200019670A (ko) * 2017-06-19 2020-02-24 에이알엠 리미티드 한계 확인

Families Citing this family (446)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282578B1 (en) * 1995-06-26 2001-08-28 Hitachi, Ltd. Execution management method of program on reception side of message in distributed processing system
US6343313B1 (en) * 1996-03-26 2002-01-29 Pixion, Inc. Computer conferencing system with real-time multipoint, multi-speed, multi-stream scalability
US6029168A (en) * 1998-01-23 2000-02-22 Tricord Systems, Inc. Decentralized file mapping in a striped network file system in a distributed computing environment
IL125273A (en) * 1998-07-08 2006-08-20 Marvell Israel Misl Ltd Communication architecture
US6314501B1 (en) 1998-07-23 2001-11-06 Unisys Corporation Computer system and method for operating multiple operating systems in different partitions of the computer system and for allowing the different partitions to communicate with one another through shared memory
AU6211799A (en) * 1998-10-10 2000-05-01 Victoria University Of Manchester, The Endian transformation
US6480941B1 (en) * 1999-02-23 2002-11-12 International Business Machines Corporation Secure partitioning of shared memory based multiprocessor system
US8245260B1 (en) * 1999-05-04 2012-08-14 Unisys Corporation Video server
US6601089B1 (en) 1999-06-21 2003-07-29 Sun Microsystems, Inc. System and method for allocating buffers for message passing in a shared-memory computer system
US6535963B1 (en) * 1999-06-30 2003-03-18 Cisco Technology, Inc. Memory apparatus and method for multicast devices
US6976260B1 (en) * 1999-09-24 2005-12-13 International Business Machines Corporation Method and apparatus for serializing a message queue in a multiprocessing environment
JP2001101033A (ja) * 1999-09-27 2001-04-13 Hitachi Ltd オペレーティングシステム及びアプリケーションプログラムの障害監視方法
US7007275B1 (en) * 1999-10-21 2006-02-28 Unisys Corporation Method and apparatus for automatic execution of concatenated methods across multiple heterogeneous data sources
US6490585B1 (en) * 1999-11-12 2002-12-03 Unisys Corp Cellular multiprocessor data warehouse
US6772416B1 (en) * 1999-11-19 2004-08-03 General Dynamics Decision Systems, Inc. Separation kernel with memory allocation, remote procedure call and exception handling mechanisms
US6735765B1 (en) * 1999-12-07 2004-05-11 Storage Technology Corporation Sharing data between operating systems
US6782001B1 (en) 1999-12-23 2004-08-24 Intel Corporation Physical layer and data link interface with reset/sync sharing
US6718417B1 (en) 1999-12-23 2004-04-06 Intel Corporation Physical layer and data link interface with flexible bus width
US7257079B1 (en) 1999-12-23 2007-08-14 Intel Corporation Physical layer and data link interface with adaptive speed
US6795881B1 (en) * 1999-12-23 2004-09-21 Intel Corporation Physical layer and data link interface with ethernet pre-negotiation
US7346075B1 (en) * 2000-02-25 2008-03-18 International Business Machines Corporation Portable networking interface method and apparatus for distributed switching system
US6633962B1 (en) * 2000-03-21 2003-10-14 International Business Machines Corporation Method, system, program, and data structures for restricting host access to a storage space
JP2001290665A (ja) * 2000-04-11 2001-10-19 Nec Software Hokuriku Ltd プロセッサシステム
US20020144010A1 (en) * 2000-05-09 2002-10-03 Honeywell International Inc. Communication handling in integrated modular avionics
US7058750B1 (en) * 2000-05-10 2006-06-06 Intel Corporation Scalable distributed memory and I/O multiprocessor system
US6981260B2 (en) * 2000-05-25 2005-12-27 International Business Machines Corporation Apparatus for minimizing lock contention in a multiple processor system with multiple run queues when determining the threads priorities
CA2335561A1 (en) * 2000-05-31 2001-11-30 Frank J. Degilio Heterogeneous client server method, system and program product for a partitioned processing environment
JP3770306B2 (ja) * 2000-06-20 2006-04-26 日本電気株式会社 ベースバイアス回路及びこのベースバイアス回路を用いた電力増幅器
US6799317B1 (en) * 2000-06-27 2004-09-28 International Business Machines Corporation Interrupt mechanism for shared memory message passing
US7620775B1 (en) * 2004-03-26 2009-11-17 Emc Corporation System and method for managing storage networks and providing virtualization of resources in such a network using one or more ASICs
US6985967B1 (en) 2000-07-20 2006-01-10 Rlx Technologies, Inc. Web server network system and method
US6757748B1 (en) 2000-07-20 2004-06-29 Rlx Technologies, Inc. Modular network interface system and method
US6747878B1 (en) 2000-07-20 2004-06-08 Rlx Technologies, Inc. Data I/O management system and method
US6411506B1 (en) * 2000-07-20 2002-06-25 Rlx Technologies, Inc. High density web server chassis system and method
US6665777B2 (en) 2000-07-26 2003-12-16 Tns Holdings, Inc. Method, apparatus, network, and kit for multiple block sequential memory management
FR2814555B1 (fr) * 2000-09-25 2003-02-28 Thomson Multimedia Sa Systeme et procede de gestion memoire de coherence de donnees et reseau multiprocesseur associe
JP2002108837A (ja) * 2000-09-29 2002-04-12 Nec Corp 計算機システムとその計算制御方法
US7343419B1 (en) 2000-10-05 2008-03-11 Aol Llc Rerouting media to selected media applications
US6728764B1 (en) * 2000-11-08 2004-04-27 Unisys Corporation Method and apparatus for operating a data processing system
US6772320B1 (en) * 2000-11-17 2004-08-03 Intel Corporation Method and computer program for data conversion in a heterogeneous communications network
US6813522B1 (en) * 2000-12-29 2004-11-02 Emc Corporation Method of sharing memory in a multi-processor system including a cloning of code and data
JP2002251326A (ja) * 2001-02-22 2002-09-06 Hitachi Ltd 耐タンパ計算機システム
US6601148B2 (en) * 2001-03-01 2003-07-29 International Business Machines Corporation Infiniband memory windows management directly in hardware
US6665759B2 (en) * 2001-03-01 2003-12-16 International Business Machines Corporation Method and apparatus to implement logical partitioning of PCI I/O slots
US20020129274A1 (en) * 2001-03-08 2002-09-12 International Business Machines Corporation Inter-partition message passing method, system and program product for a security server in a partitioned processing environment
US7089558B2 (en) * 2001-03-08 2006-08-08 International Business Machines Corporation Inter-partition message passing method, system and program product for throughput measurement in a partitioned processing environment
US6985951B2 (en) * 2001-03-08 2006-01-10 International Business Machines Corporation Inter-partition message passing method, system and program product for managing workload in a partitioned processing environment
US20020129172A1 (en) * 2001-03-08 2002-09-12 International Business Machines Corporation Inter-partition message passing method, system and program product for a shared I/O driver
US6578128B1 (en) * 2001-03-29 2003-06-10 Emc Corporation Address management for a shared memory region on a multi-processor controller board
JP4443067B2 (ja) * 2001-04-26 2010-03-31 富士通マイクロエレクトロニクス株式会社 プロセッサおよびそのリセット制御方法
US20040004966A1 (en) * 2001-04-27 2004-01-08 Foster Michael S. Using virtual identifiers to route transmitted data through a network
US20020188709A1 (en) * 2001-05-04 2002-12-12 Rlx Technologies, Inc. Console information server system and method
US20020188718A1 (en) * 2001-05-04 2002-12-12 Rlx Technologies, Inc. Console information storage system and method
US6587921B2 (en) * 2001-05-07 2003-07-01 International Business Machines Corporation Method and apparatus for cache synchronization in a clustered environment
JP4632574B2 (ja) * 2001-05-25 2011-02-16 株式会社日立製作所 記憶装置およびファイルデータのバックアップ方法およびファイルデータのコピー方法
US6874014B2 (en) * 2001-05-29 2005-03-29 Hewlett-Packard Development Company, L.P. Chip multiprocessor with multiple operating systems
US7103747B2 (en) * 2001-06-28 2006-09-05 Hewlett-Packard Development Company, L.P. Memory table and memory manager for use in managing memory
US6795907B2 (en) * 2001-06-28 2004-09-21 Hewlett-Packard Development Company, L.P. Relocation table for use in memory management
US7213081B2 (en) * 2001-06-29 2007-05-01 Fujitsu Limited Dynamic determination of memory mapped input output range granularity for multi-node computer system
US6968398B2 (en) * 2001-08-15 2005-11-22 International Business Machines Corporation Method of virtualizing I/O resources in a computer system
US7290104B2 (en) * 2001-09-19 2007-10-30 Intel Corporation Increasing code separation between applications
US6999998B2 (en) * 2001-10-04 2006-02-14 Hewlett-Packard Development Company, L.P. Shared memory coupling of network infrastructure devices
US20030069949A1 (en) * 2001-10-04 2003-04-10 Chan Michele W. Managing distributed network infrastructure services
US6920485B2 (en) * 2001-10-04 2005-07-19 Hewlett-Packard Development Company, L.P. Packet processing in shared memory multi-computer systems
JP3878508B2 (ja) * 2001-11-08 2007-02-07 松下電器産業株式会社 回路群制御システム
US6757785B2 (en) * 2001-11-27 2004-06-29 International Business Machines Corporation Method and system for improving cache performance in a multiprocessor computer
US20030110205A1 (en) * 2001-12-07 2003-06-12 Leith Johnson Virtualized resources in a partitionable server
US6910108B2 (en) * 2002-01-09 2005-06-21 International Business Machines Corporation Hardware support for partitioning a multiprocessor system to allow distinct operating systems
US6795902B2 (en) * 2002-01-09 2004-09-21 Sun Microsystems, Inc. Inter-domain data transfer
US6826653B2 (en) 2002-02-06 2004-11-30 Hewlett-Packard Development Company, L.P. Block data mover adapted to contain faults in a partitioned multiprocessor system
US20030163651A1 (en) * 2002-02-26 2003-08-28 International Business Machines Corporation Apparatus and method of transferring data from one partition of a partitioned computer system to another
US6834296B2 (en) 2002-03-01 2004-12-21 International Business Machines Corporation Apparatus and method of multicasting or broadcasting data from one partition of a partitioned computer system to a plurality of other partitions
US20030177367A1 (en) * 2002-03-14 2003-09-18 International Business Machines Corporation Controlling access to a disk drive in a computer system running multiple operating systems
US20030177334A1 (en) * 2002-03-14 2003-09-18 International Business Machines Corporation Address mapping for disk drive to accommodate multiple operating systems
US7219121B2 (en) * 2002-03-29 2007-05-15 Microsoft Corporation Symmetrical multiprocessing in multiprocessor systems
US6968415B2 (en) * 2002-03-29 2005-11-22 International Business Machines Corporation Opaque memory region for I/O adapter transparent bridge
US6725289B1 (en) * 2002-04-17 2004-04-20 Vmware, Inc. Transparent address remapping for high-speed I/O
US7529844B2 (en) * 2002-04-26 2009-05-05 Sun Microsystems, Inc. Multiprocessing systems employing hierarchical spin locks
US7478139B2 (en) * 2002-04-29 2009-01-13 International Business Machines Corporation Shared resource support for internet protocol
US7051102B2 (en) * 2002-04-29 2006-05-23 Microsoft Corporation Peer-to-peer name resolution protocol (PNRP) security infrastructure and method
US8103754B1 (en) * 2002-05-02 2012-01-24 Hewlett-Packard Development Company, L.P. Reserving a shared volume in a multiple node data storage system
US7747747B1 (en) 2002-05-06 2010-06-29 Apple Inc. Method and arrangement for supressing duplicate network resources
JP4032816B2 (ja) * 2002-05-08 2008-01-16 株式会社日立製作所 ストレージネットワークトポロジ管理システム
US6941436B2 (en) * 2002-05-09 2005-09-06 International Business Machines Corporation Method and apparatus for managing memory blocks in a logical partitioned data processing system
FR2840082B1 (fr) * 2002-05-24 2006-04-07 Bull Sa Procede d'echange d'informations entre systemes d'exploitation cohabitant sur un meme ordinateur
JP2004005213A (ja) * 2002-05-31 2004-01-08 Toshiba Corp 情報処理装置
US20030229721A1 (en) * 2002-06-05 2003-12-11 Bonola Thomas J. Address virtualization of a multi-partitionable machine
US7487264B2 (en) * 2002-06-11 2009-02-03 Pandya Ashish A High performance IP processor
US7444636B2 (en) * 2002-07-15 2008-10-28 Hewlett-Packard Development Company, L.P. Method and system of determining attributes of a functional unit in a multiple processor computer system
US7111303B2 (en) * 2002-07-16 2006-09-19 International Business Machines Corporation Virtual machine operating system LAN
KR20050033652A (ko) * 2002-08-28 2005-04-12 그라스 밸리 (유.에스.) 아이엔씨. 향상된 성능을 구비하는 비디오-스토리지 네트워크
US20040059850A1 (en) * 2002-09-19 2004-03-25 Hipp Christopher G. Modular server processing card system and method
US7181744B2 (en) * 2002-10-24 2007-02-20 International Business Machines Corporation System and method for transferring data between virtual machines or other computer entities
US7028218B2 (en) * 2002-12-02 2006-04-11 Emc Corporation Redundant multi-processor and logical processor configuration for a file server
US7007160B1 (en) * 2002-12-03 2006-02-28 Hewlett-Packard Development Company, L.P. System and method for loading an advanced configuration and power interface (ACPI) original equipment manufacturer (OEM) description table
US7103766B2 (en) * 2002-12-20 2006-09-05 Hewlett-Packard Development Company, L.P. System and method for making BIOS routine calls from different hardware partitions
US7188062B1 (en) * 2002-12-27 2007-03-06 Unisys Corporation Configuration management for an emulator operating system
US7000046B1 (en) * 2003-01-17 2006-02-14 Unisys Corporation Standard channel I/O processor (SCIOP)
CA2422252C (en) * 2003-03-14 2008-09-02 Ibm Canada Limited - Ibm Canada Limitee Reduced synchronization reservation system and method for a shared memory buffer
JP4012517B2 (ja) * 2003-04-29 2007-11-21 インターナショナル・ビジネス・マシーンズ・コーポレーション 仮想計算機環境におけるロックの管理
US7251815B2 (en) * 2003-04-29 2007-07-31 International Business Machines Corporation Multiple virtual machines sharing processor and work queue in memory having program/dispatch functions for assigning and accessing work items while the virtual machine was not idle
US7299468B2 (en) * 2003-04-29 2007-11-20 International Business Machines Corporation Management of virtual machines to utilize shared resources
US8892878B2 (en) * 2003-05-09 2014-11-18 Oracle America, Inc. Fine-grained privileges in operating system partitions
US7100034B2 (en) * 2003-05-23 2006-08-29 Hewlett-Packard Development Company, L.P. System for selecting another processor to be the boot strap processor when the default boot strap processor does not have local memory
US20040243783A1 (en) * 2003-05-30 2004-12-02 Zhimin Ding Method and apparatus for multi-mode operation in a semiconductor circuit
US7685254B2 (en) * 2003-06-10 2010-03-23 Pandya Ashish A Runtime adaptable search processor
US7356818B2 (en) * 2003-06-24 2008-04-08 International Business Machines Corporation Virtual machine communicating to external device without going through other virtual machines by using a list of IP addresses managed only by a single virtual machine monitor
US20040268362A1 (en) * 2003-06-25 2004-12-30 International Business Machines Corporation Method, apparatus and program storage device for providing a two-step communication scheme
JP3892829B2 (ja) 2003-06-27 2007-03-14 株式会社東芝 情報処理システムおよびメモリ管理方法
US20050015645A1 (en) * 2003-06-30 2005-01-20 Anil Vasudevan Techniques to allocate information for processing
US7620950B2 (en) * 2003-07-01 2009-11-17 International Business Machines Corporation System and method to monitor amount of usage of applications in logical partitions
KR100518584B1 (ko) * 2003-07-12 2005-10-04 삼성전자주식회사 공유 라이브러리 시스템 및 상기 시스템 구축 방법
US8028130B1 (en) 2003-07-22 2011-09-27 Oracle America, Inc. Pipeline structure for a shared memory protocol
US7085910B2 (en) * 2003-08-27 2006-08-01 Lsi Logic Corporation Memory window manager for control structure access
US7743381B1 (en) * 2003-09-16 2010-06-22 Symantec Operating Corporation Checkpoint service
US7664823B1 (en) * 2003-09-24 2010-02-16 Cisco Technology, Inc. Partitioned packet processing in a multiprocessor environment
US20050071665A1 (en) * 2003-09-30 2005-03-31 Zimmer Vincent J. Methods and apparatus to associate boot objects with trust credentials
US8122361B2 (en) * 2003-10-23 2012-02-21 Microsoft Corporation Providing a graphical user interface in a system with a high-assurance execution environment
US7660322B2 (en) * 2003-12-11 2010-02-09 International Business Machines Corporation Shared adapter
JP4408692B2 (ja) * 2003-12-19 2010-02-03 富士通株式会社 通信装置管理プログラム
US20050198461A1 (en) * 2004-01-12 2005-09-08 Shaw Mark E. Security measures in a partitionable computing system
TWI253014B (en) * 2004-02-10 2006-04-11 Intervideo Digital Technology Architecture for sharing application programs between operation systems with power-saving effect and method thereof
US7383555B2 (en) * 2004-03-11 2008-06-03 International Business Machines Corporation Apparatus and method for sharing a network I/O adapter between logical partitions
EP1725934A4 (en) 2004-03-13 2008-08-13 Cluster Resources Inc SYSTEM AND METHOD FOR SELF-OPTIMIZED RESOURCE RESERVATION IN CALCULATION TIME
US8782654B2 (en) 2004-03-13 2014-07-15 Adaptive Computing Enterprises, Inc. Co-allocating a reservation spanning different compute resources types
JP2005275629A (ja) * 2004-03-23 2005-10-06 Nec Corp マルチプロセッサシステム、及び、メモリアクセス方法
US7620774B1 (en) * 2004-03-26 2009-11-17 Emc Corporation System and method for managing storage networks and providing virtualization of resources in such a network using one or more control path controllers with an embedded ASIC on each controller
US20050216695A1 (en) * 2004-03-26 2005-09-29 Jean-Pierre Bono Memory extension for a data processor to provide both common and separate physical memory areas for virtual memory spaces
US20050240806A1 (en) * 2004-03-30 2005-10-27 Hewlett-Packard Development Company, L.P. Diagnostic memory dump method in a redundant processor
US8533716B2 (en) 2004-03-31 2013-09-10 Synopsys, Inc. Resource management in a multicore architecture
US7598956B2 (en) 2004-04-15 2009-10-06 Microsoft Corporation Blended object attribute keyframing model
US7246217B1 (en) * 2004-04-19 2007-07-17 Sandia Corporation Interconnection arrangement of routers of processor boards in array of cabinets supporting secure physical partition
JP4607489B2 (ja) * 2004-04-21 2011-01-05 株式会社エヌ・ティ・ティ・ドコモ データ処理装置およびデータ処理方法
US7478204B2 (en) * 2004-04-29 2009-01-13 International Business Machines Corporation Efficient sharing of memory between applications running under different operating systems on a shared hardware system
US8214622B2 (en) 2004-05-27 2012-07-03 International Business Machines Corporation Facilitating management of storage of a pageable mode virtual environment absent intervention of a host of the environment
US7941799B2 (en) 2004-05-27 2011-05-10 International Business Machines Corporation Interpreting I/O operation requests from pageable guests without host intervention
US7206915B2 (en) * 2004-06-03 2007-04-17 Emc Corp Virtual space manager for computer having a physical address extension feature
US20070266388A1 (en) 2004-06-18 2007-11-15 Cluster Resources, Inc. System and method for providing advanced reservations in a compute environment
US7434022B1 (en) * 2004-06-29 2008-10-07 Emc Corporation Distributed workflow techniques
US8914606B2 (en) * 2004-07-08 2014-12-16 Hewlett-Packard Development Company, L.P. System and method for soft partitioning a computer system
US20060020940A1 (en) * 2004-07-08 2006-01-26 Culter Bradley G Soft-partitioning systems and methods
US20060026367A1 (en) * 2004-07-27 2006-02-02 Sanjoy Das Storage task coordination apparatus method and system
US7386688B2 (en) * 2004-07-29 2008-06-10 Hewlett-Packard Development Company, L.P. Communication among partitioned devices
US8898246B2 (en) * 2004-07-29 2014-11-25 Hewlett-Packard Development Company, L.P. Communication among partitioned devices
US7356613B2 (en) * 2004-08-17 2008-04-08 International Business Machines Corporation Routable application partitioning
US9619279B2 (en) * 2004-08-18 2017-04-11 Red Bend Software Sas Operating systems sharing supervisor address space with same virtual to physical mapping for supervisor address space using same translation formula with different translation tree
US8176490B1 (en) 2004-08-20 2012-05-08 Adaptive Computing Enterprises, Inc. System and method of interfacing a workload manager and scheduler with an identity manager
US7539832B2 (en) * 2004-08-23 2009-05-26 Hewlett-Packard Development Company, L.P. Option ROM code acquisition
US7299376B2 (en) 2004-08-25 2007-11-20 International Business Machines Corporation Apparatus, system, and method for verifying backup data
US20060053092A1 (en) * 2004-09-01 2006-03-09 Chris Foo Method and system to perform dynamic search over a network
US20060058658A1 (en) * 2004-09-13 2006-03-16 Siemens Medical Solutions Usa, Inc. Communications between co-located operating systems for medical diagnostic ultrasound and other systems
US9038070B2 (en) 2004-09-14 2015-05-19 Synopsys, Inc. Debug in a multicore architecture
US20060070042A1 (en) * 2004-09-24 2006-03-30 Muratori Richard D Automatic clocking in shared-memory co-simulation
US7685319B2 (en) 2004-09-28 2010-03-23 Cray Canada Corporation Low latency communication via memory windows
US7424739B2 (en) * 2004-10-29 2008-09-09 Microaoft Corporation On-machine communication verification
JP2006133989A (ja) * 2004-11-04 2006-05-25 Hitachi Ltd ストレージシステムの管理方法、及び装置
WO2006053093A2 (en) 2004-11-08 2006-05-18 Cluster Resources, Inc. System and method of providing system jobs within a compute environment
US8145872B2 (en) 2004-11-08 2012-03-27 International Business Machines Corporation Autonomic self-tuning of database management system in dynamic logical partitioning environment
JP4606142B2 (ja) * 2004-12-01 2011-01-05 株式会社ソニー・コンピュータエンタテインメント スケジューリング方法、スケジューリング装置およびマルチプロセッサシステム
JP2006163516A (ja) * 2004-12-02 2006-06-22 Fujitsu Ltd ネットワーク装置、ファイバーチャネルスイッチおよび共用メモリアクセス制御方法
US7580915B2 (en) * 2004-12-14 2009-08-25 Sap Ag Socket-like communication API for C
US7593930B2 (en) * 2004-12-14 2009-09-22 Sap Ag Fast channel architecture
US8533717B2 (en) * 2004-12-14 2013-09-10 Sap Ag Fast platform independent inter-process communication
US7600217B2 (en) * 2004-12-14 2009-10-06 Sap Ag Socket-like communication API for Java
US7523196B2 (en) * 2004-12-28 2009-04-21 Sap Ag Session monitoring using shared memory
US8370448B2 (en) * 2004-12-28 2013-02-05 Sap Ag API for worker node retrieval of session request
US7500133B2 (en) * 2004-12-28 2009-03-03 Sap Ag Connection manager for handling message oriented protocol-based requests
US7694065B2 (en) * 2004-12-28 2010-04-06 Sap Ag Distributed cache architecture
US7552153B2 (en) * 2004-12-28 2009-06-23 Sap Ag Virtual machine monitoring using shared memory
US7971001B2 (en) * 2004-12-28 2011-06-28 Sap Ag Least recently used eviction implementation
US7539821B2 (en) * 2004-12-28 2009-05-26 Sap Ag First in first out eviction implementation
US7672949B2 (en) 2004-12-28 2010-03-02 Sap Ag Connection manager having a common dispatcher for heterogeneous software suites
US20060143256A1 (en) 2004-12-28 2006-06-29 Galin Galchev Cache region concept
US8204931B2 (en) 2004-12-28 2012-06-19 Sap Ag Session management within a multi-tiered enterprise network
US7591006B2 (en) * 2004-12-29 2009-09-15 Sap Ag Security for external system management
US7412705B2 (en) * 2005-01-04 2008-08-12 International Business Machines Corporation Method for inter partition communication within a logical partitioned data processing system
KR100645537B1 (ko) * 2005-02-07 2006-11-14 삼성전자주식회사 안정적인 패킷 포워딩을 위한 동적인 큐 관리방법 및 이를위한 네트워크 프로세서의 구성요소
US7765405B2 (en) * 2005-02-25 2010-07-27 Microsoft Corporation Receive side scaling with cryptographically secure hashing
US8863143B2 (en) 2006-03-16 2014-10-14 Adaptive Computing Enterprises, Inc. System and method for managing a hybrid compute environment
US9075657B2 (en) 2005-04-07 2015-07-07 Adaptive Computing Enterprises, Inc. On-demand access to compute resources
US9231886B2 (en) 2005-03-16 2016-01-05 Adaptive Computing Enterprises, Inc. Simple integration of an on-demand compute environment
KR101064878B1 (ko) * 2005-03-17 2011-09-16 엠텍비젼 주식회사 복수의 프로세서에 의한 메모리 공유 방법 및 메모리 공유구조를 가지는 휴대형 단말기
JP4711709B2 (ja) * 2005-03-18 2011-06-29 富士通株式会社 パーティション割り振り方法及びコンピュータシステム
KR100591371B1 (ko) * 2005-03-23 2006-06-20 엠텍비젼 주식회사 공유 메모리의 분할 영역 크기 가변 방법 및 공유 메모리를가지는 휴대형 단말기
KR100592105B1 (ko) * 2005-03-25 2006-06-21 엠텍비젼 주식회사 공유 메모리의 분할 영역의 다중 억세스 제어 방법 및 공유메모리를 가지는 휴대형 단말기
US7987306B2 (en) 2005-04-04 2011-07-26 Oracle America, Inc. Hiding system latencies in a throughput networking system
US7415034B2 (en) 2005-04-04 2008-08-19 Sun Microsystems, Inc. Virtualized partitionable shared network interface
US7779164B2 (en) * 2005-04-04 2010-08-17 Oracle America, Inc. Asymmetrical data processing partition
US8510491B1 (en) * 2005-04-05 2013-08-13 Oracle America, Inc. Method and apparatus for efficient interrupt event notification for a scalable input/output device
US7817647B2 (en) * 2005-04-22 2010-10-19 Microsoft Corporation Flower-petal resolutions for PNRP
US8589562B2 (en) * 2005-04-29 2013-11-19 Sap Ag Flexible failover configuration
US7337171B2 (en) * 2005-05-12 2008-02-26 International Business Machines Corporation Apparatus and method for sharing a virtual file system between logical partitions
US7689800B2 (en) * 2005-05-12 2010-03-30 Microsoft Corporation Partition bus
US7788642B2 (en) * 2005-05-16 2010-08-31 Texas Instruments Incorporated Displaying cache information using mark-up techniques
US7689660B2 (en) * 2005-06-09 2010-03-30 Sap Ag Application server architecture
US7636943B2 (en) * 2005-06-13 2009-12-22 Aladdin Knowledge Systems Ltd. Method and system for detecting blocking and removing spyware
GB2427715A (en) * 2005-06-24 2007-01-03 Advanced Risc Mach Ltd Managing snoop operations in a multiprocessor system
JP4725955B2 (ja) * 2005-06-30 2011-07-13 株式会社リコー 情報処理装置、メッセージ管理方法、プログラムおよび記憶媒体
US7441112B2 (en) 2005-06-30 2008-10-21 Intel Corporation Offloading the processing of a network protocol stack
US8195624B2 (en) * 2005-06-30 2012-06-05 Phoenix Technologies Ltd. Shared file system management between independent operating systems
US7966412B2 (en) * 2005-07-19 2011-06-21 Sap Ag System and method for a pluggable protocol handler
US7647469B2 (en) * 2005-07-22 2010-01-12 International Business Machines Corporation Method of assigning virtual import/export element addresses
US7843961B2 (en) * 2005-07-25 2010-11-30 International Business Machines Corporation Hardware device emulation
US7568013B1 (en) * 2005-08-03 2009-07-28 Sun Microsystems, Inc. Multiple message send routine for network packets
US7720925B1 (en) * 2005-08-03 2010-05-18 Oracle America, Inc. Multiple message receive routine for network packets
US7945677B2 (en) * 2005-09-06 2011-05-17 Sap Ag Connection manager capable of supporting both distributed computing sessions and non distributed computing sessions
US9342945B2 (en) 2005-09-09 2016-05-17 Bally Gaming, Inc. Gaming device with a virtualization manager
KR100634566B1 (ko) * 2005-10-06 2006-10-16 엠텍비젼 주식회사 공유 메모리 제어 방법 및 공유 메모리 동작 제어를수행하는 사용자 단말기
TWI277324B (en) * 2005-10-19 2007-03-21 Ind Tech Res Inst Network packet storage method and network packet transmitting apparatus using the same
US20070106683A1 (en) * 2005-11-08 2007-05-10 3Com Corporation Distributed database
US7516291B2 (en) * 2005-11-21 2009-04-07 Red Hat, Inc. Cooperative mechanism for efficient application memory allocation
US8707323B2 (en) * 2005-12-30 2014-04-22 Sap Ag Load balancing algorithm for servicing client requests
US20070156907A1 (en) * 2005-12-30 2007-07-05 Galin Galchev Session handling based on shared session information
US20070162594A1 (en) * 2006-01-12 2007-07-12 Microsoft Corporation Controlled disconnection of a network device
US20070174723A1 (en) * 2006-01-18 2007-07-26 Omar Cardona Sub-second, zero-packet loss adapter failover
US8028071B1 (en) * 2006-02-15 2011-09-27 Vmware, Inc. TCP/IP offload engine virtualization system and methods
US7872973B2 (en) * 2006-03-17 2011-01-18 Alcatel Lucent Method and system for using a queuing device as a lossless stage in a network device in a communications network
US8042109B2 (en) * 2006-03-21 2011-10-18 Intel Corporation Framework for domain-specific run-time environment acceleration using virtualization technology
US20070239965A1 (en) * 2006-03-31 2007-10-11 Saul Lewites Inter-partition communication
US7610481B2 (en) 2006-04-19 2009-10-27 Intel Corporation Method and apparatus to support independent systems in partitions of a processing system
EP2016498B1 (en) 2006-04-21 2013-12-11 Oracle America, Inc. Asymmetrical processing for networking functions and data path offload
WO2007123541A1 (en) * 2006-04-21 2007-11-01 Sun Microsystems, Inc. Virtualized partitionable shared network interface
WO2007123542A1 (en) * 2006-04-21 2007-11-01 Sun Microsystems, Inc. Hiding system latencies in a throughput networking system
US8769703B2 (en) * 2006-04-27 2014-07-01 Unisys Corporation System and method for providing a mechanism to virtualize a perpetual, unique system identity on a partitioned computer system
US20070256076A1 (en) * 2006-04-27 2007-11-01 Thompson James W System and method for separating multiple workloads processing in a single computer operating environment
US20080005494A1 (en) * 2006-06-07 2008-01-03 Zimmer Vincent J Supporting flash access in a partitioned platform
US20070288938A1 (en) * 2006-06-12 2007-12-13 Daniel Zilavy Sharing data between partitions in a partitionable system
US20070288921A1 (en) * 2006-06-13 2007-12-13 King Steven R Emulating a network-like communication connection between virtual machines on a physical device
US7426604B1 (en) * 2006-06-14 2008-09-16 Sun Microsystems, Inc. Virtual output buffer architecture
US8214828B2 (en) * 2006-06-30 2012-07-03 Microsoft Corporation Module state management in a virtual machine environment
US8447936B2 (en) * 2006-06-30 2013-05-21 Microsoft Corporation Module state management in a virtual machine environment
JP5621191B2 (ja) * 2006-07-18 2014-11-05 日本電気株式会社 情報通信処理装置、情報通信端末、情報通信システム、機能切替方法及び機能切替プログラム
US7434025B2 (en) * 2006-07-18 2008-10-07 Microsoft Corporation Leverage guest logical to physical translation for host-side memory access
US7546398B2 (en) * 2006-08-01 2009-06-09 International Business Machines Corporation System and method for distributing virtual input/output operations across multiple logical partitions
US8001540B2 (en) * 2006-08-08 2011-08-16 International Business Machines Corporation System, method and program product for control of sequencing of data processing by different programs
US20080040458A1 (en) * 2006-08-14 2008-02-14 Zimmer Vincent J Network file system using a subsocket partitioned operating system platform
US20080126652A1 (en) * 2006-09-27 2008-05-29 Intel Corporation Managing Interrupts in a Partitioned Platform
US7949815B2 (en) 2006-09-27 2011-05-24 Intel Corporation Virtual heterogeneous channel for message passing
US7925809B2 (en) * 2006-10-24 2011-04-12 Apple Inc. Systems and methods for storage management in a data processing device
US9202087B2 (en) * 2006-10-31 2015-12-01 Verizon Patent And Licensing Inc. Method and apparatus for controlling access to local storage devices
US7996348B2 (en) 2006-12-08 2011-08-09 Pandya Ashish A 100GBPS security and search architecture using programmable intelligent search memory (PRISM) that comprises one or more bit interval counters
US9141557B2 (en) 2006-12-08 2015-09-22 Ashish A. Pandya Dynamic random access memory (DRAM) that comprises a programmable intelligent search memory (PRISM) and a cryptography processing engine
US7984454B2 (en) * 2006-12-19 2011-07-19 International Business Machines Corporation Migration of single root stateless virtual functions
US20080163063A1 (en) * 2006-12-29 2008-07-03 Sap Ag Graphical user interface system and method for presenting information related to session and cache objects
US7899663B2 (en) * 2007-03-30 2011-03-01 International Business Machines Corporation Providing memory consistency in an emulated processing environment
US8479208B2 (en) 2007-03-30 2013-07-02 Intel Corporation System partitioning to present software as platform level functionality including mode logic to maintain and enforce partitioning in first and configure partitioning in second mode
US8880582B2 (en) * 2007-03-30 2014-11-04 Hewlett-Packard Development Company, L.P. User access to a partitionable server
US8271258B2 (en) * 2007-03-30 2012-09-18 International Business Machines Corporation Emulated Z-series queued direct I/O
US7941613B2 (en) 2007-05-31 2011-05-10 Broadcom Corporation Shared memory architecture
JP5136550B2 (ja) * 2007-06-01 2013-02-06 富士通株式会社 情報処理装置及び情報処理装置の再構成方法
US20080306818A1 (en) * 2007-06-08 2008-12-11 Qurio Holdings, Inc. Multi-client streamer with late binding of ad content
US7969445B2 (en) * 2007-06-20 2011-06-28 Nvidia Corporation System, method, and computer program product for broadcasting write operations
US7996482B1 (en) 2007-07-31 2011-08-09 Qurio Holdings, Inc. RDMA based real-time video client playback architecture
US8041773B2 (en) 2007-09-24 2011-10-18 The Research Foundation Of State University Of New York Automatic clustering for self-organizing grids
US20090119584A1 (en) * 2007-11-02 2009-05-07 Steve Herbst Software Tool for Creating Outlines and Mind Maps that Generates Subtopics Automatically
KR101439844B1 (ko) * 2007-11-14 2014-09-17 삼성전자주식회사 저장 공간 할당 방법 및 장치
US7454478B1 (en) * 2007-11-30 2008-11-18 International Business Machines Corporation Business message tracking system using message queues and tracking queue for tracking transaction messages communicated between computers
US8762476B1 (en) 2007-12-20 2014-06-24 Qurio Holdings, Inc. RDMA to streaming protocol driver
US8751755B2 (en) 2007-12-27 2014-06-10 Sandisk Enterprise Ip Llc Mass storage controller volatile memory containing metadata related to flash memory storage
US8645965B2 (en) * 2007-12-31 2014-02-04 Intel Corporation Supporting metered clients with manycore through time-limited partitioning
US8090767B2 (en) 2008-01-07 2012-01-03 Apple Inc. Pairing and storage access scheme between a handheld device and a computing system
US9081694B2 (en) * 2008-01-14 2015-07-14 Bivio Networks, Inc. Systems and methods for asymmetric multiprocessing
US8893126B2 (en) * 2008-02-01 2014-11-18 International Business Machines Corporation Binding a process to a special purpose processing element having characteristics of a processor
US8060904B1 (en) 2008-02-25 2011-11-15 Qurio Holdings, Inc. Dynamic load based ad insertion
US8458438B2 (en) * 2008-02-26 2013-06-04 International Business Machines Corporation System, method and computer program product for providing quiesce filtering for shared memory
US8527715B2 (en) * 2008-02-26 2013-09-03 International Business Machines Corporation Providing a shared memory translation facility
US8380907B2 (en) * 2008-02-26 2013-02-19 International Business Machines Corporation Method, system and computer program product for providing filtering of GUEST2 quiesce requests
US8140834B2 (en) * 2008-02-26 2012-03-20 International Business Machines Corporation System, method and computer program product for providing a programmable quiesce filtering register
US8432810B2 (en) * 2008-03-28 2013-04-30 Apple Inc. Techniques for reducing buffer overflow in a communication system
US20110035413A1 (en) * 2008-04-18 2011-02-10 Thierry Bessis Diameter bus communications between processing nodes of a network element
US8429675B1 (en) * 2008-06-13 2013-04-23 Netapp, Inc. Virtual machine communication
US7650488B2 (en) * 2008-06-18 2010-01-19 Intel Corporation Communication between processor core partitions with exclusive read or write to descriptor queues for shared memory space
US9513695B2 (en) 2008-06-24 2016-12-06 Virident Systems, Inc. Methods of managing power in network computer systems
US8521967B1 (en) * 2008-06-24 2013-08-27 Virident Systems, Inc. Network computing systems having shared memory clouds with addresses of disk-read-only memories mapped into processor address spaces
US8271996B1 (en) * 2008-09-29 2012-09-18 Emc Corporation Event queues
US8244518B2 (en) * 2009-01-19 2012-08-14 International Business Machines Corporation Input/output processor (IOP) based zSeries emulation
US8225069B2 (en) 2009-03-31 2012-07-17 Intel Corporation Control of on-die system fabric blocks
US8996556B2 (en) * 2009-06-05 2015-03-31 Microsoft Technology Licensing, Llc Parallel processing of an ordered data stream
US8171280B2 (en) * 2009-06-22 2012-05-01 Matthew Laue Method of running multiple operating systems on an X86-based computer system having a dedicated memory region configured as a do not use region
JP5413001B2 (ja) * 2009-07-09 2014-02-12 富士通株式会社 キャッシュメモリ
US9256560B2 (en) * 2009-07-29 2016-02-09 Solarflare Communications, Inc. Controller integration
KR101593993B1 (ko) * 2009-08-10 2016-02-26 삼성전자주식회사 웹 애플리케이션 간의 데이터 통신 장치 및 방법
US9876735B2 (en) 2009-10-30 2018-01-23 Iii Holdings 2, Llc Performance and power optimized computer system architectures and methods leveraging power optimized tree fabric interconnect
US9077654B2 (en) 2009-10-30 2015-07-07 Iii Holdings 2, Llc System and method for data center security enhancements leveraging managed server SOCs
US9465771B2 (en) 2009-09-24 2016-10-11 Iii Holdings 2, Llc Server on a chip and node cards comprising one or more of same
US9054990B2 (en) 2009-10-30 2015-06-09 Iii Holdings 2, Llc System and method for data center security enhancements leveraging server SOCs or server fabrics
US20110103391A1 (en) 2009-10-30 2011-05-05 Smooth-Stone, Inc. C/O Barry Evans System and method for high-performance, low-power data center interconnect fabric
US9069929B2 (en) 2011-10-31 2015-06-30 Iii Holdings 2, Llc Arbitrating usage of serial port in node card of scalable and modular servers
US8599863B2 (en) 2009-10-30 2013-12-03 Calxeda, Inc. System and method for using a multi-protocol fabric module across a distributed server interconnect fabric
US20130107444A1 (en) 2011-10-28 2013-05-02 Calxeda, Inc. System and method for flexible storage and networking provisioning in large scalable processor installations
US9680770B2 (en) 2009-10-30 2017-06-13 Iii Holdings 2, Llc System and method for using a multi-protocol fabric module across a distributed server interconnect fabric
US9648102B1 (en) 2012-12-27 2017-05-09 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US9311269B2 (en) 2009-10-30 2016-04-12 Iii Holdings 2, Llc Network proxy for high-performance, low-power data center interconnect fabric
US10877695B2 (en) 2009-10-30 2020-12-29 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US11720290B2 (en) 2009-10-30 2023-08-08 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
EP2497026B1 (en) * 2009-11-04 2016-12-07 Deere & Company Electronic data processing system having a virtual bus server application
US8453149B2 (en) * 2010-01-21 2013-05-28 International Business Machines Corporation Efficient multi-core processing of events
US8341643B2 (en) * 2010-03-29 2012-12-25 International Business Machines Corporation Protecting shared resources using shared memory and sockets
US8477610B2 (en) * 2010-05-31 2013-07-02 Microsoft Corporation Applying policies to schedule network bandwidth among virtual machines
US8634302B2 (en) 2010-07-30 2014-01-21 Alcatel Lucent Apparatus for multi-cell support in a network
US8229943B2 (en) * 2010-08-26 2012-07-24 Hewlett-Packard Development Company, L.P. System and method for modifying an executing query
US8473565B2 (en) * 2010-09-10 2013-06-25 International Business Machines Corporation Abstracting special file interfaces to concurrently support multiple operating system levels
US20120093047A1 (en) * 2010-10-14 2012-04-19 Alcatel-Lucent USA Inc. via the Electronic Patent Assignment System (EPAS) Core abstraction layer for telecommunication network applications
US8504744B2 (en) 2010-10-28 2013-08-06 Alcatel Lucent Lock-less buffer management scheme for telecommunication network applications
US8737417B2 (en) 2010-11-12 2014-05-27 Alcatel Lucent Lock-less and zero copy messaging scheme for telecommunication network applications
US8730790B2 (en) 2010-11-19 2014-05-20 Alcatel Lucent Method and system for cell recovery in telecommunication networks
US8861434B2 (en) 2010-11-29 2014-10-14 Alcatel Lucent Method and system for improved multi-cell support on a single modem board
US8966222B2 (en) * 2010-12-15 2015-02-24 Microsoft Corporation Message passing in a cluster-on-chip computing environment
EP2663919B1 (en) 2011-01-11 2019-07-03 A10 Networks Inc. Virtual application delivery chassis system
EP2482220A1 (en) * 2011-01-27 2012-08-01 SafeNet, Inc. Multi-enclave token
US8813071B2 (en) 2011-01-31 2014-08-19 Symantec Corporation Storage reclamation systems and methods
US8806159B2 (en) 2011-04-08 2014-08-12 Symantec Corporation Data storage resource management systems and methods
US20140032796A1 (en) * 2011-04-13 2014-01-30 Michael R. Krause Input/output processing
US20140032795A1 (en) 2011-04-13 2014-01-30 Hewlett-Packard Development Company, L.P. Input/output processing
WO2012141695A1 (en) * 2011-04-13 2012-10-18 Hewlett-Packard Development Company, L.P. Input/output processing
US8799592B2 (en) 2011-04-20 2014-08-05 International Business Machines Corporation Direct memory access-like data transfer between guest operating systems
US8954435B2 (en) 2011-04-22 2015-02-10 Symantec Corporation Method and system for reclaiming storage on a shared storage device or independent of the mount state of a file system
US8751768B2 (en) * 2011-04-29 2014-06-10 Symantec Corporation Data storage reclamation systems and methods
US20120284501A1 (en) * 2011-05-06 2012-11-08 Xcelemor, Inc. Computing system with hardware reconfiguration mechanism and method of operation thereof
WO2012163275A1 (zh) * 2011-05-30 2012-12-06 联想(北京)有限公司 控制方法、控制装置以及计算机系统
US9154577B2 (en) 2011-06-06 2015-10-06 A10 Networks, Inc. Sychronization of configuration file of virtual application distribution chassis
US8909982B2 (en) 2011-06-19 2014-12-09 Sandisk Enterprise Ip Llc System and method for detecting copyback programming problems
US8910020B2 (en) 2011-06-19 2014-12-09 Sandisk Enterprise Ip Llc Intelligent bit recovery for flash memory
US9357482B2 (en) 2011-07-13 2016-05-31 Alcatel Lucent Method and system for dynamic power control for base stations
US9619247B2 (en) * 2011-07-15 2017-04-11 Microsoft Technology Licensing, Llc Enabling fast string acquisition in an operating system for efficient interoperations with various language projections
US9213618B2 (en) 2011-09-16 2015-12-15 Symantec Corporation Storage management systems and methods in hierarchical storage systems
JP5935806B2 (ja) * 2011-09-26 2016-06-15 日本電気株式会社 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム
US9473596B2 (en) 2011-09-27 2016-10-18 International Business Machines Corporation Using transmission control protocol/internet protocol (TCP/IP) to setup high speed out of band data communication connections
WO2013048943A1 (en) 2011-09-30 2013-04-04 Intel Corporation Active state power management (aspm) to reduce power consumption by pci express components
US8938658B2 (en) 2011-11-07 2015-01-20 Sandisk Enterprise Ip Llc Statistical read comparison signal generation for memory systems
US8924815B2 (en) 2011-11-18 2014-12-30 Sandisk Enterprise Ip Llc Systems, methods and devices for decoding codewords having multiple parity segments
US8954822B2 (en) 2011-11-18 2015-02-10 Sandisk Enterprise Ip Llc Data encoder and decoder using memory-specific parity-check matrix
US9048876B2 (en) 2011-11-18 2015-06-02 Sandisk Enterprise Ip Llc Systems, methods and devices for multi-tiered error correction
KR101949417B1 (ko) * 2011-12-02 2019-02-20 삼성전자주식회사 프로세서, 명령어 생성 장치 및 방법
KR101920239B1 (ko) * 2012-03-06 2018-11-20 삼성전자주식회사 파일 시스템 기능을 제공하는 단말기의 장치 및 방법
CN102662853A (zh) * 2012-03-22 2012-09-12 北京北大众志微系统科技有限责任公司 实现使用存储级并行的内存管理方法及装置
US8615766B2 (en) * 2012-05-01 2013-12-24 Concurix Corporation Hybrid operating system
US8880935B2 (en) 2012-06-12 2014-11-04 International Business Machines Corporation Redundancy and load balancing in remote direct memory access communications
US9396101B2 (en) 2012-06-12 2016-07-19 International Business Machines Corporation Shared physical memory protocol
US8930507B2 (en) 2012-06-12 2015-01-06 International Business Machines Corporation Physical memory shared among logical partitions in a VLAN
US8924952B1 (en) * 2012-06-27 2014-12-30 Amazon Technologies, Inc. Updating software utilizing multiple partitions
US9699263B1 (en) 2012-08-17 2017-07-04 Sandisk Technologies Llc. Automatic read and write acceleration of data accessed by virtual machines
WO2014074239A2 (en) * 2012-09-25 2014-05-15 Openpeak Inc. Method and system for sharing vpn connections between applications
US9047057B2 (en) * 2012-11-16 2015-06-02 International Business Machines Corporation Accessing additional memory space with multiple processors
US20140143372A1 (en) * 2012-11-20 2014-05-22 Unisys Corporation System and method of constructing a memory-based interconnect between multiple partitions
US9501398B2 (en) 2012-12-26 2016-11-22 Sandisk Technologies Llc Persistent storage device with NVRAM for staging writes
US9612948B2 (en) 2012-12-27 2017-04-04 Sandisk Technologies Llc Reads and writes between a contiguous data block and noncontiguous sets of logical address blocks in a persistent storage device
US9239751B1 (en) 2012-12-27 2016-01-19 Sandisk Enterprise Ip Llc Compressing data from multiple reads for error control management in memory systems
US9003264B1 (en) 2012-12-31 2015-04-07 Sandisk Enterprise Ip Llc Systems, methods, and devices for multi-dimensional flash RAID data protection
US9454420B1 (en) 2012-12-31 2016-09-27 Sandisk Technologies Llc Method and system of reading threshold voltage equalization
US9329928B2 (en) 2013-02-20 2016-05-03 Sandisk Enterprise IP LLC. Bandwidth optimization in a non-volatile memory system
US9214965B2 (en) 2013-02-20 2015-12-15 Sandisk Enterprise Ip Llc Method and system for improving data integrity in non-volatile storage
US9459910B1 (en) * 2013-03-13 2016-10-04 Emc Corporation Controlling a layered driver
US9431077B2 (en) * 2013-03-13 2016-08-30 Qualcomm Incorporated Dual host embedded shared device controller
US9870830B1 (en) 2013-03-14 2018-01-16 Sandisk Technologies Llc Optimal multilevel sensing for reading data from a storage medium
US9367246B2 (en) 2013-03-15 2016-06-14 Sandisk Technologies Inc. Performance optimization of data transfer for soft information generation
US9092350B1 (en) 2013-03-15 2015-07-28 Sandisk Enterprise Ip Llc Detection and handling of unbalanced errors in interleaved codewords
US9244763B1 (en) 2013-03-15 2016-01-26 Sandisk Enterprise Ip Llc System and method for updating a reading threshold voltage based on symbol transition information
US9009576B1 (en) 2013-03-15 2015-04-14 Sandisk Enterprise Ip Llc Adaptive LLR based on syndrome weight
US9236886B1 (en) 2013-03-15 2016-01-12 Sandisk Enterprise Ip Llc Universal and reconfigurable QC-LDPC encoder
US9170941B2 (en) 2013-04-05 2015-10-27 Sandisk Enterprises IP LLC Data hardening in a storage system
US10049037B2 (en) 2013-04-05 2018-08-14 Sandisk Enterprise Ip Llc Data management in a storage system
US9658867B2 (en) * 2013-05-30 2017-05-23 Hewlett Packard Enterprise Development Lp Preserving object code translations of a library for future reuse by an emulator
US9159437B2 (en) 2013-06-11 2015-10-13 Sandisk Enterprise IP LLC. Device and method for resolving an LM flag issue
US9813485B2 (en) * 2013-06-14 2017-11-07 1E Limited Communication of virtual machine data
US9384126B1 (en) 2013-07-25 2016-07-05 Sandisk Technologies Inc. Methods and systems to avoid false negative results in bloom filters implemented in non-volatile data storage systems
US9524235B1 (en) 2013-07-25 2016-12-20 Sandisk Technologies Llc Local hash value generation in non-volatile data storage systems
US9043517B1 (en) 2013-07-25 2015-05-26 Sandisk Enterprise Ip Llc Multipass programming in buffers implemented in non-volatile data storage systems
US9361221B1 (en) 2013-08-26 2016-06-07 Sandisk Technologies Inc. Write amplification reduction through reliable writes during garbage collection
US9639463B1 (en) 2013-08-26 2017-05-02 Sandisk Technologies Llc Heuristic aware garbage collection scheme in storage systems
US9628433B2 (en) * 2013-08-27 2017-04-18 International Business Machines Corporation Transmission of short message service (SMS) message and notifications in virtualized wireless mobile computing device based on the status of intended recipient
US9442670B2 (en) 2013-09-03 2016-09-13 Sandisk Technologies Llc Method and system for rebalancing data stored in flash memory devices
US9519577B2 (en) 2013-09-03 2016-12-13 Sandisk Technologies Llc Method and system for migrating data between flash memory devices
WO2015047416A1 (en) * 2013-09-30 2015-04-02 Hewlett-Packard Development Company, L.P. Selecting operating systems based on a computing device mode
US9158349B2 (en) 2013-10-04 2015-10-13 Sandisk Enterprise Ip Llc System and method for heat dissipation
US9323637B2 (en) 2013-10-07 2016-04-26 Sandisk Enterprise Ip Llc Power sequencing and data hardening architecture
US9298608B2 (en) 2013-10-18 2016-03-29 Sandisk Enterprise Ip Llc Biasing for wear leveling in storage systems
US9436831B2 (en) 2013-10-30 2016-09-06 Sandisk Technologies Llc Secure erase in a memory device
US9263156B2 (en) 2013-11-07 2016-02-16 Sandisk Enterprise Ip Llc System and method for adjusting trip points within a storage device
US9244785B2 (en) 2013-11-13 2016-01-26 Sandisk Enterprise Ip Llc Simulated power failure and data hardening
US9152555B2 (en) 2013-11-15 2015-10-06 Sandisk Enterprise IP LLC. Data management with modular erase in a data storage system
US9703816B2 (en) 2013-11-19 2017-07-11 Sandisk Technologies Llc Method and system for forward reference logging in a persistent datastore
US9520197B2 (en) 2013-11-22 2016-12-13 Sandisk Technologies Llc Adaptive erase of a storage device
US9520162B2 (en) 2013-11-27 2016-12-13 Sandisk Technologies Llc DIMM device controller supervisor
US9122636B2 (en) 2013-11-27 2015-09-01 Sandisk Enterprise Ip Llc Hard power fail architecture
US9280429B2 (en) 2013-11-27 2016-03-08 Sandisk Enterprise Ip Llc Power fail latching based on monitoring multiple power supply voltages in a storage device
US9250676B2 (en) 2013-11-29 2016-02-02 Sandisk Enterprise Ip Llc Power failure architecture and verification
US9092370B2 (en) 2013-12-03 2015-07-28 Sandisk Enterprise Ip Llc Power failure tolerant cryptographic erase
US9235245B2 (en) 2013-12-04 2016-01-12 Sandisk Enterprise Ip Llc Startup performance and power isolation
CN104699627B (zh) * 2013-12-06 2019-05-07 上海芯豪微电子有限公司 一种缓存系统和方法
US9129665B2 (en) 2013-12-17 2015-09-08 Sandisk Enterprise Ip Llc Dynamic brownout adjustment in a storage device
US9639478B2 (en) 2014-01-17 2017-05-02 International Business Machines Corporation Controlling direct memory access page mappings
US10049216B2 (en) 2014-02-06 2018-08-14 Intel Corporation Media protection policy enforcement for multiple-operating-system environments
US9549457B2 (en) 2014-02-12 2017-01-17 Sandisk Technologies Llc System and method for redirecting airflow across an electronic assembly
US9703636B2 (en) 2014-03-01 2017-07-11 Sandisk Technologies Llc Firmware reversion trigger and control
US9519319B2 (en) 2014-03-14 2016-12-13 Sandisk Technologies Llc Self-supporting thermal tube structure for electronic assemblies
US9485851B2 (en) 2014-03-14 2016-11-01 Sandisk Technologies Llc Thermal tube assembly structures
US9348377B2 (en) 2014-03-14 2016-05-24 Sandisk Enterprise Ip Llc Thermal isolation techniques
US9448876B2 (en) 2014-03-19 2016-09-20 Sandisk Technologies Llc Fault detection and prediction in storage devices
US9454448B2 (en) 2014-03-19 2016-09-27 Sandisk Technologies Llc Fault testing in storage devices
US9390814B2 (en) 2014-03-19 2016-07-12 Sandisk Technologies Llc Fault detection and prediction for data storage elements
US9626400B2 (en) 2014-03-31 2017-04-18 Sandisk Technologies Llc Compaction of information in tiered data structure
US9390021B2 (en) 2014-03-31 2016-07-12 Sandisk Technologies Llc Efficient cache utilization in a tiered data structure
US9626399B2 (en) 2014-03-31 2017-04-18 Sandisk Technologies Llc Conditional updates for reducing frequency of data modification operations
US9697267B2 (en) 2014-04-03 2017-07-04 Sandisk Technologies Llc Methods and systems for performing efficient snapshots in tiered data structures
US9846658B2 (en) * 2014-04-21 2017-12-19 Cisco Technology, Inc. Dynamic temporary use of packet memory as resource memory
WO2015161456A1 (zh) * 2014-04-22 2015-10-29 华为终端有限公司 一种具有多操作系统的终端
US10742559B2 (en) 2014-04-24 2020-08-11 A10 Networks, Inc. Eliminating data traffic redirection in scalable clusters
US9961130B2 (en) 2014-04-24 2018-05-01 A10 Networks, Inc. Distributed high availability processing methods for service sessions
US10152331B2 (en) 2014-05-16 2018-12-11 Wind River Systems, Inc. Method and system for enforcing kernel mode access protection
US10656840B2 (en) 2014-05-30 2020-05-19 Sandisk Technologies Llc Real-time I/O pattern recognition to enhance performance and endurance of a storage device
US10656842B2 (en) 2014-05-30 2020-05-19 Sandisk Technologies Llc Using history of I/O sizes and I/O sequences to trigger coalesced writes in a non-volatile storage device
US10114557B2 (en) 2014-05-30 2018-10-30 Sandisk Technologies Llc Identification of hot regions to enhance performance and endurance of a non-volatile storage device
US9645749B2 (en) 2014-05-30 2017-05-09 Sandisk Technologies Llc Method and system for recharacterizing the storage density of a memory device or a portion thereof
US10146448B2 (en) 2014-05-30 2018-12-04 Sandisk Technologies Llc Using history of I/O sequences to trigger cached read ahead in a non-volatile storage device
US9093160B1 (en) 2014-05-30 2015-07-28 Sandisk Technologies Inc. Methods and systems for staggered memory operations
US10372613B2 (en) 2014-05-30 2019-08-06 Sandisk Technologies Llc Using sub-region I/O history to cache repeatedly accessed sub-regions in a non-volatile storage device
US10162748B2 (en) 2014-05-30 2018-12-25 Sandisk Technologies Llc Prioritizing garbage collection and block allocation based on I/O history for logical address regions
US9070481B1 (en) 2014-05-30 2015-06-30 Sandisk Technologies Inc. Internal current measurement for age measurements
US8891303B1 (en) 2014-05-30 2014-11-18 Sandisk Technologies Inc. Method and system for dynamic word line based configuration of a three-dimensional memory device
US9703491B2 (en) 2014-05-30 2017-07-11 Sandisk Technologies Llc Using history of unaligned writes to cache data and avoid read-modify-writes in a non-volatile storage device
US9652381B2 (en) 2014-06-19 2017-05-16 Sandisk Technologies Llc Sub-block garbage collection
WO2016014017A1 (en) * 2014-07-21 2016-01-28 Hewlett-Packard Development Company, L.P. Operating system device access using a virtual machine
US9443601B2 (en) 2014-09-08 2016-09-13 Sandisk Technologies Llc Holdup capacitor energy harvesting
US9262407B1 (en) * 2014-09-19 2016-02-16 International Business Machines Corporation Optimization of a multi-language user interface layout via reverse pseudo-translation
US9424173B2 (en) 2014-10-23 2016-08-23 GlobalFoundries, Inc. Performing secure address relocation within a multi-processor system sharing a same physical memory channel to external memory
CN106293956A (zh) * 2015-06-03 2017-01-04 中兴通讯股份有限公司 一种应用程序间数据传输的方法及装置
US10657274B2 (en) * 2015-06-29 2020-05-19 Samsng Electronics Co., Ltd. Semiconductor device including memory protector
US10318288B2 (en) 2016-01-13 2019-06-11 A10 Networks, Inc. System and method to process a chain of network applications
CN106021000B (zh) * 2016-06-02 2018-06-01 北京百度网讯科技有限公司 用于机器人操作系统的共享内存管理方法和装置
US10114559B2 (en) * 2016-08-12 2018-10-30 International Business Machines Corporation Generating node access information for a transaction accessing nodes of a data set index
US9971691B2 (en) * 2016-09-12 2018-05-15 Intel Corporation Selevtive application of interleave based on type of data to be stored in memory
US9678865B1 (en) * 2016-09-23 2017-06-13 International Business Machines Corporation Pre-allocating save areas of a memory
US10481951B2 (en) * 2016-11-15 2019-11-19 Red Hat Israel, Ltd. Multi-queue device assignment for application groups
US10635336B1 (en) * 2016-12-16 2020-04-28 Amazon Technologies, Inc. Cache-based partition allocation
CN106874105A (zh) * 2016-12-23 2017-06-20 北京北大众志微系统科技有限责任公司 一种基于数据对象感知的内存库划分方法和装置
US10241688B2 (en) * 2017-03-09 2019-03-26 International Business Machines Corporation I/O amplification for determining to increase workload
US10289330B2 (en) 2017-03-30 2019-05-14 Western Digital Technologies, Inc. Allocating shared memory among multiple tasks in a multiprocessor environment
WO2019067334A1 (en) * 2017-09-29 2019-04-04 Knowles Electronics, Llc MULTICORDER AUDIO PROCESSOR WITH FLEXIBLE MEMORY ALLOCATION
US10866740B2 (en) * 2018-10-01 2020-12-15 Western Digital Technologies, Inc. System and method for performance-based multiple namespace resource allocation in a memory
US11640361B2 (en) 2019-03-08 2023-05-02 International Business Machines Corporation Sharing secure memory across multiple security domains
US11487906B2 (en) 2019-03-08 2022-11-01 International Business Machines Corporation Storage sharing between a secure domain and a non-secure entity
US11531627B2 (en) 2019-03-08 2022-12-20 International Business Machines Corporation Secure storage isolation
DE102019215295A1 (de) * 2019-10-04 2021-04-08 Robert Bosch Gmbh Datenstruktur, Speichermittel und Vorrichtung
US20220345378A1 (en) * 2021-04-26 2022-10-27 Hewlett Packard Enterprise Development Lp Electronic paper-based display device node fault visualization
CN113699637A (zh) * 2021-09-05 2021-11-26 江阴市子龙呢绒有限公司 一种新型提花机操作系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62219147A (ja) * 1986-03-20 1987-09-26 Fujitsu Ltd 仮想計算機システムにおける共通メモリ方式
JPH02158858A (ja) * 1988-10-28 1990-06-19 Internatl Business Mach Corp <Ibm> メツセージ転送機構
US5590301A (en) * 1995-10-06 1996-12-31 Bull Hn Information Systems Inc. Address transformation in a cluster computer system

Family Cites Families (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3641505A (en) 1969-06-25 1972-02-08 Bell Telephone Labor Inc Multiprocessor computer adapted for partitioning into a plurality of independently operating systems
US3812469A (en) 1972-05-12 1974-05-21 Burroughs Corp Multiprocessing system having means for partitioning into independent processing subsystems
US4000485A (en) 1975-06-30 1976-12-28 Honeywell Information Systems, Inc. Data processing system providing locked operation of shared resources
US4253146A (en) 1978-12-21 1981-02-24 Burroughs Corporation Module for coupling computer-processors
US4245306A (en) 1978-12-21 1981-01-13 Burroughs Corporation Selection of addressed processor in a multi-processor network
US4253144A (en) 1978-12-21 1981-02-24 Burroughs Corporation Multi-processor communication network
US4240143A (en) 1978-12-22 1980-12-16 Burroughs Corporation Hierarchical multi-processor network for memory sharing
US4488217A (en) 1979-03-12 1984-12-11 Digital Equipment Corporation Data processing system with lock-unlock instruction facility
US4392196A (en) 1980-08-11 1983-07-05 Harris Corporation Multi-processor time alignment control system
US4466059A (en) 1981-10-15 1984-08-14 International Business Machines Corporation Method and apparatus for limiting data occupancy in a cache
US4441155A (en) 1981-11-23 1984-04-03 International Business Machines Corporation Page controlled cache directory addressing
US4464717A (en) 1982-03-31 1984-08-07 Honeywell Information Systems Inc. Multilevel cache system with graceful degradation capability
US4586133A (en) 1983-04-05 1986-04-29 Burroughs Corporation Multilevel controller for a cache memory interface in a multiprocessing system
US4686621A (en) 1983-06-30 1987-08-11 Honeywell Information Systems Inc. Test apparatus for testing a multilevel cache system with graceful degradation capability
US4562536A (en) 1983-06-30 1985-12-31 Honeywell Information Systems Inc. Directory test error mode control apparatus
US4667288A (en) 1983-06-30 1987-05-19 Honeywell Information Systems Inc. Enable/disable control checking apparatus
US4564903A (en) 1983-10-05 1986-01-14 International Business Machines Corporation Partitioned multiprocessor programming system
US5392409A (en) * 1984-01-18 1995-02-21 Hitachi, Ltd. I/O execution method for a virtual machine system and system therefor
US5067071A (en) 1985-02-27 1991-11-19 Encore Computer Corporation Multiprocessor computer system employing a plurality of tightly coupled processors with interrupt vector bus
US4875155A (en) 1985-06-28 1989-10-17 International Business Machines Corporation Peripheral subsystem having read/write cache with record access
JPS62194563A (ja) 1986-02-21 1987-08-27 Hitachi Ltd バツフア記憶装置
US5123101A (en) 1986-11-12 1992-06-16 Xerox Corporation Multiple address space mapping technique for shared memory wherein a processor operates a fault handling routine upon a translator miss
US5142683A (en) 1987-03-09 1992-08-25 Unisys Corporation Intercomputer communication control apparatus and method
US4843541A (en) * 1987-07-29 1989-06-27 International Business Machines Corporation Logical resource partitioning of a data processing system
US5016167A (en) 1987-12-21 1991-05-14 Amdahl Corporation Resource contention deadlock detection and prevention
US5251308A (en) 1987-12-22 1993-10-05 Kendall Square Research Corporation Shared memory multiprocessor with data hiding and post-store
JPH01246656A (ja) 1988-03-29 1989-10-02 Nec Corp プロセッサ間共有メモリ管理方式
AU3594189A (en) 1988-06-21 1990-01-04 Amdahl Corporation Controlling the initiation of logical systems in a data processing system with logical processor facility
JPH02128267A (ja) * 1988-11-09 1990-05-16 Fujitsu Ltd 共有メモリによる通信方式
US4929940A (en) 1988-11-18 1990-05-29 International Business Machines Corporation Collision crossbar switch
US5117350A (en) 1988-12-15 1992-05-26 Flashpoint Computer Corporation Memory address mechanism in a distributed memory architecture
US5142676A (en) 1988-12-28 1992-08-25 Gte Laboratories Incorporated Separate content addressable memories for storing locked segment addresses and locking processor identifications for controlling access to shared memory
US5060136A (en) 1989-01-06 1991-10-22 International Business Machines Corp. Four-way associative cache with dlat and separately addressable arrays used for updating certain bits without reading them out first
US4967414A (en) 1989-01-06 1990-10-30 International Business Machines Corp. LRU error detection using the collection of read and written LRU bits
US5237670A (en) 1989-01-30 1993-08-17 Alantec, Inc. Method and apparatus for data transfer between source and destination modules
JP2833062B2 (ja) 1989-10-30 1998-12-09 株式会社日立製作所 キャッシュメモリ制御方法とこのキャッシュメモリ制御方法を用いたプロセッサおよび情報処理装置
US5136714A (en) * 1989-12-04 1992-08-04 International Business Machines Corporation Method and apparatus for implementing inter-processor interrupts using shared memory storage in a multi-processor computer system
JP2826857B2 (ja) 1989-12-13 1998-11-18 株式会社日立製作所 キャッシュ制御方法および制御装置
US5123094A (en) 1990-01-26 1992-06-16 Apple Computer, Inc. Interprocessor communications includes second CPU designating memory locations assigned to first CPU and writing their addresses into registers
DE69029084D1 (de) 1990-02-27 1996-12-12 Ibm Nachrichtenführungseinrichtung durch mehrere Rechner, die mittels eines geteilten intelligenten Speichers gekoppelt sind
US5297269A (en) 1990-04-26 1994-03-22 Digital Equipment Company Cache coherency protocol for multi processor computer system
JPH0619759B2 (ja) * 1990-05-21 1994-03-16 富士ゼロックス株式会社 マルチプロセッサシステムにおける相互通信方法
US5276896A (en) 1990-06-11 1994-01-04 Unisys Corporation Apparatus for implementing data communications between terminal devices and user programs
JPH04119445A (ja) 1990-09-11 1992-04-20 Canon Inc 計算機システム
EP0490595B1 (en) * 1990-12-14 1998-05-20 Sun Microsystems, Inc. Method for operating time critical processes in a window system environment
JPH04367963A (ja) 1991-06-15 1992-12-21 Hitachi Ltd 共有記憶通信方法
US5687342A (en) 1991-09-18 1997-11-11 Ncr Corporation Memory range detector and translator
US5727179A (en) 1991-11-27 1998-03-10 Canon Kabushiki Kaisha Memory access method using intermediate addresses
US5426748A (en) 1992-01-03 1995-06-20 International Business Machines Corporation Guest/host extended addressing method and means with contiguous access list entries
US5408629A (en) 1992-08-13 1995-04-18 Unisys Corporation Apparatus and method for controlling exclusive access to portions of addressable memory in a multiprocessor system
JPH06110781A (ja) 1992-09-30 1994-04-22 Nec Corp キャッシュメモリ装置
EP0613088A1 (en) 1993-02-24 1994-08-31 Digital Equipment Corporation Method of memory interleaving and memory systems interleaved thereby
JP2809961B2 (ja) 1993-03-02 1998-10-15 株式会社東芝 マルチプロセッサ
JPH06314264A (ja) 1993-05-06 1994-11-08 Nec Corp セルフ・ルーティング・クロスバー・スイッチ
US5499354A (en) 1993-05-19 1996-03-12 International Business Machines Corporation Method and means for dynamic cache management by variable space and time binding and rebinding of cache extents to DASD cylinders
US5652885A (en) 1993-05-25 1997-07-29 Storage Technology Corporation Interprocess communications system and method utilizing shared memory for message transfer and datagram sockets for message control
FR2707774B1 (fr) 1993-07-15 1995-08-18 Bull Sa Procédé de gestion cohérente des échanges entre des niveaux d'une hiérarchie de mémoires à au moins trois niveaux.
US5504874A (en) 1993-09-29 1996-04-02 Silicon Graphics, Inc. System and method of implementing read resources to maintain cache coherency in a multiprocessor environment permitting split transactions
WO1995025306A2 (en) 1994-03-14 1995-09-21 Stanford University Distributed shared-cache for multi-processors
US5530837A (en) 1994-03-28 1996-06-25 Hewlett-Packard Co. Methods and apparatus for interleaving memory transactions into an arbitrary number of banks
US5490280A (en) 1994-03-31 1996-02-06 Intel Corporation Apparatus and method for entry allocation for a resource buffer
JPH07281925A (ja) * 1994-04-06 1995-10-27 Fujitsu Ltd マルチプロセッサシミュレーション装置
US5465336A (en) 1994-06-30 1995-11-07 International Business Machines Corporation Fetch and store buffer that enables out-of-order execution of memory instructions in a data processing system
US5555399A (en) * 1994-07-07 1996-09-10 International Business Machines Corporation Dynamic idle list size processing in a virtual memory management operating system
US5842226A (en) 1994-09-09 1998-11-24 International Business Machines Corporation Virtual memory management for a microkernel system with multiple operating systems
JP2783164B2 (ja) 1994-09-14 1998-08-06 日本電気株式会社 通信網
US5717942A (en) 1994-12-27 1998-02-10 Unisys Corporation Reset for independent partitions within a computer system
US5689713A (en) 1995-03-31 1997-11-18 Sun Microsystems, Inc. Method and apparatus for interrupt communication in a packet-switched computer system
US5809539A (en) 1995-04-27 1998-09-15 Hitachi, Ltd. Processor system having address allocation and address lock capability adapted for a memory comprised of synchronous DRAMs
US5838955A (en) 1995-05-03 1998-11-17 Apple Computer, Inc. Controller for providing access to a video frame buffer in split-bus transaction environment
US5619471A (en) 1995-06-06 1997-04-08 Apple Computer, Inc. Memory controller for both interleaved and non-interleaved memory
US5925099A (en) * 1995-06-15 1999-07-20 Intel Corporation Method and apparatus for transporting messages between processors in a multiple processor system
US5852718A (en) 1995-07-06 1998-12-22 Sun Microsystems, Inc. Method and apparatus for hybrid packet-switched and circuit-switched flow control in a computer system
US5657390A (en) * 1995-08-25 1997-08-12 Netscape Communications Corporation Secure socket layer application program apparatus and method
US5940870A (en) 1996-05-21 1999-08-17 Industrial Technology Research Institute Address translation for shared-memory multiprocessor clustering
US5717897A (en) 1996-09-09 1998-02-10 Unisys Corporation System for coordinating coherency of cache memories of multiple host computers of a distributed information system
EP0931290A1 (en) 1997-03-21 1999-07-28 International Business Machines Corporation Address mapping for system memory
US6092166A (en) * 1997-04-30 2000-07-18 International Business Machines Corporation Cross-system data piping method using an external shared memory
US5870589A (en) * 1997-07-23 1999-02-09 International Business Machines Corporation Method for enhanced broadcast and unknown server operation
US5935212A (en) * 1997-08-07 1999-08-10 I-Planet, Inc. Connection-oriented session emulation
US5894566A (en) * 1997-09-26 1999-04-13 Mci Communications Corporation System and method for emulating network outages a segmented architecture
US6366947B1 (en) * 1998-01-20 2002-04-02 Redmond Venture, Inc. System and method for accelerating network interaction
US6314501B1 (en) 1998-07-23 2001-11-06 Unisys Corporation Computer system and method for operating multiple operating systems in different partitions of the computer system and for allowing the different partitions to communicate with one another through shared memory
DE69912478T2 (de) 1998-12-18 2004-08-19 Unisys Corp. Speicher-adressen-übersetzungs-anordnung und verfahren für einen speicher mit mehreren speichereinheiten
US6658469B1 (en) * 1998-12-18 2003-12-02 Microsoft Corporation Method and system for switching between network transport providers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62219147A (ja) * 1986-03-20 1987-09-26 Fujitsu Ltd 仮想計算機システムにおける共通メモリ方式
JPH02158858A (ja) * 1988-10-28 1990-06-19 Internatl Business Mach Corp <Ibm> メツセージ転送機構
US5590301A (en) * 1995-10-06 1996-12-31 Bull Hn Information Systems Inc. Address transformation in a cluster computer system
JPH11512857A (ja) * 1995-10-06 1999-11-02 ブル・エイチエヌ・インフォメーション・システムズ・インコーポレーテッド クラスタ・コンピュータ・システムにおけるアドレス変換

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217591A (ja) * 2007-03-06 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像形成装置、画像形成システム、アドレス変換処理プログラム
JP2010009567A (ja) * 2008-06-27 2010-01-14 Internatl Business Mach Corp <Ibm> 動的にマージされた物理パーティションを含む情報処理システムおよびこれを動作させる方法
US7743375B2 (en) 2008-06-27 2010-06-22 International Business Machines Corporation Information handling system including dynamically merged physical partitions
JP4550136B2 (ja) * 2008-06-27 2010-09-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 動的にマージされた物理パーティションを含む情報処理システムおよびこれを動作させる方法
JP2011118900A (ja) * 2009-11-30 2011-06-16 Internatl Business Mach Corp <Ibm> システムの立ち上げ時間を早めるための方法、装置およびコンピュータ・プログラム
US9928185B2 (en) 2015-01-30 2018-03-27 Fujitsu Limited Information processing apparatus and computer-readable recording medium having program recorded therein
KR20200019670A (ko) * 2017-06-19 2020-02-24 에이알엠 리미티드 한계 확인
KR102644529B1 (ko) * 2017-06-19 2024-03-08 에이알엠 리미티드 한계 확인

Also Published As

Publication number Publication date
EP1145122A2 (en) 2001-10-17
CA2355065A1 (en) 2000-06-22
US7571440B2 (en) 2009-08-04
JP2002532806A (ja) 2002-10-02
DE69935805T2 (de) 2007-12-27
ATE359550T1 (de) 2007-05-15
CA2355065C (en) 2004-03-16
US6314501B1 (en) 2001-11-06
DE69935805D1 (de) 2007-05-24
BR9916308A (pt) 2001-12-11
EP1145122B1 (en) 2007-04-11
WO2000036509A2 (en) 2000-06-22
WO2000036509A3 (en) 2001-04-19
US20030037178A1 (en) 2003-02-20

Similar Documents

Publication Publication Date Title
US6314501B1 (en) Computer system and method for operating multiple operating systems in different partitions of the computer system and for allowing the different partitions to communicate with one another through shared memory
US6785892B1 (en) Communications between partitioned host processors and management processor
TW544589B (en) Loosely coupled-multi processor server
US6925547B2 (en) Remote address translation in a multiprocessor system
US6163834A (en) Two level address translation and memory registration system and method
JP3777095B2 (ja) 論理区分化コンピュータのイベント・ドリブン通信インタフェース
JP3606551B2 (ja) 割込アーキテクチャを含むデータ処理システム、方法および記憶媒体
US9086905B2 (en) Interpreting I/O operation requests from pageable guests without host intervention
US6629152B2 (en) Message passing using shared memory of a computer
US7003586B1 (en) Arrangement for implementing kernel bypass for access by user mode consumer processes to a channel adapter based on virtual address mapping
US6598144B1 (en) Arrangement for limiting access to addresses by a consumer process instigating work in a channel adapter based on virtual address mapping
US6834332B2 (en) Apparatus and method for swapping-out real memory by inhibiting i/o operations to a memory region and setting a quiescent indicator, responsive to determining the current number of outstanding operations
US20050081202A1 (en) System and method for task queue management of virtual devices using a plurality of processors
US20150331722A1 (en) Rdma (remote direct memory access) data transfer in a virtual environment
US20020172199A1 (en) Node translation and protection in a clustered multiprocessor system
US7051180B2 (en) Masterless building block binding to partitions using identifiers and indicators
US20140130060A1 (en) User-level re-initialization instruction interception
US6950945B2 (en) Apparatus and method for intersystem lock optimization
US8006252B2 (en) Data processing system with intercepting instructions
EP1145128B1 (en) A memory address translation system and method for a memory having multiple storage units
JP3375649B2 (ja) 並列計算機
US20020124126A1 (en) Method and apparatus for managing access to a service processor
Liaaen et al. Dolphin SCI Adapter Cards.
US20200409759A1 (en) Zero copy message reception for devices
CN117170854A (zh) 一种内存访问方法及相关设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091023

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100402