JP2006209768A - メモリストアをコピーすることによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム - Google Patents

メモリストアをコピーすることによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム Download PDF

Info

Publication number
JP2006209768A
JP2006209768A JP2006016022A JP2006016022A JP2006209768A JP 2006209768 A JP2006209768 A JP 2006209768A JP 2006016022 A JP2006016022 A JP 2006016022A JP 2006016022 A JP2006016022 A JP 2006016022A JP 2006209768 A JP2006209768 A JP 2006209768A
Authority
JP
Japan
Prior art keywords
processor
user program
memory
value
instructions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006016022A
Other languages
English (en)
Other versions
JP4463212B2 (ja
Inventor
Vigna Paul Del Jr
ポール・デル・ビグナー・ジュニア
Robert L Jardine
ロバート・エル・ジャーディン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2006209768A publication Critical patent/JP2006209768A/ja
Application granted granted Critical
Publication of JP4463212B2 publication Critical patent/JP4463212B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3851Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1687Temporal synchronisation or re-synchronisation of redundant processing components at event level, e.g. by interrupt or result of polling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline, look ahead using a plurality of independent parallel functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/1641Error detection by comparing the output of redundant processing systems where the comparison is not performed by the redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1691Temporal synchronisation or re-synchronisation of redundant processing components using a quantum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
    • G06F11/183Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components
    • G06F11/184Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components where the redundant components implement processing functionality

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

【課題】ユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステムを提供する。
【解決手段】
本発明にかかるプロセッサベースの方法は、第1のプロセッサ及び第2のプロセッサで実行されるユーザプログラムの複製コピーの実行ポイントをアラインメントすることであって、第1のプロセッサにおいてユーザプログラムにより実行されるメモリストアのデータのみを、第1のプロセッサのメモリから第2のプロセッサのメモリへコピーすること、及び第1のプロセッサからのユーザプログラムのレジスタ状態を、第2のプロセッサによる使用のためにコピーすること、によってアラインメントすることを含む。
【選択図】図3

Description

本発明は、ユーザプログラムにおける実行ポイントのアラインメントに関する。
[関連出願の相互参照]
本出願は、「Method and System of Determining Whether An Application Program Has Made A System Level Call」と題する同時係属中の米国特許出願第11/042,981号(CR参照番号2162−30600)に関連する。
緩やかなロックステッププロセッサ(loosely lock-stepped processor)は、ユーザプログラムの複製コピーを実行するプロセッサであるが、これらのプロセッサは、ユーザプログラムの自身の各コピーを同じ歩調で実行する必要もなければ、同じウォールクロック時刻に実行する必要もない。緩やかなロックステッププロセッサは、宇宙線によって引き起こされるような計算誤りを検出して訂正するのに使用することができ、また、ユーザプログラムがハードウェア障害にもかかわらず動作し続けることを確実にするのに使用することもできる。
クロック周波数のわずかな相違のため、又は、或るプロセッサでは遭遇したが、他のプロセッサでは遭遇していない訂正可能なソフトエラーのため、或るプロセッサは、ユーザプログラム内の自身の実行ポイントにおいて進む(lead)ことがあり、プロセッサにおいてユーザプログラムが進んでいるのか、それとも遅れているのかを判断することは難しい。プログラムカウンタ又は命令ポインタの比較は、ユーザプログラムの実行ポイントを十分に特定することができない。その理由は、すべてのユーザプログラムは、同じソフトウェアループにあるが、ループの異なる繰り返しに存在することがあり、命令ポインタが同じ場合もあるからである。さらに、いくつかのプロセッサは、自身の性能監視ユニットに、各リタイヤ命令(retired instruction)でカウントを試みるリタイヤ命令カウンタ(retired instruction counter)を実施する。リタイヤ命令カウンタは性能監視目的で含まれ、必ずしも、ありとあらゆるリタイヤ命令を正しくカウントするとは限らないことから、リタイヤ命令カウンタの値の比較は十分でない場合がある。例えば、リタイヤ命令カウンタが特定の値に達すると、プロセッサによっては、新たな命令のロードを中止する機能を有するものもある。しかしながら、パイプラインプロセッサは、スライディングストップ(sliding stop)として知られている、完了する命令、及び、リタイヤ命令カウンタによってカウントされない命令をパイプラインに依然としていくつか有することがある。その上、プロセッサ製造業者は、自身のリタイヤ命令カウンタが100パーセント正確であることを保証しない。
上記の問題は、メモリストアをコピーすることによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステムによって大部分解決される。例示の実施の形態のいくつかは、第1のプロセッサ及び第2のプロセッサで実行されるユーザプログラムの複製コピーの実行ポイントをアラインメントすることであって、第1のプロセッサにおいてユーザプログラムにより実行されるメモリストアのデータのみを、第1のプロセッサのメモリから第2のプロセッサのメモリへコピーすること、及び第1のプロセッサからのユーザプログラムのレジスタ状態を、第2のプロセッサによる使用のためにコピーすること、によってアラインメントすること、を含む方法であり得る。
次に、本発明の例示の実施の形態の詳細な説明について、添付図面が参照される。
[表記及び専門用語]
以下の説明及び特許請求の範囲の全体を通じて、特定のシステムコンポーネントを参照するために、一定の用語が使用される。当業者には分かるように、コンピュータ企業は、或るコンポーネントを異なる名前で参照することがある。この文書は、名前は異なるが機能は異ならないコンポーネントを区別するつもりはない。以下の考察及び特許請求の範囲では、用語「含む」及び「備える」は、オープンエンドな形式で使用され、したがって、「含むが、これらに限定されるものではない」との意味に解釈されるべきである。また、用語「連結する」は、間接的な接続又は直接的な接続のいずれかを意味するように意図されている。したがって、第1のデバイスが第2のデバイスに連結する場合、その接続は、直接的な接続を通じている場合もあるし、他のデバイス及び接続を介して間接的な接続を通じている場合もある。
[詳細な説明]
以下の考察は、本発明のさまざまな実施の形態を対象にする。これらの実施の形態の1つ又は複数は好ましいものとすることができるが、開示した実施の形態は、開示の範囲を限定するものとして解釈されるべきでなく、それ以外に使用されるべきでない。これに加えて、以下の説明は幅広い用途を有すること、及び、どの実施の形態の考察も、その実施の形態の例示にすぎないことが意図されており、開示の範囲がその実施の形態に限定されることを暗示するようには意図されていないことが当業者には理解されよう。
図1は、本発明の実施の形態によるコンピューティングシステム1000を示している。詳細には、コンピューティングシステム1000は、複数のマルチプロセッサコンピュータシステム10を備えることができる。いくつかの実施の形態では、2つのマルチプロセッサコンピュータシステム10のみを使用することができ、したがって、コンピューティングシステム1000は、二重化冗長(DMR;dual-modular redundant)システムを実施することができる。図1に示すように、コンピューティングシステム1000は、3つのマルチプロセッサコンピュータシステム10を備え、したがって、三重化冗長(TMR;tri-modular redundant)システムを実施する。コンピュータシステムが二重化冗長であるのか、それとも三重化冗長であるのかにかかわらず、コンピューティングシステム1000は、マルチプロセッサコンピュータシステム全体にわたってユーザプログラムを冗長に実行することにより、フォールトトレランスを実施する。
本発明の実施の形態によれば、各マルチプロセッサコンピュータシステム10は、好ましくは、1つ又は複数のプロセッサを備え、図1に示すように、4つのプロセッサを備える。図1の各プロセッサは、プロセッサを示す頭文字「P」を有する。さらに、各プロセッサには、マルチプロセッサコンピュータシステム10A、10B、及び10Cの1つの内部におけるプロセッサの物理ロケーションをそれぞれ示す「A」、「B」、又は「C」の文字名称も与えられる。最後に、各プロセッサには、各マルチプロセッサコンピュータシステム内のそのプロセッサのロケーションを示す数字名称が与えられる。したがって、例えば、マルチプロセッサコンピュータシステム10Aのプロセッサは、名称「PA1」、「PA2」、「PA3」、及び「PA4」を有する。
本発明の実施の形態によれば、各マルチプロセッサコンピュータシステム10からの少なくとも1つのプロセッサは、論理的にグループ化されて、論理プロセッサ12を形成することができる。図1に示す例示の実施の形態では、プロセッサPA3、PB3、及びPC3がグループ化されて、論理プロセッサ12を形成することができる。本発明の実施の形態によれば、論理プロセッサ内の各プロセッサは、同じユーザプログラムをほぼ同時に実行し、したがって、フォールトトレランスを実施する。より詳細には、論理プロセッサ内の各プロセッサは、ユーザプログラムの同じ命令ストリームの提供を受けて、同じ結果を計算する(誤差がないと仮定して)が、論理プロセッサ内のプロセッサは、厳密なロックステップではなく、サイクルごとのロックステップでもない。これらのプロセッサは、緩やかなロックステップであり、割り込みのハンドリングは、システムコール(後述)等のランデブー機会に基づいて行われる。いくつかの実施の形態によれば、プロセッサは非決定的な実行を有する場合があり、したがって、厳密なロックステップは実行可能でない場合がある。プロセッサの1つが故障した場合、1つ又は複数の残りのプロセッサは、全体のシステム性能に影響を与えることなく続行することができる。
論理プロセッサ内に同じユーザプログラムを実行する2つ又は3つ以上のプロセッサが存在しうるため、入出力(I/O)デバイス14及び16に対する読み出しや書き込み等の二重(duplicate)読み出し及び二重書き込みが発生する場合がある。I/Oデバイス14及び16は、任意の適切なI/Oデバイスとすることができ、例えば、ネットワークインターフェースカード、フロッピー(登録商標)ドライブ、ハードディスクドライブ、CD−ROMドライブ、及び/又はキーボードとすることができる。障害検出の目的で読み出し及び書き込みを比較するために、各論理プロセッサは、自身を同期ロジックに関連付けている。例えば、プロセッサPA1、PB1、及びPC1は、同期ロジック18に関連付けられた論理プロセッサを形成する。同様に、プロセッサPA2、PB2、及びPC2は、同期ロジック20に関連付けられた論理プロセッサを形成する。論理プロセッサ12は、同期ロジック22に関連付けられている。最後に、プロセッサPA4、PB4、及びPC4は、同期ロジック24に関連付けられた論理プロセッサを形成する。このように、各マルチプロセッサコンピュータシステム10は、それぞれを、相互接続26を経由して同期ロジック18、20、22、及び24のそれぞれに連結する。相互接続26は、周辺機器相互接続(PCI)バスであってもよく、詳細には、直列化PCI(serialized PCI)バスである。ただし、他の通信方式も同等に使用することができる。
各同期ロジック18、20、22、及び24は、投票者ロジックユニットを備え、例えば、同期ロジック22の投票者ロジック28を備える。以下の考察は、同期ロジック22の投票者ロジック28を対象にしているが、同期ロジック18、20、22、及び24のそれぞれの各投票者ロジックユニットにも等しく適用することができる。投票者ロジック28は、プロセッサからの読み出し要求及び書き込み要求を集約するように動作し、場合によっては、論理プロセッサの同期のために、プロセッサ間の情報交換の役割を果たす。説明のために、論理プロセッサ12の各プロセッサがユーザプログラムの自身のコピーを実行することについて考察し、各プロセッサがネットワークインターフェース34に対する読み出し要求を生成することについて考察する。論理プロセッサ12の各プロセッサは、自身の読み出し要求を投票者ロジック28に送信する。投票者ロジック28は、各読み出し要求を受信し、それら読み出し要求を比較し、(読み出し要求が一致すると仮定して)ネットワークインターフェース34に単一の読み出し要求を発行する。
同期ロジックによって発行された単一読み出し要求に応答して、例示のネットワークインターフェース34は、要求された情報を投票者ロジック28に返信する。次に、投票者ロジックは、要求された情報を複製して、論理プロセッサ内のプロセッサのそれぞれに渡す。同様に、パケットメッセージの書き込みや他のプログラム(他の論理プロセッサ上で実行されることがある)へのパケットメッセージの転送等の他の入出力機能についても、同期ロジックは、それらの要求が一致することを確認し、次いで、単一の要求を適切なロケーションに転送する。論理プロセッサのいずれか1つのプロセッサが適切に機能しない場合(例えば、要求を生成できない場合、指定された時間内に要求を生成できない場合、一致しない要求を生成する場合、又は、完全に故障している場合)、全体のユーザプログラムは、論理プロセッサの残りの1つ又は複数のプロセッサの要求に基づいて続行する。
外部インターフェース(ネットワークインターフェース34等)に対する読み出し及び書き込みの集約、及び、それら外部インターフェースから返信されたデータの複製に加えて、同期ロジックは、日時情報の要求が行われた時に各プロセッサに同じ日時が確実に提供されるようにする役割も果たす。詳細には、ユーザプログラムは、それらユーザプログラムの実行における一定のポイントで、日時情報を要求するシステムコールを行うことがある。システムコールは、オペレーティングシステムプログラム等の(ユーザモードよりも高い特権モードで実行される)特権プログラムに対するあらゆるコールである。日時情報を得るためのシステムコールは、システムコールのカテゴリーに分類されるプログラムファミリーの単なる一例にすぎず、割り込みをハンドリングする際のシステムコールの役割は、以下でより十分に考察する。ユーザプログラムにおける対応するポイントにおいて(それらの対応するポイントが実行された時のウォールクロック時刻が異なるにもかかわらず)同じ日時を各ユーザプログラムに提供するために、論理プロセッサ内の各プロセッサが内部的に時刻を導き出すのではなく、本発明の実施の形態による同期ロジックが論理プロセッサ内の各プロセッサに日時情報を提供する。
図2は、マルチプロセッサコンピュータシステム10をより詳細に示している。詳細には、図2は、本発明の実施の形態によるマルチプロセッサコンピュータシステム10が、複数のプロセッサを有することができ、図2の例示の事例では4つのこのようなプロセッサ34、36、38、及び40を有することができることを示している。4つのプロセッサのみが示されているが、本発明の範囲及び精神から逸脱することなく、任意の個数のプロセッサを使用することができる。プロセッサ34〜40は、個別にパッケージングされたプロセッサとすることができ、プロセッサのパッケージは、単一のパッケージ内に2つ又は3つ以上のプロセッサダイを備えるか、又は、単一のダイ上に複数のプロセッサを備える。プロセッサのそれぞれは、プロセッサバス44を経由してI/Oブリッジ及びメモリコントローラ42(以下、I/Oブリッジ42という)に連結することができる。I/Oブリッジ42は、メモリバス45を経由してプロセッサ34〜40を1つ又は複数のメモリモジュール46に連結する。したがって、I/Oブリッジ42は、1つ又は複数のメモリモジュール46によって画定されたメモリ領域に対する読み出し及び書き込みを制御することができる。また、I/Oブリッジ42は、バスライン43によって示すように、プロセッサ34〜40のそれぞれが同期ロジック(図2に図示せず)に連結することも可能にすることができる。
図2をさらに参照して、1つ又は複数のメモリモジュール46によって画定されたメモリを、各プロセッサにつき1つのパーティションに区画することができる。したがって、プロセッサのそれぞれは、独立に動作することが可能になる。代替的な実施の形態では、各プロセッサは、それ自身の一体化されたメモリコントローラを有することができ、したがって、各プロセッサは、それ自身の専用メモリを有することができ、これも本発明の考慮の範囲内にある。プロセッサ34〜40は、厳密なロックステップ実行に適していない非決定的プロセッサとすることもできる。
図2は、各マルチプロセッサコンピュータシステム10が、I/Oブリッジ42とメモリモジュール46との間に連結された再統合ロジック48を備えることもさらに示している。図1の例示の実施の形態は、再統合ロジックの相互接続(ライン51)をリング形式で示しているが、任意のネットワークトポロジを同等に使用することができる(例えば、リング、ツリー、二重リング、完全接続)。動作時において、再統合論理ロジック48は、I/Oブリッジ42に対してトランスペアレントであり、1つ又は複数のメモリモジュール46に対する読み出し及び書き込みを妨げない。しかしながら、論理プロセッサ内の或るプロセッサが障害に遭遇し、再起動する必要がある場合に、再統合ロジック48は、以前故障したプロセッサが、論理プロセッサの故障していないプロセッサと同じポイントで開始できるように、別のプロセッサから少なくともユーザプログラムメモリのコピーを可能にする。
緩やかなロックステップシステムでは、或るプロセッサが進んだり遅れたりすることがある理由は多く存在し得る。例えば、各プロセッサはほぼ同じクロック周波数で命令を実行することができるが、実際のクロック周波数の差は小さくても、時間の経過によってかなりの差になることがある。その上、本発明の少なくともいくつかの実施の形態に従って実施されたプロセッサは、非決定的な実行を有し、したがって、たとえ正確に同じユーザプログラムが提供されても、プロセッサは、ユーザプログラムの同じ実行ポイントに到達するのに実行ステップ数が大きく異なる場合がある。さらにまた、いくつかのプロセッサは、データアクセス問題及び/又はエラーに遭遇する可能性もある。いくつかの例として、或るプロセッサが、他のプロセッサが遭遇することができないキャッシュミスに遭遇することがある、或るプロセッサが訂正可能なメモリエラーに遭遇することがあり、したがって、残りのプロセッサには必要とされない回復ルーチンの実行を必要とすることがある、及び、或るプロセッサがトランスレーション・ルックアサイド・バッファ(Translation Look-aside Buffer)のミスに遭遇することがあり、それによって、ユーザプログラムの最終結果に影響を与えないが付加的処理が行われる、といったものがある。これらの場合も、プロセッサは、最終的に、ユーザプログラムの同じ実行ポイントに到達するが、実行される命令数、及び、それらの命令を実行するのに必要な時間は、同じでないことがある。
論理プロセッサのプロセッサが同じ命令ストリームを実行しているが、その命令ストリームの同じポイントに存在しないことがあるという考えに留意して、このような環境における割り込みのハンドリングに考察を移す。たとえ、同じ割り込みが、正確に同じウォールクロック時刻で各プロセッサにアサートされても、それら各プロセッサの緩やかなロックステップ実行により、割り込みは、各プロセッサの命令ストリームの同じポイントでアサートされないことがある。この問題は、割り込みアサート自体が非同期であることによってさらに悪化する。適切なオペレーションを確保するために、論理プロセッサ内の各プロセッサは、ユーザプログラムの命令ストリームの同じ実行ポイントで、割り込みにサービスを提供する必要がある。本発明の実施の形態によれば、割り込みが命令ストリームの同じ実行ポイントでサービスを受けることを確保することは、割り込みにサービスを提供するためのランデブーポイントについて合意するメカニズムとして同期ロジックを利用することによって行われる。
本発明の実施の形態によれば、論理プロセッサ内のプロセッサは、特定の割り込みがアサートされたこと、及び、割り込みにサービスを提供するための提案されたポイント、を互いに通信する。換言すると、論理プロセッサ内のプロセッサは、どの割り込みにサービスを提供すべきか(又は最初にサービスを提供すべきか)について合意し、また、割り込みにサービスを提供するためのポイントについても合意する。図3は、協力して割り込みのサービス提供を調整するさまざまなコンポーネントのオペレーションを説明するために、部分的なコンピューティングシステム1000を示している。図3は、論理プロセッサ50が、この場合、2つのプロセッサPA1及びPB1のみを備えるという意味で、図1のシステムを簡略化したものである。また、図3は、別の意味では、各プロセッサのメモリパーティション52を示し、プロセッサがI/Oブリッジ42を通じてメモリパーティション及び投票者ロジックにどのように連結するかを示しているので、図1よりも詳細化されている。このように、図3の論理プロセッサ50は、マルチプロセッサコンピュータシステム10A及び10Bからのそれぞれ1つのプロセッサを備える。プロセッサPA1は、I/Oブリッジ42Aに連結し、I/Oブリッジ42Aは、同期ロジック18及びPA1プロセッサのメモリパーティション52Aの双方に連結する。プロセッサPB1は、その各I/Oブリッジ42Bに連結し、I/Oブリッジ42Bは、同期ロジック18及びPB1プロセッサのメモリパーティション52Bに連結する。
少なくともいくつかの実施の形態によれば、論理プロセッサのプロセッサに、割り込みにサービスを提供するためのランデブーポイントを確立するための情報を交換させるには、各プロセッサが同期ロジック18の投票者論理回路56における同期レジスタ54に情報を書き込むことが必要とされる。本発明の実施の形態によれば、ランデブーポイントは、任意の適切な位置とすることができ、ディスパッチャプログラムが実行され、他のタスクを実行に設定する各時刻、トラップ及び障害ハンドラ、ユーザプログラムによって行われたシステムコール等とすることができる。システムコールがランデブーポイントのバルクであると想定されるため、本明細書の残りの部分ではこれらランデブーポイントをシステムコールと呼ぶ。しかしながら、用語「システムコール」は、この場合、一般的に、任意の可能なランデブーポイントを指すために使用されることが理解されよう。システムコール番号は、システムコールが任意の開始点(starting point)から行われた回数を示す番号とすることができる。例えば、図3のロケーション72は、システムコール番号が存在するメモリパーティション52のロケーションを示している。代替的な実施の形態では、システムコール番号は、メモリパーティション52以外に位置するレジスタにも同等に記憶することができる。図3に示す実施の形態では、同期レジスタ54は、事前に指定されたメモリロケーションであるが、データを書き込むことができるロケーションならばどのロケーションでも十分である。プロセッサの一部又はすべてが自身の各情報を書き込んだ後、投票者ロジック56は、同期レジスタ54の情報を、メモリパーティション52のそれぞれにおける対応する1組のレジスタ57にライトバックする。レジスタ54と同様に、レジスタ57は、メモリパーティション52に事前に指定されたメモリロケーションであるが、データを書き込むことができるロケーションならばどのロケーションでも十分である。同期ロジックへ情報を書き込むことによって、残りのプロセッサが割り込みを調べるのを待っている間、ユーザプログラムの処理を続けることが可能になる。情報を交換することによって、論理プロセッサ内のプロセッサは、ユーザプログラムのどのポイントで割り込みにサービスを提供するかを調整する。
任意の時刻にプロセッサに割り込みをアサートすることは、割り込み情報を含んだパケットベースのメッセージを介して行うことができる。また、割り込みは、或るプロセッサクロックサイクル数の後に満了するように設定されたタイマ等の内部信号源からプロセッサにアサートすることもできる。このようなパケット又は内部割込みがプロセッサによって受信され検出されると、ユーザプログラムは一時停止され、割り込みハンドラルーチンが起動される。割り込みハンドラルーチンの目的は、ランデブーポイントを特定するプロセスを開始することである。割り込みによって要求されたサービスに関する動作は、割り込みハンドラルーチンによっては行われない。システムコールは、ランデブーポイントをスケジューリングしたプロセスが完了したポイントであり、また、割り込みにサービスを提供するプログラムのスケジューリングが行われたポイントでもある。システムコールに基づく割り込みのスケジューリングに関するより多くの情報については、「Method and System of Loosely Lock-Stepped Non-Deterministic Processors」と題する同時係属中の米国特許出願第11/042,548号(CR参照番号2162−22100)を参照することができる。
このように、本発明の実施の形態によると、割り込みのサービス提供の調整は、システムコール及び他のオペレーティングシステム遷移において行われる。しかしながら、長期間の間、システムコールを行わないユーザプログラムが存在し得る。したがって、論理プロセッサ内のプロセッサが、実行しているユーザプログラムの部分について大幅に異なる可能性があり、且つ/又は、さらに、割り込みにサービスを提供する十分な機会がない可能性がある。十分な頻度でシステムコールを行わないユーザプログラムは、「非協調プロセス(uncooperative process)」と呼ばれる。
本発明の実施の形態による非協調プロセスのハンドリングは、いくつかの段階を有する。第1段階は、ユーザプログラムが確かに非協調的であることを識別することである。第2段階は、ユーザプログラムが異なる(必ずしもそうとは限らないが)可能性があるメモリロケーションを特定することである。第3段階は、論理プロセッサの各プロセッサにおける非協調プロセスが同じ実行ステージにあることを保証する動作を行うことであり、これは、実行ポイントのアラインメントとしても知られている。最後に、最終段階は、かつて非協調プロセスだったものを変更すること、とすることができる。これらの段階のそれぞれについて次に取り扱うことにする。
いくつかの実施の形態では、ユーザプログラムがあまりにも稀にしかシステムコールを行わず、したがって、非協調的であるとみなされることを特定することには、タイマの使用を必要とする。ユーザプログラムがタイマの満了前にシステムコールを行わないと、そのユーザプログラムは非協調プロセスである。また、本発明のいくつかの実施の形態によれば、プロセッサのディスパッチャプログラム(最も高い特権状態であるカーネルモードで動作する)が、ユーザプログラムを実行にセットするごとに、ディスパッチャは、プロセッサのリタイヤ命令カウンタをリセットし、ユーザ(最低レベル特権)命令のみをカウントするようにそのリタイヤ命令カウンタを設定し、非協調プロセスタイマを始動し、現在のシステムコール番号の表示を記憶する。リタイヤ命令カウンタは、例えば、ほとんどの市販のプロセッサの性能監視ユニットで実施されるカウンタである。リタイヤ命令カウンタの値は、プロセッサによる各ユーザレベル命令の実行完了時にインクリメントされる。非協調プロセスタイマに関して、インターバルタイムカウンタ(ITC;Interval Time Counter)レジスタ及びインターバルタイムマッチ(ITM;Interval Time Match)レジスタを装備することによって、Intel(登録商標)により製造されたItanium(登録商標)プロセッサを、非協調プロセスを検出するのに使用することができる。Itanium(登録商標)プロセッサが使用される場合、コンパイラが挿入した、例えばload.s及びload.chkの対といった投機的命令(speculative instruction)は、リタイヤ命令カウント値に大きな影響を与える可能性があるので、ユーザプログラムで許可されないことに留意されたい。ITCは、プロセッサの電源投入時にカウントを開始するフリーランニングカウンタ(free running counter)である。「フリーランニング」ということは、ITCが、実行される命令の個数及び/又はタイプにかかわらずカウントし、どの命令(特権にかかわらず)によってもITCを停止させることができず、どのユーザ命令によってもITCの値を変更できないことを意味する。これらの実施の形態で非協調プロセスタイマを始動することは、したがって、ITCの値を読み出すこと、及び、所望の時間が経過した時にITCの値を表す値をITMに置くことを意味する。ITCレジスタ及びITMレジスタの値が等しい場合、インターバルタイマ割り込みがアサートされる。これらの例示の実施の形態の非協調プロセスタイマは真に「満了」していないが、ここから先では、非協調プロセスタイマとして使用されるどのタイマのタイプのシステムにも一般に当てはまるように、ITMと一致するITCの値の考察を「タイマの満了」と呼ぶことにする。ITC/ITMタイプのタイミング機能を実施しないプロセッサの場合、周期的タイマ割り込みを、レジスタと組み合わせて使用し、割り込みの回数を追跡することができ、所定の個数の周期的タイマ割り込みが発生した後に非協調プロセスに関連したタスクを実行することができる。再び、非協調プロセスタイマの一般論に移って、タイマの満了時に、非協調プロセスハンドラルーチンを起動する割り込みがアサートされる。非協調プロセスハンドラルーチンは、タイマによって規定された期間中に少なくとも1つのシステムコールがあったかどうかをチェックする。このタイマによって規定された期間は、いくつかの実施の形態では、およそ100マイクロ秒程度とすることができる。代替的な実施の形態では、システムコールは、タイマをリセットして、非協調プロセスハンドラルーチンのトリガを回避することができるが、これらのリセットは、多大なコストを要するカーネルモードプロセスコールを必要とすることがある。非協調プロセッサタイマに関連した割り込みは、各プロセッサの内部でハンドリングされ(確かに、ユーザプロセスが協調的である場合、非協調プロセスタイマが満了したことは、他のプロセスに通信されない)、したがって、論理プロセッサのさまざまなプロセッサにわたって調整されたサービス提供を必要とする、入出力要求等の割り込みとは異なるタイプの割り込みとみなすことができる。
図4(図4A及び図4Bを含む)は、本発明の実施の形態による非協調プロセスハンドラのフロー図を示している。詳細には、非協調プロセスハンドラは、非協調プロセスタイマの満了後の割り込みのアサートによって開始することができる(ブロック400)。割り込みを無効にした(ブロック402)後、非協調プロセスハンドラは、現在のシステムコール番号(たとえば、図3のロジック72から)、及び、開始時にディスパッチャにより記憶されたシステムコール番号を読み出す(ブロック404)。割り込みを無効にすることは、明示的なステップとすることもできるし、割り込みハンドラの入る時に自動的に行うこともできる。現在のシステムコール番号がディスパッチャによって開始時に記憶されたシステムコール番号と同じである(ブロック406)ということは、ユーザプログラムが、非協調プロセスタイマによって規定された期間中にシステムコールを行わなかったことを示し、したがって、ユーザプログラムが非協調プロセスであることを示す。他方、現在のシステムコール番号が、記憶されたシステムコール番号と同じでない場合には(再びブロック406)、そのプロセスは協調的であり、したがって、例示の方法は、非協調プロセスタイマをリセットし(ブロック417)、現在のシステムコール番号を保存し(ブロック419)、割り込みを有効にし(ブロック418)、そしてユーザプログラムにリターンする(ブロック420)。
本発明の実施の形態によれば、ユーザプログラムが論理プロセッサの少なくとも1つのプロセッサ内で非協調的になることによって、他のプロセッサとのデータの交換が起動され、論理プロセッサの他のプロセッサがその非協調性に同意するかどうかが判断される。引き続き図4を参照して、現在のシステムコール番号が、ディスパッチャによって記憶されたシステムコール番号と同じである場合(ブロック406)、次のステップは、未確認のランデブーオペレーションがあるかどうかの判断である(ブロック408)(以下で考察する)。未確認のランデブーがない場合、次のステップは、ユーザプログラムの非協調性の表示を、現在のリタイヤ命令カウンタ(RIC)の値と共に、投票者ロジック56の同期レジスタ54に書き込むことである(ブロック410)。その後、非協調プロセスハンドラルーチンは、同期データの返信を投票者ロジックのソフトウェアループで待機する(ブロック412)。
いくつかの実施の形態では、どの時点においても、データの交換は1つしか進行できないので、非協調プロセスタイマの満了時にまだ完了していないランデブーポイントである未確認のランデブーをスケジューリングしようとする試みが行われている場合(再びブロック408)、次のステップは、投票者ロジックが同期データを書き込むまでソフトウェアループで待機することである(ブロック422)。ライトバックされた同期データは、前の割り込み(非協調プロセスハンドラルーチンの現在の実行をトリガした非協調プロセスタイマ満了割り込みではない)についてのものであることに留意して、返信されたデータは、ランデブーポイントのスケジューリングに使用される(ブロック424)。ランデブーポイントのスケジューリングに関するより多くの情報については、「Method and System of Loosely Lock-Stepped Non-Deterministic Processors」と題する米国特許出願第11/042,548号(CR参照番号2162−22100))を参照することができる。ランデブーポイントのスケジューリング(ブロック424)の後、プロセスは、ユーザプログラムの非協調性の表示を、現在のリタイヤ命令カウンタの値と共に、投票者ロジック56の同期レジスタ54に書き込むことに進み(ブロック410)、データの返信をソフトウェアループで待機する(ブロック412)。
ユーザプログラムが非協調的であることにプロセッサが合意しない場合には(ブロック414)、返信されたデータの解析が行われて、ユーザプログラムが他のプロセッサにおいて協調的であるかどうかが判断される(ブロック416)。例えば、一方のプロセッサの非協調プロセスタイマは、ユーザプログラムによるシステムコールの直前に満了する(又は繰り返す)ことがある一方、論理プロセッサの第2のプロセッサのユーザプログラムは、満了直前にシステムコールを行うことがある。したがって、一方のプロセッサは、プロセスが非協調的であることを示し、第2のプロセッサは、提案したランデブーポイントの書き込みを含めて、次の割り込みをハンドリングするためのランデブーポイントのスケジューリングを試みる。この解析によって、ユーザプログラムがまもなくシステムコールを行うことが明らかになると(ブロック416)、非協調プロセスタイマがリセットされ(ブロック417)、現在のシステムコール番号が保存され(ブロック419)、割り込みが有効にされ(ブロック418)、そして、ユーザプログラムが実行を継続でき、まもなく再び協調的となるように、プロセスはリターンする(ブロック420)。
さらに図4を参照して、ユーザプログラムが非協調的であることに論理プロセッサのすべてのプロセッサが合意した場合(ブロック414)、ユーザプログラムのリタイヤ命令カウンタがプロセッサの最も高いリタイヤ命令カウンタと同じになるまで、プロセッサがユーザプログラムを先に進めて実行することによって、ユーザプログラムのさまざまなコピーをアラインメントするプロセスは開始する(ブロック426)(リタイヤ命令カウンタの値は、ブロック410において、各プログラムの非協調性の表示と共に交換されるので、各プロセッサはその情報を知っている)。場合によっては、図4の例示の非協調プロセスハンドラが動作しているプロセッサは、最も高いリタイヤ命令カウンタを有し、したがって、ユーザプログラムは、適切なポイントにいる。最も高いリタイヤ命令カウンタの値に向けて先に実行することは、多くの形態を取ることができる。現在のプロセッサのリタイヤ命令カウンタの値が、最も高いリタイヤ命令カウンタの値よりもかなり遅れている場合、タイマを始動することができ、タイマの活動時間の期間中、ユーザプログラムの実行を可能にすることができる。或いは、タイマ期間の間、ユーザプログラムが実行することを可能にするために、又は、最も高いリタイヤ命令カウンタの値に近いリタイヤ命令カウンタを得るのにタイマが使用された後のいずれかで、プロセッサを単一命令モード(single instruction mode)に置くことができる。この単一命令モードでは、リタイヤ命令カウンタが最も高いリタイヤ命令カウンタの値と一致するまで、ユーザプログラムは単一ステップで実行される。
例示の図4のブロック426の完了後、論理プロセッサのすべてのプロセッサは、同じリタイヤ命令カウンタの値にあるが、背景技術の項で考察した理由から、ユーザプログラムが実際に命令ストリームの同じ実行ポイントにあるという保証はない。したがって、図4の例示のステップを実行している各プロセッサにおける次のステップは、ユーザプログラムにおいて所定の個数の命令を前に進めて実行すると同時に、メモリストアのアドレスを記録することである(ブロック428)。この所定の個数は、図では「N」で示されている。Nの値は、特定のブランド及びモデルのプロセッサでテストを行うことによって求めることができ、同じ命令ストリームを提供されたプロセッサ間のリタイヤ命令カウンタの値の少なくとも最大誤差を表すものである。換言すると、Nの値は、プロセッサのリタイヤ命令カウンタ(ユーザプログラムがディスパッチされた時にゼロにされる)が等しい時のプロセッサの実行ポイント間の実際の命令の最大個数とすることができる。いくつかの実施の形態では、Nの値は、最大誤差の複数倍にすることができ、場合によっては、Nの値は、たとえば1,000となるように選択される。
図4のブロック428をさらに参照して、Itanium(登録商標)プロセッサを使用して実施される実施の形態では、ユーザプログラムのメモリへの書き込みアクセスのそれぞれにおいてトリガするマスク値でItanium(登録商標)の「データブレークポイントレジスタ」を設定することによって、ユーザプログラムの各メモリに対するユーザプログラムのストアが記録される。ユーザプログラムは、割り込みが有効にされた状態で、少なくともN個の命令の間続行することが許可される。N個の命令の実行中、データブレークポイントレジスタのマスク値がメモリアクセスによって満たされると、割り込みがアサートされる。そのメモリアクセスがストアであった場合に、このアサートされた割り込みは、アドレスを記録する割り込みハンドラを実行させる。ユーザプログラムがN個の命令を前に進めて実行していない限り、各メモリアクセスが、ストアアドレスを記録する割り込みをトリガすると、ユーザプログラムは再び実行を許可される。データブレークポイントレジスタを設定することに加えて、少なくともいくつかの実施の形態は、十分大きな時間値で設定されるタイマも装備し、ユーザプログラムがメモリアクセスを含まず、したがってメモリストアを含まない場合に、このタイマが、ユーザプログラムの実行をブレークして少なくともN個の命令が実行されたかどうかを判断するための方法を提供するようにされる。ユーザプログラムが少なくともN個の命令を前に進めて実行すると、データブレークポイントレジスタがクリアされ、割り込みが無効にされ、図4の例示のプロセスが再開される。他の製造業者が提供しているプロセッサは、Itanium(登録商標)のデータブレークポイントレジスタの能力と同様の能力を有することもできるし、等価なロジックを追加してこの機能を提供することもできる。
N個の命令のストアアドレス(もしあれば)を記録した後、ランデブーポイントを決定するためのデータの交換と同様の方法で、記録されたアドレスが投票者ロジックに書き込まれるか、又は、N個の命令においてストアが行われなかったことを示す表示が投票者ロジックに書き込まれる(ブロック430)。これ以降、記録されたストアアドレスについて言及する場合、N個の命令においてストアが行われなかったことを示す表示も暗黙的に含まれる。このように、記録されたストアアドレスは、投票者ロジックのレジスタ54に書き込まれるか、又は、投票者ロジックの、記録されたストアアドレスの交換専用のレジスタに書き込まれる。すべてのプロセッサが、ユーザプログラムの非協調性に合意していることに留意すると、最終的には、すべてのプログラムが、記録されたストアアドレスのリストを書き込み、すべてのデータが投票者ロジックに一旦書き込まれると、それらデータは、プロセッサ、たとえばレジスタ57にライトバックされる。例示の図4は、プロセッサの観点からのフロー図であり、詳細には、非協調プロセスハンドラルーチンの観点からのフロー図である。各プロセッサへのデータのライトバックは、論理プロセッサの他のすべてのプロセッサが自身の各データを書き込んだ後(又はタイムアウトした後)、投票者ロジックによって実行される。したがって、ステップ432は、投票者ロジックがデータを返信するのを各プロセッサが待機していることを示している。データセットのサイズに応じて、同期ロジックを通じた情報の交換は、数回の繰り返しを要することがあり、したがって、ブロック430及び432によって示す方法は、複数回繰り返されることがある。したがって、各プロセッサは、他のプロセッサからの、記録されたストアアドレスの返信をソフトウェアループで待機する(ブロック432)。
次のステップは、各プロセッサが、すべてのプロセッサによって提供された情報からストアアドレスの和集合を計算することである(ブロック438)。たとえば、第1のプロセッサが{1,2,3,4}のストアアドレス集合を記録し、且つ、第2のプロセッサが{2,3,4,5}のストアアドレス集合を記録している場合、これら記録されたストアアドレスの和集合は{1,2,3,4,5}となる。記録されたストアアドレスの和集合は、プロセッサ間のメモリが異なる可能性があるメモリロケーションのリストを表している。その後、各プロセッサは、和集合の自身のストアアドレスのそれぞれにおける値を、ユーザプログラムのレジスタ状態と共に、論理プロセッサ内の他のプロセッサへ送信する(ブロック440)。このようにして、論理プロセッサ内の各プロセッサは、論理プロセッサ内のどのプロセッサが送信元(source)プロセッサであるかに基づいて、自身のメモリ及びレジスタ状態を内部で訂正するのに必要とされるすべての情報を有する。
次のステップは、プロセッサが協働して送信元プロセッサを特定することである(ブロック434)。送信元プロセッサは、実行ポイントにおいて先行するプロセッサである必要はなく、実際、送信元プロセッサの選択は任意とすることができる。協働して送信元プロセッサを選択することは、レジスタ54に書き込んで、投票者ロジックが各プロセッサから供給されたデータをすべてのプロセッサへ返す等、投票者ロジックを通じて情報を交換することを含むことができる。いくつかの実施の形態では、送信元プロセッサはあらかじめ定められ、したがって、ブロック434及び436は、プロセッサがオンラインで実行される時やプロセッサに故障の疑いがある時等、その他の時に行うことができる。他の方法も等しく使用することができる。図4の例示の方法が動作しているプロセッサが送信元プロセッサである場合(ブロック436)、データを置換することは必要とされない。したがって、次のブロック444を飛ばして、非協調プロセスタイマがリセットされ(ブロック417)、現在のシステムコール番号が保存され(ブロック419)、割り込みが有効にされ(ブロック418)、そして、プロセスはユーザプログラムにリターンする(ブロック420)。
他方、例示のプロセスが実行されているプロセッサが送信元でない場合(再びブロック436)、プロセッサは、各ストアアドレスにおける値及びユーザプログラムのレジスタ状態を送信元プロセッサから取り込み、自身の対応するメモリの値及びレジスタ状態を置換する(ブロック445)。このレジスタ状態は、ユーザプログラムの現在の状況及び実行ポイントを規定する、プロセッサのさまざまなレジスタの状態と共に、現在のプログラムカウンタの値を含む。送信元でないプロセッサで実行が再開された時、それら送信元でないプロセッサは、送信元プロセッサと同じロケーションで再開し、同じメモリ状態を有する。
少なくともいくつかの実施の形態によれば、各プロセッサがユーザプログラムの非協調性に合意した時にアラインメントを強制するだけで、ユーザプログラムの非協調性にかかわらず、適切なオペレーションを確保するのに十分な場合がある。少なくともいくつかの実施の形態では、各プロセッサは、ユーザプログラムにシステムコールを仕掛けて(ブロック444)、ユーザプログラムの少なくとも非協調プロセスの指定を引き起こした部分が再びそのようにならないことを確実にする。この事前対策ステップは多くの形態を取ることができる。いくつかの実施の形態では、ユーザプログラムの好ましくない部分(ほとんどはソフトウェアループ)が、システムコールを含むように変更される。これは、例えば、ノーオペレーション命令(NOP)をシステムコール(例えば、日時コール)と置換することによって行われる。ユーザプログラム命令ストリームが単なる置換を許容していない場合には、命令は、その置換される命令を指し示す分岐命令、システムコール、及びリターン分岐命令と置換される。これらの変更は、ユーザプログラムがメインメモリに存在するときにユーザプログラムに対して行うことができ、且つ/又は、ユーザプログラムがディスクドライブ等の長期記憶デバイスに存在するときにユーザプログラムに対して行うことができる。さらに別の代替的な実施の形態では、プロセッサハードウェアは、命令ストリームの特定のポイントに割り込みを挿入するメカニズムをサポートすることができ、その割り込みは、アラインメント及び割り込みスケジューリングのためのシステムコールをトリガすることができる。たとえば、Itanium(登録商標)プロセッサファミリは、「命令ブレークポイントレジスタ」として知られている、プロセッサ内のレジスタをサポートする。このブレークポイントレジスタには、命令ポインタ値をロードすることができる。実際の命令ポインタがブレークポイントレジスタの値と一致すると、割り込みがトリガされる。この例示のメカニズムは、割り込みをトリガするのに使用され、この割り込みは、次に、同期目的でシステムコールをトリガする。このハードウェアベースのメカニズムは、すべてのアーキテクチャで利用可能でない場合があるが、ユーザプログラムを変更する実施の形態は、汎用的な適用を有することができる。その後、非協調プロセスタイマはリセットされ(ブロック417)、現在のシステムコール番号は保存され(ブロック419)、割り込みが有効にされ(ブロック418)、割り込みハンドラはユーザプログラムにリターンする(ブロック420)。
実行されたN個の命令内にメモリストアがない場合には、送信元ではない各プロセッサは、自身のレジスタ状態のみを送信元プロセッサのレジスタ状態と置換し、ユーザプログラムが実行を再開すると、それらユーザプログラムは同じポイントで再開する。Nは、ユーザプログラムの実行ポイント間の最大誤差となるように決定されるので、メモリストアが、それらN個の命令の期間中に行われない場合、ユーザプログラムの各メモリを変更することなく各ユーザプログラムを同じポイントで再開させることは、それらユーザプログラムのメモリが異ならないので、可能である。したがって、本明細書で説明したさまざまな実施の形態は、交換する必要があるデータを大幅に少なくでき、最良の場合には、交換されるデータが全くないので、たとえば、ユーザプログラムのメモリ全体のクローンを作成すること及び/又はメモリページのクローンを作成することを上回る大きな利点を有し、ユーザプログラムのレジスタ状態を残しておく(save)ということが分かる。
図5Aは、図4の概念をさらに示すために、2つのプロセッサPA1及びPB1によって実行される複数の命令を示している。この説明は、3つのプロセッサにも等しく適用することができるが、図を過度に複雑にしないように2つが使用されている。詳細には、各プロセッサは、命令(INST)1〜10を含む自身の各ユーザプログラムが非協調的であると判断しているものとみなす(図4のブロック410、412、及び414)。さらに、各プロセッサは、最も高いリタイヤ命令ポインタの値(図5Aの場合、RIC=A)にユーザプログラムをステップさせているものとみなす(図4のブロック426)。リタイヤ命令のカウントを担当するハードウェアの不完全性のため、2つのプロセッサのリタイヤ命令カウンタの値が等しいにもかかわらず、ユーザプログラムの実行ポイントは、2つのプロセッサ間で異なる場合がある。図5Aは、2つのプロセッサのリタイヤ命令カウンタの値が等しいにもかかわらず、プロセッサPB1が、2つの命令だけプロセッサPA1に先行していることを示している。さらに、ユーザプログラムの平均的なタイムスライスの期間中に遭遇する命令数にわたってリタイヤ命令をカウントする際に起こり得る最も大きな誤差は、場合によっては経験的なテストを通じて、2であると判断されるものとみなす。
この例示の場合、Nの値は、2以上の値に等しく設定することができ、4が使用される。各ユーザプログラムは、4つの命令を先に進めてステップすることが許可されると同時に、ストアアドレスのリストを作成する(図4のブロック428)。この例示の場合、各命令がメモリストアであり、したがって、各プロセッサは、各命令のストアアドレスを記録するものとみなす。プロセッサPA1によって記録されたアドレス500は、したがって、命令{4,5,6,7}のストアアドレスである。同様に、プロセッサPB1によって記録されたアドレス502は、したがって、命令{6,7,8,9}のストアアドレスである。これら記録されたストアアドレスは、プロセッサ間で交換される(図4のブロック430、432)。次に、各プロセッサは、ストアアドレスの和集合を計算し(図4のブロック438)、この和集合は{4,5,6,7,8,9}となる(図4のブロック438)。これらの前提が与えられると、2つの集合の和集合は、2つのプロセッサのメモリが(誤差の幅(margin)で)異なる可能性のあるすべてのロケーションを表している。その後、ストアアドレスの和集合の値は、プロセッサ間で交換される(図4のブロック440)。次に、送信元プロセッサが選択され(図4のブロック434及び436)、送信元でないすべてのプロセッサは、和集合のメモリアドレスの値を送信元プロセッサからの値と置換し、また、自身の各レジスタ状態を送信元プロセッサのレジスタ状態と置換する(図4のブロック445)。
図5Bは、プロセッサPA1が送信元として選択され、したがって、プロセッサPA1の値及びレジスタ状態がプロセッサPB1の値及びレジスタ状態に取って代わる場合を示している。プロセッサのそれぞれがこの第1の例示の場合に再開すると、プロセッサは命令8で実行を開始する(矢印504)。プロセッサPB1は、命令8及び9を重複して実行するが、前の実行の効果は、プロセッサPA1からのデータのコピーによって置き換えられる。同様に、図5Cは、プロセッサPB1が送信元として選択され、したがって、プロセッサPB1の値及びレジスタ状態がプロセッサPA1の値及びレジスタ状態に取って代わる場合を示している。プロセッサのそれぞれがこの第2の例示の場合に再開すると、プロセッサは、命令10で実行を開始する(矢印506)。プロセッサPA1は、命令8及び9を実行しなかったが、それにもかかわらず、それらの命令の効果は、プロセッサPB1からのメモリロケーションの値のコピーのため存在し、また、レジスタ状態のコピーのため存在する。
送信元として選択されたプロセッサからのメモリロケーションの値を提供することは、多くの形態を取ることができる。いくつかの実施の形態では、メモリロケーションの値は、論理プロセッサの各投票者ロジックを使用して交換される。投票者ロジックの使用は、Nの値が小さい場合等、交換するデータ量が比較的小さい場合に実際的となり得る。他の実施の形態では、メモリロケーションの値は、各プロセッサの再統合ロジック48(図2)を使用して交換される。さらに別の実施の形態では、メモリロケーションの値は、ネットワーク17(図1)にわたるパケットメッセージを使用して交換される。
図6は、図4の方法をさらに示すために、イベント割り込みに関係した非協調プロセスのハンドリングを示す時間表である。詳細には、図6は、各プロセッサがシステムコール番号1999に遭遇する状況を示している。プロセッサPA1の場合、割り込み5は、非協調プロセスタイマの満了前にアサートされ、したがって、プロセッサPA1は、システムコール番号2000で割り込み5のサービス提供を提案する(ライン600)。割り込み5のサービス提供を提案した直後、プロセッサPA1の非協調プロセスタイマは満了し、ランデブーが未確認であるため、プロセッサPA1は、投票者ロジックが前の提案からの同期データを書き込むのを待機してスピンする(spin)(図4のブロック422)。これに対して、プロセッサPB1は、割り込みがアサートされる前に、自身の非協調プロセスタイマを満了させ、したがって、プロセッサPB1は、非協調プロセス情報を同期レジスタ54に書き込み(ライン602;図4のブロック410)、確認をソフトウェアループで待機する(図4のブロック412)。その後、投票者ロジックは、同期データを各プロセッサにライトバックする(ライン604)。プロセッサが割り込みのサービス提供に合意せず、非協調プロセス割り込みの即時動作性から、プロセッサPA1は、割り込み5を今後再び提案できるようにリストに書き込み(ブロック424)、非協調プロセスの表示を同期レジスタに書き込み(ライン606;図4のブロック410)、そして、確認をソフトウェアループで待機する(図4のブロック412)。
プロセッサPB1について、プロセッサは、非協調プロセスに関して合意しない(ブロック414)(プロセッサPA1は、アプリケーションプログラムが非協調であることを示すのではなく、割り込みにサービスを提供することを提案した)。その上、プロセッサPA1によって提案されたシステムコール番号(この例示の場合にはシステムコール2000)は、プロセッサPB1のシステムコールが次に行われることを意味するものではなく、提案したシステムコール番号2000は、プロセッサPA1もシステムコール番号1999に達していることを暗に意味するものである(図4のブロック416)。したがって、プロセッサPB1は、非協調プロセスの表示の第2の書き込みを行い(ライン608;図4のブロック410)、この場合も、確認をソフトウェアループで待機する(ブロック412)。その後、投票者ロジック56は、同期データを各プロセッサに書き込む(ライン610)。この例示の第2の書き込みでは、プロセッサは、非協調ステータスに合意し(各プロセッサについてブロック414)、したがって、各プロセッサは、ユーザプログラムの実行ポイントをアラインメントするプロセスを開始する。
また、図6は、投票者ロジックに書き込まれた同期データが一致しないにもかかわらず、ユーザプログラムの非協調性がまもなく終了する可能性があるという情報をプロセッサが収集する状況も示している。詳細には、図6は、プロセッサPA1が、この例示の場合にはシステムコール番号3000のシステムコールを行うこともさらに示している(領域614)。システムコールプロセスの一部として、プロセッサPA1は、次のランデブーポイントを提案又は広告する(ライン616)。これに対して、プロセッサPB1は、自身の非協調プロセスタイマをシステムコール前に満了させ、したがって、非協調プロセスの表示を書き込み(ライン618;図4のブロック410)、確認をソフトウェアループで待機する(図4のブロック412)。投票者ロジックが同期データを返信すると(ライン620)、プロセッサPA1は、不一致に気付き、再び、同期データの書き込みを試みる(ライン622;図4のブロック414)。これに対して、プロセッサPB1は、同期データを受信し(ライン620)、プロセッサがユーザプログラムの非協調性について合意しない(図4のブロック414)一方、プロセッサPA1からの提案されたランデブー情報は、システムコールが次に行われることを示している(図4のブロック416)。したがって、プロセッサPB1は、システムコールが行われるまで、ユーザプログラムの実行を継続する。その後の或る時に、プロセッサは、プロセッサPA1によって最初に提案された割り込みに合意する。
ここまで説明した実施の形態は、Nの値が静的であり、事前に決定されていると仮定している。代替的な実施の形態では、Nの値が順応して(adaptively)変更される。図7は、Nの値に対する順応変更を実施するアルゴリズムのフロー図を示している。図7の例示の方法は、スタンドアロンプロセスとして実施することもできるし、図4の方法内に組み込むこともでき、たとえば、リタイヤ命令カウント値が一致するまで前に進めて実行すること(図4のブロック426)、及びN個の命令を前に進めて実行すること(図4のブロック428)の間に組み込むことができる。このプロセスは開始して(ブロック700)、リタイヤ命令カウンタの正確度の証拠の収集に移る。いくつかの実施の形態では、リタイヤ命令カウンタの値が等しい場合、プロセッサ間の命令ポインタの値が比較される。たとえば、リタイヤ命令カウンタの値が等しい場合において、命令ポインタが同じであるとき、これは、リタイヤ命令カウンタに誤差がないことの証拠である。したがって、これらの実施の形態は、最も高いリタイヤ命令カウンタの値に向けて先に進めてステップした後、同期ロジックを使用して命令ポインタを交換すること等により、命令ポインタを交換することを必要とする。いくつかの実施の形態では、各プロセッサは、自身の記録されたストアアドレスの集合のサイズをストアアドレスの集合の和集合と比較する。たとえば、プロセッサが、自身のストアの集合のサイズが5エントリであり、すべてのストアアドレスの集合の和集合のサイズが5エントリであると計算すると、これは、プロセッサ間のリタイヤ命令カウンタの値に誤差がないか、又は、小さな誤差しかないことの証拠である。これに対して、プロセッサが、自身のストアアドレスの集合のサイズが5エントリであり、和集合のサイズが10(二重化冗長システムで)であるか、又は、15(三重化冗長システムで)であると計算すると、これは、リタイヤ命令カウンタの値の誤差が、Nの選択された値又は提供された値と等しいか又はそれよりも大きいかのいずれかであることの証拠である。
リタイヤ命令カウンタの正確度の証拠を収集する正確なメカニズムの如何を問わず、次のステップは、リタイヤ命令の誤差がNの値に近づいていることをその証拠が示すかどうかを判断することであり(ブロック704)、たとえば、誤差がN以上であることをその証拠が示唆するかどうかを判断することである。そうである場合、Nの値は調整されるべきであり(ブロック706)、証拠のログはリセットされる(ブロック716)(以下でさらに考察)。Nの値の増加又は減少は、他のプロセッサの協議なしに、各プロセッサが完了することもできるし、Nの値を増加させる判断は、それらプロセッサによるデータの交換を起動して、変更の正確な値について合意することもできる。
リタイヤ命令カウンタの不正確度がNの値に近づいていることを証拠が示唆していない場合、次のステップは、収集された証拠をログ記録することである(ブロック708)。したがって、たとえ、リタイヤ命令カウンタの誤差がNよりも大きい可能性があることを、収集された証拠の1つの事例が示していたとしても、(この場合、ユーザプログラムの複製コピーが正しくアラインメントされていない可能性があるので)Nの値の増加を行うべきである(ブロック704及び706)一方、Nの値を低くすることは、大きな証拠の集合に基づいて行われる。この証拠の集合のサイズが十分に大きくない場合(ブロック710)、プロセスは終了する(ブロック718)。他方、証拠の集合のサイズが十分に大きい場合(ブロック712)、たとえば、1週間のデータ又は1カ月のデータである場合、リタイヤ命令カウンタの値に起こり得る誤差が、Nの現在の値よりもはるかに小さいかどうかについての判断が行われる(ブロック712)。たとえば、プロセッサ間のリタイヤ命令カウンタの値の正確度が10カウント以下であるが、Nがおよそ1000程度である場合、Nの値を削減することができる(ブロック714)。他方、プロセッサ間のリタイヤ命令カウンタの値の正確度が100カウントであり、Nがおよそ200程度である場合、Nの値は変更されるべきではない。次のステップでは、証拠のログ記録がリセットされ(ブロック716)、プロセスは終了する(ブロック718)。
上記考察は、本発明の原理及びさまざまな実施の形態の例示であるように意図されている。当業者には、上記開示を十分に理解することによって、多数の変形及び変更が明らかになるであろう。たとえば、Itanium(登録商標)プロセッサが使用される場合に、そのコンパイラベースの投機的命令を使用できることを述べたが、プロセッサベースの投機は、リタイヤ命令カウンタに悪影響を与えるおそれがないので、上述した例示の方法及びシステムは、プロセッサベースの投機(たとえば、分岐予測投機及び命令リオーダ(reorder))と共に機能する。さらに、上述したさまざまな実施の形態は、非協調的という用語が定義された通りに、ユーザプログラムが非協調的であると判断された時にのみデータ交換を実行することに関係しているが、本発明の代替的な実施の形態では、メモリストアの記録並びにデータ及びレジスタ状態の交換は、割り込みのアサート時及び/又はあらゆるシステムコール時等の都合の良い任意の時刻に行うことができる。その上、図4の例示の実施の形態は、リタイヤ命令カウンタの値が一致するまで、各プロセッサが前に進めて実行することを説明している。しかしながら、N個の命令を実行した時のリタイヤ命令カウンタの値の差を、Nの値のサイズにおいて考慮することができる。たとえば、プロセッサが100命令のリタイヤ命令カウント値の差を有する場合、Nの値は、100に、リタイヤ命令カウンタについて予測できる誤差の最大量を加えたものとすることができる。添付の特許請求の範囲は、このようなすべての変形及び変更を包含するように解釈されることが意図されている。
本発明の実施の形態によるコンピューティングシステムを示す図である。 本発明の実施の形態によるコンピューティングシステムをより詳細に示す図である。 本発明の実施の形態による部分的なコンピューティングシステムを示す図である。 本発明の実施の形態による非協調プロセスハンドラのフロー図である。 本発明の実施の形態による非協調プロセスハンドラのフロー図である。 図4の方法を示すための複数の命令を示す図である。 図4の方法を示すための複数の命令を示す図である。 図4の方法を示すための複数の命令を示す図である。 本発明の実施の形態によるイベント割り込みに関連して非協調プロセスをハンドリングする時間表を示す図である。 本発明の実施の形態に従って使用されるNの値を順応して調整するフロー図である。
符号の説明
10A,10B,10C・・・マルチコンピュータシステム
12・・・論理プロセッサ
14,16・・・I/Oデバイス
17・・・ネットワーク
18,20,22,24・・・同期ロジック
26・・・相互接続
28・・・投票者ロジック
34・・・ネットワークインターフェース
42,42A,42B・・・I/Oブリッジ
44・・・プロセッサバス
45・・・メモリバス
46・・・メモリモジュール
48・・・再統合ロジック
52A,52B・・・メモリパーティション
54・・・同期レジスタ
56・・・投票者ロジック

Claims (10)

  1. 第1のプロセッサ及び第2のプロセッサ(PA、PB、PC)で実行されるユーザプログラムの複製コピーの実行ポイントをアラインメントすることであって、
    前記第1のプロセッサ(PA、PB、PC)において前記ユーザプログラムにより実行されるメモリストアのデータのみを、前記第1のプロセッサのメモリ(46)から前記第2のプロセッサ(PA、PB、PC)のメモリ(46)へコピーすること、及び
    前記第1のプロセッサ(PA、PB、PC)からの前記ユーザプログラムのレジスタ状態を、前記第2のプロセッサ(PA、PB、PC)による使用のためにコピーすること、によってアラインメントすること
    を含む、プロセッサベースの方法。
  2. 前記コピーすることの前に、前記第1のプロセッサ及び前記第2のプロセッサ(PA、PB、PC)のそれぞれにおけるリタイヤ命令カウンタの値がほぼ同じになるまで、前記ユーザプログラムの少なくとも1つが実行することを許可すること、
    各ユーザプログラムの所定の個数の命令を実行すること、
    前記実行することとほぼ同時に、前記ユーザプログラムのそれぞれがメモリにデータを記憶するロケーションのメモリアドレスを記録すること、及び
    前記ユーザプログラムのそれぞれがデータを記憶する前記メモリアドレスの和集合を求めること
    をさらに含み、
    前記データをコピーすることは、
    メモリアドレスの前記和集合によって画定されたメモリアドレスからのデータのみをコピーすること
    をさらに含む、請求項1に記載のプロセッサベースの方法。
  3. 前記リタイヤ命令カウンタの値の正確度の証拠を収集すること、及び
    前記収集した証拠に基づいて、前記所定の個数を調整すること
    をさらに含む、請求項2に記載のプロセッサベースの方法。
  4. 前記調整することは、
    前記リタイヤ命令カウンタの値の不正確度が前記所定の個数以上であることを前記正確度の証拠が示唆している場合に、前記所定の個数を増加させること、又は、
    前記リタイヤ命令カウンタの値の不正確度が前記所定の個数未満であることを前記正確度の証拠が示唆している場合に、前記所定の個数を減少させること、の一方
    をさらに含む、請求項3に記載のプロセッサベースの方法。
  5. 前記ユーザプログラムの前記複製コピーがそれぞれ所定の期間内にシステムレベルコールを行わなかったと判断した後にアラインメントすること
    をさらに含む、請求項1に記載のプロセッサベースの方法。
  6. 前記判断することは、
    前記第1のプロセッサ(PA、PB、PC)からの情報を前記第2のプロセッサ(PA、PB、PC)に提供することであって、前記情報は、前記第1のプロセッサ(PA、PB、PC)で実行されるユーザプログラムが所定の時間内にシステムレベルコールを行っていなかったことを示す、前記第1のプロセッサ(PA、PB、PC)からの情報を前記第2のプロセッサ(PA、PB、PC)に提供すること、及び
    前記第2のプロセッサ(PA、PB、PC)からの情報を使用して、前記第2のプロセッサ(PA、PB、PC)で実行される前記ユーザプログラムの複製コピーが前記所定の時間内にシステムレベルコールを行ったかどうかを、前記第1のプロセッサ(PA、PB、PC)によって判断すること
    をさらに含む、請求項5に記載のプロセッサベースの方法。
  7. 各プロセッサ(PA、PB、PC)の前記ユーザプログラムの、前記所定の時間内にシステムコールを行わなかったと判断された部分内において、各ユーザプログラムにシステムコールを挿入すること
    をさらに含む、請求項5に記載のプロセッサベースの方法。
  8. ユーザプログラムを実行する第1のプロセッサ(PA、PB、PC)であって、第1のメモリ(46)に連結された、第1のプロセッサと、
    前記ユーザプログラムの複製コピーをほぼ同時に実行する第2のプロセッサ(PA、PB、PC)であって、第2のメモリ(46)に連結された、第2のプロセッサ(PA、PB、PC)と、
    を備え、
    前記第1のプロセッサ(PA、PB、PC)は、
    前記第1のメモリ(46)のメモリストアロケーションからのデータを前記第2のプロセッサ(PA、PB、PC)に提供するように動作でき、
    前記第1のプロセッサ(PA、PB、PC)は、
    前記第2のプロセッサ(PA、PB、PC)に前記ユーザプログラムのレジスタ状態を提供するように動作できる
    システム。
  9. 前記第1のプロセッサ(PA、PB、PC)がデータを提供する前に、前記第1のプロセッサ(PA、PB、PC)は、
    自身の各ユーザプログラムの所定の個数の命令を実行するように動作でき、且つ、ほぼ同時に、前記所定の個数の命令におけるメモリストアのアドレスの第1のリストを作成するように動作でき、
    前記第1のプロセッサ(PA、PB、PC)がデータを提供する前に、前記第2のプロセッサ(PA、PB、PC)は、
    自身の各ユーザプログラムの所定の個数の命令を実行するように動作でき、且つ、ほぼ同時に、前記所定の個数の命令におけるメモリストアのアドレスの第2のリストを作成するように動作でき、
    前記第1のプロセッサ及び前記第2のプロセッサ(PA、PB、PC)は、
    自身の各リストを交換するように動作でき、
    前記第1のプロセッサ(PA、PB、PC)によって提供された前記データは、
    前記第1のリスト及び前記第2のリストの和集合の前記メモリロケーションからのデータである
    請求項8に記載のシステム。
  10. 実質的に各ユーザプログラム命令の少なくとも完了時の状態を変更する、前記第1のプロセッサ(PA、PB、PC)に関連した第1のリタイヤ命令カウンタと、
    実質的に各複製コピーのユーザプログラム命令の少なくとも完了時の状態を変更する、前記第2のプロセッサ(PA、PB、PC)に関連した第2のリタイヤ命令カウンタと
    をさらに備え、
    各プロセッサが前記所定の個数の命令を実行する前に、少なくとも1つのプロセッサ(PA、PB、PC)は、
    前記第1のリタイヤ命令カウンタの値及び前記第2のリタイヤ命令カウンタの値がほぼ等しくなるまで命令を実行するように動作できる
    請求項9に記載のシステム。
JP2006016022A 2005-01-25 2006-01-25 メモリストアをコピーすることによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム Expired - Fee Related JP4463212B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/042,427 US7328331B2 (en) 2005-01-25 2005-01-25 Method and system of aligning execution point of duplicate copies of a user program by copying memory stores

Publications (2)

Publication Number Publication Date
JP2006209768A true JP2006209768A (ja) 2006-08-10
JP4463212B2 JP4463212B2 (ja) 2010-05-19

Family

ID=36698446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006016022A Expired - Fee Related JP4463212B2 (ja) 2005-01-25 2006-01-25 メモリストアをコピーすることによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム

Country Status (3)

Country Link
US (1) US7328331B2 (ja)
JP (1) JP4463212B2 (ja)
CN (1) CN1811724B (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240806A1 (en) * 2004-03-30 2005-10-27 Hewlett-Packard Development Company, L.P. Diagnostic memory dump method in a redundant processor
US20060020852A1 (en) * 2004-03-30 2006-01-26 Bernick David L Method and system of servicing asynchronous interrupts in multiple processors executing a user program
US7426656B2 (en) * 2004-03-30 2008-09-16 Hewlett-Packard Development Company, L.P. Method and system executing user programs on non-deterministic processors
US7747844B2 (en) * 2005-03-31 2010-06-29 Hewlett-Packard Development Company, L.P. Acquiring instruction addresses associated with performance monitoring events
US7730350B2 (en) * 2005-04-28 2010-06-01 Hewlett-Packard Development Company, L.P. Method and system of determining the execution point of programs executed in lock step
US20070073977A1 (en) * 2005-09-29 2007-03-29 Safranek Robert J Early global observation point for a uniprocessor system
US20070083511A1 (en) * 2005-10-11 2007-04-12 Microsoft Corporation Finding similarities in data records
US7681185B2 (en) 2005-10-12 2010-03-16 Microsoft Corporation Template-driven approach to extract, transform, and/or load
US7991933B2 (en) * 2008-06-25 2011-08-02 Dell Products L.P. Synchronizing processors when entering system management mode
US8473964B2 (en) * 2008-09-30 2013-06-25 Microsoft Corporation Transparent user mode scheduling on traditional threading systems
CA3098730A1 (en) 2018-05-10 2019-11-14 Miovision Technologies Incorporated Blockchain data exchange network and methods and systems for submitting data to and transacting data on such a network
US10769071B2 (en) * 2018-10-10 2020-09-08 Micron Technology, Inc. Coherent memory access
GB2579591B (en) 2018-12-04 2022-10-26 Imagination Tech Ltd Buffer checker
GB2579590B (en) * 2018-12-04 2021-10-13 Imagination Tech Ltd Workload repetition redundancy

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU616213B2 (en) 1987-11-09 1991-10-24 Tandem Computers Incorporated Method and apparatus for synchronizing a plurality of processors
US5574849A (en) 1992-12-17 1996-11-12 Tandem Computers Incorporated Synchronized data transmission between elements of a processing system
EP0731945B1 (en) 1993-12-01 2000-05-17 Marathon Technologies Corporation Fault resilient/fault tolerant computing
US5491787A (en) * 1994-08-25 1996-02-13 Unisys Corporation Fault tolerant digital computer system having two processors which periodically alternate as master and slave
JP3123413B2 (ja) * 1995-11-07 2001-01-09 株式会社日立製作所 コンピュータシステム
US5790397A (en) 1996-09-17 1998-08-04 Marathon Technologies Corporation Fault resilient/fault tolerant computing
US5896523A (en) 1997-06-04 1999-04-20 Marathon Technologies Corporation Loosely-coupled, synchronized execution
CA2309926A1 (en) 1997-11-14 1999-05-27 Erik Muench Method for maintaining the synchronized execution in fault resilient/fault tolerant computer systems
US6085333A (en) * 1997-12-19 2000-07-04 Lsi Logic Corporation Method and apparatus for synchronization of code in redundant controllers in a swappable environment
US6247118B1 (en) * 1998-06-05 2001-06-12 Mcdonnell Douglas Corporation Systems and methods for transient error recovery in reduced instruction set computer processors via instruction retry
US6247143B1 (en) * 1998-06-30 2001-06-12 Sun Microsystems, Inc. I/O handling for a multiprocessor computer system
US6393582B1 (en) 1998-12-10 2002-05-21 Compaq Computer Corporation Error self-checking and recovery using lock-step processor pair architecture
JP3809930B2 (ja) * 1998-12-25 2006-08-16 株式会社日立製作所 情報処理装置
US7043728B1 (en) * 1999-06-08 2006-05-09 Invensys Systems, Inc. Methods and apparatus for fault-detecting and fault-tolerant process control
US6418540B1 (en) * 1999-08-27 2002-07-09 Lucent Technologies Inc. State transfer with throw-away thread
US6604177B1 (en) 2000-09-29 2003-08-05 Hewlett-Packard Development Company, L.P. Communication of dissimilar data between lock-stepped processors
US6604717B2 (en) * 2000-11-15 2003-08-12 Stanfield Mccoy J. Bag holder
GB2392742B (en) * 2002-09-04 2005-10-19 Advanced Risc Mach Ltd Synchronisation between pipelines in a data processing apparatus
US7117319B2 (en) * 2002-12-05 2006-10-03 International Business Machines Corporation Managing processor architected state upon an interrupt

Also Published As

Publication number Publication date
CN1811724A (zh) 2006-08-02
US7328331B2 (en) 2008-02-05
US20060168434A1 (en) 2006-07-27
JP4463212B2 (ja) 2010-05-19
CN1811724B (zh) 2011-08-03

Similar Documents

Publication Publication Date Title
JP4463212B2 (ja) メモリストアをコピーすることによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム
JP4386449B2 (ja) 実行される命令に関する情報を交換することによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム
JP2005285120A (ja) ユーザプログラムを実行する複数のプロセッサにおける非同期割り込みにサービスを提供する方法およびシステム
JP2005285119A (ja) 非決定的プロセッサにおいてユーザプログラムを実行する方法およびシステム
US7434098B2 (en) Method and system of determining whether a user program has made a system level call
US7155704B2 (en) Determinism in a multiprocessor computer system and monitor and processor therefor
Bernick et al. NonStop/spl reg/advanced architecture
JP2005285121A (ja) プロセッサ間で情報を交換する方法およびシステム
US8370841B2 (en) Optimizing deterministic event record and replay operations
TWI590153B (zh) 用於多線串處理之方法
US4965717A (en) Multiple processor system having shared memory with private-write capability
US6499048B1 (en) Control of multiple computer processes using a mutual exclusion primitive ordering mechanism
Ronsse et al. Record/replay for nondeterministic program executions
US9594648B2 (en) Controlling non-redundant execution in a redundant multithreading (RMT) processor
JP3030658B2 (ja) 電源故障対策を備えたコンピュータシステム及びその動作方法
KR20000005689A (ko) 시간지연이중화기술을구현하는장치및방법
US7549085B2 (en) Method and apparatus to insert special instruction
US7447941B2 (en) Error recovery systems and methods for execution data paths
JP2006252548A (ja) 時間的冗長性を実施するための可変遅延命令
Reif Fault tolerance in multi-core systems

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100121

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100216

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4463212

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140226

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees