JP2006209769A - 実行される命令に関する情報を交換することによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム - Google Patents

実行される命令に関する情報を交換することによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム Download PDF

Info

Publication number
JP2006209769A
JP2006209769A JP2006016023A JP2006016023A JP2006209769A JP 2006209769 A JP2006209769 A JP 2006209769A JP 2006016023 A JP2006016023 A JP 2006016023A JP 2006016023 A JP2006016023 A JP 2006016023A JP 2006209769 A JP2006209769 A JP 2006209769A
Authority
JP
Japan
Prior art keywords
processor
instructions
instruction
user program
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006016023A
Other languages
English (en)
Other versions
JP4386449B2 (ja
Inventor
Vigna Paul Del Jr
ポール・デル・ビグナー・ジュニア
Robert L Jardine
ロバート・エル・ジャーディン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2006209769A publication Critical patent/JP2006209769A/ja
Application granted granted Critical
Publication of JP4386449B2 publication Critical patent/JP4386449B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3851Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

【課題】ユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステムを提供する。
【解決手段】
本発明にかかるプロセッサベースの方法は、ユーザプログラムの複製コピーを第1のプロセッサ及び第2のプロセッサで動作させること、命令の少なくともいくつかを復号して、復号された各命令の入力を求めることであって、復号することは、各プロセッサにおける実行とほぼ同時である、復号された各命令の入力を求めること、プロセッサ間で、復号された命令のアドレス及び復号された命令の入力を示す値を交換すること、少なくとも復号された命令のアドレスを使用して、第1のプロセッサにおけるユーザプログラムの実行ポイントが、第2のプロセッサのユーザプログラムの実行ポイントより遅れていると判断すること、及び各ユーザプログラム内の実行ポイントがほぼアラインメントされるまで、第1のプロセッサを進めることを含む。
【選択図】図3

Description

本発明は、ユーザプログラムにおける実行ポイントのアラインメントに関する。
[関連出願の相互参照]
本出願は、「Method and System of Determining Whether An Application Program Has Made A System Level Call」と題する同時係属中の米国特許出願第11/042,981号(CR参照番号2162−30600))に関連する。また、本出願は、「Method and System of Aligning Execution Point of Duplicate Copies of a User Program by Copying Memory Stores」と題する同時係属中の米国特許出願第11/042,427号(CR参照番号2162−35000))にも関連する。
緩やかなロックステッププロセッサ(loosely lock-stepped processor)は、ユーザプログラムの複製コピーを実行するプロセッサであるが、これらのプロセッサは、ユーザプログラムの自身の各コピーを同じ歩調で実行する必要もなければ、同じウォールクロック時刻に実行する必要もない。緩やかなロックステッププロセッサは、宇宙線によって引き起こされるような計算誤りを検出して訂正するのに使用することができ、また、ユーザプログラムがハードウェア障害にもかかわらず動作し続けることを確実にするのに使用することもできる。
クロック周波数のわずかな相違のため、又は、或るプロセッサでは遭遇したが、他のプロセッサでは遭遇していない訂正可能なソフトエラーのため、或るプロセッサは、ユーザプログラム内の自身の実行ポイントにおいて進む(lead)ことがあり、プロセッサにおいてユーザプログラムが進んでいるのか、それとも遅れているのかを判断することは難しい。プログラムカウンタ又は命令ポインタの比較は、ユーザプログラムの実行ポイントを十分に特定することができない。その理由は、すべてのユーザプログラムは、同じソフトウェアループにあるが、ループの異なる繰り返しに存在することがあり、命令ポインタが同じ場合もあるからである。さらに、いくつかのプロセッサは、自身の性能監視ユニットに、各リタイヤ命令(retired instruction)でインクリメントを試みるリタイヤ命令カウンタ(retired instruction counter)を実施する。リタイヤ命令カウンタは性能監視目的で含まれ、必ずしも、ありとあらゆるリタイヤ命令を正しくカウントするとは限らないことから、リタイヤ命令カウンタの値の比較は十分でない場合がある。例えば、リタイヤ命令カウンタが特定の値に達すると、プロセッサによっては、新たな命令のロードを中止する機能を有するものもある。しかしながら、パイプラインプロセッサは、スライディングストップ(sliding stop)として知られている、完了する命令、及び、リタイヤ命令カウンタによってカウントされない命令をパイプラインに依然としていくつか有することがある。その上、プロセッサ製造業者は、自身のリタイヤ命令カウンタが100パーセント正確であることを保証しない。
本発明の一実施形態は、ユーザプログラムの複製コピーを第1のプロセッサ及び第2のプロセッサ(PA、PB、PC)で動作させること、前記命令の少なくともいくつかを復号するとともに、復号された各命令の入力を求めることであって、前記復号することは、各プロセッサ(PA、PB、PC)における実行とほぼ同時である、前記命令の少なくともいくつかを復号するとともに、復号された各命令の入力を求めること、前記プロセッサ(PA、PB、PC)間で、復号された命令のアドレス及び前記復号された命令の入力を示す値を交換すること、少なくとも前記復号された命令の前記アドレスを使用して、前記第1のプロセッサ(PA、PB、PC)における前記ユーザプログラムの実行ポイントが、前記第2のプロセッサ(PA、PB、PC)の前記ユーザプログラムの実行ポイントに対して遅れていると判断すること、及び各ユーザプログラム内の前記実行ポイントがほぼアラインメントされるまで、前記第1のプロセッサ(PA、PB、PC)を進めること、を含むプロセッサベースの方法である。
次に、本発明の例示の実施の形態の詳細な説明について、添付図面が参照される。
[表記及び専門用語]
以下の説明及び特許請求の範囲の全体を通じて、特定のシステムコンポーネントを参照するために、一定の用語が使用される。当業者には分かるように、コンピュータ企業は、或るコンポーネントを異なる名前で参照することがある。この文書は、名前は異なるが機能は異ならないコンポーネントを区別するつもりはない。以下の考察及び特許請求の範囲では、用語「含む」及び「備える」は、オープンエンドな形式で使用され、したがって、「含むが、これらに限定されるものではない」との意味に解釈されるべきである。また、用語「連結する」は、間接的な接続又は直接的な接続のいずれかを意味するように意図されている。したがって、第1のデバイスが第2のデバイスに連結する場合、その接続は、直接的な接続を通じている場合もあるし、他のデバイス又は接続を介して間接的な接続を通じている場合もある。
[詳細な説明]
以下の考察は、本発明のさまざまな実施の形態を対象にする。これらの実施の形態の1つ又は複数は好ましいものとすることができるが、開示した実施の形態は、開示の範囲を限定するものとして解釈されるべきでなく、それ以外に使用されるべきでない。これに加えて、以下の説明は幅広い用途を有すること、及び、どの実施の形態の考察も、その実施の形態の例示にすぎないことが意図されており、開示の範囲がその実施の形態に限定されることを暗示するようには意図されていないことが当業者には理解されよう。
図1は、本発明の実施の形態によるコンピューティングシステム1000を示している。詳細には、コンピューティングシステム1000は、複数のマルチプロセッサコンピュータシステム10を備える。いくつかの実施の形態では、2つのマルチプロセッサコンピュータシステム10のみを使用することができ、したがって、コンピューティングシステム1000は、二重化冗長(DMR;dual-modular redundant)システムを実施することができる。図1に示すように、コンピューティングシステム1000は、3つのマルチプロセッサコンピュータシステム10を備え、したがって、三重化冗長(TMR;tri-modular redundant)システムを実施する。コンピュータシステムが二重化冗長であるのか、それとも三重化冗長であるのかにかかわらず、コンピューティングシステム1000は、マルチプロセッサコンピュータシステム全体にわたってユーザプログラムを冗長に実行することにより、フォールトトレランスを実施する。
本発明の実施の形態によれば、各マルチプロセッサコンピュータシステム10は、好ましくは、1つ又は複数のプロセッサを備え、図1に示すように、4つのプロセッサを備える。図1の各プロセッサは、プロセッサを示す頭文字「P」を有する。さらに、各プロセッサには、マルチプロセッサコンピュータシステム10A、10B、及び10Cの1つの内部におけるプロセッサの物理ロケーションをそれぞれ示す「A」、「B」、又は「C」の文字名称も与えられる。最後に、各プロセッサには、各マルチプロセッサコンピュータシステム内のそのプロセッサのロケーションを示す数字名称が与えられる。したがって、例えば、マルチプロセッサコンピュータシステム10Aのプロセッサは、名称「PA1」、「PA2」、「PA3」、及び「PA4」を有する。
本発明の実施の形態によれば、各マルチプロセッサコンピュータシステム10からの少なくとも1つのプロセッサは、論理的にグループ化されて、論理プロセッサ12を形成することができる。図1に示す例示の実施の形態では、プロセッサPA3、PB3、及びPC3がグループ化されて、論理プロセッサ12を形成することができる。本発明の実施の形態によれば、論理プロセッサ内の各プロセッサは、ユーザプログラムの複製コピーをほぼ同時に実行し、したがって、フォールトトレランスを実施する。より詳細には、論理プロセッサ内の各プロセッサは、ユーザプログラムの同じ命令ストリームの提供を受けて、同じ結果を計算する(誤差がないと仮定して)が、論理プロセッサ内のプロセッサは、厳密なロックステップではなく、サイクルごとのロックステップでもない。これらのプロセッサは、緩やかなロックステップであり、割り込みのハンドリングは、システムコール(後述)に基づいて行われる。いくつかの実施の形態によれば、プロセッサは非決定的な実行を有する場合があり、したがって、厳密なロックステップは実行可能でない場合がある。プロセッサの1つが故障した場合、1つ又は複数の残りのプロセッサは、全体のシステム性能に影響を与えることなく続行することができる。
論理プロセッサ内に同じユーザプログラムを実行する2つ又は3つ以上のプロセッサが存在しうるため、入出力(I/O)デバイス14及び16に対する読み出しや書き込み等の二重(duplicate)読み出し及び二重書き込みが発生する場合がある。I/Oデバイス14及び16は、任意の適切なI/Oデバイスとすることができ、例えば、ネットワークインターフェースカード、フロッピー(登録商標)ドライブ、ハードディスクドライブ、CD −ROMドライブ、及び/又はキーボードとすることができる。障害検出の目的で読み出し及び書き込みを比較するために、各論理プロセッサは、自身を同期ロジックに関連付けている。例えば、プロセッサPA1、PB1、及びPC1は、同期ロジック18に関連付けられた論理プロセッサを形成する。同様に、プロセッサPA2、PB2、及びPC2は、同期ロジック20に関連付けられた論理プロセッサを形成する。論理プロセッサ12は、同期ロジック22に関連付けられている。最後に、プロセッサPA4、PB4、及びPC4は、同期ロジック24に関連付けられた論理プロセッサを形成する。このように、各マルチプロセッサコンピュータシステム10は、それぞれを、相互接続26を経由して同期ロジック18、20、22、及び24のそれぞれに連結する。相互接続26は、周辺機器相互接続(PCI)バスであり、詳細には、直列化PCI(serialized PCI)バスである。ただし、他のバス通信方式も同等に使用することができる。
各同期ロジック18、20、22、及び24は、投票者ロジックユニットを備え、例えば、同期ロジック22の投票者ロジック28を備える。以下の考察は、同期ロジック22の投票者ロジック28を対象にしているが、同期ロジック18、20、22、及び24のそれぞれの各投票者ロジックユニットにも等しく適用することができる。投票者ロジック28は、プロセッサからの読み出し要求及び書き込み要求を集約するように動作し、場合によっては、論理プロセッサの同期のために、プロセッサ間の情報交換の役割を果たす。説明のために、論理プロセッサ12の各プロセッサがユーザプログラムの自身のコピーを実行することについて考察し、各プロセッサがネットワークインターフェース34に対する読み出し要求を生成することについて考察する。論理プロセッサ12の各プロセッサは、自身の読み出し要求を投票者ロジック28に送信する。投票者ロジック28は、各読み出し要求を受信し、それら読み出し要求を比較し、(読み出し要求が一致すると仮定して)ネットワークインターフェース34に単一の読み出し要求を発行する。
同期ロジックによって発行された単一読み出し要求に応答して、例示のネットワークインターフェース34は、要求された情報を投票者ロジック28に返信する。次に、投票者ロジックは、要求された情報を複製して、論理プロセッサ内のプロセッサのそれぞれに渡す。同様に、パケットメッセージの書き込みや他のプログラム(他の論理プロセッサ上で実行されることがある)へのパケットメッセージの転送等の他の入出力機能についても、同期ロジックは、それらの要求が一致することを確認し、次いで、単一の要求を適切なロケーションに転送する。論理プロセッサのいずれか1つのプロセッサが適切に機能しない場合(例えば、要求を生成できない場合、指定された時間内に要求を生成できない場合、一致しない要求を生成する場合、又は、完全に故障している場合)、全体のユーザプログラムは、論理プロセッサの残りの1つ又は複数のプロセッサの要求に基づいて続行する。
外部インターフェース(ネットワークインターフェース34等)に対する読み出し及び書き込みの集約、及び、それら外部インターフェースから返信されたデータの複製に加えて、同期ロジックは、日時情報の要求が行われた時に各プロセッサに同じ日時が確実に提供されるようにする役割も果たす。詳細には、ユーザプログラムは、それらユーザプログラムの実行における一定のポイントで、日時情報を要求するシステムコールを行うことがある。システムコールは、オペレーティングシステムプログラム等の(ユーザモードよりも高い特権モードで実行される)特権プログラムに対するあらゆるコールである。日時情報を得るためのシステムコールは、システムコールのカテゴリーに分類されるプログラムファミリーの単なる一例にすぎず、割り込みをハンドリングする際のシステムコールの役割は、以下でより十分に考察する。ユーザプログラムにおける同じ実行ポイントにおいて(それらの実行ポイントに到達した時のウォールクロック時刻が異なるにもかかわらず)同じ日時を各ユーザプログラムに提供するために、論理プロセッサ内の各プロセッサが内部的に時刻を導き出すのではなく、本発明の実施の形態による同期ロジックが論理プロセッサ内の各プロセッサに日時情報を提供する。
図2は、マルチプロセッサコンピュータシステム10をより詳細に示している。詳細には、図2は、本発明の実施の形態によるマルチプロセッサコンピュータシステム10が、複数のプロセッサを有することができ、図2の例示の事例では4つのこのようなプロセッサ34、36、38、及び40を有することができることを示している。4つのプロセッサのみが示されているが、本発明の範囲及び精神から逸脱することなく、任意の個数のプロセッサを使用することができる。プロセッサ34〜40は、個別にパッケージングされたプロセッサとすることができ、プロセッサのパッケージは、単一のパッケージ内に2つ又は3つ以上のプロセッサダイを備えるか、又は、単一のダイ上に複数のプロセッサを備える。プロセッサのそれぞれは、プロセッサバス44を経由してI/Oブリッジ及びメモリコントローラ42(以下、I/Oブリッジ42という)に連結することができる。I/Oブリッジ42は、メモリバス45を経由してプロセッサ34〜40を1つ又は複数のメモリモジュール46に連結する。したがって、I/Oブリッジ42は、1つ又は複数のメモリモジュール46によって画定されたメモリ領域に対する読み出し及び書き込みを制御することができる。また、I/Oブリッジ42は、バスライン43によって示すように、プロセッサ34〜40のそれぞれが同期ロジック(図2に図示せず)に連結することも可能にすることができる。
図2をさらに参照して、1つ又は複数のメモリモジュール46によって画定されたメモリを、各プロセッサにつき1つのパーティションに区画することができる。したがって、プロセッサのそれぞれは、独立に動作することが可能になる。代替的な実施の形態では、各プロセッサは、それ自身の一体化されたメモリコントローラを有することができ、したがって、各プロセッサは、それ自身の専用メモリを有することができ、これも本発明の考慮の範囲内にある。プロセッサ34〜40は、厳密なロックステップ実行に適していない非決定的プロセッサとすることもできる。
図2は、各マルチプロセッサコンピュータシステム10が、I/Oブリッジ42とメモリモジュール46との間に連結された再統合ロジック48を備えることもさらに示している。図1の例示の実施の形態は、再統合ロジックの相互接続(ライン50)をリング形式で示しているが、任意のネットワークトポロジを同等に使用することができる(例えば、リング、ツリー、二重リング、完全接続)。動作時において、再統合論理ロジック48は、I/Oブリッジ42に対してトランスペアレントであり、1つ又は複数のメモリモジュール46に対する読み出し及び書き込みを妨げない。しかしながら、論理プロセッサ内の或るプロセッサが障害に遭遇し、再起動する必要がある場合に、再統合ロジック48は、以前故障したプロセッサが、論理プロセッサの故障していないプロセッサと同じポイントで開始できるように、別のプロセッサから少なくともユーザプログラムメモリのコピーを可能にする。
緩やかなロックステップシステムでは、或るプロセッサが進んだり遅れたりすることがある理由は多く存在し得る。例えば、各プロセッサはほぼ同じクロック周波数で命令を実行することができるが、実際のクロック周波数の差は小さくても、時間の経過によってかなりの差になることがある。その上、本発明の少なくともいくつかの実施の形態に従って実施されたプロセッサは、非決定的な実行を有し、したがって、たとえ正確に同じユーザプログラムが提供されても、プロセッサは、ユーザプログラムの同じ実行ポイントに到達するのに実行ステップ数が大きく異なる場合がある。さらにまた、いくつかのプロセッサは、データアクセス遅延及び/又はエラーに遭遇する可能性もある。いくつかの例として、或るプロセッサが、他のプロセッサが遭遇することができないキャッシュミスに遭遇することがある、或るプロセッサが訂正可能なメモリエラーに遭遇することがあり、したがって、残りのプロセッサには必要とされない回復ルーチンの実行を必要とすることがある、及び、或るプロセッサがトランスレーション・ルックアサイド・バッファ(Translation Look-aside Buffer)のミスに遭遇することがあり、それによって、ユーザプログラムの最終結果に影響を与えないが付加的処理が行われる、といったものがある。これらの場合も、プロセッサは、最終的に、ユーザプログラムの同じ実行ポイントに到達するが、実行される命令数、及び、それらの命令を実行するのに必要な時間は、同じでないことがある。
論理プロセッサのプロセッサが同じ命令ストリームを実行しているが、その命令ストリームの同じポイントに存在しないことがあるという考えに留意して、このような環境における割り込みのハンドリングに考察を移す。たとえ、同じ割り込みが、正確に同じウォールクロック時刻で各プロセッサにアサートされても、それら各プロセッサの緩やかなロックステップ実行により、割り込みは、ユーザプログラムの同じ実行ポイントでアサートされないことがある。この問題は、割り込みアサート自体が非同期であることによってさらに悪化する。適切なオペレーションを確保するために、論理プロセッサ内の各プロセッサは、ユーザプログラムの命令ストリームの同じ実行ポイントで、割り込みにサービスを提供する必要がある。本発明の実施の形態によれば、割り込みが命令ストリームの同じ実行ポイントでサービスを受けることを確保することは、割り込みにサービスを提供するためのランデブーポイントについて合意するメカニズムとして同期ロジックを利用することによって行われる。
本発明の実施の形態によれば、論理プロセッサ内のプロセッサは、特定の割り込みがアサートされたこと、及び、実行を一時停止して割り込みにサービスを提供するためのユーザプログラムの提案されたポイント、を互いに通信する。換言すると、論理プロセッサ内のプロセッサは、どの割り込みにサービスを提供すべきか(又は最初にサービスを提供すべきか)について合意し、また、割り込みにサービスを提供するためのユーザプログラムのポイントについても合意する。図3は、協力して割り込みのサービス提供を調整するさまざまなコンポーネントのオペレーションを説明するために、部分的なコンピューティングシステム1000を示している。図3は、論理プロセッサ50が、この場合、2つのプロセッサPA1及びPB1のみを備えるという意味で、図1のシステムを簡略化したものである。また、図3は、別の意味では、各プロセッサのメモリパーティション52を示し、プロセッサがI/Oブリッジ42を通じてメモリパーティション及び投票者ロジックにどのように連結するかを示しているので、図1よりも詳細化されている。このように、図3の論理プロセッサ50は、マルチプロセッサコンピュータシステム10A及び10Bからのそれぞれ1つのプロセッサを備える。プロセッサPA1は、I/Oブリッジ42Aに連結し、I/Oブリッジ42Aは、同期ロジック18及びPA1プロセッサのメモリパーティション52Aの双方に連結する。プロセッサPB1は、その各I/Oブリッジ42Bに連結し、I/Oブリッジ42Bは、同期ロジック18及びPB1プロセッサのメモリパーティション52Bに連結する。
少なくともいくつかの実施の形態によれば、論理プロセッサのプロセッサに、割り込みにサービスを提供するためのランデブーポイントを確立するための情報を交換させるには、各プロセッサが同期ロジック18の投票者論理回路56における同期レジスタ54に情報を書き込むことが必要とされる。本発明の実施の形態によれば、ランデブーポイントは、任意の適切な位置とすることができ、オペレーティングシステムのディスパッチャ機能が実行され、他のタスクを実行に設定する各時刻、トラップ及び障害ハンドラ、ユーザプログラムによって行われたシステムコール等とすることができる。しかしながら、用語「システムコール」は、本明細書では、一般的に、任意の可能なランデブーポイントを指すために使用されることが理解されよう。システムコール番号は、システムコールが任意の開始点(starting point)から行われた回数を示す番号とすることができる。例えば、図3のロケーション72は、システムコール番号が存在するメモリパーティション52のロケーションを示している。代替的な実施の形態では、システムコール番号は、メモリパーティション52以外に位置するレジスタにも同等に記憶することができる。図3に示す実施の形態では、同期レジスタ54は、事前に指定されたメモリロケーションであるが、データを書き込むことができるロケーションならばどのロケーションでも十分である。プロセッサの一部又はすべてが自身の各情報を書き込んだ後、投票者ロジック56は、同期レジスタ54の情報を、メモリパーティション52のそれぞれにおける対応する1組のメモリロケーション57にライトバックする。同期ロジックへ情報を書き込むことによって、残りのプロセッサが割り込みを調べるのを待っている間、ユーザプログラムの処理を続けることが可能になる。情報を交換することによって、論理プロセッサ内のプロセッサは、ユーザプログラムのどのポイントで割り込みにサービスを提供するかを調整する。
任意の時刻にプロセッサに割り込みをアサートすることは、割り込み情報を含んだパケットベースのメッセージを介して行うこともできるし、専用割り込み信号ラインを介して行うこともできる。また、割り込みは、或るプロセッサクロックサイクル数の後に満了するように設定されたタイマ等の内部信号源からプロセッサにアサートすることもできる。このようなパケット又は内部割込みがプロセッサによって受信され検出されると、ユーザプログラムは一時停止され、割り込みハンドラルーチンが起動される。割り込みハンドラルーチンの目的は、ランデブーポイントを特定するプロセスを開始することである。割り込みによって要求されたサービスに関する動作は、割り込みハンドラルーチンによっては行われない。システムコールは、ランデブーポイントをスケジューリングしたプロセスが完了したポイントであり、また、割り込みにサービスを提供するプログラムのスケジューリングが行われたポイントでもある。システムコールに基づく割り込みのスケジューリングに関するより多くの情報については、「Method and System of Loosely Lock-Stepped Non-Deterministic Processors」と題する同時係属中の米国特許出願第11/042,548号(CR参照番号2162−22100))を参照することができる。
このように、割り込みのサービス提供の調整は、システムコールにおいて行われる。しかしながら、長期間の間、システムコールを行わないユーザプログラムが存在し得る。したがって、論理プロセッサ内のプロセッサが、実行しているユーザプログラムの部分について大幅に異なる可能性があり、且つ/又は、さらに、割り込みにサービスを提供する十分な機会がない可能性がある。十分な頻度でシステムコールを行わないユーザプログラムは、「非協調プロセス(uncooperative process)」と呼ばれる。
本発明の実施の形態による非協調プロセスのハンドリングは、いくつかの段階を有する。第1段階は、ユーザプログラムが確かに非協調的なものであることを特定することである。第2段階は、どのプロセッサ(複数可)がユーザプログラムの実行ポイントにおいて遅れているかを特定し、その遅れているプロセッサを進めることである。最後に、最終段階は、元非協調プロセスを変更することとすることができる。これらの段階のそれぞれについて次に取り扱うことにする。
いくつかの実施の形態では、ユーザプログラムがあまりにも稀にしかシステムコールを行わず、したがって、非協調的であるとみなされることを特定することには、タイマの使用を必要とする。ユーザプログラムがタイマの満了前にシステムコールを行わないと、そのユーザプログラムは非協調プロセスである。また、本発明のいくつかの実施の形態によれば、プロセッサのディスパッチャ(最も高い特権状態であるカーネルモードで動作する)が、ユーザプログラムを実行にセットするごとに、ディスパッチャは、プロセッサのリタイヤ命令カウンタをリセットし、ユーザ(最低レベル特権)命令のみをカウントするようにそのリタイヤ命令カウンタを設定し、非協調プロセスタイマを始動し、現在のシステムコール番号の表示を記憶する。リタイヤ命令カウンタは、例えば、ほとんどの市販のプロセッサの性能監視ユニットで実施されるカウンタである。リタイヤ命令カウンタの値は、プロセッサによる各ユーザレベル命令の実行完了時にインクリメントされる。非協調プロセスタイマに関して、インターバルタイムカウンタ(ITC;Interval Time Counter)レジスタ及びインターバルタイムマッチ(ITM;Interval Time Match)レジスタを装備することによって、Intel(登録商標)により製造されたItanium(登録商標)プロセッサを、非協調プロセスを検出するのに使用することができる。ITCは、プロセッサの電源投入時にカウントを開始するフリーランニングカウンタ(free running counter)である。「フリーランニング」ということは、ITCが、実行される命令の個数及び/又はタイプにかかわらずカウントし、どの命令(特権にかかわらず)によってもITCを停止させることができず、どのユーザ命令によってもITCの値を変更できないことを意味する。これらの実施の形態で非協調プロセスタイマを始動することは、したがって、ITCの値を読み出すこと、及び、所望の時間が経過した時にITCの値を表す値をITMに置くことを意味する。ITCレジスタ及びITMレジスタの値が等しい場合、インターバルタイマ割り込みがアサートされる。これらの例示の実施の形態の非協調プロセスタイマは真に「満了」していないが、ここから先では、非協調プロセスタイマとして使用されるどのタイマのタイプのシステムにも一般に当てはまるように、ITMと一致するITCの値の考察を「タイマの満了」と呼ぶことにする。Itanium(登録商標)プロセッサが使用される場合、コンパイラが挿入した、例えばload.s及びload.chkの対といった投機的命令(speculative instruction)は、リタイヤ命令カウント値に大きな影響を与える可能性があるので、ユーザプログラムで許可されないことに留意されたい。ITC/ITMタイプのタイミング機能を実施しないプロセッサの場合、周期的タイマ割り込みを、レジスタと組み合わせて使用し、割り込みの回数を追跡することができ、所定の個数の周期的タイマ割り込みが発生した後に非協調プロセスに関連したタスクを実行することができる。再び、非協調プロセスタイマの一般論に移って、タイマの満了時に、非協調プロセスハンドラルーチンを起動する割り込みがアサートされる。非協調プロセスハンドラルーチンは、タイマによって規定された期間中に少なくとも1つのシステムコールがあったかどうかをチェックする。このタイマによって規定された期間は、いくつかの実施の形態では、およそ100マイクロ秒程度とすることができる。非協調タイマの満了によって引き起こされた割り込みは、各プロセッサで直ちにサービスの提供を受けるという点で、ユーザプログラムの実行中にアサートされた他の割り込みとは異なるクラスの割り込みとみなすことができる。それに対して、ユーザプログラムの実行中にアサートされた他の割り込みは、ランデブーポイントでサービスの提供を受けるようにスケジューリングされる。代替的な実施の形態では、システムコールは、タイマをリセットして、非協調プロセスハンドラルーチンのトリガを回避することができるが、これらのリセットは、多大なコストを要するカーネルモードプロセスコールを必要とすることがある。非協調プロセッサタイマに関連した割り込みは、各プロセッサの内部でハンドリングされ(確かに、ユーザプロセスが協調的である場合、非協調プロセスタイマが満了したことは、他のプロセスに通信されない)、したがって、論理プロセッサのさまざまなプロセッサにわたって調整されたサービス提供を必要とする、入出力要求等の割り込みとは異なるタイプの割り込みとみなすことができる。
図4は、本発明の実施の形態による非協調プロセスハンドラのフロー図を示している。詳細には、非協調プロセスハンドラは、非協調プロセスタイマの満了後に割り込みをアサートすることによって開始する(ブロック400)。割り込みを無効にした(ブロック402)後、非協調プロセスハンドラは、現在のシステムコール番号(例えば、図3のロケーション72から)、及び、開始時にディスパッチャにより記憶されたシステムコール番号を読み出す(ブロック404)。割り込みの無効は、明示的なステップで行うこともできるし、割り込みハンドラに入った時に自動的に行うこともできる。現在のシステムコール番号がディスパッチャによって開始時に記憶されたシステムコール番号と同じである(ブロック406)ことは、ユーザプログラムが、非協調プロセスタイマによって規定された期間中にシステムコールを行わなかったことを示し、したがって、ユーザプログラムが非協調プロセスであることを示す。他方、現在のシステムコール番号が、記憶されたシステムコール番号と同じでない場合には(再びブロック406)、そのプロセスは協調的であり、したがって、例示の方法は、非協調プロセスタイマをリセットし(ブロック417)、現在のシステムコール番号を保存し(ブロック419)、割り込みを有効にし(ブロック418)、そしてリターンする(ブロック420)。
本発明の実施の形態によれば、ユーザプログラムが論理プロセッサの少なくとも1つのプロセッサ内で非協調的になることによって、他のプロセッサとのデータの交換が起動され、論理プロセッサの他のプロセッサがその非協調性に同意するかどうかが判断される。引き続き図4を参照して、現在のシステムコール番号が、ディスパッチャによって記憶されたシステムコール番号と同じである場合(ブロック406)、次のステップは、未確認のランデブーオペレーションがあるかどうかの判断である(ブロック408)(以下でより十分に考察する)。未確認のランデブーがない場合、次のステップは、ユーザプログラムの非協調性の表示を、現在のリタイヤ命令カウンタ(RIC)の値と共に、投票者ロジック56の同期レジスタ54に書き込むことである(ブロック410)。その後、非協調プロセスハンドラルーチンは、同期データの返信を投票者ロジックのソフトウェアループで待機する(ブロック412)。
いくつかの実施の形態では、どの時点においても、データの交換は1つしか進行できないので、非協調プロセスタイマの満了時にまだ完了していないランデブーポイントである未確認のランデブーをスケジューリングしようとする試みが行われている場合(再びブロック408)、次のステップは、投票者ロジックが同期データを書き込むまでソフトウェアループで待機することである(ブロック422)。ライトバックされた同期データは、前の割り込み(非協調プロセスハンドラルーチンの現在の実行をトリガした非協調プロセスタイマ満了割り込みではない)についてのものであることに留意して、返信されたデータは、ランデブーポイントのスケジューリングに使用される(ブロック424)。ランデブーポイントのスケジューリングに関するより多くの情報については、「Method and System of Loosely Lock-Stepped Non-Deterministic Processors」と題する米国特許出願第11/042,548号(CR参照番号2162−22100))を参照することができる。ランデブーポイントのスケジューリング(ブロック424)の後、プロセスは、ユーザプログラムの非協調性の表示を、現在のリタイヤ命令カウンタの値と共に、投票者ロジック56の同期レジスタ54に書き込むことに進み(ブロック410)、データの返信をソフトウェアループで待機する(ブロック412)。
ユーザプログラムが非協調的であることにプロセッサが合意しない場合には(ブロック414)、返信されたデータの解析が行われて、ユーザプログラムが他のプロセッサにおいて協調的であるかどうかが判断される(ブロック416)。例えば、一方のプロセッサの非協調プロセスタイマは、ユーザプログラムによるシステムコールの直前に満了することがある一方、論理プロセッサの第2のプロセッサのユーザプログラムは、満了直前にシステムコールを行うことがある。したがって、一方のプロセッサは、プロセスが非協調的であることを示し、第2のプロセッサは、提案したランデブーポイントの書き込みを含めて、次の割り込みをハンドリングするためのランデブーポイントのスケジューリングを試みる。この解析によって、ユーザプログラムがまもなくシステムコールを行うことが明らかになると(ブロック416)、非協調プロセスタイマがリセットされ(ブロック417)、現在のシステムコール番号が保存され(ブロック419)、割り込みが有効にされ(ブロック418)、そして、ユーザプログラムが実行を継続でき、まもなく再び協調的となるように、プロセスはリターンする(ブロック420)。
さらに図4を参照して、ユーザプログラムが非協調的であることに論理プロセッサのすべてのプロセッサが合意した場合(ブロック414)、ユーザプログラムのリタイヤ命令カウンタがプロセッサの最も高いリタイヤ命令カウンタと同じになるまで、プロセッサがユーザプログラムを先に進めて実行することによって、ユーザプログラムのさまざまなコピーをアラインメントするプロセスは開始する(ブロック426)(リタイヤ命令カウンタの値は、ブロック410において、各プログラムの非協調性の表示と共に交換されるので、各プロセッサはその情報を知っている)。場合によっては、図4の例示の非協調プロセスハンドラが動作しているプロセッサは、最も高いリタイヤ命令カウンタを有し、したがって、ユーザプログラムは、適切なポイントにいる。最も高いリタイヤ命令カウンタの値に向けて先に実行することは、多くの形態を取ることができる。現在のプロセッサのリタイヤ命令カウンタの値が、最も高いリタイヤ命令カウンタの値よりもかなり遅れている場合、タイマを始動することができ、タイマの活動時間の期間中、ユーザプログラムの実行を可能にすることができる。或いは、タイマ期間の間、ユーザプログラムが実行することを可能にするために、又は、最も高いリタイヤ命令カウンタの値に近いリタイヤ命令カウンタを得るのにタイマが使用された後のいずれかで、プロセッサを単一命令モード(single instruction mode)に置くことができる。この単一命令モードでは、リタイヤ命令カウンタが最も高いリタイヤ命令カウンタの値と一致するまで、ユーザプログラムは単一ステップで実行される。
例示の図4のブロック426の完了後、論理プロセッサのすべてのプロセッサは、同じリタイヤ命令カウンタの値にあるが、背景技術の項で考察した理由から、ユーザプログラムが実際に命令ストリームの同じ実行ポイントにあるという保証はない。したがって、次のステップは、複数の命令を実行すること、それら命令の少なくともいくつかを復号すること、及び、復号された命令の入力を求めることである(ブロック430)。図4について言及する(並びに、図5、図7、及び図9のより具体的なインプリメンテーションにおける)復号は、プログラムベースの復号であり、命令の実行に備えてプロセッサにより実行されるハードウェアベースの復号と混同されるべきでない。代替的な実施の形態では、プロセッサは、緩やかなロックステップのオペレーション用に特に設計することができ、したがって、復号された情報を、プロセッサのレジスタを経由してソフトウェアへ渡すこともできるし、命令を復号して復号した情報をソフトウェアへ渡す第2のハードウェアベースの復号ユニットを有することもできる。例えば、ユーザプログラムの命令がOR演算であるとみなす。復号を行うこと(ソフトウェアであろうと、特別に設計されたハードウェアであろうと)によって、マシン語命令が復号されて、その命令が、実行されたOR演算であったと判断され、さらに、その命令がその機能を実行するのに使用した入力レジスタの値が求められる。これらの実行及び復号は、任意の順序で行うこともできるし、ほぼ同時に行うこともできる。復号された命令の少なくともいくつかのアドレス、及び、復号された命令の少なくともいくつかの入力を示す値は、プロセッサ間で交換される(ブロック432)。本発明の少なくともいくつかの実施の形態によれば、復号された命令のアドレス及び復号された命令の入力を示す値の交換は、その情報を同期レジスタ54に書き込むことによって行われ、投票者ロジック56は、非協調プロセスの表示及びリタイヤ命令カウンタの値の交換と同様の方法で、その情報を返信する。
プロセッサが、復号された命令のアドレス及び命令の入力を示す値を他のプロセッサから取得するとすぐに、図4の例示の方法が実施されるプロセッサは、交換された命令のアドレスのパターンマッチングを行う(ブロック434)。アドレス(したがって、アドレス及び命令)及び入力を示す値の一致するパターンを見つけることによって、各プロセッサは、論理プロセッサ内の他のプロセッサを基準とした自身の相対的な実行ポイントを求める。次のステップは、図4の例示の方法が実施されるプロセッサが、ユーザプログラムの実行ポイントにおいて遅れているかどうかを判断することである(ブロック436)。プロセッサは、自身が遅れている場合、実行ポイントが、論理プロセッサのプロセッサにおける、ユーザプログラムの最も進んだ実行ポイントと一致するまで、ユーザプログラムを先に進めて実行する(ブロック438)。
少なくともいくつかの実施の形態によれば、各プロセッサがユーザプログラムの非協調性に合意した時にアラインメントを強制するだけで、ユーザプログラムの非協調性にかかわらず、適切なオペレーションを確保するのに十分な場合がある。さらに別の実施の形態では、各プロセッサは、ユーザプログラムにシステムコールを仕掛けて(ブロック440)、ユーザプログラムの少なくとも非協調プロセスの指定を引き起こした部分が再びそのようにならないことを確実にすることができる。いくつかの実施の形態では、ユーザプログラムの好ましくない部分(ほとんどはソフトウェアループ)が、システムコールを含むように変更される。これは、例えば、ノーオペレーション命令(NOP)をシステムコール(例えば、日時コール)と置換することによって行われる。ユーザプログラム命令ストリームが単なる置換を許容していない場合には、命令は、その置換される命令を指し示す分岐命令、システムコール、及びリターン分岐命令と置換される。これらの変更は、ユーザプログラムがメインメモリに存在するときにユーザプログラムに対して行うことができ、且つ/又は、ユーザプログラムがディスクドライブ等の長期記憶デバイスに存在するときにユーザプログラムに対して行うことができる。さらに別の代替的な実施の形態では、プロセッサハードウェアは、命令ストリームの特定のポイントに割り込みを挿入するメカニズムをサポートすることができ、その割り込みは、割り込みスケジューリングのためのシステムコールをトリガする。例えば、Itanium(登録商標)プロセッサファミリは、「命令ブレークポイントレジスタ」として知られている、プロセッサ内のレジスタをサポートする。このブレークポイントレジスタには、命令ポインタ値をロードすることができる。実際の命令ポインタがブレークポイントレジスタの値と一致すると、割り込みがトリガされる。この例示のメカニズムは、割り込みをトリガするのに使用され、この割り込みは、次に、同期目的でシステムコールをトリガする。このハードウェアベースのメカニズムは、すべてのアーキテクチャで利用可能でない場合があるが、ユーザプログラムを変更する実施の形態は、汎用的な適用を有することができる。その後、非協調プロセスタイマはリセットされ(ブロック417)、現在のシステムコール番号は保存され(ブロック419)、割り込みが有効にされ(ブロック418)、そして割り込みハンドラはリターンする(ブロック420)。
さらに図4を参照して、破線428内の一群のステップは、復号(ブロック430)、復号された命令のアドレスの交換(ブロック432)、及びパターンマッチング(ブロック434)であり、論理プロセッサ内の他のプロセッサの実行ポイントを基準とした相対的な実行ポイントを求めるのに使用できるいくつかの代替的な実施の形態の高レベルの概要である。本明細書は、プロセッサが自身の相対的な実行ポイントを求めるのに使用できる3つの代替的な実施の形態を提示する。これらの代替的な実施の形態のそれぞれについて次に考察することにする。
図5は、プロセッサが自身の相対的な実行ポイントを求めるのに使用できる代替的な実施の形態の第1のものを示している。図5の例示の方法のステップは、図4の破線428内の3つの高レベルの記述に取って代わるものである。このプロセスは、カウントパラメータをゼロにすることによって開始する(ブロック500)。次のステップは、単一のユーザプログラム命令を実行することである(ブロック502)。単一のユーザプログラム命令を実行することは、図5の例示の方法が実施されるプロセッサを単一ステップモードにすること、及び、単一の命令を実行することによって行うことができる。この命令は(プロセッサによる実行の前又は後のいずれかで)復号され、命令の入力が求められる(ブロック504)。ブロック504の例示のステップは、ソフトウェア復号プロセスであり、プロセッサによって実行されて(ブロック502の)例示の実行を実施するユーザ命令の復号と混同されるべきではない。例えば、実行されたユーザプログラムが論理AND演算である場合、図5の例示の方法は、マシン語命令を復号して、その命令がAND演算であったと判断し、その命令がその機能を実行するのに使用した入力レジスタの値をさらに求める。その後、復号された命令のアドレス及び入力を示す値は、リストに書き込まれ(ブロック506)、カウントパラメータがインクリメントされる(ブロック508)。命令を復号する例示のステップ(ブロック504)及び復号された各命令のアドレス(及び関連情報)をリストに書き込む例示のステップ(ブロック506)は、所定の繰り返し回数だけ繰り返される(ブロック510)。これらの実施の形態のこの所定の繰り返し回数は、図では「3N」として示されている。Nの値は、特定のブランド及びモデルのプロセッサでテストを行うことによって求めることができ、同じ命令ストリームを提供されて、同じ時間の間その命令ストリームを実行するプロセッサ間のリタイヤ命令カウンタの値の少なくとも最大誤差を表すものである。換言すると、Nの値は、プロセッサのリタイヤ命令カウンタ(ユーザプログラムがディスパッチされた時にゼロにされる)が等しい時のプロセッサの実行ポイント間の命令数の最大差である。いくつかの実施の形態では、誤差の幅(margin)を有するために、Nの値は、最大誤差の複数倍にすることができ、場合によっては、Nの値は、最大誤差が例えば1,000未満であっても、1,000となるように選択される。図5の例示の場合、及び、誤差の幅を含むNではなくNの正確な値が使用される場合には、一致するものが、命令の先頭と、その先頭が進んでいる命令の個数とを正確に特定することを確実にするために、少なくとも3N個の命令の復号された値が交換されるべきである。3N個よりも多くの命令の復号された値を交換すること(又は、Nが、意図的に真のNよりも大きくなるように選択された場合)も、本発明の範囲及び精神の範囲内にある。
さらに図5を参照して、判定ブロック510によって示すように、実行、復号、及び復号された値のリストへの書き込みは、リタイヤ命令カウンタの値の最大誤差の少なくとも3倍で完了する。次のステップは、作成されたリストを投票者ロジックに書き込むこと(ブロック512)、及び、投票者ロジックが論理プロセッサにおける他のプロセッサからの同様の情報をメモリにライトバックするまでソフトウェアループで待機すること(ブロック514)である。このメモリは、例えば、図5の例示の方法が実施されるプロセッサのロケーション57である。プロセッサは、論理プロセッサにおける他のプロセッサからのリストを有するとすぐに、リストのパターンマッチングを実行し、リタイヤ命令カウンタの値の最大誤差の少なくとも2倍の長さを有するパターンを探索する(seek)(ブロック516)。一致するものが見つかるとすぐに、プロセッサは、次に、論理プロセッサにおける他のプロセッサを基準とした相対的な、ユーザプログラムにおける自身の実行ポイントを求める(ブロック518)。その後、プロセスは、例示の方法が実施されたプロセッサが遅れているかどうかの例示の判断で再開する(図4のブロック436)。
図6は、図4及び図5の概念をさらに示すために、2つのプロセッサPA1及びPB1の複数の命令{A,B,…P}を示している。この説明は、3つのプロセッサにも等しく適用することができるが、この説明を過度に複雑にしないように2つが使用されている。詳細には、各ユーザプログラムが非協調的であると判断されており、プロセッサの1つが、それらプロセッサのリタイヤ命令カウンタの値が等しくなる(「RIC=」)まで、先に進めて実行されたものとみなす。リタイヤ命令をカウントする際の不正確さのために、プロセッサPA1のユーザプログラムで実行される次の命令は命令Cである一方、プロセッサPB1で実行される次の命令は命令Aである。このように、プロセッサPA1が、実行ポイントにおいて、2つのユーザプログラム命令分だけプロセッサPB1の先頭に立っている。換言すると、この状況のスキューは2である。さらに、ユーザプログラムの平均的なタイムスライスの期間中に遭遇する命令数にわたるリタイヤ命令カウンタの値の最大誤差は、場合によっては経験的なテストを通じて、4であると判断されるものとみなす。
この例示の場合に、Nの値は、4以上とすることができ、この例の場合、Nは正確に4である。したがって、各ユーザプログラムは、この例示の場合に、12個のユーザプログラム命令を先に進めてステップすることが許可されると同時に、各プロセッサは、復号された命令のアドレス及び復号された命令への入力を示す値のリストを作成する(図5のブロック500〜510)。一旦完了すると、プロセッサPA1は、12個のエントリ{C,D,…N}を含むリスト600を有する。同様に、プロセッサPB1は、{A,B,…L}を含むリスト602を有する。その後、これらのリストは、プロセッサ間で交換され(図5のブロック512及びブロック514)、各プロセッサは、自身が作成したリストと、他のプロセッサから取得した1つ又は複数のリストとのパターンマッチングを実行して、相対的な実行ポイントを求める(図5のブロック516及びブロック518)。図6の例示の場合、各プロセッサは、{C,D,…L}を含むパターンの一致を見つける。したがって、10個の命令が、一致するものとして見つけられ、これは、リタイヤ命令カウンタの値の最大誤差の2倍(2N)の最小パターン一致長を超えている。この例では、プロセッサPA1は、自身が先頭に立ち、プロセッサ間の実行ポイントのスキューは2(S=2)であると判断する(図5のブロック518)。同様に、プロセッサPB1は、自身が遅れており、この例示の場合のスキューは2であると判断する(図5のブロック518)。したがって、次のステップは、遅れているプロセッサ、この場合、PB1が、スキューの量だけ先に進めて実行することであり(図4のブロック438)、このステップの後、ライン604によって示すように、各ユーザプログラムで実行される次の命令がOの状態で、プロセッサのそれぞれはアラインメントされる。このようにして、例示の2つのプロセッサのアラインメントが完了し、その後、追加プログラムが、重複しないメモリを探索する可能性もなく、且つ、プロセッサ間でメモリページデータをコピーする必要もなく、ユーザプログラムとメモリを共有できる他のプログラムをディスパッチすることが安全となる。
図5を再び手短に参照して、復号された命令(のアドレス)及び入力を示す値をリストに書き込む例示のステップ(ブロック506)は、多くの形態を取ることができる。いくつかの実施の形態では、復号された命令及び実際の入力自体をリストに書き込むことができる。プロセッサ間で交換されるデータ量を削減するために、代替的な実施の形態は、入力の値のシグネチャ又は縮小表現を送信する。例えば、各プロセッサは、入力の巡回冗長検査合計を計算することができ、この検査合計をリストに書き込まれる値として、他のプロセッサと交換することができる。巡回冗長検査符号や64ビット修正フレッチャー検査合計(modified Fletcher check sum)等のあらゆる強い検査合計発生器を使用することができる。
さらに図5を参照して、さらに別の代替的な実施の形態は、実行された3N個の命令の全命令よりも少なく符号化して交換することによって、プロセッサ間で交換されるデータ量を削減する。より詳細には、本発明のいくつかの実施の形態は、ユーザプログラム内の所定の一致ポイントの命令のアドレスのみを交換する。これらの実施の形態では、すべての入力の値が交換されるか、又は、すべての命令の入力の値を使用して計算された巡回冗長検査の値を交換することによって、そのデータセットをさらに削減することができる。例えば、いくつかの実施の形態では、一致ポイントは、実質的に、実行された3N個の命令の最初の命令及び最後の命令のアドレスと共に、分岐命令のアドレスのみとすることができる。分岐命令が一致ポイントとなる例示の実施の形態では、各プロセッサは、少なくとも2Nの長さを有する一致するものを探索するが、一致する分岐命令間の命令がカウントされ、同じであると仮定される。しかしながら、それらの命令への入力は、巡回冗長検査の値を計算する時は含まれる。さらに別の代替的な実施の形態では、一致ポイントは、周期的な命令ポインタの値を有する命令であり、例えば、命令ポインタ(IP)=0 mod Mを有する命令である(ここで、Mは、あらゆる任意の数であり、例えば、10、20、30である)。
図5及び図6によって示す実施の形態では、パターンマッチング段階まで、どのプロセッサが進み、どのプロセッサ(複数可)が遅れているかは分からない。したがって、先頭の適切な特定を確保するには、リタイヤ命令カウンタの値の最大誤差の3倍を実行することが必要とされることがある。しかしながら、プロセッサ間で交換されるデータ量を削減することが望ましく、リタイヤ命令カウンタの値のアラインメント(図4のブロック426)後に、どのプロセッサがユーザプログラムの実行ポイントにおいて先頭に立っているかが分かる場合には、実行、復号、及び交換される命令の個数だけでなく、パターンマッチングの長さも削減することができる。
図7は、図4の破線28内で実施することができるステップの代替的な実施の形態を示している。この代替的な実施の形態では、実行されるユーザプログラム命令の個数、復号されるユーザプログラム命令の個数、及び交換されるアドレスの個数が削減される。詳細には、リタイヤ命令カウンタの値をアラインメントすると(図4のブロック426)、論理プロセッサのさまざまなプロセッサは、どのプロセッサが実行ポイントにおいて進んでいるかに気付かない。しかしながら、リタイヤ命令カウント値に起こり得る最大誤差は判明している(又は、実際の起こり得る最大誤差を含むように十分大きいと仮定される)ので、N個の命令を先に進めて実行する或るプロセッサを選択することによって、先頭を強制することができる。したがって、図7の例示の方法の最初のステップは、強制される先頭プロセッサを選択することである(ブロック700)。強制された先頭として選択されたプロセッサは、必ずしも、実行ポイントにおいて、実際に先行するプロセッサである必要はなく、実際には、強制された先頭の選択は、任意のものとすることができる。強制された先頭を選択することは、例えば、(プロセッサがブートされる時に割り当てられる)最下位プロセッサ識別番号及び最上位プロセッサ識別番号でプロセッサを選択することを含むことができる。他の実施の形態では、強制された先頭を選択することは、レジスタ54への書き込み等、投票者ロジックを通じた情報の交換を含み、投票者ロジックは、各プロセッサから供給されたデータをすべてのプロセッサへ返信する。例えば、一選択方法は、各プロセッサに乱数を発生させ、最も高い乱数を有するプロセッサ(数の交換後に判断される)が、強制された先頭となる。他の方法も等しく使用することができる。
次のステップは、図7の例示の方法が実行されているプロセッサが、強制された先頭であるかどうかを判断することである(ブロック702)。例示の方法が実行されているプロセッサが、強制された先頭である場合、そのプロセッサは、ユーザプログラムにおいて、リタイヤ命令カウンタの値の最大誤差に少なくとも等しい命令数を先に進めて実行する(ブロック704)。この特定のステップの命令のいずれも復号及び/又は記録を行う必要はない。強制された先頭が、実行ポイントにおいて、実際に進んでいたのか、それとも遅れていたのかにかかわらず、リタイヤ命令カウンタの値の最大誤差を先に進めて実行した後は、このステップを実行したプロセッサが、ユーザプログラムの実行ポイントにおいて先頭になる(又は先頭に並ぶ(tied for))。
さらに図7を参照して、各プロセッサの次のステップは、カウントパラメータをゼロにすること(ブロック706)、及び、単一のユーザプログラム命令を実行すること(ブロック707)である。その後、プロセッサによって実行された命令は復号され、その命令の入力が求められる(ステップ708)。代替的に、この復号は、実行の前に行うこともできるし、ほぼ同時に行うこともできる。復号された命令のアドレス及び入力を示す値は、リストに書き込まれ(ブロック710)、カウントパラメータがインクリメントされる(ブロック712)。図5の例示の方法と酷似して、命令を復号する例示のステップ(ブロック708)、及び、復号された各命令のアドレス(及び関連情報)をリストに書き込む例示のステップ(ブロック710)は、所定の繰り返し回数繰り返される(ブロック714)。一方、図5の例示の方法と異なり、図7の方法では、所定の繰り返し回数は、リタイヤ命令カウンタの最大誤差の2倍であり、図では「2N」として示されている。図7の例示の場合、及び、誤差の幅を含むNではなくNの正確な値が使用される場合には、一致するものが、先頭と、その先頭が進んでいる命令の個数とを正確に特定することを確保するために、少なくとも2N個の命令の復号された値が交換されるべきである。しかしながら、2N個よりも多くの命令の復号された値を交換すること(又は、Nが、意図的に真のNよりも大きくなるように選択された場合)も、本発明の範囲及び精神の範囲内にある。
さらに図7を参照して、次のステップは、作成されたリストを投票者ロジックに書き込むこと(ブロック716)、及び、投票者ロジックが論理プロセッサにおける他のプロセッサからの同様の情報をメモリにライトバックするまでソフトウェアループで待機すること(ブロック718)である。このメモリは、例えば、図7の例示の方法が実施されるプロセッサのロケーション57である。プロセッサは、論理プロセッサにおける他のプロセッサからのリストを有するとすぐに、リストのパターンマッチングを実行し、少なくとも1つの一致するアドレスを有するパターン(1つの一致する命令)を探索するか、又は、場合によっては、一致するものが全くないこともある(ブロック720)。少なくとも1つの命令の一致するものが見つかるか、又は、一致するものが見つからないとすぐに、プロセッサは、次に、強制された先頭を基準とした相対的な、ユーザプログラムにおける自身の実行ポイントを求める(ブロック722)。その後、プロセスは、この方法が実施されたプロセッサが遅れているかどうかの判断で再開する(図4のブロック436)。図7のオペレーションでは、進んでいるか又は遅れているかのプロセッサのラベルに関して気付くべき違いがある。プロセッサの実行ポイントは、リタイヤ命令カウンタの値が強制的に等しくされた(図4のブロック426)時に遅れていることがあるが、当初遅れているプロセッサが、強制された先頭として選択され、N個の命令を進められた場合(ブロック700〜704)、パターンマッチング後には、その強制された先頭は、実行ポイントにおいて先頭に立ち、他のプロセッサ(複数可)は前進することになる(図4のブロック436及び438)。対照的に、リタイヤ命令カウンタの値を強制的に等しくした後に、プロセッサの実行ポイントが遅れており、そのプロセッサが、強制された先頭として選択されない場合、2N個の命令の実行、復号、交換、及びパターンマッチングが一旦完了すると、プロセッサはさらに遅れることになる。
図8Aは、図4及び図7の概念をさらに示すために、2つのプロセッサPA1及びPB1の複数の命令{A,B,…M}を示している。この説明は、3つのプロセッサにも等しく適用することができるが、この説明を過度に複雑にしないように2つが使用されている。詳細には、各ユーザプログラムが非協調的であると判断されており、プロセッサの1つが、それらプロセッサのリタイヤ命令カウンタの値が等しくなる(「RIC=」)まで、先に進めて実行されたものとみなす。リタイヤ命令をカウントする際の不正確さのために、プロセッサPA1のユーザプログラムで実行される次の命令は命令Cである一方、プロセッサPB1で実行される次の命令は命令Aである。このように、プロセッサPA1が、実行ポイントにおいて、2つのユーザプログラム命令分だけプロセッサPB1の先頭に立っている。さらに、ユーザプログラムの平均的なタイムスライスの期間中に遭遇する命令数にわたるリタイヤ命令カウンタの値の最大誤差は、場合によっては経験的なテストを通じて、4であると判断されるものとみなす。
図8Aの例示の場合に、Nの値は、4以上とすることができ、この例の場合、Nは正確に4である。プロセッサPB1は、強制された先頭として任意に選ばれ(図7のブロック700)、したがって、ユーザプログラムのN個の命令を先に進めてステップする(図7のブロック704)。その後、各ユーザプログラムは、この例示の場合には、8つのユーザプログラム命令(2N)を先に進めてステップすることが許可されると同時に、各プロセッサは、復号された命令のアドレス及び復号された命令への入力を示す値のリストを作成する(図7のブロック706〜714)。一旦完了すると、プロセッサPA1は、8つのエントリ{C,D,…J}を含むリスト804を有する。同様に、プロセッサPB1は、エントリ{E,F,…L}を含むリスト804を有する。その後、これらのリストは、プロセッサ間で交換され(図7のブロック716及び718)、各プロセッサは、自身が作成したリストと、他のプロセッサから取得した1つ又は複数のリストとのパターンマッチングを実行して、相対的な実行ポイントを求める(図7のブロック720及び722)。図8Aでは、各プロセッサは、{E,F,…J}を含むパターンの一致を見つける。この例では、プロセッサPA1は、自身が現在遅れており、プロセッサ間の実行ポイントのスキューは2(S=2)であると判断する(図7のブロック722)。同様に、プロセッサPB1は、自身が現在進んでおり、この例示の場合のスキューは2であると判断する(再び図7のブロック722)(図8Aは、プロセッサPA1は、最初、2つだけ進んでいることに言及している)。したがって、次のステップは、遅れているプロセッサ、この場合、PA1(リタイヤ命令カウンタの値を強制的に等しくした後に、PA1が進んでいたことにかかわらず)が、2つの命令だけ先に進めて実行することであり(図4のブロック438)、このステップの後、ライン806によって示すように、各ユーザプログラムで実行される次の命令がMの状態で、プロセッサのそれぞれはアラインメントされる。このようにして、例示の2つのプロセッサのアラインメントが完了し、その後、追加プログラムが、重複しないメモリを探索する可能性なく、ユーザプログラムとメモリを共有できる他のプログラムをディスパッチすることが安全となる。
図8Bは、リタイヤ命令カウンタを強制的に等しくした後の先頭のプロセッサPA1が、強制された先頭として選択されることを除いて、図8Aと同じ状況を示している。したがって、プロセッサPA1が、ユーザプログラムのN個の命令を先に進めてステップし(図7のブロック704)、PA1の最初の復号された命令(図7のステップ708)を命令Gとする。その後、各ユーザプログラムは、8つのユーザプログラム命令(2N)を先に進めてステップすることが許可されると同時に、各プロセッサは、復号された命令のアドレス及び復号された命令への入力を示す値のリストを作成する(図7のブロック706〜714)。一旦完了すると、プロセッサPA1は、8つのエントリ{G,H,…N}を含むリスト810を有する。同様に、プロセッサPB1は、エントリ{A,B,…H}を含むリスト812を有する。その後、これらのリストは、プロセッサ間で交換され(図7のブロック716及び718)、各プロセッサは、自身が作成したリストと、他のプロセッサから取得した1つ又は複数のリストとのパターンマッチングを実行して、相対的な実行ポイントを求める(図7のブロック720及び722)。図8Bでは、各プロセッサは、{G,H}を含むパターンの一致を見つける。この例では、プロセッサPB1は、自身が遅れており(6つの命令分)、プロセッサ間の実行ポイントのスキューは2(S=2)であると判断する(図7のブロック722)。換言すると、プロセッサ間の元のスキューは2であったが、強制された先頭を、N個の命令を先に進めて実行した後、スキューは6つの命令となる。同様に、プロセッサPA1は、自身が進んでおり(6つの命令分)、この例示の場合のスキューは2であると判断する(再び図7のブロック722)。この場合も、プロセッサ間の元のスキューは2であったが、強制された先頭を、N個の命令を先に進めて実行した後、スキューは6つの命令となる。したがって、次のステップは、遅れているプロセッサ、この場合、PB1が、6つの命令だけ先に進めて実行することであり(図4のブロック438)、このステップの後、プロセッサのそれぞれはアラインメントされる。
図7の例示の方法を使用して解析された状況では、プロセッサ間のスキューがNに等しく、且つ、真の先頭が、強制された先頭として偶然に選ばれた場合、この強制された先頭は、2N個分先頭に立つ。各プロセッサが2N個の命令分前進すると、先頭のプロセッサは依然として2N個の命令分先行しており、したがって、パターンマッチングにおいて一致は見つからないことになる(図7のブロック720)。この場合、図7の例示の方法が動作するプロセッサは、元のスキューがNであったが、遅れているプロセッサは、現在、2N個の命令分遅れていることを知っている。図7の方法をさらに参照して、スキューが1(S=1)の状況では、交換されたリスト間には、単一の一致する命令しかないことになる。しかしながら、強制された先頭が確かに先頭であるという知識を与えると、プロセッサ間の実行ポイントを特定するには、単一の命令で十分である。さらに、この評価に対する確信は、一致する命令が、強制された先頭のリストのまさに始点にあり、強制されていない先頭(複数可)のリストのまさに終点にあることから得ることができる。
図9は、図4の破線28内で実施できるステップのさらに別の代替的な実施の形態を示している。この実施の形態では、実行されるユーザプログラム命令の個数、復号されるユーザプログラム命令の個数、及び交換されるアドレスの個数が削減される。詳細には、リタイヤ命令カウンタの値をアラインメントすると(図4のブロック426)、各プロセッサの次のステップは、カウントパラメータをゼロにすること(ブロック900)、及び、単一のユーザプログラム命令を実行すること(ブロック902)である。その後、プロセッサによって実行された命令は復号され、その命令の入力が求められる(ステップ904)。ブロック904の復号は、実行の後に示されているが、実行の前に行うこともできるし、実行とほぼ同時に行うこともできる。復号された命令のアドレス及び復号された命令の入力を示す値は、リストに書き込まれ(ブロック906)、投票者ロジックにも書き込まれる(再びブロック906)。したがって、命令は、復号された後直ちに交換される。次に、この例示の方法は、他のプロセッサからの復号された命令のアドレス及び復号された命令の入力を示す値の返信をソフトウェアループで待つ(ブロック908)。このデータが投票者ロジックからライトバックされた後、アドレス及び入力の値は、第2のリストに記憶され(ブロック910)、カウントパラメータがインクリメントされる(ブロック912)。命令を復号する例示のステップ(ブロック904)、及び、復号された各命令のアドレス(及び関連情報)をリスト及び投票者ロジックに書き込む例示のステップ(ブロック906)は、所定の繰り返し回数繰り返される(ブロック914)。図5及び図7の例示の方法とは異なり、この所定の繰り返し回数は、リタイヤ命令カウンタの値の少なくとも最大誤差のみであり、図では「N」として示されている。図9の例示の場合、及び、誤差の幅を含むNではなくNの正確な値が使用される場合には、一致するものが、先頭と、その先頭が先頭が進んでいる命令の個数とを正確に特定することを確保するために、少なくともN個の命令の復号された値が交換されるべきである。しかしながら、N個よりも多くの命令の復号された値を交換すること(又は、Nが、意図的に真のNよりも大きくなるように選択された場合)も、本発明の範囲及び精神の範囲内にある。
さらに図9を参照して、ユーザプログラムのN個の命令の実行及び復号の後、例示の方法は、復号された命令のアドレス(及び入力を示す値)の、内部で生成されたリストからの命令と、論理プロセッサにおける他のプロセッサによって提供された復号された命令のアドレス(及び入力を示す値)のリストからの命令とに対してパターンマッチングを実行する(ブロック916)。2つ又は3つ以上の一致するものが見つかり(ブロック918)、且つ、例示のプロセスが、ユーザプログラムの3N個の命令よりも少ない個数しか実行されていない場合(ブロック924)、プロセスは、さらにユーザプログラム命令を実行する。2つ又は3つ以上の一致するパターンが見つかると、プロセス間の先頭を決定することはできず、したがって、比較するための命令がさらに必要とされる。他方、一致するものが1つだけ見つかると(長さは任意であり、単一の命令(及び入力)の一致するものを含む)(ブロック918及び919)、次のステップは、実行ポイントを求めることである(ブロック920)。その後、プロセスは、この例示の方法が実施されたプロセッサが遅れているかどうかの例示の判断で再開する(図4のブロック436)。一致するものが見つからない場合(ブロック919)、これは、Nの値が正しくなかったことを示すエラーがある場合である(ブロック921)。2つ又は3つ以上の一致するものが見つかったが(ブロック918)、3N個の命令が実行されている場合、復号された命令は、冪等ループ(idempotent loop、ループの繰り返しが、命令及び命令への入力に基づいて区別できないループ)を含み、1つの一致するものが任意に選択され(ブロック926)、実行ポイントが、その選択された一致するものを基準として求められる(ブロック920)。換言すると、3N個の命令が実行され、依然として2つ又は3つ以上の一致するものがある場合には、それら一致するもののいずれか1つが選択されて、実行ポイントが強制的に等しくされる。
したがって、図9の例示の方法は、N個の命令のみ(スキューS=0の場合)のアドレスの復号及び交換で相対的な実行ポイントを確認できる場合がある。図9の例示の方法を実施する一般的な場合には、各プロセッサは、それらプロセッサの各ユーザプログラムの実行ポイントを確認するのに、多くともN+2S個の命令しか実行する必要がない。したがって、図9の方法は、スキューが小さい場合に図5及び図7の例示の方法を上回る利点を有する。スキューがNに近づく極限においては、図9の方法は、図5の方法と同じ3N個の復号された命令の交換に低下する。
図10Aは、図4及び図9の概念をさらに示すために、2つのプロセッサPA1及びPB1の複数の命令{A,B,…E}を示している。この場合、例示の命令が、ループの2つの繰り返しをどのように表すかに注目されたい。詳細には、ユーザプログラムの各コピー(又はプロセッサ)が非協調的であると判断されており、プロセッサの1つが、それらプロセッサのリタイヤ命令カウンタの値が等しくなる(「RIC=」)まで、先に進めて実行されたものとみなす。リタイヤ命令をカウントする際の不正確さのために、プロセッサPA1のユーザプログラムで実行される次の命令は命令Cである一方、プロセッサPB1で実行される次の命令は命令Aである。このように、プロセッサPA1が、実行ポイントにおいて、2つのユーザプログラム命令分だけプロセッサPB1の先頭に立っている。さらに、リタイヤ命令カウンタの値の最大誤差は、この場合、4であるとみなす。
図10Aの例示の場合に、Nの値は、4以上とすることができ、この例の場合、Nは正確に4である。各ユーザプログラムは、少なくとも4つのユーザプログラム命令を先に進めてステップすることが許可されると同時に、各プロセッサは、復号された命令のアドレス(及び復号された命令への入力を示す値)のリストを作成してリストを交換する(図9のブロック900〜914)。N個の命令の復号が一旦完了すると、プロセッサPA1は、4つのエントリ{C,D,A,B}を含むリスト1002を有する。同様に、プロセッサPB1は、エントリ{A,B,C,D}を含むリスト1004を有する。これらの実施の形態では、復号された命令のアドレス(及び復号された命令の入力を示す値)は、各復号の後に交換され(図9のブロック906及び908)、また、各プロセッサは、論理プロセッサにおける他のプロセッサからのリストも有する。したがって、各プロセッサは、自身が作成したリストと、他のプロセッサから取得した1つ又は複数のリストとのパターンマッチングを実行する(図9のブロック916)。一方、図10Aの例示の場合には、各プロセッサは、{C,D}及び{A,B}である2つの一致するパターンを見つける(ブロック918)。したがって、これら2つのプロセッサ間の実行ポイントは求めることができず、この例では、N個の命令のみが実行され復号されているので、プロセスは、ユーザプログラム命令を追加して実行及び復号することに戻る。
図10Bは、(1つのユーザプログラム命令のみを追加し、先に進めてステップすると、依然として、等しい長さの2つの一致するパターンが残るので)2つのユーザプログラム命令を追加して実行及び復号した後の図10Aの状況を示している。詳細には、2つのユーザプログラム命令を追加して実行した後、プロセッサPA1は、6つのエントリ{C,D,A,B,C,E}を含むリスト1006を有する。同様に、プロセッサPB1は、エントリ{A,B,C,D,A,B}を含むリスト1008を有する。この例示の場合のパターンマッチングは、4つの命令{C,D,A,B}の長さを有する1つの一致するパターンを明らかにする。長さ4の一致するパターンが1つしか見つからないので(図9のブロック918)、ユーザプログラムの相対的な実行ポイントを求めることができる(ブロック920)。したがって、次のステップは、遅れているプロセッサ、この場合、PB1が、2つの命令分を先に進めて実行することであり(図4のブロック438)、このステップの後、プロセッサのそれぞれはアラインメントされる。
この時点までに説明した実施の形態は、Nの値が静的であり、事前に決定されていると仮定している。代替的な実施の形態では、Nの値が順応して(adaptively)変更される。図11は、Nの値に対する順応変更を実施するアルゴリズムのフロー図を示している。図11の例示の方法は、スタンドアロンプロセスとして実施することもできるし、図4の方法内に組み込むこともできる。このプロセスは開始して(ブロック1100)、リタイヤ命令カウンタの正確度の証拠の収集に移る(ブロック1102)。いくつかの実施の形態では、リタイヤ命令カウンタの値が等しい場合、プロセッサ間の命令ポインタの値が比較される。例えば、リタイヤ命令カウンタの値が等しい場合において、命令ポインタが同じであるとき、これは、リタイヤ命令カウンタに誤差がないことの間接的な証拠となる。したがって、これらの実施の形態は、最も高いリタイヤ命令カウンタの値に向けて先に進めてステップした後、同期ロジックを使用して命令ポインタを交換すること等により、命令ポインタを交換することを必要とする。いくつかの実施の形態では、Nの正確度の直接的な証拠を求めることができる。例えば、図7によって示す実施の形態では、パターンマッチングの後、一致するものが見つからない場合、これは、Nの値がスキューに正確に等しかったことの直接的な証拠となる。図9では、一致するものが見つからない場合(ブロック919),これは、Nの値が正しくない(小さすぎる)ことの直接的な証拠となる。
リタイヤ命令カウンタの正確度の直接的な証拠又は間接的な証拠を収集する正確なメカニズムにかかわらず、次のステップは、リタイヤ命令の誤差がNの値以上であることをその証拠が示すかどうかを判断することである(ブロック1104)。リタイヤ命令の誤差がNの値以上であることをその証拠が示す場合、Nの値は調整されるべきであり(ブロック1106)、証拠のログはリセットされる(ブロック1116)(以下でさらに考察する)。Nの値の増加又は減少は、他のプロセッサの協議なしに、各プロセッサが完了することもできるし、Nの値を増加させる判断は、それらプロセッサによるデータの交換を起動して、変更の正確な値について合意することもできる。
リタイヤ命令カウンタの正確度がNよりも大きいことを証拠が示唆していない場合、次のステップは、収集された証拠をログ記録することである(ブロック1108)。したがって、たとえ、リタイヤ命令カウンタの誤差がNよりも大きい可能性があることを、収集された証拠の1つの事例が示していたとしても、(この場合、ユーザプログラムの複製コピーが正しくアラインメントされていない可能性があるので)Nの値の増加を行うべきである(ブロック1104及び1106)一方、Nの値を低くすることは、大きな証拠の集合に基づいて行われる。この証拠の集合のサイズが十分に大きくない場合(ブロック1110)、プロセスは終了する(ブロック1118)。他方、証拠の集合のサイズが十分に大きい場合(ブロック1110)、例えば、1週間のデータ又は1カ月のデータである場合、リタイヤ命令カウンタの値に起こり得る誤差が、Nの現在の値よりもはるかに小さいかどうかについての判断が行われる(ブロック1112)。例えば、プロセッサ間のリタイヤ命令カウンタの値の正確度が10カウント以下であるが、Nがおよそ1000程度である場合、Nの値を削減することができる(ブロック1114)。他方、プロセッサ間のリタイヤ命令カウンタの値の正確度が100カウントであり、Nがおよそ200程度である場合、Nの値は変更されるべきである。次のステップでは、証拠のログ記録がリセットされ(ブロック1116)、プロセスは終了する(ブロック1118)。
上記考察は、本発明の原理及びさまざまな実施の形態の例示であるように意図されている。当業者には、上記開示を十分に理解することによって、多数の変形及び変更が明らかになる。例えば、Itanium(登録商標)プロセッサが使用される場合に、そのコンパイラベースの投機的命令を使用できることを述べたが、プロセッサベースの投機は、リタイヤ命令カウンタに悪影響を与えるおそれがないので、上述した例示の方法及びシステムは、プロセッサベースの投機(例えば、分岐予測投機及び命令リオーダ(reorder))と共に機能する。例示の実施の形態は、プロセッサのリタイヤ命令カウンタの値が一致するまで、各プロセッサが前に進めて実行することを説明している。しかしながら、N個の命令を実行した時のリタイヤ命令カウンタの値の差を、Nの値のサイズにおいて考慮することができる。例えば、プロセッサが100命令のリタイヤ命令カウント値の差を有する場合、Nの値は、100に、少なくともリタイヤ命令カウンタについて予測できる誤差の最大量を加えたものとすることができる。添付の特許請求の範囲は、このようなすべての変形及び変更を包含するように解釈されることが意図されている。
本発明の実施の形態によるコンピューティングシステムを示す図である。 本発明の実施の形態によるコンピューティングシステムをより詳細に示す図である。 本発明の実施の形態による部分的なコンピューティングシステムを示す図である。 本発明の実施の形態による非協調プロセスハンドラを示す図である。 実行ポイントを判断する第1の代替的な方法を示す図である。 図5の方法を示す図である。 実行ポイントを判断する代替的な実施の形態を示す図である。 図7の方法を示す図である。 図7の方法を示す図である。 実行ポイントを判断するさらに別の代替的な実施の形態を示す図である。 図9の方法を示す図である。 図9の方法を示す図である。 本発明の実施の形態に従って使用されるNの値を順応して調整する例示のフロー図である。
符号の説明
10A,10B,10C・・・マルチコンピュータシステム
12・・・論理プロセッサ
14,16 I/Oデバイス
18,20,22,24・・・同期ロジック
26・・・相互接続
28・・・投票者ロジック
34・・・ネットワークインターフェース
42,42A,42B・・・I/Oブリッジメモリコントローラ
44・・・プロセッサバス
45・・・メモリバス
46・・・メモリモジュール
48・・・再統合ロジック
52A,52B・・・メモリパーティション
54・・・同期レジスタ
56・・・投票者ロジック

Claims (10)

  1. ユーザプログラムの複製コピーを第1のプロセッサ及び第2のプロセッサ(PA、PB、PC)で動作させること、
    前記命令の少なくともいくつかを復号するとともに、復号された各命令の入力を求めることであって、前記復号することは、各プロセッサ(PA、PB、PC)における実行とほぼ同時である、前記命令の少なくともいくつかを復号するとともに、復号された各命令の入力を求めること、
    前記プロセッサ(PA、PB、PC)間で、復号された命令のアドレス及び前記復号された命令の入力を示す値を交換すること、
    少なくとも前記復号された命令の前記アドレスを使用して、前記第1のプロセッサ(PA、PB、PC)における前記ユーザプログラムの実行ポイントが、前記第2のプロセッサ(PA、PB、PC)の前記ユーザプログラムの実行ポイントに対して遅れていると判断すること、及び
    各ユーザプログラム内の前記実行ポイントがほぼアラインメントされるまで、前記第1のプロセッサ(PA、PB、PC)を進めること
    を含むプロセッサベースの方法。
  2. 前記判断することは、
    前記第1のプロセッサ(PA、PB、PC)内において、
    前記交換された、前記復号された命令のアドレス及び前記復号された命令の入力を示す値をパターンマッチングすること、及び
    前記第1のプロセッサ(PA、PB、PC)が実行ポイントにおいて遅れている量を、パターンマッチングのロケーションに基づいて求めること
    をさらに含む請求項1に記載のプロセッサベースの方法。
  3. 前記復号することの前に、
    各プロセッサ(PA、PB、PC)のリタイヤ命令カウンタの値がほぼ同じになるまで、前記ユーザプログラムの少なくとも1つが実行することを許可すること、及び次に、
    各ユーザプログラムのいくつかの命令を実行すること
    をさらに含む請求項2に記載のプロセッサベースの方法。
  4. 前記実行することは、
    前記リタイヤ命令カウンタの値の最大誤差の少なくとも3倍を実行すること
    をさらに含み、
    前記交換することは、
    前記実行することの後に交換すること
    をさらに含み、
    前記パターンマッチングすることは、
    前記リタイヤ命令カウンタの値の前記最大誤差の少なくとも2倍の長さの一致パターンを見つけること
    をさらに含む
    請求項3に記載のプロセッサベースの方法。
  5. 前記いくつかの命令を前記実行することの前に、
    前記方法は、
    前記プロセッサ(PA、PB、PC)の1つにおいて、前記リタイヤ命令カウンタの値の最大誤差を前に進めて実行すること
    をさらに含み、
    前記いくつかの命令を実行することは、
    前記リタイヤ命令カウンタの値の前記最大誤差の少なくとも2倍を各プロセッサ(PA、PB、PC)において実行すること
    をさらに含み、
    前記交換することは、
    前記実行することの後に交換すること
    をさらに含み、
    前記パターンマッチングすることは、
    一致するパターンの1つを見つけること、又は、一致するパターンを見つけないこと
    をさらに含む
    請求項3に記載のプロセッサベースの方法。
  6. 前記実行することは、
    前記リタイヤ命令カウンタの値の前記最大誤差と、前記リタイヤ命令カウンタの値の前記最大誤差の3倍とを含めて、その両者の間で実行すること
    をさらに含み、
    前記交換することは、
    各命令を実行した後に交換すること
    をさらに含み、
    前記パターンマッチングすることは、
    復号された命令の少なくともいくつかのアドレスを交換した後に、各交換後の一致するパターンのテストを行うこと、及び単一の一致するものが見つかった場合にさらに実行することを抑制すること又は複数の一致するものが見つかった場合に実行を継続することの一方、
    をさらに含む
    請求項3に記載のプロセッサベースの方法。
  7. リタイヤ命令カウンタの値の正確度の証拠を収集すること、及び
    前記収集した証拠に基づいて前記所定の個数を調整すること、
    をさらに含む
    請求項1に記載のプロセッサベースの方法。
  8. ユーザプログラムを実行するように動作できる第1のプロセッサ(PA、PB、PC)であって、
    第1のメモリ(46)に連結された、第1のプロセッサ(PA、PB、PC)と、
    前記ユーザプログラムの複製コピーをほぼ同時に実行するように動作できる第2のプロセッサ(PA、PB、PC)であって、第2のメモリ(46)に連結された、第2のプロセッサ(PA、PB、PC)と、
    を備え、
    前記第1のプロセッサ(PA、PB、PC)は、
    自身のユーザプログラムの実行された複数の命令を、前記第2のプロセッサ(PA、PB、PC)の前記ユーザプログラムの実行された複数の命令と照合して、前記第1のプロセッサ(PA、PB、PC)が遅れている命令数を求めるように動作でき、
    前記第1のプロセッサ(PA、PB、PC)は、
    前記ユーザプログラムの前記複製コピーの実行ポイントがほぼ同じになるまで、前に進めて実行するように動作できる
    システム。
  9. 前記第1のプロセッサが前記実行された複数の命令を照合する前に、
    前記第1のプロセッサ(PA、PB、PC)は、
    自身の各ユーザプログラムの所定の個数の命令を実行するように動作でき、且つ、前記実行とほぼ同時に、少なくともいくつかの命令を復号して、前記復号した命令の入力を求め、そして、前記復号した命令のアドレス及び前記入力を示す値を第1のリストに置くように動作でき、
    前記第2のプロセッサ(PA、PB、PC)は、
    自身の各ユーザプログラムの所定の個数の命令を実行するように動作でき、且つ、前記実行とほぼ同時に、少なくともいくつかの命令を復号して、前記復号した命令の入力を求め、そして、前記復号した命令のアドレス及び前記入力を示す値を第2のリストに置くように動作でき、
    前記第1のプロセッサ及び前記第2のプロセッサ(PA、PB、PC)は、
    リストを交換する
    請求項8に記載のシステム。
  10. 前記第1のプロセッサが前記実行された複数の命令を照合する前に、
    前記第1のプロセッサ(PA、PB、PC)は、
    自身の各ユーザプログラムのいくつかの命令を実行するように動作でき、且つ、前記実行とほぼ同時に、少なくともいくつかの命令を復号して、前記復号した命令の入力を求めるように動作でき、且つ、前記実行とほぼ同時に、前記復号した命令のアドレス及び入力を前記第2のプロセッサ(PA、PB、PC)と交換するように動作でき、
    前記第2のプロセッサ(PA、PB、PC)は、
    自身の各ユーザプログラムのいくつかの命令を実行するように動作でき、且つ、前記実行とほぼ同時に、少なくともいくつかの命令を復号して、前記復号した命令の入力を求めるように動作でき、且つ、前記実行とほぼ同時に、前記復号した命令のアドレス及び入力を前記第1のプロセッサ(PA、PB、PC)と交換するように動作できる
    請求項8に記載のシステム。
JP2006016023A 2005-01-25 2006-01-25 実行される命令に関する情報を交換することによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム Expired - Fee Related JP4386449B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/042,504 US7467327B2 (en) 2005-01-25 2005-01-25 Method and system of aligning execution point of duplicate copies of a user program by exchanging information about instructions executed

Publications (2)

Publication Number Publication Date
JP2006209769A true JP2006209769A (ja) 2006-08-10
JP4386449B2 JP4386449B2 (ja) 2009-12-16

Family

ID=36698441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006016023A Expired - Fee Related JP4386449B2 (ja) 2005-01-25 2006-01-25 実行される命令に関する情報を交換することによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム

Country Status (3)

Country Link
US (2) US7467327B2 (ja)
JP (1) JP4386449B2 (ja)
CN (1) CN100507833C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026932A (ja) * 2008-07-23 2010-02-04 Toshiba Corp 高可用システム及び実行状態制御方法
JP2012514257A (ja) * 2008-12-31 2012-06-21 インテル・コーポレーション 冗長プロセスを同期させるためのステート履歴ストレージ

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467327B2 (en) * 2005-01-25 2008-12-16 Hewlett-Packard Development Company, L.P. Method and system of aligning execution point of duplicate copies of a user program by exchanging information about instructions executed
US8218549B2 (en) * 2007-06-18 2012-07-10 International Business Machines Corporation Synchronization of message stream in a multi-tier messaging system
US8428065B2 (en) * 2007-06-18 2013-04-23 International Business Machines Corporation Group communication system achieving efficient total order and state synchronization in a multi-tier environment
US20100169886A1 (en) * 2008-12-31 2010-07-01 Seakr Engineering, Incorporated Distributed memory synchronized processing architecture
US20110099421A1 (en) * 2009-09-30 2011-04-28 Alessandro Geist Radiation-hardened hybrid processor
US20110078498A1 (en) * 2009-09-30 2011-03-31 United States Of America As Represented By The Administrator Of The National Aeronautics And Spac Radiation-hardened hybrid processor
US8856590B2 (en) * 2012-01-07 2014-10-07 Compunetix, Inc. Reliable compute engine, method and apparatus
US9256426B2 (en) * 2012-09-14 2016-02-09 General Electric Company Controlling total number of instructions executed to a desired number after iterations of monitoring for successively less number of instructions until a predetermined time period elapse
US20140380020A1 (en) * 2013-06-24 2014-12-25 Honeywell International Inc. System and methods for synchronization of redundant processing elements
EP3428748B1 (de) * 2017-07-13 2020-08-26 Siemens Aktiengesellschaft Verfahren und anordnung zum betrieb von zwei redundanten systemen
WO2019213779A1 (en) 2018-05-10 2019-11-14 Miovision Technologies Incorporated Blockchain data exchange network and methods and systems for submitting data to and transacting data on such a network

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU616213B2 (en) * 1987-11-09 1991-10-24 Tandem Computers Incorporated Method and apparatus for synchronizing a plurality of processors
US5327553A (en) * 1989-12-22 1994-07-05 Tandem Computers Incorporated Fault-tolerant computer system with /CONFIG filesystem
US6233702B1 (en) 1992-12-17 2001-05-15 Compaq Computer Corporation Self-checked, lock step processor pairs
EP0986007A3 (en) 1993-12-01 2001-11-07 Marathon Technologies Corporation Method of isolating I/O requests
US5790397A (en) * 1996-09-17 1998-08-04 Marathon Technologies Corporation Fault resilient/fault tolerant computing
US5896523A (en) 1997-06-04 1999-04-20 Marathon Technologies Corporation Loosely-coupled, synchronized execution
US6279119B1 (en) 1997-11-14 2001-08-21 Marathon Technologies Corporation Fault resilient/fault tolerant computing
US6327668B1 (en) 1998-06-30 2001-12-04 Sun Microsystems, Inc. Determinism in a multiprocessor computer system and monitor and processor therefor
US6393582B1 (en) 1998-12-10 2002-05-21 Compaq Computer Corporation Error self-checking and recovery using lock-step processor pair architecture
US6604177B1 (en) 2000-09-29 2003-08-05 Hewlett-Packard Development Company, L.P. Communication of dissimilar data between lock-stepped processors
US7017073B2 (en) * 2001-02-28 2006-03-21 International Business Machines Corporation Method and apparatus for fault-tolerance via dual thread crosschecking
US6928583B2 (en) * 2001-04-11 2005-08-09 Stratus Technologies Bermuda Ltd. Apparatus and method for two computing elements in a fault-tolerant server to execute instructions in lockstep
US6862693B2 (en) * 2001-04-13 2005-03-01 Sun Microsystems, Inc. Providing fault-tolerance by comparing addresses and data from redundant processors running in lock-step
US7366948B2 (en) * 2004-10-25 2008-04-29 Hewlett-Packard Development Company, L.P. System and method for maintaining in a multi-processor system a spare processor that is in lockstep for use in recovering from loss of lockstep for another processor
US7467327B2 (en) * 2005-01-25 2008-12-16 Hewlett-Packard Development Company, L.P. Method and system of aligning execution point of duplicate copies of a user program by exchanging information about instructions executed
US7260495B2 (en) * 2005-06-06 2007-08-21 International Business Machines Corporation System and method for test generation for system level verification using parallel algorithms
TW200745873A (en) * 2006-06-05 2007-12-16 Dmp Electronics Inc Dual computers for backup and being fault-tolerant system architecture

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026932A (ja) * 2008-07-23 2010-02-04 Toshiba Corp 高可用システム及び実行状態制御方法
JP2012514257A (ja) * 2008-12-31 2012-06-21 インテル・コーポレーション 冗長プロセスを同期させるためのステート履歴ストレージ
JP2014160483A (ja) * 2008-12-31 2014-09-04 Intel Corp 装置、方法、及び、プロセッサ

Also Published As

Publication number Publication date
CN100507833C (zh) 2009-07-01
US7467327B2 (en) 2008-12-16
CN1811700A (zh) 2006-08-02
US20090070564A1 (en) 2009-03-12
US7752494B2 (en) 2010-07-06
US20060168425A1 (en) 2006-07-27
JP4386449B2 (ja) 2009-12-16

Similar Documents

Publication Publication Date Title
JP4386449B2 (ja) 実行される命令に関する情報を交換することによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム
JP4463212B2 (ja) メモリストアをコピーすることによってユーザプログラムの複製コピーの実行ポイントをアラインメントする方法及びシステム
US7434098B2 (en) Method and system of determining whether a user program has made a system level call
US7426656B2 (en) Method and system executing user programs on non-deterministic processors
JP2005285120A (ja) ユーザプログラムを実行する複数のプロセッサにおける非同期割り込みにサービスを提供する方法およびシステム
US10909006B2 (en) Main processor error detection using checker processors
US6327668B1 (en) Determinism in a multiprocessor computer system and monitor and processor therefor
US11263081B2 (en) Checkpointing
US7861228B2 (en) Variable delay instruction for implementation of temporal redundancy
US8799706B2 (en) Method and system of exchanging information between processors
KR20120025492A (ko) Smt 기계에서 비교 및 전달 명령어를 사용한 안정적 실행
EP0372751B1 (en) Pipelined data-processing apparatus
JP2005166057A (ja) 障害検出コンピュータシステム
US9594648B2 (en) Controlling non-redundant execution in a redundant multithreading (RMT) processor
KR20000005689A (ko) 시간지연이중화기술을구현하는장치및방법
Chen et al. MSRP-FT: Reliable resource sharing on multiprocessor mixed-criticality systems
US7549085B2 (en) Method and apparatus to insert special instruction
JPH1196006A (ja) 情報処理装置
JP2006252548A (ja) 時間的冗長性を実施するための可変遅延命令

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090903

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090928

R150 Certificate of patent or registration of utility model

Ref document number: 4386449

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131009

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees