JP4576433B2 - 情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラム - Google Patents

情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラム Download PDF

Info

Publication number
JP4576433B2
JP4576433B2 JP2007557689A JP2007557689A JP4576433B2 JP 4576433 B2 JP4576433 B2 JP 4576433B2 JP 2007557689 A JP2007557689 A JP 2007557689A JP 2007557689 A JP2007557689 A JP 2007557689A JP 4576433 B2 JP4576433 B2 JP 4576433B2
Authority
JP
Japan
Prior art keywords
diagnosis
cpu
cache memory
logical
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007557689A
Other languages
English (en)
Other versions
JPWO2007091297A1 (ja
Inventor
秀憲 東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2007091297A1 publication Critical patent/JPWO2007091297A1/ja
Application granted granted Critical
Publication of JP4576433B2 publication Critical patent/JP4576433B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
    • G06F11/2242Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors in multi-processor systems, e.g. one processor becoming the test master

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Hardware Redundancy (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

本発明は、情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラムに関し、特に、内部に共有資源が存在するCPUにおける診断を、排他処理を適切に行って実施することが可能な情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラムに関する。
従来より、起動時に自装置を構成する各部の自己診断を行い、不具合を有する部分があればその部分を切り離して起動したり、起動を中止したりする情報処理装置が知られている。このような自己診断を行うことにより、情報処理装置が不具合を有したまま稼動することを回避することができ、情報処理装置の信頼性を高めることができる。
情報処理装置が自己診断処理を行う場合、共有資源の排他処理が必要となる場合がある。例えば、マルチプロセッサシステムにおいて主記憶が複数のCPU(Central Processing Unit)によって共有されている場合、主記憶の診断は、一つのCPUのみが行ったり、複数のCPUによって排他的に行う必要がある。
一般に、主記憶の診断には、複数のテストパターンを書き込み、同じテストパターンが読み出されるか否かを調べる手法が用いられる。この手法では、複数のCPUが同時に診断を実施すると、あるCPUによって書き込まれたテストパターンが他のCPUによって上書きされ、誤った診断結果が下される可能性があるため、一つのCPUのみが診断を行ったり、複数のCPUが排他的に診断を行わなければならない。
特許文献1では、複数のCPUによって共有される記憶装置を一つのCPUが診断する処理を短時間で完了することができ、診断を担当するCPUに不具合が発生した場合に、これをシステム制御装置が検出し、他のCPUに診断を肩代わりさせることが可能な技術が開示されている。
特開平2−311950号公報
ところで、近年、プロセス技術の進展にともなって、一つのダイ上に複数のCPUコアを実装したマルチコアCPUの利用が広まりつつある。マルチコアCPUは、単純に複数のCPUを一つのダイにまとめただけでなく、キャッシュの共有化等により、CPU間のやりとりを高速化させ、性能の向上も図られている。
また、CPUを仮想的に複数のCPUに見せかけ、複数のプログラムの並列実行性能を高めるマルチスレッド技術をCPUコアに組み込み、さらに、性能を向上させたマルチコアCPUも登場しつつある。
かかるマルチコアCPUを備えた情報処理装置を安定して稼動させるには、起動時に各CPUコアとこれらによって共有されるキャッシュ等の共有資源の診断を行う必要がある。このとき、共有資源については排他的に診断が行われるように制御する必要があるが、特許文献1に記載されているような従来の自己診断に係る技術では、CPU内部に共有資源が存在することが想定されていないため、適切に排他処理を行って共有資源の診断を行うことができなかった。
本発明は、上記に鑑みてなされたものであって、マルチスレッドに対応したマルチコアCPUのように内部に共有資源が存在するCPUの診断を、排他処理を適切に行って実施することが可能な情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、当該の情報処理装置を構成する各部が正常であるか否かを診断する診断プログラムを記憶し、それぞれが独立してプログラムを実行可能な複数の命令制御手段および前記複数の命令制御手段により共有される共有資源を備えたCPUと、前記診断プログラムによる診断の結果を記憶する記憶手段とを有する情報処理装置であって、前記CPUは、前記診断プログラムに従って前記共有資源の診断を行う場合に、該共有資源を共有する命令制御手段の一つのみが該共有資源を診断するように制御することを特徴とする。
この発明によれば、CPU内の共有資源を複数の命令制御手段の一つのみが診断を担当するように構成したので、排他処理を適切に行って共有資源の診断を実施することができる情報処理装置を得ることができる。
また、本発明は、上記の発明において、前記CPUは、前記共有資源の診断を行っていた前記命令制御手段に異常が発生した場合に、該共有資源を共有する他の命令制御手段が該共有資源を診断するように制御することを特徴とする。
この発明によれば、共有資源の診断を担当する命令制御手段に異常が発生した場合に、他の命令制御手段に診断を肩代わりさせるように構成したので、診断処理に高い信頼性を備える情報処理装置を得ることができる。
また、本発明は、上記の発明において、前記情報処理装置は、サービスプロセッサと接続され、前記命令制御手段は、前記診断プログラムに従って前記各部の診断を行う前に、前記サービスプロセッサによって診断されることを特徴とする。
この発明によれば、診断処理に先立って、サービスプロセッサによって命令制御手段の基礎的な動作確認を行うように構成したので、診断処理の信頼性を高めることができる。
また、本発明は、それぞれが独立してプログラムを実行可能な複数の論理CPUとして動作するCPUコアを複数備えたCPUを有する情報処理装置において、該情報処理装置を構成する装置が正常であることを診断するために前記論理CPUにより実行される診断プログラムであって、予め決められた順序に従って診断対象の装置を順次選択する診断対象選択手順と、前記診断対象選択手順によって選択された装置が他の論理CPUと共有されている場合に、前記装置の診断を排他的に行う担当が当該の論理CPUであるか否かを判定する進行制御手順と、前記進行制御手順により前記装置の診断を排他的に行う担当が当該の論理CPUであると判定された場合、もしくは、前記装置が他の論理CPUと共有されていない場合に、前記装置の診断を実行し、診断結果を記憶手段に記憶させる診断実行手順とを含んだことを特徴とする。
この発明によれば、CPU内の共有資源を一つの論理CPUのみが診断を担当するように構成したので、排他処理を適切に行って共有資源の診断を実施することができる診断プログラムを得ることができる。
また、本発明は、上記の発明において、前記進行制御手順は、他の論理CPUと共有されている装置の診断を排他的に行う担当が当該の論理CPUでないと判断した場合に、該装置の診断結果が前記記憶手段に記憶されるまで、該装置の診断を排他的に行う担当が当該の論理CPUであるか否かの判定を再試行し続けることを特徴とする。
また、本発明は、上記の発明において、前記進行制御手順は、他の論理CPUと共有されている装置の診断を排他的に行う担当が当該の論理CPUでないと判断した場合に、該装置の診断結果が前記記憶手段に記憶されるまで監視し、前記記憶手段に記憶されていれば、前記診断対象選択手順に次の診断対象を選択させることを特徴とする。
この発明によれば、共有資源の診断を他の論理CPUが担当しているときに、共有資源の診断が完了するまでは、共有資源の診断を肩代わりする必要があるか否かを監視するように構成したので、診断処理に高い信頼性をもたせることができる。
また、本発明は、上記の発明において、前記診断実行手順は、診断の結果、前記CPUコアの一つに含まれ、該CPUコアの論理CPUによって共有されている装置の異常を検出した場合は、該CPUコアが異常である旨を前記記憶手段に記憶させ、前記進行制御手順は、当該の論理CPUを含むCPUコアが異常である旨が前記記憶手段に記憶された場合は、当該の論理CPUにおける診断処理を中止させることを特徴とする。
また、本発明は、上記の発明において、前記診断実行手順は、診断の結果、前記CPUに含まれ、該CPUが備えるCPUコアによって共有されている装置の異常を検出した場合は、該CPUが異常である旨を前記記憶手段に記憶させ、前記進行制御手順は、当該の論理CPUを含むCPUが異常である旨が前記記憶手段に記憶された場合は、当該の論理CPUにおける診断処理を中止させることを特徴とする。
この発明によれば、共有資源に異常が検出された場合に、その共有資源を利用するCPUコアもしくはCPUに異常があることを記憶手段に記憶するように構成したので、異常があるCPUコアもしくはCPUを切り離して情報処理装置を安定して稼動させることができる。
また、本発明は、それぞれが独立してプログラムを実行可能な複数の論理CPUとして動作するCPUコアを複数備えたCPUを有する情報処理装置において、該情報処理装置を構成する装置が正常であることを診断する診断方法であって、予め決められた順序に従って診断対象の装置を順次選択する診断対象選択工程と、前記診断対象選択工程によって選択された装置が複数の論理CPUによって共有されている場合に、該装置を共有する論理CPUを一つ選択し、選択した論理CPUに該装置の診断を行わせる進行制御工程とを含んだことを特徴とする。
この発明によれば、CPU内の共有資源を一つの論理CPUのみが診断を担当するように構成したので、排他処理を適切に行って共有資源の診断を実施することができる診断方法を得ることができる。
また、本発明は、上記の発明において、前記進行制御工程は、論理CPUによって共有されている装置を診断させるために選択した論理CPUに異常が発生した場合は、該装置を共有する他の論理CPUを一つ選択し、選択した論理CPUに該装置の診断を行わせることを特徴とする。
この発明によれば、共有資源の診断を担当する論理CPUに異常が発生した場合に、他の論理CPUに診断を肩代わりさせるように構成したので、診断処理に高い信頼性を備える診断方法を得ることができる。
また、本発明は、複数の処理部と、前記複数の処理部により共有される共有資源とを備えたCPUであって、前記共有資源の診断時に、前記複数の処理部のうち、一つの処理部が診断プログラムを実行して前記共有資源の診断を行い、他の処理部は前記一つの処理部による前記供給資源の診断終了を待つように動作することを特徴とする。
この発明によれば、CPU内の共有資源を一つの処理部のみが診断を担当するように構成したので、排他処理を適切に行って共有資源の診断を実施することができるCPUを得ることができる。
本発明によれば、CPU内の共有資源を複数の命令制御手段の一つのみが診断を担当するように構成したので、排他処理を適切に行って共有資源の診断を実施することができる情報処理装置を得ることができるという効果を奏する。
また、本発明によれば、共有資源の診断を担当する命令制御手段に異常が発生した場合に、他の命令制御手段に診断を肩代わりさせるように構成したので、診断処理に高い信頼性を備える情報処理装置を得ることができるという効果を奏する。
また、本発明によれば、診断処理に先立って、サービスプロセッサによって命令制御手段の基礎的な動作確認を行うように構成したので、診断処理の信頼性を高めることができるという効果を奏する。
また、本発明によれば、CPU内の共有資源を一つの論理CPUのみが診断を担当するように構成したので、排他処理を適切に行って共有資源の診断を実施することができる診断プログラムを得ることができるという効果を奏する。
また、本発明によれば、共有資源の診断を他の論理CPUが担当しているときに、共有資源の診断が完了するまでは、共有資源の診断を肩代わりする必要があるか否かを監視するように構成したので、診断処理に高い信頼性をもたせることができるという効果を奏する。
また、本発明によれば、共有資源に異常が検出された場合に、その共有資源を利用するCPUコアもしくはCPUに異常があることを記憶手段に記憶するように構成したので、異常があるCPUコアもしくはCPUを切り離して情報処理装置を安定して稼動させることができるという効果を奏する。
また、本発明によれば、CPU内の共有資源を一つの論理CPUのみが診断を担当するように構成したので、排他処理を適切に行って共有資源の診断を実施することができる診断方法を得ることができるという効果を奏する。
また、本発明によれば、共有資源の診断を担当する論理CPUに異常が発生した場合に、他の論理CPUに診断を肩代わりさせるように構成したので、診断処理に高い信頼性を備える診断方法を得ることができるという効果を奏する。
また、本発明によれば、CPU内の共有資源を一つの処理部のみが診断を担当するように構成したので、排他処理を適切に行って共有資源の診断を実施することができるCPUを得ることができるという効果を奏する。
以下に、本発明に係る情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
まず、本実施例に係る情報処理装置の構成について説明する。図1は、本実施例に係る情報処理装置10の構成を示す図である。同図に示すように、情報処理装置10は、CPU100a〜100kと、主記憶200と、入出力装置300と、ネットワークインターフェース装置400と、シリアル通信インターフェース装置500と、ROM600と、SRAM700とをバスを介して接続して構成される。
CPU100a〜100kは、マルチスレッドに対応したCPUコアを複数備えたマルチコアCPUであり、それぞれ、#1〜#kの番号で識別される。これらのCPUは、いずれも同様の構成を有するので、ここでは、CPU100aを例にして詳細な構成について説明する。なお、情報処理装置10は、必ずしも複数のCPUを備える必要はなく、単一のCPUのみを備えた構成とすることもできる。
図2は、CPU100aの構成を示す図である。同図に示すように、CPU100aは、CPUコア110a〜110mと、L2キャッシュ120とを有する。CPUコア110a〜110mは、それぞれが、完結したCPUとして動作可能なCPUコアであり、#1−1〜#1−mの番号で識別される。なお、「−」で区切られた最初の番号は、そのCPUコアが含まれるCPUの番号であり、2番目の番号は、CPU内においてそのCPUコアに割り当てられた連番である。
CPUコア110aは、命令制御部111と、レジスタ113a〜113nと、TLB(Translation Lookaside Buffer)114と、L1キャッシュ115とを有する。命令制御部111は、各種演算や入出力制御等を実行する処理部である。命令制御部111は、マルチスレッドに対応しているため、CPUコア110aは、情報処理装置10上で動作するオペレーティングシステムやアプリケーションプログラムからはn個のCPUであるかのようにみえる(以下、この見かけ上存在するCPUを「論理CPU」という)。
CPU100aにおいては、各論理CPUがプログラムを実行する主体となる。CPU100aにはm個のCPUコアが存在し、それぞれのCPUコアがn個の論理CPUとして動作するので、CPU100aは、並列に、m×n個の命令を実行しているかのように見える。
レジスタ113a〜113nは、命令制御部111が各種演算等で使用するデータやカウンタ等を記憶する記憶装置であり、#1−1−1〜#1−1−nの番号で識別される論理CPU112a〜112nごとに存在する。なお、論理CPUに割り当てられた番号の最後の「−」よりも前の部分は、その論理CPUが含まれるCPUコアの番号であり、それ以降の部分は、CPUコア内においてその論理CPUに割り当てられた連番である。
TLB114は、仮想記憶空間と実記憶空間の変換のための変換表を保持する装置であり、L1キャッシュ115は、主記憶200と論理CPU112a〜112nの間の入出力を高速化させるための一次キャッシュである。TLB114とL1キャッシュ115は、論理CPU112a〜112nによって共有される。
CPUコア110b〜110mの構成は、CPUコア110aと同様である。そして、L2キャッシュ120は、CPUコア110a〜110mに内蔵されているL1キャッシュ115を補助する2次キャッシュであり、CPUコア110a〜110mによって共有される。
このように、CPU100aは、CPUコア110a〜110mがL2キャッシュ120を共有し、各CPUコアに含まれる論理CPU112a〜112nが、TLB114とL1キャッシュ115を共有する構成となっている。
ここで、情報処理装置10の起動時にCPU100aの自己診断処理を行う場合について考える。TLB114とL1キャッシュ115は、各CPUコアの論理CPU112a〜112nに共有されるため、診断処理同士の干渉による誤診断を回避するために、各CPUコアごとに論理CPUの一つのみが診断を担当するように制御する必要がある。
また、L2キャッシュ120は、CPUコア110a〜110mによって共有されるため、診断処理同士の干渉による誤診断を回避するために、ある一時点においてCPUコア110a〜110mのいずれかに含まれる論理CPUの一つのみが診断を担当するように制御する必要がある。
なお、上記のCPU100a〜100kの構成は、一例であり、キャッシュ構成等を変更することができる。例えば、2次キャッシュがCPUコアごとに存在する構成とすることもできるし、TLBやキャッシュ以外の装置を共有するように構成することもできる。
図1の説明に戻って、主記憶200は、CPU100a〜100kが各種情報処理を実行するために必要なデータやプログラムが展開されるメモリである。入出力装置300は、ハードディスク装置等の入出力装置であり、ネットワークインターフェース装置400は、ネットワークを介して情報をやりとりするためのインターフェース装置である。
シリアル通信インターフェース装置500は、RS−232C等のシリアル通信接続手段によって他の装置を接続するためのインターフェース装置であり、情報処理装置10は、シリアル通信インターフェース装置500を介してサービスプロセッサ20と接続される。サービスプロセッサ20は、情報処理装置10の運用管理のための各種処理を行う装置である。なお、情報処理装置10とサービスプロセッサ20は、シリアル通信接続手段によって接続することを限定するわけではない。
ROM600は、読み取り専用のメモリであり、診断プログラム610を記憶する。診断プログラム610は、情報処理装置10の起動時に各論理CPUに自己診断処理を実行させるためのプログラムである。
SRAM700は、書き換え可能な不揮発メモリであり、診断プログラム610による診断結果等をCPU診断情報710と機器診断情報720として記憶する。CPU診断情報710は、CPU100a〜100kとそれらのCPUに含まれるCPUコアと論理CPUの診断に係る情報であり、機器診断情報720は、その他の装置の診断に係る情報である。
なお、情報処理装置10の構成は、上記の通りである必要はなく、用途等に応じて様々な構成をとることができる。例えば、図1に図示した以外の装置を接続することもできるし、診断プログラム610、CPU診断情報710および機器診断情報720を他の記憶手段に記憶させることもできる。
図3は、図1に示した診断プログラム610の構成を示す図である。診断プログラム610は、情報処理装置10の起動時に各論理CPUによって読み取られ、自己診断処理を実現させるプログラムである。以下、論理CPU112aにて診断プログラム610が実行される場合を例にして、診断プログラム610の詳細について説明する。
図3に示すように、診断プログラム610は、診断対象選択部611と、進行制御部612と、診断実行部613とを有する。
診断対象選択部611は、予め決められた順序に従って診断対象の装置を順次選択する処理部である。具体的には、診断対象選択部611は、レジスタ113a、TLB114、主記憶200、L1キャッシュ115、L2キャッシュ120、CPU100aの外部に接続されている装置という順序で診断対象の装置を選択する。
診断対象選択部611は、原則的に、論理CPU112aに近い装置から順に診断対象として選択するが、主記憶200については、より論理CPU112aに近いL1キャッシュ115およびL2キャッシュ120に先行して診断対象として選択する。これは、本実施例の構成では、L1キャッシュ115およびL2キャッシュ120を、論理CPU112aから直接制御することができず、主記憶200への書き込みと読み取りを通じてしかL1キャッシュ115およびL2キャッシュ120の診断を行うことができないため、事前に主記憶200の診断を完了しておく必要があるからである。
進行制御部612は、診断の進行を制御する制御部である。診断対象選択部611によって選択された診断対象が、論理CPU112aによって占有されている装置(例えば、レジスタ113a)であった場合、進行制御部612は、他の論理CPUの処理を考慮せずに診断を実行させる。
また、診断対象選択部611によって選択された診断対象が、論理CPU112a〜112nによって共有されている装置(例えば、TLB114)であった場合、進行制御部612は、自身を実行する論理CPUが診断を行うべきと判断した場合のみ診断を実行させる。
共有されている装置を複数の論理CPUが同時に診断した場合、診断処理同士が干渉して誤った診断結果が得られる可能性がある。そこで、進行制御部612は、他の論理CPUと共有されている装置が診断対象である場合、一つの論理CPUのみが排他的に診断を行うように制御をおこなう。以下の説明では、ある装置が複数の論理CPUによって共有されている場合に(論理CPUを含むCPUコアによって共有されている場合を含む)、その装置の診断を担当する論理CPUをマスタCPUと呼ぶこととする。
進行制御部612は、自身を実行する論理CPUがマスタCPUとなるか否かの判断を当該の論理CPUに割り当てられた番号に基づいて行う。具体的には、自身を実行する論理CPUが、診断対象の装置を共有する正常な論理CPUの中で最も若い番号が割り当てられている場合に、当該の論理CPUがマスタCPUであると判断する。このように番号を利用する手法は、複雑な同期処理等が不要で、容易に実現が可能である。
上記の例では、論理CPU112aは、診断対象の装置を共有する正常な論理CPUの中で最も若い番号を割り当てられているので、進行制御部612は、自身を実行する論理CPUをマスタCPUであると判断して診断を実行させる。ここで、論理CPU112aに異常が発見されていた場合は、次に若い番号が割り当てられている正常な論理CPUにて実行されている診断プログラム610の進行制御部612が同様の判断を行う。
そして、進行制御部612は、自身を実行する論理CPUがマスタCPUでないと判断した場合、診断対象の装置の診断が完了するまで、自身を実行する論理CPUがマスタCPUか否かの判断を繰り返し試行する。これにより、マスタCPUに異常が発生した場合に、他の論理CPUが新たにマスタCPUとなって診断を肩代わりすることが可能になる。
この方式では、マスタCPUの故障時に他の論理CPUに診断を肩代わりさせる機能を特別な装置(例えば、特許文献1におけるシステム制御装置)を用いず、ソフトウェアのみによって実現することができ、信頼性の高い情報処理装置を安価に提供することが可能になる。
そして、進行制御部612は、自身を実行する論理CPUがマスタCPUでないと判断した場合、診断対象の装置の診断が正常に完了していれば、診断対象選択部611に次の選択対象を選択させる。また、進行制御部612は、診断対象の異常が検出されていた場合、当該の論理CPUは正常に動作することができないと判断して診断処理を中止させる。
進行制御部612は、診断対象選択部611によって選択された診断対象が、CPUコア110a〜110mによって共有されている装置(例えば、L2キャッシュ120)であった場合や、CPU100a〜100kによって共有されている装置(例えば、主記憶200)であった場合も同様の排他制御を行う。
すなわち、診断対象の装置が複数のCPUコアによって共有されている場合は、その装置を共有する正常なCPUコアに含まれる正常な論理CPUの中で最も若い番号を有する論理CPUがマスタCPUとして診断を担当するように制御する。また、診断対象の装置が複数のCPUコアによって共有されている場合は、その装置を共有する正常なCPUが備える正常なCPUコアに含まれる正常な論理CPUの中で最も若い番号を有する論理CPUがマスタCPUとして診断を担当するように制御する
診断実行部613は、診断対象の装置の診断を行って、診断結果をCPU診断情報710と機器診断情報720に格納する処理部である。
診断実行部613は、CPUの内部の装置に異常を発見した場合、その装置を備える論理CPU、CPUコアもしくはCPUが異常である旨をCPU診断情報710に記録する。例えば、レジスタ113aに異常を発見した場合は、論理CPU112aが異常である旨をCPU診断情報710に記録し、TLB114に異常を発見した場合は、CPUコア110aが異常である旨をCPU診断情報710に記録し、L2キャッシュ120に異常を発見した場合は、CPU100aが異常である旨をCPU診断情報710に記録する。
また、論理CPU、CPUコアもしくはCPUが備える装置が正常であると判断した場合、その論理CPU、CPUコアもしくはCPUが正常である旨をCPU診断情報710に記録する。例えば、レジスタ113aが正常であると判断された場合は、論理CPU112aが正常である旨をCPU診断情報710に記録し、TLB114とL1キャッシュ115が正常であると判断された場合は、CPUコア110aが正常である旨をCPU診断情報710に記録し、L2キャッシュ120が正常であると判断された場合は、CPU100aが正常である旨をCPU診断情報710に記録する。
なお、CPU100aが正常と判断されるために、CPUコア110a〜110mの全てが正常と判断される必要はなく、異常があると判断されたCPUコアは縮退処理されて動作しないように制御される。同様に、CPUコア110aが正常と判断されるために、論理CPU112a〜112nの全てが正常と判断される必要はなく、異常があると判断された論理CPUは縮退処理されて動作しないように制御される。
図4は、CPU診断情報710のデータ構成の一例を示す図である。同図に示すように、CPU診断情報710は、CPUごと、CPUコアごとおよび論理CPUごとに診断結果を保持する。診断結果は、自己診断処理の開始時に「0」にリセットされ、診断実行部613によって当該のCPU、CPUコアもしくは論理CPUが正常であると診断された場合は「1」が設定され、異常があると診断された場合は「2」が設定される。
次に、情報処理装置10が起動時に行う自己診断の処理手順について説明する。図5は、自己診断の大まかな流れを示す図である。
同図に示すように、まず、情報処理装置10は、SRAM700に記憶されている診断情報をクリアする(ステップS101)。そして、サービスプロセッサ20が、情報処理装置10の基本的な動作確認を行う(ステップS102)。この動作確認により、CPU100a〜100kが自己診断処理に必要な基本的な動作を行うことができる程度に正常であることが確認される。
この後、CPU100a〜100kに含まれる各論理CPUが診断プログラム610を読み込んで各CPUの診断を実行し(ステップS103)、さらに、他の機器の診断を実行する(ステップS104)。なお、既に説明したように、L1キャッシュ115およびL2キャッシュ120を診断するに際に主記憶200へのアクセスが必要であり、これらの診断の前に主記憶200の診断を実施しておく必要があるため、主記憶200の診断は、ステップS103の中で実行される。
図6−1〜6−4は、診断プログラム610によるCPUの自己診断処理および主記憶200の診断の処理手順を示す図である。この処理手順は、図5に示したステップS103を詳細に表したものである。診断プログラム610は、各論理CPUにおいて実行されるが、ここでは、論理CPU112aにおいて実行される診断プログラム610に注目して説明を進めることとする。
同図に示すように、まず、診断対象選択部611が、レジスタ113aを診断対象として選択する。レジスタ113aは、論理CPU112aに占有されており、他の論理CPUと共有されていないため、進行制御部612は、他の論理CPUを考慮することなく診断実行部613にレジスタ113aの診断を実行させる(ステップS201)。
ここで、診断が正常に完了しなかった場合(ステップS202肯定)、診断実行部613は、CPU診断情報710に論理CPU112aが異常である旨を記憶させ(ステップS203)、自己診断処理を異常終了させる。
一方、診断が正常に完了した場合は(ステップS202否定)、論理CPU112aに含まれる装置の診断が正常に完了したことになるので、診断実行部613は、CPU診断情報710に論理CPU112aが正常である旨を記憶させ(ステップS204)、処理を継続する。
続いて、診断対象選択部611が、TLB114を診断対象として選択する。TLB114は、論理CPU112a〜112nによって共有されているため、進行制御部612は、後述する状況確認処理を行って、自身を実行する論理CPU112aがマスタCPUとなるか否か等を確認する(ステップS205)。
図7は、状況確認処理の処理手順を示す図である。まず、診断対象選択部611は、CPU診断情報710を参照して、自身を実行する論理CPU112aを含むCPUであるCPU100aの診断結果を取得する(ステップS301)。
ここで、診断結果が異常を示すものである場合は(ステップS302異常)、自己診断処理を異常終了させる。また、診断結果が正常を示すものである場合は(ステップS302正常)、CPU100a内の装置の診断が完了しているので、自己診断処理を正常に終了させる。
そして、CPU100aの診断結果が、診断が完了していないことを示すものである場合は(ステップS301未診断)、CPU診断情報710を参照して、自身を実行する論理CPU112aを含むCPUコアであるCPUコア110aの診断結果を取得する(ステップS303)。
ここで、診断結果が異常を示すものである場合は(ステップS304異常)、自己診断処理を異常終了させる。また、CPUコア110aの診断結果が、診断が完了していないことを示すもの、もしくは、正常を示すものである場合は(ステップS304未診断もしくは正常)、機器診断情報720を参照して、診断対象の装置の診断結果を取得する(ステップS305)。
そして、この診断結果が、診断が完了していないことを示すものである場合は(ステップS306未診断)、自身を実行している論理CPU112aが診断対象の装置に対してマスタCPUとなるか否かを判定する(ステップS307)。
図6−1に戻って、進行制御部612は、状況確認処理を行った後、診断対象であるTLB114の診断結果が異常を示すものである場合は(ステップS206異常)、自己診断処理を異常終了させる。また、診断結果が正常を示すものである場合は(ステップS206正常)、次の装置の診断を行うためステップS213へ遷移する。
そして、診断の結果、診断が完了していないことを示すものである場合は(ステップS206未診断)、自身を実行する論理CPU112aがマスタCPUでなければ(ステップS207否定)、ステップS205へ復帰して状況確認処理を再実行する。一方、論理CPU112aがマスタCPUであれば(ステップS207肯定)、進行制御部612は、診断実行部613にTLB114の診断を実行させる(ステップS208)。
TLB114の診断は、図8に示すように、複数のテストパターンを書き込み、読み出した値が期待する値と一致するか否かを比較することで行う。
ここで、診断が正常に完了しなかった場合(ステップS209肯定)、診断実行部613は、機器診断情報720にTLB114が異常である旨を記憶させ(ステップS210)、CPU診断情報710にCPUコア110aが異常である旨を記憶させ(ステップS211)、自己診断処理を異常終了させる。
一方、診断が正常に完了した場合は(ステップS209否定)、機器診断情報720にTLB114が正常である旨を記憶させ(ステップS212)、次の装置の診断へと移行する。
TLB114の診断が完了した後、診断対象選択部611が、主記憶200を診断対象として選択する。主記憶200は、CPU100a〜100kによって共有されているため、進行制御部612は、状況確認処理を行って、自身を実行する論理CPU112aがマスタCPUとなるか否か等を確認する(ステップS213)。
そして、進行制御部612は、状況確認処理を行った後、診断対象である主記憶200の診断結果が正常を示すものである場合は(ステップS214正常)、次の装置の診断を行うためステップS218へ遷移する。
そして、診断の結果、診断が完了していないことを示すものである場合は(ステップS214未診断)、自身を実行する論理CPU112aがマスタCPUでなければ(ステップS215否定)、ステップS213へ復帰して状況確認処理を再実行する。
一方、論理CPU112aがマスタCPUであれば(ステップS215肯定)、進行制御部612は、診断実行部613に主記憶200の診断を実行させ(ステップS216)、診断実行部613は、診断結果を機器診断情報720に記憶させる(ステップS217)。
主記憶200の診断は、図9に示すように、メモリ診断回路による診断と、CPUからの読み込みと書き込みによる診断とを組み合わせて行う。
主記憶200の診断が完了した後、診断対象選択部611が、L1キャッシュ115を診断対象として選択する。L1キャッシュ115は、論理CPU112a〜112nによって共有されているため、進行制御部612は、状況確認処理を行って、自身を実行する論理CPU112aがマスタCPUとなるか否か等を確認する(ステップS218)。
そして、進行制御部612は、状況確認処理を行った後、診断対象であるL1キャッシュ115の診断結果が異常を示すものである場合は(ステップS219異常)、自己診断処理を異常終了させる。また、診断結果が正常を示すものである場合は(ステップS219正常)、次の装置の診断を行うためステップS227へ遷移する。
そして、診断結果が、診断が完了していないことを示すものである場合は(ステップS219未診断)、自身を実行する論理CPU112aがマスタCPUでなければ(ステップS220否定)、ステップS218へ復帰して状況確認処理を再実行する。一方、論理CPU112aがマスタCPUであれば(ステップS220肯定)、進行制御部612は、診断実行部613にL1キャッシュ115の診断を実行させる(ステップS221)。
ここで、診断が正常に完了しなかった場合(ステップS222肯定)、診断実行部613は、機器診断情報720にL1キャッシュ115が異常である旨を記憶させ(ステップS223)、CPU診断情報710にCPUコア110aが異常である旨を記憶させ(ステップS224)、自己診断処理を異常終了させる。
一方、診断が正常に完了した場合は(ステップS222否定)、機器診断情報720にL1キャッシュ115が正常である旨を記憶させ(ステップS225)、さらに、CPUコア110aに含まれる装置の診断が正常に完了したことになるので、CPU診断情報710にCPUコア110aが正常である旨を記憶させ(ステップS226)、次の装置の診断へと移行する。
L1キャッシュ115の診断が完了した後、診断対象選択部611が、L2キャッシュ120を診断対象として選択する。L2キャッシュ120は、CPUコア110a〜110mによって共有されているため、進行制御部612は、状況確認処理を行って、自身を実行する論理CPU112aがマスタCPUとなるか否か等を確認する(ステップS227)。
そして、進行制御部612は、状況確認処理を行った後、診断対象であるL2キャッシュ120の診断結果が異常を示すものである場合は(ステップS228異常)、自己診断処理を異常終了させる。また、診断結果が正常を示すものである場合は(ステップS228正常)、次の装置の診断を行うためステップS236へ遷移する。
そして、診断の結果、診断が完了していないことを示すものである場合は(ステップS228未診断)、自身を実行する論理CPU112aがマスタCPUでなければ(ステップS229否定)、ステップS227へ復帰して状況確認処理を再実行する。一方、論理CPU112aがマスタCPUであれば(ステップS229肯定)、進行制御部612は、診断実行部613にL2キャッシュ120の診断を実行させる(ステップS230)。
L2キャッシュ120(およびL1キャッシュ115)の診断は、図10に示すように、主記憶200への書き込みと読み込みを通して、キャッシュが正しく保持されているか否かを確認することにより行われる。
ここのL2キャッシュ120の診断で、診断が正常に完了しなかった場合(ステップS231肯定)、診断実行部613は、機器診断情報720にL2キャッシュ120が異常である旨を記憶させ(ステップS232)、CPU診断情報710にCPU100aが異常である旨を記憶させ(ステップS233)、自己診断処理を異常終了させる。
一方、診断が正常に完了した場合は(ステップS231否定)、機器診断情報720にL2キャッシュ120が正常である旨を記憶させ(ステップS234)、さらに、CPUコア110aに含まれる装置の診断が正常に完了したことになるので、CPU診断情報710にCPUコア110aが正常である旨を記憶させる(ステップS235)。
こうして、論理CPU112aが診断すべき装置の診断が完了した後、進行制御部612は、他のCPUコアの診断が完了するのを待ち受ける。具体的には、まず、状況確認処理を行って、CPU100aの診断が完了しているか否かと、自身を実行する論理CPU112aがCPU100aに対してマスタCPUとなるか否かを確認する(ステップS236)。
ここで、CPU100aの診断が完了していれば、処理を終了する。CPU100aの診断が完了しておらず、自身を実行する論理CPU112aがマスタCPUであれば(ステップ237肯定)、CPU診断情報710を参照してCPUコア110a〜110mの診断が完了しているか否かを確認する。そして、CPUコア110a〜110m診断が完了していれば(ステップ238肯定)、CPU診断情報710にCPU100aが正常である旨を記憶させて処理を終了する(ステップS239)。
自身を実行する論理CPU112aがマスタCPUでない場合(ステップS237否定)、もしくは、CPUコア110a〜110m診断が完了していない場合は(ステップS238否定)、ステップS236に復帰して状況確認処理から再実行する。
以上のように、本発明に係る情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラムは、自己診断よる安定稼動を得るために有用であり、特に、内部に共有資源が存在するCPUの診断を、排他処理を適切に行って実施することが必要な場合に適している。
図1は、本実施例に係る情報処理装置の構成を示す図である。 図2は、CPUの構成を示す図である。 図3は、診断プログラムの構成を示す図である。 図4は、CPU診断情報のデータ構成の一例を示す図である。 図5は、自己診断の大まかな流れを示す図である。 図6−1は、診断プログラムによるCPUの自己診断処理の処理手順を示す図である。 図6−2は、診断プログラムによる主記憶の診断処理の処理手順を示す図である。 図6−3は、診断プログラムによるCPUの自己診断処理の処理手順を示す図である。 図6−4は、診断プログラムによるCPUの自己診断処理の処理手順を示す図である。 図7は、状況確認処理の処理手順を示す図である。 図8は、TLBの診断の処理手順を示す図である。 図9は、主記憶の診断の処理手順を示す図である。 図10は、L1キャッシュおよびL2キャッシュの診断の処理手順を示す図である。
符号の説明
10 情報処理装置
20 サービスプロセッサ
100a〜100k CPU
110a〜110m CPUコア
111 命令制御部
112a〜112n 論理CPU
113a〜113n レジスタ
114 TLB
115 L1キャッシュ
120 L2キャッシュ
200 主記憶
300 入出力装置
400 ネットワークインターフェース装置
500 シリアル通信インターフェース装置
600 ROM
610 診断プログラム
611 診断対象選択部
612 進行制御部
613 診断実行部
700 SRAM
710 CPU診断情報
720 機器診断情報

Claims (4)

  1. 命令制御を行う論理CPUを複数含むCPUコアを複数有する演算処理装置と、前記演算処理装置に供給するデータを保持する第1の記憶装置と、診断の結果を保持する第2の記憶装置を有する情報処理装置において、
    前記演算処理装置は、
    前記第1の記憶装置が保持するデータの一部を保持する記憶部として、前記複数のCPUコアから共有される2次キャッシュメモリと、前記複数の論理CPUから共有される1次キャッシュメモリとを有し、
    前記複数のCPUコアのうち、少なくともいずれか一のCPUコアに含まれる複数の論理CPUのうち少なくともいずれか一の論理CPUは、
    前記第1の記憶装置を診断対象として選択し、前記第1の記憶装置の診断が完了した後に、前記1次キャッシュメモリを診断対象として選択するとともに、前記1次キャッシュメモリの診断が完了した後に、前記2次キャッシュメモリを診断対象として選択する診断対象選択部と、前記選択された第1の記憶装置と2次キャッシュメモリと1次キャッシュメモリの診断を実行するとともにそれぞれの診断結果を前記第2の記憶装置に格納する診断実行部と、前記診断対象選択部が選択した診断対象のうち前記選択された2次キャッシュメモリと1次キャッシュメモリが他の論理CPUと共有されている場合には、前記選択された2次キャッシュメモリと1次キャッシュメモリを共有する複数の論理CPUのうち自身が有する診断実行部のみに前記共有された診断対象の診断を排他的に実行させる進行制御部を有することを特徴とする情報処理装置。
  2. データを保持する第1の記憶装置と、診断の結果を保持する第2の記憶装置に接続されるとともに、命令制御を行う論理CPUを複数含むCPUコアを複数有する演算処理装置において、
    前記演算処理装置は、
    前記第1の記憶装置が保持するデータの一部を保持する記憶部として、前記複数のCPUコアから共有される2次キャッシュメモリと、前記複数の論理CPUから共有される1次キャッシュメモリとを有し、
    前記複数のCPUコアのうち、少なくともいずれか一のCPUコアに含まれる複数の論理CPUのうち少なくともいずれか一の論理CPUは、
    前記第1の記憶装置を診断対象として選択し、前記第1の記憶装置の診断が完了した後に、前記1次キャッシュメモリを診断対象として選択するとともに、前記1次キャッシュメモリの診断が完了した後に、前記2次キャッシュメモリを診断対象として選択する診断対象選択部と、前記選択された第1の記憶装置と2次キャッシュメモリと1次キャッシュメモリの診断を実行するとともにそれぞれの診断結果を前記第2の記憶装置に格納する診断実行部と、前記診断対象選択部が選択した診断対象のうち前記選択された2次キャッシュメモリと1次キャッシュメモリが他の論理CPUと共有されている場合には、前記選択された2次キャッシュメモリと1次キャッシュメモリを共有する複数の論理CPUのうち自身が有する診断実行部のみに前記共有された診断対象の診断を排他的に実行させる進行制御部を有することを特徴とする演算処理装置。
  3. 命令制御を行う論理CPUを複数含む複数のCPUコアと、データを保持する第1の記憶装置が保持するデータの一部を保持する記憶部として、前記複数のCPUコアから共有される2次キャッシュメモリと、前記複数の論理CPUから共有される1次キャッシュメモリとを有する演算処理装置と、診断の結果を保持する第2の記憶装置を有する情報処理装置の制御方法において、
    前記複数のCPUコアのうち、少なくともいずれか一のCPUコアに含まれる複数の論理CPUのうち少なくともいずれか一の論理CPUが有する診断対象選択部が、前記第1の記憶装置を診断対象として選択するステップと、
    前記一の論理CPUが有する進行制御部が、前記一の論理CPUが有する診断実行部のみに、前記選択された第1の記憶装置の診断を実行させるとともに、前記第1の記憶装置の診断結果を前記第2の記憶装置に格納させるステップと、
    前記一の論理CPUが有する診断対象選択部が、前記第1の記憶装置の診断が完了した後に、前記1次キャッシュメモリを診断対象として選択するステップと、
    前記一の論理CPUが有する進行制御部が、前記選択された1次キャッシュメモリを共有する複数の論理CPUのうち前記一の論理CPUが有する診断実行部のみに、前記選択された1次キャッシュメモリの診断を排他的に実行させるとともに、前記1次キャッシュメモリの診断結果を前記第2の記憶装置に格納させるステップと、
    前記一の論理CPUが有する診断対象選択部が、前記1次キャッシュメモリの診断が完了した後に、前記2次キャッシュメモリを診断対象として選択するステップと、
    前記一の論理CPUが有する進行制御部が、前記選択された2次キャッシュメモリを共有する複数のCPUコアに含まれる複数の論理CPUのうち前記一の論理CPUが有する診断実行部のみに、前記選択された2次キャッシュメモリの診断を排他的に実行させるとともに、前記2次キャッシュメモリの診断結果を前記第2の記憶装置に格納させるステップと、
    を有することを特徴とする情報処理装置の制御方法。
  4. 命令制御を行う論理CPUを複数含む複数のCPUコアと、データを保持する第1の記憶装置が保持するデータの一部を保持する記憶部として、前記複数のCPUコアから共有される2次キャッシュメモリと、前記複数の論理CPUから共有される1次キャッシュメモリとを有する演算処理装置と、診断の結果を保持する第2の記憶装置を有する情報処理装置の制御プログラムにおいて、
    前記複数のCPUコアのうち、少なくともいずれか一のCPUコアに含まれる複数の論理CPUのうち少なくともいずれか一の論理CPUが有する診断対象選択部が、前記第1の記憶装置を診断対象として選択するステップと、
    前記一の論理CPUが有する進行制御部が、前記一の論理CPUが有する診断実行部のみに、前記選択された第1の記憶装置の診断を実行させるとともに、前記第1の記憶装置の診断結果を前記第2の記憶装置に格納させるステップと、
    前記一の論理CPUが有する診断対象選択部が、前記第1の記憶装置の診断が完了した後に、前記1次キャッシュメモリを診断対象として選択するステップと、
    前記一の論理CPUが有する進行制御部が、前記選択された1次キャッシュメモリを共有する複数の論理CPUのうち前記一の論理CPUが有する診断実行部のみに、前記選択された1次キャッシュメモリの診断を排他的に実行させるとともに、前記1次キャッシュメモリの診断結果を前記第2の記憶装置に格納させるステップと、
    前記一の論理CPUが有する診断対象選択部が、前記1次キャッシュメモリの診断が完了した後に、前記2次キャッシュメモリを診断対象として選択するステップと、
    前記一の論理CPUが有する進行制御部が、前記選択された2次キャッシュメモリを共有する複数のCPUコアに含まれる複数の論理CPUのうち前記一の論理CPUが有する診断実行部のみに、前記選択された2次キャッシュメモリの診断を排他的に実行させるとともに、前記2次キャッシュメモリの診断結果を前記第2の記憶装置に格納させるステップと、
    を有することを特徴とする情報処理装置の制御プログラム。
JP2007557689A 2006-02-06 2006-02-06 情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラム Expired - Fee Related JP4576433B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/302005 WO2007091297A1 (ja) 2006-02-06 2006-02-06 情報処理装置、cpu、診断プログラムおよび診断方法

Publications (2)

Publication Number Publication Date
JPWO2007091297A1 JPWO2007091297A1 (ja) 2009-06-25
JP4576433B2 true JP4576433B2 (ja) 2010-11-10

Family

ID=38344905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007557689A Expired - Fee Related JP4576433B2 (ja) 2006-02-06 2006-02-06 情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラム

Country Status (3)

Country Link
US (1) US8090991B2 (ja)
JP (1) JP4576433B2 (ja)
WO (1) WO2007091297A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5057911B2 (ja) * 2007-09-14 2012-10-24 アルパイン株式会社 マルチプロセッサシステム
JP5714543B2 (ja) * 2012-08-23 2015-05-07 トヨタ自動車株式会社 自己監視機能を備えたコンピュータ、監視プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02311950A (ja) * 1989-05-29 1990-12-27 Fuji Electric Co Ltd マルチプロセッサシステムの自己診断方法
JPH08263463A (ja) * 1995-03-20 1996-10-11 Fujitsu Ltd プロセッサ初期診断装置及びその方法
JPH09146851A (ja) * 1995-11-16 1997-06-06 Mitsubishi Electric Corp キャッシュ・メモリ診断方法
JP2000040069A (ja) * 1998-07-24 2000-02-08 Nec Corp オンチップマルチプロセッサシステムにおける初期設定・診断方式

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4587609A (en) * 1983-07-01 1986-05-06 Honeywell Information Systems Inc. Lockout operation among asynchronous accessers of a shared computer system resource
US5448716A (en) * 1992-10-30 1995-09-05 International Business Machines Corporation Apparatus and method for booting a multiple processor system having a global/local memory architecture
US5790850A (en) * 1996-09-30 1998-08-04 Intel Corporation Fault resilient booting for multiprocessor computer systems
US6158000A (en) * 1998-09-18 2000-12-05 Compaq Computer Corporation Shared memory initialization method for system having multiple processor capability
US6574748B1 (en) * 2000-06-16 2003-06-03 Bull Hn Information Systems Inc. Fast relief swapping of processors in a data processing system
US6748556B1 (en) 2000-08-15 2004-06-08 International Business Machines Corporation Changing the thread capacity of a multithreaded computer processor
US6681345B1 (en) 2000-08-15 2004-01-20 International Business Machines Corporation Field protection against thread loss in a multithreaded computer processor
US6625698B2 (en) * 2000-12-28 2003-09-23 Unisys Corporation Method and apparatus for controlling memory storage locks based on cache line ownership
JP3891004B2 (ja) * 2002-02-26 2007-03-07 日本電気株式会社 情報処理システム及び該システムの制御方法並びにプログラム
FR2843208B1 (fr) * 2002-07-31 2005-03-04 Iroc Technologies Dispositif de reconfiguration d'un ensemble memoire presentant des defauts
US7206966B2 (en) 2003-10-22 2007-04-17 Hewlett-Packard Development Company, L.P. Fault-tolerant multi-core microprocessing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02311950A (ja) * 1989-05-29 1990-12-27 Fuji Electric Co Ltd マルチプロセッサシステムの自己診断方法
JPH08263463A (ja) * 1995-03-20 1996-10-11 Fujitsu Ltd プロセッサ初期診断装置及びその方法
JPH09146851A (ja) * 1995-11-16 1997-06-06 Mitsubishi Electric Corp キャッシュ・メモリ診断方法
JP2000040069A (ja) * 1998-07-24 2000-02-08 Nec Corp オンチップマルチプロセッサシステムにおける初期設定・診断方式

Also Published As

Publication number Publication date
US20090006893A1 (en) 2009-01-01
JPWO2007091297A1 (ja) 2009-06-25
WO2007091297A1 (ja) 2007-08-16
US8090991B2 (en) 2012-01-03

Similar Documents

Publication Publication Date Title
JP5509568B2 (ja) コンピュータ装置、プロセッサ診断方法、及びプロセッサ診断制御プログラム
JP5579354B2 (ja) 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置
US20090037888A1 (en) Simulation of program execution to detect problem such as deadlock
US7007192B2 (en) Information processing system, and method and program for controlling the same
JP2005129053A (ja) フォールトトレラント・マルチコア・マイクロプロセッシング
CN101213523A (zh) 调试辅助装置及用于在计算机中执行调试处理方法的程序
CN104067234A (zh) 原位处理器重新表征
CN104798046A (zh) 对称多处理器布置、安全关键系统及其方法
JP5641233B2 (ja) 車両データ取得システム及び車両データ取得方法
JP5293062B2 (ja) コンピュータ装置、メモリ診断方法、及びメモリ診断制御プログラム
JP4576433B2 (ja) 情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラム
JP2007299213A (ja) Raid制御装置および障害監視方法
JP2008282308A (ja) 協調検証装置、協調検証方法、協調検証プログラム
JP5849491B2 (ja) ディスク制御装置、ディスク装置異常検出方法、及びプログラム
US20060230308A1 (en) Methods and systems for conducting processor health-checks
US7607040B2 (en) Methods and systems for conducting processor health-checks
JP2020030507A (ja) マルチコア制御装置
JP5057911B2 (ja) マルチプロセッサシステム
JP2019159931A (ja) 並列化方法、並列化ツール、及びマルチコアマイコン
JPS6229820B2 (ja)
JP6024742B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び記録媒体
JP2008217665A (ja) マルチプロセッサシステム、タスクスケジューリング方法およびタスクスケジューリングプログラム
JP2010244174A (ja) Dspカード試験装置およびdspカード試験装置における故障異常情報のモニタ方法
JP2007128435A (ja) 情報処理装置、情報処理装置におけるpciカードへのアクセス方法
JP2018163539A (ja) 自己診断方法および自己診断プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100823

R150 Certificate of patent or registration of utility model

Ref document number: 4576433

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees