JP2006201881A - 情報処理装置およびシステムバス制御方法 - Google Patents

情報処理装置およびシステムバス制御方法 Download PDF

Info

Publication number
JP2006201881A
JP2006201881A JP2005010821A JP2005010821A JP2006201881A JP 2006201881 A JP2006201881 A JP 2006201881A JP 2005010821 A JP2005010821 A JP 2005010821A JP 2005010821 A JP2005010821 A JP 2005010821A JP 2006201881 A JP2006201881 A JP 2006201881A
Authority
JP
Japan
Prior art keywords
lanes
controller
information processing
pci express
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005010821A
Other languages
English (en)
Other versions
JP4558519B2 (ja
Inventor
Tomoshi Sue
智志 須江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005010821A priority Critical patent/JP4558519B2/ja
Priority to EP05252413A priority patent/EP1681632A3/en
Priority to US11/117,540 priority patent/US20060161714A1/en
Priority to CNB2005100694812A priority patent/CN100456267C/zh
Priority to KR1020050038470A priority patent/KR100725080B1/ko
Publication of JP2006201881A publication Critical patent/JP2006201881A/ja
Application granted granted Critical
Publication of JP4558519B2 publication Critical patent/JP4558519B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/382Information transfer, e.g. on bus using universal interface adapter
    • G06F13/385Information transfer, e.g. on bus using universal interface adapter for adaptation of a particular data processing system to different peripheral devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express

Abstract

【課題】ドライバやOSがPCI Express特有の機能に対応していない場合であっても、PCI Expressインターフェースのレーン数の縮退が発生した場合に適切な対処をおこなうことができる情報処理装置およびシステムバス制御方法を提供すること。
【解決手段】MMB400は、システムの初期化完了時に、Negotiated Link Widthレジスタ211cの値を参照し、この値を自身が有する記憶手段であるRAM420に記憶しておく。そして、OSやハードウェアから何らかの装置の異常の通知を受けた場合には、再度Negotiated Link Widthレジスタ211cの値を参照して、RAM420に記憶しておいた値と比較する。そして、両者の値が異なっていた場合には、レーン数の縮退が発生した旨のメッセージをコンソールに送信し、デバイスを切り離す等の所定の対応を実施する。
【選択図】 図4

Description

この発明は、情報処理装置およびシステムバス制御方法に関し、特に、ドライバやOSがPCI Express特有の機能に対応していない場合であっても、PCI Expressインターフェースのレーン数の縮退が発生した場合に適切な対処をおこなうことができる情報処理装置およびシステムバス制御方法に関するものである。
近年、プロセッサの急速な高速化にともなって、プロセッサに関連する各種インターフェースも強く高速化が求められている。たとえば、パソコン等においてプロセッサと各種デバイスとを接続するために利用されてきたPCIは、133MB/秒程度の転送速度を有しているが、この速度ではプロセッサの性能を生かすことができなくなってきている。そこで、より高速な転送速度を得ることができるPCI Expressと呼ばれる新しいインターフェースへの移行が進みつつある。
PCI Expressでは、転送速度を向上させるため、従来のパラレルインターフェースに替わってシリアルインターフェースが採用されている。シリアルインターフェースは、パラレルインターフェースのように信号間で同期をとる必要がなく、ノイズ等の影響も受け難いため、高速化に適している。PCI Expressは、500MB/秒程度の転送速度を有し、また、複数のインターフェースを束ねて利用することで、さらに高速な転送速度を得ることができるようになっている。
図1は、PCI Expressにおけるデバイスの接続方式を説明するための説明図である。同図に示すように、PCI Expressにおいては、コントローラとPCI Expressデバイス間の上下1対のインターフェースをレーンと呼ぶ。そして、コントローラとPCI Expressデバイス間を、1ないし複数のレーンで接続する構成をとる。
PCI Expressの仕様については、たとえば、非特許文献1に詳しく記載されている。PCI Expressは、従来のPCIとソフトウェア上の互換性を確保しており、PCI Express特有の機能を必要としない限りは、従来のPCIに対応したドライバやOS(Operating System)をそのまま利用できることも特徴になっている。
"PCI Express Base Specification 1.0a"、[online]、PCI-SIG、平成17年1月5日検索]、インターネット<URL:http://www.pcisig.com/specifications/pciexpress/base/>
しかしながら、従来のPCIに対応したドライバやOSをそのまま利用した場合、PCI Express経由で接続したデバイスが期待通りに動作しない場合がある。既に説明した通り、PCI Expressでは、コントローラとPCI Expressデバイス間を複数のレーンで接続して伝送速度を向上させることができるが、たとえば、本来2レーンを使って接続すべきPCI Expressデバイスが、インターフェースの故障などにより1レーンで接続されてしまったとしても、従来のPCIに対応したドライバやOSはそのまま動作してしまう。
従来のPCIでは、複数のレーンを束ねて利用するという概念が存在しないため、一部のレーンが動作せず、レーン数が縮退した状態であっても、従来のPCIに対応したドライバやOSはそのことを検出することができない。ストレージデバイスのような高速性を要求されるデバイスにおいてこのような事態が発生すると、本来の性能が得られないままシステムが動作し続けることになる。また、このように一部の故障を検出できないままシステムが動作し続けることは、故障の連鎖により大規模な障害を招く可能性もある。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、ドライバやOSがPCI Express特有の機能に対応していない場合であっても、PCI Expressインターフェースのレーン数の縮退が発生した場合に適切な対処をおこなうことができる情報処理装置およびシステムバス制御方法を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、複数のレーンからなるPCI Expressインターフェースを有する情報処理装置であって、前記PCI Expressインターフェースの制御をおこない、このインターフェースの動作状態を保持するコントローラと、情報処理装置の初期処理完了時に前記コントローラから前記PCI Expressインターフェースの動作状態を取得して記憶し、故障発生の通知をうけた場合に、記憶している動作状態と前記コントローラが保持している動作状態を比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうシステム管理装置とを備えたことを特徴とする。
また、本発明は、必要な伝送速度に応じて複数のシリアル接続回線を束ねてデバイスを接続するシステムバスインターフェースを有する情報処理装置であって、前記システムバスインターフェースの制御をおこない、このインターフェースの動作状態を保持するコントローラと、情報処理装置の初期処理完了時に前記コントローラから前記システムバスインターフェースの動作状態を取得して記憶し、故障発生の通知をうけた場合に、記憶している動作状態と前記コントローラが保持している動作状態を比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうシステム管理装置とを備えたことを特徴とする。
また、本発明は、必要な伝送速度に応じて複数のシリアル接続回線を束ねてデバイスを接続するシステムバスインターフェースを制御するシステムバス制御方法であって、情報処理装置の初期処理完了時に、前記システムバスインターフェースの制御をおこなうコントローラからインターフェースの動作状態を取得して記憶する工程と、故障発生の通知をうけた場合に、記憶している動作状態と前記コントローラが保持している動作状態を比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなう工程とを含んだことを特徴とする。
この発明によれば、レーン数の縮退を監視し、レーン数の縮退が発生した場合に対応処理をおこなう仕組みをハードウェアに設けたので、ドライバやOSがPCI Express特有の機能に対応していない場合でも、レーン数の縮退が発生した場合に適切な対応をおこなうことができる。
また、本発明は、上記の発明において、PCI Expressインターフェースに接続されたデバイスが本来接続されるべきレーン数を記憶する記憶手段をさらに備え、前記システム管理装置は、情報処理装置の初期処理完了時に、前記コントローラから前記PCI Expressインターフェースの動作状態を取得し、この情報に含まれる接続レーン数と前記記憶手段に記憶されているレーン数とを比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうことを特徴とする。
この発明によれば、PCI Expressインターフェースに接続されたデバイスが本来接続されるべきレーン数を記憶しておき、システム起動時にその通りのレーン数で接続がおこなわれたかを確認するように構成したので、レーン数が縮退したままシステムが起動することを防止することができる。
また、本発明は、上記の発明において、前記コントローラは、制御対象のPCI Expressインターフェースに係る故障が発生した場合に、前記システム管理装置に故障が発生した旨を通知する手段を備えたことを特徴とする。
この発明によれば、PCI Expressインターフェースのコントローラからシステム管理装置に対して故障発生の通知をおこなうように構成したので、ドライバやOSから故障の通知がない場合でも、レーン数の縮退等のPCI Expressインターフェースの故障をシステム管理装置が検知することができる。
また、本発明は、上記の発明において、プロセッサと前記コントローラの接続を動的に組替えることができるスイッチをさらに備え、前記システム管理装置は、レーン数の縮退が発生していることを検出した場合に、前記スイッチを制御してレーン数の縮退が発生したコントローラを動的に切り離し、プロセッサの稼動状態を継続させることを特徴とする。
この発明によれば、レーン数の縮退が発生した場合でもシステムが継続動作できるように構成したので、システムの運用と保守を柔軟におこなうことができる。
また、本発明は、上記の発明において、前記システム管理装置は、レーン数の縮退により切り離したコントローラの代替となるコントローラが実装された旨の通知を受信した場合に、プロセッサの稼動状態を継続させたままで、前記スイッチを制御して前記代替となるコントローラの組込み処理をおこなうことを特徴とする。
この発明によれば、システムが継続動作したままの状態で、レーン数が縮退したコントローラの代替コントローラを組み込むことができるように構成したので、システムの運用と保守を柔軟におこなうことができる。
また、本発明は、上記の発明において、前記システム管理装置は、プロセッサの稼動状態を継続させたままで代替となるコントローラの組込み処理をおこなう場合に、前記コントローラから前記PCI Expressインターフェースの動作状態を取得し、この情報に含まれる接続レーン数と前記記憶手段に記憶されているレーン数とを比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうことを特徴とする。
この発明によれば、PCI Expressインターフェースに接続されたデバイスが本来接続されるべきレーン数を記憶しておき、代替コントローラの組み込み時にその通りのレーン数で接続がおこなわれたかを確認するように構成したので、レーン数が縮退したままシステムが動作することを防止することができる。
本発明によれば、レーン数の縮退を監視し、レーン数の縮退が発生した場合に対応処理をおこなう仕組みをハードウェアに設けたので、ドライバやOSがPCI Express特有の機能に対応していない場合でも、レーン数の縮退が発生した場合に適切な対応をおこなうことができるという効果を奏する。
また、本発明によれば、PCI Expressインターフェースに接続されたデバイスが本来接続されるべきレーン数を記憶しておき、システム起動時にその通りのレーン数で接続がおこなわれたかを確認するように構成したので、レーン数が縮退したままシステムが起動することを防止することができるという効果を奏する。
また、本発明によれば、PCI Expressインターフェースのコントローラからシステム管理装置に対して故障発生の通知をおこなうように構成したので、ドライバやOSから故障の通知がない場合でも、レーン数の縮退等のPCI Expressインターフェースの故障をシステム管理装置が検知することができるという効果を奏する。
また、本発明によれば、レーン数の縮退が発生した場合でもシステムが継続動作できるように構成したので、システムの運用と保守を柔軟におこなうことができるという効果を奏する。
また、本発明によれば、システムが継続動作したままの状態で、レーン数が縮退したコントローラの代替コントローラを組み込むことができるように構成したので、システムの運用と保守を柔軟におこなうことができるという効果を奏する。
また、本発明によれば、PCI Expressインターフェースに接続されたデバイスが本来接続されるべきレーン数を記憶しておき、代替コントローラの組み込み時にその通りのレーン数で接続がおこなわれたかを確認するように構成したので、レーン数が縮退したままシステムが動作することを防止することができるという効果を奏する。
以下に添付図面を参照して、この発明に係る情報処理装置およびシステムバス制御方法の好適な実施の形態を詳細に説明する。
まず、本実施例に係るシステムバス制御方式を適用する情報処理装置について説明する。図2は、本実施例に係るシステムバス制御方式を適用する情報処理装置の構成を示すブロック図である。同図に示すように、情報処理装置10は、システムボード100〜103とI/Oユニット200〜203をクロスバースイッチ(XB)300を介して接続した構成をとる。また、システムボード100〜103、I/Oユニット200〜203およびクロスバースイッチ300には、これらの接続状態を制御するMMB(Management Board)400も接続される。
システムボード100〜103は、プロセッサ及びメモリを搭載したボードである。I/Oユニット200〜203は、PCI Expressデバイスなどの各種デバイスを接続するための装置である。クロスバースイッチ300は、システムボード100〜103とI/Oユニット200〜203とを接続するためのスイッチである。MMB400は、情報処理装置10に係る各種管理処理をおこなうシステム管理装置であり、システムボード100〜103とI/Oユニット200〜203との接続状態の制御もおこなう。
クロスバースイッチ300を介して接続されたシステムボードとI/Oユニットの組合せは、パーティションと呼ばれ、それぞれのパーティションは、独立したシステムのように動作する。たとえば、図2の例では、システムボード100と、I/Oユニット200とが一つのパーティションを構成し、システムボード101〜102と、I/Oユニット201〜202とがもう一つののパーティションを構成している。これらのパーティションは独立しているので、それぞれ別のOSを動作させることもできる。
なお、クロスバースイッチ300に接続されるシステムボードやI/Oユニットの数は何台であっても構わない。
次に、I/Oユニットの構成について説明する。ここでは、I/Oユニット200を例にとって説明するが、I/Oユニット201〜203も同様の構成を有する。
図3は、図2に示したI/Oユニット200の構成を示すブロック図である。同図に示すように、I/Oユニット200は、I/Oブリッジ210を有し、I/Oブリッジ210配下に各種のPCI Expressデバイスを接続する。I/Oブリッジ210は、PCI Expressデバイスとクロスバースイッチ300の間で信号の変換をおこなう装置であり、接続されるPCI Expressデバイスごとに制御レジスタを有する。また、I/Oブリッジ210は、クロスバースイッチ300との接続状態の制御を受けるためにMMB400とも接続される。
図3の例では、I/Oブリッジ210配下にオンボードデバイス220と、PCIブリッジ230と、スロット240とが接続されており、これらに対応した制御レジスタ211〜213が設けられている。オンボードデバイス220は、I/Oユニット200にオンボードで供えられたPCI Expressデバイスであり、たとえば、ネットワークインターフェース装置などがこれに相当する。PCIブリッジ230は、従来のPCIデバイスを接続するためのブリッジである。スロット240は、拡張ボードとして提供されるPCI Expressデバイスを接続するためのスロットである。
I/Oブリッジ210は、図1のコントローラに相当し、I/Oブリッジ210とオンボードデバイス220の間と、I/Oブリッジ210とPCIブリッジ230の間と、I/Oブリッジ210とスロット240の間とが、それぞれPCI Expressによって接続される構成となっている。それぞれの接続は、ポートと呼ばれ、1ないし複数のレーンからなっている。なお、I/Oブリッジ210配下に接続されるデバイスやスロットは、この例の通りである必要はなく、どのようなデバイスやスロットがいくつ接続されていても構わない。
次に、制御レジスタの構成について説明する。ここでは、制御レジスタ211を例にとって説明するが、制御レジスタ212〜213も同様の構成を有する。
図4は、図3に示した制御レジスタ211の構成を示すブロック図である。同図に示すように、制御レジスタ211は、PCI Expressの制御をおこなうための各種レジスタを有する。制御レジスタ211が有するレジスタは、大別して2種類存在する。一つは、PCI Expressの仕様を実現するためのものであり、もう一つは、レーン数の縮退を監視するためのものである。そして、これらのレジスタは、MMB400から参照および/もしくは設定が可能になっている。
Link Statusレジスタ211aと、Link Speedレジスタ211bと、Negotiated Link Widthレジスタ211cは、PCI Expressの仕様を実現するためのレジスタの一部である。Link Statusレジスタ211aは、デバイスの接続状態を保持する。Link Speedレジスタ211bは、デバイスとの間の転送速度を保持する。Negotiated Link Widthレジスタ211cは、デバイスとの接続レーン数を保持する。
MMB400は、システムの初期化完了時に、Negotiated Link Widthレジスタ211cの値を参照し、この値を自身が有する記憶手段であるRAM420に記憶しておく。そして、OSやハードウェアから何らかの装置の異常の通知を受けた場合には、再度Negotiated Link Widthレジスタ211cの値を参照して、RAM420に記憶しておいた値と比較する。そして、両者の値が異なっていた場合には、レーン数の縮退が発生した旨のメッセージをコンソールに送信し、デバイスを切り離す等の所定の対応を実施する。
このように、MMB400にレーン数の縮退の監視と対応をおこなう機能をもたせることにより、ドライバやOSがPCI Express特有の機能に対応していない場合でも、レーン数の縮退が発生した場合に適切な処理をおこなうことが可能になる。また、MMB400は、もともと各種の制御管理機能を備えているので、わずかな機能追加によってレーン数の縮退の監視と対応をおこなう機能を実現することができる。
Available Link Widthレジスタ211dと、Max Link Widthレジスタ211eと、割込Maskレジスタ211fと、Error Statusレジスタ211gは、レーン数の縮退を監視するためのレジスタである。Available Link Widthレジスタ211dには、接続されているデバイスが仕様上利用可能なレーン数が保持される。Max Link Widthレジスタ211eには、I/Oユニット側で物理的に接続可能なレーン数が保持される。
MMB400は、システムの初期化完了時に、Available Link Widthレジスタ211dとMax Link Widthレジスタ211eの値のうち小さい方の値と、Negotiated Link Widthレジスタ211cの値とを比較し、値が一致しない場合は、レーン数の縮退が発生した旨のメッセージをコンソールに送信し、システムの起動を停止させる等の対処をおこなう。
このように、本来接続されるべきレーン数をレジスタに保持しておき、システムの初期化時に本来のレーン数でデバイスが接続されたかをMMB400が確認するように構成することにより、ドライバやOSがPCI Express特有の機能に対応していない場合でも、レーン数が縮退した状態でシステムが起動することを防止することができる。なお、Available Link Widthレジスタ211dとMax Link Widthレジスタ211eの値は、システムの管理者が設定するものとしてもよいし、MMB400等が自動で設定するものとしてもよい。
割込Maskレジスタ211fは、当該のポートにおいて検出したエラーをMMB400に割り込みとして通知するか否かを設定するためのマスクである。Error Statusレジスタ211gは、当該のポートにおいてエラーが発生した場合に、エラーの内容に応じたビットが設定されるレジスタである。ポートにおいて何らかのエラーが検出されると、そのエラーの内容に応じたビットがError Statusレジスタ211gに立てられる。この値は、割込Maskレジスタ211fの値と論理積をとられ、何らかのビットが立ったままであれば、MMB400に対して割り込みが通知される仕組みとなっている。
割り込みが通知されると、MMB400は、前述のように、Negotiated Link Widthレジスタ211cの値とRAM420に記憶しておいた値と比較してレーン数の縮退が発生しているか否かを確認する。そして、レーン数の縮退が発生している場合には、そのポートに接続されているデバイスの切り離し等の対応をおこなう。
レーン数の縮退によりデバイスの切り離しをおこなった場合、そのデバイスがシステムの稼動に必須のものでない限り、システムは稼動を続ける。そして、正常なポートに正常なデバイスを接続し、MMB400を設定して、そのポートを含むI/Oユニットをパーティションに参加させることにより、システムは元の状態に復元される。このように、システムの稼動を継続したまま、システムを再構成することをダイナミックリコンフィギュレーションと呼ぶ。
ダイナミックリコンフィギュレーション実行時には、システム起動時と同様に制御レジスタが初期設定され、MMB400によってレーン数が縮退していないかどうかの確認がおこなわれる。
次に、MMBの構成について説明する。図5は、図2に示したMMB400の構成を示すブロック図である。同図に示すように、MMB400は、CPU410と、RAM420と、ネットワークコントローラ430と、フラッシュメモリー440と、リアルタイムクロック(RTC)450と、SMBUSコントローラ460a〜460eとを接続して構成される。
CPU410は、フラッシュメモリー440に記憶されたファームウェア(プログラム)を実行することで各種処理を実現するプロセッサである。RAM420は、CPU410が各種処理において利用するデータ等を一時的に記憶する記憶装置である。ネットワークコントローラ430は、ネットワークを介してコンソールと各種情報のやりとりをおこなうためのネットワークインターフェース装置である。
フラッシュメモリー440は、CPU410が実行するファームウェアや各種設定を固定的に記憶する記憶装置である。リアルタイムクロック450は、各種制御に必要な計時をおこなうための装置である。SMBUSコントローラ460a〜460eは、MMB400が制御をおこなう対象であるシステムボード100〜103と、I/Oユニット200〜203と、クロスバースイッチ300と信号のやりとりをおこなうためのインターフェース装置である。
MMB400は、フラッシュメモリー440に記憶されたファームウェアを実行し、必要に応じてデータをRAM420に記憶させたり、RAM420に記憶させたデータを読み出したりしながら各種処理を実行する。そして、SMBUSコントローラ460a〜460eを介してシステムボードやI/Oユニットやクロスバースイッチと信号のやりとりをおこなって、これらの装置の接続状態を制御する。
図6は、MMB400上で動作するファームウェアの構成を示すブロック図である。同図に示すように、ファームウェア500は、IPMI(Intelligent Platform Management Initiative)510と、OEM拡張部520とからなる。IPMI510は、サーバ装置等の情報処理装置を管理するための標準的なファームウェアである。OEM拡張部520は、IPMI510の機能を補充/拡張するために情報処理装置のベンダーが追加したファームウェアである。
OEM拡張部520は、パーティション制御部521や、スケジュール制御部522や、ファームウェア更新部523などの複数のモジュールからなる。スケジュール制御部522は、事前に設定されたスケジュールに従って各種処理を自動起動するためのモジュールである。ファームウェア更新部523は、ファームウェアの書き換えをおこなうためのモジュールである。
パーティション制御部521は、クロスバーを介してシステムボードとI/Oユニットを接続してパーティションを構成するためのモジュールである。このモジュールは、さらに、PCI Expressのポートのレーン数の縮退の監視と、縮退が発生した場合の対応の処理もおこなう。
次に、レーン数の縮退に関連して情報処理装置10がどのように動作するのかについて説明する。図7〜8は、図2に示した情報処理装置10の処理手順を示すフローチャートである。図7に示すように、システムの立上げがおこなわれると(ステップS201)、システムではBIOS(Basic Input/Output System)が起動された後(ステップS202)、診断プログラムによるPOST(Power On Self Test)が実行される(ステップS203)。そして、POSTが正常に完了すると、OSが起動され(ステップS204)、通常のシステム運用状態となる(ステップS205)。
MMB400は、システム起動後(ステップS101)、POSTの完了を待機する(ステップS102)。そして、システムからPOSTの結果が通知されると、PCI Expressポートの初期化状態を確認する。ここで、初期化が正常に完了せずにレーン数が縮退したポートを発見した場合は(ステップS103否定)、コンソールにその旨のメッセージを送信した後、システムを停止させる。
PCI Expressポートの初期化が正常に完了している場合(ステップS103肯定)、MMB400は、各ポートの接続レーン情報を制御レジスタから読出して内部の記憶手段に保持し(ステップS104)、システム監視状態に入る(ステップS105)。
システム監視状態に入ったMMB400は、I/Oユニット等のハードウェアやOS等のソフトウェアから故障が発生した旨の通知を受けると(ステップS106肯定)、各ポートの接続レーン情報を制御レジスタから読出し、内部に保持しているレーン数との比較をおこなう(ステップS107)。ここで、いずれかのポートにおいてレーン数の変化を発見した場合は(ステップS108肯定)、そのポートの切り離しをおこない、システムに対して当該のポートを切り離した旨を通知する(ステップ109)。そして、コンソールにエラー情報を送信した後(ステップS110)、システム監視状態に復帰する。
通知を受けたシステム側は、ポートの切り離しを認識して必要な処理をおこない(ステップS206)、運用状態を継続する。
図8は、ダイナミックリコンフィギュレーションにより、システムが復旧する場面の動作を示している。システムは、ポートが縮退したまま稼動している状態となっている(ステップS401)。管理者が代替のI/Oユニットを筐体に実装し、コンソールからMMB400に対してポートの組込み指示をおこなうことでダイナミックリコンフィギュレーションが実行される。
オペレータからの指示を受けたMMB400は、新規I/Oユニットの電源を投入し、システム起動時と同様の初期処理をおこなう(ステップS301)。そして、新規I/Oユニットとクロスバースイッチ300にパーティション番号を設定した後(ステップS302)、クロスバースイッチ300の設定をおこなって新規I/Oユニットからのデータ受付けを有効にし(ステップS303)、新規I/Oユニットの設定をおこなってクロスバースイッチ300へのデータ発行を有効にする(ステップS304)。
続いて、MMB400は、OSに対して新規I/Oユニットを組み込んだことを通知する(ステップS305)。通知を受けたOSは、ポート組込み処理をおこない、新規I/Oユニットを稼動状態にする(ステップS402)。こうして、システムは、ポートが復旧した状態で稼動する状態となる(ステップS403)。

上述してきたように、本実施例では、レーン数の縮退を監視し、レーン数の縮退が発生した場合に対応処理をおこなう仕組みをハードウェアに設けたので、ドライバやOSがPCI Express特有の機能に対応していない場合でも、レーン数の縮退が発生した場合に適切な対応をおこなうことができる。
以上のように、本発明にかかる情報処理装置およびシステムバス制御方法は、PCI Expressの制御に有用であり、特に、ドライバやOSがPCI Express特有の機能に対応していない場合であっても、PCI Expressインターフェースのレーン数の縮退が発生した場合に適切な対処をおこなうことが必要な場合に適している。
PCI Expressにおけるデバイスの接続方式を説明するための説明図である。 本実施例に係るシステムバス制御方式を適用する情報処理装置の構成を示すブロック図である。 図2に示したI/Oユニットの構成を示すブロック図である。 図3に示した制御レジスタの構成を示すブロック図である。 図2に示したMMBの構成を示すブロック図である。 MMB上で動作するファームウェアの構成を示すブロック図である。 図2に示した情報処理装置の処理手順を示すフローチャートである。 図2に示した情報処理装置の処理手順を示すフローチャートである。
符号の説明
10 情報処理装置
100、101、102、103 システムボード
200、201、202、203 I/Oユニット
210 I/Oブリッジ
211、212、213 制御レジスタ
211a Link Statusレジスタ
211b Link Speedレジスタ
211c Negotiated Link Widthレジスタ
211d Available Link Widthレジスタ
211e Max Link Widthレジスタ
211f 割込Maskレジスタ
211g Error Statusレジスタ
220 オンボードデバイス
230 PCIブリッジ
240 スロット
300 クロスバースイッチ(XB)
400 MMB
410 CPU
420 RAM
430 ネットワークコントローラ
440 フラッシュメモリー
450 リアルタイムクロック(RTC)
460a、460b、460c、460d、460e SMBUSコントローラ
500 ファームウェア
510 IPMI(2.0)
520 OEM拡張部
521 パーティション制御部
522 スケジュール制御部
523 ファームウェア更新部

Claims (8)

  1. 複数のレーンからなるPCI Expressインターフェースを有する情報処理装置であって、
    前記PCI Expressインターフェースの制御をおこない、このインターフェースの動作状態を保持するコントローラと、
    情報処理装置の初期処理完了時に前記コントローラから前記PCI Expressインターフェースの動作状態を取得して記憶し、故障発生の通知をうけた場合に、記憶している動作状態と前記コントローラが保持している動作状態を比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうシステム管理装置と
    を備えたことを特徴とする情報処理装置。
  2. PCI Expressインターフェースに接続されたデバイスが本来接続されるべきレーン数を記憶する記憶手段をさらに備え、
    前記システム管理装置は、情報処理装置の初期処理完了時に、前記コントローラから前記PCI Expressインターフェースの動作状態を取得し、この情報に含まれる接続レーン数と前記記憶手段に記憶されているレーン数とを比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうことを特徴とする請求項1に記載の情報処理装置。
  3. 前記コントローラは、制御対象のPCI Expressインターフェースに係る故障が発生した場合に、前記システム管理装置に故障が発生した旨を通知する手段を備えたことを特徴とする請求項1または2のいずれか一つに記載の情報処理装置。
  4. プロセッサと前記コントローラの接続を動的に組替えることができるスイッチをさらに備え、
    前記システム管理装置は、レーン数の縮退が発生していることを検出した場合に、前記スイッチを制御してレーン数の縮退が発生したコントローラを動的に切り離し、プロセッサの稼動状態を継続させることを特徴とする請求項1、2または3のいずれか一つに記載の情報処理装置。
  5. 前記システム管理装置は、レーン数の縮退により切り離したコントローラの代替となるコントローラが実装された旨の通知を受信した場合に、プロセッサの稼動状態を継続させたままで、前記スイッチを制御して前記代替となるコントローラの組込み処理をおこなうことを特徴とする請求項4に記載の情報処理装置。
  6. 前記システム管理装置は、プロセッサの稼動状態を継続させたままで代替となるコントローラの組込み処理をおこなう場合に、前記コントローラから前記PCI Expressインターフェースの動作状態を取得し、この情報に含まれる接続レーン数と前記記憶手段に記憶されているレーン数とを比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうことを特徴とする請求項5に記載の情報処理装置。
  7. 必要な伝送速度に応じて複数のシリアル接続回線を束ねてデバイスを接続するシステムバスインターフェースを有する情報処理装置であって、
    前記システムバスインターフェースの制御をおこない、このインターフェースの動作状態を保持するコントローラと、
    情報処理装置の初期処理完了時に前記コントローラから前記システムバスインターフェースの動作状態を取得して記憶し、故障発生の通知をうけた場合に、記憶している動作状態と前記コントローラが保持している動作状態を比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうシステム管理装置と
    を備えたことを特徴とする情報処理装置。
  8. 必要な伝送速度に応じて複数のシリアル接続回線を束ねてデバイスを接続するシステムバスインターフェースを制御するシステムバス制御方法であって、
    情報処理装置の初期処理完了時に、前記システムバスインターフェースの制御をおこなうコントローラからインターフェースの動作状態を取得して記憶する工程と、
    故障発生の通知をうけた場合に、記憶している動作状態と前記コントローラが保持している動作状態を比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなう工程と
    を含んだことを特徴とするシステムバス制御方法。

JP2005010821A 2005-01-18 2005-01-18 情報処理装置およびシステムバス制御方法 Expired - Fee Related JP4558519B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005010821A JP4558519B2 (ja) 2005-01-18 2005-01-18 情報処理装置およびシステムバス制御方法
EP05252413A EP1681632A3 (en) 2005-01-18 2005-04-18 Method and apparatus for monitoring a number of lanes between a controller and a PCI express device
US11/117,540 US20060161714A1 (en) 2005-01-18 2005-04-29 Method and apparatus for monitoring number of lanes between controller and PCI Express device
CNB2005100694812A CN100456267C (zh) 2005-01-18 2005-05-09 监控控制器和PCI Express设备间信道数量的方法和装置
KR1020050038470A KR100725080B1 (ko) 2005-01-18 2005-05-09 정보 처리 장치 및 시스템 버스 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005010821A JP4558519B2 (ja) 2005-01-18 2005-01-18 情報処理装置およびシステムバス制御方法

Publications (2)

Publication Number Publication Date
JP2006201881A true JP2006201881A (ja) 2006-08-03
JP4558519B2 JP4558519B2 (ja) 2010-10-06

Family

ID=36190421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005010821A Expired - Fee Related JP4558519B2 (ja) 2005-01-18 2005-01-18 情報処理装置およびシステムバス制御方法

Country Status (5)

Country Link
US (1) US20060161714A1 (ja)
EP (1) EP1681632A3 (ja)
JP (1) JP4558519B2 (ja)
KR (1) KR100725080B1 (ja)
CN (1) CN100456267C (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008046878A (ja) * 2006-08-16 2008-02-28 Fujitsu Ltd データ処理システムおよび情報処理装置
JP2009169854A (ja) * 2008-01-18 2009-07-30 Nec Corp コンピュータシステム、障害処理方法および障害処理プログラム
JP2010122762A (ja) * 2008-11-17 2010-06-03 Nec Corp 拡張カード、障害診断処理方法、情報処理装置及び障害診断処理プログラム
JP2010211739A (ja) * 2009-03-12 2010-09-24 Nec Corp 障害対応システムおよび障害対応方法
JP2011108006A (ja) * 2009-11-18 2011-06-02 Nec Corp ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置
WO2012023198A1 (ja) * 2010-08-19 2012-02-23 富士通株式会社 バス制御装置及びバス制御方法
JP5252074B2 (ja) * 2009-03-10 2013-07-31 富士通株式会社 送受信装置、データの送受信方法
US9639142B2 (en) 2014-03-31 2017-05-02 Fujitsu Limited Apparatus and method for controlling power consumption of devices performing communications between a processor and I/O devices

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8021193B1 (en) 2005-04-25 2011-09-20 Nvidia Corporation Controlled impedance display adapter
US7793029B1 (en) * 2005-05-17 2010-09-07 Nvidia Corporation Translation device apparatus for configuring printed circuit board connectors
US8332560B2 (en) * 2005-07-11 2012-12-11 Dell Products L.P. System and method for identifying inoperable connection points in a storage enclosure
US7539809B2 (en) * 2005-08-19 2009-05-26 Dell Products L.P. System and method for dynamic adjustment of an information handling systems graphics bus
CN100382064C (zh) * 2005-12-19 2008-04-16 威盛电子股份有限公司 状态协调方法
US20090006708A1 (en) * 2007-06-29 2009-01-01 Henry Lee Teck Lim Proportional control of pci express platforms
JP2011258055A (ja) * 2010-06-10 2011-12-22 Fujitsu Ltd 情報処理システム及び情報処理システムの障害処理方法
CN103646001B (zh) * 2013-12-12 2016-07-06 北京经纬恒润科技有限公司 Dma数据传输控制方法及系统
CN104170322B (zh) * 2014-04-02 2017-06-20 华为技术有限公司 一种PCIe链路故障的处理方法、设备及系统
JP6298030B2 (ja) 2015-10-28 2018-03-20 ファナック株式会社 低レイテンシと高スループットのデータ通信を両立するモータ制御装置
TWI810886B (zh) * 2022-04-11 2023-08-01 大陸商星宸科技股份有限公司 資料傳輸控制裝置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58176726A (ja) * 1982-04-09 1983-10-17 Toshiba Corp バス障害検出装置
JPH0449461A (ja) * 1990-06-19 1992-02-18 Fujitsu Ltd バスロック解除方式
JPH05173922A (ja) * 1991-12-24 1993-07-13 Nec Corp データ転送制御システム
JPH07152679A (ja) * 1993-11-29 1995-06-16 Fuji Facom Corp プロセス制御装置
JP2000293443A (ja) * 1999-04-09 2000-10-20 Nec Eng Ltd データ転送システム及びそれに用いるデータ転送方法
JP2000315197A (ja) * 1999-03-31 2000-11-14 Internatl Business Mach Corp <Ibm> 区分システム用の動的構成を備えたpciスロット制御装置
US6535939B1 (en) * 1999-11-09 2003-03-18 International Business Machines Corporation Dynamically configurable memory bus and scalability ports via hardware monitored bus utilizations
WO2004095297A2 (en) * 2003-03-25 2004-11-04 Intel Corporation A high performance serial bus testing methodology
JP2005141739A (ja) * 2003-11-06 2005-06-02 Dell Products Lp Pciエクスプレスリンクのダイナミック再構成

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774640A (en) * 1991-10-21 1998-06-30 Tandem Computers Incorporated Method and apparatus for providing a fault tolerant network interface controller
CA2064541C (en) * 1992-03-31 1998-09-15 Thomas A. Gray Cycling error count for link maintenance
US5933614A (en) * 1996-12-31 1999-08-03 Compaq Computer Corporation Isolation of PCI and EISA masters by masking control and interrupt lines
JPH1185644A (ja) * 1997-09-05 1999-03-30 Hitachi Ltd 冗長構成システムの系切替制御方法
KR100293950B1 (ko) * 1998-01-22 2001-08-07 윤종용 주변소자 내부연결 버스 모니터를 이용한 장애 감지 장치 및 방법
US6256700B1 (en) * 1999-03-30 2001-07-03 Dell Usa, L.P. Bus/port switching system and method for a computer
US6505317B1 (en) 2000-03-24 2003-01-07 Sun Microsystems, Inc. System and method for testing signal interconnections using built-in self test
JP2001298482A (ja) * 2000-04-13 2001-10-26 Nec Corp 分散型障害回復装置及びシステムと方法並びに記録媒体
US6658478B1 (en) * 2000-08-04 2003-12-02 3Pardata, Inc. Data storage system
US7035202B2 (en) * 2001-03-16 2006-04-25 Juniper Networks, Inc. Network routing using link failure information
US6918001B2 (en) * 2002-01-02 2005-07-12 Intel Corporation Point-to-point busing and arrangement
US7802049B2 (en) * 2002-10-30 2010-09-21 Intel Corporation Links having flexible lane allocation
JP4492035B2 (ja) 2003-04-21 2010-06-30 日本電気株式会社 データ処理装置
US7440396B1 (en) * 2003-11-24 2008-10-21 Cisco Technology, Inc. Determining the position of a bad link
US7293127B2 (en) * 2004-01-15 2007-11-06 Ati Technologies, Inc. Method and device for transmitting data using a PCI express port
US7844767B2 (en) * 2004-05-21 2010-11-30 Intel Corporation Method for identifying bad lanes and exchanging width capabilities of two CSI agents connected across a link
US7174412B2 (en) * 2004-08-19 2007-02-06 Genesys Logic, Inc. Method and device for adjusting lane ordering of peripheral component interconnect express
US7174411B1 (en) * 2004-12-02 2007-02-06 Pericom Semiconductor Corp. Dynamic allocation of PCI express lanes using a differential mux to an additional lane to a host
KR100853290B1 (ko) * 2004-12-14 2008-08-21 엘지전자 주식회사 휴대용 기기의 버스제어방법 및 장치

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58176726A (ja) * 1982-04-09 1983-10-17 Toshiba Corp バス障害検出装置
JPH0449461A (ja) * 1990-06-19 1992-02-18 Fujitsu Ltd バスロック解除方式
JPH05173922A (ja) * 1991-12-24 1993-07-13 Nec Corp データ転送制御システム
JPH07152679A (ja) * 1993-11-29 1995-06-16 Fuji Facom Corp プロセス制御装置
JP2000315197A (ja) * 1999-03-31 2000-11-14 Internatl Business Mach Corp <Ibm> 区分システム用の動的構成を備えたpciスロット制御装置
JP2000293443A (ja) * 1999-04-09 2000-10-20 Nec Eng Ltd データ転送システム及びそれに用いるデータ転送方法
US6535939B1 (en) * 1999-11-09 2003-03-18 International Business Machines Corporation Dynamically configurable memory bus and scalability ports via hardware monitored bus utilizations
WO2004095297A2 (en) * 2003-03-25 2004-11-04 Intel Corporation A high performance serial bus testing methodology
JP2005141739A (ja) * 2003-11-06 2005-06-02 Dell Products Lp Pciエクスプレスリンクのダイナミック再構成

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008046878A (ja) * 2006-08-16 2008-02-28 Fujitsu Ltd データ処理システムおよび情報処理装置
JP2009169854A (ja) * 2008-01-18 2009-07-30 Nec Corp コンピュータシステム、障害処理方法および障害処理プログラム
JP2010122762A (ja) * 2008-11-17 2010-06-03 Nec Corp 拡張カード、障害診断処理方法、情報処理装置及び障害診断処理プログラム
JP5252074B2 (ja) * 2009-03-10 2013-07-31 富士通株式会社 送受信装置、データの送受信方法
JP2010211739A (ja) * 2009-03-12 2010-09-24 Nec Corp 障害対応システムおよび障害対応方法
JP2011108006A (ja) * 2009-11-18 2011-06-02 Nec Corp ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置
WO2012023198A1 (ja) * 2010-08-19 2012-02-23 富士通株式会社 バス制御装置及びバス制御方法
JP5644859B2 (ja) * 2010-08-19 2014-12-24 富士通株式会社 バス制御装置及びバス制御方法
US9639142B2 (en) 2014-03-31 2017-05-02 Fujitsu Limited Apparatus and method for controlling power consumption of devices performing communications between a processor and I/O devices

Also Published As

Publication number Publication date
CN1808406A (zh) 2006-07-26
JP4558519B2 (ja) 2010-10-06
US20060161714A1 (en) 2006-07-20
EP1681632A3 (en) 2006-12-06
KR100725080B1 (ko) 2007-06-08
CN100456267C (zh) 2009-01-28
KR20060083837A (ko) 2006-07-21
EP1681632A2 (en) 2006-07-19

Similar Documents

Publication Publication Date Title
JP4558519B2 (ja) 情報処理装置およびシステムバス制御方法
US7594144B2 (en) Handling fatal computer hardware errors
US9582448B2 (en) Transmission apparatus and control unit
JP2006195821A (ja) 情報処理システムの制御方法、情報処理システム、ダイレクトメモリアクセス制御装置、プログラム
US8397053B2 (en) Multi-motherboard server system
JP5296036B2 (ja) マルチプロセッサコンピュータシステムでのdmi冗長
WO2006114822A1 (ja) Dmaコントローラ、ノード、データ転送制御方法、及びプログラム
JP2010140361A (ja) コンピュータシステム及び異常検出回路
JP2008217265A (ja) プールi/oデバイス動作確認方法、及び計算機システム
JP2007334731A (ja) Usb機器、ホスト装置、およびusb接続システム
JP6357879B2 (ja) システムおよび障害処理方法
JP2004302731A (ja) 情報処理装置および障害診断方法
JP6352627B2 (ja) コンピュータシステム及びその動作方法
JP6669979B1 (ja) 情報処理システム及び中継装置
JP6256087B2 (ja) ダンプシステムおよびダンプ処理方法
JP4633553B2 (ja) デバッグシステム、デバッグ方法およびプログラム
KR20090092707A (ko) 정보 처리 시스템, 정보 처리 시스템의 제어 방법, 및 정보처리 시스템의 제어 프로그램
US9454452B2 (en) Information processing apparatus and method for monitoring device by use of first and second communication protocols
JP5682007B2 (ja) 電子機器装置
JP6579255B1 (ja) 情報処理システム、および中継装置
CN110955629B (zh) 计算装置
JP2010244129A (ja) 計算機システム
JP4432975B2 (ja) パケット通信デバイス、パケット通信方法、およびパケット通信プログラム
JP6089543B2 (ja) 試験方法および処理装置
JP2020119098A (ja) 情報処理システム及び中継装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070803

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100720

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100721

R150 Certificate of patent or registration of utility model

Ref document number: 4558519

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees