JP6264155B2 - 情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム - Google Patents

情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム Download PDF

Info

Publication number
JP6264155B2
JP6264155B2 JP2014074257A JP2014074257A JP6264155B2 JP 6264155 B2 JP6264155 B2 JP 6264155B2 JP 2014074257 A JP2014074257 A JP 2014074257A JP 2014074257 A JP2014074257 A JP 2014074257A JP 6264155 B2 JP6264155 B2 JP 6264155B2
Authority
JP
Japan
Prior art keywords
communication
communication device
information processing
power consumption
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014074257A
Other languages
English (en)
Other versions
JP2015197732A (ja
Inventor
倫子 和久田
倫子 和久田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014074257A priority Critical patent/JP6264155B2/ja
Priority to US14/631,224 priority patent/US9639142B2/en
Publication of JP2015197732A publication Critical patent/JP2015197732A/ja
Application granted granted Critical
Publication of JP6264155B2 publication Critical patent/JP6264155B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/325Power saving in peripheral device
    • G06F1/3278Power saving in modem or I/O interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Description

本発明は、情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム
に関する。
情報処理装置に搭載された演算処理装置としてのCPU(Central Processing Unit)は、IO装置からデータを取得して処理を行う。情報処理装置では、CPUとIO装置間の通信は、その通信用のデバイス(以降「通信装置」と表記)を介して行うのが普通である。その通信装置とは、具体的には、ブリッジLSI(Large Scale Integrated circuit)、或いはスイッチLSI等である。
情報処理装置には、IO装置との間で通信を行う通信装置は、通常、複数設けられている。複数台のIO装置が接続可能な情報処理装置では、トポロジがツリー構造となるように、各通信装置が接続される。
近年、情報処理装置の消費電力を抑制する省電力化の要請が強くなっている。その要請により、消費電力が比較的に小さい通信装置にも、省電力機能が搭載されつつある。
例えばPCIe(Peripheral Components Interconnect Express)規格には、ASPM(Active-State Power Management)と呼ばれる消費電力管理機能が定義されており、リンクを介して接続されている2つの通信装置に、そのリンクの状態に応じて省電力状態に移行させることが可能である。すなわち、ASPMは、リンクの状態に応じて、消費電力を抑制させることができる。
省電力状態に通信装置を移行させた場合、リンクのレイテイシは増大する。そのため、高性能が要求されるような情報処理装置には、ASPMは常時用いるべきではない。しかし、情報処理装置の消費電力が最大若しくは最大に近づいている場合など、消費電力の抑制が要請される状況では、通信装置の消費電力をも抑制する必要がある。
特許文献1には、複数のレーンからなるPCI Expressインターフェースを有する情報処理装置であって、前記PCI Expressインターフェースの制御をおこない、このインターフェースの動作状態を保持するコントローラと、情報処理装置の初期処理完了時に前記コントローラから前記PCI Expressインターフェースの動作状態を取得して記憶し、故障発生の通知をうけた場合に、記憶している動作状態と前記コントローラが保持している動作状態を比較し、レーン数が縮退していることを検出したならば、予め決められた所定の対応処理をおこなうシステム管理装置とを備えた情報処理装置が記載されている。
特許文献2に記載の情報処理装置では、PCIeアダプタ/エンドポイント(以下、エンドポイントという)の合計最大および/または最小データ転送速度と、フロントサイド・バスに対する最大データ転送速度、即ち、フロントサイド・バスの帯域幅と、の比較に基づいてエンドポイントの操作パラメータを調整するために、2つのテーブル・データ構造がファームウェアによって利用される。第1テーブル・データ構造は、データ処理システムの各エンドポイントの帯域幅使用を制御するための操作パラメータ設定の種々の組み合わせを含む。第2テーブル・データ構造は、データ処理システムがそれらの関連した最小データ転送速度および優先順位をサポートするエンドポイントのリストを含む。第2テーブル・データ構造は、更に、どのエンドポイントがアイソクロナス要件を有するかということを指示する。
操作に関しては、搭載された機構が、所定の期間内に生じ得るエラーの閾値を設定する。エラーがその閾値を超える場合、その機構は、フロントサイド・バスがその最大データ転送速度で作動しているかどうかを決定するために、フロントサイド・バス・パフォーマンス・カウンタに照会を行う。フロントサイド・バスが最大データ転送速度で作動していない場合、その機構は、閾値を超えるエンドポイントに対するデータ転送速度の設定値を増加させる。フロントサイド・バスがそれの最大データ転送速度で作動している場合、その機構は、どのエンドポイントがアクティブであるかを決定するためにすべてのエンドポイントに照会を行う。次に、その機構は、不適切な(complaining)エンドポイントよりも低い優先順位にあるエンドポイントが存在するかどうかを決定する。そこで、その機構は、低い優先順位のエンドポイントを1ステップだけ減少させ、不適切なエンドポイントを1ステップだけ増加させる。フロントサイド・バスがそれの最大データ転送速度で作動し且つアクティブな低い優先順位のエンドポイントが存在しない場合、その機構は不適切なエンドポイントだけを切り離す。
特開2006−201881号公報 特開2009−93636号公報
1側面では、本発明は、情報処理装置に搭載された通信装置の消費電力を適切に抑制するための技術を提供することを目的とする。
本発明を適用した1システムは、複数の入出力装置に接続されることを前提とし、演算を行う演算処理装置と、複数の入出力装置と演算処理装置との間の通信をそれぞれ行う複数の通信装置と、複数の通信装置のうち、消費電力を制御可能な通信装置を特定する特定部と、特定部が特定した通信装置が複数の通信装置のうちで停止が検出された通信装置の最上流に位置している通信装置である場合に、特定部が特定した通信装置に対して、消費電力を抑制させる管理部と、を有する。
本発明を適用した場合には、情報処理装置に搭載された通信装置の消費電力を適切に抑制することができる。
本実施形態による情報処理装置の構成例を説明する図である。 CPUボードに搭載されるCPUの構成例を説明する図である。 電源管理処理のフローチャートである。 電源停止処理のフローチャートである。 UEにおけるデバイス特定処理のフローチャートである。
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。
図1は、本実施形態による情報処理装置の構成例を説明する図である。本実施形態による情報処理装置1は、例えばデータセンタに構築された情報処理システムを構成する情報処理装置である。この情報処理装置1は、並列計算機を構成するノードとして用いることも可能であり、図1に表すように、CPUボード2、IOボード3、IOサブボード4、及び制御用ボード5を備えている。
CPUボード2は、複数のCPU20(20−0、20−1)が実装されたボードである。CPUボード2には、他に、メモリ(メモリモジュール)、及びファームウェアを格納したFWH(Firm-Ware Hub)等が実装されている。
図2は、CPUボードに搭載されるCPUの構成例を説明する図である。
図2に構成例を表すCPU20は、4つのCPUコア201、2つのメモリコントローラ202、インターコネクトコントローラ203、及びIOコントローラ21を備える。図2に表す構成例は一例であり、CPU20の構成は図2に表す例に限定されない。また、図2には、主要な構成要素のみを表しており、2次キャッシュ、及び2次キャッシュコントローラ等は図示を省略している。
各メモリコントローラ202は、何れかのCPUコア201の制御に従い、CPU20に接続された何れかのメモリ210にアクセスする。それにより、各CPUコア201は、メモリコントローラ202を介して、何れかのメモリ210へのデータの書き込み、或いはデータの読み出しを行う。
並列計算機を構成する複数のノードは、専用のコンピュータネットワークであるインターコネクトによって接続される。図2中に220を付して表記の「Tofu」は、6次元メッシュ/トーラスのインターコネクトであるTorus Fusionの略記である。インターコネクトコントローラ203は、Tofu220を介した他の情報処理装置(ノード)1とのデータ通信を実現させる。
IOコントローラ21は、情報処理装置1内部のデータの入出力を管理する。IOコントローラ21には、ブリッジ22、及びPCI express Root Complex(以降「ルートコンプレックス」と表記)23が搭載されている。
PCIe(PCI express)では、階層化されたツリー構造となる形で各通信装置が接続されるのが普通である。ルートコンプレックス23は、階層の根幹(ルート)となる通信装置である。ブリッジ22は、CPUコア201とルートコンプレックス23間で必要なプロトコル変換を行う。
IOボード3は、各種IOデバイスを接続可能にする。そのために、IOボード3には、2つのPCI express Switch(以降「スイッチ」と略記)31(31−0、31−1)、及びPCI express Adaptor(以降「アダプタ」と略記)35が実装されている。
スイッチ31−0は、2つのポート32(32−0、32−1)が内部バス33により接続されたスイッチである。ポート32−0はCPU20−0のIOコントローラ21内のルートコンプレックス23と接続され、ポート32−1はアダプタ35と接続されている。アダプタ35は、エンドポイントであり、スロット36内に挿入されることでIOボード3に搭載されている。
アダプタ35には、IO装置用のスイッチ6が接続されている。このスイッチ6は、例えば外部ファイル装置(外部記憶装置)等との接続を想定したスイッチである。アダプタ35にスイッチ6を接続させることにより、1台以上のIO装置を情報処理装置1に追加させることができる。
スイッチ31−1は、3つのポート32(32−2〜32−4)が内部バス33により接続されたスイッチである。ポート32−2はCPU20−1のIOコントローラ21と接続され、ポート32−3、及び32−4はIOサブボード4上のSATA(Serial AT Attachment)コントローラ41、及びイーサネット(Ethernet)コントローラ42と接続されている。SATAコントローラ41、及びイーサネットコントローラ42はエンドポイントである。
IOサブボード4は、IO装置を搭載可能なボードである。図1中にIO装置43として表記の「device」は、例えばOS(Operating System)、及び各種アプリケーション・プログラム(以降「アプリケーション」と略記)等を格納したハードディスク装置、或いはSSD(Solid State Drive)等の記憶装置である。そのIO装置43は、SATAコントローラ41に接続されている。
イーサネットコントローラ42には、ハブ(hub)7が接続されている。情報処理装置1を制御、或いは管理のためのコンソール(端末装置)等は、ハブ7に接続して用いることができる。
制御用ボード5は、情報処理装置1全体を管理する管理装置であるサービスプロセッサ50が実装されたボードである。このサービスプロセッサ50は、本実施形態による管理装置が実行されたコンピュータであり、例えばMPU(Micro-Processing Unit)51、フラッシュメモリ52、及びメモリ53を備えた構成である。
MPU51は、制御用の専用信号81が接続されるインターフェースを備えている。
専用信号81には、他に各CPU20、各スイッチ31、アダプタ35、SATAコントローラ41、及びイーサネットコントローラ42に接続されている。MPU51は、専用信号81を介し、各CPU20、各スイッチ31、アダプタ35、SATAコントローラ41、及びイーサネットコントローラ42のメンテナンス用資源にアクセスし、必要な情報を収集する。また、各CPU20、各スイッチ31、アダプタ35、SATAコントローラ41、及びイーサネットコントローラ42は、専用信号を介して、各種エラー通知のための割り込みをサービスプロセッサ50に行うか、CPU20がソフトウェアにエラー通知の割り込みを行いソフトウェアからサービスプロセッサ50へエラーを通知する。
フラッシュメモリ52には、MPU51が実行するファームウェアが格納されている。MPU51は、ファームウェアを実行することにより、通信装置の消費電力の抑制を含む各種管理を行う。
各CPU20のIOコントローラ21に実装されたルートコンプレックス23、各スイッチ31、アダプタ35、SATAコントローラ41、及びイーサネットコントローラ42は、IO装置を接続させるための通信装置(PCIeデバイス)である。サービスプロセッサ50は、状況の変化に応じて、これらの通信装置の消費電力を抑制するための制御を行う。
各CPU20は、電源オン、或いはシステムリセット等により、FWHに格納されたファームウェアを起動させ、初期化を行う。その初期化時に、各CPU20は、通信装置の接続関係(トポロジ)を認識する。この認識結果として得られる、各通信装置間の接続関係を表す接続情報53aは、例えば各CPU20から専用信号81を介してサービスプロセッサ50に送信され、サービスプロセッサ50のメモリ53に保存される。サービスプロセッサ50は、保存した接続情報53aを用いて、通信装置の消費電力を抑制するための制御を行う。
本実施形態では、通信装置の消費電力を抑制する制御を行う契機となる状況の変化として、障害の発生を想定している。ここでは、便宜的に、障害として、通信装置の停止、及びエラーの発生のみを想定する。
各通信装置は、AER(Advanced Error Reporting)機能を備えている。このAER機能は、PCIeデバイス向けに拡張エラーレポートを提出する機能である。AER機能を実装した通信装置は、各種検出結果をまとめた情報(以降「AERテーブル」と表記する)を記憶部に保持している。図2に表記の26、32a、35a、41a、及び42aは、AERテーブルが格納される記憶部である。ここでは、記憶部を有する通信装置を特定する必要のない場合、記憶部に符号を付さないこととする。
AERテーブルは、複数のレジスタを含む。レジスタには、アンコレクタブルエラーに係わる情報が格納されるレジスタ(以降「アンコレクタブル・エラー・レジスタ」と表記)が含まれる。このアンコレクタブル・エラー・レジスタにステータスが表されるアンコレクタブルエラーとしては、Poisoned TLP、Unexpected Completion、ECRC Error、Unsupported Request、Malformed TLP、及びFlow Control Protocol Error等がある。これらのエラーは何れも、対象となる部品の交換が必要なエラーである。そのため、本実施形態では、何れかのエラーを検出した通信装置は停止対象としている。
CPU20のIOコントローラ21内に実装された通信装置以外の通信装置は、アンコレクタブルエラーを検出した場合、その旨をCPU20に割り込みを介して通知する。サービスプロセッサ50へのアンコレクタブルエラーの通知は、CPU20、及びアンコレクタブルエラーを検出した通信装置の何れに行わせても良い。ここでは便宜的に、アンコレクタブルエラーを検出した通信装置は、そのアンコレクタブルエラーの検出をサービスプロセッサ50に直接、通知すると想定する。
アンコレクタブルエラーの検出は、割り込みによってサービスプロセッサ50に通知される。サービスプロセッサ50は、割り込みによってアンコレクタブルエラーの検出が通知された場合、専用信号81を介して、割り込みを行った通信装置の記憶部にアクセスし、アンコレクタブル・エラー・レジスタの情報を取得する。それにより、サービスプロセッサ50は、発生したアンコレクタブルエラーのエラー種別を特定し、特定したエラー種別、及び割り込みを行った通信装置に応じて、消費電力を抑制するための制御を行う。
上記接続情報53aは、消費電力を抑制すべき範囲の特定に用いられる。サービスプロセッサ50は、エラー種別、及び割り込みを行った通信装置から、実際にアンコレクタブルエラーが発生した可能性が考えられる通信装置の候補を被疑個所として選択する。停止対象通信装置は、被疑個所のなかから1つ選択される。
アンコレクタブルエラーは、実際に通信を行うことで検出される。そのため、実際にアンコレクタブルエラーが発生した通信装置は、データの送信側、データの受信側、及びその両方のうちの何れかとなる。このことから、被疑個所として、データの送信側、及びデータの受信側の2つの通信装置が選択される。2つの通信装置のうちの一方は、アンコレクタブルエラーを検出した通信装置である。
2つの通信装置が同時に故障する確率は低いと考えられる。また、停止対象通信装置がより上流側に位置するほど、消費電力の抑制範囲は広くなりやすく、停止対象通信装置の選択結果が誤っていた場合のペナルティも大きくなりやすい。このようなことから、本実施形態では、停止対象通信装置は被疑個所とする2つの通信装置のうちの下流側(ルートコンプレックス23から見て、より離れた側)に位置する方としている。
停止対象の通信装置を選択(特定)した後、サービスプロセッサ50は、接続情報53aを参照し、選択した停止対象通信装置から、消費電力を抑制する範囲を特定し、特定した範囲内に存在する通信装置の消費電力を抑制する。消費電力を抑制する範囲は、その消費電力の抑制による悪影響を発生させることなく、且つ発生したアンコネクタブルエラーが影響を及ぼす範囲である。その消費電力の抑制による影響を受けるIO装置の消費電力を制御可能であれば、消費電力を制御可能なIO装置も消費電力を抑制する範囲に含まれる。消費電力を抑制する範囲内に存在する通信装置やIO装置の消費電力を抑制させるため、情報処理装置1に要求されるパフォーマンス等に係わらず、情報処理装置1の消費電力を適切に削減させることができる。
PCIe仕様で規定される基準クロックを出力するために、CPUボード上にそれぞれのルートコンプレックスごとへ供給するクロック発生回路25を搭載している。
CPUにはルートコンプレックスの他にメモリやインターコネクトコントローラも内蔵されており、その部分へ供給されるクロックと、ルートコンプレックスへ供給される基準クロックは分かれている。
ルートコンプレックス23への基準クロックの出力を停止させることにより、CPU内の演算機能を止めることはなく、ルートコンプレックス23部分のみ通信装置の消費電力は低減する。本実施形態では、特定した範囲内にルートコンプレックス23が含まれている場合、そのルートコンプレックス23への基準クロックの出力を停止させるようにしている。また、特定した範囲内に存在するルートコンプレックス23以外の通信装置、具体的にはスイッチ31、アダプタ35、SATAコントローラ41、及びイーサネットコントローラ42は、電源、つまり電力供給を停止させるようにしている。そのようにして、本実施形態では、ルートコンプレックス23以外の通信装置は、通信装置単位で電源を停止させ、消費電力をより抑制できるようにしている。
通信装置単位の電源の停止は、例えば通信装置に内蔵されている電源回路(例えばDC(Direct Current)−DCコンバータ)のオン/オフをサービスプロセッサ50に行わせることで実現させることができる。専用信号81は、サービスプロセッサ50が各通信装置の消費電力を制御するためにも用いられる。なお、通信装置単位の電源の停止は、電源回路以外を制御して行っても良い。例えば通信装置への電力供給を停止させることで行っても良い。電源の停止は、スイッチ31のポート32単位で行うようにしても良い。ポート32単位で電源を停止できるようにした場合には、消費電力の抑制はより細かく制御することができる。
ここで、図1に表す構成例を参照し、被疑個所によって特定される消費電力の抑制範囲について具体的に説明する。
図1に表す構成例では、停止対象通信装置がCPU20−0のルートコンプレックス23、スイッチ31−0の何れかのポート32、或いはアダプタ35であった場合、消費電力の抑制範囲は、それらを全て含む範囲となる。そのため、CPU20−0のルートコンプレックス23のクロック発生回路25は停止され、スイッチ31−0、及びアダプタ35の電源は停止される。
停止対象通信装置がCPU20−1のルートコンプレックス23、スイッチ31−1のポート32−2であった場合、消費電力の抑制範囲は、そのルートコンプレックス23、及び下流側の全てを含む範囲となる。そのため、CPU20−1のルートコンプレックス23のクロック発生回路25は停止され、スイッチ31−1、SATAコントローラ41、イーサネットコントローラ42、及びIO装置43の電源は全て停止される。
停止対象通信装置がスイッチ31−1のポート32−3、或いはSATAコントローラ41であった場合、消費電力の抑制範囲は、そのSATAコントローラ41、及びその下流側の全てを含む範囲となる。そのため、SATAコントローラ41、及びIO装置43の電源は全て停止される。
停止対象通信装置がスイッチ31−1のポート32−4、或いはイーサネットコントローラ42であった場合、消費電力の抑制範囲は、そのイーサネットコントローラ42のみの範囲となる。そのため、イーサネットコントローラ42の電源のみが停止される。
本実施形態では、アンコレクタブルエラー以外のエラーの発生(検出)により、消費電力の抑制を行うようにしている。
現在、PCIe規格に沿った通信が可能な通信装置のなかには、転送速度を自動的に調整可能な通信装置がある。本実施形態では、予め設定された転送速度(バンド幅)よりも低速な転送速度への調整、つまりバンド幅が劣化するエラーの発生(検出)を契機に、必要に応じて消費電力の抑制を行うようにしている。
通信装置通信装置のダウンストリームポートは、バンド幅の劣化を検出した場合、その旨をCPU20、及びサービスプロセッサ50に通知する。バンド幅の劣化が通知されたサービスプロセッサ50は、2つの通信装置に、一定値(以降「閾値」と表記)を上限にリトレーニングを行わせ、性能が回復、つまりバンド幅が回復したか否かの確認を行う。
リンクに一時的な性能劣化が発生した場合、リトレーニングによりバンド幅は回復し、例えば最大転送速度、最大レーン数でリンクアップすると期待できる。このことから、本実施形態では、バンド幅が回復しない場合、リンクに接続されている2つの通信装置のうちの一方に固定故障が発生しているとみなし、消費電力の抑制を行うようにしている。被疑個所は、リンクに接続されている2つの通信装置であり、停止対象通信装置は、アンコレクタブルエラーの検出時と同様の理由から、被疑個所のなかで下流側に位置する通信装置である。
リンクの性能が劣化していたとしても、通信自体は可能である。このことから、本実施形態では、リンクの性能の劣化により消費電力を抑制するか否かの判定は、その判定用の情報(以降「継続可否情報」と表記)53bに従って行うようにしている。その継続回避情報53bは、例えばリンク毎に、性能の劣化を固定故障として扱うか否かを表す情報であり、例えばハブ7に直接、或いは間接的に接続されるコンソール等の端末装置を用いてサービスプロセッサ50に保持される。図2では、継続可否情報53bをメモリ53内に表しているが、その継続可否情報53bの保存にはフラッシュメモリ52も用いられる。
性能の劣化を固定故障として扱う場合に特定される消費電力の抑制範囲は、アンコレクタブルエラーの検出時と同様である。
性能が回復しないリンクに接続されている2つの通信装置のうちの一方に固定故障が発生しているとみなし、消費電力の抑制を行うことにより、情報処理装置1の消費電力はより低減させることができる。継続可否情報53bにより、性能が回復しないリンクのなかで通信に用いるべきリンクは継続して通信に用いられる。このようなことから、抑制すべき消費電力のみを適切に抑制することになる。
通信装置の停止(異常停止)は、上流側、若しくは下流側に位置する通信装置によって検出されるか、或いはサービスプロセッサ50によって直接的に検出される。停止した通信装置は、停止対象通信装置として扱われ、消費電力の抑制範囲が特定される。
停止した通信装置を介したCPU20とIO装置間の通信は不可能である。そのため、停止した通信装置から特定される消費電力の抑制範囲内の消費電力を抑制させたとしても不具合は発生しない。
サービスプロセッサ50は、エラー検出時、或いは停止した通信装置の検出時、図3にフローチャートを表す電源管理処理を実行することにより、消費電力の抑制を行う。次に図3を参照し、消費電力の抑制のためのサービスプロセッサ50の動作について、より詳細に説明する。
図3にフローチャートを表す電源管理処理は、アンコレクタブルエラー、若しくは性能の劣化(バンド幅の劣化)の通知、或いは停止した通信装置の検知を契機に、サービスプロセッサ50が実行する処理である。その電源管理処理は、サービスプロセッサ50のMPU51が、フラッシュメモリ52のファームウェアを実行することで実現される。
先ず、サービスプロセッサ50は、停止した通信装置が検知されたか否か判定する(S1)。通信装置の停止が別の通信装置から通知されるか、或いはサービスプロセッサ50自身が通信装置の停止を認識した場合、S1の判定はYesとなってS2に移行する。新たに停止した通信装置が存在しない場合、S1の判定はNoとなってS3に移行する。
S2では、サービスプロセッサ50は、消費電力の抑制範囲を特定し、特定した抑制範囲内の消費電力を抑制するための電源停止処理を実行する。その電源停止処理を実行した後、電源管理処理が終了する。
S3では、サービスプロセッサ50は、リンクの性能の劣化(バンド幅の劣化)が通知されたか否か判定する。バンド幅の劣化が通知された場合、S3の判定はYesとなってS4に移行する。バンド幅の劣化が通知されていない場合、S3の判定はNoとなってS10に移行する。
上記のように、本実施形態では、バンド幅の劣化が検出されたリンクに接続されている2つの通信装置に対し、閾値を上限に、バンド幅の劣化を回復させるためのリトレーニング(図3中「回復処理」及び「PCIe LINK retrain処理」と表記)を行わせる。そのリトレーニングは、S4に移行することで行われる。
S4では、サービスプロセッサ50は、バンド幅の劣化が検出されたリンクに接続されている2つの通信装置に対し、リトレーニングを行わせる。次にサービスプロセッサ50は、リトレーニングの結果を確認し、バンド幅が期待するレベルに回復したか否か判定する(S5)。バンド幅が期待するレベルに回復した場合、S5の判定はYesとなり、ここで電源管理処理が終了する。一方、バンド幅が期待するレベルにまで回復しなかった場合、S5の判定はNoとなってS6に移行する。
S6では、サービスプロセッサ50は、リトレーニングを行わせた回数が閾値以下か否か判定する。閾値分のリトレーニングを行わせた場合、S6の判定はNoとなってS7に移行する。閾値分のリトレーニングを行わせていない場合、S6の判定はYesとなってS4に戻る。それにより、サービスプロセッサ50は再度、リトレーニングを行わせる。
S7では、サービスプロセッサ50は、継続可否情報53bを参照し、バンド幅が劣化したリンクに、そのバンド幅の劣化を固定故障として扱うと設定されているか否か判定する。バンド幅の劣化を固定故障として扱わないと設定、つまり動作継続オプションが付いている場合、S7の判定はYesとなり、ここで電源管理処理が終了する。この結果、バンド幅が劣化したリンクは、バンド幅が劣化したまま使用されることとなる。一方、バンド幅の劣化を固定故障として扱うと設定、つまり動作継続オプションが付いていない場合、S7の判定はNoとなってS8に移行する。
S8では、サービスプロセッサ50は、被疑個所として、バンド幅が劣化したリンクに接続されている2つの通信装置を選択する。選択される2つの通信装置のうちの1つは、バンド幅の劣化を検知した通信装置であり、もう1つは、その通信装置とリンクを介して接続されている通信装置(図3中「対向デバイス」と表記)である。
S8に続くS9では、サービスプロセッサ50は、被疑個所のうち、下流側(下方)に位置する通信装置を停止対象通信装置(図3中「停止が通知されたデバイス」と表記)に決定する。その後、上記S2に移行する。
上記S3の判定がNoとなって移行するS10では、サービスプロセッサ50は、アンコレクタブルエラー(図3中「UE」と表記)が通知されたか否か判定する。何らかのアンコレクタブルエラーが通知された場合、S10の判定はYesとなってS11に移行する。何れのアンコレクタブルエラーも通知されていない場合、S10の判定はNoとなり、ここで電源管理処理が終了する。
S11では、サービスプロセッサ50は、通知されたアンコレクタブルエラーで停止対象通信装置を特定するためのUEにおけるデバイス特定処理を実行する。その実行後、上記S2に移行する。
図4は、S2で実行される電源停止処理のフローチャートである。次に図4を参照し、電源停止処理について詳細に説明する。
停止が通知された通信装置、及び停止対象通信装置の下流側は全て、消費電力を抑制する対象となる。このことから、消費電力の抑制範囲は、停止が通知された通信装置、或いは停止対象通信装置の上流側の範囲を特定することで決定される。
先ず、サービスプロセッサ50は、停止を通知された通信装置をAとする(S21)。次にサービスプロセッサ50は、Aと接続された、Aの一つ上流側(上位)の通信装置をBとする(S22)。その後、サービスプロセッサ50は、BにA以外の通信装置がリンクにより接続されているか否か判定する(S23)。BにA以外の通信装置が接続されている場合、S23の判定はYesとなってS25に移行する。BにA以外の通信装置が接続されていない場合、S23の判定はNoとなってS24に移行し、Bを新たにAとする。その後は上記S22に戻る。それにより、S22〜S24によって形成される処理ループは、停止を通知された通信装置、或いは停止対象通信装置を起点に、消費電力の抑制による影響が発生しない上流側の範囲の探索を実現させる。
最上流に位置する通信装置は、ルートコンプレックス23であり、ルートコンプレックス23より上流側には対象となる通信装置は存在しない。このことから、Bがルートコンプレックス23であった場合、S23の判定はYesとなる。
S25では、サービスプロセッサ50は、消費電力の抑制範囲(図3中「電源停止可能範囲」と表記)を特定する。その抑制範囲は、A、及びそのAの下流側に存在する全ての通信装置(場合によってはIO装置を含む)である。
S25に続くS26では、サービスプロセッサ50は、Bはルートコンプレックス23か否か判定する。Bがルートコンプレックス23であった場合、S26の判定はYesとなってS27に移行する。Bがルートコンプレックス23でない場合、S26の判定はNoとなってS28に移行する。
S27では、サービスプロセッサ50は、Bであるルートコンプレックス23へ供給する基準クロックの出力を停止させる。次に、サービスプロセッサ50は、A、及びそのAの下流側に位置する全ての通信装置の電源を停止させる。そのようにして、特定した消費電力の抑制範囲内に存在する通信装置の消費電力の抑制を行った後、この電源停止処理が終了する。
図5は、図3に表す電源管理処理内でS11として実行されるUEにおけるデバイス特定処理のフローチャートである。最後に図5を参照し、UEにおけるデバイス特定処理について詳細に説明する。
先ず、サービスプロセッサ50は、被疑個所の候補を特定する(S31)。ここで被疑個所の候補として特定される通信装置は、アンコレクタブルエラーを検知した通信装置(図5中「検知デバイス」と表記)、その通信装置と対向する通信装置、及びパケットを送信した通信装置である。
次に、サービスプロセッサ50は、エラーを検知した通信装置にAER機能が実装されているか否か判定する(S32)。エラーを検知した通信装置にAER機能が実行されている場合、S32の判定はYesとなってS33に移行する。その通信装置にAER機能が実装されていない場合、S32の判定はNoとなってS36に移行する。
S33では、サービスプロセッサ50は、エラー種別はPoisoned TLP、Unexpected Completion、ECRC Error、及びUnsupported Requestのうちの何れかであるか否か判定する。この判定処理は、エラーを検知した通信装置としてルートコンプレックス23、及びエンドポイントを想定した処理である。そのため、エラーを検知した通信装置がルートコンプレックス23、或いはエンドポイントであり、且つエラー種別が該当している場合、S33の判定はYesとなってS34に移行する。エラーを検知した通信装置がルートコンプレックス23、及びエンドポイントの何れでもないか、或いはエラー種別が該当していない場合、S33の判定はNoとなってS36に移行する。
S34では、サービスプロセッサ50は、被疑個所として、エラーを検知した通信装置a、及びパケットを送信した通信装置b(ここではルートコンプレックス23、及びIO装置が含まれる)を特定する。次に、サービスプロセッサ50は、被疑個所として特定した通信装置a、及び通信装置bのなかで、より下流に位置する通信装置を停止対象通信装置(図5中「停止を通知されたデバイス」と表記)とする(S35)。その後、このUEにおけるデバイス特定処理が終了する。
上記S32、或いはS33の判定がNoとなって移行するS36では、サービスプロセッサ50は、被疑個所として、エラーを検知した通信装置a、及びその通信装置と対向する通信装置bを特定する。その後、上記S35に移行する。
S35で特定された停止対象通信装置は、図4に表す電源停止処理の実行時、停止を通知されたデバイスとして扱われる。それにより、エラー種別、及び通信装置の停止等に係わらず、消費電力の抑制範囲は特定される。
なお、本実施形態では、エラーの発生、或いは通信装置の停止による状況の変化を契機に、消費電力の抑制を行うようにしているが、消費電力の抑制を行う契機は状況の変化以外であっても良い。例えばCPU20は、初期化時に、通信装置(エンドポイント)に接続されているIO装置を認識する。IO装置の認識により、CPU10とIO装置間の通信に使用されない通信装置を特定することができる。CPU20とIO装置との間の通信に用いられない通信装置の電源を停止させても、不具合は発生しない。このことから、CPU20による初期化(IO装置の認識)を契機に、消費電力の抑制を行うようにしても良い。通信に使用されない通信装置の特定は、接続される可能性があるエンドポイント(必要に応じてポートを含む)を予め設定し、IO装置の認識結果の他に、設定を反映させて行うようにしても良い。このようなことからも、様々な変形を行うことができる。
本実施形態では、PCIe規格に対応した通信装置を消費電力の抑制対象としている。消費電力の抑制対象とする通信装置が対応の規格はPCIe規格に限定されない。規格の数も1つだけに限定されない。
また、本実施形態では、サービスプロセッサ50に通信装置を対象にした消費電力の抑制を行わせているが、その消費電力の抑制は別のコンピュータに行わせても良い。必要な情報の取得、及び消費電力の抑制のための制御が外部から可能にした場合、情報処理装置1の外部に存在するコンピュータを管理装置として用いても良い。
上記以外にも、様々な変形を行うことができる。
以上の変形例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
複数の入出力装置に接続される情報処理装置において、
演算を行う演算処理装置と、
前記複数の入出力装置と前記演算処理装置との間の通信をそれぞれ行う複数の通信装置と、
前記複数の通信装置のうち、消費電力を制御可能な通信装置を特定する特定部と、
前記特定部が特定した通信装置に対して、消費電力を抑制させる管理部と、
を有することを特徴とする情報処理装置。
(付記2)
前記特定部は、
前記複数の通信装置のいずれかにおけるエラーの発生、又は、前記複数の入出力装置におけるエラーの発生に基づき、消費電力を制御可能な通信装置を特定することを特徴とする付記1記載の情報処理装置。
(付記3)
前記特定部は、
前記複数の通信装置のいずれかに接続された入出力装置の認識ができない場合、消費電力を制御可能な通信装置を特定することを特徴とする付記1又は2記載の情報処理装置。
(付記4)
前記管理部は、
前記特定部が特定した通信装置のなかで電源を停止可能な通信装置の電源を停止させる ことを特徴とする付記1、2又は3記載の情報処理装置。
(付記5)
複数の入出力装置に接続されるとともに、演算を行う演算処理装置と、前記複数の入出力装置と前記演算処理装置との間の通信をそれぞれ行う複数の通信装置とを備える情報処理装置に用いられ、
前記複数の通信装置のうち、消費電力を制御可能な範囲を特定する特定部と、
前記特定部が特定した通信装置に対して、消費電力を制御する管理部と、
を有することを特徴とする管理装置。
(付記6)
複数の入出力装置に接続されるとともに、演算を行う演算処理装置と、前記複数の入出力装置と前記演算処理装置との間の通信をそれぞれ行う複数の通信装置とを備える情報処理装置の制御方法において、
前記情報処理装置が有する特定部が、前記複数の通信装置のうち、消費電力を制御可能な通信装置を特定し、
前記情報処理装置が有する管理部が、特定された前記通信装置に対して、消費電力を抑制することを特徴とする情報処理装置の制御方法。
(付記7)
複数の入出力装置に接続されるとともに、演算を行う演算処理装置と、前記複数の入出力装置と前記演算処理装置との間の通信をそれぞれ行う複数の通信装置とを備える情報処理装置の制御プログラムにおいて、
前記情報処理装置が有する特定部に、前記複数の通信装置のうち、消費電力を制御可能な通信装置を特定させ、
前記情報処理装置が有する管理部が、特定された前記通信装置に対して、消費電力を抑制させることを特徴とする情報処理装置の制御プログラム。
1 情報処理装置
2 CPUボード
3 IOボード
4 IOサブボード
5 制御用ボード
20、20−0、20−1 CPU
21 IOコントローラ
23 ルートコンプレックス
25 クロック発生回路
26、32a、41a、42a 記憶部
31、31−0、31−1 スイッチ
32、32−0〜32−4 ポート
35 アダプタ
41 SATAコントローラ
42 イーサネットコントローラ
43 IO装置
50 サービスプロセッサ
51 MPU
52 フラッシュメモリ
53 メモリ
53a 接続情報
53b 継続可否情報

Claims (3)

  1. 複数の入出力装置に接続される情報処理装置において、
    演算を行う演算処理装置と、
    前記複数の入出力装置と前記演算処理装置との間の通信をそれぞれ行う複数の通信装置と、
    前記複数の通信装置のうち、消費電力を制御可能な通信装置を特定する特定部と、
    前記特定部が特定した通信装置が前記複数の通信装置のうちで停止が検出された通信装置の最上流に位置している通信装置である場合に、前記特定部が特定した通信装置に対して、消費電力を抑制させる管理部と、
    を有することを特徴とする情報処理装置。
  2. 複数の入出力装置に接続されるとともに、演算を行う演算処理装置と、前記複数の入出力装置と前記演算処理装置との間の通信をそれぞれ行う複数の通信装置とを備える情報処理装置の制御方法において、
    前記情報処理装置が有する特定部が、前記複数の通信装置のうち、消費電力を制御可能な通信装置を特定し、
    前記特定部が特定した通信装置が前記複数の通信装置のうちで停止が検出された通信装置の最上流に位置している通信装置である場合に、前記情報処理装置が有する管理部が、特定された前記通信装置に対して、消費電力を抑制させることを特徴とする情報処理装置の制御方法。
  3. 複数の入出力装置に接続されるとともに、演算を行う演算処理装置と、前記複数の入出力装置と前記演算処理装置との間の通信をそれぞれ行う複数の通信装置とを備える情報処理装置の制御プログラムにおいて、
    前記情報処理装置が有する特定部に、前記複数の通信装置のうち、消費電力を制御可能な通信装置を特定させ、
    前記特定部が特定した通信装置が前記複数の通信装置のうちで停止が検出された通信装置の最上流に位置している通信装置である場合に、前記情報処理装置が有する管理部、特定された前記通信装置に対して、消費電力抑制を行わせることを特徴とする情報処理装置の制御プログラム。
JP2014074257A 2014-03-31 2014-03-31 情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム Expired - Fee Related JP6264155B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014074257A JP6264155B2 (ja) 2014-03-31 2014-03-31 情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム
US14/631,224 US9639142B2 (en) 2014-03-31 2015-02-25 Apparatus and method for controlling power consumption of devices performing communications between a processor and I/O devices

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014074257A JP6264155B2 (ja) 2014-03-31 2014-03-31 情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム

Publications (2)

Publication Number Publication Date
JP2015197732A JP2015197732A (ja) 2015-11-09
JP6264155B2 true JP6264155B2 (ja) 2018-01-24

Family

ID=54190263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014074257A Expired - Fee Related JP6264155B2 (ja) 2014-03-31 2014-03-31 情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム

Country Status (2)

Country Link
US (1) US9639142B2 (ja)
JP (1) JP6264155B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6264155B2 (ja) * 2014-03-31 2018-01-24 富士通株式会社 情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム
CN107102638B (zh) * 2017-06-28 2019-07-16 爱普(福建)科技有限公司 Io点通信范围的检测方法、插件及计算机可读介质
CN108494845B (zh) * 2018-03-14 2020-12-22 曙光信息产业(北京)有限公司 一种基于6D-Torus网络的作业调度方法和装置
JP7012915B2 (ja) * 2019-12-06 2022-01-28 三菱電機株式会社 コントローラ
CN116670622A (zh) * 2021-04-29 2023-08-29 华为技术有限公司 一种限制功耗的方法和装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3640828B2 (ja) * 1999-02-24 2005-04-20 株式会社日立製作所 中継器及びそれを用いたネットワーク
US7103760B1 (en) * 2001-07-16 2006-09-05 Billington Corey A Embedded electronic device connectivity system
JP4558519B2 (ja) 2005-01-18 2010-10-06 富士通株式会社 情報処理装置およびシステムバス制御方法
US7279856B1 (en) * 2006-03-31 2007-10-09 Emc Corporation Environmental and health monitoring circuitry for storage processor I/O annex module
JP2008228465A (ja) * 2007-03-13 2008-09-25 Juki Corp 電装装置
US7944660B2 (en) * 2007-06-15 2011-05-17 General Electric Company Micro-electromechanical system based selectively coordinated protection systems and methods for electrical distribution
US7653773B2 (en) 2007-10-03 2010-01-26 International Business Machines Corporation Dynamically balancing bus bandwidth
US8127165B2 (en) * 2009-02-05 2012-02-28 Lsi Corporation Multipath power management
JP5401679B2 (ja) * 2009-02-19 2014-01-29 株式会社日立製作所 計算機システム、管理方法及び管理サーバ
US7934045B2 (en) * 2009-06-09 2011-04-26 International Business Machines Corporation Redundant and fault tolerant control of an I/O enclosure by multiple hosts
US8381264B1 (en) * 2009-09-10 2013-02-19 Amazon Technologies, Inc. Managing hardware reboot and reset in shared environments
US8275560B2 (en) * 2009-09-10 2012-09-25 Intel Corporation Power measurement techniques of a system-on-chip (SOC)
US9348396B2 (en) * 2011-06-08 2016-05-24 Nec Corporation Computer system, connection device, power supply control method, and power supply control program recording medium
US9086945B2 (en) * 2011-09-01 2015-07-21 Dell Products, Lp System and method to correlate errors to a specific downstream device in a PCIe switching network
JP5915086B2 (ja) * 2011-10-31 2016-05-11 富士通株式会社 切替制御装置、切替制御方法、情報処理装置および切替制御プログラム
JP5794137B2 (ja) * 2011-12-20 2015-10-14 富士通株式会社 制御システムおよび中継装置
US20140006826A1 (en) * 2012-06-30 2014-01-02 Mahesh Wagh Low power low frequency squelch break protocol
US9063734B2 (en) * 2012-09-07 2015-06-23 Atmel Corporation Microcontroller input/output connector state retention in low-power modes
US9563256B2 (en) * 2013-01-04 2017-02-07 Intel Corporation Processor hiding its power-up latency with activation of a root port and quickly sending a downstream cycle
US10496152B2 (en) * 2013-09-27 2019-12-03 Intel Corporation Power control techniques for integrated PCIe controllers
JP6264155B2 (ja) * 2014-03-31 2018-01-24 富士通株式会社 情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム

Also Published As

Publication number Publication date
US9639142B2 (en) 2017-05-02
JP2015197732A (ja) 2015-11-09
US20150277531A1 (en) 2015-10-01

Similar Documents

Publication Publication Date Title
US7536584B2 (en) Fault-isolating SAS expander
EP2052326B1 (en) Fault-isolating sas expander
US7673185B2 (en) Adaptive SAS PHY configuration
JP6264155B2 (ja) 情報処理装置、情報処理装置の制御方法及び情報処理装置の制御プログラム
US10019300B2 (en) Live error recovery
US20130205173A1 (en) Storage device, and storage device control method
US9582448B2 (en) Transmission apparatus and control unit
US7653773B2 (en) Dynamically balancing bus bandwidth
US10007629B2 (en) Inter-processor bus link and switch chip failure recovery
US10078543B2 (en) Correctable error filtering for input/output subsystem
US20110320706A1 (en) Storage apparatus and method for controlling the same
US11467909B1 (en) Peripheral component interconnect express interface device and operating method thereof
JP2016004510A (ja) 原因特定方法、原因特定プログラム、情報処理システム
JP2008090375A (ja) 割込み制御システム、およびこれを利用した記憶制御システム
US10817454B2 (en) Dynamic lane access switching between PCIe root spaces
US20190205489A1 (en) System and method for isolating faults in a resilient system
CN115550291B (zh) 交换机的复位系统及方法、存储介质、电子设备
US20140298076A1 (en) Processing apparatus, recording medium storing processing program, and processing method
US20240248819A1 (en) Peripheral component interconnect express device and operating method thereof
US11068421B1 (en) Memory device and associated flash memory controller
JP2018147510A (ja) サーバ装置およびサーバシステム
US20230281080A1 (en) Correctable error tracking and link recovery
WO2015111206A1 (ja) 計算機システム、サーバモジュール及びストレージモジュール
CN109428750B (zh) 一种点到多点业务传输方法和装置
CN117729099A (zh) 无电子开关式主备主控卡控制通道切换方法、设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170919

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171204

R150 Certificate of patent or registration of utility model

Ref document number: 6264155

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees