JP6558098B2 - 情報処理装置、およびプログラム - Google Patents
情報処理装置、およびプログラム Download PDFInfo
- Publication number
- JP6558098B2 JP6558098B2 JP2015127443A JP2015127443A JP6558098B2 JP 6558098 B2 JP6558098 B2 JP 6558098B2 JP 2015127443 A JP2015127443 A JP 2015127443A JP 2015127443 A JP2015127443 A JP 2015127443A JP 6558098 B2 JP6558098 B2 JP 6558098B2
- Authority
- JP
- Japan
- Prior art keywords
- cpu
- time
- cpus
- processor
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
〔第1の実施の形態〕
図1は、第1の実施の形態に係る情報処理装置の一例を示す図である。情報処理装置10は、複数のプロセッサ(CPU)11〜14、記憶部15、および制御部16を有する。情報処理装置10内では、CPU11〜14それぞれに識別番号が付与されている。CPU11の識別番号は「1」、CPU12の識別番号は「2」、CPU13の識別番号は「3」、CPU14の識別番号は「4」である。
さらに、CPUの稼働時間に使用率を乗算した値を使用時間とすることで、使用時間を正確に算出することができる。すなわち、CPUのエラーは、処理の実行過程で発生する。そのため、何も処理を実行していないアイドル状態の期間を使用時間に含めてしまうと、信頼性を正確に判断できなくなる。第1の実施の形態では、使用率を加味して使用時間を計算することで、ほとんどアイドル状態にならないCPUと、通常アイドル状態になっているCPUとの違いを加味して信頼性を判断し、訂正不可能なエラーが発生しやすいCPUを正確に判断できる。
次に第2の実施の形態について説明する。第2の実施の形態では、サーバの起動時に、プロセッサ(CPU)の稼働時間を加味して、各CPUの信頼性を評価する。なお、CPUの稼働時間としては、CPUの使用率を加味した実質稼働時間が用いられる。実質稼働時間は、例えば「CPUの稼働時間×CPU使用率」で求められる。なお、実質稼働時間は、第1の実施の形態における使用時間の一例である。求められた実質稼働時間を用いて、使用するCPUを選択することで、各CPUの信頼性を正確に判断可能となる。
図4は、稼働時間・エラー管理簿の一例を示す図である。稼働時間・エラー管理簿101gには、Unit、実質稼働時間、訂正可能なエラー数、前回の平均使用率の欄が設けられている。Unitの欄には、管理対象のCPUの識別番号が設定される。実質稼働時間の欄には、対応するCPUの実質的な稼働時間が設定される。実質的な稼働時間とは、CPUがオンラインとなっていた時間に、そのCPUの平均使用率を乗算して得られる時間である。訂正可能なエラー数の欄には、対応するCPUで発生した訂正可能なエラーの数が設定される。前回の平均使用率の欄には、直近のシステム運用時における対応するCPUの平均使用率が設定される。
図6は、CPU動作管理機能を示すブロック図である。図6には、サーバ100が有する、CPU動作管理のための機能を、機能ブロックで表している。例えばサーバ100は、OS110、使用率採取部120、エラー情報収集部130、CPU数算出部140、およびCPU選定部150を有する。OS110は、メモリ101−2に格納されたOSのプログラム(OS101i)を、CPU101aが実行することで実現する機能である。使用率採取部120、エラー情報収集部130、CPU数算出部140、およびCPU選定部150は、管理プログラム101fをCPU101aが実行することで実現される機能である。
次に、CPU動作管理処理について詳細に説明する。CPU動作管理処理は、システムの起動時と停止時とに行われる。以下、図7〜図9を参照してシステム起動時の処理を説明し、図10〜図12を参照してシステム停止時の処理を説明する。
[ステップS101]CPU101aは、OS110を起動する。
[ステップS111]CPU数算出部140は、アプリケーションの使用CPU数が固定か否かを判断する。例えばCPU数算出部140は、アプリケーションプログラム101hのプロパティなどの管理情報に、使用CPU数が指定されているかどうかを調査する。CPU数算出部140は、使用CPU数が指定されていれば、使用CPU数固定であると判断する。使用CPU数が固定の場合、処理が終了する。使用CPU数が固定でなければ、処理がステップS112に進められる。
[ステップS113]CPU数算出部140は、アプリケーションプログラム101hの実行用に用意されたCPU数分(図3の例では「4」)だけ、ステップS114,S115の処理をループする。例えばCPU数算出部140は、稼働時間・エラー管理簿101gに登録されているCPUを、上から順に処理対象とする。
[ステップS116]CPU数算出部140は、アプリケーションプログラム101hの実行用に用意されたすべてのCPU101b〜101eについて処理が完了したら、処理をステップS117に進める。
図9は、CPU選定処理の手順の一例を示すフローチャートである。
[ステップS121]CPU選定部150は、稼働時間・エラー管理簿101gに登録されたCPU101b〜101eのエントリを、単位稼働時間当たりの訂正可能なエラー数で昇順に並べ替える。例えばCPU選定部150は、稼働時間・エラー管理簿101gの各CPUについて、訂正可能なエラー数を実質稼働時間で除算し、単位稼働時間当たりの訂正可能なエラー数を算出する。そしてCPU選定部150は、稼働時間・エラー管理簿101g内のCPU101b〜101eのエントリを、単位稼働時間当たりの訂正可能なエラー数が少ない順に並べる。
[ステップS126]CPU選定部150は、処理対象のCPUを、稼働時間・エラー管理簿101g上での次のCPUに移動する。
図10は、システム停止時のCPU動作管理処理の手順の一例を示すフローチャートである。
[ステップS202]OS110は、管理プログラム101fの使用率採取モジュールに基づいて、使用率採取部120を起動する。使用率採取部120は、システムの起動から停止までの各CPUの使用率の採取処理を実行する。使用率採取処理の詳細は後述する(図11参照)。
次に、使用率採取処理の詳細について説明する。
図11は、使用率採取処理の手順の一例を示すフローチャートである。
図12は、エラー情報収集処理の手順の一例を示すフローチャートである。
[ステップS221]エラー情報収集部130は、アプリケーションプログラム101hの実行用に用意されたすべてのCPU101b〜101eの、訂正可能なエラー数を取得する。例えばエラー情報収集部130は、監視ユニット103から、システムの最後の起動から現在までの訂正可能なエラー情報を取得する。
図14は、初回起動時における使用CPU選定の第2の例を示す図である。図14の例では、初回起動時には、アプリケーションプログラム101hの負荷が不明であるものとする。この場合、CPU選定部150は、システム全体の負荷を測定するため、1回目の起動時には、すべてのCPU101b〜101eを使用対象とする。OS110は、4つのCPU101b〜101eに対してアプリケーションプログラム101hを実行させる。
図18は、n+m回目の起動時における使用CPU選定例を示す図である。図18の例では、訂正可能なエラー回数は、識別番号「4」のCPU101eが最大である。ただし、単位時間当たりの訂正可能なエラー数は、識別番号「2」のCPU101cが最大である。この場合、CPU選定部150は、単位時間当たりの訂正可能なエラー数が最大であるCPU101cを、使用対象外とする。
11〜14 プロセッサ(CPU)
15 記憶部
15a 動作情報管理テーブル
16 制御部
Claims (2)
- 複数のプロセッサそれぞれの使用時間とエラー発生状況とを示す動作情報を記憶する記憶部と、
プログラムの実行開始時に、前記動作情報に基づいて、前記複数のプロセッサのうちの使用時間が短い方から所定数のプロセッサを、動作させる第1のプロセッサとして選択し、選択されていない第2のプロセッサを停止した状態で、前記第1のプロセッサに前記プログラムを実行させ、前記第1のプロセッサの稼働時間に前記第1のプロセッサの平均使用率を乗算した使用時間と、前記第1のプロセッサのエラー発生状況とを取得し、取得した該使用時間と該エラー発生状況とを前記記憶部に格納する制御部と、
を有する情報処理装置。 - コンピュータに、
プログラムの実行開始時に、複数のプロセッサそれぞれの使用時間とエラー発生状況とを示す動作情報に基づいて、前記複数のプロセッサのうちの使用時間が短い方から所定数のプロセッサを、動作させる第1のプロセッサとして選択し、
選択されていない第2のプロセッサを停止した状態で、前記第1のプロセッサに前記プログラムを実行させ、
前記第1のプロセッサの稼働時間に前記第1のプロセッサの平均使用率を乗算した使用時間と、前記第1のプロセッサのエラー発生状況を取得し、
該使用時間と該エラー発生状況とを、前記動作情報として記憶部に格納する、
処理を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015127443A JP6558098B2 (ja) | 2015-06-25 | 2015-06-25 | 情報処理装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015127443A JP6558098B2 (ja) | 2015-06-25 | 2015-06-25 | 情報処理装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017010421A JP2017010421A (ja) | 2017-01-12 |
JP6558098B2 true JP6558098B2 (ja) | 2019-08-14 |
Family
ID=57763631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015127443A Active JP6558098B2 (ja) | 2015-06-25 | 2015-06-25 | 情報処理装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6558098B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3541212B2 (ja) * | 1993-12-28 | 2004-07-07 | 富士通株式会社 | プロセッサ割当て装置 |
JP5259725B2 (ja) * | 2008-10-31 | 2013-08-07 | 株式会社日立製作所 | 計算機システム |
JP5440912B2 (ja) * | 2009-07-02 | 2014-03-12 | 日本電気株式会社 | 情報処理装置及びそのプロセッサ管理方法 |
JP2012003594A (ja) * | 2010-06-18 | 2012-01-05 | Toyota Motor Corp | 並列計算機 |
JP5648397B2 (ja) * | 2010-09-28 | 2015-01-07 | 富士通株式会社 | 計算処理システム、そのジョブ分散配置方法及びジョブ分散配置プログラム |
JP2014215765A (ja) * | 2013-04-24 | 2014-11-17 | 株式会社三菱東京Ufj銀行 | 制御装置 |
-
2015
- 2015-06-25 JP JP2015127443A patent/JP6558098B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017010421A (ja) | 2017-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9389937B2 (en) | Managing faulty memory pages in a computing system | |
US10223224B1 (en) | Method and system for automatic disk failure isolation, diagnosis, and remediation | |
CN110083494B (zh) | 在多核心环境中管理硬件错误的方法和装置 | |
US20150149822A1 (en) | Event handling in storage area networks | |
CN110399260B (zh) | 用于预测性地服务和支持解决方案的系统和方法 | |
TW201730764A (zh) | 用來於一儲存系統中進行資料擦洗管理之方法與裝置 | |
JP6369235B2 (ja) | ストレージ制御装置およびストレージ制御プログラム | |
US20100083043A1 (en) | Information processing device, recording medium that records an operation state monitoring program, and operation state monitoring method | |
US8122176B2 (en) | System and method for logging system management interrupts | |
CN112181298B (zh) | 阵列访问方法、装置、存储设备及机器可读存储介质 | |
US20160357623A1 (en) | Abnormality detection method and information processing apparatus | |
US11860718B2 (en) | Register reading method and apparatus, device, and medium | |
US10613953B2 (en) | Start test method, system, and recording medium | |
JP6558037B2 (ja) | 運用管理プログラム、運用管理方法、および運用管理装置 | |
JP5419819B2 (ja) | 計算機システムの管理方法、及び管理システム | |
US11010249B2 (en) | Kernel reset to recover from operating system errors | |
US9411695B2 (en) | Provisioning memory in a memory system for mirroring | |
US9411666B2 (en) | Anticipatory protection of critical jobs in a computing system | |
US11113163B2 (en) | Storage array drive recovery | |
US11126486B2 (en) | Prediction of power shutdown and outage incidents | |
JP6558098B2 (ja) | 情報処理装置、およびプログラム | |
US20130318310A1 (en) | Processor processing method and processor system | |
JP5342660B2 (ja) | 管理システム及びシステム管理方法及びプログラム | |
US9928154B2 (en) | Leveling stress factors among like components in a server | |
US20220214910A1 (en) | Information processing system, information processing apparatus, and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190514 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190514 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6558098 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |