JP2019032745A - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2019032745A JP2019032745A JP2017154219A JP2017154219A JP2019032745A JP 2019032745 A JP2019032745 A JP 2019032745A JP 2017154219 A JP2017154219 A JP 2017154219A JP 2017154219 A JP2017154219 A JP 2017154219A JP 2019032745 A JP2019032745 A JP 2019032745A
- Authority
- JP
- Japan
- Prior art keywords
- load
- data
- information processing
- unit
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0778—Dumping, i.e. gathering error/state information after a fault for later diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/28—Error detection; Error correction; Monitoring by checking the correct order of processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
- G06F11/3433—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/301—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3024—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3041—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is an input/output interface
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/815—Virtual
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
Abstract
【解決手段】情報処理システムは、第1システムと第2システムと管理装置10を備える。管理装置の第1収集部101と第2収集部103は、それぞれ、障害が発生した第1システムと同一又は類似のシステムである第2システムにおいて或る処理を実行する第1装置の通信負荷データとCPU負荷データを受信し、通信負荷データ格納部121とCPU負荷データ格納部123に格納する。関係算出部107は、通信負荷データとCPU負荷データの関係を示すデータを生成し、関係データ格納部127に格納する。推定データ生成部109は、関係データ格納部に格納された関係データと障害が発生する前の第1システムにおいて或る処理を実行する第2装置の通信負荷とに基づき、障害が発生する前の第2装置のプロセッサ負荷を算出し推定データ格納部129に格納する。
【選択図】図4
Description
障害が発生した第1システムと同一又は類似のシステムである第2システムにおいて或る処理を実行する第1装置のプロセッサ負荷と通信負荷との関係を示すデータを生成する第1生成部と、
生成された前記データと、前記障害が発生する前の前記第1システムにおいて前記或る処理を実行する第2装置の通信負荷とに基づき、前記障害が発生する前の前記第2装置のプロセッサ負荷を算出する算出部と、
を有する情報処理装置。
前記第1生成部は、
前記第1システムの構成並びに前記第2装置のプロセッサ負荷の変動及び通信負荷の変動と、前記第1システム以外のシステムの構成及び当該システムにおいて前記特定の処理を実行する装置のプロセッサ負荷の変動及び通信負荷の変動との比較に基づき、前記第2システムを特定する、
付記1記載の情報処理装置。
前記第1生成部は、
前記第1装置のプロセッサ負荷と前記第1装置に対するリクエストの数との関係を示すデータを、前記第1装置に対するリクエストの種類ごとに生成する、
付記1又は2記載の情報処理装置。
前記障害が発生する前の前記第2装置に対するリクエストの送信パターンを、前記障害が発生する前の前記第2装置の通信ログから生成する第2生成部と、
生成された前記送信パターンに従って前記第1装置に対するリクエストを送信する出力部と、
生成された前記送信パターンに従って前記第1装置に対するリクエストが送信された場合における前記第1装置のプロセッサ負荷と、算出された前記第2装置のプロセッサ負荷との比較の結果に基づき、前記出力部が前記第1装置に対するリクエストを送信する頻度を変更する制御部と、
をさらに有する付記1乃至3のいずれか1つ記載の情報処理装置。
前記制御部は、
計測された前記プロセッサ負荷と、算出された前記第2装置のプロセッサ負荷とが同じになるように、前記出力部が前記第1装置に対するリクエストを送信する頻度を変更する、
付記4記載の情報処理装置。
前記第1装置及び前記第2装置は仮想マシンである、
付記1乃至5のいずれか1つ記載の情報処理装置。
コンピュータが、
障害が発生した第1システムと同一又は類似のシステムである第2システムにおいて或る処理を実行する第1装置のプロセッサ負荷と通信負荷との関係を示すデータを生成し、
生成された前記データと、前記障害が発生する前の前記第1システムにおいて前記或る処理を実行する第2装置の通信負荷とに基づき、前記障害が発生する前の前記第2装置のプロセッサ負荷を算出する、
処理を実行する情報処理方法。
コンピュータに、
障害が発生した第1システムと同一又は類似のシステムである第2システムにおいて或る処理を実行する第1装置のプロセッサ負荷と通信負荷との関係を示すデータを生成し、
生成された前記データと、前記障害が発生する前の前記第1システムにおいて前記或る処理を実行する第2装置の通信負荷とに基づき、前記障害が発生する前の前記第2装置のプロセッサ負荷を算出する、
処理を実行させるプログラム。
13 検証装置 16 情報処理装置
3 情報処理装置 5 ネットワーク
131 CPU 132 メモリ
133 HDD 134 NIC
1300 ハイパバイザ 1310 仮想スイッチ
1321,1322,1323 VM
11 CPU 12 メモリ
14 NIC 15 バス
17 HDD
101 第1収集部 103 第2収集部
105 特定部 107 関係算出部
109 推定データ生成部 111 パターン抽出部
113 リクエスト出力部 115 制御部
121 通信負荷データ格納部 123 CPU負荷データ格納部
125 システム構成データ格納部 127 関係データ格納部
129 推定データ格納部 135 パターンデータ格納部
Claims (6)
- 障害が発生した第1システムと同一又は類似のシステムである第2システムにおいて或る処理を実行する第1装置のプロセッサ負荷と通信負荷との関係を示すデータを生成する第1生成部と、
生成された前記データと、前記障害が発生する前の前記第1システムにおいて前記或る処理を実行する第2装置の通信負荷とに基づき、前記障害が発生する前の前記第2装置のプロセッサ負荷を算出する算出部と、
を有する情報処理装置。 - 前記第1生成部は、
前記第1システムの構成並びに前記第2装置のプロセッサ負荷及び通信負荷と、前記第1システム以外のシステムの構成及び当該システムにおいて前記特定の処理を実行する装置のプロセッサ負荷及び通信負荷との比較に基づき、前記第2システムを特定する、
請求項1記載の情報処理装置。 - 前記第1生成部は、
前記第1装置のプロセッサ負荷と前記第1装置に対するリクエストの数との関係を示すデータを、前記第1装置に対するリクエストの種類ごとに生成する、
請求項1又は2記載の情報処理装置。 - 前記障害が発生する前の前記第2装置に対するリクエストの送信パターンを、前記障害が発生する前の前記第2装置の通信ログから生成する第2生成部と、
生成された前記送信パターンに従って前記第1装置に対するリクエストを送信する出力部と、
生成された前記送信パターンに従って前記第1装置に対するリクエストが送信された場合における前記第1装置のプロセッサ負荷と、算出された前記第2装置のプロセッサ負荷との比較の結果に基づき、前記出力部が前記第1装置に対するリクエストを送信する頻度を変更する制御部と、
をさらに有する請求項1乃至3のいずれか1つ記載の情報処理装置。 - コンピュータが、
障害が発生した第1システムと同一又は類似のシステムである第2システムにおいて或る処理を実行する第1装置のプロセッサ負荷と通信負荷との関係を示すデータを生成し、
生成された前記データと、前記障害が発生する前の前記第1システムにおいて前記或る処理を実行する第2装置の通信負荷とに基づき、前記障害が発生する前の前記第2装置のプロセッサ負荷を算出する、
処理を実行する情報処理方法。 - コンピュータに、
障害が発生した第1システムと同一又は類似のシステムである第2システムにおいて或る処理を実行する第1装置のプロセッサ負荷と通信負荷との関係を示すデータを生成し、
生成された前記データと、前記障害が発生する前の前記第1システムにおいて前記或る処理を実行する第2装置の通信負荷とに基づき、前記障害が発生する前の前記第2装置のプロセッサ負荷を算出する、
処理を実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154219A JP6904155B2 (ja) | 2017-08-09 | 2017-08-09 | 情報処理装置、情報処理方法及びプログラム |
US16/055,484 US10467079B2 (en) | 2017-08-09 | 2018-08-06 | Information processing device, information processing method, and non-transitory computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154219A JP6904155B2 (ja) | 2017-08-09 | 2017-08-09 | 情報処理装置、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019032745A true JP2019032745A (ja) | 2019-02-28 |
JP6904155B2 JP6904155B2 (ja) | 2021-07-14 |
Family
ID=65274121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017154219A Active JP6904155B2 (ja) | 2017-08-09 | 2017-08-09 | 情報処理装置、情報処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10467079B2 (ja) |
JP (1) | JP6904155B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220138068A1 (en) * | 2019-07-02 | 2022-05-05 | Hewlett-Packard Development Company, L.P. | Computer readable program code change impact estimations |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010224629A (ja) * | 2009-03-19 | 2010-10-07 | Hitachi Information Systems Ltd | ソフトウェア検証システムと方法およびプログラム |
JP2014021803A (ja) * | 2012-07-20 | 2014-02-03 | Mitsubishi Electric Corp | コンピュータ装置及びリソース使用量予測方法及びプログラム |
WO2014118897A1 (ja) * | 2013-01-29 | 2014-08-07 | 富士通株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
JP2015056039A (ja) * | 2013-09-12 | 2015-03-23 | 株式会社東芝 | 制御装置、制御システムおよび制御方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6353902B1 (en) * | 1999-06-08 | 2002-03-05 | Nortel Networks Limited | Network fault prediction and proactive maintenance system |
US6609212B1 (en) * | 2000-03-09 | 2003-08-19 | International Business Machines Corporation | Apparatus and method for sharing predictive failure information on a computer network |
JP4066932B2 (ja) * | 2003-11-10 | 2008-03-26 | 株式会社日立製作所 | 予測に基づいた計算機リソース配分方法 |
US7484132B2 (en) * | 2005-10-28 | 2009-01-27 | International Business Machines Corporation | Clustering process for software server failure prediction |
US20080126881A1 (en) * | 2006-07-26 | 2008-05-29 | Tilmann Bruckhaus | Method and apparatus for using performance parameters to predict a computer system failure |
US8140914B2 (en) * | 2009-06-15 | 2012-03-20 | Microsoft Corporation | Failure-model-driven repair and backup |
JP2011002906A (ja) * | 2009-06-16 | 2011-01-06 | Fujitsu Ltd | 監視プログラム、監視装置、および監視方法 |
US8966039B1 (en) * | 2011-04-25 | 2015-02-24 | Sprint Communications Company L.P. | End-to-end communication service monitoring and reporting |
US8881108B2 (en) * | 2012-06-28 | 2014-11-04 | Sap Ag | Test program for HTTP-communicating service |
CN104871105B (zh) * | 2012-11-19 | 2018-06-22 | 西门子公司 | 用于分布式系统的复原优化和控制 |
JP6126891B2 (ja) * | 2013-03-29 | 2017-05-10 | 富士通株式会社 | 検出方法、検出プログラム、および検出装置 |
CA2870080C (en) * | 2013-11-08 | 2017-12-19 | Accenture Global Services Limited | Network node failure predictive system |
US9674046B2 (en) * | 2014-10-21 | 2017-06-06 | At&T Intellectual Property I, L.P. | Automatic detection and prevention of network overload conditions using SDN |
US9830240B2 (en) * | 2015-05-14 | 2017-11-28 | Cisco Technology, Inc. | Smart storage recovery in a distributed storage system |
JP6686459B2 (ja) * | 2016-01-19 | 2020-04-22 | 富士通株式会社 | 診断装置、診断方法および診断プログラム |
US10339131B1 (en) * | 2016-06-10 | 2019-07-02 | Hortonworks, Inc. | Fault prevention |
US10198330B2 (en) * | 2016-11-30 | 2019-02-05 | Sap Se | Configuring disaster recovery for a cloud based application |
-
2017
- 2017-08-09 JP JP2017154219A patent/JP6904155B2/ja active Active
-
2018
- 2018-08-06 US US16/055,484 patent/US10467079B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010224629A (ja) * | 2009-03-19 | 2010-10-07 | Hitachi Information Systems Ltd | ソフトウェア検証システムと方法およびプログラム |
JP2014021803A (ja) * | 2012-07-20 | 2014-02-03 | Mitsubishi Electric Corp | コンピュータ装置及びリソース使用量予測方法及びプログラム |
WO2014118897A1 (ja) * | 2013-01-29 | 2014-08-07 | 富士通株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
JP2015056039A (ja) * | 2013-09-12 | 2015-03-23 | 株式会社東芝 | 制御装置、制御システムおよび制御方法 |
Also Published As
Publication number | Publication date |
---|---|
US20190050282A1 (en) | 2019-02-14 |
US10467079B2 (en) | 2019-11-05 |
JP6904155B2 (ja) | 2021-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10158541B2 (en) | Group server performance correction via actions to server subset | |
Nguyen et al. | {AGILE}: elastic distributed resource scaling for {infrastructure-as-a-service} | |
JP6692000B2 (ja) | リスク識別方法、リスク識別装置、クラウドリスク識別装置及びシステム | |
WO2016204804A1 (en) | Virtualized network function monitoring | |
TW201423398A (zh) | 虛擬機至實體機之間相關性能問題的根源分析的方法與系統 | |
US9852007B2 (en) | System management method, management computer, and non-transitory computer-readable storage medium | |
US20180107503A1 (en) | Computer procurement predicting device, computer procurement predicting method, and recording medium | |
Caglar et al. | Intelligent, performance interference-aware resource management for iot cloud backends | |
WO2018131556A1 (ja) | リソース設定制御装置、リソース設定制御システム、リソース設定制御方法、および、コンピュータ読み取り可能記録媒体 | |
US20180095819A1 (en) | Incident analysis program, incident analysis method, information processing device, service identification program, service identification method, and service identification device | |
CN104956331A (zh) | 管理计算机系统的管理系统及其管理方法 | |
KR102365839B1 (ko) | 애플리케이션 성능 모니터링 방법 및 장치 | |
US10135709B1 (en) | Tracking work in an asynchronous application or service during load testing | |
Di Sanzo et al. | Machine learning for achieving self-* properties and seamless execution of applications in the cloud | |
US10282239B2 (en) | Monitoring method | |
Dhingra et al. | Comparative analysis of fault tolerance models and their challenges in cloud computing | |
CN104135525B (zh) | 云平台elb组件的资源扩展方法和装置 | |
JP6904155B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US10067778B2 (en) | Management system, recording medium and method for managing virtual machines | |
US8798982B2 (en) | Information processing device, information processing method, and program | |
JP2020035297A (ja) | 機器状態監視装置及びプログラム | |
US11526784B2 (en) | Real-time server capacity optimization tool using maximum predicted value of resource utilization determined based on historica data and confidence interval | |
CN103795766B (zh) | 一种p2sp多源下载系统 | |
Mekuria et al. | Automated profiling of virtualized media processing functions using telemetry and machine learning | |
US8930369B2 (en) | Information processing apparatus, message classifying method and non-transitory medium for associating series of transactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200514 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210524 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6904155 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |