JP6187021B2 - 情報処理システム、情報処理システムの制御方法及び管理装置の制御プログラム - Google Patents
情報処理システム、情報処理システムの制御方法及び管理装置の制御プログラム Download PDFInfo
- Publication number
- JP6187021B2 JP6187021B2 JP2013169188A JP2013169188A JP6187021B2 JP 6187021 B2 JP6187021 B2 JP 6187021B2 JP 2013169188 A JP2013169188 A JP 2013169188A JP 2013169188 A JP2013169188 A JP 2013169188A JP 6187021 B2 JP6187021 B2 JP 6187021B2
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- state
- notification
- change notification
- management device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3048—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the topology of the computing system or computing system component explicitly influences the monitoring activity, e.g. serial, hierarchical systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
Description
図3に、本実施の形態に係る情報処理システムの構成例を示す。本情報処理システムは、監視マスタサーバ100と、監視サブマスタサーバ110及び120と、フェイルオーバペアとなっているファイルサーバA及びBと、計算サーバ210及び220と、管理サーバ230とを有する。
状態変更通知キャッシュは、短時間に大量の状態変更通知が情報処理システム内のネットワークを流れるのを防止するために行われるが、被監視サーバの数が少ない場合には、ネットワークにおける通信負荷が抑えられている場合もある。また、被監視サーバの数が多くても、ダウンしている被監視サーバの数が多ければ又は稼働中の被監視サーバの数が少なければ、同様にネットワークにおける通信負荷が抑えられている場合もある。
第1の管理装置と、複数の情報処理装置と、前記第1の管理装置と前記複数の情報処理装置とに接続される第2の管理装置とを有する情報処理システムにおいて、
前記第2の管理装置は、
前記複数の情報処理装置のうち状態の変更が発生した通知元情報処理装置から、前記通知元情報処理装置の状態の変更が発生した旨を通知する状態変更通知を受信した場合、受信した前記状態変更通知に含まれる前記通知元情報処理装置の変化後の状態を示す状態情報に対応して規定された所定時間だけ受信した前記状態変更通知を保持してから、受信した前記状態変更通知を前記第1の管理装置に送信する
情報処理システム。
前記第2の管理装置はさらに、
受信した前記状態変更通知に含まれる前記通知元情報処理装置の状態情報と、受信した前記状態変更通知に含まれる前記通知元情報処理装置の種別を示す種別情報とに対応して規定された所定時間だけ受信した前記状態変更通知を保持する
付記1記載の情報処理システム。
前記第2の管理装置はさらに、
前記第1の管理装置を経由して前記通知元情報処理装置についての状態変更通知を受信した場合、前記通知元情報処理装置の変化後の状態を示す状態情報と前記通知元情報処理装置の種別を示す種別情報とに対応して規定された所定時間だけ保持してから、受信した前記状態変更通知を前記複数の情報処理装置のうち稼動状態の情報処理装置に送信する
付記2記載の情報処理システム。
前記複数の情報処理装置の各々は、
自装置の状態の変化を検出した場合、自装置の変化後の状態に対応して設定された時間間隔で自装置を監視する
付記1乃至3のいずれか1つ記載の情報処理システム。
前記第1の管理装置は、
前記第2の管理装置を経由して前記通知元情報処理装置からの状態変更通知を受信した場合、前記通知元情報処理装置からの状態変更通知に含まれる前記通知元情報処理装置の変化後の状態を示す状態情報に対応して規定された所定時間だけ受信した前記状態変更通知を保持してから受信した前記状態変更通知を処理する
付記1乃至4のいずれか1つ記載の情報処理システム。
前記第2の管理装置は、
前記複数の情報処理装置の数又は前記複数の情報処理装置のうち稼働中の情報処理装置の数が閾値以上である場合、受信した前記状態変更通知を前記所定時間だけ保持する
付記1乃至5のいずれか1つ記載の情報処理システム。
第1の管理装置と、複数の情報処理装置と、前記第1の管理装置と前記複数の情報処理装置とに接続される第2の管理装置とを有する情報処理システムの制御方法において、
前記複数の情報処理装置のうち状態の変更が発生した通知元情報処理装置から、前記通知元情報処理装置の状態の変更が発生した旨を通知する状態変更通知を受信した場合、前記第2の管理装置が、受信した前記状態変更通知を保持し、
受信した前記状態変更通知に含まれる前記通知元情報処理装置の変化後の状態を示す状態情報に対応して規定された所定時間の経過後、前記第2の管理装置が、受信した前記状態変更通知を前記第1の管理装置に送信する
制御方法。
他の管理装置と、複数の情報処理装置と、前記他の管理装置と前記複数の情報処理装置とに接続される管理装置の制御プログラムにおいて、
前記複数の情報処理装置のうち状態の変更が発生した通知元情報処理装置から、前記通知元情報処理装置の状態の変更が発生した旨を通知する状態変更通知を受信した場合、前記管理装置に、受信した前記状態変更通知を保持させ、
受信した前記状態変更通知に含まれる前記通知元情報処理装置の変化後の状態を示す状態情報に対応して規定された所定時間の経過後、前記管理装置に、受信した前記状態変更通知を前記他の管理装置に送信させる
制御プログラム。
110,120 監視サブマスタサーバ
210,220 計算サーバ
230 管理サーバ
Claims (8)
- 第1の管理装置と、複数の情報処理装置と、前記第1の管理装置と前記複数の情報処理装置とに接続される第2の管理装置とを有する情報処理システムにおいて、
前記第2の管理装置は、
前記複数の情報処理装置のうち状態の変更が発生した通知元情報処理装置から、前記通知元情報処理装置の状態の変更が発生した旨を通知する状態変更通知を受信した場合、通常状態を示す状態情報に対応付けられた時間と非通常状態を示す状態情報に対応付けられた時間とを格納するデータ格納部から、受信した前記状態変更通知に含まれる前記通知元情報処理装置の変化後の状態を示す状態情報に対応付けられた時間を特定し、
特定された前記時間だけ受信した前記状態変更通知を保持してから、受信した前記状態変更通知を前記第1の管理装置に送信する
情報処理システム。 - 前記データ格納部に格納された、前記通常状態を示す状態情報に対応付けられた時間及び前記非通常状態を示す状態情報に対応付けられた時間は、情報処理装置の種別を示す種別情報にさらに対応付けられ、
前記第2の管理装置はさらに、
受信した前記状態変更通知に含まれる前記通知元情報処理装置の状態情報と、受信した前記状態変更通知に含まれる前記通知元情報処理装置の種別を示す種別情報とに対応付けられた時間を前記データ格納部から特定し、
特定された前記時間だけ受信した前記状態変更通知を保持する
請求項1記載の情報処理システム。 - 前記第2の管理装置はさらに、
前記第1の管理装置を経由して前記通知元情報処理装置についての状態変更通知を受信した場合、前記通知元情報処理装置の変化後の状態を示す状態情報と前記通知元情報処理装置の種別を示す種別情報とに対応付けられた時間を前記データ格納部から特定し、
特定された前記時間だけ受信した前記状態変更通知を保持してから、受信した前記状態変更通知を前記複数の情報処理装置のうち稼働状態の情報処理装置に送信する
請求項2記載の情報処理システム。 - 前記複数の情報処理装置の各々は、
自装置の状態の変化を検出した場合、自装置の変化後の状態に対応して設定された時間間隔で自装置を監視する
請求項1乃至3のいずれか1つ記載の情報処理システム。 - 前記第1の管理装置は、
前記第2の管理装置を経由して前記通知元情報処理装置からの状態変更通知を受信した場合、前記通知元情報処理装置からの状態変更通知に含まれる前記通知元情報処理装置の変化後の状態を示す状態情報に対応して規定された所定時間だけ受信した前記状態変更通知を保持してから受信した前記状態変更通知を処理する
請求項1乃至4のいずれか1つ記載の情報処理システム。 - 前記第2の管理装置は、
前記複数の情報処理装置の数又は前記複数の情報処理装置のうち稼働中の情報処理装置の数が閾値以上である場合、受信した前記状態変更通知を、特定された前記時間だけ保持する
請求項1乃至5のいずれか1つ記載の情報処理システム。 - 第1の管理装置と、複数の情報処理装置と、前記第1の管理装置と前記複数の情報処理装置とに接続される第2の管理装置とを有する情報処理システムの制御方法において、
前記複数の情報処理装置のうち状態の変更が発生した通知元情報処理装置から、前記通知元情報処理装置の状態の変更が発生した旨を通知する状態変更通知を受信した場合、前記第2の管理装置が、受信した前記状態変更通知を保持し、
前記第2の管理装置が、通常状態を示す状態情報に対応付けられた時間と非通常状態を示す状態情報に対応付けられた時間とを格納するデータ格納部から、受信した前記状態変更通知に含まれる前記通知元情報処理装置の変化後の状態を示す状態情報に対応付けられた時間を特定し、
特定された前記時間の経過後、前記第2の管理装置が、受信した前記状態変更通知を前記第1の管理装置に送信する
制御方法。 - 他の管理装置と、複数の情報処理装置と、前記他の管理装置と前記複数の情報処理装置とに接続される管理装置の制御プログラムにおいて、
前記複数の情報処理装置のうち状態の変更が発生した通知元情報処理装置から、前記通知元情報処理装置の状態の変更が発生した旨を通知する状態変更通知を受信した場合、前記管理装置に、受信した前記状態変更通知を保持させ、
通常状態を示す状態情報に対応付けられた時間と非通常状態を示す状態情報に対応付けられた時間とを格納するデータ格納部から、受信した前記状態変更通知に含まれる前記通知元情報処理装置の変化後の状態を示す状態情報に対応付けられた時間を前記管理装置に特定させ、
特定された前記時間の経過後、前記管理装置に、受信した前記状態変更通知を前記他の管理装置に送信させる
制御プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013169188A JP6187021B2 (ja) | 2013-08-16 | 2013-08-16 | 情報処理システム、情報処理システムの制御方法及び管理装置の制御プログラム |
US14/334,733 US9880912B2 (en) | 2013-08-16 | 2014-07-18 | Information processing system, control method of information processing system, and non-transitory computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013169188A JP6187021B2 (ja) | 2013-08-16 | 2013-08-16 | 情報処理システム、情報処理システムの制御方法及び管理装置の制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015036957A JP2015036957A (ja) | 2015-02-23 |
JP6187021B2 true JP6187021B2 (ja) | 2017-08-30 |
Family
ID=52467713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013169188A Active JP6187021B2 (ja) | 2013-08-16 | 2013-08-16 | 情報処理システム、情報処理システムの制御方法及び管理装置の制御プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9880912B2 (ja) |
JP (1) | JP6187021B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016115155A (ja) * | 2014-12-15 | 2016-06-23 | 株式会社リコー | 機器管理装置、機器管理システム、対応指示方法及びプログラム |
US10580407B1 (en) * | 2017-12-08 | 2020-03-03 | Amazon Technologies, Inc. | State detection and responses for electronic devices |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61221542A (ja) | 1985-03-27 | 1986-10-01 | 株式会社日立製作所 | 集中監視制御システム |
JPH04319900A (ja) * | 1991-04-19 | 1992-11-10 | Fujitsu Ltd | 状態変化情報再送信方式 |
JPH07319836A (ja) * | 1994-05-30 | 1995-12-08 | Hitachi Ltd | 障害監視方式 |
JPH0983641A (ja) | 1995-09-20 | 1997-03-28 | Nec Corp | 監視制御方式 |
DE60106467T2 (de) * | 2001-12-14 | 2006-02-23 | Hewlett-Packard Development Co., L.P., Houston | Verfahren zum Installieren Überwachungsagenten, System und Computerprogramm von Objekten in einem IT-Netz Überwachung |
JP3583767B2 (ja) * | 2002-06-06 | 2004-11-04 | 株式会社エヌ・ティ・ティ・ドコモ | メッセージ配信システム及びメッセージ配信方法 |
US8230445B2 (en) * | 2003-01-14 | 2012-07-24 | International Business Machines Corporation | Event management method and system |
JP2008015722A (ja) * | 2006-07-05 | 2008-01-24 | Hitachi Electronics Service Co Ltd | データ処理システム |
JP5588127B2 (ja) * | 2009-06-08 | 2014-09-10 | 株式会社日立システムズ | 障害監視装置 |
-
2013
- 2013-08-16 JP JP2013169188A patent/JP6187021B2/ja active Active
-
2014
- 2014-07-18 US US14/334,733 patent/US9880912B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9880912B2 (en) | 2018-01-30 |
US20150052384A1 (en) | 2015-02-19 |
JP2015036957A (ja) | 2015-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10467136B2 (en) | Adaptable data caching mechanism for in-memory cluster computing | |
KR101888029B1 (ko) | 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템 | |
JP4920391B2 (ja) | 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム | |
US20190342380A1 (en) | Adaptive resource-governed services for performance-compliant distributed workloads | |
US10095547B1 (en) | Stream processing at scale | |
JP6019995B2 (ja) | 分散システム、サーバ計算機、及び障害発生防止方法 | |
US8479038B1 (en) | Method and apparatus for achieving high availability for applications and optimizing power consumption within a datacenter | |
US8510742B2 (en) | Job allocation program for allocating jobs to each computer without intensively managing load state of each computer | |
US9553810B2 (en) | Dynamic reconfiguration of network devices for outage prediction | |
JP2004030363A (ja) | 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム | |
US20180032387A1 (en) | Predictive Analytics on Database Wait Events | |
US7925922B2 (en) | Failover method and system for a computer system having clustering configuration | |
JP2012088770A (ja) | コンピュータリソース制御システム | |
US10732873B1 (en) | Timeout mode for storage devices | |
US10540202B1 (en) | Transient sharing of available SAN compute capability | |
CN111418187A (zh) | 云网络中的可伸缩统计和分析机制 | |
JP6187021B2 (ja) | 情報処理システム、情報処理システムの制御方法及び管理装置の制御プログラム | |
JP2008250669A (ja) | ウェブ監視制御システム、ウェブサーバ制御装置およびウェブサーバ制御プログラム | |
US9836342B1 (en) | Application alerting system and method for a computing infrastructure | |
KR101326451B1 (ko) | 복합 장애 조건을 이용하여 시스템 장애를 판단하는 시스템 장애 모니터링 방법 및 서버 | |
CN115934304A (zh) | 一种数据处理方法、装置、计算机设备及可读存储介质 | |
CN115840635A (zh) | 计算资源管理方法、电子设备和程序产品 | |
Mondal et al. | Energy modeling of virtual machine replication schemes with checkpointing in data centers | |
JP2012089109A (ja) | コンピュータリソース制御システム | |
US20230221961A1 (en) | Remote front-drop for recovery after pipeline stall |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160510 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170328 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6187021 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |