JP2019032709A - 分散システム - Google Patents
分散システム Download PDFInfo
- Publication number
- JP2019032709A JP2019032709A JP2017153432A JP2017153432A JP2019032709A JP 2019032709 A JP2019032709 A JP 2019032709A JP 2017153432 A JP2017153432 A JP 2017153432A JP 2017153432 A JP2017153432 A JP 2017153432A JP 2019032709 A JP2019032709 A JP 2019032709A
- Authority
- JP
- Japan
- Prior art keywords
- service
- server
- servers
- monitoring unit
- activation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 claims abstract description 72
- 230000004913 activation Effects 0.000 claims description 62
- 230000005856 abnormality Effects 0.000 claims description 28
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 238000000034 method Methods 0.000 abstract description 37
- 230000008569 process Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 238000012790 confirmation Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Abstract
Description
本発明の実施の形態1に係る分散システムは、複数のサーバで実行される異なるサービスが連携して機能する。
まず、第1サーバ1の構成について説明する。第1サーバ1は、第1プロセス管理部11(第1サービス起動部12、第1サービス停止部13)、全サーバ起動監視部14、第1停止条件監視部15、第1サービス監視部16、第1アラート出力部17を備える。
次に、第2サーバ2〜第5サーバ5の構成について説明する。これらのサーバは、起動条件、停止条件等の設定情報が異なるのみで同様の機能を有する。そのため、主として第2サーバ2を例に説明する。
次に、図3を参照してマスタサーバである第1サーバ1の起動について説明する。図3は、本発明の実施の形態1に係る第1サーバ1が起動時に実行する処理のフローチャートである。まず、システム運用者による第1サーバ1のOS起動により、基本的な通信プログラム等が実行されて他サーバと通信可能となる。
次に、図4を参照して第2サーバ2〜第5サーバ5の起動について説明する。図4は、本発明の実施の形態1に係る第2サーバ2〜第5サーバ5が起動時に実行する処理のフローチャートである。まず、システム運用者による第2サーバ2〜第5サーバ5のOS起動により、基本的な通信プログラム等が実行されて他サーバと通信可能となる。第2サーバ2〜第5サーバ5の起動処理は、起動条件が異なる以外共通するため、以下の説明では第2サーバ2を例に挙げて説明する。
次に、図5、図6を参照してサーバの停止について説明する。図5は、本発明の実施の形態1に係る第1サーバ1〜第3サーバ3が停止時に実行する処理のフローチャートである。図6は、本発明の実施の形態1に係る第4サーバ4と第5サーバ5が停止時に実行する処理のフローチャートである。各サーバの起動処理は、停止条件が異なる以外共通するため、以下の説明では第2サーバ2を例に挙げて説明する。
以上説明したように、本実施形態に係る分散システムによれば、システム運用者が各サーバの起動順序を意識しなくても、各サーバは、システムとして機能するようにサーバ間で待ち合わせを行い、起動条件の成立を待って必要なサービスを起動することができる。また、システム運用者が各サーバの停止順序を意識しなくても、各サーバは、安全にシャットダウンするようにサーバ間で待ち合わせを行い、停止条件の成立を待って起動していたサービスを停止することができる。そのため、本実施形態に係る分散システムによれば、システム運用手順を簡素化し、システム運用者の負担を軽減でき、かつ最小限のオペレーションで安全にシステムを起動・停止することができる。
ところで、上述した実施の形態においては、サービスの実行状態のモニタリングまたは異常時の警告を発するために、サービス監視部やアラート出力部を備えている。ところで、単に複数のサーバ間で起動・停止の待ち合わせを実現する場合には、サービス監視部やアラート通知部を要しない構成であってもよい。
各サーバ機のハードウェア構成について図7を参照しつつ説明する。図7は、図4の各サーバ機が有する処理回路のハードウェア構成例を示すブロック図である。図2に示す各部は、各サーバ機が有する機能の一部を示し、各機能は処理回路により実現される。例えば、処理回路は、CPU101、ROM102、RAM103、入出力インターフェース104、システムバス105、入力装置106、モニタ107、ストレージ108、ネットワークI/F(インターフェース)109を備えたコンピュータである。
11、21、31、41、51 第1プロセス管理部、第2プロセス管理部、第3プロセス管理部、第4プロセス管理部、第5プロセス管理部
12、22、32、42、52 第1サービス起動部、第2サービス起動部、第3サービス起動部、第4サービス起動部、第5サービス起動部
13、23、33、43、53 第1サービス停止部、第2サービス停止部、第3サービス停止部、第4サービス停止部、第5サービス停止部
14 全サーバ起動監視部
24、34、44、54 第2起動条件監視部、第3起動条件監視部、第4起動条件監視部、第5起動条件監視部
15、25、35、45、55 第1停止条件監視部、第2停止条件監視部、第3停止条件監視部、第4停止条件監視部、第5停止条件監視部
16、26,36、46、56 第1サービス監視部、第2サービス監視部、第3サービス監視部、第4サービス監視部、第5サービス監視部
17、27、37、47、57 第1アラート出力部、第2アラート出力部、第3アラート出力部、第4アラート出力部、第5アラート出力部
6 ネットワーク
101 CPU
102 ROM
103 RAM
104 入出力インターフェース
105 システムバス
106 入力装置
107 モニタ
108 ストレージ
109 ネットワークI/F
Claims (6)
- 複数のサーバで実行される異なるサービスが連携して機能する分散システムであって、
前記複数のサーバのうち自サーバのサービスよりも前に起動すべき親サーバのサービスを定義した起動条件の成立を監視する起動条件監視部と、
前記起動条件に定義された前記親サーバのサービスの起動を待って、前記自サーバのサービスを起動するサービス起動部と、
を備えることを特徴とする分散システム。 - 前記複数のサーバのうち自サーバのサービスよりも前に停止すべき子サーバのサービスを定義した停止条件の成立を監視する停止条件監視部と、
前記停止条件に定義された前記子サーバのサービスの停止を待って、前記自サーバのサービスを停止するサービス停止部と、
を備えることを特徴とする請求項1記載の分散システム。 - 前記複数のサーバは、共通する物理マシン上で起動する複数の仮想サーバであって、
前記物理マシンが、前記複数の仮想サーバを一括して起動または停止させること、
を特徴する請求項2記載の分散システム。 - 前記複数のサーバは、
自サーバのサービスを起動後、前記自サーバのサービスの異常を検出した場合にサービス異常状態を記録するサービス監視部と、
前記サービス監視部が検出したサービスの異常を表示するモニタと、
前記サービス異常状態に応じたアラート信号を出力するアラート出力部と、
を備えることを特徴とする請求項1乃至3のいずれか1項記載の分散システム。 - 前記複数のサーバのうち、他サーバに従属しないマスタサーバは、
前記マスタサーバのサービス起動後、少なくとも1つの前記他サーバが所定時間以内に起動しない場合にタイムアウト情報を記録する全サーバ起動監視部と、を備え、
前記アラート出力部は、前記タイムアウト情報に応じたアラート信号を出力すること、
を特徴とする請求項4記載の分散システム。 - 前記サービス監視部は、自サーバのサービスの異常を検出してから所定時間を経過しても異常が継続している場合に、サービス異常継続状態を記録し、
前記アラート出力部は、前記サービス異常継続状態に応じた再度のアラート信号を出力すること、
を特徴する請求項4記載の分散システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017153432A JP2019032709A (ja) | 2017-08-08 | 2017-08-08 | 分散システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017153432A JP2019032709A (ja) | 2017-08-08 | 2017-08-08 | 分散システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019032709A true JP2019032709A (ja) | 2019-02-28 |
Family
ID=65524368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017153432A Pending JP2019032709A (ja) | 2017-08-08 | 2017-08-08 | 分散システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019032709A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111866094A (zh) * | 2020-07-01 | 2020-10-30 | 天津联想超融合科技有限公司 | 一种定时任务处理方法、节点及计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63242150A (ja) * | 1987-03-30 | 1988-10-07 | 株式会社東芝 | 電力系統監視方式 |
JP2005043962A (ja) * | 2003-07-22 | 2005-02-17 | Nippon Telegr & Teleph Corp <Ntt> | 分散サーバシステム、サーバ、アプリケーションプロセス起動制御方法、及びプログラム |
JP2008225745A (ja) * | 2007-03-12 | 2008-09-25 | Nec Corp | プロセス制御装置および方法およびプログラム |
JP2011186637A (ja) * | 2010-03-05 | 2011-09-22 | Ntt Data Corp | リソース連携システム及びリソース連携方法 |
JP2014010772A (ja) * | 2012-07-02 | 2014-01-20 | Fujitsu Ltd | システム管理装置、システムの管理方法、及びシステムの管理プログラム |
JP2014178976A (ja) * | 2013-03-15 | 2014-09-25 | Nec Corp | アプリケーション起動制御方法とシステムと装置とプログラム |
WO2017066972A1 (en) * | 2015-10-23 | 2017-04-27 | Oracle International Corporation | System and method for booting application servers in parallel |
-
2017
- 2017-08-08 JP JP2017153432A patent/JP2019032709A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63242150A (ja) * | 1987-03-30 | 1988-10-07 | 株式会社東芝 | 電力系統監視方式 |
JP2005043962A (ja) * | 2003-07-22 | 2005-02-17 | Nippon Telegr & Teleph Corp <Ntt> | 分散サーバシステム、サーバ、アプリケーションプロセス起動制御方法、及びプログラム |
JP2008225745A (ja) * | 2007-03-12 | 2008-09-25 | Nec Corp | プロセス制御装置および方法およびプログラム |
JP2011186637A (ja) * | 2010-03-05 | 2011-09-22 | Ntt Data Corp | リソース連携システム及びリソース連携方法 |
JP2014010772A (ja) * | 2012-07-02 | 2014-01-20 | Fujitsu Ltd | システム管理装置、システムの管理方法、及びシステムの管理プログラム |
JP2014178976A (ja) * | 2013-03-15 | 2014-09-25 | Nec Corp | アプリケーション起動制御方法とシステムと装置とプログラム |
WO2017066972A1 (en) * | 2015-10-23 | 2017-04-27 | Oracle International Corporation | System and method for booting application servers in parallel |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111866094A (zh) * | 2020-07-01 | 2020-10-30 | 天津联想超融合科技有限公司 | 一种定时任务处理方法、节点及计算机可读存储介质 |
CN111866094B (zh) * | 2020-07-01 | 2023-10-31 | 天津联想超融合科技有限公司 | 一种定时任务处理方法、节点及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180351792A1 (en) | System and method for providing secure and redundant communications and processing for a collection of internet of things (iot) devices | |
JP5579650B2 (ja) | 監視対象プロセスを実行する装置及び方法 | |
US11044144B2 (en) | Self-monitoring | |
US20210133054A1 (en) | Prioritized transfer of failure event log data | |
US20090164565A1 (en) | Redundant systems management frameworks for network environments | |
US11397632B2 (en) | Safely recovering workloads within a finite timeframe from unhealthy cluster nodes | |
JP2017187992A (ja) | 制御装置、制御方法およびプログラム | |
JP6558037B2 (ja) | 運用管理プログラム、運用管理方法、および運用管理装置 | |
US9032014B2 (en) | Diagnostics agents for managed computing solutions hosted in adaptive environments | |
JP2015230720A (ja) | 計算機システム | |
JP2019032709A (ja) | 分散システム | |
JP4905165B2 (ja) | 監視支援プログラム、監視方法および監視システム | |
US11159610B2 (en) | Cluster formation offload using remote access controller group manager | |
US20220066704A1 (en) | Monitoring system, monitoring method, and monitoring program | |
CN114189429A (zh) | 一种服务器集群故障的监测系统、方法、装置及介质 | |
JP3622719B2 (ja) | 障害情報表示システム | |
CN107783852B (zh) | 一种dump文件生成方法及终端 | |
JP2014215622A (ja) | プラント監視システム及びプラント監視方法 | |
JP4137004B2 (ja) | 分散型計算機システムのプロセス管理方法 | |
JPH0424838A (ja) | マルチプロセッサの障害管理方式 | |
JP5836438B1 (ja) | 異常監視装置、異常監視システム及び異常監視プログラム | |
US20240095058A1 (en) | System and method for self-healing agent and cloud desktop | |
JP2019040331A (ja) | 分散制御システムおよびノード | |
JP6695517B1 (ja) | プログラマブル表示器およびデータ管理方法 | |
JP7304833B2 (ja) | 情報処理装置、情報処理方法、および、情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190902 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200910 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210119 |