JP2011253475A - 計算機システム - Google Patents

計算機システム Download PDF

Info

Publication number
JP2011253475A
JP2011253475A JP2010128429A JP2010128429A JP2011253475A JP 2011253475 A JP2011253475 A JP 2011253475A JP 2010128429 A JP2010128429 A JP 2010128429A JP 2010128429 A JP2010128429 A JP 2010128429A JP 2011253475 A JP2011253475 A JP 2011253475A
Authority
JP
Japan
Prior art keywords
service
status
computer system
server
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010128429A
Other languages
English (en)
Inventor
Miki Shirone
未来 城根
Atsushi Matsushita
淳 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2010128429A priority Critical patent/JP2011253475A/ja
Publication of JP2011253475A publication Critical patent/JP2011253475A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】負荷分散装置に処理の停止を明示的に指示しなくても分散処理の振り分けを停止、再開できる計算機システムを提供する。
【解決手段】サーバにインストールされているサービスXには、故障判定部4を備える。
負荷分散装置2は、周期的にサービスXに対してライブチェック信号を送信する。サービスXが正常に動作している時、故障判定部はステータス記録部5に「可」と記載し、負荷分散装置2に現在のステータスを通知する。サービスXに異常があるときは、同様に「否」と記載し、負荷分散装置2に現在のステータスを通知する。ステータス記録部5の値を強制的に変更することによって、サービスXを負荷分散装置2の分散処理(振り分け対象)から除外し、また、加えることを可能とする計算機システムを提供する。
【選択図】図2

Description

この発明は、計算機処理において、負荷分散装置を使用したサービスの並列処理を提供する計算機システムに関するものであり、例えばWebアプリケーションを使用した計算機システムに関するものである。
従来、サーバ装置によるサービスを継続したまま、実行するサービスを切り替える方法として、明示的な指示により特定サーバを切り離し、あるいは予備サーバを利用する方法が用いられていた。この場合、ユーザはアクセス先サーバを意識する必要があった。
そこで、現在稼働中のサービスを維持したまま新旧サービスを入れ替える方法として、特許文献1のような、サービス切替制御手段を利用するサービス切替システムが提案されている。
特開2002−183106 段落0021
特許文献1によるサービス切替システムにおいて、バージョンアップなどによってサービスを保守する必要がある場合、サービス切替手段に対して、切り替え対象となるサービスの情報、切り替え後のサービスの情報、切替日時やタイミングなどのスケジュール情報を指示する必要がある。
この場合、結局の所、負荷分散装置に対して明示的に切り替えを指示しなければならないという従来からの問題点が解決できなかった。
この発明は、このような課題を解決するためになされたものであり、サービスの自己診断機能を利用して、簡単に、安価に、間接的に負荷分散装置に対して、各サーバが提供するサービスの利用の可否を認知させることができる計算機システムを提供することを目的とする。
この発明に係る計算機システムは、
ネットワークに接続した利用者端末からのサービスの利用要求を、複数のサーバ装置にインストールした同種のサービスに分散させる負荷分散装置を備えた計算機システムにおいて、
各サーバ装置にインストールされた個々のサービスは、所定の間隔で負荷分散装置が送信するライブチェック信号を受けて当該サービスの稼働状況を自己診断し、自己診断の結果である現在のステータスの値を当該サービス内のステータス記録部に記録する故障判定応答部と、
上記ステータス記録部のステータスの値を書き換える、故障判定応答部とは別系統のステータス変更部とを備え、
負荷分散装置は、当該サービスのステータスの値が「可」のときは、当該サービスを分散処理対象サービスとし、ステータスの値が「否」のときは、当該サービスを分散処理対象サービスから除外することを特徴とするものである。
この発明に係る計算機システムの各サーバ装置にインストールされた個々のサービスは、所定の間隔で負荷分散装置が送信するライブチェック信号を受けて当該サービスの稼働状況を自己診断し、自己診断の結果である現在のステータスの値を当該サービス内のステータス記録部に記録する故障判定応答部と、
上記ステータス記録部のステータスの値を書き換える、故障判定応答部とは別系統のステータス変更部とを備え、
負荷分散装置は、当該サービスのステータスの値が「可」のときは、当該サービスを分散処理対象サービスとし、ステータスの値が「否」のときは、当該サービスを分散処理対象サービスから除外することを特徴とするものなので、
簡単に、安価に、間接的に負荷分散装置に対して、各サーバが提供するサービスの利用の可否を認知させることができる。したがって、特定のサーバの特定のサービスについて保守が必要な場合であっても、負荷分散装置に明示的切り替え指示をすることなく当該サービスの利用要求を他のサーバに振り分けることができる。
この発明の計算機システムの実施の形態1におけるシステム構成図である。 この発明の計算機システムの実施の形態1におけるサービスの構成と、負荷分散装置とサービスの関係を示す概念図である。 この発明の計算機システムの実施の形態1における負荷分散装置がおこなう、サービスの故障判定のフローを示す図である。 この発明の計算機システムの実施の形態1における、あるサービスのステータスが「否」である状態を示す図である。 この発明の計算機システムの実施の形態2におけるシステム構成図である。 この発明の計算機システムの実施の形態2におけるシステムの入れ替え過程示す図である。 この発明の計算機システムの実施の形態2におけるシステムの入れ替え過程示す図である。 この発明の計算機システムの実施の形態2におけるシステムの入れ替え過程示す図である。 この発明の計算機システムの実施の形態3におけるシステム構成を示す図である。 この発明の計算機システムの実施の形態3における装置内負荷制御装置の動作を示す図である。
実施の形態1.
以下、この発明の実施の形態1を図1に基づいて説明する。
図1は、計算機システム100のシステム構成図である。
図1において、計算機システム100は正常に稼動している状態を示している。各サービス利用者は、ネットワーク1に接続した負荷分散装置2を経由して、複数のサーバ3a−3cにインストールされて提供される複数のサービスX、Y、Zに対して処理の要求を出し、その処理結果を受け取っている。
サービス利用者は、利用するサービスの種類は意識するが、そのサービスがサーバ3a−3cのいずれのサーバで実際に分散処理(振り分け処理)されているかについては、意識していない。
次に、計算機システム100の動作について説明する。
図2は各サービスの構成と負荷分散装置2との関係を示す概念図である。
図1で示した各サービスX−Zの内部には、図2に示すような故障判定応答部4を設けている。負荷分散装置2は故障判定応答部4に対して、一定間隔毎に故障判定のためのライブチェック信号を送信している。
ライブチェック信号を受信した故障判定応答部4はサービスのセルフチェックをおこない、当該サービスが正常に機能しているときは同サービス内のステータス記録部5に「可」と記録し、サービスに異常がある場合は「否」と記録する。更に故障判定応答部4は、現在のステータス状態を負荷分散装置2に送信する。
ステータス変更部7は、故障判定応答部4とは別系統でステータス記録部5の値を変更する機能を有する。
負荷分散装置2は、ステータス記録部の値に応じて各サーバ3a−3cの提供するサービスの故障判定を実施する。
図3は、負荷分散装置2がおこなうサービスX−Zの故障判定のフローを示す図である。
受信した、あるサービスのステータスが「否」の場合は、負荷分散装置2は当該サービスを故障と判定し、サービス利用者のサービス利用要求の振り分けの対象サービスから当該サービスを除外する。ステータスが「可」の場合には、正常と判断し、当該サービスをサービス利用者の振り分け対象サービスに加える。
図4は、計算機システム100のサービスZのステータスが「否」である状態を示す図である。サーバ3a内にサービスZは存在しているが、負荷分散装置2の故障判定により、当該サービスZはサービス利用者からの振り分けの対象から除外されることになる。
本発明では、このサービスの状態を示すステータスを動的に「可」「否」と変更することにより、直接に負荷分散装置2に、振り分け対象サービス変更の指示を出すことなく、振り分けの対象サービスを制御する。
例えば、図4のように、サービスZのステータス記録部5の値をステータス変更部7により強制的に「否」に変更すると、次回のライブチェックが行われるまで、サーバ3aのサービスZは負荷分散装置2による、サービスの振り分け対象から除外される。
この発明に係る計算機システム100によれば、サービスの自己診断機能を利用して、簡単に、安価に、間接的に負荷分散装置2に対して、各サーバ3a−3bが提供するサービスX−Zの利用の可否を認知させることができる。
したがって、特定のサーバの特定のサービスについて保守が必要な場合であっても、負荷分散装置2に直接、明示的切り替え指示をすることなく当該サービスの利用要求を他のサーバに振り分けることができる。
実施の形態2.
実施の形態1では、単純な振り分けの対象変更を実施する場合について述べた。本実施の形態では、故障判定応答部4を応用した新旧サービスの入れ替えについて、図5から図8を用いて、実施の形態1と異なる部分を中心に説明する。
図5乃至図8は、計算機システム100の装置構成とサービス入れ替えの工程を示す図である。これからサービスを入れ替える対象となるサービスをサービスYとする。
まず、図6のようにサーバ3aのサービスY用のステータス記録部5の記載をステータス変更部7により故意に「否」に変更することで負荷分散装置2の振り分けの対象から外す。この状態ではサーバ3aのサービスYに対しては、サービス利用者からの要求がなくなる。ここで図7のように、サーバ3aの旧サービスYを新サービスYに変更し、サーバ3aのサービスYを起動してから、サーバ3bおよびサーバ3cのサービスYのステータス記録部5の記録をいずれも「否」に変更し、即座にサーバ3aのサービスYのステータス記録部5の記録を「可」に変更する。そして、サーバ3bおよびサーバ3cの旧サービスYを新サービスYに変更し、図8に示すようにサーバ3bおよびサーバ3cのステータス記録部5の記録を「可」にすることで、新旧サービスYの入れ替えを完了させることができる。この時、ライブチェック信号の送信周期を、サービスの入れ替え所要時間に合わせて変更することにより、サービスの復帰を最短とできるよう調整する。
本発明の実施の形態2では、図7で示す状態に移行する際に、新サービスYがサーバ3a上で起動完了してから、ステータス記録部5の記録を「可」にするため、サーバ3aからサーバ3cまでのいずれかのサービスYを提供しながらサービスYの更新をすることができる。
また、ライブチェック信号の送信周期を、サービスの入れ替え所要時間に合わせて変更することにより、サービスの復帰を最短とし、システム全体の運用を安定できる。
実施の形態3.
実施の形態2では、サービスの新旧入れ替えについて説明したが、本実施の形態3では、各サーバ内に装置内負荷制御装置6を設けることで、特定サービスを優先実行する計算機システムを得ることができる。
図9は本実施の形態における計算機システム300のシステム構成図である。
サービスYが優先度の高いサービスであることを示している。
各サーバ内の装置内負荷制御装置6は、特定のサービスの負荷が予め設定した値より高くなると、ステータス変更部7は優先度の低いサービスを停止するための設定をステータス記録部5におこなう。ここでは、サービスYの負荷が設定値を超える場合、サーバ3aではサービスXを、サーバ3bではサービスZを停止するための設定をするものとする。
今この状態において、サービスYの負荷が高くなると、図10に示すように、サーバ3aおよびサーバ3b内の装置内負荷制御装置6がこれを検知し、サーバ3aではサービスXを、サーバ3bではサービスZのステータス記録部5の記録をそれぞれ強制的に「否」にするようステータス変更部に指示する。
すると負荷分散装置2は、サーバ3aのサービスX及び、サーバ3bのサービスZへのサービス利用要求の振り分けを停止する。これによって各サーバ3a、3b内のサービスYの相対的処理能力を上昇させて、サービスYの実行を優先させることが可能となる。
図9、図10ではサーバが2台の構成を示したので、全体として1台当たりの処理量は、優先処理をさせても、させなくても同じである。しかし、全体として優先度の高いサービスから優先的に実行できるという利点がある。なお、サーバの台数が増えるほど優先処理の効率が向上することになる。
100,300 計算機システム、1 ネットワーク、2 負荷分散装置、
3a,3b,3c サーバ、X,Y,Z サービス、4 故障判定応答部、
5 ステータス記録部、6 装置内負荷制御装置、7 ステータス変更部。

Claims (3)

  1. ネットワークに接続した利用者端末からのサービスの利用要求を、複数のサーバ装置にインストールした同種のサービスに分散させる負荷分散装置を備えた計算機システムにおいて、
    各サーバ装置にインストールされた個々の前記サービスは、
    所定の間隔で前記負荷分散装置が送信するライブチェック信号を受けて当該サービスの稼働状況を自己診断し、自己診断の結果である現在のステータスの値を当該サービス内のステータス記録部に記録する故障判定応答部と、
    上記ステータス記録部のステータスの値を書き換える、前記故障判定応答部とは別系統のステータス変更部とを備え、
    前記負荷分散装置は、当該サービスのステータスの値が「可」のときは、当該サービスを分散処理対象サービスとし、ステータスの値が「否」のときは、当該サービスを分散処理対象サービスから除外することを特徴とする計算機システム。
  2. 前記ライブチェック信号の周期は可変であることを特徴とする請求項1に記載の計算機システム。
  3. 前記各サーバは、装置内負荷制御装置を備え、
    前記装置内負荷制御装置は、前記各サーバ内での特定のサービスの負荷が所定の値を超えた場合は、優先度の低いサービスのステータスの値を「否」と書き換えるよう前記ステータス変更部に指示することを特徴とする請求項1又は請求項2に記載の計算機システム。
JP2010128429A 2010-06-04 2010-06-04 計算機システム Pending JP2011253475A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010128429A JP2011253475A (ja) 2010-06-04 2010-06-04 計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010128429A JP2011253475A (ja) 2010-06-04 2010-06-04 計算機システム

Publications (1)

Publication Number Publication Date
JP2011253475A true JP2011253475A (ja) 2011-12-15

Family

ID=45417331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010128429A Pending JP2011253475A (ja) 2010-06-04 2010-06-04 計算機システム

Country Status (1)

Country Link
JP (1) JP2011253475A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014038389A (ja) * 2012-08-10 2014-02-27 Konica Minolta Inc 画像形成装置
JP2014178947A (ja) * 2013-03-15 2014-09-25 Bank Of Tokyo-Mitsubishi Ufj Ltd プロセス監視プログラム及びプロセス監視システム
US9338320B2 (en) 2012-08-10 2016-05-10 Konica Minolta, Inc. Image forming apparatus and method of controlling the same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014038389A (ja) * 2012-08-10 2014-02-27 Konica Minolta Inc 画像形成装置
US9338320B2 (en) 2012-08-10 2016-05-10 Konica Minolta, Inc. Image forming apparatus and method of controlling the same
JP2014178947A (ja) * 2013-03-15 2014-09-25 Bank Of Tokyo-Mitsubishi Ufj Ltd プロセス監視プログラム及びプロセス監視システム

Similar Documents

Publication Publication Date Title
US9870159B2 (en) Solid-state disk (SSD) management
JP5338906B2 (ja) サーバ管理プログラム、管理サーバ、仮想サーバ配置方法
US10657006B2 (en) Multi-RPO data protection
US10389850B2 (en) Managing redundancy among application bundles
US20170155560A1 (en) Management systems for managing resources of servers and management methods thereof
US9183102B2 (en) Hardware consumption architecture
US10530660B2 (en) Application bundle preloading
WO2012066604A1 (en) Server system and method for managing the same
US20120198200A1 (en) Method and apparatus of memory overload control
US20160344786A1 (en) Managing staleness latency among application bundles
JP2005149281A (ja) 情報処理システム、情報処理装置、情報処理装置の制御方法及びプログラム
WO2015049742A1 (ja) ストレージシステムおよびストレージシステム制御方法
US20200177674A1 (en) Dynamic distributor selection for network load balancing
JP2014186652A (ja) データ転送装置、データ転送システム、データ転送方法及びプログラム
US20200153645A1 (en) Increasing processing capacity of processor cores during initial program load processing
JPWO2017179537A1 (ja) ソフトウェア更新制御装置、ソフトウェア更新制御システム、ソフトウェア更新制御方法、及び、ソフトウェア更新制御プログラムが格納された記録媒体
US20200319890A1 (en) Increasing resources for partition to compensate for input/output (i/o) recovery event
Wang et al. Approaches for resilience against cascading failures in cloud datacenters
WO2014045549A1 (ja) マシン配置計画を生成する情報処理装置及びマシン配置計画生成方法
JP2013206379A (ja) クラスタ監視装置、クラスタ監視方法、及びプログラム
JP2011253475A (ja) 計算機システム
JP2013041515A (ja) 仮想データセンタシステム
JP5282569B2 (ja) 管理装置、管理システム、管理方法及び管理プログラム
JP6525761B2 (ja) ウェブサーバ、管理システム、およびその制御方法
JP2012141671A (ja) 仮想計算機の移動方法、仮想計算機システム及び管理サーバ