JP2018195113A - 管理サーバ、クラウドシステム、及び管理方法 - Google Patents

管理サーバ、クラウドシステム、及び管理方法 Download PDF

Info

Publication number
JP2018195113A
JP2018195113A JP2017098933A JP2017098933A JP2018195113A JP 2018195113 A JP2018195113 A JP 2018195113A JP 2017098933 A JP2017098933 A JP 2017098933A JP 2017098933 A JP2017098933 A JP 2017098933A JP 2018195113 A JP2018195113 A JP 2018195113A
Authority
JP
Japan
Prior art keywords
signal
test
application
instruction
test signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017098933A
Other languages
English (en)
Other versions
JP6924072B2 (ja
Inventor
祐介 賀内
Yusuke Kauchi
祐介 賀内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2017098933A priority Critical patent/JP6924072B2/ja
Publication of JP2018195113A publication Critical patent/JP2018195113A/ja
Application granted granted Critical
Publication of JP6924072B2 publication Critical patent/JP6924072B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】クラウドシステムが提供するサービスに不具合が生じることを適切に抑制する管理技術を提供する。【解決手段】管理サーバは、送信部と、受信部と、指示部と、を備える。前記送信部は、クラウドシステムが備える複数の被管理サーバが実行するアプリケーションそれぞれを経由してテスト用通信端末にテスト信号を送信する。前記受信部は、前記テスト用通信端末から送信される前記テスト信号に対する応答信号を、前記テスト信号の送信時に用いられた前記アプリケーションを経由して受信する。前記指示部は、前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合に、前記テスト信号の送信時に用いられた前記アプリケーションを例えば単一で前記処理負荷の分散対象から除外する指示信号を前記クラウドシステムが備える負荷分散装置に出力する。【選択図】図1

Description

本発明は、クラウドシステムを管理する技術に関する。
故障やCPUの負荷状態を検知して、検知結果に応じてサーバやアプリケーションをクラウドシステムの負荷分散対象から除外する技術は従来から存在する。CPUの負荷状態を検知する手法として、例えば特許文献1にはアプリケーション毎に異なるサーバ性能を効率的に計測して収集する方法が開示されている。
特開2006−285316号公報
しかしながら、サーバやアプリケーションが遅延しながらも動作している場合は、サーバやアプリケーションが故障している訳ではないため、故障を検知することができず、遅延しながらも動作しているサーバやアプリケーションをクラウドシステムの負荷分散対象から除外できなかった。その結果、クラウドシステムが提供するサービスに処理の遅延(不具合)が生じることがあった。
また、CPUが高負荷状態であってもクラウドシステムが提供するサービスに不具合が生じていない場合は、負荷分散の対象から除外する必要はない。それにもかかわらず、これまではCPUの高負荷状態であるサーバをクラウドシステムの負荷分散対象から一律に除外していたため、必要以上に負荷分散対象からの除外が実行されるおそれがあった。CPUの高負荷状態によってクラウドシステムが提供するサービスに不具合が生じているかを判断できなかったためである。
本発明は、上記の課題に鑑み、クラウドシステムが提供するサービスに不具合が生じることを適切に抑制する管理技術を提供することを目的とする。
本発明に係る管理サーバは、複数の被管理サーバと、前記複数の被管理サーバに対して処理負荷を分散させる負荷分散装置と、を備えるクラウドシステムに組み込み可能な管理サーバであって、前記複数の被管理サーバが実行するアプリケーションそれぞれを経由してテスト用通信端末にテスト信号を送信する送信部と、前記テスト用通信端末から送信される前記テスト信号に対する応答信号を、前記テスト信号の送信時に用いられた前記アプリケーションを経由して受信する受信部と、前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合に、前記テスト信号の送信時に用いられた前記アプリケーションを単一で、又は、同一の仮想サーバに属する他の前記アプリケーションとともに、又は、同一の物理サーバに属する他の前記アプリケーションとともに、前記処理負荷の分散対象から除外する指示信号を前記負荷分散装置に出力する指示部と、を備える構成(第1の構成)である。
上記第1の構成の管理サーバにおいて、前記処理負荷の分散対象から除外された前記アプリケーションが単一で、又は、同一の仮想サーバに属する他の前記アプリケーションとともに、又は、同一の物理サーバに属する他の前記アプリケーションとともに、再起動した後、前記送信部は、再起動した前記アプリケーションそれぞれを経由して前記テスト用通信端末に前記テスト信号を送信し、再起動した前記アプリケーション全てに関して、前記受信部が、前記送信部が前記テスト信号を送信してから所定時間が経過する前に前記受信部が前記応答信号を受信する場合に、前記指示部は、前記指示信号の指示内容を解除する解除信号を前記負荷分散装置に出力する構成(第2の構成)であってもよい。
上記第1又は第2の構成の管理サーバにおいて、前記送信部の送信タイミングを操作する操作部をさらに備える構成(第3の構成)であってもよい。
上記第1〜第3いずれかの構成の管理サーバにおいて、前記送信部は、異なる場所に存在する複数の前記テスト用通信端末に前記テスト信号を送信する構成(第4の構成)であってもよい。
上記第4の構成の管理サーバにおいて、前記クラウドシステムは、前記複数の被管理サーバに前記負荷分散装置を介してネットワーク接続される複数のクライアント端末をさらに備え、前記複数のクライアント端末はそれぞれ異なる移動体に搭載され、前記テスト用通信端末としても機能する構成(第5の構成)であってもよい。
上記第4又は第5の構成の管理サーバにおいて、前記送信部が前記テスト信号を送信してから前記受信部が前記応答信号を受信するまでに要する時間の平均値を場所毎に算出する算出部をさらに備える構成(第6の構成)であってもよい。
上記第1〜第6いずれかの構成の管理サーバにおいて、前記アプリケーションは音声信号を処理する構成(第7の構成)であってもよい。
上記第1〜第7いずれかの構成の管理サーバにおいて、前記指示信号が前記アプリケーションを単一で前記処理負荷の分散対象から除外する信号であって、前記アプリケーション全てに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、又は、前記指示信号が前記アプリケーションを前記仮想サーバ単位で前記処理負荷の分散対象から除外する信号であって、前記仮想サーバそれぞれで少なくとも一つの前記アプリケーションに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、又は、前記指示信号が前記アプリケーションを前記物理サーバ単位で前記処理負荷の分散対象から除外する信号であって、前記物理サーバそれぞれで少なくとも一つの前記アプリケーションに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、前記指示部は例外的に前記指示信号を出力しない構成(第8の構成)であってもよい。
本発明に係るクラウドシステムは、複数の被管理サーバと、前記複数の被管理サーバに対して処理負荷を分散させる負荷分散装置と、上記第1〜第8いずれかの構成の管理サーバと、を備える構成(第9の構成)である。
上記第9の構成のクラウドシステムにおいて、前記管理サーバを2つ備え、前記複数の被管理サーバ、前記負荷分散装置、及び一方の前記管理サーバをデータセンタ内に設置し、前記データセンタと他方の前記管理サーバとがネットワーク接続される構成(第10の構成)であってもよい。
上記第10の構成のクラウドシステムにおいて、前記指示信号が前記アプリケーションを単一で前記処理負荷の分散対象から除外する信号であって、両方の前記管理サーバによるテストにおいて前記アプリケーション全てに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、又は、前記指示信号が前記アプリケーションを前記仮想サーバ単位で前記処理負荷の分散対象から除外する信号であって、両方の前記管理サーバによるテストにおいて前記仮想サーバそれぞれで少なくとも一つの前記アプリケーションに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、又は、前記指示信号が前記アプリケーションを前記物理サーバ単位で前記処理負荷の分散対象から除外する信号であって、両方の前記管理サーバによるテストにおいて前記物理サーバそれぞれで少なくとも一つの前記アプリケーションに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、前記指示部は例外的に前記指示信号を出力せず、一部の前記アプリケーションの処理優先度を残りの前記アプリケーションの処理優先度よりも高くする構成(第11の構成)であってもよい。
本発明に係る管理方法は、複数の被管理サーバと、前記複数の被管理サーバに対して処理負荷を分散させる負荷分散装置と、を備えるクラウドシステムの管理方法であって、前記複数の被管理サーバが実行するアプリケーションそれぞれを経由してテスト用通信端末にテスト信号を送信する送信工程と、前記テスト用通信端末から送信される前記テスト信号に対する応答信号を、前記テスト信号の送信時に用いられた前記アプリケーションを経由して受信する受信工程と、前記送信工程が前記テスト信号を送信してから所定時間が経過しても前記受信工程が前記応答信号を受信しない場合に、前記テスト信号の送信時に用いられた前記アプリケーションを単一で、又は、同一の仮想サーバに属する他の前記アプリケーションとともに、又は、同一の物理サーバに属する他の前記アプリケーションとともに、前記処理負荷の分散対象から除外する指示信号を前記負荷分散装置に出力する指示工程と、を備える構成(第12の構成)である。
本発明の管理技術によれば、クラウドシステムが提供するサービスに不具合が生じることを適切に抑制することができる。
クラウドシステムの一構成例を示す図 配車指示が送信された場合の動作を説明する図 監視サーバの一構成例を示す図 テスト信号が送信された場合の動作を説明する図 管理サーバの動作例を示すフローチャート 管理サーバの他の動作例を示すフローチャート 監視サーバの他の構成例を示す図 クラウドシステムの一構成例を示す図
以下、本発明の例示的な実施形態について、図面を参照しながら詳細に説明する。
<1.クラウドシステムの構成>
図1は、クラウドシステムの一構成例を示す図である。図1に示すクラウドシステムは、管理サーバ300及びデータセンタ700を備えている。以下、図1に示すクラウドシステムをタクシーの配車システムとして利用する場合について説明する。
クライアント端末100及びテスト用通信端末400は、公衆網500を介してデータセンタ700と通信可能である。
配車センタ200及び管理サーバ300は、専用網600を介してデータセンタ700と通信可能である。なお、本実施形態と異なり、配車センタ200及び管理サーバ300が公衆網500を介してデータセンタ700と通信可能であっても構わない。
クライアント端末100は、タクシーに定常的又は一時的に搭載される。図1では、クライアント端末100を1台しか図示していないが、実際には図1に示すクラウドシステムを利用するタクシーの台数分のクライアント端末100が存在する。クライアント端末100は、ハンドマイク101と、情報処理装置102と、位置情報取得部103と、IP無線機104と、を備えている。
ハンドマイク101は、電気信号である配車指示を音声に変換して運転手に伝え、運転手が発した返答を電気信号である指示応答に変換して情報処理装置102に出力する。
情報処理装置102は、配車指示、指示応答、及び位置情報等を処理する。
位置情報取得部103は、クライアント端末100の位置情報ひいてはクライアント端末100を搭載しているタクシーの位置情報を取得する。位置情報取得部103としては、例えばナビゲーションシステム等で利用されるGPS(Global Positioning System)受信部を用いることができる。GPS受信部は、複数のGPS衛星からの信号を受信して、現在時刻におけるクライアント端末100の位置が地球上における経度緯度で表現された情報を取得する。
IP無線機104は、公衆網500を介してデータセンタ700のM2M通信機701と通信する。
配車センタ200は、パーソナルコンピュータ(以下、「PC」と略す)201及び202と、スイッチ203と、ローカルサーバ204と、ルータ205と、を備えている。図1では、配車センタ200を1つしか図示していないが、実際には図1に示すクラウドシステムを利用するタクシー会社の数だけ配車センタ200が存在する。
スイッチ203は、ローカルサーバ204と接続するPCを切り替える。ローカルサーバ204は、PC201又は202からの命令に応じて、配車指示をルータ205及び専用網600を介してデータセンタ700に送信する。
管理サーバ300は、PC301と、監視サーバ302と、ルータ303と、を備えている。監視サーバ302は、周期的にテスト信号をルータ303及び専用網600を介してデータセンタ700に送信する。また、監視サーバ302は、PC301からの命令に応じてテスト信号をルータ303及び専用網600を介してデータセンタ700に送信してもよい。
テスト用通信端末400は、情報処理装置401と、IP無線通信機402と、を備えている。情報処理装置401は、テスト信号を受信すると、応答信号を出力する。
IP無線機402は、公衆網500を介してデータセンタ700のM2M通信機701と通信する。
データセンタ700は、M2M通信機701と、ルータ702と、負荷分散装置703と、スイッチ704及び707と、物理サーバ705及び706と、データベースサーバ708及び709と、データベース710と、を備えている。
データセンタ700は、M2M通信機701及びルータ702を用いて、クライアント端末100、配車センタ200、管理サーバ300、及びテスト用通信端末400と通信する。
負荷分散装置703は、物理サーバ705及び706及び各物理サーバが備える仮想サーバに対して処理負荷を分散させる。
スイッチ704は、負荷分散装置703と接続する物理サーバを切り替える。
物理サーバ705は、仮想サーバ705a及び705bを備えている。仮想サーバ705aは、アプリケーション705a1〜705a3と、音声制御部705a4と、記憶部705a5と、を備えている。仮想サーバ705aは、例えば4つのCPUを備え各CPUがアプリケーション705a1〜705a3及び音声制御部705a4のいずれか一つを処理する構成であってもよく、CPUをマルチコア対応としてCPUの個数を3つ以下にしてもよい。音声制御部705a4は、アプリケーション705a1〜705a3それぞれと協働し、記憶部705a5はアプリケーション705a1〜705a3それぞれの処理内容をログデータとして記憶する。
仮想サーバ705bは仮想サーバ705aと同様の構成であり、物理サーバ706は物理サーバ705と同様の構成である。上述した仮想サーバ及び物理サーバが管理サーバ300によって管理される被管理サーバである。被管理サーバが複数存在していれば、仮想サーバの数及び物理サーバの数は本実施形態と同一でなくても構わない。
スイッチ707は、負荷分散装置703と接続するデータベースサーバを切り替える。
データベースサーバ708及び709は、データセンタ700が受信するデータ等に基づいてデータベース710を更新する。例えば、データベース710に格納されている各クライアント端末100の位置情報が更新される。
<2.配車指示が送信された場合の動作>
図2は、配車指示が送信された場合の動作を説明する図である。PC201又は202がローカルサーバ204に配車指示を送信すると、ローカルサーバ204は物理サーバ705又は706の或る1つのアプリケーションに配車指示を送信する。なお、物理サーバ705又は706の或る1つのアプリケーションは、負荷分散装置703によって指定される。
物理サーバ705又は706の或る1つのアプリケーションは、配車指示に含まれる配車先に関する情報に基づいて、データベース710に送信先を確認する。データベース710は、配車先の周辺に位置する所定数のクライアント端末100を送信先とすることを、物理サーバ705又は706の或る1つのアプリケーションに指示する。
物理サーバ705又は706の或る1つのアプリケーションは、データベース710からの送信先指示に従って、配車先の周辺に位置する所定数のクライアント端末100の情報処理装置102に配車指示を送信する。
物理サーバ705又は706の或る1つのアプリケーションは、配車指示を受信した情報処理装置102から最も早く返ってきた配車指示応答を受け付け、その受け付けた配車指示応答をローカルサーバ204に送信する。これにより、1つの配車が完了する。
<3.テスト信号が送信された場合の動作>
テスト信号が送信された場合の動作を説明する前に、テスト信号を送信する監視サーバ302の構成について説明する。図3は、監視サーバの一構成例を示す図である。
図3に示す監視サーバ302は、制御部302aと、記憶部302bと、を備えている。制御部302aは、CPU、RAM、及びROMを備えたマイクロコンピュータである。制御部302aは、テスト信号を送信する送信部302a1と、テスト信号に対する応答信号を受信する受信部302a2と、指示信号を負荷分散装置703に出力する指示部302a3と、を備えている。記憶部302bは、例えばEEPROM、フラッシュメモリ、ハードディスクドライブ等の不揮発性の記憶媒体である。記憶部302bは、プログラム302b1と、被管理サーバデータ302b2と、を備えている。プログラム302b1は、制御部302aによって読み出され、制御部302aが監視サーバ302を制御するために実行される。被管理サーバデータ302b2は、例えば各被管理サーバと各アプリケーションとの関係を示すデータであって、送信部302a1がテスト信号を送信する際に利用される。
図4は、テスト信号が送信された場合の動作を説明する図である。監視サーバ302は物理サーバ705又は706の或る1つのアプリケーションにテスト信号を送信する。なお、物理サーバ705又は706の或る1つのアプリケーションは、監視サーバ302によって指定される。
物理サーバ705又は706の或る1つのアプリケーションは、テスト信号に基づいて、データベース710に送信先を確認する。データベース710は、テスト用通信端末400の情報処理装置401を送信先とすることを、物理サーバ705又は706の或る1つのアプリケーションに指示する。
物理サーバ705又は706の或る1つのアプリケーションは、データベース710からの送信先指示に従って、テスト用通信端末400の情報処理装置401にテスト信号を送信する。
物理サーバ705又は706の或る1つのアプリケーションは、テスト信号を受信した情報処理装置401から返ってきた応答信号を受け付け、その受け付けた応答信号を監視サーバ302に送信する。これにより、物理サーバ705又は706の或る1つのアプリケーションに関する1回のテストが完了する。
<4.監視サーバの動作>
図5は、管理サーバ300の動作例を示すフローチャートである。管理サーバ300は周期的に(例えば数秒毎に)図5に示すフロー動作を開始する。まず、監視サーバ302の送信部302a1は、物理サーバ705又は706の或る1つのアプリケーションを経由してテスト用通信端末400にテスト信号を送信する(ステップS11)。次に、監視サーバ302の制御部302aは、監視サーバ302の送信部302a1がテスト信号を送信してから所定時間が経過しても、テスト信号に対する応答信号を、テスト信号の送信時に用いられたアプリケーションを経由して監視サーバ302の受信部302a2が受信していないか否かを判定する(ステップS12)。
監視サーバ302の受信部302a2が所定時間以内に応答信号を受信していない場合、監視サーバ302の指示部302a3は、テスト信号の送信時に用いられたアプリケーションを分散対象から除外する指示信号を負荷分散装置703に出力し(ステップS13)、図5に示すフロー動作を終了する。なお、分散対象から除外する方法としては、(I)テスト信号の送信時に用いられたアプリケーションを単一で除外する方法、(II)テスト信号の送信時に用いられたアプリケーションを同一の仮想サーバに属する他のアプリケーションとともに除外する方法、(III)テスト信号の送信時に用いられたアプリケーションを同一の物理サーバに属する他のアプリケーションとともに除外する方法、のいずれを採用してもよい。例えば、アプリケーション705a1を分散対象から除外する場合、アプリケーション705a1を単独で除外してもよく、同一の仮想サーバ705aに属するアプリケーション705a1〜705a3を全て除外してもよく、同一の物理サーバ705に属する全てのアプリケーションを全て除外してもよい。
一方、監視サーバ302の受信部302a2が所定時間以内に応答信号を受信している場合、監視サーバ302の指示部302aが指示信号を出力することなく、図5に示すフロー動作を終了する。
図5に示す動作フローは、テスト信号の送信時に用いられたアプリケーションを毎回変更して実行され、全てのアプリケーションに対してテストが実行される。ただし、分散対象から除外されたアプリケーションに対しては、分散対象の除外が解除される迄は、テストが実行されない。
管理サーバ300によって実行されるテストによると、テストによって処理の遅延が実際に生じた場合に、テスト信号の送信時に用いられたアプリケーションを分散対象から除外するので、除外漏れや過度な除外を防止することができる。したがって、クラウドシステムが提供するサービスに不具合が生じることを適切に抑制することができる。特に、タクシー配車システムでは、24時間365日絶え間なく正常に稼働し続けることが要求されているため、処理の遅延を無くしてクラウドシステムが提供するサービスに不具合が生じないようにすることは重要である。また、タクシー配車システムでは、アプリケーションが音声信号を処理しているため、処理に遅延が生じると、聞き手が認識できない音声が出力されることになり、重大な障害となってしまう。したがって、アプリケーションが音声信号を処理している場合、管理サーバ300によって実行されるテストは特に有用である。
上述した実施形態では、管理サーバ300は周期的に図5に示すフロー動作を開始したが、それに代えて或いはそれに加えて、PC301のキーボードやポインティングデバイス等の操作部が送信部302a1の送信タイミングを操作するようにしてもよい。これにより、例えば配車センタ200のオペレータから管理サーバ300のオペレータに対して、クラウドシステムが提供するサービスに不具合に関する苦情が寄せられた場合に、すぐに原因究明に取り掛かることができる。
図6は、管理サーバ300の他の動作例を示すフローチャートである。管理サーバ300は、処理負荷の分散対象から除外されたアプリケーションが単一で再起動した後に、図6に示すフロー動作を開始する。なお、アプリケーションの再起動は、管理サーバ300からの命令によって実行されてもよく、アプリケーション自身によって自律的に実行されてもよい。
まず監視サーバ302の送信部302a1は、再起動したアプリケーションを経由してテスト用通信端末400にテスト信号を送信する(ステップS21)。次に、監視サーバ302の制御部302aは、監視サーバ302の送信部302a1がテスト信号を送信してから所定時間が経過しても、テスト信号に対する応答信号を、テスト信号の送信時に用いられたアプリケーションを経由して監視サーバ302の受信部302a2が受信していないか否かを判定する(ステップS22)。
監視サーバ302の受信部302a2が所定時間以内に応答信号を受信している場合、監視サーバ302の指示部302a3は、テスト信号の送信時に用いられたアプリケーションに対する指示信号の指示内容を解除する解除信号を負荷分散装置703に出力し(ステップS23)、図6に示すフロー動作を終了する。なお、図5に示すフロー動作において、テスト信号の送信時に用いられたアプリケーションを同一の仮想サーバに属する他のアプリケーションとともに除外していた場合、分散対象から除外していた同一の仮想サーバに属するアプリケーションを再起動する。そして、その再起動したアプリケーション全てに関して、監視サーバ302の受信部302a2が所定時間以内に応答信号を受信していれば、監視サーバ302の指示部302a3が解除信号を負荷分散装置703に出力するようにする。同様に、図5に示すフロー動作において、テスト信号の送信時に用いられたアプリケーションを同一の物理サーバに属する他のアプリケーションとともに除外していた場合、分散対象から除外していた同一の物理サーバに属するアプリケーションを再起動する。そして、その再起動したアプリケーション全てに関して、監視サーバ302の受信部302a2が所定時間以内に応答信号を受信していれば、監視サーバ302の指示部302a3が解除信号を負荷分散装置703に出力するようにする。
一方、監視サーバ302の受信部302a2が所定時間以内に応答信号を受信していない場合、監視サーバ302の指示部302aが解除信号を出力することなく、図6に示すフロー動作を終了する。
上述した分散対象からの除外解除を実行することで、処理の遅延が解消されたアプリケーションを円滑に分散対象に戻すことができる。
<5.変形例>
上記実施形態は、全ての点で例示であって、制限的なものではないと考えられるべきであり、本発明の技術的範囲は、上記実施形態の説明ではなく、特許請求の範囲によって示されるものであり、特許請求の範囲と均等の意味及び範囲内に属する全ての変更が含まれると理解されるべきである。上述した実施形態において説明した種々の変形例は互いに矛盾しない限り適宜組合せて実施することができる。
例えば上述した実施形態では、管理サーバ300が1つのテスト用通信端末400に対してテスト信号を送信したが、管理サーバ300が異なる場所に存在する複数のテスト用通信端末400に対してテスト信号を送信してもよい。
管理サーバ300が異なる場所に存在する複数のテスト用通信端末400に対してテスト信号を送信することで、クラウドシステムが提供するサービスに不具合が生じる原因がデータセンタ700側にあるのかクライアント端末100や公衆網500側にあるのかを切り分けることが可能になる。
物理サーバ705又は706の或る1つのアプリケーションに対するテストにおいて、複数のテスト用通信端末400全てに関して処理の遅延が生じた場合、クラウドシステムが提供するサービスに不具合が生じる原因がデータセンタ700側にあると推定できる。一方、物理サーバ705又は706の或る1つのアプリケーションに対するテストにおいて、複数のテスト用通信端末400の一部のみに関して処理の遅延が生じた場合、クラウドシステムが提供するサービスに不具合が生じる原因が、処理の遅延が生じたテスト用通信端末400の場所に対応するクライアント端末100や公衆網500側にあると推定できる。したがって、監視サーバ302の制御部302aが上記のような推定処理を実行するようにしてもよい。
例えば、クライアント端末100の情報処理装置102にテスト用通信端末400の情報処理装置401の機能を付加することで、複数のクライアント端末100を異なる場所に存在する複数のテスト用通信端末400として利用することができる。これにより、テスト用通信端末400を設置するために必要となるコストを抑えることができる。また、テストにおいて端末が存在する場所とサービスが実際に利用されているときに端末が存在する場所とが一致するので、上述した推定処理における推定精度が向上する。
また、管理サーバ300が異なる場所に存在する複数のテスト用通信端末400に対してテスト信号を送信する場合、監視サーバ302を図7に示す構成にしてもよい。図7に示す監視サーバ302では、制御部302aが算出部302a4を備えている。
算出部302a4は、送信部302a1がテスト信号を送信してから受信部302a2が応答信号を受信するまでに要する時間の平均値を場所毎に算出する。算出部302a4によって算出された平均時間を確認することで、処理の遅延が特定の地域の問題であるか否かを容易に確認することができる。
なお、平均値としては、全てのアプリケーションに関する平均値であってもよく、特定のアプリケーションに関する平均値であってもよい。また、例えば、大きい方から所定数の時間を省き小さい方から所定数の時間を省いた中央範囲に属する時間の平均値を算出してもよい。また、各場所としては地図上の一点であってもよいが、所定のひとかたまりの範囲を同一の場所としてもよい。算出部302a4によって算出された平均時間は、例えば地図上にマッピングし、そのマッピングした結果をPC301のディスプレイに表示すればよい。これにより、処理の遅延が特定の地域の問題であるか否かの確認がより一層容易になる。地域は、例えば都道府県や、市町村の境界に応じて定められる範囲(境界範囲)である。また、地域は各タクシー会社が営業可能な領域として定められているそれぞれの範囲(営業範囲)であってもよい。さらに地域は、通信網の種類(例えば、FORMA通信網や、有線・無線の通信網等)に応じて定められる範囲(通信網範囲)であってもよい。
また、上述した実施形態をそのまま実施した場合、全てのアプリケーションが分散対象から除外されてしまい、クラウドシステムとして全く動作しないという事態が生じ得る。そこで、指示信号がそのまま出力されれば全てのアプリケーションが分散対象から除外されてしまう場合には、監視サーバ302の指示部302a3が例外的に指示信号を出力しない構成として、全てのアプリケーションが分散対象から除外されてしまう事態を未然に回避するようにしてもよい。
また、例えば上述した実施形態では、管理サーバ300を1つのみ設けたが、管理サーバ300以外に図8に示すようにデータセンタ700の内部にも管理サーバ800を設けるようにしてもよい。
データセンタ700の内外それぞれに管理サーバを設けることで、クラウドシステムが提供するサービスに不具合が生じる原因がデータセンタ700側にあるのか専用網600側にあるのかを切り分けることが可能になる。
物理サーバ705又は706の或る1つのアプリケーションに対するテストにおいて、両方の管理サーバに関して処理の遅延が生じた場合、クラウドシステムが提供するサービスに不具合が生じる原因がデータセンタ700側にあると推定できる。一方、物理サーバ705又は706の或る1つのアプリケーションに対するテストにおいて、管理サーバ300のみに関して処理の遅延が生じた場合、クラウドシステムが提供するサービスに不具合が生じる原因が、専用網600側にあると推定できる。したがって、管理サーバ300又は管理サーバ800が他方の管理サーバでのテスト結果を取得して上記のような推定処理を実行するようにしてもよい。
また、物理サーバ705又は706の或る1つのアプリケーションに対するテストにおいて、両方の管理サーバに関して処理の遅延が生じた場合であって且つ指示信号がそのまま出力されれば全てのアプリケーションが分散対象から除外されてしまう場合には、両方の管理サーバが例外的に指示信号を出力しない構成として、全てのアプリケーションが分散対象から除外されてしまう事態を未然に回避するようにし、さらに一部のアプリケーションの処理優先度(例えばNICE値)を残りのアプリケーションの処理優先度よりも高くすればよい。処理優先度を高くしたアプリケーションを使用することで、処理の遅延を抑えることができる。この場合、仮想サーバのCPUはマルチコア対応のCPUにすればよい。
300 管理サーバ
301 PC
302a1 送信部
302a2 受信部
302a3 指示部
302a4 算出部
500 公衆網
600 専用網
700 データセンタ
703 負荷分散装置
705、706 物理サーバ
705a、705b 仮想サーバ

Claims (12)

  1. 複数の被管理サーバと、前記複数の被管理サーバに対して処理負荷を分散させる負荷分散装置と、を備えるクラウドシステムに組み込み可能な管理サーバであって、
    前記複数の被管理サーバが実行するアプリケーションそれぞれを経由してテスト用通信端末にテスト信号を送信する送信部と、
    前記テスト用通信端末から送信される前記テスト信号に対する応答信号を、前記テスト信号の送信時に用いられた前記アプリケーションを経由して受信する受信部と、
    前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合に、前記テスト信号の送信時に用いられた前記アプリケーションを単一で、又は、同一の仮想サーバに属する他の前記アプリケーションとともに、又は、同一の物理サーバに属する他の前記アプリケーションとともに、前記処理負荷の分散対象から除外する指示信号を前記負荷分散装置に出力する指示部と、
    を備える、管理サーバ。
  2. 前記処理負荷の分散対象から除外された前記アプリケーションが単一で、又は、同一の仮想サーバに属する他の前記アプリケーションとともに、又は、同一の物理サーバに属する他の前記アプリケーションとともに、再起動した後、
    前記送信部は、再起動した前記アプリケーションそれぞれを経由して前記テスト用通信端末に前記テスト信号を送信し、再起動した前記アプリケーション全てに関して、前記受信部が、前記送信部が前記テスト信号を送信してから所定時間が経過する前に前記受信部が前記応答信号を受信する場合に、
    前記指示部は、前記指示信号の指示内容を解除する解除信号を前記負荷分散装置に出力する、請求項1に記載の管理サーバ。
  3. 前記送信部の送信タイミングを操作する操作部をさらに備える、請求項1又は請求項2に記載の管理サーバ。
  4. 前記送信部は、異なる場所に存在する複数の前記テスト用通信端末に前記テスト信号を送信する、請求項1〜3のいずれか一項に記載の管理サーバ。
  5. 前記クラウドシステムは、前記複数の被管理サーバに前記負荷分散装置を介してネットワーク接続される複数のクライアント端末をさらに備え、
    前記複数のクライアント端末はそれぞれ異なる移動体に搭載され、前記テスト用通信端末としても機能する、請求項4に記載の管理サーバ。
  6. 前記送信部が前記テスト信号を送信してから前記受信部が前記応答信号を受信するまでに要する時間の平均値を場所毎に算出する算出部をさらに備える、請求項4又は請求項5に記載の管理サーバ。
  7. 前記アプリケーションは音声信号を処理する、請求項1〜6のいずれか一項に記載の管理サーバ。
  8. 前記指示信号が前記アプリケーションを単一で前記処理負荷の分散対象から除外する信号であって、前記アプリケーション全てに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、又は、
    前記指示信号が前記アプリケーションを前記仮想サーバ単位で前記処理負荷の分散対象から除外する信号であって、前記仮想サーバそれぞれで少なくとも一つの前記アプリケーションに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、又は、
    前記指示信号が前記アプリケーションを前記物理サーバ単位で前記処理負荷の分散対象から除外する信号であって、前記物理サーバそれぞれで少なくとも一つの前記アプリケーションに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、
    前記指示部は例外的に前記指示信号を出力しない、請求項1〜7のいずれか一項に記載の管理サーバ。
  9. 複数の被管理サーバと、
    前記複数の被管理サーバに対して処理負荷を分散させる負荷分散装置と、
    請求項1〜8のいずれか一項に記載の管理サーバと、
    を備える、クラウドシステム。
  10. 前記管理サーバを2つ備え、
    前記複数の被管理サーバ、前記負荷分散装置、及び一方の前記管理サーバをデータセンタ内に設置し、前記データセンタと他方の前記管理サーバとがネットワーク接続される、請求項9に記載のクラウドシステム。
  11. 前記指示信号が前記アプリケーションを単一で前記処理負荷の分散対象から除外する信号であって、両方の前記管理サーバによるテストにおいて前記アプリケーション全てに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、又は、
    前記指示信号が前記アプリケーションを前記仮想サーバ単位で前記処理負荷の分散対象から除外する信号であって、両方の前記管理サーバによるテストにおいて前記仮想サーバそれぞれで少なくとも一つの前記アプリケーションに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、又は、
    前記指示信号が前記アプリケーションを前記物理サーバ単位で前記処理負荷の分散対象から除外する信号であって、両方の前記管理サーバによるテストにおいて前記物理サーバそれぞれで少なくとも一つの前記アプリケーションに関して前記送信部が前記テスト信号を送信してから所定時間が経過しても前記受信部が前記応答信号を受信しない場合、
    前記指示部は例外的に前記指示信号を出力せず、一部の前記アプリケーションの処理優先度を残りの前記アプリケーションの処理優先度よりも高くする、請求項10に記載のクラウドシステム。
  12. 複数の被管理サーバと、前記複数の被管理サーバに対して処理負荷を分散させる負荷分散装置と、を備えるクラウドシステムの管理方法であって、
    前記複数の被管理サーバが実行するアプリケーションそれぞれを経由してテスト用通信端末にテスト信号を送信する送信工程と、
    前記テスト用通信端末から送信される前記テスト信号に対する応答信号を、前記テスト信号の送信時に用いられた前記アプリケーションを経由して受信する受信工程と、
    前記送信工程が前記テスト信号を送信してから所定時間が経過しても前記受信工程が前記応答信号を受信しない場合に、前記テスト信号の送信時に用いられた前記アプリケーションを単一で、又は、同一の仮想サーバに属する他の前記アプリケーションとともに、又は、同一の物理サーバに属する他の前記アプリケーションとともに、前記処理負荷の分散対象から除外する指示信号を前記負荷分散装置に出力する指示工程と、
    を備える、管理方法。
JP2017098933A 2017-05-18 2017-05-18 管理サーバ、クラウドシステム、及び管理方法 Active JP6924072B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017098933A JP6924072B2 (ja) 2017-05-18 2017-05-18 管理サーバ、クラウドシステム、及び管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017098933A JP6924072B2 (ja) 2017-05-18 2017-05-18 管理サーバ、クラウドシステム、及び管理方法

Publications (2)

Publication Number Publication Date
JP2018195113A true JP2018195113A (ja) 2018-12-06
JP6924072B2 JP6924072B2 (ja) 2021-08-25

Family

ID=64570555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017098933A Active JP6924072B2 (ja) 2017-05-18 2017-05-18 管理サーバ、クラウドシステム、及び管理方法

Country Status (1)

Country Link
JP (1) JP6924072B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021673A (ja) * 2002-06-18 2004-01-22 Dainippon Printing Co Ltd 自動リセット装置、自動リセット方法、プログラム、及び記録媒体
JP2006195709A (ja) * 2005-01-13 2006-07-27 Hitachi Ltd Webサービスシステム
JP2007094631A (ja) * 2005-09-28 2007-04-12 Hitachi Electronics Service Co Ltd アプリケーション稼働監視システム及び顧客アプリケーション稼働監視サービス提供システム及びアプリケーション稼働監視方法及び顧客アプリケーション稼働監視サービス提供方法
JP2009020736A (ja) * 2007-07-12 2009-01-29 Hitachi Ltd サーバアプリケーション監視システム及び監視方法
JP2011197796A (ja) * 2010-03-17 2011-10-06 Fujitsu Frontech Ltd 負荷分散制御装置
JP2016103179A (ja) * 2014-11-28 2016-06-02 株式会社日立製作所 計算機リソースの割り当て方法及び計算機システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021673A (ja) * 2002-06-18 2004-01-22 Dainippon Printing Co Ltd 自動リセット装置、自動リセット方法、プログラム、及び記録媒体
JP2006195709A (ja) * 2005-01-13 2006-07-27 Hitachi Ltd Webサービスシステム
JP2007094631A (ja) * 2005-09-28 2007-04-12 Hitachi Electronics Service Co Ltd アプリケーション稼働監視システム及び顧客アプリケーション稼働監視サービス提供システム及びアプリケーション稼働監視方法及び顧客アプリケーション稼働監視サービス提供方法
JP2009020736A (ja) * 2007-07-12 2009-01-29 Hitachi Ltd サーバアプリケーション監視システム及び監視方法
JP2011197796A (ja) * 2010-03-17 2011-10-06 Fujitsu Frontech Ltd 負荷分散制御装置
JP2016103179A (ja) * 2014-11-28 2016-06-02 株式会社日立製作所 計算機リソースの割り当て方法及び計算機システム

Also Published As

Publication number Publication date
JP6924072B2 (ja) 2021-08-25

Similar Documents

Publication Publication Date Title
AU2013392103B2 (en) Coalescing geo-fence events
US20140067452A1 (en) Intelligent work management based on satellite navigation system data and network node data
US20140372015A1 (en) Public safety vehicle routing
CN105808235A (zh) 移动终端通知栏消息的管理方法、装置及移动终端
CN111404627B (zh) 一种时间同步方法、装置、系统和存储介质
US20190122554A1 (en) Smart parking management and navigation system
JP6924072B2 (ja) 管理サーバ、クラウドシステム、及び管理方法
JP4495634B2 (ja) 地震情報管理システム
US10631135B2 (en) Information processing device, information processing system, and information processing method
CN110972071A (zh) 一种多模定位方法、定位服务器、终端和存储介质
JPWO2009122482A1 (ja) 端末、ネットワーク装置、該端末と該ネットワーク装置とからなるネットワーク装置検索システム、およびネットワーク装置検索方法
KR101752357B1 (ko) 재난 신호를 전달하는 경보장치 시스템
JP2013196092A (ja) 監視制御サーバ装置及びこれを用いたリアルタイム警報管理システム並びに警報受信端末
JP2007094925A (ja) サーバおよびクライアント機器
JP6586699B2 (ja) 地震情報の配信システム
KR20180069592A (ko) 위치 추정 시스템 및 그것의 동작 방법
KR20160104817A (ko) 실시간 버스 위치 조회 시스템
CN105491631A (zh) 一种移动终端定位方法、装置及移动终端
CN105682218A (zh) 一种移动终端定位方法、装置及移动终端
CN107113565B (zh) 虚拟传感器装置和方法
JP2017044481A (ja) 測位システム
JP2016178522A (ja) 移動通信端末及び出力制御方法
JPWO2015045307A1 (ja) 無線通信装置、無線通信システム、通信方法
JP6631677B1 (ja) 情報処理装置、緊急情報通知システム、緊急情報通知方法及びプログラム
US20170016992A1 (en) Satellite modem location tracking

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210730

R150 Certificate of patent or registration of utility model

Ref document number: 6924072

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150