JP6487359B2 - ネットワークサービス評価システム - Google Patents

ネットワークサービス評価システム Download PDF

Info

Publication number
JP6487359B2
JP6487359B2 JP2016052546A JP2016052546A JP6487359B2 JP 6487359 B2 JP6487359 B2 JP 6487359B2 JP 2016052546 A JP2016052546 A JP 2016052546A JP 2016052546 A JP2016052546 A JP 2016052546A JP 6487359 B2 JP6487359 B2 JP 6487359B2
Authority
JP
Japan
Prior art keywords
container
virtual machine
network
virtual
server resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016052546A
Other languages
English (en)
Other versions
JP2017167822A5 (ja
JP2017167822A (ja
Inventor
悠己 加須屋
悠己 加須屋
圭介 黒木
圭介 黒木
林 通秋
通秋 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2016052546A priority Critical patent/JP6487359B2/ja
Publication of JP2017167822A publication Critical patent/JP2017167822A/ja
Publication of JP2017167822A5 publication Critical patent/JP2017167822A5/ja
Application granted granted Critical
Publication of JP6487359B2 publication Critical patent/JP6487359B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、仮想化環境において仮想マシンの障害が検知されてライブマイグレーションによりネットワークサービスを継続する際に、サービス中断時間を計測してネットワークサービスを評価するネットワークサービス評価システムに関する。
ネットワークサービスの信頼性を高める技術としてマイグレーションが知られている。マイグレーションとは、仮想化技術により作成された仮想マシンを現在の物理マシンから他の物理マシンへ移行させてサービスを継続させる技術であり、特に、移行元の物理マシンにおいて仮想マシンを停止させずに、そのメモリデータ等を移行先の物理マシンにコピーすることで実質的に無停止で移行先の物理マシンが処理を引き継ぐ技術は、ライブマイグレーション(live migration)と呼ばれる。
ライブマイグレーションでは、サービスの停止時間をより短くすることが要求され、特許文献1には、保護切り替え動作等を実施する場合のサービス中断時間の測定に関連して、ネットワークの端点に送信機および受信機を設け、その送信機から受信機に向けて試験パケットを送出し、受信側でそのパケットを解析することで中断時間を測定する技術が開示されている。
特開2005-210719号公報
特許文献1によれば、仮想化環境においてもサービス中断時間の測定は可能であるが、以下のような2つの技術課題を解決しなければならない。
(1) 仮想化環境においては、複数の仮想マシンで構成されるネットワークの復旧に際し、ネットワークの構成要素である仮想マシンが、それを実現している物理サーバ間を移動することにより、試験パケットを送受信する装置のケーブル等をそれに応じて動的に変更する必要が生じる。
(2) 試験パケットを送受するための物理的な送受信装置を用意する必要があり、たとえ仮想マシンで仮想的な送信装置、受信装置を用意する場合でも、仮想マシンの作成にはある程度の時間を要するので、サービスの中断時間を短縮するためには、試験パケットの送受信装置をネットワーク上に常駐させなければならず、その結果、コンピューティングリソース(CPU・メモリ・HDD等)を余計に、または常時消費してしまう。
本発明の目的は、上記の技術課題を解決し、ネットワークに物理的な変更を加えることなく、かつコンピューティングリソース(CPU・メモリ・HDD等)を余計に、または常時消費することなく、ライブマイグレーションにおけるサービスの中断時間を測定できるネットワークサービス評価システムを提供することにある。
上記の目的を達成するために、本発明は、仮想マシンのライブマイグレーションを評価するシステムにおいて、仮想マシンの障害検知に応答して、試験パケットを送受するための送信コンテナおよび受信コンテナを仮想的に作成するサーバ資源をそれぞれ決定する手段と、決定された各サーバ資源に送信コンテナおよび受信コンテナを作成する手段と、試験パケットが移動対象の仮想マシンを経由できるネットワークを送信コンテナと受信コンテナとの間に仮想的に追加する手段と、仮想マシンが停止して移行先で再開するまでのサービス中断期間を、送信コンテナから受信コンテナへ送信した試験パケットに基づいて計算する手段を具備した。
本発明によれば、以下のような効果が達成される。
(1) サービス中断時間の計測に用いる試験パケットを送受する送受信機能を、その作成に時間を要する仮想マシンではなく、極めて短時間かつ少ないコンピュータリソースで仮想的に実現できるコンテナ技術により、送信コンテナおよび受信コンテナとして作成できる。その結果、試験パケットの送受信専用機能をネットワーク上に常駐させることなく、コンピューティングリソースの追加的な使用を短時間および最小限に抑えながら、ライブマイグレーションにおけるサービス中断時間を測定できるようになる。
例えば、仮想マシンの作成に、ハイパーバイザ型の仮想化方式であれば10秒から数分必要とするのに対して、コンテナ技術では1秒以内で作成できる。したがって、仮想マシンの障害が検知されてから、その作成を開始しても、ライブマイグレーションにおけるサービス中断時間の測定に支障をきたすことがない。
(2) 各コンテナと各仮想スイッチとを動的に接続するので、ケーブルの配置換えをせずにサービス監視を実現できるようになる。
本発明を適用したネットワークサービス評価システムの主要部の構成を示した機能ブロック図である。 仮想マシンにより作成される仮想ネットワークが2つの論理ネットワークA,Bにより構成されている様子を示した図である。 構成情報データベースに蓄積されている論理ネットワークの接続情報の一例を示した図である。 構成情報データベースに蓄積されているリンク情報の一例を示した図である。 アラームの発生からライブマイグレーションの実施およびその完了までの手順を示したシーケンスフロー(その1)である。 アラームの発生からライブマイグレーションの実施およびその完了までの手順を示したシーケンスフロー(その2)である。
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明を適用したシステムの主要部の構成を示した図であり、ここでは、本発明の説明に不要な構成は図示が省略されている。
ネットワークには、仮想マシンを作成するための複数のサーバ資源(物理サーバ)200(200a,200b,200c)および各サーバ資源200上で仮想環境を制御してネットワークサービスを評価する管理システム群100が接続されており、各サーバ資源200及び管理システム群100にはIP到達性があるものとする。
各サーバ資源200では、オペレーティングシステム(OS)201上に仮想マシンVMを実現するための仮想化実現ミドルウェア202が実装され、この仮想化実現ミドルウェア202上で1ないし複数の仮想マシンVMが稼働する。
ネットワークNW1には、内部ネットワークNW2および外部ネットワークNW3が接続され、内部ネットワークNW2で作成されるユーザのパケットは仮想マシンVMで構成されるネットワークNW1を通り、インターネット等の外部ネットワークNW3へ出て行くことができる。
管理システム群100は、ネットワークNW1を構成する仮想マシンの作成を主に行う仮想マシン制御装置101、サービス中断時間を測定するための送信コンテナおよび受信コンテナを作成するコンテナ制御装置102、各コンテナと仮想マシンとを接続するためのネットワークを作成するネットワーク制御装置103、および各仮想マシンとサーバ資源200とのマッピングなどを示す構成情報を管理する構成情報データベース(DB)104を主要な構成としている。これらの各装置は、それぞれ別のシステムとして作成しても良いし、同一システム内に機能として実装しても良い。
管理システム群100は、仮想マシンVMが報知する障害アラームの受信等を契機にしてライブマイグレーションが実行される直前に、仮想マシンVMで構成されるネットワークの端点に送信コンテナ301および受信コンテナ302を作成する。そして、ライブマイグレーションの期間中に送信コンテナ301が送信したパケットを受信した受信コンテナ302が当該受信パケット数を解析することで、ライブマイグレーションの実行に伴うサービス中断時間を測定する。
本実施形態では、各サーバ資源200の仮想化実現ミドルウェア202上で計5台の仮想マシンVMa,VMb,VMc,VMd,VMeが稼働しており、それぞれがファイヤーウォールなどのネットワークアプリケーションを実行する。
ここでは、図2に示したように、ネットワークNW1が2つの論理ネットワークA,Bにより作成されており、そのネットワークの接続に関する情報および各仮想リンクに関する情報は構成情報DB104に保持されている。
図3は、構成情報DB104に蓄積されている論理ネットワークの接続情報の例を示した図であり、ネットワークNW1が前記2つの論理ネットワークA,Bにより作成されていることを示している。
また、論理ネットワークAが「内部ネットワークNW2」、「仮想マシンVMa」、「仮想マシンVMd」および「外部ネットワークNW3」で構成されており、その接続状態が[内部ネットワークNW2−仮想リンクVL1−仮想マシンVMa]、[仮想マシンVMa−仮想リンクVL2−仮想マシンVMd]および[仮想マシンVMd−仮想リンクVL3−外部ネットワークNW3]であることを示している。
さらに、マッピング情報を参照することで、仮想マシンVMaがサーバ資源200a上で稼働し、仮想マシンVMdがサーバ資源200b上で稼働していることも判る。論理ネットワークBの説明は省略する。
図4は、構成情報DB104に蓄積されているリンク情報の例を示した図であり、仮想リンクVLごとに、その一端側(端点A)および他端側(端点B)の接続対象、コネクションポイント(A/B)、スイッチコネクションポイント(A/B)および終端スイッチに関する情報が登録されている。
ここで、コネクションポイント(A/B)とは、端点A/Bが使用している物理ポートまたは仮想ポートである。図示の例では、コネクションポイントBは仮想マシンaの物理ポートeth1に該当する。なお、内部ネットワークNW2の場合は該当ポートが存在しない。スイッチコネクションポイント(A/B)は、仮想スイッチVMと端点A/Bとを接続する際に使用する仮想スイッチの仮想ポートである。
次いで、図5,6のシーケンスフローを参照して、アラームの発生からライブマイグレーションの実施およびその完了までの手順について説明する。ここでは、仮想マシンdが何らかのアラームを報知し、これが検知されて仮想マシンdを対象にライブマイグレーションを実行する場合を例にして説明する。
時刻t1において、管理システム群100の仮想マシン制御装置101が仮想マシンdから何らかのアラームを受信すると、時刻t2では、仮想マシンdが作成されているサーバ資源200bのミドルウェア202bに対して他のサーバ資源へのメモリコピーが指示される。
本実施形態では、サーバ資源200cが仮想マシンdの機能を引き継ぐことを想定し、時刻t3では、仮想マシンdのメモリ内容がサーバ資源200cのミドルウェア202cへコピーされる。時刻t4では、仮想マシン制御装置101からコンテナ制御装置102へコンテナ作成が指示される。
コンテナ制御装置102は、時刻t5において、前記コンテナ作成の指示に応答して構成情報DB104からネットワークに関する構成を取得し、論理的なネットワークの端点を確認する。時刻t6では、コンテナ制御装置102から仮想マシン制御装置101に対して、送信コンテナおよび受信コンテナを作成するためのコンピューティングリソース情報の問い合わせが実施され、最も潤沢にリソースが空いているサーバ資源が送信コンテナおよび受信コンテナの作成先として決定される。
時刻t7では、仮想マシン制御装置101からコンテナ制御装置102へ、前記決定されたサーバ資源が通知される。ここでは、サーバ資源200a、200cへのコンテナ作成が決定されたものとして説明を続ける。
時刻t8では、サーバ資源200aに対して送信コンテナの作成が指示され、そのオペレーティングシステム上に送信コンテナ301が作成される。時刻t9では、サーバ資源200cに対して受信コンテナの作成が指示され、そのオペレーティングシステム上に受信コンテナ302が作成される。時刻t10では、コンテナ制御装置102からネットワーク制御装置103へ、前記各コンテナ301,302を含む論理ネットワークの作成が指示される。
ネットワーク制御装置103は、前記作成指示に応答して、時刻t11,t12において、前記構成情報DB104に蓄積されている情報に基づいて仮想スイッチVS1,VS2の設定変更を実施することで、送信コンテナ301と仮想マシンVMa、および受信コンテナ302と仮想マシンVMdとを接続する。
本実施形態では、図3,4の構成情報DB104を参照することで、(1) 仮想マシンVMa,VMdが論理ネットワークAを構成していること、(2) 仮想マシンVMaがサーバ資源200a上に作成され、仮想マシンVMdがサーバ資源200b上に作成されていること、(3) 仮想マシンVMaの内部ネットワークNW2に最も近い仮想リンクがVL1であり、仮想マシンVMdの外部ネットワークNW3に最も近い仮想リンクがVL3であること、を認識する。
さらに、仮想マシンVMaに関しては、その接続される終端スイッチが仮想スイッチVS1のport2であることを認識し、これらの認識結果に基づいて、送信コンテナ301を仮想スイッチVS1に接続し、送信コンテナ301が接続されたportと仮想マシンVMaが接続されているport2との間をパケットが送受信可能なように仮想スイッチVS1に設定が投入される。なお、仮想マシンVMdに関する説明は省略する。
以上のようにして、送信および受信コンテナ301,302を含むネットワーク作成が完了すると、時刻t13において、ネットワーク制御装置103からコンテナ制御装置102へ完了通知が送信される。時刻t14では、コンテナ制御装置102から送信コンテナ301に対して監視の開始が指示される。
図6へ進み、時刻t15では、送信コンテナ301から受信コンテナ302へ試験パケットの送信が開始される。時刻t16では、送信コンテナ301からコンテナ制御装置102に対して、試験パケットの送信を開始した旨が通知される。時刻t17では、コンテナ制御装置102から仮想マシン制御装置101に対してライブマイグレーションが指示される。
時刻t18では、仮想マシン制御装置101からサーバ資源200bのミドルウェア202bに対して仮想マシンVMdの停止が指示される。時刻t19では、ミドルウェア202bが、前記要求に応答して仮想マシンVMdを停止させ、残りのメモリ情報をサーバ資源200cのミドルウェア202cへコピーする。
全てのメモリコピーが完了し、サーバ資源200c上に仮想マシンVMdが移設されると、時刻t20では、仮想マシン制御装置101からサーバ資源200cのミドルウェア202cに対して仮想マシンVMdの起動が指示されてライブマイグレーションが完了する。時刻t21では、仮想マシン制御装置101からコンテナ制御装置102へライブマイグレーションの完了が通知される。
時刻t22では、コンテナ制御装置102から送信コンテナ301に対して結果が要求され、時刻t23では、コンテナ制御装置102から受信コンテナ302へ結果が要求される。時刻t24では、送信コンテナ301からコンテナ制御装置102へ結果が送信され、時刻t25では、受信コンテナ302からコンテナ制御装置102へ結果が送信される。
時刻t26では、コンテナ制御装置102において、前記通知された結果に基づいて解析が行われる。本実施形態では、送信コンテナ301が送信した試験パケット数から、受信コンテナ302で受信できた試験パケット数を減じることでサービスの中断時間が求められる。
時刻t27、t28では、それぞれ送信コンテナ301および受信コンテナ302に対して、その削除が要求され、それぞれのサーバ資源上で各コンテナ301,302が削除される。
本実施形態によれば、サービス中断時間の計測に用いる試験パケットを送受する送受信機能を、その作成に時間を要する仮想マシンではなく、極めて短時間かつ少ないコンピュータリソースで仮想的に実現できるコンテナ技術により、送信コンテナ301および受信コンテナ302として作成できる。
その結果、試験パケットの送受信専用機能をネットワーク上に常駐させることなく、コンピューティングリソースの追加的な使用を短時間および最小限に抑えながら、ライブマイグレーションにおけるサービス中断時間を測定できるようになる。
100…管理システム群,101…仮想マシン制御装置,102…コンテナ制御装置,103…ネットワーク制御装置,104…構成情報データベース(DB),200…サーバ資源,201…オペレーティングシステム(OS),202…仮想化実現ミドルウェア,301…送信コンテナ,302…受信コンテナ

Claims (3)

  1. 第1のサーバ資源上で稼働する仮想マシンを第2のサーバ資源上へ移行するライブマイグレーションを評価するシステムにおいて、
    仮想マシンの障害検知に応答して、試験パケットを送受信する送信コンテナおよび受信コンテナを仮想的に作成するサーバ資源をそれぞれ決定する手段と、
    決定された各サーバ資源に送信コンテナおよび受信コンテナを作成する手段と、
    試験パケットが移動対象の仮想マシンを経由できるネットワークを送信コンテナと受信コンテナとの間に仮想的に追加する手段と、
    仮想マシンが第1のサーバ資源上で停止してから第2のサーバ資源上で再開するまでのサービス中断期間を前記送信コンテナから受信コンテナへ送信した試験パケットに基づいて計算する手段を具備したことを特徴とするネットワークサービス評価システム。
  2. 前記仮想的に追加するネットワークが仮想スイッチであることを特徴とする請求項1に記載のネットワークサービス評価システム。
  3. 前記ネットワークを仮想的に追加する手段は、移動対象の仮想マシンで構成される論理ネットワークの一方側及び他方側の端点に前記送信コンテナおよび受信コンテナを配置することを特徴とする請求項1または2に記載のネットワークサービス評価システム。
JP2016052546A 2016-03-16 2016-03-16 ネットワークサービス評価システム Active JP6487359B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016052546A JP6487359B2 (ja) 2016-03-16 2016-03-16 ネットワークサービス評価システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016052546A JP6487359B2 (ja) 2016-03-16 2016-03-16 ネットワークサービス評価システム

Publications (3)

Publication Number Publication Date
JP2017167822A JP2017167822A (ja) 2017-09-21
JP2017167822A5 JP2017167822A5 (ja) 2018-05-31
JP6487359B2 true JP6487359B2 (ja) 2019-03-20

Family

ID=59910278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016052546A Active JP6487359B2 (ja) 2016-03-16 2016-03-16 ネットワークサービス評価システム

Country Status (1)

Country Link
JP (1) JP6487359B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587281B (zh) * 2017-09-29 2020-07-28 华为技术有限公司 容器配置方法和计算节点
JP7338481B2 (ja) 2020-01-14 2023-09-05 富士通株式会社 設定変更方法および設定変更プログラム
US20230251887A1 (en) 2020-07-09 2023-08-10 Nec Corporation Data migration system, data migration method, non-transitory computer-readable medium for data migration program
JP2022074864A (ja) 2020-11-05 2022-05-18 富士通株式会社 情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2410394B (en) * 2004-01-22 2007-04-04 Agilent Technologies Inc Service disruption time determination apparatus and method therefor
JP2011108045A (ja) * 2009-11-18 2011-06-02 Hitachi Ltd 計算機システム、管理サーバ及び電力削減方法
JP2011198299A (ja) * 2010-03-23 2011-10-06 Fujitsu Ltd プログラム、コンピュータ、通信装置および通信制御システム
JP5861767B2 (ja) * 2012-03-16 2016-02-16 富士通株式会社 稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体
JP2014112293A (ja) * 2012-12-05 2014-06-19 Mitsubishi Electric Corp 監視制御システム及び監視制御方法
JP6144639B2 (ja) * 2014-02-20 2017-06-07 日本電信電話株式会社 ネットワーク制御装置、通信システム、ネットワーク制御方法、および、ネットワーク制御プログラム
JP6447329B2 (ja) * 2015-04-09 2019-01-09 富士通株式会社 並列計算制御装置、並列計算システムおよびマイグレーション時間推定プログラム
JP6570033B2 (ja) * 2015-07-28 2019-09-04 日本電信電話株式会社 仮想スイッチ制御システム及び方法

Also Published As

Publication number Publication date
JP2017167822A (ja) 2017-09-21

Similar Documents

Publication Publication Date Title
US10484266B2 (en) Leveraging multi-stream transport protocol capabilities for routing
WO2018228302A1 (zh) 用于虚拟网络链路检测的方法及装置
JP6487359B2 (ja) ネットワークサービス評価システム
US9971525B2 (en) Peer to peer volume extension in a shared storage environment
US10838752B2 (en) Network notification loss detection for virtual machine migration
US11188371B2 (en) Monitoring controller and a method performed thereby for monitoring network performance
CN111654519B (zh) 用于传输数据处理请求的方法和装置
US11055159B2 (en) System and method for self-healing of application centric infrastructure fabric memory
WO2020224300A1 (zh) 基于用户态协议栈的报文分流方法、装置及系统
US11843508B2 (en) Methods and apparatus to configure virtual and physical networks for hosts in a physical rack
CA3125144A1 (en) System and method to operate devices with dns caches
US20130054817A1 (en) Disaggregated server load balancing
CN110389711B (zh) 帮助端点设备实现sr-iov功能的方法、设备和非瞬态计算机可读介质
US10855546B2 (en) Systems and methods for non-intrusive network performance monitoring
WO2018054271A1 (zh) 一种数据传输方法及装置
US20140192635A1 (en) Start-up delay for event-driven virtual link aggregation
US20150277958A1 (en) Management device, information processing system, and management program
US11121960B2 (en) Detecting and managing relocation of network communication endpoints in a distributed computing environment
CN103546556B (zh) 一种在未来网络xia中虚拟机在线迁移方法
JP5018969B2 (ja) 通信制御プログラム、通信制御装置、通信制御システムおよび通信制御方法
US20230059940A1 (en) Systems and methods for application health based network traffic routing in a geographically distributed cloud service
CN110870286B (zh) 容错处理的方法、装置和服务器
US10692168B1 (en) Availability modes for virtualized graphics processing
US20230097099A1 (en) Selection of gateways for reconnection upon detection of reachability issues with backend resources
US10223241B2 (en) Resuming a remote debugging session using a backup node

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180307

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180412

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190221

R150 Certificate of patent or registration of utility model

Ref document number: 6487359

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150