JP2015002482A - ネットワークシステム及び制御方法 - Google Patents

ネットワークシステム及び制御方法 Download PDF

Info

Publication number
JP2015002482A
JP2015002482A JP2013126933A JP2013126933A JP2015002482A JP 2015002482 A JP2015002482 A JP 2015002482A JP 2013126933 A JP2013126933 A JP 2013126933A JP 2013126933 A JP2013126933 A JP 2013126933A JP 2015002482 A JP2015002482 A JP 2015002482A
Authority
JP
Japan
Prior art keywords
virtual
virtual machine
computer system
gateway
tunnel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013126933A
Other languages
English (en)
Other versions
JP6077945B2 (ja
Inventor
幸男 築島
Yukio Tsukishima
幸男 築島
陽平 片山
Yohei Katayama
陽平 片山
文裕 沈
Seon-Il Shim
文裕 沈
賢治 湊
Kenji Minato
賢治 湊
田中 裕之
Hiroyuki Tanaka
裕之 田中
佳宏 中島
Yoshihiro Nakajima
佳宏 中島
勝弘 島野
Katsuhiro Shimano
勝弘 島野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013126933A priority Critical patent/JP6077945B2/ja
Publication of JP2015002482A publication Critical patent/JP2015002482A/ja
Application granted granted Critical
Publication of JP6077945B2 publication Critical patent/JP6077945B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】ワーキング系計算機システム上の仮想マシンに関して障害が発生した際に仮想マシンと通信していたクライアントに対して一切の設定変更を加えることなく障害を復旧可能なネットワークシステム及び制御方法を提供することを目的とする。【解決手段】本発明は、ゲートウェイと仮想マシンとの間をポイント・ツー・ポイントの仮想トンネルで接続し、障害発生後に仮想マシンをバックアップ系の計算機システムの上で再構築し、ゲートウェイと仮想マシンとの間の仮想トンネルを再設定することとした。【選択図】図10

Description

本発明は、仮想的なネットワークを構築する技術が適用されたネットワークシステム及び制御方法に関する。
2000年から2010年に掛け、中央演算処理装置(CPU)のマルチコア化と、オペレーションシステム(OS)仮想化に対応したCPUの制御命令コードの情報開示に伴い、OS仮想化は実用レベルで利用できるまで演算処理性能が向上し、商用導入され始めた。
OS仮想化は、CPUや主記憶装置(メモリ)、ハードディスク、ネットワーク・インターフェースを備えた物理的な計算機システムと、ゲストOSとの間にHyperVisorを設け、HyperVisorがゲストOSと計算機システムとの間で制御命令の橋渡しを担うものである。HyperVisorの代表例としてVMware、XEN、およびKVMと呼ばれるものが存在する。HyperVisorの特徴的な役割として、計算機システムを利用するユーザに対してあたかも複数の計算機システム、いわゆる仮想マシンが存在するように論理的に分割してみせる技術ことができる。その技術の概要は非特許文献1、非特許文献2、および非特許文献3に示されている。本発明で述べている物理システムの一例が計算機システムである。また非特許文献4にはゲストOSを起動するためのプロセスや、起動手順についての得失が紹介されている。非特許文献5において、物理的な計算機システムのメモリの上で仮想マシンのためのメモリ領域を確保する方法について紹介し、非特許文献6ではHyperVisorを利用して仮想マシンを駆動するための仮想的なデバイスを生成・制御する方法について紹介している。
OS仮想化の恩恵により、ゲストOSについて仮想マシンイメージをある計算機システムから別の計算機システムに移転したとしてもHyperVisorがハードウェア依存性を吸収してくれるため、逆にゲストOSはハードウェア依存性を意識しなくてもよくなる。さらに、計算機システム上の遊休物理資源を有効活用できるようになった。このため、データセンタ事業者はOS仮想化を利用するようになった。
さらにOS仮想化の副産物として、仮想マシンの静的な情報はハードディスク上のデータに記憶され、仮想マシン上で演算処理、もしくはネットワーク通信処理されているような動的な情報はメモリ上のデータとして記憶されるようになった。この仮想マシンのデータ、すなわち仮想マシンイメージを他の計算機システムにコピーすることにより、仮想的なモノではあるが、同等の性能や特性を有する計算機システムを容易かつ迅速に複製できるようになった。
非特許文献7は、計算機システムがローカルストレージ上の仮想マシンイメージを読みだして仮想マシンを起動する方法と、一方でリモートストレージ上の仮想マシンイメージを読み出して仮想マシンを起動する方法と、を紹介している。
非特許文献7が述べるとおり、上記のふたつの方法を比較すると得失が併存するが、いずれの方法とも仮想マシンを起動することができ、仮想マシンを駆動する計算機システムと仮想マシンイメージの位置関係に関わらず、仮想マシンを起動する方法は既に技術的に確立されている。
非特許文献8、非特許文献9および非特許文献10では、ある計算機システム上で駆動する仮想マシン(文献内での略称はVM)の数の増加や、仮想マシン自体の負荷の増加に応じ、同計算機システムの負荷が増大する場合について、一部の仮想マシンを別の計算機システム上に移転するライブ・マイグレーション技術を紹介している。この技術のおかげで、仮想マシン上で駆動しているWebサーバや、映像ストリーミングサーバはユーザへのサービスをほぼ中断することなく、ライブ・マイグレーションが実施される。
上記の三件の非特許文献に示されるとおり、ワーキング系の計算機システム上の仮想マシンとバックアップ系の計算機システム上の仮想マシンとの間において、ハードディスクやIPアドレス、MACアドレスなどの資源の一部、もしくは全部を共有する技術や、ワーキング系の仮想マシンのハードディスク上やメモリ上のデータを、バックアップ系の仮想マシンにコピーする技術は確立されている。非特許文献9では、ワーキング系の計算機システムからバックアップ系の計算機システムに仮想マシンがマイグレーションされた際、仮想マシンからReverse Address Resolution Protocol(RARP)、もしくはGratuitous ARPと呼ばれるメッセージをバックアップ系の計算機システム周辺のネットワークノード群に対してブロードキャストすることにより、前記のネットワークノード群に対して仮想マシンの所在が移動したことを迅速に知らせる方法が紹介されている。
上記の非特許文献8は、ワーキング系の計算機システム上で駆動する仮想マシンに関して障害が発生する場合、バックアップ系の計算機システム上で同じ仮想マシンを駆動することにより、障害を回復するハイ・アベイラビリティ技術についても紹介している。
非特許文献8が述べるとおり、ある計算機システム上で駆動するワーキング系仮想マシンと、別の計算機システム上のバックアップ系仮想マシンとが定期的に状態監視する技術が既に確立されている。また、計算機システムや仮想マシンを管理する管理システム(非特許文献7で記載されているvCenter Server)がワーキング系の計算機システムや仮想マシン、ならびにバックアップ系の計算機システムや仮想マシンを状態監視する技術も確立されている。さらに、ワーキング系の仮想マシンに障害が発生した際、バックアップ系の仮想マシンをワーキング系として切り替える技術も確立されている。ハイ・アベイラビリティ技術の場合、仮想マシン上のWebや映像ストリーミングなどのサービスは中断されるが、迅速に復旧される。
非特許文献11では、非特許文献8で示されているハイ・アベイラビリティ技術をオープンソースソフトウェアで実現する方法を紹介している。非特許文献11の例では市中の障害検知ソフトウェア(非特許文献7で記載されているpacemaker)と、市中のOS仮想化ソフトウェア(非特許文献11で記載されているKVM)とを組み合わせている。
非特許文献11で示されるとおり、個別の機能、すなわちソフトウェアを組み合わせ、連動させればハイ・アベイラビリティ技術が実現できる。
上記の非特許文献8は、ハイ・アベイラビリティ技術と同様の障害復旧技術であるフォールト・トレランス技術についても紹介している。
非特許文献8で述べられている通り、ワーキング系のある計算機システム上で駆動する仮想マシンとバックアップ系の計算機システム上で駆動する仮想マシンとの間において、短周期でデータの同期を繰り返している。もし、ワーキング系の仮想マシンに関して障害が発生した場合、バックアップ系の仮想マシンをワーキング系の仮想マシンとして即時に切り替えて駆動することにより、仮想マシン上で駆動しているWebや映像ストリーミングなどのサーバおよびサービスは、そのユーザに対してほぼ中断されることなく提供され続ける。
フォールト・トレランス技術は、ハイ・アベイラビリティ技術と比べ、計算機システムや管理システムに掛る負荷が大きい一方、障害検知後からバックアップ系の仮想マシンをワーキングとして駆動させるまでの所要時間が短くできる。
非特許文献8のハイ・アベイラビリティ技術やフォールト・トレランス技術のとおり、ワーキング系の仮想マシンとバックアップ系の仮想マシンとの間で保有する、もしくは処理中のデータを同期する技術は得失の差を考慮して多数考案・実装され、実用化されている。
非特許文献12は、通信事業者と、OS仮想ソフトウェアベンダが共同して取り組んだ遠隔ライブ・マイグレーションの例である。通信事業者も自社のデータセンタ内でOS仮想化を利用するとともにOS仮想化を使ったライブ・マイグレーション技術の検討に着手している。
上記のとおり、データセンタ事業者から通信事業者、通信ベンダ、ソフトウェアベンダが多数参加し、OS仮想化を利用したライブ・マイグレーション技術や、ハイ・アベイラビリティ技術、フォールト・トレランス技術を研究開発し、商用化している。
ただし、これまでのOS仮想化のライブ・マイグレーション技術や、ハイ・アベイラビリティ技術は大きな技術課題を抱えていた。
非特許文献19の図1で示されるとおり、これまでの仮想化では計算機システム内においてカーネル空間上の仮想ブリッジを経由し、物理的なNICと、ゲストOS、すなわち仮想マシンとの間で通信させ、その物理的なNICを介して仮想マシンと外部の計算機システムとの間で通信させていた。
そして、非特許文献19の図8で示されるとおり、仮想マシンが外部の計算機システムと通信する場合、仮想マシンが保有するIPアドレスは、自身が駆動されている計算機システム上のNICのIPアドレスと同じIPセグメントに属していることが前提である。すなわち、既存技術は図1に示されるとおりに仮想マシン同士や、仮想マシンとクライアントとの間がレイヤ2ネットワークで接続されていることを前提としていた。図1の環境下において、仮想マシン1が計算機システム1から計算機システム2に移動する場合、vNIC1とvNIC2とは同じIPセグメントに属し、それゆえにvNIC1とvNIC2とは同じIPアドレスを保有することができた。vNICは仮想的なネットワーク・インターフェース・カードの略称である。
一方、図2のように計算機システム1と計算機システム2とをIPルーティング機能を有する経路制御用レイヤ3ノードで接続する場合、計算機システム1と計算機システム2とは異なるIPセグメントに属する。図2の環境において、仮想マシン1が計算機システム1から計算機システム2に移動する場合、vNIC1とvNIC2とは必ず異なるネットワークアドレスを保有しなければならない。このため、仮想マシン1上のプロトコルソフトウェアも設定を変更しなければならず、変更しなければプロトコルソフトウェアの通信機能を復旧できない。非特許文献21にはプロトコルソフトウェアの一例や、同プロトコルソフトウェアをインストールしたり、駆動するための設定方法が示されている。
このような既存技術の場合、上記のとおり、プロトコルソフトウェアの設定を変更すれば通信機能を回復できる。ただし、これは従前の故障復旧技術と同様であり、そしてプロトコルソフトウェア毎に設定変更の内容が異なるために故障復旧技術の汎用性が損なわれてしまっている。
非特許文献13は、既存技術が抱える上記の問題を解決する技術を提案している。非特許文献13の図1では、srcVMSとdstVMSとの間で仮想トンネルを構築し、仮想トンネル経由でVM、すなわち仮想マシンを移動させている。またIMSはVMとCNとの間を流れる主信号の経路制御を担う。VMはIMSと連携して新しいIPアドレスを取得する。一方、CNはIMSと連携し、移動後のVMのIPアドレスを認識する。これにより、CNはdstVMS上のVMに主信号を送信する際、適切なIPアドレスを付与することができ、VMとCNとの間で通信を再開できるようになる。
このように非特許文献13のようなモバイルIP技術を活用することによってレイヤ3ネットワーク越しのライブ・マイグレーション技術を実現できるが、VMにモバイルIPをサポートしたソフトウェアを駆動させておく必要があり、余計なソフトウェアを駆動させなければならないというデメリットを抱えている。さらにCNもモバイルIPをサポートしなければならないため、CNの汎用性を低下させてしまっている。
そこで新たに非特許文献14に示されるような、ネットワーク仮想化が提案された。非特許文献14で示されたネットワーク構成を図3、図4、および図5を用いて分かりやすく示す。
図3および図4に示されるとおり、経路制御用レイヤ3ノードの上に仮想的なレイヤ2ノードである仮想通信ノード3を構築し、クライアントと仮想通信ノード3とを仮想トンネル(21、22)で接続し、仮想通信ノード3と仮想マシン1とを仮想トンネルTn11で接続する方法が考案・開発され、商用化されている。この方法では、図5に示されるとおり、仮想通信ノード3を中心とした仮想レイヤ2ネットワークによってクライアント1やクライアント2、仮想マシン1を面的に接続する。これにより、これらをひとつのIPセグメントで接続できることになり、問題を解決できる。それゆえ、図6のように仮想マシン1に関する何らかの障害に際して計算機システム2上に仮想マシン1を再構築する際、仮想マシン1のvNIC1を再構築前後で設定変更しなくてよい。
さらに非特許文献14のネットワーク仮想化は、非特許文献13で述べた、VM、すなわち仮想マシンの内部にモバイルIPプロトコルのソフトウェアを駆動させるということが必要なくなり、CPUやメモリなどのリソースを無駄に消費しない。さらにCN、すなわちクライアントもモバイルIPをサポートするということが不要となり、クライアントの汎用性を保つことができる。
Jim Smith、Ravi Nair、「The Architecture of Virtual Machines」、IEEE Computer Magazine, May 2005 中村 真彦 著、「仮想化技術 パーフェクトガイド 最新の仮想化ソフトで様々なOSを使い倒そう」、初版、ISBN 978−4−88166−581−7、ソーテック社、2007年、pp.8−24 山幡 為佐久 著、「詳細KVMの最新仮想化技術 第2回KVMの実装」、日経Linux(登録商標) 2010/12号、日経BP、2010年12月、pp.125−130 藤原 勝弘、山崎 泰宏 著、「クラウド・コンピューティングの基盤技術を知る 第7回仮想サーバーの起動プロセスを知る」、日経Linux(登録商標) 2011/04号、日経BP社、2011年4月、pp.125−130 山幡 為佐久 著、「詳細KVMの最新仮想化技術 第3回シャドウページング」、日経Linux(登録商標) 2011/01号、日経BP、2011年1月、pp.136−142 山幡 為佐久 著、「詳細KVMの最新仮想化技術 第5回デバイスエミュレーション」、日経Linux(登録商標) 2011/03号、日経BP、2011年3月、pp.140−146 山崎 泰宏 著、「クラウド・コンピューティングの基盤技術を知る 第5回クラウド基盤ソフトウェアの概要」、日経Linux(登録商標) 2011/08号、日経BP社、2011年8月、pp.126−131 ヴイエムウェア株式会社 著、「VMware徹底入門」、第二版、ISBN 978−4−7981−2842−9、翔泳社、2010年、pp.289−336 山幡 為佐久 著、「詳細KVMの最新仮想化技術 第4回ライブマイグレーション」、日経Linux(登録商標) 2011/02号、日経BP、2011年2月、pp.141−147 濱野 司 著、「こちら検証ラボ 長距離ライブマイグレーションは実用になるか データごと転送する方式なら長距離でも支障なく移行できる」、日経SYSTEMS 2012年3月号、日経BP社、2012年、pp.52−57 中平 和友 著、「Pacemaker + KVMで仮想化クラスタリング 〜仮想化連携機能のご紹介〜」、OSC2011 Tokyo/Fall、2011年12月 http://www.ntt.co.jp/news2011/1108/110802a.html 渡邉 英伸、大東 俊博、近堂 徹、西村 浩二、相原 玲二、「IPモビリティと複数インターフェースを用いたグローバルライブマイグレーション」、電子情報通信学会論文誌、B Vol.J93−B No.7、pp.893−901 http://www.hitachi.co.jp/New/cnews/month/2012/07/0702.html http://itpro.nikkeibp.co.jp/free/ITPro/OPINION/20020312/1/ 片山 陽平、山本 猛仁、山田 一久、中尾 彰宏、「ネットワーク仮想化基盤における仮想ネットワーク管理モデルに関する一検討」、第三回NV研究会、2012年3月、URL: http://www.ieice.org/〜nv/06−nv20120302−katayama.pdf 中平 佳裕、今中 規景、橋爪 洋、「新世代ネットワークのアーキテクチャとノード構成の一検討」、NS2010−293、NS研究会、2011年3月、pp.741−746 Zhu, Y. ,Algorithms for Assigning Substrate Network Resources to Virtual Network Components ,INFOCOM 2006. 25th IEEE International Conference on Computer Communications. Proceedings,IEEE, 2006年4月, pp. 1−12,URL: http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4146975&tag=1 Fernando Vazquez著、「詳細KVMの最新仮想化技術 第6回ネットワークの仮想化」、日経Linux(登録商標) 2011/03号、日経BP、2011年04月、pp.156−162 石黒 邦宏 著、「ネットワーク抽象化におけるオブジェクトモデル―SDNとMPLSの統合」、MPLS Japan 2012、2012年10月、URL: http://www.mpls.jp/presentations/MPLSJP2012_ishiguro.pdf ZebOS Network Platform Version 7.9.1, Network Platform Installation Guide、URL: http://www.ipinfusion.com/sites/default/files/document/ZebOSInstallGuide_1.pdf
しかしながら非特許文献14が述べるネットワーク仮想化にも大きな課題が存在している。非特許文献14では、図4に示されるようなネットワーク環境下において、仮想トンネル経由で仮想通信ノード3に接続するクライアント1、クライアント2、および仮想マシン1が直接通信できる状態になってしまう。この場合の問題点は、エンドユーザであるクライアント1のデータが通信サービス事業者のもつ仮想マシン1を経由することなくクライアント2にも流れてしまうため、クライアント1のデータをクライアント2に送付しないようにコントロールするということができない。すなわち、クライアント1の個人情報や個人ファイルがクライアント2や、仮想通信ノード3に接続する他のクライアントに覗き見されることになる可能性がある。実際、非特許文献15が述べるとおり、上記の事例が発生している。
このようなことが発生しないようにするため、例えば図4の環境下において仮想通信ノード3をユーザグループ毎に設ける方法が考えられる。しかしながらこの場合、ユーザグループ数が大幅に増加すると経路制御用レイヤ3ノードの処理負荷も増加してしまう。すなわち、大規模なネットワークではこのような対策を実施することはできない。
ただし、そもそも仮想通信ノード3に相当する仮想的なレイヤ2ノードが必須であるかと見直すと、データセンタ事業と、インターネットやVoIPなどの通信サービス事業とで必要性が異なる。
データセンタ事業をみると、ユーザもしくはクライアントはデータセンタ上に存在する複数の計算機システム、もしくはその上で駆動する複数の仮想マシンをレンタルし、それらを同時に利用することが一般的である。また、そのレンタルした計算機システムや仮想マシンの間では自由自在にデータを送受できることが一般的に求められている。また、データセンタ事業におけるOS仮想化の使い方は、仮想通信ノード群でレイヤ2ネットワークを構築し、それらによって接続された仮想マシン群の上でサービスアプリケーションを実行している。このようにみると、OS仮想化やネットワーク仮想化はデータセンタ事業に適した技術であることが分かる。
一方の通信サービス事業をみると、ユーザもしくはクライアントは、まず通信サービスネットワーク上のエッジに存在するレイヤ3ノードと通信し、そこを介して初めてほかのユーザやクライアントと通信している。すなわち、エッジのエリヤ3ノードがユーザもしくはクライアントのデータの入出力をコントロールすることが一般的に求められている。さらに通信サービス事業におけるOS仮想化の使い方は二種類考えられる。前者は先に発展したデータセンタ事業に向けたOS仮想化に倣い、仮想通信ノード群でレイヤ2ネットワークを構築し、それらによって接続された仮想マシン群の上でレイヤ3以上のネットワークアプリケーションを実行するというものである。そして前者だけが実質的に研究開発されてきている。一方の後者は、仮想マシン群の上でレイヤ2以上のネットワークアプリケーションを駆動し、仮想マシン群の間を仮想トンネルで接続するというものである。後者の場合、仮想マシン群からなる仮想ネットワークを用い、仮想ネットワーク毎にインターネットサービスや、IP−VPNサービス、広域イーサネット(登録商標)サービスなどをそれぞれ提供することが可能となる。また、IP−VPNや広域イーサネット(登録商標)サービス同様、顧客毎に仮想ネットワークを提供することもできる。ただし、後者を前提とした研究開発はされていない。
上記の前者を前提とした通信サービス事業や、データセンタ事業のユースケースを考えると、クライアント同士の間にマルチポイントアクセスを可能とする仮想的なレイヤ2ネットワークが必ず存在してしまう。
一方の上記の後者を前提とした通信サービス事業のユースケースを考えると、クライアント同士の間に仮想マシンを介在させ、仮想マシン上でIPルーティングプロトコルソフトウェアを駆動させることができる。
本発明は、これまで注目を浴びていなかった上記の後者を前提とした通信サービス事業をターゲットとし、上記に述べた多くの課題をすべて解決することを目的とする。すなわち、本発明は、ワーキング系計算機システム上の仮想マシンに関して障害が発生した際に仮想マシンと通信していたクライアントに対して一切の設定変更を加えることなく障害を復旧可能なネットワークシステム及び制御方法を提供することを目的とする。
上記目的を達成するために、本発明は、ゲートウェイと仮想マシンとの間をポイント・ツー・ポイントの仮想トンネルで接続し、障害発生後に仮想マシンをバックアップ系の計算機システムの上で再構築し、ゲートウェイと仮想マシンとの間の仮想トンネルを再設定することとした。なお、本明細書において、バックアップ系の仮想マシンを副仮想マシンと表現することがある。
具体的には、本発明に係るネットワークシステムは、
OS仮想化で仮想マシン及び仮想通信ノードを駆動可能な複数の計算機システムと、
クライアントを収容するゲートウェイと、
前記計算機システムと前記ゲートウェイとを接続する経路制御用レイヤ3ノードと、
前記計算機システムに前記仮想マシン及び前記仮想通信ノードを構築し、前記経路制御用レイヤ3ノード及び前記仮想通信ノードを介して前記仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記クライアントと前記仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送するとともに、
前記仮想マシンに障害が発生した場合、前記仮想マシンの仮想マシンイメージと同じ仮想マシンイメージ、もしくは同じコマンド体系の仮想マシンイメージを用いて他の前記計算機システムに新たに副仮想マシンを構築し、前記経路制御用レイヤ3ノード及び他の前記計算機システムの前記仮想通信ノードを介して前記副仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記障害発生前の設定で前記クライアントと前記副仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送するように、前記計算機システム、前記ゲートウェイ、及び前記経路制御用レイヤ3ノードを管理及び制御する管理システムと、
を備える。
また、本発明に係るネットワークシステムの制御方法は、
OS仮想化で仮想マシン及び仮想通信ノードを駆動可能な複数の計算機システムと、
クライアントを収容するゲートウェイと、
前記計算機システムと前記ゲートウェイとを接続する経路制御用レイヤ3ノードと、
前記計算機システム、前記ゲートウェイ、及び前記経路制御用レイヤ3ノードを管理及び制御する管理システムと、
を備えるネットワークシステムの制御方法であって、
前記計算機システムに前記仮想マシン及び前記仮想通信ノードを構築し、前記経路制御用レイヤ3ノード及び前記仮想通信ノードを介して前記仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記クライアントと前記仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送する仮想ネットワーク構築手順と、
前記仮想マシンに障害が発生した場合、前記仮想マシンの仮想マシンイメージと同じ仮想マシンイメージ、もしくは同じコマンド体系の仮想マシンイメージを用いて他の前記計算機システムに新たに副仮想マシンを構築し、前記経路制御用レイヤ3ノード及び他の前記計算機システムの前記仮想通信ノードを介して前記副仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記障害発生前の設定で前記クライアントと前記副仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送する障害復旧手順と、
を行う。
本発明は、ワーキング系計算機システム上の仮想マシンに関して障害が発生した際、管理システムが仮想マシンの仮想マシンイメージと同じ仮想マシンイメージを用いてバックアップ系計算機システムの一台の上で仮想マシンを駆動する。そして、本発明は、仮想トンネルをワーキング系計算機システム上の仮想マシンからバックアップ系計算機システム上の仮想マシンへ接続変更する。当該仮想トンネルでは主信号をカプセル化して転送するため、クライアント側で設定の変更が不要である。
従って、本発明は、ワーキング系計算機システム上の仮想マシンに関して障害が発生した際に仮想マシンと通信していたクライアントに対して一切の設定変更を加えることなく障害を復旧可能なネットワークシステム及び制御方法を提供することができる。
第1の発明の具体的な構成は次の通りである。
本発明に係るネットワークシステムの前記管理システムは、
前記ゲートウェイ上にTAPを設定して、前記TAPと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPとを結ぶ前記仮想トンネルを構築し、
前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信手段と、
前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知手段と、
前記仮想マシンを停止する仮想マシン停止手段と、
前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保手段と、
前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築手段と、
前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定手段と、
前記ゲートウェイにおいて、前記副仮想マシンと接続するための前記仮想トンネルを設定するゲートウェイ設定手段と、
を有する。
本発明に係るネットワークシステムの制御方法は、
前記仮想ネットワーク構築手順が、
前記ゲートウェイ上にTAPを設定して、前記TAPと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPとを結ぶ前記仮想トンネルを構築し、
構築した前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信ステップ、で行い、
前記障害復旧手順が、
前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知ステップと、
前記仮想マシンを停止する仮想マシン停止ステップと、
前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保ステップと、
前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築ステップと、
前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定ステップと、
前記ゲートウェイにおいて、前記副仮想マシンと接続するための前記仮想トンネルを設定するゲートウェイ設定ステップと、を行う。
また、第2の発明の具体的な構成は次の通りである。
本発明に係るネットワークシステムの前記管理システムは、
前記ゲートウェイ上に複数のTAPを設定して、前記TAPの1つと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPの1つとを結ぶ前記仮想トンネルを構築し、
前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信手段と、
前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知手段と、
前記仮想マシンを停止する仮想マシン停止手段と、
前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保手段と、
前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築手段と、
前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定手段と、
前記ゲートウェイの前記TAPそれぞれについての所定メッセージを前記ゲートウェイに発信させ、前記メッセージに対して応答する少なくとも一台の前記仮想マシンに対応するTAPのペアから一つのペアを選択し、前記ペアのTAP間で前記仮想トンネルを設定するゲートウェイ自律設定手段と、
を有する。
本発明に係るネットワークシステムの制御方法は、
前記仮想ネットワーク構築手順が、
前記ゲートウェイ上に複数のTAPを設定して、前記TAPの1つと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPの1つとを結ぶ前記仮想トンネルを構築し、
前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信ステップで行い、
前記障害復旧手順が、
前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知ステップと、
前記仮想マシンを停止する仮想マシン停止ステップと、
前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保ステップと、
前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築ステップと、
前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定ステップと、
前記ゲートウェイの前記TAPそれぞれについての所定メッセージを前記ゲートウェイに発信させ、前記メッセージに対して応答する少なくとも一台の前記仮想マシンに対応するTAPのペアから一つのペアを選択し、前記ペアのTAP間で前記仮想トンネルを設定するゲートウェイ自律設定ステップと、を行う。
本発明は、クライアントと、クライアントを収容するゲートウェイと、portを搭載するとともに一台以上の仮想マシン群と一台以上の仮想通信ノードとを駆動するワーキング系計算機システムと、前記ワーキング系計算機システムに対する一台以上のバックアップ系計算機システムと、一台以上の前記ゲートウェイ群、前記ワーキング系計算機システム、及び一台以上の前記バックアップ系計算機システム群とを接続する経路制御用レイヤ3ノードと、前記ゲートウェイ群、前記ワーキング系計算機システム、前記バックアップ系計算機システム群、及び前記経路制御用レイヤ3ノードを管理・制御する管理システムと、から成るネットワークシステムを前提とする。また、前記仮想マシンがプロトコルソフトウェアを駆動するとともにvNICを介して前記仮想通信ノードと主信号を送受し、前記仮想通信ノードがTAPを有するとともに前記TAP経由で前記仮想通信ノードと主信号を送受し、一方でvport、および前記ワーキング系計算機システム上の前記portを経由して前記経路制御用レイヤ3ノードと主信号を送受し、前記経路制御用レイヤ3ノードがportを有するとともに前記port経由で入出力する主信号をIPルーティングに従って経路制御し、前記ゲートウェイがportを有するとともに前記port系で前記経路制御レイヤ3ノードと主信号を送受し、一方でTAPも有するとともに前記TAP経由で前記クライアントと主信号を送受する、ネットワークシステムを前提とする。
上記の前提の上で本発明は、前記ワーキング系計算機システム上の前記仮想マシンに関して障害が発生した際、前記管理システムが前記仮想マシンの仮想マシンイメージと同じ仮想マシンイメージを用いて前記バックアップ系計算機システムの一台の上で仮想マシンを駆動することにより、前記仮想マシンと通信していたクライアントに対して一切の設定変更を加えることなく障害を復旧する障害復旧方法に関し、前記ワーキング系計算機システムと前記バックアップ系計算機システムとが前記経路制御用レイヤ3ノードを介して異なるIPセグメントに属する場合でも障害復旧できるように本発明によって拡張した障害復旧方法である。
第1の発明において、
前記ワーキング系計算機システムと前記ゲートウェイが互いのTAPを終端点とした仮想トンネルを構築し、前記仮想トンネルに収容される主信号に対してアウターヘッダを付与し、逆に前記仮想トンネルから出力される主信号から前記アウターヘッダを除去し、さらに前記経路制御用レイヤ3ノードが、入力してくる主信号に対して前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従って主信号を宛先に向けて転送する、トンネル通信手段(ステップ)と、
障害発生後に、前記管理システムが前記バックアップ系計算機システム上の仮想通信ノードを管理・制御してTAPを設定し、前記TAPと前記ゲートウェイ上の前記TAPとを結ぶ仮想トンネルを構築する、仮想通信ノード設定手段(ステップ)と、
前記管理システムが前記ゲートウェイ上の前記TAPを管理・制御し、前記TAPと前記仮想トンネル上の前記仮想通信ノード上の前記TAPとを結ぶ仮想トンネルを構築する、ゲートウェイ設定手段(ステップ)と、を有する。
これにより、レイヤ3ネットワークを介して接続されたクライアント群や仮想マシン群の間で、ワーキング系の計算機システム上で駆動していた仮想マシンに関する障害に際し、バックアップ系の計算機システム上に同等の仮想マシンを駆動でき、クライアントに一切の変更を加えることなく、クライアントと仮想マシンとの間の通信を再確立することができる。
既存技術との差異は、
(1)ゲートウェイと仮想マシンとの間をポイント・ツー・ポイントの仮想トンネルで接続していることと、
(2)管理システムが障害発生後に仮想マシンをバックアップ系の計算機システムの上で再構築することと、
(3)管理システムがゲートウェイと仮想マシンとの間の仮想トンネルを再設定することと、
を組み合わせたことである。これにより上記の効果が実現されている。
また、第2の発明において、
第1の発明を前提とし、前記ゲートウェイ設定手段(ステップ)において前記ゲートウェイに設定される前記TAPについて、複数のTAP候補を予め前記ゲートウェイに設定しておき、障害発生後、前記ゲートウェイ設定手段(ステップ)を実行することなく、前記ゲートウェイが前記のTAP候補群に対してARPもしくはそれに相当するマルチキャスト、もしくはブロードキャストのメッセージを発信し、前記メッセージに対して応答してきた、一台以上の仮想マシンとTAPのペアから一つのペアを選択し、前記の選択されたTAPと仮想トンネルを設定する、ゲートウェイ自律設定手段(ステップ)、を実行する。
これにより、地域に多く分散配備されるゲートウェイに対し、管理システムが設定する必要性がなくなり、管理システムの処理負荷を大幅に低減できる。
本発明は、ワーキング系計算機システム上の仮想マシンに関して障害が発生した際に仮想マシンと通信していたクライアントに対して一切の設定変更を加えることなく障害を復旧可能なネットワークシステム及び制御方法を提供することができる。
OS仮想化において、経路制御用レイヤ2ノードを用いたシステム構成を説明する図である。 OS仮想化において、経路制御用レイヤ3ノードを用いたシステム構成を説明する図である。 OS仮想化において、経路制御用レイヤ3ノードを用いたシステム構成を説明する図である。 OS仮想化において、経路制御用レイヤ3ノードを用いたシステム構成を説明する図である。仮想通信ノード3は、仮想マシン1、クライアント1、及びクライアント2とを仮想的かつ面的に接続する。 OS仮想化によって実現される仮想的なレイヤ2ネットワークの構成を説明する図である。 OS仮想化により、バックアップ系の仮想マシンを駆動する例を説明する図である。 本発明におけるネットワークシステムを説明する図である。ワーキング系の計算機システム上で仮想マシンを駆動する例である。 本発明におけるネットワークシステムを説明する図である。ワーキング系の仮想マシンとクライアントとを仮想的に直接接続する仮想トンネルの例である。 本発明におけるネットワークシステムにおいて実現される仮想的なレイヤ2ネットワークの構成を説明する図である。 本発明におけるネットワークシステムの制御方法を説明するフローチャートである。 本発明におけるネットワークシステムの制御方法を説明するシーケンス図である。 本発明におけるネットワークシステムにおいて、管理システムが保管する仮想マシンイメージと設定情報を説明する図である。 本発明におけるネットワークシステムにおいて、仮想マシンのメモリ上のデータを説明する図である。 本発明におけるネットワークシステムにおいて、仮想マシンのメモリ上のデータを説明する図である。 本発明におけるネットワークシステムにおいて、障害発生前に、Port11からPort9の方向に向けて送信される主信号、およびvport2からvNIC1の方向に向けて送信される主信号を説明する図である。 本発明におけるネットワークシステムにおいて、障害発生前に、Port7からPort3に向けて送信される主信号を説明する図である。カプセリングプロトコルとしてVXLANを用いた場合の例である。 本発明におけるネットワークシステムにおいて、障害発生前に、vNIC1からvport2の方向に向けて送信される主信号、およびport9からport11の方向に向けて送信される主信号を説明する図である。 本発明におけるネットワークシステムにおいて、障害発生前に、Port3からPort7に向けて送信される主信号を説明する図である。カプセリングプロトコルとしてVXLANを用いた場合の例である。 本発明におけるネットワークシステムにおいて、障害発生前に、Port11からPort9の方向に向けて送信される主信号、およびvport2からvNIC1の方向に向けて送信される主信号を説明する図である。 本発明におけるネットワークシステムにおいて、障害発生前に、Port7からPort3に向けて送信される主信号を説明する図である。カプセリングプロトコルとしてVXLANを用いた場合の例である。 本発明におけるネットワークシステムを説明する図である。バックアップ系の計算機システム上で仮想マシンを駆動する例である。 本発明におけるネットワークシステムを説明する図である。バックアップ系の仮想マシンとクライアントとを仮想的に直接接続する仮想トンネルの例である。 本発明におけるネットワークシステムにおいて、障害発生後に、Port11からPort9の方向に向けて送信される主信号、およびvport5からvNIC1の方向に向けて送信される主信号を説明する図である。 本発明におけるネットワークシステムにおいて、障害発生後に、Port7からPort3に向けて送信される主信号を説明する図である。カプセリングプロトコルとしてVXLANを用いた場合の例である。 本発明におけるネットワークシステムにおいて、障害発生後に、vNIC1からvport5の方向に向けて送信される主信号、およびport9からport11の方向に向けて送信される主信号を説明する図である。 本発明におけるネットワークシステムにおいて、障害発生後に、Port3からPort7に向けて送信される主信号を説明する図である。カプセリングプロトコルとしてVXLANを用いた場合の例である。 本発明におけるネットワークシステムにおいて、障害発生後に、Port11からPort9の方向に向けて送信される主信号、およびvport5からvNIC1の方向に向けて送信される主信号を説明する図である。 本発明におけるネットワークシステムにおいて、障害発生前に、Port7からPort3に向けて送信される主信号を説明する図である。カプセリングプロトコルとしてVXLANを用いた場合の例である。 本発明におけるネットワークシステムにおいて、ゲートウェイに複数のTAPおよび仮想トンネルを形成した場合を説明する図である。 本発明におけるネットワークシステムの制御方法を説明するフローチャートである。
添付の図面を参照して本発明の実施形態を説明する。以下に説明する実施形態は本発明の実施例であり、本発明は、以下の実施形態に制限されるものではない。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。
(実施形態1)
本実施形態は、OS仮想化で仮想マシン及び仮想通信ノードを駆動可能な複数の計算機システムと、
クライアントを収容するゲートウェイと、
前記計算機システムと前記ゲートウェイとを接続する経路制御用レイヤ3ノードと、
前記計算機システムに前記仮想マシン及び前記仮想通信ノードを構築し、前記経路制御用レイヤ3ノード及び前記仮想通信ノードを介して前記仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記クライアントと前記仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送するとともに、
前記仮想マシンに障害が発生した場合、前記仮想マシンの仮想マシンイメージと同じ仮想マシンイメージ、もしくは同じコマンド体系の仮想マシンイメージを用いて他の前記計算機システムに新たに副仮想マシンを構築し、前記経路制御用レイヤ3ノード及び他の前記計算機システムの前記仮想通信ノードを介して前記副仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記障害発生前の設定で前記クライアントと前記副仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送するように、前記計算機システム、前記ゲートウェイ、及び前記経路制御用レイヤ3ノードを管理及び制御する管理システムと、
を備えるネットワークシステムである。
また、本実施形態は、上記ネットワークシステムの制御方法であって、
前記計算機システムに前記仮想マシン及び前記仮想通信ノードを構築し、前記経路制御用レイヤ3ノード及び前記仮想通信ノードを介して前記仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記クライアントと前記仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送する仮想ネットワーク構築手順と、
前記仮想マシンに障害が発生した場合、前記仮想マシンの仮想マシンイメージと同じ仮想マシンイメージ、もしくは同じコマンド体系の仮想マシンイメージを用いて他の前記計算機システムに新たに副仮想マシンを構築し、前記経路制御用レイヤ3ノード及び他の前記計算機システムの前記仮想通信ノードを介して前記副仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記障害発生前の設定で前記クライアントと前記副仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送する障害復旧手順と、
を行う。
詳細には、本実施形態は、複数セグメントから成るIPネットワーク上での、仮想マシンから成る仮想ネットワークについての障害復旧方法である。つまり、前記仮想ネットワーク構築手順は、
前記ゲートウェイ上にTAPを設定して、前記TAPと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPとを結ぶ前記仮想トンネルを構築し、
構築した前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信ステップ、で行い、
前記障害復旧手順は、
前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知ステップと、
前記仮想マシンを停止する仮想マシン停止ステップと、
前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保ステップと、
前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築ステップと、
前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定ステップと、
前記ゲートウェイにおいて、前記副仮想マシンと接続するための前記仮想トンネルを設定するゲートウェイ設定ステップと、を行う。
図10は本発明の原理を示す一例であり、図11は図10についての制御メッセージのシーケンスを示す一例である。仮想マシンのレポジトリの例、特に仮想マシンイメージと設定情報、仮想マシンのメモリ上のデータ、および仮想マシン上のプロトコルソフトウェアの一例をそれぞれ図12、図13、図14に示す。
管理システム76は、図12のとおり、駆動している仮想マシンと、その仮想マシンイメージ、および設定情報を管理する。また図13及び非特許文献3、非特許文献8および非特許文献9に示されるとおり、駆動している仮想マシンのメモリデータや、入力されたトランザクション情報を管理する。さらに図14に示されるとおり、管理システム76は仮想マシン上で駆動させているプロトコルソフトウェアを管理している。
図7は本実施形態が前提とするシステム構成の一例を示す。本実施形態におけるクライアントは、パーソナル・コンピュータ(PC)や携帯電話、タブレットPCなどであり、ゲートウェイは、宅内に配備されるホーム・ゲートウェイ・ルータ、および経路制御用レイヤ3ノード73はIPルータである。
仮想マシンは、Xen、KVMもしくはVMwareなどのOS仮想化ソフトウェアによって実現されるものであり、vNICや仮想通信ノードも同様に実現される。本実施形態において、仮想マシンの上で駆動するプロトコルソフトウェアは、IPルータをソフトウェアで実現するIPルーティングソフトウェアを想定する。
本実施形態における仮想トンネルは、GREやVXLANなどのトンネリングプロトコルによって実現され、TAPはGRETAPやVTEPである。仮想トンネルは、例えばGREの場合、下記のようなコマンドを仮想マシン上のオペレーションシステム上で実行することによって生成される。
(コマンド)
# /sbin/ip tunnel add <IF_NAME> mode gre remote <REMOTE_IPV4_ADDR> local <LOCAL_IPV4_ADDR>
上記において、<IF_NAME>はGRETAPの識別情報であり、<REMOTE_IPV4_ADDR>は対向側の仮想トンネル端のGRETAPのIPアドレスであり、<LOCAL_IPV4_ADDR>はローカルのGRETAPのIPアドレスである。このようにして、仮想トンネルが設定される。
以降、本実施形態では特にVXLANを前提として説明する。ただし、GREを前提とした場合でも本発明の原理に変更を与えず、GREを用いてもよい。非特許文献20にGRETAPおよびVXLANによる主信号のカプセル化の例を示す。
TAP1とTAP2に付与されるIPアドレスは非特許文献19のとおり、計算機システム1上のport1と同じIPアドレスとなるように設定されている。
図7と図8に示すとおり、障害発生前の仮想マシン1は計算機システム1(74)の上で動作していると想定し、TAP3とTAP1、およびTAP4とTAP2とがそれぞれ仮想トンネル(Tn31、32)によって接続されていると想定する。すなわち、TAP3において、対向側の仮想トンネル端はTAP1、及びそのIPアドレスであり、TAP1における対向側の仮想トンネル端はTAP3、及びそのIPアドレスである。TAP4とTAP2も同様に設定されているものとする。この時、図9に示されるようなクライアント1と仮想マシン1との間でポイン・ツー・ポイントの仮想レイヤ2ネットワークが構築されている。同様、クライアント2と仮想マシン1との間でもポイント・ツー・ポイントの仮想レイヤ2ネットワークを構築している。
この状況下において、クライアント1が仮想マシン1、及びそのプロトコルソフトウェアに向けて送信する主信号に関し、port11とport9との区間、及びvport2とvNIC1との区間で観測される主信号の構造を図15に示す。また、port7とport3との区間において観測される主信号の構造を図16に示す。図16に示されるとおり、本来の主信号は、VXLANヘッダによってカプセル化されており、受信側のTAPにおいてVXLANヘッダをデカプセル化することによって本来の主信号を取り出す。一方、仮想マシン1がクライアント1に向けて送信する主信号に関し、vNIC1とvport2との区間、及びport9とport11との区間において観測される主信号の構造を図17に示す。また、port3とport7との区間において観測される主信号の構造を図18に示す。図17に示されるとおり、仮想マシン1からクライアント1に送信される主信号もまたVXLANによってカプセル化される。クライアント1からクライアント2に送信される主信号の構造を図19に示す。図19の主信号は、中継区間、例えばport7とport3との区間において図20のようにカプセル化される。
この状態において、ワーキング系の計算機システム1(74)、計算機システム1(74)上の仮想マシン1、もしくは仮想マシン1上のプロトコルソフトウェアが監視されていると想定する。監視方法は非特許文献8や非特許文献11が紹介するとおり、ワーキング系計算機システム1(74)上の仮想マシン1と、バックアップ系計算機システム2(75)上の仮想マシン1との間で正常性確認メッセージを定期的に交換し、ワーキング系の仮想マシン1から送信されているはずの正常性確認メッセージがバックアップ系の仮想マシン1に到達しなかった時点でバックアップ系の仮想マシン1から管理システム76に通知する方法が考えられる。これを間接監視方法とする。間接監視方法では、非特許文献8のとおり、ワーキング系の仮想マシン1とバックアップ系の仮想マシン1とが予め駆動されており、共有ストレージ、すなわち共有のハードディスクを用いる。そのため、ワーキング系からバックアップ系に仮想マシン1の駆動場所を切り替える際も高速化できる。ただし、バックアップ系の計算機システム2(75)や仮想マシン1を事前に決定しているため、複数のバックアップ系の計算機システム群やそれらの上で駆動している仮想マシン群を絡めた大規模障害に対し、対処できなくなるという問題を抱えている。一方、管理システム76がワーキング系の計算機システム1(74)、計算機システム1(74)上の仮想マシン1、および仮想マシン1上のプロトコルソフトウェアを直接監視する方法も考えられる。これを直接監視方法とする。直接監視方法は間接監視方法と比べて管理システム76に掛る処理負荷が多くなり、障害発生から障害復旧までに要する時間も長くなる。ただし、バックアップ系の計算機システム2(75)や仮想マシン1を障害発生後に動的に探索・決定することができるため、上記のような大規模障害に対しても対応することができる。なお、いずれの方法を用いても本発明の原理に変更は発生しない。本実施形態では直接監視方法をベースにして説明する。
管理システム76はワーキング系の計算機システム1(74)、計算機システム1(74)上の仮想マシン1、及び仮想マシン1上のプロトコルソフトウェアを監視し、それらの一部、もしくは全てに関わる障害が発生すれば上記の方法によってその障害を検知する(障害検知ステップS01)。
障害検知ステップS01後、管理システム76はワーキング系の仮想マシン1を停止させる。これはワーキング系仮想マシン停止ステップS02であり、非特許文献8にも記載されている。非特許文献8で示されるとおり、ワーキング系の仮想マシン1が停止しておらず、障害復旧後にワーキング系の仮想マシン1とバックアップ系の仮想マシン1が同じIPアドレスを保有したままで併存することがないようにするためである。それゆえ、上記の併存というリスクを許容する場合、すなわちIPアドレスの重複によって安定的なIP通信を確立することができないことを許容する場合、ワーキング系仮想マシン停止ステップS02を割愛できる。前記の割愛を実施する場合と実施しない場合のいずれについても、図10における後段のバックアップ系仮想マシン構築ステップS04と、仮想通信ノード設定ステップS05と、ゲートウェイ設定ステップS06と、に差異を生じさせない。本実施形態では割愛しない場合について説明する。
図10のバックアップ系計算機システム確保ステップS03において、管理システム76はバックアップ系の計算機システム2(75)の候補を探索し、確保する。管理システム76は上記の探索に際し、非特許文献16や非特許文献17の表2に示される、CPUの数や個々の性能、メモリのサイズ、NICのネットワーク帯域についての物理量や利用可能量についての情報を参照する。資源の情報を自身のレポジトリ上で記憶する場合と、外部のレポジトリ上で記憶する場合がある。非特許文献18では、管理システム76が上記の参照情報に基づき、仮想マシンを割り当てるべき適当な計算機システムを探索する方法を紹介している。
上記で述べた間接監視方法を採用している場合、バックアップ系計算機システム確保ステップS03は割愛される。
バックアップ系計算機システム確保ステップS03が完了した後、管理システム76はバックアップ系仮想マシン構築ステップS04を実行する。
管理システム76は、上記までで確保されたバックアップ系の計算機システムに対し、ワーキング系の仮想マシン1と同じ仮想マシンイメージをコピーする。この際、上記の間接監視方法を採用している場合、障害発生前からバックアップ系の仮想マシン1を駆動しているため、コピーというアクションを割愛できる。
管理システム76は、図12のレポジトリ上の情報に基づき、ワーキング系仮想マシン1と同等のバックアップ系仮想マシン1を設定する。この際、上記の間接監視方法を採用している場合、障害発生前からバックアップ系の仮想マシン1を駆動しているため、本アクションを割愛できる。
次に管理システム76はバックアップ系の仮想マシン1を起動し、図14のレポジトリ情報に基づき、ワーキング系仮想マシン上で駆動していたプロトコルソフトウェアと同じものをバックアップ系仮想マシンにインストールし、プロトコルソフトウェアを設定する。この際、上記の間接監視方法を採用している場合、障害発生前からバックアップ系の仮想マシンを駆動しているため、本アクションを割愛できる。
バックアップ系仮想マシン構築ステップS04の最後として、管理システム76は図13のとおりにワーキング系の仮想マシン1のメモリ上のデータや入力されたトランザクション情報を記憶しており、それらの情報をバックアップ系の仮想マシン1にコピーし、ワーキング系の仮想マシン1とバックアップ系の仮想マシン1との間で状態を一致させる。ワーキング系の仮想マシン1とバックアップ系の仮想マシン1との間で状態が一致していることにより、障害復旧後、仮想マシン1にアクセスしているクライアントに対して一切の影響を与えない。一方、状態が一致していない場合、クライアントから同じデータを再送信してもらったり、同じトランザクション要求を再送信してもらう必要がある。ただし、その程度の差異であり、状態を一致させていなくてもよい。
上記のバックアップ系仮想マシン構築ステップS04は、一例であり、異なる内容でも本発明の原理に変更を与えない。
上記までの手順により、図21に示されるように仮想マシン1が計算機システム2(75)の上で駆動する。上記の直接監視方法を採用している場合、管理システム76が仮想マシン1を再駆動させるためのバックアップ系の計算機システム2(75)を動的に探索・決定するため、バックアップ系計算機システムの候補を複数用意できる。また、複数のワーキング系仮想マシンに対し、同じバックアップ系の計算機システムを共用できる。すなわち、M対N冗長、もしくは多重冗長と呼ばれる障害復旧スキーム、およびアーキテクチャを構築できる。
次に管理システム76は、仮想通信ノード設定ステップS05において、バックアップ系の仮想通信ノード2、TAP5、TAP6、vport5、及びvport6を設定する。既にバックアップ系の計算機システム2(75)上に別の用途で利用されている仮想通信ノード2が存在している場合、尚且つその仮想通信ノード2を利用する場合、TAP5、TAP6、vport5、及びvport6の設定のみで良い。TAP5とTAP6に付与されるIPアドレスは非特許文献19のとおり、計算機システム2(75)上のport2と同じIPアドレスとなるように設定される。
仮想通信ノード設定ステップS05の完了後、非特許文献9に示されるとおり、計算機システム2(75)のport2や仮想通信ノード2のTAP5、およびTAP6の一部、もしくはそれぞれからRARPもしくはGARPを発信してもよい。発信することにより、経路制御用レイヤ3ノード73が自身のport6と、port2、TAP5、及びTAP6とIP通信できる事を迅速に認識できる。ただし、迅速性を必要としない場合、RARPやGARPを発信しなくてもよい。
仮想通信ノード設定ステップS05に続き、管理システム76はゲートウェイ設定ステップS06を実行する。管理システム76は、ゲートウェイ1(71)のTAP3およびゲートウェイ2(72)のTAP4を制御し、TAP3における対向側の仮想トンネル端をTAP5、及びそのIPアドレスに設定し直す。同様、TAP4における対向側の仮想トンネル端をTAP6、及びそのIPアドレスに設定し直す。
ゲートウェイ設定ステップS06の完了後、図22に示されるように仮想トンネル(Tn31、Tn32)が再構築される。
この状況下において、クライアント1が仮想マシン1、及びそのプロトコルソフトウェアに向けて送信する主信号に関し、port11とport9との区間、及びvport5とvNIC1との区間で観測される主信号の構造を図23に示す。また、port7とport3との区間において観測される主信号の構造を図24に示す。一方、仮想マシン1がクライアント1に向けて送信する主信号に関し、vNIC1とvport5との区間、及びport9とport11との区間において観測される主信号の構造を図25に示す。また、port3とport7との区間において観測される主信号の構造を図26に示す。さらに、クライアント1からクライアント2に送信される主信号の構造を図27に示す。また、port7とport3との区間において観測される主信号の構造を図28に示す。
以上のとおり、本来の主信号が障害発生前後で変わらない一方、本来の主信号をカプセル化している外側のヘッダに関するIPアドレスが変化する。
以上により、ワーキング系の計算機システム1(74)の上の仮想マシン1を、レイヤ3ネットワークを介し、バックアップ系の計算機システム2(75)の上で再駆動させることができる。さらに再駆動に際し、仮想マシン1、もしくはそれを経由してネットワーク通信を行っていたクライアント1およびクライアント2に関し、設定変更を実施する必要がなく、障害復旧に伴うクライアントへの影響を縮小している。
本実施形態では経路制御用レイヤ3ノード73を一台の例で説明しているが、同経路制御用レイヤ3ノード73を特に制御していないため、複数台が併存していても本発明の原理に変更を与えない。
(実施形態2)
本実施形態は、実施形態1で説明したネットワークシステム及びその制御方法の他の障害復旧方法である。つまり、前記仮想ネットワーク構築手順は、
前記ゲートウェイ上に複数のTAPを設定して、前記TAPの1つと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPの1つとを結ぶ前記仮想トンネルを構築し、
前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信ステップで行い、
前記障害復旧手順は、
前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知ステップと、
前記仮想マシンを停止する仮想マシン停止ステップと、
前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保ステップと、
前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築ステップと、
前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定ステップと、
前記ゲートウェイの前記TAPそれぞれについての所定メッセージを前記ゲートウェイに発信させ、前記メッセージに対して応答する少なくとも一台の前記仮想マシンに対応するTAPのペアから一つのペアを選択し、前記ペアのTAP間で前記仮想トンネルを設定するゲートウェイ自律設定ステップと、を行う。
管理システム76は、仮想通信ノード1に付与するTAP1と仮想通信ノード2に付与するTAP2についてのIPアドレスを予めレポジトリに記憶しておき、障害復旧の際にレポジトリからTAP2のIPアドレスを割り当てる。
一方のゲートウェイ1(71)は、請求項2により、障害発生以前より図29のようにTAP3とTAP7を具備する。TAP3において対向側の仮想トンネル端としてTAP1、及びそのIPアドレスを設定しておき、同様にTAP7において対向側の仮想トンネル端としてTAP5、及びそのIPアドレスを設定しておく。ただし、障害発生以前にTAP5が実在しているか否かは問わない。ゲートウェイ2(72)も同様に複数のTAP群を具備し、ゲートウェイ1(71)と同じような挙動を示す。本実施形態では便宜上、ゲートウェイ2(72)の説明を割愛する。
図30は、本実施形態のネットワークシステムの制御方法を説明するフローチャートである。障害発生後に実施形態1のとおりにゲートウェイ設定ステップS06の手前まで障害復旧処理が完了した際、本実施形態では管理システム76がゲートウェイ設定ステップS06を実行しない。ゲートウェイ設定ステップS06の代替としてゲートウェイ自律設定ステップS07を行う。ゲートウェイ自律設定ステップS07について以下に説明する。
ゲートウェイ1(71)はTAP3及びTAP7を経由し、ARP、もしくはそれに類するレスポンスを要求するリクエストメッセージのブロードキャスティング、もしくはマルチキャスティングを行う。このゲートウェイ1(71)からのメッセージを受信した仮想マシン1は、ゲートウェイ1(71)に対してレスポンスメッセージを返信する。
ゲートウェイ1(71)はレスポンスメッセージを受信すると、そのメッセージを受信したTAP、すなわちTAP7に障害復旧後の仮想マシン1、もしくはそれに相当するものが存在していることを認識し、以後仮想マシン1とTAP7を経由して通信する。
以上により、管理システム76がゲートウェイを設定しなくても、ゲートウェイが事前に具備しているTAP群を利用して仮想トンネルを再構築できる。
ゲートウェイが複数のTAPを事前に具備している場合、尚且つ上記のレスポンスメッセージを複数のTAPで受信する場合が考えられる。そのような場合、ゲートウェイはいくつかの方法で利用すべきTAPを選定することができる。例えば、レスポンスメッセージを最初に受信したTAPを選定する方法である。また、TAPの識別番号などの値の大小に基づいて選定する方法である。ただし、本実施形態において述べた方法以外を用いて適切なTAPを選定してもよい。
(他の実施形態)
実施形態1および実施形態2において、クライアント1、およびクライアント2の一部、もしくは双方が、移動体端末、すなわちスマートフォン、携帯電話、もしくはゲーム機とすることができる。
(本発明の効果)
本発明により、仮想マシンから成る仮想ネットワークにおける仮想マシンに関する障害に際し、その障害のある仮想マシンをあるIPセグメントから別のIPセグメントに移動させることができる。また、その障害のある仮想マシン経由で通信していたクライアントに対しても設定変更を一切及ぼさないようにできる。さらに、ワーキング系の計算機システムとバックアップ系の計算機システムとの間でM対Nの冗長構成を組むことができる。
(定義)
本明細書における略語は次の通りである。
NIC:ネットワークインターフェースカード
vNIC:仮想的ネットワークインターフェースカード
TAP:vNICを提供する機能
GRE:Generic Routing Encapsulation、トンネルプロトコルのひとつ
VXLAN:Virtual eXtensible Local Area Network
(付記)
本発明は、オペレーションシステム(OS)仮想化、ネットワーク仮想化もしくはSoftware−Defined Networkingの分野において、複数セグメントから成るIPネットワーク上での、仮想マシンから成る仮想ネットワークについての障害復旧方法である。
以下は、上述の仮想ネットワークについての障害復旧方法を説明したものである。
(1):
クライアントと、
クライアントを収容するゲートウェイと、
portを搭載するとともに一台以上の仮想マシン群と一台以上の仮想通信ノードとを駆動する一台以上のワーキング系計算機システムと、
前記の一台以上のワーキング系計算機システム群に対する一台以上のバックアップ系計算機システム群と、
一台以上の前記ゲートウェイ群、前記の一台以上のワーキング系計算機システム群、及び一台以上の前記バックアップ系計算機システム群とを接続する経路制御用レイヤ3ノード73と、
前記ゲートウェイ群、前記ワーキング系計算機システム、前記バックアップ系計算機システム群、及び前記経路制御用レイヤ3ノード73を管理・制御する管理システム76と、
から成り、
前記仮想マシンがプロトコルソフトウェアを駆動するとともにvNICを介して前記仮想通信ノードと主信号を送受し、
前記仮想通信ノードがTAPを有するとともに前記TAP経由で前記仮想通信ノードと主信号を送受し、一方でvport、および前記ワーキング系計算機システム上の前記portを経由して前記経路制御用レイヤ3ノード73と主信号を送受し、
前記経路制御用レイヤ3ノード73がportを有するとともに前記port経由で入出力する主信号をIPルーティングに従って経路制御し、
前記ゲートウェイがportを有するとともに前記portで前記経路制御レイヤ3ノード73と主信号を送受し、一方でTAPも有するとともに前記TAP経由で前記クライアントと主信号を送受する、
ことを特徴としたネットワークシステムを前提とし、
前記ワーキング系計算機システム上の前記仮想マシンに関して障害が発生した際、前記管理システム76が前記仮想マシンの仮想マシンイメージと同じ仮想マシンイメージ、もしくは同じコマンド体系の仮想マシンイメージ を用いて前記バックアップ系計算機システムの一台の上で仮想マシンを駆動することにより、前記仮想マシンと通信していたクライアントに対して一切の設定変更を加えることなく障害を復旧する障害復旧方法に関し、
前記ワーキング系計算機システムと前記バックアップ系計算機システムとが前記経路制御用レイヤ3ノード73を介して異なるIPセグメントに属する場合でも障害復旧できるように本発明によって拡張した障害復旧方法であり、
前記ワーキング系計算機システムと前記ゲートウェイが互いのTAPを終端点とした仮想トンネルを構築し、前記仮想トンネルに収容される主信号に対してアウターヘッダを付与し、逆に前記仮想トンネルから出力される主信号から前記アウターヘッダを除去し、さらに前記経路制御用レイヤ3ノード73が、入力してくる主信号に対して前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従って主信号を宛先に向けて転送する、トンネル通信ステップと、
障害発生後に、
前記管理システム76が前記バックアップ系計算機システム上の仮想通信ノードを管理・制御してTAPを設定し、前記TAPと前記ゲートウェイ上の前記TAPとを結ぶ仮想トンネルを構築する、仮想通信ノード設定ステップと、
前記管理システム76が前記ゲートウェイ上の前記TAPを管理・制御し、前記TAPと前記仮想トンネル上の前記仮想通信ノード上の前記TAPとを結ぶ仮想トンネルを構築する、ゲートウェイ設定ステップと、
を有する障害復旧方法。
(2):
上記(1)を前提とし、
前記ゲートウェイ設定ステップにおいて前記ゲートウェイに設定される前記TAPについて、複数のTAP候補を予め前記ゲートウェイに設定しておき、
障害発生後、
前記ゲートウェイ設定ステップを実行することなく、
前記ゲートウェイが前記のTAP候補群に対してARPもしくはそれに相当するマルチキャスト、もしくはブロードキャストのメッセージを発信し、前記メッセージに対して応答してきた、一台以上の仮想マシンとTAPのペアから一つのペアを選択し、前記の選択されたTAPと仮想トンネルを設定する、ゲートウェイ自律設定ステップ、を実行する障害復旧方法。
71:ゲートウェイ
72:ゲートウェイ
73:経路制御用レイヤ3ノード
74:計算機システム
75:計算機システム
76:管理システム

Claims (6)

  1. OS仮想化で仮想マシン及び仮想通信ノードを駆動可能な複数の計算機システムと、
    クライアントを収容するゲートウェイと、
    前記計算機システムと前記ゲートウェイとを接続する経路制御用レイヤ3ノードと、
    前記計算機システムに前記仮想マシン及び前記仮想通信ノードを構築し、前記経路制御用レイヤ3ノード及び前記仮想通信ノードを介して前記仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記クライアントと前記仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送するとともに、
    前記仮想マシンに障害が発生した場合、前記仮想マシンの仮想マシンイメージと同じ仮想マシンイメージ、もしくは同じコマンド体系の仮想マシンイメージを用いて他の前記計算機システムに新たに副仮想マシンを構築し、前記経路制御用レイヤ3ノード及び他の前記計算機システムの前記仮想通信ノードを介して前記副仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記障害発生前の設定で前記クライアントと前記副仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送するように、前記計算機システム、前記ゲートウェイ、及び前記経路制御用レイヤ3ノードを管理及び制御する管理システムと、
    を備えるネットワークシステム。
  2. 前記管理システムは、
    前記ゲートウェイ上にTAPを設定して、前記TAPと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
    前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPとを結ぶ前記仮想トンネルを構築し、
    前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
    前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
    前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信手段と、
    前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知手段と、
    前記仮想マシンを停止する仮想マシン停止手段と、
    前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保手段と、
    前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築手段と、
    前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定手段と、
    前記ゲートウェイにおいて、前記副仮想マシンと接続するための前記仮想トンネルを設定するゲートウェイ設定手段と、
    を有することを特徴とする請求項1に記載のネットワークシステム。
  3. 前記管理システムは、
    前記ゲートウェイ上に複数のTAPを設定して、前記TAPの1つと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
    前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPの1つとを結ぶ前記仮想トンネルを構築し、
    前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
    前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
    前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信手段と、
    前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知手段と、
    前記仮想マシンを停止する仮想マシン停止手段と、
    前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保手段と、
    前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築手段と、
    前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定手段と、
    前記ゲートウェイの前記TAPそれぞれについての所定メッセージを前記ゲートウェイに発信させ、前記メッセージに対して応答する少なくとも一台の前記仮想マシンに対応するTAPのペアから一つのペアを選択し、前記ペアのTAP間で前記仮想トンネルを設定するゲートウェイ自律設定手段と、
    を有することを特徴とする請求項1に記載のネットワークシステム。
  4. OS仮想化で仮想マシン及び仮想通信ノードを駆動可能な複数の計算機システムと、
    クライアントを収容するゲートウェイと、
    前記計算機システムと前記ゲートウェイとを接続する経路制御用レイヤ3ノードと、
    前記計算機システム、前記ゲートウェイ、及び前記経路制御用レイヤ3ノードを管理及び制御する管理システムと、
    を備えるネットワークシステムの制御方法であって、
    前記計算機システムに前記仮想マシン及び前記仮想通信ノードを構築し、前記経路制御用レイヤ3ノード及び前記仮想通信ノードを介して前記仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記クライアントと前記仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送する仮想ネットワーク構築手順と、
    前記仮想マシンに障害が発生した場合、前記仮想マシンの仮想マシンイメージと同じ仮想マシンイメージ、もしくは同じコマンド体系の仮想マシンイメージを用いて他の前記計算機システムに新たに副仮想マシンを構築し、前記経路制御用レイヤ3ノード及び他の前記計算機システムの前記仮想通信ノードを介して前記副仮想マシンと前記ゲートウェイとをポイント・ツー・ポイントの仮想トンネルで接続し、前記障害発生前の設定で前記クライアントと前記副仮想マシンとの間の主信号をカプセル化して前記仮想トンネルで伝送する障害復旧手順と、
    を行うことを特徴とする制御方法。
  5. 前記仮想ネットワーク構築手順は、
    前記ゲートウェイ上にTAPを設定して、前記TAPと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
    前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPとを結ぶ前記仮想トンネルを構築し、
    構築した前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
    前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
    前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信ステップ、で行い、
    前記障害復旧手順は、
    前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知ステップと、
    前記仮想マシンを停止する仮想マシン停止ステップと、
    前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保ステップと、
    前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築ステップと、
    前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定ステップと、
    前記ゲートウェイにおいて、前記副仮想マシンと接続するための前記仮想トンネルを設定するゲートウェイ設定ステップと、を行う
    ことを特徴とする請求項4に記載の制御方法。
  6. 前記仮想ネットワーク構築手順は、
    前記ゲートウェイ上に複数のTAPを設定して、前記TAPの1つと前記計算機システムに構築された前記仮想通信ノード上のTAPとを結ぶ前記仮想トンネルを構築し、
    前記仮想通信ノードにTAPを設定して、前記TAPと前記ゲートウェイ上の前記TAPの1つとを結ぶ前記仮想トンネルを構築し、
    前記仮想トンネルに収容される主信号に対してアウターヘッダを付与してカプセル化し、
    前記経路制御用レイヤ3ノードにおいて、カプセル化した主信号の前記アウターヘッダ内に含まれる宛先アドレスと仮想ネットワークの識別情報に従ってカプセル化した主信号を宛先に向けて転送し、
    前記仮想トンネルから出力されるカプセル化した主信号から前記アウターヘッダを除去するトンネル通信ステップで行い、
    前記障害復旧手順は、
    前記仮想マシンが構築された前記計算機システム、前記仮想マシン、もしくは前記仮想マシン上のプロトコルソフトウェアを監視して障害の発生を検知する障害検知ステップと、
    前記仮想マシンを停止する仮想マシン停止ステップと、
    前記副仮想マシンを駆動できる他の前記計算機システムを探索し、バックアップ系の計算機システムとして確保するバックアップ系計算機システム確保ステップと、
    前記バックアップ系の計算機システム上で前記副仮想マシンを構築するバックアップ系仮想マシン構築ステップと、
    前記バックアップ系の計算機システムにTAPとvportを有する仮想通信ノードを設定し、前記TAPに対して宛先の前記ゲートウェイと接続するための前記仮想トンネルを設定する仮想通信ノード設定ステップと、
    前記ゲートウェイの前記TAPそれぞれについての所定メッセージを前記ゲートウェイに発信させ、前記メッセージに対して応答する少なくとも一台の前記仮想マシンに対応するTAPのペアから一つのペアを選択し、前記ペアのTAP間で前記仮想トンネルを設定するゲートウェイ自律設定ステップと、を行う
    ことを特徴とする請求項4に記載の制御方法。
JP2013126933A 2013-06-17 2013-06-17 ネットワークシステム及び制御方法 Active JP6077945B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013126933A JP6077945B2 (ja) 2013-06-17 2013-06-17 ネットワークシステム及び制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013126933A JP6077945B2 (ja) 2013-06-17 2013-06-17 ネットワークシステム及び制御方法

Publications (2)

Publication Number Publication Date
JP2015002482A true JP2015002482A (ja) 2015-01-05
JP6077945B2 JP6077945B2 (ja) 2017-02-08

Family

ID=52296748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013126933A Active JP6077945B2 (ja) 2013-06-17 2013-06-17 ネットワークシステム及び制御方法

Country Status (1)

Country Link
JP (1) JP6077945B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108924046A (zh) * 2018-07-16 2018-11-30 烽火通信科技股份有限公司 一种gre隧道承载业务的保护方法及系统
CN110178345A (zh) * 2016-05-31 2019-08-27 交互数字Ce专利控股公司 用于提供备用链路的方法和设备
US11803452B2 (en) * 2019-02-14 2023-10-31 Nippon Telegraph And Telephone Corporation Duplexed operation system and method therefor

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006029940A1 (en) * 2004-09-17 2006-03-23 Hewlett-Packard Development Company, L.P. Network virtualization
JP2011186805A (ja) * 2010-03-09 2011-09-22 Kddi R & D Laboratories Inc 情報処理システムの構成方法および物理マシン
JP2012175190A (ja) * 2011-02-17 2012-09-10 Nippon Telegr & Teleph Corp <Ntt> 制御装置、制御システム、制御方法、及び制御プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006029940A1 (en) * 2004-09-17 2006-03-23 Hewlett-Packard Development Company, L.P. Network virtualization
JP2011186805A (ja) * 2010-03-09 2011-09-22 Kddi R & D Laboratories Inc 情報処理システムの構成方法および物理マシン
JP2012175190A (ja) * 2011-02-17 2012-09-10 Nippon Telegr & Teleph Corp <Ntt> 制御装置、制御システム、制御方法、及び制御プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110178345A (zh) * 2016-05-31 2019-08-27 交互数字Ce专利控股公司 用于提供备用链路的方法和设备
CN110178345B (zh) * 2016-05-31 2021-06-29 交互数字Ce专利控股公司 用于提供备用链路的方法和设备
CN108924046A (zh) * 2018-07-16 2018-11-30 烽火通信科技股份有限公司 一种gre隧道承载业务的保护方法及系统
CN108924046B (zh) * 2018-07-16 2021-06-29 烽火通信科技股份有限公司 一种gre隧道承载业务的保护方法及系统
US11803452B2 (en) * 2019-02-14 2023-10-31 Nippon Telegraph And Telephone Corporation Duplexed operation system and method therefor

Also Published As

Publication number Publication date
JP6077945B2 (ja) 2017-02-08

Similar Documents

Publication Publication Date Title
US11082261B2 (en) Logical router comprising disaggregated network elements
US11941423B2 (en) Data processing method and related device
WO2018161633A1 (zh) 一种报文处理方法、设备及网络系统
JP6805116B2 (ja) Psuの待機電源が機能しない場合に動作可能なサーバシステム
CN114946166A (zh) 在包括云边缘位置的异构计算环境中的动态资源移动
JP6432955B2 (ja) 仮想ネットワーク機能インスタンスをマイグレーションさせるための方法、装置およびシステム
US10110481B2 (en) Virtual network functions with high availability in public clouds
CN115004661A (zh) 通信服务提供商网络内托管的云计算实例的移动性
WO2013044828A1 (zh) 虚拟化集群系统及其处理方法和设备
US20150113112A1 (en) Managing Network Connection of a Network Node
WO2021185169A1 (zh) 一种切换方法、装置、设备和存储介质
CN111988222A (zh) 数据传输方法及装置、电子设备和计算机可读存储介质
JP6077945B2 (ja) ネットワークシステム及び制御方法
Addad et al. MIRA!: An SDN-based framework for cross-domain fast migration of ultra-low latency 5G services
CN109412980B (zh) 一种bras备份方法及装置
CN112929206B (zh) 一种云网环境下云物理机配置的方法与装置
CN113709220A (zh) 虚拟负载均衡器的高可用实现方法、系统及电子设备
Guay et al. Early experiences with live migration of SR-IOV enabled InfiniBand
JP2020113836A (ja) 情報処理装置、情報処理システム、および設定プログラム
CN117061425A (zh) 利用虚拟联网的容器化路由器
CN117579428A (zh) 云网络跨技术栈互联互通的方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170113

R150 Certificate of patent or registration of utility model

Ref document number: 6077945

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150