JP5075727B2 - ストリーム配信システム及び障害検知方法 - Google Patents

ストリーム配信システム及び障害検知方法 Download PDF

Info

Publication number
JP5075727B2
JP5075727B2 JP2008115001A JP2008115001A JP5075727B2 JP 5075727 B2 JP5075727 B2 JP 5075727B2 JP 2008115001 A JP2008115001 A JP 2008115001A JP 2008115001 A JP2008115001 A JP 2008115001A JP 5075727 B2 JP5075727 B2 JP 5075727B2
Authority
JP
Japan
Prior art keywords
stream distribution
server
failure
distribution server
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008115001A
Other languages
English (en)
Other versions
JP2009265959A (ja
Inventor
大輔 横田
有時 高田
理 竹内
佳寛 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008115001A priority Critical patent/JP5075727B2/ja
Priority to US12/140,650 priority patent/US7836330B2/en
Publication of JP2009265959A publication Critical patent/JP2009265959A/ja
Application granted granted Critical
Publication of JP5075727B2 publication Critical patent/JP5075727B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、ストリーム配信における障害を検知するストリーム配信システム及び障害検知方法に関する。
従来、ネットワークにおける障害の解析方法として、クライアント端末からネットワーク経路の障害をポーリングで監視することで、ネットワーク経路のどこで障害が発生しているかを監視するようにしたものが知られている(例えば、特許文献1参照)。
特開2002-152203号公報
しかしながら、従来の方法では、クライアント端末、サーバ及びネットワーク経路が固定である場合には利用できるが、ストリーム配信などのように、クライアント端末が不特定多数の場合には利用できない。また、ネットワーク経路が複雑な場合には、ポーリングによるトラフィックが増大するため、監視の頻度と監視のためのトラフィック増とのバランスを取るのが困難である。
一方、インターネットストリーム配信サービスのますますの増加が予想され、ストリーム配信サーバの配信帯域増大や、広域なネットワークでの活用が期待されている。同時に、サーバ設置面積の削減や、消費電力の低減からサーバ単体の処理性能の向上が要求されている。
ストリーム配信サーバが複雑なネットワークを介してストリームデータを送信するストリーム配信では、単体の配信帯域が大きいストリームデータを取り扱うため、ネットワークにおける障害が発生した場合、その障害解析には高性能な障害解析機器が必要であった。また、障害解析機器は、障害が発生しているかを調べるだけでも、ストリーム配信サーバの複雑な挙動を理解する必要があるため、ストリーム配信におけるネットワーク障害の解析は非常に困難であった。
さらに、ストリーム配信は配信帯域を保証する必要があるため、配信帯域が必要帯域を下回るなど、ストリーム配信の品質低下が発生した際に、品質低下を検知してその原因を解析する必要がある。しかし、ストリーム配信の品質低下の原因として、ネットワークにおける障害の他に、ストリーム配信サーバにおける障害やクライアント端末における障害など、複数の原因が考えられ、品質低下の原因の特定は困難であった。
本発明はかかる問題点に鑑みてなされたものであり、その目的とするところは、ストリーム配信における品質低下の原因を容易に特定することのできるストリーム配信システム及び障害検知方法を提供することにある。
本発明は前述の目的を達成するために、ネットワーク装置を介してクライアント端末と通信してストリームデータを送信する第1ストリーム配信サーバと、前記第1ストリーム配信サーバに対して冗長化されたサーバであって、前記第1ストリームサーバに接続される第2ストリーム配信サーバとを備え、前記第1ストリーム配信サーバは、前記クライアント端末との通信に関する通信情報を第2ストリーム配信サーバに送信する送信部を有し、前記第2ストリーム配信サーバは、前記第1ストリーム配信サーバに送信されるデータのコピーであるミラーデータを、前記ネットワーク装置から取得する取得部と、前記通信情報と前記ミラーデータとに基づいて、前記第1ストリーム配信サーバと前記クライアント端末との間のネットワークにおける障害を検知するネットワーク障害検知部とを有するストリーム配信システムを提案する。
また、本発明は前述の目的を達成するために、ネットワーク装置を介してクライアント端末と通信してストリームデータを送信する第1ストリーム配信サーバと、前記第1ストリーム配信サーバに対して冗長化されたサーバであって、前記第1ストリームサーバに接続される第2ストリーム配信サーバとを有するシステムに用いられる障害検知方法であって、前記第1ストリーム配信サーバが、前記クライアント端末との通信に関する通信情報を第2ストリーム配信サーバに送信する送信ステップと、前記第2ストリーム配信サーバが、前記第1ストリーム配信サーバに送信されるデータのコピーであるミラーデータを、前記ネットワーク装置から取得する取得ステップと、前記第2ストリーム配信サーバが、前記通信情報と前記ミラーデータとに基づいて、前記第1ストリーム配信サーバと前記クライアント端末との間のネットワークにおける障害を検知するネットワーク障害検知ステップとを備える障害検知方法を提案する。
本発明によれば、第1ストリーム配信サーバ及びクライアント端末間の通信に関する通信情報と、第1ストリーム配信サーバに送信されるデータのコピーであるミラーデータとに基づいて、第1ストリーム配信サーバ及びクライアント端末間のネットワークにおける障害が検知される。これにより、第2ストリーム配信サーバが、通信情報及びミラーデータによって、ネットワーク障害による品質低下を検知することができ、ネットワーク障害とその他の障害とを切り分けることができる。
本発明によれば、第2ストリーム配信サーバが、通信情報及びミラーデータによって、ネットワーク障害による品質低下を検知することができ、ネットワーク障害とその他の障害とを切り分けることができる。これにより、品質低下の原因となっている範囲を絞り込むことができ、ストリーム配信における品質低下の原因を容易に特定することができる。また、第1ストリーム配信サーバと同程度の性能を有する第2ストリーム配信サーバがネットワーク障害を検知するので、従来のように高性能な障害解析機器を必要とすることなく、ネットワーク障害を解析することが可能となる。
以下、図面について本発明の一実施の形態を詳述する。
まず、図1乃至図5を参照してストリーム配信システムの構成を説明する。図1は、ストリーム配信システムの全体構成を説明する概略構成図である。
ストリーム配信サーバ9は、ストリーム配信サーバ(以下、単にサーバという)1aと、サーバ1bと、外部記憶装置3とから構成されている。サーバ1a及びサーバ1bは、それぞれルータ2及びネットワーク5を介して接続されるクライアント端末4と通信し、クライアント端末4が指定したストリームのストリームデータを送信する。
クライアント端末4は、サーバ1a又はサーバ1bが送信するストリームデータを受信し、ストリームを閲覧するサービスをクライアント端末4の利用者に提供する端末である。クライアント端末4は、サーバ1a又はサーバ1bにネットワーク5を介してストリームの配信要求を送信し、サーバ1a又はサーバ1bからストリームデータを受信し、クライアント端末4の利用者にストリームを再生して提供するストリーム再生部34を有する。また、クライアント端末4は、利用者からの操作を受付ける入力デバイス(図示せず)と、映像を表示するデバイス(図示せず)とを有する。なお、図1では、クライアント端末4は1つだけしか示されていないが、これに限定されず、複数のクライアント端末であってもよい。
クライアント端末4は、ストリームの配信要求をする前に、サーバ1a及びサーバ1bが配信可能なストリームの一覧と、ストリームを配信するサーバ1a及びサーバ1bのネットワーク5上のアドレス、例えばIPアドレスとを、Webサーバ(図示せず)などから取得する。また、クライアント端末4は、ストリームデータを受信中に予め一定時間分のストリームデータを先読みする。サーバ1aからストリームデータを受信中に受信障害が発生し、先読みした一定時間内に続きのストリームデータをサーバ1aから受信できなかった場合に、クライアント端末4は、取得したサーバ1bのアドレスに基づいて、サーバ1bに続きのストリームの配信要求をする。
ネットワーク5は、WAN(Wide Area Network)又はインターネットで構成されている。
ルータ2は、サーバ1aやサーバ1bなどの他のネットワーク機器と接続するためのネットワークポート34a及びネットワークポート34bを備えている。また、ルータ2は、ネットワークポートに送信されるパケットをコピーし、コピーしたミラーパケットを他のネットワークポートにも送信するミラーリング部32と、外部からの設定変更を受付けてルータ2の動作の設定を変更する設定変更受付部33とを有する。
本実施形態では、ルータ2は、ネットワークポート34aとサーバ1aとがネットワークケーブル6aで接続され、ネットワークポート34bとサーバ1bとがネットワークケーブル6bで接続されている。ストリーム配信サービスを提供するサービス提供業者は、ネットワーク5に接続するルータ2と、ルータ2に接続するサーバ1a及びサーバ1bとを所有し、管理している。
サーバ1a及びサーバ1b間には、互いに相手の動作状態に関する情報を取得できるインタフェースケーブル7が設けられている。また、サーバ1a及びサーバ1bは、配信すべきストリームのストリームデータを格納した外部記憶装置3を共有し、インタフェースケーブル8a及びインタフェースケーブル8bで外部記憶装置3に接続している。インタフェースケーブル8a及びインタフェースケーブル8bとしては、例えばファイバチャンネルケーブルなどを用いることが好ましい。
外部記憶装置3は、サーバ1a及びサーバ1bが配信すべきストリームのストリームデータを格納したディスクであるストリームディスク30と、後述するパケット記録部18によって取得され、ルータ2からサーバ1aに送信されたパケットのコピーであるミラーパケットを格納したディスクであるパケットディスク31とから構成されている。
図2は、図1に示したサーバの物理構成を説明する概略構成図である。サーバ1a及びサーバ1bは、それぞれプロセッサ100、主記憶装置101、内部インタフェース105、通信回路インタフェース106、外部記憶装置インタフェース107及び入出力装置108を有する。主記憶装置101は、RAM(Random Access Memory)などにより構成され、演算処理を行う際に用いられる記憶手段として、プログラムメモリ102及びデータメモリ103を備える。なお、演算処理は、CPU(Central Processing Unit)によって構成されるプロセッサ100が、プログラムメモリ102上のプログラムを実行することで実現される。また、入出力装置108は、例えばキーボードとマウスとディスプレイである。
サーバ1a及びサーバ1bは、アクティブ・スタンバイ構成をとっている。すなわち、サーバ1a及びサーバ1bは、アクティブ又はスタンバイの動作モードの一方の状態にある。動作モードがアクティブであるサーバはストリーム配信のサービスを提供し、動作モードがスタンバイであるサーバは、動作モードがアクティブであるサーバに障害が発生していないかを監視し、動作モードがアクティブであるサーバに障害が発生したときに、動作モードをスタンバイからアクティブに変更してストリーム配信のサービスを継続する。なお、以下において、特に記載がない限り、サーバ1aは動作モードがアクティブであり、サーバ1bは動作モードがスタンバイであるとして説明する。
図1に示すように、サーバ1aは、動作モードがアクティブであるサーバで動作する、ストリーム配信部10と、コネクション管理表11と、通信状態通知部14とを有する。また、サーバ1bは、動作モードがスタンバイであるサーバで動作する、障害監視部15と、ネットワーク障害監視部17と、パケット記録部18と、コネクション解析19と、パケットバッファ20とを有する。なお、図1では、サーバ1aに動作モードがアクティブであるサーバで動作するものを、サーバ1bに動作モードがスタンバイであるサーバで動作するものを、それぞれ図示しているが、サーバに障害が発生したときに、アクティブ・スタンバイを入れ替える必要があるため、実際には、サーバ1a及びサーバ1bは、動作モードがアクティブであるサーバで動作するものと、動作モードがスタンバイであるサーバで動作するものとの両方を有する。
ストリーム配信部10は、ネットワーク5を介してストリームデータをクライアント端末4に配信するためのものである。ストリーム配信部10は、クライアント端末4からのストリームの配信要求に従い、ストリームデータを外部記憶装置3から取得し、ストリームを途切れなく再生するために必要な送信帯域を守るように、取得したストリームデータをクライアント端末4に送信する。
コネクション管理表11は、クライアント端末4との通信に関する通信情報を、クライアント端末4とのコネクションごとに管理するための表である。
図3は、図1に示したコネクション管理表を説明する構成図である。コネクション管理表11は、ストリーム配信部10によって記録又は更新される表である。コネクション管理表11は、配信情報欄201と、必要帯域欄202と、クライアント端末識別情報欄203と、受信パケット欄204と、通信状態欄205とから構成されている。
配信情報201欄には、例えばファイル名などのストリームディスク30に格納された配信すべきストリームデータを識別する情報が格納される。必要帯域欄202には、ストリームをクライアント端末4で途切れなく再生するために必要な送信帯域が格納される。クライアント端末識別情報欄203には、例えばネットワークアドレスなどの送信すべきクライアント端末4を識別するための識別情報が格納される。
受信パケット204欄には、サーバ1aに送信されたパケットの受信状態を示す受信情報、例えばサーバ1aがクライアント端末4から受信した受信パケットの数と、最後の受信パケットのサーバ1aにおける時刻と、当該受信パケットの内容を示すパケット情報とが格納される。なお、受信パケット欄204に格納されるパケット情報は、最後の受信パケットに限定されず、サーバ1aが受信したパケットのうちの一部、例えば格納可能なデータ量の範囲内で複数の受信パケットであってもよい。
通信状態205欄には、クライアント端末4との通信状態を示す通信状態情報、例えばクライアント端末4が受信可能なデータサイズを示すTCP(Transmission Control Protocol)のウィンドウサイズと、サーバ1aがストリームデータを送信してからクライアント端末4が受信したことを示すACK(ACKnowledgement)信号を受信するまでの遅延時間のうち、所定時間内に複数の遅延時間を測定した場合における最大の遅延時間と、直近の通信における通信帯域と、パケットの再送を行った回数とが格納される。
ストリーム配信部10は、クライアント端末4とコネクションを確立したときに行を追加し、配信情報201欄、必要帯域202欄及びクライアント端末識別情報203欄に情報を格納して記録する。また、ストリーム配信中は、所定時間ごとに受信パケット204欄及び通信状態欄205の内容を更新し、クライアント端末4からストリームの配信停止要求を受信するなど、クライアント端末4との通信が正常に終了した場合に、通信状態205欄を“正常終了”に更新する。
通信状態通知部14は、動作モードがスタンバイであるサーバ1bに、クライアント端末4に配信しているストリームの通信状態を知らせるためのものである。具体的には、通信状態通知部14は、所定時間ごとにコネクション管理表11をサーバ1bに送信する。なお、通信状態通知部14がコネクション管理表11をサーバ1bに送信する周期(所定時間)は、ストリーム配信部10が受信パケット欄204及び通信状態欄205の内容を更新する周期(所定時間)と同じか同程度であることが好ましい。
障害監視部15は、サーバ1aに障害が発生していないかを監視するためのものである。障害監視部15は、障害を検知したときに、サーバ1aの動作モードをアクティブからスタンバイに変更し、サーバ1bの動作モードをスタンバイからアクティブに変更する。なお、動作モードを変更する方法として、例えばアクティブフラグをプログラムメモリ102又はデータメモリ103に有し、動作モードをアクティブにする場合はアクティブフラグに「1」を、スタンバイにする場合はアクティブフラグに「0」を格納する。
ネットワーク障害監視部17は、障害監視部15によって起動され、ネットワーク5にネットワーク的な障害、すなわちクライアント端末4における障害も含めたネットワーク障害が発生していないかを監視するためのものである。ネットワーク障害監視部17は、ネットワーク障害を検知したときに、検知したネットワーク障害の障害解析を行う。
パケット記録部18は、障害監視部15又はネットワーク障害監視部17によって起動され、クライアント端末4からサーバ1aに送信されるパケットのコピーであるミラーパケットをルータ2から取得し、取得したミラーパケットを記録するためのものである。パケット記録部18は、ルータ2から取得したミラーパケットを、送信元であるクライアント端末4を識別することでコネクションごとに分類し、後述するコネクション解析表19に記録又は更新する。さらに、パケット記録部18は、ルータ2から取得したミラーパケットを、主記憶装置101にある後述のパケットバッファ20にバッファリングし、後述するタイミングで外部記憶装置3のパケットディスク31に記録する。バッファリングするデータ量は、ネットワーク障害監視部17によって行われる、後述のネットワーク障害の障害解析に過不足のないデータ量を設定しており、これを超えるミラーパケットは、パケット記録部18が削除する。なお、バッファリングするデータ量は、ネットワーク障害の障害解析に過不足のないデータ量で、かつ、クライアント端末4がネットワーク障害を検知するためのタイムアウト時間に受信するミラーパケットのデータ量以上であることが好ましい。
図4は、図1に示したコネクション解析表を説明する構成図である。コネクション解析表19は、ルータ2でコピーされサーバ1bに送信されたミラーパケットを、パケット記録部18が受信し、解析した結果が記録される表である。コネクション解析表19は、後述するパケットバッファ20にバッファリングされたミラーパケットの内容を更新する際に、パケット記録部18によって更新される。
コネクション解析表19は、クライアント端末識別情報欄211と、バッファリングパケット情報212欄とから構成されている。クライアント端末識別情報欄211には、コネクション管理表11のクライアント端末識別情報欄203と同様に、クライアント端末4を識別するための識別情報が格納される。バッファリングパケット情報欄212には、主記憶装置101にバッファリングした一番古いミラーパケットがクライアント端末4との通信開始から何番目に受信したものか管理するために、受信パケット数が格納される。
図5は、図1に示したパケットバッファを説明する構成図である。パケットバッファ20は、受信時刻欄221と、クライアント端末識別情報欄222と、受信パケット番号欄223と、パケットデータ欄224とから構成されている。受信時刻欄221には、ミラーパケットを受信したサーバ1bにおける時刻が格納される。クライアント端末識別情報欄222には、ミラーパケットにおける送信元の情報が格納される。受信パケット番号欄223には、クライアント端末識別情報欄222に格納される送信元ごとのミラーパケットの通し番号が格納される。パケットデータ欄224には、サーバ1bが受信したミラーパケットの内容が格納される。
次に、図6乃至図8を参照してストリーム配信システムの動作を説明する。
図6は、図1に示した障害監視部の動作を説明するフローチャートである。障害監視部15は、例えば前述のアクティブフラグに基づいて、サーバ1bの動作モードがスタンバイであるか否かを判定し(S301)、スタンバイである場合には障害監視を続行してS302へ進み、スタンバイでない場合には動作モードがスタンバイになるまでS301を繰り返す。
次に、障害監視部15はパケット記録部18を起動し、パケット記録部18は、ルータ2に設定変更を要求し、ルータ2がサーバ1aに送信するパケットをコピーしてサーバ1bに送信するように、ルータ2を設定する(S304)。なお、後述するS303の処理後に再度S304を実行する場合など、既にルータ2に設定済みである場合に、障害監視部15はS304をスキップする。
次に、障害監視部15は、他方のサーバであるサーバ1aに障害が発生しているか否かを判定する(S302)。サーバに障害が発生しているか否かを判定する方法として、例えば以下の処理を実行する。
図7は、サーバにおける障害の検知に係る動作を説明するフローチャートである。まず、障害監視部15は、サーバ1aのソフトウェアと一定間隔で通信して応答があるかなどに基づいて、サーバ1aのソフトウェアが正常に動作しないなど、ソフトウェアに障害が発生しているか否かを判定する(S321)。サーバ1aのソフトウェアに障害が発生していない場合、障害監視部15は、サーバ1aとサーバ1bとの内部インタフェースを接続し、サーバ1bから内部インタフェースを経由してサーバ1aにおけるCPUの自己チェックの結果を監視し、CPUに障害が発生しているか否かを判定する(S322)。サーバ1aのCPUに障害が発生していない場合、障害監視部15は、サーバ1bから内部インタフェースを経由してサーバ1aの電源が正常な電圧になってないなど、電源に障害が発生しているか否かを判定する(S323)。サーバ1aの電源に障害が発生していない場合、障害監視部15は、サーバ1aのソフトウェアに問い合わせ、ストリーム配信システム9の内部ネットワークの障害、例えばネットワークケーブル6bの断線などが発生しているか否かを判定する(S324)。内部ネットワークに障害が発生していない場合、障害監視部15は、サーバ1aのソフトウェアに問い合わせ、冷却ファンの回転数が低下するなど、冷却装置に障害が発生しているか否かを判定する(S325)。S321〜S325において、1つでも障害が発生している場合に、障害監視部15はサーバaにおける障害の発生を検知して終了し、全てに障害が発生していない場合に、障害監視部15はサーバ1aにおける障害の発生を検知せず、サーバ1aは正常であるとして終了する。
S302の判定の結果、サーバ1aに障害が発生している場合、障害監視部15は、サーバ1bがクライアント端末4と通信できるように、ルータ2に設定変更を要求してS304で変更したルータ2の設定を元に戻し、パケット記録部18を停止する(S305)。パケット記録部18を停止後、障害監視部15は、サーバ1aの動作モードをアクティブからスタンバイに変更し、サーバ1bの動作モードをスタンバイからアクティブに変更する、いわゆるフェールオーバー処理を行い(S306)、障害監視部15は障害の発生を監視する処理を終了して停止する。これにより、サーバ1aの障害監視部15が起動され、動作モードがアクティブであるサーバ1bにおける障害を監視することができる。
なお、ルータ2とサーバ1a及びサーバ1bとを接続するネットワークケーブル6a及びネットワークケーブル6bが複数存在するなど、ルータ2がコピーしたミラーパケットの送信とストリームデータの送信とを同時に実行できる場合、障害監視部15はS304及びS305のルータ2の設定変更は省略してもよい。
S302の判定の結果、サーバ1aに障害が発生していない場合に、障害監視部15はネットワーク障害監視部17を起動し、ネットワーク障害監視部17はネットワーク障害の発生を監視する。
図8は、図1に示したネットワーク障害監視部の動作を説明するフローチャートである。まず、ネットワーク障害監視部17は、クライアント端末4との通信に関する通信情報をサーバ1aから取得する(S310)。具体的には、サーバ1aの通信状態通知部14がコネクション管理表11の内容を送信し、サーバ1bのネットワーク障害監視部17が通信状態通知部14によって送信されたコネクション管理表11の内容を受信する。
次に、ネットワーク障害監視部17は、取得したコネクション管理表11の各行について、行ごとに以下のS311〜S314を実行する。
まず、ネットワーク障害監視部17は、コネクション管理表11の通信状態欄205が“正常終了”か否かに基づいて、サーバ1aとクライアント端末4との通信が正常に終了したか否かを判定し(S311)、サーバ1aとクライアント端末4との通信が正常に終了した場合にはS315に進み、正常に終了していない場合にはS312に進む。
次に、ネットワーク障害監視部17は、通信状態欄205に格納された、サーバ1aとクライアント端末4との通信状態を示す通信状態情報の各指標について、それぞれに予め設定された閾値に達したか否か判定する(S312)。ネットワークの通信状態を示す指標がその指標に設定された閾値に達した場合としては、例えばネットワークプロトコルにTCPを利用しているときに、TCPのウィンドウサイズが0になった場合、サーバ1aのIP(Internet Protocol)パケットの送信時刻と当該IPパケットに対応するAck信号の到着時刻との差が1秒以上になった場合、過去10秒間の通信帯域が必要帯域欄202の帯域を下回る場合、再送パケット数が1を超える場合などが挙げられる。このように、通信状態欄205に基づいて、クライアント端末4との通信状態の変化を検知するので、通信状態の変化による品質低下を検知することができる。
S312の判定の結果、ネットワーク障害監視部17は、通信状態情報の各指標に設定された閾値に達した場合にS316に進み、閾値に達していない場合にS313に進む。
次に、ネットワーク障害監視部17はパケット記録部18を起動し、パケット記録部18は、受信パケット欄204の内容がパケットバッファ20に含まれるか検索する。すなわち、クライアント端末識別情報欄203の情報とクライアント端末識別情報欄222の情報とが一致し、かつ、受信パケット欄204の受信数と受信パケット番号欄223のミラーパケットの通し番号とが一致する行を、パケットバッファ20から検索する。そして、パケット記録部18は、検索された行におけるパケットデータ欄224のミラーパケットの内容を取得し、取得したパケットデータ欄224のミラーパケットの内容と、受信パケット欄204のパケット情報とが異なるか否かを判定する(S313)。このように、受信パケット欄204の受信数及びパケット情報に基づいて、所定時点より前にサーバ1aに送信されたパケットの受信状態の変化を検知するので、所定時点より前の、サーバ1aにおけるパケットの受信漏れ(パケットドロップ)を検知することができる。
S313の判定の結果、ネットワーク障害監視部17は、検索された行におけるパケットデータ欄224のミラーパケットの内容と受信パケット欄204に格納されるパケット情報とが異なる場合にS316に進み、一致する場合にS314に進む。なお、ネットワーク障害監視部17は、パケットバッファ20を検索した結果、パケットバッファ20に該当する行がない場合もS314に進む。
次に、パケット記録部18は、クライアント端末識別情報欄203の情報とクライアント端末識別情報欄222の情報とが一致し、かつ、受信パケット番号欄223のミラーパケットの通し番号が受信パケット欄204の受信数より大きい行を、パケットバッファ20から検索し、検索された行における受信時刻欄221の時刻と受信パケット欄204の受信時刻との差が、一定時間以上であるか否か判定する(S314)。このように、受信パケット欄204の受信数及び受信時刻に基づいて、所定時点以降にサーバ1aに送信されたパケットの受信状態の変化を検知するので、所定時点以降の、サーバ1aにおけるパケットの受信漏れ(パケットドロップ)を検知することができる。
S314の判定の結果、ネットワーク障害監視部17は、検索された行における受信時刻欄221の時刻と受信パケット欄204の受信時刻との差が一定時間以上である場合に、S316に進む。なお、一定時間は、後述するS315で待機する時間である。また、ネットワーク障害監視部17は、パケットバッファ20を検索した結果、パケットバッファ20に該当する行がない場合もS316に進む。
前述のS311〜S314を、コネクション管理表11の各行について実行した後、ネットワーク障害監視部17は一定時間待機する(S315)。なお、一定時間は数秒程度が好ましい。
ここで、S312の判定が真(Yes)の場合、サーバ1a及びクライアント端末4間のネットワーク5又はクライアント端末4自身になんらかの障害が発生し、サーバ1aには問題がない可能性がある。また、S313又はS314の判定が真(Yes)の場合、サーバ1aはパケットを受信しきれなかった可能性がある。このように、サーバ1aとクライアント端末4との通信に関する通信情報であるコネクション管理表11と、サーバ1aに送信されるパケットのコピーであるミラーパケットをバッファリングしたパケットバッファ20とに基づいて、サーバ1a及びクライアント端末4間のネットワーク5における障害が検知されるので、サーバ1bが、コネクション管理表11及びパケットバッファ20によって、ネットワーク障害による品質低下を検知することができ、ネットワーク障害とその他の障害とを切り分けることができる。
次に、パケット記録部18は、パケットバッファ20にバッファリングしたミラーパケットをパケットディスク31に記憶する(S316)。これにより、ネットワーク障害とその他の障害との切り分け情報を記録することができる。
次に、ネットワーク障害監視部17は、コネクション解析表19のクライアント端末識別情報欄211を利用し、ネットワーク5の障害解析を行う(S317)。ネットワーク5の障害解析方法としては、例えばICMP(Internet Control Message Protocol)パケットを利用した障害解析方法が考えられる。この方法は、IPパケットの最大ホップ数を1、2、3と順次増加させ、クライアント端末識別情報欄211に格納されたクライアント端末のネットワークアドレスに対してICMPパケットを複数送信し、応答数を統計的に計測することで、何ホップ先のルータまで通信可能かと、パケットロス率とを取得でき、ネットワークの障害解析ができる。このように、ネットワーク障害を検知したときにネットワーク障害を解析し、ネットワーク障害を解析するときに、例えばICMPパケットをネットワーク5に送信しているので、ネットワーク障害の解析によるネットワーク5のトラフィック増加を最小限度に抑えることができる。
ネットワーク障害監視部17はS317の次にS315に進み、一定時間経過後、ネットワーク障害監視部17はネットワーク障害の発生を監視する処理を終了し、図6に示したフローチャートに戻り、障害監視部15は再度S301〜S306を繰り返す。
このように、本発明によれば、サーバ1aとクライアント端末4との通信に関する通信情報であるコネクション管理表11と、サーバ1aに送信されるパケットのコピーであるミラーパケットをバッファリングしたパケットバッファ20とに基づいて、サーバ1a及びクライアント端末4間のネットワーク5における障害が検知されるので、サーバ1bが、コネクション管理表11及びパケットバッファ20によって、ネットワーク障害による品質低下を検知することができ、ネットワーク障害とその他の障害とを切り分けることができる。これにより、品質低下の原因となっている範囲を絞り込むことができ、ストリーム配信における品質低下の原因を容易に特定することができる。また、サーバ1aと同程度の性能を有するサーバ1bがネットワーク障害を検知するので、従来のように高性能な障害解析機器を必要とすることなく、ネットワーク障害を解析することが可能となる。
また、ネットワーク障害を検知したときに、ミラーパケットをパケットディスク31に記憶するので、ネットワーク障害とその他の障害との切り分け情報を記録することができる。これにより、従来の障害解析機器が行っていたように、配信帯域が大きく膨大な量のパケットをパケットキャプチャして調べたり、あるいはパケットキャプチャの量を一定期間や一定条件に制限して調べたりする必要がなく、障害解析に必要なパケットだけを記録することができる。
また、サーバ1bの動作モードをスタンバイからアクティブに変更し、クライアント端末4にストリームデータを配信するときに、サーバ1bは障害監視部15を停止するので、サーバ1aの動作モードをアクティブからスタンバイに変更することで、サーバ1aの障害監視部15が起動され、動作モードがアクティブであるサーバ1bにおける障害を監視することができる。
また、コネクション管理表11はクライアント端末4との通信状態を示す通信状態情報が格納される通信状態欄205を含み、通信状態欄205に基づいて、クライアント端末4との通信状態の変化を検知することができる。これにより、通信状態の変化による品質低下を検知することができ、ネットワーク障害を更に切り分けることができる。
また、コネクション管理表11はサーバ1aに送信されたデータの受信状態を示す受信情報が格納される受信パケット欄204を含み、受信パケット欄204に基づいて、サーバ1aに送信されたパケットの受信状態の変化を検知するので、サーバ1aにおけるパケットの受信漏れ(パケットドロップ)を検知することができる。これにより、パケットの受信漏れとその他の障害とを切り分けることができる。
また、ネットワーク障害を検知したときにネットワーク障害を解析し、ネットワーク障害を解析するときに、例えばICMPパケットをネットワーク5に送信しているので、ネットワーク障害の解析によるネットワーク5のトラフィック増加を最小限度に抑えることができる。
なお、本発明の構成及び動作は、前述の実施形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加えてもよい。
ストリーム配信システムの全体構成を説明する概略構成図である。 図1に示したサーバの物理構成を説明する概略構成図である。 図1に示したコネクション管理表を説明する構成図である。 図1に示したコネクション解析表を説明する構成図である。 図1に示したパケットバッファを説明する構成図である。 図1に示した障害監視部の動作を説明するフローチャートである。 サーバにおける障害の検知に係る動作を説明するフローチャートである。 図1に示したネットワーク障害監視部の動作を説明するフローチャートである。
符号の説明
1a,1b…サーバ、2…ルータ、3…外部記憶装置、4…クライアント端末、5…ネットワーク、10…ストリーム配信部、11…コネクション管理表、14…通信状態通知部、15…障害監視部、17…ネットワーク障害監視部、18…パケット記録部、20…パケットバッファ。

Claims (12)

  1. ネットワーク装置を介してクライアント端末と通信してストリームデータを送信する第1ストリーム配信サーバと、
    前記第1ストリーム配信サーバに対して冗長化されたサーバであって、前記第1ストリームサーバに接続される第2ストリーム配信サーバとを備え、
    前記第1ストリーム配信サーバは、
    前記クライアント端末との通信に関する通信情報を第2ストリーム配信サーバに送信する送信部を有し、
    前記第2ストリーム配信サーバは、
    前記第1ストリーム配信サーバに送信されるデータのコピーであるミラーデータを、前記ネットワーク装置から取得する取得部と、
    前記通信情報と前記ミラーデータとに基づいて、前記第1ストリーム配信サーバと前記クライアント端末との間のネットワークにおける障害を検知するネットワーク障害検知部とを有する
    ことを特徴とするストリーム配信システム。
  2. 前記第2ストリーム配信サーバは、
    前記ネットワークにおける障害を検知したときに、前記ミラーデータを記憶する記憶部を有する
    ことを特徴とする請求項1に記載のストリーム配信システム。
  3. 前記第2ストリーム配信サーバは、
    前記第1ストリーム配信サーバにおける障害を検知するサーバ障害検知部と、
    前記第1ストリーム配信サーバにおける障害を検知したときに、前記クライアント端末に前記ストリームデータを送信するストリーム配信部と、
    前記クライアント端末に前記ストリームデータを送信するときに、前記サーバ障害検知部を停止する停止部とを有する
    ことを特徴とする請求項1に記載のストリーム配信システム。
  4. 前記通信情報は、前記クライアント端末との通信状態を示す通信状態情報を含む
    ことを特徴とする請求項1に記載のストリーム配信システム。
  5. 前記通信情報は、前記第1ストリーム配信サーバに送信された前記データの受信状態を示す受信情報を含み、
    前記第2ストリーム配信サーバは、
    前記通信情報と前記ミラーデータとに基づいて、前記第1ストリーム配信サーバに送信される前記データの受信漏れを検知する受信漏れ検知部を有する
    ことを特徴とする請求項1に記載のストリーム配信システム。
  6. 前記第2ストリーム配信サーバは、
    前記ネットワークにおける障害を検知したときに、前記ネットワークにおける障害を解析する解析部を有する
    ことを特徴とする請求項1に記載のストリーム配信システム。
  7. ネットワーク装置を介してクライアント端末と通信してストリームデータを送信する第1ストリーム配信サーバと、前記第1ストリーム配信サーバに対して冗長化されたサーバであって、前記第1ストリームサーバに接続される第2ストリーム配信サーバとを有するシステムに用いられる障害検知方法であって、
    前記第1ストリーム配信サーバが、前記クライアント端末との通信に関する通信情報を第2ストリーム配信サーバに送信する送信ステップと、
    前記第2ストリーム配信サーバが、前記第1ストリーム配信サーバに送信されるデータのコピーであるミラーデータを、前記ネットワーク装置から取得する取得ステップと、
    前記第2ストリーム配信サーバが、前記通信情報と前記ミラーデータとに基づいて、前記第1ストリーム配信サーバと前記クライアント端末との間のネットワークにおける障害を検知するネットワーク障害検知ステップとを備える
    ことを特徴とする障害検知方法。
  8. 前記ネットワーク障害検知ステップは、
    前記第2ストリーム配信サーバが、前記ネットワークにおける障害を検知したときに、前記ミラーデータを記憶する記憶ステップを含む
    ことを特徴とする請求項7に記載の障害検知方法。
  9. 前記取得ステップは、
    前記第2ストリーム配信サーバが、前記第1ストリーム配信サーバにおける障害を検知するサーバ障害検知ステップと、
    前記第2ストリーム配信サーバが、前記第1ストリーム配信サーバにおける障害を検知したときに、前記クライアント端末に前記ストリームデータを送信するストリーム配信ステップと、
    前記第2ストリーム配信サーバが、前記クライアント端末に前記ストリームデータを送信するときに、前記サーバ障害検知ステップにおける前記第1ストリーム配信サーバによる障害の検知を停止する停止ステップとを含む
    ことを特徴とする請求項7に記載の障害検知方法。
  10. 前記通信情報は、前記クライアント端末との通信状態を示す通信状態情報を含む
    ことを特徴とする請求項7に記載の障害検知方法。
  11. 前記通信情報は、前記第1ストリーム配信サーバに送信された前記データの受信状態を示す受信情報を含み、
    前記ネットワーク障害検知ステップは、
    前記第2ストリーム配信サーバが、前記通信情報と前記ミラーデータとに基づいて、前記第1ストリーム配信サーバに送信される前記データの受信漏れを検知する受信漏れ検知ステップを含む
    ことを特徴とする請求項7に記載の障害検知方法。
  12. 前記ネットワーク障害検知ステップは、
    前記第2ストリーム配信サーバが、前記ネットワークにおける障害を検知したときに、前記ネットワークにおける障害を解析する解析ステップを含む
    ことを特徴とする請求項7に記載の障害検知方法。
JP2008115001A 2008-04-25 2008-04-25 ストリーム配信システム及び障害検知方法 Expired - Fee Related JP5075727B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008115001A JP5075727B2 (ja) 2008-04-25 2008-04-25 ストリーム配信システム及び障害検知方法
US12/140,650 US7836330B2 (en) 2008-04-25 2008-06-17 Stream distribution system and failure detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008115001A JP5075727B2 (ja) 2008-04-25 2008-04-25 ストリーム配信システム及び障害検知方法

Publications (2)

Publication Number Publication Date
JP2009265959A JP2009265959A (ja) 2009-11-12
JP5075727B2 true JP5075727B2 (ja) 2012-11-21

Family

ID=41216169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008115001A Expired - Fee Related JP5075727B2 (ja) 2008-04-25 2008-04-25 ストリーム配信システム及び障害検知方法

Country Status (2)

Country Link
US (1) US7836330B2 (ja)
JP (1) JP5075727B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140379894A1 (en) * 2013-06-21 2014-12-25 Microsoft Corporation Using different connectivity checks to determine causes of connectivity issues

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005089241A2 (en) 2004-03-13 2005-09-29 Cluster Resources, Inc. System and method for providing object triggers
US8782654B2 (en) 2004-03-13 2014-07-15 Adaptive Computing Enterprises, Inc. Co-allocating a reservation spanning different compute resources types
US20070266388A1 (en) 2004-06-18 2007-11-15 Cluster Resources, Inc. System and method for providing advanced reservations in a compute environment
US8176490B1 (en) 2004-08-20 2012-05-08 Adaptive Computing Enterprises, Inc. System and method of interfacing a workload manager and scheduler with an identity manager
US8271980B2 (en) 2004-11-08 2012-09-18 Adaptive Computing Enterprises, Inc. System and method of providing system jobs within a compute environment
US8863143B2 (en) 2006-03-16 2014-10-14 Adaptive Computing Enterprises, Inc. System and method for managing a hybrid compute environment
US8631130B2 (en) 2005-03-16 2014-01-14 Adaptive Computing Enterprises, Inc. Reserving resources in an on-demand compute environment from a local compute environment
US9231886B2 (en) 2005-03-16 2016-01-05 Adaptive Computing Enterprises, Inc. Simple integration of an on-demand compute environment
CA2603577A1 (en) 2005-04-07 2006-10-12 Cluster Resources, Inc. On-demand access to compute resources
US8041773B2 (en) 2007-09-24 2011-10-18 The Research Foundation Of State University Of New York Automatic clustering for self-organizing grids
US20100157964A1 (en) * 2008-12-18 2010-06-24 Pantech & Curitel Communications, Inc. Server to guide reconnection in mobile internet, method for guiding server reconnection, and server reconnection method
US9898714B2 (en) * 2009-01-26 2018-02-20 Google Technology Holdings LLC System and method for a direct social network
US8713060B2 (en) * 2009-03-31 2014-04-29 Amazon Technologies, Inc. Control service for relational data management
US8307003B1 (en) 2009-03-31 2012-11-06 Amazon Technologies, Inc. Self-service control environment
US8060792B2 (en) * 2009-03-31 2011-11-15 Amazon Technologies, Inc. Monitoring and automated recovery of data instances
US9705888B2 (en) 2009-03-31 2017-07-11 Amazon Technologies, Inc. Managing security groups for data instances
US9207984B2 (en) 2009-03-31 2015-12-08 Amazon Technologies, Inc. Monitoring and automatic scaling of data volumes
US8332365B2 (en) 2009-03-31 2012-12-11 Amazon Technologies, Inc. Cloning and recovery of data volumes
US8744509B2 (en) * 2009-04-08 2014-06-03 Qualcomm Incorporated Reducing time for call failure indication
US8958837B2 (en) * 2009-04-08 2015-02-17 Qualcomm Incorporated Reducing time for call failure indication
US8325601B2 (en) * 2009-05-08 2012-12-04 Canon Kabushiki Kaisha Reliable network streaming of a single data stream over multiple physical interfaces
US7987392B2 (en) * 2009-06-08 2011-07-26 Microsoft Corporation Differentiating connectivity issues from server failures
US8599863B2 (en) 2009-10-30 2013-12-03 Calxeda, Inc. System and method for using a multi-protocol fabric module across a distributed server interconnect fabric
US9876735B2 (en) 2009-10-30 2018-01-23 Iii Holdings 2, Llc Performance and power optimized computer system architectures and methods leveraging power optimized tree fabric interconnect
US9465771B2 (en) 2009-09-24 2016-10-11 Iii Holdings 2, Llc Server on a chip and node cards comprising one or more of same
US9054990B2 (en) 2009-10-30 2015-06-09 Iii Holdings 2, Llc System and method for data center security enhancements leveraging server SOCs or server fabrics
US20130107444A1 (en) 2011-10-28 2013-05-02 Calxeda, Inc. System and method for flexible storage and networking provisioning in large scalable processor installations
US20110103391A1 (en) 2009-10-30 2011-05-05 Smooth-Stone, Inc. C/O Barry Evans System and method for high-performance, low-power data center interconnect fabric
US9069929B2 (en) 2011-10-31 2015-06-30 Iii Holdings 2, Llc Arbitrating usage of serial port in node card of scalable and modular servers
US9077654B2 (en) 2009-10-30 2015-07-07 Iii Holdings 2, Llc System and method for data center security enhancements leveraging managed server SOCs
US9135283B2 (en) 2009-10-07 2015-09-15 Amazon Technologies, Inc. Self-service configuration for data environment
US8074107B2 (en) 2009-10-26 2011-12-06 Amazon Technologies, Inc. Failover and recovery for replicated data instances
US8335765B2 (en) 2009-10-26 2012-12-18 Amazon Technologies, Inc. Provisioning and managing replicated data instances
US8676753B2 (en) 2009-10-26 2014-03-18 Amazon Technologies, Inc. Monitoring of replicated data instances
US11720290B2 (en) 2009-10-30 2023-08-08 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US9648102B1 (en) 2012-12-27 2017-05-09 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US9311269B2 (en) 2009-10-30 2016-04-12 Iii Holdings 2, Llc Network proxy for high-performance, low-power data center interconnect fabric
US10877695B2 (en) 2009-10-30 2020-12-29 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US9680770B2 (en) 2009-10-30 2017-06-13 Iii Holdings 2, Llc System and method for using a multi-protocol fabric module across a distributed server interconnect fabric
JP5625938B2 (ja) * 2011-01-19 2014-11-19 沖電気工業株式会社 通信装置、通信システム及び通信プログラム
JP5928976B2 (ja) * 2011-11-10 2016-06-01 新日鉄住金ソリューションズ株式会社 生存監視システム
US9794379B2 (en) 2013-04-26 2017-10-17 Cisco Technology, Inc. High-efficiency service chaining with agentless service nodes
US10417025B2 (en) 2014-11-18 2019-09-17 Cisco Technology, Inc. System and method to chain distributed applications in a network environment
US9660909B2 (en) 2014-12-11 2017-05-23 Cisco Technology, Inc. Network service header metadata for load balancing
USRE48131E1 (en) 2014-12-11 2020-07-28 Cisco Technology, Inc. Metadata augmentation in a service function chain
JP6672925B2 (ja) * 2016-03-22 2020-03-25 富士ゼロックス株式会社 通信プログラム及び通信装置
US10187306B2 (en) 2016-03-24 2019-01-22 Cisco Technology, Inc. System and method for improved service chaining
US10931793B2 (en) 2016-04-26 2021-02-23 Cisco Technology, Inc. System and method for automated rendering of service chaining
US10456672B2 (en) 2016-05-19 2019-10-29 Google Llc Methods and systems for facilitating participation in a game session
US10419550B2 (en) 2016-07-06 2019-09-17 Cisco Technology, Inc. Automatic service function validation in a virtual network environment
US10320664B2 (en) 2016-07-21 2019-06-11 Cisco Technology, Inc. Cloud overlay for operations administration and management
US10218616B2 (en) 2016-07-21 2019-02-26 Cisco Technology, Inc. Link selection for communication with a service function cluster
US10225270B2 (en) 2016-08-02 2019-03-05 Cisco Technology, Inc. Steering of cloned traffic in a service function chain
US10218593B2 (en) 2016-08-23 2019-02-26 Cisco Technology, Inc. Identifying sources of packet drops in a service function chain environment
JP6839347B2 (ja) * 2016-11-02 2021-03-10 富士通株式会社 パケットキャプチャプログラム、パケットキャプチャ装置及びパケットキャプチャ方法
US10225187B2 (en) 2017-03-22 2019-03-05 Cisco Technology, Inc. System and method for providing a bit indexed service chain
US10333855B2 (en) 2017-04-19 2019-06-25 Cisco Technology, Inc. Latency reduction in service function paths
US10554689B2 (en) 2017-04-28 2020-02-04 Cisco Technology, Inc. Secure communication session resumption in a service function chain
US10735275B2 (en) 2017-06-16 2020-08-04 Cisco Technology, Inc. Releasing and retaining resources for use in a NFV environment
US10798187B2 (en) 2017-06-19 2020-10-06 Cisco Technology, Inc. Secure service chaining
US10397271B2 (en) 2017-07-11 2019-08-27 Cisco Technology, Inc. Distributed denial of service mitigation for web conferencing
US10673698B2 (en) 2017-07-21 2020-06-02 Cisco Technology, Inc. Service function chain optimization using live testing
US11063856B2 (en) 2017-08-24 2021-07-13 Cisco Technology, Inc. Virtual network function monitoring in a network function virtualization deployment
US10791065B2 (en) 2017-09-19 2020-09-29 Cisco Technology, Inc. Systems and methods for providing container attributes as part of OAM techniques
EP4336800A3 (en) 2017-10-10 2024-05-29 Google LLC Distributed sample-based game profiling with game metadata and metrics and gaming api platform supporting third-party content
US11018981B2 (en) 2017-10-13 2021-05-25 Cisco Technology, Inc. System and method for replication container performance and policy validation using real time network traffic
US10541893B2 (en) 2017-10-25 2020-01-21 Cisco Technology, Inc. System and method for obtaining micro-service telemetry data
US11140207B2 (en) 2017-12-21 2021-10-05 Google Llc Network impairment simulation framework for verification of real time interactive media streaming systems
EP3700640B1 (en) 2018-03-22 2021-05-26 Google LLC Methods and systems for rendering and encoding content for online interactive gaming sessions
US11077364B2 (en) 2018-04-02 2021-08-03 Google Llc Resolution-based scaling of real-time interactive graphics
KR102694451B1 (ko) 2018-04-02 2024-08-13 구글 엘엘씨 대화형 클라우드 게임용 방법, 디바이스 및 시스템
CN111886057B (zh) 2018-04-02 2024-09-20 谷歌有限责任公司 用于电子系统的输入装置
EP3701489B1 (en) 2018-04-10 2022-10-26 Google LLC Memory management in gaming rendering
US10666612B2 (en) 2018-06-06 2020-05-26 Cisco Technology, Inc. Service chains for inter-cloud traffic
EP3807766B1 (en) 2018-11-16 2021-10-27 Google LLC Shadow tracking of real-time interactive simulations for complex system analysis
US20220166660A1 (en) * 2020-11-23 2022-05-26 Capital One Services, Llc Identifying network issues in a cloud computing environment
CN113055225B (zh) * 2021-02-08 2023-12-05 网宿科技股份有限公司 网络故障分析数据的获取方法、终端及服务器

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09311843A (ja) * 1996-05-24 1997-12-02 Oki Electric Ind Co Ltd クライアントサーバ型通信方法及びクライアントサーバ型通信装置
US5987621A (en) * 1997-04-25 1999-11-16 Emc Corporation Hardware and software failover services for a file server
JP2001045023A (ja) * 1999-08-02 2001-02-16 Matsushita Electric Ind Co Ltd ビデオサーバシステム及びビデオデータ配信方法
JP2001346181A (ja) * 2000-06-01 2001-12-14 Matsushita Electric Ind Co Ltd データ記憶部共有装置およびプログラム記録媒体
JP2002152203A (ja) 2000-11-15 2002-05-24 Hitachi Information Systems Ltd クライアントマシンとクライアントソフトウェアおよびネットワーク監視方法
US6839865B2 (en) * 2000-12-29 2005-01-04 Road Runner System and method for multicast stream failover
US20040153709A1 (en) * 2002-07-03 2004-08-05 Burton-Krahn Noel Morgen Method and apparatus for providing transparent fault tolerance within an application server environment
US7159234B1 (en) * 2003-06-27 2007-01-02 Craig Murphy System and method for streaming media server single frame failover
US7721117B2 (en) * 2005-04-01 2010-05-18 Sherer W Paul Stream control failover utilizing an attribute-dependent protection mechanism
FR2885465B1 (fr) * 2005-05-04 2007-09-07 Gl Trade Sa Basculement de serveur dans les transmissions de donnees en temps reel
JP4516496B2 (ja) * 2005-07-27 2010-08-04 株式会社日立製作所 マルチキャスト配信方法及びシステム、コンテンツサーバ
EP2021964A4 (en) * 2006-05-12 2011-04-13 Acei Ab PLAY SYSTEM WITH FAILOVER AND TAKEOVER ABILITY
JP4687590B2 (ja) * 2006-07-07 2011-05-25 沖電気工業株式会社 情報配信システム及び障害判定方法
US8369212B2 (en) * 2006-08-29 2013-02-05 Hewlett-Packard Development Company, L.P. Network path validation based on user-specified criteria
US20080104266A1 (en) * 2006-10-25 2008-05-01 Eliezer Dekel Reliable messaging using message streams in a high speed, low latency data communications environment
US8219848B2 (en) * 2007-04-10 2012-07-10 International Business Machines Corporation Mechanism for recovery from site failure in a stream processing system
CN101690136A (zh) * 2007-06-26 2010-03-31 汤姆逊许可证公司 实时协议流迁移
US8892719B2 (en) * 2007-08-30 2014-11-18 Alpha Technical Corporation Method and apparatus for monitoring network servers

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140379894A1 (en) * 2013-06-21 2014-12-25 Microsoft Corporation Using different connectivity checks to determine causes of connectivity issues
US9544207B2 (en) * 2013-06-21 2017-01-10 Microsoft Technology Licensing, Llc Using different connectivity checks to determine causes of connectivity issues

Also Published As

Publication number Publication date
US20090271656A1 (en) 2009-10-29
US7836330B2 (en) 2010-11-16
JP2009265959A (ja) 2009-11-12

Similar Documents

Publication Publication Date Title
JP5075727B2 (ja) ストリーム配信システム及び障害検知方法
CN110808874B (zh) 一种跨机房服务监控方法、装置、存储介质及服务器
EP3281120B1 (en) Server side content delivery network quality of service
US9071655B2 (en) Managing access to digital content sources
US20110320870A1 (en) Collecting network-level packets into a data structure in response to an abnormal condition
US7743129B2 (en) Methods and arrangements to detect a failure in a communication network
US8948016B2 (en) Communication network monitoring
CN117176711A (zh) 用于监视服务的方法、设备和存储介质
US8122151B2 (en) Storage system for optimally controlling a plurality of data transfer paths and method therefor
EP2988498B1 (en) Ott video quality monitoring method, apparatus, and system
KR20040078559A (ko) 엔드-투-엔드 측정을 기초로 한 네트워크 상으로의 데이터스트림의 유입 제어
CN110830460B (zh) 一种连接建立方法、装置、电子设备及存储介质
JP2004280738A (ja) 代理応答装置
US20160119181A1 (en) Network state monitoring system
JP4687590B2 (ja) 情報配信システム及び障害判定方法
WO2013057773A1 (ja) プログラム、情報処理装置、および経路設定方法
KR102469441B1 (ko) 가상 게이트웨이 클러스터 전역 장애에 대한 모니터링 방법 및 장치
US7502863B2 (en) Method of distributing stream data and system thereof
CN110769268A (zh) 数据流监测方法及装置
WO2024087692A1 (zh) 设备管理方法、设备、系统和存储介质
US20060215525A1 (en) Communication apparatus and program provided with failure determining method and function
US20240056370A1 (en) Data transmission control method and apparatus, electronic device, and storage medium
WO2015194651A1 (ja) 障害通知装置、障害通知方法及びプログラム
EP4270183A1 (en) Public cloud tenant service management method and device
JP2001346181A (ja) データ記憶部共有装置およびプログラム記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120731

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120827

R150 Certificate of patent or registration of utility model

Ref document number: 5075727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees