JP4515262B2 - フォールトトレランススキームを動的に切換えるための方法 - Google Patents
フォールトトレランススキームを動的に切換えるための方法 Download PDFInfo
- Publication number
- JP4515262B2 JP4515262B2 JP2004536519A JP2004536519A JP4515262B2 JP 4515262 B2 JP4515262 B2 JP 4515262B2 JP 2004536519 A JP2004536519 A JP 2004536519A JP 2004536519 A JP2004536519 A JP 2004536519A JP 4515262 B2 JP4515262 B2 JP 4515262B2
- Authority
- JP
- Japan
- Prior art keywords
- fault tolerance
- time
- scheme
- average
- application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 29
- 230000006854 communication Effects 0.000 claims description 42
- 238000004891 communication Methods 0.000 claims description 41
- 230000007246 mechanism Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 description 43
- 238000012545 processing Methods 0.000 description 9
- 238000011084 recovery Methods 0.000 description 6
- 230000008447 perception Effects 0.000 description 5
- 230000002085 persistent effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
Description
W=C+S+FT・・・・・・・・(1)
ここで、
Wは、待ち時間であり、
Cは、通信に費やされる総使用時間であって、両方向C1,C2での通信時間の合計であり、
Sは、総サービス時間であって、演算に費やされる時間とデータI/O時間との合計であり、
FTは、フォールトトレランスに費やされる総使用時間であって、サーバ側での総フォールトトレランス時間FT2,FT3と、クライアント側での総フォールトトレランス時間FT1,FT4との合計である。
m(W)=m(C)+m(S)+m(FT)・・・・・・・・(2)
ここで、
m(W)は、待ち時間の平均であり、
m(C)は、通信に費やされる総使用時間の平均であり、
m(S)は、総サービス時間の平均であり、
m(FT)は、フォールトトレランスに費やされる総使用時間の平均である。
v(W)=v(C)+v(S)+v(FT)・・・・・・・・(3)
ここで、
v(W)は、待ち時間の分散であり、
v(C)は、通信に費やされる総使用時間の分散であり、
v(S)は、総サービス時間の分散であり、
v(FT)は、フォールトトレランスに費やされる総使用時間の分散である。
ブロック34において、平均待ち時間閾値(T(W))が超えられたことを切換えアルゴリズム30が判断すると、当該アルゴリズムは、ブロック36において、通信に費やされる時間(C)と、サービス時間(S)と、フォールトトレランスで費やされる時間(FT)と、の値を得る。当業者であれば分かるように、前述された待ち時間Wの測定と同様に、通信プロセスと、ユーザ要求の処理と、フォールトトレランス機構と、にそれぞれ関連する作業のためのタイムスタンプを使用して、パラメータC,S,FTが測定され得る。例えば、図1の分散システムのクライアント14およびサーバ16は、メッセージロギング動作の最初と最後のタイムスタンプを使用することにより、信頼性が高いメッセージングシステム18におけるフォールトトレランスで費やされる時間(FT)を計算することができる。
ブロック34において、平均待ち時間(m(W))が所定の待ち時間閾値(T(W))よりも短い場合、ブロック54において、切換えアルゴリズムは、現在のフォールトトレランススキームが与え得る信頼性よりも高い信頼性をユーザまたは分散アプリケーション24が必要としているか否かを判断する。
Claims (17)
- 分散システムで実行されるフォールトトレランス機構に関連付けられた複数のフォールトトレランススキームを動的に切換える方法において、
前記分散システムで生じるユーザインタフェースイベントの待ち時間であって、通信時間、サービス時間、フォールトトレランス時間を含む待ち時間を取得する工程と、
前記待ち時間の平均が所定の平均待ち時間閾値よりも大きいか否かを判断する工程と、
前記待ち時間の前記平均が前記所定の平均待ち時間閾値よりも大きい時に、前記通信時間、前記サービス時間、前記フォールトトレランス時間が互いに独立であるか否かを判断する工程と、
前記通信時間、前記サービス時間、前記フォールトトレランス時間が互いに独立である時に、前記複数のフォールトトレランススキームのうちの第1のフォールトトレランススキームから、前記複数のフォールトトレランススキームのうちの第2のフォールトトレランススキームへと切換える工程と、
を備えたことを特徴とする方法。 - 前記平均待ち時間閾値は、前記ユーザインタフェースイベントに関連付けられたアプリケーションによって設定される
ことを特徴とする請求項1に記載の方法。 - 前記アプリケーションは、前記アプリケーションに関連付けられたユーザインタフェースイベントのクラス毎に前記平均待ち時間閾値を定める
ことを特徴とする請求項2に記載の方法。 - 前記アプリケーションによって設定された前記平均待ち時間閾値は、前記アプリケーションのユーザによって変更され得る
ことを特徴とする請求項2に記載の方法。 - 前記平均待ち時間閾値は、前記ユーザインタフェースイベントに関連付けられたアプリケーションのユーザのプロファイルを使用して設定される
ことを特徴とする請求項1に記載の方法。 - 前記平均待ち時間閾値は、装置毎に、前記ユーザプロファイルを使用して設定される
ことを特徴とする請求項5に記載の方法。 - 前記通信時間、前記サービス時間、前記フォールトトレランス時間が互いに独立であるか否かを判断する前記工程は、前記ユーザインタフェースイベントに関連付けられたアプリケーションを実行する装置間で送られるメッセージの数が所定のメッセージ閾値を超えるか否かを判断する工程を含んでいる
ことを特徴とする請求項1に記載の方法。 - 前記複数のフォールトトレランススキームのうちの第1のフォールトトレランススキームから前記複数のフォールトトレランススキームのうちの第2のフォールトトレランススキームへ切換える前記工程は、前記ユーザインタフェースイベントに関連付けられたアプリケーションによって定められる待ち時間に関する値に基づいて前記第2のフォールトトレランススキームを選択する工程を更に含んでいる
ことを特徴とする請求項1に記載の方法。 - 前記複数のフォールトトレランススキームのうちの第1のフォールトトレランススキームから前記複数のフォールトトレランススキームのうちの第2のフォールトトレランススキームへ切換える前記工程は、前記第1および第2のフォールトトレランススキームのうちの少なくとも一方に関連付けられた実施コストに基づいて前記第2のフォールトトレランススキームを選択する工程を更に含んでいる
ことを特徴とする請求項1に記載の方法。 - 前記通信時間、前記サービス時間、前記フォールトトレランス時間が互いに独立でない時に前記第1のフォールトトレランススキームにおける実施コストを判断する工程と、
前記第1のフォールトトレランススキームが前記通信時間および前記サービス時間に対して十分な影響を与えているか否かを判断する工程と、
前記十分な影響が判断される時、前記第1のフォールトトレランススキームから、前記複数のフォールトトレランススキームのうちの第3のフォールトトレランススキームへと切換える工程と、
を更に備えたことを特徴とする請求項1に記載の方法。 - 前記十分な影響は、前記通信時間およびサービス時間に対する影響であって、前記平均待ち時間閾値を上回るように前記平均待ち時間を増大させる影響として規定される
ことを特徴とする請求項10に記載の方法。 - 前記待ち時間の前記平均が所定の平均待ち時間閾値よりも大きくない時に、前記ユーザインタフェースイベントに関連付けられたアプリケーションが更にレベルの高いフォールトトレランスを必要としているか否かを判断する工程と、
前記更にレベルの高いフォールトトレランスを有する少なくとも1つのフォールトトレランススキームが前記平均待ち時間閾値を満たすことができるか否かを判断する工程と、
前記第1のフォールトトレランススキームから、前記更にレベルの高いフォールトトレランスを有する前記少なくとも1つのフォールトトレランススキームのうちの選ばれた1つへと切換える工程と、
を更に備えたことを特徴とする請求項10に記載の方法。 - 前記ユーザインタフェースイベントに関連付けられたアプリケーションに対して、フォールトトレランススキームを切換える決定を知らせる工程
を更に備えたことを特徴とする請求項12に記載の方法。 - フォールトトレランス機構に関連付けられた複数のフォールトトレランススキームを動的に切換えることができるフォールトトレラント分散システムにおいて、
前記分散システムで生じるユーザインタフェースイベントの待ち時間であって、通信時間、サービス時間、フォールトトレランス時間を含む待ち時間を取得する手段と、
前記待ち時間の平均が所定の平均待ち時間閾値よりも大きいか否かを判断する手段と、
前記待ち時間の前記平均が前記所定の平均待ち時間閾値よりも大きい時に、前記通信時間、前記サービス時間、前記フォールトトレランス時間が互いに独立であるか否かを判断する手段と、
前記通信時間、前記サービス時間、前記フォールトトレランス時間が互いに独立である時に、前記複数のフォールトトレランススキームのうちの第1のフォールトトレランススキームから、前記複数のフォールトトレランススキームのうちの第2のフォールトトレランススキームへと切換える手段と、
を備えたことを特徴とするフォールトトレラント分散システム。 - 前記通信時間、前記サービス時間、前記フォールトトレランス時間が互いに独立でない時に前記第1のフォールトトレランススキームにおける実施コストを判断する手段と、
前記第1のフォールトトレランススキームが前記通信時間および前記サービス時間に対して十分な影響を与えているか否かを判断する手段と、
前記十分な影響が判断される時、前記第1のフォールトトレランススキームから、前記複数のフォールトトレランススキームのうちの第3のフォールトトレランススキームへと切換える手段と、
を更に備えたことを特徴とする請求項14に記載のシステム。 - 前記待ち時間の前記平均が所定の平均待ち時間閾値よりも大きくない時に、前記ユーザインタフェースイベントに関連付けられたアプリケーションが更にレベルの高いフォールトトレランスを必要としているか否かを判断する手段と、
前記更にレベルの高いフォールトトレランスを有する少なくとも1つのフォールトトレランススキームが前記平均待ち時間閾値を満たすことができるか否かを判断する手段と、
前記第1のフォールトトレランススキームから、前記更にレベルの高いフォールトトレランスを有する前記少なくとも1つのフォールトトレランススキームのうちの選ばれた1つへと切換える手段と、
を更に備えたことを特徴とする請求項15に記載のシステム。 - 前記ユーザインタフェースイベントに関連付けられたアプリケーションに対して、フォールトトレランススキームを切換える決定を知らせるための手段
を更に備えたことを特徴とする請求項16に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/243,083 US6745339B2 (en) | 2002-09-13 | 2002-09-13 | Method for dynamically switching fault tolerance schemes |
PCT/US2003/028591 WO2004025890A1 (en) | 2002-09-13 | 2003-09-10 | Method for dynamically switching fault tolerance schemes |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005539312A JP2005539312A (ja) | 2005-12-22 |
JP4515262B2 true JP4515262B2 (ja) | 2010-07-28 |
Family
ID=31991545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004536519A Expired - Lifetime JP4515262B2 (ja) | 2002-09-13 | 2003-09-10 | フォールトトレランススキームを動的に切換えるための方法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US6745339B2 (ja) |
JP (1) | JP4515262B2 (ja) |
AU (1) | AU2003272325A1 (ja) |
WO (1) | WO2004025890A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020118686A1 (en) * | 2001-02-26 | 2002-08-29 | Sudeep Gupta | Multi-homing proxy apparatus, and associated method, for digital communication network |
US6745339B2 (en) * | 2002-09-13 | 2004-06-01 | Docomo Communications Laboratories Usa, Inc. | Method for dynamically switching fault tolerance schemes |
US7702739B1 (en) * | 2002-10-01 | 2010-04-20 | Bao Tran | Efficient transactional messaging between loosely coupled client and server over multiple intermittent networks with policy based routing |
US7693952B2 (en) * | 2003-03-27 | 2010-04-06 | Microsoft Corporation | Availability and scalability in a messaging system in a manner transparent to the application |
ATE373913T1 (de) * | 2003-06-24 | 2007-10-15 | Research In Motion Ltd | Serialisierung von eine verteiltenapplikation einer router |
US7440553B2 (en) * | 2004-02-04 | 2008-10-21 | Samsung Electronics Co., Ltd. | Apparatus and method for checkpointing a half-call model in redundant call application nodes |
US7885182B2 (en) * | 2004-05-14 | 2011-02-08 | Arris Group, Inc. | Method for fast recovery from ring protection switches on DOCSIS networks |
GB2420639A (en) * | 2004-11-24 | 2006-05-31 | Hewlett Packard Development Co | Monitoring Copy on write (COW) faults to control zero-copy data transfer |
KR20120138546A (ko) * | 2011-06-15 | 2012-12-26 | 한국전자통신연구원 | 분산 네트워크에서 우선순위에 기반한 디스커버리를 수행하는 장치 및 방법과, 디스커버리 백오프 타임 결정 방법 |
US8949653B1 (en) * | 2012-08-03 | 2015-02-03 | Symantec Corporation | Evaluating high-availability configuration |
US10409353B2 (en) * | 2013-04-17 | 2019-09-10 | Qualcomm Incorporated | Dynamic clock voltage scaling (DCVS) based on application performance in a system-on-a-chip (SOC), and related methods and processor-based systems |
RU170236U1 (ru) * | 2016-09-19 | 2017-04-18 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Томский государственный университет систем управления и радиоэлектроники" (ТУСУР) | Резервированная многоканальная вычислительная система |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5280607A (en) * | 1991-06-28 | 1994-01-18 | International Business Machines Corporation | Method and apparatus for tolerating faults in mesh architectures |
US5367668A (en) * | 1993-02-26 | 1994-11-22 | Stratus Computer, Inc. | Method and apparatus for fault-detection |
US5828847A (en) * | 1996-04-19 | 1998-10-27 | Storage Technology Corporation | Dynamic server switching for maximum server availability and load balancing |
US5963540A (en) * | 1997-12-19 | 1999-10-05 | Holontech Corporation | Router pooling in a network flowswitch |
US6195680B1 (en) * | 1998-07-23 | 2001-02-27 | International Business Machines Corporation | Client-based dynamic switching of streaming servers for fault-tolerance and load balancing |
DE19835216B4 (de) * | 1998-08-05 | 2005-10-27 | Systemonic Ag | Prozessor und Verfahren zur parallelen Datenverarbeitung |
US6674713B1 (en) * | 1999-02-23 | 2004-01-06 | Cisco Technology, Inc. | Method and apparatus for providing continuous voice and call communications between a data network and a telephony network |
US6453468B1 (en) * | 1999-06-30 | 2002-09-17 | B-Hub, Inc. | Methods for improving reliability while upgrading software programs in a clustered computer system |
US6446218B1 (en) * | 1999-06-30 | 2002-09-03 | B-Hub, Inc. | Techniques for maintaining fault tolerance for software programs in a clustered computer system |
EP1232575B1 (en) * | 1999-11-29 | 2009-06-03 | Samsung Electronics Co., Ltd. | method for assigning a common packet channel in a cdma communication system |
US6745339B2 (en) * | 2002-09-13 | 2004-06-01 | Docomo Communications Laboratories Usa, Inc. | Method for dynamically switching fault tolerance schemes |
US20040111510A1 (en) * | 2002-12-06 | 2004-06-10 | Shahid Shoaib | Method of dynamically switching message logging schemes to improve system performance |
-
2002
- 2002-09-13 US US10/243,083 patent/US6745339B2/en not_active Expired - Lifetime
-
2003
- 2003-09-10 JP JP2004536519A patent/JP4515262B2/ja not_active Expired - Lifetime
- 2003-09-10 AU AU2003272325A patent/AU2003272325A1/en not_active Abandoned
- 2003-09-10 WO PCT/US2003/028591 patent/WO2004025890A1/en active Application Filing
-
2004
- 2004-04-01 US US10/817,112 patent/US7243263B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6745339B2 (en) | 2004-06-01 |
WO2004025890A1 (en) | 2004-03-25 |
US20040205373A1 (en) | 2004-10-14 |
AU2003272325A1 (en) | 2004-04-30 |
US7243263B2 (en) | 2007-07-10 |
US20040054942A1 (en) | 2004-03-18 |
JP2005539312A (ja) | 2005-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Castelli et al. | Proactive management of software aging | |
US8015281B2 (en) | Dynamic server flow control in a hybrid peer-to-peer network | |
US20020087612A1 (en) | System and method for reliability-based load balancing and dispatching using software rejuvenation | |
US7409436B2 (en) | Exactly once JMS communication | |
US6826601B2 (en) | Exactly one cache framework | |
US8099379B2 (en) | Performance evaluating apparatus, performance evaluating method, and program | |
JP4107676B2 (ja) | トランザクション引継ぎシステム | |
US6782408B1 (en) | Controlling a number of instances of an application running in a computing environment | |
JP4515262B2 (ja) | フォールトトレランススキームを動的に切換えるための方法 | |
Zhang et al. | Fault-tolerant grid services using primary-backup: feasibility and performance | |
CN114218012A (zh) | 用于在集群系统中备份和恢复数据的方法和系统 | |
US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
EP1762069B1 (en) | Method of selecting one server out of a server set | |
JP2004192647A (ja) | メッセージ記録手法の動的切り替え方法 | |
Chawathe et al. | System support for scalable and fault tolerant internet services | |
CN113766013A (zh) | 一种会话创建方法、装置、设备及存储介质 | |
JP4129473B2 (ja) | コンピュータクラスタにおけるデータ収集 | |
Maassen et al. | Middleware adaptation with the delphoi service | |
Dumitraş et al. | Architecting and implementing versatile dependability | |
Chen et al. | Dynamic replication scheduling for cloud datacenters based on workload statistics | |
Zhu et al. | A scheduling framework for web server clusters with intensive dynamic content processing | |
Das et al. | Modeling the coverage and effectiveness of fault-management architectures in layered distributed systems | |
Almhanna et al. | Utilizing Probability Distribution for Selecting Optimal and Minimal Replicas to Achieving Fault Tolerance in a Distributed System. | |
Han et al. | Scheduling proxy: enabling adaptive-grained scheduling for global computing system | |
Arapé et al. | On the Development of an Enhanced Least-Loaded Strategy for the CORBA Load Balancing and Monitoring Service. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20051114 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100511 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100512 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4515262 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140521 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |