TWI568213B - 交談式遠端管理系統及其負載平衡控制方法 - Google Patents

交談式遠端管理系統及其負載平衡控制方法 Download PDF

Info

Publication number
TWI568213B
TWI568213B TW103112476A TW103112476A TWI568213B TW I568213 B TWI568213 B TW I568213B TW 103112476 A TW103112476 A TW 103112476A TW 103112476 A TW103112476 A TW 103112476A TW I568213 B TWI568213 B TW I568213B
Authority
TW
Taiwan
Prior art keywords
user
server
management system
remote management
servers
Prior art date
Application number
TW103112476A
Other languages
English (en)
Other versions
TW201540013A (zh
Inventor
黃國銘
李坤敏
吳金能
陳柄佑
黃慕凱
Original Assignee
財團法人工業技術研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人工業技術研究院 filed Critical 財團法人工業技術研究院
Priority to TW103112476A priority Critical patent/TWI568213B/zh
Priority to US14/303,088 priority patent/US9535775B2/en
Publication of TW201540013A publication Critical patent/TW201540013A/zh
Application granted granted Critical
Publication of TWI568213B publication Critical patent/TWI568213B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1012Server selection for load balancing based on compliance of requirements or conditions with available server resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Description

交談式遠端管理系統及其負載平衡控制方法
本揭露是有關於一種交談式遠端管理系統及其負載平衡控制方法。
隨著網路技術的發展,越來越多的用戶端需要透過交談式遠端管理系統來連線到用戶伺服器,以存取分享資料庫之大量資料。
然而,採用單一分享資料庫之架構容易造成網路瓶頸。並且突發性的斷線(crash)是目前負載平衡伺服器無法處理的情況。再者,系統為了負載平衡而需要經常進行遷移(migration)會產生銜接上的問題。
本揭露係有關於一種交談式遠端管理系統及其負載 平衡控制方法。
根據本揭露之第一方面,提出一種交談式遠端管理系統(session-based remote management system)之負載平衡控制方法。交談式遠端管理系統用以使數個用戶端(client)透過數個用戶伺服器(client server)連線至數個區域資料庫(local database)及一分享資料庫(shared database)。交談式遠端管理系統之負載平衡控制方法包括以下步驟。分析此些用戶端與此些用戶伺服器之運算能力。依據此些用戶端與此些用戶伺服器之運算能力,分配此些用戶端與此些用戶伺服器。動態預測此些用戶伺服器之一斷線機率(crash probability),以獲得一系統穩定值(health value)。
根據本揭露之第二方面,提出一種交談式遠端管理系統(session-based remote management system)。交談式遠端管理系統包括複數個用戶伺服器(client server)、一負載平衡伺服器(load balance server)、複數個區域資料庫(local database)、一分享資料庫(shared database)及一監控伺服器(monitor server)。負載平衡伺服器用以分析數個用戶端(client)與此些用戶伺服器之運算能力,並依據此些用戶端與此些用戶伺服器之運算能力,分配此些用戶端與此些用戶伺服器。此些區域資料庫分別連接於此些用戶伺服器。監控伺服器連接於此些用戶伺服器與分享資料庫。監控伺服器用以動態預測此些用戶伺服器之一斷線機率(crash probability),以獲得一系統穩定值(health value)。
為了對本揭露之上述及其他方面有更佳的瞭解,下 文特舉較佳實施例,並配合所附圖式,作詳細說明如下:
100‧‧‧交談式遠端管理系統
110‧‧‧負載平衡伺服器
111‧‧‧命令/請求監控器
112‧‧‧伺服器監控器
113‧‧‧效能評估器
114‧‧‧分配佈告欄記錄器
115‧‧‧負載平衡控制器
116‧‧‧遷移控制器
117‧‧‧分配器
118‧‧‧命令/請求傳輸埠
120‧‧‧用戶伺服器
130‧‧‧區域資料庫
140‧‧‧監控伺服器
141‧‧‧硬體效能監控器
142‧‧‧連線效能監控器
143‧‧‧正規化模組
144‧‧‧斷線監控器
145‧‧‧斷線預測模組
146‧‧‧斷線樣本記錄器
147‧‧‧評估模組
150‧‧‧分享資料庫
200‧‧‧用戶端
BA‧‧‧正規化演算法
BP‧‧‧正規化樣本
CA‧‧‧檢查演算法
CP‧‧‧斷線樣本
CPT‧‧‧斷線樣本表
DA‧‧‧預測演算法
EA‧‧‧評估演算法
P‧‧‧預估機率值
P11~P14、P21、P22、P31、P32、P41、P42、P11’~P14’、P21’、P22’、P31’、P32’、P41’、P42’‧‧‧狀態值
Q1~Q4、P1~P4、P1’~P4’‧‧‧運作狀態
R‧‧‧相關旗標
R2~R4‧‧‧旗標值
S410、S420、S430、S441、S442、S451、S452、S461、S462、S511、S512、S521、S531、S532、S540、S541、S542、S543、S544‧‧‧流程步驟
第1圖繪示交談式遠端管理系統(session-based remote management system)之示意圖。
第2圖繪示負載平衡伺服器(load balance server)之示意圖。
第3圖繪示監控伺服器(monitor server)之示意圖
第4圖繪示交談式遠端管理系統之負載平衡控制方法之流程圖。
第5圖繪示第4圖之步驟S430之示意圖。
第6圖繪示正規化樣本(blending pattern)之示意圖。
第7圖繪示斷線樣本(crash pattern)之比對情況。
請參照第1圖,其繪示交談式遠端管理系統(Session-based remote management System)100之示意圖。交談式遠端管理系統100包括一負載平衡伺服器(load balance server)110、複數個用戶伺服器(client server)120、複數個區域資料庫(local database)130、一監控伺服器(monitor server)140及一分享資料庫(shared database)150。負載平衡伺服器110連接於數個用戶端200,用以分配與管理用戶端200與用戶伺服器120之連線。因此,交談式遠端管理系統100用以使複數個用戶端200 透過複數個用戶伺服器120連線至複數個區域資料庫130及一分享資料庫150。在本實施例中,負載平衡伺服器110具有靜態優先權平衡配置機制,可以依據用戶端200與用戶伺服器120之運算能力,分配用戶端200與用戶伺服器120,使得用戶端200與用戶端伺服器120獲得良好的配置,以避免負載不平衡之瓶頸。
用戶伺服器120用以透過負載平衡伺服器110的分配,而與用戶端200連線。用戶伺服器120用以自區域資料庫130或分享資料庫150提供用戶端200所需之大量資料,或者供用戶端200進行大量運算程序。
區域資料庫130以一對一之方式分別連接於用戶伺服器120,而與分享資料庫150形成階層式資料庫架構。區域資料庫130用以分擔分享資料庫150的負載,以避免單一資料庫可能造成負載不平衡的瓶頸。
監控伺服器140連接於用戶伺服器120與分享資料庫150。監控伺服器140具有動態預測機制,可以對用戶伺服器120進行動態預測,以避免發生突發性斷線(crash)而造成無法處理的瓶頸。
此外,監控伺服器140更具有動態系統遷移與備份機制,可以在預測斷線將發生時,控制用戶伺服器120利用區域資料庫130或分享資料庫150進行用戶端200遷移與資料備份之動作,以避免系統進行遷移銜接的瓶頸。
分享資料庫150連接於監控伺服器140,而不是直 接連接於用戶伺服器120。分享資料庫150用以提供用戶端200所需的大量資料。
如上所述,交談式遠端管理系統100具備靜態優先權平衡配置機制、階層式資料庫架構、動態預測機制及動態系統遷移備份機制。靜態優先權平衡配置機制及階層式資料庫架構可以避免負載不平衡的瓶頸。動態預測機制可以避免發生突發性斷線而造成無法處理的瓶頸。動態系統遷移備份機制可以避免系統進行遷移銜接的瓶頸。
請參照第2圖,其繪示負載平衡伺服器110之示意圖。負載平衡伺服器110包括一命令/請求監控器(command/request monitor)111、一伺服器監控器(server monitor)112、一效能評估器(cost evaluator)113、一分配佈告欄記錄器(assignment bulletin)114、一負載平衡控制器(load balance controller)115、一遷移控制器(migrator)116、一分配器(dispatcher)117及一命令/請求傳輸埠(command/request transfer port)118。
命令/請求監控器111用以監控各命令/請求的回應時間及執行狀況。伺服器監控器112用以監控各用戶伺服器120之負載,包含處理器、記憶體、連接埠之執行狀況。效能評估器113用以評估用戶伺服器120之能力及各個命令/請求所屬之用戶端200的優先權。分配佈告欄記錄器114用以記錄各個用戶端200與用戶伺服器120之分配關係。負載平衡控制器115用以根據負 載平衡規則,動態決定各個用戶端200與用戶伺服器120之分配關係。遷移控制器116用以當交談式遠端管理系統100需進行遷移動作時,負責動態進行各用戶端200之遷移動作。分配器117用以進行各用戶端200分配至用戶伺服器120之作業。命令/請求傳輸埠118用以將各命令/請求送至各個用戶端200。
請參照第3圖,其繪示監控伺服器140之示意圖。監控伺服器140包括一硬體效能監控器(hardware performance monitor)141、一連線效能監控器(database performance monitor)142、一正規化模組(blending module)143、一斷線監控器(crash monitor)144、一斷線預測模組(crash prediction module)145、一斷線樣本記錄器(crash pattern recorder)146及一評估模組(evaluation module)147。
硬體效能監控器141用以監控各用戶伺服器120之處理器、記憶體等硬體之效能。連線效能監控器142用以監控各用戶伺服器120所連接之區域資料庫130的連線效能。正規化模組143用以將硬體效能監控器141及連線效能監控器142所收集之諸多監控資訊進行正規化,並產生合成資訊,例如,正規化樣本(blending pattern)。斷線監控器144用以監控各用戶伺服器120是否發生斷線,若有斷線事件發生,則負責將各資訊合成,並記錄在斷線樣本表(crash pattern table,CPT)中。斷線預測模組145依據正規化後之監控資訊,負責動態預測用戶端伺服器120之斷線機率。斷線樣本記錄器146用以記錄發生過斷線事件之合成資 訊。評估模組147用以評估與修正各斷線之預估機率值P。
請參照第4圖,其繪示交談式遠端管理系統100之負載平衡控制方法之流程圖。以下係透過流程圖詳細說明交談式遠端管理系統100如何透過上述靜態優先權平衡配置機制、階層式資料庫架構、動態預測機制及動態系統遷移備份機制進行負載平衡之控制。
在步驟S410中,負載平衡伺服器110之命令/請求監控器111及伺服器監控器112分析用戶端200與用戶伺服器120之運算能力。
在步驟S420中,負載平衡伺服器110之效能評估器113、分配佈告欄記錄器114及負載平衡控制器115依據用戶端200與用戶伺服器120之運算能力,分配用戶端200與用戶伺服器120。在此步驟中,負載平衡伺服器110透過下述方式進行靜態優先權平衡配置機制。例如,以先到先服務(First Come First Served,FCFS)排程演算法來進行靜態優先權平衡配置機制,但本實施例並不以此為限。首先,先期評估各用戶端200與用戶伺服器120之規格與運算能力。接著,將一定數量之用戶端200(例如是序號1~1000)依序分配給用戶伺服器120。當某個用戶端200反註冊,反註冊之用戶端200空出之餘額將由最後一個用戶端200補上,依此將可達到負載平衡。
在步驟S430中,監控伺服器140動態預測用戶伺服器120之一斷線機率(crash probability),以獲得一系統穩定值 (health value)。
在步驟S441中,監控伺服器140判斷系統穩定值是否高於一第一門檻值,若系統穩定值高於第一門檻值,則進入步驟S442;若系統穩定值不高於第一門檻值,則進入步驟S451。
在步驟S442中,負載平衡伺服器110僅備份各個用戶伺服器120之資料至對應之區域資料庫130。
在步驟S451中,監控伺服器140判斷系統穩定值是否介於第一門檻值及一第二門檻值之間。第一門檻值高於第二門檻值。若系統穩定值介於第一門檻值及第二門檻值之間,則進入步驟S452;若系統穩定值未介於第一門檻值及第二門檻值之間,則進入步驟S461。
在步驟S452中,負載平衡伺服器110同步備份各個用戶伺服器120之資料至對應之各個區域資料庫130及鄰近之各個區域資料庫130。
在步驟S461中,監控伺服器140判斷系統穩定度是否低於第二門檻值。若系統穩定度低於第二門檻值,則進入步驟S462;若系統穩定度不是否低於第二門檻值,則結束本流程。
在步驟S462中,負載平衡伺服器110備份用戶伺服器120之資料至分享資料庫150。
如上所述,步驟S410及步驟S420可以交談式遠端管理系統100在運作之初就能夠透過靜態優先權平衡配置機制及階層式資料庫架構,來避免負載不平衡的瓶頸。
步驟S430則可以在交談式遠端管理系統100運作過程中,夠過動態預測機制,來避免發生突發性斷線而造成無法處理的瓶頸。
步驟S441、S442、S451、S452、S461、S462則可以根據交談式遠端管理系統100之系統穩定度的預測結果,動態進行資料遷移備份。當交談式遠端管理系統100很穩定時,採取完全不額外備份之機制(例如,步驟S442)。當交談式遠端管理系統100穩定度參半時,採取只額外備份到鄰近區域資料庫130之機制(例如,步驟S452)。當交談式遠端管理系統100很不穩定時,採取全部額外備份到分享資料庫150之機制(例如,步驟S462)。
請參照第5圖,其繪示第4圖之步驟S430之示意圖的一實施例。步驟S430之動態預測機制係透過一種自我學習預測演算法(Self-Learning Predictor Algorithm,SLPA)來執行。
自我學習預測演算法包含下面四個主部份:步驟S511、S512之正規化演算法(Blending Algorithm)BA。步驟S521之檢查演算法(Checking Algorithm)CA。步驟S531、S532之預測演算法(Detecting Algorithm)DA。步驟S541~S544之評估演算法(Estimating Algorithm)EA。
請參照第6圖,其繪示正規化樣本(blending pattern)BP之示意圖。在步驟S511中,硬體效能監控器141及連線效能監控器142獲得用戶伺服器120之其中之一的數個運作狀態Q1、 Q2、Q3、Q4,例如分別是執行的軟體物件、處理器之負載、記憶體之負載、網路存取時間。在其他實施例中,運作狀態也可以是溫度及網路存取數量。
在步驟S512中,正規化模組143將此些運作狀態Q1、Q2、Q3、Q4合成正規化樣本BP。在此步驟中,運作狀態Q1、Q2、Q3、Q4的長度分別縮減為運作狀態P1、P2、P3、P4,以提高比對速度,並提高比對的成功機率。運作狀態P1具有4個狀態值P11、P12、P13、P14,運作狀態P2具有2個狀態值P21、P22,運作狀態P3具有2個狀態值P31、P32,運作狀態P4具有2個狀態值P41、P42。
接著,在步驟S521中,斷線預測模組145辯識正規化樣本BP是否近似於記錄於斷線樣本記錄器146之一斷線樣本(crash pattern)CP。請參照第7圖,其繪示斷線樣本CP之比對情況。斷線樣本CP係為用戶伺服器120實際發生斷線時的正規化樣本BP。用戶伺服器120實際發生多次斷線時,則在斷線樣本表CPT中記錄著多筆斷線樣本CP。每一筆斷線樣本CP記錄運作狀態P1’、P2’、P3’、P4’,運作狀態P1’具有4個狀態值P11’、P12’、P13’、P14’,運作狀態P2’具有2個狀態值P21’、P22’,運作狀態P3’具有2個狀態值P31’、P32’,運作狀態P4’具有2個狀態值P41’、P42’。
預估機率值P代表正規化樣本BP近似於此筆斷線樣本CP時,發生斷線的可能機率。相關旗標(relation flag)R 之旗標值R2、R3、R4分別記錄著運作狀態P2’、P3’、P4’與斷線之關連性。旗標值R2、R3、R4為1表示有關連,旗標值R2、R3、R4為0表示無關連。
在比對過程中,首先比對正規化樣本BP之運作狀態P1是否相似於一筆斷線樣本CP之運作狀態P1’。在本實施例中,係先比對狀態值P11是否相同於狀態值P11’,如果相同,則給予一高的初始分數;反之,則給予低的初始分數。接著,繼續比對狀態值P12是否相同於狀態值P12’,如果相同,則將分數往上累加;反之,則再比對狀態值P13是否相同於狀態值P12’。依此類推,直到所有狀態值P11、P12、P13、P14均與運作狀態P1’比對完畢。若累計分數大於一個門檻值,則表示正規化樣本BP之運作狀態P1與這一筆斷線樣本CP之運作狀態P1’相似。
若正規化樣本BP之運作狀態P1相似於某個斷線樣本CP之運作狀態P1’,則進一步以加權曼哈頓距離(weighted manhattan distance)來進行比對正規化樣本BP之運作狀態P2、P3、P4是否相似於此斷線樣本CP之運作狀態P2’、P3’、P4’。舉例來說,加權曼哈頓距離d係以下式(1)進行計算:
其中,i,j為整數值。
加權曼哈頓距離d小於一臨界值時,則代表此正規化樣本BP近似於此斷線樣本CP。
在交談式遠端管理系統100運作過程中,會持續產生正規化樣本BP,每一個正規化樣本BP都透過上述步驟進行比對,直到找到發現某一個正規化樣本BP近似於斷線樣本表CPT中之某一個斷線樣本CP時,表示交談式遠端管理系統100可能即將發生斷線。
在步驟S531中,預測交談式遠端管理系統100是否即將發生斷線。即若正規化樣本BP近似於斷線樣本CP時,則依據近似之斷線樣本CP之預估機率值P給予用戶伺服器120之斷線機率。並於此步驟中,產生一個介於0~1之間的亂數。若亂數小於或等於此斷線機率,則預測交談式遠端管理系統100即將發生斷線,並於步驟S540進行備份之動作。若亂數大於此斷線機率,則預測交談式遠端管理系統100不會發生斷線,並進入步驟S532。
在步驟S532中,斷線監控器144監控用戶伺服器120之斷線的發生,以得知預測之正確性?若預測正確,則進入步驟S541;若預測不正確,則進入步驟S542。
在步驟S541中,評估模組147將此斷線樣本CP之預估機率值P提高。在步驟S542中,評估模組147將此斷線樣本CP之預估機率值P降低。
接著,在步驟S541及步驟S542之後皆會進入步驟S543。在步驟S543中,評估模組147更新斷線樣本表CPT,例如斷線樣本CP之預估機率值P過低,則從斷線樣本表CPT刪除該 斷線樣本CP。然後,在步驟S544中,更新相關旗標R。舉例來說,比較兩次斷線的情況,若兩次的運作狀態P2’差異過大,則表示斷線與運作狀態P2’無關,則將旗標值R2改設為0;若兩次的運作狀態P3’差異過大,則表示斷線與運作狀態P3’無關,則將旗標值R3改設為0;若兩次的運作狀態P4’差異過大,則表示斷線與運作狀態P4’無關,則將旗標值R4改設為0。
透過上述學習的步驟,即可不斷修正斷線樣本表CPT之內容,使得斷線預測的成功率增加。
綜上所述,雖然本揭露已以較佳實施例揭露如上,然其並非用以限定本揭露。本揭露所屬技術領域中具有通常知識者,在不脫離本揭露之精神和範圍內,當可作各種之更動與潤飾。因此,本揭露之保護範圍當視後附之申請專利範圍所界定者為準。
100‧‧‧交談式遠端管理系統
110‧‧‧負載平衡伺服器
120‧‧‧用戶伺服器
130‧‧‧區域資料庫
140‧‧‧監控伺服器
150‧‧‧分享資料庫
200‧‧‧用戶端

Claims (15)

  1. 一種交談式遠端管理系統(session-based remote management system)之負載平衡控制方法,該交談式遠端管理系統用以使複數個用戶端(client)透過複數個用戶伺服器(client server)連線至複數個區域資料庫(local database)及一分享資料庫(shared database),該交談式遠端管理系統之負載平衡控制方法包括:分析該些用戶端與該些用戶伺服器之運算能力;依據該些用戶端與該些用戶伺服器之運算能力,分配該些用戶端與該些用戶伺服器;動態預測該些用戶伺服器之一斷線機率(crash probability),以獲得一系統穩定值(health value):以及若該系統穩定值高於一第一門檻值,則僅備份各該用戶伺服器之資料至對應之各該區域資料庫。
  2. 如申請專利範圍第1項所述之交談式遠端管理系統之負載平衡控制方法,更包括:若該系統穩定值介於該第一門檻值及一第二門檻值之間,則同步備份各該用戶伺服器之資料至對應之各該區域資料庫及鄰近之各該區域資料庫,其中該第一門檻值高於該第二門檻值。
  3. 如申請專利範圍第2項所述之交談式遠端管理系統之負載平衡控制方法,更包括:若該系統穩定度低於該第二門檻值,則備份該些用戶伺服器 之資料至該分享資料庫。
  4. 如申請專利範圍第1項所述之交談式遠端管理系統之負載平衡控制方法,其中動態預估該些用戶伺服器之該斷線機率,以獲得該系統穩定值之步驟包括:將該些用戶伺服器之其中之一的複數個運作狀態合成一正規化樣本(blending pattern);辯識該正規化樣本是否近似於一斷線樣本(crash pattern);以及若該正規化樣本近似於該斷線樣本,則依據該斷線樣本之一預估機率值給予該斷線機率。
  5. 如申請專利範圍第4項所述之交談式遠端管理系統之負載平衡控制方法,其中動態預估該些用戶伺服器之該斷線機率,以獲得該系統穩定值之步驟更包括:依據預測之正確性,修正該預估機率值。
  6. 如申請專利範圍第4項所述之交談式遠端管理系統之負載平衡控制方法,其中該些運作狀態包括執行的軟體物件、處理器之負載、記憶體之負載、網路存取時間、溫度及網路存取數量。
  7. 如申請專利範圍第1項所述之交談式遠端管理系統之負載平衡控制方法,其中該些用戶伺服器以一對一之方式連接於該些區域資料庫。
  8. 一種交談式遠端管理系統(Session-based Remote Management System),包括: 複數個用戶伺服器(client server);一負載平衡伺服器(load balance server),用以分析複數個用戶端(client)與該些用戶伺服器之運算能力,並依據該些用戶端與該些用戶伺服器之運算能力,分配該些用戶端與該些用戶伺服器;複數個區域資料庫(local database),分別連接於該些用戶伺服器;一分享資料庫(shared database);以及一監控伺服器(monitor server),連接於該些用戶伺服器與該分享資料庫,該監控伺服器用以動態預測該些用戶伺服器之一斷線機率(crash probability),以獲得一系統穩定值(health value),其中若該系統穩定值高於一第一門檻值,則該負載平衡伺服器僅備份各該用戶伺服器之資料至對應之各該區域資料庫。
  9. 如申請專利範圍第8項所述之交談式遠端管理系統,其中若該系統穩定值介於該第一門檻值及一第二門檻值之間,則該負載平衡伺服器同步備份各該用戶伺服器之資料至對應之各該區域資料庫及鄰近之各該區域資料庫,該第一門檻值高於該第二門檻值。
  10. 如申請專利範圍第9項所述之交談式遠端管理系統,其中若該系統穩定度低於該第二門檻值,則該負載平衡伺服器備份該些用戶伺服器之資料至該分享資料庫。
  11. 如申請專利範圍第8項所述之交談式遠端管理系統,其 中該監控伺服器更包括:一硬體效能監控器(hardware performance monitor),連接於該些用戶伺服器;一連線效能監控器(database performance monitor),連接於該些區域資料庫,該硬體效能監控器及該連線效能監控器用以獲得該些用戶伺服器之其中之一的複數個運作狀態;一正規化模組(blending module),用以將該些運作狀態合成一正規化樣本(blending pattern);一斷線樣本記錄器(crash pattern recorder),用以紀錄至少一斷線樣本(crash pattern);以及一斷線預測模組(crash prediction module),用以辯識該正規化樣本是否近似於該斷線樣本,若該正規化樣本近似於該斷線樣本,則依據該斷線樣本之一預估機率值給予該斷線機率。
  12. 如申請專利範圍第11項所述之交談式遠端管理系統,其中監控伺服器更包括:一斷線監控器(crash monitor),用以監控該些用戶伺服器之斷線的發生,以得知預測之正確性;以及一評估模組(evaluation module),用以依據預測之正確性,修正該預估機率值。
  13. 如申請專利範圍第11項所述之交談式遠端管理系統,其中該些運作狀態包括執行的軟體物件、處理器之負載、記憶體之負載、網路存取時間、溫度及網路存取數量。
  14. 如申請專利範圍第8項所述之交談式遠端管理系統,其中該些用戶伺服器以一對一之方式連接於該些區域資料庫。
  15. 如申請專利範圍第8項所述之交談式遠端管理系統,其中該負載平衡伺服器包括:一命令/請求監控器(command/request monitor);一伺服器監控器(server monitor),該命令/請求監控器及該伺服器監控器用以分析該些用戶端與該些用戶伺服器之運算能力;一效能評估器(cost evaluator);一分配佈告欄記錄器(assignment bulletin);一負載平衡控制器(load balance controller),該效能評估器、該分配佈告欄記錄器及該負載平衡控制器依據該些用戶端與該些用戶伺服器之運算能力,分配該些用戶端與該些用戶伺服器;一遷移控制器(migrator),用以當該交談式遠端管理系統需進行遷移動作時,負責動態進行各該用戶端之遷移動作;一分配器(dispatcher),用以進行該些用戶端分配至該些用戶伺服器之作業;以及一命令/請求傳輸埠(command/request transfer port),用以將複數個命令/請求送至該些用戶端。
TW103112476A 2014-04-03 2014-04-03 交談式遠端管理系統及其負載平衡控制方法 TWI568213B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW103112476A TWI568213B (zh) 2014-04-03 2014-04-03 交談式遠端管理系統及其負載平衡控制方法
US14/303,088 US9535775B2 (en) 2014-04-03 2014-06-12 Session-based remote management system and load balance controlling method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW103112476A TWI568213B (zh) 2014-04-03 2014-04-03 交談式遠端管理系統及其負載平衡控制方法

Publications (2)

Publication Number Publication Date
TW201540013A TW201540013A (zh) 2015-10-16
TWI568213B true TWI568213B (zh) 2017-01-21

Family

ID=54209835

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103112476A TWI568213B (zh) 2014-04-03 2014-04-03 交談式遠端管理系統及其負載平衡控制方法

Country Status (2)

Country Link
US (1) US9535775B2 (zh)
TW (1) TWI568213B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI770038B (zh) * 2017-07-06 2022-07-11 中華電信股份有限公司 伺服器之遠端管理系統及其遠端管理方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10069753B2 (en) * 2014-03-17 2018-09-04 Cloud Physics, Inc. Relationship-based resource-contention analysis system and method
US9672116B1 (en) * 2014-07-08 2017-06-06 EMC IP Holding Company LLC Backup using instinctive preferred server order list (PSOL)
US10505818B1 (en) * 2015-05-05 2019-12-10 F5 Networks. Inc. Methods for analyzing and load balancing based on server health and devices thereof
US9996432B2 (en) * 2016-02-03 2018-06-12 International Business Machines Corporation Automated local database connection affinity and failover
US10338990B2 (en) 2016-06-23 2019-07-02 Vmware, Inc. Culprit module detection and signature back trace generation
US10268563B2 (en) * 2016-06-23 2019-04-23 Vmware, Inc. Monitoring of an automated end-to-end crash analysis system
US10331508B2 (en) * 2016-06-23 2019-06-25 Vmware, Inc. Computer crash risk assessment
US10365959B2 (en) 2016-06-23 2019-07-30 Vmware, Inc. Graphical user interface for software crash analysis data
US10191837B2 (en) 2016-06-23 2019-01-29 Vmware, Inc. Automated end-to-end analysis of customer service requests
US10469394B1 (en) 2016-08-01 2019-11-05 F5 Networks, Inc. Methods for configuring adaptive rate limit based on server data and devices thereof
US10310932B2 (en) * 2017-01-13 2019-06-04 Bank Of America Corporation Using a concentration risk of a computing resource to define affinity and anti-affinity workloads
US10635334B1 (en) 2017-09-28 2020-04-28 EMC IP Holding Company LLC Rule based data transfer model to cloud
US10942779B1 (en) 2017-10-27 2021-03-09 EMC IP Holding Company LLC Method and system for compliance map engine
US10754368B1 (en) 2017-10-27 2020-08-25 EMC IP Holding Company LLC Method and system for load balancing backup resources
US10834189B1 (en) 2018-01-10 2020-11-10 EMC IP Holding Company LLC System and method for managing workload in a pooled environment
US10509587B2 (en) 2018-04-24 2019-12-17 EMC IP Holding Company LLC System and method for high priority backup
US10769030B2 (en) 2018-04-25 2020-09-08 EMC IP Holding Company LLC System and method for improved cache performance
US12045473B2 (en) * 2022-06-14 2024-07-23 Western Digital Technologies, Inc. Data storage device and method for prediction-based improved power-loss handling
CN115623010A (zh) * 2022-10-19 2023-01-17 南京航空航天大学 基于sdn和haco-csa的服务器集群负载均衡方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030177160A1 (en) * 2002-03-14 2003-09-18 Internationl Business Machines Corporation Predictive system for self-managed e-business infrastructures
US8521571B1 (en) * 2008-05-07 2013-08-27 Salesforce.Com, Inc. System, method and computer program product for managing business hours in an on-demand service

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7716077B1 (en) 1999-11-22 2010-05-11 Accenture Global Services Gmbh Scheduling and planning maintenance and service in a network-based supply chain environment
US7499453B2 (en) 2000-05-19 2009-03-03 Cisco Technology, Inc. Apparatus and methods for incorporating bandwidth forecasting and dynamic bandwidth allocation into a broadband communication system
US20020087612A1 (en) * 2000-12-28 2002-07-04 Harper Richard Edwin System and method for reliability-based load balancing and dispatching using software rejuvenation
US7240117B2 (en) * 2001-04-04 2007-07-03 Hall Aluminum Llc Method and apparatus for preventing overload using scaled recovery
US7086061B1 (en) * 2002-08-01 2006-08-01 Foundry Networks, Inc. Statistical tracking of global server load balancing for selecting the best network address from ordered list of network addresses based on a set of performance metrics
US20050033809A1 (en) * 2003-08-08 2005-02-10 Teamon Systems, Inc. Communications system providing server load balancing based upon weighted health metrics and related methods
WO2007028128A2 (en) 2005-09-01 2007-03-08 Vishal Dhawan Voice application network platform
US8130793B2 (en) 2006-08-22 2012-03-06 Embarq Holdings Company, Llc System and method for enabling reciprocal billing for different types of communications over a packet network
US8125897B2 (en) 2006-08-22 2012-02-28 Embarq Holdings Company Lp System and method for monitoring and optimizing network performance with user datagram protocol network performance information packets
US8064391B2 (en) 2006-08-22 2011-11-22 Embarq Holdings Company, Llc System and method for monitoring and optimizing network performance to a wireless device
US20090112809A1 (en) * 2007-10-24 2009-04-30 Caterpillar Inc. Systems and methods for monitoring health of computing systems
US8555292B2 (en) 2008-06-27 2013-10-08 Microsoft Corporation Synchronizing communication over shared memory
TWI400655B (zh) 2008-12-25 2013-07-01 Ind Tech Res Inst 動態評分負載平衡裝置與方法
KR101028956B1 (ko) 2009-07-31 2011-04-12 포항공과대학교 산학협력단 모바일 iptv 서비스를 제공하는 방법 및 이를 위한 시스템
JP5557590B2 (ja) 2010-05-06 2014-07-23 株式会社日立製作所 負荷分散装置及びシステム
US8289856B2 (en) 2010-07-28 2012-10-16 At&T Intellectual Property I, L.P. Alarm threshold for BGP flapping detection
US8732534B2 (en) * 2010-09-17 2014-05-20 Oracle International Corporation Predictive incident management
US8874747B2 (en) * 2010-12-27 2014-10-28 Nokia Corporation Method and apparatus for load balancing in multi-level distributed computations
TWI414161B (zh) 2011-01-28 2013-11-01 Univ Nat Chiao Tung 負載分配方法
US20120233313A1 (en) 2011-03-11 2012-09-13 Hironobu Fukami Shared scaling server system
CN102571782B (zh) 2011-12-29 2014-10-01 浙江大学 一种新型负载平衡服务器集群系统
US8539080B1 (en) * 2012-12-18 2013-09-17 Microsoft Corporation Application intelligent request management based on server health and client information
US9692820B2 (en) * 2013-04-06 2017-06-27 Citrix Systems, Inc. Systems and methods for cluster parameter limit

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030177160A1 (en) * 2002-03-14 2003-09-18 Internationl Business Machines Corporation Predictive system for self-managed e-business infrastructures
US8521571B1 (en) * 2008-05-07 2013-08-27 Salesforce.Com, Inc. System, method and computer program product for managing business hours in an on-demand service

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI770038B (zh) * 2017-07-06 2022-07-11 中華電信股份有限公司 伺服器之遠端管理系統及其遠端管理方法

Also Published As

Publication number Publication date
US9535775B2 (en) 2017-01-03
TW201540013A (zh) 2015-10-16
US20150286519A1 (en) 2015-10-08

Similar Documents

Publication Publication Date Title
TWI568213B (zh) 交談式遠端管理系統及其負載平衡控制方法
JP6072072B2 (ja) クラウドシステム管理装置、クラウドシステム、再配置方法、及びプログラム
US8185905B2 (en) Resource allocation in computing systems according to permissible flexibilities in the recommended resource requirements
JP4744171B2 (ja) 計算機システム及び記憶制御方法
CN105556499B (zh) 智能自动缩放
EP3798930A2 (en) Machine learning training resource management
US20210011830A1 (en) Predictive storage management system
US10599352B2 (en) Online flash resource allocation manager based on a TCO model
KR20120102664A (ko) 미래 사용 추정에 기반한 저장 메모리 할당
CN112650576A (zh) 资源调度方法、装置、设备、存储介质及计算机程序产品
JP6200080B2 (ja) 複数のコンピューティングシステムへのクライアントアクセスの管理
CN107463593A (zh) 库存扣减方法及其设备
US10754368B1 (en) Method and system for load balancing backup resources
CN103412519A (zh) 远端周边的控制系统、方法及其远端服务器
CN112685157B (zh) 任务处理方法、装置、计算机设备及存储介质
KR101152315B1 (ko) 네트워크 감시 카메라용 서버 가상화 방법
CN115794366A (zh) 一种内存预取方法及装置
WO2017017774A1 (ja) ストレージ監視システムおよびその監視方法
CN110275772B (zh) 一种数据处理方法及其相关设备
CN114546705B (zh) 操作响应方法、操作响应装置、电子设备以及存储介质
US9270530B1 (en) Managing imaging of multiple computing devices
KR20220055661A (ko) 엣지 서비스 제어 처리 시스템 및 그 제어방법
US20230362103A1 (en) Reducing placement conflicts between concurrent virtual machine allocations
US20240086203A1 (en) Sizing service for cloud migration to physical machine
US20210232950A1 (en) Information processing system and method for controlling information processing system