CN108880882B - 一种基于健康检查改进机制的gslb处理方法 - Google Patents

一种基于健康检查改进机制的gslb处理方法 Download PDF

Info

Publication number
CN108880882B
CN108880882B CN201810617634.XA CN201810617634A CN108880882B CN 108880882 B CN108880882 B CN 108880882B CN 201810617634 A CN201810617634 A CN 201810617634A CN 108880882 B CN108880882 B CN 108880882B
Authority
CN
China
Prior art keywords
service
gslb
state
data center
reporting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810617634.XA
Other languages
English (en)
Other versions
CN108880882A (zh
Inventor
曾楠
娄征
俞俊
吴小志
张昕
许梦晗
山发军
牧军
石荣水
李虎
范江
孙镇
曹宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
NARI Group Corp
Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
NARI Group Corp
Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd, NARI Group Corp, Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201810617634.XA priority Critical patent/CN108880882B/zh
Publication of CN108880882A publication Critical patent/CN108880882A/zh
Application granted granted Critical
Publication of CN108880882B publication Critical patent/CN108880882B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0246Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开一种基于健康检查改进机制的GSLB处理方法,其中将VIP业务状态分为正常、部分正常、故障、禁用;服务池成员状态分为正常、故障、禁用,服务池状态体现为上报因子基数,GSLB端接受数据中心上报数据后对数据中心SLB进行确认,收到的业务VIP对应状态为和GSLB本地信息状态比较,并执行响应业务切换操作,从而解决多数据中心的业务切换慢问题。

Description

一种基于健康检查改进机制的GSLB处理方法
技术领域
本发明属于计算机网络技术领域,尤其涉及一种GSLB处理方法。
背景技术
在整个GSLB多数据中心解决方案中,目前基本所有的GSLB厂商解决方案都是基于GSLB设备上的主动健康检查结果来实时判断该数据中心的业务是否可用,这种模式下的弊端显而易见,由于健康检查是有周期的、即在多个周期返回失败则认为该数据中心SLB设备业务为无效,业务中断时间长、数据中心之间业务切换慢;另外一个重要的问题是GSLB的主动健康检查无法探测到数据中心所有真实业务的状态,包括:
1、数据中心SLB内网网络线路故障;
2、管理员业务切换时禁用正在使用数据中心SLB业务;
3、数据中心提供服务的服务器超过半数处于宕机状态;
4、其他情况下数据中心SLB设备可以立即感知到的业务失败的情况。
故,需要一种新的技术方案以解决上述问题,通过SLB主动上送模式,即本发明的被动工作模式实现解决以上问题。
发明内容
发明目的:解决多数据中心的业务切换慢问题,并将GSLB健康检查方式的主动模式修改为主动、被动同时工作模式:
1、主动模式为基于现有机制,新增GSLB设备主动向SLB设备周期性获取信息机制,称为主动模式;
2、被动模式为新增机制,SLB设备主动向GSLB设备上送故障信息内容,即上送健康因子。
技术方案:为达到上述目的,本发明可采用如下技术方案:
一种基于健康检查改进机制的GSLB处理方法,
数据中心SLB设备根据现有SLB设备VIP服务状态与服务池成员状态上报给GSLB设备,VIP服务与服务池成员成一对多的形式出现;
VIP服务状态分为正常、部分正常、故障、禁用;服务池成员状态分为正常、故障、禁用,服务池成员状态体现为上报因子基数,计算方式为:
上报因子M=(1-(服务池中成员总数-服务池成员状态的故障数-服务池成员状态的禁用数)/100)*100,取值范围为1到100,数越大代表该服务池健康状态越稳定;
当VIP服务状态或上报因子发生变更后直接上报给GSLB设备,上报参数为:VIP服务状态、服务池名称、服务池成员状态对应的上报因子;
基于现有GSLB设备协议,使用重传确认机制,如果上报参数传输失败,在一个周期会重传若干次,直到有确认消息,如果周期内全部失败,启用多周期传输上报;
GSLB设备接收数据中心上报数据后对数据中心SLB设备进行收到上报数据的确认,收到的VIP服务状态为x,将x和GSLB设备本地信息状态比较,并执行响应业务切换操作,切换操作包括:
(a)x=正常,GSLB设备保持原有客户端DNS响应方式,针对该数据中心的业务请求保持不变;
(b)x=部分正常,检查收到的该VIP服务对应上报因子,取其中最小的一个上报因子M值;
50≤M<100时GSLB设备将原有客户端请求速率s1修改为一半,即s1/2,此时GSLB设备针对客户端响应的DNS应答记录中,该数据中心的业务减少为原来的1/2;
0<M<50时GSLB设备将原有客户端请求速率s1修改为四分之一,即s1/4,此时GSLB设备针对客户端响应的DNS应答记录中,该数据中心的业务减少为原来的1/4;
M=0,则认为异常状态,GSLB设备将不再响应该数据中心SLB设备1的DNS请求。
进一步的,多周期传输上报方式为,设第一个周期传输为t1,时间间隔初始值为30s,以后每一周期失败后,时间间隔值乘以2,那么第二个周期t2的时间间隔=30*2=60s,第三个周期t3的时间间隔=60*2=120s。
进一步的,数据中心SLB设备还设置上报恢复机制,包括:
(1)VIP服务状态或上报因子发生变更;
(2)数据中心SLB设备系统初始化;
(3)收到GSLB设备的确认消息。
进一步的,GSLB设备还设置恢复机制,包括:
GSLB设备收到SLB设备上报该VIP服务状态变为正常;
GSLB设备主动健康检查更新该VIP服务状态为正常。
进一步的,GSLB设备还设置状态切换限制:即恢复机制时间大于GSLB设备主动健康检查两个周期的时间。
有益效果:本发明中通过VIP对应状态x和GSLB设备本地信息状态比较,并执行响应业务切换操作,以解决多数据中心的业务切换慢问题;将GSLB设备健康检查方式的主动模式修改为主动、被动同时工作模式。
附图说明
图1是本发明基于健康检查改进机制的GSLB处理方法的原理图。
具体实施方式
请结合图1所示,为本发明基于健康检查改进机制的GSLB处理方法的具体实施方式。
该处理方法的前提条件:
1GSLB设备已关联健康检查算法;
2多数据中心。
实现及原理说明:
数据中心SLB设备:
上报机制:设备根据现有SLB设备VIP服务状态与服务池成员状态上报给GSLB设备,VIP服务与服务池成员成一对多的形式出现。
催发条件:VIP服务状态变更时触发上报,状态为正常(normal)、部分正常(someup)、故障(down)、禁用(disable);服务池成员状态为正常(normal)、故障(down)、禁用(disable),服务池成员状态体现为上报因子基数,计算方式为:上报因子M=(1-(服务池中成员总数-服务池成员状态的故障数-服务池成员状态的禁用数)/100)*100,取值范围为1到100,数越大代表该服务池健康状态越稳定,当VIP服务状态或上报因子发生变更后不等待直接上报给GSLB设备,上报参数为:VIP服务状态、服务池名称及对应的上报因子M1、M2...;
上报方式:基于现有GSLB设备协议,使用重传确认机制,如果传输失败,在一个周期会重传三次,直到有确认消息,如果周期内全部失败,启用多周期传输上报,假设第一个周期传输为t1,时间间隔interval初始值为30s,以后每一周期失败后interval值乘以2,那么第二个周期t2的interval=30*2=60s,第三个周期t3的interval=60*2=120s。
上报恢复机制:
(1)VIP服务状态或上报因子发生变更;
(2)数据中心SLB设备系统初始化;
(3)收到GSLB设备的确认消息。
GSLB设备:
GSLB设备接受数据中心上报数据后对数据中心SLB设备进行收到上报数据的确认,假设收到的业务VIP为VIP1,状态status=x,将x和GSLB设备本地信息状态比较,并执行响应业务切换操作:
x=normal,GSLB设备保持原有客户端DNS响应方式,针对该数据中心的业务请求保持不变;
x=some up,检查收到的该VIP1服务对应上报因子,取其中最小的一个因子M值:
50≤M<100时GSLB设备将原有客户端请求速率s1修改为一半,即s1/2,此时GSLB设备针对客户端响应的DNS应答记录中,该数据中心的业务减少为原来的1/2;
0<M<50时GSLB设备将原有客户端请求速率s1修改为四分之一,即s1/4,此时GSLB设备针对客户端响应的DNS应答记录中,该数据中心的业务减少为原来的1/4;
M=0,则认为异常状态,GSLB设备将不再响应该数据中心SLB设备的DNS请求。
恢复机制:
GSLB设备收到SLB设备上报该VIP服务状态变为nomal;
GSLB设备主动健康检查更新该VIP服务状态为nomal;
状态切换限制机制:
恢复机制时间T大于GSLB设备主动健康检查两个周期的时间。
另外,本发明的具体实现方法和途径很多,以上所述仅是本发明的优选实施方式。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (5)

1.一种基于健康检查改进机制的GSLB处理方法,其特征在于:
数据中心SLB设备根据现有SLB设备VIP服务状态与服务池成员状态上报给GSLB设备,VIP服务与服务池成员成一对多的形式出现;
VIP服务状态分为正常、部分正常、故障、禁用;服务池成员状态分为正常、故障、禁用,服务池成员状态体现为上报因子基数,计算方式为:
上报因子M=(1-(服务池中成员总数-服务池成员状态的故障数-服务池成员状态的禁用数)/100)*100,取值范围为1到100,数越大代表该服务池健康状态越稳定;
当VIP服务状态或上报因子发生变更后直接上报给GSLB设备,上报参数为:VIP服务状态、服务池名称、服务池成员状态对应的上报因子;
基于现有GSLB设备协议,使用重传确认机制,如果上报参数传输失败,在一个周期会重传若干次,直到有确认消息,如果周期内全部失败,启用多周期传输上报;
GSLB设备接收数据中心上报数据后对数据中心SLB设备进行收到上报数据的确认,收到的VIP服务状态为x,将x和GSLB设备本地信息状态比较,并执行响应业务切换操作,切换操作包括:
(a)x=正常,GSLB设备保持原有客户端DNS响应方式,针对该数据中心的业务请求保持不变;
(b)x=部分正常,检查收到的该VIP服务对应上报因子,取其中最小的一个上报因子M值;
50≤M<100时GSLB设备将原有客户端请求速率s1修改为一半,即s1/2,此时GSLB设备针对客户端响应的DNS应答记录中,该数据中心的业务减少为原来的1/2;
0<M<50时GSLB设备将原有客户端请求速率s1修改为四分之一,即s1/4,此时GSLB设备针对客户端响应的DNS应答记录中,该数据中心的业务减少为原来的1/4;
M=0,则认为异常状态,GSLB设备将不再响应该数据中心SLB设备的DNS请求。
2.根据权利要求1所述的处理方法,其特征在于:多周期传输上报方式为,设第一个周期传输为t1,时间间隔初始值为30s,以后每一周期失败后,时间间隔值乘以2,那么第二个周期t2的时间间隔=30*2=60s,第三个周期t3的时间间隔=60*2=120s。
3.根据权利要求1所述的处理方法,其特征在于:数据中心SLB设备还设置上报恢复机制,包括:
(1)VIP服务状态或上报因子发生变更;
(2)数据中心SLB设备系统初始化;
(3)收到GSLB设备的确认消息。
4.根据权利要求1或2或3所述的处理方法,其特征在于:GSLB设备还设置恢复机制,包括:
GSLB设备收到SLB设备上报该VIP服务状态变为正常;
GSLB设备主动健康检查更新该VIP服务状态为正常。
5.根据权利要求4所述的处理方法,其特征在于:GSLB设备还设置状态切换限制,即恢复机制时间大于GSLB设备主动健康检查两个周期的时间。
CN201810617634.XA 2018-06-15 2018-06-15 一种基于健康检查改进机制的gslb处理方法 Active CN108880882B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810617634.XA CN108880882B (zh) 2018-06-15 2018-06-15 一种基于健康检查改进机制的gslb处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810617634.XA CN108880882B (zh) 2018-06-15 2018-06-15 一种基于健康检查改进机制的gslb处理方法

Publications (2)

Publication Number Publication Date
CN108880882A CN108880882A (zh) 2018-11-23
CN108880882B true CN108880882B (zh) 2021-07-16

Family

ID=64339372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810617634.XA Active CN108880882B (zh) 2018-06-15 2018-06-15 一种基于健康检查改进机制的gslb处理方法

Country Status (1)

Country Link
CN (1) CN108880882B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101146021A (zh) * 2006-09-11 2008-03-19 思华科技(上海)有限公司 内容分发网络的路由系统及方法
CN101682619A (zh) * 2007-03-12 2010-03-24 思杰系统有限公司 用于基于用户选择的规格进行负载平衡的系统和方法
WO2010068458A2 (en) * 2008-11-25 2010-06-17 Citrix Systems, Inc. Systems and methods for gslb remote service monitoring
CN102075593A (zh) * 2010-12-30 2011-05-25 北京世纪互联工程技术服务有限公司 一种sdns数据的生成方法及系统
CN102301677A (zh) * 2008-11-25 2011-12-28 思杰系统有限公司 用于全局服务器负载平衡站点持续的系统和方法
CN102891804A (zh) * 2012-10-16 2013-01-23 中兴通讯股份有限公司南京分公司 控制策略的调整方法及系统
CN103973788A (zh) * 2014-05-08 2014-08-06 浪潮电子信息产业股份有限公司 一种基于传输遍布式网络架构的负载均衡方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101431532A (zh) * 2008-12-15 2009-05-13 中国电信股份有限公司 一种内容路由方法、负载均衡设备和资源管理设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101146021A (zh) * 2006-09-11 2008-03-19 思华科技(上海)有限公司 内容分发网络的路由系统及方法
CN101682619A (zh) * 2007-03-12 2010-03-24 思杰系统有限公司 用于基于用户选择的规格进行负载平衡的系统和方法
WO2010068458A2 (en) * 2008-11-25 2010-06-17 Citrix Systems, Inc. Systems and methods for gslb remote service monitoring
CN102301677A (zh) * 2008-11-25 2011-12-28 思杰系统有限公司 用于全局服务器负载平衡站点持续的系统和方法
CN102075593A (zh) * 2010-12-30 2011-05-25 北京世纪互联工程技术服务有限公司 一种sdns数据的生成方法及系统
CN102891804A (zh) * 2012-10-16 2013-01-23 中兴通讯股份有限公司南京分公司 控制策略的调整方法及系统
CN103973788A (zh) * 2014-05-08 2014-08-06 浪潮电子信息产业股份有限公司 一种基于传输遍布式网络架构的负载均衡方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
业务双活数据中心网络设计要点探讨;林秀;《电子技术》;20160331;第60-63页 *

Also Published As

Publication number Publication date
CN108880882A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
JP7009560B2 (ja) プロセス制御システムに冗長性を提供するための方法および装置
CN104094577B (zh) 用于间接地评定活动实体的状态的方法和装置
EP1391079B1 (en) Method and system for implementing a fast recovery process in a local area network
US8018844B2 (en) Reliable message transfer over an unreliable network
US7719956B2 (en) Trunk network system for multipoint-to-multipoint relay
JP2011526086A (ja) 多重リンク障害からのネットワーク回復システム及び方法
CN109101196A (zh) 主节点切换方法、装置、电子设备及计算机存储介质
CN107508694B (zh) 一种集群内的节点管理方法及节点设备
TW201517568A (zh) 伺服器操作系統及其操作方法
US20130139178A1 (en) Cluster management system and method
CN105071968A (zh) 一种通信设备的业务面和控制面的隐性故障修复方法和装置
JP2020512780A (ja) アクセスノード・ゲートウェイ(an−gw)の非可用期間およびan−gwの復旧後のメッセージフラッド抑制のための方法、システム、およびコンピュータ可読媒体
CN107071189A (zh) 一种通讯设备物理接口的连接方法
EP2945314B1 (en) Distributed flow processing system fault tolerance method, nodes and system
CN108880882B (zh) 一种基于健康检查改进机制的gslb处理方法
JP5229007B2 (ja) 監視システム、ネットワーク機器、監視情報提供方法およびプログラム
CN101611378B (zh) 用于提供被动自动配置的方法和装置
CN109104319B (zh) 一种数据存储装置及方法
KR20110046897A (ko) 서브넷에서 마스터 노드를 선출하는 방법
US20120127992A1 (en) Registering an internet protocol phone in a dual-link architecture
Morgan et al. A survey of methods for improving computer network reliability and availability
CN113824595B (zh) 链路切换控制方法、装置和网关设备
JP3914072B2 (ja) ネットワーク障害監視方法、通信システムおよび回線切替装置
CN107342902B (zh) 一种四控服务器的链路重组方法及系统
KR100274848B1 (ko) 망관리 시스템에서의 망관리 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant