CN107634863A - 用于域名解析容灾服务的分布式监控装置及方法 - Google Patents

用于域名解析容灾服务的分布式监控装置及方法 Download PDF

Info

Publication number
CN107634863A
CN107634863A CN201711007714.5A CN201711007714A CN107634863A CN 107634863 A CN107634863 A CN 107634863A CN 201711007714 A CN201711007714 A CN 201711007714A CN 107634863 A CN107634863 A CN 107634863A
Authority
CN
China
Prior art keywords
monitoring
distributed
distributed monitoring
server
disaster tolerance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711007714.5A
Other languages
English (en)
Inventor
高庆
刘泽群
董朋飞
蔡炳森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hundred Enlightenment Technology Co Ltd
Original Assignee
Beijing Hundred Enlightenment Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hundred Enlightenment Technology Co Ltd filed Critical Beijing Hundred Enlightenment Technology Co Ltd
Priority to CN201711007714.5A priority Critical patent/CN107634863A/zh
Publication of CN107634863A publication Critical patent/CN107634863A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开提供了一种用于域名解析容灾服务的分布式监控装置及方法,括:n个监控服务器,n>=2,每个监控服务器作为一个分布式监控节点,所述监控服务器可以根据业务使用需求按照地理位置属性和/或运营商网络接入服务特性分组,用于监测其所在分组的网站服务可用性情况;以及分布式监控管理中心。作为一种主要用于域名解析容灾切换服务中的分布式监控技术,本发明所实现的技术系统除了包括分布式监控节点管理模块和监控信息数据分析引擎,修改DNS域名解析记录相关的功能模块,以及因需要及时通知到运维或运营人员而部署的预警通知模块。

Description

用于域名解析容灾服务的分布式监控装置及方法
技术领域
本公开涉及域名解析容灾领域,尤其涉及一种用于域名解析容灾服务的分布式监控装置及方法。
背景技术
互联网上的大部分应用都是通过域名对外提供服务的,对于一个大型的互联网服务来说,会有地理位置上来自全国各地,乃至于世界各地的访问请求。地理位置上不同的客户,在接入互联网网络时可能会使用到各种类型的运营商线路,例如电信网络、移动网络、联通网络、教育网、铁通、长城宽带等等,以及以上互联网运营商的南北区域网络。此时如果运营的一个大规模互联网网站服务收到某地的客户投诉称网站服务不可用,则可能存在多种可能的故障原因,有可能是某数据中心的服务器发生系统当机,也可能是客户侧的互联网网络接入故障,还有可能是受到不同的电信运营商之间的跨网通信网络波动影响,甚至于是同一个电信运营商的南方网络和北方网络之间的通信故障,并且需要根据上述原因选择是否立即执行修改DNS域名解析记录的应急预算。因此确定以上多种可能性中的哪一类原因是导致的客户访问故障的原因,以及相应的处理方式成为亟待解决的问题。
现有技术大多停留在系统可用性监控,网络可用性监控层面,很少同时考虑多网并存的条件下,网络接入、网络跨接对网站服务的影响,因为不能提供全面的网站服务是否可用、多大程度上的可用以及哪些部分出现不可用的监测数据,也就不能基于这些数据进行决策是否可以采取修改域名解析记录的容灾处理措施。
公开内容
(一)要解决的技术问题
本公开提供了一种用于域名解析容灾服务的分布式监控装置及方法,以至少部分解决以上所提出的技术问题。
(二)技术方案
根据本公开的一个方面,提供了一种用于域名解析容灾服务的分布式监控装置,包括:n个监控服务器,n>=2,每个监控服务器作为一个分布式监控节点,所述监控服务器可以根据业务使用需求按照地理位置属性和/或运营商网络接入服务特性分组,用于监测其所在分组的网站服务可用性情况;分布式监控管理中心,包括:分布式监控节点管理模块,连接到n个监控服务器,用于提供对分布于全国各地的n个监控服务器节点的分组管理及任务管理;监控信息数据分析引擎模块,连接到分布式监控节点管理模块,用于根据分布式监控节点管理模块收集到的网络可用性监控数据,判断出当前正在发生的网络服务故障的类型、范围和影响,提供数据分析及决策制定的功能。
在本公开一些实施例中,所述分布式监控节点管理模块,对指定分组的监控服务器下达定制的网站服务可用性监控任务;所述监控服务器,执行由所述分布式监控节点管理模块下达的任务,并将产生的监控数据回传至所述分布式监控节点管理模块。
在本公开一些实施例中,所述监控服务器在配置了需要进行可用性监控的网站域名和服务地址、端口信息后,定时按固定的时间节奏产生网络服务监控数据。
在本公开一些实施例中,每个监控服务器具有特有的地址位置或运营商网络的代表性,其中,n>=6,每个监控服务器可以同时属于多个分组,支持同时处理多个网站服务可用性监控任务。
在本公开一些实施例中,所述每个监控服务器根据运营商网络接入服务特性划分一级分组,根据地理位置属性划分二级分组。
在本公开一些实施例中,其中,所述一级分组包括:中国电信分组、中国移动分组、中国联通分组,教育网分组,电信和移动跨网节点分组。
在本公开一些实施例中,其中,所述一级分组中中国电信分组包括二级分组节点:中国电信南方节点和中国电信北方节点。
在本公开一些实施例中,监控信息数据分析引擎模块,通过组合使用多个监测节点分组逻辑,得出用于判断是否应该立即触发DNS域名解析容灾切换处理流程的处理逻辑。
在本公开一些实施例中,监控信息数据分析引擎模块输入数据包括由系统管理人员手工定义的容灾切换策略与规则,由此得出系统预设的数据分析算法与决策推导模型,容灾切换策略与规则可按域名解析容灾切换需求而定义;所述监控信息数据分析引擎模块依据分布式监控节点管理模块传输的数据,通过系统预设的数据分析算法与决策推导模型,给出是否满足触发DNS解析容灾切换操作的一个肯定或否定的结论。
在本公开一些实施例中,所述分布式监控管理中心还包括:DNS域名解析记录变更管理模块,连接到监控信息数据分析引擎模块,用于根据监控信息数据分析引擎模块的分析结果,通过调用权威DNS服务器的API接口的方式,对网站服务的域名解析记录、TTL时间进行配置变更。
在本公开一些实施例中,所述DNS域名解析记录变更管理模块,为保障在修改DNS解析记录的过程中客户侧尽快更新本地缓存,把域名解析的TTL时间设置为T1秒,在触发DNS域名解析容灾切换事件T2分钟后,该功能模块会自动把域名解析的TTL配置变更为T3秒,其中T1<<T3。
在本公开一些实施例中,T1=10,T2=20,T3=600。
在本公开一些实施例中,所述DNS域名解析记录变更管理模块,还提供可配置的域名解析记录的自动抢占功能,即允许当网站的主服务器恢复后,自动将域名解析记录指回主服务器。
在本公开一些实施例中,所述分布式监控管理中心还包括:预警信息通知模块连接到监控信息数据分析引擎模块,用于及时向管理人员发出相关事件的预警信息。
根据本公开的另一个方面,通过了一种用于域名解析容灾服务的分布式监控方法,包括:由分布式监控管理中心对指定分组的监控服务器下达网站服务可用性监控任务,所述指定分组的监控服务器是分布于全国各地的n个监控服务器节点;监控服务器执行由分布式监控管理中心下达的任务,并将产生的监控数据回传至分布式监控管理中心;依据系统输入的监控数据,通过预设的数据分析算法与决策推导模型,自动做出是否满足触发DNS解析容灾切换操作的肯定或否定的结论。
在本公开一些实施例中,在做出是否满足触发DNS解析容灾切换操作的结论之后还包括步骤:在需要触发DNS解析容灾切换操作时,调用权威DNS服务器的API接口的方式,对网站服务的域名解析记录、TTL时间进行配置变更,维护域名TTL信息以及解析抢占设置等;向管理人员以多种方式发出相关事件的预警信息。
在本公开一些实施例中,每个监控服务器具有地址位置和/或运营商网络的代表性,并且可以同时属于多个分组,支持同时处理多个网站服务可用性监控任务。
(三)有益效果
从上述技术方案可以看出,本公开用于域名解析容灾服务的分布式监控装置及方法至少具有以下有益效果其中之一:
(1)通过使用部署在全国范围内的分布式监控服务器,每个监控服务器都选取了特定地理位置的特定电信运营商网络,按上述的分组策略对收集到的网络监测信息进行数据分析,可以准确得判断出当前正在发生的网络服务故障的类型、范围和影响,通过组合使用多个监测节点分组逻辑,能得出更多用于判断是否应该立即触发DNS域名解析容灾切换处理流程的复杂处理逻辑,有效提高网站服务的可靠性;
(2)由于使用了支持灵活分组的在广域范围内分布的监控服务器提供网站服务可用性的多方面网络监测依据,以及使用了可按域名解析容灾切换需求而灵活定义的一套容灾配置策略与规则,在以上两类数据输入的基础上基于数据分析与决策的自动化处理引擎给出是否需要立即触发变更DNS域名解析记录操作的结论。
附图说明
图1为本公开实施例用于域名解析容灾服务的分布式监控装置的结构示意图。
图2为本公开实施例用于域名解析容灾服务的分布式监控方法的流程图。
具体实施方式
本公开提供了一种用于域名解析容灾服务的分布式监控装置及方法。作为一种主要用于域名解析容灾切换服务中的分布式监控技术,本发明所实现的技术系统除了包括分布式监控节点管理模块和监控信息数据分析引擎,修改DNS域名解析记录相关的功能模块,以及因需要及时通知到运维或运营人员而部署的预警通知模块。
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
本公开某些实施例于后方将参照所附附图做更全面性地描述,其中一些但并非全部的实施例将被示出。实际上,本公开的各种实施例可以许多不同形式实现,而不应被解释为限于此数所阐述的实施例;相对地,提供这些实施例使得本公开满足适用的法律要求。
在本公开的第一个示例性实施例中,提供了一种用于域名解析容灾服务的分布式监控装置。图1为本公开第一实施例用于域名解析容灾服务的分布式监控装置的结构示意图。如图1所示,本公开用于域名解析容灾服务的分布式监控装置包括:
n个监控服务器,n>=2,所述n个监控服务器节点分布于全国各地,优选地,n>=6,每个监控服务器作为一个分布式监控节点,并且其监控情况用于反映其所在分组的网站服务可用性情况。所述监控服务器可以根据业务使用需求按照某种特性分成多个小组,每个监控服务器拥用有代表性的地理位置属性,以及使用有代表性的电信运营商网络接入服务,根据运营商网络接入服务特性划分一级分组,根据地理位置属性划分二级分组。如一级分组包括中国电信分组、中国移动分组、中国联通分组,教育网分组,电信和移动跨网节点分组,综合性分组等等;所述一级分组中中国电信分组包括根据地域划分的二级分组节点:中国电信南方节点和中国电信北方节点。。在配置了需要进行可用性监控的网站域名和服务地址、端口信息后,所述监控服务器都去定时按固定的时间节奏产生网络服务监控数据,每个监控节点都有自己特有的地址位置或运营商网络的代表性。每个监控节点可以同时属于多个分组,支持同时处理多个网站服务可用性监控任务。
分布式监控管理中心,用于对分组的n个监控服务器的监控数据进行分析,根据分析结果进行相应处理。所述分布式监控管理中心包括:
分布式监控节点管理模块,连接到n个监控服务器,用于提供对分布于全国各地的n个监控服务器节点的分组管理及任务管理,提供基础设施服务。所述分布式监控节点管理模块对指定分组的监控服务器下达定制的网站服务可用性监控任务,监控服务器执行由所述分布式监控节点管理模块下达的任务,并将产生的监控数据回传至所述分布式监控节点管理模块。
监控信息数据分析引擎模块连接到分布式监控节点管理模块,用于根据分布式监控节点管理模块的数据判断出当前正在发生的网络服务故障的类型、范围和影响,提供数据分析及决策制定的功能。所述监控信息数据分析引擎模块通过组合使用多个监测节点分组逻辑,得出用于判断是否应该立即触发DNS域名解析容灾切换处理流程的处理逻辑。其输入包括两部分数据:一类数据是由系统管理人员手工定义的容灾切换策略与规则,由此得出系统预设的数据分析算法与决策推导模型,容灾切换策略与规则可按域名解析容灾切换需求而灵活定义;另一类数据是由监控管理中心收集到的网络可用性监控数据。所述监控信息数据分析引擎模块依据分布式监控节点管理模块传输的数据,通过系统预设的数据分析算法与决策推导模型,给出是否满足触发DNS解析容灾切换操作的一个肯定或否定的结论。
优选地,所述分布式监控管理中心还包括:
DNS域名解析记录变更管理模块连接到监控信息数据分析引擎模块,用于根据监控信息数据分析引擎模块的分析结果,通过调用权威DNS服务器的API接口的方式,对网站服务的域名解析记录、TTL时间进行配置变更。所述DNS域名解析记录变更管理模块不会主动触发或执行什么功能操作,完全是由上层功能模块按照数据分析引擎做出的决策信息进行调用执行的。所述DNS域名解析记录变更管理模块同时为保障在修改DNS解析记录的过程中,能够让客户侧尽快更新本地缓存,该功能模块会把域名解析的TTL时间设置为一个比较小的数值,如10秒。在以上切换事件发生一段时间后,如20分钟,该功能模块会自动把域名解析的TTL配置变更为600秒,以减少客户侧不必要的域名解析负担,提高网站服务的使用体验。此外,该功能模块还需要提供可配置的域名解析记录的自动抢占功能,即允许当网站的主服务器恢复后,自动将域名解析记录指回主服务器。
预警信息通知模块连接到监控信息数据分析引擎模块,用于及时向管理人员以多种方式发出相关事件的预警信息,所述多种方式包括:手机短信、电话、邮件以及微信通知等。
本方案的关键技术点在于使用了一套支持灵活分组的在广域范围内分布的监控服务器提供网站服务可用性的多方面网络监测依据,使用了可按域名解析容灾切换需求而灵活定义的一套容灾配置策略与规则,在以上两类数据输入的基础上基于数据分析与决策的自动化处理引擎给出是否需要立即触发变更DNS域名解析记录操作的结论。
至此,本公开第一实施例用于域名解析容灾服务的分布式监控装置介绍完毕。
在本公开的第二个示例性实施例中,提供了一种用于域名解析容灾服务的分布式监控方法。图2为本公开实施例用于域名解析容灾服务的分布式监控方法的流程图。如图2所示,本公开用于域名解析容灾服务的分布式监控方法包括:
步骤A,由分布式监控管理中心对指定分组的监控服务器下达网站服务可用性监控任务,所述指定分组的监控服务器是分布于全国各地的n个监控服务器节点;
步骤B,监控服务器执行由分布式监控管理中心下达的任务,并将产生的监控数据回传至分布式监控管理中心;
步骤C,依据系统输入的监控数据,通过预设的数据分析算法与决策推导模型,自动做出是否满足触发DNS解析容灾切换操作的肯定或否定的结论,优选地,所述预设的数据分析算法与决策推导模型由系统管理人员手工定义的容灾切换策略与规则得出;
优选地,所述用于域名解析容灾服务的分布式监控方法,在步骤C之后还包括:
步骤D,在需要触发DNS解析容灾切换操作时,调用权威DNS服务器的API接口的方式,对网站服务的域名解析记录、TTL时间进行配置变更,维护域名TTL信息以及解析抢占设置等。
步骤E,向管理人员以多种方式发出相关事件的预警信息。
本发明中通过使用部署在全国范围内的分布式监控服务器,每个监控服务器都选取了特定地理位置的特定电信运营商网络。按上述的分组策略对收集到的网络监测信息进行数据分析,可以准确得判断出当前正在发生的网络服务故障的类型、范围和影响。通过组合使用多个监测节点分组逻辑,能得出更多用于判断是否应该立即触发DNS域名解析容灾切换处理流程的复杂处理逻辑,有效提高网站服务的可靠性。
为了达到简要说明的目的,上述实施例1中任何可作相同应用的技术特征叙述皆并于此,无需再重复相同叙述。
至此,本公开第二实施例用于域名解析容灾服务的分布式监控方法介绍完毕。
至此,已经结合附图对本公开实施例进行了详细描述。需要说明的是,在附图或说明书正文中,未绘示或描述的实现方式,均为所属技术领域中普通技术人员所知的形式,并未进行详细说明。此外,上述对各元件和方法的定义并不仅限于实施例中提到的各种具体结构、形状或方式,本领域普通技术人员可对其进行简单地更改或替换。
除非有所知名为相反之意,本说明书及所附权利要求中的数值参数是近似值,能够根据通过本公开的内容所得的所需特性改变。具体而言,所有使用于说明书及权利要求中表示组成的含量、反应条件等等的数字,应理解为在所有情况中是受到「约」的用语所修饰。一般情况下,其表达的含义是指包含由特定数量在一些实施例中±10%的变化、在一些实施例中±5%的变化、在一些实施例中±1%的变化、在一些实施例中±0.5%的变化。
此外,除非特别描述或必须依序发生的步骤,上述步骤的顺序并无限制于以上所列,且可根据所需设计而变化或重新安排。并且上述实施例可基于设计及可靠度的考虑,彼此混合搭配使用或与其他实施例混合搭配使用,即不同实施例中的技术特征可以自由组合形成更多的实施例。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的内容,并且上面对特定语言所做的描述是为了披露本公开的最佳实施方式。
本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的相关设备中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。并且,在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。
类似地,应当理解,为了精简本公开并帮助理解各个公开方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,公开方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的单独实施例。
以上所述的具体实施例,对本公开的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本公开的具体实施例而已,并不用于限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (17)

1.一种用于域名解析容灾服务的分布式监控装置,包括:
n个监控服务器,n>=2,每个监控服务器作为一个分布式监控节点,所述监控服务器可以根据业务使用需求按照地理位置属性和/或运营商网络接入服务特性分组,用于监测其所在分组的网站服务可用性情况;
分布式监控管理中心,包括:
分布式监控节点管理模块,连接到所述n个监控服务器,用于提供对分布于全国各地的n个监控服务器节点的分组管理及任务管理;
监控信息数据分析引擎模块,连接到分布式监控节点管理模块,用于根据分布式监控节点管理模块收集到的网络可用性监控数据,判断出当前正在发生的网络服务故障的类型、范围和影响,提供数据分析及决策制定的功能。
2.根据权利要求1所述的分布式监控装置,其中,
所述分布式监控节点管理模块,对指定分组的监控服务器下达定制的网站服务可用性监控任务;
所述监控服务器,执行由所述分布式监控节点管理模块下达的任务,并将产生的监控数据回传至所述分布式监控节点管理模块。
3.根据权利要求1所述的分布式监控装置,其中,所述监控服务器在配置了需要进行可用性监控的网站域名和服务地址、端口信息后,定时按固定的时间节奏产生网络服务监控数据。
4.根据权利要求1所述的分布式监控装置,每个监控服务器具有特有的地址位置或运营商网络的代表性,其中,n>=6,并且每个监控服务器可以同时属于多个分组,支持同时处理多个网站服务可用性监控任务。
5.根据权利要求1所述的分布式监控装置,其中,所述每个监控服务器根据运营商网络接入服务特性划分一级分组,根据地理位置属性划分二级分组。
6.根据权利要求5所述的分布式监控装置,其中,所述一级分组包括:中国电信分组、中国移动分组、中国联通分组,教育网分组,电信和移动跨网节点分组。
7.根据权利要求6所述的分布式监控装置,其中,所述一级分组中中国电信分组包括二级分组节点:中国电信南方节点和中国电信北方节点。
8.根据权利要求7所述的分布式监控装置,其中,
监控信息数据分析引擎模块,通过组合使用多个监测节点分组逻辑,得出用于判断是否应该立即触发DNS域名解析容灾切换处理流程的处理逻辑。
9.根据权利要求1所述的分布式监控装置,其中,
监控信息数据分析引擎模块输入数据包括由系统管理人员手工定义的容灾切换策略与规则,由此得出系统预设的数据分析算法与决策推导模型,容灾切换策略与规则可按域名解析容灾切换需求而定义;所述监控信息数据分析引擎模块依据分布式监控节点管理模块传输的数据,通过系统预设的数据分析算法与决策推导模型,给出是否满足触发DNS解析容灾切换操作的一个肯定或否定的结论。
10.根据权利要求1所述的分布式监控装置,所述分布式监控管理中心还包括:
DNS域名解析记录变更管理模块,连接到监控信息数据分析引擎模块,用于根据监控信息数据分析引擎模块的分析结果,通过调用权威DNS服务器的API接口的方式,对网站服务的域名解析记录、TTL时间进行配置变更。
11.根据权利要求1所述的分布式监控装置,其中,
所述DNS域名解析记录变更管理模块,为保障在修改DNS解析记录的过程中客户侧尽快更新本地缓存,把域名解析的TTL时间设置为T1秒,在触发DNS域名解析容灾切换事件T2分钟后,该功能模块会自动把域名解析的TTL配置变更为T3秒,其中T1<<T3。
12.根据权利要求11所述的分布式监控装置,其中,T1=10,T2=20,T3=600。
13.根据权利要求1所述的分布式监控装置,其中,
所述DNS域名解析记录变更管理模块,还提供可配置的域名解析记录的自动抢占功能,即允许当网站的主服务器恢复后,自动将域名解析记录指回主服务器。
14.根据权利要求1所述的分布式监控装置,所述分布式监控管理中心还包括:
预警信息通知模块连接到监控信息数据分析引擎模块,用于及时向管理人员发出相关事件的预警信息。
15.一种用于域名解析容灾服务的分布式监控方法,包括:
由分布式监控管理中心对指定分组的监控服务器下达网站服务可用性监控任务,所述指定分组的监控服务器是分布于全国各地的n个监控服务器节点;
监控服务器执行由分布式监控管理中心下达的任务,并将产生的监控数据回传至分布式监控管理中心;
依据系统输入的监控数据,通过预设的数据分析算法与决策推导模型,自动做出是否满足触发DNS解析容灾切换操作的肯定或否定的结论。
16.根据权利要求15所述的分布式监控方法,在做出是否满足触发DNS解析容灾切换操作的结论之后还包括步骤:
在需要触发DNS解析容灾切换操作时,调用权威DNS服务器的API接口的方式,对网站服务的域名解析记录、TTL时间进行配置变更,维护域名TTL信息以及解析抢占设置等;
向管理人员以多种方式发出相关事件的预警信息。
17.根据权利要求15所述的分布式监控方法,每个监控服务器具有地址位置和/或运营商网络的代表性,并且可以同时属于多个分组,支持同时处理多个网站服务可用性监控任务。
CN201711007714.5A 2017-10-25 2017-10-25 用于域名解析容灾服务的分布式监控装置及方法 Pending CN107634863A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711007714.5A CN107634863A (zh) 2017-10-25 2017-10-25 用于域名解析容灾服务的分布式监控装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711007714.5A CN107634863A (zh) 2017-10-25 2017-10-25 用于域名解析容灾服务的分布式监控装置及方法

Publications (1)

Publication Number Publication Date
CN107634863A true CN107634863A (zh) 2018-01-26

Family

ID=61106440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711007714.5A Pending CN107634863A (zh) 2017-10-25 2017-10-25 用于域名解析容灾服务的分布式监控装置及方法

Country Status (1)

Country Link
CN (1) CN107634863A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109560903A (zh) * 2019-02-14 2019-04-02 湖南智领通信科技有限公司 一种完全容灾的车载指挥通信系统
CN109739877A (zh) * 2018-11-21 2019-05-10 比亚迪股份有限公司 数据库系统和数据管理方法
CN109768899A (zh) * 2018-12-26 2019-05-17 北京奇安信科技有限公司 网站可用性监测方法、装置、设备及介质
CN110855808A (zh) * 2019-10-11 2020-02-28 新浪网技术(中国)有限公司 一种基于分布式监控策略的域名自动切换方法、装置及系统
CN113708967A (zh) * 2021-08-26 2021-11-26 中化信息技术有限公司 一种系统监测容灾预警装置及预警方法
CN113727381A (zh) * 2021-08-31 2021-11-30 中国联合网络通信集团有限公司 网络容灾方法、装置、系统及存储介质
CN114760224A (zh) * 2021-12-24 2022-07-15 中国银联股份有限公司 用于监控网络通道的状态的系统、方法、设备和存储介质
CN116170346A (zh) * 2022-12-27 2023-05-26 天翼云科技有限公司 一种监控方法、装置及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101628628A (zh) * 2009-08-03 2010-01-20 北京航空航天大学 适用于航天器系统的自修正冗余切换机制及其验证方法
CN102217234A (zh) * 2009-05-08 2011-10-12 圣斯马来西亚大学 实时分布式网络监控和安全监控平台
CN102347976A (zh) * 2011-07-25 2012-02-08 北京安天电子设备有限公司 分布式网络服务器监控方法及系统
CN104270268A (zh) * 2014-09-28 2015-01-07 曙光信息产业股份有限公司 一种分布式系统网络性能分析及故障诊断方法
CN104539479A (zh) * 2014-12-16 2015-04-22 北京中交兴路车联网科技有限公司 一种分布式服务监控系统及方法
CN104954324A (zh) * 2014-03-26 2015-09-30 阿里巴巴集团控股有限公司 一种Session容灾方法及装置
CN105574590A (zh) * 2015-12-28 2016-05-11 中国民航信息网络股份有限公司 自适应总控灾备切换装置、系统及信号发生方法
CN106130820A (zh) * 2016-07-13 2016-11-16 张志华 一种大数据平台系统
CN106161046A (zh) * 2015-03-18 2016-11-23 国家电网公司 一种面向电力光传输网的通信安全防御模型及其控制方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102217234A (zh) * 2009-05-08 2011-10-12 圣斯马来西亚大学 实时分布式网络监控和安全监控平台
CN101628628A (zh) * 2009-08-03 2010-01-20 北京航空航天大学 适用于航天器系统的自修正冗余切换机制及其验证方法
CN102347976A (zh) * 2011-07-25 2012-02-08 北京安天电子设备有限公司 分布式网络服务器监控方法及系统
CN104954324A (zh) * 2014-03-26 2015-09-30 阿里巴巴集团控股有限公司 一种Session容灾方法及装置
CN104270268A (zh) * 2014-09-28 2015-01-07 曙光信息产业股份有限公司 一种分布式系统网络性能分析及故障诊断方法
CN104539479A (zh) * 2014-12-16 2015-04-22 北京中交兴路车联网科技有限公司 一种分布式服务监控系统及方法
CN106161046A (zh) * 2015-03-18 2016-11-23 国家电网公司 一种面向电力光传输网的通信安全防御模型及其控制方法
CN105574590A (zh) * 2015-12-28 2016-05-11 中国民航信息网络股份有限公司 自适应总控灾备切换装置、系统及信号发生方法
CN106130820A (zh) * 2016-07-13 2016-11-16 张志华 一种大数据平台系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109739877A (zh) * 2018-11-21 2019-05-10 比亚迪股份有限公司 数据库系统和数据管理方法
CN109768899A (zh) * 2018-12-26 2019-05-17 北京奇安信科技有限公司 网站可用性监测方法、装置、设备及介质
CN109560903A (zh) * 2019-02-14 2019-04-02 湖南智领通信科技有限公司 一种完全容灾的车载指挥通信系统
CN109560903B (zh) * 2019-02-14 2024-01-19 湖南智领通信科技有限公司 一种完全容灾的车载指挥通信系统
CN110855808A (zh) * 2019-10-11 2020-02-28 新浪网技术(中国)有限公司 一种基于分布式监控策略的域名自动切换方法、装置及系统
CN110855808B (zh) * 2019-10-11 2022-09-16 新浪网技术(中国)有限公司 一种基于分布式监控策略的域名自动切换方法、装置及系统
CN113708967A (zh) * 2021-08-26 2021-11-26 中化信息技术有限公司 一种系统监测容灾预警装置及预警方法
CN113708967B (zh) * 2021-08-26 2024-04-16 中化信息技术有限公司 一种系统监测容灾预警装置及预警方法
CN113727381A (zh) * 2021-08-31 2021-11-30 中国联合网络通信集团有限公司 网络容灾方法、装置、系统及存储介质
CN113727381B (zh) * 2021-08-31 2023-06-27 中国联合网络通信集团有限公司 网络容灾方法、装置、系统及存储介质
CN114760224A (zh) * 2021-12-24 2022-07-15 中国银联股份有限公司 用于监控网络通道的状态的系统、方法、设备和存储介质
CN116170346A (zh) * 2022-12-27 2023-05-26 天翼云科技有限公司 一种监控方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN107634863A (zh) 用于域名解析容灾服务的分布式监控装置及方法
CN102820984B (zh) 自动网络拓扑结构检测和建模
CN106100999B (zh) 一种虚拟化网络环境中镜像网络流量控制方法
US5799317A (en) Data management system for a telecommunications signaling system 7(SS#7)
KR101789393B1 (ko) 서버 클러스터에 서버를 추가 및 제거하기 위한 시스템 및 방법
EP1116121A1 (en) Interface system for integrated monitoring and management of network devices in a telecommunications network
JP2000209201A (ja) ネットワ―ク管理方法及びネットワ―ク管理システム
US7729287B2 (en) Methods of providing simulation for communications systems and related systems and computer program products
US7941537B2 (en) System, method, and computer-readable medium for resource migration in a distributed telecommunication system
CN109660405A (zh) 呼叫中心的容灾方法、装置、设备及存储介质
CN109462511B (zh) 网络的建立方法及装置
CN105446724B (zh) 软件参数的管理方法及装置
CN101369916B (zh) 性能指标的采集方法
CN108464031B (zh) 电信网络中的基于数据库的冗余
GB2416091A (en) High Capacity Fault Correlation
US5966713A (en) Method for determining the contents of a restoration log
WO1997024835A1 (en) Telecommunications network management method
CN100411360C (zh) 多网融合的网络管理方法
KR100441892B1 (ko) 코랜 가입자 통합 관리 장치 및 방법
CN105827475A (zh) 一种端到端电信客户网络监控系统
WO2003007549A1 (en) Method and graphical user interface for controlling a telecommunication system
Hanmer Operations and Maintenance 2
KR102602570B1 (ko) 방화벽 장치의 설정값을 제어하는 igw 콘트롤러 및 그것과 방화벽 장치 간의 설정값 동기화 제어 방법
Faisal Network Monitoring System Analysis Using OpenNMS to Analyze the Irregularities of the Internet Network
KR101229569B1 (ko) 통합 토폴로지를 이용한 장애 표시 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180126

RJ01 Rejection of invention patent application after publication