CN103384212A - 一种通信应用系统双机高可用方案及其实现 - Google Patents
一种通信应用系统双机高可用方案及其实现 Download PDFInfo
- Publication number
- CN103384212A CN103384212A CN2013103180020A CN201310318002A CN103384212A CN 103384212 A CN103384212 A CN 103384212A CN 2013103180020 A CN2013103180020 A CN 2013103180020A CN 201310318002 A CN201310318002 A CN 201310318002A CN 103384212 A CN103384212 A CN 103384212A
- Authority
- CN
- China
- Prior art keywords
- monitoring
- machine
- shipper
- network
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种通信应用系统双机高可用方案及其实现。在通讯业务领域中,对应用服务器的可用性和稳定性要求非常高,一旦服务器运行中断,将出现灾难性的后果。所以对于重要的服务器,都非常注重可用性和稳定性,一旦运行发生中断,要立即恢复。因此需要一种应用服务器双机高可用方案,部署2台应用服务器,监测服务器的运行状态。一旦服务器出现故障情况,可迅速将应用程序切换到另一台冗余服务器,继续处理数据。本发明技术要点包括,监控进程状态功能,监控网卡状态和网络端口功能,双机切换功能,监控策略可配置功能,双机状态相互监控,远程控制功能。
Description
技术领域
本发明涉及通讯领域、电信业务领域,特别是涉及一种通信应用系统双机高可用方案及其实现。
背景技术
随着电信通讯技术的迅猛发展,国内各大运营商经过激烈的竞争,发展为目前中国电信、中国联通、中国移动三大电信运营商,随着3G技术的发展、成熟,国内三大运营商都进入了全业务运营的时代。随着技术的更新换代和业务发展,系统的可用性和稳定性需求也不断增大,一旦系统出现故障导致瘫痪,将会带来灾难性的后果。
现有的技术,系统一旦出现故障会自动发出告警,等待技术人员去现场处理,这种机制,反应迟钝而且导致数据停止处理。即使是时间不长,也会造成一定的经济损失,如果时间持续长久,损失更将是灾难性,所以运营商极不愿意看到系统因为故障而停止运行。通信应用系统双机高可用方案,可以提高系统的可用性。即使运行的服务器发生故障,退出了服务,还有另外一台马上可以切换替补,有效地保证了服务不会中断。
发明内容
本发明所要解决的技术问题是提供一种通信应用系统双机高可用方案及其实现,以提高系统的可用性。
为实现上述发明目的,本发明提供一种通信应用系统双机高可用方案及其实现,包括监控进程状态功能;
所述监控进程状态,是定时获取系统中运行的进程列表,从列表中判断指定进程的状态。若进程出现挂死或退出状况,立即进行切换服务器处理。
监控进程状态,用于:判断服务器中进程是否处于正常状态,服务是否正常运行,数据是否正在处理中。一旦进程退出或者挂死,处理就会停止,服务就会中断。监控到进程异常后,可以马上切换到另一台冗余的服务器,继续运行。
本发明还提供一种通信应用系统双机高可用方案及其实现,包括:监控网卡状态和网络端口功能。
所述监控网卡状态,是定时获取系统的网卡列表,判断列表中指定网卡状态,包括网卡是否可用,网卡IP是否发生变化,指定IP是否存在,若发生异常状况,立即切换服务器。
所述监控网络端口,是获取网卡上指定端口的状态,如果端口未被占用,即程序或网络出现异常,立即切换服务器。可以分别监控UDP协议和TCP协议的端口。
监控网卡状态和网络端口用于:判断机器的网络是否处于正常状态,网卡是否处于工作状态,IP地址是否正确,进程是否通过正常端口与其他模块进行通信传输。一旦网络出现问题,如其中一张网卡故障,进程无法正常处理,网卡监控就会监测到异常,马上切换到另一台服务器,继续处理。
本发明还提供一种通信应用系统双机高可用方案及其实现,包括:双机切换功能。
所述双机切换,是在运行的服务器发生异常状况后,将故障机器上的应用程序停止,浮点IP删除,通知对端机器切换,停止监控功能。对端机器收到切换指令后,马上添加浮点IP,启动应用程序,启动监控功能,通知对端已经切换完成。通过切换功能,停止故障机器的工作,让冗余的机器替换故障机器处理数据,继续提供服务。
所述浮点IP,是双机对外服务的一个IP地址,这个IP在正常运行的服务器上,当发生故障时,IP就改变到另一台冗余机器上继续运行。通过浮点IP可以保证外部访问的连续性,不会因为切换了机器而导致服务IP改变,而中断业务。
双机切换用于:发生故障时,能停止正在运行的故障服务器,并启动冗余服务器。冗余服务器启动后,能迅速接替故障服务器,恢复处理数据的功能,避免服务中断。
本发明还提供一种通信应用系统双机高可用方案及其实现,包括:监控策略可配置功能。
所述监控策略可配置,是用户可根据实际情况,指定需要监控哪些进程,指定监控网卡,设定监控周期,配置浮点IP等等。
优选的有,上述方法中,还包括:以下6个方面,设定监控检测的间隔周期,指定监控的进程,指定监控的网卡,指定监控的端口,指定浮点IP,指定开启和关闭服务的脚本。
监控策略可配置用于:根据项目的实际情况,设置不同参数,监控不同内容,使得双机冗余服务器能应用到更多项目和不同情况中。不同项目有不同需求,应用场景也各不相同,对应的监控需要也不一样,启动和停止服务器的方法也不一样。监控策略可配置使得监控更加灵活多变。
本发明还提供一种通信应用系统双机高可用方案及其实现,包括:双机状态相互监控。
所述相互状态监控,两台机器,定时广播心跳包,心跳包中包含主机当前状态。
双机状态相互监控用于:获取对端机器的状态,同时也检测两机器之间的网络连通性。如果机器间的网络出现问题,心跳包收不到,那么网络正常的一台机器就会切换处理数据。如果发现本来处于冗余的机器,突然强制变成了活动状态,监控功能就会把另一台服务器停止,变成冗余状态。
本发明还提供一种通信应用系统双机高可用方案及其实现,包括:远程控制功能。
所述远程控制,是方案提供特定控制程序,可以通过局域网连接监控程序。
远程控制用于:获取当前机器状态(包括程序和网卡状态),获取当前机器是处于活动状态还是冗余状态,可以强制切换两台机器的状态,可以停止两台机器上的监控功能。
由上述方案可以看出,本发明中两台服务器可以互为替补,相互切换,方案提供严密灵敏的监控机制,运行的服务器发生异常,能够及时切换到另一台服务器,继续处理数据,提供服务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实现中系统结构示意图;
图2为本发明实现中服务器发生故障示意图;
图3为本发明实现中服务器发生故障后切换示意图;
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一,参见图2和图3。
本发明提供一种通信应用系统双机高可用方案及其实现,实现了系统故障监控,双机切换互为替补,可用于通讯领域中提高业务系统可用性。监控功能实现了可配置,可以满足不同项目和多种应用场景,灵活易用。
假设存在2台应用服务器,分别为服务器1和服务器2,以及一个浮点I P地址。参见图1。外部网络进行数据交换和业务处理,访问是浮点IP。
起初浮点IP在服务器1上,由服务器1进行处理。外部模块访问的是浮点IP,提交的数据都给服务器1进行处理。服务器1一直很稳定,直到一天进程A出现异常情况退出,服务器1上监控程序发现异常情况,马上关闭应用程序,删除浮点IP,并通知服务器2。服务器2接收到通知,马上启动应用进程,添加浮点IP,并更换状态,接替服务器1继续处理业务数据。
本发明提供应用程序监控,网卡监控,端口监控,双机监控等功能,能保证全面监控应用服务器运行状态,及时发现异常并进行切换。
本发明提供6个方面监控功能进行配置设定,设定监控检测的间隔周期,指定监控的进程,指定监控的网卡,指定监控的端口,指定浮点IP,指定开启和关闭服务的脚本。
本发明提供远程控制程序,可以通过网络连接监控程序。。远程控制程序连接成功后,可以获取当前机器状态(包括程序和网卡状态),获取当前机器是处于活动状态还是冗余状态,可以强制切换两台机器的状态,可以停止两台机器上的切换服务。
由上可见,本发明提供的一种通信应用系统双机高可用方案及其实现,有以下优点。
(1)可用性高
本发明提供的通信应用系统双机高可用方案的实现,能够实时监控机器运行状态,做到随时出现故障随时切换服务器,不会因为一台服务器故障而停止服务。
(2)监控全面
本发明提供监控服务,能对应用进程实、网络状态和对端机器进行全面有效监控。一旦出现已经能够及时发现,并切换服务器。
(3)灵活易用
本发明可以提供6个方面监控功能进行配置设定,能在多个应用场景下,配置实现监控,及时临时改变监控选项也可以轻松修改配置。
本发明可以提供远程控制程序,实现双机状态查询,强制切换,以及监控功能的启动和停止。
通过以上的方法实施例的描述,所属领域的技术人员可以清楚地了解到本发明方便、稳定、广泛地应用于通讯领域系统中。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种通信应用系统双机高可用方案及其实现,其特征在于,包括监控进程状态功能;
所述监控进程状态,是定时获取系统中运行的进程列表,从列表中判断指定进程的状态,若进程出现挂死或退出状况,立即进行切换服务器处理。
2.一种通信应用系统双机高可用方案算法及其实现,其特征在于,包括监控网卡状态和网络端口功能;
所述监控网卡状态,是定时获取系统的网卡列表,判断列表中指定网卡状态,包括网卡是否可用,网卡IP是否发生变化,指定IP是否存在,若发生异常状况,立即切换服务器;
所述监控网络端口,是获取网卡上指定端口的状态,如果端口未被占用,即程序或网络出现异常,立即切换服务器;可以分别监控UDP协议和TCP协议的端口。
3.一种通信应用系统双机高可用方案及其实现,其特征在于,包括:双机切换功能;
所述双机切换,是在运行的服务器发生异常状况后,将故障机器上的应用程序停止,浮点IP删除,通知对端机器切换,停止监控功能;对端机器收到切换指令后,马上添加浮点IP,启动应用程序,启动监控功能,通知对端已经切换完成;通过切换功能,停止故障机器的工作,让冗余的机器替换故障机器处理数据,继续提供服务;
所述浮点IP,是双机对外服务的一个IP地址,这个IP在正常运行的服务器上,当发生故障时,IP就改变到另一台冗余机器上继续运行;通过浮点I P可以保证外部访问的连续性,不会因为切换了机器而导致服务IP改变,而中断业务。
4.一种通信应用系统双机高可用方案及其实现,其特征在于,包括:监控策略可配置功能;
所述监控策略可配置,是用户可根据实际情况,指定需要监控哪些进程,指定监控网卡,设定监控周期,配置浮点IP等等。
5.根据权利要求4所述的方法,其特征在于,还包括:
所述监控策略,包含以下6个方面,设定监控检测的间隔周期,指定监控的进程,指定监控的网卡,指定监控的端口,指定浮点IP,指定开启和关闭服务程序的脚本。
6.一种通信应用系统双机高可用方案及其实现,其特征在于,包括:双机状态相互监控;
所述相互状态监控,两台机器,定时广播心跳包,心跳包中包含主机当前状态;如果机器间的网络出现问题,心跳包收不到,那么网络正常的一台机器就会切换处理数据;如果发现本来处于冗余的机器,突然强制变成了活动状态,监控功能就会把另一台服务器停止,变成冗余状态,防止两台机器同时处理数据造成冲突。
7.一种通信应用系统双机高可用方案及其实现,其特征在于,包括:远程控制功能;
所述远程控制,是方案提供特定控制程序,通过局域网连接监控程序;远程控制程序连接成功后,可以获取当前机器状态(包括程序和网卡状态),获取当前机器是处于活动状态还是冗余状态,可以强制切换两台机器的状态,可以停止两台机器上的切换服务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013103180020A CN103384212A (zh) | 2013-07-24 | 2013-07-24 | 一种通信应用系统双机高可用方案及其实现 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013103180020A CN103384212A (zh) | 2013-07-24 | 2013-07-24 | 一种通信应用系统双机高可用方案及其实现 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103384212A true CN103384212A (zh) | 2013-11-06 |
Family
ID=49491913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013103180020A Pending CN103384212A (zh) | 2013-07-24 | 2013-07-24 | 一种通信应用系统双机高可用方案及其实现 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103384212A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103647668A (zh) * | 2013-12-16 | 2014-03-19 | 上海证券交易所 | 一种高可用集群内主机群体决策系统及切换方法 |
CN105162873A (zh) * | 2015-09-22 | 2015-12-16 | 浪潮(北京)电子信息产业有限公司 | 一种k1服务器的高可用方法及系统 |
CN106657440A (zh) * | 2016-12-27 | 2017-05-10 | 创新科存储技术(深圳)有限公司 | Dns服务的实现方法 |
CN107480014A (zh) * | 2017-07-24 | 2017-12-15 | 北京奇安信科技有限公司 | 一种高可用设备切换方法及装置 |
CN107872361A (zh) * | 2016-09-26 | 2018-04-03 | 横河电机株式会社 | 处理装置、网络装置、处理装置的控制方法、网络装置的控制方法、以及记录介质 |
CN108134700A (zh) * | 2017-12-22 | 2018-06-08 | 南京因泰莱电器股份有限公司 | 一种实现电力自动化通信数据完整性的方法 |
CN109507866A (zh) * | 2018-12-07 | 2019-03-22 | 天津津航计算技术研究所 | 一种基于网络地址漂移技术的双机冗余系统及方法 |
CN111416749A (zh) * | 2020-04-08 | 2020-07-14 | 上海晨驭信息科技有限公司 | 一种用于服务器主备自动切换的系统 |
CN111555931A (zh) * | 2020-04-23 | 2020-08-18 | 北京奇艺世纪科技有限公司 | 上游服务器监控处理方法、监控器及电子设备 |
CN112995070A (zh) * | 2021-05-21 | 2021-06-18 | 湖南兴天电子科技有限公司 | 一种双卡切换系统及方法 |
CN113225334A (zh) * | 2021-04-30 | 2021-08-06 | 中国工商银行股份有限公司 | 终端安全管理方法、装置、电子设备及存储介质 |
CN113557695A (zh) * | 2019-03-15 | 2021-10-26 | 艾可慕株式会社 | 服务器系统以及进程的冗余化方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070143455A1 (en) * | 2003-05-09 | 2007-06-21 | Gorman David J | Monitoring operational data in data processing systems |
CN101206692A (zh) * | 2006-12-20 | 2008-06-25 | 联想(北京)有限公司 | 检测进程的方法及设备 |
CN101651580A (zh) * | 2009-09-08 | 2010-02-17 | 中兴通讯股份有限公司 | 一种触发双机切换的方法及装置 |
-
2013
- 2013-07-24 CN CN2013103180020A patent/CN103384212A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070143455A1 (en) * | 2003-05-09 | 2007-06-21 | Gorman David J | Monitoring operational data in data processing systems |
CN101206692A (zh) * | 2006-12-20 | 2008-06-25 | 联想(北京)有限公司 | 检测进程的方法及设备 |
CN101651580A (zh) * | 2009-09-08 | 2010-02-17 | 中兴通讯股份有限公司 | 一种触发双机切换的方法及装置 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103647668A (zh) * | 2013-12-16 | 2014-03-19 | 上海证券交易所 | 一种高可用集群内主机群体决策系统及切换方法 |
CN105162873A (zh) * | 2015-09-22 | 2015-12-16 | 浪潮(北京)电子信息产业有限公司 | 一种k1服务器的高可用方法及系统 |
CN107872361B (zh) * | 2016-09-26 | 2021-06-29 | 横河电机株式会社 | 处理装置、网络装置、处理装置的控制方法、网络装置的控制方法、以及记录介质 |
CN107872361A (zh) * | 2016-09-26 | 2018-04-03 | 横河电机株式会社 | 处理装置、网络装置、处理装置的控制方法、网络装置的控制方法、以及记录介质 |
CN106657440A (zh) * | 2016-12-27 | 2017-05-10 | 创新科存储技术(深圳)有限公司 | Dns服务的实现方法 |
CN107480014B (zh) * | 2017-07-24 | 2021-01-01 | 奇安信科技集团股份有限公司 | 一种高可用设备切换方法及装置 |
CN107480014A (zh) * | 2017-07-24 | 2017-12-15 | 北京奇安信科技有限公司 | 一种高可用设备切换方法及装置 |
CN108134700A (zh) * | 2017-12-22 | 2018-06-08 | 南京因泰莱电器股份有限公司 | 一种实现电力自动化通信数据完整性的方法 |
CN109507866A (zh) * | 2018-12-07 | 2019-03-22 | 天津津航计算技术研究所 | 一种基于网络地址漂移技术的双机冗余系统及方法 |
CN113557695A (zh) * | 2019-03-15 | 2021-10-26 | 艾可慕株式会社 | 服务器系统以及进程的冗余化方法 |
CN113557695B (zh) * | 2019-03-15 | 2023-10-27 | 艾可慕株式会社 | 服务器系统以及进程的冗余化方法 |
CN111416749A (zh) * | 2020-04-08 | 2020-07-14 | 上海晨驭信息科技有限公司 | 一种用于服务器主备自动切换的系统 |
CN111555931A (zh) * | 2020-04-23 | 2020-08-18 | 北京奇艺世纪科技有限公司 | 上游服务器监控处理方法、监控器及电子设备 |
CN113225334A (zh) * | 2021-04-30 | 2021-08-06 | 中国工商银行股份有限公司 | 终端安全管理方法、装置、电子设备及存储介质 |
CN112995070A (zh) * | 2021-05-21 | 2021-06-18 | 湖南兴天电子科技有限公司 | 一种双卡切换系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103384212A (zh) | 一种通信应用系统双机高可用方案及其实现 | |
CN100568854C (zh) | 一种保持邻居关系的方法和接口板 | |
CN102355368B (zh) | 一种网络设备的故障处理方法及系统 | |
CN106533736B (zh) | 一种网络设备重启方法和装置 | |
US9071513B2 (en) | Path switch-back method and apparatus in transport network | |
WO2016095344A1 (zh) | 链路切换方法、装置及线卡 | |
US10037253B2 (en) | Fault handling methods in a home service system, and associated household appliances and servers | |
CN111372272A (zh) | 无线桥接网络的异常恢复方法和装置 | |
CN102257759A (zh) | 主备倒换方法、系统控制单元和通信系统 | |
CN112218321B (zh) | 主备链路切换方法、装置、通信设备和存储介质 | |
CN109218232B (zh) | 一种实现Mux机的方法、设备及系统 | |
CN110895469A (zh) | 双机热备系统的升级方法、装置及电子设备和存储介质 | |
US10929254B2 (en) | Data processing system providing service continuity protection | |
CN104639867A (zh) | 一种视频会议恢复方法及系统 | |
CN111371680B (zh) | 双机热备的路由管理方法、装置、设备及存储介质 | |
CN102195861A (zh) | 一种路由切换过程中建立bfd会话的方法和装置 | |
CN104901834A (zh) | 一种网络服务器自动切换的方法及系统 | |
CN105871614A (zh) | 一种通信设备中板卡的保护方法和装置 | |
CN103441987A (zh) | 双机防火墙系统的管理方法和装置 | |
CN108933818A (zh) | 通信方法及装置 | |
CN106411574B (zh) | 一种管理控制方法和装置 | |
CN102546344B (zh) | 链路倒换方法和装置 | |
CN111585797A (zh) | 以太网链路切换方法、装置、设备及计算机可读存储介质 | |
CN103281720A (zh) | 无线控制器热备切换方法及装置、无线控制器、接入系统 | |
CN114422335A (zh) | 通信方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131106 |
|
WD01 | Invention patent application deemed withdrawn after publication |