CN106603319A - 一种故障处理的方法、管理服务器以及逻辑服务器 - Google Patents

一种故障处理的方法、管理服务器以及逻辑服务器 Download PDF

Info

Publication number
CN106603319A
CN106603319A CN201710121123.4A CN201710121123A CN106603319A CN 106603319 A CN106603319 A CN 106603319A CN 201710121123 A CN201710121123 A CN 201710121123A CN 106603319 A CN106603319 A CN 106603319A
Authority
CN
China
Prior art keywords
server
address
backup
logical
caching server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710121123.4A
Other languages
English (en)
Other versions
CN106603319B (zh
Inventor
余东良
魏定强
刘剑
王小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710121123.4A priority Critical patent/CN106603319B/zh
Publication of CN106603319A publication Critical patent/CN106603319A/zh
Application granted granted Critical
Publication of CN106603319B publication Critical patent/CN106603319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Abstract

本发明实施例公开了一种故障处理的方法,用于降低故障处理的时间,以及提高系统的可用率。本发明实施例方法包括:管理服务器获取故障缓存服务器的IP地址,所述故障缓存服务器的IP地址是监控管理器确定的;所述管理服务器将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;所述管理服务器根据所述备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;所述管理服务器将更新后的逻辑服务器的配置信息向逻辑服务器发送,所述更新后的逻辑服务器的配置信息包括所述备份缓存服务器的IP地址,所述备份缓存服务器的IP地址用于所述逻辑服务器重建连接池。

Description

一种故障处理的方法、管理服务器以及逻辑服务器
技术领域
本发明涉及计算机领域,尤其涉及一种故障处理的方法、管理服务器以及逻辑服务器。
背景技术
在现有技术中,逻辑层服务器与多台memcache服务器进行交互的过程中,当memecache服务器发生故障时,memcache服务器管理人员收到监控告警信息,需要快速定位原因,并快速恢复。如果是memcache服务器硬件故障,管理人员需要找到新memcache服务器或者是备机替换故障机。memcache服务器替换完后,重启逻辑层服务器,与memcache服务器重建连接池,故障才能彻底消除。
现有技术的缺点:从故障发现到最终解决耗时较长;memcache服务器故障机替换后,需要重启逻辑层服务器与memcache重建连接池;因为处理时间长,且要重启逻辑层服务器,降低了系统的可用率。
发明内容
本发明实施例提供了一种故障处理的方法、管理服务器以及逻辑服务器,用于降低故障处理的时间,以及提高系统的可用率。
本发明实施例第一方面提供一种故障处理的方法,可以包括:
管理服务器获取故障缓存服务器的IP地址,该故障缓存服务器的IP地址是监控管理器确定的;
该管理服务器将该故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;
该管理服务器根据该备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;
该管理服务器将更新后的逻辑服务器的配置信息向逻辑服务器发送,该更新后的逻辑服务器的配置信息包括该备份缓存服务器的IP地址,该备份缓存服务器的IP地址用于该逻辑服务器重建连接池。
本发明实施例第二方面提供一种故障处理的方法,可以包括:
逻辑服务器定期读取该逻辑服务器的当前配置信息;
若该当前配置信息与上次读取的配置信息不同,则该逻辑服务器根据该当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。
本发明实施例第三方面提供一种管理服务器,可以包括:
获取模块,用于获取故障缓存服务器的IP地址,该故障缓存服务器的IP地址是监控管理器确定的;
替换模块,用于将该故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;
更新模块,用于根据该备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;
发送模块,用于将更新后的逻辑服务器的配置信息向逻辑服务器发送,该更新后的逻辑服务器的配置信息包括该备份缓存服务器的IP地址,该备份缓存服务器的IP地址用于该逻辑服务器重建连接池。
本发明实施例第四方面提供一种逻辑服务器,可以包括:
读取模块,用于定期读取该逻辑服务器的当前配置信息;
建立模块,用于若该当前配置信息与上次读取的配置信息不同,则该逻辑服务器根据该当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。
从以上技术方案可以看出,本发明实施例具有以下优点:
在本发明实施例中,管理服务器获取故障缓存服务器的IP地址,该故障缓存服务器的IP地址是监控管理器确定的;该管理服务器将该故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;该管理服务器根据该备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;该管理服务器将更新后的逻辑服务器的配置信息向逻辑服务器发送,该更新后的逻辑服务器的配置信息包括备份缓存服务器的IP地址,逻辑服务器定期读取该逻辑服务器的当前配置信息;若该当前配置信息与上次读取的配置信息不同,则该逻辑服务器根据该当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。逻辑服务器不需要重启,就可以根据备份缓存服务器的IP地址与备份缓存服务器重建连接池;进一步的,管理服务器对逻辑服务器的配置信息进行集成管理,可以自动的获取故障缓存服务器的IP地址,并将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址,因为从缓存服务器发生故障,到最后重建连接池,都是设备自动完成的,不需要人为的去替换备份缓存服务器之类的操作,所以,花费的时间比较少,并且,因为逻辑服务器不需要重启,就可重建连接池,提高了系统的可用率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,还可以根据这些附图获得其它的附图。
图1为本发明实施例中游戏服务器系统架构的一个示意图;
图2为本发明实施例中故障处理的方法的一个实施例示意图;
图3为本发明实施例中所应用的一个场景示意图;
图4为本发明实施例中具体的一个流程示意图;
图5为本发明实施例中管理服务器的一个实施例示意图;
图6为本发明实施例中管理服务器的另一个实施例示意图;
图7为本发明实施例中逻辑服务器的一个实施例示意图;
图8为本发明实施例中逻辑服务器的另一个实施例示意图;
图9为本发明实施例中监控服务器的一个实施例示意图;
图10为本发明实施例中管理服务器的另一个实施例示意图;
图11为本发明实施例中逻辑服务器的另一个实施例示意图;
图12为本发明实施例中监控服务器的另一个实施例示意图。
具体实施方式
本发明实施例提供了一种故障处理的方法、管理服务器以及逻辑服务器,用于降低故障处理的时间,以及提高系统的可用率。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,都应当属于本发明保护的范围。
本发明技术方案主要应用的是游戏服务器系统,如图1所示,为游戏服务器系统架构的一个示意图。其中,游戏服务器系统通常包括逻辑层、缓存cache层和数据层。cache层出现故障,如何快速的恢复,提高系统的可用率,本发明实施例主要就是为了解决这个问题。实现原理:游戏服务器系统中的逻辑层服务器启动一个线程进行cache服务器异常状态检查,当监控服务器发现cache服务器发生故障,定时任务将逻辑层cache相关的配置修改为备份cache服务器的配置信息,逻辑层服务器不用重启就可以完成与备份cache服务器的连接池重建,不影响用户体验的情况下进行故障自动处理。
下面对本发明技术方案中所用到的一些缩略语和关键术语进行定义:
Memcached:是一个高性能的分布式内存对象缓存系统,用于动态网页Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon)是用C语言写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程进行通信。
连接池:连接池技术的核心思想是连接复用,通过建立一个数据库连接池以及一套连接使用、分配、管理策略,使得该连接池中的连接可以得到高效、安全的复用,避免了数据库连接频繁建立、关闭的开销。另外,由于对JDBC(Java Data Base Connectivity java,数据库连接)中的原始连接进行了封装,从而方便了数据库应用对于连接的使用(特别是对于事务处理),提高了获取数据库连接效率,也正是因为这个封装层的存在,隔离了应用的本身的处理逻辑和具体数据库访问逻辑,使应用本身的复用成为可能。连接池主要由三部分组成:连接池的建立、连接池中连接的使用管理、连接池的关闭。
下面以实施例的方式对本发明技术方案做进一步的说明,如图2所示,为本发明实施例中故障处理的方法的一个实施例示意图,包括:
201、监控服务器向缓存服务器发送数据包;
在本发明实施例中,监控服务器向缓存服务器发送数据包;监控服务器可以对故障机进行监控,例如,监控服务器每隔一定的周期(如3分钟)对memcache服务器进行ping一定数量(如100个)数据包,用来监控memcache服务器是否发生故障。
202、若监控服务器在预置时长内,未收到缓存服务器发送的反馈信息,则监控服务器确定缓存服务器发生故障,反馈信息指示缓存服务器已接收数据包;
在本发明实施例中,监控服务器向缓存服务器发送数据包之后,若监控服务器在预置时长内,未收到缓存服务器发送的反馈信息,则监控服务器确定缓存服务器发生故障,反馈信息指示缓存服务器已接收数据包。
或者,监控服务器判断向memcache服务器发送的数据包的丢包率是否大于预置阈值,若大于,则监控服务器可以确定该memcache服务器发生故障。例如,监控服务器确定的丢包率为100%,可以判断memcache服务器故障,这里的丢包率可以为一个预置阈值,监控服务器将故障机器的内网IP(Internet Protocol,互联网协议)过滤保存到运营数据库。
应理解,这里的缓存服务器可以简称为memcache服务器或者cache层服务器。
203、监控服务器将故障缓存服务器的IP地址保存;
在本发明实施例中,监控服务器确定上述的缓存服务器发生故障后,可以将故障缓存服务器的IP地址保存。具体的,监控服务器可以将故障memcache服务器的内网IP地址保存在运营数据库。
需要说明的是,在本发明实施例中,步骤201-203是可选的步骤。
204、管理服务器获取故障缓存服务器的IP地址,故障缓存服务器的IP地址是监控管理器确定的;
在本发明实施例中,管理服务器获取故障缓存服务器的IP地址,故障缓存服务器的IP地址是监控管理器确定的。管理服务器可以实时的,也可以周期性的从运营数据库中拉取故障缓存服务器的IP地址。
需要说明的是,管理服务器初始的时候,保存有每个逻辑服务器的配置信息,进行集成式管理。其中,每个逻辑服务器因为与缓存服务器进行交互,所以,每个逻辑服务器的配置信息也包括与进行交互的缓存服务器相关的配置文件,比如memcache的内网IP地址、端口信息等,一般都会采用hash取模的方式配置多台memcache服务器,保证有足够的cache容量。
即管理服务器管理所有的逻辑层服务器,包括逻辑服务器的进程、配置文件、工具脚本等信息。本方案通常会准备大于2台的备份memcache服务器,备机正常起动memcache进程。memcahe备机的IP地址信息保存到数据库里。管理服务器定时任务可以每隔1分钟从监控管理器拉取故障memcache服务器的内网IP地址。
205、管理服务器将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;
在本发明实施例中,管理服务器获取故障缓存服务器的IP地址之后,管理服务器将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。具体的,可以包括:管理服务器确定故障缓存服务器的IP地址是否在逻辑服务器的配置信息中;若在,则管理服务器将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。或者,还可以包括:若故障缓存服务器的IP地址合法,则管理服务器将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
若备份缓存服务器有多个,则可以随机的选择一个备份缓存服务器替换故障缓存服务器。也可以对备份缓存服务器的存储空间进行判断,当存储空间大于预置阈值的时候,才可以将故障缓存服务器的IP地址替换为该备份缓存服务器的IP地址;或者,管理服务器还可以对故障缓存服务器的IP地址进行判断,确定是否合法,以及管理服务器判断故障缓存服务器的IP地址是否在保存的逻辑服务器的配置信息中,若保存的逻辑服务器的配置信息中包括故障缓存服务器的IP地址,那么,管理服务器将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
即如果拉到的故障缓存服务器的IP地址合法,并且是逻辑服务器配置文件中的memcache IP,那么,定时任务会将逻辑服务器配置文件中故障服务器的IP替换成memcache备机信息中的一个IP,并将备份缓存服务器IP从备份信息表中去除。这一切处理都是服务器任务作业自动执行的,没有人为参于,故障memcache服务器配置替换完成。
206、管理服务器根据备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;
在本发明实施例中,管理服务器将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址之后,管理服务器根据备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新。
即管理服务器对保存的逻辑服务器的配置信息进行修改,因为之前保存的与逻辑服务器交互的缓存服务器发省故障,如果替换成备份服务器的话,那么,对应的逻辑服务器的配置信息也需要修改,即将保存的逻辑服务器的配置信息修改为与备份缓存服务器相关的一些信息,例如与备份缓存服务器进行通信的内网IP地址、端口信息等。
进一步的,管理服务器将备份缓存服务器的IP地址从备份信息列表中删除。因为,该备份缓存服务器已经作为正常通信的服务器进行通信,需要从备份信息列表中删除,不然,会造成下次出现故障的时候,若还是替换的是该备份缓存服务器,那么,可能会出现存储空间不足、或者业务通信的矛盾、不兼容等问题。
207、管理服务器将更新后的逻辑服务器的配置信息发送至逻辑服务器;
在本发明实施例中,步骤207可以包括步骤a和步骤b,如下所示:
a、管理服务器将更新后的逻辑服务器的配置信息向逻辑服务器发送,更新后的逻辑服务器的配置信息包括备份缓存服务器的IP地址,备份缓存服务器的IP地址用于逻辑服务器重建连接池;
b、逻辑服务器接收管理服务器发送的更新后的逻辑服务器的配置信息,更新后的逻辑服务器的配置信息包括备份缓存服务器的IP地址。
在本发明实施例中,管理服务器根据备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新之后,管理服务器将更新后的逻辑服务器的配置信息向逻辑服务器发送,更新后的逻辑服务器的配置信息包括备份缓存服务器的IP地址,备份缓存服务器的IP地址用于逻辑服务器重建连接池。逻辑服务器接收管理服务器发送的更新后的逻辑服务器的配置信息,更新后的逻辑服务器的配置信息包括备份缓存服务器的IP地址。
208、逻辑服务器定期读取逻辑服务器的当前配置信息;
在本发明实施例中,逻辑服务器会周期性的读取逻辑服务器的当前配置信息。应理解,步骤207和208的时序不做限定。
209、若当前配置信息与上次读取的配置信息不同,则逻辑服务器根据当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。
在本发明实施例中,管理服务器将更新后的逻辑服务器的配置信息发送至逻辑服务器之后,若当前配置信息与上次读取的配置信息不同,则逻辑服务器根据当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。
进一步的,若备份缓存服务器未保存数据,则逻辑服务器从数据库中读取目标数据;逻辑服务器将目标数据保存在备份缓存服务器中。具体的,逻辑服务器将目标数据保存在备份缓存服务器中,可以包括:逻辑服务器将目标数据通过以关键字对应值的形式,即以key对应的value形式保存在备份缓存服务器中。
示例性的,逻辑服务器关于memcache服务器相关的配置文件发生了变化,故障memcache服务器IP已被替换为memcache备份服务器IP,但此时新的加入备份memcache服务器并没生效,逻辑服务器并没有与memcache服务器重建连接池。所以需要修改逻辑服务器逻辑,逻辑服务器启动之后,启动一个线程,可以是周期性的(每隔5秒钟),进行一次memcache服务器读取,一旦发现读取异常,逻辑层服务器与memcache服务器重建连接池。这样逻辑服务器与新的memcache服务器建立起了新的连接池,逻辑服务器去新的memcahe服务器读取数据,如果数据不存在,则直接从db(Database,数据库)中读取,并可以以key对应的value形式将查询结果存储到新的memcache服务器的缓存数据中,然后将查询的结果返回逻辑服务器,memcahce服务器故障彻底解决,业务恢复正常。
在本发明实施例中,逻辑服务器接收管理服务器发送的更新后的逻辑服务器的配置信息,更新后的逻辑服务器的配置信息包括备份缓存服务器的IP地址;逻辑服务器定期读取该逻辑服务器的当前配置信息;若该当前配置信息与上次读取的配置信息不同,则该逻辑服务器根据该当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。逻辑服务器不需要重启,就可以根据备份缓存服务器的IP地址与备份缓存服务器重建连接池;进一步的,管理服务器对逻辑服务器的配置信息进行集成管理,可以自动的获取故障缓存服务器的IP地址,并将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址,因为从缓存服务器发生故障,到最后重建连接池,都是设备自动完成的,不需要人为的去替换备份缓存服务器之类的操作,所以,花费的时间比较少,并且,因为逻辑服务器不需要重启,就可重建连接池,提高了系统的可用率。
即本发明实施例可以提高系统的可用率,加快故障处理时间,不用重启逻辑层服务器即可完成故障memcache服务器的替换,给用户很好的体验。需要说明的是,还可以用开源的软件memagent搭建memcache高可用集群,也可以达到本发明实施例同样的效果。
下面以实际应用场景对本发明实施例进行具体说明,如下所示:
如图3所示,为本发明实施例所应用的场景示意图,例如,本发明实施例可以用在手机游戏偶像梦幻祭的cache层服务器的memcached故障自动处理上,来保证系统的可用性。
在图3所示的示意图中,包括用户、逻辑服务器、memcache服务器、备份memcache服务器(memcache bak服务器)、管理服务器、监控服务器、运营数据库和业务数据库。其中,管理服务器对所有的逻辑服务器可进行集中式管理,保存每个逻辑服务器的配置文件信息。逻辑服务器与memcache服务器进行交互通信;监控服务器对周期性的对每个memcache服务器进行监控,检测是否发生故障;运营数据库可以保存发生故障的memcache服务器的IP地址,业务数据库可以保存通信数据,使得逻辑服务器在memcache服务器中未保存数据的时候进行读写。
在图3中,用户有n个,逻辑服务器有n个,memcache服务器有n个,备份memcache服务器有2个,一般来说,备份memcache服务器会大于等于两个,管理服务器、监控服务器、运营数据库和业务数据库各一个。如图4所示,为本发明实施例的一个流程示意图。监控服务器周期性(例如每隔3分钟)的向各个memcache服务器发送数据包(例如ping100个数据包),如果丢包率为100%,那么,监控服务器判断该机器故障,这里假设发生故障的memcache服务器为memcache服务器1,监控服务器可以将故障机器(memcache服务器1)的内网IP地址过滤保存到运营数据库。
管理服务器可以从运营数据库中获取故障机器,即memcache服务器1的内网IP地址,先可以判断memcache服务器1的内网IP地址是否在预先保存的逻辑服务器的配置文件信息中,若在,那么,管理服务器可以将故障memcache服务器1的IP地址替换为备份memcache服务器1或者备份memcache服务器2的IP地址;若不在,那么,就认为发生故障的不是memcache服务器了,管理服务器就不能替换为备份memcache服务器。
若将故障memcache服务器的IP地址替换为备份memcache服务器1的IP地址之后,管理服务器可以将之前保存的逻辑服务器的配置文件信息进行修改,即之前保存的逻辑服务器的配置文件信息是与发生故障的memcache服务器的一些信息,现在既然将故障memcache服务器替换了,那么,对应的配置文件信息也要发生更新,即管理服务器将逻辑服务器的配置文件信息更新为与备份memcache服务器1相关的信息,例如备份memcache服务器1的内网IP地址,端口信息等。
管理服务器再将更新后的逻辑服务器的配置文件信息向逻辑服务器发送,每个逻辑服务器收到更新后的逻辑服务器的配置文件信息之后,逻辑服务器一直在周期性的向memcache服务器进行读取,当接收更新后的逻辑服务器的配置文件信息后,进行读取的时候,会发现读取异常,因为发现不是之前的memcache服务器1了,变成了备份memcache服务器1。那么,逻辑服务器需要与备份memcache服务器1建立连接池,才能进行数据通信。逻辑服务器不需要重启,就可以重建与备份memcache服务器1的连接池,所以,提高了系统的可用率。进一步的,逻辑服务器与备份memcache服务器1建立连接池后,向备份memcache服务器1进行数据读取,若备份memcache服务器1不存在,则从业务数据库中读取数据,并将该数据缓存在memcache服务器中,下次读取该数据的时候就方便很多,再将读取结果返回到逻辑服务器;memcahce服务器故障彻底解决,业务恢复正常。
上面对本发明实施例中故障处理的方法进行说明,下面对本发明实施例中管理服务器进行说明,如图5所示,为本发明实施例中管理服务器的一个实施例示意图,可以包括:
获取模块501,用于获取故障缓存服务器的IP地址,故障缓存服务器的IP地址是监控管理器确定的;
替换模块502,用于将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;
更新模块503,用于根据备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;
发送模块504,用于将更新后的逻辑服务器的配置信息向逻辑服务器发送,更新后的逻辑服务器的配置信息包括备份缓存服务器的IP地址,备份缓存服务器的IP地址用于逻辑服务器重建连接池。
可选的,在本发明的一些实施例中,
替换模块502,具体用于若故障缓存服务器的IP地址合法,则替换模块将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
可选的,在本发明的一些实施例中,
替换模块502,具体用于确定故障缓存服务器的IP地址是否在逻辑服务器的配置信息中;若在,则替换模块将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
可选的,在本发明的一些实施例中,在上述图5所示的基础上,如图6所示,为本发明实施例中管理服务器的另一个示意图,管理服务器还可以包括:
删除模块505,用于将备份缓存服务器的IP地址从备份信息列表中删除。
如图7所示,为本发明实施例中逻辑服务器的一个实施例示意图,可以包括:
读取模块701,用于定期读取逻辑服务器的当前配置信息;
建立模块702,用于若当前配置信息与上次读取的配置信息不同,则逻辑服务器根据当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。
可选的,在本发明的一些实施例中,在上述图7所示的基础上,如图8所示,为本发明实施例中逻辑服务器的另一个示意图,逻辑服务器还可以包括:
读取模块703,用于若备份缓存服务器未保存数据,则读取模块从数据库中读取目标数据;
保存模块704,用于将目标数据保存在备份缓存服务器中。
可选的,在本发明的一些实施例中,
保存模块704,具体用于将目标数据通过以关键字对应值的形式保存在备份缓存服务器中。
如图9所示,为本发明实施例中监控服务器的一个实施例示意图,可以包括:
发送模块901,用于向缓存服务器发送数据包;
确定模块902,用于若监控服务器在预置时长内,未收到缓存服务器发送的反馈信息,则确定模块确定缓存服务器发生故障,反馈信息指示缓存服务器已接收数据包;
保存模块903,用于将故障缓存服务器的IP地址保存。
如图10所示,为本发明实施例中管理服务器的一个实施例示意图。
该管理服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1022(例如,一个或一个以上处理器)和存储器1032,一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中,存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对管理服务器中的一系列指令操作。更进一步地,中央处理器1022可以设置为与存储介质1030通信,在管理服务器1000上执行存储介质1030中的一系列指令操作。
管理服务器还可以包括一个或一个以上电源1026,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1058,和/或,一个或一个以上操作系统1041,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
在本发明实施例中,中央处理器1022,还用于将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;根据备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;
有线或无线网络接口1050,用于获取故障缓存服务器的IP地址,故障缓存服务器的IP地址是监控管理器确定的;将更新后的逻辑服务器的配置信息向逻辑服务器发送,更新后的逻辑服务器的配置信息包括备份缓存服务器的IP地址,备份缓存服务器的IP地址用于逻辑服务器重建连接池。
可选的,在本发明的一些实施例中,
中央处理器1022,具体用于若故障缓存服务器的IP地址合法,则替换模块将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
可选的,在本发明的一些实施例中,
中央处理器1022,具体用于确定故障缓存服务器的IP地址是否在逻辑服务器的配置信息中;若在,则替换模块将故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
可选的,在本发明的一些实施例中,
中央处理器1022,还用于将备份缓存服务器的IP地址从备份信息列表中删除。
如图11所示,为本发明实施例中逻辑服务器的一个实施例示意图。
该逻辑服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1122(例如,一个或一个以上处理器)和存储器1132,一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中,存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对逻辑服务器中的一系列指令操作。更进一步地,中央处理器1122可以设置为与存储介质1130通信,在逻辑服务器1100上执行存储介质1130中的一系列指令操作。
逻辑服务器还可以包括一个或一个以上电源1126,一个或一个以上有线或无线网络接口1150,一个或一个以上输入输出接口1158,和/或,一个或一个以上操作系统1141,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
在本发明实施例中,中央处理器1122,还用于定期读取逻辑服务器的当前配置信息;若当前配置信息与上次读取的配置信息不同,则逻辑服务器根据当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。
可选的,在本发明的一些实施例中,
中央处理器1122,还用于若备份缓存服务器未保存数据,则读取模块从数据库中读取目标数据;将目标数据保存在备份缓存服务器中。
可选的,在本发明的一些实施例中,
中央处理器1122,具体用于将目标数据通过以关键字对应值的形式保存在备份缓存服务器中。
如图12所示,为本发明实施例中监控服务器的一个实施例示意图。
该监控服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1222(例如,一个或一个以上处理器)和存储器1232,一个或一个以上存储应用程序1242或数据1244的存储介质1230(例如一个或一个以上海量存储设备)。其中,存储器1232和存储介质1230可以是短暂存储或持久存储。存储在存储介质1230的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对监控服务器中的一系列指令操作。更进一步地,中央处理器1222可以设置为与存储介质1230通信,在监控服务器1200上执行存储介质1230中的一系列指令操作。
监控服务器还可以包括一个或一个以上电源1226,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1258,和/或,一个或一个以上操作系统1241,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
在本发明实施例中,有线或无线网络接口1250,还用于向缓存服务器发送数据包;
中央处理器1222,还用于若监控服务器在预置时长内,未收到缓存服务器发送的反馈信息,则确定模块确定缓存服务器发生故障,反馈信息指示缓存服务器已接收数据包;将故障缓存服务器的IP地址保存。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (14)

1.一种故障处理的方法,其特征在于,包括:
管理服务器获取故障缓存服务器的IP地址,所述故障缓存服务器的IP地址是监控管理器确定的;
所述管理服务器将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;
所述管理服务器根据所述备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;
所述管理服务器将更新后的逻辑服务器的配置信息向逻辑服务器发送,所述更新后的逻辑服务器的配置信息包括所述备份缓存服务器的IP地址,所述备份缓存服务器的IP地址用于所述逻辑服务器重建连接池。
2.根据权利要求1所述的方法,其特征在于,所述管理服务器将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址,包括:
若所述故障缓存服务器的IP地址合法,则所述管理服务器将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
3.根据权利要求1所述的方法,其特征在于,所述管理服务器将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址,包括:
所述管理服务器确定所述故障缓存服务器的IP地址是否在逻辑服务器的配置信息中;
若在,则所述管理服务器将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
4.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:
所述管理服务器将所述备份缓存服务器的IP地址从备份信息列表中删除。
5.一种故障处理的方法,其特征在于,包括:
逻辑服务器定期读取所述逻辑服务器的当前配置信息;
若所述当前配置信息与上次读取的配置信息不同,则所述逻辑服务器根据所述当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述备份缓存服务器未保存数据,则所述逻辑服务器从数据库中读取目标数据;
所述逻辑服务器将所述目标数据保存在所述备份缓存服务器中。
7.根据权利要求6所述的方法,其特征在于,所述逻辑服务器将所述目标数据保存在所述备份缓存服务器中,包括:
所述逻辑服务器将所述目标数据通过以关键字对应值的形式保存在所述备份缓存服务器中。
8.一种管理服务器,其特征在于,包括:
获取模块,用于获取故障缓存服务器的IP地址,所述故障缓存服务器的IP地址是监控管理器确定的;
替换模块,用于将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址;
更新模块,用于根据所述备份缓存服务器的IP地址,对逻辑服务器的配置信息进行更新;
发送模块,用于将更新后的逻辑服务器的配置信息向逻辑服务器发送,所述更新后的逻辑服务器的配置信息包括所述备份缓存服务器的IP地址,所述备份缓存服务器的IP地址用于所述逻辑服务器重建连接池。
9.根据权利要求8所述的方法,其特征在于,
所述替换模块,具体用于若所述故障缓存服务器的IP地址合法,则所述替换模块将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
10.根据权利要求8所述的管理服务器,其特征在于,
所述替换模块,具体用于确定所述故障缓存服务器的IP地址是否在逻辑服务器的配置信息中;若在,则所述替换模块将所述故障缓存服务器的IP地址替换为备份缓存服务器的IP地址。
11.根据权利要求8-10任一所述的管理服务器,其特征在于,所述管理服务器还包括:
删除模块,用于将所述备份缓存服务器的IP地址从备份信息列表中删除。
12.一种逻辑服务器,其特征在于,包括:
读取模块,用于定期读取所述逻辑服务器的当前配置信息;
建立模块,用于若所述当前配置信息与上次读取的配置信息不同,则所述逻辑服务器根据所述当前配置信息包括的备份缓存服务器的IP地址与对应的备份缓存服务器建立连接池。
13.根据权利要求12所述的逻辑服务器,其特征在于,所述逻辑服务器还包括:
读取模块,用于若所述备份缓存服务器未保存数据,则所述读取模块从数据库中读取目标数据;
保存模块,用于将所述目标数据保存在所述备份缓存服务器中。
14.根据权利要求13所述的逻辑服务器,其特征在于,
所述保存模块,具体用于将所述目标数据通过以关键字对应值的形式保存在所述备份缓存服务器中。
CN201710121123.4A 2017-03-02 2017-03-02 一种故障处理的方法、管理服务器以及逻辑服务器 Active CN106603319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710121123.4A CN106603319B (zh) 2017-03-02 2017-03-02 一种故障处理的方法、管理服务器以及逻辑服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710121123.4A CN106603319B (zh) 2017-03-02 2017-03-02 一种故障处理的方法、管理服务器以及逻辑服务器

Publications (2)

Publication Number Publication Date
CN106603319A true CN106603319A (zh) 2017-04-26
CN106603319B CN106603319B (zh) 2020-10-09

Family

ID=58588198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710121123.4A Active CN106603319B (zh) 2017-03-02 2017-03-02 一种故障处理的方法、管理服务器以及逻辑服务器

Country Status (1)

Country Link
CN (1) CN106603319B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107243156A (zh) * 2017-06-30 2017-10-13 珠海金山网络游戏科技有限公司 一种大型分布式网络游戏服务器系统
CN108600016A (zh) * 2018-04-27 2018-09-28 佛山市日日圣科技有限公司 一种游戏服务器故障处理方法及处理装置
CN109962991A (zh) * 2017-12-26 2019-07-02 中国移动通信集团四川有限公司 物联网故障处理方法、装置、设备及介质
CN113206760A (zh) * 2021-04-30 2021-08-03 杭州迪普科技股份有限公司 用于vrf资源分配的接口配置更新方法、装置与电子设备
CN113453340A (zh) * 2020-03-24 2021-09-28 阿里巴巴集团控股有限公司 服务方法、服务器集群以及LoRaWAN网络系统
CN113992696A (zh) * 2020-07-10 2022-01-28 中国电信股份有限公司 memcache缓存系统、其同步方法及计算机可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101196852A (zh) * 2008-01-03 2008-06-11 杭州华三通信技术有限公司 分布式缓存方法及其系统、以及缓存设备和非缓存设备
US20090063394A1 (en) * 2007-08-27 2009-03-05 International Business Machines Corporation Apparatus and method for streamlining index updates in a shared-nothing architecture
CN101562543A (zh) * 2009-05-25 2009-10-21 阿里巴巴集团控股有限公司 一种缓存数据的处理方法、处理系统和装置
CN103152191A (zh) * 2011-12-06 2013-06-12 中国移动通信集团福建有限公司 一种物联网业务网关数据处理方法和系统
CN103973424A (zh) * 2014-05-22 2014-08-06 乐得科技有限公司 缓存系统中的故障解决方法和设备
CN105867837A (zh) * 2015-12-02 2016-08-17 乐视体育文化产业发展(北京)有限公司 一种分布式高速缓存系统中的客户端配置更新方法、设备及系统
CN105933407A (zh) * 2016-04-20 2016-09-07 中国银联股份有限公司 一种实现Redis集群高可用的方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090063394A1 (en) * 2007-08-27 2009-03-05 International Business Machines Corporation Apparatus and method for streamlining index updates in a shared-nothing architecture
CN101196852A (zh) * 2008-01-03 2008-06-11 杭州华三通信技术有限公司 分布式缓存方法及其系统、以及缓存设备和非缓存设备
CN101562543A (zh) * 2009-05-25 2009-10-21 阿里巴巴集团控股有限公司 一种缓存数据的处理方法、处理系统和装置
CN103152191A (zh) * 2011-12-06 2013-06-12 中国移动通信集团福建有限公司 一种物联网业务网关数据处理方法和系统
CN103973424A (zh) * 2014-05-22 2014-08-06 乐得科技有限公司 缓存系统中的故障解决方法和设备
CN105867837A (zh) * 2015-12-02 2016-08-17 乐视体育文化产业发展(北京)有限公司 一种分布式高速缓存系统中的客户端配置更新方法、设备及系统
CN105933407A (zh) * 2016-04-20 2016-09-07 中国银联股份有限公司 一种实现Redis集群高可用的方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107243156A (zh) * 2017-06-30 2017-10-13 珠海金山网络游戏科技有限公司 一种大型分布式网络游戏服务器系统
CN109962991A (zh) * 2017-12-26 2019-07-02 中国移动通信集团四川有限公司 物联网故障处理方法、装置、设备及介质
CN109962991B (zh) * 2017-12-26 2022-06-14 中国移动通信集团四川有限公司 物联网故障处理方法、装置、设备及介质
CN108600016A (zh) * 2018-04-27 2018-09-28 佛山市日日圣科技有限公司 一种游戏服务器故障处理方法及处理装置
CN113453340A (zh) * 2020-03-24 2021-09-28 阿里巴巴集团控股有限公司 服务方法、服务器集群以及LoRaWAN网络系统
CN113992696A (zh) * 2020-07-10 2022-01-28 中国电信股份有限公司 memcache缓存系统、其同步方法及计算机可读存储介质
CN113206760A (zh) * 2021-04-30 2021-08-03 杭州迪普科技股份有限公司 用于vrf资源分配的接口配置更新方法、装置与电子设备
CN113206760B (zh) * 2021-04-30 2022-06-24 杭州迪普科技股份有限公司 用于vrf资源分配的接口配置更新方法、装置与电子设备

Also Published As

Publication number Publication date
CN106603319B (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
CN106603319A (zh) 一种故障处理的方法、管理服务器以及逻辑服务器
US11120044B2 (en) System and method for maintaining a master replica for reads and writes in a data store
US20200228393A1 (en) System and method for data replication using a single master failover protocol
CN105357296B (zh) 一种Docker云平台下弹性缓存系统
CN109831500B (zh) Kubernetes集群中配置文件与Pod的同步方法
CN104580226B (zh) 一种共享会话数据的系统和方法
US9984140B1 (en) Lease based leader election system
CN104715001B (zh) 用于对数据处理系统的集群中的共享资源执行写入操作的方法和系统
CN109639794A (zh) 一种有状态集群恢复方法、装置、设备及可读存储介质
CN103677967B (zh) 一种数据库的远程数据服务系统及任务调度方法
CN103842969B (zh) 信息处理系统
DE112011103666B4 (de) Speicherverwaltung in Cluster-Datenverarbeitungssystemen
US9489434B1 (en) System and method for replication log branching avoidance using post-failover rejoin
EP3276492B1 (en) Failover and recovery for replicated data instances
CN106936623A (zh) 分布式缓存系统及缓存集群的管理方法
US20160188426A1 (en) Scalable distributed data store
WO2021103499A1 (zh) 一种基于多活数据中心的流量切换方法及装置
CN103870393B (zh) 缓存管理方法及系统
CN106874136A (zh) 一种存储系统的故障处理方法及装置
CN106919346A (zh) 一种基于clvm的共享存储虚拟化实现方法
CN102523101A (zh) 机器管理器服务结构
CN109408115A (zh) 一种基于容器环境中迁移对象的方法及计算系统
CN103973725A (zh) 一种分布式协同方法和协同器
CN107171870A (zh) 一种双机热备份方法及装置
CN107197012A (zh) 一种基于元数据管理系统的服务发布及监管系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant