CN112887432A - 分布式系统重建运维方法、运维节点及系统 - Google Patents

分布式系统重建运维方法、运维节点及系统 Download PDF

Info

Publication number
CN112887432A
CN112887432A CN202110352598.0A CN202110352598A CN112887432A CN 112887432 A CN112887432 A CN 112887432A CN 202110352598 A CN202110352598 A CN 202110352598A CN 112887432 A CN112887432 A CN 112887432A
Authority
CN
China
Prior art keywords
distributed system
time
timeout time
current data
data capacity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110352598.0A
Other languages
English (en)
Other versions
CN112887432B (zh
Inventor
颜高飞
夏龙飞
张家宇
张远征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110352598.0A priority Critical patent/CN112887432B/zh
Publication of CN112887432A publication Critical patent/CN112887432A/zh
Application granted granted Critical
Publication of CN112887432B publication Critical patent/CN112887432B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供了一种分布式系统重建运维方法、运维节点及系统,可用于人工智能技术领域,所述方法包括:采集所述分布式系统的当前数据容量;根据所述当前数据容量确定所述分布式系统重建所需的展期时间,根据所述展期时间调整所述分布式系统与客户端的会话超时时间;将所述会话超时时间传输至所述分布式系统以使所述分布式系统将默认超时时间替换为所述会话超时时间,本发明可避免分布式系统在重建过程中由于服务器之间同步全量数据导致同步耗时过大而影响客户端的交易。

Description

分布式系统重建运维方法、运维节点及系统
技术领域
本发明涉及互联网技术领域,特别涉及人工智能技术领域,尤其涉及一种分布式系统重建运维方法、运维节点及系统。
背景技术
目前的应用软件的服务器通常采用分布式系统。例如,在以dubbo为代表的分布式服务框架中,主流注册中心为zookeeper分布式系统。Zookeeper是一种分布式协调系统,可应用于实现注册中心、配置中心、分布式锁、分布式队列等。zookeeper以其高可用性、可靠性、使用便利性等优势成为众多分布式服务框架的首选注册中心。Zookeeper中的服务器与应用的客户端建立长连接后,会生成会话进行数据交互。该会话通常具有超时时间,当服务器超过该超时时间没有反馈信息,则客户端可能会报错退出当前任务。
随着分布式服务化推广,分布式系统的服务注册量和订阅量日益增长,zookeeper系统中服务器之间同步压力逐渐增大。尤其是在作为注册中心的系统服务器自身运维时或系统服务器故障后恢复时,zookeeper服务器之间需要同步全量数据。同步的数据量过大可能导致部分zookeeper服务器同步数据耗时过大,连接至注册中心服务器的会话经常由于超时退出,存在影响业务交易的风险。
发明内容
本发明的一个目的在于提供一种分布式系统重建运维方法,避免分布式系统在重建过程中由于服务器之间同步全量数据导致同步耗时过大而影响客户端的交易。本发明的另一个目的在于提供一种运维节点。本发明的再一个目的在于提供一种分布式系统。本发明的还一个目的在于提供一种计算机设备。本发明的还一个目的在于提供一种可读介质。
为了达到以上目的,本发明一方面公开了一种分布式系统重建运维方法,包括:
采集所述分布式系统的当前数据容量;
根据所述当前数据容量确定所述分布式系统重建所需的展期时间,根据所述展期时间调整所述分布式系统与客户端的会话超时时间;
将所述会话超时时间传输至所述分布式系统以使所述分布式系统将默认超时时间替换为所述会话超时时间。
优选的,进一步包括:
接收所述分布式系统在重建之前传输的报警信息以根据所述报警信息获取所述分布式系统的当前数据容量。
优选的,所述根据所述当前数据容量确定所述分布式系统重建所需的展期时间具体包括:
根据所述当前数据容量以及容量与展期时间的对应关系确定所述当前数据容量对应的展期时间。
优选的,所述根据所述展期时间调整所述分布式系统与客户端的会话超时时间具体包括:
将所述展期时间和默认超时时间相加得到会话超时时间。
优选的,进一步包括:
每隔预定时间间隔获取所述分布式系统的同步进度,根据所述同步进度重新确定各服务器的展期时间,并根据重新确定的展期时间调整各服务器的会话超时时间直至所述展期时间为0。
本发明还公开了一种分布式系统重建运维方法,包括:
接收运维节点传输的会话超时时间,将默认超时时间替换为所述会话超时时间,其中,所述会话超时时间为所述运维节点采集所述分布式系统的当前数据容量,根据所述当前数据容量确定所述分布式系统重建所需的展期时间,并根据所述展期时间调整得到的所述分布式系统与客户端的会话超时时间。
优选的,所述采集所述分布式系统的当前数据容量具体包括:
通过MNTR命令采集分布式系统的当前数据容量并存储至数据库,以使所述运维节点从所述数据库获取所述分布式系统的当前数据容量。
优选的,进一步包括:
在所述分布式系统重建之前,传输报警信息至所述运维节点以使所述运维节点根据所述报警信息获取所述分布式系统的当前数据容量。
优选的,所述将默认超时时间替换为所述会话超时时间具体包括:
通过SSTO命令用接收的会话超时时间替换默认超时时间。
本发明还公开了一种运维节点,包括:
数据采集模块,用于采集分布式系统的当前数据容量;
动态调整模块,用于根据所述当前数据容量确定所述分布式系统重建所需的展期时间,根据所述展期时间调整所述分布式系统与客户端的会话超时时间;
信息发送模块,用于将所述会话超时时间传输至所述分布式系统以使所述分布式系统将默认超时时间替换为所述会话超时时间。
本发明还公开了一种分布式系统,被配置为接收运维节点传输的会话超时时间,将默认超时时间替换为所述会话超时时间,其中,所述会话超时时间为所述运维节点采集所述分布式系统的当前数据容量,根据所述当前数据容量确定所述分布式系统重建所需的展期时间,并根据所述展期时间调整得到的所述分布式系统与客户端的会话超时时间。
本发明还公开了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,
所述处理器执行所述程序时实现如上所述方法。
本发明还公开了一种计算机可读介质,其上存储有计算机程序,
该程序被处理器执行时实现如上所述方法。
本发明通过采集分布式系统的当前数据容量,根据该当前数据容量可以预测分布式系统重建过程所需的时间,根据该重建所需的时间确定对应的展期时间。进一步根据该展期时间对当前分布式系统与客户端的超时时间进行展期以延长会话超时时间,即根据该展期时间重新确定会话超时时间。然后将该会话超时时间传输给分布式系统以使分布式系统采用调整后的会话超时时间,避免分布式系统在重建过程中由于服务器之间同步全量数据导致同步耗时过大而影响客户端的交易。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明分布式系统重建运维方法一个具体实施例的流程图;
图2示出本发明分布式系统重建运维方法一个具体实施例采集当前数据容量的示意图;
图3示出本发明分布式系统重建运维方法一个具体实施例系统重建的示意图;
图4示出本发明运维节点一个具体实施例的结构图;
图5示出适于用来实现本发明实施例的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请公开的一种分布式系统重建运维方法、运维节点及系统可用于人工智能技术领域,也可用于除人工智能技术领域之外的任意领域,本申请公开的一种分布式系统重建运维方法、运维节点及系统的应用领域不做限定。
在现有技术中,CAP理论是指一个分布式系统不可能同时满足一致性(C)、可用性(A)和分区容错性(P)这三个基本需求,最多只能同时满足其中两项。其中,一致性是指数据在多台服务器之间保持一致的特性。可用性是指系统提供的服务必须一直处于可用的状态,对于用户的每一次操作请求总是能够在有限的时间内返回结果。分区容错性是指系统在遇到任何网络分区故障的时候,仍然需要能够保证对外提供满足一致性和可用性的服务,除非是整个网络环境都发生了故障。在以dubbo为代表的分布式服务框架中,主流注册中心为zookeeper。zookeeper以其高可用性、可靠性、使用便利性等优势成为众多分布式服务框架的首选注册中心。zookeeper系统为一个典型的CP系统,系统服务器之间实时同步数据以确保各服务器上数据一致性。
在分布式服务系统中,随着分布式服务化推广,服务注册量和订阅量日益增长,zookeeper服务器之间同步压力逐渐增大。尤其是在注册中心系统服务器自身运维时或系统服务器故障后恢复时,zookeeper服务器之间需要同步全量数据。同步的数据量过大可能导致部分zookeeper服务器同步数据耗时过大、影响通过这些服务器连接至注册中心的客户端会话超时,继而存在影响业务交易的风险。其中,zookeeper会话是指zookeeper客户端与服务端建立长连接后,生成会话。会话具有超时时间,目前通常根据长连接心跳更新会话超时时间。
为了解决目前分布式系统在运维或故障后重建过程中由于会话超时对交易带来的影响,本发明提供一种动态调整客户端与服务器的会话超时时间的运维方法,根据分布式系统实时的注册数据量,即当前数据容量,自动对客户端会话进行展期(延长),规避分布式系统在重建过程中由于服务器之间同步全量数据导致同步耗时过大而影响交易的风险。
基于此,根据本发明的一个方面,本实施例公开了一种分布式系统重建运维方法。如图1所示,本实施例中,所述方法包括:
S100:采集所述分布式系统的当前数据容量。
具体的,可通过修改分布式系统中服务器代码的方式使各服务器采集当前数据容量。优选的,可将采集的服务器的当前数据容量存储至数据库中以便于运维节点在系统重建时从该数据库中获取各服务器的当前数据容量。在一个具体例子中,对于zookeeper分布式系统,可在服务器代码中设置mntr命令。服务器可以每隔一分钟通过mntr命令采集自身的当前数据容量,并将该当前数据容量存储至数据库中,例如,如图2所示,可存储至Prometheus中。其中,Prometheus是一个开源的服务监控系统和时间序列数据库。
S200:根据所述当前数据容量确定所述分布式系统重建所需的展期时间,根据所述展期时间调整所述分布式系统与客户端的会话超时时间。
具体的,通过重建时系统leader服务器的当前数据容量确定leader服务器全量数据同步至其他follower服务器所需的数据同步时间,根据该数据同步时间可以对会话超时时间进行展期,从而通过动态调整会话超时时间的方式为分布式系统重建过程提供缓冲时间,以使重建之后的分布式系统对会话进行处理,防止客户端频繁报错导致交易失败。
S300:将所述会话超时时间传输至所述分布式系统以使所述分布式系统将默认超时时间替换为所述会话超时时间。
具体的,可通过修改分布式系统中服务器代码的方式使leader服务器接收到运维节点传输的展期后的会话超时时间后自动将该默认超时时间替换为该会话超时时间。在一个具体例子中,对于zookeeper分布式系统,可在服务器代码中设置ssto命令。leader服务器在接收到运维节点传输的会话超时时间后,通过ssto命令用输入的会话超时时间替换掉预先设置的默认超时时间。
本发明通过采集分布式系统的当前数据容量,根据该当前数据容量可以预测分布式系统重建过程所需的时间,根据该重建所需的时间确定对应的展期时间。进一步根据该展期时间对当前分布式系统与客户端的超时时间进行展期以延长会话超时时间,即根据该展期时间重新确定会话超时时间。然后将该会话超时时间传输给分布式系统以使分布式系统采用调整后的会话超时时间,避免分布式系统在重建过程中由于服务器之间同步全量数据导致同步耗时过大而影响客户端的交易。
在优选的实施方式中,所述方法进一步包括在采集所述分布式系统的当前数据容量,之前:
S000:接收所述分布式系统在重建之前传输的报警信息以根据所述报警信息获取所述分布式系统的当前数据容量。
具体的,可对分布式系统的服务器代码进行改造,使得当一台分布式系统中的服务器出现服务异常、脱离系统或运维等异常情况时,该服务器可向运维节点发送报警信息。从而,运维节点接收到报警信息后确定分布式系统需要重建,需要对会话超时时间进行动态调整,以使分布式系统的重建过程不会导致客户端的交易失败,避免分布式系统在重建过程中由于服务器之间同步全量数据导致同步耗时过大而影响客户端的交易。
需要说明的是,如图3所示,分布式系统的重建过程为:分布式系统的服务器出现异常,系统中的所有服务器重新选举一个服务器作为leader,其他服务器作为follower服务器。在重建时,该leader服务器将当前数据容量对应的全量数据同步至各follower服务器。在此过程中,由于数据量巨大可能导致耗时过大,无法对客户端进行及时反应。本发明中Leader服务器接收到运维节点传输的会话超时时间后将初始设置的默认超时时间替换为该会话超时时间(session),自动对会话进行展期,保障会话涉及的各交易正常进行。
在优选的实施方式中,所述S200根据所述当前数据容量确定所述分布式系统重建所需的展期时间具体包括:
S210:根据所述当前数据容量以及容量与展期时间的对应关系确定所述当前数据容量对应的展期时间。
具体的,可以根据不同的数据容量需要耗费的同步时间来合理设置展期时间。从而,可预先设置不同数据容量与展期时间的对应关系,形成对应关系表。在实际调整时,根据服务器系统的当前数据容量(leader服务器的当前数据容量)从该对应关系表中选择对应的展期时间,实现对会话超时时间的适应化动态调整。表1示出了上述具体例子中不同数据容量对应的展期时间。
表1
Zookeeper当前数据容量 展期时间
<800M 0,无需展期
800M~2G 1分钟
2G~3G 2分钟
3G~5G 5分钟
在优选的实施方式中,所述S200根据所述展期时间调整所述分布式系统与客户端的会话超时时间具体包括:
S220:将所述展期时间和默认超时时间相加得到会话超时时间。
具体的,本发明中,通过展期时间对默认超时时间进行调整,可以通过多种预设的计算方式根据展期时间和默认超时时间得到会话超时时间。在该优选的实施方式中,通过将展期时间和默认超时时间相加得到会话超时时间。例如,在一个具体例子中,分布式系统的当前数据容量为2.5G,即分布式系统中每个服务器上的数据存储量为2.5G,展期时间通过表1可以确定为2分钟。若默认会话时间为10分钟,则在默认会话时间的基础上加上展期时间可得到会话超时时间为12分钟。
在优选的实施方式中,所述方法进一步包括:
S400:每隔预定时间间隔获取所述分布式系统的同步进度,根据所述同步进度重新确定各服务器的展期时间,并根据重新确定的展期时间调整各服务器的会话超时时间直至所述展期时间为0。
具体的,分布式系统的重建过程可能受到多种因素的影响而导致重建所需的时间与预测所需的重建时间不相符合。从而,根据分布式系统的当前数据容量得到的展期时间可能存在不准确的情况。因此,在该优选的实施方式中,每隔预定时间间隔获取分布式系统的数据同步进度,根据数据同步进度重新确定展期时间。优选的,可将未同步完的数据作为系统的当前数据容量,根据该当前数据容量重新确定展期时间,对超时会话时间进行更新。当展期时间为0时,表示重建的数据同步基本上已经完成,分布式系统可以正常与客户端连接进行会话,从而可将会话超时时间恢复为默认超时时间。例如,对于图3的分布式服务器集群,在集群由于故障或升级需要重建时,集群中的各服务器重新选举产生leader服务器,集群中的其他服务器作为follower服务器。在重建过程中,Leader服务器将其上的数据同步至其他follower服务器。其中,一部分follower服务器同步速度快,另一部分follower服务器的同步速度慢。获取各服务器上已同步的数据可确定各服务器的同步进度,可根据同步进度确定是否需要对会话进行展期,即部分服务器已数据同步完成,可正常对客户端的会话进行处理。对于未数据同步完成的服务器,根据未同步的数据预测需要的数据同步时间作为重新确定的展期时间,根据该重新确定的展期时间对会话超时时间进行直至重新确定的展期时间为0,即表示该服务器数据同步结束,重建完成。
通过对本发明和现有技术中的分布式系统进行压测验证得到本发明的分布式系统重建运维方法中作为注册中心的zookeeper系统的性能容量比现有技术中的zookeeper系统提升了6倍以上。具体的,在dubbo服务框架、zookeeper注册中心的分布式系统中进行压测。分批次启动大量的服务提供方、服务消费方注册至注册中心,并进行服务调用。当注册到一定量后,停zookeeper leader节点以重建系统。若重建成功、且无失败交易,表示zookeeper可支撑该注册量,继续增大注册量,重复重建系统过程,以获取当时系统容量上限。若重建失败、或存在交易报错无提供方,表示zookeeper不可支撑该注册量,减少注册量,重复重建系统过程,以获取当时系统容量上限。最终得到的压测结果如表2所示。
表2
可支撑的数据容量 可支撑的服务节点数
现有技术 800M 125W
本发明 >5G >800W
基于相同原理,本实施例还公开了一种分布式系统重建运维方法。本实施例中,所述方法包括:
S500:接收运维节点传输的会话超时时间,将默认超时时间替换为所述会话超时时间,其中,所述会话超时时间为所述运维节点采集所述分布式系统的当前数据容量,根据所述当前数据容量确定所述分布式系统重建所需的展期时间,并根据所述展期时间调整得到的所述分布式系统与客户端的会话超时时间。
在优选的实施方式中,所述S500采集所述分布式系统的当前数据容量具体包括:
S510:通过MNTR命令采集分布式系统的当前数据容量并存储至数据库,以使所述运维节点从所述数据库获取所述分布式系统的当前数据容量。需要说明的是,MNTR命令为本领域技术人员可以根据实际情况进行设置的程序指令,在此不再赘述。
在优选的实施方式中,所述方法进一步包括:
S600:在所述分布式系统重建之前,传输报警信息至所述运维节点以使所述运维节点根据所述报警信息获取所述分布式系统的当前数据容量。
在优选的实施方式中,所述S500将默认超时时间替换为所述会话超时时间具体包括:
S520:通过SSTO命令用接收的会话超时时间替换默认超时时间。需要说明的是,SSTO命令为本领域技术人员可以根据实际情况进行设置的程序指令,在此不再赘述。
由于该方法解决问题的原理与以上方法类似,因此本方法的实施可以参见方法的实施,在此不再赘述。
基于相同原理,本实施例还公开了一种运维节点。如图4所示,本实施例中,所述运维节点包括数据采集模块11、动态调整模块12和信息发送模块13。
其中,所述数据采集模块11用于采集所述分布式系统的当前数据容量。
所述动态调整模块12用于根据所述当前数据容量确定所述分布式系统重建所需的展期时间,根据所述展期时间调整所述分布式系统与客户端的会话超时时间。
所述信息发送模块13用于将所述会话超时时间传输至所述分布式系统以使所述分布式系统将默认超时时间替换为所述会话超时时间。
由于该运维节点解决问题的原理与以上方法类似,因此本运维节点的实施可以参见方法的实施,在此不再赘述。
基于相同原理,本实施例还公开了一种分布式系统。该分布式系统被配置为接收运维节点传输的会话超时时间,将默认超时时间替换为所述会话超时时间,其中,所述会话超时时间为所述运维节点采集所述分布式系统的当前数据容量,根据所述当前数据容量确定所述分布式系统重建所需的展期时间,并根据所述展期时间调整得到的所述分布式系统与客户端的会话超时时间。
由于该系统解决问题的原理与以上方法类似,因此本系统的实施可以参见方法的实施,在此不再赘述。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机设备,具体的,计算机设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中计算机设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的由客户端执行的方法,或者,所述处理器执行所述程序时实现如上所述的由服务器执行的方法。
下面参考图5,其示出了适于用来实现本申请实施例的计算机设备600的结构示意图。
如图5所示,计算机设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶反馈器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包括用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (13)

1.一种分布式系统重建运维方法,其特征在于,包括:
采集所述分布式系统的当前数据容量;
根据所述当前数据容量确定所述分布式系统重建所需的展期时间,根据所述展期时间调整所述分布式系统与客户端的会话超时时间;
将所述会话超时时间传输至所述分布式系统以使所述分布式系统将默认超时时间替换为所述会话超时时间。
2.根据权利要求1所述的分布式系统重建运维方法,其特征在于,进一步包括:
接收所述分布式系统在重建之前传输的报警信息以根据所述报警信息获取所述分布式系统的当前数据容量。
3.根据权利要求1所述的分布式系统重建运维方法,其特征在于,所述根据所述当前数据容量确定所述分布式系统重建所需的展期时间具体包括:
根据所述当前数据容量以及容量与展期时间的对应关系确定所述当前数据容量对应的展期时间。
4.根据权利要求1所述的分布式系统重建运维方法,其特征在于,所述根据所述展期时间调整所述分布式系统与客户端的会话超时时间具体包括:
将所述展期时间和默认超时时间相加得到会话超时时间。
5.根据权利要求1所述的分布式系统重建运维方法,其特征在于,进一步包括:
每隔预定时间间隔获取所述分布式系统的同步进度,根据所述同步进度重新确定各服务器的展期时间,并根据重新确定的展期时间调整各服务器的会话超时时间直至所述展期时间为0。
6.一种分布式系统重建运维方法,其特征在于,包括:
接收运维节点传输的会话超时时间,将默认超时时间替换为所述会话超时时间,其中,所述会话超时时间为所述运维节点采集所述分布式系统的当前数据容量,根据所述当前数据容量确定所述分布式系统重建所需的展期时间,并根据所述展期时间调整得到的所述分布式系统与客户端的会话超时时间。
7.根据权利要求6所述的分布式系统重建运维方法,其特征在于,所述采集所述分布式系统的当前数据容量具体包括:
通过MNTR命令采集分布式系统的当前数据容量并存储至数据库,以使所述运维节点从所述数据库获取所述分布式系统的当前数据容量。
8.根据权利要求6所述的分布式系统重建运维方法,其特征在于,进一步包括:
在所述分布式系统重建之前,传输报警信息至所述运维节点以使所述运维节点根据所述报警信息获取所述分布式系统的当前数据容量。
9.根据权利要求6所述的分布式系统重建运维方法,其特征在于,所述将默认超时时间替换为所述会话超时时间具体包括:
通过SSTO命令用接收的会话超时时间替换默认超时时间。
10.一种运维节点,其特征在于,包括:
数据采集模块,用于采集分布式系统的当前数据容量;
动态调整模块,用于根据所述当前数据容量确定所述分布式系统重建所需的展期时间,根据所述展期时间调整所述分布式系统与客户端的会话超时时间;
信息发送模块,用于将所述会话超时时间传输至所述分布式系统以使所述分布式系统将默认超时时间替换为所述会话超时时间。
11.一种分布式系统,其特征在于,被配置为接收运维节点传输的会话超时时间,将默认超时时间替换为所述会话超时时间,其中,所述会话超时时间为所述运维节点采集所述分布式系统的当前数据容量,根据所述当前数据容量确定所述分布式系统重建所需的展期时间,并根据所述展期时间调整得到的所述分布式系统与客户端的会话超时时间。
12.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,
所述处理器执行所述程序时实现如权利要求1-9任一项所述方法。
13.一种计算机可读介质,其上存储有计算机程序,其特征在于,
该程序被处理器执行时实现如权利要求1-9任一项所述方法。
CN202110352598.0A 2021-03-31 2021-03-31 分布式系统重建运维方法、运维节点及系统 Active CN112887432B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110352598.0A CN112887432B (zh) 2021-03-31 2021-03-31 分布式系统重建运维方法、运维节点及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110352598.0A CN112887432B (zh) 2021-03-31 2021-03-31 分布式系统重建运维方法、运维节点及系统

Publications (2)

Publication Number Publication Date
CN112887432A true CN112887432A (zh) 2021-06-01
CN112887432B CN112887432B (zh) 2023-07-18

Family

ID=76040436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110352598.0A Active CN112887432B (zh) 2021-03-31 2021-03-31 分布式系统重建运维方法、运维节点及系统

Country Status (1)

Country Link
CN (1) CN112887432B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277606A (zh) * 2022-08-01 2022-11-01 成都安恒信息技术有限公司 一种优化drbd数据同步的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070115845A1 (en) * 2005-10-24 2007-05-24 Christian Hochwarth Network time out handling
CN101208969A (zh) * 2005-05-20 2008-06-25 微软公司 用于根据网络条件最优化网络通信的系统和方法
CN102668456A (zh) * 2009-11-05 2012-09-12 阿玛得斯两合公司 用于调整会话超时周期的方法及系统
US20130204843A1 (en) * 2012-02-07 2013-08-08 Zerto Ltd. Adaptive quiesce for efficient cross-host consistent cdp checkponts
CN103246480A (zh) * 2012-02-08 2013-08-14 Lsi公司 用于raid中改善重建的系统和方法
CN106462544A (zh) * 2014-03-31 2017-02-22 亚马逊科技公司 分布式存储系统中的会话管理
CN108509325A (zh) * 2018-03-07 2018-09-07 北京三快在线科技有限公司 系统超时时间的动态确定方法与装置
CN109510867A (zh) * 2018-10-31 2019-03-22 恒生电子股份有限公司 数据请求处理的方法、装置、存储介质及电子设备
CN112015596A (zh) * 2020-10-20 2020-12-01 支付宝(杭州)信息技术有限公司 一种区块链数据的恢复方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101208969A (zh) * 2005-05-20 2008-06-25 微软公司 用于根据网络条件最优化网络通信的系统和方法
US20070115845A1 (en) * 2005-10-24 2007-05-24 Christian Hochwarth Network time out handling
CN102668456A (zh) * 2009-11-05 2012-09-12 阿玛得斯两合公司 用于调整会话超时周期的方法及系统
US20130204843A1 (en) * 2012-02-07 2013-08-08 Zerto Ltd. Adaptive quiesce for efficient cross-host consistent cdp checkponts
CN103246480A (zh) * 2012-02-08 2013-08-14 Lsi公司 用于raid中改善重建的系统和方法
CN106462544A (zh) * 2014-03-31 2017-02-22 亚马逊科技公司 分布式存储系统中的会话管理
CN108509325A (zh) * 2018-03-07 2018-09-07 北京三快在线科技有限公司 系统超时时间的动态确定方法与装置
CN109510867A (zh) * 2018-10-31 2019-03-22 恒生电子股份有限公司 数据请求处理的方法、装置、存储介质及电子设备
CN112015596A (zh) * 2020-10-20 2020-12-01 支付宝(杭州)信息技术有限公司 一种区块链数据的恢复方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277606A (zh) * 2022-08-01 2022-11-01 成都安恒信息技术有限公司 一种优化drbd数据同步的方法
CN115277606B (zh) * 2022-08-01 2023-11-24 成都安恒信息技术有限公司 一种优化drbd数据同步的方法

Also Published As

Publication number Publication date
CN112887432B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
US11146502B2 (en) Method and apparatus for allocating resource
US8874700B2 (en) Optimizing storage of data files
US20120323846A1 (en) Sending Category Information
CN105530272B (zh) 一种应用数据的同步方法和装置
EP3758325B1 (en) Traffic limiting method, node and system
US9112948B1 (en) System and method for assignment and switching of content sources for a streaming content session
CN109245908B (zh) 一种主从集群切换的方法和装置
CN102903043A (zh) 支付服务器和支付通道获取方法
CN111355612A (zh) 源站故障的cdn节点应急处理方法及系统
CN107347093B (zh) 用于分布式服务器系统的配置方法和装置
CN110489494A (zh) 分布式数据库在线扩容方法及装置
CN111338834B (zh) 数据存储方法和装置
CN112887432B (zh) 分布式系统重建运维方法、运维节点及系统
CN113193947A (zh) 实现分布式全局序的方法、设备、介质及程序产品
CN112732491A (zh) 数据处理系统、基于数据处理系统的业务数据处理方法
CN110071952B (zh) 服务调用量的控制方法和装置
US11734057B2 (en) Method and apparatus for processing a service of an abnormal server
CN107818027B (zh) 名字节点主备切换的方法、装置和分布式系统
CN108874531A (zh) 用于熔断服务的方法、装置、系统及电子设备
CN111510480A (zh) 一种请求发送方法、装置以及第一服务器
CN111949536A (zh) 基于字节码技术的java应用程序测试方法及系统
CN112817687A (zh) 一种数据同步方法和装置
CN115629909A (zh) 业务数据处理的方法、装置、电子设备和存储介质
CN109710285A (zh) 一种设备升级方法及系统
CN112948207A (zh) 信息传递方法、装置、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant