CN111193759A - 分布式计算系统、方法和设备 - Google Patents

分布式计算系统、方法和设备 Download PDF

Info

Publication number
CN111193759A
CN111193759A CN201811358935.1A CN201811358935A CN111193759A CN 111193759 A CN111193759 A CN 111193759A CN 201811358935 A CN201811358935 A CN 201811358935A CN 111193759 A CN111193759 A CN 111193759A
Authority
CN
China
Prior art keywords
service node
data
tasks
standby
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811358935.1A
Other languages
English (en)
Other versions
CN111193759B (zh
Inventor
陈娜
刘智琼
张金娟
丘晖
朱明英
池炜成
俞科峰
华竹轩
伍运珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201811358935.1A priority Critical patent/CN111193759B/zh
Publication of CN111193759A publication Critical patent/CN111193759A/zh
Application granted granted Critical
Publication of CN111193759B publication Critical patent/CN111193759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Retry When Errors Occur (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开提出一种分布式计算系统、方法和设备,涉及通信技术领域。分布式计算系统包括:云管理平台,多个服务节点,备用服务节点,其中,云管理平台与各个服务节点和备用服务节点通信连接,每个服务节点上部署相应的资料分组,备用服务节点上部署全量资料,全量资料包括各个资料分组。当某个服务节点故障时,云管理平台将故障服务节点需要处理的任务和处理所述任务需要的业务数据路由到备用服务节点,使得备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。由于节省从缓存加载资料分组的时间,因此,降低了接管时延。

Description

分布式计算系统、方法和设备
技术领域
本公开涉及通信技术领域,特别涉及一种分布式计算系统、方法和设备。
背景技术
企业的信息系统既有计算密集型的应用,也有需要频繁读写和事务交易型的应用。运营商的计费系统就是典型的计算密集型应用,它需要结合用户订购的套餐情况和话单中的详细信息,对用户的话单进行大量复杂的计费和优惠处理,最终得出用户的消费数据。
一种相关技术的计费系统如图1所示,云管理平台下挂多个服务节点,每个服务节点上部署相应的资料分组,云管理平台的缓存中存储有全量数据。如果某个服务节点故障,云管理平台需要将缓存中的故障服务节点相关的资料分组加载到新接管的服务节点。由于资料分组加载时间比较长,造成接管时间比较长。
发明内容
本公开的一个目的是降低接管时延。
本公开的一些实施例提出一种分布式计算系统,包括:
云管理平台,
多个服务节点,
备用服务节点,
其中,云管理平台与各个服务节点和备用服务节点通信连接,每个服务节点上部署相应的资料分组,备用服务节点上部署全量资料,全量资料包括各个资料分组。
在一些实施例中,服务节点与备用服务节点按照比例进行混合部署。
在一些实施例中,当某个服务节点故障时,云管理平台将故障服务节点需要处理的任务以及处理所述任务需要的业务数据路由到备用服务节点,备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。
在一些实施例中,资料包括计费应用使用的静态资料。
本公开的一些实施例提出一种分布式计算方法,包括:
当某个部署有资料分组的服务节点故障时,部署有全量资料的备用服务节点接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据路由到备用服务节点;
备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。
在一些实施例中,故障服务节点需要处理的任务包括计费话单;资料包括计费应用使用的静态资料。
本公开的一些实施例提出一种用于分布式计算的备用服务节点,部署有全量资料,包括:
接收模块,被配置为当某个部署有资料分组的服务节点故障时,接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据路由到备用服务节点;
接管模块,被配置为基于全量资料和业务数据接管故障服务节点需要处理的任务。
本公开的一些实施例提出一种用于分布式计算的备用服务节点,部署有全量资料,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行前述任一个实施例的分布式计算方法。
本公开的一些实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任一个实施例的分布式计算方法。
附图说明
下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍。根据下面参照附图的详细描述,可以更加清楚地理解本公开,
显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术的分布式计算系统的部署示意图。
图2为本公开一些实施例的分布式计算系统的部署示意图。
图3为本公开一些实施例的分布式计算方法的示意图。
图4为本公开一些实施例的用于分布式计算的备用服务节点的示意图。
图5为本公开一些实施例的用于分布式计算的备用服务节点的示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。
图2为本公开一些实施例的分布式计算系统的部署示意图。
如图2所示,该实施例的系统200包括:云管理平台210,多个服务节点220,备用服务节点230。
各个服务节点220和备用服务节点230例如可以是物理的服务器。在服务器中可以安装各种应用和中间件,还可以存储各种资料数据。在一些实施例中,资料分组和全量资料所涉及的“资料”例如包括计费应用使用的静态资料,如用户订购的计费套餐信息。
其中,云管理平台210与各个服务节点220和备用服务节点230通信连接,每个服务节点220上部署相应的资料分组,备用服务节点230上部署全量资料,全量资料包括各个资料分组。从而实现资料的混合部署,例如,用于实现计费系统部分云化时静态资料的混合部署。
在一些实施例中,服务节点220与备用服务节点230按照比例进行混合部署。即,每个备用服务节点230负责存储其相应的若干服务节点220的全量资料,不同备用服务节点230的全量资料的内容可以不同。
在一些实施例中,当某个服务节点220故障时,云管理平台210将故障服务节点需要处理的任务以及处理所述任务需要的业务数据(如计费累积量)路由到备用服务节点230,备用服务节点230基于全量资料和业务数据接管故障服务节点需要处理的任务。
图3为本公开一些实施例的分布式计算方法的示意图。
如图3所示,该实施例的方法包括:
在步骤310,当某个部署有资料分组的服务节点故障时,部署有全量资料的备用服务节点接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据(如计费累积量)。
在一些实施例中,故障服务节点需要处理的任务包括计费话单;资料包括计费应用使用的静态资料。
在步骤320,备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。
图4为本公开一些实施例的用于分布式计算的备用服务节点的示意图。
如图4所示,该实施例的备用服务节点230部署有全量资料,包括:
接收模块410,被配置为当某个部署有资料分组的服务节点故障时,接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据。
接管模块420,被配置为基于全量资料和业务数据接管故障服务节点需要处理的任务。
在一些实施例中,故障服务节点需要处理的任务包括计费话单。资料分组和全量资料涉及的“资料”包括计费应用使用的静态资料。
图5为本公开一些实施例的用于分布式计算的备用服务节点的示意图。
如图5所示,该实施例的备用服务节点230部署有全量资料,包括:
存储器510;以及
耦接至所述存储器510的处理器520,所述处理器520被配置为基于存储在所述存储器510中的指令,执行前述任一个实施例的分布式计算方法。
其中,存储器510例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
本公开的一些实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任一个实施例的分布式计算方法。
本公开实现了资料的混合部署,由于节省从缓存加载资料分组的时间,因此,降低了接管时延。此外,相对于所有节点部署全量资料,可以减少资源浪费。无论业务量大小,都可采用本公开的部分云化方案(应用和数据未完全分离),扩大了部分云化方案的使用范围。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种分布式计算系统,包括:
云管理平台,
多个服务节点,
备用服务节点,
其中,云管理平台与各个服务节点和备用服务节点通信连接,每个服务节点上部署相应的资料分组,备用服务节点上部署全量资料,全量资料包括各个资料分组。
2.如权利要求1所述的系统,其中,服务节点与备用服务节点按照比例进行混合部署。
3.如权利要求1所述的系统,其中,
当某个服务节点故障时,云管理平台将故障服务节点需要处理的任务以及处理所述任务需要的业务数据路由到备用服务节点,备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。
4.如权利要求1所述的系统,其中,资料包括计费应用使用的静态资料。
5.一种分布式计算方法,包括:
当某个部署有资料分组的服务节点故障时,部署有全量资料的备用服务节点接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据;
备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。
6.如权利要求5所述的方法,其中,故障服务节点需要处理的任务包括计费话单;
资料包括计费应用使用的静态资料。
7.一种用于分布式计算的备用服务节点,部署有全量资料,包括:
接收模块,被配置为当某个部署有资料分组的服务节点故障时,接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据;
接管模块,被配置为基于全量资料和业务数据接管故障服务节点需要处理的任务。
8.如权利要求7所述的节点,其中,故障服务节点需要处理的任务包括计费话单;
资料包括计费应用使用的静态资料。
9.一种用于分布式计算的备用服务节点,部署有全量资料,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求5-6中任一项所述的分布式计算方法。
10.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求5-6中任一项所述的分布式计算方法。
CN201811358935.1A 2018-11-15 2018-11-15 分布式计算系统、方法和设备 Active CN111193759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811358935.1A CN111193759B (zh) 2018-11-15 2018-11-15 分布式计算系统、方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811358935.1A CN111193759B (zh) 2018-11-15 2018-11-15 分布式计算系统、方法和设备

Publications (2)

Publication Number Publication Date
CN111193759A true CN111193759A (zh) 2020-05-22
CN111193759B CN111193759B (zh) 2023-08-01

Family

ID=70709303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811358935.1A Active CN111193759B (zh) 2018-11-15 2018-11-15 分布式计算系统、方法和设备

Country Status (1)

Country Link
CN (1) CN111193759B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010067055A (ja) * 2008-09-11 2010-03-25 Ri Co Ltd バックアッププログラム
US20120311391A1 (en) * 2011-06-02 2012-12-06 International Business Machines Corporation Failure data management for a distributed computer system
CN103595776A (zh) * 2013-11-05 2014-02-19 福建网龙计算机网络信息技术有限公司 分布式缓存方法及系统
CN103716182A (zh) * 2013-12-12 2014-04-09 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN105335448A (zh) * 2014-08-15 2016-02-17 中国银联股份有限公司 基于分布式环境的数据存储及处理系统
CN106874142A (zh) * 2015-12-11 2017-06-20 华为技术有限公司 一种实时数据容错处理方法及系统
CN107454155A (zh) * 2017-07-25 2017-12-08 北京三快在线科技有限公司 一种基于负载均衡集群的故障处理方法、装置以及系统
CN108388433A (zh) * 2017-12-28 2018-08-10 创新科软件技术(深圳)有限公司 超融合系统的管理平台部署方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010067055A (ja) * 2008-09-11 2010-03-25 Ri Co Ltd バックアッププログラム
US20120311391A1 (en) * 2011-06-02 2012-12-06 International Business Machines Corporation Failure data management for a distributed computer system
CN103595776A (zh) * 2013-11-05 2014-02-19 福建网龙计算机网络信息技术有限公司 分布式缓存方法及系统
CN103716182A (zh) * 2013-12-12 2014-04-09 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN105335448A (zh) * 2014-08-15 2016-02-17 中国银联股份有限公司 基于分布式环境的数据存储及处理系统
CN106874142A (zh) * 2015-12-11 2017-06-20 华为技术有限公司 一种实时数据容错处理方法及系统
CN107454155A (zh) * 2017-07-25 2017-12-08 北京三快在线科技有限公司 一种基于负载均衡集群的故障处理方法、装置以及系统
CN108388433A (zh) * 2017-12-28 2018-08-10 创新科软件技术(深圳)有限公司 超融合系统的管理平台部署方法

Also Published As

Publication number Publication date
CN111193759B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN105635216B (zh) 分布式应用的升级方法、设备和分布式系统
CN104601680A (zh) 一种资源管理方法及装置
CN112470119B (zh) 一种分布式系统中的业务升级方法、装置及分布式系统
CN106874142B (zh) 一种实时数据容错处理方法及系统
CN107168777B (zh) 分布式系统中资源的调度方法以及装置
CN106576260B (zh) Nfv系统中的策略协调方法和装置
CN108319492B (zh) 复位物理机的方法、装置与系统
CN104504495A (zh) 运维异常处理方法、装置及设备
CN109857516A (zh) 基于容器的集群迁移方法及装置
CN106385330A (zh) 一种网络功能虚拟化编排器的实现方法及装置
CN111858050A (zh) 服务器集群混合部署方法、集群管理节点及相关系统
CN104111843A (zh) 一种基于沙箱的脚本更新方法及系统
CN109120680A (zh) 一种控制系统、方法及相关设备
CN106301877A (zh) 一种虚拟网元的升级方法和装置
CN111193759B (zh) 分布式计算系统、方法和设备
CN104021033A (zh) 一种繁忙处理节点的散列方法和系统
CN113050978A (zh) 应用的灰度发布控制方法、装置、设备及计算机存储介质
CN105338058A (zh) 一种应用更新的方法及装置
CN102868594B (zh) 一种消息处理方法和装置
US20170090820A1 (en) Method and device for operating a many-core system
EP3129878B1 (en) Elasticity engine for availability management framework (amf)
CN111897554A (zh) 一种升级方法、装置和系统
CN105141462A (zh) 区域故障虚拟网络资源分配方法及系统
CN107454021B (zh) 一种通信方法及装置
CN108234615B (zh) 表项处理方法、主板及主网络设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant