CN111193759B - 分布式计算系统、方法和设备 - Google Patents

分布式计算系统、方法和设备 Download PDF

Info

Publication number
CN111193759B
CN111193759B CN201811358935.1A CN201811358935A CN111193759B CN 111193759 B CN111193759 B CN 111193759B CN 201811358935 A CN201811358935 A CN 201811358935A CN 111193759 B CN111193759 B CN 111193759B
Authority
CN
China
Prior art keywords
service node
data
tasks
billing
standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811358935.1A
Other languages
English (en)
Other versions
CN111193759A (zh
Inventor
陈娜
刘智琼
张金娟
丘晖
朱明英
池炜成
俞科峰
华竹轩
伍运珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201811358935.1A priority Critical patent/CN111193759B/zh
Publication of CN111193759A publication Critical patent/CN111193759A/zh
Application granted granted Critical
Publication of CN111193759B publication Critical patent/CN111193759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本公开提出一种分布式计算系统、方法和设备,涉及通信技术领域。分布式计算系统包括:云管理平台,多个服务节点,备用服务节点,其中,云管理平台与各个服务节点和备用服务节点通信连接,每个服务节点上部署相应的资料分组,备用服务节点上部署全量资料,全量资料包括各个资料分组。当某个服务节点故障时,云管理平台将故障服务节点需要处理的任务和处理所述任务需要的业务数据路由到备用服务节点,使得备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。由于节省从缓存加载资料分组的时间,因此,降低了接管时延。

Description

分布式计算系统、方法和设备
技术领域
本公开涉及通信技术领域,特别涉及一种分布式计算系统、方法和设备。
背景技术
企业的信息系统既有计算密集型的应用,也有需要频繁读写和事务交易型的应用。运营商的计费系统就是典型的计算密集型应用,它需要结合用户订购的套餐情况和话单中的详细信息,对用户的话单进行大量复杂的计费和优惠处理,最终得出用户的消费数据。
一种相关技术的计费系统如图1所示,云管理平台下挂多个服务节点,每个服务节点上部署相应的资料分组,云管理平台的缓存中存储有全量数据。如果某个服务节点故障,云管理平台需要将缓存中的故障服务节点相关的资料分组加载到新接管的服务节点。由于资料分组加载时间比较长,造成接管时间比较长。
发明内容
本公开的一个目的是降低接管时延。
本公开的一些实施例提出一种分布式计算系统,包括:
云管理平台,
多个服务节点,
备用服务节点,
其中,云管理平台与各个服务节点和备用服务节点通信连接,每个服务节点上部署相应的资料分组,备用服务节点上部署全量资料,全量资料包括各个资料分组。
在一些实施例中,服务节点与备用服务节点按照比例进行混合部署。
在一些实施例中,当某个服务节点故障时,云管理平台将故障服务节点需要处理的任务以及处理所述任务需要的业务数据路由到备用服务节点,备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。
在一些实施例中,资料包括计费应用使用的静态资料。
本公开的一些实施例提出一种分布式计算方法,包括:
当某个部署有资料分组的服务节点故障时,部署有全量资料的备用服务节点接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据路由到备用服务节点;
备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。
在一些实施例中,故障服务节点需要处理的任务包括计费话单;资料包括计费应用使用的静态资料。
本公开的一些实施例提出一种用于分布式计算的备用服务节点,部署有全量资料,包括:
接收模块,被配置为当某个部署有资料分组的服务节点故障时,接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据路由到备用服务节点;
接管模块,被配置为基于全量资料和业务数据接管故障服务节点需要处理的任务。
本公开的一些实施例提出一种用于分布式计算的备用服务节点,部署有全量资料,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行前述任一个实施例的分布式计算方法。
本公开的一些实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任一个实施例的分布式计算方法。
附图说明
下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍。根据下面参照附图的详细描述,可以更加清楚地理解本公开,
显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术的分布式计算系统的部署示意图。
图2为本公开一些实施例的分布式计算系统的部署示意图。
图3为本公开一些实施例的分布式计算方法的示意图。
图4为本公开一些实施例的用于分布式计算的备用服务节点的示意图。
图5为本公开一些实施例的用于分布式计算的备用服务节点的示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。
图2为本公开一些实施例的分布式计算系统的部署示意图。
如图2所示,该实施例的系统200包括:云管理平台210,多个服务节点220,备用服务节点230。
各个服务节点220和备用服务节点230例如可以是物理的服务器。在服务器中可以安装各种应用和中间件,还可以存储各种资料数据。在一些实施例中,资料分组和全量资料所涉及的“资料”例如包括计费应用使用的静态资料,如用户订购的计费套餐信息。
其中,云管理平台210与各个服务节点220和备用服务节点230通信连接,每个服务节点220上部署相应的资料分组,备用服务节点230上部署全量资料,全量资料包括各个资料分组。从而实现资料的混合部署,例如,用于实现计费系统部分云化时静态资料的混合部署。
在一些实施例中,服务节点220与备用服务节点230按照比例进行混合部署。即,每个备用服务节点230负责存储其相应的若干服务节点220的全量资料,不同备用服务节点230的全量资料的内容可以不同。
在一些实施例中,当某个服务节点220故障时,云管理平台210将故障服务节点需要处理的任务以及处理所述任务需要的业务数据(如计费累积量)路由到备用服务节点230,备用服务节点230基于全量资料和业务数据接管故障服务节点需要处理的任务。
图3为本公开一些实施例的分布式计算方法的示意图。
如图3所示,该实施例的方法包括:
在步骤310,当某个部署有资料分组的服务节点故障时,部署有全量资料的备用服务节点接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据(如计费累积量)。
在一些实施例中,故障服务节点需要处理的任务包括计费话单;资料包括计费应用使用的静态资料。
在步骤320,备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务。
图4为本公开一些实施例的用于分布式计算的备用服务节点的示意图。
如图4所示,该实施例的备用服务节点230部署有全量资料,包括:
接收模块410,被配置为当某个部署有资料分组的服务节点故障时,接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据。
接管模块420,被配置为基于全量资料和业务数据接管故障服务节点需要处理的任务。
在一些实施例中,故障服务节点需要处理的任务包括计费话单。资料分组和全量资料涉及的“资料”包括计费应用使用的静态资料。
图5为本公开一些实施例的用于分布式计算的备用服务节点的示意图。
如图5所示,该实施例的备用服务节点230部署有全量资料,包括:
存储器510;以及
耦接至所述存储器510的处理器520,所述处理器520被配置为基于存储在所述存储器510中的指令,执行前述任一个实施例的分布式计算方法。
其中,存储器510例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
本公开的一些实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任一个实施例的分布式计算方法。
本公开实现了资料的混合部署,由于节省从缓存加载资料分组的时间,因此,降低了接管时延。此外,相对于所有节点部署全量资料,可以减少资源浪费。无论业务量大小,都可采用本公开的部分云化方案(应用和数据未完全分离),扩大了部分云化方案的使用范围。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (9)

1.一种分布式计算系统,包括:
云管理平台,
多个服务节点,
备用服务节点,
其中,云管理平台与各个服务节点和备用服务节点通信连接,每个服务节点上部署相应的资料分组,备用服务节点上部署全量资料,全量资料包括各个资料分组,
其中,当某个服务节点故障时,云管理平台将故障服务节点需要处理的任务以及处理所述任务需要的业务数据路由到备用服务节点,部署有全量资料的备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务,所述任务是计算密集型的任务。
2.如权利要求1所述的系统,其中,服务节点与备用服务节点按照比例进行混合部署。
3.如权利要求1所述的系统,其中,故障服务节点需要处理的任务包括计费话单,处理所述任务需要的业务数据包括计费累积量,资料包括计费应用使用的静态资料,
当某个服务节点故障时,云管理平台将故障服务节点需要处理的计费话单以及计费累积量路由到备用服务节点,备用服务节点基于计费应用使用的全量静态资料和计费累积量接管故障服务节点需要处理的计费话单。
4.一种分布式计算方法,包括:
当某个部署有资料分组的服务节点故障时,部署有全量资料的备用服务节点接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据;
部署有全量资料的备用服务节点基于全量资料和业务数据接管故障服务节点需要处理的任务,所述任务是计算密集型的任务。
5.如权利要求4所述的方法,其中,故障服务节点需要处理的任务包括计费话单;处理所述任务需要的业务数据包括计费累积量;资料包括计费应用使用的静态资料,
当某个服务节点故障时,云管理平台将故障服务节点需要处理的计费话单以及计费累积量路由到备用服务节点,备用服务节点基于计费应用使用的全量静态资料和计费累积量接管故障服务节点需要处理的计费话单。
6.一种用于分布式计算的备用服务节点,部署有全量资料,包括:
接收模块,被配置为当某个部署有资料分组的服务节点故障时,接收云管理平台路由的故障服务节点需要处理的任务以及处理所述任务需要的业务数据;
接管模块,被配置为基于全量资料和业务数据接管故障服务节点需要处理的任务,所述任务是计算密集型的任务。
7.如权利要求6所述的节点,其中,故障服务节点需要处理的任务包括计费话单;处理所述任务需要的业务数据包括计费累积量;资料包括计费应用使用的静态资料,
接收模块,被配置为当某个部署有资料分组的服务节点故障时,接收云管理平台路由的故障服务节点需要处理的计费话单以及计费累积量;
接管模块,被配置为基于计费应用使用的全量静态资料和计费累积量接管故障服务节点需要处理的计费话单。
8.一种用于分布式计算的备用服务节点,部署有全量资料,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求4-5中任一项所述的分布式计算方法。
9.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求4-5中任一项所述的分布式计算方法。
CN201811358935.1A 2018-11-15 2018-11-15 分布式计算系统、方法和设备 Active CN111193759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811358935.1A CN111193759B (zh) 2018-11-15 2018-11-15 分布式计算系统、方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811358935.1A CN111193759B (zh) 2018-11-15 2018-11-15 分布式计算系统、方法和设备

Publications (2)

Publication Number Publication Date
CN111193759A CN111193759A (zh) 2020-05-22
CN111193759B true CN111193759B (zh) 2023-08-01

Family

ID=70709303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811358935.1A Active CN111193759B (zh) 2018-11-15 2018-11-15 分布式计算系统、方法和设备

Country Status (1)

Country Link
CN (1) CN111193759B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103595776A (zh) * 2013-11-05 2014-02-19 福建网龙计算机网络信息技术有限公司 分布式缓存方法及系统
CN103716182A (zh) * 2013-12-12 2014-04-09 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN106874142A (zh) * 2015-12-11 2017-06-20 华为技术有限公司 一种实时数据容错处理方法及系统
CN108388433A (zh) * 2017-12-28 2018-08-10 创新科软件技术(深圳)有限公司 超融合系统的管理平台部署方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5455340B2 (ja) * 2008-09-11 2014-03-26 株式会社アール・アイ バックアッププログラム
US8812916B2 (en) * 2011-06-02 2014-08-19 International Business Machines Corporation Failure data management for a distributed computer system
CN105335448B (zh) * 2014-08-15 2018-09-21 中国银联股份有限公司 基于分布式环境的数据存储及处理系统
CN107454155B (zh) * 2017-07-25 2021-01-22 北京三快在线科技有限公司 一种基于负载均衡集群的故障处理方法、装置以及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103595776A (zh) * 2013-11-05 2014-02-19 福建网龙计算机网络信息技术有限公司 分布式缓存方法及系统
CN103716182A (zh) * 2013-12-12 2014-04-09 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN106874142A (zh) * 2015-12-11 2017-06-20 华为技术有限公司 一种实时数据容错处理方法及系统
CN108388433A (zh) * 2017-12-28 2018-08-10 创新科软件技术(深圳)有限公司 超融合系统的管理平台部署方法

Also Published As

Publication number Publication date
CN111193759A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
CN102932409B (zh) 一种虚拟机在线迁移的方法和系统
CN106874142B (zh) 一种实时数据容错处理方法及系统
CN105242983A (zh) 一种数据存储方法以及一种数据存储管理服务器
CN104601680A (zh) 一种资源管理方法及装置
US20160044096A1 (en) Scaling Up and Scaling Out of a Server Architecture for Large Scale Real-Time Applications
US20180081663A1 (en) Tenant Allocation in Multi-Tenant Software Applications
CN105224422A (zh) 一种数据备份方法及设备
CN111213343B (zh) 一种主机升级方法及设备
CN104504495A (zh) 运维异常处理方法、装置及设备
CN110569124A (zh) 一种任务分配方法和装置
CN111193759B (zh) 分布式计算系统、方法和设备
CN112231053B (zh) 一种负载均衡服务分配方法及装置
CN105740278A (zh) 一种数据处理方法和装置
CN109120680A (zh) 一种控制系统、方法及相关设备
CN110298031B (zh) 一种词典服务系统及模型版本一致性配送方法
CN109936462B (zh) 容灾方法及装置
CN105338058A (zh) 一种应用更新的方法及装置
CN102868594B (zh) 一种消息处理方法和装置
CN107644020A (zh) 数据存储和调用的方法及装置
CN105426252A (zh) 一种分布式文件系统的线程分配方法及系统
CN109788007B (zh) 一种基于两地三中心的云平台及其通信方法
CN108733460B (zh) 保持用于网络存储设备的会话的方法和设备
CN108234615B (zh) 表项处理方法、主板及主网络设备
CN106888244A (zh) 一种业务处理方法及装置
CN105141462A (zh) 区域故障虚拟网络资源分配方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant