CN112162902A - 一种提升调控系统应用模块运行水平的多活冗余方法 - Google Patents

一种提升调控系统应用模块运行水平的多活冗余方法 Download PDF

Info

Publication number
CN112162902A
CN112162902A CN202011018735.9A CN202011018735A CN112162902A CN 112162902 A CN112162902 A CN 112162902A CN 202011018735 A CN202011018735 A CN 202011018735A CN 112162902 A CN112162902 A CN 112162902A
Authority
CN
China
Prior art keywords
application module
machine
resources
control system
regulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011018735.9A
Other languages
English (en)
Inventor
王顺江
李正文
句荣滨
葛维春
李典阳
韩子娇
孟凡博
王洪哲
王爱华
王荣茂
于鹏
苏安龙
庄启明
赵军
刘广利
张艳军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoyang Power Supply Co Of State Grid Liaoning Electric Power Supply Co ltd
State Grid Liaoning Electric Power Co Ltd
Shenyang Institute of Engineering
Original Assignee
Liaoyang Power Supply Co Of State Grid Liaoning Electric Power Supply Co ltd
State Grid Corp of China SGCC
State Grid Liaoning Electric Power Co Ltd
Shenyang Institute of Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoyang Power Supply Co Of State Grid Liaoning Electric Power Supply Co ltd, State Grid Corp of China SGCC, State Grid Liaoning Electric Power Co Ltd, Shenyang Institute of Engineering filed Critical Liaoyang Power Supply Co Of State Grid Liaoning Electric Power Supply Co ltd
Priority to CN202011018735.9A priority Critical patent/CN112162902A/zh
Publication of CN112162902A publication Critical patent/CN112162902A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

一种提升调控系统应用模块运行水平的多活冗余方法,属于网络技术领域,包括如下步骤:步骤1:统计服务器集群中的机器配置和应用占用资源情况;步骤2:构建应用模块占用资源和机器总资源的关系,定义数学表达式;步骤3:定义机器备份应用模块数公式。本发明在双机互备的基础上,计算机资源不浪费的前提下,为每一个应用模块安排尽量多的备份机器,提升了应用模块的冗余度,提高了资源利用率和整个调控系统运行水平。

Description

一种提升调控系统应用模块运行水平的多活冗余方法
技术领域
本发明属于网络技术领域,尤其涉及一种提升调控系统应用模块运行水平的多活冗余方法。
背景技术
随着信息技术以及内部网络应用的不断深入,企业对网络服务的依赖性不断增加,因此,服务器系统的硬、软件故障造成的应用中断会严重影响到正常的工作,甚至带来经济损失;这种应用环境的多样化和开放性以及服务器系统本身的复杂性给它的运行带来了许多不确定因素;这些因素对服务器的可靠性、稳定性提出了更高的要求。
双机互备指两个相对独立的应用模块在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用模块接管过来,从而保证了应用模块的持续性。也就是主机和备机运行于不同的应用模块,主机与备机互为备份。本发明是在双机互备的基础上为运行的每一个应用模块增加一台备机,从而增加了整个服务器集群的稳定性。
目前,服务器集群采用双机互备的工作方式,两个相对独立的应用模块在两台机器同时运行,彼此均设为备机,如图1所示。在实际应用中,往往应用数量远大于机器数量,而每个应用模块占用机器资源较小,如图2所示。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种提升调控系统应用模块运行水平的多活冗余方法,在双机互备的基础上,计算机资源不浪费的前提下,为每一个应用模块安排尽量多的备份机器,提升了应用模块的冗余度,提高了资源利用率和整个调控系统运行水平。
为解决上述技术问题,本发明所采取的技术方案是:
一种提升调控系统应用模块运行水平的多活冗余方法,包括以下步骤:
步骤1:统计服务器集群中的机器配置和应用模块占用资源情况;所述资源包括CPU资源和内存资源;
步骤2:构建应用模块占用资源和机器总资源的关系,定义数学表达式,如下两式所示:
Figure BDA0002699971370000021
Figure BDA0002699971370000022
其中,n为机器总数;m为需要运行的应用模块数;Ai为第i台机器所能提供的CPU资源;Bi为第i台机器所能提供的内存资源;Cj为第j个应用模块需要占用的CPU资源;Dj为第j个应用模块需要占用的内存资源;
Figure BDA0002699971370000023
和ψ分别为机器CPU和内存能运行最大应用模块平均数;
步骤3:由步骤2中所得数据并考虑木桶原则,计算机器备份应用模块数γ,如下式所示:
Figure BDA0002699971370000031
步骤4:构建故障后备份再平衡算法;一部分机器故障后,机器所能提供的总资源数减少,为所有应用模块重新分配备份机器,数学表示如下:
Figure BDA0002699971370000032
Figure BDA0002699971370000033
其中,n′为当前剩余机器总数;
步骤5:将步骤4中所得数据带入公式(3),得到故障后机器备份应用模块数γ′;当故障机器太多,导致出现γ′=0的情况时,集群软件应及时通知管理员处理故障;
Figure BDA0002699971370000034
采用上述技术方案所产生的有益效果在于:本发明提供的多应用模块在服务器集群中的备份数量计算方法,基于服务器集群中的机器配置和应用模块占用资源情况,在满足机器稳定运行的前提下增加了运行应用模块冗余度,合理利用了服务器资源,提升了调控系统运行水平。
附图说明
图1为双机互备的工作方式示意图;
图2为实际应用中的双机互备的工作方式示意图;
图3为本发明实施例提供的VM配置示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明为一种提升调控系统应用模块运行水平的多活冗余方法,首先统计服务器集群中的机器配置和应用模块占用资源情况,定义机器提供资源大小,应用模块占用资源大小,在此基础上,提出机器最大运行应用平均数计算公式。最后,建立本发明的多应用在服务器集群中的备份数量计算方程,实现资源不浪费的前提下,为每一个应用模块安排尽量多的备份机器,增加了运行应用模块冗余度,合理利用了服务器资源,提升了调控系统运行水平。
实施例1
本实施例的方法如下所述:
步骤1:统计服务器集群中的机器配置和应用模块占用资源情况;考虑到应用模块运行需要CPU、内存、硬盘三类硬件共同作用,而集群服务器中的应用模块一般储存在共享的磁盘阵列中。因此,本实施例中的计算机资源只考虑CPU资源和内存资源。
本实施例选取30台HP ProLiant DL580 G7(B8C93A)服务器作为服务器集群的配置,具体配置如下表所示;
表1 HP ProLiant DL580 G7(B8C93A)配置表
Figure BDA0002699971370000051
本具体实施例以虚拟机VM(以下简称VM)代替具体运行的应用模块。VM配置如附图3所示。设运行的VM数量为50。为了保证宿主机稳定运行,每台机器应保留1GB内存和1CPU核心。则每台机器可以提供11个CPU核心,23线程,31GB内存。
步骤2:构建应用模块占用资源和机器总资源的关系,定义数学表达式,如下两式所示:
Figure BDA0002699971370000052
Figure BDA0002699971370000053
其中,n为机器总数;m为需要运行的应用模块数;Ai为第i台机器所能提供的CPU资源;Bi为第i台机器所能提供的内存资源;Cj为第j个应用模块需要占用的CPU资源;Dj为第j个应用模块需要占用的内存资源;
Figure BDA0002699971370000061
和ψ分别为机器CPU和内存能运行最大应用模块平均数;
步骤3:由步骤2中所得数据并考虑木桶原则,计算机器备份应用模块数γ,如下式所示:
Figure BDA0002699971370000062
步骤4:构建故障后备份再平衡算法;一部分机器故障后,机器所能提供的总资源数减少,为所有应用模块重新分配备份机器,数学表示如下:
Figure BDA0002699971370000063
Figure BDA0002699971370000064
其中,n′为当前剩余机器总数;
本实施例中服务器集群中有5台机器故障,则当前剩余机器总数n′=25;
Figure BDA0002699971370000065
步骤5:将步骤4中所得数据带入公式(3),得到故障后机器备份应用模块数γ′;当故障机器太多,故障后机器备份应用模块数γ′越小,导致出现γ′=0的情况时,此时机器负载过大,资源已不够给一部分或所有应用模块备份,集群软件应及时通知管理员处理故障;
Figure BDA0002699971370000066
本实施例中
Figure BDA0002699971370000071
以上计算结果证明本发明的计算方法的可行性,证明了计算方法的正确性。
最后应说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (3)

1.一种提升调控系统应用模块运行水平的多活冗余方法,其特征在于:包括如下步骤:
步骤1:统计服务器集群中的机器配置和应用模块占用资源情况;
步骤2:构建应用模块占用资源和机器总资源的关系,定义如下:
Figure FDA0002699971360000011
Figure FDA0002699971360000012
其中,n为机器总数;m为需要运行的应用模块数;Ai为第i台机器所能提供的CPU资源;Bi为第i台机器所能提供的内存资源;Cj为第j个应用模块需要占用的CPU资源;Dj为第j个应用模块需要占用的内存资源;
Figure FDA0002699971360000013
和ψ分别为机器CPU和内存能运行最大应用模块平均数;
步骤3:由步骤2中所得数据,计算机器备份应用模块数γ,如下式所示:
Figure FDA0002699971360000014
步骤4:构建故障后备份再平衡,如下式所示:
Figure FDA0002699971360000015
Figure FDA0002699971360000021
其中,n′为当前剩余机器总数;
步骤5:将步骤4中所得数据带入公式(3),得到故障后机器备份应用模块数γ′;
Figure FDA0002699971360000022
2.根据权利要求1所述的一种提升调控系统应用模块运行水平的多活冗余方法,其特征在于:步骤1中所述的资源包括CPU资源和内存资源。
3.根据权利要求1所述的一种提升调控系统应用模块运行水平的多活冗余方法,其特征在于:步骤5中,当故障机器太多,导致出现γ′=0的情况时,集群软件通知管理员处理故障。
CN202011018735.9A 2020-09-24 2020-09-24 一种提升调控系统应用模块运行水平的多活冗余方法 Pending CN112162902A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011018735.9A CN112162902A (zh) 2020-09-24 2020-09-24 一种提升调控系统应用模块运行水平的多活冗余方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011018735.9A CN112162902A (zh) 2020-09-24 2020-09-24 一种提升调控系统应用模块运行水平的多活冗余方法

Publications (1)

Publication Number Publication Date
CN112162902A true CN112162902A (zh) 2021-01-01

Family

ID=73862899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011018735.9A Pending CN112162902A (zh) 2020-09-24 2020-09-24 一种提升调控系统应用模块运行水平的多活冗余方法

Country Status (1)

Country Link
CN (1) CN112162902A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572289A (zh) * 2013-10-10 2015-04-29 中国电信股份有限公司 基于虚拟化的服务器配置测算处理方法与装置
CN108921728A (zh) * 2018-07-03 2018-11-30 北京科东电力控制系统有限责任公司 基于电网调度系统的分布式实时库系统
CN109165122A (zh) * 2018-08-13 2019-01-08 浙商银行股份有限公司 一种提升基于区块链技术实现的应用系统同城多园区部署灾备能力的方法
CN109324876A (zh) * 2018-10-12 2019-02-12 西安交通大学 一种高可用的Docker与虚拟机初始放置方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572289A (zh) * 2013-10-10 2015-04-29 中国电信股份有限公司 基于虚拟化的服务器配置测算处理方法与装置
CN108921728A (zh) * 2018-07-03 2018-11-30 北京科东电力控制系统有限责任公司 基于电网调度系统的分布式实时库系统
CN109165122A (zh) * 2018-08-13 2019-01-08 浙商银行股份有限公司 一种提升基于区块链技术实现的应用系统同城多园区部署灾备能力的方法
CN109324876A (zh) * 2018-10-12 2019-02-12 西安交通大学 一种高可用的Docker与虚拟机初始放置方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
郑旭: "数字化校园视频监控系统组网设计及应用", 《中国优秀硕士学位论文全文数据库》, pages 42 *
高原: "适用于电网调控系统的细粒度多机冗余机制的设计与实现", 适用于电网调控系统的细粒度多机冗余机制的设计与实现, pages 2 *

Similar Documents

Publication Publication Date Title
JP4405511B2 (ja) 複数のサービス・ポイントを有する自律コンピューティングにおける動的に構成可能な耐障害性
US20120072767A1 (en) Recovery of failed disks in an array of disks
CN105553701A (zh) 一种配网调控系统及其控制方法
US20170090793A1 (en) Devices and methods for a data storage device
WO2017097006A1 (zh) 一种实时数据容错处理方法及系统
EP4075252A1 (en) Data storage method, apparatus, and system and data reading method, apparatus, and system in storage system
CN111935244B (zh) 一种业务请求处理系统及超融合一体机
CN111045602A (zh) 集群系统控制方法及集群系统
Qing et al. Virtual network protection strategy to ensure the reliability of SFC in NFV
CN114337944A (zh) 一种系统级主备冗余通用控制方法
CN106844052A (zh) 一种基于Windows Server构建融合集群的方法及装置
CN113608836A (zh) 一种基于集群的虚拟机高可用方法及系统
CN115225642B (zh) 超融合系统的弹性负载均衡方法及系统
CN112201378A (zh) 基于核电厂dcs平台的热备切换方法、系统、终端及介质
CN112073499A (zh) 一种多机型云物理服务器的动态服务方法
CN112162902A (zh) 一种提升调控系统应用模块运行水平的多活冗余方法
CN105391790A (zh) 类RAC One Node的数据库高可用方法
CN104503871A (zh) 一种基于小型机系统全冗余模型的实现方法
CN111817892B (zh) 一种网络管理方法、系统、电子设备及存储介质
CN114879905A (zh) 一种数据存储方法、装置、电子设备及存储介质
CN111930563B (zh) 云仿真系统中的容错方法
CN114330698A (zh) 一种类脑计算机操作系统的神经模型存储系统及方法
KR20230064270A (ko) 직류 송배전망용 고속 제어 플랫폼 장치, 방법 및 시스템
CN103685359A (zh) 数据处理方法及装置
US20200394081A1 (en) Leveraging reserved data center resources to improve data center utilization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210926

Address after: 111000 81 Bayi Street, Baita District, Liaoyang City, Liaoning Province

Applicant after: LIAOYANG POWER SUPPLY COMPANY OF STATE GRID LIAONING ELECTRIC POWER SUPPLY Co.,Ltd.

Applicant after: STATE GRID LIAONING ELECTRIC POWER SUPPLY Co.,Ltd.

Applicant after: SHENYANG INSTITUTE OF ENGINEERING

Address before: 111099 81 Bayi street, Baita District, Liaoyang City, Liaoning Province

Applicant before: LIAOYANG POWER SUPPLY COMPANY OF STATE GRID LIAONING ELECTRIC POWER SUPPLY Co.,Ltd.

Applicant before: STATE GRID LIAONING ELECTRIC POWER SUPPLY Co.,Ltd.

Applicant before: STATE GRID CORPORATION OF CHINA

Applicant before: SHENYANG INSTITUTE OF ENGINEERING

TA01 Transfer of patent application right