CN117149533A - 一种能够自动适配多余度配置的综合控制计算机系统 - Google Patents

一种能够自动适配多余度配置的综合控制计算机系统 Download PDF

Info

Publication number
CN117149533A
CN117149533A CN202311434089.8A CN202311434089A CN117149533A CN 117149533 A CN117149533 A CN 117149533A CN 202311434089 A CN202311434089 A CN 202311434089A CN 117149533 A CN117149533 A CN 117149533A
Authority
CN
China
Prior art keywords
channel
load
redundancy
module
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311434089.8A
Other languages
English (en)
Other versions
CN117149533B (zh
Inventor
吴伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Zhengyang Bochuang Electronic Technology Co ltd
Original Assignee
Chengdu Zhengyang Bochuang Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Zhengyang Bochuang Electronic Technology Co ltd filed Critical Chengdu Zhengyang Bochuang Electronic Technology Co ltd
Priority to CN202311434089.8A priority Critical patent/CN117149533B/zh
Publication of CN117149533A publication Critical patent/CN117149533A/zh
Application granted granted Critical
Publication of CN117149533B publication Critical patent/CN117149533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3017Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3096Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents wherein the means or processing minimize the use of computing system or of computing system component resources, e.g. non-intrusive monitoring which minimizes the probe effect: sniffing, intercepting, indirectly deriving the monitored data from other directly available data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • G06F11/326Display of status information by lamps or LED's for error or online/offline status
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5022Workload threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明涉及数据处理技术领域,具体地说,涉及一种能够自动适配多余度配置的综合控制计算机系统。其包括通道监控单元、冗余分配单元、动态负载均衡单元和故障变更单元。本发明通过冗余分配单元将识别到的冗余根据通道监控单元的负载情况分配至多个控制通道内,然后动态负载均衡单元将每个控制通道的初步负载与二次负载进行比对,平衡每个控制通道的冗余,通过故障变更单元传输动态负载均衡单元中负载重控制通道内的部分冗余至空闲通道,并接收到通道监控单元运行状态为故障运行的信号时,将故障运行对应的控制通道内冗余传输至空闲通道,提高系统的容错性和可靠性,有利于快速响应故障情况并进行恢复,减少故障对系统运行的影响。

Description

一种能够自动适配多余度配置的综合控制计算机系统
技术领域
本发明涉及数据处理技术领域,具体地说,涉及一种能够自动适配多余度配置的综合控制计算机系统。
背景技术
电子计算机通称电脑,是现代一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能,是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备,其中,在余度计算机中,每一余度称为一个通道,每个通道均具有输出控制能力,根据控制策略的不同,需要设计余度计算机输出控制权的确定和交接,通常由逻辑上独立于处理器及其他接口模块的专用逻辑完成,这部分逻辑称为通道故障逻辑,通道故障逻辑又称计算机的故障容错逻辑,然而目前的计算机系统在实现高可用性和容错性方面存在一些局限性,具体的:
其一、在面对系统负载增加或故障发生时,传统系统通常通过静态配置的方式提供冗余度,然而,这种静态配置往往难以适应实时的负载变化和故障情况,导致资源的浪费或者无法满足系统的容错需求;
其二、传统的冗余配置还需要由管理员手动进行调整和管理,增加了系统配置的复杂性和维护成本,在应对多样化的负载和故障情况时,管理员往往需要耗费大量的时间和精力来进行手动配置和调优,限制了系统的灵活性和响应能力;
其三、尽管近年来提出了一些动态配置和自适应性调整的技术,这些技术能够根据实际负载和故障情况,动态调整系统的冗余度配置,以最大程度地减少故障对系统的影响,但是,现有技术在进行动态配置时,只关注单一方面的调整,无法全面考虑系统的容错需求和资源利用率之间的平衡,另外,过于依赖静态的预设参数,无法适应实时的负载和故障变化,鉴于此,我们提出一种能够自动适配多余度配置的综合控制计算机系统。
发明内容
本发明的目的在于提供一种能够自动适配多余度配置的综合控制计算机系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供一种能够自动适配多余度配置的综合控制计算机系统,包括通道监控单元、冗余分配单元、动态负载均衡单元和故障变更单元;
所述通道监控单元用于实时监测每个控制通道的负载情况和运行状态,负载情况包括处理速度、等待时间和队列长度,运行状态包括正常运行和故障运行;
所述冗余分配单元用于接收所述通道监控单元运行状态为正常运行的控制通道,将识别到的冗余根据所述通道监控单元的负载情况分配至多个控制通道内;
所述动态负载均衡单元用于设置时间窗口,在时间窗口初始点所述通道监控单元检测到的负载情况为初步负载,当所述冗余分配单元分配冗余到达时间窗口终点时,发出实时监控信号至所述通道监控单元,再次监控每个控制通道的负载情况,定义为二次负载,将每个控制通道的初步负载与二次负载进行比对,若二次负载的弱于初步负载,表示对应控制通道的负载重,则分割出部分冗余分配给空闲通道,平衡每个控制通道的冗余;
所述故障变更单元用于检测所述冗余分配单元分配后的空闲通道,若存在空闲通道,则传输所述动态负载均衡单元中负载重控制通道内的部分冗余至空闲通道,并接收到所述通道监控单元运行状态为故障运行的信号时,将故障运行对应的控制通道内冗余传输至空闲通道,若不存在空闲通道,则调出备用通道承载部分冗余,并接收故障运行的控制通道内冗余至备用通道。
作为本技术方案的进一步改进,所述通道监控单元包括负载监测模块和运行检测模块;
所述负载检测模块用于识别当前控制通道的处理速度、等待时间和队列长度确定当前控制通道的负载阈值;
所述运行检测模块用于监测每个通道的处理任务,若按照预期的流程和时间完成,以及成功的返回结果,则输出正常运行,判定该通道处于正常运行状态,反之,判定该通道处于异常运行状态,并监测到任务处理过程中出现异常、错误、超时、网络连接失败的故障现象,也判定该通道处于故障运行状态。
作为本技术方案的进一步改进,所述冗余分配单元包括冗余识别模块和负载评估模块;
所述冗余识别模块用于识别计算机系统中的冗余,判断冗余配置的负载数据;
所述负载评估模块用于在其中一个控制通道内,将所述冗余识别模块的负载数据与所述负载检测模块的负载阈值进行比对,若负载数据大于负载阈值,则分割出达到负载阈值的冗余,将剩余的冗余传输至另一个控制通道内,直至全部冗余适配的分配在多个控制通道内进行配置。
作为本技术方案的进一步改进,所述动态负载均衡单元包括时间窗口设置模块、监控反馈模块、负载比对模块和平衡分配模块;
所述时间窗口设置模块用于设置负载判断和调整的周期,定义为时间窗口;
所述监控反馈模块用于在所述时间窗口设置模块时间窗口的初始点接收所述负载检测模块的初次负载,在所述时间窗口设置模块时间窗口的终点接收所述负载检测模块的二次负载;
所述负载比对模块用于将所述监控反馈模块的初次负载和二次负载采用数值对比算法进行对比,若初次负载大于二次负载,则输出当前控制通道负载重信号;
所述平衡分配模块用于接收所述负载对比模块中初次负载大于二次负载对应的控制通道,分割出冗余至空闲通道进行配置。
作为本技术方案的进一步改进,所述平衡分配模块还包括分割反馈模块,所述分割反馈模块用于在所述平衡分配模块发出分割指令后,对当前控制通道内的冗余进行定量分割,并发出反馈信号至监控反馈模块中,再次对比初次负载和二次负载,若初次负载还是大于二次负载,则重复上述操作,直至初次负载小于等于二次负载。
作为本技术方案的进一步改进,所述故障变更单元包括空闲通道确定模块、备用通道调出模块和冗余传输模块;
所述空闲通道确定模块用于连接所述负载评估模块的输出端,在冗余分配完成后,调出没有被分配冗余的控制通道,定义为空闲通道;
所述备用通道调出模块用于设置备用通道,在接收到所述冗余传输模块的调取信号后,将备用通道与已有控制通道连接;
所述冗余传输模块用于先接收空闲通道确定模块的空闲通道,若存在空闲通道,则将冗余传输至空闲通道,若不存在空闲通道,则发出调取信号,接收所述备用通道调出模块的备用通道,将冗余传输至备用通道。
作为本技术方案的进一步改进,所述故障变更单元还包括故障提醒模块,所述故障提醒模块用于接收到所述运行检测模块的故障运行状态时,传输传输信号至冗余传输模块,使故障运行状态对应控制通道内的冗余传输至空闲通道,并采用声光报警器发出预警信号。
作为本技术方案的进一步改进,所述通道监控单元还包括间隔监测模块,所述间隔监测模块用于设置监测间隔,每达到监测间隔则发出控制信号,控制所述运行检测模块对控制通道进行监测;
所述间隔监测模块在接收到所述故障提醒模块的故障运行状态的信号时,直接控制所述运行检测模块对控制通道进行监测在监测间隔内进行多次监测,若多次监测均为故障运行,则发出控制通道确定故障信号,若多次监测中含有正常运行信号,则发出异常信号。
与现有技术相比,本发明的有益效果:
1、该能够自动适配多余度配置的综合控制计算机系统中,通过通道监控单元实时监测每个控制通道的负载情况和运行状态,冗余分配单元将识别到的冗余根据所述通道监控单元的负载情况分配至多个控制通道内,有利于资源的充分利用,然后动态负载均衡单元将每个控制通道的初步负载与二次负载进行比对,平衡每个控制通道的冗余,可根据时间窗口的设置,及时检测到负载情况的变化,从而做出相应的调整,并根据初步负载和二次负载的比对,能够快速判断负载重的控制通道,进行冗余的分配,实现负载的均衡,最后,通过故障变更单元传输动态负载均衡单元中负载重控制通道内的部分冗余至空闲通道,并接收到通道监控单元运行状态为故障运行的信号时,将故障运行对应的控制通道内冗余传输至空闲通道,提高系统的容错性和可靠性,有利于快速响应故障情况并进行恢复,减少故障对系统运行的影响;
本发明能够实现负载均衡、资源优化和故障处理,提高计算机系统的性能、稳定性和可用性。
2、该能够自动适配多余度配置的综合控制计算机系统中,在没完成监测间隔时,通道监控单元不进行工作,减轻计算机运行的强度,并且,在监测到控制通道故障运行时,在监测间隔内进行多次监测,若多次监测均为故障运行,则表示控制通道确实故障,提高故障监测的准确性,若多次监测有的是正常运行,有的是故障运行,则发出异常信号,方便工作人员,监测是控制通道损坏还是通道监控单元损坏,有利于对通道监控单元自身的运行进行监测,提高计算机系统的安全性。
附图说明
图1为本发明的整体结构原理框图;
图2为本发明的整体结构的详细原理图。
图中各个标号意义为:
100、通道监控单元;200、冗余分配单元;300、动态负载均衡单元;400、故障变更单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:请参阅图1-图2所示,本实施例提供一种能够自动适配多余度配置的综合控制计算机系统,包括通道监控单元100、冗余分配单元200、动态负载均衡单元300和故障变更单元400;
通道监控单元100用于实时监测每个控制通道的负载情况和运行状态,负载情况包括处理速度、等待时间和队列长度,运行状态包括正常运行和故障运行,通过实时监测有利于及时发现控制通道的异常情况,方便后续根据负载情况做出相应的调整,避免出现过载或负载不均衡的情况,分别对多个控制通道进行监测,也方便在其中一个控制通道故障时,快速排查和处理;
具体的,通道监控单元100包括负载监测模块和运行检测模块;
负载检测模块用于识别当前控制通道的处理速度、等待时间和队列长度确定当前控制通道的负载阈值,其中,负载阈值为当前控制通道能承载冗余的最大值,若超过负载阈值,则会造成负载重,反之,若小于等于负载阈值,则运行稳定,具体的:
在识别控制通道的处理速度时,通过比对任务的到达时间和处理完成时间,可以计算出每个通道的处理速度,当处理速度较慢时,可以判定该通道的负载情况较重;
在识别控制通道的等待时间时,通过记录进入通道队列等待的任务的时间戳,并计算等待时间的累积,可以获取每个通道的等待时间信息,如果等待时间过长,可能表示该通道负载较重;
在识别控制通道的队列长度时,监控通道中任务队列的长度,当队列长度超过一定阈值,可能意味着该通道的负载较重;
运行检测模块用于监测每个通道的处理任务,若按照预期的流程和时间完成,以及成功的返回结果,则输出正常运行,判定该通道处于正常运行状态,反之,判定该通道处于异常运行状态,并监测到任务处理过程中出现异常、错误、超时、网络连接失败的故障现象,也判定该通道处于故障运行状态。
冗余分配单元200用于接收通道监控单元100运行状态为正常运行的控制通道,将识别到的冗余根据通道监控单元100的负载情况分配至多个控制通道内,有利于资源的充分利用,将冗余根据每个控制通道的负载情况进行分配,避免冗余聚集在一个控制通道,造成负载较大损坏,且使多个冗余可以适配控制通道,若一部分控制通道可以承载冗余,则使另一部分控制通道处于空闲状态,避免资源的浪费;
其中,冗余分配单元200包括冗余识别模块和负载评估模块;
冗余识别模块用于识别计算机系统中的冗余,判断冗余配置的负载数据;
负载评估模块用于在其中一个控制通道内,将冗余识别模块的负载数据与负载检测模块的负载阈值进行比对,若负载数据大于负载阈值,则分割出达到负载阈值的冗余,将剩余的冗余传输至另一个控制通道内,直至全部冗余适配的分配在多个控制通道内进行配置,有利于针对每个控制通道的负载情况评估冗余的分配策略,保证控制通道能力强,可以承载较多的冗余进行配置,反之,若控制通道能力弱,则承载较少的冗余进行配置,实现冗余都能完成配置,以更充分地利用资源。
动态负载均衡单元300用于设置时间窗口,在时间窗口初始点通道监控单元100检测到的负载情况为初步负载,当冗余分配单元200分配冗余到达时间窗口终点时,发出实时监控信号至通道监控单元100,再次监控每个控制通道的负载情况,定义为二次负载,将每个控制通道的初步负载与二次负载进行比对,若二次负载的弱于初步负载,表示对应控制通道的负载重,则分割出部分冗余分配给空闲通道,平衡每个控制通道的冗余,可根据时间窗口的设置,及时检测到负载情况的变化,从而做出相应的调整,并根据初步负载和二次负载的比对,能够快速判断负载重的控制通道,进行冗余的分配,实现负载的均衡;
值得说明的,动态负载均衡单元300包括时间窗口设置模块、监控反馈模块、负载比对模块和平衡分配模块;
时间窗口设置模块用于设置负载判断和调整的周期,定义为时间窗口,其中,时间窗口的长度可以根据系统需求进行定义,通常是一个固定的时间间隔;
监控反馈模块用于在时间窗口设置模块时间窗口的初始点接收负载检测模块的初次负载,在时间窗口设置模块时间窗口的终点接收负载检测模块的二次负载;
负载比对模块用于将监控反馈模块的初次负载和二次负载采用数值对比算法进行对比,若初次负载大于二次负载,则输出当前控制通道负载重信号,由于负载检测模块可以分别检测每个控制通道的负载情况,通过比对时间窗口前后的负载数据,方便判断冗余在当前控制通道内的配置情况,若负载情况数值下降,表示冗余在当前控制通道内不能很好的进行配置;
平衡分配模块用于接收负载对比模块中初次负载大于二次负载对应的控制通道,分割出冗余至空闲通道进行配置,有利于避免当前控制通道负载中影响运行速度,平衡每个控制通道的冗余负载。
故障变更单元400用于检测冗余分配单元200分配后的空闲通道,若存在空闲通道,则传输动态负载均衡单元300中负载重控制通道内的部分冗余至空闲通道,并接收到通道监控单元100运行状态为故障运行的信号时,将故障运行对应的控制通道内冗余传输至空闲通道,若不存在空闲通道,则调出备用通道承载部分冗余,并接收故障运行的控制通道内冗余至备用通道,可对故障运行状态下的控制通道进行重新分配,将冗余传输至空闲通道或备用通道,提高系统的容错性和可靠性,有利于快速响应故障情况并进行恢复,减少故障对系统运行的影响;
进一步的,故障变更单元400包括空闲通道确定模块、备用通道调出模块和冗余传输模块;
空闲通道确定模块用于连接负载评估模块的输出端,在冗余分配完成后,调出没有被分配冗余的控制通道,定义为空闲通道;
备用通道调出模块用于设置备用通道,在接收到冗余传输模块的调取信号后,将备用通道与已有控制通道连接,有利于在已有的控制通道不能配置冗余时,有备用资源可用,保证工作的正常运行,同理,若已有的控制通道能完成冗余配置,则备用通道与已有通道断连,减轻计算机的负载;
冗余传输模块用于先接收空闲通道确定模块的空闲通道,若存在空闲通道,则将冗余传输至空闲通道,若不存在空闲通道,则发出调取信号,接收备用通道调出模块的备用通道,将冗余传输至备用通道,通过动态调整冗余任务的分配,可以更充分地利用空闲通道和备用通道,实现资源的优化利用,提高系统的性能效率,有利于保证计算机控制的稳定性。
综上,本发明能够实现负载均衡、资源优化和故障处理,提高计算机系统的性能、稳定性和可用性。
由于平衡分配模块在分割出冗余至空闲通道时,不能确保分割出的部分冗余,能使初次负载小于二次负载,因此,为了提高每个控制通道内的配置效果,使平衡分配模块还包括分割反馈模块,分割反馈模块用于在平衡分配模块发出分割指令后,对当前控制通道内的冗余进行定量分割,并发出反馈信号至监控反馈模块中,再次对比初次负载和二次负载,若初次负载还是大于二次负载,则重复上述操作,直至初次负载小于等于二次负载,通过往复的分割,和循环监测反馈,有利于保证当前控制通道可以保持运行稳定。
实施例2:由于故障变更单元400接收到通道监控单元100运行状态为故障运行的信号时,用户不能及时发现控制通道的故障,因此,使故障变更单元400还包括故障提醒模块,故障提醒模块用于接收到运行检测模块的故障运行状态时,传输传输信号至冗余传输模块,使故障运行状态对应控制通道内的冗余传输至空闲通道,并采用声光报警器发出预警信号,不仅方便在故障时,及时将故障对应控制通道内的冗余进行转移,避免影响计算机系统的稳定性,且通过声光报警器提醒工作人员及时发现,有利于快速定位损坏的控制通道进行维修更换。
并且,在通道监控单元100对故障进行监测时,若实时监测控制通道的,导致计算机长时间处于工作状态,易导致运行强度较大,因此,通道监控单元100还包括间隔监测模块,间隔监测模块用于设置监测间隔,每达到监测间隔则发出控制信号,控制运行检测模块对控制通道进行监测;
间隔监测模块在接收到故障提醒模块的故障运行状态的信号时,直接控制运行检测模块对控制通道进行监测在监测间隔内进行多次监测,若多次监测均为故障运行,则发出控制通道确定故障信号,若多次监测中含有正常运行信号,则发出异常信号,有利于在没完成监测间隔时,通道监控单元100不进行工作,减轻计算机运行的强度,并且,在监测到控制通道故障运行时,在监测间隔内进行多次监测,若多次监测均为故障运行,则表示控制通道确实故障,提高故障监测的准确性,若多次监测有的是正常运行,有的是故障运行,则发出异常信号,方便工作人员,监测是控制通道损坏还是通道监控单元100损坏,有利于对通道监控单元100自身的运行进行监测,提高计算机系统的安全性。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种能够自动适配多余度配置的综合控制计算机系统,其特征在于:包括通道监控单元(100)、冗余分配单元(200)、动态负载均衡单元(300)和故障变更单元(400);
所述通道监控单元(100)用于实时监测每个控制通道的负载情况和运行状态,负载情况包括处理速度、等待时间和队列长度,运行状态包括正常运行和故障运行;
所述冗余分配单元(200)用于接收所述通道监控单元(100)运行状态为正常运行的控制通道,将识别到的冗余根据所述通道监控单元(100)的负载情况分配至多个控制通道内;
所述动态负载均衡单元(300)用于设置时间窗口,在时间窗口初始点所述通道监控单元(100)检测到的负载情况为初步负载,当所述冗余分配单元(200)分配冗余到达时间窗口终点时,发出实时监控信号至所述通道监控单元(100),再次监控每个控制通道的负载情况,定义为二次负载,将每个控制通道的初步负载与二次负载进行比对,若二次负载的弱于初步负载,表示对应控制通道的负载重,则分割出部分冗余分配给空闲通道,平衡每个控制通道的冗余;
所述故障变更单元(400)用于检测所述冗余分配单元(200)分配后的空闲通道,若存在空闲通道,则传输所述动态负载均衡单元(300)中负载重控制通道内的部分冗余至空闲通道,并接收到所述通道监控单元(100)运行状态为故障运行的信号时,将故障运行对应的控制通道内冗余传输至空闲通道,若不存在空闲通道,则调出备用通道承载部分冗余,并接收故障运行的控制通道内冗余至备用通道。
2.根据权利要求1所述的能够自动适配多余度配置的综合控制计算机系统,其特征在于:所述通道监控单元(100)包括负载监测模块和运行检测模块;
所述负载检测模块用于识别当前控制通道的处理速度、等待时间和队列长度确定当前控制通道的负载阈值;
所述运行检测模块用于监测每个通道的处理任务,若按照预期的流程和时间完成,以及成功的返回结果,则输出正常运行,判定该通道处于正常运行状态,反之,判定该通道处于异常运行状态,并监测到任务处理过程中出现异常、错误、超时、网络连接失败的故障现象,也判定该通道处于故障运行状态。
3.根据权利要求2所述的能够自动适配多余度配置的综合控制计算机系统,其特征在于:所述冗余分配单元(200)包括冗余识别模块和负载评估模块;
所述冗余识别模块用于识别计算机系统中的冗余,判断冗余配置的负载数据;
所述负载评估模块用于在其中一个控制通道内,将所述冗余识别模块的负载数据与所述负载检测模块的负载阈值进行比对,若负载数据大于负载阈值,则分割出达到负载阈值的冗余,将剩余的冗余传输至另一个控制通道内,直至全部冗余适配的分配在多个控制通道内进行配置。
4.根据权利要求3所述的能够自动适配多余度配置的综合控制计算机系统,其特征在于:所述动态负载均衡单元(300)包括时间窗口设置模块、监控反馈模块、负载比对模块和平衡分配模块;
所述时间窗口设置模块用于设置负载判断和调整的周期,定义为时间窗口;
所述监控反馈模块用于在所述时间窗口设置模块时间窗口的初始点接收所述负载检测模块的初次负载,在所述时间窗口设置模块时间窗口的终点接收所述负载检测模块的二次负载;
所述负载比对模块用于将所述监控反馈模块的初次负载和二次负载采用数值对比算法进行对比,若初次负载大于二次负载,则输出当前控制通道负载重信号;
所述平衡分配模块用于接收所述负载对比模块中初次负载大于二次负载对应的控制通道,分割出冗余至空闲通道进行配置。
5.根据权利要求4所述的能够自动适配多余度配置的综合控制计算机系统,其特征在于:所述平衡分配模块还包括分割反馈模块,所述分割反馈模块用于在所述平衡分配模块发出分割指令后,对当前控制通道内的冗余进行定量分割,并发出反馈信号至监控反馈模块中,再次对比初次负载和二次负载,若初次负载还是大于二次负载,则重复上述操作,直至初次负载小于等于二次负载。
6.根据权利要求4所述的能够自动适配多余度配置的综合控制计算机系统,其特征在于:所述故障变更单元(400)包括空闲通道确定模块、备用通道调出模块和冗余传输模块;
所述空闲通道确定模块用于连接所述负载评估模块的输出端,在冗余分配完成后,调出没有被分配冗余的控制通道,定义为空闲通道;
所述备用通道调出模块用于设置备用通道,在接收到所述冗余传输模块的调取信号后,将备用通道与已有控制通道连接;
所述冗余传输模块用于先接收空闲通道确定模块的空闲通道,若存在空闲通道,则将冗余传输至空闲通道,若不存在空闲通道,则发出调取信号,接收所述备用通道调出模块的备用通道,将冗余传输至备用通道。
7.根据权利要求6所述的能够自动适配多余度配置的综合控制计算机系统,其特征在于:所述故障变更单元(400)还包括故障提醒模块,所述故障提醒模块用于接收到所述运行检测模块的故障运行状态时,传输传输信号至冗余传输模块,使故障运行状态对应控制通道内的冗余传输至空闲通道,并采用声光报警器发出预警信号。
8.根据权利要求7所述的能够自动适配多余度配置的综合控制计算机系统,其特征在于:通道监控单元(100)还包括间隔监测模块,所述间隔监测模块用于设置监测间隔,每达到监测间隔则发出控制信号,控制所述运行检测模块对控制通道进行监测;
所述间隔监测模块在接收到所述故障提醒模块的故障运行状态的信号时,直接控制所述运行检测模块对控制通道进行监测在监测间隔内进行多次监测,若多次监测均为故障运行,则发出控制通道确定故障信号,若多次监测中含有正常运行信号,则发出异常信号。
CN202311434089.8A 2023-11-01 2023-11-01 一种能够自动适配多余度配置的综合控制计算机系统 Active CN117149533B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311434089.8A CN117149533B (zh) 2023-11-01 2023-11-01 一种能够自动适配多余度配置的综合控制计算机系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311434089.8A CN117149533B (zh) 2023-11-01 2023-11-01 一种能够自动适配多余度配置的综合控制计算机系统

Publications (2)

Publication Number Publication Date
CN117149533A true CN117149533A (zh) 2023-12-01
CN117149533B CN117149533B (zh) 2024-01-23

Family

ID=88903194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311434089.8A Active CN117149533B (zh) 2023-11-01 2023-11-01 一种能够自动适配多余度配置的综合控制计算机系统

Country Status (1)

Country Link
CN (1) CN117149533B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916090A (zh) * 2010-07-14 2010-12-15 北京航空航天大学 一种无人机机载三余度电气负载管理中心
CN105182944A (zh) * 2015-09-30 2015-12-23 成都飞机工业(集团)有限责任公司 一种无人机全数字固态配电管理系统及配电管理方法
KR101723932B1 (ko) * 2016-09-27 2017-04-18 국방과학연구소 이중화 채널을 포함하는 비행조종컴퓨터의 고장 진단 방법
US20190004515A1 (en) * 2017-06-29 2019-01-03 The Boeing Company Fault Coverage for Multiple Failures in Redundant Systems
CN109714190A (zh) * 2018-11-28 2019-05-03 四川商通实业有限公司 一种基于应用级别的负载均衡与故障转移系统及其方法
CN116700993A (zh) * 2023-08-02 2023-09-05 浪潮(北京)电子信息产业有限公司 一种负载均衡方法、装置、设备及可读存储介质
CN116880151A (zh) * 2023-08-04 2023-10-13 苏州宇洽科技有限公司 一种多余度计算机控制系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916090A (zh) * 2010-07-14 2010-12-15 北京航空航天大学 一种无人机机载三余度电气负载管理中心
CN105182944A (zh) * 2015-09-30 2015-12-23 成都飞机工业(集团)有限责任公司 一种无人机全数字固态配电管理系统及配电管理方法
KR101723932B1 (ko) * 2016-09-27 2017-04-18 국방과학연구소 이중화 채널을 포함하는 비행조종컴퓨터의 고장 진단 방법
US20190004515A1 (en) * 2017-06-29 2019-01-03 The Boeing Company Fault Coverage for Multiple Failures in Redundant Systems
CN109714190A (zh) * 2018-11-28 2019-05-03 四川商通实业有限公司 一种基于应用级别的负载均衡与故障转移系统及其方法
CN116700993A (zh) * 2023-08-02 2023-09-05 浪潮(北京)电子信息产业有限公司 一种负载均衡方法、装置、设备及可读存储介质
CN116880151A (zh) * 2023-08-04 2023-10-13 苏州宇洽科技有限公司 一种多余度计算机控制系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
闫稳;: "机载供电系统双余度控制器的容错控制", 航空计算技术, vol. 40, no. 04, pages 86 - 88 *

Also Published As

Publication number Publication date
CN117149533B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
CN106657212B (zh) 自助终端状态监控方法及系统
CN105007312A (zh) 一种云计算服务器自适应负载均衡控制方法及控制系统
CN103580902B (zh) 一种计算机信息系统及其动态容灾方法
US6557035B1 (en) Rules-based method of and system for optimizing server hardware capacity and performance
US20210006505A1 (en) A bursty traffic allocation method, device and proxy server
CN109067597A (zh) 一种分布式系统动态智能服务治理方法
EP0913772B1 (en) Integrated overload control for distributed real time systems
CN101454741A (zh) 分布式系统中动态调节资源用电的方法和装置
US9641431B1 (en) System and methods for utilization-based balancing of traffic to an information retrieval system
WO2021012510A1 (zh) Cpu使用率自适应调整方法、装置、终端及存储介质
CN106656533A (zh) 一种集群系统的负荷处理监控方法及装置
KR20200106662A (ko) 멀티태스킹시스템을 포함하는 공작기계 및 공작기계의 멀티태스킹방법
CN117149533B (zh) 一种能够自动适配多余度配置的综合控制计算机系统
CN117331425B (zh) 功耗管理系统、功耗管理方法、存储介质及电子设备
CN117175776A (zh) 基于智能控制技术的ups节能系统
CN113391611B (zh) 动力环境监控系统的预警方法、装置及系统
CN111309132B (zh) 一种服务器多档位电源冗余的方法
US20220321644A1 (en) Information processing apparatus, information processing system, non-transitory computer-readable medium, and information processing method
Xue et al. Tale of tails: Anomaly avoidance in data centers
CN112686501A (zh) 生产线的分析方法、装置、生产线、存储介质及处理器
CN111209102A (zh) 一种分布式任务分发方法与系统
CN118041745B (zh) 物联网电表故障监测方法及系统
CN108664311B (zh) 虚拟机迁移控制方法及装置
CN110505115B (zh) 一种监控交换机跑高风险的方法和装置
CN118400376B (zh) 一种自助洗车机服务器负载的动态均衡方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant