CN117118862A - 一种大数据中心监控数据可视化系统及方法 - Google Patents

一种大数据中心监控数据可视化系统及方法 Download PDF

Info

Publication number
CN117118862A
CN117118862A CN202311354426.2A CN202311354426A CN117118862A CN 117118862 A CN117118862 A CN 117118862A CN 202311354426 A CN202311354426 A CN 202311354426A CN 117118862 A CN117118862 A CN 117118862A
Authority
CN
China
Prior art keywords
equipment
data
monitoring
information
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311354426.2A
Other languages
English (en)
Inventor
杨叶
刘佳
胡丁
刘强
钟显宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Sanxiang Bank Co Ltd
Original Assignee
Hunan Sanxiang Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Sanxiang Bank Co Ltd filed Critical Hunan Sanxiang Bank Co Ltd
Priority to CN202311354426.2A priority Critical patent/CN117118862A/zh
Publication of CN117118862A publication Critical patent/CN117118862A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Environmental & Geological Engineering (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及监控数据处理技术领域,尤其涉及一种大数据中心监控数据可视化系统及方法。所述方法包括以下步骤:在机柜面板上配置IP地址信息并获取设备接入信息;根据设备接入信息与IP地址信息将机柜设备接入远程控制管理交换机,得到远程监控信息;其中机柜面板与机柜设备通过电性连接;对远程监控信息进行信息采集处理,得到监控服务器控制信息;通过监控服务器控制信息响应监控服务器,通过监控服务器实时监控数据中心内部IT设备,得到IT设备监控信息;根据IT设备监控信息使用SNMP协议采集数据中心内部IT设备的运行状态信息,得到原始IT设备监控信息。本发明能够提高现场巡检的效率和准确率。

Description

一种大数据中心监控数据可视化系统及方法
技术领域
本发明涉及监控数据处理技术领域,尤其涉及一种大数据中心监控数据可视化系统及方法。
背景技术
数据中心是现代企业极为重要的组成部分,承载着企业的核心系统和业务数据。为了确保数据中心系统的可靠性、稳定性和可用性,需要对其中的IT设备进行全面监控。设备的可视化监控方法已经成为现代IT运维中的常见实践。不能否认的是,现代IT环境已经产生了许多复杂的系统和设备,为监测和管理这些设备和系统带来了挑战。可视化监控方法可以帮助IT管理人员在实时监测设备状态的同时,了解设备健康与性能状况,方便管理人员对设备的性能进行调整,减少系统宕机和业务中断的风险。IT设备监控系统是一种用来监测计算机系统硬件状态的系统,能够实时、准确地监视网络设备的运行状况,为IT管理员提供全面的故障管理和设备维护服务。IT设备监控系统以网络为基础,利用各种网络协议和技术,在实时监测和记录设备的运行状况的同时,还能及时报警、提供维护和保养指导。然而,机房运维人员在数据中心现场巡检时,通常仅能巡查设备运行指示灯是否有异常灯,以指示灯状态来判断设备运行状态存在一定的误差,局限性较大。
发明内容
基于此,有必要提供一种大数据中心监控数据可视化系统及方法,以解决至少一个上述技术问题。
为实现上述目的,一种大数据中心监控数据可视化方法,包括以下步骤:
步骤S1:在机柜面板上配置IP地址信息并获取机柜设备接入信息;根据机柜设备接入信息与IP地址信息将机柜设备接入远程控制管理交换机,得到远程监控信息;其中机柜面板与机柜设备通过电性连接;
步骤S2:对远程监控信息进行信息采集处理,得到监控服务器控制信息;通过监控服务器控制信息响应监控服务器,通过监控服务器实时监控数据中心内部IT设备,得到IT设备监控信息;
步骤S3:根据IT设备监控信息使用SNMP协议采集数据中心内部IT设备的运行状态信息,得到原始IT设备监控信息;利用智能降噪算法对原始IT设备监控信息进行降噪处理,以得到IT设备监控数据;
步骤S4:对IT设备监控数据进行数据预处理,将预处理后的IT设备监控数据利用傅里叶变换算法进行数据转换,得到监控数据;将监控数据内的IT设备运行情况可视化展示到机柜面板,得到IT设备运行情况信息;
步骤S5:利用历史溯源算法对IT设备运行情况信息进行时间回溯处理,得到IT设备运行的历史数据;通过预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,以生成IT设备运行告警类型;
步骤S6:将IT设备运行告警类型可视化展示在机柜面板中。
本发明通过在机柜面板上配置IP地址信息和获取机柜设备接入信息将机柜设备接入到远程控制管理交换机中,便于机柜设备的远程控制和监控,其中机柜面板与机柜设备通过电性连接,这可以提高管理员对机柜设备的管理效率,并减少设备故障和运行问题的发生。通过对远程监控信息进行信息采集处理以得到监控服务器控制信息,通过监控服务器控制信息响应监控服务器,管理员可以实时地监控机柜设备的状态,包括机柜内设备的温度、湿度等环境信息,以及机柜设备的运行状态和任何异常。这可以帮助管理员及时发现和解决机柜设备问题,提高机柜面板的稳定性和可靠性。接下来,通过使用SNMP协议采集数据中心内部IT设备的运行状态信息,并利用智能降噪算法对原始IT设备监控数据进行降噪处理,即可提高数据的准确性和可信度。这可以帮助管理员更好地了解IT设备的运行情况,及时进行故障排除和预防。对IT设备监控数据进行数据预处理可以过滤掉噪声和无关数据,提高监控数据的精准度和可靠性,通过将监控数据可视化后展示到机柜面板,可以帮助运维人员分析IT设备性能趋势,方便追踪IT设备的性能变化及其所处环境,根据趋势预测IT设备性能的未来发展,帮助优化IT设备管理和资源规划。通过将监控数据可视化展示到机柜面板上,管理员可以更直观地了解IT设备的运行状况。此外,通过将IT设备监控数据进行傅里叶变换,可以更好地理解和分析IT设备监控数据,为运维人员提供更有价值的信息。然后,通过利用历史溯源算法对IT设备运行情况信息进行时间回溯处理,并使用预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,生成不同类型的IT设备运行告警,可以实时发现IT设备运行异常,快速响应并避免IT设备故障导致的系统中断和数据丢失,从而提高IT设备的运行稳定性。最后,将IT设备运行告警类型可视化展示在机柜面板中,为监控IT设备异常行为提供了更加可视化的方式,可以很好地规避潜在故障和成本损失。通过预防性维护手段,可以减少故障发生的可能性,降低IT设备损坏的风险。机房运维人员可以通过机柜面板快速浏览IT设备告警信息,并判断IT设备运行问题所在,机柜面板上展示的IT设备运行告警类型,为机房运维人员提供记录工具,记录IT设备运行问题并跟踪处理过程。通过记录和跟踪问题,可以更好地控制IT设备运行问题,而且运维人员在数据中心现场巡检时能够及时发现异常运行情况,并提高IT设备的可靠性和稳定性。
优选地,在本说明书中,还提供了一种大数据中心监控数据可视化系统,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上任一项所述的大数据中心监控数据可视化方法。
综上所述,本发明提供了一种大数据中心监控数据可视化系统,该系统能够实现本发明所述任意一种大数据中心监控数据可视化方法,用于联合存储器、处理器及存储器上运行的计算机程序之间的操作实现一种大数据中心监控数据可视化方法,系统内部结构互相协作,该监控系统能够实时监控数据中心内部IT设备的运行状态和工作情况,对于IT设备的工作状态异常可以快速响应,并提供及时的解决方案,保证IT设备的高效、稳定运行,能够将IT设备的状态、所属位置等信息可视化展示在一个统一的机柜面板上,从而使得运维人员得以更加方便地查看IT设备状态,及时发现问题,快速解决故障,并且能够对IT设备进行远程监控,并提供实时告警功能,能够帮助避免恶意攻击、数据安全问题和机房安全问题,提高IT设备的安全性。
附图说明
通过阅读参照以下附图所作的对非限制性实施所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一种大数据中心监控数据可视化方法的步骤流程示意图;
图2为图1中步骤S1的详细实施步骤流程示意图;
图3为图1中步骤S2的详细实施步骤流程示意图;
图4为图1中步骤S4的详细实施步骤流程示意图;
图5为图1中步骤S5的详细实施步骤流程示意图;
图6为图5中步骤S53的详细实施步骤流程示意图。
具体实施方式
下面结合附图对本发明专利的技术方法进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为实现上述目的,请参阅图1至图6,本发明提供了一种大数据中心监控数据可视化方法,所述方法包括以下步骤:
步骤S1:在机柜面板上配置IP地址信息并获取机柜设备接入信息;根据机柜设备接入信息与IP地址信息将机柜设备接入远程控制管理交换机,得到远程监控信息;其中机柜面板与机柜设备通过电性连接;
步骤S2:对远程监控信息进行信息采集处理,得到监控服务器控制信息;通过监控服务器控制信息响应监控服务器,通过监控服务器实时监控数据中心内部IT设备,得到IT设备监控信息;
步骤S3:根据IT设备监控信息使用SNMP协议采集数据中心内部IT设备的运行状态信息,得到原始IT设备监控信息;利用智能降噪算法对原始IT设备监控信息进行降噪处理,以得到IT设备监控数据;
步骤S4:对IT设备监控数据进行数据预处理,将预处理后的IT设备监控数据利用傅里叶变换算法进行数据转换,得到监控数据;将监控数据内的IT设备运行情况可视化展示到机柜面板,得到IT设备运行情况信息;
步骤S5:利用历史溯源算法对IT设备运行情况信息进行时间回溯处理,得到IT设备运行的历史数据;通过预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,以生成IT设备运行告警类型;
步骤S6:将IT设备运行告警类型可视化展示在机柜面板中。
本发明实施例中,参考图1所示,为本发明一种大数据中心监控数据可视化方法的步骤流程示意图,在本实例中,所述大数据中心监控数据可视化方法的步骤包括:
步骤S1:在机柜面板上配置IP地址信息并获取机柜设备接入信息;根据机柜设备接入信息与IP地址信息将机柜设备接入远程控制管理交换机,得到远程监控信息;其中机柜面板与机柜设备通过电性连接;
本发明实施例通过在机柜面板上配置IP地址信息并获取机柜设备接入信息,然后根据机柜设备接入信息与IP地址信息将机柜设备接入到远程控制管理交换机上,最终得到远程监控信息,其中机柜面板与机柜设备通过电性连接。
步骤S2:对远程监控信息进行信息采集处理,得到监控服务器控制信息;通过监控服务器控制信息响应监控服务器,通过监控服务器实时监控数据中心内部IT设备,得到IT设备监控信息;
本发明实施例通过对远程监控信息进行信息采集处理,以获得监控服务器控制信息,通过监控服务器控制信息响应于监控服务器,利用监控服务器实时监控数据中心内部IT设备,最终得到IT设备监控信息。
步骤S3:根据IT设备监控信息使用SNMP协议采集数据中心内部IT设备的运行状态信息,得到原始IT设备监控信息;利用智能降噪算法对原始IT设备监控信息进行降噪处理,以得到IT设备监控数据;
本发明实施例通过采用SNMP协议收集IT设备监控信息,通过SNMP代理方式对数据中心内部IT设备进行监控,然后采集数据中心内部IT设备的运行状态信息,通过运行状态信息掌握IT设备的实时状态、及时发现IT设备异常状态,以得到原始IT设备监控数据,最后,利用智能降噪算法对原始IT设备监控数据进行降噪处理,最终得到更准确、可靠的IT设备监控数据。
步骤S4:对IT设备监控数据进行数据预处理,将预处理后的IT设备监控数据利用傅里叶变换算法进行数据转换,得到监控数据;将监控数据内的IT设备运行情况可视化展示到机柜面板,得到IT设备运行情况信息;
本发明实施例通过对IT设备监控数据进行数据预处理,提取出IT设备监控数据中的关键信息,清除异常数据干扰,并通过利用傅里叶变换算法对预处理后的IT设备监控数据进行数据转换,以得到监控数据。然后,通过利用数据分析和可视化技术将监控数据可视化展示到机柜面板上,以提供更直接、更直观的IT设备运行情况,最终得到IT设备运行情况信息。
步骤S5:利用历史溯源算法对IT设备运行情况信息进行时间回溯处理,得到IT设备运行的历史数据;通过预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,以生成IT设备运行告警类型;
本发明实施例通过利用历史溯源算法对IT设备运行情况信息进行时间回溯处理,以回溯出IT设备运行的历史数据,然后运用预设的异常监控算法模型训练IT设备运行的历史数据,对模型进行参数优化,以得到优化的异常监控算法模型,最后将原始的IT设备运行数据重新输入到优化的异常监控算法模型中进行信息检测,检测IT设备运行是否正常,与预设的异常规则进行比较和分析,判断是否出现异常情况并生成相应的告警信息,最终生成IT设备运行告警类型。
步骤S6:将IT设备运行告警类型可视化展示在机柜面板中。
本发明实施例通过在机柜面板可视化展示IT设备运行告警类型,能够提供实时的IT设备运行状态问题,运维人员通过在巡检过程中观察机柜面板的告警类型展示信息,及时发现IT设备的异常状况,并记录IT设备的实际状态情况,对IT设备进行维护或更换等操作。
本发明通过在机柜面板上配置IP地址信息和获取机柜设备接入信息将机柜设备接入到远程控制管理交换机中,便于机柜设备的远程控制和监控,其中机柜面板与机柜设备通过电性连接,这可以提高管理员对机柜设备的管理效率,并减少设备故障和运行问题的发生。通过对远程监控信息进行信息采集处理以得到监控服务器控制信息,通过监控服务器控制信息响应监控服务器,管理员可以实时地监控机柜设备的状态,包括机柜内设备的温度、湿度等环境信息,以及机柜设备的运行状态和任何异常。这可以帮助管理员及时发现和解决机柜设备问题,提高机柜面板的稳定性和可靠性。接下来,通过使用SNMP协议采集数据中心内部IT设备的运行状态信息,并利用智能降噪算法对原始IT设备监控数据进行降噪处理,即可提高数据的准确性和可信度。这可以帮助管理员更好地了解IT设备的运行情况,及时进行故障排除和预防。对IT设备监控数据进行数据预处理可以过滤掉噪声和无关数据,提高监控数据的精准度和可靠性,通过将监控数据可视化后展示到机柜面板,可以帮助运维人员分析IT设备性能趋势,方便追踪IT设备的性能变化及其所处环境,根据趋势预测IT设备性能的未来发展,帮助优化IT设备管理和资源规划。通过将监控数据可视化展示到机柜面板上,管理员可以更直观地了解IT设备的运行状况。此外,通过将IT设备监控数据进行傅里叶变换,可以更好地理解和分析IT设备监控数据,为运维人员提供更有价值的信息。然后,通过利用历史溯源算法对IT设备运行情况信息进行时间回溯处理,并使用预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,生成不同类型的IT设备运行告警,可以实时发现IT设备运行异常,快速响应并避免IT设备故障导致的系统中断和数据丢失,从而提高IT设备的运行稳定性。最后,将IT设备运行告警类型可视化展示在机柜面板中,为监控IT设备异常行为提供了更加可视化的方式,可以很好地规避潜在故障和成本损失。通过预防性维护手段,可以减少故障发生的可能性,降低IT设备损坏的风险。机房运维人员可以通过机柜面板快速浏览IT设备告警信息,并判断IT设备运行问题所在,机柜面板上展示的IT设备运行告警类型,为机房运维人员提供记录工具,记录IT设备运行问题并跟踪处理过程。通过记录和跟踪问题,可以更好地控制IT设备运行问题,而且运维人员在数据中心现场巡检时能够及时发现异常运行情况,并提高IT设备的可靠性和稳定性。
优选地,步骤S1包括以下步骤:
步骤S11:设计机柜面板并利用光纤接入机柜设备,通过机柜设备监控机柜面板,得到机柜面板信息;其中机柜面板与机柜设备通过电性连接;
步骤S12:基于机柜面板信息在机柜面板上配置IP地址并获取机柜设备接入信息;
步骤S13:根据机柜设备接入信息将机柜设备接入到本地网络中的远程控制管理交换机,得到远程监控信息。
作为本发明的一个实施例,参考图2所示,为图1中步骤S1的详细步骤流程示意图,在本实施例中步骤S1包括以下步骤:
步骤S11:设计机柜面板并利用光纤接入机柜设备,通过机柜设备监控机柜面板,得到机柜面板信息;其中机柜面板与机柜设备通过电性连接;
本发明实施例通过设计一个机柜面板,利用光纤将机柜面板接入机柜设备当中,通过机柜设备监控机柜面板,最终得到机柜面板信息,其中机柜面板与机柜设备通过电性连接。
步骤S12:基于机柜面板信息在机柜面板上配置IP地址并获取机柜设备接入信息;
本发明实施例基于机柜面板信息在机柜面板上配置IP地址,建立与远程控制管理交换机相通的网络通道并获取机柜设备接入信息。
步骤S13:根据机柜设备接入信息将机柜设备接入到本地网络中的远程控制管理交换机,得到远程监控信息。
本发明实施例通过利用机柜设备接入信息将机柜设备接入到与该IP地址的地址一致远程控制管理交换机中,最终得到远程监控信息。
本发明通过设计一个机柜面板,利用光纤接入机柜设备,通过机柜设备监控机柜面板,最终得到机柜面板信息,其中机柜面板与机柜设备通过电性连接,机柜面板信息涵盖了机柜内部的许多关键数据,包括机柜设备的温度、湿度、能耗、供电状态等,通过机柜面板可以及时掌握机柜设备的运行状况,避免设备故障和安全问题。通过基于机柜面板信息配置IP地址并获取机柜设备接入信息,可以将机柜设备接入到本地网络中,便于实现机柜设备的远程监控和管理。机柜设备接入信息可以方便地配置在机柜面板上,可以快速简便地让机柜设备接入网络并方便地修改IP地址,减少了机柜设备接入过程的复杂度和不便。然后,通过利用远程控制管理交换机,可以将机柜设备接入到远程控制管理交换机上,方便监控并快速发现数据中心内部IT设备的故障信息,提高监控效率和管理效率。最后得到远程监控信息,为后续的IT设备监控操作提供了监控信息来源,通过采用远程监控方式,设备的异常情况可以及时监测到,并从远程控制管理交换机中获取IT设备的故障信息,运维人员可以及时响应和解决问题,缩短设备维修周期,提高关键业务系统的可用性及服务水平。另外,远程监控可以为IT设备的硬件维护、软件升级以及布线等运维管理事项提供更多的帮助,减少对于工程师的人力投入,从而降低运维成本。
优选地,步骤S2包括以下步骤:
步骤S21:对远程监控信息进行信息采集处理,得到监控服务器控制信息;
步骤S22:将监控服务器控制信息传输至数据中心内部IT设备的监控服务器中,通过监控服务器控制信息响应监控服务器,得到监控服务器监控信息;
步骤S23:根据监控服务器监控信息实时监控数据中心内部IT设备,得到IT设备监控信息。
作为本发明的一个实施例,参考图3所示,为图1中步骤S2的详细步骤流程示意图,在本实施例中步骤S2包括以下步骤:
步骤S21:对远程监控信息进行信息采集,得到监控服务器控制信息;
本发明实施例通过对得到的远程监控信息采集与监控服务器相关的信息,最终得到监控服务器控制信息。
步骤S22:将监控服务器控制信息传输至数据中心内部IT设备的监控服务器中,通过监控服务器控制信息响应监控服务器,得到监控服务器监控信息;
本发明实施例将采集到的监控服务器控制信息通过网络传输至数据中心内部IT设备的监控服务器中,将监控服务器控制信息响应于监控服务器,最终得到监控服务器监控信息。
步骤S23:根据监控服务器监控信息实时监控数据中心内部IT设备,得到IT设备监控信息。
本发明实施例通过对监控服务器监控信息进行统计和分析,实时监控数据中心内部IT设备,最终得到IT设备监控信息。
本发明通过对远程监控信息进行信息采集,以得到监控服务器控制信息,将其传输至监控服务器,并在监控服务器内响应实现对数据中心内部IT设备的实时监控,能够及时发现IT设备异常状况。监控服务器能够将采集到的信息分类整合,并对其进行处理,从而得到有效的监控服务器监控信息,提高了监控效率。最后,通过监控服务器监控信息实时监控数据中心内部IT设备,得到IT设备监控信息,利用IT设备监控信息远程监控能够避免或者减少物理巡检成本,控制人员可以远程监控机柜面板,减少维护和调试所需的人力以及时间成本,同时也可以及时找出问题的根源,加速故障处理进程。远程监控数据中心内部IT设备能够增加机柜设备的安全性,避免不必要的人为干预,远程监控也能够为IT设备提供更严密的权益认证和访问控制。
优选地,步骤S3包括以下步骤:
步骤S31:通过在数据中心内部IT设备内安装SNMP代理,使用SNMP协议收集IT设备监控信息,得到IT设备监控信息数据;
本发明实施例根据数据中心内部IT设备的类型、功能和运行情况,选择合适的SNMP代理,将选定的SNMP代理安装到数据中心内部IT设备中,然后通过使用SNMP协议收集IT设备监控信息,最终得到IT设备监控信息数据。
步骤S32:根据IT设备监控信息数据采集数据中心内部IT设备的运行状态信息,得到原始IT设备监控信息;对原始IT设备监控信息进行数据转换处理,得到原始IT设备监控数据;
本发明实施例通过对IT设备监控信息数据进行实时监控和分析,采集数据中心内部IT设备的运行状态信息,获取IT设备的运行趋势和状态,及时发现潜在的问题,然后,将原始IT设备监控信息转换为数据格式,最终得到原始IT设备监控数据。
步骤S33:利用智能降噪算法对原始IT设备监控数据进行降噪处理,获得噪声值;
本发明实施例通过使用智能降噪算法对原始IT设备监控数据进行降噪处理,该智能降噪算法包括线性处理过程和非线性处理过程,在进行降噪处理之前,需要预先确定降噪采样时间间隔、降噪指数衰减系数、降噪采样时间偏移量、自回归滤波器的系数以及非线性处理函数的系数,其中降噪采样时间间隔是指数据采样的时间间隔,降噪指数衰减系数则是指在降噪处理过程中,噪声随时间的指数衰减的速度,降噪采样时间偏移量是指为了防止降噪时间出现误差而设定的调整参数,自回归滤波器是一种滤波器,用于对时间序列数据进行平滑处理,其系数需要根据实际情况来确定,非线性处理函数是一种将噪声数据经过非线性变换得到更准确的数据的方法,其参数也需要根据实际情况来确定。利用自回归滤波器对原始IT设备监控数据进行平滑处理,以去除原始IT设备监控数据中的噪声成分,然后根据降噪指数衰减系数和降噪采样时间间隔,利用平均积分法计算出噪声值,并用噪声值对原始IT设备监控数据进行修正,该过程为线性处理过程。最后,利用非线性处理函数将噪声数据进行变换,得到更加准确的噪声值。
其中,智能降噪算法的公式如下所示:
式中,为噪声值,/>为降噪采样时间,/>为降噪采样时间偏移量,/>为降噪指数衰减系数,/>为原始IT设备监控数据,/>为降噪采样时间间隔,/>为自回归滤波器的数量,为第/>个自回归滤波器的系数,/>为第/>个非线性处理噪声值函数的系数,/>为第/>个非线性处理噪声值函数,/>为非线性处理的数量,/>为智能降噪算法的常数偏移量;
本发明构建了一个智能降噪算法的公式,为了消除原始IT设备监控数据中噪声对异常监控过程准确度的影响,需要对原始IT设备监控数据进行降噪处理,得到更加干净、准确的IT设备监控数据,通过该算法最终获得噪声值,该算法公式充分考虑了降噪采样时间,降噪采样时间偏移量/>,降噪指数衰减系数/>,原始IT设备监控数据/>,降噪采样时间间隔,自回归滤波器的数量/>,第/>个自回归滤波器的系数/>,通过以上参数形成了一种进行线性降噪处理的函数关系/>,另外,该算法公式还需要考虑非线性降噪处理过程的函数关系/>,其中参数包括/>为正整数,第/>个非线性处理噪声值函数的系数/>,第/>个非线性处理噪声值函数/>,非线性处理的数量/>,根据噪声值/>与各参数之间的相互关系构成了一种函数关系,该算法公式实现了对原始IT设备监控数据进行降噪处理,同时,该公式中智能降噪算法的常数偏移量/>可以根据实际情况进行调整,从而提高智能降噪算法的准确性和鲁棒性。
步骤S34:若噪声值大于或等于预设的噪声阈值时,剔除该噪声值对应的原始IT设备监控数据,得到IT设备监控数据;若噪声值小于预设的噪声阈值时,则将原始IT设备监控数据定义为IT设备监控数据。
本发明实施例根据设备监控系统的要求,预先设定噪声阈值,若噪声值大于或等于预设的噪声阈值时,则认为该原始IT设备监控数据中包含噪声,会对后续的异常监控过程产生影响,需要将其剔除,以得到IT设备监控数据,若噪声值小于预设的噪声阈值时,则将原始IT设备监控数据定义为IT设备监控数据。
本发明通过SNMP代理,可以实时监测数据中心内部IT设备的运行状态信息,及时发现设备的异常情况,从而防止因IT设备故障引起的业务中断。SNMP协议具有接口简单、可靠性高、可扩展性强、安全性好等优点,可以保证IT设备监控数据的准确性。通过采用SNMP协议收集IT设备监控信息,对数据中心内部IT设备的监控通过代理方式完成,可以简化监控过程,减少了对数据中心内部IT设备的监控资源的需求,降低了操作难度和监控成本。通过IT设备监控信息数据采集数据中心内部IT设备的运行状态信息,可以保证监控数据的准确性,及时掌握IT设备运行情况,避免数据监测不准确和误报等问题。通过使用智能降噪算法可以去除因噪声而导致的异常监控判断错误,从而获得更准确、可靠和稳定的IT设备监控数据,为进一步的数据处理和分析提供更好的基础。通过剔除大于或等于预设噪声阈值的噪声值对应的原始IT设备监控数据,可以减少数据处理和分析的误差和不确定性,防止噪声值对后续分析和预测结果产生不良影响,提高IT设备运行状态监控的准确度和可靠性。
优选地,步骤S4包括以下步骤:
步骤S41:对IT设备监控数据进行数据预处理,得到初始监控数据;
步骤S42:构建监控数据特征数据库,通过傅里叶变换算法对初始监控数据进行特征提取转换,以生成监控数据特征并保存至监控数据特征数据库;
其中,傅里叶变换算法的公式如下所示:
式中,为监控数据特征,/>为频率参数,/>为傅里叶变换算法谐波分量参数,/>为傅里叶变换算法信号转变偏移参数,/>为傅里叶变换算法信号相位转变参数,/>为要进行特征提取转换的初始监控数据,/>为要进行特征提取转换的初始监控数据参数,/>为调和平滑参数,/>为第/>个预设的初始监控数据基函数,/>为第/>个基函数的系数,/>为预设的初始监控数据基函数的数量,/>为傅里叶变换算法的修正值;
步骤S43:获取监控数据特征数据库中监控数据特征中的特征数据包,根据特征数据包获取与IT设备运行情况相关的数据,得到监控数据;
步骤S44:根据监控数据利用数据分析和可视化技术将IT设备运行情况可视化展示到机柜面板,得到IT设备运行情况信息。
作为本发明的一个实施例,参考图4所示,为图1中步骤S4的详细步骤流程示意图,在本实施例中步骤S4包括以下步骤:
步骤S41:对IT设备监控数据进行数据预处理,得到初始监控数据;
本发明实施例通过对IT设备监控数据进行缺失值填补、去除异常值或无关变量、重复值以及清除不必要的噪声数据,最终得到初始监控数据。
步骤S42:构建监控数据特征数据库,通过傅里叶变换算法对初始监控数据进行特征提取转换,以生成监控数据特征并保存至监控数据特征数据库;
本发明实施例通过构建一个监控数据特征数据库,通过傅里叶变换算法对预处理后的初始监控数据进行特征提取转换,将初始监控数据分成若干段等长序列,对每段序列进行等间隔采样,并生成时域序列,对每个时域序列进行傅里叶变换得到频域序列,在频域序列中选择合适的频率区间和基函数,并提取频率谐波和相位信息,最终得到监控数据特征并将其保存至构建的监控数据特征数据库当中。
其中,傅里叶变换算法的公式如下所示:
式中,为监控数据特征,/>为频率参数,/>为傅里叶变换算法谐波分量参数,/>为傅里叶变换算法信号转变偏移参数,/>为傅里叶变换算法信号相位转变参数,/>为要进行特征提取转换的初始监控数据,/>为要进行特征提取转换的初始监控数据参数,/>为调和平滑参数,/>为第/>个预设的初始监控数据基函数,/>为第/>个基函数的系数,/>为预设的初始监控数据基函数的数量,/>为傅里叶变换算法的修正值;
本发明构建了一个傅里叶变换算法的公式,可以对初始监控数据进行频域特征分析和提取,通过傅里叶变换算法可以将原始的时间序列信号转换为频率分布的形式,得到每个频率分量的信号幅值和相位信息,从而获得更精准的监控数据。该算法公式分为了两个部分,充分考虑了频率参数,傅里叶变换算法谐波分量参数/>,傅里叶变换算法信号转变偏移参数/>,傅里叶变换算法信号相位转变参数/>,要进行特征提取转换的初始监控数据,要进行特征提取转换的初始监控数据参数/>,调和平滑参数/>,通过以上参数形成了积分特征变换关系/>,其中通过调整/>的值可以增加或减少谐波分量,调整/>的值可以改变信号的偏移,调整/>的值可以改变信号的相位,从而提取不同的信号特征,另外,还考虑了第/>个预设的初始监控数据基函数/>,第/>个基函数的系数/>,预设的初始监控数据基函数的数量/>,通过选择不同的基函数来捕获信号的不同特征,同时也可以通过调整基函数系数来控制特征提取的效果,并根据监控数据特征/>与以上参数构成了一种函数关系/>,该算法公式实现了对初始监控数据的特征提取转换工作,同时,该公式中傅里叶变换算法的修正值/>可以根据实际情况进行调整,从而提高傅里叶变换算法的准确性和适用性。
步骤S43:获取监控数据特征数据库中监控数据特征中的特征数据包,根据特征数据包获取与IT设备运行情况相关的数据,得到监控数据;
本发明实施例运用查询和访问语句获取监控数据特征数据库中的监控数据特征的数据包,提取数据包中与IT设备运行情况相关的监控数据特征,最终得到监控数据。
步骤S44:根据监控数据利用数据分析和可视化技术将IT设备运行情况可视化展示到机柜面板,得到IT设备运行情况信息。
本发明实施例通过对预处理后的监控数据进行统计和分析,获取IT设备运行的趋势和状态,发现IT设备运行潜在的问题,根据实际情况利用可视化技术在机柜面板上设计可视化界面和布局,将各IT设备运行情况可视化展示到机柜面板,最终得到IT设备运行情况信息。
本发明通过对IT设备监控数据进行数据预处理,可以自动化处理大量的IT设备监控数据,并提取出有价值的特征信息,为IT设备运行情况的分析和监控提供支持。通过构建监控数据特征数据库,方便对监控数据特征进行存储和管理,并可以通过利用傅里叶变换算法对初始监控数据进行特征提取来生成具备代表性的监控数据特征,从而降低初始监控数据的复杂度和噪声干扰,提高监控效率和准确性,从而得到准确的与IT设备运行情况相关的监控数据。然后,通过利用数据分析和可视化技术,可以将监控数据可视化展示到机柜面板上,以提供更直接、更直观的IT设备运行情况信息,快速发现异常IT设备,及时采取相应措施,从而提高IT设备运行的可靠性和稳定性。通过可视化展示监控数据,运维人员可以更全面地了解IT设备的运行情况,更快地发现IT设备存在的问题和风险,辅助运维人员进行决策和调整,确保数据中心的系统稳定性和高效性。
优选地,步骤S5包括以下步骤:
步骤S51:通过对IT设备运行情况信息进行数据采集,得到IT设备运行数据;
步骤S52:利用历史溯源算法对IT设备运行数据进行时间回溯处理,得到IT设备运行的历史数据;
其中,历史溯源算法的公式如下所示:
式中,为IT设备运行在时间/>处的历史数据,/>为回溯时间窗口大小,/>为时间/>的IT设备运行数据,/>为响应函数,/>为时间扩散系数,/>为历史初始时间,为指数函数,/>为滞后项个数,/>为第/>个滞后项系数,/>为IT设备运行在时间/>处的历史数据,/>为历史溯源算法的修正值;
步骤S53:利用预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,得到优化的异常监控算法模型;利用优化的异常监控算法模型对IT设备运行数据进行信息检测,得到IT设备异常信号;
步骤S54:根据IT设备异常信号确定IT设备运行告警信号,得到IT设备运行告警类型。
作为本发明的一个实施例,参考图5所示,为图1中步骤S5的详细步骤流程示意图,在本实施例中步骤S5包括以下步骤:
步骤S51:通过对IT设备运行情况信息进行数据采集,得到IT设备运行数据;
本发明实施例通过对IT设备运行情况信息进行IT设备运行情况类型和IT设备范围数据采集,最终得到IT设备运行数据。
步骤S52:利用历史溯源算法对IT设备运行数据进行时间回溯处理,得到IT设备运行的历史数据;
本发明实施例通过利用历史溯源算法对IT设备运行数据进行时间回溯处理,其中需要通过设置回溯时间窗口大小来确定IT设备运行的历史数据的时间跨度,设定合适的响应函数来描述IT设备的运行特征,设定合适的时间扩散系数来反映IT设备运行数据在时间上的具体分布情况,并通过确定IT设备运行数据的滞后项个数和滞后项系数来调整IT设备运行的历史数据与当前IT设备运行数据的权重,通过选择以上合适的参数对IT设备运行数据进行历史时间回溯,最终得到IT设备运行的历史数据。
其中,历史溯源算法的公式如下所示:
式中,为IT设备运行在时间/>处的历史数据,/>为回溯时间窗口大小,/>为时间/>的IT设备运行数据,/>为响应函数,/>为时间扩散系数,/>为历史初始时间,为指数函数,/>为滞后项个数,/>为第/>个滞后项系数,/>为IT设备运行在时间/>处的历史数据,/>为历史溯源算法的修正值;
本发明构建了一个历史溯源算法的公式,为了对IT设备运行数据进行时间回溯以获取IT设备运行的历史数据,通过利用历史溯源算法可以重建IT设备曾经出现的异常情况,还原IT设备的历史运行状态,为后续的异常监控处理预测未来的故障发生提供了历史数据来源,该算法公式充分考虑了时间的IT设备运行数据/>,响应函数/>,时间扩散系数/>,历史初始时间/>,并通过设置合适的回溯时间窗口大小/>对IT设备运行数据进行时间回调处理,形成了一种偏导关系/>,还需要考虑对IT设备运行数据的滞后项进行相应的处理,其中需要设置滞后项个数/>,第/>个滞后项系数/>以及IT设备运行在时间/>处的历史数据/>形成了一种数据关系,根据IT设备运行在时间/>处的历史数据/>与以上各参数之间的相互关系构成了一种函数关系/>,从而实现了对IT设备运行数据的历史时间溯源,同时,该算法公式中历史溯源算法的修正值/>可以根据实际情况进行调整,从而提高历史溯源算法的准确性和适用性。
步骤S53:利用预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,得到优化的异常监控算法模型;利用优化的异常监控算法模型对IT设备运行数据进行信息检测,得到IT设备异常信号;
本发明实施例通过从IT设备运行的历史数据中提取各种IT设备运行状态的相关特征,将其作为异常监控算法模型的输入,通过异常监控算法模型进行模型训练,并进行模型参数调整,以生成最优异常监控算法模型,然后将实时采集得到的设备运行数据输入到最优异常监控算法模型中进行检测,最终得到设备异常信号。
步骤S54:根据IT设备异常信号确定IT设备运行告警信号,得到IT设备运行告警类型。
本发明实施例根据得到的IT设备异常信号的表现形式和性质,将其分类为不同的IT设备运行告警信号,并判断IT设备运行告警信号的具体类型,最终得到IT设备运行告警类型。
本发明通过对IT设备运行情况信息进行数据采集,可以收集到IT设备的实时运行数据,及时了解IT设备的运行状况,对IT设备进行监控和管理,为后续的历史时间回溯处理提供了数据基础。通过利用历史溯源算法对IT设备运行数据进行时间回溯分析,可以还原IT设备历史运行状况,并获取IT设备运行的历史数据,为后续的异常监控提供了数据基础。通过对IT设备运行的历史数据的模型训练,可以自动化地构建异常监控算法模型,对IT设备运行数据进行信息检测和识别,找到最适合识别IT设备运行情况的算法模型,从而实现对各类设备异常信号的快速响应和处置。然后,利用最优异常监控算法模型对设备运行数据进行实时监测,精确定位IT设备运行中可能出现的异常情况,可以及时发现并对IT设备异常信号做出响应,迅速排除异常,避免异常信号演变成更严重的故障,保证数据中心的稳定性和可靠性。最后,通过对IT设备异常信号的判断,可以及时发现IT设备存在的潜在问题,并确定相应的IT设备运行告警类型,使得相关的运维人员可以得到预警、监控和解决问题的时间。IT设备运行告警类型可以告知运维人员IT设备存在的实际问题,从而提前进行适当的维修或更换,以避免可能的IT设备故障风险,同时也可以最大限度地用好IT设备故障验收和故障处理的机会。
优选地,步骤S53包括以下步骤:
步骤S531:构建基于支持向量机的异常监控算法模型,其中异常监控算法模型包括异常指数算法、分类算法和参数调优;
步骤S532:利用如下的异常指数算法对IT设备运行的历史数据进行计算,得到异常指数;
其中,异常指数算法的公式如下所示:
式中,为异常指数,/>为指数函数,/>为第/>个IT设备运行的历史数据,/>为IT设备运行的历史数据的平均值,/>为IT设备运行的历史数据的数量,/>为第/>个IT设备运行的历史数据出现的概率,/>为第/>个IT设备运行的历史数据的信息熵,/>为异常指数的修正值;
步骤S533:利用分类算法对异常指数进行异常信号分类并添加到相应预设的异常信号集合中,其中异常信号集合包括IT设备安全信号集合、IT设备故障信号集合和IT设备失效信号集合;
步骤S534:将IT设备运行的历史数据输入至异常监控算法模型中进行训练,并通过如下异常损失值函数进行模型参数调优,得到优化的异常监控算法模型;
其中,异常损失值函数的公式如下所示:
式中,为异常损失值,/>为IT设备运行的历史数据的数据数量,/>为第/>个IT设备运行的历史数据,/>为IT设备运行的历史数据的平均值,/>为第/>个IT设备运行的历史数据所属的信号类别,/>为第/>个IT设备运行的历史数据对/>的调和平滑参数,/>为第/>个IT设备运行的历史数据对/>的调和平滑参数,/>为异常损失值的修正值;
步骤S535:将IT设备运行数据输入至优化的异常监控算法模型进行信息检测,得到IT设备异常信号。
作为本发明的一个实施例,参考图6所示,为图5中步骤S53的详细步骤流程示意图,在本实施例中步骤S53包括以下步骤:
步骤S531:构建基于支持向量机的异常监控算法模型,其中异常监控算法模型包括异常指数算法、分类算法和参数调优;
本发明实施例通过构建基于支持向量机的异常监控算法模型,其中异常监控算法模型当中包括异常指数算法、分类算法以及参数调优等步骤。通过异常指数作为异常监控算法的基础,将IT设备运行数据转化为一个异常指数,来描述IT设备运行的状态,然后将IT设备运行数据根据异常指数的大小进行分类,基于支持向量机建立分类算法,按照对应的IT设备运行情况设定阈值将IT设备运行数据分为IT设备安全信号、IT设备故障信号和IT设备失效信号,最后通过对异常监控算法模型的参数进行优化调整,以提高算法模型的准确性和鲁棒性,并将已处理好的IT设备运行数据输入至调参后的异常监控算法模型中进行测试,评估模型的性能和准确度,调整模型参数,直到达到较高的精度和可靠性。
步骤S532:利用如下的异常指数算法对IT设备运行的历史数据进行计算,得到异常指数;
本发明实施例通过异常指数算法对IT设备运行的历史数据进行计算,得到异常指数,根据IT设备运行的历史数据中的IT设备运行异常情况,计算相应的IT设备安全、IT设备故障以及IT设备失效的异常指数阈值,以便及时发现运行状态异常的情况。
其中,异常指数算法的公式如下所示:
式中,为异常指数,/>为指数函数,/>为第/>个IT设备运行的历史数据,/>为IT设备运行的历史数据的平均值,/>为IT设备运行的历史数据的数量,/>为第/>个IT设备运行的历史数据出现的概率,/>为第/>个IT设备运行的历史数据的信息熵,/>为异常指数的修正值;
本发明构建了一个异常指数算法的公式,为了分析IT设备运行的历史数据的偏差大小,对当前IT设备运行状态进行实时监测和预测,从而得到异常指数,方便后续异常信号分类提供了数据基础。通过异常指数算法,能够对IT设备的运行状态和健康状况进行实时监测,能够帮助自动化IT设备管理,快速识别IT设备的故障,减少了维修IT设备所需的时间和人力成本,并且可以有效降低维护IT设备的难度和复杂度。该公式充分考虑了第个IT设备运行的历史数据/>,IT设备运行的历史数据的平均值/>,IT设备运行的历史数据的数量/>,通过指数函数/>形成了一种函数关系/>,并且通过第/>个IT设备运行的历史数据出现的概率/>得到第/>个IT设备运行的历史数据的信息熵/>,可以提高计算异常指数的准确度和精确度,根据异常指数/>与各参数之间的相互联系构成了一种函数关系/>,实现了通过异常指数算法对IT设备运行的历史数据进行计算,从而得到异常指数,同时,该公式中异常指数的修正值可以根据实际情况进行调整,从而提高异常指数算法的准确性和鲁棒性。
步骤S533:利用分类算法对异常指数进行异常信号分类并添加到相应预设的异常信号集合中,其中异常信号集合包括IT设备安全信号集合、IT设备故障信号集合和IT设备失效信号集合;
本发明实施例通过基于支持向量机的分类算法将得到的异常指数进行异常信号分类,根据预设的IT设备安全、IT设备故障以及IT设备失效的异常指数阈值和设定的规则,判断异常指数是属于IT设备安全信号、IT设备故障信号还是IT设备失效信号,并将异常信息加入相应的异常信号集合中。
步骤S534:将IT设备运行的历史数据输入至异常监控算法模型中进行训练,并通过如下异常损失值函数进行模型参数调优,得到优化的异常监控算法模型;
本发明实施例通过将清洗和预处理后的IT设备运行的历史数据输入到异常监控算法模型中进行训练,通过改变异常监控算法模型的参数不断优化训练结果,使其最大化异常监控的精度,建立准确可靠的异常监控算法模型,最终得到优化的异常监控算法模型。
其中,异常损失值函数的公式如下所示:
式中,为异常损失值,/>为IT设备运行的历史数据的数据数量,/>为第/>个IT设备运行的历史数据,/>为IT设备运行的历史数据的平均值,/>为第/>个IT设备运行的历史数据所属的信号类别,/>为第/>个IT设备运行的历史数据对/>的调和平滑参数,/>为第/>个IT设备运行的历史数据对/>的调和平滑参数,/>为异常损失值的修正值;
本发明构建了一个计算异常损失值的公式,用于计算异常监控算法模型的损失值,在通过异常监控算法模型对IT设备运行的历史数据进行训练时,为了帮助模型尽可能地拟合数据,需要使用一个适合的损失函数来作为模型参数优化的指标,对于本发明的异常监控算法模型而言,通过选择如上所述的异常损失函数可以根据IT设备运行的历史数据的波动性来调整参数的大小,来评估模型的准确性,该公式充分考虑了IT设备运行的历史数据的数据数量,第/>个IT设备运行的历史数据/>,IT设备运行的历史数据的平均值/>,第个IT设备运行的历史数据所属的信号类别/>,第/>个IT设备运行的历史数据对的调和平滑参数/>,第/>个IT设备运行的历史数据对/>的调和平滑参数/>,根据异常损失值/>与各参数之间的相互的作用关系,构成了一种函数关系/>,该函数公式实现了利用异常损失函数对异常监控算法模型损失值的计算,同时,通过异常损失值的修正值/>的引入,可以针对在模型训练时出现的特殊情况进行调整,进一步提高异常损失函数的适用性和稳定性,从而提高异常监控算法模型的泛化能力和鲁棒性。
步骤S535:将IT设备运行数据输入至优化的异常监控算法模型进行信息检测,得到IT设备异常信号。
本发明实施例通过将预处理后的IT设备运行数据输入至优化的异常监控算法模型中进行模型预测,计算相应的异常指数,将模型得到的异常指数与之前预设的异常指数阈值做比较,根据预设的判断规则判定当前运行状态是否正常,进而判断IT设备是否出现异常信号,根据异常信号的表现形式和性质,将其分类为IT设备安全信号、IT设备故障信号和IT设备失效信号,最终得到IT设备异常信号。
本发明构建了一个基于支持向量机的异常监控算法模型,该模型是数据中心IT设备可视化异常监控的核心。其中异常指数算法是一种用于监控异常信号的基础算法,通过收集和分析IT设备运行数据,确定IT设备的正常运行状态,通过计算异常指数进行判断来发现异常状况,分类算法也是一种重要的监控异常算法,能够通过对IT设备运行数据以及异常数据进行分类,帮助运维人员快速识别和定位IT设备问题,并及时采取应对措施。通过应用分类算法,数据中心可以更好的尽快地发现故障问题,缩短问题响应的时间,从而降低IT设备维护费用和风险,而参数调优是基于异常监控算法模型的一种优化技术,可以通过参数调整来避免或减轻过拟合、欠拟合等问题,提高模型的预测准确度和稳定性。数据中心通过对算法的参数进行调优,能够进一步提升异常监控算法模型的精度和可靠程度,节省人力和时间成本,从而提高数据中心的效率和质量。通过异常指数算法对异常指数的计算,可以及时检测IT设备的故障情况,判断异常状况是否超过了阈值,进而预测IT设备是否需要维修或更换,对于IT设备故障的快速定位和修复有着非常重要的作用,异常指数算法可以监测IT设备运行的稳定性,能够帮助运维团队尽早发现潜在的故障风险,并通过提供预测工具防止可能的问题发生,从而保持IT设备的稳定性。分类算法可以对异常信号进行准确和快速的分类和定位。借助分类算法的工作,运维人员可以快速的找到信号集合中相应的异常信号,得出异常类型,并进一步判断发生异常的具体IT设备。对异常信号的分类以后,根据异常信号集合的不同类型,便可以采取相应的响应措施,包括识别并快速处理IT设备故障、及时进行恢复操作或者更换IT设备等,能够及时防止故障影响的扩散。另外,通过分类算法实现对异常信号集合的分类,可以实现数据中心更加规范、高效的运维管理,可以快速应对各种潜在的IT设备故障,保证数据中心的稳定运营,从而实现可持续性的IT设备监控。通过对IT设备运行的历史数据进行训练,并通过异常损失值函数对模型参数进行调优,可以提高异常监控算法模型的精度和准确性,从而更好地预测和监测IT设备的异常状况。在异常监控算法模型训练和调优过程中,可以通过有效选择特征并优化异常损失函数,最终得到优化的异常监控算法模型,从而降低误报率和误诊率,提高IT设备异常判断的准确性。优化的异常监控算法模型经过对历史数据的训练和参数调优,模型的准确度和精度都得到了提升,能够更好地识别各种IT设备异常信号,提高识别准确性。最后,将IT设备运行数据输入至最优异常监控算法模型进行信息检测,从而得到IT设备异常信号,为后续的IT设备运行告警信号的确定提供了信号数据源。
优选地,步骤S54包括以下步骤:
步骤S541:根据IT设备异常信号确定IT设备运行告警信号,其中IT设备运行告警信号按照不同颜色的闪烁灯光信号进行分类,分别为绿色信号、红色信号和黄色信号;
本发明实施例根据IT设备异常信号确定IT设备运行告警信号,按照不同颜色的闪烁灯光信号对IT设备运行异常情况进行分类,其中绿色信号表示IT设备安全,红色信号表示IT设备故障,黄色信号表示IT设备失效。当IT设备在正常运行时,机柜面板的告警信号灯通常是绿色闪烁,表明IT设备处于正常运行状态,运维人员不做任何处理;当IT设备出现故障、安全隐患、超温度或者IT设备不存在时,机柜面板的告警信号灯通常会变成红色闪烁,并自动发出声音或者提示,表明IT设备出现异常状况,运维人员首先查看机柜面板上的红色闪烁灯信息,并查看告警类型、产生时间、具体内容等信息,然后,根据告警类型和具体内容,运维人员及时采取措施,如远程维护、更换IT设备等,避免因IT设备异常而造成的损失和影响,最后,运维人员将相应的故障记录并打标签,等待后续的维护处理;当IT设备失效或IT设备的某些组件以及部件出现故障状况时,机柜面板告警信号灯通常会变成黄色闪烁,提醒运维人员注意,运维人员记录并排查故障原因,如果需要可以对故障IT设备进行远程重启或者关闭,并确认IT设备是否正常运行。
步骤S542:当IT设备运行告警信号为绿色信号时,得到IT设备运行告警类型为IT设备安全;
本发明实施例通过判断得到IT设备运行告警信号为绿色信号,表明IT设备运行告警类型为IT设备安全。
步骤S543:当IT设备运行告警信号为红色信号时,得到IT设备运行告警类型为IT设备故障;
本发明实施例通过判断得到IT设备运行告警信号为红色信号,表明IT设备运行告警类型为IT设备故障。
步骤S544:当IT设备运行告警信号为黄色信号时,得到IT设备运行告警类型为IT设备失效。
本发明实施例通过判断得到IT设备运行告警信号为黄色信号,表明IT设备运行告警类型为IT设备失效。
本发明利用IT设备异常信号确定IT设备运行告警信号,IT设备运行告警信号通过不同颜色的闪烁灯光信号,能够直观地告知运维人员IT设备的异常状况和问题类型,提高问题诊断和处理的速度。按照不同颜色的闪烁灯光信号分类IT设备告警类型,有助于更好地控制和管理IT设备运行状态,提高数据中心的稳定性和安全性,减少IT设备故障和安全隐患的发生。同时,将IT设备运行告警信号按照颜色分类,其中绿色信号为IT设备安全信号,红色信号为IT设备故障信号以及黄色信号为IT设备失效信号,有助于运维人员灵活选择相应的处理策略,对于IT设备安全,则需要及时采取安全措施,对于IT设备故障,则需要及时维修或更换IT设备,而对于IT设备失效,则意味着需要为IT设备定期维护和保养。
优选地,步骤S6包括以下步骤:
将IT设备运行告警类型传输至机柜面板,得到告警类型展示信息;
本发明实施例将IT设备运行告警类型通过IT设备接口传输至机柜面板,机柜面板解析IT设备告警类型传输过来的告警信号,将其转换为告警类型展示信息,机柜面板将告警类型展示信息显示在相应的位置,提醒运维人员对IT设备告警进行监控和检查。
优选地,机房运维人员在现场巡检过程中通过告警类型展示信息判断数据中心内部IT设备的运行情况,并记录在案。
本发明实施例机房运维人员现场巡检过程中对IT设备告警类型展示信息进行仔细检查,判断IT设备告警类型是否为IT设备安全、IT设备故障或IT设备失效等IT设备运行情况,并结合实际情况快速定位和检查IT设备的异常。根据告警类型展示的信息,运维人员对IT设备运行情况进行记录,并记录IT设备异常原因和处理流程,同时执行相应的补救措施,对后续IT设备巡检和管理工作提出必要的建议和改进建议。
本发明通过机柜面板对IT设备运行告警类型的传输和展示,能够提供实时的IT设备运行状态信息,运维人员通过巡检过程中观察机柜面板的告警类型展示信息,可以及时发现IT设备的异常状况,记录IT设备的实际状态情况,对IT设备进行维护或更换等操作。运维人员通过机柜面板的告警类型展示信息,可以快速判断IT设备是否存在异常状况,进一步分析故障的原因,以便更好地制定相应的维护方案。通过告警类型展示信息,可以更有效地提醒运维人员IT设备的存在问题情况,可以避免人为疏忽带来的风险,让IT设备更加稳定的运行在数据中心。同时,基于机柜面板的运行告警类型展示,可以更好地集成机房内互不相关的IT设备,并实现智能化的运维管理,这将提高IT设备使用寿命和IT设备运行的质量,并且也能够降低维护成本。
优选地,在本说明书中,还提供了一种大数据中心监控数据可视化系统,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上所述的大数据中心监控数据可视化方法。
综上所述,本发明提供了一种大数据中心监控数据可视化系统,该系统能够实现本发明所述任意一种大数据中心监控数据可视化方法,用于联合存储器、处理器及存储器上运行的计算机程序之间的操作实现一种大数据中心监控数据可视化方法,系统内部结构互相协作,该监控系统能够实时监控数据中心内部IT设备的运行状态和工作情况,对于IT设备的工作状态异常可以快速响应,并提供及时的解决方案,保证IT设备的高效、稳定运行,能够将IT设备的状态、所属位置等信息可视化展示在一个统一的机柜面板上,从而使得运维人员得以更加方便地查看IT设备状态,及时发现问题,快速解决故障,并且能够对IT设备进行远程监控,并提供实时告警功能,能够帮助避免恶意攻击、数据安全问题和机房安全问题,提高IT设备的安全性。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在申请文件的等同要件的含义和范围内的所有变化涵括在本发明内。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种大数据中心监控数据可视化方法,其特征在于,包括以下步骤:
步骤S1:在机柜面板上配置IP地址信息并获取机柜设备接入信息;根据机柜设备接入信息与IP地址信息将机柜设备接入远程控制管理交换机,得到远程监控信息;其中机柜面板与机柜设备通过电性连接;
步骤S2:对远程监控信息进行信息采集处理,得到监控服务器控制信息;通过监控服务器控制信息响应监控服务器,通过监控服务器实时监控数据中心内部IT设备,得到IT设备监控信息;
步骤S3,包括:
步骤S31:通过在数据中心内部IT设备内安装SNMP代理,使用SNMP协议收集IT设备监控信息,得到IT设备监控信息数据;
步骤S32:根据IT设备监控信息数据采集数据中心内部IT设备的运行状态信息,得到原始IT设备监控信息;对原始IT设备监控信息进行数据转换处理,得到原始IT设备监控数据;
步骤S33:利用智能降噪算法对原始IT设备监控数据进行降噪处理,获得噪声值;
其中,智能降噪算法的公式如下所示:
式中,为噪声值,/>为降噪采样时间,/>为降噪采样时间偏移量,/>为降噪指数衰减系数,/>为原始IT设备监控数据,/>为降噪采样时间间隔,/>为自回归滤波器的数量,/>为第/>个自回归滤波器的系数,/>为第/>个非线性处理噪声值函数的系数,/>为第/>个非线性处理噪声值函数,/>为非线性处理的数量,/>为智能降噪算法的常数偏移量;
步骤S34:若噪声值大于或等于预设的噪声阈值时,剔除该噪声值对应的原始IT设备监控数据,得到IT设备监控数据;若噪声值小于预设的噪声阈值时,则将原始IT设备监控数据定义为IT设备监控数据;
步骤S4:对IT设备监控数据进行数据预处理,将预处理后的IT设备监控数据利用傅里叶变换算法进行数据转换,得到监控数据;将监控数据内的IT设备运行情况可视化展示到机柜面板,得到IT设备运行情况信息;
步骤S5:利用历史溯源算法对IT设备运行情况信息进行时间回溯处理,得到IT设备运行的历史数据;通过预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,以生成IT设备运行告警类型;
步骤S6:将IT设备运行告警类型可视化展示在机柜面板中。
2.根据权利要求1所述的大数据中心监控数据可视化方法,其特征在于,步骤S1包括以下步骤:
步骤S11:设计机柜面板并利用光纤接入机柜设备,通过机柜设备监控机柜面板,得到机柜面板信息;其中机柜面板与机柜设备通过电性连接;
步骤S12:基于机柜面板信息在机柜面板上配置IP地址并获取机柜设备接入信息;
步骤S13:根据机柜设备接入信息将机柜设备接入到本地网络中的远程控制管理交换机,得到远程监控信息。
3.根据权利要求1所述的大数据中心监控数据可视化方法,其特征在于,步骤S2包括以下步骤:
步骤S21:对远程监控信息进行信息采集处理,得到监控服务器控制信息;
步骤S22:将监控服务器控制信息传输至数据中心内部IT设备的监控服务器中,通过监控服务器控制信息响应监控服务器,得到监控服务器监控信息;
步骤S23:根据监控服务器监控信息实时监控数据中心内部IT设备,得到IT设备监控信息。
4.根据权利要求1所述的大数据中心监控数据可视化方法,其特征在于,步骤S4包括以下步骤:
步骤S41:对IT设备监控数据进行数据预处理,得到初始监控数据;
步骤S42:构建监控数据特征数据库,通过傅里叶变换算法对初始监控数据进行特征提取转换,以生成监控数据特征并保存至监控数据特征数据库;
其中,傅里叶变换算法的公式如下所示:
式中,为监控数据特征,/>为频率参数,/>为傅里叶变换算法谐波分量参数,/>为傅里叶变换算法信号转变偏移参数,/>为傅里叶变换算法信号相位转变参数,/>为要进行特征提取转换的初始监控数据,/>为要进行特征提取转换的初始监控数据参数,/>为调和平滑参数,/>为第/>个预设的初始监控数据基函数,/>为第/>个基函数的系数,/>为预设的初始监控数据基函数的数量,/>为傅里叶变换算法的修正值;
步骤S43:获取监控数据特征数据库中监控数据特征中的特征数据包,根据特征数据包获取与IT设备运行情况相关的数据,得到监控数据;
步骤S44:根据监控数据利用数据分析和可视化技术将IT设备运行情况可视化展示到机柜面板,得到IT设备运行情况信息。
5.根据权利要求1所述的大数据中心监控数据可视化方法,其特征在于,步骤S5包括以下步骤:
步骤S51:通过对IT设备运行情况信息进行数据采集,得到IT设备运行数据;
步骤S52:利用历史溯源算法对IT设备运行数据进行时间回溯处理,得到IT设备运行的历史数据;
其中,历史溯源算法的公式如下所示:
式中,为IT设备运行在时间/>处的历史数据,/>为回溯时间窗口大小,/>为时间/>的IT设备运行数据,/>为响应函数,/>为时间扩散系数,/>为历史初始时间,/>为指数函数,/>为滞后项个数,/>为第/>个滞后项系数,/>为IT设备运行在时间/>处的历史数据,/>为历史溯源算法的修正值;
步骤S53:利用预设的异常监控算法模型对IT设备运行的历史数据进行模型训练,得到优化的异常监控算法模型;利用优化的异常监控算法模型对IT设备运行数据进行信息检测,得到IT设备异常信号;
步骤S54:根据IT设备异常信号确定IT设备运行告警信号,得到IT设备运行告警类型。
6.根据权利要求5所述的大数据中心监控数据可视化方法,其特征在于,步骤S53包括以下步骤:
步骤S531:构建基于支持向量机的异常监控算法模型,其中异常监控算法模型包括异常指数算法、分类算法和参数调优;
步骤S532:利用如下的异常指数算法对IT设备运行的历史数据进行计算,得到异常指数;
其中,异常指数算法的公式如下所示:
式中,为异常指数,/>为指数函数,/>为第/>个IT设备运行的历史数据,/>为IT设备运行的历史数据的平均值,/>为IT设备运行的历史数据的数量,/>为第/>个IT设备运行的历史数据出现的概率,/>为第/>个IT设备运行的历史数据的信息熵,/>为异常指数的修正值;
步骤S533:利用分类算法对异常指数进行异常信号分类并添加到相应预设的异常信号集合中,其中异常信号集合包括IT设备安全信号集合、IT设备故障信号集合和IT设备失效信号集合;
步骤S534:将IT设备运行的历史数据输入至异常监控算法模型中进行训练,并通过如下异常损失值函数进行模型参数调优,得到优化的异常监控算法模型;
其中,异常损失值函数的公式如下所示:
式中,为异常损失值,/>为IT设备运行的历史数据的数据数量,/>为第/>个IT设备运行的历史数据,/>为IT设备运行的历史数据的平均值,/>为第/>个IT设备运行的历史数据所属的信号类别,/>为第/>个IT设备运行的历史数据对/>的调和平滑参数,/>为第/>个IT设备运行的历史数据对/>的调和平滑参数,/>为异常损失值的修正值;
步骤S535:将IT设备运行数据输入至优化的异常监控算法模型进行信息检测,得到IT设备异常信号。
7.根据权利要求5所述的大数据中心监控数据可视化方法,其特征在于,步骤S54包括以下步骤:
步骤S541:根据IT设备异常信号确定IT设备运行告警信号,其中IT设备运行告警信号按照不同颜色的闪烁灯光信号进行分类,分别为绿色信号、红色信号和黄色信号;
步骤S542:当IT设备运行告警信号为绿色信号时,得到IT设备运行告警类型为IT设备安全;
步骤S543:当IT设备运行告警信号为红色信号时,得到IT设备运行告警类型为IT设备故障;
步骤S544:当IT设备运行告警信号为黄色信号时,得到IT设备运行告警类型为IT设备失效。
8.根据权利要求1所述的大数据中心监控数据可视化方法,其特征在于,步骤S6包括以下步骤:
将IT设备运行告警类型传输至机柜面板,得到告警类型展示信息;
机房运维人员在现场巡检过程中通过告警类型展示信息判断数据中心内部IT设备的运行情况,并记录在案。
9.一种大数据中心监控数据可视化系统,其特征在于,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如权利要求1至8中任一项所述的大数据中心监控数据可视化方法。
CN202311354426.2A 2023-10-19 2023-10-19 一种大数据中心监控数据可视化系统及方法 Pending CN117118862A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311354426.2A CN117118862A (zh) 2023-10-19 2023-10-19 一种大数据中心监控数据可视化系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311354426.2A CN117118862A (zh) 2023-10-19 2023-10-19 一种大数据中心监控数据可视化系统及方法

Publications (1)

Publication Number Publication Date
CN117118862A true CN117118862A (zh) 2023-11-24

Family

ID=88796826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311354426.2A Pending CN117118862A (zh) 2023-10-19 2023-10-19 一种大数据中心监控数据可视化系统及方法

Country Status (1)

Country Link
CN (1) CN117118862A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106487574A (zh) * 2016-04-01 2017-03-08 国家计算机网络与信息安全管理中心 自动化运行维护监测系统
CN110532152A (zh) * 2019-08-05 2019-12-03 北明云智(武汉)网软有限公司 一种基于Kapacitor计算引擎的监控告警处理方法及系统
CN114615160A (zh) * 2022-03-11 2022-06-10 以萨技术股份有限公司 一种机房服务器监控状态实时展示与预警方法及系统
CN114676862A (zh) * 2022-05-27 2022-06-28 容云家(深圳)互联网技术有限公司 一种数据中心的可视化运维管理方法及系统
CN115081584A (zh) * 2022-05-16 2022-09-20 合肥科大智能机器人技术有限公司 基于机器学习的电力设备健康管理方法、系统及介质
CN116016201A (zh) * 2021-11-04 2023-04-25 贵州电网有限责任公司 一种基于业务回溯的异常预警方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106487574A (zh) * 2016-04-01 2017-03-08 国家计算机网络与信息安全管理中心 自动化运行维护监测系统
CN110532152A (zh) * 2019-08-05 2019-12-03 北明云智(武汉)网软有限公司 一种基于Kapacitor计算引擎的监控告警处理方法及系统
CN116016201A (zh) * 2021-11-04 2023-04-25 贵州电网有限责任公司 一种基于业务回溯的异常预警方法
CN114615160A (zh) * 2022-03-11 2022-06-10 以萨技术股份有限公司 一种机房服务器监控状态实时展示与预警方法及系统
CN115081584A (zh) * 2022-05-16 2022-09-20 合肥科大智能机器人技术有限公司 基于机器学习的电力设备健康管理方法、系统及介质
CN114676862A (zh) * 2022-05-27 2022-06-28 容云家(深圳)互联网技术有限公司 一种数据中心的可视化运维管理方法及系统

Similar Documents

Publication Publication Date Title
CN111459700B (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
KR20180108446A (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
CN117082105B (zh) 一种绿色智慧医院设施监控系统及方法
CN117474357B (zh) 基于深度学习的配电房运维管理方法及系统
CN117114449A (zh) 一种电力大数据可视化分析系统及方法
CN117196066A (zh) 智慧运维信息分析模型
CN117055502A (zh) 基于物联网和大数据分析的智能控制系统
CN118194150B (zh) 冷水机远程监控与故障预测系统
CN117607780A (zh) 一种电能计量装置异常分析系统及其分析方法
CN117406026A (zh) 一种适用于分布式电源的配电网故障检测方法
CN115392812B (zh) 一种异常根因定位方法、装置、设备及介质
CN118430092B (zh) 一种基于mcc系统的数据通用采集方法
CN117289085A (zh) 一种多线路故障分析诊断方法及系统
CN118408583B (zh) 一种编码器故障诊断方法及系统
CN117808456A (zh) 一种基于智慧运营管理的设备故障预警方法及装置
CN115372816A (zh) 基于数据分析的配电开关设备运行故障预测系统及方法
CN117639251A (zh) 一种高压开关柜智能在线监测系统
CN117791876A (zh) 变电设备运行状态监测方法及异常管控系统
CN115356970A (zh) 一种基于实时数据和运维数据的动环监控系统及方法
CN117270937A (zh) 数字运营运维管理系统
CN118030409A (zh) 用于风机机组的运行性能异常检测方法及系统
CN117150418B (zh) 基于状态特征故障树的变压器运检周期制定方法和系统
CN117290764B (zh) 基于数据特征分析的治超系统故障智能识别及诊断的方法
CN110455370B (zh) 防汛抗旱远程遥测显示系统
CN117435908A (zh) 一种用于旋转机械的多种故障特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination