CN114676862B - 一种数据中心的可视化运维管理方法及系统 - Google Patents

一种数据中心的可视化运维管理方法及系统 Download PDF

Info

Publication number
CN114676862B
CN114676862B CN202210584586.5A CN202210584586A CN114676862B CN 114676862 B CN114676862 B CN 114676862B CN 202210584586 A CN202210584586 A CN 202210584586A CN 114676862 B CN114676862 B CN 114676862B
Authority
CN
China
Prior art keywords
data
information
equipment
fault
data center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210584586.5A
Other languages
English (en)
Other versions
CN114676862A (zh
Inventor
欧阳凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rongyunjia Shenzhen Internet Technology Co ltd
Original Assignee
Rongyunjia Shenzhen Internet Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rongyunjia Shenzhen Internet Technology Co ltd filed Critical Rongyunjia Shenzhen Internet Technology Co ltd
Priority to CN202210584586.5A priority Critical patent/CN114676862B/zh
Publication of CN114676862A publication Critical patent/CN114676862A/zh
Application granted granted Critical
Publication of CN114676862B publication Critical patent/CN114676862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/28Design optimisation, verification or simulation using fluid dynamics, e.g. using Navier-Stokes equations or computational fluid dynamics [CFD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/08Fluids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/08Thermal analysis or thermal optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/14Force analysis or force optimisation, e.g. static or dynamic forces
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Molecular Biology (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Fluid Mechanics (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

本发明公开了一种数据中心的可视化运维管理方法及系统,包括:获取数据中心的设备及设施信息、管线信息、空间布局信息,获取数据中心的三维可视化模型;通过三维可视化模型进行设备部署规划及布线规划,并获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案;对运维数据进行分类,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;获取故障的类型及位置信息生成故障预警及解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示。本发明通过对数据中心运维状态及运维数据进行三维可视化展示,实现了数据中心的智能运营维护,减少了人力资源配置,提高了运维工作效率。

Description

一种数据中心的可视化运维管理方法及系统
技术领域
本发明涉及运维管理技术邻域,更具体的,涉及一种数据中心的可视化运维管理方法及系统。
背景技术
随着电子信息行业的快速发展,高效便捷的行业应用系统背后是不计其数的各种服务器、网络设备、数据存数设备在做支撑,通信网络的规模逐渐扩大,通信网络设备也不断增加,早期投入使用的数据中心面临着优化改造和适应后续业务发展的问题。在原始数据中心的机柜上进行服务器等设备的重新布置或在原始数据中心布置新机柜时, 设备从一到多,运行维护工作变得越来越繁杂,想使得数据中心运维管理更具实效性,必须对运维管理手段进行创新,如何进行科学、合理、高效的运行维护管理,就变得迫切和必要。
为了能够对数据中心进行科学合理的可视化运维管理,使得满足当前数据中心的运维需求,需要开发一款系统与之配合进行实现,该系统通过获取数据中心的设备及设施信息、管线信息、空间布局信息,基于三维重建获取数据中心的三维可视化模型;根据空间布局信息及当前布线状态进行设备部署规划及布线规划;对能耗数据、设备运行数据及环境参数进行运维数据信息分析,对运维数据进行分类,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;生成故障报告,根据故障报告生成故障解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示。在该系统的实现过程中,如何根据布局规划故障分析及能耗调控进行数据中心的可视化运维管理是亟不可待需要解决的问题。
发明内容
为了解决上述技术问题,本发明提出了一种数据中心的可视化运维管理方法及系统。
本发明第一方面提供了一种数据中心的可视化运维管理方法,包括:
获取数据中心的设备及设施信息、管线信息、空间布局信息,基于三维重建获取数据中心的三维可视化模型;
根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划;
获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案;
提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;
获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示。
本方案中,所述的根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划,具体为:
获取数据中心当前机柜位置信息及空闲位置信息,同时获取机柜、接线及电源的容量信息,根据所述容量信息获取容量占用信息;
根据管线信息获取数据中心的当前布线状态,根据当前布线状态获取端到端的链路连接情况;
根据数据中心的三维可视化模型获取数据中心内制冷设备的位置信息,根据制冷设备的预设温度结合所述位置信息及数据中心的空间布局信息生成室内温度场分布;
通过对数据中心的设备进行温度监测判断设备的散热需求,获取所述散热需求大于预设需求阈值的设备信息,并将其标记为标记设备;
根据所述室内温度场分布结合机柜位置信息及空闲位置信息对机柜摆放位置进行规划更新,将所述标记设备进行分散布置,并根据分散布置后标记设备的位置信息依据所述链路连接情况重新进行布线规划;
若进行新设备上架时,则根据数据中心的设备温度监测获取预设区域范围内区域热环境,根据新设备属性信息及预设区域范围内的容量占用信息选取区域热环境温度小的区域进行优先布置规划。
本方案中,获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案,具体为:
获取数据中心的历史运维数据,根据所述历史运维数据获取服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率,结合数据中心中预设区域范围的区域热环境温度信息进行匹配生成时序序列;
根据所述服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率进行能耗分析,基于LSTM建立服务器设备的能耗预测模型,并初始化参数;
将所述时序序列预处理为训练集与测试集,通过所述训练集对所述能耗预测模型进行迭代训练及准确性验证,获取预设时间周期内的服务器设备参数信息导入能耗预测模型;
根据所述能耗预测模型获取预设时间后的能耗预测值,根据能耗预测值预测数据中心中预设区域范围的区域热环境温度信息;
根据空调调控的滞后性对所述区域热环境温度信息进行误差补偿,对数据中心的区域热环境温度三维可视化模型进行可视化显示,根据补偿后的区域热环境温度信息进行数据中心的环境温度智能调控方案。
本方案中,提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障,具体为:
提取运维数据中的能耗数据、设备运行数据及环境参数,将提取的数据进行数据标准化处理,将数据进行分类;
获取预设时间周期内不同时段中相同环境参数下设备的历史设备运行数据及历史能耗数据,将当前提取的数据与所述历史运行数据集历史能耗数据进行相似度对比;
若所述相似度不符合预设相似度阈值标准,则生成故障检测调用指令;
获取设备正常运行情况下调用故障检测调用指令的响应时间区间,当设备调用故障检测调用指令的响应时间不处于所述响应时间区间时,则生成故障预警信息。
本方案中,获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,具体为:
根据数据中心的故障预警获确定故障所在链路信息,构建故障知识库,根据预设周期内不同日期的同一时刻的设备运行数据生成设备运行数据基准曲线;
获取每个时刻点的实时设备运行数据,根据所述设备运行数据基准曲线获取异常数据的出现频次及时段分布,通过所述出现频次及时段分布获取当前故障特征,在故障知识库中进行大数据分析,获取故障类型;
根据所述故障所在链路信息及故障类型生成故障报告,根据所述故障报告生成索引标签在故障知识库中建立索引任务,获取故障知识库中与当前故障的匹配度符合预设值要求的运维管理数据;
根据所述运维管理数据获取故障原因及解决方案,根据所述故障原因及解决方案生成维修工单,将故障预警及维修工单在所述数据中心三维可视化模型中进行标签显示。
本方案中,还包括:
对数据中心中所有设备建立运维记录,将设备的设备状态参数与所述运维记录进行匹配;
根据设备属性预设设备的评价指标,根据设备的设备状态参数与故障预警次数评估设备的健康状况;
若数据中心中设备的健康状况小于预设健康状况阈值,则对设备进行故障高风险预警,并生成建议信息。
本发明第二方面还提供了一种数据中心的可视化运维管理系统,该系统包括:存储器、处理器,所述存储器中包括一种数据中心的可视化运维管理方法程序,所述一种数据中心的可视化运维管理方法程序被所述处理器执行时实现如下步骤:
获取数据中心的设备及设施信息、管线信息、空间布局信息,基于三维重建获取数据中心的三维可视化模型;
根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划;
获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案;
提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;
获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示。
本方案中,所述的根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划,具体为:
获取数据中心当前机柜位置信息及空闲位置信息,同时获取机柜、接线及电源的容量信息,根据所述容量信息获取容量占用信息;
根据管线信息获取数据中心的当前布线状态,根据当前布线状态获取端到端的链路连接情况;
根据数据中心的三维可视化模型获取数据中心内制冷设备的位置信息,根据制冷设备的预设温度结合所述位置信息及数据中心的空间布局信息生成室内温度场分布;
通过对数据中心的设备进行温度监测判断设备的散热需求,获取所述散热需求大于预设需求阈值的设备信息,并将其标记为标记设备;
根据所述室内温度场分布结合机柜位置信息及空闲位置信息对机柜摆放位置进行规划更新,将所述标记设备进行分散布置,并根据分散布置后标记设备的位置信息依据所述链路连接情况重新进行布线规划;
若进行新设备上架时,则根据数据中心的设备温度监测获取预设区域范围内区域热环境,根据新设备属性信息及预设区域范围内的容量占用信息选取区域热环境温度小的区域进行优先布置规划。
本方案中,获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案,具体为:
获取数据中心的历史运维数据,根据所述历史运维数据获取服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率,结合数据中心中预设区域范围的区域热环境温度信息进行匹配生成时序序列;
根据所述服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率进行能耗分析,基于LSTM建立服务器设备的能耗预测模型,并初始化参数;
将所述时序序列预处理为训练集与测试集,通过所述训练集对所述能耗预测模型进行迭代训练及准确性验证,获取预设时间周期内的服务器设备参数信息导入能耗预测模型;
根据所述能耗预测模型获取预设时间后的能耗预测值,根据能耗预测值预测数据中心中预设区域范围的区域热环境温度信息;
根据空调调控的滞后性对所述区域热环境温度信息进行误差补偿,对数据中心的区域热环境温度三维可视化模型进行可视化显示,根据补偿后的区域热环境温度信息进行数据中心的环境温度智能调控方案。
本方案中,提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障,具体为:
提取运维数据中的能耗数据、设备运行数据及环境参数,将提取的数据进行数据标准化处理,将数据进行分类;
获取预设时间周期内不同时段中相同环境参数下设备的历史设备运行数据及历史能耗数据,将当前提取的数据与所述历史运行数据集历史能耗数据进行相似度对比;
若所述相似度不符合预设相似度阈值标准,则生成故障检测调用指令;
获取设备正常运行情况下调用故障检测调用指令的响应时间区间,当设备调用故障检测调用指令的响应时间不处于所述响应时间区间时,则生成故障预警信息。
本方案中,获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,具体为:
根据数据中心的故障预警获确定故障所在链路信息,构建故障知识库,根据预设周期内不同日期的同一时刻的设备运行数据生成设备运行数据基准曲线;
获取每个时刻点的实时设备运行数据,根据所述设备运行数据基准曲线获取异常数据的出现频次及时段分布,通过所述出现频次及时段分布获取当前故障特征,在故障知识库中进行大数据分析,获取故障类型;
根据所述故障所在链路信息及故障类型生成故障报告,根据所述故障报告生成索引标签在故障知识库中建立索引任务,获取故障知识库中与当前故障的匹配度符合预设值要求的运维管理数据;
根据所述运维管理数据获取故障原因及解决方案,根据所述故障原因及解决方案生成维修工单,将故障预警及维修工单在所述数据中心三维可视化模型中进行标签显示。
本方案中,还包括:
对数据中心中所有设备建立运维记录,将设备的设备状态参数与所述运维记录进行匹配;
根据设备属性预设设备的评价指标,根据设备的设备状态参数与故障预警次数评估设备的健康状况;
若数据中心中设备的健康状况小于预设健康状况阈值,则对设备进行故障高风险预警,并生成建议信息。
本发明公开了一种数据中心的可视化运维管理方法及系统,包括:获取数据中心的设备及设施信息、管线信息、空间布局信息,获取数据中心的三维可视化模型;通过三维可视化模型进行设备部署规划及布线规划,并获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案;对运维数据进行分类,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;获取故障的类型及位置信息生成故障预警及解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示。本发明通过对数据中心运维状态及运维数据进行三维可视化展示,实现了数据中心的智能运营维护,减少了人力资源配置,提高了运维工作效率。
附图说明
图1示出了本发明一种数据中心的可视化运维管理方法的流程图;
图2示出了本发明通过能耗分析制定智能调控方案方法的流程图;
图3示出了本发明获取故障解决方案方法的流程图;
图4示出了本发明一种数据中心的可视化运维管理系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种数据中心的可视化运维管理方法的流程图。
如图1所示,本发明第一方面提供了一种数据中心的可视化运维管理方法,包括:
S102,获取数据中心的设备及设施信息、管线信息、空间布局信息,基于三维重建获取数据中心的三维可视化模型;
S104,根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划;
S106,获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案;
S108,提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;
S110,获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示。
需要说明的是,获取数据中心中现有设备及设施信息、设备间管线信息,及各设备在数据中心的空间布局信息,根据获取的信息通过三维可视化技术建立数据中心的三维可视化模型,常用的三维可视化技术通常包括激光扫描、GIS、BIM、全景影像以及利用Unity3D、OpenGL开发的可视化平台等。其中BIM是利用信息技术对项目的几何、物理和功能信息进行全生命周期的表达与信息存储,具有可视化设计与决策、参数化设计、关联修改设计、性能分析、协同设计等特点。
需要说明的是,所述的根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划,具体为:获取数据中心当前机柜位置信息及空闲位置信息,同时获取机柜、接线、网络及电源等的容量信息,根据所述容量信息获取容量占用信息;根据管线信息获取数据中心的当前布线状态,根据当前布线状态获取端到端的链路连接情况;根据数据中心的三维可视化模型获取数据中心内制冷设备的位置信息,根据制冷设备的预设温度结合所述位置信息及数据中心的空间布局信息生成室内温度场分布,所述温度场分布可使用数据插值的方式将温度数据图形化,并通过CFD进行仿真获取;通过对数据中心的设备进行温度监测判断设备的散热需求,获取所述散热需求大于预设需求阈值的设备信息,并将其标记为标记设备;根据所述室内温度场分布结合机柜位置信息及空闲位置信息对机柜摆放位置进行规划更新,将所述标记设备进行分散布置,并根据分散布置后标记设备的位置信息依据所述链路连接情况重新进行布线规划;若进行新设备上架时,则根据数据中心的设备温度监测获取预设区域范围内区域热环境,根据新设备属性信息及预设区域范围内的容量占用信息选取区域热环境温度小的区域进行优先布置规划。
图2示出了本发明通过能耗分析制定智能调控方案方法的流程图。
根据本发明实施例,获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案,具体为:
S202,获取数据中心的历史运维数据,根据所述历史运维数据获取服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率,结合数据中心中预设区域范围的区域热环境温度信息进行匹配生成时序序列;
S204,根据所述服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率进行能耗分析,基于LSTM建立服务器设备的能耗预测模型,并初始化参数;
S206,将所述时序序列预处理为训练集与测试集,通过所述训练集对所述能耗预测模型进行迭代训练及准确性验证,获取预设时间周期内的服务器设备参数信息导入能耗预测模型;
S208,根据所述能耗预测模型获取预设时间后的能耗预测值,根据能耗预测值预测数据中心中预设区域范围的区域热环境温度信息;
S210,根据空调调控的滞后性对所述区域热环境温度信息进行误差补偿,对数据中心的区域热环境温度三维可视化模型进行可视化显示,根据补偿后的区域热环境温度信息进行数据中心的环境温度智能调控方案。
选取服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率进行数据分析,并分析各设备组件之间的相互作用,通过设备相关参数与服务器设备能耗进行相关性分析,确定各设备相关参数的比例系数,根据比例系确定服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率的输入组合,以反映服务器设备的能耗。
需要说明的是,提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障,具体为:提取运维数据中的能耗数据、设备运行数据及环境参数,将提取的数据进行数据标准化处理,将数据进行分类;获取预设时间周期内不同时段中相同环境参数下设备的历史设备运行数据及历史能耗数据,将当前提取的数据与所述历史运行数据集历史能耗数据进行相似度对比;若所述相似度不符合预设相似度阈值标准,则生成故障检测调用指令;获取设备正常运行情况下调用故障检测调用指令的响应时间区间,当设备调用故障检测调用指令的响应时间不处于所述响应时间区间时,则生成故障预警信息。对已发生故障的设备部件,根据部件类别做出相应的隔离措施处理,避免单一非必要部件故障影响整机系统的运行。
图3示出了本发明获取故障解决方案方法的流程图。
根据本发明实施例,获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,具体为:
S302,根据数据中心的故障预警获确定故障所在链路信息,构建故障知识库,根据预设周期内不同日期的同一时刻的设备运行数据生成设备运行数据基准曲线;
S304,获取每个时刻点的实时设备运行数据,根据所述设备运行数据基准曲线获取异常数据的出现频次及时段分布,通过所述出现频次及时段分布获取当前故障特征,在故障知识库中进行大数据分析,获取故障类型;
S306,根据所述故障所在链路信息及故障类型生成故障报告,根据所述故障报告生成索引标签在故障知识库中建立索引任务,获取故障知识库中与当前故障的匹配度符合预设值要求的运维管理数据;
S308,根据所述运维管理数据获取故障原因及解决方案,根据所述故障原因及解决方案生成维修工单,将故障预警及维修工单在所述数据中心三维可视化模型中进行标签显示。
需要说明的是,本发明还包括建立运维记录,将设备运维记录与设备健康状况匹配,具体为:对数据中心中所有设备建立运维记录,将设备的设备状态参数与所述运维记录进行匹配;根据设备属性预设设备的评价指标,根据设备的设备状态参数与故障预警次数评估设备的健康状况,对设备组件的寿命和运行状态进行跟踪;若数据中心中设备的健康状况小于预设健康状况阈值,则对设备进行故障高风险预警,降低设备在高负荷运行状态下的突然失效,并生成建议信息,另外通过运维记录进行数据中心设备资产监管。
根据本发明实施例,本发明还包括,设置数据中心不同设备的数据访问权限,根据用户的角色权限进行动态访问控制,具体为:
根据数据中心中设备数据重要程度预设数据访问权限,同时根据用户的职责预设用户角色的初始可信值;
当获取到用户的登录请求时,获取用户的访问身份验证信息,根据所述用户的访问身份验证信息获取历史交互记录,并根据所述历史交互记录获取历史可信值;
获取用户当前登录行为,对当前登录行为进行根据预设评价标准生成用户当前登录行为的评估得分,根据所述评估得分确定用户登录可信值;
通过所述用户角色的初始可信值、历史可信值及用户登录可信值获取用户角色的可信值,根据所述用户角色可信值及设备的预设数据访问权限获取对应的权限等级;
根据所述权限等级开放相应访问资源供用户进行访问。
所述用户当前登录行为包括用户登录的IP地址,用户登录的密码尝试次数,单位时间内的登录次数及连接状态的更改次数,根据上述因素预设可信值的评价标准。数据访问权限等级包括但不限于数据文件管理权限,故障预警查看及处理权限,历史数据访问权限及实时数据录入权限等。
根据本发明实施例,本发明还包括,获取数据中心的监控数据,实现可视化安防管理,具体为:
将数据中心按照预设范围划分为多个子区域,获取各子区域中区域热环境温度值及安防摄像终端的监控信息;
根据所述各子区域中区域热环境温度值及预设温度阈值进行数据中心火情预警,消防系统根据子区域范围进行火情处理;
当数据中心存在故障信息时,根据故障预警的重要程度及故障设备所在位置,规划运维路线,并在数据中心现场提供路径指引;
根据根据各子区域的监控信息获取运维人员的路径信息,若所述路径信息与运维路线生成路径偏差;
根据各子区域的监控信息获取运维人员在各子区域的停留时间,将所述停留时间与相同故障预警的对应时间进行对比生成时间偏差;
若所述时间偏差或路径偏差大于对应偏差阈值,则生成异常信息,并向安保人员及其他运维人员进行发送。
图4示出了本发明一种数据中心的可视化运维管理系统的框图。
本发明第二方面还提供了一种数据中心的可视化运维管理系统4,该系统包括:存储器41、处理器42,所述存储器中包括一种数据中心的可视化运维管理方法程序,所述一种数据中心的可视化运维管理方法程序被所述处理器执行时实现如下步骤:
获取数据中心的设备及设施信息、管线信息、空间布局信息,基于三维重建获取数据中心的三维可视化模型;
根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划;
获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案;
提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;
获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示。
需要说明的是,获取数据中心中现有设备及设施信息、设备间管线信息,及各设备在数据中心的空间布局信息,根据获取的信息通过三维可视化技术建立数据中心的三维可视化模型,常用的三维可视化技术通常包括激光扫描、GIS、BIM、全景影像以及利用Unity3D、OpenGL开发的可视化平台等。其中BIM是利用信息技术对项目的几何、物理和功能信息进行全生命周期的表达与信息存储,具有可视化设计与决策、参数化设计、关联修改设计、性能分析、协同设计等特点。
需要说明的是,所述的根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划,具体为:获取数据中心当前机柜位置信息及空闲位置信息,同时获取机柜、接线、网络及电源等的容量信息,根据所述容量信息获取容量占用信息;根据管线信息获取数据中心的当前布线状态,根据当前布线状态获取端到端的链路连接情况;根据数据中心的三维可视化模型获取数据中心内制冷设备的位置信息,根据制冷设备的预设温度结合所述位置信息及数据中心的空间布局信息生成室内温度场分布,所述温度场分布可使用数据插值的方式将温度数据图形化,并通过CFD进行仿真获取;通过对数据中心的设备进行温度监测判断设备的散热需求,获取所述散热需求大于预设需求阈值的设备信息,并将其标记为标记设备;根据所述室内温度场分布结合机柜位置信息及空闲位置信息对机柜摆放位置进行规划更新,将所述标记设备进行分散布置,并根据分散布置后标记设备的位置信息依据所述链路连接情况重新进行布线规划;若进行新设备上架时,则根据数据中心的设备温度监测获取预设区域范围内区域热环境,根据新设备属性信息及预设区域范围内的容量占用信息选取区域热环境温度小的区域进行优先布置规划。
根据本发明实施例,获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案,具体为:
获取数据中心的历史运维数据,根据所述历史运维数据获取服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率,结合数据中心中预设区域范围的区域热环境温度信息进行匹配生成时序序列;
根据所述服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率进行能耗分析,基于LSTM建立服务器设备的能耗预测模型,并初始化参数;
将所述时序序列预处理为训练集与测试集,通过所述训练集对所述能耗预测模型进行迭代训练及准确性验证,获取预设时间周期内的服务器设备参数信息导入能耗预测模型;
根据所述能耗预测模型获取预设时间后的能耗预测值,根据能耗预测值预测数据中心中预设区域范围的区域热环境温度信息;
根据空调调控的滞后性对所述区域热环境温度信息进行误差补偿,对数据中心的区域热环境温度三维可视化模型进行可视化显示,根据补偿后的区域热环境温度信息进行数据中心的环境温度智能调控方案。
选取服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率进行数据分析,并分析各设备组件之间的相互作用,通过设备相关参数与服务器设备能耗进行相关性分析,确定各设备相关参数的比例系数,根据比例系确定服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率的输入组合,以反映服务器设备的能耗。
需要说明的是,提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障,具体为:提取运维数据中的能耗数据、设备运行数据及环境参数,将提取的数据进行数据标准化处理,将数据进行分类;获取预设时间周期内不同时段中相同环境参数下设备的历史设备运行数据及历史能耗数据,将当前提取的数据与所述历史运行数据集历史能耗数据进行相似度对比;若所述相似度不符合预设相似度阈值标准,则生成故障检测调用指令;获取设备正常运行情况下调用故障检测调用指令的响应时间区间,当设备调用故障检测调用指令的响应时间不处于所述响应时间区间时,则生成故障预警信息。对已发生故障的设备部件,根据部件类别做出相应的隔离措施处理,避免单一非必要部件故障影响整机系统的运行。
根据本发明实施例,获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,具体为:
根据数据中心的故障预警获确定故障所在链路信息,构建故障知识库,根据预设周期内不同日期的同一时刻的设备运行数据生成设备运行数据基准曲线;
获取每个时刻点的实时设备运行数据,根据所述设备运行数据基准曲线获取异常数据的出现频次及时段分布,通过所述出现频次及时段分布获取当前故障特征,在故障知识库中进行大数据分析,获取故障类型;
根据所述故障所在链路信息及故障类型生成故障报告,根据所述故障报告生成索引标签在故障知识库中建立索引任务,获取故障知识库中与当前故障的匹配度符合预设值要求的运维管理数据;
根据所述运维管理数据获取故障原因及解决方案,根据所述故障原因及解决方案生成维修工单,将故障预警及维修工单在所述数据中心三维可视化模型中进行标签显示。
需要说明的是,本发明还包括建立运维记录,将设备运维记录与设备健康状况匹配,具体为:对数据中心中所有设备建立运维记录,将设备的设备状态参数与所述运维记录进行匹配;根据设备属性预设设备的评价指标,根据设备的设备状态参数与故障预警次数评估设备的健康状况,对设备组件的寿命和运行状态进行跟踪;若数据中心中设备的健康状况小于预设健康状况阈值,则对设备进行故障高风险预警,降低设备在高负荷运行状态下的突然失效,并生成建议信息。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种数据中心的可视化运维管理方法,其特征在于,包括以下步骤:
获取数据中心的设备及设施信息、管线信息、空间布局信息,基于三维重建获取数据中心的三维可视化模型;
根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划;
获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案;
提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;
获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示;
所述的根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划,具体为:
获取数据中心当前机柜位置信息及空闲位置信息,同时获取机柜、接线及电源的容量信息,根据所述容量信息获取容量占用信息;
根据管线信息获取数据中心的当前布线状态,根据当前布线状态获取端到端的链路连接情况;
根据数据中心的三维可视化模型获取数据中心内制冷设备的位置信息,根据制冷设备的预设温度结合所述位置信息及数据中心的空间布局信息生成室内温度场分布;
通过对数据中心的设备进行温度监测判断设备的散热需求,获取所述散热需求大于预设需求阈值的设备信息,并将其标记为标记设备;
根据所述室内温度场分布结合机柜位置信息及空闲位置信息对机柜摆放位置进行规划更新,将所述标记设备进行分散布置,并根据分散布置后标记设备的位置信息依据所述链路连接情况重新进行布线规划;
若进行新设备上架时,则根据数据中心的设备温度监测获取预设区域范围内区域热环境,根据新设备属性信息及预设区域范围内的容量占用信息选取区域热环境温度小的区域进行优先布置规划;
获取数据中心的监控数据,实现可视化安防管理,具体为:
将数据中心按照预设范围划分为多个子区域,获取各子区域中区域热环境温度值及安防摄像终端的监控信息;
根据所述各子区域中区域热环境温度值及预设温度阈值进行数据中心火情预警,消防系统根据子区域范围进行火情处理;
当数据中心存在故障信息时,根据故障预警的重要程度及故障设备所在位置,规划运维路线,并在数据中心现场提供路径指引;
根据各子区域的监控信息获取运维人员的路径信息,若所述路径信息与运维路线生成路径偏差;
根据各子区域的监控信息获取运维人员在各子区域的停留时间,将所述停留时间与相同故障预警的对应时间进行对比生成时间偏差;
若所述时间偏差或路径偏差大于对应偏差阈值,则生成异常信息,并向安保人员及其他运维人员进行发送。
2.根据权利要求1所述的一种数据中心的可视化运维管理方法,其特征在于,获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案,具体为:
获取数据中心的历史运维数据,根据所述历史运维数据获取服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率,结合数据中心中预设区域范围的区域热环境温度信息进行匹配生成时序序列;
根据所述服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率进行能耗分析,基于LSTM建立服务器设备的能耗预测模型,并初始化参数;
将所述时序序列预处理为训练集与测试集,通过所述训练集对所述能耗预测模型进行迭代训练及准确性验证,获取预设时间周期内的服务器设备参数信息导入能耗预测模型;
根据所述能耗预测模型获取预设时间后的能耗预测值,根据能耗预测值预测数据中心中预设区域范围的区域热环境温度信息;
根据空调调控的滞后性对所述区域热环境温度信息进行误差补偿,对数据中心的区域热环境温度三维可视化模型进行可视化显示,根据补偿后的区域热环境温度信息进行数据中心的环境温度智能调控方案。
3.根据权利要求1所述的一种数据中心的可视化运维管理方法,其特征在于,提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障,具体为:
提取运维数据中的能耗数据、设备运行数据及环境参数,将提取的数据进行数据标准化处理,将数据进行分类;
获取预设时间周期内不同时段中相同环境参数下设备的历史设备运行数据及历史能耗数据,将当前提取的数据与所述历史运行数据集历史能耗数据进行相似度对比;
若所述相似度不符合预设相似度阈值标准,则生成故障检测调用指令;
获取设备正常运行情况下调用故障检测调用指令的响应时间区间,当设备调用故障检测调用指令的响应时间不处于所述响应时间区间时,则生成故障预警信息。
4.根据权利要求1所述的一种数据中心的可视化运维管理方法,其特征在于,获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,具体为:
根据数据中心的故障预警获确定故障所在链路信息,构建故障知识库,根据预设周期内不同日期的同一时刻的设备运行数据生成设备运行数据基准曲线;
获取每个时刻点的实时设备运行数据,根据所述设备运行数据基准曲线获取异常数据的出现频次及时段分布,通过所述出现频次及时段分布获取当前故障特征,在故障知识库中进行大数据分析,获取故障类型;
根据所述故障所在链路信息及故障类型生成故障报告,根据所述故障报告生成索引标签在故障知识库中建立索引任务,获取故障知识库中与当前故障的匹配度符合预设值要求的运维管理数据;
根据所述运维管理数据获取故障原因及解决方案,根据所述故障原因及解决方案生成维修工单,将故障预警及维修工单在数据中心三维可视化模型中进行标签显示。
5.根据权利要求1所述的一种数据中心的可视化运维管理方法,其特征在于,还包括:
对数据中心中所有设备建立运维记录,将设备的设备状态参数与所述运维记录进行匹配;
根据设备属性预设设备的评价指标,根据设备的设备状态参数与故障预警次数评估设备的健康状况;
若数据中心中设备的健康状况小于预设健康状况阈值,则对设备进行故障高风险预警,并生成建议信息。
6.一种数据中心的可视化运维管理系统,其特征在于,该系统包括:存储器、处理器,所述存储器中存储有一种数据中心的可视化运维管理方法程序,所述一种数据中心的可视化运维管理方法程序被所述处理器执行时实现如下步骤:
获取数据中心的设备及设施信息、管线信息、空间布局信息,基于三维重建获取数据中心的三维可视化模型;
根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划;
获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案;
提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障;
获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,将故障预警及解决方案在所述三维可视化模型中进行标注显示;
所述的根据所述空间布局信息及当前布线状态通过三维可视化模型进行数据中心的设备部署规划及布线规划,具体为:
获取数据中心当前机柜位置信息及空闲位置信息,同时获取机柜、接线及电源的容量信息,根据所述容量信息获取容量占用信息;
根据管线信息获取数据中心的当前布线状态,根据当前布线状态获取端到端的链路连接情况;
根据数据中心的三维可视化模型获取数据中心内制冷设备的位置信息,根据制冷设备的预设温度结合所述位置信息及数据中心的空间布局信息生成室内温度场分布;
通过对数据中心的设备进行温度监测判断设备的散热需求,获取所述散热需求大于预设需求阈值的设备信息,并将其标记为标记设备;
根据所述室内温度场分布结合机柜位置信息及空闲位置信息对机柜摆放位置进行规划更新,将所述标记设备进行分散布置,并根据分散布置后标记设备的位置信息依据所述链路连接情况重新进行布线规划;
若进行新设备上架时,则根据数据中心的设备温度监测获取预设区域范围内区域热环境,根据新设备属性信息及预设区域范围内的容量占用信息选取区域热环境温度小的区域进行优先布置规划;
获取数据中心的监控数据,实现可视化安防管理,具体为:
将数据中心按照预设范围划分为多个子区域,获取各子区域中区域热环境温度值及安防摄像终端的监控信息;
根据所述各子区域中区域热环境温度值及预设温度阈值进行数据中心火情预警,消防系统根据子区域范围进行火情处理;
当数据中心存在故障信息时,根据故障预警的重要程度及故障设备所在位置,规划运维路线,并在数据中心现场提供路径指引;
根据各子区域的监控信息获取运维人员的路径信息,若所述路径信息与运维路线生成路径偏差;
根据各子区域的监控信息获取运维人员在各子区域的停留时间,将所述停留时间与相同故障预警的对应时间进行对比生成时间偏差;
若所述时间偏差或路径偏差大于对应偏差阈值,则生成异常信息,并向安保人员及其他运维人员进行发送。
7.根据权利要求6所述的一种数据中心的可视化运维管理系统,其特征在于,获取数据中心的运维数据信息,根据所述运维数据信息进行能耗分析,通过能耗分析制定智能调控方案,具体为:
获取数据中心的历史运维数据,根据所述历史运维数据获取服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率,结合数据中心中预设区域范围的区域热环境温度信息进行匹配生成时序序列;
根据所述服务器设备的风扇转速,处理器利用率,内存利用率及I/O占用率进行能耗分析,基于LSTM建立服务器设备的能耗预测模型,并初始化参数;
将所述时序序列预处理为训练集与测试集,通过所述训练集对所述能耗预测模型进行迭代训练及准确性验证,获取预设时间周期内的服务器设备参数信息导入能耗预测模型;
根据所述能耗预测模型获取预设时间后的能耗预测值,根据能耗预测值预测数据中心中预设区域范围的区域热环境温度信息;
根据空调调控的滞后性对所述区域热环境温度信息进行误差补偿,对数据中心的区域热环境温度三维可视化模型进行可视化显示,根据补偿后的区域热环境温度信息进行数据中心的环境温度智能调控方案。
8.根据权利要求6所述的一种数据中心的可视化运维管理系统,其特征在于,提取运维数据中的能耗数据、设备运行数据及环境参数进行数据分析,并对同类数据不同时段的数据进行对比分析,检测数据中心的故障,具体为:
提取运维数据中的能耗数据、设备运行数据及环境参数,将提取的数据进行数据标准化处理,将数据进行分类;
获取预设时间周期内不同时段中相同环境参数下设备的历史设备运行数据及历史能耗数据,将当前提取的数据与所述历史运行数据集历史能耗数据进行相似度对比;
若所述相似度不符合预设相似度阈值标准,则生成故障检测调用指令;
获取设备正常运行情况下调用故障检测调用指令的响应时间区间,当设备调用故障检测调用指令的响应时间不处于所述响应时间区间时,则生成故障预警信息。
9.根据权利要求6所述的一种数据中心的可视化运维管理系统,其特征在于,获取故障的类型及位置信息生成故障报告,根据故障报告生成故障解决方案,具体为:
根据数据中心的故障预警获确定故障所在链路信息,构建故障知识库,根据预设周期内不同日期的同一时刻的设备运行数据生成设备运行数据基准曲线;
获取每个时刻点的实时设备运行数据,根据所述设备运行数据基准曲线获取异常数据的出现频次及时段分布,通过所述出现频次及时段分布获取当前故障特征,在故障知识库中进行大数据分析,获取故障类型;
根据所述故障所在链路信息及故障类型生成故障报告,根据所述故障报告生成索引标签在故障知识库中建立索引任务,获取故障知识库中与当前故障的匹配度符合预设值要求的运维管理数据;
根据所述运维管理数据获取故障原因及解决方案,根据所述故障原因及解决方案生成维修工单,将故障预警及维修工单在数据中心三维可视化模型中进行标签显示。
CN202210584586.5A 2022-05-27 2022-05-27 一种数据中心的可视化运维管理方法及系统 Active CN114676862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210584586.5A CN114676862B (zh) 2022-05-27 2022-05-27 一种数据中心的可视化运维管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210584586.5A CN114676862B (zh) 2022-05-27 2022-05-27 一种数据中心的可视化运维管理方法及系统

Publications (2)

Publication Number Publication Date
CN114676862A CN114676862A (zh) 2022-06-28
CN114676862B true CN114676862B (zh) 2022-09-09

Family

ID=82080273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210584586.5A Active CN114676862B (zh) 2022-05-27 2022-05-27 一种数据中心的可视化运维管理方法及系统

Country Status (1)

Country Link
CN (1) CN114676862B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115421950B (zh) * 2022-08-25 2024-01-23 广东博成网络科技有限公司 一种基于机器学习的自动化系统运维管理方法及系统
CN115578068B (zh) * 2022-10-25 2023-05-05 广东星神科技有限公司 一种办公空间的数字化管理方法及装置
CN116029701B (zh) * 2023-01-19 2024-02-27 中国长江三峡集团有限公司 一种数据中心能耗评估方法、系统、装置及电子设备
CN116824050B (zh) * 2023-06-16 2024-06-04 广东际洲科技股份有限公司 一种it设备可视化运维系统
CN117041018B (zh) * 2023-10-09 2024-01-02 中电科大数据研究院有限公司 一种数据中心远程智能运维管理方法及相关设备
CN117118862A (zh) * 2023-10-19 2023-11-24 湖南三湘银行股份有限公司 一种大数据中心监控数据可视化系统及方法
CN117611060B (zh) * 2024-01-24 2024-04-23 天津万事达物流装备有限公司 一种基于无人仓库使用的轻型提升机的智能管理系统
CN117828798B (zh) * 2024-03-05 2024-05-24 山东怡然信息技术有限公司 基于大数据的综合智能布线方法及系统
CN118113565A (zh) * 2024-03-11 2024-05-31 安徽高颐科技有限公司 一种数据中心的可视化运维管理系统
CN117992315A (zh) * 2024-04-03 2024-05-07 福建时代星云科技有限公司 一种ems平台数据可视化方法及终端
CN118246344B (zh) * 2024-05-20 2024-08-16 国网信息通信产业集团有限公司 基于数据驱动的暖通空调系统在线优化方法
CN118246714B (zh) * 2024-05-28 2024-07-30 中国水利水电第九工程局有限公司 一种水利水电工程施工能耗分析方法及系统
CN118409936B (zh) * 2024-07-03 2024-09-17 青岛大学 一种计算机故障报警系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343593A (zh) * 2021-08-05 2021-09-03 佛山市陶风互联网络科技有限公司 基于神经网络的家装布线规划管理方法、系统及存储介质
CN114050963A (zh) * 2021-10-28 2022-02-15 上海市安装工程集团有限公司 一种数据中心设备运维管理现场定位找寻系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244502B2 (en) * 2009-08-12 2012-08-14 International Business Machines Corporation Knowledge-based models for data centers
CN108413567B (zh) * 2018-03-14 2020-05-26 山东建筑大学 基于物联网的中央空调节费优化方法与系统
CN110442940A (zh) * 2019-07-25 2019-11-12 天津大学青岛海洋技术研究院 一种高效的船舶多管路并行智能布局设计方法
CN111381163A (zh) * 2020-03-31 2020-07-07 浙江江宇电机有限公司 电机群组故障预警方法及装置
CN111860900A (zh) * 2020-08-14 2020-10-30 中国能源建设集团广东省电力设计研究院有限公司 基于bim的数字孪生智慧机房管理方法、装置、设备及介质
CN113505046A (zh) * 2021-05-31 2021-10-15 云聚数据科技(上海)有限公司 一种三维可视化数据中心监控管理系统与方法
CN114021932A (zh) * 2021-10-28 2022-02-08 华能利津风力发电有限公司 风电机组的能效评价与诊断方法、系统及介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343593A (zh) * 2021-08-05 2021-09-03 佛山市陶风互联网络科技有限公司 基于神经网络的家装布线规划管理方法、系统及存储介质
CN114050963A (zh) * 2021-10-28 2022-02-15 上海市安装工程集团有限公司 一种数据中心设备运维管理现场定位找寻系统

Also Published As

Publication number Publication date
CN114676862A (zh) 2022-06-28

Similar Documents

Publication Publication Date Title
CN114676862B (zh) 一种数据中心的可视化运维管理方法及系统
US9158035B2 (en) System and method of automated acquisition, correlation and display of power distribution grid operational parameters and weather events
US20190228296A1 (en) Significant events identifier for outlier root cause investigation
JP2007520019A (ja) リスクを検出するためのコンピュータベースシステム及び方法
CN114862288B (zh) 智慧水务二次加压管理系统
JP2008276279A (ja) 装置性能管理方法、装置性能管理システム、および管理プログラム
CN112181786B (zh) 一种巡检应用的配置方法、装置及设备
EP4097577A1 (en) Systems and methods for resource analysis, optimization, or visualization
CN111292327A (zh) 机房巡检方法、装置、设备及存储介质
CN116595756A (zh) 基于数字孪生的数据中心智能化运维方法及装置
CN115334560B (zh) 基站异常的监测方法、装置、设备及计算机可读存储介质
CN114398354A (zh) 数据监测方法、装置、电子设备及存储介质
CN113993005B (zh) 电网设备检查方法、装置、计算机设备和存储介质
JP2009009538A (ja) 運転状況分析方法および運転状況分析システム
TW201826059A (zh) 設備管理裝置、設備管理方法、及程式
CN114034972B (zh) 基于图像数据的智能电缆故障确定方法和装置
CN108122036B (zh) 一种变电站带电运检辅助分析方法
CN115899991A (zh) 空调运行控制方法、装置、电子设备及存储介质
JP2002230238A (ja) 災害対策支援システムおよびプログラム
CN115659351A (zh) 一种基于大数据办公的信息安全分析方法、系统及设备
CN115098326A (zh) 一种系统异常检测方法及装置、存储介质及电子设备
CN115185792A (zh) 故障硬件处理方法、装置和系统
JP6995701B2 (ja) 系統断面データ管理装置および方法
CN113837462A (zh) 故障风险趋势分析方法、装置、服务器和存储介质
CN112989150A (zh) 一种运维图的获取方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant