CN117271265A - 一种it监控装置及监控方法 - Google Patents

一种it监控装置及监控方法 Download PDF

Info

Publication number
CN117271265A
CN117271265A CN202311299232.7A CN202311299232A CN117271265A CN 117271265 A CN117271265 A CN 117271265A CN 202311299232 A CN202311299232 A CN 202311299232A CN 117271265 A CN117271265 A CN 117271265A
Authority
CN
China
Prior art keywords
data
monitoring
module
monitoring device
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311299232.7A
Other languages
English (en)
Inventor
李迎军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank Of China Ltd Yunnan Branch
Original Assignee
Agricultural Bank Of China Ltd Yunnan Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank Of China Ltd Yunnan Branch filed Critical Agricultural Bank Of China Ltd Yunnan Branch
Priority to CN202311299232.7A priority Critical patent/CN117271265A/zh
Publication of CN117271265A publication Critical patent/CN117271265A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3086Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves the use of self describing data formats, i.e. metadata, markup languages, human readable formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及硬件监控技术领域,公开了一种IT监控装置,包括:数据采集模块:用于获取硬件设备的各个状态和性能数据指标,数据存储模块:用于将采集到的数据需要存储在数据库中以供后续处理和分析。本发明的IT监控装置及监控方法,具有实时监控和警报、故障预防和减少停机时间、提高硬件资源利用率、性能优化和瓶颈分析、自动化运维和故障处理、容量规划和资源调度、数据分析和决策支持、合规性和安全审计、服务级别管理、提高响应和解决问题的效率,以及数据驱动的决策和优化的功能。能够提高硬件设备的可靠性、性能和安全性,减少故障和业务中断,提高资源利用效率和管理效率,从而增强组织的业务连续性和竞争力。

Description

一种IT监控装置及监控方法
技术领域
本发明涉及硬件监控技术领域,具体涉及一种IT监控装置及监控方法。
背景技术
IT是信息技术行业的统称,IT实际上有三个层次:第一层是硬件,主要指数据存储、处理和传输的主机和网络通信设备;第二层是指软件,包括可用来搜集、存储、检索、分析、应用、评估信息的各种软件,它包括我们通常所指的ERP(企业资源计划)、CRM(客户关系管理)、SCM(供应链管理)等商用管理软件,也包括用来加强流程管理的WF(工作流)管理软件、辅助分析的DW/DM(数据仓库和数据挖掘)软件等;第三层是指应用,指搜集、存储、检索、分析、应用、评估使用各种信息,包括应用ERP、CRM、SCM等软件直接辅助决策,也包括利用其他决策分析模型或借助DW/DM等技术手段来进一步提高分析的质量,辅助决策者作决策。
目前缺少一种能够对IT硬件进行实时监控的装置,无法做到实时监控管理硬件设备的状态和性能数据,自动化操作、数据分析和报告等,导致硬件设备的可靠性和维护效率不够高,因此亟待提出一种IT监控装置及监控方法。
发明内容
为实现以上目的,本发明通过以下技术方案予以实现:一种IT监控装置,包括:
数据采集模块:用于获取硬件设备的各个状态和性能数据指标;
数据存储模块:用于将采集到的数据需要存储在数据库中以供后续处理和分析;
数据处理和分析模块:用于对存储的数据需要进行处理和分析,以提取有用的信息和指标;
告警管理模块:用于根据设定的阈值和规则,检测数据中的异常和超出阈值的情况,并触发告警;
可视化展示模块:用于通过图形展示的形式将监控数据进行可视化展示;
自动化运维模块:用于通过自动化任务和脚本来执行常见的运维操作和故障处理;
数据安全和权限管理模块:用于进行用户认证、权限管理和数据加密,只有授权的用户才能访问和操作监控装置和相关数据,以防止未授权的访问和数据泄露。
优选的,所述数据采集模块通过使用SNMP、WMI、API调用中的其中一项或多项从硬件设备中获取数据。
优选的,所述数据处理和分析模块具体包括:清洗和处理采集数据、聚合数据生成指标和报表、进行统计分析和异常检测。
优选的,自动化运维模块具体包括:定期备份设备配置、执行固件升级、进行自动化故障排查。
优选的,IT监控装置还包括,设备发现和注册模块:通过自动化扫描网络、配置设备代理或手动输入设备信息建立与设备的连接,以获取设备的监控数据。
优选的,IT监控装置还包括,实时监控和采集模块:用于通过轮询、事件驱动或推送的方式,定期发送请求或侦听设备的变化,以获取最新的监控数据。
优选的,IT监控装置还包括,扩展模块:用于添加新的设备类型和监控指标,并灵活的配置选项。
优选的,IT监控装置还包括,报告和分析模块:用于生成定期或按需的监控报告,包括设备状态、性能指标、故障记录,以进行数据分析和趋势分析。
一种IT监控方法,包括:
S1、通过设备发现和注册模块发现要监控的硬件设备;
S2、数据采集模块从设备中获取数据,并传输到数据存储模块进行存储;
S3、数据处理和分析模块对存储的数据进行处理和分析,生成有用的信息,同时,告警管理模块根据设定的规则和阈值,触发告警通知;
S4、数据处理和分析模块对数据进行分析后,生成可视化展示,以便管理员查看设备状态和性能;
S5、自动化运维模块执行自动化任务和故障处理,提高运维效率,安全和权限模块确保监控装置的安全性,限制访问权限。
本发明具有以下有益效果:
本发明的IT监控装置及监控方法,具有实时监控和警报、故障预防和减少停机时间、提高硬件资源利用率、性能优化和瓶颈分析、自动化运维和故障处理、容量规划和资源调度、数据分析和决策支持、合规性和安全审计、服务级别管理、提高响应和解决问题的效率,以及数据驱动的决策和优化的功能。能够提高硬件设备的可靠性、性能和安全性,减少故障和业务中断,提高资源利用效率和管理效率,从而增强组织的业务连续性和竞争力。
附图说明
图1为本发明IT监控装置的基本实现原理流程图;
图2为本发明IT监控装置的功能展示图;
图3为本发明IT监控装置的分布式部署架构。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本发明实施例提供一种IT监控装置,包括:数据采集模块,可以通过各种方法和协议从硬件设备中获取数据,常用的方法包括使用SNMP(Simple Network ManagementProtocol)、WMI(Windows Management Instrumentation)、API调用等。通过这些方法,平台可以获取硬件设备的各种状态和性能指标,如CPU利用率、内存使用情况、网络流量、磁盘空间等。
数据存储模块:采集到的数据需要存储在数据库中以供后续处理和分析。通常会选择关系型数据库或专门用于时间序列数据的数据库,如MySQL、InfluxDB等,数据存储的结构和模式根据监控装置的需求和数据类型而有所不同。
数据处理和分析模块:存储的数据需要进行处理和分析,以提取有用的信息和指标。这包括数据清洗、聚合、压缩和计算等操作。通过这些处理和分析,可以生成更高级别的指标和报表,用于监控和评估硬件设备的性能和状态。
告警管理模块:监控装置根据设定的阈值和规则,检测数据中的异常和超出阈值的情况,并触发告警。可以通过邮件、短信、即时通讯等方式发送告警通知。告警管理功能帮助管理员及时响应和处理异常情况,以减少业务中断和故障发生。
可视化展示模块:通过图表、报表、仪表盘等形式将监控数据进行可视化展示。这样管理员和利益相关者可以直观地了解设备的状态和性能。常用的数据可视化工具包括Grafana、Kibana等,它们提供了丰富的可视化组件和功能。
自动化运维模块:监控装置可以通过自动化脚本和任务执行常见的运维操作和故障处理。例如,可以定期备份设备配置、执行固件升级、自动化故障排查等操作,减少人工干预的工作量,提高运维效率和一致性。
数据安全和权限管理模块:监控装置需要确保数据的安全性,包括用户认证、权限管理和数据加密等措施。只有授权的用户才能访问和操作监控装置和相关数据,以防止未授权的访问和数据泄露。
设备发现和注册模块:监控装置需要能够发现和注册要监控的硬件设备。这可以通过自动化扫描网络、配置设备代理或手动输入设备信息来实现。发现和注册设备后,监控装置可以建立与设备的连接,以获取设备的监控数据。
实时监控和采集:监控装置需要能够实时监控硬件设备的状态和性能,并及时采集数据。平台可以定期发送请求或侦听设备的变化,以获取最新的监控数据。这可以通过轮询、事件驱动或推送方式实现。
扩展模块:监控装置应具备良好的扩展性和可定制性,以适应不同的硬件设备和监控需求。平台应支持添加新的设备类型和监控指标,并具备灵活的配置选项,以满足不断变化的监控要求。
报告和分析模块:生成定期或按需的监控报告,包括设备状态、性能指标、故障记录等。进行数据分析和趋势分析,帮助管理员了解设备的历史表现和趋势变化,以支持决策和优化。
可扩展性和集成性:支持灵活的扩展和集成,可以与其他监控系统、管理系统和自动化工具进行集成,实现全面的IT基础设施管理。
总体而言,IT硬件监控装置通过数据采集、存储、处理、分析和展示等步骤,实现对硬件设备的实时监控和管理。通过有效的监控和分析,可以及时发现问题、预测趋势,并采取相应的措施,提高硬件设备的性能和稳定性,确保业务的正常运行。
IT监控装置可以带来多种有益效果,包括:
1.实时监控和警报:监控装置能够实时监测硬件设备的状态和性能指标,并在出现异常或超出预设阈值时发出警报。这可以帮助管理员及时发现问题并采取措施,以避免潜在的故障和服务中断。
2.故障预防和减少停机时间:通过监控装置,管理员可以及时发现潜在的问题和故障迹象,并采取预防措施。这有助于减少硬件设备的故障次数,提高设备的可靠性和稳定性,从而减少停机时间和业务中断。
3.提高硬件资源利用率:监控装置可以跟踪和分析硬件设备的资源使用情况,如CPU利用率、内存利用率、存储空间等。管理员可以根据这些数据进行容量规划和优化,合理分配资源,提高硬件资源的利用效率。
4.性能优化和瓶颈分析:监控装置可以提供关于硬件设备性能的详细数据和指标。管理员可以利用这些数据进行性能分析和瓶颈定位,找出系统性能瓶颈,并采取相应的措施进行优化,以提高系统的响应速度和性能。
5.自动化运维和故障处理:监控装置可以与自动化工具和脚本集成,实现自动化的运维和故障处理,当出现故障或异常时,监控装置可以自动触发预定义的操作和任务,如自动重启设备、自动切换到备用设备等,从而减少人工干预的需求和故障恢复时间。
6.容量规划和资源调度:通过监控装置提供的数据和趋势分析,管理员可以预测硬件设备的容量需求,并进行相应的规划和资源调度。这可以避免资源短缺或过度配置,提高资源利用效率,节约成本。
7.数据分析和决策支持:监控装置可以对采集的硬件数据进行分析和可视化,提供有关设备状态、性能趋势和问题模式的洞察。这些数据和洞察可以帮助管理员做出更准确的决策,优化设备配置、制定维护计划和升级策略。
8.提高响应和解决问题的效率:通过实时监控和自动化运维,监控装置可以快速发现问题并采取相应的措施,这有助于提高故障响应和解决问题的效率,减少停机时间和业务中断,提高用户满意度。
9.数据驱动的决策和优化:监控装置提供的数据和分析结果可以为决策和优化提供依据,管理员可以基于数据进行容量规划、资源调度、设备升级和维护计划等决策,从而实现更高效的资源管理和系统优化。
实施例2:
本发明实施例提供一种IT监控方法,根据图1和图2所示,首先从设备发现和注册开始,包括扫描网络设备并将其注册到监控装置的平台上。然后,进行数据采集,获取设备的状态信息和性能指标,采集到的数据通过传输到监控平台进行存储;接下来,进行数据处理和分析,包括清洗、过滤、聚合和压缩数据,进行数据分析和挖掘;
在告警处理阶段,设定阈值和告警规则,监测数据是否超过阈值,并触发告警通知,通过可视化展示,创建仪表盘、报表、图表等,提供用户界面供查看和分析数据,最后,自动化运维阶段根据告警信息自动采取措施,执行故障排除流程和自动化运维操作和任务执行,数据安全和权限管理确保监控平台的安全性,限制访问权限。
图1和图2展示了IT监控装置的全流程,涵盖了设备发现和注册、数据采集、数据传输、数据存储、数据处理和分析、告警处理、可视化展示以及自动化运维和故障处理等关键步骤。通过这些步骤,IT监控装置能够实现对硬件设备的全面监控、数据分析和可视化展示,以及自动化运维和故障处理的功能。这样可以提高硬件设备的可靠性、性能和安全性,减少故障和业务中断,提高资源利用效率和管理效率,进而增强组织的业务连续性和竞争力。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种IT监控装置,其特征在于:包括:
数据采集模块:用于获取硬件设备的各个状态和性能数据指标;
数据存储模块:用于将采集到的数据需要存储在数据库中以供后续处理和分析;
数据处理和分析模块:用于对存储的数据需要进行处理和分析,以提取有用的信息和指标;
告警管理模块:用于根据设定的阈值和规则,检测数据中的异常和超出阈值的情况,并触发告警;
可视化展示模块:用于通过图形展示的形式将监控数据进行可视化展示;
自动化运维模块:用于通过自动化任务和脚本来执行常见的运维操作和故障处理;
数据安全和权限管理模块:用于进行用户认证、权限管理和数据加密,只有授权的用户才能访问和操作监控装置和相关数据,以防止未授权的访问和数据泄露。
2.根据权利要求1所述的一种IT监控装置,其特征在于:
所述数据采集模块通过使用SNMP、WMI、API调用中的其中一项或多项从硬件设备中获取数据。
3.根据权利要求1所述的一种IT监控装置,其特征在于:所述数据处理和分析模块具体包括:清洗和处理采集数据、聚合数据生成指标和报表、进行统计分析和异常检测。
4.根据权利要求1所述的一种IT监控装置,其特征在于步骤:自动化运维模块具体包括:定期备份设备配置、执行固件升级、进行自动化故障排查。
5.根据权利要求1所述的一种IT监控装置,其特征在于:还包括,设备发现和注册模块:通过自动化扫描网络、配置设备代理或手动输入设备信息建立与设备的连接,以获取设备的监控数据。
6.根据权利要求1所述的一种IT监控装置,其特征在于:还包括,实时监控和采集模块:用于通过轮询、事件驱动或推送的方式,定期发送请求或侦听设备的变化,以获取最新的监控数据。
7.根据权利要求1所述的一种IT监控装置,其特征在于:还包括,扩展模块:用于添加新的设备类型和监控指标,并灵活的配置选项。
8.根据权利要求1所述的一种IT监控装置,其特征在于:还包括,报告和分析模块:用于生成定期或按需的监控报告,包括设备状态、性能指标、故障记录,以进行数据分析和趋势分析。
9.一种IT监控方法,其特征在于,包括:
S1、通过设备发现和注册模块发现要监控的硬件设备;
S2、数据采集模块从设备中获取数据,并传输到数据存储模块进行存储;
S3、数据处理和分析模块对存储的数据进行处理和分析,生成有用的信息,同时,告警管理模块根据设定的规则和阈值,触发告警通知;
S4、数据处理和分析模块对数据进行分析后,生成可视化展示,以便管理员查看设备状态和性能;
S5、自动化运维模块执行自动化任务和故障处理,提高运维效率,安全和权限模块确保监控装置的安全性,限制访问权限。
CN202311299232.7A 2023-10-09 2023-10-09 一种it监控装置及监控方法 Pending CN117271265A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311299232.7A CN117271265A (zh) 2023-10-09 2023-10-09 一种it监控装置及监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311299232.7A CN117271265A (zh) 2023-10-09 2023-10-09 一种it监控装置及监控方法

Publications (1)

Publication Number Publication Date
CN117271265A true CN117271265A (zh) 2023-12-22

Family

ID=89221242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311299232.7A Pending CN117271265A (zh) 2023-10-09 2023-10-09 一种it监控装置及监控方法

Country Status (1)

Country Link
CN (1) CN117271265A (zh)

Similar Documents

Publication Publication Date Title
CN104407964B (zh) 一种基于数据中心的集中监控系统及方法
US6856942B2 (en) System, method and model for autonomic management of enterprise applications
US10489711B1 (en) Method and apparatus for predictive behavioral analytics for IT operations
CN105302120A (zh) 智能设备的远程服务装置、系统和方法
CN100549975C (zh) 计算机维护帮助系统及分析服务器
CN110738352A (zh) 基于故障大数据的维修派单管理方法、装置、设备及介质
CN104022904A (zh) 分布式机房it设备统一管理平台
CN111858176A (zh) 一种远程监控故障自愈系统和方法
CN116895046B (zh) 基于虚拟化的异常运维数据处理方法
CN117010665A (zh) 智慧运维idc机房管理系统
CN117220917A (zh) 一种基于云计算的网络实时监控方法
CN114143160B (zh) 一种云平台自动化运维系统
CN117251353A (zh) 一种民航弱电系统的监控方法、系统及平台
CN114327967A (zh) 设备修复方法及装置、存储介质、电子装置
CN113537590A (zh) 一种数据异常预测方法及系统
CN105703942B (zh) 一种日志采集方法及装置
KR100496958B1 (ko) 시스템 장애 통합관리방법
CN117271265A (zh) 一种it监控装置及监控方法
CN114090382B (zh) 超融合集群健康巡检方法和装置
CN109614292A (zh) 基于shell的主机运行数据自动采集监控系统
CN115687036A (zh) 日志采集方法、装置及日志系统
CN114428715A (zh) 一种日志处理方法、装置、系统及存储介质
CN111447329A (zh) 呼叫中心中状态服务器的监控方法、系统、设备及介质
JP2020141353A (ja) 装置管理方法、管理装置及びプログラム
CN118331823B (zh) 航天工程业务运行日志管理与监控告警方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination