CN117520096B - 一种智能服务器安全监控系统 - Google Patents

一种智能服务器安全监控系统 Download PDF

Info

Publication number
CN117520096B
CN117520096B CN202311578961.6A CN202311578961A CN117520096B CN 117520096 B CN117520096 B CN 117520096B CN 202311578961 A CN202311578961 A CN 202311578961A CN 117520096 B CN117520096 B CN 117520096B
Authority
CN
China
Prior art keywords
monitoring
data
server
servers
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311578961.6A
Other languages
English (en)
Other versions
CN117520096A (zh
Inventor
黄文良
陈旭桥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Baota Safety Technology Co ltd
Original Assignee
Guangdong Baota Safety Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Baota Safety Technology Co ltd filed Critical Guangdong Baota Safety Technology Co ltd
Priority to CN202311578961.6A priority Critical patent/CN117520096B/zh
Publication of CN117520096A publication Critical patent/CN117520096A/zh
Application granted granted Critical
Publication of CN117520096B publication Critical patent/CN117520096B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/70Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
    • G06F21/71Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information

Abstract

本发明公开了一种智能服务器安全监控系统,系统包括数据采集模块、子监控模块、数据存储单元、警报单元、动态监控模块、进程评估模块、安全中心模块,进程评估模块根据数据标签对应的数值变化对不同时刻的服务器数量进行评估,通过计算事件中不同时刻分析对应的数据标签数值的自相关系数确定对应的服务器的数量,再由动态分析模块对实际服务器网络中的误差进行分析,当服务器异常终止运行且数据采集过程异常时,根据进程评估模块的分析结果对运行的服务器个数进行分析,提高了服务器动态监测的实时性和监控效率。

Description

一种智能服务器安全监控系统
技术领域
本发明涉及智能监控技术领域,具体涉及一种智能服务器安全监控系统。
背景技术
对于分布式系统来说,服务器部署的跨网段、跨IDC机房、跨地域的特点带来了巨大的网络环境的差异、网络复杂性和网络不稳定性,如何高效地监控服务器的在线状态和运行状态至关重要;现有技术中已经有很多成熟的服务器监控系统技术来实现对于服务器的实时数据收集和运行监控,例如Zabbix、Nagios、SNMP协议、WMI系统管理接口,但是在分布式系统中,运行任务量多,任务类型多样化,参与计算的服务器的数量增加时,服务器监测数据的采集过程发生改变,监控系统对服务器的监控能力有限,并且当服务器出现工作异常和监测数据传输异常时,监测数据周期性采集的特点不能及时发现异常点,只能采集到服务器的异常的监测数据以后才能发现异常,为了提高智能服务器安全监控的效率,保证运行任务量大时,也能准精的监控到所有服务器的状态,本发明提出了种智能服务器安全监控系统。
发明内容
针对上述情况,为了克服现有技术之缺陷,本发明之目的提供了一种智能服务器安全监控系统,系统的进程评估模块对运行对象进行评估分析确定服务器的当前计算规模,再由子监控模块对监测数据周期采集的过程进行延时分析,再由动态监控模块对接入服务器的整体状态进行动态阈值分析,对服务器发生改变时监控系统的动态进行分析,大大提高了服务器监控的实时性和监控效率。
一种智能服务器安全监控系统,包括数据采集模块、子监控模块、数据存储单元、警报单元、动态监控模块、进程评估模块、安全中心模块;
所述数据采集模块中的监控采集端对服务器的运行状态进行监测得到监测数据,并将监测数据传输至数据存储单元进行数据存储;
所述监控采集端对服务器运行状态的监控是周期性的,子监控模块根据服务器的监测数据的数据分析来对服务器的运行状态进行监测,并确定不同服务器的警报规则,由所述子监控模块对每一个服务器的周期性采集和传输的过程进行分析,通对传输过程的数据分析来判断监测数据采集过程的状态;
所述进程评估模块对计算对象的分布式计算过程中不同时刻的状态进行评估得到当前计算规模,并根据当前计算规模部署各个服务器的计算业务和监控采集端,分布式计算过程中不同状态下参与计算的服务器数量不同;
所述动态监控模块对参与数据计算的所有服务器的监测指标进行动态分析,当服务器网络的计算规模发生改变时,动态监控模块根据进程评估模块确定的当前计算规模确定对应的服务器数量和待接入的服务器数量,并根据监测数据采集周期的分析结果进行计算,得到待接入服务器监测数据的接收过程的分析结果,动态监控模块对服务器接入前与接入的动态参数发生的改变和监控系统的平稳状态进行分析预测;
监控系统的运维人员通过安全中心模块对整体服务器网络进行调整,当服务器的数量变化时,服务器的数据监控指标的对应数值发生改变,根据预测结果对服务器的异常进行安全调整。
所述动态监控模块对服务器数量变化过程中服务器的数据监控指标的变化进行整体动态分析,具体过程如下:
步骤1、参与运算的不同数量的服务器组成服务器网络,将分布式计算网络中的每一个服务器记为一个节点,根据数据采集模块采集的节点的监测数据提取节点对应节点向量;
步骤2、当服务器网络的节点数固定时,动态监控模块根据所有的节点向量建立动态方程对节点的状态进行异常预测,预测方程如下:
利用z时刻的节点的运行状态以及监控系统传输误差来估计状态z+1时刻节点的异常状态,其中,为z时刻数据监控指标的监控函数,F(z)为状态转移矩阵,ε为监控系统总的传输误差,传输误差是根据传输总延时计算得到的;
步骤3、当进程评估模块的评估结果改变时,根据评估结果确定需要的服务器的数量,并通过运算得到运算规模中待接入的服务器数量,记为b,服务器接入的时间记为(t1,t2,t3,...,tb),以起始点为标记的时间戳,根据子监控模块的确定介入后传输的传输总时延,
步骤4、动态监控模块结合子监控模块的分析结果与接入服务前的预测结果,对服务器的动态接入过程进行状态分析,对同一个时刻内进行数据传输的所有节点变化进行分析得到动态变化阈值;
步骤5、根据动态变化阈值的分析过程对服务器网络整体的稳定性进行分析。
所述子监控模块的分析过程包括监测数据的分析过程和监测数据采集周期的分析过程,服务器根据自身运算产生监测数据,数据采集模块的不同监控采集端对服务器的监测数据进行周期性采集,子监控模块对服务器采集周期的分析过程如下:
步骤一、子监控模块对数据采集模块采集的所有服务器第一个采集周期的监测数据进行运行状态分析,并确定不同服务器的警报规则,正常运行的服务器个数记为K,将服务器对应的监测数据采集周期数据的上传时刻记为aii∈[1,K],i表示服务器的下标;
步骤二、计算初始周期以后的所有轮训周期过程的传输总时延,传输总时延包括传输时延、计算时延和接收时延,计算时延为服务器周期运行状态分析时长与步骤一中第一个周期对应时长差值的绝对值;
步骤三、传输时延为信道长度与电磁波在信道上传输速率相除,不同服务器的传输时延不同,不同上传过程中的传输时延对传输的数据量进行加权,并计算出相同上传时刻值,所有的服务器上传数据量加权以后的总和;
步骤四、接收时延为监控运维端接受时的网络的通信量,传输总时延为传输时延、计算时延和接收时延的总和,子监控模块对监测数据的分析过程的分析结果符合警报规则,则发布警报信息,监测数据没有异常时,计算监测数据采集周期的传输总时延。
所述进程评估模块对计算对象的计算规模和变化过程进行计算评估,根据对象确定数据计算的数据标签,数据标签对应的具体数值记为Xi,i∈[1,p],p为数据标签个数,不同状态下数据标签对应的数值发生改变,参与计算的服务器数量也不相同,进程评估模块对计算对象不同时间点的自相关性进行计算,计算公式如下:
其中,Δ(X,t)=Xi+t-Xi为时间差t的变化值,X为不同时刻数据标签的评估数据指标向量。
所述进程评估模块根据自相关系数确定不同时刻之间运算对象的评估数据指标的变化,进程评估模块通过对运算对象的评估分析确定服务器的初始个数和各个服务器的业务功能,在分布式计算过程中,随着计算规模的变化,所需的服务器个数也发生变化,根据自相关系数确定相邻时刻所需的服务器数量成正比,服务器数量减去以运行的服务器数量即为需增加的服务器数量。
在所述数据采集模块中,不同监控采集端中的agent对服务器的不同工作状态的数据进行周期轮回监控采集,监测数据中包括服务器的运行数据、状态数据和在线数据。
所述警报单元根据客户需求和报警规则判断是否触发警报,并将警报信息按照指定方式发送,包括报警类型、报警原因、报警次数以及报警处理情况。
所述安全中心模块为服务器安全监控系统的控制端,运维人员结合动态监控模块的分析结果对服务器进行远程安全控制。
由于以上技术方案的采用,本发明与现有技术相比具有以下优点:
本发明的进程评估模块对运算事件中对象进行评估分析得到p个对象描述的数据标签,在分布式运算过程不同运算时刻对应的运算规模不同,服务器的数量发生变化时,数据标签对应的数值发生改变,进程评估模块根据数据标签对应的数值变化对不同时刻的服务器数量进行评估,通过计算事件中不同时刻分析对应的数据标签数值的自相关系数确定对应的服务器的数量,再由动态分析模块对实际服务器网络中的误差进行分析,当服务器异常终止运行且数据采集过程异常时,根据进程评估模块的分析结果对运行的服务器个数进行分析,提高了服务器动态监测的实时性和监控效率。
附图说明
图1为本发明的整体分析流程图;
图2为本发明中整体模块图;
图3为本发明的子监控模块的分析流程图;
图4为本发明的动态监控模块的分析流程图。
具体实施方式
有关本发明的前述及其他技术内容、特点与功效,在以下配合参考附图1到4对实施例的详细说明中,将可清楚的呈现。本申请的实施方式及实施方式中的特征可以相互组合,说明书中所使用的术语为本发明的技术领域技术人员通常理解的含义。
具体实施例使用时,随着计算机技术的不断发展,分布式计算的应用范围越来越广,通过对服务器运行数据的分析来对服务器的安全运行进行监控,首先采用SNMP协议、API接口、日志监控等方式对服务器的各项数据指标以及运行数据进行采集,将采集到的数据存储于服务器监控系统的数据库中,以便日后的查询分析,并借助机器学习、数据挖掘等技术,对存储的数据进行分析,发现变化、事件和异常行为,再将分析结果进行可视化,以便运维人员和管理人员更直观地了解服务器的运行情况和性能状况,最后服务器监控系统对发现的变化、事件和异常行为进行告警处理,例如发送邮件和短信提示管理员尽快处理,不同服务器的工作类型不同,所适用的监控系统也会有所差别,不同监控系统的数据采集方式、存储方式、分析技术和可视化方式不同,所以当分布式计算规模发生改变时,需要大量的服务器参与到计算中来,服务器的数量和类型发生动态变化,并且服务器存在级联的关系,最实用的监控工具和监控技术也会发生改变,会造成监控系统监控效率的降低的问题,为了提高服务器数量发生改变时,监控系统的监控效率不被影响,本发明提出了一种智能服务器安全监控系统,包括数据采集模块、子监控模块、数据存储单元、警报单元、动态监控模块、进程评估模块、安全中心模块;
在所述数据采集模块进行数据采集之前,服务器监控系统在待监测服务器上进行装和配置,以便数据采集模块的代理监控程序能够收集服务器的各种性能数据,实现对服务器的CPU监控、网络监控、内存监控、磁盘监控等,例如CPU监控项中包括CPU利用率、CPU缓存、CPU实用主频率、CPU的名字和位置,网络监控中服务器接受的TCP请求数、TCP连接失败个数、TCP重复率、TCP接收的分片数、内存数据,对内存实用情况监控的内存监控项中包括所有内存、已使用内存、可用内存、内存使用率、多进程共享的内存总额、虚拟内存总量,对磁盘使用情况的监控,例如,磁盘的监控项中包括磁盘总量、设备名称、磁盘使用率、磁盘未使用量,服务器不同状态下参与运算的状态和参与的程度不同,所述数据采集模块中的监控采集端对服务器的运行状态进行监测得到监测数据,并将监测数据传输至数据存储单元进行数据存储,监测数据包括服务器的运行数据、状态数据和在线数据,数据采集模块对采集的监测数据进行数据传输和聚合,将本地收集的数据定期传输到远程服务器上,数据存储单元对实时数据、历史数据、数据分析和数据分布等多种形式的数据进行数据存储,服务器的接入状态包括运行状态、任务状态以及在线状态;
对象和业务组代理轮检后的数据进行监控分析,所以服务器的异常在轮检后数据分析时才能被发现,使得服务器的异常不能及时被发现,
各个服务器的监控端按照监控系统设定的时间间隔或事件触发条件,收集监测数据并将其存储在本地或远程服务器上,这些数据可以用于后续的分析和可视化,由于所述监控采集端对服务器运行状态的监控是周期性的,并且数据采集过程中的起始触发条件和采集周期不同,当服务器的发生异常时,只有采集到异常数据,才可能发现异常的服务器,并且当安装在服务器的监控端的监控程序发生异常时,就不能正常的采集到监测数据了,所以保证服务器的整体工作状态的监控时,监测数据的采集过程也应该在分析范围内,子监控模块根据服务器监测数据的数据分析来对服务器的运行状态进行监测,并确定不同服务器的警报规则,由所述子监控模块对每一个服务器的周期性采集和传输的过程进行分析,通对传输过程的数据分析来判断监测数据采集过程的状态;子监控模块首先对收集到的数据进行清洗和过滤,再对收集的服务器的各项指标数据进行分析,并判断服务器的状态,最后对服务器的使用命令工具进行收集,对数据采集和数据分析周期过程进行分析,功能服务器有WEB服务器、数据库服务器、文件服务器;
分布式计算中运行服务器的数量发生改变时,对运算事件描述的指标数据发生改变,所述进程评估模块对计算对象的分布式计算过程中不同时刻的状态进行评估得到当前计算规模,并根据当前计算规模部署各个服务器的计算业务和监控采集端,分布式计算过程中不同状态下参与计算的服务器数量不同;
所述动态监控模块对参与数据计算的所有服务器的监测指标进行动态分析,当服务器网络的计算规模发生改变时,监控系统监控服务器的能力也随之变化,才可以准确的监控到所有服务器的状态,动态监控模块根据进程评估模块确定的当前计算规模确定对应的服务器数量和待接入的服务器数量,并根据监测数据采集周期的分析结果进行计算,得到待接入服务器监测数据的接收过程的分析结果,动态监控模块对服务器接入前与接入的动态参数发生的改变和监控系统的平稳状态进行分析预测;不同服务器节点之间存在关联关系,服务器的运算状态和功能不相同,对应的节点的警报规则也不相同,动态监控模块对所有节点组成的节点网的整体状态进行动态监控和预测,当服务器在运行过程中被攻击时,被攻击节点对周围节点产生影响,动态监控模块通过监控对所有服务器的异常状态进行整体监控;
监控系统的运维人员通过安全中心模块对整体服务器网络进行调整,当服务器的数量变化时,服务器的数据监控指标的对应数值发生改变,根据预测结果对服务器的异常进行安全调整。
服务器的数量发生改变时,监控系统及时对自身漏洞进行处理,首先更新系统补丁,修复已经存在的系统漏洞,然后再禁用危险服务、删除危险组件、关闭危险端口,全面排除暴露的系统危险,目标服务器的恶意占用会造成目标服务器CPU、内存和磁盘大量负载,造成服务器宕机;
服务器数量发生改变时,不同功能的服务器的数据接入点,服务器的各项指标均对整体的运行指标有影响,将所有服务器的节点关联成一个节点网络并结合子监控模块对每一个节点的监控结果进行整体的状态分析,进一步地,所述动态监控模块对服务器数量变化过程中服务器的数据监控指标的变化进行整体动态分析,动态分析模块对数量变化前后的变化进行分析,根据服务器没有变化前产生的数据进行预测分析,再结合预测的结果对服务器数量变化后的状态进行分析,具体过程如下:
步骤1、参与运算的不同数量的服务器组成服务器网络,将分布式计算网络中的每一个服务器记为一个节点,根据所述数据采集模块采集的节点的监测数据提取节点对应节点向量,节点向量中包括子监控模块对服务器运行的各个指标的分析结果;
步骤2、当服务器网络的节点数固定时,动态监控模块根据所有的节点向量建立动态方程对节点的状态进行异常预测,预测方程如下:
利用z时刻的节点的运行状态以及监控系统传输误差来估计状态z+1时刻节点的异常状态,其中,为z时刻数据监控指标的监控函数,F(z)为状态转移矩阵,ε为监控系统总的传输误差,传输误差是根据传输总延时计算得到的,服务器的数量未发生改变时,固定数量服务器的监测数据采集过程中传输误差根据子监控模块得到,动态监控模块对整体网络的误差进行整体分析;
步骤3、当进程评估模块的评估结果改变时,根据评估结果确定需要的服务器的数量,并通过运算得到运算规模中待接入的服务器数量,记为b,服务器接入的时间记为(t1,t2,t3,...,tb),以起始点为标记的时间戳,根据子监控模块的确定介入后传输的传输总时延,监控系统在大量新的服务器进行运行时,节点的介入对整个服务器网络产生动态影响;
步骤4、动态监控模块结合子监控模块的分析结果与接入服务前的预测结果,对服务器的动态接入过程进行状态分析,对同一个时刻内进行数据传输的所有节点变化进行分析得到动态变化阈值,动态分析模块结合变化前的预测结果对变化后的状态进行分析,根据服务器数量变化前对异常状态的预测结果对改变后的节点网络进行整体分析,不同节点接入的时间、功能、数据采集周期各不相同;
步骤5、根据动态变化阈值的分析过程对服务器网络整体的稳定性进行分析。
在服务器分布式运行过程时,不同的监控系统对服务器监控的特点不相同,例如普罗米修斯监控系统的监测数据可以按照时间顺序数据进行数据接入,Zabbix监控系统通过采集各种服务器的性能数据、日志数据等,需要大量的网络带宽和存储空间来传输和存储数据,当服务器大规模部署时,会给网络和存储系统造成压力,监控系统的监控过程中保证数据的正常接入是至关重要的,在服务器的部署规模发生变化是,子监控模块对数据周期采集过程中的数据传输进行分析,服务器轮巡采集的周期不同,不同规模下同一时刻传输的数据量的分析是对网络产生压力的关键,监测数据的传输时刻和传输时延与服务器规模的变化时刻有关,所述子监控模块的分析过程包括监测数据的分析过程和监测数据采集周期的分析过程,子监控模块通过服务器监测数据的分析来判断服务器的运行状态,服务器自身运形产生运行日志等数据,数据采集模块的不同监控采集端对服务器的监测数据进行周期性采集,子监控模块是监控系统对服务器监控的第一监控模块,根据监测数据进行分析来判定服务器的异常情况,动态监控模块是第二监控模块,从整体的变化方向对服务器进行分析,不同服务器的监控采集周期的起始点和周期轮巡时长均不相同,轮巡周期结束后,上传服务器的监测数据,不同时刻轮巡结束上传监测数据的周期个数不同,在当前时刻,同时上传的节点的监测数据共同对监控系统的传输和分析产生压力,子监控模块对不同时刻的传输总时延进行分析,子监控模块对服务器采集周期的分析过程如下:
步骤一、子监控模块对数据采集模块采集的所有服务器第一个采集周期的监测数据进行运行状态分析,并确定不同服务器的警报规则,正常运行的服务器个数记为K,将服务器对应的监测数据采集周期数据的上传时刻记为aii∈[1,K],i表示服务器的下标;
步骤二、计算初始周期以后的所有轮训周期过程的传输总时延,传输总时延是一个时刻同时进行监测数据上传的所有服务器的周期代带的时延,传输总时延包括传输时延、计算时延和接收时延,计算时延为服务器周期运行状态分析时长与步骤一中的一个周期对应时长差值的绝对值,传输时延是在一个时刻一个服务器的信息传输带来的延迟,计算时延是子监控模块对服务器进行第一次监测时带来的时延,接收时延是监测数据接收过程中的时延;
步骤三、传输时延为信道长度与电磁波在信道上传输速率相除,不同服务器的传输时延不同,同一时刻处于相同监测数据传输状态的服务器周期共同作用,不同上传过程中的传输时延对传输的数据量进行加权,并计算出相同上传时刻值,所有服务器上传数据量加权后的总和;
步骤四、接收时延为监控运维端接受时的网络的通信量,不同的服务器传输的监测数据共同作用于接收端,不同服务器的监测数据通信占比不同,传输总时延为所有同一时刻传输的服务器的传输时延、计算时延和接收时延的分析总和,子监控模块对监测数据的分析过程的分析结果符合警报规则,则发布警报信息,监测数据没有异常时,计算监测数据采集周期的传输总时延。
客户通过身份验证登录服务系统,通过身份验证确定实用服务和资源的类型,确定服务事件的初始信息,所述进程评估模块对计算对象的计算规模和变化过程进行计算评估,根据对象确定数据计算的数据标签,数据标签对应的具体数值记为Xi,i∈[1,p],p为数据标签个数,不同状态下数据标签对应的数值发生改变,参与计算的服务器数量也不相同,进程评估模块对计算对象不同时间点的自相关性进行计算,计算公式如下:
其中,Δ(X,t)=Xi+t-Xi为时间差t的变化值,X为不同时刻数据标签的评估数据指标向量,根据事件的对象描述得到数据标签,数据标签的对应的数值组成评估数据的指标向量。
所述进程评估模块根据自相关系数确定不同时刻之间运算对象的评估数据指标的变化,进程评估模块通过对运算对象的评估分析确定服务器的初始个数和各个服务器的业务功能,在分布式计算过程中,随着计算规模的变化,所需的服务器个数也发生变化,根据自相关系数确定相邻时刻所需的服务器数量成正比,服务器数量减去以运行的服务器数量即为需增加的服务器数量。
在所述数据采集模块中,不同监控采集端中的agent对服务器的不同工作状态的数据进行周期轮回监控采集,监测数据中包括服务器的运行数据、状态数据和在线数据。
所述警报单元根据客户需求和报警规则判断是否触发警报,并将警报信息按照指定方式发送,包括报警类型、报警原因、报警次数以及报警处理情况,不同服务器的警报规则是根据服务器的运行数据和触发条件所决定的,通过设置监测规则和阈值,当监测数据出现异常时,系统将自动发出预警和警报,并通知相关人员进行修复和调整,这些报警信息可以通过邮件、短信、电话等方式及时通知相关人员。
所述安全中心模块为服务器安全监控系统的控制端,运维人员结合动态监控模块的分析结果对服务器进行远程安全控制,通过对服务器监测数据的分析和可视化以便于运维人员和管理人员更直观的了解服务器的运行情况和性能情况,对服务器各项指标的变化趋势和分布情况进行可视化,服务器的安全防护通过自动开启系统防火墙、服务器禁PING、修改RDP默认端口,管理系统监听端口,手动选择信任端口,安全日志审计。
本实施例的子监控模块是对服务器进行安全监控的第一监控单位,当子监控模块根据监测数据分析判定服务器异常时,直接触发服务器的警报规则,由警报单元直接发出警报信息,当监测数据没有异常时,子监控模块再对监测数据的采集过程进行分析,得到监测数据采集周期的传输总时延,子监控模块对一个时刻内同时上传的服务器采集周期的监测数据给监控系统带来的压力进行分析,数据采集周期对应点不同,子监控模块将不同采集周期接入时带来的影响转化为时延分析,提高了动态数据监控的准确性。
本实施例的动态监控模块对整体服务器网络的状态进行监控,首先动态分析模块结合子监控模块的传输时延确定传输误差,并对服务器数量发生变化前的整体监控指标进行预测,再结合进程评估模块的评估得到的服务器变化的数量差,当服务器的数量发生改变时,动态监控模块根据变化前的预测结果和监测数据进程整体的监控状态分析得到动态变化阈值,再结合动态阈值进行整体的稳定性分析,当服务器终止运行且子监控模块没有监控到时,动态分析模块结合子监控模块和进程评估模块的分析结果进行整体状态分析,大大提高服务器监控的效率和服务器监控系统的稳定性。
本发明具体实用时,系统包括数据采集模块、子监控模块、数据存储单元、警报单元、动态监控模块、进程评估模块、安全中心模块,数据采集模块中的监控采集端对服务器的运行状态进行监测得到监测数据,并将监测数据传输至数据存储单元进行数据存储,再由所述子监控模块对服务器进行第一次安全监控,当子监控模块根据监测数据分析判定服务器异常时,直接触发服务器的警报规则,由警报单元直接发出警报信息,当监测数据没有异常时,子监控模块再对监测数据的采集过程进行分析,得到监测数据采集周期的传输总时延,并将传输总时延发送至动态监控模块;所述进程评估模块根据对象描述的数据标签对应的数值变化对不同时刻的服务器数量进行评估,并通过计算事件中不同时刻分析对应的数据标签数值的自相关系数确定对应的服务器的数量,最后,动态监控模块对整体服务器网络的状态进行监控,首先动态分析模块结合子监控模块的传输时延确定传输误差,并对服务器数量发生变化前的整体监控指标进行预测,再结合进程评估模块的评估得到的服务器变化的数量差,当服务器的数量发生改变时,动态监控模块根据变化前的预测结果和监测数据进程整体的监控状态分析得到动态变化阈值,再结合动态阈值进行整体的稳定性分析,当服务器终止运行且子监控模块没有监控到时,动态分析模块结合子监控模块和进程评估模块的分析结果进行整体状态分析,大大提高服务器监控的效率和服务器监控系统的稳定性,提高了服务器动态监测的实时性。
以上所述是结合具体实施方式对本发明所作的进一步详细说明,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (7)

1.一种智能服务器安全监控系统,其特征在于,包括数据采集模块、子监控模块、数据存储单元和进程评估模块;
所述数据采集模块中的监控采集端对服务器的运行状态进行监测得到监测数据,并将监测数据传输至数据存储单元进行数据存储;
所述监控采集端对服务器运行状态的监控是周期性的,子监控模块根据服务器监测数据的数据分析来对服务器的运行状态进行监测,并确定不同服务器的警报规则,由所述子监控模块对每一个服务器的周期性采集和传输的过程进行分析,通对传输过程的数据分析来判断监测数据采集过程的状态;
所述进程评估模块对计算对象的分布式计算过程中不同时刻的状态进行评估得到当前计算规模,并根据当前计算规模部署各个服务器的计算业务和监控采集端,分布式计算过程中不同状态下参与计算的服务器数量不同;
还包括动态监控模块和安全中心模块;
所述动态监控模块对参与数据计算的所有服务器的监测指标进行动态分析,当服务器网络的计算规模发生改变时,动态监控模块根据进程评估模块确定的当前计算规模确定对应的服务器数量和待接入的服务器数量,并根据监测数据采集周期的分析结果进行计算,得到待接入服务器监测数据的接收过程的分析结果,动态监控模块对服务器接入前与接入的动态参数发生的改变和监控系统的平稳状态进行分析预测;
监控系统的运维人员通过安全中心模块对整体服务器网络进行调整,当服务器的数量变化时,服务器的数据监控指标的对应数值发生改变,根据预测结果对服务器的异常进行安全调整;
所述进程评估模块对计算对象的计算规模和变化过程进行计算评估,根据对象确定数据计算的数据标签,数据标签对应的具体数值记为Xi,i∈[1,p],p为数据标签个数,不同状态下数据标签对应的数值发生改变,参与计算的服务器数量也不相同,进程评估模块对计算对象不同时间点的自相关性进行计算,计算公式如下:
其中,Δ(X,t)=Xi+t-Xi为时间差t的变化值,X为不同时刻数据标签的评估数据指标向量。
2.根据权利要求1所述的一种智能服务器安全监控系统,其特征在于,所述动态监控模块对服务器数量变化过程中服务器的数据监控指标的变化进行整体动态分析。
3.根据权利要求1所述的一种智能服务器安全监控系统,其特征在于,所述子监控模块的分析过程包括监测数据的分析过程和监测数据采集周期的分析过程,数据采集模块的不同监控采集端对服务器运行过程中的监测数据进行周期性采集。
4.根据权利要求1所述的一种智能服务器安全监控系统,其特征在于,所述进程评估模块根据自相关系数确定不同时刻之间运算对象的评估数据指标的变化,进程评估模块通过对运算对象的评估分析确定服务器的初始个数和各个服务器的业务功能,在分布式计算过程中,随着计算规模的变化,所需的服务器个数也发生变化,根据自相关系数确定相邻时刻所需的服务器数量成正比,服务器数量减去以运行的服务器数量即为需增加的服务器数量。
5.根据权利要求1所述的一种智能服务器安全监控系统,其特征在于,在所述数据采集模块中,不同监控采集端中的agent对服务器的不同工作状态的数据进行周期轮回监控采集,监测数据中包括服务器的运行数据、状态数据和在线数据。
6.根据权利要求1所述的一种智能服务器安全监控系统,其特征在于,还包括警报单元,所述警报单元根据客户需求和报警规则判断是否触发警报,并将警报信息按照指定方式发送,包括报警类型、报警原因、报警次数以及报警处理情况。
7.根据权利要求1所述的一种智能服务器安全监控系统,其特征在于,所述安全中心模块为服务器安全监控系统的控制端,运维人员结合动态监控模块的分析结果对服务器进行远程安全控制。
CN202311578961.6A 2023-11-23 2023-11-23 一种智能服务器安全监控系统 Active CN117520096B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311578961.6A CN117520096B (zh) 2023-11-23 2023-11-23 一种智能服务器安全监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311578961.6A CN117520096B (zh) 2023-11-23 2023-11-23 一种智能服务器安全监控系统

Publications (2)

Publication Number Publication Date
CN117520096A CN117520096A (zh) 2024-02-06
CN117520096B true CN117520096B (zh) 2024-05-03

Family

ID=89764179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311578961.6A Active CN117520096B (zh) 2023-11-23 2023-11-23 一种智能服务器安全监控系统

Country Status (1)

Country Link
CN (1) CN117520096B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2824330A1 (en) * 2011-01-12 2012-07-19 Videonetics Technology Private Limited An integrated intelligent server based system and method/systems adapted to facilitate fail-safe integration and/or optimized utilization of various sensory inputs
WO2015085244A1 (en) * 2013-12-06 2015-06-11 Lookout, Inc. Distributed monitoring, evaluation, and response for multiple devices
CN112965874A (zh) * 2021-03-04 2021-06-15 浪潮云信息技术股份公司 一种可配置的监控告警方法及系统
CN116319061A (zh) * 2023-04-18 2023-06-23 天津市职业大学 一种智能控制网络系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2824330A1 (en) * 2011-01-12 2012-07-19 Videonetics Technology Private Limited An integrated intelligent server based system and method/systems adapted to facilitate fail-safe integration and/or optimized utilization of various sensory inputs
WO2015085244A1 (en) * 2013-12-06 2015-06-11 Lookout, Inc. Distributed monitoring, evaluation, and response for multiple devices
CN112965874A (zh) * 2021-03-04 2021-06-15 浪潮云信息技术股份公司 一种可配置的监控告警方法及系统
CN116319061A (zh) * 2023-04-18 2023-06-23 天津市职业大学 一种智能控制网络系统

Also Published As

Publication number Publication date
CN117520096A (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
US20220030021A1 (en) Method and system for confident anomaly detection in computer network traffic
EP1505768B1 (en) Method for efficient reactive monitoring
KR100840129B1 (ko) 통계적인 분석을 이용한 성능장애 관리시스템 및 그 방법
US20060069956A1 (en) Method and system for reducing false alarms in network fault management systems
CN114757590B (zh) 基于大数据分析的企业运营风险预警及管控系统
US20050097207A1 (en) System and method of predicting future behavior of a battery of end-to-end probes to anticipate and prevent computer network performance degradation
CN109412870A (zh) 告警监控方法及平台、服务器、存储介质
US20110078301A1 (en) Systems and methods for detecting network conditions based on correlation between trend lines
CN113242153B (zh) 一种基于网络流量监控的面向应用的监控分析方法
CN113438110B (zh) 一种集群性能的评价方法、装置、设备及存储介质
Xu et al. Lightweight and adaptive service api performance monitoring in highly dynamic cloud environment
US8180716B2 (en) Method and device for forecasting computational needs of an application
CN115801121A (zh) 光缆设备异常检测方法及装置
CN110049015B (zh) 网络安全态势感知系统
CN117520096B (zh) 一种智能服务器安全监控系统
Raja et al. Rule generation for TCP SYN flood attack in SIEM environment
US10110440B2 (en) Detecting network conditions based on derivatives of event trending
CN115080363B (zh) 一种基于业务日志的系统容量评估方法及装置
CN114531338A (zh) 一种基于调用链数据的监控告警和溯源方法及系统
EP3787240A1 (en) Abnormality detection apparatus, abnormality detection method, and abnormality detection program
Yang et al. Traffic anomaly detection and prediction based on SDN-enabled ICN
Qian et al. Research on DNS attack detection based on HMM
Meilei et al. Research on Key Technology and System Design of Network Performance Monitoring System
CN116702121B (zh) 一种云桌面场景下增强访问控制安全性的方法
CN117495357B (zh) 一种基于大数据的电力数据监管系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant