CN108306747B - 一种云安全检测方法、装置和电子设备 - Google Patents

一种云安全检测方法、装置和电子设备 Download PDF

Info

Publication number
CN108306747B
CN108306747B CN201710020111.2A CN201710020111A CN108306747B CN 108306747 B CN108306747 B CN 108306747B CN 201710020111 A CN201710020111 A CN 201710020111A CN 108306747 B CN108306747 B CN 108306747B
Authority
CN
China
Prior art keywords
fault
application layer
cloud security
determining
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710020111.2A
Other languages
English (en)
Other versions
CN108306747A (zh
Inventor
丁超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710020111.2A priority Critical patent/CN108306747B/zh
Publication of CN108306747A publication Critical patent/CN108306747A/zh
Application granted granted Critical
Publication of CN108306747B publication Critical patent/CN108306747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提出一种云安全检测方法、装置和电子设备,包括:获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;根据所述故障对象的故障评估结果,以及所述故障对象的关联对象的故障评估结果,得到云安全系统的故障检测结果。本申请将网络设备端与服务器设备端的完整链路建立起来,同时根据不同链路区块的特点,设置健康度的层级,整条链路建立起实时预警机制,在必须时进行自动修复或者人工干预排查,由于问题的准确定位,大大提升了系统的稳定性。

Description

一种云安全检测方法、装置和电子设备
技术领域
本发明涉及云产品安全领域,具体涉及一种云安全检测方法、装置和电子设备。
背景技术
随着互联网技术的进一步发展,云计算应用的普及,虚拟化资源池、弹性架构、服务可度量、灵活接入和按需服务等特性让计算资源(包括网络,服务器,存储,应用软件,服务)变得随时、随地、随需可得,极大的优化了IT(Internet Technology,互联网技术)资源效率,但同时也对云上用户的IT系统安全性提出了新的挑战。云上业务的安全是客户的生命线,如今安全灰、黑产业泛滥,切实有效的保障云上安全需要强大的云安全系统。云上安全系统属于全时段的保障系统,其稳定性至关重要,出现问题的快速恢复能力自然而然成为了重要的部分。
云安全系统的防护大体可以分为网络安全与应用安全两层,网络层安全主要对镜像流量进行分析,功能涉及DDos(Distributed Denial of Service,分布式拒绝服务)攻击检测、流量旁路阻断、流量清洗等等,而应用层安全主要涉及web应用防火墙、防御CC(Challenge Collapsar,挑战黑洞)攻击等功能。由于云安全系统本身的特殊性,其自下而上的链路硬件层面上涉及到诸多的网络设备与服务器设备,软件层面上涉及到多层次的调用与被调用,关系复杂。现阶段对于单模块,单应用,单设备等等的监控手段非常多,技术也十分成熟,业界大部分采用的也均属于单点或者多点监控预警,也有诸多“全系统/链路”的监控,在现有的技术实现中,网络设备端与服务器设备端的监控预警往往是相对独立的。按照现有的技术手段,云安全系统的健康度检查、预警工作会有一定的局限性。如果仅仅出现在服务器设备端,软件/硬件故障,通过各种监控、预警方式将可以做到很好的保障效果。同样,在网络设备端,也可以做到类似的效果。但是在云安全某些事件中,网络端预警系统可能并未发现,服务器层面也并没有问题,可是应用出现严重问题,此时排查问题就会陷入非常大的麻烦,由于无法及时定位问题,需要联系网络工程师,系统工程师,业务运维工程师,开发工程师等等一起联合排查,不但耗时耗力,问题也解决的慢,导致故障升级,系统稳定性被客户质疑等等问题。
发明内容
本申请提供一种云安全检测方法、装置和电子设备,实现云安全实时的预警,确保链路的某个环节出现问题时可以迅速定位并解决,提高云安全系统的可靠性与稳定性。
采取的技术方案如下:
一种云安全检测方法,包括:
获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;
根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
根据所述故障对象的故障评估结果,以及所述故障对象的关联对象的故障评估结果,得到云安全系统的故障检测结果。
可选地,得到云安全系统的故障检测结果包括以下任一项或多项:
对所述云安全系统故障进行判定;
对所述云安全系统故障进行定位。
可选地,所述预定的关联关系包括:网络设备和服务器设备之间的映射关系,以及应用层软件之间的调用关系。
可选地,所述故障对象包括以下一种或多种:网络设备、服务器设备、应用层软件。
可选地,网络设备与服务器设备之间的映射关系包括:
网络设备与服务器设备之间的端口连接情况。
可选地,根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象包括以下至少之一:
根据网络设备与服务器设备之间的端口连接情况确定网络设备与服务器设备之间的映射关系,以及根据所述应用层软件的数据流向确定应用层软件之间的调用关系;
根据所述监控数据的流向确定网络设备与服务器设备之间的映射关系;以及所述监控数据的流向确定应用层软件之间的调用关系;
根据下载或者接收上位机的数据,确定网络设备与服务器设备之间的映射关系和应用层软件之间的调用关系。
可选地,当所述故障对象为网络设备或服务器设备时,根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述网络设备或服务器设备的故障评估,以及与所述网络设备或服务器设备存在映射关系的设备的故障评估,对所述云安全系统故障进行判定和/或定位;
当所述故障对象为应用层软件时,根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述应用层软件的故障评估,以及与所述应用层软件存在调用关系的应用层软件的故障评估,对所述云安全系统故障进行判定和/或定位。
可选地,得到云安全系统的故障检测结果包括:
将所述故障对象的故障评估得分,以及所述故障对象的关联对象的故障评估得分进行加权计算,获得完整链路累积的故障得分;
当所述完整链路累积的故障得分超过预设分值时,发出报警。
可选地,所述网络设备的监控数据包括以下的一项或者多项:
运营商线路实时流量;
分流器的流量的入流量以及出流量;
云安全集群网卡收到的流量;
交换机路由器的流量信息。
可选地,服务器设备的监控数据包括以下的一项或者多项:
处理器参数、内存参数、硬盘参数、负载参数。
可选地,应用层软件的监控数据包括以下的一项或者多项:
应用的进程信息、应用的端口信息、应用的数据库信息。
为解决上述技术问题,本发明还提供一种云安全检测装置,包括:
获取模块,设置为获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;
关联模块,设置为根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
故障模块,设置为根据所述故障对象的故障评估结果,以及所述故障对象的关联对象的故障评估结果,得到云安全系统的故障检测结果。
可选地,所述故障模块得到云安全系统的故障检测结果包括以下任一项或多项:
对所述云安全系统故障进行判定;
对所述云安全系统故障进行定位。
可选地,所述关联模块的所述预定的关联关系包括:网络设备和服务器设备之间的映射关系,以及应用层软件之间的调用关系。
可选地,所述关联模块的网络设备与服务器设备之间的映射关系包括:
网络设备与服务器设备之间的端口连接情况。
可选地,所述关联模块根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象包括以下至少之一:
根据网络设备与服务器设备之间的端口连接情况确定网络设备与服务器设备之间的映射关系,以及根据所述应用层软件的数据流向确定应用层软件之间的调用关系;
根据所述监控数据的流向确定网络设备与服务器设备之间的映射关系;以及所述监控数据的流向确定应用层软件之间的调用关系;
根据下载或者接收上位机的数据,确定网络设备与服务器设备之间的映射关系和应用层软件之间的调用关系。
可选地,当所述故障对象为网络设备或服务器设备时,所述关联模块根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述网络设备或服务器设备的故障评估,以及与所述网络设备或服务器设备存在映射关系的设备的故障评估,对所述云安全系统故障进行判定和/或定位;
当所述故障对象为应用层软件时,所述关联模块根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述应用层软件的故障评估,以及与所述应用层软件存在调用关系的应用层软件的故障评估,对所述云安全系统故障进行判定和/或定位。
可选地,所述故障模块得到云安全系统的故障检测结果包括:
将所述故障对象的故障评估得分,以及所述故障对象的关联对象的故障评估得分进行加权计算,获得完整链路累积的故障得分;
当所述完整链路累积的故障得分超过预设分值时,发出报警。
为解决上述技术问题,本发明还提供一种用于进行云安全检测的电子设备,包括:存储器和处理器;
所述存储器用于保存用于进行云安全检测的程序;
所述处理器用于进行云安全检测的程序在被读取执行时,执行以下操作:
获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;
根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果。
本申请和现有技术相比,具有如下有益效果:
本申请至少一个实施例的技术方案将网络设备端与服务器设备端的完整链路建立起来,同时根据不同链路区块的特点,设置健康度的层级,整条链路建立起实时预警机制,在必须时进行自动修复或者人工干预排查,由于问题的准确定位,大大提升了系统的稳定性。
附图说明
图1为本发明实施例的一种云安全检测方法的流程图;
图2为本发明实施例的一种云安全检测装置的结构示意图;
图3为本发明实施例1的一种云安全链路的结构示意图;
图4为本发明实施例2的一种云安全预警判定的流程图。
具体实施方式
为使本发明的发明目的、技术方案和有益效果更加清楚明了,下面结合附图对本发明的实施例进行说明,需要说明的是,在不冲突的情况下,本申请中的实施例和实施例中的特征可以相互任意组合。
如图1所示,本发明实施例提供一种云安全预警方法,包括:
S101、获取云安全系统内预定监控对象的云计算监控数据;
S102、根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
S103、根据所述故障对象的故障评估结果,以及所述故障对象的关联对象的故障评估结果,得到云安全系统的故障检测结果。
本发明实施例中,监控对象包括以下一种或多种:网络设备、服务器设备和应用层软件。相应地,本发明实施例中,所述故障对象包括以下一种或多种:网络设备、服务器设备和应用层软件。
服务器设备主要包括云安全系统中涉及的集群服务器、虚拟化服务器等计算服务设备;网络设备主要包括云安全系统中涉及的网关、路由、边界设备、交换机等实体。
本发明实施例中,根据所述监控数据确定故障对象可以是指根据获取到的必要监控数据,以及系统硬件之间的关联关系和系统软件之间的关联关系,确定可能存在故障的对象,并进一步对故障对象进行评估,从而确定当前故障对象是否是产生故障的原因。
其中,在网络设备部分的监控数据,最重要的指标就是流量相关的信息,包括各运营商线路实时流量,分流器的流量的入流量以及出流量,云安全集群网卡收到的流量以及交换机路由器的流量信息等;在服务器设备部分的监控数据,重要的指标是cpu、内存、硬盘、负载的参数;在应用层软件部分的监控数据,重要的指标是各应用层软件的核心进程、端口、数据库等上层的信息。
本发明实施例中,预定的关联关系可以由系统管理员或其它用户根据云安全系统链路框架或者拓扑结构设置,还可以根据系统硬件之间的关联关系和系统软件之间的关联关系的改变而修改;该关联关系可以事先保存在执行本实施例方法的设备中,也可以保存在预定位置由执行本实施例方法的设备在使用时读取。
本发明实施例中,故障评估可以分为两个步骤,首先根据监控数据确定可能存在故障的对象,例如设备A的流量超过设定阈值,或者登陆的频率超过设定阈值;然后根据故障对象的故障评估结果进一步确定当前故障对象是否是产生故障的原因,本发明实施例中涉及的方式为:将当前故障对象的故障评估得分,以及所述故障对象的关联对象的故障评估得分进行加权计算,当累积的故障得分超过预设分值时,确定当前故障对象是产生故障的原因。
本发明实施例中,故障评估效果可以对故障进行判定和定位,并进一步发出报警,可以通知相关人员进行参与故障处理。
本发明实施例中,预定的关联关系可以包括系统硬件之间的映射关系,主要是网络设备与服务器设备之间的端口连接情况,应用层软件之间的调用关系,数据流向等信息,除了上述映射关系和调用关系以外,实际应用时还可以根据需要设置其它的关联关系,本发明实施例根据云安全系统内的各网络设备与各服务器设备之间的映射关系和各应用层软件的调用关系,将云安全系统的完整链路建立起来,根据不同链路区块的特点,实现整条链路实时预警,由于故障对象的准确定位,大大提升了系统的稳定性。
本发明实施例的方法可以应用于云安全系统也可以应用于集群系统中,可以云安全系统内或外的设备执行。
基于上述实施例,步骤S103中得到云安全系统的故障检测结果可以包括以下任一项或多项:
对所述云安全系统故障进行判定;
对所述云安全系统故障进行定位。
本发明实施例中,首先根据监控数据确定故障对象,对故障对象以及所述故障对象的关联对象进行故障评估,故障检测结果可以对云安全系统中出现的故障进行发现和/或判定和/或定位,进而使得链路中某个环节或者故障对象出现问题时,得以迅速解决,提高云安全系统的可靠性和稳定性。
基于上述实施例,所述预定的关联关系可以包括:网络设备和服务器设备之间的映射关系,以及应用层软件之间的调用关系。
基于上述实施例,当检测到云安全系统存在故障时,根据所述监测数据确定存在故障的设备或应用层软件,其中,存在故障的设备包括网络设备和/或服务器设备,并将其作为故障设备或故障应用,根据所述故障设备的故障评估,以及与所述故障设备存在映射关系的关联设备的故障评估,或者根据所述故障应用的故障评估,以及与所述故障应用存在调用关系的关联应用的故障评估,对所述云安全系统故障进行判定和/或定位。
网络设备与服务器设备之间的映射关系可以包括:
网络设备与服务器设备之间的端口连接情况。
根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象可以包括以下至少之一:
根据网络设备与服务器设备之间的端口连接情况确定网络设备与服务器设备之间的映射关系,以及根据所述应用层软件的数据流向确定应用层软件之间的调用关系;
根据所述监控数据的流向确定网络设备与服务器设备之间的映射关系;以及所述监控数据的流向确定应用层软件之间的调用关系;
根据下载或者接收上位机的数据,确定网络设备与服务器设备之间的映射关系和应用层软件之间的调用关系。
基于上述实施例,当所述故障对象为网络设备或服务器设备时,根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果可以包括:
根据所述网络设备或服务器设备的故障评估,以及与所述网络设备或服务器设备存在映射关系的设备的故障评估,对所述云安全系统故障进行判定和/或定位;
当所述故障对象为应用层软件时,根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述应用层软件的故障评估,以及与所述应用层软件存在调用关系的应用层软件的故障评估,对所述云安全系统故障进行判定和/或定位。
具体地,得到云安全系统的故障检测结果可以包括:
将所述故障对象的故障评估得分,以及所述故障对象的关联对象的故障评估得分进行加权计算,获得完整链路累积的故障得分;
当所述完整链路累积的故障得分超过预设分值时,发出报警。
本发明实施例通过网络设备与服务器设备之间的端口连接情况和应用层软件的数据流向,建立起云安全系统的完整链路,根据经过完整链路累积的故障评估得分对云安全系统故障进行判定和/或定位,本发明实施例中的故障评估得分包括两部分,一部分为本故障对象的故障得分,另一部分为所述故障对象的关联对象根据权值计算出来的故障得分,经过完整链路累积的故障得分为故障检测的最终故障得分,当最终故障得分超过预设分值(根据实际情况设置),发出报警,其中报警可以直接发送至对应的负责人,有可能系统存在多故障同时发生,以群组的方式,通知相关负责人进行群组共同排查,故障定位准确,大大提升了系统的稳定性。
其中,所述网络设备的监控数据可以包括以下的一项或者多项:
运营商线路实时流量;
分流器的流量的入流量以及出流量;
云安全集群网卡收到的流量;
交换机路由器的流量信息。
其中,服务器设备的监控数据可以包括以下的一项或者多项:
处理器参数、内存参数、硬盘参数、负载参数。
其中,应用层软件的监控数据可以包括以下的一项或者多项:
应用的进程信息、应用的端口信息、应用的数据库信息。
本发明实施例可以根据需要自行设置监控数据所包含的内容,例如:网络设备的操作行为日志、网络流量日志等,监控数据和内容可以由系统管理员或其它用户根据云安全系统链路框架或者拓扑结构设置,还可以根据系统硬件之间的关联关系和系统软件之间的关联关系的改变而修改。监控数据可以保存在执行本实施例方法的设备中,也可以保存在预定位置由执行本实施例方法的设备在使用时读取。
如图2所示,本发明实施例还提供一种云安全检测装置,包括:
获取模块,设置为获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;
关联模块,设置为根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
故障模块,设置为根据所述故障对象的故障评估结果,以及所述故障对象的关联对象的故障评估结果,得到云安全系统的故障检测结果。
可选地,所述故障模块得到云安全系统的故障检测结果可以包括以下任一项或多项:
对所述云安全系统故障进行判定;
对所述云安全系统故障进行定位。
优选地,所述关联模块的所述预定的关联关系包括:网络设备和服务器设备之间的映射关系,以及应用层软件之间的调用关系。
可选地,所述关联模块的网络设备与服务器设备之间的映射关系可以包括:
网络设备与服务器设备之间的端口连接情况。
可选地,所述关联模块根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象可以包括以下至少之一:
根据网络设备与服务器设备之间的端口连接情况确定网络设备与服务器设备之间的映射关系,以及根据所述应用层软件的数据流向确定应用层软件之间的调用关系;
根据所述监控数据的流向确定网络设备与服务器设备之间的映射关系;以及所述监控数据的流向确定应用层软件之间的调用关系;
根据下载或者接收上位机的数据,确定网络设备与服务器设备之间的映射关系和应用层软件之间的调用关系。
可选地,当所述故障对象为网络设备或服务器设备时,所述关联模块根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果可以包括:
根据所述网络设备或服务器设备的故障评估,以及与所述网络设备或服务器设备存在映射关系的设备的故障评估,对所述云安全系统故障进行判定和/或定位;
可选地,当所述故障对象为应用层软件时,所述关联模块根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果可以包括:
根据所述应用层软件的故障评估,以及与所述应用层软件存在调用关系的应用层软件的故障评估,对所述云安全系统故障进行判定和/或定位。
可选地,所述故障模块得到云安全系统的故障检测结果可以包括:
将所述故障对象的故障评估得分,以及所述故障对象的关联对象的故障评估得分进行加权计算,获得完整链路累积的故障得分;
当所述完整链路累积的故障得分超过预设分值时,发出报警。
本发明实施例还提供一种用于进行云安全检测的电子设备,包括:存储器和处理器;
所述存储器用于保存用于进行云安全检测的程序;
所述用于进行云安全检测的程序在被所述处理器读取执行时,执行以下操作:
获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;
根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果。
示例1
如图3所示,为一典型的云安全系统链路框架,其中,由上至下的三层分别表示:云端业务、服务器、网络部分,具体地,圆圈代表应用,各个集群是服务器,网络层包括分光、分流、路由等。图3中箭头所示的是流量在系统中可能会流转的地方,如运营商进来的流量会分光成两份相同的流量,一份流量分流后到达各个服务器集群,各个业务集群之间也会有交互链条,一份流量路由至虚拟化集群上,虚拟化集群运作的业务之间会有流量的交互,其与其余的业务集群也会有交互,以及云端的各个用户的业务都会与服务器内部业务有交互。这些交互可能是API(Application Programming Interface,应用程序编程接口)调用,也可能是网络协议层的访问,也可以是网络专线的物理上的连接。
如图3所示,本实例中网络设备包括:分光器、分流器、路由;服务器设备包括:服务器设备业务集群1、业务集群2、业务集群3、业务集群4,以及虚拟化集群服务器设备,其中,虚拟化集群服务器设备中包括内部业务1、内部业务2……内部业务n;应用层软件包括云端虚拟化集群,其中云端虚拟化集群包括云上业务1、云上业务2……云上业务n,
其中,网络层分光的目的是为了分出一份镜像流量,到达服务器的云安全集群链路中作分析,如果发现流量存在异常,会有各种动作,包括阻断、黑洞、清洗等。
本例中,预定的关联关系包括映射关系和调用关系,可以预先建立。
本例中,所建立的预定的映射关系(即网络设备和服务器设备之间的映射关系)包括:网络设备分流器与服务器设备业务集群1、业务集群2、业务集群3分别具有的映射关系;网络设备路由与服务器设备业务集群4的映射关系;网络设备路由与虚拟化集群设备的映射关系;服务器设备业务集群1与业务集群4的映射关系;服务器设备业务集群2与虚拟化集群内部业务1的映射关系;服务器设备业务集群3与虚拟化集群内部业务2的映射关系;虚拟化集群内部业务1与内部业务2的映射关系。
本例中,所建立的调用关系包括:服务器设备业务集群2和云上业务1之间的调用关系;虚拟化集群内部业务n和云上业务2之间的调用关系;云上业务2和云上业务n之间的调用关系。
在建立预定的关联关系后,可以保存在执行云安全监测的设备中或预定位置。
具体的,本实施例结合云安全链路说明利用上述云安全预警方法进行故障判定和/或定位的过程如下:
获取云计算监控数据。在网络部分,重要的监控数据是流量相关的信息,包括各运营商线路实时流量,分流器的流量的入流量以及出流量,云安全集群网卡收到的流量以及交换机路由器的流量信息等;在服务器部分,重要的监控数据是cpu、内存、硬盘、负载这些常见的参数;在应用层软件,重要的监控数据是各应用的核心进程、端口、数据库等上层的信息。
本实例中假设根据监控数据确定服务器设备业务集群2和虚拟化集群的内部业务2是故障对象,根据服务器设备业务集群2与虚拟化集群内部业务1的映射关系,以及服务器设备业务集群2和云上业务1之间的调用关系,得到故障对象服务器设备业务集群2的关联对象是虚拟化集群内部业务1和云上业务1;根据服务器设备业务集群3与虚拟化集群内部业务2的映射关系,以及虚拟化集群内部业务1与内部业务2的映射关系,得到虚拟化集群的内部业务2的关联对象是服务器设备业务集群3和虚拟化集群内部业务1。
首先对服务器设备业务集群2和虚拟化集群的内部业务2进行故障评估,根据故障评估获得服务器设备业务集群2和虚拟化集群的内部业务2的故障评估得分;再对服务器设备业务集群2的关联对象虚拟化集群内部业务1和云上业务1进行故障评估,再对虚拟化集群的内部业务2的关联对象服务器设备业务集群3和虚拟化集群内部业务1进行故障评估,获得虚拟化集群内部业务1和云上业务1、以及服务器设备业务集群3和虚拟化集群内部业务1的故障评估得分;其中,故障对象的故障评估得分和关联对象的权值的设定可以根据故障对象的位置、结构等因素进行设定,一般是以经验值为主,并在实际应用中不断调整完善,具体,故障评估得分参照本实例的故障得分进行加权计算的过程,这里暂不赘述。
当根据所述监控数据确定某个环节或者某个设备或者某个应用出现故障时,根据所述监测数据确定存在故障的设备或应用,其中,存在故障的设备包括网络设备和/或服务器设备;
对存在故障的设备或应用进行故障评估获得故障设备或应用的故障得分;对与所述故障设备存在映射关系的关联设备的故障评估或者与所述故障应用存在调用关系的关联应用进行故障评估,获得关联对象根据权值计算出来的故障得分;
将获得的两部分故障得分,进行加权计算,获得完整链路累积的故障得分;当所述完整链路累积的故障得分超过预设分值时,判定所述故障设备或者故障应用存在故障,当所述完整链路累积的故障得分没有超过预设分值时,排除所述故障设备或者故障应用的故障风险。
本实例中,对获得的故障得分进行加权计算的过程如下:
故障得分值包括两部分,一是本设备或者本应用的故障得分,另一是关联设备或者关联应用根据权值计算出来的故障得分,经过完整链路累积的故障分为最终故障分,当故障分超过预设分值(根据实际情况设置),产生系统预警信息。
具体地,如图4所示,故障分计算方法以及评价方案如下:
本实施例施行5分制,1分为正常,2-5分表示存在故障,并且分值越高故障越严重,0分表示未使用。
权值的设定可以是以经验值为主,并在实际系统中不断调整完善。如预设故障分超过3分时发出告警,网络设备分流器,出现部分流量丢失,单点打分为3分,因为流量丢失会导致后面的流量分析集群受影响,根据经验值权值设为0.4,即当前向上反馈的故障分为1.2,如果流量分析集群的故障分为1,那么此时两部分分值相加为2.2,并不会发出告警。相反,如果分析集群故障分为3,同样是流量丢失问题,首先会发出告警对本身业务进行排查,如果没有问题,则在系统中升级,分流器故障权值为0.8,反馈故障分为2.4,而此时如分流器故障分为1,两者相加为3.4,超过3,可以确定是线路问题。以上例子仅为了说明评价方案而举出,实际情况复杂程度远远超过上述例子。另外,本实例在会对相关联的故障分打标签,以确保不同故障分类处理,故障分也不会跨类别累加。
本实施例借鉴交通道路拥堵的信号灯的方式,故障分从0到5依次按照灰,绿,蓝,黄,橙,红的方式进行链路渲染(根据实际情况设置)。主要目的是方便查看,节约看图时间成本。
其中,报警可以直接发送至对应的负责人,有可能系统存在多故障同时发生,以群组的方式,通知相关负责人进行群组共同排查。
虽然本发明所揭示的实施方式如上,但其内容只是为了便于理解本发明的技术方案而采用的实施方式,并非用于限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭示的核心技术方案的前提下,可以在实施的形式和细节上做任何修改与变化,但本发明所限定的保护范围,仍须以所附的权利要求书限定的范围为准。

Claims (17)

1.一种云安全检测方法,其特征在于,包括:
获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;
根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
根据所述故障对象的故障评估结果,以及所述故障对象的关联对象的故障评估结果,得到云安全系统的故障检测结果,包括:将所述故障对象的故障评估得分,以及所述故障对象的关联对象的故障评估得分进行加权计算,获得完整链路累积的故障得分;
其中,所述预定的关联关系包括:网络设备和服务器设备之间的映射关系,以及应用层软件之间的调用关系。
2.如权利要求1所述的方法,其特征在于:得到云安全系统的故障检测结果包括以下任一项或多项:
对所述云安全系统故障进行判定;
对所述云安全系统故障进行定位。
3.如权利要求1所述的方法,其特征在于:所述故障对象包括以下一种或多种:网络设备、服务器设备、应用层软件。
4.如权利要求1所述的方法,其特征在于:网络设备与服务器设备之间的映射关系包括:
网络设备与服务器设备之间的端口连接情况。
5.如权利要求4所述的方法,其特征在于:根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象包括以下至少之一:
根据网络设备与服务器设备之间的端口连接情况确定网络设备与服务器设备之间的映射关系,以及根据所述应用层软件的数据流向确定应用层软件之间的调用关系;
根据所述监控数据的流向确定网络设备与服务器设备之间的映射关系;以及所述监控数据的流向确定应用层软件之间的调用关系;
根据下载或者接收上位机的数据,确定网络设备与服务器设备之间的映射关系和应用层软件之间的调用关系。
6.如权利要求3所述的方法,其特征在于:
当所述故障对象为网络设备或服务器设备时,根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述网络设备或服务器设备的故障评估,以及与所述网络设备或服务器设备存在映射关系的设备的故障评估,对所述云安全系统故障进行判定和/或定位;
当所述故障对象为应用层软件时,根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述应用层软件的故障评估,以及与所述应用层软件存在调用关系的应用层软件的故障评估,对所述云安全系统故障进行判定和/或定位。
7.如权利要求1所述的方法,其特征在于:所述方法还包括:
当所述完整链路累积的故障得分超过预设分值时,发出报警。
8.如权利要求1至7任一所述的方法,其特征在于:所述网络设备的监控数据包括以下的一项或者多项:
运营商线路实时流量;
分流器的流量的入流量以及出流量;
云安全集群网卡收到的流量;
交换机路由器的流量信息。
9.如权利要求1至7任一所述的方法,其特征在于:服务器设备的监控数据包括以下的一项或者多项:
处理器参数、内存参数、硬盘参数、负载参数。
10.如权利要求1至7任一所述的方法,其特征在于:应用层软件的监控数据包括以下的一项或者多项:
应用的进程信息、应用的端口信息、应用的数据库信息。
11.一种云安全检测装置,其特征在于:包括:
获取模块,设置为获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;
关联模块,设置为根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
故障模块,设置为根据所述故障对象的故障评估结果,以及所述故障对象的关联对象的故障评估结果,得到云安全系统的故障检测结果,包括:将所述故障对象的故障评估得分,以及所述故障对象的关联对象的故障评估得分进行加权计算,获得完整链路累积的故障得分;
其中,所述关联模块的所述预定的关联关系包括:网络设备和服务器设备之间的映射关系,以及应用层软件之间的调用关系。
12.如权利要求11所述的装置,其特征在于:所述故障模块得到云安全系统的故障检测结果包括以下任一项或多项:
对所述云安全系统故障进行判定;
对所述云安全系统故障进行定位。
13.如权利要求11所述的装置,其特征在于:所述关联模块的网络设备与服务器设备之间的映射关系包括:
网络设备与服务器设备之间的端口连接情况。
14.如权利要求13所述的装置,其特征在于:所述关联模块根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象包括以下至少之一:
根据网络设备与服务器设备之间的端口连接情况确定网络设备与服务器设备之间的映射关系,以及根据所述应用层软件的数据流向确定应用层软件之间的调用关系;
根据所述监控数据的流向确定网络设备与服务器设备之间的映射关系;以及所述监控数据的流向确定应用层软件之间的调用关系;
根据下载或者接收上位机的数据,确定网络设备与服务器设备之间的映射关系和应用层软件之间的调用关系。
15.如权利要求13所述的装置,其特征在于:
当所述故障对象为网络设备或服务器设备时,所述关联模块根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述网络设备或服务器设备的故障评估,以及与所述网络设备或服务器设备存在映射关系的设备的故障评估,对所述云安全系统故障进行判定和/或定位;
当所述故障对象为应用层软件时,所述关联模块根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果包括:
根据所述应用层软件的故障评估,以及与所述应用层软件存在调用关系的应用层软件的故障评估,对所述云安全系统故障进行判定和/或定位。
16.如权利要求11所述的装置,其特征在于:所述故障模块还设置为:
当所述完整链路累积的故障得分超过预设分值时,发出报警。
17.一种用于进行云安全检测的电子设备,包括:存储器和处理器;其特征在于:
所述存储器用于保存用于进行云安全检测的程序;
所述处理器用于进行云安全检测的程序在被读取执行时,执行以下操作:
获取云安全系统内的网络设备、服务器设备和应用层软件的云计算监控数据;
根据所述监控数据确定故障对象,根据预定的关联关系确定所述故障对象的关联对象;
根据所述故障对象的故障评估,以及所述故障对象的关联对象的故障评估,得到云安全系统的故障检测结果,包括:将所述故障对象的故障评估得分,以及所述故障对象的关联对象的故障评估得分进行加权计算,获得完整链路累积的故障得分;
其中,所述预定的关联关系包括:网络设备和服务器设备之间的映射关系,以及应用层软件之间的调用关系。
CN201710020111.2A 2017-01-11 2017-01-11 一种云安全检测方法、装置和电子设备 Active CN108306747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710020111.2A CN108306747B (zh) 2017-01-11 2017-01-11 一种云安全检测方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710020111.2A CN108306747B (zh) 2017-01-11 2017-01-11 一种云安全检测方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN108306747A CN108306747A (zh) 2018-07-20
CN108306747B true CN108306747B (zh) 2021-07-23

Family

ID=62872071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710020111.2A Active CN108306747B (zh) 2017-01-11 2017-01-11 一种云安全检测方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN108306747B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815080A (zh) * 2018-12-14 2019-05-28 深圳壹账通智能科技有限公司 计算机设备的三维监控方法及其装置
CN109800052B (zh) * 2018-12-15 2020-11-24 深圳先进技术研究院 应用于分布式容器云平台的异常检测与定位方法及装置
CN111314290B (zh) * 2019-12-30 2022-06-24 北京长亭未来科技有限公司 一种web应用防火墙业务连续性保护的方法、装置及电子设备
CN112152837B (zh) * 2020-08-14 2024-01-26 上海纽盾科技股份有限公司 网络安全设备智能监管的实现方法、装置及系统
CN112711507A (zh) * 2020-12-17 2021-04-27 浙江高速信息工程技术有限公司 设备告警方法、电子设备和介质
CN112910686B (zh) * 2021-01-14 2022-10-25 牙木科技股份有限公司 流量分析系统、流量分析系统的运行方法及计算机可读存储介质
CN113591477B (zh) * 2021-08-10 2023-09-15 平安银行股份有限公司 基于关联数据的故障定位方法、装置、设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101252477B (zh) * 2008-03-27 2010-12-22 杭州华三通信技术有限公司 一种网络故障根源的确定方法及分析装置
US8874963B2 (en) * 2010-12-20 2014-10-28 Nec Corporation Operations management apparatus, operations management method and program thereof
CN104734871A (zh) * 2013-12-20 2015-06-24 中兴通讯股份有限公司 一种实现故障定位的方法及装置
CN104252401B (zh) * 2014-08-29 2017-02-15 北京阅联信息技术有限公司 一种基于权重的设备状态判断方法及其系统
CN105183619B (zh) * 2015-09-29 2018-03-27 北京奇艺世纪科技有限公司 一种系统故障预警方法和系统
CN105357029B (zh) * 2015-09-29 2018-11-27 国网福建省电力有限公司 基于全站信息的智能变电站通信链路异常的检测分析方法

Also Published As

Publication number Publication date
CN108306747A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN108306747B (zh) 一种云安全检测方法、装置和电子设备
US9483343B2 (en) System and method of visualizing historical event correlations in a data center
US20200106662A1 (en) Systems and methods for managing network health
CN110716842B (zh) 集群故障检测方法和装置
CN111342988B (zh) 一种基于态势感知的网络安全预警方法及装置
CN112291075B (zh) 网络故障定位方法、装置、计算机设备及存储介质
US20190319923A1 (en) Network data control method, system and security protection device
CN109150635A (zh) 故障影响分析方法及装置
CN112003747A (zh) 云虚拟网关的故障定位方法
CN109964450B (zh) 一种确定共享风险链路组的方法及装置
WO2018035765A1 (zh) 网络异常的检测方法及装置
CN116909817A (zh) 专线控制方法、装置、计算机设备和存储介质
CN115102865A (zh) 一种网络安全设备拓扑管理方法及系统
CN113873560A (zh) 网络故障的处理方法和装置
US10432451B2 (en) Systems and methods for managing network health
CN114666373A (zh) 物联网终端的维护方法及相关设备
CN112291185B (zh) 一种采集网络数据的方法和装置
CN111261271B (zh) 一种针对视频监控环境的业务可用性诊断方法及装置
CN111083011A (zh) 路由安全防火墙和管理平台的自动化测试方法及装置
CN110933066A (zh) 网络终端非法接入局域网的监控系统及方法
CN116723111B (zh) 业务请求的处理方法、系统及电子设备
CN112001623B (zh) 软件负载均衡的健康度的评估方法、系统、介质和设备
US11949580B2 (en) Data center management based on probing
US12126492B2 (en) Data center management based on merging/unmerging of configurations
CN112653587B (zh) 一种网络连通状态检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant