CN116980314A - 系统访问量监控方法、装置、电子设备和存储介质 - Google Patents

系统访问量监控方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN116980314A
CN116980314A CN202210397604.9A CN202210397604A CN116980314A CN 116980314 A CN116980314 A CN 116980314A CN 202210397604 A CN202210397604 A CN 202210397604A CN 116980314 A CN116980314 A CN 116980314A
Authority
CN
China
Prior art keywords
early warning
threshold value
warning threshold
determining
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210397604.9A
Other languages
English (en)
Inventor
史森
林纲
孙剑骏
郑浩彬
段新
黄容
倪泳智
侯韶宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Guangdong Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202210397604.9A priority Critical patent/CN116980314A/zh
Publication of CN116980314A publication Critical patent/CN116980314A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种系统访问量监控方法、装置、电子设备和存储介质,其中方法包括:获取待监控系统的历史访问量数据;基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;基于所述预警阈值,对所述待监控系统进行访问量监控。本发明提供的方法、装置、电子设备和存储介质,可以提高系统访问量监控的准确率、灵活性和效率。

Description

系统访问量监控方法、装置、电子设备和存储介质
技术领域
本发明涉及流量监控技术领域,尤其涉及一种系统访问量监控方法、装置、电子设备和存储介质。
背景技术
系统访问量监控是系统安全预警的重要功能。通过系统访问量监控,可以识别异常网络段IP、安全演练IP、绕行IP及疑似DDOS攻击等异常访问。
目前,基于人工设置的预警阈值,对系统的访问量进行监控。然而,人工设置预警阈值依赖于专业人员对业务的深入了解,基于此,基于人工设置的预警阈值不够精确,降低了对系统进行访问量监控的准确性,最终影响了系统的正常运行。此外,由于访问流量数据会随时间的变迁而改变,而人工设置预警阈值过于死板,即使通过人工对预警阈值进行实时更新,人工设置预警阈值的效率也偏低,进而影响了系统的正常运行。
发明内容
本发明提供一种系统访问量监控方法、装置、电子设备和存储介质,用以解决现有技术中人工设置预警阈值准确率低、灵活性低、效率低的缺陷,实现高准确率、高灵活性、高效率的系统访问量监控。
本发明提供一种系统访问量监控方法,包括:
获取待监控系统的历史访问量数据;
基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;
基于所述预警阈值,对所述待监控系统进行访问量监控。
根据本发明提供的一种系统访问量监控方法,所述基于第一预设置信度,确定所述历史访问量数据的第一置信区间,包括:
对所述历史访问量数据进行聚类处理,得到聚类结果;
对所述聚类结果中各簇类进行数据清洗,得到清洗后的各簇类;
基于第一预设置信度和所述清洗后的各簇类,确定所述历史访问量数据的第一置信区间。
根据本发明提供的一种系统访问量监控方法,所述对所述聚类结果中各簇类进行数据清洗,得到清洗后的各簇类,包括:
采用四分位法,对所述聚类结果中各簇类进行处理,得到所述各簇类的下四分位数和上四分位数;
基于所述下四分位数和所述上四分位数,对所述各簇类进行数据清洗,得到清洗后的各簇类,任一清洗后的簇类包括所述下四分位数至所述上四分位数的数据。
根据本发明提供的一种系统访问量监控方法,所述获取待监控系统的历史访问量数据,之后还包括:
基于不同的时间粒度,对所述历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据,以供得到所述各时间粒度的预警阈值。
根据本发明提供的一种系统访问量监控方法,所述预警阈值包括多个时间点的阈值,所述基于所述预警阈值,对所述待监控系统进行访问量监控,之前还包括:
确定所述预警阈值中最小阈值所对应的第一时间点,并确定所述预警阈值中最大阈值所对应的第二时间点;
确定所述预警阈值的中位数,并基于第二预设置信度,确定所述预警阈值的第二置信区间;
将所述预警阈值中所述第一时间点的阈值更新为所述中位数,并将所述预警阈值中所述第二时间点的阈值更新为所述第二置信区间的上限值。
根据本发明提供的一种系统访问量监控方法,所述预警阈值包括闲时时段的阈值和忙时时段的阈值;
所述确定所述预警阈值中最小阈值所对应的第一时间点,并确定所述预警阈值中最大阈值所对应的第二时间点,包括:
确定所述预警阈值中闲时时段的最小阈值所对应的第一闲时时间点,并确定所述预警阈值中忙时时段的最小阈值所对应的第一忙时时间点;
确定所述预警阈值中闲时时段的最大阈值所对应的第二闲时时间点,并确定所述预警阈值中忙时时段的最大阈值所对应的第二忙时时间点;
所述确定所述预警阈值的中位数,并基于第二预设置信度,确定所述预警阈值的第二置信区间,包括:
确定所述预警阈值中闲时时段的中位数,并确定所述预警阈值中忙时时段的中位数;
基于第二预设置信度,确定所述预警阈值中闲时时段的第二置信区间,并基于第二预设置信度,确定所述预警阈值中忙时时段的第二置信区间;
所述将所述预警阈值中所述第一时间点的阈值更新为所述中位数,并将所述预警阈值中所述第二时间点的阈值更新为所述第二置信区间的上限值,包括:
将所述预警阈值中所述第一闲时时间点的阈值更新为所述闲时时段的中位数,并将所述预警阈值中所述第一忙时时间点的阈值更新为所述忙时时段的中位数;
将所述预警阈值中所述第二闲时时间点的阈值更新为所述闲时时段的第二置信区间的上限值,并将所述预警阈值中所述第二忙时时间点的阈值更新为所述忙时时段的第二置信区间的上限值。
根据本发明提供的一种系统访问量监控方法,所述获取待监控系统的历史访问量数据,包括:
获取待监控系统中不同用户维度的历史访问量数据,以供得到各用户维度的预警阈值,所述用户维度用于表征访问用户。
本发明还提供一种系统访问量监控装置,包括:
获取模块,用于获取待监控系统的历史访问量数据;
确定模块,用于基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;
监控模块,用于基于所述预警阈值,对所述待监控系统进行访问量监控。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述系统访问量监控方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述系统访问量监控方法。
本发明提供的系统访问量监控方法、装置、电子设备和存储介质,获取待监控系统的历史访问量数据;基于第一预设置信度,确定历史访问量数据的第一置信区间,并将第一置信区间的上限值确定为预警阈值;基于预警阈值,对待监控系统进行访问量监控。通过上述方式,对历史访问量数据进行统计分析,并采用带可信度的阈值确定方法确定预警阈值,以使预警阈值为预设置信度下的限值,相比人工设置预警阈值,本发明确定的预警阈值更为准确,进而提高系统访问量监控的准确性;同时,即使访问流量数据随时间的变迁而改变,预警阈值可以根据动态的历史访问量数据自动进行调整,从而提高预警阈值设置的灵活性和效率,进而提高系统访问量监控的灵活性和效率。综上,本发明可以提高系统访问量监控的准确率、灵活性和效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的系统访问量监控方法的流程示意图之一;
图2为本发明提供的系统访问量监控方法的流程示意图之二;
图3为本发明提供的系统访问量监控方法的流程示意图之三;
图4为本发明提供的系统访问量监控装置的结构示意图;
图5为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
系统访问量监控是系统安全预警的重要功能。通过系统访问量监控,可以识别异常网络段IP、安全演练IP、绕行IP及疑似DDOS攻击等异常访问。
目前,在通信行业中对访问量进行监控的方法主要是通过人工,即人工主观设置预警阈值。然而,人工设置预警阈值依赖于专业人员对业务的深入了解,即结合人的经验和访问流量的历史数据主观地设置预警阈值。基于此,目前基于人工设置预警阈值的方案过于依赖对业务深入了解且经验丰富的人员来设定预警阈值及阈值计算规则,从而具备一定的局限性,进而导致人工设置的预警阈值不够精确,降低了对系统进行访问量监控的可靠性,最终影响了系统的正常运行。此外,由于访问流量数据会随时间的变迁而改变,因此,预警阈值也要随时间的变迁而变化,然而,访问流量数据存在大量噪声或者无效数据,需要人工予以剔除,进而不断地修改预警阈值,才能确保预警阈值的精确,然而人工设置预警阈值的效率也偏低,进而影响了系统的正常运行;同时,人工设定预警阈值需要频繁地通过人工凭经验设置,定义计算规则和调整阈值数值,过于刻板,不够灵活,无法适应工作中访问流量波动或者周期性变化,进而导致用户大规模访问时,时常会有误报或者漏报的情况出现。
针对上述问题,本发明提出以下各实施例。图1为本发明提供的系统访问量监控方法的流程示意图之一,如图1所示,该系统访问量监控方法包括:
步骤110,获取待监控系统的历史访问量数据。
此处,待监控系统为需要进行访问量监控的系统,该待监控系统可以为网投系统等需要对用户访问进行安全监控的系统。
此处,历史访问量数据为在当前时间之前的访问量数据,该访问量数据的数据量大小可以根据实际需求进行设定,具体设定其时间段,例如,历史访问量数据为该待监控系统中当前时间之前的30天内的访问量数据。
在一实施例中,历史访问量数据可以包括不同用户维度的历史访问量数据。该不同用户维度可以包括IP、账号(USER)和号码(MOBILE)等用于表征访问用户的维度。
在一具体实施例中,将历史访问量数据以字节流方式传输,并将该历史访问量数据的文件流数据以CSV格式进行快速存储。当然,也可以通过其他方式和格式进行传输和存储,本发明实施例对此不作限定。
基于上述两实施例,可以将IP、账号和号码三个维度的历史访问量数据存放于三个CSV文件中。
步骤120,基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值。
需要说明的是,此处是基于可靠性理论,结合高斯分布置信度原理,推算出预警阈值。
此处,第一预设置信度为高斯分布置信度,该第一预设置信度可以根据实际需求进行设定,例如95%置信度、90%置信度等等,本发明实施例对此不作具体限定。
为便于理解,此处第一预设置信度以95%置信度为例进行说明。该95%置信度的计算方式如下所示:
式中:P表示概率;μ为历史访问量数据的均值;z为95%置信区间在z表(置信区间的z critical value)中的对应值,z表中95%置信区间对应的z值为1.96;为标准误差,σ为历史访问量数据的标准差,n为历史访问量数据的样本量;置信区间的最小值为最大值为/>此时,预警阈值为/>
基于上述95%置信度的计算方式,如图2所示,置信区间是在预先确定好的显著性水平下计算出来的,显著性水平通常称为α,绝大多数情况会将α设为0.05。置信度为(1-α),即置信度是0.95或95%,此时,得到一个以μ为中心,面积为0.95的置信区间,即上述95%置信度的计算方式中M会有95%的可能性落入该置信区间。
在一实施例中,在上述步骤120之前,基于不同的时间粒度,对历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据。基于此,基于第一预设置信度,确定各时间粒度对应的历史访问量数据的第一置信区间,并将各时间粒度的第一置信区间的上限值确定为各时间粒度的预警阈值。
在另一实施例中,对历史访问量数据进行全采样时间范围维度的预警阈值计算。
在一实施例中,历史访问量数据可以包括不同用户维度的历史访问量数据。基于此,基于第一预设置信度,确定各用户维度的历史访问量数据的第一置信区间,并将各用户维度的第一置信区间的上限值确定为各用户维度的预警阈值。
在一具体实施例中,将预警阈值以json方式传输,若包括各用户维度的预警阈值,则以list格式进行传输和存储。当然,也可以通过其他方式和格式进行传输和存储,本发明实施例对此不作限定。
步骤130,基于所述预警阈值,对所述待监控系统进行访问量监控。
在一实施例中,本发明实施例的应用终端为预警系统,该预警系统基于预警阈值,对待监控系统进行访问量监控。在另一实施例中,将预警阈值发送至预警系统中,以使预警系统基于接收到的预警阈值,对待监控系统进行访问量监控。
在一具体实施例中,获取待监控系统的当前访问量;基于预警阈值确定第一阈值和第二阈值,第二阈值大于第一阈值;若当前访问量大于第一阈值,且小于第二阈值,则发出警告预警;若当前访问量大于或等于第二阈值,则禁止当前访问量对应的用户访问待监控系统。
其中,当前访问量为针对用户进行区分的访问量。
其中,第一阈值和第二阈值可以根据实际需要进行设定,第一阈值为预警阈值的两倍,第二阈值为预警阈值的三倍,本发明实施例对此不作限定。
其中,警告预警可以根据实际情况进行设定,例如,会对当前访问发出安全状态黄色预警,并以邮件和/或短信的形式发送到负责人的邮箱和手机上。
此外,当前访问量大于或等于第二阈值时,也会发出警告预警,例如,会对当前访问发出安全状态红色预警,并以邮件和/或短信的形式发送到负责人的邮箱和手机上。
可以理解的是,禁止当前访问量对应的用户访问待监控系统,可以冻结该访问用户,并可以由预警系统的负责人进入预警系统的后台决定是否放行该用户,若负责人决定放行该用户,该访问用户将在预设时间(例如12小时)内不再受到预警系统的访问量监控。
此外,预警系统的操作人员可以在预警系统中通过查看异常日志的方式,来查看具体的异常信息。
在一些实施例中,该预警阈值可以在预设时间内进行更新,例如,每天更新该预警阈值,即每天重复上述步骤110和步骤120,以不断更新得到预警阈值。基于此,即使访问量存在周期性波动,也可以确保预警阈值的准确性。
在一实施例中,上述预警阈值可以包括各时间粒度的预警阈值。基于此,可以根据具体应用情景选择不同时间粒度的预警阈值对待监控系统进行访问量监控。
在一实施例中,历史访问量数据可以包括不同用户维度的历史访问量数据。基于此,可以根据具体应用情景选择不同用户维度的预警阈值对待监控系统进行访问量监控。
本发明实施例提供的系统访问量监控方法,获取待监控系统的历史访问量数据;基于第一预设置信度,确定历史访问量数据的第一置信区间,并将第一置信区间的上限值确定为预警阈值;基于预警阈值,对待监控系统进行访问量监控。通过上述方式,对历史访问量数据进行统计分析,并采用带可信度的阈值确定方法确定预警阈值,以使预警阈值为预设置信度下的限值,相比人工设置预警阈值,本发明实施例确定的预警阈值更为准确,进而提高系统访问量监控的准确性;同时,即使访问流量数据随时间的变迁而改变,预警阈值可以根据动态的历史访问量数据自动进行调整,从而提高预警阈值设置的灵活性和效率,进而提高系统访问量监控的灵活性和效率。综上,本发明实施例可以提高系统访问量监控的准确率、灵活性和效率。
基于上述实施例,图2为本发明提供的系统访问量监控方法的流程示意图之二,如图2所示,上述步骤120中,基于第一预设置信度,确定所述历史访问量数据的第一置信区间,包括:
步骤121,对所述历史访问量数据进行聚类处理,得到聚类结果。
此处,聚类处理的处理方法可以根据实际需求进行设定,本发明实施例以K-means聚类算法为例进行说明。
其中,K-means聚类算法是一种基于数值的聚类算法,以k确定簇数,以距离作为数据对象间相似性度量的标准,k值根据不同地区或数据的特点进行设定。进一步地,在一实施例中,根据人工经验设定k值,然后通过自组织网络法进行自动分类,以获得k的大小,进而获得多个分类簇。
在一实施例中,在上述步骤121之前,基于不同的时间粒度,对历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据。基于此,对各时间粒度对应的历史访问量数据进行聚类处理,得到各时间粒度对应的聚类结果。
在一实施例中,历史访问量数据可以包括不同用户维度的历史访问量数据。基于此,对各用户维度的历史访问量数据进行聚类处理,得到各用户维度的聚类结果。
步骤122,对所述聚类结果中各簇类进行数据清洗,得到清洗后的各簇类。
需要说明的是,由于历史访问量数据中存在大量噪声数据和无效数据,基于此,需要对聚类结果中各簇类进行数据清洗,以剔除大量噪声数据和无效数据,即剔除历史访问量数据中的不正常数据。
此处,数据清洗的方法可以根据实际需求进行设定,本发明实施例对此不作具体限定。
在一实施例中,历史访问量数据中数据较大值和数据较小值通常为噪声数据,因此,数据清洗是为了剔除历史访问量数据中的数据较大值和数据较小值。
在一实施例中,在上述步骤121之前,基于不同的时间粒度,对历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据。基于此,对各时间粒度对应的聚类结果中各簇类进行数据清洗,得到清洗后的各簇类。
在一实施例中,历史访问量数据可以包括不同用户维度的历史访问量数据。基于此,对各用户维度的的聚类结果中各簇类进行数据清洗,得到清洗后的各簇类。
步骤123,基于第一预设置信度和所述清洗后的各簇类,确定所述历史访问量数据的第一置信区间。
在一实施例中,将清洗后的各簇类进行数据合并,得到新的访问量数据,之后基于第一预设置信度,确定新的访问量数据的第一置信区间。
在另一实施例中,基于第一预设置信度,确定各簇类的置信区间,之后,将各簇类的置信区间的上限值确定为各簇类的预警阈值,最后,基于各簇类的预警阈值进行平均运算得到整体的预警阈值,即上述步骤120的预警阈值。
在一实施例中,在上述步骤121之前,基于不同的时间粒度,对历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据。基于此,基于第一预设置信度和各时间粒度对应的清洗后的各簇类,确定各时间粒度对应的历史访问量数据的第一置信区间。
在一实施例中,历史访问量数据可以包括不同用户维度的历史访问量数据。基于此,基于第一预设置信度和各用户维度的清洗后的各簇类,确定各用户维度的历史访问量数据的第一置信区间。
本发明实施例提供的系统访问量监控方法,通过上述方式,对历史访问量数据进行聚类处理,可以通过多层面确定预警阈值,进而提高预警阈值的准确性,最终进一步提高系统访问量监控的准确性;同时,对历史访问量数据进行聚类处理,以使后续可以更好地进行数据清洗处理;对聚类结果中各簇类进行数据清洗,可以剔除各簇类中的不正常数据,从而确保预警阈值确定过程的稳定性和针对性,进而提高预警阈值的准确性,最终进一步提高系统访问量监控的准确性。
基于上述任一实施例,该方法中,上述步骤122包括:
采用四分位法,对所述聚类结果中各簇类进行处理,得到所述各簇类的下四分位数和上四分位数;
基于所述下四分位数和所述上四分位数,对所述各簇类进行数据清洗,得到清洗后的各簇类,任一清洗后的簇类包括所述下四分位数至所述上四分位数的数据。
具体地,确定聚类结果中各簇类中的最小值和最大值,以及确定聚类结果中各簇类中的中位数、下四分位数和上四分位数;然后,将最小值至下四分位数的数据段进行去除,并将上四分位数至最大值的数据段进行去除,仅保留下四分位数至中位数的数据段,以及中位数至上四分位数的数据段。
可以理解的是,按照四分位法,可以得到最小值到下四分位数、下四分位数到中位数、中位数到上四分位数、上四分位数到最大值四个数据段。
为便于理解四分位法,以下通过四分位法计算公式进行说明。
将各簇类中n个数从小到大进行排列,Q1、Q2、Q3分别叫做该数据集的下四分位数点、中位数点、上四分位数点。将数据集分为四个部分,分别为最小值到下四分位数、下四分位数到中位数、中位数到上四分位数、上四分位数到最大值四个数据段。其中,Q1、Q2、Q3如下所示:
Q1=(n+1)/4;
Q2=2(n+1)/4;
Q3=3(n+1)/4。
在一实施例中,历史访问量数据中数据较大值和数据较小值通常为噪声数据或无效数据,因此,采用四分位法,对聚类结果中各簇类进行处理,从而可以剔除大量噪声数据和无效数据,即将最小值至下四分位数的数据段进行去除,并将上四分位数至最大值的数据段进行去除。
在一实施例中,在上述步骤121之前,基于不同的时间粒度,对历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据。基于此,采用四分位法,对各时间粒度对应的聚类结果中各簇类进行处理,得到各时间粒度对应的各簇类的下四分位数和上四分位数;基于各时间粒度对应的各簇类的下四分位数和上四分位数,对各时间粒度对应的各簇类进行数据清洗,得到各时间粒度对应的清洗后的各簇类。
在一实施例中,历史访问量数据可以包括不同用户维度的历史访问量数据。基于此,采用四分位法,对各用户维度的聚类结果中各簇类进行处理,得到各用户维度的各簇类的下四分位数和上四分位数;基于各用户维度的各簇类的下四分位数和上四分位数,对各用户维度对应的各簇类进行数据清洗,得到各用户维度对应的清洗后的各簇类。
本发明实施例提供的系统访问量监控方法,通过上述方式,采用四分位法,可以更好地对聚类结果中各簇类进行数据清洗,从而进一步确保预警阈值确定过程的稳定性和针对性,进而进一步提高预警阈值的准确性,最终进一步提高系统访问量监控的准确性。
基于上述任一实施例,该方法中,上述步骤110之后还包括:
基于不同的时间粒度,对所述历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据,以供得到所述各时间粒度的预警阈值。
此处,不同的时间粒度可以包括但不限于:小时、天、周、分、月等等,本发明实施例对此不作具体限定。
在一实施例中,将历史访问量数据按小时粒度和天粒度划分为25个维度,即将历史访问量数据以小时为单位划分为24份,并将历史访问量数据以天为单位划分为1份。
相应的,上述步骤120包括:基于第一预设置信度,确定各时间粒度对应的历史访问量数据的第一置信区间,并将各时间粒度对应的第一置信区间的上限值确定为各时间粒度的预警阈值。
例如,将历史访问量数据按小时粒度进行划分,进而可以得到24小时的预警阈值,具体如下表1所示:
小时 0 1 2 3 4 5 6 7 8 9 10 11
预警阈值 10 7 7 5 6 2 3 9 7 32 67 40
小时 12 13 14 15 16 17 18 19 20 21 22 23
预警阈值 15 20 38 23 15 28 34 40 47 30 18 105
表1
相应的,上述步骤130包括:基于各时间粒度的预警阈值,对待监控系统进行访问量监控。
在一实施例中,历史访问量数据可以包括不同用户维度的历史访问量数据。基于此,基于不同的时间粒度,对不同用户维度的历史访问量数据进行规范化处理,得到不同用户维度的各时间粒度对应的历史访问量数据,以供得到不同用户维度的各时间粒度的预警阈值。
例如,将历史访问量数据按小时粒度进行划分,进而可以得到24小时的预警阈值,并将不同用户维度设定为IP、账号和号码,具体如下表2、表3、表4所示,表2为IP的24小时的预警阈值,表3为账号的24小时的预警阈值,表4为号码的24小时的预警阈值。
小时 0 1 2 3 4 5 6 7 8 9 10 11
预警阈值 30 14 14 14 14 14 14 14 14 35 36 41
小时 12 13 14 15 16 17 18 19 20 21 22 23
预警阈值 21 13 34 29 14 23 44 42 52 29 14 14
表2
小时 0 1 2 3 4 5 6 7 8 9 10 11
预警阈值 17 102 50 16 16 16 16 16 25 25 38 38
小时 12 13 14 15 16 17 18 19 20 21 22 23
预警阈值 11 25 25 22 16 15 78 77 17 14 18 36
表3
小时 0 1 2 3 4 5 6 7 8 9 10 11
预警阈值 10 10 10 10 10 10 10 10 90 90 90 90
小时 12 13 14 15 16 17 18 19 20 21 22 23
预警阈值 90 90 90 90 90 90 90 90 90 90 90 90
表4
可以理解的是,将历史访问量数据按小时粒度和天粒度划分为25个维度,并将不同用户维度设定为IP、账号和号码,此时,每日可以生成75个预警阈值,其中包括三个用户维度的24小时的预警阈值和每日整体的预警阈值。
本发明实施例提供的系统访问量监控方法,通过上述方式,基于不同的时间粒度,对历史访问量数据进行规范化处理,从而既能得到整体的预警阈值,又可以细化预警阈值的时间范围,即可以得到不同时刻的预警阈值,从而可以实现更灵活和更精准的预警阈值设置,进而进一步提高系统访问量监控的灵活性和准确性。
基于上述任一实施例,图3为本发明提供的系统访问量监控方法的流程示意图之三,如图3所示,所述预警阈值包括多个时间点的阈值,上述步骤130之前还包括:
步骤310,确定所述预警阈值中最小阈值所对应的第一时间点,并确定所述预警阈值中最大阈值所对应的第二时间点。
需要说明的是,在预警阈值确定过程中,访问流量数据根据用户的访问情况会出现有的时间点值较小或较大的情况,从而导致计算的预警阈值过小或过大,因此,需要对预警阈值中最小阈值和最大阈值进行替换。
此处,第一时间点可以包括多个时间点,第二时间点也可以包括多个时间点,即较小值可以包括多个,较大值也可以包括多个。
在一实施例中,预警阈值包括24小时的预警阈值,即0-23的24个预警阈值。
步骤320,确定所述预警阈值的中位数,并基于第二预设置信度,确定所述预警阈值的第二置信区间。
步骤330,将所述预警阈值中所述第一时间点的阈值更新为所述中位数,并将所述预警阈值中所述第二时间点的阈值更新为所述第二置信区间的上限值。
此处,第二预设置信度为高斯分布置信度,该第二预设置信度可以根据实际需求进行设定,例如95%置信度、90%置信度等等,本发明实施例对此不作具体限定。
本发明实施例提供的系统访问量监控方法,通过上述方式,根据动态数据变迁而进一步调整优化预警阈值,可以很好地应对历史访问量数据的周期性变化,进一步提高预警阈值的准确性,从而进一步提高系统访问量监控的准确性。
基于上述任一实施例,该方法中,所述预警阈值包括闲时时段的阈值和忙时时段的阈值,上述步骤310包括:
确定所述预警阈值中闲时时段的最小阈值所对应的第一闲时时间点,并确定所述预警阈值中忙时时段的最小阈值所对应的第一忙时时间点;
确定所述预警阈值中闲时时段的最大阈值所对应的第二闲时时间点,并确定所述预警阈值中忙时时段的最大阈值所对应的第二忙时时间点。
上述步骤320包括:
确定所述预警阈值中闲时时段的中位数,并确定所述预警阈值中忙时时段的中位数;
基于第二预设置信度,确定所述预警阈值中闲时时段的第二置信区间,并基于第二预设置信度,确定所述预警阈值中忙时时段的第二置信区间。
上述步骤330包括:
将所述预警阈值中所述第一闲时时间点的阈值更新为所述闲时时段的中位数,并将所述预警阈值中所述第一忙时时间点的阈值更新为所述忙时时段的中位数;
将所述预警阈值中所述第二闲时时间点的阈值更新为所述闲时时段的第二置信区间的上限值,并将所述预警阈值中所述第二忙时时间点的阈值更新为所述忙时时段的第二置信区间的上限值。
此处,闲时时段和忙时时段可以根据实际需求进行设定,本发明实施例对此不作具体限定。例如,在小时粒度上,可以将24小时时间中的0时到8时设定为闲时,将8时到24时设定为忙时;又例如,在天粒度上,可以将周一至周五设定为闲时,周六至周日设定为忙时;又例如,在天粒度上,可以将工作日设定为闲时,节假日设定为忙时。
本发明实施例提供的系统访问量监控方法,通过上述方式,将预警阈值分为闲时时段的阈值和忙时时段的阈值,进而将闲时时段和忙时时段的预警阈值分开进行阈值替换,相比整体在一起进行替换,本发明实施例对预警阈值的替换更为准确,从而进一步提高预警阈值的准确性,进而进一步提高系统访问量监控的准确性;同时,预警阈值有闲时模式和非闲时模式,从而可切换模式以应对系统访问量的周期性变化。
基于上述任一实施例,该方法中,上述步骤110包括:
获取待监控系统中不同用户维度的历史访问量数据,以供得到各用户维度的预警阈值,所述用户维度用于表征访问用户。
此处,不同用户维度可以包括但不限于:IP、账号(USER)和号码(MOBILE)等等。基于此,可以对源IP异常、号码高频查询、账号登录三个维度的数据进行监控。
在一实施例中,获取待监控系统中IP、账号和号码的历史访问量数据,以供得到IP、账号和号码的预警阈值。
相应的,上述步骤120包括:基于第一预设置信度,确定各用户维度的历史访问量数据的第一置信区间,并将各用户维度的第一置信区间的上限值确定为各用户维度的预警阈值。
相应的,上述步骤130包括:基于各用户维度的预警阈值,对待监控系统进行访问量监控。
进一步地,可以在上述步骤120之前,基于不同的时间粒度,对各用户维度的历史访问量数据进行规范化处理,得到各用户维度的各时间粒度对应的历史访问量数据。
本发明实施例提供的系统访问量监控方法,通过上述方式,可以对不同用户维度的访问量数据进行监控,从而确保各用户维度的访问量均可以被监控,进而进一步提高系统访问量监控的准确性。
下面对本发明提供的系统访问量监控装置进行描述,下文描述的系统访问量监控装置与上文描述的系统访问量监控方法可相互对应参照。
图4为本发明提供的系统访问量监控装置的结构示意图,如图4所示,该系统访问量监控装置,包括:
获取模块410,用于获取待监控系统的历史访问量数据;
确定模块420,用于基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;
监控模块430,用于基于所述预警阈值,对所述待监控系统进行访问量监控。
本发明实施例提供的系统访问量监控装置,获取待监控系统的历史访问量数据;基于第一预设置信度,确定历史访问量数据的第一置信区间,并将第一置信区间的上限值确定为预警阈值;基于预警阈值,对待监控系统进行访问量监控。通过上述方式,对历史访问量数据进行统计分析,并采用带可信度的阈值确定方法确定预警阈值,以使预警阈值为预设置信度下的限值,相比人工设置预警阈值,本发明实施例确定的预警阈值更为准确,进而提高系统访问量监控的准确性;同时,即使访问流量数据随时间的变迁而改变,预警阈值可以根据动态的历史访问量数据自动进行调整,从而提高预警阈值设置的灵活性和效率,进而提高系统访问量监控的灵活性和效率。综上,本发明实施例可以提高系统访问量监控的准确率、灵活性和效率。
基于上述任一实施例,该确定模块420包括:
聚类处理单元,用于对所述历史访问量数据进行聚类处理,得到聚类结果;
数据清洗单元,用于对所述聚类结果中各簇类进行数据清洗,得到清洗后的各簇类;
区间确定单元,用于基于第一预设置信度和所述清洗后的各簇类,确定所述历史访问量数据的第一置信区间。
基于上述任一实施例,该数据清洗单元还用于:
采用四分位法,对所述聚类结果中各簇类进行处理,得到所述各簇类的下四分位数和上四分位数;
基于所述下四分位数和所述上四分位数,对所述各簇类进行数据清洗,得到清洗后的各簇类,任一清洗后的簇类包括所述下四分位数至所述上四分位数的数据。
基于上述任一实施例,该装置还包括:
规范处理模块,用于基于不同的时间粒度,对所述历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据,以供得到所述各时间粒度的预警阈值。
基于上述任一实施例,所述预警阈值包括多个时间点的阈值,该装置还包括:
时间确定模块,用于确定所述预警阈值中最小阈值所对应的第一时间点,并确定所述预警阈值中最大阈值所对应的第二时间点;
区间确定模块,用于确定所述预警阈值的中位数,并基于第二预设置信度,确定所述预警阈值的第二置信区间;
阈值替换模块,用于将所述预警阈值中所述第一时间点的阈值更新为所述中位数,并将所述预警阈值中所述第二时间点的阈值更新为所述第二置信区间的上限值。
基于上述任一实施例,所述预警阈值包括闲时时段的阈值和忙时时段的阈值;
该时间确定模块还用于:
确定所述预警阈值中闲时时段的最小阈值所对应的第一闲时时间点,并确定所述预警阈值中忙时时段的最小阈值所对应的第一忙时时间点;
确定所述预警阈值中闲时时段的最大阈值所对应的第二闲时时间点,并确定所述预警阈值中忙时时段的最大阈值所对应的第二忙时时间点;
该区间确定模块还用于:
确定所述预警阈值中闲时时段的中位数,并确定所述预警阈值中忙时时段的中位数;
基于第二预设置信度,确定所述预警阈值中闲时时段的第二置信区间,并基于第二预设置信度,确定所述预警阈值中忙时时段的第二置信区间;
该阈值替换模块还用于:
将所述预警阈值中所述第一闲时时间点的阈值更新为所述闲时时段的中位数,并将所述预警阈值中所述第一忙时时间点的阈值更新为所述忙时时段的中位数;
将所述预警阈值中所述第二闲时时间点的阈值更新为所述闲时时段的第二置信区间的上限值,并将所述预警阈值中所述第二忙时时间点的阈值更新为所述忙时时段的第二置信区间的上限值。
基于上述任一实施例,该获取模块410还用于:
获取待监控系统中不同用户维度的历史访问量数据,以供得到各用户维度的预警阈值,所述用户维度用于表征访问用户。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行系统访问量监控方法,该方法包括:获取待监控系统的历史访问量数据;基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;基于所述预警阈值,对所述待监控系统进行访问量监控。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的系统访问量监控方法,该方法包括:获取待监控系统的历史访问量数据;基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;基于所述预警阈值,对所述待监控系统进行访问量监控。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的系统访问量监控方法,该方法包括:获取待监控系统的历史访问量数据;基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;基于所述预警阈值,对所述待监控系统进行访问量监控。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种系统访问量监控方法,其特征在于,包括:
获取待监控系统的历史访问量数据;
基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;
基于所述预警阈值,对所述待监控系统进行访问量监控。
2.根据权利要求1所述的系统访问量监控方法,其特征在于,所述基于第一预设置信度,确定所述历史访问量数据的第一置信区间,包括:
对所述历史访问量数据进行聚类处理,得到聚类结果;
对所述聚类结果中各簇类进行数据清洗,得到清洗后的各簇类;
基于第一预设置信度和所述清洗后的各簇类,确定所述历史访问量数据的第一置信区间。
3.根据权利要求2所述的系统访问量监控方法,其特征在于,所述对所述聚类结果中各簇类进行数据清洗,得到清洗后的各簇类,包括:
采用四分位法,对所述聚类结果中各簇类进行处理,得到所述各簇类的下四分位数和上四分位数;
基于所述下四分位数和所述上四分位数,对所述各簇类进行数据清洗,得到清洗后的各簇类,任一清洗后的簇类包括所述下四分位数至所述上四分位数的数据。
4.根据权利要求1至3任一项所述的系统访问量监控方法,其特征在于,所述获取待监控系统的历史访问量数据,之后还包括:
基于不同的时间粒度,对所述历史访问量数据进行规范化处理,得到各时间粒度对应的历史访问量数据,以供得到所述各时间粒度的预警阈值。
5.根据权利要求1至3任一项所述的系统访问量监控方法,其特征在于,所述预警阈值包括多个时间点的阈值,所述基于所述预警阈值,对所述待监控系统进行访问量监控,之前还包括:
确定所述预警阈值中最小阈值所对应的第一时间点,并确定所述预警阈值中最大阈值所对应的第二时间点;
确定所述预警阈值的中位数,并基于第二预设置信度,确定所述预警阈值的第二置信区间;
将所述预警阈值中所述第一时间点的阈值更新为所述中位数,并将所述预警阈值中所述第二时间点的阈值更新为所述第二置信区间的上限值。
6.根据权利要求5所述的系统访问量监控方法,其特征在于,所述预警阈值包括闲时时段的阈值和忙时时段的阈值;
所述确定所述预警阈值中最小阈值所对应的第一时间点,并确定所述预警阈值中最大阈值所对应的第二时间点,包括:
确定所述预警阈值中闲时时段的最小阈值所对应的第一闲时时间点,并确定所述预警阈值中忙时时段的最小阈值所对应的第一忙时时间点;
确定所述预警阈值中闲时时段的最大阈值所对应的第二闲时时间点,并确定所述预警阈值中忙时时段的最大阈值所对应的第二忙时时间点;
所述确定所述预警阈值的中位数,并基于第二预设置信度,确定所述预警阈值的第二置信区间,包括:
确定所述预警阈值中闲时时段的中位数,并确定所述预警阈值中忙时时段的中位数;
基于第二预设置信度,确定所述预警阈值中闲时时段的第二置信区间,并基于第二预设置信度,确定所述预警阈值中忙时时段的第二置信区间;
所述将所述预警阈值中所述第一时间点的阈值更新为所述中位数,并将所述预警阈值中所述第二时间点的阈值更新为所述第二置信区间的上限值,包括:
将所述预警阈值中所述第一闲时时间点的阈值更新为所述闲时时段的中位数,并将所述预警阈值中所述第一忙时时间点的阈值更新为所述忙时时段的中位数;
将所述预警阈值中所述第二闲时时间点的阈值更新为所述闲时时段的第二置信区间的上限值,并将所述预警阈值中所述第二忙时时间点的阈值更新为所述忙时时段的第二置信区间的上限值。
7.根据权利要求1至3任一项所述的系统访问量监控方法,其特征在于,所述获取待监控系统的历史访问量数据,包括:
获取待监控系统中不同用户维度的历史访问量数据,以供得到各用户维度的预警阈值,所述用户维度用于表征访问用户。
8.一种系统访问量监控装置,其特征在于,包括:
获取模块,用于获取待监控系统的历史访问量数据;
确定模块,用于基于第一预设置信度,确定所述历史访问量数据的第一置信区间,并将所述第一置信区间的上限值确定为预警阈值;
监控模块,用于基于所述预警阈值,对所述待监控系统进行访问量监控。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述系统访问量监控方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述系统访问量监控方法。
CN202210397604.9A 2022-04-15 2022-04-15 系统访问量监控方法、装置、电子设备和存储介质 Pending CN116980314A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210397604.9A CN116980314A (zh) 2022-04-15 2022-04-15 系统访问量监控方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210397604.9A CN116980314A (zh) 2022-04-15 2022-04-15 系统访问量监控方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN116980314A true CN116980314A (zh) 2023-10-31

Family

ID=88469912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210397604.9A Pending CN116980314A (zh) 2022-04-15 2022-04-15 系统访问量监控方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN116980314A (zh)

Similar Documents

Publication Publication Date Title
CN113176978B (zh) 基于日志文件的监控方法、系统、设备及可读存储介质
CN111309565B (zh) 告警处理方法、装置、电子设备以及计算机可读存储介质
CN112596990B (zh) 告警风暴的处理方法、装置及终端设备
CN113824768B (zh) 负载均衡系统中的健康检查方法及装置和流量转发方法
CN107888441A (zh) 一种网络流量基线自学习自适应方法
US20200151340A1 (en) Monitoring a blockchain
CN114553682B (zh) 实时告警方法、系统、计算机设备及存储介质
CN113391981A (zh) 一种监控指标的预警方法及相关设备
CN111064719B (zh) 文件异常下载行为的检测方法及装置
CN114338372A (zh) 网络信息安全监控方法及系统
CN114827168A (zh) 告警聚合上报方法、装置、计算机设备及存储介质
CN113076935B (zh) 基于图像识别的监管方法、装置、服务器及介质
CN111949421B (zh) Sdk调用方法、装置、电子设备和计算机可读存储介质
CN116980314A (zh) 系统访问量监控方法、装置、电子设备和存储介质
CN117118739A (zh) 网络安全规则的评估方法及装置、存储介质、电子设备
CN114598621B (zh) 一种电力通信网络可靠性评估系统
CN111475495A (zh) 基于大数据的质量分析方法、系统及存储介质
CN115913652A (zh) 异常访问行为检测方法及装置、电子设备及可读存储介质
EP3971754A1 (en) Method and apparatus for identifying applets of risky content based on differential privacy preserving
CN115480997A (zh) 一种指标异常的告警方法、装置、电子设备及存储介质
CN112685261A (zh) 一种基于观察者模式的微服务运行状态监控方法
CN111817923B (zh) 交换机端口流量突变的预警分析方法和装置
CN113163418B (zh) 一种计量自动化设备规范化测试管理系统及测试方法
CN113055930B (zh) 数据处理方法、通信设备、服务器及存储介质
JP2009169762A (ja) ルールベース管理システム、ルールベース管理方法およびルールベース管理用プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination