CN113641682A - 一种基于机器学习的离群资产检测方法及系统 - Google Patents

一种基于机器学习的离群资产检测方法及系统 Download PDF

Info

Publication number
CN113641682A
CN113641682A CN202111194965.5A CN202111194965A CN113641682A CN 113641682 A CN113641682 A CN 113641682A CN 202111194965 A CN202111194965 A CN 202111194965A CN 113641682 A CN113641682 A CN 113641682A
Authority
CN
China
Prior art keywords
asset
information
outlier
statistical
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111194965.5A
Other languages
English (en)
Inventor
韩旭东
曲志峰
张胜猛
高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongfu Safety Technology Co Ltd
Original Assignee
Zhongfu Safety Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongfu Safety Technology Co Ltd filed Critical Zhongfu Safety Technology Co Ltd
Priority to CN202111194965.5A priority Critical patent/CN113641682A/zh
Publication of CN113641682A publication Critical patent/CN113641682A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出的一种基于机器学习的离群资产检测方法及系统,所述方法包括:对资产基本信息进行预处理,形成资产统计信息,并存储到资产统计表中;把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息;把离群资产信息写入离群资产表。本发明能够通过基于机器学习的聚类算法对待检测资产数据集进行聚合,将不属于任何簇的资产对象判定为资产数据集中的离群点,从而得到离群资产,结合人工判定及时解除资产风险。

Description

一种基于机器学习的离群资产检测方法及系统
技术领域
本发明涉及数据处理技术领域,更具体的说是涉及一种基于机器学习的离群资产检测方法及系统。
背景技术
随着电子政务与信息化融合日益深化,网络和业务系统已经成为各种机构日常办公、办事的基础设施,而承载业务系统的服务器、日常办公用的终端以及保障组织内部信息安全的安全设备,它们作为组织的有形资产,长期稳定运行是业务顺利开展的基本保障。
虽然传统的监控软件在发现设备故障、运行异常等方面确实起到了一定的作用,但现有的监控软件只能发现故障和运行异常的设备资产,在设备资产在正常运行情况下无法及时发现异常,存在明显的监控盲点。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种基于机器学习的离群资产检测方法及系统,能够通过基于机器学习的聚类算法对待检测资产数据集进行聚合,将不属于任何簇的资产对象判定为资产数据集中的离群点,从而得到离群资产,结合人工判定及时解除资产风险。
本发明为实现上述目的,通过以下技术方案实现:
一种基于机器学习的离群资产检测方法,包括如下步骤:
S1:对资产基本信息进行预处理,形成资产统计信息,并存储到资产统计表中;
S2:把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息;
S3:把离群资产信息写入离群资产表。
进一步,所述资产基本信息包括:
资产信息、资产漏洞信息、资产告警信息和资产访问信息。
进一步,所述步骤S1具体为:
对资产信息、资产漏洞信息、资产告警信息、资产访问信息基于资产ID进行关联;基于资产ID和资产状态分组聚合生成资产统计信息;
把资产统计信息存储到资产统计表中。
进一步,所述离群资产算法模型采用K-Means聚类算法,K-Means聚类算法的聚类个数K设置为6,K-Means聚类算法采用的距离函数为欧几里得距离函数。
进一步,所述K-Means聚类算法具体包括:
将需要度量样本之间的距离,用p个资产属性来表示n个样本的数据矩阵如下:
Figure DEST_PATH_IMAGE001
其中,x代表资产统计信息属性的取值,xnp代表第n个资产的第p个属性,资产属性包括资产状态、资产漏洞数、资产告警数和资产访问数;
度量资产之间的相似性采用欧几里得距离函数,具体如下:
Figure 207739DEST_PATH_IMAGE002
其中,d(i,j)代表第i个资产与第j个资产之间的欧几里得距离,xip代表第i个资产的第p个属性, xjp代表第j个资产的第p个属性。
进一步,所述步骤S2具体包括:
S21:从资产统计表中随机选取K个资产统计对象作为初始的聚类中心;
S22:分别计算每个资产统计对象到各个聚类中心的距离,将对象分配到距离最近的聚类中;
S23:所有资产统计对象分配完成后,重新计算K个聚类中心;
S24:将本次计算得到的K个聚类中心与前一次计算得到的K个聚类中心比较,判断聚类中心是否发生变化,若是,则转到步骤S22,否则转到步骤S25;
S25:输出聚类结果;
S26:计算每个聚类的正常半径;
S27:从每个聚类中,找出大于正常半径的点,即离群点,并从聚类中剔除,形成不属于任何簇的离群资产信息。
进一步,所述聚类的正常半径为聚类的平均距离与1.5倍标准差之和。
进一步,所述步骤S3包括:
使用预设的离群资产的数据结果进行离群资产信息的整理,形成离群资产;
把离群资产写入离群资产表。
相应的,本发明还公开了一种基于机器学习的离群资产检测系统,包括:
资产数据存储库,用于存储资产基本信息、离群资产信息,以及对资产基本信息进行信息预处理生成的资产统计信息;
计算单元,用于把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息。
进一步,所述资产数据存储库包括:
资产信息存储单元,用于使用资产信息表存储资产信息,资产信息表的数据项包括资产ID、资产名称、资产状态和登记时间;
资产漏洞信息存储单元,用于使用资产漏洞表存储资产的漏洞信息,资产漏洞表的数据项包括主键、资产ID、漏洞类型和漏洞检测时间,资产漏洞表的资产ID与资产信息表的资产ID关联;
资产告警信息存储单元,用于使用资产告警表存储资产的监控告警信息,资产告警表的数据项包括主键、资产ID、告警类型和告警时间,资产告警表的资产ID与资产信息表的资产ID关联;
资产访问信息存储单元,用于使用资产访问表存储资产对外访问或访问该资产的访问信息,资产访问表的数据项包括主键、资产ID、访问类型和访问时间;
资产统计信息存储单元,用于使用资产统计表存储经过预处理的资产统计信息,资产统计表的数据项包括主键、统计日期,资产ID、资产状态、漏洞个数、告警个数、访问次数等,资产统计表的资产ID与资产信息表的资产ID关联;
离群资产信息存储单元,用于使用离群资产表存储经过离群资产算法模型形成的不属于任何簇的离群资产信息,离群资产表的数据项包括主键、资产ID,资产名称、检测时间,异常描述和处置状态。
对比现有技术,本发明有益效果在于:
1、本发明提供的离群资产检测方法及流程思路清晰,过程简单,能够及时发现异常资产,为解除内部风险提供了重要的信息。
2、本发明可以有效的发现正常运行资产的异常问题,克服了以往通过监控软件只能发现故障和运行异常的设备资产,提高了设备资产的可用性和安全性。
3、本发明基于K-Means聚类算法,可处理大数据集,具有高效可伸缩的有点。由于此聚类算法的时间和空间复杂度是线性或者较为接近线性,算法具有执行速度快的优点。
4、本发明采用的K-Means聚类算法,对离群点和噪音点敏感,更有利于发现离群资产。
5、本发明具有一定的通用性,其中用于模型的资产统计属性信息可以根据实际情况进行调整,资产统计属性的增加或替换方便。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明的方法流程图;
附图2是本发明的离群资产检测过程示意图;
附图3是本发明的系统结构图。
图中,1为资产数据存储库,2为计算单元,11为资产信息存储单元,12为资产漏洞信息存储单元,13为资产告警信息存储单元,14为资产访问信息存储单元,15为资产统计信息存储单元,16为离群资产信息存储单元。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
如图1所示的一种基于机器学习的离群资产检测方法,包括如下步骤:
S1:对资产基本信息进行预处理,形成资产统计信息,并存储到资产统计表中。
其中,资产基本信息包括:资产信息、资产漏洞信息、资产告警信息和资产访问信息。首先,对资产信息、资产漏洞信息、资产告警信息、资产访问信息基于资产ID进行关联;然后,基于资产ID和资产状态分组聚合生成资产统计信息;最后,把资产统计信息存储到资产统计表中。
资产统计信息的数据结构和样例简述如下:{统计日期:20210804,资产ID:ZD0001,资产状态:0,资产漏洞数:5,资产告警数:20,资产访问数:300},其中资产状态取值为{0:在用,1:停用}。
S2:把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息。
其中,离群资产算法模型采用K-Means聚类算法,K-Means聚类算法的聚类个数K设置为6,K-Means聚类算法采用的距离函数为欧几里得距离函数。K-Means算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据划分为预定的聚类个数K,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。
K-Means聚类算法具体包括:
将需要度量样本之间的距离,用p个资产属性来表示n个样本的数据矩阵如下:
Figure 474772DEST_PATH_IMAGE001
其中,x代表资产统计信息属性的取值,xnp代表第n个资产的第p个属性,资产属性包括资产状态、资产漏洞数、资产告警数和资产访问数;
度量资产之间的相似性采用欧几里得距离函数,具体如下:
Figure 673672DEST_PATH_IMAGE002
其中,d(i,j)代表第i个资产与第j个资产之间的欧几里得距离,xip代表第i个资产的第p个属性, xjp代表第j个资产的第p个属性。
S3:把离群资产信息写入离群资产表。
首先,使用预设的离群资产的数据结果进行离群资产信息的整理,形成离群资产。然后,把离群资产写入离群资产表。
资产统计信息经过应用离群资产算法模型后如果存在不属于任何簇的资产信息,我们就把这部分资产信息重新组织,形成离群资产,离群资产的数据结构简述如下:{主键:UUID,资产ID:ZD0001,资产名称:张三的主机,检测时间:2021010101:11:11,异常描述:模型检测异常,处置状态:待处置},最后把组织好的离群资产信息写入到离群资产表。
在本方法中,步骤S2基于通过K-Means聚类算法构建的离群资产算法模型,实现了离群资产检测,如图2所示,具体包括以下步骤:
S21:从资产统计表中随机选取K个资产统计对象作为初始的聚类中心。
S22:分别计算每个资产统计对象到各个聚类中心的距离,将对象分配到距离最近的聚类中。
S23:所有资产统计对象分配完成后,重新计算K个聚类中心。
S24:将本次计算得到的K个聚类中心与前一次计算得到的K个聚类中心比较,判断聚类中心是否发生变化,若是,则转到步骤S22,否则转到步骤S25。
S25:输出聚类结果。
S26:计算每个聚类的正常半径。
聚类的正常半径为聚类的平均距离与1.5倍标准差之和。
S27:从每个聚类中,找出大于正常半径的点,即离群点,并从聚类中剔除,形成不属于任何簇的离群资产信息。
本实施例提供了一种基于机器学习的离群资产检测方法,能够通过基于机器学习的聚类算法对待检测资产数据集进行聚合,将不属于任何簇的资产对象判定为资产数据集中的离群点,从而得到离群资产,结合人工判定及时解除资产风险。
相应的,如图3所示,本发明还公开了一种基于机器学习的离群资产检测系统,包括:
资产数据存储库1,用于存储资产基本信息、离群资产信息,以及对资产基本信息进行信息预处理生成的资产统计信息。
计算单元2,用于把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息。离群资产算法模型采用基于距离的非层次聚类算法K-Means实现,经过资产信息预处理形成的每日资产统计数据作为离群资产算法模型的输入参数,簇个数等是离群资产算法模型的配置参数,离群资产算法模型的输出结果中不属于任何簇的结果集就是我们的离群资产。
其中,资产数据存储库1具体包括:
资产信息存储单元11,用于建立一个资产信息表,使用资产信息表存储资产信息,资产信息表的数据项包括资产ID、资产名称、资产状态和登记时间。资产信息包括终端、服务器、网络设备等有形资产信息。
资产漏洞信息存储单元12,用于建立一个资产漏洞表,使用资产漏洞表存储资产的漏洞信息,资产漏洞表的数据项包括主键、资产ID、漏洞类型和漏洞检测时间,资产漏洞表的资产ID与资产信息表的资产ID关联。
资产告警信息存储单元13,用于建立一个资产告警表,使用资产告警表存储资产的监控告警信息,资产告警表的数据项包括主键、资产ID、告警类型和告警时间,资产告警表的资产ID与资产信息表的资产ID关联。
资产访问信息存储单元14,用于建立一个资产访问表,使用资产访问表存储资产对外访问或访问该资产的访问信息,资产访问表的数据项包括主键、资产ID、访问类型和访问时间。
资产统计信息存储单元15,用于建立一个资产统计表,使用资产统计表存储经过预处理的资产统计信息,资产统计信息作为离群资产算法模型的输入参数,资产统计表的数据项包括主键、统计日期,资产ID、资产状态、漏洞个数、告警个数、访问次数等,资产统计表的资产ID与资产信息表的资产ID关联。
离群资产信息存储单元16,用于使用离群资产表存储经过离群资产算法模型形成的不属于任何簇的离群资产信息,离群资产表的数据项包括主键、资产ID,资产名称、检测时间,异常描述和处置状态。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
同理,在本发明各个实施例中的各处理单元可以集成在一个功能模块中,也可以是各个处理单元物理存在,也可以两个或两个以上处理单元集成在一个功能模块中。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。

Claims (10)

1.一种基于机器学习的离群资产检测方法,其特征在于,包括如下步骤:
S1:对资产基本信息进行预处理,形成资产统计信息,并存储到资产统计表中;
S2:把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息;
S3:把离群资产信息写入离群资产表。
2.根据权利要求1所述的基于机器学习的离群资产检测方法,其特征在于,所述资产基本信息包括:
资产信息、资产漏洞信息、资产告警信息和资产访问信息。
3.根据权利要求2所述的基于机器学习的离群资产检测方法,其特征在于,所述步骤S1具体为:
对资产信息、资产漏洞信息、资产告警信息、资产访问信息基于资产ID进行关联;基于资产ID和资产状态分组聚合生成资产统计信息;
把资产统计信息存储到资产统计表中。
4.根据权利要求1所述的基于机器学习的离群资产检测方法,其特征在于,所述离群资产算法模型采用K-Means聚类算法,K-Means聚类算法的聚类个数K设置为6,K-Means聚类算法采用的距离函数为欧几里得距离函数。
5.根据权利要求4所述的基于机器学习的离群资产检测方法,其特征在于,所述K-Means聚类算法具体包括:
将需要度量样本之间的距离,用p个资产属性来表示n个样本的数据矩阵如下:
Figure 169049DEST_PATH_IMAGE001
其中,x代表资产统计信息属性的取值,xnp代表第n个资产的第p个属性,资产属性包括资产状态、资产漏洞数、资产告警数和资产访问数;
度量资产之间的相似性采用欧几里得距离函数,具体如下:
Figure 983421DEST_PATH_IMAGE002
其中,d(i,j)代表第i个资产与第j个资产之间的欧几里得距离,xip代表第i个资产的第p个属性, xjp代表第j个资产的第p个属性。
6.根据权利要求4所述的基于机器学习的离群资产检测方法,其特征在于,所述步骤S2具体包括:
S21:从资产统计表中随机选取K个资产统计对象作为初始的聚类中心;
S22:分别计算每个资产统计对象到各个聚类中心的距离,将对象分配到距离最近的聚类中;
S23:所有资产统计对象分配完成后,重新计算K个聚类中心;
S24:将本次计算得到的K个聚类中心与前一次计算得到的K个聚类中心比较,判断聚类中心是否发生变化,若是,则转到步骤S22,否则转到步骤S25;
S25:输出聚类结果;
S26:计算每个聚类的正常半径;
S27:从每个聚类中,找出大于正常半径的点,即离群点,并从聚类中剔除,形成不属于任何簇的离群资产信息。
7.根据权利要求6所述的基于机器学习的离群资产检测方法,其特征在于,所述聚类的正常半径为聚类的平均距离与1.5倍标准差之和。
8.根据权利要求1所述的基于机器学习的离群资产检测方法,其特征在于,所述步骤S3包括:
使用预设的离群资产的数据结果进行离群资产信息的整理,形成离群资产;
把离群资产写入离群资产表。
9.一种基于机器学习的离群资产检测系统,其特征在于,包括:
资产数据存储库,用于存储资产基本信息、离群资产信息,以及对资产基本信息进行信息预处理生成的资产统计信息;
计算单元,用于把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息。
10.根据权利要求9所述的基于机器学习的离群资产检测系统,其特征在于,所述资产数据存储库包括:
资产信息存储单元,用于使用资产信息表存储资产信息,资产信息表的数据项包括资产ID、资产名称、资产状态和登记时间;
资产漏洞信息存储单元,用于使用资产漏洞表存储资产的漏洞信息,资产漏洞表的数据项包括主键、资产ID、漏洞类型和漏洞检测时间,资产漏洞表的资产ID与资产信息表的资产ID关联;
资产告警信息存储单元,用于使用资产告警表存储资产的监控告警信息,资产告警表的数据项包括主键、资产ID、告警类型和告警时间,资产告警表的资产ID与资产信息表的资产ID关联;
资产访问信息存储单元,用于使用资产访问表存储资产对外访问或访问该资产的访问信息,资产访问表的数据项包括主键、资产ID、访问类型和访问时间;
资产统计信息存储单元,用于使用资产统计表存储经过预处理的资产统计信息,资产统计表的数据项包括主键、统计日期,资产ID、资产状态、漏洞个数、告警个数、访问次数等,资产统计表的资产ID与资产信息表的资产ID关联;
离群资产信息存储单元,用于使用离群资产表存储经过离群资产算法模型形成的不属于任何簇的离群资产信息,离群资产表的数据项包括主键、资产ID,资产名称、检测时间,异常描述和处置状态。
CN202111194965.5A 2021-10-14 2021-10-14 一种基于机器学习的离群资产检测方法及系统 Pending CN113641682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111194965.5A CN113641682A (zh) 2021-10-14 2021-10-14 一种基于机器学习的离群资产检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111194965.5A CN113641682A (zh) 2021-10-14 2021-10-14 一种基于机器学习的离群资产检测方法及系统

Publications (1)

Publication Number Publication Date
CN113641682A true CN113641682A (zh) 2021-11-12

Family

ID=78426763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111194965.5A Pending CN113641682A (zh) 2021-10-14 2021-10-14 一种基于机器学习的离群资产检测方法及系统

Country Status (1)

Country Link
CN (1) CN113641682A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106101102A (zh) * 2016-06-15 2016-11-09 华东师范大学 一种基于pam聚类算法的网络异常流量检测方法
CN106682079A (zh) * 2016-11-21 2017-05-17 云南电网有限责任公司电力科学研究院 一种基于聚类分析的用户用电行为检测方法
CN107644032A (zh) * 2016-07-21 2018-01-30 中兴通讯股份有限公司 离群点检测方法和装置
CN111694718A (zh) * 2020-05-27 2020-09-22 平安普惠企业管理有限公司 内网用户异常行为识别方法、装置、计算机设备及可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106101102A (zh) * 2016-06-15 2016-11-09 华东师范大学 一种基于pam聚类算法的网络异常流量检测方法
CN107644032A (zh) * 2016-07-21 2018-01-30 中兴通讯股份有限公司 离群点检测方法和装置
CN106682079A (zh) * 2016-11-21 2017-05-17 云南电网有限责任公司电力科学研究院 一种基于聚类分析的用户用电行为检测方法
CN111694718A (zh) * 2020-05-27 2020-09-22 平安普惠企业管理有限公司 内网用户异常行为识别方法、装置、计算机设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周永章 等: "《地球科学大数据挖掘与机器学习》", 30 September 2018, 中山大学出版社 *

Similar Documents

Publication Publication Date Title
CA3024960C (en) Method,apparatus,and computer-readable medium for detecting anomalous user behavior
US9601000B1 (en) Data-driven alert prioritization
US10635817B2 (en) Targeted security alerts
US20180285596A1 (en) System and method for managing sensitive data
CN111984499A (zh) 一种大数据集群的故障检测方法和装置
JP2022118108A (ja) ログ監査方法、装置、電子機器、媒体およびコンピュータプログラム
WO2013110083A2 (en) Identification of a data record for communication to a receiver
Jeong et al. Anomaly teletraffic intrusion detection systems on hadoop-based platforms: A survey of some problems and solutions
CN111258798A (zh) 监控数据的故障定位方法、装置、计算机设备及存储介质
CN112737800A (zh) 服务节点故障定位方法、调用链生成方法及服务器
US20150120697A1 (en) System and method for analysis of a database proxy
CN116545678A (zh) 网络安全防护方法、装置、计算机设备和存储介质
CN114610561A (zh) 系统监测方法、装置、电子设备及计算机可读存储介质
CN113641682A (zh) 一种基于机器学习的离群资产检测方法及系统
CN115587132B (zh) 一种基于会话聚类识别数据库异常访问的方法及系统
US20220222159A1 (en) Timing Index Anomaly Detection Method, Device and Apparatus
CN111143433A (zh) 一种统计数据仓数据的方法及装置
CN116431324A (zh) 一种基于Kafka高并发数据采集与分发的边缘系统
CN113824717B (zh) 一种配置检查方法及装置
CN115225308A (zh) 大规模群体攻击流量的攻击团伙识别方法及相关设备
CN116467360A (zh) 产品信息分析方法、装置及电子设备
CN115964256B (zh) 一种资产管理场景下的告警方法及系统
Andrade et al. Enhancing intelligence SOC with big data tools
CN110209666B (zh) 一种数据存储方法及终端设备
CN114741673B (zh) 行为风险检测方法、聚类模型构建方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211112