CN116881828B - 一种基于子空间相似度的knn算法的异常检测方法 - Google Patents
一种基于子空间相似度的knn算法的异常检测方法 Download PDFInfo
- Publication number
- CN116881828B CN116881828B CN202310888586.9A CN202310888586A CN116881828B CN 116881828 B CN116881828 B CN 116881828B CN 202310888586 A CN202310888586 A CN 202310888586A CN 116881828 B CN116881828 B CN 116881828B
- Authority
- CN
- China
- Prior art keywords
- subspace
- fss
- similarity
- sample
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 26
- 230000002159 abnormal effect Effects 0.000 title claims description 3
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000000034 method Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 15
- 238000012216 screening Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于子空间相似度的KNN算法的异常检测方法,涉及数据异常检测技术领域,该方法首先对数据进行归一化处理并将预处理后的数据作为训练样本,然后根据训练样本的分布情况求解其对应的特征子空间进而将原来的高维空间进行划分,最后在计算待测样本的近邻时,根据其与各子空间的相似度优先在与其数据分布相似的子空间进行近邻查找,最终根据近邻的类别完成对待测样本类别的预测。本发明提出的SFSS‑KNN算法在传统KNN算法的基础上做出改进使得在提高检测效率的同时提高了检测的准确率。
Description
技术领域
本发明涉及数据异常检测技术领域,特别涉及一种基于子空间相似度的KNN算法的异常检测方法。
背景技术
在智能时代,各行各业时刻都会产生大量的数据,异常检测就是通过分析这些数据以找出异常数据的过程。从本质上讲可将异常检测看作二分类问题,即从混杂的数据中区分出正常行为和异常行为。
当前异常检测领域涉及到的方法和技术包括KNN算法、朴素贝叶斯算法NB、支持向量机算法SVM、决策树算法DT和Adaboost算法等,传统算法在近邻查找时未考虑样本空间分布问题且通常需要遍历所有已知样本,导致算法在训练样本数据量庞大时时间复杂度较高,准确率较低。
发明内容
本发明提供了一种基于子空间相似度的KNN算法的异常检测方法,包括以下步骤:
采集实验数据,对采集的实验数据进行归一化处理后作为数据集;
根据数据集样本分布情况求解全部子空间模板FSS;
将数据集中的待测样本s0按照分布情况与子空间模板FSS一一进行匹配,求解出与待测样本s0最为相似的子空间FSSm;
求解所述待测样本s0与子空间模板FSS匹配的所有的子空间中心,并计算所述子空间中心之间的距离,以此距离作为子空间之间的相似度;
根据FSSm与其他子空间之间的相似度进行FSSm近邻的筛选;
根据筛选出的FSSm近邻划分类别,取类别数最多的一类作为待测样本的类别,完成类别预测。
优选的,所述归一化处理的表达式为:
xnormal=(x-xmin)/(xmax-xmin)
其中,xmin代表当前特征内最小的数值,xmax代表当前特征内最大的数值,x代表当前特征内的任一数值。
优选的,根据训练集的样本分布情况求解全部子空间模板FSS包括如下步骤:
将数据集分为训练数据集Train和测试数据集;
从训练数据集Train中取出样本向量Train[i]=[x1,x2,x3,…,xn];
对Train[i]进行计算求得子空间向量FSS_temp=[v1,v2,v3,…,vn];
将训练数据集Train中每一个样本进行取出样本向量Train[i]=[x1,x2,x3,…,xn]处理,根据所有子空间向量FSS_temp生成全部的子空间模板。
优选的,所述对Train[i]进行计算求得子空间向量FSS_temp=[v1,v2,v3,…,vn]的计算公式为:
其中,xi代表样本在第i个维度上的值,vi代表xi经过上述计算公式转换后的值。
优选的,所述训练集中的待测样本s0按照分布情况与子空间模板FSS一一进行匹配,求解出与待测样本s0最为相似的子空间FSSm,包括如下步骤:
将待测样本s0按照求得子空间向量FSS_temp的计算公式转换为snew;
计算snew与全部子空间模板FSS的相似度值,按照相似度值从低到高对子空间模板进行排序,找出最相似的子空间FSSm。
优选的,所述计算snew与全部子空间模板FSS的相似度值,其计算公式为:
其中,样本空间维度值为n,snew=[x1,x2,……xn],全部子空间模板中任一子空间模板为[y1,y2,……yn]。
优选的,求解所述待测样本s0与子空间模板FSS匹配的所有的子空间中心,并计算所述子空间中心之间的距离,以此距离作为子空间之间的相似度,包括如下步骤:
计算子空间中心;
根据计算snew与任一个子空间模板FSS的相似度值的计算公式计算子空间中心与子空间中心之间的相似度。
优选的,对于N维子空间Ri,根据子空间中心的计算公式计算空间中所有样本在每个维度上的均值,最终得到N个均值组成的点[x1,x2,x3,…,xn],即子空间的中心,所述计算子空间中心的计算公式为:
其中,n代表样本数,代表各个样本在第j个维度上的均值,/>代表第i个样本在第j个维度的值。
优选的,所述根据FSSm与其他子空间之间的相似度进行FSSm近邻的筛选流程包括如下步骤:
设置参数K,表示待测样本的近邻数;
根据待测样本的近邻数计算FSSm与其它子空间的相似度;
根据相似度值从低到高对子空间进行排序,获得与FSSm最为相似的子空间FSSmin、最小相似度值d;
按照计算snew与全部子空间模板FSS的相似度值的计算公式分别计算待测样本s0与FSSm中的样本s[i]的相似度值similarity;
判断similarity与d的关系,如果similarity<d,将s[i]写入近邻集合SSS中;如果similarity>d,令i=i+1,再次进行相似度值similarity的计算过程;
如果集合SSS中的样本未达到K个,FSSm=FSSmin,再次进行相似度值similarity的计算过程,否则,输出近邻SSS。
与现有技术相比,本发明具有如下显著优点:
首先对数据进行归一化处理并将预处理后的数据作为训练样本,然后根据训练样本的分布情况求解其对应的特征子空间进而将原来的高维空间进行划分,最后在计算待测样本的近邻时,根据其与各子空间的相似度优先在与其数据分布相似的子空间进行近邻查找,最终根据近邻的类别完成对待测样本类别的预测,本发明在传统KNN算法的基础上做出改进使得在提高检测效率的同时提高了检测的准确率。
附图说明
图1为本发明提供的流程图;
图2为本发明提供的不同数据集下三种算法的准确率图;
图3为本发明提供的不同数据集下三种算法的召回率图;
图4为本发明提供的不同数据集下三种算法的时间图。
具体实施方式
下面结合本发明中的附图,对本发明实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
为了便于理解和说明,如附图1-4所示,本发明提供了一种基于子空间相似度的KNN算法(SFSS-KNN算法)的异常检测方法,如图1所示,具体包括以下步骤:
步骤S1.数据预处理
由于数据的各个特征量纲差异太大,将数据的每一特征都进行归一化处理,处理后的数据作为数据集,数据集分为训练数据集Train和测试数据集;
步骤S2.子空间模板的求解
根据训练数据集样本的分布情况不同,求解出全部子空间模板FSS;
步骤S3.子空间匹配
将测试数据集中的待测样本s0按照分布情况与子空间模板一一进行匹配,求解出与待测样本最为相似的子空间;
步骤S4.子空间相似度的计算
求解待测样本与子空间模板FSS匹配的所有子空间中心,并计算子空间中心之间的距离,以此距离作为子空间之间的相似度;
步骤S5.子空间内近邻的筛选
本发明认为,具有相同空间分布的数据在实际应用中通常具有更好的相似性,因此在得到全部子空间模板并且求出与待测样本最相似子空间FSSm的基础上应考虑样本空间之间的相似度问题以便进行近邻筛选;
步骤S6.待测样本类别的预测
根据待测样本近邻的类别,取类别数最多的那一类别作为待测样本的类别,从而完成类别预测。
所述步骤S1中归一化处理的表达式为:
xnormal=(x-xmin)/(xmax-xmin) (1)
其中xmin代表当前特征内最小的数值,xmax代表当前特征内最大的数值,x代表当前特征内的任一数值。
所述步骤S2中子空间模板的求解流程为:
步骤S201.从训练样本集合Train中取出样本向量Train[i]=[x1,x2,x3,…,xn]。
步骤S202.按照表达式(2)对Train[i]进行计算求得子空间向量FSS_temp=[v1,v2,v3,…,vn]
步骤S203.将训练样本集中每一个样本按照步骤S201进行处理,根据所有子空间向量FSS_temp生成全部的子空间模板。
所述步骤S3中子空间匹配的流程为:
步骤S301.取出待测样本s0按照表达式(2)转换为snew。
步骤S302.根据表达式(3)计算snew与全部子空间模板FSS的相似度值,按照相似度值从低到高对子空间模板进行排序,找出最相似的子空间FSSm。
所述步骤S4中子空间相似度的计算方式为:
步骤S401.根据表达式(4)计算子空间中心。
步骤S402.根据表达式(3)计算子空间中心与子空间中心之间的相似度。
所述步骤S5中子空间内近邻的筛选流程为:
步骤S501.设置参数K,表示待测样本的近邻数,计算FSSm与其它子空间的相似度,根据相似度值从低到高对子空间进行排序,得到与FSSm最为相似的子空间FSSmin、最小相似度值d;
步骤S502.按照表达式(3)分别计算待测样本s0与FSSm中的样本s[i]的相似度值similarity;
步骤S503.判断similarity与d的关系,如果similarity<d,将s[i]写入近邻集合SSS中;如果similarity>d,令i=i+1,返回步骤S502;
步骤S504.如果集合SSS中的样本未达到K个,FSSm=FSSmin,跳转至S502;否则,输出近邻SSS。
经过以上步骤可检测出各个领域内的异常行为,本发明所提出的基于改进KNN算法的异常检测方法适用于各个领域。
本发明与经典学习算法的实验对比表如下所示:
表1Fetal_health数据集的对比
表1为NB、SVM、DT、AdaBoost算法与本发明提供的SFSS-KNN算法在Fetal_health数据集上以不同指标Accuracy、Recall、F1-score、AUC进行的数据对比情况。
表2Haberman数据集的对比
表2为NB、SVM、DT、AdaBoost算法与本发明提供的SFSS-KNN算法在Haberman数据集上以不同指标Accuracy、Recall、F1-score、AUC进行的数据对比情况。
表3Kddcup数据集的对比
表3为NB、SVM、DT、AdaBoost算法与本发明提供的SFSS-KNN算法在Kddcup数据集上以不同指标Accuracy、Recall、F1-score、AUC进行的数据对比情况。
表4Awid数据集的对比
表4为NB、SVM、DT、AdaBoost算法与本发明提供的SFSS-KNN算法在Awid数据集上以不同指标Accuracy、Recall、F1-score、AUC进行的数据对比情况。
在智能时代,各行各业时刻都会产生大量的数据,异常检测就是通过分析这些数据以找出异常数据的过程。从本质上讲可将异常检测看作二分类问题,即从混杂的数据中区分出正常行为和异常行为。当前异常检测领域涉及到的方法和技术包括KNN算法、朴素贝叶斯算法NB、支持向量机算法SVM、决策树算法DT和Adaboost算法等,传统算法在近邻查找时未考虑样本空间分布问题且通常需要遍历所有已知样本,导致算法在训练样本数据量庞大时时间复杂度较高,准确率较低,因而本发明提出改进KNN算法将其应用于异常检测领域。本发明将SFSS-KNN算法与上述算法在Fetal_health数据集、Haberman数据集、Kddcup数据集以及Awid数据集上做对比实验,具体实验对比图如图2、图3与图4所示。
其中,图2为SFSS-KNN算法、KNN算法与FSS-KNN算法在Fetal_health数据集、Haberman数据集、Kddcup数据集以及Awid数据集上的准确率对比图;图3为SFSS-KNN算法、KNN算法与FSS-KNN算法在Fetal_health数据集、Haberman数据集、Kddcup数据集以及Awid数据集上的召回率对比图;
图4为SFSS-KNN算法、KNN算法与FSS-KNN算法在Fetal_health数据集、Haberman数据集、Kddcup数据集以及Awid数据集上时间对比图。
实验结果表明,SFSS-KNN算法在进行异常检测时具有更高的效率及准确率。数据集可从https://www.kaggle.com和https://archive.ics.uci.edu/获取。
以上所述实施例仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换,均属于本发明的保护范围。
Claims (7)
1.一种基于子空间相似度的KNN算法的异常检测方法,其特征在于,包括以下步骤:
采集Fetal_health实验数据,对采集的Fetal_health实验数据进行归一化处理后作为数据集;
根据数据集的样本分布情况求解全部子空间模板FSS;
将数据集中的待测样本s0按照分布情况与子空间模板FSS一一进行匹配,求解出与待测样本s0最相似的子空间FSSm;
求解所述待测样本s0与子空间模板FSS匹配的所有子空间中心,并计算所述子空间中心之间的距离,以此距离作为子空间之间的相似度;
根据FSSm与其他子空间之间的相似度进行FSSm近邻的筛选;
根据筛选出的FSSm近邻划分类别,取类别数最多的一类作为待测样本的类别,完成待测样本的类别预测;
其中,根据数据集的样本分布情况求解全部子空间模板FSS包括如下步骤:
将数据集分为训练数据集Train和测试数据集;
从训练数据集Train中取出样本向量Train[i]=[x1,x2,x3,…,xn];
对Train[i]进行计算求得子空间向量FSS_temp=[v1,v2,v3,…,vn];
将训练数据集Train中每一个样本进行取出样本向量Train[i]=[x1,x2,x3,…,xn]处理,根据所有子空间向量FSS_temp生成全部的子空间模板;
所述训练集中的待测样本s0按照分布情况与子空间模板FSS一一进行匹配,求解出与待测样本s0最为相似的子空间FSSm,包括如下步骤:
将待测样本s0按照求得子空间向量FSS_temp的计算公式转换为snew;
计算snew与全部子空间模板FSS的相似度值,按照相似度值从低到高对子空间模板进行排序,找出最相似的子空间FSSm。
2.如权利要求1所述的一种基于子空间相似度的KNN算法的异常检测方法,其特征在于,所述对采集的实验数据进行归一化处理后作为训练集的表达式为:
xnormal=(x-xmin)/(xmax-xmin)
其中,xmin代表当前特征内最小的数值,xmax代表当前特征内最大的数值,x代表当前特征内的任一数值。
3.如权利要求1所述的一种基于子空间相似度的KNN算法的异常检测方法,其特征在于,所述对Train[i]进行计算求得子空间向量FSS_temp=[v1,v2,v3,…,vn]的计算公式为:
其中,xi代表样本在第i个维度上的值,vi代表xi经过上述计算公式转换后的值。
4.如权利要求3所述的一种基于子空间相似度的KNN算法的异常检测方法,其特征在于,计算snew与全部子空间模板FSS的相似度值,其计算公式为:
其中,样本空间维度值为n,snew=[x1,x2,……xn],任一子空间模板为[y1,y2,……yn]。
5.如权利要求4所述的一种基于子空间相似度的KNN算法的异常检测方法,其特征在于,所述求解所述待测样本s0与子空间模板FSS匹配的所有子空间中心,计算所述子空间中心之间的距离,以此距离作为子空间之间的相似度,包括如下步骤:
计算子空间中心;
根据计算snew与全部子空间模板FSS的相似度值的计算公式计算子空间中心与子空间中心之间的相似度。
6.如权利要求5所述的一种基于子空间相似度的KNN算法的异常检测方法,其特征在于,对于N维子空间Ri,根据子空间中心的计算公式计算空间中所有样本在每个维度上的均值,最终得到N个均值组成的点[x1,x2,x3,…,xn],即子空间的中心,所述子空间中心的计算公式为:
其中,n代表样本数,代表各个样本在第j个维度上的均值,/>代表第i个样本在第j个维度的值。
7.如权利要求4所述的一种基于子空间相似度的KNN算法的异常检测方法,其特征在于,所述根据FSSm与其他子空间之间的相似度进行FSSm近邻的筛选流程包括如下步骤:
设置参数K,表示待测样本的近邻数;
根据待测样本的近邻数计算FSSm与其它子空间的相似度;
根据相似度值从低到高对子空间进行排序,获得与FSSm最为相似的子空间FSSmin、最小相似度值d;
按照计算snew与全部子空间模板FSS的相似度值的计算公式分别计算待测样本s0与FSSm中的样本s[i]的相似度值similarity;
判断similarity与d的关系,如果similarity<d,将s[i]写入近邻集合SSS中;如果similarity>d,令i=i+1,再次进行相似度值similarity的计算过程;
如果集合SSS中的样本未达到K个,FSSm=FSSmin,再次进行相似度值similarity的计算过程,否则,输出近邻SSS。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310888586.9A CN116881828B (zh) | 2023-07-19 | 2023-07-19 | 一种基于子空间相似度的knn算法的异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310888586.9A CN116881828B (zh) | 2023-07-19 | 2023-07-19 | 一种基于子空间相似度的knn算法的异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116881828A CN116881828A (zh) | 2023-10-13 |
CN116881828B true CN116881828B (zh) | 2024-05-17 |
Family
ID=88258348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310888586.9A Active CN116881828B (zh) | 2023-07-19 | 2023-07-19 | 一种基于子空间相似度的knn算法的异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116881828B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8116575B1 (en) * | 2008-02-26 | 2012-02-14 | Hrl Laboratories, Llc | System for anomaly detection using sub-space analysis |
CN103605702A (zh) * | 2013-11-08 | 2014-02-26 | 北京邮电大学 | 一种基于词相似度的网络文本分类方法 |
CN104573049A (zh) * | 2015-01-20 | 2015-04-29 | 安徽科力信息产业有限责任公司 | 一种基于中心向量的knn分类器训练样本裁剪方法 |
CN106021578A (zh) * | 2016-06-01 | 2016-10-12 | 南京邮电大学 | 一种基于聚类和隶属度融合的改进型文本分类算法 |
CN106650297A (zh) * | 2017-01-06 | 2017-05-10 | 南京航空航天大学 | 一种无领域知识的卫星分系统异常检测方法 |
CN108154178A (zh) * | 2017-12-25 | 2018-06-12 | 北京工业大学 | 基于改进的svm-knn算法的半监督托攻击检测方法 |
CN109739984A (zh) * | 2018-12-25 | 2019-05-10 | 贵州商学院 | 一种基于Hadoop平台的改进并行KNN网络舆情分类算法 |
CN109871872A (zh) * | 2019-01-17 | 2019-06-11 | 西安交通大学 | 一种基于壳向量式svm增量学习模型的流量实时分类方法 |
CN110263855A (zh) * | 2019-06-20 | 2019-09-20 | 深圳大学 | 一种利用共基胶囊投影进行图像分类的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7958068B2 (en) * | 2007-12-12 | 2011-06-07 | International Business Machines Corporation | Method and apparatus for model-shared subspace boosting for multi-label classification |
-
2023
- 2023-07-19 CN CN202310888586.9A patent/CN116881828B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8116575B1 (en) * | 2008-02-26 | 2012-02-14 | Hrl Laboratories, Llc | System for anomaly detection using sub-space analysis |
CN103605702A (zh) * | 2013-11-08 | 2014-02-26 | 北京邮电大学 | 一种基于词相似度的网络文本分类方法 |
CN104573049A (zh) * | 2015-01-20 | 2015-04-29 | 安徽科力信息产业有限责任公司 | 一种基于中心向量的knn分类器训练样本裁剪方法 |
CN106021578A (zh) * | 2016-06-01 | 2016-10-12 | 南京邮电大学 | 一种基于聚类和隶属度融合的改进型文本分类算法 |
CN106650297A (zh) * | 2017-01-06 | 2017-05-10 | 南京航空航天大学 | 一种无领域知识的卫星分系统异常检测方法 |
CN108154178A (zh) * | 2017-12-25 | 2018-06-12 | 北京工业大学 | 基于改进的svm-knn算法的半监督托攻击检测方法 |
CN109739984A (zh) * | 2018-12-25 | 2019-05-10 | 贵州商学院 | 一种基于Hadoop平台的改进并行KNN网络舆情分类算法 |
CN109871872A (zh) * | 2019-01-17 | 2019-06-11 | 西安交通大学 | 一种基于壳向量式svm增量学习模型的流量实时分类方法 |
CN110263855A (zh) * | 2019-06-20 | 2019-09-20 | 深圳大学 | 一种利用共基胶囊投影进行图像分类的方法 |
Non-Patent Citations (5)
Title |
---|
A KNN based random subspace ensemble classifier for detection and discrimination of high impedance fault in PV integrated power network;K.S.V. Swarna;《Measurement》;20221231;1-20 * |
An Improved Substation Equipment Recognition Algorithm by KNN Classification of Subspace Feature Vector;Liang Wang 等;《2021 China Automation Congress (CAC)》;20220314;1-6 * |
SMwKnn:基于类别子空间距离加权的互k近邻算法;卢伟胜 等;《计算机科学》;20140215;第41卷(第2期);166-169 * |
一种K-MEANS算法在网络异常检测中的应用;刘涛 等;《微电子学与计算机 》;20120505;第29卷(第5期);42-45 * |
一种基于抗原软子空间聚类的否定选择算法;刘正军 等;《计算机应用研究》;20170321;第35卷(第3期);680-684 * |
Also Published As
Publication number | Publication date |
---|---|
CN116881828A (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Mixture gases classification based on multi-label one-dimensional deep convolutional neural network | |
EP2244213B1 (en) | Generating method of two class classification prediction model, program for generating classification prediction model and generating device of two class classification prediction model | |
CN112084237A (zh) | 一种基于机器学习和大数据分析的电力系统异常预测方法 | |
Liu et al. | Decision tree learning based feature evaluation and selection for image classification | |
CN108333468A (zh) | 一种有源配电网下不良数据的识别方法及装置 | |
Tavakoli | Seq2image: Sequence analysis using visualization and deep convolutional neural network | |
CN116720095A (zh) | 一种基于遗传算法优化模糊c均值的电特性信号聚类方法 | |
CN117171702A (zh) | 一种基于深度学习的多模态电网故障检测方法和系统 | |
Alzubaidi et al. | Projection pursuit Random Forest using discriminant feature analysis model for churners prediction in telecom industry. | |
Islam et al. | Knntree: A new method to ameliorate k-nearest neighbour classification using decision tree | |
CN116881828B (zh) | 一种基于子空间相似度的knn算法的异常检测方法 | |
Gavagsaz | Efficient parallel processing of k-nearest neighbor queries by using a centroid-based and hierarchical clustering algorithm | |
Oh et al. | Multivariate time series open-set recognition using multi-feature extraction and reconstruction | |
Zhao et al. | An improved kNN algorithm based on essential vector | |
CN112735532A (zh) | 基于分子指纹预测的代谢物识别系统及其应用方法 | |
Putra et al. | Dimensional Feature Reduction for Detecting Botnet Activities | |
Shrivastava et al. | Improving Anomaly Classification using Combined Data Transformation and Machine Learning Methods. | |
Abdelouahed et al. | Harnessing feature engineering to improve machine learning: A review of different data processing techniques | |
Cecotti et al. | Rejection schemes in multi-class classification--application to handwritten character recognition | |
Veen et al. | Interpreting Hybrid AI through Autodecoded Latent Space Entities | |
Vescan et al. | Cross-Project Defect Prediction using Supervised and Unsupervised Learning: a Replication Study | |
CN114584350B (zh) | 基于流形的网络数据包特征的降维及聚类的攻击识别方法 | |
Gyamfi et al. | Automated system-level anomaly detection and classification using modified random forest | |
Singh et al. | Intrusion detection using spatial-temporal features based on Riemannian manifold | |
Mohseni et al. | Outlier detection in test samples and supervised training set selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |