CN104899327B - 一种无类别标签的时间序列异常检测方法 - Google Patents

一种无类别标签的时间序列异常检测方法 Download PDF

Info

Publication number
CN104899327B
CN104899327B CN201510351164.3A CN201510351164A CN104899327B CN 104899327 B CN104899327 B CN 104899327B CN 201510351164 A CN201510351164 A CN 201510351164A CN 104899327 B CN104899327 B CN 104899327B
Authority
CN
China
Prior art keywords
mrow
msup
msub
class
prime
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510351164.3A
Other languages
English (en)
Other versions
CN104899327A (zh
Inventor
刘大同
彭宇
陈静
张玉杰
彭喜元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201510351164.3A priority Critical patent/CN104899327B/zh
Publication of CN104899327A publication Critical patent/CN104899327A/zh
Application granted granted Critical
Publication of CN104899327B publication Critical patent/CN104899327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/10Recognition assisted with metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

一种无类别标签的时间序列异常检测方法,本发明涉及无类别标签的时间序列异常检测方法。本发明的目的是为了解决针对卫星遥测数据进行固定点分段效果不理想、层次聚类需要人工设定聚类数目以及目前尚无一种可直接利用的能够实现无类别标签时间序列的离线和在线的异常检测方法框架的问题。通过以下技术方案实现的:步骤一、根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段,得到无类别标签的时间序列X={x1,x2,…,xn};步骤二、对步骤一得到的X={x1,x2,…,xn}进行自适应层次聚类,并判定和删除无类别标签的时间序列中的异常序列,得到;步骤三、结合匹配阈值以为样本,采用最近邻居算法对x”进行模式匹配,实现卫星遥测数据异常检测。本发明应用于卫星数据检测领域。

Description

一种无类别标签的时间序列异常检测方法
技术领域
本发明涉及无类别标签的时间序列异常检测方法。
背景技术
通过对卫星遥测数据中的偏航姿态角进行分析,偏航姿态角的整体变化趋势如图2所示,其细节变化如图3所示,得出卫星遥测数据具有明显地周期性,且该特性已与卫星遥测数据提供单位进行了确认。通过对遥测数据的每个周期进行分析,可以得出卫星在该周期之内的运行状态是否正常,按照固定点对卫星遥测数据分段效果不理想的情况,如图4所示,各个分段序列之间的耦合度不够高,存在一定的偏差,随着时间的推进这种偏差会愈发明显。
目前卫星遥测数据各周期内的正常模式、异常模式、故障模式等均没有较为明确的可参考资料,因此分段后得到的时间序列没有所属类别标签,在此类无类别标签的时间序列基础之上实现离线和在线的异常检测目前没有可直接利用的异常检测方法框架。
对离线数据进行异常检测,一般采用聚类方法进行,并将聚类结果中成员极少类别视为异常类别,其中聚类方法中较为常用的聚类方法是层次聚类方法,但是该算法存在需要人工设定聚类数目的缺陷,若聚类数目设定不当将会使得聚类结果以及异常检测结果不够理想。
发明内容
本发明的目的是为了解决针对卫星遥测数据进行固定点分段效果不理想、层次聚类需要人工设定聚类数目以及目前尚无一种可直接利用的能够实现无类别标签时间序列的离线和在线的异常检测方法框架的问题,而提出了一种无类别标签的时间序列异常检测方法。
上述的发明目的是通过以下技术方案实现的:
步骤一、根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段,得到无类别标签的时间序列X={x1,x2,…,xn},其中n为大于0的正整数,表示时间序列数目,x1为无类别标签的时间序列中第一个时间序列,x2为无类别标签的时间序列中第二个时间序列,xn为无类别标签的时间序列中第n个时间序列;
步骤二、对步骤一得到的无类别标签的时间序列X={x1,x2,…,xn}进行自适应层次聚类,并判定和删除无类别标签的时间序列中的异常序列,得到卫星正常运行模式含有类别标签的时间序列和类别标签其中nz为大于0的正整数,表示正常时间序列数目,x'1为含有类别标签的时间序列中第一个正常时间序列,x'2为含有类别标签的时间序列中第二个正常时间序列,为含有类别标签的时间序列中第nz个正常时间序列,l'1为类别标签中第一个正常时间序列,l'2为类别标签中第二个正常时间序列,为类别标签中第nz个正常时间序列;
步骤三、结合匹配阈值以步骤二中获得的含有类别标签的时间序列和类别标签为样本,采用最近邻居算法对最新卫星遥测时间序列x”进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测。
发明效果
异常检测是数据挖掘任务中的一项重要功能,本发明针对卫星运行过程中的遥测数据特点,首先,根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段;然后,对分段后得到的无类别标签时间序列进行自适应层次聚类同时根据异常判定参数对其中的异常类别进行删除,得到卫星正常运行的类别模式;最后,结合匹配阈值采用最近邻居(1-Nearest Neighbor,1-NN)算法对最新卫星遥测数据进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测。各部分的具体发明效果如下:
首先针对按照固定点对卫星遥测数据分段效果不理想的情况,如图4所示,提出了按照卫星遥测数据中的幅角突变点为标识进行分段的方法,其分段效果如图5所示,以幅角为标识进行分段的分段结果更为紧凑,各个分段序列之间的耦合度更高、更为合理。
其次,针对层次聚类需要人工设定聚类数目的问题,提出了一种以类间类内距离比值为评价标准的自适应层次聚类方法,使层次聚类算法能够自动确定最优类别数目,避免了由于人工设定聚类数目不当的情况导致的聚类结果以及异常检测结果不够理想的问题。
最后,针对目前尚无一种可直接利用的能够实现无类别标签时间序列的离线和在线的异常检测方法框架,提出了一种无类别标签的时间序列异常检测方法。该方法首先对历史卫星遥测数据采用自适应层次聚类方法并根据异常判定参数对其中的异常类别进行删除,获得正常类别模式,实现离线无类别标签时间序列的异常检测;然后结合匹配阈值采用1-NN算法对最新卫星遥测数据进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测,实现在线无类别标签时间序列的异常检测。
通过对卫星遥测数据中的飞轮转速D参量采用异常注入的方式进行仿真实验,其实验结果表明,该方法能够有效的检测出离线和在线卫星遥测数据中的异常时间序列,如图10、图11a、图11b、图11bc、图12、图13a、图13b、图13c所示。
针对卫星遥测数据开展无类别标签时间序列离线和在线异常检测的验证实验,用于实验的具体测试参量为飞轮转速D,其原始数据如图6所示。其中用于离线异常检测实验的无类别标签时间序列样本数为50,所有时间序列经与数据提供单位确认已无异常,通过采用异常准入的方式对其中一个时间序列注入脉冲型异常,异常幅值为二分之一倍参量最大值减去最小值,注入位置为时间序列中间位置,注入异常后的样本如图10所示。
针对上述无类别标签时间序列样本采用自适应层次聚类方法并设定异常判定参数为0.05,进行异常检测结果如图11a、11b、11c所示,通过该结果可以发现基于自适应层次聚类方法的异常检测方法能够有效识别异常时间序列,并对正常时间序列确定较好的类别数目并实现聚类。
将通过前述处理后得到的含有类别标签的正常时间序列作为1-NN分类算法的训练样本,设定灵敏度系数为1,用于实现卫星遥测数据的在线异常检测。仿真输入测试样本为50,所有时间序列经与数据提供单位确认已无异常,通过采用异常准入的方式对其中一个时间序列注入阶跃型异常,异常幅值为负四分之一倍参量最大值减去最小值,注入位置为时间序列的四分之三处位置,注入异常后的样本如图12所示。
附图说明
图1为本发明流程图;
图2为原始测试数据偏航姿态角测试序列示例图;
图3为原始测试数据偏航姿态角测试序列前450点示例图;
图4为偏航姿态角测试序列固定点分段叠加绘图结果图;
图5为偏航姿态角测试序列以幅角分段叠加绘图结果图,时间单位为秒;
图6为飞轮转速D测试序列分段叠加绘图结果图,时间单位为秒;
图7为实施例中自适应层次聚类仿真测试数据图;
图8为实施例中自适应层次聚类质量曲线图;
图9为实施例中自适应层次聚类结果图;
图10为注入异常后的无标签时间序列样本图,时间单位为秒;
图11a为类别1基于自适应层次聚类异常检测结果图,时间单位为秒;
图11b为类别2基于自适应层次聚类异常检测结果图,时间单位为秒;
图11c为异常序列基于自适应层次聚类异常检测结果图,时间单位为秒;
图12为注入异常后的测试无标签时间序列样本图,时间单位为秒;
图13a为类别1基于1-NN分类匹配的异常检测结果图,时间单位为秒;
图13b为类别2基于1-NN分类匹配的异常检测结果图,时间单位为秒;
图13c为异常序列基于1-NN分类匹配的异常检测结果图,时间单位为秒。
具体实施方式
具体实施方式一:结合图1说明本实施方式,一种无类别标签的时间序列异常检测方法具体是按照以下步骤进行的:
步骤一、根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段,得到无类别标签的时间序列X={x1,x2,…,xn},其中n为大于0的正整数,表示时间序列数目,x1为无类别标签的时间序列中第一个时间序列,x2为无类别标签的时间序列中第二个时间序列,xn为无类别标签的时间序列中第n个时间序列;
步骤二、对步骤一得到的无类别标签的时间序列X={x1,x2,…,xn}进行自适应层次聚类,并判定和删除无类别标签的时间序列中的异常序列,得到卫星正常运行模式下含有类别标签的时间序列和类别标签其中nz为大于0的正整数,表示正常时间序列数目,x'1为含有类别标签的时间序列中第一个正常时间序列,x'2为含有类别标签的时间序列中第二个正常时间序列,为含有类别标签的时间序列中第nz个正常时间序列,l'1为类别标签中第一个正常时间序列,l'2为类别标签中第二个正常时间序列,为类别标签中第nz个正常时间序列;
步骤三、结合匹配阈值以步骤二中获得的含有类别标签的时间序列和类别标签为训练样本,采用最近邻居(1-NearestNeighbor,1-NN)算法对最新卫星遥测时间序列x”进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测。
具体实施方式二:本实施方式与具体实施方式一不同的是:所述步骤一中根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段,得到无类别标签的时间序列X={x1,x2,…,xn},其中n为大于0的正整数,表示时间序列数目,x1为无类别标签的时间序列中第一个时间序列,x2为无类别标签的时间序列中第二个时间序列,xn为无类别标签的时间序列中第n个时间序列;具体过程为:将卫星遥测历史数据以幅角突变点为标识进行分段,得到无类别标签的时间序列X={x1,x2,…,xn}。
幅角为卫星遥测数据中的测试参量之一,其值的变化规律为从0~360依次递增,当达到360后,则变为0重新开始递增,其中从360变为0这个点为幅角突变点;以幅角突变点为标识进行分段,即:记录幅角突变点的对应时间,将其他测试参量根据幅角突变点对应的时间进行提取,提取方法为相邻两个幅角突变点对应时间之内的测试数据提取为一条时间序列。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是:所述步骤二中对步骤一得到的无类别标签的时间序列X={x1,x2,…,xn}进行自适应层次聚类,并判定和删除无类别标签的时间序列中的异常序列,得到卫星正常运行模式下含有类别标签的时间序列和类别标签其中nz为大于0的正整数,表示正常时间序列数目,x'1为含有类别标签的时间序列中第一个正常时间序列,x'2为含有类别标签的时间序列中第二个正常时间序列,为含有类别标签的时间序列中第nz个正常时间序列,l'1为类别标签中第一个正常时间序列,l'2为类别标签中第二个正常时间序列,为类别标签中第nz个正常时间序列;具体过程为:
计算出各个无类别标签的时间序列X={x1,x2,…,xn}之间的n×n的欧式距离矩阵,自适应层次聚类方法的基本步骤如下:
步骤二一、将每个无类别标签的时间序列归为一类,共得到n类,每类仅包含一个无类别标签的时间序列,类与类之间的距离就是所包含的无类别标签的时间序列之间的距离,并令RJ(n)=0;RJ为类间类内距离比值序列用于评估聚类质量,序列长度为n,RJ(n)表示RJ中的第n个元素;
步骤二二、找到最接近的两个类合并成一类,总类别数减少一个,并根据式(4-6)计算RJ(i)的值,i为当前类别数,RJ(i)为RJ中的第i个元素,表示当类别数目为i时的类间类内距离比值,i=1,2,…,n;
设加权类内距离为加权类间距离为则相关定义如下:
其中,为第j'类的类内距离均值
为第i'类与第j'类的类间距离均值
式中,dist(xi't,xj'k)表示计算xi't与xj'k之间的欧式距离;
pj'为第j'类的类内距离权重;
qi'j'为第i'类与第j'类的类间距离权重,j'=1,2,…,i,,i'=1,2,…,i;
xj'k为第j'类Xj'中的第k个序列,k=1,2,…,nj',nj'为第j'类的成员数目;
xi't为第i'类Xi'中的第t个序列t=1,2,…,ni',ni'为第i'类的成员数目;
Xj'为第j'类的时间序列集合
S*为类内距离均值序列;
Xi'为第i'类的时间序列集合
xj't'为第j'类Xj'中的第t'个序列,t'=1,2,…,nj'
步骤二三、重新计算合并后的类与未合并的类之间的距离,更新欧式距离矩阵;
步骤二四、重复步骤二二和步骤二三,直到合并成一个类别数目为止,并令RJ(1)=0,RJ(1)为RJ中的第1个元素,表示当类别数目为1时的类间类内距离比值;
步骤二五、获取RJ序列中前半段序列中的最大值RJ(c),RJ序列中前半段序列为其中c即为最佳的聚类数目,并获得对应c类的聚类后类别标签L={l1,l2,…,ln};
步骤二六、根据设定异常判定参数R对聚类后的各类别进行判定,若则表示第i'类为异常类别并对该类别进行删除;
步骤二七、删除所有异常类别后即得到卫星正常运行模式含有类别标签的时间序列和类别标签此时类别数目为c-c',c'表示异常类别数目。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一、二或三不同的是:所述步骤三中结合匹配阈值以步骤二中获得的含有类别标签的时间序列和类别标签为训练样本,采用最近邻居(1-Nearest Neighbor,1-NN)算法对最新卫星遥测时间序列x”进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测;具体过程为:
步骤三一:计算出含有类别标签的时间序列中各类别的类内欧式距离均值其中的计算方式如下:
其中,表示第l类的类内距离均值,l=1,2,…,c-c';
ml表示第l类的成员数目;
表示中第l类的所有成员;
dist(xli”,xlj”)表示计算xli”与xlj”之间的欧式距离;
i”=1,2,…,ml-1,j”=i”+1,i”+2,…,ml
步骤三二:获取待进行异常检测的时间序列x”,获取方式为提取最新卫星遥测数据中相邻两个幅角突变点对应时间之内的时间序列x”;
步骤三三:计算出待检测的时间序列x”与含有类别标签的时间序列之间的欧式距离序列D={d1,d2,…,dn},其中,di”’表示待检测的时间序列x”与x'i”'之间的欧式距离,x'i”'中的第i”'个序列,i”'=1,2,…,n;
步骤三四:采用基于欧式距离的1-NN分类方法,对待检测的时间序列x”进行预分类,确定待检测的时间序列x”的准所属类别l';准所属类别l'取值范围为l=1,2,…,c-c';
步骤三五:确定与待检测的时间序列x”的欧式距离最小的含有类别标签的时间序列,即在D={d1,d2,…,dn}中,取出最小的数值dmin,确定最小的数值对应的含有类别标签的时间序列,其对应的类别标签即为x”的准所属类别为l';
步骤三六:判断dmin之间的大小关系,其中P为用户设定的异常检测敏感系数,得出待检测的时间序列x”的异常检测结果,其判断规则为:若则待检测的时间序列x”判定为异常序列,否则待检测的时间序列x”判定为正常序列,并将x”归入l'类。
其它步骤及参数与具体实施方式一、二或三相同。
采用以下实施例验证本发明的有益效果:
实施例1
一种无类别标签的时间序列异常检测方法具体是按照以下步骤进行的:
步骤一、根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段,得到无类别标签的时间序列X={x1,x2,…,xn},其中n为大于0的正整数,表示时间序列数目,x1为无类别标签的时间序列中第一个时间序列,x2为无类别标签的时间序列中第二个时间序列,xn为无类别标签的时间序列中第n个时间序列;
步骤二、对步骤一得到的无类别标签的时间序列X={x1,x2,…,xn}进行自适应层次聚类,并判定和删除无类别标签的时间序列中的异常序列,得到卫星正常运行模式下含有类别标签的时间序列和类别标签其中nz为大于0的正整数,表示正常时间序列数目,x'1为含有类别标签的时间序列中第一个正常时间序列,x'2为含有类别标签的时间序列中第二个正常时间序列,为含有类别标签的时间序列中第nz个正常时间序列,l'1为类别标签中第一个正常时间序列,l'2为类别标签中第二个正常时间序列,为类别标签中第nz个正常时间序列;
步骤三、结合匹配阈值以步骤二中获得的含有类别标签的时间序列和类别标签为训练样本,采用最近邻居(1-NearestNeighbor,1-NN)算法对最新卫星遥测时间序列x”进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测。
此部分,首先,根据卫星遥测数据的周期特性以幅角突变点为标识对卫星遥测历史数据进行分段,得到无类别标签的卫星遥测时间序列集合;然后,对分段后得到的无类别标签的卫星遥测时间序列集合进行自适应层次聚类,并完成异常时间序列的检出之后,得到卫星正常时间序列以及对应的正常类别模式;最后,结合匹配阈值采用1-NN算法对从最新卫星遥测数据中提取出来的待检测时间序列进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测与卫星运行模式识别。
对自适应层次聚类的验证采用仿真实验完成。仿真数据如图7所示,共200个数据点,对其采用自适应层次聚类的处理结果为:聚类质量曲线如图8所示,可知当类别数为4时,聚类质量最好,因此将仿真数据聚类为4类,聚类结果如图9所示,其中不同形状表示所属不同类别。由处理结果图9对比原始数据图7可知自适应层次聚类有效可行。
针对卫星遥测数据开展无类别标签时间序列离线和在线异常检测的验证实验,用于实验的具体测试参量为飞轮转速D,其原始数据如图6所示。其中用于离线异常检测实验的无类别标签时间序列样本数为50,所有时间序列经与数据提供单位确认已无异常,通过采用异常准入的方式对其中一个时间序列注入脉冲型异常,异常幅值为二分之一倍参量最大值减去最小值,注入位置为时间序列中间位置,注入异常后的样本如图10所示。
针对上述无类别标签时间序列样本采用自适应层次聚类方法并设定异常判定参数为0.05,进行异常检测结果如图11a、11b、11c所示,通过该结果可以发现基于自适应层次聚类方法的异常检测方法能够有效识别异常时间序列,并对正常时间序列确定较好的类别数目并实现聚类。
将通过前述处理后得到的含有类别标签的正常时间序列作为1-NN分类算法的训练样本,设定灵敏度系数为1,用于实现卫星遥测数据的在线异常检测。仿真输入测试样本为50,所有时间序列经与数据提供单位确认已无异常,通过采用异常准入的方式对其中一个时间序列注入阶跃型异常,异常幅值为负四分之一倍参量最大值减去最小值,注入位置为时间序列的四分之三处位置,注入异常后的样本如图12所示。
进行基于1-NN分类匹配的异常检测结果如图13a、13b、13c所示,通过该结果可以发现基于1-NN分类匹配的异常检测方法能够有效识别异常时间序列,并对正常时间序列实现较好的分类。

Claims (3)

1.一种无类别标签的时间序列异常检测方法,其特征在于,一种无类别标签的时间序列异常检测方法具体是按照以下步骤进行的:
步骤一、根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段,得到无类别标签的时间序列X={x1,x2,…,xn},其中n为大于0的正整数,表示时间序列数目,x1为无类别标签的时间序列中第一个时间序列,x2为无类别标签的时间序列中第二个时间序列,xn为无类别标签的时间序列中第n个时间序列;
步骤二、对步骤一得到的无类别标签的时间序列X={x1,x2,…,xn}进行自适应层次聚类,并判定和删除无类别标签的时间序列中的异常序列,得到卫星正常运行模式含有类别标签的时间序列和类别标签其中nz为大于0的正整数,表示正常时间序列数目,x'1为含有类别标签的时间序列中第一个正常时间序列,x'2为含有类别标签的时间序列中第二个正常时间序列,为含有类别标签的时间序列中第nz个正常时间序列,l'1为类别标签中第一个正常时间序列,l'2为类别标签中第二个正常时间序列,为类别标签中第nz个正常时间序列;具体过程为:
计算出各个无类别标签的时间序列X={x1,x2,…,xn}之间的n×n的欧式距离矩阵,自适应层次聚类方法的基本步骤如下:
步骤二一、将每个无类别标签的时间序列归为一类,共得到n类,每类仅包含一个无类别标签的时间序列,类与类之间的距离就是所包含的无类别标签的时间序列之间的距离,并令RJ(n)=0;RJ为类间类内距离比值序列,序列长度为n,RJ(n)表示RJ中的第n个元素;
步骤二二、找到最接近的两个类合并成一类,总类别数减少一个,并根据式(4-6)计算RJ(i)的值,i为当前类别数,RJ(i)为RJ中的第i个元素,表示当类别数目为i时的类间类内距离比值,i=1,2,…,n;
设加权类内距离为加权类间距离为则相关定义如下:
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msubsup> <mi>J</mi> <mi>b</mi> <mo>*</mo> </msubsup> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mo>=</mo> <mn>1</mn> </mrow> <mi>i</mi> </munderover> <msub> <mi>p</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> <mo>&amp;CenterDot;</mo> <msubsup> <mi>S</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mo>*</mo> </msubsup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msubsup> <mi>J</mi> <mi>c</mi> <mo>*</mo> </msubsup> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <mo>=</mo> <mn>1</mn> </mrow> <mi>i</mi> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mo>=</mo> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <mo>+</mo> <mn>1</mn> </mrow> <mi>i</mi> </munderover> <msub> <mi>q</mi> <mrow> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>&amp;CenterDot;</mo> <msubsup> <mi>T</mi> <mrow> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </mrow> <mo>*</mo> </msubsup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>R</mi> <mi>J</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msubsup> <mi>J</mi> <mi>c</mi> <mo>*</mo> </msubsup> <msubsup> <mi>J</mi> <mi>b</mi> <mo>*</mo> </msubsup> </mfrac> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>-</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>
其中,为第j'类的类内距离均值
<mrow> <msubsup> <mi>S</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mo>*</mo> </msubsup> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mfrac> <mn>2</mn> <mrow> <msub> <mi>n</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> <mrow> <mo>(</mo> <msub> <mi>n</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>x</mi> <mrow> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mi>k</mi> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>X</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> </mrow> </munder> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>x</mi> <mrow> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>t</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>X</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> </mrow> </munder> <mi>d</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mi>k</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>x</mi> <mrow> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>t</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>n</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> <mo>&gt;</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mrow> <mo>(</mo> <msup> <mi>S</mi> <mo>*</mo> </msup> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>n</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> <mo>=</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>-</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>p</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> <mo>=</mo> <mfrac> <msub> <mi>n</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> <mi>n</mi> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>-</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>
为第i'类与第j'类的类间距离均值
<mrow> <msubsup> <mi>T</mi> <mrow> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </mrow> <mo>*</mo> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <msub> <mi>n</mi> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>n</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> </mrow> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>n</mi> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> </msub> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>n</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> </munderover> <mi>d</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <mi>t</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>x</mi> <mrow> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mi>k</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>-</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>q</mi> <mrow> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>n</mi> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> </msub> <mo>+</mo> <msub> <mi>n</mi> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </msub> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>-</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>
式中,dist(xi't,xj'k)表示计算xi't与xj'k之间的欧式距离;
pj'为第j'类的类内距离权重;
qi'j'为第i'类与第j'类的类间距离权重,j'=1,2,…,i,i'=1,2,…,i;
xj'k为第j'类Xj'中的第k个序列,k=1,2,…,nj',nj'为第j'类的成员数目;
xi't为第i'类Xi'中的第t个序列t=1,2,…,ni',ni'为第i'类的成员数目;
Xj'为第j'类的时间序列集合
S*为类内距离均值序列;
Xi'为第i'类的时间序列集合
xj't'为第j'类Xj'中的第t'个序列,t'=1,2,…,nj'
步骤二三、重新计算合并后的类与未合并的类之间的距离,更新欧式距离矩阵;
步骤二四、重复步骤二二和步骤二三,直到合并成一个类别数目为止,并令RJ(1)=0,RJ(1)为RJ中的第1个元素,表示当类别数目为1时的类间类内距离比值;
步骤二五、获取RJ序列中前半段序列中的最大值RJ(c),RJ序列中前半段序列为其中c即为最佳的聚类数目,并获得对应c类的聚类后类别标签L={l1,l2,…,ln};
步骤二六、根据设定异常判定参数R对聚类后的各类别进行判定,若则表示第i'类为异常类别并对该类别进行删除;
步骤二七、删除所有异常类别后即得到卫星正常运行模式含有类别标签的时间序列和类别标签此时类别数目为c-c',c'表示异常类别数目;
步骤三、结合匹配阈值以步骤二中获得的含有类别标签的时间序列和类别标签为样本,采用最近邻居算法对最新卫星遥测时间序列x”进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测。
2.根据权利要求1所述一种无类别标签的时间序列异常检测方法,其特征在于,所述步骤一中根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段,得到无类别标签的时间序列X={x1,x2,…,xn},其中n为大于0的正整数,表示时间序列数目,x1为无类别标签的时间序列中第一个时间序列,x2为无类别标签的时间序列中第二个时间序列,xn为无类别标签的时间序列中第n个时间序列;具体过程为:将卫星遥测历史数据以幅角突变点为标识进行分段,得到无类别标签的时间序列X={x1,x2,…,xn};
幅角为卫星遥测数据中的测试参量之一,其值的变化规律为从0~360依次递增,当达到360后,则变为0重新开始递增,其中从360变为0这个点为幅角突变点;以幅角突变点为标识进行分段,即:记录幅角突变点的对应时间,将其他测试参量根据幅角突变点对应的时间进行提取,提取方法为相邻两个幅角突变点对应时间之内的测试数据提取为一条时间序列。
3.根据权利要求2所述一种无类别标签的时间序列异常检测方法,其特征在于,所述步骤三中结合匹配阈值以步骤二中获得的含有类别标签的时间序列和类别标签为样本,采用最近邻居算法对最新卫星遥测时间序列x”进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测;具体过程为:
步骤三一:计算出含有类别标签的时间序列中各类别的类内欧式距离均值其中的计算方式如下:
<mrow> <msub> <mover> <mi>s</mi> <mo>&amp;OverBar;</mo> </mover> <mi>l</mi> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mfrac> <mn>2</mn> <mrow> <msub> <mi>m</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>m</mi> <mi>l</mi> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <msup> <mi>i</mi> <mrow> <mo>&amp;prime;</mo> <mo>&amp;prime;</mo> </mrow> </msup> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>m</mi> <mi>l</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <msup> <mi>j</mi> <mrow> <mo>&amp;prime;</mo> <mo>&amp;prime;</mo> </mrow> </msup> <mo>=</mo> <msup> <mi>i</mi> <mrow> <mo>&amp;prime;</mo> <mo>&amp;prime;</mo> </mrow> </msup> <mo>+</mo> <mn>1</mn> </mrow> <msub> <mi>m</mi> <mi>l</mi> </msub> </munderover> <mi>d</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <msup> <mi>li</mi> <mrow> <mo>&amp;prime;</mo> <mo>&amp;prime;</mo> </mrow> </msup> </mrow> </msub> <mo>,</mo> <msub> <mi>x</mi> <mrow> <msup> <mi>lj</mi> <mrow> <mo>&amp;prime;</mo> <mo>&amp;prime;</mo> </mrow> </msup> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>m</mi> <mi>l</mi> </msub> <mo>&gt;</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mrow> <mo>(</mo> <mover> <mi>S</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>m</mi> <mi>l</mi> </msub> <mo>=</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
其中,表示第l类的类内距离均值,l=1,2,…,c-c';
ml表示第l类的成员数目;
表示中第l类的所有成员;
dist(xli”,xlj”)表示计算xli”与xlj”之间的欧式距离;
i”=1,2,…,ml-1;
j”=i”+1,i”+2,…,ml
步骤三二:获取待进行异常检测的时间序列x”,获取方式为提取最新卫星遥测数据中相邻两个幅角突变点对应时间之内的时间序列x”;
步骤三三:计算出待检测的时间序列x”与含有类别标签的时间序列之间的欧式距离序列D={d1,d2,…,dn},其中,di”'表示待检测的时间序列x”与x'i”'之间的欧式距离,x'i”'中的第i”'个序列,i”'=1,2,…,n;
步骤三四:采用基于欧式距离的1-NN分类方法,对待检测的时间序列x”进行预分类,确定待检测的时间序列x”的准所属类别l';准所属类别l'取值范围为l'=1,2,…,c-c';其中,所述1-NN分类方法为最近邻居算法;
步骤三五:确定与待检测的时间序列x”的欧式距离最小的含有类别标签的时间序列,即在D={d1,d2,…,dn}中,取出最小的数值dmin,确定最小的数值对应的含有类别标签的时间序列,其对应的类别标签即为x”的准所属类别为l';
步骤三六:判断dmin之间的大小关系,其中P为用户设定的异常检测敏感系数,得出待检测的时间序列x”的异常检测结果,其判断规则为:若则待检测的时间序列x”判定为异常序列,否则待检测的时间序列x”判定为正常序列,并将x”归入l'类。
CN201510351164.3A 2015-06-24 2015-06-24 一种无类别标签的时间序列异常检测方法 Active CN104899327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510351164.3A CN104899327B (zh) 2015-06-24 2015-06-24 一种无类别标签的时间序列异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510351164.3A CN104899327B (zh) 2015-06-24 2015-06-24 一种无类别标签的时间序列异常检测方法

Publications (2)

Publication Number Publication Date
CN104899327A CN104899327A (zh) 2015-09-09
CN104899327B true CN104899327B (zh) 2018-03-30

Family

ID=54031989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510351164.3A Active CN104899327B (zh) 2015-06-24 2015-06-24 一种无类别标签的时间序列异常检测方法

Country Status (1)

Country Link
CN (1) CN104899327B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184084B (zh) * 2015-09-14 2018-05-01 深圳供电局有限公司 一种电力计量自动化终端故障类型预测方法和系统
CN106197424B (zh) * 2016-06-28 2019-03-22 哈尔滨工业大学 遥测数据驱动的无人机飞行状态识别方法
CN106709509B (zh) * 2016-11-30 2021-05-28 哈尔滨工业大学 一种基于时间序列特殊点的卫星遥测数据聚类方法
CN106778839B (zh) * 2016-11-30 2021-02-26 哈尔滨工业大学 基于局部极值优化提取的卫星遥测数据时间序列表示方法
CN108830162B (zh) * 2018-05-21 2022-02-08 西华大学 无线电频谱监测数据中的时序模式序列提取方法及存储方法
CN109034191B (zh) * 2018-06-19 2021-06-01 哈尔滨工业大学 基于elm的单维遥测数据异常判读方法
CN110032495B (zh) * 2019-03-28 2023-08-25 创新先进技术有限公司 数据异常检测方法和装置
CN110321940B (zh) * 2019-06-24 2021-07-09 清华大学 飞行器遥测数据特征提取与分级分类方法及装置
CN110413949B (zh) * 2019-08-02 2021-03-09 湖南联智科技股份有限公司 一种呈递增或递减变化趋势的数据处理方法
CN110837874B (zh) * 2019-11-18 2023-05-26 上海新炬网络信息技术股份有限公司 基于时间序列分类的业务数据异常检测方法
CN111241158B (zh) * 2020-01-07 2020-09-18 清华大学 一种飞行器遥测数据的异常检测方法和装置
CN111680355B (zh) * 2020-05-06 2022-06-28 北京航空航天大学 一种典型遥测异常检测与定位的自适应幅值几何映射方法
CN111611961A (zh) * 2020-05-29 2020-09-01 福州大学 一种基于变点分段与序列聚类的谐波异常识别方法
CN112465044B (zh) * 2020-12-03 2022-12-27 上海卫星工程研究所 基于敏感参数多证据融合的卫星工况识别与分割方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101561878A (zh) * 2009-05-31 2009-10-21 河海大学 基于改进cure聚类算法的无监督异常检测方法和系统
US8005771B2 (en) * 2007-10-04 2011-08-23 Siemens Corporation Segment-based change detection method in multivariate data stream
CN102339288A (zh) * 2010-07-21 2012-02-01 中国移动通信集团辽宁有限公司 数据仓库异常数据的检测方法及装置
CN103400152A (zh) * 2013-08-20 2013-11-20 哈尔滨工业大学 基于分层聚类的滑动窗口多数据流异常检测方法
CN104317681A (zh) * 2014-09-02 2015-01-28 上海交通大学 针对计算机系统的行为异常自动检测方法及检测系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005771B2 (en) * 2007-10-04 2011-08-23 Siemens Corporation Segment-based change detection method in multivariate data stream
CN101561878A (zh) * 2009-05-31 2009-10-21 河海大学 基于改进cure聚类算法的无监督异常检测方法和系统
CN102339288A (zh) * 2010-07-21 2012-02-01 中国移动通信集团辽宁有限公司 数据仓库异常数据的检测方法及装置
CN103400152A (zh) * 2013-08-20 2013-11-20 哈尔滨工业大学 基于分层聚类的滑动窗口多数据流异常检测方法
CN104317681A (zh) * 2014-09-02 2015-01-28 上海交通大学 针对计算机系统的行为异常自动检测方法及检测系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"时空序列数据挖掘中若干关键技术研究";杨文涛;《中国优秀硕士学位论文全文数据库 基础科学辑》;20140515(第5期);A008-64页 *
"时间序列数据挖掘若干关键问题研究";何晓旭;《中国博士学位论文全文数据库 基础科学辑》;20141015(第10期);A002-66页 *

Also Published As

Publication number Publication date
CN104899327A (zh) 2015-09-09

Similar Documents

Publication Publication Date Title
CN104899327B (zh) 一种无类别标签的时间序列异常检测方法
Zhang et al. Intelligent fault diagnosis under varying working conditions based on domain adaptive convolutional neural networks
CN104915568B (zh) 基于dtw的卫星遥测数据异常检测方法
CN111931868B (zh) 时间序列数据异常检测方法和装置
Cabrera et al. Automatic feature extraction of time-series applied to fault severity assessment of helical gearbox in stationary and non-stationary speed operation
CN105738109B (zh) 基于稀疏表示与集成学习的轴承故障分类诊断方法
US9053391B2 (en) Supervised and semi-supervised online boosting algorithm in machine learning framework
Rai et al. A novel health indicator based on the Lyapunov exponent, a probabilistic self-organizing map, and the Gini-Simpson index for calculating the RUL of bearings
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
Pan et al. A deep learning network via shunt-wound restricted Boltzmann machines using raw data for fault detection
CN104596780B (zh) 一种动车组制动系统传感器故障的诊断方法
CN106528417A (zh) 软件缺陷智能检测方法和系统
CN109409425B (zh) 一种基于近邻成分分析的故障类型识别方法
Chadha et al. Time series based fault detection in industrial processes using convolutional neural networks
CN110175640A (zh) 一种基于机器学习的电液伺服阀故障诊断方法
Kourd et al. Fault diagnosis based on neural networks and decision trees: application to DAMADICS
CN110728377B (zh) 一种面向机电设备的智能故障诊断方法及系统
CN116012681A (zh) 基于声振信号融合的管道机器人电机故障诊断方法及系统
Wang et al. Three‐stage feature selection approach for deep learning‐based RUL prediction methods
CN113051452B (zh) 运维数据特征选择方法和装置
CN114169460A (zh) 样本筛选方法、装置、计算机设备和存储介质
Hwang et al. Anomaly Detection in Time Series Data and its Application to Semiconductor Manufacturing
Zhang et al. Determining statistical process control baseline periods in long historical data streams
ZUBEDI et al. Implementation of Winsorizing and random oversampling on data containing outliers and unbalanced data with the random forest classification method
Mayuravaani et al. A semi-supervised deep learning approach for the classification of steel surface defects

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant