CN114997276A - 一种面向压制成型设备的异构多源时序数据异常识别方法 - Google Patents

一种面向压制成型设备的异构多源时序数据异常识别方法 Download PDF

Info

Publication number
CN114997276A
CN114997276A CN202210493426.XA CN202210493426A CN114997276A CN 114997276 A CN114997276 A CN 114997276A CN 202210493426 A CN202210493426 A CN 202210493426A CN 114997276 A CN114997276 A CN 114997276A
Authority
CN
China
Prior art keywords
data
cluster
sensor
vector
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210493426.XA
Other languages
English (en)
Other versions
CN114997276B (zh
Inventor
左颖
游虎杰
张萌
陶飞
张大舜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun Equipment & Technology Research Institute
Beihang University
Original Assignee
Changchun Equipment & Technology Research Institute
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun Equipment & Technology Research Institute, Beihang University filed Critical Changchun Equipment & Technology Research Institute
Priority to CN202210493426.XA priority Critical patent/CN114997276B/zh
Publication of CN114997276A publication Critical patent/CN114997276A/zh
Application granted granted Critical
Publication of CN114997276B publication Critical patent/CN114997276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明公开了一种面向压制成型设备的异构多源时序数据异常识别方法,包括:传感器数据集构建模块,该模块根据原始数据与被采集时间的对应关系生成传感器数据向量,并进行标准化处理,然后基于标准化数据向量构建传感器数据集;聚类簇和簇内数据检测集构建模块,该模块通过K‑means算法构建传感器数据集内的聚类簇,并构建聚类簇对应的簇内数据检测集;异常数据识别模块,该模块通过LOF算法,将各聚类簇内数据放入簇内数据检测集进行异常识别,并进行相应标记。本发明能在仅计算部分向量局部离群因子条件下,排除多个异常向量集中分布产生的干扰,高效准确识别压制成型设备传感器所采集异构多源时序数据中的异常数据。

Description

一种面向压制成型设备的异构多源时序数据异常识别方法
技术领域
本发明属于电子工程和计算机科学领域,具体涉及一种面向压制成型设备的异构多源时序数据异常识别方法。
背景技术
压制成型工艺广泛应用于冶金、制药、陶瓷等行业领域,其核心设备为压制成型设备。近年来,智能制造迅速兴起,为传统制造业的转型与升级提供了非常关键的助力,有效提升了企业的生产力。将智能制造技术应用于压制成型工艺,是提升压制成型工艺产品质量和生产效率的重要途经。但是,智能制造技术与压制成型工艺的结合离不开压制成型设备传感器所采集数据,这些数据在类型上表现为异构,存在位移、压力、温度、湿度等多种类型的数据,在采集来源上表现为多源,分别通过不同传感器进行采集,且各类数据均为时序数据,由各传感器按照一定采样频率进行采样所得。然而,由于制造现场容易受到外界干扰,造成传感器的错采,从而导致采集到的个别制造现场数据与实际数据偏差过大。因此在采集到制造现场的数据后,需要识别并剔除其中的异常数据,才能作为制造车间的智能决策的支撑数据而使用。由此可见,制造现场数据的异常识别是智能制造中非常重要的步骤,是确保数据可靠性和制造精度的关键环节。
针对制造现场原始数据异常识别所采用的方法属于非监督学习方法。目前,国内外学者进行了大量的研究。然而传统的非监督学习异常识别方法存在一定的局限性。例如:基于KNN的异常识别方法对异构多源数据中的噪声和整体分布密度较为敏感;基于LOF的异常识别方法计算量较大,且很难识别异构多源数据中多个集中分布的异常数据;基于孤立森林的异常识别方法同样会受到异构多源数据中多个异常数据集中分布产生的干扰。K-means算法是一种常用的聚类分析算法,能够将异构多源数据集划分为多个聚类簇,使得每个聚类簇中的异构多源数据都尽可能集中分布。利用K-means算法的上述特性,可以减少需要进行异常识别的异构多源数据,并且排除多个异常数据集中分布产生的干扰,这对面向异构多源数据的异常识别研究具有重要意义。同时,由于各类数据的分布情况存在差异,且均为时间序列,与被采集时间有着密切联系,需要将所有数据分别与自身的被采集时间进行关联,并按采集来源进行分类。因此,本发明提出一种面向压制成型设备的异构多源时序数据异常识别方法,能在仅计算部分向量局部离群因子条件下,排除多个异常向量集中分布产生的干扰,高效准确识别压制成型设备传感器所采集异构多源时序数据中的异常数据。
发明内容
本发明要解决的技术问题为:提供一种面向压制成型设备的异构多源时序数据异常识别方法,该方法能在仅计算部分向量局部离群因子条件下,排除多个异常向量集中分布产生的干扰,高效准确识别压制成型设备传感器所采集异构多源时序数据中的异常数据。
本发明解决其技术问题是采取以下技术方案实现的:一种面向压制成型设备的异构多源时序数据异常识别方法,包括以下步骤:
步骤一:基于传感器采集数据与采集时间的对应关系,进行传感器数据集构建,具体实现如下:
(11)传感器数据向量构建:基于压制成型过程中传感器采集数据与采集时间的对应关系,构建传感器数据向量Vn=[dn,tn],其中1≤n≤4,dn表示传感器n的采集数据,tn表示dn的采集时间,传感器1为压力传感器,用来采集压制成型设备的压头压力数据d1,传感器2为位移传感器,用来采集压制成型设备的滑块位移数据d2,传感器3为温度传感器,用来采集压制成型设备所在环境温度数据d3,传感器4为湿度传感器,用来采集压制成型设备所在环境湿度数据d4
(12)采集数据与采集时间标准化:依据标准化公式
Figure BDA0003632653890000021
Figure BDA0003632653890000022
分别将传感器数据向量Vn对应的压头压力、滑块位移、环境温度、环境湿度数据及这些数据的采集时间进行标准化处理,得到标准化数据向量
Figure BDA0003632653890000023
其中d为压头压力、滑块位移、环境温度、环境湿度中的一类数据,
Figure BDA0003632653890000024
为该类数据的平均值,
Figure BDA0003632653890000025
为该类数据进行标准化处理后的值,σd为该类数据标准差,t为该类数据的采集时间,
Figure BDA0003632653890000026
为该类数据采集时间的平均值,
Figure BDA0003632653890000027
为该类数据采集时间进行标准化处理后的值,σt为该类数据采集时间的标准差;
(13)传感器数据集构建:利用标准化数据向量
Figure BDA0003632653890000028
构建传感器数据集Dn,其中Dn
Figure BDA0003632653890000029
所指代的所有向量组成;
步骤二:基于步骤一所构建传感器数据集,进行传感器数据集内聚类簇和簇内数据检测集构建,具体实现如下:
(21)传感器数据集内聚类簇构建:利用K-means算法对传感器数据集Dn进行聚类,在Dn内得到聚类簇
Figure BDA00036326538900000210
其中传感器数据集Dn的对应聚类簇个数kn依据肘部原则确定;
(22)聚类簇对应的簇内数据检测集构建:依据公式
Figure BDA00036326538900000211
计算聚类簇
Figure BDA0003632653890000031
对应的簇内数据检测集
Figure BDA0003632653890000032
其中1≤i≤kn
步骤三:基于步骤二所构建传感器数据集内聚类簇和簇内数据检测集,进行异常数据识别,具体实现如下:
(31)初始聚类簇选定:在Dn内(1≤n≤4)选定聚类簇
Figure BDA0003632653890000033
中的第一个聚类簇
Figure BDA0003632653890000034
设所选定聚类簇的下角标为i,其中1≤i≤kn,令i=1;
(32)基于聚类簇对应簇内数据检测集的异常向量识别:在
Figure BDA0003632653890000035
中抽取一个未被标记过的向量,应用LOF算法计算该向量的局部异常因子,并基于计算结果判断被抽取向量在
Figure BDA0003632653890000036
中是否属于异常向量,如果是,则进入步骤(33),否则进入步骤(34);
(33)标记被抽取向量为异常向量:将被抽取向量标记为异常向量,如果
Figure BDA0003632653890000037
中所有向量都已被标记,则进入步骤(35),否则返回步骤(32);
(34)标记聚类簇内所有向量为正常向量:清除对
Figure BDA0003632653890000038
中所有向量的标记,将
Figure BDA0003632653890000039
中所有向量标记为正常向量,进入步骤(35);
(35)聚类簇选定判断:若i<kn,则令i=i+1,返回步骤(32),否则进入步骤(36);
(36)异常采集数据标记:利用步骤(33)与步骤(34)对向量的标记,根据传感器采集数据与数据集Dn中各向量的对应关系,标记采集数据中的异常数据。
所述步骤中(21)中,针对传感器数据集应用肘部原则时,需要令传感器数据集的聚类簇个数从1开始,以1为步长递增,对传感器数据集进行多次聚类,并分别计算传感器数据集每次聚类的误差平方和,当传感器数据集本次聚类与前一次聚类的误差平方和的比值大于0.9时,即表明该传感器数据集对应的聚类簇个数应当选定为本次聚类设定的聚类簇个数。
本发明将肘部原则与压制成型工艺具体情况相结合,在生产同一种产品时,只需要在处理首轮压制成型过程中传感器采集数据时,运用肘部原则计算传感器数据集对应的聚类簇个数,在处理后续轮次压制成型过程中传感器的采集数据时,传感器数据集直接沿用之前选定的对应聚类簇个数,无需重新应用肘部原则进行计算对应聚类簇个数,因为在生产同一种产品时,压制成型工况基本相同,而在相同或相近工况下,相同传感器在产品生产过程中采集数据的个数与分布大致相同。
所述步骤(21)与步骤(22)中,利用K-means算法对传感器数据集Dn进行聚类,在Dn内得到聚类簇
Figure BDA00036326538900000310
并依据公式
Figure BDA00036326538900000311
计算聚类簇
Figure BDA00036326538900000312
对应的簇内数据检测集
Figure BDA00036326538900000313
1≤i≤kn,能够排除多个异常向量集中分布产生的干扰,提高异常识别的准确度
所述步骤(32)与步骤(34)中,在
Figure BDA00036326538900000314
中抽取一个未被标记过的向量,应用LOF算法计算该向量的局部异常因子,如果计算结果为局部异常因子小于1.2,即可判断被抽取向量在
Figure BDA0003632653890000043
中不属于异常向量,并清除对
Figure BDA0003632653890000041
中所有向量的标记,然后将
Figure BDA0003632653890000042
中所有向量标记为正常向量;利用了同一聚类簇中向量分布集中的特性,当聚类簇中存在一个正常向量时,能判断该聚类簇中所有向量都不属于异常向量,提高异常数据识别的效率。
本发明与现有技术相比的优点在于:
(1)现有面向压制成型设备的异构多源时序数据异常识别方法,主要依据数据向量邻域内的数据向量密集程度来判断数据向量是否为异常向量,这样只能识别零散分布的异常向量,而无法准确识别出多个集中分布的异常向量。而本发明在计算传感器数据向量的局部异常因子之前,对传感器数据集进行了聚类,并计算了每个聚类簇在所属传感器数据集中的补集作为对应的簇内数据检测集,这样能够排除多个异常向量集中分布产生的干扰,与现有技术相比,能够准确识别出多个集中分布的异常向量,从而提高了异常识别的准确度。
(2)现有面向压制成型设备的异构多源时序数据异常识别方法需要依次对每个数据向量进行计算,以此依次判断每个数据向量是否为异常向量,而本发明利用同一聚类簇中向量分布集中的特性,当聚类簇中存在一个正常向量时,就能判断该聚类簇中所有向量都不属于异常向量,与现有技术相比,这样避免了对所有数据向量进行计算,提高了异常数据识别的效率。
(3)现有技术并未将肘部原则用于面向压制成型设备的异构多源时序数据异常识别方法,而本发明结合压制成型工艺具体情况,只需要在处理首轮压制成型过程中传感器采集数据时,运用肘部原则计算传感器数据集对应的聚类簇个数,在处理后续轮次压制成型过程中传感器采集数据时,传感器数据集可以直接沿用之前选定的对应聚类簇个数,无需重新应用肘部原则进行计算对应聚类簇个数,这既确保了传感器数据集对应聚类簇个数的合理性,又避免了大量重复计算,提高了计算效率。
附图说明
图1为本发明的流程框图;
图2为基于肘部原则的聚类簇个数选定流程图。
具体实施方式
下面结合附图对本发明做进一步详细的描述。
本发明涉及一种面向压制成型设备的异构多源时序数据异常识别方法,利用采集数据与对应采集时间生成传感器数据集,然后对传感器数据集进行划分,提高了异常数据识别的效率和准确度。针对识别不同工况压制成型设备异常数据的需求,本发明提出的方法能够高效准确地实现面向压制成型过程异构多源时序数据的异常识别。
如图1所示,本发明方法具体实施方式如下:
(1)基于传感器采集数据与采集时间的对应关系,进行传感器数据集构建,具体实现如下:
(11)传感器数据向量构建:基于压制成型过程中传感器采集数据与采集时间的对应关系,构建传感器数据向量Vn=[dn,tn],其中1≤n≤4,dn表示传感器n的采集数据,tn表示dn的采集时间,传感器1为压力传感器,用来采集压制成型设备的压头压力数据d1,传感器2为位移传感器,用来采集压制成型设备的滑块位移数据d2,传感器3为温度传感器,用来采集压制成型设备所在环境温度数据d3,传感器4为湿度传感器,用来采集压制成型设备所在环境湿度数据d4
(12)采集数据与采集时间标准化:依据标准化公式
Figure BDA0003632653890000051
Figure BDA0003632653890000052
分别将传感器数据向量Vn对应的压头压力、滑块位移、环境温度、环境湿度数据及这些数据的采集时间进行标准化处理,得到标准化数据向量
Figure BDA0003632653890000053
其中d为压头压力、滑块位移、环境温度、环境湿度中的一类数据,
Figure BDA0003632653890000054
为该类数据的平均值,
Figure BDA0003632653890000055
为该类数据进行标准化处理后的值,σd为该类数据标准差,t为该类数据的采集时间,
Figure BDA0003632653890000056
为该类数据采集时间的平均值,
Figure BDA0003632653890000057
为该类数据采集时间进行标准化处理后的值,σt为该类数据采集时间的标准差;
(13)传感器数据集构建:利用标准化数据向量
Figure BDA0003632653890000058
构建传感器数据集Dn,其中Dn
Figure BDA0003632653890000059
所指代的所有向量组成;
(2)基于步骤(1)所构建传感器数据集,进行传感器数据集内聚类簇和簇内数据检测集构建,具体实现如下:
(21)传感器数据集内聚类簇构建:利用K-means算法对传感器数据集Dn进行聚类,在Dn内得到聚类簇
Figure BDA00036326538900000510
若本轮压制成型操作为第一轮,则应用肘部原则确定传感器数据集Dn的对应聚类簇个数kn,否则,若本轮压制成型所生产产品与上一轮相同,则传感器数据集Dn的对应聚类簇个数kn与上一轮保持一致,若本轮压制成型所生产产品与上一轮不同,则重新应用肘部原则确定传感器数据集Dn的对应聚类簇个数kn
基于肘部原则的聚类簇个数选定流程如图2所示:
①完成传感器数据集构建;
②若本轮压制成型操作为第一轮,则应用肘部原则确定传感器数据集Dn的对应聚类簇个数kn,并转到第④步,否则转到第③步。
③若本轮压制成型所生产产品与上一轮相同,则传感器数据集Dn的对应聚类簇个数kn与上一轮保持一致,若本轮压制成型所生产产品与上一轮不同,则重新应用肘部原则确定传感器数据集Dn的对应聚类簇个数kn
④根据所确定的传感器数据集Dn的对应聚类簇个数kn,对传感器数据集Dn进行聚类。
这样节约了计算资源与时间成本,因为在生产同一种产品时,压制成型工况基本相同,而在相同或相近工况下,相同传感器采集数据的个数与分布大致相同;
(22)聚类簇对应的簇内数据检测集构建:依据公式
Figure BDA0003632653890000061
计算聚类簇
Figure BDA0003632653890000062
对应的簇内数据检测集
Figure BDA0003632653890000063
其中1≤i≤kn
(3)基于步骤二所构建传感器数据集内聚类簇和簇内数据检测集,进行异常数据识别,具体实现如下:
(31)初始聚类簇选定:在Dn(1≤n≤4)内选定聚类簇
Figure BDA0003632653890000064
中的第一个聚类簇
Figure BDA0003632653890000065
设所选定聚类簇的下角标为i,其中1≤i≤kn,令i=1;
(32)基于聚类簇对应簇内数据检测集的异常向量识别:在
Figure BDA0003632653890000066
中抽取一个未被标记过的向量,应用LOF算法计算被抽取向量在
Figure BDA0003632653890000067
中的局部异常因子,并判断计算所得局部异常因子是否大于1,如果是,则判断被抽取向量为异常向量,则进入步骤(33),否则判断被抽取向量为正常向量,进入步骤(34);
(33)标记被抽取向量为异常向量:将被抽取的向量
Figure BDA0003632653890000068
扩充为三维向量[dn,tn,0],以此将该向量标记为异常向量,如果
Figure BDA0003632653890000069
中所有向量都已被标记,则进入步骤(35),否则返回步骤(32);
(34)标记聚类簇内所有向量为正常向量:将
Figure BDA00036326538900000610
中所有被扩充向量[dn,tn,0]还原为二维向量[dn,tn],从而清除对
Figure BDA00036326538900000611
中所有向量的标记,然后将
Figure BDA00036326538900000612
中所有向量扩充为三维向量[dn,tn,1],以此将
Figure BDA00036326538900000613
中所有向量标记为正常向量,并进入步骤(35);
(35)聚类簇选定判断:若i<kn,则令i=i+1,返回步骤(32),否则进入步骤(36);
(36)异常采集数据标记:利用步骤(33)与步骤(34)对向量的标记,根据传感器采集数据与数据集Dn中各向量的对应关系,标记采集数据中的异常数据。
如图2所示,本发明结合压制成型工艺具体情况,明确了基于肘部原则的聚类簇个数选定流程。
(1)完成传感器数据集构建;
(2)若本轮压制成型操作为第一轮,则应用肘部原则确定传感器数据集Dn的对应聚类簇个数kn,并转到第(4)步,否则转到第(3)步。
(3)若本轮压制成型所生产产品与上一轮相同,则传感器数据集Dn的对应聚类簇个数kn与上一轮保持一致,若本轮压制成型所生产产品与上一轮不同,则重新应用肘部原则确定传感器数据集Dn的对应聚类簇个数kn
(4)根据所确定的传感器数据集Dn的对应聚类簇个数kn,对传感器数据集Dn进行聚类。
综上所述:本发明公开了一种面向压制成型设备的异构多源时序数据异常识别方法,包括传感器数据集构建模块、簇内数据检测集构建模块、异常数据识别模块,能在仅计算部分向量局部离群因子条件下,排除多个异常向量集中分布产生的干扰,高效准确识别压制成型设备传感器所采集异构多源时序数据中的异常数据,解决了传统LOF算法无法准确识别多个集中分布异常数据的问题。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种面向压制成型设备的异构多源时序数据异常识别方法,其特征在于,包括以下步骤:
步骤一:基于传感器采集数据与采集时间的对应关系,进行传感器数据集构建,具体实现如下:
(11)传感器数据向量构建:基于压制成型过程中传感器采集数据与采集时间的对应关系,构建传感器数据向量Vn=[dn,tn],其中1≤n≤4,dn表示传感器n的采集数据,tn表示dn的采集时间,传感器1为压力传感器,用来采集压制成型设备的压头压力数据d1,传感器2为位移传感器,用来采集压制成型设备的滑块位移数据d2,传感器3为温度传感器,用来采集压制成型设备所在环境温度数据d3,传感器4为湿度传感器,用来采集压制成型设备所在环境湿度数据d4
(12)采集数据与采集时间标准化:依据标准化公式
Figure FDA0003632653880000011
Figure FDA0003632653880000012
分别将传感器数据向量Vn对应的压头压力、滑块位移、环境温度、环境湿度数据及这些数据的采集时间进行标准化处理,得到标准化数据向量
Figure FDA0003632653880000013
其中d为压头压力、滑块位移、环境温度、环境湿度中的一类数据,
Figure FDA00036326538800000115
为该类数据的平均值,
Figure FDA0003632653880000014
为该类数据进行标准化处理后的值,σd为该类数据的标准差,t为该类数据的采集时间,
Figure FDA0003632653880000015
为该类数据采集时间的平均值,
Figure FDA0003632653880000016
为该类数据采集时间进行标准化处理后的值,σt为该类数据采集时间的标准差;
(13)传感器数据集构建:利用标准化数据向量
Figure FDA0003632653880000017
构建传感器数据集Dn,其中Dn
Figure FDA0003632653880000018
所指代的所有向量组成;
步骤二:基于步骤一所构建传感器数据集,进行传感器数据集内聚类簇和簇内数据检测集,具体实现如下:
(21)传感器数据集内聚类簇构建:利用K-means算法对传感器数据集Dn进行聚类,在Dn内得到聚类簇
Figure FDA0003632653880000019
其中传感器数据集Dn的对应聚类簇个数kn依据肘部原则确定,所述肘部原则是指通过对数据集进行多次聚类以选定最佳聚类簇个数的原则;
(22)聚类簇对应的簇内数据检测集构建:依据公式
Figure FDA00036326538800000110
计算聚类簇
Figure FDA00036326538800000111
对应的簇内数据检测集
Figure FDA00036326538800000112
其中1≤i≤kn
步骤三:基于步骤二所构建传感器数据集内聚类簇和簇内数据检测集,进行异常数据识别,具体实现如下:
(31)初始聚类簇选定:在Dn内选定聚类簇
Figure FDA00036326538800000113
中的第一个聚类簇
Figure FDA00036326538800000116
设所选定聚类簇的下角标为i,其中1≤i≤kn,令i=1;
(32)基于聚类簇对应簇内数据检测集的异常向量识别:在
Figure FDA0003632653880000021
中抽取一个未被标记过的向量,应用LOF算法计算该向量的局部异常因子,并基于计算结果判断被抽取向量在
Figure FDA0003632653880000022
中是否属于异常向量,如果是,则进入第(33)步,否则进入步骤(34);
(33)标记被抽取向量为异常向量:将被抽取向量标记为异常向量,如果
Figure FDA0003632653880000023
中所有向量都已被标记,则进入步骤(35),否则返回步骤(32);
(34)标记聚类簇内所有向量为正常向量:清除对
Figure FDA0003632653880000024
中所有向量的标记,将
Figure FDA0003632653880000025
中所有向量标记为正常向量,进入步骤(35);
(35)聚类簇选定判断:若i<kn,则令i加1,返回步骤(32),否则进入步骤(36);
(36)异常采集数据标记:利用步骤(33)与步骤(34)对向量的标记,根据传感器采集数据与数据集Dn中各向量的对应关系,标记采集数据中的异常数据。
2.根据权利要求1所述的面向压制成型设备的异构多源时序数据异常识别方法,其特征在于:所述步骤中(21)中,针对传感器数据集应用肘部原则时,需要令传感器数据集的聚类簇个数从1开始,以1为步长递增,对传感器数据集进行多次聚类,并分别计算传感器数据集每次聚类的误差平方和,当传感器数据集本次聚类与前一次聚类的误差平方和的比值大于0.9时,即表明该传感器数据集对应的聚类簇个数应当选定为本次聚类设定的聚类簇个数。
3.根据权利要求1所述的面向压制成型设备的异构多源时序数据异常识别方法,其特征在于:所述步骤(21)与步骤(22)中,利用K-means算法对传感器数据集Dn进行聚类,在Dn内得到聚类簇
Figure FDA0003632653880000026
并依据公式
Figure FDA0003632653880000027
计算聚类簇
Figure FDA0003632653880000028
对应的簇内数据检测集
Figure FDA0003632653880000029
能够排除多个异常向量集中分布产生的干扰,提高异常识别的准确度。
4.根据权利要求1所述的面向压制成型设备的异构多源时序数据异常识别方法,其特征在于:所述步骤(32)与步骤(34)中,在
Figure FDA00036326538800000210
中抽取一个未被标记过的向量,应用LOF算法计算该向量的局部异常因子,如果计算结果为局部异常因子小于1.2,即可判断被抽取向量在
Figure FDA00036326538800000211
中不属于异常向量,并清除对
Figure FDA00036326538800000212
中所有向量的标记,然后将
Figure FDA00036326538800000213
中所有向量标记为正常向量;利用了同一聚类簇中向量分布集中的特性,当聚类簇中存在一个正常向量时,能判断该聚类簇中所有向量都不属于异常向量,提高异常数据识别的效率。
CN202210493426.XA 2022-05-07 2022-05-07 一种面向压制成型设备的异构多源时序数据异常识别方法 Active CN114997276B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210493426.XA CN114997276B (zh) 2022-05-07 2022-05-07 一种面向压制成型设备的异构多源时序数据异常识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210493426.XA CN114997276B (zh) 2022-05-07 2022-05-07 一种面向压制成型设备的异构多源时序数据异常识别方法

Publications (2)

Publication Number Publication Date
CN114997276A true CN114997276A (zh) 2022-09-02
CN114997276B CN114997276B (zh) 2024-05-28

Family

ID=83025325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210493426.XA Active CN114997276B (zh) 2022-05-07 2022-05-07 一种面向压制成型设备的异构多源时序数据异常识别方法

Country Status (1)

Country Link
CN (1) CN114997276B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821833A (zh) * 2023-08-29 2023-09-29 好林(威海)新材料有限公司 一种机器滤布粘连的数据异常检测方法
CN116821834A (zh) * 2023-08-29 2023-09-29 浙江北岛科技有限公司 基于内嵌传感器的真空断路器检修管理系统
CN117272198A (zh) * 2023-09-08 2023-12-22 广东美亚商旅科技有限公司 一种基于商旅行程业务数据的异常用户生成内容识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018126984A2 (zh) * 2017-01-06 2018-07-12 江南大学 一种基于mea-bp神经网络wsn异常检测方法
CN109376330A (zh) * 2018-08-27 2019-02-22 大连理工大学 一种基于扩展稀疏分量分析的非比例阻尼结构模态识别方法
WO2020038353A1 (zh) * 2018-08-21 2020-02-27 瀚思安信(北京)软件技术有限公司 异常行为检测方法及系统
CN111967509A (zh) * 2020-07-31 2020-11-20 北京赛博星通科技有限公司 一种对工业设备采集的数据进行处理和检测的方法及装置
WO2021009364A1 (fr) * 2019-07-17 2021-01-21 Electricite De France Procédé d'identification de données aberrantes dans d'un jeu de données d'entrée acquises par au moins un capteur
CN113420800A (zh) * 2021-06-11 2021-09-21 中国科学院计算机网络信息中心 一种数据异常检测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018126984A2 (zh) * 2017-01-06 2018-07-12 江南大学 一种基于mea-bp神经网络wsn异常检测方法
WO2020038353A1 (zh) * 2018-08-21 2020-02-27 瀚思安信(北京)软件技术有限公司 异常行为检测方法及系统
CN109376330A (zh) * 2018-08-27 2019-02-22 大连理工大学 一种基于扩展稀疏分量分析的非比例阻尼结构模态识别方法
WO2021009364A1 (fr) * 2019-07-17 2021-01-21 Electricite De France Procédé d'identification de données aberrantes dans d'un jeu de données d'entrée acquises par au moins un capteur
CN111967509A (zh) * 2020-07-31 2020-11-20 北京赛博星通科技有限公司 一种对工业设备采集的数据进行处理和检测的方法及装置
CN113420800A (zh) * 2021-06-11 2021-09-21 中国科学院计算机网络信息中心 一种数据异常检测方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821833A (zh) * 2023-08-29 2023-09-29 好林(威海)新材料有限公司 一种机器滤布粘连的数据异常检测方法
CN116821834A (zh) * 2023-08-29 2023-09-29 浙江北岛科技有限公司 基于内嵌传感器的真空断路器检修管理系统
CN116821833B (zh) * 2023-08-29 2023-11-14 好林(威海)新材料有限公司 一种机器滤布粘连的数据异常检测方法
CN116821834B (zh) * 2023-08-29 2023-11-24 浙江北岛科技有限公司 基于内嵌传感器的真空断路器检修管理系统
CN117272198A (zh) * 2023-09-08 2023-12-22 广东美亚商旅科技有限公司 一种基于商旅行程业务数据的异常用户生成内容识别方法
CN117272198B (zh) * 2023-09-08 2024-05-28 广东美亚商旅科技有限公司 一种基于商旅行程业务数据的异常用户生成内容识别方法

Also Published As

Publication number Publication date
CN114997276B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN114997276A (zh) 一种面向压制成型设备的异构多源时序数据异常识别方法
AU2020103923A4 (en) Fault diagnosis method and system for gear bearing based on multi-source information fusion
CN109612513B (zh) 一种面向大规模高维传感器数据的在线式异常检测方法
CN107682319A (zh) 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法
CN110895526A (zh) 一种大气监测系统中数据异常的修正方法
CN111401573B (zh) 一种工况状态建模与修正模型方法
CN104931263A (zh) 一种基于符号化概率有限状态机的轴承故障诊断方法
CN105955214B (zh) 基于样本时序和近邻相似性信息的间歇过程故障检测方法
CN107657274A (zh) 一种基于k‑means的二叉SVM‑tree不平衡数据工业故障分类方法
CN108388234A (zh) 一种基于相关性划分多变量块pca模型的故障监测方法
Zhang et al. Amplitude‐frequency images‐based ConvNet: Applications of fault detection and diagnosis in chemical processes
CN115293610A (zh) 一种基于个性化定制的配件订单生成系统
CN108760268B (zh) 一种基于信息熵的立磨运行数据阶跃故障诊断方法
Baccour et al. Experimental analysis of crisp similarity and distance measures
Chen et al. Big data analytic for multivariate fault detection and classification in semiconductor manufacturing
CN116975535A (zh) 一种基于土壤环境监测数据的多参数数据分析方法
CN116401528A (zh) 一种基于全局-局部散度的多元时间序列无监督降维方法
TWI639908B (zh) 製程偵錯與診斷方法
Yu et al. A hybrid learning-based model for on-line monitoring and diagnosis of out-of-control signals in multivariate manufacturing processes
CN115310499A (zh) 一种基于数据融合的工业设备故障诊断系统及方法
CN114548295A (zh) 基于多尺度领域自适应网络的轴承故障分类系统及方法
CN110647922B (zh) 基于公共和特有特征提取的分层式非高斯过程监测方法
CN110516750B (zh) 一种基于cart决策树的钢板板形质量异常检测方法
CN109523195B (zh) 基于样本多模态分类的分层式非高斯算法的故障检测方法
Wang et al. Generalized Out-of-Distribution Fault Diagnosis (GOOFD) via Internal Contrastive Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant