CN117290802B - 一种基于数据处理的主机电源运行监测方法 - Google Patents
一种基于数据处理的主机电源运行监测方法 Download PDFInfo
- Publication number
- CN117290802B CN117290802B CN202311587231.2A CN202311587231A CN117290802B CN 117290802 B CN117290802 B CN 117290802B CN 202311587231 A CN202311587231 A CN 202311587231A CN 117290802 B CN117290802 B CN 117290802B
- Authority
- CN
- China
- Prior art keywords
- data point
- data
- neighborhood
- abnormal
- mth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012545 processing Methods 0.000 title claims abstract description 44
- 230000002159 abnormal effect Effects 0.000 claims abstract description 101
- 230000008569 process Effects 0.000 claims abstract description 23
- 230000001105 regulatory effect Effects 0.000 claims abstract description 9
- 238000012216 screening Methods 0.000 claims abstract description 6
- 238000010606 normalization Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 230000005856 abnormality Effects 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/28—Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种基于数据处理的主机电源运行监测方法。方法包括:获取不同批次的产品加工过程中主机电源的监测数据对应的数据点;对数据点进行聚类获得各聚类簇,根据每个数据点与其邻域内数据点的数据值的差异、每个数据点所在的聚类簇内属于对应批次的产品所对应的所有数据点的数据值的差异,得到每个数据点的显著程度;根据每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异,得到每个数据点邻域内数据点的权重系数;根据权重系数和每个数据点与其邻域内数据点的距离筛选疑似异常数据点,进而判断主机电源运行是否出现异常。本发明提高了主机电源运行状态监测结果的可信度。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于数据处理的主机电源运行监测方法。
背景技术
工控主机电源状态实时监测场景中,需要通过设置在工控主机电源部分的传感器采集运行过程中的监测数据,通过对监测数据进行分析,可以有效地实现工控主机电源的运行监测,并及时预警或报警,以避免潜在的故障和安全隐患。
由于获得的工控主机电源过程中的监测数据是时序数据,其存在一定的阶段性特征,当利用KNN算法进行异常数据检测时,仅对全局异常较为敏感,但在阶段性特征上往往存在局部异常数据,主要是由于K最近邻(k-Nearest Neighbor,KNN)分类算法的异常分数是基于邻域统计计算的,不具有计算的标签权重值,局部阶段的异常往往在全局上不够明显,因此忽略了局部的异常情况,进而导致主机电源运行状态监测结果的可信度较低。
发明内容
为了解决现有方法对主机电源运行状态进行监测时存在的监测结果的可信度较低的问题,本发明的目的在于提供一种基于数据处理的主机电源运行监测方法,所采用的技术方案具体如下:
本发明提供了一种基于数据处理的主机电源运行监测方法,该方法包括以下步骤:
获取不同批次的产品加工过程中主机电源的监测数据,基于所有监测数据获取数据点;
对所有数据点进行聚类获得不少于两个聚类簇,分别对每个聚类簇中的数据点进行动态时间规整获得每个数据点对应的规整后的时刻;根据每个数据点与其邻域内数据点的数据值之间的差异、每个数据点所在的聚类簇内属于对应批次的产品所对应的所有数据点的数据值之间的差异,得到每个数据点的显著程度;
根据每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异,得到每个数据点邻域内数据点对应的权重系数;根据每个数据点邻域内数据点对应的权重系数以及每个数据点与其邻域内数据点的距离,获得每个数据点的异常置信程度;基于所述异常置信程度筛选疑似异常数据点;
基于疑似异常数据点和KNN算法,判断主机电源运行是否出现异常。
优选的,所述分别对每个聚类簇中的数据点进行动态时间规整获得每个数据点对应的规整后的时刻,包括:
对于第n个聚类簇:
将第n个聚类簇中属于同一批次的产品加工过程中对应的所有数据点按照时间先后顺序进行排序,获得每一批次在第n个聚类簇中的数据点子序列;
对所有批次在第n个聚类簇中的数据点子序列进行动态时间规整,获得第n个聚类簇中每个数据点对应的规整后的时刻。
优选的,对所有批次在第n个聚类簇中的数据点子序列进行动态时间规整,获得第n个聚类簇中每个数据点对应的规整后的时刻,包括:
将所有批次在第n个聚类簇中最长的数据点子序列记为第n个聚类簇的特征序列;
分别将所述特征序列与所有批次在第n个聚类簇中的数据点子序列中除所述特征序列外其他所有数据点子序列进行动态时间规整,获得所有批次在第n个聚类簇中的数据点子序列中除所述特征序列外其他所有数据点子序列中数据点对应的规整后的时刻;
分别将所述特征序列中每个数据点对应的原始时刻作为规整后的时刻。
优选的,采用如下公式计算第m个数据点的显著程度:
;
其中,表示第m个数据点的显著程度,/>表示第m个数据点的数据值,/>表示第m个数据点邻域内的第j个数据点的数据值,J表示第m个数据点邻域内数据点的数量,/>表示第m个数据点所在的聚类簇内属于第m个数据点对应的批次的产品所对应的所有数据点的平均数据值,/>表示取绝对值符号,/>表示最大最小值归一化函数。
优选的,所述根据每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异,得到每个数据点邻域内数据点对应的权重系数,包括:
对于第m个数据点邻域内的第j个数据点:
将第m个数据点与其邻域内的第j个数据点之间显著程度的差异记为第m个数据点邻域内的第j个数据点对应的第二差异;将第m个数据点与其邻域内的第j个数据点之间规整后的时刻的差异记为第m个数据点邻域内的第j个数据点对应的第三差异;
计算所述第三差异与预设调整参数之和的倒数,将所述第二差异与所述倒数之间的乘积的归一化结果,确定为第m个数据点邻域内的第j个数据点对应的权重系数;其中预设调整参数大于0。
优选的,所述根据每个数据点邻域内数据点对应的权重系数以及每个数据点与其邻域内数据点的距离,获得每个数据点的异常置信程度,包括:
对于第m个数据点:
分别将常数1与第m个数据点邻域内每个数据点对应的权重系数之和,作为第m个数据点邻域内每个数据点的权值;将第m个数据点邻域内每个数据点的权值和第m个数据点与其邻域内每个数据点的欧式距离之间的乘积,作为第m个数据点邻域内每个数据点的特征指标;
将第m个数据点邻域内所有数据点的特征指标的和值的归一化结果,确定为第m个数据点的异常置信程度。
优选的,所述基于所述异常置信程度筛选疑似异常数据点,包括:
将异常置信程度大于异常置信程度阈值的数据点,确定为疑似异常数据点。
优选的,所述基于疑似异常数据点和KNN算法,判断主机电源运行是否出现异常,包括:
将每个疑似异常数据点输入到KNN算法模型中,获得每个疑似异常数据点的异常分数值;
统计异常分数值大于异常得分阈值的疑似异常数据点的总数量;基于所述总数量判断主机电源运行是否出现异常。
优选的,基于所述总数量判断主机电源运行是否出现异常,包括:
若所述总数量大于数量阈值,则判定主机电源运行出现异常;
若所述总数量小于或等于数量阈值,则判定主机电源运行正常。
优选的,所述基于所有监测数据获取数据点,包括:
对于第k个批次:将第k个批次的产品加工过程中主机电源的监测数据按照时间先后顺序进行排序,获得第k个批次的监测数据序列;
将每个批次的监测数据序列中每个监测数据对应的索引作为坐标系中的横坐标,将每个批次的监测数据序列中每个监测数据对应的数据值作为坐标系中的纵坐标,获得各数据点。
本发明至少具有如下有益效果:
本发明首先基于不同批次的产品加工过程中主机电源的监测数据获得了多个数据点,对所有数据点进行聚类获得多个聚类簇,根据每个数据点与其邻域内数据点的数据值之间的差异、每个数据点所在的聚类簇内属于对应批次的产品所对应的所有数据点的数据值之间的差异,对每个数据点的显著程度进行评价,然后结合每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异,得到了每个数据点邻域内数据点对应的权重系数,进而确定了每个数据点的异常置信程度,实现了对邻域异常分数的方向限制性调整,使得局部异常点的异常状况在样本点检测全局上更具有显著性,异常置信程度越大,说明对应数据点越可能为异常数据点,本发明首先基于异常置信程度从所有数据点中筛选了疑似异常数据点,然后结合KNN算法对疑似异常数据点再次分析,进而对主机电源运行状态进行了判断,实现对主机电源运行状态的监测,提高了主机电源运行状态监测结果的可信度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明实施例所提供的一种基于数据处理的主机电源运行监测方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于数据处理的主机电源运行监测方法进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于数据处理的主机电源运行监测方法的具体方案。
一种基于数据处理的主机电源运行监测方法实施例:
本实施例所针对的具体场景为:在产品生产加工过程中,往往需要对工控主机的运行状况进行监测,一旦主机运行异常则需要及时停机检修,避免造成不可逆转的损伤,本实施例将采集不同批次的产品加工过程中主机电源的监测数据,对采集到的监测数据的变化其情况进行分析,判断主机电源运行是否出现异常,若主机电源运行出现异常,则进行预警,及时停机检修。
本实施例提出了一种基于数据处理的主机电源运行监测方法,如图1所示,本实施例的一种基于数据处理的主机电源运行监测方法包括以下步骤:
步骤S1,获取不同批次的产品加工过程中主机电源的监测数据,基于所有监测数据获取数据点。
本实施例首先在工控主机电源的合适位置处设置相应的传感器,用于采集工控主机运行过程中电源的监测数据,监测数据可以是电流数据,可以是温度数据,也可以是其他种类的数据,本实施例中以电流数据为例进行说明,对于其他种类的监测数据均可采用本实施例提供的方法进行处理。采集多个批次的产品加工过程中主机电源的监测数据,本实施例中设置每一秒采集一次监测数据,在具体应用中,实施者可根据具体情况进行设置;本实施例采集了最近五个批次的产品加工过程中主机电源在每个采集时刻的监测数据。需要说明的是:采集的多个批次的产品加工过程中主机电源的监测数据均为同一主机电源的监测数据,由于不同批次生产的产品的数量可能不同,因此不同批次的产品的总加工时长可能不同,也即采集到的不同批次的产品加工过程中主机电源的监测数据的数量可能不同。
本实施例获取了每个批次的产品加工过程中主机电源在每个采集时刻的监测数据,接下来对于第k个批次:将第k个批次的产品加工过程中主机电源的监测数据按照时间先后顺序进行排序,获得第k个批次的监测数据序列。采用该方法,能够获得每个批次的监测数据序列。将每个批次的监测数据序列中每个监测数据对应的索引作为坐标系中的横坐标,将每个批次的监测数据序列中每个监测数据对应的数据值作为坐标系中的纵坐标,获得多个数据点;需要说明的是:本实施例将所有批次的产品加工过程中主机电源的监测数据均映射到了同一个坐标系中获得了多个数据点,后续将对给坐标系中的所有数据点进行聚类。
步骤S2,对所有数据点进行聚类获得不少于两个聚类簇,分别对每个聚类簇中的数据点进行动态时间规整获得每个数据点对应的规整后的时刻;根据每个数据点与其邻域内数据点的数据值之间的差异、每个数据点所在的聚类簇内属于对应批次的产品所对应的所有数据点的数据值之间的差异,得到每个数据点的显著程度。
利用KNN算法对采集到的工控主机电源监测数据进行异常数据检测时,其仅对全局异常较为敏感,但在阶段性特征上,往往存在局部异常数据,其主要是由于KNN算法的异常分数是基于邻域统计计算的,不具有计算的标签权重值,其局部阶段的异常往往在全局上不够明显,因此难以实现对于局部的异常情况的提取。本实施例通过分析时序数据单一采样周期上的数据点邻域显著程度,再进一步将多个采样数据规整到同一个样本空间中,以数据点的显著程度作为其样本空间上的距离权值,实现对于邻域异常分数的方向限制性调整,使得局部异常点的异常状况在样本点检测全局上更加具有显著性,从而提取出准确的异常数据,实现对于工控主机电源运行状态的实时监测。
本实施例首先采用层次聚类算法对坐标系中的所有数据点进行聚类,获得多个聚类簇,同一个聚类簇内的数据点表现的特征较为接近,不同聚类簇内的数据点表现的特征差异较大。层次聚类算法为现有技术,此处不再过多赘述。
对于第n个聚类簇:将第n个聚类簇中属于同一批次的产品加工过程中对应的所有数据点按照时间先后顺序进行排序,获得每一批次在第n个聚类簇中的数据点子序列;将所有批次在第n个聚类簇中最长的数据点子序列记为第n个聚类簇的特征序列;分别将所述特征序列与所有批次在第n个聚类簇中的数据点子序列中除所述特征序列外其他所有数据点子序列进行动态时间规整,获得所有批次在第n个聚类簇中的数据点子序列中除所述特征序列外其他所有数据点子序列中数据点对应的规整后的时刻;分别将所述特征序列中每个数据点对应的原始时刻作为规整后的时刻。采用上述方法,能够获得每个聚类内所有数据点对应的规整后的时刻。动态时间规整算法为现有技术,此处不再过多赘述。
工控主机电源监测数据会随着工控主机的运行状态的变化而产生轻微的变化,工控主机电源瞬时异常状况往往存在较大的突变特征,其突变特征是与监测数据的阶段性特征相关联的,本实施例将根据每个数据点与其邻域内数据点的数据值之间的差异、每个数据点所在的聚类簇内属于对应批次的产品所对应的所有数据点的数据值之间的差异,得到每个数据点的显著程度。第m个数据点的显著程度的具体计算公式为:
;
其中,表示第m个数据点的显著程度,/>表示第m个数据点的数据值,/>表示第m个数据点邻域内的第j个数据点的数据值,J表示第m个数据点邻域内数据点的数量,/>表示第m个数据点所在的聚类簇内属于第m个数据点对应的批次的产品所对应的所有数据点的平均数据值,/>表示取绝对值符号,/>表示最大最小值归一化函数。
表示第m个数据点与其邻域内的第j个数据点的数据值的差异,/>表示第m个数据点与其所在的聚类簇内属于第m个数据点对应的批次的产品所对应的所有数据点的平均数据值之间的差异;当第m个数据点与其邻域内数据点的数据值的差异越大、且第m个数据点与其所在的聚类簇内属于第m个数据点对应的批次的产品所对应的所有数据点的平均数据值之间的差异也越大时,说明第m个数据点与周围数据点数据值之间的差异越大,即第m个数据点的显著程度越大。本实施例中对于任一数据点,其邻域为以该数据点为窗口中心,构建大小为5*5的窗口,将该窗口内除窗口中心位置外的其它所有区域作为该数据点的邻域,在具体应用中,实施者可根据具体情况设置邻域的大小。
采用上述方法,能够获得每个数据点的显著程度,便于后续对样本空间内的数据内数据点的显著程度的特征分析,并构建出权重系数,实现对数据点邻域异常分数区分度的调整。
步骤S3,根据每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异,得到每个数据点邻域内数据点对应的权重系数;根据每个数据点邻域内数据点对应的权重系数以及每个数据点与其邻域内数据点的距离,获得每个数据点的异常置信程度;基于所述异常置信程度筛选疑似异常数据点。
不同批次的产品加工时长可能不同,因此需要进行样本空间上的规整构建,并根据其数据点的样本空间上的邻域数据点的显著程度分布特征,获得每个数据点邻域内数据点对应的权重系数。
对于任一数据点:在对该数据点所在的样本空间上的邻域求取邻域异常分数时,该数据点与其邻域数据点的时间轴跨度越小,且对应的显著程度差异越大,说明该数据点在由多个时序监测数据构成的样本空间上的异常在多个时序监测数据上呈现不相同的趋势,其表现的异常状况的显著程度越大,则其对应的邻域异常分数的权重系数就越大,使得该数据点的邻域异常分数更大,便于后续的异常数据提取。本实施例将根据每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异。
具体地,对于第m个数据点邻域内的第j个数据点:
将第m个数据点与其邻域内的第j个数据点之间显著程度的差异记为第m个数据点邻域内的第j个数据点对应的第二差异;将第m个数据点与其邻域内的第j个数据点之间规整后的时刻的差异记为第m个数据点邻域内的第j个数据点对应的第三差异;计算所述第三差异与预设调整参数之和的倒数,将所述第二差异与所述倒数之间的乘积的归一化结果,确定为第m个数据点邻域内的第j个数据点对应的权重系数,其中预设调整参数大于0。第m个数据点邻域内的第j个数据点对应的权重系数的具体计算公式为:
;
其中,表示第m个数据点邻域内的第j个数据点对应的权重系数,/>表示第m个数据点的显著程度,/>表示第m个数据点邻域内的第j个数据点的显著程度,/>表示第m个数据点对应的规整后的时刻,/>表示第m个数据点邻域内的第j个数据点对应的规整后的时刻,/>表示预设调整参数,simgoid( )表示归一化函数。
表示第m个数据点邻域内的第j个数据点对应的第二差异,/>表示第m个数据点邻域内的第j个数据点对应的第三差异;权重系数的计算公式中引入预设调整参数是为了防止分母为0,本实施例中预设调整参数为0.01,在具体应用中,实施者可根据具体情况进行设置。权重系数是与第m个数据点与其邻域数据点的时间轴跨度以及显著程度差异相关联的,其表征的是在动态规整的时序数据上显著程度的差异性大小。当第m个数据点与其邻域内的第j个数据点之间显著程度的差异越大、第m个数据点与其邻域内的第j个数据点之间规整后的时刻的差异越小时,第m个数据点邻域内的第j个数据点对应的权重系数越大。
采用上述方法,能够获得每个数据点邻域内的每个数据点对应的权重系数,接下来本实施例将根据每个数据点邻域内数据点对应的权重系数以及每个数据点与其邻域内数据点的距离,获得每个数据点的异常置信程度。
具体地,对于第m个数据点:
分别将常数1与第m个数据点邻域内每个数据点对应的权重系数之和,作为第m个数据点邻域内每个数据点的权值;将第m个数据点邻域内每个数据点的权值和第m个数据点与其邻域内每个数据点的欧式距离之间的乘积,作为第m个数据点邻域内每个数据点的特征指标;将第m个数据点邻域内所有数据点的特征指标的和值的归一化结果,确定为第m个数据点的异常置信程度。第m个数据点的异常置信程度的具体计算公式为:
;
其中,表示第m个数据点的异常置信程度,J表示第m个数据点邻域内数据点的数量,/>表示第m个数据点邻域内的第j个数据点对应的权重系数,/>表示第m个数据点与其邻域内每个数据点的欧式距离,/>表示最大最小值归一化函数。
表示第m个数据点邻域内的第j个数据点的权值,/>表示第m个数据点邻域内的第j个数据点的特征指标。
采用上述方法,能够获得每个数据点的异常置信程度,将异常置信程度大于异常置信程度阈值的数据点,确定为疑似异常数据点。本实施例中异常置信程度阈值为0.92,在具体应用中,实施者可根据具体情况进行设置。
步骤S4,基于疑似异常数据点和KNN算法,判断主机电源运行是否出现异常。
本实施例在步骤S3中基于猛数据点的异常置信程度从所有数据点中筛选出了疑似异常数据点,疑似异常数据点为异常数据点的可能性较大,因此本实施例接下来将对疑似异常数据点进行再次判断。
具体地,将每个疑似异常数据点输入到KNN算法模型中,根据邻域数据点的异常程度累积获得每个疑似异常数据点的异常分数值;KNN算法模型为现有模型,此处不再过多赘述。统计异常分数值大于异常得分阈值的疑似异常数据点的总数量;本实施例中异常得分阈值为0.85,在具体应用中,实施者可根据具体情况进行设置。异常分数值大于异常得分阈值的疑似异常数据点的总数量越多,说明主机运行状态越可能出现看异常,因此若所述总数量大于数量阈值,则判定主机电源运行出现异常,及时给予预警,提醒工作人员进行停机检修;若所述总数量小于或等于数量阈值,则判定主机电源运行正常。本实施例中的数量阈值为所有数据点的数量的5%,在具体应用中,实施者可根据具体情况进行设置。
至此,采用本实施例提供的方法完成了对主机电源运行状态的监测。
本实施例首先基于不同批次的产品加工过程中主机电源的监测数据获得了多个数据点,对所有数据点进行聚类获得多个聚类簇,根据每个数据点与其邻域内数据点的数据值之间的差异、每个数据点所在的聚类簇内属于对应批次的产品所对应的所有数据点的数据值之间的差异,对每个数据点的显著程度进行评价,然后结合每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异,得到了每个数据点邻域内数据点对应的权重系数,进而确定了每个数据点的异常置信程度,实现了对邻域异常分数的方向限制性调整,使得局部异常点的异常状况在样本点检测全局上更具有显著性,异常置信程度越大,说明对应数据点越可能为异常数据点,本实施例首先基于异常置信程度从所有数据点中筛选了疑似异常数据点,然后结合KNN算法对疑似异常数据点再次分析,进而对主机电源运行状态进行了判断,实现对主机电源运行状态的监测,提高了主机电源运行状态监测结果的可信度。
需要说明的是:以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于数据处理的主机电源运行监测方法,其特征在于,该方法包括以下步骤:
获取不同批次的产品加工过程中主机电源的监测数据,基于所有监测数据获取数据点;
对所有数据点进行聚类获得不少于两个聚类簇,分别对每个聚类簇中的数据点进行动态时间规整获得每个数据点对应的规整后的时刻;根据每个数据点与其邻域内数据点的数据值之间的差异、每个数据点所在的聚类簇内属于对应批次的产品所对应的所有数据点的数据值之间的差异,得到每个数据点的显著程度;
根据每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异,得到每个数据点邻域内数据点对应的权重系数;根据每个数据点邻域内数据点对应的权重系数以及每个数据点与其邻域内数据点的距离,获得每个数据点的异常置信程度;基于所述异常置信程度筛选疑似异常数据点;
基于疑似异常数据点和KNN算法,判断主机电源运行是否出现异常;
采用如下公式计算第m个数据点的显著程度:
;
其中,表示第m个数据点的显著程度,/>表示第m个数据点的数据值,/>表示第m个数据点邻域内的第j个数据点的数据值,J表示第m个数据点邻域内数据点的数量,/>表示第m个数据点所在的聚类簇内属于第m个数据点对应的批次的产品所对应的所有数据点的平均数据值,/>表示取绝对值符号,/>表示最大最小值归一化函数;
所述根据每个数据点与其邻域内数据点之间显著程度的差异和规整后的时刻的差异,得到每个数据点邻域内数据点对应的权重系数,包括:
对于第m个数据点邻域内的第j个数据点:
将第m个数据点与其邻域内的第j个数据点之间显著程度的差异记为第m个数据点邻域内的第j个数据点对应的第二差异;将第m个数据点与其邻域内的第j个数据点之间规整后的时刻的差异记为第m个数据点邻域内的第j个数据点对应的第三差异;
计算所述第三差异与预设调整参数之和的倒数,将所述第二差异与所述倒数之间的乘积的归一化结果,确定为第m个数据点邻域内的第j个数据点对应的权重系数;其中预设调整参数大于0。
2.根据权利要求1所述的一种基于数据处理的主机电源运行监测方法,其特征在于,所述分别对每个聚类簇中的数据点进行动态时间规整获得每个数据点对应的规整后的时刻,包括:
对于第n个聚类簇:
将第n个聚类簇中属于同一批次的产品加工过程中对应的所有数据点按照时间先后顺序进行排序,获得每一批次在第n个聚类簇中的数据点子序列;
对所有批次在第n个聚类簇中的数据点子序列进行动态时间规整,获得第n个聚类簇中每个数据点对应的规整后的时刻。
3.根据权利要求2所述的一种基于数据处理的主机电源运行监测方法,其特征在于,对所有批次在第n个聚类簇中的数据点子序列进行动态时间规整,获得第n个聚类簇中每个数据点对应的规整后的时刻,包括:
将所有批次在第n个聚类簇中最长的数据点子序列记为第n个聚类簇的特征序列;
分别将所述特征序列与所有批次在第n个聚类簇中的数据点子序列中除所述特征序列外其他所有数据点子序列进行动态时间规整,获得所有批次在第n个聚类簇中的数据点子序列中除所述特征序列外其他所有数据点子序列中数据点对应的规整后的时刻;
分别将所述特征序列中每个数据点对应的原始时刻作为规整后的时刻。
4.根据权利要求1所述的一种基于数据处理的主机电源运行监测方法,其特征在于,所述根据每个数据点邻域内数据点对应的权重系数以及每个数据点与其邻域内数据点的距离,获得每个数据点的异常置信程度,包括:
对于第m个数据点:
分别将常数1与第m个数据点邻域内每个数据点对应的权重系数之和,作为第m个数据点邻域内每个数据点的权值;将第m个数据点邻域内每个数据点的权值和第m个数据点与其邻域内每个数据点的欧式距离之间的乘积,作为第m个数据点邻域内每个数据点的特征指标;
将第m个数据点邻域内所有数据点的特征指标的和值的归一化结果,确定为第m个数据点的异常置信程度。
5.根据权利要求1所述的一种基于数据处理的主机电源运行监测方法,其特征在于,所述基于所述异常置信程度筛选疑似异常数据点,包括:
将异常置信程度大于异常置信程度阈值的数据点,确定为疑似异常数据点。
6.根据权利要求1所述的一种基于数据处理的主机电源运行监测方法,其特征在于,所述基于疑似异常数据点和KNN算法,判断主机电源运行是否出现异常,包括:
将每个疑似异常数据点输入到KNN算法模型中,获得每个疑似异常数据点的异常分数值;
统计异常分数值大于异常得分阈值的疑似异常数据点的总数量;基于所述总数量判断主机电源运行是否出现异常。
7.根据权利要求6所述的一种基于数据处理的主机电源运行监测方法,其特征在于,基于所述总数量判断主机电源运行是否出现异常,包括:
若所述总数量大于数量阈值,则判定主机电源运行出现异常;
若所述总数量小于或等于数量阈值,则判定主机电源运行正常。
8.根据权利要求1所述的一种基于数据处理的主机电源运行监测方法,其特征在于,所述基于所有监测数据获取数据点,包括:
对于第k个批次:将第k个批次的产品加工过程中主机电源的监测数据按照时间先后顺序进行排序,获得第k个批次的监测数据序列;
将每个批次的监测数据序列中每个监测数据对应的索引作为坐标系中的横坐标,将每个批次的监测数据序列中每个监测数据对应的数据值作为坐标系中的纵坐标,获得各数据点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311587231.2A CN117290802B (zh) | 2023-11-27 | 2023-11-27 | 一种基于数据处理的主机电源运行监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311587231.2A CN117290802B (zh) | 2023-11-27 | 2023-11-27 | 一种基于数据处理的主机电源运行监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117290802A CN117290802A (zh) | 2023-12-26 |
CN117290802B true CN117290802B (zh) | 2024-03-26 |
Family
ID=89244806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311587231.2A Active CN117290802B (zh) | 2023-11-27 | 2023-11-27 | 一种基于数据处理的主机电源运行监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117290802B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556279B (zh) * | 2024-01-12 | 2024-04-09 | 江苏雷博微电子设备有限公司 | 基于电参数分析的匀胶显影机运行状态监测方法及系统 |
CN117668844B (zh) * | 2024-01-30 | 2024-05-28 | 浙江御安信息技术有限公司 | 基于信息安全的威胁文件检测系统 |
CN117992870B (zh) * | 2024-04-03 | 2024-06-25 | 山东铁鹰建设工程有限公司 | 一种用于智能化衬砌台车的偏压预警方法 |
CN117992808B (zh) * | 2024-04-03 | 2024-05-31 | 深圳大学 | 一种基于大数据的计算机网络管理方法及系统 |
CN118051801B (zh) * | 2024-04-16 | 2024-07-19 | 山东东阿古胶阿胶系列产品有限公司 | 一种速溶阿胶粉加工过程监测数据智能分析方法 |
CN118468063B (zh) * | 2024-05-20 | 2024-10-29 | 深圳市优力创科新能源有限公司 | 一种ups不间断电源状态监测及预警系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107808209A (zh) * | 2017-09-11 | 2018-03-16 | 重庆大学 | 基于加权kNN距离的风电场异常数据辨识方法 |
EP3364157A1 (en) * | 2017-02-16 | 2018-08-22 | Fundación Tecnalia Research & Innovation | Method and system of outlier detection in energy metering data |
CN109683594A (zh) * | 2019-01-11 | 2019-04-26 | 河南工学院 | 一种异常变量精确识别与定位方法 |
CN110045714A (zh) * | 2019-04-08 | 2019-07-23 | 沈阳化工大学 | 一种基于权重近邻规则的工业过程监控方法 |
CN110400231A (zh) * | 2019-06-06 | 2019-11-01 | 湖南大学 | 一种加权非线性贝叶斯的电能计量设备失效率预估方法 |
CN112381181A (zh) * | 2020-12-11 | 2021-02-19 | 桂林电子科技大学 | 一种建筑能耗异常的动态检测方法 |
CN114004285A (zh) * | 2021-10-15 | 2022-02-01 | 南京工程学院 | 一种基于改进kNN算法的非侵入式负荷辨识方法 |
CN115511002A (zh) * | 2022-10-19 | 2022-12-23 | 北京信息科技大学 | 一种电力缺失数据补全方法 |
CN116028815A (zh) * | 2023-01-05 | 2023-04-28 | 江苏科技大学 | 一种针对工业时序不平衡数据的时间序列数据增强方法 |
CN116502112A (zh) * | 2023-06-29 | 2023-07-28 | 深圳市联明电源有限公司 | 一种新能源电源测试数据管理方法及系统 |
CN116936978A (zh) * | 2023-09-19 | 2023-10-24 | 广州杉和信息科技有限公司 | 一种蓄电池鼓包智能化监测方法及系统 |
CN116931703A (zh) * | 2023-09-18 | 2023-10-24 | 惠州市鑫晖源科技有限公司 | 基于数据分析的电竞主机电源电压调整方法 |
-
2023
- 2023-11-27 CN CN202311587231.2A patent/CN117290802B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3364157A1 (en) * | 2017-02-16 | 2018-08-22 | Fundación Tecnalia Research & Innovation | Method and system of outlier detection in energy metering data |
CN107808209A (zh) * | 2017-09-11 | 2018-03-16 | 重庆大学 | 基于加权kNN距离的风电场异常数据辨识方法 |
CN109683594A (zh) * | 2019-01-11 | 2019-04-26 | 河南工学院 | 一种异常变量精确识别与定位方法 |
CN110045714A (zh) * | 2019-04-08 | 2019-07-23 | 沈阳化工大学 | 一种基于权重近邻规则的工业过程监控方法 |
CN110400231A (zh) * | 2019-06-06 | 2019-11-01 | 湖南大学 | 一种加权非线性贝叶斯的电能计量设备失效率预估方法 |
CN112381181A (zh) * | 2020-12-11 | 2021-02-19 | 桂林电子科技大学 | 一种建筑能耗异常的动态检测方法 |
CN114004285A (zh) * | 2021-10-15 | 2022-02-01 | 南京工程学院 | 一种基于改进kNN算法的非侵入式负荷辨识方法 |
CN115511002A (zh) * | 2022-10-19 | 2022-12-23 | 北京信息科技大学 | 一种电力缺失数据补全方法 |
CN116028815A (zh) * | 2023-01-05 | 2023-04-28 | 江苏科技大学 | 一种针对工业时序不平衡数据的时间序列数据增强方法 |
CN116502112A (zh) * | 2023-06-29 | 2023-07-28 | 深圳市联明电源有限公司 | 一种新能源电源测试数据管理方法及系统 |
CN116931703A (zh) * | 2023-09-18 | 2023-10-24 | 惠州市鑫晖源科技有限公司 | 基于数据分析的电竞主机电源电压调整方法 |
CN116936978A (zh) * | 2023-09-19 | 2023-10-24 | 广州杉和信息科技有限公司 | 一种蓄电池鼓包智能化监测方法及系统 |
Non-Patent Citations (1)
Title |
---|
一种基于加权KNN的大数据集下离群检测算法;王茜;杨正宽;;计算机科学(第10期);第1-4页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117290802A (zh) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117290802B (zh) | 一种基于数据处理的主机电源运行监测方法 | |
WO2011043108A1 (ja) | 設備状態監視方法、監視システム及び監視プログラム | |
CN110895526A (zh) | 一种大气监测系统中数据异常的修正方法 | |
CN112179691B (zh) | 基于对抗学习策略的机械装备运行状态异常检测系统和方法 | |
WO2011125130A1 (ja) | プラントの診断装置、診断方法、及び診断プログラム | |
CN107067100B (zh) | 风电功率异常数据辨识方法及辨识装置 | |
US20220027230A1 (en) | Predicting Equipment Fail Mode from Process Trace | |
CN116756595B (zh) | 一种导电滑环故障数据采集监测方法 | |
CN108956111B (zh) | 一种机械部件的异常状态检测方法及检测系统 | |
CN117312997B (zh) | 一种电力管理系统智能诊断方法及系统 | |
CN117289778B (zh) | 一种工控主机电源健康状态的实时监测方法 | |
CN117171604B (zh) | 基于传感器的保温板生产线异常监测系统 | |
CN111931834B (zh) | 基于孤立森林算法的铝型材挤压过程流数据异常检测方法、设备及存储介质 | |
CN115496644A (zh) | 基于数据识别的固体废弃物处理设备监测方法 | |
CN110378371B (zh) | 一种基于平均近邻距离异常因子的能耗异常检测方法 | |
US11782426B2 (en) | Abnormality score calculation apparatus, method, and medium | |
CN115858794B (zh) | 用于网络运行安全监测的异常日志数据识别方法 | |
CN113866455A (zh) | 基于深度学习的桥梁加速度监测数据异常检测方法、系统和装置 | |
CN117762913A (zh) | 一种海上风电异常功率数据自动识别方法及系统 | |
CN112949735A (zh) | 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法 | |
CN117556364B (zh) | 一种矿用矿压安全智能监测系统 | |
CN117493816A (zh) | 一种基于大数据的空气监测预警方法及系统 | |
US11609836B2 (en) | Operation method and operation device of failure detection and classification model | |
CN113408383A (zh) | 基于有界β(g,h)分布和MWKPCA的可听噪声无效数据判定方法 | |
CN116341993B (zh) | 一种用于聚苯乙烯生产过程中状态监测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |