CN114280352B - 一种基于电流的大仪工时计算方法 - Google Patents

一种基于电流的大仪工时计算方法 Download PDF

Info

Publication number
CN114280352B
CN114280352B CN202111611235.0A CN202111611235A CN114280352B CN 114280352 B CN114280352 B CN 114280352B CN 202111611235 A CN202111611235 A CN 202111611235A CN 114280352 B CN114280352 B CN 114280352B
Authority
CN
China
Prior art keywords
current
data
sample
large instrument
instrument
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111611235.0A
Other languages
English (en)
Other versions
CN114280352A (zh
Inventor
陈科明
刘剑
张百军
吴文楷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202111611235.0A priority Critical patent/CN114280352B/zh
Publication of CN114280352A publication Critical patent/CN114280352A/zh
Application granted granted Critical
Publication of CN114280352B publication Critical patent/CN114280352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于电流的大仪工时计算方法。本发明首先采集各个大仪的电流数据,将电流数据按照算法处理后生成样本集,再采用改进的聚类算法进行聚类,按照评价系数找到最佳的聚类结果,得到最终的簇。若簇个数等于2,则认为对应大仪只有关机态和工作态,没有待机态,这类仪器往往是示波器或信号分析仪一类;若簇大于2,则认为当前仪器存在关机态、待机态和工作态。通过簇与大仪状态的关系对应,即可计算出仪器的工作时长。后续采集数据仅需要变换成样本集后,计算每个样本与所有簇的相似度,取其中最高相似度的簇代表该样本的状态,从而实现快速计算工时目的。

Description

一种基于电流的大仪工时计算方法
技术领域
本发明涉及数据分析领域,具体而言,本发明涉及一种基于电流的大仪工时计算方法。
背景技术
作为科研的重要基础,高校企业对于大仪设备的需求逐年提升,我国每年投入大量资源以满足国内科研需要。然而,目前我国对于大仪设备的管理相较于国外还停留在一个比较落后的阶段,存在较多为问题。比如,大仪工时难以统计,统计大仪工时的工作往往通过人工的方式解决,人工记录存在漏记、误记、甚至无记录的情况;大仪搬动缺乏详细信息,导致后续使用者想要使用时找不到仪器;许多大仪无法达到年机时800小时的标准,大仪长时间闲置导致资源的浪费。想要提高大仪的管理服务水平,最主要的是需要解决大仪工时情况不明的问题。
电流分析属于信号分析的范畴,故信号分析的部分方法也可以用于当前场景。中国专利申请《一种基于仪器电流数据的大数据分析方法》(申请号:201910456282.9)公开了一种仪器状态检测的方法,通过支持向量机(SVM)模型构建仪器的电流和状态的对应关系,实现对仪器状态的检测。该方法需要事先得到仪器不同状态下的电流数据,然后人工为样本打上标签后再对模型进行训练,利用训练后的模型对电流进行识别。但面对海量大仪,每台都进行人工标注、训练、拟合,工业成本太高。利用傅里叶变换以及小波分析对将电流数据转换到频域分析也是一种方法,如将大仪工作时的特征主频存入识别库进行别、检测大仪从其它状态切换到工作状态时的频率变化等,但是这类方法也都需要人工参与,难以落地。计算阈值也是一种方法,阈值通过聚类或者其它算法给出,主要思想是利用电流值与阈值的比较来判断大仪的状态。这种方法忽视了每个状态在时间上的连续性,阈值较难确定,且对不同状态下电流存在重叠的大仪不够友好。对电流进行分箱也是一种处理方法,但是分箱后也会存在数据太杂,且分箱并没有一个通用的标准,只能通过人工界定。
发明内容
本发明的目的是提供一种方法,根据现场采集的大仪电流数据,通过对电流数据进行预变换处理后利用改进的聚类算法对数据进行聚类,并对聚类结果进行处理,从而得到出大仪的工作时长。
为实现上述目的,本发明采用以下技术方案:一种基于电流的大仪工时计算方法,借助仪器管理系统实现。所述仪器管理系统包括管理平台以及用于采集电流数据的终端,终端按照一定频率采集仪器的电流数据并向管理平台上报,管理平台用于汇总并展示仪器信息,如仪器编号、地址、负责人等,以及指定时间内的仪器电流数据。所述方法包含以下步骤:
A、数据集建立步骤:
A-1、从仪器管理系统中获取某台大仪的电流数据,所述电流数据包括关机电流、待机电流、工作电流。
A-2、对A-1中获取的电流数据进行处理,将电流数据转换成一定结构的数据集。
B、数据分析步骤:
B-1、对A-2中获取的数据集进行特征变换,将数据集转换为样本集。
B-2、对B-1中获取的样本集按照改进的聚类算法进行聚类,得到多个聚类结果,每个聚类结果对应一个簇。
B-3、根据聚类结果评价系数并找到最佳聚类数。
C、工时计算步骤
C-1、对B-3所得簇与大仪的状态之间做如下映射:电流均值最小的簇对应大仪关机态、电流值均值次小的簇对应大仪待机态、其余簇对应大仪的工作态。若B-3所得簇个数为2,那么做如下映射:电流均值较小的簇对应大仪关机态、电流均值大的簇对应大仪工作态。最后将对应的簇存储到云端。
C-2、再次获取到大仪的电流数据时,仅需要通过将数据转换为样本集,再计算每个样本与每个簇的距离,每个样本与距离最近的簇代表的状态相同。此时,可以快速计算出大仪的工作时长。
在本发明中,首先获取到对应大仪的电流数据,所述电流数据包含了大仪的所有状态。将电流数据进行预处理以及变换后生成样本集,再采用改进的聚类算法对电流数据进行聚类,利用簇评价系数得到最佳的聚类结果,得到最终的簇。若簇个数小于2,则认为此次数据不完整,对应大仪下次再做分析;若簇个数等于2,则认为大仪只有关机态和工作态,没有待机态,这类仪器往往是示波器或分析仪一类;若簇个数大于2,则认为当前仪器存在关机态、待机态和工作态。后续再次分析电流数据时,仅需将数据集转换为样本集,计算每个样本的归属簇,即可快速得到每个样本对应的大仪状态,相比阈值法划分大仪的状态的容错性更强,也能兼容更多种类型的大仪。
本发明的有益效果:本发明可以在不确定大仪是否存在待机状态的情况下,也能通过对簇的分析找到大仪的工作电流数据,得到大仪的工作时长。将每台大仪的状态对应的簇记录至数据库中,后续统计机时无需算法介入,直接对比数据库中的簇即可,解决了仪器工时不清晰,不准确的问题,具有一定的工程价值。
附图说明
图1是整体方法流程图。
图2是数据集处理流程图。
图3是簇生成流程图。
图4是大仪工时分析流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚明白,接下来结合附图和实例进行进一步的详细说明,下文中出现对电流大小的描述单位都为(A)安培。
本发明的实现建立在仪器管理系统收集的大量电流数据之上,考虑到仪器在不同状态下电流值具有随机波动的特性,且不同仪器的电流数据不同。因此所述方法如图1所示,具体流程如下:
A、数据集建立步骤:
A-1、电流数据获取步骤。
A-2、数据集生成步骤。
步骤A-1中,电流数据由仪器管理系统给出,为了保证数据充分,电流数据的时间跨度为1个月。
步骤A-2流程如图2所示。首先,根据A-1中获取的电流数据,将电流数据中出现的所有电流值存储到候选集C中,并对候选集C按照电流值大小进行排序。
实施例:假设电流数据S={0.02,0.01,0.02,0.02,0.01,0.02,0.02,0.24,0.22,0.23,0.24,0.24,0.25,0.24,0.24},经上述A-2的处理之后,参考电流数据集C={0.01,0.02,0.22,0.23,0.24,0.25}。
其次,在C中按照电流数据精度为步长,找到每段连续数值中的最大值作为上限值,将这些上限值记为上限集H。若H的大小为1,则说明数据不够充分,该大仪不进行后续动作。在实施例中,H={0.02,0.25}。
最后,将电流数据变换为数据集N。具体实施过程为,取C中最小值记为下限值l,从大到小依次从H中获取上限值h。对于每次取出的l,h都需要遍历一遍电流数据,将所有电流值在此上下限范围中且未访问过的所有索引记录下来。对这些索引进行连续性检查,若存在一段连续索引的长度大于R,则将这段索引序列存储到N中并全部标记为访问。重复上述过程,直到H中所有上限值都使用完毕。
B、数据分析,主要包括以下三个步骤完成。
B-1、建立样本集步骤。
B-2、利用改进的聚类算法聚类步骤。
B-3、根据聚类评价找到最佳聚类结果步骤
步骤B-1主要是将步骤A-2中获取的数据集转换成样本集,便于聚类过程的实现。数据集中的每个数据为一段连续的索引序列,首先将该序列转换成对应的电流值形成电流序列;其次计算电流序列的均值与标准差,将这两个值作为样本的特征;最后,对所有样本的特征进行归一化处理,得到最终的样本集T,形式如下。
T={t0,t1,t2,…tn}
其中t为具体样本,t的具体形式如下。
t=[mean,var]
其中mean代表均值,var代表方差。
特征标准化采用最大最小归一化的方式处理,主要是为了避免不同特征差距过大从而导致某些特征在计算过程中的占比过重。最大最小归一化的公式如下。
其中,xmin代表所有样本中该特征的最小值,xmax代表所有样本中该特征的最大值。
步骤B-2是对B-1中生成的样本集进行聚类,聚类算法种类众多,但核心的关键在于定义每个样本间的相似度以及超参的选取。在这里,选择Kmeans算法作为聚类的基本思想,样本相似度d(i,j)定义如下。
其中dp(i,j)代表样本i与样本j的对应电流序列相似度。序列相似度采用动态时间规整算法计算,该算法基于动态规划思想,用于计算两段波形的相似度,状态转移方程如下。
其中dist(i,j)为电流序列第i个电流值与第j个电流值之差的绝对值。同样的,需要计算任意两段电流序列的相似度,并按照上述归一化方式进行标准化。最后,因为通常大仪都具有3个状态,因此将Kmeans的聚类个数初值设置为3,进行聚类,得到初步聚类结果。
步骤B-3主要用于确定最佳的聚类个数,这里采用轮廓系数S代表聚类结果的好坏。任意一个样本的轮廓系数Si计算公式如下。
其中ai代表样本i到相同簇内其它样本的平均距离,bi代表样本i到其它不同簇中样本的平均距离的最小值。计算所有样本的轮廓系数后求和取平均值,就可以得到此次聚类的轮廓系数,公式如下。
聚类个数的取值范围可以从2至5,依次进行聚类,计算轮廓系数,从而得出轮廓系数最高的作为最终的聚类结果,见图3。
C、工时计算步骤,主要包括以下两个步骤完成。
C-1、状态映射步骤。
C-2、状态分析步骤。
步骤C-1中,所述的聚类结果由B-3中给出,所得簇的个数为2至5。若簇的个数大于3,那么将电流均值最小的簇对应大仪关机态、电流值均值次小的簇对应大仪待机态、其余簇对应大仪的工作态。若B-3所得簇个数为2,那么做如下映射:电流均值较小的簇对应大仪关机态、电流均值大的簇对应大仪工作态。最后,将簇与对应的标签存储到云端。
步骤C-2中,主要涉及对后续大仪采集的电流数据进行分析。将大仪采集的电流数据进行步骤A-2、B-1的处理后获取样本集,计算样本集中样本与步骤C-1中获得的每个簇的平均相似度,最后,样本对应的状态与平均相似度最高的簇的状态相同。找出所有对应为工作的样本即可计算出大仪的工作时长。
至此,实现了一种基于电流的大仪工时计算方法。如图4所示,该方法首先将电流数据进行处理以及变换后生成样本集,再采用改进的聚类算法对电流数据进行聚类,利用簇评价系数得到最佳的聚类结果,得到最终的簇,最后将簇保存至云端。后续采集到的电流数据按照该方法形成样本集,比较样本与簇的相似度,将样本状态设置为相似度最高的簇对应的大仪状态,统计所有状态为工作的样本,最后得到大仪的工作时长。

Claims (3)

1.一种基于电流的大仪工时计算方法,其特征在于该方法包括以下步骤:
A、数据集建立步骤:
A-1、从仪器管理系统中获取某台大仪的电流数据,所述电流数据包括关机电流、待机电流、工作电流;
A-2、对A-1中获取的电流数据进行处理,将电流数据转换成一定结构的数据集;
B、数据分析步骤:
B-1、对A-2中获取的数据集进行特征变换,将数据集转换为样本集;
B-2、对B-1中获取的样本集按照改进的聚类算法进行聚类,得到多个聚类结果,每个聚类结果对应一个簇;
B-3、根据聚类结果评价系数并找到最佳聚类数;
C、工时计算步骤
C-1、对B-3所得簇与大仪的状态之间做如下映射:若B-3所得簇大于3,则将电流均值最小的簇对应大仪关机态、电流值均值次小的簇对应大仪待机态、其余簇对应大仪的工作态;若B-3所得簇个数为2,那么做如下映射:电流均值较小的簇对应大仪关机态、电流均值大的簇对应大仪工作态;最后将对应的簇存储到云端;
C-2、再次获取到大仪的电流数据时,仅需要通过将数据转换为样本集,再计算每个样本与每个簇的距离,每个样本与距离最近的簇代表的状态相同;此时,可以快速计算出大仪的工作时长;
步骤A-2中将电流数据转换为数据集的步骤如下;
首先,根据A-1中获取的电流数据,将电流数据中出现的所有电流值存储到候选集C中,并对候选集C按照电流值大小进行排序;
其次,在候选集C中按照电流数据精度为步长,找到每段连续数值中的最大值作为上限值,将这些上限值记为上限集H;若H的大小为1,则说明数据不够充分,该大仪不进行后续动作;
最后,将电流数据变换为数据集N;具体为,取候选集C中最小值记为下限值l,从大到小依次从上限集H中获取上限值h;对于每次取出的l,h都需要遍历一遍电流数据,将所有电流值在此上下限范围中且未访问过的所有索引记录下来;对这些索引进行连续性检查,若存在一段连续索引的长度大于R,则将这段索引序列存储到数据集N中并全部标记为访问;重复上述过程,直到上限集H中所有上限值都使用完毕;
步骤B-1生成样本集具体步骤如下;
步骤A-2中获取的数据集中的每个数据为一段连续的索引序列,首先将该序列转换成对应的电流值形成电流序列;其次计算电流序列的均值与标准差,将这两个值作为样本的特征;最后,对所有样本的特征进行归一化处理,得到最终的样本集T。
2.根据权利要求1所述的一种基于电流的大仪工时计算方法,其特征在于:步骤B-2所述的改进的聚类算法中聚类的相似度定义如下:
步骤B-2中聚类的相似度定义不仅结合了样本特征的欧式距离之和,还结合了任意两个样本对应电流序列的相似度的结果;此处需要计算任意两个电流序列的相似度,再对这些相似度进行归一化处理,再应用到样本相似度计算中。
3.根据权利要求1所述的一种基于电流的大仪工时计算方法,其特征在于:步骤C-2具体如下:
对后续采集到的大仪电流数据进行处理后获取样本集,计算样本集中每个样本与该大仪对应的每个簇的平均相似度,每个样本对应的状态与平均相似度最高的簇的状态相同;找出所有对应为工作的样本即可计算出大仪的工作时长。
CN202111611235.0A 2021-12-27 2021-12-27 一种基于电流的大仪工时计算方法 Active CN114280352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111611235.0A CN114280352B (zh) 2021-12-27 2021-12-27 一种基于电流的大仪工时计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111611235.0A CN114280352B (zh) 2021-12-27 2021-12-27 一种基于电流的大仪工时计算方法

Publications (2)

Publication Number Publication Date
CN114280352A CN114280352A (zh) 2022-04-05
CN114280352B true CN114280352B (zh) 2024-02-13

Family

ID=80876175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111611235.0A Active CN114280352B (zh) 2021-12-27 2021-12-27 一种基于电流的大仪工时计算方法

Country Status (1)

Country Link
CN (1) CN114280352B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243388A (zh) * 2015-09-09 2016-01-13 电子科技大学 基于动态时间规整和划分算法的波形分类方法
CN107561997A (zh) * 2017-08-22 2018-01-09 电子科技大学 一种基于大数据决策树的电力设备状态监测方法
CN111695639A (zh) * 2020-06-17 2020-09-22 浙江经贸职业技术学院 一种基于机器学习的电力用户用电异常检测方法
CN112288597A (zh) * 2020-11-24 2021-01-29 四川长虹电器股份有限公司 一种基于层次聚类和直方图算法的能耗在线异常检测方法
CN112286924A (zh) * 2020-11-20 2021-01-29 中国水利水电科学研究院 一种数据异常动态识别与多模式自匹配的数据清洗技术
CN112924743A (zh) * 2021-01-29 2021-06-08 杭州轨物科技有限公司 一种基于电流数据的仪器状态检测方法
CN112948345A (zh) * 2021-04-15 2021-06-11 苏州数海长云数据信息科技有限公司 一种基于云计算平台的大数据聚类方法
CN113378889A (zh) * 2021-05-17 2021-09-10 深圳萨摩耶数字科技有限公司 密度聚类分箱方法
CN113408622A (zh) * 2021-06-21 2021-09-17 国网山东省电力公司泰安供电公司 计及特征量信息表达差异的非侵入式负荷辨识方法及系统
KR102310306B1 (ko) * 2021-04-12 2021-10-07 솔라커넥트 주식회사 발전소 군집화 및 군집 기반 이상진단 방법
CN113537525A (zh) * 2021-07-23 2021-10-22 四川大学 一种电池储能系统故障状态自适应预警方法
CN113642421A (zh) * 2021-07-27 2021-11-12 北京市腾河电子技术有限公司 周期性多状态电器的事件检测方法及系统、设备、存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101700340B1 (ko) * 2012-04-06 2017-01-26 에스케이플래닛 주식회사 대용량 데이터의 클러스터 결과 분석 시스템 및 방법

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243388A (zh) * 2015-09-09 2016-01-13 电子科技大学 基于动态时间规整和划分算法的波形分类方法
CN107561997A (zh) * 2017-08-22 2018-01-09 电子科技大学 一种基于大数据决策树的电力设备状态监测方法
CN111695639A (zh) * 2020-06-17 2020-09-22 浙江经贸职业技术学院 一种基于机器学习的电力用户用电异常检测方法
CN112286924A (zh) * 2020-11-20 2021-01-29 中国水利水电科学研究院 一种数据异常动态识别与多模式自匹配的数据清洗技术
CN112288597A (zh) * 2020-11-24 2021-01-29 四川长虹电器股份有限公司 一种基于层次聚类和直方图算法的能耗在线异常检测方法
CN112924743A (zh) * 2021-01-29 2021-06-08 杭州轨物科技有限公司 一种基于电流数据的仪器状态检测方法
KR102310306B1 (ko) * 2021-04-12 2021-10-07 솔라커넥트 주식회사 발전소 군집화 및 군집 기반 이상진단 방법
CN112948345A (zh) * 2021-04-15 2021-06-11 苏州数海长云数据信息科技有限公司 一种基于云计算平台的大数据聚类方法
CN113378889A (zh) * 2021-05-17 2021-09-10 深圳萨摩耶数字科技有限公司 密度聚类分箱方法
CN113408622A (zh) * 2021-06-21 2021-09-17 国网山东省电力公司泰安供电公司 计及特征量信息表达差异的非侵入式负荷辨识方法及系统
CN113537525A (zh) * 2021-07-23 2021-10-22 四川大学 一种电池储能系统故障状态自适应预警方法
CN113642421A (zh) * 2021-07-27 2021-11-12 北京市腾河电子技术有限公司 周期性多状态电器的事件检测方法及系统、设备、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于改进K-means聚类的变压器异常状态识别模型;谢荣斌 等;电力大数据;第21卷(第5期);全文 *

Also Published As

Publication number Publication date
CN114280352A (zh) 2022-04-05

Similar Documents

Publication Publication Date Title
CN113011481A (zh) 一种基于决策树算法的电能表功能异常评估方法及系统
CN111797887A (zh) 一种基于密度筛选与k-均值聚类的反窃电预警方法及系统
CN110147760A (zh) 一种高效电能质量扰动图像特征提取与识别新方法
CN110632546B (zh) 基于全网域证据集的电子式互感器可信度评估方法和装置
CN111709668A (zh) 基于数据挖掘技术的电网设备参数风险识别方法及装置
CN111783696A (zh) 一种基于pv关系的低压分支拓扑实时分析的边缘计算方法
CN114700587B (zh) 一种基于模糊推理和边缘计算的漏焊缺陷实时检测方法及系统
CN116821832A (zh) 针对高压工商业用户用电负荷的异常数据辨识与修正方法
CN117992931B (zh) 一种直流信号特征库与参比信号模型建立系统及方法
CN117559443A (zh) 尖峰负荷下大工业用户集群有序用电控制方法
CN111400428A (zh) 一种知识图谱体系搭建方法
CN114280352B (zh) 一种基于电流的大仪工时计算方法
CN118174276A (zh) 一种低压光伏台区相序自动识别方法及装置
CN117609818A (zh) 基于聚类与信息熵的电网关联关系发现方法
CN115797044B (zh) 基于聚类分析的信贷风控预警方法及系统
CN116662840A (zh) 一种基于机器学习的低压台区用户相位识别方法
CN116776181A (zh) 基于改进模糊聚类的终端侧负荷辨识方法、介质及系统
CN114710313A (zh) 一种电网的设备攻击检测方法、装置及系统
CN117647697B (zh) 一种基于知识图谱的电力计量流水线故障定位方法及系统
Ren et al. Multivariable panel data ordinal clustering and its application in competitive strategy identification of appliance-wiring listed companies
CN116955444B (zh) 基于大数据分析的采集噪声点挖掘方法及系统
CN214118451U (zh) 一种基于熵权法的水泵特征优选装置
CN112884167B (zh) 一种基于机器学习的多指标异常检测方法及其应用系统
CN118377774A (zh) 数据处理方法、装置、电子设备及存储介质
CN111667153A (zh) 一种基于灰色关联分析法的居民用电行为分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant