CN110070048A - 基于双次K-means聚类的设备类型识别方法及系统 - Google Patents
基于双次K-means聚类的设备类型识别方法及系统 Download PDFInfo
- Publication number
- CN110070048A CN110070048A CN201910330598.3A CN201910330598A CN110070048A CN 110070048 A CN110070048 A CN 110070048A CN 201910330598 A CN201910330598 A CN 201910330598A CN 110070048 A CN110070048 A CN 110070048A
- Authority
- CN
- China
- Prior art keywords
- data
- equipment
- cluster
- harmonic wave
- device type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了基于双次K‑means聚类的设备类型识别方法及系统。基于双次K‑means聚类的设备类型识别方法,包括构建标准特征库;接收设备运行时谐波数据和电气参数相关数据并作为样本源数据;依据标准特征库筛选出设备运行时的有效数据,提取设备的谐波指标数据;采用K‑means聚类方法对谐波指标数据进行初步聚类,以区分设备的负载特性;对隶属同一负载特性的设备运行时的电气参数进行K‑means聚类,选取K值及最优的簇中心点和隶属此簇的样本源数据之间的距离阈值;将第二次K‑means聚类后的样本源数据与标准特征库进行相似性比对,标记中心点设备类型标签并评估聚类结果,完成设备识别分类模型的建立;将实时接收的数据输入至设备识别分类模型,识别出设备的类型。
Description
技术领域
本公开属于设备类型识别领域,尤其涉及一种基于双次K-means聚类的设备类型识别方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
随着工业化与信息化两化融合的日益成熟,物联网技术成为人类社会与物理系统互联互通、万物互联的重要手段。物联网的大规模使用使接入其中的电器设备越来越多,目前物联网平台对设备确认大部分依靠人工录入,随着设备量和设备使用规模的不断增大,自动识别接入平台的设备类型将变得非常重要;物联网自识别设备类型不仅大大减少人力而且可以及时调整相关设备使用状态,使设备服务个性化、差异化,为设备智能化奠定基础,以期提供更加个性化的服务。
已有许多学者和专家在电器设备识别方面作了分析和研究。获取用户设备的相关规律与模式信息应用机器学习等算法挖掘电器设备参数数据的潜在特征建模,比对电器设备的负荷特性等因素和模型的相似性,识别设备。发明人发现,当前大部分的模型是基于特定电气设备的进行分析,针对性强、鲁棒性弱,实施方式复杂,不能灵活变通用于大量的电器设备,且对于特征明显的数据无法做到精确识别;另外,研究历史数据的设备识别时效性差,虽然能达到设备识别的目的,但在信息更迭迅速的物联网面前过于迟滞。
发明内容
为了解决上述问题,本公开的第一个方面提供一种基于双次K-means聚类的设备类型识别方法,其先后两次对数据聚类分簇,先将所有数据按照其设备的负载特性分类,再利用二次聚类及聚类后的样本源数据与标准特征库进行相似性比对,达到实时准确识别设备类型的目的。
为了实现上述目的,本公开采用如下技术方案:
一种基于双次K-means聚类的设备类型识别方法,包括:
基于已知设备类型的时间序列的谐波和电气参数模型,构建标准特征库;
接收设备运行时谐波数据和电气参数相关数据并作为样本源数据;
依据标准特征库筛选出设备运行时的有效数据,提取设备的谐波指标数据;
采用K-means聚类方法对谐波指标数据进行初步聚类,聚类设备的负载特性;
对隶属同一负载特性的设备运行时的电气参数进行K-means聚类,选取K值以及最优的簇中心点和隶属此簇的样本源数据之间的距离阈值;
将第二次K-means聚类后的样本源数据与标准特征库进行相似性比对,标记中心点设备类型标签,并评估聚类结果,完成设备识别分类模型的建立;
将实时接收的设备运行时谐波数据和电气参数相关数据输入至设备识别分类模型,识别出设备的类型。
其中,对隶属同一负载特性的设备运行时的电气参数进行K-means聚类时,欧式距离的计算采用改进的基于设备电气参数的加权欧式距离方法,将计算的样本点与中心点(或距离中心点最近的样本点)之间的电气参数比值作为欧式距离的加权值。
为了解决上述问题,本公开的第二个方面提供一种基于双次K-means聚类的设备类型识别系统,其先后两次对数据聚类分簇,先将所有数据按照其设备的负载特性分类,再利用二次聚类及聚类后的样本源数据与标准特征库进行相似性比对,达到实时准确识别设备类型的目的。
为了实现上述目的,本公开采用如下技术方案:
一种基于双次K-means聚类的设备类型识别系统,包括分类模型建立模块和设备类型预测输出模块;
所述分类模型建立模块,用于构建设备识别分类模型;
所述设备类型预测输出模块,用于将实时接收的设备运行时谐波数据和电气参数相关数据输入至设备识别分类模型,输出识别的设备类型;
所述分类模型建立模块,还包括:
标准特征库构建模块,其用于基于已知设备类型的时间序列的谐波和电气参数模型,构建标准特征库;
样本源数据构建模块,其用于接收设备运行时谐波数据和电气参数相关数据并作为样本源数据;
谐波指标数据提取模块,其用于依据标准特征库筛选出设备运行时的有效数据,提取设备的谐波指标数据;
初步聚类模块,其用于采用K-means聚类方法对谐波指标数据进行初步聚类,聚类设备的负载特性;
二次聚类模块,其用于对隶属同一负载特性的设备运行时的电气参数进行K-means聚类,选取k值以及最优的簇中心点和隶属此簇的样本源数据之间的距离阈值;
聚类结果评估模块,其用于将第二次K-means聚类后的样本源数据与标准特征库进行相似性比对,标记中心点设备类型标签,并评估聚类结果,完成设备识别分类模型的建立。
为了解决上述问题,本公开的第三个方面提供一种计算机可读存储介质,其先后两次对数据聚类分簇,先将所有数据按照其设备的负载特性分类,再利用二次聚类及聚类后的样本源数据与标准特征库进行相似性比对,达到实时准确识别设备类型的目的。
为了实现上述目的,本公开采用如下技术方案:
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于双次K-means聚类的设备类型识别方法中的步骤。
为了解决上述问题,本公开的第四个方面提供一种计算机设备,其先后两次对数据聚类分簇,先将所有数据按照其设备的负载特性分类,再利用二次聚类及聚类后的样本源数据与标准特征库进行相似性比对,达到实时准确识别设备类型的目的。
为了实现上述目的,本公开采用如下技术方案:
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述所述的基于双次K-means聚类的设备类型识别方法中的步骤。
本公开的有益效果是:
本公开先后两次对数据聚类分簇,先将所有数据按照其设备的负载特性分类,再利用二次聚类及聚类后的样本源数据与标准特征库进行相似性比对,达到实时准确识别设备类型的目的。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1是本公开实施例提供的一种基于双次K-means聚类的设备类型识别方法流程图。
图2(a)是本公开实施例提供的台式机和电视机模型。
图2(b)是本公开实施例提供的空调辐热模型。
图2(c)是本公开实施例提供的热风机模型。
图2(d)是本公开实施例提供的饮水机加热模型。
图2(e)是本公开实施例提供的微波炉和节能灯模型。
图2(f)是本公开实施例提供的电冰箱模型。
图3(a)是本公开实施例提供的电视机电流模型。
图3(b)是本公开实施例提供的台式机电流模型。
图3(c)是本公开实施例提供的LED灯电流模型。
图3(d)是本公开实施例提供的空调加热电流模型。
图3(e)是本公开实施例提供的微波炉电流模型。
图3(f)是本公开实施例提供的饮水机加热电流模型。
图3(g)是本公开实施例提供的热风机吹热风时电流模型。
图3(h)是热风机吹冷风时电流模型。
图3(i)是本公开实施例提供的电冰箱电流模型。
图4是本公开实施例提供的基于双次K-means聚类的设备类型识别具体过程图。
图5是本公开实施例提供的一种基于双次K-means聚类的设备类型识别系统结构示意图。
具体实施方式
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
图1提供了一种基于双次K-means聚类的设备类型识别方法实施例流程图。
如图1所示,本实施例的一种基于双次K-means聚类的设备类型识别方法,包括:
S101:构建设备识别分类模型。
具体地,步骤S101包括:
S1011:基于已知设备类型的时间序列的谐波和电气参数模型,构建标准特征库。
电器设备的运行过程蕴含着一定的统计规律,即各种负荷特征。常用的电器设备接入电力系统中因其内部构造机理的相同点和不同点有不同的或类似的参数特性和负载特性,并依据负载特性进行简单的分类;用电设备的电气参数包括谐波、电流有效值、周期电流值、功率和能耗值等,用电设备在运行过程中电气参数的各阶段变化各不相同;且用户使用设备会呈现一定的时间规律,比如,家庭常用设备会在用户下班回家时显示大概率的使用频率。
1)谐波特性分析:
电力电子技术的迅速发展,各种整流装置、频率变换装置等具有非线性特性的用电设备应运而生,使得电网电流产生了高次谐波,非线性元件大量存在于家用、办公设备中,如电视机、各种节能灯、电磁炉、洗衣机、微波炉、电冰箱、计算机、充电器、各种科研和医疗用仪器等。大量有关谐波的实测调查表明,常用电器设备主要产生不大于13次的奇次谐波,少量电器会产生高于20次的谐波,且含量很少,1-32次谐波可完全反应设备的谐波情况和用电状况。
谐波特性可通过快速傅里叶变换(FFT)将时域内电流信号转换为频域的频谱信号。在此通过智能终端将电流进行初步数据滤波和FFT计算出1到32次谐波与功率一起集中按时上传,物联网实时采集。
2)负载特性分析:
设备的负载特性有纯阻性负载、容性负载和感性负载。纯阻性负载通过电阻类的元件进行工作,功率变化较大,但是在使用过程中负荷特性接近于纯阻性负荷,谐波几乎没有,电流波形近乎于正弦波;容性负载存在交直流转换模块,所以产生了较大的波形畸变,甚至出现了相当高次的谐波,但功率不是太大;感性负载带有负载电流滞后负载电压一个相位差的特性,有些设备在消耗有功功率时还会消耗无功功率,谐波含量比较大。
基于提取的谐波次数作为用电设备谐波识别典型指标,电流总谐波畸变率可以很好的反应设备的谐波情况,且设备的谐波含量越丰富其电流总谐波畸变率越大,因此可以用电流总谐波畸变率大体判断出用电设备负载特性,一般来说,阻性(R)、容性(C)和感性(L)负载的电流总谐波畸变率存在以下关系:
THDIC>THDIL>THDIR。
3)功率和工作特性分析
电器设备在工作的过程中,往往会围绕设备的额定功率上下小范围的波动;但有些设备的状态变化明显,随着时间的推移,出现设备功能变化或者人为干扰等因素,设备状态变化,进而会引起设备功率呈现相应的规律性变化。如下表1所示的用电设备的工作分析。
表1电器设备工作分析
基于上述分析,本实施例选择1-32次谐波为主要研究参数,功率电气参数为辅助研究参数,如图2(a)-图2(f)所示,建立基于时间序列的谐波和功率模型作为标准特征库。
在其他实施例中,电气参数可选用电流数据,具体地,利用录波器对常用家用电器的电流数据采集,记录电器运行时的电流随时间的变化和功率标值,如图3(a)-图3(i)所示。
S1012:接收设备运行时谐波数据和电气参数相关数据并作为样本源数据。
在具体实施中,物联网平台长时间采集智能终端的数据作为实验样本源数据。处理样本源数据,提取有效数据填补缺失值、处理离群点、数据归一化和提取设备谐波指标等数据预处理,从而保证数据的正确性、一致性、完整性和最小性。
S1013:依据标准特征库筛选出设备运行时的有效数据,提取设备的谐波指标数据。
具体地,提取设备谐波指标是提取高次谐波与基波的占比,突出设备谐波的丰富程度,通过指标反映设备的负载特性。本实施例提取典型的电流的总谐波畸变率作为指标,有样本数据n×32维,提取指标后变为n×1维数据。其中,n为大于1的正整数
电流畸变率定义为各次谐波有效值的平方和的平方根值与其基波有效值的百分比。电流的总谐波畸变率为THDI,表达式如下:
设备数据包含谐波、功率和时间序列三部分。其中的谐波的基波数据和多次谐波数据差别很大,数据归一化的目的是将数据的差距进行缩小,使数据更加平滑,同时将有规律的数据变成无序列的纯数据,便于不同次的谐波之间能够进行比较和加权。为下述聚类做数据预处理基础,可以有更好的聚类效果。
有i组样本数据组成的i X32维矩阵:
N’为归一化之后的谐波值,则具体的归一化处理公式如下:
nmin=min1<<j<<32Nij (2)
nmax=max1<<j<<32Nij (3)
归一化之后的数据矩阵为:
S1014:采用K-means聚类方法对谐波指标数据进行初步聚类,聚类设备的负载特性。
聚类分析用于数据挖掘和知识发现,结合模式识别和模式分类、对数据压缩和向量量化等。基于数据驱动的设备分类,利用K-means聚类将属于同一类别设备的数据归为簇。聚类算法是随机选取K个中心点,根据聚类中心(中心点){C1,C2,…,Ck}与样本数据的相似性度量距离不断调整中心点的位置,不断迭代,选出最优中心点。
由此得到的聚类中心{C1,C2,…,Ck}看作是所有设备的标准值,事实上以上数据分别是在设备处于各种不同时间段运行状态下得到的。
利用提取的谐波次数作为用电设备谐波识别典型指标,电流总谐波畸变率可以很好的反应设备的谐波情况,且设备的谐波含量越丰富其电流总谐波畸变率越大,因此用电流总谐波畸变率大体判断出用电设备负载特性。
利用阻性(R)、容性(C)和感性(L)负载的电流总谐波畸变率存在以下关系来对设备进行负载特性的聚类:
THDIC>THDIL>THDIR。
经选取样本数据中有效数据后提取设备谐波指标{THDI1,THDI2,…,THDIn},因数据维数少且特征明显,k-means聚类可以精确的对数据集群。根据设备的负载特性选择聚类个数k≤3,聚类的中心点{A1,...,AK}。基于中心点,划分有效数据为a1,...,aK样本数据集。其中,设备的负载特性包括阻性(R)、容性(C)和感性(L)负载。
S1015:对隶属同一负载特性的设备运行时的电气参数进行K-means聚类,选取K值以及最优的簇中心点和隶属此簇的样本源数据之间的距离阈值。
K-means聚类的核心是相似性距离度量的不断迭代。欧几里得距离(欧式距离)作为最常用的相似性距离度量方法,欧式距离度量数据空间相似性,原理简单。由于该方法在聚类过程中采取距离就近原则,在实际应用中,不考虑数据样本中的属性在实验过程中的不同作用,而是将它们统一看待,用样本之间的欧氏距离并不能准确地表示相似度,因为相似不仅仅依赖于数据间的相近程度,还依赖于产生样本数据的实际物理器件类型,也就是说数据集中每个样本在聚类分析过程中对于数据样本集不同类划分的重要性不同。
基于采集的电气参数数据,为使每个样本数据有结合设备自身的影响力,聚类算法的簇中心有更强的说服力,设备识别采用的相似性度量方法是将每个样本数据的功率值与本次迭代聚类中心(或距离中心最近的样本点)的功率值做比,将不小于1的比重作为权重对欧式距离进行加权。
计算样本权重:
wi=max{Pij,Pi}/min{Pij,Pi} (8)
其中:Pi为簇Ci的样本数据的功率;Pij为属于簇Ci的每个样本数据对应的功率。
计算相似性度量距离:
随着聚类数K的增大,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和(SSE)自然会逐渐变小。当K小于真实聚类数时,由于K的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当K到达真实聚类数时,再增加K所得到的聚合程度回报会迅速变小,所以SSE的下降幅度会骤减,然后随着K值的继续增大而趋于平缓,也就是说SSE和K的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数核心指标SSE(sum of the squared errors,误差平方和)的计算公式:
其中,ci是第i个簇;p是ci中的样本点;mi是ci的质心(ci中所有样本的均值);SSE是所有样本的聚类误差,代表了聚类效果的好坏。
S1016:将第二次K-means聚类后的样本源数据与标准特征库进行相似性比对,标记中心点设备类型标签,并评估聚类结果,完成设备识别分类模型的建立。
利用手肘法选择合适的聚类簇的个数K值,改进的相似性度量距离(加权欧氏距离)代替传统的k-means聚类的欧氏距离计算,对a1,...,aK样本集数据预处理之后的数据分别聚类,选出最优中心点和隶属于此中心点的最大加权欧式距离。利用每个簇的样本源数据对比标准特征库,标记聚类中心{C1,C2,…,Ck}设备类型标签。
S102:将实时接收的设备运行时谐波数据和电气参数相关数据输入至设备识别分类模型,识别出设备的类型。
如图4所示,物联网实时采集智能终端上传的n组设备数据,提取设备谐波指标,与设备识别分类模型初步聚类的聚类中心{A1,...,AK}计算欧式距离,选择最近距离的簇Ai;n组设备数据数据预处理后作为预测数据,二次聚类的聚类中心{C1,C2,…,Ck}与预测数据运算加权欧氏距离,选择出距离最小且在各中心点距离阈值之内的中心点标签。其中运算归一化选用ai样本集的nmin、nmax,计算加权欧氏距离采用最有中心点{C1,C2,…,Ck}的Pi。如果在进行距离阈值比对中发现没有符合条件的距离阈值,则标记发现新设备,需要更新设备识别分类模型。如此反复将提取出的所有数据进行设备识别,采用少数服从多数的原则确定设备的类别,完成设备实时识别。
图5提供了一种基于双次K-means聚类的设备类型识别系统结构示意图。
如图5所示,本实施例的一种基于双次K-means聚类的设备类型识别系统,包括分类模型建立模块和设备类型预测输出模块;
(1)所述分类模型建立模块,用于构建设备识别分类模型;
(2)所述设备类型预测输出模块,用于将实时接收的设备运行时谐波数据和电气参数相关数据输入至设备识别分类模型,输出识别的设备类型;
所述分类模型建立模块,还包括:
(2.1)标准特征库构建模块,其用于基于已知设备类型的时间序列的谐波和电气参数模型,构建标准特征库;
本实施例选择1-32次谐波为主要研究参数,功率电气参数为辅助研究参数,如图2(a)-图2(f)所示,建立基于时间序列的谐波和功率模型作为标准特征库。
在其他实施例中,电气参数可选用电流数据,具体地,利用录波器对常用家用电器的电流数据采集,记录电器运行时的电流随时间的变化和功率标值,如图3(a)-图3(i)所示。
(2.2)样本源数据构建模块,其用于接收设备运行时谐波数据和电气参数相关数据并作为样本源数据;
在具体实施中,物联网平台长时间采集智能终端的数据作为实验样本源数据。处理样本源数据,提取有效数据填补缺失值、处理离群点、数据归一化和提取设备谐波指标等数据预处理,从而保证数据的正确性、一致性、完整性和最小性。
(2.3)谐波指标数据提取模块,其用于依据标准特征库筛选出设备运行时的有效数据,提取设备的谐波指标数据;
具体地,提取设备谐波指标是提取高次谐波与基波的占比,突出设备谐波的丰富程度,通过指标反映设备的负载特性。本实施例提取典型的电流的总谐波畸变率作为指标,有样本数据n×32维,提取指标后变为n×1维数据。其中,n为大于1的正整数
电流畸变率定义为各次谐波有效值的平方和的平方根值与其基波有效值的百分比。电流的总谐波畸变率为THDI,表达式如下:
设备数据包含谐波、功率和时间序列三部分。其中的谐波的基波数据和多次谐波数据差别很大,数据归一化的目的是将数据的差距进行缩小,使数据更加平滑,同时将有规律的数据变成无序列的纯数据,便于不同次的谐波之间能够进行比较和加权。为下述聚类做数据预处理基础,可以有更好的聚类效果。
有i组样本数据组成的i X32维矩阵:
N’为归一化之后的谐波值,则具体的归一化处理公式如下:
nmin=min1<<j<<32Nij (2)
nmax=max1<<j<<32Nij (3)
归一化之后的数据矩阵为:
(2.4)初步聚类模块,其用于采用K-means聚类方法对谐波指标数据进行初步聚类,聚类设备的负载特性;
聚类分析用于数据挖掘和知识发现,结合模式识别和模式分类、对数据压缩和向量量化等。基于数据驱动的设备分类,利用K-means聚类将属于同一类别设备的数据归为簇。聚类算法是随机选取K个中心点,根据聚类中心(中心点){C1,C2,…,Ck}与样本数据的相似性度量距离不断调整中心点的位置,不断迭代,选出最优中心点。
由此得到的聚类中心{C1,C2,…,Ck}看作是所有设备的标准值,事实上以上数据分别是在设备处于各种不同时间段运行状态下得到的。
利用提取的谐波次数作为用电设备谐波识别典型指标,电流总谐波畸变率可以很好的反应设备的谐波情况,且设备的谐波含量越丰富其电流总谐波畸变率越大,因此用电流总谐波畸变率大体判断出用电设备负载特性。
利用阻性(R)、容性(C)和感性(L)负载的电流总谐波畸变率存在以下关系来对设备进行负载特性的聚类:
THDIC>THDIL>THDIR。
经选取样本数据中有效数据后提取设备谐波指标{THDI1,THDI2,…,THDIn},因数据维数少且特征明显,k-means聚类可以精确的对数据集群。根据设备的负载特性选择聚类个数k≤3,聚类的中心点{A1,...,AK}。基于中心点,划分有效数据为a1,...,aK样本数据集。其中,设备的负载特性包括阻性(R)、容性(C)和感性(L)负载。
(2.5)二次聚类模块,其用于对隶属同一负载特性的设备运行时的电气参数进行K-means聚类,选取k值以及最优的簇中心点和隶属此簇的样本源数据之间的距离阈值;
K-means聚类的核心是相似性距离度量的不断迭代。欧几里得距离(欧式距离)作为最常用的相似性距离度量方法,欧式距离度量数据空间相似性,原理简单。由于该方法在聚类过程中采取距离就近原则,在实际应用中,不考虑数据样本中的属性在实验过程中的不同作用,而是将它们统一看待,用样本之间的欧氏距离并不能准确地表示相似度,因为相似不仅仅依赖于数据间的相近程度,还依赖于产生样本数据的实际物理器件类型,也就是说数据集中每个样本在聚类分析过程中对于数据样本集不同类划分的重要性不同。
基于采集的电气参数数据,为使每个样本数据有结合设备自身的影响力,聚类算法的簇中心有更强的说服力,设备识别采用的相似性度量方法是将每个样本数据的功率值与本次迭代聚类中心(或距离中心最近的样本点)的功率值做比,将不小于1的比重作为权重对欧式距离进行加权。
计算样本权重:
wi=max{Pij,Pi}min{Pij,Pi} (8)
其中:Pi为簇Ci的样本数据的功率;Pij为属于簇Ci的每个样本数据对应的功率。
计算相似性度量距离:
随着聚类数K的增大,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和(SSE)自然会逐渐变小。当K小于真实聚类数时,由于K的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当K到达真实聚类数时,再增加K所得到的聚合程度回报会迅速变小,所以SSE的下降幅度会骤减,然后随着K值的继续增大而趋于平缓,也就是说SSE和K的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数核心指标SSE(sum of the squared errors,误差平方和)的计算公式:
其中,ci是第i个簇;p是ci中的样本点;mi是ci的质心(ci中所有样本的均值);SSE是所有样本的聚类误差,代表了聚类效果的好坏。
(2.6)聚类结果评估模块,其用于将第二次K-means聚类后的样本源数据与标准特征库进行相似性比对,标记中心点设备类型标签,并评估聚类结果,完成设备识别分类模型的建立。
利用手肘法选择合适的聚类簇的个数K值,改进的相似性度量距离(加权欧氏距离)代替传统的k-means聚类的欧氏距离计算,对a1,...,aK样本集数据预处理之后的数据分别聚类,选出最优中心点和隶属于此中心点的最大加权欧式距离。利用每个簇的样本源数据对比标准特征库,标记聚类中心{C1,C2,…,Ck}设备类型标签。
在另一实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图1所示的基于双次K-means聚类的设备类型识别方法中的步骤。
在另一实施例中,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如图1所示的基于双次K-means聚类的设备类型识别方法中的步骤
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种基于双次K-means聚类的设备类型识别方法,其特征在于,包括:
基于已知设备类型的时间序列的谐波和电气参数模型,构建标准特征库;
接收设备运行时谐波数据和电气参数相关数据并作为样本源数据;
依据标准特征库筛选出设备运行时的有效数据,提取设备的谐波指标数据;
采用K-means聚类方法对谐波指标数据进行初步聚类,聚类设备的负载特性;
对隶属同一负载特性的设备运行时的电气参数进行K-means聚类,选取K值以及最优的簇中心点和隶属此簇的样本源数据之间的距离阈值;
将第二次K-means聚类后的样本源数据与标准特征库进行相似性比对,标记中心点设备类型标签,并评估聚类结果,完成设备识别分类模型的建立;
将实时接收的设备运行时谐波数据和电气参数相关数据输入至设备识别分类模型,识别出设备的类型。
2.如权利要求1所述的一种基于双次K-means聚类的设备类型识别方法,其特征在于,谐波指标数据为预设次数谐波与基波的占比。
3.如权利要求1所述的一种基于双次K-means聚类的设备类型识别方法,其特征在于,接收设备运行时谐波数据和电气参数相关数据之后,还包括:
对设备运行时谐波数据和电气参数相关数据进行归一化。
4.如权利要求1所述的一种基于双次K-means聚类的设备类型识别方法,其特征在于,通过手肘法选取K值并选出最优的簇中心点和隶属此簇的样本源数据之间的距离阈值。
5.一种基于双次K-means聚类的设备类型识别系统,其特征在于,包括分类模型建立模块和设备类型预测输出模块;
所述分类模型建立模块,用于构建设备识别分类模型;
所述设备类型预测输出模块,用于将实时接收的设备运行时谐波数据和电气参数相关数据输入至设备识别分类模型,输出识别的设备类型;
所述分类模型建立模块,还包括:
标准特征库构建模块,其用于基于已知设备类型的时间序列的谐波和电气参数模型,构建标准特征库;
样本源数据构建模块,其用于接收设备运行时谐波数据和电气参数相关数据并作为样本源数据;
谐波指标数据提取模块,其用于依据标准特征库筛选出设备运行时的有效数据,提取设备的谐波指标数据;
初步聚类模块,其用于采用K-means聚类方法对谐波指标数据进行初步聚类,聚类设备的负载特性;
二次聚类模块,其用于对隶属同一负载特性的设备运行时的电气参数进行K-means聚类,选取k值以及最优的簇中心点和隶属此簇的样本源数据之间的距离阈值;
聚类结果评估模块,其用于将第二次K-means聚类后的样本源数据与标准特征库进行相似性比对,标记中心点设备类型标签,并评估聚类结果,完成设备识别分类模型的建立。
6.如权利要求5所述的一种基于双次K-means聚类的设备类型识别系统,其特征在于,在所述谐波指标数据提取模块中,谐波指标数据为预设次数谐波与基波的占比。
7.如权利要求5所述的一种基于双次K-means聚类的设备类型识别系统,其特征在于,所述样本源数据构建模块,还用于:
对接收设备运行时谐波数据和电气参数相关数据进行归一化。
8.如权利要求5所述的一种基于双次K-means聚类的设备类型识别系统,其特征在于,在所述二次聚类模块中,通过手肘法选取K值并选出最优的簇中心点和隶属此簇的样本源数据之间的距离阈值;
或
在所述二次步聚类模块中,采用改进的基于设备电气参数的加权欧式距离方法,将计算的样本点与中心点或距离中心点最近的样本之间的电气参数比值作为欧式距离的加权值。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的基于双次K-means聚类的设备类型识别方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4中任一项所述的基于双次K-means聚类的设备类型识别方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910330598.3A CN110070048B (zh) | 2019-04-23 | 2019-04-23 | 基于双次K-means聚类的设备类型识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910330598.3A CN110070048B (zh) | 2019-04-23 | 2019-04-23 | 基于双次K-means聚类的设备类型识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110070048A true CN110070048A (zh) | 2019-07-30 |
CN110070048B CN110070048B (zh) | 2020-11-10 |
Family
ID=67368556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910330598.3A Active CN110070048B (zh) | 2019-04-23 | 2019-04-23 | 基于双次K-means聚类的设备类型识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110070048B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110445689A (zh) * | 2019-08-15 | 2019-11-12 | 平安科技(深圳)有限公司 | 识别物联网设备类型的方法、装置及计算机设备 |
CN110766208A (zh) * | 2019-10-09 | 2020-02-07 | 中电科新型智慧城市研究院有限公司 | 一种基于社会群体行为的政务服务需求预测方法 |
CN110766043A (zh) * | 2019-09-10 | 2020-02-07 | 国网浙江省电力有限公司杭州供电公司 | 基于电网信息数据的K-means聚类算法 |
CN111985815A (zh) * | 2020-08-21 | 2020-11-24 | 国网能源研究院有限公司 | 一种能源电力运营评价指标的筛选方法及装置 |
CN113297291A (zh) * | 2021-05-08 | 2021-08-24 | 上海电气风电集团股份有限公司 | 监测方法、系统、可读存储介质和风力发电机 |
CN114095803A (zh) * | 2022-01-19 | 2022-02-25 | 高视科技(苏州)有限公司 | 物联网信息管理系统的数据采集优化方法及产品 |
CN115795316A (zh) * | 2022-11-17 | 2023-03-14 | 国网江苏省电力有限公司电力科学研究院 | 一二次融合设备的波形相似度判定方法、装置及存储介质 |
CN116028838A (zh) * | 2023-01-09 | 2023-04-28 | 广东电网有限责任公司 | 一种基于聚类算法的能源数据处理方法、装置及终端设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200275A (zh) * | 2014-06-24 | 2014-12-10 | 国家电网公司 | 基于用户行为特点的用电模式分类和控制方法 |
CN104699959A (zh) * | 2015-02-13 | 2015-06-10 | 国家电网公司 | 一种基于k-means算法的线损同类划分方法 |
CN105021888A (zh) * | 2015-07-06 | 2015-11-04 | 广州供电局有限公司 | 基于数据聚类的谐波数据监测方法 |
CN105429135A (zh) * | 2015-12-08 | 2016-03-23 | 河南许继仪表有限公司 | 一种非侵入式电力负荷分解的辨识决策方法及系统 |
CN105894034A (zh) * | 2016-04-01 | 2016-08-24 | 中国电力科学研究院 | 一种基于二次聚类的商业负荷特性聚类分析方法 |
CN106226572A (zh) * | 2016-07-13 | 2016-12-14 | 国家电网公司 | 基于暂态特征聚类的家用负荷识别方法 |
US20180048704A1 (en) * | 2016-08-11 | 2018-02-15 | Symantec Corporation | Network Device Clusters |
CN108399221A (zh) * | 2018-02-11 | 2018-08-14 | 山东建筑大学 | 基于大数据关联分析的室内电气设备分类识别方法与系统 |
CN108415777A (zh) * | 2018-03-21 | 2018-08-17 | 常州信息职业技术学院 | 一种基于聚类特征提取的云计算集群任务负载预测方法 |
-
2019
- 2019-04-23 CN CN201910330598.3A patent/CN110070048B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200275A (zh) * | 2014-06-24 | 2014-12-10 | 国家电网公司 | 基于用户行为特点的用电模式分类和控制方法 |
CN104699959A (zh) * | 2015-02-13 | 2015-06-10 | 国家电网公司 | 一种基于k-means算法的线损同类划分方法 |
CN105021888A (zh) * | 2015-07-06 | 2015-11-04 | 广州供电局有限公司 | 基于数据聚类的谐波数据监测方法 |
CN105429135A (zh) * | 2015-12-08 | 2016-03-23 | 河南许继仪表有限公司 | 一种非侵入式电力负荷分解的辨识决策方法及系统 |
CN105894034A (zh) * | 2016-04-01 | 2016-08-24 | 中国电力科学研究院 | 一种基于二次聚类的商业负荷特性聚类分析方法 |
CN106226572A (zh) * | 2016-07-13 | 2016-12-14 | 国家电网公司 | 基于暂态特征聚类的家用负荷识别方法 |
US20180048704A1 (en) * | 2016-08-11 | 2018-02-15 | Symantec Corporation | Network Device Clusters |
CN108399221A (zh) * | 2018-02-11 | 2018-08-14 | 山东建筑大学 | 基于大数据关联分析的室内电气设备分类识别方法与系统 |
CN108415777A (zh) * | 2018-03-21 | 2018-08-17 | 常州信息职业技术学院 | 一种基于聚类特征提取的云计算集群任务负载预测方法 |
Non-Patent Citations (4)
Title |
---|
JIANPENG QI ET AL.: "An effective and efficient hierarchical K-means clustering algorithm", 《INTERNATIONAL JOURNAL OF DISTRIBUTED SENSOR NETWORKS》 * |
刘政 等: "基于特征相似度的家庭用电负荷识别方法", 《重庆理工大学学报(自然科学)》 * |
卜凡鹏 等: "一种基于双层迭代聚类分析的负荷模式可控精细化识别方法", 《电网技术》 * |
王星华 等: "一种基于双层聚类分析的负荷形态组合识别方法", 《电网技术》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110445689A (zh) * | 2019-08-15 | 2019-11-12 | 平安科技(深圳)有限公司 | 识别物联网设备类型的方法、装置及计算机设备 |
CN110445689B (zh) * | 2019-08-15 | 2022-03-18 | 平安科技(深圳)有限公司 | 识别物联网设备类型的方法、装置及计算机设备 |
CN110766043A (zh) * | 2019-09-10 | 2020-02-07 | 国网浙江省电力有限公司杭州供电公司 | 基于电网信息数据的K-means聚类算法 |
CN110766208A (zh) * | 2019-10-09 | 2020-02-07 | 中电科新型智慧城市研究院有限公司 | 一种基于社会群体行为的政务服务需求预测方法 |
CN111985815A (zh) * | 2020-08-21 | 2020-11-24 | 国网能源研究院有限公司 | 一种能源电力运营评价指标的筛选方法及装置 |
CN113297291A (zh) * | 2021-05-08 | 2021-08-24 | 上海电气风电集团股份有限公司 | 监测方法、系统、可读存储介质和风力发电机 |
CN114095803A (zh) * | 2022-01-19 | 2022-02-25 | 高视科技(苏州)有限公司 | 物联网信息管理系统的数据采集优化方法及产品 |
CN114095803B (zh) * | 2022-01-19 | 2022-05-31 | 高视科技(苏州)有限公司 | 物联网信息管理系统的数据采集优化方法及产品 |
CN115795316A (zh) * | 2022-11-17 | 2023-03-14 | 国网江苏省电力有限公司电力科学研究院 | 一二次融合设备的波形相似度判定方法、装置及存储介质 |
CN115795316B (zh) * | 2022-11-17 | 2024-03-08 | 国网江苏省电力有限公司电力科学研究院 | 一二次融合设备的波形相似度判定方法、装置及存储介质 |
CN116028838A (zh) * | 2023-01-09 | 2023-04-28 | 广东电网有限责任公司 | 一种基于聚类算法的能源数据处理方法、装置及终端设备 |
CN116028838B (zh) * | 2023-01-09 | 2023-09-19 | 广东电网有限责任公司 | 一种基于聚类算法的能源数据处理方法、装置及终端设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110070048B (zh) | 2020-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110070048A (zh) | 基于双次K-means聚类的设备类型识别方法及系统 | |
CN109145949A (zh) | 基于集成学习的非侵入式电力负荷监测与分解方法及系统 | |
CN109858758A (zh) | 一种配电网电能质量的组合赋权评估方法及系统 | |
CN106022509B (zh) | 考虑地域和负荷性质双重差异的配电网空间负荷预测方法 | |
Huang et al. | A clustering based grouping method of nearly zero energy buildings for performance improvements | |
CN110231528A (zh) | 基于负荷特征模型库的变压器户变异常识别方法及装置 | |
CN110991786A (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN111368904B (zh) | 一种基于电力指纹的电器设备识别方法 | |
CN108694673A (zh) | 一种保险业务风险预测的处理方法、装置及处理设备 | |
CN111476173B (zh) | 一种基于bas-svm的配电网电压暂降源识别方法 | |
Dong et al. | A short-term power load forecasting method based on k-means and SVM | |
CN108549907B (zh) | 一种基于多源迁移学习的数据校验方法 | |
Mian Qaisar et al. | Signal piloted processing of the smart meter data for effective appliances recognition | |
CN110689162B (zh) | 一种基于用户侧分类的母线负荷预测方法、装置及系统 | |
CN109858728A (zh) | 基于分行业用电特性分析的负荷预测方法 | |
CN106952027A (zh) | 一种10kV配电网线路规划接入容量计算方法 | |
CN107944495A (zh) | 一种基于深层森林算法的家庭用电负荷分类识别方法 | |
CN109359665A (zh) | 一种基于支持向量机的家电负荷识别方法及装置 | |
CN113723844B (zh) | 一种基于集成学习的低压台区理论线损计算方法 | |
CN110363354A (zh) | 风场风功率预测方法、电子装置及存储介质 | |
CN109284851A (zh) | 一种适用于需求侧响应的用户用电行为分类方法 | |
CN108122173A (zh) | 一种基于深度信念网络的多行业负荷预测方法 | |
CN115204698A (zh) | 一种低压台区供电稳定性的实时分析方法 | |
CN111324790A (zh) | 基于支持向量机分类的负荷类型识别方法 | |
CN113962477A (zh) | 一种产业电量关联聚集预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |