CN105653670B - 一种基于流形学习聚类算法的智能用电数据挖掘方法 - Google Patents

一种基于流形学习聚类算法的智能用电数据挖掘方法 Download PDF

Info

Publication number
CN105653670B
CN105653670B CN201511017533.1A CN201511017533A CN105653670B CN 105653670 B CN105653670 B CN 105653670B CN 201511017533 A CN201511017533 A CN 201511017533A CN 105653670 B CN105653670 B CN 105653670B
Authority
CN
China
Prior art keywords
data
time
user
formula
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201511017533.1A
Other languages
English (en)
Other versions
CN105653670A (zh
Inventor
史常凯
盛万兴
张波
周勐
高媛
许保平
孙智涛
常方圆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI filed Critical State Grid Corp of China SGCC
Priority to CN201511017533.1A priority Critical patent/CN105653670B/zh
Publication of CN105653670A publication Critical patent/CN105653670A/zh
Application granted granted Critical
Publication of CN105653670B publication Critical patent/CN105653670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于流形学习聚类算法的智能用电数据挖掘方法,包括:获取用户n点用电数据集合X={X1,X2...Xs...Xt},其中,Xs={x1,x2...xi...xn},s∈[1,t],t为用户总数,i∈[1,n],n为用电数据采集点总数;对第s个用户n点用电数据Xs进行归一化处理,获取归一化处理后数据Xs′={x1′,x2′...xi′...x′n};对Xs′进行曲线拟合,获取用户用电的峰值对应时间Tp和谷值对应时间Tv,将Tp和Tv作为所述用户的标签;基于流形学习算法对所述归一化处理后数据进行降维处理,获取降维处理后数据集Y={Y1,Y2...Ys...Yt};采用聚类算法对所述降维处理后数据集进行分类;对每类用户的价格敏感性进行评价;本发明提供的方法针对智能用电数据信息,通过采用流形学习聚类方法对信息进行聚类分析,为智能用电互动化提供决策信息。

Description

一种基于流形学习聚类算法的智能用电数据挖掘方法
技术领域
本发明涉及数据挖掘分析领域,具体涉及一种基于流形学习聚类算法的智能用电数据挖掘方法。
背景技术
智能互动化是智能电网的一个重要环节,针对智能用电基础信息的数据挖掘,对明确用户互动化需求具有十分重要的价值。
目前现有的用电数据采集分析系统对数据信息的挖掘相对简单,如根据用户用电量将用户进行档次划分为(如大、中、小)不同的用户群,根据用电性质划分不同客户群(民用电、工商业用电等),很少综合考虑不同区域、不同用电性质、不同时间段等对用户用电量信息的挖掘。
发明内容
本发明的目的是针对智能用电数据信息,提供一种基于流形学习聚类算法的智能用电数据挖掘方法,通过采用流形学习聚类方法对信息进行聚类分析,为智能用电互动化提供决策信息。
本发明的目的是采用下述技术方案实现的:
一种基于流形学习聚类算法的智能用电数据挖掘方法,其改进之处在于,所述方法包括:
(1)获取用户n点用电数据集合X={X1,X2...Xs...Xt},其中,Xs={x1,x2...xi...xn}为第s个用户n点用电数据,s∈[1,t],t为用户总数,xi为n点用电数据中第i点数据,i∈[1,n],n为用电数据采集点总数;
(2)对第s个用户n点用电数据Xs进行归一化处理,获取归一化处理后数据Xs′={x1′,x2′...xi′...xn′},xi′为Xs中归一化处理后第i个元素;
(3)对Xs′进行曲线拟合,获取用户用电的峰值对应时间Tp和谷值对应时间Tv,将Tp和Tv作为所述用户的标签;
(4)基于流形学习算法对所述归一化处理后数据进行降维处理,获取降维处理后数据集Y={Y1,Y2...Ys...Yt},其中,Ys={ys1,ys2},s∈[1,t],t为用户总数,ys1为Xs′降维处理后数据的第一个元素,ys2为Xs′降维处理后数据的第二个元素;
(5)采用聚类算法对所述降维处理后数据集进行分类;
(6)对每类用户的价格敏感性进行评价。
优选的,所述步骤(2)中,对Xs进行归一化处理的公式为:
Figure BDA0000894796600000021
式(1)中,xi′为Xs中归一化处理后第i个元素,xi为Xs中第i个元素,xmax为Xs中元素最大值,xmin为Xs中元素最小值。
优选的,所述步骤(4)中,基于流形学习算法将Xs′={x1′,x2′...xi′...xn′}降为二维数据,包括:
(4-1)将Xs′中的数据点xi′与k邻域内数据点进行连接并获取数据点xi′与k邻域内数据点的欧氏距离,以数据点xi′为节点,数据点xi′与k邻域内数据点连接线为边构建领域图;
(4-2)采用Dijkstra算法获取领域图内任意两点xi′和xj′之间的最短距离d(i,j)及领域图内任意两点xi′和xj′之间的最短距离矩阵D{d(i,j)},其中,i,j∈[1,n];
(4-3)采用MDS算法获取Xs′={x1′,x2′...xi′...xn′}的低维嵌入坐标Yov={yov1,yov2},令S={d(i,j)2}和H={δij-1/n},构造矩阵B,公式为:
B=-(HSH)/2 (2)
其中,δij的公式为:
Figure BDA0000894796600000022
分别获取所述矩阵B最大的两个特征值所对应的特征向量ys1和ys2作为所述Xs′={x1′,x2′...xi′...xn′}的低维嵌入坐标Ys中的第一和第二个元素。
优选的,所述步骤(5)中,采用k-means算法将所述降维处理后数据集分为4类,包括:
(5-1)在所述降维处理后数据集Y={Y1,Y2...Ys...Yt}中随机选择4个元素{Ya,Yb,Yc,Yd}作为初始聚类中心;
(5-2)分别计算Y={Y1,Y2...Ys...Yt}中每个元素至{Ya,Yb,Yc,Yd}中4个元素的欧氏距离的公式为:
dso=||Ys-Yo||2,o∈(a,b,c,d) (4)
式(4)中,dso为Ys至Yo的欧氏距离;
(5-3)选择dso中的最小值,若最小值为dso,则Ys属于o类,聚类结果为Yo={Yo1,Yo2...Yov...Yon},其中,Yov={yov1,yov2}为属于o类的第v个数据,on为属于o类的数据总个数,o∈(a,b,c,d);
(5-4)修改聚类中心Yo的公式为:
Figure BDA0000894796600000031
式(5)中,yo1′为修改后聚类中心Yo的第一个元素,yo2′为修改后聚类中心Yo的第二个元素,yov1为属于o类的第v个数据的第一个元素,yov2为属于o类的第v个数据的第二个元素,on为属于o类的数据总个数,o∈(a,b,c,d);
(5-5)设定阈值ΔO,若修改后聚类中心的位置变化小于等于ΔO,则聚类结果为Yo={Yo1,Yo2...Yov...Yon},其中,Yov={yov1,yov2},若修改后聚类中心的位置变化大于ΔO,则返回步骤(5-2)。
优选的,所述步骤(6)中,确定每类用户用电的峰值对应时间平均值和谷值对应 时间平均值令供电单位的分时电价高峰时间为T0、低谷时间为T1,则每类用户用电的峰 值对应时间平均值与供电单位的分时电价低谷时间T1的差ΔTp的公式为 每类用户用电的谷值对应时间平均值与供电单位的分时电价高峰时间T0的差ΔTv的公 式为
Figure BDA0000894796600000037
进一步的,设定阈值A和B,若ΔTp≤A或ΔTv≤B,则用户对分时电价敏感,用电单位需调整分时电价高峰时间T0和低谷时间T1。
与最接近的现有技术相比,本发明具有的有益效果:
本发明提供的一种基于流形学习聚类算法的智能用电数据挖掘方法,在数据挖掘前首先进行数据归一化、标准化处理;采用流行学习方法对标准化后的数据进行数据可视化,使用电数据在2维平面上能将其表示,并采用K-meams聚类算法对数据进行聚类;聚类后的数据根据用户在典型用电场景下的用电特性进行划分不同的类别,从而对供电单位的业务决策提供可靠依据。
附图说明
图1是本发明提供的一种基于流形学习聚类算法的智能用电数据挖掘方法流程图;
图2是本发明实施例中仿真数据采集示意图;
图3是本发明实施例中96维数据降至两维后数据分布情况示意图;
图4是本发明实施例中聚类结果示意图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供了一种基于流形学习聚类算法的智能用电数据挖掘方法,如图1所示,包括:
(1)获取用户n点用电数据集合X={X1,X2...Xs...Xt},其中,Xs={x1,x2...xi...xn}为第s个用户n点用电数据,s∈[1,t],t为用户总数,xi为n点用电数据中第i点数据,i∈[1,n],n为用电数据采集点总数;
其中,n点用电数据可以采集用户一天的数据,也可以采集用户一年的数据;
(2)对第s个用户n点用电数据Xs进行归一化处理,获取归一化处理后数据Xs′={x1′,x2′...xi′...xn′},xi′为Xs中归一化处理后第i个元素;
(3)对Xs′进行曲线拟合,获取用户用电的峰值对应时间Tp和谷值对应时间Tv,将Tp和Tv作为所述用户的标签;
(4)基于流形学习算法对所述归一化处理后数据进行降维处理,获取降维处理后数据集Y={Y1,Y2...Ys...Yt},其中,Ys={ys1,ys2},s∈[1,t],t为用户总数,ys1为Xs′降维处理后数据的第一个元素,ys2为Xs′降维处理后数据的第二个元素;
(5)采用聚类算法对所述降维处理后数据集进行分类;
(6)对每类用户的价格敏感性进行评价。
具体的,所述步骤(2)中,对Xs进行归一化处理的公式为:
Figure BDA0000894796600000051
式(1)中,xi′为Xs中归一化处理后第i个元素,xi为Xs中第i个元素,xmax为Xs中元素最大值,xmin为Xs中元素最小值。
所述步骤(4)中,基于流形学习算法将Xs′={x1′,x2′...xi′...xn′}降为二维数据,包括:
(4-1)将Xs′中的数据点xi′与k邻域内数据点进行连接并获取数据点xi′与k邻域内数据点的欧氏距离,以数据点xi′为节点,数据点xi′与k邻域内数据点连接线为边构建领域图;
(4-2)采用Dijkstra算法获取领域图内任意两点xi′和xj′之间的最短距离d(i,j)及领域图内任意两点xi′和xj′之间的最短距离矩阵D{d(i,j)},其中,i,j∈[1,n];
(4-3)采用MDS算法获取Xs′={x1′,x2′...xi′...xn′}的低维嵌入坐标Yov={yov1,yov2},令S={d(i,j)2}和H={δij-1/n},构造矩阵B,公式为:
B=-(HSH)/2 (2)
其中,δij的公式为:
Figure BDA0000894796600000052
分别获取所述矩阵B最大的两个特征值所对应的特征向量ys1和ys2作为所述Xs′={x1′,x2′...xi′...xn′}的低维嵌入坐标Ys中的第一和第二个元素。
所述步骤(5)中,采用k-means算法将所述降维处理后数据集分为4类,包括:
(5-1)在所述降维处理后数据集Y={Y1,Y2...Ys...Yt}中随机选择4个元素{Ya,Yb,Yc,Yd}作为初始聚类中心;
(5-2)分别计算Y={Y1,Y2...Ys...Yt}中每个元素至{Ya,Yb,Yc,Yd}中4个元素的欧氏距离的公式为:
dso=||Ys-Yo||2,o∈(a,b,c,d) (4)
式(4)中,dso为Ys至Yo的欧氏距离;
例如,当o=a时,dsa为Ys至聚类中心Ya的欧氏距离;
(5-3)选择dso中的最小值,若最小值为dso,则Ys属于o类,聚类结果为Yo={Yo1,Yo2...Yov...Yon},其中,Yov={yov1,yov2}为属于o类的第v个数据,on为属于o类的数据总个数,o∈(a,b,c,d);
其中,dso包含dsa、dsb、dsc和dsd,分别选择这四个值中最小的值;
例如,当dsa、dsb、dsc和dsd中,dsa的值最小,说明Ys至聚类中心Ya的欧氏距离最小,则Ys属于a类;
(5-4)修改聚类中心Yo的公式为:
Figure BDA0000894796600000061
式(5)中,yo1′为修改后聚类中心Yo的第一个元素,yo2′为修改后聚类中心Yo的第二个元素,yov1为属于o类的第v个数据的第一个元素,yov2为属于o类的第v个数据的第二个元素,on为属于o类的数据总个数,o∈(a,b,c,d);
(5-5)设定阈值ΔO,若修改后聚类中心的位置变化小于等于ΔO,则聚类结果为Yo={Yo1,Yo2...Yov...Yon},其中,Yov={yov1,yov2},若修改后聚类中心的位置变化大于ΔO,则返回步骤(5-2)。
所述步骤(6)中,确定每类用户用电的峰值对应时间平均值
Figure BDA0000894796600000062
和谷值对应时间平均值
Figure BDA0000894796600000063
令供电单位的分时电价高峰时间为T0、低谷时间为T1,则每类用户用电的峰值对应时间平均值
Figure BDA0000894796600000064
与供电单位的分时电价低谷时间T1的差ΔTp的公式为
Figure BDA0000894796600000065
每类用户用电的谷值对应时间平均值
Figure BDA0000894796600000066
与供电单位的分时电价高峰时间T0的差ΔTv的公式为
Figure BDA0000894796600000067
设定阈值A和B,若ΔTp≤A或ΔTv≤B,则用户对分时电价敏感,用电单位需调整分时电价高峰时间T0和低谷时间T1。
其中,当用户对分时电价敏感时,供电单位可以合理调整分时电价峰谷时段以调整用户用电时间,从而起到削峰填谷作用减轻电网供电压力。
实施例
对基于流形学习聚类算法的智能用电数据挖掘方法进行仿真实验,如图2所示,仿真数据如下:
对用户15分钟进行一次用电量数据采集,一天中共有96个用电数据点。按用户的实际典型用电习惯对用户数据进行划分,主要有以上这四种场景:早8点和晚8点用电高峰期,午夜和中午时段用电低峰用户;晚上8点用电高峰期用户;一天中用电均衡无明显峰谷时段用户;午夜时段用电高峰期用户;
采用基于流形学习的算法进行可视化处理,如图3所示,将96维的数据进行维数约减,降到两维后的数据分布情况;
然后采用基于K-means聚类,聚类结果如图4所示,通过给定的数据样本分析后发现,其正确率在95%左右,具有很好的聚类效果。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (3)

1.一种基于流形学习聚类算法的智能用电数据挖掘方法,其特征在于,所述方法包括:
(1)获取用户n点用电数据集合X={X1,X2...Xs...Xt},其中,Xs={x1,x2...xi...xn}为第s个用户n点用电数据,s∈[1,t],t为用户总数,xi为n点用电数据中第i点数据,i∈[1,n],n为用电数据采集点总数;
(2)对第s个用户n点用电数据Xs进行归一化处理,获取归一化处理后数据X′s={x′1,x′2...x′i...x′n},x′i为Xs中归一化处理后第i个元素;
(3)对X′s进行曲线拟合,获取用户用电的峰值对应时间Tp和谷值对应时间Tv,将Tp和Tv作为所述用户的标签;
(4)基于流形学习算法对所述归一化处理后数据进行降维处理,获取降维处理后数据集Y={Y1,Y2...Ys...Yt},其中,Ys={ys1,ys2},s∈[1,t],t为用户总数,ys1为X′s降维处理后数据的第一个元素,ys2为X′s降维处理后数据的第二个元素;
(5)采用聚类算法对所述降维处理后数据集进行分类;
(6)对每类用户的价格敏感性进行评价;
所述步骤(6)中,确定每类用户用电的峰值对应时间平均值
Figure FDA0002637712450000011
和谷值对应时间平均值
Figure FDA0002637712450000012
令供电单位的分时电价高峰时间为T0、低谷时间为T1,则每类用户用电的峰值对应时间平均值
Figure FDA0002637712450000013
与供电单位的分时电价低谷时间T1的差ΔTp的公式为
Figure FDA0002637712450000014
每类用户用电的谷值对应时间平均值
Figure FDA0002637712450000015
与供电单位的分时电价高峰时间T0的差ΔTv的公式为
Figure FDA0002637712450000016
设定阈值A和B,若ΔTp≤A或ΔTv≤B,则用户对分时电价敏感,用电单位需调整分时电价高峰时间T0和低谷时间T1;
所述步骤(4)中,基于流形学习算法将X′s={x′1,x′2...x′i...x′n}降为二维数据,包括:
(4-1)将X′s中的数据点x′i与k邻域内数据点进行连接并获取数据点x′i与k邻域内数据点的欧氏距离,以数据点x′i为节点,数据点x′i与k邻域内数据点连接线为边构建领域图;
(4-2)采用Dijkstra算法获取领域图内任意两点x′i和x′j之间的最短距离d(i,j)及领域图内任意两点x′i和x′j之间的最短距离矩阵D{d(i,j)},其中,i,j∈[1,n];
(4-3)采用MDS算法获取X′s={x′1,x′2...x′i...x′n}的低维嵌入坐标Ys={ys1,ys2},令S={d(i,j)2}和H={δij-1/n},构造矩阵B,公式为:
B=-(HSH)/2 (2)
其中,δij的公式为:
Figure FDA0002637712450000021
分别获取所述矩阵B最大的两个特征值所对应的特征向量ys1和ys2作为所述X′s={x′1,x′2...x′i...x′n}的低维嵌入坐标Ys中的第一和第二个元素。
2.如权利要求1所述的方法,其特征在于,所述步骤(2)中,对Xs进行归一化处理的公式为:
Figure FDA0002637712450000022
式(1)中,x′i为Xs中归一化处理后第i个元素,xi为Xs中第i个元素,xmax为Xs中元素最大值,xmin为Xs中元素最小值。
3.如权利要求1所述的方法,其特征在于,所述步骤(5)中,采用k-means算法将所述降维处理后数据集分为4类,包括:
(5-1)在所述降维处理后数据集Y={Y1,Y2...Ys...Yt}中随机选择4个元素{Ya,Yb,Yc,Yd}作为初始聚类中心;
(5-2)分别计算Y={Y1,Y2...Ys...Yt}中每个元素至{Ya,Yb,Yc,Yd}中4个元素的欧氏距离的公式为:
dso=||Ys-Yo||2,o∈(a,b,c,d) (4)
式(4)中,dso为Ys至Yo的欧氏距离;
(5-3)选择dso中的最小值,若最小值为dso,则Ys属于o类,聚类结果为Yo={Yo1,Yo2...Yov...Yon},其中,Yov={yov1,yov2}为属于o类的第v个数据,on为属于o类的数据总个数,o∈(a,b,c,d);
(5-4)修改聚类中心Yo的公式为:
Figure FDA0002637712450000023
式(5)中,y′o1为修改后聚类中心Yo的第一个元素,y′o2为修改后聚类中心Yo的第二个元素,yov1为属于o类的第v个数据的第一个元素,yov2为属于o类的第v个数据的第二个元素,on为属于o类的数据总个数,o∈(a,b,c,d);
(5-5)设定阈值ΔO,若修改后聚类中心的位置变化小于等于ΔO,则聚类结果为Yo={Yo1,Yo2...Yov...Yon},其中,Yov={yov1,yov2},若修改后聚类中心的位置变化大于ΔO,则返回步骤(5-2)。
CN201511017533.1A 2015-12-29 2015-12-29 一种基于流形学习聚类算法的智能用电数据挖掘方法 Active CN105653670B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511017533.1A CN105653670B (zh) 2015-12-29 2015-12-29 一种基于流形学习聚类算法的智能用电数据挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511017533.1A CN105653670B (zh) 2015-12-29 2015-12-29 一种基于流形学习聚类算法的智能用电数据挖掘方法

Publications (2)

Publication Number Publication Date
CN105653670A CN105653670A (zh) 2016-06-08
CN105653670B true CN105653670B (zh) 2020-12-29

Family

ID=56477341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511017533.1A Active CN105653670B (zh) 2015-12-29 2015-12-29 一种基于流形学习聚类算法的智能用电数据挖掘方法

Country Status (1)

Country Link
CN (1) CN105653670B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106227919B (zh) * 2016-07-11 2020-01-24 国家电网公司 基于流形学习的电力系统动态仿真可视化方法
CN106503633A (zh) * 2016-10-10 2017-03-15 上海电机学院 一种视频图像中人脸特征库的建立方法
CN110717806B (zh) * 2019-09-06 2024-04-02 中国平安财产保险股份有限公司 产品信息推送方法、装置、设备及存储介质
CN110689250B (zh) * 2019-09-20 2023-04-14 深圳供电局有限公司 一种用户用电数据的处理方法、系统及计算机可读介质
CN110879829A (zh) * 2019-11-26 2020-03-13 杭州皓智天诚信息科技有限公司 一种知识产权大数据业务智能系统
CN114254018A (zh) * 2021-12-22 2022-03-29 中国工商银行股份有限公司 客户信息挖掘方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184349A (zh) * 2011-04-29 2011-09-14 河海大学 基于流形学习的基因表达数据的聚类系统及方法
CN102890718A (zh) * 2012-10-10 2013-01-23 重庆大学 基于有监督显式流形学习算法的电子鼻数据挖掘方法
CN103679555A (zh) * 2013-12-16 2014-03-26 成都安健发科技有限公司 基于负荷特性分类的分时电价确定方法
CN105184281A (zh) * 2015-10-12 2015-12-23 上海电机学院 基于高维流形学习的人脸特征库构建方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7907777B2 (en) * 2005-01-25 2011-03-15 Siemens Medical Solutions Usa, Inc. Manifold learning for discriminating pixels in multi-channel images, with application to image/volume/video segmentation and clustering
US8954365B2 (en) * 2012-06-21 2015-02-10 Microsoft Corporation Density estimation and/or manifold learning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184349A (zh) * 2011-04-29 2011-09-14 河海大学 基于流形学习的基因表达数据的聚类系统及方法
CN102890718A (zh) * 2012-10-10 2013-01-23 重庆大学 基于有监督显式流形学习算法的电子鼻数据挖掘方法
CN103679555A (zh) * 2013-12-16 2014-03-26 成都安健发科技有限公司 基于负荷特性分类的分时电价确定方法
CN105184281A (zh) * 2015-10-12 2015-12-23 上海电机学院 基于高维流形学习的人脸特征库构建方法

Also Published As

Publication number Publication date
CN105653670A (zh) 2016-06-08

Similar Documents

Publication Publication Date Title
CN105653670B (zh) 一种基于流形学习聚类算法的智能用电数据挖掘方法
CN110781332A (zh) 基于复合聚类算法的电力居民用户日负荷曲线聚类方法
Räsänen et al. Data-based method for creating electricity use load profiles using large amount of customer-specific hourly measured electricity use data
Wijaya et al. Consumer segmentation and knowledge extraction from smart meter and survey data
CN104573619A (zh) 基于人脸识别的智能广告大数据分析方法及系统
US20140351285A1 (en) Platform and method for analyzing electric power system data
Kaneda et al. Sliding window-based support vector regression for predicting micrometeorological data
Hagenauer et al. Hierarchical self-organizing maps for clustering spatiotemporal data
WO2017107422A1 (zh) 一种用户性别识别方法及装置
CN106846082B (zh) 基于硬件信息的旅游冷启动用户产品推荐系统及方法
CN111144468A (zh) 电力用户信息标签化方法和装置、电子设备以及存储介质
CN108734216A (zh) 基于负荷曲线形态的电力用户分类方法、装置及存储介质
CN107248031B (zh) 一种针对负荷曲线峰谷差的快速电力用户分类方法
CN109117872A (zh) 一种基于自动最优聚类算法的用户用电行为分析方法
CN116842405A (zh) 一种电力负荷数据聚类方法、系统、设备及存储介质
CN104156403A (zh) 一种基于聚类的大数据常态模式提取方法及系统
CN109815987A (zh) 一种人群分类方法和分类系统
CN113591899A (zh) 电力客户画像识别方法、装置及终端设备
CN104391879A (zh) 层次聚类的方法及装置
CN105825232A (zh) 对电动汽车用户进行分类的方法及装置
CN106067034A (zh) 一种基于高维矩阵特征根的配电网负荷曲线聚类方法
CN110796159A (zh) 基于k-means算法的电力数据分类方法及系统
CN106204267A (zh) 一种基于改进k‑means和神经网络聚类的客户细分系统
CN110705616A (zh) 基于用电偏好进行用户负荷曲线聚类的方法及系统
CN102722578A (zh) 一种基于拉普拉斯正则化无监督的聚类特征选取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant