CN107657266A - 一种基于改进谱多流形聚类的负荷曲线聚类方法 - Google Patents
一种基于改进谱多流形聚类的负荷曲线聚类方法 Download PDFInfo
- Publication number
- CN107657266A CN107657266A CN201710655501.7A CN201710655501A CN107657266A CN 107657266 A CN107657266 A CN 107657266A CN 201710655501 A CN201710655501 A CN 201710655501A CN 107657266 A CN107657266 A CN 107657266A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- load
- curve
- load curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000001228 spectrum Methods 0.000 title claims abstract description 25
- 230000006872 improvement Effects 0.000 title claims description 16
- 230000000694 effects Effects 0.000 claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 22
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000010219 correlation analysis Methods 0.000 claims description 2
- 238000007621 cluster analysis Methods 0.000 abstract 1
- 230000009467 reduction Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 240000002853 Nelumbo nucifera Species 0.000 description 4
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 4
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000010835 comparative analysis Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 238000000205 computational method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007580 dry-mixing Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于改进谱多流形聚类的负荷曲线聚类方法,本发明包括典型日负荷曲线提取、负荷曲线聚类和聚类效果评价三步。首先提取用户负荷特性指标,结合非参数核密度估计方法计算提取用户典型日负荷曲线。在改进谱多流形聚类算法中,引入时间翘曲距离度量曲线相似性,并用高斯核函数计算局部相似性,基于此计算相似性矩阵。聚类后采用多种聚类有效性指标对聚类结果和算法性能进行评价。本发明采用保定地区若干用户的负荷数据作为算例样本进行聚类分析,验证了文中提出的典型日负荷曲线提取方法和改进谱多流形聚类方法的合理性和优越性。
Description
技术领域
本发明涉及一种基于改进谱多流形聚类的负荷曲线聚类方法, 属于光伏预测领域。
背景技术
电力负荷曲线聚类是配用电大数据挖掘和实施负荷管理的基 础。通过数据挖掘中的聚类技术进行用户负荷曲线聚类从而得到合 理的用户分类,有助于售电公司准确把握用户的用电特性,引入合 理的需求响应机制并制定科学的营销策略,对于削峰填谷、优化用 电曲线、提高电能质量等方面有着重要意义。
将聚类技术应用于用户负荷曲线分类这一领域的研究已相当深 入。常用的聚类算法主要有:K-means、层次聚类法、模糊C均值 (fuzzy C-mean,FCM)、自组织映射神经网络(self-organizing map, SOM)等。主要思路为采集不同用户的连续负荷数据构成离散序列, 以序列间的距离类指标描述曲线相似性,作为聚类的依据。随着电 网中采集技术和计量装置的不断发展,负荷采集间隔越来越小,使 得构成负荷曲线的数据维数越来越高。而很多基于欧氏距离的聚类 算法如K-means都是通过计算数据点之间的几何平均距离来进行聚 类,它难以反映负荷的时间序列这一属性,同时,负荷数据维数越 高,平均距离这一测度的意义就越小。这就使得基于全维度负荷曲 线欧氏距离的聚类方法在面对高维曲线的聚类问题时显得十分乏 力。因此,很多现有技术都从数据降维的角度入手来解决此类问题。 现有技术提出了一种基于信息熵分段聚合近似的方法,在充分表达 负荷曲线波动性的同时降低了数据维度,兼顾了曲线的距离相似性 和形状相似性。现有技术从负荷曲线中提取若干负荷特性指标,以 此对负荷数据进行降维,再以加权欧氏距离作为相似性判据来完成 聚类。现有技术定义并提取功率曲线、分时功率、功率频谱3类向 量,再通过SOM神经网络对输入数据进行低维映射,进而完成可视 化聚类。现有技术研究了多种数据集降维算法,在降维后的数据集 上进行集成聚类,比较各种降维算法的信息损失和计算效率后,得出结合主成分分析降维的集成聚类算法可以取得最佳效果。总的来 说,各类降维技术都是以负荷曲线形态为基础,不论是负荷指标提 取或是低维映射,都应最大程度地保证负荷曲线的形态信息。但上 述方法的降维过程均不可避免地会对原始信息造成一定程度的损失,影响聚类的质量。另外,许多常用降维方法如主成分分析 (principal componentanalysis,PCA)都是基于数据具有全局线 性分布的假设,若数据结构不满足要求,则难以取得理想的降维效 果。
发明内容
本发明所要解决的技术问题是提供一种基于改进谱多流形聚类 的负荷曲线聚类方法,其基于多流形假设的聚类算法——谱多流形 聚类(spectral multi-manifoldclustering,SMMC),以该算法的 思路为基础,在相似性矩阵的计算方法上进行改进,引入了典型时 间翘曲距离(canonical warping distance)的概念用以衡量负荷 曲线间的相似程度,利用传统谱聚类中基于欧氏距离的高斯核函数 计算局部相似性,结合两种相似性计算相似度权值从而构成相似性 矩阵。这样既考虑了负荷曲线之间的欧氏距离关系,又考虑了负荷 数据本身的时间序列属性。
为解决上述技术问题,本发明所采取的技术方案是:一种基于 改进谱多流形聚类的负荷曲线聚类方法,其特征在于:该方法包括 如下步骤:
(1)基于非参数核密度估计的典型日负荷曲线提取
首先选择某用户一定周期T内的日负荷数据,从每个样本日日 负荷曲线中提取负荷特性指标,得到每个样本日的日负荷特性指标 向量Yi=[xi1,xi2,......,xin],i=1,2,3......,T;n为同一时刻采样的特性指标个 数;采用非参数核密度估计方法对每个样本日日负荷曲线中提取的 负荷特性指标进行概率密度拟合,进而确定周期T内的典型日负荷指标向量Yc=[xc1,xc2,......,xcn],c=1,2,......,T;n为同一时刻采样的特性指标 个数;根据每个样本日的日负荷特性指标向量Yi;以及周期T内的 典型日负荷指标向量Yc;确定每个相应样本日的日负荷负荷曲线权 重wi,i=1,2,......,T;然后对每个样本日的日负荷曲线进行加权叠加,
最终得到所需的典型日负荷曲线;
(2)对谱多流形聚类算法的改进
首先构造K-近邻图,即当样本点同一类特性指标xi在xj的K个近 邻点以内或xi在xj的K个近邻点以内时,连接xj和xj两个顶点, i=1,2,......T,j=1,2......T;
利用高斯核函数即公式(8)计算采样点的局部相似性pij;
其中,xi和xj为样本点内的同一类特性指标,σ为高斯核函数半 径;
利用公式(7)、(9)计算采样点间的典型时间翘曲距离qij;
其中,xi[nr]和xj[mr]为样本同一类特性指标序列的对应元素,ar和 βr为用典型相关分析计算所得的空间变换矩阵;
构造相似性矩阵W,利用公式(11)计算相似性权值ωij;
其中,Knn(x)表示点x的K个近邻点;
根据相似性矩阵W计算对角矩阵D,其中dii=∑jωij;
求解非规范拉普拉斯矩阵L=D-W的最小k个特征值对应的特征向 量U;
在U构成的特征空间利用K-means将数据点进行聚类。
进一步的技术方案在于,所述负荷特性指标为从日负荷曲线中 提取日负荷率、日峰谷差率、峰期负载率、平期负载率、谷期负载 率。
进一步的技术方案在于,所述的非参数核密度估计方法为
令第n个特性指标xn的T个样本为x1n,x2n,x3n,......,xTn则基于非参数 核密度理论可得负荷特性指标xn的概率密度函数fk(xn),如式(1)所 示:
式中:h为带宽;T为样本数;xin为第n个特性指标的第i个样 本值;H为核函数;
为保证被估计概率密度函数的连续性,核函数通常为关于y 轴对称的单峰平滑概率密度函数,其需满足式(2)特性:
式中:c为大于0的常数;
最常用的核函数有Epanechikov函数和Gaussian函数,本发明 选择Gaussian核函数,如式(3)所示;
进一步的技术方案在于,所述典型日负荷曲线提取步骤如下:
1)选择某用户一定周期T内的日负荷数据,提取日负荷率等负 荷特性指标构成向量Yi=[xi1,xi2,......,xin],i=1,2,3......,T;n为同一时刻采样 的特性指标个数;
2)采用非参数核密度估计对负荷特性指标进行概率密度拟合, 得到典型日负荷指标向量Yc=[xc1,xc2,......,xcn],c=1,2,......,T;n为同一时刻 采样的特性指标个数;
3)计算Yi与Yc的欧氏距离di,以此来确定样本日i的负荷曲线权 重wi,i=1,2,......,T;为使得欧式距离越大,曲线所占权重越小,定义计算 公式为:
其中,λ为区间[0,1]内的可调参数,用于调整di对wi的影响程 度;特别的,当λ=0时,利用下一步骤中公式(6)所计算出的典型 日负荷曲线即为对所有样本日负荷曲线求取算术平均所得的平均负 荷曲线.在此取λ=0.5计算典型日负荷曲线;
4)对样本日的日负荷曲线进行加权叠加,最终得到所需的典型 日负荷曲线;设样本日i的日负荷数据为Li=[li1,li2,......,li24],典型日负 荷数据为Lc=[lc1,lc2,......,lc24],其中lct(t=1,2,…,24)的计算公式为:
进一步的技术方案在于,还包括对聚类结果的评价:其是基于时 间翘曲距离和“去中心化”思想的曲线聚类评价指标CHCTW,通过计 算类间曲线差异度(用S1表示)与类内曲线相似度(用M1表示)的 比值衡量聚类效果;该指标以时间翘曲距离度量曲线差异度,同时摒 弃了类中心和样本中心,在计算过程中动态地将计算对象作为中心; 具体计算公式为:
式中,K为聚类数,Ci为聚类结果中的第i类,ni为类Ci中的曲 线条数;当且仅当nk≥2,k∈[1,K]时公式(16)成立;
CHCTW的计算公式为:
同样,CHCTW指标越大,表明类间曲线愈相异而类内曲线愈相似, 即聚类效果越好。
采用上述技术方案所产生的有益效果在于:本发明针对用户负荷 曲线聚类问题,分别提出了新型的典型日负荷曲线提取方法和改进谱 多流形聚类算法。首先基于负荷特性指标提取和非参数核密度拟合对 用户的典型日负荷曲线进行提取,然后采用改进谱多流形聚类算法对 若干用户的负荷曲线进行聚类。结合本发明提出的聚类评价指标,全 面对聚类算法的性能和聚类效果进行对比分析。通过算例验证表明:
1)本发明提出的典型日负荷曲线提取方法能够发掘用户的典型 负荷曲线形态并全面而准确地反映用户的用电特性和规律。
2)本发明所提的改进谱多流形聚类算法在曲线聚类问题上具有 良好的效果,在聚类有效性和算法稳定性方面均优于K-means算法。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是负荷特性指标拟合结果;
图2是典型日负荷曲线提取;
图3是基于CH指标确定最优聚类数;
图4是改进SMMC算法聚类结果;
图5是K-means聚类的CH指标;
图6是改进SMMC聚类的CH指标。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方 案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的 一部分实施例,而不是全部的实施例。基于本发明中的实施例,本 领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但 是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域 技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明 不受下面公开的具体实施例的限制。
本发明公开的技术方案如下:
1基于非参数核密度估计的典型日负荷曲线提取方法
现有的典型日负荷曲线确定方法主要有两种思路。第一种思路是 有根据地选择某负荷日作为典型日(如最大负荷日),直接提取其负 荷曲线作为典型日负荷曲线。然而由于影响负荷变化的因素十分复 杂,使得负荷曲线在具有一定规律性的同时也体现出了较强的随机 性,因此很难保证此类方法选择的典型日足够“典型”;第二种思路 是依照某种规律选择一定天数负荷日的负荷曲线,叠加后取平均作为 典型日负荷曲线。这种方法虽然在一定程度上降低了随机性,但简单 求取算术平均的计算方法往往在“平均化”的过程中减小了负荷曲线 的波动幅度,使得日最大负荷、日最小负荷、日负荷率等负荷指标趋 于“中心化”,损失了原有负荷曲线的特征。
因此,本发明基于概率统计的思想提出了一种新型的用户典型日 负荷曲线提取方法,通过提取负荷特性指标进行概率密度拟合,进而 对样本日的负荷曲线进行加权叠加得到最终的典型日负荷曲线,以保 证该负荷曲线能最大程度地反映用户的用电特性和规律。
1.1负荷指标提取
首先选择某用户一定周期T内(如30天)的日负荷数据,从日 负荷曲线中提取日负荷率、日峰谷差率、峰期负载率、平期负载率、 谷期负载率等负荷特性指标,得到每个样本日的日负荷特性指标向量 Yi=[xi1,xi2,xi3,xi4,xi5],i=1,2,3,...,T。各指标的定义如表1所示。
表1日负荷特性指标
Tab.1 Daily load pattern indexes
1.2基于非参数核密度估计的概率密度拟合
本发明采用非参数核密度估计方法对从样本日负荷曲线中提取 出的负荷特性指标进行概率密度拟合,进而确定最“典型”的典型日 负荷指标向量Yc=[xc1,xc2,xc3,xc4,xc5]。
非参数核密度估计方法无需任何先验知识、完全从数据样本出发 研究数据分布特征[12]。本发明利用该方法对负荷指标的提取结果进行 参数拟合。
令第n个特性指标xn的T个样本为x1n,x2n,x3n,......,xTn则基于非参数 核密度理论可得负荷特性指标xn的概率密度函数fk(xn),如式(1)所 示:
式中:h为带宽;T为样本数;xin为第n个特性指标的第i个样 本值;H为核函数。
为保证被估计概率密度函数的连续性,核函数通常为关于y轴 对称的单峰平滑概率密度函数,其需满足式(2)特性:
式中:c为大于0的常数;
最常用的核函数有Epanechikov函数和Gaussian函数,本发明 选择Gaussian核函数,如式(3)所示。
1.3典型日负荷曲线提取流程
本发明所提出的典型日负荷曲线提取具体流程为:
1)选择某用户一定周期T内的日负荷数据,提取日负荷率等负 荷特性指标构成向量Yi=[xi1,xi2,......,xin],i=1,2,3......,T;n为同一时刻采样 的特性指标个数;
2)采用非参数核密度估计对负荷特性指标进行概率密度拟合, 得到典型日负荷指标向量Yc=[xc1,xc2,......,xcn],c=1,2,......,T;n为同一时刻 采样的特性指标个数;
3)计算Yi与Yc的欧氏距离di,以此来确定样本日i的负荷曲线权 重wi,i=1,2,......,T;为使得欧式距离越大,曲线所占权重越小,定义计算 公式为:
其中,λ为区间[0,1]内的可调参数,用于调整di对wi的影响程 度;特别的,当λ=0时,利用下一步骤中公式(6)所计算出的典型 日负荷曲线即为对所有样本日负荷曲线求取算术平均所得的平均负 荷曲线.在此取λ=0.5计算典型日负荷曲线;
4)对样本日的日负荷曲线进行加权叠加,最终得到所需的典型 日负荷曲线;设样本日i的日负荷数据为Li=[li1,li2,......,li24],典型日负 荷数据为Lc=[lc1,lc2,......,lc24],其中lct(t=1,2,…,24)的计算公式为:
2用于曲线聚类的SMMC算法改进策略
针对本发明要解决的负荷曲线聚类问题,本发明基于谱多流形聚 类算法的思路,对算法中相似性矩阵的构建过程进行了改进,引入典 型时间翘曲距离来衡量和描述负荷曲线在时间尺度上的相似性,然后 结合高斯核函数反映采样点在空间位置上的相似性,通过两种相似性 的融合,计算并构建新的相似性矩阵W。
2.1时间翘曲距离
时间翘曲距离(canonical warping distance)是利用典型时间 规整(canonicaltime warping,CTW)通过反复迭代对参考序列p 和查询序列q进行空间转换和动态时间规整(dynamic time warping, DTW)来找出两个序列间距离最小的匹配,进而可以采用计算公式(7) 求出典型时间翘曲距离[19]:
其中,p[ni]和q[mi]为序列的对应元素,a和β为用典型相关分析 计算所得的空间变换矩阵。
动态时间规整(DTW)是上世界60年代由日本学者提出,通过规 整语音信号的长度来进行语音识别的一种算法。DTW结合了时间规整 和距离测算,在成对样本时间特征最优匹配的情况下使得样本间差别 最小,即距离测度最小。在CTW的计算中,可以根据计算的实际需要 改变最大迭代次数、在动态时间规整中使用的距离函数等参数。
典型时间规整(CTW)具有三个性质:平移不变性、旋转不变性、 标度不变性。简单来说,若一条曲线是由另一条曲线经过平移、旋转、 放缩或三种变换的任意组合得到的,那么这两条曲线的典型时间翘曲 距离为零。因此,CTW可以最大程度地发掘曲线的相似性,使得典型 时间翘曲距离在曲线相似的情况下数值很小,避免了传统欧式距离测 度算法的局限性。
2.2相似性矩阵
谱多流形聚类为了发掘空间结构,训练若干混合概率主成分分析 器来估计采样点的局部切空间,通过计算数据点间的局部切空间的结 构相似性来计算相似性矩阵W。
而在本发明的曲线聚类研究中,我们并不关注高维空间中采样点 的局部切空间是否相似,而是更加关注数据点本身所具有的时间序列 属性。因此,本发明在构造相似性矩阵时,既计入了数据点之间的欧 氏距离关系pij,又考量了负荷曲线之间典型时间翘曲距离的大小qij。 然后通过一个合适的融合函数将两者结合并计算相似性权值ωij。由 于这样计算得到的W包含了样本点的时间序列信息,使得邻近图的构 造更趋合理,也大大增强了对新样本点的泛化能力。
本发明采用在实际中应用广泛的高斯核函数度量数据点的局部 相似性pij:
其中,xi和xj为样本点内的同一类特性指标,σ为高斯核函数半 径。
将样本点xi和xj的特征向量作为两个序列代入公式(7)计算qij, 如公式(9)所示:
然后需要一个合适的融合函数f将两者融合计算相似性权值:
ωij=f(pij,qij) (10)
在公式(8)中计算的pij是数据点间欧氏距离的单调递减函数, 描述了采样点的局部相似性;而公式(9)计算的qij为距离测度,其 值越小说明相似性越高。因此此处的函数f应为pij的单调递增函数, 是qij的递减函数,在这里本发明对两者做除法取其商来计算相似性 权值,即:
其中,Knn(x)表示点x的K个近邻点。
2.3改进SMMC算法流程
前面两小节详细描述了改进SMMC算法中的关键步骤:相似性矩 阵的构建思路和方法,在此基础上,本发明提出的改进SMMC算法的 具体算法步骤如下:
1)首先构造K-近邻图,即当样本点同一类特性指标xi在xj的K 个近邻点以内或xi在xj的K个近邻点以内时,连接xj和xj两个顶点, i=1,2,......T,j=1,2......T。
2)利用高斯核函数即公式(8)计算采样点的局部相似性pij。
3)利用公式(9)计算采样点间的典型时间翘曲距离qij。
4)构造相似性矩阵,利用公式(11)计算相似性权值wij。
5)根据相似性矩阵W计算对角矩阵D,其中dii=∑jωij。
6)求解非规范拉普拉斯矩阵L=D-W的最小k个特征值对应的特 征向量U。
7)在U构成的特征空间利用K-means将数据点进行聚类。
基于上述算法步骤,利用软件Matlab R2012a进行编程,实现改 进SMMC算法的聚类功能。
3聚类评价指标
本发明选取CH指标(Calinski-Harabasz Index,CHI)来确定 最优聚类数,并以该指标思路为基础设计了一种基于时间翘曲距离的 新指标CHCTW来辅助评价曲线聚类效果。
3.1最优聚类数的确定
良好的聚类结果具有两个特征:高的类内相似性和低的类间相似 性。因此,本发明采用CH指标来确定聚类过程中的最优聚类数。CH 指标综合度量了类间的分离度(用S表示)和类内的紧密度(用M表 示),其值的大小即为分离度和紧密度的比值。具体计算公式为:
式中,K为聚类数,Ci为聚类结果中的第i类,ci为类Ci的聚类 中心,ni为类Ci中的曲线条数,为样本集中N条负荷曲线x1,x2,…,xN的样本中心。则CH指标的计算公式为:
由公式可见,CH指标越大,表明类间越分散且类内越紧凑,即 聚类效果越好。
3.2基于时间翘曲距离的聚类效果评价指标
CH指标本质上是一种基于欧氏距离和“中心化”的聚类有效性 指标,它的类内紧密度和类间分离度分别以类内对象与类中心、类中 心与样本中心的欧氏距离为度量准则。
为全面评价聚类效果,还应从曲线相似程度的角度对聚类结果进 行分析,从而衡量和比较算法的有效性。但若采用CH指标基于欧氏 距离和“中心化”的设计原则,会在一定程度上损失类内曲线的相似 度和类间曲线的差异度,使评价指标难以准确评价聚类效果。
因此,本发明提出了一种基于时间翘曲距离和“去中心化”思想 的曲线聚类评价指标CHCTW,通过计算类间曲线差异度(用S1表示) 与类内曲线相似度(用M1表示)的比值衡量聚类效果。该指标以时间 翘曲距离度量曲线差异度,同时摒弃了类中心和样本中心,在计算过 程中动态地将计算对象作为中心。具体计算公式为:
式中,K为聚类数,Ci为聚类结果中的第i类,ni为类Ci中的曲 线条数;当且仅当nk≥2,k∈[1,K]时公式(16)成立;
CHCTW的计算公式为:
同样,CHCTW指标越大,表明类间曲线愈相异而类内曲线愈相似, 即聚类效果越好。
4算例分析
为验证本发明针对曲线聚类所提方法的有效性,本发明基于软件 Matlab R2012a进行各模块程序的编写和调试(包括负荷指标提取、 概率密度拟合、改进SMMC聚类、聚类评价指标计算等),以进行算例 的验证和分析。首先选取了保定市50个用户在一个月内的负荷数据 构成样本集,首先采用基于非参数核密度拟合的曲线提取方法分别提 取各用户的典型日负荷曲线,然后采用改进谱多流形聚类方法对50 个用户的典型日负荷曲线进行聚类。
4.1基于非参数核密度估计的典型日负荷曲线提取
在选择用户一定周期内的负荷数据构成样本集时,考虑到用户用 电特性受季节变化影响较为明显,因此周期不宜过长;同时也为了保 证典型日曲线的拟合生成具有统计学意义,本发明选择30天作为周 期。本发明以某用户为例,首先从样本集中该用户的日负荷数据中提 取负荷特性指标,然后利用非参数核密度估计方法对各指标的概率密 度曲线进行拟合,并辅以正态分布拟合作为对比,拟合过程如图1所 示:
在非参数核密度估计中,带宽越大,拟合曲线越平滑;带宽越小, 则曲线越容易出现峰值。由于概率密度函数拟合曲线与横坐标所包络 的面积恒为1,因此对于本发明拟合的单峰概率密度函数来说,带宽 越大,则拟合曲线的峰值越大;带宽越小,拟合曲线峰值越低。换言 之,带宽的大小并不影响峰值的横坐标位置,即对“典型”负荷指标 值的获取并无影响,因此本发明没有在最优带宽的确定上作过于深入 的研究。本发明中,五个负荷指标进行拟合时的带宽分别为:0.009, 0.016,0.009,0.016,0.010。
从图中可以看出,非参数核密度估计拟合比正态分布拟合具有更 好的拟合效果。通过概率密度拟合,得到典型日负荷特性指标向量 Yc=[0.795,0.478,1.219,0.822,1.132]。
利用公式(5)计算权重(分别取λ=0,0.5,1)并对样本中的 负荷曲线进行加权叠加后得到三条提取后的负荷曲线,如图2所示。
λ=0对应的负荷曲线表示所有曲线经过简单的算术平均所得到 的平均负荷曲线,从图中可以看出,该曲线由于过于“平均化”使其 难以准确表现用户的用电特性;而取λ=1所提取的负荷曲线更注重于 表现用户多数情况下的用电情形,在全面性上稍有欠缺。综合对比三 者的表现,本发明取λ=0.5计算提取典型日负荷曲线。
4.2基于改进SMMC算法的负荷曲线聚类
在提取了样本中50个用户的共50条典型日负荷曲线后,考虑到 不同用户间负荷数据的数量级不同,因此为了消除此影响,本发明在 聚类前首先对每条负荷曲线采取除以该曲线最大负荷值的归一化处 理方法。然后采用改进SMMC算法对50条负荷曲线进行聚类。
4.2.1最优聚类数的确定
为确定最优聚类数,首先设置不同的聚类数依次进行聚类,并记 录CH指标的值。除本发明所提算法外,还采用了K-means算法进行 对比。本发明用两种方法对比了聚类数K的取值从2到20的情形, 实验各进行10次,对于每个聚类数,取对应的CHI最大值作为该算法在该聚类数下的最优聚类结果,实验结果如图3所示:
由图可知,采用改进SMMC聚类算法的最优聚类数为7,此时CHI 为73.86。而采用K-means算法的最优聚类数为8,对应的CHI为 68.25,低于前者。因此本发明将聚类数定为7,对样本进行聚类和 作图,结果如图4所示.
4.2.2聚类效果评价
本发明采用了经典的CH指标和本发明提出的CHCTW指标分别从 欧氏距离角度和曲线相似性角度对聚类效果进行对比评估。同时,考 虑到聚类算法的稳定性是衡量算法性能的一个重要指标,因此本发明 也从算法稳定性的角度对算法性能进行了对比分析。
具体来说,本发明采用改进SMMC和K-means两种算法对聚类数 K从2到20的情形分别了进行10次实验,将CHI达到10次实验中 最大值的情况称为“达到最优聚类”,本发明将达到最优聚类的次数 作为衡量算法稳定性的依据。
将改进SMMC和K-means两种算法在聚类数为5~10情形下的CHI、 CHCTW指标和达到最优聚类的次数进行对比展示,如表2所示:
表2两种方法聚类效果对比
Tab.2 Clustering results’comparison of two methods
从表中可以看出,聚类数为7时CHCTW指标也达到了最大,这也 反映出本发明将最优聚类数定为7的正确性。为更加直观地分析算法 稳定性,将两种算法10次聚类的CHI绘图展示,如图5、图6所
从图中明显可以看出,改进SMMC算法的稳定性优于K-means算 法。结合表2和图5、图6,通过利用三种指标对比评估两种算法的 聚类效果,可得出本发明所提的改进SMMC算法全面优于K-means算 法。
5结论
针对用户负荷曲线聚类问题,本发明分别提出了新型的典型日负 荷曲线提取方法和改进谱多流形聚类算法。首先基于负荷特性指标提 取和非参数核密度拟合对用户的典型日负荷曲线进行提取,然后采用 改进谱多流形聚类算法对若干用户的负荷曲线进行聚类。结合本发明 提出的聚类评价指标,全面对聚类算法的性能和聚类效果进行对比分析。通过算例验证表明:
1)本发明提出的典型日负荷曲线提取方法能够发掘用户的典型 负荷曲线形态并全面而准确地反映用户的用电特性和规律。
2)本发明所提的改进谱多流形聚类算法在曲线聚类问题上具有 良好的效果,在聚类有效性和算法稳定性方面均优于K-means算法。
Claims (5)
1.一种基于改进谱多流形聚类的负荷曲线聚类方法,其特征在于:该方法包括如下步骤:
(1)基于非参数核密度估计的典型日负荷曲线提取
首先选择某用户一定周期T内的日负荷数据,从每个样本日日负荷曲线中提取负荷特性指标,得到每个样本日的日负荷特性指标向量Yi=[xi1,xi2,......,xin],i=1,2,3......,T;n为同一时刻采样的特性指标个数;采用非参数核密度估计方法对每个样本日日负荷曲线中提取的负荷特性指标进行概率密度拟合,进而确定周期T内的典型日负荷指标向量Yc=[xc1,xc2,......,xcn],c=1,2,......,T;n为同一时刻采样的特性指标个数;根据每个样本日的日负荷特性指标向量Yi;以及周期T内的典型日负荷指标向量Yc;确定每个相应样本日的日负荷负荷曲线权重wi,i=1,2,......,T;然后对每个样本日的日负荷曲线进行加权叠加,最终得到所需的典型日负荷曲线;
(2)对谱多流形聚类算法的改进
首先构造K-近邻图,即当样本点同一类特性指标xi在xj的K个近邻点以内或xi在xj的K个近邻点以内时,连接xj和xj两个顶点,i=1,2,......T,j=1,2......T;
利用高斯核函数即公式(8)计算采样点的局部相似性pij;
<mrow>
<msub>
<mi>p</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>j</mi>
</msub>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
</mrow>
<mrow>
<mn>2</mn>
<msup>
<mi>&sigma;</mi>
<mn>2</mn>
</msup>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,xi和xj为样本点内的同一类特性指标,σ为高斯核函数半径;
利用公式(7)、(9)计算采样点间的典型时间翘曲距离qij;
<mrow>
<mi>C</mi>
<mi>T</mi>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>p</mi>
<mo>,</mo>
<mi>q</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</msubsup>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&alpha;</mi>
<mi>i</mi>
</msub>
<mo>&CenterDot;</mo>
<mi>p</mi>
<mo>&lsqb;</mo>
<msub>
<mi>n</mi>
<mi>i</mi>
</msub>
<mo>&rsqb;</mo>
<mo>-</mo>
<msub>
<mi>&beta;</mi>
<mi>i</mi>
</msub>
<mo>&CenterDot;</mo>
<mi>q</mi>
<mo>&lsqb;</mo>
<msub>
<mi>m</mi>
<mi>i</mi>
</msub>
<mo>&rsqb;</mo>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>q</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>r</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</msubsup>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&alpha;</mi>
<mi>r</mi>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>&lsqb;</mo>
<msub>
<mi>n</mi>
<mi>r</mi>
</msub>
<mo>&rsqb;</mo>
<mo>-</mo>
<msub>
<mi>&beta;</mi>
<mi>r</mi>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>x</mi>
<mi>j</mi>
</msub>
<mo>&lsqb;</mo>
<msub>
<mi>m</mi>
<mi>r</mi>
</msub>
<mo>&rsqb;</mo>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,xi[nr]和xj[mr]为样本同一类特性指标序列的对应元素,ar和βr为用典型相关分析计算所得的空间变换矩阵;
构造相似性矩阵W,利用公式(11)计算相似性权值ωij;
<mrow>
<msub>
<mi>&omega;</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mfrac>
<msub>
<mi>p</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<msub>
<mi>q</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mfrac>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>&Element;</mo>
<mi>K</mi>
<mi>n</mi>
<mi>n</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>11</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Knn(x)表示点x的K个近邻点;
根据相似性矩阵W计算对角矩阵D,其中
求解非规范拉普拉斯矩阵L=D-W的最小k个特征值对应的特征向量U;
在U构成的特征空间利用K-means将数据点进行聚类。
2.根据权利要求1所述的一种基于改进谱多流形聚类的负荷曲线聚类方法,其特征在于:所述负荷特性指标为从日负荷曲线中提取日负荷率、日峰谷差率、峰期负载率、平期负载率、谷期负载率。
3.根据权利要求1所述的一种基于改进谱多流形聚类的负荷曲线聚类方法,其特征在于:所述的非参数核密度估计方法为
令第n个特性指标xn的T个样本为x1n,x2n,x3n,......,xTn则基于非参数核密度理论可得负荷特性指标xn的概率密度函数fk(xn),如式(1)所示:
<mrow>
<msub>
<mi>f</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>n</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mi>T</mi>
<mi>h</mi>
</mrow>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<mi>H</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mrow>
<msub>
<mi>x</mi>
<mi>n</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>n</mi>
</mrow>
</msub>
</mrow>
<mi>h</mi>
</mfrac>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
式中:h为带宽;T为样本数;xin为第n个特性指标的第i个样本值;H为核函数;
为保证被估计概率密度函数的连续性,核函数通常为关于y轴对称的单峰平滑概率密度函数,其需满足式(2)特性:
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mo>&Integral;</mo>
<mi>K</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mi>d</mi>
<mi>x</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>&Integral;</mo>
<mi>x</mi>
<mi>K</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mi>d</mi>
<mi>x</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>&Integral;</mo>
<msup>
<mi>x</mi>
<mn>2</mn>
</msup>
<mi>K</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mi>d</mi>
<mi>x</mi>
<mo>=</mo>
<mi>c</mi>
<mo>></mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
式中:c为大于0的常数;
最常用的核函数有Epanechikov函数和Gaussian函数,本发明选择Gaussian核函数,如式(3)所示;
<mrow>
<mi>K</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<msqrt>
<mrow>
<mn>2</mn>
<mi>&pi;</mi>
</mrow>
</msqrt>
</mfrac>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<mfrac>
<msup>
<mi>x</mi>
<mn>2</mn>
</msup>
<mn>2</mn>
</mfrac>
</mrow>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
4.根据权利要求1所述的一种基于改进谱多流形聚类的负荷曲线聚类方法,其特征在于:所述典型日负荷曲线提取步骤如下:
1)选择某用户一定周期T内的日负荷数据,提取日负荷率等负荷特性指标构成向量Yi=[xi1,xi2,......,xin],i=1,2,3......,T;n为同一时刻采样的特性指标个数;
2)采用非参数核密度估计对负荷特性指标进行概率密度拟合,得到典型日负荷指标向量Yc=[xc1,xc2,......,xcn],c=1,2,......,T;n为同一时刻采样的特性指标个数;
3)计算Yi与Yc的欧氏距离di,以此来确定样本日i的负荷曲线权重wi,i=1,2,......,T;为使得欧式距离越大,曲线所占权重越小,定义计算公式为:
<mrow>
<msub>
<mi>w</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<msup>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>/</mo>
<msub>
<mi>d</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>&lambda;</mi>
</msup>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mi>i</mi>
<mi>T</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>/</mo>
<msub>
<mi>d</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>&lambda;</mi>
</msup>
</mrow>
</mfrac>
<mo>,</mo>
<mi>&lambda;</mi>
<mo>&Element;</mo>
<mo>&lsqb;</mo>
<mn>0</mn>
<mo>,</mo>
<mn>1</mn>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,λ为区间[0,1]内的可调参数,用于调整di对wi的影响程度;特别的,当λ=0时,利用下一步骤中公式(6)所计算出的典型日负荷曲线即为对所有样本日负荷曲线求取算术平均所得的平均负荷曲线.在此取λ=0.5计算典型日负荷曲线;
4)对样本日的日负荷曲线进行加权叠加,最终得到所需的典型日负荷曲线;设样本日i的日负荷数据为Li=[li1,li2,......,li24],典型日负荷数据为Lc=[lc1,lc2,......,lc24],其中lct(t=1,2,…,24)的计算公式为:
<mrow>
<msub>
<mi>l</mi>
<mrow>
<mi>c</mi>
<mi>t</mi>
</mrow>
</msub>
<mo>=</mo>
<mover>
<mi>&Sigma;</mi>
<mn>24</mn>
</mover>
<msub>
<mi>w</mi>
<mi>i</mi>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>l</mi>
<mrow>
<mi>i</mi>
<mi>t</mi>
</mrow>
</msub>
<mo>,</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<mi>T</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
5.根据权利要求1所述的一种基于改进谱多流形聚类的负荷曲线聚类方法,其特征在于:还包括对聚类结果的评价:其是基于时间翘曲距离和“去中心化”思想的曲线聚类评价指标CHCTW,通过计算类间曲线差异度(用S1表示)与类内曲线相似度(用M1表示)的比值衡量聚类效果;该指标以时间翘曲距离度量曲线差异度,同时摒弃了类中心和样本中心,在计算过程中动态地将计算对象作为中心;具体计算公式为:
<mrow>
<msub>
<mi>S</mi>
<mn>1</mn>
</msub>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<mo>&lsqb;</mo>
<mfrac>
<msub>
<mi>n</mi>
<mi>i</mi>
</msub>
<mrow>
<mi>K</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>K</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</munderover>
<munder>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<mi>x</mi>
<mo>&Subset;</mo>
<msub>
<mi>C</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>y</mi>
<mo>&Subset;</mo>
<msub>
<mi>C</mi>
<mi>j</mi>
</msub>
</mrow>
</munder>
<mrow>
<mi>i</mi>
<mo>&NotEqual;</mo>
<mi>j</mi>
</mrow>
</munder>
<mi>C</mi>
<mi>T</mi>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>15</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>M</mi>
<mn>1</mn>
</msub>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<mo>&lsqb;</mo>
<mfrac>
<mn>1</mn>
<mrow>
<msub>
<mi>n</mi>
<mi>k</mi>
</msub>
<mo>-</mo>
<mn>1</mn>
</mrow>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msub>
<mi>n</mi>
<mi>k</mi>
</msub>
</munderover>
<munder>
<munder>
<mi>&Sigma;</mi>
<mrow>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
</msub>
<mo>&Subset;</mo>
<msub>
<mi>C</mi>
<mi>k</mi>
</msub>
</mrow>
</munder>
<mrow>
<mi>j</mi>
<mo>&NotEqual;</mo>
<mi>i</mi>
</mrow>
</munder>
<mi>C</mi>
<mi>T</mi>
<mi>W</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>16</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,K为聚类数,Ci为聚类结果中的第i类,ni为类Ci中的曲线条数;当且仅当nk≥2,k∈[1,K]时公式(16)成立;
CHCTW的计算公式为:
<mrow>
<mi>C</mi>
<mi>H</mi>
<mi>C</mi>
<mi>T</mi>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>K</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>S</mi>
<mn>1</mn>
</msub>
<mo>/</mo>
<mrow>
<mo>(</mo>
<mi>K</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>M</mi>
<mn>1</mn>
</msub>
<mo>/</mo>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>-</mo>
<mi>K</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>17</mn>
<mo>)</mo>
</mrow>
</mrow>
同样,CHCTW指标越大,表明类间曲线愈相异而类内曲线愈相似,即聚类效果越好。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710655501.7A CN107657266B (zh) | 2017-08-03 | 2017-08-03 | 一种基于改进谱多流形聚类的负荷曲线聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710655501.7A CN107657266B (zh) | 2017-08-03 | 2017-08-03 | 一种基于改进谱多流形聚类的负荷曲线聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107657266A true CN107657266A (zh) | 2018-02-02 |
CN107657266B CN107657266B (zh) | 2021-01-08 |
Family
ID=61128295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710655501.7A Expired - Fee Related CN107657266B (zh) | 2017-08-03 | 2017-08-03 | 一种基于改进谱多流形聚类的负荷曲线聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107657266B (zh) |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427967A (zh) * | 2018-03-13 | 2018-08-21 | 范大昭 | 一种实时影像聚类方法 |
CN108460410A (zh) * | 2018-02-08 | 2018-08-28 | 合肥工业大学 | 居民需求侧的用电模式识别方法和系统、存储介质 |
CN108846346A (zh) * | 2018-06-06 | 2018-11-20 | 浙江大学 | 基于密度峰值聚类算法的神经元峰电位在线分类方法 |
CN108959424A (zh) * | 2018-06-11 | 2018-12-07 | 长春电力设计有限公司 | 一种用于电力系统负荷监测的城市用电地图的操作方法 |
CN109376132A (zh) * | 2018-08-01 | 2019-02-22 | 国网浙江省电力有限公司电力科学研究院 | 基于Spark技术的计量设备典型运行曲线评估方法及系统 |
CN109508877A (zh) * | 2018-11-05 | 2019-03-22 | 宁波市胜源技术转移有限公司 | 一种基于聚类对分布式光伏客户进行分类的方法及系统 |
CN109773787A (zh) * | 2018-12-29 | 2019-05-21 | 南京埃斯顿机器人工程有限公司 | 机械设备的控制学习方法及其具备学习功能的服务器系统 |
CN109871860A (zh) * | 2018-11-02 | 2019-06-11 | 湖南大学 | 一种基于核主成分分析的日负荷曲线降维聚类方法 |
CN109886315A (zh) * | 2019-01-29 | 2019-06-14 | 电子科技大学 | 一种基于核保持的图像相似性度量方法 |
CN110009175A (zh) * | 2018-12-25 | 2019-07-12 | 阿里巴巴集团控股有限公司 | Od需求分析算法的性能评估方法和装置 |
CN110610192A (zh) * | 2019-08-07 | 2019-12-24 | 电子科技大学 | 一种频谱空间信道聚类方法 |
CN110619472A (zh) * | 2019-09-19 | 2019-12-27 | 贵州电网有限责任公司 | 一种电力用户典型日负荷曲线编制方法 |
CN110796307A (zh) * | 2019-10-29 | 2020-02-14 | 北京天易数聚科技有限公司 | 一种综合能源系统分布式负荷预测方法及系统 |
CN110796173A (zh) * | 2019-09-27 | 2020-02-14 | 昆明电力交易中心有限责任公司 | 一种基于改进kmeans的负荷曲线形态聚类算法 |
CN110889431A (zh) * | 2019-10-28 | 2020-03-17 | 杭州电子科技大学 | 基于K-Means算法改进的高频职业技能生命曲线聚类方法 |
CN111144440A (zh) * | 2019-11-28 | 2020-05-12 | 中国电力科学研究院有限公司 | 一种专变用户日电力负荷特征的分析方法及装置 |
CN111144481A (zh) * | 2019-12-26 | 2020-05-12 | 厦门大学 | 一种基于谱聚类的单分子电输运数据的聚类方法 |
CN111382794A (zh) * | 2020-03-09 | 2020-07-07 | 浙江工商大学 | 一种曲线相似度计算方法 |
CN111723876A (zh) * | 2020-07-20 | 2020-09-29 | 浙江大学 | 一种考虑双尺度相似性的负荷曲线集成谱聚类算法 |
CN111767273A (zh) * | 2020-06-22 | 2020-10-13 | 清华大学 | 基于改进som算法的数据智能检测方法及装置 |
CN111898903A (zh) * | 2020-07-28 | 2020-11-06 | 北京科技大学 | 一种钢铁产品均匀性和综合质量评估方法及系统 |
CN112149052A (zh) * | 2020-04-30 | 2020-12-29 | 国网湖南省电力有限公司 | 一种基于plr-dtw的日负荷曲线聚类方法 |
CN112766543A (zh) * | 2020-12-31 | 2021-05-07 | 清华大学 | 一种用户集群基线负荷估计方法 |
CN113822319A (zh) * | 2021-07-01 | 2021-12-21 | 湖南大学 | 面向主动配电网的源-荷联合时序场景生成方法和系统 |
CN114266304A (zh) * | 2021-12-20 | 2022-04-01 | 上海应用技术大学 | 一种牵引供电系统电能质量分类管理的PCA—Kmeans聚类方法 |
CN114511040A (zh) * | 2022-03-31 | 2022-05-17 | 北京邮电大学 | 基于ap聚类的网络流量分类方法及装置 |
CN114676587A (zh) * | 2022-04-12 | 2022-06-28 | 北京航空航天大学 | 基于载荷谱相似性的疲劳寿命评估方法 |
CN116109009A (zh) * | 2023-04-10 | 2023-05-12 | 山东理工大学 | 基于多特征量提取的光储型园区负荷曲线动态识别方法 |
CN117076990A (zh) * | 2023-10-13 | 2023-11-17 | 国网浙江省电力有限公司 | 基于曲线降维和聚类的负荷曲线辨识方法、装置及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446967A (zh) * | 2016-10-28 | 2017-02-22 | 国网福建省电力有限公司 | 一种新型电力系统负荷曲线聚类方法 |
US20170091270A1 (en) * | 2015-09-30 | 2017-03-30 | Linkedln Corporation | Organizational url enrichment |
CN106600119A (zh) * | 2016-11-30 | 2017-04-26 | 南方电网科学研究院有限责任公司 | 基于k均值的电力用户聚类方法及装置 |
CN106997426A (zh) * | 2017-03-30 | 2017-08-01 | 东北大学 | 一种基于核密度估计的非侵入式电力负荷辨识方法 |
-
2017
- 2017-08-03 CN CN201710655501.7A patent/CN107657266B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170091270A1 (en) * | 2015-09-30 | 2017-03-30 | Linkedln Corporation | Organizational url enrichment |
CN106446967A (zh) * | 2016-10-28 | 2017-02-22 | 国网福建省电力有限公司 | 一种新型电力系统负荷曲线聚类方法 |
CN106600119A (zh) * | 2016-11-30 | 2017-04-26 | 南方电网科学研究院有限责任公司 | 基于k均值的电力用户聚类方法及装置 |
CN106997426A (zh) * | 2017-03-30 | 2017-08-01 | 东北大学 | 一种基于核密度估计的非侵入式电力负荷辨识方法 |
Non-Patent Citations (7)
Title |
---|
FENG ZHOU,ET AL.: ""Generalized Canonical Time Warping"", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
IOANNIS P. PANAPAKIDIS,AT EL.: ""Three-stage clustering procedure for deriving the typical load curves of the electricity consumers"", 《IEEE》 * |
U. MAULIK,AT EL.: ""Performance evaluation of some clustering algorithms and validity indices"", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
孙彦萍等: ""基于SOM需求响应潜力的居民用户优化聚合模型"", 《电力建设》 * |
王勇: ""基于流形学习的分类与聚类方法及其应用研究"", 《中国博士学位论文全文数据库 信息科技辑》 * |
赵渊等: ""基于序贯仿真和非参数核密度估计的大电网可靠性评估"", 《电力系统自动化》 * |
马瑞等: ""考虑气温因素的负荷特性统计指标关联特征数据挖掘"", 《中国电机工程学报》 * |
Cited By (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460410A (zh) * | 2018-02-08 | 2018-08-28 | 合肥工业大学 | 居民需求侧的用电模式识别方法和系统、存储介质 |
CN108427967A (zh) * | 2018-03-13 | 2018-08-21 | 范大昭 | 一种实时影像聚类方法 |
CN108427967B (zh) * | 2018-03-13 | 2021-08-27 | 中国人民解放军战略支援部队信息工程大学 | 一种实时影像聚类方法 |
CN108846346A (zh) * | 2018-06-06 | 2018-11-20 | 浙江大学 | 基于密度峰值聚类算法的神经元峰电位在线分类方法 |
CN108959424A (zh) * | 2018-06-11 | 2018-12-07 | 长春电力设计有限公司 | 一种用于电力系统负荷监测的城市用电地图的操作方法 |
CN108959424B (zh) * | 2018-06-11 | 2021-08-20 | 长春电力设计有限公司 | 一种用于电力系统负荷监测的城市用电地图的操作方法 |
CN109376132A (zh) * | 2018-08-01 | 2019-02-22 | 国网浙江省电力有限公司电力科学研究院 | 基于Spark技术的计量设备典型运行曲线评估方法及系统 |
CN109871860A (zh) * | 2018-11-02 | 2019-06-11 | 湖南大学 | 一种基于核主成分分析的日负荷曲线降维聚类方法 |
CN109871860B (zh) * | 2018-11-02 | 2022-12-13 | 湖南大学 | 一种基于核主成分分析的日负荷曲线降维聚类方法 |
CN109508877A (zh) * | 2018-11-05 | 2019-03-22 | 宁波市胜源技术转移有限公司 | 一种基于聚类对分布式光伏客户进行分类的方法及系统 |
CN110009175A (zh) * | 2018-12-25 | 2019-07-12 | 阿里巴巴集团控股有限公司 | Od需求分析算法的性能评估方法和装置 |
CN109773787A (zh) * | 2018-12-29 | 2019-05-21 | 南京埃斯顿机器人工程有限公司 | 机械设备的控制学习方法及其具备学习功能的服务器系统 |
CN109886315A (zh) * | 2019-01-29 | 2019-06-14 | 电子科技大学 | 一种基于核保持的图像相似性度量方法 |
CN110610192B (zh) * | 2019-08-07 | 2022-03-15 | 电子科技大学 | 一种频谱空间信道聚类方法 |
CN110610192A (zh) * | 2019-08-07 | 2019-12-24 | 电子科技大学 | 一种频谱空间信道聚类方法 |
CN110619472A (zh) * | 2019-09-19 | 2019-12-27 | 贵州电网有限责任公司 | 一种电力用户典型日负荷曲线编制方法 |
CN110796173A (zh) * | 2019-09-27 | 2020-02-14 | 昆明电力交易中心有限责任公司 | 一种基于改进kmeans的负荷曲线形态聚类算法 |
CN110889431A (zh) * | 2019-10-28 | 2020-03-17 | 杭州电子科技大学 | 基于K-Means算法改进的高频职业技能生命曲线聚类方法 |
CN110796307B (zh) * | 2019-10-29 | 2022-07-22 | 北京天易数聚科技有限公司 | 一种综合能源系统分布式负荷预测方法及系统 |
CN110796307A (zh) * | 2019-10-29 | 2020-02-14 | 北京天易数聚科技有限公司 | 一种综合能源系统分布式负荷预测方法及系统 |
CN111144440A (zh) * | 2019-11-28 | 2020-05-12 | 中国电力科学研究院有限公司 | 一种专变用户日电力负荷特征的分析方法及装置 |
CN111144481A (zh) * | 2019-12-26 | 2020-05-12 | 厦门大学 | 一种基于谱聚类的单分子电输运数据的聚类方法 |
CN111144481B (zh) * | 2019-12-26 | 2022-06-21 | 厦门大学 | 一种基于谱聚类的单分子电输运数据的聚类方法 |
CN111382794A (zh) * | 2020-03-09 | 2020-07-07 | 浙江工商大学 | 一种曲线相似度计算方法 |
CN111382794B (zh) * | 2020-03-09 | 2023-04-25 | 浙江工商大学 | 一种曲线相似度计算方法 |
CN112149052A (zh) * | 2020-04-30 | 2020-12-29 | 国网湖南省电力有限公司 | 一种基于plr-dtw的日负荷曲线聚类方法 |
CN112149052B (zh) * | 2020-04-30 | 2023-07-11 | 国网湖南省电力有限公司 | 一种基于plr-dtw的日负荷曲线聚类方法 |
CN111767273B (zh) * | 2020-06-22 | 2023-05-23 | 清华大学 | 基于改进som算法的数据智能检测方法及装置 |
CN111767273A (zh) * | 2020-06-22 | 2020-10-13 | 清华大学 | 基于改进som算法的数据智能检测方法及装置 |
CN111723876B (zh) * | 2020-07-20 | 2021-09-28 | 浙江大学 | 一种考虑双尺度相似性的负荷曲线集成谱聚类方法 |
CN111723876A (zh) * | 2020-07-20 | 2020-09-29 | 浙江大学 | 一种考虑双尺度相似性的负荷曲线集成谱聚类算法 |
CN111898903A (zh) * | 2020-07-28 | 2020-11-06 | 北京科技大学 | 一种钢铁产品均匀性和综合质量评估方法及系统 |
CN112766543A (zh) * | 2020-12-31 | 2021-05-07 | 清华大学 | 一种用户集群基线负荷估计方法 |
CN112766543B (zh) * | 2020-12-31 | 2022-12-09 | 清华大学 | 一种用户集群基线负荷估计方法 |
CN113822319A (zh) * | 2021-07-01 | 2021-12-21 | 湖南大学 | 面向主动配电网的源-荷联合时序场景生成方法和系统 |
CN113822319B (zh) * | 2021-07-01 | 2024-04-19 | 湖南大学 | 面向主动配电网的源-荷联合时序场景生成方法和系统 |
CN114266304A (zh) * | 2021-12-20 | 2022-04-01 | 上海应用技术大学 | 一种牵引供电系统电能质量分类管理的PCA—Kmeans聚类方法 |
CN114266304B (zh) * | 2021-12-20 | 2023-09-22 | 上海应用技术大学 | 一种牵引供电系统电能质量分类管理的PCA—Kmeans聚类方法 |
CN114511040A (zh) * | 2022-03-31 | 2022-05-17 | 北京邮电大学 | 基于ap聚类的网络流量分类方法及装置 |
CN114676587B (zh) * | 2022-04-12 | 2022-09-23 | 北京航空航天大学 | 基于载荷谱相似性的疲劳寿命评估方法 |
CN114676587A (zh) * | 2022-04-12 | 2022-06-28 | 北京航空航天大学 | 基于载荷谱相似性的疲劳寿命评估方法 |
CN116109009A (zh) * | 2023-04-10 | 2023-05-12 | 山东理工大学 | 基于多特征量提取的光储型园区负荷曲线动态识别方法 |
CN117076990A (zh) * | 2023-10-13 | 2023-11-17 | 国网浙江省电力有限公司 | 基于曲线降维和聚类的负荷曲线辨识方法、装置及介质 |
CN117076990B (zh) * | 2023-10-13 | 2024-02-27 | 国网浙江省电力有限公司 | 基于曲线降维和聚类的负荷曲线辨识方法、装置及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107657266B (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107657266A (zh) | 一种基于改进谱多流形聚类的负荷曲线聚类方法 | |
Wang et al. | The impact of regional financial development on economic growth in Beijing–Tianjin–Hebei region: A spatial econometric analysis | |
Panapakidis et al. | Pattern recognition algorithms for electricity load curve analysis of buildings | |
Zhang et al. | Measuring and improving regional energy security: A methodological framework based on both quantitative and qualitative analysis | |
CN109617231A (zh) | 一种用于低压台区的用户网络拓扑识别装置及方法 | |
CN106446967A (zh) | 一种新型电力系统负荷曲线聚类方法 | |
CN106408008A (zh) | 一种基于负荷曲线距离和形状的负荷分类方法 | |
CN106203478A (zh) | 一种用于智能电表大数据的负荷曲线聚类方法 | |
Tan | An improved KNN text classification algorithm based on K-medoids and rough set | |
Xiao et al. | Multistage decision support framework for sites selection of solar power plants with probabilistic linguistic information | |
CN107133652A (zh) | 基于K‑means聚类算法的用电客户价值评估方法及系统 | |
CN105740635B (zh) | 一种变压器电磁设计方案的云理想解评价方法 | |
CN110111024A (zh) | 基于ahp模糊综合评价模型的科技成果市场价值评估方法 | |
CN111723876B (zh) | 一种考虑双尺度相似性的负荷曲线集成谱聚类方法 | |
CN104376402B (zh) | 一种基于频域指标的负荷特性分类与综合方法 | |
CN110473140A (zh) | 一种基于图嵌入的极限学习机的图像降维方法 | |
CN107341479A (zh) | 一种基于加权稀疏协作模型的目标跟踪方法 | |
CN106886923A (zh) | 一种区域配电网能源费用托管服务定价方法 | |
Yang et al. | Investigating regional disparities of China’s human development with cluster analysis: A historical perspective | |
Jiaojiao et al. | Survey of small object detection methods based on deep learning | |
CN106022578A (zh) | 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法 | |
CN108898273A (zh) | 一种基于形态分析的用户侧负荷特征聚类评价方法 | |
CN110363384A (zh) | 基于深度加权神经网络的异常用电检测方法 | |
CN104778280B (zh) | 基于近邻传播的文本数据流聚类算法 | |
CN107169114A (zh) | 一种海量数据多维排序搜索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210108 Termination date: 20210803 |