CN110321390A - 基于有监督和无监督算法结合的负荷曲线数据可视化方法 - Google Patents
基于有监督和无监督算法结合的负荷曲线数据可视化方法 Download PDFInfo
- Publication number
- CN110321390A CN110321390A CN201910481049.6A CN201910481049A CN110321390A CN 110321390 A CN110321390 A CN 110321390A CN 201910481049 A CN201910481049 A CN 201910481049A CN 110321390 A CN110321390 A CN 110321390A
- Authority
- CN
- China
- Prior art keywords
- load curve
- neural network
- curve data
- data
- supervision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 38
- 238000013079 data visualisation Methods 0.000 title claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 239000011159 matrix material Substances 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000005259 measurement Methods 0.000 claims abstract description 13
- 230000003595 spectral effect Effects 0.000 claims abstract description 7
- 239000010410 layer Substances 0.000 claims description 20
- 210000002569 neuron Anatomy 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims description 12
- 238000012544 monitoring process Methods 0.000 claims description 8
- 230000001537 neural effect Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000012800 visualization Methods 0.000 claims description 3
- 239000011229 interlayer Substances 0.000 claims description 2
- 210000004218 nerve net Anatomy 0.000 claims 1
- 230000000007 visual effect Effects 0.000 claims 1
- 238000005457 optimization Methods 0.000 abstract description 6
- 238000012706 support-vector machine Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 13
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,首先,基于距离与曲线形态的双尺度相似性度量,采用无监督优化谱聚类算法获得负荷曲线精准标签数据;其次,采用稀疏自动编码器神经网络学习大规模待分类负荷曲线的内在特征,得到隐藏层权值矩阵即神经网络的优化初始参数;最后,基于已获得的标签数据,训练支持向量机神经网络分类器,实现对大规模待分类负荷曲线的有监督分类。有监督与无监督算法结合能够获得更精确的负荷曲线类别标签数据并一定程度上改进大数据导致的计算效率较低问题。
Description
技术领域
本发明涉及智能电网用户侧负荷数据处理方法,尤其是涉及一种基于有监督和无监督算法结合的负荷曲线数据可视化方法。
背景技术
随着电网用户侧对电能使用多方面要求的提升,社会逐渐暴露出资源短缺等问题。为应对能源短缺问题,国家在接入高比例可再生能源的同时,进一步开放售电市场,使得用户在用电选择上具有更多的自由性。由此带来的用户端的高自由度导致负荷曲线更加趋于多样化。用户用电行为在季节、时段等方面存在一定的潜在规律。采用聚类或分类技术对负荷曲线进行分析,是详细了解用户用电特征的重要手段。电力负荷曲线分类是需求侧管理、负荷建模等工作的重要基础,对电力系统的分析、运行、规划都具有重要意义。
电力负荷曲线分类方法主要有无监督、有监督,以及无监督和有监督结合等方法。负荷曲线无监督分类主要采用基于划分的k-means和模糊C均值聚类、层次聚类、自组织映射聚类等方法。面对当今智能电网大数据场景下电力负荷曲线数量繁多、形态差异显著等问题,较广泛应用的划分式聚类算法仅以单一的传统距离量度方式判断负荷曲线相似度难以有效区分形态差异较大的负荷曲线。负荷数据维数越高,平均距离这一测度的意义就越小。因此,考虑引入皮尔逊相关系数代替欧氏距离判据改善负荷形态聚类效果,但仅能识别出幅度不同形态相似的负荷曲线。还有学者提出一种以余弦相似度作为外层聚类判据,欧式距离作为内层聚类判据的双层聚类分析方法,一定程度上可以有效识别出负荷类型。但是,现有文献大多仅针对距离的相似性度量函数进行优化,并未综合考虑负荷曲线形态特征相似度,因此导致聚类效果并不理想。
负荷曲线有监督分类主要采用基于统计原理的最小距离分类、贝叶斯分类,以及基于人工神经网络的分类等方法。其中,人工神经网络因为其自主学习能力强,容错性能良好等特点应用更为广泛。采用Kohonen神经网络对负荷动态特性进行聚类,验证该神经网络应用于负荷分类的优越性;采用BP神经网络学习负荷动态特性,但BP神经网络的解受训练样本影响较大,这个不足限制了BP神经网络的广泛应用。神经网络的在目前的研究中还存在着训练样本过大导致分类效率低下、训练过程中出现过拟合等问题。
鉴于无监督和有监督分类方法存在的问题,近年来有学者提出采用无监督与有监督相结合的负荷曲线分类方法。利用无监督算法获取标签数据,作为有监督分类算法的训练样本。将无监督算法的复杂度低、适用性强与有监督算法的效率高、描述复杂动态行为效果好等优势相结合。将模糊C均值聚类或k-means聚类与神经网络相结合,一定程度上能够提高海量数据处理效率。但是,现有文献在获取标签数据环节一般仅考虑距离相似度判据,获得的标签数据精准较低,对最终的分类结果会造成一定的影响。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于有监督和无监督算法结合的负荷曲线数据可视化方法。
本发明的目的可以通过以下技术方案来实现:
一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,该方法包括以下步骤:
步骤1:针对输入的用户用电负荷曲线数据通过误差平方和(sum of squarederror,SSE)确定最优聚类数;
步骤2:选取输入的用户用电负荷曲线数据中的部分数据通过无监督双尺度谱聚类对其进行聚类,获得类别标签数据;
步骤3:通过稀疏自编码算法学习输入的用户用电负荷曲线数据的内在特征并初始化神经网络分类器;
步骤4:利用步骤2中的类别标签数据训练步骤3中的神经网络分类器,获取训练完成的神经网络分类器;
步骤5:将步骤1中的输入的用户用电负荷曲线数据通过训练完成的神经网络分类器进行有监督数据分类,获得经过有监督数据分类的用户用电负荷曲线数据;
步骤6:将经过有监督数据分类的用户用电负荷曲线数据传输至用于电力调配的可视化设备上并显示。
进一步地,所述步骤2包括以下分步骤:
步骤21:根据欧式距离公式判断输入的用户用电负荷曲线数据中的部分数据的距离相似度并建立距离相似性度量矩阵;
步骤22:根据相关性系数公式判断输入的用户用电负荷曲线数据中的部分数据的形态相似度并建立形态相似性度量矩阵;
步骤23:根据距离相似性度量矩阵和形态相似性度量矩阵建立双尺度相似性度量矩阵并对其进行谱聚类,获得类别标签数据。
进一步地,所述步骤21中的欧式距离公式为:
式中,ai,j表示彼此i和j两条用户用电负荷曲线数据之间的欧式距离,m表示维数,k、i和j均为自然数,xi,k和xj,k分别表示彼此i和j两条用户用电负荷曲线数据中对应第k点的数据值。
进一步地,所述步骤22中的相关性系数公式为:
式中,bij表示彼此i和j两条用户用电负荷曲线数据之间的相关距离,表示第i条用户用电负荷曲线数据平均值,表示第j条用户用电负荷曲线数据平均值。
进一步地,所述步骤23中的双尺度相似性度量矩阵为:
P=αA+βB,α+β=1
式中,P表示双尺度相似性度量矩阵,A表示距离相似性度量矩阵,B表示形态相似性度量矩阵,α和β分别为距离相似性度量矩阵和形态相似性度量矩阵的权重参数。
进一步地,所述步骤4包括以下分步骤:
步骤41:设置神经网络分类器的初步参数,所述初步参数包括训练学习率,稀疏参数、随机权值矩阵和随机偏移矩阵;
步骤42:设置神经网络分类器前向算法中的训练次数、迭代次数,并进一步得出神经网络分类器隐藏层神经元的平均激活量;
步骤43:对神经网络分类器输出层的每一个神经元经过稀疏代价函数处理后反向传播更新层间连接权值,至此神经网络分类器设置完毕;
步骤44:利用类别标签数据中的无标签用户负荷数据输入对设置完毕的神经网络分类器进行训练,同时执行前向算法并使用梯度下降算法微调网络参数以提升训练精度,最终获得训练完成的神经网络分类器。
进一步地,所述步骤42中的神经网络分类器隐藏层神经元的平均激活量为:
式中,ρj表示神经网络分类器隐藏层神经元的平均激活量,n表示神经元数量,aj (l)()表示第l层第i个神经元的激活值,x表示输入负荷曲线数据矩阵,l为自然数。
进一步地,所述步骤6中的可视化设备包括显示器、投影仪和电力监控仪。
与现有技术相比,本发明具有以下优点:
(1)本发明采用基于距离和曲线形态双尺度相似性度量的优化谱聚类算法,获得更精确的负荷曲线类别标签数据,引入稀疏自动编码器优化神经网络分类器实现更好效果的负荷曲线分类,数据处理精确度更高。
(2)本发明中双尺度相似性度量能够克服仅根据距离判断曲线相似性带来的局限,同时分析曲线波动特征从而保证数据聚类的准确性与有效性,提高标签数据的精度,对SAE自编码算法内部参数进行优化,进一步提高神经网络对负荷数据的适应度。使用数据内在特征矩阵初始化SVM支持向量机神经网络训练,使分类器经训练后具有较强的分类能力,SAE自编码算法与SVM支持向量机神经网络结合在数据分类适确性、轮廓系数以及有效性等指标上表现更佳,对于用户负荷曲线分类更加有效,计算效率一定程度上得到提升。
附图说明
图1为本发明的方法流程示意图;
图2为本发明方法的用户负荷数据特征学习与分类网络结构图;
图3为本发明方法确定稀疏自动编码器参数中神经元数量对聚类效果的影响效果图;
图4为本发明方法确定稀疏自动编码器参数中稀疏参数对聚类效果的影响效果图;
图5为本发明方法确定聚类数的误差平方和SSE曲线图;
图6为本方法用户负荷曲线分类第一结果图;
图7为本方法用户负荷曲线分类第二结果图;
图8为本方法用户负荷曲线分类第三结果图;
图9为本方法用户负荷曲线分类第四结果图;
图10为本方法用户负荷曲线分类第五结果图;
图11为本方法用户负荷曲线分类第六结果图;
图12为本发明用户负荷曲线分类后获得的典型负荷曲线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
实施例
如图1所示为本发明基于有监督和无监督算法结合的负荷曲线数据可视化方法的具体流程示意图,具体包括以下步骤:
1)通过误差平方和(sum of squared error,SSE)确定最优聚类数K;
2)选取部分负荷曲线,通过双尺度谱聚类对其进行聚类,获得类别标签数据;
21)距离相似性度量:
采用欧氏距离判断曲线之间的距离相似性。欧氏距离指在m维空间中两点之间的真实距离。负荷曲线xi与yi之间的欧氏距离定义为:
式中,ai,j表示彼此i和j两条用户用电负荷曲线数据之间的欧式距离,m表示维数,k、i和j均为自然数,xi,k和xj,k分别表示彼此i和j两条用户用电负荷曲线数据中对应第k点的数据值。
22)形态相似性度量:
判断曲线之间形态特征的相似性。采取相关距离对曲线形态波动特征进行度量。负荷曲线xi与yi之间的相关性系数定义为:
相关距离定义为:
bij=1-b′ij
式中,bij表示彼此i和j两条用户用电负荷曲线数据之间的相关距离,表示第i条用户用电负荷曲线数据平均值,表示第j条用户用电负荷曲线数据平均值。
23)双尺度相似性度量:
综合考虑曲线距离与形态特征,在谱聚类中采用双尺度相似性度量矩阵。根据欧氏距离与形态相关距离获得的相似度矩阵,采用极值归一化方法分别对两个矩阵归一处理,得到相应的矩阵A与B,双尺度相似度矩阵定义为:
P=αA+βB,α+β=1
式中,P表示双尺度相似性度量矩阵,A表示距离相似性度量矩阵,B表示形态相似性度量矩阵,α和β分别为距离相似性度量矩阵和形态相似性度量矩阵的权重参数。
参数确定方法:首先设定计算步长为0.1,进行10次计算,找出聚类效果最优的权重参数,之后在该权重值两侧区间内设定计算步长为0.01,以此逐渐找出最优权重。
3)通过SAE学习负荷曲线的内在特征简明表达并初始化神经网络;
4)采用标签数据训练神经网络分类器;
41)用无标签用户负荷数据训练稀疏自动编码器。首先,设置训练学习率、稀疏参数ρ等参数,权值矩阵W与偏移矩阵b初始值随机获得。随后,设置前向算法中的训练次数、迭代次数,通过前向算法计算隐藏层神经元的平均激活量ρj。
式中,ρj表示神经网络分类器隐藏层神经元的平均激活量,n表示神经元数量,aj (l)()表示第l层第i个神经元的激活值,x表示输入负荷曲线数据矩阵,l为自然数。
对输出层的每一个神经元计算稀疏代价函数并通过反向传播更新神经网络的层间连接权值,从而获得数据低维表达;
42)使用步骤41)中学习得到连接权值初始化网络,执行前向计算并使用梯度下降算法对网络参数进行微调以提升训练精度;
5)对重表达后的N条负荷曲线通过训练好的神经网络分类器进行分类,获得最终分类结果。
如图2为本发明方法的用户负荷数据特征学习与分类网络结构图,本发明采用的SAE优化SVM分类器的训练主要分为3个步骤。
1)用无标签用户负荷数据x1训练稀疏自动编码器。
首先,设置训练学习率、稀疏参数ρ等参数,权值矩阵W与偏移矩阵b初始值随机获得。随后,设置前向算法中的训练次数、迭代次数,通过前向算法计算隐藏层神经元的平均激活量ρj。对输出层的每一个神经元计算稀疏代价函数并通过反向传播更新神经网络的层间连接权值。
2)采用有标签数据(x2,y2)训练SVM分类器。
使用步骤1)中学习得到的权值矩阵W和偏移矩阵b初始化网络,执行前向计算并使用梯度下降算法对网络参数进行微调以提升训练精度。使用优化标签数据对神经网络进行训练。
3)采用完成学习的神经网络实现对无标签用户负荷曲线的分类并与现有方法进行对比检验分类效果。
如图3、图4分别为本发明方法确定稀疏自动编码器参数(神经元数量与稀疏参数)对聚类效果的影响图;DBI指标表示类内距离平均值之和与类间距离之比的最大值,其值越小表示不同类相离越远,聚类效果越好。SC指数结合内聚度和分离度两种因素评价聚类效果。SC的取值范围为[-1,1],越接近边界值表示聚类效果越好。由此可以确定稀疏自动编码器神经元数量为30,稀疏参数为0.1。
如图5本发明方法确定聚类数的SSE曲线图,根据SSE曲线的拐点确定最优聚类数K=6。
如图6~图11为采用本发明方法用户负荷曲线分类多个结果图;如图12为本方法用户负荷曲线分类后获得的典型负荷曲线图。典型负荷曲线能够清楚展示六类负荷曲线的波动状况。负荷存在平峰、双峰及多峰的用电特性,典型负荷曲线表明本文的分类方法能够较为明了的将多种用电特性区分开来。本发明所提方法突破了仅基于距离相似性分类的局限,通过负荷波动特征实现了不同类别的有效区分,表示出各类负荷在某一时间段的典型用电特征,有利于提供更加精确的发电指导与用户用电方案,为负荷曲线精确建模提供良好的实践基础。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,该方法包括以下步骤:
步骤1:针对输入的用户用电负荷曲线数据通过误差平方和确定最优聚类数;
步骤2:选取输入的用户用电负荷曲线数据中的部分数据通过无监督双尺度谱聚类对其进行聚类,获得类别标签数据;
步骤3:通过稀疏自编码算法学习输入的用户用电负荷曲线数据的内在特征并初始化神经网络分类器;
步骤4:利用步骤2中的类别标签数据训练步骤3中的神经网络分类器,获取训练完成的神经网络分类器;
步骤5:将步骤1中的输入的用户用电负荷曲线数据通过训练完成的神经网络分类器进行有监督数据分类,获得经过有监督数据分类的用户用电负荷曲线数据;
步骤6:将经过有监督数据分类的用户用电负荷曲线数据传输至用于电力调配的可视化设备上并显示。
2.根据权利要求1所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤2包括以下分步骤:
步骤21:根据欧式距离公式判断输入的用户用电负荷曲线数据中的部分数据的距离相似度并建立距离相似性度量矩阵;
步骤22:根据相关性系数公式判断输入的用户用电负荷曲线数据中的部分数据的形态相似度并建立形态相似性度量矩阵;
步骤23:根据距离相似性度量矩阵和形态相似性度量矩阵建立双尺度相似性度量矩阵并对其进行谱聚类,获得类别标签数据。
3.根据权利要求2所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤21中的欧式距离公式为:
式中,ai,j表示彼此i和j两条用户用电负荷曲线数据之间的欧式距离,m表示维数,k、i和j均为自然数,xi,k和xj,k分别表示彼此i和j两条用户用电负荷曲线数据中对应第k点的数据值。
4.根据权利要求2所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤22中的相关性系数公式为:
式中,bij表示彼此i和j两条用户用电负荷曲线数据之间的相关距离,表示第i条用户用电负荷曲线数据平均值,表示第j条用户用电负荷曲线数据平均值。
5.根据权利要求2所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤23中的双尺度相似性度量矩阵为:
P=αA+βB,α+β=1
式中,P表示双尺度相似性度量矩阵,A表示距离相似性度量矩阵,B表示形态相似性度量矩阵,α和β分别为距离相似性度量矩阵和形态相似性度量矩阵的权重参数。
6.根据权利要求1所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤4包括以下分步骤:
步骤41:设置神经网络分类器的初步参数,所述初步参数包括训练学习率,稀疏参数、随机权值矩阵和随机偏移矩阵;
步骤42:设置神经网络分类器前向算法中的训练次数、迭代次数,并进一步得出神经网络分类器隐藏层神经元的平均激活量;
步骤43:对神经网络分类器输出层的每一个神经元经过稀疏代价函数处理后反向传播更新层间连接权值,至此神经网络分类器设置完毕;
步骤44:利用类别标签数据中的无标签用户负荷数据输入对设置完毕的神经网络分类器进行训练,同时执行前向算法并使用梯度下降算法微调网络参数以提升训练精度,最终获得训练完成的神经网络分类器。
7.根据权利要求6所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤42中的神经网络分类器隐藏层神经元的平均激活量为:
式中,ρj表示神经网络分类器隐藏层神经元的平均激活量,n表示神经元数量,aj (l)()表示第l层第i个神经元的激活值,x表示输入负荷曲线数据矩阵,l为自然数。
8.根据权利要求1所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤6中的可视化设备包括显示器、投影仪和电力监控仪。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910481049.6A CN110321390A (zh) | 2019-06-04 | 2019-06-04 | 基于有监督和无监督算法结合的负荷曲线数据可视化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910481049.6A CN110321390A (zh) | 2019-06-04 | 2019-06-04 | 基于有监督和无监督算法结合的负荷曲线数据可视化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110321390A true CN110321390A (zh) | 2019-10-11 |
Family
ID=68119377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910481049.6A Pending CN110321390A (zh) | 2019-06-04 | 2019-06-04 | 基于有监督和无监督算法结合的负荷曲线数据可视化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110321390A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689092A (zh) * | 2019-10-18 | 2020-01-14 | 大连海事大学 | 一种基于数据导向的鞋底花纹图像深度聚类方法 |
CN111507297A (zh) * | 2020-04-24 | 2020-08-07 | 中国科学院空天信息创新研究院 | 一种基于度量信息矩阵的雷达信号识别方法及系统 |
CN113361454A (zh) * | 2021-06-25 | 2021-09-07 | 东南大学 | 一种基于非监督优化的深度学习非侵入式负荷监测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205449A (zh) * | 2015-08-24 | 2015-12-30 | 西安电子科技大学 | 基于深度学习的手语识别方法 |
CN106022509A (zh) * | 2016-05-07 | 2016-10-12 | 国网浙江省电力公司经济技术研究院 | 考虑地域和负荷性质双重差异的配电网空间负荷预测方法 |
CN106447133A (zh) * | 2016-11-03 | 2017-02-22 | 上海交通大学 | 一种基于深度自编码网络的短期电力负荷预测方法 |
CN107016241A (zh) * | 2017-04-05 | 2017-08-04 | 重庆交通大学 | 基于加噪样本增强深度自编码学习网络的旋转机械寿命阶段识别方法 |
CN109165743A (zh) * | 2018-07-17 | 2019-01-08 | 东南大学 | 一种基于深度压缩自编码器的半监督网络表示学习算法 |
-
2019
- 2019-06-04 CN CN201910481049.6A patent/CN110321390A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205449A (zh) * | 2015-08-24 | 2015-12-30 | 西安电子科技大学 | 基于深度学习的手语识别方法 |
CN106022509A (zh) * | 2016-05-07 | 2016-10-12 | 国网浙江省电力公司经济技术研究院 | 考虑地域和负荷性质双重差异的配电网空间负荷预测方法 |
CN106447133A (zh) * | 2016-11-03 | 2017-02-22 | 上海交通大学 | 一种基于深度自编码网络的短期电力负荷预测方法 |
CN107016241A (zh) * | 2017-04-05 | 2017-08-04 | 重庆交通大学 | 基于加噪样本增强深度自编码学习网络的旋转机械寿命阶段识别方法 |
CN109165743A (zh) * | 2018-07-17 | 2019-01-08 | 东南大学 | 一种基于深度压缩自编码器的半监督网络表示学习算法 |
Non-Patent Citations (2)
Title |
---|
屈相帅等: "基于稀疏自动编码器深度神经网络的电能质量扰动分类方法", 《电力自动化设备》 * |
朱誉等: "基于典型场景集的虚拟电厂与配电网协同定价策略", 《电力建设》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689092A (zh) * | 2019-10-18 | 2020-01-14 | 大连海事大学 | 一种基于数据导向的鞋底花纹图像深度聚类方法 |
CN110689092B (zh) * | 2019-10-18 | 2022-06-14 | 大连海事大学 | 一种基于数据导向的鞋底花纹图像深度聚类方法 |
CN111507297A (zh) * | 2020-04-24 | 2020-08-07 | 中国科学院空天信息创新研究院 | 一种基于度量信息矩阵的雷达信号识别方法及系统 |
CN113361454A (zh) * | 2021-06-25 | 2021-09-07 | 东南大学 | 一种基于非监督优化的深度学习非侵入式负荷监测方法 |
CN113361454B (zh) * | 2021-06-25 | 2024-04-09 | 东南大学 | 一种基于非监督优化的深度学习非侵入式负荷监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106779087B (zh) | 一种通用机器学习数据分析平台 | |
CN109492667A (zh) | 一种用于非侵入式电力负荷监测的特征选择辨识方法 | |
WO2021073462A1 (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN108280479B (zh) | 一种基于负荷特性指标加权聚类算法的电网用户分类方法 | |
CN110321390A (zh) | 基于有监督和无监督算法结合的负荷曲线数据可视化方法 | |
CN108681973A (zh) | 电力用户的分类方法、装置、计算机设备和存储介质 | |
CN103049651A (zh) | 一种用于电力负荷聚类的方法及装置 | |
CN108363810A (zh) | 一种文本分类方法及装置 | |
CN108764366A (zh) | 针对非均衡数据的特征选择和聚类抽样集成二分类方法 | |
CN101907681A (zh) | 基于gsd_svdd的模拟电路动态在线故障诊断方法 | |
CN108333468B (zh) | 一种有源配电网下不良数据的识别方法及装置 | |
CN109461025A (zh) | 一种基于机器学习的电能替代潜在客户预测方法 | |
CN108876797A (zh) | 一种基于Spiking-SOM神经网络聚类的图像分割系统及方法 | |
CN108805193A (zh) | 一种基于混合策略的电力缺失数据填充方法 | |
CN111242161B (zh) | 一种基于智能学习的非侵入式非居民用户负荷辨识方法 | |
CN110533116A (zh) | 基于欧式距离的自适应集成的不平衡数据分类方法 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN105740635B (zh) | 一种变压器电磁设计方案的云理想解评价方法 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN110321940A (zh) | 飞行器遥测数据特征提取与分级分类方法及装置 | |
Bidoki et al. | Evaluating different clustering techniques for electricity customer classification | |
CN110458189A (zh) | 压缩感知和深度卷积神经网络电能质量扰动分类方法 | |
CN109284851A (zh) | 一种适用于需求侧响应的用户用电行为分类方法 | |
CN109242174A (zh) | 一种基于决策树的季节性负荷自适应划分方法 | |
CN109374997A (zh) | 基于vmd初始化s变换的混合动力系统电能质量扰动检测与评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191011 |
|
RJ01 | Rejection of invention patent application after publication |