CN111914899A - 一种结合人工规则与机器学习的电力负荷识别方法 - Google Patents
一种结合人工规则与机器学习的电力负荷识别方法 Download PDFInfo
- Publication number
- CN111914899A CN111914899A CN202010622793.6A CN202010622793A CN111914899A CN 111914899 A CN111914899 A CN 111914899A CN 202010622793 A CN202010622793 A CN 202010622793A CN 111914899 A CN111914899 A CN 111914899A
- Authority
- CN
- China
- Prior art keywords
- sample
- machine learning
- artificial
- decision tree
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000010801 machine learning Methods 0.000 title claims abstract description 34
- 238000003066 decision tree Methods 0.000 claims abstract description 35
- 239000013598 vector Substances 0.000 claims abstract description 17
- 238000005192 partition Methods 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 238000007418 data mining Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种结合人工规则与机器学习的电力负荷识别方法。由人工规则决策树和机器学习分类器组成,设每个待识别样本具有n维特征,将待识别样本的n维特征输入人工规则决策树得到m维输出,将样本原有n维特征与人工规则决策树得到m维输出拼接作为样本新的m+n维特征向量,将m+n维特征向量输入机器学习分类器进行分类并输出负荷识别结果。实现了专家经验和数据挖掘的有机结合,利用专家经验的同时减小了其主观性的影响,从而有效利用专家经验和数据挖掘成果提高负荷识别的准确性。
Description
技术领域
本发明涉及负荷识别领域,特别是涉及一种结合人工规则与机器学习的电力负荷识别方法。
背景技术
电力负荷识别技术是实现精细化电网需求侧管理和个性化家庭用电管理的重要基础。目前所提出的负荷识别方法数量众多,主要可以分为基于专家经验的人工规则设置方法和完全基于数据驱动的机器学习方法。从本质上来说两种方法各有优劣:人工规则设置的方法往往基于专家对于电器结构组成、功能用途的准确把握,更加能够反映电器工作特性的本质;机器学习方法基于大量电器工作量测数据与分类标签,能够挖掘出人工难以觉察的数据之间的关联。
基于此,如果能够将人工规则与机器学习方法相结合就可以结合两者的优点,实现更好的效果。
发明内容
为实现专家经验与机器学习方法在负荷识别中的融合,本发明提供一种结合人工规则与机器学习的电力负荷识别方法。
一种结合人工规则与机器学习的电力负荷识别方法,包括人工规则决策树和机器学习分类器,设每个待识别样本具有n维特征,负荷识别方法步骤包括:
将待识别样本的n维特征输入人工规则决策树得到m维输出;
将待识别样本原有的n维特征与人工规则决策树得到的m维输出拼接作为样本新的m+n维特征向量;
将m+n维特征向量输入机器学习分类器进行分类并输出负荷识别结果。
进一步地,结合人工规则与机器学习方法的负荷识别方法的模型训练过程为:
将训练样本集划分为样本集1和样本集2;
人为指定用于分类的数据特征项作为人工规则决策树各分枝的划分特征,但不设划分阈值;
利用样本集1对人工规则决策树进行训练,确定各划分特征的划分阈值;
对样本集2,将其中每个样本经人工规则决策树的输出结果与样本集2原有特征向量拼接组成新的样本特征向量,进一步训练机器学习分类器。
进一步地,按任意方法从训练样本集中抽取出样本集1和样本集2,两个样本集的数据可以有重叠。
进一步地,所述利用样本集1对人工规则决策树进行训练,确定各划分特征的划分阈值中,采用Gini系数确定划分阈值。
进一步地,所述的机器学习分类器采用决策树、人工神经网络、支持向量机中的任一种或几种的组合。
与现有技术相比,本发明实现的有益效果是:本发明将人工规则与机器学习方法结合起来,利用专家经验的同时减小了其主观性的影响,从而有效利用专家经验和数据挖掘成果提高负荷识别的准确性。
附图说明
图1是本发明提供的一种结合人工规则与机器学习的电力负荷识别方法的识别过程示意图。
图2是本发明提供的一种结合人工规则与机器学习的电力负荷识别方法的模型训练过程示意图。
图3是本发明实施例中人工规则决策树的训练过程示意图。
图4是本发明实施例中的人工规则决策树结构。
具体实施方式
本发明提供的一种结合人工规则与机器学习的电力负荷识别方法的思想在于,人工规则基于专家经验选择划分特征往往是符合负荷工作特性、具有较高参考价值的,但是人工确定的划分阈值具有很强的主观性,一般不够准确,故采用人工确定划分特征而通过样本数据训练确定划分阈值的方法。人工规则决策树的输出没有作为结论而是拼接到样本特征向量中作为下次分类器的输入,进一步减小了人工主观性的影响。在训练过程中将训练样本集划分为2个子集分别训练人工规则决策树和机器学习分类器,用以抑制过拟合。
一种结合人工规则与机器学习的电力负荷识别方法包括人工规则决策树和机器学习分类器,设每个待识别样本具有n维特征,负荷识别方法步骤包括:
步骤1.1:将待识别样本的n维特征输入人工规则决策树得到m维输出;
步骤1.2:将待识别样本原有的n维特征与人工规则决策树得到的m维输出拼接作为样本新的m+n维特征向量;
步骤1.3:将m+n维特征向量输入机器学习分类器进行分类并输出负荷识别结果。
机器学习分类器采用决策树、人工神经网络、支持向量机中的任一种或几种的组合。
本实施例提供的识别方法在使用前需要先对模型进行训练,然后再采用得到的模型进行识别分类。具体的模型训练过程为:
步骤2.1:按任意方法从训练样本集中抽取出样本集1和样本集2,两个样本集的数据可以有重叠。本实施例中,负荷工作特征采用电压有效值、电流有效值、功率因数、有功功率、无功功率和电流的0到11次谐波。获取训练样本集,将其中1/3划分至样本集1,其余2/3划分到样本集2。
步骤2.2:指定用于分类的数据特征项作为人工规则决策树各分枝的划分特征,但不设划分阈值,如图3所示,图3左图中问号表示该特征的划分阈值为未知数待确定。本实施例中,人工规则决策树特征选择如图4所示,特征1:有功功率、特征2:功率因数、特征3:3次谐波含量。
步骤2.3:利用样本集1对人工规则决策树进行训练,确定各划分特征的划分阈值,如图3所示,图3右图中a、b、c即表示训练得到的特征1、2、3的划分阈值。本实施例采用Gini系数确定划分阈值,采用样本集1按照决策树常规训练方法确定各划分阈值。本实施例最终得到的人工规则决策树如图4所示,分别采用有功功率、特功率因数、3次谐波含量作为划分特征,其划分阈值分别为a、b、c。
步骤2.4:对样本集2,将其中每个样本经人工规则决策树的输出结果与样本集2原有特征向量拼接组成新的样本特征向量,进一步训练机器学习分类器;
其中,步骤2.1和步骤2.2的顺序可以交换。
本实施例中,机器学习分类器采用具有3个隐层的人工神经网络,利用样本集2中各样本和样本集2各样本经过人工规则决策树输出拼接后的样本采用遗传算法对人工神经网络进行训练。
训练完成后,本实施例的负荷识别分类过程如图1所示,待分类的样本特征向量先输入人工规则决策树,将人工规则决策树的输出与原特征向量拼接后送入本实施例训练的人工神经网络进行分类,以人工神经网络的分类结果为最终的负荷识别结果。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (5)
1.一种结合人工规则与机器学习的电力负荷识别方法,其特征在于,包括人工规则决策树和机器学习分类器,设每个待识别样本具有n维特征,所述负荷识别方法步骤包括:
将待识别样本的n维特征输入人工规则决策树得到m维输出;
将待识别样本原有的n维特征与人工规则决策树得到的m维输出拼接作为样本新的m+n维特征向量;
将m+n维特征向量输入机器学习分类器进行分类并输出负荷识别结果。
2.根据权利要求1所述的一种结合人工规则与机器学习的电力负荷识别方法,其特征在于,结合人工规则与机器学习方法的负荷识别方法的模型训练过程为:
将训练样本集划分为样本集1和样本集2;
人为指定用于分类的数据特征项作为人工规则决策树各分枝的划分特征,但不设划分阈值;
利用样本集1对人工规则决策树进行训练,确定各划分特征的划分阈值;
对样本集2,将其中每个样本经人工规则决策树的输出结果与样本集2原有特征向量拼接组成新的样本特征向量,进一步训练机器学习分类器。
3.根据权利要求2所述的一种结合人工规则与机器学习的电力负荷识别方法,其特征在于:按任意方法从训练样本集中抽取出样本集1和样本集2,两个样本集的数据允许有重叠。
4.根据权利要求2所述的一种结合人工规则与机器学习的电力负荷识别方法,其特征在于:所述利用样本集1对人工规则决策树进行训练,确定各划分特征的划分阈值中,采用Gini系数确定划分阈值。
5.根据权利要求1所述的一种结合人工规则与机器学习的电力负荷识别方法,其特征在于:所述的机器学习分类器采用决策树、人工神经网络、支持向量机中的任一种或几种的组合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010622793.6A CN111914899B (zh) | 2020-06-30 | 2020-06-30 | 一种结合人工规则与机器学习的电力负荷识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010622793.6A CN111914899B (zh) | 2020-06-30 | 2020-06-30 | 一种结合人工规则与机器学习的电力负荷识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111914899A true CN111914899A (zh) | 2020-11-10 |
CN111914899B CN111914899B (zh) | 2023-09-15 |
Family
ID=73226829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010622793.6A Active CN111914899B (zh) | 2020-06-30 | 2020-06-30 | 一种结合人工规则与机器学习的电力负荷识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111914899B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909912A (zh) * | 2019-10-08 | 2020-03-24 | 西安交通大学 | 基于自适应误差反馈的园区电力系统净负荷组合预测方法 |
CN110956220A (zh) * | 2019-12-11 | 2020-04-03 | 深圳市活力天汇科技股份有限公司 | 一种非侵入式家用电器负荷识别方法 |
-
2020
- 2020-06-30 CN CN202010622793.6A patent/CN111914899B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909912A (zh) * | 2019-10-08 | 2020-03-24 | 西安交通大学 | 基于自适应误差反馈的园区电力系统净负荷组合预测方法 |
CN110956220A (zh) * | 2019-12-11 | 2020-04-03 | 深圳市活力天汇科技股份有限公司 | 一种非侵入式家用电器负荷识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111914899B (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108876054B (zh) | 基于改进遗传算法优化极限学习机的短期电力负荷预测方法 | |
CN109829236B (zh) | 一种基于XGBoost特征提取的压缩机故障诊断方法 | |
CN110298391A (zh) | 一种基于小样本的迭代式增量对话意图类别识别方法 | |
CN103116766B (zh) | 一种基于增量神经网络和子图编码的图像分类方法 | |
CN108921294A (zh) | 一种用于神经网络加速的渐进式块知识蒸馏方法 | |
CN108197773A (zh) | 电力负荷预测方法、电力负荷预测装置及终端设备 | |
CN110569925B (zh) | 应用于电力设备运检的基于lstm的时序异常检测方法 | |
CN110544177A (zh) | 基于电力指纹的负荷识别方法及计算机可读存储介质 | |
CN109861211B (zh) | 一种基于数据驱动的配电网动态重构方法 | |
CN103324954A (zh) | 一种基于树结构的图像分类方法及其系统 | |
CN110516065A (zh) | 一种基于多路动态掩码的注意力神经网络的方法 | |
CN112862065B (zh) | 一种基于多任务图神经网络的电网支路参数辨识方法 | |
CN110689162B (zh) | 一种基于用户侧分类的母线负荷预测方法、装置及系统 | |
CN109829549A (zh) | 基于演化树的哈希学习方法及其无监督的在线哈希学习方法 | |
CN109740057B (zh) | 一种基于知识萃取的增强神经网络及信息推荐方法 | |
CN109766935A (zh) | 一种基于超图p-Laplacian图卷积神经网络的半监督分类方法 | |
CN111104972A (zh) | 基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法 | |
CN113240011A (zh) | 一种深度学习驱动的异常识别与修复方法及智能化系统 | |
CN113536509B (zh) | 一种基于图卷积网络的微电网拓扑辨识方法 | |
CN113283179A (zh) | 一种基于多目标lstm集成网络的短期负荷预测方法 | |
CN111652478B (zh) | 基于伞式算法的电力系统电压稳定评估误分类约束方法 | |
CN110212551A (zh) | 基于卷积神经网络的微网无功自动控制方法 | |
CN111737907A (zh) | 一种基于深度学习和dga的变压器故障诊断方法及装置 | |
CN108629627A (zh) | 一种移动广告的自动投放控制方法 | |
CN110783913A (zh) | 基于群的计及预想事故集最佳电网拓扑在线优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |