CN117473365A - 基于需求侧响应的用户分类方法及装置 - Google Patents

基于需求侧响应的用户分类方法及装置 Download PDF

Info

Publication number
CN117473365A
CN117473365A CN202311402124.8A CN202311402124A CN117473365A CN 117473365 A CN117473365 A CN 117473365A CN 202311402124 A CN202311402124 A CN 202311402124A CN 117473365 A CN117473365 A CN 117473365A
Authority
CN
China
Prior art keywords
chromosome
feature
characteristic
indexes
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311402124.8A
Other languages
English (en)
Inventor
杨迪
吕云彤
王飞
李宏博
霍伟
张辰灏
林跻云
葛鑫鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
North China Electric Power University
Marketing Service Center of State Grid Hebei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
North China Electric Power University
Marketing Service Center of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, North China Electric Power University, Marketing Service Center of State Grid Hebei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202311402124.8A priority Critical patent/CN117473365A/zh
Publication of CN117473365A publication Critical patent/CN117473365A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2111Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2131Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physiology (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)

Abstract

本发明提供一种基于需求侧响应的用户分类方法及装置,属于电力技术领域。该方法包括:获取多个已分类用户的用电负荷曲线和需求响应标签;提取每个用电负荷曲线的时频域特征集,时频域特征集中包含多个特征指标和每个特征指标对应的特征数据;基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,得到目标特征指标;根据目标特征指标对应的特征数据和已分类用户的需求响应标签,对预设的分类器进行训练,得到用户分类模型;基于用户分类模型对待分类用户进行分类。本发明能够提高在需求侧响应方面对用户分类的准确性。

Description

基于需求侧响应的用户分类方法及装置
技术领域
本发明涉及电力技术领域,尤其涉及一种基于需求侧响应的用户分类方法及装置。
背景技术
需求侧资源具有单体容量小、数量众多、分布分散和响应随机性强的特点,通常会以微网、虚拟电厂和需求响应聚合商等聚合形态出现。需求侧响应是用户响应电网的号召,有计划地暂时调整自己的用电情况的行为,可以促进电力系统稳定,因此对用户进行准确的需求响应的分类是非常重要的。
相关技术中的分类方法主要是根据用户的用电负荷数据的用电特征进行分类,但是用电负荷数据具有规模大、维度高、来源类型多、时效特征强和价值密度低等典型特征,这些特征提取难度大,且很多用电特征与需求响应的关联性较弱,难以实现在需求侧响应方面对用户进行准确的分类。
发明内容
本发明实施例提供了一种基于需求侧响应的用户分类方法及装置,以提高在需求侧响应方面对用户分类的准确性。
第一方面,本发明实施例提供了一种基于需求侧响应的用户分类方法,包括:
获取多个已分类用户的用电负荷曲线和需求响应标签;
提取每个用电负荷曲线的时频域特征集,时频域特征集中包含多个特征指标和每个特征指标对应的特征数据;
基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,得到目标特征指标;
根据目标特征指标对应的特征数据和已分类用户的需求响应标签,对预设的分类器进行训练,得到用户分类模型;
基于用户分类模型对待分类用户进行分类。
在一种可能的实现方式中,基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,得到目标特征指标,包括:
设置改进的遗传算法的相关参数,相关参数包括染色体种群的种群大小、最大迭代次数和适应度阈值;
生成种群大小数量的染色体,得到染色体群体,每个染色体中包含预设数量的特征指标,预设数量小于特征指标的总数量;
对于染色体群体中每条染色体,根据该染色体包含的特征指标对应的特征数据,训练多个不同类型的分类器,得到每个分类器的准确率,并基于各个分类器的准确率得到该染色体的适应度值;
对染色体群体中的各条染色体进行遗传操作;
分别计算各条染色体的当前适应度值,并将当前迭代次数加1;
不断迭代,直至当前迭代次数达到最大迭代次数,或者当前染色体群体中最大的适应度值大于适应度阈值;
将适应度值最大的染色体包含的特征指标确定为目标特征指标。
在一种可能的实现方式中,对染色体群体中的各条染色体进行遗传操作,包括:
对染色体群体中的各条染色体进行交叉和变异,得到遗传后的染色体;
检测各条遗传后的染色体中是否存在重复的特征指标;
若存在,则对存在重复的特征指标的染色体重新进行交叉和变异,直至各条遗传后的染色体中均不存在重复的特征指标,则完成遗传操作。
在一种可能的实现方式中,在将适应度值最大的染色体包含的特征指标确定为目标特征指标之后,还包括:
将适应度值最大的染色体对应的准确率最大的分类器作为预设的分类器。
在一种可能的实现方式中,提取每个用电负荷曲线的时频域特征集,包括:
提取用电负荷曲线的不同时段的时域特征指标和每个时域特征指标对应的特征数据;
基于希尔伯特-黄变换提取用电负荷曲线的频域特征指标和每个频域特征指标对应的特征数据。
在一种可能的实现方式中,基于希尔伯特-黄变换提取用电负荷曲线的频域特征指标和每个频域特征指标对应的特征数据,包括:
对用电负荷曲线进行经验模态分解,得到多个经验模态分量;
对每个经验模态分量分别进行希尔伯特-黄变换,得到多个变换分量;
针对每个变换分量,计算瞬时频率的平均值;
基于各个变换分量的瞬时频率的平均值,得到用电负荷曲线的各个频域特征的特征数据。
在一种可能的实现方式中,时域特征指标包括用电功率消耗、用电功率比值和统计特征。
在一种可能的实现方式中,分类器包括以下的至少一种:决策树模型、支持向量机、K-近邻分类算法和人工神经网络模型。
第二方面,本发明实施例提供了一种基于需求侧响应的用户分类装置,包括:
获取模块,用于获取多个已分类用户的用电负荷曲线和需求响应标签;
提取模块,用于提取每个用电负荷曲线的时频域特征集,时频域特征集中包含多个特征指标和每个特征指标对应的特征数据;
筛选模块,用于基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,得到目标特征指标;
训练模块,用于根据目标特征指标对应的特征数据和已分类用户的需求响应标签,对预设的分类器进行训练,得到用户分类模型;
分类模块,用于基于用户分类模型对待分类用户进行分类。
在一种可能的实现方式中,筛选模块具体用于:
设置改进的遗传算法的相关参数,相关参数包括染色体种群的种群大小、最大迭代次数和适应度阈值;
生成种群大小数量的染色体,得到染色体群体,每个染色体中包含预设数量的特征指标,预设数量小于特征指标的总数量;
对于染色体群体中每条染色体,根据该染色体包含的特征指标对应的特征数据,训练多个不同类型的分类器,得到每个分类器的准确率,并基于各个分类器的准确率得到该染色体的适应度值;
对染色体群体中的各条染色体进行遗传操作;
分别计算各条染色体的当前适应度值,并将当前迭代次数加1;
不断迭代,直至当前迭代次数达到最大迭代次数,或者当前染色体群体中最大的适应度值大于适应度阈值;
将适应度值最大的染色体包含的特征指标确定为目标特征指标。
本发明实施例与现有技术相比存在的有益效果是:
本发明实施例通过获取多个已分类用户的用电负荷曲线,进行时频域特征集的提取,能够得到多个与用电负荷曲线相关的特征指标;基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,可以准确地从众多特征指标中筛选出与需求响应的关联性强的特征指标,以便根据关联性强的特征指标进行准确的用户分类;通过筛选得到的目标特征指标对应特征数据和已分类用户的需求响应标签,建立用户分类模型,可以准确地构建关联性强的目标特征指标与用户需求响应的关系,实现对用户的准确分类;通过用户分类模型对待分类用户进行分类,能够快速准确地得到待分类用户的需求响应标签,提高用户分类的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于需求侧响应的用户分类方法的实现流程图;
图2是本发明实施例提供的筛选特征指标的实现流程图;
图3是本发明实施例提供的基于需求侧响应的用户分类装置的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
图1为本发明实施例提供的基于需求侧响应的用户分类方法的实现流程图,详述如下:
步骤S101,获取多个已分类用户的用电负荷曲线和需求响应标签。
在本实施例中,用户主要指能够参与需求响应的用户,例如微网、虚拟电厂和需求响应聚合商等。
用电负荷曲线可以通过智能电表获取,具体可以包括用户接入电网的节点位置、用户负荷功率曲线和时间标签等;需求响应标签为用户进行需求响应的意愿或者概率。
步骤S102,提取每个用电负荷曲线的时频域特征集,时频域特征集中包含多个特征指标和每个特征指标对应的特征数据。
在本实施例中,每个时频域特征集中可以具有相同数量和类型的特征指标,特征指标可以是时域特征指标或者频域特征指标。
时域特征指标可以包括用电功率消耗、用电功率比值和统计特征等;具体的,可以基于需求响应的时段进行划分,提取不同峰谷时段的用电功率消耗、用电功率比值和统计特征。
步骤S103,基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,得到目标特征指标。
在本实施例中,通过改进的遗传算法,对多个特征指标进行筛选,能够筛选出与需求响应的关联性强的特征指标,避免使用大量特征指标和对应的特征数据进行用户的分类,以便提高模型训练的效率和用户分类的准确性。
同时将与需求响应的关联性弱的特征指标去除,也能够避免关联性弱的特征指标对模型训练和用户分类产生的误差影响,进而提高分类的准确性。
步骤S104,根据目标特征指标对应的特征数据和已分类用户的需求响应标签,对预设的分类器进行训练,得到用户分类模型。
在本实施例中,预设的分类器可以是决策树模型、支持向量机(Support VectorMachines,SVM)、K-近邻分类算法(K-Nearest Neighbor,KNN)和人工神经网络模型(Artificial Neural Network,ANN)等分类器,可以根据具体需要进行选择相应的分类器进行训练。
在对分类器进行训练时,可以对特征数据进行划分,其中70%的特征数据作为训练数据,30%的特征数据作为测试数据,也可以根据需要进行调整,训练数据和测试数据的比例在此不进行限制。
步骤S105,基于用户分类模型对待分类用户进行分类。
本发明实施例通过获取多个已分类用户的用电负荷曲线,进行时频域特征集的提取,能够得到多个与用电负荷曲线相关的特征指标;基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,可以准确地从众多特征指标中筛选出与需求响应的关联性强的特征指标,以便根据关联性强的特征指标进行准确的用户分类;通过筛选得到的目标特征指标对应特征数据和已分类用户的需求响应标签,建立用户分类模型,可以准确地构建关联性强的目标特征指标与用户需求响应的关系,实现对用户的准确分类;通过用户分类模型对待分类用户进行分类,能够快速准确地得到待分类用户的需求响应标签,提高用户分类的准确性。
在一种可能的实现方式中,参见图2所示的筛选特征指标的实现流程图,步骤S103基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,得到目标特征指标,可以详述为:
步骤S201,设置改进的遗传算法的相关参数,相关参数包括染色体种群的种群大小、最大迭代次数和适应度阈值。
具体的,图2中的im表示最大迭代次数,fm表示适应度阈值。
步骤S202,生成种群大小数量的染色体,得到染色体群体,每个染色体中包含预设数量的特征指标,预设数量小于特征指标的总数量。
在本实施例中,通过对预设数量的特征指标进行二进制编码得到染色体,具体的,可以是对特征指标所代表的序号进行编码。
例如,预设数量为3,即染色体中包含3个特征指标,则某个染色体的编码可以为0010 1011 0001,其中0010、1011和0001分别表示一种特征指标。
步骤S203,对于染色体群体中每条染色体,根据该染色体包含的特征指标对应的特征数据,训练多个不同类型的分类器,得到每个分类器的准确率,并基于各个分类器的准确率得到该染色体的适应度值。
在本实施例中,染色体的编码中存有的是该染色体包含的特征指标的信息,每个特征指标对应所有已分类用户的该特征指标的特征数据。
通过将染色体包含的特征指标对应的特征数据输入多个不同类型的分类器中进行训练,得到每个分类器的准确率,可以综合多个分类器的结果确定特征指标与需求响应的关联度,具体的,分类器的准确率越高,说明对应的染色体包含的特征指标越优,即特征指标与需求响应的关联度更高,因此,该染色体的适应度值也就越高。
可选的,适应度值可以通过计算各个分类器的准确率的平均值得到。
分类器可以是以下的至少一种:决策树模型、SVM、KNN算法和ANN模型等分类器,在具体使用时,可以根据需要选择多个不同类型的分类器。
在一个具体的实施例中,选择SVM、KNN算法和ANN模型作为分类器,计算染色体的适应度值的过程为:通过对该染色体的编码进行反编码,得到该染色体包含的特征指标;将特征指标对应的特征数据输入SVM、KNN算法和ANN模型中进行训练,分别得到SVM的第一准确率、KNN算法的第二准确率和ANN模型的第三准确率;通过计算第一准确率、第二准确率和第三准确率的平均值,得到该染色体的适应度值。
步骤S204,对染色体群体中的各条染色体进行遗传操作。
在本实施例中,通过对各条染色体进行遗传操作,得到新一代的染色体,使染色体群体朝着更优的方向进化,进而能够选取出与需求响应关联性强的特征指标。
本实施例中的染色体是对特征指标的需要进行编码,在进行遗传操作时,染色体中的编码发生变化,则染色体对应的特征指标也就会发生相应的变化,具体通过对染色体进行反编码或者解码,能够得到该染色体对应的特征指标。
其中遗传操作可以包括选择操作、交叉操作和变异操作。
步骤S205,分别计算各条染色体的当前适应度值,并将当前迭代次数加1。
步骤S206,不断迭代,直至当前迭代次数达到最大迭代次数,或者当前染色体群体中最大的适应度值大于适应度阈值。
具体的,图2中的i表示迭代次数,f表示染色体群体中最大的适应度值。
步骤S207,将适应度值最大的染色体包含的特征指标确定为目标特征指标。
在本实施例中,若当前迭代次数达到最大迭代次数,或者当前染色体群体中最大的适应度值大于适应度阈值,说明通过改进的遗传算法得到最优解,即与需求响应关联度强的特征指标,由于染色体的适应度是根据分类器的准确率得到的,因此,染色体的适应度值最大说明该染色体包含的特征指标对应的特征数据训练得到的分类器的准确率最高,即该染色体包含的特征指标就是与需求响应关联度强的特征指标。基于此,将适应度值最大的染色体包含的特征指标确定为目标特征指标,基于目标特征指标进行分类器的训练和对待分类用户的分类,以便保证对用户分类的准确性。
可选的,在步骤S103基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,得到目标特征指标之前,还包括:
对每个特征指标对应的特征数据进行归一化处理,并分别计算归一化后的每个特征指标对应的特征数据的方差;
保留方差大于预设阈值的特征指标。
在本实施例中,在对特征指标进行筛选之前,还先对特征指标进行初筛。通过计算归一化后的方差,能够明确该特征指标对应的特征数据的离散程度,相应的,也就能够反映出该特征指标对应的特征数据是否对用户的需求响应产生影响。
若特征指标的方差大于预设阈值,说明该特征指标存在的较大的变化幅度,可能与用户的需求响应存在关联;若特征指标的方差不大于预设阈值,说明该特征指标存在的较小的变化幅度,很可能与用户的需求响应不存在关联,并且如果这一类特征指标对应的特征数据获取存在误差,也可能会影响用户分类的准确性,因此,可以保留大于预设阈值的特征指标,去除不大于预设阈值的特征指标,以减小后续通过遗传算法进行筛选的复杂性,以及降低用电负荷曲线中误差数据的影响。
在一种可能的实现方式中,步骤S204对染色体群体中的各条染色体进行遗传操作,可以详述为:
对染色体群体中的各条染色体进行交叉和变异,得到遗传后的染色体;
检测各条遗传后的染色体中是否存在重复的特征指标;
若存在,则对存在重复的特征指标的染色体重新进行交叉和变异,直至各条遗传后的染色体中均不存在重复的特征指标,则完成遗传操作。
在本实施例中,对染色体进行交叉操作和变异操作之后,可能会出现在同一条染色体中包括相同的特征指标的情况,则该染色体对应的特征指标的数量会减少,若此类个体参与后续的种群进化,将导致最终的染色体种群筛选出的特征指标的数量小于算法设定的特征指标的数量,影响训练分类器的准确性。
因此,遍历所有染色体,对具有重复特征指标的染色体重新进行遗传交叉变异的过程,直至所有染色体都不具有重复的特征指标。
在一个具体的实施例中,在经过交叉变异后,染色体的编码中可能存在重复的特征,如编码为0010 1011 0010的染色体,编码长度为三个特征指标,但该个体只具有0010和1011两种特征指标,其中0010特征指标出现重复,因此需要对该染色体重新进行交叉操作和变异操作,使该染色体具有三个特征指标。
在一种可能的实现方式中,在步骤S207将适应度值最大的染色体包含的特征指标确定为目标特征指标之后,还包括:
将适应度值最大的染色体对应的准确率最大的分类器作为预设的分类器。
在本实施例中,适应度值最大的染色体包含的特征指标就是与需求响应关联度强的特征指标,并且将其选取为目标特征指标,进行后续的分类器的训练和对待分类用户的分类,因此选取适应度值最大的染色体对应的准确率最大的分类器作为预设的分类器,能够保证训练得到的分类器的准确率最大,从而保证用户分类的准确性。
其中,在计算染色体的适应度值时,已经计算了染色体包含的特征指标对应的特征数据训练各个分类器的准确率,可以直接根据计算适应度值时的各个分类器的准确率进行分类器的选取。
在一种可能的实现方式中,步骤S102提取每个用电负荷曲线的时频域特征集,可以详述为:
步骤S301,提取用电负荷曲线的不同时段的时域特征指标和每个时域特征指标对应的特征数据;
步骤S302,基于希尔伯特-黄变换提取用电负荷曲线的频域特征指标和每个频域特征指标对应的特征数据。
在本实施例中,在进行时域特征指标和特征数据的提取时,可以针对需求响应窗口进行精确提取,避免选择的特征与需求响应的关联度较弱。具体提取的特征要能够反映需求侧用户不同时段(峰、平、谷)的负荷大小以及负荷波动模式的差异性。
具体的,时域特征指标可以包括用电功率消耗、用电功率比值和统计特征等。其中,用电功率消耗包括冬季平均用电量、夏季平均用电量、工作日平均用电量、非公日平均用电量、峰时段平均用电量和谷时段平均用电量等;用电功率比值包括各个峰时段的用电量与峰时段平均用电量之间的比值、各个谷时段的用电量与谷时段平均用电量之间的比值、各个峰时段的用电量与当日平均用电量的比值和各个谷时段的用电量与当日平均用电量的比值等;统计特征包括冬季平均用电功率方差、夏季平均用电功率方差、工作日平均用电功率方差、非公日平均用电功率方差、峰时段平均用电功率方差和谷时段平均用电功率方差等。
在进行频域特征指标和特征数据的提取方面,目前多采用小波变换的方法进行提取,但是这种方法需要选择合适的小波基,会造成频域特征数据的误差。
因此,本发明考虑采用希尔伯特-黄变换的方式进行频域特征指标的提取,准确得到各个频域特征指标的趋势。
可选的,步骤S302基于希尔伯特-黄变换提取用电负荷曲线的频域特征指标和每个频域特征指标对应的特征数据,可以详述为:
对用电负荷曲线进行经验模态分解,得到多个经验模态分量;
对每个经验模态分量分别进行希尔伯特-黄变换,得到多个变换分量;
针对每个变换分量,计算瞬时频率的平均值;
基于各个变换分量的瞬时频率的平均值,得到用电负荷曲线的各个频域特征的特征数据。
其中,对用电负荷曲线进行经验模态分解,得到多个经验模态分量,包括:
通过拟合用电负荷数据的上包络线和下包络线,并计算上包络线和下包络线的均值;
令用电负荷曲线减去该均值,得到满足模态函数条件的模态分量,若该分量不满足模态条件,则重新拟合用电负荷数据的上包络线和下包络线,直至得到满足条件的模态分量;
在用电负荷曲线中减去该模态分量,得到新的负荷曲线,并在新的负荷曲线中重复减去该模态分量,直至剩余模态分量小于预设分量阈值,得到多个经验模态分量。
在一种可能的实现方式中,步骤S105基于用户分类模型对待分类用户进行分类,可以详述为:
获取待分类用户的用户负荷曲线;
从用户负荷曲线中提取目标特征指标对应的特征数据,并输入至用户分类模型中,得到待分类用户的需求响应标签。
在本实施例中,由于前述步骤已经确定出目标特征指标,因此可以直接提取目标特征指标对应的特征数据,可以减少特征提取过程的复杂性,提高对用户分类的效率。
另外,获取每个已分类用户的需求响应标签,可以是通过问卷调查等方式获取用户参与需求响应的主观意愿,得到用户的需求响应标签;也可以是通过用户实际的需求响应情况确定每个用户的需求响应标签,例如某用户处于需求响应项目实施场景内,获取预设时间内进行需求响应号召的号召次数和用户参与需求响应的参与次数,基于号召次数和参与次数,计算每个用户的需求响应概率,从而得到每个用户的需求响应标签。
在得到待分类用户的需求响应标签之后,配电网或电网公司,能够根据用户的需求响应情况更好地进行局部区域或局部时段的负荷调节,提高配电网运行的稳定性,保障居民、公共服务和重要用户用电。
本发明实施例通过获取多个已分类用户的用电负荷曲线,进行时频域特征集的提取,能够得到多个与用电负荷曲线相关的特征指标;基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,可以准确地从众多特征指标中筛选出与需求响应的关联性强的特征指标,以便根据关联性强的特征指标进行准确的用户分类;其中通过将染色体包含的特征指标对应的特征数据输入多个不同类型的分类器中进行训练,得到每个分类器的准确率,可以综合多个分类器的结果确定特征指标与需求响应的关联度,保证适应度值的合理性,以便选取出合适的特征指标;通过筛选得到的目标特征指标对应特征数据和已分类用户的需求响应标签,建立用户分类模型,可以准确地构建关联性强的目标特征指标与用户需求响应的关系,实现对用户的准确分类;其中通过将适应度值最大的染色体对应的准确率最大的分类器作为预设的分类器,能够保证选择适合目标特征指标的分类器进行训练,提高分类器的准确率;通过用户分类模型对待分类用户进行分类,能够快速准确地得到待分类用户的需求响应标签,提高用户分类的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
图3示出了本发明实施例提供的基于需求侧响应的用户分类装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
如图3所示,基于需求侧响应的用户分类装置30包括:
获取模块31,用于获取多个已分类用户的用电负荷曲线和需求响应标签;
提取模块32,用于提取每个用电负荷曲线的时频域特征集,时频域特征集中包含多个特征指标和每个特征指标对应的特征数据;
筛选模块33,用于基于各个时频域特征集和改进的遗传算法,对多个特征指标进行筛选,得到目标特征指标;
训练模块34,用于根据目标特征指标对应的特征数据和已分类用户的需求响应标签,对预设的分类器进行训练,得到用户分类模型;
分类模块35,用于基于用户分类模型对待分类用户进行分类。
在一种可能的实现方式中,筛选模块33具体用于:
设置改进的遗传算法的相关参数,相关参数包括染色体种群的种群大小、最大迭代次数和适应度阈值;
生成种群大小数量的染色体,得到染色体群体,每个染色体中包含预设数量的特征指标,预设数量小于特征指标的总数量;
对于染色体群体中每条染色体,根据该染色体包含的特征指标对应的特征数据,训练多个不同类型的分类器,得到每个分类器的准确率,并基于各个分类器的准确率得到该染色体的适应度值;
对染色体群体中的各条染色体进行遗传操作;
分别计算各条染色体的当前适应度值,并将当前迭代次数加1;
不断迭代,直至当前迭代次数达到最大迭代次数,或者当前染色体群体中最大的适应度值大于适应度阈值;
将适应度值最大的染色体包含的特征指标确定为目标特征指标。
在一种可能的实现方式中,筛选模块33具体用于:
对染色体群体中的各条染色体进行交叉和变异,得到遗传后的染色体;
检测各条遗传后的染色体中是否存在重复的特征指标;
若存在,则对存在重复的特征指标的染色体重新进行交叉和变异,直至各条遗传后的染色体中均不存在重复的特征指标,则完成遗传操作。
在一种可能的实现方式中,筛选模块33还用于:
将适应度值最大的染色体对应的准确率最大的分类器作为预设的分类器。
在一种可能的实现方式中,提取模块32具体用于:
提取用电负荷曲线的不同时段的时域特征指标和每个时域特征指标对应的特征数据;
基于希尔伯特-黄变换提取用电负荷曲线的频域特征指标和每个频域特征指标对应的特征数据。
在一种可能的实现方式中,提取模块32具体用于:
对用电负荷曲线进行经验模态分解,得到多个经验模态分量;
对每个经验模态分量分别进行希尔伯特-黄变换,得到多个变换分量;
针对每个变换分量,计算瞬时频率的平均值;
基于各个变换分量的瞬时频率的平均值,得到用电负荷曲线的各个频域特征的特征数据。
在一种可能的实现方式中,时域特征指标包括用电功率消耗、用电功率比值和统计特征。
在一种可能的实现方式中,分类器包括以下的至少一种:决策树模型、支持向量机、K-近邻分类算法和人工神经网络模型。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于需求侧响应的用户分类方法,其特征在于,包括:
获取多个已分类用户的用电负荷曲线和需求响应标签;
提取每个用电负荷曲线的时频域特征集,所述时频域特征集中包含多个特征指标和每个特征指标对应的特征数据;
基于各个时频域特征集和改进的遗传算法,对所述多个特征指标进行筛选,得到目标特征指标;
根据目标特征指标对应的特征数据和所述已分类用户的需求响应标签,对预设的分类器进行训练,得到所述用户分类模型;
基于所述用户分类模型对待分类用户进行分类。
2.根据权利要求1所述的基于需求侧响应的用户分类方法,其特征在于,所述基于各个时频域特征集和改进的遗传算法,对所述多个特征指标进行筛选,得到目标特征指标,包括:
设置改进的遗传算法的相关参数,所述相关参数包括染色体种群的种群大小、最大迭代次数和适应度阈值;
生成所述种群大小数量的染色体,得到染色体群体,每个染色体中包含预设数量的特征指标,所述预设数量小于特征指标的总数量;
对于所述染色体群体中每条染色体,根据该染色体包含的特征指标对应的特征数据,训练多个不同类型的分类器,得到每个分类器的准确率,并基于各个分类器的准确率得到该染色体的适应度值;
对所述染色体群体中的各条染色体进行遗传操作;
分别计算各条染色体的当前适应度值,并将当前迭代次数加1;
不断迭代,直至当前迭代次数达到最大迭代次数,或者当前染色体群体中最大的适应度值大于所述适应度阈值;
将适应度值最大的染色体包含的特征指标确定为目标特征指标。
3.根据权利要求2所述的基于需求侧响应的用户分类方法,其特征在于,所述对所述染色体群体中的各条染色体进行遗传操作,包括:
对所述染色体群体中的各条染色体进行交叉和变异,得到遗传后的染色体;
检测各条遗传后的染色体中是否存在重复的特征指标;
若存在,则对存在重复的特征指标的染色体重新进行交叉和变异,直至各条遗传后的染色体中均不存在重复的特征指标,则完成遗传操作。
4.根据权利要求2所述的基于需求侧响应的用户分类方法,其特征在于,在所述将适应度值最大的染色体包含的特征指标确定为目标特征指标之后,还包括:
将适应度值最大的染色体对应的准确率最大的分类器作为预设的分类器。
5.根据权利要求1-4任一项所述的基于需求侧响应的用户分类方法,其特征在于,所述提取每个用电负荷曲线的时频域特征集,包括:
提取用电负荷曲线的不同时段的时域特征指标和每个时域特征指标对应的特征数据;
基于希尔伯特-黄变换提取用电负荷曲线的频域特征指标和每个频域特征指标对应的特征数据。
6.根据权利要求5所述的基于需求侧响应的用户分类方法,其特征在于,所述基于希尔伯特-黄变换提取用电负荷曲线的频域特征指标和每个频域特征指标对应的特征数据,包括:
对用电负荷曲线进行经验模态分解,得到多个经验模态分量;
对每个经验模态分量分别进行希尔伯特-黄变换,得到多个变换分量;
针对每个变换分量,计算瞬时频率的平均值;
基于各个变换分量的瞬时频率的平均值,得到用电负荷曲线的各个频域特征的特征数据。
7.根据权利要求5所述的基于需求侧响应的用户分类方法,其特征在于,所述时域特征指标包括用电功率消耗、用电功率比值和统计特征。
8.根据权利要求2所述的基于需求侧响应的用户分类方法,其特征在于,所述分类器包括以下的至少一种:决策树模型、支持向量机、K-近邻分类算法和人工神经网络模型。
9.一种基于需求侧响应的用户分类装置,其特征在于,包括:
获取模块,用于获取多个已分类用户的用电负荷曲线和需求响应标签;
提取模块,用于提取每个用电负荷曲线的时频域特征集,所述时频域特征集中包含多个特征指标和每个特征指标对应的特征数据;
筛选模块,用于基于各个时频域特征集和改进的遗传算法,对所述多个特征指标进行筛选,得到目标特征指标;
训练模块,用于根据目标特征指标对应的特征数据和所述已分类用户的需求响应标签,对预设的分类器进行训练,得到所述用户分类模型;
分类模块,用于基于所述用户分类模型对待分类用户进行分类。
10.根据权利要求9所述的基于需求侧响应的用户分类装置,其特征在于,筛选模块具体用于:
设置改进的遗传算法的相关参数,所述相关参数包括染色体种群的种群大小、最大迭代次数和适应度阈值;
生成所述种群大小数量的染色体,得到染色体群体,每个染色体中包含预设数量的特征指标,所述预设数量小于特征指标的总数量;
对于所述染色体群体中每条染色体,根据该染色体包含的特征指标对应的特征数据,训练多个不同类型的分类器,得到每个分类器的准确率,并基于各个分类器的准确率得到该染色体的适应度值;
对所述染色体群体中的各条染色体进行遗传操作;
分别计算各条染色体的当前适应度值,并将当前迭代次数加1;
不断迭代,直至当前迭代次数达到最大迭代次数,或者当前染色体群体中最大的适应度值大于所述适应度阈值;
将适应度值最大的染色体包含的特征指标确定为目标特征指标。
CN202311402124.8A 2023-10-26 2023-10-26 基于需求侧响应的用户分类方法及装置 Pending CN117473365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311402124.8A CN117473365A (zh) 2023-10-26 2023-10-26 基于需求侧响应的用户分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311402124.8A CN117473365A (zh) 2023-10-26 2023-10-26 基于需求侧响应的用户分类方法及装置

Publications (1)

Publication Number Publication Date
CN117473365A true CN117473365A (zh) 2024-01-30

Family

ID=89638973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311402124.8A Pending CN117473365A (zh) 2023-10-26 2023-10-26 基于需求侧响应的用户分类方法及装置

Country Status (1)

Country Link
CN (1) CN117473365A (zh)

Similar Documents

Publication Publication Date Title
Jiang et al. A fused load curve clustering algorithm based on wavelet transform
CN103324980A (zh) 一种风电场风速预测方法
CN111861013B (zh) 一种电力负荷预测方法及装置
CN111724278A (zh) 一种面向电力多元负荷用户的精细分类方法及系统
CN110544177A (zh) 基于电力指纹的负荷识别方法及计算机可读存储介质
CN111489188B (zh) 一种居民可调负荷潜力挖掘方法及系统
CN114241779B (zh) 一种城市快速路交通流短时预测方法、计算机及存储介质
CN113240011A (zh) 一种深度学习驱动的异常识别与修复方法及智能化系统
CN112085111B (zh) 一种负荷辨识方法和装置
CN115423013A (zh) 电力系统运行方式分类方法、装置、设备及介质
Xue et al. Adaptive ultra-short-term wind power prediction based on risk assessment
CN114925767A (zh) 一种基于变分自编码器的场景生成方法和装置
CN116826710A (zh) 基于负荷预测的削峰策略推荐方法、装置及存储介质
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN110909786A (zh) 一种基于特性指标与决策树模型的新装用户负荷辨识方法
CN113094448B (zh) 住宅空置状态的分析方法及分析装置、电子设备
CN114202174A (zh) 一种电价风险等级预警方法、装置及存储介质
CN110516849A (zh) 一种基于典型日负荷曲线的负荷分类结果评价方法
CN111417132B (zh) 小区的划分方法、装置及设备
Guo et al. Short-term EV charging load forecasting based on GA-GRU model
CN117473365A (zh) 基于需求侧响应的用户分类方法及装置
CN112508363A (zh) 基于深度学习的电力信息系统状态分析方法及装置
CN115952906A (zh) 一种基于lsgan-gru的短期光伏功率预测方法、系统、设备及介质
Yang et al. Genetic k-means-algorithm-based classification of direct load-control curves
CN115081515A (zh) 能效评价模型构建方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination