CN114565033A - 储能运行工况特征参数体系构建方法、系统及存储介质 - Google Patents

储能运行工况特征参数体系构建方法、系统及存储介质 Download PDF

Info

Publication number
CN114565033A
CN114565033A CN202210169787.9A CN202210169787A CN114565033A CN 114565033 A CN114565033 A CN 114565033A CN 202210169787 A CN202210169787 A CN 202210169787A CN 114565033 A CN114565033 A CN 114565033A
Authority
CN
China
Prior art keywords
data
energy storage
operation condition
bag
characteristic parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210169787.9A
Other languages
English (en)
Inventor
陈继忠
闫涛
张敏
赵军
杨水丽
常潇
王凯丰
李相俊
张明霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Electric Power Research Institute Of Sepc
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
State Grid Electric Power Research Institute Of Sepc
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Electric Power Research Institute Of Sepc, State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI filed Critical State Grid Electric Power Research Institute Of Sepc
Priority to CN202210169787.9A priority Critical patent/CN114565033A/zh
Publication of CN114565033A publication Critical patent/CN114565033A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J15/00Systems for storing electric energy
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种储能运行工况特征参数体系构建方法、系统及存储介质,方法包括:收集储能系统典型工况运行数据;通过数据预处理从储能系统典型工况运行数据中获取多个运行工况特征集;构建随机森林模型,并计算每个运行工况特征集的重要性度量;计算每个运行工况特征集的重要性度量标准差;选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。本发明能够实现对储能系统多目标应用场景工况的有效表征,并且对工况运行数据的异常值和噪声有很强的容忍度,能够从实际储能系统所涵盖的多维度应用场景出发,对大量储能系统实际运行工况特征参数作出快速、准确、无偏估计的筛选,构建适用于多场景、高准确度的储能运行工况特性表征体系。

Description

储能运行工况特征参数体系构建方法、系统及存储介质
技术领域
本发明属于电化学储能技术领域,具体涉及一种储能运行工况特征参数体系构建方法、系统及存储介质。
背景技术
电化学储能技术对推动能源绿色转型,应对极端事件,保障能源安全,促进能源和电力的高质量发展具有重要意义。在新能源消纳、提升电网安全灵活性、促进多能互补等能源新业态方面具有良好的应用前景。随着电化学储能性能的不断提升、成本持续下降,已经成为目前储能产业研发创新的重点领域和主要增长点。
在电力系统各个环节的不同应用场景及应用目标所构造出的不同工况条件,会对储能系统提出不同的技术需求,由于工况运行参数涉及应用场景/储能本体技术双侧,具有多元化、不可公度性以及原始信息掺杂大量主观因素的特点,且电化学储能电池性能因工况应力作用而发生退化,具有工况依赖性。因此,涉及储能系统规划配置、优化控制和运行维护等技术的问题属于多目标场景应用问题,故而,提出一个用于分析和测度不同工况中的储能系统工况特征参数体系方法显得尤为重要,是本领域技术人员希望解决的技术问题。
目前,关于电化学储能系统多样性应用场景的运行工况特征参数体系构建方法研究中,具有代表性的相关技术研究如下:文献[1]为白浩、于力、梁朔等于2019.11.29提出的中国专利“一种配电网储能系统配置参数的确定方法及装置(CN 110518612 A)”;文献[2]为王婧、邢金、叶辛等于2018.08.10提出的中国专利“基于多属性多目标综合评价指标的储能工况适用性对比项目后评价方法(CN 108390403 A)”;文献[3]为张立强、黎明、林俊宇于2019.02.19提出的中国专利“储能系统电池工况的简化方法(CN 109358291 A)”。
现有技术在储能运行工况特征参数选取和体系构建上有所不同。文献[1]中,首先确定储能系统优化项,在提升的运行效率、本级配电网降低的线路损耗、上级配电网调度储能系统降低的峰谷差值,以及储能系统平均寿命中选取至少一个,然后分别在确定影响各储能系统优化项的各枚举参数中选择至少一个,构建相应的特征参数体系。文献[2]针对6种应用场景,首先构建了其各自的储能系统配置优化目标函数,然后再综合考虑各应用场景的地理环境、储能应用远景目标、工况条件以及所用储能类型的投资成本、平抑效能指标、能量转换效率以及放电深度,分别给出了相应的其储能工况适用性对比综合评价指标,来对每一种储能类型进行评估,得到多属性多目标综合评价指标体系。文献[3]选取储能系统实际工况功率序列,将各功率片段的实际运行工况用该片段的功率代表值替代,得到相应工况特征参数体系表征的原始典型工况,对原始典型工况进一步简化整合得到储能电池最终简化工况。
这些相关研究在储能工况特征参数筛选与辨识等方面已经有所进展。现有研究在基于历史积累的经验总结上,通过在给定的参数范围内选出与储能系统应用场景相关的工况特征参数,构建相应参数体系应用到储能系统配置、评价等方面。然而,储能运行工况复杂多样,特征参数呈现多维度的特点,现有技术采用设定的或是单一的工况特征参数体系,应用到日益广泛的储能系统工况分析和评价,将难以保证工况表征的准确性。
发明内容
本发明的目的在于针对上述现有技术中的问题,提供一种储能运行工况特征参数体系构建方法、系统及存储介质,从实际储能系统所涵盖的多维度应用场景出发,通过对大量储能系统实际运行工况特征参数进行快速、准确、无偏估计的筛选,构建出适用于多场景、高准确度的储能运行工况特性表征体系。
为了实现上述目的,本发明有如下的技术方案:
第一方面,提供一种储能运行工况特征参数体系构建方法,包括:
获取储能系统典型工况运行数据;
通过数据预处理从储能系统典型工况运行数据中获取多个运行工况特征集;
构建随机森林模型,并计算每个运行工况特征集的重要性度量;
根据每个运行工况特征集的重要性度量,计算每个运行工况特征集的重要性度量标准差;
选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
作为本发明储能运行工况特征参数体系构建方法的一种优选方案,所述通过数据预处理从储能系统典型工况运行数据中获取多个运行工况特征集的步骤中,所述的数据预处理包括数据清理和数据标准化。
作为本发明储能运行工况特征参数体系构建方法的一种优选方案,所述构建随机森林模型的步骤中,随机森林模型的决策树采用CART算法,设定模型关键参数包括决策树数量T以及在决策树的每个节点进行分裂时需要的输入特征参数个数m。
作为本发明储能运行工况特征参数体系构建方法的一种优选方案,所述构建随机森林模型的步骤中,原始数据集包括N个样本,每个样本均由相同的特征集XM构成,每个特征集包括M个特征参数,从N个训练样本中有放回的随机抽取N个样本,作为单棵决策树的训练样本,构成该棵决策树的袋内数据集,T棵决策树共有T个袋内数据集,将每个袋内数据集作为构成随机森林模型中的单棵决策树的训练数据,未被抽取的样本构成对应决策树的袋外数据集,则共有T个袋外数据集;
按如下过程对构建的随机森林模型进行训练:
随机森林模型在每棵决策树的每个节点上进行分裂,从M个运行工况特征参数里选择 m个特征参数,找到每个特征参数的最优分割点,并选择最佳分割属性作为节点创建分裂决策树;共创建T棵决策树。
作为本发明储能运行工况特征参数体系构建方法的一种优选方案,所述计算每个运行工况特征集的重要性度量的步骤包括:
对训练完成的随机森林模型中的每个决策树,选择各自相应的袋外数据集,放入各自决策树中进行预测,将每个袋外数据集的预测值和真值进行比较,以袋外数据集的预测值≠真值的数量作为误分类样本数,再计算误分类样本数占袋外数据集总样本数的比率,作为决策树的袋外数据误差OOBerr1;
对上述的袋外数据集所有样本中的特征参数X加入噪声干扰,从而随机改变样本在特征参数X处的值,得到新的袋外数据集,计算新的袋外数据误差OOBerr1';
对于T棵决策树构建的随机森林,则运行工况特征集XM的重要性度量VIMX按下式计算:
Figure BDA0003517123870000041
特征集XM的M个特征参数上述步骤进行计算,共计算得到M个重要性度量VIMX
作为本发明储能运行工况特征参数体系构建方法的一种优选方案,在所述选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系的步骤中,先将M个重要性度量VIMX按降序排序,剔除其中最小的δ个特征参数,得到M′个特征参数的新特征集XM′;使用新特征集XM′重复剔除,直到剩下M0个特征参数,M0为最小保留特征参数数量;再从中选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
第二方面,提供一种储能运行工况特征参数体系构建系统,包括:
数据收集模块,用于收集储能系统典型工况运行数据;
数据预处理模块,用于通过数据预处理从储能系统典型工况运行数据中获取多个运行工况特征集;
随机森林模型构建及重要性度量计算模块,用于构建随机森林模型,并计算每个运行工况特征集的重要性度量;
重要性度量标准差计算模块,用于计算每个运行工况特征集的重要性度量标准差;
特征参数体系选取模块,用于选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
作为本发明储能运行工况特征参数体系构建系统的一种优选方案,所述数据预处理模块所进行的数据预处理操作包括数据清理和数据标准化;数据预处理模块获取到的原始数据集包括N个样本,每个样本均由相同的特征集XM构成,每个特征集包括M个特征参数。
作为本发明储能运行工况特征参数体系构建系统的一种优选方案,所述随机森林模型构建及重要性度量计算模块构建的随机森林模型决策树采用CART算法,设定模型关键参数包括决策树数量T以及在决策树的每个节点进行分裂时需要的输入特征参数个数m;从N 个样本中有放回的随机抽取N个样本,作为单棵决策树的训练样本,构成该棵决策树的袋内数据集,T棵决策树共有T个袋内数据集,将每个袋内数据集作为构成随机森林模型中的单棵决策树的训练数据,未被抽取的样本构成对应决策树的袋外数据集,则共有T个袋外数据集;按如下过程对构建的随机森林模型进行训练:
随机森林模型在每棵决策树的每个节点上进行分裂,从M个特征参数里选择m个特征参数,找到每个特征参数的最优分割点,并选择最佳分割属性作为节点创建决策树;共创建T棵决策树。
作为本发明储能运行工况特征参数体系构建系统的一种优选方案,所述随机森林模型构建及重要性度量计算模块计算每个运行工况特征集的重要性度量的步骤包括:
对训练完成的随机森林模型中的每个决策树,选择各自相应的袋外数据集,放入各自决策树中进行预测,将每个袋外数据集的预测值和真值进行比较,以袋外数据集的预测值≠真值的数量作为误分类样本数,再计算误分类样本数占袋外数据集总样本数的比率,作为决策树的袋外数据误差OOBerr1;对上述的袋外数据集所有样本中的特征参数X加入噪声干扰,从而随机改变样本在特征参数X处的值,得到新的袋外数据集,计算新的袋外数据误差OOBerr1';
对于T棵决策树构建的随机森林,则运行工况特征集XM的重要性度量VIMX按下式计算:
Figure BDA0003517123870000061
特征集XM的M个特征参数上述步骤进行计算,共计算得到M个重要性度量VIMX
作为本发明储能运行工况特征参数体系构建系统的一种优选方案,所述特征参数体系选取模块先将M个重要性度量VIMX按降序排序,剔除其中最小的δ个特征参数,得到M′个特征参数的新特征集XM′;使用新特征集XM′重复剔除,直到剩下M0个特征参数,M0为最小保留特征参数数量;再从中选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
第三方面,还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述的储能运行工况特征参数体系构建方法。
相较于现有技术,本发明第一方面至少具有如下的有益效果:
通过从储能系统典型工况运行数据中获取多个运行工况特征集,并计算随机森林模型下每个运行工况特征集的重要性度量以及重要性度量标准差,基于各种工况特征参数影响权重,对其进行量化筛选。最终选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系,从而实现对储能系统多目标应用场景工况的有效表征,本发明对工况运行数据的异常值和噪声有很强的容忍度,能够从实际储能系统所涵盖的多维度应用场景出发,对大量储能系统实际运行工况特征参数作出快速、准确、无偏估计的筛选,构建出了适用于多场景、高准确度的储能运行工况特性表征体系。
可以理解的是,上述第二方面至第三方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1本发明储能运行工况特征参数体系构建方法流程图;
图2本发明实施例储能系统工况的20个特征参数重要性评分图;
图3本发明实施例特征参数重要性的标准差分布图;
图4本发明实施例储能系统工况的11个特征参数重要性评分图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请的实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
请参阅图1,本发明储能运行工况特征参数体系构建方法包括以下步骤:
(1)获取储能系统典型工况运行数据;
(2)数据清理和标准化,得到N个训练样本、M个特征参数(特征集XM)构成的原始数据集;
(3)构建随机森林模型,决策树采用CART算法,设定模型关键参数:决策树数量T,以及在决策树的每个节点进行分裂时需要的输入特征个数m;
(4)从原始数据集中的N个样本中,有放回的随机抽取N个样本,T棵决策树共有T个袋内数据集(In-bag),每个袋内数据集作为构成随机森林模型中的单棵决策树的训练数据;
未被抽取的样本构成该决策树的袋外数据集(OOB),共有T个OOB数据集;
(5)训练随机森林模型:
a)随机森林模型中,在每棵决策树的每个节点上进行分裂时,从M个特征里选择m个特征参数(m<M),找到每个特征的最优分割点,选择最佳分割属性作为节点创建决策树;
b)按照上述步骤分裂,共创建T个决策树;
c)计算T个棵决策树输出的样本预测值众数;
d)完成随机森林模型训练。
(6)对训练完成的随机森林模型中的每个决策树,选择各自相应的袋外数据集(OOB1),放入各自决策树中进行预测,将OOB1样本的预测值和真值进行比较,OOB1样本的预测值≠真值的数量作为误分类样本数,计算误分类样本数占OOB1总样本数的比率,作为决策树的袋外数据误差(OOBerr1),计算表达式如下;
Figure BDA0003517123870000081
(7)对袋外数据集OOB1所有样本中的特征参数X加入噪声干扰,从而随机改变样本在特征参数X处的值,得到新的袋外数据集(OOB1'),计算相应的袋外数据误差(OOBerr1');
(8)对于T棵决策树构建的随机森林,运行工况特征集XM中的特征参数X的重要性度量 VIMX按照如下表达式进行计算:
Figure BDA0003517123870000091
(9)将特征集XM的M个特征参数按上述步骤循环计算,共计算得到M个重要性度量VIMX
(10)计算M个重要性度量VIMX的标准差STDM
(11)将M个重要性度量VIMX按降序排序,剔除其中最小的δ个特征参数,得到具有M′ (M′=M-δ)个特征参数的新特征集XM′
(12)使用新特征集XM′重复步骤(4)-(11),直到剩下M0个特征参数(M0为最小保留特征参数数量);
(13)选取标准差STDM最小的特征集Xmin为储能运行工况特征参数体系。
实施例2
以下结合实际案例对本发明实施过程加以说明并实施效果加以验证。
本实施例共收集了N=238组的MW级以上并网锂离子电池储能系统的5种实际运行工况数据,电源侧辅助调频16组、光储联合27组、风储平滑和计划出力分别为96和73组,以及电网侧削峰填谷26组。上述5种应用的储能系统运行在功率为0.1~1P0、容量为5~ 80%DOD和时间为秒~小时级的量程范围内,从表征储能系统工况具有的功率和能量两种属性的量值、响应速度、工作时长、波形特征等维度出发,选取与储能系统典型运行工况特征密切相关的M=20个工况性能表征参数,如表1所示,开展储能系统工况的变量特征参数重要性分析和表征体系构建。
表1
Figure BDA0003517123870000092
Figure BDA0003517123870000101
设定随机森林模型的决策树数量为T=150个,以及在决策树的每个节点进行分裂时需要考虑的输入特征个数m=3。
从原始数据集中的N=238个样本中,有放回的随机抽取共150组,每组238个样本,作为随机森林模型中的150棵决策树的训练数据(In-bag),完成该随机森林模型的训练。
将未被抽取的样本构成150组袋外数据集(OOB),分别放入各自决策树中进行预测,计算决策树的袋外数据误差(OOBerr1)。
随机改变OOB1所有样本在特征参数X处的值,得到新的袋外数据集OOB1',计算相应的袋外数据误差(OOBerr1')。
然后,计算特征集X20的20个特征参数的VIM20,分布如图2所示,从图中可见,最大值为VIM20-x19=0.83,表示特征集X20中的参数x19(充电峰谷值差)对工况表征的影响力最强,而最小值VIM20-x11=0.085,参数x11(充放电峰值数量比)对工况表征的影响力最弱,该特征集的STD20=0.184,可见各特征参数的影响能力具有显著性差异。
按照降序排列,采用每次删除δ=3个特征参数的删减率,将VIM20最小的3个特征参数 x3、x9和x11删除后,重新构建特征集X17的工况训练集。依次重复训练模型,6组(M'=20,17,14,11,8,5)特征集的VIMM′标准差STD如图3所示。
其中,特征集X11的VIM11标准差最小STD11=0.147,特征集X11的特征参数如表2所示。
表2
Figure BDA0003517123870000102
各特征参数的VIM11分布如图4所示。其中,最大值为VIM11-x10=0.86,表示特征集X11中的参数x10(充电峰谷值差)对工况表征的影响力最强,与图2中特征集X20的参数x19相一致;特征集X11的参数x6(充电峰值频率)具有最小的VIM11-x6=0.39,对采用特征集X11表征的工况影响力最弱,但其显著高于特征集X20中的参数x11。而STD11<STD20说明这11 个工况特征集X11的离散程度显著优于特征集X20,在特征参数数量减少的同时,每个参数在表征工况特性时发挥更大影响力。因此,可选择图4给出的11个特征参数作为功率为0.1~ 1P0、容量为5~80%DOD和时间为秒~小时级的量程范围内储能系统工况特征参数体系。
可见,本发明的储能运行工况特征参数体系构建方法,实现了从实际储能系统所涵盖的多维度应用场景出发,对大量储能系统实际运行工况特征参数作出快速、准确、无偏估计的筛选,构建适用于多场景、高准确度的储能运行工况特性表征体系。
实施例3
本发明实施例还提出一种储能运行工况特征参数体系构建系统,包括:
数据收集模块1,用于收集储能系统典型工况运行数据;
数据预处理模块2,用于通过数据预处理从储能系统典型工况运行数据中获取多个运行工况特征集;
随机森林模型构建及重要性度量计算模块3,用于构建随机森林模型,并计算每个运行工况特征集的重要性度量;
重要性度量标准差计算模块4,用于计算每个运行工况特征集的重要性度量标准差;
特征参数体系选取模块5,用于选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
在一种实施方式当中,数据预处理模块2所进行的数据预处理操作包括数据清理和数据标准化;数据预处理模块获取到的原始数据集包括N个样本,每个样本均由相同的特征集XM构成,每个特征集包括M个特征参数。
在一种实施方式当中,随机森林模型构建及重要性度量计算模块3构建的随机森林模型决策树采用CART算法,设定模型关键参数包括决策树数量T以及在决策树的每个节点进行分裂时需要的输入特征参数个数m;从N个训练样本中有放回的随机抽取N个样本,作为单棵决策树的训练样本,构成该棵决策树的袋内数据集,T棵决策树共有T个袋内数据集,将每个袋内数据集作为构成随机森林模型中的单棵决策树的训练数据,未被抽取的样本构成对应决策树的袋外数据集,则共有T个袋外数据集;按如下过程对构建的随机森林模型进行训练:
随机森林模型在每棵决策树的每个节点上进行分裂,从M个特征参数里选择m个特征参数,找到每个特征参数的最优分割点,并选择最佳分割属性作为节点创建分裂决策树;共创建T棵决策树。
在一种实施方式当中,随机森林模型构建及重要性度量计算模块3计算每个运行工况特征集的重要性度量的步骤包括:
对训练完成的随机森林模型中的每个决策树,选择各自相应的袋外数据集,放入各自决策树中进行预测,将每个袋外数据集的预测值和真值进行比较,以袋外数据集的预测值≠真值的数量作为误分类样本数,再计算误分类样本数占袋外数据集总样本数的比率,作为决策树的袋外数据误差OOBerr1;对上述的袋外数据集所有样本中的特征参数X加入噪声干扰,从而随机改变样本在特征参数X处的值,得到新的袋外数据集,计算新的袋外数据误差OOBerr1';
对于T棵决策树构建的随机森林,则运行工况特征集的重要性度量VIMX按下式计算:
Figure BDA0003517123870000121
特征集XM的M个特征参数上述步骤进行计算,共计算得到M个重要性度量VIMX
在一种实施方式当中,特征参数体系选取模块5先将M个重要性度量VIMX按降序排序,剔除其中最小的δ个特征参数,得到M′个特征参数的新特征集XM′;使用新特征集XM′重复剔除,直到剩下M0个特征参数,M0为最小保留特征参数数量;再从中选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
实施例4
本发明的另一实施例还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的储能运行工况特征参数体系构建方法。所述计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。为了便于说明,以上内容仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机可读存储介质是非暂时性的,可以存储在各种电子设备形成的存储装置当中,能够实现本发明实施例方法记载的执行过程。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和 /或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (12)

1.一种储能运行工况特征参数体系构建方法,其特征在于,包括:
获取储能系统典型工况运行数据;
通过数据预处理从储能系统典型工况运行数据中获取多个运行工况特征集;
构建随机森林模型,并计算每个运行工况特征集的重要性度量;
根据每个运行工况特征集的重要性度量,计算每个运行工况特征集的重要性度量标准差;
选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
2.根据权利要求1所述的储能运行工况特征参数体系构建方法,其特征在于:所述通过数据预处理从储能系统典型工况运行数据中获取多个运行工况特征集的步骤中,所述的数据预处理包括数据清理和数据标准化。
3.根据权利要求1所述的储能运行工况特征参数体系构建方法,其特征在于:所述构建随机森林模型的步骤中,随机森林模型的决策树采用CART算法,设定模型关键参数包括决策树数量T以及在决策树的每个节点进行分裂时需要的输入特征参数个数m。
4.根据权利要求3所述的储能运行工况特征参数体系构建方法,其特征在于:所述构建随机森林模型的步骤中,原始数据集包括N个样本,每个样本均由相同的特征集XM构成,每个特征集包括M个特征参数,从N个样本中有放回的随机抽取N个样本,作为单棵决策树的训练样本,构成该棵决策树的袋内数据集,T棵决策树共有T个袋内数据集,将每个袋内数据集作为构成随机森林模型中的单棵决策树的训练数据,未被抽取的样本构成对应决策树的袋外数据集,则共有T个袋外数据集;
按如下过程对构建的随机森林模型进行训练:
随机森林模型在每棵决策树的每个节点上进行分裂,从M个运行工况特征参数里选择m个特征参数,找到每个特征参数的最优分割点,并选择最佳分割属性作为节点创建决策树;共创建T棵决策树。
5.根据权利要求4所述的储能运行工况特征参数体系构建方法,其特征在于,所述计算每个运行工况特征集的重要性度量的步骤包括:对训练完成的随机森林模型中的每个决策树,选择各自相应的袋外数据集,放入各自决策树中进行预测,将每个袋外数据集的预测值和真值进行比较,以袋外数据集的预测值≠真值的数量作为误分类样本数,再计算误分类样本数占袋外数据集总样本数的比率,作为决策树的袋外数据误差OOBerr1;
对上述的袋外数据集所有样本中的特征参数X加入噪声干扰,从而随机改变样本在特征参数X处的值,得到新的袋外数据集,计算新的袋外数据误差OOBerr1';
对于T棵决策树构建的随机森林,则运行工况特征集XM的重要性度量VIMX按下式计算:
Figure FDA0003517123860000021
特征集XM的M个特征参数上述步骤进行计算,共计算得到M个重要性度量VIMX
6.根据权利要求5所述的储能运行工况特征参数体系构建方法,其特征在于,在所述选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系的步骤中,先将M个重要性度量VIMX按降序排序,剔除其中最小的δ个特征参数,得到M′个特征参数的新特征集XM′;使用新特征集XM′重复剔除,直到剩下M0个特征参数,M0为最小保留特征参数数量;再从中选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
7.一种储能运行工况特征参数体系构建系统,其特征在于,包括:
数据收集模块,用于收集储能系统典型工况运行数据;
数据预处理模块,用于通过数据预处理从储能系统典型工况运行数据中获取多个运行工况特征集;
随机森林模型构建及重要性度量计算模块,用于构建随机森林模型,并计算每个运行工况特征集的重要性度量;
重要性度量标准差计算模块,用于计算每个运行工况特征集的重要性度量标准差;
特征参数体系选取模块,用于选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
8.根据权利要求7所述储能运行工况特征参数体系构建系统,其特征在于:所述数据预处理模块所进行的数据预处理操作包括数据清理和数据标准化;数据预处理模块获取到的原始数据集包括N个样本,每个样本均由相同的特征集XM构成,每个特征集包括M个特征参数。
9.根据权利要求7所述储能运行工况特征参数体系构建系统,其特征在于:所述随机森林模型构建及重要性度量计算模块构建的随机森林模型决策树采用CART算法,设定模型关键参数包括决策树数量T以及在决策树的每个节点进行分裂时需要的输入特征参数个数m;从N个样本中有放回的随机抽取N个样本,作为单棵决策树的训练样本,构成该棵决策树的袋内数据集,T棵决策树共有T个袋内数据集,将每个袋内数据集作为构成随机森林模型中的单棵决策树的训练数据,未被抽取的样本构成对应决策树的袋外数据集,则共有T个袋外数据集;按如下过程对构建的随机森林模型进行训练:
随机森林模型在每棵决策树的每个节点上进行分裂,从M个运行工况特征参数里选择m个特征参数,找到每个特征参数的最优分割点,并选择最佳分割属性作为节点创建决策树;共创建T棵决策树。
10.根据权利要求9所述储能运行工况特征参数体系构建系统,其特征在于:所述随机森林模型构建及重要性度量计算模块计算每个运行工况特征集的重要性度量的步骤包括:
对训练完成的随机森林模型中的每个决策树,选择各自相应的袋外数据集,放入各自决策树中进行预测,将每个袋外数据集的预测值和真值进行比较,以袋外数据集的预测值≠真值的数量作为误分类样本数,再计算误分类样本数占袋外数据集总样本数的比率,作为决策树的袋外数据误差OOBerr1;对上述的袋外数据集所有样本中的特征参数X加入噪声干扰,从而随机改变样本在特征参数X处的值,得到新的袋外数据集,计算新的袋外数据误差OOBerr1';
对于T棵决策树构建的随机森林,则运行工况特征集XM的重要性度量VIMX按下式计算:
Figure FDA0003517123860000041
特征集XM的M个特征参数上述步骤进行计算,共计算得到M个重要性度量VIMX
11.根据权利要求10所述储能运行工况特征参数体系构建系统,其特征在于:所述特征参数体系选取模块先将M个重要性度量VIMX按降序排序,剔除其中最小的δ个特征参数,得到M′个特征参数的新特征集XM′;使用新特征集XM′重复剔除,直到剩下M0个特征参数,M0为最小保留特征参数数量;再从中选取重要性度量标准差最小的运行工况特征集作为运行工况特征参数体系。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的储能运行工况特征参数体系构建方法。
CN202210169787.9A 2022-02-23 2022-02-23 储能运行工况特征参数体系构建方法、系统及存储介质 Pending CN114565033A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210169787.9A CN114565033A (zh) 2022-02-23 2022-02-23 储能运行工况特征参数体系构建方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210169787.9A CN114565033A (zh) 2022-02-23 2022-02-23 储能运行工况特征参数体系构建方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN114565033A true CN114565033A (zh) 2022-05-31

Family

ID=81713654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210169787.9A Pending CN114565033A (zh) 2022-02-23 2022-02-23 储能运行工况特征参数体系构建方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN114565033A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116738238A (zh) * 2023-08-14 2023-09-12 北京赛目科技股份有限公司 一种天气场景的搭建方法、装置及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116738238A (zh) * 2023-08-14 2023-09-12 北京赛目科技股份有限公司 一种天气场景的搭建方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN115166563B (zh) 一种动力电池老化状态评估与退役筛选方法及系统
CN113030761B (zh) 一种超大规模储能电站电池健康状态的评估方法及系统
CN114742097A (zh) 一种基于轴承振动信号自动确定变分模态分解参数的优化算法
CN115423013A (zh) 电力系统运行方式分类方法、装置、设备及介质
CN116298934B (zh) 一种用于锂电池健康状态估算的预测网络的建模方法
CN114565033A (zh) 储能运行工况特征参数体系构建方法、系统及存储介质
CN117349751A (zh) 基于元学习与贝叶斯优化的黄土滑坡滑距预测方法及系统
CN114416707A (zh) 工业时序数据的自动化特征工程方法和装置
CN110674569A (zh) 基于决策树的充电剩余时间估算方法及系统
CN116953547A (zh) 一种储能电池健康度评估方法、系统、设备及存储介质
CN117825998A (zh) 一种锂离子电池剩余寿命预测方法、系统、设备及介质
CN113689112B (zh) 利用云计算改进层次分析法的智慧能源站能效评估方法及系统
CN116245019A (zh) 一种基于Bagging抽样及改进随机森林算法的负荷预测方法、系统、装置及存储介质
CN117744722A (zh) 一种大模型压缩方法及系统
CN110956675B (zh) 技术成熟度曲线自动生成方法及装置
CN117394436A (zh) 基于随机场景分析的光伏承载能力评估方法及系统
CN116014764B (zh) 一种分布式储能优化处理方法及装置
CN112967154B (zh) 一种电力系统Well-being的评估方法及装置
CN115730147A (zh) 客户挖掘方法及装置
CN116070958A (zh) 归因分析方法、装置、电子设备和存储介质
CN115879799A (zh) 一种变电站电能质量分析方法
CN114417918A (zh) 一种风电场信号特征提取及去噪优化数据的方法
CN114462549A (zh) 储能电站运行工况分类方法、系统、存储介质及服务器
CN111092425B (zh) 一种基于拓扑特性的网架聚类分析方法及系统
CN114548286A (zh) 储能系统并网工况的分类方法、系统、存储介质及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination