CN117172831A - 基于用户行为与数量演变的动态分群方法和系统 - Google Patents

基于用户行为与数量演变的动态分群方法和系统 Download PDF

Info

Publication number
CN117172831A
CN117172831A CN202311446622.2A CN202311446622A CN117172831A CN 117172831 A CN117172831 A CN 117172831A CN 202311446622 A CN202311446622 A CN 202311446622A CN 117172831 A CN117172831 A CN 117172831A
Authority
CN
China
Prior art keywords
day
dynamic
frequency coefficient
clustering
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311446622.2A
Other languages
English (en)
Other versions
CN117172831B (zh
Inventor
刘栋
史锐
秦继朔
毛志航
张啸虎
但扬清
徐敏
董骁翀
王智冬
孙珂
孙英云
武佳卉
许凌
王丹
薛雅玮
于昊洋
李凡
郭国栋
刘忠健
佟宇梁
王晨轩
胡蓉
孙飞飞
李万伟
冯智慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Branch Of State Grid Corp ltd
State Grid Zhejiang Electric Power Co Ltd
North China Electric Power University
State Grid Gansu Electric Power Co Ltd
Economic and Technological Research Institute of State Grid Zhejiang Electric Power Co Ltd
State Grid Economic and Technological Research Institute
Original Assignee
East China Branch Of State Grid Corp ltd
State Grid Zhejiang Electric Power Co Ltd
North China Electric Power University
State Grid Gansu Electric Power Co Ltd
Economic and Technological Research Institute of State Grid Zhejiang Electric Power Co Ltd
State Grid Economic and Technological Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Branch Of State Grid Corp ltd, State Grid Zhejiang Electric Power Co Ltd, North China Electric Power University, State Grid Gansu Electric Power Co Ltd, Economic and Technological Research Institute of State Grid Zhejiang Electric Power Co Ltd, State Grid Economic and Technological Research Institute filed Critical East China Branch Of State Grid Corp ltd
Priority to CN202311446622.2A priority Critical patent/CN117172831B/zh
Publication of CN117172831A publication Critical patent/CN117172831A/zh
Application granted granted Critical
Publication of CN117172831B publication Critical patent/CN117172831B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于电力系统分析和管理技术领域,涉及一种基于用户行为与数量演变的动态分群方法和系统,包括:计算智能电表采集数据的用户对象,及其对应的负荷数据;对负荷数据进行改进的离散小波转换,获得负荷特征向量;将负荷特征向量输入动态分群算法模型,动态分群算法模型中第一日采用初始化聚类中心,从第二日开始,初始化聚类中心采用上一日的历史聚类中心,获得所有日的用户动态分群标签结果序列;输出所有日的用户动态分群标签结果序列。其可更好地应对用户的时变性与不确定性,给出了一种考虑用户行为和数量演变、分群一致性、抗噪能力与鲁棒性的动态分群方法。

Description

基于用户行为与数量演变的动态分群方法和系统
技术领域
本发明涉及一种基于用户行为与数量演变的动态分群方法、系统、可读介质和设备,属于电力系统分析和管理技术领域。
背景技术
作为提升电力系统灵活性的重要手段之一,负荷聚合服务通过挖掘海量用户的用电行为,将用电规律相近的个体进行分群,能够为用户提供更优良的用电体验,实现更精细化的需求侧管理。然而,随着新能源发电入户、电动汽车的普及和用户个性化用电习惯的综合影响,用户用电行为趋于多样化,使得用户负荷曲线具有较强的不确定性与易变性,同时由于智能电表用户规模的持续扩大,存在较多缺乏历史数据的新增用户,从而造成用户分群问题面临着巨大的挑战。现有研究已经对用户分群问题做出了大量方法研究,如何实现更加合理、平稳和灵活的用户分群方式,对提升海量用户的可监与可控能力具有重要意义。
目前大部分用户负荷分群问题研究利用用户的静态历史负荷数据,在选取特征的基础上,采用聚类方法挖掘用户之间的相似性实现用户分群,称为静态聚类,而静态聚类方法过度依赖于用户的历史负荷数据,从而忽略了受不同因素影响的用户动态特性,且难以考虑新增用户的分群问题。部分研究基于用户的社会属性,通常依据行业、领域、家庭人口等用户属性将用户分群,但主要是受经验规则影响较大,划分结果不够精确。一些研究则利用传统聚类方法如K-means、模糊C均值聚类对用户重复聚类,借此达到动态分群的目的,但其本质上仍然是定期更新聚类,忽略了分群特性的前后一致性和变化平滑性。
发明内容
针对上述问题,本发明的目的是提供一种基于用户行为与数量演变的动态分群方法、系统、可读介质和设备,其可更好地应对用户的时变性与不确定性,给出了一种考虑用户行为和数量演变、分群一致性、抗噪能力与鲁棒性、平滑过渡和分群对应的动态分群方法。
为实现上述目的,本发明提出了以下技术方案:一种基于用户行为与数量演变的动态分群方法,包括以下步骤:计算智能电表采集数据的用户对象,及其对应的负荷数据;对所述负荷数据进行改进的离散小波转换,获得负荷特征向量;将所述负荷特征向量输入动态分群算法模型,所述动态分群算法模型中第一日采用K-means初始化聚类中心,从第二日开始,初始化聚类中心采用上一日的历史聚类中心/>,从而获得所有日的用户动态分群标签结果序列;输出所有日的用户动态分群标签结果序列。
进一步,所述改进的离散小波转换的方法为:将所述负荷数据在第一层被分解为第一高频系数和第一低频系数;将所述第一低频系数输入第二层,分解为第二高频系数和第二低频系数;以此类推,直到最后一层,所述第一高频系数、第二高频系数直至第N高频系数和第N低频系数组成离散小波转换的处理结果;获得第N高频系数和第N低频系数;将第N低频系数进行最大最小值归一化,并将其结果作为经过所述改进的离散小波转换的复合数据;其中,N是层的数量。
进一步,所述将第N低频系数进行最大最小值归一化的计算公式为:
其中,是第N低频系数,/>是第N低频系数的最小值,/>是第N低频系数的最大值,/>是第N低频系数的最大最小值归一化值。
进一步,所述动态分群算法模型中分群方法为:计算距离聚类中心最近的特征向量集合;对所述特征向量集合求平均值并归一化,将经过归一化的所述平均值设置为新的聚类中心,从而得到第t日的聚类中心集合/>;将第t-1日的所有聚类中心集合/>和第t日的所有聚类中心集合/>通过贪心近似算法进行映射,获得第t日反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子;根据所述第t日反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子,对第t日的聚类中心进行更新;重复上一步,直至完成对所述聚类中心集合/>中所有聚类中心的更新;重复上面的步骤,直至获得最优的聚类中心,所述最优的聚类中心与日的用户动态分群标签对于,从而获得所有日的用户动态分群标签结果序列。
进一步,所述距离聚类中心最近的特征向量集合表示为:
其中,是距离第t日第j个聚类中心/>最近的特征向量集合,/>是第t日第i个负荷特征向量,/>是第t日负荷特征向量集合。
进一步,所述第t日反映两个分群相对大小的比例系数的计算公式为:
其中,是第t日反映两个分群相对大小的比例系数,/>是第t日属于第j个聚类中心的用户数量,/>是第t-1日属于第j个聚类中心的用户数量,f(j)是对第j个聚类中心进行贪心近似算法计算。
进一步,所述第t日和第t-1日的平衡因子的计算公式为:
其中,是平衡因子,/>是第t日平衡因子,K是/>值的上限,/>是/>的初始值,r是/>的增长速率。
进一步,根据所述第t日反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子,对第t日的聚类中心进行更新的计算公式为:
其中,是第j个聚类中心。
本发明还公开了一种基于用户行为与数量演变的动态分群系统,包括:数据获取模块,用于计算智能电表采集数据的用户对象,及其对应的负荷数据;改进的离散小波转换模块,用于对所述负荷数据进行改进的离散小波转换,并将经过所述改进的离散小波转换的复合数据转换为负荷特征向量;模型训练模块,用于将所述负荷特征向量输入动态分群算法模型,所述动态分群算法模型中第一日采用初始化聚类中心,从第二日开始,初始化聚类中心采用上一日的历史聚类中心/>,获得所有日的用户动态分群标签结果序列;输出模块,用于输出所有日的用户动态分群标签结果序列。
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现上面任一项所述的基于用户行为与数量演变的动态分群方法。
进一步,所述改进的离散小波转换的方法为:将所述负荷数据在第一层被分解为第一高频系数和第一低频系数;将所述第一低频系数输入第二层,分解为第二高频系数和第二低频系数;以此类推,直到最后一层,获得第N高频系数和第N低频系数;将第N低频系数进行最大最小值归一化,并将其结果作为经过所述改进的离散小波转换的复合数据;其中,N是层的数量。
进一步,所述将第N低频系数进行最大最小值归一化的计算公式为:
其中,是第N低频系数,/>是第N低频系数的最小值,/>是第N低频系数的最大值,/>是第N低频系数的最大最小值归一化值。
进一步,所述动态分群算法模型中分群方法为:计算距离聚类中心最近的特征向量集合;根据所述特征向量集合对集合中负荷数据求平均值并归一化,将经过归一化的所述平均值设置为新的聚类中心,从而得到第t日的聚类中心集合/>;将第t-1日的所有聚类中心集合/>和第t日的所有聚类中心集合/>通过贪心近似算法进行映射,获得第t日反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子;根据所述第t日的反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子,对第t日的聚类中心进行更新;重复上一步,直至完成对所述聚类中心集合/>中所有聚类中心的更新;重复上面的步骤,直至获得所有日的用户动态分群标签结果序列。
进一步,所述距离聚类中心最近的特征向量集合表示为:
其中,是距离第t日第j个聚类中心/>最近的特征向量集合,/>是第t日第i个负荷特征向量,/>是第t日负荷特征向量集合。
进一步,所述第t日反映两个分群相对大小的比例系数的计算公式为:
其中,是第t日反映两个分群相对大小的比例系数,/>是第t日属于第j个聚类中心的用户数量,/>是第t-1日属于第j个聚类中心的用户数量,f(j)是对第j个聚类中心进行贪心近似算法计算。
进一步,所述第t日和第t-1日的平衡因子的计算公式为:
其中,是平衡因子,/>是第t日平衡因子,K是/>值的上限,/>是/>的初始值,r是/>的增长速率。
进一步,根据所述第t日的反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子,对第t日的聚类中心进行更新的计算公式为:
其中,是第j个聚类中心。
本发明还公开了一种基于用户行为与数量演变的动态分群系统,包括:数据获取模块,用于计算智能电表采集数据的用户对象,及其对应的负荷数据;改进的离散小波转换模块,用于对所述负荷数据进行改进的离散小波转换,并将经过所述改进的离散小波转换的复合数据转换为负荷特征向量;模型训练模块,用于将所述负荷特征向量输入动态分群算法模型,所述动态分群算法模型中第一日采用初始化聚类中心,从第二日开始,初始化聚类中心采用上一日的历史聚类中心/>,获得所有日的用户动态分群标签结果序列;输出模块,用于输出所有日的用户动态分群标签结果序列。
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现上面任一项所述的基于用户行为与数量演变的动态分群方法。
本发明还公开了一种计算设备,包括:一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据上述任一项所述的种基于用户行为与数量演变的动态分群方法。
本发明由于采取以上技术方案,其具有以下优点:
1、相比于传统用户静态分群方法,本发明通过对每一天的负荷数据都进行聚类算法获得用户动态分群算法,其能够针对每日实际情况对用户进行动态分群,分群结果在长期上具有季节演变的趋势,在短期则可以反映出工作日与周末的波动情况,且用户动态分群具有一定的特殊事件应对能力,在极端天气和节假日等特殊日有更好的分群效果。
2、本发明通过从第二日开始,初始化聚类中心采用上一日的历史聚类中心/>进行用户动态分群算法,使得数据具有较好的纵向一致性和规律性,各分群聚合后的同类负荷曲线形状近似,可以反映当日各分群用户数量的差异,能够为用户数据挖掘与建模提供良好的支撑,可以实现更加合理、平稳和灵活的用户分群方式。
3、本发明中方案计算过程快速高效,计算结果准确,不需要人工操作即可完成,节约了成本。
附图说明
图1是本发明一实施例中基于用户行为与数量演变的动态分群方法的流程图;
图2是本发明一实施例中动态分群算法模型的计算方法流程图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方案,通过具体实施例对本发明进行详细的描绘。然而应当理解,具体实施方式的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。在本发明的描述中,需要理解的是,所用到的术语仅仅是用于描述的目的,而不能理解为指示或暗示相对重要性。
名词解释
聚类算法是当前数据信息挖掘中有效的无监督学习方法,其能够在无任何先验认知的条件下挖掘数据对象的相似性,达到数据分组的目的。
特征提取是把原始数据从高维空间转换到低维空间中,将原始特征合并成一些新的特征类型来进行表示,以剔除冗余特征。
离散小波变换是Discrete Wavelet Transform, DWT,是指在特定子集上采取缩放和平移的小波变换,是一种兼具时域和频域多分辨率能力的信号分析工具,可以得到原始时间序列的近似表示,具有计算迅速的优点。
为了解决现有技术中存在的在聚类时过多依赖于用户的历史负荷特征或其他静态属性,忽略了受不同因素影响的用户动态特性,且难以考虑新增用户的分群。例如,同一个住所的用户负荷特征将随住户的更换而演变,这将直接影响用户的分群结果,以及在定期更新用户分群结果时忽略了用户分群特性的前后一致性和变化平滑性,使得动态分群的结果前后无法对应,导致偏离历史结果较多,且由于在重复聚类时没有考虑到历史的聚类结果,抗噪声能力和鲁棒性较弱等问题,本发明提出了一种基于用户行为与数量演变的动态分群方法、系统和可读介质,对用户日负荷数据进行特征提取、将负荷特征向量分配到距离最近的聚类中心、更新当前聚类中心、映射上一次聚类中心、根据相对大小加权值继续进行更新、重复迭代并得到最终的用户动态分群标签结果。其能够实现更加合理、平稳和灵活的用户分群方式,有助于集群负荷预测精度的提升,其计算过程快速高效,计算结果可靠,不需要人工操作即可完成,节约了成本。下面结合附图,通过实施例对发明方案进行详细阐述。
实施例一
本实施例公开了一种基于用户行为与数量演变的动态分群方法,如图1所示,包括以下步骤:
S1计算智能电表采集数据的用户对象,及其对应的负荷数据。
记某地区第t日智能电表采集数据的用户对象总数为,构成负荷数据集合
S2对负荷数据进行改进的离散小波(Discrete Wavelet Transform, DWT)转换,获得负荷特征向量。
如图2所示,改进的离散小波转换的方法为:
S2.1将负荷数据在第一层被分解为第一高频系数和第一低频系数;
输入n维第t日负荷序列其在第一层被分解为第一高频系数D 1和第一低频系数A 1。其中第一高频系数反映第t日负荷序列/>的细节特征;其中第二高频系数反映第t日负荷序列/>的轮廓特征。
S2.2将第一低频系数输入第二层,分解为第二高频系数和第二低频系数;
S2.3以此类推,直到最后一层,获得第N高频系数和第N低频系数;第一高频系数、第二高频系数直至第N高频系数和第N低频系数组成离散小波转换的处理结果;
例如本实施例中改进的离散小波转换算法共包括三层,经过三层改进的离散小波转换算法的结果为:
式中:D 1D 2D 3分别第一高频系数、第二高频系数和第三高频系数,A 3为第三低频系数。
S2.4将第N低频系数进行最大最小值归一化,并将其结果作为经过改进的离散小波转换的复合数据;其中,N是层的数量。
将第N低频系数进行最大最小值归一化的计算公式为:
其中,是第N低频系数,/>是第N低频系数的最小值,/>是第N低频系数的最大值,/>是第N低频系数的最大最小值归一化值。
本实施例中,改进的离散小波转换算法共包括三层,即将第三低频系数A3进行最大最小值归一化,其计算公式为:
其中,是第三低频系数,/>是第三低频系数的最小值,/>是第三低频系数的最大值,/>是第三低频系数的最大最小值归一化值。
经过上述改进的离散小波转换算法特征提取,负荷数据集合被转换为负荷特征向量集合/>,其中/>为DWT特征提取并归一化后的第i个负荷在第t日的负荷特征向量,l为特征向量的长度。
采用改进后的离散小波变换算法进行日负荷特征提取,能够提高单步聚类性能。
S3将负荷特征向量输入动态分群算法模型,动态分群算法模型中第一日采用初始化聚类中心,从第二日开始,初始化聚类中心采用上一日的历史聚类中心/>,获得所有日的用户动态分群标签结果序列。
动态分群算法模型中分群方法为:
在该动态分群算法模型进行训练前,需要确定用户分群的数量k,用户分群的数量k可以依据聚类模型性能指标和实际需要处理的数据确定。
时,随机初始化k个质心,采用得到聚类中心集合/>,对聚类中心集合/>归一化,并基于聚类中心集合/>比较与所有用户日负荷特征间距离求得该日用户分群标签L 1
时,将所有负荷特征向量分配到距离最近的上一迭代步聚类中心C t ,从而更新当前聚类中心。距离聚类中心/>最近的特征向量集合表示为:
其中,是距离第t日第j个聚类中心/>最近的特征向量集合,/>是第t日第i个负荷特征向量,/>是第t日负荷特征向量集合。
根据特征向量集合对集合中负荷数据求平均值并归一化,将经过归一化的平均值设置为新的聚类中心,进而更新每个聚类中心,得到第t天的所有增量聚类中心集合
其中,是聚类中心j周围负荷特征向量的平均值。
将第t-1日的所有聚类中心集合和第t日的所有聚类中心集合/>通过贪心近似算法进行映射,获得第t日的反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子。
第t日反映两个分群相对大小的比例系数的计算公式为:
其中,是第t日反映两个分群相对大小的比例系数,/>是第t日属于第j个聚类中心的用户数量,/>是第t-1日属于第j个聚类中心的用户数量,f(j)是对第j个聚类中心进行贪心近似算法计算。
考虑到初始迭代时历史时间较短,动态分群的历史权重应较小,因而本实施例基于Logstic回归模型采用动态增长计算第t日和第t-1日的平衡因子,使得分类结果中含有的早期迭代时携带的历史信息较少,随天数历史信息权重递增,第t日和第t-1日的平衡因子的计算公式为:
其中,是平衡因子,/>是第t日平衡因子,K是/>值的上限,/>是/>的初始值,r是/>的增长速率。本实施例中/>的初始值/>设置为0.1,/>的增长速率r为0.02,/>值的上限K为0.4。上述参数只是本实施例中的示意性说明,本领域技术人员可以根据实际需要设定上述参数。
根据第t日反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子,对第t日的聚类中心进行更新。对第t日的聚类中心进行更新的计算公式为:
其中,是第j个聚类中心。
重复上一步,直至完成对聚类中心集合中所有聚类中心的更新;
重复上面的步骤,直至获得最优的聚类中心,所述最优的聚类中心与日的用户动态分群标签对于,从而获得所有日的用户动态分群标签结果序列。
通过上述步骤,第t日的质心位于非进化K-means聚类模型所得聚类中心与日/>中最接近的匹配之间,并由/>衡量这两个分群的相对大小加权,从而实现动态分群时按比例携带历史信息。
S4输出所有日的用户动态分群标签结果序列。
输出所有日的用户动态分群标签结果序列,并对该用户动态分群标签结果序列进行显示。其中,对结果序列的显示方法包括大不限于采用数据列表进行展示,采用图表进行显示,或者根据根据客户感兴趣的类别进行显示等。
实施例二
基于相同的发明构思,本实施例公开了一种基于用户行为与数量演变的动态分群系统,包括:
数据获取模块,用于计算智能电表采集数据的用户对象,及其对应的负荷数据;
改进的离散小波转换模块,用于对负荷数据进行改进的离散小波转换,并将经过改进的离散小波转换的复合数据转换为负荷特征向量;
模型训练模块,用于将负荷特征向量输入动态分群算法模型,动态分群算法模型中第一日采用初始化聚类中心,从第二日开始,初始化聚类中心采用上一日的历史聚类中心/>,获得所有日的用户动态分群标签结果序列;
输出模块,用于输出所有日的用户动态分群标签结果序列。
实施例三
基于相同的发明构思,本实施例公开了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行以实现上面任一项的基于用户行为与数量演变的动态分群方法。
实施例四
基于相同的发明构思,本实施例公开了一种计算设备,包括:一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行根据上述任一项的基于用户行为与数量演变的动态分群方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。上述内容仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种基于用户行为与数量演变的动态分群方法,其特征在于,包括以下步骤:
计算智能电表采集数据的用户对象,及其对应的负荷数据;
对所述负荷数据进行改进的离散小波转换,获得负荷特征向量;
将所述负荷特征向量输入动态分群算法模型,获得所有日的用户动态分群标签结果序列,所述动态分群算法模型中第一日采用初始化聚类中心,从第二日开始,初始化聚类中心采用上一日的历史聚类中心/>
输出所有日的用户动态分群标签结果序列。
2.如权利要求1所述的基于用户行为与数量演变的动态分群方法,其特征在于,所述改进的离散小波转换的方法为:
将所述负荷数据在第一层被分解为第一高频系数和第一低频系数;
将所述第一低频系数输入第二层,分解为第二高频系数和第二低频系数;
以此类推,直到最后一层,获得第N高频系数和第N低频系数;
所述第一高频系数、第二高频系数直至第N高频系数和第N低频系数组成离散小波转换的处理结果;
将第N低频系数进行最大最小值归一化,并将其结果作为经过所述改进的离散小波转换的复合数据;
其中,N是层的数量。
3.如权利要求2所述的基于用户行为与数量演变的动态分群方法,其特征在于,所述将第N低频系数进行最大最小值归一化的计算公式为:
其中,是第N低频系数,/>是第N低频系数的最小值,/>是第N低频系数的最大值,/>是第N低频系数的最大最小值归一化值。
4.如权利要求1所述的基于用户行为与数量演变的动态分群方法,其特征在于,所述动态分群算法模型中分群方法为:
计算距离聚类中心最近的特征向量集合;
根据所述特征向量集合对集合中负荷数据求平均值并归一化,将经过归一化的所述平均值设置为新的聚类中心,从而得到第t日的聚类中心集合
将第t-1日的所有聚类中心集合和第t日的所有聚类中心集合/>通过贪心近似算法进行映射,获得第t日反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子;根据所述第t日反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子,对第t日的聚类中心进行更新;
重复上一步,直至完成对所述聚类中心集合中所有聚类中心的更新;
重复上面的步骤,直至获得最优的聚类中心,所述最优的聚类中心与日的用户动态分群标签对于,从而获得所有日的用户动态分群标签结果序列。
5.如权利要求4所述的基于用户行为与数量演变的动态分群方法,其特征在于,所述距离聚类中心最近的特征向量集合表示为:
其中,是距离第t日第j个聚类中心/>最近的特征向量集合,/>是第t日第i个负荷特征向量,/>是第t日负荷特征向量集合。
6.如权利要求4所述的基于用户行为与数量演变的动态分群方法,其特征在于,所述第t日反映两个分群相对大小的比例系数的计算公式为:
其中,是第t日反映两个分群相对大小的比例系数,/>是第t日属于第j个聚类中心的用户数量,/>是第t-1日属于第j个聚类中心的用户数量,f(j)是对第j个聚类中心进行贪心近似算法计算。
7.如权利要求6所述的基于用户行为与数量演变的动态分群方法,其特征在于,所述第t日和第t-1日的平衡因子的计算公式为:
其中,是平衡因子,/>是第t日平衡因子,K是/>值的上限,/>是/>的初始值,r是/>的增长速率。
8.如权利要求7所述的基于用户行为与数量演变的动态分群方法,其特征在于,根据所述第t日的反映两个分群相对大小的比例系数以及第t日和第t-1日的平衡因子,对第t日的聚类中心进行更新的计算公式为:
其中,是第j个聚类中心。
9.一种基于用户行为与数量演变的动态分群系统,其特征在于,包括:
数据获取模块,用于计算智能电表采集数据的用户对象,及其对应的负荷数据;
改进的离散小波转换模块,用于对所述负荷数据进行改进的离散小波转换,并将经过所述改进的离散小波转换的复合数据转换为负荷特征向量;
模型训练模块,用于将所述负荷特征向量输入动态分群算法模型,所述动态分群算法模型中第一日采用初始化聚类中心,从第二日开始,初始化聚类中心采用上一日的历史聚类中心/>,获得所有日的用户动态分群标签结果序列;
输出模块,用于输出所有日的用户动态分群标签结果序列。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-8任一项所述的基于用户行为与数量演变的动态分群方法。
11.一种计算设备,其特征在于,包括:一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至8任一项所述的种基于用户行为与数量演变的动态分群方法。
CN202311446622.2A 2023-11-02 2023-11-02 基于用户行为与数量演变的动态分群方法和系统 Active CN117172831B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311446622.2A CN117172831B (zh) 2023-11-02 2023-11-02 基于用户行为与数量演变的动态分群方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311446622.2A CN117172831B (zh) 2023-11-02 2023-11-02 基于用户行为与数量演变的动态分群方法和系统

Publications (2)

Publication Number Publication Date
CN117172831A true CN117172831A (zh) 2023-12-05
CN117172831B CN117172831B (zh) 2024-01-23

Family

ID=88937955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311446622.2A Active CN117172831B (zh) 2023-11-02 2023-11-02 基于用户行为与数量演变的动态分群方法和系统

Country Status (1)

Country Link
CN (1) CN117172831B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070255736A1 (en) * 2006-04-29 2007-11-01 Yahoo! Inc. System and method using hierachical clustering for evolutionary clustering of sequential data sets
CN109472404A (zh) * 2018-10-31 2019-03-15 山东大学 一种电力负荷短期预测方法、模型、装置及系统
CN110909773A (zh) * 2019-11-08 2020-03-24 中国农业大学 基于自适应粒子群的客户分类方法及系统
CN112415304A (zh) * 2020-10-30 2021-02-26 国网天津市电力公司 基于低压台区电压数据曲线分群的线路识别方法
CN113281993A (zh) * 2021-05-11 2021-08-20 北京理工大学 一种贪心k-均值自组织神经网络多机器人路径规划方法
CN113378954A (zh) * 2021-06-23 2021-09-10 云南电网有限责任公司电力科学研究院 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统
CN114897451A (zh) * 2022-07-13 2022-08-12 南昌工程学院 考虑需求响应用户关键特征的双层聚类修正方法及装置
CN116842405A (zh) * 2023-06-30 2023-10-03 国电南瑞科技股份有限公司 一种电力负荷数据聚类方法、系统、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070255736A1 (en) * 2006-04-29 2007-11-01 Yahoo! Inc. System and method using hierachical clustering for evolutionary clustering of sequential data sets
CN109472404A (zh) * 2018-10-31 2019-03-15 山东大学 一种电力负荷短期预测方法、模型、装置及系统
CN110909773A (zh) * 2019-11-08 2020-03-24 中国农业大学 基于自适应粒子群的客户分类方法及系统
CN112415304A (zh) * 2020-10-30 2021-02-26 国网天津市电力公司 基于低压台区电压数据曲线分群的线路识别方法
CN113281993A (zh) * 2021-05-11 2021-08-20 北京理工大学 一种贪心k-均值自组织神经网络多机器人路径规划方法
CN113378954A (zh) * 2021-06-23 2021-09-10 云南电网有限责任公司电力科学研究院 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统
CN114897451A (zh) * 2022-07-13 2022-08-12 南昌工程学院 考虑需求响应用户关键特征的双层聚类修正方法及装置
CN116842405A (zh) * 2023-06-30 2023-10-03 国电南瑞科技股份有限公司 一种电力负荷数据聚类方法、系统、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨耀;魏宾;李晶晶;高飞;: "基于小波去噪的电力系统日负荷分析", 陕西电力, no. 12 *

Also Published As

Publication number Publication date
CN117172831B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
CN104063480B (zh) 一种基于电力大数据的负荷曲线并行聚类方法
CN110245783B (zh) 一种基于c-均值聚类模糊粗糙集的短期负荷预测方法
Meiseles et al. Source model selection for deep learning in the time series domain
CN109117872A (zh) 一种基于自动最优聚类算法的用户用电行为分析方法
CN112115322B (zh) 用户分群方法、装置、电子设备及存储介质
CN112330052A (zh) 一种配变负荷预测方法
CN108734216A (zh) 基于负荷曲线形态的电力用户分类方法、装置及存储介质
CN116646927B (zh) 一种基于分段滤波与纵横聚类的风电功率预测方法
CN113378954A (zh) 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统
CN112200346B (zh) 一种天气波动过程划分与匹配的短期风电功率预测方法
CN110795610B (zh) 一种基于聚类的电力负荷分析方法
CN117172831B (zh) 基于用户行为与数量演变的动态分群方法和系统
CN111324790A (zh) 基于支持向量机分类的负荷类型识别方法
CN114240687A (zh) 一种适用于综合能源系统的能源托管效率分析方法
CN113094448B (zh) 住宅空置状态的分析方法及分析装置、电子设备
Zhang et al. A density-center-based automatic clustering algorithm for IoT data analysis
CN113537556A (zh) 一种基于状态频率记忆网络的家庭短期负荷预测方法
CN112347162A (zh) 一种基于在线学习的多元时序数据规则挖掘方法
CN117764227A (zh) 一种用于加油站的客户流失预测装置
CN111695599B (zh) 一种用户用电负荷时间弹性识别方法
CN116011655A (zh) 基于两阶段智能特征工程的负荷超短期预测方法及系统
CN109145026B (zh) 一种根据注释者辅助信息程度的标签排序的方法
CN112668770A (zh) 一种基于信息与波形总体相似度的电力负荷预测方法
CN113222781B (zh) 一种智能变频供水方法及系统
CN117477581B (zh) 一种电力系统负荷均衡控制方法及电力系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant