CN112711913B

CN112711913B - 基于粒度支持向量机的冷热电短期负荷预测系统及方法

Info

Publication number: CN112711913B
Application number: CN202110004055.XA
Authority: CN
Inventors: 肖晶; 徐荆州; 齐飞; 冯澎湃; 邱泽晶; 郭松; 周博滔; 江城
Original assignee: Wuhan Energy Efficiency Evaluation Co Ltd Of State Grid Electric Power Research Institute; State Grid Corp of China SGCC; State Grid Electric Power Research Institute; Nanjing Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Current assignee: Wuhan Energy Efficiency Evaluation Co Ltd Of State Grid Electric Power Research Institute; State Grid Corp of China SGCC; State Grid Electric Power Research Institute; Nanjing Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date: 2021-01-04
Filing date: 2021-01-04
Publication date: 2022-07-22
Anticipated expiration: 2041-01-04
Also published as: CN112711913A

Abstract

本发明公开了一种基于粒度支持向量机的冷热电短期负荷预测系统及方法，考虑了影响冷热电短期负荷预测的各类关键影响因素，通过采集历史冷热电负荷和关键影响因素的样本数据，运用共享最近邻相似度把样本划分为若干个信息粒，利用k最近邻连通度提取每个信息粒关键支持向量点，针对支持向量点进行支持向量机训练后得到最终的决策模型，然后利用决策模型进行冷热电负荷预测，以提高短期负荷预测准确率和降低时间复杂度。本发明方法在保证关键粒化信息不丢失的同时减低了负荷训练样本的复杂性，克服传统粒度支持向量机对短期负荷历史样本数据粒化的随机性，从而获得较好的预测精度和模型泛化能力。

Description

基于粒度支持向量机的冷热电短期负荷预测系统及方法

技术领域

本发明涉及综合能源系统负荷预测技术领域，尤其涉及一种基于粒度支持向量机的冷热电短期负荷预测系统及方法。

背景技术

由于受建筑围护结构要素、室外天气、用户行为和节假日等因素的影响，综合能源系统的冷热电短期负荷需求具有波动性和随机性。冷热电短期负荷预测的误差将会给电网和热网安全可靠稳定运行和调度管理带来诸多问题。常用的冷热电短期负荷预测方法主要包括以时间序列法和神经网络法，时间序列法的原理和模型均相对简单，难以满足当前对短期负荷预测的精度要求。神经网络方法考虑了影响负荷的不确定因素，预测效果较时间序列法有了明显的改善，但是在确定网络结构时缺乏理论方法。支持向量机(SVM)是一种基于统计学习理论的预测模型，它基于VC维理论和结构风险最小化原则，避免了传统机器学习中的过拟合和欠拟合等问题。

在给定样本的情况下，SVM的参数选择直接影响其模型的学习能力，同时对假设空间的规模和搜索方式有很大的影响。参数的选择决定着SVM模型的性能，如何得到最优的参数组合是SVM模型必须考虑的问题。我们可以把参数选取看作一个优化问题来处理，将智能优化算法引入到SVM参数寻优中。目前，智能优化SVM参数的方法主要由遗传算法、蚁群算法和粒子群优化算法。遗传算法搜索速度较慢，训练时间较长，增加了计算复杂度，对初始种群的选择有一定的依赖性；蚁群算法每次构造过程计算量较大，容易出现停滞现象，不能对空间进一步搜索，不利于发现更好解，对于连续优化问题(函数优化)无法直接应用；粒子群算法结构简单，容易实现，所涉及的参数较少，可能更快低收敛于最优解，具有更好的收敛速度，但是粒子群算法容易陷入局部最优解，并且算法后期的收敛速度较慢。结合粒度计算方法可以克服传统智能优化算法对于大规模数据划分粒的随机性，提升了训练效果，降低了训练代价，可以较好地提高预测模型的泛化能力；然而，实际数据中仍会存在数据集交叠的情况，而且大部分样本分布形态各异，如何将这些分布不规则的样本点合理地划分、解决子空间样本点分布不平衡、有效解决纯粒的关键点提取等问题，选择合适的划分机制是粒度支持向量机模型的关键所在。

发明内容

本发明的目的就是要提出一种基于粒度支持向量机的冷热电短期负荷预测系统及方法，旨在满足避免常规机器学习中的过拟合和欠拟合等问题的同时，又能保证关键粒化信息不丢失、减低负荷训练样本的复杂性，同时克服传统粒度支持向量机对短期负荷历史样本数据粒化的随机性，从而获得较好的预测精度和模型泛化能力。

为实现此目的，本发明所设计的基于粒度支持向量机的冷热电短期负荷预测系统，它包括数据采集模块、粒度划分模块、支持向量提取模块、预测模型训练模块和负荷预测模块；所述数据采集模块用于采集建筑物历史时序冷热电负荷和影响建筑冷热电负荷水平的关键影响因素样本数据，并完成关键影响因素样本数据预处理生成关键影响因素样本集；所述粒度划分模块用于运用共享最近邻相似度将数据采集模块输出的关键影响因素样本集进行粒群划分，获得若干个信息粒；所述支持向量提取模块用于利用k最近邻连通度对粒度划分模块输出的每个信息粒的关键支持向量点进行提取；所述预测模型训练模块针对支持向量提取模块输出的支持向量点，以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练，获得逐时负荷预测最终决策模型超参数组，建立粒度支持向量机负荷预测模型；所述负荷预测模块采用数据采集模块的关键影响因素预处理方法获得当前时刻关键影响因素样本数据，以当前时序行样本为输入变量值，基于预测模型训练模块输出的粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果。

一种基于粒度支持向量机的冷热电短期负荷预测方法，它包括如下步骤：

S1，数据采集：所述数据采集模块用于采集建筑物历史时序冷热电负荷和影响建筑冷热电负荷水平的关键影响因素样本数据，并完成关键影响因素样本数据预处理生成关键影响因素样本集；

S2，粒度划分：所述粒度划分模块运用共享最近邻相似度把关键影响因素样本集划分为若干个信息粒；

S3，支持向量提取：所述支持向量提取模块利用k最近邻连通度提取每个信息粒的关键支持向量点；

S4，预测模型训练：所述预测模型训练模块针对各信息粒中提取的支持向量，以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练，获得逐时负荷预测最终决策模型超参数组，建立粒度支持向量机负荷预测模型；

S5，负荷预测：所述负荷预测模块采用S1中关键影响因素预处理方法获得当前时刻关键影响因素样本数据，以当前时序行样本为输入变量值，基于粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果。

本发明的有益效果：

本发明采用了共享最近邻相似度划分粒度的方法解决子空间样本点分布不平衡、纯粒的关键点提取等问题，是数据样本的更符合自然分布规律，在保证不丢失关键信息的前提下，尽可能的过滤掉冗余的数据，在简化样本点的同时减低了负荷训练样本的复杂性，克服传统粒度支持向量机对短期负荷历史样本数据粒化的随机性，从而获得较好的预测精度和模型泛化能力；对于提高综合能源供应可靠性以及线网规划安全高效运行具有重要意义，解决了现有的冷热电短期负荷预测模型泛化能力低、参数寻优速度慢、预测精度低等问题。

附图说明

图1为本发明的系统结构示意图；

图2为本发明的方法工作原理示意图；

图3为本发明预测模型与常规支持向量机技术预测结果对比示意图；

其中，1-数据采集模块、2-粒度划分模块、3-支持向量提取模块、4-预测模型训练模块、5-负荷预测模块、6-实际负荷输出模块。

具体实施方式

以下结合附图和具体实施例对本发明作进一步的详细说明：

本发明所设计的基于粒度支持向量机的冷热电短期负荷预测系统，如图1所示，它包括数据采集模块1、粒度划分模块2、支持向量提取模块3、预测模型训练模块4、负荷预测模块5和实际负荷输出模块6；所述数据采集模块1用于采集建筑物历史时序冷热电负荷，采集建筑围护结构要素和/或室外天气和/或用户行为和/或节假日等影响建筑冷热电负荷水平的关键影响因素，不同种类的关键影响因素以不同列数据形式存放至关键影响因素样本数据中，所述数据采集模块1完成关键影响因素样本数据预处理生成关键影响因素样本集，具体方法为所述数据采集模块1分别对关键影响因素样本数据每列关键影响因素计算贝塞尔函数标准差并清洗3倍以上误差的异常数据样本，让剩下的数据样本服从正态分布，并对剩下的数据样本进行归一化处理生成关键影响因素样本集；所述粒度划分模块2用于运用共享最近邻相似度将数据采集模块1输出的关键影响因素样本集进行粒群划分，获得若干个信息粒，以保证关键粒化信息不丢失、减低负荷训练样本的复杂性，同时克服传统粒度支持向量机对短期负荷历史样本数据粒化的随机性；所述支持向量提取模块3用于利用k最近邻连通度对粒度划分模块2输出的每个信息粒的关键支持向量点进行提取，旨在满足避免常规机器学习中的过拟合和欠拟合等问题，为预测模型训练提供最优化求解约束条件；所述预测模型训练模块4针对支持向量提取模块3输出的支持向量点，以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练，获得逐时负荷预测最终决策模型超参数组，建立粒度支持向量机负荷预测模型；所述负荷预测模块5采用数据采集模块1的关键影响因素预处理方法获得当前时刻关键影响因素样本数据，以当前时序行样本为输入变量值，基于预测模型训练模块4输出的粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果；所述实际负荷输出模块6用于对负荷预测模块5输出的短期预测结果进行[0,1]反归一化处理，得到预测时刻冷热电逐时负荷实际计算结果。即：

y＝y_min+y′×(y_max-y_min)

式中，y，表示该预测时刻负荷实际计算值；y′，表示该预测时刻负荷归一化值；y_min，表示该预测时刻负荷输出样本集最小值；y_max，表示预测时刻负荷输出样本集最大值。

上述技术方案中，所述数据采集模块1采集的关键影响因素包括建筑围护结构要素和/或室外天气和/或用户行为和/或节假日；所述样本数据为每间隔5分钟记录一组样本记录，包括前60天的历史负荷数据及影响因素数据。

上述技术方案中，所述数据采集模块1完成异常数据样本清洗的具体方法为：

第一步，计算所述数据采集模块1采集到的建筑冷热电负荷关键影响因素每列样本数据x_i的算术平均值

即：

第二步，ns为关键影响因素的原始样本数据记录长度；

其次，运用贝塞尔函数计算建筑冷热电负荷关键影响因素每列样本数据x_i的标准差σ，即：

第三步，计算建筑冷热电负荷关键影响因素每列样本数据x_i的绝对误差δ，即：

第四步，去除满足以下条件的样本数据清除，让剩下的数据样本服从正态分布，即：

δ≥3σ

第五步，对清洗后的样本集进行归一化处理，把干净数据集缩放至[0,1]之间，即：

式中，x′，表示该影响因素归一化值；x，表示该影响因素实际测量值；x_min，表示该影响因素的样本集最小值；x_max，表示该影响要素的样本集最大值。

上述技术方案中，所述粒度划分模块2完成粒群划分的具体方法为：

第一步，计算数据采集模块1输出的归一化后的每个样本点间的欧氏距离r，构造距离矩阵D为样本点，即：

D＝(a_i,j)_n×n,x_i,x_j

式中，x_i，x_j是样本集{x₁,x₂,…,x_n}中的任意两点，其中：

x_i＝[r_i,1,r_i,2,…,r_i,n]

x_j＝[r_j,1,r_j,2,…,r_j,n]

式中，r_i,n为关键影响因素列n的样本点x_i的欧氏距离；为r_j,n为关键影响因素列n的样本点x_j的欧氏距离；

第二步，计算距离矩阵D中每个点的共享最近邻相似度S(x_i,x_j)，得到样本的相似度矩阵，即：

S(x_i,x_j)＝s(nn[x_i]∩nn[x_j])

式中，nn[x_i]和nn[x_j]分别是x_i和x_j的k最近邻列表；s(nn[x_i]∩nn[x_j])表示距离矩阵D的大小；若x_i和x_j两点存在对方的k最近邻中，则定义两点为相似，且其共享最近邻点的个数为两点的相似度值S(x_i,x_j)；

第三步，计算每个样本点的密度D(x_i)，将大于阈值n的点归为信息粒{K₁,K₂,…,K_n}，小于阈值相似度n的点归为噪声点{N₁,N₂,…,N_n}，即：

D(x_i)＝count[S(x_i,x_j)]≥n

式中，点x_i的密度为在x_j的k最近邻列表中与x_i相似的点的个数；n为判断两个点是否相似的阈值，即两个点相似的条件是他们两者之间共享了不少于n个的最近邻；

K＝{D(x_i)≥n}

N＝{D(x_i)<n}

式中，K为信息粒，核心点密度不小于阈值n；N为噪声点，核心点密度小于阈值n。

上述技术方案中，所述支持向量提取模块3完成支持向量点提取的具体方法为：

第一步，对属于混合粒的信息粒{N_i}，利用k最近邻法对其进行裁剪，得到关键信息{G_s}；

第二步，对属于纯粒的信息粒{K_i}，计算其k最近邻连通度st(x_i,D)，即：

st(x_i,D)＝∑c(x_i)

式中，D，表示样本集；x_i，表示任意一个样本点；c(x_i)，表示点x_i出现在k最近邻列表中的次数；若x_i是x_j的k最近邻列表中的一点，则称点x_i与点x_j连通；

第三步，计算纯粒{K_i}中样本点的k最近邻连通度平均值D_m作为阈值，将连通度大于阈值的样本点删除并提取边缘点{G_b}，对于粒化得到的噪声点保留为一个噪声粒{G_n}，即：

D_m＝∑st(x_i,D)/s(D)

式中，s(D)，表示样本集D中样本点的个数。

上述技术方案中，所述预测模型训练模块4完成预测模型训练的具体方法为：

第一步，将从混合粒中提取出的支持向量点{G_s}、从纯粒中提出的边缘点{G_b}、噪声点{G_n}进行组合，生成新的样本数据集D′；

第二步，设定SVM超参数变化范围：惩罚参数C为[10^-2，10³]，损失函数参数ε为[10^-3，10]，RBF核函数参数σ为[10^-2，10²]；

第三步，利用十折交叉验证法，将数据集D′分为10份，其中8份作为训练样本，剩余2份作为测试样本，采用高斯核函数进行SVM训练，寻找最优超参数组，得到短期负荷预测最终的决策模型，建立粒度支持向量机负荷预测模型。

一种基于粒度支持向量机的冷热电短期负荷预测方法，如图2所示，它包括如下步骤：

S1，数据采集：所述数据采集模块1从能管平台以时间间隔5分钟为一个采样周期采集前60天冷热电负荷历史数据作为输出变量，采集建筑围护结构要素和/或室外天气和/或用户行为和/或节假日等影响建筑冷热电负荷水平的关键影响因素作为输入变量，不同种类的关键影响因素以不同列数据形式存放至输入变量中，以影响因素作为输入变量、冷热电负荷作为输出变量构建原始训练样本集；所述数据采集模块1分别对输入变量每列关键影响因素计算贝塞尔函数标准差并清洗3倍以上误差的异常数据样本，让剩下的数据样本服从正态分布，对干净数据集缩放至[0,1]完成归一化处理；

S2，粒度划分：所述粒度划分模块2运用共享最近邻相似度把归一化后的样本划分为若干个信息粒；

S3，支持向量提取：所述支持向量提取模块3利用k最近邻连通度提取每个信息粒的关键支持向量点；

S4，预测模型训练：所述预测模型训练模块4针对各信息粒中提取的支持向量，以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练，获得逐时负荷预测最终决策模型超参数组，建立粒度支持向量机负荷预测模型；

S5，负荷预测：所述负荷预测模块5采用S1中关键影响因素预处理方法获得当前时刻关键影响因素样本数据，以当前时序行样本为输入变量值，基于粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果；

S6，实际负荷输出：所述实际负荷输出模块6对短期预测结果进行处理得到预测时刻冷热电逐时负荷实际计算结果。

上述技术方案中，所述步骤S1中，数据采集模块1完成异常数据样本清洗的具体方法为：

S11，计算所述数据采集模块1采集到的建筑冷热电负荷关键影响因素被测列x_i的算术平均值

即：

式中，ns为关键影响因素的原始样本数据记录长度。

S12，运用贝塞尔函数计算建筑冷热电负荷关键影响因素被测列x_i的标准差σ，即：

S13，计算每个样本数据的绝对误差δ，即：

S14，去除满足以下条件的样本数据清除，让剩下的数据样本服从正态分布，即：

δ≥3σ

S15，对清洗后的样本集进行归一化处理，把干净数据集缩放至[0,1]之间，即：

上述技术方案中，粒度划分模块2完成粒群划分的具体方法为：

S21，计算数据采集模块1输出的归一化后的每个样本点间的欧氏距离r，构造距离矩阵D为样本点，即：

D＝(a_i,j)_n×n,x_i,x_j

式中，x_i，x_j是样本集{x₁,x₂,…,x_n}中的任意两点，其中：

x_i＝[r_i,1,r_i,2,…,r_i,n]

x_j＝[r_j,1,r_j,2,…,r_j,n]

式中，r_i,n为关键影响因素列n的样本点x_i的欧氏距离；为r_j,n为关键影响因素列n的样本点x_j的欧氏距离。

S22，计算距离矩阵D中每个点的共享最近邻相似度S(x_i,x_j)，得到样本的相似度矩阵，即：

S(x_i,x_j)＝s(nn[x_i]∩nn[x_j])

式中，nn[x_i]和nn[x_j]分别是x_i和x_j的k最近邻列表；s(nn[x_i]∩nn[x_j])表示距离矩阵D的大小；若x_i和x_j两点存在对方的k最近邻中，则定义两点为相似，且其共享最近邻点的个数为两点的相似度值S(x_i,x_j)。

S23，计算每个样本点的密度D(x_i)，将大于阈值n的点归为信息粒{K₁,K₂,…,K_n}，小于阈值相似度n的点归为噪声点{N₁,N₂,…,N_n}，即：

D(x_i)＝count[S(x_i,x_j)]≥n

式中，点x_i的密度为在x_j的k最近邻列表中与x_i相似的点的个数；n为判断两个点是否相似的阈值，即两个点相似的条件是他们两者之间共享了不少于n个的最近邻。

K＝{D(x_i)≥n}

N＝{D(x_i)<n}

上述技术方案中，所述步骤S3中，支持向量提取模块3完成支持向量点提取的具体方法为：

S31，对属于混合粒的信息粒{N_i}，利用k最近邻法对其进行裁剪，得到关键信息{G_s}；

S32，对属于纯粒的信息粒{K_i}，计算其k最近邻连通度st(x_i,D)，即：

st(x_i,D)＝∑c(x_i)

式中，D，表示样本集；x_i，表示任意一个样本点；c(x_i)，表示点x_i出现在k最近邻列表中的次数；若x_i是x_j的k最近邻列表中的一点，则称点x_i与点x_j连通。

S33，计算纯粒{K_i}中样本点的k最近邻连通度平均值D_m作为阈值，将连通度大于阈值的样本点删除并提取边缘点{G_b}，对于粒化得到的噪声点保留为一个噪声粒{G_n}，即：

D_m＝∑st(x_i,D)/s(D)

式中，s(D)，表示样本集D中样本点的个数。

上述技术方案中，所述步骤S4中，预测模型训练模块4完成预测模型训练的具体方法为：

S41，将从混合粒中提取出的支持向量点{G_s}、从纯粒中提出的边缘点{G_b}、噪声点{G_n}进行组合，生成新的样本数据集D′；

S42，设定SVM超参数变化范围：惩罚参数C为[10^-2，10³]，损失函数参数ε为[10^-3，10]，RBF核函数参数σ为[10^-2，10²]；

S43，利用十折交叉验证法，将数据集D′分为10份，其中8份作为训练样本，剩余2份作为测试样本，采用高斯核函数进行SVM训练，寻找最优超参数组，得到短期负荷预测最终的决策模型，建立粒度支持向量机负荷预测模型。

本发明粒度支持向量机预测模型与常规支持向量机技术的10组实验MSE(均方误差)结果对比，如图3所示，平均预测精度比常规技术提高12.0％以上。

本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种基于粒度支持向量机的冷热电短期负荷预测系统，其特征在于：包括数据采集模块(1)、粒度划分模块(2)、支持向量提取模块(3)、预测模型训练模块(4)和负荷预测模块(5)；

所述数据采集模块(1)用于采集建筑物历史时序冷热电负荷和影响建筑冷热电负荷水平的关键影响因素样本数据，并完成关键影响因素样本数据预处理生成关键影响因素样本集；

所述粒度划分模块(2)用于运用共享最近邻相似度将数据采集模块(1)输出的关键影响因素样本集进行粒群划分，获得若干个信息粒；

所述支持向量提取模块(3)用于利用k最近邻连通度对粒度划分模块(2)输出的每个信息粒的关键支持向量点进行提取；

所述预测模型训练模块(4)针对支持向量提取模块(3)输出的支持向量点，以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练，获得逐时负荷预测最终决策模型超参数组，建立粒度支持向量机负荷预测模型；

所述负荷预测模块(5)采用数据采集模块(1)的关键影响因素预处理方法获得当前时刻关键影响因素样本数据，以当前时序行样本为输入变量值，基于预测模型训练模块(4)输出的粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果；

所述粒度划分模块(2)完成粒群划分的具体方法为：

第一步，计算数据采集模块(1)输出的归一化后的每个样本点间的欧氏距离r，构造距离矩阵D为样本点，即：

D＝(a_i，j)_n×n，x_i，x_j

式中，x_i，x_j是样本集{x₁，x₂，…，x_n}中的任意两点，其中：

x_i＝[r_i，1，r_i，2，…，r_i，n]

x_j＝[r_j，1，r_j，2，…，r_j，n]

式中，r_i，n为关键影响因素列n的样本点x_i的欧氏距离；为r_j，n为关键影响因素列n的样本点x_j的欧氏距离；

第二步，计算距离矩阵D中每个点的共享最近邻相似度S(x_i，x_j)，得到样本的相似度矩阵，即：

S(x_i，x_j)＝s(nn[x_i]∩nn[x_j])

式中，nn[x_i]和nn[x_j]分别是x_i和x_j的k最近邻列表；s(nn[x_i]∩nn[x_j])表示距离矩阵D的大小；若x_i和x_j两点存在对方的k最近邻中，则定义两点为相似，且其共享最近邻点的个数为两点的相似度值S(x_i，x_j)；

第三步，计算每个样本点的密度D(x_i)，将大于阈值n的点归为信息粒{K₁，K₂，…，K_n}，小于阈值相似度n的点归为噪声点{N₁，N₂，…，N_n}，即：

D(x_i)＝count[S(x_i，x_j)]≥n

K＝{D(x_i)≥n}

N＝{D(x_i)＜n}

式中，K为信息粒，核心点密度不小于阈值n；N为噪声点，核心点密度小于阈值n；

所述支持向量提取模块(3)完成支持向量点提取的具体方法为：

第二步，对属于纯粒的信息粒{K_i}，计算其k最近邻连通度st(x_i，D)，即：

st(x_i，D)＝∑c(x_i)

D_m＝∑st(x_i，D)/s(D)

式中，s(D)，表示样本集D中样本点的个数；

所述预测模型训练模块(4)完成预测模型训练的具体方法为：

2.根据权利要求1所述的基于粒度支持向量机的冷热电短期负荷预测系统，其特征在于：

还包括实际负荷输出模块(6)，所述实际负荷输出模块(6)用于对负荷预测模块(5)输出的短期预测结果进行处理得到预测时刻冷热电逐时负荷实际计算结果；

所述数据采集模块(1)采集的关键影响因素包括建筑围护结构要素和/或室外天气和/或用户行为和/或节假日，不同种类的关键影响因素以不同列数据形式存放至关键影响因素样本数据中；所述样本数据为每间隔m分钟记录一组样本记录，包括前d天的历史负荷数据及影响因素数据。

3.根据权利要求1所述的基于粒度支持向量机的冷热电短期负荷预测系统，其特征在于：所述数据采集模块(1)完成异常数据样本清洗的具体方法为：

第一步，计算所述数据采集模块(1)采集到的建筑冷热电负荷关键影响因素每列样本数据x_i的算术平均值

即：

式中，ns为关键影响因素的原始样本数据记录长度；

第二步，运用贝塞尔函数计算建筑冷热电负荷关键影响因素每列样本数据x_i的标准差σ，即：

δ≥3σ

第五步，对清洗后的样本集进行归一化处理，把干净数据集缩放至[0，1]之间，即：

式中，x′，表示影响因素归一化值；x，表示影响因素实际测量值；x_min，表示影响因素的样本集最小值；x_max，表示影响要素的样本集最大值。

4.一种基于权利要求1-3任一项所述的基于粒度支持向量机的冷热电短期负荷预测系统的冷热电短期负荷预测方法，其特征在于，它包括如下步骤：

S1，数据采集：所述数据采集模块(1)用于采集建筑物历史时序冷热电负荷和影响建筑冷热电负荷水平的关键影响因素样本数据，并完成关键影响因素样本数据预处理生成关键影响因素样本集；

S2，粒度划分：所述粒度划分模块(2)用于运用共享最近邻相似度将数据采集模块(1)输出的关键影响因素样本集进行粒群划分，获得若干个信息粒；

S3，支持向量提取：所述支持向量提取模块(3)用于利用k最近邻连通度对粒度划分模块(2)输出的每个信息粒的关键支持向量点进行提取；

S4，预测模型训练：所述预测模型训练模块(4)针对支持向量提取模块(3)输出的支持向量点，以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练，获得逐时负荷预测最终决策模型超参数组，建立粒度支持向量机负荷预测模型；

S5，负荷预测：所述负荷预测模块(5)采用数据采集模块(1) 的关键影响因素预处理方法获得当前时刻关键影响因素样本数据，以当前时序行样本为输入变量值，基于预测模型训练模块(4)输出的粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果。

5.根据权利要求4所述的冷热电短期负荷预测方法，其特征在于：

步骤S5后还包括S6实际负荷输出，具体方法为：所述实际负荷输出模块(6)用于对负荷预测模块(5)输出的短期预测结果进行处理得到预测时刻冷热电逐时负荷实际计算结果；

步骤S1中，数据采集模块(1)完成异常数据样本清洗的具体方法为：

S11，计算所述数据采集模块(1)采集到的建筑冷热电负荷关键影响因素每列样本数据x_i的算术平均值

即：

式中，ns为关键影响因素的原始样本数据记录长度；

S12，运用贝塞尔函数计算建筑冷热电负荷关键影响因素每列样本数据x_i的标准差σ，即：

S13，计算建筑冷热电负荷关键影响因素每列样本数据x_i的绝对误差δ，即：

δ≥3σ

S15，对清洗后的样本集进行归一化处理，把干净数据集缩放至[0，1]之间，即：

6.根据权利要求4所述的冷热电短期负荷预测方法，其特征在于：步骤S2中，粒度划分模块(2)完成粒群划分的具体方法为：

S21，计算数据采集模块(1)输出的归一化后的每个样本点间的欧氏距离r，构造距离矩阵D为样本点，即：

D＝(a_i，j)_n×n，x_i，x_j

x_i＝[r_i，1，r_i，2，…，r_i，n]

x_j＝[r_j，1，r_j，2，…，r_j，n]

S22，计算距离矩阵D中每个点的共享最近邻相似度S(x_i，x_j)，得到样本的相似度矩阵，即：

S(x_i，x_j)＝s(nn[x_i]∩nn[x_j])

式中，nn[x_i]和nn[x_j]分别是x_i和x_j的k最近邻列表；s(nn[x_i]∩nn[x_j])表示距离矩阵D的大小；若x_i和x_j两点存在对方的k 最近邻中，则定义两点为相似，且其共享最近邻点的个数为两点的相似度值S(x_i，x_j)；

S23，计算每个样本点的密度D(x_i)，将大于阈值n的点归为信息粒{K₁，K₂，…，K_n}，小于阈值相似度n的点归为噪声点{N₁，N₂，…，N_n}，即：

D(x_i)＝count[S(x_i，x_j)]≥n

K＝{D(x_i)≥n}

N＝{D(x_i)＜n}

7.根据权利要求4所述的冷热电短期负荷预测方法，其特征在于：步骤S3中，支持向量提取模块(3)完成支持向量点提取的具体方法为：

S32，对属于纯粒的信息粒{K_i}，计算其k最近邻连通度st(x_i，D)，即：

st(x_i，D)＝∑c(x_i)

D_m＝∑st(x_i，D)/s(D)

式中，s(D)，表示样本集D中样本点的个数；

步骤S4中，预测模型训练模块(4)完成预测模型训练的具体方法为：