CN111815054A - 基于大数据的工业蒸汽热网短期负荷预测方法 - Google Patents
基于大数据的工业蒸汽热网短期负荷预测方法 Download PDFInfo
- Publication number
- CN111815054A CN111815054A CN202010656981.0A CN202010656981A CN111815054A CN 111815054 A CN111815054 A CN 111815054A CN 202010656981 A CN202010656981 A CN 202010656981A CN 111815054 A CN111815054 A CN 111815054A
- Authority
- CN
- China
- Prior art keywords
- load
- data
- day
- historical
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明提出了一种基于大数据的工业蒸汽热网短期负荷预测方法,该方法的主体思路是对热网中的每个用户的负荷进行独立预测,最后将所有用户的预测结果进行累加得到热网系统的总负荷。本发明捕捉了每个用户的用汽规律,避免了从热网负荷总量上进行分析预测结果产生的偏颇,提高了短期负荷预测准确度。
Description
技术领域
本发明涉及智慧能源和能源互联网领域,具体涉及基于大数据的工业蒸汽热网短期负荷预测方法。
背景技术
热网系统短期负荷预测结果关系到热网系统调度运行和生产计划的制定,准确的算起负荷预测结果有助于提高系统的安全性和稳定性,能够减少发电成本。
目前,热网系统根据业务需求已实现用汽信息采集系统的建设,实现了热网用户的用汽信息全采集,为准确把握用户级负荷变化规律提供了数据基础。目前很多热网负荷预测对象主要都是针对总量负荷,或者再深一层配气站的母线负荷,通过母线负荷累加获得总量负荷。而热网负荷时由众多用户负荷构成,不同用户的负荷受自身行业属性和生产特点的影响,负荷规律也千差万别,从热网负荷总量上分析负荷变化规律就忽略了用户的用汽规律,因此分析结果必然存在一定的偏颇,更加无法精确定位负荷波动的源头(即用户)。而用汽信息采集系统的海量用户级负荷信息将使从用户级负荷入手的短期负荷预测成为可能。
同时,随着热网公司大数据平台等业务辅助平台的完善,热网现有数据源头已经可以定位到用户负荷层面。行业标准划分数据、季节天气等于短期负荷密切耦合的相关因素也将会纳入到短期负荷预测的基础数据库中。但是负荷的影响因素众多、非线性极强,因此结合负荷数据与影响因素数据,研究负荷随多种因素的变化规律,进而总结用户的用汽规律,将是提高短期负荷准确度的一种有效手段。本发明提供了热用户负荷走势与其影响因素之间的分析方法,研究负荷随影响因素的变化规律,进而分析用汽规律,并对未来的负荷走势进行预测性分析,为热网的运行优化和精准调控提供参考与指导。
发明内容
为了解决上述技术问题,本发明的目的是提供一种基于大数据的工业蒸汽热网短期负荷预测方法。
本发明采用以下方案:
一种基于大数据的工业蒸汽热网短期负荷预测方法,包括以下步骤:
步骤S1,采集数据源,包括供热系统中N个热用户用汽信息采集及相关影响因素采集;然后进行数据清洗、数据转换;
步骤S2,数据预处理,针对其中第n(1≤n≤N)个用户,利用聚类分析、灰色关联分析、决策树等技术对历史负荷数据进行预处理,用于建立该用户每天的负荷曲线与影响因素的数学模型;
步骤S3,负荷预测模型建立:根据第n个用户的负荷曲线特性构建预测模型,并预测该用户的待预测日负荷曲线;
步骤S4,重复S2到S3,最终得到所有用户在待预测日的负荷预测曲线,并累加所有用户的预测结果得到系统负荷预测曲线。
上述技术方案中,进一步地,步骤S1中,所述采集数据源的方法包括:
采集供热系统中所有用户的历史负荷数据集,并从天气预报接口采集待预测日天气因素的预测数据;所述的历史负荷数据集包括所有热用户历史负荷数据,影响热用户负荷走势的天气因素和日类型历史数据;所述的天气因素包括日最高气温、日平均气温、日平均降水、日平均湿度、日平均风速,所述的日类型包括工作日、休息日、节假日;
将各数据库中所需要的历史数据和预测数据打包成数据视图,并将上述数据视图与所有数据库进行对接,以将所有所需要的历史数据和预测数据存储到相应的目标数据表中。
进一步地,所述步骤S1中对历史负荷数据进行数据清洗、数据转换的方法包括:
通常情况下负荷会受到不同的因素的影响,在对负荷异常的分析时需要考虑噪声点和缺失值的影响。
设N个用户历史负荷数据为F=[Fy(1)Fy(2)…Fy(n)…Fy(N)],其中,Fy(n)=[Fy1(n)Fy2(n)…Fyd(n)],Fyd(n)构成一条负荷曲线,n为第n个用户,d为第d天,并且1≤n≤N,d≥1。
分别对每个用户负荷曲线异常值类型建立时间序列上的模型:
式中,Fyd(n)表示第n个用户的第d天的负荷序列,Fyd(n)(t)表示的t时刻的负荷,Fxd(n)(t)表示不包含异常值的t时刻负荷,p为异常值个数,wi和a(j)表示负荷异常值的影响因子,表示的是t时刻的脉冲函数。
对于数据库中的缺失值,根据用汽负荷的波动特性,计算前后相邻两日相同时间点的负荷以及当前时刻的前后两个时间点的负荷的均值,和后一日相对前一日的负荷变化率,以均值加上负荷变化量填充空缺值:
式中:Xi表示当前时刻的负荷,i表示时间点取值为1到24,a1和a2分别表示前后两天对应时刻和当前时刻前后两个时间点负荷的加权系数。
对于噪声点数据,在负荷曲线上体现为远离正常的波动范围,出现毛刺等现象。利用负荷序列的前后波动性关系,可以通过计算负荷间的距离来检测异常。取时间序列中到中心点s最近的k个负荷的距离表示负荷的密度区域,则密度越大的点区域半径越小,取负荷点到中心点的距离d与密度区域半径r的较大者作为中心点s的可达距离。则负荷的异常程度可以用负荷点到中心点s的相对距离来表示,通过设定一定的阈值就可得到数据异常的负荷点,阈值的计算方式为:
式中,rd表示以s为中心点的密度区域的可达距离,ds表示以s为中心点的所有距离的均值,m表示该时间序列中的所有负荷点。
对于异常的噪声点数据要进行修复,修复方法采用当前负荷相对前一天时间序列的变化的思路进行处理:
式中,x(t)表示当前序列中不存在异常的负荷数据,x(t-j)表示序列异常点前面第j个的负荷数据,x′(t-j)表示相对x(t-j)前一天的负荷数据。
进一步地,所述步骤S2中,采用凝聚层次聚类算法对数据进行预处理,分别对每个独立用户的负荷曲线进行聚类分析的方法为:
设将第n个用户的d(d≥1)组Fyd(n)负荷曲线组成初始簇C1~Cd,Fyd(n)为单独一个单独样本簇Ci(1≤i≤d);
计算负荷样本簇Ci与负荷样本簇Cj(1≤j≤d)之间的平均距离:
其中,xi,xj分别为负荷样本簇Ci,Cj中的负荷点,xi={xi1,xi2,……xin},{xj={xj1,xj2,……xjn},二者间的欧式距离d(xi-xj)为:
设定曲线间的距离阈值为D,在负荷样本S中有N条负荷曲线序列{L1,L2,…….,LN},,任意取出曲线LN并计算与其他曲线间的欧式距离,合并最近两个簇,合并的过程反复进行直到类别总数达到预设的数目K。
进一步地,所述步骤S2中,对于每个独立用户,利用灰色关联分析方法对数据进行预处理,确立影响负荷走势的关键因素的方法为:
针对第n个用户的历史负荷数据集,先对影响该用户的负荷曲线走势的因素进行关联度排序,根据关联度来判断因素对负荷的影响,从而剔除一些对负荷影响小(关联度小于0.4)的因素,即采用灰色关联分析方法计算每天的天气因素、日类型与负荷曲线之间的灰色关联度;
将历史负荷数据、天气因素以及日类型作为分析样本,设定负荷数据为母序列、天气因素和日类型为子序列;采用灰色关联分析算法分析各个子序列与母序列的相关性,最后将同一子序列的所有灰色关联度求均值即可得到各个影响因素的灰色关联度。
所述影响因素与负荷之间的灰色关联度计算方法包括:
确定反映系统行为特征的参考序列和影响系统行为的比较序列:即历史负荷数据为参考序列,天气因素和日类型组成的历史影响因素数据则称比较序列;将第n个用户的参考序列Fy(n)=[Fy1(n)Fy2(n)…Fyd(n)]表示成X0=[X0(1),X0(2),……,X0(d)](d=n),将比较序列Dx(n)=[Dx1(n)Dx2(n)…Dxd(n)]表示成Xi=[Xi(1),Xi(2),……,Xi(d)](i=1,2,…,k);其中,k为变量个数;
对历史负荷数据和历史因素数据进行无量纲化处理;
对历史负荷数据进行标准化:
其中,X0(1)为一组历史负荷数据序列,p=2
对历史影响因素数据进行标准化:
其中,Xi(1)为一组历史影响因素数据序列,p=2
计算参考序列与比较序列的灰色关联系数方法为:
式中,
灰色相对关联度表征了历史负荷数据序列X0和历史影响因素数据序列Xi相对于始点的变化速率之间的关系,历史负荷数据序列X0和历史影响因素数据序列Xi的变化速率越趋于一致,其灰色相对关联度越大。计算灰色相对关联度Π0i:
式中,
灰色综合关联度体现了负荷序列X0和影响因素序列Xi的相似程度,较为全面地表征两个序列之间联系是否紧密。计算灰色综合关联度Ψ0i:
对计算得出的灰色关联度进行排序,选定灰色关联度超过设定阈值的四个因素作为关键影响因素。
更进一步地,所述的步骤S2中,针对每个独立用户,采用CART决策树对数据进行预处理,建立负荷与关键影响因素之间分类规则的方法为:
根据历史负荷曲线产生的分类结果与确立的关键影响因素,利用CART决策树算法建立分类规则模型;
采用CART决策树算法进行样本分类的方法包括:
针对第n用户的m组参考序列Fy(n)构建训练样本:
C={X1,X2,……,Xm,L}
Xm={xm1,xm2,……,xmt}
L={L1,L2,……,Lk}
其中,X1,X2,……,Xm为历史负荷数据分类标签;L为历史影响因素标签;
将训练样本划分为测试变量和目标变量,通过对这两种变量的循环分析形成二叉决策树。假设训练数据集D={(x1,y1),(x2,y2),……(xn,yn)},A为历史影响因素数据集,现在用特征A对数据进行分割,若特征A为离散特征,则根据A的某一可能取值a将D分为D1与D2:
D1={D|A=a},D2={D|A≠a}
即在已知特征A的条件下集合D的基尼指数:
对整个数据集中所有的可能特征A以及其可能取值a选取基尼系数最小的特征A*与特征下的取值a*,将数据集切分,数据D1,D2被分到两个子节点中去,对子节点递归进行重复迭代直至满足所有的Gini(D,A)取值都最小;
计算基尼系数:
式中,是从训练样本集中随机抽取的一个样本,表示当某一测试变量值为h时属于第j类的概率;nj(h)为训练样本中测试变量值为h时属于第j类的样本个数;n(h)为训练样本中该测试变量值为h的样本个数;j为类别个数。
为避免模型过拟合,需要对决策树进行减枝。设树的叶结点个数为|T|,t是树T的叶结点,该叶结点有Nt个样本点,其中k类的样本点有Ntk个,k=1,2,…,K,Ht(T)为叶结点t上的经验熵,α≥0为参数,则损失函数可定义为:
其中经验熵为:
在损失函数定义公式中,将其右端第一项记作:
则损失函数简化为:
Cα(T)=C(T)+α|T|
输入生成算法产生的决策树T0,参数α,计算每个结点的经验熵,递归的从树的叶结点向上回缩。设一组叶节点回归到其父结点之前与之后的整体数分别为TA与TB,计算其对应的损失函数值Cα(TA)与Cα(TB),如果
Cα(TA)≤Cα(TB)
则进行剪枝,即将父结点变为新的叶结点。继续从叶结点向上回缩,直至不能继续为止,得到损失函数最小的子树Tα,即最优决策树。
进一步地,所述步骤S3中负荷预测模型建立方法为:
找到与待预测日同类型日的历史负荷曲线、历史影响因素,以及针对每一类训练对应的支持向量机模型,计算出每个独立用户的预测负荷曲线,
找到第n个用户的与待预测日的分类标签L′(n)相同的历史负荷曲线数据集、日特征向量集构建训练样本,针对该类负荷曲线的走势变化规律和特征,选取匹配的预测模型,预测该用户在待预测日的负荷曲线;
其中,所述的分类标签L′(n)的计算方式为:找到第n个用户的待预测日的关键因素日特征向量为x′(n)={x′1,x′2,…x′k}(k=4);
输入上述匹配的预测模型中:
L′(n)=f(x′(n))
其中输入x′(n)为日特征向量,输出L′(n)即为用户n的待预测日的负荷曲线对应的分类标签。
采用支持向量机模型完成负荷预测的方法为:
设第n个用户的历史负荷曲线数据集中,属于分类标签L′(n)的样本共k个,(x1,y1),(x2,y2),…(xk,yk),其中xk∈Dx(n)为输入参数,即日特征向量集,yk∈Fy(n)为相应的输出参数,即负荷曲线,k为样本个数。输入参数与输出参数之间存在如下关系:
f(x)(n)=ω·θ(x)+b
其中,ω为权值矢量,b为阈值。
这里,同理理论计算SVM的回归函数,目标函数与约束条件:
利用拉格朗日方法求解上述最优化问题:
K(xi,xj)=exp(-g|xi-xj|2)
式中,核函数采用径向基函,g为核函数的参数。
第n个用户的待预测日的关键因素日特征向量x′(n)输入到上述支持向量机f(x)(n)模型中,得出该用户在待预测日的负荷曲线F′yd(n)。
进一步地,所述的步骤S4中计算系统负荷预测曲线的方法为:
重复上述步骤S2到S3,计算得出所有用户在待预测日的负荷曲线数据集{F′yd(1)F′yd(2)…F′yd(n)},将预测结果累加起来,即求得目标热网的系统总负荷:
其中,Flow为待预测日的系统负荷,F′yd(n)为第n用户的待预测日负荷曲线。
本发明的有益效果为:
本发明通过采集的热网中热用户的历史负荷数据、天气因素和日类型历史数据,利用大数据技术(聚类分析、灰色关联分析、决策树算法)对历史负荷数据、历史影响因素数据(天气因素和日类型历史数据)进行预处理;把握每个热用户负荷与天气因素、日类型的密切关系;并根据不同用户特性构建预测模型,对某用户的未来日负荷曲线进行独立预测,最后累加所有用户的预测结果,得到系统的预测负荷;本发明利用大数据技术,捕捉了每个用户的用汽规律,弥补了传统的数据统计方法对数量级较大的数据量分析方面的不足,解决了工业用汽系统从热网负荷总量上进行分析导致的预测失准问题,提高了工业热网系统短期总负荷预测准确度,最终为工业热网的运行优化和精准调控做参考。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明所涉及的一种基于大数据技术的工业热网短期负荷预测方法的流程图;
图2是本发明所涉及的凝聚层次聚类方法的流程图;
图3是本发明所涉及的用户负荷曲线走势图;
图4是本发明所涉及的分类规则建立图
图5是本发明所涉及的CART决策树示意图;
图6是本发明所涉及的支持向量机算法示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
实施例1
图1是本发明所涉及的一种基于大数据技术的工业热网短期负荷预测方法的流程图。如图1所示,本实施例提供了一种基于大数据技术的工业热网短期负荷预测解决方案,包括:步骤S1,获取数据源,包括供热系统中N个热用户用汽信息采集及相关影响因素采集,并对上述数据进行清洗、转换;步骤S2,数据预处理,针对其中第n(1≤n≤N)个用户,利用聚类分析、灰色关联分析、决策树等技术对历史负荷数据进行预处理,建立该用户每天的负荷曲线与天气、日类型等影响因素的数学模型;步骤S3,负荷预测模型建立,根据第n个用户的负荷曲线特性构建预测模型,并预测该用户的待预测日负荷曲线;步骤S4,重复S2到S3,最终得到所有用户在待预测日的负荷预测曲线,并累加所有用户的预测结果得到系统负荷预测曲线。
图2是本发明所涉及的凝聚层次聚类方法的流程图。如图2所示,在本实施例中,所述步骤S2,凝聚层次聚类方法包括:设将第n个用户的d(d≥1)组Fyd(n)负荷曲线组成初始簇C1~Cd,Fyd(n)为单独一个负荷样本簇Ci(1≤i≤d);
计算负荷样本簇Ci与负荷样本簇Cj(1≤j≤d)之间的平均距离:
其中,xi,xj分别为负荷样本簇Ci,Cj中的负荷点,xi={xi1,xi2,……xin},xj={xj1,xj2,……xjn},二者的欧式距离d(xi-xj)为:
设定曲线间的距离阈值为D,在负荷样本S中有N条负荷曲线序列{L1,L2,…….,LN},,任意取出曲线LN并计算与其他曲线间的欧式距离,合并最近两个簇,合并的过程反复进行直到类别总数达到预设的数目K。
由于负荷曲线的走势与日类型、天气因素等密切相关,对历史负荷曲线的聚类分析是负荷预测的基础步骤。针对海量的用户负荷,若无针对性的研究每个用户的用汽规律将会造成巨大的资源浪费。因此,聚类分析能够将用汽规律相近的负荷日期归为一类。通过计算各个向量之间的空间距离,将其由零散分布的独立样本逐渐归为趋势相近的若干类。
图3是本发明所涉及的用户负荷曲线走势图
如图3所示,在本实施例中,所述步骤S2,聚类结果方法包括:通过对某独立用户的历史负荷曲线进行凝聚层次聚类分析得出该用户分类结果,该用户的历史负荷曲线可以归类为图3中的六类负荷曲线,并将聚类结果与其对应日类型存入表中:
表1聚类结果与其对应的日类型
结合负荷曲线分类结果及表1可以看出六类负荷曲线在幅值大小及曲线走势上存在较大的差异。可以看出类1、类3、类4主要为工作日负荷,类2、类5主要为休息日负荷,进一步分析节假日属性,发现第5类含有大量的节假日如国庆节等的负荷走势,而第6类为主要为节假日前一天的负荷。分析表明,凝聚层次聚类算法成功完成了分类的任务。
图4是本发明所涉及的分类规则建立图。如图4所示,在本实施例中,所述步骤S2,灰色关联度计算方法包括:针对第n用户的历史负荷数据集,先对影响该用户的负荷曲线走势的因素进行关联度排序,剔除一些对负荷影响小的因素。即采用灰色关联分析方法计算每天的天气因素[日最高气温、日平均气温、日平均湿度、日平均风速、日平均降水、日类型(工作日、休息日、节假日)]与负荷曲线之间的灰色关联度;
将历史负荷数据、天气因素以及日类型数据集作为分析样本,设定负荷数据为母序列、天气因素和日类型为若干子序列;采用灰色关联分析算法分析各个子序列与母序列的相关性,最后将所有灰色关联度求均值即可得到各个影响因素的灰色关联度。
确定反映系统行为特征的参考序列和影响系统行为的比较序列:即历史负荷数据为参考序列,天气因素和日类型组成的历史影响因素数据则称比较序列;第n个用户的参考序列Fy(n)=[Fy1(n)Fy2(n)…Fyd(n)]表示成X0=[X0(1),X0(2),……,X0(d)](d=n),比较序列Dx(n)=[Dx1(n)Px2(n)…Dxd(n)]表示成Xi=[Xi(1),Xi(2),……,Xi(d)](i=1,2,…,k)。其中,k为变量个数。
对历史负荷数据和历史因素数据进行无量纲化处理;
即对参考序列进行Normalization标准化:
其中,X0(1)为一组历史负荷数据序列,p=2
即对比较序列进行Normalization标准化:
其中,Xd(1)为一组历史影响因素数据序列,p=2
计算参考数列与比较数列的灰色关联系数方法包括:
式中,
灰色相对关联度表征了历史负荷数据序列X0和历史影响因素数据序列Xi相对于始点的变化速率之间的关系,历史负荷数据序列X0和历史影响因素数据序列Xi的变化速率越趋于一致,其灰色相对关联度越大。
计算灰色相对关联度Π0i:
式中,
灰色综合关联度体现了负荷序列X0和影响因素序列Xi的相似程度,较为全面地表征两个序列之间联系是否紧密。
计算灰色综合关联度Ψ0i:
对影响负荷的因素进行关联度排序,剔除一些对负荷影响小的因素,从而达到约简分类规则,简化预测模型的目的。选定灰色关联度超过设定阈值的四个因素作为关键影响因素。
通过对第n用户的历史负荷数据以及历史天气数据进行灰色关联分析,可以得出影响该用户负荷变化规律的关键影响因素,有利于缩减样本集的数据维度,进一步提高准确度。对第n用户的灰色关联度计算结果表2:
表2第n用户的灰色关联度计算结果
根据灰色关联度大小,最终选择出最高气温、平均气温、日类型、平均湿度对负荷变化趋势影响较大,可作为关键因素,在后续分析汇总主要关注这几项影响因素。
在本示例中,所述步骤S2,图4中中间为决策树的算法模型,左输入为日属性向量,即历史负荷中每天的负荷数据。右侧输入为在层次聚类分析后得到的若干类别。
在本实施例中,所述步骤S2,CART决策树建立分类规则的方法包括:针对第n用户的m组参考序列Fy(n)构建训练样本C:
C={X1,X2,……,Xm,L}
X1={x11,x12,……,x1t}…Xm={xm1,xm2,……,xmt}
L={L1,L2,……,Lk}
其中,X1,X2,……,Xm为历史负荷数据分类标签,称为属性向量;L为历史影响因素标签,称为标签向量;
将训练样本划分为测试变量和目标变量,通过对这两种变量的循环分析形成二叉决策树:
其中,训练数据集D={(x1,y1),(x2,y2),……(xn,yn)},特征A={A1,A2,…An}(n=4)为历史影响因素数据集,若特征A为离散特征,则利用特征A的某一可能取值a将数据分为D1与D2两部分,计算A=a时的基尼系数,对整个数据集中所有的可能特征A以及其可能取值a选取基尼系数最小的特征A*与该特征下的取值a*,将数据集切分,数据D1,D2被分到两个子节点中去,对子节点递归的重复迭代直至满足所有所有的Gini(D,A)取值都最小。
计算基尼系数:
式中,是从训练样本集中随机抽取一个样本,表示当某一测试变量值为h时属于第j类的概率;nj(h)为训练样本中测试变量值为h时属于第j类的样本个数;n(h)为训练样本中该测试变量值为h的样本个数;j为类别个数。
为避免模型过拟合,需要对决策树进行减枝:
设树的叶结点个数为|T|,树T的任意叶结点t有Nt个样本点,其中k类的样本点有Ntk个,k=1,2,…,K,Ht(T)为叶结点t上的经验熵,α≥0为参数,则损失函数可定义为:
其中经验熵为:
在损失函数定义公式中,将其右端第一项记作:
则损失函数简化为:
Cα(T)=C(T)+α|T|
输入生成算法产生的决策树T0,参数α,计算每个结点的经验熵,递归的从树的叶结点向上回缩;设一组叶节点回归到其父结点之前与之后的整体数分别为TA与TB,计算其对应的损失函数值Cα(TA)与Cα(TB),如果
Cα(TA)≤Cα(TB)
则进行剪枝,即将父结点变为新的叶结点;继续从叶结点向上回缩,直至不能继续为止,得到损失函数最小的子树Tα,即最优决策树。
CART决策树算法根据信息增益度将样本按其若干影响属性值不断划分,最后归入指定的类。因此能够找到分类结果与关键影响因素间的耦合关系,造成聚类结果的依据,并以分类规则的形式表现出来。当已知待预测日的关键影响因素值时,可以将预测日遵循分类规则分配到对应的聚类中去,从而该类的结果就可以作为待预测日的相似日数据集来训练模型。
根据第n用户的负荷曲线进行分析,所得分类决策树也是久特变负荷曲线分类规则,同时也表征了负荷聚类结果与关键影响因素值的定量关系,某日影响负荷的关键因素表:
表3某日影响负荷的关键因素
图6是本发明所涉及的支持向量机算法示意图。如图6所示,在本实施例中,所述步骤S3,找到待预测日的同类型日历史负荷曲线、历史影响因素,已知待预测日的相关因素数据,在上述分类规则中可以将待预测日分到与之对应的类中,存入表4:
表4待预测日及与其对应的类
以及针对每一类训练对应的支持向量机模型,以及计算出每个独立用户的预测负荷曲线的方法包括:
找到第n用户的与待预测日的分类标签L′(n)相同的历史负荷曲线数据集、日特征向量集构建训练样本,针对该类负荷曲线的走势变化规律和特征,选取匹配的预测模型,预测该用户在待预测日的负荷曲线。
其中,所述的分类标签L′(n)的计算方式为:找到第n个用户的待预测日的关键因素日特征向量为x′(n)={x′1,x′2,…x′k}(=4),其中x′1,′2,…x′k分别为日平均气温、日平均湿度、日平均风速、日类型;
输入上述匹配的预测模型中:
L′(n)=f(x′(n))
其中输入x′(n)为日特征向量,输出L′(n)即为用户n的待预测日的负荷曲线对应的分类标签。
采用支持向量机模型完成负荷预测的方法为:
设第n个用户的历史负荷曲线数据集中,属于分类标签L′(n)的样本共k个,(x1,y1),(x2,y2),…(xk,yk),其中xk∈Dx(n)为输入参数,即日特征向量集,yk∈Fy(n)为相应的输出参数,即负荷曲线,k为样本个数。输入参数与输出参数之间存在如下关系:
f(x)(n)=ω·θ(x)+b
其中,ω为权值矢量,b为阈值。
这里,同理理论计算SVM的回归函数,目标函数与约束条件:
利用拉格朗日方法求解上述最优化问题:
K(xi,xj)=exp(-g|xi-xj|2)
式中,核函数采用径向基函,g为核函数的参数。
针对上述的分类结果,将第n用户的每类负荷数据及相应的关键影响因素数据构建训练样本,针对每类负荷数据的变化规律和特征,选取匹配的预测模型完成对该日负荷的预测。支持向量机的核函数选用RBF核函数,此核函数下需要确定参数有核函数参数、不敏感系数和惩罚参数。不同的参数组合,匹配不同类型的负荷,具有更强的建模针对性。因此通过遗传算法对六类历史数据集分别进行寻优和计算,可得到匹配最优的参数组合表:
表5最优的参数组合
第n用户的待预测日的关键因素日特征向量x′(n)输入到上述支持向量机f(x)(n)模型中,得出该用户在待预测日的负荷曲线F′yd(n)。
重复上述步骤,计算得出所有用户在待预测日的负荷曲线数据集{F′yd(1)F′yd(2)…F′yd(n)},将其预测结果进行累加起来,即求得目标热网的系统总负荷:
其中,Flow为待预测日的系统负荷,F′yd(n)为第n用户的待预测日负荷曲线。
综上所述,本发明通过采集的热网中热用户历史负荷数据、天气因素、日类型数据,利用大数据技术(聚类分析、灰色关联分析、决策树算法)对历史负荷数据、因素数据、日类型进行预处理;把握每个热用户负荷与天气因素、日类型的密切关系;并根据不同用户特性构建预测模型,对某用户的未来日负荷曲线进行独立预测,最后累加所有用户的预测结果,得到系统的预测负荷;本发明利用大数据技术,捕捉了每个用户的用汽规律,弥补了传统的数据统计方法对数量级较大的数据量分析方面的不足,解决了工业用汽系统从热网负荷总量上进行分析导致的预测失准问题,提高了工业热网系统短期总负荷预测准确度,最终为工业热网的运行优化和精准调控做参考。
采用数据清洗算法处理数据传输与采集过程中产生的异常数据,提升负荷预测的精度,有利于运行人员对供热系统的用户用汽情况进行更加科学的统计;基于大数据技术的工业热网负荷实时滚动预测,使运行人员实时掌握当前系统的用汽水平,并辅助分析当前工况条件下供热系统运行情况,能及时做好工业热网的运行优化和精准调控,提升供热企业精细化运行管理水平。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (8)
1.一种基于大数据的工业蒸汽热网短期负荷预测方法,其特征在于,包括:
1)采集数据源;数据清洗、数据转换;
2)数据预处理:针对每个独立用户,首先,利用凝聚层次聚类分析算法对其负荷曲线进行分类;然后,利用灰色关联分析方法选取影响其负荷走势的关键影响因素;最后,利用CART决策树建立分类规则;
3)负荷预测模型建立:根据第n个用户的负荷曲线特性构建预测模型,并预测该用户的待预测日负荷曲线;
4)重复步骤2)-3),将所有用户的负荷预测结果累加,得到热网系统负荷。
2.如权利要求1所述的基于大数据的工业蒸汽热网短期负荷预测方法,其特征在于,所述的步骤1)中采集数据源的方法为:
采集供热系统中所有用户的历史负荷数据集,并从天气预报接口采集待预测日天气因素的预测数据;所述的历史负荷数据集包括所有热用户历史负荷数据,影响热用户负荷走势的天气因素和日类型历史数据;所述的天气因素包括日最高气温、日平均气温、日平均降水、日平均湿度、日平均风速,所述的日类型包括工作日、休息日、节假日;
将各数据库中所需要的历史负荷数据集和预测数据打包成数据视图,并将上述数据视图与所有数据库对接,以将所有所需要的历史负荷数据集和预测数据存储到相应的目标数据表中。
3.如权利要求1所述的基于大数据的工业蒸汽热网短期负荷预测方法,其特征在于,所述的步骤1)中数据清洗、数据转换的方法为:
负荷会受到不同因素的影响,在对负荷异常的分析时需要考虑噪声点和缺失值的影响;
设N个用户历史负荷数据为F=[Fy(1)Fy(2)…Fy(n)…Fy(N)],其中,Fy(n)=[Fy1(n)Fy2(n)…Fyd(n)],Fyd(n)构成一条负荷曲线,n为第n个用户,d为第d天,并且1≤n≤N,d≥1;
分别对每个用户负荷曲线异常值类型建立时间序列上的模型:
式中,Fyd(n)表示第n个用户的第d天的负荷序列,Fyd(n)(t)表示的t时刻的负荷,Fxd(n)(t)表示不包含异常值的t时刻负荷,p为异常值个数,wi和a(j)表示负荷异常值的影响因子,表示的是t时刻的脉冲函数;
对于数据库中的缺失值,根据用汽负荷的波动特性,计算前后相邻两日相同时间点的负荷以及当前时刻的前后两个时间点的负荷的均值,和后一日相对前一日的负荷变化率,以均值加上负荷变化量填充空缺值:
式中:Xi表示当前时刻的负荷,i表示时间点取值为1到24,a1和a2分别表示前后两天对应时刻和当前时刻前后两个时间点负荷的加权系数;
对于噪声点数据,利用负荷序列的前后波动性关系,通过计算负荷间的距离来检测异常;取时间序列中到中心点s最近的k个负荷的距离表示负荷的密度区域,则密度越大的点区域半径越小,取负荷点到中心点的距离d与密度区域半径r的较大者作为中心点s的可达距离;则负荷的异常程度可以用负荷点到中心点s的相对距离来表示,通过设定阈值可得到数据异常的负荷点,阈值的计算方式为:
式中,rd表示以s为中心点的密度区域的可达距离,ds表示以s为中心点的所有距离的均值,m表示该时间序列中的所有负荷点;
对于异常的噪声点数据要进行修复,修复方法采用当前负荷相对前一天时间序列的变化思路进行处理:
式中,x(t)表示当前序列中不存在异常的负荷数据,x(t-j)表示序列异常点前面第j个的负荷数据,x′(t-j)表示相对x(t-j)前一天的负荷数据。
4.如权利要求1所述的基于大数据的工业蒸汽热网短期负荷预测方法,其特征在于,所述步骤2)中,针对每个独立用户,利用凝聚层次聚类分析算法对其负荷曲线进行分类的方法为:
设将第n个用户的d(d≥1)组Fyd(n)负荷曲线组成初始簇C1~Cd,Fyd(n)为单独一个负荷样本簇Ci(1≤i≤d);
取负荷样本簇Ci(1≤i≤d)与负荷样本簇Cj(1≤j≤d),计算两者之间的平均距离:
其中,xi,xj分别为负荷样本簇Ci,Cj中的负荷点,xi={xi1,xi2,......xin},xj={xj1,xj2,......xjn},二者间的欧式距离d(xi-xj)为:
设定曲线间的距离阈值为D,在负荷样本S中有N条负荷曲线序列{L1,L2,......,LN},任意取出曲线LN并计算与其他曲线间的欧式距离,合并最近两个簇,合并的过程反复进行直到类别总数达到预设的数目K。
5.如权利要求4所述的基于大数据的工业蒸汽热网短期负荷预测方法,其特征在于,所述步骤2)中,针对每个独立用户,利用灰色关联分析方法选取影响其负荷走势的关键影响因素的方法为:
针对第n个用户的历史负荷数据集,采用灰色关联分析方法计算每天的天气因素、日类型与负荷曲线之间的灰色关联度;
将历史负荷数据、天气因素以及日类型作为分析样本,设定负荷数据为母序列、天气因素和日类型为子序列;采用灰色关联分析算法分析各个子序列与母序列的相关性,最后将同一子序列的所有灰色关联度求均值即可得到各个影响因素的灰色关联度;
所述影响因素与负荷曲线之间的灰色关联度的计算方法为:
确定反映系统行为特征的参考序列和影响系统行为的比较序列:即历史负荷数据为参考序列,天气因素和日类型组成的历史影响因素数据则称比较序列;将第n个用户的参考序列Fy(n)=[Fy1(n)Fy2(n)…Fyd(n)]表示成X0=[X0(1),X0(2),......,X0(d)](d=n),将比较序列Dx(n)=[Dx1(n)Dx2(n)…Dxd(n)]表示成Xi=[Xi(1),Xi(2),......,Xi(d)](i=1,2,...,k);其中k为变量个数;
对历史负荷数据和历史因素数据进行无量纲化处理;
对历史负荷数据进行标准化:
其中,X0(1)为一组历史负荷数据序列,p=2;
对历史影响因素数据进行标准化:
其中,Xi(1)为一组历史影响因素数据序列,p=2;
计算参考序列与比较序列的灰色关联系数方法为:
式中,
计算灰色相对关联度Π0i:
式中,
计算灰色综合关联度Ψ0i:
对计算得出的灰色综合关联度Ψ0i进行排序,选定灰色关联度超过0.4的因素作为关键影响因素。
6.如权利要求5所述的基于大数据的工业蒸汽热网短期负荷预测方法,其特征在于,所述步骤2)中,针对每个独立用户,利用CART决策树建立负荷与关键影响因素之间分类规则的方法为:
针对第n个用户的m组参考序列Fy(n)构建训练样本C:
C={X1,X2,......,Xm,L}
Xm={xm1,xm2,......,xmt}
L={L1,L2,......,Lk}
其中,X1,X2,......,Xm为历史负荷数据分类标签;L为历史影响因素标签;
将训练样本划分为测试变量和目标变量,通过对这两种变量的循环分析形成二叉决策树;假设训练数据集D={(x1,y1),(x2,y2),......(xn,yn)},A为历史影响因素数据集,用特征A对数据进行分割,若特征A为离散特征,则根据A的某一可能取值a将D分为D1与D2:
D1={D|A=a},D2={D|A≠a}
即在已知特征A的条件下集合D的基尼指数:
对整个数据集中所有的可能特征A以及其可能取值a选取基尼系数最小的特征A*与该特征下的取值a*,将数据集切分,数据D1,D2被分到两个子节点中去,对子节点递归进行重复迭代直至满足所有的Gini(D,A)取值都最小;
计算基尼系数:
式中,是从训练样本集中随机抽取的一个样本,表示当某一测试变量值为h时属于第j类的概率;nj(h)为训练样本中测试变量值为h时属于第j类的样本个数;n(h)为训练样本中该测试变量值为h的样本个数;j为类别个数;
为避免模型过拟合,需要对决策树进行减枝:
设树的叶结点个数为|T|,树T的任意叶结点t有Nt个样本点,其中k类的样本点有Ntk个,k=1,2,...,K,Ht(T)为叶结点t上的经验熵,α≥0为参数,则损失函数可定义为:
其中经验熵为:
在损失函数定义公式中,将其右端第一项记作:
则损失函数简化为:
Cα(T)=C(T)+α|T|
输入生成算法产生的决策树T0,参数α,计算每个结点的经验熵,递归的从树的叶结点向上回缩;设一组叶节点回归到其父结点之前与之后的整体数分别为TA与TB,计算其对应的损失函数值Cα(TA)与Cα(TB),如果
Cα(TA)≤Cα(TB)
则进行剪枝,即将父结点变为新的叶结点;继续从叶结点向上回缩,直至不能继续为止,得到损失函数最小的子树Tα,即最优决策树。
7.如权利要求1所述的基于大数据的工业蒸汽热网短期负荷预测方法,其特征在于,所述步骤3)中,建立负荷预测模型的方法为:找到待预测日的同类型日历史负荷曲线、历史影响因素,以及针对每一类训练对应的支持向量机模型;
找到第n个用户的与待预测日的分类标签L′(n)相同的历史负荷曲线数据集、日特征向量集构建训练样本,针对该类负荷曲线的走势变化规律和特征,选取匹配的预测模型,预测该用户在待预测日的负荷曲线;
采用支持向量机模型完成负荷预测的方法为:
设第n个用户的历史负荷曲线数据集中,属于分类标签L′(n)的样本共k个,(x1,y1),(x2,y2),...(xk,yk),其中xk∈Dx(n)为输入参数,即日特征向量集,yk∈Fy(n)为相应的输出参数,即负荷曲线;输入参数与输出参数之间存在如下关系:
f(x)(n)=ω·θ(x)+b
其中,ω为权值矢量,b为阈值;
同理,对于理论计算SVM的回归函数,目标函数与约束条件:
利用拉格朗日方法求解上述最优化问题:
K(xi,xj)=exp(-g|xi-xj|2)
式中,核函数采用径向基函,g为核函数的参数;
第n个用户的待预测日的关键因素日特征向量x′(n)输入到上述支持向量机f(x)(n)模型中,得出该用户在待预测日的负荷曲线F′yd(n)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020102434405 | 2020-03-31 | ||
CN202010243440 | 2020-03-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111815054A true CN111815054A (zh) | 2020-10-23 |
Family
ID=72842852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010656981.0A Pending CN111815054A (zh) | 2020-03-31 | 2020-07-09 | 基于大数据的工业蒸汽热网短期负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111815054A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434843A (zh) * | 2020-11-10 | 2021-03-02 | 华侨大学 | 一种新建轨道开通前沿线公交乘客转移预测方法及系统 |
CN112613651A (zh) * | 2020-12-16 | 2021-04-06 | 上海全应科技有限公司 | 一种工业蒸汽末端消费量预测模型建立、预测方法及系统 |
CN112884042A (zh) * | 2021-02-23 | 2021-06-01 | 新疆大学 | 一种基于关联向量机的输配电线路最大负荷辨识方法 |
CN113393028A (zh) * | 2021-06-10 | 2021-09-14 | 国网江苏省电力有限公司南通供电分公司 | 一种基于数据挖掘技术的负荷预测方法 |
CN113408808A (zh) * | 2021-06-28 | 2021-09-17 | 北京百度网讯科技有限公司 | 训练方法、数据生成方法、装置、电子设备以及存储介质 |
CN117495434A (zh) * | 2023-12-25 | 2024-02-02 | 天津大学 | 电能需求预测方法、模型训练方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881706A (zh) * | 2014-12-31 | 2015-09-02 | 天津弘源慧能科技有限公司 | 一种基于大数据技术的电力系统短期负荷预测方法 |
CN109934301A (zh) * | 2019-03-22 | 2019-06-25 | 广东电网有限责任公司 | 一种电力负荷聚类分析方法、装置和设备 |
CN110610280A (zh) * | 2018-10-31 | 2019-12-24 | 山东大学 | 一种电力负荷短期预测方法、模型、装置及系统 |
CN110689195A (zh) * | 2019-09-26 | 2020-01-14 | 云南电网有限责任公司电力科学研究院 | 一种电力日负荷预测方法 |
-
2020
- 2020-07-09 CN CN202010656981.0A patent/CN111815054A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881706A (zh) * | 2014-12-31 | 2015-09-02 | 天津弘源慧能科技有限公司 | 一种基于大数据技术的电力系统短期负荷预测方法 |
CN110610280A (zh) * | 2018-10-31 | 2019-12-24 | 山东大学 | 一种电力负荷短期预测方法、模型、装置及系统 |
CN109934301A (zh) * | 2019-03-22 | 2019-06-25 | 广东电网有限责任公司 | 一种电力负荷聚类分析方法、装置和设备 |
CN110689195A (zh) * | 2019-09-26 | 2020-01-14 | 云南电网有限责任公司电力科学研究院 | 一种电力日负荷预测方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434843A (zh) * | 2020-11-10 | 2021-03-02 | 华侨大学 | 一种新建轨道开通前沿线公交乘客转移预测方法及系统 |
CN112613651A (zh) * | 2020-12-16 | 2021-04-06 | 上海全应科技有限公司 | 一种工业蒸汽末端消费量预测模型建立、预测方法及系统 |
CN112613651B (zh) * | 2020-12-16 | 2024-05-03 | 上海全应科技有限公司 | 一种工业蒸汽末端消费量预测模型建立、预测方法及系统 |
CN112884042A (zh) * | 2021-02-23 | 2021-06-01 | 新疆大学 | 一种基于关联向量机的输配电线路最大负荷辨识方法 |
CN113393028A (zh) * | 2021-06-10 | 2021-09-14 | 国网江苏省电力有限公司南通供电分公司 | 一种基于数据挖掘技术的负荷预测方法 |
CN113393028B (zh) * | 2021-06-10 | 2022-08-19 | 国网江苏省电力有限公司南通供电分公司 | 一种基于数据挖掘技术的负荷预测方法 |
CN113408808A (zh) * | 2021-06-28 | 2021-09-17 | 北京百度网讯科技有限公司 | 训练方法、数据生成方法、装置、电子设备以及存储介质 |
CN113408808B (zh) * | 2021-06-28 | 2024-01-12 | 北京百度网讯科技有限公司 | 训练方法、数据生成方法、装置、电子设备以及存储介质 |
CN117495434A (zh) * | 2023-12-25 | 2024-02-02 | 天津大学 | 电能需求预测方法、模型训练方法、装置及电子设备 |
CN117495434B (zh) * | 2023-12-25 | 2024-04-05 | 天津大学 | 电能需求预测方法、模型训练方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111815054A (zh) | 基于大数据的工业蒸汽热网短期负荷预测方法 | |
Cheng et al. | Data and knowledge mining with big data towards smart production | |
Kuo et al. | Application of a hybrid of genetic algorithm and particle swarm optimization algorithm for order clustering | |
CN111324642A (zh) | 一种面向电网大数据分析的模型算法选型与评价方法 | |
CN112561156A (zh) | 基于用户负荷模式分类的短期电力负荷预测方法 | |
CN110717610B (zh) | 一种基于数据挖掘的风电功率预测方法 | |
CN112987666B (zh) | 电厂机组运行优化调控方法及系统 | |
CN110571792A (zh) | 一种电网调控系统运行状态的分析评估方法及系统 | |
CN110674993A (zh) | 一种用户负荷短期预测方法和装置 | |
CN114048870A (zh) | 一种基于日志特征智能挖掘的电力系统异常监测方法 | |
CN110555058A (zh) | 基于改进决策树的电力通信设备状态的预测方法 | |
CN107862406A (zh) | 应用深度学习和改进Apriori算法综合的一次设备风险预测的方法 | |
CN112288157A (zh) | 一种基于模糊聚类与深度强化学习的风电场功率预测方法 | |
CN116944700A (zh) | 用于激光切割的检测及控制方法和系统 | |
Dalkani et al. | Modelling electricity consumption forecasting using the Markov process and hybrid features selection | |
CN115481844A (zh) | 基于特征提取和改进的svr模型的配网物资需求预测系统 | |
CN117076691A (zh) | 一种面向智慧社区的商品资源知识图谱算法模型 | |
CN112508363A (zh) | 基于深度学习的电力信息系统状态分析方法及装置 | |
CN112508278A (zh) | 一种基于证据回归多模型的多联供系统负荷预测方法 | |
Zhai et al. | Combining PSO-SVR and Random Forest Based Feature Selection for Day-ahead Peak Load Forecasting. | |
Toghraee et al. | The impact of feature selection on meta-heuristic algorithms to data mining methods | |
CN116467658A (zh) | 一种基于马尔科夫链的设备故障溯源方法 | |
CN116128544A (zh) | 一种电力营销异常营业数据的主动稽核方法和系统 | |
Fan et al. | EDA-USL: unsupervised clustering algorithm based on estimation of distribution algorithm | |
CN113379093A (zh) | 油气集输系统能耗分析与优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210104 Address after: 310058 Yuhang Tang Road, Xihu District, Hangzhou, Zhejiang 866 Applicant after: ZHEJIANG University Applicant after: Wuxi Huaguang Environmental Protection Energy Group Co., Ltd Address before: 310058 Yuhang Tang Road, Xihu District, Hangzhou, Zhejiang 866 Applicant before: ZHEJIANG University |