CN110717524A - 一种老年人热舒适预测方法 - Google Patents

一种老年人热舒适预测方法 Download PDF

Info

Publication number
CN110717524A
CN110717524A CN201910891404.7A CN201910891404A CN110717524A CN 110717524 A CN110717524 A CN 110717524A CN 201910891404 A CN201910891404 A CN 201910891404A CN 110717524 A CN110717524 A CN 110717524A
Authority
CN
China
Prior art keywords
data set
thermal comfort
substep
factor
decision tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910891404.7A
Other languages
English (en)
Other versions
CN110717524B (zh
Inventor
杨玉兰
李洋
邰惠鑫
陈金花
张振彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910891404.7A priority Critical patent/CN110717524B/zh
Publication of CN110717524A publication Critical patent/CN110717524A/zh
Application granted granted Critical
Publication of CN110717524B publication Critical patent/CN110717524B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

一种老年人热舒适预测方法,包括以下步骤:确定老年人热舒适影响因素,构建原始训练样本数据集;对原始训练样本数据集进行预处理,构建老年人热舒适预测特征数据集;针对老年人热舒适预测特征数据集,判断C4.5节点分裂算法用于老年人热舒适预测的适用性,得出基于C4.5分裂算法构建决策树用于老年人热舒适预测的准确率P1;针对老年人热舒适预测特征数据集,判断CART节点分裂算法的适用性,得出将CART节点分裂算法应用于老年人热舒适预测的准确率P2;将P1和P2按照其在算术和中占的比例分别赋予C4.5节点分裂算法和CATR节点分裂算法权重β1和β2,β12=1;基于算法适用性混合分裂决策树构建老年人热舒适预测随机森林;采用训练好的随机森林进行老年人热舒适预测。

Description

一种老年人热舒适预测方法
技术领域
本发明属于建筑热湿环境仿真领域,具体涉及一种基于算法适用性混合分裂决策树随机森林的老年人热舒适预测方法。
背景技术
我国人口老龄化速度持续加快,养老建筑的需求量正在逐年增加。随着人民生活水平的不断提高,人们对室内环境热舒适的要求越来越来高,老年人也在不断的追求理想的养老居住环境。老年人是一个生理和心理具有特殊性的群体,健康舒适的室内环境对老年人来说显得尤为重要。老年人生活的室内热环境直接影响老年人的身心健康和生活质量。老年人的心理和生理与中青年人有很大的不同,老年人随着年龄的增长,生理机能逐渐退化,新陈代谢减缓,对热环境的敏感度变差,以及老年疾病的普遍性,使得老年人对热环境变化的适应能力逐渐减弱。因此,老年人室内热环境的热舒适状况不仅影响到室内热舒适,而且还是影响老年人健康的重要因素。郭飞等人对大连市老年人和非老年人的热适应性进行对比研究,结果表明老年人的热中性温度和可接受的操作温度都低于非老年人。
由于老年人的生理心理的特殊性,老年人热舒适预测涉及的因素远多于经典室内热舒适评价涉及的因素,将传统的热舒适评价用于老年人热舒适评价出现明显偏差,评价中信息处理不完整等不足。刘红等研究表明,采用目前的室内热环境评价标准来评价和预测老年人的热舒适性存在明显偏差。如何多维度并且准确地评价老年人居室的热环境及预测老年人的热舒适性,已经成为营造良好养老建筑热环境亟需解决的问题。
在处理多维度信息热舒适评价及提高热舒适预测精度方面,国内外学者们开展了一些研究。由于机器学习具有高维信息处理能力强、处理数据量大、预测精度高等优点,基于机器学习的数据挖掘方法被用于热舒适预测。目前,被应用于多维度热舒适预测建模的数据挖掘方法有支持向量机SVM、BP神经网络、离散小波变换算法、贝叶斯网络等。
机器学习中的决策树方法以其速度快、精度高、生成模式简单易懂以及容易转化成分类规则等优点,在数据挖掘领域被广泛地研究和应用。杜晨秋等采用决策树进行热舒适预测,对夏热冬冷地区自由运行居住建筑中的人员热舒适及影响因素和权重进行了预测分析。
随机森林算法是由Breiman提出的一种比较新的统计学习理论,采用决策树作为基分类器,随机生成多棵决策树进行预测。该算法以其预测精度高、抗噪能力强、适应范围广等优点,在数据挖掘领域被广泛地研究和应用。Tanaya Chaudhuri等人从生理参数信息出发,研究不同热状态下生理反应的性别差异,并利用随机森林进行统计分析和预测建模。Siliang Lu等人基于ASHRAE RP884数据集开发了随机森林热舒适模型来模拟温度设定点控制系统。Joyce Kim等人基于居住者的冷热行为开发随机森林模型预测个人的热偏好,并发现与传统模型相比,随机森林算法预测的准确率较高。
随着随机森林应用越来越广泛,其不足之处随之显现。一是节点分裂算法与数据集的适用性未得到深入研究,同一节点分裂算法应用于不同数据集其预测不尽相同,针对同一数据集应用不同的节点分裂算法会也得到不同的决策树,使其预测也存在差异;二是随机森林的分类结果投票中,每棵决策树对各自的分类结果投出一票,生长效果差的决策树和生长效果好的决策树拥有同样的投票能力,这不利于得到客观科学的预测结果;而且随机森林在投票过程中未考虑到出现相同票数的情况,不利于分类。
发明内容
本发明提供了一种提高了随机森林的分类正确率的基于算法适用性混合分裂决策树随机森林的老年人热舒适预测方法。
本发明采用的技术方案是:
一种老年人热舒适预测方法,其基于算法适用性混合分裂决策树随机森林,包括以下步骤:
步骤1,确定老年人热舒适影响因素,构建原始训练样本数据集O;
步骤2,对原始训练样本数据集O进行预处理,构建老年人热舒适预测特征数据集SO;
步骤3,针对老年人热舒适预测特征数据集SO,判断C4.5节点分裂算法用于老年人热舒适预测的适用性,得出基于C4.5分裂算法构建决策树用于老年人热舒适预测的准确率P1
步骤4,针对老年人热舒适预测特征数据集SO,判断CART节点分裂算法的适用性,得出将CART节点分裂算法应用于老年人热舒适预测的准确率P2
步骤5,将P1和P2按照其在算术和中占的比例分别赋予C4.5节点分裂算法和CATR节点分裂算法权重β1和β2,β12=1;
步骤6,基于步骤5的算法适用性混合分裂决策树构建老年人热舒适预测随机森林;
步骤7,采用训练好的随机森林进行老年人热舒适预测。
进一步,步骤1中老年人热舒适影响因素包括:老年人个体信息、室内外物理参数、建筑本体特征、热环境可调节性;其中老年人个体信息包括:年龄、性别、健康状况、平均代谢率、服装热阻、老年人热舒适调节行为偏好;室内外物理参数包括:室内外干球温度、室内外相对湿度、室内风速、室内表面辐射温度;建筑本体特征包括:建筑所在气候分区、建筑所在住区规划特征、建筑围护结构热工性能、房间楼层、房间朝向等;热环境可调节性包括:窗户的可开启性、窗帘的可调节性、加热设备可调节性、降温设备可调节行。
进一步,假设步骤1中一共确定M个影响因素,采用向量Xi(i=1,2,...,M)表示;按照确定的影响因素收集相应因素的原始数据及老年人热舒适评价结果,每一次调查测试得到一行原始数据,即得到了一个训练样本;假设做了N次调查测试,则一共得到N个训练样本,组成原始训练样本数据集O(yj
Figure BDA0002208852970000042
)(i=1,2,...,M;j=1,2,...,N),其中:yj表示第j个训练样本的老年人热舒适评价结果,Xi j中的元素xij表示第j个训练样本的第i个因素的原始数据。
进一步,步骤2中的预处理指将影响因素中的连续变量进行离散化处理,预处理结果组成了老年人热舒适预测特征数据集SO(syj,SXi j),其中:syj(j=1,2,...,N)表示第j个样本的老年人热舒适评价结果的预处理值,SXi j(i=1,2,...,M;j=1,2,...,N)中的元素sxi j表示第j个样本的第i个因素的预处理后的因素值,老年人热舒适预测特征数据集SO可表示为如下矩阵:
Figure BDA0002208852970000041
进一步,步骤3、步骤4的具体步骤均包括以下子步骤:
子步骤1,随机抽取老年人热舒适预测特征数据集SO中15%的样本数据作为决策树分裂算法适用性赋权数据集C,85%的样本数据作为训练数据集D;
子步骤2,随机选取训练数据集D的二分之一样本作为决策树的试探数据集Ds;子步骤3,基于C4.5节点分裂算法和基于CART算法分别构建决策树;
子步骤4,将数据集C分别输入构建完成的决策树进行仿真测试,得出基于C4.5分裂算法构建决策树用于老年人热舒适预测的准确率P1和将CART节点分裂算法应用于老年人热舒适预测的准确率P2
进一步,基于C4.5节点分裂算法构建决策树包括以下子步骤:
子步骤3.3.1,根节点数据集S等于试探数据集Ds
子步骤3.3.2,根据式1计算S的信息熵:
Figure BDA0002208852970000051
式中:Info(S)表示数据集S的信息熵,|Sk|表示数据集S中老年人热舒适等于第k个类别的样本数,|S|表示数据集S的样本数,K是老年人热舒适类别总数;子步骤3.3.3,将S根据因素xi的因素值分类,分类子集数目等于因素xi的因素值的个数,根据式2计算按照因素xi对S进行热舒适分类的信息熵:
Figure BDA0002208852970000052
式中:Info_xi(S)表示按照因素xi对S进行热舒适分类的信息熵;R表示数据集S中因素xi所具有的因素值的个数;r表示因素xi的第r个因素值;|Sr|表示数据集S中因素xi的因素值等于第r个因素值的样本数;Info(Sr)表示数据集S中因素xi的因素值等于第r个因素值的数据集的信息熵;
子步骤3.3.4,根据式3计算按照因素xi对S进行热舒适分类的信息增益量:
Gain(xi)=Info(S)-Info_xi(S) (式3)
式中:Gain(xi)表示按照因素xi对S进行热舒适分类的信息增益量;
子步骤3.3.5,根据式4计算按照因素xi对S进行热舒适分类的分裂信息比率:
式中:SplitInfo(xi)表示按照因素xi对S进行热舒适分类的分裂信息比率;
子步骤3.3.6,根据式5计算按照因素xi对S进行热舒适分类的信息增益率:
Figure BDA0002208852970000062
式中:GainRatio(xi)表示按照因素xi对S进行热舒适分类的信息增益率;
子步骤3.3.7,选择信息增益率值GainRatio(xi)最大的因素作为决策树分裂规则,将S按照分裂因素的因素值个数分裂为多个子节点;
子步骤3.3.8,将子节点数据集作为根节点数据集S,采用子步骤3.3.2~子步骤3.3.7的方法通过迭代进行决策树分裂,直到完整的决策树构建完成为止。
进一步,基于CART算法构建决策树,包括以下子步骤:
子步骤4.3.1,根节点数据集S等于试探数据集Ds
子步骤4.3.2,采用式6计算数据集S的基尼指数:
Figure BDA0002208852970000063
式中:Gini(S)表示数据集S的基尼指数;|Sk|表示数据集S中老年人热舒适等于第k个类别的样本数;|S|表示数据集S的样本数;K是老年人热舒适类别总数;
子步骤4.3.3,将数据集S根据因素xi是否等于第r个因素值划分成S1和S2两个部分,S1为S中因素xi等于第r个因素值的数据集,S2=S-S1
子步骤4.3.4,采用式7计算将数据集S根据因素xi是否等于第r个因素值进行划分的基尼指数:
Figure BDA0002208852970000071
式中:Ginisplit(S,xi(r))表示将数据集S根据因素xi是否等于第r个因素值进行划分的基尼指数,|S1|表示数据集S1的样本数,|S2|表示数据集S2的样本数,|S|表示数据集S的样本数;Gini(S1)表示数据集S1的基尼指数,Gini(S2)表示数据集S2的基尼指数;
子步骤4.3.5,选择划分基尼指数Ginisplit(S,xi(r))最小值的因素及对应的因素值作为决策树的分裂规则,将S分裂为两个子节点;
子步骤4.3.6,将子节点数据集作为根节点数据集S,采用子步骤4.3.2~子步骤4.3.5的方法通过迭代进行决策树分裂,直到完整的决策树构建完成为止。
进一步,步骤6的具体步骤包括以下子步骤:
子步骤6.1,随机抽取老年人热舒适预测特征数据集SO中85%样本作为决策树构建数据集D1,15%样本作为决策树赋权数据集D2
子步骤6.2,生成行采样数据集
Figure BDA0002208852970000081
采用Bootstrap方法有放回地对决策树构建数据集D1实施行采样,随机抽取数据样本,抽取的样本数与构建数据集D1样本数相同,得到决策树构建子数据集
Figure BDA0002208852970000082
子步骤6.3,生成列采样数据集DL,对数据集
Figure BDA0002208852970000083
进行列采样,从M-1个因素中随机不放回的抽取m(m<<M-1,m为
Figure BDA0002208852970000084
的取整值)个因素,得到列采样数据集DL;
子步骤6.4,将列采样数据集DL作为根节点数据集S;
子步骤6.5,根据式8计算混和分裂指标Φ(S,xi(r));
Φ(S,xi(r))=β2Ginisplit(S,xi(r))-β1 GainRatio(xi) (式8)
式中,Φ(S,xi(r))为依据因素xi是否等于第r个因素值将S进行分类的混合分裂指标;
子步骤6.6,选取混合分裂指标Φ(S,xi(r))最小值的因素和因素值将S分裂为两个子节点;
子步骤6.7,将子节点数据集作为根节点数据集S,采用子步骤6.5~子步骤6.6的方法通过迭代进行决策树分裂,直到构建完整的决策树T1为止;
子步骤6.8,重复子步骤6.2~子步骤6.7,假设重复P次,形成P棵决策树T1,T2,…,TP,以此组成基于算法适用性混合分裂决策树的老年人热舒适预测随机森林;
子步骤6.9,对决策树棵数进行优化,保持m值不变,调整随机森林棵树P,当随机森林的泛化误差减少且趋于稳定时,对应的决策树棵数为最佳决策数棵树Q;
子步骤6.10,决策树的赋权,将决策树赋权数据集D2中的样本分别输入到Q棵决策树中,得到每棵决策树的老年人热舒适分类正确率wq,将每棵决策树的分类正确率作为权值赋予每棵决策树。
进一步,步骤7的具体步骤包括:将待测老年人热舒适预测样本v(x1,x2,...,xm)输入到每棵决策树,根据式9计算老年人热舒适的最终预测结果:
Figure BDA0002208852970000091
其中,k表示老年人热舒适等级的类别;K表示老年人热舒适等级的类别总数,
Figure BDA0002208852970000092
表示第q决策树输出的老年人热舒适预测结果为第k个类别,wq为第q棵决策树的权值。
本发明的有益效果:本发明主要在三个方面改进随机森林方法,以提高随机森林应用于老年人热舒适预测的算法适用性以及预测客观性,提供一种应用于多维度信息的老年人热舒适预测方法。首先,本发明针对决策树节点分裂算法应用于老年人热舒适预测训练样本的适用性进行实验,得到C4.5和CART决策树节点分裂算法在老年人热舒适预测数据集的适用性评价;其次,本发明根据节点分裂算法的适用性,构建混合决策树分裂算法,旨在获得最优决策树节点分裂规则,以此构成随机森林基分类器;最后,对随机森林的分类结果的投票进行改进,对生长决策树赋予一定的权值,采用决策树加权投票策略,使得决策树具有与其生长效果相应的投票能力,解决出现相同票数的情况,提高了随机森林的分类正确率。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面结合具体实施例来对本发明进行进一步说明,但并不将本发明局限于这些具体实施方式。本领域技术人员应该认识到,本发明涵盖了权利要求书范围内所可能包括的所有备选方案、改进方案和等效方案。
参见图1,本实施例提供了一种基于算法适用性混合分裂决策树随机森林的老年人热舒适预测方法,结合一个老年人热舒适预测案例来对本发明进行进一步说明。
具体步骤如下:
步骤1.确定老年人热舒适预测影响因素,构建原始数据集;
从以下四个方面确定老年人热舒适评价因素:老年人个体信息、室内外物理参数、建筑本体特征、热环境可调节性,一共确定了15个因素,采用向量Xi(i=1,2,...,15)表示;x1=“年龄”、x2=“健康状况”、x3=“性别”、x4=“居住楼层”、x5=“居住朝向”、x6=“平均代谢率”、x7=“服装热阻”、x8=“室内干球温度”、x9=“室内辐射温度”、x10=“室内风速”、x11=“室内相对湿度”、x12=“窗户的打开状态”、x13=“窗帘的可调节性”、x14=“室外干球温度”、x15=“室外相对湿度”;通过文献查阅获得到564个训练样本数据集;
步骤2.对原始数据集进行预处理,构建特征数据集;
将连续变量进行离散化处理,并对所有因素进行有限等级赋值;例如:因素x2(“性别”)的值域为:{男=0,女=1};因素x3(“健康状况”)的值域为:{自理=1,介助=2,介护=3};因素x4(“居住楼层”)的值域为:{一层=1,二层=2,三层=3,四层=4,五层=5,…};老年人热舒适评价结果类别syj采用7级表示,类别值域为:{冷=1,凉=2,微凉=3,适中=4,微暖=5,暖=6,热=7};预处理后得到特征数据集SO,可表示为如下矩阵:
Figure BDA0002208852970000111
步骤3.针对本案例老年人热舒适预测特征数据集SO,判断C4.5节点分裂算法用于老年人热舒适预测的适用性,包括以下子步骤:
子步骤3.1:随机选取特征数据集SO中的84个样本作为赋权数据集C,480个样本作为训练数据集D;
子步骤3.2:并随机选取训练数据集中的240个样本作为决策树的试探数据集Ds;
子步骤3.3:基于C4.5节点分裂算法构建决策树,包括以下子步骤:
子步骤3.3.1:根节点数据集S等于试探数据集Ds
子步骤3.3.2:根据式1计算S的信息熵:
Figure BDA0002208852970000112
式中:Info(S)表示数据集S的信息熵,|Sk|表示数据集S中老年人热舒适等于第k个类别的样本数,|S|表示数据集S的样本数,K是老年人热舒适类别总数;子步骤3.3.3:将S根据因素xi的因素值分类,分类子集数目等于因素xi的因素值的个数,根据式2计算按照因素xi对S进行热舒适分类的信息熵:
式中:Info_xi(S)表示按照因素xi对S进行热舒适分类的信息熵;R表示数据集S中因素xi所具有的因素值的个数;r表示因素xi的第r个因素值;|Sr|表示数据集S中因素xi的因素值等于第r个因素值的样本数;Info(Sr)表示数据集S中因素xi的因素值等于第r个因素值的数据集的信息熵;
子步骤3.3.4:根据式3计算按照因素xi对S进行热舒适分类的信息增益量:
Gain(xi)=Info(S)-Info_xi(S) (式3)
式中:Gain(xi)表示按照因素xi对S进行热舒适分类的信息增益量;
子步骤3.3.5:根据式4计算按照因素xi对S进行热舒适分类的分裂信息比率:
Figure BDA0002208852970000122
式中:SplitInfo(xi)表示按照因素xi对S进行热舒适分类的分裂信息比率;
子步骤3.3.6:根据式5计算按照因素xi对S进行热舒适分类的信息增益率:
式中:GainRatio(xi)表示按照因素xi对S进行热舒适分类的信息增益率;
子步骤3.3.7:选择信息增益率值GainRatio(xi)最大的因素作为决策树分裂规则,将S按照分裂因素的因素值个数分裂为多个子节点;
子步骤3.3.8:将子节点数据集作为根节点数据集S,采用子步骤3.3.2~子步骤3.3.7的方法通过迭代进行决策树分裂。本步骤通过在MATLAB中编写相应程序完成,当节点的样本数小于3时,节点结束分裂,决策树根节点的分裂因素为因素x3(“健康状况”)(GainRatio(xi)=0.3688),最后一层的节点分裂因素为x8=“室内干球温度”(GainRatio(xi)=0.2647),从该层分裂出7个叶子节点,结束分裂;
子步骤3.4:将数据集C输入构建完成的决策树进行仿真测试,构建基于C4.5算法的决策树,得到决策树预测正确率P1=76.19%;
步骤4.针对老年人热舒适预测特征数据集SO,判断CART节点分裂算法的适用性,包括以下子步骤:
子步骤4.1:随机选取特征数据集SO中的84个样本作为赋权数据集C,480个样本作为训练数据集D;
子步骤4.2:并随机选取训练数据集中的240个样本作为决策树的试探数据集Ds;
子步骤4.3:基于CART算法构建决策树,包括以下子步骤:
子步骤4.3.1:根节点数据集S等于试探数据集Ds
子步骤4.3.2:采用式6计算数据集S的基尼指数:
Figure BDA0002208852970000131
式中:Gini(S)表示数据集S的基尼指数;|Sk|表示数据集S中老年人热舒适等于第k个类别的样本数;|S|表示数据集S的样本数;K是老年人热舒适类别总数;
子步骤4.3.3:将数据集S根据因素xi是否等于第r个因素值划分成S1和S2两个部分,S1为S中因素xi等于第r个因素值的数据集,S2=S-S1
子步骤4.3.4:采用式7计算将数据集S根据因素xi是否等于第r个因素值进行划分的基尼指数:
Figure BDA0002208852970000141
式中:Ginisplit(S,xi(r))表示将数据集S根据因素xi是否等于第r个因素值进行划分的基尼指数,|S1|表示数据集S1的样本数,|S2|表示数据集S2的样本数,|S|表示数据集S的样本数;Gini(S1)表示数据集S1的基尼指数,Gini(S2)表示数据集S2的基尼指数;
子步骤4.3.5:选择划分基尼指数Ginisplit(S,xi(r))最小值的因素及对应的因素值作为决策树的分裂规则,将S分裂为两个子节点;
子步骤4.3.6:将子节点数据集作为根节点数据集S,采用子步骤4.3.2~子步骤4.3.5的方法通过迭代进行决策树分裂,经过41次迭代分裂,完成决策树构建;
步骤4.7:将数据集C输入构建的决策树进行仿真测试,得出将CART节点分裂算法构应用于老年人热舒适预测的准确率P2=89.29%2
步骤5.将P1和P2按照其在算术和中占的比例分别赋予C4.5节点分裂算法和CATR节点分裂算法权重β1和β2,即
Figure BDA0002208852970000151
β2=1-β1=0.54;
步骤6.基于算法适用性混合分裂决策树构建老年人热舒适预测随机森林,包括以下子步骤:
子步骤6.1随机不放回地选取特征数据集SO中的84个样本作为测试集V,随机不放回地抽取SO中的72个样本作为决策树赋权数据集D2,随机不放回地抽取SO中的408个样本作为决策树构建数据集D1
子步骤6.2:生成行采样数据集
Figure BDA0002208852970000152
采用Bootstrap方法有放回地对决策树构建数据集D1实施行采样,随机抽取数据样本,抽取的样本数与构建数据集D1样本数相同,得到决策树构建子数据集子步骤6.3:生成列采样数据集DL
对数据集
Figure BDA0002208852970000154
进行列采样,从15个因素中随机不放回的抽取m=3(
Figure BDA0002208852970000153
的取整值)个因素,得到列采样数据集DL;
子步骤6.4:将列采样数据集DL作为根节点数据集S;
子步骤6.5:根据式8计算混和分裂指标Φ(S,xi(r));
Φ(S,xi(r))=β2Ginisplit(S,xi(r))-β1GainRatio(xi) (式8)
式中,Φ(S,xi(r))为依据因素xi是否等于第r个因素值将S进行分类的混合分裂指标;
子步骤6-6:选取混合分裂指标Φ(S,xi(r))最小值的因素和因素值将S分裂为两个子节点;
子步骤6.7:将子节点数据集作为根节点数据集S,采用子步骤6.5~子步骤6.6的方法通过迭代进行决策树分裂,直到构建完整的决策树T1为止;
子步骤6.8:按照决策树初始值P0取50,重复子步骤6.2~子步骤6.7,,形成50棵决策树T1,T2,…,T50,以此组成基于算法适用性混合分裂决策树的老年人热舒适预测随机森林;
子步骤6.9:对决策树颗数进行优化;
保持分裂属性的个数3不变,分别选取了50、100、150、…、950、1000棵决策树,进行20次随机森林棵树优化实验,获得随机森林的袋外错误率,且发现随机森林的袋外错误率随着决策树棵数的增加不断减少,当决策树的棵数为300棵时袋外错误率减少且趋于稳定,本案选取最佳决策数棵树为300;
子步骤6.10:决策树的赋权;
将决策树赋权数据集D2中的样本分别输入到300棵决策树中,得到每棵决策树的老年人热舒适分类正确率wq,将每棵决策树的分类正确率作为权值赋予每棵决策树;
步骤7.采用训练好的随机森林进行老年人热舒适预测;
将测试集V样本V(x1,x2,...,x15)输入到每棵决策树,根据式9计算老年人热舒适的最终预测结果:
其中,k表示老年人热舒适等级的类别;K表示老年人热舒适等级的类别总数,
Figure BDA0002208852970000172
表示第q决策树输出的老年人热舒适预测结果为第k个类别,wq为第q棵决策树的权值。
本案例老年人热舒适预测结果如表一,其预测结果的正确率为86.90%,均方根误差RMSE=0.4499,均方根对数误差RMLSE=0.0105。
表1 基于算法适用性混合分裂决策树随机森林的老年人热舒适案例预测结果
Figure BDA0002208852970000171
综合上述的预测结果可以看出,本文所提出的老年人热舒适预测模型在历史数据集上得到良好的运行结果,且预测准确率较高。随机森林预测老年人热舒适得到的结果科学合理,具有参考意义。

Claims (9)

1.一种老年人热舒适预测方法,其基于算法适用性混合分裂决策树随机森林,包括以下步骤:
步骤1,确定老年人热舒适影响因素,构建原始训练样本数据集O;
步骤2,对原始训练样本数据集O进行预处理,构建老年人热舒适预测特征数据集SO;
步骤3,针对老年人热舒适预测特征数据集SO,判断C4.5节点分裂算法用于老年人热舒适预测的适用性,得出基于C4.5分裂算法构建决策树用于老年人热舒适预测的准确率P1
步骤4,针对老年人热舒适预测特征数据集SO,判断CART节点分裂算法的适用性,得出将CART节点分裂算法应用于老年人热舒适预测的准确率P2
步骤5,将P1和P2按照其在算术和中占的比例分别赋予C4.5节点分裂算法和CATR节点分裂算法权重β1和β2,β12=1;
步骤6,基于步骤5的算法适用性混合分裂决策树构建老年人热舒适预测随机森林;
步骤7,采用训练好的随机森林进行老年人热舒适预测。
2.如权利要求1所述的一种老年人热舒适预测方法,其特征在于:步骤1中老年人热舒适影响因素包括:老年人个体信息、室内外物理参数、建筑本体特征、热环境可调节性;其中老年人个体信息包括:年龄、性别、健康状况、平均代谢率、服装热阻、老年人热舒适调节行为偏好;室内外物理参数包括:室内外干球温度、室内外相对湿度、室内风速、室内表面辐射温度;建筑本体特征包括:建筑所在气候分区、建筑所在住区规划特征、建筑围护结构热工性能、房间楼层、房间朝向等;热环境可调节性包括:窗户的可开启性、窗帘的可调节性、加热设备可调节性、降温设备可调节行。
3.如权利要求2所述的一种老年人热舒适预测方法,其特征在于:假设步骤1中一共确定M个影响因素,采用向量Xi(i=1,2,...,M)表示;按照确定的影响因素收集相应因素的原始数据及老年人热舒适评价结果,每一次调查测试得到一行原始数据,即得到了一个训练样本;假设做了N次调查测试,则一共得到N个训练样本,组成原始训练样本数据集O(yj,Xi j)(i=1,2,...,M;j=1,2,...,N),其中:yj表示第j个训练样本的老年人热舒适评价结果,Xi j中的元素xi j表示第j个训练样本的第i个因素的原始数据。
4.如权利要求3所述的一种老年人热舒适预测方法,其特征在于:步骤2中的预处理指将影响因素中的连续变量进行离散化处理,预处理结果组成了老年人热舒适预测特征数据集SO(syj,SXi j),其中:syj(j=1,2,...,N)表示第j个样本的老年人热舒适评价结果的预处理值,SXi j(i=1,2,...,M;j=1,2,...,N)中的元素sxi j表示第j个样本的第i个因素的预处理后的因素值,老年人热舒适预测特征数据集SO可表示为如下矩阵:
Figure FDA0002208852960000021
5.如权利要求1至4任意一项所述的一种老年人热舒适预测方法,其特征在于:步骤3、步骤4的具体步骤均包括以下子步骤:
子步骤1,随机抽取老年人热舒适预测特征数据集SO中15%的样本数据作为决策树分裂算法适用性赋权数据集C,85%的样本数据作为训练数据集D;
子步骤2,随机选取训练数据集D的二分之一样本作为决策树的试探数据集Ds
子步骤3,基于C4.5节点分裂算法和基于CART算法分别构建决策树;
子步骤4,将数据集C分别输入构建完成的决策树进行仿真测试,得出基于C4.5分裂算法构建决策树用于老年人热舒适预测的准确率P1和将CART节点分裂算法应用于老年人热舒适预测的准确率P2
6.如权利要求5所述的一种老年人热舒适预测方法,其特征在于:基于C4.5节点分裂算法构建决策树包括以下子步骤:
子步骤3.3.1,根节点数据集S等于试探数据集Ds
子步骤3.3.2,根据式1计算S的信息熵:
Figure FDA0002208852960000031
式中:Info(S)表示数据集S的信息熵,|Sk|表示数据集S中老年人热舒适等于第k个类别的样本数,|S|表示数据集S的样本数,K是老年人热舒适类别总数;
子步骤3.3.3,将S根据因素xi的因素值分类,分类子集数目等于因素xi的因素值的个数,根据式2计算按照因素xi对S进行热舒适分类的信息熵:
式中:Info_xi(S)表示按照因素xi对S进行热舒适分类的信息熵;R表示数据集S中因素xi所具有的因素值的个数;r表示因素xi的第r个因素值;|Sr|表示数据集S中因素xi的因素值等于第r个因素值的样本数;Info(Sr)表示数据集S中因素xi的因素值等于第r个因素值的数据集的信息熵;
子步骤3.3.4,根据式3计算按照因素xi对S进行热舒适分类的信息增益量:
Gain(xi)=Info(S)-Info_xi(S) (式3)
式中:Gain(xi)表示按照因素xi对S进行热舒适分类的信息增益量;
子步骤3.3.5,根据式4计算按照因素xi对S进行热舒适分类的分裂信息比率:
Figure FDA0002208852960000041
式中:SplitInfo(xi)表示按照因素xi对S进行热舒适分类的分裂信息比率;
子步骤3.3.6,根据式5计算按照因素xi对S进行热舒适分类的信息增益率:
Figure FDA0002208852960000042
式中:GainRatio(xi)表示按照因素xi对S进行热舒适分类的信息增益率;
子步骤3.3.7,选择信息增益率值GainRatio(xi)最大的因素作为决策树分裂规则,将S按照分裂因素的因素值个数分裂为多个子节点;
子步骤3.3.8,将子节点数据集作为根节点数据集S,采用子步骤3.3.2~子步骤3.3.7的方法通过迭代进行决策树分裂,直到完整的决策树构建完成为止。
7.如权利要求5所述的一种老年人热舒适预测方法,其特征在于:基于CART算法构建决策树,包括以下子步骤:
子步骤4.3.1,根节点数据集S等于试探数据集Ds
子步骤4.3.2,采用式6计算数据集S的基尼指数:
Figure FDA0002208852960000043
式中:Gini(S)表示数据集S的基尼指数;|Sk|表示数据集S中老年人热舒适等于第k个类别的样本数;|S|表示数据集S的样本数;K是老年人热舒适类别总数;
子步骤4.3.3,将数据集S根据因素xi是否等于第r个因素值划分成S1和S2两个部分,S1为S中因素xi等于第r个因素值的数据集,S2=S-S1
子步骤4.3.4,采用式7计算将数据集S根据因素xi是否等于第r个因素值进行划分的基尼指数:
Figure FDA0002208852960000051
式中:Ginisplit(S,xi(r))表示将数据集S根据因素xi是否等于第r个因素值进行划分的基尼指数,|S1|表示数据集S1的样本数,|S2|表示数据集S2的样本数,|S|表示数据集S的样本数;Gini(S1)表示数据集S1的基尼指数,Gini(S2)表示数据集S2的基尼指数;
子步骤4.3.5,选择划分基尼指数Ginisplit(S,xi(r))最小值的因素及对应的因素值作为决策树的分裂规则,将S分裂为两个子节点;
子步骤4.3.6,将子节点数据集作为根节点数据集S,采用子步骤4.3.2~子步骤4.3.5的方法通过迭代进行决策树分裂,直到完整的决策树构建完成为止。
8.如权利要求1至4任意一项所述的一种老年人热舒适预测方法,其特征在于:步骤6的具体步骤包括以下子步骤:
子步骤6.1,随机抽取老年人热舒适预测特征数据集SO中85%样本作为决策树构建数据集D1,15%样本作为决策树赋权数据集D2
子步骤6.2,生成行采样数据集
Figure FDA0002208852960000061
采用Bootstrap方法有放回地对决策树构建数据集D1实施行采样,随机抽取数据样本,抽取的样本数与构建数据集D1样本数相同,得到决策树构建子数据集
Figure FDA0002208852960000062
子步骤6.3,生成列采样数据集DL,对数据集进行列采样,从M-1个因素中随机不放回的抽取m(m<<M-1,m为
Figure FDA0002208852960000064
的取整值)个因素,得到列采样数据集DL;
子步骤6.4,将列采样数据集DL作为根节点数据集S;
子步骤6.5,根据式8计算混和分裂指标Φ(S,xi(r));
Φ(S,xi(r))=β2Ginisplit(S,xi(r))-β1GainRatio(xi) (式8)
式中,Φ(S,xi(r))为依据因素xi是否等于第r个因素值将S进行分类的混合分裂指标;
子步骤6.6,选取混合分裂指标Φ(S,xi(r))最小值的因素和因素值将S分裂为两个子节点;
子步骤6.7,将子节点数据集作为根节点数据集S,采用子步骤6.5~子步骤6.6的方法通过迭代进行决策树分裂,直到构建完整的决策树T1为止;
子步骤6.8,重复子步骤6.2~子步骤6.7,假设重复P次,形成P棵决策树T1,T2,…,TP,以此组成基于算法适用性混合分裂决策树的老年人热舒适预测随机森林;
子步骤6.9,对决策树棵数进行优化,保持m值不变,调整随机森林棵树P,当随机森林的泛化误差减少且趋于稳定时,对应的决策树棵数为最佳决策数棵树Q;
子步骤6.10,决策树的赋权,将决策树赋权数据集D2中的样本分别输入到Q棵决策树中,得到每棵决策树的老年人热舒适分类正确率wq,将每棵决策树的分类正确率作为权值赋予每棵决策树。
9.如权利要求8所述的一种老年人热舒适预测方法,其特征在于:步骤7的具体步骤包括:将待测老年人热舒适预测样本v(x1,x2,...,xm)输入到每棵决策树,根据式9计算老年人热舒适的最终预测结果:
Figure FDA0002208852960000071
其中,k表示老年人热舒适等级的类别;K表示老年人热舒适等级的类别总数,fq tree(v)=k表示第q决策树输出的老年人热舒适预测结果为第k个类别,wq为第q棵决策树的权值。
CN201910891404.7A 2019-09-20 2019-09-20 一种老年人热舒适预测方法 Active CN110717524B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910891404.7A CN110717524B (zh) 2019-09-20 2019-09-20 一种老年人热舒适预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910891404.7A CN110717524B (zh) 2019-09-20 2019-09-20 一种老年人热舒适预测方法

Publications (2)

Publication Number Publication Date
CN110717524A true CN110717524A (zh) 2020-01-21
CN110717524B CN110717524B (zh) 2021-04-06

Family

ID=69210628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910891404.7A Active CN110717524B (zh) 2019-09-20 2019-09-20 一种老年人热舒适预测方法

Country Status (1)

Country Link
CN (1) CN110717524B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783830A (zh) * 2020-05-29 2020-10-16 平安科技(深圳)有限公司 基于oct的视网膜分类方法、装置、计算机设备及存储介质
CN112966023A (zh) * 2021-03-12 2021-06-15 中海石油(中国)有限公司 一种井筒的完整性预判方法
CN113516173A (zh) * 2021-05-27 2021-10-19 江西五十铃汽车有限公司 一种基于随机森林与决策树的整车静动态干涉的测评方法
CN114743118A (zh) * 2022-04-27 2022-07-12 汇德晟新电气科技(扬州)有限公司 基于创新型随机森林算法的输电线路劣化绝缘子识别方法
CN118245935A (zh) * 2024-05-29 2024-06-25 天目山实验室 一种基于可穿戴设备的超声速客机乘客热舒适评价方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014228172A (ja) * 2013-05-21 2014-12-08 公益財団法人鉄道総合技術研究所 列車内の温熱環境評価方法
CN105373606A (zh) * 2015-11-11 2016-03-02 重庆邮电大学 一种改进c4.5决策树算法下的不平衡数据抽样方法
CN105844300A (zh) * 2016-03-24 2016-08-10 河南师范大学 一种基于随机森林算法的优化分类方法及装置
WO2016168910A1 (en) * 2015-04-20 2016-10-27 Green Power Labs Inc. Predictive building control system and method for optimizing energy use and thermal comfort for a building or network of buildings
CN109857175A (zh) * 2019-01-23 2019-06-07 南京邮电大学 一种非侵入式人体热舒适的ai感知方法
CN110186170A (zh) * 2019-06-20 2019-08-30 北京石油化工学院 热舒适度指标pmv控制方法及设备
CN110287552A (zh) * 2019-06-10 2019-09-27 合肥工业大学 基于改进随机森林算法的电机轴承故障诊断方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014228172A (ja) * 2013-05-21 2014-12-08 公益財団法人鉄道総合技術研究所 列車内の温熱環境評価方法
WO2016168910A1 (en) * 2015-04-20 2016-10-27 Green Power Labs Inc. Predictive building control system and method for optimizing energy use and thermal comfort for a building or network of buildings
CN105373606A (zh) * 2015-11-11 2016-03-02 重庆邮电大学 一种改进c4.5决策树算法下的不平衡数据抽样方法
CN105844300A (zh) * 2016-03-24 2016-08-10 河南师范大学 一种基于随机森林算法的优化分类方法及装置
CN109857175A (zh) * 2019-01-23 2019-06-07 南京邮电大学 一种非侵入式人体热舒适的ai感知方法
CN110287552A (zh) * 2019-06-10 2019-09-27 合肥工业大学 基于改进随机森林算法的电机轴承故障诊断方法及系统
CN110186170A (zh) * 2019-06-20 2019-08-30 北京石油化工学院 热舒适度指标pmv控制方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ASMA AHMAD FARHAN等: "Predicting Individual Thermal Comfort using Machine Learning Algorithms", 《2015 IEEE INTERNATIONAL CONFERENCE ON AUTOMATION SCIENCE AND ENGINEERING》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783830A (zh) * 2020-05-29 2020-10-16 平安科技(深圳)有限公司 基于oct的视网膜分类方法、装置、计算机设备及存储介质
CN112966023A (zh) * 2021-03-12 2021-06-15 中海石油(中国)有限公司 一种井筒的完整性预判方法
CN113516173A (zh) * 2021-05-27 2021-10-19 江西五十铃汽车有限公司 一种基于随机森林与决策树的整车静动态干涉的测评方法
CN114743118A (zh) * 2022-04-27 2022-07-12 汇德晟新电气科技(扬州)有限公司 基于创新型随机森林算法的输电线路劣化绝缘子识别方法
CN118245935A (zh) * 2024-05-29 2024-06-25 天目山实验室 一种基于可穿戴设备的超声速客机乘客热舒适评价方法

Also Published As

Publication number Publication date
CN110717524B (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
CN110717524B (zh) 一种老年人热舒适预测方法
Chai et al. Using machine learning algorithms to predict occupants’ thermal comfort in naturally ventilated residential buildings
Chan et al. Development of artificial neural network models for predicting thermal comfort evaluation in urban parks in summer and winter
Fard et al. Application of machine learning in thermal comfort studies: A review of methods, performance and challenges
CN111639462B (zh) 一种基于深度置信神经网络的自然通风环境下建筑室内热舒适预测方法
Farhan et al. Predicting individual thermal comfort using machine learning algorithms
CN108898275B (zh) 一种基于云模型的奶牛养殖环境舒适度评价方法及系统
CN111260116A (zh) 一种基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法
CN112613232B (zh) 一种冬季供暖条件下室内人体热舒适预测及评价方法
CN114662201B (zh) 一种自然通风智能调控的寻优方法
CN116468138A (zh) 空调负荷预测方法、系统、电子设备及计算机存储介质
CN110991478B (zh) 热舒适感模型建立方法和用户偏好温度的设定方法及系统
CN115130830A (zh) 基于级联宽度学习和麻雀算法的非侵入式负荷分解方法
CN117349621A (zh) 一种夏季可变温环境下室内人体热舒适预测及评价方法
CN112097378A (zh) 一种基于前馈型神经网络的空调舒适度调节方法
Mościbrodzka The Use of Methods of Multidimensional Comparative Analysis in Evaluation of the Standard of Living of Poland’s Population in Comparison with Other Co
Cao et al. A sleep staging model for the sleep environment control based on machine learning
Ahmad et al. Performance of Machine Learning Algorithms Considering Spatial Effects Assessment for Indoor Personal Thermal Comfort in Air-Conditioned Workplace
CN110781538B (zh) 基于实地监测的开窗仿真算法
Bingxin et al. Experimental design and the GA-BP prediction of human thermal comfort index
CN112508259A (zh) 一种针对独立用户类别的中长期用电量预测方法及系统
Zhao et al. Evaluation of thermal comfort in air-conditioned rooms based on structure/control-related parameters and data-mining method
Martins et al. A deep learning approach to personal thermal comfort models for an ageing population
CN118551669B (zh) 基于气候预测的建筑围护结构多目标节能优化方法、装置
Rodríguez-Alabarce et al. Thermal comfort estimation using a neurocomputational model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant