CN116680779A - 一种基于建筑室内日光感知评价预测模型的模型特征分析方法 - Google Patents
一种基于建筑室内日光感知评价预测模型的模型特征分析方法 Download PDFInfo
- Publication number
- CN116680779A CN116680779A CN202310553807.7A CN202310553807A CN116680779A CN 116680779 A CN116680779 A CN 116680779A CN 202310553807 A CN202310553807 A CN 202310553807A CN 116680779 A CN116680779 A CN 116680779A
- Authority
- CN
- China
- Prior art keywords
- sunlight
- perception evaluation
- perception
- light environment
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 133
- 230000008447 perception Effects 0.000 title claims abstract description 131
- 238000004458 analytical method Methods 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 69
- 238000000556 factor analysis Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 230000003993 interaction Effects 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 12
- 238000012795 verification Methods 0.000 claims abstract description 12
- 238000010801 machine learning Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 238000002474 experimental method Methods 0.000 claims description 7
- 238000003066 decision tree Methods 0.000 claims description 6
- 238000013210 evaluation model Methods 0.000 claims description 6
- 238000011835 investigation Methods 0.000 claims description 6
- 238000006116 polymerization reaction Methods 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000005065 mining Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 abstract description 10
- 230000007613 environmental effect Effects 0.000 abstract description 9
- 238000012360 testing method Methods 0.000 description 14
- 238000011160 research Methods 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- IJJWOSAXNHWBPR-HUBLWGQQSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]-n-(6-hydrazinyl-6-oxohexyl)pentanamide Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCCCC(=O)NN)SC[C@@H]21 IJJWOSAXNHWBPR-HUBLWGQQSA-N 0.000 description 5
- 230000016776 visual perception Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000004313 glare Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000000846 Bartlett's test Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000027288 circadian rhythm Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/13—Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Geometry (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Computer Hardware Design (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Mathematics (AREA)
- Structural Engineering (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Civil Engineering (AREA)
- Architecture (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种基于建筑室内日光感知评价预测模型的模型特征分析方法。所述方法包括:步骤1,收集建筑室内光环境特征数据和主观日光感知评价结果,建立日光感知评价的基础数据库;步骤2,展开探索性因子分析和验证性因子分析,获得日光感知共性因子;步骤3,筛选最优性能机器学习算法,构建日光感知评价预测模型;步骤4,利用SHAP方法对日光感知评价预测模型进行特征解释分析,得到光环境特征参数及其交互组合对日光感知评价结果的影响权重。本发明提出的日光感知评价预测模型不但具有较高的预测精度,还具有良好的模型可解释性,能够分析各种环境因素在对日光感知评价中的影响权重,提高了建筑自然采光设计的准确性与科学性。
Description
技术领域
本发明属于建筑室内自然采光设计技术领域,特别是涉及一种基于建筑室内日光感知评价预测模型的模型特征分析方法。
背景技术
国际健康建筑研究院(International WELLBuilding Institute)提出的《WELL健康建筑标准》指出,自然采光对使用者情绪、昼夜节律和工作效率具有实质性的影响。展开使用者日光感知评价研究不但能够以使用者视角对室内光环境进行精准预测与评估,而且评价结果可以显著提高建筑采光设计精度与决策效率。
视觉感知过程是人眼受到外界刺激时,大脑针对外界信息进行整体性处理、分析和理解形成的复杂反应机制。由于视觉感知是建筑采光设计中必要的考虑因素,为了更加科学有效地研究使用者视觉感知规律,需要在建筑采光设计中引入量化研究方法。通过对视觉感知的量化研究,可以深入了解建筑室内环境对使用者视觉感知的影响,有助于优化建筑设计决策,提高建筑室内环境的舒适度和使用效果。在建筑设计研究中,主观问卷调查和语义差别量表是目前使用最多的量化分析方法。
既有研究通常会采用不同的主观评价量表进行实验,由于这些问卷的提问方式存在差异,且具有强烈的主观偏向性与经验性,很难判断日光感知规律的差异是否受提问方式的影响。同时,研究学者常采用线性回归、相关性分析、因子分析等传统统计学方法进行单一环境要素与日光感知评价之间的关系研究,缺乏对环境要素与评估结果潜在的复杂非线性关系的考虑,而且难以判断环境要素组合效应对于日光感知评价结果的影响,无法为设计者提供精准地采光设计决策支持。
发明内容
本发明目的是为了解决既有日光感知评价研究无法全面反映使用者主观感受、环境参数影响权重不清晰的问题,提出了一种基于建筑室内日光感知评价预测模型的模型特征分析方法。
本发明是通过以下技术方案实现的,本发明提出一种基于建筑室内日光感知评价预测模型的模型特征分析方法,所述方法包括以下步骤:
步骤1,在典型建筑空间内展开日光感知评价实验,收集建筑室内光环境特征参数和主观日光感知评价结果,建立日光感知评价的基础数据库;
步骤2,调用日光感知评价基础数据库数据,展开探索性因子分析和验证性因子分析,获得日光感知共性因子;
步骤3,基于日光感知共性因子分类结果,筛选最优性能机器学习算法,构建日光感知评价预测模型;
步骤4,利用SHAP方法对日光感知评价预测模型进行特征解释分析,分别计算每个光环境特征参数的平均SHAP值、典型样本的光环境特征参数SHAP值和光环境特征参数交互组合的SHAP值,得到光环境特征参数及其交互组合对日光感知评价结果的影响权重。
进一步地,步骤1具体为:
步骤1.1,利用问卷调查和实地调研的方法,获取不同建筑类型的典型空间环境信息;
步骤1.2,在典型建筑空间内展开日光感知评价实验,采集建筑室内光环境特征参数,收集主观日光感知评价结果;
步骤1.3,依据建筑空间类型以及采光形式,将光环境特征参数与日光感知评价结果进行筛选与分类,建立日光感知评价模型的基础数据库。
进一步地,所述日光感知评价的内容为15组评价室内光环境特征的双极性形容词,分别为:昏暗的---明亮的、低对比度---高对比度、明显的---模糊的、均匀的---不均匀的、稳定的---变化的、简单的---复杂的、连续的---不连续的、整齐的---随意的、有趣的---无趣的、令人舒适的---令人不舒适的、令人满意的---令人不满意的、令人愉快的---令人不愉快的、令人紧张的---令人放松的、有抑制性的---有刺激性的、有吸引力的---没有吸引力的。
进一步地,步骤2具体为:对日光感知评价结果进行信度与效度分析,在探索性因子分析中运用主成分分析法,提取日光感知评价问题项之间潜在的共性因子;对共性因子展开验证性因子分析,依据聚合效度、区分效度和结构效度分析结果,以模型拟合指标的标准值为参考,对标准载荷系数低的问题项进行试错性删减,直至所有指标达到阈值标准,得到日光感知共性因子。
进一步地,步骤3具体为:
步骤3.1,依据日光感知共性因子分类结果,对基础数据库中的数据集进行特征选择,并预处理光环境特征参数;
步骤3.2,采用决策树算法、随机森林算法和XGBoost算法分别构建日光感知评价预测模型,运用模型评价指标比较预测模型的精度,筛选最优预测模型;
步骤3.3,运用网格搜索法和交叉验证法,展开预测模型超参数优化,最终获得有效的日光感知评价预测模型。
进一步地,步骤4具体为:利用SHAP方法对日光感知评价预测模型进行特征解释,分析光环境特征参数对日光感知评价结果、光环境特征参数对日光感知评价分类结果、基于典型样本的光环境特征参数对日光感知评价结果、以及光环境特征参数交互组合对日光感知评价结果的影响程度,以探讨光环境特征要素与日光感知评价结果之间的量化关系,从而得到光环境特征参数及其交互组合对日光感知评价结果的影响权重。
进一步地,所述SHAP值用于深入挖掘输入特征对预测结果的重要程度,具体计算公式为:
其中,g(x′)表示预测模型,x’∈{0,1}M表示特征向量,M表示简化输入特征的个数;φi表示特征i的SHAP值;在特征向量中,“1”表示对应的特征值“存在”,“0”表示“不存在”;φ0表示所有简化输入被关闭即缺失的模型输出。
进一步地,SHAP方法用于分析学习预测模型的数据集特征;当采用XGBoost算法构建日光感知评价预测模型时,SHAP方法用于分析最终XGBoost模型fc(S);SHAP方法通过构造特征S的子集来确定所有特征的SHAP值,具体计算公式为:
其中,|S|表示S中非零项的个数,表示所有的S向量其中非零元素是M中非零元素的子集。
本发明提出一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述一种基于建筑室内日光感知评价预测模型的模型特征分析方法的步骤。
本发明提出一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现所述一种基于建筑室内日光感知评价预测模型的模型特征分析方法的步骤。
本发明具有以下有益效果:
本发明提出了一种基于建筑室内日光感知评价预测模型的模型特征分析方法。该方法通过探索性因子分析和验证性因子分析获得日光感知共性因子,不但能够准确反映日光感知过程中视觉关注的重点,而且共性因子可作为反映视觉认知基础规律特征的标尺,助力筛选最能反映日光感知基础规律的主观评价问题量表。运用机器学习建模技术和SHAP特征解释方法,得到光环境特征参数及其交互组合对于日光感知评价的量化影响和关联性规律。通过建立日光感知评价预测模型和对模型特征的解释分析,探讨了各种环境因素在对日光感知评价中的影响权重,弥补了日光感知研究在理论与技术上的策略缺失,实现了对日光感知评价复杂影响的深入探究,提高了建筑自然采光设计的准确性与科学性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明所述的一种基于建筑室内日光感知评价预测模型的模型特征分析方法的流程图。
图2为光环境特征参数对日光感知评价模型整体情况的解释性分析结果图。
图3为光环境特征参数对日光感知评价模型分类情况的解释性分析结果图。
图4为基于典型样本的光环境特征参数对日光感知评价模型的解释性分析结果图。
图5为光环境特征参数交互组合对日光感知评价模型的解释性分析结果图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
结合图1说明本实施例,本发明提出一种基于建筑室内日光感知评价预测模型的模型特征分析方法,包括以下步骤:
步骤1,在典型建筑空间内展开日光感知评价实验,收集建筑室内光环境特征数据和主观日光感知评价结果,建立日光感知评价的基础数据库;
步骤2,调用日光感知评价基础数据库数据,展开探索性因子分析和验证性因子分析,获得日光感知共性因子;
步骤3,基于日光感知共性因子分类结果,筛选最优性能机器学习算法,构建日光感知评价预测模型;
步骤4,利用SHAP(SHapley Additive exPlanations)方法对日光感知评价预测模型进行特征解释分析,分别计算每个光环境特征参数的平均SHAP值、典型样本的光环境特征参数SHAP值、光环境特征参数交互组合的SHAP值,得到光环境特征参数及其交互组合对日光感知评价结果的影响权重。
所述步骤1具体为:
步骤1.1,利用问卷调查和实地调研的方法,获取不同建筑类型的典型空间环境信息;
步骤1.2,在典型建筑空间内展开日光感知评估实验,采集建筑室内光环境特征数据,收集主观日光感知评价结果;
步骤1.3,依据建筑空间类型以及采光形式,将光环境特征数据与日光感知评价结果进行筛选与分类,建立日光感知评价模型的基础数据库。
所述日光感知评价内容为15组评价室内光环境特征的双极性形容词,分别为:昏暗的---明亮的、低对比度---高对比度、明显的---模糊的、均匀的---不均匀的、稳定的---变化的、简单的---复杂的、连续的---不连续的、整齐的---随意的、有趣的---无趣的、令人舒适的---令人不舒适的、令人满意的---令人不满意的、令人愉快的---令人不愉快的、令人紧张的---令人放松的、有抑制性的---有刺激性的、有吸引力的---没有吸引力的。
所述日光感知评价采用7级语义差别量表作为评价标度,具体为:每个评估项中,1级和7级对应双极性形容词组的两个形容词,4级为适中状态。
所述建筑室内光环境特征参数具体包括:建筑空间特征参数(建筑空间功能、建筑平面尺寸、主要空间尺寸、窗户朝向、窗户数量、窗墙比)、室外环境气象参数(太阳高度角、太阳方位角、天空类型)、自然采光特征参数(受试者视线范围内的平均亮度、垂直人眼照度、水平桌面照度、日光眩光概率(Daylight Glare Probability)、日光眩光指数(Daylight Glare Index))。
所述步骤2具体为:对日光感知评价结果进行信度与效度分析,在探索性因子分析中运用主成分分析法,提取日光感知评价问题项之间潜在的共性因子;对共性因子展开验证性因子分析,依据聚合效度、区分效度和结构效度分析结果,以模型拟合指标的标准值为参考,对标准载荷系数较低的问题项进行试错性删减,直至所有指标达到阈值标准,得到日光感知共性因子。
所述探索性因子分析(Exploratory Factor Analysis)是一种用于挖掘评价量表中潜在结构关系,并对其进行处理和降维,获得共性因子的统计学方法。在展开探索性因子分析前,需要对问题项进行信度与效度检验,验证评价结果是否有效和问题项之间是否存在关联性。
信度检验采用克隆巴赫系数(Cronbach's coefficient alpha),该系数能够检验评估内容的可靠性。克隆巴赫系数越高,表明问卷的信度越高。在实际分析中,当克隆巴赫系数大于等于0.7时,表明问卷可信;当克隆巴赫系数小于0.4时,表明问卷信度较低,不适合继续展开因子分析。克隆巴赫系数的计算公式为:
式中:α为信度系数,K为问卷评估项,为所有参与者在第i题上的分数变异,/>为所有参与者所得总分的方差。
效度检验采用KMO(Kaiser-Meyer-Olkin Test)和Bartlett's球状检验(Bartlett's Test of Sphericity)。KMO检验是用于比较问卷问题项之间简单相关系数和偏相关系数的指标。KMO检验的计算公式为:
式中:rij为简单相关系数,rij·1,2…k为偏相关系数。KMO检验的取值范围为[0,1]。当KMO值越接近于1,表明问题项之间的相关性越强,因子分析效果就越好。在实际分析中,当KMO值大于0.7时,表明问卷内容适合展开因子分析;当KMO值小于0.5时,问卷内容不适合采用因子分析法。
Bartlett's球状检验的目的在于检验零假设“相关矩阵是一个单位矩阵”和备选假设“相关矩阵不是一个单位矩阵”何者成立。在实际分析中,若检验结果p值<0.05,拒绝零假设而接受备选假设,表示该相关矩阵不是单位矩阵,适合进行因子分析;若检验结果p值≥0.05,接受零假设,表示该相关矩阵是单位矩阵,适合数据不适合做因子分析。
所述主成分分析法(Principal Component Analysis)是一种将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法。
所述验证性因子分析(Confirmatory Factor Analysis)是用于检验共性因子与问题项之间的对应关系是否与研究者预期保持一致的研究方法。验证性因子分析的主要目的在于进行聚合效度、区分效度和结构效度的验证。
聚合(收敛)效度是指运用不同测量方法测定同一特征时测量结果的相似程度。聚合(收敛)效度的验证指标为组合信度、平均提取方差值(Average variance extracted,AVE)和因子载荷量。组合信度为因子载荷值加和的平方,问题项之间相关性越强,潜在变量对它们的解释能力也越强,因子载荷值加和的平方越大,内部一致性就越好。AVE为潜在变量对所有测量变量的综合解释能力,即当AVE值越高,潜在变量能够同时解释它所对应的评估项的能力越强。因子载荷量为潜在变量到测量变量的标准化回归系数,因子载荷量越大,代表潜在变量对测量变量的解释能力越强。若每个共性因子的AVE值大于0.5、CR值大于0.7,且因子载荷量大于0.7,说明该共性因子具有良好的聚合效度。
区分效度为潜在变量之间的区分性。区分效度的验证指标为AVE平方根值和相关性系数。当每个共性因子的AVE平方根值均大于该因子与其它因子相关系数的绝对值时,表明共性因子具有良好的区分效度。
结构效度用于检验共性因子与问题项对应关系是否符合预期。在实际分析中,经常使用的结构效度拟合指标及其标准如表1所示。
表1结构效度常用拟合指标
拟合指数 | 中文名称 | 标准 |
χ2/df | 卡方自由度比 | 小于3 |
GFI | 拟合优度指数 | 大于0.9 |
RMSEA | 近似误差均方根 | 小于0.05 |
SRMR | 标准化均方根误差 | 小于0.05 |
CFI | 比较拟合指数 | 大于0.9 |
NFI | 规范拟合指数 | 大于0.9 |
所述步骤3具体为:
步骤3.1,依据日光感知共性因子分类结果,对基础数据库中的数据集进行特征选择,并预处理光环境特征数据;
步骤3.2,采用决策树算法、随机森林算法和XGBoost算法分别构建日光感知评价预测模型,运用模型评价指标比较预测模型的精度,筛选最优预测模型;
步骤3.3,运用网格搜索法和交叉验证法,展开预测模型超参数优化,最终获得有效的日光感知评价预测模型;
所述特征选择为机器学习中选择相关特征子集构建模型的过程。该方法可以有效去除冗余或无关变量,以寻找数据库中最优特征子集。
所述光环境特征数据预处理过程,是将连续型光环境数据进行归一化处理,对离散型建筑空间特征数据(测试地点、窗户朝向、窗户数量等)进行One-Hot编码处理,从而减少不同数据变化幅度对模型预测结果的影响。
所述决策树算法是一种基于树形结构的分类和回归算法,具有易于理解、可解释性强、对缺失值不敏感等优点。随机森林算法是一种基于决策树的集成学习算法,通过组合多个决策树进行分类或回归预测,可以有效提高预测准确率。XGBoost(eXtreme GradientBoosting)算法是一种采用了贪心算法和梯度信息优化损失函数的集成学习算法,具有良好的鲁棒性和对不平衡数据集的适应性。
所述模型评价指标如表2所示:
表2模型评价指标
所述网格搜索法是指,在指定的参数范围内,按步长依次调整参数,利用调整的参数训练学习器,从所有的参数中找到在验证集上精度最高参数的过程。交叉验证的基本原理是重复地使用数据,将数据集划分为不同的训练集和测试集,在此基础上反复地进行训练、测试以及模型选择,从而准确评估模型性能,防止模型过拟合或欠拟合。
所述步骤4具体为:利用SHAP(SHapley Additive exPlanations)方法对日光感知评价预测模型进行特征解释,分析光环境特征参数对日光感知评价结果、光环境特征参数对日光感知评价分类结果、基于典型样本的光环境特征参数对日光感知评价结果,以及光环境特征参数交互组合对日光感知评价结果的影响程度,以探讨光环境特征要素与日光感知评价结果之间的量化关系,从而得到光环境特征参数及其交互组合对日光感知评价结果的影响权重。
所述SHAP值用于深入挖掘输入特征对预测结果的重要程度,具体计算公式为:
其中,g(x′)表示预测模型,x’∈{0,1}M表示特征向量,M表示简化输入特征的个数。φi表示特征i的SHAP值。在特征向量中,“1”表示对应的特征值“存在”,“0”表示“不存在”。φ0表示所有简化输入被关闭(即缺失)的模型输出。
所述SHAP方法还能够分析学习预测模型的数据集特征。以XGBoost算法为例,由于SHAP方法是依托预测模型展开的特征解释方法,因此SHAP方法仅用于分析最终XGBoost模型fx(S)。SHAP方法是通过构造特征S的子集来确定所有特征的SHAP值,具体计算公式为:
其中,|S|表示S中非零项的个数,表示所有的S向量其中非零元素是M中非零元素的子集。
运用SHAP值可以解释光环境特征参数对日光感知评价结果的影响程度。例如,运用SHAP方法评估光环境特征参数对日光满意度评价结果的影响程度,如图2所示。Ltask/Lm对日光满意度评估结果的影响程度最大,DGP次之。
运用SHAP值的平均值可以解释光环境特征参数对日光感知评价分类结果的影响程度。例如,运用SHAP方法评估光环境特征参数对日光满意度分类结果的影响程度,如图3所示。Ltask/Lm对“满意”、“不满意”和“适中”状态的影响程度不同,对日光“不满意”状态的影响程度明显,但是对“适中”状态的影响较弱。
运用SHAP值及决策分析图,可以解释典型样本的光环境特征参数对日光感知评价结果的影响程度。例如,运用SHAP方法解释典型样本的光环境特征参数对日光满意度评价结果的影响程度,如图4所示。图中每个线条对应数据集中的一个样本,线条颜色表示特征的预测值,对应图上方的光谱色带。所有线条从底部出发,向顶部移动。每个特征的SHAP值都添加到评价结果的基值中,表示每个特征参数对整体预测做出的贡献程度。所有样本数据在性别和实验位置处的直线斜率变化较小,表明这两个特征参数对于日光满意度评价结果的影响较弱。
运用SHAP值可以解释光环境特征参数交互组合对日光感知评价结果的影响程度。例如,运用SHAP方法评估光环境特征参数交互组合对日光满意度评价结果的影响程度,如图5所示。太阳高度角和Ltask为对日光满意度评估影响程度最大的特征参数交互组合,且包含Ltask/Lm的特征参数组合普遍对评估结果影响较高。
本发明提出了一种基于建筑室内日光感知评价预测模型的模型特征分析方法。该方法通过探索性因子分析和验证性因子分析获得日光感知共性因子,不但能够准确反映日光感知过程中视觉关注的重点,而且共性因子可作为反映视觉认知基础规律特征的标尺,助力筛选最能反映日光感知基础规律的主观评价问题量表。运用机器学习建模技术和SHAP特征解释方法,得到光环境特征参数及其交互组合对于日光感知评价的量化影响和关联性规律。通过建立日光感知评价预测模型和对模型特征的解释分析,探讨了各种环境因素在对日光感知评价中的影响权重,弥补了日光感知研究在理论与技术上的策略缺失,实现了对日光感知评价复杂影响的深入探究,提高了建筑自然采光设计的准确性与科学性。
本发明提出一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述一种基于建筑室内日光感知评价预测模型的模型特征分析方法的步骤。
本发明提出一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现所述一种基于建筑室内日光感知评价预测模型的模型特征分析方法的步骤。
本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasablePROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambusRAM,DRRAM)。应注意,本发明描述的方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,高密度数字视频光盘(digital video disc,DVD))、或者半导体介质(例如,固态硬盘(solid state disc,SSD))等。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
应注意,本申请实施例中的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
以上对本发明所提出的一种基于建筑室内日光感知评价预测模型的模型特征分析方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于建筑室内日光感知评价预测模型的模型特征分析方法,其特征在于:所述方法包括以下步骤:
步骤1,在典型建筑空间内展开日光感知评价实验,收集建筑室内光环境特征参数和主观日光感知评价结果,建立日光感知评价的基础数据库;
步骤2,调用日光感知评价基础数据库数据,展开探索性因子分析和验证性因子分析,获得日光感知共性因子;
步骤3,基于日光感知共性因子分类结果,筛选最优性能机器学习算法,构建日光感知评价预测模型;
步骤4,利用SHAP方法对日光感知评价预测模型进行特征解释分析,分别计算每个光环境特征参数的平均SHAP值、典型样本的光环境特征参数SHAP值和光环境特征参数交互组合的SHAP值,得到光环境特征参数及其交互组合对日光感知评价结果的影响权重。
2.根据权利要求1所述的方法,其特征在于:步骤1具体为:
步骤1.1,利用问卷调查和实地调研的方法,获取不同建筑类型的典型空间环境信息;
步骤1.2,在典型建筑空间内展开日光感知评价实验,采集建筑室内光环境特征参数,收集主观日光感知评价结果;
步骤1.3,依据建筑空间类型以及采光形式,将光环境特征参数与日光感知评价结果进行筛选与分类,建立日光感知评价模型的基础数据库。
3.根据权利要求2所述的方法,其特征在于:所述日光感知评价的内容为15组评价室内光环境特征的双极性形容词,分别为:昏暗的---明亮的、低对比度---高对比度、明显的---模糊的、均匀的---不均匀的、稳定的---变化的、简单的---复杂的、连续的---不连续的、整齐的---随意的、有趣的---无趣的、令人舒适的---令人不舒适的、令人满意的---令人不满意的、令人愉快的---令人不愉快的、令人紧张的---令人放松的、有抑制性的---有刺激性的、有吸引力的---没有吸引力的。
4.根据权利要求1所述的方法,其特征在于:步骤2具体为:对日光感知评价结果进行信度与效度分析,在探索性因子分析中运用主成分分析法,提取日光感知评价问题项之间潜在的共性因子;对共性因子展开验证性因子分析,依据聚合效度、区分效度和结构效度分析结果,以模型拟合指标的标准值为参考,对标准载荷系数低的问题项进行试错性删减,直至所有指标达到阈值标准,得到日光感知共性因子。
5.根据权利要求1所述的方法,其特征在于:步骤3具体为:
步骤3.1,依据日光感知共性因子分类结果,对基础数据库中的数据集进行特征选择,并预处理光环境特征参数;
步骤3.2,采用决策树算法、随机森林算法和XGBoost算法分别构建日光感知评价预测模型,运用模型评价指标比较预测模型的精度,筛选最优预测模型;
步骤3.3,运用网格搜索法和交叉验证法,展开预测模型超参数优化,最终获得有效的日光感知评价预测模型。
6.根据权利要求5所述的方法,其特征在于:步骤4具体为:利用SHAP方法对日光感知评价预测模型进行特征解释,分析光环境特征参数对日光感知评价结果、光环境特征参数对日光感知评价分类结果、基于典型样本的光环境特征参数对日光感知评价结果、以及光环境特征参数交互组合对日光感知评价结果的影响程度,以探讨光环境特征要素与日光感知评价结果之间的量化关系,从而得到光环境特征参数及其交互组合对日光感知评价结果的影响权重。
7.根据权利要求6所述的方法,其特征在于:所述SHAP值用于深入挖掘输入特征对预测结果的重要程度,具体计算公式为:
其中,g(x′)表示预测模型,x′∈{0,1}M表示特征向量,M表示简化输入特征的个数,φi表示特征i的SHAP值;在特征向量中,“1”表示对应的特征值“存在”,“0”表示“不存在”;φ0表示所有简化输入被关闭即缺失的模型输出。
8.根据权利要求7所述的方法,其特征在于:SHAP方法用于分析学习预测模型的数据集特征;当采用XGBoost算法构建日光感知评价预测模型时,SHAP方法用于分析最终XGBoost模型fx(S);SHAP方法通过构造特征S的子集来确定所有特征的SHAP值,具体计算公式为:
其中,|S|表示S中非零项的个数,表示所有的S向量其中非零元素是M中非零元素的子集。
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8任一项所述方法的步骤。
10.一种计算机可读存储介质,用于存储计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-8任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310553807.7A CN116680779A (zh) | 2023-05-17 | 2023-05-17 | 一种基于建筑室内日光感知评价预测模型的模型特征分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310553807.7A CN116680779A (zh) | 2023-05-17 | 2023-05-17 | 一种基于建筑室内日光感知评价预测模型的模型特征分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116680779A true CN116680779A (zh) | 2023-09-01 |
Family
ID=87780038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310553807.7A Pending CN116680779A (zh) | 2023-05-17 | 2023-05-17 | 一种基于建筑室内日光感知评价预测模型的模型特征分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116680779A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117875769A (zh) * | 2023-12-29 | 2024-04-12 | 广州大学 | 一种视觉要素对骑行环境评价影响强度的分析方法及系统 |
CN117993790A (zh) * | 2024-04-07 | 2024-05-07 | 中国测试技术研究院声学研究所 | 基于神经网络的指挥室声环境质量权重计量优化分析方法 |
-
2023
- 2023-05-17 CN CN202310553807.7A patent/CN116680779A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117875769A (zh) * | 2023-12-29 | 2024-04-12 | 广州大学 | 一种视觉要素对骑行环境评价影响强度的分析方法及系统 |
CN117993790A (zh) * | 2024-04-07 | 2024-05-07 | 中国测试技术研究院声学研究所 | 基于神经网络的指挥室声环境质量权重计量优化分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116680779A (zh) | 一种基于建筑室内日光感知评价预测模型的模型特征分析方法 | |
Krasnopolsky et al. | Using ensemble of neural networks to learn stochastic convection parameterizations for climate and numerical weather prediction models from data simulated by a cloud resolving model | |
WO2017078808A1 (en) | Differentially private processing and database storage | |
US20230084638A1 (en) | Method and apparatus for classification model training and classification, computer device, and storage medium | |
CN112735097A (zh) | 一种区域滑坡预警方法及系统 | |
CN109190698B (zh) | 一种网络数字虚拟资产的分类识别系统及方法 | |
CN112764024A (zh) | 基于卷积神经网络和Bert的雷达目标识别方法 | |
Rieser et al. | Cluster-based user simulations for learning dialogue strategies. | |
CN112989621A (zh) | 一种模型性能评价方法、装置、设备及存储介质 | |
CN111861781A (zh) | 一种居民用电行为聚类中的特征优选方法及系统 | |
CN112241554A (zh) | 基于差分隐私指数机制的模型窃取防御方法和装置 | |
CN116169670A (zh) | 一种基于改进神经网络的短期非居民负荷预测方法及系统 | |
CN111752995A (zh) | 一种学生数据挖掘系统及方法 | |
CN111353529A (zh) | 一种自动确定聚类中心的混合属性数据集聚类方法 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
Yazdani et al. | Merging data and experts’ knowledge-based weights for ranking GMPEs | |
CN116702132A (zh) | 网络入侵检测方法及系统 | |
CN115270959B (zh) | 基于递归特征消除融合随机森林的页岩岩性识别法及装置 | |
Naviamos et al. | A study on determining household poverty status: SVM based classification model | |
CN113361610B (zh) | 葡萄酒产地智能识别方法及系统 | |
CN116307792A (zh) | 一种面向城市体检主题场景的评估方法及装置 | |
CN112530546B (zh) | 一种基于K-means聚类与XGBoost算法的心理预判方法及系统 | |
CN116244426A (zh) | 地理功能区识别方法、装置、设备及存储介质 | |
CN114281994B (zh) | 一种基于三层加权模型的文本聚类集成方法及系统 | |
CN112241922A (zh) | 基于改进朴素贝叶斯分类的电网资产综合价值评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |