CN109784553A - 一种室内pm2.5浓度预估方法 - Google Patents

一种室内pm2.5浓度预估方法 Download PDF

Info

Publication number
CN109784553A
CN109784553A CN201811655319.2A CN201811655319A CN109784553A CN 109784553 A CN109784553 A CN 109784553A CN 201811655319 A CN201811655319 A CN 201811655319A CN 109784553 A CN109784553 A CN 109784553A
Authority
CN
China
Prior art keywords
data
concentration
value
factor
air quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811655319.2A
Other languages
English (en)
Other versions
CN109784553B (zh
Inventor
于靓
康宁
孙益康
刘陟升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Jianzhu University
Original Assignee
Shenyang Jianzhu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Jianzhu University filed Critical Shenyang Jianzhu University
Priority to CN201811655319.2A priority Critical patent/CN109784553B/zh
Publication of CN109784553A publication Critical patent/CN109784553A/zh
Application granted granted Critical
Publication of CN109784553B publication Critical patent/CN109784553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及空气检测技术领域,具体涉及一种室内PM2.5浓度预估方法,具体包括如下步骤:通过大数据平台获取室外空气质量基础数据;对所获取的空气质量基础数据进行数据处理后获得标准数据;通过Apriori算法实现关联因子分析;建立专家知识库;构建浓度向量;预测浓度;匹配成因。本发明所提供的室内PM2.5浓度预估方法,通过大数据平台采集空气质量数据,对数据进行处理分析后预测出PM2.5浓度,并可分析成因,提供有效地决策措施;提高了空气质量,为人们提供一个安全、健康且舒适的室内环境。

Description

一种室内PM2.5浓度预估方法
技术领域
本发明涉及空气检测技术领域,具体涉及一种室内PM2.5浓度预估方法。
背景技术
由于人们长时间待在室内,尤其对于家庭主妇、老人、儿童来说,在室内的时间更是在95%以上,因此,人们更希望待在一个健康、安全、舒适的室内环境。大量关于室内外细颗粒物污染物关系的研究表明,室内室外的PM2.5浓度具有明显的相关性,因为室外PM2.5可以经过门窗及墙体等围护结构缝隙进入室内。城市人群长期暴露在PM2.5较高的环境下会对健康产生有害影响,而人体对微弱的污染物感知不敏感;虽然,现有市面上具有监测PM2.5浓度的相关设备,但设备价格较为昂贵,而且不易操作。
发明内容
本发明为了能够方便快捷地随时掌握室内PM2.5浓度值,提供了一种室内PM2.5浓度预估方法。
为了达到上述目的,本发明包括以下技术方案:本发明提供了一种室内PM2.5浓度预估方法,包括如下步骤:
(1)通过大数据平台获取室外空气质量基础数据;
(2)对所获取的空气质量基础数据进行数据处理后获得标准数据;
(3)通过Apriori算法实现关联因子分析;
(4)建立专家知识库;
(5)构建浓度向量:分别对不同检测物质浓度下正常及异常值在7个因子上进行离散化,利用熵计算离散化后的模型因子之间的分布,得到各因子的7个合理的阈值区间,使这7个因子在该阈值区间上有最大的信息量表示,即形成了7*n维向量;
(6)预测浓度:将离散化后的数据构建成向量,当把所有训练数据全部构建完成后,根据这些数据在空间的分布情况,利用KNN算法,通过调整k值达到最优预测效果,完成建模;
(7)匹配成因:针对异常预警数据,继续使用KNN算法对新样本进行匹配成因以及结合专家知识库给出建议方案。
进一步地,所述步骤(2)的具体步骤为:
1)对数据进行处理,清洗操作,主要包括对数据不一致进行纠正,对数据噪音、数据局外音进行消除或识别,对部分遗失缺损的数据进行补充;
2)数据转换:将数据转换成便于数据挖掘的格式;
3)数据规约:在大数据平台上,利用大数据平台的数据处理能力从特征中删除不重要或者不相干的特征,对数据进行在再一次检查,确保完整性及正确性。
进一步地,所述通过Apriori算法实现关联因子分析具体为:
1)对关联因子进行筛选分析判断;
2)使用Apriori算法进行关联因子分析;
3)根据分析结果进行处理,去除关联性低的因子,保留关联性较高的因子,分别为:室外浓度、缝隙高度、缝隙深度、缝隙两侧压差、缝隙形状、缝隙直角数、气密性等级。
进一步地,所述步骤(4)建立专家知识库具体为:
1)根据所获得的关联因子,将训练样本形成7维向量;
2)收集报警浓度的判定方案及决策意见,进行最终的数据治理、数据筛选、计算,形成初代版本的专家库。
进一步地,所述步骤(6)中采用KNN算法预测浓度的步骤具体为:
1)将训练样本形式化为特征空间中的加权特征向量,X=(x1,x2,x3……x7),xi表示样本x的第i个特征的值;
2)确定K值,通过交叉验证,取测试准确率最高的值作为K的取值;
3)采用余弦相似性作为距离度量算法计算两个样本之间的相似度;
4)利用相似度对浓度进行预测。
进一步地,所述步骤(6)中确定K取值的步骤为:
1)计算测试实例到所有训练集实例的距离;
2)所有的距离进行排序,找到k个最近的邻居;
3)各个近邻对应的结果进行合并,再排序,返回出现次数最多的那个结果;
4)对每一个k,使用验证集计算,记录k对应的准确数目,取准确率最大的k值。
进一步地,所述步骤(7)中使用KNN算法对新样本进行匹配成因的步骤为:
在以上预测浓度的基础上,进行以下两步骤
1)按照类别权重大小成因进行归类,归类方式通过
其中n为KNN算法中的k的取值,αi为相似度,xi为对应向量;
2)判断出预警的原因,并根据专家知识库制定浓度异常建议措施。
采用上述技术方案,包括以下有益效果:本发明所提供的室内PM2.5浓度预估方法,通过大数据平台采集空气质量数据,对数据进行处理分析后预测出PM2.5浓度,并可分析成因,提供有效地决策措施;提高了空气质量,为人们提供一个安全、健康且舒适的室内环境。
具体实施方式
下面通过具体的实施例对本发明做进一步的详细描述。
实施例:
本实施例提供了一种室内PM2.5浓度预估方法,包括如下步骤:
S1、通过大数据平台获取室外空气质量基础数据;所述空气质量基础数据为室外浓度、室外风速、室外气温、室外空气相对湿度、所在气候区(严寒地区、寒冷地区、夏热冬冷地区、夏热冬暖地区和温和地区)、房间功能(住宅、大厅、地下室、办公区域等)、缝隙高度、缝隙深度、缝隙两侧压差、缝隙形状(L型、U型、直缝型)、缝隙直角数、气密性等级中的一种或多种;
上述空气质量基础数据可以通过相应的传感器获取后存储在大数据平台。
S2、对所获取的空气质量基础数据进行数据处理后获得标准数据,具体为:
S201、在大数据平台上,利用大数据平台的数据处理能力对数据进行处理,清洗操作,主要包括对数据不一致进行纠正,对数据噪音、数据局外音进行消除或识别,对部分遗失缺损的数据进行补充;
S202、数据转换:将数据转换成便于数据挖掘的格式;
S203、数据规约:在大数据平台上,利用大数据平台的数据处理能力从特征中删除不重要或者不相干的特征,对数据进行在再一次检查,确保完整性及正确性。
S3、通过Apriori算法实现关联因子分析,具体为:
S301、对关联因子进行筛选分析判断;
S302、使用Apriori算法进行关联因子分析;
S303、根据分析结果进行处理,去除关联性低的因子,保留关联性较高的因子,分别为:室外浓度、缝隙高度、缝隙深度、缝隙两侧压差、缝隙形状(L型、U型、直缝型)、缝隙直角数、气密性等级。
S4、建立专家知识库,具体为:
S401、根据所获得的关联因子,将训练样本形成7维向量;
S402、收集报警浓度的判定方案及决策意见,进行最终的数据治理、数据筛选、计算,形成初代版本的专家库。
本步骤目的只是为了从专业角度上可以根据原因给出一些专业建议及解决方案,例如:如果是因为室外浓度过高导致的室内浓度高,那么可以建议开净化器。如果室外浓度相对较高,但是气密性差导致的室内也很高,可以安装气密性好的门窗等。具体方式为根据相应的信息(关联因子)向领域内专家进行咨询,对咨询后的结果归纳总结得到相应的专家库,后续根据实际情况可以酌情补充知识库。
S5、构建浓度向量:分别对不同检测物质浓度下正常及异常值在7个因子上进行离散化,利用熵计算离散化后的模型因子之间的分布,得到各因子的7个合理的阈值区间,使这7个因子在该阈值区间上有最大的信息量表示,即形成了7*n维向量;
S6、预测浓度:将离散化后的数据构建成向量,当把所有训练数据全部构建完成后,根据这些数据在空间的分布情况,利用KNN算法,通过调整k值达到最优预测效果,完成建模;采用KNN算法预测浓度的步骤具体为:
S601、将训练样本形式化为特征空间中的加权特征向量,X=(x1,x2,x3……xi表示样本x的第i个特征的值;
S602、确定K值,通过交叉验证,取测试准确率最高的值作为K的取值;确定K取值的步骤为:
1)计算测试实例到所有训练集实例的距离;
2)所有的距离进行排序,找到k个最近的邻居;
3)k个邻近值对应的结果进行合并,再排序,返回出现次数最多的那个结果;
4)对每一个k,使用验证集计算,记录k对应的准确数目,取准确率最大的k值。
S603、采用余弦相似性作为距离度量算法计算两个样本之间的相似度;所述采用余弦相似性作为距离度量算法计算两个样本之间的相似度,具体为:余弦相似度是利用两个向量之间的夹角的余弦值来衡量两个向量之间的余弦相似度;两个向量越相似夹角越小,余弦值越接近1。
在n维空间中,对于向量A=(a1,a2,...an),B=(b1,b2,...,bn),
其余弦值为:在本实施例中,n=7;
S604、利用相似度对浓度进行预测。
S7、匹配成因:针对异常预警数据,继续使用KNN算法对新样本进行匹配成因以及结合专家知识库给出建议方案。
其中,使用KNN算法对新样本进行匹配成因的步骤为:
在以上预测浓度的基础上,进行以下步骤:
S701、按照类别权重大小成因进行归类,归类方式通过其中,N为KNN算法中的k的取值,αi相似度,xi为对应向量。
S702、判断出预警的原因(上一步成因归类最大的值,如相近取前三个),并根据专家知识库制定浓度异常建议措施。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种室内PM2.5浓度预估方法,其特征在于,包括如下步骤:
(1)通过大数据平台获取室外空气质量基础数据;
(2)对所获取的空气质量基础数据进行数据处理后获得标准数据;
(3)通过Apriori算法实现关联因子分析;
(4)建立专家知识库;
(5)构建浓度向量:分别对不同检测物质浓度下正常及异常值在7个因子上进行离散化,利用熵计算离散化后的模型因子之间的分布,得到各因子的7个合理的阈值区间,使这7个因子在该阈值区间上有最大的信息量表示,即形成了7*n维向量;
(6)预测浓度:将离散化后的数据构建成向量,当把所有训练数据全部构建完成后,根据这些数据在空间的分布情况,利用KNN算法,通过调整k值达到最优预测效果,完成建模;
(7)匹配成因:针对异常预警数据,继续使用KNN算法对新样本进行匹配成因以及结合专家知识库给出建议方案。
2.根据权利要求1所述的方法,其特征在于,所述步骤(2)获得标准数据的步骤为:
1)对数据进行处理,清洗操作,主要包括对数据不一致进行纠正,对数据噪音、数据局外音进行消除或识别,对部分遗失缺损的数据进行补充;
2)数据转换:将数据转换成便于数据挖掘的格式;
3)数据规约:在大数据平台上,利用大数据平台的数据处理能力从特征中删除不重要或者不相干的特征,对数据进行再一次检查,确保完整性及正确性。
3.根据权利要求1所述的方法,其特征在于,所述通过Apriori算法实现关联因子分析具体为:
1)对关联因子进行筛选分析判断;
2)使用Apriori算法进行关联因子分析;
3)根据分析结果进行处理,去除关联性低的因子,保留关联性较高的因子,分别为:室外浓度、缝隙高度、缝隙深度、缝隙两侧压差、缝隙形状、缝隙直角数、气密性等级。
4.根据权利要求1所述的方法,其特征在于,所述步骤(4)建立专家知识库具体为:
1)根据所获得的关联因子,将训练样本形成7维向量;
2)收集报警浓度的判定方案及决策意见,进行最终的数据治理、数据筛选、计算,形成初代版本的专家库。
5.根据权利要求1所述的方法,其特征在于,所述步骤(6)中采用KNN算法预测浓度的步骤具体为:
1)将训练样本形式化为特征空间中的加权特征向量,X=(x1,x2,x3……x7)xi表示样本x的第i个特征的值;
2)确定K值,通过交叉验证,取测试准确率最高的值作为K的取值;
3)采用余弦相似性作为距离度量算法计算两个样本之间的相似度;
4)利用相似度对浓度进行预测。
6.根据权利要求5所述的方法,其特征在于,所述步骤(6)中确定K取值的步骤为:
1)计算测试实例到所有训练集实例的距离;
2)所有的距离进行排序,找到k个最近的邻居;
3)k个邻近值对应的结果进行合并,再排序,返回出现次数最多的那个结果;
4)对每一个k,使用验证集计算,记录k对应的准确数目,取准确率最大的k值。
7.根据权利要求1所述的方法,其特征在于,所述步骤(7)中使用KNN算法对新样本进行匹配成因的步骤为:
1)按照类别权重大小成因进行归类,归类方式通过其中n为KNN算法中的k的取值,αi为相似度,xi为对应向量;
2)判断出预警的原因,并根据专家知识库制定浓度异常建议措施。
CN201811655319.2A 2018-12-29 2018-12-29 一种室内pm2.5浓度预估方法 Active CN109784553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811655319.2A CN109784553B (zh) 2018-12-29 2018-12-29 一种室内pm2.5浓度预估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811655319.2A CN109784553B (zh) 2018-12-29 2018-12-29 一种室内pm2.5浓度预估方法

Publications (2)

Publication Number Publication Date
CN109784553A true CN109784553A (zh) 2019-05-21
CN109784553B CN109784553B (zh) 2022-12-02

Family

ID=66499128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811655319.2A Active CN109784553B (zh) 2018-12-29 2018-12-29 一种室内pm2.5浓度预估方法

Country Status (1)

Country Link
CN (1) CN109784553B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114239943A (zh) * 2021-12-09 2022-03-25 中国建筑科学研究院天津分院 一种气溶胶浓度预测方法
CN114323151A (zh) * 2021-12-31 2022-04-12 青岛科创信达科技有限公司 基于环境数据的鸡舍环境舒适度预测方法、装置、产品及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090079977A1 (en) * 2007-08-13 2009-03-26 C8 Medisensors Inc. Calibrated Analyte Concentration Measurements in Mixtures
CN104008278A (zh) * 2014-05-14 2014-08-27 昆明理工大学 一种基于特征向量和最小二乘支持向量机的pm25浓度预测方法
WO2016129715A1 (ko) * 2015-02-10 2016-08-18 주식회사 주빅스 환경 재난, 재해 조기감지를 위한 대기질 예측 및 관리 시스템
CN108399470A (zh) * 2018-02-09 2018-08-14 苏州科技大学 一种基于多示例遗传神经网络的室内pm2.5预测方法
CN108629980A (zh) * 2018-06-27 2018-10-09 石家庄铁道大学 一种通过控制交通流量改善空气质量的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090079977A1 (en) * 2007-08-13 2009-03-26 C8 Medisensors Inc. Calibrated Analyte Concentration Measurements in Mixtures
CN104008278A (zh) * 2014-05-14 2014-08-27 昆明理工大学 一种基于特征向量和最小二乘支持向量机的pm25浓度预测方法
WO2016129715A1 (ko) * 2015-02-10 2016-08-18 주식회사 주빅스 환경 재난, 재해 조기감지를 위한 대기질 예측 및 관리 시스템
CN108399470A (zh) * 2018-02-09 2018-08-14 苏州科技大学 一种基于多示例遗传神经网络的室内pm2.5预测方法
CN108629980A (zh) * 2018-06-27 2018-10-09 石家庄铁道大学 一种通过控制交通流量改善空气质量的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
化虎蝶等: "基于贝叶斯网络的大连市空气质量预测与诊断", 《安全与环境工程》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114239943A (zh) * 2021-12-09 2022-03-25 中国建筑科学研究院天津分院 一种气溶胶浓度预测方法
CN114323151A (zh) * 2021-12-31 2022-04-12 青岛科创信达科技有限公司 基于环境数据的鸡舍环境舒适度预测方法、装置、产品及存储介质

Also Published As

Publication number Publication date
CN109784553B (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
CN106599571B (zh) 兼顾流量和蒸发的流域水文模型分期率定方法
KR101771053B1 (ko) 실시간 통합 실내 공기질 알림지수 결정 방법 및 장치
CN110555617A (zh) 一种基于物联网的建筑火灾风险实时动态定量评估方法
Zilko et al. Copula in a multivariate mixed discrete–continuous model
Li et al. An inverse approach to solving zone air infiltration rate and people count using indoor environmental sensor data
CN112966856A (zh) 一种山洪风险预测方法及预测系统
Ham et al. Three-dimensional thermography-based method for cost-benefit analysis of energy efficiency building envelope retrofits
CN110503348B (zh) 一种基于位置匹配的个体空气污染暴露模拟测量方法
Aggarwal et al. Hygrothermal performance assessment of wood frame walls under historical and future climates using partial least squares regression
CN114897228A (zh) 一种基于人口分布和道路网络的公共设施布局检验方法
Rastogi et al. An IoT-based discrete time Markov chain model for analysis and prediction of indoor air quality index
CN109784553A (zh) 一种室内pm2.5浓度预估方法
CN101650359A (zh) 一种基于知识融合机器学习算法的煤热值软测量方法
CN117272092A (zh) 基于亚热带地区健康城市评价结果的城市优化建设方法
CN109612057B (zh) 室内pm2.5预警控制方法、装置及计算机可读存储介质
Wolniewicz et al. Verifying Traffic Noise Analysis Calculation Models.
Hult et al. Blower-door techniques for measuring interzonal leakage
TWI744299B (zh) 不動產估價用途的交易標的價格估算方法
CN109654559A (zh) 一种能识别水汽与油烟的健康烹饪系统
Mishalani et al. Evaluating impact of pavement condition sampling advances on life-cycle management
CN113378398A (zh) 一种基于电能表的健康度分析方法、系统及存储介质
CN118379175B (zh) 一种顾及动态交互作用的城市健康韧性时空特征建模方法
CN115730803B (zh) 一种基于人工智能的建筑房屋维护进度智能监测管理方法
Lowell Effects of adjacent stand characteristics and boundary distance on density and volume of mapped land units in the boreal forest
Fattahi et al. Students’ behaviour analysis based on correlating thermal comfort and spatial simulations; case study of a schoolyard in Shiraz City

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant