CN116499938A - 一种职业工作场所气溶胶悬浮物智能监测方法 - Google Patents

一种职业工作场所气溶胶悬浮物智能监测方法 Download PDF

Info

Publication number
CN116499938A
CN116499938A CN202310780569.3A CN202310780569A CN116499938A CN 116499938 A CN116499938 A CN 116499938A CN 202310780569 A CN202310780569 A CN 202310780569A CN 116499938 A CN116499938 A CN 116499938A
Authority
CN
China
Prior art keywords
acquisition
data
sampling point
dimension
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310780569.3A
Other languages
English (en)
Other versions
CN116499938B (zh
Inventor
杨雪莹
郝培
蔚景霖
曾强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN CENTER FOR DISEASE CONTROL AND PREVENTION
Original Assignee
TIANJIN CENTER FOR DISEASE CONTROL AND PREVENTION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN CENTER FOR DISEASE CONTROL AND PREVENTION filed Critical TIANJIN CENTER FOR DISEASE CONTROL AND PREVENTION
Priority to CN202310780569.3A priority Critical patent/CN116499938B/zh
Publication of CN116499938A publication Critical patent/CN116499938A/zh
Application granted granted Critical
Publication of CN116499938B publication Critical patent/CN116499938B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N2015/0096Investigating consistence of powders, dustability, dustiness
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Dispersion Chemistry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Sampling And Sample Adjustment (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明涉及物理化学分析技术领域,提出了一种职业工作场所气溶胶悬浮物智能监测方法,包括:获取采样点的采集数据、若干采集矩阵以及粉尘浓度,获取尘源偏移度以及浓度因素间隔,由此得到场所域相似度;根据场所域相似度得到马尔科夫转移矩阵并聚类,得到每一类的决策纠正比;随机抽取样本集构建决策树,将采集数据分为若干维度数据,得到每个决策树每个维度的浓度信息增益;获取决策树的初始预测值,对初始预测值进行修正得到粉尘浓度预测值;根据粉尘浓度预测值对气溶胶浓度进行监测判断。本发明针对随机森林中的每棵决策树更加准确地选择特征,提高后续神经网络模型的监测精度。

Description

一种职业工作场所气溶胶悬浮物智能监测方法
技术领域
本发明涉及物理化学分析技术领域,具体涉及一种职业工作场所气溶胶悬浮物智能监测方法。
背景技术
在一定条件下,外来化学物质以较小剂量即可引起机体的功能或器质性损害,甚至危及生命,此种化学物质称为毒物。劳动者在生产过程中由于接触毒物所发生的中毒称为职业中毒。在生产环境中的毒物常以固体、液体、气体、或者气溶胶的形式存在,其中气溶胶类的毒物是职业工作场所中最常见,接触最多的有害物质,气溶胶主要是指粉尘、烟、雾等气溶胶类有害物质。
在职业工作场所中,烟和雾通常是职员机体可以看到或感触到的有害物质,在多数场所中可以人为主观避免,然而粉尘是能较长时间悬浮在空气中的固体微粒,其大小在0.1左右,且不具有明显的外观特征,因此粉尘浓度的监测是职业工作场所气溶胶监测的关键环节。现阶段对职业工作场所中气溶胶浓度的检测方法包括滤膜称重法、直读法等,滤膜称重法存在操作繁琐、噪声干扰严重、检测结果延时长的问题,不适用在职业工作场所中气溶胶浓度的实时监测;直读法借助光学粒子计数器OPC或激光粒子计数器LPC实现,但是每个粒子的检测角度、粒子直径以及折射率都存在比较复杂的关系,很难消除这些复杂关系对测量结果的影响。
发明内容
本发明提供一种职业工作场所气溶胶悬浮物智能监测方法,以解决噪声干扰严重、检测结果延时长的问题,所采用的技术方案具体如下:
本发明一个实施例提供了一种职业工作场所气溶胶悬浮物智能监测方法,该方法包括以下步骤:
获取采样点的采集数据及若干采集矩阵;
获取每个采样点对应的粉尘浓度,将粉尘浓度最大的采样点记为中心采样点,根据任意两个采样点与中心采样点的距离之差得到尘源偏移度;将每个采样点在相同周期下不同高度采集矩阵同一列的元素作差得到垂直间隔序列,获得每个时刻的时间间隔序列;根据任意两个采样点的垂直间隔序列和时间间隔序列得到任意两个采样点的浓度因素间隔;根据任意两个采样点的尘源偏移度和浓度因素间隔得到场所域相似度;
将采样点作为无向图的节点,场所域相似度作为节点连线的权重,利用马尔科夫聚类算法将所有采样点划分为不同的聚类簇中,并根据每个聚类簇的场所域相似度连线得到的马尔科夫转移矩阵,得到若干状态;在每个状态中,根据每个采样点的粉尘浓度获得每个状态的决策纠正比;
在所有采集数据中随机抽取样本集构建决策树,将采集数据分为若干维度数据,得到每个维度数据的平均影响值以及信息增益,根据抽取样本集平均影响值、信息增益得到每个决策树每个维度的浓度信息增益;
将浓度信息增益的最大值为决策树的最优特征,根据决策树的最优特征获取决策树的初始预测值,根据每个采样点的决策纠正比对初始预测值进行修正,若干决策树完成投票得到每个采样点的粉尘浓度预测值;
根据粉尘浓度预测值对气溶胶浓度进行监测判断。
优选的,所述采集矩阵的获取方法为:
对于采集到的N种采集数据;
设置采集周期和采集高度,每个采样点在不同采集周期和采集高度处每时刻获得四种采集数据,将每个采样点在不同采集周期和采集高度得到的采集数据构建采集矩阵,采集矩阵的大小为,采集矩阵中第1行元素为第一种采集数据、第2行元素为第二种采集数据、第3行元素为第三种采集数据、……、第N行元素为第N种采集数据,采集矩阵的每一列元素为每一时刻的N种采集数据。
优选的,所述根据任意两个采样点与中心采样点的距离之差得到尘源偏移度的方法为:
在一个周期内,对于任意一个采样点,计算采样点与中心采样点的欧氏距离,得到所有采样点与中心采样点的欧氏距离,将任意两个采样点与中心采样点的欧氏距离作差,将所有周期内任意两个采样点与中心采样点的欧氏距离的差值的均值作为任意两个采样点的尘源偏移度。
优选的,所述垂直间隔序列的获取方法为:
对于每个采样点在不同采集周期不同高度下得到的采集矩阵,在同一个周期下,每个采样点有若干采集矩阵,将最低高度对应的采集矩阵和第二高高度对应的采集矩阵同一列相同位置元素作差得到的差值序列作为第一垂直序列,将第二高高度对应的采集矩阵和最高高度对应的采集矩阵同一列相同位置元素作差得到的差值序列作为第二垂直序列,依次类推,获得所有垂直间隔序列。
优选的,所述根据任意两个采样点的垂直间隔序列和时间间隔序列得到任意两个采样点的浓度因素间隔的方法为:
式中,表示采样点i在第t个采集周期的第p个时刻得到的第f个垂直间隔序列,/> 表示采样点j在第t个采集周期的第p个时刻得到的第f个垂直间隔序列,/>表示采样点i在第t个采集周期的第a个时刻得到的时间间隔序列,/>表示采样点j在第t个采集周期的第a个时刻得到的时间间隔序列,/>为每个时刻对应的垂直间隔序列的数量,/>为每个采样周期的时刻数量,n为采样周期的数量,/>为dtw距离,/>表示采样点i和采样点j之间的浓度因素间隔。
优选的,所述根据抽取样本集内每个维度的平均影响值、信息增益得到每个决策树每个维度的浓度信息增益的方法为:
式中,G为决策树y的抽取样本集,表示G中的维度b的维度数据的分布方差,是G中所有维度对应的分布方差的均值,/>是维度b的维度数据的平均影响值,/>、/>是G中所有维度中所有维度数据的平均影响值的最大值、最小值,/> 表示G中维度b的维度数据的维度影响系数,/>是G中维度b的维度数据的信息增益,/>为决策树y中维度b的浓度信息增益。
本发明的有益效果是:本发明提出一种职业工作场所气溶胶悬浮物智能监测方法,通过随机森林预测模型以及神经网络模型实现对职业工作场所中不同区域内采样点气溶胶悬浮物浓度的监测。根据职业工作场所中采样点处采集数据的分布特点构建场所域相似度,进而利用场所域相似度构建马尔科夫转移矩阵,其有益效果在于随机抽取数据构建决策树时考虑不同状态内采集数据对粉尘浓度的影响程度不同,能够消除抽取不同采样点采集数据预测粉尘浓度时的误差,消除实际职业场所中不同区域内影响粉尘浓度因素之间的原有差异,提高预测值的精度。其次基于抽取数据集中不同维度采集数据与粉尘浓度的关联程度构建浓度信息增益,浓度信息增益考虑了抽取数据集中不同维度采集数据的分布情况以及采集数据与粉尘浓度之间的关联程度,其有益效果在于避免传统特征选择方法中部分特征被忽略的问题,针对随机森林中的每棵决策树更加准确地选择特征,提高后续神经网络模型的监测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的一种职业工作场所气溶胶悬浮物智能监测方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明第一个实施例提供的一种职业工作场所气溶胶悬浮物智能监测方法流程图,用于室外场景下检测气溶胶,该方法包括以下步骤:
步骤S101,设置若干采样点,采集每个采样点在不同时刻和高度下的采样数据,构建每个采样点的若干采样矩阵。
实施例一以露天煤矿为例,将露天煤矿中的工作场所作为职业工作场所,为了采集工作场所中的多维度数据,分别利用检测仪器采集露天煤矿的粉尘浓度以及温度、湿度、风力以及气压4种环境因素,例如使用诺方SDL-307室外空气检测仪采集粉尘浓度,使用华控温湿度传感器采集温度、湿度数据,使用华控HSTL-FS01风速仪采集风力数据,使用大气压力传感器采集气压。根据露天煤矿中不同工作内容分别选择N个不同位置的采集点,其中每个采样点检测一个粉尘浓度,在每个采集点离地面高度、/>、/>处安置上述检测仪器,由于在露天煤矿采集需要驾驶重型设备,因此高度要较高,同时为了保证人类能够呼吸到的高度进行检测,本实施例中数据采集周期设置为1天,连续采集15天的数据,本实施例以N取50,/>、/>、/>分别取1.5米、2.5米、3.5米来进行叙述,不同的实施例可以根据环境设置不同的取值,本实施例不进行限定。
为了避免网络传输、采集环境等因素造成的数据缺失、数据遗漏等问题,提高采集数据质量,需要对采集数据进行处理。本实施例中采用均值填充法对采集数据进行处理,均值填充法为公知技术,具体过程不再赘述。进一步的,为了消除不同维度数据之间的量纲影响,利用z-score标准化的方法对均值填充处理后的采集数据进行处理统一量纲,z-score标准化为公知技术,具体过程不再赘述,其中采样数据指采集的温度、湿度、气压、风力数据的统称。
对于每个采样点在每个采集周期在每个高度上构建一个采集矩阵,矩阵的维度为,矩阵中第1行元素为温度数据、第2行元素为湿度数据、第3行元素为风力数据、第4行元素为气压数据,矩阵如下:
其中,表示采样点i在第t个采集周期在高度/>下的采集矩阵,/>表示第α个温度数据在高度/>下的值,/>表示第α个湿度数据在高度/>下的值,表示第α个风力数据在高度/>下的值,/>表示第α个气压数据在高度/>下的值。
至此,获得了每个采样点在不同采集周期不同高度下的采集矩阵。
步骤S102,根据任意两个采样点的距离和序列距离得到尘源偏移度和浓度因素间隔,并得到场所域相似度,根据场所域相似度得到马尔科夫转移矩阵,得到每个状态的决策纠正比。
在煤矿中不同位置的粉尘浓度可以直接通过粉尘浓度检测仪得到,但是由于不同位置处粉尘浓度的影响因素不同,因此需要对粉尘浓度进行修正。在本实施例中,每个采样点的采集数据包括温度数据、湿度数据、风力数据、气压数据以及高度,随机森林算法基于采样点的采集数据对每个采样点的粉尘浓度进行预测时,需要构建多颗决策树,在每颗决策树的构建过程中,传统的特征选择方法一般是一次性地将所有特征都考虑到,但是在职业工作场所中不同采样点的工作内容是不同的,例如在煤矿中存在爆破区域、运输区域、开采区域等,不同区域内采样点的采集数据对粉尘浓度的影响关系也是不同的。因此本实施例先根据不同采样点位置不同造成的差异将采样点分类,然后在每一类中选择出最优的特征。
职员或员工在煤矿中不同位置进行的具体工作不同,距离产生粉尘的粉尘源的距离不同,那么场所中不同区域内粉尘浓度存在差异,即每个采样点的采集数据由于位置不同会存在一定的差异。如果利用职业场所中位置差异较大采样数据预测某个采样点的粉尘浓度时会产生一定的误差,因此在预测粉尘浓度之前先对不同采样点的采集数据进行位置变换估计,评估采样数据从当前采样点位置到其余采样点时由位置变换造成的数据误差。
当环境因素的对粉尘浓度的影响相似时,每个采样点采集数据的波动趋势应当是相似的,例如在一个气温基本不变风和日丽的时间获取的不同采样点的采集数据,此时风力、温度、湿度、气压较为接近,不同位置采样点的采集数据之间的大小关系应该是只与高度成正比的。例如,对于采样点i,当其周围环境因素稳定时,在不同时刻采集数据之间的差异是比较接近的,采集数据大小只会受到高度的影响,例如,采样点i高处的粉尘浓度大于低处,且随着粉尘颗粒的下沉,高处到低处呈现递减浓度序列,因此将不同高度的数据序列作差结果应当是在一个微小范围内波动的,如果两个采样点数据序列作差结果波动程度一致,那么认为这两个采样点在职业场所中的采集数据在进行位置变换时造成的数据误差可以忽略,不会对预测值产生额外影响。
获得每个采样周期中采样点的粉尘浓度最大的采样点,获得每个采样周期内浓度测量根据两个采样点在不同时间周期的采样距离得到两个采样点的尘源偏移度,公式如下:
式中,为第t个采样周期中采样点i与粉尘浓度最大的采样点z的欧氏距离,为第t个采样周期中采样点j与粉尘浓度最大的采样点z的欧氏距离,n为采样周期的数量,在本实施例中取n为15,/>为采样点i与采样点j的尘源偏移度。采样点i和采样点j所在区域距离职业工作场所中粉尘源的距离大小越相似,/>的值越小,即/>的值越小,两个采样点所在区域距离粉尘源越远,影响粉尘浓度变化的因素越相似。
对于每个采样点在相同周期下,将不同高度对应的采集矩阵的同一列的所有元素对应作差得到的序列记为垂直间隔序列,将采样点i在第t个采样周期的p时刻下对应的第f个垂直间隔序列记为,当f=1时,垂直间隔序列为采集矩阵/>中第p列元素与采集矩阵/>中第p列相同位置元素之间的作差结果;当f=2时,垂直间隔序列为采集矩阵中第p列元素与采集矩阵/>中第p列相同位置元素之间的作差结果;当f=3时,垂直间隔序列为采集矩阵/>中第p列元素与采集矩阵/>中第p列相同位置元素之间的作差结果。对于一个采样点在同一时刻下不同高度得到不同的温度数据、湿度数据、风力数据和气压数据构成一个序列,序列的前四位为最高高度对应的四个数据,后四位为最低高度对应的四个数据,记该序列为数据序列,将每一个时刻的数据序列与后一个时刻的数据序列作差得到每个时刻的时间间隔序列。
根据两个采样点的所有垂直间隔序列的dtw距离以及两个采样点的时间间隔序列的dtw距离得到两个采样点的浓度因素间隔,公式如下:
式中,表示采样点i在第t个采集周期的第p个时刻得到的第f个垂直间隔序列,/> 表示采样点j在第t个采集周期的第p个时刻得到的第f个垂直间隔序列,/>表示采样点i在第t个采集周期的第a个时刻得到的时间间隔序列,/>表示采样点j在第t个采集周期的第a个时刻得到的时间间隔序列,/>为每个时刻对应的垂直间隔序列的数量,/>为每个采样周期的时刻数量,n为采样周期的数量,/>表示采样点i和采样点j之间的浓度因素间隔。采样点i与采样点j相同高度处的粉尘浓度受高度差影响变化越相似,/>越小,采样点i与采样点j所在区域内采集数据之间随时间变化的趋势越相似,时序间隔序列/> />之间的差异越小,即/>越小,/>越小。
根据两个采样点的尘源偏移度和浓度因素间隔得到场所域相似度,公式如下:
式中,表示采样点i和采样点j的浓度因素间隔,/>表示采样点i和采样点j的尘源偏移度,/>表示采样点i和采样点j的场所域相似度。场所域相似度/>的值越大,采样点i、j所在区域内采集数据对粉尘浓度的影响越相似,利用采样点i处的采集数据预测采样点j处粉尘浓度的误差越小。
对于所有的采样点,计算任意两个不相同的采样点之间的场所域相似度,将每个采样点作为无向图的节点,任意两个采样点之间的场所域相似度作为两个节点连线的权重,利用马尔科夫聚类算法将N个采样点划分到不同聚类簇中,将聚类簇的数量记为K,即N个采样点划分到K个聚类簇中,马尔科夫聚类算法为公知技术,具体过程不再赘述。其次将每一个聚类簇作为一个状态,认为每个聚类簇中采样点的采集数据对粉尘浓度的影响是具有较高相似性的,即簇内采样点所在区域中的粉尘状态较为相似,对于K个聚类簇得到一个大小为的马尔科夫转移矩阵,其中K个聚类簇表示K个状态,马尔科夫转移矩阵为公知技术,具体过程不再赘述。
获取不同状态下的各采样点对应的粉尘浓度的概率分布,概率分布为公知技术,具体过程不再赘述,其次基于马尔科夫转移矩阵得到下一时刻不同状态下粉尘浓度的概率分布,并基于不同状态中采样点的采集数据进行后续粉尘浓度的预测时的误差在随机森林中构建决策树时根据抽取数据所在状态对决策树的预测值进行修正。利用场所域相似度构建马尔科夫转移矩阵,其有益效果在于随机抽取数据构建决策树时考虑不同类型采样点中采集数据对粉尘浓度的影响程度不同,能够消除抽取不同采样点采集数据预测粉尘浓度时的误差,消除实际职业场所中不同区域内影响粉尘浓度因素之间的差异,提高预测值的精度。
此时根据粉尘浓度的最大值和最小值构建决策纠正比,公式如下:
式中,是状态k的决策纠正比,/>、/>分别是状态k中所有采样点对应粉尘浓度的最大值、最小值。
至此,得到不同类采样点采集数据对应的决策修正值即决策纠正比。
步骤S103,获得抽取样本集,根据抽取样本集得到每个决策树每个维度的浓度信息增益,根据抽取样本集以及浓度信息增益最大值对应的维度得到修正预测值,根据随机森林投票得到粉尘浓度预测值。
随机森林算法主要是基于袋外数据集的重要性排名选择特征,其中袋外数据集简单来说是没有被采样的数据构成的数据集,为现有概念,这种构建方式对于煤矿中采样点的多维采集数据而言会存在一些问题,例如:对于相关性强的环境因素数据,它们的重要性可能会被高估,一些有用的特征可能被忽略。因此在每次抽取采集数据构建决策树时,除了需要考虑采集数据对应的决策修正值外,还需要考虑针对每棵决策树的抽取数据不同,最优特征的选择也应当根据抽取数据特点自适应获取。
每个采样点的采集数据对粉尘浓度的影响具有一定的相似性,例如采样点相同高度处的温度越低,粉尘浓度越小;相同高度处风速越小,粉尘浓度越高;相同高度处的湿度越高,粉尘浓度越大;在一定范围内随着气压升高,粉尘浓度逐渐上升,而采集数据的高度升高,气压减小,气温下降、湿度减小。即温度、风速、高度三个维度的数据对粉尘浓度的影响关系较为相似,湿度、一定范围内气压对粉尘浓度的影响关系较为相似,因此选择决策树的最优特征时应当考虑抽取数据中采集数据对粉尘浓度的影响关系,从风力、温度、湿度、气压中选择合适的特征。除此之外,每棵决策树的分类能力越强,随机森林预测值的错误率越低,因此如果某个数据特征能够作为决策树的最优特征,那么该特征对抽取数据的分类能力优于其它特征对抽取数据的分类能力,将每个采集数据中包含的温度数据、湿度数据、风力数据、气压数据分别作为一个维度数据,每个维度包含若干维度数据,决策树为现有算法,每次随机得到一个样本集,在此不做赘述。
基于上述分析,通过平均影响值法MIV得到每个维度数据平均影响值,此处构建浓度信息增益V,用于表征不同聚类簇中采样点采集数据中每个维度数据对决策树分类结果的影响程度,计算决策树y中维度b的浓度信息增益
式中,G为决策树y的抽取样本集,表示G中的维度b的维度数据的分布方差,是G中所有维度对应的分布方差的均值,/>是维度b的维度数据的平均影响值,/>、/>是G中所有维度中所有维度数据的平均影响值的最大值、最小值,/> 表示G中维度b的维度数据的维度影响系数,/>是G中维度b的维度数据的信息增益,/>为决策树y中维度b的浓度信息增益。
的值越大,维度b对应的采集数据对决策树y分类结果的影响程度越大,信息增益的获取过程为:本实施例中将抽取样本集G以及维度b作为信息增益算法的输入,则信息增益算法的输出是维度b的信息增益,信息增益算法为公知技术,具体过程不再赘述。
浓度信息增益反映了构建决策树时不同维度采集数据对决策树分类结果的影响程度。抽取样本集G中维度b的维度数据分布越零散,即的值越大,维度b的维度数据与粉尘浓度的关联越密切,维度b对应维度数据大小的轻微变化对应粉尘浓度将会产生明显变化,即/>的值越大,维度b对应维度数据对粉尘浓度预测值的影响越大,基于维度b构建的决策树y的分类能力越强,即/>的值越大,维度b的选择性越好,决策树y的抽取数据的分类能力越强。浓度信息增益考虑了抽取数据集中不同维度采集数据的分布情况以及采集数据与粉尘浓度之间的关联程度,其有益效果在于避免传统特征选择方法中特征被忽略的问题,针对每棵决策树更加准确地选择特征。
获取决策树y的抽取数据中每个维度的浓度信息增益,将浓度信息增益按照从大到小的顺序排序,将浓度信息增益最大值对应的维度作为决策树y的最优特征。根据抽取数据集G对应的采样点状态,利用决策修正值对决策树y的分类结果进行修正。例如随机森林预测的是第i个采样点的粉尘浓度,采样点i属于第k种状态,那么需要根据抽取数据集G中样本对应状态与第k种状态之间的决策修正值对决策树y的分类结果进行修正,得到决策树y的修正预测值。计算决策树y的修正预测值,公式如下:
式中,是决策树y的修正预测值,/>是决策树y的初始预测值,/>是抽取样本集G预测状态k内采样点粉尘浓度时的决策修正比。
分别获取随机森林中每棵决策树的修正预测值,根据每个分类结果对应的决策树数量,随机森林根据决策树的投票选择决定最后的预测结果。随机森林算法中的决策树投票为公知技术,具体过程不再赘述。
至此,得到每个采样点对应的粉尘浓度预测值。
步骤S104,根据粉尘浓度预测值完成气溶胶悬浮物监测。
将采样点对应的粉尘浓度预测值作为实际粉尘浓度,将实际粉尘浓度作为每个采样点的气溶胶监测浓度,其次对比气溶胶监测浓度与无危害气溶胶浓度的大小,如果气溶胶监测浓度大于无危害气溶胶浓度,认为对应职业工作场所区域内的气溶胶浓度超标,通知职员或者工人撤离,进行粉尘清除措施,避免职员或者工人机体受到危害。
本发明第二个实施例提供的一种职业工作场所气溶胶悬浮物智能监测方法,用于室内场景下检测气溶胶,该方法包括以下步骤:
步骤S201,设置若干采样点,采集每个采样点在不同时刻和高度下的采样数据,构建每个采样点的若干采样矩阵。
实施例2以室内焊接工厂为例,在室内焊接时,不同高度的焊接点使用的电流不同会造成不同的粉尘,不同的高度烟尘颗粒大小也不相同,因此使用传感器采集焊接工厂的粉尘浓度以及温度、湿度、电流、颗粒大小等四种环境因素, 根据焊接工厂中不同工作内容分别选择N个不同位置的采集点,由于室内空间较小,N的取值相较于室外要更小一些,在每个采集点离地面高度、/>、/>处安置上述检测仪器,在室内高度较低,本实施例以N取30,、/>、/>分别取0.5米、1米、1.5米来进行叙述,不同的实施例可以根据环境设置不同的取值,本实施例不进行限定,本实施例中数据采集周期设置为1天,连续采集15天的数据。
本实施例中采用均值填充法对采集数据进行处理,均值填充法为公知技术,具体过程不再赘述。进一步的,为了消除不同维度数据之间的量纲影响,利用z-score标准化的方法对均值填充处理后的采集数据进行处理统一量纲,z-score标准化为公知技术,具体过程不再赘述,其中采样数据指采集的温度、湿度、电流、颗粒大小的统称。
对于每个采样点在每个采集周期在每个高度上构建一个采集矩阵,矩阵的维度为,矩阵中第1行元素为温度数据、第2行元素为湿度数据、第3行元素为电流数据、第4行元素为颗粒大小数据。
至此,获得了每个采样点在不同采集周期不同高度下的采集矩阵。
步骤S202,根据任意两个采样点的距离和序列距离得到尘源偏移度和浓度因素间隔,并得到场所域相似度,根据场所域相似度得到马尔科夫转移矩阵,得到每个状态的决策纠正比。
获得每个采样周期中采样点的粉尘浓度最大的采样点,获得每个采样周期内浓度测量根据两个采样点在不同时间周期的采样距离得到两个采样点的尘源偏移度,根据任意两个采样点到粉尘浓度最大的采样点的欧式距离在不同采样周期的均值记为两个采样点的尘缘偏离度。
对于每个采样点在相同周期下,将不同高度对应的采集矩阵的同一列的所有元素对应作差得到的序列记为垂直间隔序列,将采样点i在第t个采样周期的p时刻下对应的第f个垂直间隔序列记为,当f=1时,垂直间隔序列为采集矩阵/>中第p列元素与采集矩阵/>中第p列相同位置元素之间的作差结果;当f=2时,垂直间隔序列为采集矩阵中第p列元素与采集矩阵/>中第p列相同位置元素之间的作差结果;当f=3时,垂直间隔序列为采集矩阵/>中第p列元素与采集矩阵/>中第p列相同位置元素之间的作差结果。
对于一个采样点在同一时刻下不同高度得到不同的温度数据、湿度数据、电流数据和颗粒大小数据构成一个序列,序列的前四位为最高高度对应的四个数据,后四位为最低高度对应的四个数据,记该序列为数据序列,将每一个时刻的数据序列与后一个时刻的数据序列作差得到每个时刻的时间间隔序列。
在同一采集周期下,得到每个时刻的任意两个采样点的dtw距离,得到采集周期下所有时刻任意两个采样点的dtw距离的均值,在同一采集周期下,获得每个时刻的若干垂直间隔序列,任意两个采样点的相同时刻相同等级的垂直间隔序列得到dtw距离,得到采集周期下所有时刻任意两个采样点的dtw距离的均值,两个均值的和作为两个采样点的浓度因素间隔,根据两个采样点的尘源偏移度和浓度因素间隔得到场所域相似度。
对于所有的采样点,计算任意两个不相同的采样点之间的场所域相似度,将每个采样点作为无向图的节点,任意两个采样点之间的场所域相似度所谓两个节点连线的权重,利用马尔科夫聚类算法将N个采样点划分到不同聚类簇中,将聚类簇的数量记为K,即N个采样点划分到K个聚类簇中,马尔科夫聚类算法为公知技术,具体过程不再赘述。其次将每一个聚类簇作为一个状态,认为每个聚类簇中采样点的采集数据对粉尘浓度的影响是具有较高相似性的,即簇内采样点所在区域中的粉尘状态较为相似,对于K个聚类簇得到一个大小为的马尔科夫转移矩阵,其中K个聚类簇表示K个状态,马尔科夫转移矩阵为公知技术,具体过程不再赘述。
根据每个状态的粉尘浓度的最大值和最小值构建决策纠正比。
步骤S203,获得抽取样本集,根据抽取样本集得到每个决策树每个维度的浓度信息增益,根据抽取样本集以及浓度信息增益最大值对应的维度得到修正预测值,根据随机森林投票得到粉尘浓度预测值。
在所有采集数据中随机抽取部分数据作为抽取样本集G,将所有采集数据中包含的温度数据、湿度数据、电流数据、颗粒大小数据分别作为一个维度数据,每个维度包含若干维度数据。通过平均影响值法MIV得到每个维度数据平均影响值,在一个抽取样本集内,根据每个维度的分布方差和分布方差的均值以及平均影响值得到维度影响系数,本实施例中将抽取样本集G以及维度b作为信息增益算法的输入,则信息增益算法的输出是维度b的信息增益,信息增益算法为公知技术,具体过程不再赘述,根据维度影响系数和维度数据的信息增益得到每个维度的浓度信息增益,每个抽取样本集G可以构建一颗决策树y。
获取决策树y的抽取数据中每个维度的浓度信息增益,将浓度信息增益按照从大到小的顺序排序,将浓度信息增益最大值对应的维度作为决策树y的最优特征。根据抽取数据集G对应的采样点状态,利用决策修正值对决策树y的分类结果进行修正,对于每隔决策树y和其最优特征得到每个决策树的最优预测值,每个采样点对应一个状态,根据该状态对应的决策修正比和初始预测值得到每个决策树的修正预测值。
获取随机森林中所有决策树的修正预测值,根据每个分类结果对应的决策树数量,随机森林根据决策树的投票选择决定最后的预测结果。随机森林算法中的决策树投票为公知技术,具体过程不再赘述。
至此,得到每个采样点对应的粉尘浓度预测值。
步骤S204,根据粉尘浓度预测值完成气溶胶悬浮物监测。
将采样点对应的粉尘浓度预测值作为实际粉尘浓度,将实际粉尘浓度作为每个采样点的气溶胶监测浓度,其次对比气溶胶监测浓度与无危害气溶胶浓度的大小,如果气溶胶监测浓度大于无危害气溶胶浓度,认为对应职业工作场所区域内的气溶胶浓度超标,通知职员或者工人撤离,进行粉尘清除措施,避免职员或者工人机体受到危害。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种职业工作场所气溶胶悬浮物智能监测方法,其特征在于,该方法包括以下步骤:
获取采样点的采集数据及若干采集矩阵;
获取每个采样点对应的粉尘浓度,将粉尘浓度最大的采样点记为中心采样点,根据任意两个采样点与中心采样点的距离之差得到尘源偏移度;将每个采样点在相同周期下不同高度采集矩阵同一列的元素作差得到垂直间隔序列,获得每个时刻的时间间隔序列;根据任意两个采样点的垂直间隔序列和时间间隔序列得到任意两个采样点的浓度因素间隔;根据任意两个采样点的尘源偏移度和浓度因素间隔得到场所域相似度;
将采样点作为无向图的节点,场所域相似度作为节点连线的权重,利用马尔科夫聚类算法将所有采样点划分为不同的聚类簇中,并根据每个聚类簇的场所域相似度连线得到的马尔科夫转移矩阵,得到若干状态;在每个状态中,根据每个采样点的粉尘浓度获得每个状态的决策纠正比;
在所有采集数据中随机抽取样本集构建决策树,将采集数据分为若干维度数据,得到每个维度数据的平均影响值以及信息增益,根据抽取样本集内每个维度的平均影响值、信息增益得到每个决策树每个维度的浓度信息增益;
将浓度信息增益的最大值为决策树的最优特征,根据决策树的最优特征获取决策树的初始预测值,根据每个采样点的决策纠正比对初始预测值进行修正,若干决策树完成投票得到每个采样点的粉尘浓度预测值;
根据粉尘浓度预测值对气溶胶浓度进行监测判断。
2.根据权利要求1所述的一种职业工作场所气溶胶悬浮物智能监测方法,其特征在于,所述采集矩阵的获取方法为:
对于采集到的N种采集数据;
设置采集周期和采集高度,每个采样点在不同采集周期和采集高度处每时刻获得四种采集数据,将每个采样点在不同采集周期和采集高度得到的采集数据构建采集矩阵,采集矩阵的大小为,采集矩阵中第1行元素为第一种采集数据、第2行元素为第二种采集数据、第3行元素为第三种采集数据、……、第N行元素为第N种采集数据,采集矩阵的每一列元素为每一时刻的N种采集数据。
3.根据权利要求1所述的一种职业工作场所气溶胶悬浮物智能监测方法,其特征在于,所述根据任意两个采样点与中心采样点的距离之差得到尘源偏移度的方法为:
在一个周期内,对于任意一个采样点,计算采样点与中心采样点的欧氏距离,得到所有采样点与中心采样点的欧氏距离,将任意两个采样点与中心采样点的欧氏距离作差,将所有周期内任意两个采样点与中心采样点的欧氏距离的差值的均值作为任意两个采样点的尘源偏移度。
4.根据权利要求1所述的一种职业工作场所气溶胶悬浮物智能监测方法,其特征在于,所述垂直间隔序列的获取方法为:
对于每个采样点在不同采集周期不同高度下得到的采集矩阵,在同一个周期下,每个采样点有若干采集矩阵,将最低高度对应的采集矩阵和第二高高度对应的采集矩阵同一列相同位置元素作差得到的差值序列作为第一垂直序列,将第二高高度对应的采集矩阵和最高高度对应的采集矩阵同一列相同位置元素作差得到的差值序列作为第二垂直序列,依次类推,获得所有垂直间隔序列。
5.根据权利要求1所述的一种职业工作场所气溶胶悬浮物智能监测方法,其特征在于,所述根据任意两个采样点的垂直间隔序列和时间间隔序列得到任意两个采样点的浓度因素间隔的方法为:式中,表示采样点i在第t个采集周期的第p个时刻得到的第f个垂直间隔序列,/> 表示采样点j在第t个采集周期的第p个时刻得到的第f个垂直间隔序列,/>表示采样点i在第t个采集周期的第a个时刻得到的时间间隔序列,/>表示采样点j在第t个采集周期的第a个时刻得到的时间间隔序列,/>为每个时刻对应的垂直间隔序列的数量,/>为每个采样周期的时刻数量,n为采样周期的数量,/>为dtw距离,/>表示采样点i和采样点j之间的浓度因素间隔。
6.根据权利要求1所述的一种职业工作场所气溶胶悬浮物智能监测方法,其特征在于,所述根据抽取样本集内每个维度的平均影响值、信息增益得到每个决策树每个维度的浓度信息增益的方法为:
式中,G为决策树y的抽取样本集,/>表示G中的维度b的维度数据的分布方差,/>是G中所有维度对应的分布方差的均值,/>是维度b的维度数据的平均影响值,/>、/>是G中所有维度中所有维度数据的平均影响值的最大值、最小值,/> 表示G中维度b的维度数据的维度影响系数,/>是G中维度b的维度数据的信息增益,/>为决策树y中维度b的浓度信息增益。
CN202310780569.3A 2023-06-29 2023-06-29 一种职业工作场所气溶胶悬浮物智能监测方法 Active CN116499938B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310780569.3A CN116499938B (zh) 2023-06-29 2023-06-29 一种职业工作场所气溶胶悬浮物智能监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310780569.3A CN116499938B (zh) 2023-06-29 2023-06-29 一种职业工作场所气溶胶悬浮物智能监测方法

Publications (2)

Publication Number Publication Date
CN116499938A true CN116499938A (zh) 2023-07-28
CN116499938B CN116499938B (zh) 2023-09-15

Family

ID=87328887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310780569.3A Active CN116499938B (zh) 2023-06-29 2023-06-29 一种职业工作场所气溶胶悬浮物智能监测方法

Country Status (1)

Country Link
CN (1) CN116499938B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116776135A (zh) * 2023-08-24 2023-09-19 之江实验室 一种基于神经网络模型的物理场数据预测方法及装置
CN117196109A (zh) * 2023-09-15 2023-12-08 中煤科工集团重庆研究院有限公司 一种基于多源信息融合的煤矿井下粉尘浓度预测修正方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7480640B1 (en) * 2003-12-16 2009-01-20 Quantum Leap Research, Inc. Automated method and system for generating models from data
US20180018561A1 (en) * 2016-07-14 2018-01-18 King Fahd University Of Petroleum And Minerals Apparatuses, systems, and methodologies for permeability prediction
CN213956923U (zh) * 2020-11-23 2021-08-13 天津市疾病预防控制中心 一种职业卫生采样用采样装置
CN113761814A (zh) * 2021-09-10 2021-12-07 西北工业大学 一种基于有监督学习模型的翼型转捩区域判断方法
CN113988414A (zh) * 2021-10-27 2022-01-28 内蒙古工业大学 一种基于P_LSTNet与加权Markov校验的风电输出功率预测方法
KR20220128105A (ko) * 2021-03-12 2022-09-20 한국과학기술원 미세 먼지 농도 모니터링 방법 및 그 장치
CN116340723A (zh) * 2023-05-22 2023-06-27 安徽中科大国祯信息科技有限责任公司 基于大数据的乡村水污染快速溯源方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7480640B1 (en) * 2003-12-16 2009-01-20 Quantum Leap Research, Inc. Automated method and system for generating models from data
US20180018561A1 (en) * 2016-07-14 2018-01-18 King Fahd University Of Petroleum And Minerals Apparatuses, systems, and methodologies for permeability prediction
CN213956923U (zh) * 2020-11-23 2021-08-13 天津市疾病预防控制中心 一种职业卫生采样用采样装置
KR20220128105A (ko) * 2021-03-12 2022-09-20 한국과학기술원 미세 먼지 농도 모니터링 방법 및 그 장치
CN113761814A (zh) * 2021-09-10 2021-12-07 西北工业大学 一种基于有监督学习模型的翼型转捩区域判断方法
CN113988414A (zh) * 2021-10-27 2022-01-28 内蒙古工业大学 一种基于P_LSTNet与加权Markov校验的风电输出功率预测方法
CN116340723A (zh) * 2023-05-22 2023-06-27 安徽中科大国祯信息科技有限责任公司 基于大数据的乡村水污染快速溯源方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PULFORD, G.W等: "A neural net structure for decision feedback equalisers", 《SECOND AUSTRALIAN CONFERENCE ON NEURAL NETWORKS》, pages 223 - 226 *
丁愫;陈报章;王瑾;陈龙;张晨雷;孙少波;黄丛吾;: "基于决策树的统计预报模型在臭氧浓度时空分布预测中的应用研究", 环境科学学报, no. 08, pages 277 - 290 *
程广超;: "两种粉尘时间加权平均浓度采样方法比较及采样注意事项", 医药论坛杂志, no. 17, pages 31 - 32 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116776135A (zh) * 2023-08-24 2023-09-19 之江实验室 一种基于神经网络模型的物理场数据预测方法及装置
CN116776135B (zh) * 2023-08-24 2023-12-19 之江实验室 一种基于神经网络模型的物理场数据预测方法及装置
CN117196109A (zh) * 2023-09-15 2023-12-08 中煤科工集团重庆研究院有限公司 一种基于多源信息融合的煤矿井下粉尘浓度预测修正方法
CN117196109B (zh) * 2023-09-15 2024-04-05 中煤科工集团重庆研究院有限公司 一种基于多源信息融合的煤矿井下粉尘浓度预测修正方法

Also Published As

Publication number Publication date
CN116499938B (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
CN116499938B (zh) 一种职业工作场所气溶胶悬浮物智能监测方法
CN111650345B (zh) 大气环境污染检测数据的处理方法、装置、设备及介质
CN108614071B (zh) 分布式室外大气质量监测精度校正系统及参数更新方法
CN114022052B (zh) 水质异常监测方法、装置、存储介质及计算机设备
CN116340723B (zh) 基于大数据的乡村水污染快速溯源方法及系统
CN114168906A (zh) 一种基于云计算的测绘地理信息数据采集系统
CN111678880B (zh) 平流层臭氧侵入对流层中低层的卫星遥感识别方法及系统
CN115239209B (zh) 用于垃圾填埋场筛除含重金属腐殖土的方法、设备和系统
CN113836808A (zh) 一种基于重污染特征约束的pm2.5深度学习预测方法
CN112257351A (zh) 一种考虑地形和风向的环境空气质量监测异常值检测方法
CN117538503A (zh) 一种实时智能的土壤污染监测系统及方法
CN113095579B (zh) 一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法
CN117113118B (zh) 一种生物气溶胶用智能监测方法及系统
CN117370813A (zh) 一种基于k线模式匹配算法的大气污染深度学习预测方法
CN116702588A (zh) 一种基于多源数据的风电场关键气象因子预报方法及系统
CN115659195A (zh) 一种大气污染在线识别方法
JPH06117600A (ja) ガス、蒸気等の漏洩地点および漏洩量推定システム
CN113011325B (zh) 一种基于孤立森林算法的堆垛机轨道损伤定位方法
CN114487284A (zh) 一种测量空气中重金属浓度的方法及系统
CN115526330A (zh) 有机物走航数据校准方法、装置、计算机设备和存储介质
CN113836813A (zh) 一种基于数据分析的高炉风口漏水检测方法
CN113610344A (zh) 一种污染预警方法、装置、电子设备及存储介质
CN117688464B (zh) 一种基于多源传感器数据的隐患分析方法及系统
CN117291430B (zh) 一种基于机器视觉的安全生产检测方法及装置
CN116413318B (zh) 一种基于井盖的有毒气体联合检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant