CN117113118B - 一种生物气溶胶用智能监测方法及系统 - Google Patents
一种生物气溶胶用智能监测方法及系统 Download PDFInfo
- Publication number
- CN117113118B CN117113118B CN202311354150.8A CN202311354150A CN117113118B CN 117113118 B CN117113118 B CN 117113118B CN 202311354150 A CN202311354150 A CN 202311354150A CN 117113118 B CN117113118 B CN 117113118B
- Authority
- CN
- China
- Prior art keywords
- data
- monitoring
- cluster
- clustering
- moment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 163
- 238000000034 method Methods 0.000 title claims abstract description 28
- 239000000443 aerosol Substances 0.000 title claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims abstract description 34
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 239000013618 particulate matter Substances 0.000 claims description 58
- 239000002245 particle Substances 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000003908 quality control method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 4
- 238000003672 processing method Methods 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
本发明涉及数据处理领域,具体涉及一种生物气溶胶用智能监测方法及系统,包括:采集生物气溶胶的实时监测数据;获取生物气溶胶的实时监测数据标准化后的监测数据,根据标准化后的监测数据构建监测空间,对标准化后的监测数据进行聚类得到类簇;根据监测数据得到每个数据点的时序聚类权重和分布聚类权重,根据每个数据点的时序聚类权重和分布聚类权重得到每个数据点到聚类中心点的第二聚类距离;根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,根据异常监测参数进行对采集的生物气溶胶监测数据进行监测分析。本发明用数据处理方法对监测数据进行处理,提高了对监测数据监测的准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种生物气溶胶用智能监测方法及系统。
背景技术
生物气溶胶是悬浮在空气中的微小生物颗粒,包括细菌、真菌、病毒等,生物气溶胶的存在可以影响室内空气质量,特别是在目标环境下,不仅可以影响人类健康,还可能对动物和植物造成损害。通过监测生物气溶胶的颗粒数量,可以用于环境监测,并且对部分微生物的存在和分布分析有助于获得生态系统和生物多样性的信息,以及追踪疾病的传播途径和范围,并及时采取措施来控制传染病的传播。
在常规的生物气溶胶的智能监测中使用k-means聚类算法通过获取标准数据类簇的检测空间进行异常监测的,但是由于生物气溶胶在空气中受温度、湿度和风向的影响导致对生物气溶胶监测到的数据使用k-means聚类算法获取到的标准数据类簇的检测空间不准确,因此需要对其进行修正处理。
发明内容
本发明提供一种生物气溶胶用智能监测方法及系统,以解决现有的问题。
本发明的一种生物气溶胶用智能监测方法及系统采用如下技术方案:
本发明一个实施例提供了一种生物气溶胶用智能监测方法,该方法包括以下步骤:
采集生物气溶胶的实时监测数据;
对生物气溶胶的实时监测数据进行标准化获得标准化后的监测数据,根据标准化后的监测数据构建监测空间,对标准化后的监测数据进行聚类得到类簇;
根据实时监测数据和监测空间得到每个数据点的时序聚类权重,根据类簇中的数据和监测空间得到每个数据点在每个类簇中的分布聚类权重,根据每个数据点的时序聚类权重和每个数据点在每个类簇中的分布聚类权重得到每个数据点到聚类中心点的第二聚类距离;
根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,根据异常监测参数进行对生物气溶胶的实时监测数据进行监测分析。
进一步地,所述根据标准化后的监测数据构建监测空间,包括的具体步骤如下:
实时监测数据包括每个时刻每种颗粒物的浓度和大小分布;
以颗粒物的浓度为横轴,以颗粒物的大小分布为纵轴建立坐标系获取生物气溶胶的监测空间。
进一步地,所述对标准化后的监测数据进行聚类得到类簇,包括的具体步骤如下:
使用PCA算法对标准化后的监测数据进行降维得到降维后的每个时刻的主成分颗粒物;
对每个时刻中的所有主成分颗粒物数据点进行聚类,得到类簇;其中,对每个时刻的数据聚成K个类簇,K为预设阈值。
进一步地,所述每个数据点的时序聚类权重的具体获取步骤如下:
每个数据点的时序聚类权重的公式为:
;
式中,ci,t,t-1表示第i个主成分颗粒物在第t个时刻的数据与相邻的第t-1个时刻的数据在监测空间中包含的数据点的个数,ci,t,t+1表示第i个主成分颗粒物在第t个时刻的数据与相邻的第t+1个时刻的数据在监测空间中包含的数据点的个数;di,t,t-1表示第i个主成分颗粒物在第t个时刻与相邻的第t-1个时刻对应的数据点在监测空间中的欧式距离,di,t,t+1表示第i个主成分颗粒物在第t个时刻与相邻的第t+1个时刻对应的数据点在监测空间中的欧式距离;exp( )表示以自然常数为底的指数函数,||表示绝对值符号,max表示取最大值函数,ωi,t表示第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重。
进一步地,相邻时刻的数据点在监测空间中包含的数据点的个数,包括的具体步骤如下:
相邻时刻的数据点在监测空间中包含的数据点的个数为:对相邻时刻的数据点在横向和纵向进行延伸,获取相邻时刻的数据点延伸后相交的两个点,记为标记点,根据相邻时刻的两个数据点和两个标记点构成一个平面区间,将该平面区间中的数据点记为相邻时刻的数据点在监测空间中包含的数据点,统计平面区间中的数据点个数即可得到相邻时刻的数据点在监测空间中包含的数据点的个数。
进一步地,所述每个数据点在每个类簇中的分布聚类权重的具体获取步骤如下:
每个数据点聚类在每个类簇中的分布聚类权重的公式为:
;
式中,Xi,t表示第i个主成分颗粒物在第t个时刻的数据点的横坐标,Yi,t表示第i个主成分颗粒物在第t个时刻的数据点的纵坐标,Xt,h表示第t个时刻的第h个类簇的聚类中心点的横坐标,Yt,h表示第t个时刻的第h个类簇的聚类中心点的纵坐标,表示第t个时刻的第h个类簇所有数据点的中心点的横坐标,/>表示第t个时刻的第h个类簇所有数据点的中心点的纵坐标,其中,/>表示数据点的横坐标在区间/>内包含的数据点个数,表示数据点的横坐标在区间/>内包含的数据点个数,/>表示数据点的纵坐标在区间/>内包含的数据点个数,/>表示数据点的纵坐标在区间内包含的数据点个数,区间都为开区间;QXt,h表示第t个时刻的第h个类簇所有数据点的横坐标的偏度,QYt,h表示第t个时刻的第h个类簇所有数据点的纵坐标的偏度,/>表示第i个主成分颗粒物在第t个时刻的数据点聚类在第h个类簇中的分布聚类权重。
进一步地,所述每个数据点到聚类中心点的第二聚类距离,包括的具体步骤如下:
每个数据点到聚类中心的第二聚类距离的公式为:
;
式中,ωi,t表示第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重,表示第i个主成分颗粒物在第t个时刻的数据点聚类在第h个类簇中的分布聚类权重,di,t,h表示第i个主成分颗粒物在第t个时刻的数据点与在第t个时刻内第h个类簇的聚类中心点之间的欧式距离,/>表示第i个主成分颗粒物在第t个时刻的数据点与在第t个时刻内第h个类簇的聚类中心点的第二聚类距离,norm( )表示线性归一化函数。
进一步地,所述根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,包括的具体步骤如下:
依据每个数据点到聚类中心点的第二聚类距离通过k-means算法对所有实时监测数据分别对每个时刻内的数据点进行聚类,得到每个时刻的K个类簇;选取包含数据点个数最多的一个类簇作为标准数据簇,获取标准数据簇中的聚类中心点和所有数据点到聚类中心点的平均距离作为异常监测参数。
进一步地,所述根据异常监测参数进行对采集的生物气溶胶监测数据进行监测分析,包括的具体步骤如下:
以异常监测参数中标准数据簇的聚类中心点为圆心,以异常监测参数中的所有数据点到聚类中心点的平均距离为半径获取异常监测区域,根据异常监测区域去判断每次不同类型颗粒物在每个时刻获取到的数据点是否为正常数据,当数据点在异常监测区域,则判定获取到的数据为正常数据,当数据点不在异常监测区域,则判定获取到的数据异常数据。
本发明还提供了一种生物气溶胶用智能监测系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项步骤。
本发明的技术方案的有益效果是:本发明通过对生物气溶胶的实时监测数据在空间维度和时间度上的分析,得到每个数据点在空间维度的分布聚类权重和时间维度的时序聚类权重,提高了数据在进行聚类时的实际复杂性;在根据每个数据点的分布聚类权重和时序聚类权重对每个数据点到聚类中心点的距离进行修正,得到每个数据点到聚类中心的第二聚类距离,提高了实时监测数据在进行监测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种生物气溶胶用智能监测方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种生物气溶胶用智能监测方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种生物气溶胶用智能监测方法及系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种生物气溶胶用智能监测方法的步骤流程图,该方法包括以下步骤:
步骤S001:采集生物气溶胶的实时监测数据。
需要说明的是,本实施例主要通过历史的生物气溶胶数据获得每种类型颗粒的正常分布,根据正常分布构建异常检测模型,因此首先需要采集构建模型的数据基础。为了分析每种类型颗粒物的在空气中的含量与监测的差异大小,本实施例需要采集空气中每种类型颗粒物的浓度和大小分布,以此来进行分析。
具体地,本实施例采用空气采样器持续采集空气中每种类型颗粒物的浓度和大小分布,以5分钟为时间间隔进行采集,即每5分钟获取每种类型颗粒物的浓度和大小分布,获取24小时内的所有数据,将24小时内监测到的所有数据记为生物气溶胶的实时监测数据。其中,此处说的颗粒物的大小分布表示粒径分布大小,即颗粒物直径的大小情况;其获取粒径分布大小还需要结合粒子计算器来获取。
至此,得到生物气溶胶的实时监测数据,和每个时刻每种类型颗粒物的浓度和大小分布。
步骤S002:对生物气溶胶的实时监测数据进行标准化获得标准化后的监测数据,根据标准化后的监测数据构建监测空间,对标准化后的监测数据进行聚类得到类簇。
需要说明的是,由于不同类型的颗粒产生的数据量不同,在构建异常检测模型时需要以每个时刻的主成分颗粒分析,结合PCA算法获得每个时刻的主成分颗粒,降低数据的处理难度;在降低数据量后,使用每个时刻的数据构建检测空间,根据空间内数据的分布特征以及在时序的分布特征,获得每个时刻数据的聚类权重,根据聚类权重结合k-means算法获得异常检测模型。
进一步需要说明的是,为了消除不同因素之间由于单位的不同导致出现的误差,使不同来源和类型的数据能够进行有效的比较、分析和整合,本实施例需要对所有的数据进行标准化。
具体地,对生物气溶胶的实时监测数据进行标准化获得标准化后的监测数据,得到标准化后的监测数据;其中标准归一化的方法使用线性归一化方法。
需要说明的是,为了简化数据,使其更易于处理和分析,同时提取出数据的主要特征,帮助提高计算效率、改善模型性能,并且提供更好的可视化和解释能力,本实施例通过降维的方式减小数据量,提高运算速率。
具体地,使用PCA算法对标准化后的数据进行降维得到降维后的每个时刻的主成分颗粒物,其中,每个时刻的主成分颗粒物是相同的。
以颗粒物的浓度为横轴,以颗粒物的大小分布为纵轴建立坐标系获取生物气溶胶的监测空间。
预设一个阈值K,其中本实施例以K=5为例进行叙述,本实施例不进行具体限定,其中K可根据具体实施情况而定。对每个时刻中的所有数据点进行聚类,得到类簇。其中,对每个时刻的数据聚成K个类簇。
步骤S003:根据实时监测数据和监测空间得到每个数据点的时序聚类权重,根据类簇中的数据和监测空间得到每个数据点在每个类簇中的分布聚类权重,根据每个数据点的时序聚类权重和每个数据点在每个类簇中的分布聚类权重得到每个数据点到聚类中心点的第二聚类距离。
需要说明的是,主成分颗粒物数据能代表所有颗粒分布数据的主要特征,若采集的监测数据为正常的,那么所有主成分颗粒物数据在应分布位于一个特定的范围之内,因此可以使用k-means算法对数据空间内的主成分颗粒物数据点聚类,获得标准数据簇。但在k-means算法聚类过程中,由于k-means算法所求为全局最优解,使得聚类结果的所有簇的数据含量近似,而标准数据簇需要包含绝大部分正常数据用于构建异常检测模型,造成聚类结果相较于标准数据簇的数据量减小,异常检测模型无法包含绝大多数正常数据。因此,本实施例根据每个主成分颗粒物数据点在时序和分布的特征上获得聚类权重来进行修正。其中,标准数据簇就是包含数据量更多的一个类簇。
(1)获取每个数据点的时序聚类权重。
进一步需要说明的是,若采集的同一种类型颗粒物在相邻时刻的两个数据点均为正常数据,那么映射到监测空间后,相邻数据点的距离近似或相邻时刻数据点的空间距离之间所包含的数据量较多,那么越可能说明这两个数据点所处的位置处于标准数据簇中,则该数据点越需要聚簇到标准数据簇中。
具体地,获取同一种类型颗粒物在相邻时刻对应的数据点在监测空间中包含的数据点的个数,表示为ci,t,t-1和ci,t,t+1,其中,ci,t,t-1表示第i个主成分颗粒物在第t个时刻与相邻的t-1个时刻之间在监测空间中包含的数据点的个数,ci,t,t+1表示第i个主成分颗粒物在第t个时刻与相邻的t+1个时刻之间在监测空间中包含的数据点的个数;
其中,相邻时刻的数据点在监测空间中包含的数据点的个数为:对相邻时刻的数据点在横向和纵向进行延伸,获取相邻时刻的数据点延伸后相交的两个点,记为标记点,根据相邻时刻的两个数据点和两个标记点构成一个平面区间,将该平面区间中的数据点记为相邻时刻的数据点在监测空间中包含的数据点,统计平面区间中的数据点个数即可得到相邻时刻的数据点在监测空间中包含的数据点的个数。
再获取同一种类型颗粒物在相邻时刻对应的数据点在监测空间中的欧式距离。其中,每个主成分颗粒物就是同一种类型颗粒物。
根据相邻时刻在监测空间中包含的数据点的个数和相邻时刻对应的数据点在监测空间中的欧式距离得到每种主成分颗粒物在每个时刻的数据点的时序聚类权重,用公式表示为:
;
式中,ci,t,t-1表示第i个主成分颗粒物在第t个时刻的数据与相邻的第t-1个时刻的数据在监测空间中包含的数据点的个数,ci,t,t+1表示第i个主成分颗粒物在第t个时刻的数据与相邻的第t+1个时刻的数据在监测空间中包含的数据点的个数;di,t,t-1表示第i个主成分颗粒物在第t个时刻与相邻的第t-1个时刻对应的数据点在监测空间中的欧式距离,di,t,t+1表示第i个主成分颗粒物在第t个时刻与相邻的第t+1个时刻对应的数据点在监测空间中的欧式距离;exp( )表示以自然常数为底的指数函数,||表示绝对值符号,max表示取最大值函数,ωi,t表示第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重。
其中,max{ci,t,t-1,ci,t,t+1}表示第i个主成分颗粒物在第t个时刻的数据与相邻时刻的数据在监测空间中包含的数据点的个数的最大值,取值越大说明第i个主成分颗粒物在第t个时刻的数据点与相邻数据点越聚集,即越可能处于标准数据簇中,则第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重取值越大;表示同一种类型的颗粒物的相邻时刻内在监测空间中包含的数据点的个数的比值,比值越趋近于1,则说明第i个主成分颗粒物在第t个时刻的数据点在监测空间中颗粒物的位置越可能为同一个簇,即越可能处于标准数据簇中,则第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重取值越大;/>和/>为第i个主成分颗粒物在第t个时刻的数据点与相邻时刻的数据点之间的距离差异,差异越小则越可能为一个簇,则第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重取值越大。
至此,得到每个主成分颗粒物在每个时刻的数据点的时序聚类权重。
(2)获取每个数据点聚类在每个类簇中的分布聚类权重。
需要说明的是,在进行k-means算法聚类时,当一个数据点越趋近于聚类中心点,即数据点的分布越靠近聚类中心点,表示数据点越是所属类簇中的数据点,则在进行聚类时给数据点给予的权重应该更大;又由于横轴和纵轴上都存在差异的,所以对于每个类簇中的数据点分别以横轴和纵轴进行分析,获取水平方向和竖直方向的偏度,来得到数据点给予的分布聚类权重。
具体地,根据每个数据点与类簇中心点之间在监测空间中包含的数据点的个数和水平方向和竖直方向的偏度得到每个数据点在分布特征上的分布聚类权重,用公式表示为:
;
式中,Xi,t表示第i个主成分颗粒物在第t个时刻的数据点的横坐标,Yi,t表示第i个主成分颗粒物在第t个时刻的数据点的纵坐标,Xt,h表示第t个时刻的第h个类簇的聚类中心点的横坐标,Yt,h表示第t个时刻的第h个类簇的聚类中心点的纵坐标,表示第t个时刻的第h个类簇所有数据点的中心点的横坐标,/>表示第t个时刻的第h个类簇所有数据点的中心点的纵坐标,其中,/>表示数据点的横坐标在区间/>内包含的数据点个数,表示数据点的横坐标在区间/>内包含的数据点个数,/>表示数据点的纵坐标在区间/>内包含的数据点个数,/>表示数据点的纵坐标在区间内包含的数据点个数,区间都为开区间;QXt,h表示第t个时刻的第h个类簇所有数据点的横坐标的偏度,QYt,h表示第t个时刻的第h个类簇所有数据点的纵坐标的偏度,/>表示第i个主成分颗粒物在第t个时刻的数据点聚类在第h个类簇中的分布聚类权重。其中,偏度为公知技术,此处不进行具体的赘述。
其中,和/>表示以类簇中所有数据点的中点为隔断的在偏移空间中的所有数据点的分布情况,取值越趋近于1表明从中点到第h个类簇的聚类中心和中点到第i个主成分颗粒物在第t个时刻的数据点的差异越小,那么越需要将第i个主成分颗粒物在第t个时刻的数据点聚类到以第h个类簇中;偏度QXt,h和QYt,h表示在聚类中心点和数据点的距离上的数据点的分布特征,偏度取值越大说明数据点越趋向于聚类中心点,即所属类簇越可能是标准数据簇。
至此,得到每个主成分颗粒物在每个时刻的数据点聚类在每个类簇中的分布聚类权重。
(3)根据每个数据点在时序特征上的时序聚类权重和分布聚类权重得到每个数据点到聚类中心的第二聚类距离。
需要说明的是,通过在时序特征和分布特征上的分析,为了对每个数据点在聚类时更加的准确,则根据每个数据点的分布聚类权重和时序聚类权重,对每个数据点到每个聚类中心的距离加上权重,获得修正后的聚类距离。
具体地,根据每个数据点的时序聚类权重和每个数据点的分布聚类权重对每个数据点到聚类中心点的距离进行修正得到修正后每个数据点到聚类中心点的第二聚类距离,用公式表示为:
;
式中,ωi,t表示第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重,表示第i个主成分颗粒物在第t个时刻的数据点聚类在第h个类簇中的分布聚类权重,di,t,h表示第i个主成分颗粒物在第t个时刻的数据点与在第t个时刻内第h个类簇的聚类中心点之间的欧式距离,/>表示第i个主成分颗粒物在第t个时刻的数据点与在第t个时刻内第h个类簇的聚类中心点的第二聚类距离,norm( )表示线性归一化函数。
其中,当的取值越大,即/>越小,则修正后的第二聚类距离也就越小,说明第i个主成分颗粒物在第t个时刻的数据点越可能属于第h个类簇中。
至此,得到每个数据点到聚类中心点的第二聚类距离。
步骤S004:根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,根据异常监测参数进行对采集的生物气溶胶监测数据进行监测分析。
通过k-means算法对24小时内的所有实时监测数据分别对每个时刻内的数据点进行聚类,在聚类时根据每个数据点到聚类中心点的第二聚类距离进行聚类,得到每个时刻的K个类簇。选取包含数据点个数最多的一个类簇作为标准数据簇,获取标准数据簇中的聚类中心点和所有数据点到聚类中心点的平均距离作为异常监测参数。
以异常监测参数中的聚类中心点为圆心,以异常监测参数中的所有数据点到聚类中心点的平均距离为半径获取异常监测区域,根据异常监测区域去判断每次不同类型颗粒物在每个时刻获取到的数据点是否为正常数据,当数据点在异常监测区域,则判定获取到的数据为正常数据,当数据点不在异常监测区域,则判定获取到的数据异常数据。
本实施例提供了一种生物气溶胶用智能监测系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现步骤S001至步骤S004。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种生物气溶胶用智能监测方法,其特征在于,该方法包括以下步骤:
采集生物气溶胶的实时监测数据;
对生物气溶胶的实时监测数据进行标准化获得标准化后的监测数据,根据标准化后的监测数据构建监测空间,对标准化后的监测数据进行聚类得到类簇;
根据实时监测数据和监测空间得到每个数据点的时序聚类权重,根据类簇中的数据和监测空间得到每个数据点在每个类簇中的分布聚类权重,根据每个数据点的时序聚类权重和每个数据点在每个类簇中的分布聚类权重得到每个数据点到聚类中心点的第二聚类距离;
根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,根据异常监测参数进行对生物气溶胶的实时监测数据进行监测分析;
每个数据点的时序聚类权重的公式为:
;
式中,ci,t,t-1表示第i个主成分颗粒物在第t个时刻的数据与相邻的第t-1个时刻的数据在监测空间中包含的数据点的个数,ci,t,t+1表示第i个主成分颗粒物在第t个时刻的数据与相邻的第t+1个时刻的数据在监测空间中包含的数据点的个数;di,t,t-1表示第i个主成分颗粒物在第t个时刻与相邻的第t-1个时刻对应的数据点在监测空间中的欧式距离,di,t,t+1表示第i个主成分颗粒物在第t个时刻与相邻的第t+1个时刻对应的数据点在监测空间中的欧式距离;exp( )表示以自然常数为底的指数函数,||表示绝对值符号,max表示取最大值函数,ωi,t表示第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重;
相邻时刻的数据点在监测空间中包含的数据点的个数为:对相邻时刻的数据点在横向和纵向进行延伸,获取相邻时刻的数据点延伸后相交的两个点,记为标记点,根据相邻时刻的两个数据点和两个标记点构成一个平面区间,将该平面区间中的数据点记为相邻时刻的数据点在监测空间中包含的数据点,统计平面区间中的数据点个数即可得到相邻时刻的数据点在监测空间中包含的数据点的个数;
每个数据点聚类在每个类簇中的分布聚类权重的公式为:
;
式中,Xi,t表示第i个主成分颗粒物在第t个时刻的数据点的横坐标,Yi,t表示第i个主成分颗粒物在第t个时刻的数据点的纵坐标,Xt,h表示第t个时刻的第h个类簇的聚类中心点的横坐标,Yt,h表示第t个时刻的第h个类簇的聚类中心点的纵坐标,表示第t个时刻的第h个类簇所有数据点的中心点的横坐标,/>表示第t个时刻的第h个类簇所有数据点的中心点的纵坐标,其中,/>表示数据点的横坐标在区间/>内包含的数据点个数,/>表示数据点的横坐标在区间/>内包含的数据点个数,/>表示数据点的纵坐标在区间/>内包含的数据点个数,/>表示数据点的纵坐标在区间/>内包含的数据点个数,区间都为开区间;QXt,h表示第t个时刻的第h个类簇所有数据点的横坐标的偏度,QYt,h表示第t个时刻的第h个类簇所有数据点的纵坐标的偏度,/>表示第i个主成分颗粒物在第t个时刻的数据点聚类在第h个类簇中的分布聚类权重。
2.根据权利要求1所述一种生物气溶胶用智能监测方法,其特征在于,所述根据标准化后的监测数据构建监测空间,包括的具体步骤如下:
实时监测数据包括每个时刻每种颗粒物的浓度和大小分布;
以颗粒物的浓度为横轴,以颗粒物的大小分布为纵轴建立坐标系获取生物气溶胶的监测空间。
3.根据权利要求1所述一种生物气溶胶用智能监测方法,其特征在于,所述对标准化后的监测数据进行聚类得到类簇,包括的具体步骤如下:
使用PCA算法对标准化后的监测数据进行降维得到降维后的每个时刻的主成分颗粒物;
对每个时刻中的所有主成分颗粒物数据点进行聚类,得到类簇;其中,对每个时刻的数据聚成K个类簇,K为预设阈值。
4.根据权利要求1所述一种生物气溶胶用智能监测方法,其特征在于,所述每个数据点到聚类中心点的第二聚类距离,包括的具体步骤如下:
每个数据点到聚类中心的第二聚类距离的公式为:
;
式中,ωi,t表示第i个主成分颗粒物在第t个时刻的数据点的时序聚类权重,表示第i个主成分颗粒物在第t个时刻的数据点聚类在第h个类簇中的分布聚类权重,di,t,h表示第i个主成分颗粒物在第t个时刻的数据点与在第t个时刻内第h个类簇的聚类中心点之间的欧式距离,/>表示第i个主成分颗粒物在第t个时刻的数据点与在第t个时刻内第h个类簇的聚类中心点的第二聚类距离,norm( )表示线性归一化函数。
5.根据权利要求1所述一种生物气溶胶用智能监测方法,其特征在于,所述根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,包括的具体步骤如下:
依据每个数据点到聚类中心点的第二聚类距离通过k-means算法对所有实时监测数据分别对每个时刻内的数据点进行聚类,得到每个时刻的K个类簇;选取包含数据点个数最多的一个类簇作为标准数据簇,获取标准数据簇中的聚类中心点和所有数据点到聚类中心点的平均距离作为异常监测参数。
6.根据权利要求1所述一种生物气溶胶用智能监测方法,其特征在于,所述根据异常监测参数进行对采集的生物气溶胶监测数据进行监测分析,包括的具体步骤如下:
以异常监测参数中标准数据簇的聚类中心点为圆心,以异常监测参数中的所有数据点到聚类中心点的平均距离为半径获取异常监测区域,根据异常监测区域去判断每次不同类型颗粒物在每个时刻获取到的数据点是否为正常数据,当数据点在异常监测区域,则判定获取到的数据为正常数据,当数据点不在异常监测区域,则判定获取到的数据异常数据。
7.一种生物气溶胶用智能监测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任意一项所述一种生物气溶胶用智能监测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311354150.8A CN117113118B (zh) | 2023-10-19 | 2023-10-19 | 一种生物气溶胶用智能监测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311354150.8A CN117113118B (zh) | 2023-10-19 | 2023-10-19 | 一种生物气溶胶用智能监测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117113118A CN117113118A (zh) | 2023-11-24 |
CN117113118B true CN117113118B (zh) | 2024-01-26 |
Family
ID=88809388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311354150.8A Active CN117113118B (zh) | 2023-10-19 | 2023-10-19 | 一种生物气溶胶用智能监测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117113118B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117289778B (zh) * | 2023-11-27 | 2024-03-26 | 惠州市鑫晖源科技有限公司 | 一种工控主机电源健康状态的实时监测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022166380A1 (zh) * | 2021-02-05 | 2022-08-11 | 天翼数字生活科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
CN116227363A (zh) * | 2023-04-25 | 2023-06-06 | 湖南省水务规划设计院有限公司 | 一种传感分布优化的洪灾预警方法 |
CN116735807A (zh) * | 2023-08-09 | 2023-09-12 | 山东优控智能技术有限公司 | 基于多传感器数据的空气质量检测评估方法 |
-
2023
- 2023-10-19 CN CN202311354150.8A patent/CN117113118B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022166380A1 (zh) * | 2021-02-05 | 2022-08-11 | 天翼数字生活科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
CN116227363A (zh) * | 2023-04-25 | 2023-06-06 | 湖南省水务规划设计院有限公司 | 一种传感分布优化的洪灾预警方法 |
CN116735807A (zh) * | 2023-08-09 | 2023-09-12 | 山东优控智能技术有限公司 | 基于多传感器数据的空气质量检测评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117113118A (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117113118B (zh) | 一种生物气溶胶用智能监测方法及系统 | |
CN115187527B (zh) | 一种多源混合型特高频局部放电图谱的分离识别方法 | |
KR20170122043A (ko) | 실시간 실내 공기질 이상치 제거 방법 및 장치 | |
CN115876258B (zh) | 基于多源数据的畜禽养殖环境异常监测及报警系统 | |
CN116821809B (zh) | 基于人工智能的生命体征数据采集系统 | |
CN111540471A (zh) | 一种基于用户健康数据的健康状态跟踪及预警方法和系统 | |
WO2018077111A1 (zh) | 植物种类的识别方法、识别装置和服务器 | |
CN117633697B (zh) | 基于物联网的生猪智能监测方法及系统 | |
CN113723157B (zh) | 一种农作物病害识别方法、装置、电子设备及存储介质 | |
CN117493921B (zh) | 基于大数据的人工智能节能管理方法及系统 | |
CN108596227B (zh) | 一种用户用电行为主导影响因素挖掘方法 | |
KR102495419B1 (ko) | 인공지능 기반의 병해충 진단 시스템 및 방법 | |
CN115602337A (zh) | 一种基于机器学习的刺激隐核虫疾病预警方法及系统 | |
CN112288022B (zh) | 一种基于ssd算法的特征融合的粮虫识别方法和识别系统 | |
CN116563205A (zh) | 基于小目标检测和改进YOLOv5的麦穗计数检测方法 | |
CN114707608B (zh) | 医疗质控数据处理方法、装置、设备、介质及程序产品 | |
CN114912720A (zh) | 基于记忆网络电力负荷预测方法、装置、终端及存储介质 | |
CN109220882A (zh) | 一种规模化商品猪场数字化监测信息应用方法及系统 | |
CN116563758A (zh) | 狮头鹅监控方法、装置、设备及存储介质 | |
Suparyati et al. | Applying different resampling strategies in random forest algorithm to predict lumpy skin disease | |
CN114580572A (zh) | 一种异常值的识别方法、装置、电子设备及存储介质 | |
CN115659195A (zh) | 一种大气污染在线识别方法 | |
CN111242028A (zh) | 基于U-Net的遥感图像地物分割方法 | |
CN117170979B (zh) | 一种大规模设备的能耗数据处理方法、系统、设备及介质 | |
CN117313017A (zh) | 一种彩叶研发数据处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |