CN117538491B - 一种站房空气质量智能监测方法及系统 - Google Patents

一种站房空气质量智能监测方法及系统 Download PDF

Info

Publication number
CN117538491B
CN117538491B CN202410026275.6A CN202410026275A CN117538491B CN 117538491 B CN117538491 B CN 117538491B CN 202410026275 A CN202410026275 A CN 202410026275A CN 117538491 B CN117538491 B CN 117538491B
Authority
CN
China
Prior art keywords
sample
data
noise
gas concentration
target gas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410026275.6A
Other languages
English (en)
Other versions
CN117538491A (zh
Inventor
陈楠
代波华
刘明亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Yite Environmental Protection Technology Co ltd
Original Assignee
Wuhan Yite Environmental Protection Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Yite Environmental Protection Technology Co ltd filed Critical Wuhan Yite Environmental Protection Technology Co ltd
Priority to CN202410026275.6A priority Critical patent/CN117538491B/zh
Publication of CN117538491A publication Critical patent/CN117538491A/zh
Application granted granted Critical
Publication of CN117538491B publication Critical patent/CN117538491B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Combustion & Propulsion (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Sampling And Sample Adjustment (AREA)

Abstract

本发明涉及数据清洗技术领域,具体涉及一种站房空气质量智能监测方法及系统。本发明首先获取站房内的目标气体浓度和参考气体浓度,通过分析目标气体浓度和参考气体浓度的波动特征,获取目标气体浓度的噪声表现程度,进一步根据噪声表现程度及孤立树对应样本集的时序波动表现,获取每个孤立树中每个目标气体浓度的样本优选程度,根据样本优选程度调整对应路径长度,获取异常得分进而对目标气体浓度降噪。本发明通过分析噪声的变化速度及变化速度稳定性特点获取每个目标气体浓度的噪声表现程度,进而分析样本集及样本对噪声异常检测的适配性,从而对其路径长度进行修正后准确去噪,提高空气质量监测准确性及效率。

Description

一种站房空气质量智能监测方法及系统
技术领域
本发明涉及数据清洗技术领域,具体涉及一种站房空气质量智能监测方法及系统。
背景技术
智慧站房是一种应用智能算法和分析仪器对子站进行全方位监控及远程运维的智能化解决方案。但在智慧站房的部分应用场景中,其相对密闭的空间内可能产生有害气体以威胁相关操作人员和设备仪器的安全,因此对站房的空气质量监测是十分重要的。然而在监测过程中,可能因环境干扰或传输失真等情况而导致空气质量监测数据中存在噪声,噪声不仅影响正常监测,甚至可能使报警器发出误报,因此对空气质量数据去噪是非常必要的。
孤立森林算法是一种常用的离群检测算法,但由于噪声数据与异常超标的空气质量数据的离群特征相似,在利用孤立森林算法进行异常检测时,易将具有重要监测意义的异常超标数据及噪声数据赋予相似的异常得分,从而无法准确区分噪声与异常超标数据,导致监测准确性大大降低。
发明内容
为了解决现有孤立森林算法对数据降噪效果差导致空气质量监测准确性低的技术问题,本发明的目的在于提供一种站房空气质量智能监测方法及系统,所采用的技术方案具体如下:
本发明提出一种站房空气质量智能监测方法,所述方法包括:
获取当前采样时刻的预设历史时段中站房内所有空气质量监测数据,所述空气质量监测数据包括一种目标气体浓度和一种参考气体浓度,其中所述目标气体浓度受所述参考气体浓度的波动影响;
根据每个采样时刻下所述目标气体浓度的局部波动特征及所述目标气体浓度与所述参考气体浓度的局部波动一致性,获取每个采样时刻下所述目标气体浓度的噪声表现程度;
以每个采样时刻下的所述目标气体浓度为一个样本数据,根据所有样本数据构建孤立树,获取每个所述孤立树对应的样本集及每个所述孤立树上每个样本数据的路径长度;根据每个所述样本集内每个样本数据的局部波动特征及噪声表现,获取每个所述样本集的优选特征值;根据所述优选特征值及所述样本集内样本数据的整体时序连续性,获取每个所述样本集的样本集优选程度;根据每个所述样本集优选程度及对应所述样本集内每个所述样本数据的局部时序连续性,获取每个所述样本集内每个所述样本数据的样本优选程度;
根据所述样本优选程度调整每个所述孤立树上每个样本数据的所述路径长度,获取每个所述目标气体浓度的异常得分;根据所述异常得分对所述目标气体浓度降噪,得到所述目标气体浓度的监测结果。
进一步地,所述噪声表现程度的获取方法包括:
根据每个所述目标气体浓度的局部幅值变化速度及局部幅值变化稳定程度,获取第一噪声表现程度;
在每个采样时刻下,根据每个所述目标气体浓度与所述参考气体浓度的局部幅值变化速度一致性,及所述目标气体浓度与所述参考气体浓度的局部幅值变化速度稳定程度的一致性,获取第二噪声表现程度;
将所述第一噪声表现程度与所述第二噪声表现程度的和作为所述噪声表现程度。
进一步地,所述第一噪声表现程度的计算公式包括:
;其中,/>为第/>个目标气体浓度的第一噪声表现程度;/>为预设邻域内一阶差的序号;/>为预设邻域内二阶差的序号;/>为预设邻域内目标气体浓度的总数量;/>为第/>个目标气体浓度的预设邻域内第/>个一阶差;/>为第/>个目标气体浓度的预设邻域内第/>个二阶差;为第/>个目标气体浓度的预设邻域内相邻一阶差的符号变化次数;/>为标准归一化函数。
进一步地,所述第二噪声表现程度的计算公式包括:
;其中,/>为第/>个目标气体浓度的第二噪声表现程度;/>为预设邻域内一阶差的序号;/>为预设邻域内二阶差的序号;/>为预设邻域内目标气体浓度的总数量;/>为第/>个目标气体浓度的预设邻域内第/>个一阶差;/>为第/>个参考气体浓度的预设邻域内第/>个一阶差;为第/>个目标气体浓度的预设邻域内第/>个二阶差;/>第/>个参考气体浓度的预设邻域内第/>个二阶差;/>为标准归一化函数。
进一步地,所述优选特征值的获取方法包括:
所述样本集内的样本数据以采集时刻的先后顺序进行排序;根据优选特征值的计算公式获取优选特征值;优选特征值的计算公式为:
;其中,/>为第/>个样本集的优选特征值;/>为第/>个样本集内所有样本数据的噪声表现程度的均值;/>为第/>个样本集内所有样本数据的噪声表现程度的方差;/>为第/>个样本集内样本数据的序号;/>为第/>个样本数据的噪声表现程度;/>为第/>个样本集内样本数据的总数量;/>为第/>个样本集内第/>个样本数据的浓度幅值;/>为第/>个样本集内第/>个样本数据的浓度幅值;/>为第/>个样本集内第/>个样本数据的浓度幅值;/>为取最小值函数;/>为标准归一化函数;/>为预设第一正参数;/>为预设第二正参数。
进一步地,所述样本集优选程度的获取方法包括:
所述样本集内的样本数据以采集时刻的先后顺序进行排序;获取每个所述样本集内相邻样本数据的采样时间间隔,将所有所述采样时间间隔的方差进行负相关映射,得到所述样本集内样本数据的整体时序连续特征值;
将所述时序连续特征值乘以对应所述样本集的所述优选特征值后映射到指数函数,得到样本集优选程度。
进一步地,所述样本优选程度的获取方法包括:
所述样本集内的样本数据以采集时刻的先后顺序进行排序;在每个所述样本集中,以每个样本数据为起点,在所述样本集中沿时序方向获取预设第二数量个样本数据作为时序参考样本数据,获取每个所述时序参考样本数据与起点对应样本数据间的采样时刻间隔的均值,将所述均值进行负相关映射后作为每个起点对应所述样本数据的时序连续参考值;将所述时序连续参考值乘以对应所述样本数据所在所述样本集的样本集优选程度,得到每个所述样本集内每个所述样本数据的样本优选程度。
进一步地,所述路径长度的调整方法包括:
以任一所述样本集内所述样本数据为目标数据,将所述目标数据在所有所述样本集内的所述样本优选程度之和作为分母,所述目标数据在对应所述样本集内的所述样本优选程度作为分子,分子与分母的比值作为对应所述目标数据在对应孤立树中的路径长度的权重;将所述权重乘以所述路径长度,得到调整后的路径长度。
进一步地,所述降噪方法包括:
将所述异常得分大于预设阈值的所述目标气体浓度作为噪声数据进行剔除,并将与所述噪声数据对应采样时刻相距最近的两个采样时刻的两个所述目标气体数据的浓度均值作为所述噪声数据的修正值对剔除数据进行填补。
本发明还提出一种站房空气质量智能监测系统,所述系统包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述一种站房空气质量智能监测方法的步骤。
本发明具有如下有益效果:
本发明首先获取一种目标气体浓度和一种参考气体浓度,其中目标气体浓度受参考气体浓度的波动影响,根据目标气体浓度的局部波动特征及目标气体浓度与参考气体浓度的局部波动一致性,结合噪声的波动特点准确获取每个采样时刻下目标气体浓度的噪声表现程度;以每个采样时刻下的目标气体浓度为一个样本数据,根据所有样本数据构建孤立树,获取每个孤立树对应的样本集及每个孤立树上每个样本数据的路径长度;根据每个样本集内每个样本数据的局部波动特征及噪声表现,获取每个样本集的优选特征值,结合样本集内样本数据的整体时序连续性,获取每个样本集的样本集优选程度,进一步结合对应样本集内每个样本数据的局部时序连续性,获取每个样本集内每个样本数据的样本优选程度,样本集内样本数据的时序连续性对噪声的异常检测存在一定影响,结合时序连续性可以准确获取样本集优选程度及样本优选程度;样本优选程度反映了每个孤立树中每个样本数据对应路径长度的准确性,通过样本优选程度调整对应路径长度,准确获取每个目标气体浓度的异常得分进而对目标气体浓度降噪,得到目标气体的监测结果。本发明通过分析噪声的变化速度及变化速度稳定性特点获取每个目标气体浓度的噪声表现程度,进而分析样本集及样本对噪声异常检测的适配性,从而对其路径长度进行修正后准确去噪,提高空气质量监测准确性及效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种站房空气质量智能监测方法的方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种站房空气质量智能监测方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种站房空气质量智能监测方法及系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种站房空气质量智能监测方法的方法流程图,该方法包括以下步骤:
步骤S1,获取当前采样时刻的预设历史时段中站房内的所有空气质量监测数据,空气质量监测数据包括一种目标气体浓度和一种参考气体浓度,其中目标气体浓度受参考气体浓度的波动影响。
在对站房内的空气质量监测数据进行监测过程中,为避免噪声干扰误报异常,本发明实施例首先获取当前采样时刻的预设历史时段中站房内的所有空气质量监测数据,进一步判断空气质量监测数据中的噪声表现程度,从而通过调整异常检测算法的相关参数以对空气质量监测数据进行降噪。
在本发明的一个实施例中,具体通过在站房内设置传感器采集当前时刻之前一周内的预设历史时间段内的空气质量监测数据,其中传感器以十分钟每次的采样频率采集空气质量监测数据中的目标气体浓度,为判断对目标气体浓度的噪声表现程度分析准确性,同步获取了目标气体浓度的参考气体浓度,参考气体浓度与目标气体浓度变化具有一定关联性,能够提高对目标气体浓度分析监测的准确性。
需要说明的是,本发明实施例以臭氧浓度为目标气体浓度,氮氧化物浓度为参考气体浓度为一个具体实施例进行分析说明;臭氧是一种有害气体,能够威胁人体健康,对其监测的准确性至关重要;在一定条件下氮氧化物会转化为臭氧,以氮氧化物的浓度变化作参考进行分析,可以提高评估臭氧分析监测的准确性。实施者也可设置对应传感器采集其他种类的目标气体浓度及其参考气体浓度,并根据气体间的变化关联性进行分析监测。
步骤S2,根据每个采样时刻下目标气体浓度的局部波动特征及目标气体浓度与参考气体浓度的局部波动一致性,获取每个采样时刻下目标气体浓度的噪声表现程度。
由于噪声和臭氧浓度异常变化均表现为异常幅值波动,噪声的幅值波动随机不定,仅根据幅值变化的异常离群情况无法准确区分噪声及臭氧浓度异常变化;但噪声为随机突变,而臭氧浓度异常变化往往表现为缓慢且稳定的增长,二者在幅值的变化速度及变化速度的稳定性存在明显差异;且氮氧化物本身具有一定的危害性,在阳光作用下会转化为臭氧,臭氧的浓度增加进而会使得氮氧化物的浓度降低,目标气体与参考气体往往同步变化;故本发明实施例根据每个采样时刻下目标气体浓度的局部波动特征及目标气体浓度与参考气体浓度的局部波动一致性,获取每个采样时刻下目标气体浓度的噪声表现程度,噪声表现程度反映了气体浓度的幅值波动为噪声引起的可能性及波动剧烈程度。
优选地,在本发明的一个实施例中,由于噪声与臭氧浓度异常变化的幅值变化特点存在差异,且臭氧与氮氧化物的浓度幅值存在变化关联性,基于此,噪声表现程度的获取方法包括:根据每个目标气体浓度的局部幅值变化速度及局部幅值变化稳定程度,获取第一噪声表现程度;在每个采样时刻下,根据每个目标气体浓度与参考气体浓度的局部幅值变化速度一致性,及目标气体浓度与参考气体浓度的局部幅值变化速度稳定程度的一致性,获取第二噪声表现程度;将第一噪声表现程度与第二噪声表现程度的和作为噪声表现程度。
为分析臭氧浓度的局部幅值波动变化,本发明实施例首先以每个臭氧浓度数据为中心,向时序方向两端分别获取预设数量个臭氧浓度数据构建预设邻域,预设数量为3,即预设邻域为包括中点对应臭氧浓度数据及其时序前后的三个相邻采样时刻下的臭氧浓度数据,预设邻域的时序长度为7,进一步分析臭氧浓度的局部幅值变化及氮氧化物的局部幅值变化以获取噪声表现程度。
优选地,在本发明的一个实施例中,第一噪声表现程度的计算公式为:
其中,为第/>个臭氧浓度的第一噪声表现程度;/>为预设邻域内一阶差的序号;/>为预设邻域内二阶差的序号;/>为预设邻域内臭氧浓度的总数量;/>为第/>个臭氧浓度的预设邻域内第/>个一阶差;/>为第/>个臭氧浓度的预设邻域内第/>个二阶差;/>为第/>个臭氧浓度的预设邻域内相邻一阶差的符号变化次数;/>
第一噪声表现程度的计算公式中,预设邻域内相邻采样时刻对应臭氧浓度数据的一阶差分值反映臭氧浓度在相邻时序上的变化速度,一阶差绝对值均值越大,说明臭氧浓度的变化速度越快;二阶差分值反映臭氧浓度在相邻时序上的变化加速度,侧面反映变化速度的稳定性,二阶差绝对值均值越大,说明臭氧浓度的变化速度越不稳定;而相邻一阶差的符号变化次数也反映了变化速度的稳定性,变化次数越多、一阶差绝对值均值及二阶差绝对值均值越大,说明预设邻域中点对应臭氧浓度的幅值变化越符合噪声的波动特点,为噪声的可能性越大,对应噪声表现程度越大。
优选地,在本发明的一个实施例中,第二噪声表现程度的获取方法为:
其中,为第/>个臭氧浓度的第二噪声表现程度;/>为预设邻域内一阶差的序号;/>为预设邻域内二阶差的序号;/>为预设邻域内臭氧浓度的总数量;/>为第/>个臭氧浓度的预设邻域内第/>个一阶差;/>为第/>个氮氧化物浓度的预设邻域内第/>个一阶差;/>为第/>个臭氧浓度的预设邻域内第/>个二阶差;/>第/>个氮氧化物浓度的预设邻域内第/>个二阶差;/>为标准归一化函数。需要说明的是,氮氧化物浓度的预设邻域获取方法与臭氧浓度的预设邻域获取方法相同,在此不再赘述。
第一噪声表现程度的计算公式中,臭氧浓度及氮氧化物浓度在相同采样时刻下的预设邻域内的相邻采样时刻下的一阶差绝对值的差异与二阶差绝对值差异,分别反映了臭氧浓度及氮氧化物浓度的幅值变化速度一致性及变化速度稳定程度的一致性,差异越小,一致性越高,其为臭氧浓度异常变化的可能性越高;相反,一致性越低,臭氧浓度的幅值变化为噪声引起波动变化的可能性越高,噪声表现程度也越高。
通过第一噪声表现程度获取目标气体浓度的噪声可能性,结合第二噪声表现程度评估第一噪声表现程度的准确性,综合二者准确判断每个采样时刻下的目标气体浓度数据的噪声表现程度。
步骤S3,以每个采样时刻下的目标气体浓度为一个样本数据,根据所有样本数据构建孤立树,获取每个孤立树对应的样本集及每个孤立树上每个样本数据的路径长度;根据每个样本集内每个样本数据的局部波动特征及噪声表现,获取每个样本集的优选特征值;根据优选特征值及样本集内样本数据的整体时序连续性,获取每个样本集的样本集优选程度;根据每个样本集优选程度及对应样本集内每个样本数据的局部时序连续性,获取每个样本集内每个样本数据的样本优选程度。
本发明实施例在通过孤立森林算法对空气质量监测数据进行降噪时,以每个采样时刻下的目标气体浓度为一个样本数据,根据所有样本数据构建预设数量个孤立树,其中孤立森林的获取过程为本领域技术人员熟知的现有技术,在此仅简述本发明的一个实施例中孤立森林的构建步骤及相关设定参数:(1)以臭氧浓度为样本数据;设定孤立树的数量为50,树的最大深度为8,孤立树中样本数量为臭氧浓度数据总数量的70%;(2)对于每棵孤立树:随机选择一个臭氧浓度为根节点,将其添加入孤立森林中;在臭氧浓度的最小值和最大值之间随机选择一个分裂值,将臭氧浓度数据集划分为两个子集,一个包含小于阈值的样本,另一个包含大于阈值的样本;重复该步骤直到无法继续分割或者到达树的最大深度;(3)构建所有孤立树。将每个孤立树作为一个样本集,并获取每个孤立树内每个臭氧浓度数据的路径长度,便于后续分析样本集内每个孤立树随机选择样本的优选程度后调整对应路径长度,获得准确异常得分。需要说明的是,构建孤立树及获取每个样本数据在对应孤立树中的路径长度为本领域技术人员所熟知的现有技术,在此不再赘述。
由于孤立森林算法选取样本的随机性,存在影响噪声数据的异常得分计算准确性的优选样本集及易出现误差的样本集,每个样本集对噪声检测的适配性将影响最终检测结果的准确性。在对空气质量监测数据降噪的过程中,更希望每个样本集内的噪声相对其他样本数据更明显突出,从而使噪声对应样本数据能够获得更大的异常得分;而噪声表现程度则反映了样本数据为噪声的可能性及波动强度;同时噪声的局部波动特征相对其他样本数据也越应符合更为孤立离群的特点;故本发明实施例根据每个样本集内每个样本数据的局部波动特征及噪声表现,获取每个样本集的优选特征值。
优选地,在本发明的一个实施例中,考虑到每个样本集内的噪声数据越少且相对其他样本数据的噪声表现程度越高越孤立,才更便于噪声的异常检测;而样本集内样本数据的噪声表现程度的方差能够反映样本集内样本数据的噪声表现程度相对其平均值的离散程度,若存在个别噪声数据,其对应噪声表现程度与其他样本数据间的噪声表现程度将存在明显的差异而导致方差较大,相反若样本集内存在大量噪声数据可能会导致方差变小,从而不利于噪声的异常检测;基于此,样本集优选程度的获取方法包括:样本集内的样本数据以采集时刻的先后顺序进行排序,以便对每个样本数据的局部波动特征分析,进而可根据优选特征值的计算公式获取优选特征值;优选特征值的计算公式为:
其中,为第/>个样本集的优选特征值;/>为第/>个样本集内所有样本数据的噪声表现程度的均值;/>为第/>个样本集内所有样本数据的噪声表现程度的方差;/>为第/>个样本集内样本数据的序号;/>为第/>个样本数据的噪声表现程度;/>为第/>个样本集内样本数据的总数量;/>为第/>个样本集内第/>个样本数据的浓度幅值;/>为第/>个样本集内第个样本数据的浓度幅值;/>为第/>个样本集内第/>个样本数据的浓度幅值;/>为取最小值函数;/>为标准归一化函数;/>为预设第一正参数;/>为预设第二正参数。
需要说明的是,在本发明实施例中,由于及/>均进行了归一化处理,其对应取值范围为0至1,二者的比值反映了每个样本数据的局部孤立度及噪声表现程度的一致性,进一步从侧面反映每个样本数据为噪声的可能性,因此当比值越趋近于1时,说明对应样本集内的样本数据越符合噪声表现程度高的样本数据越孤立、噪声表现程度低的样本数据越集中的特点,样本数据的噪声表现程度越准确,同时为保证分式有意义,故将预设第一正参数/>设置为1;预设第二正参数/>取0.01,防止/>作为分母为零时,分式无意义,实施者也可根据具体实施情况设置其他取值。
优选特征值的计算公式中,噪声表现程度的均值及方差的乘积越大,说明样本集内存在部分噪声表现程度大的样本数据,且对应的噪声表现程度水平越高,更易于噪声的异常检测,则对应样本集的优选特征值越高;反映了样本数据相对前后两个样本数据的幅值孤立程度,该值越大,对应样本数据的孤立程度越高,越可能为噪声,对应的噪声表现程度应当也越高,当/>越趋近于1时,说明对应样本集内的样本数据越符合噪声表现程度高的样本数据越孤立、噪声表现程度低的样本数据越集中的特点,样本数据的噪声表现程度越准确,相反当比值与1的差值绝对值越大时,说明样本数据的噪声表现程度与局部幅值孤立程度越不一致,越不符合噪声特点,对于后续的噪声异常检测准确性也越低,则样本集的优选特征值也越低。
又考虑到空气质量监测数据随时间而变化,样本集内样本数据的时序不连续将对噪声的异常检测结果产生一定影响。故本发明实施例进一步根据优选特征值及样本集内样本数据的整体时序连续性,获取每个样本集的样本集优选程度。
优选地,在本发明的一个实施例中,样本集优选程度的获取方法包括:样本集内的样本数据以采集时刻的先后顺序进行排序;获取每个样本集内相邻样本数据的采样时间间隔,将所有采样时间间隔的方差进行负相关映射,得到样本集内样本数据的整体时序连续特征值;将时序连续特征值乘以对应样本集的优选特征值后映射到指数函数,得到样本集优选程度。样本集优选程度的计算公式为:
其中,为第/>个样本集的样本集优选程度;/>为第/>个样本集的优选特征值;为第/>个样本集内所有相邻样本数据的对应采样时间间隔的时间间隔方差;/>为标准归一化函数。
样本集优选程度的计算公式中,具体将时间间隔方差做倒数运算进行负相关映射,样本集内所有相邻样本数据的对应采样时间间隔的时间间隔方差越大,说明样本集内样本数据的时序连续性越低,样本集对于噪声数据的异常检测优选程度越低;而样本集的优选特征值越大,则说明样本集内样本数据的越适合噪声的异常检测。
对于任意一个采样时刻下的目标气体浓度,其可能出现在不同的样本集内,每个样本集内样本数据的时序集中性不一致,在时序集中性越低的样本集中可能使得异常波动数据在样本集内的孤立程度更为明显,从而可能导致异常波动数据获取较高的异常得分,影响噪声检测的准确性;故本发明实施例根据每个样本集优选程度及对应样本集内每个样本数据的局部时序连续性,获取每个样本集内每个样本数据的样本优选程度,进而根据样本优选程度调整每个样本数据在不同样本集对应孤立树中的路径长度。
优选地,在本发明的一个实施例中,样本优选程度的获取方法包括:样本集内的样本数据以采集时刻的先后顺序进行排序;在每个样本集中,以每个样本数据为起点,在样本集中沿时序方向获取预设第二数量个样本数据作为时序参考样本数据,获取每个时序参考样本数据与起点对应样本数据间的采样时刻间隔的均值,将均值进行负相关映射后作为每个起点对应样本数据的时序连续参考值;将时序连续参考值乘以对应样本数据所在样本集的样本集优选程度,得到每个样本集内每个样本数据的样本优选程度。样本优选程度的计算公式为:
其中,为第/>个样本数据在第/>个样本集内的样本优选程度;/>为第/>个样本数据所在的第/>个样本集的样本集优选程度;/>为样本集内样本数据的排序序号;/>为第/>个样本集内第/>个样本数据的采集时刻;/>为第/>个样本集内第/>个样本数据的采集时刻;/>为预设第二数量;在本发明的一个实施例中,预设第二数量/>取6,实施者可根据具体实施情况自行设定。
样本优选程度的计算公式中,每个时序参考样本数据与对应样本数据间的采样时刻间隔的均值越大,说明对应样本数据的局部时序越不连续,对噪声的异常检测影响越大;故通过倒数运算进行负相关映射,将时序连续参考值作为权重与对应样本集的优选程度进行合并,获取样本优选程度;时间连续参考值越大且对应样本集的优选程度越高,对应样本数据的样本优选程度越高。
步骤S4,根据样本优选程度调整每个孤立树上每个样本数据的路径长度,获取每个目标气体浓度的异常得分;根据异常得分对目标气体浓度降噪,得到目标气体浓度的监测结果。
获取每个样本数据在每个孤立树中的样本优选程度后,就可以利用样本优选程度调整每个孤立树上每个样本数据的路径长度,从而获得每个目标气体浓度数据的最终异常得分,为目标气体浓度数据降噪提供依据。
优选地,在本发明的一个实施例中,以任一样本集内样本数据为目标数据,将目标数据在所有样本集内的样本优选程度之和作为分母,目标数据在对应样本集内的样本优选程度作为分子,分子与分母的比值作为对应目标数据在对应孤立树中的路径长度的权重;将权重乘以路径长度,得到调整后的路径长度。路径长度调整计算公式为:
其中,为第/>个样本数据在第/>个样本集内的调整后的路径长度;/>为第/>个样本数据在第/>个样本集内的路径长度;/>为第/>个样本数据在第/>个样本集内的样本优选程度;/>为样本集的序号;/>为样本集的总数量,在本发明实施例中,样本集的总数量即孤立树的总数量为50,实施者可在构建孤立森林时调整相关参数确定样本集的数量。
路径长度调整计算公式中,将目标样本数据在每个样本集中的样本优选程度占总样本优选程度的比例作为调整路径的权重,权重越大,说明目标样本数据在对应样本集的孤立树中的优选程度越高,获取的路径长度越准确,最终对噪声的检测准确性也越高,故调整幅度越小;反之,样本优选程度越低,样本对应路径长度的误差越大越不准确,调整幅度越大,越将对应路径长度缩小。
对每个目标气体浓度在对应样本集的孤立树中的路径长度进行调整后,可以根据调整后的路径长度获取每个目标气体浓度的异常得分;根据调整后的路径长度获取异常得分已是本领域技术人员所熟知的技术手段,在此不再赘述。
获取每个采集时刻下每个目标气体浓度的异常得分后,可以对疑似为噪声的异常得分较高的目标气体浓度进行剔除降噪。
优选地,在本发明的一个实施例中,将异常得分大于预设阈值的目标气体浓度作为噪声数据进行剔除,并将噪声数据对应采样时刻相距最近的两个采样时刻的两个目标气体数据的浓度均值作为噪声数据的修正值剔除数据进行填补。其中,异常得分的预设阈值设置为0.75,实施者可根据具体实施情况进行设定。
同样的,氮氧化物也是一种有害气体,实施者可根据上述对臭氧浓度数据的降噪方法对氮氧化物浓度进行处理,准确监测氮氧化物的浓度变化,实施者还可以通过采集分析其他种类的有害气体进行处理监测,在此不再赘述。
对空气质量监测数据进行降噪后,站房的运维人员便可准确对站房内的空气质量进行异常评估及智能监测,从而采取相应的预警及处理措施,以保证空气质量及站房内的环境安全。
综上所述,本发明首先获取当前采样时刻的预设历史时段中站房内的一种目标气体浓度和一种参考气体浓度;根据每个采样时刻下目标气体浓度的局部波动特征及目标气体浓度与参考气体浓度的局部波动一致性,获取每个采样时刻下目标气体浓度的噪声表现程度;以每个采样时刻下的目标气体浓度为一个样本数据,根据所有样本数据构建孤立树,获取每个孤立树对应的样本集及每个孤立树上每个样本数据的路径长度;根据每个样本集内每个样本数据的局部波动特征及噪声表现,获取每个样本集的优选特征值;进而结合样本集内样本数据的整体时序连续性,获取每个样本集的样本集优选程度;根据每个样本集优选程度及对应样本集内每个样本数据的局部时序连续性,获取每个样本集内每个样本数据的样本优选程度;根据样本优选程度调整每个孤立树上每个样本数据的路径长度,获取每个目标气体浓度的异常得分进而对目标气体浓度降噪,得到对目标气体浓度的监测结果。本发明通过分析噪声的变化速度及变化速度稳定性获取每个目标气体浓度的噪声表现程度,进而根据噪声表现程度获取每个目标气体浓度在对应孤立树中的样本优先度,从而对其路径长度进行修正,准确每个目标其他浓度为噪声的异常得分,从而能够准确去噪,提高了空气质量监测准确性及效率。
本发明还提出一种站房空气质量智能监测系统,系统包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现一种站房空气质量智能监测方法的步骤。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。

Claims (2)

1.一种站房空气质量智能监测方法,其特征在于,所述方法包括:
获取当前采样时刻的预设历史时段中站房内所有空气质量监测数据,所述空气质量监测数据包括一种目标气体浓度和一种参考气体浓度,其中所述目标气体浓度受所述参考气体浓度的波动影响;
根据每个采样时刻下所述目标气体浓度的局部波动特征及所述目标气体浓度与所述参考气体浓度的局部波动一致性,获取每个采样时刻下所述目标气体浓度的噪声表现程度;
以每个采样时刻下的所述目标气体浓度为一个样本数据,根据所有样本数据构建孤立树,获取每个所述孤立树对应的样本集及每个所述孤立树上每个样本数据的路径长度;根据每个所述样本集内每个样本数据的局部波动特征及噪声表现,获取每个所述样本集的优选特征值;根据所述优选特征值及所述样本集内样本数据的整体时序连续性,获取每个所述样本集的样本集优选程度;根据每个所述样本集优选程度及对应所述样本集内每个所述样本数据的局部时序连续性,获取每个所述样本集内每个所述样本数据的样本优选程度;
根据所述样本优选程度调整每个所述孤立树上每个样本数据的所述路径长度,获取每个所述目标气体浓度的异常得分;根据所述异常得分对所述目标气体浓度降噪,得到所述目标气体浓度的监测结果;
所述噪声表现程度的获取方法包括:
根据每个所述目标气体浓度的局部幅值变化速度及局部幅值变化稳定程度,获取第一噪声表现程度;
在每个采样时刻下,根据每个所述目标气体浓度与所述参考气体浓度的局部幅值变化速度一致性,及所述目标气体浓度与所述参考气体浓度的局部幅值变化速度稳定程度的一致性,获取第二噪声表现程度;
将所述第一噪声表现程度与所述第二噪声表现程度的和作为所述噪声表现程度;
所述第一噪声表现程度的计算公式包括:
;其中,/>为第/>个目标气体浓度的第一噪声表现程度;/>为预设邻域内一阶差的序号;/>为预设邻域内二阶差的序号;/>为预设邻域内目标气体浓度的总数量;/>为第/>个目标气体浓度的预设邻域内第/>个一阶差;/>为第/>个目标气体浓度的预设邻域内第/>个二阶差;/>为第/>个目标气体浓度的预设邻域内相邻一阶差的符号变化次数;/>为标准归一化函数;
所述第二噪声表现程度的计算公式包括:
;其中,/>为第/>个目标气体浓度的第二噪声表现程度;/>为预设邻域内一阶差的序号;/>为预设邻域内二阶差的序号;/>为预设邻域内目标气体浓度的总数量;/>为第/>个目标气体浓度的预设邻域内第/>个一阶差;/>为第/>个参考气体浓度的预设邻域内第/>个一阶差;/>为第/>个目标气体浓度的预设邻域内第/>个二阶差;/>第/>个参考气体浓度的预设邻域内第/>个二阶差;/>为标准归一化函数;
所述优选特征值的获取方法包括:
所述样本集内的样本数据以采集时刻的先后顺序进行排序;根据优选特征值的计算公式获取优选特征值;优选特征值的计算公式为:
;其中,/>为第/>个样本集的优选特征值;/>为第/>个样本集内所有样本数据的噪声表现程度的均值;/>为第/>个样本集内所有样本数据的噪声表现程度的方差;/>为第/>个样本集内样本数据的序号;/>为第/>个样本数据的噪声表现程度;/>为第/>个样本集内样本数据的总数量;/>为第/>个样本集内第/>个样本数据的浓度幅值;/>为第/>个样本集内第个样本数据的浓度幅值;/>为第/>个样本集内第/>个样本数据的浓度幅值;为取最小值函数;/>为标准归一化函数;/>为预设第一正参数;/>为预设第二正参数;
所述样本集优选程度的获取方法包括:
所述样本集内的样本数据以采集时刻的先后顺序进行排序;获取每个所述样本集内相邻样本数据的采样时间间隔,将所有所述采样时间间隔的方差进行负相关映射,得到所述样本集内样本数据的整体时序连续特征值;
将所述时序连续特征值乘以对应所述样本集的所述优选特征值后映射到指数函数,得到样本集优选程度;
样本优选程度的获取方法包括:
所述样本集内的样本数据以采集时刻的先后顺序进行排序;在每个所述样本集中,以每个样本数据为起点,在所述样本集中沿时序方向获取预设第二数量个样本数据作为时序参考样本数据,获取每个所述时序参考样本数据与起点对应样本数据间的采样时刻间隔的均值,将所述均值进行负相关映射后作为每个起点对应所述样本数据的时序连续参考值;将所述时序连续参考值乘以对应所述样本数据所在所述样本集的样本集优选程度,得到每个所述样本集内每个所述样本数据的样本优选程度;
所述路径长度的调整方法包括:
以任一所述样本集内所述样本数据为目标数据,将所述目标数据在所有所述样本集内的所述样本优选程度之和作为分母,所述目标数据在对应所述样本集内的所述样本优选程度作为分子,分子与分母的比值作为对应所述目标数据在对应孤立树中的路径长度的权重;将所述权重乘以所述路径长度,得到调整后的路径长度;
降噪方法包括:
将所述异常得分大于预设阈值的所述目标气体浓度作为噪声数据进行剔除,并将与所述噪声数据对应采样时刻相距最近的两个采样时刻的两个所述目标气体数据的浓度均值作为所述噪声数据的修正值对剔除数据进行填补。
2.一种站房空气质量智能监测系统,其特征在于,所述系统包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1所述一种站房空气质量智能监测方法的步骤。
CN202410026275.6A 2024-01-09 2024-01-09 一种站房空气质量智能监测方法及系统 Active CN117538491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410026275.6A CN117538491B (zh) 2024-01-09 2024-01-09 一种站房空气质量智能监测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410026275.6A CN117538491B (zh) 2024-01-09 2024-01-09 一种站房空气质量智能监测方法及系统

Publications (2)

Publication Number Publication Date
CN117538491A CN117538491A (zh) 2024-02-09
CN117538491B true CN117538491B (zh) 2024-04-05

Family

ID=89788406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410026275.6A Active CN117538491B (zh) 2024-01-09 2024-01-09 一种站房空气质量智能监测方法及系统

Country Status (1)

Country Link
CN (1) CN117538491B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117747040B (zh) * 2024-02-20 2024-05-24 济南宝林信息技术有限公司 一种产妇产后护理状况远程监控方法及系统
CN117829381B (zh) * 2024-03-05 2024-05-14 成都农业科技职业学院 基于物联网的农业大棚数据优化采集系统
CN117851766B (zh) * 2024-03-08 2024-06-11 济宁万生环保材料有限公司 一种dotp粗酯连续蒸馏过程温度数据监测方法
CN118053531B (zh) * 2024-04-16 2024-06-14 大连杰伍科技有限公司 一种医学检验临床数据智能管理方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020010701A1 (zh) * 2018-07-11 2020-01-16 平安科技(深圳)有限公司 污染物异常监测方法、系统、计算机设备和存储介质
WO2020140678A1 (zh) * 2019-01-04 2020-07-09 深圳壹账通智能科技有限公司 异常申请检测方法、装置、计算机设备和存储介质
CN113239999A (zh) * 2021-05-07 2021-08-10 北京沃东天骏信息技术有限公司 数据异常检测方法、装置和电子设备
CN115577275A (zh) * 2022-11-11 2023-01-06 山东产业技术研究院智能计算研究院 一种基于lof和孤立森林的时序数据异常监测系统及方法
CN116383645A (zh) * 2023-03-22 2023-07-04 洪晓霞 一种基于异常检测的系统健康度智能监测评估方法
CN117030654A (zh) * 2023-10-10 2023-11-10 武汉怡特环保科技有限公司 一种空气中痕量级二氧化硫浓度测量方法
CN117238058A (zh) * 2023-11-10 2023-12-15 无锡明诚汽车部件有限公司 基于数据分析的汽车用起动机监测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11374919B2 (en) * 2020-11-18 2022-06-28 Okta, Inc. Memory-free anomaly detection for risk management systems

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020010701A1 (zh) * 2018-07-11 2020-01-16 平安科技(深圳)有限公司 污染物异常监测方法、系统、计算机设备和存储介质
WO2020140678A1 (zh) * 2019-01-04 2020-07-09 深圳壹账通智能科技有限公司 异常申请检测方法、装置、计算机设备和存储介质
CN113239999A (zh) * 2021-05-07 2021-08-10 北京沃东天骏信息技术有限公司 数据异常检测方法、装置和电子设备
CN115577275A (zh) * 2022-11-11 2023-01-06 山东产业技术研究院智能计算研究院 一种基于lof和孤立森林的时序数据异常监测系统及方法
CN116383645A (zh) * 2023-03-22 2023-07-04 洪晓霞 一种基于异常检测的系统健康度智能监测评估方法
CN117030654A (zh) * 2023-10-10 2023-11-10 武汉怡特环保科技有限公司 一种空气中痕量级二氧化硫浓度测量方法
CN117238058A (zh) * 2023-11-10 2023-12-15 无锡明诚汽车部件有限公司 基于数据分析的汽车用起动机监测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
fuzzy isoliation forest for anomaly detection;meriem chater 等;procedia computer science;20221019;第916-925页 *
基于孤立森林算法的取用水量异常数据检测方法;赵臣啸;薛惠锋;王磊;万毅;;中国水利水电科学研究院学报;20200215(第01期);第34-42页 *
基于模糊孤立森林算法的多维数据异常检测方法;李倩;韩斌;汪旭祥;;计算机与数字工程;20200420(第04期);第133-137页 *
孤立森林算法研究及并行化实现;王诚;狄萱;计算机技术与发展;20211231(第006期);第13-18页 *

Also Published As

Publication number Publication date
CN117538491A (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
CN117538491B (zh) 一种站房空气质量智能监测方法及系统
CN110087207B (zh) 无线传感器网络缺失数据重建方法
CN117272210A (zh) 一种建筑施工异常隐患数据检测方法及系统
CN117235652B (zh) 一种基于大数据的钢丝加工环境监管方法及系统
CN110717472B (zh) 基于改进的小波阈值去噪的故障诊断方法及系统
CN109404285A (zh) 一种螺杆式压缩机故障诊断的改进混洗蛙跳算法增强自适应带通滤波方法
CN117786325B (zh) 一种大口径物联网水表的环境温度智慧预警系统
CN117503204B (zh) 一种超声ai数字诊疗系统
CN116738207A (zh) 一种基于数据分析获取滑动观察窗口长度的方法
KR102342106B1 (ko) 인체상태 판단을 위한 비접촉식 생체신호 분석 시스템
CN105138823B (zh) 一种基于自相关函数的生理信号质量检测方法
CN111709279B (zh) 一种利用svd-emd算法分离微地震噪声混合信号的算法
RU2351005C1 (ru) Способ оценки параметров сигнала и устройство для реализации способа (варианты)
CN115774081A (zh) 一种电子元器件车间用有毒气体排放监测系统
Sivaranjini et al. Computationally-efficient pulse rate estimation from compressed ppg measurements for continuous vital signs monitoring
CN112545501A (zh) 一种血液成分浓度检测方法及装置
CN107506779B (zh) 一种植物茎干含水量的估算方法及系统
CN117875794B (zh) 一种能源电力数据质量评估方法
CN112268608A (zh) 一种强干扰dvs的高精度解调算法
CN117368870B (zh) 一种微波散射计载荷特性评估方法、装置及设备
CN112826460B (zh) 生理信号频率提取方法、装置、生理信号采集设备和介质
CN117971625B (zh) 基于计算机云平台的性能数据智能监测系统
CN118053531B (zh) 一种医学检验临床数据智能管理方法及系统
CN109635481B (zh) 一种用于穿戴设备的数据分析系统
CN118171135B (zh) 基于多源数据融合的水产养殖环境监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant