CN117540327B - 一种企业环境自主管理数据采集处理系统 - Google Patents

一种企业环境自主管理数据采集处理系统 Download PDF

Info

Publication number
CN117540327B
CN117540327B CN202410026591.3A CN202410026591A CN117540327B CN 117540327 B CN117540327 B CN 117540327B CN 202410026591 A CN202410026591 A CN 202410026591A CN 117540327 B CN117540327 B CN 117540327B
Authority
CN
China
Prior art keywords
data
target
cluster
dimension
enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410026591.3A
Other languages
English (en)
Other versions
CN117540327A (zh
Inventor
梁天池
刘思焜
龙超君
余姝洁
罗旌生
李钰基
田雷
郑浩旻
罗冬怡
李楚蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongshan Environmental Protection Technology Center
Original Assignee
Zhongshan Environmental Protection Technology Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongshan Environmental Protection Technology Center filed Critical Zhongshan Environmental Protection Technology Center
Priority to CN202410026591.3A priority Critical patent/CN117540327B/zh
Publication of CN117540327A publication Critical patent/CN117540327A/zh
Application granted granted Critical
Publication of CN117540327B publication Critical patent/CN117540327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及环境数据采集测量技术领域,具体涉及一种企业环境自主管理数据采集处理系统,该系统通过多个模块之间的相互配合可以实现以下步骤:通过传感器,采集待监测区域内每个待监测企业在预设历史时间段内每种预设维度下的维度数据,对目标环境数据进行聚类;根据所有聚类中心包括的同一种预设维度下的维度数据进行直线拟合;确定簇异常程度和数据异常程度;确定待监测企业对应的环境异常程度;根据环境异常程度和历史采集周期,确定当前采集周期;根据每个待监测企业对应的当前采集周期,采集每个待监测企业在当前时间段内的目标环境数据。本发明实现了环境数据的采集,提高了环境数据采集周期设置的合理性。

Description

一种企业环境自主管理数据采集处理系统
技术领域
本发明涉及环境数据采集测量技术领域,具体涉及一种企业环境自主管理数据采集处理系统。
背景技术
随着时代的发展,对企业环境质量的要求也相应提高,一般要求企业环境质量达标之后才可以进行正常的生产活动,然而,在企业生产过程中可能由于忽视环境维护等原因,导致企业环境质量变差,因此对环境质量达标企业的后续环境质量监测至关重要。在对环境质量监测的过程中往往需要采集相关的环境数据。目前,对数据进行采集时,通过采用的方法为:通过预设采集周期,对数据进行采集。
然而,当通过预设采集周期,对环境数据进行采集时,经常会存在如下技术问题:
由于预设采集周期往往是通过人工经验设置的采集周期,所以预设采集周期的设置往往受到人为主观因素的影响,从而导致环境数据的采集周期设置的合理性较差,进而导致环境质量监测的准确度较差。
发明内容
为了解决环境数据的采集周期设置的合理性较差的技术问题,本发明提出了一种企业环境自主管理数据采集处理系统。
本发明提供了一种企业环境自主管理数据采集处理系统,该系统包括:
获取聚类模块,用于获取待监测区域内的每个待监测企业在预设历史时间段内每种预设维度下的维度数据,并将同一个待监测企业在同一个时刻下采集的所有预设维度下的维度数据,组合为目标环境数据,对所有目标环境数据进行聚类,得到目标聚类簇;
直线拟合模块,用于根据所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到该种预设维度对应的拟合直线;
簇异常确定模块,用于根据每个目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,确定每个目标聚类簇对应的簇异常程度;
数据异常确定模块,用于根据每个目标环境数据所属目标聚类簇对应的簇异常程度,以及每个目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异,确定每个目标环境数据对应的数据异常程度;
环境异常确定模块,用于根据每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,确定每个待监测企业对应的环境异常程度;
周期确定模块,用于根据每个待监测企业对应的环境异常程度和历史采集周期,确定每个待监测企业对应的当前采集周期;
数据采集模块,用于根据每个待监测企业对应的当前采集周期,采集每个待监测企业在当前时间段内的目标环境数据。
可选地,所述对所有目标环境数据进行聚类,得到目标聚类簇,包括:
通过不限类别个数的聚类算法,对所有目标环境数据进行聚类,并将得到的每个聚类簇,确定为初始聚类簇;
若初始聚类簇的数量大于或等于预设数量,则将每个初始聚类簇,确定为目标聚类簇;
若初始聚类簇的数量小于预设数量,则通过限制类别个数的聚类算法,将所有的目标环境数据聚类为预设数量个聚类簇,并将最新聚类得到的每个聚类簇,确定为目标聚类簇。
可选地,所述根据所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到该种预设维度对应的拟合直线,包括:
将任意一种预设维度确定为标记维度,对所有目标聚类簇中所有目标环境数据包括的标记维度下的维度数据进行升序,得到所述标记维度对应的维度数据序列;
从所述维度数据序列中筛选出所有目标聚类簇的聚类中心包括的维度数据,作为参考数据,得到所述标记维度对应的参考数据集合;
以所述参考数据集合中的参考数据在所属维度数据序列的序号为横坐标,以所述参考数据集合中的参考数据为纵坐标,对所述参考数据集合进行直线拟合,得到所述标记维度对应的拟合直线。
可选地,所述根据每个目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,确定每个目标聚类簇对应的簇异常程度,包括:
将任意一个维度数据确定为标记数据,将所述标记数据在所属维度数据序列中的序号,确定为所述标记数据对应的目标坐标包括的横坐标,并将所述标记数据,确定为所述标记数据对应的目标坐标包括的纵坐标;
将所述标记数据对应的目标坐标与所述标记数据所属预设维度对应的拟合直线之间的距离,确定为所述标记数据对应的偏离距离;
将任意一个目标聚类簇确定为标记聚类簇,根据所述标记聚类簇的聚类中心包括的所有维度数据对应的偏离距离,确定所述标记聚类簇对应的目标距离,其中,偏离距离与目标距离呈正相关;
根据所述标记聚类簇中所有目标环境数据,确定所述标记聚类簇对应的目标离散程度;
根据所述标记聚类簇对应的目标离散程度和目标距离,确定所述标记聚类簇对应的簇异常程度,其中,所述标记聚类簇对应的目标离散程度和目标距离均与其对应的簇异常程度呈正相关。
可选地,所述根据所述标记聚类簇中所有目标环境数据,确定所述标记聚类簇对应的目标离散程度,包括:
将所述标记聚类簇中所有目标环境数据包括的同一种预设维度下的维度数据的标准差,确定为所述标记聚类簇在该种预设维度下的离散因子;
将所述标记聚类簇在所有预设维度下的离散因子的均值,确定为所述标记聚类簇对应的目标离散程度。
可选地,目标聚类簇对应的簇异常程度对应的公式为:
;/>;其中,/>是第i个目标聚类簇对应的簇异常程度;i是目标聚类簇的序号;/>是归一化函数;/>是第i个目标聚类簇对应的目标距离;/>是第i个目标聚类簇对应的目标离散程度;n是预设维度的种类总数;j是预设维度的种类序号;/>是第i个目标聚类簇的聚类中心包括的第j种预设维度下的维度数据对应的偏离距离。
可选地,目标环境数据对应的数据异常程度对应的公式为:
;其中,/>是第i个目标聚类簇中,第m个目标环境数据对应的数据异常程度;i是目标聚类簇的序号;m是第i个目标聚类簇中目标环境数据的序号;/>是归一化函数;/>是第i个目标聚类簇对应的簇异常程度;n是预设维度的种类总数;j是预设维度的种类序号;/>是取绝对值函数;/>是第i个目标聚类簇中,第m个目标环境数据包括的第j种预设维度下的维度数据;/>是第i个目标聚类簇中,所有目标环境数据包括的第j种预设维度下的维度数据的均值;/>是第i个目标聚类簇中,所有目标环境数据包括的第j种预设维度下的维度数据的标准差;/>是预先设置的大于0的因子;/>表征第m个目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异。
可选地,所述根据每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,确定每个待监测企业对应的环境异常程度,包括:
将每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度的均值,确定为每个待监测企业对应的环境异常程度。
可选地,待监测企业对应的当前采集周期对应的公式为:
;/>;其中,/>是第a个待监测企业对应的当前采集周期;a是待监测企业的序号;/>是向上取整函数;/>是第a个待监测企业对应的历史采集周期;/>是以自然常数为底的指数函数;/>是第a个待监测企业对应的环境得分;H是预设超参数;/>是第a个待监测企业对应的环境异常程度。
可选地,所述系统实现的方法还包括:
当待监测企业对应的环境异常程度大于预设异常阈值时,将待监测企业标记为环境异常企业。
本发明具有如下有益效果:
本发明的一种企业环境自主管理数据采集处理系统,实现了环境数据的采集,解决了环境数据的采集周期设置的合理性较差的技术问题,提高了环境数据采集周期设置的合理性。首先,获取每个待监测企业在预设历史时间段内每种预设维度下的维度数据,可以便于后续分析待监测企业在预设历史时间段内的环境质量变化情况,由于环境质量变化情况往往影响采集周期的大小,比如,环境质量发生较大变化,或者说出现异常变化时,为了更好地分析变化原因进行相应处理等,往往需要采集更多的数据,即此时往往需要调小采集周期,因此,获取每个待监测企业在预设历史时间段内每种预设维度下的维度数据,可以便于后续自适应调整当前时间段内的采集周期。其次,对目标环境数据进行聚类,可以便于后续分析环境质量变化情况。然后,由于不同企业的规模往往不同,所以不同企业在同一维度下的维度数据往往不同,但是在企业数量较多时,不同企业在同一维度下的维度数据往往呈线性关系,故基于所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到的拟合直线可以表征多个待监测企业在该预设维度下维度数据的整体分布情况。接着,综合考虑目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,量化的目标聚类簇对应的簇异常程度可以表征该目标聚类簇的异常情况,其值越大,往往说明该目标聚类簇越异常。其次,量化的目标环境数据对应的数据异常程度可以表征该目标环境数据的异常情况,其值较大,往往说明该目标环境数据相对比较异常。之后,综合考虑待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,量化的待监测企业对应的环境异常程度可以表征待监测企业在预设历史时间段内发生环境异常变化的情况,其值越大,往往说明该待监测企业在预设历史时间段内发生的环境异常变化越大,往往说明越需要调小该待监测企业在当前时间段内的采集周期。而后,基于待监测企业对应的环境异常程度和历史采集周期,可以提高待监测企业对应的当前采集周期确定的准确度。并且相较于通过人工经验设置的采集周期,本发明量化了多个与环境异常相关的指标,比如,簇异常程度、数据异常程度和环境异常程度,在一定程度上减少了人为主观因素的影响,从而相对比较准确客观地确定了待监测企业在当前时间段内的采集周期,进而提高了目标环境数据采集周期设置的合理性。最后,基于每个待监测企业对应的当前采集周期,可以实现对每个待监测企业在当前时间段内目标环境数据的采集,从而提高了目标环境数据采集周期设置的合理性,进而提高了环境质量监测的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明的一种企业环境自主管理数据采集处理系统的结构示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一个实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本发明提供了一种企业环境自主管理数据采集处理系统,该系统包括:
获取聚类模块,用于获取待监测区域内的每个待监测企业在预设历史时间段内每种预设维度下的维度数据,并将同一个待监测企业在同一个时刻下采集的所有预设维度下的维度数据,组合为目标环境数据,对所有目标环境数据进行聚类,得到目标聚类簇;
直线拟合模块,用于根据所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到该种预设维度对应的拟合直线;
簇异常确定模块,用于根据每个目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,确定每个目标聚类簇对应的簇异常程度;
数据异常确定模块,用于根据每个目标环境数据所属目标聚类簇对应的簇异常程度,以及每个目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异,确定每个目标环境数据对应的数据异常程度;
环境异常确定模块,用于根据每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,确定每个待监测企业对应的环境异常程度;
周期确定模块,用于根据每个待监测企业对应的环境异常程度和历史采集周期,确定每个待监测企业对应的当前采集周期;
数据采集模块,用于根据每个待监测企业对应的当前采集周期,采集每个待监测企业在当前时间段内的目标环境数据。
参考图1,示出了根据本发明的一种企业环境自主管理数据采集处理系统的结构示意图。该企业环境自主管理数据采集处理系统,包括:
获取聚类模块101,用于获取待监测区域内的每个待监测企业在预设历史时间段内每种预设维度下的维度数据,并将同一个待监测企业在同一个时刻下采集的所有预设维度下的维度数据,组合为目标环境数据,对所有目标环境数据进行聚类,得到目标聚类簇。
在一些实施例中,可以获取待监测区域内的每个待监测企业在预设历史时间段内每种预设维度下的维度数据,并将同一个待监测企业在同一个时刻下采集的所有预设维度下的维度数据,组合为目标环境数据,对所有目标环境数据进行聚类,得到目标聚类簇。
其中,待监测区域可以是待进行环境监测的区域。例如,待监测区域可以是某个城市或某个工业园区。待监测企业可以是在预设历史时间段之前环境质量达标的企业。各个待监测企业在预设历史时间段之前的环境质量情况可以相近。比如,环境质量等级相同可以认为环境质量情况相近。预设历史时间段可以是预先设置的历史时间段。例如,若预设历史时间段对应的时长为1天,则预设历史时间段可以为昨天。预设维度可以是预先设置的与企业环境质量相关的维度。例如,预设维度可以是但不限于:用水维度、用电维度、VOCS(Volatile Organic Compounds,挥发性有机物)维度和日常环境巡查维度。维度数据可以是与企业环境质量相关的环境数据。预设维度下的维度数据可以是预设维度值。例如,若预设维度为用水维度,则该预设维度下的维度数据可以是用水量,用水量所属的预设维度可以为用水维度。
需要说明的是,获取每个待监测企业在预设历史时间段内每种预设维度下的维度数据,可以便于后续分析待监测企业在预设历史时间段内的环境质量变化情况,由于环境质量变化情况往往影响采集周期的大小,比如,环境质量发生较大变化,或者说出现异常变化时,为了更好地分析变化原因进行相应处理等,往往需要采集更多的数据,即此时往往需要调小采集周期,因此,获取每个待监测企业在预设历史时间段内每种预设维度下的维度数据,可以便于后续自适应调整当前时间段内的采集周期。其次,对目标环境数据进行聚类,可以便于后续分析环境质量变化情况。
作为示例,本步骤可以包括以下步骤:
第一步,获取待监测区域内的每个待监测企业在预设历史时间段内每种预设维度下的维度数据,并将同一个待监测企业在同一个时刻下采集的所有预设维度下的维度数据,组合为目标环境数据。
例如,记任意一个待监测企业为候选企业,若共有4种预设维度,分别为用水维度、用电维度、VOCS维度和日常环境巡查维度,并且候选企业对应的历史采集周期为5分钟,则在预设历史时间段内,可以通过流量计量设备,每隔5分钟采集一次候选企业的用水量,作为候选企业在用水维度下的维度数据,其中,采集的用水量可以等于预设时间间隔内的总用水量,预设时间间隔可以是预先设置的时间间隔,比如,若预设时间间隔为1分钟,则2023年12月14日16时36分采集的候选企业的用水量可以是:候选企业在2023年12月14日16时35分至2023年12月14日16时36分之间的总用水量;在预设历史时间段内,可以通过功率传感器,每隔5分钟采集一次候选企业的用电量,作为候选企业在用电维度下的维度数据,其中,采集的用电量可以等于预设时间间隔内的总用电量;在预设历史时间段内,可以通过浓度传感器,每隔5分钟采集一次候选企业的VOCS浓度,作为候选企业在VOCS维度下的维度数据;在预设历史时间段内,可以通过管理人员日常环境巡查,每隔5分钟采集一次候选企业的日常环境巡查得分,作为候选企业在日常环境巡查维度下的维度数据,其中,日常环境巡查得分可以是管理人员日常环境巡查对企业环境的打分;并将同一个时刻下采集的候选企业的用水量、用电量、VOCS浓度和日常环境巡查得分,组合为一个目标环境数据,即此时的目标环境数据可以包括:用水量、用电量、VOCS浓度和日常环境巡查得分。其中,候选企业对应的历史采集周期可以是在预设历史时间段内采集候选企业相关环境数据的周期。流量计量设备可以是但不限于:涡街流量计、电磁流量计和瞬时流量计。
第二步,对所有目标环境数据进行聚类,得到目标聚类簇可以包括以下子步骤:
第一子步骤,通过不限类别个数的聚类算法,对所有目标环境数据进行聚类,并将得到的每个聚类簇,确定为初始聚类簇。
其中,不限类别个数的聚类算法可以是进行聚类时不要求设置聚类数量的聚类算法。例如,不限类别个数的聚类算法可以是ISODATA(Iterative Selforganizing DataAnalysis Techniques Algorithm,迭代自组织聚类)算法。
比如,可以根据目标环境数据包括的所有维度数据,通过ISODATA算法,对所有目标环境数据进行聚类,并将得到的每个聚类簇,确定为初始聚类簇。
第二子步骤,若初始聚类簇的数量大于或等于预设数量,则将每个初始聚类簇,确定为目标聚类簇。
其中,预设数量可以是预先设置的数量。预设数量大于或等于进行直线拟合需要的数据量,即预设数量可以大于或等于2。比如,预设数量可以是5。
需要说明的是,预设数量相对越大,后续进行直线拟合得到的直线越可以表征多个待监测企业在预设维度下维度数据的整体分布情况。
第三子步骤,若初始聚类簇的数量小于预设数量,则通过限制类别个数的聚类算法,将所有的目标环境数据聚类为预设数量个聚类簇,并将最新聚类得到的每个聚类簇,确定为目标聚类簇。
其中,限制类别个数的聚类算法可以是进行聚类时要求设置聚类数量的聚类算法。例如,限制类别个数的聚类算法可以是K-means(K-means clustering algorithm,K均值聚类)算法。
比如,若初始聚类簇的数量小于预设数量,则可以根据目标环境数据包括的所有维度数据,通过K-means算法,对所有目标环境数据进行聚类,并将此时聚类得到的每个聚类簇,确定为目标聚类簇。
直线拟合模块102,用于根据所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到该种预设维度对应的拟合直线。
在一些实施例中,可以根据所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到该种预设维度对应的拟合直线。
需要说明的是,由于不同企业的规模往往不同,所以不同企业在同一维度下的维度数据往往不同,但是在企业数量较多时,不同企业在同一维度下的维度数据往往呈线性关系,故基于所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到的拟合直线可以表征多个待监测企业在该预设维度下维度数据的整体分布情况。
作为示例,本步骤可以包括以下步骤:
第一步,将任意一种预设维度确定为标记维度,对所有目标聚类簇中所有目标环境数据包括的标记维度下的维度数据进行升序,得到上述标记维度对应的维度数据序列。
其中,所有目标聚类簇中所有目标环境数据,也就是预设历史时间段内采集的所有目标环境数据。
第二步,从上述维度数据序列中筛选出所有目标聚类簇的聚类中心包括的维度数据,作为参考数据,得到上述标记维度对应的参考数据集合。
其中,参考数据集合中参考数据的数量可以等于目标聚类簇的数量,或者说参考数据集合中参考数据的数量可以等于聚类中心的数量。
第三步,以上述参考数据集合中的参考数据在所属维度数据序列的序号为横坐标,以上述参考数据集合中的参考数据为纵坐标,对上述参考数据集合进行直线拟合,得到上述标记维度对应的拟合直线。
簇异常确定模块103,用于根据每个目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,确定每个目标聚类簇对应的簇异常程度。
在一些实施例中,可以根据每个目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,确定每个目标聚类簇对应的簇异常程度。
需要说明的是,综合考虑目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,量化的目标聚类簇对应的簇异常程度可以表征该目标聚类簇的异常情况,其值越大,往往说明该目标聚类簇越异常。
作为示例,本步骤可以包括以下步骤:
第一步,将任意一个维度数据确定为标记数据,将标记数据在所属维度数据序列中的序号,确定为标记数据对应的目标坐标包括的横坐标,并将标记数据,确定为标记数据对应的目标坐标包括的纵坐标。
第二步,将标记数据对应的目标坐标与标记数据所属预设维度对应的拟合直线之间的距离,确定为标记数据对应的偏离距离。
第三步,将任意一个目标聚类簇确定为标记聚类簇,根据标记聚类簇的聚类中心包括的所有维度数据对应的偏离距离,确定标记聚类簇对应的目标距离。
其中,偏离距离可以与目标距离呈正相关。
第四步,根据标记聚类簇中所有目标环境数据,确定标记聚类簇对应的目标离散程度可以包括以下子步骤:
第一子步骤,将标记聚类簇中所有目标环境数据包括的同一种预设维度下的维度数据的标准差,确定为标记聚类簇在该种预设维度下的离散因子。
第二子步骤,将标记聚类簇在所有预设维度下的离散因子的均值,确定为标记聚类簇对应的目标离散程度。
第五步,根据标记聚类簇对应的目标离散程度和目标距离,确定标记聚类簇对应的簇异常程度。
其中,标记聚类簇对应的目标离散程度和目标距离均可以与其对应的簇异常程度呈正相关。
例如,确定目标聚类簇对应的簇异常程度对应的公式可以为:
;/>;其中,/>是第i个目标聚类簇对应的簇异常程度。i是目标聚类簇的序号。/>是归一化函数。/>是第i个目标聚类簇对应的目标距离。/>是第i个目标聚类簇对应的目标离散程度。n是预设维度的种类总数。j是预设维度的种类序号。/>是第i个目标聚类簇的聚类中心包括的第j种预设维度下的维度数据对应的偏离距离。
需要说明的是,当越大时,往往说明第i个目标聚类簇的聚类中心包括的第j种预设维度下的维度数据越偏离其所属预设维度对应的拟合直线,往往说明该维度数据越偏离其所属预设维度下维度数据的整体分布情况,往往说明该维度数据越可能是偏离预设历史时间段内所属维度整体分布的异常数据。当/>越大时,往往说明第i个目标聚类簇越可能存在异常变化。当/>越大时,往往说明第i个目标聚类簇内目标环境数据的分布相对越离散,往往说明第i个目标聚类簇的聚类效果越不好,往往说明第i个目标聚类簇相对越异常。因此,当/>越大时,往往说明第i个目标聚类簇越可能存在异常变化。
数据异常确定模块104,用于根据每个目标环境数据所属目标聚类簇对应的簇异常程度,以及每个目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异,确定每个目标环境数据对应的数据异常程度。
在一些实施例中,可以根据每个目标环境数据所属目标聚类簇对应的簇异常程度,以及每个目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异,确定每个目标环境数据对应的数据异常程度。
需要说明的是,综合考虑目标环境数据所属目标聚类簇对应的簇异常程度,以及目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异,量化的目标环境数据对应的数据异常程度可以表征该目标环境数据的异常情况,其值较大,往往说明该目标环境数据相对比较异常。
作为示例,确定目标环境数据对应的数据异常程度对应的公式可以为:
;其中,/>是第i个目标聚类簇中,第m个目标环境数据对应的数据异常程度。i是目标聚类簇的序号。m是第i个目标聚类簇中目标环境数据的序号。/>是归一化函数。/>是第i个目标聚类簇对应的簇异常程度。n是预设维度的种类总数。j是预设维度的种类序号。/>是取绝对值函数。/>是第i个目标聚类簇中,第m个目标环境数据包括的第j种预设维度下的维度数据。/>是第i个目标聚类簇中,所有目标环境数据包括的第j种预设维度下的维度数据的均值。/>是第i个目标聚类簇中,所有目标环境数据包括的第j种预设维度下的维度数据的标准差;也就是第i个目标聚类簇在第j种预设维度下的离散因子。/>是预先设置的大于0的因子,主要用于防止分母为0,例如,可以为0.01。/>表征第m个目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异。
需要说明的是,当越小时,往往说明第i个目标聚类簇越可能不存在异常变化,往往说明第i个目标聚类簇内的目标环境数据越可能是接近预设历史时间段内整体分布的环境数据。当/>越小时,往往说明第m个目标环境数据包括的第j种预设维度下的维度数据越相对靠近其所属目标聚类簇中第j种预设维度下的平均维度数据,往往说明第m个目标环境数据包括的第j种预设维度下的维度数据越可能是符合其所属目标聚类簇中第j种预设维度下数据分布的数据。因此,当/>越小时,往往说明第m个目标环境数据越可能是接近预设历史时间段内整体分布的环境数据。
环境异常确定模块105,用于根据每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,确定每个待监测企业对应的环境异常程度。
在一些实施例中,可以根据每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,确定每个待监测企业对应的环境异常程度。
需要说明的是,综合考虑待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,量化的待监测企业对应的环境异常程度可以表征待监测企业在预设历史时间段内发生环境异常变化的情况,其值越大,往往说明该待监测企业在预设历史时间段内发生的环境异常变化越大,往往说明越需要调小该待监测企业在当前时间段内的采集周期。
作为示例,可以将每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度的均值,确定为每个待监测企业对应的环境异常程度。
需要说明的是,由于当目标环境数据对应的数据异常程度越小时,往往说明该目标环境数据越可能是接近预设历史时间段内整体分布的环境数据。因此,当待监测企业对应的环境异常程度越小时,往往说明该待监测企业的环境数据分布情况越符合所有待监测企业的整体环境数据分布情况,往往说明该待监测企业的环境质量越可能没有发生变化,往往说明该待监测企业的环境质量越可能没有发生异常,即往往说明该待监测企业的环境质量越可能没有变好或变差,而是保持稳定。由于企业在生产过程中往往会产生污染,所以一般情况下,如果企业环境质量发生异常,往往说明企业环境质量变差。
周期确定模块106,用于根据每个待监测企业对应的环境异常程度和历史采集周期,确定每个待监测企业对应的当前采集周期。
在一些实施例中,可以根据每个待监测企业对应的环境异常程度和历史采集周期,确定每个待监测企业对应的当前采集周期。
其中,待监测企业对应的历史采集周期可以是在预设历史时间段内采集待监测企业相关环境数据的周期。待监测企业对应的当前采集周期可以是在当前时间段内采集待监测企业相关环境数据的周期。当前时间段对应的时长可以等于预设历史时间段对应的时长。例如,若当前时间段对应的时长为1天,则当前时间段可以为当天。
需要说明的是,基于待监测企业对应的环境异常程度和历史采集周期,可以提高待监测企业对应的当前采集周期确定的准确度。
作为示例,确定待监测企业对应的当前采集周期对应的公式可以为:
;/>;其中,/>是第a个待监测企业对应的当前采集周期。a是待监测企业的序号。/>是向上取整函数。/>是第a个待监测企业对应的历史采集周期。/>是以自然常数为底的指数函数。/>是第a个待监测企业对应的环境得分。H是预设超参数,H可以预先设置的不需进行采集周期调整时的环境得分,H的取值范围可以为(0,1),例如,H可以取0.5。/>是第a个待监测企业对应的环境异常程度。
需要说明的是,当越小时,往往说明第a个待监测企业的环境数据分布情况越符合所有待监测企业的整体环境数据分布情况,往往说明第a个待监测企业的环境质量越可能没有发生变化,往往说明第a个待监测企业的环境质量越可能没有发生异常,即往往说明第a个待监测企业的环境质量越可能没有变好或变差,而是保持稳定。当/>越小时,往往说明第a个待监测企业的环境质量越可能发生了异常,往往说明第a个待监测企业的环境质量越可能变好或变差,一般情况下由于企业在生产过程中往往会产生污染,所以导致环境变差的可能性往往更大;往往说明越需要调小第a个待监测企业在当前时间段内的采集周期。比如,当待监测企业的环境质量变差时,往往说明需要对待监测企业的环境进行治理,往往说明待监测企业需要的关注度相对越多,往往需要采集待监测企业对应的更多的环境数据,以增加检查频率,以便于进行环境情况分析。当待监测企业的环境质量变好时,往往可以分析环境变好的情况,往往说明待监测企业需要的关注度相对越多,往往需要采集待监测企业对应的更多的环境数据,以增加检查频率,以便于进行环境情况分析,以便找到致使环境变好的手段,以便继续沿用。因此,/>可以表征第a个待监测企业在当前时间段内的采集周期。
数据采集模块107,用于根据每个待监测企业对应的当前采集周期,采集每个待监测企业在当前时间段内的目标环境数据。
在一些实施例中,可以根据每个待监测企业对应的当前采集周期,采集每个待监测企业在当前时间段内的目标环境数据。
需要说明的是,基于每个待监测企业对应的当前采集周期,可以实现对每个待监测企业在当前时间段内目标环境数据的采集,从而提高了目标环境数据采集周期设置的合理性,进而提高了环境质量监测的准确度。
作为示例,记任意一个待监测企业为候选企业,若共有4种预设维度,分别为用水维度、用电维度、VOCS维度和日常环境巡查维度,并且计算的候选企业对应的当前采集周期为6分钟,则在当前时间段内,可以通过流量计量设备,每隔6分钟采集一次候选企业的用水量,作为候选企业在用水维度下的维度数据;在当前时间段内,可以通过功率传感器,每隔6分钟采集一次候选企业的用电量,作为候选企业在用电维度下的维度数据;在当前时间段内,可以通过浓度传感器,每隔6分钟采集一次候选企业的VOCS浓度,作为候选企业在VOCS维度下的维度数据;在当前时间段内,可以通过管理人员日常环境巡查,每隔6分钟采集一次候选企业的日常环境巡查得分,作为候选企业在日常环境巡查维度下的维度数据;并将同一个时刻下采集的候选企业的用水量、用电量、VOCS浓度和日常环境巡查得分,组合为一个目标环境数据。
可选地,当待监测企业对应的环境异常程度大于预设异常阈值时,将待监测企业标记为环境异常企业,环境异常企业往往是环境质量发生变化的企业,环境异常企业大多是环境质量变差较为严重的企业。其中,预设异常阈值可以是预先设置的阈值。例如,预设异常阈值可以是0.7。
可选地,将除了环境异常企业之外的每个待监测企业记为参考企业,确定参考企业在当前时间段的下一时间段内的采集周期的方法可以包括:将参考企业作为待监测企业,将当前时间段作为预设历史时间段,并将当前采集周期作为历史采集周期,执行获取聚类模块101至周期确定模块106所实现的步骤,得到的参考企业的采集周期即为所要确定的参考企业在下一时间段内的采集周期。
可选地,若环境异常企业是环境质量变差较为严重的企业,则可以在环境治理后,由管理人员监测其环境质量达标后,将其标记为待监测企业,继续上述的环境数据采集,以实现环境质量的监测。
综上,相较于通过人工经验设置的采集周期,本发明量化了多个与环境异常相关的指标,比如,簇异常程度、数据异常程度和环境异常程度,在一定程度上减少了人为主观因素的影响,从而相对比较准确客观地确定了待监测企业在当前时间段内的采集周期,进而提高了目标环境数据采集周期设置的合理性。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种企业环境自主管理数据采集处理系统,其特征在于,所述系统包括:
获取聚类模块,用于获取待监测区域内的每个待监测企业在预设历史时间段内每种预设维度下的维度数据,并将同一个待监测企业在同一个时刻下采集的所有预设维度下的维度数据,组合为目标环境数据,对所有目标环境数据进行聚类,得到目标聚类簇;
直线拟合模块,用于根据所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到该种预设维度对应的拟合直线;
簇异常确定模块,用于根据每个目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,确定每个目标聚类簇对应的簇异常程度;
数据异常确定模块,用于根据每个目标环境数据所属目标聚类簇对应的簇异常程度,以及每个目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异,确定每个目标环境数据对应的数据异常程度;
环境异常确定模块,用于根据每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,确定每个待监测企业对应的环境异常程度;
周期确定模块,用于根据每个待监测企业对应的环境异常程度和历史采集周期,确定每个待监测企业对应的当前采集周期;
数据采集模块,用于根据每个待监测企业对应的当前采集周期,采集每个待监测企业在当前时间段内的目标环境数据;
目标环境数据对应的数据异常程度对应的公式为:
;其中,/>是第i个目标聚类簇中,第m个目标环境数据对应的数据异常程度;i是目标聚类簇的序号;m是第i个目标聚类簇中目标环境数据的序号;/>是归一化函数;/>是第i个目标聚类簇对应的簇异常程度;n是预设维度的种类总数;j是预设维度的种类序号;/>是取绝对值函数;/>是第i个目标聚类簇中,第m个目标环境数据包括的第j种预设维度下的维度数据;/>是第i个目标聚类簇中,所有目标环境数据包括的第j种预设维度下的维度数据的均值;/>是第i个目标聚类簇中,所有目标环境数据包括的第j种预设维度下的维度数据的标准差;/>是预先设置的大于0的因子;表征第m个目标环境数据与其所属目标聚类簇中所有目标环境数据之间的差异;
待监测企业对应的当前采集周期对应的公式为:
;/>;其中,/>是第a个待监测企业对应的当前采集周期;a是待监测企业的序号;/>是向上取整函数;/>是第a个待监测企业对应的历史采集周期;/>是以自然常数为底的指数函数;/>是第a个待监测企业对应的环境得分;H是预设超参数;/>是第a个待监测企业对应的环境异常程度。
2.根据权利要求1所述的一种企业环境自主管理数据采集处理系统,其特征在于,所述对所有目标环境数据进行聚类,得到目标聚类簇,包括:
通过不限类别个数的聚类算法,对所有目标环境数据进行聚类,并将得到的每个聚类簇,确定为初始聚类簇;
若初始聚类簇的数量大于或等于预设数量,则将每个初始聚类簇,确定为目标聚类簇;
若初始聚类簇的数量小于预设数量,则通过限制类别个数的聚类算法,将所有的目标环境数据聚类为预设数量个聚类簇,并将最新聚类得到的每个聚类簇,确定为目标聚类簇。
3.根据权利要求1所述的一种企业环境自主管理数据采集处理系统,其特征在于,所述根据所有目标聚类簇的聚类中心包括的同一种预设维度下的维度数据进行直线拟合,得到该种预设维度对应的拟合直线,包括:
将任意一种预设维度确定为标记维度,对所有目标聚类簇中所有目标环境数据包括的标记维度下的维度数据进行升序,得到所述标记维度对应的维度数据序列;
从所述维度数据序列中筛选出所有目标聚类簇的聚类中心包括的维度数据,作为参考数据,得到所述标记维度对应的参考数据集合;
以所述参考数据集合中的参考数据在所属维度数据序列的序号为横坐标,以所述参考数据集合中的参考数据为纵坐标,对所述参考数据集合进行直线拟合,得到所述标记维度对应的拟合直线。
4.根据权利要求1所述的一种企业环境自主管理数据采集处理系统,其特征在于,所述根据每个目标聚类簇的聚类中心包括的所有维度数据与所有拟合直线,确定每个目标聚类簇对应的簇异常程度,包括:
将任意一个维度数据确定为标记数据,将所述标记数据在所属维度数据序列中的序号,确定为所述标记数据对应的目标坐标包括的横坐标,并将所述标记数据,确定为所述标记数据对应的目标坐标包括的纵坐标;
将所述标记数据对应的目标坐标与所述标记数据所属预设维度对应的拟合直线之间的距离,确定为所述标记数据对应的偏离距离;
将任意一个目标聚类簇确定为标记聚类簇,根据所述标记聚类簇的聚类中心包括的所有维度数据对应的偏离距离,确定所述标记聚类簇对应的目标距离,其中,偏离距离与目标距离呈正相关;
根据所述标记聚类簇中所有目标环境数据,确定所述标记聚类簇对应的目标离散程度;
根据所述标记聚类簇对应的目标离散程度和目标距离,确定所述标记聚类簇对应的簇异常程度,其中,所述标记聚类簇对应的目标离散程度和目标距离均与其对应的簇异常程度呈正相关。
5.根据权利要求4所述的一种企业环境自主管理数据采集处理系统,其特征在于,所述根据所述标记聚类簇中所有目标环境数据,确定所述标记聚类簇对应的目标离散程度,包括:
将所述标记聚类簇中所有目标环境数据包括的同一种预设维度下的维度数据的标准差,确定为所述标记聚类簇在该种预设维度下的离散因子;
将所述标记聚类簇在所有预设维度下的离散因子的均值,确定为所述标记聚类簇对应的目标离散程度。
6.根据权利要求5所述的一种企业环境自主管理数据采集处理系统,其特征在于,目标聚类簇对应的簇异常程度对应的公式为:
;/>;其中,/>是第i个目标聚类簇对应的簇异常程度;i是目标聚类簇的序号;/>是归一化函数;/>是第i个目标聚类簇对应的目标距离;/>是第i个目标聚类簇对应的目标离散程度;n是预设维度的种类总数;j是预设维度的种类序号;/>是第i个目标聚类簇的聚类中心包括的第j种预设维度下的维度数据对应的偏离距离。
7.根据权利要求1所述的一种企业环境自主管理数据采集处理系统,其特征在于,所述根据每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度,确定每个待监测企业对应的环境异常程度,包括:
将每个待监测企业在预设历史时间段内所有目标环境数据对应的数据异常程度的均值,确定为每个待监测企业对应的环境异常程度。
8.根据权利要求1所述的一种企业环境自主管理数据采集处理系统,其特征在于,所述系统实现的方法还包括:
当待监测企业对应的环境异常程度大于预设异常阈值时,将待监测企业标记为环境异常企业。
CN202410026591.3A 2024-01-09 2024-01-09 一种企业环境自主管理数据采集处理系统 Active CN117540327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410026591.3A CN117540327B (zh) 2024-01-09 2024-01-09 一种企业环境自主管理数据采集处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410026591.3A CN117540327B (zh) 2024-01-09 2024-01-09 一种企业环境自主管理数据采集处理系统

Publications (2)

Publication Number Publication Date
CN117540327A CN117540327A (zh) 2024-02-09
CN117540327B true CN117540327B (zh) 2024-04-02

Family

ID=89788413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410026591.3A Active CN117540327B (zh) 2024-01-09 2024-01-09 一种企业环境自主管理数据采集处理系统

Country Status (1)

Country Link
CN (1) CN117540327B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116578890A (zh) * 2023-07-14 2023-08-11 山东焦易网数字科技股份有限公司 基于数字孪生的智能工厂数据优化采集方法
WO2023206888A1 (zh) * 2022-04-25 2023-11-02 广东玖智科技有限公司 一种ppg信号聚类中心获取方法及装置和ppg信号处理方法及装置
CN117171604A (zh) * 2023-11-03 2023-12-05 城资泰诺(山东)新材料科技有限公司 基于传感器的保温板生产线异常监测系统
CN117273284A (zh) * 2023-11-21 2023-12-22 杭州巨奥能源科技有限公司 一种面向企业用电平衡的异常数据监测系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023206888A1 (zh) * 2022-04-25 2023-11-02 广东玖智科技有限公司 一种ppg信号聚类中心获取方法及装置和ppg信号处理方法及装置
CN116578890A (zh) * 2023-07-14 2023-08-11 山东焦易网数字科技股份有限公司 基于数字孪生的智能工厂数据优化采集方法
CN117171604A (zh) * 2023-11-03 2023-12-05 城资泰诺(山东)新材料科技有限公司 基于传感器的保温板生产线异常监测系统
CN117273284A (zh) * 2023-11-21 2023-12-22 杭州巨奥能源科技有限公司 一种面向企业用电平衡的异常数据监测系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
聚类分析在城市客流聚集风险分析中的应用;张嘉成;杜渂;;电信快报;20170110(01);第28-33页 *

Also Published As

Publication number Publication date
CN117540327A (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
CN109977535B (zh) 一种线损异常诊断方法、装置、设备及可读存储介质
CN112381476B (zh) 用于确定状态异常的电能表的方法及装置
CN107436277B (zh) 基于相似距离判别的单指标数据质量控制方法
CN114518143A (zh) 一种智能环境感知系统
CN117522632B (zh) 一种基于深度学习的水质指标预测方法
CN113487470A (zh) 一种基于大数据的环保隐患精准监测定位方法
CN111144440A (zh) 一种专变用户日电力负荷特征的分析方法及装置
CN117220441A (zh) 基于全景监控下的信息监测智能预警方法
CN113810792B (zh) 一种基于云计算的边缘数据采集分析系统
CN117540327B (zh) 一种企业环境自主管理数据采集处理系统
CN114295162A (zh) 一种基于数据采集的环境监测系统
CN115994692B (zh) 基于5g和大数据的智慧河湖管理平台
CN116307886A (zh) 一种企业生产状态的实时监测方法及装置
CN117296538A (zh) 基于植被土壤成分检测的绿植维护方法、装置与系统
CN115423383B (zh) 基于人工智能的分布式村镇饮用水监测调控系统及方法
CN114149076B (zh) 一种厌氧氨氧化污水处理系统的智能调试系统
CN115931041A (zh) 一种新的区域环保监测预警方法
CN113869782B (zh) 基于时序分解企业用电数据以识别环保管控异常的方法
CN117786584B (zh) 基于大数据分析的畜牧业水源污染监测预警方法及系统
CN115146881B (zh) 一种低压分布式光伏系统不良数据检测方法和系统
CN118108350A (zh) 生物控制精准曝气节能系统
CN117932501B (zh) 一种电能表运行状态管理方法和系统
CN116227740B (zh) 一种基于区块链的能源分析管理云平台
CN115481904B (zh) 一种基于智能人工湿地的废水处理效率管理系统
CN116452358B (zh) 基于物联网的智慧农业管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant