CN117078490B - 基于多项因素进行同步分析的城市小微水体风险评估方法 - Google Patents

基于多项因素进行同步分析的城市小微水体风险评估方法 Download PDF

Info

Publication number
CN117078490B
CN117078490B CN202311340168.2A CN202311340168A CN117078490B CN 117078490 B CN117078490 B CN 117078490B CN 202311340168 A CN202311340168 A CN 202311340168A CN 117078490 B CN117078490 B CN 117078490B
Authority
CN
China
Prior art keywords
data
target
sequence
data sequence
indirect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311340168.2A
Other languages
English (en)
Other versions
CN117078490A (zh
Inventor
蔡倩怡
陶钧实
丘锦荣
王秀娟
林晓君
曾经文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Institute of Environmental Science of Ministry of Ecology and Environment
Original Assignee
South China Institute of Environmental Science of Ministry of Ecology and Environment
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Institute of Environmental Science of Ministry of Ecology and Environment filed Critical South China Institute of Environmental Science of Ministry of Ecology and Environment
Priority to CN202311340168.2A priority Critical patent/CN117078490B/zh
Publication of CN117078490A publication Critical patent/CN117078490A/zh
Application granted granted Critical
Publication of CN117078490B publication Critical patent/CN117078490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理技术领域,具体涉及基于多项因素进行同步分析的城市小微水体风险评估方法,包括:采集目标水体的水体直接数据和间接影响数据,分别记为A类数据和B类数据,其中A类数据包含若干种直接指标的时序数据序列,B类数据包含若干种间接指标的时序数据序列,获取每个时序数据序列的信息丰富程度,将任意一种直接指标的时序数据序列,记为目标直接数据序列,将任意一种间接指标的时序数据序列,记为目标间接数据序列,获取目标直接数据序列与目标间接数据序列的相关性,由此获取目标间接数据序列与A类数据的关联性,从而得到目标水体的风险评估值。本发明自适应降维参数,提高了城市小微水体的风险评估值的准确性。

Description

基于多项因素进行同步分析的城市小微水体风险评估方法
技术领域
本发明涉及数据处理技术领域,具体涉及基于多项因素进行同步分析的城市小微水体风险评估方法。
背景技术
随着城市化进程的加速,城市小微水体的健康状态也越来越堪忧,需要对城市小微水体进行健康状态监测和风险评估。由于城市的发展,城市的复杂性提高,城市小微水体监测数据的规模和复杂性不断增加,需要监测的数据越来越多,难以从繁杂多变的数据中准确提取出有效信息,并且会产生维度灾难。传统的应对维度灾难的技术手段是PCA数据降维,但是传统的PCA数据只针对数据本身的变化进行降维。
现有的问题:城市小微水体监测数据中可能存在一些没有意义或者对水体的健康状态影响较小的数据,这会PCA数据降维的结果难以满足要求,从而使得根据降维数据分析出的城市小微水体风险评估指标的结果准确性较低。
发明内容
本发明提供基于多项因素进行同步分析的城市小微水体风险评估方法,以解决现有的问题。
本发明的基于多项因素进行同步分析的城市小微水体风险评估方法采用如下技术方案:
本发明一个实施例提供了基于多项因素进行同步分析的城市小微水体风险评估方法,该方法包括以下步骤:
将任意一处城市小微水体,记为目标水体;使用水体监测设备对目标水体进行监测,得到目标水体的水体直接数据和间接影响数据;将水体直接数据和间接影响数据,分别记为A类数据和B类数据;所述A类数据包含若干种直接指标的时序数据序列;所述B类数据包含若干种间接指标的时序数据序列;
将任意一个时序数据序列,记为参考数据序列,并得到参考数据序列中的局部极值点;根据参考数据序列中数据之间、局部极值点之间的差异,得到参考数据序列的信息丰富程度、每个局部极值点的特征量;
将任意一种直接指标的时序数据序列,记为目标直接数据序列;将任意一种间接指标的时序数据序列,记为目标间接数据序列;根据目标直接数据序列与目标间接数据序列之间的数据、局部极值点的特征量的差异,得到目标间接数据序列中每一个局部极值点的映射数据点与映射时间点;
根据目标直接数据序列与目标间接数据序列之间的数据差异、目标间接数据序列中局部极值点与其时间点、映射数据点、映射时间点之间的数据差异,得到目标直接数据序列与目标间接数据序列的相关性;
根据目标直接数据序列分别与所有种直接指标的时序数据序列的相关性、所有时序数据序列的信息丰富程度,得到目标间接数据序列与A类数据的关联性;
根据所有种间接指标的时序数据序列分别与A类数据的关联性,得到目标水体的风险评估值。
进一步地,所述根据参考数据序列中数据之间、局部极值点之间的差异,得到参考数据序列的信息丰富程度、每个局部极值点的特征量,包括的具体步骤如下:
在参考数据序列中任意相邻两个局部极值点之间,依次计算前一个数据减去后一个数据的差值,得到所述相邻两个局部极值点之间的差值序列;
将所述相邻两个局部极值点之间的差值序列中的数据均值的绝对值,记为所述相邻两个局部极值点之间的斜率;
将所述相邻两个局部极值点的数据值的差值的绝对值,记为所述相邻两个局部极值点的极差;
在参考数据序列中,将所述相邻两个局部极值点之间的斜率乘以所述相邻两个局部极值点的极差,记为所述相邻两个局部极值点中前一个局部极值点的特征量;
根据参考数据序列中的数据方差、参考数据序列中所有相邻局部极值点之间的斜率、相邻局部极值点的极差,得到参考数据序列的信息丰富程度。
进一步地,所述根据参考数据序列中的数据方差、参考数据序列中所有相邻局部极值点之间的斜率、相邻局部极值点的极差,得到参考数据序列的信息丰富程度对应的具体计算公式为:
;
其中E为参考数据序列的信息丰富程度,为参考数据序列中的数据方差,R为参考 数据序列中的局部极值点数量,为参考数据序列中第t个和第t+1个局部极值点之间的 斜率,为参考数据序列中第t个和第t+1个局部极值点的极差。
进一步地,所述根据目标直接数据序列与目标间接数据序列之间的数据、局部极值点的特征量的差异,得到目标间接数据序列中每一个局部极值点的映射数据点与映射时间点,包括的具体步骤如下:
计算目标间接数据序列中的数据方差与目标直接数据序列中的数据方差的商值,将所述商值乘以目标直接数据序列中每个局部极值点的特征量,记为目标直接数据序列中每个局部极值点的新特征量;
将目标间接数据序列中任意一个局部极值点,记为目标局部极值点;
将目标局部极值点对应的时间点,记为起始时间点;
在目标直接数据序列中,按照时间顺序,从起始时间点开始,依次向后统计b个局部极值点,记为目标局部极值点对应的参考局部极值点;所述b为预设的参考数量;
根据目标局部极值点的特征量与参考局部极值点的新特征量之间的差异,得到目标局部极值点的映射数据点与映射时间点。
进一步地,所述根据目标局部极值点的特征量与参考局部极值点的新特征量之间的差异,得到目标局部极值点的映射数据点与映射时间点,包括的具体步骤如下:
计算目标局部极值点的特征量分别与所有参考局部极值点的新特征量的差异,将所述差异中的最大值对应的参考局部极值点,记为目标局部极值点的映射数据点;
将目标局部极值点的映射数据点对应的时间点,记为目标局部极值点的映射时间点。
进一步地,所述根据目标直接数据序列与目标间接数据序列之间的数据差异、目标间接数据序列中局部极值点与其时间点、映射数据点、映射时间点之间的数据差异,得到目标直接数据序列与目标间接数据序列的相关性对应的具体计算公式为:
;
其中K为目标直接数据序列与目标间接数据序列的相关性,为目标直接数据序 列,为目标间接数据序列,的协方差,q为目标间接数据序列中的局部极 值点的数量,为目标间接数据序列中第j个局部极值点的数据值,为目标间接数据序列 中第j个局部极值点的映射数据点的数据值,为目标间接数据序列中第j个和第j+1个 局部极值点的时间点的时间间隔,为目标间接数据序列中第j个和第j+1个局部极值点 的映射时间点的时间间隔,| |为绝对值函数,为以自然常数为底的指数函数。
进一步地,所述根据目标直接数据序列分别与所有种直接指标的时序数据序列的相关性、所有时序数据序列的信息丰富程度,得到目标间接数据序列与A类数据的关联性,包括的具体步骤如下:
根据水体检测行业内制定的水体质量评估标准,得到每一种直接指标对应的水体监测的重要性评估值;
将目标间接数据序列的信息丰富程度除以每种直接指标的时序数据序列的信息丰富程度,记为标间接数据序列对每种直接指标的时序数据序列的影响程度;
根据标间接数据序列对所有种直接指标的时序数据序列的影响程度、所有种直接指标对应的水体监测的重要性评估值、目标间接数据序列分别与所有种直接指标的时序数据序列的相关性,得到目标间接数据序列与A类数据的关联性。
进一步地,所述根据标间接数据序列对所有种直接指标的时序数据序列的影响程度、所有种直接指标对应的水体监测的重要性评估值、目标间接数据序列分别与所有种直接指标的时序数据序列的相关性,得到目标间接数据序列与A类数据的关联性,包括的具体步骤如下:
将每种直接指标对应的水体监测的重要性评估值、目标间接数据序列与每种直接指标的时序数据序列的相关性、标间接数据序列对每种直接指标的时序数据序列的影响程度进行相乘,记为目标间接数据序列与每种直接指标的时序数据序列的关联性;
将目标间接数据序列分别与所有种直接指标的时序数据序列的关联性的均值,记为目标间接数据序列与A类数据的关联性。
进一步地,所述根据所有种间接指标的时序数据序列分别与A类数据的关联性,得到目标水体的风险评估值,包括的具体步骤如下:
将每种间接指标的时序数据序列与A类数据的关联性,记为每种间接指标的时序数据序列的降维参数;
根据所有种间接指标的时序数据序列的降维参数、预设的目标主成分数量,使用PCA降维算法对B类数据进行降维操作,得到B类数据的若干个主成分与每个主成分的主成分得分;
根据B类数据的所有主成分、所有主成分的主成分得分,得到目标水体的风险评估值。
进一步地,所述根据B类数据的所有主成分、所有主成分的主成分得分,得到目标水体的风险评估值对应的具体计算公式为:
;
其中P为目标水体的风险评估值,为B类数据的第u个主成分的方差,为B类数据 的第u个主成分的主成分得分,Y为B类数据的主成分的数量,a为预设的常数,为线性 归一化函数。
本发明的技术方案的有益效果是:
本发明实施例中,采集目标水体的水体直接数据和间接影响数据,分别记为A类数据和B类数据。其中A类数据包含若干种直接指标的时序数据序列,B类数据包含若干种间接指标的时序数据序列。获取每个时序数据序列的信息丰富程度,将任意一种直接指标的时序数据序列,记为目标直接数据序列,将任意一种间接指标的时序数据序列,记为目标间接数据序列。获取目标间接数据序列中每一个局部极值点的映射数据点与映射时间点,从而得到目标直接数据序列与目标间接数据序列的相关性。由于A类数据相对于B类数据存在一定的在滞后性,会使传统算法获取的相关性误差较大,本实施例通过滞后性分析,得到的相关性更可靠,保障后续数据分析的准确性。由此获取目标间接数据序列与A类数据的关联性,从而得到目标水体的风险评估值。至此本发明自适应每种间接指标的时序数据序列的降维参数,提高了城市小微水体的风险评估值的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于多项因素进行同步分析的城市小微水体风险评估方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于多项因素进行同步分析的城市小微水体风险评估方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于多项因素进行同步分析的城市小微水体风险评估方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于多项因素进行同步分析的城市小微水体风险评估方法的步骤流程图,该方法包括以下步骤:
步骤S001:将任意一处城市小微水体,记为目标水体;使用水体监测设备对目标水体进行监测,得到目标水体的水体直接数据和间接影响数据;将水体直接数据和间接影响数据,分别记为A类数据和B类数据;所述A类数据包含若干种直接指标的时序数据序列;所述B类数据包含若干种间接指标的时序数据序列。
当进行城市小微水体风险评估时,将任意一处城市小微水体,记为目标水体,需要使用水体监测设备对目标水体进行监测,本实施例将监测数据分为两大类以全面了解水体环境的状况:水体直接数据和间接影响数据。
将水体直接数据记为A类数据,已知水体直接数据主要涵盖了直接与小微水体质量相关的参数,包括小微水体的透明度、溶解氧、氨氮等关键指标。这类数据直接反映了水体本身的物理、化学、生物特性,是用于全面评估水质状况的重要依据。因此A类数据包含若干种直接指标的时序数据序列。
将间接影响数据记为B类数据,已知间接影响数据则包括了与水体相关的周边环境、人类活动等因素。这些数据包括降水情况、土地利用、周边雨污分流情况等,它们虽然不直接反映水体内部状况,但却对水体的直接数据造成影响,提供了影响水体健康的重要线索。因此B类数据包含若干种间接指标的时序数据序列。
所需说明的是:本实施例设定的直接指标分别为小微水体的透明度、溶解氧含量、氨氮浓度,间接指标分别为降水量、土地利用面积、周边雨污分流比例,直接指标和间接指标每天进行一次采集,采集时长为一年,得到每种直接指标和间接指标的时序数据序列,以此为例进行叙述,其它实施方式中可设置为其它指标与采集时间,本实施例不进行限定。并且每种直接指标和间接指标的时序数据序列中的数据是经过最小最大规范法进行归一化至[0,1]区间内的数据,由此消除不同数据之间的量纲差异,以便更好地进行比较、分析和处理。其中,最小最大规范法为公知技术,具体方法在此不做介绍。
步骤S002:将任意一个时序数据序列,记为参考数据序列,并得到参考数据序列中的局部极值点;根据参考数据序列中数据之间、局部极值点之间的差异,得到参考数据序列的信息丰富程度、每个局部极值点的特征量。
已知A类数据直接反应水体的某种参数指标,这类特征虽然是水体健康状态的直接相关数据,但是它们不是根本原因,B类数据才是导致A类数据发生变化的根本原因。因此对于A类数据进行分析只能起到监测的作用,不能起到防范以及风险应对的作用。因此,本实施例通过B类数据对A类数据的影响来对城市小微水体的风险进行评估。
对于所有的数据而言,数据的变化越大,那么这条数据的信息越丰富,那么这条信息的重要程度越高。因此可以通过所有数据的波动程度来计算数据的重要性。
数据的波动程度越高,数据的方差越大,同时数据的各极值点之间的斜率越大,极值点之间的幅值差距越大。因此对于各项数据,通过它自身数据的波动情况来获取它的信息丰富程度。
将B类数据与A类数据中的任意一种间接指标或者直接指标的时序数据序列,记为参考数据序列。使用一阶导数法,得到参考数据序列中的局部极值点。在参考数据序列中任意相邻两个局部极值点之间,依次计算前一个数据减去后一个数据的差值,得到所述相邻两个局部极值点之间的差值序列。将所述相邻两个局部极值点之间的差值序列中的数据均值的绝对值,记为所述相邻两个局部极值点之间的斜率。将所述相邻两个局部极值点的数据值的差值的绝对值,记为所述相邻两个局部极值点的极差。其中,一阶导数法为公知技术,具体方法在此不做介绍。
所需说明的是:由于采集时长为一年,故参考数据序列中会存在较多的数据波动,即局部极值点较多,若数据序列中的数据波动较少时,需要延长采集时长,保障数据序列中存在较多的数据波动,提高后续数据分析的准确性。
由此可知参考数据序列的信息丰富程度E的计算公式为:
;
其中E为参考数据序列的信息丰富程度,为参考数据序列中的数据方差,R为参考 数据序列中的局部极值点数量,为参考数据序列中第t个和第t+1个局部极值点之间的 斜率,为参考数据序列中第t个和第t+1个局部极值点的极差。
所需说明的是:s越大,说明参考数据序列中数据的波动情况越复杂,数据的重要 程度越高。越大,说明参考数据序列中数据的波动程度越大,数据的信息越丰 富,因此用与s的乘积,表示参考数据序列的信息丰富程度。即信息的 波动越强烈,信息越丰富。
根据参考数据序列中相邻两个局部极值点之间的斜率、相邻两个局部极值点的极差,可知参考数据序列中每个局部极值点的特征量的计算公式为:
其中为参考数据序列中第t个局部极值点的特征量,R为参考数据序列中的局部 极值点数量,为参考数据序列中第t个和第t+1个局部极值点之间的斜率,为参考 数据序列中第t个和第t+1个局部极值点的极差。
所需说明的是:参考数据序列中最后一个局部极值点没有对应的下一个局部极值 点,与其相邻的局部极值点,只有参考数据序列中倒数第二个局部极值点,因此令参考数据 序列中最后一个局部极值点的特征量等于参考数据序列中倒数第二个局部极值点的特 征量。由此得到参考数据序列中每个局部极值点的特征量。
按照上述方式,得到A类数据中每一种直接指标与B类数据中每一种间接指标的时序数据序列的信息丰富程度,以及时序数据序列中的局部极值点和每个局部极值点的特征量。
步骤S003:将任意一种直接指标的时序数据序列,记为目标直接数据序列;将任意一种间接指标的时序数据序列,记为目标间接数据序列;根据目标直接数据序列与目标间接数据序列之间的数据、局部极值点的特征量的差异,得到目标间接数据序列中每一个局部极值点的映射数据点与映射时间点。
由于B类数据是间接影响水体健康状态的数据,B类数据对水体的影响就是对A类数据的影响,因此本实施例将各B类数据对各个A类数据进行相关性计算,从而获取各个B类数据对各种A类数据的影响。
如果B类数据对A类数据有影响,那么A类数据的变化会随着B类数据的变化而变化。B类数据对A类数据的影响越大,这两个数据的协方差越大。同时A类数据的数据幅值和周期会随着A类数据的幅值和频率进行变化。
将A类数据中的任意一种直接指标的时序数据序列,记为目标直接数据序列。将B类数据中的任意一种间接指标的时序数据序列,记为目标间接数据序列。
由于在计算B类数据对A类数据的影响时,由于B类数据相对于A类数据的影像往往具有滞后性,因此这两类数据的对应关系并非是相同时间点对应的,因此本实施例通过分析目标直接数据序列与目标间接数据序列中极值点的对应关系,得到其相关性。
由此可知目标直接数据序列中每个局部极值点的新特征量的计算公式为:
其中为目标直接数据序列中第i个局部极值点的新特征量,d为目标直接数据序 列中局部极值点的数量,为目标直接数据序列中第i个局部极值点的特征量,为目标间 接数据序列中的数据方差,为目标直接数据序列中的数据方差。
所需说明的是:由于目标直接数据序列与目标间接数据序列中数据的幅值变化差 距可能较大,因此直接使用两序列中的局部极值点的特征量进行对比找对应点时效果较 差,因此在对比时还要结合两项数据的整体波动比例,即方差的比例来对目标直接数据序 列中每个局部极值点的特征量进行调整,由此得到目标直接数据序列中每个局部极值点 的新特征量。
本实施例设定的参考数量b为5,以此为例进行叙述,其它实施方式中可设置为其它值,本实施例不进行限定。
在目标直接数据序列与目标间接数据序列中的局部极值点对应过程中,由于B类数据对于A类数据的影响往往是滞后的,因此将目标间接数据序列中任意一个局部极值点,记为目标局部极值点。将目标局部极值点对应的时间点,记为起始时间点。在目标直接数据序列中,按照时间顺序,从起始时间点开始,依次向后统计b个局部极值点,记为目标局部极值点对应的参考局部极值点。
计算目标局部极值点的特征量分别与其对应的所有参考局部极值点的新特征量的差值的绝对值,将所述绝对值中的最大值对应的参考局部极值点,记为目标局部极值点的映射数据点。将目标局部极值点的映射数据点对应的时间点,记为目标局部极值点的映射时间点。
所需说明的是:若目标局部极值点对应的参考局部极值点的数量为0时,则令目标直接数据序列中起始时间点上的数据点为目标局部极值点的映射数据点。若所述绝对值中的最大值对应的参考局部极值点存在多个时,取这多个参考局部极值点所处时间点距离起始时间点最近的参考局部极值点,记为目标局部极值点的映射数据点。即目标局部极值点对应一个映射数据点。
按照上述方式得到,目标间接数据序列中每一个局部极值点的映射数据点与映射时间点。
步骤S004:根据目标直接数据序列与目标间接数据序列之间的数据差异、目标间接数据序列中局部极值点与其时间点、映射数据点、映射时间点之间的数据差异,得到目标直接数据序列与目标间接数据序列的相关性。
由此可知目标直接数据序列与目标间接数据序列的相关性的计算公式为:
其中K为目标直接数据序列与目标间接数据序列的相关性,为目标直接数据序 列,为目标间接数据序列,的协方差,q为目标间接数据序列中的局部极 值点的数量,为目标间接数据序列中第j个局部极值点的数据值,为目标间接数据序列 中第j个局部极值点的映射数据点的数据值,为目标间接数据序列中第j个和第j+1个 局部极值点的时间点的时间间隔,为目标间接数据序列中第j个和第j+1个局部极值点 的映射时间点的时间间隔,| |为绝对值函数,为以自然常数为底的指数函数,本实施 例以来呈现反比例关系及归一化处理,实施者可根据实际情况设置反比例函数及归 一化函数。
所需说明的是:计算两个数据序列的协方差为公知技术,具体方法在此不做介绍。 且越大,说明目标直接数据序列与目标间接数据序列的相关性越强。 表示目标直接数据序列与目标间接数据序列的局部极值点的联系,表示 目标直接数据序列与目标间接数据序列中数据变化周期的联系,且越小,则目标直接数据序列与目标间接数据序列的联系越紧密,因此用 归一化的反比例值的乘积,表示目标直 接数据序列与目标间接数据序列的相关性。
按照上述方式,得到目标间接数据序列与A类数据中每一种直接指标的时序数据序列的相关性。
步骤S005:根据目标直接数据序列分别与所有种直接指标的时序数据序列的相关性、所有时序数据序列的信息丰富程度,得到目标间接数据序列与A类数据的关联性。
已知本实施例中直接指标分别为小微水体的透明度、溶解氧含量、氨氮浓度,根据水体检测行业内制定的水体质量评估标准,分别得到小微水体的透明度、溶解氧含量、氨氮浓度对水体监测的重要性评估值,即得到A类数据中每一种直接指标对应的水体监测的重要性评估值。
所需说明的是:水体检测行业及其相关行业会制定一些指南、标准或法规来指导水体监测,其中包括各类型数据的重要性评估。这些指南和标准通常是根据科学研究、环境保护需求以及具体地区的实际情况而制定的,其它实施方式中可根据所处地区制定的标准来获取每种指标对应的水体监测的重要性评估值,本实施例不进行限定。
由于A类数据是水体的直接参数,而根据水体监测标准,以各种直接指标对应的水体监测的重要性评估值为各种直接指标的时序数据序列的权重。而B类数据对A类数据的影响是多向的,即一项B类数据对多种A类数据造成影响,因此结合各项A类数据的权重,来计算各B类数据对整体A类数据的关联性。
由此可知目标间接数据序列与A类数据的关联性T的计算公式为:
其中T为目标间接数据序列与A类数据的关联性,M为A类数据中直接指标的种类数 量,为目标间接数据序列的信息丰富程度,为A类数据中第x种直接指标的时序数据序 列的信息丰富程度,为A类数据中第x种直接指标对应的水体监测的重要性评估值,为 目标间接数据序列与A类数据中第x种直接指标的时序数据序列的相关性。
所需说明的是:表示目标间接数据序列对A类数据中第x种直接指标的时序数据 序列的影响程度,其值越大,说明目标间接数据序列中较小的数据变化,会造成A类数据中 第x种直接指标的时序数据序列中出现较大的数据变化,即影响程度越大。分别以的调整值,故表示目标间接数据序列与A类数据中第x种直接指标的时序数据 序列的关联性,则用表示目标间接数据序列与A类数据的关联性,关联性 越大,说明目标间接数据序列对A类数据的影响越大,即对于水体健康程度的影响程度越 大。
按照上述方式,得到B类数据中每一种间接指标的时序数据序列与A类数据的关联性。
步骤S006:根据所有种间接指标的时序数据序列分别与A类数据的关联性,得到目标水体的风险评估值。
由于本实施例旨在提供水体的防范以及风险应对,而A类数据是小微水体的直接特征指标,是风险的具体表现,而非水体健康风险的来源,B类数据才是小微水体整体健康属性的根本原因,因此只对B类数据进行降维。
已知降维参数和目标主成分数量是PCA降维算法中的主要参数。本实施例设定的目标主成分数量Y为5,以此为例进行叙述,其它实施方式中可设置为其它值,本实施例不进行限定。将B类数据中每一种间接指标的时序数据序列与A类数据的关联性,记为B数据中每一种间接指标的时序数据序列的降维参数。
根据B类数据中所有种间接指标的时序数据序列的降维参数、目标主成分数量Y,使用PCA降维算法对B类数据进行降维操作,得到B类数据的Y个主成分与每个主成分的主成分得分。其中,PCA降维算法为公知技术,具体方法在此不做介绍。
通过降维后的主成分数据来对小微水体的风险进行评估。由于主成分数据融合了各项对于小微水体风险的影响数据,因此主成分数据波动越大,小微水体的风险越大,因此可以通过各主成分的主成分得分作为主成分权重来进行小微水体风险计算,由此可知目标水体的风险评估值P的计算公式为:
其中P为目标水体的风险评估值,为B类数据的第u个主成分的方差,为B类数据 的第u个主成分的主成分得分,Y为目标主成分数量,Y也为B类数据的主成分的数量,a为常 数。为线性归一化函数,将数据值归一化至[0,1]区间内。本实施例设定,以此 为例进行叙述,其它实施方式中可设置为其它值,本实施例不进行限定。
所需说明的是:越大,说明数据的波动程度越大,那么风险越大,故主成分的值变 化越快,即方差越大时,小微水体的风险越大。因此用表示目标水体 的风险评估值,目标水体的风险评估值越大,小微水体的风险越高。
至此,本发明完成。
综上所述,在本发明实施例中,使用水体监测设备对目标水体进行监测,得到目标水体的水体直接数据和间接影响数据,分别记为A类数据和B类数据。其中A类数据包含若干种直接指标的时序数据序列,B类数据包含若干种间接指标的时序数据序列。获取每个时序数据序列的信息丰富程度,将任意一种直接指标的时序数据序列,记为目标直接数据序列,将任意一种间接指标的时序数据序列,记为目标间接数据序列。获取目标间接数据序列中每一个局部极值点的映射数据点与映射时间点,从而得到目标直接数据序列与目标间接数据序列的相关性。由此获取目标间接数据序列与A类数据的关联性,从而得到目标水体的风险评估值。本发明自适应降维参数,提高了城市小微水体的风险评估值的准确性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.基于多项因素进行同步分析的城市小微水体风险评估方法,其特征在于,该方法包括以下步骤:
将任意一处城市小微水体,记为目标水体;使用水体监测设备对目标水体进行监测,得到目标水体的水体直接数据和间接影响数据;将水体直接数据和间接影响数据,分别记为A类数据和B类数据;所述A类数据包含若干种直接指标的时序数据序列;所述B类数据包含若干种间接指标的时序数据序列;
将任意一个时序数据序列,记为参考数据序列,并得到参考数据序列中的局部极值点;根据参考数据序列中数据之间、局部极值点之间的差异,得到参考数据序列的信息丰富程度、每个局部极值点的特征量;
将任意一种直接指标的时序数据序列,记为目标直接数据序列;将任意一种间接指标的时序数据序列,记为目标间接数据序列;根据目标直接数据序列与目标间接数据序列之间的数据、局部极值点的特征量的差异,得到目标间接数据序列中每一个局部极值点的映射数据点与映射时间点;
根据目标直接数据序列与目标间接数据序列之间的数据差异、目标间接数据序列中局部极值点与其时间点、映射数据点、映射时间点之间的数据差异,得到目标直接数据序列与目标间接数据序列的相关性;
根据目标直接数据序列分别与所有种直接指标的时序数据序列的相关性、所有时序数据序列的信息丰富程度,得到目标间接数据序列与A类数据的关联性;
根据所有种间接指标的时序数据序列分别与A类数据的关联性,得到目标水体的风险评估值;
其中,根据目标直接数据序列与目标间接数据序列之间的数据、局部极值点的特征量的差异,得到目标间接数据序列中每一个局部极值点的映射数据点与映射时间点,包括的具体步骤如下:
计算目标间接数据序列中的数据方差与目标直接数据序列中的数据方差的商值,将所述商值乘以目标直接数据序列中每个局部极值点的特征量,记为目标直接数据序列中每个局部极值点的新特征量;
将目标间接数据序列中任意一个局部极值点,记为目标局部极值点;
将目标局部极值点对应的时间点,记为起始时间点;
在目标直接数据序列中,按照时间顺序,从起始时间点开始,依次向后统计b个局部极值点,记为目标局部极值点对应的参考局部极值点;所述b为预设的参考数量;
根据目标局部极值点的特征量与参考局部极值点的新特征量之间的差异,得到目标局部极值点的映射数据点与映射时间点;
其中,根据目标局部极值点的特征量与参考局部极值点的新特征量之间的差异,得到目标局部极值点的映射数据点与映射时间点,包括的具体步骤如下:
计算目标局部极值点的特征量分别与所有参考局部极值点的新特征量的差异,将所述差异中的最大值对应的参考局部极值点,记为目标局部极值点的映射数据点;
将目标局部极值点的映射数据点对应的时间点,记为目标局部极值点的映射时间点;
其中,根据目标直接数据序列与目标间接数据序列之间的数据差异、目标间接数据序列中局部极值点与其时间点、映射数据点、映射时间点之间的数据差异,得到目标直接数据序列与目标间接数据序列的相关性对应的具体计算公式为:
;
其中K为目标直接数据序列与目标间接数据序列的相关性,为目标直接数据序列,/>为目标间接数据序列,/>为/>和/>的协方差,q为目标间接数据序列中的局部极值点的数量,/>为目标间接数据序列中第j个局部极值点的数据值,/>为目标间接数据序列中第j个局部极值点的映射数据点的数据值,/>为目标间接数据序列中第j个和第j+1个局部极值点的时间点的时间间隔,/>为目标间接数据序列中第j个和第j+1个局部极值点的映射时间点的时间间隔,| |为绝对值函数,/>为以自然常数为底的指数函数。
2.根据权利要求1所述基于多项因素进行同步分析的城市小微水体风险评估方法,其特征在于,所述根据参考数据序列中数据之间、局部极值点之间的差异,得到参考数据序列的信息丰富程度、每个局部极值点的特征量,包括的具体步骤如下:
在参考数据序列中任意相邻两个局部极值点之间,依次计算前一个数据减去后一个数据的差值,得到所述相邻两个局部极值点之间的差值序列;
将所述相邻两个局部极值点之间的差值序列中的数据均值的绝对值,记为所述相邻两个局部极值点之间的斜率;
将所述相邻两个局部极值点的数据值的差值的绝对值,记为所述相邻两个局部极值点的极差;
在参考数据序列中,将所述相邻两个局部极值点之间的斜率乘以所述相邻两个局部极值点的极差,记为所述相邻两个局部极值点中前一个局部极值点的特征量;
根据参考数据序列中的数据方差、参考数据序列中所有相邻局部极值点之间的斜率、相邻局部极值点的极差,得到参考数据序列的信息丰富程度。
3.根据权利要求2所述基于多项因素进行同步分析的城市小微水体风险评估方法,其特征在于,所述根据参考数据序列中的数据方差、参考数据序列中所有相邻局部极值点之间的斜率、相邻局部极值点的极差,得到参考数据序列的信息丰富程度对应的具体计算公式为:
;
其中E为参考数据序列的信息丰富程度,为参考数据序列中的数据方差,R为参考数据序列中的局部极值点数量,/>为参考数据序列中第t个和第t+1个局部极值点之间的斜率,/>为参考数据序列中第t个和第t+1个局部极值点的极差。
4.根据权利要求1所述基于多项因素进行同步分析的城市小微水体风险评估方法,其特征在于,所述根据目标直接数据序列分别与所有种直接指标的时序数据序列的相关性、所有时序数据序列的信息丰富程度,得到目标间接数据序列与A类数据的关联性,包括的具体步骤如下:
根据水体检测行业内制定的水体质量评估标准,得到每一种直接指标对应的水体监测的重要性评估值;
将目标间接数据序列的信息丰富程度除以每种直接指标的时序数据序列的信息丰富程度,记为标间接数据序列对每种直接指标的时序数据序列的影响程度;
根据标间接数据序列对所有种直接指标的时序数据序列的影响程度、所有种直接指标对应的水体监测的重要性评估值、目标间接数据序列分别与所有种直接指标的时序数据序列的相关性,得到目标间接数据序列与A类数据的关联性。
5.根据权利要求4所述基于多项因素进行同步分析的城市小微水体风险评估方法,其特征在于,所述根据标间接数据序列对所有种直接指标的时序数据序列的影响程度、所有种直接指标对应的水体监测的重要性评估值、目标间接数据序列分别与所有种直接指标的时序数据序列的相关性,得到目标间接数据序列与A类数据的关联性,包括的具体步骤如下:
将每种直接指标对应的水体监测的重要性评估值、目标间接数据序列与每种直接指标的时序数据序列的相关性、标间接数据序列对每种直接指标的时序数据序列的影响程度进行相乘,记为目标间接数据序列与每种直接指标的时序数据序列的关联性;
将目标间接数据序列分别与所有种直接指标的时序数据序列的关联性的均值,记为目标间接数据序列与A类数据的关联性。
6.根据权利要求1所述基于多项因素进行同步分析的城市小微水体风险评估方法,其特征在于,所述根据所有种间接指标的时序数据序列分别与A类数据的关联性,得到目标水体的风险评估值,包括的具体步骤如下:
将每种间接指标的时序数据序列与A类数据的关联性,记为每种间接指标的时序数据序列的降维参数;
根据所有种间接指标的时序数据序列的降维参数、预设的目标主成分数量,使用PCA降维算法对B类数据进行降维操作,得到B类数据的若干个主成分与每个主成分的主成分得分;
根据B类数据的所有主成分、所有主成分的主成分得分,得到目标水体的风险评估值。
7.根据权利要求6所述基于多项因素进行同步分析的城市小微水体风险评估方法,其特征在于,所述根据B类数据的所有主成分、所有主成分的主成分得分,得到目标水体的风险评估值对应的具体计算公式为:
;
其中P为目标水体的风险评估值,为B类数据的第u个主成分的方差,/>为B类数据的第u个主成分的主成分得分,Y为B类数据的主成分的数量,a为预设的常数,/>为线性归一化函数。
CN202311340168.2A 2023-10-17 2023-10-17 基于多项因素进行同步分析的城市小微水体风险评估方法 Active CN117078490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311340168.2A CN117078490B (zh) 2023-10-17 2023-10-17 基于多项因素进行同步分析的城市小微水体风险评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311340168.2A CN117078490B (zh) 2023-10-17 2023-10-17 基于多项因素进行同步分析的城市小微水体风险评估方法

Publications (2)

Publication Number Publication Date
CN117078490A CN117078490A (zh) 2023-11-17
CN117078490B true CN117078490B (zh) 2024-03-29

Family

ID=88718022

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311340168.2A Active CN117078490B (zh) 2023-10-17 2023-10-17 基于多项因素进行同步分析的城市小微水体风险评估方法

Country Status (1)

Country Link
CN (1) CN117078490B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117523703B (zh) * 2023-11-21 2024-04-05 北京易动宇航科技有限公司 一种电推进系统失效风险评估方法
CN117493787B (zh) * 2024-01-02 2024-03-15 山东力威液压技术有限公司 基于压力流量关联分析的液压阀运行数据异常预警方法
CN117556377B (zh) * 2024-01-12 2024-03-22 山东德源电力科技股份有限公司 用于站所自动化终端的多源数据融合处理方法
CN117880766B (zh) * 2024-03-13 2024-05-28 深圳市诚立业科技发展有限公司 基于随机权重算法的短信通道路由方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012178036A (ja) * 2011-02-25 2012-09-13 Kddi Corp 類似度評価装置及び方法並びに類似度評価プログラム及びその記憶媒体
WO2019237523A1 (zh) * 2018-06-11 2019-12-19 平安科技(深圳)有限公司 安全风险评估方法、装置、计算机设备和存储介质
CN114492978A (zh) * 2022-01-20 2022-05-13 哈尔滨工程大学 一种基于多层注意力机制的时空序列预测方法及设备
CN115953687A (zh) * 2023-01-18 2023-04-11 生态环境部卫星环境应用中心 基于遥感技术的小微水体受损等级划分方法和装置
CN116416108A (zh) * 2023-06-12 2023-07-11 生态环境部华南环境科学研究所(生态环境部生态环境应急研究所) 基于多项因素进行同步分析的城市小微水体风险评估方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080167571A1 (en) * 2006-12-19 2008-07-10 Alan Gevins Determination of treatment results prior to treatment or after few treatment events
US20100082362A1 (en) * 2008-09-17 2010-04-01 Baker Salsbury Method and Apparatus for Assessing Salient Characteristics of a Community
US20170200107A1 (en) * 2016-01-07 2017-07-13 Mark Ducros Stouse Correlation processes for identifying cause and effect relationships in complex business environments

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012178036A (ja) * 2011-02-25 2012-09-13 Kddi Corp 類似度評価装置及び方法並びに類似度評価プログラム及びその記憶媒体
WO2019237523A1 (zh) * 2018-06-11 2019-12-19 平安科技(深圳)有限公司 安全风险评估方法、装置、计算机设备和存储介质
CN114492978A (zh) * 2022-01-20 2022-05-13 哈尔滨工程大学 一种基于多层注意力机制的时空序列预测方法及设备
CN115953687A (zh) * 2023-01-18 2023-04-11 生态环境部卫星环境应用中心 基于遥感技术的小微水体受损等级划分方法和装置
CN116416108A (zh) * 2023-06-12 2023-07-11 生态环境部华南环境科学研究所(生态环境部生态环境应急研究所) 基于多项因素进行同步分析的城市小微水体风险评估方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Two-step Principal Component Analysis for Dynamic Processes;Lou, Zhijiang;《IEEE》;第73-77页 *
基于主成分分析法的目标价值评估;劳亚民;刘登科;陈明明;;舰船电子工程(第03期);第20-25页 *
基于动态时间序列电压相关性分析的低压配电网拓扑校核;邹时容;陆慧;洪梓铭;黄杰栋;陈琳韬;廖志伟;;广东电力(第05期);第35-40页 *

Also Published As

Publication number Publication date
CN117078490A (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN117078490B (zh) 基于多项因素进行同步分析的城市小微水体风险评估方法
CN106340286B (zh) 一种通用的实时乐器演奏评价系统
CN108509935B (zh) 一种基于随机森林算法的雷达工作模式识别方法
CN111122162B (zh) 基于欧氏距离多尺度模糊样本熵的工业系统故障检测方法
CN108171976B (zh) 基于在途数据的车辆用途识别方法
CN108090515A (zh) 一种基于数据融合的环境等级评估方法
US20240133391A1 (en) Prediction method for stall and surging of axial-flow compressor based on deep autoregressive network
CN110533007A (zh) 一种桥梁车载应变影响线特征智能识别与提取方法
CN107132311A (zh) 一种基于频域特征提取的快速气体识别算法
Chatterjee et al. Speech emotion recognition using cross-correlation and acoustic features
CN117289778B (zh) 一种工控主机电源健康状态的实时监测方法
CN103852525A (zh) 基于ar-hmm的声发射信号识别方法
CN115169504B (zh) 一种煤气精脱硫工艺中的设备异常识别方法
CN106874674A (zh) 一种面向海洋领域的多元时间序列相似性度量方法
Ni et al. Multi-meter intelligent detection and recognition method under complex background
CN109272262A (zh) 一种自然语言特征的分析方法
Fourqurean et al. Elucidating seagrass population dynamics: Theory, constraints, and practice
CN114925731A (zh) 检测柔性测斜仪监测数据异常值的方法
CN113657726A (zh) 基于随机森林的人员的危险性分析方法
CN112395812B (zh) 一种评价风速时移性的方法
CN112528849B (zh) 一种基于内积矩阵及深度学习的结构健康监测方法
CN114386196B (zh) 一种板带力学性能预测准确性评估方法
CN115754006B (zh) 一种基于时间序列排列模式分布的声发射事件检测方法
CN118035780B (zh) 基于多维传感器的河流状态评估方法及系统
CN115372919B (zh) 一种基于t检验的雷达目标回波模拟性能评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant