CN113127533A - 气象交通系统基于组合多变量相关性的影响因子分析方法 - Google Patents

气象交通系统基于组合多变量相关性的影响因子分析方法 Download PDF

Info

Publication number
CN113127533A
CN113127533A CN202110344284.6A CN202110344284A CN113127533A CN 113127533 A CN113127533 A CN 113127533A CN 202110344284 A CN202110344284 A CN 202110344284A CN 113127533 A CN113127533 A CN 113127533A
Authority
CN
China
Prior art keywords
elements
meteorological
traffic system
score
factors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110344284.6A
Other languages
English (en)
Inventor
杨泓
卢军
郑昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Meteorological Service Center
Chengdu University of Information Technology
Original Assignee
Sichuan Meteorological Service Center
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Meteorological Service Center, Chengdu University of Information Technology filed Critical Sichuan Meteorological Service Center
Priority to CN202110344284.6A priority Critical patent/CN113127533A/zh
Publication of CN113127533A publication Critical patent/CN113127533A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种气象交通系统基于组合多变量相关性的影响因子分析方法,该方法采用i‑score分析多个因子对目标产生作用权值;该方法可以很好地解决由于平均值的代表性很差,导致这种大尺度分析的效果很差,构建出的模型的拟合能力不理想的问题。

Description

气象交通系统基于组合多变量相关性的影响因子分析方法
技术领域
本发明具体涉及一种气象交通系统基于组合多变量相关性的影响因子分析方法。
背景技术
对于交通事故和气象要素的相关关系,可能是线性的,也可能是非线性的,确定用哪种方法来计算相关系数是一个关键。影响高原公路气象的要素很多,目前的气象预测研究,还难以有效地判断,哪些要素是影响川西高原公路气象的关键核心因素。一些研究成果虽然给出了一些参考的重点要素,例如地面温度、湿度、气压等,但是这些要素仅仅局限于特殊的应用环境,在不同的应用环境中,差异性很大。国内外以往的研究为了简化分析的难度,通常将一条公路的气象条件的平均值代替整条公路所有段的气象值。由于平均值的代表性很差,导致这种大尺度分析的效果很差,构建出的模型的拟合能力不理想。因此急需一种气象交通系统基于组合多变量相关性的影响因子分析方法以解决这一问题。
发明内容
本发明的目的在于针对现有技术的不足,提供一种气象交通系统基于组合多变量相关性的影响因子分析方法,该气象交通系统基于组合多变量相关性的影响因子分析方法可以很好地解决上述问题。
为达到上述要求,本发明采取的技术方案是:提供一种气象交通系统基于组合多变量相关性的影响因子分析方法,该气象交通系统基于组合多变量相关性的影响因子分析方法包括如下步骤:
采用i-score分析多个因子对目标产生作用权值,具体计算公式如下:
设具有m+1个变量的分组Ai,考虑这些变量对Y的影响,假设其度量值是DI
Figure BDA0003000336240000021
其中
Figure BDA0003000336240000022
为Ai的一个子集合Aij的元素均值,
Figure BDA0003000336240000023
所有样本的均值。nij和nik分别从Ai中选择的子集合中元素的总个数。
该气象交通系统基于组合多变量相关性的影响因子分析方法具有的优点如下:
该方法可以很好地解决由于平均值的代表性很差,导致这种大尺度分析的效果很差,构建出的模型的拟合能力不理想的问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示意性地示出了根据本申请一个实施例的气象交通系统基于组合多变量相关性的影响因子分析方法中网格化时空预报模型的示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本申请作进一步地详细说明。
在以下描述中,对“一个实施例”、“实施例”、“一个示例”、“示例”等等的引用表明如此描述的实施例或示例可以包括特定特征、结构、特性、性质、元素或限度,但并非每个实施例或示例都必然包括特定特征、结构、特性、性质、元素或限度。另外,重复使用短语“根据本申请的一个实施例”虽然有可能是指代相同实施例,但并非必然指代相同的实施例。
为简单起见,以下描述中省略了本领域技术人员公知的某些技术特征。
根据本申请的一个实施例,提供一种气象交通系统基于组合多变量相关性的影响因子分析方法,将气象要素资料与交通事故资料进行相关分析,计算出相关系数。对于交通事故和气象要素的相关关系,可能是线性的,也可能是非线性的,先选择一种方法来计算相关系数,如何效果不好,再选择另外的方法。将气象要素资料与交通事故资料进行多因子的联合相关分析,基于国际领先的i-score方法,计算出相关系数。对于交通事故和气象要素的相关关系,可能是线性的,也可能是非线性的,先选择一种方法来计算相关系数。
为了解决这个问题,在本项目,创新地引入了i-score多因子联合分析方法。在川西高原公路气象预测中,由于各种要素之间高度相关,某些回归参数的估计值极不稳定,甚至出现有悖常理、难以解释的情形。为了避免这种困境,本项目先采用i-score分析多个因子对目标产生作用权值,为了充分考虑四川省气象变化的特点,引入了50公里范围内自动气象站的气象观测要素作为主成分的备选因素。
这样经过基于i-score的多因子联合主成分分析后,根据分析结果,自动地保留几个主成分,而不至于导致原变量的信息的过多损失,同时也避免了这些主成分为自变量进行多重回归就不会再出现共线性的困扰。
假设有一个具有m+1个变量的分组Ai,考虑这些变量对Y的影响,假设其度量值是DI
Figure BDA0003000336240000031
其中
Figure BDA0003000336240000032
为Ai的一个子集合Aij的元素均值,
Figure BDA0003000336240000033
所有样本的均值。nij和nik分别从Ai中选择的子集合中元素的总个数。
i-score方法的计算过程如下:
子分组的选择,可以从2开始,直到N。N的大小取决于对多个元素组合起来影响输出的探测力度。例如N取5,表明最多找到5个元素组合起来对输出有影响。根据N,随机地从m个元素中选择N个元素,形成一个分组。随机地从分组中删除一个元素,每删除一个元素,都计算一次DI。然后放回这个元素到分组中,在这个分组中随机选择另外一个元素删除,再计算DI。如此循环,直到分组中每个元素都删了一次,并且得到了每个被删除元素对应于的DI。对比上述得到的DI,把最小的DI所对应的那个元素从集合中删除。然后再从新的N-1个元素中重复上述过程。这个过程可以重复到一直满足设定的条件为止结束。例如,可以是所有的DI都是正值了,这个时候,所有的元素都是对输出Y有贡献的,必须要保留了,并且找到了一个组合,是对输出Y有直接影响的因素组合。
经过基于i-score的多因子联合主成分分析后,系统会自动地保留几个气象主成分因素,而不至于导致原变量的信息的过多损失。I-score方法相对于传统的PCA方法的优点是:
(1)PCA方法进行线性投影后将维,已经丧失了物理意义,基于PCA后的数据进行的回归,解决了计算的复杂性,却完全丢失了物理意义。
(2)PCA的本质运算系统是线性的,只考虑了二阶统计特性,只能提取数据中的线性关系,从而将高维的原始数据的线性特征映射到低维特征空间。对于数据间存在着大量非线性关系的时候,PCA已经不满足使用条件。我们研究的气象-交通系统中的数据映射,没有任何研究能表明其是线性系统,因此使用PCA难以得出正确的结论。
事实上,多个元素组合对Y的影响,是自然中普遍存在的事情。i-score方法不仅仅能找到单个的元素对Y的影响,更能找到多个元素组合对Y的影响,这种能力是独一的,非凡的。i-score方法不仅仅适用于线性系统,也适用于非线性系统。应用i-score方法,我们才获得了对大数据全面的(不仅仅能找到单个元素的影响,更能找到元素组合对Y的影响)、深刻(理论上可以找到人一多个元素组合对Y的影响)的认识,可以发现许多原有的模型方法无法发现的事物之间的关联。
所以,可以总结,i-score是原生态的,揭示事物内在关系,PCA是针对线性系统的,优雅但是掩盖了事务的本来面目,适应本项目的使用。
本项目首次应用i-score方法,基于大数据分析,从数据分析角度发现时空气象要素对交通安全事故的作用机制与作用机理。本项目将原有的单一时间维度、单一空间维度的分析提高到时空气象三维度网格(本项目达到5公里*公里)分析,将三个不同量纲的数据混合分析,可以得出更加精确的预测模型。充分利用四川省气象服务中心已经掌握的全省自动气象站实时观测数据,结合川西高原公路气象监测站网观测数据,运用优于PCA主成分分析的i-score方法,在整个川西高原公路气象预测中,加入了扩展区域成分因素作为附加的主元素,主元素的选择以i-score自动分析结果为判据,从而综合应用了全省气象数据为川西高原公路气象预测提供支撑,提高了预测分析的客观性、准确性。i-score方法不仅仅能找到单个气象元素对交通的影响,更能找到多个气象元素组合交通的影响。应用i-score方法,我们才获得了对大数据全面的(不仅仅能找到单个气象元素的影响,更能找到气象元素组合对交通的影响)、深刻(理论上可以找到多个气象元素组合对交通的影响)的认识,可以发现许多原有的模型方法无法发现的事物之间的关联。
以上所述实施例仅表示本发明的几种实施方式,其描述较为具体和详细,但并不能理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明保护范围。因此本发明的保护范围应该以所述权利要求为准。

Claims (3)

1.一种气象交通系统基于组合多变量相关性的影响因子分析方法,其特征在于,包括如下步骤:
采用i-score分析多个因子对目标产生作用权值,具体计算公式如下:
设具有m+1个变量的分组Ai,考虑这些变量对Y的影响,假设其度量值是DI
Figure FDA0003000336230000011
其中
Figure FDA0003000336230000013
为Ai的一个子集合Aij的元素均值,
Figure FDA0003000336230000012
所有样本的均值。nij和nik分别从Ai中选择的子集合中元素的总个数。
2.根据权利要求1所述的气象交通系统基于组合多变量相关性的影响因子分析方法,其特征在于,具体包括如下步骤:
S1:子分组的选择,从2开始,直到N,N的大小取决于对多个元素组合起来影响输出的探测力度;
S2:根据N,随机地从m个元素中选择N个元素,形成一个分组;
S3:随机地从分组中删除一个元素,每删除一个元素,都计算一次DI
S4:然后放回这个元素到分组中,在这个分组中随机选择另外一个元素删除,再计算DI
S5:循环上述步骤,直到分组中每个元素都删了一次,并且得到了每个被删除元素对应于的DI
S6:对比上述得到的DI,把最小的DI所对应的那个元素从集合中删除;
S7:然后再从新的N-1个元素中重复上述过程。
3.根据权利要求1所述的气象交通系统基于组合多变量相关性的影响因子分析方法,其特征在于:还包括如下步骤:经过基于i-score的多因子联合主成分分析后,系统自动地保留气象主成分因素。
CN202110344284.6A 2021-03-31 2021-03-31 气象交通系统基于组合多变量相关性的影响因子分析方法 Pending CN113127533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110344284.6A CN113127533A (zh) 2021-03-31 2021-03-31 气象交通系统基于组合多变量相关性的影响因子分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110344284.6A CN113127533A (zh) 2021-03-31 2021-03-31 气象交通系统基于组合多变量相关性的影响因子分析方法

Publications (1)

Publication Number Publication Date
CN113127533A true CN113127533A (zh) 2021-07-16

Family

ID=76775028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110344284.6A Pending CN113127533A (zh) 2021-03-31 2021-03-31 气象交通系统基于组合多变量相关性的影响因子分析方法

Country Status (1)

Country Link
CN (1) CN113127533A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995467A (zh) * 2014-05-26 2014-08-20 河海大学常州校区 基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法
CN106101116A (zh) * 2016-06-29 2016-11-09 东北大学 一种基于主成分分析的用户行为异常检测系统及方法
CN108229742A (zh) * 2018-01-04 2018-06-29 国网浙江省电力公司电力科学研究院 一种基于气象数据以及数据趋势的负荷预测方法
CN111476158A (zh) * 2020-04-07 2020-07-31 金陵科技学院 一种基于pso-pca-svm的多通道生理信号体感手势识别方法
KR20200101106A (ko) * 2019-02-19 2020-08-27 주식회사 녹십자지놈 혈중 무세포 dna 기반 간암 치료 예후예측 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995467A (zh) * 2014-05-26 2014-08-20 河海大学常州校区 基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法
CN106101116A (zh) * 2016-06-29 2016-11-09 东北大学 一种基于主成分分析的用户行为异常检测系统及方法
CN108229742A (zh) * 2018-01-04 2018-06-29 国网浙江省电力公司电力科学研究院 一种基于气象数据以及数据趋势的负荷预测方法
KR20200101106A (ko) * 2019-02-19 2020-08-27 주식회사 녹십자지놈 혈중 무세포 dna 기반 간암 치료 예후예측 방법
CN111476158A (zh) * 2020-04-07 2020-07-31 金陵科技学院 一种基于pso-pca-svm的多通道生理信号体感手势识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨泓 等: "四川高速公路安全行车气象风险指数与预警提示发布系统", 《科技成果》 *

Similar Documents

Publication Publication Date Title
CN106375339B (zh) 基于事件滑动窗口的攻击模式检测方法
CN101808351B (zh) 业务影响分析方法和系统
EP3968243A1 (en) Method and apparatus for realizing model training, and computer storage medium
CN109871975B (zh) 基于数据挖掘的故障抢修处理时长预测方法
CN108712714B (zh) 一种室内wlan指纹定位中ap的选择方法及装置
DE102022201746A1 (de) Verwaltung von rechenzentren mit maschinellem lernen
CN115497272A (zh) 一种基于数字化建造的工期智能化预警系统及方法
CN113723452A (zh) 一种基于kpi聚类的大规模异常检测系统
CN113645182B (zh) 一种基于二次特征筛选的拒绝服务攻击随机森林检测方法
CN107784393A (zh) 一种输电线路的缺陷预测方法及装置
Gardner et al. Generation-load mismatch detection and analysis
Chun-Hui et al. Anomaly detection in network management system based on isolation forest
CN117078048A (zh) 基于数字孪生的智慧城市资源管理方法及系统
Zhou et al. Research of network traffic anomaly detection model based on multilevel autoregression
CN116226103A (zh) 一种基于FPGrowth算法进行政务数据质量检测的方法
CN103345552A (zh) 电力ict通信网可靠性的评估方法及系统
CN109446327B (zh) 一种移动通信客户投诉的诊断方法及系统
CN112035527B (zh) 基于数据挖掘的电压暂降敏感设备故障水平评估方法
CN113127533A (zh) 气象交通系统基于组合多变量相关性的影响因子分析方法
CN115599830A (zh) 一种数据关联关系的确定方法、装置、设备和介质
CN107276807B (zh) 一种基于社区动态紧密度的层次化网络社区树剪枝方法
CN117169652A (zh) 一种基于人工智能的配电网故障检测定位系统
CN116151799A (zh) 一种基于bp神经网络的配电线路多工况故障率快速评估方法
CN117675230A (zh) 基于知识图谱的油井数据完整性识别方法
CN116192520A (zh) 一种基于大数据的安全通讯管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210716