CN110188324B - 一种基于特征向量空间滤值的交通事故poisson回归分析方法 - Google Patents

一种基于特征向量空间滤值的交通事故poisson回归分析方法 Download PDF

Info

Publication number
CN110188324B
CN110188324B CN201910411640.4A CN201910411640A CN110188324B CN 110188324 B CN110188324 B CN 110188324B CN 201910411640 A CN201910411640 A CN 201910411640A CN 110188324 B CN110188324 B CN 110188324B
Authority
CN
China
Prior art keywords
traffic accident
calculating
data
matrix
moran
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910411640.4A
Other languages
English (en)
Other versions
CN110188324A (zh
Inventor
陈玉敏
罗凤兰
陈娒杰
黄黎恒
谭黄元
曹吉平
廖佳鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201910411640.4A priority Critical patent/CN110188324B/zh
Publication of CN110188324A publication Critical patent/CN110188324A/zh
Application granted granted Critical
Publication of CN110188324B publication Critical patent/CN110188324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Complex Calculations (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于特征向量空间滤值的交通事故poisson回归分析方法,包括:步骤1、统计每个街区里面的交通事故数量总和作为因变量;步骤2、获取交通事故总量对应的相关因子数据,并按街区分别计算各相关因子数据;步骤3、对相关因子进行筛选;步骤4、对街区数据进行空间邻接关系的判断,计算中心化的空间邻接矩阵矩阵;步骤5、计算空间邻接矩阵的特征值和特征向量组;步骤6、提取特征向量作为交通事故数据的空间影响因子;步骤7、求解基于特征函数空间滤值的poisson回归模型系数,得到交通事故量与自变量之间的关系模型;步骤8、对关系模型的精度进行验证和评价。本发明可有效的提高回归模型的拟合精度,实现对交通事故的有效分析和准确模拟。

Description

一种基于特征向量空间滤值的交通事故poisson回归分析 方法
技术领域
本发明涉及地学统计和空间分析服务应用技术领域,尤其涉及一种基于特征向量空间滤值的交通事故poisson回归分析方法。
背景技术
城市道路交通安全关系到城市居民的人身安全和切身利益,是国民经济发展和社会安定的重要方面。近年来,随着城市化进程的进一步加快以及城市机动化程度的日益增高,城市道路交通事故呈上升态势。目前关于交通事故的研究主要集中于以下两个方面:一方面是基于logistic回归模型,分析各种因素对交通事故严重程度的影响;另一方面是基于poisson回归模型,分析交通事故的发生起数与影响因素之间的关系。
Poisson回归模型适用于描述单位时间、单位面积或者单位容积内某事件发生的频数分布情况,通常用于描述稀有事件(即小概率)事件发生数的分布。许多的学者应用Poisson回归模型分析交通事故与相关因素之间的关系。谢孟昌根据台湾中山高速公路交通事故统计数据,分别采用线性模型和泊松回归模型构建交通事故起数、死亡人数受伤人数、单车事故起数和多车事故起数模型;Kraus和Anderson根据美国加州告诉公路统计数据,选择事故率为因变量,选择车道数、护栏形式、道路线行等为自变量,并考虑自变量之间的相互影响,采用泊松回归模型分别建立车道、路外事故率模型;Miaou等人(1992)利用泊松回归模型建立了北卡罗莱纳农村州际公路上卡车事故与公路几何形状之间的经验关系。
地理学第一定律指出:地理事物或属性在空间分布上互为相关,存在集聚(clustering)、随机(random)、规则(Regularity)分布,且距离越近相关性越强。由于空间相关性的存在,可能会导致模型的拟合优度比较差。为了解决这个问题,需要消除空间自相关的影响。
去除空间自相关影响的方法主要有地理加权回归方法(GWR)和空间滤值(spatialfiltering)方法,空间滤值方法最早是由Getis和Griffith提出,该方法的核心思想是,把模型中的变量分解成空间影响和非空间影响两部分,将变量的空间影响部分提取出来并将其变量加入到普通的回归模型当中以滤去空间影响。Griffith提出的特征函数空间滤值方法通过选取特征向量加入到自变量中构建滤值算子来代替模型残差中的自相关部分,使得剩余的残差部分只受随机误差影响,从而消除空间自相关的影响。滤值算子相当于残差的自相关部分,故其必然需要包含地理单元间的空间关系。空间权重矩阵通过构建空间地理单元间的二进制关系,能有效地表达地理单元的空间相关性,因此可以基于空间权重矩阵来构建滤值算子。利用筛选的特征向量来构建滤值算子加入到普通的回归模型中,能有效的减少受残差的空间自相关影响而导致的模型误设。Patuelli利用空间滤值方法研究德国失业现象,发现空间滤值的加入使得回归模型对于失业现象的预测准确率提高,从实证研究的角度验证了空间滤值方法的有效性。
在这项发明中,我们基于特征向量空间滤值的方法,消除空间自相关的影响,构建了基于特征向量空间滤值的交通事故poisson回归模型,用来研究交通事故的发生与相关因子之间的关系,构建了交通事故起数模型。相比于使用普通的poisson回归模型,该方法能够拥有更好的拟合优度。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于特征向量空间滤值的交通事故poisson回归分析方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于特征向量空间滤值的交通事故poisson回归分析方法,该方法包括以下步骤:
步骤1、统计每个街区里面的交通事故数量总和作为因变量;
步骤2、获取交通事故总量对应的相关因子数据,并按街区分别计算各相关因子数据;
步骤3、对相关因子进行筛选:计算交通事故数据和相关因子的pearson相关系数,将相关系数大于设定值对应的相关因子作为模型的自变量;自变量之间的共线性诊断:计算自变量之间的方差膨胀因子,剔除掉方差膨胀因子大于10的相关因子;
步骤4、对街区数据进行空间邻接关系的判断,构建相应的空间邻接矩阵W,并对空间邻接矩阵W进行中心化操作,得到中心化的空间邻接矩阵矩阵C;
步骤5、计算空间邻接矩阵C的特征值和特征向量组E;
步骤6、使用前向选择法,从向量组E中提取特征向量作为交通事故数据的空间影响因子;
步骤7、求解基于特征函数空间滤值的poisson回归模型系数,得到交通事故量与自变量之间的关系模型;
步骤8、对关系模型的精度进行验证和评价。
进一步地,本发明的步骤1的具体方法为:
以街区为单位对交通事故进行数量的统计;首先获取到交通事故数据点的经纬度数据,在软件ArcGIS Desktop中,将经纬度数据转换成点数据,然后使用ArcGIS Desktop的Join Data功能,选择sum,统计得到每个街区发生交通事故的数量。
进一步地,本发明的步骤2的具体方法为:
步骤2.1、首先通过开源网站OpenStreetMap获取道路数据;利用ArcGISDesktop的“标识”工具来把每条路段在行政边界处打断,并且标识处路段所属街区的名称;处理完成后得到新的道路要素类文件;然后通过ArcGIS Desktop的几何计算功能计算每条道路的长度;再使用汇总功能,根据街区字段名称进行汇总,得到每个街区的道路长度;
步骤2.2、通过ArcGIS Desktop的几何计算功能计算每个街区的面积;
步骤2.3、根据道路长度和街区面积计算得到街区道路密度;根据每个街区人口数据和街区面积计算得到街区人口密度;根据每个街区的面积和研究区域总面积计算得到街区面积占比;
步骤2.4、利用网络爬虫从高德地图上爬取相关的POI数据;将爬取到的经纬度数据在ArcGIS Desktop中转化为点数据;然后使用ArcGIS Desktop的Join Data功能,选择sum,统计得到每个街区相应因子的数量。
进一步地,本发明的步骤4的具体方法为:
若街区i与j相互邻接,则Wij=1,否则Wij=0,最终得到一个n*n的矩阵,即空间邻接矩阵W;对矩阵W进行中心化的操作,计算公式如下:
Figure BDA0002062988300000041
其中,C为中心化后的矩阵,I为单位矩阵,11T为所有元素为1的矩阵,n为邻接矩阵的行列号,行号和列号是相等的。
进一步地,本发明的步骤5的具体方法为:
求解特征值与特征向量的算法包括:幂法、反幂法、Jacobi迭代法、QR算法;通过软件中的开源库函数进行求解。
进一步地,本发明的步骤6的具体方法为:
步骤6.1、首先对特征向量组进行初步筛选,只选择其中特征向量的Moran’s I大于0.25的特征向量,特征向量的Moran’s I跟它对应的特征值的函数关系如下:
Figure BDA0002062988300000042
其中n是矩阵的行列号,W是原始的邻接矩阵;1是n*1的一个全部元素是1的向量;
步骤6.2、循环迭代,每次从步骤6.1的特征向量组中选择一个特征向量Ei加入到模型中X=X+Ei,计算残差e和残差e的Moran’s I,遍历所有剩下的特征向量,一次只加入一个X=X+Ei,计算得到Moran’s I,最后得到所有特征向量Ei对应的Moran’s I的向量组;其中,残差e的计算公式为:
Figure BDA0002062988300000043
残差e的Moran’s I的计算公式为:
Figure BDA0002062988300000051
其中,W和Wij都表示经过标准归一化后的邻接矩阵;n为邻接矩阵的行列号;e为计算的残差;
步骤6.3、取Moran’s I向量组中最小的,进行Moran’s I的显著性分析。
进一步地,本发明的步骤6.3中进行显著性分析的方法具体为:
步骤6.3.1、将最小的Moran’s I所对应的残差e向量进行999次随机排列,一个e向量中的各个行进行随机排列,得到999个一维的e向量,然后再分别计算e的Moran’s I,表示为Irnd,其中Y用新的e向量替换,X不变;
步骤6.3.2、统计Irnd>=最小的Moran’s I的个数,表示为num;
步骤6.3.3、计算P=(num+1)/(999+1);
步骤6.3.4、若P>=0.05,表示不显著,显著性检验算法结束,e所对应的特征向量Emin保留;若P<0.05,表示显著,设定X=X+Emin重复步骤6.2,直到不显著为止。
进一步地,本发明的步骤8的具体方法为:
计算所得模型的Pseudo R2、AIC值、Deviance Statistic以及残差的Moran’s I作为评价指标,验证模型的拟合精度;通过留一交叉验证的方法划分训练集和验证集,进行模型验证。
本发明产生的有益效果是:本发明的基于特征向量空间滤值的交通事故poisson回归分析方法,针对交通事故进行研究与分析,将特征向量空间滤值方法引入到普通poisson回归模型中,设计了一种基于特征函数空间滤值的交通事故poisson回归分析方法。本发明解决了普通poisson回归模型由于残差空间自相关导致的模型拟合精度不够高的问题,可有效的提高回归模型的拟合精度,实现对交通事故的有效分析和准确模拟。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明实施例的流程图。
图2为本发明实施例步骤2中获取相关因子数据子流程图。
图3为本发明实施例步骤3因子筛选的子流程图。
图4为本发明实施例步骤6特征向量筛选的子流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明要解决的核心问题是:利用普通的poisson回归模型进行交通事故的分析和预测时忽略了空间自相关的影响,本发明将特征向量空间滤值与普通的poisson回归模型相结合,减少变量间的空间自相关,提高模型在交通事故的分析和预测中的精度和模型拟合优度。
参见图1,本发明提供的基于特征向量空间滤值的交通事故poisson回归分析方法,包括以下步骤:
步骤1:统计每个街区里面的交通事故数量总和作为因变量。首先获取到交通事故数据点的经纬度数据,在ArcGIS Desktop将经纬度数据转换成点数据,然后使用ArcGISDesktop的Join Data功能,然后选择”Join data fromanother layer based on spatiallocation”,选择sum,然后统计每个街区发生交通事故的数量。
步骤2:获取相应的交通事故总量相关因子数据,并按街区分别计算各因子数据。
步骤2.1:如附图2所示,首先通过开源网站OpenStreetMap获取道路数据;利用ArcGIS Desktop的“标识”工具来把每条路段在行政边界处打断,并且标识处路段所属街区的名称;处理完成后会得到一个新的道路要素类文件。然后通过ArcGIS Desktop的几何计算功能计算每条道路的长度;再使用汇总功能,根据街区字段名称进行汇总,即可得到每个街区的道路长度;
步骤2.2:通过ArcGIS Desktop的几何计算功能计算每个街区的面积;
步骤2.3:用步骤2.1计算得到的道路长度/步骤2.2计算得到的街区面积即可得到街区道路密度;用每个街区人口数据/步骤2.2计算得到的街区面积即可得到街区人口密度;用步骤2.2计算得到的每个街区的面积/研究区域总面积即可得到街区面积占比;
步骤2.4:利用Python网络爬虫技术从高德地图上爬取相关的POI数据;将爬取到的经纬度数据在ArcGIS Desktop中转化为点数据;然后使用ArcGIS Desktop的Join Data功能,然后选择”Join data from another layer based onspatial location”,选择sum,然后统计每个街区相应因子的数量。
步骤3:相关因子的筛选。计算交通事故数据和相关因子的pearson相关系数,将与交通事故数据相关性显著的因子作为模型的自变量,剔除掉相关性不显著的因子;变量之间的共线性诊断,计算变量之间的方差膨胀因子,剔除掉方差膨胀因子大于10的因子。其中计算pearson相关系数可在R中进行,利用cor函数和开源R包Hmisc中的rcorr函数进行计算;计算因子间的VIF也在R中进行,利用esf函数计算。
步骤4:对街区数据进行空间邻接关系的判断,构建相应的空间邻接矩阵W,并对空间邻接矩阵W进行中心化操作得到矩阵C。具体实施时,若街区i与j相互邻接,则Wij=1,否则Wij=0,最终可以得到一个n*n的矩阵,即空间邻接矩阵W。建立的邻接矩阵W关于对角线对称,这将导致在之后的特征向量的计算中,特征向量结果之间相互正交,有可能引起多重共线性问题而使模型误设,因此需要对矩阵W进行中心化的操作,计算公式如下:
Figure BDA0002062988300000071
其中,C为中心化后的矩阵,I为单位矩阵,11T为所有元素为1的矩阵,n为邻接矩阵的行列号,行号和列号是相等的。
步骤5:计算步骤4所得到的空间邻接矩阵C的特征值和特征向量组E.目前常见的求解特征值与特征向量的算法有幂法、反幂法、Jacobi迭代法、QR算法。而能进行特征值与特征向量计算的软件与开源库也较多,R、matlab中都有很多的开源库可以使用,如R中的开源包spmoran中的meigen函数就可用来求解矩阵的特征值和特征向量。
步骤6:使用前向选择法,从步骤5所得的向量组E中提取合适的特征向量作为交通事故数据的空间影响因子,参见图4,具体步骤如下:
步骤6.1首先对特征向量组进行初步筛选,只选择其中特征向量的Moran’sI大于0.25的特征向量。特征向量的Moran’s I跟它对应的特征值有一个函数关系如下:
Figure BDA0002062988300000081
其中n是矩阵的行列号,W是原始的邻接矩阵;1是n*1的一个全部元素是1的向量。
步骤6.2循环迭代,每次从步骤6.1的特征向量组中选择一个特征向量Ei加入到模型中(X=X+Ei),计算残差e和残差e的Moran’s I.遍历所有剩下的特征向量,一次只加入一个(X=X+Ei),计算得到Moran’s I.最后得到所有特征向量Ei对应的Moran’s I的向量组。其中,残差e的计算公式为:
Figure BDA0002062988300000082
残差e的Moran’s I的计算公式为:
Figure BDA0002062988300000083
其中,W和Wij都表示经过标准归一化后的邻接矩阵;n为邻接矩阵的行列号;e为计算的残差。
步骤6.3:取Moran’s I向量组中最小的,进行Moran’s I的显著性分析。
步骤6.3.1:将最小的Moran’s I所对应的残差e向量多次随机排列(999次,一个e向量中的各个行进行随机排列,得到999个一维的e向量),然后用步骤3的公式再分别计算e的Moran’s I(Irnd),其中Y用新的e向量替换,X不变。
步骤6.3.2:统计Irnd>=最小的Moran’s I的个数(num)
步骤6.3.3:计算P=(num+1)/(999+1)
步骤6.3.4:若P>=0.05,不显著,显著性检验算法结束(e所对应的特征向量Emin保留);若P<0.05,显著,设定X=X+Emin重复步骤6.2(每次在剩下的n-1个Ei中选取一个Moran’s I最小的,带入步骤6.3进行显著性分析,得X=X+Emin+Ei),直到不显著为止。
步骤7:并求解基于特征函数空间滤值的poisson回归模型系数,得到交通事故量与自变量之间的关系模型。其中基于特征向量空间滤值的poisson回归模型为:
log(E(Y|x))=α+βX+εE
其中,εE是选择的空间特征向量,表达了空间影响。
最后通过极大似然法可以对上述式子进行求解,得到α、β、ε的值;此过程可以在R中调用glm函数来完成。
步骤8:模型精度评价。计算所得模型的Pseudo R2、AIC值、Deviance Statistic以及残差的Moran’s I等作为评价指标,验证模型的拟合精度。其中,Pseudo R2用于评价模型的拟合优度;AIC评价了模型的复杂度;Deviance Statistic常用于统计模型的拟合优度评价,越接近1,拟合优度越高;残差Moran’s I用于评价空间滤值对残差自相关处理的效果。
Figure BDA0002062988300000091
其中yi是街区的交通事故发生量,,
Figure BDA0002062988300000094
是交通事故数据的平均值,/>
Figure BDA0002062988300000093
是模型预测的街区i的交通事故数量,n是街区的个数。
Figure BDA0002062988300000092
其中,W和Wij都表示经过标准归一化后的邻接矩阵;n为邻接矩阵的行列号;e为计算的残差。I的取值范围是[-1,1],值越接近于0,残差空间自相关性越弱,模型越可靠。
步骤9:留一交叉验证。正常训练都会划分训练集和验证集,训练集用来训练模型,而验证集用来评估模型的泛化能力。留一法的样本利用率高,适合于小样本情况。交叉验证可以更好的评价模型的适用性。留一交叉验证具体做法就是:每次只留下一个样本做测试集,其他样本做训练集,如果有N个样本,则需要训练N次,测试N次。最后对验证误差求平均:
Figure BDA0002062988300000101
其中,N为样本数量;en为第n次验证误差。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (6)

1.一种基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,该方法包括以下步骤:
步骤1、统计每个街区里面的交通事故数量总和作为因变量;
步骤2、获取交通事故总量对应的相关因子数据,并按街区分别计算各相关因子数据;
步骤3、对相关因子进行筛选:计算交通事故数据和相关因子的pearson相关系数,将相关系数大于设定值对应的相关因子作为模型的自变量;自变量之间的共线性诊断:计算自变量之间的方差膨胀因子,剔除掉方差膨胀因子大于10的相关因子;
步骤4、对街区数据进行空间邻接关系的判断,构建相应的空间邻接矩阵W,并对空间邻接矩阵W进行中心化操作,得到中心化的空间邻接矩阵矩阵C;
步骤5、计算空间邻接矩阵C的特征值和特征向量组E;
步骤6、使用前向选择法,从向量组E中提取特征向量作为交通事故数据的空间影响因子;
步骤7、求解基于特征函数空间滤值的poisson回归模型系数,得到交通事故量与自变量之间的关系模型;
步骤8、对关系模型的精度进行验证和评价;
步骤6的具体方法为:
步骤6.1、首先对特征向量组进行初步筛选,只选择其中特征向量的Moran’s I大于0.25的特征向量,特征向量的Moran’s I跟它对应的特征值的函数关系如下:
Figure FDA0004175375090000011
其中n是矩阵的行列号,W是原始的邻接矩阵;1是n*1的一个全部元素是1的向量;
步骤6.2、循环迭代,每次从步骤6.1的特征向量组中选择一个特征向量Ei加入到模型中X=X+Ei,计算残差e和残差e的Moran’s I,遍历所有剩下的特征向量,一次只加入一个X=X+Ei,计算得到Moran’s I,最后得到所有特征向量Ei对应的Moran’s I的向量组;其中,残差e的计算公式为:
Figure FDA0004175375090000021
残差e的Moran’s I的计算公式为:
Figure FDA0004175375090000022
其中,W和Wij都表示经过标准归一化后的邻接矩阵;n为邻接矩阵的行列号;e为计算的残差;
步骤6.3、取Moran’s I向量组中最小的,进行Moran’s I的显著性分析;
步骤6.3中进行显著性分析的方法具体为:
步骤6.3.1、将最小的Moran’s I所对应的残差e向量进行999次随机排列,一个e向量中的各个行进行随机排列,得到999个一维的e向量,然后再分别计算e的Moran’s I,表示为Irnd,其中Y用新的e向量替换,X不变;
步骤6.3.2、统计Irnd>=最小的Moran’s I的个数,表示为num;
步骤6.3.3、计算P=(num+1)/(999+1);
步骤6.3.4、若P>=0.05,表示不显著,显著性检验算法结束,e所对应的特征向量Emin保留;若P<0.05,表示显著,设定X=X+Emin重复步骤6.2,直到不显著为止。
2.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤1的具体方法为:
以街区为单位对交通事故进行数量的统计;首先获取到交通事故数据点的经纬度数据,在软件ArcGISDesktop中,将经纬度数据转换成点数据,然后使用ArcGISDesktop的JoinData功能,选择sum,统计得到每个街区发生交通事故的数量。
3.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤2的具体方法为:
步骤2.1、首先通过开源网站OpenStreetMap获取道路数据;利用ArcGIS Desktop的“标识”工具来把每条路段在行政边界处打断,并且标识处路段所属街区的名称;处理完成后得到新的道路要素类文件;然后通过ArcGISDesktop的几何计算功能计算每条道路的长度;再使用汇总功能,根据街区字段名称进行汇总,得到每个街区的道路长度;
步骤2.2、通过ArcGISDesktop的几何计算功能计算每个街区的面积;
步骤2.3、根据道路长度和街区面积计算得到街区道路密度;根据每个街区人口数据和街区面积计算得到街区人口密度;根据每个街区的面积和研究区域总面积计算得到街区面积占比;
步骤2.4、利用网络爬虫从高德地图上爬取相关的POI数据;将爬取到的经纬度数据在ArcGISDesktop中转化为点数据;然后使用ArcGISDesktop的Join Data功能,选择sum,统计得到每个街区相应因子的数量。
4.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤4的具体方法为:
若街区i与j相互邻接,则Wij=1,否则Wij=0,最终得到一个n*n的矩阵,即空间邻接矩阵W;对矩阵W进行中心化的操作,计算公式如下:
Figure FDA0004175375090000031
其中,C为中心化后的矩阵,I为单位矩阵,11T为所有元素为1的矩阵,n为邻接矩阵的行列号,行号和列号是相等的。
5.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤5的具体方法为:
求解特征值与特征向量的算法包括:幂法、反幂法、Jacobi迭代法、QR算法;通过软件中的开源库函数进行求解。
6.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤8的具体方法为:
计算所得模型的Pseudo R2、AIC值、Deviance Statistic以及残差的Moran’sI作为评价指标,验证模型的拟合精度;通过留一交叉验证的方法划分训练集和验证集,进行模型验证。
CN201910411640.4A 2019-05-17 2019-05-17 一种基于特征向量空间滤值的交通事故poisson回归分析方法 Active CN110188324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910411640.4A CN110188324B (zh) 2019-05-17 2019-05-17 一种基于特征向量空间滤值的交通事故poisson回归分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910411640.4A CN110188324B (zh) 2019-05-17 2019-05-17 一种基于特征向量空间滤值的交通事故poisson回归分析方法

Publications (2)

Publication Number Publication Date
CN110188324A CN110188324A (zh) 2019-08-30
CN110188324B true CN110188324B (zh) 2023-05-30

Family

ID=67716670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910411640.4A Active CN110188324B (zh) 2019-05-17 2019-05-17 一种基于特征向量空间滤值的交通事故poisson回归分析方法

Country Status (1)

Country Link
CN (1) CN110188324B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570339B (zh) * 2019-09-16 2022-04-29 四川长虹电器股份有限公司 一种在线教育教学干预方法
CN112818747A (zh) * 2020-12-31 2021-05-18 上海应用技术大学 一种基于空间大数据的城市特色街区人口密度估算方法和系统方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038081A (zh) * 2017-12-25 2018-05-15 武汉大学 基于特征函数空间滤值的滑坡灾害logistic回归分析方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038081A (zh) * 2017-12-25 2018-05-15 武汉大学 基于特征函数空间滤值的滑坡灾害logistic回归分析方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《A Geocomputation and Geovisualization Comparision of Moran and Geary Eigenvector Spatial Filtering》;Daniel A.Griffith;《2017 25th International Conference on Geoinformatics》;20171231;全文 *
《基于Moran模型的道路交通事故空间自相关特征分析》;温惠英等;《交通与计算机》;20080615;全文 *
《基于交通分析区的交通事故与交通违法空间特征分析及影响关系研究》;樊朋光;《中国优秀硕士学位论文全文数据库》;20190401;全文 *
基于Moran统计量的空间自相关理论发展和方法改进;陈彦光;《地理研究》;20091115(第06期);全文 *

Also Published As

Publication number Publication date
CN110188324A (zh) 2019-08-30

Similar Documents

Publication Publication Date Title
CN108346292B (zh) 基于卡口数据的城市快速路实时交通指数计算方法
CN113034913A (zh) 交通拥堵预测方法、装置、设备及存储介质
CN109635010B (zh) 一种用户特征及特征因子抽取、查询方法和系统
CN112447041B (zh) 识别车辆的营运行为的方法、装置及计算设备
CN110188324B (zh) 一种基于特征向量空间滤值的交通事故poisson回归分析方法
CN109598931B (zh) 基于交通安全风险的群体划分与差异性分析方法及系统
CN106297304A (zh) 一种基于MapReduce面向大规模卡口数据的套牌车识别方法
Xi et al. A hybrid algorithm of traffic accident data mining on cause analysis
CN113051811B (zh) 一种基于gru网络的多模式短期交通拥堵预测方法
Trirat et al. Df-tar: a deep fusion network for citywide traffic accident risk prediction with dangerous driving behavior
DE112021001926T5 (de) System und verfahren zur filterlosen drosselung vonfahrzeugereignisdatenverarbeitung zum identifizieren von parkbereichen
Pollard et al. Comparing the quality of OD matrices in time and between data sources
Getachew Traffic load effects on bridges, statistical analysis of collected and Monte Carlo simulated vehicle data
CN112652168B (zh) 一种重大交通事故预警方法、系统及存储介质
CN115794801B (zh) 一种挖掘自动驾驶事故致因链式关系的数据分析方法
CN115565376B (zh) 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统
CN107516287A (zh) 交通事故成因分析方法
CN116484244A (zh) 基于聚类模型的自动驾驶事故发生机制分析方法
CN116564551A (zh) 一种数据-知识驱动的城市轨道交通风险辨识方法
CN108596381B (zh) 基于od数据的城市停车需求预测方法
CN112749239B (zh) 一种事件图谱构建方法、装置及计算设备
CN111951546B (zh) 一种量化拥堵收费政策安全影响范围的方法
CN112183615B (zh) 一种带有马尔可夫链数据处理的汽车风险用户筛查方法
CN111191185B (zh) 一种交通出行系统的区块重要性评估方法及系统
CN111369200B (zh) 一种基于车辆lbs数据的城市物流通道识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant