CN110188324A - 一种基于特征向量空间滤值的交通事故poisson回归分析方法 - Google Patents
一种基于特征向量空间滤值的交通事故poisson回归分析方法 Download PDFInfo
- Publication number
- CN110188324A CN110188324A CN201910411640.4A CN201910411640A CN110188324A CN 110188324 A CN110188324 A CN 110188324A CN 201910411640 A CN201910411640 A CN 201910411640A CN 110188324 A CN110188324 A CN 110188324A
- Authority
- CN
- China
- Prior art keywords
- traffic accident
- block
- data
- moran
- filter value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Traffic Control Systems (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于特征向量空间滤值的交通事故poisson回归分析方法,包括:步骤1、统计每个街区里面的交通事故数量总和作为因变量;步骤2、获取交通事故总量对应的相关因子数据,并按街区分别计算各相关因子数据;步骤3、对相关因子进行筛选;步骤4、对街区数据进行空间邻接关系的判断,计算中心化的空间邻接矩阵矩阵;步骤5、计算空间邻接矩阵的特征值和特征向量组;步骤6、提取特征向量作为交通事故数据的空间影响因子;步骤7、求解基于特征函数空间滤值的poisson回归模型系数,得到交通事故量与自变量之间的关系模型;步骤8、对关系模型的精度进行验证和评价。本发明可有效的提高回归模型的拟合精度,实现对交通事故的有效分析和准确模拟。
Description
技术领域
本发明涉及地学统计和空间分析服务应用技术领域,尤其涉及一种基于特征向量空间滤值的交通事故poisson回归分析方法。
背景技术
城市道路交通安全关系到城市居民的人身安全和切身利益,是国民经济发展和社会安定的重要方面。近年来,随着城市化进程的进一步加快以及城市机动化程度的日益增高,城市道路交通事故呈上升态势。目前关于交通事故的研究主要集中于以下两个方面:一方面是基于logistic回归模型,分析各种因素对交通事故严重程度的影响;另一方面是基于poisson回归模型,分析交通事故的发生起数与影响因素之间的关系。
Poisson回归模型适用于描述单位时间、单位面积或者单位容积内某事件发生的频数分布情况,通常用于描述稀有事件(即小概率)事件发生数的分布。许多的学者应用Poisson回归模型分析交通事故与相关因素之间的关系。谢孟昌根据台湾中山高速公路交通事故统计数据,分别采用线性模型和泊松回归模型构建交通事故起数、死亡人数受伤人数、单车事故起数和多车事故起数模型; Kraus和Anderson根据美国加州告诉公路统计数据,选择事故率为因变量,选择车道数、护栏形式、道路线行等为自变量,并考虑自变量之间的相互影响,采用泊松回归模型分别建立车道、路外事故率模型;Miaou等人(1992)利用泊松回归模型建立了北卡罗莱纳农村州际公路上卡车事故与公路几何形状之间的经验关系。
地理学第一定律指出:地理事物或属性在空间分布上互为相关,存在集聚(clustering)、随机(random)、规则(Regularity)分布,且距离越近相关性越强。由于空间相关性的存在,可能会导致模型的拟合优度比较差。为了解决这个问题,需要消除空间自相关的影响。
去除空间自相关影响的方法主要有地理加权回归方法(GWR)和空间滤值(spatialfiltering)方法,空间滤值方法最早是由Getis和Griffith提出,该方法的核心思想是,把模型中的变量分解成空间影响和非空间影响两部分,将变量的空间影响部分提取出来并将其变量加入到普通的回归模型当中以滤去空间影响。Griffith提出的特征函数空间滤值方法通过选取特征向量加入到自变量中构建滤值算子来代替模型残差中的自相关部分,使得剩余的残差部分只受随机误差影响,从而消除空间自相关的影响。滤值算子相当于残差的自相关部分,故其必然需要包含地理单元间的空间关系。空间权重矩阵通过构建空间地理单元间的二进制关系,能有效地表达地理单元的空间相关性,因此可以基于空间权重矩阵来构建滤值算子。利用筛选的特征向量来构建滤值算子加入到普通的回归模型中,能有效的减少受残差的空间自相关影响而导致的模型误设。Patuelli利用空间滤值方法研究德国失业现象,发现空间滤值的加入使得回归模型对于失业现象的预测准确率提高,从实证研究的角度验证了空间滤值方法的有效性。
在这项发明中,我们基于特征向量空间滤值的方法,消除空间自相关的影响,构建了基于特征向量空间滤值的交通事故poisson回归模型,用来研究交通事故的发生与相关因子之间的关系,构建了交通事故起数模型。相比于使用普通的poisson回归模型,该方法能够拥有更好的拟合优度。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于特征向量空间滤值的交通事故poisson回归分析方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于特征向量空间滤值的交通事故poisson回归分析方法,该方法包括以下步骤:
步骤1、统计每个街区里面的交通事故数量总和作为因变量;
步骤2、获取交通事故总量对应的相关因子数据,并按街区分别计算各相关因子数据;
步骤3、对相关因子进行筛选:计算交通事故数据和相关因子的pearson 相关系数,将相关系数大于设定值对应的相关因子作为模型的自变量;自变量之间的共线性诊断:计算自变量之间的方差膨胀因子,剔除掉方差膨胀因子大于10的相关因子;
步骤4、对街区数据进行空间邻接关系的判断,构建相应的空间邻接矩阵 W,并对空间邻接矩阵W进行中心化操作,得到中心化的空间邻接矩阵矩阵 C;
步骤5、计算空间邻接矩阵C的特征值和特征向量组E;
步骤6、使用前向选择法,从向量组E中提取特征向量作为交通事故数据的空间影响因子;
步骤7、求解基于特征函数空间滤值的poisson回归模型系数,得到交通事故量与自变量之间的关系模型;
步骤8、对关系模型的精度进行验证和评价。
进一步地,本发明的步骤1的具体方法为:
以街区为单位对交通事故进行数量的统计;首先获取到交通事故数据点的经纬度数据,在软件ArcGIS Desktop中,将经纬度数据转换成点数据,然后使用ArcGIS Desktop的Join Data功能,选择sum,统计得到每个街区发生交通事故的数量。
进一步地,本发明的步骤2的具体方法为:
步骤2.1、首先通过开源网站OpenStreetMap获取道路数据;利用ArcGIS Desktop的“标识”工具来把每条路段在行政边界处打断,并且标识处路段所属街区的名称;处理完成后得到新的道路要素类文件;然后通过ArcGIS Desktop 的几何计算功能计算每条道路的长度;再使用汇总功能,根据街区字段名称进行汇总,得到每个街区的道路长度;
步骤2.2、通过ArcGIS Desktop的几何计算功能计算每个街区的面积;
步骤2.3、根据道路长度和街区面积计算得到街区道路密度;根据每个街区人口数据和街区面积计算得到街区人口密度;根据每个街区的面积和研究区域总面积计算得到街区面积占比;
步骤2.4、利用网络爬虫从高德地图上爬取相关的POI数据;将爬取到的经纬度数据在ArcGIS Desktop中转化为点数据;然后使用ArcGIS Desktop的 Join Data功能,选择sum,统计得到每个街区相应因子的数量。
进一步地,本发明的步骤4的具体方法为:
若街区i与j相互邻接,则Wij=1,否则Wij=0,最终得到一个n*n的矩阵,即空间邻接矩阵W;对矩阵W进行中心化的操作,计算公式如下:
其中,C为中心化后的矩阵,I为单位矩阵,11T为所有元素为1的矩阵, n为邻接矩阵的行列号,行号和列号是相等的。
进一步地,本发明的步骤5的具体方法为:
求解特征值与特征向量的算法包括:幂法、反幂法、Jacobi迭代法、QR 算法;通过软件中的开源库函数进行求解。
进一步地,本发明的步骤6的具体方法为:
步骤6.1、首先对特征向量组进行初步筛选,只选择其中特征向量的 Moran’s I大于0.25的特征向量,特征向量的Moran’s I跟它对应的特征值的函数关系如下:
其中n是矩阵的行列号,W是原始的邻接矩阵;1是n*1的一个全部元素是1的向量;
步骤6.2、循环迭代,每次从步骤6.1的特征向量组中选择一个特征向量 Ei加入到模型中X=X+Ei,计算残差e和残差e的Moran’s I,遍历所有剩下的特征向量,一次只加入一个X=X+Ei,计算得到Moran’s I,最后得到所有特征向量Ei对应的Moran’s I的向量组;其中,残差e的计算公式为:
残差e的Moran’s I的计算公式为:
其中,W和Wij都表示经过标准归一化后的邻接矩阵;n为邻接矩阵的行列号;e为计算的残差;
步骤6.3、取Moran’s I向量组中最小的,进行Moran’s I的显著性分析。
进一步地,本发明的步骤6.3中进行显著性分析的方法具体为:
步骤6.3.1、将最小的Moran’s I所对应的残差e向量进行999次随机排列,一个e向量中的各个行进行随机排列,得到999个一维的e向量,然后再分别计算e的Moran’s I,表示为Irnd,其中Y用新的e向量替换,X不变;
步骤6.3.2、统计Irnd>=最小的Moran’s I的个数,表示为num;
步骤6.3.3、计算P=(num+1)/(999+1);
步骤6.3.4、若P>=0.05,表示不显著,显著性检验算法结束,e所对应的特征向量Emin保留;若P<0.05,表示显著,设定X=X+Emin重复步骤6.2,直到不显著为止。
进一步地,本发明的步骤8的具体方法为:
计算所得模型的Pseudo R2、AIC值、Deviance Statistic以及残差的Moran’ s I作为评价指标,验证模型的拟合精度;通过留一交叉验证的方法划分训练集和验证集,进行模型验证。
本发明产生的有益效果是:本发明的基于特征向量空间滤值的交通事故 poisson回归分析方法,针对交通事故进行研究与分析,将特征向量空间滤值方法引入到普通poisson回归模型中,设计了一种基于特征函数空间滤值的交通事故poisson回归分析方法。本发明解决了普通poisson回归模型由于残差空间自相关导致的模型拟合精度不够高的问题,可有效的提高回归模型的拟合精度,实现对交通事故的有效分析和准确模拟。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明实施例的流程图。
图2为本发明实施例步骤2中获取相关因子数据子流程图。
图3为本发明实施例步骤3因子筛选的子流程图。
图4为本发明实施例步骤6特征向量筛选的子流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明要解决的核心问题是:利用普通的poisson回归模型进行交通事故的分析和预测时忽略了空间自相关的影响,本发明将特征向量空间滤值与普通的 poisson回归模型相结合,减少变量间的空间自相关,提高模型在交通事故的分析和预测中的精度和模型拟合优度。
参见图1,本发明提供的基于特征向量空间滤值的交通事故poisson回归分析方法,包括以下步骤:
步骤1:统计每个街区里面的交通事故数量总和作为因变量。首先获取到交通事故数据点的经纬度数据,在ArcGIS Desktop将经纬度数据转换成点数据,然后使用ArcGISDesktop的Join Data功能,然后选择”Join data from another layer based on spatiallocation”,选择sum,然后统计每个街区发生交通事故的数量。
步骤2:获取相应的交通事故总量相关因子数据,并按街区分别计算各因子数据。
步骤2.1:如附图2所示,首先通过开源网站OpenStreetMap获取道路数据;利用ArcGIS Desktop的“标识”工具来把每条路段在行政边界处打断,并且标识处路段所属街区的名称;处理完成后会得到一个新的道路要素类文件。然后通过ArcGIS Desktop的几何计算功能计算每条道路的长度;再使用汇总功能,根据街区字段名称进行汇总,即可得到每个街区的道路长度;
步骤2.2:通过ArcGIS Desktop的几何计算功能计算每个街区的面积;
步骤2.3:用步骤2.1计算得到的道路长度/步骤2.2计算得到的街区面积即可得到街区道路密度;用每个街区人口数据/步骤2.2计算得到的街区面积即可得到街区人口密度;用步骤2.2计算得到的每个街区的面积/研究区域总面积即可得到街区面积占比;
步骤2.4:利用Python网络爬虫技术从高德地图上爬取相关的POI数据;将爬取到的经纬度数据在ArcGIS Desktop中转化为点数据;然后使用ArcGIS Desktop的Join Data功能,然后选择”Join data from another layer based on spatial location”,选择sum,然后统计每个街区相应因子的数量。
步骤3:相关因子的筛选。计算交通事故数据和相关因子的pearson相关系数,将与交通事故数据相关性显著的因子作为模型的自变量,剔除掉相关性不显著的因子;变量之间的共线性诊断,计算变量之间的方差膨胀因子,剔除掉方差膨胀因子大于10的因子。其中计算pearson相关系数可在R中进行,利用cor函数和开源R包Hmisc中的rcorr函数进行计算;计算因子间的VIF也在R中进行,利用esf函数计算。
步骤4:对街区数据进行空间邻接关系的判断,构建相应的空间邻接矩阵 W,并对空间邻接矩阵W进行中心化操作得到矩阵C。具体实施时,若街区i 与j相互邻接,则Wij=1,否则Wij=0,最终可以得到一个n*n的矩阵,即空间邻接矩阵W。建立的邻接矩阵W关于对角线对称,这将导致在之后的特征向量的计算中,特征向量结果之间相互正交,有可能引起多重共线性问题而使模型误设,因此需要对矩阵W进行中心化的操作,计算公式如下:
其中,C为中心化后的矩阵,I为单位矩阵,11T为所有元素为1的矩阵, n为邻接矩阵的行列号,行号和列号是相等的。
步骤5:计算步骤4所得到的空间邻接矩阵C的特征值和特征向量组E.目前常见的求解特征值与特征向量的算法有幂法、反幂法、Jacobi迭代法、QR 算法。而能进行特征值与特征向量计算的软件与开源库也较多,R、matlab中都有很多的开源库可以使用,如R中的开源包spmoran中的meigen函数就可用来求解矩阵的特征值和特征向量。
步骤6:使用前向选择法,从步骤5所得的向量组E中提取合适的特征向量作为交通事故数据的空间影响因子,参见图4,具体步骤如下:
步骤6.1首先对特征向量组进行初步筛选,只选择其中特征向量的Moran’s I大于0.25的特征向量。特征向量的Moran’s I跟它对应的特征值有一个函数关系如下:
其中n是矩阵的行列号,W是原始的邻接矩阵;1是n*1的一个全部元素是1的向量。
步骤6.2循环迭代,每次从步骤6.1的特征向量组中选择一个特征向量Ei 加入到模型中(X=X+Ei),计算残差e和残差e的Moran’s I.遍历所有剩下的特征向量,一次只加入一个(X=X+Ei),计算得到Moran’s I.最后得到所有特征向量Ei对应的Moran’s I的向量组。其中,残差e的计算公式为:
残差e的Moran’s I的计算公式为:
其中,W和Wij都表示经过标准归一化后的邻接矩阵;n为邻接矩阵的行列号;e为计算的残差。
步骤6.3:取Moran’s I向量组中最小的,进行Moran’s I的显著性分析。
步骤6.3.1:将最小的Moran’s I所对应的残差e向量多次随机排列(999次,一个e向量中的各个行进行随机排列,得到999个一维的e向量),然后用步骤3的公式再分别计算e的Moran’s I(Irnd),其中Y用新的e向量替换,X不变。
步骤6.3.2:统计Irnd>=最小的Moran’s I的个数(num)
步骤6.3.3:计算P=(num+1)/(999+1)
步骤6.3.4:若P>=0.05,不显著,显著性检验算法结束(e所对应的特征向量Emin保留);若P<0.05,显著,设定X=X+Emin重复步骤6.2(每次在剩下的n-1个Ei中选取一个Moran’s I最小的,带入步骤6.3进行显著性分析,得 X=X+Emin+Ei),直到不显著为止。
步骤7:并求解基于特征函数空间滤值的poisson回归模型系数,得到交通事故量与自变量之间的关系模型。其中基于特征向量空间滤值的poisson回归模型为:
log(E(Y|x))=α+βX+εE
其中,εE是选择的空间特征向量,表达了空间影响。
最后通过极大似然法可以对上述式子进行求解,得到α、β、ε的值;此过程可以在R中调用glm函数来完成。
步骤8:模型精度评价。计算所得模型的Pseudo R2、AIC值、Deviance Statistic以及残差的Moran’s I等作为评价指标,验证模型的拟合精度。其中, Pseudo R2用于评价模型的拟合优度;AIC评价了模型的复杂度;Deviance Statistic常用于统计模型的拟合优度评价,越接近1,拟合优度越高;残差 Moran’s I用于评价空间滤值对残差自相关处理的效果。
其中yi是街区的交通事故发生量,,是交通事故数据的平均值,是模型预测的街区i的交通事故数量,n是街区的个数。
其中,W和Wij都表示经过标准归一化后的邻接矩阵;n为邻接矩阵的行列号;e为计算的残差。I的取值范围是[-1,1],值越接近于0,残差空间自相关性越弱,模型越可靠。
步骤9:留一交叉验证。正常训练都会划分训练集和验证集,训练集用来训练模型,而验证集用来评估模型的泛化能力。留一法的样本利用率高,适合于小样本情况。交叉验证可以更好的评价模型的适用性。留一交叉验证具体做法就是:每次只留下一个样本做测试集,其他样本做训练集,如果有N个样本,则需要训练N次,测试N次。最后对验证误差求平均:
其中,N为样本数量;en为第n次验证误差。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (8)
1.一种基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,该方法包括以下步骤:
步骤1、统计每个街区里面的交通事故数量总和作为因变量;
步骤2、获取交通事故总量对应的相关因子数据,并按街区分别计算各相关因子数据;
步骤3、对相关因子进行筛选:计算交通事故数据和相关因子的pearson相关系数,将相关系数大于设定值对应的相关因子作为模型的自变量;自变量之间的共线性诊断:计算自变量之间的方差膨胀因子,剔除掉方差膨胀因子大于10的相关因子;
步骤4、对街区数据进行空间邻接关系的判断,构建相应的空间邻接矩阵W,并对空间邻接矩阵W进行中心化操作,得到中心化的空间邻接矩阵矩阵C;
步骤5、计算空间邻接矩阵C的特征值和特征向量组E;
步骤6、使用前向选择法,从向量组E中提取特征向量作为交通事故数据的空间影响因子;
步骤7、求解基于特征函数空间滤值的poisson回归模型系数,得到交通事故量与自变量之间的关系模型;
步骤8、对关系模型的精度进行验证和评价。
2.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤1的具体方法为:
以街区为单位对交通事故进行数量的统计;首先获取到交通事故数据点的经纬度数据,在软件ArcGISDesktop中,将经纬度数据转换成点数据,然后使用ArcGIS Desktop的Join Data功能,选择sum,统计得到每个街区发生交通事故的数量。
3.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤2的具体方法为:
步骤2.1、首先通过开源网站OpenStreetMap获取道路数据;利用ArcGIS Desktop的“标识”工具来把每条路段在行政边界处打断,并且标识处路段所属街区的名称;处理完成后得到新的道路要素类文件;然后通过ArcGIS Desktop的几何计算功能计算每条道路的长度;再使用汇总功能,根据街区字段名称进行汇总,得到每个街区的道路长度;
步骤2.2、通过ArcGIS Desktop的几何计算功能计算每个街区的面积;
步骤2.3、根据道路长度和街区面积计算得到街区道路密度;根据每个街区人口数据和街区面积计算得到街区人口密度;根据每个街区的面积和研究区域总面积计算得到街区面积占比;
步骤2.4、利用网络爬虫从高德地图上爬取相关的POI数据;将爬取到的经纬度数据在ArcGIS Desktop中转化为点数据;然后使用ArcGIS Desktop的Join Data功能,选择sum,统计得到每个街区相应因子的数量。
4.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤4的具体方法为:
若街区i与j相互邻接,则Wij=1,否则Wij=0,最终得到一个n*n的矩阵,即空间邻接矩阵W;对矩阵W进行中心化的操作,计算公式如下:
其中,C为中心化后的矩阵,I为单位矩阵,11T为所有元素为1的矩阵,n为邻接矩阵的行列号,行号和列号是相等的。
5.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤5的具体方法为:
求解特征值与特征向量的算法包括:幂法、反幂法、Jacobi迭代法、QR算法;通过软件中的开源库函数进行求解。
6.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤6的具体方法为:
步骤6.1、首先对特征向量组进行初步筛选,只选择其中特征向量的Moran’s I大于0.25的特征向量,特征向量的Moran’s I跟它对应的特征值的函数关系如下:
其中n是矩阵的行列号,W是原始的邻接矩阵;1是n*1的一个全部元素是1的向量;
步骤6.2、循环迭代,每次从步骤6.1的特征向量组中选择一个特征向量Ei加入到模型中X=X+Ei,计算残差e和残差e的Moran’s I,遍历所有剩下的特征向量,一次只加入一个X=X+Ei,计算得到Moran’s I,最后得到所有特征向量Ei对应的Moran’s I的向量组;其中,残差e的计算公式为:
残差e的Moran’s I的计算公式为:
其中,W和Wij都表示经过标准归一化后的邻接矩阵;n为邻接矩阵的行列号;e为计算的残差;
步骤6.3、取Moran’s I向量组中最小的,进行Moran’s I的显著性分析。
7.根据权利要求6所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤6.3中进行显著性分析的方法具体为:
步骤6.3.1、将最小的Moran’s I所对应的残差e向量进行999次随机排列,一个e向量中的各个行进行随机排列,得到999个一维的e向量,然后再分别计算e的Moran’s I,表示为Irnd,其中Y用新的e向量替换,X不变;
步骤6.3.2、统计Irnd>=最小的Moran’s I的个数,表示为num;
步骤6.3.3、计算P=(num+1)/(999+1);
步骤6.3.4、若P>=0.05,表示不显著,显著性检验算法结束,e所对应的特征向量Emin保留;若P<0.05,表示显著,设定X=X+Emin重复步骤6.2,直到不显著为止。
8.根据权利要求1所述的基于特征向量空间滤值的交通事故poisson回归分析方法,其特征在于,步骤8的具体方法为:
计算所得模型的Pseudo R2、AIC值、Deviance Statistic以及残差的Moran’s I作为评价指标,验证模型的拟合精度;通过留一交叉验证的方法划分训练集和验证集,进行模型验证。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910411640.4A CN110188324B (zh) | 2019-05-17 | 2019-05-17 | 一种基于特征向量空间滤值的交通事故poisson回归分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910411640.4A CN110188324B (zh) | 2019-05-17 | 2019-05-17 | 一种基于特征向量空间滤值的交通事故poisson回归分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110188324A true CN110188324A (zh) | 2019-08-30 |
CN110188324B CN110188324B (zh) | 2023-05-30 |
Family
ID=67716670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910411640.4A Active CN110188324B (zh) | 2019-05-17 | 2019-05-17 | 一种基于特征向量空间滤值的交通事故poisson回归分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188324B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110570339A (zh) * | 2019-09-16 | 2019-12-13 | 四川长虹电器股份有限公司 | 一种在线教育教学干预方法 |
CN112818747A (zh) * | 2020-12-31 | 2021-05-18 | 上海应用技术大学 | 一种基于空间大数据的城市特色街区人口密度估算方法和系统方法 |
CN117953685A (zh) * | 2024-01-30 | 2024-04-30 | 长沙理工大学 | 一种交通事故时空影响范围识别、关联因素确定方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038081A (zh) * | 2017-12-25 | 2018-05-15 | 武汉大学 | 基于特征函数空间滤值的滑坡灾害logistic回归分析方法 |
-
2019
- 2019-05-17 CN CN201910411640.4A patent/CN110188324B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038081A (zh) * | 2017-12-25 | 2018-05-15 | 武汉大学 | 基于特征函数空间滤值的滑坡灾害logistic回归分析方法 |
Non-Patent Citations (4)
Title |
---|
DANIEL A.GRIFFITH: "《A Geocomputation and Geovisualization Comparision of Moran and Geary Eigenvector Spatial Filtering》", 《2017 25TH INTERNATIONAL CONFERENCE ON GEOINFORMATICS》 * |
樊朋光: "《基于交通分析区的交通事故与交通违法空间特征分析及影响关系研究》", 《中国优秀硕士学位论文全文数据库》 * |
温惠英等: "《基于Moran模型的道路交通事故空间自相关特征分析》", 《交通与计算机》 * |
陈彦光: "基于Moran统计量的空间自相关理论发展和方法改进", 《地理研究》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110570339A (zh) * | 2019-09-16 | 2019-12-13 | 四川长虹电器股份有限公司 | 一种在线教育教学干预方法 |
CN110570339B (zh) * | 2019-09-16 | 2022-04-29 | 四川长虹电器股份有限公司 | 一种在线教育教学干预方法 |
CN112818747A (zh) * | 2020-12-31 | 2021-05-18 | 上海应用技术大学 | 一种基于空间大数据的城市特色街区人口密度估算方法和系统方法 |
CN117953685A (zh) * | 2024-01-30 | 2024-04-30 | 长沙理工大学 | 一种交通事故时空影响范围识别、关联因素确定方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110188324B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Mapping hourly dynamics of urban population using trajectories reconstructed from mobile phone records | |
CN110188324A (zh) | 一种基于特征向量空间滤值的交通事故poisson回归分析方法 | |
CN101894134B (zh) | 一种基于空间布局的钓鱼网页检测及其实现方法 | |
CN109784636A (zh) | 欺诈用户识别方法、装置、计算机设备及存储介质 | |
CN105741549B (zh) | 一种基于空间copula理论的交通流量预测方法 | |
CN115688404B (zh) | 基于svm-rf模型的降雨型滑坡预警方法 | |
US9159132B1 (en) | Process and system for identifying damage | |
CN106021290A (zh) | 一种基于多尺度地理信息的社交网络关联挖掘方法 | |
CN104881867A (zh) | 一种基于特征分布的遥感图像质量评价方法 | |
CN105355047A (zh) | 多交通检测源动态时间粒度的数据融合处理方法 | |
Yin et al. | A deep learning approach for rooftop geocoding | |
Caracciolo et al. | Influence of spatial precipitation sampling on hydrological response at the catchment scale | |
CN112365595A (zh) | 基于报警数据点要素的鉴别交通事故多发点的分析方法 | |
Pollard et al. | Comparing the quality of OD matrices in time and between data sources | |
CN113807278A (zh) | 一种基于深度学习的土地利用分类及变化预测方法 | |
Bakar et al. | Cluster analysis of hourly rainfalls using storm indices in Peninsular Malaysia | |
Miller et al. | Scaling GPS trajectories to match point traffic counts: A convex programming approach and Utah case study | |
Duan et al. | MobilePulse: Dynamic profiling of land use pattern and OD matrix estimation from 10 million individual cell phone records in Shanghai | |
Nolan et al. | Distribution models calibrated with independent field data predict two million ancient and veteran trees in England | |
CN107730717B (zh) | 一种基于特征提取的公共交通可疑卡识别方法 | |
CN113901348A (zh) | 一种基于数学模型的钉螺分布影响因素识别与预测方法 | |
Chung et al. | Investigating the effects of POI-based land use on traffic accidents in Suzhou Industrial Park, China | |
CN116310583A (zh) | 基于深度语义拓扑融合网络的极化sar图像分类方法 | |
CN115166874A (zh) | 基于机器学习的气象干旱指数spi构建方法 | |
CN109919360A (zh) | 连环犯罪的预测模型建立的方法、预测方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |