CN109544690B - 共享单车出行影响因素识别方法、系统及存储介质 - Google Patents

共享单车出行影响因素识别方法、系统及存储介质 Download PDF

Info

Publication number
CN109544690B
CN109544690B CN201811212040.7A CN201811212040A CN109544690B CN 109544690 B CN109544690 B CN 109544690B CN 201811212040 A CN201811212040 A CN 201811212040A CN 109544690 B CN109544690 B CN 109544690B
Authority
CN
China
Prior art keywords
data
shared bicycle
point
regression model
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811212040.7A
Other languages
English (en)
Other versions
CN109544690A (zh
Inventor
莫海彤
魏宗财
陈婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201811212040.7A priority Critical patent/CN109544690B/zh
Publication of CN109544690A publication Critical patent/CN109544690A/zh
Application granted granted Critical
Publication of CN109544690B publication Critical patent/CN109544690B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/30Polynomial surface description
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种共享单车出行影响因素识别方法、系统及存储介质,所述方法包括:获取共享单车数据、兴趣点数据和城市道路数据;对获取的共享单车数据、兴趣点数据和城市道路数据进行预处理;根据预处理的数据,划分样本单元网格,统计共享单车的起点和终点数量、兴趣点数量和城市道路长度;根据样本单元网格,构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别。本发明结合混合地理加权回归模型,能够识别不同空间单元的建成环境因素对共享单车出行的影响作用,由此能够对具备不同建成环境特征的空间单元的共享单车投放、调配提供根据,为共享单车企业运营策略、交通规划以及相关公共政策提供参考。

Description

共享单车出行影响因素识别方法、系统及存储介质
技术领域
本发明涉及一种共享单车出行影响因素识别方法、系统及存储介质,属于建成环境和交通行为领域。
背景技术
智慧社会的建设。共享单车作为中国“新四大发明“之一,凭借随取随放、方便快捷、绿色环保以及能够解决”最先/最后一公里“的交通出行难题等等优点得到迅速推广,但其乱停乱放、过度投放等现象也对城市交通秩序和城市形象造成负面影响。因此,基于智能技术精准识别城市建成环境对共享单车的出行特征的影响,实现不同地区的共享单车的合理投放和调配,匹配产品供给和用户需求是当前政府、企业和市民共同关注的重点。
既有研究发现,建成环境会影响人的活动,从而对交通行为造成影响。研究建成环境与交通行为之间的关系可通过构建计量模型进行模拟仿真。传统的全局回归模型估计的参数具全局性和平稳性,但忽略了空间的非平稳性。根据地理学第一定律(Tobler's firstlaw),任何事物都与其他事物相关,而相近事物之间的关联则更紧密。空间异质性会导致回归模型的同一自变量在不同的观测位置具备不同的回归系数。而地理加权回归模型(Geographically weighted regression,GWR)通过局部加权最小二乘法估计可得到空间单元样本的参数,能反映空间的非平稳性,其回归系数是空间位置的函数。混合地理加权回归模型(MGWR)则兼具全局回归模型和地理加权回归模型的优势,包含全局变量和局部变量,兼顾空间的平稳性和非平稳性,能够获得更好的拟合效果,从而提高共享单车出行影响因素识别的有效性和精确度。
发明内容
本发明的第一个目的是为了解决上述现有技术的缺陷,提供了一种共享单车出行影响因素识别方法,该方法结合混合地理加权回归模型,能够识别不同空间单元的建成环境因素对共享单车出行的影响作用。
本发明的第二个目的在于提供一种共享单车出行影响因素识别系统。
本发明的第三个目的在于提供一种存储介质。
本发明的第一个目的可以通过采取如下技术方案达到:
共享单车出行影响因素识别方法,所述方法包括:
获取共享单车数据、兴趣点数据和城市道路数据;
对获取的共享单车数据、兴趣点数据和城市道路数据进行预处理;
根据预处理的数据,划分样本单元网格,统计共享单车的起点和终点数量、兴趣点数量和城市道路长度;
根据样本单元网格,构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别。
进一步的,所述对共享单车数据、兴趣点数据和城市道路数据进行预处理,具体包括:
对共享单车数据进行清洗,剔除重复采集和未曾移动的数据点信息,生成模拟的出行轨迹,存储出行距离、出行时长和出行速度信息;
计算所述出行轨迹的起点经纬度和终点经纬度;
从兴趣点数据中筛选保留餐饮、风景名胜、公司企业、购物、金融保险服务、科教文化服务、生活服务、体育休闲服务、医疗保健服务、住宅、住宿服务、政府机构及社会团体、交通设施共十三类兴趣点,记为二级类别;
将十三类兴趣点整合为居住、办公、生活服务、医疗卫生、餐饮购物、体育休闲、文教、交通设施共八个类别,记为一级类别;
对城市道路数据进行筛选,保留一级道路、二级道路的道路中心线,以道路中心线的长度表示城市道路长度。
进一步的,所述根据预处理的数据,划分样本单元网格,统计共享单车的起点和终点、兴趣点数量和城市道路长度,具体包括:
根据预处理的数据,划分样本单元网格,对网格内共享单车起点和终点数量、各类别的兴趣点数量、各等级城市道路的长度进行统计;
将每个变量储存为独立的数据列,剔除或补全分析样本中包含空值的数据行,将所有数据合并到同一要素类中;
计算网格中心点的经纬度,并分存为两列。
进一步的,所述构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别,具体包括:
构建高斯混合地理加权回归模型;其中,所述高斯混合地理加权回归模型包括全局变量和局部变量;
选择核函数计算高斯混合地理加权回归模型中每个空间单元的权重值以及选择核带宽;其中,所述核函数包括高斯固定核函数和自适应双重平方核函数;
优选高斯混合地理加权回归模型的全局变量和局部变量;
通过莫兰指数检验高斯混合地理加权回归模型的标准化残差。
进一步的,所述高斯混合地理加权回归模型的构建如下:
Figure BDA0001832626660000031
其中,yi为因变量,即共享单车轨迹起点数量、终点数量的对数,Xij表示第i个空间单元的第j个自变量,即建成环境特征,αj为全局变量的的回归系数,βj为局部变量的的回归系数,ui和vi为第i个空间单元的经纬度坐标,εi为残差。
进一步的,所述高斯固定核函数的具体公式如下:
Wst=exp(-dst/h2)
所述自适应双重平方核函数的具体公式如下:
Figure BDA0001832626660000032
其中,Wst为中心点s的观测点t的权重值,h为固定带宽值,dst为中心点s和观测点t的欧氏距离,hs(k)为自适应带宽;通过黄金分割搜索法自动搜索最佳带宽大小,赤池信息量准则作为选取标准,用于衡量统计模型的拟合优良性。
进一步的,所述优选高斯混合地理加权回归模型的全局变量和局部变量,具体为:
将所有自变量列为局部变量,进行地理加权回归模型构建,地理加权回归的公式如下:
Figure BDA0001832626660000041
其中,yi为因变量,Xij表示第i个空间单元的第j个自变量,γj(ui,vi)为自变量的回归系数,ui和vi为第i个空间单元的经纬度坐标,εi为残差记录模型的AICc值,记为AIC0;将第j个自变量列为全局变量,进行混合地理加权回归,记录AICc值,记为AICj,比较两个模型的AICc值,若AIC0-AICj>3,则将第j个自变量列为全局变量,以此类推。
进一步的,所述莫兰指数的具体公式如下:
Figure BDA0001832626660000042
其中,Zi为要素i的属性及其平均值
Figure BDA0001832626660000043
的偏差,Wi,j为要素i和j的空间权重,n为要素权重;通过p值和z值进行判断,满足以下条件则为在不同的置信度下呈随机状态:
若p<0.10,置信度为90%,则|z|≤1.65;若p<0.05,置信度为95%,则|z|≤1.96;若p<0.01,置信度为99%,则|z|≤2.58。
本发明的第二个目的可以通过采取如下技术方案达到:
共享单车出行影响因素识别系统,所述系统包括:
数据获取模块,用于获取共享单车数据、兴趣点数据和城市道路数据;
预处理模块,用于对获取的共享单车数据、兴趣点数据和城市道路数据进行预处理;
网格划分模块,用于根据预处理的数据,划分样本单元网格,统计共享单车的起点和终点数量、兴趣点数量和城市道路长度;
识别模块,用于根据样本单元网格,构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别。
本发明的第三个目的可以通过采取如下技术方案达到:
存储介质,存储有程序,所述程序被处理器执行时,实现上述的共享单车出行影响因素识别方法。
本发明相对于现有技术具有如下的有益效果:
本发明结合混合地理加权回归模型,能够识别不同空间单元的建成环境因素对共享单车出行的影响作用,由此能够对具备不同建成环境特征的空间单元的共享单车投放、调配提供根据,为共享单车企业运营策略、交通规划以及相关公共政策提供参考。
附图说明
图1为本发明实施例1的共享单车出行影响因素识别方法的流程图。
图2为本发明实施例2的荔湾区样本单元网格图。
图3为本发明实施例2的混合地理加权回归模型中局部变量为办公的回归系数空间分布图。
图4为本发明实施例2的混合地理加权回归模型中局部变量为医疗卫生的回归系数空间分布图。
图5为本发明实施例2的混合地理加权回归模型中局部变量为体育休闲的回归系数空间分布图
图6为本发明实施例2的混合地理加权回归模型中局部变量为文教的回归系数空间分布图。
图7为本发明实施例3的共享单车出行影响因素识别系统的结构框图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1:
本实施例提供了一种共享单车出行影响因素识别方法,该方法使用混合地理加权回归模型,识别不同空间单元的建成环境因素对共享单车出行的影响作用,由此能够对具备不同建成环境特征的空间单元的共享单车投放、调配提供根据,为共享单车企业运营、城市慢行交通规划和智能交通系统建设提供技术基础。
如图1所示,本实施例的共享单车出行影响因素识别方法包括以下步骤:
S1、获取原始数据。
本实施例的原始数据包括共享单车数据、兴趣点(Point of Interest,即POI)数据和城市道路数据,兴趣点数据可以从高德地图的API(Application Program Interface,应用程序接口)接口获取。
S2、对获取的原始数据进行预处理。
对共享单车数据进行预处理:对共享单车数据进行清洗,剔除重复采集和未曾移动的数据点信息,运用ArcGIS软件的线追踪间隔工具生成模拟的出行轨迹,存储出行距离、出行时长和出行速度等信息;进一步地,计算出行轨迹的起点经纬度和终点经纬度,通过ArcGIS软件生成起点和终点的shapefile文件。
对兴趣点数据进行预处理:主要是对兴趣点数据进行分类和整合,具体地,从兴趣点数据中筛选保留餐饮、风景名胜、公司企业、购物、金融保险服务、科教文化服务、生活服务、体育休闲服务、医疗保健服务、住宅、住宿服务、政府机构及社会团体、交通设施共十三类兴趣点,记为二级类别;进一步地,将十三类兴趣点整合为居住、办公、生活服务、医疗卫生、餐饮购物、体育休闲、文教、交通设施共八个类别,记为一级类别
对城市道路数据进行预处理:对城市道路数据进行筛选,保留一级道路、二级道路的道路中心线,以道路中心线的长度表示城市道路长度。
S3、创建混合地理加权回归模型(MGWR)的空间单元。
划分样本单元网格,统计共享单车的起点和终点数量、兴趣点数量和城市道路长度;其中,每个样本单元网格为混合地理加权回归模型的一个空间单元。
具体地,使用ArcGIS创建渔网工具划分样本单元网格,尺寸为1km*1km,对网格内共享单车起点和终点数量、各类别POI数量、各等级道路长度进行统计,将每个变量储存为独立的数据列,剔除或补全分析样本中包含空值的数据行,所有数据合并到同一要素类中。另外,需计算出网格中心点的经纬度,分存为两列。将上述要素类导出为dbaseIV文件。
S4、构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别。
该步骤具体包括:
1)构建高斯混合地理加权回归模型。
高斯混合地理加权回归模型包括全局变量(Global independent variables)和局部变量(Local independent variables),模型构建如下:
Figure BDA0001832626660000071
其中,yi为因变量,即共享单车轨迹起点数量、终点数量的对数,Xij表示第i个空间单元的第j个自变量,即建成环境特征,αj为全局变量的的回归系数,βj为局部变量的的回归系数,ui和vi为第i个空间单元的经纬度坐标,εi为残差。
2)选择空间权重衰减函数及核带宽。
地理加权回归模型中每个空间单元的权重值由核函数计算得出,经典的核函数类型为高斯固定核函数(Gaussian fixed kernel)和自适应双重平方核函数(Adaptive bi-square kernel)。
高斯固定核函数的权重值从中心向外连续衰减且永不为零,与以固定距离法(Fixed)选择带宽的方式匹配良好,可以生成较为平滑的核表面。而选用双重平方函数计算时,落在带宽范围内的数据点通过高斯连续单调递减函数计算权重值,超出带宽部分权重值则全部记为零,与自适应法(Adaptive)选择带宽的方式匹配良好。
所述高斯固定核函数的具体公式如下:
Wst=exp(-dst/h2)
所述自适应双重平方核函数的具体公式如下:
Figure BDA0001832626660000082
其中,Wst为中心点s的观测点t的权重值,h为固定带宽值,dst为中心点s和观测点t的欧氏距离,hs(k)为自适应带宽;通过黄金分割搜索法(Golden section search)自动搜索最佳带宽大小,赤池信息量准则(Akaike information criterion,AIC)作为选取标准,用于衡量统计模型的拟合优良性。
3)优选高斯混合地理加权回归模型的全局变量和局部变量。
在GWR4.0中,首先将所有自变量列为局部变量,进行地理加权回归模型构建,地理加权回归模型的公式如下:
Figure BDA0001832626660000081
其中,yi为因变量,Xij表示第i个空间单元的第j个自变量,γj(ui,vi)为自变量的回归系数,ui和vi为第i个空间单元的经纬度坐标,εi为残差记录模型的AICc值,记为AIC0;将第j个自变量列为全局变量,进行混合地理加权回归,记录AICc值,记为AICj,比较两个模型的AICc值,若AIC0-AICj>3,则将第j个自变量列为全局变量,以此类推。
4)通过莫兰指数检验高斯混合地理加权回归模型的标准化残差。
高斯混合地理加权回归模型的标准化残差(Std.Residual)应在空间中随机分布,通过莫兰指数进行检验,莫兰指数公式如下:
Figure BDA0001832626660000091
其中,Zi为要素i的属性及其平均值
Figure BDA0001832626660000092
的偏差,Wi,j为要素i和j的空间权重,n为要素权重;通过p值和z值进行判断,满足以下条件则为在不同的置信度下呈随机状态:
若p<0.10,置信度为90%,则|z|≤1.65;若p<0.05,置信度为95%,则|z|≤1.96;若p<0.01,置信度为99%,则|z|≤2.58。
本领域技术人员可以理解,实现上述实施例的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,相应的程序可以存储于计算机可读存储介质中。
应当注意,尽管在附图中以特定顺序描述了上述实施例的方法操作,但是这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
实施例2:
为了验证一种上述实施例1的共享单车出行影响因素识别方法实施效果,本实施例采集广州市荔湾区2018年8月13日全天24个小时的摩拜单车分布数据作为应用实例进行验证。
1)共享单车的分布数据每10分钟进行一次采集,全天包含144个采集时刻点,原始采集数据行共1899267行,经过共享单车数据预处理后生成85791条轨迹。建成环境数据包括兴趣点数据和城市道路数据两部分,其中,兴趣点数据为广州市荔湾区2018年4月爬取的21276个兴趣点,筛选整合为居住、办公、生活服务、医疗卫生、餐饮购物、体育休闲、文教、交通设施八大类。道路数据为广州市荔湾区长度总和为49.5km的市区一级道路以及312.9km的市区二级道路。
2)提取荔湾区行政边界,如图2所示,创建1km*1km的网格84个,剔除网格面积小于0.5平方千米的网格,保留63个网格,如图3~图6所示。分别统计每个网格内的共享单车轨迹起点数量,八类兴趣点数量以及市区一、二级的道路长度,并记录网格中心点的经纬度坐标,导出dbase文件。
3)在GWR 4.0中导入上述dbase文件,使用自适应双重平方核函数、黄金分割搜索法和AICc判别准则,构建高斯地理加权回归模型。模型以共享单车轨迹的起/终点数量作为因变量,以八类兴趣点设施点和两类道路为10个自变量,将自变量组{居住、办公、生活服务、医疗卫生、餐饮购物、体育休闲、文教、交通设施、一级道路、二级道路}记为{Indep1,Indep2,...,Indep10},进行回归,计算AIC值。然后,将Indep1列为全局变量,其余变量列为局部变量,计算AIC值,记为AIC1,以此类推。
回归模型结果得出{AIC0,AIC1,...,AIC10}={1124.36,1120.78,1124.85,1120.11,1128.81,1120.42,1130.46,1128.66,1120.17,1120.74,1120.10},根据AIC判别准则,将Indep1,Indep3,Indep5,Indep8,Indep9,Indep10列为全局变量,而Indep2,Indep4,Indep6,Indep7列为局部变量,进行回归,混合地理加权回归模型的AICc值为1117.53,比地理加权回归模型的AICc值小6.83,模型拟合性能更佳。从下表2可以看出,从全局回归模型、地理加权回归模型到混合地理加权回归模型,模型的解释力(Adjusted R2)得到逐步提升,而AICc值逐步下降,相差均大于3,混合地理加权回归模型解释力和拟合效果更优。
表2三类模型拟合结果对比
Figure BDA0001832626660000101
4)对残差进行莫兰指数检验,如下表3所示,标准化残差分布随机。根据混合地理加权回归模型报表,统计全局变量和局部变量的回归系数如下表4和表5所示,并将表5的局部变量回归系数在ArcGIS软件中进行空间可视化,如图3~图6所示。
表3莫兰指数检验结果
Figure BDA0001832626660000102
表4混合地理加权回归模型全局变量回归结果
Figure BDA0001832626660000103
Figure BDA0001832626660000111
表5混合地理加权回归模型局部变量回归结果
Figure BDA0001832626660000112
实施例3:
如图7所示,共享单车出行影响因素识别系统,该系统包括数据获取模块、预处理模块、网格划分模块和识别模块,各个模块的具体功能如下:
所述数据获取模块,用于获取共享单车数据、兴趣点数据和城市道路数据。
所述预处理模块,用于对获取的共享单车数据、兴趣点数据和城市道路数据进行预处理。
所述网格划分模块,用于根据预处理的数据,划分样本单元网格,统计共享单车的起点和终点数量、兴趣点数量和城市道路长度。
所述识别模块,用于根据样本单元网格,构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别。
本实施例中各个模块的具体实现可以参见上述实施例1,在此不再一一赘述;需要说明的是,本实施例提供的系统仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
实施例4:
本实施例提供了一种存储介质,该存储介质为计算机可读存储介质,其存储有计算机程序,计算机程序被处理器执行时,实现上述实施例1的共享单车出行影响因素识别方法,如下:
获取共享单车数据、兴趣点数据和城市道路数据;对获取的共享单车数据、兴趣点数据和城市道路数据进行预处理;根据预处理的数据,划分样本单元网格,统计共享单车的起点和终点数量、兴趣点数量和城市道路长度;根据根据样本单元网格,构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别。
综上所述,本发明结合混合地理加权回归模型,能够识别不同空间单元的建成环境因素对共享单车出行的影响作用,由此能够对具备不同建成环境特征的空间单元的共享单车投放、调配提供根据,为共享单车企业运营策略、交通规划以及相关公共政策提供参考。
以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (7)

1.一种共享单车出行影响因素识别方法,其特征在于,所述方法包括:
获取共享单车数据、兴趣点数据和城市道路数据;其中,所述共享单车数据每10分钟进行一次采集获取;
对获取的共享单车数据、兴趣点数据和城市道路数据进行预处理;
根据预处理的数据,划分样本单元网格,分别统计每个样本单元网格内共享单车的起点和终点数量、兴趣点数量和城市道路长度;其中,兴趣点数量和城市道路长度构成建成环境因素;
根据样本单元网格,构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别;
所述构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别,具体包括:
构建高斯混合地理加权回归模型;其中,所述高斯混合地理加权回归模型包括全局变量和局部变量,高斯混合地理加权回归模型的构建如下:
Figure FDA0002575111200000011
其中,yi为第i个空间单元的因变量,即共享单车轨迹起点数量、终点数量的对数,Xij为第i个空间单元的第j个自变量,即建成环境特征,αj为全局变量的回归系数,βj为局部变量的回归系数,ui和vi为第i个空间单元的经纬度坐标,εi为残差;
选择核函数计算高斯混合地理加权回归模型中每个空间单元的权重值以及选择核带宽;其中,所述核函数包括高斯固定核函数和自适应双重平方核函数;
将所有自变量列为局部变量,进行地理加权回归模型构建,地理加权回归的公式如下:
Figure FDA0002575111200000021
其中,yi为第i个空间单元的因变量,Xij为第i个空间单元的第j个自变量,γj(ui,vi)为自变量的回归系数,ui和vi为第i个空间单元的经纬度坐标,εi为残差记录模型的AICc值,记为AIC0;将第j个自变量列为全局变量,进行混合地理加权回归,记录AICc值,记为AICj,比较两个模型的AICc值,若AIC0-AICj>3,则将第j个自变量列为全局变量,以此类推;
通过莫兰指数检验高斯混合地理加权回归模型的标准化残差。
2.根据权利要求1所述的共享单车出行影响因素识别方法,其特征在于,所述对共享单车数据、兴趣点数据和城市道路数据进行预处理,具体包括:
对共享单车数据进行清洗,剔除重复采集和未曾移动的数据点信息,生成模拟的出行轨迹,存储出行距离、出行时长和出行速度信息;
计算所述出行轨迹的起点经纬度和终点经纬度;
从兴趣点数据中筛选保留餐饮、风景名胜、公司企业、购物、金融保险服务、科教文化服务、生活服务、体育休闲服务、医疗保健服务、住宅、住宿服务、政府机构及社会团体、交通设施共十三类兴趣点,记为二级类别;
将十三类兴趣点整合为居住、办公、生活服务、医疗卫生、餐饮购物、体育休闲、文教、交通设施共八个类别,记为一级类别;
对城市道路数据进行筛选,保留一级道路、二级道路的道路中心线,以道路中心线的长度表示城市道路长度。
3.根据权利要求1所述的共享单车出行影响因素识别方法,其特征在于,所述根据预处理的数据,划分样本单元网格,统计共享单车的起点和终点、兴趣点数量和城市道路长度,具体包括:
根据预处理的数据,划分样本单元网格,对每个样本单元网格内共享单车起点和终点数量、各类别的兴趣点数量、各等级城市道路的长度进行统计;
将每个变量储存为独立的数据列,剔除或补全分析样本中包含空值的数据行,将所有数据合并到同一要素类中;
计算网格中心点的经纬度,并分存为两列。
4.根据权利要求1所述的共享单车出行影响因素识别方法,其特征在于,所述高斯固定核函数的具体公式如下:
Wst=exp(-dst/h2)
所述自适应双重平方核函数的具体公式如下:
Figure FDA0002575111200000031
其中,Wst为中心点s的观测点t的权重值,h为固定带宽值,dst为中心点s和观测点t的欧氏距离,hs(k)为自适应带宽;通过黄金分割搜索法自动搜索最佳带宽大小,赤池信息量准则作为选取标准,用于衡量统计模型的拟合优良性。
5.根据权利要求1所述的共享单车出行影响因素识别方法,其特征在于,所述莫兰指数的具体公式如下:
Figure FDA0002575111200000032
其中,Zi为要素i的属性及其平均值
Figure FDA0002575111200000033
的偏差,Wi,j为要素i和j的空间权重,n为要素权重;通过p值和z值进行判断,满足以下条件则为在不同的置信度下呈随机状态:
若p<0.10,置信度为90%,则|z|≤1.65;若p<0.05,置信度为95%,则|z|≤1.96;若p<0.01,置信度为99%,则|z|≤2.58。
6.一种共享单车出行影响因素识别系统,其特征在于,所述系统包括:
数据获取模块,用于获取共享单车数据、兴趣点数据和城市道路数据;其中,所述共享单车数据每10分钟进行一次采集获取;
预处理模块,用于对获取的共享单车数据、兴趣点数据和城市道路数据进行预处理;
网格划分模块,用于根据预处理的数据,划分样本单元网格,分别统计每个样本单元网格内共享单车的起点和终点数量、兴趣点数量和城市道路长度;其中,兴趣点数量和城市道路长度构成建成环境因素;
识别模块,用于根据样本单元网格,构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别;
所述构建混合地理加权回归模型,对影响共享单车出行的起点和终点分布的建成环境因素进行识别,具体包括:
构建高斯混合地理加权回归模型;其中,所述高斯混合地理加权回归模型包括全局变量和局部变量,高斯混合地理加权回归模型的构建如下:
Figure FDA0002575111200000041
其中,yi为第i个空间单元的因变量,即共享单车轨迹起点数量、终点数量的对数,Xij为第i个空间单元的第j个自变量,即建成环境特征,αj为全局变量的回归系数,βj为局部变量的的回归系数,ui和vi为第i个空间单元的经纬度坐标,εi为残差;
选择核函数计算高斯混合地理加权回归模型中每个空间单元的权重值以及选择核带宽;其中,所述核函数包括高斯固定核函数和自适应双重平方核函数;
将所有自变量列为局部变量,进行地理加权回归模型构建,地理加权回归的公式如下:
Figure FDA0002575111200000042
其中,yi为第i个空间单元的因变量,Xij表示第i个空间单元的第j个自变量,γj(ui,vi)为自变量的回归系数,ui和vi为第i个空间单元的经纬度坐标,εi为残差记录模型的AICc值,记为AIC0;将第j个自变量列为全局变量,进行混合地理加权回归,记录AICc值,记为AICj,比较两个模型的AICc值,若AIC0-AICj>3,则将第j个自变量列为全局变量,以此类推;
通过莫兰指数检验高斯混合地理加权回归模型的标准化残差。
7.一种存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现权利要求1-5任一项所述的共享单车出行影响因素识别方法。
CN201811212040.7A 2018-10-18 2018-10-18 共享单车出行影响因素识别方法、系统及存储介质 Active CN109544690B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811212040.7A CN109544690B (zh) 2018-10-18 2018-10-18 共享单车出行影响因素识别方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811212040.7A CN109544690B (zh) 2018-10-18 2018-10-18 共享单车出行影响因素识别方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN109544690A CN109544690A (zh) 2019-03-29
CN109544690B true CN109544690B (zh) 2020-09-22

Family

ID=65844232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811212040.7A Active CN109544690B (zh) 2018-10-18 2018-10-18 共享单车出行影响因素识别方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN109544690B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059986B (zh) * 2019-05-08 2021-02-19 武汉大学 一种共享单车动态投放方法及系统
CN110222893B (zh) * 2019-06-06 2021-11-16 武汉元光科技有限公司 共享交通资源的投放地点推荐方法、装置与电子设备
CN111047130B (zh) * 2019-06-11 2021-03-02 北京嘀嘀无限科技发展有限公司 用于交通分析和管理的方法和系统
CN110543699B (zh) * 2019-08-15 2023-06-13 创新先进技术有限公司 共享车辆出行数据仿真、共享车辆调度方法、装置及设备
CN112184088B (zh) * 2020-11-12 2022-05-17 同济大学 一种基于多源数据的城市可骑行性评价方法及系统
CN112329265A (zh) * 2020-11-25 2021-02-05 国网湖南省电力有限公司 卫星遥感降水精细化空间估算方法及系统
CN112597402B (zh) * 2020-12-17 2022-11-18 东南大学 基于多源数据的轨道交通换乘共享单车影响区界定方法
CN112990976B (zh) * 2021-03-29 2024-06-14 华南理工大学 基于开源数据挖掘的商业网点选址方法、系统、设备及介质
CN112950092B (zh) * 2021-04-19 2024-06-25 哈尔滨工业大学(深圳) 基于轨迹数据的街道可骑行性评估方法、装置和存储介质
CN113743789A (zh) * 2021-09-07 2021-12-03 吉林大学 基于城市建成环境因素的共享单车空间分布量估计方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103392A (zh) * 2017-05-24 2017-08-29 北京航空航天大学 一种基于时空地理加权回归的公交客流影响因素识别与预测方法
CN107590766A (zh) * 2017-09-28 2018-01-16 东南大学 一种与道路交通事故风险相关的用地组合形态的判别方法
CN107622325A (zh) * 2017-09-12 2018-01-23 大连理工大学 基于建成环境和微博数据的交通事故时空分布量化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103392A (zh) * 2017-05-24 2017-08-29 北京航空航天大学 一种基于时空地理加权回归的公交客流影响因素识别与预测方法
CN107622325A (zh) * 2017-09-12 2018-01-23 大连理工大学 基于建成环境和微博数据的交通事故时空分布量化方法
CN107590766A (zh) * 2017-09-28 2018-01-16 东南大学 一种与道路交通事故风险相关的用地组合形态的判别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANALYSIS ON THE INFLUENCE FACTORS OF PASSENGER BY USING SMALL SAMPLE SIZE OF SUBWAY STATIONS;陈琦等;《J.Archit. PLann. AIJ.》;20180531;第83卷(第747期);第908页左栏-第914页右栏 *
面向智慧城市的共享单车出行时空间特征研——以广州天河中心区为例;魏宗财等;《科技导报》;20180928;第36卷(第18期);第71页的摘要、第72页右栏-78页左栏 *

Also Published As

Publication number Publication date
CN109544690A (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
CN109544690B (zh) 共享单车出行影响因素识别方法、系统及存储介质
Neutze The suburban apartment boom: case study of a land use problem
Hashimoto et al. Scenario analysis of land-use and ecosystem services of social-ecological landscapes: implications of alternative development pathways under declining population in the Noto Peninsula, Japan
CN112990976B (zh) 基于开源数据挖掘的商业网点选址方法、系统、设备及介质
CN109146204A (zh) 一种多层次综合评估的风电场升压站自动选址方法
Liaghat et al. A multi-criteria evaluation using the analytic hierarchy process technique to analyze coastal tourism sites
Maddahi et al. Land suitability analysis for rice cultivation using multi criteria evaluation approach and GIS
Hai-ling et al. A GIS-based approach for information management in ecotourism region
CN109840272B (zh) 一种共享电动汽车站点用户需求预测方法
CN113034040A (zh) 一种典型物种迁移廊道选址方法、装置及设备
CN112380425A (zh) 社区推荐方法、系统、计算机设备及存储介质
Dong et al. Analysis of urban environmental problems based on big data from the urban municipal supervision and management information system
Tassinari et al. Wide-area spatial analysis: A first methodological contribution for the study of changes in the rural built environment
Zoppi et al. Differentials in the regional operational program expenditure for public services and infrastructure in the coastal cities of Sardinia (Italy) analyzed in the ruling context of the Regional Landscape Plan
CN112950079B (zh) 绿地供需数据处理方法、系统、计算机设备及存储介质
CN117076744B (zh) 一种无障碍设施建设选址方法及设备
CN116703132B (zh) 共享车辆动态调度的管理方法、装置及计算机设备
Bakkal et al. Modeling and querying trajectories using Neo4j spatial and TimeTree for carpool matching
CN112434262A (zh) 一种滨水公共空间活力影响因素识别方法及终端
CN107801418B (zh) 利用地图检索记录的流动人口推算装置及方法
Liu et al. An integrated method used to value recreation land–a case study of Sweden
CN115860213A (zh) 多情景城市应急采样场所选址优化方法、系统、设备及介质
Olajuyigbe et al. Assessment of Quality of Life Using Geographical Information System Approach for Poverty Alleviation Decision-Making
CN109635047B (zh) 地理网格的信息处理方法、装置、设备及可读存储介质
CN110189029A (zh) 一种基于大规模手机位置数据的自行车骑车与停车需求评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant