CN109146155B - 基于多源数据融合的城市交通出行需求确定方法及系统 - Google Patents

基于多源数据融合的城市交通出行需求确定方法及系统 Download PDF

Info

Publication number
CN109146155B
CN109146155B CN201810868012.4A CN201810868012A CN109146155B CN 109146155 B CN109146155 B CN 109146155B CN 201810868012 A CN201810868012 A CN 201810868012A CN 109146155 B CN109146155 B CN 109146155B
Authority
CN
China
Prior art keywords
traffic
name
interest points
data
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810868012.4A
Other languages
English (en)
Other versions
CN109146155A (zh
Inventor
阳建强
华雪东
王炜
周文竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201810868012.4A priority Critical patent/CN109146155B/zh
Publication of CN109146155A publication Critical patent/CN109146155A/zh
Application granted granted Critical
Publication of CN109146155B publication Critical patent/CN109146155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多源数据融合的城市交通出行需求确定方法及系统,该方法包含了多源数据采集、多源数据融合、城市交通出行需求确定三大步骤。本发明方法采集了包含房地产住宅数据、企业纳税数据、兴趣点数据、消费水平数据等在内的多源数据,通过对多源数据进行融合、解析与处理,可以更加准确的获取城市交通出行需求。通过本发明方法获得的城市交通出行需求,在提升了交通出行需求数据精度与准确度的同时,降低了交通出行需求数据采集的时间消耗与采集难度,具有现实意义。

Description

基于多源数据融合的城市交通出行需求确定方法及系统
技术领域
本发明属于交通大数据处理及交通出行需求分析领域,涉及一种基于多源数据融合的城市交通出行需求确定方法及系统。
背景技术
城市交通出行需求确定与分析工作作为城市交通规划的核心工作之一,其目的是建立城市土地利用与交通的相互关系模型,进而预测不同的土地利用布局下的交通流量,为交通规划、决策、交通政策的制定等提供决策依据,从基础数据的层面保证决策的科学性。由于城市交通出行需求涉及到城市社会、经济等各方面的因素,因而一般情况下,对于城市交通出行需求的确定,需要遵循如下原则:符合经济发展规律;符合客运基本出行交通规律;反映交通政策的影响;与城市土地利用相匹配。在具体的交通出行需求的计算与确定层面,一般的做法是依托如下的基础数据:城市总体规划、相关的交通规划资料、道路基础资料、交通量调查数据、城市社会经济发展资料等。
受限于传统的交通基础数据采集技术,城市交通出行需求确定工作具有如下的几点局限性:1)在基础数据的采集工作上,传统的方法需要借助大量的人力进行居民入户调查,一方面会消耗大量的人力、物力与财力,并且调查的前期准备时间、调查的进行时间、调查数据的处理时间都非常的长;另一方面调查的覆盖面也非常窄,往往只能覆盖不超过3%的城市人口;2)在需求分析确定方面,对于部分关键数据及参数的取值时采用了近似的处理,导致交通出行需求分析的结果并不准确。此外,由于数据的采集周期长,导致交通出行需求分析的结果存在一定的滞后性。
发明内容
发明目的:为解决传统城市交通出行需求确定方法数据调查耗时耗力、确定结果确定性不高、存在一定滞后性的实际问题,本发明目的在于提出了一种基于多源数据融合的城市交通出行需求确定方法及系统,采集了包含房地产住宅数据、企业纳税数据、兴趣点数据、消费水平数据等在内的多源数据,通过对多源数据进行融合、解析与处理,可以更加准确的获取城市交通出行需求,在提升了交通出行需求数据精度与准确度的同时,降低了交通出行需求数据采集的时间消耗与采集难度。
技术方案:为实现上述发明目的,本发明采用的技术方案为:
一种基于多源数据融合的城市交通出行需求确定方法,该方法包括如下步骤:
(1)多源数据采集,所述多源数据包括房地产住宅数据、兴趣点数据、企业纳税数据和消费水平数据;所述房地产住宅数据包括城市的住宅区数量以及各住宅区的名称、房屋总数、房屋总使用面积和人均居住面积;所述兴趣点数据包括兴趣点总数量以及各兴趣点的名称、行业分类和坐标;所述企业纳税数据包括城市的企业数量以及各企业的名称和年营业额;所述消费水平数据包括城市的店铺数量以及各店铺的名称和人均消费金额;
(2)多源数据融合,包括:将行业分类为写字楼或住宅区的兴趣点分类为交通发生类兴趣点,其他兴趣点分类为交通吸引类兴趣点;将兴趣点名称分别与住宅区名称、企业名称、店铺名称匹配,得到匹配成功的兴趣点的房屋总使用面积、人均居住面积、企业年营业额和人均消费金额;将兴趣点的房屋总使用面积与人均居住面积相除计算交通发生类兴趣点交通发生人数;将兴趣点的企业年营业额与人均消费金额相除计算交通吸引类兴趣点的交通吸引人数;
(3)城市交通出行需求确定,包括:设置各交通小区的初始交通发生人数和初始交通吸引人数为0;将各交通小区内的所有的兴趣点的交通发生人数和通吸引人数对应的累加至交通小区的交通发生人数和交通吸引人数之上;将各交通小区的交通发生人数与人均出行次数相乘得到交通小区的交通发生量,各交通小区的交通吸引人数为交通吸引量。
作为优选,所述步骤(1)中采用网络爬虫技术,在互联网上爬取城市的房地产住宅数据。
作为优选,所述步骤(1)中采用百度地图API,在百度地图网页采集城市的兴趣点数据。
作为优选,所述步骤(1)中采用大众点评API,在大众点评网页采集消费水平数据。
作为优选,所述步骤(2)中,采用KMP算法将兴趣点名称NBmb分别与住宅区名称NAma、企业名称NCmc、店铺名称NDmd进行匹配;按照名称NBmb、NAma进行匹配时:若名称NBmb、NAma采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NAma采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NAma)的0.85倍,则匹配成功;否则匹配失败;按照名称NBmb、NCmc进行匹配时:若名称NBmb、NCmc采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NCmc采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NCmc)的0.85倍,则匹配成功;否则匹配失败;按照名称NBmb、NDmd进行匹配时:若名称NBmb、NDmd采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NDmd采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NDmd)的0.85倍,则匹配成功;否则匹配失败;其中,ma、mb、mc、md分别表示住宅区的序号、兴趣点的序号、企业的序号、店铺的序号;min(NBmb、NAma)、min(NBmb、NCmc)、min(NBmb、NDmd)分别表示名称NBmb和NAma的字符串长度的较小值、名称NBmb和NCmc的字符串长度的较小值、名称NBmb和NDmd的字符串长度的较小值。
作为优选,所述步骤(2)中,对于交通吸引类兴趣点,交通发生人数为0,对于名称匹配不成功的交通发生类兴趣点,交通发生人数为其他所有匹配成功的交通发生类兴趣点的交通发生人数的平均值;对于交通发生类兴趣点,交通引类人数为0,对于名称匹配不成功的交通引类类兴趣点,交通吸引人数为其他所有匹配成功的交通吸引类兴趣点的交通吸引人数的平均值。
本发明另一方面提供的一种基于多源数据融合的城市交通出行需求确定系统,包括:
多源数据采集模块,包括房地产住宅数据采集单元、兴趣点数据采集单元、企业纳税数据采集单元和消费水平数据采集单元分别用于采集房地产住宅数据、兴趣点数据、企业纳税数据和消费水平数据;所述房地产住宅数据包括城市的住宅区数量以及各住宅区的名称、房屋总数、房屋总使用面积和人均居住面积;所述兴趣点数据包括兴趣点总数量以及各兴趣点的名称、行业分类和坐标;所述企业纳税数据包括城市的企业数量以及各企业的名称和年营业额;所述消费水平数据包括城市的店铺数量以及各店铺的名称和人均消费金额;
多源数据融合模块,包括:兴趣点分类单元,用于将行业分类为写字楼或住宅区的兴趣点分类为交通发生类兴趣点,其他兴趣点分类为交通吸引类兴趣点;多源数据匹配单元,用于将兴趣点名称分别与住宅区名称、企业名称、店铺名称匹配,得到匹配成功的兴趣点的房屋总使用面积、人均居住面积、企业年营业额和人均消费金额;交通发生人数计算单元,用于将兴趣点的房屋总使用面积与人均居住面积相除计算交通发生类兴趣点交通发生人数;以及,交通吸引人数计算单元,用于将兴趣点的企业年营业额与人均消费金额相除计算交通吸引类兴趣点的交通吸引人数;
以及,城市交通出行需求确定模块,用于根据兴趣点的交通发生人数和通吸引人数计算交通小区的交通发生量和交通吸引量,具体为:设置各交通小区的初始交通发生人数和初始交通吸引人数为0;将各交通小区内的所有的兴趣点的交通发生人数和通吸引人数对应的累加至交通小区的交通发生人数和交通吸引人数之上;将各交通小区的交通发生人数与人均出行次数相乘得到交通小区的交通发生量,各交通小区的交通吸引人数为交通吸引量。
有益效果:本发明提出的一种基于多源数据融合的城市交通出行需求确定方法,该方法充分考虑了城市交通需求与多源数据间的互动及关联变化关系,通过本发明方法获得的城市交通出行需求,在提升了交通出行需求数据精度与准确度的同时,降低了交通出行需求数据采集的时间消耗与采集难度。与现有依托人工调查为主的交通数据抽样采集,随后进行处理分析获取城市交通出行需求的做法相比,本发明方法采集了网络上包含房地产住宅数据、企业纳税数据、兴趣点数据、消费水平数据等在内的多源数据,通过对多源数据进行融合、解析与处理,可以更加准确的获取城市交通出行需求;同时,这种电子化的多源数据采集与处理,可以大大的节约人力、物力与财力,提高交通数据采集的覆盖范围。此外,基于多源数据确定的城市交通出行需求时滞性小,结果的时效性高。
附图说明
图1为本发明的流程框图。
具体实施方式
下面结合附图和具体实施例,对本发明作更进一步的说明。
如图1所示,本发明实施例公开的一种基于多源数据融合的城市交通出行需求确定方法,通过对包含房地产住宅数据、企业纳税数据、兴趣点数据、消费水平数据等多源数据的采集、融合与分析,获取城市的交通出行需求,该方法主要包括以下步骤:
步骤S1:多源数据采集。具体包括如下方面数据的采集:
步骤1A)房地产住宅数据采集。采集的数据包含:城市的住宅区数量MA,第ma个住宅区名称NAma,第ma个住宅区的房屋总数TAma,第ma个住宅区的房屋总使用面积AAma,第ma个住宅区的人均居住面积ABma。其中,ma为住宅区的序号,ma为自然数,且MA≥ma≥1;
本步骤中,采用网络爬虫技术,在链家(https://www.lianjia.com/)、我爱我家(https://www.5i5j.com/),或者城市房管部门主管的房产登记网站上爬取城市的房地产住宅数据,具体在数据爬取操作时,可选择上述某一个网站进行爬取操作。
步骤1B)兴趣点数据采集。采集的数据包含:兴趣点的总数量MB,第mb个兴趣点的名称NBmb,第mb个兴趣点的行业分类TBmb,第mb个兴趣点的坐标(xmb,ymb)。
其中,mb为兴趣点的序号,mb为自然数,且MB≥mb≥1;
本步骤中,采用百度地图API(http://api.map.baidu.com/lbsapi/)接口,采用其提供的POI检索功能(http://lbsyun.baidu.com/index.php?title=jspopular/guide/search),在百度地图网页采集城市的兴趣点数据。
步骤1C)企业纳税数据采集。采集的数据包含:城市的企业数量MC,第mc个企业的名称NCmc,第mc个企业的年营业额TCmc。其中,mc为企业的序号,mc为自然数,且MC≥mc≥1;本步骤中,可以通过企查查(https://www.qichacha.com/)或天眼查(https://www.tianyancha.com/)提供的企业经营状况信息直接获取,或者计算得到。
步骤1D)消费水平数据采集。采集的数据包含:城市的店铺数量MD,第md个店铺的名称NDmd,第md个店铺的人均消费金额TDmd。其中,md为店铺的序号,md为自然数,且MD≥md≥1;
本步骤中,采用大众点评API(http://developer.dianping.com/index),采用其提供的搜索商户功能(http://developer.dianping.com/app/api/v1/business/find_businesses),在大众点评网页采集消费水平数据。
步骤S2:多源数据融合。包含如下步骤:
步骤2A):兴趣点分类。将步骤1B)中采集得到的兴趣点数据根据行业分类TBmb进行分类:若TBmb为写字楼、住宅区的兴趣点,则第mb个兴趣点为交通发生类兴趣点;否则,若TBmb为除了写字楼、住宅区以外的兴趣点,则第mb个兴趣点为交通吸引类兴趣点;
步骤2B):多源数据匹配。将兴趣点名称分别与住宅区名称、企业名称、店铺名称匹配,获取兴趣点的房屋总使用面积、人均居住面积、企业年营业额和人均消费金额。具体为:将步骤1B)采集得到的兴趣点数据,和步骤1A)房地产住宅数据数据,按照名称NBmb、NAma进行匹配:对于第mb个兴趣点,若名称NBmb、NAma采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NAma采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NAma)的0.85倍,则匹配成功,此时匹配后第mb个兴趣点的房屋总使用面积为AAMAmb,匹配后的人均居住面积为ABMAmb;将步骤1B)采集得到的兴趣点数据,和步骤1C)采集得到的企业纳税数据,按照名称NBmb、NCmc进行匹配:对于第mb个兴趣点,若名称NBmb、NCmc采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NCmc采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NCmc)的0.85倍,则匹配成功,此时,匹配后第mb个兴趣点的企业的年营业额为TCMCmb;将步骤1B)采集得到的兴趣点数据,和步骤1D)采集得到的消费水平数据,按照名称NBmb、NDmd进行匹配:对于第mb个兴趣点,若名称NBmb、NDmd采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NDmd采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NDmd)的0.85倍,则匹配成功,此时匹配后第mb个兴趣点的人均消费金额TCMDmb。其中,下标MAmb为与第mb个兴趣点匹配的房地产住宅数据的序号,下标MCmb为与第mb个兴趣点匹配的企业纳税数据的序号,下标MDmb为与第mb个兴趣点匹配的消费水平数据的序号;min(NBmb、NAma)、min(NBmb、NCmc)、min(NBmb、NDmd)分别表示名称NBmb和NAma的字符串长度的较小值、名称NBmb和NCmc的字符串长度的较小值、名称NBmb和NDmd的字符串长度的较小值。
步骤2C):交通发生类兴趣点交通发生人数计算。若第mb个兴趣点在步骤2A)中分类为交通吸引类兴趣点,则第mb个兴趣点的交通发生人数Pmb=0;若第mb个兴趣点在步骤2A)中分类为交通发生类兴趣点,则计算交通发生人数:若该兴趣点在步骤2B)中匹配成功,则第mb个兴趣点的交通发生人数Pmb=AAMAmb/ABMAmb;若该兴趣点在步骤2B)中匹配不成功,则第mb个兴趣点的交通发生人数Pmb为其他所有匹配成功的交通发生类兴趣点的交通发生人数的平均值;
步骤2D):交通吸引类兴趣点交通吸引人数计算。若第mb个兴趣点在步骤2A)中分类为交通发生类兴趣点,则第mb个兴趣点的交通吸引人数Amb=0;若第mb个兴趣点在步骤2A)中分类为交通吸引类兴趣点,则计算交通吸引人数:若该兴趣点在步骤2B)中匹配成功,则第mb个兴趣点的交通吸引人数Amb=TCMCmb/TCMDmb;若该兴趣点在步骤2B)中匹配不成功,则第mb个兴趣点的交通吸引人数Amb为其他所有匹配成功的交通吸引类兴趣点的交通吸引人数的平均值;
步骤S3:城市交通出行需求确定。包含如下步骤:
步骤3A)交通出行需求初始化。设置第n个交通小区的初始交通发生人数为Pron=0,初始交通吸引人数为Attn=0。其中,n为交通小区的序号,n为自然数,且N≥n≥1。N为交通小区的总数;
步骤3B)交通出行人数确定。依次处理每个兴趣点的交通发生人数与交通吸引人数:第mb个兴趣点在交通小区nmb内,则将第mb个兴趣点的交通发生人数Pmb、交通吸引人数Amb对应的累加至第nmb个交通小区的交通发生人数Pronmb、交通吸引人数Attnmb之上;
步骤3C)交通出行需求确定。第n个交通小区的交通发生量为PPron=Pron×time,交通吸引量为AAttn=Attn,其中,time为人均出行次数。
本发明另一实施例提供的一种基于多源数据融合的城市交通出行需求确定系统,包括:多源数据采集模块、多源数据融合模块和城市交通出行需求确定模块,其中多源数据采集模块包括房地产住宅数据采集单元、兴趣点数据采集单元、企业纳税数据采集单元和消费水平数据采集单元分别用于采集房地产住宅数据、兴趣点数据、企业纳税数据和消费水平数据。多源数据融合模块,包括:兴趣点分类单元,用于将行业分类为写字楼或住宅区的兴趣点分类为交通发生类兴趣点,其他兴趣点分类为交通吸引类兴趣点;多源数据匹配单元,用于将兴趣点名称分别与住宅区名称、企业名称、店铺名称匹配,得到匹配成功的兴趣点的房屋总使用面积、人均居住面积、企业年营业额和人均消费金额;交通发生人数计算单元,用于将兴趣点的房屋总使用面积与人均居住面积相除计算交通发生类兴趣点交通发生人数;以及,交通吸引人数计算单元,用于将兴趣点的企业年营业额与人均消费金额相除计算交通吸引类兴趣点的交通吸引人数。城市交通出行需求确定模块,用于根据兴趣点的交通发生人数和通吸引人数计算交通小区的交通发生量和交通吸引量。该基于多源数据融合的城市交通出行需求确定系统实施例可以用于执行上述基于多源数据融合的城市交通出行需求确定方法实施例,其技术原理、所解决的技术问题及产生的技术效果相似,具体实现细节参见上述方法实施例,此处不再赘述。

Claims (4)

1.一种基于多源数据融合的城市交通出行需求确定方法,其特征在于,该方法包括如下步骤:
(1)多源数据采集,所述多源数据包括房地产住宅数据、兴趣点数据、企业纳税数据和消费水平数据;所述房地产住宅数据包括城市的住宅区数量以及各住宅区的名称、房屋总数、房屋总使用面积和人均居住面积,采用网络爬虫技术,在互联网上爬取城市的房地产住宅数据;所述兴趣点数据包括兴趣点总数量以及各兴趣点的名称、行业分类和坐标,采用百度地图API,在百度地图网页采集城市的兴趣点数据;所述企业纳税数据包括城市的企业数量以及各企业的名称和年营业额,通过企查查或天眼查提供的企业经营状况信息直接获取,或者计算得到;所述消费水平数据包括城市的店铺数量以及各店铺的名称和人均消费金额,采用大众点评API,在大众点评网页采集消费水平数据;
(2)多源数据融合,包括:将行业分类为写字楼或住宅区的兴趣点分类为交通发生类兴趣点,其他兴趣点分类为交通吸引类兴趣点;将兴趣点名称分别与住宅区名称、企业名称、店铺名称匹配,得到匹配成功的兴趣点的房屋总使用面积、人均居住面积、企业年营业额和人均消费金额;将兴趣点的房屋总使用面积与人均居住面积相除计算交通发生类兴趣点交通发生人数;将兴趣点的企业年营业额与人均消费金额相除计算交通吸引类兴趣点的交通吸引人数;
(3)城市交通出行需求确定,包括:设置各交通小区的初始交通发生人数和初始交通吸引人数为0;将各交通小区内的所有的兴趣点的交通发生人数和通吸引人数对应的累加至交通小区的交通发生人数和交通吸引人数之上;将各交通小区的交通发生人数与人均出行次数相乘得到交通小区的交通发生量,各交通小区的交通吸引人数为交通吸引量。
2.根据权利要求1所述的基于多源数据融合的城市交通出行需求确定方法,其特征在于,所述步骤(2)中,采用KMP算法将兴趣点名称NBmb分别与住宅区名称NAma、企业名称NCmc、店铺名称NDmd进行匹配;按照名称NBmb、NAma进行匹配时:若名称NBmb、NAma采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NAma采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NAma)的0.85倍,则匹配成功;否则匹配失败;按照名称NBmb、NCmc进行匹配时:若名称NBmb、NCmc采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NCmc采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NCmc)的0.85倍,则匹配成功;否则匹配失败;按照名称NBmb、NDmd进行匹配时:若名称NBmb、NDmd采用KMP算法计算得到的数值大于或者等于名称NBmb与任何一个NDmd采用KMP算法计算得到数值,且KMP算法计算得到的数值大于或者等于min(NBmb、NDmd)的0.85倍,则匹配成功;否则匹配失败;其中,ma、mb、mc、md分别表示住宅区的序号、兴趣点的序号、企业的序号、店铺的序号;min(NBmb、NAma)、min(NBmb、NCmc)、min(NBmb、NDmd)分别表示名称NBmb和NAma的字符串长度的较小值、名称NBmb和NCmc的字符串长度的较小值、名称NBmb和NDmd的字符串长度的较小值。
3.根据权利要求1所述的基于多源数据融合的城市交通出行需求确定方法,其特征在于,所述步骤(2)中,对于交通吸引类兴趣点,交通发生人数为0,对于名称匹配不成功的交通发生类兴趣点,交通发生人数为其他所有匹配成功的交通发生类兴趣点的交通发生人数的平均值;对于交通发生类兴趣点,交通引类人数为0,对于名称匹配不成功的交通引类类兴趣点,交通吸引人数为其他所有匹配成功的交通吸引类兴趣点的交通吸引人数的平均值。
4.一种基于多源数据融合的城市交通出行需求确定系统,其特征在于,包括:
多源数据采集模块,包括房地产住宅数据采集单元、兴趣点数据采集单元、企业纳税数据采集单元和消费水平数据采集单元分别用于采集房地产住宅数据、兴趣点数据、企业纳税数据和消费水平数据;所述房地产住宅数据包括城市的住宅区数量以及各住宅区的名称、房屋总数、房屋总使用面积和人均居住面积,采用网络爬虫技术,在互联网上爬取城市的房地产住宅数据;所述兴趣点数据包括兴趣点总数量以及各兴趣点的名称、行业分类和坐标,采用百度地图API,在百度地图网页采集城市的兴趣点数据;所述企业纳税数据包括城市的企业数量以及各企业的名称和年营业额,通过企查查或天眼查提供的企业经营状况信息直接获取,或者计算得到;所述消费水平数据包括城市的店铺数量以及各店铺的名称和人均消费金额,采用大众点评API,在大众点评网页采集消费水平数据;
多源数据融合模块,包括:兴趣点分类单元,用于将行业分类为写字楼或住宅区的兴趣点分类为交通发生类兴趣点,其他兴趣点分类为交通吸引类兴趣点;多源数据匹配单元,用于将兴趣点名称分别与住宅区名称、企业名称、店铺名称匹配,得到匹配成功的兴趣点的房屋总使用面积、人均居住面积、企业年营业额和人均消费金额;交通发生人数计算单元,用于将兴趣点的房屋总使用面积与人均居住面积相除计算交通发生类兴趣点交通发生人数;以及,交通吸引人数计算单元,用于将兴趣点的企业年营业额与人均消费金额相除计算交通吸引类兴趣点的交通吸引人数;
以及,城市交通出行需求确定模块,用于根据兴趣点的交通发生人数和通吸引人数计算交通小区的交通发生量和交通吸引量,具体为:设置各交通小区的初始交通发生人数和初始交通吸引人数为0;将各交通小区内的所有的兴趣点的交通发生人数和通吸引人数对应的累加至交通小区的交通发生人数和交通吸引人数之上;将各交通小区的交通发生人数与人均出行次数相乘得到交通小区的交通发生量,各交通小区的交通吸引人数为交通吸引量。
CN201810868012.4A 2018-08-02 2018-08-02 基于多源数据融合的城市交通出行需求确定方法及系统 Active CN109146155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810868012.4A CN109146155B (zh) 2018-08-02 2018-08-02 基于多源数据融合的城市交通出行需求确定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810868012.4A CN109146155B (zh) 2018-08-02 2018-08-02 基于多源数据融合的城市交通出行需求确定方法及系统

Publications (2)

Publication Number Publication Date
CN109146155A CN109146155A (zh) 2019-01-04
CN109146155B true CN109146155B (zh) 2021-07-09

Family

ID=64799485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810868012.4A Active CN109146155B (zh) 2018-08-02 2018-08-02 基于多源数据融合的城市交通出行需求确定方法及系统

Country Status (1)

Country Link
CN (1) CN109146155B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008837B (zh) * 2019-03-06 2022-04-29 东南大学 一种根据所属道路网络封闭多边形统计poi的快速实现方法
CN110111570A (zh) * 2019-05-07 2019-08-09 四川咖范网络科技有限公司 基于多源数据融合的智能交通系统
CN112954623B (zh) * 2021-02-02 2022-05-20 苏州丽景智行交通工程咨询有限公司 一种基于手机信令大数据的居民入住率估算方法
CN113192321A (zh) * 2021-03-17 2021-07-30 东南大学 一种面向综合土地利用的交通需求分布提取方法
CN113611105B (zh) * 2021-07-09 2022-06-07 东南大学 一种城市交通出行需求总量预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105513351A (zh) * 2015-12-17 2016-04-20 北京亚信蓝涛科技有限公司 一种基于大数据的交通出行特征数据提取方法
CN106056909A (zh) * 2016-06-29 2016-10-26 东南大学 一种中小城市快速公交阈值确定方法
CN107305590A (zh) * 2017-06-14 2017-10-31 北京市交通信息中心 一种基于手机信令数据的城市交通出行特征确定方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105513351A (zh) * 2015-12-17 2016-04-20 北京亚信蓝涛科技有限公司 一种基于大数据的交通出行特征数据提取方法
CN106056909A (zh) * 2016-06-29 2016-10-26 东南大学 一种中小城市快速公交阈值确定方法
CN107305590A (zh) * 2017-06-14 2017-10-31 北京市交通信息中心 一种基于手机信令数据的城市交通出行特征确定方法

Also Published As

Publication number Publication date
CN109146155A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN109146155B (zh) 基于多源数据融合的城市交通出行需求确定方法及系统
Niu et al. Integrating multi-source big data to infer building functions
Chen et al. Long short-term memory model for traffic congestion prediction with online open data
CN110753307B (zh) 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法
Frejinger Route choice analysis: data, models, algorithms and applications
CN106651424A (zh) 基于大数据技术的电力用户画像建立与分析方法
CN106096623A (zh) 一种犯罪识别与预测方法
CN106651036A (zh) 空气质量预报系统
Wang et al. Estimating urban traffic congestions with multi-sourced data
CN109035112B (zh) 基于多源数据融合的城市建设与更新模式确定方法及系统
Kang Effects of the human and built environment on neighborhood vitality: Evidence from Seoul, Korea, using mobile phone data
Zenkert et al. Big data analytics in smart mobility: Modeling and analysis of the Aarhus smart city dataset
CN108694463B (zh) 一种城市轨道交通站点进出站客流预测方法
CN109977287A (zh) 一种不同信息源的房产数据同一性判别方法
Steenbruggen Tourism geography: Emerging trends and initiatives to support tourism in Morocco
CN106096246A (zh) 基于pm2.5和pm10的气溶胶光学厚度估计方法
Huang et al. Estimating light-rail transit peak-hour boarding based on accessibility at station and route levels in Wuhan, China
Hudson Urban Characterisation; Expanding Applications for, and New Approaches to Building Attribute Data Capture
ARREERAS et al. An association rule mining-based exploration of travel patterns in wide tourism areas using a Wi-Fi package sensing survey
CN103530421A (zh) 基于微博的事件相似性度量方法及系统
Hou et al. Application of artificial intelligence-based sensor technology in the recommendation model of cultural tourism resources
CN108256112A (zh) 基于地理语义的地名地址检索质量评价方法
Chen et al. Quasi real-time evaluation system for seismic disaster based on internet of things
CN113688870A (zh) 一种采用混合算法的基于用户用电行为的群租房识别方法
CN106485921A (zh) 一种基于社交数据的区域高速路网车流状态分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant