CN115412857A - 一种居民出行信息预测方法 - Google Patents

一种居民出行信息预测方法 Download PDF

Info

Publication number
CN115412857A
CN115412857A CN202211016710.4A CN202211016710A CN115412857A CN 115412857 A CN115412857 A CN 115412857A CN 202211016710 A CN202211016710 A CN 202211016710A CN 115412857 A CN115412857 A CN 115412857A
Authority
CN
China
Prior art keywords
travel
information
time
user
trip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211016710.4A
Other languages
English (en)
Other versions
CN115412857B (zh
Inventor
孙轶琳
董轶男
陈逸洁
蒋雨豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202211016710.4A priority Critical patent/CN115412857B/zh
Publication of CN115412857A publication Critical patent/CN115412857A/zh
Application granted granted Critical
Publication of CN115412857B publication Critical patent/CN115412857B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明涉及一种居民出行信息预测方法,其主要步骤包括:收集用户个人信息及位置信息;根据位置信息对出行信息进行提取;构建基于BERT的时间序列模型对出行信息进行预测。以行程时空数据、用户个人信息、城市建成环境数据为模型输入,以出行方式及出行目的等出行信息为模型输出;根据出行调查进度与数据积累迭代训练及优化模型;优化完毕的模型即可用于居民出行信息的预测。本发明方法可更快更准地预测出行活动,可以为交通决策、交通规划和基础设施建设提供更加细致的信息,且能够预测交通方式分配以提高出行效率,为低碳减排和出行即服务平台的建设提供数据支撑。

Description

一种居民出行信息预测方法
技术领域
本发明涉及出行信息数据采集方法与识别领域,尤其是基于智能手机定位大数据对居民出行过程和轨迹进行采集,利用基于BERT(Bidirectional EncoderRepresentation from Transformers)的时间序列方法识别和预测出行信息,形成用于交通规划和交通决策的数据基础。
背景技术
我国经济的蓬勃发展在大幅提升居民生活水平的同时,也给城市交通组织和设施带来了日益增长的压力。交通拥堵已成为对城市发展和居民对美好生活的向往产生制约的关键问题之一,同时也为可持续发展和低碳环保带来了严峻挑战。为了获得一定区域内居民交通出行的基本特征,为交通基础设施建设提供信息支撑,居民出行调查是有力的方法,并以准确性和高效性为关键点。
许多城市规律性地开展大规模的居民出行调查,其核心内容是受访者使用出行链的方式记录出行起讫点、交通方式、出行目的等信息。为了提高调查结果可靠性,传统居民出行调查经历了纸笔调查、电话调查、电脑辅助自主填报等形式,然而这些方法更新速度慢,采样率低,并且无法避免主观认知造成的数据质量下降,无法提供具体路径选择信息。智能手机普及率的提高,使得采用高精度定位日志替代传统出行调查成为可能。其在出行链组成、区域内出行特征、道路交通实时运行状态等的精确记录,出行需求及路径选择分析等方面都具有独特的优势,并且相比手机信令数据展现出更佳的精确性和丰富性。而在智能手机调查的“无感化”和“被动化”方面,受访者手动记录频率降低的同时,如何同时保证并提高数据可靠性依然是研究的重点。
基于出行调查数据,离散选择模型结合实测交通流数据与阻抗函数等,能够对个人及社会属性、交通方式选择偏好、时空分布等进行拟合及分配。但局限于模型复杂度,其逐渐被机器学习及深度学习模型所取代,并常用于人群出行特征分析。城市化进程的加快以及共享出行等新兴出行方式的普及,出行即服务等体系的探索及发展,为居民出行信息分析带来了急剧增多的影响因素及严峻的挑战。就个体出行活动预测而言,亟需能够解析更为复杂的因子组合,并能进行高效精准预测的新型模型结构,以增强信息提取及利用的效率。
发明内容
针对上述背景技术中存在的缺陷,本发明提供一种居民出行信息预测方法。本发明方法首先基于智能手机获取实时高精度定位日志数据,包括用户出行时间、地点、方式及目的等出行特征,结合基于注意力机制的数据处理方法,对居民出行链进行复现,实现高可靠性、自动化的出行信息采集。相较于抽样率有限、精度较差的传统居民出行调查,以及定位精确度有限的手机信令数据,定位日志依托于极高的智能手机普及率,能够详细反映个人及人群的出行特征,并覆盖全距离范围内、多种特征组合的出行。
将所收集的出行信息划分为时间序列数据,构建基于BERT的深度学习网络模型,对居民个人的出行方式、出行目的和出行时段进行整合预测。在充分利用经济社会属性、出行信息等多种因素组合的基础上,该模型具备出行活动链全过程预测,以及根据现有或预约出行链结构自动修正预测结果的能力,同时具有良好的拟合精度。
本发明采用以下技术方案实现:
一种居民出行信息预测方法,包括以下步骤:
(1)采集用户个人信息:包括性别、年龄、职业、收入、居住区域、机动车驾照保有情况及交通工具使用情况;并赋予其唯一身份识别编号(ID),用于保护隐私及匹配所得数据;
(2)获取用户的位置信息:对于某一用户ID,以每2秒的频率记录当前时间戳tn、水平位置精度Hn、经度Jn、纬度Wn、速度Vn、加速度An、方向(与正北方向的顺时针夹角)Dn以及方向改变速率D’n,并以每20秒的频率上传出行记录至服务器,从而形成居民出行调查日志数据集。所述方向改变速率D’n的计算公式为:
Figure BDA0003812814940000021
其中,Δtn为两相邻定位点间的时间戳之差,ΔDn为两相邻定位点间的方向Dn之差。
(3)根据步骤(2)中用户的位置信息,获得候选停留点:基于注意力机制,从居民出行调查日志数据集中筛选出候选停留点。出现以下情况则将候选停留点合并为一个候选停留点:若两个候选停留点间距不足50米;若两个候选停留点的间距不大于150米,且时间差不大于5分钟。
(4)基于步骤(2)得到的用户的位置信息和步骤(3)得到的候选停留点,获得用户的出行信息;所述出行信息包括出行方式、出行目的和出行时段。据此可对出行活动安排进行复现,即出行活动链。
(5)当日进行的行程数据存储于本地及云端,用户可随时于应用程序内查看并核准行程信息及出行记录。
(6)BERT是用于自然语言处理的一种预训练模型,基于此构建时间序列模型,具体是以全连接层替代输入层,以Sigmoid层替代输出层构建基于BERT的时间序列模型;所述模型以行程时空数据Tripts(出行时段、出行时长、出行距离、平均速度、最大速度、速度的50/75分位数、平均加速度、最大加速度、加速度的50/75分位数、5km/h以下速度的时空占比、方向改变速率D′n、用户个人信息Indat(性别、年龄、职业、收入、居住区域、机动车驾照保有情况、交通工具使用情况)、城市建成环境数据Buden(城市用地类型及道路分布)等特征为输入;以出行信息Trvin(出行方式、出行目的、出行时段)为输出。
(7)根据前k个调查日获取的出行信息进行预训练,在此基础上将第k+1至k+n个调查日每日的数据输入模型,可对其实现迭代优化,该流程如图4所示。
(8)模型部署于智能手机上后,于应用程序界面展示用户当前时段的出行信息识别及预测结果,并由用户进行匹配度评价,从而可对模型进行进一步优化;
(9)采用优化后的模型对居民未来的出行信息进行预测。
上述技术方案中,进一步地,所述的步骤(3)中,基于注意力机制,从居民出行调查日志数据集中筛选出候选停留点,具体为:
首先,对获取的用户位置信息进行加密:
Xi=[sinWi,cosWi]
其中,i=1,2...n,Xi为时间戳ti时的加密位置信息,Wi为时间戳ti时的纬度;
接着,计算加密后任意两个位置之间的组合值Cij
Figure BDA0003812814940000041
其中,j=1,2...n,Xj为时间戳tj时的加密位置信息,Hi和Hj分别为时间戳ti时和tj时的水平位置精度;
然后,对所有组合值进行打分:
Figure BDA0003812814940000042
最后,针对任意一个位置,选取其与其他位置之间组合值的最大打分值:
Y1a=Max(Y11,Y12,Y13,...,Y1n),Y2b=Max(Y21,Y22,Y23,...,Y2n),...,Ynk=Max(Yn1,...,Ynk,...,Ynn)即可得到候选停留点Pa,Pb,...,Pk
本发明具有以下有益效果:
克服了传统居民出行调查和手机信令数据的局限性,高效且易于实施,节约人力物力,信息丰富且精确度高;基于个人交通大数据对居民出行信息进行提取,及进行模型迭代修正,结果时效性强;规避了参与人员(包括受试者和研究人员)的主观因素问题,具有较强的客观科学性。
深度学习网络模型具有易于部署,精度高,低成本的优势。将本发明方法部署于智能手机应用程序内,开展全要素交通出行调查,在降低调查成本、减少资源消耗的同时,充分利用移动网络覆盖佳、智能手机普及广的优势,提高数据质量;基于更为高效的深度学习网络模型,对所收集出行信息数据进行挖掘,既能够充分利用各影响因子组合,也可更快更准地预测出行活动,可以为交通决策、交通规划和基础设施建设提供更加细致的信息,且能够预测交通方式分配以提高出行效率,为低碳减排和出行即服务平台的建设提供数据支撑。
附图说明
图1出行信息采集流程;
图2基于注意力机制的数据处理流程;
图3基于BERT的时间序列模型;
图4出行信息识别及预测的工作流程;
图5于杭州市内进行的出行调查中,所采集出行轨迹数据的地图投影。
具体实施方式
本发明提出一种基于智能手机定位大数据和模型迭代的居民出行信息预测方法。下面结合具体应用实例对本发明进行进一步描述,但本发明的保护范围并不局限于此。
实施例1
下面以2020年5月,在杭州市范围内进行的出行调查为例,对本发明的一种居民出行信息预测方法进行进一步的阐释。实施的具体步骤如下:
(1)招募杭州市范围内常住居民参加出行调查,进行智能手机APP(内嵌有本发明的预测方法)安装及使用培训,并开展为期三天的预调查,就使用过程中出现的问题进行反馈与解决。
(2)根据步骤(1)中的预调查结果,调整受试者组成比例,并再次进行使用培训。
(3)于杭州市内,按照图1所示与前述流程,进行出行调查和信息采集工作,并对所采集数据进行整理。对于某天内某个用户的出行数据,其格式形如表1所示。
表1
Figure BDA0003812814940000051
(4)在为期10个工作日,包括290位常驻居民的出行调查中,共收集有效定位点数据1898520条,出行总有效时长1520小时31分钟,出行总有效距离9492.42千米,有效调查日数1509天。
(5)基于调查前5个工作日所获数据(包含定位点数据968245条,出行总时长821小时47分钟,出行总距离503.10千米,调查日数785天),以行程时空数据Tripts(出行时段、出行时长、出行距离、平均速度、最大速度、速度的50/75分位数、平均加速度、最大及速度、加速度的50/75分位数、5km/h以下速度的时空占比、方向改变速率)、用户属性Indat(性别、年龄、职业、收入、机动车驾照保有情况、交通工具使用情况)、城市建成环境数据Buden(城市用地类型及道路分布)等特征为输入;以出行信息Trvin(出行方式、出行目的、出行时段)为输出。
(6)以步骤(5)中数据的80%作为训练集,20%作为测试集,按2:00~10:00,10:00~18:00,18:00~2:00的三时段划分,建立基于BERT的时间序列模型。
(7)自第6个工作日起依托预训练模型对出行信息进行预测,并以F1分数(F1-Score,即精确率和召回率的调和平均数)作为评价标准,由式
Figure BDA0003812814940000061
计算,各时段及分项F1分数平均值为0.67。同时,自第6日起将当日所得数据与既有数据集相组合,仍以80%数据作为训练集,20%作为测试集,对基于BERT的时间序列模型进行迭代调优,即可得到训练完毕的最佳模型,其预测结果如下表2。对于所述出行信息,以10:00~18:00最为准确;出行时段的预测准确率最高,平均F1分数达到0.96;出行方式及出行目的预测F1分数也均高于0.91,由此可知本发明构建的模型达到了理想的预测效果,可进一步用于区域内居民出行信息预测。
表2
Figure BDA0003812814940000062
该系统部署于应用程序客户端及服务器端运行,能够高效收集出行数据,降低调查负担;通过对所收集出行信息数据进行挖掘,既能够充分利用各影响因子组合,也可更快更准地预测出行活动,可以为交通决策、交通规划和基础设施建设提供更加细致的信息,且能够预测交通方式分配以提高出行效率,为低碳减排和出行即服务平台的建设提供数据支撑。

Claims (4)

1.一种居民出行信息预测方法,其特征在于,包括以下步骤:
1)采集用户个人信息:包括性别、年龄、职业、收入、居住区域、机动车驾照保有情况及交通工具使用情况,并赋予其唯一身份识别编号ID;
2)采集用户的位置信息:对于某一用户ID,以每2秒的频率记录当前时间戳tn、水平位置精度Hn、经度Jn、纬度Wn、速度Vn、加速度An、方向Dn,并以固定频率上传用户位置信息,从而形成居民出行调查日志数据集;
3)根据步骤(2)中用户的位置信息,获得候选停留点:基于注意力机制,从出行调查日志数据集筛选出候选停留点;出现以下情况则将候选停留点合并为一个候选停留点:若两个候选停留点间距不足50米;若两个候选停留点的间距不大于150米,且时间差不大于5分钟;
4)基于步骤(3)得到的用户的位置信息和步骤(4)得到的候选停留点,获得用户的出行信息,所述出行信息包括出行方式、出行目的、出行时段;
5)储存当日的出行信息,用户可随时查看并核准出行信息;
6)以全连接层替代输入层,以Sigmoid层替代输出层,构建基于BERT的时间序列模型;所述模型以行程时空数据Tripts、用户个人信息Indat、城市建成环境数据Buden为输入;以出行信息为输出;
7)根据前k个调查日获取的出行信息进行预训练,通过第k+1至k+n个调查日每日的数据作为模型输入进行迭代优化;
8)用户根据实际情况对当前时段的出行信息预测结果进行匹配度评价,从而对模型进行进一步优化;
9)采用优化后的模型对居民未来的出行信息进行预测。
2.根据权利要求1所述的居民出行信息预测方法,其特征在于,所述的步骤(3)中,基于注意力机制,从居民出行调查日志数据集中筛选出候选停留点,具体为:
首先,对获取的用户位置信息进行加密:
Xi=[sinWi,cosWi]
其中,i=1,2...n,Xi为时间戳ti时的加密位置信息,Wi为时间戳ti时的纬度;
接着,计算加密后任意两个位置之间的组合值Cij
Figure FDA0003812814930000021
其中,j=1,2...n,Xj为时间戳tj时的加密位置信息,Hi和Hj分别为时间戳ti时和tj时的水平位置精度;
然后,对所有组合值进行打分:
Figure FDA0003812814930000022
最后,针对任意一个位置,选择其与其他所有位置之间组合值的最大打分值:Y1a=Max(Y11,Y12,Y13,...,Y1n),Y2b=Max(Y21,Y22,Y23,...,Y2n),...,Ynk=Max(Yn1,...,Ynk,...,Ynn),即可得到候选停留点Pa,Pb,...,Pk
3.根据权利要求1所述的居民出行信息预测方法,其特征在于,所述的步骤(6)中,行程时空数据Tripts具体包括:出行时段、出行时长、出行距离、平均速度、最大速度、速度的50/75分位数、平均加速度、最大加速度、加速度的50/75分位数、5km/h以下速度的时空占比以及方向改变速率D′n
4.根据权利要求1所述的居民出行信息预测方法,其特征在于,所述的步骤(6)中,城市建成环境数据包括城市用地类型及道路分布。
CN202211016710.4A 2022-08-24 2022-08-24 一种居民出行信息预测方法 Active CN115412857B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211016710.4A CN115412857B (zh) 2022-08-24 2022-08-24 一种居民出行信息预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211016710.4A CN115412857B (zh) 2022-08-24 2022-08-24 一种居民出行信息预测方法

Publications (2)

Publication Number Publication Date
CN115412857A true CN115412857A (zh) 2022-11-29
CN115412857B CN115412857B (zh) 2023-08-18

Family

ID=84161074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211016710.4A Active CN115412857B (zh) 2022-08-24 2022-08-24 一种居民出行信息预测方法

Country Status (1)

Country Link
CN (1) CN115412857B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116502879A (zh) * 2023-06-29 2023-07-28 山东第一医科大学(山东省医学科学院) 基于大数据分析的城市运输设备部署设计系统
CN116628527A (zh) * 2023-07-24 2023-08-22 浙江大学 一种集成出行策略的设计方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104159189A (zh) * 2013-05-15 2014-11-19 同济大学 基于智能手机的居民出行信息获取方法
CN109561386A (zh) * 2018-11-23 2019-04-02 东南大学 一种基于多源定位数据的城市居民出行活动模式获取方法
CN112966010A (zh) * 2021-02-09 2021-06-15 深圳大学 一种用户轨迹信息挖掘方法
CN113822709A (zh) * 2021-09-15 2021-12-21 摩拜(北京)信息技术有限公司 一种出行数据的处理方法、装置及服务器
US20210400423A1 (en) * 2020-06-22 2021-12-23 Microsoft Technology Licensing, Llc Generation and modification of locational entries and geofences for safety of group members

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104159189A (zh) * 2013-05-15 2014-11-19 同济大学 基于智能手机的居民出行信息获取方法
CN109561386A (zh) * 2018-11-23 2019-04-02 东南大学 一种基于多源定位数据的城市居民出行活动模式获取方法
US20210400423A1 (en) * 2020-06-22 2021-12-23 Microsoft Technology Licensing, Llc Generation and modification of locational entries and geofences for safety of group members
CN112966010A (zh) * 2021-02-09 2021-06-15 深圳大学 一种用户轨迹信息挖掘方法
CN113822709A (zh) * 2021-09-15 2021-12-21 摩拜(北京)信息技术有限公司 一种出行数据的处理方法、装置及服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨超;朱荣荣;涂然;: "基于智能手机调查数据的居民出行活动特征分析", 交通信息与安全, no. 06 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116502879A (zh) * 2023-06-29 2023-07-28 山东第一医科大学(山东省医学科学院) 基于大数据分析的城市运输设备部署设计系统
CN116628527A (zh) * 2023-07-24 2023-08-22 浙江大学 一种集成出行策略的设计方法及系统
CN116628527B (zh) * 2023-07-24 2023-11-10 浙江大学 一种集成出行策略的设计方法及系统

Also Published As

Publication number Publication date
CN115412857B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN115412857B (zh) 一种居民出行信息预测方法
CN102607553B (zh) 一种基于出行轨迹数据的行程识别方法
CN110555544B (zh) 一种基于gps导航数据的交通需求估计方法
CN110598953A (zh) 一种时空相关的空气质量预测方法
CN105142106A (zh) 基于手机信令数据的出行者职住地识别与出行链刻画方法
CN108495254B (zh) 一种基于信令数据的交通小区人口特征估计方法
WO2021115320A1 (zh) 交通评估方法和系统
CN110716935A (zh) 基于网约车出行的轨迹数据分析与可视化方法及系统
CN110837973B (zh) 一种基于交通出行数据的人类出行选择信息挖掘方法
Yang et al. A data-driven travel mode share estimation framework based on mobile device location data
CN113962472B (zh) 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法
CN112418556B (zh) 一种基于互联网共享平台下的网格化服务系统
Yang et al. Detecting home and work locations from mobile phone cellular signaling data
Demirbas et al. imap: Indirect measurement of air pollution with cellphones
CN109800903A (zh) 一种基于出租车轨迹数据的盈利路线规划方法
Ali et al. Analysing vehicular congestion scenario in Kuala Lumpur using open traffic
CN108986466B (zh) 一种基于WiFi探针的交通OD信息采集系统及处理方法
Huang et al. Sensing Multi-modal Mobility Patterns: A Case Study of Helsinki using Bluetooth Beacons and a Mobile Application
Bagheri et al. A computational framework for revealing competitive travel times with low-carbon modes based on smartphone data collection
CN114666738A (zh) 基于手机信令的国土空间规划方法和系统
Elleuch et al. Collection and exploration of GPS based vehicle traces database
Mandal et al. GPS crowdsensing for public stoppage planning of city buses: A perspective of developing economies
CN116233759B (zh) 一种居民出行轨迹调查方法及系统
Li et al. Research on urban resident activity patterns and hotspot area based on GPS floating car data
CN111833229A (zh) 一种基于地铁依赖度的出行行为时空分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant