CN110414732B - 一种出行未来轨迹预测方法、装置、储存介质及电子设备 - Google Patents
一种出行未来轨迹预测方法、装置、储存介质及电子设备 Download PDFInfo
- Publication number
- CN110414732B CN110414732B CN201910667629.4A CN201910667629A CN110414732B CN 110414732 B CN110414732 B CN 110414732B CN 201910667629 A CN201910667629 A CN 201910667629A CN 110414732 B CN110414732 B CN 110414732B
- Authority
- CN
- China
- Prior art keywords
- travel
- data set
- trajectory
- fuzzy
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 63
- 230000000737 periodic effect Effects 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000013439 planning Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 10
- 238000010295 mobile communication Methods 0.000 description 9
- 230000011664 signaling Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010033864 Paranoia Diseases 0.000 description 1
- 208000027099 Paranoid disease Diseases 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/043—Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Automation & Control Theory (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Mathematics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种出行未来轨迹预测方法,包括:将出行原始轨迹数据输入模型中;从所述模型中获取出行未来轨迹预测结果,所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的,所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论,将所述原始轨迹数据模糊处理后提取的轨迹片段集合。该方法实现更加精确的移动对象轨迹位置预测,从而为智慧城市、基于位置的服务、个性化信息推荐和交通规划等应用提供支持。
Description
技术领域
本发明涉及城市交通技术领域,具体涉及一种出行未来轨迹预测方法、装置、储存介质及电子设备。
背景技术
人类出行具有93%的可预测性,人类在地理空间上的活动与移动也呈现出高时空动态变化的特征。挖掘人类出行历史轨迹隐含的规律,预测人类出行过程中在未来某个时间可能所在的位置,既是缺失轨迹数据内插填补的需求,可为探索城市居民活动规律、优化公共资源配置、指导商业设施选择、制定公共安全应急预案等提供重要科学依据,也可为城市规划、城市管理、智能交通、基于位置的信息服务、商业广告投放等应用提供支撑,并为城市动力学与群体行为模式分析等社会学研究提供辅助。
近年来,移动定位技术迅猛发展。移动定位技术包括导航卫星定位技术、移动通讯网络定位技术、混合定位技术、室内定位技术。卫星定位技术包括美国的全球定位系统(Global Positioning System,GPS)、俄罗斯的全球导航卫星系统(GLONASS)、我国的北斗卫星导航系统、正在建设的欧洲Galileo卫星导航定位系统、伪卫星定位技术等。移动通讯网络定位技术包括Cell-ID、AFLT(Advanced Forward Link Trilateration)、基于信号到达时间的定位(Time of Arrival,TOA)、信号到达时间差定位(Time Different ofArrival,TDOA)、基于角度测量的定位技术(Angle of Arrival,AOA)和增强型观察时间差(Enhanced Observed Time Difference,E-OTD)等。混合定位技术采用导航卫星信号与移动通信信号联合定位方法,如A-GPS和GPSOne技术。室内定位技术包括WiFi定位技术、射频识别(Radio Frequency Identification,RFID)定位技术、蓝牙或NFC(Near FieldCommunication)定位技术、ZigBee定位技术、UWB(Ultra-Wideband)定位技术、超声波定位技术、影像匹配与条码定位技术、地磁定位技术等。内置GPS模块或者WiFi/Cell-ID定位接口的移动终端,如PDA、智能手机、平板电脑等用户规模不断扩大,移动终端操作系统平台(Android、iOS、Windows Phone)不断渗透到各行各业,昭示着移动互联网时代的来临,并正在向物联网时代迈进。随着移动互联网设施的不断完善和第三代/第四代通信网络(3G/4G)的不断发展,基于位置的服务(Location Based Services,LBS)应用如在线导航、基于位置的社交网络、基于位置的广告推送、商业物流调度与管理、车联网等用户规模和功能需求不断增长,人类出行轨迹数据爆发式增长。
例如截止2013年底,中国移动电话用户数达11.06亿,移动设备普及率约81.3%,其中上海等特大城市移动设备普及率已达到126%。移动通讯信令数据准确记录了移动通讯用户在移动通讯网络中活动时的通讯基站位置和活动的相关信息。当移动通讯终端产生开关机、通话或收发短信、访问移动互联网、甚至基站切换行为时,用户所关联的蜂窝基站及时间将被保存在信令数据中,辅之以蜂窝基站的精确坐标及其多个基站的信号交会方法,可以获取误差范围在市区500m、郊区1000m以内的用户位置信息。移动通讯信令数据较全面地反映了用户的连续出行轨迹,具有样本数量庞大、样本相对其他数据源无偏性较好,且支持定位精度以上多时空尺度自由切分的数据特点,为人类出行未来位置预测提供了数据基础。
发明内容
(一)发明目的
本发明的目的是提供一种出行未来轨迹预测方法、装置、储存介质及电子设备以解决现有出行未来轨迹预测准确率低的问题。
(二)技术方案
为解决上述问题,本发明的第一方面提供了一种出行未来轨迹预测方法,包括:
将出行原始轨迹数据输入模型中;
从所述模型中获取出行未来轨迹预测结果,所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的,所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论,将所述原始轨迹数据模糊处理后提取的轨迹片段集合。
进一步地,所述周期性训练数据集和所述邻近性训练数据集生成步骤包括:
将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集;
根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集;
利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段,并对所述轨迹片段进行特征标识,形成周期性训练数据集与邻近性数据集。
进一步地,所述将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集包括:
利用固定格网将所述原始轨迹数据的地理空间分成不同空间区域;
将所述原始轨迹数据中轨迹的坐标点映射到所述空间区域中,得到出行格网化数据集。
进一步地,所述根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集包括:
将网格化的地理空间划分为明确空间和模糊空间;
当所述出行轨迹点落入所述明确空间时,该轨迹点完全隶属于其所在格网;而当所述轨迹点落入模糊空间时,该轨迹点隶属于距离其最近四个格网,进而将所述原始轨迹数据构建成模糊空间轨迹数据集。
进一步地,所述模型为Fuzzy-LSTM模型。
根据本发明的另一方面,提供一种出行未来轨迹预测装置,包括:
识别模块,用于将出行原始轨迹数据输入模型中;
预测模块,用于从所述模型中获取出行未来轨迹预测结果,所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的,所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论,将所述原始轨迹数据模糊处理后提取的轨迹片段集合。
进一步地,所述预测模块包括:
网格化模块,用于将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集;
模糊化模块,用于根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集;
轨迹片段提取模块,用于利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段,并对所述轨迹片段进行特征标识,形成周期性训练数据集与邻近性数据集。
进一步地,网格化模块包括:
区域划分模块,用于利用固定格网将所述原始轨迹数据的地理空间分成不同空间区域;
坐标映射模块,用于将所述原始轨迹数据中轨迹的坐标点映射到所述空间区域中,得到出行格网化数据集。
进一步地,所述模糊化模块包括:
空间划分模块,用于将网格化的地理空间划分为明确空间和模糊空间;
隶属关系模块,用于当所述出行轨迹点落入所述明确空间时,该轨迹点完全隶属于其所在格网;而当所述轨迹点落入模糊空间时,该轨迹点隶属于距离其最近四个格网,进而将所述原始轨迹数据构建成模糊空间轨迹数据集。
进一步地,所述模型为Fuzzy-LSTM模型。
根据本发明的又一方面,提供一种计算机存储介质,所述存储介质上存储有计算机程序,所述程序被处理器执行时实现上述方案中任意一项所述的方法步骤。
根据本发明的又一方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方案中任意一项所述的方法步骤。
(三)有益效果
本发明的上述技术方案具有如下有益的技术效果:
通过利用处理后的轨迹片段对模型训练,再依靠改模型对出行未来轨迹的预测,可以得到更加精确的出行轨迹位置预测,从而为智慧城市、基于位置的服务、个性化信息推荐和交通规划等应用提供支持。
附图说明
图1是根据本发明第一实施方式的出行未来轨迹预测方法流程图;
图2是根据本发明一具体实施方式的手机信令数据空间分布图;
图3是根据本发明一具体实施方式的预测准确率比较图;
图4是根据本发明一具体实施方式不同时段出行位置预测准确率比较图;
图5是根据本发明一可选实施方式的出行格网轨迹图;
图6是根据本发明一可选实施方式的模糊空间划分图;
图7是根据本发明一可选实施方式的出行模糊轨迹点图;
图8是根据本发明一可选实施方式的模糊子轨迹图;
图9是根据本发明一可选实施方式的Fuzzy-LSTM模型人类出行位置预测图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
如图1所示,本发明的第一方面提供了一种出行未来轨迹预测方法,包括:
S1:将出行原始轨迹数据输入模型中;
S2:从模型中获取出行未来轨迹预测结果;模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的;周期性训练数据集和邻近性训练数据集是基于模糊集合理论,将原始轨迹数据模糊处理后提取的轨迹片段集合。
通过综合考虑移动对象历史轨迹邻近性和周期性,基于长期依赖信息的学习过程,实现更加精确的移动对象轨迹位置预测。
可选的,所述周期性训练数据集和所述邻近性训练数据集生成步骤包括:
将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集;
根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集;
利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段,并对所述轨迹片段进行特征标识,形成周期性训练数据集与邻近性数据集。
通过模糊空间隶属度解决确定性格网剖分导致的轨迹点尖锐边界问题,并对长短时记忆神经网络进行改进,综合考虑移动对象历史轨迹邻近性和周期性,基于长期依赖信息的学习过程,实现更加精确的移动对象轨迹位置预测。
可选的,所述将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集包括:
利用固定格网将所述原始轨迹数据的地理空间分成不同空间区域;
将所述原始轨迹数据中轨迹的坐标点映射到所述空间区域中,得到出行格网化数据集。
可选的,所述根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集包括:
将网格化的地理空间划分为明确空间和模糊空间;
当所述出行轨迹点落入所述明确空间时,该轨迹点完全隶属于其所在格网;而当所述轨迹点落入模糊空间时,该轨迹点隶属于距离其最近四个格网,进而将所述原始轨迹数据构建成模糊空间轨迹数据集。
可选的,所述模型为Fuzzy-LSTM模型。
在本发明一具体实施例中,为验证本发明专利的效率与精度效果,发明验证所使用的数据为上海市10万移动通讯用户连续15个工作日的手机信令数据,每个用户每天的出行轨迹为一条完整的轨迹停留点记录,共计150万条真实轨迹数据。轨迹点定位精度在市区约100至500米、郊区约400至1000米,平均记录时间间隔约20分钟。该数据集良好地反映了人类出行的真实运动行为,具有一定的代表性。其轨迹线空间累积分布如图2所示,与该市人口分布高度一致。数据格式如表1所示。实验硬件平台为Intel(R)Core(TM)i7-3770,3.40GHZ CPU,16GB内存,操作系统为Windows 7,实现语言为Python。
表1手机信令数据示例
为了便于比较发明专利效果,本发明专利采用如下的评价指标:
为了验证本发明的效果,本专利选择的对比实验为:
(2)NLPMM位置预测方法,为经典的基于马尔科夫模型人类出行位置预测算法,该方法综合考虑人类出行个体和群体的行为模式,分别针对人类出行移动个体和群体轨迹构建马尔科夫模型,并采用线性回归对模型进行融合,从而预测移动对象下一时刻所在位置。
本发明专利实验结果对比如图所示:
图3为本发明专利预测准确率评价预测性能,本发明专利方法预测准确率为83.98%,较-LSTM算法和NLPMM算法分别高出4.36%和6.95%。本发明专利方法和-LSTM方法预测准确率均高于NLPMM方法,是因为在预测过程中考虑了长期依赖信息,提高了算法的预测性能;同时改进后的本发明专利方法预测准确率优于-LSTM方法和NLPMM方法,说明考虑模糊空间隶属度和移动对象轨迹周期性影响有利于提高轨迹预测算法性能。
图4为本发明专利方法在不同时段的轨迹预测准确率,依据统计结果,出行位置平均预测准确率依次为78.8%(早高峰)、76.19%(晚高峰)、75.84(日间平峰)、91.29%(夜间平峰)。由于白天人群不规律出行较多,预测准确率相对较低;而夜晚轨迹预测准确率较高。
在本发明的一可选实施例中,提供了一种出行位置预测方法,包括以下步骤:
步骤101.获取人类出行原始轨迹数据,对数据进行存储和预处理;
步骤102.将地理空间格网化剖分成不同的空间区域,构建人类出行格网化数据集G_Traj;
步骤103.将格网划分为明确空间和模糊空间,计算单个轨迹点pi可能与格网空间单元si的临近空间单元集合sset都存在隶属关系,构建模糊空间轨迹数据集F_Traj;
步骤104.利用递增滑动窗数据构建方法提取轨迹片段,并进行特征标识,构建人类出行周期性训练数据集Trajp与邻近性数据集Trajc;
步骤105.构建Fuzzy-LSTM人类出行预测轨迹模型,利用训练数据集对该模型进行训练,对人类出行未来位置进行预测;
步骤106.人类出行位置预测结果集Trajresult;
下面进一步以上海市真实手机信令数据举例详细说明本发明实施例的实际应用过程。
本实施例在以本实施方式为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例,本实施例的具体过程包括以下的步骤:
步骤201,获取低采样率人类出行原始轨迹数据集Dcdr,具体数据格式为:数据集Dcdr,且Dcdr={traj1,traj2,…,trajq},traj={gpsfile1,gpsfile2,…,gpsfilen},其中,gpsfilei={ptl,pt2,…,ptn},其中,n是集合中轨迹点的数目,pti是第i个轨迹点,可用一个三元组表示,即,pti={lati,loni,timestampi},表示在某一时刻手机用户的经纬度。Dcdr可以根据需要采用gpx、kml、plt和log等格式。为实现对海量原始轨迹数据分布式存储,在该实施例案例中采用的数据库为MongoDB集群,实现通过非结构化方式进行数据的逻辑存储与管理。在实际的存储方案中采用了数据库的自动分片策略,分布式集群处理模型采用MapReduce模型,从而实现利用分布式计算环境和存储结构进行手机话单轨迹数据的物理存储与处理。
步骤202,人类出行轨迹数据的格网剖分方法以为正方形、三角形、六边形等,本专利不限定具体格网剖分方法,地理空间被被固定格网剖分成不同的空间区域,轨迹的单个坐标点pi被映射到所在的空间区域si,原始轨迹Traj可被转化后格网区域序列定义为格网轨迹G_Traj,表示为:
G_Traj={(s1,t1),(s2,t2),...,(sn,tn)}
其中,ti表示时间,ti<ti+1;si表示轨迹点pi映射到格网空间上后对应的格网编号。如图5所示,轨迹trajm={(p1,t1),(p2,t2),...,(p6,t6)}对应的格网轨迹为g_trajm={(s1,t1),(s2,t2),...,(s6,t6)}.
步骤203,传统确定性格网轨迹G_Traj中,轨迹点pi及所对应的格网空间单元si之间是一一映射关系,但真实环境中,单个轨迹点pi可能与si的临近空间单元集合sset都存在隶属关系,借鉴模糊集合理论,将格网划分为明确空间和模糊空间。如图6所示,格网圆形之内部分定义为明确空间,圆形之外的部分定义为模糊空间。当轨迹点落入明确空间时,该轨迹点完全隶属于其所在格网;而当轨迹点落入模糊空间时,定义该轨迹点隶属于距离其最近四个格网。
当给定一系列格网S={s1,s2,s3,...,sj}和轨迹点pi,可以依据式1、2计算其模糊空间隶属度:
其中,Ci,j为模糊空间隶属度计算中间量,|pi-sj|代表轨迹点pi到格网sj的距离,r为明确空间半径,J为轨迹点邻近格网集合。在分别计算点到各格网的模糊空间隶属度中间量后,对其进行归一化,得到最终模糊空间隶属度Ci,j。
模糊空间隶属度为轨迹点pi到邻近的空间单元集sset的隶属程度cset,通过模糊隶属度函数A(x)计算,原始轨迹点pi可被映射到模糊格网点集fpi=(sset,cset)。
模糊轨迹由模糊空间格网点fpi组成的有序序列定义为模糊轨迹,表示为:
F_Traj={(fpi,1|a1),(fpi,2|a2),...,(fpi,m|an)}
其中,Sseqi为模糊序列集合,由轨迹内各点所隶属空间单元集合计算笛卡尔积生成;Cseqi为序列隶属度集合,由轨迹内各点所对应隶属空间单元的隶属度的乘积计算生成。以图7中轨迹traj1=(p1,p2)为例,其模糊轨迹为f_traj1={(s5s2|0.3),(s5s1|0.35),(s5s5|0.2),(s5s4|0.25)}。
步骤204,利用递增滑动窗数据构建方法提取轨迹片段,并进行特征标识,构建人类出行周期性训练数据集Trajp与邻近性数据集Trajc;
对一段子轨迹seqm,其模糊子轨迹可以用模糊子轨迹序列集合Sseqi和对应子轨迹序列隶属度集合Cseqi表示。如图8所示,模糊子轨迹序列集合Sseqi由子轨迹内各点所隶属空间单元集合计算笛卡尔积获取的序列集合,子轨迹隶属度集合Cseqi由轨迹内各点所对应隶属空间单元的隶属度的乘积计算生成。
步骤205,本发明专利需要根据上述模糊轨迹对模型神经元结构进行改进。其核心思想为将模糊子轨迹序列隶属度作为对应序列权重,与模糊子轨迹序列共同传入Fuzzy-LSTM神经网络,并在完成同一段模糊子轨迹训练后对神经网络权重进行更新。
Fuzzy-LSTM轨迹预测模型基于移动对象历史轨迹预测移动对象下一位置,其计算过程主要受忘记门层、输入门层、输出门层三部分控制,并由细胞状态记录移动对象历史轨迹信息。当输入新的移动对象位置时,需要遗忘部分旧位置信息。此过程通过忘记门层完成。该门层依次读取模糊子轨迹序列Sseqt、对应子轨迹序列隶属度Cseqt和上一时刻输出ht-1,输出取值范围为[0,1]的值给细胞状态Ct-1。其中1代表保留全部信息,0表示遗忘全部信息。在轨迹预测问题中,该过程表示当模型接收到新的模糊子轨迹时,需要确定其对原有轨迹信息保留程度。计算过程如下所示:
ft=α(Cseqt*wf*[ht-1,Sseqt」+bf)
其中,ft表示t时刻忘记门层,ht-1表示t-1时刻模型输出值,α表示sigmod函数,Cseqt为t时刻输入的模糊子轨迹序列的空间隶属度,Wf为忘记门层权重矩阵,Sseqt为t时刻输入的模糊子轨迹序列,bf为忘记门层偏执项。
模型随后对新传入位置序列进行处理,主要由输入门层和细胞状态信息完成。当模型接受新位置序列时,需要通过输入门层决定更新值,并利用tanh函数作为激活函数创建细胞状态信息候选值向量。其计算过程如式所示:
it=α(Cseqt*Wi*[ht-1,Sseqt」+bi)
Ct=tanh(Cseqt*Wc*[ht-1,Sseqt]+bc)
确定模型输入和忘记门层后,模型将更新细胞状态。模型将忘记门层值与原有细胞状态相乘,并与候选值向量和输入向量的乘积求和,确定新的细胞状态。在轨迹预测问题中,该过程表示模型遗忘部分原有轨迹信息并接收新的模糊子轨迹的影响。计算过程如式所示:
Ct=ft*Ct-1+it*Ct
其中,Ct表示t时刻细胞状态,Ct-1表示t-1时刻细胞状态。
最后基于细胞状态确定模型输出,主要由输出门层完成。模型先通过sigmod函数作为激活函数确定细胞状态输出内容,并通过tanh函数处理确定输出内容。计算过程如式所示:
ot=α(Cseqt*Wo*[ht-1,Sseqt]+bo)
ht=ot*tanh(Ct)
其中,ot表示t时刻输出门层,Wo表示输出门层权重矩阵,bo为输出门层偏执项,ht为t时刻模型输出。
如图9所示,在对模型输出结果依据求和函数进行融合后,采用softmax函数为激活函数的全连接层将模型输出转换为固定维数的位置概率向量,通过损失函数训练Fuzzy-LSTM模型参数确定最终模型,在给定移动对象轨迹trajk和训练好的Fuzzy-LSTM模型后,新的邻近子轨迹和周期子轨迹将会被作为输入传输到训练好的模型中,输出概率最高的位置作为模型预测结果。
步骤206.人类出行位置预测重构结果集Trajresult,在给定所有轨迹段和训练的模型后,提取各个轨迹的所选特征将形成为具有相同维度的矢量,并采用训练后模型预测人类出行未来位置。
可见,本发明实施例一种人类出行未来位置预测方法,可以实现人类出行未来位置预测,为个性化位置信息服务推荐,解决人类出行数据稀疏性问题,人类出行行为特征分析的定量化分析提供了数据支撑,本发明可以直接应用于动态交通信息的发布,服务于地图网站系统、公共出行信息平台和移动位置服务。
需要说明的是,本发明实施例的方法适用于所有人类出行位置预测过程;本发明不限制具体的城市范围及具体的手机信令数据提供商。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如:ROM/RAM、磁碟、光盘等。
根据本发明的另一方面,提供一种出行未来轨迹预测装置,包括:
识别模块,用于将出行原始轨迹数据输入模型中;
预测模块,用于从所述模型中获取出行未来轨迹预测结果,所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的,所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论,将所述原始轨迹数据模糊处理后提取的轨迹片段集合。
可选的,所述预测模块包括:
网格化模块,用于将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集;
模糊化模块,用于根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集;
轨迹片段提取模块,用于利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段,并对所述轨迹片段进行特征标识,形成周期性训练数据集与邻近性数据集。
可选的,网格化模块包括:
区域划分模块,用于利用固定格网将所述原始轨迹数据的地理空间分成不同空间区域;
坐标映射模块,用于将所述原始轨迹数据中轨迹的坐标点映射到所述空间区域中,得到出行格网化数据集。
可选的,所述模糊化模块包括:
空间划分模块,用于将网格化的地理空间划分为明确空间和模糊空间;
隶属关系模块,用于当所述出行轨迹点落入所述明确空间时,该轨迹点完全隶属于其所在格网;而当所述轨迹点落入模糊空间时,该轨迹点隶属于距离其最近四个格网,进而将所述原始轨迹数据构建成模糊空间轨迹数据集。
可选的,所述模型为Fuzzy-LSTM模型。
根据本发明的又一方面,提供一种计算机存储介质,所述存储介质上存储有计算机程序,所述程序被处理器执行时实现上述方案中任意一项所述的方法步骤。
根据本发明的又一方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方案中任意一项所述的方法步骤。
本发明旨在保护一种出行未来轨迹预测方法,包括:将出行原始轨迹数据输入模型中;从所述模型中获取出行未来轨迹预测结果,所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的,所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论,将所述原始轨迹数据模糊处理后提取的轨迹片段集合。该方法实现更加精确的移动对象轨迹位置预测,从而为智慧城市、基于位置的服务、个性化信息推荐和交通规划等应用提供支持。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (8)
1.一种出行未来轨迹预测方法,其特征在于,包括:
将出行原始夜晚轨迹数据输入模型中,所述模型为Fuzzy-LSTM模型,所述Fuzzy-LSTM模型的激活函数为softmax函数,在softmax函数基础之上,将模糊集合Cseqt加入计算,来解决模型训练时间过长的问题,所述出行原始夜晚轨迹数据储存于MongoDB集群,并利用MapReduce模型将所述出行原始夜晚轨迹数据进行分布式集群处理;
从所述模型中获取出行未来轨迹预测结果,所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的,所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论,将所述原始轨迹数据模糊处理后提取的轨迹片段集合,所述周期性训练数据集和所述邻近性训练数据集生成步骤包括:将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集;根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,利用归一化方法将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集;利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段,并对所述轨迹片段进行特征标识,形成周期性训练数据集与邻近性数据集。
2.根据权利要求1所述的方法,其特征在于,所述将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集包括:
利用固定格网将所述原始轨迹数据的地理空间分成不同空间区域;
将所述原始轨迹数据中轨迹的坐标点映射到所述空间区域中,得到出行格网化数据集。
3.根据权利要求1所述的方法,其特征在于,所述根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集包括:
将网格化的地理空间划分为明确空间和模糊空间;
当所述出行轨迹点落入所述明确空间时,该轨迹点完全隶属于其所在格网;而当所述轨迹点落入模糊空间时,该轨迹点隶属于距离其最近四个格网,进而将所述原始轨迹数据构建成模糊空间轨迹数据集。
4.一种出行未来轨迹预测装置,其特征在于,包括:
识别模块,用于将出行原始夜晚轨迹数据输入模型中,所述模型为Fuzzy-LSTM模型,所述Fuzzy-LSTM模型的激活函数为softmax函数,在softmax函数基础之上,将模糊集合Cseqt加入计算,来解决模型训练时间过长的问题,所述出行原始夜晚轨迹数据储存于MongoDB集群,并利用MapReduce模型将所述出行原始夜晚轨迹数据进行分布式集群处理;
预测模块,用于从所述模型中获取出行未来轨迹预测结果,所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的,所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论,将所述原始轨迹数据模糊处理后提取的轨迹片段集合,所述预测模块包括:网格化模块,用于将所述原始轨迹数据的地理空间网格化,得到出行格网化数据集;模糊化模块,用于根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系,利用归一化方法将所述原始轨迹数据模糊化,得到模糊空间轨迹数据集;轨迹片段提取模块,用于利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段,并对所述轨迹片段进行特征标识,形成周期性训练数据集与邻近性数据集。
5.根据权利要求4所述的装置,其特征在于,网格化模块包括:
区域划分模块,用于利用固定格网将所述原始轨迹数据的地理空间分成不同空间区域;
坐标映射模块,用于将所述原始轨迹数据中轨迹的坐标点映射到所述空间区域中,得到出行格网化数据集。
6.根据权利要求4所述的装置,其特征在于,所述模糊化模块包括:
空间划分模块,用于将网格化的地理空间划分为明确空间和模糊空间;
隶属关系模块,用于当所述出行轨迹点落入所述明确空间时,该轨迹点完全隶属于其所在格网;而当所述轨迹点落入模糊空间时,该轨迹点隶属于距离其最近四个格网,进而将所述原始轨迹数据构建成模糊空间轨迹数据集。
7.一种计算机存储介质,其特征在于,所述存储介质上存储有计算机程序,所述程序被处理器执行时实现权利要求1-3中任意一项所述的方法步骤。
8.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-3中任意一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910667629.4A CN110414732B (zh) | 2019-07-23 | 2019-07-23 | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910667629.4A CN110414732B (zh) | 2019-07-23 | 2019-07-23 | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110414732A CN110414732A (zh) | 2019-11-05 |
CN110414732B true CN110414732B (zh) | 2020-09-18 |
Family
ID=68362604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910667629.4A Active CN110414732B (zh) | 2019-07-23 | 2019-07-23 | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110414732B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI815367B (zh) * | 2021-03-25 | 2023-09-11 | 日商樂天集團股份有限公司 | 推定系統、推定方法、及程式產品 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110954105B (zh) * | 2019-11-26 | 2021-11-19 | 东软集团股份有限公司 | 车辆位置预测方法、装置、存储介质及电子设备 |
CN111194005A (zh) * | 2019-12-05 | 2020-05-22 | 中国科学院地理科学与资源研究所 | 一种室内行人语义位置提取方法及预测方法 |
CN113191173B (zh) * | 2020-01-14 | 2024-08-02 | 北京地平线机器人技术研发有限公司 | 一种训练数据获取方法及装置 |
CN111929715A (zh) * | 2020-06-28 | 2020-11-13 | 杭州云起智慧校园科技有限公司 | 一种用于校徽的定位方法、装置、设备及存储介质 |
CN111832225B (zh) * | 2020-07-07 | 2023-01-31 | 重庆邮电大学 | 一种构建汽车行驶工况的方法 |
CN113610307B (zh) * | 2021-08-12 | 2023-06-20 | 中国民用航空飞行学院 | 一种航班计划管理系统 |
CN113836316B (zh) * | 2021-09-23 | 2023-01-03 | 北京百度网讯科技有限公司 | 三元组数据的处理方法、训练方法、装置、设备及介质 |
CN113643542A (zh) * | 2021-10-13 | 2021-11-12 | 北京理工大学 | 基于集成学习的多车交互环境下车辆轨迹预测方法及系统 |
CN114071528B (zh) * | 2021-11-16 | 2023-06-27 | 北京邮电大学 | 基于业务需求预测的多波束卫星波束资源适配方法 |
CN116321007B (zh) * | 2023-03-13 | 2024-04-02 | 深圳市交投科技有限公司 | 出行目的预测方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108319928A (zh) * | 2018-02-28 | 2018-07-24 | 天津大学 | 一种基于多目标微粒群算法优化的深度学习模型及应用 |
CN109410575A (zh) * | 2018-10-29 | 2019-03-01 | 北京航空航天大学 | 一种基于胶囊网络和嵌套式长短时记忆神经网络的路网状态预测方法 |
CN109697504A (zh) * | 2018-11-09 | 2019-04-30 | 山东师范大学 | 基于直觉循环模糊神经网络的时间序列预测方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528720A (zh) * | 2016-11-02 | 2017-03-22 | 中铁程科技有限责任公司 | 换乘站推荐方法和换乘站推荐系统 |
CN109344247B (zh) * | 2018-09-29 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
-
2019
- 2019-07-23 CN CN201910667629.4A patent/CN110414732B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108319928A (zh) * | 2018-02-28 | 2018-07-24 | 天津大学 | 一种基于多目标微粒群算法优化的深度学习模型及应用 |
CN109410575A (zh) * | 2018-10-29 | 2019-03-01 | 北京航空航天大学 | 一种基于胶囊网络和嵌套式长短时记忆神经网络的路网状态预测方法 |
CN109697504A (zh) * | 2018-11-09 | 2019-04-30 | 山东师范大学 | 基于直觉循环模糊神经网络的时间序列预测方法及装置 |
Non-Patent Citations (1)
Title |
---|
Predicting future locations of moving objects with deep fuzzy-LSTM networks;Mingxiao Li et al.;《Transportmetrica A: Transport Science》;20181205;第2324-9943页 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI815367B (zh) * | 2021-03-25 | 2023-09-11 | 日商樂天集團股份有限公司 | 推定系統、推定方法、及程式產品 |
Also Published As
Publication number | Publication date |
---|---|
CN110414732A (zh) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110414732B (zh) | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 | |
Soh et al. | Adaptive deep learning-based air quality prediction model using the most relevant spatial-temporal relations | |
Chen et al. | Travel time prediction system based on data clustering for waste collection vehicles | |
Mohamed et al. | Accurate real-time map matching for challenging environments | |
Rong et al. | Du-parking: Spatio-temporal big data tells you realtime parking availability | |
US9904932B2 (en) | Analyzing semantic places and related data from a plurality of location data reports | |
CN109005515B (zh) | 一种基于移动轨迹信息的用户行为模式画像的方法 | |
Luca et al. | Deep learning for human mobility: a survey on data and models | |
CN106767835B (zh) | 定位方法和装置 | |
Jiang et al. | Deep ROI-based modeling for urban human mobility prediction | |
CN111212383B (zh) | 区域常住人口数量的确定方法、装置、服务器和介质 | |
Yu et al. | Extracting and predicting taxi hotspots in spatiotemporal dimensions using conditional generative adversarial neural networks | |
Rossi et al. | Vehicle trajectory prediction and generation using LSTM models and GANs | |
Li et al. | Robust inferences of travel paths from GPS trajectories | |
CN110598917B (zh) | 一种基于路径轨迹的目的地预测方法、系统及存储介质 | |
CN106339769A (zh) | 一种面向移动社会网络的用户出行预测方法 | |
CN111194005A (zh) | 一种室内行人语义位置提取方法及预测方法 | |
CN111242352A (zh) | 基于车辆轨迹的停等聚集效应预测方法 | |
Fang et al. | CityTracker: Citywide individual and crowd trajectory analysis using hidden Markov model | |
Qian et al. | Detecting taxi trajectory anomaly based on spatio-temporal relations | |
CN112699201B (zh) | 导航数据处理方法、装置、计算机设备和存储介质 | |
Chu et al. | Simulating human mobility with a trajectory generation framework based on diffusion model | |
Qian et al. | Vehicle trajectory modelling with consideration of distant neighbouring dependencies for destination prediction | |
CN113326877A (zh) | 模型训练、数据处理方法、装置、设备、存储介质及程序 | |
Terroso-Sáenz et al. | Human mobility prediction with region-based flows and water consumption |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |