CN110414732B

CN110414732B - 一种出行未来轨迹预测方法、装置、储存介质及电子设备

Info

Publication number: CN110414732B
Application number: CN201910667629.4A
Authority: CN
Inventors: 张恒才; 李明晓; 陆锋
Original assignee: Institute of Geographic Sciences and Natural Resources of CAS
Current assignee: Institute of Geographic Sciences and Natural Resources of CAS
Priority date: 2019-07-23
Filing date: 2019-07-23
Publication date: 2020-09-18
Anticipated expiration: 2039-07-23
Also published as: CN110414732A

Abstract

本发明公开了一种出行未来轨迹预测方法，包括：将出行原始轨迹数据输入模型中；从所述模型中获取出行未来轨迹预测结果，所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的，所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论，将所述原始轨迹数据模糊处理后提取的轨迹片段集合。该方法实现更加精确的移动对象轨迹位置预测，从而为智慧城市、基于位置的服务、个性化信息推荐和交通规划等应用提供支持。

Description

一种出行未来轨迹预测方法、装置、储存介质及电子设备

技术领域

本发明涉及城市交通技术领域，具体涉及一种出行未来轨迹预测方法、装置、储存介质及电子设备。

背景技术

人类出行具有93％的可预测性，人类在地理空间上的活动与移动也呈现出高时空动态变化的特征。挖掘人类出行历史轨迹隐含的规律，预测人类出行过程中在未来某个时间可能所在的位置，既是缺失轨迹数据内插填补的需求，可为探索城市居民活动规律、优化公共资源配置、指导商业设施选择、制定公共安全应急预案等提供重要科学依据，也可为城市规划、城市管理、智能交通、基于位置的信息服务、商业广告投放等应用提供支撑，并为城市动力学与群体行为模式分析等社会学研究提供辅助。

近年来，移动定位技术迅猛发展。移动定位技术包括导航卫星定位技术、移动通讯网络定位技术、混合定位技术、室内定位技术。卫星定位技术包括美国的全球定位系统(Global Positioning System,GPS)、俄罗斯的全球导航卫星系统(GLONASS)、我国的北斗卫星导航系统、正在建设的欧洲Galileo卫星导航定位系统、伪卫星定位技术等。移动通讯网络定位技术包括Cell-ID、AFLT(Advanced Forward Link Trilateration)、基于信号到达时间的定位(Time of Arrival,TOA)、信号到达时间差定位(Time Different ofArrival,TDOA)、基于角度测量的定位技术(Angle of Arrival,AOA)和增强型观察时间差(Enhanced Observed Time Difference,E-OTD)等。混合定位技术采用导航卫星信号与移动通信信号联合定位方法，如A-GPS和GPSOne技术。室内定位技术包括WiFi定位技术、射频识别(Radio Frequency Identification,RFID)定位技术、蓝牙或NFC(Near FieldCommunication)定位技术、ZigBee定位技术、UWB(Ultra-Wideband)定位技术、超声波定位技术、影像匹配与条码定位技术、地磁定位技术等。内置GPS模块或者WiFi/Cell-ID定位接口的移动终端，如PDA、智能手机、平板电脑等用户规模不断扩大，移动终端操作系统平台(Android、iOS、Windows Phone)不断渗透到各行各业，昭示着移动互联网时代的来临，并正在向物联网时代迈进。随着移动互联网设施的不断完善和第三代/第四代通信网络(3G/4G)的不断发展，基于位置的服务(Location Based Services,LBS)应用如在线导航、基于位置的社交网络、基于位置的广告推送、商业物流调度与管理、车联网等用户规模和功能需求不断增长，人类出行轨迹数据爆发式增长。

例如截止2013年底，中国移动电话用户数达11.06亿，移动设备普及率约81.3％，其中上海等特大城市移动设备普及率已达到126％。移动通讯信令数据准确记录了移动通讯用户在移动通讯网络中活动时的通讯基站位置和活动的相关信息。当移动通讯终端产生开关机、通话或收发短信、访问移动互联网、甚至基站切换行为时，用户所关联的蜂窝基站及时间将被保存在信令数据中，辅之以蜂窝基站的精确坐标及其多个基站的信号交会方法，可以获取误差范围在市区500m、郊区1000m以内的用户位置信息。移动通讯信令数据较全面地反映了用户的连续出行轨迹，具有样本数量庞大、样本相对其他数据源无偏性较好，且支持定位精度以上多时空尺度自由切分的数据特点，为人类出行未来位置预测提供了数据基础。

发明内容

(一)发明目的

本发明的目的是提供一种出行未来轨迹预测方法、装置、储存介质及电子设备以解决现有出行未来轨迹预测准确率低的问题。

(二)技术方案

为解决上述问题，本发明的第一方面提供了一种出行未来轨迹预测方法，包括：

将出行原始轨迹数据输入模型中；

从所述模型中获取出行未来轨迹预测结果，所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的，所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论，将所述原始轨迹数据模糊处理后提取的轨迹片段集合。

进一步地，所述周期性训练数据集和所述邻近性训练数据集生成步骤包括：

将所述原始轨迹数据的地理空间网格化，得到出行格网化数据集；

根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系，将所述原始轨迹数据模糊化，得到模糊空间轨迹数据集；

利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段，并对所述轨迹片段进行特征标识，形成周期性训练数据集与邻近性数据集。

进一步地，所述将所述原始轨迹数据的地理空间网格化，得到出行格网化数据集包括：

利用固定格网将所述原始轨迹数据的地理空间分成不同空间区域；

将所述原始轨迹数据中轨迹的坐标点映射到所述空间区域中，得到出行格网化数据集。

进一步地，所述根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系，将所述原始轨迹数据模糊化，得到模糊空间轨迹数据集包括：

将网格化的地理空间划分为明确空间和模糊空间；

当所述出行轨迹点落入所述明确空间时，该轨迹点完全隶属于其所在格网；而当所述轨迹点落入模糊空间时，该轨迹点隶属于距离其最近四个格网，进而将所述原始轨迹数据构建成模糊空间轨迹数据集。

进一步地，所述模型为Fuzzy-LSTM模型。

根据本发明的另一方面，提供一种出行未来轨迹预测装置，包括：

识别模块，用于将出行原始轨迹数据输入模型中；

预测模块，用于从所述模型中获取出行未来轨迹预测结果，所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的，所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论，将所述原始轨迹数据模糊处理后提取的轨迹片段集合。

进一步地，所述预测模块包括：

网格化模块，用于将所述原始轨迹数据的地理空间网格化，得到出行格网化数据集；

模糊化模块，用于根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系，将所述原始轨迹数据模糊化，得到模糊空间轨迹数据集；

轨迹片段提取模块，用于利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段，并对所述轨迹片段进行特征标识，形成周期性训练数据集与邻近性数据集。

进一步地，网格化模块包括：

区域划分模块，用于利用固定格网将所述原始轨迹数据的地理空间分成不同空间区域；

坐标映射模块，用于将所述原始轨迹数据中轨迹的坐标点映射到所述空间区域中，得到出行格网化数据集。

进一步地，所述模糊化模块包括：

空间划分模块，用于将网格化的地理空间划分为明确空间和模糊空间；

隶属关系模块，用于当所述出行轨迹点落入所述明确空间时，该轨迹点完全隶属于其所在格网；而当所述轨迹点落入模糊空间时，该轨迹点隶属于距离其最近四个格网，进而将所述原始轨迹数据构建成模糊空间轨迹数据集。

进一步地，所述模型为Fuzzy-LSTM模型。

根据本发明的又一方面，提供一种计算机存储介质，所述存储介质上存储有计算机程序，所述程序被处理器执行时实现上述方案中任意一项所述的方法步骤。

根据本发明的又一方面，提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方案中任意一项所述的方法步骤。

(三)有益效果

本发明的上述技术方案具有如下有益的技术效果：

通过利用处理后的轨迹片段对模型训练，再依靠改模型对出行未来轨迹的预测，可以得到更加精确的出行轨迹位置预测，从而为智慧城市、基于位置的服务、个性化信息推荐和交通规划等应用提供支持。

附图说明

图1是根据本发明第一实施方式的出行未来轨迹预测方法流程图；

图2是根据本发明一具体实施方式的手机信令数据空间分布图；

图3是根据本发明一具体实施方式的预测准确率比较图；

图4是根据本发明一具体实施方式不同时段出行位置预测准确率比较图；

图5是根据本发明一可选实施方式的出行格网轨迹图；

图6是根据本发明一可选实施方式的模糊空间划分图；

图7是根据本发明一可选实施方式的出行模糊轨迹点图；

图8是根据本发明一可选实施方式的模糊子轨迹图；

图9是根据本发明一可选实施方式的Fuzzy-LSTM模型人类出行位置预测图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

如图1所示，本发明的第一方面提供了一种出行未来轨迹预测方法，包括：

S1：将出行原始轨迹数据输入模型中；

S2：从模型中获取出行未来轨迹预测结果；模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的；周期性训练数据集和邻近性训练数据集是基于模糊集合理论，将原始轨迹数据模糊处理后提取的轨迹片段集合。

通过综合考虑移动对象历史轨迹邻近性和周期性，基于长期依赖信息的学习过程，实现更加精确的移动对象轨迹位置预测。

可选的，所述周期性训练数据集和所述邻近性训练数据集生成步骤包括：

通过模糊空间隶属度解决确定性格网剖分导致的轨迹点尖锐边界问题，并对长短时记忆神经网络进行改进，综合考虑移动对象历史轨迹邻近性和周期性，基于长期依赖信息的学习过程，实现更加精确的移动对象轨迹位置预测。

可选的，所述将所述原始轨迹数据的地理空间网格化，得到出行格网化数据集包括：

可选的，所述根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系，将所述原始轨迹数据模糊化，得到模糊空间轨迹数据集包括：

将网格化的地理空间划分为明确空间和模糊空间；

可选的，所述模型为Fuzzy-LSTM模型。

在本发明一具体实施例中，为验证本发明专利的效率与精度效果，发明验证所使用的数据为上海市10万移动通讯用户连续15个工作日的手机信令数据，每个用户每天的出行轨迹为一条完整的轨迹停留点记录，共计150万条真实轨迹数据。轨迹点定位精度在市区约100至500米、郊区约400至1000米，平均记录时间间隔约20分钟。该数据集良好地反映了人类出行的真实运动行为，具有一定的代表性。其轨迹线空间累积分布如图2所示，与该市人口分布高度一致。数据格式如表1所示。实验硬件平台为Intel(R)Core(TM)i7-3770,3.40GHZ CPU,16GB内存，操作系统为Windows 7，实现语言为Python。

表1手机信令数据示例

为了便于比较发明专利效果，本发明专利采用如下的评价指标：

(1)预测准确率：已知轨迹序列Traj_k＝<p₁，p₂，...，p_n>和预测轨迹序列

预测准确率计算为。

其中，

表示真实轨迹点到预测格网中心点的欧氏距离，γ表示距离阈值，

表示预测序列的长度。

为了验证本发明的效果，本专利选择的对比实验为：

(1)

-LSTM位置预测方法，采用原始LSTM模型进行人类出行轨迹预测。该方法能够解决预测中的长期依赖问题，并被广泛应用与时序数据预测领域；

(2)NLPMM位置预测方法，为经典的基于马尔科夫模型人类出行位置预测算法，该方法综合考虑人类出行个体和群体的行为模式，分别针对人类出行移动个体和群体轨迹构建马尔科夫模型，并采用线性回归对模型进行融合，从而预测移动对象下一时刻所在位置。

本发明专利实验结果对比如图所示：

图3为本发明专利预测准确率评价预测性能，本发明专利方法预测准确率为83.98％，较

-LSTM算法和NLPMM算法分别高出4.36％和6.95％。本发明专利方法和

-LSTM方法预测准确率均高于NLPMM方法，是因为在预测过程中考虑了长期依赖信息，提高了算法的预测性能；同时改进后的本发明专利方法预测准确率优于

-LSTM方法和NLPMM方法，说明考虑模糊空间隶属度和移动对象轨迹周期性影响有利于提高轨迹预测算法性能。

图4为本发明专利方法在不同时段的轨迹预测准确率，依据统计结果，出行位置平均预测准确率依次为78.8％(早高峰)、76.19％(晚高峰)、75.84(日间平峰)、91.29％(夜间平峰)。由于白天人群不规律出行较多，预测准确率相对较低；而夜晚轨迹预测准确率较高。

在本发明的一可选实施例中，提供了一种出行位置预测方法，包括以下步骤：

步骤101.获取人类出行原始轨迹数据，对数据进行存储和预处理；

步骤102.将地理空间格网化剖分成不同的空间区域，构建人类出行格网化数据集G_Traj；

步骤103.将格网划分为明确空间和模糊空间，计算单个轨迹点p_i可能与格网空间单元s_i的临近空间单元集合s_set都存在隶属关系，构建模糊空间轨迹数据集F_Traj；

步骤104.利用递增滑动窗数据构建方法提取轨迹片段，并进行特征标识，构建人类出行周期性训练数据集Traj_p与邻近性数据集Traj_c；

步骤105.构建Fuzzy-LSTM人类出行预测轨迹模型，利用训练数据集对该模型进行训练，对人类出行未来位置进行预测；

步骤106.人类出行位置预测结果集Traj_result；

下面进一步以上海市真实手机信令数据举例详细说明本发明实施例的实际应用过程。

本实施例在以本实施方式为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例，本实施例的具体过程包括以下的步骤：

步骤201，获取低采样率人类出行原始轨迹数据集D_cdr，具体数据格式为：数据集D_cdr，且D_cdr＝{traj1，traj2，…，trajq}，traj＝{gpsfile1，gpsfile2，…，gpsfilen}，其中，gpsfile_i＝{ptl，pt2，…，ptn}，其中，n是集合中轨迹点的数目，pti是第i个轨迹点，可用一个三元组表示，即，pti＝{lati，loni，timestampi}，表示在某一时刻手机用户的经纬度。D_cdr可以根据需要采用gpx、kml、plt和log等格式。为实现对海量原始轨迹数据分布式存储，在该实施例案例中采用的数据库为MongoDB集群，实现通过非结构化方式进行数据的逻辑存储与管理。在实际的存储方案中采用了数据库的自动分片策略，分布式集群处理模型采用MapReduce模型，从而实现利用分布式计算环境和存储结构进行手机话单轨迹数据的物理存储与处理。

步骤202，人类出行轨迹数据的格网剖分方法以为正方形、三角形、六边形等，本专利不限定具体格网剖分方法，地理空间被被固定格网剖分成不同的空间区域，轨迹的单个坐标点p_i被映射到所在的空间区域s_i，原始轨迹Traj可被转化后格网区域序列定义为格网轨迹G_Traj，表示为：

G_Traj＝{(s₁，t₁)，(s₂，t₂)，...，(s_n，t_n)}

其中，t_i表示时间，

t_i＜t_i+1；s_i表示轨迹点p_i映射到格网空间上后对应的格网编号。如图5所示，轨迹traj_m＝{(p₁，t₁)，(p₂，t₂)，...，(p₆，t₆)}对应的格网轨迹为g_traj_m＝{(s₁，t₁)，(s₂，t₂)，...，(s₆，t₆)}.

步骤203，传统确定性格网轨迹G_Traj中，轨迹点p_i及所对应的格网空间单元s_i之间是一一映射关系，但真实环境中，单个轨迹点p_i可能与s_i的临近空间单元集合s_set都存在隶属关系，借鉴模糊集合理论，将格网划分为明确空间和模糊空间。如图6所示，格网圆形之内部分定义为明确空间，圆形之外的部分定义为模糊空间。当轨迹点落入明确空间时，该轨迹点完全隶属于其所在格网；而当轨迹点落入模糊空间时，定义该轨迹点隶属于距离其最近四个格网。

当给定一系列格网S＝{s₁，s₂，s₃，...，s_j}和轨迹点p_i，可以依据式1、2计算其模糊空间隶属度：

其中，C_i，j为模糊空间隶属度计算中间量，|p_i-s_j|代表轨迹点p_i到格网s_j的距离，r为明确空间半径，J为轨迹点邻近格网集合。在分别计算点到各格网的模糊空间隶属度中间量后，对其进行归一化，得到最终模糊空间隶属度C_i，j。

模糊空间隶属度为轨迹点p_i到邻近的空间单元集s_set的隶属程度c_set，通过模糊隶属度函数A(x)计算，原始轨迹点p_i可被映射到模糊格网点集f_pi＝(s_set，c_set)。

模糊轨迹由模糊空间格网点f_pi组成的有序序列定义为模糊轨迹，表示为：

F_Traj＝{(f_pi，1|a₁)，(f_pi，2|a₂)，...，(f_pi，m|a_n)}

其中，Sseq_i为模糊序列集合，由轨迹内各点所隶属空间单元集合计算笛卡尔积生成；Cseq_i为序列隶属度集合，由轨迹内各点所对应隶属空间单元的隶属度的乘积计算生成。以图7中轨迹traj₁＝(p₁，p₂)为例，其模糊轨迹为f_traj₁＝{(s₅s₂|0.3)，(s₅s₁|0.35)，(s₅s₅|0.2)，(s₅s₄|0.25)}。

步骤204，利用递增滑动窗数据构建方法提取轨迹片段，并进行特征标识，构建人类出行周期性训练数据集Traj_p与邻近性数据集Traj_c；

对一段子轨迹seq_m，其模糊子轨迹可以用模糊子轨迹序列集合Sseq_i和对应子轨迹序列隶属度集合Cseq_i表示。如图8所示，模糊子轨迹序列集合Sseq_i由子轨迹内各点所隶属空间单元集合计算笛卡尔积获取的序列集合，子轨迹隶属度集合Cseq_i由轨迹内各点所对应隶属空间单元的隶属度的乘积计算生成。

构建人类出行周期性训练数据集

用以刻画周期性子轨迹的影响；构建人类出行邻近性训练数据集

用以刻画邻近性模糊子轨迹的影响。

步骤205，本发明专利需要根据上述模糊轨迹对模型神经元结构进行改进。其核心思想为将模糊子轨迹序列隶属度作为对应序列权重，与模糊子轨迹序列共同传入Fuzzy-LSTM神经网络，并在完成同一段模糊子轨迹训练后对神经网络权重进行更新。

Fuzzy-LSTM轨迹预测模型基于移动对象历史轨迹预测移动对象下一位置，其计算过程主要受忘记门层、输入门层、输出门层三部分控制，并由细胞状态记录移动对象历史轨迹信息。当输入新的移动对象位置时，需要遗忘部分旧位置信息。此过程通过忘记门层完成。该门层依次读取模糊子轨迹序列Sseq_t、对应子轨迹序列隶属度Cseq_t和上一时刻输出h_t-1，输出取值范围为[0，1]的值给细胞状态C_t-1。其中1代表保留全部信息，0表示遗忘全部信息。在轨迹预测问题中，该过程表示当模型接收到新的模糊子轨迹时，需要确定其对原有轨迹信息保留程度。计算过程如下所示：

f_t＝α(Cseq_t*w_f*[h_t-1，Sseq_t」+b_f)

其中，f_t表示t时刻忘记门层，h_t-1表示t-1时刻模型输出值，α表示sigmod函数，Cseq_t为t时刻输入的模糊子轨迹序列的空间隶属度，W_f为忘记门层权重矩阵，Sseq_t为t时刻输入的模糊子轨迹序列，b_f为忘记门层偏执项。

模型随后对新传入位置序列进行处理，主要由输入门层和细胞状态信息完成。当模型接受新位置序列时，需要通过输入门层决定更新值，并利用tanh函数作为激活函数创建细胞状态信息候选值向量。其计算过程如式所示：

i_t＝α(Cseq_t*W_i*[h_t-1，Sseq_t」+b_i)

C_t＝tanh(Cseq_t*W_c*[h_t-1，Sseq_t]+b_c)

其中，i_t表示t时刻输入门层，tanh表示tanh函数，W_i、W_c为输入门层、细胞状态权重矩阵，

为t时刻输入的细胞状态，b_i、b_c为输入门层及细胞状态对应偏执项。

确定模型输入和忘记门层后，模型将更新细胞状态。模型将忘记门层值与原有细胞状态相乘，并与候选值向量和输入向量的乘积求和，确定新的细胞状态。在轨迹预测问题中，该过程表示模型遗忘部分原有轨迹信息并接收新的模糊子轨迹的影响。计算过程如式所示：

C_t＝f_t*C_t-1+i_t*C_t

其中，C_t表示t时刻细胞状态，C_t-1表示t-1时刻细胞状态。

最后基于细胞状态确定模型输出，主要由输出门层完成。模型先通过sigmod函数作为激活函数确定细胞状态输出内容，并通过tanh函数处理确定输出内容。计算过程如式所示：

o_t＝α(Cseq_t*W_o*[h_t-1，Sseq_t]+b_o)

h_t＝o_t*tanh(C_t)

其中，o_t表示t时刻输出门层，W_o表示输出门层权重矩阵，b_o为输出门层偏执项，h_t为t时刻模型输出。

如图9所示，在对模型输出结果依据求和函数进行融合后，采用softmax函数为激活函数的全连接层将模型输出转换为固定维数的位置概率向量，通过损失函数训练Fuzzy-LSTM模型参数确定最终模型，在给定移动对象轨迹traj_k和训练好的Fuzzy-LSTM模型后，新的邻近子轨迹和周期子轨迹将会被作为输入传输到训练好的模型中，输出概率最高的位置作为模型预测结果。

步骤206.人类出行位置预测重构结果集Traj_result，在给定所有轨迹段和训练的模型后，提取各个轨迹的所选特征将形成为具有相同维度的矢量，并采用训练后模型预测人类出行未来位置。

可见，本发明实施例一种人类出行未来位置预测方法，可以实现人类出行未来位置预测，为个性化位置信息服务推荐，解决人类出行数据稀疏性问题，人类出行行为特征分析的定量化分析提供了数据支撑，本发明可以直接应用于动态交通信息的发布，服务于地图网站系统、公共出行信息平台和移动位置服务。

需要说明的是，本发明实施例的方法适用于所有人类出行位置预测过程；本发明不限制具体的城市范围及具体的手机信令数据提供商。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于一计算机可读取存储介质中，所述的存储介质，如：ROM/RAM、磁碟、光盘等。

识别模块，用于将出行原始轨迹数据输入模型中；

可选的，所述预测模块包括：

可选的，网格化模块包括：

可选的，所述模糊化模块包括：

可选的，所述模型为Fuzzy-LSTM模型。

本发明旨在保护一种出行未来轨迹预测方法，包括：将出行原始轨迹数据输入模型中；从所述模型中获取出行未来轨迹预测结果，所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的，所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论，将所述原始轨迹数据模糊处理后提取的轨迹片段集合。该方法实现更加精确的移动对象轨迹位置预测，从而为智慧城市、基于位置的服务、个性化信息推荐和交通规划等应用提供支持。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims

1.一种出行未来轨迹预测方法，其特征在于，包括：

将出行原始夜晚轨迹数据输入模型中，所述模型为Fuzzy-LSTM模型，所述Fuzzy-LSTM模型的激活函数为softmax函数，在softmax函数基础之上，将模糊集合Cseq_t加入计算，来解决模型训练时间过长的问题，所述出行原始夜晚轨迹数据储存于MongoDB集群，并利用MapReduce模型将所述出行原始夜晚轨迹数据进行分布式集群处理；

从所述模型中获取出行未来轨迹预测结果，所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的，所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论，将所述原始轨迹数据模糊处理后提取的轨迹片段集合，所述周期性训练数据集和所述邻近性训练数据集生成步骤包括：将所述原始轨迹数据的地理空间网格化，得到出行格网化数据集；根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系，利用归一化方法将所述原始轨迹数据模糊化，得到模糊空间轨迹数据集；利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段，并对所述轨迹片段进行特征标识，形成周期性训练数据集与邻近性数据集。

2.根据权利要求1所述的方法，其特征在于，所述将所述原始轨迹数据的地理空间网格化，得到出行格网化数据集包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系，将所述原始轨迹数据模糊化，得到模糊空间轨迹数据集包括：

将网格化的地理空间划分为明确空间和模糊空间；

4.一种出行未来轨迹预测装置，其特征在于，包括：

识别模块，用于将出行原始夜晚轨迹数据输入模型中，所述模型为Fuzzy-LSTM模型，所述Fuzzy-LSTM模型的激活函数为softmax函数，在softmax函数基础之上，将模糊集合Cseq_t加入计算，来解决模型训练时间过长的问题，所述出行原始夜晚轨迹数据储存于MongoDB集群，并利用MapReduce模型将所述出行原始夜晚轨迹数据进行分布式集群处理；

预测模块，用于从所述模型中获取出行未来轨迹预测结果，所述模型是通过出行周期性训练数据集和出行邻近性训练数据集训练得出的，所述周期性训练数据集和所述邻近性训练数据集是基于模糊集合理论，将所述原始轨迹数据模糊处理后提取的轨迹片段集合，所述预测模块包括：网格化模块，用于将所述原始轨迹数据的地理空间网格化，得到出行格网化数据集；模糊化模块，用于根据所述原始轨迹数据的单个出行轨迹点与所述网格化数据集的隶属关系，利用归一化方法将所述原始轨迹数据模糊化，得到模糊空间轨迹数据集；轨迹片段提取模块，用于利用滑动窗数据构建方法提取所述模糊空间轨迹数据集的轨迹片段，并对所述轨迹片段进行特征标识，形成周期性训练数据集与邻近性数据集。

5.根据权利要求4所述的装置，其特征在于，网格化模块包括：

6.根据权利要求4所述的装置，其特征在于，所述模糊化模块包括：

7.一种计算机存储介质，其特征在于，所述存储介质上存储有计算机程序，所述程序被处理器执行时实现权利要求1-3中任意一项所述的方法步骤。

8.一种电子设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1-3中任意一项所述的方法步骤。