CN112862155A - 一种城市移动性预测方法及预测系统 - Google Patents

一种城市移动性预测方法及预测系统 Download PDF

Info

Publication number
CN112862155A
CN112862155A CN202110006379.7A CN202110006379A CN112862155A CN 112862155 A CN112862155 A CN 112862155A CN 202110006379 A CN202110006379 A CN 202110006379A CN 112862155 A CN112862155 A CN 112862155A
Authority
CN
China
Prior art keywords
vector
data
hot
city
urban
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110006379.7A
Other languages
English (en)
Inventor
陶铭
孙庚�
李学强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan University of Technology
Original Assignee
Dongguan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan University of Technology filed Critical Dongguan University of Technology
Priority to CN202110006379.7A priority Critical patent/CN112862155A/zh
Publication of CN112862155A publication Critical patent/CN112862155A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于离散位置关系模型及长短期记忆网络的城市移动性预测方法,该方法包括:S1、依次采用过滤、分段、网格化及one‑hot编码技术对移动轨迹数据进行预处理;S2、设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,同时将具有高维且没有相对位置信息的one‑hot表示向量转换为包含位置之间关系信息的低维嵌入向量;S3、将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,并对城市个体的移动行为进行预测;本发明还公开了一种城市移动性预测系统,本发明进一步保证了城市移动个体未来位置预测的实时性和精准性,可广泛应用于城市移动个体对服务质量要求较高的场景。

Description

一种城市移动性预测方法及预测系统
技术领域
本发明涉及网络技术领域,特别是涉及一种城市移动性预测方法及预测系统。
背景技术
目前,针对城市移动性预测的主要研究思想是根据移动物体的历史移动数据预测下一个移动位置。主流的研究方法主要分为三类:基于当前位置的预测,基于用户历史移动数据的预测以及基于人类社交活动的预测。这三类主流的预测方法在某些领域具有很好的效果,但是不适用于位置粒度较小且对预测精度要求很高的场景。主要体现在如下几个方面:(1)现有方法在处理轨迹数据时通过聚类或其他技术手段忽略了中间位置,使得位置数据变小;(2)当位置数量很大时,现有方法存在维度灾难的问题,甚至无法建模;(3)当轨迹数据较长时,现有方法将丢失先前的重要信息并影响预测结果;(4)现有方法将位置表示为独立点,忽略了位置之间的关系,导致预测结果是离散的。
由此可知,现有技术和方法还有待于进一步的改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术和方法的上述缺陷,提供一种基于离散位置关系模型及长短期记忆网络的城市移动性预测方法及预测系统,其实时精准预测城市移动个体的未来位置,据此为城市移动个体提供更高质量的服务。
为实现上述目的,本发明提供了一种城市移动性预测方法,包括以下步骤:
S1、依次采用过滤、分段、网格化及one-hot编码技术对移动轨迹数据进行预处理;
S2、设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,克服位置粒度小的时候数据量特别大的问题,同时将具有高维且没有相对位置信息的one-hot表示向量转换为包含位置之间关系信息的低维嵌入向量;
S3、将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,并对城市个体的移动行为进行预测。
优选的,所述步骤S1具体包括:
S11、通过对所述城市个体的移动轨迹的分析,轨迹数据可以抽象表示为T={<l1,t1>,<l2,t2>,...,<lk,tk>},其中li是GPS数据,ti是GPS数据采集时间,k是轨迹序列的长度;
S12、将满足
Figure BDA0002883576970000021
的轨迹进行过滤;
S13、采用时间阈值δt来对数据分段;对于轨迹T={<l1,t1>,<l2,t2>,...,<lk,tk>},如果存在采集时间间隔ti+1-ti>δt,那么该轨迹将会分段为T1={<l1,t1>,<l2,t2>,...,<li,ti>}与T2={<li+1,ti+1>,<li+2,ti+2>,...,<lk,tk>};
S14、采用geohash编码网格化方法对轨迹数据进行抽象化处理,以获得细粒度的轨迹表示和预测结果;
S15、移动轨迹经网格化处理后,将离散数据转换为one-hot编码,即:将位置数据转换成长度为位置个数的向量,其中对应位置为1,剩余位置为0。
优选的,所述步骤S2具体包括:
S21、假设移动个体位置的geohash编码集合为Sgeo={Li|Li∈City and Li∈Stra},其中,City是属于城市区域位置的编码集合;Stra是由移动轨迹产生的编码集合。相邻集和为Sneibor={Li|Li is neighborhood to Lj,Lj∈Sgeo},总的geohash编码集合为Sallgeo=Sgeo∪Sneibor,one-hot编码的长度为n=count(Sallgeo),并且每个位置的one-hot编码对应一个m维的位置表示向量;
S22、假如当前位置编号为i,对应的one-hot向量为Li,周围的位置为{Lj,Lj+1,...,Lj+7},假设存在一个参数矩阵V∈Rn×m,则可根据公式pk=Lk×V,j≤k≤j+7计算周围每个位置的投影向量pk
S23、将周围位置的投影相加,得到第i个位置的嵌入向量
Figure BDA0002883576970000031
如果m远小于n,则ei的维度较低,不具有稀疏性且包含附近的网格信息;
S24、保留one-hot向量Li与嵌入向量ei的对应字典,假设存在另一个参数矩阵W=Rm×n,为提高模型的泛化能力,采用了softmax函数
Figure BDA0002883576970000032
将嵌入向量ei转化为n维one-hot向量;
S25、输出应该等于第i个位置的one-hot向量,即:
Figure BDA0002883576970000033
模型的均方误差为
Figure BDA0002883576970000034
优选的,所述步骤S3具体包括:
S31、将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,长短期记忆网络的输出是嵌入向量,采用
Figure BDA0002883576970000041
转换为one-hot向量,对城市个体的移动行为进行预测。
与现有技术相比,本发明提供的一种城市移动性预测方法的有益效果在于:
本方法是基于离散位置关系模型及长短期记忆网络的,其能够实时精准预测城市移动个体的未来位置,保证了城市移动个体未来位置预测的实时性和精准性,可广泛应用于城市移动个体对服务质量要求较高的场景,据此为城市移动个体提供更高质量的服务。
本发明还提供了一种城市移动性预测系统,其包括:
移动轨迹数据预处理模块,其依次采用过滤、分段、网格化及one-hot编码技术对移动轨迹数据进行预处理;
离散位置表示模块,设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,克服位置粒度小的时候数据量特别大的问题,其收集移动轨迹数据预处理模块预处理后的信息,同时将具有高维且没有相对位置信息的one-hot表示向量转换为包含位置之间关系信息的低维嵌入向量;
基于长短期记忆网络的移动预测模块,其收集离散位置表示模块低维嵌入向量,并对低维嵌入向量表示的轨迹数据进行训练,再对城市个体的移动行为进行预测。
优选的,所述移动轨迹数据预处理模块具体包括:
移动轨迹数据抽象表示单元,通过对所述城市个体的移动轨迹的分析,轨迹数据可以抽象表示为T={<l1,t1>,<l2,t2>,...,<lk,tk>},其中li是GPS数据,ti是GPS数据采集时间,k是轨迹序列的长度;
移动轨迹数据过滤单元,其将满足
Figure BDA0002883576970000051
的轨迹进行过滤;
移动轨迹数据分段单元,其采用时间阈值δt来对数据分段,对于轨迹T={<l1,t1>,<l2,t2>,...,<lk,tk>},如果存在采集时间间隔ti+1-ti>δt,那么该轨迹将会分段为T1={<l1,t1>,<l2,t2>,...,<li,ti>}与T2={<li+1,ti+1>,<li+2,ti+2>,...,<lk,tk>};
移动轨迹数据网格化处理单元,其采用geohash编码网格化方法对轨迹数据进行抽象化处理,以获得细粒度的轨迹表示和预测结果;
移动轨迹数据one-hot编码单元,其将离散数据转换为one-hot编码,即:将位置数据转换成长度为位置个数的向量,其中对应位置为1,剩余位置为0。
优选的,所述离散位置表示模块具体包括:
位置表示模型初始化单元,假设移动个体位置的geohash编码集合为Sgeo={Li|Li∈City and Li∈Stra}。其中,City是属于城市区域位置的编码集合;Stra是由移动轨迹产生的编码集合;相邻集和为Sneibor={Li|Li is neighborhood to Lj,Lj∈Sgeo}。总的geohash编码集合为Sallgeo=Sgeo∪Sneibor,one-hot编码的长度为n=count(Sallgeo),并且每个位置的one-hot编码对应一个m维的位置表示向量;
投影层计算单元,假如当前位置编号为i,对应的one-hot向量为Li,周围的位置为{Lj,Lj+1,...,Lj+7},假设存在一个参数矩阵V∈Rn×m,则可根据公式pk=Lk×V,j≤k≤j+7计算周围每个位置的投影向量pk
嵌入向量计算单元,将周围位置的投影相加,得到第i个位置的嵌入向量
Figure BDA0002883576970000061
如果m远小于n,则ei的维度较低,不具有稀疏性且包含附近的网格信息;
嵌入向量与one-hot向量映射单元,保留one-hot向量Li与嵌入向量ei的对应字典,假设存在另一个参数矩阵W=Rm×n,为提高模型的泛化能力,采用了softmax函数
Figure BDA0002883576970000064
将嵌入向量ei转化为n维one-hot向量;
误差计算单元,理想情况下,输出应该等于第i个位置的one-hot向量,即:
Figure BDA0002883576970000062
模型的均方误差为
Figure BDA0002883576970000063
优选的,所述基于长短期记忆网络的移动预测模块具体包括:
移动预测单元,其对嵌入向量表示的轨迹数据进行训练,其输出是嵌入向量,采用
Figure BDA0002883576970000065
转换为one-hot向量,对城市个体的移动行为进行预测。
与现有技术相比,本发明提供的一种城市移动性预测系统的有益效果在于:
本系统是基于离散位置关系模型及长短期记忆网络的,其能够实时精准预测城市移动个体的未来位置,保证了城市移动个体未来位置预测的实时性和精准性,可广泛应用于城市移动个体对服务质量要求较高的场景,据此为城市移动个体提供更高质量的服务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种城市移动性预测方法的较佳实施例的流程图;
图2是本发明实施例二提供的一种城市移动性预测系统的较佳实施例的功能模块图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参见图1,图1是本发明一种基于离散位置关系模型及长短期记忆网络的城市移动性预测方法的较佳实施例的流程图,其包括:
步骤S1、依次采用过滤、分段、网格化及one-hot编码技术对移动轨迹数据进行预处理;
本发明实施例中,所述步骤S1具体包括步骤:
S11、通过对所述城市个体的移动轨迹的分析,轨迹数据可以抽象表示为T={<l1,t1>,<l2,t2>,...,<lk,tk>},其中li是GPS数据,ti是GPS数据采集时间,k是轨迹序列的长度;
S12、考虑到位置划分粒度小时,位置数据量将会很大,城市区域范围以外的移动轨迹将没有足够的样本来提取移动模式,且这些位置数据将影响预测结果,因此,将满足
Figure BDA0002883576970000081
的轨迹进行过滤;
S13、由于GPS数据在采集时均有固定的时间间隔。当数据的时间间隔非常大的时候表示采集的位置也有较大的转移,采用时间阈值δt来对数据分段。对于轨迹T={<l1,t1>,<l2,t2>,...,<lk,tk>},如果存在采集时间间隔ti+1-ti>δt,那么该轨迹将会分段为T1={<l1,t1>,<l2,t2>,...,<li,ti>}与T2={<li+1,ti+1>,<li+2,ti+2>,...,<lk,tk>};
S14、由于GPS数据过于琐碎和冗余,无法直接有效地提取出城市个体的移动规律,采用geohash编码网格化方法对轨迹数据进行抽象化处理,以获得细粒度的轨迹表示和预测结果;
S15、移动轨迹经网格化处理后,由于其离散性,不能直接输入到神经网络中进行训练,将离散数据转换为one-hot编码,即:将位置数据转换成长度为位置个数的向量,其中对应位置为1,剩余位置为0;
步骤S2、设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,克服位置粒度小的时候数据量特别大的问题,同时将具有高维且没有相对位置信息的one-hot表示向量转换为包含位置之间关系信息的低维嵌入向量;
本发明实施例中,所述步骤S2具体包括步骤:
S21、假设移动个体位置的geohash编码集合为Sgeo={Li|Li∈City and Li∈Stra}。其中,City是属于城市区域位置的编码集合;Stra是由移动轨迹产生的编码集合。相邻集和为Sneibor={Li|Li is neighborhood to Lj,Lj∈Sgeo}。总的geohash编码集合为Sallgeo=Sgeo∪Sneibor,one-hot编码的长度为n=count(Sallgeo),并且每个位置的one-hot编码对应一个m维的位置表示向量;
S22、假如当前位置编号为i,对应的one-hot向量为Li,周围的位置为{Lj,Lj+1,...,Lj+7}。假设存在一个参数矩阵V∈Rn×m,则可根据公式pk=Lk×V,j≤k≤j+7计算周围每个位置的投影向量pk
S23、将周围位置的投影相加,得到第i个位置的嵌入向量
Figure BDA0002883576970000095
如果m远小于n,则ei的维度较低,不具有稀疏性且包含附近的网格信息;
S24、保留one-hot向量Li与嵌入向量ei的对应字典,假设存在另一个参数矩阵W=Rm×n,为提高模型的泛化能力,采用了softmax函数
Figure BDA0002883576970000092
将嵌入向量ei转化为n维one-hot向量;
S25、理想情况下,输出应该等于第i个位置的one-hot向量,即:
Figure BDA0002883576970000096
模型的均方误差为
Figure BDA0002883576970000097
步骤S3、将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,并对城市个体的移动行为进行预测。
本发明实施例中,所述步骤S3具体包括步骤:
S31、将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,长短期记忆网络的输出是嵌入向量,采用
Figure BDA0002883576970000101
转换为one-hot向量,对城市个体的移动行为进行预测。
由上可见,本发明通过分析城市个体的移动轨迹数据,依次采用过滤、分段、网格化及one-hot编码技术对移动轨迹数据进行预处理;设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,克服位置粒度小的时候数据量特别大的问题,同时将具有高维且没有相对位置信息的one-hot表示向量转换为包含位置之间关系信息的低维嵌入向量;将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,并对城市个体的移动行为进行预测。本方法是基于离散位置关系模型及长短期记忆网络的,其能够实时精准预测城市移动个体的未来位置,保证了城市移动个体未来位置预测的实时性和精准性,可广泛应用于城市移动个体对服务质量要求较高的场景,据此为城市移动个体提供更高质量的服务。
实施例二
基于上述实施例一,本发明还提供一种基于离散位置关系模型及长短期记忆网络的城市移动性预测系统,如图2所示,其包括:
移动轨迹数据预处理模块100,依次采用过滤、分段、网格化及one-hot编码技术对移动轨迹数据进行预处理;具体如实施例一所述。
离散位置表示模块200,设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,克服位置粒度小的时候数据量特别大的问题,同时将具有高维且没有相对位置信息的one-hot表示向量转换为包含位置之间关系信息的低维嵌入向量;具体如实施例一所述。
基于长短期记忆网络的移动预测模块300,将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,并对城市个体的移动行为进行预测。具体如实施例一所述。
进一步地,所述移动轨迹数据预处理模块100具体包括:
移动轨迹数据抽象表示单元,通过对所述城市个体的移动轨迹的分析,轨迹数据可以抽象表示为T={<l1,t1>,<l2,t2>,...,<lk,tk>},其中li是GPS数据,ti是GPS数据采集时间,k是轨迹序列的长度;具体如上所述。
移动轨迹数据过滤单元,考虑到位置划分粒度小时,位置数据量将会很大,城市区域范围以外的移动轨迹将没有足够的样本来提取移动模式,且这些位置数据将影响预测结果,因此,将满足
Figure BDA0002883576970000111
的轨迹进行过滤;具体如实施例一所述。
移动轨迹数据分段单元,由于GPS数据在采集时均有固定的时间间隔。当数据的时间间隔非常大的时候表示采集的位置也有较大的转移,采用时间阈值δt来对数据分段。对于轨迹T={<l1,t1>,<l2,t2>,...,<lk,tk>},如果存在采集时间间隔ti+1-ti>δt,那么该轨迹将会分段为T1={<l1,t1>,<l2,t2>,...,<li,ti>}与T2={<li+1,ti+1>,<li+2,ti+2>,...,<lk,tk>};具体如实施例一所述。
移动轨迹数据经网格化处理单元,由于GPS数据过于琐碎和冗余,无法直接有效地提取出城市个体的移动规律,采用geohash编码网格化方法对轨迹数据进行抽象化处理,以获得细粒度的轨迹表示和预测结果;具体如实施例一所述。
移动轨迹数据one-hot编码单元,移动轨迹网格化处理后,由于其离散性,不能直接输入到神经网络中进行训练,将离散数据转换为one-hot编码,即:将位置数据转换成长度为位置个数的向量,其中对应位置为1,剩余位置为0。具体如实施例一所述。
进一步地,所述离散位置表示模块200具体包括:
位置表示模型初始化单元,假设移动个体位置的geohash编码集合为Sgeo={Li|Li∈City and Li∈Stra}。其中,City是属于城市区域位置的编码集合;Stra是由移动轨迹产生的编码集合;相邻集和为Sneibor={Li|Li is neighborhood to Lj,Lj∈Sgeo}。总的geohash编码集合为Sallgeo=Sgeo∪Sneibor,one-hot编码的长度为n=count(Sallgeo),并且每个位置的one-hot编码对应一个m维的位置表示向量;具体如实施例一所述。
投影层计算单元,假如当前位置编号为i,对应的one-hot向量为Li,周围的位置为{Lj,Lj+1,...,Lj+7},假设存在一个参数矩阵V∈Rn×m,则可根据公式pk=Lk×V,j≤k≤j+7计算周围每个位置的投影向量pk;具体如实施例一所述。
嵌入向量计算单元,将周围位置的投影相加,得到第i个位置的嵌入向量
Figure BDA0002883576970000121
如果m远小于n,则ei的维度较低,不具有稀疏性且包含附近的网格信息;具体如实施例一所述。
嵌入向量与one-hot向量映射单元,保留one-hot向量Li与嵌入向量ei的对应字典,假设存在另一个参数矩阵W=Rm×n,为提高模型的泛化能力,采用了softmax函数
Figure BDA0002883576970000131
将嵌入向量ei转化为n维one-hot向量;具体如实施例一所述。
误差计算单元,理想情况下,输出应该等于第i个位置的one-hot向量,即:
Figure BDA0002883576970000135
模型的均方误差为
Figure BDA0002883576970000136
具体如实施例一所述。
进一步地,所述基于长短期记忆网络的移动预测模块300具体包括:
移动预测单元,采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,长短期记忆网络的输出是嵌入向量,采用
Figure BDA0002883576970000134
转换为one-hot向量,对城市个体的移动行为进行预测。具体如实施例一所述。
综上所述,本发明所提供的一种基于离散位置关系模型及长短期记忆网络的城市移动性预测方法及系统,所述方法具体包括:依次采用过滤、分段、网格化及one-hot编码技术对城市个体的移动轨迹数据进行预处理;设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,克服位置粒度小的时候数据量特别大的问题,同时将具有高维且没有相对位置信息的one-hot表示向量转换为包含位置之间关系信息的低维嵌入向量;将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,并对城市个体的移动行为进行预测。本系统是基于离散位置关系模型及长短期记忆网络的,其能够实时精准预测城市移动个体的未来位置,保证了城市移动个体未来位置预测的实时性和精准性,可广泛应用于城市移动个体对服务质量要求较高的场景,据此为城市移动个体提供更高质量的服务。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.一种城市移动性预测方法,其特征在于,包括以下步骤:
S1、依次采用过滤、分段、网格化及one-hot编码技术对移动轨迹数据进行预处理;
S2、设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,克服位置粒度小的时候数据量特别大的问题,同时将具有高维且没有相对位置信息的one-hot表示向量转换为包含位置之间关系信息的低维嵌入向量;
S3、将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,并对城市个体的移动行为进行预测。
2.根据权利要求1所述的一种城市移动性预测方法,其特征在于,所述步骤S1具体包括:
S11、通过对所述城市个体的移动轨迹的分析,轨迹数据可以抽象表示为T={<l1,t1>,<l2,t2>,...,<lk,tk>},其中li是GPS数据,ti是GPS数据采集时间,k是轨迹序列的长度;
S12、将满足
Figure FDA0002883576960000011
的轨迹进行过滤;
S13、采用时间阈值δt来对数据分段;对于轨迹T={<l1,t1>,<l2,t2>,...,<lk,tk>},如果存在采集时间间隔ti+1-ti>δt,那么该轨迹将会分段为T1={<l1,t1>,<l2,t2>,...,<li,ti>}与T2={<li+1,ti+1>,<li+2,ti+2>,...,<lk,tk>};
S14、采用geohash编码网格化方法对轨迹数据进行抽象化处理,以获得细粒度的轨迹表示和预测结果;
S15、移动轨迹经网格化处理后,将离散数据转换为one-hot编码,即:将位置数据转换成长度为位置个数的向量,其中对应位置为1,剩余位置为0。
3.根据权利要求2所述的一种城市移动性预测方法,其特征在于,所述步骤S2具体包括:
S21、假设移动个体位置的geohash编码集合为Sgeo={Li|Li∈City and Li∈Stra},其中,City是属于城市区域位置的编码集合;Stra是由移动轨迹产生的编码集合。相邻集和为Sneibor={Li|Liis neighborhood to Lj,Lj∈Sgeo},总的geohash编码集合为Sallgeo=Sgeo∪Sneibor,one-hot编码的长度为n=count(Sallgeo),并且每个位置的one-hot编码对应一个m维的位置表示向量;
S22、假如当前位置编号为i,对应的one-hot向量为Li,周围的位置为{Lj,Lj+1,...,Lj+7},假设存在一个参数矩阵V∈Rn×m,则可根据公式pk=Lk×V,j≤k≤j+7计算周围每个位置的投影向量pk
S23、将周围位置的投影相加,得到第i个位置的嵌入向量
Figure FDA0002883576960000021
如果m远小于n,则ei的维度较低,不具有稀疏性且包含附近的网格信息;
S24、保留one-hot向量Li与嵌入向量ei的对应字典,假设存在另一个参数矩阵W=Rm×n,为提高模型的泛化能力,采用了softmax函数
Figure FDA0002883576960000031
将嵌入向量ei转化为n维one-hot向量;
S25、输出应该等于第i个位置的one-hot向量,即:
Figure FDA0002883576960000032
模型的均方误差为
Figure FDA0002883576960000033
4.根据权利要求1所述的一种城市移动性预测方法,其特征在于,所述步骤S3具体包括:
S31、将采用嵌入向量表示的轨迹数据输入长短期记忆网络进行训练,长短期记忆网络的输出是嵌入向量,采用
Figure FDA0002883576960000034
转换为one-hot向量,对城市个体的移动行为进行预测。
5.一种城市移动性预测系统,其特征在于,包括:
移动轨迹数据预处理模块,其依次采用过滤、分段、网格化及one-hot编码技术对移动轨迹数据进行预处理;
离散位置表示模块,设计基于地理位置网格划分的离散位置关系模型,使用位置嵌入来减小位置表示的尺寸,克服位置粒度小的时候数据量特别大的问题,其收集移动轨迹数据预处理模块预处理后的信息,同时将具有高维且没有相对位置信息的one-hot表示向量转换为包含位置之间关系信息的低维嵌入向量;
基于长短期记忆网络的移动预测模块,其收集离散位置表示模块低维嵌入向量,并对低维嵌入向量表示的轨迹数据进行训练,再对城市个体的移动行为进行预测。
6.根据权利要求5所述的一种城市移动性预测系统,其特征在于,所述移动轨迹数据预处理模块具体包括:
移动轨迹数据抽象表示单元,通过对所述城市个体的移动轨迹的分析,轨迹数据可以抽象表示为T={<l1,t1>,<l2,t2>,...,<lk,tk>},其中li是GPS数据,ti是GPS数据采集时间,k是轨迹序列的长度;
移动轨迹数据过滤单元,其将满足
Figure FDA0002883576960000041
的轨迹进行过滤;
移动轨迹数据分段单元,其采用时间阈值δt来对数据分段,对于轨迹T={<l1,t1>,<l2,t2>,...,<lk,tk>},如果存在采集时间间隔ti+1-ti>δt,那么该轨迹将会分段为T1={<l1,t1>,<l2,t2>,...,<li,ti>}与T2={<li+1,ti+1>,<li+2,ti+2>,...,<lk,tk>};
移动轨迹数据网格化处理单元,其采用geohash编码网格化方法对轨迹数据进行抽象化处理,以获得细粒度的轨迹表示和预测结果;
移动轨迹数据one-hot编码单元,其将离散数据转换为one-hot编码,即:将位置数据转换成长度为位置个数的向量,其中对应位置为1,剩余位置为0。
7.根据权利要求6所述的一种城市移动性预测系统,其特征在于,所述离散位置表示模块具体包括:
位置表示模型初始化单元,假设移动个体位置的geohash编码集合为Sgeo={Li|Li∈City and Li∈Stra},其中,City是属于城市区域位置的编码集合;Stra是由移动轨迹产生的编码集合;相邻集和为Sneibor={Li|Liis neighborhood to Lj,Lj∈Sgeo}。总的geohash编码集合为Sallgeo=Sgeo∪Sneibor,one-hot编码的长度为n=count(Sallgeo),并且每个位置的one-hot编码对应一个m维的位置表示向量;
投影层计算单元,假如当前位置编号为i,对应的one-hot向量为Li,周围的位置为{Lj,Lj+1,...,Lj+7},假设存在一个参数矩阵V∈Rn×m,则可根据公式pk=Lk×V,j≤k≤j+7计算周围每个位置的投影向量pk
嵌入向量计算单元,将周围位置的投影相加,得到第i个位置的嵌入向量
Figure FDA0002883576960000051
如果m远小于n,则ei的维度较低,不具有稀疏性且包含附近的网格信息;
嵌入向量与one-hot向量映射单元,保留one-hot向量Li与嵌入向量ei的对应字典,假设存在另一个参数矩阵W=Rm×n,为提高模型的泛化能力,采用了softmax函数
Figure FDA0002883576960000052
将嵌入向量ei转化为n维one-hot向量;
误差计算单元,理想情况下,输出应该等于第i个位置的one-hot向量,即:
Figure FDA0002883576960000053
模型的均方误差为
Figure FDA0002883576960000054
8.根据权利要求6所述的一种城市移动性预测系统,其特征在于,所述基于长短期记忆网络的移动预测模块具体包括:
移动预测单元,其对嵌入向量表示的轨迹数据进行训练,其输出是嵌入向量,采用
Figure FDA0002883576960000055
转换为one-hot向量,对城市个体的移动行为进行预测。
CN202110006379.7A 2021-01-05 2021-01-05 一种城市移动性预测方法及预测系统 Pending CN112862155A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110006379.7A CN112862155A (zh) 2021-01-05 2021-01-05 一种城市移动性预测方法及预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110006379.7A CN112862155A (zh) 2021-01-05 2021-01-05 一种城市移动性预测方法及预测系统

Publications (1)

Publication Number Publication Date
CN112862155A true CN112862155A (zh) 2021-05-28

Family

ID=76001672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110006379.7A Pending CN112862155A (zh) 2021-01-05 2021-01-05 一种城市移动性预测方法及预测系统

Country Status (1)

Country Link
CN (1) CN112862155A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019023628A1 (en) * 2017-07-27 2019-01-31 Waymo Llc NEURAL NETWORKS FOR VEHICLE TRACK PLANNING
CN110163439A (zh) * 2019-05-24 2019-08-23 长安大学 一种基于注意力机制的城市规模出租车轨迹预测方法
CN110738370A (zh) * 2019-10-15 2020-01-31 南京航空航天大学 一种新颖的移动对象目的地预测算法
CN110888912A (zh) * 2019-10-15 2020-03-17 中国人民解放军国防科技大学 基于时空大数据的目标行为语义轨迹预测方法
CN110928993A (zh) * 2019-11-26 2020-03-27 重庆邮电大学 基于深度循环神经网络的用户位置预测方法及系统
CN112037506A (zh) * 2020-07-29 2020-12-04 长安大学 车辆轨迹预测模型构建方法、车辆轨迹预测方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019023628A1 (en) * 2017-07-27 2019-01-31 Waymo Llc NEURAL NETWORKS FOR VEHICLE TRACK PLANNING
CN110163439A (zh) * 2019-05-24 2019-08-23 长安大学 一种基于注意力机制的城市规模出租车轨迹预测方法
CN110738370A (zh) * 2019-10-15 2020-01-31 南京航空航天大学 一种新颖的移动对象目的地预测算法
CN110888912A (zh) * 2019-10-15 2020-03-17 中国人民解放军国防科技大学 基于时空大数据的目标行为语义轨迹预测方法
CN110928993A (zh) * 2019-11-26 2020-03-27 重庆邮电大学 基于深度循环神经网络的用户位置预测方法及系统
CN112037506A (zh) * 2020-07-29 2020-12-04 长安大学 车辆轨迹预测模型构建方法、车辆轨迹预测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高雅等: ""基于LSTM的移动对象位置预测算法"", 《计算机科学与探索》 *

Similar Documents

Publication Publication Date Title
CN111400620B (zh) 基于时空嵌入Self-Attention的用户轨迹位置预测方法
Li et al. Estimation of missing values in heterogeneous traffic data: Application of multimodal deep learning model
KR101830522B1 (ko) 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법
CN110163449B (zh) 一种基于主动时空图卷积的机动车排污监测节点部署方法
CN115374375B (zh) 基于深度学习的轨迹聚类方法、系统及存储介质
CN110503032B (zh) 基于监控摄像头轨迹数据的个体重要场所探测方法
Li et al. Model and transfer spatial-temporal knowledge for fine-grained radio map reconstruction
CN112580616B (zh) 人群数量确定方法、装置、设备及存储介质
Bisio et al. Traffic analysis through deep-learning-based image segmentation from UAV streaming
Xu et al. Fusing high-resolution multispectral image with trajectory for user next travel location prediction
Tao et al. Urban mobility prediction based on LSTM and discrete position relationship model
CN112862155A (zh) 一种城市移动性预测方法及预测系统
Said et al. Deep-Gap: A deep learning framework for forecasting crowdsourcing supply-demand gap based on imaging time series and residual learning
Bahra et al. A bidirectional trajectory prediction model for users in mobile networks
CN111814588A (zh) 行为检测方法以及相关设备、装置
Eum et al. Imputation of missing time-activity data with long-term gaps: A multi-scale residual CNN-LSTM network model
CN115879051A (zh) 一种基于vae的轨迹大数据异常检测方法与系统
CN115938112A (zh) 交通需求预测方法、系统、电子设备及计算机存储介质
Gundlegård et al. Integrated tracking and route classification for travel time estimation based on cellular network signalling data
Cao et al. Self-supervised temporal analysis of spatiotemporal data
CN117649028B (zh) 基于城市功能区域匹配的跨城市人群流量趋势预测方法
JP6959559B2 (ja) データ数決定装置、データ数決定方法及びデータ数決定プログラム
Yan et al. City-scale taxi demand prediction using multisource urban geospatial data
JP6783707B2 (ja) データ数決定装置、データ数決定方法及びデータ数決定プログラム
CN116432870B (zh) 一种城市流量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210528

RJ01 Rejection of invention patent application after publication