CN112633349B - 基于贝叶斯模型的共享单车目的地预测方法 - Google Patents
基于贝叶斯模型的共享单车目的地预测方法 Download PDFInfo
- Publication number
- CN112633349B CN112633349B CN202011502624.5A CN202011502624A CN112633349B CN 112633349 B CN112633349 B CN 112633349B CN 202011502624 A CN202011502624 A CN 202011502624A CN 112633349 B CN112633349 B CN 112633349B
- Authority
- CN
- China
- Prior art keywords
- user
- travel
- information
- destination
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 5
- 230000003203 everyday effect Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000008901 benefit Effects 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Navigation (AREA)
Abstract
本发明公开了一种基于贝叶斯模型的共享单车目的地预测方法,通过采集目标用户的实时输入信息和历史出行信息,对实时输入信息和历史出行信息分别依次进行读写和转化,根据转化后的实时输入信息和历史出行信息分别构建目标用户的潜在目的地集合和出行特征集合,根据潜在目的地集合和出行特征集合训练贝叶斯模型,得到预测模型,采用预测模型预测用户到达潜在目的地集合中每个目的地的到达概率,按照到达概率从大到小的顺序对各个目的地进行排序,输出前m个的目的地,能够准确灵活地预测目标用户本次出行的目的地,有效缩短了用户的出行时间。
Description
技术领域
本发明涉及物联网技术领域,尤其涉及一种基于贝叶斯模型的共享单车目的地预测方法。
背景技术
受益于共享经济和移动支付的快速发展,共享单车在世界范围内迅速兴起。相比于公共自行车,其取消了对固定租赁站点的限制,使其可在服务范围内的任意地点借还车,增加了其在短距离出行中的优势,并成为了城市交通“第一公里”和“最后一公里”的有效接驳工具。然而,在共享单车带来便利的同时,一系列的运营问题也由此出现,如单车调运不及时、故障频发、故障单车堆积、停放秩序混乱等。这些问题不仅造成了共享单车的供需不平衡、降低了用户的出行体验和满意度,也阻碍了其它交通方式的正常运行。
预测用户出行的终点有以下作用:(1)在共享单车的应用界面为用户提供较为准确的备选终点选项,适应用户起点位置和出行时间的变化,改善用户的出行体验。(2)为单车运营商提供必要的调度信息,使其可以提前调配和管理共享单车以满足用户的出行需求。
现有技术多根据GPS定位获取用户的起点信息,在应用界面仅能将最近几次出行的历史终点位置提供给用户。在出行起终点位置变化较大的情况下,用户需要手动输入相关信息。这种方式一方面会占用用户的出行时间,另一方面又不能灵活地预测用户本次出行的目的地。
发明内容
针对以上问题,本发明提出一种收集数据简便、预测效率高、能够有效提高用户出行体验的基于贝叶斯模型的共享单车目的地预测方法。
为实现本发明的目的,提供一种基于贝叶斯模型的共享单车目的地预测方法,包括如下步骤:
S10,采集目标用户的实时输入信息和历史出行信息;
S20,对实时输入信息和历史出行信息分别依次进行读写和转化;
S30,根据转化后的实时输入信息和历史出行信息分别构建目标用户的潜在目的地集合和出行特征集合;
S50,根据潜在目的地集合和出行特征集合训练贝叶斯模型,得到预测模型,采用预测模型预测用户到达潜在目的地集合中每个目的地的到达概率;
S60,按照到达概率从大到小的顺序对各个目的地进行排序,输出前m个的目的地。
在一个实施例中,采集目标用户的实时输入信息和历史出行信息包括:
S11,通过共享单车应用平台收集用户的实时输入信息;所述实时输入信息包括用户ID、共享单车ID、起点位置和骑行开始时间;
S12,通过共享单车运营商收集用户一个月内的历史出行信息,所述历史出行信息包括用户ID、共享单车ID、起点位置、终点位置、骑行开始时间和骑行时长。
在一个实施例中,对实时输入信息和历史出行信息分别依次进行读写和转化包括:
S21,将存在遗漏信息属性值的历史出行信息进行删除;
S22,对共享单车GPS定位的经纬度根据GeoHash算法进行二进制转换,并与对应的地理位置进行匹配;所述地理位置包括起点位置和终点位置;
S23,计算各个变量值,对连续性变量进行离散化处理,采用自然间断点分级法分别对变量值的计算结果和离散化处理的结果进行分段处理,得到转化后的实时输入信息和历史出行信息;所述变量值包括用户出行距离、出行次数和出行频率;所述连续性变量包括年龄和距离。
在一个实施例中,根据转化后的实时输入信息和历史出行信息构建目标用户的潜在目的地集合包括:
S31,提取出用户历史出行信息中所有的起点位置和终点位置构成起点集合S和终点集合T;
S32,根据用户历史出行信息中起点和终点位置出现的次数,对起点位置集合按照起点位置出现的频次从大到小的顺序进行排序得到S={s1,s2,...,sn},对终点位置集合按照终点位置出现的频次从大到小的顺序进行排序得到T={t1,t2,...,tn};
S33,根据起点位置间或终点位置间的欧式距离分别对起点位置和终点位置进行相似性归类,将经纬度数据在同一范围内的位置信息进行相似性归类;
S34,在集合S={s1,s2,...,sn}和T={t1,t2,...,tn}中将s1和t1以及与其同一类的位置排除后,继续以出现次数最多的si和ti为基准,计算其与其他位置的欧式距离,距离小于或等于阈值的起点或终点,被认为是与si和ti同一类的位置;i的取值范围为1至n;
S35,重复步骤S34,直到S和T中所有的位置处理完成;
S36,根据处理后的历史终点位置构建用户的潜在目的集合D={d1,d2,...,dn}。
具体地,将经纬度数据在同一范围内的位置信息进行相似性归类包括:
考虑到用户多通过步行到达共享单车的上车点,将不同起点位置或终点位置间的距离阈值设为100m,以出现次数最高的位置s1和t1为基准,计算s1和t1与其他起终点位置的欧式距离,距离小于或等于阈值的起点或终点,被认为是与s1和t1同一类的位置,以实现相似性归类;在二维空间中,位置(x1,y1)和位置(x2,y2)间欧式距离ρ的计算公式如下:
在一个实施例中,根据转化后的实时输入信息和历史出行信息构建目标用户的出行特征集合包括:
S41,构建目标用户的个人特征;所述个人特征包括用户ID,性别,年龄,出行频率;根据用户一个月内的历史出行信息,共享单车出行频率的计算方法为:
S42,构建地理位置特征;所述地理位置特征包括起点位置和潜在终点位置,起点位置和潜在终点位置间的距离;其中起终点间的距离为欧式距离;
S43,构建时间特征;所述时间特征包括用户开始使用共享单车的时间和用户骑行的平均时长,将用户使用共享单车的时间划分周内和周末,并将每天开始使用共享单车的时间划分为上午(6:00-12:00)、下午(12:00-18:00)、晚上(18:00-24:00)、凌晨(24:00-6:00);用户骑行的平均时长以半小时为间隔进行划分;
S44,构建出行规律特征;所述出行规律特征包括用户从起点位置出发的次数和时间;用户到达潜在终点的次数和时间;用户从起点位置到终点位置的次数和时间;
S45,根据步骤S41至S44,构建用户的出行特征集合。
在一个实施例中,用预测模型预测用户到达潜在目的地集合中每个目的地的到达概率包括:
S51,在潜在目的地集合D中,用户到达目的地di的概率为:
其中,X是用户对应的特征向量,所述特征向量包括个人特征、地理位置特征、时间特征和出行规律特征,Pi(D=di|X)为已知出行特征为X的情况下,用户到达目的地di的后验概率,P(X|D=di)是条件概率,P(D=di)是用户到达目的地di的先验概率,利用贝叶斯模型计算用户到达每个潜在目的地的概率。
与现有技术相比,本发明的技术方案具有以下有益效果:
1、基于历史出行信息和实时定位信息构建用户出行的潜在目的地集合,实现单车时空信息、使用信息和历史信息的有效利用,为运营商制定合理的共享单车调度组织方案提供参考。
2、考虑用户的出行时空特性,建立用户的出行特征集合,基于此利用贝叶斯模型对用户共享单车出行目的地进行预测。在用户出行有一定差异的情况下,可有效提高用户本次出行终点的预测准确性。
3、结合用户历史出行数据,不仅仅局限于提供用户最近几次出行的终点位置,在应用界面可为用户提供多个到达概率较高的备选终点选项,减少或避免用户手动输入相关信息,节约用户出行时间,提升用户出行体验。
附图说明
图1是一个实施例的基于贝叶斯模型的共享单车目的地预测方法流程图;
图2是另一个实施例的基于贝叶斯模型的共享单车目的地预测方法流程图;
图3是一个实施例的训练贝叶斯模型的系统流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参考图1所示,图1为一个实施例的基于贝叶斯模型的共享单车目的地预测方法流程图,包括如下步骤:
为实现本发明的目的,提供一种基于贝叶斯模型的共享单车目的地预测方法,包括如下步骤:
S10,采集目标用户的实时输入信息和历史出行信息。
该步骤可以实现数据提取,包括收集、存储和更新用户的实时输入信息和历史出行信息。
S20,对实时输入信息和历史出行信息分别依次进行读写和转化。
该步骤可以实现数据处理,对数据提取单元的用户信息进行读写和转化。
S30,根据转化后的实时输入信息和历史出行信息分别构建目标用户的潜在目的地集合和出行特征集合。
S50,根据潜在目的地集合和出行特征集合训练贝叶斯模型,得到预测模型,采用预测模型预测用户到达潜在目的地集合中每个目的地的到达概率。
该步骤可以训练贝叶斯模型预测用户到达潜在目的地集合中每个目的地的概率。
S60,按照到达概率从大到小的顺序对各个目的地进行排序,输出前m个的目的地。
上述m可以取5等值。该步骤具体可以按照到达概率从大到小的顺序对潜在目的地进行排序,输出前5个概率最大的目的地位置。
在一个示例中,输出前5个概率最大的目的地位置包括:
S61,结合用户本次出行的时间特征和经过相似性处理后的起点位置,根据S50预测的概率按到达概率从大到小的顺序对潜在目的地集合中的位置进行排序。
S62,将概率最大的前5个位置作为用户本次出行可选的目的地位置,输出到应用平台。
在一个实施例中,上述基于贝叶斯模型的共享单车目的地预测方法也可以参考图2所示,包括如下过程:
1.用户出行信息采集。
用户通过扫描共享单车上的二维码使用车辆,并将相关信息传送给运营商。通过共享单车运营商及应用平台收集用户最近一个月的历史出行信息和本次出行的信息,包括用户ID、共享单车ID、起点、终点、用户开始使用共享单车的时间、用户骑行的时长等。
2.用户出行数据处理
对收集到的用户信息进行读写和转换。收集到的用户出行数据可能存在数据缺失、格式不匹配等数据问题,需要对数据进行预处理。包括以下步骤:
(1)数据缺失值处理,即将存在遗漏信息属性值的出行信息进行删除,减少对模型预测的影响。
(2)经纬度数据转换,即对共享单车GPS定位的经纬度数据根据GeoHash算法进行二进制转换,并与对应的地理位置进行匹配。
(3)数据计算与处理,即计算用户出行距离、出行次数、出行频率等变量值。为了更好的构建用户特征,需要对年龄、距离等连续性变量进行离散化处理,这里采用“自然间断点分级法”进行分段处理。
3.构建用户的潜在目的地集合
根据收集到的用户出行数据提取出用户历史出行中所有的起点和终点构成位置集合S和T,并按照历史数据中起点和终点位置出现频次从大到小的顺序,对位置集合进行排序,得到起点位置集合S={s1,s2,...,sn}和终点位置集合T={t1,t2,...,tn}。
考虑到GPS数据定位的误差,以及用户出行相同的起终点间存在短距离的偏差,不同的经纬度数据可能对应同一个地理位置。为了减少数据量,更好地构建用户出行的起终点集合,进而提高模型预测的效率,需要将得到的起终点位置进行相似性归类。本实施例中将不同起点或终点间的距离阈值设为100m,以出现次数最高的位置s1和t1为基准,依次计算s1和t1与其他起终点位置的欧式距离。认为与s1或t1距离小于或等于100m的起点或终点是与s1和t1同一类的位置(相似性归类),并将该位置的名称替换为s1或t1的位置名称。在集合S={s1,s2,...,sn}和T={t1,t2,...,tn}中将s1和t1以及与其同一类的位置排除后,继续以出现次数最多的si和ti为基准,计算其与剩余位置的欧式距离。经过多次计算后,完成对S和T中所有位置的处理。其中,在二维空间中,位置(x1,y1)和位置(x2,y2)间欧式距离ρ的计算公式如下:
位置处理完成后,根据用户的历史终点位置构建用户的潜在目的地集合D={d1,d2,...,dn}。
4.构建用户的出行特征集合
根据收集到的用户出行数据,构建用户的出行特征集合,具体包括以下子步骤:
(1)构建用户个人特征,包括用户ID,性别,年龄,出行频率。其中,根据用户一个月内的历史出行信息,共享单车出行频率的计算方法为:
(2)构建地理位置特征,包括起点和潜在终点位置,起点和潜在终点位置间的距离。其中,起终点间的距离为欧式距离。
(3)构建时间特征,包括用户开始使用共享单车的时间和用户骑行的平均时长。其中,将用户使用共享单车的时间划分周内和周末,并将每天开始使用共享单车的时间划分为上午(6:00-12:00)、下午(12:00-18:00)、晚上(18:00-24:00)、凌晨(24:00-6:00)。用户骑行的平均时长以半小时为间隔进行划分。
(4)构建出行规律特征,包括用户从起点位置出发的次数和时间;用户到达潜在终点的次数和时间;用户从起点位置到终点位置的次数和时间。
(5)根据以上步骤构建用户的出行特征集合。
5.预测用户到达终点的概率
如图3所示,根据收集到的用户出行的历史信息和实时信息,训练贝叶斯模型。在潜在目的地集合D中,用户到达目的地di的概率为:
其中,X是用户对应的特征向量(包括个人特征、地理位置特征、时间特征和出行规律特征),Pi(D=di|X)为已知出行特征为X的情况下,用户到达目的地di的后验概率,P(X|D=di)是条件概率,P(D=di)是用户到达目的地di的先验概率。利用贝叶斯模型计算用户到达每个潜在目的地的概率。
6.输出用户潜在目的地
结合用户本次出行的时间特征和经过相似性处理后的起点位置,根据贝叶斯模型预测的概率按照到达概率从大到小的顺序对潜在目的地集合中的位置进行排序。将概率最大的前5个位置作为用户本次出行可选择的目的地位置,输出到应用平台。
上述基于贝叶斯模型的共享单车目的地预测方法,通过采集目标用户的实时输入信息和历史出行信息,对实时输入信息和历史出行信息分别依次进行读写和转化,根据转化后的实时输入信息和历史出行信息分别构建目标用户的潜在目的地集合和出行特征集合,根据潜在目的地集合和出行特征集合训练贝叶斯模型,得到预测模型,采用预测模型预测用户到达潜在目的地集合中每个目的地的到达概率,按照到达概率从大到小的顺序对各个目的地进行排序,输出前m个的目的地,能够准确灵活地预测目标用户本次出行的目的地,有效缩短了用户的出行时间。
在一个实施例中,采集目标用户的实时输入信息和历史出行信息包括:
S11,通过共享单车应用平台收集用户的实时输入信息;所述实时输入信息包括用户ID、共享单车ID、起点位置和骑行开始时间;
S12,通过共享单车运营商收集用户一个月内的历史出行信息,所述历史出行信息包括用户ID、共享单车ID、起点位置、终点位置、骑行开始时间和骑行时长。
在一个实施例中,对实时输入信息和历史出行信息分别依次进行读写和转化包括:
S21,将存在遗漏信息属性值的历史出行信息进行删除。该步骤数据主要进行缺失值处理,即将存在遗漏信息属性值的出行信息进行删除,减少对模型预测的影响。
S22,对共享单车GPS定位的经纬度根据GeoHash算法进行二进制转换,并与对应的地理位置进行匹配;所述地理位置包括起点位置和终点位置。该步骤主要进行经纬度数据转换,即对共享单车GPS定位的经纬度数据根据GeoHash算法进行二进制转换,并与对应的地理位置进行匹配。
S23,计算各个变量值,对连续性变量进行离散化处理,采用自然间断点分级法分别对变量值的计算结果和离散化处理的结果进行分段处理,得到转化后的实时输入信息和历史出行信息;所述变量值包括用户出行距离、出行次数和出行频率;所述连续性变量包括年龄和距离。该步骤主要进行数据计算与处理,即计算用户出行距离、出行次数、出行频率等变量值。为了更好的构建用户特征,需要对年龄、距离等连续性变量进行离散化处理,这里采用“自然间断点分级法”进行分段处理。
在一个实施例中,根据转化后的实时输入信息和历史出行信息构建目标用户的潜在目的地集合包括:
S31,提取出用户历史出行信息中所有的起点位置和终点位置构成起点集合S和终点集合T。
S32,根据用户历史出行信息中起点位置和终点位置分别出现的次数,对起点位置集合按照起点位置出现的频次从大到小的顺序进行排序得到S={s1,s2,...,sn},对终点位置集合按照终点位置出现的频次从大到小的顺序进行排序得到T={t1,t2,...,tn}。
S33,根据起点位置间或终点位置间的欧式距离分别对起点位置和终点位置进行相似性归类,将经纬度数据在同一范围内的位置信息进行相似性归类。该步骤根据起点间或终点间的欧式距离对起终点位置进行相似性归类。考虑到GPS数据定位的误差,以及用户出行相同的起终点间存在短距离的偏差,不同的经纬度数据可能对应同一个地理位置。为了减少数据量,更好地构建用户出行的起终点集合,进而提高模型预测的效率,需要将这类位置信息进行相似性归类。
S34,在集合S={s1,s2,...,sn}和T={t1,t2,...,tn}中将s1和t1以及与其同一类的位置排除后,继续以出现次数最多的si和ti为基准,计算其与其他位置的欧式距离,距离小于或等于阈值的起点或终点,被认为是与si和ti同一类的位置;i的取值范围为1至n;
S35,重复步骤S34,直到S和T中所有的位置处理完成;
S36,根据处理后的历史终点位置构建用户的潜在目的集合D={d1,d2,...,dn}。
具体地,将经纬度数据在同一范围内的位置信息进行相似性归类包括:
考虑到用户多通过步行到达共享单车的上车点,将不同起点位置或终点位置间的距离阈值设为100m,以出现次数最高的位置s1和t1为基准,计算s1和t1与其他起终点位置的欧式距离,距离小于或等于阈值的起点或终点,被认为是与s1和t1同一类的位置,以实现相似性归类;在二维空间中,位置(x1,y1)和位置(x2,y2)间欧式距离ρ的计算公式如下:
在一个实施例中,根据转化后的实时输入信息和历史出行信息构建目标用户的出行特征集合包括:
S41,构建目标用户的个人特征;所述个人特征包括用户ID,性别,年龄,出行频率;根据用户一个月内的历史出行信息,共享单车出行频率的计算方法为:
S42,构建地理位置特征;所述地理位置特征包括起点位置和潜在终点位置,起点位置和潜在终点位置间的距离;其中起终点间的距离为欧式距离;
S43,构建时间特征;所述时间特征包括用户开始使用共享单车的时间和用户骑行的平均时长,将用户使用共享单车的时间划分周内和周末,并将每天开始使用共享单车的时间划分为上午(6:00-12:00)、下午(12:00-18:00)、晚上(18:00-24:00)、凌晨(24:00-6:00);用户骑行的平均时长以半小时为间隔进行划分;
S44,构建出行规律特征;所述出行规律特征包括用户从起点位置出发的次数和时间;用户到达潜在终点的次数和时间;用户从起点位置到终点位置的次数和时间;
S45,根据步骤S41至S44,构建用户的出行特征集合。
在一个实施例中,用预测模型预测用户到达潜在目的地集合中每个目的地的到达概率包括:
S51,在潜在目的地集合D中,用户到达目的地di的概率为:
其中,X是用户对应的特征向量,所述特征向量包括个人特征、地理位置特征、时间特征和出行规律特征,Pi(D=di|X)为已知出行特征为X的情况下,用户到达目的地di的后验概率,P(X|D=di)是条件概率,P(D=di)是用户到达目的地di的先验概率,利用贝叶斯模型计算用户到达每个潜在目的地的概率。
与现有技术相比,本实施例的技术方案具有以下有益效果:
1、基于历史出行信息和实时定位信息构建用户出行的潜在目的地集合,实现单车时空信息、使用信息和历史信息的有效利用,为运营商制定合理的共享单车调度组织方案提供参考。
2、考虑用户的出行时空特性,建立用户的出行特征集合,基于此利用贝叶斯模型对用户共享单车出行目的地进行预测。在用户出行有一定差异的情况下,可有效提高用户本次出行终点的预测准确性。
3、结合用户历史出行数据,不仅仅局限于提供用户最近几次出行的终点位置,在应用界面可为用户提供多个到达概率较高的备选终点选项,减少或避免用户手动输入相关信息,节约用户出行时间,提升用户出行体验。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本申请实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (5)
1.一种基于贝叶斯模型的共享单车目的地预测方法,其特征在于,包括如下步骤:
S10,采集目标用户的实时输入信息和历史出行信息;
S20,对实时输入信息和历史出行信息分别依次进行读写和转化;
S30,根据转化后的实时输入信息和历史出行信息分别构建目标用户的潜在目的地集合和出行特征集合;
S50,根据潜在目的地集合和出行特征集合训练贝叶斯模型,得到预测模型,采用预测模型预测用户到达潜在目的地集合中每个目的地的到达概率;
S60,按照到达概率从大到小的顺序对各个目的地进行排序,输出前m个的目的地;
根据转化后的实时输入信息和历史出行信息构建目标用户的出行特征集合包括:
S41,构建目标用户的个人特征;所述个人特征包括用户ID,性别,年龄,出行频率;根据用户一个月内的历史出行信息,共享单车出行频率的计算方法为:
S42,构建地理位置特征;所述地理位置特征包括起点位置和潜在终点位置,起点位置和潜在终点位置间的距离;其中起终点间的距离为欧式距离;
S43,构建时间特征;所述时间特征包括用户开始使用共享单车的时间和用户骑行的平均时长,将用户使用共享单车的时间划分周内和周末,并将每天开始使用共享单车的时间划分为上午、下午、晚上、凌晨;用户骑行的平均时长以半小时为间隔进行划分;
S44,构建出行规律特征;所述出行规律特征包括用户从起点位置出发的次数和时间;用户到达潜在终点的次数和时间;用户从起点位置到终点位置的次数和时间;
S45,根据步骤S41至S44,构建用户的出行特征集合;
采用预测模型预测用户到达潜在目的地集合中每个目的地的到达概率包括:
S51,在潜在目的地集合D中,用户到达目的地di的概率为:
其中,X是用户对应的特征向量,所述特征向量包括个人特征、地理位置特征、时间特征和出行规律特征,Pi(D=di|X)为已知出行特征为X的情况下,用户到达目的地di的后验概率,P(X|D=di)是条件概率,P(D=di)是用户到达目的地di的先验概率,利用贝叶斯模型计算用户到达每个潜在目的地的概率。
2.根据权利要求1所述的基于贝叶斯模型的共享单车目的地预测方法,其特征在于,采集目标用户的实时输入信息和历史出行信息包括:
S11,通过共享单车应用平台收集用户的实时输入信息;所述实时输入信息包括用户ID、共享单车ID、起点位置和骑行开始时间;
S12,通过共享单车运营商收集用户一个月内的历史出行信息,所述历史出行信息包括用户ID、共享单车ID、起点位置、终点位置、骑行开始时间和骑行时长。
3.根据权利要求2所述的基于贝叶斯模型的共享单车目的地预测方法,其特征在于,对实时输入信息和历史出行信息分别依次进行读写和转化包括:
S21,将存在遗漏信息属性值的历史出行信息进行删除;
S22,对共享单车GPS定位的经纬度根据GeoHash算法进行二进制转换,并与对应的地理位置进行匹配;所述地理位置包括起点位置和终点位置;
S23,计算各个变量值,对连续性变量进行离散化处理,采用自然间断点分级法分别对变量值的计算结果和离散化处理的结果进行分段处理,得到转化后的实时输入信息和历史出行信息;所述变量值包括用户出行距离、出行次数和出行频率;所述连续性变量包括年龄和距离。
4.根据权利要求3所述的基于贝叶斯模型的共享单车目的地预测方法,其特征在于,根据转化后的实时输入信息和历史出行信息构建目标用户的潜在目的地集合包括:
S31,提取出用户历史出行信息中所有的起点位置和终点位置构成起点集合S和终点集合T;
S32,根据用户历史出行信息中起点和终点位置出现的次数,对起点位置集合按照起点位置出现的频次从大到小的顺序进行排序得到S={s 1,s 2,...,sn},对终点位置集合按照终点位置出现的频次从大到小的顺序进行排序得到T={t1,t2,...,tn};
S33,根据起点位置间或终点位置间的欧式距离分别对起点位置和终点位置进行相似性归类,将经纬度数据在同一范围内的位置信息进行相似性归类;
S34,在集合S={s1,s2,...,sn}和T={t1,t2,...,tn}中将s1和t1以及与其同一类的位置排除后,继续以出现次数最多的si和ti为基准,计算其与其他位置的欧式距离,距离小于或等于阈值的起点或终点,被认为是与si和ti同一类的位置;i的取值范围为1至n;
S35,重复步骤S34,直到S和T中所有的位置处理完成;
S36,根据处理后的历史终点位置构建用户的潜在目的集合D={d1,d2,...,dn}。
5.根据权利要求4所述的基于贝叶斯模型的共享单车目的地预测方法,其特征在于,将经纬度数据在同一范围内的位置信息进行相似性归类包括:
考虑到用户多通过步行到达共享单车的上车点,将不同起点位置或终点位置间的距离阈值设为100m,以出现次数最高的位置s1和t1为基准,计算s1和t1与其他起终点位置的欧式距离,距离小于或等于阈值的起点或终点,被认为是与s 1和t1同一类的位置,以实现相似性归类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011502624.5A CN112633349B (zh) | 2020-12-18 | 2020-12-18 | 基于贝叶斯模型的共享单车目的地预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011502624.5A CN112633349B (zh) | 2020-12-18 | 2020-12-18 | 基于贝叶斯模型的共享单车目的地预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112633349A CN112633349A (zh) | 2021-04-09 |
CN112633349B true CN112633349B (zh) | 2024-04-26 |
Family
ID=75317129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011502624.5A Active CN112633349B (zh) | 2020-12-18 | 2020-12-18 | 基于贝叶斯模型的共享单车目的地预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112633349B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610568A (zh) * | 2021-07-26 | 2021-11-05 | 建信金融科技有限责任公司 | 一种潜在标签挖掘方法和装置 |
CN113822709A (zh) * | 2021-09-15 | 2021-12-21 | 摩拜(北京)信息技术有限公司 | 一种出行数据的处理方法、装置及服务器 |
CN118691052A (zh) * | 2024-08-26 | 2024-09-24 | 北京阿帕科蓝科技有限公司 | 信息展示方法、装置、计算机设备和计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108074414A (zh) * | 2017-12-19 | 2018-05-25 | 广州小鹏汽车科技有限公司 | 一种基于用户行为的常走路径交通信息提醒方法及系统 |
EP3483557A1 (en) * | 2017-11-10 | 2019-05-15 | Bayerische Motoren Werke Aktiengesellschaft | Methods and apparatuses for predicting a destination of a user's current travel path |
-
2020
- 2020-12-18 CN CN202011502624.5A patent/CN112633349B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3483557A1 (en) * | 2017-11-10 | 2019-05-15 | Bayerische Motoren Werke Aktiengesellschaft | Methods and apparatuses for predicting a destination of a user's current travel path |
CN108074414A (zh) * | 2017-12-19 | 2018-05-25 | 广州小鹏汽车科技有限公司 | 一种基于用户行为的常走路径交通信息提醒方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112633349A (zh) | 2021-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112633349B (zh) | 基于贝叶斯模型的共享单车目的地预测方法 | |
CN106875066B (zh) | 用车出行行为的预测方法、装置、服务器以及存储介质 | |
US10160321B2 (en) | Methods, circuits, devices, systems and associated computer executable code for driver decision support | |
Gao et al. | Optimize taxi driving strategies based on reinforcement learning | |
CN109151168B (zh) | 乘车码的切换方法、装置、移动终端及可读存储介质 | |
CN111985710A (zh) | 一种公交乘客出行站点预测方法、存储介质及服务器 | |
Ashqar et al. | Network and station-level bike-sharing system prediction: A San Francisco bay area case study | |
KR20180006875A (ko) | 주문형 서비스를 위한 정보를 제공하는 방법들 및 시스템들 | |
CN110909106B (zh) | 一种轨迹预测方法和系统 | |
CN110414732A (zh) | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 | |
US20240077325A1 (en) | Method for predicting the destination location of a vehicle | |
CN105138590A (zh) | 轨迹预测方法和装置 | |
CN113253722B (zh) | 电动车充电路径规划方法、装置及系统 | |
CN112132661A (zh) | 基于用户打车偏好的信息推送方法及装置 | |
CN111931077B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
Wong et al. | Long-term user location prediction using deep learning and periodic pattern mining | |
Jiang et al. | A framework of travel mode identification fusing deep learning and map-matching algorithm | |
CN112926796B (zh) | 一种基于特定场景的下车点推荐方法及装置 | |
Leng et al. | Managing travel demand: Location recommendation for system efficiency based on mobile phone data | |
Zhang et al. | DeepTrip: A deep learning model for the individual next trip prediction with arbitrary prediction times | |
CN110516017A (zh) | 基于终端设备的地点信息处理方法、装置、电子设备及存储介质 | |
CN109558961A (zh) | 确定位置信息的方法和系统、存储介质、处理器以及装置 | |
Dyrmishi et al. | Mobile positioning and trajectory reconstruction based on mobile phone network data: A tentative using particle filter | |
Herberth et al. | Identifying atypical travel patterns for improved medium-term mobility prediction | |
Liu et al. | Recommending a personalized sequence of pick-up points |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |