CN108629457A - 预测出行方式以及构建预测模型的方法和装置 - Google Patents
预测出行方式以及构建预测模型的方法和装置 Download PDFInfo
- Publication number
- CN108629457A CN108629457A CN201810435555.7A CN201810435555A CN108629457A CN 108629457 A CN108629457 A CN 108629457A CN 201810435555 A CN201810435555 A CN 201810435555A CN 108629457 A CN108629457 A CN 108629457A
- Authority
- CN
- China
- Prior art keywords
- trip
- information
- equation
- model
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000007704 transition Effects 0.000 claims description 22
- 238000010276 construction Methods 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000011835 investigation Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000009184 walking Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G06Q50/40—
Abstract
本发明公开了一种预测出行方式以及构建预测模型的方法和装置,所述方法包括:获取出行者的出行影响因素信息,作为预测模型的输入信息;根据所述预测模型的输出确定所述出行者的出行方式的预测结果;其中,所述预测模型是根据样本者的历次出行的信息预先构建的;其中一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;其中,所述出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息。应用本发明可以基于出行影响因素动态预测出行方式,提高对出行方式预测的准确性,使得交通规划更为有效。
Description
技术领域
本发明涉及智能交通技术领域,特别是指一种预测出行方式以及预测模型构建的方法和装置。
背景技术
出行方式的选择问题是个人出行决策中的重要一环。但是,在各交通规划、交通需求数学模型中,出行方式选择问题往往被大幅简化。该类出行方式选择模型在交通规划过程中大多被简化为集计的重力模型(gravity model)或是非集计的静态离散选择模型(discrete choice model)。现有的模型大多基于随机效用最大化理论,常见的模型为多项logit模型(Multinomial Logit,MNL)和嵌套logit模型(Nested Logit,NL),假设出行者在每一个决策时间点作出的出行方式选择相互独立且服从同一概率分布。这使得各种随时间变化的内生因素无法影响到出行方式的选择概率,这一局限性将大大影响交通需求预测的准确性,进而影响交通规划的准确性以及时效性。
事实上,本发明的发明人发现,新兴的交通科技也在影响着人们的日常生活,共享经济、智能交通的蓬勃发展,让传统的出行方式分担也发生了阶梯式的跃迁。人的出行方式选择变得越来越动态,从智能手机客户端可以实时呼叫出租车,共享单车、滴滴拼车等各类新型的出行方式也让短途的最后一英里出行有了更多选择。而从长期来看,出行方式的选择更是一种随时间变化的动态过程。譬如,以前偏好自驾的上班族有了孩子之后,会更多考虑和家庭成员拼车出行;热衷于共享经济、公共交通的年轻人成家立业了,从城中心的租住房搬到远一些的通勤小区,也会考虑购置私家车。除了家庭的变迁之外,工作的变动,收入的增减,健康程度,等等,这些时变的人生周期的变化,对人们的出行方式选择有着深远影响。而在当前基于出行方式预测的交通规划过程中,这些动态因素没有包括进去。也就是说,现有的出行方式预测方法是静态的,无法随着各种随时间变化的因素而改变,从而准确性较差,而基于准确性较差的出行方式预测,则无法规划出更利于出行的交通布局。
发明内容
本发明提出了一种预测出行方式以及构建预测模型的方法和装置,可以基于出行影响因素动态预测出行方式,提高对出行方式预测的准确性,使得交通规划更为有效。
基于上述目的,本发明提供一种预测出行方式的方法,包括:
获取出行者的出行影响因素信息,作为预测模型的输入信息;
根据所述预测模型的输出确定所述出行者的出行方式的预测结果;
其中,所述预测模型是根据样本者的历次出行的信息预先构建的;其中一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;
其中,所述出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息。
其中,所述个人信息包括:性别、年龄;以及
所述家庭信息包括:家庭成员数、家庭年均收入、家庭车辆数;以及
所述各类出行方式的信息包括:各类出行方式下的公交走行时间、转车次数、等待时间、公交费用,驾车走行时间、油费、过路费、停车费用。
其中,所述预测模型具体是根据如下方法预先构建的:
构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程;
联立所述离散方程并求解出所述离散方程的参数;
基于所述离散方程和求解出的参数构建出所述预测模型;
其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
其中,所述根据所述预测模型的输出确定所述出行者的出行方式的预测结果,具体包括:
所述预测模型确定所述出行者的出行影响因素信息所对应的出行隐含状态;
所述预测模型根据模型方程中的该出行隐含状态下的出行方式选择的条件概率的离散方程计算出选择各出行方式的条件概率;
将所述预测模型输出的条件概率最大的出行方式确定为所述出行者的出行方式的预测结果。
或者,所述预测模型具体是根据如下方法预先构建的:
构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程,以及各出行隐含状态间的状态转移方程;
联立所述模型方程,并求解出所述模型方程的参数;
基于所述模型方程和求解出的参数构建出所述预测模型;
其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
进一步,所述方法中还包括:将待预测的时间点输入所述预测模型;以及
所述根据所述预测模型的输出确定所述出行者的出行方式的预测结果,具体包括:
所述预测模型确定所述出行者的出行影响因素信息所对应的出行隐含状态;
所述预测模型运用模型方程中的状态转移方程根据确定的出行隐含状态以及将待预测的时间点,计算出所述时间点后的该出行者的出行隐含状态;
所述预测模型根据模型方程中的该出行隐含状态下的出行方式选择的条件概率的离散方程计算出选择各出行方式的条件概率;
将所述预测模型输出的条件概率最大的出行方式确定为所述时间点后所述出行者的出行方式的预测结果。
本发明还提供一种构建预测模型的方法,包括:
构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程;
联立所述模型方程,并求解出所述模型方程的参数;
基于所述模型方程和求解出的参数构建出所述预测模型;
其中,所述样本者的一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;其中,所述出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息;
其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
进一步,所述模型方程中还包括各出行隐含状态间的状态转移方程。
本发明还提供一种预测出行方式的装置,包括:
信息获取模块,用于获取出行者的出行影响因素信息,作为预测模型的输入信息;
预测模块,用于根据所述预测模型的输出确定所述出行者的出行方式的预测结果;
其中,所述预测模型是根据样本者的历次出行的信息预先构建的;其中一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;所述出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息。
进一步,所述装置还包括:
模型构建模块,用于构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程;联立所述模型方程,并求解出所述模型方程的参数;基于所述模型方程和求解出的参数构建出所述预测模型;其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
进一步,所述模型方程中还包括各出行隐含状态间的状态转移方程。
本发明的技术方案中,通过样本者的历次出行的信息,包括样本者历次出行的出行影响因素信息,比如个人信息、家庭信息、各类出行方式的信息等,以及样本者历次出行的出行方式的选择信息,进而基于这些信息构建出行方式的预测模型。这样,在将出行者的出行影响因素信息,作为该构建的预测模型的输入信息后,该预测模型可以输出基于所述出行者的出行影响因素信息所作出的出行方式的预测结果。也就是说,模型的输出可以根据输入的出行影响因素信息的变化而变化,实现基于各种因素动态预测出行方式的目的,从而可以提高对出行方式预测的准确性,使得交通规划更为有效。
附图说明
图1为本发明实施例提供的出行方式随时间动态变化的示意图;
图2为本发明实施例提供的出行方式随家庭生活状态的变迁动态变化的示意图;
图3为本发明实施例提供的一种构建预测模型的方法流程图;
图4为本发明实施例提供的预测模型中出行隐含状态转移、以及出行方式的选择概率示意图;
图5为本发明实施例提供的一种预测出行方式的方法流程图;
图6为本发明实施例提供的一种预测出行方式的装置内部结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
本发明的发明人考虑到,随着移动GPS技术和大数据科学的普及,个人的出行数据,个人信息和家庭信息不再难以获取。
通过大数据获取样本者的历次出行的信息,包括样本者历次出行的出行影响因素信息,比如个人信息、家庭信息、各类出行方式的信息等,以及样本者历次出行的出行方式的选择信息,进而基于这些信息构建出行方式的预测模型。这样,在将出行者的出行影响因素信息,作为该构建的预测模型的输入信息后,该预测模型可以输出基于所述出行者的出行影响因素信息所作出的出行方式的预测结果。也就是说,模型的输出可以根据输入的出行影响因素信息的变化而变化,实现基于各种因素动态预测出行方式的目的,从而可以提高对出行方式预测的准确性,使得交通规划更为有效。
下面结合附图详细说明本发明实施例的技术方案。
在进行模型构建前,可以先通过调查获取样本者的历次出行的信息;其中,一次出行的信息中包括:样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;其中,所述出行影响因素信息中包括个人信息、家庭信息、各类出行方式的信息。其中,样本者可以是多个。
具体地,可以从通过大数据统计出的居民出行面板数据中获取一段时间的样本者历次出行的出行影响因素信息,比如个人信息、家庭信息等,以及样本者所选择的出行方式。
居民出行面板数据中记录了按一定固定时间间隔,对同一组被调查者进行重复采样的数据。家庭出行调查通常以一年为时间单位。针对共享单车等新兴出行模式的调查,也有以一个月或更短间隔为时间单位分析用户的短时市场反应。此数据提供每一时期被调查者的家庭信息和个人信息,调查当日的出行情况,及其出行方式选择。
例如,西雅图地区居民出行面板数据作为最早的交通面板数据之一,为交通学界广泛采用。该数据收集于1989-2002年间,共分成10个时间节点收集。该数据、及其相对应的交通规划仿真模型数据均为政府开源信息,因此本算例使用该数据设计计算实例,分析美国西雅图地区居民出行方式选择。出行方式子集合包括自驾(独自驾驶、出租车)、拼车、公共交通(公交、地铁、通勤车)、其他(自行车、步行)4种选择。
在1989-2002西雅图地区居民出行面板数据库中,按每次出行整理数据。个人信息、家庭信息包括:性别、年龄、家庭成员数、家庭年均收入、家庭车辆数。数据描述统计如表1所示。
表1
表1中描述统计(除最后两行)为均值,括号内为标准差。
出行方式随时间变化的动态性体现见图1。从图1中可以看出,自驾所占的比重逐渐提升,而公交和步行所占比重则有所下降。数据显示,每次调查时间节点相较于前一次而言平均有14.9%的被调查者改变了出行方式。整体而言,35.9%的被调查者至少改变过一次出行方式。
另一方面,家庭生活状态的变迁从很大程度上左右了出行者的方式选择。如图2所示,不同家庭生活状态下的出行方式选择有着显著的不同。按家庭人口组成划分,家庭生活状态在数据中分为四大类:1.有孩子的家庭(孩子年龄0~5岁);2.有孩子的家庭(孩子年龄6~17岁);3.单人家庭,独身;4.多人家庭,无小孩。没有孩子的多人家庭出行方式分担率最为稳定,而单人家庭的出行方式变化最为显著。有孩子的家庭出行选择和家人拼车的更多见一些,而选择公交的概率相对偏低。
各类出行方式的信息则可以通过交通状况历史数据获取。各类出行方式的信息包括各类出行方式下的公交走行时间、转车次数、等待时间、公交费用,驾车走行时间、油费、过路费、停车费用,等等。通过与居民出行面板数据中获取的样本者历次出行所选择的出行方式、出发地点、目的地、出行时间进行匹配,从而得到样本者历次出行的各种不同出行方式的信息。
进一步,各类出行方式的信息还可通过交通规划仿真模型进行补充。对于上述交通状况历史数据信息不全的情况,各交通出行信息也可以通过交通规划仿真模型得到。模型基于城市路网、交通规划OD需求矩阵(Origin-Destination Demand Matrix)计算出各类出行方式的时间、花费等等。
在获取样本者的历次出行的信息后,本发明实施例提供的一种构建出行方式的预测模型的方法,流程如图3所示,包括如下步骤:
S301:构建模型方程。
本步骤中,构建的模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程;进一步,模型方程中还可包括各出行隐含状态间的状态转移方程;其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
具体地,根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程,形式如下公式一所示:
其中,Y={Yit}为所调查获取的样本者的出行方式选择行为,对应每个样本者i和每个调查的时间节点t;m为出行方式决策变量;等号左边的Pr(Yit=m|Hit)为基于出行隐含状态Hit的、出行方式选择行为为m的条件概率;等号右边的概率公式中,为基于出行隐含状态Hit的出行方式m的系统效用函数,符合如下公式二所示的混合logit(MixedLogit,ML)假设;表示基于出行隐含状态Hit的各出行方式的系统效用函数的、以e为底的指数之和。
其中,Zit表示从样本者i在调查的时间节点t的个人信息和家庭信息中所提取的特征的特征值所组成的向量;Xmt表示从调查的时间节点t的出行方式m的信息中提取的特征的特征值所组成的向量。比如,Zit向量中的子元素可以家庭年收入,家庭车辆数,家庭总人数,样本者性别,是否拥有公交月票等特征的特征值。使用本方法时,可以依据数据和模型具体需要,修改Zit以及Xmt向量中的子元素。
是ML中的随机白噪变量,用于考察个体异质性,服从标准正态分布。是随机效用最大化理论中的随机变量;是描述随机白噪变量的待求解参数,与同为待估计求解出的模型方程的参数。
从上述公式二中可以看出,出行隐含状态是由样本者的出行影响因素信息的一种组合构成的,即从样本者的个人信息和家庭信息中所提取的特征的特征值所组成的向量,以及出行方式的信息中提取的特征的特征值所组成的向量,决定了一种出行隐含状态。
模型方程中还可以包括各出行隐含状态间的状态转移方程,形式如公式三所示:
其中,代表样本者i在t时刻从出行隐含状态a转移到出行隐含状态b的转移概率。H为设定值,本领域技术人员可以根据经验设置,比如通过对比模型的拟合度,选择能使拟合度最高的H。在本发明中,简单的转移概率被进一步细化为考虑个体异质性的logit概率模型(或称分类评定模型),用以描述复杂的动态转换过程。以最简单的二阶马尔可夫转移矩阵为例,转移概率公式可以如下公式四所示:
其中,Zit表示从样本者i在调查的时间节点t的个人信息和家庭信息中所提取的特征的特征值所组成的向量,为样本者的个人或家庭属性,作为转移概率模型的独立变量。λ(a,b)为待估计求解出的模型方程的参数。这种设计的好处是个人或家庭的属性变化将影响到状态的转移。如前所述,家庭组成的变迁,工作或居住地的变动,收入的增减,健康程度的变化,都有可能使出行者在偏好驾车或偏好公交这两种状态之间动态转换。同时,该模型具有普遍性,可以考察各种因素的潜在影响,基于不同数据,出行者的出行惯性、对交通方式的熟悉程度、生活方式态度等等都可以涵盖在该模型框架下。
S302:联立上述的模型方程,并求解出所述模型方程的参数后,基于所述模型方程和求解出的参数构建出所述预测模型。
本步骤中,可以联立上述模型方程中的不同出行隐含状态下的出行方式选择的条件概率的离散方程,即联立上述公式一、二所示的方程,并求解出模型方程的参数进而,基于模型方程中的不同出行隐含状态下的出行方式选择的条件概率的离散方程和求解出的参数 构建出出行方式的预测模型。
作为一种更优的实施方式,本步骤中,可以联立上述模型方程中的不同出行隐含状态下的出行方式选择的条件概率的离散方程,以及各出行隐含状态间的状态转移方程,即联立上述公式一、二、三、四,并求解出模型方程的参数λ(a,b);进而,基于模型方程中的不同出行隐含状态下的出行方式选择的条件概率的离散方程,以及各出行隐含状态间的状态转移方程和求解出的参数λ(a,b)构建出出行方式的预测模型。
在求解模型方程的参数时,可以应用贝叶斯估计或最大似然估计方法对参数进行标定。
具体地,样本者在各个调查时间点(t=1,2,…,T)所选择的出行方式Y={Yit}形成了一个时间序列。联立上述公式一、二、三、四所示的不同出行隐含状态下的出行方式选择的条件概率的离散方程,以及各出行隐含状态间的状态转移方程,可以得到观测到这一系列出行方式选择的联合似然函数,如公式五所示:
其中,公式五为联合似然函数,本发明采用贝叶斯估计与马尔可夫蒙特卡洛方法估计模型方程的参数。具体步骤如下:
首先,基于一定先验概率分布假设和联合似然函数,模型方程的参数的后验分布服从贝叶斯原理,如公式六所示:
Pr(β,λ,,γ,σ,Hit|Y)=L(β,λ,γ,σ,Hit)Pr(β,λ,γ,σ,Hit) (公式六)
为得到参数估计值,需要对参数基于后验概率连续抽样。由于方程的复杂性,我们无法直接得到解析解,所以该抽样过程由马尔可夫蒙特卡洛(MCMC)方法完成。从初始值开始,每一步抽样均基于如下条件概;具体地,第j次迭代循环的抽样均基于如下条件概率:
β[j]~π(β|β[j-1],λ[j-1],γ[j-1],σ[j-1])
λ[j]~π(λ|β[j],λ[j-1],γ[j-1],σ[j-1])
γ[j]~π(γ|β[j],λ[j],γ[j-1],σ[j-1])
σ[j]~π(σ|β[j],λ[j],γ[j],σ[j-1])
其中,π(β,λ,γ,σ)为参数的极限分布。经过每个迭代循环,上式中的条件概率组合构成了MCMC中的马尔可夫链,并逐渐收敛于参数的真实极限分布。收敛后,在目标后验分布中抽取足够数量的样本以得出参数估计的各项统计值;其中,上述条件概率中的j为自然数。
通过参数估计,可以确定各出行影响因素对出行者方式选择影响程度。通过参数正负号及数值大小,可以定量分析模型的敏感性,即,每种出行影响因素的变化对出行隐含状态转移、以及出行方式选择概率的影响。同时,通过与传统多项式Logit(MultinomialLogit,MNL)等模型比较各类模型拟合指标,可以评估各模型的优劣。
图4直观示出了预测模型中出行隐含状态转移、以及出行方式的选择概率的示意图。
例如,利用上述表1中的数据构建预测模型,模型方程中的不同出行隐含状态下的出行方式选择的条件概率的离散方程,求解后得到的ML模型的参数见表2:
表2:出行方式选择的ML离散选择模型
运用本发明所提出的模型,我们可以发现,样本者表现出两个差别较为显著的隐含出行状态。状态1可以被标记为“时间/费用敏感状态”。状态1下,各出行时间和费用的参数为负,且数值较大,表示样本者在状态1情况下,各个出行方式的时间和费用对方式选择的决定性较大。而状态2则可以被标记为“自驾偏好状态”,因为自驾出行方式在模型中有着正显著的常数项参数,表示出行者在该状态下对自驾这种出行方式有明显的偏好。
本发明方法的另一大优点在于可以分析样本者在这两种出行状态之间的动态转移。何种因素导致样本者从对时间/费用敏感的状态转移到了完全偏好于自驾的状态?通过数据分析,发明者发现家庭生活状态的影响最为显著。隐马尔可夫状态转移模型结果见表3。模型中的四类家庭生状态分别为:1.有孩子的家庭(孩子年龄0~5岁);2.有孩子的家庭(孩子年龄6~17岁);3.单人家庭,独身;4.多人家庭,无小孩。
表3:马尔可夫状态转移方程
通过构建的预测模型发现,有孩子的家庭(家庭生活状态1,2)有更大的惯性保持其所在的出行状态(即:负显著的转移模型参数)。而单人家庭(家庭生活状态3)中的出行者有更大概率从出行状态1(时间/费用敏感状态)转移到出行状态2(自驾偏好状态)。
基于上述构建的预测模型,本发明实施例提供的一种预测出行方式的方法,流程如图5所示,包括如下步骤:
S501:获取出行者的出行影响因素信息,作为预测模型的输入信息。
更优地,本步骤中,还可将待预测的时间点输入所述预测模型。
其中,所述出行者的出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息。其中,所述个人信息包括:性别、年龄;所述家庭信息包括:家庭成员数、家庭年均收入、家庭车辆数;所述各类出行方式的信息包括:各类出行方式下的公交走行时间、转车次数、等待时间、公交费用,驾车走行时间、油费、过路费、停车费用。
S502:根据所述预测模型的输出确定所述出行者的出行方式的预测结果。
其中,所述预测模型可以是根据样本者的历次出行的信息,依据上述如图3所示流程中的方法预先构建的;其中一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息。
具体地,本步骤中,所述预测模型确定所述出行者的出行影响因素信息所对应的出行隐含状态;进而,所述预测模型根据模型方程中的该出行隐含状态下的出行方式选择的条件概率的离散方程计算出选择各出行方式的条件概率;之后,将所述预测模型输出的条件概率最大的出行方式确定为所述出行者的出行方式的预测结果。
作为一种更优的实施方式,本步骤中,所述预测模型确定所述出行者的出行影响因素信息所对应的出行隐含状态后,运用模型方程中的状态转移方程根据确定的出行隐含状态以及将待预测的时间点,计算出所述时间点后的该出行者的出行隐含状态;进而,所述预测模型根据模型方程中的该出行隐含状态下的出行方式选择的条件概率的离散方程计算出选择各出行方式的条件概率;之后,将所述预测模型输出的条件概率最大的出行方式确定为所述时间点后所述出行者的出行方式的预测结果。
基于上述预测出行方式的方法,本发明实施例提供的一种预测出行方式的装置,内部结构如图6所示,包括:信息获取模块601、预测模块602。
信息获取模块601用于获取出行者的出行影响因素信息,作为预测模型的输入信息;
预测模块602用于根据所述预测模型的输出确定所述出行者的出行方式的预测结果;
其中,所述预测模型是根据样本者的历次出行的信息预先构建的;其中一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;所述出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息。
进一步,本发明实施例提供的一种预测出行方式的装置中还包括:模型构建模块603。
模型构建模块603用于构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程;联立所述模型方程,并求解出所述模型方程的参数;基于所述模型方程和求解出的参数构建出所述预测模型;其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
进一步,模型构建模块603构建的模型方程中还可以包括各出行隐含状态间的状态转移方程。
其中,模型构建模块603构建模型方程,以及求解模型方程的参数的具体方法可参见上述图3所示流程的各步骤,此处不再赘述;而模型构建模块603也可作为构建出行方式的预测模型的装置而独立设置;亦即本发明实施例提供的一种构建的预测模型的装置中可以包括模型构建模块603。
本发明的技术方案中,通过样本者的历次出行的信息,包括样本者历次出行的出行影响因素信息,比如个人信息、家庭信息、各类出行方式的信息等,以及样本者历次出行的出行方式的选择信息,进而基于这些信息构建出行方式的预测模型。这样,在将出行者的出行影响因素信息,作为该构建的预测模型的输入信息后,该预测模型可以输出基于所述出行者的出行影响因素信息所作出的出行方式的预测结果。也就是说,模型的输出可以根据输入的出行影响因素信息的变化而变化,实现基于各种因素动态预测出行方式的目的,从而可以提高对出行方式预测的准确性,使得交通规划更为有效。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种预测出行方式的方法,其特征在于,包括:
获取出行者的出行影响因素信息,作为预测模型的输入信息;
根据所述预测模型的输出确定所述出行者的出行方式的预测结果;
其中,所述预测模型是根据样本者的历次出行的信息预先构建的;其中一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;
其中,所述出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息。
2.根据权利要求1所述的方法,其特征在于,
所述个人信息包括:性别、年龄;以及
所述家庭信息包括:家庭成员数、家庭年均收入、家庭车辆数;以及
所述各类出行方式的信息包括:各类出行方式下的公交走行时间、转车次数、等待时间、公交费用,驾车走行时间、油费、过路费、停车费用。
3.根据权利要求1或2所述的方法,其特征在于,所述预测模型具体是根据如下方法预先构建的:
构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程;
联立所述离散方程并求解出所述离散方程的参数;
基于所述离散方程和求解出的参数构建出所述预测模型;
其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
4.根据权利要求3所述的方法,其特征在于,所述根据所述预测模型的输出确定所述出行者的出行方式的预测结果,具体包括:
所述预测模型确定所述出行者的出行影响因素信息所对应的出行隐含状态;
所述预测模型根据模型方程中的该出行隐含状态下的出行方式选择的条件概率的离散方程计算出选择各出行方式的条件概率;
将所述预测模型输出的条件概率最大的出行方式确定为所述出行者的出行方式的预测结果。
5.根据权利要求1或2所述的方法,其特征在于,所述预测模型具体是根据如下方法预先构建的:
构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程,以及各出行隐含状态间的状态转移方程;
联立所述模型方程,并求解出所述模型方程的参数;
基于所述模型方程和求解出的参数构建出所述预测模型;
其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
6.根据权利要求5所述的方法,其特征在于,还包括:将待预测的时间点输入所述预测模型;以及
所述根据所述预测模型的输出确定所述出行者的出行方式的预测结果,具体包括:
所述预测模型确定所述出行者的出行影响因素信息所对应的出行隐含状态;
所述预测模型运用模型方程中的状态转移方程根据确定的出行隐含状态以及将待预测的时间点,计算出所述时间点后的该出行者的出行隐含状态;
所述预测模型根据模型方程中的该出行隐含状态下的出行方式选择的条件概率的离散方程计算出选择各出行方式的条件概率;
将所述预测模型输出的条件概率最大的出行方式确定为所述时间点后所述出行者的出行方式的预测结果。
7.一种构建预测模型的方法,其特征在于,包括:
构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程;
联立所述模型方程,并求解出所述模型方程的参数;
基于所述模型方程和求解出的参数构建出所述预测模型;
其中,所述样本者的一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;其中,所述出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息;
其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
8.根据权利要求7所述的方法,其特征在于,所述模型方程中还包括各出行隐含状态间的状态转移方程。
9.一种预测出行方式的装置,其特征在于,包括:
信息获取模块,用于获取出行者的出行影响因素信息,作为预测模型的输入信息;
预测模块,用于根据所述预测模型的输出确定所述出行者的出行方式的预测结果;
其中,所述预测模型是根据样本者的历次出行的信息预先构建的;其中一次出行的信息中包括:所述样本者该次出行时的出行影响因素信息,以及出行方式的选择信息;所述出行影响因素信息包括个人信息、家庭信息、各类出行方式的信息。
10.根据权利要求9所述的装置,其特征在于,还包括:
模型构建模块,用于构建模型方程;其中,所述模型方程包括根据所述样本者的历次出行的信息,构建的不同出行隐含状态下的出行方式选择的条件概率的离散方程;联立所述模型方程,并求解出所述模型方程的参数;基于所述模型方程和求解出的参数构建出所述预测模型;其中,一个出行隐含状态是由所述样本者的出行影响因素信息的一种组合构成的。
11.根据权利要求10所述的装置,其特征在于,所述模型方程中还包括各出行隐含状态间的状态转移方程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810435555.7A CN108629457B (zh) | 2018-05-09 | 2018-05-09 | 预测出行方式以及构建预测模型的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810435555.7A CN108629457B (zh) | 2018-05-09 | 2018-05-09 | 预测出行方式以及构建预测模型的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108629457A true CN108629457A (zh) | 2018-10-09 |
CN108629457B CN108629457B (zh) | 2021-09-28 |
Family
ID=63692165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810435555.7A Expired - Fee Related CN108629457B (zh) | 2018-05-09 | 2018-05-09 | 预测出行方式以及构建预测模型的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108629457B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918567A (zh) * | 2019-03-05 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 出行方式推荐方法及装置 |
CN110059116A (zh) * | 2019-04-15 | 2019-07-26 | 东南大学 | 一种家庭多日出行距离累计分布预测方法 |
CN111222703A (zh) * | 2020-01-09 | 2020-06-02 | 五邑大学 | 一种预测旅客出行方式的方法及装置 |
CN111442778A (zh) * | 2019-01-16 | 2020-07-24 | 百度在线网络技术(北京)有限公司 | 出行方案推荐方法、装置、设备及计算机可读存储介质 |
CN111666503A (zh) * | 2019-03-05 | 2020-09-15 | 百度在线网络技术(北京)有限公司 | 出行方式推荐方法、装置、计算机设备和可读存储介质 |
CN111859181A (zh) * | 2020-06-11 | 2020-10-30 | 北京百度网讯科技有限公司 | 跨区域的出行推荐方法、装置、电子设备及存储介质 |
CN112687096A (zh) * | 2019-10-17 | 2021-04-20 | 丰田自动车株式会社 | 信息处理装置和信息处理方法 |
CN116611565A (zh) * | 2023-05-23 | 2023-08-18 | 岭南师范学院 | 基于数据分析的用户行为监控系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103413443A (zh) * | 2013-07-03 | 2013-11-27 | 太原理工大学 | 基于隐马尔科夫模型的短时交通流状态预测方法 |
US20150032424A1 (en) * | 2013-07-25 | 2015-01-29 | Honda Motor Co., Ltd. | Familiarity modeling |
CN104537836A (zh) * | 2014-12-30 | 2015-04-22 | 北京通博科技有限公司 | 路段行驶时间分布预测方法 |
CN105095993A (zh) * | 2015-07-22 | 2015-11-25 | 济南市市政工程设计研究院(集团)有限责任公司 | 一种轨道站点客流量预测系统及方法 |
CN106682703A (zh) * | 2017-01-13 | 2017-05-17 | 北京航空航天大学 | 一种基于obd数据的驾驶人出行模式识别方法 |
-
2018
- 2018-05-09 CN CN201810435555.7A patent/CN108629457B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103413443A (zh) * | 2013-07-03 | 2013-11-27 | 太原理工大学 | 基于隐马尔科夫模型的短时交通流状态预测方法 |
US20150032424A1 (en) * | 2013-07-25 | 2015-01-29 | Honda Motor Co., Ltd. | Familiarity modeling |
CN104537836A (zh) * | 2014-12-30 | 2015-04-22 | 北京通博科技有限公司 | 路段行驶时间分布预测方法 |
CN105095993A (zh) * | 2015-07-22 | 2015-11-25 | 济南市市政工程设计研究院(集团)有限责任公司 | 一种轨道站点客流量预测系统及方法 |
CN106682703A (zh) * | 2017-01-13 | 2017-05-17 | 北京航空航天大学 | 一种基于obd数据的驾驶人出行模式识别方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111442778A (zh) * | 2019-01-16 | 2020-07-24 | 百度在线网络技术(北京)有限公司 | 出行方案推荐方法、装置、设备及计算机可读存储介质 |
US11586992B2 (en) | 2019-01-16 | 2023-02-21 | Baidu Online Network Technology (Beijing) Co., Ltd. | Travel plan recommendation method, apparatus, device and computer readable storage medium |
CN109918567A (zh) * | 2019-03-05 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 出行方式推荐方法及装置 |
CN111666503A (zh) * | 2019-03-05 | 2020-09-15 | 百度在线网络技术(北京)有限公司 | 出行方式推荐方法、装置、计算机设备和可读存储介质 |
CN111666503B (zh) * | 2019-03-05 | 2023-08-18 | 百度在线网络技术(北京)有限公司 | 出行方式推荐方法、装置、计算机设备和可读存储介质 |
CN110059116A (zh) * | 2019-04-15 | 2019-07-26 | 东南大学 | 一种家庭多日出行距离累计分布预测方法 |
CN112687096A (zh) * | 2019-10-17 | 2021-04-20 | 丰田自动车株式会社 | 信息处理装置和信息处理方法 |
CN111222703A (zh) * | 2020-01-09 | 2020-06-02 | 五邑大学 | 一种预测旅客出行方式的方法及装置 |
CN111222703B (zh) * | 2020-01-09 | 2023-05-12 | 五邑大学 | 一种预测旅客出行方式的方法及装置 |
CN111859181A (zh) * | 2020-06-11 | 2020-10-30 | 北京百度网讯科技有限公司 | 跨区域的出行推荐方法、装置、电子设备及存储介质 |
CN116611565A (zh) * | 2023-05-23 | 2023-08-18 | 岭南师范学院 | 基于数据分析的用户行为监控系统 |
CN116611565B (zh) * | 2023-05-23 | 2023-12-29 | 岭南师范学院 | 基于数据分析的用户行为监控系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108629457B (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108629457A (zh) | 预测出行方式以及构建预测模型的方法和装置 | |
Hörl et al. | Simulation of price, customer behaviour and system impact for a cost-covering automated taxi system in Zurich | |
McFadden | Disaggregate behavioral travel demand’s RUM side | |
Zong et al. | Understanding parking decisions with structural equation modeling | |
Mazloumi et al. | An integrated framework to predict bus travel time and its variability using traffic flow data | |
CN110428096A (zh) | 基于票务信息的城市轨道交通多交路运输组织优化方法 | |
Birolini et al. | Access mode choice to low-cost airports: Evaluation of new direct rail services at Milan-Bergamo airport | |
CN106503869A (zh) | 一种基于站点短时需求预测的公共自行车动态调度方法 | |
Wu et al. | Equilibrium and modal split in a competitive highway/transit system under different road-use pricing strategies | |
CN108877226A (zh) | 景区交通旅游预测方法及预警系统 | |
Pineda et al. | Integrated traffic-transit stochastic equilibrium model with park-and-ride facilities | |
CN106846214A (zh) | 分析交通枢纽可达性对区域公共运输方式竞争影响的方法 | |
CN109583708B (zh) | 多智能体微观交通配流模型的建立方法 | |
CN110459050A (zh) | 一种基于混合决策树的短期公交客流预测方法 | |
Chakirov | Urban mobility pricing with heterogeneous users | |
Hasnine et al. | A dynamic discrete choice model for tour-based mode choices | |
Ning et al. | A catfish effect based team recommendation system | |
Hasnine | Tour-based mode choice model in activity-based modelling framework | |
Zhu et al. | Learning Transportation Mode Choice for Context-Aware Services with Directed-Graph-Guided Fused Lasso from GPS Trajectory Data | |
Chen | Models of count with endogenous choices | |
Zhao et al. | Empirical study of drivers' learning behavior and reliance on VMS | |
Dong | Analysis of activity-based accessibility | |
WANG et al. | Airport Ground Access Choice Between Transportation Network Companies and Parking: A Case Study of Hartsfield-Jackson Atlanta International Airport | |
Li | Evaluation of Parking Guidance Information System with Multi-agent Based Simulation | |
Fournier | Equity and Efficiency in Multi-modal Transportation Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210928 |