CN113570099A - 发车间隔预测方法、预测模型训练方法及其装置和设备 - Google Patents
发车间隔预测方法、预测模型训练方法及其装置和设备 Download PDFInfo
- Publication number
- CN113570099A CN113570099A CN202010352008.XA CN202010352008A CN113570099A CN 113570099 A CN113570099 A CN 113570099A CN 202010352008 A CN202010352008 A CN 202010352008A CN 113570099 A CN113570099 A CN 113570099A
- Authority
- CN
- China
- Prior art keywords
- bus
- data
- characteristic
- departure interval
- sample data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 238000012549 training Methods 0.000 title claims abstract description 70
- 230000006399 behavior Effects 0.000 claims description 80
- 238000012546 transfer Methods 0.000 claims description 41
- 230000015654 memory Effects 0.000 claims description 24
- 238000012512 characterization method Methods 0.000 claims 3
- 239000000126 substance Substances 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000007619 statistical method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 239000002737 fuel gas Substances 0.000 description 2
- 239000000295 fuel oil Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/123—Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Traffic Control Systems (AREA)
Abstract
本申请公开了发车间隔预测方法、预测模型训练方法及其装置和设备,涉及大数据领域。具体实现方案为:获取待预测的公交线路;确定待预测的公交线路的特征数据,特征数据是基于多个用户的行为轨迹数据得到的,特征数据用于表征乘客乘坐待预测的公交线路的需求度;基于特征数据对待预测的公交线路的发车间隔时间进行预测,得到待预测的公交线路的发车间隔时间。从而得到置信度更高的发车间隔时间。
Description
技术领域
本申请实施例涉及数据处理中的大数据技术,尤其涉及一种发车间隔预测方法、预测模型训练方法及其装置和设备。
背景技术
随着生活节奏的加快,人们对了解公交何时到站的需求日益加大。而公交何时到站的一个决定因素就是发车间隔。在地图中或者在公交车的各个站点的电子屏幕上加入各个车辆的发车间隔时间,能够让市民提高出行的效率,避免过长时间的在公交站等待。
目前,各个公交场站对于公交车的调度可能受很多因素影响,因此,公交车大多数时候并不都是完全按照时刻表上的时刻发车。那么,如何确定公交发车间隔时间,成了一大难题。当前主要是依靠采集人员去各个公交发车站点实际采集和记录发车间隔时间。又或者采用众包采集的方式,即通过手机应用程序(Application,app)把由采集人员执行的工作任务,以自由自愿的形式外包给非特定的大众志愿者,让这些大众志愿者反馈采集的发车间隔数据至众包平台。
但是,通过采集人员的方式实际采集,需要依靠大规模的人力资源。而众包方式虽然可以省去采集的人力成本,但是众包采集的方式,用户上报的数据置信度相对较低。
发明内容
提供了一种用于预测发车间隔的发车间隔预测方法、预测模型训练方法及其装置和设备。
根据第一方面,提供了一种发车间隔预测方法,包括:获取待预测的公交线路;确定所述待预测的公交线路的特征数据,所述特征数据是基于多个用户的行为轨迹数据得到的,所述特征数据用于表征乘客乘坐所述待预测的公交线路的需求度;基于所述特征数据对所述待预测的公交线路的发车间隔时间进行预测,得到所述待预测的公交线路的发车间隔时间。
根据第二方面,提供了一种发车间隔预测模型的训练方法,包括:获取公交线路的特征样本数据,以及所述特征样本数据对应的发车间隔标注信息,所述特征样本数据根据多个用户的行为轨迹样本数据确定,所述特征样本数据用于表征乘客乘坐所述公交线路的需求度;将所述特征样本数据作为待训练模型的输入,将所述发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到预测模型。
根据第三方面,提供了一种发车间隔预测装置,包括:第一获取模块,用于获取待预测的公交线路;第一确定模块,用于确定所述待预测的公交线路的特征数据,所述特征数据是基于多个用户的行为轨迹数据得到的,所述特征数据用于表征乘客乘坐所述待预测的公交线路的需求度;预测模块,用于基于所述特征数据对所述待预测的公交线路的发车间隔时间进行预测,得到所述待预测的公交线路的发车间隔时间。
根据第四方面,提供了一种发车间隔预测模型的训练装置,包括:第二获取模块,用于获取特征样本数据以及所述特征样本数据对应的发车间隔标注信息,所述特征样本数据根据多个用户的行为轨迹样本数据确定,所述特征样本数据用于表征乘客乘坐所述公交线路的需求度;训练模块,用于将所述特征样本数据作为待训练模型的输入,将所述发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到预测模型。
根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
根据第六方面,提供了一种电子设备,包括:至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第二方面所述的方法。
根据第七方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面所述的方法。
根据第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第二方面所述的方法。
根据第九方面,提供了一种发车间隔预测方法,包括:确定待预测的公交线路的特征数据;基于所述特征数据预测得到所述待预测的公交线路的发车间隔时间。
根据第十方面,提供了一种发车间隔预测模型的训练方法,包括:获取用于表征乘客乘坐公交线路的需求度的特征样本数据以及对应的发车间隔标注信息;基于所述特征样本数据以及所述发车间隔标注信息进行模型训练,得到用于预测公交线路的发车间隔时间的预测模型。
根据本申请的技术解决了现有技术中预测发车间隔时间的置信度较低的问题。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的一种公共交通的应用场景图;
图2为本申请实施例提供的发车间隔预测方法流程图;
图3为本申请一示例提供的确定站点定位热度特征的示意图;
图4为本申请一示例提供的确定站点转移热度特征的示意图;
图5为本申请实施例提供的预测发车间隔时间的示意图;
图6为本申请另一实施例提供的预测发车间隔时间的示意图;
图7为本申请实施例提供的发车间隔预测模型的训练方法流程图;
图8为本申请实施例提供的特征数据库的数据结构示意图;
图9为本申请另一实施例提供的预测发车间隔时间的示意图;
图10为本申请实施例提供的发车间隔预测装置的结构示意图;
图11为本申请实施例提供的发车间隔预测模型的训练装置的结构示意图;
图12是用来实现本申请实施例的发车间隔预测方法和/或发车间隔预测模型的训练方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是本申请实施例提供的一种公共交通的应用场景图。如图1所示,该应用场景包括:公交枢纽站11、多辆公交车12、公交站牌13和乘客14;其中,公交枢纽站11是多条公交线路的汇集点,每一条公交线路上的每一辆公交车从公交枢纽站11发车,并最终回到公交枢纽站11。公交枢纽站的调度人员可以对多条公交线路进行调度,也可以对每条公交线路上的多趟公交车进行调度,以满足公共交通需求。每一辆公交车12从公交枢纽站11出发,并经过预先规划好的公交线路15行驶,到达终点站,最后按照公交线路15返回公交枢纽站11。其中,公交线路15上的多个三角形表示该公交线路途经的公交站点。
在公交车行驶过程中,用户可以通过地图软件或者公交站牌上显示的发车间隔来决定是否需要等车。若用户无法获知准确的发车间隔,就会导致在公交站点等候时间无法确定,若等待时间过长,可能会影响用户的出行计划,从而给用户带来不好的体验。目前由大量自由的志愿者进行主动上报的众包采集方式,置信度较低。
针对上述技术问题,本申请实施例通过基于多个用户的行为轨迹,来提取待预测的公交线路的特征数据,之后基于特征数据来预测待预测的公交线路的发车间隔。用户的行为轨迹数据能够反应用户的真实出行规划,另一方面能够客观地反应用户对于公交线路的需求度,因此,基于用户行为轨迹数据预测的发车间隔时间,置信度和准确度都更高。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请实施例提供的发车间隔预测方法流程图。本申请实施例针对现有技术的如上技术问题,提供了发车间隔预测方法,如图2所示,该方法具体步骤如下:
步骤201、获取待预测的公交线路。
其中,待预测的公交线路是指需要预测发车间隔时间的公交线路,可以是任意公交线路。
步骤202、确定待预测的公交线路的特征数据。
其中,待预测的公交线路的特征数据是基于多个用户的行为轨迹数据得到的,该特征数据用于表征乘客乘坐所述待预测的公交线路的需求度。
本实施例中,用户的行为轨迹数据是指用于表征用户的活动范围的位置数据,可以理解为是包括M个定位点的轨迹数据。多个用户的行为轨迹数据可以通过地图软件来获取,也可以通过用户随身携带的具有定位功能的电子设备的定位数据来获取。其中,M为大于0的整数。
通过对多个用户在N天的行为轨迹数据进行统计分析,可以得到特征数据。其中,统计分析可以理解为特征提取。其中,N为大于0的整数。
步骤203、基于特征数据对待预测的公交线路的发车间隔时间进行预测,得到待预测的公交线路的发车间隔时间。
待预测的公交线路的特征数据能够表征乘客对待预测的公交线路的需求度,根据待预测的公交线路的特征数据,能够确定合适的发车间隔时间,从而为用户提供更为合理和准确的发车间隔时间。
本申请实施例通过获取待预测的公交线路,确定待预测的公交线路的特征数据,以及基于特征数据对待预测的公交线路的发车间隔时间进行预测,得到待预测的公交线路的发车间隔时间。其中,特征数据是基于多个用户的行为轨迹数据得到的,且特征数据能够用于表征乘客对待预测的公交线路的需求度。因而,预测的发车间隔时间的置信度更高。
在一个可选的实施例中,特征数据包括待预测的公交线路的每个公交站点的定位热度特征、待预测的公交线路的每个公交站点的站点转移热度特征、线路检索热度特征和公交线路基本特征。其中,站点转移热度特征用于表征相邻两个站点之间的上车乘客量。
对于不同的特征数据,分别对应有不同的确定方式。对于特征数据中的公交线路基本特征,其属于待预测公交线路的固有属性,可以根据预先存储的该公交线路的基本特征直接获取到。基本特征可以包括该公交线路的总站点数量、总线路长度和公交类型信息中的至少一项。其中,公交类型信息可以有不同的划分方式,例如按照运行区间,公交类型信息可以划分为短途和长途;按照燃料种类,公交类型信息可以划分为燃油、燃气和电动;按照车型结构,公交类型信息可以划分为单层、双层和铰接式。本实施例可以选取其中一种划分方式,也可以选取多种划分方式。应当理解,上述公交类型的划分方式仅为举例,并不限定只包括以上三种划分方式,对于其他的划分方式也在本申请实施例的范围内。
对于其他三种特征数据,可以根据用户行为轨迹数据确定待预测的公交线路的特征数据。下面将详细介绍对于其他三种特征数据,如何根据用户行为轨迹数据确定待预测的公交线路的特征数据。
可选的,公交站点的定位热度特征用于表征位于该公交站点周围的用户数量,能够表征在该公交站点的乘客数量。确定待预测的公交线路的每个公交站点的定位热度特征,包括:
步骤a1、针对待预测的公交线路的各个公交站点,确定在公交站点周围预设距离范围内的用户数量。
其中,用户行为轨迹数据包括多个位置信息,这些位置信息可能位于公交站点周围,也可能不在公交站点周围,通过将用户的位置信息和公交站点的位置信息进行比较,来确定用户是否位于公交站点周围。
例如,假设待预测的公交线路包括B1、B2、B3、B4、B5五个公交站点。如图3所示,以公交站点B1为例,可以以公交站点B1的站牌位置O点为中心点,以预设半径R为半径圈出预设距离范围,然后确定获取到的用户行为轨迹数据中的位置信息是否位于预设距离范围内,最终统计出位于预设距离范围内的位置信息对应的用户数量。从图中可以看出,用户1的行为轨迹数据中的位置G1位于预设距离范围内,用户2的行为轨迹数据中的G2位于预设距离范围之外。对于其他的公交站点,也可以采用类似的方法来确定在该公交站点周围预设距离范围内的用户数量。
步骤a2、基于各个公交站点的用户数量,确定公交站点的定位热度特征。
其中,公交站点的定位热度特征采用公交站点的定位热度值来表征。一个公交站点的定位热度特征与该公交站点的用户数量的呈正比例关系,即该公交站点的用户数量越多,该公交站点的定位热度值越大。
可选的,待预测的公交线路的每个公交站点的站点转移热度特征,用于表征相邻两个站点之间的上车乘客量。确定站点转移热度特征,包括:
步骤b1、将多个用户的行为轨迹数据与预设的公交轨迹进行匹配,得到多个用户的公交轨迹。
其中,预设的公交轨迹为待预测的公交线路上两个站点之间的公交线路。待预测的公交线路上两个站点可以是相邻的两个站点,也可以是间隔了几个站点的两个站点。若用户行为轨迹数据与待预测的公交线路上两个站点之间的路线匹配成功,则得到一条公交轨迹。
如图4所示,预设的公交轨迹,即公交线路包括A1站点和B1站点,A1站点靠近起始站点,A1站点和B1站点之间的轨迹路线如图4所示,用户的行为轨迹数据中有一部分轨迹A2B2(即A2点到B2点之间的线段)与A1站点和B1站点之间的轨迹路线重合,或者重合度大于预设重合度,则认为该用户在A1站点上车。
步骤b2、基于多个用户的公交轨迹,确定各个公交站点的上车乘客数量。
对于一个用户的行为轨迹数据而言,若存在多条公交轨迹,则取靠近公交始发站的站点为上车站点。如此,对待预测的公交线路上两个站点之间的用户的公交轨迹进行统计,便可得到各个公交站点的上车乘客数量。
步骤b3、基于各个公交站点的上车乘客数量,得到站点转移热度特征。
其中,站点转移热度特征采用站点转移热度值来表征,各个公交站点的上车乘客数量与站点转移热度值呈正向关系,即各个公交站点的上车乘客数量越多,站点转移热度值越大。
通过对公交线路上两个站点之间的上车乘客数量进行统计,可以了解该公交线路的站点客流量情况,从而为发车间隔时间的预测提供更加准确的参考信息。
可选的,确定公交线路检索热度特征,包括:
步骤c1、获取多个用户在地图中的公交线路检索数据。
步骤c2、基于公交线路检索数据,定所述公交线路的检索用户数量或所述公交线路的检索次数。
步骤c3、基于所述公交线路的检索用户数量或所述公交线路的检索次数,确定所述待预测的公交线路的公交线路检索热度特征。
其中,公交线路的检索热度特征采用该公交线路的检索热度值来表征。可以通过统计用户对该公交线路进行检索的次数或者统计多个用户行为轨迹数据对应的多个用户中检索该公交线路的用户数量,来确定该公交线路的检索热度值。检索该公交线路的用户数量与该公交线路的检索热度值呈正向关系,即检索该公交线路的用户数量越多,该公交线路的检索热度值越高。同样地,用户对该公交线路进行检索的次数与该公交线路的检索热度值呈正向关系,用户对该公交线路进行检索的次数越多,该公交线路的检索热度值也越高。
以上是对于如何确定特征数据的介绍,在确定了特征数据之后,就可以根据特征数据来预测该公交线路的发车间隔时间。下面将详细介绍如何根据特征数据来预测该公交线路的发车间隔时间。
在一种可选的实施方式中,可以基于特征数据,以及预设的特征数据和发车间隔时间之间的对应关系,得到待预测的公交线路的发车间隔时间。本实施例中,可以预先存储特征数据和发车间隔时间之间的对应关系,然后在需要进行预测时,将待预测的公交线路的特征数据,与预设的特征数据和发车间隔时间之间的对应关系进行匹配,来确定待预测的公交线路的发车间隔时间。一个可选的预测规则是:特征数据所反应的用户对该公交线路的需求度越大,则发车间隔时间越短;反之,特征数据所反应的用户对该公交线路的需求度越小,则发车间隔时间越长。在上述特征数据中,站点定位热度值、站点转移热度值、站点检索热度值越大,公交线路基本特征中的总站点数越多、总线路长度越长,则表示用户对该公交线路的需求度越大,对应的发车间隔时间越短;反之,站点定位热度值、站点转移热度值、站点检索热度值越小,公交线路基本特征中的总站点数越少、总线路长度越短,则表示用户对该公交线路的需求度越小,对应的发车间隔时间越长。
在一种可选的实施方式中,还可以对站点定位热度值、站点转移热度值、站点检索热度值和公交线路基本特征求加权和,然后基于计算得到的加权和,以及预设的加权值与发车间隔时间之间的对应关系,来确定发车间隔时间。
在上述实施例的基础上,用户的行为轨迹数据还可以包括时间信息。通过对用户的行为轨迹数据对应的时间信息进行统计分析,可以将用户的行为轨迹数据划分为不同时间段的用户行为轨迹数据,不同时间段的用户行为轨迹数据包括高峰期用户行为轨迹数据、平峰期用户行为轨迹数据和低峰期用户行为轨迹数据。进而通过对高峰期用户行为轨迹数据、平峰期用户行为轨迹数据和低峰期用户行为轨迹数据分别进行统计分析,可以得到高峰期特征数据、平峰期特征数据和低峰期特征数据。
其中,高峰期特征数据包括高峰期公交站点的定位热度特征、高峰期公交站点的转移热度特征以及高峰期公交站点的检索热度特征;平峰期特征数据包括平峰期公交站点的定位热度特征、平峰期公交站点的转移热度特征以及平峰期公交站点的检索热度特征;低峰期特征数据包括低峰期公交站点的定位热度特征、低峰期公交站点的转移热度特征以及低峰期公交站点的检索热度特征。
对于如何确定高峰期特征数据、平峰期特征数据和低峰期特征数据,具体可以参见上述实施例中对于确定特征数据的实施例的介绍,此处不再赘述。
可选的,预设的特征数据和发车间隔时间之间的对应关系也可以包括:高峰期特征数据和高峰期发车间隔时间的对应关系、平峰期特征数据和平峰期发车间隔时间的对应关系、低峰期特征数据和低峰期发车间隔时间的对应关系。
如图5所示,在将用户行为轨迹数据划分为高峰期、平峰期和低峰期,并得到高峰期特征数据、平峰期特征数据和低峰期特征数据之后,还可以根据高峰期特征数据和高峰期发车间隔时间的对应关系、平峰期特征数据和平峰期发车间隔时间的对应关系、低峰期特征数据和低峰期发车间隔时间的对应关系来确定不同时间段的发车间隔时间。
通过对高峰期、平峰期和低峰期的发车间隔时间分别进行预测,对于用户等车过程而言,具有更实际的参考意义,用户可以更加准确地获知不同时间段的发车间隔时间,以合理规划自己的出行计划。
在另一种可选的实施方式中,还可以基于预设的预测模型来预测发车间隔时间。则基于所述特征数据对所述待预测的公交线路的发车间隔时间进行预测,得到所述待预测的公交线路的发车间隔时间,包括:将所述特征数据输入预设的预测模型,得到所述待预测的公交线路的发车间隔时间。其中,预设的预测模型可以是通过预先训练得到的。
如图6所示,在将特征数据划分为高峰期特征数据、平峰期特征数据和低峰期特征数据之后,预测模型也可以分别对应有高峰期预测模型、平峰期预测模型和低峰期预测模型。则将特征数据输入预设的预测模型,得到发车间隔时间,包括以下至少一项预测过程:将所述高峰期特征数据输入预设的高峰期预测模型,得到高峰期发车间隔时间;将所述平峰期特征数据输入预设的平峰期预测模型,得到平峰期发车间隔时间;将所述低峰期特征数据输入预设的低峰期预测模型,得到低峰期发车间隔时间。
通过模型预测的方式来预测发车间隔时间,相较于基于预设的对应关系预测发车间隔时间而言,预测的发车间隔时间的准确度更高。
以上介绍了可以采用预测模型来预测发车间隔时间,下面将具体介绍预测模型的训练过程:
如图7所示,本申请实施例提供了一种发车间隔预测模型的训练方法,包括:
步骤S701、获取公交线路的特征样本数据,以及特征样本数据对应的发车间隔标注信息。
其中,特征样本数据根据多个用户的行为轨迹样本数据确定,特征样本数据用于表征乘客乘坐所述公交线路的需求度。
可选的,本实施例可以在每天的预定时间获取前1天的多个用户的行为轨迹样本数据,然后存储在基础数据库中,这些数据视为原始数据。因此,还需要对多个用户的行为轨迹样本数据进行预处理,例如,按照预先定义好的数据格式对原始数据进行处理,得到符合预先定义的数据格式的预处理后数据。其中,预处理过程包括过滤;过滤包括将一些无效的GPS数据进行过滤。
公交线路的特征样本数据可以是真值样本,也就是基于采集的大量用户的实际行为轨迹数据确定的特征样本数据。当然,本申请实施例的训练样本数据并不限定于真值样本,也可以采用公共数据集中的训练数据。
步骤S702、将特征样本数据作为待训练模型的输入,将发车间隔标注信息作为待训练模型的输出,对待训练模型进行迭代训练,得到预测模型。
其中,待训练模型可以是神经网络,也可以是其他模型,本实施例对此不作具体限定。以神经网络为例,对待训练模型进行迭代训练,若迭代训练的损失函数值达到期望的损失函数值,则训练结束。具体的训练过程可以参见现有技术的介绍,此处不再赘述。
对于特征样本数据,与特征数据类似,也可以包括站点定位热度特征样本、站点转移热度特征样本、公交线路检索热度特征样本、公交线路基本特征样本。下面将详细介绍不同特征样本数据的获取方式:
在一种可选的实施方式中,特征样本数据包括站点定位热度特征样本,则获取公交线路的特征样本数据,包括:
步骤d1、针对每条公交线路的每个公交站点,确定位于公交站点周围预设距离范围内的用户数量。
其中,用户行为轨迹样本数据包括多个位置信息,这些位置信息可能位于公交站点周围,也可能不在公交站点周围,通过将用户的位置信息和公交站点的位置信息进行比较,来确定用户是否位于公交站点周围。
例如,假设公交线路包括B1、B2、B3、B4、B5五个公交站点。以公交站点B1为例,可以以公交站点B1的站牌位置O点为中心点,以预设半径R为半径圈出预设距离范围,然后确定获取到的用户行为轨迹样本数据中的位置信息是否位于预设距离范围内,最终统计出位于预设距离范围内的位置信息对应的用户数量。对于其他的公交站点,也可以采用类似的方法来确定在该公交站点周围预设距离范围内的用户数量。具体可以参见图3所示示例的介绍。
步骤d2、基于公交站点周围预设距离范围内的用户数量,确定公交站点的定位热度特征样本。
其中,公交站点的定位热度特征样本采用公交站点的定位热度样本值来表征。一个公交站点的定位热度特征样本与该公交站点的用户数量的呈正比例关系,即该公交站点的用户数量越多,该公交站点的定位热度样本值越大。
在另一种可选的实施方式中,特征样本数据包括站点转移热度特征样本,则获取公交线路的特征样本数据,包括:
步骤e1、将多个用户行为轨迹样本数据与预设的公交轨迹进行匹配,得到多个用户的公交轨迹。
其中,预设的公交轨迹为公交线路上两个站点之间的公交线路。公交线路上两个站点可以是相邻的两个站点,也可以是间隔了几个站点的两个站点。若用户行为轨迹数据与公交线路上两个站点之间的路线匹配成功,则得到一条公交轨迹。
步骤e2、基于多个用户的公交轨迹,确定各个公交站点的上车乘客数量。
对于一个用户的行为轨迹数据而言,若存在多条公交轨迹,则取靠近公交始发站的站点为上车站点。如此,对待预测的公交线路上两个站点之间的用户的公交轨迹进行统计,便可得到各个公交站点的上车乘客数量。
步骤e3、基于各个公交站点的上车乘客数量,得到站点转移热度特征样本。
其中,站点转移热度特征样本采用站点转移热度值来表征,各个公交站点的上车乘客数量与站点转移热度值呈正向关系,即各个公交站点的上车乘客数量越多,站点转移热度值越大,反之,各个公交站点的上车乘客数量越少,站点转移热度值越小。
通过对公交线路上两个站点之间的上车乘客数量进行统计,可以了解该公交线路的站点客流量情况,从而为发车间隔时间的预测提供更加准确的参考信息。
在另一种可选的实施方式中,特征样本数据包括公交线路检索热度特征样本,则获取公交线路的特征样本数据,包括:
步骤f1、获取多个用户在地图中的公交线路检索数据。
步骤f2、基于所述公交线路检索数据,确定所述公交线路的检索用户数量或所述公交线路的检索次数。
步骤f3、基于所述公交线路的检索用户数量或所述公交线路的检索次数,确定所述公交线路的检索热度特征样本。
其中,公交线路的检索热度特征样本采用该公交线路的检索热度样本值来表征。可以通过统计用户对该公交线路进行检索的次数或者统计多个用户行为轨迹样本数据对应的多个用户中检索该公交线路的用户数量,来确定该公交线路的检索热度值。用户对该公交线路进行检索的次数与该公交线路的检索热度值呈正比例关系。
在另一种可选的实施方式中,特征样本数据包括:公交线路基本特征样本;其中,所述公交线路基本特征样本包括:总站点数、总距离和公交类型信息。公交线路基本特征样本属于公交线路的固有属性,可以根据预先存储的该公交线路的基本特征直接获取到。其中,公交类型信息可以有不同的划分方式,例如按照运行区间,公交类型信息可以划分为短途和长途;按照燃料种类,公交类型信息可以划分为燃油、燃气和电动;按照车型结构,公交类型信息可以划分为单层、双层和铰接式。本实施例可以选取其中一种划分方式,也可以选取多种划分方式。应当理解,上述公交类型的划分方式仅为举例,并不限定只包括以上三种划分方式,对于其他的划分方式也在本申请实施例的范围内。
通过上述实施例得到的特征样本数据可以存储在特征数据库中,特征数据库中的数据格式可以如图8所示,每一条公交线路包括N个公交站点,每个公交站点分别对应有站点定位热度特征样本、公交站点转移热度特征样本,该条公交线路还对应有检索热度特征样本和公交线路基本特征样本,其中,定位热度特征11、站点转移热度特征12、线路检索热度特征1和线路基本特征1均对应公交站点1,对于其余的数据格式与公交站点1类似,此处不再赘述。对于一条公交线路而言,无论是哪个公交站点,其对应的线路检索热度特征和线路基本特征都是相同的。
在上述实施例的基础上,用户的行为轨迹样本数据还可以包括时间信息。其中,如图9所示,通过对用户的行为轨迹样本数据对应的时间信息进行统计分析,可以将用户的行为轨迹样本数据划分为不同时间段的用户行为轨迹样本数据,不同时间段的用户行为轨迹样本数据包括高峰期用户行为轨迹样本数据、平峰期用户行为轨迹样本数据和低峰期用户行为轨迹样本数据。进而通过对高峰期用户行为轨迹样本数据、平峰期用户行为轨迹样本数据和低峰期用户行为轨迹样本数据分别进行统计分析,可以得到高峰期特征样本数据、平峰期特征样本数据和低峰期特征样本数据。之后,分别基于高峰期特征样本数据、平峰期特征样本数据和低峰期特征样本数据训练得到高峰期预测模型、平峰期预测模型、低峰期预测模型。
其中,高峰期预测模型的训练包括:将高峰期特征样本数据作为待训练模型的输入,将所述高峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到高峰期预测模型。
平峰期预测模型的训练包括:将平峰期特征样本数据作为待训练模型的输入,将所述平峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到平峰期预测模型。低峰期预测模型的训练包括:将低峰期特征样本数据作为待训练模型的输入,将所述低峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到低峰期预测模型。
其中,高峰期特征样本数据包括高峰期公交站点的定位热度特征、高峰期公交站点的转移热度特征以及高峰期公交站点的检索热度特征;平峰期特征数据包括平峰期公交站点的定位热度特征、平峰期公交站点的转移热度特征以及平峰期公交站点的检索热度特征;低峰期特征数据包括低峰期公交站点的定位热度特征、低峰期公交站点的转移热度特征以及低峰期公交站点的检索热度特征。
对于如何确定高峰期特征样本数据、平峰期特征样本数据和低峰期特征样本数据,具体可以参见上述实施例中对于确定特征数据的实施例的介绍,此处不再赘述。
可选的,发车间隔标注信息是基于公交线路的相邻两趟车辆的全球定位系统(Global Positioning System,GPS)数据中的时间信息确定。通常地,公交车辆上都安装有GPS定位装置,可以实时采集车辆的GPS定位信息,GPS定位信息对应有时间信息,因此,可以基于公交线路的相邻两趟车辆的GPS数据中的时间信息确定发车间隔标注信息,以获取更加准确的发车间隔标注信息。可选的,公交线路的相邻两趟车辆的GPS数据可以采用该相邻两趟车辆在同一站点时的时间差来确定。为了避免交通因素发车间隔标注信息准确度的影响,可以取相邻两趟车辆在公交线路的始发站或者包括始发站在内的前3站的时间差来确定发车间隔标注信息。
根据本申请的实施例,还提供一种发车间隔预测装置,如图10所示,发车间隔预测装置100包括:第一获取模块101、第一确定模块102和预测模块103;其中,第一获取模块101,用于获取待预测的公交线路;第一确定模块102,用于确定所述待预测的公交线路的特征数据,所述特征数据是基于多个用户的行为轨迹数据得到的,所述特征数据用于表征乘客乘坐所述待预测的公交线路的需求度;预测模块103,用于基于特征数据对待预测的公交线路的发车间隔时间进行预测,得到待预测的公交线路的发车间隔时间。
可选的,所述特征数据包括所述待预测的公交线路的每个公交站点的定位热度特征;所述第一确定模块102,包括:定位热度确定单元1021,用于针对所述待预测的公交线路的各个公交站点,确定在所述公交站点周围预设距离范围内的用户数量;以及基于各个公交站点的用户数量,确定所述公交站点的定位热度特征。
可选的,所述特征数据包括:所述待预测的公交线路的每个公交站点的站点转移热度特征;所述站点转移热度特征用于表征相邻两个站点之间的上车乘客量;所述第一确定模块102,包括:转移热度确定单元1022,用于将所述多个用户行为轨迹数据与预设的公交轨迹进行匹配,得到所述多个用户的公交轨迹,所述预设的公交轨迹为待预测的公交线路上两个站点之间的公交线路;基于所述多个用户的公交轨迹,确定各个公交站点的上车乘客数量;以及基于所述各个公交站点的上车乘客数量,得到所述站点转移热度特征。
可选的,特征数据包括公交线路检索热度特征;所述第一确定模块102,包括:检索热度确定单元1023,用于获取多个用户在地图中的公交线路检索数据;基于所述公交线路检索数据,确定所述公交线路的检索用户数量或所述公交线路的检索次数;基于所述公交线路的检索用户数量或所述公交线路的检索次数,确定所述待预测的公交线路的公交线路检索热度特征。
可选的,所述特征数据包括所述待预测的公交线路的基本特征;所述待预测的公交线路的基本特征至少包括:总站点数量、总线路长度和公交类型信息中的至少一项。
可选的,预测模块103包括:第一预测单元1031,用于基于所述特征数据,以及预设的特征数据和发车间隔时间的对应关系,得到所述待预测的公交线路的发车间隔时间。
可选的,所述特征数据包括以下中的至少一项:高峰期特征数据、平峰期特征数据和低峰期特征数据;所述预设的特征数据和发车间隔时间的对应关系包括以下中的至少一项:高峰期特征数据和高峰期发车间隔时间的对应关系、平峰期特征数据和平峰期发车间隔时间的对应关系、低峰期特征数据和低峰期发车间隔时间的对应关系。
可选的,所述预测模块103包括:第二预测单元1032,用于将所述特征数据输入预设的预测模型,得到所述待预测的公交线路的发车间隔时间。
可选的,所述特征数据包括以下中的至少一项:高峰期特征数据、平峰期特征数据和低峰期特征数据;所述预测模型包括以下中的至少一项:高峰期预测模型、平峰期预测模型和低峰期预测模型;
所述第二预测单元1032将所述特征数据输入预设的预测模型,得到发车间隔时间,包括以下中至少一项:将所述高峰期特征数据输入预设的高峰期预测模型,得到高峰期发车间隔时间;将所述平峰期特征数据输入预设的平峰期预测模型,得到平峰期发车间隔时间;将所述低峰期特征数据输入预设的低峰期预测模型,得到低峰期发车间隔时间。
图10所示实施例的发车间隔预测装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
根据本申请的实施例,本申请还提供了一种发车间隔预测模型的训练装置,如图11所示,发车间隔预测模型的训练装置110包括:第二获取模块111和训练模块112;其中,第二获取模块111,用于获取特征样本数据以及所述特征样本数据对应的发车间隔标注信息,所述特征样本数据根据多个用户的行为轨迹样本数据确定;训练模块112,用于将所述特征样本数据作为待训练模型的输入,将所述发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到预测模型。
可选的,所述特征样本数据包括:站点定位热度特征样本;则第二获取模块111包括:定位热度特征样本确定单元1110,用于针对每条公交线路的每个公交站点,确定位于所述公交站点周围预设距离范围内的用户数量;基于所述公交站点周围预设距离范围内的用户数量,确定所述公交站点的定位热度特征样本。
可选的,所述特征样本数据包括:站点转移热度特征样本;则第二获取模块111包括:转移热度特征样本确定单元1111,用于将所述多个用户行为轨迹样本数据与预设的公交轨迹进行匹配,得到所述多个用户的公交轨迹;基于所述多个用户的公交轨迹,确定各个公交站点的上车乘客数量;基于所述各个公交站点的上车乘客数量,得到所述站点转移热度特征样本。
可选的,所述特征样本数据包括:公交线路检索热度特征样本;则第二获取模块112包括:转移热度特征样本确定单元1112,用于获取多个用户在地图中的公交线路检索数据;基于所述公交线路检索数据,确定所述公交线路的检索用户数量或所述公交线路的检索次数;基于所述公交线路的检索用户数量或所述公交线路的检索次数,确定所述公交线路的检索热度特征样本。
可选的,所述特征样本数据至少包括:公交线路基本特征样本;所述公交线路基本特征样本包括:总站点数、总距离和公交类型。
可选的,所述特征样本数据包括以下中至少一项:高峰期特征样本数据、平峰期特征样本数据和低峰期特征样本数据;训练模块112包括:第一训练单元1120,用于将高峰期特征样本数据作为待训练模型的输入,将所述高峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到高峰期预测模型;第二训练单元1121,用于将平峰期特征样本数据作为待训练模型的输入,将所述平峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到平峰期预测模型;第三训练单元1122,用于将低峰期特征样本数据作为待训练模型的输入,将所述低峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到低峰期预测模型。
可选的,该训练装置110还包括:第二确定模块113,用于将所述多个用户行为轨迹样本数据划分为高峰期用户行为轨迹样本数据、平峰期用户行为轨迹样本数据、低峰期用户行为轨迹样本数据;分别基于高峰期用户行为轨迹样本数据、平峰期用户行为轨迹样本数据、低峰期用户行为轨迹样本数据,确定高峰期特征样本数据、平峰期特征样本数据和低峰期特征样本数据。
可选的,所述发车间隔标注信息是基于所述公交线路的相邻两趟车辆在同一站点的GPS数据中的时间信息的时间差确定。
图11所示实施例的发车间隔预测模型的训练装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图12所示,是根据本申请实施例的发车间隔预测方法或发车间隔预测模型的训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图12所示,该电子设备包括:一个或多个处理器1201、存储器1202,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图12中以一个处理器1201为例。
存储器1202即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的发车间隔预测方法或发车间隔预测模型的训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的发车间隔预测方法或发车间隔预测模型的训练方法。
存储器1202作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的发车间隔预测方法或发车间隔预测模型的训练方法对应的程序指令/模块(例如,附图10所示的第一获取模块101、第一确定模块102和预测模块103,附图11所示的第二获取模块111、训练模块112和第二确定模块113)。处理器1201通过运行存储在存储器1202中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的发车间隔预测方法或发车间隔预测模型的训练方法。
存储器1202可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据发车间隔预测方法或发车间隔预测模型的训练方法的电子设备的使用所创建的数据等。此外,存储器1202可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1202可选包括相对于处理器1201远程设置的存储器,这些远程存储器可以通过网络连接至发车间隔预测方法或发车间隔预测模型的训练方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
发车间隔预测方法或发车间隔预测模型的训练方法的电子设备还可以包括:输入装置1203和输出装置1204。处理器1201、存储器1202、输入装置1203和输出装置1204可以通过总线或者其他方式连接,图12中以通过总线连接为例。
输入装置1203可接收输入的数字或字符信息,以及产生与发车间隔预测方法或发车间隔预测模型的训练方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置Y04可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
可选的,用于实现发车间隔预测方法的电子设备,与用于实现发车间隔预测模型的训练方法的电子设备还可以是同一电子设备。
根据本申请实施例的技术方案,通过确定待预测的公交线路的特征数据,并基于特征数据预测得到待预测的公交线路的发车间隔时间。基于特征数据预测得到待预测的公交线路的发车间隔时间,相较于现有技术而言,置信度更高。
根据本申请实施例的技术方案,通过获取用于表征乘客乘坐公交线路的需求度的特征样本数据以及对应的发车间隔标注信息,以及基于特征样本数据以及发车间隔标注信息进行模型训练,得到用于预测公交线路的发车间隔时间的预测模型。该预测模型可以用于预测发车间隔时间。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (25)
1.一种发车间隔预测方法,其特征在于,包括:
获取待预测的公交线路;
确定所述待预测的公交线路的特征数据,所述特征数据是基于多个用户的行为轨迹数据得到的,所述特征数据用于表征乘客乘坐所述待预测的公交线路的需求度;
基于所述特征数据对所述待预测的公交线路的发车间隔时间进行预测,得到所述待预测的公交线路的发车间隔时间。
2.根据权利要求1所述的方法,其特征在于,所述特征数据包括所述待预测的公交线路的每个公交站点的定位热度特征;
所述确定所述待预测的公交线路的特征数据,包括:
针对所述待预测的公交线路的各个公交站点,确定在所述公交站点周围预设距离范围内的用户数量;
基于各个公交站点的用户数量,确定所述公交站点的定位热度特征。
3.根据权利要求1所述的方法,其特征在于,所述特征数据包括:所述待预测的公交线路的每个公交站点的站点转移热度特征;所述站点转移热度特征用于表征相邻两个站点之间的上车乘客量;
所述确定所述待预测的公交线路的特征数据,包括:
将所述多个用户行为轨迹数据与预设的公交轨迹进行匹配,得到所述多个用户的公交轨迹,所述预设的公交轨迹为待预测的公交线路上两个站点之间的公交线路;
基于所述多个用户的公交轨迹,确定各个公交站点的上车乘客数量;
基于所述各个公交站点的上车乘客数量,得到所述站点转移热度特征。
4.根据权利要求1所述的方法,其特征在于,所述特征数据包括公交线路检索热度特征;
所述确定所述待预测的公交线路的特征数据,包括:
获取多个用户在地图中的公交线路检索数据;
基于所述公交线路检索数据,确定所述公交线路的检索用户数量或所述公交线路的检索次数;
基于所述公交线路的检索用户数量或所述公交线路的检索次数,确定所述待预测的公交线路的公交线路检索热度特征。
5.根据权利要求1所述的方法,其特征在于,所述特征数据包括所述待预测的公交线路的基本特征;
所述待预测的公交线路的基本特征至少包括:总站点数量、总线路长度和公交类型信息中的至少一项。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述特征数据对所述待预测的公交线路的发车间隔时间进行预测,得到所述待预测的公交线路的发车间隔时间,包括:
基于所述特征数据,以及预设的特征数据和发车间隔时间的对应关系,得到所述待预测的公交线路的发车间隔时间。
7.根据权利要求6所述的方法,其特征在于,所述特征数据包括以下中的至少一项:高峰期特征数据、平峰期特征数据和低峰期特征数据;
所述预设的特征数据和发车间隔时间的对应关系包括以下中的至少一项:高峰期特征数据和高峰期发车间隔时间的对应关系、平峰期特征数据和平峰期发车间隔时间的对应关系、低峰期特征数据和低峰期发车间隔时间的对应关系。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述特征数据对所述待预测的公交线路的发车间隔时间进行预测,得到所述待预测的公交线路的发车间隔时间,包括:
将所述特征数据输入预设的预测模型,得到所述待预测的公交线路的发车间隔时间。
9.根据权利要求8所述的方法,其特征在于,所述特征数据包括以下中的至少一项:高峰期特征数据、平峰期特征数据和低峰期特征数据;
所述预测模型包括以下中的至少一项:高峰期预测模型、平峰期预测模型和低峰期预测模型;
所述将所述特征数据输入预设的预测模型,得到发车间隔时间,包括以下中至少一项:
将所述高峰期特征数据输入预设的高峰期预测模型,得到高峰期发车间隔时间;
将所述平峰期特征数据输入预设的平峰期预测模型,得到平峰期发车间隔时间;
将所述低峰期特征数据输入预设的低峰期预测模型,得到低峰期发车间隔时间。
10.一种发车间隔预测模型的训练方法,其特征在于,包括:
获取公交线路的特征样本数据,以及所述特征样本数据对应的发车间隔标注信息,所述特征样本数据根据多个用户的行为轨迹样本数据确定,所述特征样本数据用于表征乘客乘坐所述公交线路的需求度;
将所述特征样本数据作为待训练模型的输入,将所述发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到预测模型。
11.根据权利要求10所述的方法,其特征在于,所述特征样本数据包括:站点定位热度特征样本;
所述获取公交线路的特征样本数据,包括:
针对每条公交线路的每个公交站点,确定位于所述公交站点周围预设距离范围内的用户数量;
基于所述公交站点周围预设距离范围内的用户数量,确定所述公交站点的定位热度特征样本。
12.根据权利要求10所述的方法,其特征在于,所述特征样本数据包括:站点转移热度特征样本;
所述获取公交线路的特征样本数据,包括:
将所述多个用户行为轨迹样本数据与预设的公交轨迹进行匹配,得到所述多个用户的公交轨迹;
基于所述多个用户的公交轨迹,确定各个公交站点的上车乘客数量;
基于所述各个公交站点的上车乘客数量,得到所述站点转移热度特征样本。
13.根据权利要求10所述的方法,其特征在于,所述特征样本数据包括:公交线路检索热度特征样本;
所述获取公交线路的特征样本数据,包括:
获取多个用户在地图中的公交线路检索数据;
基于所述公交线路检索数据,确定所述公交线路的检索用户数量或所述公交线路的检索次数;
基于所述公交线路的检索用户数量或所述公交线路的检索次数,确定所述公交线路的检索热度特征样本。
14.根据权利要求10所述的方法,其特征在于,所述特征样本数据至少包括:公交线路基本特征样本;
所述公交线路基本特征样本包括:总站点数、总距离和公交类型。
15.根据权利要求10-14任一项所述的方法,其特征在于,所述特征样本数据包括以下中至少一项:高峰期特征样本数据、平峰期特征样本数据和低峰期特征样本数据;
所述将所述特征样本数据作为待训练模型的输入,将所述发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到预测模型,包括以下中至少一项训练:
将高峰期特征样本数据作为待训练模型的输入,将所述高峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到高峰期预测模型;
将平峰期特征样本数据作为待训练模型的输入,将所述平峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到平峰期预测模型;
将低峰期特征样本数据作为待训练模型的输入,将所述低峰期特征样本数据对应的发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到低峰期预测模型。
16.根据权利要求15所述的方法,其特征在于,所述高峰期特征样本数据、平峰期特征样本数据和低峰期特征样本数据基于如下方法步骤确定:
将所述多个用户行为轨迹样本数据划分为高峰期用户行为轨迹样本数据、平峰期用户行为轨迹样本数据、低峰期用户行为轨迹样本数据;
分别基于高峰期用户行为轨迹样本数据、平峰期用户行为轨迹样本数据、低峰期用户行为轨迹样本数据,确定高峰期特征样本数据、平峰期特征样本数据和低峰期特征样本数据。
17.根据权利要求10-14、16任一项所述的方法,其特征在于,所述发车间隔标注信息是基于所述公交线路的相邻两趟车辆在同一站点的GPS数据中的时间信息的时间差确定。
18.一种发车间隔预测装置,其特征在于,包括:
第一获取模块,用于获取待预测的公交线路;
第一确定模块,用于确定所述待预测的公交线路的特征数据,所述特征数据是基于多个用户的行为轨迹数据得到的,所述特征数据用于表征乘客乘坐所述待预测的公交线路的需求度;
预测模块,用于基于所述特征数据对所述待预测的公交线路的发车间隔时间进行预测,得到所述待预测的公交线路的发车间隔时间。
19.一种发车间隔预测模型的训练装置,其特征在于,包括:
第二获取模块,用于获取公交线路的特征样本数据以及所述特征样本数据对应的发车间隔标注信息,所述特征样本数据根据多个用户的行为轨迹样本数据确定,所述特征样本数据用于表征乘客乘坐所述公交线路的需求度;
训练模块,用于将所述特征样本数据作为待训练模型的输入,将所述发车间隔标注信息作为所述待训练模型的输出,对所述待训练模型进行迭代训练,得到预测模型。
20.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
21.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求10-17中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。
23.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求10-17中任一项所述的方法。
24.一种发车间隔预测方法,其特征在于,包括:
确定待预测的公交线路的特征数据;
基于所述特征数据预测得到所述待预测的公交线路的发车间隔时间。
25.一种发车间隔预测模型的训练方法,其特征在于,包括:
获取用于表征乘客乘坐公交线路的需求度的特征样本数据以及对应的发车间隔标注信息;
基于所述特征样本数据以及所述发车间隔标注信息进行模型训练,得到用于预测公交线路的发车间隔时间的预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010352008.XA CN113570099A (zh) | 2020-04-28 | 2020-04-28 | 发车间隔预测方法、预测模型训练方法及其装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010352008.XA CN113570099A (zh) | 2020-04-28 | 2020-04-28 | 发车间隔预测方法、预测模型训练方法及其装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113570099A true CN113570099A (zh) | 2021-10-29 |
Family
ID=78158284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010352008.XA Pending CN113570099A (zh) | 2020-04-28 | 2020-04-28 | 发车间隔预测方法、预测模型训练方法及其装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113570099A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102226929A (zh) * | 2011-05-20 | 2011-10-26 | 郑州大学 | 一种公交智能调度的方法 |
KR20130059957A (ko) * | 2011-11-29 | 2013-06-07 | 쌍용자동차 주식회사 | 내비게이션 시스템의 경로안내방법 |
CN104751536A (zh) * | 2013-12-25 | 2015-07-01 | 中兴通讯股份有限公司 | 一种公交站点优化评估方法和系统 |
CN105320998A (zh) * | 2015-09-22 | 2016-02-10 | 中山大学 | 一种基于ic卡刷卡数据的最优公交出行路径获取方法 |
CN105719476A (zh) * | 2016-03-28 | 2016-06-29 | 深圳市佳信捷技术股份有限公司 | 公交系统调度信息的更新方法及装置 |
CN106294629A (zh) * | 2016-08-03 | 2017-01-04 | 长信智控网络科技有限公司 | 一种公交车运行查询方法及其查询系统 |
WO2018001122A1 (zh) * | 2016-06-28 | 2018-01-04 | 高德软件有限公司 | 一种公交车行驶速度确定方法及装置 |
CN107563540A (zh) * | 2017-07-25 | 2018-01-09 | 中南大学 | 一种基于随机森林的短时公交上车客流量的预测方法 |
-
2020
- 2020-04-28 CN CN202010352008.XA patent/CN113570099A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102226929A (zh) * | 2011-05-20 | 2011-10-26 | 郑州大学 | 一种公交智能调度的方法 |
KR20130059957A (ko) * | 2011-11-29 | 2013-06-07 | 쌍용자동차 주식회사 | 내비게이션 시스템의 경로안내방법 |
CN104751536A (zh) * | 2013-12-25 | 2015-07-01 | 中兴通讯股份有限公司 | 一种公交站点优化评估方法和系统 |
CN105320998A (zh) * | 2015-09-22 | 2016-02-10 | 中山大学 | 一种基于ic卡刷卡数据的最优公交出行路径获取方法 |
CN105719476A (zh) * | 2016-03-28 | 2016-06-29 | 深圳市佳信捷技术股份有限公司 | 公交系统调度信息的更新方法及装置 |
WO2018001122A1 (zh) * | 2016-06-28 | 2018-01-04 | 高德软件有限公司 | 一种公交车行驶速度确定方法及装置 |
CN106294629A (zh) * | 2016-08-03 | 2017-01-04 | 长信智控网络科技有限公司 | 一种公交车运行查询方法及其查询系统 |
CN107563540A (zh) * | 2017-07-25 | 2018-01-09 | 中南大学 | 一种基于随机森林的短时公交上车客流量的预测方法 |
Non-Patent Citations (1)
Title |
---|
张澍裕等: "基于实时GPS的公交短时动态调度算法", 计算机科学, vol. 46, no. 6, 30 June 2019 (2019-06-30), pages 499 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3842963A1 (en) | Method and device for acquiring poi state information, apparatus, and computer storage medium | |
US9785897B2 (en) | Methods and systems for optimizing efficiency of a workforce management system | |
CN112000700A (zh) | 地图信息展示方法、装置、电子设备及存储介质 | |
CN114428828A (zh) | 基于行驶轨迹挖掘新增道路方法、装置及电子设备 | |
CN112129315B (zh) | 用于推荐停车场的方法、装置、电子设备和存储介质 | |
CN108182240B (zh) | 兴趣点新增率预测模型训练及预测方法、装置及存储介质 | |
CN113570867A (zh) | 一种城市交通状态预测方法、装置、设备及可读存储介质 | |
CN111551190B (zh) | 自动驾驶确定定位能力的方法、装置、设备及介质 | |
Ma et al. | Public transportation big data mining and analysis | |
CN111832658A (zh) | 兴趣点信息处理方法、装置、电子设备和存储介质 | |
CN111757272B (zh) | 地铁拥堵程度的预测方法、模型训练方法和装置 | |
CN110674208B (zh) | 用于确定用户的职住地信息的方法和装置 | |
CN111047107B (zh) | 公路通行时间预测方法、装置、电子设备和存储介质 | |
CN112883236A (zh) | 一种地图更新方法、装置、电子设备及存储介质 | |
CN113706857B (zh) | 道路通行性的确定方法、装置、设备及存储介质 | |
CN111694914A (zh) | 用户常驻区域确定方法及装置 | |
CN113570099A (zh) | 发车间隔预测方法、预测模型训练方法及其装置和设备 | |
CN111310961A (zh) | 数据预测方法、装置、电子设备和计算机可读存储介质 | |
CN113449754B (zh) | 标签的匹配模型训练和展示方法、装置、设备及介质 | |
CN114549051A (zh) | 跨区域的人才流动意向分析方法、装置、设备及存储介质 | |
CN112883127B (zh) | 一种道路数据处理方法、装置、电子设备和介质 | |
CN113051490A (zh) | 新增兴趣点预测模型训练、新增兴趣点预测方法及装置 | |
CN111783037A (zh) | 一种车辆里程预估模型优化方法、装置、设备及存储介质 | |
CN113741459A (zh) | 确定训练样本的方法和自动驾驶模型的训练方法、装置 | |
WO2016067460A1 (ja) | 交通行動推定システム、交通シミュレーションシステム、交通行動推定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |