CN116205460A - 基于乘客画像和eta数据的公交报站生成方法、装置及应用 - Google Patents

基于乘客画像和eta数据的公交报站生成方法、装置及应用 Download PDF

Info

Publication number
CN116205460A
CN116205460A CN202310216178.9A CN202310216178A CN116205460A CN 116205460 A CN116205460 A CN 116205460A CN 202310216178 A CN202310216178 A CN 202310216178A CN 116205460 A CN116205460 A CN 116205460A
Authority
CN
China
Prior art keywords
bus
station
stop
shift
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310216178.9A
Other languages
English (en)
Inventor
王海斌
郑凯杰
杨若松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Shuzhimeng Technology Co ltd
Original Assignee
Hangzhou Shuzhimeng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Shuzhimeng Technology Co ltd filed Critical Hangzhou Shuzhimeng Technology Co ltd
Priority to CN202310216178.9A priority Critical patent/CN116205460A/zh
Publication of CN116205460A publication Critical patent/CN116205460A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
    • G08G1/133Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams within the vehicle ; Indicators inside the vehicles or at stops

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Remote Sensing (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供一种基于乘客画像和ETA数据的公交报站生成方法、装置及应用,根据历史时间的乘客画像和ETA数据对未能依赖于GPS定位信息的公交路单数据进行报站时间的补充,本方案基于历史时间的交易簇中的乘客画像获取交易簇在待报站的班次站点发生的第一概率,基于交易簇对应的ETA数据获取交易簇在待报站的班次站点发生的第二概率,并利用维特比算法计算交易簇在待报站的班次站点发生的第三概率,以第三概率值最大值对应的交易簇的最早交易时间作为待报站的班次站点的报站时间,在缺少部分GPS定位数据的情况下准确地对遗漏的报站站点进行补充,提高公交模拟报站的准确性。

Description

基于乘客画像和ETA数据的公交报站生成方法、装置及应用
技术领域
本申请涉及公交云领域,特别是涉及一种基于乘客画像和ETA数据的公交报站生成方法、装置及应用。
背景技术
公交报站系统采用定位技术、语音解码技术和无线传输等一系列技术实现站点检测以及到离站自动播报语音功能。公交线路的公交报站功能可方便乘客及时地知晓此时的行车位置,以提早做好下车准备;也可方便公交调度中心及时地获悉每个公交线路的行车情况以做好及时有效的调度。
目前的公交报站公交报站的方式主要还是通过GPS轨迹模拟进行模拟生成,具体的方式为车载终端接收卫星的导航电文后经过解析获取车辆当前位置、速度和时间等定位信息,通过车辆当前位置和终端存储的站点位置进行比对,当车辆到达站点时自动启动语音报站模块实现报站功能。然而在实际运行过程中由于某些地段的地形原因(在山区或隧道等GPS信号不好的地段)和车载设备自身的原因(车载机损坏或者GPS信号上传丢失),导致依赖于GPS定位的公交报站系统无法提供准确的报站信息,可能会出现乘客错失下站站点的情况,且无法为乘客的乘车交易生成对应的报站,导致后续在统计公交线路客流的时候会存在缺失客流的情况,影响后续针对班次、报站以及客流的数据挖掘工作。
发明内容
本申请实施例提供了一种基于乘客画像和ETA数据的公交报站生成方法、装置及应用,在缺少部分GPS定位数据的情况下准确地对遗漏的报站站点进行补充,提高公交模拟报站的准确性。
第一方面,本申请实施例提供了一种基于乘客画像和ETA数据的公交报站生成方法,包括:
获取至少一公交路单数据,所述公交路单数据包括公交班次、班次站点以及班次时间段;
统计所述公交路单数据的公交班次在历史时间的班次时间段内的交易簇,基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率,基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率,其中所述乘客画像记录历史时间的用户乘坐公交班次的乘车交易以及待报站的班次站点的站点上车频率,所述ETA数据记录历史时间的公交班次的站点对之间的行车耗时时间;
基于所述第一概率和所述第二概率利用维特比算法计算所述交易簇在待报站的班次站点发生的第三概率,取待报站的班次站点的所述第三概率值最大值对应的交易簇的最早交易时间作为待报站的班次站点的报站时间。
第二方面,本申请实施例提供了一种基于乘客画像和ETA数据的公交报站生成装置,包括:
路单获取单元,用于获取至少一公交路单数据,所述公交路单数据包括公交班次、班次站点以及班次时间段;
概率预计单元,用于统计所述公交路单数据的公交班次在历史时间的班次时间段内的交易簇,基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率,基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率,其中所述乘客画像记录历史时间的用户乘坐公交班次的乘车交易以及待报站的班次站点的站点上车频率,所述ETA数据记录历史时间的公交班次的站点对之间的行车耗时时间;
报站生成单元,用于基于所述第一概率和所述第二概率利用维特比算法计算所述交易簇在待报站的班次站点发生的第三概率,取待报站的班次站点的所述第三概率值最大值对应的交易簇的最早交易时间作为待报站的班次站点的报站时间。
第三方面,本申请实施例提供了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行基于乘客画像和ETA数据的公交报站生成方法。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括基于乘客画像和ETA数据的公交报站生成方法。
本发明的主要贡献和创新点如下:
本方案利用历史时间的乘车画像以及ETA数据对公交路单数据的站点进行报站时间的补充生成,在缺少部分GPS定位信息的情况下利用了公交路单数据进行公交班次的补充,且充分利用已有数据进行模拟报站生成,具有完善的容错机制,仅是对原有的报站时间进行补充。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的基于乘客画像和ETA数据的公交报站生成方法的流程图;
图2是根据本申请一种实施例的基于乘客画像和ETA数据的公交报站生成方法的逻辑框架图;
图3是根据本申请实施例的库装置的基于乘客画像和ETA数据的公交报站生成装置的结构框图;
图4是根据本申请实施例的电子装置的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
实施例一
本方案提供了一种基于乘客画像和ETA数据的公交报站生成方法,为了方便对本方案的实施内容进行说明,以下对本方案涉及的专业名词进行解释:
乘客画像:历史时间内的公交班次的乘客的乘车交易,包括公交班次、上车站点、各个站点的上车频率、乘客信息以及交易发生时间。
交易簇:历史时间内的公交乘客的乘车交易按照交易发生时间进行聚类得到的集合,每一交易簇内含有符合聚类时间要求的至少一乘车交易。
ETA:不同时间段下的公交线路的各个站点之间的行车耗时时间,包括统计时间段、公交班次、开始站点、结束站点、开始站点的班次开始时间,以及站点之间的行车耗时时间。
公交路单数据:值班调度员根据行车需求调度形成的公交出车线路,包括公交班次、公交班次的班次站点、计划发车时间、计划到达时间、实际发车时间、实际到达时间、始发站以及终点站以及班次时间段。
需要说明的是,本方案中提到的公交班次对应唯一的公交线路,同一公交班次由多辆公交车辆进行共同运营,故本方案的公交班次记录有车辆标识以及运营线路标识。示例性的,车辆A和车辆B都运营公交班次101,公交班次101的公交线路为动车站至火车站,此时,公交班次101记录有车辆标识:车辆A或者车辆B,公交线路表示为101。
如图1和图2所示,本方案提供的基于乘客画像和ETA数据的公交报站生成方法,包括如下步骤:
获取至少一公交路单数据,所述公交路单数据包括公交班次、班次站点以及班次时间段;
统计所述公交路单数据的公交班次在历史时间的班次时间段内的交易簇,基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率,基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率,其中所述乘客画像记录历史时间的用户乘坐公交班次的乘车交易以及待报站的班次站点的站点上车频率,所述ETA数据记录历史时间的公交班次的站点对之间的行车耗时时间;
基于所述第一概率和所述第二概率利用维特比算法计算所述交易簇在待报站的班次站点发生的第三概率,取待报站的班次站点的所述第三概率值最大值对应的交易簇的最早交易时间作为待报站的班次站点的报站时间。
本方案提供的基于乘客画像和ETA数据的公交报站生成方法利用已有的乘车画像以及ETA对未依赖于GPS定位的公交路单数据进行模拟报站的补充,提高了公交模拟报站的准确性,且不影响原有的模拟报站系统的公交模拟报站。本方案是对未能依赖于GPS定位的公交路单数据进行模拟报站的补充,也就是说,本方案获取的至少一公交路单数据为未依赖于GPS定位的公交路单数据。在一些实施例中,在“获取至少一公交路单数据”步骤中,获取模拟报站系统生成的公交班次的班次站点的预设报站时间,依据所述预设报站时间匹配所述公交路单数据并筛选匹配不成功的公交路单数据,本方案以匹配不成功的公交路单数据进行规模拟报站的生成。需要说明的是,本方案是对无法用模拟报站系统模拟的整条公交班次的公交路单数据进行模拟报站生成。
在一些实施例中,对筛选得到的匹配不成功的公交路单数据进行正确性校验后,获取所述公交路单数据的公交班次的始发站、终点站、始发站的实际出发时间以及终点站的实际到达时间,并基于所述实际出发时间和实际到达时间计算得到当前公交班次的班次时间段。需要说明的是,本方案是通过历史的公交路单数据进行处理,历史的公交路单数据是由调度员或者司机手动添加实际发车的实际出发时间以及实际到达的实际到达时间,故依旧是可以知晓公交路单数据的实际发车时间和实际到达时间的。
具体的,所述公交路单数据指的是由值班调度员根据出车计划人为事先安排的出车计划,所述公交路单数据包括公交班次、公交班次的班次站点、计划发车时间、计划到达时间、实际发车时间、实际到达时间、始发站以及终点站以及班次时间段。
示例性的,某公交路单数据的信息为:始发站:动车站;终点站:火车站;班次站点:第一站,第二站,第三站;车辆标识:杭AXXXX;运营线路标识:101,实际出发时间:8:00;实际到达时间:10:00;
由于此类公交路单数据的班次站点是不能依赖于GPS定位信息的,故本方案在获取公交路单数据后根据已有的乘客画像以及ETA数据来对该公交路单数据进行模拟报站。
在“统计所述公交路单数据的公交班次在历史时间的班次时间段内的交易簇”步骤中,交易簇由历史时间内的乘客的乘车交易按照交易时间进行聚类得到,所述乘车交易包括公交班次、上车站点、乘客信息以及交易发生时间。
每一乘客乘坐一次公交班次就会产生一次乘车交易,同一乘客的多个乘车交易构成该乘客的乘客画像,换言之,乘客画像内含有同一乘客的至少一乘车交易。由于同一乘客可能多次在同一站点上车,故乘客画像包括历史时间的用户乘坐公交班次的乘车交易以及每个站点的站点上车频率,其中各个站点的站点上车频率根据多个乘车交易统计得到。具体的,获取乘客在该站点的上车次数以及该乘客在该公交班次的线路上的所有交易总次数,取上车次数同交易总次数的商值作为当前乘客在该站点的站点上车频率,遍历每个站点以获取乘客在每个站点的站点上车频率,而同一公交班次的设定时间段内的多个乘车交易聚类得到交易簇,每一交易簇内含有符合设定时间段的至少一乘车交易。
一般而言,当公交车在某个站点停留时,乘客依照排队次序依次上车发生乘车交易,此时同一站点上车的乘车交易根据交易时间形成交易簇。由于公交车在正常行驶过程中一般不会有新增的乘车交易,故对于同一公交班次而言,每一交易簇集中发生时则表示此时公交班次停留于某个上车站点,且每一交易簇内含有不同乘客的乘车交易。
换言之,本方案统计乘客历史时间的乘车交易形成乘客画像,乘客画像包括各个乘客在历史乘坐的公交班次上在各个站点上车的站点上车频率,按照乘乘客交易的交易时间进行聚类得到不同时间段的交易簇。
在一些实施例中,可用乘客的卡号来表征该乘客的乘客信息。示例性的,乘客李XX的乘车交易为:公交班次:101;上车站点:动车站;交易发生时间:8:30;乘车信息:1101101。乘客李XX的乘客画像为:乘客李XX的乘车交易为:公交班次:101;上车站点:动车站;交易发生时间:8:30、8:40、8:30;乘车信息:1101101;站点上车频率为:3次。
在“基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率”步骤中,自所述交易簇中筛选乘车交易次数大于设定阈值的乘客的乘客画像,并基于所述乘客画像获取所述交易簇在待报站的班次站点发生的第一概率。
在一些实施例中,自所述交易簇中筛选150天内发生15次以上乘车交易的乘客的乘客画像,当然具体的筛选条件根据实际需求可进行调整。本方案通过该方式来筛选经常乘坐同一公交班次的乘客的乘客画像进行计算,以此避免偶然性的乘车交易带来的误差。
在“基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率”步骤中,基于所述乘客画像获取待报站的班次站点的各个乘客的站点上车频率,获取待报站的班次站点的各个乘客的出现概率,取各个乘客的站点上车频率和各个乘客的出现概率的乘积和所有乘客共同出现的出现概率做商值得到待报站的班次站点的第一概率。本方案选用乘客在当前站点的站点上车频率作为待报站的班次站点的各个乘客的出现概率由于乘客之间没有联系,满足独立分布的概念,所以所有乘客在这个站点上车的概率等于各个乘客在这个站点上车的概率相乘,即各个乘客在这个站点上车的频率相乘。
换言之,所述交易簇在待报站的班次站点发生的第一概率等于待报站的班次站点的各个乘客的站点上车频率的乘积。
具体的,基于所述乘客画像获取所述交易簇在待报站的班次站点发生的第一概率的计算公式如下:
Figure BDA0004115049930000081
其中,P(station|personN)表示某个乘客N选择在待报站的班次站点上车的站点上车频率,P(personN)表示某个乘客N出现的出现概率,N为乘客的数量,分母是这些乘客共同出现的概率,由于各个乘客之间没有联系,所以满足独立分布的概念,即P(person1,person2,…,personN)和P(person1)
*P(persion2)...*P(personN)相等,在计算的时候可以分子分母约分。
本方案遍历计算所述公交班次数据的待报站的班次站点的第一概率,得到交易簇在待报站的班次站点发生的第一概率。需要说明的是,第一概率是根据历史时间的乘客画像得到的,也就是说,根据实际发生乘车交易的交易数据进行获取,这样获取的第一概率是更加符合实际公交运行规律的。
在“基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率”步骤中,ETA数据为不同时间段下的公交线路的各个站点形成的站点对之间的行车耗时时间,ETA数据包括统计时间段、公交班次、开始站点、结束站点、开始站点的班次开始时间,以及站点之间的行车耗时时间。
具体的,在“基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率”步骤中,获取每一交易簇的平均交易时间至所述班次开始时间之间的差值,获取所述班次开始时间到待报站的班次站点的行车时间以及所述行车时间的方差,基于所述差值、所述行车时间以及所述方差计算待报站的班次站点的第二概率。每一交易簇的平均交易时间是根据每一交易簇的多个乘车交易的交易时间取平均值得到。在一些实施例中,根据历史数据计算站点和站点之间的行车时间,求取站点和站点之间的行车时间的均值,计算相同站点和站点间的行车时间与均值之间的差值,从而算出行车时间的方差。
计算每一站点的第二概率的公式如下:
Figure BDA0004115049930000091
其中x为交易簇内乘车交易的平均交易时间到班次开始时间的差值,μ为班次开始时间加上到待报站的班次站点的行车时间,σ为使用的行车时间的方差,P(station)为待报站的班次站点的第二概率。
需要说明的是,本方案的第一概率由乘客画像推演得到,根据第一概率最大值可获取该交易簇所属的班次站点;第二概率由ET数据推演得到,根据第二概率最大值也可获取该交易簇所属的班次站点。在本方案中,依据第二概率为预测概率,以第一概率为转移概率,建立选择概率模型并使用维特比算法得到该交易簇最大概率所在的班次站点,以班次站点上的交易簇的最早交易时间作为该班次站点的报站时间。
在“基于所述第一概率和所述第二概率利用维特比算法计算所述交易簇在待报站的班次站点发生的第三概率,取待报站的班次站点的所述第三概率值最大值对应的交易簇的最早交易时间作为该站点的报站时间”步骤中,本方案利用维特比算法基于第一概率和第二概率计算各个交易簇在待报站的班次站点发生的最大概率组合。由于聚类算法的局限性,可能会存在同一站点的不同乘车交易被误划分为多个交易簇,此时多个交易簇对应同一站点,故本方案取每一站点的交易簇中的最早交易时间作为该站点的报站时间。
具体的,计算第三概率的公式如下:
dp[i][j]=Max(dp[i-1][k],k∈[0,j]+trans[i][j]+emit[i][j]
其中dp[i][j]表示按照时间排序的第i个交易簇在公交班次的第j个待报站的班次站点发生的概率,trans[i][j]表示第i个交易簇在公交班次的第j个待报站的班次站点发生的第一概率,emit[i][j]表示第i个交易簇在公交班次的第j个待报站的班次站点发生的第二概率。
另外,在一些实施例中,可能会存在公交线路的某个站点并不存在交易簇的情况,此时根据ETA数据对此类不存在交易簇的站点进行模拟报站处理。具体的,在“取每一站点的所述第三概率值最大值对应的交易簇的最早交易时间作为该站点的报站时间”步骤之后包括步骤:筛选未生成报站时间的待报站的班次站点作为空站点,获取所述空站点的前一个有报站时间的站点的前置报站时间,并基于所述ETA数据和所述前置报站时间计算出所述空站点的报站时间。由于ETA数据记录了站点之间的行车耗时时间,故可根据所述ETA数据和所述前置报站时间计算出当前空站点的报站时间。
当然,在一些实施例中,在获取公交路单数据的公交班次的每个站点的报站时间后,对不合理数据进行正确性修正,以便于后续的数据管理。比如若出现后置位的站点的报站时间早于前置位的站点的报站时间,则表明该公交路单数据的报站数据必然出现错误。
实施例二
基于相同的构思,参考图3,本申请还提出了一种基于乘客画像和ETA数据的公交报站生成装置,包括:
路单获取单元,用于获取至少一公交路单数据,所述公交路单数据包括公交班次、班次站点以及班次时间段;
概率预计单元,用于统计所述公交路单数据的公交班次在历史时间的班次时间段内的交易簇,基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率,基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率,其中所述乘客画像记录历史时间的用户乘坐公交班次的乘车交易以及待报站的班次站点的站点上车频率,所述ETA数据记录历史时间的公交班次的站点对之间的行车耗时时间;
报站生成单元,用于基于所述第一概率和所述第二概率利用维特比算法计算所述交易簇在待报站的班次站点发生的第三概率,取待报站的班次站点的所述第三概率值最大值对应的交易簇的最早交易时间作为待报站的班次站点的报站时间。
关于该实施例二中同于实施例一的内容在此不进行累赘说明,详尽上文描述。
实施例三
本实施例还提供了一种电子装置,参考图4,包括存储器304和处理器302,该存储器304中存储有计算机程序,该处理器302被设置为运行计算机程序以执行上述任一项基于乘客画像和ETA数据的公交报站生成方法的实施例中的步骤。
具体地,上述处理器302可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecificIntegratedCircuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器304可以包括用于数据或指令的大容量存储器304。举例来说而非限制,存储器304可包括硬盘驱动器(HardDiskDrive,简称为HDD)、软盘驱动器、固态驱动器(SolidStateDrive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器304可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器304可在数据处理装置的内部或外部。在特定实施例中,存储器304是非易失性(Non-Volatile)存储器。在特定实施例中,存储器304包括只读存储器(Read-OnlyMemory,简称为ROM)和随机存取存储器(RandomAccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(ProgrammableRead-OnlyMemory,简称为PROM)、可擦除PROM(ErasableProgrammableRead-OnlyMemory,简称为EPROM)、电可擦除PROM(ElectricallyErasableProgrammableRead-OnlyMemory,简称为EEPROM)、电可改写ROM(ElectricallyAlterableRead-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(StaticRandom-AccessMemory,简称为SRAM)或动态随机存取存储器(DynamicRandomAccessMemory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器304(FastPageModeDynamicRandomAccessMemory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDateOutDynamicRandomAccessMemory,简称为EDODRAM)、同步动态随机存取内存(SynchronousDynamicRandom-AccessMemory,简称SDRAM)等。
存储器304可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器302所执行的可能的计算机程序指令。
处理器302通过读取并执行存储器304中存储的计算机程序指令,以实现上述实施例中的任意一种基于乘客画像和ETA数据的公交报站生成方法。
可选地,上述电子装置还可以包括传输设备306以及输入输出设备308,其中,该传输设备306和上述处理器302连接,该输入输出设备308和上述处理器302连接。
传输设备306可以用来经由一个网络接收或者发送数据。上述的网络具体实例可包括电子装置的通信供应商提供的有线或无线网络。在一个实例中,传输设备包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备306可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
输入输出设备308用于输入或输出信息。在本实施例中,输入的信息可以是公交路单数据等,输出的信息可以是报站时间等。
可选地,在本实施例中,上述处理器302可以被设置为通过计算机程序执行以下步骤:
获取至少一公交路单数据,所述公交路单数据包括公交班次、班次站点以及班次时间段;
统计所述公交路单数据的公交班次在历史时间的班次时间段内的交易簇,基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率,基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率,其中所述乘客画像记录历史时间的用户乘坐公交班次的乘车交易以及待报站的班次站点的站点上车频率,所述ETA数据记录历史时间的公交班次的站点对之间的行车耗时时间;
基于所述第一概率和所述第二概率利用维特比算法计算所述交易簇在待报站的班次站点发生的第三概率,取待报站的班次站点的所述第三概率值最大值对应的交易簇的最早交易时间作为待报站的班次站点的报站时间。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
通常,各种实施例可以以硬件或专用电路、软件、逻辑或其任何组合来实现。本发明的一些方面可以以硬件来实现,而其他方面可以以可以由控制器、微处理器或其他计算设备执行的固件或软件来实现,但是本发明不限于此。尽管本发明的各个方面可以被示出和描述为框图、流程图或使用一些其他图形表示,但是应当理解,作为非限制性示例,本文中描述的这些框、装置、系统、技术或方法可以以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备或其某种组合来实现。
本发明的实施例可以由计算机软件来实现,该计算机软件由移动设备的数据处理器诸如在处理器实体中可执行,或者由硬件来实现,或者由软件和硬件的组合来实现。包括软件例程、小程序和/或宏的计算机软件或程序(也称为程序产品)可以存储在任何装置可读数据存储介质中,并且它们包括用于执行特定任务的程序指令。计算机程序产品可以包括当程序运行时被配置为执行实施例的一个或多个计算机可执行组件。一个或多个计算机可执行组件可以是至少一个软件代码或其一部分。另外,在这一点上,应当注意,如图中的逻辑流程的任何框可以表示程序步骤、或者互连的逻辑电路、框和功能、或者程序步骤和逻辑电路、框和功能的组合。软件可以存储在诸如存储器芯片或在处理器内实现的存储块等物理介质、诸如硬盘或软盘等磁性介质、以及诸如例如DVD及其数据变体、CD等光学介质上。物理介质是非瞬态介质。
本领域的技术人员应该明白,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于乘客画像和ETA数据的公交报站生成方法,其特征在于,包括:
获取至少一公交路单数据,所述公交路单数据包括公交班次、班次站点以及班次时间段;
统计所述公交路单数据的公交班次在历史时间的班次时间段内的交易簇,基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率,基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率,其中所述乘客画像记录历史时间的用户乘坐公交班次的乘车交易以及待报站的班次站点的站点上车频率,所述ETA数据记录历史时间的公交班次的站点对之间的行车耗时时间;
基于所述第一概率和所述第二概率利用维特比算法计算所述交易簇在待报站的班次站点发生的第三概率,取待报站的班次站点的所述第三概率值最大值对应的交易簇的最早交易时间作为待报站的班次站点的报站时间。
2.根据权利要求1所述的基于乘客画像和ETA数据的公交报站生成方法,其特征在于,在“获取至少一公交路单数据”步骤中,获取模拟报站系统生成的公交班次的班次站点的预设报站时间,依据所述预设报站时间匹配所述公交路单数据并筛选匹配不成功的公交路单数据。
3.根据权利要求1所述的基于乘客画像和ETA数据的公交报站生成方法,其特征在于,在“基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率”步骤中,基于所述乘客画像获取待报站的班次站点的各个乘客的站点上车频率,获取待报站的班次站点的各个乘客的出现概率,取各个乘客的站点上车频率和各个乘客的出现概率的乘积和所有乘客共同出现的出现概率做商值得到待报站的班次站点的第一概率。
4.根据权利要求1所述的基于乘客画像和ETA数据的公交报站生成方法,其特征在于,在“基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率”步骤中,ETA数据包括开始站点的班次开始时间,获取每一交易簇的平均交易时间至所述班次开始时间之间的差值,获取所述班次开始时间到待报站的班次站点的行车时间以及所述行车时间的方差,基于所述差值、所述行车时间以及所述方差计算待报站的班次站点的第二概率。
5.根据权利要求1所述的基于乘客画像和ETA数据的公交报站生成方法,其特征在于,计算第三概率的公式如下:
dp[i][j]=Max(dp[i-1][k],k∈[0,j]+trans[i][j]+emit[i][j]
其中dp[i][j]表示按照时间排序的第i个交易簇在公交班次的第j个待报站的班次站点发生的概率,trans[i][j]表示第i个交易簇在公交班次的第j个待报站的班次站点发生的第一概率,emit[i][j]表示第i个交易簇在公交班次的第j个待报站的班次站点发生的第二概率。
6.根据权利要求1所述的基于乘客画像和ETA数据的公交报站生成方法,其特征在于,筛选未生成报站时间的待报站的班次站点作为空站点,获取所述空站点的前一个有报站时间的站点的前置报站时间,并基于所述ETA数据和所述前置报站时间计算出所述空站点的报站时间。
7.根据权利要求1所述的基于乘客画像和ETA数据的公交报站生成方法,其特征在于,交易簇由历史时间内的乘客的乘车交易按照交易时间进行聚类得到,所述乘车交易包括公交班次、上车站点、乘客信息以及交易发生时间。
8.一种基于乘客画像和ETA数据的公交报站生成装置,其特征在于,包括:
路单获取单元,用于获取至少一公交路单数据,所述公交路单数据包括公交班次、班次站点以及班次时间段;
概率预计单元,用于统计所述公交路单数据的公交班次在历史时间的班次时间段内的交易簇,基于所述交易簇中的乘客画像获取所述交易簇在待报站的班次站点发生的第一概率,基于所述交易簇对应的ETA数据获取所述交易簇在待报站的班次站点发生的第二概率,其中所述乘客画像记录历史时间的用户乘坐公交班次的乘车交易以及待报站的班次站点的站点上车频率,所述ETA数据记录历史时间的公交班次的站点对之间的行车耗时时间;
报站生成单元,用于基于所述第一概率和所述第二概率利用维特比算法计算所述交易簇在待报站的班次站点发生的第三概率,取待报站的班次站点的所述第三概率值最大值对应的交易簇的最早交易时间作为待报站的班次站点的报站时间。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1到8任一所述的基于乘客画像和ETA数据的公交报站生成方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括根据权利要求1到8任一所述的基于乘客画像和ETA数据的公交报站生成方法
CN202310216178.9A 2023-03-02 2023-03-02 基于乘客画像和eta数据的公交报站生成方法、装置及应用 Pending CN116205460A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310216178.9A CN116205460A (zh) 2023-03-02 2023-03-02 基于乘客画像和eta数据的公交报站生成方法、装置及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310216178.9A CN116205460A (zh) 2023-03-02 2023-03-02 基于乘客画像和eta数据的公交报站生成方法、装置及应用

Publications (1)

Publication Number Publication Date
CN116205460A true CN116205460A (zh) 2023-06-02

Family

ID=86507569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310216178.9A Pending CN116205460A (zh) 2023-03-02 2023-03-02 基于乘客画像和eta数据的公交报站生成方法、装置及应用

Country Status (1)

Country Link
CN (1) CN116205460A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116824900A (zh) * 2023-08-24 2023-09-29 杭州数知梦科技有限公司 硬件报站与模拟报站的融合方法、系统及其应用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116824900A (zh) * 2023-08-24 2023-09-29 杭州数知梦科技有限公司 硬件报站与模拟报站的融合方法、系统及其应用
CN116824900B (zh) * 2023-08-24 2023-11-14 杭州数知梦科技有限公司 硬件报站与模拟报站的融合方法、系统及其应用

Similar Documents

Publication Publication Date Title
CN103177575B (zh) 城区出租车动态在线调度优化系统及其方法
CN104884900A (zh) 行程时间信息提供设备和行程时间信息提供方法
CN113129588B (zh) 公交车运行线路的确定方法、确定装置及电子设备
CN116205460A (zh) 基于乘客画像和eta数据的公交报站生成方法、装置及应用
CN108803559A (zh) 车辆故障分析方法、装置和系统
CN106251628B (zh) 一种确定机动车的交通出行量的方法及装置
CN114559989B (zh) 一种列车定位方法、装置、终端设备以及存储介质
CN107545318A (zh) 公交线路优先级确定、公交换乘线路排序方法及装置
CN107221183B (zh) 一种公共交通工具实时报站方法及装置
CN115164922A (zh) 一种路径规划方法、系统、设备及存储介质
CN105303245A (zh) 交通分析系统以及交通分析方法
CN109711743A (zh) 一种施工隧道车辆出勤的考核方法、计算机装置以及计算机可读存储介质
CN116204576B (zh) 一种公共交通数据生成gtfs格式数据的生成方法及系统
CN112765726A (zh) 一种寿命预测方法及装置
CN116664025A (zh) 装卸货位置点生成方法、装置及设备
CN115083198B (zh) 一种多车运力资源调度方法及装置
CN116415747A (zh) 拼车路线确定方法、装置和电子设备
CN115218912B (zh) 导航时长预估方法、装置、车辆及设备
CN114390438B (zh) 一种交通设备定位方法及装置
CN106781470B (zh) 城市道路的运行速度的处理方法及装置
CN113963550A (zh) 一种多义路径识别方法、装置及电子设备
US9261375B2 (en) Anomaly detection for road user charging systems
CN112639764A (zh) 汽车出行规律的分析方法、服务器及系统
CN113326958A (zh) 拥挤度确定和推送方法、路线规划方法及相关装置和系统
CN113682352B (zh) 列车车流推算方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination