CN111489171A - 基于二维码的乘车行程匹配方法、装置、电子设备及介质 - Google Patents

基于二维码的乘车行程匹配方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN111489171A
CN111489171A CN202010266486.9A CN202010266486A CN111489171A CN 111489171 A CN111489171 A CN 111489171A CN 202010266486 A CN202010266486 A CN 202010266486A CN 111489171 A CN111489171 A CN 111489171A
Authority
CN
China
Prior art keywords
time
travel
stroke
consuming
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010266486.9A
Other languages
English (en)
Other versions
CN111489171B (zh
Inventor
江炳坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010266486.9A priority Critical patent/CN111489171B/zh
Publication of CN111489171A publication Critical patent/CN111489171A/zh
Application granted granted Critical
Publication of CN111489171B publication Critical patent/CN111489171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/42Confirmation, e.g. check or permission by the legal debtor of payment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0022Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisions for transferring data to distant stations, e.g. from a sensing device
    • G06K17/0025Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisions for transferring data to distant stations, e.g. from a sensing device the arrangement consisting of a wireless interrogation device in combination with a device for optically marking the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/32Payment architectures, schemes or protocols characterised by the use of specific devices or networks using wireless devices
    • G06Q20/327Short range or proximity payments by means of M-devices
    • G06Q20/3274Short range or proximity payments by means of M-devices using a pictured code, e.g. barcode or QR-code, being displayed on the M-device

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Navigation (AREA)

Abstract

本说明书实施例公开了一种基于二维码的乘车行程匹配方法,在检测到目标用户使用离线码出站的出站信息时,获取所述目标用户在预设时间内的N个待定行程,其中,N为不小于2的整数;针对所述N个待定行程中的任意一个待定行程,根据行程聚类模型和该待定行程的行程耗时,获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,其中,所述行程聚类模型包括多个耗时聚类中心。

Description

基于二维码的乘车行程匹配方法、装置、电子设备及介质
技术领域
本说明书实施例涉及区块链处理技术领域,尤其涉及一种基于二维码的乘车行程匹配方法、装置、电子设备及介质。
背景技术
随着移动电子设备的飞速发展,使得移动电子设备上的应用也越来越多,促使第三方网络支付日益普及,例如在线下支付领域,用户通过智能手机即可完成支付,方便用户使用。
现有技术中用户在乘坐交通工具例如乘坐地铁和快速工具时,基本都使用双离线二维码,用户在闸机/机具上刷码的记录,会异步上传到服务端,服务端将进出站记录进行匹配后,组成完整行程进行扣款。
发明内容
本说明书实施例提供了一种基于二维码的乘车行程匹配方法、装置、电子设备及介质,能够有效提高行程匹配的准确度。
本说明书实施例第一方面提供了一种基于二维码的乘车行程匹配方法,包括:
在检测到目标用户使用离线码出站的出站信息时,获取所述目标用户在预设时间内的N个待定行程,其中,N为不小于2的整数;
针对所述N个待定行程中的任意一个待定行程,根据行程聚类模型和该待定行程的行程耗时,获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,其中,所述行程聚类模型包括多个耗时聚类中心。
本说明书实施例第二方面提供了一种基于二维码的乘车行程匹配装置,包括:
待定行程获取单元,用于在检测到目标用户使用离线码出站的出站信息时,获取所述目标用户在预设时间内的N个待定行程,其中,N为不小于2的整数;
行程匹配单元,用于针对所述N个待定行程中的任意一个待定行程,根据行程聚类模型和该待定行程的行程耗时,获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,其中,所述行程聚类模型包括多个耗时聚类中心。
本说明书实施例第三方面还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于二维码的乘车行程匹配方法的步骤。
本说明书实施例第四方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时上述基于二维码的乘车行程匹配方法的步骤。
本说明书实施例的有益效果如下:
基于上述技术方案,行程聚类模型中包括多个耗时聚类中心,根据待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,判断出该待定行程是否为真实行程;由于根据待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,能够准确的确定出待定行程与每个耗时聚类中心的关联性,由于每个耗时聚类中心所对应的行程耗时占据比例不同,在某个耗时聚类中心所占比例更大,且待定行程与占比更大的耗时聚类中心的关联性更强,则能够判断出该待定行程为真实行程的概率越大,进而使得根据待定行程与每个耗时聚类中心的关联性,能够有效提高判定待定行程是否为真实行程的准确性。
附图说明
图1为本说明书实施例中基于二维码的乘车行程匹配方法的方法流程图;
图2为本说明书实施例中行程聚类模型的模型训练步骤的方法流程图;
图3为本说明书实施例中基于二维码的乘车行程匹配装置的结构示意图;
图4为本说明书实施例中电子设备的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。
本说明书实施例中基于二维码的乘车行程匹配方法通常应用在使用双离线码乘车扣费场景中,例如现有的公交地铁二维码进出站,基本都使用双离线码,其目标是用于解决网络不稳定或弱网环境下的用户验证和支付问题;用户在闸机或机具等扫码设备上刷码的记录,会异步上传到服务端,服务端将进出站记录进行匹配后,组成完整行程进行扣款。
本说明书实施例中的二维码是指用某种特定的几何图形按一定规律在平面(二维方向上)分布的、黑白相间的、记录数据符号信息的图形;双离线是指用户的手机和扫码设备都允许离线,即用户手机在离线时能生成码,扫码设备在离线时能验证码值得正确性,用以完成进出站行为。
本说明书实施例中的行程是指用户乘坐公共交通工具例如地铁或公交时,用户从A站点刷码进站到B站点刷码出站,一次完整的乘坐过程称为行程;行程耗时是指用户乘坐公共交通工具例如地铁或公交时,用户从A站点刷码进站到B站点刷码出站,过程实际消耗的时间。
在双离线的情况下,由于网络原因,部分扫码设备可能延时上传刷码记录,服务端收到的刷码记录可能是乱序的,所以无法像传统IC卡一样在出站时上完成实时扣费。比如用户的顺序为A站进,B站出,C站进,D站出,正确的行程为A->B和C->D两个行程,计算票价也是计算AB和CD的票价。但由于扫码设备可能无法将进出站的信息及时上传,服务端收到的顺序可能为A、D、B、C,这时可能将行程错误地匹配为A->D和B->C两个行程,导致扣款出现错误。
在实际应用过程中,若某个用户操作移动设备在离线状态下生成离线码进站,扫码设备也在离线状态下扫描离线码,并对离线码进行离线验证(例如使用公钥进行离线验证),若验证出离线码合法,则控制对应的闸机开闸,并异步上传进站信息;使得服务器接收到进站信息之后,保存进站信息,此时,可以将进站信息按用户维度或时间维度放入缓存队列,其中,扫码设备可以安装在闸机上。
以及,某个用户操作移动设备在离线状态下生成离线码出站,扫码设备也在离线状态下扫描离线码,并对离线码进行离线验证(例如使用公钥进行离线验证),若验证出离线码合法,则控制对应的闸机开闸,并异步上传出站信息;使得服务器接收到出站信息之后,保存出站信息,此时,可以将出站信息按用户维度或时间维度放入缓存队列,其中,扫码设备可以安装在闸机上。
本说明书实施例中,扫码设备包括摄像装置,其中,摄像装置可以是摄像头、摄像机和云台等设备;进一步的,离线码是指在离线状态下生成的二维码。
第一方面,如图1所示,本说明书实施例提供一种基于二维码的乘车行程匹配方法,包括:
S102、在检测到目标用户使用离线码出站的出站信息时,获取目标用户在预设时间内的N个待定行程,其中,N为不小于2的整数;
S104、针对N个待定行程中的任意一个待定行程,根据行程聚类模型和该待定行程的行程耗时,获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,其中,行程聚类模型包括多个耗时聚类中心。
其中,在步骤S102中,在检测到目标用户使用离线码出站的出站信息时,获取目标用户在预设时间内的进出站信息,根据进出站信息,确定目标用户的N个待定行程,其中,N为不小于1的整数。
本说明书实施例中,预设时间可以由设备或人工自行设定,也可以根据实际需求进行设定,预设时间可以为8小时,1天和2天等,本说明书不作具体限制。
具体来讲,目标用户可以为使用离线码出站的任意一个用户,在检测到目标用户使用离线码出站的出站信息时,获取目标用户在预设时间内的所有进站信息和所有出站信息;再根据所有进站信息和所有出站信息,得到进出站信息;使得进出站信息包括目标用户在预设时间内的所有进站信息和所有出站信息。
以及,在得到进出站信息之后,再根据进出站信息,得到N个待定行程;具体地,将进出站信息中的每个进站信息和每个出站信息进行任意组合,得到N个待定行程。
具体地,将进出站信息包含的每个站点作为进站站点和出站站点,再将进出站信息包含所有站点中每两个站点进行组合,得到N个待定行程,每两个站点中的站点可以相同或不同。
例如,以目标用户为a1为例,a1使用智能手机在离线状态下生成离线码在B1站点出站,闸机上的扫码设备扫描到离线码并验证通过之后,将a1的出站信息异步上传到服务器;使得服务器接收到a1的出站信息,此时,根据a1从服务器的缓存中提取出a1在今天内的所有进站信息和所有出站信息组成的进出站信息,进出站信息包括a1在B2和B3站点进站,在b4站点出站;根据a1在B2和B3站点进站,以及在B1和B4站点出站,确定出N个待定行程包括B1站点进站和B1站点出站用TB1,B1表示,TB1,B2,TB1,B3,TB1,B4,TB2,B1,TB2,B2,TB2,B3,TB2,B4,TB3,B1,TB3,B2,TB3,B3,TB3,B4,TB4,B1,TB4,B2,TB4,B3,以及TB4,B4
在确定出N个待定行程之后,执行步骤S104,以及在执行步骤S104执行,还需训练出行程聚类模型,其中,如图2所示,行程聚类模型的模型训练步骤包括:
S2O2、获取目标线路对应的多个可行行程,其中,目标线路包括目标用户使用离线码出站的站点;
具体地,目标线路具体可以为某个城市中的地铁线路和快速公交线路等,若目标线路具有M个站点,将M个站点中的每两个站点进行任意组合,得到M×M个可行行程作为多个可行行程,其中,多个可行行程中包括同站进出的行程,其中,M为不小于2的整数。
S2O4、获取多个可行行程的历史行程数据,历史行程数据包括多个可行行程中每个可行行程的历史行程耗时;
具体地,针对多个可行行程中每个可行行程,获取该可行行程的一个或多个行程数据,基于获取每个可行行程的一个或多个行程数据,获取到历史行程数据;例如以某市地铁线路为例,可以采集该地铁线路在2年内的每个可行行程的行程数据,再根据每个可行行程对应的行程数据,确定该市地铁线路的多个可行行程的历史行程数据;其中,历史行程数据还可以包括可行行程的进出站点信息。
S2O6、使用k均值聚类算法对历史行程数据进行聚类,得到行程聚类模型。
具体地,首先确定历史行程数据对应的多个分类,基于多个分类,使用k均值聚类算法对历史行程数据的历史行程耗时进行聚类,得到行程聚类模型,使得行程聚类模型中包括多个分类对应的多个聚类中心。
具体来讲,在确定多个分类时,可以由系统用户或设备自行设定,也可以根据实际需求进行设定,例如多个分类可以为3个分类、4个分类和5个分类等。以及在确定多个分类时,还可以从历史行程数据确定出与每个分类对应的历史行程数据,以4个分类为例,可以将历史行程数据根据行程耗时平均分成4份,或者将历史行程数据随机分成4份,然后依次对4份历史行程数据进行分类,得到4个聚类中心;当然,还可以将历史行程数据分成4份,其中历史行程数据中行程耗时较长的部分历史行程数据分成2份,以及行程耗时较短的部分历史行程数据分成2份,本说明书不作具体限制。
具体来讲,为了使得行程聚类模型中的多个聚类中心能够在后续计算过程中,预测出待定行程是否为真实行程的准确度更高,使用K均值聚类算法对每个可行行程的历史行程数据进行聚类,得到行程聚类模型,具体包括以下步骤:
步骤S1、从所有历史行程数据中,获取行程耗时位于最短耗时比例中的最短历史行程数据集,使用k均值聚类算法对最短历史行程数据集进行聚类,得到最短耗时聚类中心;
步骤S2、从所有历史行程数据中,获取行程耗时位于最长耗时比例中的最长历史行程数据集,使用k均值聚类算法对最长历史行程数据集进行聚类,得到最长耗时聚类中心;
步骤S3、从所有历史行程数据中,获取行程耗时位于中间耗时比例中的中间历史行程数据集,使用k均值聚类算法对中间历史行程数据集进行聚类,得到中间耗时聚类中心;
步骤S4、根据最短耗时聚类中心、最长耗时聚类中心和中间耗时聚类中心,得到行程聚类模型。
本说明书实施例中,最短耗时比例、最长耗时比例和中间耗时比例均是预先设置的,其中,最短耗时比例为历史行程数据中行程耗时最短的行程数据比例,最短耗时比例可以5%,6%和10%等;最长耗时比例为历史行程数据中行程耗时最长的行程数据比例,最长耗时比例可以4%,5%,6%和10%等;中间耗时比例为历史行程数据中行程耗时除去最短耗时比例和最长耗时比例后的行程数据比例。
具体地,在获取到历史行程数据之后,可以根据最短耗时比例、最长耗时比例和中间耗时比例,从历史行程数据中获取到行程耗时最短的最短耗时比例例如为5%的行程数据作为最短历史行程数据集;以及从历史行程数据中获取到行程耗时最长的最长耗时比例例如为5%的行程数据作为最长历史行程数据集;以及从历史行程数据中获取到行程耗时位于中间耗时比例的行程数据作为中间历史行程数据集,即去掉行程耗时最长的最长比例的行程数据和行程耗时最短的最短比例的行程数据之后,剩余的所有行程数据作为中间历史行程数据集;然后使用K均值聚类算法分别对最短历史行程数据集、最长历史行程数据集和中间历史行程数据集进行聚类,得到最短耗时聚类中心、最长耗时聚类中心和中间耗时聚类中心。
具体地,最短历史行程数据集、最长历史行程数据集和中间历史行程数据集依次用K1,K2和K3表示,最短耗时聚类中心、最长耗时聚类中心和中间耗时聚类中心依次用x1,x2和x3表示,其中,x1为对最短历史行程数据集中所有行程数据的平均值,x2为对最长历史行程数据集中所有行程数据的平均值,x3为对中间历史行程数据集中所有行程数据的平均值;再根据x1,x2和x3,确定出行程聚类模型,其中,行程聚类模型包括3个聚类中心为x1,x2和x3。
以及在得到行程聚类模型之后,使用行程聚类模型执行步骤S104,其中,在执行步骤S104过程中,首先从N个待定行程中任意选取一个待定行程,针对选取的待定行程,执行步骤S104;若判断出选取的待定行程为真实行程,则根据待选取的待定行程,从N个待定行程中确定是否还存在需要进行行程匹配的待定行程,若存在,则从存在的待定行程中再次选取一个待定行程执行步骤S104,直至N个待定行程中不存在需要进行行程匹配的待定行程为止。
具体来讲,针对N个待定行程中的任意一个待定行程,首先可以根据存储在服务器中的该待定行程的行程数据,获取到该待定行程的行程耗时;再根据行程聚类模型和该待定行程的行程耗时,获取该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,其中,行程聚类模型包括多个耗时聚类中心。
具体来讲,若行程聚类模型包括最短耗时聚类中心、最长耗时聚类中心和中间耗时聚类中心,获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,包括:获取该待定行程的行程耗时与最短耗时聚类中心之间的第一耗时距离;获取该待定行程的行程耗时与最长耗时聚类中心之间的第二耗时距离;获取该待定行程的行程耗时与中间耗时聚类中心之间的第三耗时距离。
具体来讲,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,具体包括以下步骤:根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定出耗时距离最小的最小耗时距离;根据最小耗时距离,确定该待定行程是否为真实行程。
具体地,若行程聚类模型包括最短耗时聚类中心、最长耗时聚类中心和中间耗时聚类中心,则根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,若确定出最小耗时距离属于K1,则判定该待定行程为非真实行程;若确定出最小耗时距离属于K2,则判定该待定行程为非真实行程;若确定出最小耗时距离属于K3,则判定该待定行程为真实行程。
具体地,可以比对第一耗时距离、第二耗时距离和第三耗时距离;若对比出第三耗时距离最小,则确定该待定行程为真实行程;否则,则确定该待定行程为非真实行程。
例如,从N个待定行程中取一个待定行程T_cd,其行程耗时为xt,将其放入行程聚类模型进行如下计算,其中,T_cd表示从c站点进站,从d站点出站;计算该行程耗时和所有聚类中心的距离dtj=xt-xj,从而得到该行程耗时与x1之间的第一耗时距离为d_t1=xt-x1;该行程耗时与x2之间的第二耗时距离为d_t2=xt-x2;该行程耗时与x3之间的第二耗时距离为d_t3=xt-x3;对d_t1,d_t2和d_t3取最小值,其中,如果d_t1最小,则待定行程T_cd∈K1,此时,可以判定T_cd为非真实行程;如果d_t2最小,则待定行程T_cd∈K2,此时,可以判定T_cd为非真实行程;如果d_t3最小,则待定行程T_cd∈K3,此时,可以判定T_cd为真实行程。
由于本说明书实施例采用了K均值聚类算法对历史行程数据进行聚类,得到行程聚类模型,且行程聚类模型中包括多个耗时聚类中心,根据待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,判断出该待定行程是否为真实行程;由于根据待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,能够准确的确定出待定行程与每个耗时聚类中心的关联性,在准确的确定出待定行程与每个耗时聚类中心的关联性基础上进行真实行程的判定,使得判定结果的准确性也会随之提高,即使得判定出待定行程是否为真实行程的准确性也随之提高。
以及,由于每个耗时聚类中心所对应的行程耗时占据比例不同,在某个耗时聚类中心所占比例更大,且待定行程与占比更大的耗时聚类中心的关联性更强,则能够判断出该待定行程为真实行程的概率越大,进而使得根据待定行程与每个耗时聚类中心的关联性,能够有效提高待定行程是否为真实行程的准确性。
本说明书实施例中,为了进一步提高待定行程是否为真实行程的准确性,还可以在对比出第三耗时距离最小之后,执行以下步骤:
步骤S11、使用k均值聚类算法对中间历史行程数据集和该待定行程的行程数据进行聚类,得到另一耗时聚类中心,并将另一耗时聚类中心作为新的中间耗时聚类中心;
具体地,在对比出第三耗时距离最小之后,使用k均值聚类算法,对中间历史行程数据集和该待定行程的行程数据取平均值,得到另一耗时聚类中心。
例如,中间历史行程数据集中包括3个历史行程数据依次对应的行程耗时为20分钟,25分钟和30分钟,而该待定行程的行程数据对应的行程耗时为32分钟,则对20分钟,25分钟,30分钟和32分钟取平均值,得到另一聚类耗时聚类中心为26.75。
步骤S12、获取该待定行程的行程耗时与另一耗时聚类中心的第四耗时距离;
例如,以另一耗时聚类中心为K4且该待定行程的行程耗时为xt为例,第四耗时距离d_t4=xt-K4。
步骤S13、比对第一耗时距离、第二耗时距离和第四耗时距离;
步骤S14、若对比出第四耗时距离最小,则确定该待定行程为真实行程;否则,则确定该待定行程为非真实行程。
例如,继续以待定行程T_cd,其行程耗时为xt为例,第四耗时距离d_t4=xt-K4,并将d_t4作为新的中间耗时聚类中心,对d_t1,d_t2和d_t4取最小值,其中,如果d_t1最小,则待定行程T_cd∈K1,此时,可以判定T_cd为非真实行程;如果d_t2最小,则待定行程T_cd∈K2,此时,可以判定T_cd为非真实行程;如果d_t4最小,则待定行程T_cd∈K4,此时,可以判定T_cd为真实行程。
如此,在通过行程聚类模型在每确定出一个待定行程为真实行程时,就会对中间耗时聚类中心进行更新,使得中心耗时聚类中心会随客流的变化而随之变化,例如比如早晚高峰、节假日、周末等的行程时间会明显区别于平时的行程时间,又例如突然有场演唱会,也可能会导致客流出现变化,行程耗时也会随着变化;而在行程耗时发生变化时,使得中间耗时聚类中心也会随之发生变化,在中间耗时聚类中心与行程耗时更匹配的情况下,通过待定行程的耗时时长与中间耗时聚类中心之间的耗时距离,判断出待定行程是否为真实行程的准确性也会随之提高,进而有效降低行程匹配错误的错误率。
本说明书实施例中,针对N个待定行程中的任意一个待定行程,若判断出该待定行程为非真实行程,则表征该待定行程的行程匹配概率较低,将该待定行程的进出站信息放入存储队列,并记录放入时间,后续对目标用户进行延时行程匹配;若判断出该待定行程为真实行程,则对该待定行程进行扣费处理,并从缓存中删除该待定行程的进出站信息。
具体来讲,在缓存中删除该待定行程的进出站信息之后,还需判断N个待定行程中是否还存在需要进行行程匹配的待定行程,若存在,则从存在的待定行程中再次选取一个待定行程执行步骤S104,直至N个待定行程中不存在需要进行检测的待定行程为止。
例如,以目标用户为a1为例,a1使用智能手机在离线状态下生成离线码在B1站点出站,并确定出N个待定行程包括TB1,B1,TB1,B2,TB1,B3,TB1,B4,TB2,B1,TB2,B2,TB2,B3,TB2,B4,TB3,B1,TB3,B2,TB3,B3,TB3,B4,TB4,B1,TB4,B2,TB4,B3,以及TB4,B4;针对N个待定行程,首先从N个待定行程中选取一个待定行程TB3,B1,根据步骤S104判定出TB3,B1为真实行程,则从服务器的缓存中删除a1在B3进站和B1出站的信息,由于N个待定行程是由B1,B2,B3和B4确定的,在B3和B1不存在的情况下,N个待定行程还包括TB2,B2,TB2,B4,TB4,B2,以及TB4,B4这4个待定行程,再从这4个待定行程中选取一个待定行程执行上述步骤,直至N个待定行程中不存在需要进行行程匹配的待定行程为止。
本说明书另一实施例中,为了使得用户的体验更好,以及由于可能出现的特殊异常导致部分行程无法匹配上的问题,可以在间隔一定时间后,将按预设行程匹配方式进行简单匹配;同时行程结果会记入可疑数据,方便后续人工分析。
具体地,预设行程匹配方式具体包括当出站记录上传到服务端时,服务器端直接查找进站记录,若存一条进站记录则直接匹配;若存在多条,则按最高票价或最低票价或按时间顺序等方式进行行程匹配。
第二方面,基于相同的技术构思,本说明书实施例提供一种基于二维码的乘车行程匹配装置,参见图3,包括:
待定行程获取单元301,用于在检测到目标用户使用离线码出站的出站信息时,获取所述目标用户在预设时间内的N个待定行程,其中,N为不小于2的整数;
行程匹配单元302,用于针对所述N个待定行程中的任意一个待定行程,根据行程聚类模型和该待定行程的行程耗时,获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,其中,所述行程聚类模型包括多个耗时聚类中心。
在一种可选的实施方式中,该装置还包括:
模型训练单元,用于获取目标线路对应的多个可行行程,其中,所述目标线路包括所述目标用户使用离线码出站的站点;获取多个可行行程的历史行程数据,历史行程数据包括多个可行行程中每个可行行程的历史行程耗时;使用k均值聚类算法对所述历史行程数据进行聚类,得到所述行程聚类模型。
在一种可选的实施方式中,模型训练单元,用于从所述历史行程数据中,获取行程耗时位于预设的最短耗时比例中的最短历史行程数据集,使用k均值聚类算法对所述最短历史行程数据集进行聚类,得到最短耗时聚类中心;从所述历史行程数据中,获取行程耗时位于预设的最长耗时比例中的最长历史行程数据集,使用k均值聚类算法对所述最长历史行程数据集进行聚类,得到最长耗时聚类中心;从所述历史行程数据中,获取行程耗时位于预设的中间耗时比例中的中间历史行程数据集,使用k均值聚类算法对所述中间历史行程数据集进行聚类,得到中间耗时聚类中心;根据所述最短耗时聚类中心、所述最长耗时聚类中心和所述中间耗时聚类中心,得到所述行程聚类模型。
在一种可选的实施方式中,行程匹配单元302,用于获取该待定行程的行程耗时与所述最短耗时聚类中心之间的第一耗时距离;获取该待定行程的行程耗时与所述最长耗时聚类中心之间的第二耗时距离;获取该待定行程的行程耗时与所述中间耗时聚类中心之间的第三耗时距离。
在一种可选的实施方式中,行程匹配单元302,用于比对所述第一耗时距离、所述第二耗时距离和所述第三耗时距离;若对比出所述第三耗时距离最小,则确定该待定行程为真实行程;否则,则确定该待定行程为非真实行程。
在一种可选的实施方式中,行程匹配单元302,用于在对比出所述第三耗时距离最小之后,使用k均值聚类算法对所述中间历史行程数据集和该待定行程的行程数据进行聚类,得到另一耗时聚类中心;获取该待定行程的行程耗时与所述另一耗时聚类中心的第四耗时距离;比对所述第一耗时距离、所述第二耗时距离和所述第四耗时距离;若对比出所述第四耗时距离最小,则确定该待定行程为真实行程;否则,则确定该待定行程为非真实行程。
在一种可选的实施方式中,待定行程获取单元301,用于获取所述目标用户在预设时间内的进出站信息;根据所述进出站信息,确定所述目标用户的N个待定行程。
在一种可选的实施方式中,该装置还包括:
扣费处理单元,用于在针对所述N个待定行程中的任意一个待定行程,确定出该待定行程是否为真实行程之后,若该待定行程为真实行程,则对该待定行程进行扣费处理;
行程匹配单元302,若该待定行程为非真实行程,用于针对所述目标用户进行延时行程匹配。
第三方面,基于与前述实施例中基于二维码的乘车行程匹配方法同样的发明构思,本说明书实施例还提供一种电子设备,如图4所示,包括存储器404、处理器402及存储在存储器404上并可在处理器402上运行的计算机程序,所述处理器402执行所述程序时实现前文所述基于二维码的乘车行程匹配方法的任一方法的步骤。
其中,在图4中,总线架构(用总线400来代表),总线400可以包括任意数量的互联的总线和桥,总线400将包括由处理器402代表的一个或多个处理器和存储器404代表的存储器的各种电路链接在一起。总线400还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口405在总线400和接收器401和发送器403之间提供接口。接收器401和发送器403可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器402负责管理总线400和通常的处理,而存储器404可以被用于存储处理器402在执行操作时所使用的数据。
第四方面,基于与前述实施例中基于二维码的乘车行程匹配方法的发明构思,本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述基于二维码的乘车行程匹配方法的任一方法的步骤。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

Claims (18)

1.一种基于二维码的乘车行程匹配方法,包括:
在检测到目标用户使用离线码出站的出站信息时,获取所述目标用户在预设时间内的N个待定行程,其中,N为不小于2的整数;
针对所述N个待定行程中的任意一个待定行程,根据行程聚类模型和该待定行程的行程耗时,获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,其中,所述行程聚类模型包括多个耗时聚类中心。
2.如权利要求1所述的方法,所述行程聚类模型的模型训练步骤,包括:
获取目标线路对应的多个可行行程,其中,所述目标线路包括所述目标用户使用离线码出站的站点;
获取多个可行行程的历史行程数据,历史行程数据包括多个可行行程中每个可行行程的历史行程耗时;
使用k均值聚类算法对所述历史行程数据进行聚类,得到所述行程聚类模型。
3.如权利要求2所述的方法,所述使用k均值聚类算法对每个可行行程的历史行程数据进行聚类,得到所述行程聚类模型,包括:
从所述历史行程数据中,获取行程耗时位于预设的最短耗时比例中的最短历史行程数据集,使用k均值聚类算法对所述最短历史行程数据集进行聚类,得到最短耗时聚类中心;
从所述历史行程数据中,获取行程耗时位于预设的最长耗时比例中的最长历史行程数据集,使用k均值聚类算法对所述最长历史行程数据集进行聚类,得到最长耗时聚类中心;
从所述历史行程数据中,获取行程耗时位于预设的中间耗时比例中的中间历史行程数据集,使用k均值聚类算法对所述中间历史行程数据集进行聚类,得到中间耗时聚类中心;
根据所述最短耗时聚类中心、所述最长耗时聚类中心和所述中间耗时聚类中心,得到所述行程聚类模型。
4.如权利要求3所述的方法,所述获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,包括:
获取该待定行程的行程耗时与所述最短耗时聚类中心之间的第一耗时距离;
获取该待定行程的行程耗时与所述最长耗时聚类中心之间的第二耗时距离;
获取该待定行程的行程耗时与所述中间耗时聚类中心之间的第三耗时距离。
5.如权利要求4所述的方法,所述根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,包括:
比对所述第一耗时距离、所述第二耗时距离和所述第三耗时距离;
若对比出所述第三耗时距离最小,则确定该待定行程为真实行程;否则,则确定该待定行程为非真实行程。
6.如权利要求4所述的方法,若对比出所述第三耗时距离最小,则确定该待定行程为真实行程,包括:
使用k均值聚类算法对所述中间历史行程数据集和该待定行程的行程数据进行聚类,得到另一耗时聚类中心;
获取该待定行程的行程耗时与所述另一耗时聚类中心的第四耗时距离;
比对所述第一耗时距离、所述第二耗时距离和所述第四耗时距离;
若对比出所述第四耗时距离最小,则确定该待定行程为真实行程;否则,则确定该待定行程为非真实行程。
7.如权利要求1-6任一项所述的方法,所述获取所述目标用户在预设时间内的N个待定行程,包括:
获取所述目标用户在预设时间内的进出站信息;
根据所述进出站信息,确定所述目标用户的N个待定行程。
8.如权利要求1-6任一项所述的方法,在针对所述N个待定行程中的任意一个待定行程,确定出该待定行程是否为真实行程之后,所述方法还包括:
若该待定行程为真实行程,则对该待定行程进行扣费处理;
若该待定行程为非真实行程,则针对所述目标用户进行延时行程匹配。
9.一种基于二维码的乘车行程匹配装置,包括:
待定行程获取单元,用于在检测到目标用户使用离线码出站的出站信息时,获取所述目标用户在预设时间内的N个待定行程,其中,N为不小于2的整数;
行程匹配单元,用于针对所述N个待定行程中的任意一个待定行程,根据行程聚类模型和该待定行程的行程耗时,获取该待定行程的行程耗时与所述行程聚类模型中每个耗时聚类中心之间的耗时距离,根据该待定行程的行程耗时与每个耗时聚类中心之间的耗时距离,确定该待定行程是否为真实行程,其中,所述行程聚类模型包括多个耗时聚类中心。
10.如权利要求9所述的装置,还包括:
模型训练单元,用于获取目标线路对应的多个可行行程,其中,所述目标线路包括所述目标用户使用离线码出站的站点;获取多个可行行程的历史行程数据,历史行程数据包括多个可行行程中每个可行行程的历史行程耗时;使用k均值聚类算法对所述历史行程数据进行聚类,得到所述行程聚类模型。
11.如权利要求10所述的装置,所述模型训练单元,用于从所述历史行程数据中,获取行程耗时位于预设的最短耗时比例中的最短历史行程数据集,使用k均值聚类算法对所述最短历史行程数据集进行聚类,得到最短耗时聚类中心;从所述历史行程数据中,获取行程耗时位于预设的最长耗时比例中的最长历史行程数据集,使用k均值聚类算法对所述最长历史行程数据集进行聚类,得到最长耗时聚类中心;从所述历史行程数据中,获取行程耗时位于预设的中间耗时比例中的中间历史行程数据集,使用k均值聚类算法对所述中间历史行程数据集进行聚类,得到中间耗时聚类中心;根据所述最短耗时聚类中心、所述最长耗时聚类中心和所述中间耗时聚类中心,得到所述行程聚类模型。
12.如权利要求11所述的装置,所述行程匹配单元,用于获取该待定行程的行程耗时与所述最短耗时聚类中心之间的第一耗时距离;获取该待定行程的行程耗时与所述最长耗时聚类中心之间的第二耗时距离;获取该待定行程的行程耗时与所述中间耗时聚类中心之间的第三耗时距离。
13.如权利要求12所述的装置,所述行程匹配单元,用于比对所述第一耗时距离、所述第二耗时距离和所述第三耗时距离;若对比出所述第三耗时距离最小,则确定该待定行程为真实行程;否则,则确定该待定行程为非真实行程。
14.如权利要求12所述的装置,所述行程匹配单元,用于在对比出所述第三耗时距离最小之后,使用k均值聚类算法对所述中间历史行程数据集和该待定行程的行程数据进行聚类,得到另一耗时聚类中心;获取该待定行程的行程耗时与所述另一耗时聚类中心的第四耗时距离;比对所述第一耗时距离、所述第二耗时距离和所述第四耗时距离;若对比出所述第四耗时距离最小,则确定该待定行程为真实行程;否则,则确定该待定行程为非真实行程。
15.如权利要求9-14任一项所述的装置,所述待定行程获取单元,用于获取所述目标用户在预设时间内的进出站信息;根据所述进出站信息,确定所述目标用户的N个待定行程。
16.如权利要求9-14任一项所述的装置,还包括:
扣费处理单元,用于在针对所述N个待定行程中的任意一个待定行程,确定出该待定行程是否为真实行程之后,若该待定行程为真实行程,则对该待定行程进行扣费处理;
所述行程匹配单元,若该待定行程为非真实行程,用于针对所述目标用户进行延时行程匹配。
17.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-8任一项所述方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-8任一项所述方法的步骤。
CN202010266486.9A 2020-04-07 2020-04-07 基于二维码的乘车行程匹配方法、装置、电子设备及介质 Active CN111489171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010266486.9A CN111489171B (zh) 2020-04-07 2020-04-07 基于二维码的乘车行程匹配方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010266486.9A CN111489171B (zh) 2020-04-07 2020-04-07 基于二维码的乘车行程匹配方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN111489171A true CN111489171A (zh) 2020-08-04
CN111489171B CN111489171B (zh) 2022-10-14

Family

ID=71811646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010266486.9A Active CN111489171B (zh) 2020-04-07 2020-04-07 基于二维码的乘车行程匹配方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN111489171B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112731492A (zh) * 2020-12-18 2021-04-30 中国平安财产保险股份有限公司 一种检测虚拟行程的方法及其相关设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176226A (ja) * 1992-12-07 1994-06-24 Fuji Electric Co Ltd 不正乗車発見装置および運賃精算装置
EP1769437A2 (en) * 2004-05-21 2007-04-04 Sabre, Inc. Systems, methods, and computer program products for searching and displaying low cost productavailability information for a given departure-return date combination or range of departure-return data combinations
CN107543558A (zh) * 2016-06-29 2018-01-05 高德软件有限公司 公交站点间行驶耗时确定方法、公交导航方法及装置
CN108234517A (zh) * 2018-01-29 2018-06-29 成都智元汇信息技术股份有限公司 一种基于离线二维码票卡的地铁乘车离线处理系统及方法
CN109150817A (zh) * 2017-11-24 2019-01-04 新华三信息安全技术有限公司 一种网页请求识别方法及装置
CN109191174A (zh) * 2018-07-27 2019-01-11 阿里巴巴集团控股有限公司 一种期望时长区间确定方法、行程验证方法及装置
CN110347122A (zh) * 2018-04-03 2019-10-18 阿里巴巴集团控股有限公司 一种出站时刻确定、数据确定方法、装置及其设备
CN110689804A (zh) * 2019-10-10 2020-01-14 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176226A (ja) * 1992-12-07 1994-06-24 Fuji Electric Co Ltd 不正乗車発見装置および運賃精算装置
EP1769437A2 (en) * 2004-05-21 2007-04-04 Sabre, Inc. Systems, methods, and computer program products for searching and displaying low cost productavailability information for a given departure-return date combination or range of departure-return data combinations
CN107543558A (zh) * 2016-06-29 2018-01-05 高德软件有限公司 公交站点间行驶耗时确定方法、公交导航方法及装置
CN109150817A (zh) * 2017-11-24 2019-01-04 新华三信息安全技术有限公司 一种网页请求识别方法及装置
CN108234517A (zh) * 2018-01-29 2018-06-29 成都智元汇信息技术股份有限公司 一种基于离线二维码票卡的地铁乘车离线处理系统及方法
CN110347122A (zh) * 2018-04-03 2019-10-18 阿里巴巴集团控股有限公司 一种出站时刻确定、数据确定方法、装置及其设备
CN109191174A (zh) * 2018-07-27 2019-01-11 阿里巴巴集团控股有限公司 一种期望时长区间确定方法、行程验证方法及装置
CN110689804A (zh) * 2019-10-10 2020-01-14 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112731492A (zh) * 2020-12-18 2021-04-30 中国平安财产保险股份有限公司 一种检测虚拟行程的方法及其相关设备
CN112731492B (zh) * 2020-12-18 2024-02-06 中国平安财产保险股份有限公司 一种检测虚拟行程的方法及其相关设备

Also Published As

Publication number Publication date
CN111489171B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
CN107679557B (zh) 驾驶模型训练方法、驾驶人识别方法、装置、设备及介质
CN112700072B (zh) 交通状况预测方法、电子设备和存储介质
CN111985710A (zh) 一种公交乘客出行站点预测方法、存储介质及服务器
CN106022541B (zh) 一种到站时间预测方法
JP6939911B2 (ja) 適応的に車両を制御する方法及び装置
Huang et al. A novel bus-dispatching model based on passenger flow and arrival time prediction
CN105023437B (zh) 一种公交od矩阵的构建方法及系统
CN110570678B (zh) 一种公交车辆从起点到终点总行驶时间预测方法及装置
WO2021121354A1 (en) Model-based deep reinforcement learning for dynamic pricing in online ride-hailing platform
CN113287124A (zh) 用于搭乘订单派遣的系统和方法
CN110570656B (zh) 定制公共交通线路方法及装置
CN105117790A (zh) 车费预估方法及装置
CN108416619B (zh) 一种消费间隔时间预测方法、装置及可读存储介质
CN112507624B (zh) 一种城际公路出行方式识别模型构建、识别方法及装置
CN107392389A (zh) 基于arima模型的出租车调度处理方法
JP6307376B2 (ja) 交通分析システム、交通分析プログラムおよび交通分析方法
CN104599002A (zh) 预测订单价值的方法及设备
CN114547128A (zh) 虚假订单的识别方法、系统、计算机设备及存储介质
CN114117883A (zh) 一种基于强化学习的自适应轨道交通调度方法、系统、终端
CN111489171B (zh) 基于二维码的乘车行程匹配方法、装置、电子设备及介质
CN116777042A (zh) 一种基于区块链与联邦学习融合的交通流预测方法
CN113159408B (zh) 轨道交通站点客流预测方法及装置
CN113807560A (zh) 一种物流成本预测方法、装置、电子设备以及存储介质
CN115689245A (zh) 一种用于确定不同场景下骑手的背单量的方法及装置
CN112860766B (zh) 一种公交运行车次认定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant