CN117634721A - 人群预测模型训练方法及相关方法、装置和设备 - Google Patents

人群预测模型训练方法及相关方法、装置和设备 Download PDF

Info

Publication number
CN117634721A
CN117634721A CN202311305911.0A CN202311305911A CN117634721A CN 117634721 A CN117634721 A CN 117634721A CN 202311305911 A CN202311305911 A CN 202311305911A CN 117634721 A CN117634721 A CN 117634721A
Authority
CN
China
Prior art keywords
site
crowd
determining
station
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311305911.0A
Other languages
English (en)
Inventor
潘天鹭
王耀威
张纯
吴益灵
袁锦宇
黄文柯
王握
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peng Cheng Laboratory
Original Assignee
Peng Cheng Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peng Cheng Laboratory filed Critical Peng Cheng Laboratory
Priority to CN202311305911.0A priority Critical patent/CN117634721A/zh
Publication of CN117634721A publication Critical patent/CN117634721A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种人群预测模型训练方法及相关方法、装置和设备。包括:获取对象的刷卡数据,根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据,以生成第一站点的第一特征数据;确定第一站点相关联的第一栅格以及相关联的关联站点,根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。该模型能提升人群预测准确性。

Description

人群预测模型训练方法及相关方法、装置和设备
技术领域
本申请涉及通信技术领域,具体涉及一种人群预测模型训练方法及相关方法、装置和设备。
背景技术
随着城市交通的快速发展,乘坐公共交通工具出行已经成为了生活在城市的人群的重要交通方式,因此需要灵活的调用公共交通工具的数量、班次、路线等运营数据,从而实现更加高效的公共交通运输。
相关技术中,通过确定公共交通覆盖的整个范围中的每个社区,然后对每个社区内的客流量进行分析得到分析结果,最后根据分析结果来确定出站点的人口流量。
但是,对每个社区内的客流量进行分析得到分析结果的做法比较简单粗糙,得到的分析结果存在不准确性,从而导致最终根据分析结果确定的运营数据也存在不准确的问题。
发明内容
本申请实施例提供一种人群预测模型训练方法及相关方法、装置和设备,它能够提升人群预测的准确性。
一种人群预测模型训练方法,包括:
获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;
根据出行信息和目标交通数据生成第一站点的第一特征数据;
确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;
确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;
根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;
根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
一种人群预测方法,包括:
确定出第一交通工具对应的目标站点以及目标站点对应的预测时间和位置信息;
获取目标站点对应的人群特征数据;
将目标站点对应的预测时间、位置信息和人群特征数据输入至本申请实施例提供的人群预测模型训练方法训练出的人群预测模型中,得到目标站点在预测时间对应的预测人群流入总量。
一种人群预测模型训练装置,包括:
第一获取模块,用于获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;
第一生成模块,用于根据出行信息和目标交通数据生成第一站点的第一特征数据;
第二生成模块,用于确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;
第一确定模块,用于确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;
第三生成模块,用于根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;
训练模块,用于根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
在一些实施方式中,刷卡数据包括刷卡时间,预设交通数据包括第一交通工具的离到站时间,第一获取模块,用于:
根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息,包括:
根据刷卡时间和离到站时间确定出对象的出行驻留时间;
根据出行驻留时间确定出对象的出行信息。
在一些实施方式中,第一获取模块,用于:
根据刷卡时间确定出相邻的第一刷卡时间和第二刷卡时间,第一刷卡时间在第二刷卡时间之后;
在离到站时间中,将最接近第一刷卡时间且在第一刷卡时间之前的到站时间确定为上车时间;
根据第二刷卡时间和上车时间确定出对象的出行驻留时间。
在一些实施方式中,刷卡数据包括刷卡车辆标识,预设交通数据包括第一交通工具的车辆标识,第一获取模块,用于:
在车辆标识中确定出与刷卡车辆标识相匹配的目标车辆标识;
在预设交通数据中将目标车辆标识对应的交通数据确定为第一站点对应的目标交通数据。
在一些实施方式中,第二生成模块,用于:
获取第一站点的第一站点位置,以及每一栅格的中心位置;
将距离第一站点位置在第一预设距离范围内的中心位置确定为目标中心位置;
将目标中心位置对应的栅格确定为第一站点相关联的第一栅格。
在一些实施方式中,第二生成模块,用于:
在预设交通数据中确定出第一交通工具对应的班次信息以及站点信息;
根据班次信息和站点信息确定出在第一站点的预设站点距离内的站点,并将预设站点距离内的站点确定为第一站点相关联的关联站点。
在一些实施方式中,第二生成模块,用于:
获取相关联的第一栅格对应的第一关联人群信息;
获取第一站点和关联站点对应的第二关联人群信息;
根据第一关联人群信息和第二关联人群信息确定出第一站点的第二特征数据。
在一些实施方式中,第二生成模块,用于:
获取第一预设时间段内第一站点的人群流入量和人群流出量,以及每一关联站点的人群流入量和人群流出量;
将第一站点的人群流入量和人群流出量以及每一关联站点的人群流入量和人群流出量确定为第二关联人群信息。
在一些实施方式中,第一确定模块,用于:
确定所述第一站点的第一站点位置,将距离所述第一站点位置在第二预设距离范围内的第二交通工具的站点确定为与所述第一站点相关联的第二站点;
获取所述第二站点的第二站点位置,将距离所述第二站点位置在第三预设距离范围内的栅格确定为所述第二站点对应的第二栅格。
在一些实施方式中,第三生成模块,用于:
获取所述第一栅格和所述第二栅格之间对应的重叠区域,并确定第二预设时间段内所述重叠区域的人群流入量;
确定第二预设时间段内所述第一栅格对应的人群流入量;
根据所述重叠区域的人群流入量和所述第一栅格对应的人群流入量确定出所述第一交通工具被所述第二交通工具替代的评分值,所述第三特征数据包括所述评分值。
在一些实施方式中,训练模块,用于:
确定所述第一站点对应的目标时间、所述第一站点在所述目标时间对应的人群流入总量以及所述第一站点的坐标信息;
根据所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据,以及所述人群流入总量、所述目标时间和所述坐标信息对基础模型进行训练,得到人群预测模型。
在一些实施方式中,训练模块,用于:
将所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据,以及所述人群流入总量、所述目标时间和所述坐标信息输入至所述基础模型中,得到估算人群流入总量;
确定所述人群流入总量和所述估算人群流入总量之间的损失值,当所述损失值满足预设损失条件,则所述基础模型训练完成得到人群预测模型。
一种人群预测装置,其特征在于,包括:
第二确定模块,用于确定出第一交通工具对应的目标站点以及目标站点对应的预测时间和位置信息;
第二获取模块,用于获取目标站点对应的人群特征数据;
预测模块,用于将目标站点对应的预测时间、位置信息和人群特征数据输入至本申请实施例提供的人群预测模型训练方法训练出的人群预测模型中,得到目标站点在预测时间对应的预测人群流入总量。
一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请实施例提供的人群预测模型训练方法或者本申请实施例提供的人群预测方法。
一种计算机设备,包括存储器、处理器以及存储在存储器中并可以在处理器上运行的计算机程序,处理器执行计算机程序时实现本申请实施例提供的人群预测模型训练方法或者本申请实施例提供的人群预测方法。
本申请实施例中,通过获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;根据出行信息和目标交通数据生成第一站点的第一特征数据;确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。以此,通过获取第一站点对应的不同类型的特征数据,然后利用不同类型的特征数据中的至少一种数据来对基础模型进行训练,训练出的人群预测模型能够预测出站点在某一时间下的人群流入总量。相对于相关技术中直接利用整个社区的客流量进行分析来确定站点的人口流量,本申请中的人群预测模型能够更加准确的预测出站点的人群流入总量,从而提高了对人群预测的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的人群预测的场景示意图。
图2是本申请实施例提供的人群预测模型训练方法的流程示意图。
图3是本申请实施例提供的人群预测模型训练方法的另一流程示意图;
图4是本申请实施例提供的第一站点的第一栅格示意图;
图5是本申请实施例提供的人群预测模型训练方法的另一流程示意图;
图6是本申请实施例提供的首发或返程的公交场景示意图;
图7是本申请实施例提供的接驳的公交场景示意图;
图8是本申请实施例提供的换乘的公交场景示意图;
图9是本申请实施例提供的公交和地铁的公交场景示意图。
图10是本申请实施例提供的人群预测模型训练方法的另一流程示意图;
图11是本申请实施例提供的人群预测模型训练方法的另一流程示意图;
图12是本申请实施例提供的人群预测方法的流程示意图;
图13是本申请实施例提供的预测值和观测值的对比图;
图14是本申请实施例提供的预测值和观测值的另一对比图;
图15是本申请实施例提供的预测值和观测值的另一对比图;
图16是本申请实施例提供的人群预测模型训练装置的结构示意图;
图17是本申请实施例提供的人群预测装置的结构示意图;
图18是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请的方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
可以理解的是,在本申请的具体实施方式中,涉及到的人群信息或者单个对象的相关信息,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
需要说明的是,在说明书、权利要求书和上述附图所描述的一些流程中,包含了按照特定顺序出现的多个步骤,但应该清楚了解,这些步骤可以不按照其在本文中出现的顺序来执行或并行执行,步骤序号仅仅是用于区分开各个不同的步骤,序号本身不代表任何的执行顺序。此外,本文中的“第一”、“第二”或者“目标”等描述,是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
随着城市交通的快速发展,乘坐公共交通工具出行已经成为了生活在城市的人群的首选交通方式,因此需要灵活的调用公共交通工具的数量、班次、路线等运营数据,从而实现更加高效的公共交通运输。
相关技术中,通过确定公共交通覆盖的整个范围中的每个社区,然后对每个社区内的客流量进行分析得到分析结果,最后根据分析结果来确定出站点的人口流量。
但是,对每个社区内的客流量进行分析得到分析结果的做法比较简单粗糙,得到的分析结果存在不准确性,从而导致最终根据分析结果确定的运营数据也存在不准确的问题。
本申请实施例为了解决上述技术问题,提出一种人群预测模型训练方法,通过该人群预测模型训练方法训练出的人群预测模型,能够对站点某一时间的人群流入总量进行预测,从而提高了人群预测的准确性。
请参阅图1,图1是本申请实施例提供的人群预测的场景示意图。
如图1所示,其中包括了公共交通工具的公共交通路线。还包括公共交通工具对应的站点,比如站点1、站点2、站点3和站点4。还包括一些地区建筑,比如学校、医院、商场等。
可以理解的是,城市中由于建筑资源的分布情况不同,会导致一些站点的客流量大,一些站点的客流量少,比如医院和商场对应的站点3的客流量就比较大,而站点1和站点2旁边没有这种公共建筑资源,则站点1和站点2对应的客流量就比较少。
时间的变化也会引起站点的客流量变化,比如星期一到星期五,学生每天都要上学,则站点4在早上和晚上对应的客流量较大。而星期六和星期天,学生放假了,则站点4全天的客流量都会比较少。
因此,在分析站点对应的客流量时,需要结合时间、地理位置来综合分析,从而实现预测站点在未来的不同时间对应的人群流入总量。
需要说明的是,本申请中利用人群预测模型所预测的人群是公共交通特征客流人群,比如公交车、地铁等公共交通工具对应的客流人群。
为了能够快速准确地确定出站点在某一时间的人群流入总量,可以通过人群预测模型来进行预测。可以理解的是,在使用人群预测模型之前,还需要对人群预测模型对应的基础模型进行训练,从而得到人群预测模型。
请参阅图2,图2是本申请实施例提供的人群预测模型训练方法的流程示意图。计算机设备为该人群预测模型训练方法的执行主体,该人群预测模型训练方法可以包括如下步骤:
110、获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据。
在公共交通工具运营时,对象需要通过刷卡、扫码、刷脸等方式来进行付款乘坐,此时可以记录下该对象对应的刷卡数据。其中,刷卡数据可以包括刷卡时间、刷卡车辆标识、刷卡地点、刷卡金额、刷卡设备标识、刷卡对象标识等等。如果对象在第一站点刷卡,则可以获取第一站点对应的刷卡数据。
第一交通工具对应有预设交通数据,该预设交通数据包括第一交通工具的班次信息以及对应的站点信息,比如班次信息包括每个车辆的发车时间和离到站时间。站点信息包括每个车辆在运行时所需要经过的站点,以及站点的站点序号、站点的标准位置、站点的名称等等。第一交通工具可以理解为是公交车,第一交通工具对应的站点可以理解为是公交站点。
其中,预设交通数据还有对应的公共交通路线,针对于一条公共交通路线有上行路线和下行路线,可以将上行路线的上行站序和下行路线的下行站序进行组合,从而得到最终的公共交通路线。比如,X线路上行路线的终点站序是30号,那么下行路线的第2站在公共交通路线中的站序是第32站。
其中,预设交通数据中包含了预先设置的固定不变的数据,比如每个站点的标准位置。预设交通数据中还包含了车辆运行时动态产生的数据,比如车辆在每一个站点的离到站时间。
在获取到刷卡数据和预设交通数据之后,可以根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据。
在一些实施方式中,根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息,包括:
(1.1)根据刷卡时间和离到站时间确定出对象的出行驻留时间;
(1.2)根据出行驻留时间确定出对象的出行信息。
通过出行驻留时间,能够确定出对象在乘坐第一交通工具出行时的出行信息,出行信息包括对象的出行目的,后续可以根据出行信息来对基础模型进行训练,从而增加基础模型训练的维度,以提高后续训练出的人群预测模型的预测准确度。
具体地,在对象出行时,若在预设时间内涉及到俩次刷卡,比如对象先乘坐车辆A,然后换乘刷卡乘坐车辆B。其中乘坐车辆A时对应有一个刷卡时间,在乘坐车辆B时对应有另一个刷卡时间,可以根据这两个不同的刷卡时间确定出对象的出行驻留时间。
比如,可以直接将乘坐车辆A的刷卡时间确定为上车时间,直接将乘坐车辆B的刷卡时间确定为下车时间,上车时间和下车时间之间的时间差就可以是对象的出行驻留时间。
在确定出行驻留时间之后,可以根据出行驻留时间确定对象的出行信息。比如,预设有以下几种出行目的:短时外出返程(公交下车-公交上车时间差大于20分钟小于2小时),长时外出返程(公交下车-公交上车时间差大于2小时小于6小时),通勤返程公交下车-公交上车时间差大于6小时小于10小时),超长驻留返程(当日公交下车-公交上车时间差大于10小时)。轨道-公交接驳(轨道出闸-公交上车时间差小于20分钟)。公交-公交接驳(公交下车-公交上车时间差小于20分钟)等。
可以将出行驻留时间和上述几种出行目的匹配,从而确定出对象的目标出行目的,将该目标出行目的确定为对象的出行信息。比如,出行驻留时间大于20分钟小于2小时,在该出行目的为短时外出返程,将该出行目的确定为对象的出行信息。
请一并参阅图3,图3是本申请实施例提供的人群预测模型训练方法的另一流程示意图。在一些实施方式中,根据刷卡时间和离到站时间确定出对象的出行驻留时间,包括如下步骤:
201、根据刷卡时间确定出相邻的第一刷卡时间和第二刷卡时间,第一刷卡时间在第二刷卡时间之后。
具体地,对象的刷卡数据中的刷卡时间可以是多个,可以获取相邻的第一刷卡时间和第二刷卡时间,该相邻的第一刷卡时间和第二刷卡时间可以是在预设时长内的,比如第一刷卡时间和第二刷卡时间之间的差值不超过三小时。
202、在离到站时间中,将最接近第一刷卡时间且在第一刷卡时间之前的到站时间确定为上车时间。
车辆在运行时,当到达每一站点时均对应有离到站时间,即离开该站点的离站时间和到达该站点的到站时间。在离到站时间中,将最接近第一刷卡时间且在第一刷卡时间之前的到站时间确定为上车时间。比如,第一刷卡时间为2022年10月10日15时30分,而离到站时间中,最接近且在第一刷卡时间之前的到站时间为2022年10月10日15时29分,则将2022年10月10日15时29分确定为上车时间。
这样在分析不同的对象的出行驻留时间时,可以通过车辆的离到站时间来进行量化,从而确定出一个标准的上车时间,从而能够更加准确的分析出对象的出行驻留时间。
203、根据第二刷卡时间和上车时间确定出对象的出行驻留时间。
可以先根据第二刷卡时间来确定出第二刷卡时间对应的下车时间,例如基于第二刷卡时间,调用最近下车点估计算法推算第二刷卡时间对应的下车时间,该下车时间可以理解为在第一刷卡时间之前。
然后确定出第二刷卡时间对应的下车时间和第一刷卡时间对应的上车时间之间的差值,则得到对象的出行驻留时间。该出行驻留时间可以理解为是上次下车的下车时间和本次上车的上车时间之间的时间差。
通过该方式能够更加准确的确定出对象对应的出行驻留时间,从而提高了出行驻留时间这一数据的准确性,从而更加有利于对基础模型的训练。
需要说明的是,上述对象的出行驻留时间和出行信息均与第一站点相关。比如上次第一刷卡时间和第二刷卡时间中有一个刷卡时间是对象在第一站点对应的刷卡时间。
在确定出行驻留时间之后,可以根据出行驻留时间确定出对象的出行信息。比如,预设有以下几种出行目的:短时外出返程(公交下车-公交上车时间差大于20分钟小于2小时),长时外出返程(公交下车-公交上车时间差大于2小时小于6小时),通勤返程公交下车-公交上车时间差大于6小时小于10小时),超长驻留返程(当日公交下车-公交上车时间差大于10小时)。轨道-公交接驳(轨道出闸-公交上车时间差小于20分钟)。公交-公交接驳(公交下车-公交上车时间差小于20分钟)等。
然后根据对象的出行驻留时间和上述几种预设的出行目的进行匹配,则得到对象的出行目的,即对象的出行信息。
在本申请中,人群预测模型实际上是应用于对站点的人群预测分析,因此还需要站点对应的交通数据。
在一些实施方式中,刷卡数据包括刷卡车辆标识,预设交通数据包括第一交通工具的车辆标识;根据刷卡数据和第一交通工具的预设交通数据确定出第一站点对应的目标交通数据,包括:
(2.1)在车辆标识中确定出与刷卡车辆标识相匹配的目标车辆标识;
(2.2)在预设交通数据中将目标车辆标识对应的交通数据确定为第一站点对应的目标交通数据。
通过获取第一站点对应的目标交通数据,能够更加准确的对站点相关的数据进行分析,从而在训练基础模型的过程中,使得训练出来的人群预测模型能够更加准确的对站点的人群进行预测。
其中,在对象进行刷卡的时候,刷卡数据中有对应的刷卡车辆标识,比如刷卡机上有每个车辆的编号,当对象刷卡时,该车辆的编号和卡号相绑定,则给车辆的编号就是刷卡车辆标识。
可以将刷卡车辆标识和数据量中的车辆标识相匹配,匹配出目标车辆标识。然后获取该目标车辆标识的交通数据,比如通过目标车辆标识在数据库中找到该目标车辆标识对应的交通数据,交通数据包括预设数据,例如目标车辆经过的站点编号、站点的标准位置、站点序号和站点名称等。交通数据还包括实时数据,例如实际的车辆离到站时间、车辆停靠位置等。
然后在交通数据中确定出第一站点的目标交通数据。比如将站点编号、站点的标准位置、站点序号和站点名称、车辆离到站时间等确定为第一站点的目标交通数据。
在交通数据中确定出第一站点的目标交通数据的过程中,还可以对交通数据的预设数据和实时数据进行分析,确定预设数据和实时数据是否吻合。比如在预设数据中确定出第一站点的标准位置,获取实时数据中的目标车辆在第一站点的停靠位置,若第一站点的标准位置和目标车辆的停靠位置之间相差的距离在预设差值范围内,则说明实时数据和预设数据吻合。则可以在预设数据和实时数据中获取第一站点的交通数据。
例如,持有20XXXX37号深圳通卡的持卡人于5月16日18:53:36刷卡,乘坐的是107路,刷卡车辆标识为粤BS49***D。将刷卡车辆标识和车辆标识进行匹配,确定出目标车辆标识以及目标车辆标识对应的目标车辆,目标车辆在18:52:06秒停靠107路上行班次的第13站序,该第13站序对应的站点编码为AX****53,确定出该站点编码对应的标准经纬度,确定出目标车辆的停靠经纬度,计算二者之间的差值,若预设差值范围为0-250米,而差值为61.5米,则说明标准经纬度和停靠站经纬度匹配,此时可以将标准经纬度确定为第一站点的标准位置,即第一站点的第一站点位置。
120、根据出行信息和目标交通数据生成第一站点的第一特征数据。
由上述可知,出行信息和目标交通数据均与第一站点相关,可以根据出行信息和目标交通数据生成第一站点的第一特征数据。
例如,在多个对象对应的出行信息中,可以确定出每一出行目的比例,将出行目的比例作为第一站点的第一特征数据。可以将第一站点的经过的公交车辆的数量、第一站点的第一站点位置、第一站点的刷卡次数等作为第一站点的第一特征数据。
还可以获取其他信息来作为第一站点的第一特征数据,比如第一站点一公里内的人口信息,例如居住人口数量、办公人口数量、居民平均收入、职工平均收入等。比如第一站点对应的站点公交资源,例如服务线路、第一站点连接的下游站点、第一站点距离最近地铁站的距离等。比如,刷卡人群的比例,例如成人比例、学生比例、老人比例等。
具体如表1所示:
表1
由上述可知,第一站点的第一特征数据涉及到多种类型的数据,从而增加基础模型在训练时的数据丰富度,从而得到人群预测模型,该人群预测模型由于是采用多个维度的数据训练出来的,能够更加准确的对站点的人群进行预测。
130、确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据。
可以理解是,在对站点进行人群预测时候,还需要考虑到栅格的人群信息,比如栅格的人群流入量和人群流出量。还需要考虑到站点的上游站点和下游站点之间的连接关系,以及站点、上游站点和下游站点对应的人群信息,比如这些站点分别对应的人群流入量和人群流出量。
因此,需要确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据。从而增加基础模型训练时的数据丰富度,从而提高训练后的人群预测模型的预测准确性。
在一些实施方式中,确定第一站点相关联的第一栅格,包括:
(1.1)获取第一站点的第一站点位置,以及每一栅格的中心位置;
(1.2)将距离第一站点位置在第一预设距离范围内的中心位置确定为目标中心位置;
(1.3)将目标中心位置对应的栅格确定为第一站点相关联的第一栅格。
通过该方式能够在地图上的多个栅格中准确地确定出第一站点的相关联的第一栅格。
其中,第一站点的第一站点位置可以是第一站点的标准经纬度。可以确定出每一栅格的正中心,然后确定出该正中心的中心经纬度,将该中心经纬度确定为栅格的中心位置。
然后将距离第一站点位置在第一预设距离范围内的中心位置确定为目标中心位置。例如,第一预设距离范围为0-1公里,则可以获取距离第一站点位置在1公里的中心位置确定为目标中心位置。最后将目标中心位置对应的栅格确定为第一站点相关联的第一栅格。
请一并参阅图4,图4是本申请实施例提供的第一站点的第一栅格示意图。
在第一站点的周围的栅格中,可以第一站点的第一站点位置为中心,以1公里为半径,将栅格的中心位置在距离第一站点位置1公里内的栅格确定为第一栅格,即图4中打上标记点的栅格就是第一站点相关联的第一栅格。
在一些实施方式中,确定第一站点相关联的关联站点,包括:
(2.1)在预设交通数据中确定出第一交通工具对应的班次信息以及站点信息;
(2.2)根据班次信息和站点信息确定出在第一站点的预设站点距离内的站点,并将预设站点距离内的站点确定为第一站点相关联的关联站点。
通过该方式能够准确地确定出第一站点相关联的关联站点,比如第一站点的上游站点和下游站点。
其中,预设交通数据中包含了每个站点的站点信息,比如站点编号、站点序号、站点位置。还包含了多条路线,每条路线中包含了多个站点。
可以确定出第一站点对应的多条目标路线,然后获取该目标路线中每个站点的站点位置,然后根据第一站点的第一站点位置和每个站点的站点位置进行距离计算,从而确定出每个站点和第一站点之间的距离。
可以将第一站点的预设站点距离内的站点确定为第一站点相关联的关联站点。比如,预设站点距离为2公里,可以将距离第一站点2公里内的站点确定为关联站点。
由上述可知,在获取到第一站点相关联的第一栅格和关联站点之后,可以通过第一栅格和关联站点进一步确定第一站点相关的数据,并将其确定为第二特征数据。
请一并参阅图5,图5是本申请实施例提供的人群预测模型训练方法的另一流程示意图。
在一些实施方式中,根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据,可以包括如下步骤:
301、获取相关联的第一栅格对应的第一关联人群信息。
具体地,第一栅格对应的第一关联人群信息包括每一个第一栅格的人群流动情况,比如某一时间段内的人群流出量。还可以对第一栅格的人群的其他信息进行分析,比如第一栅格的人口职业数据、人口年龄分布情况、人口收入分布情况等等,这些也可以作为第一关联人群信息。
302、获取第一站点和关联站点对应的第二关联人群信息。
在一些实施方式中,可以先分析出第一站点和关联站点之间的连接关系,比如确定出哪些关联站点为上游站点,哪些关联站点为下游站点,从而用于在后续中反映出不同站点的站点序号和人群之间的关系。可以将该连接关系也作为第二关联人群信息。
在一些实施方式中,获取第一站点和关联站点对应的第二关联人群信息,包括:
(3.1)获取第一预设时间段内第一站点的人群流入量和人群流出量,以及每一关联站点的人群流入量和人群流出量;
(3.2)将第一站点的人群流入量和人群流出量以及每一关联站点的人群流入量和人群流出量确定为第二关联人群信息。
其中,可以获取第一预设时间段内第一站点的人群流入量和人群流出量,比如在早上8:00-9:00时段获取第一站点的人群流入量和人群流出量。针对于其他关联站点,同时获取每一关联站点的人群流入量和人群流出量。
在获取每一关联站点的人群流入量和人群流出量时。可以确定出每一关联站点的相关联栅格,然后确定出相关联栅格对应的人群流入量和人群流出量,然后将每一关联站点的相关联栅格的人群流入量和人群流出量确定为每一关联站点的人群流入量和人群流出量。将第一站点的人群流入量和人群流出量以及每一关联站点的人群流入量和人群流出量确定为第二关联人群信息。
303、根据第一关联人群信息和第二关联人群信息确定出第一站点的第二特征数据。
将第一关联人群信息和第二关联人群信息作为第一站点的第二特征数据。由上述可知,第二特征数据中包含了第一站点和周边栅格之间的人群关系,还包含了第一站点和相关联的上游站点和下游站点之间的人群关系,这样能够更加准确的体现出第一站点的人群和第一站点之间的关系,从而使得基础模型的训练数据更加丰富,使得训练出的人群预测模型能够更加准确的对第一站点的人群进行预测。
由上述内容可知,在第二特征数据中包含了第一站点和相关联的第一站点和相关联的关联站点之间的人群信息,从而使得训练出的人群预测模型具备根据这两个因素来进行人群预测的能力,以提高对站点的人群预测准确性。
140、确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格。
可以理解的是,在实际的公共交通运行过程中,还涉及到不同类型的交通工具的换乘,比如地铁和公交车之间的换乘。因此,除了第一交通工具对应的站点之外,还需要考虑到第二交通工具之外的站点,比如地铁的站点。
请一并参阅图6、图7和图8。图6是本申请实施例提供的首发或返程的公交场景示意图;图7是本申请实施例提供的接驳的公交场景示意图;图8是本申请实施例提供的换乘的公交场景示意图。
其中,在首发或者返程、换乘和接驳的公交场景中,公交和地铁分布在空间的不同位置,这就导致了人群可以选择乘坐不同的交通工具,若只考虑公交车出行,会忽略掉地铁的人群承载量,这样会导致对公交车的不同站点的人群预测是不够精准的。从而影响公交车的运营调度。
本申请考虑到该问题,同时还需要引入地铁对公交的影响,因此需要考虑到地铁的人群承载量。
在一些实施方式中,确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格,包括:
(1.1)确定第一站点的第一站点位置,将距离第一站点位置在第二预设距离范围内的第二交通工具的站点确定为与第一站点相关联的第二站点;
(1.2)获取第二站点的第二站点位置,将距离第二站点位置在第三预设距离范围内的栅格确定为第二站点对应的第二栅格。
通过该方式能够准确的确定出第一站点相关联的第二站点,以及第二站点对应的第二栅格。
其中,可以确定出第一站点的标准经纬度,然后确定出第一站点附近的第二交通工具的站点的经纬度,比如第一站点附近的地铁站的经纬度。然后根据第一站点的标准经纬度和第二交通工具的站点的经纬度,确定出第一站点和第二交通工具的站点之间的距离。
最后将距离在第二预设距离范围内的第二交通工具的站点确定为与第一站点相关联的第二站点。比如将距离在1公里之内的第二交通工具的站点确定为第二站点。
然后再获取每一第二站点的第二站点位置,比如第二站点的经纬度,获取每一第二站点周围的栅格的中心位置,将中心位置在距离第二站点位置在第三预设距离范围内的栅格确定为第二站点对应的第二栅格。
150、根据第二栅格和第一栅格确定出第一站点对应的第三特征数据。
在确定好第二栅格之后,可以根据第一栅格和第二栅格分别对应的人群流动情况来确定出第二交通工具对第一交通工具的替代程度。
如图9所示,图9是本申请实施例提供的公交和地铁的公交场景示意图。
其中,在第一栅格和第二栅格之间对应有重叠区域,而在该重叠区域内,可以分析重叠区域的人群流入量,从而确定出第二交通工具对第一交通工具的替代程度。
具体地,请参阅图10,图10是本申请实施例提供的人群预测模型训练方法的另一流程示意图。
在一些实施方式中,根据第二栅格和第一栅格确定出第一站点对应的第三特征数据,可以包括如下步骤:
401、获取第一栅格和第二栅格之间对应的重叠区域,并确定第二预设时间段内重叠区域的人群流入量。
在第一栅格和第二栅格中,至少有部分第一栅格和至少部分第二栅格之间存在重叠区域,可以获取第二预设时间段内该重叠区域内的人群流入量。比如,通过基站对电子设备的定位来确定出第二预设时间段内该重叠区域内的人群流入量。
402、确定第二预设时间段内第一栅格对应的人群流入量。
同理,可以获取第二预设时间段内第一栅格对应的人群流入量。
403、根据重叠区域的人群流入量和第一栅格对应的人群流入量确定出第一交通工具被第二交通工具替代的评分值,第三特征数据包括评分值。
针对于第一站点,可以将重叠区域的人群流入量除以第一栅格对应的人群流入量,从而确定出第一交通工具被第二交通工具替代的评分值。第三特征数据包括评分值。
在一些实施方式中,还可以分析出第一站点和其关联站点分别对应的重叠区域的人群流入量,以及第一站点和其关联站点分别对应的栅格的人群流入量。最后根据第一站点和其关联站点分别对应的重叠区域的人群流入量和第一站点和其关联站点分别对应的栅格的人群流入量,确定出第一站点对应的第一交通工具被第二交通工具替代的评分值。
具体如下公式所示:
其中,Fo,i_j指的是距离观测站点o的下游第i到j站距之内,与地铁站覆盖区域相重叠的部分的栅格人群流入量,Fi_j指的是公交下游沿途第i到j站距之内所有的附近栅格人群流入量。δi_j为第i到j站第一交通工具被第二交通工具替代的评分值。
在一些实施方式中,可以将第二交通站点的不同站点之间的站距也考虑到,距离第一站点越近的地铁站点,一般来说其周围的出行人员更容易转变为接驳客流,因此对于站距的计算也是很重要的一步。首先将地铁线路双向站点和站序融合成一个数组,如:[[['罗湖',0],['国贸',1],['老街',2],……],[['双龙',0],['南联',1],['龙城广场',2],['吉祥',3],],……];然后通过创建有向图和dijkstra算法计算每个地铁站点前往任意一个地铁站点的路径和最短站距。
通过上述方式,就可以获取任意一个公交站点周边的地铁站点与其他地铁站点的连通性,以掌握潜在的接驳客流的来源区域的人口流出情况。从而有利于对基础模型进行训练,使得训练出的人群预测模型能够从更多的维度来进行站点的人群预测,从而提高预测准确性。
160、根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
在本申请实施例中,其中基础模型可以是时空地理加权回归模型(Geographically and Temporally Weighted Regression,GTWR),该模型可以根据时间地理的变化来确定出对应的人群,比如某一位置的人群流入量或者人群流出量。
在一些实施方式中,根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型,包括:
(1.1)确定第一站点对应的目标时间、第一站点在目标时间对应的人群流入总量以及第一站点的坐标信息;
(1.2)根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据,以及人群流入总量、目标时间和坐标信息对基础模型进行训练,得到人群预测模型。
通过该方式,能够提高训练出的人群预测模型的准确性。
第一特征数据、第二特征数据以及第三特征数据可以作为基础模型的自变量,而第一站点的实际人群流量可以作为因变量。可以根据基础模型的实际训练需求,在第一特征数据、第二特征数据以及第三特征数据中选取至少一种数据来进行训练。
比如,针对于站点的首发人群预测,可以采用第一特征数据和第三特征数据来训练基础模型。针对于换乘人群的预测,可以采用第一特征数据、第二特征数据以及第三特征数据来对基础模型进行训练。
第一站点的坐标信息包括经度和纬度。
其中,基础模型对应的公式如下:
其中,Ymo,i为mo出行目的相关的第一站点的因变量,也就是第一站点在目标时间对应的人群流入总量。ui是第一站点的经度,vi是第i个站点的纬度。βk是第k个自变量在第一站点的回归系数。εi为自变量对应的计算结果之和与因变量之间的损失值。Xi,k为第一站点的第K个自变量,即第一特征数据、第二特征数据以及第三特征数据中的某一自变量。
在一些实施方式中,在python环境中,可通过调用mgtwr.model库中的时空地理加权回归算法对自变量的回归系数、损失值、平均绝对误差、自变量显著性等进行计算。
在一些实施方式中,根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据,以及人群流入总量、目标时间和坐标信息对基础模型进行训练,得到人群预测模型,包括:
(1.2.1)将第一特征数据、第二特征数据以及第三特征数据中的至少一种数据,以及人群流入总量、目标时间和坐标信息输入至基础模型中,得到估算人群流入总量;
(1.2.2)确定人群流入总量和估算人群流入总量之间的损失值,当损失值满足预设损失条件,则基础模型训练完成得到人群预测模型。
将第一特征数据、第二特征数据以及第三特征数据中的至少一种数据,以及人群流入总量、目标时间和坐标信息输入至基础模型对应的公式中,然后得到估算人群流入总量。
可以确定人群流入总量和估算人群流入总量之间的损失值,比如将二者相减得到损失值,当损失值不满足预设损失条件时,需要对每一自变量对应的回归系数进行调整,直至调整后的回归系数的基础模型预测出的估算人群流入总量和人群流入总量之间的损失值满足预设条件,则基础模型训练完成得到人群预测模型。
在一些实施方式中,在计算每一自变量的回归系数之前,还需要检查自变量之间的多重共线性,以避免自变量之间的高度相关关系是模型估计失真。比如,自变量中包含了人口平均收入和人口职业这两个自变量,而人口职业和人口平均收入是正相关的,可以只取其中一个作为自变量。具体地计算过程中,可以采用方差膨胀因子VIF来统计出自变量之间的多重共线性。
需要说明的是,在针对于不同的站点,均需要训练出该站点对应的人群预测模型,也就是说上述第一站点训练出的人群预测模型仅仅适用于第一站点。
本申请实施例中,通过获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;根据出行信息和目标交通数据生成第一站点的第一特征数据;确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。以此,通过获取第一站点对应的不同类型的特征数据,然后利用不同类型的特征数据中的至少一种数据来对基础模型进行训练,训练出的人群预测模型能够预测出站点在某一时间下的人群流入总量。相对于相关技术中直接利用整个社区的客流量进行分析来确定站点的人口流量,本申请中的人群预测模型能够更加准确的预测出站点的人群流入总量,从而提高了对人群预测的准确性。
请继续参阅图11,图11是本申请实施例提供的人群预测模型训练方法的另一流程示意图。该人群预测模型训练方法可以包括如下步骤:
501、根据刷卡时间和离到站时间确定出对象的出行驻留时间,根据出行驻留时间确定出对象的出行信息。
具体地,在对象出行时,若在预设时间内涉及到俩次刷卡,比如对象先乘坐车辆A,然后换乘刷卡乘坐车辆B。其中乘坐车辆A时对应有一个刷卡时间,在乘坐车辆B时对应有另一个刷卡时间,可以根据这两个不同的刷卡时间确定出对象的出行驻留时间。
比如,可以直接将乘坐车辆A的刷卡时间确定为上车时间,直接将乘坐车辆B的刷卡时间确定为下车时间,上车时间和下车时间之间的时间差就可以是对象的出行驻留时间。
在确定出行驻留时间之后,可以根据出行驻留时间确定对象的出行信息。比如,预设有以下几种出行目的:短时外出返程(公交下车-公交上车时间差大于20分钟小于2小时),长时外出返程(公交下车-公交上车时间差大于2小时小于6小时),通勤返程公交下车-公交上车时间差大于6小时小于10小时),超长驻留返程(当日公交下车-公交上车时间差大于10小时)。轨道-公交接驳(轨道出闸-公交上车时间差小于20分钟)。公交-公交接驳(公交下车-公交上车时间差小于20分钟)等。
可以将出行驻留时间和上述几种出行目的匹配,从而确定出对象的目标出行目的,将该目标出行目的确定为对象的出行信息。比如,出行驻留时间大于20分钟小于2小时,在该出行目的为短时外出返程,将该出行目的确定为对象的出行信息。
具体地,可以根据刷卡时间确定出相邻的第一刷卡时间和第二刷卡时间,第一刷卡时间在第二刷卡时间之后;在离到站时间中,将最接近第一刷卡时间且在第一刷卡时间之前的到站时间确定为上车时间;根据第二刷卡时间和上车时间确定出对象的出行驻留时间。
502、在车辆标识中确定出与刷卡车辆标识相匹配的目标车辆标识,在预设交通数据中将目标车辆标识对应的交通数据确定为第一站点对应的目标交通数据。
其中,在对象进行刷卡的时候,刷卡数据中有对应的刷卡车辆标识,比如刷卡机上有每个车辆的编号,当对象刷卡时,该车辆的编号和卡号相绑定,则给车辆的编号就是刷卡车辆标识。
可以将刷卡车辆标识和数据量中的车辆标识相匹配,匹配出目标车辆标识。然后获取该目标车辆标识的交通数据,比如通过目标车辆标识在数据库中找到该目标车辆标识对应的交通数据,交通数据包括预设数据,例如目标车辆经过的站点编号、站点的标准位置、站点序号和站点名称等。交通数据还包括实时数据,例如实际的车辆离到站时间、车辆停靠位置等。
然后在交通数据中确定出第一站点的目标交通数据。比如将站点编号、站点的标准位置、站点序号和站点名称、车辆离到站时间等确定为第一站点的目标交通数据。
在交通数据中确定出第一站点的目标交通数据的过程中,还可以对交通数据的预设数据和实时数据进行分析,确定预设数据和实时数据是否吻合。比如在预设数据中确定出第一站点的标准位置,获取实时数据中的目标车辆在第一站点的停靠位置,若第一站点的标准位置和目标车辆的停靠位置之间相差的距离在预设差值范围内,则说明实时数据和预设数据吻合。则可以在预设数据和实时数据中获取第一站点的交通数据。
例如,持有20XXXX37号深圳通卡的持卡人于5月16日18:53:36刷卡,乘坐的是107路,刷卡车辆标识为粤BS49***D。将刷卡车辆标识和车辆标识进行匹配,确定出目标车辆标识以及目标车辆标识对应的目标车辆,目标车辆在18:52:06秒停靠107路上行班次的第13站序,该第13站序对应的站点编码为AX****53,确定出该站点编码对应的标准经纬度,确定出目标车辆的停靠经纬度,计算二者之间的差值,若预设差值范围为0-250,而差值为61.5,则说明标准经纬度和停靠站经纬度匹配,此时可以将标准经纬度确定为第一站点的标准位置,即第一站点的第一站点位置。
503、根据出行信息和目标交通数据生成第一站点的第一特征数据。
由上述可知,出行信息和目标交通数据均与第一站点相关,可以根据出行信息和目标交通数据生成第一站点的第一特征数据。
例如,在多个对象对应的出行信息中,可以确定出每一出行目的比例,将出行目的比例作为第一站点的第一特征数据。可以将第一站点的经过的公交车辆的数量、第一站点的第一站点位置、第一站点的刷卡次数等作为第一站点的第一特征数据。
还可以获取其他信息来作为第一站点的第一特征数据,比如第一站点一公里内的人口信息,例如居住人口数量、办公人口数量、居民平均收入、职工平均收入等。比如第一站点对应的站点公交资源,例如服务线路、第一站点连接的下游站点、第一站点距离最近地铁站的距离等。比如,刷卡人群的比例,例如成人比例、学生比例、老人比例等。
504、获取第一站点的第一站点位置,以及每一栅格的中心位置,将距离第一站点位置在第一预设距离范围内的中心位置确定为目标中心位置。
其中,第一站点的第一站点位置可以是第一站点的标准经纬度。可以确定出每一栅格的正中心,然后确定出该正中心的中心经纬度,将该中心经纬度确定为栅格的中心位置。
然后将距离第一站点位置在第一预设距离范围内的中心位置确定为目标中心位置。例如,第一预设距离范围为0-1公里,则可以获取距离第一站点位置在1公里的中心位置确定为目标中心位置。
505、将目标中心位置对应的栅格确定为第一站点相关联的第一栅格。
506、在预设交通数据中确定出第一交通工具对应的班次信息以及站点信息。
其中,预设交通数据中包含了每个站点的站点信息,比如站点编号、站点序号、站点位置。还包含了多条路线,每条路线中包含了多个站点。
507、根据班次信息和站点信息确定出在第一站点的预设站点距离内的站点,并将预设站点距离内的站点确定为第一站点相关联的关联站点。
可以确定出第一站点对应的多条目标路线,然后获取该目标路线中每个站点的站点位置,然后根据第一站点的第一站点位置和每个站点的站点位置进行距离计算,从而确定出每个站点和第一站点之间的距离。
可以将第一站点的预设站点距离内的站点确定为第一站点相关联的关联站点。比如,预设站点距离为2公里,可以将距离第一站点2公里内的站点确定为关联站点。
508、获取相关联的第一栅格对应的第一关联人群信息,获取第一站点和关联站点对应的第二关联人群信息。
具体地,第一栅格对应的第一关联人群信息包括每一个第一栅格的人群流动情况,比如某一时间段内的人群流出量。还可以对第一栅格的人群的其他信息进行分析,比如第一栅格的人口职业数据、人口年龄分布情况、人口收入分布情况等等,这些也可以作为第一关联人群信息。
在一些实施方式中,可以先分析出第一站点和关联站点之间的连接关系,比如确定出哪些关联站点为上游站点,哪些关联站点为下游站点,从而用于在后续中反映出不同站点的站点序号和人群之间的关系。可以将该连接关系也作为第二关联人群信息。
具体地,可以获取第一预设时间段内第一站点的人群流入量和人群流出量,以及每一关联站点的人群流入量和人群流出量;将第一站点的人群流入量和人群流出量以及每一关联站点的人群流入量和人群流出量确定为第二关联人群信息。
509、根据第一关联人群信息和第二关联人群信息确定出第一站点的第二特征数据。
将第一关联人群信息和第二关联人群信息作为第一站点的第二特征数据。由上述可知,第二特征数据中包含了第一站点和周边栅格之间的人群关系,还包含了第一站点和相关联的上游站点和下游站点之间的人群关系,这样能够更加准确的体现出第一站点的人群和第一站点之间的关系,从而使得基础模型的训练数据更加丰富,使得训练出的人群预测模型能够更加准确的对第一站点的人群进行预测。
510、确定第一站点的第一站点位置,将距离第一站点位置在第二预设距离范围内的第二交通工具的站点确定为与第一站点相关联的第二站点。
确定第一站点的第一站点位置,将距离第一站点位置在第二预设距离范围内的第二交通工具的站点确定为与第一站点相关联的第二站点。
511、获取第二站点的第二站点位置,将距离第二站点位置在第三预设距离范围内的栅格确定为第二站点对应的第二栅格。
获取第二站点的第二站点位置,将距离第二站点位置在第三预设距离范围内的栅格确定为第二站点对应的第二栅格。
512、根据第二栅格和第一栅格确定出第一站点对应的第三特征数据。
具体地,可以获取第一栅格和第二栅格之间对应的重叠区域,并确定第二预设时间段内重叠区域的人群流入量;确定第二预设时间段内第一栅格对应的人群流入量;根据重叠区域的人群流入量和第一栅格对应的人群流入量确定出第一交通工具被第二交通工具替代的评分值,第三特征数据包括评分值。
513、根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
第一特征数据、第二特征数据以及第三特征数据可以作为基础模型的自变量,而第一站点的实际人群流量可以作为因变量。可以根据基础模型的实际训练需求,在第一特征数据、第二特征数据以及第三特征数据中选取至少一种数据来进行训练。
比如,针对于站点的首发人群预测,可以采用第一特征数据和第三特征数据来训练基础模型。针对于换乘人群的预测,可以采用第一特征数据、第二特征数据以及第三特征数据来对基础模型进行训练。
第一站点的坐标信息包括经度和纬度。
具体地,确定第一站点对应的目标时间、第一站点在目标时间对应的人群流入总量以及第一站点的坐标信息;将第一特征数据、第二特征数据以及第三特征数据中的至少一种数据,以及人群流入总量、目标时间和坐标信息输入至基础模型中,得到估算人群流入总量;确定人群流入总量和估算人群流入总量之间的损失值,当损失值满足预设损失条件,则基础模型训练完成得到人群预测模型。
本申请实施例中,通过获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;根据出行信息和目标交通数据生成第一站点的第一特征数据;确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。以此,通过获取第一站点对应的不同类型的特征数据,然后利用不同类型的特征数据中的至少一种数据来对基础模型进行训练,训练出的人群预测模型能够预测出站点在某一时间下的人群流入总量。相对于相关技术中直接利用整个社区的客流量进行分析来确定站点的人口流量,本申请中的人群预测模型能够更加准确的预测出站点的人群流入总量,从而提高了对人群预测的准确性。
在得到人群预测模型之后,可以对人群预测模型进行应用。请继续参阅图12,图12是本申请实施例提供的人群预测方法的流程示意图。该人群预测方法可以包括如下步骤:
610、确定出第一交通工具对应的目标站点以及目标站点对应的预测时间和位置信息。
其中,目标站点可以是某一个公交站,可以确定出该站点的预测时间,比如2023年9月28日上午8点,目标站点的位置信息可以是目标站点的经纬度。该目标站点可以是上述内容中的第一站点。
620、获取目标站点对应的人群特征数据。
其中,获取站点对应的人群特征数据可以如上述内容中获取第一特征数据、第二特征数据和第三特征数据类似。其中人群特征数据可以包括目标站点对应的居住人口数量、站点公交资源、站点行车数量、刷卡量、出行目的比例等等。即人群特征数据中可以包含上述第一特征数据、第二特征数据和第三特征数据中相同类型的数据。在此不再赘述。
630、将目标站点对应的预测时间、位置信息和人群特征数据输入至本申请实施例提供的人群预测模型训练方法训练出的人群预测模型中,得到目标站点在预测时间对应的预测人群流入总量。
将目标站点对应的预测时间、位置信息和人群特征数据输入至本申请实施例提供的人群预测模型训练方法训练出的人群预测模型中。其中针对于人群特征数据中的每一自变量,可以确定出每一自变量对应的回归系数,然后再将根据人群预测模型预测目标站点在预测时间对应的预测人群流入总量。
在一些实施方式中,在预测目标站点不同类型的人群时,可以在人群特征数据中筛选出需要的自变量,然后将该自变量输入到人群预测模型中,从而计算出对应类型人群的人群流入总量。
例如,在全日首发、轨道接驳、中短时返程三种出行目的对应的人群,针对于每一出行目的,可以在人群特征数据中获取对应的自变量,然后根据人群预测模型预测出对应类型人群流入总量。
请一并参阅图13、图14和图15,图13为本申请实施例提供的预测值和观测值的对比图。图14为本申请实施例提供的预测值和观测值的另一对比图。图15为本申请实施例提供的预测值和观测值的另一对比图。
其中,由图13可知,针对于首发客流,目标站点的首发客流预测值和首发客流观测值非常接近。
由图14可知,针对于接驳客流,目标站点的接驳客流预测值和接驳客流观测值非常接近。
由图15可知,针对于全部客流,目标站点的全部客流预测值和全部客流观测值非常接近。
也就是说,本申请实施例中,人群预测模型的预测值和实际的观测值非常接近,拥有较高的预测准确率。
在本申请实施例中,通过确定出第一交通工具对应的目标站点以及目标站点对应的预测时间和位置信息,获取目标站点对应的人群特征数据,将目标站点对应的预测时间、位置信息和人群特征数据输入至本申请实施例提供的人群预测模型训练方法训练出的人群预测模型中,得到目标站点在预测时间对应的预测人群流入总量。能够实现利用人群预测模型快速准确的确定出目标站点在预测时间对应的预测人群流入总量。
请继续参阅图16,图16是本申请实施例提供的人群预测模型训练装置的结构示意图。该人群预测模型训练装置可以执行上述人群预测模型训练方法。人群预测模型训练装置700包括:
第一获取模块710,用于获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;
第一生成模块720,用于根据出行信息和目标交通数据生成第一站点的第一特征数据;
第二生成模块730,用于确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;
第一确定模块740,用于确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;
第三生成模块750,用于根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;
训练模块760,用于根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
在一些实施方式中,刷卡数据包括刷卡时间,预设交通数据包括第一交通工具的离到站时间,第一获取模块710,用于:
根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息,包括:
根据刷卡时间和离到站时间确定出对象的出行驻留时间;
根据出行驻留时间确定出对象的出行信息。
在一些实施方式中,第一获取模块710,用于:
根据刷卡时间确定出相邻的第一刷卡时间和第二刷卡时间,第一刷卡时间在第二刷卡时间之后;
在离到站时间中,将最接近第一刷卡时间且在第一刷卡时间之前的到站时间确定为上车时间;
根据第二刷卡时间和上车时间确定出对象的出行驻留时间。
在一些实施方式中,刷卡数据包括刷卡车辆标识,预设交通数据包括第一交通工具的车辆标识,第一获取模块710,用于:
在车辆标识中确定出与刷卡车辆标识相匹配的目标车辆标识;
在预设交通数据中将目标车辆标识对应的交通数据确定为第一站点对应的目标交通数据。
在一些实施方式中,第二生成模块730,用于:
获取第一站点的第一站点位置,以及每一栅格的中心位置;
将距离第一站点位置在第一预设距离范围内的中心位置确定为目标中心位置;
将目标中心位置对应的栅格确定为第一站点相关联的第一栅格。
在一些实施方式中,第二生成模块730,用于:
在预设交通数据中确定出第一交通工具对应的班次信息以及站点信息;
根据班次信息和站点信息确定出在第一站点的预设站点距离内的站点,并将预设站点距离内的站点确定为第一站点相关联的关联站点。
在一些实施方式中,第二生成模块730,用于:
获取相关联的第一栅格对应的第一关联人群信息;
获取第一站点和关联站点对应的第二关联人群信息;
根据第一关联人群信息和第二关联人群信息确定出第一站点的第二特征数据。
在一些实施方式中,第二生成模块730,用于:
获取第一预设时间段内第一站点的人群流入量和人群流出量,以及每一关联站点的人群流入量和人群流出量;
将第一站点的人群流入量和人群流出量以及每一关联站点的人群流入量和人群流出量确定为第二关联人群信息。
在一些实施方式中,第一确定模块740,用于:
确定所述第一站点的第一站点位置,将距离所述第一站点位置在第二预设距离范围内的第二交通工具的站点确定为与所述第一站点相关联的第二站点;
获取所述第二站点的第二站点位置,将距离所述第二站点位置在第三预设距离范围内的栅格确定为所述第二站点对应的第二栅格。
在一些实施方式中,第三生成模块750,用于:
获取所述第一栅格和所述第二栅格之间对应的重叠区域,并确定第二预设时间段内所述重叠区域的人群流入量;
确定第二预设时间段内所述第一栅格对应的人群流入量;
根据所述重叠区域的人群流入量和所述第一栅格对应的人群流入量确定出所述第一交通工具被所述第二交通工具替代的评分值,所述第三特征数据包括所述评分值。
在一些实施方式中,训练模块760,用于:
确定所述第一站点对应的目标时间、所述第一站点在所述目标时间对应的人群流入总量以及所述第一站点的坐标信息;
根据所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据,以及所述人群流入总量、所述目标时间和所述坐标信息对基础模型进行训练,得到人群预测模型。
在一些实施方式中,训练模块760,用于:
将所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据,以及所述人群流入总量、所述目标时间和所述坐标信息输入至所述基础模型中,得到估算人群流入总量;
确定所述人群流入总量和所述估算人群流入总量之间的损失值,当所述损失值满足预设损失条件,则所述基础模型训练完成得到人群预测模型。
由上述可知,本申请实施例中,通过获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;根据出行信息和目标交通数据生成第一站点的第一特征数据;确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。以此,通过获取第一站点对应的不同类型的特征数据,然后利用不同类型的特征数据中的至少一种数据来对基础模型进行训练,训练出的人群预测模型能够预测出站点在某一时间下的人群流入总量。相对于相关技术中直接利用整个社区的客流量进行分析来确定站点的人口流量,本申请中的人群预测模型能够更加准确的预测出站点的人群流入总量,从而提高了对人群预测的准确性。
请一并参阅图17,图17是本申请实施例提供的人群预测装置的结构示意图。该人群预测装置可以执行上述人群预测方法。人群预测装置800包括:
第二确定模块810,用于确定出第一交通工具对应的目标站点以及目标站点对应的预测时间和位置信息;
第二获取模块820,用于获取目标站点对应的人群特征数据;
预测模块830,用于将目标站点对应的预测时间、位置信息和人群特征数据输入至本申请实施例提供的人群预测模型训练方法训练出的人群预测模型中,得到目标站点在预测时间对应的预测人群流入总量。
在本申请实施例中,通过确定出第一交通工具对应的目标站点以及目标站点对应的预测时间和位置信息,获取目标站点对应的人群特征数据,将目标站点对应的预测时间、位置信息和人群特征数据输入至本申请实施例提供的人群预测模型训练方法训练出的人群预测模型中,得到目标站点在预测时间对应的预测人群流入总量。能够实现利用人群预测模型快速准确的确定出目标站点在预测时间对应的预测人群流入总量。
本申请实施例还提供一种计算机设备,该计算机设备可以为终端,如图18所示,其示出了本申请实施例所涉及的终端的结构示意图,具体来讲:
该计算机设备可以包括射频(RF,Radio Frequency)电路901、包括有一个或一个以上计算机可读存储介质的存储器902、输入单元903、显示单元904、传感器905、音频电路906、无线保真(WiFi,Wireless Fidelity)模块907、包括有一个或者一个以上处理核心的处理器908、以及电源909等部件。本领域技术人员可以理解,图18中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路901可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器908处理;另外,将涉及上行的数据发送给基站。通常,RF电路901包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、对象身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路901还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GSM,Global System of Mobile communication)、通用分组无线服务(GPRS,GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器902可用于存储软件程序以及模块,处理器908通过运行存储在存储器902的软件程序以及模块,从而执行各种功能应用以及信息检索。存储器902可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器902可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器902还可以包括存储器控制器,以提供处理器908和输入单元903对存储器902的访问。
输入单元903可用于接收输入的数字或字符信息,以及产生与对象设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元903可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集对象在其上或附近的触摸操作(比如对象使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测对象的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器908,并能接收处理器908发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元903还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元904可用于显示由对象输入的信息或提供给对象的信息以及终端的各种图形对象接口,这些图形对象接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元904可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器908以确定触摸事件的类型,随后处理器908根据触摸事件的类型在显示面板提供相应的视觉输出。虽然在图18中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
终端还可包括至少一种传感器905,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路906、扬声器,传声器可提供对象与终端之间的音频接口。音频电路906可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路906接收后转换为音频数据,再将音频数据输出处理器908处理后,经RF电路901以发送给比如另一终端,或者将音频数据输出至存储器902以便进一步处理。音频电路906还可能包括耳塞插孔,以提供外设耳机与终端的通信。
WiFi属于短距离无线传输技术,终端通过WiFi模块907可以帮助对象收发电子邮件、浏览网页和访问流式媒体等,它为对象提供了无线的宽带互联网访问。虽然图18示出了WiFi模块907,但是可以理解的是,其并不属于终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器908是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器902内的软件程序和/或模块,以及调用存储在存储器902内的数据,执行终端的各种功能和处理数据,从而对手机进行整体监测。可选的,处理器908可包括一个或多个处理核心;优选的,处理器908可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、对象界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器908中。
终端还包括给各个部件供电的电源909(比如电池),优选的,电源可以通过电源管理系统与处理器908逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源909还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端中的处理器908会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器902中,并由处理器908来运行存储在存储器902中的应用程序,从而实现各种功能:
获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;
根据出行信息和目标交通数据生成第一站点的第一特征数据;
确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;
确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;
根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;
根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对人群预测模型训练方法的详细描述,此处不再赘述。
由上述可知,本申请实施例中,通过获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;根据出行信息和目标交通数据生成第一站点的第一特征数据;确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。以此,通过获取第一站点对应的不同类型的特征数据,然后利用不同类型的特征数据中的至少一种数据来对基础模型进行训练,训练出的人群预测模型能够预测出站点在某一时间下的人群流入总量。相对于相关技术中直接利用整个社区的客流量进行分析来确定站点的人口流量,本申请中的人群预测模型能够更加准确的预测出站点的人群流入总量,从而提高了对人群预测的准确性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种人群预测模型训练方法中的步骤。例如,该指令可以执行如下步骤:
获取对象的刷卡数据,并根据刷卡数据和第一交通工具的预设交通数据确定出对象的出行信息和第一站点对应的目标交通数据;
根据出行信息和目标交通数据生成第一站点的第一特征数据;
确定第一站点相关联的第一栅格以及相关联的关联站点,并根据相关联的第一栅格和关联站点确定出第一站点的第二特征数据;
确定与第一站点相关联的第二交通工具对应的第二站点以及第二站点对应的第二栅格;
根据第二栅格和第一栅格确定出第一站点对应的第三特征数据;
根据第一特征数据、第二特征数据以及第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种人群预测模型训练方法和人群预测方法中的步骤,因此,可以实现本申请实施例所提供的任一种人群预测模型训练方法和人群预测方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种人群预测模型训练方法及相关方法、装置和设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (17)

1.一种人群预测模型训练方法,其特征在于,包括:
获取对象的刷卡数据,并根据所述刷卡数据和第一交通工具的预设交通数据确定出所述对象的出行信息和所述第一站点对应的目标交通数据;
根据所述出行信息和所述目标交通数据生成所述第一站点的第一特征数据;
确定所述第一站点相关联的第一栅格以及相关联的关联站点,并根据所述相关联的第一栅格和所述关联站点确定出所述第一站点的第二特征数据;
确定与所述第一站点相关联的第二交通工具对应的第二站点以及所述第二站点对应的第二栅格;
根据所述第二栅格和所述第一栅格确定出所述第一站点对应的第三特征数据;
根据所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
2.根据权利要求1所述的人群预测模型训练方法,其特征在于,所述刷卡数据包括刷卡时间,所述预设交通数据包括所述第一交通工具的离到站时间;
所述根据所述刷卡数据和第一交通工具的预设交通数据确定出所述对象的出行信息,包括:
根据所述刷卡时间和所述离到站时间确定出所述对象的出行驻留时间;
根据所述出行驻留时间确定出所述对象的出行信息。
3.根据权利要求2所述的人群预测模型训练方法,其特征在于,所述根据所述刷卡时间和所述离到站时间确定出所述对象的出行驻留时间,包括:
根据所述刷卡时间确定出相邻的第一刷卡时间和第二刷卡时间,所述第一刷卡时间在所述第二刷卡时间之后;
在所述离到站时间中,将最接近所述第一刷卡时间且在所述第一刷卡时间之前的到站时间确定为上车时间;
根据所述第二刷卡时间和所述上车时间确定出所述对象的出行驻留时间。
4.根据权利要求1所述的人群预测模型训练方法,其特征在于,所述刷卡数据包括刷卡车辆标识,所述预设交通数据包括所述第一交通工具的车辆标识;
所述根据所述刷卡数据和第一交通工具的预设交通数据确定出所述第一站点对应的目标交通数据,包括:
在所述车辆标识中确定出与所述刷卡车辆标识相匹配的目标车辆标识;
在所述预设交通数据中将所述目标车辆标识对应的交通数据确定为所述第一站点对应的目标交通数据。
5.根据权利要求1所述的人群预测模型训练方法,其特征在于,所述确定所述第一站点相关联的第一栅格,包括:
获取所述第一站点的第一站点位置,以及每一栅格的中心位置;
将距离所述第一站点位置在第一预设距离范围内的所述中心位置确定为目标中心位置;
将所述目标中心位置对应的栅格确定为所述第一站点相关联的第一栅格。
6.根据权利要求1所述的人群预测模型训练方法,其特征在于,所述确定所述第一站点相关联的关联站点,包括:
在所述预设交通数据中确定出所述第一交通工具对应的班次信息以及站点信息;
根据所述班次信息和所述站点信息确定出在所述第一站点的预设站点距离内的站点,并将所述预设站点距离内的站点确定为所述第一站点相关联的关联站点。
7.根据权利要求6所述的人群预测模型训练方法,其特征在于,所述根据所述相关联的第一栅格和所述关联站点确定出所述第一站点的第二特征数据,包括:
获取所述相关联的第一栅格对应的第一关联人群信息;
获取所述第一站点和所述关联站点对应的第二关联人群信息;
根据所述第一关联人群信息和所述第二关联人群信息确定出所述第一站点的第二特征数据。
8.根据权利要求7所述的人群预测模型训练方法,其特征在于,所述获取所述第一站点和所述关联站点对应的第二关联人群信息,包括:
获取第一预设时间段内所述第一站点的人群流入量和人群流出量,以及每一所述关联站点的人群流入量和人群流出量;
将所述第一站点的人群流入量和人群流出量以及每一所述关联站点的人群流入量和人群流出量确定为所述第二关联人群信息。
9.根据权利要求1所述的人群预测模型训练方法,其特征在于,所述确定与所述第一站点相关联的第二交通工具对应的第二站点以及所述第二站点对应的第二栅格,包括:
确定所述第一站点的第一站点位置,将距离所述第一站点位置在第二预设距离范围内的第二交通工具的站点确定为与所述第一站点相关联的第二站点;
获取所述第二站点的第二站点位置,将距离所述第二站点位置在第三预设距离范围内的栅格确定为所述第二站点对应的第二栅格。
10.根据权利要求1所述的人群预测模型训练方法,其特征在于,所述根据所述第二栅格和所述第一栅格确定出所述第一站点对应的第三特征数据,包括:
获取所述第一栅格和所述第二栅格之间对应的重叠区域,并确定第二预设时间段内所述重叠区域的人群流入量;
确定第二预设时间段内所述第一栅格对应的人群流入量;
根据所述重叠区域的人群流入量和所述第一栅格对应的人群流入量确定出所述第一交通工具被所述第二交通工具替代的评分值,所述第三特征数据包括所述评分值。
11.根据权利要求1-10任一项所述的人群预测模型训练方法,其特征在于,所述根据所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型,包括:
确定所述第一站点对应的目标时间、所述第一站点在所述目标时间对应的人群流入总量以及所述第一站点的坐标信息;
根据所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据,以及所述人群流入总量、所述目标时间和所述坐标信息对基础模型进行训练,得到人群预测模型。
12.根据权利要求11所述的人群预测模型训练方法,其特征在于,所述根据所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据,以及所述人群流入总量、所述目标时间和所述坐标信息对基础模型进行训练,得到人群预测模型,包括:
将所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据,以及所述人群流入总量、所述目标时间和所述坐标信息输入至所述基础模型中,得到估算人群流入总量;
确定所述人群流入总量和所述估算人群流入总量之间的损失值,当所述损失值满足预设损失条件,则所述基础模型训练完成得到人群预测模型。
13.一种人群预测方法,其特征在于,包括:
确定出第一交通工具对应的目标站点以及所述目标站点对应的预测时间和位置信息;
获取所述目标站点对应的人群特征数据;
将所述目标站点对应的预测时间、所述位置信息和所述人群特征数据输入至如权利要求1-12任一项所述的人群预测模型训练方法训练出的人群预测模型中,得到所述目标站点在所述预测时间对应的预测人群流入总量。
14.一种人群预测模型训练装置,其特征在于,包括:
第一获取模块,用于获取对象的刷卡数据,并根据所述刷卡数据和第一交通工具的预设交通数据确定出所述对象的出行信息和所述第一站点对应的目标交通数据;
第一生成模块,用于根据所述出行信息和所述目标交通数据生成所述第一站点的第一特征数据;
第二生成模块,用于确定所述第一站点相关联的第一栅格以及相关联的关联站点,并根据所述相关联的第一栅格和所述关联站点确定出所述第一站点的第二特征数据;
第一确定模块,用于确定与所述第一站点相关联的第二交通工具对应的第二站点以及所述第二站点对应的第二栅格;
第三生成模块,用于根据所述第二栅格和所述第一栅格确定出所述第一站点对应的第三特征数据;
训练模块,用于根据所述第一特征数据、所述第二特征数据以及所述第三特征数据中的至少一种数据对基础模型进行训练,得到人群预测模型。
15.一种人群预测装置,其特征在于,包括:
第二确定模块,用于确定出第一交通工具对应的目标站点以及所述目标站点对应的预测时间和位置信息;
第二获取模块,用于获取所述目标站点对应的人群特征数据;
预测模块,用于将所述目标站点对应的预测时间、所述位置信息和所述人群特征数据输入至如权利要求1-12任一项所述的人群预测模型训练方法训练出的人群预测模型中,得到所述目标站点在所述预测时间对应的预测人群流入总量。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1-12任一项所述的人群预测模型训练方法或者权利要求13所述的人群预测方法。
17.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-12任一项所述的人群预测模型训练方法或者权利要求13所述的人群预测方法。
CN202311305911.0A 2023-10-08 2023-10-08 人群预测模型训练方法及相关方法、装置和设备 Pending CN117634721A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311305911.0A CN117634721A (zh) 2023-10-08 2023-10-08 人群预测模型训练方法及相关方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311305911.0A CN117634721A (zh) 2023-10-08 2023-10-08 人群预测模型训练方法及相关方法、装置和设备

Publications (1)

Publication Number Publication Date
CN117634721A true CN117634721A (zh) 2024-03-01

Family

ID=90027662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311305911.0A Pending CN117634721A (zh) 2023-10-08 2023-10-08 人群预测模型训练方法及相关方法、装置和设备

Country Status (1)

Country Link
CN (1) CN117634721A (zh)

Similar Documents

Publication Publication Date Title
US10088599B2 (en) Systems and methods for weather forecasting
CN113064839B (zh) 一种系统评测方法及装置
CN105579993A (zh) 用于物联网集成平台的数据整合机制
CN104798420A (zh) 基于沿路线遇到的周围的可识别无线信号源估计到达时间
CN112414420B (zh) 一种基于交通流量的导航方法以及相关装置
CN109556612A (zh) 一种导航信息处理方法、装置、服务器、终端及存储介质
CN109219953A (zh) 一种闹钟提醒方法及终端设备
CN110278324A (zh) 检测地铁进出站状态的方法、装置、终端设备和存储介质
Horn et al. QZTool—automatically generated origin-destination matrices from cell phone trajectories
CN104937914B (zh) 信息处理设备、信息处理方法以及介质
CN110520891B (zh) 信息处理装置、信息处理方法和程序
Acer et al. Scaling crowdsourcing with mobile workforce: A case study with belgian postal service
JP2012032968A (ja) 情報収集システム、情報処理装置、サーバ装置、情報収集方法およびプログラム
US20170347237A1 (en) Determining Semantic Travel Modes
Kishore et al. CENSE: A cognitive navigation system for people with special needs
JP6379305B1 (ja) ワイヤレス信号特性に基づくモバイルデバイスを使用したユーザコンテキストの検出
CN117634721A (zh) 人群预测模型训练方法及相关方法、装置和设备
CN116205335A (zh) 一种排水预测结果生成方法、装置、电子设备及存储介质
US20170347232A1 (en) Determining Semantic Travel Modes
CN110795994B (zh) 路口图像选择方法及装置
JP2019020942A (ja) マッチング装置、マッチング方法、およびプログラム
CN113077370A (zh) 地理瓦片的城市功能属性识别方法、设备、介质以及产品
CN111932411A (zh) 一种确定城市用地功能的方法、装置及终端设备
KR101937567B1 (ko) 대중교통수단분담률과 내부통행거리비율의 관계 분석 기반의 정보를 제공하기 위한 장치, 이를 위한 방법 및 이 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
CN106546242A (zh) 位置估计方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination