CN117455553B - 一种地铁站客流量预测的方法 - Google Patents

一种地铁站客流量预测的方法 Download PDF

Info

Publication number
CN117455553B
CN117455553B CN202311676289.4A CN202311676289A CN117455553B CN 117455553 B CN117455553 B CN 117455553B CN 202311676289 A CN202311676289 A CN 202311676289A CN 117455553 B CN117455553 B CN 117455553B
Authority
CN
China
Prior art keywords
model
prediction
prediction model
parameter
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311676289.4A
Other languages
English (en)
Other versions
CN117455553A (zh
Inventor
杨晓霞
崔春月
董海荣
魏金丽
马浩
韩超
杨磊
周敏
康元磊
张永亮
曲大义
朱兆文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao University of Technology
China Railway Construction Electrification Bureau Group Co Ltd
Third Engineering Co Ltd of China Railway Construction Electrification Bureau Group Co Ltd
Original Assignee
Qingdao University of Technology
China Railway Construction Electrification Bureau Group Co Ltd
Third Engineering Co Ltd of China Railway Construction Electrification Bureau Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao University of Technology, China Railway Construction Electrification Bureau Group Co Ltd, Third Engineering Co Ltd of China Railway Construction Electrification Bureau Group Co Ltd filed Critical Qingdao University of Technology
Priority to CN202311676289.4A priority Critical patent/CN117455553B/zh
Publication of CN117455553A publication Critical patent/CN117455553A/zh
Application granted granted Critical
Publication of CN117455553B publication Critical patent/CN117455553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/25Design optimisation, verification or simulation using particle-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/14Force analysis or force optimisation, e.g. static or dynamic forces
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Geometry (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种地铁站客流量预测的方法,涉及客流量预测领域,包括:基于社会力模型的仿真软件,建立地铁站实际场景的三维仿真环境;设置输入数据集,运行仿真过程获取输出数据集;构建基于随机森林算法的预测模型,采用AOA算法优化预测模型;利用验证集评估模型精度;利用测试集评估选择的最优模型的预测误差,当预测误差小于预设阈值时,则将对应的预测模型作为最终预测模型,否则返回重新选择最优模型;利用选择的最终预测模型,输入不同场景特征,预测对应场景下进站乘客对不同设施的选择情况。针对现有技术中客流量预测精度低的问题,本申请使用AOA算法对模型进行优化提高了地铁站客流预测精度。

Description

一种地铁站客流量预测的方法
技术领域
本申请涉及客流量预测领域,特别涉及一种地铁站客流量预测的方法。
背景技术
随着全球人口的快速城市化,城市轨道交通客流量呈现高速增长的态势。以地铁为例,其具有运量大、速度快、准点率高等优势,被广泛应用于城市公共交通体系中。地铁系统的运输能力大小,直接制约城市区域的人员流动效率,而其运力调配与管理,则依赖于准确预测客流分布。因此,地铁站客流量预测技术对地铁线路客流控制与管理具有重要支撑作用。
目前,地铁站客流量预测常采用神经网络模型、支持向量机模型等智能算法技术。其中,随机森林算法具有高预测精度、对异常值鲁棒的优势,但对样本集场景的适应性差,难以满足地铁站复杂场景的客流预测需求。人工神经网络模型,虽具有简洁性、通用性、适应性强等优点,却预测精度不高。
在相关技术中,比如中国专利文献CN116401941A中提供了一种地铁站闸机疏散能力的预测方法,包括以下步骤:构建闸机场景的三维仿真模型;构建预测模型、预测模型的训练集和测试集;使用沙猫群算法对预测模型进行优化,利用步骤二中得到的训练集对优化后的预测模型进行训练,得到训练完成的模型;向步骤三中得到的训练完成的模型中输入测试集中闸机数量、闸机间可通行宽度、个体期望速度与半径和人群数量,得到对应人群通过闸机的疏散时间的预测值,得到可用于预测闸机疏散能力的时间预测模型,通过采用基于社会力模型的仿真软件得到模型的训练集和测试集,可模拟多种闸机布置场景,在短时间内得到各场景下大量的训练集和测试集数据。但是该方案沙猫群算法优化可能会陷入局部最优解,未能找到全局最优模型,导致预测精度受限。
发明内容
1.要解决的技术问题
针对现有技术中存在的地铁站客流量预测精度低的问题,本申请提供了一种地铁站客流量预测的方法,用于地铁站付费区内进站乘客对不同设施选择的预测,通过构建仿真环境获得样本数据,建立基于随机森林算法的预测模型,并使用AOA算法对模型进行优化提高了地铁站客流预测精度。
2.技术方案
本申请的目的通过以下技术方案实现。
本说明书实施例提供一种地铁站客流量预测的方法,用于地铁站付费区内进站乘客对不同设施选择的预测,包括:采用基于社会力模型的仿真软件,建立地铁站实际场景的三维仿真环境,设置三维仿真环境中的进站区域,并在进站区域中设置付费区,付费区内设置不同设施;社会力模型(Social Force Model)是描述人群行为的微观仿真方法,将人群模拟成由许多具有自主行为的个体微粒组成的粒子系统,每个个体受到社会学力的驱动而运动。其中,社会学力可以分为异性个体间的斥力、同类个体间的引力以及个体与环境边界的作用力。基于社会力模型的仿真软件可以建立包含个体微粒的三维虚拟场景,模拟个体在场景中受力移动的轨迹,实现对复杂人群行为的仿真。在本申请中,采用基于社会力模型的仿真软件,通过设置地铁站三维场景中的环境边界、不同设施的吸引力或斥力场实现对乘客选择行为的模拟,获取不同情况下的仿真样本数据,用于建立预测模型。
具体地,社会力模型,在本申请中,可以采用牛顿力学模型,这个模型将人群当作质点,它遵循牛顿第二定律,认为行人运动受外力作用而产生加速度。主要的社会力来源是行人之间的相互作用力。磁场力模型,这个模型借鉴了电磁理论,将人群比作带电粒子,在虚拟“社会磁场力”的作用下移动。个体间没有直接接触,但会相互影响。粒子-弹簧模型,这个模型将每个个体视为一个粒子,个体之间用弹簧连接。在弹簧张力和个体意愿的共同作用下,模拟个体运动。连续力学模型,这个模型不再将人群视为离散个体,而是采用连续力学建模,将人群看作连续均质流体,由Navier Stokes方程描述运动。
地铁站实际场景是指地铁站点实际的物理环境及运行情况,包括站点结构、内部设施、运营模式、客流规律等方面。站点结构:指地铁站的运营区域范围,包含出入口、售票区、检票区、乘车区、站台区等功能分区。内部设施:指地铁站内各功能分区的服从设施,包括自动售检票机、安检通道、验票闸机、楼梯、扶梯、直梯等。运营模式,指地铁站的开放时间、运营线路方案等运营参数设置。客流规律,指不同时段及情景下,地铁站运营区域内的客流分布状态、客流大小、高峰等特征。在本申请中,需要考虑地铁站的全貌情况,构建反映实际场景的三维仿真环境,用于迭代优化预测模型,提高对复杂场景的适应性。
三维仿真环境指使用三维计算机图形技术,构建包含环境实体及个体代理的虚拟场景,用于重现和模拟现实世界的工作过程和物理行为。构建包含地铁站实际场景结构、设施、乘客个体等的三维仿真环境。在此环境中模拟多种情景下乘客选择路径和设施的运动学过程,用以收集训练预测模型的行为数据样本。
设置输入数据集,并将输入数据集输入建立的三维仿真环境中,运行仿真过程获取输出数据集,根据输出数据集构建训练集、验证集和测试集;设置输入数据集:根据影响乘客选择行为的关键因素,如乘客属性、设施距离、设施吞吐量、进站客流量等,构建描述这些影响因素的多维输入数据。将输入数据集加载到构建的包含实际场景细节的三维仿真环境中,驱动场景中代理乘客个体的运动,通过多次模拟获取不同情况下的仿真结果。记录仿真过程中个体乘客的运动轨迹、聚集分布、设施选择等多维输出数据,构成输出数据集。根据多轮模拟获得包含输入条件和输出结果的多组数据,构建训练样本集、验证集、测试集。通过利用三维仿真场景多情景采样获得丰富多样性的行为数据,可以提高预测模型对复杂实际情况的适应性,增强模型的泛化能力,从而提高复杂场景下的预测精度。
构建基于随机森林算法的预测模型,设置预测模型的节点分裂条件和叶子节点数目,采用AOA算法优化预测模型,并利用训练集训练优化后的预测模型;建立包含多棵决策树的随机森林回归模型,设置树节点的分裂条件和叶子节点数目,作为客流量预测的初始模型。引入适应度离散优化算法,通过迭代搜索找到随机森林模型的参数组合,获得对目标客流量预测问题的全局最优解,以提高预测的鲁棒性。使用三维仿真场景采集的包含复杂场景特征的训样集,对AOA算法优化后的随机森林模型进行监督学习训练,获得对复杂场景具有更强适应性的预测模型。经AOA算法优化后,在复杂样本集上的训练,进一步提升了随机森林模型对应复杂实际场景的预测精度与可靠性。
其中,节点分裂条件指构建决策树过程中,控制节点是否继续生成子节点的规则。常见分裂条件有基尼指数、信息增益率、信息增益等。选择不同的分裂条件可以影响决策树的生成结果。叶子节点数目:指决策树从根节点分裂到终端节点的分裂次数。叶子节点数目反映了决策树的复杂程度。适当控制叶子节点数目,可以获得决策树的最佳划分,防止过拟合。在本申请中,需要预先设置随机森林算法中决策树的节点分裂条件和叶子节点数目。这些参数的选择会影响随机森林的性能。通过AOA优化算法可以搜索出其最优配置,以提高随机森林模型的预测精度。
其中,AOA算法即自适应的离散优化算法(Adaptive Optimization Algorithm),是一种数值优化算法,可用于解决复杂的多峰优化问题。在本申请中,应用AOA算法来优化随机森林算法中的模型参数,使其在给定样本集上达到最小误差,进而获得一个对复杂实际场景具有最好预测效果的随机森林模型。具体是将参数看成AOA算法中的解向量,迭代改变参数组合,通过目标函数(即训练误差函数)评价指导搜索方向,以获得全局最优参数配置。
其中,随机森林算法是一种基于多棵决策树集成的监督学习算法。其基本原理是构建多棵决策树,让各树依据自身的学习对同一样本数据进行预测,并最终对所有预测结果进行整合以获得最终预测。该算法中的每棵决策树采用不同的训练样本、特征子集进行构建,保证了决策树之间的差异性。同时,算法引入随机化机制来避免过拟合问题。在本申请中,应用随机森林算法建立客流量预测模型。选用该算法是因为其对异常值具有强大的鲁棒性,并可以处理高维度的数据集。技术方案使用AOA算法来优化随机森林中的参数配置,找到其对复杂实际样本集的最佳拟合,以提高预测精度。
将验证集作为输入,评估构建的预测模型的输出结果与验证集中的实际值的误差,选择误差最小的模型作为最优模型;将验证集样本作为模型输入,得到预测输出。计算验证集实际输出与模型预测输出之间的误差,常用误差评价指标有MSE、RMSE、MAE等。重复上述步骤,得到AOA算法优化迭代过程中每次产生的新模型在验证集上的误差指标。比较不同迭代轮次的模型在验证集上的误差指标,选择错误最小,即达到损失函数最小的模型作为当前最优模型。将选择的最优模型在测试集上再次测试,如测试误差达到可接受水平,则最后确定该最优模型为最终的预测模型。通过引入独立的验证集对模型迭代过程进行监控,可以有效选择出最优参数配置下的最佳预测模型,防止在训练数据上过度拟合,提高模型的泛化能力,增强其对复杂场景的适应性。
利用测试集评估选择的最优模型的预测误差,当预测误差小于预设阈值时,则将对应的预测模型作为最终预测模型,否则返回重新选择最优模型;具体地,利用选择的最终预测模型,输入不同场景特征,预测对应场景下进站乘客对不同设施的选择情况。在验证集上选择误差最小的最优模型。利用独立的测试集数据集对该最优模型进行预测,计算测试集预测误差(如RMSE)。判断测试误差是否低于预先设置的错误阈值,该阈值是根据实际预测精度需求预先给定的。如果测试误差达到阈值要求,则确认该最优模型,部署使用。如果测试误差高于阈值,则返回到优化流程,重新进行模型的参数迭代优化,直到重新选择出一个测试误差满足要求的最优模型。得到终端最优模型,完成模型的评估与选择。通过测试集的评估,可以避免模型过拟合训练数据,而对实际场景依然保持较优预测能力的模型,将其作为最终模型使用。
进一步地,采用AOA算法优化基于随机森林算法的预测模型,AOA算法的优化目标函数为随机森林算法中决策树数量,通过迭代计算获取决策树数量的最优值,以生成优化后的预测模型。具体地,构建基于随机森林算法的初始预测模型,模型包含多棵决策树。设定AOA算法的优化目标函数为随机森林中决策树的数量,即森林大小,记为D数。在AOA算法迭代优化过程中,改变随机森林中决策树数量D,形成不同的模型参数组合。分别计算每种参数组合下,随机森林模型在训练集上的拟合效果,记录其预测误差。AOA算法以最小化训练集误差为优化目标,迭代计算并逼近决策树数量D的最优值。当优化过程满足终止条件时,输出当前对应的决策树数量D,生成优化后的随机森林模型。该优化后的随机森林模型将决策树数量D设置为对目标问题的最佳拟合值,从而获得了高精度的预测模型。通过将随机森林大小作为优化目标,用AOA算法寻找其最优配置,可获得对样本集最优拟合的高精度预测模型。
进一步地,采用AOA算法优化基于随机森林算法的预测模型,还包括:
AOA算法采用MOA函数,MOA函数值通过如下公式计算:
其中,为当前迭代数,/>为最大迭代次数,/>为MOA函数的最小值,/>为MOA函数最大值;利用MOA函数值和随机数进行比较,当MOA函数值大于等于随机数时执行AOA算法的全局搜索,否则进行局部搜索;其中,全局搜索为按照预设步长改变预测模型的所有参数组合来遍历预测模型的整个参数空间;局部搜索为在预测模型的当前参数组合下,改变单个参数的值,在对应参数的维度上进行搜索。
具体地,全局搜索,目的是遍历整个参数空间,找到全局最优区。设置较大搜索步长,产生更多种组合。改变所有参数,评价目标函数,记录最优值。迭代达到最大计算量限制,定位全局最优区。设置全局搜索可以增加找到全局最优解的概率。局部搜索,目的是在当前最优区域内细化搜索。以前期最优解为初始点,设置小步长。仅改变部分维度参数,评价目标函数。迭代达到精度要求,快速定位局部最优解。设置局部搜索可以减少计算量,提高精确度。引入MOA函数和随机数,实现全局与局部搜索的自适应切换。避免陷入局部最优,又提高计算效率。使AOA算法既保持全局搜索能力,又可快速精确迭代,从而大幅提高了优化速度。
进一步地,全局搜索,还包括:引入主算子运算,主算子运算用于改变预测模型的参数组合;主算子运算和随机数满足如下公式:
主算子运算和随机数满足如下公式:
其中,为下一次迭代中的解决方案,即预测模型的参数组合;/>为当前训练集预测误差最小的参数组合;/>为控制搜索步长的整数参数,/>为搜索精度控制参数;/>为/>区间内的随机数,当/>时,执行除法搜索策略,即减小搜索步长;否则执行乘法搜索策略,即增大搜索步长;MOP为数学优化器概率系数。
主算子运算实质上是改变参数组合的搜索规则,相当于AOA中的迭代次数。设置主算子可以加快全局搜索过程。搜索策略中的除法和乘法操作,可以自适应地减小或增大搜索步长,既可快速遍历整个参数空间,又可细化到局部,提高全局搜索的效率。数学优化器概率MOA,使得全局搜索中仍保留一定概率执行局部精化搜索。这避免陷入局部最优,也可加速找到全局最优区。随机数的引入增加了搜索路径的多样性,可产生更多样的解空间分布,有利于跳出局部最优,找到全局最优。总的来说,主算子运算、自适应搜索策略、MOA函数及随机机制的引入,实现了高效、稳定的全局搜索,这大大提升了AOA算法终止复杂问题时求出全局最优解的概率,增强了其在预测模型优化过程中的全局搜索能力。
具体地,根据公式,当时,将执行乘法搜索策略,即增大搜索步长。这符合全局搜索的需求,可以更快遍历整个参数空间。增大步长有利于跳出局部最优区域,实现对全局空间的广泛搜索。0.5的确定性设置降低了全局搜索过程的随机性。相比完全随机,更有利于按照系统的策略扩展全局搜索范围。可更快地遍历全局空间,找到全局最优区。减少了不必要的重复搜索,提高了搜索效率。与局部搜索形成对比,此设置增强了全局搜索的针对性。有利于预测模型参数优化的初期全局搜索和遍历。与局部搜索策略配合,提高参数优化与模型拟合的效果。最终可以提升预测模型的预测精度和泛化能力。综上,该设置增强了全局搜索的范围扩展能力,加快了对全局最优区域的识别,与局部搜索策略配合,提高了参数优化与模型训练的效果。
根据基于随机森林算法的预测模型的参数维度和初始种群个体数建立初始化方程
其中,为第i个个体的第j维参数值;/>为第j维参数的上界;/>为第j维参数的下界;/>为/>的随机数;通过设置上下界/>和/>,可以约束参数值在合理范围内,避免初始化超出参数空间。引入随机数and,可以增加种群样本的随机性,避免陷入局部最优解。根据参数维度和初始种群数构建初始化方程,可以生成符合要求的初始种群规模。初始化种群矩阵X为全局搜索提供初始样本,搜索更加全面和高效。有利于AOA算法的全局搜索过程,提供更优的参数组合,提高模型预测的鲁棒性。帮助算法跳出局部最优解,在全参数空间中寻找全局最优点,实现对模型的有效优化。最终提高基于随机森林算法预测模型的预测精度和泛化能力。总之,该初始化方程的设计符合AOA算法搜索机制,可以有效构建初始种群,为后续模型参数优化提供支撑,从而提高预测性能。
初始种群个体数为种群规模X,种群规模X为在AOA算法中根据预测模型的参数维度随机生成的初始种群矩阵X,X的表达式如下:
其中,表示第i个参数组合在第j个参数维度上的取值;定义了初始种群矩阵X的含义,即X中每一个元素/>代表一个参数组合的第j维参数值。/>明确了初始种群矩阵X的构成,即由多个参数组合构成,每个参数组合包含多个维度的参数。参数组合之间通过行索引i区分,一个组合内部通过列索引j区分不同维度的参数。这样的矩阵结构符合后续在参数空间中搜索最优参数组合的需要。明确了初始种群矩阵X的结构,为基于X进行的全局搜索奠定了基础。/>的定义将参数空间映射到初始种群矩阵X,为初始化种群个体创造了条件。有利于根据参数维度和初始种群数构建合理的初始矩阵X。为后续迭代过程提供了初始样本,使搜索过程更加可控和有效。最后可以提高AOA算法对模型参数优化的效果,从而提高预测精度。总之,/>的定义明确了初始种群矩阵X的内在结构,为初始化种群个体建立了数学表达,有利于参数空间到初始样本的映射,为后续搜索过程提供了有效的初始条件。
数学优化器概率系数MOP通过如下公式计算:
其中,灵敏度参数,用于表示迭代过程中的开发精度;/>为当前迭代数,为最大迭代次数。引入了灵敏度参数/>,可以控制迭代过程中的搜索精度,当需要更精细搜索时可以设置较大的/>
与当前迭代次数/>和最大迭代次数/>相结合,可以使MOP随着迭代次数变化。在迭代初期,/>较小,MOP较大,这有利于全局遍历,实现对整个参数空间的全局搜索。当/>接近/>时,MOP变小,这有利于局部细致搜索,加速找到局部最优解。MOP的变化有利于实现全局搜索和局部搜索的有机配合,提高参数优化的效果。根据不同的优化问题,可以通过调整α的参数设置实现不同的搜索策略。MOP的计算公式结合了固定参数和可变参数,使搜索策略可定制化和可控性更强。该公式设置符合AOA算法的搜索机制,使全局和局部搜索协同配合。有利于提高AOA算法对模型参数组合优化的效果。最终可以提高基于随机森林算法的预测模型性能,提高预测精度。
进一步地,局部搜索,还包括:主算子运算和随机数满足如下公式:
其中,为下一次迭代中的解决方案,即预测模型的参数组合;/>为当前训练集预测误差最小的参数组合;/>为搜索精度控制参数;/>为/>区间内的随机数,当/>时,执行减法搜索策略,即减小搜索步长;否则执行加法搜索策略,即增大搜索步长;MOP为数学优化器概率系数;引入主算子运算,根据当前最优解/>和随机数,生成新的候选解/>。主算子支持加法和减法搜索策略,可以灵活调整搜索步长。/>的随机比较控制是执行加法还是减法策略,增加搜索的随机性。减法策略有利于局部细致搜索,加法策略利于跳出局部最优。搜索精度因子/>可控制搜索幅度,避免迭代发散。结合MOP系数,搜索策略可在全局和局部之间平滑切换。局部搜索依据当前最优解进行,可快速逼近局部最优点。相比全局搜索更有针对性,计算效率更高。局部搜索作为优化迭代后期的策略,可迅速得到局部最优解。与全局搜索策略组合,提高了算法的优化效率。最后可以获得预测模型的参数局部最优值,提高模型的预测精度。
进一步地,利用训练集训练优化后的预测模型,还包括:输出构成随机森林算法的单个决策树,单个决策树用于构建基于随机森林算法的预测模型的训练过程。输出随机森林算法的单个决策树,将随机森林看作是多个决策树的集成。单棵决策树是随机森林的基本组成单元,理解单棵决策树的结构和生成过程对构建整个随机森林模型非常重要。在训练过程中,需要依次输出构成随机森林的每一棵决策树,这是训练的一个关键步骤。单棵决策树的生成会考虑特征选择、决策节点划分等,这些都影响最终模型的效果。对单棵决策树的输出,为理解随机森林算法的训练过程提供基础。在生成每棵决策树时,会有一定随机性,这保证决策树之间的差异性。多个决策树集成可以提高算法稳定性,避免过拟合。明确了随机森林算法的基本组成单元,以及模型训练中决策树的作用。有利于根据决策树的集成提高最终模型的预测精度和泛化能力。综上,该技术方案强调了决策树是构建随机森林的基础,输出单个决策树有利于理解和分析算法的训练过程,为构建一个优化后的强大预测模型提供支持。
构建单个决策树采用ID3算法,ID3算法满足如下公式:
其中,为信息熵,D为训练集的样本数据集,/>为第k类样本在样本数据集D中所占的样本比例;k的取值为1至y,y为样本数据集D中的样本类别数。
进一步地,还包括:利用信息增益法设置随机森林算法中每个决策树的根节点数目,并根据信息增益法设置预测模型中的叶子节点数目。利用信息增益法设置决策树的根节点数目。信息增益度量特征对样本分类的效果。信息增益大的特征更有助于样本分类,应选择在根节点进行分割。根据信息增益从大到小选择特征作为根节点,可以生成信息量最大的决策树。同时利用信息增益法设置叶子节点数目。信息增益小可能代表噪声或异常值。设置叶子节点止分割阈值,避免生长过深树,防止过拟合。信息增益法同时考虑树的广度和深度,获得合理规模的决策树。该方法为决策树提供最优的生成规则,提高单棵树的分类性能。引入信息增益法,增加了模型可解释性,理解特征对分类的贡献。集成信息增益法生成的决策树,可以提升随机森林模型的预测准确性。并且增强模型的泛化能力,防止过拟合现象。综上,该技术方案利用信息增益法优化决策树的生成,既考虑树的广度和深度,提升单棵树效果,又防止过拟合,提高随机森林模型的预测性能。
进一步地,构建单个决策树采用ID3算法,ID3算法满足如下公式:信息增益法设置预测模型中的叶子节点数目,信息增益法满足如下公式:
信息增益法设置预测模型中的叶子节点数目,信息增益法满足如下公式:
其中,为属性/>对样本数据集/>进行划分时得到的信息增益,/>为样本数据集/>的信息熵,/>为训练集的样本数据集,/>为划分数据集/>的特征或属性,/>使用特征/>对数据集/>进行划分后得到的分支节点数目,/>为特征/>对数据集/>进行划分后得到的第/>个分支节点,/>为第v个分支节点/>的信息熵。
其中,利用信息熵公式计算样本数据集的焦点度,度量样本混乱程度。信息熵高表示样本混乱,不易分类。信息熵低表示样本较纯,易于分类。再利用信息增益公式,选择最大程度减少信息熵的特征作为分割属性。信息增益大的特征更有区分样本的能力,应优先选择。递归地对子节点数据集计算信息熵和信息增益,生成决策树。设置信息增益最小值,控制决策树生长的深度和过拟合。信息增益法生成的决策树更加高效。选取最佳分割属性,构建信息量最大的决策树。相比其他划分指标,信息增益法更全面考虑样本分布。构建的决策树分类性能更优,提高随机森林准确率。综上,本申请运用信息论方法优化决策树生成,在降低样本混乱度的同时防止过拟合,有利于提高决策树和随机森林的预测准确性。
具体地,表示特征/>的信息增益,用于评估特征/>的分类效果。/>为原数据集/>的信息熵,反映当前样本集的杂乱程度。/>为原训练集样本,是决策树划分的起点。为用于划分/>的特征或属性,选择信息增益最大的/>进行划分。/>为特征/>划分/>后得到的分支节点数,反映划分的复杂程度。/>为特征/>的第/>个划分后的子节点数据集,计算每个子节点的信息熵/>。权衡当前集合杂乱度/>和划分复杂度V,选择最佳的特征/>。考虑所有划分子节点的熵/>,防止遗漏局部最优。这些参数综合考虑样本分布、划分效果、划分复杂度,构建出最优决策树。生成的决策树分类性能更强,提升随机森林的预测准确率。还可避免过拟合,改善模型的泛化能力。综上,信息增益公式参数设置全面考虑决策树构建的优化目标,有利于获得性能最强的决策树,提高随机森林模型的精度。
进一步地,地铁站实际场景的三维仿真环境包含地铁站厅,设置的不同设施包含与地铁站厅连接的楼梯、扶梯和直梯。其中,地铁站厅是车站的主要功能区之一,大量乘客经过这里,设置厅区可以模拟真实的客流集散情况。楼梯、扶梯、直梯是连接地铁站厅与站台的主要设施,设置这些设施可以模拟乘客的垂直流线。不同设施如楼梯、扶梯具有不同的通过能力和旅行时间,设置它们可以模拟乘客的设施选择偏好。通过设置这些主要功能区和设施,可以建立一个与实际地铁站场景类似的三维仿真环境。可以按照真实地铁站的布局和运营情况,设置仿真对象的参数和规则。运行仿真,可以观测到类似实际情况的乘客流动、设施选择等行为。从仿真中可以收集大量包含设施选择的数据,作为模型的样本数据。最后可以应用模型去预测新场景下的设施客流分布情况。模型预测结果会更加接近实际情况,从而提高预测准确性。综上,设置这些参数具有模拟真实场景、提供样本数据等技术优势,可以提高仿真环境的逼真度,并提高预测模型的有效性。
进一步地,输入数据集,用于表示影响进站乘客选择不同设施的因素,包含乘客的属性参数、闸机到不同设施的距离、不同设施的通行能力参数和模拟的进站乘客数量;输出数据集为利用建立的三维仿真环境运行仿真过程中生成的不同情况下不同设施的客流量数据。其中,输入数据集考虑了影响乘客选择的关键因素,使仿真条件更符合实际。乘客属性参数可以模拟不同人群的选择倾向,更全面。设施距离是影响选择的重要考量因素之一。设施通行能力会制约客流分布,设置此参数使仿真更准确。模拟不同进站数量可以观察客流分布动态变化。输出数据集包含设施客流量,是模型训练的样本数据。运行仿真获得不同条件下的输出数据,样本量更丰富。输入参数设置合理有利于仿真的准确性。输出数据集包含丰富信息,有利于训练更准确的预测模型。输入和输出数据集设置考虑多因素、全面合理,使仿真更符合实际。最后可以提高仿真的准确性,并辅助获得一个性能更强的预测模型。整体上提高预测的精确度和泛化能力。综上,输入输出数据集的参数设置能提高仿真的逼真度,并使训练得到的预测模型更加准确高效。
3.有益效果
相比于现有技术,本申请的优点在于:
(1)通过采用基于社会力模型的仿真软件和三维仿真环境,模拟地铁站实际场景,包括付费区内不同设施的设置,该方法能够更真实地反映进站乘客的行为;结合随机森林算法和AOA算法的优化,能够更准确地捕捉进站乘客对不同设施的选择行为,从而提高客流量预测的精度;
(2)通过引入全局搜索和局部搜索策略,结合主算子运算和随机数,该方法可以更灵活地搜索预测模型的参数空间;这样的优化过程可以有效避免陷入局部最优解,提高了预测模型的泛化能力,使其更适应不同的地铁站场景,从而提高客流量预测的精度;
(3)通过利用不同场景特征输入选择的最终预测模型,这种方法可以在不同地铁站场景下进行客流量预测;这提高了方法的通用性,使其能够适应不同结构、设施和流量特征的地铁站,从而更好地应对实际运营中的多样性和变化性,从而提高客流量预测的精度。
附图说明
本说明书将以示例性实施例的方式进一步描述,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的一种地铁站客流量预测的方法的示例性流程示意图;
图2是根据本说明书一些实施例所示的AOA优化算法示意图;
图3是根据本说明书一些实施例所示的地铁站付费区的三维仿真模型示意图;
图4是根据本说明书一些实施例所示的一种客流量仿真示意图;
图5是根据本说明书一些实施例所示的一种验证集预测结果对比示意图;
图6是根据本说明书一些实施例所示的一种测试集预测结果对比示意图;
图7是根据本说明书一些实施例所示的另一种测试集真实值和测试集预测值对比示意图;
图8是根据本说明书一些实施例所示的另一种验证集真实值和验证集预测值对比示意图。
具体实施方式
下面结合附图对本说明书实施例提供的方法和系统进行详细说明。
图1是根据本说明书一些实施例所示的一种地铁站客流量预测的方法的示例性流程示意图,如图1所示,一种地铁站客流量预测的方法,包括如下步骤:S110采用基于社会力模型的仿真软件,建立地铁站实际场景的三维仿真环境,设置三维仿真环境中的进站区域,并在进站区域中设置付费区,付费区内设置不同设施;S120设置输入数据集,并将输入数据集输入建立的三维仿真环境中,运行仿真过程获取输出数据集,根据输出数据集构建训练集、验证集和测试集;S130构建基于随机森林算法的预测模型,设置预测模型的节点分裂条件和叶子节点数目,采用AOA算法优化预测模型,并利用训练集训练优化后的预测模型;S140将验证集作为输入,评估构建的预测模型的输出结果与验证集中的实际值的误差,选择误差最小的模型作为最优模型;S150利用测试集评估选择的最优模型的预测误差,当预测误差小于预设阈值时,则将对应的预测模型作为最终预测模型,否则返回重新选择最优模型;S160利用选择的最终预测模型,输入不同场景特征,预测对应场景下进站乘客对不同设施的选择情况。其中,算术优化算法(Arithmetic Optimization Algorithm,AOA)是Abualigah在2020年提出的基于四则混合运算思想设计的元启发式优化算法。
图2是根据本说明书一些实施例所示的AOA优化算法示意图,如图2所示,算术优化算法利用算术运算符作为数学优化:利用算术中的乘除运算扩大算法全局搜索的分散性,利用加减运算提高算法局部搜索的精确性。最终获得的位置可以处于由搜索范围中的D、M、S和A的位置确定的范围内的随机位置。在其他概念中,D、M、S和A估计接近最优解的位置,并且其他解在接近最优解区域周围随机地更新它们的位置。本申请以地铁站付费区为例来详细说明地铁站付费区内进站乘客对设施选择的客流量预测方法的过程。
图3是根据本说明书一些实施例所示的地铁站付费区的三维仿真模型示意图,采用基于社会力模型的个体运动仿真软件,对应实地场景,对地铁站付费区进行建模,付费区内设施有多种布置方式,图3所示为其中的一种地铁站付费区仿真布置方式。利用MassMotion软件构建地铁付费区场景的三维仿真模型,Mass motion软件基于社会力模型模拟行人的运动,以适应物理环境内动态变化的条件(如避免障碍物和其他行人),并使用路线成本法寻路,可真实地模拟出乘客的运动规律。采用基于社会力模型的个体运动仿真软件Mass Motion,对应实地场景,通过“Scene”模块进行模型搭建,对地铁站内的付费区进行建模;通过“Activities”模块进行活动事件设置,对个体的人物属性进行设置;通过“Simulation&Analysis”模块进行行人运动的仿真模拟得到地铁站付费区内不同设施处的客流量。
其中,图3中非付费区域1为进站前的区域,乘客在此区域还未进入付费区域,付费区域2为进站后需要刷卡或者购票才能进入的区域;构建预测模型、预测模型的训练集、验证集和测试集,预测模型的基础使用随机森林模型,在随机森林模型的技术上,通过构造决策树,得到随机森林模型;将模拟个体放入三维仿真模型中,模拟不同场景下的行人疏散,构建预测模型的训练集、验证集和测试集;通过使用随机森林模型,得到基础的地铁站付费区内进站乘客对设施选择的客流量。
图4是根据本说明书一些实施例所示的一种客流量仿真示意图,如图4所示,在仿真中,将模拟个体放入仿真场景中,多次更改乘客属性、设施的通行能力、进站乘客数量,得到多组不同乘客属性、闸机到设施距离、设施的通行能力和进站乘客数量下的地铁站付费区内不同设施处的客流量,即训练集、验证集和测试集。本申请通过在仿真实验中多次更改乘客属性、闸机到设施距离、设施的通行能力和进站乘客数量,获取训练集、验证集和测试集,所用方法是基于社会力模型构建的地铁站付费区场景三维仿真模型进行仿真,社会力模型可较为精确地模拟个体运动,故所得数据可信度高。
使用AOA优化算法对预测模型进行优化,利用得到的训练集对优化后的预测模型进行训练,得到训练完成的模型;AOA优化算法基于种群的优化原理,灵感来源于基础的算术运算符运算。随机森林是基于决策树算法的集成算法,引入决策树数目保证模型可以有效防止过拟合,提高模型的泛化性能。但是随机森林模型受生成树数目会影响模型性能,增加生成树的数量可以提高模型的稳定性和预测精度,但超过某个阈值后增加树的数量不会进一步提高准确性,反而会降低模型效率。因此,本文才有AOA优化算法进行随机森林模型中决策树数目的迭代寻优。
进一步的,对AOA优化算法优化的随机森林模型进行训练,具体为:数据预处理,划分训练样本、验证样本和测试样本;根据输入特征的数量与预测特征的数量确定预测模型根节点的数目和最小叶子数,输入特征是乘客属性、闸机到设施的距离、设施的通行能力和进站乘客数量,输出为地铁站付费区内不同设施处的客流量,根据信息增益的原理定义根节点,确定决策树根节点的数目;设置决策树数目的初始值和阈值;将训练集作决策树为的输入向量,引入目标函数,对决策树进行训练。
具体的:随机森林是一种决策树的集成算法,其回归预测计算式如下:
其中,为回归预测模型,/>为单个决策树模型,x为输入变量。引入决策树的分裂方法,输出单个决策树模型/>,引入决策树数目到随机森林中,输出预测函数序列h1,h2,……hi。上述地铁站付费区内进站乘客对设施选择的客流量预测方法,根据决策树分裂方法,ID3决策树算法:
其中,为信息熵,D为训练集的样本数据集,/>为第k类样本在样本数据集D中所占的样本比例;k的取值为1至y,y为样本数据集D中的样本类别数。
信息增益法设置预测模型中的叶子节点数目,信息增益法满足如下公式:
其中,为属性/>对样本数据集/>进行划分时得到的信息增益,/>为样本数据集/>的信息熵,/>为训练集的样本数据集,/>为划分数据集/>的特征或属性,/>使用特征/>对数据集/>进行划分后得到的分支节点数目,/>为特征/>对数据集/>进行划分后得到的第/>个分支节点,/>为第v个分支节点/>的信息熵。/>
随机森林模型的结果在很大程度上取决于决策树数目,因此采用AOA优化算法优化这个参数,提高预测模型的准确度。初始化AOA算法,设置决策树数目的取值范围;利用AOA算法对预测模型中的决策树数目进行优化,重构预测算法,将决策数目作为AOA优化算法的一组候选解,计算AOA适应度值,更新最佳的决策树数目;在AOA算法中,根据基于随机森林算法的预测模型的参数维度和初始种群个体数建立初始化方程
其中,为第i个个体的第j维参数值;/>为第j维参数的上界;/>为第j维参数的下界;/>为/>的随机数。
初始种群个体数为种群规模X,种群规模X为在AOA算法中根据预测模型的参数维度随机生成的初始种群矩阵X,X的表达式如下:
其中,表示第i个参数组合在第j个参数维度上的取值;在AOA中,优化过程从矩阵X中所示的一组候选解(X)开始,该候选解是随机生成的,并且每次迭代中的最佳候选解被认为是迄今为止获得的最佳解或接近最佳解。在AOA开始工作之前,它应该选择搜索阶段(即全局探索或局部开发)。因此,使用数学优化器加速(MOA)函数计算的系数用于搜索:AOA算法采用MOA函数,MOA函数值通过如下公式计算:
其中,为当前迭代数,/>为最大迭代次数,/>为MOA函数的最小值,/>为MOA函数最大值;/>为MOA函数的最小值,取/>;/>为MOA函数最大值,取/>用来限制操作。比较/>和/>,当/><时进入搜索机制,否则得到最优解决方案,即最佳决策树数目。
搜索阶段由数学优化加速(MOA)函数决定,条件为(/>为随机数)。所使用的算子向最优区域收敛。根据算术运算符,使用除法(D)运算符或乘法(M)运算符进行的数学计算会得到高分布的值或判定,这就需要探索搜索机制。AOA的探索算子在搜索区域内随机探索多个区域,并根据两种主要搜索策略(D/M)找到更好的解决方案。需要注意的是,我们考虑了一个随机比例系数,以产生更多的多样化过程,并探索搜索空间的不同区域。我们采用了最简单的规则,它能够模拟算术算子的行为。本文为探索部分提出了以下位置更新方程:
/>
其中,为下一次迭代中的解决方案,即预测模型的参数组合;/>为当前训练集预测误差最小的参数组合;/>为控制搜索步长的整数参数,/>为搜索精度控制参数;/>为/>区间内的随机数,当/>时,执行除法搜索策略,即减小搜索步长;否则执行乘法搜索策略,即增大搜索步长;MOP为数学优化器概率系数。
在此阶段,第一个算子(D)以为条件,另一个算子(M)将被忽略,直到该算子完成当前任务。否则,第二个算子(M)将代替D执行当前任务(/>为随机数)。这里,数学优化器概率系数MOP通过如下公式计算:
其中,灵敏度参数,用于表示迭代过程中的开发精度;/>为当前迭代数,为最大迭代次数。
其中,为下一次迭代中的解决方案,即预测模型的参数组合;/>为当前训练集预测误差最小的参数组合;/>为搜索精度控制参数;/>为/>区间内的随机数,当/>时,执行减法搜索策略,即减小搜索步长;否则执行加法搜索策略,即增大搜索步长;MOP为数学优化器概率系数。
该阶段通过深度搜索来利用搜索空间。在这一阶段,第一个算子(S)以为条件,其他算子(A)将被忽略,直到该算子完成当前任务。否则,第二个算子(A)将代替S执行当前任务。本阶段的这些程序与上一阶段的分区类似。然而,探索搜索运算符(S和A)经常试图避免陷入局部搜索区域。这一过程有助于探索搜索策略找到最优解并保持候选解的多样性。
通过AOA优化算法的迭代计算,得到AOA算法的目标函数最优值对应的候选解,即随机森林模型最优的决策树数目。通过迭代计算,得到AOA算法的目标函数中最优值对应的候选解,并作为随机森林预测模型中的决策树数目,完成模型的训练。
向得到的训练完成的模型中输入测试集和验证集中乘客属性、闸机到设施的距离、设施的通行能力和进站乘客数量,得到地铁站付费区内不同设施处的客流量的预测值。
图5是根据本说明书一些实施例所示的一种验证集预测结果对比示意图,图6是根据本说明书一些实施例所示的一种测试集预测结果对比示意图;如图5和图6所示,预测值与真实值间吻合度较高。计算均方误差用以评价模型的有效性,图5展示了本预测方法的验证集预测结果。横轴为样本序号,纵轴为客流量大小。蓝线表示模型预测出的各样本客流量,红点为对应样本的真实客流量。可以看出,预测值能够较好地跟踪真实曲线的变化趋势,两者吻合度较高。为评价预测的准确性,计算预测结果与真值之间的均方误差(MSE)。通过阈值判断,MSE在可接受范围内,验证集预测效果良好。图6展示了本预测方法在独立测试集上的预测效果。与图5类似,预测曲线能够很好地拟合真实曲线,预测值和真实值吻合度高。测试集样本与训练集和验证集样本不同,预测效果依然良好,说明模型具有很好的泛化能力。同样计算MSE,低误差表明模型在测试集上的预测稳定有效。验证和测试结果说明,本预测方法可以准确预测客流量分布,并具备可靠的泛化能力。
图7是根据本说明书一些实施例所示的另一种测试集真实值和测试集预测值对比示意图,图8是根据本说明书一些实施例所示的另一种验证集真实值和验证集预测值对比示意图;如图7和图8所示,给出了预测模型的精度分析情况,从图7和图8中可以看出本申请的模型预测精度良好,说明设施选择预测模型的准确度较高,从而得到可用于地铁站付费区内进站乘客对设施选择的客流量预测模型。将一组包含乘客属性、闸机到设施的距离、设施的通行能力、进站乘客数量的数据输入到已完成训练和测试的AOA优化和本申请的学习机模型中,得到地铁站付费区内进站乘客对设施选择的客流量,预测值的均方误差较随机森林模型的均方误差下降,其预测精度得到提高。验证集和测试集结果表明,经AOA算法优化的模型精度高,准确预测进站乘客对设施的选择,具有较强泛化能力。结果证明了基于AOA算法优化的预测方法可以有效提高地铁站设施选择预测的准确性。
以上示意性地对本申请创造及其实施方式进行了描述,该描述没有限制性,在不背离本申请的精神或者基本特征的情况下,能够以其他的具体形式实现本申请。附图中所示的也只是本申请创造的实施方式之一,实际的结构并不局限于此,权利要求中的任何附图标记不应限制所涉及的权利要求。所以,如果本领域的普通技术人员受其启示,在不脱离本创造宗旨的情况下,不经创造性地设计出与该技术方案相似的结构方式及实施例,均应属于本专利的保护范围。此外,“包括”一词不排除其他元件或步骤,在元件前的“一个”一词不排除包括“多个”该元件。产品权利要求中陈述的多个元件也可以由一个元件通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (1)

1.一种地铁站客流量预测的方法,用于地铁站付费区内进站乘客对不同设施选择的预测,其特征在于:
采用基于社会力模型的仿真软件,建立地铁站实际场景的三维仿真环境,设置三维仿真环境中的进站区域,并在进站区域中设置付费区,付费区内设置不同设施;
设置输入数据集,并将输入数据集输入建立的三维仿真环境中,运行仿真过程获取输出数据集,根据输出数据集构建训练集、验证集和测试集;
构建基于随机森林算法的预测模型,设置预测模型的节点分裂条件和叶子节点数目,采用AOA算法优化预测模型,并利用训练集训练优化后的预测模型;
将验证集作为输入,评估构建的预测模型的输出结果与验证集中的实际值的误差,选择误差最小的模型作为最优模型;评估误差采用RMSE;
利用测试集评估选择的最优模型的预测误差,当预测误差小于预设阈值时,则将对应的预测模型作为最终预测模型,否则返回重新选择最优模型;
利用选择的最终预测模型,输入不同场景特征,预测对应场景下进站乘客对不同设施的选择情况;
采用AOA算法优化基于随机森林算法的预测模型,AOA算法的优化目标函数为随机森林算法中决策树数量,通过迭代计算获取决策树数量的最优值,以生成优化后的预测模型;
其中,社会力模型采用连续力学模型,将人群作为连续均质流体,由Navier Stokes方程描述运动;
采用AOA算法优化基于随机森林算法的预测模型,还包括:
AOA算法采用MOA函数,MOA函数值通过如下公式计算:
其中,CurIter为当前迭代数,MaxIter为最大迭代次数,MOAmin为MOA函数的最小值,MOAmax为MOA函数最大值;
利用MOA函数值和随机数进行比较,当MOA函数值大于等于随机数时执行AOA算法的全局搜索,否则进行局部搜索;
其中,全局搜索为按照预设步长改变预测模型的所有参数组合来遍历预测模型的整个参数空间;局部搜索为在预测模型的当前参数组合下,改变单个参数的值,在对应参数的维度上进行搜索;
全局搜索,还包括:
引入主算子运算,主算子运算用于改变预测模型的参数组合;
主算子运算和随机数满足如下公式:
其中,Xi,j(Iter+1)为下一次迭代中的解决方案,即预测模型的参数组合;best(xj)为当前训练集预测误差最小的参数组合;∈为控制搜索步长的整数参数,μ为搜索精度控制参数;r2为[0,1]区间内的随机数,当r2<0.5时,执行除法搜索策略,即减小搜索步长;否则执行乘法搜索策略,即增大搜索步长;MOP为数学优化器概率系数;
根据基于随机森林算法的预测模型的参数维度和初始种群个体数建立初始化方程Xi,j
Xi,j=(μ×μbj-lbj)×rand+lbj
其中,Xi,j为第i个个体的第j维参数值;μbj为第j维参数的上界;
lbj为第j维参数的下界;rand为[0,1]的随机数;
初始种群个体数为种群规模X,种群规模X为在AOA算法中根据预测模型的参数维度随机生成的初始种群矩阵X,X的表达式如下:
其中,Xi,j表示第i个参数组合在第j个参数维度上的取值;
数学优化器概率系数MOP通过如下公式计算:
其中,α灵敏度参数,用于表示迭代过程中的开发精度;CurIter为当前迭代数,MaxIter为最大迭代次数;
局部搜索,还包括:
主算子运算和随机数满足如下公式:
其中,Xi,j(Iter+1)为下一次迭代中的解决方案,即预测模型的参数组合;best(xj)为当前训练集预测误差最小的参数组合;μ为搜索精度控制参数;r3为[0,1]区间内的随机数,当r3<0.5时,执行减法搜索策略,即减小搜索步长;否则执行加法搜索策略,即增大搜索步长;MOP为数学优化器概率系数;
利用训练集训练优化后的预测模型,还包括:
输出构成随机森林算法的单个决策树,单个决策树用于构建基于随机森林算法的预测模型的训练过程;
还包括:
利用信息增益法设置随机森林算法中每个决策树的根节点数目,并根据信息增益法设置预测模型中的叶子节点数目;
构建单个决策树采用ID3算法,ID3算法满足如下公式:
其中,ED为信息熵,D为训练集的样本数据集,pk为第k类样本在样本数据集D中所占的样本比例;k的取值为1至y,y为样本数据集D中的样本类别数;
信息增益法设置预测模型中的叶子节点数目,信息增益法满足如下公式:
其中,G(D,a)为属性a对样本数据集D进行划分时得到的信息增益,ED为样本数据集D的信息熵,D为训练集的样本数据集,a为划分数据集D的特征或属性,V使用特征a对数据集D进行划分后得到的分支节点数目,Dv为特征a对数据集D进行划分后得到的第V个分支节点,为第v个分支节点Dv的信息熵;
地铁站实际场景的三维仿真环境包含地铁站厅,设置的不同设施包含与地铁站厅连接的楼梯、扶梯和直梯;
输入数据集,用于表示影响进站乘客选择不同设施的因素,包含乘客的属性参数、闸机到不同设施的距离、不同设施的通行能力参数和模拟的进站乘客数量;
输出数据集为利用建立的三维仿真环境运行仿真过程中生成的不同情况下不同设施的客流量数据;
其中,输出数据集包含仿真过程中个体乘客的运动轨迹、聚集分布和设施选择。
CN202311676289.4A 2023-12-08 2023-12-08 一种地铁站客流量预测的方法 Active CN117455553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311676289.4A CN117455553B (zh) 2023-12-08 2023-12-08 一种地铁站客流量预测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311676289.4A CN117455553B (zh) 2023-12-08 2023-12-08 一种地铁站客流量预测的方法

Publications (2)

Publication Number Publication Date
CN117455553A CN117455553A (zh) 2024-01-26
CN117455553B true CN117455553B (zh) 2024-04-30

Family

ID=89580080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311676289.4A Active CN117455553B (zh) 2023-12-08 2023-12-08 一种地铁站客流量预测的方法

Country Status (1)

Country Link
CN (1) CN117455553B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003128A (zh) * 2018-07-07 2018-12-14 太原理工大学 基于改进的随机森林公共自行车站点需求量预测方法
CN109522876A (zh) * 2018-12-13 2019-03-26 北京交通大学 基于bp神经网络的地铁站楼扶梯选择预测方法及系统
CN110266528A (zh) * 2019-06-12 2019-09-20 南京理工大学 基于机器学习的车联网通信的流量预测方法
CN114358414A (zh) * 2021-12-30 2022-04-15 北方工业大学 一种自适应并行的社区养老服务点选址优化方法及系统
CN115358491A (zh) * 2022-10-19 2022-11-18 南瑞轨道交通技术有限公司 一种基于ceemdan-lstm的地铁客流预测方法及系统
CN115496293A (zh) * 2022-10-18 2022-12-20 浙江砖助智连科技有限责任公司 一种基于极端森林算法的干损疏解机用水量预测模型
WO2023056696A1 (zh) * 2021-10-08 2023-04-13 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN116401941A (zh) * 2023-03-27 2023-07-07 青岛理工大学 一种地铁站闸机疏散能力的预测方法
CN116933946A (zh) * 2023-08-07 2023-10-24 扬州大学 一种基于客流去向结构的轨道交通od客流预测方法及系统
CN116957331A (zh) * 2023-07-17 2023-10-27 盛视科技股份有限公司 风险旅客流量范围预测方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11195412B2 (en) * 2019-07-16 2021-12-07 Taiwo O Adetiloye Predicting short-term traffic flow congestion on urban motorway networks
CN112561146B (zh) * 2020-12-08 2023-04-18 哈尔滨工程大学 一种基于模糊逻辑和深度lstm的大规模实时交通流预测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003128A (zh) * 2018-07-07 2018-12-14 太原理工大学 基于改进的随机森林公共自行车站点需求量预测方法
CN109522876A (zh) * 2018-12-13 2019-03-26 北京交通大学 基于bp神经网络的地铁站楼扶梯选择预测方法及系统
CN110266528A (zh) * 2019-06-12 2019-09-20 南京理工大学 基于机器学习的车联网通信的流量预测方法
WO2023056696A1 (zh) * 2021-10-08 2023-04-13 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN114358414A (zh) * 2021-12-30 2022-04-15 北方工业大学 一种自适应并行的社区养老服务点选址优化方法及系统
CN115496293A (zh) * 2022-10-18 2022-12-20 浙江砖助智连科技有限责任公司 一种基于极端森林算法的干损疏解机用水量预测模型
CN115358491A (zh) * 2022-10-19 2022-11-18 南瑞轨道交通技术有限公司 一种基于ceemdan-lstm的地铁客流预测方法及系统
CN116401941A (zh) * 2023-03-27 2023-07-07 青岛理工大学 一种地铁站闸机疏散能力的预测方法
CN116957331A (zh) * 2023-07-17 2023-10-27 盛视科技股份有限公司 风险旅客流量范围预测方法和装置
CN116933946A (zh) * 2023-08-07 2023-10-24 扬州大学 一种基于客流去向结构的轨道交通od客流预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Short-Term Traffic Flow Prediction Based on Least Square Support Vector Machine with Hybrid Optimization Algorithm";Luo, C 等;《NEURAL PROCESSING LETTERS》;20191231;第50卷(第3期);pp:2305-2322 *
"基于MassMotion 的地铁站乘客疏散特性分析";蒋海龙;《万方数据知识服务平台》;20231012 *

Also Published As

Publication number Publication date
CN117455553A (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
Reinelt TSPLIB—A traveling salesman problem library
Ferber et al. Neural network heuristics for classical planning: A study of hyperparameter space
CN113704956A (zh) 一种基于数字孪生技术的城市道路在线微观仿真方法及系统
CN116401941B (zh) 一种地铁站闸机疏散能力的预测方法
Jubair et al. Social class particle swarm optimization for variable-length Wireless Sensor Network Deployment
CN114898293A (zh) 一种面向自动驾驶汽车的过街行人群体多模态轨迹预测方法
Chen et al. Multi-objective clustering analysis via combinatorial pigeon inspired optimization
Fontes et al. On multi-objective evolutionary algorithms
Zhang et al. Direction-decision learning based pedestrian flow behavior investigation
Ning‐bo et al. Destination and route choice models for bidirectional pedestrian flow based on the social force model
Samarasinghe et al. Grammar-based cooperative learning for evolving collective behaviours in multi-agent systems
Loibl et al. Simulation of Polycentric Urban Growth Dynamics Through Agents: Modle concept, application, result and validation
CN117455553B (zh) 一种地铁站客流量预测的方法
Rasekh et al. EDNC: Evolving differentiable neural computers
El-Wahed Intelligent fuzzy multi-criteria decision making: review and analysis
Testa et al. Crowdest: a method for estimating (and not simulating) crowd evacuation parameters in generic environments
CN115981302A (zh) 车辆跟驰换道行为决策方法、装置及电子设备
Duro et al. Collaborative multi-objective optimization for distributed design of complex products
Casas Deep reinforcement learning for urban traffic light control
Jin et al. Optimizing crowd simulation based on real video data
da Costa Oliveira et al. A framework for inverse surrogate modeling for fitness estimation applied to multi-objective evolutionary algorithms
Moussa et al. Real-time path planning with virtual magnetic fields
Froelich et al. Learning fuzzy cognitive maps from the web for the stock market decision support system
Duc et al. Hierarchical pathfinding and ai-based learning approach in strategy game design
Guo et al. Simulated CAVs driving and characteristics of the mixed traffic using reinforcement learning method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant