CN113283508B - 客流预测方法、装置、设备及存储介质 - Google Patents

客流预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113283508B
CN113283508B CN202110590599.9A CN202110590599A CN113283508B CN 113283508 B CN113283508 B CN 113283508B CN 202110590599 A CN202110590599 A CN 202110590599A CN 113283508 B CN113283508 B CN 113283508B
Authority
CN
China
Prior art keywords
passenger flow
data
preset
predicted
preset time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110590599.9A
Other languages
English (en)
Other versions
CN113283508A (zh
Inventor
钱江
温文波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202110590599.9A priority Critical patent/CN113283508B/zh
Publication of CN113283508A publication Critical patent/CN113283508A/zh
Application granted granted Critical
Publication of CN113283508B publication Critical patent/CN113283508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请提供一种客流预测方法、装置、设备及存储介质。在预设时间周期内,获取于各待预测交通枢纽和各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,通过残差分量数据对预设学习网络模型进行训练,根据训练结果及预设预测模型生成随机客流预测结果,并根据趋势项数据和随机客流预测结果各自的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流。客流预测的样本数据具备数据量较大且局限性小的特点,能够实现客流融合分析以满足综合预测需求。对非连续的随机特征与预测结果之间内在关联进行考量,有效提升预测精度,以获得高精度及高可靠性的预测结果。

Description

客流预测方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种客流预测方法、装置、设备及存储介质。
背景技术
随着旅游业的发展,对于客流预测成为满足旅游需求必需的研究核心,尤其对于从火车站、高铁站、机场、汽车站、码头等一系列的交通枢纽区域出发并经过或者到达各不同目的区域的客流预测更成为关注重点。
针对目前的客流预测方案,在数据选择方面大多采用单一类型的客流监测数据,存在数据量小且局限性大等缺点,缺乏对区域周边不同模式的交通客流的融合分析,导致无法满足区域的综合预测需求。而在所采用的预测手段方面,主要集中在统计学预测和机器学习预测,例如统计学预测手段中采用的时间序列分析以及统计预测,机器学习预测手段中采用的BP(Back Propagation)网络以及对应的回归模型等。然而,现有的这种预测手段也存在诸多缺陷,导致预测精度不够,无法满足预测需求。例如,传统的统计学预测手段仅单纯从数据统计的角度分析客流规律,进而实现统计预测,预测质量在很大程度上依赖于所统计到的数据的质量,若所统计到的数据质量欠佳,则直接导致预测结果精度较低、可靠性较低。而机器学习预测手段中采用BP网络,又例如长短期记忆(Long Short-TermMemory,LSTM)网络、卷积神经网络(Convolutional Neural Network,CNN)等人工神经网络,虽然易于实现任何复杂非线性映射功能,并能够发挥模型固有的长期记忆的能力,但这种人工神经网络并不能有效挖掘非连续数据之间蕴含的有效信息与潜在关系,进而导致对客流的预测精度不够。
可见,亟需一种客流预测方案以克服现有技术中存在的上述问题。
发明内容
本申请提供一种客流预测方法、装置、设备及存储介质,用于解决现有的客流预测方案在数据选择和预设手段方面存在的缺陷导致预测精度不够无法满足预测需求的技术问题。
第一方面,本申请提供一种客流预测方法,包括:
在预设时间周期内,获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到样本数据集合;
根据所述样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,以通过所述残差分量数据对预设学习网络模型进行训练得到训练结果,所述趋势项数据用于表征客流的规律特征对客流的影响,所述残差分量数据用于表征客流的随机特征对所述客流的影响;
根据训练结果以及预设预测模型生成随机客流预测结果,并根据所述趋势项数据和所述随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流。
在一种可能的设计中,所述获取于待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,包括:
获取所述预设通信网络所属基站小区内的各交通枢纽,并按照各交通枢纽的名称信息对各交通枢纽进行归类,以根据归类后的各交通枢纽确定各待预测交通枢纽;
获取各第一预设时间点于各待预测交通枢纽使用所述预设通信网络的第一用户清单,并获取各第二预设时间点于各待预测区域使用所述预设通信网络的第二用户清单,各用户数据包括所述第一用户清单和所述第二用户清单。
在一种可能的设计中,所述根据各用户数据得到样本数据集合,包括:
根据所述第一用户清单和所述第二用户清单确定第一原始数据,每个第一原始数据用于表征第一用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,所述第一用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发并到达或者经由各待预测区域的用户数量;
根据所述预设时间周期内的各第一预设时间点以及对应的各第一原始数据和各第二原始数据生成各原始数据集合,每个第二原始数据用于表征第二用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,所述第二用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发未到达或者未经由各待预测区域的用户数量;
根据各原始数据集合以及获取各用户数据时的随机特征数据得到对应的样本数据集合,所述随机特征数据包括数值化的天气特征数据、突发事件数据以及特征时间数据中的至少一种。
在一种可能的设计中,所述根据所述预设时间周期内的各第一预设时间点以及对应的各第一原始数据和各第二原始数据生成各原始数据集合,包括:
将各第一预设时间点按照预设数值化算法进行数值化,以将所述预设时间周期内数值化后的各第一预设时间点与对应的各第一原始数据和各第二原始数据形成的各原始数据确定为所述原始数据集合。
在一种可能的设计中,所述根据所述样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,包括:
对所述样本数据集合中的各样本数据进行所述预设傅里叶变换,并结合预设频谱阈值以及所述变换结果进行所述预设傅里叶变换对应的傅里叶逆变换,以得到逆变换结果;
将所述逆变换结果确定为所述趋势项数据,并根据所述趋势项数据以及各样本数据得到所述残差分量数据。
在一种可能的设计中,所述通过所述残差分量数据对预设学习网络模型进行训练得到训练结果,包括:
将所述残差分量数据作为底层训练样本,以将所述底层训练样本确定为所述预设学习网络模型的输入量对所述预设学习网络模型进行逐层训练,得到对应的输出量;
将所述输出量中的顶层输出量确定为所述训练结果,所述训练结果用于表征所述预设学习网络模型对所述客流的随机特征进行学习后得到的对应结果。
在一种可能的设计中,所述根据训练结果以及预设预测模型生成随机客流预测结果,包括:
将所述训练结果作为所述预设预测模型的输入量,以根据所述预设预测模型中的预设径向基核函数生成所述随机客流预测结果与所述客流的随机特征之间的非线性映射关系;
根据所述非线性映射关系得到所述预设预测模型的输出量,以将所述输出量确定为所述随机客流预测结果对应的客流值。
在一种可能的设计中,所述根据所述趋势项数据和所述随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流,包括:
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的所述趋势项数据中用于表征客流的数据确定为规律客流值,所述规律客流值为所述趋势项数据对应的所述客流值;
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的所述随机客流预测结果对应的所述客流值确定为随机客流值;
将所述规律客流值和所述随机客流值进行加和运算,以将所述加和运算的结果确定为各第一预设时间点从各待预测交通枢纽至对应的各待预测区域的所述预测客流。
在一种可能的设计中,所述预设学习网络模型为深度置信网络模型;所述预设预测模型为支持向量回归机。
第二方面,本申请提供一种客流预测装置,包括:
获取模块,用于在预设时间周期内,获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到样本数据集合;
第一处理模块,用于根据所述样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,以通过所述残差分量数据对预设学习网络模型进行训练得到训练结果,所述趋势项数据用于表征客流的规律特征对客流的影响,所述残差分量数据用于表征客流的随机特征对所述客流的影响;
第二处理模块,用于根据训练结果以及预设预测模型生成随机客流预测结果,并根据所述趋势项数据和所述随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流。
在一种可能的设计中,所述获取模块,具体用于:
获取所述预设通信网络所属基站小区内的各交通枢纽,并按照各交通枢纽的名称信息对各交通枢纽进行归类,以根据归类后的各交通枢纽确定各待预测交通枢纽;
获取各第一预设时间点于各待预测交通枢纽使用所述预设通信网络的第一用户清单,并获取各第二预设时间点于各待预测区域使用所述预设通信网络的第二用户清单,各用户数据包括所述第一用户清单和所述第二用户清单。
在一种可能的设计中,所述获取模块,还具体用于:
根据所述第一用户清单和所述第二用户清单确定第一原始数据,每个第一原始数据用于表征第一用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,所述第一用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发并到达或者经由各待预测区域的用户数量;
根据所述预设时间周期内的各第一预设时间点以及对应的各第一原始数据和各第二原始数据生成各原始数据集合,每个第二原始数据用于表征第二用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,所述第二用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发未到达或者未经由各待预测区域的用户数量;
根据各原始数据集合以及获取各用户数据时的随机特征数据得到对应的样本数据集合,所述随机特征数据包括数值化的天气特征数据、突发事件数据以及特征时间数据中的至少一种。
在一种可能的设计中,所述获取模块,还具体用于:
将各第一预设时间点按照预设数值化算法进行数值化,以将所述预设时间周期内数值化后的各第一预设时间点与对应的各第一原始数据和各第二原始数据形成的各原始数据确定为所述原始数据集合。
在一种可能的设计中,所述第一处理模块,具体用于:
对所述样本数据集合中的各样本数据进行所述预设傅里叶变换,并结合预设频谱阈值以及所述变换结果进行所述预设傅里叶变换对应的傅里叶逆变换,以得到逆变换结果;
将所述逆变换结果确定为所述趋势项数据,并根据所述趋势项数据以及各样本数据得到所述残差分量数据。
在一种可能的设计中,所述第一处理模块,还具体用于:
将所述残差分量数据作为底层训练样本,以将所述底层训练样本确定为所述预设学习网络模型的输入量对所述预设学习网络模型进行逐层训练,得到对应的输出量;
将所述输出量中的顶层输出量确定为所述训练结果,所述训练结果用于表征所述预设学习网络模型对所述客流的随机特征进行学习后得到的对应结果。
在一种可能的设计中,所述第二处理模块,具体用于:
将所述训练结果作为所述预设预测模型的输入量,以根据所述预设预测模型中的预设径向基核函数生成所述随机客流预测结果与所述客流的随机特征之间的非线性映射关系;
根据所述非线性映射关系得到所述预设预测模型的输出量,以将所述输出量确定为所述随机客流预测结果对应的客流值。
在一种可能的设计中,所述第二处理模块,还具体用于:
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的所述趋势项数据中用于表征客流的数据确定为规律客流值,所述规律客流值为所述趋势项数据对应的所述客流值;
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的所述随机客流预测结果对应的所述客流值确定为随机客流值;
将所述规律客流值和所述随机客流值进行加和运算,以将所述加和运算的结果确定为各第一预设时间点从各待预测交通枢纽至对应的各待预测区域的所述预测客流。
在一种可能的设计中,所述预设学习网络模型为深度置信网络模型;所述预设预测模型为支持向量回归机。
第三方面,本申请提供一种电子设备,包括:
处理器;以及,
存储器,用于存储所述处理器的计算机程序;
其中,所述处理器配置为经由执行所述计算机程序来执行第一方面所提供的任意一种可能的客流预测方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所提供的任意一种可能的客流预测方法。
第五方面,本申请还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面所提供的任意一种可能的客流预测方法。
本申请提供一种客流预测方法、装置、设备及存储介质。首先在预设时间周期内,获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到样本数据集合,进而根据样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,以通过残差分量数据对预设学习网络模型进行训练得到训练结果,其中,趋势项数据用于表征客流的规律特征对客流的影响,残差分量数据用于表征客流的随机特征对客流的影响。最后根据训练结果以及预设预测模型生成随机客流预测结果,并根据趋势项数据和随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流,以实现对各待预测交通枢纽至各待预测区域的客流预测。本申请提供的客流预测方法通过获取在各待预测交通枢纽和各待预测区域使用预设通信网络的各用户数据得到样本数据集合中的各样本数据,使得进行客流预测的样本数据不但具备数据量较大且局限性较小的特点,并能够达到对客流的融合分析。并对各样本数据分别利用预设傅里叶变换以及预设学习网络模型的相应处理,可以充分考量非连续的随机特征与预测结果之间的内在关联,有效提升客流预测精度,进而不但满足综合预测需求还使得预测结果具备高精度以及高可靠性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用场景示意图;
图2为本申请实施例提供的一种客流预测方法的流程示意图;
图3为本申请实施例提供的另一种客流预测方法的流程示意图;
图4为本申请实施例提供的再一种客流预测方法的流程示意图;
图5为本申请实施例提供的又一种客流预测方法的流程示意图;
图6为本申请实施例提供的又一种客流预测方法的流程示意图;
图7为本申请实施例提供的一种客流预测装置的结构示意图;
图8为本申请提供的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的方法和装置的例子。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
现有的客流预测方法在数据选择和预测手段方面均存在诸多问题。例如,在数据选择方面,大多采用单一类型的客流监测数据,存在数据量小且局限性大等缺点,缺乏对区域周边不同模式的交通客流的融合分析,导致无法满足区域的综合预测需求。在预测手段方面主要集中在统计学预测和机器学习预测,这些预测手段均还存在诸多缺陷,会导致预测精度不够,无法满足预测需求。例如,传统的统计学预测手段仅单纯从数据统计的角度分析客流规律,进而实现统计预测,预测质量在很大程度上依赖于所统计到的数据的质量,若所统计到的数据质量欠佳,则直接导致预测结果精度较低、可靠性较低。而机器学习预测手段中采用BP网络,又例如长短期记忆(Long Short-Term Memory,LSTM)网络、卷积神经网络(Convolutional Neural Network,CNN)等人工神经网络,虽然易于实现任何复杂非线性映射功能,且还能够发挥模型固有的长期记忆的能力,但这种人工神经网络并不能有效挖掘非连续数据之间蕴含的有效信息与潜在关系,进而也会导致客流预测精度不够。
针对现有技术中存在的上述问题,本申请提供一种客流预测方法、装置、设备及存储介质。本申请提供的客流预测方法的发明构思在于:首先获取各待预测交通枢纽以及各待预测区域内使用预设通信网络的各用户数据,以通过所获取到的各用户数据得到各样本数据。在数据选择方面并非单一类型的客流监测,而是基于各待预测交通枢纽和各待预测区域之间的各用户数据内在的关联得到各样本数据,使得所选择的数据具备数据量大且局限性小等优点,能够达到对客流的融合分析,进而满足区域的综合预测需求。其次,在基于各样本数据进行客流预测的预测阶段,利用了预设傅里叶变换以及预设学习网络模型对各样本数据进行相应处理,可以获取到非连续的随机特征与预测结果之间的内在关联,进而可以获得高精度以及高可靠性的预测客流。
以下,对本申请实施例的示例性应用场景进行介绍。
图1为本申请实施例提供的一种应用场景示意图。如图1所示,网络可以为基站11、终端设备12以及电子设备13之间提供通信链路的介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备12和电子设备13通过网络可以分别与基站11之间进行信息交互。其中,基站11可以为部署于各待预测交通枢纽以及各待预测区域的相应基站,各待预测交通枢纽可以为火车站、高铁站、汽车站、码头、机场等一系列交通枢纽,各待预测区域可以为景区、大型体育场馆等活动场地等区域。终端设备12为在各待预测交通枢纽以及各待预测区域出现的旅客、游客等用户持有的通信终端设备,该通信终端设备通过使用配置基站11的运营商所提供的通信网络以为各用户提供相应通信服务。电子设备13为执行本申请实施例提供的客流预测方法的客流预测装置所对应的设备,电子设备13可以部署于需要获取客流预测信息的相关机构或部门。电子设备13中配置的处理器通过执行相应计算机程序能够实现本申请实施例提供的客流预测方法,以为需要获取客流预测信息的相关机构或部门获得所需的客流预测结果。
其中,基站11所提供的通信网络可以为4G或者5G网络。终端设备12可以为各用户持有的智能手机、智能手表以及其他支持通信服务的智能穿戴设备等,图1中的终端设备12以智能手机为例示出。电子设备13可以为计算机、服务器或者服务器集群,图1中的电子设备13以服务器为例示出。
需要说明的是,上述应用场景仅仅是示意性的,本申请实施例提供的客流预测方法、装置、设备及存储介质包括但不仅限于上述应用场景。
图2为本申请实施例提供的一种客流预测方法的流程示意图。如图2所示,本实施例提供的客流预测方法,包括:
S101:在预设时间周期内,获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到样本数据集合。
选择一预设时间周期,例如三个月、四个月等,获取在这一预设时间周期内于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,其中,预设通信网络可以为任意运营商通信网络,各用户数据可以为使用预设通信网络的各用户的手机号码。各待预测交通枢纽以及各待预测区域即为需要进行客流预测的各交通枢纽以及各待预测区域,以浙江省杭州市为例,杭州东站、杭州站、萧山机场即可为各待预测交通枢纽,西湖景区、西溪国家湿地公园等即可作为各待预测区域。可以理解的是客流从各待预测交通枢纽流向至各待预测区域。在获取到各用户数据之后,对所所获取到的各用户数据进行相应加工预处理,以将加工预处理后得到的相应数据确定为对应的各样本数据,从而形成样本数据集合。
在一种可能的设计中,本步骤S101中获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据的可能实现方式如图3所示。图3为本申请实施例提供的另一种客流预测方法的流程示意图。如图3所示,本实施例包括:
S201:获取预设通信网络所属基站小区内的各交通枢纽,并按照各交通枢纽的名称信息对各交通枢纽进行归类,以根据归类后的各交通枢纽确定各待预测交通枢纽。
在获取各用户数据时,首选确定各待预测交通枢纽。具体地,例如首先可以获取预设通信网络所属的各基站小区内分布的具体地的各交通枢纽,然后基于各交通枢纽的名称信息所具有的先天特征,比如,交通枢纽一般以“××车站”或者“××汽车站”命名,因而可以根据各交通枢纽的名称信息对各交通枢纽进行归类,再将归类后的各交通枢纽或归类后的部分交通枢纽确定为各待预测交通枢纽。在实际工况中可以客流预测需求根据归类后的各交通枢纽确定各待预测交通枢纽。
S202:获取各第一预设时间点于各待预测交通枢纽使用预设通信网络的第一用户清单,并获取各第二预设时间点于各待预测区域使用预设通信网络的第二用户清单。
其中,各用户数据包括第一用户清单和第二用户清单。
在确定了各待预测交通枢纽之后,可以从预设通信网络所属运营商的网络管理中心获取在各预设第一时间点于各待预测交通枢纽使用预设通信网络的第一用户清单,第一用户清单可以为手机号码。其中,各第一预设时间点可以为预设时间周期内的每一天中指定时间点,指定时间点可以以小时为单位。每一天可以为预设时间周期内每周的每一天,假设预设时间周期为三个月,则每一天可以为三个月中每个月内每周的任意一天。例如,各第一预设时间点则可以为预设时间周期内每一天的早7点至晚19点中的各小时。
与获取第一用户清单相类似地,还可以获取各第二预设时间点于各待预测区域使用预设通信网络的第二用户清单,第二用户清单也即为手机号码。各第二预设时间点即为与各第一预设时间点具有预设延迟时长的相应时间。比如,当各第一预设时间点为预设时间周期内每一天的早7点至晚19点中的各小时,则各第二预设时间点可以为预设时间周期内与各第一预设时间点相同的这一天的早8点至晚21点中的各小时,或者这一天的早9点至晚21点中的各小时,对此,本实施例不作限定。
另外,需要进行客流预测的机构或者部门根据客流预测需求或者客流从各待预测交通所流向的各目的区域确定各待预测区域,通常各待预测区域可以为各景点或者各活动举办场地等,对此,本实施例不作限定。
本实施例提供的客流预测方法,在预设时间周期内,首先通过对预设通信网络所属基站小区内的各交通枢纽进行归类获得各待预测交通枢纽,然后获取预设时间周期内各第一预设时间点于各待预测交通枢纽使用预设通信网络的第一用户清单,以及获取预设时间周期内各第二预设时间点于各待预测区域使用预设通信网络的第二用户清单,以根据获取到的第一用户清单和第二用户清单得到各用户数据。基于各待预测交通枢纽以及各待预测区域使用预设通信网络的第一用户清单和第二用户清单得到各用户数据,在数据选择方面不同于现有技术中单一类型的客流监测数据,所选择的数据具备数据量大且局限性小等优点,能够达到对客流的融合分析,进而满足区域的综合预测需求。
进一步地,在一种可能的设计中,本步骤S101中根据各用户数据得到样本数据集合的可能实现方式如图4所示。图4为本申请实施例提供的再一种客流预测方法的流程示意图。如图4所示,本实施例包括:
S301:根据第一用户清单和第二用户清单确定第一原始数据。
其中,每个第一原始数据用于表征第一用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,第一用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发并到达或者经由各待预测区域的用户数量。
在得到第一用户清单和第二用户清单之后,基于第一用户清单和第二用户清单确定第一原始数据。
具体地,首先根据第一用户清单确定在各第一预设时间点从各待预测交通枢纽出发的用户总数量,其中,第一用户清单所对应的用户数量即为对应的各待预测交通枢纽出发的用户总数量。然后,根据第一清单和第二清单确定在各第一预设时间点从各待预测交通枢纽出发且到达或者经由各待预测区域的用户数量,将该用户数量定义为第一用户数量。再确定第一用户数量占用户总数量的百分比,以将该百分比确定为各第一预设时间点对应的第一原始数据。
另外,为了保证所获取到的各第一原始数据的准确度,还可以针对每一天中的各第一预设时间点所对应的各第一原始数据,通过获取该组第一原始数据的中位方差,以剔除该组第一原始数据中与中位方差之间的差值的绝对值最大的两个数据,将剔除后的得到的第一原始数据确定为根据第一用户清单和第二用户清单确定的每一天中的各第一预设时间点所对应的各第一原始数据。
S302:根据预设时间周期内的各第一预设时间点以及对应的各第一原始数据和各第二原始数据生成各原始数据集合。
其中,每个第二原始数据用于表征第二用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,第二用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发未到达或者未经由各待预测区域的用户数量。
进一步地,在实际工况中,针对预设时间周期内的每一天所对应的各第一预设时间点,可能存在从各待预测交通枢纽出发但却未到达或者未经过对应的各待预测区域的客流,因而,为了确保最终所确定的各样本数据的完整度,需要将在各第一预设时间点从各待预测交通枢纽出发但却未到达或者未经由各待预测区域的用户数量占在各第一预设时间点从各待预测交通枢纽出发的用户总数量的百分比设置为0,即将每个第二原始数据设置为0。进而,根据各每个第一预设时间点以及每个第一预设时间点所对应的各第一原始数据和各第二原始数据形成一原始数据集合,从而生成预设时间周期内的各第一预设时间点所对应的各原始数据集合。
S303:根据各原始数据集合以及获取各用户数据时的随机特征数据得到对应的样本数据集合。
其中,随机特征数据包括数值化的天气特征数据、突发事件数据以及特征时间数据中的至少一种。
在生成各原始数据集合之后,进一步结合获取各用户数据时的随机特征数据,以形成客流预测阶段所需的各样本数据,各样本数据形成的集合即为样本数据集合。其中,随机特征数据包括数值或后的天气特征数据、突发事件数据以及特征事件数据中的至少一种。天气特征数据用于表明获取各用户数据时的天气情况,突发事件数据用于表征获取各用户数据时的是否有突发事件发生,特征时间数据用于表征获取各用户数据的当前时间是否为节假日(除周末)。本实施例中对于天气情况、突发事件所对应的具体内容以及节假日为哪一具体的节假日不作限定。另外,对于天气情况如何、是否有突发事件以及是否为节假日可以通过“0”和“1”进行数值化处理,例如,天气情况好采用“1”表示,天气情况差采用“0”表示,有突发时间事件采用“1”表示,无突发事件采用“0”表示,为节假日采用“1”表示,不为节假日采用“0”表示。本实施例对于实际工况中对于获取随机特征数据的数值化过程不作限定。
通过上述实施例的描述可知,在获取到第一用户清单和第二用户清单之后,首先确定各第一预设时间中从各待预测交通枢纽出发的用户总数量,然后确定在各第一预设时间从各待预测交通枢纽出发且到达或经由各待预测区域的用户数量,即第一用户数量,以及确定在各第一预设时间从各待预测交通枢纽出发却未到达或者未经过各待预测区域的用户数量,即第二用户数量,再得到第一用户数量占用户总数量的百分比,将该百分比定义为对应的第一原始数据,以及将第二用户数量设置为0并定义为第二原始数据。从而根据预设时间周期内的各第一预设时间点以及各第一预设时间点所对应的各第一原始数据和第二原始数据首先生成各原始数据集合,进而再根据各原始数据集合以及获取各用户数据时的随机特征数据得到对应的样本数据集合,以对该样本数据集合中的各样本数据进行预测阶段的相应处理,得到预测客流。
在一种可能的设计中,步骤S302可能的实现方式为:
首先将各第一预设时间点按照预设数值化算法进行数值化,然后根据预设时间周期内数值化后的各第一预设时间点与对应的各第一原始数据和各第二原始数据生成各原始数据,以将各原始数据形成的集合确定为原始数据集合。
例如,将各第一预设时间点按照预设数值化算法进行数值化中的预设数值化算法符合如下表1和表2所示的转换规则。其中,对于各第一预设时间点中的每一天即周几可以按照表1所示的转换规则进行数值化,对于各第一预设时间点中的具体时间点可以按照表2所示的转换规则进行数值化。
表1
时间点 数值化后的时间点
周一 0000001
周二 0000010
周三 0000100
周四 0001000
周五 0010000
周六 0100000
周日 1000000
表1仅为示意性列举的一种用于将各第一预设时间点中的每一天进行数值化所采用的预设数值化算法,但并不表示将预设数值化算法限定于此,在实际工况中,可以根据实际情况设置相应的预设数值化算法,对此,本实施例不作限定。
表2
表2中以早7点至晚19点为例示意性列举的一种用于将各第一预设时间点中的具体时间点进行数值化所采用的预设数值化算法,但并不表示将预设数值化算法限定于此,在实际工况中,可以根据实际情况设置相应的预设数值化算法,对此,本实施例不作限定。
在将各第一预设时间点按照预设数值化算法进行数值化后,根据预设时间周期内数值化后的各第一预设时间点以及各第一预设时间点所对应的各第一原始数据和各第二原始数据形成各原始数据。其中,假设预设时间周期为三个月,各第一预设时间点则为这三个月内的每个周一至周日中早7点至晚19点中的每个小时,则预设时间周期内存在10至13组由第一原始数据和第二原始数据组成的一系列数据,假设以S表示该系列数据,即S包含有10至13组{X1、X2、X3、X4}数据,其中,X1表示数值化后的周几,X2表示数值化后的时间点,X3表示X1和X2对应的时间点中的从待预测交通枢纽出发的用户数量,X4表示在X1和X2对应的时间点对应的第一原始数据对应的数值在该系列总的第一原始数据中的平均值,从而将每组{X1、X2、X3、X4}确定为X1和X2这一第一预设时间点对应的原始数据,以将预设时间周期内的各原始数据看作一集合,则将该集合确定为原始数据集合。
其中,可以理解的是上述平均值为每组数据中的第一原始数据在该10至13组数据中的平均值。
S102:根据样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,以通过残差分量数据对预设学习网络模型进行训练得到训练结果。
其中,趋势项数据用于表征客流的规律特征对客流的影响,残差分量数据用于表征客流的随机特征对客流的影响。
通过上述实施例的描述可知,样本数据集合中的各样本数据包括有对应的原数据集合中的各数据以及随机特征数据,因而,若将各样本数据与样本数据所对应的客流量之间的关系通过一函数表示,则该函数可以如下所示的公式(1)表示:
Y=θ1F(X1)+θ2G(X2)+θ3H(X3)+θ4I(X4)+R (1)
其中,Y表示客流量,F、G、H和I分别表示上述实施例中的X1、X2、X3、X4各自与客流量之间的映射函数,R则表示随机特征数据与客流量之间的映射函数,θ1、θ2、θ3和θ4分别为F、G、H和I各映射函数的对应参数。
而对于预设傅里叶变换而言,由于经过预设傅里叶变换后的频谱分布在不同的频段,即在低频和高频分别分布着不同信号的信息。因此,利用预设傅里叶变换的这一特点,可以将上述如公式(1)所表示的客流量进行分离,即可以将客流量进行分离以如下所示的公式(2)表示:
Xt=At+Et (2)
其中,Xt表示t时刻从一待预测交通枢纽至一待预测区域的客流量,At表示该客流量的趋势项数据,Et表示该客流量的残差分量数据。再结合公式(1)以及预设傅里叶变换后所具备的特征,则可以理解的是,At所表示的客流量的趋势项数据为在高频处分布的相应信号,这一信号表现为规律特征,换言之,At所表示的客流量的趋势项数据为公式(1)中的F和G对于客流的影响,而Et所表示的客流量的残差分量数据为在低频处分布的相应信号,即为公式(1)中的H、I和R这种随机特征对于客流的影响。
通过上述的描述即可得知,根据样本数据集合中的各样本数据进行预设傅里叶变换可以将各样本数据所表示的客流量分离为对应的趋势项数据和残差分量数据,其中,趋势项数据用于表征客流的规律特征对于客流的影响,而残差分量数据用于表征客流的随机特征对于客流的影响。因此,通过分离后得到的趋势项数据由于为客流的规律特征对客流的影响,因而可以作为表征规律特征所对应的预测客流使用。而残差分量数据则需进一步使用预设学习网络模型进行学习,以获取客流的随机特征与预测客流之间的关系。故而,在得到趋势项数据和残差分量数据之后,还通过残差分量数据对预设学习网络模型进行训练以得到训练结果,将该训练结果作为后续预设预测模型的输入量以得到客流的随机特征的预测客流。
其中,预设学习网络模型可以为深度置信网络模型(Deep Belief Network,DBN),该网络模型可以独立学习客流的随机特征对客流的影响,以有效提高预测效率。
S103:根据训练结果以及预设预测模型生成随机客流预测结果,并根据趋势项数据和随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流。
通过步骤S102的描述可知,根据各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据后,其中的趋势项数据由于是表征客流的规律特征对于客流的影响,因而可将其作为表征规律特征所对应的预测客流,而残差分量数据是客流的随机特征对于客流的影响,因而需通过残差分量数据对预设学习网络模型进行训练以得到训练结果,该训练结果即为预设学习网络模型针对客流的随机特征对于客流的影响进行学习后得到的对应学习结果。将该学习结果,即训练结果,作为预设预测模型的输入量进行预测,则得到的预测结果即为客流的随机特征所对应的预测结果,将其定义为随机客流预测结果。之后,再结合之前已得到的趋势项数据所对应的客流值以及该随机客流预测结果所对应的客流值得到对应的各待预测交通枢纽至对应的各待预测区域的预测客流,完成对各待预测交通枢纽至对应的各待预测区域的客流预测过程。
在一种可能的设计中,本步骤S103中根据趋势项数据和随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流的可能实现方式如图5所示。图5为本申请实施例提供的又一种客流预测方法的流程示意图。如图5所示,本实施例包括:
S401:将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的所趋势项数据中用于表征客流的数据确定为规律客流值。
其中,规律客流值为趋势项数据对应的客流值。
根据通过预设傅里叶变换得到的趋势项数据,将各第一预设时间点所对应的各待预测交通枢纽至对应的各待预测区域的趋势项数据中用于表征客流的数据确定为规律客流值,该规律客流值为趋势项数据所对应的客流值,也即规律特征所对应的客流值。
S402:将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的随机客流预测结果对应的客流值确定为随机客流值。
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的训练结果作为预设预测模型的输入量,以得到输出量,该输出量即为各第一预设时间点对应的各待预测交通枢纽对应的各待预测区域的随机客流预测结果,将随机客流预测结果所对应的客流值确定为随机客流值,换言之,该随机客流值为针对客流的随机特征得到的预测客流。
S403:将规律客流值和随机客流值进行加和运算,以将加和运算的结果确定为各第一预设时间点从各待预测交通枢纽至对应的各待预测区域的预测客流。
将上述得到的规律客流值与随机客流值相加,即进行加和运算,以将相加得到的和,即加和运算结果,确定为对应的各第一预设时间点从各待预测交通枢纽至对应的各待预测区域的预测客流。
本申请实施例提供的客流预测方法通过获取在各待预测交通枢纽和各待预测区域使用预设通信网络的各用户数据得到样本数据集合中的各样本数据,使得进行客流预测的样本数据不但具备数据量较大且局限性较小的特点,并能够达到对客流的融合分析。并对各样本数据分别利用预设傅里叶变换以及预设学习网络模型的相应处理,可以充分考量非连续的随机特征与预测结果之间的内在关联,有效提升客流预测精度,进而不但满足综合预测需求还使得预测结果具备高精度以及高可靠性。
图6为本申请实施例提供的又一种客流预测方法的流程示意图。如图6所示,本实施例包括:
S501:在预设时间周期内,获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到样本数据集合。
本步骤501的实现方式、原理及技术效果与步骤S101的实现方式、原理及技术效果相类似,具体内容可参考前述详细步骤,在此不再赘述。
S502:对样本数据集合中的各样本数据进行预设傅里叶变换,并结合预设频谱阈值以及变换结果进行预设傅里叶变换对应的傅里叶逆变换,以得到逆变换结果。
通过图2所示实施例中对于预设傅里叶变换的描述可知,对样本数据集合中的各样本数据进行预设傅里叶变化可以得到趋势项数据和残差分量数据。具体地,首先对样本数据集合中的各样本数据进行如下公式(3)所示的预设傅里叶变换,得到变换结果:
Yω=F(Xt) (3)
其中,F则表示对各样本数据进行预设傅里叶变换,Yω表示预设傅里叶变换后得到的变换结果,Xt表示t时刻的样本数据,t的取值为各第一预设时间点。
在得到预设傅里叶变换后的变换结果之后,结合预设频谱阈值以及该变换结果进行预设傅里叶变换对应的傅里叶逆变换,得到逆变换结果。具体地,结合前述实施例中对于公式(2)的描述可知,通过公式(3)得到的变换结果中包括有高频和低频处的相应信号,因而,可以设置预设频谱阈值,以利用预设频谱阈值对低频处分布的相应信号进行过滤,得到高频处分布的相应信号。例如,针对变换结果,将小于预设频谱阈值的相应数据均设置为0,以滤除低频处分布的相应信号,假设对变换结果Yω通过预设频谱阈值进行滤除后得到的结果以Y′ω表示,则进一步对该滤除结果进行预设傅里叶变换对应的傅里叶逆变换,得到逆变换结果,如下公式(4)所示:
At=F-1(Y′ω) (4)
其中At表示逆变换结果,该逆变换结果用于对高频处分布的信号进行反推而得到,用于表征客流的规律特征对于客流影响的相应数据。
S503:将逆变换结果确定为趋势项数据,并根据趋势项数据以及各样本数据得到残差分量数据。
得到的逆变换结果用于表客流的规律特征对客流影响的相应数据,结合之前公式(2)的描述,则将该逆变换结果确定为趋势项数据。并进一步地,在公式(2)的基础上,则利用所得到的趋势项数据与各样本数据之间满足公式(2)所示关系的基础上则可以得到残差分量数据,从而实现各样本数据的趋势项数据和残差分量数据的分离。
S504:将残差分量数据作为底层训练样本,以将底层训练样本确定为预设学习网络模型的输入量对预设学习网络模型进行逐层训练,得到对应的输出量。
在得到残差分量数据之后,需利用残差分量数据对预设学习网络模型进行训练。通过上述公式(1)和公式(2)的描述可知,残差分量数据用于表征客流的随机特征对客流的影响,例如天气、突发时间以及特征时间等等。为了确保客流的随机特征的独立性,本申请实施例采用了例如DBN的预设学习网络模型以将残差分量数据作为输入量进行逐层训练。从而可以根据不同输入量的似然概率分布,得到良好的拟合效果。
具体地,将残差分量数据作为底层训练样本,将底层训练样本确定为该DBN的输入量以对其进行逐层训练,得到对应的输出量。换言之,将DBN中底层的受限玻尔兹曼机(Boltzmann Machine,RBM)隐层的输出作为高层的RBM的输入,通过自底而上的逐层特征提取,以保证每一层的训练后得到的输出量都是输入量的非线性变换。
S505:将输出量中的顶层输出量确定为训练结果。
其中,训练结果用于表征预设学习网络模型对客流的随机特征进行学习后得到的对应结果。
在通过残差分量数据对预设学习网络模型进行逐层训练得到对应的输出量,其中,将输出量中预设学习网络模型的顶层输出量确定为最终的训练结果,该训练结果即为预设学习网络模型对客流的随机特征进行学习后得到的相应结果。
S506:将训练结果作为预设预测模型的输入量,以根据预设预测模型中的预设径向基核函数生成随机客流预测结果与客流的随机特征之间的非线性映射关系。
S507:根据非线性映射关系得到预设预测模型的输出量,以将输出量确定为随机客流预测结果对应的客流值。
在得到训练结果之后,将训练结果确定为预设预测模型的输入量,以获取对应的输出量,从而得到随机客流预测结果。
具体地,首先将训练结果确定为预设预测模型的输入量,以根据预设预测模型中的预设径向基核函数得到随机客流预测结果与客流的随机特征之间的非线性映射关系。其中,预设预测模型可以为任意的预测回归模型,例如支持向量回归机(Support VactorRegression,SVR)。SVR不同于传统的预测回归模型的是只要预测结果与输入的真实值之间的偏离程度符合预设范围,则均认为预测结果正确,从而使得所有的输入量距离超平面的总偏差最小。并且,在利用预设预测模型进行预测时,可以将预设预测模型的核函数设置为预设径向基核函数,通过该预设径向基核函数可以将低维空间的相应数据映射于高维空间以实现隐式变换,从而生成随机客流预测结果与客流的随机特征之间的非线性映射关系,完成针对客流的随机特征的非线性回归,并能有效控制过拟合。
在利用预设径向基核函数生成随机客流预测结果与客流的随机特征之间的非线性映射关系之后,则可以根据该非线性映射关系可以得到预设预测模型的输出量,完成利用残差分量数据的预测过程,得到随机客流预测结果,其中,预设预测模型的输出量即为该随机客流预测结果对应的客流值。从而通过训练结果以及预设预测模型生成随机客流预测结果。
S508:根据趋势项数据和随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流。
本步骤S508的具体实现方式、原理以及效果与前述实施例中的步骤S103相类似,具体过程可参考前述详细内容,在此不再赘述。
本申请实施例提供的客流预测方法,在利用预设通信网络获取到各用户数据并得到样本数据集合的各样本数据后,通过预设傅里叶变换所具备的特征根据各样本数据得到趋势项数据和残差分量数据,以将各样本数据实现趋势项数据和残差分量数据的分离,从而针对客流的规律特征得到相应预测客流,以及针对客流的随机特征对客流的影响,即残差分量数据,以将其作为预设学习网络模型的训练样本对该预设学习网络模型进行训练,以获取客流的随机特征与对应的预测客流之间的内在关联,从而再将训练结果作为预设预测模型的输入量以得到客流的随机特征对应的预测客流,即随机客流预测结果。最后根据随机客流预测结果和客流的规律特征对应的预测结果各自的客流值得到对应的各待预测交通枢纽至对应的各待预测区域的预测客流,有效提升客流预测精度,不但满足综合预测需求还可以获得高精度以及高可靠性的预测结果。
下述为本申请装置实施例,可以用于执行本申请对应的方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请对应的方法实施例。
图7为本申请实施例提供的一种客流预测装置的结构示意图。如图7所示,本实施例提供的客流预测装置600,包括:
获取模块601,用于在预设时间周期内,获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到样本数据集合。
第一处理模块602,用于根据样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,以通过残差分量数据对预设学习网络模型进行训练得到训练结果。
其中,趋势项数据用于表征客流的规律特征对客流的影响,残差分量数据用于表征客流的随机特征对客流的影响。
第二处理模块603,用于根据训练结果以及预设预测模型生成随机客流预测结果,并根据趋势项数据和随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流。
在一种可能的设计中,获取模块601,具体用于:
获取预设通信网络所属基站小区内的各交通枢纽,并按照各交通枢纽的名称信息对各交通枢纽进行归类,以根据归类后的各交通枢纽确定各待预测交通枢纽。
获取各第一预设时间点于各待预测交通枢纽使用预设通信网络的第一用户清单,并获取各第二预设时间点于各待预测区域使用预设通信网络的第二用户清单,各用户数据包括第一用户清单和第二用户清单。
在一种可能的设计中,获取模块601,还具体用于:
根据第一用户清单和第二用户清单确定第一原始数据。
其中,每个第一原始数据用于表征第一用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,第一用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发并到达或者经由各待预测区域的用户数量。
根据预设时间周期内的各第一预设时间点以及对应的各第一原始数据和各第二原始数据生成各原始数据集合。
其中,每个第二原始数据用于表征第二用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,第二用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发未到达或者未经由各待预测区域的用户数量。
根据各原始数据集合以及获取各用户数据时的随机特征数据得到对应的样本数据集合。
其中,随机特征数据包括数值化的天气特征数据、突发事件数据以及特征时间数据中的至少一种。
在一种可能的设计中,获取模块601,还具体用于:
将各第一预设时间点按照预设数值化算法进行数值化,以将预设时间周期内数值化后的各第一预设时间点与对应的各第一原始数据和各第二原始数据形成的各原始数据确定为原始数据集合。
在一种可能的设计中,第一处理模块602,具体用于:
对样本数据集合中的各样本数据进行预设傅里叶变换,并结合预设频谱阈值以及变换结果进行预设傅里叶变换对应的傅里叶逆变换,以得到逆变换结果。
将逆变换结果确定为趋势项数据,并根据趋势项数据以及各样本数据得到残差分量数据。
在一种可能的设计中,第一处理模块602,还具体用于:
将残差分量数据作为底层训练样本,以将底层训练样本确定为预设学习网络模型的输入量对预设学习网络模型进行逐层训练,得到对应的输出量。
将输出量中的顶层输出量确定为训练结果。
其中,训练结果用于表征预设学习网络模型对客流的随机特征进行学习后得到的对应结果。
在一种可能的设计中,第二处理模块603,具体用于:
将训练结果作为预设预测模型的输入量,以根据预设预测模型中的预设径向基核函数生成随机客流预测结果与客流的随机特征之间的非线性映射关系。
根据非线性映射关系得到预设预测模型的输出量,以将输出量确定为随机客流预测结果对应的客流值。
在一种可能的设计中,第二处理模块603,还具体用于:
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的趋势项数据中用于表征客流的数据确定为规律客流值。
其中,规律客流值为趋势项数据对应的客流值。
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的随机客流预测结果对应的客流值确定为随机客流值。
将规律客流值和随机客流值进行加和运算,以将加和运算的结果确定为各第一预设时间点从各待预测交通枢纽至对应的各待预测区域的预测客流。
在一种可能的设计中,预设学习网络模型为深度置信网络模型。预设预测模型为支持向量回归机。
值得说明的,上述图7及可选的实施例提供的客流预测装置,可用于执行上述任一实施例提供的客流预测方法的相应步骤,具体实现方式和技术效果类似,这里不再赘述。
本申请所提供的上述各装置实施例仅仅是示意性的,其中的模块划分仅仅是一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个模块可以结合或者可以集成到另一个系统。各个模块相互之间的耦合可以是通过一些接口实现,这些接口通常是电性通信接口,但是也不排除可能是机械接口或其它的形式接口。因此,作为分离部件说明的模块可以是或者也可以不是物理上分开的,既可以位于一个地方,也可以分布到同一个或不同设备的不同位置上。
图8为本申请提供的一种电子设备的结构示意图。如图8所示,该电子设备700可以包括:至少一个处理器701和存储器702。图8示出的是以一个处理器为例的电子设备。
存储器702,用于存放处理器701的计算机程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器702可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器701配置为用于执行存储器702存储的计算机程序,以实现以上各方法实施例中客流预测方法的各步骤。
其中,处理器701可能是一个中央处理器(central processing unit,简称为CPU),或者是特定集成电路(application specific integrated circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选地,存储器702既可以是独立的,也可以跟处理器701集成在一起。当存储器702是独立于处理器701之外的器件时,电子设备700,还可以包括:
总线703,用于连接处理器701以及存储器702。总线可以是工业标准体系结构(industry standard architecture,简称为ISA)总线、外部设备互连(peripheralcomponent,PCI)总线或扩展工业标准体系结构(extended industry standardarchitecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器702和处理器701集成在一块芯片上实现,则存储器702和处理器701可以通过内部接口完成通信。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random accessmemory,RAM)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有计算机程序,当电子设备的至少一个处理器执行该计算机程序时,电子设备执行上述的各种实施方式提供的客流预测方法的各个步骤。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在可读存储介质中。电子设备的至少一个处理器可以从可读存储介质读取该计算机程序,至少一个处理器执行该计算机程序使得电子设备实施上述的各种实施方式提供的客流预测方法的各个步骤。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (11)

1.一种客流预测方法,其特征在于,包括:
在预设时间周期内,获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到样本数据集合;
根据所述样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,以通过所述残差分量数据对预设学习网络模型进行训练得到训练结果,所述趋势项数据用于表征客流的规律特征对客流的影响,所述残差分量数据用于表征客流的随机特征对所述客流的影响;
根据训练结果以及预设预测模型生成随机客流预测结果,并根据所述趋势项数据和所述随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流;
所述根据各用户数据得到样本数据集合,包括:
根据第一用户清单和第二用户清单确定第一原始数据,每个第一原始数据用于表征第一用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,所述第一用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发并到达或者经由各待预测区域的用户数量,其中,所述第一用户清单包括各第一预设时间点于各待预测交通枢纽使用所述预设通信网络的用户,所述第二用户清单包括各第二预设时间点于各待预测区域使用所述预设通信网络的用户,所述第二预设时间点为与所述第一预设时间点具有预设延迟时长的相应时间;
根据所述预设时间周期内的各第一预设时间点以及对应的各第一原始数据和各第二原始数据生成各原始数据集合,每个第二原始数据用于表征第二用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,所述第二用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发未到达或者未经由各待预测区域的用户数量;
根据各原始数据集合以及获取各用户数据时的随机特征数据得到对应的样本数据集合,所述随机特征数据包括数值化的天气特征数据、突发事件数据以及特征时间数据中的至少一种。
2.根据权利要求1所述的客流预测方法,其特征在于,所述获取于待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,包括:
获取所述预设通信网络所属基站小区内的各交通枢纽,并按照各交通枢纽的名称信息对各交通枢纽进行归类,以根据归类后的各交通枢纽确定各待预测交通枢纽;
获取各第一预设时间点于各待预测交通枢纽使用所述预设通信网络的第一用户清单,并获取各第二预设时间点于各待预测区域使用所述预设通信网络的第二用户清单,各用户数据包括所述第一用户清单和所述第二用户清单。
3.根据权利要求2所述的客流预测方法,其特征在于,所述根据所述预设时间周期内的各第一预设时间点以及对应的各第一原始数据和各第二原始数据生成各原始数据集合,包括:
将各第一预设时间点按照预设数值化算法进行数值化,以将所述预设时间周期内数值化后的各第一预设时间点与对应的各第一原始数据和各第二原始数据形成的各原始数据确定为所述原始数据集合。
4.根据权利要求1-3任一项所述的客流预测方法,其特征在于,所述根据所述样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,包括:
对所述样本数据集合中的各样本数据进行所述预设傅里叶变换,并结合预设频谱阈值以及变换结果进行所述预设傅里叶变换对应的傅里叶逆变换,以得到逆变换结果;
将所述逆变换结果确定为所述趋势项数据,并根据所述趋势项数据以及各样本数据得到所述残差分量数据。
5.根据权利要求4所述的客流预测方法,其特征在于,所述通过所述残差分量数据对预设学习网络模型进行训练得到训练结果,包括:
将所述残差分量数据作为底层训练样本,以将所述底层训练样本确定为所述预设学习网络模型的输入量对所述预设学习网络模型进行逐层训练,得到对应的输出量;
将所述输出量中的顶层输出量确定为所述训练结果,所述训练结果用于表征所述预设学习网络模型对所述客流的随机特征进行学习后得到的对应结果。
6.根据权利要求5所述的客流预测方法,其特征在于,所述根据训练结果以及预设预测模型生成随机客流预测结果,包括:
将所述训练结果作为所述预设预测模型的输入量,以根据所述预设预测模型中的预设径向基核函数生成所述随机客流预测结果与所述客流的随机特征之间的非线性映射关系;
根据所述非线性映射关系得到所述预设预测模型的输出量,以将所述输出量确定为所述随机客流预测结果对应的客流值。
7.根据权利要求6所述的客流预测方法,其特征在于,所述根据所述趋势项数据和所述随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流,包括:
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的所述趋势项数据中用于表征客流的数据确定为规律客流值,所述规律客流值为所述趋势项数据对应的所述客流值;
将各第一预设时间点对应的各待预测交通枢纽至对应的各待预测区域的所述随机客流预测结果对应的所述客流值确定为随机客流值;
将所述规律客流值和所述随机客流值进行加和运算,以将所述加和运算的结果确定为各第一预设时间点从各待预测交通枢纽至对应的各待预测区域的所述预测客流。
8.根据权利要求1所述的客流预测方法,其特征在于,所述预设学习网络模型为深度置信网络模型;所述预设预测模型为支持向量回归机。
9.一种客流预测装置,其特征在于,包括:
获取模块,用于在预设时间周期内,获取于各待预测交通枢纽以及各待预测区域使用预设通信网络的各用户数据,并根据各用户数据得到样本数据集合;
第一处理模块,用于根据所述样本数据集合中的各样本数据进行预设傅里叶变换得到趋势项数据和残差分量数据,以通过所述残差分量数据对预设学习网络模型进行训练得到训练结果,所述趋势项数据用于表征客流的规律特征对客流的影响,所述残差分量数据用于表征客流的随机特征对所述客流的影响;
第二处理模块,用于根据训练结果以及预设预测模型生成随机客流预测结果,并根据所述趋势项数据和所述随机客流预测结果各自对应的客流值得到各待预测交通枢纽至对应的各待预测区域的预测客流;
所述获取模块具体用于:
根据第一用户清单和第二用户清单确定第一原始数据,每个第一原始数据用于表征第一用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,所述第一用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发并到达或者经由各待预测区域的用户数量,其中,所述第一用户清单包括各第一预设时间点于各待预测交通枢纽使用所述预设通信网络的用户,所述第二用户清单包括各第二预设时间点于各待预测区域使用所述预设通信网络的用户,所述第二预设时间点为与所述第一预设时间点具有预设延迟时长的相应时间;
根据所述预设时间周期内的各第一预设时间点以及对应的各第一原始数据和各第二原始数据生成各原始数据集合,每个第二原始数据用于表征第二用户数量与从各待预测交通枢纽出发的用户总数量之间的百分比,所述第二用户数量用于表征在各第一预设时间点从各待预测交通枢纽出发未到达或者未经由各待预测区域的用户数量;
根据各原始数据集合以及获取各用户数据时的随机特征数据得到对应的样本数据集合,所述随机特征数据包括数值化的天气特征数据、突发事件数据以及特征时间数据中的至少一种。
10.一种电子设备,其特征在于,包括:
处理器;以及,
存储器,用于存储所述处理器的计算机程序;
其中,所述处理器配置为经由执行所述计算机程序来执行权利要求1至8任一项所述的客流预测方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的客流预测方法。
CN202110590599.9A 2021-05-28 2021-05-28 客流预测方法、装置、设备及存储介质 Active CN113283508B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110590599.9A CN113283508B (zh) 2021-05-28 2021-05-28 客流预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110590599.9A CN113283508B (zh) 2021-05-28 2021-05-28 客流预测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113283508A CN113283508A (zh) 2021-08-20
CN113283508B true CN113283508B (zh) 2023-11-10

Family

ID=77282305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110590599.9A Active CN113283508B (zh) 2021-05-28 2021-05-28 客流预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113283508B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512772A (zh) * 2015-12-22 2016-04-20 重庆邮电大学 一种基于移动网络信令数据的动态人流量预警方法
WO2018032938A1 (zh) * 2016-08-19 2018-02-22 深圳奇迹智慧网络有限公司 基于探针的人流预警分析方法和系统
CN109034506A (zh) * 2018-09-18 2018-12-18 中铁第五勘察设计院集团有限公司 一种综合客运枢纽联运交通客流量预测方法
WO2019028852A1 (zh) * 2017-08-11 2019-02-14 深圳前海达闼云端智能科技有限公司 一种安检物品的检测方法、装置及电子设备
CN109492788A (zh) * 2017-09-13 2019-03-19 中移(杭州)信息技术有限公司 预测人流量以及建立人流量预测模型的方法及相关设备
CN110020980A (zh) * 2019-04-08 2019-07-16 江苏号百信息服务有限公司 基于手机信令数据的机场到发旅客识别与客情分析方法
CN111882098A (zh) * 2020-04-03 2020-11-03 广州市交通规划研究院 一种基于整体协同的铁路站点客流及接驳方式预测方法
CN112488419A (zh) * 2020-12-15 2021-03-12 平安国际智慧城市科技股份有限公司 基于od分析的客流分布预测方法、装置、设备及存储介质
CN112732778A (zh) * 2020-12-28 2021-04-30 江苏欣网视讯软件技术有限公司 基于手机信令的交通枢纽客流流向识别方法、计算机系统、服务器与存储介质
CN112770278A (zh) * 2020-12-22 2021-05-07 智慧足迹数据科技有限公司 手机信令分析方法、装置、计算机设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512772A (zh) * 2015-12-22 2016-04-20 重庆邮电大学 一种基于移动网络信令数据的动态人流量预警方法
WO2018032938A1 (zh) * 2016-08-19 2018-02-22 深圳奇迹智慧网络有限公司 基于探针的人流预警分析方法和系统
WO2019028852A1 (zh) * 2017-08-11 2019-02-14 深圳前海达闼云端智能科技有限公司 一种安检物品的检测方法、装置及电子设备
CN109492788A (zh) * 2017-09-13 2019-03-19 中移(杭州)信息技术有限公司 预测人流量以及建立人流量预测模型的方法及相关设备
CN109034506A (zh) * 2018-09-18 2018-12-18 中铁第五勘察设计院集团有限公司 一种综合客运枢纽联运交通客流量预测方法
CN110020980A (zh) * 2019-04-08 2019-07-16 江苏号百信息服务有限公司 基于手机信令数据的机场到发旅客识别与客情分析方法
CN111882098A (zh) * 2020-04-03 2020-11-03 广州市交通规划研究院 一种基于整体协同的铁路站点客流及接驳方式预测方法
CN112488419A (zh) * 2020-12-15 2021-03-12 平安国际智慧城市科技股份有限公司 基于od分析的客流分布预测方法、装置、设备及存储介质
CN112770278A (zh) * 2020-12-22 2021-05-07 智慧足迹数据科技有限公司 手机信令分析方法、装置、计算机设备及存储介质
CN112732778A (zh) * 2020-12-28 2021-04-30 江苏欣网视讯软件技术有限公司 基于手机信令的交通枢纽客流流向识别方法、计算机系统、服务器与存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Foresting Tourism Demand with Decomposed Search Cycles;Xin Li 等;《Journal of Travel Research》;52-68 *
基于深度学习的路网短时交通流预测;焦琴琴;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;第C034-1433页正文第4.2.2节、第4.3节 *
面向手机信令数据的交通枢纽人流量短时预测算法;林培群;雷永巍;张孜;陈丽甜;;《哈尔滨工业大学学报》;第50卷(第09期);89-95 *

Also Published As

Publication number Publication date
CN113283508A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN109872535B (zh) 一种智慧交通通行预测方法、装置及服务器
US10977585B2 (en) Order allocation system and method
CN109657844B (zh) 电力短期负荷预测方法和装置
US20180357892A1 (en) Uncertainty modeling in traffic demand prediction
CN111442778A (zh) 出行方案推荐方法、装置、设备及计算机可读存储介质
US20230215272A1 (en) Information processing method and apparatus, computer device and storage medium
CN104657457B (zh) 一种用户评价视频的数据处理方法、视频推荐方法及装置
JP6688149B2 (ja) タクシー需要推定システム
CN114912717B (zh) 基于物联网的智慧城市保障住房申请风险评估方法和系统
CN111881243A (zh) 一种出租车轨迹热点区域分析方法及系统
CN113411453A (zh) 一种外呼对象的智能管理方法及装置、介质、计算设备
Schlenther et al. Addressing spatial service provision equity for pooled ride‐hailing services through rebalancing
Karbassi Yazdi et al. A binary differential evolution algorithm for airline revenue management: a case study
Shariat Torbaghan et al. Investigating the impact of unanticipated market and construction delays on the development of a meshed HVDC grid using dynamic transmission planning
CN113065701B (zh) 一种轨道交通客流量智能预测方法和装置
CN113283508B (zh) 客流预测方法、装置、设备及存储介质
CN109618281A (zh) 一种高铁小区的识别方法及装置
Hosseini et al. Towards Understanding the Benefits and Challenges of Demand Responsive Public Transit-A Case Study in the City of Charlotte, NC
CN108133291B (zh) 一种社会事件与客运交通需求之间的相关性分析方法
CN107295105A (zh) 儿童行为的分析方法及终端设备、计算机可读存储介质
WO2023020425A1 (zh) 一种流量区间预测评估方法、装置和存储介质
CN111429237A (zh) 订单价格的确定方法、装置、服务器及存储介质
CN111738582B (zh) 基于群落化的银行网点任务动态分配方法、装置和设备
CN111833088B (zh) 一种供需预测方法及装置
CN113822464A (zh) 用户信息的处理方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant