客流数据确定方法、装置、计算机设备和存储介质
技术领域
本发明实施例涉及智能交通技术领域,尤其是涉及一种客流数据确定方法、装置、计算机设备和存储介质。
背景技术
地铁作为人们一种重要的交通出行方式,随着科学技术的快速发展,带来了巨大的便利。因此,地铁的客流量也是人们关心的重点,目前,通常使用机器学习模型来预测客流量,然而,对于一些突发情况,如演唱会、节假日、高温等,造成当时的客流量增多,而目前的通过机器学习模型预测客流量的方式无法针对这些突发情况进行预测,造成客流量预测准确率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高客流量预测准确率的客流数据确定方法、装置、计算机设备和存储介质。
第一方面,提供一种客流数据确定方法,该方法包括:
获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种;
将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量;
根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子;
根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。
在其中一个实施例中,客流量预测模型包括客流量预测算法和客流量预测子模型,将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量,包括:从关联数据中获取时间参数和属性参数对应的子关联数据;根据子关联数据获取匹配的预设客流量预测算法,利用预设客流量预测算法计算得到子关联数据对应的第一子客流量;将影响客流量预测因素对应的关联数据和预测站点标识输入至已训练好的客流量预测子模型中,得到预测站点标识对应的第二子客流量;将第一子客流量和第二子客流量输入至已训练好的客流量预测模型中,客流量预测模型通过全连接层输出中间客流量,对中间客流量进行张量连接得到预测站点标识对应的预测客流量。
在其中一个实施例中,客流量预测算法的生成步骤包括:获取影响客流量时间参数和属性参数对应的历史客流量数据,根据历史客流量数据制定对应的客流量预测算法,不同时间参数对应的关联数据对应不同的客流量预测算法,不同属性参数对应的关联数据对应不同的客流量预测算法。
在其中一个实施例中,客流量预测子模型的训练步骤包括:构建至少一个训练数据特征,训练数据特征为历史客流量数据特征、周期性客流量数据特征、月份特征、星期特征、小时特征、假期特征、平均气温特征、绝对温差特征中的至少一个;将至少一个训练数据特征输入至初始客流量预测子模型中,计算得到至少一个训练数据特征对应的初始权重系数,将初始权重系数作为初始客流量预测子模型的模型参数,得到中间客流量预测子模型;获取训练关联数据,训练关联数据包括对应的目标预测客流量数据;将训练关联数据输入至中间客流量预测子模型,得到对应的预测客流量数据;根据目标预测客流量数据和预测客流量数据计算得到训练损失值,根据训练损失值对中间客流量预测子模型的模型参数进行调整,直至满足收敛条件,得到已训练好的客流量预测子模型。
在其中一个实施例中,预设条件用于判断关联数据是否是特殊关联数据,特殊关联数据为假期关联数据、突发状况关联数据中的至少一种。
在其中一个实施例中,已训练的客流量影响因子的生成步骤包括:获取特殊关联数据对应的特殊客流量和普通关联数据对应的普通客流量;随机初始化特殊客流量对应的初始影响参数;获取预设偏移量,根据预设偏移量和初始影响参数计算得到更新影响参数;根据更新影响参数和普通客流量计算得到预测值,根据预测值和普通客流量计算得到误差;当误差满足收敛条件时,将更新影响参数作为客流量影响因子,否则,将更新影响参数作为初始影响参数,直至误差满足收敛条件得到客流量影响因子。
在其中一个实施例中,根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量,包括:将预测客流量和客流量影响因子相乘,得到预测站点标识对应的目标预测客流量。
第二方面,提供一种客流数据确定装置,该装置包括:
获取模块,用于获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种;
预测模块,用于将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量;
判断模块,用于根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子;
计算模块,用于根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。
第三方面,提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种;
将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量;
根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子;
根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种;
将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量;
根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子;
根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。
上述客流数据确定方法、装置、计算机设备和存储介质,通过客流量预测模型对至少一种影响客流量预测因素的关联数据进行预测,得到预测客流量,而在实际过程,需要考虑到预测过程中发生的特殊情况,因此结合已训练好的客流量影响因子对客流量预测模型输出的预测客流量进行修订,得到目标预测客流量,从而提高客流量预测的准确性。
附图说明
图1为一个实施例中客流数据确定方法的应用环境图;
图2为一个实施例中客流数据确定方法的流程示意图;
图3为一个实施例中预测客流量预测步骤的流程示意图;
图4为一个实施例中预测客流量预测算法对应的生成步骤示意图;
图5为一个实施例中客流量预测子模型的训练步骤的流程示意图;
图6为一个实施例中客流量影响因子的生成步骤的流程示意图;
图7为一个实施例中客流数据确定装置的结构框图;
图8为一个实施例中预测模块的结构框图;
图9为一个实施例中计算机设备的内部结构图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本申请提供的客流数据确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,终端102采集到影响客流量预测因素对应的关联数据,预测因素为时间参数、天气参数、属性参数中的至少一种,再将关联数据和预测站点标识发送至服务器104。服务器104将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量,根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子,根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。进一步地,服务器104将预测站点标识对应的目标预测客流量发送至终端102。
在一个实施例中,如图2所示,提供了一种客流数据确定方法,以该方法应用于图1中的终端102或服务器104为例进行说明,包括以下步骤:
步骤202,获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种。
其中,这里的关联数据是指影响客流量预测因素对应的相关数据,可以包括不同维度的数据。其中,预测因素为时间参数、天气参数、属性参数中的至少一种,影响客流量时间参数对应的关联数据可以是与时间维度相关的数据,如xx年xx月xx日等等,不同的时间阶段对应不同的时间等级,如将一年12个月中的每个月确定为一对应等级,即共有12个等级;必要时,可以采用更精确的分级方案,例如将一年划分为365个等级。而影响客流量天气参数对应的关联数据可以是与天气或者温度维度相关的数据,具体的,根据预设的不同天气情况设置对应的天气等级,具体的等级根据具体的天气参数确定,例如降水量、温度和湿度的单独或综合判断。
步骤204,将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量。
其中,这里的客流量预测模型是用来预测客流量的,是基于自然规律训练好的客流量预测模型,其并非根据人为设定,是根据大自然规律总结出的客观的模型算法,这里的客流量预测模型可以是单一的深度学习模型,或者包括多个子客流量预测模型的客流量预测模型。其中,深度学习模型的结构可以是一种神经网络模型,神经网络模型是有很多层(输入层、至少一层隐藏层、输出层)组成的,每层又是由多个神经元组成的,数据是由前往后进行传输计算的,其并不是一种统计模型,也不是用于执行统计和数学分析,是一种受自然规律约束的模型。
具体地,将采集到的至少一种影响客流量预测因素对应的关联数据和需要进行预测的站点标识同时输入至客流量预测模型中,可通过客流量预测模型对关联数据进行特征提取、以及对提取出的特征进行处理和计算,得到与预测站点标识对应的预测客流量。
在一个实施例中,例如关联数据为时间参数对应的关联数据:2020年2月2日,预测站点标识为站点a,则将2020年2月2日和预测站点标识输入至客流量预测模型中,客流量预测模型对输入数据进行特征提取、处理以及计算,可以输出2020年2月2日站点a的客流量为1000。
步骤206,根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子。
其中,因为客流量预测模型在对客流量进行预测时,通常都是依赖大量训练关联数据和对应的历史客流量进行训练的,但是因为在实际预测过程中,会出现一些突发情况或者特殊情况,如训练关联数据某天是工作日,而且天气是晴天(数据表征为降水量为0),但是待预测的当天突然出现酷热(数据表征为温度超过预设阈值)这种天气情况,因此客流量预测模型预测出来的客流量并不准确,为了考虑到与预测过程中的一些突发情况相结合,需要对客流量预测模型输出的客流量进行修订,从而得到实际的客流量。
在一个实施例中,预设条件用于判断关联数据是否是特殊关联数据,特殊关联数据为假期关联数据、突发状况关联数据中的至少一种。
其中,这里的预设条件用于判断关联数据是否是特殊关联数据,特殊关联数据为假期关联数据、突发状况关联数据中的至少一种。也就是说,需要根据采集到的关联数据进行检测,检测该关联数据是否是特殊关联数据,例如检测采集到的关联数据是否需要对客流量影响因子进行修正,例如假期属性、人流量波动属性(产生波动的原因可能是某明星的演唱会、重要比赛)等等。
其中,这里的客流量影响因子是针对特殊关联数据对应的预测客流量进行修订的权重系数,可以预先通过大量的特殊关联数据、正常关联数据以及对应的历史客流量进行训练得到的。
具体地,检测采集到的关联数据是否是特殊关联数据,当检测到关联数据是特殊关联数据后,获取已训练的客流量影响因子,可以根据客流量影响因子对客流量预测模型输出的预测客流量进行修订。
步骤208,根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。
具体地,在获取已训练好的客流量影响因子之后,根据客流量影响因子对预测客流量进行修订,将修订后的结果作为目标预测客流量。具体可以是根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量,其中,计算方式可自定义,自定义可以是将预测客流量和客流量影响因子进行相乘,将相乘得到的结果作为目标预测客流量,或者还可以是根据预测客流量和客流量影响因子进行加权计算,将加权计算得到的结果作为目标预测客流量等等。
在一个实施例中,根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量,包括:将预测客流量和客流量影响因子相乘,得到预测站点标识对应的目标预测客流量。
具体地,这里计算方式为将预测客流量和客流量影响因子进行相乘,将相乘得到的结果作为目标预测客流量。
例如,假设有两个地铁站,通过客流量预测模型预测出的预测客流量为[100,200]人次。使用已训练好的客流量影响因子是[1.85,1.12]。那么就使用这个调整权重与预测客流量对应相乘[100*1.85,200*1.12]得到目标预测客流量[185,224]。
上述客流数据确定方法中,通过客流量预测模型对至少一种影响客流量预测因素的关联数据进行预测,得到预测客流量,而在实际过程,需要考虑到预测过程中发生的特殊情况,因此结合已训练好的客流量影响因子对客流量预测模型输出的预测客流量进行修订,得到目标预测客流量,从而提高客流量预测的准确性。
在一个实施例中,如图3所示,客流量预测模型包括客流量预测算法和客流量预测子模型,将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量,包括:
步骤302,从关联数据中获取时间参数和属性参数对应的子关联数据。
步骤304,根据子关联数据获取匹配的预设客流量预测算法,利用预设客流量预测算法计算得到子关联数据对应的第一子客流量。
其中,这里的客流量预测模型包括客流量预测算法和客流量预测子模型,客流量预测算法不是一种模型,是通过规则预测对应的客流量,不同预测因素对应的子关联数据存在对应的客流量预测算法,即在时间参数中,子关联数据可以是待测日期,待测日期为工作日、周末、节假日都存在对应的不同的客流量预测算法,而各个客流量预测算法是通过大量历史相关客流量数据进行统计得到的。客流量预测算法的预测数据是待预测日期,获取关联数据中的待预测日期作为子关联数据,再确定待预测日期对应的类别,候选类别有工作日、周末、假期,工作日、周末、假期均与预设的时间等级相对应。进一步地,再根据待预测日期对应的类别获取对应的预测客流量预测算法。
其中,这里的子关联数据是指影响客流量时间参数对应的相关数据,和影响客流量属性参数对应的相关数据。也就是说,从获取到至少一种影响客流量预测因素的关联数据中,从关联数据中获取与时间维度相关的数据,如待预测日日期,如xx年xx月xx日等等。同时,从关联数据中获取与假期维度相关的数据,如国庆节对应的待预测日期、春节对应的待预测日期、劳动节对应的待预测日期等等。
具体地,获取到至少一种影响客流量预测因素的关联数据,从关联数据中获取与时间或者假期维度相关的数据,作为子关联数据,如待预测日期,如xx年xx月xx日等等。在确定子关联数据从候选类别中确定对应的目标类别后,获取与目标类别对应的预测客流量预测算法,利用预测客流量预测算法计算得到子关联数据对应的第一子客流量。
例如,如图4所示,图4示出一个实施例中预测客流量预测算法对应的生成步骤示意图,判断训练日期所属的类别,若训练日期为工作日或者周末时,则寻找对应的历史工作日或者周末,按照日期降序排序,选择排名前top个,获取这top个日期进站、出站的第一客流量平均值,以及寻找对应的相同星期,按照日期降序排序,选择排名前top个,获取这top个日期进站、出站的第二客流量平均值,根据第一客流量平均值和第二客流量平均值计算得到第一平均值。若训练日期为节假日,寻找对应的历史节假日,按照日期降序排序,选择排名前top个,获取这top个日期进站、出站的第二平均值,根据第一平均值和第二平均值计算平均误差。图4示出的是一个预测客流量预测算法的流程示意图,训练好不同类别所属的预测客流量预测算法后,可获取对应的预测客流量预测算法,利用预测客流量预测算法计算对应的预测客流量。
步骤306,将影响客流量预测因素对应的关联数据和预测站点标识输入至已训练好的客流量预测子模型中,得到预测站点标识对应的第二子客流量。
步骤308,将第一子客流量和第二子客流量输入至已训练好的客流量预测模型中,客流量预测模型通过全连接层输出中间客流量,对中间客流量进行张量连接得到预测站点标识对应的预测客流量。
其中,客流量预测模型包括客流量预测算法和客流量预测子模型,也就是说客流量预测算法得到的子客流量和客流量预测子模型预测得到的子客流量作为客流量预测模型的输入数据。而这里是将影响客流量预测因素对应的关联数据和预测站点标识输入至已训练好的客流量预测子模型中,客流量预测子模型对关联数据进行特征提取,对提取到的特征进行处理和计算,最终输出得到预测站点标识对应的第二子客流量。
进一步地,将第一子客流量和第二子客流量作为已训练好的客流量预测模型的输入,客流量预测模型对第一子客流量和第二子客流量进行处理和计算得到预测站点标识对应的预测客流量。具体可以是,客流量预测模型接收到第一子客流量和第二子客流量后,第一子客流量和第二子客流量后面可以分别连接一层32个神经元的全连接层,将第一子客流量和第二子客流量对应的全连接层输出的结果作为中间客流量,再对中间客流量进行张量连接从而输出预测站点标识对应的预测客流量。
其中,客流量预测模型结合客流量预测算法和客流量预测子模型,将客流量预测算法和客流量预测子模型对应子客流量同时输入至客流量预测模型中,得到最终的预测客流量,客流量预测算法和客流量预测子模型的优势相结合,能够提高客流量预测的准确性。
在一个实施例中,客流量预测算法的生成步骤包括:获取影响客流量时间参数和属性参数对应的历史客流量数据,根据历史客流量数据制定对应的客流量预测算法,不同时间参数对应的关联数据对应不同的客流量预测算法,不同属性参数对应的关联数据对应不同的客流量预测算法。
具体地,获取影响客流量时间参数和属性参数对应的历史客流量数据后,根据历史客流量数据制定对应的客流量预测算法,不同时间参数对应的关联数据对应不同的客流量预测算法,不同属性参数对应的关联数据对应不同的客流量预测算法。也就是说,不同类别对应的历史客流量数据可以训练出对应的客流量预测算法,如预测日期的属性参数为工作日属性时,工作日属性存在对应的客流量预测算法,预测日期的属性参数为周末时,周末属性存在对应的客流量预测算法,预测日期的属性参数为节假日时,节假日属性存在对应的客流量预测算法。即客流量预测算法是针对不同的类别(比如待预测日期是工作日、周末、节假日),给出不同的规则,然后在实际的预测过程中,利用这套规则来预测客流量。
在一个实施例中,具体可以如图4所示,图4示出一个实施例中预测客流量预测算法对应的生成步骤示示意图,判断训练日期所属的类别,若训练日期为工作日或者周末时,则寻找对应的历史工作日或者周末,按照日期降序排序,选择排名前top个,获取这top个日期进站、出站的第一客流量平均值,以及寻找对应的相同星期,按照日期降序排序,选择排名前top个,获取这top个日期进站、出站的第二客流量平均值,根据第一客流量平均值和第二客流量平均值计算得到第一平均值。若训练日期为节假日,寻找对应的历史节假日,按照日期降序排序,选择排名前top个,获取这top个日期进站、出站的第二平均值,根据第一平均值和第二平均值计算平均误差。图4示出的是一个预测客流量预测算法的流程示意图,训练好不同类别所属的预测客流量预测算法后,可获取对应的预测客流量预测算法,利用预测客流量预测算法计算对应的预测客流量。
在一个实施例中,如图5所示,客流量预测子模型的训练步骤包括:
步骤502,构建至少一个训练数据特征,训练数据特征为历史客流量数据特征、周期性客流量数据特征、月份特征、星期特征、小时特征、假期特征、平均气温特征、绝对温差特征中的至少一个。
其中,这里的训练数据特征是用来训练客流量预测子模型的,在训练客流量预测子模型之前,可以构建至少一个训练数据特征,训练数据特征可以是历史客流量数据特征、周期性客流量数据特征、月份特征、星期特征、小时特征、假期特征、平均气温特征、绝对温差特征中的至少一个。
这里的历史客流量数据特征是各个训练站点对应的历史客流量对应的特征数据,具体可以是获取各个训练站点对应的历史客流量数据,将历史客流量数据转换为对应的历史客流量数据特征。如,n天前(1天前,2天前,...,n天前)m维张量(m为站点数),共n个特征,这n个特征为历史客流量数据特征。
而周期性客流量数据特征是指与周期性客流量对应的特征数据,具体可以是获取各个训练站点对应的周期性客流量数据,将周期性客流量数据转换为对应的周期性客流量数据特征。其中,具体周期可以根据实际需要或者实际应用场景进行设置。如,周期性客流量数据为14天前的客流量数据,21天前的客流量数据,m维张量(m为站点数),共2个特征。
其中,月份特征是指与月份相关的特征数据,如待预测日期所在的月份,星期特征是指星期相关的特征数据,如待预测日期所在的星期,小时特征是与小时相关的特征数据,如待预测小时,假期特征是与假期相关的特征数据,如待预测日期是否是节假日,平均气温特征是与气温相关的特征数据,如待预测日期所在的平均气温,而绝对温差特征是本申请提出的新特征构造方法,是利用待预测日期对应的实际气温和体感最合适温度之间差的绝对值作为绝对温差特征。应当说明的是,月份特征、星期特征、小时特征、假期特征、平均气温特征、绝对温差特征都为1维张量。
步骤504,将至少一个训练数据特征输入至初始客流量预测子模型中,计算得到至少一个训练数据特征对应的初始权重系数,将初始权重系数作为初始客流量预测子模型的模型参数,得到中间客流量预测子模型。
具体地,在构建得到至少一个训练数据特征后,将至少一个训练数据特征输入至初始客流量预测子模型中,通过初始客流量预测子模型对训练数据特征进行处理、计算,得到各个训练数据特征对应的初始权重系数,但是这个权重系数并不是最终的权重系数,还需要不断调整,使得客流量预测子模型对应的预测值能够与真实的客流量更加接近。则需要不断地训练客流量预测子模型,不断地调整客流量预测子模型的模型参数,使得客流量预测子模型的效果最好,达到拟合,具体是将初始权重系数作为初始客流量预测子模型的模型参数,得到中间客流量预测子模型。
步骤506,获取训练关联数据,训练关联数据包括对应的目标预测客流量数据。
步骤508,将训练关联数据输入至中间客流量预测子模型,得到对应的预测客流量数据。
其中,在得到中间客流量预测子模型后,需要获取训练关联数据去训练中间客流量预测子模型,这里的训练关联数据可以是影响客流量各个预测因素对应的数据都可以作为训练关联数据。其中,训练关联数据包括对应的目标预测客流量数据,这里的目标预测客流量数据可以作为训练关联数据的标签,作为客流量预测子模型输出的预测客流量进行参考,从而确定客流量预测子模型的准确性。
具体地,将获取到的训练关联数据,作为中间客流量预测子模型的输入数据,通过中间客流量预测子模型对训练关联数据进行特征提取、处理和计算,得到对应的预测客流量数据。
步骤510,根据目标预测客流量数据和预测客流量数据计算得到训练损失值,根据训练损失值对中间客流量预测子模型的模型参数进行调整,直至满足收敛条件,得到已训练好的客流量预测子模型。
其中,在得到预测客流量数据后,根据目标预测客流量数据和预测客流量数据计算得到训练损失值,训练损失值越小,客流量预测子模型的预测准确性越高。训练损失值是用来调整客流量预测子模型的模型参数的参考值。具体地,根据目标预测客流量数据和预测客流量数据计算得到训练损失值,可以通过训练损失值确定预测客流量数据和目标预测客流量数据之间的差异,再通过训练损失值对中间客流量预测子模型的模型参数进行调整,直至满足收敛条件,从而得到已训练好的客流量预测子模型。收敛条件可以是训练损失值达到最小时,确定客流量预测子模型满足收敛条件,或者还可以是训练损失值不再发生变化,确定客流量预测子模型满足收敛条件,或者还可以是迭代次数达到预设次数,确定客流量预测子模型满足收敛条件,预设次数可根据实际需要或者应用场景进行设置。
在一个实施例中,如图6所示,已训练的客流量影响因子的生成步骤包括:
步骤602,获取特殊关联数据对应的特殊客流量和普通关联数据对应的普通客流量。
其中,这里的特殊客流量是指特殊关联数据对应的客流量数据,特殊关联数据是影响客流量特殊因素对应的数据,可以将节假日、突发情况(如演唱会)、酷热、暴雪等情况称为特殊因素。相对于特殊关联数据的是普通关联数据,就是影响客流量普通影响因素对应的数据,可以将工作日、正常情况等情况称为普通影响因素。
具体地,获取影响客流量特殊因素对应的关联数据,关联数据如演唱会当天的日期、或者酷热当前的日期等等,同时,获取影响客流量普通影响因素对应的关联数据,如工作日对应的日期等等。
步骤604,随机初始化特殊客流量对应的初始影响参数。
步骤606,获取预设偏移量,根据预设偏移量和初始影响参数计算得到更新影响参数。
其中,这里的初始影响参数是特殊客流量对应的初始权重系数,可以对特殊客流量对应的权重系数进行随机赋值,随机赋予的初始值可作为特殊客流量对应的初始影响参数。而预设偏移量是预先设置用来更新影响参数的,可以根据实际需要或者应用场景进行设置。
具体地,在获取特殊关联数据对应的特殊客流量和普通关联数据对应的普通客流量后,对特殊客流量进行随机初始化赋值,将初始化的值作为特殊客流量对应的初始影响参数,即特殊客流量对应的初始权重系数,再获取预先存储的预设偏移量,根据预设偏移量来更新初始影响参数,具体可以是根据预设偏移量和初始影响参数计算得到更新影响参数,计算方式可自定义,自定义可以是将预设偏移量和初始影响参数相乘,计算得到更新影响参数,或者还可以是根据预设偏移量和初始影响参数进行加权求和,计算得到更新影响参数。
步骤608,根据更新影响参数和普通客流量计算得到预测值,根据预测值和普通客流量计算得到误差。
步骤610,当误差满足收敛条件时,将更新影响参数作为客流量影响因子,否则,将更新影响参数作为初始影响参数,直至误差满足收敛条件得到客流量影响因子。
具体地,在根据预设偏移量和初始影响参数计算得到更新影响参数之后,可根据更新影响参数和普通客流量计算得到预测值,再根据预测值和普通客流量计算得到误差。这里的误差可以体现预测值和普通客流量之间的差异性,如果误差越小,说明预测值更加贴近实际值,反之,如果误差越大,说明预测值准确度越差。其中,计算更新影响参数的计算方式可自定义,自定义可以是将更新影响参数和普通客流量进行相乘,得到预测值等等,而误差的计算方式可自定义,自定义可以是将预测值和普通客流量之间的差值作为误差等等。具体的计算方式在本申请中不作任何限制,具体可以根据实际应用或者需要进行设置。
进一步地,在得到预测值和普通客流量之间的误差后,检测误差是否满足收敛条件,当误差满足收敛条件时,将更新影响参数作为客流量影响因子,否则,将更新影响参数作为初始影响参数,直至误差满足收敛条件得到客流量影响因子。其中,这里的收敛条件可自定义,自定义可以是误差达到最小时,或者误差不再发生任何变化时,或者是迭代次数达到预设迭代次数后,可认为是满足收敛条件。
在一个具体实施例中,提供了一种客流数据确定方法,具体包括以下步骤:
1、获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种。
2、将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量。
2-1、客流量预测模型包括客流量预测算法和客流量预测子模型,从关联数据中获取时间参数和属性参数对应的子关联数据。
2-2、根据子关联数据获取匹配的预设客流量预测算法,利用预设客流量预测算法计算得到子关联数据对应的第一子客流量。其中,客流量预测算法的生成步骤包括:获取影响客流量时间参数和属性参数对应的历史客流量数据,根据历史客流量数据制定对应的客流量预测算法,不同时间参数对应的关联数据对应不同的客流量预测算法,不同属性参数对应的关联数据对应不同的客流量预测算法。
2-3、将影响客流量预测因素对应的关联数据和预测站点标识输入至已训练好的客流量预测子模型中,得到预测站点标识对应的第二子客流量。
其中,客流量预测子模型的训练步骤包括:
2-3-1、构建至少一个训练数据特征,训练数据特征为历史客流量数据特征、周期性客流量数据特征、月份特征、星期特征、小时特征、假期特征、平均气温特征、绝对温差特征中的至少一个。
2-3-2、将至少一个训练数据特征输入至初始客流量预测子模型中,计算得到至少一个训练数据特征对应的初始权重系数,将初始权重系数作为初始客流量预测子模型的模型参数,得到中间客流量预测子模型。
2-3-3、获取训练关联数据,训练关联数据包括对应的目标预测客流量数据。
2-3-4、将训练关联数据输入至中间客流量预测子模型,得到对应的预测客流量数据。
2-3-5、根据目标预测客流量数据和预测客流量数据计算得到训练损失值,根据训练损失值对中间客流量预测子模型的模型参数进行调整,直至满足收敛条件,得到已训练好的客流量预测子模型。
2-4、将第一子客流量和第二子客流量输入至已训练好的客流量预测模型中,所述客流量预测模型通过全连接层输出中间客流量,对所述中间客流量进行张量连接得到预测站点标识对应的预测客流量。
3、根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子。其中,预设条件用于判断关联数据是否是特殊关联数据,特殊关联数据为假期关联数据、突发状况关联数据中的至少一种。
其中,已训练的客流量影响因子的生成步骤包括:
3-1、获取特殊关联数据对应的特殊客流量和普通关联数据对应的普通客流量。
3-2、随机初始化特殊客流量对应的初始影响参数。
3-3、获取预设偏移量,根据预设偏移量和初始影响参数计算得到更新影响参数。
3-4、根据更新影响参数和普通客流量计算得到预测值,根据预测值和普通客流量计算得到误差。
3-5、当误差满足收敛条件时,将更新影响参数作为客流量影响因子,否则,将更新影响参数作为初始影响参数,直至误差满足收敛条件得到客流量影响因子。
4、根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。
4-1、将预测客流量和客流量影响因子相乘,得到预测站点标识对应的目标预测客流量。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种客流数据确定装置700,包括:获取模块、预测模块、判断模块和计算模块,其中:
获取模块702,用于获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种。
预测模块704,用于将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量。
判断模块706,用于根据所述预测因素确定所述关联数据是否符合预设条件,当所述关联数据符合所述预设条件时,获取已训练的客流量影响因子。
计算模块708,用于根据所述预测客流量和所述客流量影响因子计算得到所述预测站点标识对应的目标预测客流量。
在一个实施例中,如图8所示,客流量预测模型包括客流量预测算法和客流量预测子模型,预测模块704包括:
子关联数据获取单元704a,用于从关联数据中获取时间参数和属性参数对应的子关联数据。
第一子客流量计算单元704b,用于根据子关联数据获取匹配的预设客流量预测算法,利用预设客流量预测算法计算得到子关联数据对应的第一子客流量。
第二子客流量计算单元704c,用于将影响客流量预测因素对应的关联数据和预测站点标识输入至已训练好的客流量预测子模型中,得到预测站点标识对应的第二子客流量。
预测客流量预测单元704d,用于将第一子客流量和第二子客流量输入至已训练好的客流量预测模型中,客流量预测模型通过全连接层输出中间客流量,对中间客流量进行张量连接得到预测站点标识对应的预测客流量。
在一个实施例中,预测模块704还用于获取影响客流量时间参数和属性参数对应的历史客流量数据,根据历史客流量数据制定对应的客流量预测算法,不同时间参数对应的关联数据对应不同的客流量预测算法,不同属性参数对应的关联数据对应不同的客流量预测算法。
在一个实施例中,预测模块704还用于构建至少一个训练数据特征,训练数据特征为历史客流量数据特征、周期性客流量数据特征、月份特征、星期特征、小时特征、假期特征、平均气温特征、绝对温差特征中的至少一个,将至少一个训练数据特征输入至初始客流量预测子模型中,计算得到至少一个训练数据特征对应的初始权重系数,将初始权重系数作为初始客流量预测子模型的模型参数,得到中间客流量预测子模型,获取训练关联数据,训练关联数据包括对应的目标预测客流量数据,将训练关联数据输入至中间客流量预测子模型,得到对应的预测客流量数据,根据目标预测客流量数据和预测客流量数据计算得到训练损失值,根据训练损失值对中间客流量预测子模型的模型参数进行调整,直至满足收敛条件,得到已训练好的客流量预测子模型。
在一个实施例中,预设条件用于判断关联数据是否是特殊关联数据,特殊关联数据为假期关联数据、突发状况关联数据中的至少一种。
在一个实施例中,客流数据确定装置700还用于获取特殊关联数据对应的特殊客流量和普通关联数据对应的普通客流量,随机初始化特殊客流量对应的初始影响参数,获取预设偏移量,根据预设偏移量和初始影响参数计算得到更新影响参数,根据更新影响参数和普通客流量计算得到预测值,根据预测值和普通客流量计算得到误差,当误差满足收敛条件时,将更新影响参数作为客流量影响因子,否则,将更新影响参数作为初始影响参数,直至误差满足收敛条件得到客流量影响因子。
在一个实施例中,客流数据确定装置700还用于将预测客流量和客流量影响因子相乘,得到预测站点标识对应的目标预测客流量。
关于客流数据确定装置的具体限定可以参见上文中对于客流数据确定方法的限定,在此不再赘述。上述客流数据确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储客流量预测模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种客流数据确定方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种客流数据确定方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9或者图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种,将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量,根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子,根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。
在一个实施例中,客流量预测模型包括客流量预测算法和客流量预测子模型,处理器执行计算机程序时还实现以下步骤:从关联数据中获取时间参数和属性参数对应的子关联数据,根据子关联数据获取匹配的预设客流量预测算法,利用预设客流量预测算法计算得到子关联数据对应的第一子客流量,将影响客流量预测因素对应的关联数据和预测站点标识输入至已训练好的客流量预测子模型中,得到预测站点标识对应的第二子客流量,将第一子客流量和第二子客流量输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取影响客流量时间参数和属性参数对应的历史客流量数据,根据历史客流量数据制定对应的客流量预测算法,不同时间参数对应的关联数据对应不同的客流量预测算法,不同属性参数对应的关联数据对应不同的客流量预测算法。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:构建至少一个训练数据特征,训练数据特征为历史客流量数据特征、周期性客流量数据特征、月份特征、星期特征、小时特征、假期特征、平均气温特征、绝对温差特征中的至少一个,将至少一个训练数据特征输入至初始客流量预测子模型中,计算得到至少一个训练数据特征对应的初始权重系数,将初始权重系数作为初始客流量预测子模型的模型参数,得到中间客流量预测子模型,获取训练关联数据,训练关联数据包括对应的目标预测客流量数据,将训练关联数据输入至中间客流量预测子模型,得到对应的预测客流量数据,根据目标预测客流量数据和预测客流量数据计算得到训练损失值,根据训练损失值对中间客流量预测子模型的模型参数进行调整,直至满足收敛条件,得到已训练好的客流量预测子模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取特殊关联数据对应的特殊客流量和普通关联数据对应的普通客流量,随机初始化特殊客流量对应的初始影响参数,获取预设偏移量,根据预设偏移量和初始影响参数计算得到更新影响参数,根据更新影响参数和普通客流量计算得到预测值,根据预测值和普通客流量计算得到误差,当误差满足收敛条件时,将更新影响参数作为客流量影响因子,否则,将更新影响参数作为初始影响参数,直至误差满足收敛条件得到客流量影响因子。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将预测客流量和客流量影响因子相乘,得到预测站点标识对应的目标预测客流量。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种,将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量,根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子,根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。
在一个实施例中,客流量预测模型包括客流量预测算法和客流量预测子模型,处理器执行计算机程序时还实现以下步骤:从关联数据中获取时间参数和属性参数对应的子关联数据,根据子关联数据获取匹配的预设客流量预测算法,利用预设客流量预测算法计算得到子关联数据对应的第一子客流量,将影响客流量预测因素对应的关联数据和预测站点标识输入至已训练好的客流量预测子模型中,得到预测站点标识对应的第二子客流量,将第一子客流量和第二子客流量输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取影响客流量时间参数和属性参数对应的历史客流量数据,根据历史客流量数据制定对应的客流量预测算法,不同时间参数对应的关联数据对应不同的客流量预测算法,不同属性参数对应的关联数据对应不同的客流量预测算法。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:构建至少一个训练数据特征,训练数据特征为历史客流量数据特征、周期性客流量数据特征、月份特征、星期特征、小时特征、假期特征、平均气温特征、绝对温差特征中的至少一个,将至少一个训练数据特征输入至初始客流量预测子模型中,计算得到至少一个训练数据特征对应的初始权重系数,将初始权重系数作为初始客流量预测子模型的模型参数,得到中间客流量预测子模型,获取训练关联数据,训练关联数据包括对应的目标预测客流量数据,将训练关联数据输入至中间客流量预测子模型,得到对应的预测客流量数据,根据目标预测客流量数据和预测客流量数据计算得到训练损失值,根据训练损失值对中间客流量预测子模型的模型参数进行调整,直至满足收敛条件,得到已训练好的客流量预测子模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取特殊关联数据对应的特殊客流量和普通关联数据对应的普通客流量,随机初始化特殊客流量对应的初始影响参数,获取预设偏移量,根据预设偏移量和初始影响参数计算得到更新影响参数,根据更新影响参数和普通客流量计算得到预测值,根据预测值和普通客流量计算得到误差,当误差满足收敛条件时,将更新影响参数作为客流量影响因子,否则,将更新影响参数作为初始影响参数,直至误差满足收敛条件得到客流量影响因子。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将预测客流量和客流量影响因子相乘,得到预测站点标识对应的目标预测客流量。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。
因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。