CN114626887A - 客流量预测方法、装置、计算机设备和存储介质 - Google Patents

客流量预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114626887A
CN114626887A CN202210269502.9A CN202210269502A CN114626887A CN 114626887 A CN114626887 A CN 114626887A CN 202210269502 A CN202210269502 A CN 202210269502A CN 114626887 A CN114626887 A CN 114626887A
Authority
CN
China
Prior art keywords
passenger flow
sequence
day
activity
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210269502.9A
Other languages
English (en)
Inventor
周漪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202210269502.9A priority Critical patent/CN114626887A/zh
Publication of CN114626887A publication Critical patent/CN114626887A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种客流量预测方法、装置、计算机设备和存储介质,涉及人工智能趋势预测技术领域。所述方法包括:获取预测时间段,并确定预测时间段对应的历史时间段,获取历史时间段内历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定,根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列,根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。采用本方法能够预测活动日和非活动日两个维度的客流量,实现更为准确的客流量预测。

Description

客流量预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及人工智能趋势预测技术领域,特别是涉及一种客流量预测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着近年来人工智能的快速发展,客流量预测也进入了一个全新的领域,得到了更多的技术支持,客流量预测应用在越来越多的领域。
现如今,各行业的商家为了在不同时间段合理地统筹调配店内人力物力资源,常常需要对客流量进行预估。然而现有的客流量预测方案大多都是由经验丰富的人靠相关经营经验,对未来时间段内的客流量进行预估,上述方式预测误差大,预测准确度低。为了解决这一问题,又有相关技术人员提出了无需依赖人工预测的智能化客流量预测方案,但是,目前的智能化客流量预测方案,往往只考虑到时段和天气等基础动态因素对客流量的影响,预测结果的准确度仍然有待提高。
因此,需要提供一种准确度更高的客流量预测方案。
发明内容
基于此,有必要针对上述技术问题,提供一种能够精准预测客流量的客流量预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种客流量预测方法。所述方法包括:
获取预测时间段,并确定预测时间段对应的历史时间段;
获取历史时间段内历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定;
根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列;
根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。
在一个实施例中,活动波动因子基于以下方式得到:
获取历史时间段的目标日均客流量序列和上一次活动的客流量序列,目标日均客流量序列为非活动日以星期属性分组的日均客流量序列;
针对各活动日,对应获取上一次活动的客流量序列中活动日当天的客流量与目标日均客流量序列中各星期数的日均客流量的比值,得到当天对应的活动波动因子。
在一个实施例中,根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列包括:
确定预测时段内活动日时间轴;
基于活动日时间轴,依次获取各活动日对应的活动波动因子与非活动日的预测客流量序列中各预测客流量的乘积,得到预测时段内活动日的预测客流量序列。
在一个实施例中,根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列之前,还包括:
对历史客流量序列和客流量影响因子进行数据预处理,数据预处理包括异常值处理;
根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列包括:
根据数据预处理后的历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列。
在一个实施例中,对历史客流量序列和客流量影响因子进行异常值处理包括:
识别历史客流量序列的异常值和客流量影响因子的异常值;
采用平均值修正方法,对历史客流量序列的异常值和客流量影响因子的异常值进行修正。
在一个实施例中,识别历史客流量序列的异常值和客流量影响因子的异常值包括:
获取历史客流量序列的均值和客流量影响因子的均值;
确定历史客流量序列中各历史客流量与历史客流量序列的均值的第一绝对距离,以及各客流量影响因子与各客流量影响因子的均值的第二绝对距离;
将第一绝对距离和第二绝对距离分别与预设标准差进行比较,筛选出历史客流量序列的异常值和客流量影响因子的异常值。
在一个实施例中,客流量预测方法应用于餐饮行业的客流量预测,客流量影响因子包括天气因子、每日平均客单价、每日人均用餐时长、星期属性、节假日属性和每日平均到店等待时长。
第二方面,本申请还提供了一种客流量预测装置。所述装置包括:
时间确定模块,用于获取预测时间段,并确定预测时间段对应的历史时间段;
数据获取模块,用于获取历史时间段内历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定;
非活动日客流量预测模块,用于根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列;
活动日客流量预测模块,用于根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。
在一个实施例中,装置还包括活动波动因子确定模块,用于获取历史时间段的目标日均客流量序列和上一次活动的客流量序列,目标日均客流量序列为非活动日以星期属性分组的日均客流量序列,针对各活动日,对应获取上一次活动的客流量序列中活动日当天的客流量与目标日均客流量序列中各星期数的日均客流量的比值,得到当天的活动波动因子。
在一个实施例中,活动日客流量预测模块还用于确定预测时段内活动日时间轴,基于活动日时间轴,依次获取各活动日对应的活动波动因子与非活动日的预测客流量序列中各预测客流量的乘积,得到预测时段内活动日的预测客流量序列。
在一个实施例中,装置还包括数据预处理模块,用于对历史客流量序列和客流量影响因子进行数据预处理,数据预处理包括异常值处理。
在一个实施例中,数据预处理模块还用于识别历史客流量序列的异常值和客流量影响因子的异常值,采用平均值修正方法,对历史客流量序列的异常值和客流量影响因子的异常值进行修正。
在一个实施例中,数据预处理模块还用于获取历史客流量序列的均值和客流量影响因子的均值,确定历史客流量序列中各历史客流量与历史客流量序列的均值的第一绝对距离,以及各客流量影响因子与各客流量影响因子的均值的第二绝对距离,将第一绝对距离和第二绝对距离分别与预设标准差进行比较,筛选出历史客流量序列的异常值和客流量影响因子的异常值。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取预测时间段,并确定预测时间段对应的历史时间段;
获取历史时间段内历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定;
根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列;
根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取预测时间段,并确定预测时间段对应的历史时间段;
获取历史时间段内历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定;
根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列;
根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取预测时间段,并确定预测时间段对应的历史时间段;
获取历史时间段内历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定;
根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列;
根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。
上述客流量预测方法、装置、计算机设备、存储介质和计算机程序产品,一方面,设计有客流量影响因子,考虑了影响因子对客流量的影响,使得根据历史客流量序列和客流量影响因子,能够得到准确且客观的非活动日的预测客流量序列,另一方面,设计有活动波动因子,该活动波动因子由活动日客流量与非活动日客流量的比值确定,因此,能够较为准确地表征活动日对客流量的影响,使得结合非活动日的预测客流量序列和活动波动因子,便能得到活动日的预测客流量序列,综上所述,本方案通过客流量影响因子加强了预测客流量的准确性,并且,通过设计有活动波动因子,能够实现活动日对客流量的影响的量化预测,进一步保证预测活动日客流量的准确性,故,采用本方案能够预测活动日和非活动日两个维度的客流量,实现更为准确的客流量预测。
附图说明
图1为一个实施例中客流量预测方法的应用环境图;
图2为一个实施例中客流量预测方法的流程示意图;
图3为一个实施例中识别历史客流量序列和客流量影响因子中异常值步骤的流程示意图;
图4为另一个实施例中客流量预测方法的流信息程示意图;
图5为一个实施例中客流量预测装置的结构框图;
图6为另一个实施例中客流量预测装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的客流量预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。具体的,可以是业务人员于终端102上进行操作,想要预测当前时间一年内的活动日客流量和非活动日客流量,于是通过终端102提交了预测需求,并发送客流量预测请求至服务器104,服务器104响应该请求,获取预测时间段如一年,确定历史时间段为去年,然后获取去年一年时间内的历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由去年一年时间内活动日客流量与非活动日客流量的比值确定,然后,根据历史客流量序列和客流量影响因子,得到今年内非活动日的预测客流量序列,再根据非活动日的预测客流量序列和活动波动因子,得到今年内活动日的预测客流量序列。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种客流量预测方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取预测时间段,并确定预测时间段对应的历史时间段。
在实际应用中,预测时间段由业务人员根据实际需求而设定,具体可以是由业务人员在操作界面上输入预测时间段提交。本实施例中,预测时间段以今年一年为例,则对应的历史时间段为去年一年。
步骤204,获取历史时间段内历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定。
历史客流量序列为按照时间顺序排列的历史客流量数据。客流量影响因子是指会影响客流量预测值的动态因素,该动态因素会随着时间的变化而变化。活动波动因子是根据由历史时间段内活动日客流量与非活动日客流量的比值确定的,其表征活动对客流量的影响。具体的,活动波动因子可以是优惠券活动波动因子,即表征优惠券活动对客流量的影响。本实施例中,历史时间段内的历史客流量序列为去年连续一年内的客流量,客流量影响因子包括天气因子、节假日属性和星期属性等因子。
在另一个实施例中,以本申请提供的方法应用在餐饮行业为例,客流量影响因子包括天气因子、每日平均客单价、每日人均用餐时长、星期属性、节假日属性和每日平均到店等待时长。
具体的,客流量影响因子的数据转换如下:
1)天气情况:用X5表示一天的天气情况,w=(0,1,2,3,4),其中0到4依次表示冰雪、雪、大雨、雨和晴天。
2)每日平均客单价:平均单一客户就餐消费金额(天)
3)每日人均用餐时长(天):每天平均人均用餐时间总时。
4)星期属性:W=(0,1,2,3,4,5,6),其中0到6一次表示星期一、星期二、星期三、星期四、星期五、星期六、星期日。
5)节假日属性:用(0,1)表示,0为不为国家法定节假日,1为是国家法定节假日。
6)每日平均到店等待时长:客户到店排号后最终进入餐厅就餐的平均等待时长。
本实施例中,通过设计包括天气因子、每日平均客单价、每日人均用餐时长、星期属性、节假日属性和每日平均到店等待时长的客流量影响因子,考虑得更为全面,进而能够进一步提高预测结果的准确性。
步骤206,根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列。
本申请从活动日和非活动日两个维度提供预测客流量的方案。所谓非活动日的预测客流量序列即为预测时间段内非优惠活动日时,按照时间顺序排列的客流量。在实际应用中,预测时段内非活动日的预测客流量序列可以是根据RBF(radial basis functionneutral network,径向基函数神经网络)函数神经网络模型预测得到。本实施例中,可以是将客流量序列和客流量影响因子输入至非活动日客流量预测模型中,得到预测时段内非活动日的预测客流量序列。其中,非活动日客流量预测模型是根据预设历史时间段内的客流量数据和期间的客流量影响因子训练得到。具体的,该模型通过对不同时间段下的客流量进行采样,并加入天气、星期、每日平均客单价、每日人均用餐时长、节假日属性和每日平均到店等待时长上述动态因素输入至模型进行训练学习,即将初始非活动日客流量预测模型进行网络初始化,设定网络参数,包括样本循环总数和目标误差等,然后将由历史时间段内的客流量数据和客流量因子作为训练样本输入至初始非活动日客流量模型,计算隐含层节点的输出和输出权值,得到样本训练误差,然后比较样本训练误差和目标误差,若样本训练误差小于目标误差,则再次输入训练样本,循环至样本循环总数时,找到预设数量的数据中心点,计算样本训练误差,当样本训练误差满足精度要求时,则训练完成,得到非活动日客流量预测模型。而后,将预测时间段内的历史客流量序列和历史客流量影响因子输入至已训练的非活动日客流量预测模型,则得到非活动日的预测客流量序列。
步骤208,根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。
预测时段内活动日的预测客流量序列即指预测时间段内,活动日的客流量序列。在得到非活动日的预测客流量序列后,可进一步的,结合活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。具体的,结合非活动日的预测客流量序列,得到预测时段内活动日的预测客流量序列。如此,能够得到活动日和非活动日两个维度对应的预测客流量序列。
上述客流量预测方法中,一方面,设计有客流量影响因子,考虑了影响因子对客流量的影响,使得根据历史客流量序列和客流量影响因子,能够得到准确且客观的非活动日的预测客流量序列,另一方面,设计有活动波动因子,该活动波动因子由活动日客流量与非活动日客流量的比值确定,因此,能够较为准确地表征活动日对客流量的影响,使得结合非活动日的预测客流量序列和活动波动因子,便能得到活动日的预测客流量序列,综上所述,本方案通过客流量影响因子加强了预测客流量的准确性,并且,通过设计有活动波动因子,能够实现活动日对客流量的影响的量化预测,进一步保证预测活动日客流量的准确性,故,采用本方案能够预测活动日和非活动日两个维度的客流量,实现更为准确的客流量预测。
在一个实施例中,活动波动因子基于以下方式得到:
获取历史时间段的目标日均客流量序列和上一次活动的客流量序列,目标日均客流量序列为非活动日以星期属性分组的日均客流量序列;
针对各活动日,对应获取上一次活动的客流量序列中活动日当天的客流量与目标日均客流量序列中各星期数的日均客流量的比值,得到当天对应的活动波动因子。
具体实施时,活动波动因子是基于优惠活动热度因子得到。通过大量的数据研究发现,一般在全年中,在非特殊活动时期,不同周的同一星期天数属性会有相似客流量规模,因此可以计算不同“星期属性”以细化区分。本实施例中,可以是获取过去连续一年的客流量以星期属性分组,分类为以星期一、星期二、星期三,…,星期天为统计单位的客流量,然后,设计优惠活动热度因子,计算各“星期”属性的全年日均客流量:
Figure BDA0003554031050000091
其中,ALL_Vol表示全年非活动日星期I的客流量,n表示统计ALL_VOL的天数。然后,获取上一次活动期间的客流量序列,根据各“星期”属性的全年日均客流量和上一次活动期间的客流量序列,得到活动波动因子:
Figure BDA0003554031050000101
其中,Couponj为优惠券活动第j天的波动因子,Cj是上一次优惠券活动第j天的实际到店客流量,n为优惠活动实际天数。本实施例中,以星期属性的全年日均客流量设计活动因子,能够比较准确预测活动日的客流量。
如图3所示,在一个实施例中,根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列包括:
步骤228,确定预测时段内活动日时间轴,基于活动日时间轴,依次获取各活动日对应的活动波动因子与非活动日的预测客流量序列中各预测客流量的乘积,得到预测时段内活动日的预测客流量序列。
具体实施时,预测活动日的客流量序列,可以是整理出预测时段内活动日时间轴,然后,按照活动日时间轴,依次将各活动日对应的活动波动因子与非活动日的预测客流量序列中各预测客流量相乘,得到该活动日当天的预测客流量,然后,以时间顺序排列,得到预测时段内活动日的预测客流量序列。本实施例中,通过将非活动日的客流量与活动波动因子相乘,能够较为准确得到活动日的预测客流量。
如图3所示,在一个实施例中,根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列之前,还包括:
步骤205,对历史客流量序列和客流量影响因子进行数据预处理,数据预处理包括异常值处理;
根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列包括:
步骤226,根据数据预处理之后的历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列。
在实际应用中,由于历史客流量序列和客流量影响因子的数量较多,而数据的质量将会对客流量预测结果的准确性产生影响,如预测客流量结果发生偏离。因此,在根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列之前,还可以对历史客流量序列和客流量影响因子进行数据预处理,具体包括异常值处理、数据标准化等。然后,再根据数据预处理之后的历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列。本实施例中,通过对历史客流量序列和客流量影响因子进行数据预处理,能够保证数据的规范性,进一步提高客流量预测的效率。
在一个实施例中,对历史客流量序列和客流量影响因子进行异常值处理包括:
识别历史客流量序列的异常值和客流量影响因子的异常值;
采用平均值修正方法,对历史客流量序列的异常值和客流量影响因子的异常值进行修正。
具体实施时,对历史客流量序列和客流量影响因子进行异常值处理可以是,首先根据预设的异常值数据判别规则,识别出历史客流量序列和客流量影响因子的异常值,然后,采用平均值修正方法,对历史客流量序列的异常值和客流量影响因子的异常值进行修正。具体的,通过平均值修正方法进行异常值处理可以是收集异常值前后两天的数据(需按照实际异常值产生具体日期进行数据采集,例如优惠活动开始前1天的数据(星期三)需要采集同一情况的相邻数据进行平均值修正)。本实施例中,通过平均值修正方法对异常值进行修正,能够准确且客观地修正异常值。
如图4所示,在一个实施例中,识别历史客流量序列的异常值和客流量影响因子的异常值包括:
步骤220,获取历史客流量序列的均值和客流量影响因子的均值;
步骤240,确定历史客流量序列中各历史客流量与历史客流量序列的均值的第一绝对距离,以及各客流量影响因子与各客流量影响因子的均值的第二绝对距离;
步骤260,将第一绝对距离和第二绝对距离分别与预设标准差进行比较,筛选出历史客流量序列的异常值和客流量影响因子的异常值。
承接上述实施例,异常数据判别规则可以是结合业务法和3σ原则,对客流量影响因子以及历史客流量进行处理。σ原则中的σ代表标准差,3σ也就是标准差。本实施例中,获取历史客流量序列的均值和客流量影响因子的均值,若当前历史客流量序列中历史客流量与历史客流量序列的均值的第一绝对距离,以及当前客流量影响因子与对应的客流量影响因子的均值的第二绝对距离均大于3倍标准差,即[-∞,μ-3σ]和[μ+3σ,+∞]部分的数据,将这一部分值称为是异常值。本实施例中,结合业务法和3σ原则,可准确地识别出异常数据。
为了对本申请提供的客流量预测方法做出更为清楚的说明,下面,结合一个具体实施例进行说明:
业务人员于终端上进行操作,想要预测当前时间一年内的活动日客流量和非活动日客流量,于是通过终端提交了预测需求,并发送客流量预测请求至服务器,服务器响应该请求,获取预测时间段如一年,确定历史时间段为去年,然后获取去年一年时间内的历史客流量序列、客流量影响因子(包括天气、星期、每日平均客单价、每日人均用餐时长、节假日属性和每日平均到店等待时长)和活动波动因子。然后,获取历史客流量序列的均值和客流量影响因子的均值,当前历史客流量序列中历史客流量与历史客流量序列的均值的第一绝对距离,以及当前客流量影响因子与对应的客流量影响因子的均值的第二绝对距离均大于3倍标准差,则将大于3倍标准差的数据判定为异常数据,再采用平均值修正方法,对历史客流量序列的异常值和客流量影响因子的异常值进行修正。
接着,一方面,可以是将数据预处理后的客流量序列和客流量影响因子输入至已训练的非活动日客流量预测模型中,得到今年内非活动日的预测客流量序列。另一方面,整理出预测时段内的活动日时间轴,然后,按照活动日时间轴,依次将各活动日对应的活动波动因子与非活动日的预测客流量序列中各预测客流量相乘,得到该活动日当天的预测客流量,然后,以时间顺序排列,得到预测时段内活动日的预测客流量序列。至此,得到活动日和非活动日两个维度对应的预测客流量序列。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的客流量预测方法的客流量预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个客流量预测装置实施例中的具体限定可以参见上文中对于客流量预测方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种客流量预测装置,包括:时间确定模块510、数据获取模块520、非活动日客流量预测模块530和活动日客流量预测模块540,其中:
时间确定模块510,用于获取预测时间段,并确定预测时间段对应的历史时间段;
数据获取模块520,用于获取历史时间段内历史客流量序列、客流量影响因子和活动波动因子,活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定;
非活动日客流量预测模块530,用于根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列;
活动日客流量预测模块540,用于根据非活动日的预测客流量序列和活动波动因子,得到预测时段内活动日的预测客流量序列。
上述客流量预测装置,一方面,设计有客流量影响因子,考虑了影响因子对客流量的影响,使得根据历史客流量序列和客流量影响因子,能够得到准确且客观的非活动日的预测客流量序列,另一方面,设计有活动波动因子,该活动波动因子由活动日客流量与非活动日客流量的比值确定,因此,能够较为准确地表征活动日对客流量的影响,使得结合非活动日的预测客流量序列和活动波动因子,便能得到活动日的预测客流量序列,综上所述,本方案通过客流量影响因子加强了预测客流量的准确性,并且,通过设计有活动波动因子,能够实现活动日对客流量的影响的量化预测,进一步保证预测活动日客流量的准确性,故,采用本装置能够预测活动日和非活动日两个维度的客流量,实现更为准确的客流量预测。
如图6所示,在一个实施例中,装置还包括活动波动因子确定模块550,用于获取历史时间段的目标日均客流量序列和上一次活动的客流量序列,目标日均客流量序列为非活动日以星期属性分组的日均客流量序列,针对各活动日,对应获取上一次活动的客流量序列中活动日当天的客流量与目标日均客流量序列中各星期数的日均客流量的比值,得到当天的活动波动因子。
在一个实施例中,活动日客流量预测模块540还用于确定预测时段内活动日时间轴,基于活动日时间轴,依次获取各活动日对应的活动波动因子与非活动日的预测客流量序列中各预测客流量的乘积,得到预测时段内活动日的预测客流量序列。
如图6所示,在一个实施例中,装置还包括数据预处理模块560,用于对历史客流量序列和客流量影响因子进行数据预处理,数据预处理包括异常值处理。
在一个实施例中,数据预处理模块560还用于识别历史客流量序列的异常值和客流量影响因子的异常值,采用平均值修正方法,对历史客流量序列的异常值和客流量影响因子的异常值进行修正。
在一个实施例中,数据预处理模块560还用于获取历史客流量序列的均值和客流量影响因子的均值,确定历史客流量序列中各历史客流量与历史客流量序列的均值的第一绝对距离,以及各客流量影响因子与各客流量影响因子的均值的第二绝对距离,将第一绝对距离和第二绝对距离分别与预设标准差进行比较,筛选出历史客流量序列的异常值和客流量影响因子的异常值。
上述客流量预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史时间段内历史客流量序列、客流量影响因子和活动波动因子等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种客流量预测方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述客流量预测方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述客流量预测方法中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述客流量预测方法中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (16)

1.一种客流量预测方法,其特征在于,所述方法包括:
获取预测时间段,并确定所述预测时间段对应的历史时间段;
获取所述历史时间段内历史客流量序列、客流量影响因子和活动波动因子,所述活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定;
根据所述历史客流量序列和所述客流量影响因子,得到预测时段内非活动日的预测客流量序列;
根据所述非活动日的预测客流量序列和所述活动波动因子,得到预测时段内活动日的预测客流量序列。
2.根据权利要求1所述的客流量预测方法,其特征在于,所述活动波动因子基于以下方式得到:
获取所述历史时间段的目标日均客流量序列和上一次活动的客流量序列,所述目标日均客流量序列为非活动日以星期属性分组的日均客流量序列;
针对各活动日,对应获取所述上一次活动的客流量序列中活动日当天的客流量与所述目标日均客流量序列中各星期数的日均客流量的比值,得到当天对应的活动波动因子。
3.根据权利要求1所述的客流量预测方法,其特征在于,所述根据所述非活动日的预测客流量序列和所述活动波动因子,得到预测时段内活动日的预测客流量序列包括:
确定所述预测时段内活动日时间轴;
基于所述活动日时间轴,依次获取各活动日对应的活动波动因子与所述非活动日的预测客流量序列中各预测客流量的乘积,得到预测时段内活动日的预测客流量序列。
4.根据权利要求1所述的客流量预测方法,其特征在于,所述根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列之前,还包括:
对所述历史客流量序列和所述客流量影响因子进行数据预处理,所述数据预处理包括异常值处理;
所述根据历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列包括:
根据数据预处理之后的历史客流量序列和客流量影响因子,得到预测时段内非活动日的预测客流量序列。
5.根据权利要求4所述的客流量预测方法,其特征在于,对所述历史客流量序列和所述客流量影响因子进行异常值处理包括:
识别所述历史客流量序列的异常值和所述客流量影响因子的异常值;
采用平均值修正方法,对所述历史客流量序列的异常值和所述客流量影响因子的异常值进行修正。
6.根据权利要求5所述的客流量预测方法,其特征在于,所述识别所述历史客流量序列的异常值和所述客流量影响因子的异常值包括:
获取所述历史客流量序列的均值和所述客流量影响因子的均值;
确定所述历史客流量序列中各历史客流量与所述历史客流量序列的均值的第一绝对距离,以及各所述客流量影响因子与各客流量影响因子的均值的第二绝对距离;
将第一绝对距离和所述第二绝对距离分别与预设标准差进行比较,筛选出所述历史客流量序列的异常值和所述客流量影响因子的异常值。
7.根据权利要求1至5任意一项所述的客流量预测方法,其特征在于,所述客流量预测方法应用于餐饮行业的客流量预测,所述客流量影响因子包括天气因子、每日平均客单价、每日人均用餐时长、星期属性、节假日属性和每日平均到店等待时长。
8.一种客流量预测装置,其特征在于,所述装置包括:
时间确定模块,用于获取预测时间段,并确定所述预测时间段对应的历史时间段;
数据获取模块,用于获取所述历史时间段内历史客流量序列、客流量影响因子和活动波动因子,所述活动波动因子由历史时间段内活动日客流量与非活动日客流量的比值确定;
非活动日客流量预测模块,用于根据所述历史客流量序列和所述客流量影响因子,得到预测时段内非活动日的预测客流量序列;
活动日客流量预测模块,用于根据所述非活动日的预测客流量序列和所述活动波动因子,得到预测时段内活动日的预测客流量序列。
9.根据权利要求8所述的客流量预测装置,其特征在于,所述装置还包括活动波动因子确定模块,用于获取所述历史时间段的目标日均客流量序列和上一次活动的客流量序列,所述目标日均客流量序列为非活动日以星期属性分组的日均客流量序列,针对各活动日,对应获取所述上一次活动的客流量序列中活动日当天的客流量与所述目标日均客流量序列中各星期数的日均客流量的比值,得到当天的活动波动因子。
10.根据权利要求8所述的客流量预测装置,其特征在于,所述活动日客流量预测模块还用于确定所述预测时段内活动日时间轴,基于所述活动日时间轴,依次获取各活动日对应的活动波动因子与所述非活动日的预测客流量序列中各预测客流量的乘积,得到预测时段内活动日的预测客流量序列。
11.根据权利要求8所述的客流量预测装置,其特征在于,所述装置还包括数据预处理模块,用于对所述历史客流量序列和所述客流量影响因子进行数据预处理,所述数据预处理包括异常值处理。
12.根据权利要求11所述的客流量预测装置,其特征在于,数据预处理模块还用于识别所述历史客流量序列的异常值和所述客流量影响因子的异常值,采用平均值修正方法,对所述历史客流量序列的异常值和所述客流量影响因子的异常值进行修正。
13.根据权利要求11所述的客流量预测装置,其特征在于,数据预处理模块还用于获取所述历史客流量序列的均值和所述客流量影响因子的均值,确定所述历史客流量序列中各历史客流量与所述历史客流量序列的均值的第一绝对距离,以及各所述客流量影响因子与各客流量影响因子的均值的第二绝对距离,将第一绝对距离和所述第二绝对距离分别与预设标准差进行比较,筛选出所述历史客流量序列的异常值和所述客流量影响因子的异常值。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
16.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202210269502.9A 2022-03-18 2022-03-18 客流量预测方法、装置、计算机设备和存储介质 Pending CN114626887A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210269502.9A CN114626887A (zh) 2022-03-18 2022-03-18 客流量预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210269502.9A CN114626887A (zh) 2022-03-18 2022-03-18 客流量预测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114626887A true CN114626887A (zh) 2022-06-14

Family

ID=81901234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210269502.9A Pending CN114626887A (zh) 2022-03-18 2022-03-18 客流量预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114626887A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115994785A (zh) * 2023-01-09 2023-04-21 淮阴工学院 一种餐饮人流量备料智能预测方法及系统
CN117575684A (zh) * 2024-01-15 2024-02-20 杭州路过网络有限公司 一种客流量预测方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115994785A (zh) * 2023-01-09 2023-04-21 淮阴工学院 一种餐饮人流量备料智能预测方法及系统
CN115994785B (zh) * 2023-01-09 2023-09-29 淮阴工学院 一种餐饮人流量备料智能预测方法及系统
CN117575684A (zh) * 2024-01-15 2024-02-20 杭州路过网络有限公司 一种客流量预测方法及系统
CN117575684B (zh) * 2024-01-15 2024-04-05 杭州路过网络有限公司 一种客流量预测方法及系统

Similar Documents

Publication Publication Date Title
CN114626887A (zh) 客流量预测方法、装置、计算机设备和存储介质
CN111091196B (zh) 客流数据确定方法、装置、计算机设备和存储介质
US20210103858A1 (en) Method and system for model auto-selection using an ensemble of machine learning models
CN113888235B (zh) 一种销量预测模型的训练方法、销量预测方法及相关装置
CN107622326B (zh) 用户分类、可用资源预测方法、装置及设备
KR102084389B1 (ko) 기업평가방법 및 시스템
CN113327151A (zh) 商品对象推荐方法、装置、计算机设备及存储介质
CN110650170B (zh) 用于推送信息的方法和装置
CN115983900A (zh) 用户营销策略的构建方法、装置、设备、介质和程序产品
US20220351051A1 (en) Analysis system, apparatus, control method, and program
CN111027837A (zh) 预新增国际航线的参考航线确定方法、系统、设备及介质
CN114741402A (zh) 业务特征池的处理方法、装置、计算机设备和存储介质
US20210365831A1 (en) Identifying claim complexity by integrating supervised and unsupervised learning
CN110837604B (zh) 基于住房监控平台的数据分析方法及装置
CN117312657A (zh) 金融应用的异常功能定位方法、装置、计算机设备和介质
CN114495137B (zh) 票据异常检测模型生成方法与票据异常检测方法
CN114819282A (zh) 基于个性化共识的应急任务规划方案评估方法和系统
CN107545347B (zh) 用于防控风险的属性确定方法、装置及服务器
CN115511562A (zh) 虚拟产品推荐方法、装置、计算机设备和存储介质
CN114417190A (zh) 网点推荐方法、装置、计算机设备和存储介质
CN112632392A (zh) 确定候选下车地点的方法、装置、设备、介质和程序产品
JP2017227942A (ja) 情報処理装置及び方法、並びにプログラム
Napoli et al. The Accuracy of Predictive Analytics in Forecasting Emergency Department Volume Before and After Onset of COVID-19
Song et al. Confidence interval construction in massive data sets
CN115829069A (zh) 网点推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination