CN117422374A

CN117422374A - 基于大数据技术的食堂智能采购方法、电子设备及介质

Info

Publication number: CN117422374A
Application number: CN202311392430.8A
Authority: CN
Inventors: 王英军
Original assignee: HUADI COMPUTER GROUP CO Ltd
Current assignee: HUADI COMPUTER GROUP CO Ltd
Priority date: 2023-10-25
Filing date: 2023-10-25
Publication date: 2024-01-19

Abstract

本申请公开了一种基于大数据技术的食堂智能采购方法、电子设备及介质。该方法可以包括：获取原始数据，包括菜品日销售数据，每日天气数据；针对原始数据进行预处理，针对预处理后的数据进行数据特征分析，获得每个特征的贡献占比；构建ARIMA时间序列模型，基于时间相关的数据特征预测第一菜品销量；构建LSTM网络模型，基于除时间之外相关的数据特征预测第二菜品销量；确定第一菜品销量与第二菜品销量的权重，计算最终的预测结果。本发明对菜品食材进行采集和深入分析，同时考虑工作日、周末、节假日、天气、人员信息等外界因素的影响，提取数据特征，构建双模型对食材采购的短期预测，为食堂采购食材提供科学依据。

Description

基于大数据技术的食堂智能采购方法、电子设备及介质

技术领域

本发明涉及采购预测领域，更具体地，涉及一种基于大数据技术的食堂智能采购方法、电子设备及介质。

背景技术

随着感应智能卡技术的广泛应用，食堂取代了纸币、饭票等，实现了刷卡就餐、充值、自动扣费等自动化管理，虽然食堂达到了一定程度的智能化管理，但食堂同时也面临如何节省经营成本，如何精准备餐，如何确保采购的食材有量有节，如何提高用餐人员对菜品的满意等问题。

目前市场上实现食堂精准采购食材的方法有两种：一种是使用订餐或点餐系统来确定精确用餐人数和菜品销售份数。此种方法可以精确到每道菜品每日的销售量，根据预测菜品的销售量，如各种餐饮店等，都通过外卖、点餐等记录具体每份菜品，此种方式对于堂食的食堂无法进行分析预测。另外一种是根据具体人数来确定采购食材数量，如学校、医院、公司、机关单位的食堂由于没有订餐系统，无法知道具体用餐人数，只能根据当前单位的人数进行采购，如果是周六日、节假日、寒暑假等人数不固定，也可能由于天气等因素影响，不能精确地预测菜品食材的采购，造成食材采购过多导致浪费，增加食堂采购成本。

因此，有必要开发一种基于大数据技术的食堂智能采购方法、电子设备及介质。

公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

发明内容

本发明提出了一种基于大数据技术的食堂智能采购方法、电子设备及介质，对菜品食材进行采集和深入分析，同时考虑工作日、周末、节假日、天气、人员信息等外界因素的影响，提取数据特征，构建双模型对食材采购的短期预测，为食堂采购食材提供科学依据。

第一方面，本公开实施例提供了一种基于大数据技术的食堂智能采购方法，包括：

获取原始数据，包括菜品日销售数据，每日天气数据；

针对所述原始数据进行预处理，针对预处理后的数据进行数据特征分析，获得每个特征的贡献占比；

构建ARIMA时间序列模型，基于时间相关的数据特征预测第一菜品销量；

构建LSTM网络模型，基于除时间之外相关的数据特征预测第二菜品销量；

确定所述第一菜品销量与所述第二菜品销量的权重，计算最终的预测结果。

优选地，所述预处理包括去除冗余数据、处理缺失值、数据聚合处理、将非数值型数据转化为数值型数据。

优选地，针对预处理后的数据进行数据特征分析，获得每个特征的贡献占比包括：

所述预处理后的数据由每样菜品的日销售量和天气状况及日期情况组成；

所述数据特征包括日期、菜品ID、星期类型、天气状况、气温、日期属性、销售量；

将上述特征的数据值进行归一化处理，获得每个特征的贡献占比。

优选地，构建ARIMA时间序列模型，基于时间相关的数据特征预测第一菜品销量包括：

从预处理后的数据中随机抽取菜品，根据该菜品的日销售数据，查看时序图是否是平稳序列，根据ADF单位根检验费对菜品日销售量进行平稳性检测，通过构造检验统计量判断序列的平稳性；

若菜品日销售量序列为非平稳序列，则对其进行平稳性处理；

使用信息准则定阶进行时间序列定阶，根据差分序列，通过ARMA模型进行拟合，根据BIC准则得到最优模型；

得到原序列的最优化拟合模型并进行评价，得到最终的ARIMA时间序列模型；

根据最终的ARIMA时间序列模型，基于时间相关的数据特征预测第一菜品销量。

优选地，得到原序列的最优化拟合模型并进行评价包括：

根据QQ图检验残差是否满足正态分布，如果是，则说明数据的均值为0，方差为常数，是一个纯随机序列。

优选地，构建LSTM网络模型，基于除时间之外相关的数据特征预测第二菜品销量包括：

将除时间之外相关的数据特征进行归一化处理后作为特征值输入；

将输入的数据集合分为训练集和测试集，配置LSTM模型的训练参数；

配置完毕后，调用模型训练函数进行训练，将训练后的LSTM网络模型；

根据训练后的LSTM网络模型，采用多序列预测方法进行销量预测。

优选地，根据训练后的LSTM网络模型，采用多序列预测方法进行销量预测包括：

首先将测试数据初始化为一定序列的测试窗口，预测下一天销售量，将预测得到这个销售量加入到创建偶中，生成相同序列长度的新窗口，循环往复，当窗口中数据全部由过去预测点组成停止，再以一个完成窗口长度向前移动，用真实测试数据重置窗口，再重新启动该过程。

优选地，确定所述第一菜品销量与所述第二菜品销量的权重包括：

得到所述ARIMA时间序列模型和所述LSTM网络模型预测的误差方差；

根据误差倒数加权平均法，分别计算所述ARIMA时间序列模型和所述LSTM网络模型的权重；

所述ARIMA时间序列模型的权重即为所述第一菜品销量的权重，所述LSTM网络模型的权重即为所述第二菜品销量的权重。

第二方面，本公开实施例还提供了一种电子设备，该电子设备包括：

存储器，存储有可执行指令；

处理器，所述处理器运行所述存储器中的所述可执行指令，以实现所述的基于大数据技术的食堂智能采购方法。

第三方面，本公开实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现所述的基于大数据技术的食堂智能采购方法。

其有益效果在于：

1.构建ARIMA时间序列和LSTM网络两种方式的组合模型，组合模型基于等权重法和误差倒数法组合的模型，预测精准度更高；

2.除了使用每日菜品销售量来预测外，也加入了外界如天气、季节、温度、节假日等因素，来预测食材采购量，进一步提升模型预测的准确性；

3.通过食材采购、库存等数据分析计算菜品日销售量；

4.根据预测菜品销售量，结合菜品所需食材的消耗量，计算出每种菜品所需食材总消耗，并自动生成采购计划。

本发明的方法和装置具有其它的特性和优点，这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的，或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述，这些附图和具体实施方式共同用于解释本发明的特定原理。

附图说明

通过结合附图对本发明示例性实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显，其中，在本发明示例性实施例中，相同的参考标号通常代表相同部件。

图1示出了根据本发明的一个实施例的基于大数据技术的食堂智能采购方法的步骤的流程图。

具体实施方式

下面将更详细地描述本发明的优选实施方式。虽然以下描述了本发明的优选实施方式，然而应该理解，可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。

为便于理解本发明实施例的方案及其效果，以下给出三个具体应用示例。本领域技术人员应理解，该示例仅为了便于理解本发明，其任何具体细节并非意在以任何方式限制本发明。

实施例1

如图1所示，该基于大数据技术的食堂智能采购方法包括：步骤101，获取原始数据，包括菜品日销售数据，每日天气数据；步骤102，针对原始数据进行预处理，针对预处理后的数据进行数据特征分析，获得每个特征的贡献占比；步骤103，构建ARIMA时间序列模型，基于时间相关的数据特征预测第一菜品销量；步骤104，构建LSTM网络模型，基于除时间之外相关的数据特征预测第二菜品销量；步骤105，确定第一菜品销量与第二菜品销量的权重，计算最终的预测结果。

在一个示例中，预处理包括去除冗余数据、处理缺失值、数据聚合处理、将非数值型数据转化为数值型数据。

在一个示例中，针对预处理后的数据进行数据特征分析，获得每个特征的贡献占比包括：

预处理后的数据由每样菜品的日销售量和天气状况及日期情况组成；

数据特征包括日期、菜品ID、星期类型、天气状况、气温、日期属性、销售量；

在一个示例中，构建ARIMA时间序列模型，基于时间相关的数据特征预测第一菜品销量包括：

在一个示例中，得到原序列的最优化拟合模型并进行评价包括：

在一个示例中，构建LSTM网络模型，基于除时间之外相关的数据特征预测第二菜品销量包括：

在一个示例中，根据训练后的LSTM网络模型，采用多序列预测方法进行销量预测包括：

在一个示例中，确定第一菜品销量与第二菜品销量的权重包括：

得到ARIMA时间序列模型和LSTM网络模型预测的误差方差；

根据误差倒数加权平均法，分别计算ARIMA时间序列模型和LSTM网络模型的权重；

ARIMA时间序列模型的权重即为第一菜品销量的权重，LSTM网络模型的权重即为第二菜品销量的权重。

具体地，本方法基于大数据技术，通过数据挖掘和深度学习，精准的预测每日食材消耗量，实现食堂食材智能采购，自动生成每周或每月的采购计划。通过获取菜品及食材消耗数据，获取每日天气数据，人员基本信息数据；然后对获取的原数据进行清洗、转换、规范等预处理；再对预处理完成的数据按进行特征(按日期、天气、是否节假日、气温等)划分；构建ARIMA时间序列预测模型和LSTM网络预测模型，并对模型进行训练，优化算法；预测未来一周每日的菜品及菜品的销售量；最后根据每份菜品所需要食材以及库存，智能计算出每日或每周食材总采购量，自动生成采购计划和采购订单。

首先获取原始数据包括菜品日销售数据，每日天气数据。菜品日销售数据是从食堂的食材采购订单或订餐系统获取菜品销售量获得，对原始数据进行初步处理，并以天为单位根据菜品ID统计每个菜品的日销售量，初步处理后的数据信息包括：日期、菜品ID、菜品名称、菜品数量等；从食堂刷卡系统得到具体每日的用餐人数。由于天气原因也会对人们的饮食造成影响，所以通过气象信息查询网站收集当地地区前几年每天的气温、雨雪等天气数据。天气的各项数据包括日期、平均温度、天气状况等信息。日期属性数据，得到日期的属性数据工作日、法定节假日、双休日、非法定节假日等。

采集了食堂原始采购数据或订单数据、天气气象数据、人员基本信息数据及日期属性数据，这些数据中不可避免存在一些缺失值、重复值、无效值等异常数据，这些异常数据可能会严重影响模型的运行效率和预测效果的准确性，因此在使用数据之前，需要对采集的数据进行必要的预处理。主要数据预处理工作有以下方面：

(1)去除冗余数据

去掉数据中与业务需求无关的属性，如订单数据的订单ID，订单号，人员ID等，在采购预测中并不会使用到，删除这些数据的属性。

(2)处理缺失值

由于菜品可能存在长期停售或仅一段时间有销售量，数据不充足，仅仅采用历史销量数据无法对其销量进行预测和精准建模，因此将此菜品从预测菜品中移除。

(3)数据聚合处理

预测菜品日消耗领，并进行智能采购，因此对原始的菜品进行聚合处理，将根据食材的采购订单结合每天的用餐人数、库存计算出每个菜品的销售量，具体以天为最小粒度进行统计。

(4)数据转换

对非数值型数据进行转化为数值型的数据，比如把工作日、周末、法定节假日、非法定节假日等转换为1、2、3、4；把晴天、多云、小雨、大雪等天气状况转换为1、2、3、4。

对预处理完成的数据进行特征分析，数据由每样菜品的日销售量和天气状况及日期情况两部分组成。每日数据包括日期、菜品ID、星期类型、天气状况、气温、日期属性(工作日、法定节假日、非法定节假日、周末)、销售量等特性，然后对数据进行归一化处理，将数据统一映射到[0，1]区间内容，让各个特征对结果做出贡献相同，使不同维度的特征在数值上有一定比较性，采用最常用的归一化方法min-max标准化进行处理。由于不同的特证具有不同的量纲，使得特征在数值上不可比较，无法直接比较它们的大小，通过归一化，可以将不同特征的数值统一映射到一个相同的范围，使得在比较特征时具有可比性；在模型训练过程中对每个特征分配一个权重，表示特征对结果的重要性，通过归一化，可以保证每个特征的取值范围在一个相同的范围内，使得每个特征对结果的贡献均衡，即使不同维度上也可以进行比较。所以归一化后的特征可以在模型训练过程中对结果做出相同的贡献，从而确认每个特征的重要程度相对均衡，提高模型的性能和稳定性。

首先使用ARIMA时间序列构建模型，拟合每种菜品销售样本数据规律，对模型进行验证，选取最优的模型，对未来数据进行预测，得到预测值，其次构建LSTM网络模型，对除时间因素外影响菜品销售的相关因素进行分析，对网络进行设计，映射出多个输入变量与每种菜品销售量之间关系，训练网络模型对未来菜品销售进行预测，得到预测值。

ARIAM时间序列模型建模步骤：

1)平稳性检验

首先，从预处理后的数据中随机抽取菜品，根据一段时间该菜品的日销售数据，查看时序图是否是平稳序列(如果是平稳序列的时序图表现出序列值始终围绕一个常数上下波动，且波动范围有界的特征)。如果序列时序图具有明显递增或递减的趋势性或周期性，那么该序列通常不是平稳时间序列。

然后，根据ADF单位根检验对菜品日销售量进行平稳性检测，通过构造检验统计量判断序列的平稳性。ADF单位根检验可以判断时间序列数据是否存在单位根，从而判断数据是否平稳。ADF单位根检验通过以下指标确定该序列是否平稳：

①1％、％5、％10不同程度拒绝原假设的统计值和ADF t检验统计量的比较，ADF t检验统计量同时小于1％、5％、10％即说明非常好地拒绝该假设；

②P-value是否非常接近0。

2)平滑处理

通过对菜品日销售序列时序图以及ADF单位根检验后，如果该菜品日销售量序列为非平稳序列，因此需要对其进行平稳性处理。要用差分法和平滑法(滚动平均和滚动标准差)来实现序列的平稳性操作。一般情况下，对时间序列进行一阶差分法就可以实现序列的平稳性，有时需要二阶差分。根据差分序列检查是否不具有趋势特征，且其序列值在均值附件上下波动，波动问题，初步判断为差分序列为平稳序列。然后对差分序列进行ADF单位根校验，再次确认是平稳序列，符合平稳序列特征。最后，为了检验平稳序列包含相关信息，需要进一步对差分序列进行随机性检验(白噪声检验)，对任意延迟阶数，检验统计量的P值小于显著性水平(0.05)，则可以在95％的概率水平下，能拒绝差分序列为纯随机性序列的原假设，即差分序列为非纯随机时间序列。

3)时间序列定阶

使用信息准则定阶(BIC)，进行时间序列定阶，根据差分序列，选用ARMA(p,q)模型进行拟合，p为自回归项数，q为滑动平均项数。自回归模型AR(p)是当前销售量与历史之间关系，用历史时间数据对自身进行预测，确定一个阶数p，表示用几期的历史销量开预测当前值；移动平均模型MA(q)自回归模型中的误差项的累加，移动平均法能有效地消除预测中的随机波动，确定一个q，表示有多少项误差值，其p值、q值存在多种组合。评估ARMA(p,q)模型的性能，根据BIC准则，找到最小的值，得到最优模型ARMA(p，q)。

4)模型构建

根据时间序列定阶后，得到原序列的最优化拟合模型ARIMA(p，几阶分差，q)。构建模型并激活，得到模型报告。

5)模型评价

根据QQ图检验残差是否满足正态分布，通过QQ图可以看数据是否均匀的落在直线的周围，如果是，则说明数据服从正态分布：均值为0，方差为常数，是一个纯随机序列。

6)模型预测

使用构建好的ARIMA模型对未来一周或一个月该菜品的日销售量进行预测。

LSTM网络模型建模步骤：

由于仅仅通过时间和历史销售数据的对应关系不能充分得到菜品销售的发展规律，影响菜品销量的因素包括气象因素、节假日、气温、男女等因素，并对上述数据进行采集和处理。

1)数据归一化处理

由于平均气温、气象、是否节假日和销售量等参数同时作为特征值输入，取值范围相差较大，需避免数值过大的销售率量对预测结果的影响过大，需要进行归一化处理，将数据的范围处理并控制在0到1之间。

2)数据分类

开始训练前，将数据集合换分为训练集和测试集，训练集合占80％，测试集占20％。

3)LSTM网络模型训练

选取天气、平均气温、是否节假日以及销售量)作为特征数据输入，配置LSTM模型的训练参数。配置完毕后，调用模型训练函数。训练完后，将训练好的模型存入文件夹中，使用时可直接加载文件夹中保存的模型文件，节省训练模型的时间。

4)模型预测

采用多序列预测方法进行销量预测，并将预测结果进行存储。首先将测试数据初始化为一定序列的测试窗口，预测下一天销售量，将预测得到这个销售量加入到创建偶中，生成相同序列长度的新窗口，循环往复，当窗口中数据全部由过去预测点组成停止，再以一个完成窗口长度向前移动，用真实测试数据重置窗口，再重新启动该过程。

相比完全序列预测，多序列预测避免了一直使用过去的错误预测结果进行下一步预测，可以有效提高预测准确率。

5)数据评估

最后再将输出数据反归一化，计算评价指标是均方误差(MSE)，在给定的预测次数内，预测值与真实值的误差平方和的均值，MSE越小，说明预测值与真实值越接近，预测的效果越好。

6)参数优化

运用控制变量法，对不同参数选取适当的取值范围，在训练的过程中不断调整参数，直至模型的预测效果最佳。调整参数：模型的节点个数、迭代次数epoch以及batchsize，得到参数组合中的最优值。

建立两个模型后，进行组合模型权重判定，根据ARIMA时间序列模型和LSTM网络模型的预测性能和效果分别赋予不同的权重，来分析菜品销售规律的线性和非线性特征，完成组合预测模型的构建，输出组合模型的预测结果作为最终的预测结果。

使用平均绝对百分比误差(MAPE)作为误差倒数加权平均法中的误差指标。首先得到ARIMA模型和LSTM网络模型预测的误差方差，然后根据误差倒数加权平均法的计算公式，分别计算出ARIMA时间序列模型和LSTM网络模型的权重。然后根据权重，得到预测模型的预测结果及对应的MAPE。使用MAPE构建ARIMA-LSTM组合预测模型，并将组合预测模型的预测记过作为最终预测结果。

根据组合预测模型，进行每样菜品销售量的预测出未来一周的菜品销售量。再根据每份菜品所需要的食材，统计出未来一周食材的总采购量，并按每天或每周生成采购计划，自动提交给食堂管理系统。

本方法定位于利用大数据相关技术，整合食堂食材采购订单、食堂一卡通、库存等，结合天气、日期属性、人员基本信息等辅助信息，通过数据挖掘和深度学习，预测未来一周所需要的食材，并自动制定合理和准确的食材采购计划，有利于优化食材库存，保证食材的新鲜度，控制食堂的采购成本和存储成本，避免食材浪费。

实施例2

本公开提供一种电子设备包括，该电子设备包括：存储器，存储有可执行指令；处理器，处理器运行存储器中的可执行指令，以实现上述基于大数据技术的食堂智能采购方法。

根据本公开实施例的电子设备包括存储器和处理器。

该存储器用于存储非暂时性计算机可读指令。具体地，存储器可以包括一个或多个计算机程序产品，该计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。

该处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中，该处理器用于运行该存储器中存储的该计算机可读指令。

本领域技术人员应能理解，为了解决如何获得良好用户体验效果的技术问题，本实施例中也可以包括诸如通信总线、接口等公知的结构，这些公知的结构也应包含在本公开的保护范围之内。

有关本实施例的详细说明可以参考前述各实施例中的相应说明，在此不再赘述。

实施例3

本公开实施例提供一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现所述的基于大数据技术的食堂智能采购方法。

根据本公开实施例的计算机可读存储介质，其上存储有非暂时性计算机可读指令。当该非暂时性计算机可读指令由处理器运行时，执行前述的本公开各实施例方法的全部或部分步骤。

上述计算机可读存储介质包括但不限于：光存储介质(例如：CD－ROM和DVD)、磁光存储介质(例如：MO)、磁存储介质(例如：磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如：存储卡)和具有内置ROM的媒体(例如：ROM盒)。

本领域技术人员应理解，上面对本发明的实施例的描述的目的仅为了示例性地说明本发明的实施例的有益效果，并不意在将本发明的实施例限制于所给出的任何示例。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

Claims

1.一种基于大数据技术的食堂智能采购方法，其特征在于，包括：

获取原始数据，包括菜品日销售数据，每日天气数据；

2.根据权利要求1所述的基于大数据技术的食堂智能采购方法，其中，所述预处理包括去除冗余数据、处理缺失值、数据聚合处理、将非数值型数据转化为数值型数据。

3.根据权利要求1所述的基于大数据技术的食堂智能采购方法，其中，针对预处理后的数据进行数据特征分析，获得每个特征的贡献占比包括：

4.根据权利要求1所述的基于大数据技术的食堂智能采购方法，其中，构建ARIMA时间序列模型，基于时间相关的数据特征预测第一菜品销量包括：

5.根据权利要求4所述的基于大数据技术的食堂智能采购方法，其中，得到原序列的最优化拟合模型并进行评价包括：

6.根据权利要求1所述的基于大数据技术的食堂智能采购方法，其中，构建LSTM网络模型，基于除时间之外相关的数据特征预测第二菜品销量包括：

7.根据权利要求6所述的基于大数据技术的食堂智能采购方法，其中，根据训练后的LSTM网络模型，采用多序列预测方法进行销量预测包括：

8.根据权利要求1所述的基于大数据技术的食堂智能采购方法，其中，确定所述第一菜品销量与所述第二菜品销量的权重包括：

9.一种电子设备，其特征在于，所述电子设备包括：

存储器，存储有可执行指令；

处理器，所述处理器运行所述存储器中的所述可执行指令，以实现权利要求1-8中任一项所述的基于大数据技术的食堂智能采购方法。

10.一种计算机可读存储介质，其特征在于，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现权利要求1-8中任一项所述的基于大数据技术的食堂智能采购方法。