CN117035848A - 一种即开型彩票销量预测方法、装置、设备及介质 - Google Patents
一种即开型彩票销量预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117035848A CN117035848A CN202311302193.1A CN202311302193A CN117035848A CN 117035848 A CN117035848 A CN 117035848A CN 202311302193 A CN202311302193 A CN 202311302193A CN 117035848 A CN117035848 A CN 117035848A
- Authority
- CN
- China
- Prior art keywords
- data
- lottery sales
- sales
- arima
- lottery
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims abstract description 91
- 238000012549 training Methods 0.000 claims abstract description 75
- 238000012795 verification Methods 0.000 claims abstract description 64
- 238000004140 cleaning Methods 0.000 claims abstract description 20
- 238000010606 normalization Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000010586 diagram Methods 0.000 claims description 17
- 230000001932 seasonal effect Effects 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 5
- 238000010187 selection method Methods 0.000 claims description 5
- 238000010200 validation analysis Methods 0.000 abstract 1
- 230000003068 static effect Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种即开型彩票销量预测方法、装置、设备及介质,属于彩票销量预测技术领域,所述方法步骤:采集各门店设定时间段内的彩票销量数据并进行清洗;搭建ARIMA销量预测模型,为ARIMA销量预测模型进行特征选择及阶数确定,并为选择特征进行归一化处理;将选择特征对应彩票销量数据作为数据集,将数据集划分为训练子集和验证子集,使用训练子集对ARIMA销量预测模型进行训练,并使用验证子集对ARIMA销量预测模型进行验证;基于当前彩票销量数据并使用验证通过ARIMA销量预测模型进行彩票销量预测。本发明通过ARIMA模型并基于历史数据实现彩票销量的短时预测,且预测精度高,准确掌握彩票市场需求和趋势。
Description
技术领域
本发明属于彩票销量预测技术领域,具体涉及一种即开型彩票销量预测方法、装置、设备及介质。
背景技术
即开型彩票是购买者在购票后立即就可了解其中奖与否,并可当即兑奖的彩票。因为无需等待开奖的快节奏形式,即开型彩票一出现便得到迅速发展。
迅速发展的即开型彩票对彩票企业的要求非常高,需要市场能够生产出满足市场需求的彩票量,而又不至于出现大量过剩彩票,这就需要彩票企业能够预测出准确的彩票销量。而准确掌握彩票的销量不仅可以帮助企业制定生产计划,避免库存积压和供应不足的问题,实现提高生产和供应链效率的目的,还有助于企业优化营销策略和销售目标,在提前预知彩票市场需求和趋势,更好的满足消费者的需求,以获得竞争优势。
传统的彩票销量仅能使用简单的统计图表,以折线图或柱形图展示历史走势,对于彩票销量预测一种是依赖于经验判断或主观猜测,缺乏科学性和准确性,容易受限于个人经验、主观因素和感觉,导致预测结果有偏差;还有一种是依赖于历史数据的单纯罗列,而且模型相对比较简单,忽略多种因素对于销量的影响,且通常是基于固定的周期或者静态的模型进行的,具有一定的滞后性。
因此,针对上述缺陷,提供一种即开型彩票销量预测方法、装置、设备及介质,是非常有必要的。
发明内容
针对上述传统的彩票销量仅能使用简单的统计图表,以折线图或柱形图展示历史走势,对于彩票销量预测一种是依赖于经验判断或主观猜测,导致预测结果有偏差;还有一种是依赖于历史数据的单纯罗列,而且模型相对比较简单,忽略多种因素对于销量的影响,且通常是基于固定的周期或者静态的模型进行的,具有一定的滞后性的缺陷,本发明提供一种即开型彩票销量预测方法、装置、设备及介质,以解决上述技术问题。
第一方面,本发明提供一种即开型彩票销量预测方法,包括如下步骤:
S1.采集各门店设定时间段内的彩票销量数据,并对彩票销量数据进行清洗;
S2.搭建ARIMA销量预测模型,为ARIMA销量预测模型进行特征选择及阶数确定,并为选择特征进行归一化处理;
S3.将选择特征对应彩票销量数据作为数据集,将数据集划分为训练子集和验证子集,使用训练子集对ARIMA销量预测模型进行训练,并使用验证子集对ARIMA销量预测模型进行验证;
S4.基于当前彩票销量数据并使用验证通过ARIMA销量预测模型进行彩票销量预测。
进一步地,步骤S1具体步骤如下:
S11.采集各门店设定时间段内的彩票销量数据;
S12.对采集的彩票销量数据按照设定时间周期进行统计;
S13.根据设定时间周期的统计规律识别彩票销量数据的异常值或对设定时间周期内彩票销量数据取均值,完成数据清洗。
进一步地,步骤S2具体步骤如下:
S21.将采集的彩票销量数据作为基础彩票销量数据,使用基础彩票销量数据计算辅助彩票销量数据,并基于辅助彩票销量数据为用户添加标签;
S22.将各门店的基础彩票销量数据与辅助彩票销量数据合并生成扩展彩票销量数据,基于扩展彩票销量数据并按照设定时间周期绘制特征相关性关联图及热力图;
S23.根据贝叶斯信息准则进行ARIMA销量预测模型的阶数确定;
S24.基于各特征间的相关性关联图和热力图为ARIMA销量预测模型进行扩展彩票销量数据的特征选择;
S25.利用区间选择法为选择的特征进行时间序列划分;
S26.利用季节性指数平滑方法将季节性特征代入ARIMA销量预测模型;
S27.对选择特征进行归一化处理,使得处理后选择特征服从正态分布。
进一步地,步骤S25具体步骤如下:
S251.预先为时间序列划分N个档位,并设定N个阈值,其中,N为整数;
S252.将小于最低阈值的扩展彩票销量数据作为最低区间,将大于最大阈值的扩展彩票销量数据作为最高区间,以及将相邻两个阈值之间的扩展彩票销量数据均作为一个区间,则共有N个区间;
S253.对选择的特征对应的每个扩展彩票销量数据进行定位;
S254.对定位扩展彩票销量数据所属区间进行确定,完成选择特征对应扩展彩票销量数据的时间序列划分。
进一步地,步骤S3具体步骤如下:
S31.将完成时间序列划分的选择特征对应扩展彩票销量数据作为数据集,基于用户标签对数据集进行标注;
S32.按照设定比例将数据集划分为训练子集和验证子集,其中,训练子集取时间序列后端的彩票销量数据,而验证子集取时间序列前端的彩票销量数据;
S33.使用训练子集对ARIMA销量预测模型进行训练,确定ARIMA销量预测模型的参数;
S34.使用验证子集对ARIMA销量预测模型的预测效果进行验证,将验证子集与训练子集进行拟合,判断拟合误差是否小于设定阈值;
若是,进入步骤S36;
若否,进入步骤S35;
S35.调整ARIMA销量预测模型的参数,返回步骤S33;
S36.输出验证通过的ARIMA销量预测模型。
进一步地,步骤S32具体步骤如下:
S321.将数据集按照时间序列划分为设定数量的组;
S322.将每个组中彩票销量数据按照设定比例划分为训练序列和验证序列,其中,验证序列取组中前端的销量数据,而训练序列取组中后端的彩票销量数据;
S323.将各组的训练序列形成训练子集,将各组的验证序列形成验证子集,最终形成交叉的训练子集与验证子集;
步骤S34中使用同组的样子序列对训练序列进行拟合,验证ARIMA销量预测模型的预测效果。
进一步地,步骤S4具体步骤如下:
S41.获取距离当前时间最近的设定时间段内的彩票销量数据;
S42.将获取的彩票销量数据进行特征选择及归一化处理后,输入验证通过的ARIMA销量预测模型,进行彩票销量预测。
第二方面,本发明提供一种即开型彩票销量预测装置,包括:
彩票销量数据采集及清洗模块,用于采集各门店设定时间段内的彩票销量数据,并对彩票销量数据进行清洗;
模型搭建及特征选择模块,用于搭建ARIMA销量预测模型,为ARIMA销量预测模型进行特征选择及阶数确定,并为选择特征进行归一化处理;
模型训练及验证模块,用于将选择特征对应彩票销量数据作为数据集,将数据集划分为训练子集和验证子集,使用训练子集对ARIMA销量预测模型进行训练,并使用验证子集对ARIMA销量预测模型进行验证;
彩票销量预测模块,用于基于当前彩票销量数据并使用验证通过ARIMA销量预测模型进行彩票销量预测。
进一步地,彩票销量数据采集及清洗模块包括:
数据采集单元,用于采集各门店设定时间段内的彩票销量数据;
数据统计单元,用于对采集的彩票销量数据按照设定时间周期进行统计;
数据清洗单元,用于根据设定时间周期的统计规律识别彩票销量数据的异常值或对设定时间周期内彩票销量数据取均值,完成数据清洗。
进一步地,模型搭建及特征选择模块包括:
辅助彩票销量数据计算单元,用于将采集的彩票销量数据作为基础彩票销量数据,使用基础彩票销量数据计算辅助彩票销量数据,并基于辅助彩票销量数据为用户添加标签;
数据关联性图绘制单元,用于将各门店的基础彩票销量数据与辅助彩票销量数据合并生成扩展彩票销量数据,基于扩展彩票销量数据并按照设定时间周期绘制特征相关性关联图及热力图;
模型阶数确定单元,用于根据贝叶斯信息准则进行ARIMA销量预测模型的阶数确定;
模型特征选择单元,用于基于各特征间的相关性关联图和热力图为ARIMA销量预测模型进行扩展彩票销量数据的特征选择;
时间序列划分单元,用于利用区间选择法为选择的特征进行时间序列划分;
季节性特征代入单元,用于利用季节性指数平滑方法将季节性特征代入ARIMA销量预测模型;
特征归一化处理单元,用于对选择特征进行归一化处理,使得处理后选择特征服从正态分布。
进一步地,模型训练及验证模块包括:
数据集设定单元,用于将完成时间序列划分的选择特征对应扩展彩票销量数据作为数据集,基于用户标签对数据集进行标注;
训练集及测试集划分单元,用于按照设定比例将数据集划分为训练子集和验证子集,其中,训练子集取时间序列后端的彩票销量数据,而验证子集取时间序列前端的彩票销量数据;
模型训练单元,用于使用训练子集对ARIMA销量预测模型进行训练,确定ARIMA销量预测模型的参数;
模型验证单元,用于使用验证子集对ARIMA销量预测模型的预测效果进行验证,将验证子集与训练子集进行拟合,判断拟合误差是否小于设定阈值;
模型参数调整单元,用于拟合误差大于等于设定阈值时,调整ARIMA销量预测模型的参数;
模型输出单元,用于拟合误差小于设定阈值时,输出验证通过的ARIMA销量预测模型。
进一步地,彩票销量预测模块包括:
历史数据选择单元,用于获取距离当前时间最近的设定时间段内的彩票销量数据;
彩票销量预测单元,用于将获取的彩票销量数据进行特征选择及归一化处理后,输入验证通过的ARIMA销量预测模型,进行彩票销量预测。
第三方面,本发明提供一种计算机设备,包括处理器和存储器;
其中,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得计算机设备执行上述第一方面所述的方法。
第四方面,本发明提供了一种存储介质,
所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。
本发明的有益效果在于:
本发明提供的即开型彩票销量预测方法、装置、设备及介质,通过ARIMA模型并基于历史数据实现彩票销量的短时预测,且预测精度高,准确掌握彩票市场需求和趋势。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明即开型彩票销量预测方法一个实施例的流程示意图。
图2是本发明即开型彩票销量预测方法另一个实施例的流程示意图。
图3是本发明即开型彩票销量预测装置示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例1:
针对传统的彩票销量仅能使用简单的统计图表,以折线图或柱形图展示历史走势,对于彩票销量预测一种是依赖于经验判断或主观猜测,导致预测结果有偏差;还有一种是依赖于历史数据的单纯罗列,而且模型相对比较简单,忽略多种因素对于销量的影响,且通常是基于固定的周期或者静态的模型进行的,具有一定的滞后性的问题,如图1所示,本发明提供一种即开型彩票销量预测方法,包括如下步骤:
S1.采集各门店设定时间段内的彩票销量数据,并对彩票销量数据进行清洗;
S2.搭建ARIMA销量预测模型,为ARIMA销量预测模型进行特征选择及阶数确定,并为选择特征进行归一化处理;
S3.将选择特征对应彩票销量数据作为数据集,将数据集划分为训练子集和验证子集,使用训练子集对ARIMA销量预测模型进行训练,并使用验证子集对ARIMA销量预测模型进行验证;
S4.基于当前彩票销量数据并使用验证通过ARIMA销量预测模型进行彩票销量预测。
实施例2:
针对传统的彩票销量仅能使用简单的统计图表,以折线图或柱形图展示历史走势,对于彩票销量预测一种是依赖于经验判断或主观猜测,导致预测结果有偏差;还有一种是依赖于历史数据的单纯罗列,而且模型相对比较简单,忽略多种因素对于销量的影响,且通常是基于固定的周期或者静态的模型进行的,具有一定的滞后性的问题,如图2所示,本发明提供一种即开型彩票销量预测方法,包括如下步骤:
S1.采集各门店设定时间段内的彩票销量数据,并对彩票销量数据进行清洗;步骤S1具体步骤如下:
S11.采集各门店设定时间段内的彩票销量数据;
S12.对采集的彩票销量数据按照设定时间周期进行统计;例如对近两个月的彩票销售激活量、确认量、兑奖量、订单订购包数、订购金额、下单时间段、票种数量、面值数量、库存值等彩票销量数据按天统计;
S13.根据设定时间周期的统计规律识别彩票销量数据的异常值或对设定时间周期内彩票销量数据取均值,完成数据清洗;对某一天彩票销量数据的异常值删除或取均值;
S2.搭建ARIMA销量预测模型,为ARIMA销量预测模型进行特征选择及阶数确定,并为选择特征进行归一化处理;步骤S2具体步骤如下:
S21.将采集的彩票销量数据作为基础彩票销量数据,使用基础彩票销量数据计算辅助彩票销量数据,并基于辅助彩票销量数据为用户添加标签;将彩票销售激活量、确认量、兑奖量、订单订购包数、订购金额作为基础彩票销量数据,而将彩票销售的RFM模型值、活跃度、参与意向值、门店状态数量及门店占比等维度的数据作为辅助彩票销量数据,其中,RFM模型值包括最近一次消费、消费频率及消费金额;标签内容可动态调整;
S22.将各门店的基础彩票销量数据与辅助彩票销量数据合并生成扩展彩票销量数据,基于扩展彩票销量数据并按照设定时间周期绘制特征相关性关联图及热力图;将所有各门店的所有可选维度彩票销量数据,按照日期绘制相关性关联图、热力图;
S23.根据如下贝叶斯信息准则进行ARIMA销量预测模型的阶数确定;
BIC = -2 * log-likelihood + k * log(N)
其中,log-likelihood 是模型的对数似然函数值,k 是模型的参数个数,N 是作为样本大小的彩票销量数据个数;
通过比较不同阶数的ARIMA模型的BIC值,可以选择最优的模型;
S24.基于各特征间的相关性关联图和热力图为ARIMA销量预测模型进行扩展彩票销量数据的特征选择;相关性关联图及热力图用于后续筛选特征,得到合适的特征维度;
S25.利用区间选择法为选择的特征进行时间序列划分;步骤S25具体步骤如下:
S251.预先为时间序列划分N个档位,并设定N个阈值,其中,N为整数;
S252.将小于最低阈值的扩展彩票销量数据作为最低区间,将大于最大阈值的扩展彩票销量数据作为最高区间,以及将相邻两个阈值之间的扩展彩票销量数据均作为一个区间,则共有N个区间;
S253.对选择的特征对应的每个扩展彩票销量数据进行定位;
S254.对定位扩展彩票销量数据所属区间进行确定,完成选择特征对应扩展彩票销量数据的时间序列划分;
例如,将彩票销量数据划分为三个档位,分别为低档Low、中档Medium和高档High;定义三个阈值 threshold1、threshold2和threshold3;
可以使用分段函数来表示,记为 f(x):
f(x) = {
Low, if x<= threshold1,
Medium, if threshold1<x<= threshold2,
High, if threshold2<x<= threshold3,
High, if x>threshold3
}
其中,x表示彩票销量数据的值,threshold1、threshold2和threshold3分别表示阈值;
S26.利用季节性指数平滑方法将季节性特征代入ARIMA销量预测模型;季节性指数平滑公式如下:
Y_t = (L_t-1 + T_t-1) * S_t-m;
其中,Y_t是观测值,L_t是水平level值,T_t是趋势trend值,S_t是季节性seasonality值,m是季节周期;
S27.对选择特征进行归一化处理,使得处理后选择特征服从正态分布;归一化处理是将各个维度的数据进行统一,消除数据之间的差异,使得各个维度之间具有可比性;
S3.将选择特征对应彩票销量数据作为数据集,将数据集划分为训练子集和验证子集,使用训练子集对ARIMA销量预测模型进行训练,并使用验证子集对ARIMA销量预测模型进行验证;步骤S3具体步骤如下:
S31.将完成时间序列划分的选择特征对应扩展彩票销量数据作为数据集,基于用户标签对数据集进行标注;
S32.按照设定比例将数据集划分为训练子集和验证子集,其中,训练子集取时间序列后端的彩票销量数据,而验证子集取时间序列前端的彩票销量数据;步骤S32具体步骤如下:
S321.将数据集按照时间序列划分为设定数量的组;
S322.将每个组中彩票销量数据按照设定比例划分为训练序列和验证序列,其中,验证序列取组中前端的销量数据,而训练序列取组中后端的彩票销量数据;
S323.将各组的训练序列形成训练子集,将各组的验证序列形成验证子集,最终形成交叉的训练子集与验证子集;
S33.使用训练子集对ARIMA销量预测模型进行训练,确定ARIMA销量预测模型的参数;
S34.使用验证子集对ARIMA销量预测模型的预测效果进行验证,将验证子集与训练子集进行拟合,判断拟合误差是否小于设定阈值;
若是,进入步骤S36;
若否,进入步骤S35;
使用同组的样子序列对训练序列进行拟合,验证ARIMA销量预测模型的预测效果;
S35.调整ARIMA销量预测模型的参数,返回步骤S33;
S36.输出验证通过的ARIMA销量预测模型;
S4.基于当前彩票销量数据并使用验证通过ARIMA销量预测模型进行彩票销量预测;步骤S4具体步骤如下:
S41.获取距离当前时间最近的设定时间段内的彩票销量数据;
S42.将获取的彩票销量数据进行特征选择及归一化处理后,输入验证通过的ARIMA销量预测模型,进行彩票销量预测。
实施例3:
针对传统的彩票销量仅能使用简单的统计图表,以折线图或柱形图展示历史走势,对于彩票销量预测一种是依赖于经验判断或主观猜测,导致预测结果有偏差;还有一种是依赖于历史数据的单纯罗列,而且模型相对比较简单,忽略多种因素对于销量的影响,且通常是基于固定的周期或者静态的模型进行的,具有一定的滞后性的问题,如图3所示,本发明提供一种即开型彩票销量预测装置,包括:
彩票销量数据采集及清洗模块,用于采集各门店设定时间段内的彩票销量数据,并对彩票销量数据进行清洗;彩票销量数据采集及清洗模块包括:
数据采集单元,用于采集各门店设定时间段内的彩票销量数据;
数据统计单元,用于对采集的彩票销量数据按照设定时间周期进行统计;
数据清洗单元,用于根据设定时间周期的统计规律识别彩票销量数据的异常值或对设定时间周期内彩票销量数据取均值,完成数据清洗;
模型搭建及特征选择模块,用于搭建ARIMA销量预测模型,为ARIMA销量预测模型进行特征选择及阶数确定,并为选择特征进行归一化处理;模型搭建及特征选择模块包括:
辅助彩票销量数据计算单元,用于将采集的彩票销量数据作为基础彩票销量数据,使用基础彩票销量数据计算辅助彩票销量数据,并基于辅助彩票销量数据为用户添加标签;
数据关联性图绘制单元,用于将各门店的与辅助彩票销量数据合并生成扩展彩票销量数据,基于扩展彩票销量数据并基础彩票销量数据按照设定时间周期绘制特征相关性关联图及热力图;
模型阶数确定单元,用于根据贝叶斯信息准则进行ARIMA销量预测模型的阶数确定;
模型特征选择单元,用于基于各特征间的相关性关联图和热力图为ARIMA销量预测模型进行扩展彩票销量数据的特征选择;
时间序列划分单元,用于利用区间选择法为选择的特征进行时间序列划分;
季节性特征代入单元,用于利用季节性指数平滑方法将季节性特征代入ARIMA销量预测模型;
特征归一化处理单元,用于对选择特征进行归一化处理,使得处理后选择特征服从正态分布;
模型训练及验证模块,用于将选择特征对应彩票销量数据作为数据集,将数据集划分为训练子集和验证子集,使用训练子集对ARIMA销量预测模型进行训练,并使用验证子集对ARIMA销量预测模型进行验证;模型训练及验证模块包括:
数据集设定单元,用于将完成时间序列划分的选择特征对应扩展彩票销量数据作为数据集,基于用户标签对数据集进行标注;
训练集及测试集划分单元,用于按照设定比例将数据集划分为训练子集和验证子集,其中,训练子集取时间序列后端的彩票销量数据,而验证子集取时间序列前端的彩票销量数据;
模型训练单元,用于使用训练子集对ARIMA销量预测模型进行训练,确定ARIMA销量预测模型的参数;
模型验证单元,用于使用验证子集对ARIMA销量预测模型的预测效果进行验证,将验证子集与训练子集进行拟合,判断拟合误差是否小于设定阈值;
模型参数调整单元,用于拟合误差大于等于设定阈值时,调整ARIMA销量预测模型的参数;
模型输出单元,用于拟合误差小于设定阈值时,输出验证通过的ARIMA销量预测模型;
彩票销量预测模块,用于基于当前彩票销量数据并使用验证通过ARIMA销量预测模型进行彩票销量预测;彩票销量预测模块包括:
历史数据选择单元,用于获取距离当前时间最近的设定时间段内的彩票销量数据;
彩票销量预测单元,用于将获取的彩票销量数据进行特征选择及归一化处理后,输入验证通过的ARIMA销量预测模型,进行彩票销量预测。
实施例4:
本发明提供一种计算机设备,包括处理器和存储器;
其中,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得计算机设备执行上述实施例1或实施例2所述的方法。
实施例5:
本发明提供一种存储介质,
所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例1或实施例2所述的方法。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种即开型彩票销量预测方法,其特征在于,包括如下步骤:
S1.采集各门店设定时间段内的彩票销量数据,并对彩票销量数据进行清洗;
S2.搭建ARIMA销量预测模型,为ARIMA销量预测模型进行特征选择及阶数确定,并为选择特征进行归一化处理;
S3.将选择特征对应彩票销量数据作为数据集,将数据集划分为训练子集和验证子集,使用训练子集对ARIMA销量预测模型进行训练,并使用验证子集对ARIMA销量预测模型进行验证;
S4.基于当前彩票销量数据并使用验证通过ARIMA销量预测模型进行彩票销量预测。
2.如权利要求1所述的即开型彩票销量预测方法,其特征在于,步骤S1具体步骤如下:
S11.采集各门店设定时间段内的彩票销量数据;
S12.对采集的彩票销量数据按照设定时间周期进行统计;
S13.根据设定时间周期的统计规律识别彩票销量数据的异常值或对设定时间周期内彩票销量数据取均值,完成数据清洗。
3.如权利要求1所述的即开型彩票销量预测方法,其特征在于,步骤S2具体步骤如下:
S21.将采集的彩票销量数据作为基础彩票销量数据,使用基础彩票销量数据计算辅助彩票销量数据,并基于辅助彩票销量数据为用户添加标签;
S22.将各门店的基础彩票销量数据与辅助彩票销量数据合并生成扩展彩票销量数据,基于扩展彩票销量数据并按照设定时间周期绘制特征相关性关联图及热力图;
S23.根据贝叶斯信息准则进行ARIMA销量预测模型的阶数确定;
S24.基于各特征间的相关性关联图和热力图为ARIMA销量预测模型进行扩展彩票销量数据的特征选择;
S25.利用区间选择法为选择的特征进行时间序列划分;
S26.利用季节性指数平滑方法将季节性特征代入ARIMA销量预测模型;
S27.对选择特征进行归一化处理,使得处理后选择特征服从正态分布。
4.如权利要求3所述的即开型彩票销量预测方法,其特征在于,步骤S25具体步骤如下:
S251.预先为时间序列划分N个档位,并设定N个阈值,其中,N为整数;
S252.将小于最低阈值的扩展彩票销量数据作为最低区间,将大于最大阈值的扩展彩票销量数据作为最高区间,以及将相邻两个阈值之间的扩展彩票销量数据均作为一个区间,则共有N个区间;
S253.对选择的特征对应的每个扩展彩票销量数据进行定位;
S254.对定位扩展彩票销量数据所属区间进行确定,完成选择特征对应扩展彩票销量数据的时间序列划分。
5.如权利要求3所述的即开型彩票销量预测方法,其特征在于,步骤S3具体步骤如下:
S31.将完成时间序列划分的选择特征对应扩展彩票销量数据作为数据集,基于用户标签对数据集进行标注;
S32.按照设定比例将数据集划分为训练子集和验证子集,其中,训练子集取时间序列后端的彩票销量数据,而验证子集取时间序列前端的彩票销量数据;
S33.使用训练子集对ARIMA销量预测模型进行训练,确定ARIMA销量预测模型的参数;
S34.使用验证子集对ARIMA销量预测模型的预测效果进行验证,将验证子集与训练子集进行拟合,判断拟合误差是否小于设定阈值;
若是,进入步骤S36;
若否,进入步骤S35;
S35.调整ARIMA销量预测模型的参数,返回步骤S33;
S36.输出验证通过的ARIMA销量预测模型。
6.如权利要求5所述的即开型彩票销量预测方法,其特征在于,步骤S32具体步骤如下:
S321.将数据集按照时间序列划分为设定数量的组;
S322.将每个组中彩票销量数据按照设定比例划分为训练序列和验证序列,其中,验证序列取组中前端的销量数据,而训练序列取组中后端的彩票销量数据;
S323.将各组的训练序列形成训练子集,将各组的验证序列形成验证子集,最终形成交叉的训练子集与验证子集;
步骤S34中使用同组的样子序列对训练序列进行拟合,验证ARIMA销量预测模型的预测效果。
7.如权利要求5所述的即开型彩票销量预测方法,其特征在于,步骤S4具体步骤如下:
S41.获取距离当前时间最近的设定时间段内的彩票销量数据;
S42.将获取的彩票销量数据进行特征选择及归一化处理后,输入验证通过的ARIMA销量预测模型,进行彩票销量预测。
8.一种即开型彩票销量预测装置,其特征在于,包括:
彩票销量数据采集及清洗模块,用于采集各门店设定时间段内的彩票销量数据,并对彩票销量数据进行清洗;
模型搭建及特征选择模块,用于搭建ARIMA销量预测模型,为ARIMA销量预测模型进行特征选择及阶数确定,并为选择特征进行归一化处理;
模型训练及验证模块,用于将选择特征对应彩票销量数据作为数据集,将数据集划分为训练子集和验证子集,使用训练子集对ARIMA销量预测模型进行训练,并使用验证子集对ARIMA销量预测模型进行验证;
彩票销量预测模块,用于基于当前彩票销量数据并使用验证通过ARIMA销量预测模型进行彩票销量预测。
9.一种计算机设备,其特征在于,包括处理器和存储器;
其中,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得计算机设备执行上述权利要求 1-7任一项所述的方法。
10.一种存储介质,其特征在于,
所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311302193.1A CN117035848A (zh) | 2023-10-10 | 2023-10-10 | 一种即开型彩票销量预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311302193.1A CN117035848A (zh) | 2023-10-10 | 2023-10-10 | 一种即开型彩票销量预测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117035848A true CN117035848A (zh) | 2023-11-10 |
Family
ID=88626741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311302193.1A Pending CN117035848A (zh) | 2023-10-10 | 2023-10-10 | 一种即开型彩票销量预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117035848A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118013469A (zh) * | 2024-04-07 | 2024-05-10 | 企云方(上海)软件科技有限公司 | 用于企业架构管理多维数据的时间相关模型分析方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256898A (zh) * | 2017-12-26 | 2018-07-06 | 深圳索信达数据技术股份有限公司 | 一种产品销量预测方法、系统及存储介质 |
CN113553540A (zh) * | 2020-04-24 | 2021-10-26 | 株式会社日立制作所 | 一种商品销量的预测方法 |
CN116362792A (zh) * | 2021-12-23 | 2023-06-30 | 中国移动通信有限公司研究院 | 一种销量预测方法、装置和计算机可读存储介质 |
CN116596580A (zh) * | 2023-05-22 | 2023-08-15 | 浙江理工大学 | 一种基于天气预报信息的季节性服装短期销量预测方法 |
-
2023
- 2023-10-10 CN CN202311302193.1A patent/CN117035848A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256898A (zh) * | 2017-12-26 | 2018-07-06 | 深圳索信达数据技术股份有限公司 | 一种产品销量预测方法、系统及存储介质 |
CN113553540A (zh) * | 2020-04-24 | 2021-10-26 | 株式会社日立制作所 | 一种商品销量的预测方法 |
CN116362792A (zh) * | 2021-12-23 | 2023-06-30 | 中国移动通信有限公司研究院 | 一种销量预测方法、装置和计算机可读存储介质 |
CN116596580A (zh) * | 2023-05-22 | 2023-08-15 | 浙江理工大学 | 一种基于天气预报信息的季节性服装短期销量预测方法 |
Non-Patent Citations (2)
Title |
---|
(美)罗伯特•H. 沙姆韦(ROBERT H. SHUMWAY),(美)戴维•S. 斯托弗(DAVID S. STOFFER)著;李洪成,潘文捷译: "《金融数量分析 基于MATLAB编程 第2版》", 31 August 2022, 北京航空航天大学出版社, pages: 258 - 259 * |
刘莉,康杰,岳振江,余磊著: "《仅基于响应的结构模态参数鲁棒辨识技术》", 31 January 2022, 北京理工大学出版社, pages: 41 - 42 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118013469A (zh) * | 2024-04-07 | 2024-05-10 | 企云方(上海)软件科技有限公司 | 用于企业架构管理多维数据的时间相关模型分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Clark et al. | Modeling time-varying uncertainty of multiple-horizon forecast errors | |
US7337135B1 (en) | Asset price forecasting | |
US9147206B2 (en) | Model optimization system using variable scoring | |
KR101396109B1 (ko) | 마케팅 모델 결정 시스템 | |
US20140039979A1 (en) | System and Method for Demand Forecasting | |
CN106022508A (zh) | 预测线上理财平台的用户邀请好友行为的方法和装置 | |
CN117035848A (zh) | 一种即开型彩票销量预测方法、装置、设备及介质 | |
Zubairy | Explaining the effects of government spending shocks | |
Huang et al. | Are bond returns predictable with real-time macro data? | |
CN106600404A (zh) | 一种预测方法及装置 | |
US9928516B2 (en) | System and method for automated analysis of data to populate natural language description of data relationships | |
KR102217886B1 (ko) | 빅데이터 기반 상품 투자 추천 알고리즘의 최적 가중치를 인공지능을 이용하여 탐색하는 시스템 및 방법 | |
Chiu | The intratemporal substitution between government spending and private consumption: Empirical evidence from Taiwan | |
CN107274043B (zh) | 预测模型的质量评价方法、装置及电子设备 | |
CN110826196B (zh) | 一种工业设备运行数据的处理方法及装置 | |
CN117132317A (zh) | 数据处理方法、装置、设备、介质及产品 | |
CN117252677A (zh) | 信贷额度确定方法和装置、电子设备及存储介质 | |
CN113379531A (zh) | 银行客户存款总额预测方法及装置 | |
Kohns et al. | A Flexible Bayesian MIDAS Approach for Interpretable Nowcasting and Forecasting | |
CN111164633B (zh) | 一种评分卡模型的调整方法、装置、服务器及存储介质 | |
CN112836939A (zh) | 一种创业型企业的在线估值方法和系统 | |
CN110728466A (zh) | 一种新产品的目标配件需求量确定方法及计算机设备 | |
Burger et al. | Deriving correlation matrices for missing financial time-series data | |
Zhao | Real-Time Density Forecasts of Output and Inflation via Quantile Regression | |
Bechný | Output gap in the Czech economy: DSGE approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |