CN110555713A - 一种确定销量预测模型的方法和装置 - Google Patents
一种确定销量预测模型的方法和装置 Download PDFInfo
- Publication number
- CN110555713A CN110555713A CN201810551461.6A CN201810551461A CN110555713A CN 110555713 A CN110555713 A CN 110555713A CN 201810551461 A CN201810551461 A CN 201810551461A CN 110555713 A CN110555713 A CN 110555713A
- Authority
- CN
- China
- Prior art keywords
- subset
- sample data
- commodity
- prediction model
- sales
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种确定销量预测模型的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;将所述测试集输入所述销量预测模型,以验证所述销量预测模型。该方法通过提取商品特征和天气特征来确定样本数据集,利用所述样本数据集建立销量预测模型,并对销量预测模型进行验证,以通过该模型预测商品销量,既提高了销量预测模型的泛化能力,又能够很好的预测与天气有关的商品销量。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种确定销量预测模型的方法和装置。
背景技术
随着互联网技术和移动技术的发展,线上购物更加便利,用户在线购物的数量有着大幅增长,如何预测商品在未来一段时间的销量变得非常重要。影响商品销量的因素有很多,比如商品价格、商品季节性、促销活动、节假日和天气情况等。以天气情况为例,人们会根据天气情况来决定购买的衣服、食物、饮品等,尤其是对于酒精性饮料和羽绒服等商品,天气情况对其销量起了重要作用。现有的商品销量预测方法中,一般是统计历史同期的销量,再依据统计结果进行销量预测。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术在预测商品销量时,仅统计历史同期的销量,不考虑商品价格、商品季节性、促销活动、节假日和天气状况等因素对商品销量所带来的影响,对商品销量预测的准确度较差。
发明内容
有鉴于此,本发明实施例提供一种确定销量预测模型的方法和装置,通过提取商品特征和天气特征来确定样本数据集,利用所述样本数据集建立销量预测模型,并对销量预测模型进行验证,以通过该模型预测商品销量,既提高了销量预测模型的泛化能力,又能够很好的预测与天气有关的商品销量。
为实现上述目的,根据本发明实施例的一个方面,提供了一种确定销量预测模型的方法。
本发明实施例的一种确定销量预测模型的方法,包括:从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;将所述测试集输入所述销量预测模型,以验证所述销量预测模型。
可选地,所述确定样本数据集,包括:将所述目标商品的样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集;其中,所述样本特征包括所述商品特征和所述天气特征,所述标签为所述目标商品的销量数据。
可选地,所述将所述样本数据集划分为训练集和测试集,包括:采用有放回的随机采样方法,从所述样本数据集中选取预设第一比例的样本数据作为原始训练集;采用有放回的随机采样方法,从所述原始训练集中选取预设第二比例的特征;将选取的所述特征和对应的所述标签组成的数据对作为训练集,将所述样本数据集中除所述训练集外的样本数据作为测试集。
可选地,其中,将所述训练集设置为当前集合,所述根据所述训练集和机器学习算法建立销量预测模型,包括:计算平方误差:遍历当前集合中每个所述特征的特征值,计算每个所述特征的特征值对应的平方误差;划分子集合:将最小平方误差对应的特征和特征值作为切分点,以对所述当前集合进行划分得到两个子集合,将所述两个子集合设置为所述当前集合;重复执行所述计算平方误差和所述划分子集合,直至满足停止条件,确定所述子集合对应的叶节点值;根据最小平方误差对应的特征、特征值和所述叶节点值生成回归树,将所述回归树作为销量预测模型。
可选地,所述停止条件为下列中的一个或多个:所述子集合的样本数量小于或等于第一阈值,所述子集合的特征个数小于或等于第二阈值,以及重复执行所述计算平方误差和所述划分子集合的次数大于或等于第三阈值。
可选地,所述确定所述子集合对应的叶节点值,包括:当所述子集合的样本数量小于或等于所述阈值时,计算所述子集合中的样本的标签的均值,将所述均值作为所述子集合的叶节点值。
为实现上述目的,根据本发明实施例的另一方面,提供了一种确定销量预测模型的装置。
本发明实施例的一种确定销量预测模型的装置,包括:提取确定模块,用于从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;划分建立模块,用于将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;输入验证模块,用于将所述测试集输入所述销量预测模型,以验证所述销量预测模型。
可选地,所述提取确定模块,还用于:将所述目标商品的样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集;其中,所述样本特征包括所述商品特征和所述天气特征,所述标签为所述目标商品的销量数据。
可选地,所述划分建立模块,还用于:采用有放回的随机采样方法,从所述样本数据集中选取预设第一比例的样本数据作为原始训练集;采用有放回的随机采样方法,从所述原始训练集中选取预设第二比例的特征;将选取的所述特征和对应的所述标签组成的数据对作为训练集,将所述样本数据集中除所述训练集外的样本数据作为测试集。
可选地,其中,将所述训练集设置为当前集合,所述划分建立模块,还用于:计算平方误差:遍历当前集合中每个所述特征的特征值,计算每个所述特征的特征值对应的平方误差;划分子集合:将最小平方误差对应的特征和特征值作为切分点,以对所述当前集合进行划分得到两个子集合,将所述两个子集合设置为所述当前集合;重复执行所述计算平方误差和所述划分子集合,直至满足停止条件,确定所述子集合对应的叶节点值;根据最小平方误差对应的特征、特征值和所述叶节点值生成回归树,将所述回归树作为销量预测模型。
可选地,所述停止条件为下列中的一个或多个:所述子集合的样本数量小于或等于第一阈值,所述子集合的特征个数小于或等于第二阈值,以及重复执行所述计算平方误差和所述划分子集合的次数大于或等于第三阈值。
可选地,所述划分建立模块,还用于:当所述子集合的样本数量小于或等于所述阈值时,计算所述子集合中的样本的标签的均值,将所述均值作为所述子集合的叶节点值。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。
本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种确定销量预测模型的方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种确定销量预测模型的方法。
上述发明中的一个实施例具有如下优点或有益效果:通过提取商品特征和天气特征来确定样本数据集,利用所述样本数据集建立销量预测模型,并对销量预测模型进行验证,以通过该模型预测商品销量,既提高了销量预测模型的泛化能力,又能够很好的预测与天气有关的商品销量;在确定样本数据集时,既考虑了内部因素,又考虑了外部因素,使得后续建立的销量预测模型能够准确预测与天气有关的商品销量;采用有放回的随机采样方式确定训练集和测试集,提高了销量预测模型的泛化能力和鲁棒性;采用回归树算法建立销量预测模型,降低了销量预测模型的过拟合,进一步提高了销量预测模型的泛化能力;采用平方误差最小原则划分训练集,进而得出每个子集合的最优输出值。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的确定销量预测模型的方法的主要步骤的示意图;
图2是根据本发明实施例的确定销量预测模型的方法的主要流程示意图;
图3为本发明实施例的建立销量预测模型的主要流程示意图;
图4为本发明实施例的回归树结构示意图;
图5是根据本发明实施例的确定销量预测模型的装置的主要模块的示意图;
图6是本发明实施例可以应用于其中的示例性系统架构图;
图7是适用于来实现本发明实施例的电子设备的计算机装置的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的确定销量预测模型的方法的主要步骤的示意图。如图1所示,本发明实施例的确定销量预测模型的方法,主要包括如下步骤:
步骤S101:从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集。其中,所述商品数据为商品基本数据、商品订单数据和用户行为数据中的至少一种数据;所述商品特征为商品基本特征、节假日特征和用户行为特征中的至少一种特征。将所述商品特征和所述天气特征作为样本特征,将所述目标商品的销量数据作为标签,将所述样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集。
步骤S102:将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型。其中,所述机器学习算法可以是回归树、线性回归、支持向量机、多层感知机等算法。该步骤首先采用随机采样方法或者统计模拟方法对所述样本数据集进行划分,以得到训练集和测试集;之后使用所述训练集和机器学习算法训练出销量预测模型。
步骤S103:将所述测试集输入所述销量预测模型,以验证销量预测模型。将销量预测模型训练好之后,即可将测试集作为销量预测模型的输入,以验证所述销量预测模型基于该测试集的输出与所述测试集中的样本数据的标签之间的误差是否在可以容忍的误差范围内。本发明实施例在预测目标商品在目标地区的销量时,考虑了天气因素对商品销量的影响,能够很好的预测与天气有关的商品销量。
图2是根据本发明实施例的确定销量预测模型的方法的主要流程示意图。如图2所示,本发明实施例的确定销量预测模型的方法,主要包括如下步骤:
步骤S201:获取目标商品的商品数据,获取目标地区的天气数据。其中,所述商品数据包括商品基本数据、商品订单数据和用户行为数据;所述商品基本数据包括商品的规格参数、功能说明、价格、图片等,所述商品订单数据包括商品名称、相关规格、数量、收货方信息、价格、物流信息等,所述用户行为数据包括用户对该商品的浏览数据、点击数据、收藏数据、评论数据、关注数据、加购物车数据等。实施例中,所述商品数据存储在数据存储系统,比如分布式数据库Hive中,此商品数据作为后续进行商品特征提取的原始数据。
在获取天气数据时,可以利用Python语言(是一种面向对象的解释型计算机程序设计语言)编写爬虫程序,来获取天气网站上目标地区的历史天气数据和未来一段时间的天气数据;也可以直接从气象局获取目标地区的历史天气数据,以及未来一段时间的天气数据。在使用爬虫程序获取天气数据时,可以使用BeautifulSoup对天气网站反馈的数据进行解析,进而获取天气数据。其中,BeautifulSoup是Python的一个库,最主要的功能就是从网页爬取我们需要的数据。
步骤S202:从所述商品数据中提取商品特征,从所述天气数据中提取天气特征,以确定样本数据集。其中,所述商品特征包括商品基本特征、节假日特征和用户行为特征。该步骤中,首先对商品数据进行过滤和清洗,去除其中的无效数据,以保证数据的准确性,提高样本特征的有效性。将所述商品特征和所述天气特征作为样本特征x,将所述目标商品的销量数据作为标签y,将所述样本特征和对应的标签组成的数据对(x,y)作为一个样本数据,所有的所述样本数据构成样本数据集D。
实施例中,从目标商品两年的商品数据中提取商品特征和天气特征作为样本数据集D:
D=(x1,y1)(x2,y2)…(xN,yN)
式中,xo是一个m维向量,m为样本特征的特征个数,o=1,2,…,N;N为样本个数;D为N行m+1列矩阵,每一行代表一个样本,每一列代表一维特征,最后一列为标签yo。
以预测目标商品某天的销量为目标,提取出目标商品近两年的样本数据。下面对本发明实施例中提取的商品特征和天气特征进行详细说明。
(1)商品基本特征包括页面价格、优惠前单价均值、优惠后单价均值、是否支持货到付款等。其中,页面价格为目标商品当天的页面价格均值;优惠前单价均值为目标商品当天在所有订单中的优惠前单件均值;优惠后单价均值为目标商品当天在所有订单中的优惠后单件均值;用0代表不支持货到付款,用1代表支持货到付款。
(2)用户行为特征包括商品浏览数、商品有效浏览数、用户评论数、用户评分、用户评分级别、收藏数、购物车等。其中,商品浏览数为目标商品当天的页面浏览次数;商品有效浏览数为目标商品当天的有效会话标识(session_id)个数;用户评论数为目标商品当天的用户评论数;用户评分为目标商品的用户评分均值;用户评分有三种情况:好评、中评和差评,将上述三个情况分别映射为对应的分值10、5和0,用户评分级别为目标商品当天的分值均值;收藏数为目标商品当天的收藏数;购物车为当天目标商品被加入购物车的数量。
(3)节假日特征包括月、周、节假日、休息日、工作日、大促日、节日、季节等。在一优选的实施例中,以每月为特征进行提取,如果当月为6月,则将相应位置设为1,其余设为0,具体特征提取结果如表1所示。
表1为月特征提取结果
以每天对应周几为特征,如果当天为周四,具体特征提取结果如表2所示。
表2为周特征提取结果
周一 | 周二 | 周三 | 周四 | 周五 | 周六 | 周日 |
0 | 0 | 0 | 1 | 0 | 0 | 0 |
判断当天是否为节假日、休息日、工作日,如果当天为2017年5月1日,该日为节假日,具体特征提取结果如表3所示。
表3为节假日、休息日、工作日特征提取结果
节假日 | 休息日 | 工作日 |
1 | 0 | 0 |
对电商平台来说,每年会有几个日期的优惠力度比较大,即大促日,比如6月18日、11月11日和12月12日。由于促销的原因,商品当天的销量会比较大,根据日期获取对应的大促日特征。例如当天为6月18日,具体特征提取结果如表4所示。
表4为大促日特征提取结果
6月18日 | 11月11日 | 12月12日 |
1 | 0 | 0 |
收集一年中影响用户购物意向的节日,共16个,分别为:元旦、春节、情人节、元宵节、妇女节、劳动节、青年节、母亲节、端午节、儿童节、父亲节、七夕节、教师节、国庆节、中秋节和圣诞节。整理出预设时间段的节日所对应的日期,根据日期获取对应的节日特征。例如当天为5月1日,对应为劳动节,具体特征提取结果如表5所示。
表5为节日特征提取结果
中国的3、4、5月为春季,6、7、8为夏季,9、10、11月是秋季,12、1、2月是冬季。根据月所对应的季节,提取对应的季节特征。例如当月为3月,对应为春季,具体特征提取结果如表6所示。
表6为季节特征提取结果
春季 | 夏季 | 秋季 | 冬季 |
1 | 0 | 0 | 0 |
(4)天气特征包括最高气温、最低气温、平均气温、风力、天气状况、人体舒适度指数等。其中,最高气温为目标地区的最高气温;最低气温为目标地区的最低气温;平均气温为根据目标地区的最高气温和最低气温计算出的平均温度;风力为目标地区当天的风力最大值;根据常见的天气情况,共取五种天气分类:晴、阴、多云、雨、雪,假如当天的天气情况为晴转多云,则天气状况特征提取如表7所示。
表7为天气状况特征提取结果表
晴 | 多云 | 阴 | 雨 | 雪 |
1 | 1 | 0 | 0 | 0 |
人体舒适度指数需根据当天的平均气温、湿度和风速进行计算,计算公式如下:
式中,SSD为人体舒适度指数;t为平均气温;f为湿度,实施例中设置为50%;v为风速,实施例中取当前的风速最大值。
上述商品基本特征共提取4个,节假日特征共提取45个,用户行为特征共提取7个,天气特征共提取10个,一共提取了66个特征构成本发明实施例的样本特征。
在一优选的实施例中,假设样本为羽绒服、啤酒和饮料商品,可以利用皮尔逊相关系数分析天气特征和商品销量之间的相关性。比如计算气温和商品销量之间的相关性,计算结果表明气温与羽绒服销量呈负相关、与啤酒和饮料销量呈正相关,即温度越低羽绒服销量越高,温度越高啤酒饮料销量越高。
步骤S203:将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型。划分样本数据集时可以采用有放回的随机采样方法、无放回的随机采样方法、蒙特卡罗方法等。采用有放回的随机采样方法划分样本数据集,能够提高销量预测模型的泛化能力和鲁棒性。在一优选的实施例中,采用回归树算法,根据训练集训练出销量预测模型,具体模型建立过程见后面描述。
下面以有放回的随机采样为例,对划分样本数据集的具体过程进行详细说明:
(1)采用有放回的随机采样方法,从所述样本数据集中选取预设第一比例的样本数据作为原始训练集。其中,所述第一比例根据需求设置,比如为75%。将样本数据集的样本数×75%,之后向下取整,得到原始训练集的样本数量。
(2)采用有放回的随机采样方法,从所述原始训练集中选取预设第二比例的特征。其中,所述第二比例根据需求设置,比如为75%。将样本数据集的特征数×75%,之后向下取整,得到训练集的特征数量。
(3)将选取的所述特征和对应的所述标签组成的数据对作为训练集,将所述样本数据集中除所述训练集外的样本数据作为测试集。
步骤S204:将所述测试集输入所述销量预测模型,以验证销量预测模型。经步骤S201至步骤S203的处理过程,得到了训练好的销量预测模型;之后将测试集输入该销量预测模型,以验证销量预测模型基于该测试集的输出与所述测试集中的样本数据的标签之间的误差是否在可以容忍的误差范围内。
图3为本发明实施例的建立销量预测模型的主要流程示意图。如图3所示,本发明实施例的建立销量预测模型的主要步骤包括:
步骤S301:遍历当前集合中每个所述特征的特征值,计算每个所述特征的特征值对应的平方误差;其中,所述当前集合的初始值为所述训练集。该步骤的具体实现过程为:
(1)遍历当前集合中每个特征的所有特征值,选取一个特征作为当前特征。
(2)从当前特征的所有特征值中选取一个特征值,将选取的所述特征值作为当前特征值。实施例中,将当前特征用i表示,当前特征值用s表示。其中,i=1,2,…,I,I为当前集合中的特征个数。
(3)根据所述当前特征值,将所述当前集合进行预划分,以得到两个新子集合。实施例中,将当前集合中其当前特征i的特征值小于当前特征值s的样本数据划分为一个新子集合D1,将其当前特征i的特征值大于或等于当前特征值s的样本数据划分为另一个新子集合D2,即D1(i,s)={X|x(i)<s},D2(i,s)={X|x(i)≥s},其中,x(i)为当前集合X中样本x的特征i的特征值。
(4)分别计算每个所述新子集合中所有标签的平均值,以根据每个所述标签和对应的所述平均值确定平方误差。实施例中,设新子集合D1中所有标签的平均值为u1,新子集合D2中所有标签的平均值为u2,则
其中,Nm(m=1,2)为子集合Dm中的样本的数量。
设新子集合D1和新子集合D2的平方误差为L(i,s),则
(5)判断所述当前特征值s是否为所述当前特征i的最后一个特征值,如果不是,则将下一特征值作为所述当前特征值,执行(3);如果是,则执行(6)。
(6)判断所述当前特征i是否为所述当前集合的最后一个特征,如果不是,则将下一特征作为所述当前特征,执行(2);如果是,则结束本流程。通过上述过程计算出了当前集合中每个特征对应的平方误差。
步骤S302:将最小平方误差对应的特征和特征值作为切分点,以对所述当前集合进行划分得到两个子集合。根据步骤S301计算出的所有平方误差,找出最小平方误差对应的特征和特征值,将找出的特征和特征值作为切分点,对当前集合进行划分,得到两个子集合。划分得到的子集合中的样本数据将不具有最小平方误差对应的特征以及对应的特征值,也即是说,子集合中的样本数据具有(训练集的特征数量-1)个特征。
步骤S303:判断是否满足预设停止条件,如果不满足所述停止条件,则执行步骤S304;如果满足所述停止条件,则执行步骤S305。在一个实施例中,所述停止条件可被定义为,子集合的样本数量是否小于或等于例如为2的第一阈值;或者子集合的特征个数是否小于或等于第二阈值,即如果某个子集合满足停止条件,则停止对该子集合进行划分。在另一个实施例中,所述停止条件也可以被定义为执行步骤S301和S302的次数是否大于或等于第三阈值,即如果生成的回归树的数量满足停止条件,则停止继续划分子集合。
步骤S304:将所述子集合作为所述当前集合,执行步骤S301。如果划分得到的两个子集合中的其中一个子集合不满足停止条件,或者两个子集合均不满足停止条件,则对不满足停止条件的子集合继续调用步骤S301至步骤S303,直至新得到的子集合能够满足停止条件。
步骤S305:计算所述子集合的所有标签的均值,将所述均值作为所述子集合的叶节点值,执行步骤S306。如果划分得到的子集合满足停止条件,则可按照步骤S301提到的公式计算该子集合的所有标签的均值,将该均值作为该子集合的叶节点值。
步骤S306:根据最小平方误差对应的特征、特征值和所述叶节点值生成回归树,将所述回归树作为销量预测模型。当每个子集合均满足停止条件,即不需要再对子集合进行划分,且计算出每个子集合对应的叶节点值后,回归树的生成过程结束。
在一优选的实施例中,重复执行步骤S203的全部过程,直至得到数量为第四阈值的回归树。所有的回归树构成销量预测模型,此时预测的销量预测数据为所有的回归树的叶节点值的均值。例如,第四阈值为10,则预测的销量预测数据为10棵回归树的叶节点的均值。
下面对本发明实施例的建立销量预测模型的过程,进行举例说明。
假设训练集中有四个样本,每个样本对应两个特征,分别为页面价格特征和最低气温特征,具体如表8所示。步骤S301对应于下述(a)过程和(b)过程,步骤S302对应于下述(c)过程,步骤S303至步骤S305对应于下述(d)过程,步骤S306对应于下述(e)过程。本实施例中停止条件为子集合的样本数量均小于等于2。
表8为训练集示例
页面价格特征 | 最低气温特征 | 标签y |
20 | 10 | 40.1 |
21 | 9 | 40.3 |
35 | 8 | 70.4 |
36 | 15 | 70.2 |
(a)当i=页面价格特征时,s的所有可能取值为20、21、35、36。
当s=20时,训练集被划分为新子集合D1(s≤20)和D2(s>20),则可计算出:
D1的所有标签的均值为40.1;
D2的所有标签的均值为(40.3+70.4+70.2)/3=60.3;
平方误差为(40.1-40.1)2+(40.3-60.3)2+(70.4-60.3)2+(70.2-60.3)2=600.02。
当s=21时,训练集被划分为新子集合D1(s≤21)和D2(s>21),则可计算出:
D1的所有标签的均值为(40.1+40.3)/2=40.2;
D2的所有标签的均值为(70.4+70.2)/2=70.3;
平方误差为(40.1-40.2)2+(40.3-40.2)2+(70.4-70.3)2+(70.2-70.3)2=0.04。
当s=35时,训练集被划分为新子集合D1(s≤35)和D2(s>35),则可计算出:
D1的所有标签的均值为(40.1+40.3+70.4)/3=50.27;
D2的所有标签的均值为70.2;
平方误差为(40.1-50.27)2+(40.3-50.27)2+(70.4-50.27)2+(70.2-70.2)2=608.02。
(b)当i=最低气温特征时,s的所有可能取值为10、9、8、15。
当s=8时,训练集被划分为新子集合D1(s≤8)和D2(s>8),则可计算出:
D1的所有标签的均值为70.4;
D2的所有标签的均值为(40.1+40.3+70.2)/3=50.2;
平方误差为(70.4-70.4)2+(40.1-50.2)2+(40.3-50.2)2+(70.2-50.2)2=600.02。
当s=9时,训练集被划分为新子集合D1(s≤9)和D2(s>9),则可计算出:
D1的所有标签的均值为(40.3+70.4)/2=55.35;
D2的所有标签的均值为(40.1+70.2)/2=55.15;
平方误差为(40.3-55.35)2+(70.4-55.35)2+(40.1-55.15)2+(70.2-55.15)2=906.01。
当s=10时,训练集被划分为新子集合D1(s≤10)和D2(s>10),则可计算出:
D1的所有标签的均值为(40.1+40.3+70.4)/3=50.27;
D2的所有标签的均值为70.2;
平方误差为(40.1-50.27)2+(40.3-50.27)2+(70.4-50.27)2+(70.2-70.2)2=608.02。
(c)由(a)过程和(b)过程可知,当i=页面价格特征时,s=21的平方误差最小,为0.04;当i=最低气温特征时,s=8的平方误差最小,为600.02。在所有的特征中选取出平方误差最小的特征,即以页面价格特征=21为切分点,将训练集切分为两个子集合D1(s≤21)和D2(s>21)。切分结果如表9和表10所示。
表9为切分后的子集合D1
最低气温特征 | 标签y |
10 | 40.1 |
9 | 40.3 |
表10为切分后的子集合D2
最低气温特征 | 标签y |
8 | 70.4 |
15 | 70.2 |
(d)分别判断子集合D1和子集合D2的样本数量是否小于等于2,下面对判断结果分别进行说明:
如果子集合D1的样本数量大于2,则对子集合D1执行(a)和(b),以再次对子集合D1进行划分;
如果子集合D2的样本数量大于2,则对子集合D2执行(a)和(b),以再次对子集合D2进行划分;
如果子集合D1的样本数量小于等于2,则停止划分,计算子集合D1的所有标签的均值,将该均值作为子集合D1的叶节点值;
如果子集合D2的样本数量小于等于2,则停止划分,计算子集合D2的所有标签的均值,将该均值作为子集合D2的叶节点值。
本实施例经一次划分后,子集合D1和子集合D2中均有两个样本,满足停止条件,无需再进行划分。此时,子集合D1的所有标签的均值为(40.1+40.3)/2=40.2,子集合D2的所有标签的均值为(70.2+70.4)/2=70.3。
(e)以特征为页面价格特征、特征值为21,子集合D1的叶节点值为40.2,子集合D2的叶节点值为70.3生成回归树,将该回归树作为销量预测模型。图4为本发明实施例的回归树结构示意图。如图4所示,本发明实施例的回归树包括两个叶节点和一个非叶节点,两个叶节点的节点值分别为40.2和70.3。
通过本发明实施例的确定销量预测模型的方法可以看出,通过提取商品特征和天气特征来确定样本数据集,利用所述样本数据集建立销量预测模型,并对销量预测模型进行验证,以通过该模型预测商品销量,既提高了销量预测模型的泛化能力,又能够很好的预测与天气有关的商品销量;在确定样本数据集时,既考虑了内部因素,又考虑了外部因素,使得后续建立的销量预测模型能够准确预测与天气有关的商品销量;采用有放回的随机采样方式确定训练集和测试集,提高了销量预测模型的泛化能力和鲁棒性;采用回归树算法建立销量预测模型,降低了销量预测模型的过拟合,进一步提高了销量预测模型的泛化能力;采用平方误差最小原则划分训练集,进而得出每个子集合的最优输出值。
图5是根据本发明实施例的确定销量预测模型的装置的主要模块的示意图。如图5所示,本发明实施例的确定销量预测模型的装置500,主要包括:
提取确定模块501,用于从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集。其中,所述商品数据为商品基本数据、商品订单数据和用户行为数据中的至少一种数据;所述商品特征为商品基本特征、节假日特征和用户行为特征中的至少一种特征。将所述商品特征和所述天气特征作为样本特征,将所述目标商品的销量数据作为标签,将所述样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集。
划分建立模块502,用于将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型。其中,所述机器学习算法可以是回归树、线性回归、支持向量机、多层感知机等算法。该模块首先采用随机采样方法或者统计模拟方法对所述样本数据集进行划分,以得到训练集和测试集;之后使用所述训练集和机器学习算法训练出销量预测模型。
输入预测模块503,用于将所述测试集输入所述销量预测模型,以验证所述销量预测模型。将销量预测模型训练好之后,即可将测试集作为销量预测模型的输入,以验证所述销量预测模型基于该测试集的输出与所述测试集中的样本数据的标签之间的误差是否在可以容忍的误差范围内。本发明实施例在预测目标商品在目标地区的销量时,考虑了天气因素对商品销量的影响,能够很好的预测与天气有关的商品销量。
从以上描述可以看出,通过提取商品特征和天气特征来确定样本数据集,利用所述样本数据集建立销量预测模型,并对销量预测模型进行验证,以通过该模型预测商品销量,既提高了销量预测模型的泛化能力,又能够很好的预测与天气有关的商品销量;在确定样本数据集时,既考虑了内部因素,又考虑了外部因素,使得后续建立的销量预测模型能够准确预测与天气有关的商品销量;采用有放回的随机采样方式确定训练集和测试集,提高了销量预测模型的泛化能力和鲁棒性;采用回归树算法建立销量预测模型,降低了销量预测模型的过拟合,进一步提高了销量预测模型的泛化能力;采用平方误差最小原则划分训练集,进而得出每个子集合的最优输出值。
图6示出了可以应用本发明实施例的确定销量预测模型的方法或确定销量预测模型的装置的示例性系统架构600。
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。在一个实施例中,终端设备601、602、603上可以安装有各种通讯客户端应用,例如向服务器605输入商品数据和/或天气数据的应用等。
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器605可以是提供各种服务的服务器,例如对管理员利用终端设备601、602、603所提供的商品数据和/或天气数据进行分析的后台管理服务器。后台管理服务器可以对接收到的数据进行分析等处理,并将处理结果(例如销量预测数据)反馈给终端设备。
需要说明的是,本申请实施例所提供的确定销量预测模型的方法一般由服务器605执行,相应地,确定销量预测模型的装置一般设置于服务器605中。
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种计算机可读介质。
本发明的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种确定销量预测模型的方法。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种确定销量预测模型的方法。
下面参考图7,其示出了适用于来实现本发明实施例的电子设备的计算机系统700的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有计算机系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明公开的实施例,上文主要步骤图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,上述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括提取确定模块、划分建立模块和输入验证模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,提取确定模块还可以被描述为“从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;将所述测试集输入所述销量预测模型,以验证所述销量预测模型。
从以上描述可以看出,通过提取商品特征和天气特征来确定样本数据集,利用所述样本数据集建立销量预测模型,并对销量预测模型进行验证,以通过该模型预测商品销量,既提高了销量预测模型的泛化能力,又能够很好的预测与天气有关的商品销量;在确定样本数据集时,既考虑了内部因素,又考虑了外部因素,使得后续建立的销量预测模型能够准确预测与天气有关的商品销量;采用有放回的随机采样方式确定训练集和测试集,提高了销量预测模型的泛化能力和鲁棒性;采用回归树算法建立销量预测模型,降低了销量预测模型的过拟合,进一步提高了销量预测模型的泛化能力;采用平方误差最小原则划分训练集,进而得出每个子集合的最优输出值。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (14)
1.一种确定销量预测模型的方法,其特征在于,包括:
从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;
将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;
将所述测试集输入所述销量预测模型,以验证所述销量预测模型。
2.根据权利要求1所述的方法,其特征在于,所述确定样本数据集,包括:将所述目标商品的样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集;其中,所述样本特征包括所述商品特征和所述天气特征,所述标签为所述目标商品的销量数据。
3.根据权利要求2所述的方法,其特征在于,所述将所述样本数据集划分为训练集和测试集,包括:
采用有放回的随机采样方法,从所述样本数据集中选取预设第一比例的样本数据作为原始训练集;
采用有放回的随机采样方法,从所述原始训练集中选取预设第二比例的特征;
将选取的所述特征和对应的所述标签组成的数据对作为训练集,将所述样本数据集中除所述训练集外的样本数据作为测试集。
4.根据权利要求3所述的方法,其中,将所述训练集设置为当前集合,其特征在于,所述根据所述训练集和机器学习算法建立销量预测模型,包括:
计算平方误差:遍历当前集合中每个所述特征的特征值,计算每个所述特征的特征值对应的平方误差;
划分子集合:将最小平方误差对应的特征和特征值作为切分点,以对所述当前集合进行划分得到两个子集合,将所述两个子集合设置为所述当前集合;
重复执行所述计算平方误差和所述划分子集合,直至满足停止条件,确定所述子集合对应的叶节点值;
根据最小平方误差对应的特征、特征值和所述叶节点值生成回归树,将所述回归树作为销量预测模型。
5.根据权利要求4所述的方法,其特征在于,所述停止条件为下列中的一个或多个:所述子集合的样本数量小于或等于第一阈值,所述子集合的特征个数小于或等于第二阈值,以及重复执行所述计算平方误差和所述划分子集合的次数大于或等于第三阈值。
6.根据权利要求4所述的方法,其特征在于,所述确定所述子集合对应的叶节点值,包括:当所述子集合的样本数量小于或等于所述阈值时,计算所述子集合中的样本的标签的均值,将所述均值作为所述子集合的叶节点值。
7.一种确定销量预测模型的装置,其特征在于,包括:
提取确定模块,用于从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;
划分建立模块,用于将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;
输入验证模块,用于将所述测试集输入所述销量预测模型,以验证所述销量预测模型。
8.根据权利要求7所述的装置,其特征在于,所述提取确定模块,还用于:将所述目标商品的样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集;其中,所述样本特征包括所述商品特征和所述天气特征,所述标签为所述目标商品的销量数据。
9.根据权利要求8所述的装置,其特征在于,所述划分建立模块,还用于:
采用有放回的随机采样方法,从所述样本数据集中选取预设第一比例的样本数据作为原始训练集;
采用有放回的随机采样方法,从所述原始训练集中选取预设第二比例的特征;
将选取的所述特征和对应的所述标签组成的数据对作为训练集,将所述样本数据集中除所述训练集外的样本数据作为测试集。
10.根据权利要求9所述的装置,其中,将所述训练集设置为当前集合,其特征在于,所述划分建立模块,还用于:
计算平方误差:遍历当前集合中每个所述特征的特征值,计算每个所述特征的特征值对应的平方误差;
划分子集合:将最小平方误差对应的特征和特征值作为切分点,以对所述当前集合进行划分得到两个子集合,将所述两个子集合设置为所述当前集合;
重复执行所述计算平方误差和所述划分子集合,直至满足停止条件,确定所述子集合对应的叶节点值;
根据最小平方误差对应的特征、特征值和所述叶节点值生成回归树,将所述回归树作为销量预测模型。
11.根据权利要求10所述的装置,其特征在于,所述停止条件为下列中的一个或多个:所述子集合的样本数量小于或等于第一阈值,所述子集合的特征个数小于或等于第二阈值,以及重复执行所述计算平方误差和所述划分子集合的次数大于或等于第三阈值。
12.根据权利要求10所述的装置,其特征在于,所述划分建立模块,还用于:当所述子集合的样本数量小于或等于所述阈值时,计算所述子集合中的样本的标签的均值,将所述均值作为所述子集合的叶节点值。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810551461.6A CN110555713A (zh) | 2018-05-31 | 2018-05-31 | 一种确定销量预测模型的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810551461.6A CN110555713A (zh) | 2018-05-31 | 2018-05-31 | 一种确定销量预测模型的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110555713A true CN110555713A (zh) | 2019-12-10 |
Family
ID=68733708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810551461.6A Pending CN110555713A (zh) | 2018-05-31 | 2018-05-31 | 一种确定销量预测模型的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110555713A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445134A (zh) * | 2020-03-26 | 2020-07-24 | 珠海随变科技有限公司 | 商品的销量预测方法、装置、计算机设备和存储介质 |
CN112330415A (zh) * | 2020-11-19 | 2021-02-05 | 北京沃东天骏信息技术有限公司 | 直播场景物品销量数据预测方法、模型的训练方法及介质 |
CN113689020A (zh) * | 2020-05-19 | 2021-11-23 | 顺丰科技有限公司 | 业务信息预测方法、装置、计算机设备和存储介质 |
CN113743969A (zh) * | 2020-05-29 | 2021-12-03 | 北京京东智能城市大数据研究院 | 用于销量数据预测的方法、装置、设备及存储介质 |
CN113780611A (zh) * | 2020-12-10 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 一种库存管理方法和装置 |
CN114757700A (zh) * | 2022-04-12 | 2022-07-15 | 北京京东尚科信息技术有限公司 | 物品销量预测模型训练方法、物品销量预测方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617459A (zh) * | 2013-12-06 | 2014-03-05 | 李敬泉 | 一种多影响因素下商品需求信息预测方法 |
CN106897109A (zh) * | 2017-02-13 | 2017-06-27 | 云南大学 | 基于随机森林回归的虚拟机性能预测方法 |
CN107067115A (zh) * | 2017-04-26 | 2017-08-18 | 大连理工大学 | 一种基于忠实乘客的多特征地铁乘车人数预测方法 |
CN107509202A (zh) * | 2017-07-10 | 2017-12-22 | 东南大学 | 一种基于接入用户数变化预测的超密集网络资源分配方法 |
-
2018
- 2018-05-31 CN CN201810551461.6A patent/CN110555713A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617459A (zh) * | 2013-12-06 | 2014-03-05 | 李敬泉 | 一种多影响因素下商品需求信息预测方法 |
CN106897109A (zh) * | 2017-02-13 | 2017-06-27 | 云南大学 | 基于随机森林回归的虚拟机性能预测方法 |
CN107067115A (zh) * | 2017-04-26 | 2017-08-18 | 大连理工大学 | 一种基于忠实乘客的多特征地铁乘车人数预测方法 |
CN107509202A (zh) * | 2017-07-10 | 2017-12-22 | 东南大学 | 一种基于接入用户数变化预测的超密集网络资源分配方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445134A (zh) * | 2020-03-26 | 2020-07-24 | 珠海随变科技有限公司 | 商品的销量预测方法、装置、计算机设备和存储介质 |
CN111445134B (zh) * | 2020-03-26 | 2021-05-28 | 珠海必要工业科技股份有限公司 | 商品的销量预测方法、装置、计算机设备和存储介质 |
CN113689020A (zh) * | 2020-05-19 | 2021-11-23 | 顺丰科技有限公司 | 业务信息预测方法、装置、计算机设备和存储介质 |
CN113743969A (zh) * | 2020-05-29 | 2021-12-03 | 北京京东智能城市大数据研究院 | 用于销量数据预测的方法、装置、设备及存储介质 |
CN113743969B (zh) * | 2020-05-29 | 2024-08-20 | 北京京东智能城市大数据研究院 | 用于销量数据预测的方法、装置、设备及存储介质 |
CN112330415A (zh) * | 2020-11-19 | 2021-02-05 | 北京沃东天骏信息技术有限公司 | 直播场景物品销量数据预测方法、模型的训练方法及介质 |
CN113780611A (zh) * | 2020-12-10 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 一种库存管理方法和装置 |
CN114757700A (zh) * | 2022-04-12 | 2022-07-15 | 北京京东尚科信息技术有限公司 | 物品销量预测模型训练方法、物品销量预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021174944A1 (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
CN110555713A (zh) | 一种确定销量预测模型的方法和装置 | |
WO2021196476A1 (zh) | 对象推荐方法、电子设备及存储介质 | |
WO2019061994A1 (zh) | 电子装置、保险产品推荐方法、系统及计算机可读存储介质 | |
CN111222976B (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN110555578B (zh) | 一种销量预测方法和装置 | |
WO2019072128A1 (zh) | 对象识别方法及其系统 | |
CN111199474A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN110196848B (zh) | 一种面向公共资源交易数据的清洗去重方法及其系统 | |
CN110070382B (zh) | 用于生成信息的方法和装置 | |
CN113362095B (zh) | 一种信息投放的方法和装置 | |
CN111966886A (zh) | 对象推荐方法、对象推荐装置、电子设备及存储介质 | |
CN110866625A (zh) | 促销指标信息生成方法和装置 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN115409419A (zh) | 业务数据的价值评估方法、装置、电子设备及存储介质 | |
US20230230081A1 (en) | Account identification method, apparatus, electronic device and computer readable medium | |
CN111091218A (zh) | 竞价预测模型的生成以及广告投放自动出价方法和装置 | |
CN116402625B (zh) | 客户评估方法、装置、计算机设备及存储介质 | |
CN112989276B (zh) | 信息推送系统的评价方法和装置 | |
CN113742564A (zh) | 目标资源的推送方法和装置 | |
CN115146653B (zh) | 对话剧本构建方法、装置、设备及存储介质 | |
CN116304236A (zh) | 一种用户画像生成方法、装置、电子设备和存储介质 | |
CN116127189A (zh) | 用户运营方法、装置、设备以及计算机存储介质 | |
CN112784861A (zh) | 相似度的确定方法、装置、电子设备和存储介质 | |
CN110826823A (zh) | 定价策略的评价方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |