CN118076967A

CN118076967A - 基于优化树集成的需求模型

Info

Publication number: CN118076967A
Application number: CN202280060117.1A
Authority: CN
Inventors: L·塔亚普兰; K·V·潘查姆; S·伯吉安; G·佩拉基斯
Original assignee: Oracle International Corp; Massachusetts Institute of Technology
Current assignee: Oracle International Corp; Massachusetts Institute of Technology
Priority date: 2021-09-28
Filing date: 2022-07-18
Publication date: 2024-05-24
Also published as: CA3229035A1; US20230096633A1; WO2023056115A1

Abstract

实施例生成零售商品的优化需求模型。实施例训练包括多棵树的树集成机器学习模型，训练包括存储树中的每棵树的上界，树包括与影响商品需求的需求特征相对应的层次和分支。实施例生成需求模型的目标函数。在每棵树的顶部分裂处，实施例使用所存储的上界来确定最优子节点，并计算每棵树的新可行域。使用新可行域上的边界，实施例使每棵树向下移动到下一分裂层次，并且当到达每棵树的叶节点时生成优化需求模型。

Description

基于优化树集成的需求模型

一个实施例总体上涉及一种计算机系统，并且具体地涉及一种预测需求的计算机系统。

背景技术

产品通常通过制造商、分销商、运输商、零售商等组成的网络交付给消费者。这种由合作将产品交付给消费者的设施组成的网络通常被称为“供应链”网络。

为了在不断变化的市场环境下通过供应链网络使产品流动顺畅且高效，产品供应商(例如，制造商、供货商、零售商等)经常面临预测产品/商品需求的任务。高估需求会导致生产过剩，并增加与持有库存相关联的成本(例如，存储成本、过时等)。另一方面，低估需求会导致收入损失。

进一步地，在零售行业，零售商需要预测未来的需求，以便更好地管理库存或制定促销/降价计划。零售商可能会开展多种类型的促销活动来提升销售额。为了生成准确的预测，零售商必须考虑可能影响需求的所有因素/特征，比如促销、价格、季节性、天气等。

一般来说，需求预测系统在按周对零售商品的销售单位进行预测时会遇到问题。零售商品在某一周的需求量受到许多因素的影响，比如季节性因素、零售商品在该周期间是否打折以及该周处于商品生命周期的哪个阶段。预测每周需求单位的一种常见方式涉及构建零售商品的“因果需求模型”。该需求模型是根据比如上面列出的因素描述每周需求单位的数学模型。这些因素被称为形成需求模型的“需求变量”或“需求特征”。

需求模型以数学方式指定需求变量如何影响需求单位。例如，如果折扣金额是需求变量，则历史数据可能显示，降价50％会导致销售单位增加4倍(即，与价格弹性相关)。在该示例中，需求变量是降价50％，历史销售数据是销售额增加4倍。如果在历史时段期间没有缺货周，则历史销售单位就能指示需求情况。通常，对历史销售数据进行预处理，以校正截尾数据，即调整库存不足周的销售单位。为了使因果需求模型在预测需求单位时发挥作用，有必要确定需求变量(降价50％)与历史销售单位(增加4倍)之间的关系。这种关系被称为与需求变量相关联的“需求参数”。

在该示例中，需求参数可以被确定为指定每降价25％，特定零售商品的需求量将增加2倍。在确定需求参数后，就可以通过指定需求变量的未来值来预测需求单位。继续以降价为例，零售商可能知道下一季将在几周内降价40％。然后，需求模型将预测降价40％的那几周的需求单位。

需求参数是通过检查包含零售商品本身或类似零售商品的降价信息的历史零售销售数据(称为“零售面板数据”)来确定的。然而，如上所述，几个需求变量会影响零售商品的销售。这几个需求变量同时适用。例如，零售商可能在夏季对夏季商品降价50％，在这种情况下，销售额增加4倍的部分原因可能是夏季对夏季零售商品的季节性需求增加。为了区分几个需求变量对销售额产生的影响，可以对需求模型进行回归，以确定使需求模型最适合零售面板数据的需求参数的值。

发明内容

实施例生成零售商品的优化需求模型。实施例训练包括多棵树的树集成机器学习模型，所述训练包括存储所述树中的每棵树的上界，所述树包括与影响所述商品需求的需求特征相对应的层次和分支。实施例生成所述需求模型的目标函数。在每棵树的顶部分裂处，实施例使用所存储的上界来确定最优子节点，并计算每棵树的新的可行域。使用所述新的可行域上的边界，实施例使每棵树向下移动到下一分裂层次，并且当到达每棵树的叶节点时生成所述优化需求模型。

附图说明

从以下结合附图对实施例的详细描述中，进一步的实施例、细节、优点和修改将变得显而易见。

图1是根据本发明实施例的计算机服务器/系统的框图。

图2是根据一个实施例的图1的需求模型生成功能在生成需求模型的优化树集成时的流程图。

图3图示了根据实施例的用于进一步解释图2的功能的三个示例树和对应的符号。

图4用图3的符号图示了图2的功能。

图5是根据一个实施例的图1的需求模型生成功能在生成需求模型的优化树集成时的流程图。

图6用图3的符号图示了图5的功能。

图7图示了根据本发明实施例的图2的功能在四树集成中的结果的示例。

图8图示了根据一个实施例的生成一组商品的价格表的计算机化系统。

图9是根据一个实施例的图1的需求模型生成功能在使用经训练的优化树集成生成零售商品的需求模型时的流程图。

图10图示了根据一个实施例的制造、库存和物流一体化系统，该系统包括使用如本文所公开的优化需求模型的需求预测。

具体实施方式

一个实施例使用影响产品需求的特征来生成基于树集成的需求模型。在构建每棵树时，实施例通过确定和存储上界来优化树集成。优化的树集成形成可以用于对产品的定价和库存进行优化的需求模型。

为了改进需求预测，零售商已开始采用现代机器学习技术，比如支持向量机(“SVM”)、人工神经网络(“ANN”)、随机森林等。然而，通常情况下零售商仅为每一类产品和每一组地点挑选一种模型。如本文所使用的，零售商可以包括单个零售商店，也可以包括全部由单个或多个物流运营部门进行整合和管理的大量零售商店。

进一步地，对于许多机器学习算法(SVM、ANN、随机森林等)，零售商将使用特征集(即，商品的各种属性)来定义产品/地点/日历交叉点的数据点。在这些算法中，零售商将使用与进行预测相同的特征集来训练模型。进一步地，同一特征集可以由多种不同的算法使用以进行预测。“特征集”是影响商品需求或销售以及描述商品属性的特征的集合。特征的示例包括价格、季节性、品牌、促销、尺寸、颜色、包装尺寸、供应商、长度等。虽然比如价格和季节性等特征可能与所有类型的产品都相关，但其他一些特征则是特定于商品。例如，包装尺寸会影响酸奶的需求，但包装的长度并不重要。相反，品牌对于时尚商品来说非常重要，但对于比如钉子或锤子等五金商品来说就不那么重要了。

一般来说，实施例利用以下需求模型或函数来进行需求预测(“等式(1)”)：

需求＝基本需求*季节性*促销效应(*附加特征效应) (1)

其中，“基本需求”是指不考虑任何影响或其他因素的历史需求，季节性是指基于季节(即，一年中的时间)对需求产生的影响，并且促销影响是指基于某一时间段内提供的一次或多次促销活动对需求产生的影响。可以视情况向模型中添加影响需求的任何或所有附加特征/变量。然而，在某些情况下，特征的数量可能会超过100个。

具体地，过去几十年，零售行业不断发展，使得在线销售已成为在线零售商盈利能力的一个非常重要的方面。这使得零售商不仅能够获得有关产品及其相应销售情况的大量数据，而且还能够获得有关购买这些产品的客户的大量数据。因此，零售商喜欢使用这种数据(例如，与销售情况相关的大量特征)，以便以更智能的方式采购库存或设定下一季度或下一季节的价格(例如，确定促销和降价)，从而使零售商的收入或利润最大化。零售商面临的两个关键挑战不仅是如何利用这些数据来开发准确、可扩展且可解释的需求预测方法，而且还包括如何将这些方法整合到其定价或库存优化问题中。

机器学习的最新进展及工具的可用性使得能够实现该过程的第一阶段，即，通过结合大量特征，越来越准确地估计数据与需求(和/或销售)之间的复杂关系。特征具有双重作用，因为它们不仅有助于预测需求，而且还有助于实施决策。尽管拥有大量特征可能有助于提高需求预测的准确性，但使用大量特征会使后续的优化问题(例如，决定定价)变得难处理。

在需求预测领域，零售商的解决方案越来越多地使用比如回归树、随机森林、分类和神经网络等机器学习模型，而不是比如线性回归、双对数回归和对数线性回归等更传统的模型。然而，利用这些需求模型来解决零售商的优化问题(比如促销和降价定价)仍然很困难。例如，机器学习模型通常会产生高维度的非参数目标函数，因此很难用当前已知的优化工具进行优化。进一步地，由于这些函数是高维度的，因此使用混合整数线性规划(“MILP”)的约束决策问题通常不是在计算上易处理的问题。相反，实施例提供了可行的近似方法来解决这些问题。

现在将详细参考本公开的实施例，附图中图示了所述实施例的示例。在以下详细描述中，阐述了许多具体细节以便提供对本公开的全面理解。然而，对于本领域普通技术人员将明显的是，可以在没有这些具体细节的情况下实践本公开。在其他实例中，并未详细描述熟知方法、过程、组件以及电路以免不必要地模糊实施例的各方面。只要可能，相似的附图标记将用于相似的元件。

图1是根据本发明实施例的计算机服务器/系统10的框图。尽管被示为单个系统，但是系统10的功能可以被实施为分布式系统。进一步地，本文公开的功能可以在可以通过网络耦接在一起的单独的服务器或设备上实施。进一步地，可以不包括系统10的一个或多个部件。例如，对于服务器的功能而言，系统10可能需要包括处理器和存储器，但可能不包括图1所示的其他部件中的一个或多个，比如键盘或显示器。图1可以用于实施本文公开的任何部件。

系统10包括总线12或用于传送信息的其他通信机制、以及耦接到总线12以用于处理信息的处理器22。处理器22可以是任何类型的通用或专用处理器。系统10进一步包括用于存储要由处理器22执行的信息和指令的存储器14。存储器14可以由随机存取存储器(“RAM”)、只读存储器(“ROM”)、比如磁盘或光盘等静态存储装置、或任何其他类型的计算机可读介质的任意组合构成。系统10进一步包括比如网络接口卡等通信设备20，以提供对网络的访问。因此，用户可以直接与系统10交互，或者通过网络或任何其他方法远程地与该系统交互。

计算机可读介质可以是可以由处理器22访问的任何可用介质，并且包括易失性和非易失性介质、可移除和不可移除介质以及通信介质。通信介质可以包括计算机可读指令、数据结构、程序模块、或调制数据信号(比如载波或其他传输机制)中的其他数据，并且包括任何信息传递介质。

处理器22进一步经由总线12耦接到显示器24，比如液晶显示器(“LCD”)。键盘26和比如计算机鼠标等光标控制设备28进一步耦接到总线12以使得用户能够与系统10交互。

在一个实施例中，存储器14存储当由处理器22执行时提供功能的软件模块。所述模块包括为系统10提供操作系统功能的操作系统15。所述模块进一步包括需求模型生成模块16，其生成基于优化树集成的需求模式以及本文公开的所有其他功能。系统10可以是更大系统的一部分。因此，系统10可以包括一个或多个附加功能模块18以包括附加功能，比如零售管理系统(例如，美国甲骨文(Oracle)公司的“Oracle零售需求预测系统”或“Oracle零售科学平台”)或企业资源规划(“ERP”)系统。附加功能模块18包括实施由需求模型生成16生成的需求模型的附加功能，比如使用需求模型来生成优化的促销和降价定价或库存优化的功能。附加功能可以包括“Oracle零售报价优化云服务”和“Oracle零售库存优化云服务”。

数据库17耦接到总线12，以便为模块16和18提供集中存储并存储客户数据、产品数据、交易数据等。在一个实施例中，数据库17是关系数据库管理系统(“RDBMS”)，其可以使用结构化查询语言(“SQL”)来管理所存储的数据。在一个实施例中，专用销售点(“POS”)终端99生成用于预测需求的交易数据和历史销售数据(例如，关于每个零售商店处的每种商品/SKU的交易的数据)。POS终端99本身可以包括附加处理功能以生成根据一个实施例的需求模型，并且可以单独或与图1的其他部件结合作为专用需求模型生成系统来进行操作。

在一个实施例中，特别是当存在大量零售商店、大量商品和大量历史数据时，数据库17被实施为内存数据库(“IMDB”)。IMDB是一种数据库管理系统，其主要依赖于主存储器来进行计算机数据存储。它与采用磁盘存储机制的数据库管理系统形成对比。主存数据库比磁盘优化数据库更快，因为磁盘访问比存储器访问慢，内部优化算法更简单，并且执行的CPU指令更少。访问存储器中的数据消除了查询数据时的寻道时间，这提供了比磁盘更快、更可预测的性能。

在一个实施例中，数据库17当被实施为IMDB时，是基于分布式数据网格来实施的。分布式数据网格是一种系统，其中计算机服务器的集合在一个或多个集群中一起工作，以管理分布式或集群环境内的信息和相关操作(比如，计算)。分布式数据网格可以用于管理跨服务器共享的应用对象和数据。分布式数据网格提供短响应时间、高吞吐量、可预测的可扩展性、连续可用性和信息可靠性。在特定示例中，分布式数据网格(例如，美国甲骨文公司的“Oracle Coherence”数据网格)将信息存储在内存中以实现更高的性能，并采用冗余性来保持该信息的副本在多个服务器之间同步，从而确保系统的弹性和在服务器发生故障的情况下数据的持续可获得性。

在一个实施例中，系统10是计算/数据处理系统，其包括用于企业组织的应用或分布式应用的集合，并且还可以实施物流、制造和库存管理功能。应用和计算系统10可以被实施为与基于云的联网系统、软件即服务(“SaaS”)体系结构或其他类型的计算解决方案，或被配置为与其一起操作。

如所讨论的，实施例实施合并一类被称为“树集成”的机器学习(“ML”)模型的需求模型。可以用于回归树的已知近似优化算法对于“简单”回归树效果良好，但在使用树集成时通常达不到预期效果。当目标函数来自树集成方法(比如，分类与回归树(“CART”)和随机森林)时，优化问题是一个重要的问题，这是由于所述问题的高维度性质以及对来自树(或森林)的可行决策的相关联约束。进一步地，关键的困难来自于随机森林本身的组合性这一事实。一些组合问题(具有特殊结构)可以利用混合整数线性规划(“MILP”)的强大功能。

实施例弥补了零售行业中的上述ML方法与开发用于优化问题(比如定价和库存)的方法之间的差距。由于这些ML函数不是参数化的，因此如何以可扩展且高效的方式进行优化是困难的。一般来说，零售行业已知的优化解决方案无法利用ML模型。

实施例对实施基于树的ML模型(包括随机森林或XGBoost)的需求模型实施上界优化。在使用集成方法形成特定零售产品的需求模型时，构建了大量的树，每棵树都根据数据的子集(在本例中为历史销售额的子集)进行训练。这有助于减轻回归树过度拟合训练集的趋势。在每个单独的树中，存在与不同需求特征相对应的多个分支和层次。对树集成进行优化是困难的，因为一个强大的预测模型通常包括数千棵树，每棵树又包括数百个分支，从而形成一个大型树集成。因此，实施例合并了使用在构建每棵树时实施的盒式方法(当树集成机器学习具有平行分裂时)或超平面方法(当树集成机器学习具有超平面分裂时)进行的上界优化。

实施例首先使用比如随机森林或XGBoost等ML模型来开发需求模型。目标变量(即，模型被设计为进行预测的变量)是某个地点处的商品需求量，并且在一个实施例中是一周。所包含的特征可以是产品属性、价格、季节性数据、假期信息、人口普查数据、天气、股票价格、库存信息等。由于比如随机森林或XGBoost等ML模型能够对特征与因变量之间的复杂非线性关系进行建模，并且与传统使用的模型相比，它们提供了可解释性和更高的预测准确性，因此经常被用于零售商品预测模型。

一般来说，已知的优化算法是在需求模型开发完成后按顺序运行。然而，这些已知方法不适用于比如随机森林或XGBoost等非参数ML模型，因为生成所有可能的解决方案以找出最优解决方案需要花费指数级的时间。例如，考虑一个具有3个特征的可预测商品需求的二元决策树。在每个节点处，都要做出一个决策(例如，商品是否有折扣)，并且所述决策有两种可能的结果：是和否。一旦树中的该节点向下遍历，在下一节点处就会出现另一决策(例如，商品是否呈特殊展示)，并且有两种结果。这一过程一直持续至到达树的底部，称为树的“叶节点”。在具有3个特征的示例中，有8个叶节点。概括来说，对于具有n个特征的二元树，最多有2ⁿ个叶节点。在树集成中，有多棵树(例如，m棵树)一起用于进行预测。由于叶节点的数量呈指数级增长，因此实际上不可能通过遍历所有树来评估收益从而预测定价决策的影响。

与试图在需求模型开发完成后进行优化的已知解决方案相比，实施例利用树的构建/训练过程并在为预测目的而构建/训练树时存储上界。实施例通过找到一组变量的最优域来进行优化，所述最优域将最大化/最小化集成树的预测或基于预测的函数。

与其他凸优化公式(例如，二次规划、二元规划和拉格朗日松弛)相比，实施例可以合并业务约束并且具有良好的扩展性。实施例利用树的构建过程(即，训练)来存储关于树分裂的两侧可能达到的最佳收益的信息，这被称为“上界”优化。该信息是在无需探索树的整个深度的情况下基于分裂数据创建和存储的，并且用于在迭代3步算法中进行快速优化。

图2是根据一个实施例的图1的需求模型生成16的功能在生成需求模型的优化树集成时的流程图。在一个实施例中，图2(以及下面的图5和图9)的流程图的功能由存储在存储器或其他计算机可读或有形介质中的软件实施，并由处理器执行。在其他实施例中，功能可以由硬件(例如，通过使用专用集成电路(“ASIC”)、可编程门阵列(“PGA”)、现场可编程门阵列(“FPGA”)等)或硬件和软件的任何组合来执行。

图2的功能是当树集成机器学习具有平行分裂时使用盒式方法进行的上界优化。图2的功能适用于优化目标函数，比如使用零售产品的价格或库存水平的需求模型。图2的功能生成需求预测模型并根据该模型进行优化(例如，优化价格或库存)(即，假设需求单位将由所生成模型的预测给出，则优化价格/库存)。

在202处，当构建/训练每棵树时，存储分裂两侧的上界(即，最佳预期收益)。

在204处，考虑每棵树的顶部分裂。

在206处，选择树分裂数量最多的特征。

在208处，使用202中存储的上界来优化206中的特征。这是通过基于上界和树分裂标准所认为的最优内容对特征的可行域进行子集构造来完成的。

在210处，保存208中优化的特征的上界/下界。

在212处，使用边界，使树向下移动到下一个叶。

在214处，确定是否已经到达每棵树的叶。如果是，则在216处完成优化。如果否，则在206处继续下一节点的功能。

图3图示了根据实施例的用于进一步解释图2的功能的三个示例树301至303和对应的符号。图3的符号如下：

是树t中节点i处的分裂决策

是树t中叶节点i的收益

是去往节点i左侧或右侧子节点的二元决策

L^t是一组叶节点

图4用图3的符号图示了图2的功能。401对应于图2的206。402对应于图2的208。403对应于图2的210。

图5是根据一个实施例的图1的需求模型生成16的功能在生成需求模型的优化树集成时的流程图。图5的功能是当树集成机器学习具有超平面分裂时使用超平面方法进行的上界优化。图5的功能适用于优化目标函数，比如零售产品的需求模型。

在502处，当构建/训练每棵树时，存储分裂两侧的上界(即，最佳预期收益)。

在504处，考虑每棵树的顶部分裂。

在506处，优化分裂以使用502中存储的上界找到每棵树的最优子节点。

在508处，基于由每棵树的子节点确定的最优域和椭球近似来计算新的可行域。

在510处，使用508的可行域上的边界，使树向下移动。

在512处，确定是否已经考虑了树的每个叶。如果是，则在514处完成优化。如果否，则在506处继续下一个叶的功能。

图6用图3的符号图示了图5的功能。601对应于图5的504、510和512。602对应于图5的506。603对应于图5的508。

图7图示了根据本发明实施例的图2的功能在四树集成中的结果的示例。图7的示例使用了一个葡萄酒数据集，所述数据集是根据从葡萄牙北部采样的葡萄酒创建的，目的是基于理化检验来预测葡萄酒的质量。所述数据集包括12个特征和4898个数据点。目标变量(即，由树集成生成的预测)是3到8之间的整数，用于预测葡萄酒的质量。部分特征列表包括酒精度、硫酸盐水平、挥发性酸度和pH值。

图7图示了对具有4棵树的森林进行优化的示例。图7的示例是简化样例，因为通常会有200至500棵树。框701至704突出显示通过优化找到的解。可以看出，通过根据实施例的优化找到的解接近真正的最优性，如突出显示部分711至714所示。在规模上(例如，200至500棵树)，几乎不可能找出哪些特征值会带来最优解。相反，实施例生成接近最优的解，如在图7的4棵树上找到的解所证明的。

由于图2的功能，所生成的边界包括以下内容：

·挥发性酸≤0.363

·11.55≤酒精

·0.645≤硫酸盐

·0.995≤密度

·非挥发性酸≤8.85

因此，根据图7的4棵树，其他7个特征对于葡萄酒的品质而言并不重要。实施例仅生成预测模型中使用的特征上的边界。根据所述模型，这些边界内的任何点都将具有较高的葡萄酒质量，因此葡萄酒供应商/提供商可以做出适当的选择。当预测商品销售额时，会对零售执行类似的分析，因此只针对有助于预测商品需求/销售的特征生成边界。

如所公开的，在实施例中，使用上述功能(即，图2和图5)生成的需求模型用于确定零售商品的优化定价或零售商品的优化库存水平，并且还可以用于需要非参数ML模型的其他应用。

价格优化

在实施例中，由需求模型生成16生成的优化树集成需求模型在价格优化系统中实施。图8图示了根据实施例的使用优化树集成需求模型的示例价格优化系统。图8图示了根据一个实施例的生成一组商品的价格表的计算机化系统100。价格表例如是存储在存储器中的数据结构，其中包含本文所述的信息的数据值和/或记录。系统100包括控制处理器执行下面公开的各种操作的价格表逻辑110。在一个实施例中，价格表逻辑110被实施为体现在存储在非暂态计算机存储介质中的模块中的计算机指令，其中所述指令被配置为可执行算法，所述可执行算法被配置为当至少由计算设备的处理器执行时执行如本文所述的功能。

价格表逻辑110通过网络或互联网连接上的电子通信与零售商的计算设备交互。术语“零售商”或“请求设备”旨在包括由零售商控制的计算设备，所述零售商对待售商品进行定价，并且向系统100请求所述零售商所出售商品的价格表。价格表逻辑110被配置为从零售商的远程计算设备接收电子通信，所述电子通信传送商品的价格数据、商品的库存数据、商品的每细分需求模型以及所选择的目标函数。

价格数据定义了针对每种商品要考虑的一组价格。这组价格包括商品的常规价格、促销价格和降价价格。在一个实施例中，将促销价格和降价价格分为两组，两组均不包括商品的常规价格，以简化促销季和降价季的计算。有时，这组价格被称为商品的“价格阶梯”。在一个实施例中，价格表逻辑110还输入每种商品的成本数据以用于计算利润。

库存数据包括“库存数量”，出于本说明的目的，所述库存数量包括常规季节开始时现有商品的初始库存数量并且可选地包括常规季节期间为补充库存而计划的商品发货量。为了输入或接收一组商品的价格数据和库存数据，价格表逻辑110可以查询存储这种数据的数据库(例如，编码价格阶梯、库存和补充数量的电子记录)。

每细分需求模型可以由零售商提供或者以其他方式提供给价格表逻辑110，并使用需求模型生成模块16来确定。在一个实施例中，每细分需求模型是基于非参数树的ML模型，比如随机森林或XGBoost。在一个实施例中，每细分需求模型是存储的一组指令，所述指令当由处理器执行时，基于商品的价格和其他因素(比如弹性、促销疲劳、季节性等)来计算商品需求。每细分需求模型包括针对不同客户细分的不同需求参数值。下面将详细描述一种示例每细分需求模型，然而，应当理解，在实施例中可以使用任何需求模型，包括不能区分不同客户细分的需求模型。在一个实施例中，零售商基于他们自己的销售历史和经验提供需求参数的值。在其他实施例中，价格表逻辑110存储并维护每细分需求模型，或从不同的来源获得每细分需求模型和参数值。

目标函数定义了零售商寻求最大化的销售相关数量，并且可以被视为需求模型的目标变量。示例目标函数包括利润和收入。

价格逻辑110被配置为生成包括促销部分和降价部分的价格表。价格表向商品指派从所述商品的常规季节以及清仓季节期间各个时间段(例如，数周或数天)的一组价格中选择的一系列价格。针对每个客户细分生成商品的价格表。“单身”客户细分和“妈妈”客户细分的示例价格表如图8所示。可以看出，在价格表的“常规/促销”部分中，这两个客户细分的价格表是不同的，而在价格表的“清仓/降价”部分中，这两个客户细分的价格表是相同的。价格表逻辑110被配置为通过网络连接将价格表传输至零售商以用于对商品进行定价。

当考虑到客户细分时，促销和降价计划问题会成比例地增加。执行每细分促销和降价计划的挑战之一是，不同的客户细分共享相同的库存。另一挑战是，所有客户细分的降价策略通常是相同的，而每细分的促销定价可以通过有针对性的营销来实现。价格表逻辑110包括分配逻辑120、促销逻辑130和降价逻辑140，它们共同协作以使用多阶段过程生成价格表的促销部分和降价部分来应对这些挑战。

分配逻辑120被配置为至少基于每个客户细分对目标函数的预测贡献在多个客户细分间分配库存数量(例如，初始库存数量以及可选的补充数量)。通过在对每个客户细分进行促销价格确定之前将库存分配给每个客户细分，打破了客户细分之间的联系，从而大大简化了生成价格表的促销部分和降价部分的过程。

例如，一个钱包可能会出售给三个不同的客户细分：单身女性、母亲和退休人员。每细分需求模型通过包括每个细分的不同需求参数值来指定这些不同类型客户的特定行为。分配逻辑120被配置为预测每个客户细分对目标函数的贡献。在一个实施例中，基于每细分需求模型，分配逻辑120可以确定：(1)当所有库存数量都分配给单身女性细分时，将产生1200美元的收入(即，目标函数)；(2)当所有库存数量都分配给母亲时，将产生1000美元的收入；并且(3)当所有库存数量都分配给退休人员时，将产生300美元的收入。分配逻辑120基于该预测贡献将库存数量分配给不同的客户细分(例如，1200/(1200+1000+300)或48％的库存数量分配给单身女性客户细分，以此类推)。在其他实施例中，使用预测每个客户细分对目标函数的贡献的其他方法。

促销逻辑130被配置为确定价格表的促销部分。对于每个客户细分，基于分配给客户细分的库存数量，促销逻辑130被配置为确定价格表中使目标函数最大化的促销部分。促销部分为商品指派从所述商品的常规季节期间各个时间段的一组价格中选择的一系列价格。

降价逻辑140被配置为在常规季节结束时汇总每个客户细分的剩余库存数量。降价逻辑140被配置为至少基于汇总的库存来确定商品的价格表中使目标函数最大化的降价部分。降价部分为商品指派从所述商品的清仓季节期间各个时间段的一组价格中选择的一系列价格。价格逻辑110将每个客户细分的促销部分和降价部分进行组合以创建针对所述客户细分的价格表。

在一个实施例中，系统100是计算/数据处理系统，其包括用于企业组织的一个应用或分布式应用的集合，并且可以由图1的系统10实施。应用和计算系统100可以被实施为与基于云的联网系统、“软件即服务”(“SaaS”)体系结构或其他类型的联网计算解决方案，或者被配置为与其一起操作。在一个实施例中，价格表逻辑110是集中式服务器端应用，该应用至少提供本文公开的功能，并且由许多用户通过计算机网络经由与计算系统100(充当服务器)通信的计算设备/终端来访问。系统100的附加细节在美国专利序列号16/380,185中公开，所述美国专利的细节通过援引并入本文。

库存优化

在实施例中，由需求模型生成16生成的优化树集成需求模型在库存管理优化系统中实施。通过实施根据实施例的优化树集成需求模型，可以使用利用需求模型的任何已知的库存优化系统。一般来说，库存优化涉及分类中每种产品的两个问题：何时下订单以及订购多少。使用最广泛的库存管理模型是s/S策略。在这样的模型中，周期性地审查库存，并且当库存位置低于‘s’时，就会下订单以将库存水平提高到‘S’。s和S值越大，缺货和预期收入损失的风险就越低，但库存持有成本就越高。另一方面，s和S值越小，将导致库存成本越低，但代价是预期收入损失就越大。考虑到这种权衡，目标是确定每个库存单位(“SKU”)商店的最优s/S策略，以实现收入损失与库存成本之间的最优平衡，同时考虑空间容量、最小/最大订单数量和交货时间的变化。

在已知的实践中，每个SKU商店的最优策略是通过一般的暴力搜索对s/S的大量组合进行大规模模拟以对成本-收入权衡进行数字评估来确定的。对于中等规模的杂货连锁店来说，SKU商店的数量可以达到300000个，这就需要对数百万个SKU商店的策略进行模拟，而每周运行一次模拟几乎是不可能的。

为了克服上述挑战，实施例开发了上面结合图1至图7公开的优化树集成ML模型，以基于比如需求分布、交货时间、包装尺寸和空间容量等变量来预测与不同s/S策略相关联的收入损失和库存成本。为此，实施例通过针对不同的需求分布和不同的s/S范围对SKU商店策略的子集进行模拟来构建训练数据集。这些模拟的输出将充当可以用于训练比如随机森林等监督模型的标记数据。

接下来，实施例使用生成的优化树集成ML模型将库存优化问题公式化为混合整数规划，以最小化目标。典型的目标是使库存总成本(包括持有成本和固定订单)和收入损失的加权组合最小化。所述约束是由空间容量、与不同供应商的合同协议以及最低库存要求驱动的。与促销和降价定价问题类似，实施例可以利用上界优化公式并研究其在准确性和速度方面的性能。ML模型的该优化问题将取代大规模模拟，因此在减少计算时间和硬件成本方面将有巨大的改进，同时还能更稳健地合并不同的约束。

图9是根据一个实施例的图1的需求模型生成16在使用经训练的优化树集成生成零售商品的需求模型时的功能的流程图。与上面图3和图5的功能一样，图9的功能生成需求预测模型并根据该模型进行优化(例如，优化如上所述的价格或库存)。

在902处，实施例生成/训练树集成ML模型(其由多棵树构成，比如200至500棵树)，并存储树的上界。训练可以包括使用训练数据集和验证数据集，并且数据可以是零售商品的历史销售数据，包括所有相关特征。

在904处，实施例生成目标函数(比如使价格或收入最大化)以及与零售商品相关的任何业务约束。

在906处，考虑每棵树的顶部分裂。

在908处，优化所述分裂以使用上界并以任何业务约束为条件找到最优子节点。

在910处，计算新的可行域。

在912处，实施例使用可行域上的边界使树向下移动到下一分裂层次。

在914处，确定是否已经到达每棵树的叶节点。若是，则在916处完成优化。否则，功能在908处继续进行。

然后，在某些实施例中使用在916处完成的优化需求模型来确定如上所述的优化定价或优化库存水平。

图10图示了根据一个实施例的制造、库存和物流一体化系统1000，该系统包括使用如本文所公开的优化需求模型的需求预测。实施例可以使用优化需求模型来实现过程的完全自动化。例如，作为使用优化需求模型并确定优化定价或优化库存水平的结果，图1的系统10可以从库存管理系统为确定的最终库存分配生成电子订单，所述电子订单使得使用运输机制将重新分配的一定量的零售商品从一个或多个仓库发送至一个或多个零售商店，并在多个仓库中的一个或多个仓库处履行所生成的电子订单。

如图10所示，系统1000可以包括产品需求预测系统1070，所述预测系统预测未来产品需求，并且在一些情况下预测和/或考虑一个或多个零售商店1001至1004处的数十万种产品或者在一些应用中数千万或更多产品的未来需求。预测系统1070通过云网络1050或其他类型的通信网络与一个或多个库存系统1020和一个或多个制造系统1080通信。

预测系统1070通过生成优化需求模型来实施上面结合图1至图7公开的功能，从而生成需求预测。库存系统1020储存库存并提供运输物流以使用卡车1010至1013或一些其他运输机制将商品交付至商店1001至1004。在一个实施例中，库存系统1020实施企业资源规划(“ERP”)专用计算机系统或专用库存控制系统，所述计算机系统或控制系统使用来自需求预测系统1070的输入来确定库存水平以及向商店1001至1004交付商品的量和时间。在一些实施例中，图10的功能可以使用自动装载机制和自动驾驶运输以及专用数据结构实现完全自动化。

制造系统1080制造要发送至库存系统1020的商品并提供使用卡车1081或一些其他运输机制将商品交付至库存系统1020的运输物流。在一个实施例中，制造系统1080实施ERP专用计算机系统或专用制造系统，所述计算机系统或制造系统使用来自预测系统1070的输入来确定要制造的商品的量、用于制造的资源的库存以及向库存系统1020交付商品的量和时间。

预测系统1070可以利用来自库存系统1020、销售跟踪系统(未示出)和/或数据库的信息来预测产品需求。在预测需求时，预测系统1070试图预测由事件、天气、社会需求、经济因素和其他因素导致的一种或多种产品的非寻常需求。可以跟踪可能对一种或多种产品的需求产生影响的数十、数百到数千个不同的变量。这些变量的变化可能会导致非寻常需求。例如，可以跟踪预测天气的变化，并且与预测天气相关联的一个或多个变量可以用于确定这种天气变化是否会对需求产生影响，并且可以进一步预测需求变化。

一般来说，图10中的元件执行库存的销售、制造或消耗。由于影响销售的随机性和外部因素，直接面向消费者销售的零售地点/商店1001至1004的库存模式最不稳定。然而，制造设施以及消耗库存(比如产品集成商、互联网托运商等在本地设施中使用的产品)的场所也受益于如本文公开的需求预测。如所公开的，每个零售地点1001至1004将销售数据和历史预测数据发送至预测系统1070。销售数据包括在先前销售周期(即，周)(通常为4至7周的库存周期)中的每个销售时段(通常为天)内每种商品或SKU/UPC的库存消耗统计。

预测系统1070将销售数据存储在储存库1072中，并且利用销售数据来生成补充库存的订单。订单包括一组商品和每种商品的数量，用于维持商店1001至1004处的库存水平。

许多零售订购方案都依赖于一周中的数天作为销售时段和销售周期。在一种配置中，在具有库存统计的库存管理环境中，其中库存统计特定于一周中的每一天，库存系统1020通过为一周中的每一天收集来自先前销售的库存水平统计来确定目标库存水平。实施例基于库存水平统计来计算一周中的每一天的库存水平，使得安全库存适应一周中不同天之间的库存变化。实施例为多种商品中的每种商品呈现指示目标库存水平的库存水平，包括一周中每一天的安全库存。实施例基于交货时间计算订购数量，使得订购数量在确定的一周中的某一天到达以满足呈现的库存水平。确认实际库存水平包括根据历史数据确认前几周中某一周中的某一天的库存水平，从而重点关注一段时间内一周中的同一天，而不是这一周中所有天的平均值。

在特定配置中，所公开的实施例可以与专用和/或特别大容量的零售销售环境结合使用。在大型物流和配送业务中，尽可能将卡车装满是有益的，并且在需要将商品推迟到下一趟运输的情况下选择使销售活动中断的可能性最小的那些商品是有益的。因此，实施例可与POS系统99结合操作，以识别销售和补充速度往往快于其他商品的高速或高周转商品。商品上的UPC条形码符号或射频识别(“RFID”)包括字段、名称或值，其单独地或与数据库查找结合地将商品指定为适合于本文所定义的安全库存处理的高速商品。

可以通过以下方式供应高速商品：为库存数据库中表示的多种商品中的每种商品识别产品标识符字段和表示所述商品的安全库存的字段，以及基于指示由销售量而增加的产品补充需求的产品速度来为每个产品标识符确定产品细分字段。所公开的实施例基于速度字段确定是否计算安全库存，即，考虑到产品吞吐量，根据安全库存进行再供应的开销和负担是否值得。

在其他实施例中，供应物流可以调用高于一天一辆卡车的交付频率，因此触发具有更高粒度的再供应窗口。在这种情况下，安全库存可能比单独一天更具体，比如为星期一上午和星期一下午，或者在一周中的某一天内指定多个交付或时间窗口，比如在上午7:00、上午11:00和下午4:00。

包括生成的需求预测的实施例可以用于实施供应物流，并根据运输商品的需求和利润率来指定交付方式(即，卡车)和清单(即，所包含的商品)。高速商品可能被认为在特定交付上具有优先空间，但可以进一步基于所包含商品的利润率或涨价来进行选择，并且选择创收潜力最大的商品以纳入其中。

在使用本文公开的需求预测并且具有多个运输车辆的这种产品库存运输环境中，每个车辆(例如，卡车)被配置用于接收固定有效载荷的商品，以交付至销售地点进行库存补充。实施例可以为交付车辆的装载提供指导，即，针对包括第一商品和第二商品在内的多种商品中的每种商品，计算安全库存，以及基于所计算的第一商品和第二商品的安全库存来确定要装载到交付车辆中的第一商品和第二商品中每种商品的数量。如果交付车辆中没有足够的空间可用于已确定数量的第一商品和第二商品(这意味着某些商品将需要被删减并推迟到下一次交付)，则实施例基于安全库存重新计算卡车装载数量。

如所公开的，上界优化找到一组变量的最佳值范围(即，域)，所述最佳值范围将最大化/最小化集成树的预测或基于预测的函数。在集成树学习方法中，组合来自多个决策树的预测，以获得比可以单独从任何单棵树获得的预测性能更好的预测性能。在每棵树中，各分支表示不同的决策路径，并且每个叶节点表示一个结果。实施例利用树的构建过程来存储关于树分裂的两侧可能达到的最佳收益的信息，这即为上界优化。该信息是在无需探索树的整个深度的情况下基于分裂数据创建和存储的，并且用于在迭代3步算法中进行快速优化。

一般来说，实施例以迭代方式使树的层次向下移动。在每个层次上，它都会根据上界进行优化以选择最优子节点，并相应地重新计算每个特征上的边界。

通过以高效的方式存储和检索信息，实施例可以是可扩展的。这是通过将树转换为数据帧、存储每个节点的关于分裂两侧的上界的信息以及利用比如哈希表等数据结构来存储信息来实现的。然后执行一系列优化。

根据实施例的上界优化可以在基于预测使函数最小化或最大化的后续优化问题中处理非参数预测模型，比如树集成。这种非参数机器学习模型通常可以提高预测准确性，进而使通过优化公式生成的定价和库存决策更稳健。实施例具有良好的扩展性，并且可以处理大量的特征或树以及大量的数据。这一点很重要，因为零售业优化问题的规模与SKU/商店的数量成比例，对于中等规模的零售商而言，SKU/商店的数量可以达到数十万。

实施例可以容易地合并业务约束并且是易处理的。与尝试解决类似问题的其他解决方案不同，实施例不要求问题不受约束或仅具有基于单个特征的约束。例如，在定价优化问题中，存在与促销和降价相关的各种时间和跨产品约束。类似地，在库存优化问题中，基于与供应商的合同协议、空间容量和交货时间，可能存在数千个约束。

实施例不仅可以应用于零售预测和优化问题的上下文中，而且可以应用于表现出类似结构特性的任何类别的优化问题。实施例将树集成ML模型与复杂的大规模优化问题无缝集成。实施例的优点包括：使用优化方法，可以在后续优化问题中使用由机器学习模型产生的预测；实施例可以容易地合并业务约束；实施例具有良好的扩展性，并且适合于解决实际的大规模问题；并且实施例可以应用于广泛类别的优化问题。

贯穿本说明书描述的本公开的特征、结构或特性可以以任何合适的方式组合在一个或多个实施例中。例如，贯穿本说明书的“一个实施例”、“一些实施例”、“某个实施例”、“某些实施例”或其他类似语言的使用是指结合实施例描述的特定特征、结构或特性可以包括在本公开的至少一个实施例中这一事实。因此，贯穿本说明书的短语“一个实施例”、“一些实施例”、“某个实施例”、“某些实施例”或其他类似语言的出现不一定都是指同一组实施例，并且所描述的特征、结构或特性可以在一个或多个实施例中以任何合适的方式组合。

本领域普通技术人员将容易理解，如上所讨论的实施例可以以不同顺序的步骤和/或以不同于所公开配置的元件来实践。因此，虽然本公开考虑了所概述的实施例，但是对于本领域技术人员来说将显而易见的是，某些修改、变化和替代构造将是显而易见的，同时仍然在本公开的精神和范围内。因此，为了确定本公开的范围和界限，应当参考所附权利要求。

Claims

1.一种生成零售商品的优化需求模型的方法，所述方法包括：

训练包括多棵树的树集成机器学习模型，所述训练包括存储所述树中的每棵树的上界，所述树包括与影响所述商品需求的需求特征相对应的层次和分支；

生成所述需求模型的目标函数；

在每棵树的顶部分裂处，使用所存储的上界确定最优子节点；

计算每棵树的新的可行域；

使用所述新的可行域上的边界，使每棵树向下移动到下一分裂层次；以及

当到达每棵树的叶节点时生成所述优化需求模型。

2.如权利要求1所述的方法，所述上界包括关于每棵树的分裂两侧的最佳收益的信息。

3.如权利要求1所述的方法，进一步包括：

当没有到达每棵树的叶节点时，优化所述下一分裂层次。

4.如权利要求1所述的方法，进一步包括基于所述优化需求模型生成所述零售商品的优化降价定价。

5.如权利要求1所述的方法，进一步包括：

基于所述优化需求模型生成在多个零售商店中的每个零售商店处所述零售商品的优化库存水平。

6.如权利要求1所述的方法，其中，所述树集成机器学习模型包括平行分裂，所述训练包括使用盒式方法。

7.如权利要求1所述的方法，其中，所述树集成机器学习模型包括超平面分裂，所述训练包括使用超平面方法。

8.如权利要求5所述的方法，进一步包括：

基于所生成的优化库存水平，从库存管理系统生成电子订单，所述电子订单使得使用运输机制将一定量的所述零售商品从多个仓库中的第一仓库发送至多个零售商店中的第一零售商店，并且与使用非优化库存水平相比所述电子订单使得将附加量的所述零售商品发送至所述第一零售商店；以及

在所述多个仓库中的一个或多个仓库处履行所生成的电子订单。

9.一种计算机可读介质，其上存储有指令，所述指令当由一个或多个处理器执行时，使所述处理器生成零售商品的优化需求模型，所述生成包括：

生成所述需求模型的目标函数；

计算每棵树的新的可行域；

当到达每棵树的叶节点时生成所述优化需求模型。

10.如权利要求9所述的计算机可读介质，所述上界进一步包括关于每棵树的分裂两侧的最佳收益的信息。

11.如权利要求9所述的计算机可读介质，所述生成进一步包括：

当没有到达每棵树的叶节点时，优化所述下一分裂层次。

12.如权利要求9所述的计算机可读介质，所述生成进一步包括基于所述优化需求模型生成所述零售商品的优化降价定价。

13.如权利要求9所述的计算机可读介质，所述生成进一步包括：

14.如权利要求9所述的计算机可读介质，其中，所述树集成机器学习模型包括平行分裂，所述训练包括使用盒式方法。

15.如权利要求9所述的计算机可读介质，其中，所述树集成机器学习模型包括超平面分裂，所述训练包括使用超平面方法。

16.如权利要求9所述的计算机可读介质，所述生成进一步包括：

17.一种用于使用零售商品的历史销售数据来优化所述零售商品的需求模型的系统，所述系统包括一个或多个处理器，所述一个或多个处理器用于执行以下操作：

生成所述需求模型的目标函数；

计算每棵树的新的可行域；

当到达每棵树的叶节点时生成所述优化需求模型。

18.如权利要求17所述的系统，所述上界包括关于每棵树的分裂两侧的最佳收益的信息。

19.如权利要求17所述的系统，所述处理器进一步：

当没有到达每棵树的叶节点时，优化所述下一分裂层次。

20.如权利要求17所述的系统，所述处理器进一步基于所述优化需求模型生成所述零售商品的优化降价定价。