CN113706224A

CN113706224A - 一种基于机器学习的智能分销模型的建模方法

Info

Publication number: CN113706224A
Application number: CN202111260349.5A
Authority: CN
Inventors: 张卫平; 丁烨; 张浩宇; 张伟
Original assignee: Global Digital Group Co Ltd
Current assignee: Global Digital Group Co Ltd
Priority date: 2021-10-28
Filing date: 2021-10-28
Publication date: 2021-11-26

Abstract

本发明提供了一种基于机器学习的智能分销模型的建模方法；所述智能分销模型通过收集和分析历史分销模型下的销售数据，建立第一训练模型；在获得所述第一训练模型后，通过对关注的分销体系内的特征或者销售数据作出相关性计算，了解关注的特征与其余特征的相关性后，忽略具有较低相关性特征的数据从而生成第二训练模型。本发明的智能分销模型指向性地通过改变选定分销模型下关注特征的方法，指导商家在实际应用中利用所述智能分销模型对其中的一个或多个分销条件进行针对性的改变，从而实现在有限条件中尽可能大的利润增长和成本节约。

Description

一种基于机器学习的智能分销模型的建模方法

技术领域

本发明涉及销售模型技术领域。具体而言，涉及一种基于机器学习的智能分销模型的建模方法。

背景技术

随着当前第三产业的蓬勃发展，对于产品、服务的销售渠道的铺开和推广越加细致。传统的单一销售，由商家把握销售链的全路，虽然可以赚取销售产品后的总利润，然而随着市场竞争的白热化，消费者的需求多样化，单一销售体系进行产品销售无疑容易错过更为广大的市场。因此，近十年来，分销的理论以及各种分销模型应运而生，提供了商家更为丰富有效的销售手段。随着社会发展及市场趋于饱和，用户难以触达、流量贵、资金流等问题凸显，众多互联网产品也逐步引入分销体系，侧面来说，是一种多元化的营销方式。分销制度的主要目的在于快速触达用户，吸引精准群体。分销制度不仅仅是拓展销售渠道，还包括扩展相关销售功能，如调查研究、促销、谈判、编配、订货、物流、风险承担。每个分销渠道的成员都会共同分担风险，分享利益，在分销渠道中是一个共同体。因此，建立一个高效、优质的分销体系模型，能最大效率地利用分销制度，最大化产品销售的数量和利润。

在目前建立相关预测性运行模型的理论和实践中，已开始广泛使用机器学习算法以提高分销模型建立的效率以及预测准确度。机器学习算法基于样本数据，或称为“训练数据集”的数据集合，构建数学模型，使得在没有明确流程和计算公式的前提下做出预测或决策。同时，机器学习善于挖掘和发现数据中以前未知的属性和规律。机器学习和数据挖掘都可以用来分析大量数据，并利用分析建立有关计算模型，从而做出对未来的预测。

然而在某些情况下，各种节日、特殊时间节点的促销活动由于人们的节日需要，将一段时间周期内的销售数据进行了明显的刺激，脱离了现在的分销模型所预测的结果，可能导致总经销商认为市场出现了根本性变化，并按照既有分销模型进行分销商数量的错误扩张或者对分销商的提成；并且进一步的，虽然在该时间段内提高了产品的销量以及总利润，但是相对地，提前消费了产品的潜在市场需求，可能会导致在今后一段时间内的销售数据反而出现了下降。由于市场内的需求影响因素较多，各分销商在没有统一的分销策略和规则指导下，容易引起恶性竞争，引起潜在的销售危机，因此急需一种具指导意义的分销模型服务于总经销商，使其可以指导下属的分销商正确且高效地实施各自的销售计划和销售活动。

查阅相关地已公开技术方案，公开号为JP2021033807 (A)提出一种海产品的分销模型体系，通过计算和分析当日收获的海产量、库存量、市场需求量、拍卖价格等建立每级分销的数量和价格系统，提高整体的销售收益；公开号为TW202121294 (A)的技术方案包括一个智能分析系统，用于分析在网络销售中，多个客户在消费时的行为习惯，从而演算进一步消费的概率；公开号为KR20210105687(A)的技术方案提出一种适合中小企业的营销方法，通过海量收集市场销售信息，分析其中的关联性高的价值信息，指导企业的有效销售行为。当前的技术方案均为基于当前信息用以推导后续销售模型或者销售策略，还存在较大的提升空间。

发明内容

本发明的目的在于，提供一种基于机器学习的智能分销模型的建模方法；所述智能分销模型通过收集和分析历史分销模型下的销售数据，从而建立第一训练模型以及第二训练模型，并且在训练过程中有指向性地通过改变指定特征向量的方法，指导商家在实际应用所述智能分销模型时，对其中的一个或多个分销条件进行针对性的改变，从而实现在有限条件中尽可能大的利润增长和成本节约。

本发明采用如下技术方案：

一种基于机器学习的智能分销模型的建模方法，所述智能分销模型的建模方法包括以下建模步骤：

S1: 收集历史分销模式的体系数据，其中至少包括分销商的层级数量、各层级分销商的数量以及各层级分销商拥有的权利/义务要求；将所述体系数据进行定性分析和分类，建立第一数据集；

S2：收集历史分销模式的销售数据，其中包括每一个单独分销商的销售历史数据；将所述销售数据进行定量分析，建立第二数据集；

S3：将从步骤S1和S2中获得所述第一数据集和第二数据集进行预处理，获得分销商的原始销售特征矩阵；

S4：划分所述原始销售特征矩阵，建立训练集[P]和测试集[T]，使用神经网络对所述训练集[P]进行机器学习训练并以所述测试集[T]进行验证，当误差函数L的值小于第一阈值，停止机器学习，获得第一训练模型；

S5：从所述第一数据集中选取至少一个特征维度，并从所述第二数据集中选取至少一个特征维度，计算两者之间的相关系数；筛选相关系数灵敏度满足条件的特征维度并加以保留；

S6：使用保留的多个特征维度再次进行训练，获得第二训练模型；

其中，步骤S5中的相关系数计算的计算，按照从特征维度是否线性分布选择具体的相关系数计算公式；如特征维度属于非线性分布数据，则选择斯皮尔曼等级相关系数计算公式进行相关性计算；如特征维度属于线性分布数据。则选择皮尔逊相关系数计算公式进行相关性计算；

所述原始销售特征矩阵包括p个特征向量，每个特征向量包括q个特征维度，使所述原始销售特征矩阵为p*q矩阵；

将所述原始销售特征矩阵进行划分时，所述训练集[P]和所述测试集[T]的比例为8：2；

所述神经网络为三层神经网络，包括一个输入层，一个隐藏层以及一个输出层；

所述神经网络采用随机梯度下降算法进行训练；

在相关系数的计算中，对关注的两个特征维度相关高相关性、中相关性、低相关性分类；对低相关性的特征维度进行屏蔽或者从所述原始销售特征矩阵中删除；

一种用于所述基于机器学习的智能分销模型的建模系统，该系统包括：

数据收集模块，通过输入并存储历史分销模式下的所述第一数据集和第二数据集，对输入的数据进行分析和分类，并根据数据的特征形成所述分销商原始销售特征矩阵；

机器学习模块，用于基于神经网络算法，通过对所述训练集[P]进行机器学习，并且使用所述测试集[T]进行验证，从而获得所述智能分销模型；

迭代处理模块，用于根据所述机器学习模块的误差函数L和目标函数，确定学习目标；所述误差函数L基于当前智能分销模型下的最终销售利润与最大理论利润的差异值；所述目标函数用于在固定某个特征维度时，使其余特征维度、权值以及偏置值符合机器学习目标。

本发明所取得的有益效果是：

1. 本智能分销模型基于海量的历史分销体系的销售数据，以及基于未来继续输入的销售数据进行模型的参数迭代升级，数据来源可追溯性高，基于真实运行体系，模型具有良好的实施性；

2. 本智能分销模型通过常规机器学习训练获得第一训练模型后，再基于第一训练模型中筛选相关性较高的目标特征向量，从而获得有针对性训练的第二训练模型，有利于在实际情况中受客观条件限制下设计最优化实施方案；

3. 本智能分销模型通过三层的神经网络进行机器训练，其中的隐藏层数量为一个，平衡了运算成本和结果可效性，能够在一般的运算平台中进行建模；

4. 本智能分销模型进行了模块化设计，方便今后模型的升级或者更换模块，降低了使用成本。

附图说明

从以下结合附图的描述可以进一步理解本发明。图中的部件不一定按比例绘制，而是将重点放在示出实施例的原理上。在不同的视图中，相同的附图标记指定对应的部分。

图1为所述原始销售特征矩阵的示意图；

图2为用于机器学习的所述神经网络示意图；

图3为本发明的建模数据流动示意图；

图4为本发明的建模步骤示意图。

附图标号说明：101-输入层；102-隐藏层；103输出层。

具体实施方式

为了使得本发明的目的技术方案及优点更加清楚明白，以下结合其实施例，对本发明进行进一步详细说明；应当理解，此处所描述的具体实施例仅用于解释本发明，并不用于限定本发明。对于本领域技术人员而言，在查阅以下详细描述之后，本实施例的其它系统.方法和/或特征将变得显而易见。旨在所有此类附加的系统、方法、特征和优点都包括在本说明书内.包括在本发明的范围内，并且受所附权利要求书的保护。在以下详细描述描述了所公开的实施例的另外的特征，并且这些特征根据以下将详细描述将是显而易见的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或组件必须具有特定的方位.以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

实施例一：

S3：将从步骤S1和S2中获得所述第一数据集和第二数据集进行预处理，获得分销商原始销售特征矩阵；

如附图2，所述神经网络为三层神经网络，包括一个输入层，一个隐藏层以及一个输出层；

所述神经网络采用随机梯度下降算法进行训练；

迭代处理模块，用于根据所述机器学习模块的误差函数L和目标函数，确定学习目标；所述误差函数L基于当前智能分销模型下的最终销售利润与最大理论利润的差异值；所述目标函数用于在固定某个特征维度时，使其余特征维度、权值以及偏置值符合机器学习目标；

其中在所述建模步骤S1，所述的体系数据为设定一个分销条款中的各项对总销售商与下级分销商的各项规则条款，包含了双方或多方的权利/义务，包括：

关于体系布局：分销商的等级划分数量，每级分销商的数量，分销商寿命等；

关于成本布局：分销商的初期投入成本，分销商的最低库存数量等；

关于市场覆盖：分销商的覆盖区域、人群，分销商可进驻商圈数量等；

关于层级控制：包括分销商的销售返佣比例，分销商销售任务等；

关于评价晋级体系：分销商的评价标准和周期，晋级标准和周期等；

进一步的，在所述建模步骤S2中，所述的销售数据指各层分销商的销售业绩统计数据，为分销商的具体销售表现的数据化，以单个分销商为单位,统计的项目包括：

销售单价、销售数量、销售成本、销售速率、一次销售成功率、返单率等；

进一步的，所述建模步骤S3中，需要对所述第一数据集以及所述第二数据集进行标准化预处理，至少包括：

加入时间戳，使数据集可基于时间进行表征；

过滤异常数据，剔除由于数据库异常或者由于错误输入造成的异常数据；

统一统计的标准，例如销售数据中的起始时间节点，销售数量是否包括退换期内的商品数量等；

进一步的，可使用以周、双周、月、季度为周期，将统一项目取平均值后，作为该周期的统计数据；

组成的所述原始销售特征矩阵如附图1所示，为p*q的矩阵，矩阵的p行中的每一行代表一条分销记录数据，指明了在某个特定的分销体系下，分销商的具体表现；一条的分销记录数据，具有q个特征向量，分别由上述列出的各种统计数据作为特征向量，其中q的数目可根据统计的范围广度以及建模设备的运算能力确定，例如q可选为100个或128个；

进一步的，举例来说，矩阵中的每一行包括：

[分销商层级，一级分销商数量，二级分销商数量，三级分销商数量，一级分销商的返佣率，一级分销商的任务，二级分销商的返佣率，二级分销商的任务，三级分销商的返佣率，三级分销商的任务，一级分销商的销售数量，二级分销商的销售数量，三级分销商的销售数量……]；

数据集合如下表格所示：

进一步的，将每一个维度表示为x_i,其中i为正整数且i=[1，q]；最后一共列出p行所示的特征向量，并形成所述所述原始销售特征矩阵；

进一步的，所述建模步骤S4中，将所述原始销售特征矩阵按8:2的比例分为所述训练集[P]和所述测试集[T]；分配的依据可以按时间段落，例如所述原始销售特征矩阵包括了从2011年至2021年的销售特征记录，则将2011年至2019年的数据作为所述训练集[P]，而2020年至2021年的数据作为测试集[T]；

进一步的，对于第一训练模型，可以表示为：

公式1：

；

其中ω_i为特征向量的q个维度其中一个维度x_i的权值，θ为模型的输出偏置值；公式1表示在所述第一训练模型中，对一条具有q个特征值的销售数据而言，每个特征值都有其对输出值影响的权重值，并且对于具有q个特征值的特征向量来说，具有q个所述权重值ω_i；

进一步的，对于销售数据而言，特征数据的数量并不多，而且通常来说在一定可预见的范围内，因此，用于机器训练的神经网络层数优选地设置为一个输入层，一个隐藏层，一个输出层，即可兼顾了建模时间的复杂程度和成本；

进一步的，在生成所述第一训练模型后，计算人员可以观察其中的权重值ω_i，对其中权重值较低的权重值ω_i进行筛选后，再次使用所述训练集[P]进行训练，并优化所述第一训练模型从而获得第二训练模型。

实施例二：

本实施例应当理解为至少包含前述任意一个实施例的全部特征，并在其基础上进一步改进；

在以上获得所述第一训练模型后，可以理解地，人们会将注意力落到其中某一个或几个特征维度上，或者是关注其中的两个特征向量维度的相互关系，在机器训练的过程中，有针对性地调整其他维度后，再次进行训练；

举例来说，在一些实施例中，人们关心的是，在三级分销商的数量与最终销售数量的关系，因为在三级分销商数量若太多的情况下，有可能存在分货不均或者在市场中存在恶性降价，从而影响了最终的销售数量；而如果三级分销商数量的数量太少，则分销的效率则得不到有效的提高，还存在较大提升空间；然而，在某些情况下，人们并不了解两个特征维度的相关程度的强弱，或者说，这两者的相关程度是否存在可计算的线性关系，从而利用分销模型可以给出优出的配置方案；因此，首先使用相关的算法计算两个特征维度的相关性；在所述第一训练模型的基础上，可以继续作出优化；

可供使用的计算两个特征维度的相关性的算法，可以采用斯皮尔曼等级相关系数或者皮尔逊相关系数算法进行计算，视乎所关心的两个特征维度是否线性分布；

其中，斯皮尔曼等级相关系数的计算公式为：

公式2：

；

公式3：

；

公式2中，x_a和x_b表示两个关注的特征维度，

和

表示特征值x_ja和x_jb在特征维度x_a和x_b中各自的秩次；d_j则代表

和

的秩次之差；

公式3中，γ为斯皮尔曼等级相关系数，其值的范围是[-1,1]；当γ的绝对值越接近1，则表示所计算的两个特征维度的相关度越高，并且越接近-1，两个特征维度呈负相关；越接近1，两个特征维度呈正相关；当γ的绝对值越接近0，则表示所计算的两个特征维度的相关度越低；

或者，使用皮尔逊相关系数计算公式：

公式4：

;

公式4中，

、

为特征维度x_a和x_b中p个数据的平均值；ρ_p是皮尔逊相关系数，ρ_p的范围也是[-1,1]，相关程度的判断与上述斯皮尔曼等级相关系数一致，在此不作赘述；

具体来说，设代表三级分销商数量的维度为x_a，代表三级分销商的平均销量的维度为x_b，两者皆为线性分布的维度，则可以采用以上皮尔逊相关系数计算公式，了解三级分销商数量与三级分销商的平均销量的相关性，若两者相关性较强，则可以通过调整其中一个维度的数量作为模型的输出，优化所述第一训练模型后，将若干个与关注维度相关性较低的维度删去，从而再次进行机器训练获得优化后的第二训练模型；例如通过调整三级分销商的数量令三级分销商的平均销量提高，在进行第二训练模型的深度训练时，删去与三级分销商无关的特征维度；或者设定三级分销商的平均销售数量目标，删去与三级分销商的平均销量无关的特征维度，从而确定应该设置三级分销商的数量。

实施例三：

本实施例应当理解为至少包含前述任意一个实施例的全部特征，并在其基础上进一步改进：

对于所述的第一数据集是人为地根据当前的规则作出分销体系的设定；该设定可能只是根据以往管理和统计人员对分销体系中积累的经验作出经验性的设定；而所述的第二数据集，则是在某个具体的分销体系设定中，分销商呈现出的具体销售业绩，两者存在因果关系；在某些情况下，可以通过选定在所述第二数据集中的某个特征维度x_c，计算x_c与所述第一数据集的所有特征维度的相关性，从而有针对性地面向需要改变的目标，对分销体系进行优化，并建立所述第二训练模型；

在获得所述第一训练模型后，由于已经可以通过所述第一训练从而获取多组具有严格线性关系的通过第一训练模型生成的参考特征向量；在原始数据中，具有大量的噪音，影响了对于二次建模的精确度；而所述参考特征向量由于是基于成品模型生成的理想化特征向量，其纯净度以及与模型的贴合程度更好，有利于进行二次建模；

进一步的，选定在所述第二数据集中的特征维度x_c作为关注维度，将所述第一数据集中的m个维度与维度x_c进行逐一计算其相关系数，获得m个相关系数ρ的组合，且ρ∈[-1,1]；设置一个相关程度阈值ρ_s，使相关程度阈值ρ_s=0.05或者ρ_s=0.1，则从所述第一数据集中选取相关系数

的所有特征维度的数据，表明这部关特征维度的数据与特征维度x_c相关性较强，同时删除其余相关系数较低的特征维度，形成一个基于所述第一训练模型的第一销售特征数据矩阵；

所述第一销售特征数据矩阵精简了部分所述第一数据集的维度后，有利于倾向目标维度x_c作出指向性的建模，使得生成的所述第二训练模型更符合人们的预设目标；

基于本实施例的实施方式，可以通过设定改善目标的方向，或者基于当前分销体系中较容易实施改善的方向进行分销模型的训练，优先地进行分销体系的调整。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

虽然上面已经参考各种实施例描述了本发明，但是应当理解，在不脱离本发明的范围的情况下，可以进行许多改变和修改。也就是说上面讨论的方法，系统和设备是示例。各种配置可以适当地省略，替换或添加各种过程或组件。例如，在替代配置中，可以以与所描述的顺序不同的顺序执行方法，和/或可以添加，省略和/或组合各种部件。而且，关于某些配置描述的特征可以以各种其他配置组合，如可以以类似的方式组合配置的不同方面和元素。此外，随着技术发展其中的元素可以更新，即许多元素是示例，并不限制本公开或权利要求的范围。

在说明书中给出了具体细节以提供对包括实现的示例性配置的透彻理解。然而，可以在没有这些具体细节的情况下实践配置例如，已经示出了众所周知的电路，过程，算法，结构和技术而没有不必要的细节，以避免模糊配置。该描述仅提供示例配置，并且不限制权利要求的范围，适用性或配置。相反，前面对配置的描述将为本领域技术人员提供用于实现所描述的技术的使能描述。在不脱离本公开的精神或范围的情况下，可以对元件的功能和布置进行各种改变。

综上，其旨在上述详细描述被认为是例示性的而非限制性的，并且应当理解，以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后，技术人员可以对本发明作各种改动或修改，这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims

1.一种基于机器学习的智能分销模型的建模方法，所述智能分销模型的建模方法包括以下建模步骤：

S3：将从步骤S1和S2中获得所述第一数据集和所述第二数据集进行预处理，获得分销商原始销售特征矩阵；

其中，步骤S5中的相关系数的计算，按照从特征维度是否线性分布选择具体的相关系数计算公式；如特征维度属于非线性分布数据，则选择斯皮尔曼等级相关系数计算公式进行相关性计算；如特征维度属于线性分布数据，则选择皮尔逊相关系数计算公式进行相关性计算。

2.根据权利要求1所述一种基于机器学习的智能分销模型的建模方法，其特征在于，所述原始销售特征矩阵包括p个特征向量，每个特征向量包括q个特征维度，使所述原始销售特征矩阵为p*q矩阵。

3.根据权利要求2所述一种基于机器学习的智能分销模型的建模方法，其特征在于，将所述原始销售特征矩阵进行划分时，所述训练集[P]和所述测试集[T]的比例为8：2。

4.根据权利要求3所述一种基于机器学习的智能分销模型的建模方法，其特征在于，所述神经网络为三层神经网络，包括一个输入层，一个隐藏层以及一个输出层。

5.根据权利要求4所述一种基于机器学习的智能分销模型的建模方法，其特征在于，所述神经网络采用随机梯度下降算法进行训练。

6.根据权利要求5所述一种基于机器学习的智能分销模型的建模方法，其特征在于，在相关系数的计算中，对关注的两个特征维度相关高相关性、中相关性、低相关性分类；对低相关性的特征维度进行屏蔽或者从所述原始销售特征矩阵中删除。

7.一种适用于如权利要求1所述建模方法的建模系统，该系统包括：

数据收集模块，通过输入并存储历史分销模式下的所述第一数据集和所述第二数据集，对输入的数据进行分析和分类，并根据数据的特征形成所述原始销售特征矩阵；

机器学习模块，用于基于神经网络算法，通过对训练集[P]进行机器学习，并且使用测试集[T]进行模型验证，从而获得所述智能分销模型；

迭代处理模块，用于根据所述机器学习模块的误差函数L和目标函数，确定学习目标；所述误差函数L基于当前智能分销模型下的实际销售利润与理论利润的差异值；所述目标函数用于在固定某个特征维度时，使其余特征维度、权值以及偏置值符合机器学习目标。

8.一种计算设备，其特征在于，该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器；其中，当该计算机程序指令被该处理器存执行时，触发所述计算设备执行如权利要求5所述的建模方法步骤。

9.一种计算机可读介质，其特征在于，所述可读介质存储有计算机程序指令；所述计算机程序指令可被处理器执行以实现如权利要求5所述的建模方法步骤。