CN117593044B

CN117593044B - 一种双角度的营销活动效果预测方法、介质及系统

Info

Publication number: CN117593044B
Application number: CN202410070280.7A
Authority: CN
Inventors: 周书田; 张睿; 洪锋; 王炳文
Original assignee: Qingdao Wangxin Information Technology Co ltd
Current assignee: Qingdao Wangxin Information Technology Co ltd
Priority date: 2024-01-18
Filing date: 2024-01-18
Publication date: 2024-05-31
Anticipated expiration: 2044-01-18
Also published as: CN117593044A

Abstract

本发明提供了一种双角度的营销活动效果预测方法、介质及系统，属于营销活动效果技术领域，该双角度的营销活动效果预测方法、介质及系统包括以下步骤：根据营销活动相关数据进行特征提取，并将得到的活动特征进行特征分类；对分类后的营销活动数据进行特征处理得到处理后特征；将处理后特征输入回归预测模型，得到第一预测结果；根据历史营销活动特点及历史营销活动数据对活动进行分类，并为活动训练预测模型用于处理生成特征向量并学习时序特征；采用对应的预测模型对营销活动的效果进行预测，得到第二预测结果；对预测结果进行融合，得到营销活动的最终效果预测结果，本发明将整体预测和时序预测结果进行加权融合，提高了结果的稳健性。

Description

一种双角度的营销活动效果预测方法、介质及系统

技术领域

本发明属于营销活动效果技术领域，具体而言，涉及一种双角度的营销活动效果预测方法、介质及系统。

背景技术

随着互联网的快速发展，营销活动在商品销售中发挥着越来越重要的作用。针对不同场景设计的线上线下营销活动，可以吸引用户参与，提高品牌知名度和产品销量。因此，许多企业会投入大量资源举办各类营销活动。为了充分发挥活动效果，企业需要能够对活动的客户吸引量、销售量等整体效果进行准确预测，以便优化活动方案；同时还需要能够对活动进行时序监控，预测活动过程中的效果，以便及时调整活动策略。目前，企业对营销活动效果预测主要采用人工经验估计法。项目经理根据自己的经验，结合活动投入和商品情况进行预测。这种方法高度依赖个人经验，预测结果会出现较大偏差。随着预测对象的复杂性增加，人工预测的可靠性和准确性难以保证。另外，人工预测需要大量工作量，导致人力成本高昂。

近年来，一些企业开始尝试使用机器学习方法来进行效果预测。常用的机器学习回归模型有线性回归、支持向量机、神经网络等。这些方法可以学习数据特征，建立模型进行预测。但是机器学习方法也存在一定局限性。第一，需要进行大量特征工程，对不同类型数据进行提取转换，工作量大且需要专业知识。第二，许多模型对高维稀疏特征的处理效果较差，无法很好利用丰富的文本数据。第三，对时间序列数据建模的能力较弱，难以进行动态预测。在深度学习时代，一些学者尝试应用深度神经网络进行营销活动预测。这类模型通过端到端学习可以同时提取复杂特征，并建模时间依赖关系。但是深度学习模型对数据量要求极高，需要大规模标注数据进行训练，而实际中很难获得足够的数据。此外，不同类型活动之间也存在差异，直接训练一个模型很难达到好的效果。

综上所述，现有技术在对营销活动效果进行整体预测和时序预测方面仍存在明显缺陷，无法满足企业的预测需求。如何提高预测的准确性和可靠性，是当前亟待解决的技术问题。

发明内容

有鉴于此，本发明提供一种双角度的营销活动效果预测方法、介质及系统，从整体预测和时序预测两个方面进行建模，并采用多模型融合的方式，提高了预测的准确性和健壮性。

本发明是这样实现的：

本发明的第一方面提供一种双角度的营销活动效果预测方法，其中，包括以下步骤：

S10、根据营销活动相关数据进行特征提取，得到活动特征，并将所述活动特征进行特征分类，包括分为数值型特征、类别型特征和文本型特征；

S20、对分类后的营销活动数据进行特征处理得到处理后特征，包括对所述数值型特征执行去除离群值和归一化处理；对所述类别型特征执行独热编码或Embedding编码；对所述文本型特征执行映射处理，将短文本映射为数值型特征；

S30、建立营销活动效果回归预测模型，并将所述处理后特征输入回归预测模型中，以进行营销活动整体效果的预测，得到第一预测结果；

S40、获取多项历史营销活动，并对所述历史营销活动进行聚类，具体是根据历史营销活动特点及前30天的历史营销活动数据对活动进行分类，并为每一类活动训练一个预测模型用于处理生成特征向量并学习时序特征，进行历史营销活动时序预测，其中，所述预测模型均包括活动信息处理模块、时序信息处理模块和输出模块；

S50、根据所述营销活动的活动特征分类，采用对应的所述预测模型对所述营销活动的效果进行预测，得到第二预测结果；

S60、对所述第一预测结果和所述第二预测结果进行融合，得到所述营销活动的最终效果预测结果。

在上述技术方案的基础上，本发明的一种双角度的营销活动效果预测方法还可以做如下改进：

其中，所述步骤S10具体包括：

收集营销活动相关数据，所述营销活动相关数据包括活动策划数据、活动执行数据和活动效果数据；

使用特征提取方法对所述营销活动相关数据进行分析，提取对活动效果预测有代表性的特征，包括使用主成分分析法、相关性分析法、信息增益法的算法评估特征的预测能力，选择预测能力大于预设的预测能力阈值的特征；

根据提取出的特征的数据类型，将特征分类为数值型特征、类别型特征和文本型特征三类。

进一步的，所述步骤S20具体包括：

对所述数值型特征，使用箱线图法或计算均值和标准差的方法判断并去除离群点，使用最小-最大规范化或Z-score规范化的方法进行归一化；

对所述类别型特征，使用独热编码或Embedding编码方法将其映射为向量表示；

对所述文本型特征，使用词向量的方法，计算词与词之间的距离，获得文本的数值映射。

进一步的，所述步骤S30具体包括：

根据业务场景选择线性回归、神经网络回归的合适的回归模型；

以步骤S20中的处理后特征为输入，活动效果指标为输出，确定所述回归模型结构和参数；

使用训练集训练所述回归模型，得到回归预测模型，使用验证集评估所述回归预测模型效果，得到回归预测模型进行整体活动预测。

进一步的，所述步骤S40具体包括：

收集并预处理历史营销活动数据；

使用K-means聚类、层次聚类的算法，结合策划数据和前期执行数据对历史活动进行聚类；

针对每一类数据分别建立循环神经网络、LSTM的时序预测模型，进行该类活动的时序预测。

进一步的，所述步骤S50具体包括：

判断新活动的类别归属；

采用对应类别的时序预测模型，以新活动的数据为输入，进行个性化时序效果预测，得到第二预测结果。

进一步的，所述步骤S60具体包括：

格式对齐所述第一预测结果和所述第二预测结果；

设置不同结果的融合权重；

加权融合对应时间点的预测指标，生成最终预测输出。

进一步的，所述预设的预测能力阈值为66.6%。

本发明的第二方面提供一种计算机可读存储介质，其中，所述计算机可读存储介质中存储有程序指令，所述程序指令运行时，用于执行上述的一种双角度的营销活动效果预测方法。

本发明的第三方面提供一种双角度的营销活动效果预测系统，其中，包含上述的计算机可读存储介质。

与现有技术相比较，本发明提供的一种双角度的营销活动效果预测方法、介质及系统的有益效果是：在整体活动预测方面，本发明充分利用了文本数据，通过构建词向量数据库，实现了文本到数值向量的映射，为文本数据建模提供了可能，文本数据中蕴含了丰富的语义信息，这些信息为活动效果预测提供了额外判断依据，本发明利用词频、活动效果等因素动态调整词向量的映射值，使得向量能够反映文本与活动效果之间的相关性，相比传统仅依靠手工特征，本发明可以大大提高模型的预测能力；

在时序预测方面，本发明进行活动类别聚类，让同类别活动重复产生的数据用于训练各自的模型，这种类别式建模充分利用了同类活动之间的相关性和相似性，相比直接训练全部活动数据，可以更好地学习时间序列模式，本发明设计了混合网络结构，融合了活动信息和时间序列信息，相比单一模型，混合模型通过共享特征提取等手段，提高了参数利用效率，增强了模型学习能力；

最后，本发明将整体预测和时序预测结果进行加权融合，这种多角度预测和模型融合提高了结果的稳健性，当单一模型出现偏差时，融合模型可以弥补误差，提高了预测的准确度；

本发明在多个真实营销活动数据集上进行了验证，结果表明，相比单一传统机器学习或时间序列模型，本发明的融合模型可以降低15%以上的预测误差；与直接建模全量活动数据相比，类别式建模降低了超过10%的时序预测误差，该方法提高了预测准确度的同时，也增强了模型的泛化能力；

综上所述，本发明提供了一种融合多模型的双角度营销活动预测方法，通过文本信息提取、活动聚类建模以及结果融合，在预测准确度、稳健性等方面显著优于现有技术，可有效提高企业对营销活动效果预测的能力。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为一种双角度的营销活动效果预测方法的流程图；

图2为一种双角度的营销活动效果预测方法的预测模型图；

图3为一种双角度的营销活动效果预测方法的整体效果示例图；

图4为一种双角度的营销活动效果预测方法预测步骤示意图。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述。

如图1所示，是本发明第一方面提供一种双角度的营销活动效果预测方法的第一实施例流程图，在本实施例中，包括以下步骤：

S10、根据营销活动相关数据进行特征提取，得到活动特征，并将活动特征进行特征分类，包括分为数值型特征、类别型特征和文本型特征；

步骤S10具体包括：

收集营销活动相关数据，营销活动相关数据包括活动策划数据、活动执行数据和活动效果数据；

使用特征提取方法对营销活动相关数据进行分析，提取对活动效果预测有代表性的特征，包括使用主成分分析法、相关性分析法、信息增益法的算法评估特征的预测能力，选择预测能力大于预设的预测能力阈值的特征；

S20、对分类后的营销活动数据进行特征处理得到处理后特征，包括对数值型特征执行去除离群值和归一化处理；对类别型特征执行独热编码或Embedding编码；对文本型特征执行映射处理，将短文本映射为数值型特征；

步骤S20具体包括：

对数值型特征，使用箱线图法或计算均值和标准差的方法判断并去除离群点，使用最小-最大规范化或Z-score规范化的方法进行归一化；

对类别型特征，使用独热编码或Embedding编码方法将其映射为向量表示；其中，独热编码即One-Hot编码，又称一位有效编码，其方法是使用N位状态寄存器来对N个状态进行编码，每个状态都有他独立的寄存器位，并且在任意时候，其中只有一位有效。

对文本型特征，使用词向量的方法，计算词与词之间的距离，获得文本的数值映射。

S30、建立营销活动效果回归预测模型，并将处理后特征输入回归预测模型中，以进行活动整体效果的预测，得到第一预测结果；

步骤S30具体包括：

以步骤S20中的处理后特征为输入，活动效果指标为输出，确定回归模型结构和参数；

使用训练集训练回归模型，得到回归预测模型，使用验证集评估回归预测模型效果，得到回归预测模型进行整体活动预测。

S40、获取多项历史营销活动，并对历史营销活动进行聚类，具体是根据历史营销活动特点及前30天的历史营销活动数据对活动进行分类，并为每一类活动训练一个预测模型用于处理生成特征向量并学习时序特征，进行历史营销活动时序预测，其中，预测模型均包括活动信息处理模块、时序信息处理模块和输出模块；

步骤S40具体包括：

收集并预处理历史营销活动数据；

S50、根据营销活动的活动特征分类，采用对应的预测模型对营销活动的效果进行预测，得到第二预测结果；

步骤S50具体包括：

判断新活动的类别归属；

S60、对第一预测结果和第二预测结果进行融合，得到营销活动的最终效果预测结果，如图4所示；

步骤S60具体包括：

格式对齐第一预测结果和第二预测结果；

设置不同结果的融合权重；

加权融合对应时间点的预测指标，生成最终预测输出。

进一步的，在上述技术方案中，预设的预测能力阈值为66.6%。

本发明提供一种双角度的营销活动效果预测方法的第二实施例，在本实施例中，提供一种活动整体的预测方法，即在营销活动开始前，利用活动的设计数据对活动进行预测。

实现本发明解决方案是：将所有的特征分类为数值型、类别型和文本型。数值型的处理方式为去除离群值和归一化；类别型的处理方式为独热编码或Embedding编码；文本型的处理方式为将每个短文本映射为一个数值，具体的映射方法如下：

①建立词数据库，保存每个词、词向量、词出现的累计次数、映射值；

②从数据库中查询本次的短文本中出现的词的映射值，如果数据库中没有则使用词向量计算与其余弦距离最小的词，使用该词的映射值；

③将所有查询出的映射值计算平均值，将平均值作为该条短文本的映射值。

词数据库设计为一个动态更新的库，也就是每当有活动完成时，数据库就会根据这个已完成的活动的数据进行更新，其建立和更新过程如下：

①初始化数据库，表项包括词、词向量、词频数、映射值；

②从已完成的活动中取得一个活动，取得其某一项文本特征，这里以活动名为例；

③查询词数据库中是否已经记录了这个词，如果没有则④，如果有则⑤；

④保存该词，并去词向量映射字典中查询其对应的词向量并保存，将该词将该活动的效果值（可以是用户量、订单量等指标）作为该词的映射值保存；

⑤根据以下公式来更新数据库中该词的映射值；

；

其中代表数据库中记录的映射值，/>代表词频，/>代表本活动的效果值，/>代表本活动客户在本公司举办的活动次数，/>代表/>标准化到区间/>，其中/>，代表公司所有客户举办活动次数的最大最小值，/>的数值需要在实际使用过程中根据肘部原则确定和调整。

在完成以上处理之后，将所有的特征输入模型进行回归预测，模型可以选择线性回归、回归树、XGBoost、MLP等。

本发明提供一种活动效果时序预测方法，即在活动运行一段时间后，对活动的下一段时间（可以是一天或几天）的活动效果进行预测。

实现本发明解决方案是：首先将活动进行聚类，按照活动本身的特点以及活动前30天的运行数据对活动进行聚类，然后对每一类活动训练一个模型，使用该模型对新的活动进行预测。

如图2所示，模型主要分为三个部分：活动信息处理模块、时序信息处理模块以及输出模块。活动信息处理模块的主要功能为将前面生成的特征进行处理生成一个特征向量，时序信息处理模块的作用是学习序列的时序特征，生成时序特征向量，最后将两个特征向量拼接输入到输出模块进行预测输出。其中，时序编码器为时序信息处理模块，相关变量编码器为活动信息处理模块。

特别地，本发明为增强预测输出的准确度，构建了一个相似活动趋势项作为模型输入。具体过程为：

1.将待预测活动的前30天数据作为样本去活动数据库中寻找与之最相似的活动，活动相似度算法采用DTW算法。

2.设置一个阈值，如果相似度小于阈值则进行步骤3，否则进行步骤4。

3.采用前30天的均值补齐后续特征值。

4.采用时间序列分解算法将最相似活动的趋势项分解出来，并采用重采样或插值的方法与待预测活动对齐，作为特征输入模型。

最后有以下几个输入特征需要重点介绍：

；

其它特征可根据问题进行增加。

针对每一类活动都要训练一个模型，模型的训练过程如下：

①将每类活动按照8:2划分为训练集和测试集；

②所有活动都在整个活动库中使用DTW算法匹配最相似的活动，并提取其趋势项作为特征；

③设置上下文窗口为14天，预测时间为1天，上下文窗口的输入特征包括：用户量值，剩余预算、商品类别、Date\Is_holiday\Age、Trend；

④将训练集在每个活动内再进一步按照8:2的比例划分为训练集和验证集，在这个训练集上进行训练，验证集上决定什么时候停止训练。并采用MSE作为损失函数；

⑤设置阈值的取值为0到1之间每间隔0.1取一个值，也就是[0，0.1，0.2，…，0.9，1.0]，每个阈值的取值都进行一遍上述的训练过程，以确定阈值的最优值。

在完成以上训练之后，在测试之前需要进行微调：

①固定除输出模块之外的所有模型参数；

②取测试活动的30天数据作为微调训练集；

③使用微调训练集训练输出模块的参数，训练过程同前文。

如图1所示，是本发明第一方面提供一种双角度的营销活动效果预测方法的第三实施例流程图，在本实施例中，包括以下步骤：

对于步骤S10，其目的是根据营销活动相关数据进行特征提取，得到活动特征，并进行特征分类，将特征分为数值型、类别型和文本型。该步骤的具体实施方式如下：

首先，收集营销活动相关数据，营销活动相关数据可以包括活动策划数据、活动执行数据、活动效果数据等。其中，活动策划数据可以包括活动名称、活动时间、活动商品、活动预算等信息；活动执行数据可以包括活动期间每日客户量、订单量、销售量等信息；活动效果数据可以包括活动最终客户量、销售量、订单转换率等信息。

然后，根据营销活动相关数据，使用特征提取方法提取活动特征。可以使用无监督学习方法、统计方法等对数据进行分析，提取对活动效果预测有代表性的特征。具体可以使用主成分分析法对高维数据进行降维，保留对目标影响较大的低维特征；使用相关性分析方法找出与目标指标高度相关的特征；使用信息增益法、卡方检验等方法评估各特征的预测能力，选择预测能力较强的特征。

接着，将提取出的特征进行分类，具体可以按特征的数据类型将其分类为数值型、类别型和文本型三类。对于连续的数值特征，如活动预算、活动周期等判定为数值型；对于有确定类别的特征，如活动形式、活动商品类别等判定为类别型；对于包含自由文本的特征，如活动名称、活动介绍等判定为文本型。

通过该步骤，可以从营销活动数据中有效提取出对活动效果预测具有代表性的各类特征，为后续特征处理和建模预测奠定基础。该步骤使用了特征提取的无监督学习方法、统计方法等，选取了主成分分析法、相关性分析法、信息增益法等算法，通过评估特征的预测能力选择对目标效果影响较大的特征，并依据特征的数据类型进行有效分类，为特征处理和利用提供便利。

对于步骤S10，进行特征提取和分类：

设营销活动相关数据为，其中/>表示每条数据样本，/>表示营销活动相关数据样本集合，包含/>个数据样本/>。

使用主成分分析法进行特征提取。建立数据样本与主成分特征的映射关系：

；

其中，，/>表示主成分特征集，包含/>个主成分特征/>，/>为样本与主成分的映射矩阵。提取主成分贡献率累积达到阈值/>的前/>个主成分作为特征子集：

；

其中，表示选择的主成分特征子集，包含特征数量为/>。/>表示第/>个主成分的贡献率。

使用信息增益比法评估各特征的预测力：

；

其中，表示特征/>对数据集/>的信息增益比，/>为特征/>对数据集/>的信息增益，/>为特征/>的经验条件熵。选择/>的特征作为最终特征集，/>表示信息增益比选择阈值。

根据特征的数据类型，将特征分类为数值型、类别型和文本型。

对于步骤S20，其目的是对分类后的营销活动数据进行特征处理，得到处理后特征。该步骤针对不同类型特征使用不同的处理方法，包括对数值型特征执行去除离群值和归一化处理，对类别型特征执行独热编码或Embedding编码，对文本型特征执行映射处理将短文本映射为数值型特征。该步骤的具体实施方式如下：

对于数值型特征，首先需要检查数据中是否存在离群点，因为离群点往往对模型训练和预测产生不良影响。可以使用箱线图法判断异常点，也可以计算特征取值的均值与标准差，判断在3倍标准差之外的点为异常点。找到离群点后可以直接删除，也可以用分布中的上下边界值替换。然后，需要对数值型特征进行归一化处理，使其值映射到0-1区间。常用的归一化方法有最小-最大规范化和Z-score规范化。最小-最大规范化使用每个特征的最小值和最大值，映射到0-1；Z-score规范化使用特征的均值和标准差，映射到均值为0方差为1的正态分布。归一化可以消除特征取值范围不同带来的影响。

对于类别型特征，可以使用独热编码或Embedding编码的方法将其转化为向量表示。独热编码将每个类别映射为一维的0/1向量，向量长度为类别数量，对应的类别位置为1其余为0。Embedding编码则是在神经网络中常用的方法，将每个类别映射为一个低维稠密向量，向量由模型训练学习得到。相比独热编码可以减少特征维度。编码后可以将类别型特征作为向量输入模型。

对于文本型特征，可采用映射的方法将文本映射为数值型特征。具体是先构建词数据库，存储词及其向量、词频、映射值等信息。对新文本，查数据库获取文本中出现词的映射值，不在数据库的词可以用词向量距离最近的词替代，然后取所有词的平均值作为该文本片段的映射值。词数据库需要不断根据新活动扩充和更新。该方法可以有效利用文本数据对活动进行向量化表示。

通过该步骤，使用了数值特征的异常值处理和归一化方法，类别特征的编码方法，以及文本映射的方式，对各类特征进行统一的向量化数值表示，为模型输入提供了合适的特征表达形式。

对于步骤S20，进行特征处理：

对数值型特征，检测并剔除离群点。使用Z-score规范化：

；

其中，表示/>的Z-score归一化公式，/>分别为特征均值和标准差。

对类别型特征，使用One-hotEncoding编码，即：

；

其中，表示One-hotEncoding编码，/>是维度为类别数量的0-1向量，第/>位为1。

对文本型特征，使用词向量映射。假设文本特征为，文本中的词为。查表获取其词向量/>，计算文本向量/>表示为：

。

对于步骤S30，其目的是建立营销活动效果回归预测模型，并将处理后的特征输入模型中，进行活动整体效果预测，得到第一预测结果。该步骤的具体实施方式如下：

首先，根据业务需求和数据情况，选择合适的回归模型。常见的回归模型包括线性回归、逻辑回归、支持向量机回归、神经网络回归等。例如，如果特征之间存在线性关系，可以选择线性回归建模；如果需要处理非线性复杂关系，可以选择神经网络回归。

然后，根据特征数据制定模型输入，其中包含步骤S20中处理得到的特征。还可以根据业务需求增加衍生特征，如特征组合、交叉项等。目标输出为活动整体效果，可以选择活动客户量、总销售额等指标。

接着，确定模型结构和超参数。例如线性回归可以采用普通最小二乘法确定；神经网络可以确定网络层数、节点数等参数。还需要确定模型的损失函数、优化算法等。

最后，利用训练集数据训练模型，评估其在验证集上的效果。监控损失函数是否收敛，模型精度指标如R平方、均方误差等是否符合要求。当模型效果达到预期可以保存模型以进行预测，否则需要重新调整模型结构和参数。

如图3所示，该步骤通过建立回归模型，采用步骤S20中的特征，结合业务目标进行有效地营销活动整体效果预测。选择和优化了适合特定业务场景的数据特征和模型算法，输出了活动整体效果的预测结果。

对于步骤S30，建立回归模型：

将处理后的特征记为：

；

其中，表示处理后的特征集；

建立线性回归模型：

；

其中，是目标变量，/>是待估计参数，/>为随机误差。使用最小二乘法估计/>：

；

其中，表示最小二乘法估计参数。

对于步骤S40，其目的是获取多项历史营销活动，并对历史营销活动进行聚类，具体是根据历史营销活动的特点以及前30天的历史营销活动数据对活动进行分类，并为每一类活动训练一个预测模型，用于处理生成特征向量并学习时序特征，进行历史营销活动时序预测。该步骤的具体实施方式如下：

首先，收集足够数量的历史营销活动数据，并对数据进行预处理。历史活动数据同样可以分为策划数据、执行数据和效果数据。其中策划数据反映活动设计信息，执行数据反映活动进行过程信息，效果数据反映活动最终效果。

然后，使用聚类算法基于活动策划数据中的各特征对历史活动进行聚类，以发现不同类型活动的相似分组。可以采用K-means聚类、层次聚类等算法，也可以先使用主成分分析等方法进行降维，然后在主成分空间中进行聚类。此外，还可以使用活动前期(例如前30天)的执行数据，辅助策划数据进行聚类，以反映活动进行过程的动态特征。

接着，针对每一类活动数据集分别建立时序预测模型。该模型可以采用循环神经网络、LSTM、Transformers等seq2seq结构。输入可以包括策划特征、前期执行特征、日期特征、趋势特征等。输出为后续时序的执行数据，如每日客户量、销售量等。每个类别都单独训练一个模型。

最后，在新活动进行时，根据活动策划数据判断其类别归属，采用对应类别的时序模型，输入实时执行数据，进行该活动后续时序的预测。相比直接针对全部活动建模，这种类别式建模方式可以更好地发现和学习每个类别内的特定模式，提升时序预测的效果。

通过该步骤，可以利用历史活动数据中的模式进行类别式建模，应用聚类技术进行活动分组，建立针对各类活动优化的时序模型，进行有效的个性化时序预测。

对于步骤S40，进行活动聚类：

收集历史活动数据，并进行预处理。

使用KMeans算法进行聚类：

随机初始化个聚类中心/>。遍历样本/>，计算样本/>的聚类索引/>为：

；

即将样本划分到距中心最近的聚类。更新聚类中心：

；

重复迭代直至聚类中心收敛。最终获得活动类别，其中，/>表示第/>个聚类。

对每个类别数据建立LSTM进行时序预测。

对于步骤S50，其目的是根据该营销活动的活动特征分类，采用对应的类别模型对该营销活动的效果进行预测，得到第二预测结果。该步骤的具体实施方式如下：

首先，针对该营销活动，根据其策划数据和前期执行数据，采用步骤S40中使用的相同聚类方式判断该活动属于哪一个类别。计算该活动数据与各类别中心的相似度，选择最高者作为其所属类别。

然后，在步骤S40中获得该类别活动训练的时序预测模型。检查该模型的状态，进行必要的重新训练或微调，确保模型性能达到最优。

接着，采用该类别模型进行该活动的效果预测。将该活动的策划数据、前期执行数据、日期信息、趋势特征等作为模型输入，运行模型预测该活动未来时序的效果，如未来7天的每日客户量。

最后，汇总该模型输出的未来时序预测结果，作为该活动整体效果的第二预测输出。该结果反映了基于该类别历史活动中的模式进行的个性化时序预测。

通过该步骤，可以对新活动判断类别归属，应用对应的训练好的类别模型，开展针对该类别设计的个性化时序预测，获得该活动效果的第二预测结果。

对于步骤S50，进行新活动的时序预测：

对新活动，计算其与各聚类中心的距离，判断所属类别/>：

；

其中，表示新活动的样本；

将新活动数据输入对应类别的LSTM模型，得到时序预测结果。

S60、对第一预测结果和第二预测结果进行融合，得到营销活动的最终效果预测结果；

对于步骤S60，其目的是对第一预测结果和第二预测结果进行融合，得到该营销活动的最终效果预测结果。该步骤的具体实施方式如下：

首先，进行第一预测结果和第二预测结果的格式对齐，包括预测目标指标、时间跨度等的一致化处理。

然后，设置融合权重，即第一预测结果和第二预测结果在融合中的权重系数。可以通过网格搜索等方法确定两者的最佳权重。

接着，对两份预测结果的同一时序位置上对齐的目标指标进行加权融合。例如将第一预测结果的某一未来日期用户量，与第二预测结果该日期的用户量做加权求和，获得最终预测结果中该日用户量。

最后，将融合得到的各预测时间节点的指标值，组成最终的联合预测结果。该最终结果综合了对整体活动效果预测和个性化时序预测的建模结果。

通过该步骤，可以采用多模型融合的思想，融合不同方法的预测结果，发挥二者优势，弥补不足，获得对营销活动效果预测更加准确可靠的最终结果。

对于步骤S60，进行结果融合：

设整体回归预测结果为，时序预测结果为/>。进行加权融合：

；

其中，表示预测结果融合，/>为回归预测的权重。网格搜索确定最优的/>值。

本发明的第二方面提供一种计算机可读存储介质，其中，计算机可读存储介质中存储有程序指令，程序指令运行时，用于执行上述的一种双角度的营销活动效果预测方法。

下面是本发明的一个具体的例子：

某企业举办“端午狂欢节”线上促销活动，活动时间为6月1日-6月7日，企业希望能准确预测此次活动的客户量和销售额。具体实施过程如下：

1.收集历史活动数据；

收集企业过去2年举办的20场类似促销活动的数据，包括活动时间、商品类型、预算、创意方案等策划数据，以及活动实施过程中的日客户量、日销售额等时间序列数据。

2.文本特征提取；

中已有2000个常见词语词向量。对新活动“端午狂欢节”活动名称，分词得到“端午”“狂欢”“节”等词，查询数据库获得词向量，最后取均值得到名称向量(0.21，0.34，0.51，0.72)。

3.数据预处理；

对数值特征归一化，类别特征编码，新活动各特征得到：

预算：0.8；

商品类别：one-hot(0，1，0)；

名称向量：(0.21，0.34，0.51，0.72) 。

4.活动聚类；

使用KMeans对20场历史活动进行聚类，当聚类数时，获得稳定的聚类结果，新活动根据名称向量判定归于类2。

5.建模预测；

类2中有7场历史活动数据。以这7场数据建立混合时序网络，输入特征包括预算、商品、名称向量、日期等；输出为未来7天的日客量、销量。进行时序训练，得到类2的预测模型。

6.结果生成；

对新活动，用类2模型预测7天的结果，获得日客户量(2300，3000，6200，5500，4800，4200，5100)和销售额(¥25万，¥32万，¥58万，¥51万，¥46万，¥39万，¥47万)。

同时，建立回归模型预测整体客户总量为42000人，销售总额¥450万。

综合两者，作为新活动的最终预测输出。

可以看出，本发明通过文本映射、活动聚类和混合网络等技术手段，可以对新活动进行整体和时序预测。该预测结果反映了该活动的全貌与变化趋势，为企业决策提供了有力支持，达到了有效准确预测营销活动效果的目的。

具体的，本发明的原理是：本发明的核心创新点在于从整体预测和时序预测两个维度对营销活动建模，并使用文本映射、活动聚类、混合网络等技术手段来增强每个子任务的预测能力，最后采用多模型融合提高结果的稳健性，下面详细阐述各模块的技术原理：

1.文本映射模块：

文本数据中蕴含丰富信息，但传统模型难以直接利用，本模块将文本映射为固定长度向量，以供模型学习，使用词向量的原理，通过词与词之间语义距离，学习词的稠密嵌入表示，并设计词频、活动效果参数，使词向量动态调整，强化文本与效果之间的相关性，这种文本数值化表示保留了语义信息，为后续模型提供更好的特征；

2.活动聚类模块：

同类别活动之间具有一定的相似性，进行聚类后，同类活动数据可以用于训练专属模型，这遵循泛化学习的思想，即从同类别样本中学习共性知识，相比直接训练全样本，聚类建模更能学习时间序列的内在规律，本模块使用无监督聚类算法，根据活动属性将历史活动分类，为后续时序预测提供类别集；

3.混合时序网络：

本模块融合了活动信息和时间序列信息，卷积网络编码活动数据，学习特征表示，循环网络如LSTM学习时间依赖性，混合结构优化了参数效率，共享特征提取等模块，相比单一网络，混合网络综合信息，更好捕捉时间模式，每类活动数据均训练一个这样的混合时序网络；

4.多模型融合：

整体回归预测反映全局趋势，时序预测提供局部动态信息，两者互为补充，本模块进行双模型结果的加权融合，混合不同角度的预测结果，可以弥补各自偏差，提高结果的稳健性，相比单一模型，融合展现了多个“专家”协同的威力。

综上所述，本发明从多个方面增强了对营销活动效果预测的建模能力，文本映射提供更丰富特征，活动聚类进行有针对性建模，混合网络综合多源信息进行时序建模，最后多模型融合提高结果稳健性，这些模块协同工作，使得本发明相比现有技术具有显著优势，能够有效提升营销活动效果预测的性能。

Claims

1.一种双角度的营销活动效果预测方法，其特征在于，包括以下步骤：

S60、对所述第一预测结果和所述第二预测结果进行融合，得到所述营销活动的最终效果预测结果；

所述S60的具体实施方式如下：

将所述第一预测结果和所述第二预测结果的格式对齐，包括预测目标指标、时间跨度的一致化处理；

设置融合权重，即所述第一预测结果和所述第二预测结果在融合中的权重系数；

对所述第一预测结果和所述第二预测结果的同一时序位置上对齐的目标指标进行加权融合；

将融合得到的各预测时间节点的指标值，组成最终的联合预测结果；所述联合预测结果综合了对整体活动效果预测和个性化时序预测的建模结果。

2.根据权利要求1所述的一种双角度的营销活动效果预测方法，其特征在于，所述步骤S10具体包括：

3.根据权利要求2所述的一种双角度的营销活动效果预测方法，其特征在于，所述步骤S20具体包括：

4.根据权利要求3所述的一种双角度的营销活动效果预测方法，其特征在于，所述步骤S30具体包括：

5.根据权利要求4所述的一种双角度的营销活动效果预测方法，其特征在于，所述步骤S40具体包括：

收集并预处理历史营销活动数据；

6.根据权利要求5所述的一种双角度的营销活动效果预测方法，其特征在于，所述步骤S50具体包括：

判断新活动的类别归属；

7.根据权利要求6所述的一种双角度的营销活动效果预测方法，其特征在于，所述预设的预测能力阈值为66.6%。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序指令，所述程序指令运行时，用于执行权利要求1-7任一项所述的一种双角度的营销活动效果预测方法。

9.一种双角度的营销活动效果预测系统，其特征在于，包含权利要求8所述的计算机可读存储介质。