CN117131428A

CN117131428A - 一种自适应营销事件风险识别方法和系统

Info

Publication number: CN117131428A
Application number: CN202311399075.7A
Authority: CN
Inventors: 孙钢; 金王英; 杨柳欣; 朱林; 楼斐; 徐家宁; 徐世予; 汪一帆; 李伊玲; 钱伟超; 李希鹏; 庄立强; 何皓; 叶西子; 章一新
Original assignee: State Grid Zhejiang Electric Power Co Ltd; Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Current assignee: State Grid Zhejiang Electric Power Co Ltd; Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2023-10-26
Filing date: 2023-10-26
Publication date: 2023-11-28

Abstract

本发明公开了一种自适应营销事件风险识别方法和系统。现有的方法存在跨领域有效性有限、难以应对概念漂移、依赖人工特征工程以及难以处理复杂数据流等缺点。本发明通过将表示向量和增强域自适应学习模型结合，并将其放入模型池中，实现对不同营销事件数据流的自适应处理，具体包括以下步骤：营销事件编码、增强域自适应、创建在线深度异常检测框架、初始化模型池、批处理异常检测和模型池适配，模型池允许多个模型自适应地协同工作，实现概念驱动的推理和漂移感知的模型池更新，以处理多个且随时间变化的概念漂移。本发明增强了对新型营销事件的风险检测能力，提升跨领域有效性，自适应处理不断变化的数据流。

Description

一种自适应营销事件风险识别方法和系统

技术领域

本发明属于电力行业的营销事件风险识别领域，具体地说是一种自适应营销事件风险识别方法和系统。

背景技术

随着电力行业的数字化转型，各种营销事件在平台上迅速发展，同时也带来了潜在的风险，对平台的安全性和用户体验构成威胁。传统的营销事件风险识别方法往往面临着多样性和变化性的挑战。

现有营销事件风险识别方法的异常检测算法本身存在很多问题：（1）有限的跨领域有效性：现有的算法主要关注特定领域的预测性能，表现可能不佳于其他领域，限制了它们的跨领域有效性。（2）难以应对概念漂移：数据流的不断发展导致概念漂移，即目标领域的属性任意变化。现有算法通常采用增量更新模型的方法，但这种方法仅适应最新的数据点，对于数据流中的任意概念漂移可能无效。（3）依赖人工特征工程：如降维、随机子采样和线性特征变换，以处理复杂的数据。这种依赖性导致次优的结果和有限的可扩展性。（4）难以处理复杂数据流：传统方法中使用预先训练的固定模型或重复创建新模型，无法有效处理复杂且不断发展的数据流。这要么导致效率低下，要么导致模型无法应对数据流的变化。

这些问题限制了现有异常检测算法在应对不断变化的数据流和多样性的营销事件风险识别中的应用效果。

发明内容

针对现有的异常检测算法存在跨领域有效性有限、难以应对概念漂移、依赖人工特征工程以及难以处理复杂数据流等缺点，本发明提供一种自适应营销事件风险识别方法及系统，其采用新的在线深度异常检测算法，以有效识别电力行业中营销事件风险。

为实现上述目的，本发明采用如下的技术方案：一种自适应营销事件风险识别方法，其包括：

1）营销事件编码：设计一个框架表示网络，将营销内容、营销事件用户评论和用户-营销交互辅助信息编码为表示向量，并将这些表示向量融合到营销事件风险检测中；

2）增强域自适应：设计一个带有强化学习代理的增强域自适应学习模型，该增强域自适应学习模型根据从域分类器和营销事件风险检测组件收到的反馈信息修改表示向量；

3）创建在线深度异常检测框架，使用增强域自适应学习营销事件风险识别模型的异常检测方法进行实例化，并通过模型池方法允许多个模型自适应地协同工作，实现概念驱动推理和漂移感知的模型池更新，以处理多个且随时间变化的概念漂移；

所述的增强域自适应学习营销事件风险识别模型包括营销事件编码和增强域自适应学习模型；

4）初始化模型池：从第一批数据流中构建增强域自适应学习营销事件风险识别模型，并初始化模型池；模型池是包含多个基于增强域自适应学习营销事件风险识别模型的集合，它们具有相同的架构但具有不同的参数；

5）批处理异常检测：通过计算异常分数来识别每个数据点的异常程度，并使用增强域自适应学习营销事件风险识别模型的可靠性对异常分数进行加权；

6）模型池适配：根据模型池的整体可靠性进行更新，如果可靠性足够，则选择最可靠的增强域自适应学习营销事件风险识别模型进行参数更新，否则创建新模型并将新模型合并入模型池。

本发明将表示网络和增强域自适应学习模型结合，并将其放入模型池中，实现对不同营销事件数据流的自适应处理。

本发明结合了表示网络和增强域自适应学习模型，并引入模型池的概念。表示网络用于提取营销事件的特征表示，而增强域自适应学习模型用于决策和预测。模型池允许多个模型自适应地协同工作，实现概念驱动的推理和漂移感知的模型池更新，以处理多个且随时间变化的概念漂移。

进一步地，所述营销事件编码，具体内容如下：

1）营销内容的表示：使用预训练的语言表征模型BERT加微调的方式对营销内容进行编码，生成营销内容的表示向量；

2）营销事件用户评论的表示：使用分层注意力机制（HAN）+前馈神经网络进行预训练，训练完成后删除前馈神经网络，仅使用分层注意力机制对营销事件用户评论进行编码，生成营销事件用户评论的表示向量；

3）用户-营销交互的表示：使用前馈神经网络，将用户-营销交互的二进制向量作为输入，并返回包含有关交互的重要信息的表示，即生成用户-营销交互的表示向量；

4）将上述三个表示向量拼接在一起，并通过前馈神经网络生成整个营销事件的表示向量。

进一步地，所述增强域自适应，具体内容如下：

使用强化学习代理将整个营销事件的表示网络转换为一个新的表示向量，该表示向量能够在域分类器中工作，但不影响营销风险分类器的准确性；

强化学习代理通过与环境的交互，选择动作并修改整个营销事件的表示向量的值，修改后的表示向量通过营销风险分类器和域分类器进行评估，得到奖励值用于指导强化学习代理的学习过程。

进一步地，所述概念驱动推理，具体内容如下：

在线深度异常检测框架使用模型池中模型的最佳组合计算输入数据点的异常分数，在针对不同的数据点优化单个模型的同时，在线深度异常检测框架根据给定的数据点估计每个模型的可靠性，并决定每个模型对最终异常得分的贡献，以最大限度地提高模型池在不同概念中的可用性。

更进一步地，所述估计每个模型的可靠性，具体内容如下：

在给定模型中反映的概念可能与当前批的概念不同，特别是当概念漂移发生时，在线深度异常检测框架通过比较模型学习到的概念与当前批次的概念估计模型的可靠性，并使用它来计算概念驱动的异常分数。

进一步地，所述漂移感知的模型池更新，具体内容如下：

在线深度异常检测框架持续监控输入数据点的模型池的可靠性，当模型池被评估为不适合最新的数据点时，在线深度异常检测框架更新模型池，以包含针对新数据点概念优化的新模型，同时保持模型池尽可能紧凑。

更进一步地，所述模型池的可靠性，具体内容如下：

当一个具有从未见过的新概念的批处理到达时，模型池中没有一个模型能够正确地对该批处理进行推理，因此，在线深度异常检测框架估计模型池的整体可靠性，以决定是否需要更新模型池。

进一步地，所述批处理异常检测，具体内容如下：

对于每个批次的数据点B，使用模型池对批次数据中的每个数据点进行异常检测，计算每个数据点的异常分数；通过比较模型学习到的概念与当前批次的概念估计每个模型的可靠性，将每个模型的异常分数与其可靠性进行加权，得到当前批次的最终异常得分。

进一步地，所述模型池适配，具体内容如下：

1）估计模型池的整体可靠性，即模型池中至少有一个模型可靠的概率；

2）如果模型池的可靠性超过预设阈值，选择最可靠的模型，并使用当前批次数据更新该模型的参数；

3）如果模型池的可靠性低于预设阈值，创建一个新的模型，将新模型合并入模型池。

本发明还提供一种自适应营销事件风险识别系统，其用于实现上述的自适应营销事件风险识别方法。

本发明具有的有益效果如下：本发明有效地增强了模型对新型营销事件的风险检测能力，提升跨领域有效性，自适应处理不断变化的数据流。本发明为电力行业提供了一种高效可靠的营销事件风险识别方法，提高了对营销事件风险的准确性识别，增强了平台的安全性和用户体验。

附图说明

图1为本发明自适应营销事件风险识别方法的流程图；

图2为本发明自适应营销事件风险识别方法的原理图；

图3为本发明营销事件编码器的架构图；

图4为本发明带有强化学习代理的增强域自适应学习模型的架构图；

图5为本发明在线深度异常检测框架(ARCUS)创建流程概述图。

具体实施方式

下面结合说明书附图和具体实施方式对本发明做进一步详细说明。

本实施例提供一种自适应营销事件风险识别方法，如图1-图2所示，其包括：

1）营销事件编码：设计一个框架表示网络，将营销内容、营销事件用户评论和用户-营销交互辅助信息编码为表示向量，并将这些表示向量融合到营销风险检测中；

2）增强域自适应：设计一个带有强化学习代理的增强域自适应学习模型，该增强域自适应学习模型根据从域分类器和营销事件风险检测组件收到的反馈修改表示向量；

所述的增强域自适应学习营销事件风险识别模型（简称REAL-MRD模型）包括营销事件编码和增强域自适应学习模型；

6）模型池适配：根据模型池的整体可靠性进行更新，如果可靠性足够，则选择最可靠的模型进行参数更新，否则创建新模型并将新模型合并入模型池。

1.增强域自适应学习营销事件风险识别模型（REAL-MRD模型）

把源域表示成包括不同营销事件的数据集（例如，智能签约户数、账户进行积分兑换以及发短信等），目标域为存在营销事件风险的数据集（例如，短信错发、同一账户积分突增以及同一账户积分频率多户号上线消费等）。

让和/>表示一组带有源域和目标域标签的二进制操作的营销事件。每次营销事件/>（例如短信错发）都包含一个内容，它是一个K单词序列/>（收件人账号不匹配）、一组用户评价/>（收件人的反馈）和用户-营销交互/>，其中用户-营销交互/>是一个二元向量，表示发布、转发或点赞关于营销事件/>（例如短信错发）的推文的用户。s表示为源域标志；t表示为目标域标志；/>表示/>是否风险事件的标签。U表示发布、转发或点赞关于所提供数据中关于所有营销事件的推文的总用户（包含各种互动数据的集合）。

用于营销事件风险检测的REAL-MRD模型。该模型的输入是来自源域的营销事件数据集D _s和目标域的营销事件数据集D _t的一部分。REAL-MRD模型有两个组成部分：(1)营销事件编码器，(2)带有强化学习代理（RL）的增强域自适应学习模型，如图3、图4所示。

下面进行详细描述。

营销内容的表示：使用预训练的语言表征模型BERT加微调的方式对营销内容进行编码，生成营销内容的表示向量。

营销事件用户评论的表示：使用分层注意力机制（HAN）+前馈神经网络进行预训练，训练完成后删除前馈神经网络，仅使用HAN对营销事件用户评论进行编码。

用户-营销交互的表示：使用前馈神经网络，该网络将用户-营销交互的二进制向量作为输入，并返回包含这些交互的重要信息的表示。

在构建表示网络并对BERT和HAN进行预训练后，将这三个分量的输出拼接成一个向量E，并通过前馈网络生成整个营销事件的表示向量。一旦将表示网络与前馈神经网络分类器叠加在一起，就可以使用源域数据集D _s和目标域数据集D _t的一部分γ训练营销事件风险分类器。训练完营销事件风险分类器F后，冻结表示向量并使用营销事件的表示向量/>训练域分类器D。

使用基于RL的技术，RL会将表示向量转换为一个新的表示向量，使其在营销事件风险分类器F上表现良好，但在域分类器D上表现不佳（域分类器是用于将输入数据分类为不同领域或来源的算法）。在这种方法中，RL代理通过选择响应给定状态的操作/>与环境进行交互。执行的动作形成状态/>和奖励/>。元组/>称为经验，将用于更新RL代理的参数，如图4所示。

奖励函数为：

(1)

其中，为标签，/>为参数、/>为表示向量、i为标签（营销事件是否为风险事件）、j为域标签；/>表示观察到标签/>的概率，这部分奖励与营销事件风险分类器F相关；/>表示观察到标签/>的概率，这部分奖励与域分类器D相关。

所选操作，RL代理的目标是根据公式1最大化其奖励。

为了训练智能体，使用强化算法，该算法使用策略梯度来更新智能体。考虑到代理的策略，根据参数为/>，强化算法使用以下损失函数来评估代理：

(2)

，为折扣率奖励的累计金额，且为折扣率。利用损失函数的梯度来更新代理：

(3)

其中，表示学习率；/>表示参数/>的梯度。

2.概念漂移

概念漂移是指市场条件、消费者需求、竞争格局等因素的变化所带来的影响，使得原先有效的判别营销风险事件的策略需要进行调整或更新。例如，法规和政策变化（改变电力购买价格机制等）、新技术的出现（智能电网、可再生能源技术的成熟等）及消费者行为的转变等。在形式上，如果输入数据点x及其标签的联合概率在t时间发生变化，则在t时间发生概念漂移，即。

一旦概念漂移发生，当前的异常检测模型就会过时，应该更新以学习新概念。由于漂移可以以各种形式发生，例如“突然”、“渐进”、“增量”和“重复发生”，因此重要的是要有一个通用的机制来同样地处理所有这些形式。

3. 在线深度异常检测框架（ARCUS框架）

ARCUS通过模型池方法允许多个模型自适应地协同工作，实现概念驱动的推理和漂移感知的模型池更新，以处理多个且随时间变化的概念漂移。

给定一个无限序列的营销事件，即数据点到达一个数据流，一个带参数为/>的异常检测模型M(即REAL-MRD模型)计算单个数据点的异常分数，，在无监督的情况下持续更新参数/>，并将分数超过阈值的数据点报告为异常。

定义1.模型池：模型池是REAL-MRD模型的集合，它们共享相同的架构，但具有不同的参数。

定义2.模型的可靠性：在给定模型中反映的概念可能与当前批的概念不同，特别是当概念漂移发生时。ARCUS通过比较模型学习到的概念与当前批次的概念来估计模型的可靠性。

让表示为当前批次的异常分数集，/>是最后一批用于更新模型的数据。给定模型M，/>和/>之间的差异的统计显著性表明该模型对当前批次的可靠性有多高。

定理1.Hoeffding基于不等式限制的均值差：给定取值范围在之间的两个独立随机变量X和Y。样本在/>和/>之间均值差的概率受下式约束：

(4)

其中，为差异的阈值，n、m为样本数。

运用定理1为和/>在推论1中给出了其差异的统计显著性。

推论1.概念差界：设H和G为模型M返回的独立异常分数，让和分别从H和G采样的异常分数集。这时，

(5)

其中b是批大小。(例如，)

(6)

模型M当前批的模型可靠性/>被定义为：

(7)

从定理1就能看出，利用推论1中的概率差界推导出公式(7)所示的单个模型的可靠性。因此，异常得分的样本均值差大于或等于的概率至多为/>。

定义3.概念驱动异常评分：给定一组模型在模型池中，有相应的可靠度/>，当前批次变量B中某个数据点/>的概念驱动异常评分/>为：

(8)

定义4.模型池可靠性：给定一个模型池，可靠性/>对于P是。

根据定义3，模型对当前批次不可靠的概率为。与此同时，由于它们是用不重叠的批次单独更新的，所以在模型池/>里的模型是相互独立的。然后，按照定义4的表述，用1减去任何一个模型都不可靠的概率来定义模型池/>的可靠性。

定义5.漂移感知模型池更新：ARCUS监控模型池的可靠性，并以显著性水平触发池的更新。当一个模型池至少有一个高可靠的模型(即/>)时，选择最可靠的模型，并使用当前批次数据更新该模型的参数。但当池中的模型只有中性可靠性值时(即/>)，ARCUS首先使用当前批处理创建一个新模型，将新模型合并入模型池。

ARCUS的创建总体过程如图5所示，算法2给出了概述。一旦使用为第一批创建的模型初始化模型池，ARCUS就会对每一批重复使用概念驱动推理进行异常检测，并使用概念漂移感知更新进行模型池自适应。异常检测步骤计算数据点的异常分数。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，所属领域的普通技术人员参照上述实施例依然可以对本发明的具体实施方式进行修改或者等同替换，这些未脱离本发明精神和范围的任何修改或者等同替换，均在申请待批的本发明的权利要求保护范围之内。

Claims

1.一种自适应营销事件风险识别方法，其特征在于，包括：

2.根据权利要求1所述的自适应营销事件风险识别方法，其特征在于，所述营销事件编码，具体内容如下：

2）营销事件用户评论的表示：使用分层注意力机制+前馈神经网络进行预训练，训练完成后删除前馈神经网络，仅使用分层注意力机制对营销事件用户评论进行编码，生成营销事件用户评论的表示向量；

3.根据权利要求1所述的自适应营销事件风险识别方法，其特征在于，所述增强域自适应，具体内容如下：

使用强化学习代理将整个营销事件的表示向量转换为一个新的表示向量，该表示向量能够在域分类器中工作，但不影响营销风险分类器的准确性；

4.根据权利要求1所述的自适应营销事件风险识别方法，其特征在于，所述概念驱动推理，具体内容如下：

5.根据权利要求4所述的自适应营销事件风险识别方法，其特征在于，所述估计每个模型的可靠性，具体内容如下：

在给定模型中反映的概念与当前批的概念不同，特别是当概念漂移发生时，在线深度异常检测框架通过比较模型学习到的概念与当前批次的概念估计模型的可靠性，并使用它来计算概念驱动的异常分数。

6.根据权利要求1所述的自适应营销事件风险识别方法，其特征在于，所述漂移感知的模型池更新，具体内容如下：

在线深度异常检测框架持续监控输入数据点的模型池的可靠性，当模型池被评估为不适合最新的数据点时，在线深度异常检测框架更新模型池，以包含针对新数据点概念优化的新模型，同时保持模型池紧凑。

7.根据权利要求6所述的自适应营销事件风险识别方法，其特征在于，所述模型池的可靠性，具体内容如下：

8.根据权利要求1所述的自适应营销事件风险识别方法，其特征在于，所述批处理异常检测，具体内容如下：

9.根据权利要求1所述的自适应营销事件风险识别方法，其特征在于，所述模型池适配，具体内容如下：

10.一种自适应营销事件风险识别系统，其特征在于，用于实现权利要求1-9任一项所述的自适应营销事件风险识别方法。