CN116956289A

CN116956289A - 动态调整潜在黑名单和黑名单的方法

Info

Publication number: CN116956289A
Application number: CN202310904530.8A
Authority: CN
Inventors: 李保荣; 陈倩; 杜金龙; 陈凤林
Original assignee: Shanghai Zeyi Supply Chain Management Co ltd
Current assignee: Shanghai Zeyi Supply Chain Management Co ltd
Priority date: 2023-07-21
Filing date: 2023-07-21
Publication date: 2023-10-27
Anticipated expiration: 2043-07-21
Also published as: CN116956289B

Abstract

一种动态调整潜在黑名单和黑名单的方法，该方法包括以下步骤：从云平台提取用户行为数据；对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量；基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。这样，能够对于用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签中的哪个标签进行准确判定，从而及时判断和处理潜在欺诈行为，有利于保障平台的安全与稳定，避免经济损失。

Description

动态调整潜在黑名单和黑名单的方法

技术领域

本申请涉及智能化调整技术领域，并且更具体地，涉及一种动态调整潜在黑名单和黑名单的方法。

背景技术

随着互联网和移动互联网的发展，用户行为数据越来越丰富，包括用户搜索、浏览、购买、评论等各种行为，这些数据对于平台提高用户体验、进行营销推广以及防范欺诈都具有重要意义。其中，黑名单和潜在黑名单是常见的反欺诈措施，能够帮助企业过滤出异常用户或者高风险用户，加强防范措施。

然而，传统的黑名单和潜在黑名单调整方案通常需要人工周期性的手动检测更新，而人工通过经验规则的检测方式存在较大的主观性，不仅效率较低，而且也容易使得某些正常用户被误判为欺诈用户，影响了用户的体验。

因此，期望一种优化的动态调整潜在黑名单和黑名单的方案。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种动态调整潜在黑名单和黑名单的方法，该方法包括以下步骤：从云平台提取用户行为数据；对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量；基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。

其中，对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量，包括：

对所述用户行为数据进行数据清洗以得到清洗后用户行为数据；

对所述清洗后用户行为数据进行词关联语义理解以得到第一用户行为语义理解特征向量；

对所述清洗后用户行为数据进行字关联语义理解以得到第二用户行为语义理解特征向量；以及

构造所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量之间的所述交互用户行为语义理解优化特征向量。

对所述清洗后用户行为数据进行词关联语义理解以得到第一用户行为语义理解特征向量，包括：

对所述清洗后用户行为数据进行分词处理以得到用户行为描述词的序列；

将所述用户行为描述词的序列通过包含嵌入层的第一语义编码器以得到所述第一用户行为语义理解特征向量。

其中，对所述清洗后用户行为数据进行字关联语义理解以得到第二用户行为语义理解特征向量，包括：

对所述清洗后用户行为数据进行分字处理以得到用户行为描述字的序列；

将所述用户行为描述字的序列通过包含嵌入层的第二语义编码器以得到所述第二用户行为语义理解特征向量。

其中，所述包含嵌入层的第一语义编码器和所述包含嵌入层的第二语义编码器具有相同的网络结构。

具体的，所述第一语义编码器和所述第二语义编码器为基于转换器的Bert模型。

其中，构造所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量之间的所述交互用户行为语义理解优化特征向量，包括：

使用级联函数融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量以得到交互用户行为语义理解特征向量；

对所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量进行前向传播信息保留融合以得到校正特征向量；

对所述校正特征向量进行线性插值变换后与所述交互用户行为语义理解特征向量进行点乘加权以得到所述交互用户行为语义理解优化特征向量。

其中，使用级联函数融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量以得到交互用户行为语义理解特征向量，包括：

以如下级联公式融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量以得到所述交互用户行为语义理解特征向量；

其中，所述级联公式为：

V_s＝Concat[V₁，V₂]；

其中，V₁表示所述第一用户行为语义理解特征向量，V₂表示所述第二用户行为语义理解特征向量，Concat[·]表示级联函数，V_s表示所述交互用户行为语义理解特征向量。

其中，对所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量进行前向传播信息保留融合以得到校正特征向量，包括：

以如下融合优化公式对所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量进行前向传播信息保留融合以得到所述校正特征向量；

其中，所述融合优化公式为：

其中，V₁是所述第一用户行为语义理解特征向量，V₂是所述第二用户行为语义理解特征向量，<<s和>>s分别表示将特征向量左移s位和右移s位，round(·)为取整函数，是特征向量V₁和V₂的所有特征值的均值，||·||₁表示特征向量的一范数，d(V₁，V₂)是特征向量V₁和V₂之间的距离，且log为以2为底的对数函数值，V′是所述校正特征向量。

其中，基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签，包括：将所述交互用户行为语义理解优化特征向量通过分类器以得到分类结果，所述分类结果用于表示用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。

本发明能够对于用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签中的哪个标签进行准确判定，从而及时判断和处理潜在欺诈行为，有利于保障平台的安全与稳定，避免经济损失。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本申请实施例的动态调整潜在黑名单和黑名单的方法的流程图。

图2为根据本申请实施例的动态调整潜在黑名单和黑名单的方法的架构示意图。

图3为根据本申请实施例的动态调整潜在黑名单和黑名单的方法中步骤120的子步骤的流程图。

图4为根据本申请实施例的动态调整潜在黑名单和黑名单的方法中步骤124的子步骤的流程图。

图5为根据本申请实施例的动态调整潜在黑名单和黑名单的系统的框图。

图6为根据本申请实施例的动态调整潜在黑名单和黑名单的方法的场景示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另有说明，本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的，不是旨在限制本申请的范围。

在本申请实施例记载中，需要说明的是，除非另有说明和限定，术语“连接”应做广义理解，例如，可以是电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

需要说明的是，本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换，以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。

在本申请的一个实施例中，图1为根据本申请实施例的动态调整潜在黑名单和黑名单的方法的流程图。图2为根据本申请实施例的动态调整潜在黑名单和黑名单的方法的架构示意图。如图1和图2所示，一种动态调整潜在黑名单和黑名单的方法，包括：110，从云平台提取用户行为数据；120，对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量；130，基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。

具体地，首先，从云平台中获取用户的行为数据，其包括用户的点击、浏览、搜索等行为。然后，对用户行为数据进行语义编码，以得到交互用户行为语义理解优化特征向量。这个特征向量可以更好地反映用户的行为特征，从而更好地判断用户是否属于潜在黑名单或黑名单。最后，基于交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单、黑名单或白名单标签。通过对用户行为数据进行分类，可以更好地识别潜在黑名单和黑名单用户，从而更好地保护系统的安全。

应可以理解，所述动态调整潜在黑名单和黑名单的方法，一方面，可以提高系统的安全性：通过对用户行为数据进行分类，可以更好地识别潜在黑名单和黑名单用户，从而更好地保护系统的安全。另一方面，可以优化用户体验，通过对用户行为数据进行分类，可以更好地了解用户的行为特征，从而更好地为用户提供个性化的服务，提高用户体验。再一方面，可以提高系统的效率，通过对用户行为数据进行分类，可以更好地了解用户的行为特征，从而更好地优化系统的运行效率，提高系统的性能。

传统的黑名单和潜在黑名单调整方案通常需要人工周期性的手动检测更新，而人工通过经验规则的检测方式存在较大的主观性，不仅效率较低，而且也容易使得某些正常用户被误判为欺诈用户，影响了用户的体验。因此，期望一种优化的动态调整潜在黑名单和黑名单的方案。

具体地，在步骤110中，从云平台提取用户行为数据。相应地，在实际进行潜在黑名单和黑名单的调整过程中，关键在于对用户的行为数据，例如用户的搜索历史记录、购买历史记录、点击记录等进行语义分析和理解，以评估该用户是否会被添加到潜在黑名单或黑名单中。基于此，在本申请的技术方案中，为了能够使得调整方案更加智能化和标准化，期望基于深度学习的语义理解模型来对于从云平台提取的用户行为数据进行语义编码，以此来智能评估用户的行为数据属于潜在黑名单标签、黑名单标签或白名单标签中的哪个标签，从而确定该用户是否会被添加到潜在黑名单或黑名单中。这样，能够优化黑名单和潜在黑名单的调整方案，及时判断和处理潜在欺诈行为，有利于保障平台的安全与稳定，避免经济损失。

更具体地，在本申请的一个实施例中，可以通过自然语言处理方式从云平台提取用户行为数据，该方式利用自然语言处理技术对用户行为数据进行分析和理解，包括文本分类、情感分析、实体识别等技术。通过对用户行为数据进行自然语言处理，可以更好地了解用户的行为特征，从而更好地判断用户是否属于潜在黑名单或黑名单。

在本申请的另一个实施例中，可以通过深度学习方式从云平台提取用户行为数据，该方式利用深度学习技术对用户行为数据进行分析和理解，包括卷积神经网络、循环神经网络、自编码器等技术。通过对用户行为数据进行深度学习，可以更好地提取用户的行为特征，从而更好地判断用户是否属于潜在黑名单或黑名单。

从云平台提取用户行为数据，包括但不限于以下有益效果：1.提高黑名单和潜在黑名单的准确性，通过深度学习的语义理解模型对用户行为数据进行编码，能够更加准确地评估用户是否应该被添加到潜在黑名单或黑名单中，从而减少误判和漏判的情况。2.优化调整方案，基于深度学习的语义理解模型能够快速地对用户行为数据进行分析和编码，从而使得调整方案更加智能化和标准化，提高调整方案的效率和准确性。3.及时判断和处理潜在欺诈行为，通过对用户行为数据进行实时监测和分析，能够及时发现潜在欺诈行为并采取相应的措施，从而保障平台的安全与稳定，避免经济损失。4.提高用户体验，通过对用户行为数据的分析和理解，能够更好地了解用户的需求和喜好，从而提供更加个性化和优质的服务，提高用户的满意度和忠诚度。

具体地，在步骤120中，对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量。图3为根据本申请实施例的动态调整潜在黑名单和黑名单的方法中步骤120的子步骤的流程图，如图3所示，对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量，包括：121，对所述用户行为数据进行数据清洗以得到清洗后用户行为数据；122，对所述清洗后用户行为数据进行词关联语义理解以得到第一用户行为语义理解特征向量；123，对所述清洗后用户行为数据进行字关联语义理解以得到第二用户行为语义理解特征向量；以及，124，构造所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量之间的所述交互用户行为语义理解优化特征向量。

更具体地，在步骤121中，对从云平台提取的用户行为数据进行数据清洗，去除无用信息和噪声数据，以得到干净的用户行为数据，为后续的语义编码做准备。在从云平台上提取的所述用户行为数据，例如用户的搜索历史记录、购买历史记录和点击记录中，会存在有噪声、重复、错误以及无用的干扰信息，导致后续对于用户行为的语义理解出现偏差或错误，进而影响对用户行为数据的标签评估判断。因此，在本申请的技术方案中，需要进一步对所述用户行为数据进行数据清洗、筛选，以去除数据中无用的噪声和异常点，从而得到更加准确、高质量的用户行为数据，即得到清洗后用户行为数据。这里，经过数据清洗处理后的用户行为数据可以更好地表达真实用户行为，减少误判和漏报情况，提高模型的准确率和覆盖范围。

在本申请一具体示例中，在对用户行为数据进行清洗时，可以采用以下几个步骤：数据去重，对原始数据进行去重处理，去除重复的数据记录，以避免重复计算和对模型的干扰；数据筛选，对数据进行筛选，去除无用的数据记录和异常点。例如，对于电商平台的用户行为数据，可以去除无效的页面访问记录、无效的搜索记录、异常的购物车操作等；数据转换，对数据进行转换，以便于后续的处理和分析。例如，将时间戳转换为日期格式、将商品ID转换为商品名称等。数据填充，对数据中的缺失值进行填充，以避免对后续分析和模型的干扰。数据归一化，对数据进行归一化处理，以避免不同特征之间的差异对模型的影响。

这样，可以得到更加准确、高质量的用户行为数据，为后续的语义编码和特征提取打下基础。

进一步地，在对于所述清洗后用户行为数据进行语义理解的过程中，考虑到由于所述清洗后用户行为数据中存在有多个词或字，这些词或字之间具有着上下文的语义关联关系，并且各个词之间的语义关联特征和各个字之间的语义关联特征所表现的语义理解信息有所不同。因此，为了能够对于所述清洗后用户行为数据进行准确且充分地语义理解，以更好地了解用户的兴趣、行为习惯和购买能力等信息，从而优化潜在黑名单和黑名单的动态调整精度和效率，在本申请的技术方案中，需要对所述清洗后用户行为数据进行分词处理和分字处理，以从原始的用户行为数据中提取出有意义的关键信息，得到更加精准的用户画像和行为描述。

更具体地，在步骤122中，对清洗后的用户行为数据进行词关联语义理解，将用户行为数据转换为词向量，并通过深度学习的语义理解模型进行编码，得到第一用户行为语义理解特征向量。对所述清洗后用户行为数据进行词关联语义理解以得到第一用户行为语义理解特征向量，包括：对所述清洗后用户行为数据进行分词处理以得到用户行为描述词的序列；将所述用户行为描述词的序列通过包含嵌入层的第一语义编码器以得到所述第一用户行为语义理解特征向量。

进一步地，在步骤123中，对清洗后的用户行为数据进行字关联语义理解，将用户行为数据转换为字向量，并通过深度学习的语义理解模型进行编码，得到第二用户行为语义理解特征向量。对所述清洗后用户行为数据进行字关联语义理解以得到第二用户行为语义理解特征向量，包括：对所述清洗后用户行为数据进行分字处理以得到用户行为描述字的序列；将所述用户行为描述字的序列通过包含嵌入层的第二语义编码器以得到所述第二用户行为语义理解特征向量；

具体来说，通过对所述清洗后用户行为数据进行分词处理，可以得到一系列的用户行为描述词的序列，从而能够深入理解用户的偏好、兴趣和需求等方面的信息。而与分词不同的是，按字进行划分并不是将整个句子按词分开，而是将整个句子拆分成一个个汉字或英文字母。通过对所述清洗后用户行为数据进行按字划分，可以得到一系列的用户行为描述字的序列，这种方式适用于非常短的文本或者是用户名和产品名等信息的场景中。这样，通过采用分词和分字处理能够对用户的行为语义进行充分理解，有利于进行用户标签系统的建立，优化潜在黑名单和黑名单的动态调整精度和效率。

继而，为了对于进行分词和分字处理后得到的所述用户行为描述词的序列和所述用户行为描述字的序列进行语义特征提取，以此来对于用户行为进行语义理解，在本申请的技术方案中，使用语义编码器来进行语义编码。具体地，将所述用户行为描述词的序列通过包含嵌入层的第一语义编码器以得到第一用户行为语义理解特征向量，并将所述用户行为描述字的序列通过包含嵌入层的第二语义编码器以得到第二用户行为语义理解特征向量。

特别地，这里，所述包含嵌入层的第一语义编码器和所述包含嵌入层的第二语义编码器具有相同的网络结构，并且所述第一语义编码器和所述第二语义编码器为基于转换器的Bert模型，以此来分别提取出所述清洗后用户行为数据中各个词基于全局的上下文语义关联特征信息以及所述用户行为数据中各个字基于全局的上下文语义关联特征信息。

Bert模型全称为Bidirectional Encoder Representations fromTransformers，是一种基于Transformer的预训练语言模型。Bert模型在自然语言处理领域取得了很大的成功，被广泛应用于文本分类、命名实体识别、情感分析等任务中。

在本申请中，第一语义编码器和第二语义编码器都采用了Bert模型，以提取用户行为数据中的语义信息。所述Bert模型包括：输入层，将清洗后的用户行为数据作为输入，每个输入序列包含多个词或字；嵌入层，将每个输入词或字转换为对应的向量表示，这些向量表示被称为嵌入向量Bert编码器，Bert编码器是由多个Transformer块组成的，每个Transformer块由多个注意力机制和前馈神经网络组成，通过多个Transformer块的堆叠，可以得到更加复杂的语义表示；输出层，Bert模型的输出层通常是一个全连接层，用于将最终的语义表示映射到具体的任务上，例如情感分析、文本分类等。

在第一语义编码器和第二语义编码器中，输入序列的长度可能不同，但是嵌入层和Bert编码器的结构是相同的，这样可以确保两个编码器提取的语义信息具有一致性和可比性。

更具体地，在步骤124中，将第一用户行为语义理解特征向量和第二用户行为语义理解特征向量进行融合，构造交互用户行为语义理解优化特征向量，从而更加全面和准确地表达用户行为数据的语义信息。然后，再使用级联函数融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量以得到交互用户行为语义理解特征向量，以此来表示所述用户行为数据中各个词基于全局的上下文语义关联特征和各个字基于全局的上下文语义关联特征之间的关联性特征信息，即所述用户行为数据中分别基于词序列和字序列的多尺度语义理解关联特征信息，从而刻画出所述用户行为语义理解的多尺度语义特征，有利于进行用户行为数据的标签确定，从而提高潜在黑名单和黑名单动态调整的效率和精准度。

图4为根据本申请实施例的动态调整潜在黑名单和黑名单的方法中步骤124的子步骤的流程图，如图4所示，构造所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量之间的所述交互用户行为语义理解优化特征向量，包括：1241，使用级联函数融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量以得到交互用户行为语义理解特征向量；1242，对所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量进行前向传播信息保留融合以得到校正特征向量；1243，对所述校正特征向量进行线性插值变换后与所述交互用户行为语义理解特征向量进行点乘加权以得到所述交互用户行为语义理解优化特征向量。

应可以理解，将第一语义编码器和第二语义编码器提取的特征向量进行融合，得到一个交互用户行为语义理解特征向量。具体来说，可以采用级联函数的方式将两个特征向量进行融合，即将它们按照一定的规则级联起来，得到一个更长的特征向量。这个更长的特征向量就是交互用户行为语义理解特征向量。

使用级联函数融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量以得到交互用户行为语义理解特征向量，包括：以如下级联公式融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量以得到所述交互用户行为语义理解特征向量；其中，所述级联公式为：

V_s＝Concat[V₁，V₂]；

上述步骤中，将第一语义编码器和第二语义编码器提取的特征向量进行了简单的级联。但是，这种简单的融合方式可能会忽略一些重要的特征信息。因此，在这一步骤中，需要对两个特征向量进行前向传播信息保留融合。具体地，可以采用一些特殊的融合方式，例如加权平均或者加权求和，以保留两个特征向量中的重要信息，并得到一个更加准确的校正特征向量。

特别地，在本申请的技术方案中，所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量分别表达用户行为数据词的和用户行为数据字的文本语义编码特征，使得在不同尺度源数据下的文本语义特征关联编码导致所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量的分布不对齐。由此，在使用级联函数融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量时，对所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量的点卷积操作和激活操作，会导致所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量的各自的不对齐的文本语义编码特征在经由级联函数在模型中进行传播时产生信息损失，影响所述交互用户行为语义理解特征向量对于不同粒度下的用户行为数据的文本语义特征的表达效果。

基于此，本申请的申请人对所述第一用户行为语义理解特征向量，例如记为V₁和所述第二用户行为语义理解特征向量，例如记为V₂进行前向传播信息保留融合，以得到校正特征向量V′，其中V′表示为：对所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量进行前向传播信息保留融合以得到校正特征向量，包括：

以如下融合优化公式对所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量进行前向传播信息保留融合以得到所述校正特征向量；其中，所述融合优化公式为：

这里，针对特征在网络模型中的前向传播过程中，由于激活函数的激活和归一化产生的在向量尺度上的浮点分布误差和信息损失，通过从均一化信息角度来引入向量的逐位位移操作，来平衡和标准化前向传播过程中的量化误差和信息损失，并通过在融合之前重塑特征参数的分布来引入分布多样性，由此以扩大信息熵的方式进行信息保留(retention)。这样，再通过对所述校正特征向量V′进行线性插值以变换为与所述交互用户行为语义理解特征向量相同的长度后与所述交互用户行为语义理解特征向量进行点乘加权，就可以提升所述交互用户行为语义理解特征向量对于不同粒度下的用户行为数据的文本语义特征的表达效果，从而提升所述交互用户行为语义理解特征向量通过分类器得到的分类结果的准确性。这样，能够对于用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签中的哪个标签进行准确判定，从而及时判断和处理潜在欺诈行为，有利于保障平台的安全与稳定，避免经济损失。

如前所述，得到了所述校正特征向量，其包含了两个特征向量中的重要信息。但是，所述校正特征向量存在一些噪声或者不必要的信息。因此，在这一步骤中，将对校正特征向量进行线性插值变换，以进一步减少噪声和不必要的信息。然后，将变换后的校正特征向量与交互用户行为语义理解特征向量进行点乘加权，得到最终的交互用户行为语义理解优化特征向量。所述交互用户行为语义理解优化特征向量将被用于黑名单和潜在黑名单的调整方案，以保障平台的安全和稳定。

在本申请的一个实施例中，使用线性组合将变换后的校正特征向量与交互用户行为语义理解特征向量进行点乘加权，将变换后的校正特征向量和交互用户行为语义理解特征向量进行加权求和。具体来说，对于一个包含n个特征的交互用户行为语义理解特征向量x和一个包含m个特征的校正特征向量y，可以先对y进行维度变换，将其扩展为一个n*m的矩阵Y，然后将X和Y进行点乘操作，得到一个n*m的矩阵Z，最后对Z的每一行进行加权求和，即可得到最终的交互用户行为语义理解优化特征向量。

在本申请的另一个实施例中，使用非线性组合将变换后的校正特征向量与交互用户行为语义理解特征向量进行点乘加权，将变换后的校正特征向量和交互用户行为语义理解特征向量进行逐元素相乘，然后对相乘得到的结果进行加权求和。具体来说，对于一个包含n个特征的交互用户行为语义理解特征向量x和一个包含m个特征的校正特征向量y，可以先对y进行维度变换，将其扩展为一个n*m的矩阵Y，然后将X和Y进行逐元素相乘，得到一个n*m的矩阵Z，最后对Z的每一行进行加权求和，即可得到最终的交互用户行为语义理解优化特征向量。应可以理解，对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量，第一方面，可以提高语义理解的准确性，通过对用户行为数据进行清洗和语义编码，能够更加准确地理解用户行为数据的语义信息，从而提高语义理解的准确性。第二方面，可以提高模型的泛化能力，通过采用多种语义编码方式，能够更加全面地表达用户行为数据的语义信息，从而提高模型的泛化能力，适应不同用户和场景的需求。第三方面，可以降低计算复杂度，通过构造交互用户行为语义理解优化特征向量，能够减少特征维度和冗余信息，从而降低计算复杂度，提高模型的效率。第四方面，可以提高判断准确率，通过对用户行为数据进行语义编码，能够更加准确地判断用户是否应该被添加到潜在黑名单或黑名单中，从而提高判断准确率，减少误判和漏判的情况。

具体地，在步骤130中，基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。接着，进一步再将所述交互用户行为语义理解优化特征向量通过分类器中进行分类处理，以得到用于表示用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签的分类结果。

也就是，在本申请的技术方案中，所述分类器的标签包括用户行为数据属于潜在黑名单标签(第一标签)、用户行为数据属于潜在黑名单标签(第二标签)，以及，用户行为数据属于潜在白名单标签(第三标签)，其中，所述分类器通过软最大值函数来确定所述交互用户行为语义理解优化特征向量属于哪个分类标签。值得注意的是，这里的所述第一标签p1、所述第二标签p2和所述第三标签p3并不包含人为设定的概念，实际上在训练过程当中，计算机模型并没有“用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签”这种概念，其只是有三种分类标签且输出特征在这三个分类标签下的概率，即p1、p2和p3之和为一。因此，用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签的分类结果实际上是通过分类标签转化为符合自然规律的多分类的类概率分布，实质上用到的是标签的自然概率分布的物理意义，而不是“用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签”的语言文本意义。

应可以理解，在本申请的技术方案中，所述分类器的分类标签为用户行为数据所属的类型标签，因此，在得到所述分类结果后，可以基于所述分类结果来对于用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签中的哪个标签进行判定，从而及时判断和处理潜在欺诈行为，有利于保障平台的安全与稳定。

基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签，包括：将所述交互用户行为语义理解优化特征向量通过分类器以得到分类结果，所述分类结果用于表示用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。

在本申请的一个实施例中，将所述交互用户行为语义理解优化特征向量通过分类器中进行分类处理，以得到用于表示用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签的分类结果，包括步骤：1.数据准备，首先需要准备一批已经经过清洗和语义编码处理的用户行为数据，同时将这些数据标注为潜在黑名单、黑名单或白名单。2.特征提取，对于每个用户行为数据，可以使用之前提到的语义理解模型来提取其交互用户行为语义理解优化特征向量。3.数据划分，将数据集划分为训练集和测试集。4.模型选择，选择一个适合的分类器模型，比如逻辑回归、决策树、支持向量机等。这个选择通常需要根据数据集的大小、特征数量、分类类别数等因素进行考虑。5.模型训练，使用训练集对分类器模型进行训练。在训练过程中，分类器会根据提取的特征向量和标注的分类结果来学习如何对用户行为数据进行分类。6.模型评估，使用测试集对训练好的分类器模型进行评估，通常使用准确率、召回率、F1值等指标来评估模型的性能。7.模型优化，如果模型的性能不够好，可以进行模型优化，比如调整模型参数、增加特征数量、使用更复杂的模型等。8.模型应用，最终，可以使用训练好的分类器模型来对新的用户行为数据进行分类，从而判断其是否属于潜在黑名单、黑名单或白名单。

综上，基于本申请实施例的动态调整潜在黑名单和黑名单的方法100被阐明，其能够对于用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签中的哪个标签进行准确判定，从而及时判断和处理潜在欺诈行为，有利于保障平台的安全与稳定，避免经济损失。

在本申请的一个实施例中，图5为根据本申请实施例的动态调整潜在黑名单和黑名单的系统的框图。如图5所示，根据本申请实施例的动态调整潜在黑名单和黑名单的系统200，包括：用户行为数据提取模块210，用于从云平台提取用户行为数据；语义编码模块220，用于对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量；标签确定模块230，用于基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。

这里，本领域技术人员可以理解，上述动态调整潜在黑名单和黑名单的系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的动态调整潜在黑名单和黑名单的方法的描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的动态调整潜在黑名单和黑名单的系统200可以实现在各种终端设备中，例如用于动态调整潜在黑名单和黑名单的的服务器等。在一个示例中，根据本申请实施例的动态调整潜在黑名单和黑名单的系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该动态调整潜在黑名单和黑名单的系统200可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该动态调整潜在黑名单和黑名单的系统200同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该动态调整潜在黑名单和黑名单的系统200与该终端设备也可以是分立的设备，并且动态调整潜在黑名单和黑名单的系统200可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

图6为根据本申请实施例的动态调整潜在黑名单和黑名单的方法的场景示意图。如图6所示，在该应用场景中，首先，从云平台提取用户行为数据(例如，如图6中所示意的C)；然后，将获取的用户行为数据输入至部署有动态调整潜在黑名单和黑名单的算法的服务器(例如，如图6中所示意的S)中，其中所述服务器能够基于动态调整潜在黑名单和黑名单的算法对所述用户行为数据进行处理，以确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种动态调整潜在黑名单和黑名单的方法，其特征在于，包括：

从云平台提取用户行为数据；

对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量；

基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。

2.根据权利要求1所述的动态调整潜在黑名单和黑名单的方法，其特征在于，对所述用户行为数据进行语义编码以得到交互用户行为语义理解优化特征向量，包括：

3.根据权利要求2所述的动态调整潜在黑名单和黑名单的方法，其特征在于，对所述清洗后用户行为数据进行词关联语义理解以得到第一用户行为语义理解特征向量，包括：

4.根据权利要求3所述的动态调整潜在黑名单和黑名单的方法，其特征在于，对所述清洗后用户行为数据进行字关联语义理解以得到第二用户行为语义理解特征向量，包括：

5.根据权利要求4所述的动态调整潜在黑名单和黑名单的方法，其特征在于，所述包含嵌入层的第一语义编码器和所述包含嵌入层的第二语义编码器具有相同的网络结构。

6.根据权利要求5所述的动态调整潜在黑名单和黑名单的方法，其特征在于，所述第一语义编码器和所述第二语义编码器为基于转换器的Bert模型。

7.根据权利要求6所述的动态调整潜在黑名单和黑名单的方法，其特征在于，构造所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量之间的所述交互用户行为语义理解优化特征向量，包括：

8.根据权利要求7所述的动态调整潜在黑名单和黑名单的方法，其特征在于，使用级联函数融合所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量以得到交互用户行为语义理解特征向量，包括：

其中，所述级联公式为：

V_s＝Concat[V₁，V₂]；

9.根据权利要求8所述的动态调整潜在黑名单和黑名单的方法，其特征在于，对所述第一用户行为语义理解特征向量和所述第二用户行为语义理解特征向量进行前向传播信息保留融合以得到校正特征向量，包括：

其中，所述融合优化公式为：

其中，V₁是所述第一用户行为语义理解特征向量，V₂是所述第二用户行为语义理解特征向量，＜＜s和＞＞s分别表示将特征向量左移s位和右移s位，round(·)为取整函数，是特征向量V₁和V₂的所有特征值的均值，||·||₁表示特征向量的一范数，d(V₁,V₂)是特征向量V₁和V₂之间的距离，且log为以2为底的对数函数值，V′是所述校正特征向量。

10.根据权利要求9所述的动态调整潜在黑名单和黑名单的方法，其特征在于，基于所述交互用户行为语义理解优化特征向量，确定用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签，包括：将所述交互用户行为语义理解优化特征向量通过分类器以得到分类结果，所述分类结果用于表示用户行为数据属于潜在黑名单标签、黑名单标签或白名单标签。