CN115424278B

CN115424278B - 邮件检测方法及装置、电子设备

Info

Publication number: CN115424278B
Application number: CN202210969051.XA
Authority: CN
Inventors: 熊子晗; 陈军; 陈大北; 郭雪松
Original assignee: China Telecom Corp Ltd
Current assignee: China Telecom Corp Ltd
Priority date: 2022-08-12
Filing date: 2022-08-12
Publication date: 2024-05-03
Anticipated expiration: 2042-08-12
Also published as: CN115424278A

Abstract

本公开实施例是关于一种邮件检测方法及装置、电子设备，涉及网络安全技术领域，该方法包括：将待处理邮件中的目标文本进行转化，得到邮件特征图像；将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像；对所述增强的邮件特征图像进行特征提取，获取输出头特征向量；对所述输出头特征向量进行拟合获取分类预测值，并根据所述分类预测值以及分类阈值的对比结果确定所述待处理邮件是否为异常邮件。本公开能够在保护用户隐私的基础上准确识别异常邮件。

Description

邮件检测方法及装置、电子设备

技术领域

本公开实施例涉及网络安全技术领域，具体而言，涉及一种邮件检测方法、邮件检测装置以及电子设备。

背景技术

网络攻击事件经常以邮件攻击获取用户的身份以及其他相关数据。

相关技术中，可以通过对发件人邮箱、正文的文本等内容进行分析，检测单词存在的意义和这些单词的相应权重，作为分类器中表示电子邮件的特征，进而使用神经网络对特征进行判断，检测其中的钓鱼邮件样本，完成分类任务。上述方式中，存在暴露邮件发件人、正文内容等隐私信息的问题，安全性较差，可靠性较低；并且，邮件检测的准确性较低。

需要说明的是，在上述背景技术部分发明的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种邮件检测方法、邮件检测装置以及电子设备，进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的安全性较低以及准确性较差的问题。

根据本公开的一个方面，提供一种邮件检测方法，包括：将待处理邮件中的目标文本进行转化，得到邮件特征图像；将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像；对所述增强的邮件特征图像进行特征提取，获取输出头特征向量；对所述输出头特征向量进行拟合获取分类预测值，并根据所述分类预测值以及分类阈值的对比结果确定所述待处理邮件是否为异常邮件。

在本公开的一种示例性实施例中，所述将待处理邮件中的目标文本进行转化，得到邮件特征图像，包括：对目标文本进行分词操作得到多个分词，并获取每个分词的特征向量以及每个分词的权重；确定各特征向量对应的哈希编码值序列；结合所述哈希编码值序列中，每个哈希编码值的每一位和所述特征向量的权重生成签名结果；对所述签名结果进行图像像素描点操作确定像素点的坐标以及灰度值，以生成所述邮件特征图像。

在本公开的一种示例性实施例中，所述确定各特征向量对应的哈希编码值序列，包括：随机初始化多个哈希函数，通过多个哈希函数确定各特征向量对应的哈希编码值序列。

在本公开的一种示例性实施例中，所述结合所述哈希编码值序列中，每个哈希编码值的每一位和所述特征向量的权重生成签名结果，包括：根据每一位的哈希编码值与所述权重进行逻辑操作，生成新的哈希编码值序列；对新的哈希编码值序列进行列加操作得到新的哈希向量；按位判断新的哈希向量中的二进制数值，以计算签名结果。

在本公开的一种示例性实施例中，所述对所述签名结果进行图像像素描点操作确定每个分词对应的像素点的坐标以及灰度值，以生成所述邮件特征图像，包括：将签名结果拆分为第一数值和第二数值；按位判断第一数值和第二数值与阈值参数的对比结果，以得到第三数值和第四数值；将第三数值和第四数值转换为十进制数值以确定坐标，并将所述坐标处的像素点的灰度值增加预设值。

在本公开的一种示例性实施例中，所述将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像，包括：对所述增强的邮件特征图像进行像素反转，通过互补灰度值代替所述灰度值；对所述像素点的互补灰度值进行归一化处理，以增强所述邮件特征图像。

在本公开的一种示例性实施例中，所述对所述增强的邮件特征图像进行特征提取，获取输出头特征向量，包括：对所述增强的邮件特征图像通过多阶段模型进行特征提取和解码，获取解码后的特征向量作为输出头特征向量；所述多阶段模型通过多个目标模型串联得到，所述目标模型包括窗口多头注意层和移位窗口多头自注意层。

在本公开的一种示例性实施例中，所述对所述增强的邮件特征图像通过多阶段模型进行特征提取和解码，获取解码后的特征向量作为输出头特征向量，包括：将所述增强的邮件特征图像进行区域划分，并对划分结果通过第一阶段模型中的线性嵌入层和目标模型进行特征提取，以获取初始特征；对所述邮件特征图像进行降采样，并通过第二阶段模型中目标模型对所述降采样结果进行深度特征提取，获取深度特征；通过第三阶段模型中的目标模型对所述深度特征进行解码操作，获取解码后的特征向量作为输出头特征向量。

根据本公开的一个方面，提供一种邮件检测装置，包括：文本转化模块，用于将待处理邮件中的目标文本进行转化，得到邮件特征图像；图像增强模块，用于将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像；特征获取模块，用于对所述增强的邮件特征图像进行特征提取，获取输出头特征向量；邮件识别模块，用于对所述输出头特征向量进行拟合获取分类预测值，并根据所述分类预测值以及分类阈值的对比结果确定所述待处理邮件是否为异常邮件。

根据本公开的一个方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的邮件检测方法。

本公开实施例中提供的邮件检测方法、邮件检测装置以及电子设备中，一方面，使用降维算法将待处理邮件中的目标文本的文字特征重新编码为邮件特征图像，将对文本特征的检测转换为对图像特征的检测，实现在检测过程中对待处理邮件的文本信息进行保护，提高了安全性和可靠性，保护了用户隐私。另一方面，通过对图像特征进行检测以实现异常邮件检测，能够在保护用户隐私的基础上，保证异常邮件的检测准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示意性示出本公开实施例的一种邮件检测方法的流程图。

图2示意性示出本公开实施例的转换为邮件特征图像的流程图。

图3示意性示出本公开实施例文本转换的示意图。

图4示意性示出本公开实施例生成邮件特征图像的具体流程图。

图5示意性示出本公开实施例特征提取模块的示意图。

图6示意性示出本公开实施例目标模型的结构示意图。

图7示意性示出本公开实施例邮件检测的流程示意图。

图8示意性示出本公开实施例邮件检测装置的框图示意图。

图9示意性示出本公开实施例电子设备的框图示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

相关技术中，邮件的检测方法存在暴露邮件发件人、正文内容等隐私信息的问题，攻击者可能会通过随机语言模型构造哈希算法，通过词频攻击等方法推测原始文档内容，容易造成敏感信息泄露等问题。

为了解决相关技术中的问题，本公开实施例中，提供了一种邮件检测方法。参考图1中所示，该邮件检测方法主要包括以下步骤：

步骤S110，将待处理邮件中的目标文本进行转化，得到邮件特征图像；

步骤S120，将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像；

步骤S130，对所述增强的邮件特征图像进行特征提取，获取输出头特征向量；

步骤S140，对所述输出头特征向量进行拟合获取分类预测值，并根据所述分类预测值以及分类阈值的对比结果确定所述待处理邮件是否为异常邮件。

本公开实施例中，使用降维算法将待处理邮件中的目标文本的文字特征重新编码为邮件特征图像，对邮件特征图像进行图像增强得到增强的邮件特征图像并获取输出头特征向量，以基于输出头特征向量获取分类预测值对待处理邮件进行识别，将对文本特征的检测转换为对图像特征的检测，实现在检测过程中对待处理邮件的文本信息进行保护，提高了安全性和可靠性，保护了用户隐私。另一方面，通过对图像特征进行检测以实现异常邮件检测，能够在保护用户隐私的基础上，保证异常邮件的检测准确性。

接下来，参考图1中所示，对邮件检测方法的每个步骤进行详细说明。

在步骤S110中，将待处理邮件中的目标文本进行转化，得到邮件特征图像。

本公开实施例中，待处理邮件可以为所有类型的邮箱接收到的待检测邮件。待处理邮件中可以包含文本信息以及图像信息等等，此处不作限定。举例而言，待处理邮件的发件人和收件人可以对应文本信息；正文信息可以包含文本信息，也可以包括图像信息。基于此，目标文本可以为发件人和正文信息中的所有文本信息。邮件特征图像可以为将邮件中的目标文本转换得到的图像，一个待处理邮件可以与一个邮件特征图像相对应。此处的邮件特征图像可以为灰度图像。

图2中示意性示出了将目标文本转化为邮件特征图像的流程图，参考图2中所示，主要包括以下步骤：获取邮件样本得到特征向量表达与权重、初始化哈希函数、计算哈希编码值、获取Simhash二进制签名、图片像素描点。具体介绍如下：

在步骤S210中，对目标文本进行过滤与分词操作得到多个分词，并获取每个分词的特征向量以及每个分词的权重。

本步骤中，在获取到待处理邮件后，可以解析出待处理邮件中的发件人以及正文文本部分，以作为目标文本。进一步地，可以对目标文本进行过滤，并对过滤后的目标文本进行分词操作得到多个分词，例如t个分词。并且可以得到每个分词的特征向量，特征向量可以为每个分词所对应的单词的分布式表达。由于每个分词对应一个特征向量，对待处理邮件的目标文本进行分词得到的多个分词可以形成一个特征向量序列，例如可以表示为如下形式T_i∈{T₁,T₂,...,T_t}。

与此同时，还可以计算每个分词的权重，此处的权重指的是权重得分，例如可以表示为w_i。示例性地，可以使用词频-逆文件频率TF-IDF(Term Frequency–Inverse DocumentFrequency)算法计算每个分词权重得分。也可以使用其他方式计算每个分词的权重得分，此处不作限定。

在步骤S220中，确定各特征向量对应的哈希编码值序列。

本步骤中，每个分词可以对应一个特征向量，每个特征向量可以对一个哈希编码值序列。哈希编码值序列可以为二进制哈希编码值序列。示例性地，可以随机初始化多个哈希函数，通过多个哈希函数确定特征向量序列中各特征向量对应的哈希编码值序列。即，通过哈希函数计算一个分词的特征向量对应的n维哈希编码值，以得到每个分词的哈希编码值序列。

在一些实施例中，哈希函数用于获取每个特征向量在一个维度上的特征，通过多个哈希函数可以获取每个特征向量在多个维度上的特征，从而形成每个特征向量的二级制哈希编码值序列。哈希编码值序列中包含的哈希编码值的数量与哈希函数的数量相同。

示例性地，随机初始化n个哈希函数Hash_j∈{Hash₁,Hash₂,...,Hash_n}，使用哈希函数Hash_j获取特征向量T_i在第j维的特征。通过哈希函数计算特征向量T_i对应的二进制哈希编码值序列H_j∈{H₁,H₂,...,H_n}。

在步骤S230中，结合所述哈希编码值序列中，每个哈希编码值的每一位和所述特征向量的权重生成签名结果。

本步骤中，每个哈希编码值可以包含多位，每一位的数值可以相同或不同，例如第一位的数值可以为0，第二位的数值可以为1等等。基于此，可以结合哈希编码值中每一位的数值和每个分词的特征向量的权重来生成签名结果。其中，逻辑操作可为加权计算或减法计算，具体根据每一位的数值而确定。示例性地，若哈希编码值中目标位的数值为第一预设值，可以将目标位的数值与该特征向量的权重进行加权计算；若哈希编码值中目标位的数值不为第一预设值，可以将目标位的数值与该所述特征向量的权重进行减法计算，以得到新的哈希编码值序列。第一预设值可为1。

即，根据哈希编码值H_j的每一位进行加权计算，哈希编码值H_j中为1的位数，加上该特征向量对应的权重w_i，否则减去其对应权重w_i，此时可得到经过加权计算的新的哈希编码值序列H'_j∈{H'₁,H'₂,...,H'_n}。

在得到新的哈希编码值序列之后，可对新的哈希编码值序列进行列加操作得到新的哈希向量列加操作指的是将新的哈希编码值序列中的所有哈希编码值进行加法操作，得到每个特征向量对应的新的哈希向量。

进一步地，按位判断新的哈希向量中的二进制数值，使用信号激活函数计算签名结果。签名结果可以为Simhash二进制签名结果，用于表示新的哈希向量中每一位的签名。示例性地，若新的哈希向量中目标位的数值大于第二预设值，则标记目标位的签名结果为1，否则为0。第二预设值可以为0。举例而言，如果新的哈希向量中第j位大于0，则标记Simhash签名第j位为1，否则为0。

在步骤S240中，对所述签名结果进行像素描点操作确定像素点的坐标以及灰度值，以生成所述邮件特征图像。

本步骤中，生成邮件特征图像可以包括以下步骤：

将签名结果拆分为第一数值和第二数值；

按位判断第一数值和第二数值与阈值参数的对比结果，以得到第三数值和第四数值；

将第三数值和第四数值转换为十进制数值以确定坐标，并将所述坐标处的像素点的灰度值增加预设值。

其中，第一数值和第二数值可以为8位16进制数值。第三数值可以为对第一数值进行转换得到的数值，第四数值可以为对第二数值进行转换得到的数值。第三数值和第四数值都可以为8位二进制数值。进一步可以将第三数值和第四数值转换为两个十进制数值，分别记为像素点的横纵坐标，并将该坐标处像素点的灰度值g增加预设值。预设值可以为16。

在一些实施例中，将Simhash二进制签名结果拆分为两个8位16进制数值Sim₁和Sim₂，按位对16进制数值与阈值参数进行比较得到对比结果。阈值参数可以为7。若对比结果为第一数值和第二数值大于7，大于7的位数记为1，否则记为0。基于此得到两个8位二进制数值，即第三数值Sim'₁和第四数值Sim'₂。将第三数值Sim'₁和第四数值Sim'₂转换为十进制数值X_sim∈[0,255]和Y_sim∈[0,255]，可根据十进制数值确定坐标。具体可以将十进制数值X_sim∈[0,255]确定为横坐标，将十进制数值Y_sim∈[0,255]确定为纵坐标。并将坐标(X_sim，Y_sim)标记于图像上，将该坐标处的像素点的灰度值增加16，直至灰度值达到目标值为止。目标值可以为最大灰度值，例如255。示例性地，每个坐标的像素点的灰度值均可以增加预设值16，若某个坐标处的像素点的灰度值增加预设值后大于255，则将其灰度值确定为255。若某个坐标处的像素点的灰度值增加预设值后不大于255，则将其灰度值确定为增加预设值之后的灰度值。需要说明的是，默认像素点的灰度值为0。

重复执行计算哈希编码值序列、获取签名结果以及图像像素描点操作的过程，直至为所有分词执行完像素描点操作为止，以将待处理邮件的目标文本转化为邮件特征图像。邮件特征图像可以为265*265的图像。具体过程参考图3中所示。

图3中示意性示出了对分词文本的处理过程，对得到的分词提取特征向量以及特征向量的权重，并通过哈希函数确定该特征向量在n个维度的哈希值，n个不同维度的哈希值所对应的权重相同。每个哈希值可以包含多位，根据每一位的数值是否为第一预设值1来选择不同的方式与特征向量的权重加权计算，得到新的数值并对新的数值进行拼接得到新的哈希编码值序列作为加权结果，对加权结果进行列加得到新的哈希向量。进一步地，对新的哈希向量中的二进制数值，使用信号激活函数进行签名计算，得到签名结果。签名结果可以为二进制数值。将Simhash二进制签名结果拆分为两个8位16进制数值，按位对16进制数值与阈值参数进行比较得到对比结果。若对比结果为大于7，大于7的位数记为1，否则记为0。基于此得到两个8位二进制数值。进一步将两个8位二进制数值转换为十进制数值，可根据十进制数值确定横坐标和纵坐标，以确定坐标。基于此，根据坐标进行像素描点。

图4中示意性示出了生成邮件特征图像的流程图，参考图4中所示，可对待处理邮件401进行解析得到发件人和正文表示的目标文本。对目标文本进行分词得到特征向量和权重，初始化哈希函数，并计算哈希编码值，获取二进制签名结果。基于签名结果进行图像像素描点，得到邮件特征图像402。

本公开实施例中，将待处理邮件的目标文本转换为邮件特征图像，能够提高安全性，保护用户隐私。

接下来，继续参考图1中所示，在步骤S120中，将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像。

本公开实施例中，邮件图像增强模块主要用于对生成的邮件图像特征进行图像增强操作，降低噪声干扰，加强其像素点特征。具体步骤包括：对所述邮件特征图像进行像素反转，通过互补灰度值代替所述灰度值；对所述像素点的互补灰度值进行归一化处理，以增强所述邮件特征图像。像素反转指的是通过与坐标处的灰度值相反的互补灰度值来对灰度值进行代替。互补灰度值g’可通过目标值与灰度值之间的差值来确定。目标值可以为255。在此基础上，可通过g’＝255-g确定互补灰度值，以执行图像像素反转变化，旨在用互补灰度代替原始的灰度值。图像像素反转后，将原始的黑色背景转换为白色背景，同时增强原始像素点的灰色细节。

在进行像素反转后，可通过对所述像素点的互补灰度值进行归一化处理实现对邮件特征图像进行归一化处理。示例性地，可以基于像素点的最小值g_min和最大值g_max进行逻辑操作实现归一化处理，具体如公式(1)所示：

其中，K为尺度因子，具体根据实际需求而确定。

图像像素反转变化和图像归一化处理，旨在加强邮件特征图像的像素点特征，增强图像对比度，以此增强图像特征，能够降低图像的噪声干扰。

在步骤S130中，对所述增强的邮件特征图像进行特征提取，获取输出头特征向量。

本公开实施例中，可以通过特征提取模块来对增强后的邮件特征图像进行特征提取。参考图5中所示，特征提取模块可以包含划分区域层501、多阶段模型502以及全局池化层503，多阶段模型502包括第一阶段模型5021、第二阶段模型5022、第三阶段模型5023。其中，多阶段模型中均包含多个目标模型504，且不同节点的模型中包含的目标模型的数量可以相同或不同。目标模型504可以为Swin Transformer模型，其中包括窗口多头注意层和移位窗口多头自注意层。参考图6中所示，目标模型Swin transformer有两个子单元。每个子单元由一个正则化层、一个注意力模块、另一个正则化层和一个前馈神经网络层、残差网络组成。正则化层可以为LN正则化层。第一个单元的注意力模块使用W-MSA，第二个单元的注意力模块使用SW-MSA。基于移动窗口的W-MSA和基于窗口的SW-MSA模块前后相连，实现不同窗口内特征的传递与交互。

窗口多头注意层中，注意力只在每个窗口内计算。采用不重叠窗口之后，每次自注意力的操作都在小的窗口里头进行，每个窗口里的patch就永远无法注意到别的窗口里的patch的信息，也就是说窗口之间的信息没有交互，所以就会限制整个模型的感受野，感受野会限制在窗口内部，看不到全局信息。

由于将注意力限制在每个窗口，限制了网络的建模能力。为了解决这个问题，SwinTransformer在W-MSA模型之后使用了移位窗口SW-MSA模型。移动窗口就是把原来的窗口往右下角移动一半窗口的距离，每次都是先要做一次基于窗口的多头自注意力，然后再做一次基于移动窗口的多头自注意力，这样就达到了窗口和窗口之间的互相通信。

基于上述特征提取模型的结构，对增强的邮件特征图像进行特征提取与解码的过程可以参考图5中所示：

可以将增强的邮件特征图像经过第一阶段模型进行处理，具体通过划分区域层划分区域，并将划分结果输入至第一阶段模型中的线性嵌入层和2层Swin Transformer模型进行第一层特征提取，以获取初始特征。进一步经过第二阶段模型进行处理，具体根据第二阶段模型中的区域融合层以及4层Swin Transformer模型对第一阶段模型输出的初始特征进行特征提取。示例性地，可通过区域融合层进行区域融合操作对输入的图像进行降采样，使用4层Swin Transformer模型对初始特征进行深度特征提取，得到局部特征并让其具备全局感受野，并根据具备全局感受野的局部特征确定为深度特征。通过第二阶段模型进一步深化图像中的局部特征，让所有局部特征关联起来，并使其具备全局感受野，提高了深度特征的准确性和全面性。其中，4层Swin Transformer模型可以根据2个窗口多头自注意层W-MSA和移位窗口多头自注意层SW-MSA串联得到。接下来，可以经过第三阶段模型进行处理，具体根据第三阶段模型中的区域融合层以及2层Swin Transformer模型对第二阶段模型输出的深度特征进行解码操作，并基于全局池化层得到解码后的特征向量，进而得到输出头特征向量。

本公开实施例中，通过多个阶段模型的串联，能够提高获取的特征向量的准确性和全面性。

参考图6中所示的目标模型的结构图所示，目标模型中包含窗口多头注意层和移位窗口多头自注意层。除此之外，还包含正则化层、残差连接以及前馈神经网络。具体过程如下：输入特征先经过正则化层进行归一化，将每一行变成均值为0、方差为1的归一化结果；经过W-MSA对归一化结果进行特征学习，并通过残差网络进行残差连接。此处的输入特征根据目标模型所处的不同阶段模型而确定。接下来经过一个LN正则化层、一个前馈神经网络以及一个残差网络，得到这一层的输出特征。进一步地，对输出特征进行基于移动窗口的多头自注意力Shifted window，以得到一个目标模型的输出。具体地，将输出特征先经过正则化层进行归一化，得到归一化结果；经过移动窗口的多头自注意层SW-MSA对归一化结果进行特征学习，并通过残差网络进行残差连接。接下来经过一个LN正则化层、一个前馈神经网络以及一个残差网络，得到一个目标模型最终的输出。

本公开实施例中，为了保证不重叠窗口之间有联系，采用了移动窗口的多头自注意层重新计算一遍窗口偏移之后的自注意力。移动窗口就是把原来的窗口往右下角移动一半窗口的距离，每次都是先要做一次基于窗口的多头自注意力，然后再做一次基于移动窗口的多头自注意力，以达到了窗口和窗口之间的互相通信，降低了复杂度，且能够提取具有全局感受野的局部特征作为深度特征，提高了特征向量的准确性。

需要补充的是，可以使用二分类交叉熵损失函数作为多阶段模型的损失函数，更新多阶段模型的模型参数，直至损失函数收敛为止，以进行模型训练，提高模型的准确性和鲁棒性。

在步骤S140中，对所述输出头特征向量进行拟合获取分类预测值，并根据所述分类预测值以及分类阈值的对比结果确定所述待处理邮件是否为异常邮件。

本公开实施例中，在得到输出头特征向量后，可以对该输出头特征向量进行拟合预测，以获取分类预测值。示例性地，可以将输出头特征向量输入至线性连接层和全连接层，以对输出头特征向量进行线性连接和全连接处理，并使用sigmoid函数得到分类预测值。

获取分类预测值后，可以将分类预测值与分类阈值进行对比得到对比结果，并根据对比结果确定待处理邮件是否为异常邮件。分类阈值可以根据实际需求进行限定，例如可以为a。若对比结果为分类预测值大于分类阈值，则确定待处理邮件属于异常邮件；若对比结果为分类预测值小于分类阈值，则确定待处理邮件不属于异常邮件，即属于正常邮件。异常邮件可以为钓鱼邮件等存在风险的邮件。异常邮件可以为钓鱼邮件或者是其他类型的存在风险的邮件。例如可以为利用伪装的电邮，欺骗收件人将账号、口令等信息回复给指定的接收者；或引导收件人连接到伪装成和真实网站一样特制的网页的邮件。

除此之外，若待处理邮件为异常邮件，则认为存在风险，可以提供预警，以便于用户规避。

图7中示意性示出了邮件检测的具体流程图，参考图7中所示，主要包括以下步骤：

在步骤S710中，获取待处理邮件。待处理邮件可以为邮箱中收到的某未知的外部邮件。

在步骤S720中，对待处理邮件进行特征转换，得到邮件特征图像。

示例性地，主要包括以下步骤：解析邮件样本的发件人信息和正文信息，对以上文本信息进行分词操作，计算每个分词的权重，同时获得每个分词的特征向量表达。随机初始化n个哈希函数以获得哈希编码值序列。获取Simhash二进制签名结果。根据签名结果进行像素描点操作，以得到265*265的邮件特征图像。

在步骤S730中，得到邮件特征图像。

在步骤S740中，对邮件特征图像进行特征增强。

示例性地，可以对邮件特征图像进行图像像素翻转以及归一化，得到增强的邮件特征图像。

在步骤S750中，对增强的邮件特征图像进行特征提取与解码，得到输出头特征向量。

示例性地，可对增强后的邮件特征图像划分区域，通过多阶段模型中的目标模型进行特征提取，并进行特征解码，经过全局池化层得到解码后的特征向量作为输出头特征向量。

其中，特征提取模块包括划分区域模块、3个阶段模型与1个输出头，其中3个阶段模型包含(2,4,2)层串联而成的Swin Transformer模块。将窗口多头自注意层和移位窗口多头自注意层的神经网络串联设计为2层Swin Transformer模块。

基于此，对增强的邮件特征图像进行区域划分，进而输入第1阶段模型进行特征提取。第1阶段模型包括线性嵌入层和2层Swin Transformer模块。接下来，使用第2阶段模型进一步提取图像的深度特征，进一步深化图像中的局部特征，让其具备全局感受野。第2阶段模型包括区域融合层和4层Swin Transformer模型，其中区域融合层对图像进行降采样，4层Swin Transformer模型即串联2个W-MSA和SW-MSA。最后第3阶段模型做特征的解码操作。第3阶段模型包括区域融合层和2层Swin Transformer模型。在3个阶段模型处理完成后，通过全局池化层得到解码后的特征向量作为输出头特征向量。

在步骤S760中，对输出头特征向量进行特征分类，判断待处理邮件的类型。

示例性地，使用sigmoid函数得到输出头特征向量的分类预测值，将分类预测值与分类阈值进行对比得到对比结果，根据对比结果判断待处理邮件属于异常邮件还是正常邮件。

在步骤S770中，识别异常邮件。

本公开实施例中提供的技术方案，针对现有的邮件检测方法存在暴露邮件发件人、正文内容等隐私信息的问题，构造基于隐私保护的异常邮件检测流程，使用降维算法将文字特征重新编码为灰度图像，从而将原来的文本特征转换为图像特征，邮件检测任务也变为图像分类任务，利用转换过程的不可逆性防止攻击者倒推行为，实现在检测过程中对用户邮件的敏感信息隐私保护。利用Swin-transformer算法实现基于图像特征的邮件检测，能够在保护用户隐私的基础上，保证邮件的检测准确性。

本公开还提供了一种邮件检测装置。参考图8所示，该邮件检测方法800主要包括以下模块：

文本转化模块801，用于将待处理邮件中的目标文本进行转化，得到邮件特征图像；

图像增强模块802，用于将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像；

特征获取模块803，用于对所述增强的邮件特征图像进行特征提取，获取输出头特征向量；

邮件识别模块804，用于对所述输出头特征向量进行拟合获取分类预测值，并根据所述分类预测值以及分类阈值的对比结果确定所述待处理邮件是否为异常邮件。

在本公开的一种示例性实施例中，所述将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像，包括：对所述邮件特征图像进行像素反转，通过互补灰度值代替所述灰度值；对所述像素点的互补灰度值进行归一化处理，以增强所述邮件特征图像。

在本公开的一种示例性实施例中，所述对所述增强的邮件特征图像进行特征提取，获取输出头特征向量，包括：对所述增强的邮件特征图像通过多阶段模型进行特征提取获取深度特征，并对所述深度特征进行解码，获取解码后的特征向量作为输出头特征向量；其中，所述多阶段模型通过多个目标模型串联得到，所述目标模型包括窗口多头注意层和移位窗口多头自注意层。

在本公开的一种示例性实施例中，所述对所述增强的邮件特征图像通过多阶段模型进行特征提取和解码，获取解码后的特征向量作为输出头特征向量，包括：将所述邮件特征图像进行区域划分，并对划分结果通过第一阶段模型中的线性嵌入层和目标模型进行特征提取，以获取初始特征；通过第二阶段模型中的目标模型对初始特征进行深度特征提取，获取深度特征；通过第三阶段模型中的目标模型对所述深度特征进行解码操作，获取解码后的特征向量作为输出头特征向量。

需要说明的是，上述邮件检测装置中各模块的具体细节已经在对应的邮件检测方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

在本公开的示例性实施例中，还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

下面参照图9来描述根据本公开的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图9所示，电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于：上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930以及显示单元940。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元910执行，使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如，所述处理单元910可以执行如图2中所示的步骤。

存储单元920可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)9201和/或高速缓存存储单元9202，还可以进一步包括只读存储单元(ROM)9203。

存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204，这样的程序模块9205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线930可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备900也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备900交互的设备通信，和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且，电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器960通过总线930与电子设备900的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备900使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者电子设备等)执行根据本公开实施方式的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。

根据本公开的实施方式的用于实现上述方法的程序产品，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

Claims

1.一种邮件检测方法，其特征在于，包括：

将待处理邮件中的目标文本进行转化，得到邮件特征图像；

将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像；

对所述增强的邮件特征图像进行特征提取，获取输出头特征向量；

对所述输出头特征向量进行拟合获取分类预测值，并根据所述分类预测值以及分类阈值的对比结果确定所述待处理邮件是否为异常邮件；

其中，所述将待处理邮件中的目标文本进行转化，得到邮件特征图像，包括：

对目标文本进行分词操作得到多个分词，并获取每个分词的特征向量以及每个分词的权重；

确定各特征向量对应的哈希编码值序列；

结合所述哈希编码值序列中，每个哈希编码值的每一位和所述分词对应的特征向量的权重生成签名结果；

将签名结果拆分为第一数值和第二数值，按位判断第一数值和第二数值与阈值参数的对比结果以得到第三数值和第四数值，将第三数值和第四数值转换为十进制数值以确定坐标，并将所述坐标处的像素点的灰度值增加预设值，直至达到目标值为止，以生成邮件特征图像。

2.根据权利要求1所述的邮件检测方法，其特征在于，所述确定各特征向量对应的哈希编码值序列，包括：

随机初始化多个哈希函数，通过多个哈希函数确定各特征向量对应的哈希编码值序列。

3.根据权利要求1所述的邮件检测方法，其特征在于，所述结合所述哈希编码值序列中，每个哈希编码值的每一位和所述分词对应的特征向量的权重生成签名结果，包括：

根据每一位的数值与所述权重进行逻辑操作，生成新的哈希编码值序列；

对新的哈希编码值序列进行列加操作得到新的哈希向量；

按位判断新的哈希向量中的二进制数值，以计算签名结果。

4.根据权利要求1所述的邮件检测方法，其特征在于，所述将所述邮件特征图像进行图像增强操作，以获取增强的邮件特征图像，包括：

对所述邮件特征图像进行像素反转，通过互补灰度值代替所述灰度值；

对像素点的互补灰度值进行归一化处理，以增强所述邮件特征图像。

5.根据权利要求1所述的邮件检测方法，其特征在于，所述对所述增强的邮件特征图像进行特征提取，获取输出头特征向量，包括：

对所述增强的邮件特征图像通过多阶段模型进行特征提取获取深度特征，并对所述深度特征进行解码，获取解码后的特征向量作为输出头特征向量；

其中，所述多阶段模型通过多个目标模型串联得到，所述目标模型包括窗口多头注意层和移位窗口多头自注意层。

6.根据权利要求5所述的邮件检测方法，其特征在于，所述对所述增强的邮件特征图像通过多阶段模型进行特征提取和解码，获取解码后的特征向量作为输出头特征向量，包括：

将所述增强的邮件特征图像进行区域划分，并对划分结果通过第一阶段模型中的线性嵌入层和目标模型进行特征提取，以获取初始特征；

通过第二阶段模型中的目标模型对所述初始特征进行深度特征提取，获取深度特征；

通过第三阶段模型中的目标模型对所述深度特征进行解码操作，获取解码后的特征向量作为输出头特征向量。

7.一种邮件检测装置，其特征在于，包括：

文本转化模块，用于将待处理邮件中的目标文本进行转化，得到邮件特征图像；

图像增强模块，用于将所述邮件特征图像进行图像增强操作，以获取增强的所述邮件特征图像；

特征获取模块，用于对所述增强的邮件特征图像进行特征提取，获取输出头特征向量；

邮件识别模块，用于对所述输出头特征向量进行拟合获取分类预测值，并根据所述分类预测值以及分类阈值的对比结果确定所述待处理邮件是否为异常邮件；

确定各特征向量对应的哈希编码值序列；

8.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至6中任一项所述的邮件检测方法。