CN114495013A

CN114495013A - 异常行为检测方法、装置及存储介质

Info

Publication number: CN114495013A
Application number: CN202210191841.XA
Authority: CN
Inventors: 李浩玮; 陶泽; 胡斌; 付慧青
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2022-03-01
Filing date: 2022-03-01
Publication date: 2022-05-13

Abstract

本发明公开了一种异常行为检测方法、装置及存储介质，在使用深度学习的基础上，充分发挥了边缘服务器高响应、低延迟的优势，提出了一种基于无数据知识传递的异常行为检测方法。本发明可以保证在不访问原始数据集，不使用任何自然图像和标记数据的前提下，为边缘模型提供用于训练的合成图像数据集，并利用云端模型和边缘模型之间的分歧提高合成图像的多样性。经过实验证明，本发明的可行性高，经过训练的模型可运行于边缘设备，且在异常行为检测时准确率较高，且拥有低延迟、响应快的优势，有效克服了庞大复杂的云端模型无法在边缘设备运行的弊端。

Description

异常行为检测方法、装置及存储介质

技术领域

本发明涉及异常行为检测技术，特别是一种异常行为检测方法、装置及存储介质。

背景技术

随着计算机智能技术的不断发展，人群的异常行为检测在智能安防、智慧城市等领域日趋普遍。而当前的异常行为检测大多数使用了云服务技术，但在实际应用中往往需要计算庞大的数据并且得到即时反馈，这将会占用网络大量带宽，为通信网络带来了巨大压力。

边缘计算是云计算的补充和延伸，它将大型服务分散到边缘设备中处理，使得数据处理更及时、传输更安全。部署在云端的模型对硬件计算能力和内存资源的要求较高，所以要实现边缘计算，为了使模型能在边缘设备上运行，首先要将云端大型复杂的模型进行压缩^[1]。目前针对此类模型压缩任务的大多数解决方案都基于知识蒸馏概念^[2]，此概念为使用一个被训练好的较大的模型训练一个新的规模较小的模型，使其的输出与原有模型的输出相匹配，该方法在训练时需要原始数据集^[3]。但在异常行为检测应用中，云端模型往往是在拥有数百万甚至数十亿图像的数据集上训练的，这些数据集不仅非常庞大，而且难以存储、传输和管理，另一个不可忽视的问题是数据隐私问题，由于用户隐私、安全或专利问题，知识蒸馏时分享训练数据集较为困难。目前已有几种方法可以将经过训练的神经网络中包含的知识可视化，如对输入图像进行变换，使用梯度上升的方法可视化网络每一层的特征^[5]；或通过目标函数梯度迭代，更新随机输入，使输入与原图像相差最小^[7]。但这些方法合成的图像往往不具有真实感，与自然图像相差较大，无法用于知识蒸馏。

此外，还可利用生成式对抗网络（GAN）生成高保真的合成图像^[8]，该方法训练了两个相互对抗的网络（生成器和判别器）来生成合成图像，尽管该方法生成的合成图像的分辨率有所提升，但训练GAN的生成器仍需要访问原始数据。

因此，如何保证在不访问原有数据集的情况下，从已经训练过的云端模型中恢复训练数据，将云端模型中的异常行为检测知识转移至可运行于边缘设备的模型，同时在异常行为检测中保持较高的准确率，是亟待解决的技术问题。

发明内容

本发明所要解决的技术问题是，针对现有技术不足，提供一种异常行为检测方法、装置及存储介质，在无需访问原始数据的前提下，提高异常行为检测的准确率。

为解决上述技术问题，本发明所采用的技术方案是：一种异常行为检测方法，包括以下步骤：

S1、获取预训练的云端模型，并输入一张随机噪声图像至所述云端模型，获得云端模型的输出分布；

S2、利用从云端模型中获取的所有卷积层特征图的均值期望值和方差期望值，生成特征分布正则化项，利用所述特征分布正则化项得到损失函数，进而获得合成图像；

S3、将所述合成图像输入至云端模型和边缘模型，并依据云端模型与边缘模型输出的softmax值进行分布匹配，训练边缘模型，得到异常行为检测模型。

本发明利用预训练的云端模型获得合成图像，并训练边缘模型，可以在无需访问原始数据的前提下，从云端模型中恢复训练数据，得到由合成图像构成的训练集，用于训练边缘模型，解决了传统异常行为检测的应用中原始数据集往往由于过于庞大而难以访问导致无法实现异常检测的问题，无需消耗大量的计算能力和内存资源，提高了异常行为检测的准确率。

为了进一步提高异常行为检测的准确率，本发明利用云端模型和边缘模型之间的分歧，扩大合成图像构成的训练集的覆盖范围，从而提高了边缘模型的准确性。本发明的方法还包括：

S4、将所述随机噪声图像输入训练后的边缘模型，得到边缘模型的输出分布；

S5、计算所述云端模型的输出分布与所述边缘模型的输出分布之间的Wasserstein距离，利用所述Wasserstein距离更新所述合成图像；

S6、返回步骤S2，重复步骤S2～步骤S5，直至达到迭代次数，得到最终的异常行为检测模型。

步骤S1中，使用在训练集ImageNet上预训练的ResNet-50模型作为云端模型。使用ImageNet训练的预训练模型具备更加丰富的先验知识，ResNet-50模型具备更加优秀的性能，对设备运行条件要求比较严格，适合部署在云端。

步骤S2中，使用以下损失函数作为优化目标，进行反向传播，使用梯度上升法对输入的随机噪声图像

进行更新，改变随机噪声图像的RGB数值，得到合成图像：

其中

为分类损失；

为云端模型的输入；y为目标标签真实值；

分别为惩罚总方差和

范数，

，

；

；

和

为缩放系数；

代表云端模型的第

个卷积层；

和

分别为第

个卷积层对应的特征图的均值和方差；

代表期望值；X代表训练云端模型的训练集，

代表云端模型在训练时的输入，

和

分别表示云端模型在训练时第

个卷积层对应的特征图的均值和方差；

表示求

范数运算。

本发明通过引入图像正则化项

和

提高了合成图像的质量，可有效增强合成图像和云端模型训练图像的特征相似性。

步骤S3中，将ResNet-18作为边缘模型。ResNet-18模型符合边缘设备的运行条件。

步骤S5中，利用所述Wasserstein距离更新所述损失函数，进而得到更新后的合成图像：

其中，

为缩放系数；

，

，inf代表函数下界；

表示

和

的联合分布；

表示求模长运算；

表示联合分布

下，云端模型输出分布和边缘模型输出分布对Wasserstein距离的期望值；

和

分别为云端模型的输出分布和边缘模型的输出分布。

本发明通过引入图像生成损失

对云端模型和边缘模型的输出分布相似性进行惩罚，鼓励合成图像引起云端模型和边缘模型的分歧，扩大合成图像构成的训练集的覆盖范围，促进从云端模型向边缘模型的知识迁移。

，

。经实验证明，此种缩放系数取值生成的合成图像质量较高，更适合作为边缘模型的训练集。

本发明还提供了一种计算机装置，包括存储器、处理器及存储在存储器上的计算机程序；所述处理器执行所述计算机程序，以实现本发明方法的步骤。

本发明还提供了一种计算机程序产品，包括计算机程序/指令；该计算机程序/指令被处理器执行时实现本发明方法的步骤。

本发明还提供了一种计算机可读存储介质，其上存储有计算机程序/指令；所述计算机程序/指令被处理器执行时实现本发明方法的步骤。

与现有技术相比，本发明所具有的有益效果为：

1、本发明提出了一种无数据知识转移的方法，可以在无需访问原始数据的前提下，从云端模型中恢复训练数据，得到由合成图像构成的训练集，用于训练边缘模型，解决了传统异常行为检测的应用中原始数据集往往由于过于庞大而难以访问导致无法实现异常检测的问题，无需消耗大量的计算能力和内存资源；

2、本发明使用梯度上升的方法可视化神经网络每一层的特征，并结合BN层中存储的卷积层特征图的均值、期望值和方差期望值，来生成具有真实感且分辨率较高的训练图像，极大地提高了异常检测的准确性，解决了传统合成图像不具有真实感，无法用于模型压缩的问题；

3、本发明利用云端模型和边缘模型之间的分歧，扩大合成图像构成的训练集的覆盖范围，从而提高了边缘模型的准确性；

4、本发明在使用深度学习的基础上，充分发挥了边缘服务器高响应、低延迟的优势，可以保证在不访问原始数据集，不使用任何自然图像和标记数据的前提下，为边缘模型提供用于训练的合成图像数据集，并利用云端模型和边缘模型之间的分歧提高合成图像的多样性。实验证明，本发明的可行性高，经过训练的模型可运行于边缘设备，且在异常行为检测时准确率较高，且拥有低延迟、响应快的优势，有效克服了庞大复杂的云端模型无法在边缘设备运行的弊端。

附图说明

图1为本发明实施例方法原理图；

图2（a）输入云端模型的噪声图像；图2（b）使用DeepDream^[5]方法合成的图像；图2（c）加入特征分布正则化项后合成的图像；图2（d）加入图像生成损失正则化项后合成的图像。

具体实施方式

本发明基于边缘网络在异常行为检测中低延迟、响应快的优势，将云端模型进行知识转移后部署到边缘设备，在训练边缘模型的过程中不需要任何自然图像和标签数据。

本发明的体系结构主要由三部分组成：（1）合成训练图像。使用云端模型为能够部署在边缘设备的边缘模型合成图像，以高分辨率生成具有真实感的图像。（2）提高合成图像的多样性。本发明是一种基于图像的生成过程中与边缘模型之间的迭代竞争增强合成图像的方法，主要思想为利用云端模型和边缘模型之间的分歧提高合成图像的多样性。（3）进行知识蒸馏。使用合成图像构成的训练集训练边缘模型。

步骤如下：

第一步：使用在训练集ImageNet上预训练的ResNet-50^[4]模型作为云端模型，ImageNet是一个用于视觉对象识别软件研究的大型可视化数据库，包含2万多个类别。为云端模型输入一张随机噪声图像，该图像使用了随机值脉冲噪声，其噪声灰度值为介于0-255的任一个的灰度值。输出该图像的概率分布，计算该概率分布和任意目标标签的损失函数，该损失函数通过计算交叉熵获得：

其中n代表着概率分布的n种类别，

代表目标标签第

种类别的概率，

代表云端模型输出的概率分布中第

种类别的概率。

从云端模型的BN层[6]中获取所有卷积层特征图的均值期望值和方差期望值，来生成特征分布正则化项。这种特征分布正则化可以大大提高生成图像的质量。该特征分布正则化项为：

；

其中

为云端模型的输入；

代表模型的第

个卷积层；

和

时第

卷积层对应的特征图的均值和方差；

代表期望值；X代表训练云端模型的训练集，

代表云端模型在训练时的输入，

和

表示云端模型在训练时第

卷积层对应的特征图的均值和方差，二者可通过BN层获得；

表示求

范数运算；

表示将对所有卷积层的运算结果求和。

第二步：反向传播时更新第一步中输入到云端模型的随机噪声图像的像素值，通过优化以下

，得到合成图像：

其中

为分类损失；

为云端模型的输入；y为目标标签真实值；

分别惩罚总方差和

范数，

，

；

为第一步得到的特征分布正则化项；

和

为相应的缩放系数，

,

。

第三步：进行知识蒸馏，将ResNet-18^[4]作为边缘模型，使用第一步中云端模型，以及第二步中的合成图像训练集，初步训练边缘模型。训练过程为给云端模型与边缘模型输入合成图像，并依据云端模型与边缘模型输出的softmax值进行分布匹配，进而训练边缘模型^[2]。训练时为云端模型和边缘模型输入合成图像，得到两个概率分布分别进行softmax计算，生成软化的概率分布，softmax计算公式如下：

其中

代表以e为底的指数函数运算，

表示第

类的输出概率，

和

表示第

类和第j类的输入概率，T为温度系数，用来控制概率分布的软化程度。

使用交叉熵求上述两个概率分布的损失函数，使用该损失函数训练边缘模型。

第四步：为边缘模型输入与云端模型相同的随机噪声图像，得到云端模型和边缘模型的输出分布分别为

和

。

第五步：计算出两个输出分布的Wasserstein距离，作为额外的图像生成损失，对输出分布的相似性进行惩罚。图像生成损失正则化项为：

其中

；

其中inf代表函数下界；

表示

和

的联合分布；

表示求模长运算；

表示联合分布

下，样本对距离的期望值。第二步的公式修改为：

其中

为分类损失，通过计算交叉熵获得；

为云端模型的输入；y为目标标签真实值；

分别惩罚总方差和

范数；

为第一步中得到的特征分布正则化项；

为图像生成损失正则化项；

和

为相应的缩放系数，

，

，

，

。

第六步：进行知识蒸馏，使用云端模型和合成图像构成的训练集继续训练边缘模型，并重复第四步到第六步100次。

使用ResNet-50作为固定的云端模型，ResNet-18作为边缘模型，云端模型已在训练集ImageNet上进行了预训练，并设定

，

，

，

，来生成224*224的合成图像。输入云端模型的噪声图像如图2（a）所示，输入的目标标签分别为鱼、汉堡、植物、火山，在使用DeepDream^[5]方法合成的图像如图2（b）所示，可以看出这些图像不具有真实感，与自然图像相差较大。在加入本发明的特征分布正则化项后，合成的图像如图2（c）所示，图像的真实感和分辨率大大增加，可以用于训练边缘模型的知识蒸馏。在加入本发明的图像生成损失正则化项后，合成的图像如图2（d）所示，提高了合成图像的多样性。

参考文献

[1] P. Molchanov, A. Mallya, S. Tyree, I. Frosio, and J. Kautz.“Importance estimation for neural network pruning”. In CVPR, 2019.

[2]G. Hinton, O. Vinyals, and J. Dean. “Distilling the knowledgein aneural network”. arXiv preprint arXiv:1503.02531, 2015.

[3]T. Chen, I. Goodfellow, and J. Shlens. “Net2net: Acceleratinglearning via knowledge transfer”. In ICLR, 2016.

[4]K. He, X. Zhang, S. Ren, and J. Sun. “Deep residual learning forimage recognition”. In CVPR, 2016.

[5]A. Mordvintsev, C. Olah, and M. Tyka. “Inceptionism: Going deeperinto neural networks”,2015.

[6]S. Ioffe and C. Szegedy. “Batch normalization: Accelerating deepnetwork training by reducing internal covariate shift”. arXiv preprint arXiv:1502.03167, 2015.

[7] A. Mahendran and A. Vedaldi. “Understanding deep imagerepresentations by inverting them”. In CVPR, 2015.

[8]A. Brock, J. Donahue, and K. Simonyan. “Large scale GAN trainingfor high fidelity natural image synthesis”. In ICLR, 2019.