CN114495013A - 异常行为检测方法、装置及存储介质 - Google Patents
异常行为检测方法、装置及存储介质 Download PDFInfo
- Publication number
- CN114495013A CN114495013A CN202210191841.XA CN202210191841A CN114495013A CN 114495013 A CN114495013 A CN 114495013A CN 202210191841 A CN202210191841 A CN 202210191841A CN 114495013 A CN114495013 A CN 114495013A
- Authority
- CN
- China
- Prior art keywords
- model
- cloud model
- abnormal behavior
- behavior detection
- edge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 36
- 206010000117 Abnormal behaviour Diseases 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000009826 distribution Methods 0.000 claims description 48
- 239000002131 composite material Substances 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 2
- 230000004044 response Effects 0.000 abstract description 5
- 238000012546 transfer Methods 0.000 abstract description 5
- 230000007547 defect Effects 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000013140 knowledge distillation Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种异常行为检测方法、装置及存储介质,在使用深度学习的基础上,充分发挥了边缘服务器高响应、低延迟的优势,提出了一种基于无数据知识传递的异常行为检测方法。本发明可以保证在不访问原始数据集,不使用任何自然图像和标记数据的前提下,为边缘模型提供用于训练的合成图像数据集,并利用云端模型和边缘模型之间的分歧提高合成图像的多样性。经过实验证明,本发明的可行性高,经过训练的模型可运行于边缘设备,且在异常行为检测时准确率较高,且拥有低延迟、响应快的优势,有效克服了庞大复杂的云端模型无法在边缘设备运行的弊端。
Description
技术领域
本发明涉及异常行为检测技术,特别是一种异常行为检测方法、装置及存储介质。
背景技术
随着计算机智能技术的不断发展,人群的异常行为检测在智能安防、智慧城市等领域日趋普遍。而当前的异常行为检测大多数使用了云服务技术,但在实际应用中往往需要计算庞大的数据并且得到即时反馈,这将会占用网络大量带宽,为通信网络带来了巨大压力。
边缘计算是云计算的补充和延伸,它将大型服务分散到边缘设备中处理,使得数据处理更及时、传输更安全。部署在云端的模型对硬件计算能力和内存资源的要求较高,所以要实现边缘计算,为了使模型能在边缘设备上运行,首先要将云端大型复杂的模型进行压缩[1]。目前针对此类模型压缩任务的大多数解决方案都基于知识蒸馏概念[2],此概念为使用一个被训练好的较大的模型训练一个新的规模较小的模型,使其的输出与原有模型的输出相匹配,该方法在训练时需要原始数据集[3]。但在异常行为检测应用中,云端模型往往是在拥有数百万甚至数十亿图像的数据集上训练的,这些数据集不仅非常庞大,而且难以存储、传输和管理,另一个不可忽视的问题是数据隐私问题,由于用户隐私、安全或专利问题,知识蒸馏时分享训练数据集较为困难。目前已有几种方法可以将经过训练的神经网络中包含的知识可视化,如对输入图像进行变换,使用梯度上升的方法可视化网络每一层的特征[5];或通过目标函数梯度迭代,更新随机输入,使输入与原图像相差最小[7]。但这些方法合成的图像往往不具有真实感,与自然图像相差较大,无法用于知识蒸馏。
此外,还可利用生成式对抗网络(GAN)生成高保真的合成图像[8],该方法训练了两个相互对抗的网络(生成器和判别器)来生成合成图像,尽管该方法生成的合成图像的分辨率有所提升,但训练GAN的生成器仍需要访问原始数据。
因此,如何保证在不访问原有数据集的情况下,从已经训练过的云端模型中恢复训练数据,将云端模型中的异常行为检测知识转移至可运行于边缘设备的模型,同时在异常行为检测中保持较高的准确率,是亟待解决的技术问题。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种异常行为检测方法、装置及存储介质,在无需访问原始数据的前提下,提高异常行为检测的准确率。
为解决上述技术问题,本发明所采用的技术方案是:一种异常行为检测方法,包括以下步骤:
S1、获取预训练的云端模型,并输入一张随机噪声图像至所述云端模型,获得云端模型的输出分布;
S2、利用从云端模型中获取的所有卷积层特征图的均值期望值和方差期望值,生成特征分布正则化项,利用所述特征分布正则化项得到损失函数,进而获得合成图像;
S3、将所述合成图像输入至云端模型和边缘模型,并依据云端模型与边缘模型输出的softmax值进行分布匹配,训练边缘模型,得到异常行为检测模型。
本发明利用预训练的云端模型获得合成图像,并训练边缘模型,可以在无需访问原始数据的前提下,从云端模型中恢复训练数据,得到由合成图像构成的训练集,用于训练边缘模型,解决了传统异常行为检测的应用中原始数据集往往由于过于庞大而难以访问导致无法实现异常检测的问题,无需消耗大量的计算能力和内存资源,提高了异常行为检测的准确率。
为了进一步提高异常行为检测的准确率,本发明利用云端模型和边缘模型之间的分歧,扩大合成图像构成的训练集的覆盖范围,从而提高了边缘模型的准确性。本发明的方法还包括:
S4、将所述随机噪声图像输入训练后的边缘模型,得到边缘模型的输出分布;
S5、计算所述云端模型的输出分布与所述边缘模型的输出分布之间的Wasserstein距离,利用所述Wasserstein距离更新所述合成图像;
S6、返回步骤S2,重复步骤S2~步骤S5,直至达到迭代次数,得到最终的异常行为检测模型。
步骤S1中,使用在训练集ImageNet上预训练的ResNet-50模型作为云端模型。使用ImageNet训练的预训练模型具备更加丰富的先验知识,ResNet-50模型具备更加优秀的性能,对设备运行条件要求比较严格,适合部署在云端。
其中为分类损失;为云端模型的输入;y为目标标签真实值;分别为惩罚总方差和范数,,;;和为缩放系数;代表云端模型的第个卷积层;和分别为第个卷积层对应的特征图的均值和方差;代表期望值;X代表训练云端模型的训练集,代表云端模型在训练时的输入,和分别表示云端模型在训练时第个卷积层对应的特征图的均值和方差;表示求范数运算。
步骤S3中,将ResNet-18作为边缘模型。ResNet-18模型符合边缘设备的运行条件。
步骤S5中,利用所述Wasserstein距离更新所述损失函数,进而得到更新后的合成图像:
其中,为缩放系数;,,inf代表函数下界;表示和的联合分布;表示求模长运算;表示联合分布下,云端模型输出分布和边缘模型输出分布对Wasserstein距离的期望值;和分别为云端模型的输出分布和边缘模型的输出分布。
本发明还提供了一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序;所述处理器执行所述计算机程序,以实现本发明方法的步骤。
本发明还提供了一种计算机程序产品,包括计算机程序/指令;该计算机程序/指令被处理器执行时实现本发明方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序/指令;所述计算机程序/指令被处理器执行时实现本发明方法的步骤。
与现有技术相比,本发明所具有的有益效果为:
1、本发明提出了一种无数据知识转移的方法,可以在无需访问原始数据的前提下,从云端模型中恢复训练数据,得到由合成图像构成的训练集,用于训练边缘模型,解决了传统异常行为检测的应用中原始数据集往往由于过于庞大而难以访问导致无法实现异常检测的问题,无需消耗大量的计算能力和内存资源;
2、本发明使用梯度上升的方法可视化神经网络每一层的特征,并结合BN层中存储的卷积层特征图的均值、期望值和方差期望值,来生成具有真实感且分辨率较高的训练图像,极大地提高了异常检测的准确性,解决了传统合成图像不具有真实感,无法用于模型压缩的问题;
3、本发明利用云端模型和边缘模型之间的分歧,扩大合成图像构成的训练集的覆盖范围,从而提高了边缘模型的准确性;
4、本发明在使用深度学习的基础上,充分发挥了边缘服务器高响应、低延迟的优势,可以保证在不访问原始数据集,不使用任何自然图像和标记数据的前提下,为边缘模型提供用于训练的合成图像数据集,并利用云端模型和边缘模型之间的分歧提高合成图像的多样性。实验证明,本发明的可行性高,经过训练的模型可运行于边缘设备,且在异常行为检测时准确率较高,且拥有低延迟、响应快的优势,有效克服了庞大复杂的云端模型无法在边缘设备运行的弊端。
附图说明
图1为本发明实施例方法原理图;
图2(a)输入云端模型的噪声图像;图2(b)使用DeepDream[5]方法合成的图像;图2(c)加入特征分布正则化项后合成的图像;图2(d)加入图像生成损失正则化项后合成的图像。
具体实施方式
本发明基于边缘网络在异常行为检测中低延迟、响应快的优势,将云端模型进行知识转移后部署到边缘设备,在训练边缘模型的过程中不需要任何自然图像和标签数据。
本发明的体系结构主要由三部分组成:(1)合成训练图像。使用云端模型为能够部署在边缘设备的边缘模型合成图像,以高分辨率生成具有真实感的图像。(2)提高合成图像的多样性。本发明是一种基于图像的生成过程中与边缘模型之间的迭代竞争增强合成图像的方法,主要思想为利用云端模型和边缘模型之间的分歧提高合成图像的多样性。(3)进行知识蒸馏。使用合成图像构成的训练集训练边缘模型。
步骤如下:
第一步:使用在训练集ImageNet上预训练的ResNet-50[4]模型作为云端模型,ImageNet是一个用于视觉对象识别软件研究的大型可视化数据库,包含2万多个类别。为云端模型输入一张随机噪声图像,该图像使用了随机值脉冲噪声,其噪声灰度值为介于0-255的任一个的灰度值。输出该图像的概率分布,计算该概率分布和任意目标标签的损失函数,该损失函数通过计算交叉熵获得:
从云端模型的BN层[6]中获取所有卷积层特征图的均值期望值和方差期望值,来生成特征分布正则化项。这种特征分布正则化可以大大提高生成图像的质量。该特征分布正则化项为:
其中为云端模型的输入;代表模型的第个卷积层;和时第卷积层对应的特征图的均值和方差;代表期望值;X代表训练云端模型的训练集,代表云端模型在训练时的输入,和表示云端模型在训练时第卷积层对应的特征图的均值和方差,二者可通过BN层获得;表示求范数运算;表示将对所有卷积层的运算结果求和。
第三步:进行知识蒸馏,将ResNet-18[4]作为边缘模型,使用第一步中云端模型,以及第二步中的合成图像训练集,初步训练边缘模型。训练过程为给云端模型与边缘模型输入合成图像,并依据云端模型与边缘模型输出的softmax值进行分布匹配,进而训练边缘模型[2]。训练时为云端模型和边缘模型输入合成图像,得到两个概率分布分别进行softmax计算,生成软化的概率分布,softmax计算公式如下:
使用交叉熵求上述两个概率分布的损失函数,使用该损失函数训练边缘模型。
第五步:计算出两个输出分布的Wasserstein距离,作为额外的图像生成损失,对输出分布的相似性进行惩罚。图像生成损失正则化项为:
第六步:进行知识蒸馏,使用云端模型和合成图像构成的训练集继续训练边缘模型,并重复第四步到第六步100次。
使用ResNet-50作为固定的云端模型,ResNet-18作为边缘模型,云端模型已在训练集ImageNet上进行了预训练,并设定,,,,来生成224*224的合成图像。输入云端模型的噪声图像如图2(a)所示,输入的目标标签分别为鱼、汉堡、植物、火山,在使用DeepDream[5]方法合成的图像如图2(b)所示,可以看出这些图像不具有真实感,与自然图像相差较大。在加入本发明的特征分布正则化项后,合成的图像如图2(c)所示,图像的真实感和分辨率大大增加,可以用于训练边缘模型的知识蒸馏。在加入本发明的图像生成损失正则化项后,合成的图像如图2(d)所示,提高了合成图像的多样性。
参考文献
[1] P. Molchanov, A. Mallya, S. Tyree, I. Frosio, and J. Kautz.“Importance estimation for neural network pruning”. In CVPR, 2019.
[2]G. Hinton, O. Vinyals, and J. Dean. “Distilling the knowledgein aneural network”. arXiv preprint arXiv:1503.02531, 2015.
[3]T. Chen, I. Goodfellow, and J. Shlens. “Net2net: Acceleratinglearning via knowledge transfer”. In ICLR, 2016.
[4]K. He, X. Zhang, S. Ren, and J. Sun. “Deep residual learning forimage recognition”. In CVPR, 2016.
[5]A. Mordvintsev, C. Olah, and M. Tyka. “Inceptionism: Going deeperinto neural networks”,2015.
[6]S. Ioffe and C. Szegedy. “Batch normalization: Accelerating deepnetwork training by reducing internal covariate shift”. arXiv preprint arXiv:1502.03167, 2015.
[7] A. Mahendran and A. Vedaldi. “Understanding deep imagerepresentations by inverting them”. In CVPR, 2015.
[8]A. Brock, J. Donahue, and K. Simonyan. “Large scale GAN trainingfor high fidelity natural image synthesis”. In ICLR, 2019.
Claims (10)
1.一种异常行为检测方法,其特征在于,包括以下步骤:
S1、获取预训练的云端模型,并输入一张随机噪声图像至所述云端模型,获得云端模型的输出分布;
S2、利用从云端模型中获取的所有卷积层特征图的均值期望值和方差期望值,生成特征分布正则化项,利用所述特征分布正则化项得到损失函数,进而获得合成图像;
S3、将所述合成图像输入至云端模型和边缘模型,并依据云端模型与边缘模型输出的softmax值进行分布匹配,训练边缘模型,得到异常行为检测模型。
2.根据权利要求1所述的异常行为检测方法,其特征在于,还包括:
S4、将所述随机噪声图像输入训练后的边缘模型,得到边缘模型的输出分布;
S5、计算所述云端模型的输出分布与所述边缘模型的输出分布之间的Wasserstein距离,利用所述Wasserstein距离更新所述合成图像;
S6、返回步骤S2,重复步骤S2~步骤S5,直至达到迭代次数,得到最终的异常行为检测模型。
3.根据权利要求1所述的异常行为检测方法,其特征在于,步骤S1中,使用在训练集ImageNet上预训练的ResNet-50模型作为云端模型。
5.根据权利要求2所述的异常行为检测方法,其特征在于,步骤S3中,将ResNet-18作为边缘模型。
8.一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序;其特征在于,所述处理器执行所述计算机程序,以实现权利要求1~7之一所述方法的步骤。
9.一种计算机程序产品,包括计算机程序/指令;其特征在于,该计算机程序/指令被处理器执行时实现权利要求1~7之一所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序/指令;其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1~7之一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210191841.XA CN114495013A (zh) | 2022-03-01 | 2022-03-01 | 异常行为检测方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210191841.XA CN114495013A (zh) | 2022-03-01 | 2022-03-01 | 异常行为检测方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114495013A true CN114495013A (zh) | 2022-05-13 |
Family
ID=81484670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210191841.XA Pending CN114495013A (zh) | 2022-03-01 | 2022-03-01 | 异常行为检测方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114495013A (zh) |
-
2022
- 2022-03-01 CN CN202210191841.XA patent/CN114495013A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | The face image super-resolution algorithm based on combined representation learning | |
CN112488210A (zh) | 一种基于图卷积神经网络的三维点云自动分类方法 | |
CN111242208A (zh) | 一种点云分类方法、分割方法及相关设备 | |
CN108960059A (zh) | 一种视频动作识别方法及装置 | |
CN110138595A (zh) | 动态加权网络的时间链路预测方法、装置、设备及介质 | |
CN114724012B (zh) | 基于时空跨尺度注意力融合热带不稳定波预警方法及装置 | |
CN112489164B (zh) | 基于改进深度可分离卷积神经网络的图像着色方法 | |
CN115222998B (zh) | 一种图像分类方法 | |
CN113821668A (zh) | 数据分类识别方法、装置、设备及可读存储介质 | |
CN112733602B (zh) | 关系引导的行人属性识别方法 | |
CN116563682A (zh) | 一种基于深度霍夫网络的注意力方案和条带卷积语义线检测的方法 | |
CN118096922A (zh) | 一种基于风格迁移和遥感影像生成地图的方法 | |
CN117853596A (zh) | 无人机遥感测绘方法及系统 | |
CN116306780B (zh) | 一种动态图链接生成方法 | |
CN116563683A (zh) | 一种基于卷积神经网络和多层感知机的遥感影像场景分类方法 | |
Jin et al. | Fusion of remote sensing images based on pyramid decomposition with Baldwinian Clonal Selection Optimization | |
CN113361570B (zh) | 基于联合数据增强和网络训练模型的3d人体姿态估计方法 | |
CN114495013A (zh) | 异常行为检测方法、装置及存储介质 | |
CN115131605A (zh) | 一种基于自适应子图的结构感知图对比学习方法 | |
CN114037866A (zh) | 一种基于可辨伪特征合成的广义零样本图像分类方法 | |
Wang et al. | Cross-layer progressive attention bilinear fusion method for fine-grained visual classification | |
CN117829320B (zh) | 一种基于图神经网络和双向深度知识蒸馏的联邦学习方法 | |
CN117351300B (zh) | 一种目标检测模型的小样本训练方法及装置 | |
CN118447337A (zh) | 一种基于大视觉模型的高光谱图像分类方法 | |
CN116962196A (zh) | 一种基于关系推理的机动通信网网络智能规划方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |