CN114495013A - 异常行为检测方法、装置及存储介质 - Google Patents

异常行为检测方法、装置及存储介质 Download PDF

Info

Publication number
CN114495013A
CN114495013A CN202210191841.XA CN202210191841A CN114495013A CN 114495013 A CN114495013 A CN 114495013A CN 202210191841 A CN202210191841 A CN 202210191841A CN 114495013 A CN114495013 A CN 114495013A
Authority
CN
China
Prior art keywords
model
cloud model
abnormal behavior
behavior detection
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210191841.XA
Other languages
English (en)
Inventor
李浩玮
陶泽
胡斌
付慧青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202210191841.XA priority Critical patent/CN114495013A/zh
Publication of CN114495013A publication Critical patent/CN114495013A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种异常行为检测方法、装置及存储介质,在使用深度学习的基础上,充分发挥了边缘服务器高响应、低延迟的优势,提出了一种基于无数据知识传递的异常行为检测方法。本发明可以保证在不访问原始数据集,不使用任何自然图像和标记数据的前提下,为边缘模型提供用于训练的合成图像数据集,并利用云端模型和边缘模型之间的分歧提高合成图像的多样性。经过实验证明,本发明的可行性高,经过训练的模型可运行于边缘设备,且在异常行为检测时准确率较高,且拥有低延迟、响应快的优势,有效克服了庞大复杂的云端模型无法在边缘设备运行的弊端。

Description

异常行为检测方法、装置及存储介质
技术领域
本发明涉及异常行为检测技术,特别是一种异常行为检测方法、装置及存储介质。
背景技术
随着计算机智能技术的不断发展,人群的异常行为检测在智能安防、智慧城市等领域日趋普遍。而当前的异常行为检测大多数使用了云服务技术,但在实际应用中往往需要计算庞大的数据并且得到即时反馈,这将会占用网络大量带宽,为通信网络带来了巨大压力。
边缘计算是云计算的补充和延伸,它将大型服务分散到边缘设备中处理,使得数据处理更及时、传输更安全。部署在云端的模型对硬件计算能力和内存资源的要求较高,所以要实现边缘计算,为了使模型能在边缘设备上运行,首先要将云端大型复杂的模型进行压缩[1]。目前针对此类模型压缩任务的大多数解决方案都基于知识蒸馏概念[2],此概念为使用一个被训练好的较大的模型训练一个新的规模较小的模型,使其的输出与原有模型的输出相匹配,该方法在训练时需要原始数据集[3]。但在异常行为检测应用中,云端模型往往是在拥有数百万甚至数十亿图像的数据集上训练的,这些数据集不仅非常庞大,而且难以存储、传输和管理,另一个不可忽视的问题是数据隐私问题,由于用户隐私、安全或专利问题,知识蒸馏时分享训练数据集较为困难。目前已有几种方法可以将经过训练的神经网络中包含的知识可视化,如对输入图像进行变换,使用梯度上升的方法可视化网络每一层的特征[5];或通过目标函数梯度迭代,更新随机输入,使输入与原图像相差最小[7]。但这些方法合成的图像往往不具有真实感,与自然图像相差较大,无法用于知识蒸馏。
此外,还可利用生成式对抗网络(GAN)生成高保真的合成图像[8],该方法训练了两个相互对抗的网络(生成器和判别器)来生成合成图像,尽管该方法生成的合成图像的分辨率有所提升,但训练GAN的生成器仍需要访问原始数据。
因此,如何保证在不访问原有数据集的情况下,从已经训练过的云端模型中恢复训练数据,将云端模型中的异常行为检测知识转移至可运行于边缘设备的模型,同时在异常行为检测中保持较高的准确率,是亟待解决的技术问题。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种异常行为检测方法、装置及存储介质,在无需访问原始数据的前提下,提高异常行为检测的准确率。
为解决上述技术问题,本发明所采用的技术方案是:一种异常行为检测方法,包括以下步骤:
S1、获取预训练的云端模型,并输入一张随机噪声图像至所述云端模型,获得云端模型的输出分布;
S2、利用从云端模型中获取的所有卷积层特征图的均值期望值和方差期望值,生成特征分布正则化项,利用所述特征分布正则化项得到损失函数,进而获得合成图像;
S3、将所述合成图像输入至云端模型和边缘模型,并依据云端模型与边缘模型输出的softmax值进行分布匹配,训练边缘模型,得到异常行为检测模型。
本发明利用预训练的云端模型获得合成图像,并训练边缘模型,可以在无需访问原始数据的前提下,从云端模型中恢复训练数据,得到由合成图像构成的训练集,用于训练边缘模型,解决了传统异常行为检测的应用中原始数据集往往由于过于庞大而难以访问导致无法实现异常检测的问题,无需消耗大量的计算能力和内存资源,提高了异常行为检测的准确率。
为了进一步提高异常行为检测的准确率,本发明利用云端模型和边缘模型之间的分歧,扩大合成图像构成的训练集的覆盖范围,从而提高了边缘模型的准确性。本发明的方法还包括:
S4、将所述随机噪声图像输入训练后的边缘模型,得到边缘模型的输出分布;
S5、计算所述云端模型的输出分布与所述边缘模型的输出分布之间的Wasserstein距离,利用所述Wasserstein距离更新所述合成图像;
S6、返回步骤S2,重复步骤S2~步骤S5,直至达到迭代次数,得到最终的异常行为检测模型。
步骤S1中,使用在训练集ImageNet上预训练的ResNet-50模型作为云端模型。使用ImageNet训练的预训练模型具备更加丰富的先验知识,ResNet-50模型具备更加优秀的性能,对设备运行条件要求比较严格,适合部署在云端。
步骤S2中,使用以下损失函数作为优化目标,进行反向传播,使用梯度上升法对输入的随机噪声图像
Figure 451530DEST_PATH_IMAGE001
进行更新,改变随机噪声图像的RGB数值,得到合成图像:
Figure 700109DEST_PATH_IMAGE002
其中
Figure 688793DEST_PATH_IMAGE003
为分类损失;
Figure 706428DEST_PATH_IMAGE004
为云端模型的输入;y为目标标签真实值;
Figure 607519DEST_PATH_IMAGE005
分别为惩罚总方差和
Figure 138468DEST_PATH_IMAGE006
范数,
Figure 134106DEST_PATH_IMAGE007
Figure 645728DEST_PATH_IMAGE008
Figure 107933DEST_PATH_IMAGE009
Figure 455738DEST_PATH_IMAGE010
Figure 661591DEST_PATH_IMAGE011
为缩放系数;
Figure 529184DEST_PATH_IMAGE012
代表云端模型的第
Figure 427870DEST_PATH_IMAGE012
个卷积层;
Figure 262971DEST_PATH_IMAGE013
Figure 6936DEST_PATH_IMAGE014
分别为第
Figure 496080DEST_PATH_IMAGE012
个卷积层对应的特征图的均值和方差;
Figure 300088DEST_PATH_IMAGE015
代表期望值;X代表训练云端模型的训练集,
Figure 622485DEST_PATH_IMAGE016
代表云端模型在训练时的输入,
Figure 170141DEST_PATH_IMAGE017
Figure 12326DEST_PATH_IMAGE018
分别表示云端模型在训练时第
Figure 252814DEST_PATH_IMAGE012
个卷积层对应的特征图的均值和方差;
Figure 796928DEST_PATH_IMAGE019
表示求
Figure 256597DEST_PATH_IMAGE006
范数运算。
本发明通过引入图像正则化项
Figure 140239DEST_PATH_IMAGE020
Figure 161416DEST_PATH_IMAGE021
提高了合成图像的质量,可有效增强合成图像和云端模型训练图像的特征相似性。
步骤S3中,将ResNet-18作为边缘模型。ResNet-18模型符合边缘设备的运行条件。
步骤S5中,利用所述Wasserstein距离更新所述损失函数,进而得到更新后的合成图像:
Figure 661668DEST_PATH_IMAGE022
其中,
Figure 816705DEST_PATH_IMAGE023
为缩放系数;
Figure 869368DEST_PATH_IMAGE024
Figure 717239DEST_PATH_IMAGE025
,inf代表函数下界;
Figure 235945DEST_PATH_IMAGE026
表示
Figure 929094DEST_PATH_IMAGE027
Figure 69220DEST_PATH_IMAGE028
的联合分布;
Figure 681467DEST_PATH_IMAGE029
表示求模长运算;
Figure 671157DEST_PATH_IMAGE030
表示联合分布
Figure 371260DEST_PATH_IMAGE031
下,云端模型输出分布和边缘模型输出分布对Wasserstein距离的期望值;
Figure 21684DEST_PATH_IMAGE027
Figure 791450DEST_PATH_IMAGE032
分别为云端模型的输出分布和边缘模型的输出分布。
本发明通过引入图像生成损失
Figure 425694DEST_PATH_IMAGE033
对云端模型和边缘模型的输出分布相似性进行惩罚,鼓励合成图像引起云端模型和边缘模型的分歧,扩大合成图像构成的训练集的覆盖范围,促进从云端模型向边缘模型的知识迁移。
Figure 319701DEST_PATH_IMAGE034
Figure 90211DEST_PATH_IMAGE035
。经实验证明,此种缩放系数取值生成的合成图像质量较高,更适合作为边缘模型的训练集。
本发明还提供了一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序;所述处理器执行所述计算机程序,以实现本发明方法的步骤。
本发明还提供了一种计算机程序产品,包括计算机程序/指令;该计算机程序/指令被处理器执行时实现本发明方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序/指令;所述计算机程序/指令被处理器执行时实现本发明方法的步骤。
与现有技术相比,本发明所具有的有益效果为:
1、本发明提出了一种无数据知识转移的方法,可以在无需访问原始数据的前提下,从云端模型中恢复训练数据,得到由合成图像构成的训练集,用于训练边缘模型,解决了传统异常行为检测的应用中原始数据集往往由于过于庞大而难以访问导致无法实现异常检测的问题,无需消耗大量的计算能力和内存资源;
2、本发明使用梯度上升的方法可视化神经网络每一层的特征,并结合BN层中存储的卷积层特征图的均值、期望值和方差期望值,来生成具有真实感且分辨率较高的训练图像,极大地提高了异常检测的准确性,解决了传统合成图像不具有真实感,无法用于模型压缩的问题;
3、本发明利用云端模型和边缘模型之间的分歧,扩大合成图像构成的训练集的覆盖范围,从而提高了边缘模型的准确性;
4、本发明在使用深度学习的基础上,充分发挥了边缘服务器高响应、低延迟的优势,可以保证在不访问原始数据集,不使用任何自然图像和标记数据的前提下,为边缘模型提供用于训练的合成图像数据集,并利用云端模型和边缘模型之间的分歧提高合成图像的多样性。实验证明,本发明的可行性高,经过训练的模型可运行于边缘设备,且在异常行为检测时准确率较高,且拥有低延迟、响应快的优势,有效克服了庞大复杂的云端模型无法在边缘设备运行的弊端。
附图说明
图1为本发明实施例方法原理图;
图2(a)输入云端模型的噪声图像;图2(b)使用DeepDream[5]方法合成的图像;图2(c)加入特征分布正则化项后合成的图像;图2(d)加入图像生成损失正则化项后合成的图像。
具体实施方式
本发明基于边缘网络在异常行为检测中低延迟、响应快的优势,将云端模型进行知识转移后部署到边缘设备,在训练边缘模型的过程中不需要任何自然图像和标签数据。
本发明的体系结构主要由三部分组成:(1)合成训练图像。使用云端模型为能够部署在边缘设备的边缘模型合成图像,以高分辨率生成具有真实感的图像。(2)提高合成图像的多样性。本发明是一种基于图像的生成过程中与边缘模型之间的迭代竞争增强合成图像的方法,主要思想为利用云端模型和边缘模型之间的分歧提高合成图像的多样性。(3)进行知识蒸馏。使用合成图像构成的训练集训练边缘模型。
步骤如下:
第一步:使用在训练集ImageNet上预训练的ResNet-50[4]模型作为云端模型,ImageNet是一个用于视觉对象识别软件研究的大型可视化数据库,包含2万多个类别。为云端模型输入一张随机噪声图像,该图像使用了随机值脉冲噪声,其噪声灰度值为介于0-255的任一个的灰度值。输出该图像的概率分布,计算该概率分布和任意目标标签的损失函数,该损失函数通过计算交叉熵获得:
Figure 794993DEST_PATH_IMAGE036
其中n代表着概率分布的n种类别,
Figure 510008DEST_PATH_IMAGE037
代表目标标签第
Figure 348651DEST_PATH_IMAGE038
种类别的概率,
Figure 81989DEST_PATH_IMAGE039
代表云端模型输出的概率分布中第
Figure 347885DEST_PATH_IMAGE038
种类别的概率。
从云端模型的BN层[6]中获取所有卷积层特征图的均值期望值和方差期望值,来生成特征分布正则化项。这种特征分布正则化可以大大提高生成图像的质量。该特征分布正则化项为:
Figure 550197DEST_PATH_IMAGE040
其中
Figure 192531DEST_PATH_IMAGE001
为云端模型的输入;
Figure 281841DEST_PATH_IMAGE041
代表模型的第
Figure 577693DEST_PATH_IMAGE012
个卷积层;
Figure 877087DEST_PATH_IMAGE013
Figure 422645DEST_PATH_IMAGE014
时第
Figure 756674DEST_PATH_IMAGE012
卷积层对应的特征图的均值和方差;
Figure 489007DEST_PATH_IMAGE015
代表期望值;X代表训练云端模型的训练集,
Figure 541277DEST_PATH_IMAGE042
代表云端模型在训练时的输入,
Figure 135200DEST_PATH_IMAGE017
Figure 448370DEST_PATH_IMAGE043
表示云端模型在训练时第
Figure 226970DEST_PATH_IMAGE012
卷积层对应的特征图的均值和方差,二者可通过BN层获得;
Figure 343699DEST_PATH_IMAGE019
表示求
Figure 725002DEST_PATH_IMAGE006
范数运算;
Figure 908990DEST_PATH_IMAGE044
表示将对所有卷积层的运算结果求和。
第二步:反向传播时更新第一步中输入到云端模型的随机噪声图像的像素值,通过优化以下
Figure 858491DEST_PATH_IMAGE045
,得到合成图像:
Figure 478828DEST_PATH_IMAGE046
其中
Figure 916019DEST_PATH_IMAGE003
为分类损失;
Figure 813568DEST_PATH_IMAGE001
为云端模型的输入;y为目标标签真实值;
Figure 58605DEST_PATH_IMAGE005
分别惩罚总方差和
Figure 572763DEST_PATH_IMAGE006
范数,
Figure 46601DEST_PATH_IMAGE007
Figure 188869DEST_PATH_IMAGE047
Figure 745752DEST_PATH_IMAGE048
为第一步得到的特征分布正则化项;
Figure 855528DEST_PATH_IMAGE010
Figure 523270DEST_PATH_IMAGE049
为相应的缩放系数,
Figure 520045DEST_PATH_IMAGE034
,
Figure 247830DEST_PATH_IMAGE050
第三步:进行知识蒸馏,将ResNet-18[4]作为边缘模型,使用第一步中云端模型,以及第二步中的合成图像训练集,初步训练边缘模型。训练过程为给云端模型与边缘模型输入合成图像,并依据云端模型与边缘模型输出的softmax值进行分布匹配,进而训练边缘模型[2]。训练时为云端模型和边缘模型输入合成图像,得到两个概率分布分别进行softmax计算,生成软化的概率分布,softmax计算公式如下:
Figure 346367DEST_PATH_IMAGE051
其中
Figure 552220DEST_PATH_IMAGE052
代表以e为底的指数函数运算,
Figure 669081DEST_PATH_IMAGE053
表示第
Figure 567767DEST_PATH_IMAGE038
类的输出概率,
Figure 389485DEST_PATH_IMAGE054
Figure 399030DEST_PATH_IMAGE055
表示第
Figure 635976DEST_PATH_IMAGE038
类和第j类的输入概率,T为温度系数,用来控制概率分布的软化程度。
使用交叉熵求上述两个概率分布的损失函数,使用该损失函数训练边缘模型。
第四步:为边缘模型输入与云端模型相同的随机噪声图像,得到云端模型和边缘模型的输出分布分别为
Figure 439984DEST_PATH_IMAGE056
Figure 903326DEST_PATH_IMAGE028
第五步:计算出两个输出分布的Wasserstein距离,作为额外的图像生成损失,对输出分布的相似性进行惩罚。图像生成损失正则化项为:
Figure 326349DEST_PATH_IMAGE057
其中
Figure 152222DEST_PATH_IMAGE058
其中inf代表函数下界;
Figure 127131DEST_PATH_IMAGE026
表示
Figure 77770DEST_PATH_IMAGE027
Figure 803018DEST_PATH_IMAGE028
的联合分布;
Figure 624344DEST_PATH_IMAGE029
表示求模长运算;
Figure 160367DEST_PATH_IMAGE030
表示联合分布
Figure 67143DEST_PATH_IMAGE031
下,样本对距离的期望值。第二步的公式修改为:
Figure 831968DEST_PATH_IMAGE059
其中
Figure 773379DEST_PATH_IMAGE003
为分类损失,通过计算交叉熵获得;
Figure 214725DEST_PATH_IMAGE060
为云端模型的输入;y为目标标签真实值;
Figure 608797DEST_PATH_IMAGE005
分别惩罚总方差和
Figure 678778DEST_PATH_IMAGE006
范数;
Figure 474695DEST_PATH_IMAGE048
为第一步中得到的特征分布正则化项;
Figure 352522DEST_PATH_IMAGE061
为图像生成损失正则化项;
Figure 233890DEST_PATH_IMAGE062
Figure 340517DEST_PATH_IMAGE063
为相应的缩放系数,
Figure 990941DEST_PATH_IMAGE034
Figure 39669DEST_PATH_IMAGE064
Figure 408333DEST_PATH_IMAGE065
Figure 82766DEST_PATH_IMAGE066
第六步:进行知识蒸馏,使用云端模型和合成图像构成的训练集继续训练边缘模型,并重复第四步到第六步100次。
使用ResNet-50作为固定的云端模型,ResNet-18作为边缘模型,云端模型已在训练集ImageNet上进行了预训练,并设定
Figure 587697DEST_PATH_IMAGE034
Figure 807325DEST_PATH_IMAGE067
Figure 663286DEST_PATH_IMAGE068
Figure 111716DEST_PATH_IMAGE069
,来生成224*224的合成图像。输入云端模型的噪声图像如图2(a)所示,输入的目标标签分别为鱼、汉堡、植物、火山,在使用DeepDream[5]方法合成的图像如图2(b)所示,可以看出这些图像不具有真实感,与自然图像相差较大。在加入本发明的特征分布正则化项后,合成的图像如图2(c)所示,图像的真实感和分辨率大大增加,可以用于训练边缘模型的知识蒸馏。在加入本发明的图像生成损失正则化项后,合成的图像如图2(d)所示,提高了合成图像的多样性。
参考文献
[1] P. Molchanov, A. Mallya, S. Tyree, I. Frosio, and J. Kautz.“Importance estimation for neural network pruning”. In CVPR, 2019.
[2]G. Hinton, O. Vinyals, and J. Dean. “Distilling the knowledgein aneural network”. arXiv preprint arXiv:1503.02531, 2015.
[3]T. Chen, I. Goodfellow, and J. Shlens. “Net2net: Acceleratinglearning via knowledge transfer”. In ICLR, 2016.
[4]K. He, X. Zhang, S. Ren, and J. Sun. “Deep residual learning forimage recognition”. In CVPR, 2016.
[5]A. Mordvintsev, C. Olah, and M. Tyka. “Inceptionism: Going deeperinto neural networks”,2015.
[6]S. Ioffe and C. Szegedy. “Batch normalization: Accelerating deepnetwork training by reducing internal covariate shift”. arXiv preprint arXiv:1502.03167, 2015.
[7] A. Mahendran and A. Vedaldi. “Understanding deep imagerepresentations by inverting them”. In CVPR, 2015.
[8]A. Brock, J. Donahue, and K. Simonyan. “Large scale GAN trainingfor high fidelity natural image synthesis”. In ICLR, 2019.

Claims (10)

1.一种异常行为检测方法,其特征在于,包括以下步骤:
S1、获取预训练的云端模型,并输入一张随机噪声图像至所述云端模型,获得云端模型的输出分布;
S2、利用从云端模型中获取的所有卷积层特征图的均值期望值和方差期望值,生成特征分布正则化项,利用所述特征分布正则化项得到损失函数,进而获得合成图像;
S3、将所述合成图像输入至云端模型和边缘模型,并依据云端模型与边缘模型输出的softmax值进行分布匹配,训练边缘模型,得到异常行为检测模型。
2.根据权利要求1所述的异常行为检测方法,其特征在于,还包括:
S4、将所述随机噪声图像输入训练后的边缘模型,得到边缘模型的输出分布;
S5、计算所述云端模型的输出分布与所述边缘模型的输出分布之间的Wasserstein距离,利用所述Wasserstein距离更新所述合成图像;
S6、返回步骤S2,重复步骤S2~步骤S5,直至达到迭代次数,得到最终的异常行为检测模型。
3.根据权利要求1所述的异常行为检测方法,其特征在于,步骤S1中,使用在训练集ImageNet上预训练的ResNet-50模型作为云端模型。
4.根据权利要求2所述的异常行为检测方法,其特征在于,步骤S2中,使用以下损失函数作为优化目标,进行反向传播,使用梯度上升法对输入的随机噪声图像
Figure 165981DEST_PATH_IMAGE001
进行更新,改变随机噪声图像的RGB数值,得到合成图像:
Figure 684687DEST_PATH_IMAGE002
其中
Figure 377836DEST_PATH_IMAGE003
为分类损失;y为目标标签真实值;
Figure 439333DEST_PATH_IMAGE004
分别为惩罚总方差和
Figure 802312DEST_PATH_IMAGE005
范数,
Figure 542735DEST_PATH_IMAGE006
Figure 305155DEST_PATH_IMAGE007
Figure 955579DEST_PATH_IMAGE008
Figure 253574DEST_PATH_IMAGE009
Figure 356659DEST_PATH_IMAGE010
为缩放系数;
Figure 516245DEST_PATH_IMAGE011
代表云端模型的第
Figure 286755DEST_PATH_IMAGE011
个卷积层;
Figure 257116DEST_PATH_IMAGE012
Figure 847498DEST_PATH_IMAGE013
分别为第
Figure 76354DEST_PATH_IMAGE014
个卷积层对应的特征图的均值和方差;
Figure 701370DEST_PATH_IMAGE015
代表期望值;X代表训练云端模型的训练集,
Figure 355816DEST_PATH_IMAGE016
代表云端模型在训练时的输入,
Figure 433494DEST_PATH_IMAGE017
Figure 934882DEST_PATH_IMAGE018
分别表示云端模型在训练时第
Figure 414405DEST_PATH_IMAGE011
个卷积层对应的特征图的均值和方差;
Figure 726569DEST_PATH_IMAGE019
表示求
Figure 557122DEST_PATH_IMAGE005
范数运算。
5.根据权利要求2所述的异常行为检测方法,其特征在于,步骤S3中,将ResNet-18作为边缘模型。
6.根据权利要求4所述的异常行为检测方法,其特征在于,步骤S5中,利用所述Wasserstein距离更新所述损失函数,进而得到更新后的合成图像:
Figure 737567DEST_PATH_IMAGE020
其中,
Figure 196230DEST_PATH_IMAGE021
为缩放系数;
Figure 803929DEST_PATH_IMAGE022
Figure 230100DEST_PATH_IMAGE023
,inf代表函数下界;
Figure 214237DEST_PATH_IMAGE024
表示
Figure 527406DEST_PATH_IMAGE025
Figure 306007DEST_PATH_IMAGE026
的联合分布;
Figure 720939DEST_PATH_IMAGE027
表示求模长运算;
Figure 243187DEST_PATH_IMAGE028
表示联合分布
Figure 676442DEST_PATH_IMAGE029
下,云端模型输出分布和边缘模型输出分布对Wasserstein距离的期望值;
Figure 625944DEST_PATH_IMAGE025
Figure 29636DEST_PATH_IMAGE026
分别为云端模型的输出分布和边缘模型的输出分布。
7.根据权利要求6所述的异常行为检测方法,其特征在于,
Figure 89996DEST_PATH_IMAGE030
Figure 643337DEST_PATH_IMAGE031
8.一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序;其特征在于,所述处理器执行所述计算机程序,以实现权利要求1~7之一所述方法的步骤。
9.一种计算机程序产品,包括计算机程序/指令;其特征在于,该计算机程序/指令被处理器执行时实现权利要求1~7之一所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序/指令;其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1~7之一所述方法的步骤。
CN202210191841.XA 2022-03-01 2022-03-01 异常行为检测方法、装置及存储介质 Pending CN114495013A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210191841.XA CN114495013A (zh) 2022-03-01 2022-03-01 异常行为检测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210191841.XA CN114495013A (zh) 2022-03-01 2022-03-01 异常行为检测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN114495013A true CN114495013A (zh) 2022-05-13

Family

ID=81484670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210191841.XA Pending CN114495013A (zh) 2022-03-01 2022-03-01 异常行为检测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN114495013A (zh)

Similar Documents

Publication Publication Date Title
Chen et al. The face image super-resolution algorithm based on combined representation learning
CN112488210A (zh) 一种基于图卷积神经网络的三维点云自动分类方法
CN111242208A (zh) 一种点云分类方法、分割方法及相关设备
CN108960059A (zh) 一种视频动作识别方法及装置
CN110138595A (zh) 动态加权网络的时间链路预测方法、装置、设备及介质
CN114724012B (zh) 基于时空跨尺度注意力融合热带不稳定波预警方法及装置
CN112489164B (zh) 基于改进深度可分离卷积神经网络的图像着色方法
CN115222998B (zh) 一种图像分类方法
CN113821668A (zh) 数据分类识别方法、装置、设备及可读存储介质
CN112733602B (zh) 关系引导的行人属性识别方法
CN116563682A (zh) 一种基于深度霍夫网络的注意力方案和条带卷积语义线检测的方法
CN118096922A (zh) 一种基于风格迁移和遥感影像生成地图的方法
CN117853596A (zh) 无人机遥感测绘方法及系统
CN116306780B (zh) 一种动态图链接生成方法
CN116563683A (zh) 一种基于卷积神经网络和多层感知机的遥感影像场景分类方法
Jin et al. Fusion of remote sensing images based on pyramid decomposition with Baldwinian Clonal Selection Optimization
CN113361570B (zh) 基于联合数据增强和网络训练模型的3d人体姿态估计方法
CN114495013A (zh) 异常行为检测方法、装置及存储介质
CN115131605A (zh) 一种基于自适应子图的结构感知图对比学习方法
CN114037866A (zh) 一种基于可辨伪特征合成的广义零样本图像分类方法
Wang et al. Cross-layer progressive attention bilinear fusion method for fine-grained visual classification
CN117829320B (zh) 一种基于图神经网络和双向深度知识蒸馏的联邦学习方法
CN117351300B (zh) 一种目标检测模型的小样本训练方法及装置
CN118447337A (zh) 一种基于大视觉模型的高光谱图像分类方法
CN116962196A (zh) 一种基于关系推理的机动通信网网络智能规划方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination