CN108898168B - 用于目标检测的卷积神经网络模型的压缩方法和系统 - Google Patents

用于目标检测的卷积神经网络模型的压缩方法和系统 Download PDF

Info

Publication number
CN108898168B
CN108898168B CN201810628418.5A CN201810628418A CN108898168B CN 108898168 B CN108898168 B CN 108898168B CN 201810628418 A CN201810628418 A CN 201810628418A CN 108898168 B CN108898168 B CN 108898168B
Authority
CN
China
Prior art keywords
convolutional neural
neural network
network
network model
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810628418.5A
Other languages
English (en)
Other versions
CN108898168A (zh
Inventor
王生进
舒晗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201810628418.5A priority Critical patent/CN108898168B/zh
Publication of CN108898168A publication Critical patent/CN108898168A/zh
Application granted granted Critical
Publication of CN108898168B publication Critical patent/CN108898168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供用于目标检测的卷积神经网络模型的压缩方法和系统。其中,方法包括:获取未经训练的用于目标检测的卷积神经网络模型,并将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络;根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数;将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,并根据样本图像对卷积神经网络模型进行训练,获取压缩后的用于目标检测的卷积神经网络模型。本发明实施例提供的用于目标检测的卷积神经网络模型的压缩方法和系统,具有较高的准确率并能减少模型的参数,使得压缩后的模型能运行于计算资源受限的平台上。

Description

用于目标检测的卷积神经网络模型的压缩方法和系统
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及用于目标检测的卷积神经网络模型的压缩方法和系统。
背景技术
随着计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术对目标进行实时跟踪研究越来越热门,对目标进行动态实时跟踪定位在智能化交通系统、智能监控系统、军事目标检测及医学导航手术中手术器械定位等方面具有广泛的应用价值。目标检测是提取目标的基本方法。在目标检测中,目标可以为人脸、车辆、人体、动物或其他目标。
以人脸检测为例,近年来,以人脸为代表的生物特征检测识别已经广泛应用到了身份辨认、账户注册、金融支付、安全防控等诸多领域。人脸检测技术,即检测出一张图片或一段视频中人脸的位置。随着人脸检测与识别技术的广泛应用,人脸检测方法也面临新的问题和挑战。一方面,更加复杂多变的应用场景,如光照、姿态、尺度、表情、遮挡的变化,对人脸检测方法的准确性和鲁棒性提出了更高的要求;另一方面,大量应用场景由于空间、成本等因素的限制,硬件计算资源受到限制,如何在保证准确率的基础上,降低人脸检测方法所需的计算资源,也是人脸检测方法面临的挑战。
传统的人脸检测方法主要依赖尺度、位置变化的检测窗口产生人脸候选区域,提取人工设计特征训练分类器,判断候选区域是否为人脸。最具代表性的是基于Haar特征和Adaboost分类器的人脸检测方法。这种方法在候选区域中计算若干个矩形特征,训练出与这些矩形特征对应的弱分类器。每一个候选窗口逐级通过弱分类器,如果置信度低于阈值,则不再进行下一步判断,通过所有弱分类器的候选区域判断为人脸区域。这种人脸检测方法基本满足简单的实时应用,但由于Haar特征表征能力较弱,不能满足复杂场景下多变的人脸检测需求。
随着深度神经网络方法在图像处理领域的广泛应用,基于卷积神经网络算法的人脸检测方法也开始出现。比较具有代表性的是级联的神经网络方法。这种方法继承了Adaboost方法的思想,采用多级网络结构,为了兼顾效率与准确率,在前几层网络利用计算快速的小型网络结构排除大量的非人脸区域。这种方法相比传统方法准确率有所提高,但仍然需要计算复杂度较高的滑动检测窗口产生候选区域。另一种代表性的RCNN(Regionswith CNN features,R-CNN)系列方法来源于通用人脸检测研究,准确率高,但是特征提取网络结构复杂,不能满足快速、实时应用的需求。
深度卷积神经网络模型一般需要较高的计算资源,需要GPU(图形处理器,Graphics Processing Unit)才能完成运算。而在大量的人脸检测应用场景中,由于空间、成本限制,人脸检测平台一般不能采用GPU。在计算资源受限的平台上,现有的基于卷积神经网络的人脸检测算法无法快速、实时运行,因此,现有的基于卷积神经网络的人脸检测模型无法大规模应用于实际生活,尤其是难以应用于计算资源受限的嵌入式平台和移动设备。
发明内容
针对现有技术存在的难以应用于计算资源受限的平台的问题,本发明实施例提供用于目标检测的卷积神经网络模型的压缩方法和系统。
根据本发明的第一方面,本发明实施例提供一种用于目标检测的卷积神经网络模型的压缩方法,包括:
获取未经训练的用于目标检测的卷积神经网络模型,并将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络;
根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数;
将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,并根据样本图像对卷积神经网络模型进行训练,获取压缩后的用于目标检测的卷积神经网络模型。
根据本发明的第二方面,本发明实施例提供一种用于目标检测的卷积神经网络模型的压缩系统,包括:
结构简化模块,用于获取未经训练的用于目标检测的卷积神经网络模型,并将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络;
知识蒸馏模块,用于根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数;
模型训练模块,将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,并根据样本图像对卷积神经网络模型进行训练,获取压缩后的用于目标检测的卷积神经网络模型。
根据本发明的第三方面,本发明实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行本发明实施例用于目标检测的卷积神经网络模型的压缩方法及其所有可选实施例的方法。
根据本发明的第四方面,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本发明实施例用于目标检测的卷积神经网络模型的压缩方法及其所有可选实施例的方法。
本发明实施例提供的用于目标检测的卷积神经网络模型的压缩方法和系统,通过简化特征提取网络的网络结构,以减少特征提取网络的参数,并通过知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,使得压缩后的用于目标检测的卷积神经网络模型具有较高的检测准确率,能用于实际的目标检测,从而减少用于目标检测的卷积神经网络模型的参数,实现对用于目标检测的卷积神经网络模型的压缩,使得用于目标检测的卷积神经网络模型占用内存更低,所需要和所消耗计算资源更少,对计算资源和内存的要求较低,可以广泛运行在目标检测的多种应用场景中,尤其是计算资源受限的嵌入式平台和移动设备。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例用于目标检测的卷积神经网络模型的压缩方法的流程图;
图2为本发明实施例用于目标检测的卷积神经网络模型的压缩系统的功能框图;
图3为本发明实施例电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例提供的用于目标检测的卷积神经网络模型的压缩方法和系统,适用于对用于目标检测的卷积神经网络模型进行压缩,尤其适用于对用于单目标检测的卷积神经网络模型进行压缩。例如,适用于对基于卷积神经网络的人脸检测模型,为一种用于人脸检测的卷积神经网络模型。
用于目标检测的卷积神经网络模型中的卷积神经网络,由特征提取网络和目标校正网络构成。特征提取网络,用于对输入的特征向量进行处理,以提取目标图像的特征。目标校正网络,用于根据目标图像的特征,获取目标图像中目标所在的区域。特征提取网络包括至少一个卷积层,还可以包括至少一个全连接层,也可以不包括全连接层。
优选地,用于目标检测的卷积神经网络模型可以为RCNN系列、YOLO系列、SSD系列的目标检测模型,但不限于此。
图1为本发明实施例用于目标检测的卷积神经网络模型的压缩方法的流程图。如图1所示,一种用于目标检测的卷积神经网络模型的压缩方法包括:步骤S101、获取未经训练的用于目标检测的卷积神经网络模型,并将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络。
需要注意的是,本发明实施例是对未经训练的用于目标检测的卷积神经网络模型进行压缩。本发明实施例不是分别对卷积神经网络模型的每一神经元层分别进行压缩,也不是对卷积神经网络模型中的特征提取网络的每一神经元层分别进行压缩,而是对特征提取网络整体进行压缩。
在进行压缩之前,先获取未经训练的用于目标检测的卷积神经网络模型,作为带压缩的用于目标检测的卷积神经网络模型。
对于未经训练的用于目标检测的卷积神经网络模型,卷积神经网络模型的参数还没有进行初始化,因此,也没有根据样本图像对卷积神经网络模型进行训练。
获取未经训练的用于目标检测的卷积神经网络模型之后,对卷积神经网络模型中的特征提取网络的网络结构进行简化。简化的基本原则是减少特征提取网络的参数的数量,因此,能够达到模型压缩和加速的目的。
特征提取网络的参数,由特征提取网络的各层的参数构成。各层的参数包括权重矩阵和偏置向量,即每一层的参数都包括权重矩阵和偏置向量。其中,权重矩阵和偏置向量可以为一个或多个。
将网络结构简化后的特征提取网络,作为简化网络。
步骤S102、根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数。
一个复杂的网络结构模型是若干个单独的小模型组成的集合或者是一个由强约束条件(例如dropout)训练得到的大型模型。一旦训练得到复杂网络,可以用不同的训练(即distillation)来将知识从复杂网络转化成更使用于应用拓展的小模型。简化网络就是一种单独的小模型。将复杂模型简化为小模型时需要保留模型的泛化能力,否则,小模型的误差会很大,导致进行目标检测的误差非常差,因而不能应用于实际的目标检测。
因此,由于简化网络与简化前的复杂网络在准确率上有一定的差距,需要采用知识蒸馏的方法,将复杂模型和简化模型进行联合训练,即通过知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练。通过联合训练,确定简化网络的参数。
训练是的目标函数需要最大限度的反映正确目标,尽管如此模型还是通常被训练得在测试数据上表现的最优,但真实目标其实是需要在新的数据集上表现良好。当从大模型到小模型做知识蒸馏的时候,可以像训练大模型一样训练好小模型。一个复杂的模型具有良好的泛化能力是因为它通常是许多不同模型的平均,这样通过蒸馏的方式训练出的小模型会比传统训练出来的小模型在测试集上表现更好。
知识蒸馏的方法主要的思想是,利用复杂网络作为教师网络,简化网络作为学生网络,简化网络不是直接学习样本图像中的目标已标注的真值标签,而是学习复杂网络根据样本图像输出的软标签。软标签相比于真值标签的非线性程度有所下降,对于简化网络的学习优化更加容易,能缩小简化网络和复杂网络的性能差距,提升简化网络的准确率。
根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,是根据样本图像进行的。
样本图像,是预先采集的图像。预先采集的图像可以是直接采集的图像,也可以是从视频中获取的图像。图像中包括了目标,并对目标的位置进行了标注,作为真值标签。
步骤S103、将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,并根据样本图像对卷积神经网络模型进行训练,获取压缩后的用于目标检测的卷积神经网络模型。
确定简化网络的参数后,将确定参数后的简化网络嵌入用于目标检测的卷积神经网络模型,即将用于目标检测的卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络。
由于步骤S102只是初步确定了用于目标检测的卷积神经网络模型中的特征提取网络的参数,还没有确定用于目标检测的卷积神经网络模型中的目标校正网络的参数,因此,通过样本图像对卷积神经网络模型进行训练,确定卷积神经网络模型的参数,将确定参数后的卷积神经网络模型作为压缩后的用于目标检测的卷积神经网络模型,从而获得压缩后的用于目标检测的卷积神经网络模型。
可以理解的是,获得压缩后的用于目标检测的卷积神经网络模型后,可以将压缩后的用于目标检测的卷积神经网络模型移植到各种应用场景的平台上,尤其是计算资源受限的嵌入式平台或移动设备上。将压缩后的用于目标检测的卷积神经网络模型移植到各种应用场景的平台上之后,利用应用场景下的摄像头或其他图像采集设备采集图像,将采集的图像输入压缩后的用于目标检测的卷积神经网络模型,输出检测到目标区域。
本发明实施例通过简化特征提取网络的网络结构,以减少特征提取网络的参数,并通过知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,使得压缩后的用于目标检测的卷积神经网络模型具有较高的检测准确率,能用于实际的目标检测,从而减少用于目标检测的卷积神经网络模型的参数,实现对用于目标检测的卷积神经网络模型的压缩,使得用于目标检测的卷积神经网络模型占用内存更低,所需要和所消耗计算资源更少,对计算资源和内存的要求较低,可以广泛运行在目标检测的多种应用场景中,尤其是计算资源受限的嵌入式平台和移动设备。进一步地,对于用于人脸检测的卷积神经网络模型,对开放场景下的人脸有较好的适应性,能够很好地应对人脸光照变化、姿态变化、表情变化以及佩戴眼镜、口罩、围巾、头巾等遮挡物的情况,不需要主动配合,对开放应用场景下多样的人脸具有较高的准确率和鲁棒性。
基于上述实施例,特征提取网络包括至少一个卷积层;相应地,将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络具体包括:减少至少一个卷积层中神经元的数量,并增加卷积层的数量;将卷积层中的大尺寸的卷积核替换为级联的小尺寸卷积核;以及若特征提取网络包括全连接层,将至少一个全连接层替换为卷积层中的至少一种。
具体地,将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络可以通过下列三种方法中的至少一种实现,即可以通过下列三种方法中的任意一种实现,也可以通过下列三种方法中的任意多种的组合实现。
第一种简化特征提取网络的网络结构的方法包括:减少至少一个卷积层中神经元的数量,并增加卷积层的数量。
由于通常情况下,特征提取网络中每一卷积层包括的神经元的数量很大,可以通过减少卷积层中神经元的数量,并增加卷积层的数量来减少网络结构的复杂性,即减小网络宽度,以深度代替宽度。在同等规模的计算复杂度情况下,网络深度相比于宽度更能提升网络的性能。
可以理解的是,对于未经训练的用于目标检测的卷积神经网络模型中的特征提取网络,可以减少上述特征提取网络的一个或多个卷积层中神经元的数量,并增加卷积层的数量。优选地,减少上述特征提取网络的每个卷积层中神经元的数量,并增加卷积层的数量。
第二种简化特征提取网络的网络结构的方法包括:将大尺寸的卷积核替换为级联的小尺寸卷积核。
卷积核的尺寸,指卷积核的大小。卷积核的尺寸越大,计算的复杂度越大。假设一个1*1卷积核的计算复杂度为M(M为常数),一个7*7卷积核的计算复杂度是49M,三个3*3卷积核的计算复杂度是27M。
卷积核通常为矩阵,高级矩阵可以替换为多个低阶矩阵相乘。
例如,一个3*3卷积核可以替换为级联的两个1*3卷积核。
因此,大尺寸的卷积核替换为级联的小尺寸卷积核,使得简化网络在保持了感受野大小不变的情况下,网络参数减少,计算量减少。
第三种简化特征提取网络的网络结构的方法包括:若特征提取网络包括全连接层,将至少一个全连接层替换为卷积层。
由于RCNN系列、YOLO系列、SSD系列等目标检测模型中的特征提取网络包括至少一个全连接层,可以用卷积层替代全连接层。
将特征提取网络中的全部全连接层都用卷积层替代,可以得到全卷积网络。全卷积的网络结构对于图片的输入大小没有限制,任意图片输入大小可以保证检测目标在输入图片中不会发生形变。
本发明实施例通过减少至少一个卷积层中神经元的数量,并增加卷积层的数量;将大尺寸的卷积核替换为级联的小尺寸卷积核;以及将至少一个全连接层替换为卷积层中的至少一种简化特征提取网络的网络结构,大大减少了特征提取网络参数的数量,使得进行前向计算时占用的计算资源大大减少。
基于上述实施例,根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练的具体步骤包括:将网络结构简化前的特征提取网络作为教师网络,根据样本图像对教师网络进行训练,确定教师网络的参数。
具体地,网络结构简化前的特征提取网络为复杂网络,网络结构简化后获得的简化网络为简单结构,因此,将网络结构简化前的特征提取网络作为教师网络,将简化网络作为学生网络。
进行联合训练时,根据样本图像对教师网络进行训练,将样本图像输入教师网络,根据教师网络的输出与已标注的真值标签之差,不断修正教师网络的参数,直至教师网络的输出与已标注的真值标签之差小于预设的第一误差阈值,从而确定教师网络的参数。
将简化网络作为学生网络,根据样本图像和样本图像对应的参数已确定的教师网络的输出,对学生网络进行训练。
确定教师网络的参数时,已经获取样本图像对应的教师网络的输出,将样本图像输入已确定的教师网络后,教师网络的输出作为软标签。软标签为样本图像对应的参数已确定的教师网络的输出。
根据样本图像对学生网络进行训练,将样本图像输入简化网络,根据简化网络的输出与软标签之差,不断修正简化网络的参数,直至简化网络的输出与软标签之差小于预设的第二误差阈值,从而确定简化网络的参数。其中,第一误差阈值与第二误差阈值可以相同也可以不同。
基于上述实施例,根据样本图像对卷积神经网络模型进行训练,获取压缩后的用于目标检测的卷积神经网络模型的具体步骤包括:根据样本图像对卷积神经网络模型进行训练,微调简化网络的参数浮点型并调整卷积神经网络模型中目标校正网络的参数,确定卷积神经网络模型的参数,获得压缩后的用于目标检测的卷积神经网络模型;其中,卷积神经网络模型的参数为浮点型。
具体地,将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络后,根据样本图像对卷积神经网络模型进行训练,将样本图像输入卷积神经网络模型,由于简化网络已经根据知识蒸馏方法进行过训练,根据卷积神经网络模型的输出与已标注的真值标签之差,不断微调简化网络的参数并修正目标校正网络的参数,直至卷积神经网络模型的输出与已标注的真值标签之差小于预设的第三误差阈值,确定替换后的特征提取网络和目标校正网络的参数,从而确定卷积神经网络模型的全部参数。
需要说明的是,一般情况下,卷积神经网络模型的参数均为浮点型。
基于上述实施例,获取卷积神经网络模型的参数与获得压缩后的用于目标检测的卷积神经网络模型之间还包括:将卷积神经网络模型的参数由浮点型量化为定点型。
参数量化是压缩模型的重要手段。一般情况下,卷积神经网络模型的参数为不同长度的浮点数。可以通过浮点数定点化,将浮点数转换为定点数。
将浮点数量化为定点数的方法有很多种,如LOG对数变换、正弦函数变换、正切函数变换和线性量化变换等。
优选地,采用线性量化变换将将浮点数转换为定点数。具体步骤包括:对于将特征提取网络替换为确定参数后的简化网络后的卷积神经网络模型,卷积神经网络模型完成训练后,对于卷积神经网络模型中每一层的参数,将参数的最大值和最小值分别作为上界和下界,并将参数的上界和下界形成的区间等分成多份,然后将每一浮点型的参数映射至量化后的区间,根据所映射至的区间,获得区间对应的定性数作为该浮点型的参数的量化结果。
例如,参数量化前,卷积神经网络模型的参数为32位浮点数,通过参数量化,将卷积神经网络模型的参数由32位浮点数转换为8-bit的定点数并存储,可以将模型压缩为原来大小的四分之一。
本发明实施例通过将确定的卷积神经网络模型的浮点型参数进行量化,获得定点型参数,使得进行前向计算时占用的计算资源大大减少,所占用的内存也大大减小。
基于上述实施例,将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,与根据样本图像对卷积神经网络模型进行训练之间还包括:对于简化网络中的每一卷积层,根据通道剪枝方法,去除该卷积层中冗余的通道。
具体地,步骤S102和步骤S103之间还包括采用通道剪枝进一步减少简化网络的参数的数量。
对于简化网络中的每一卷积层,根据预设的通道剪枝策略,去除该卷积层中冗余的通道。
通道剪枝的关键在于如何评判每个通道对应的参数对于简化网络整体的重要程度,保留重要程度高的通道。
通道指一个单层卷积核。冗余的通道,指对简化网络的准确率的影响很小,甚至可以忽略不计的单层卷积核。
本发明实施例通过通道减枝方法,能够在保持卷积神经网络模型准确率的情况下进一步减少卷积神经网络模型的参数的数量,从而减少计算量和占用的内存。
基于上述实施例,根据通道剪枝方法,去除该卷积层中冗余的通道的具体步骤包括:对于该卷积层中的每一通道,若判断获知该通道的卷积核的n范数小于预设的范数阈值,则将该通道确定为冗余的通道并去除;或,对于该卷积层中的每一通道,若判断获知该通道的卷积核对应的激活值小于预设的激活值阈值,则将该通道确定为冗余的通道并去除;或,若去除若干个通道后的该卷积层的输出误差最小,则将若干个通道确定为冗余的通道并去除。
具体地,根据通道剪枝方法,去除该卷积层中冗余的通道可以基于下列三种预设的通道剪枝策略任意一种实现。
三种预设的通道剪枝策略包括:基于通道的卷积核的n范数、基于通道的卷积核对应的激活值和基于最小重构误差进行通道剪枝。
对于每一卷积层,基于通道的卷积核的n范数进行通道剪枝的具体步骤包括:
对于该卷积层中的每一通道,计算该通道的卷积核的n范数,并将该通道的卷积核的n范数与预设的范数阈值进行比较;
若该通道的卷积核的n范数小于预设的范数阈值,则将该通道确定为冗余的通道并去除;若该通道的卷积核的n范数大于预设的范数阈值,则保留该通道。
对于每一卷积层,基于通道的卷积核对应的激活值进行通道剪枝的具体步骤包括:
对于该卷积层中的每一通道,计算该通道的卷积核对应的激活值,并将该通道的卷积核对应的激活值与预设的激活值阈值进行比较;
若该通道的卷积核对应的激活值小于预设的激活值阈值,则将该通道确定为冗余的通道并去除;若该通道的卷积核对应的激活值大于预设的激活值阈值,则保留该通道。
对于每一卷积层,基于最小重构误差进行通道剪枝的具体步骤包括:
对于每一卷积层,分别去除该卷积层中的若干个通道,并计算每种情况下,去除若干个通道后的简化网络中该卷积层的输出误差。输出误差指去除通道后的简化网络中该卷积层的输出与去除通道后的简化网络中该卷积层的输出之间的差值。
例如,该卷积层中包括n个通道时,分别去除每一个通道、每两个通道、…、每(n-1)个通道,并计算每种情况下去除若干个通道后的简化网络中该卷积层的输出误差。
比较上述每种情况下,去除若干个通道后的简化网络中该卷积层的输出误差,将其中输出误差时所去除的若干个通道确定为冗余的通道并去除。
图2为本发明实施例用于目标检测的卷积神经网络模型的压缩系统的功能框图。基于上述实施例,如图2所示,一种用于目标检测的卷积神经网络模型的压缩系统包括:结构简化模块201,用于获取未经训练的用于目标检测的卷积神经网络模型,并将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络;知识蒸馏模块202,用于根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数;模型训练模块203,将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,并根据样本图像对卷积神经网络模型进行训练,获取压缩后的用于目标检测的卷积神经网络模型。
本发明提供的用于目标检测的卷积神经网络模型的压缩系统用于执行本发明提供的用于目标检测的卷积神经网络模型的压缩方法,用于目标检测的卷积神经网络模型的压缩系统包括的各模块实现相应功能的具体方法和流程详见上述用于目标检测的卷积神经网络模型的压缩方法的实施例,此处不再赘述。
本发明实施例通过简化特征提取网络的网络结构,以减少特征提取网络的参数,并通过知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,使得压缩后的用于目标检测的卷积神经网络模型具有较高的检测准确率,能用于实际的目标检测,从而减少用于目标检测的卷积神经网络模型的参数,实现对用于目标检测的卷积神经网络模型的压缩,使得用于目标检测的卷积神经网络模型占用内存更低,所需要和所消耗计算资源更少,对计算资源和内存的要求较低,可以广泛运行在目标检测的多种应用场景中,尤其是计算资源受限的嵌入式平台和移动设备。进一步地,对于用于人脸检测的卷积神经网络模型,对开放场景下的人脸有较好的适应性,能够很好地应对人脸光照变化、姿态变化、表情变化以及佩戴眼镜、口罩、围巾、头巾等遮挡物的情况,不需要主动配合,对开放应用场景下多样的人脸具有较高的准确率和鲁棒性。
图3为本发明实施例电子设备的结构框图。基于上述实施例,如图3所示,一种电子设备包括:处理器(processor)301、存储器(memory)302和总线303;其中,处理器301和存储器302通过总线303完成相互间的通信;处理器301用于调用存储器302中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:用于目标检测的卷积神经网络模型的压缩方法;将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络的方法;根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数的方法;根据样本图像对卷积神经网络模型进行训练的方法;进行参数量化的方法;进行通道剪枝的方法等。
本发明另一实施例公开一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:用于目标检测的卷积神经网络模型的压缩方法;将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络的方法;根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数的方法;根据样本图像对卷积神经网络模型进行训练的方法;进行参数量化的方法;进行通道剪枝的方法等。
本发明另一实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:用于目标检测的卷积神经网络模型的压缩方法;将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络的方法;根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数的方法;根据样本图像对卷积神经网络模型进行训练的方法;进行参数量化的方法;进行通道剪枝的方法等。
以上所描述的系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种用于人脸检测的卷积神经网络模型的压缩方法,其特征在于,包括:
获取未经训练的用于人脸检测的卷积神经网络模型,并将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络;
根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数;
将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,并根据样本图像对压缩后的卷积神经网络模型进行训练,获取压缩后的用于人脸检测的卷积神经网络模型;
所述将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,与所述根据样本图像对压缩后的卷积神经网络模型进行训练之间还包括:
对于简化网络中的每一卷积层,根据通道剪枝方法,去除该卷积层中冗余的通道;
所述根据通道剪枝方法,去除该卷积层中冗余的通道的具体步骤包括:
对于该卷积层中的每一通道,若判断获知该通道的卷积核的n范数小于预设的范数阈值,则将该通道确定为冗余的通道并去除;
或,对于该卷积层中的每一通道,若判断获知该通道的卷积核对应的激活值小于预设的激活值阈值,则将该通道确定为冗余的通道并去除;
或,若去除若干个通道后的该卷积层的输出误差最小,则将所述若干个通道确定为冗余的通道并去除。
2.根据权利要求1所述的用于人脸检测的卷积神经网络模型的压缩方法,其特征在于,所述特征提取网络包括至少一个卷积层;
相应地,将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络具体包括:
减少至少一个卷积层中神经元的数量,并增加卷积层的数量;
将所述卷积层中的大尺寸的卷积核替换为级联的小尺寸卷积核;
以及若特征提取网络包括全连接层,将至少一个全连接层替换为卷积层中的至少一种。
3.根据权利要求1所述的用于人脸检测的卷积神经网络模型的压缩方法,其特征在于,根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练的具体步骤包括:
将网络结构简化前的特征提取网络作为教师网络,根据样本图像对教师网络进行训练,确定教师网络的参数;
将简化网络作为学生网络,根据样本图像和样本图像对应的参数已确定的教师网络的输出,对学生网络进行训练。
4.根据权利要求1所述的用于人脸检测的卷积神经网络模型的压缩方法,其特征在于,根据样本图像对压缩后的卷积神经网络模型进行训练,获取压缩后的用于人脸检测的卷积神经网络模型的具体步骤包括:
根据样本图像对压缩后的卷积神经网络模型进行训练,微调简化网络的参数浮点型并调整卷积神经网络模型中目标校正网络的参数,确定卷积神经网络模型的参数,获得压缩后的用于人脸检测的卷积神经网络模型;
其中,卷积神经网络模型的参数为浮点型。
5.根据权利要求4所述的用于人脸检测的卷积神经网络模型的压缩方法,其特征在于,获取卷积神经网络模型的参数与获得压缩后的用于人脸检测的卷积神经网络模型之间还包括:
将卷积神经网络模型的参数由浮点型量化为定点型。
6.一种用于人脸检测的卷积神经网络模型的压缩系统,其特征在于,包括:
结构简化模块,用于获取未经训练的用于人脸检测的卷积神经网络模型,并将卷积神经网络模型中的特征提取网络的网络结构进行简化,获取简化网络;
知识蒸馏模块,用于根据知识蒸馏方法对网络结构简化前后的特征提取网络进行联合训练,确定简化网络的参数;
模型训练模块,将卷积神经网络模型中的特征提取网络替换为确定参数后的简化网络,并根据样本图像对压缩后的卷积神经网络模型进行训练,获取压缩后的用于人脸检测的卷积神经网络模型;
通道剪枝模块,用于对于简化网络中的每一卷积层,根据通道剪枝方法,去除该卷积层中冗余的通道;
所述根据通道剪枝方法,去除该卷积层中冗余的通道的具体步骤包括:
对于该卷积层中的每一通道,若判断获知该通道的卷积核的n范数小于预设的范数阈值,则将该通道确定为冗余的通道并去除;
或,对于该卷积层中的每一通道,若判断获知该通道的卷积核对应的激活值小于预设的激活值阈值,则将该通道确定为冗余的通道并去除;
或,若去除若干个通道后的该卷积层的输出误差最小,则将所述若干个通道确定为冗余的通道并去除。
7.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至5任一所述的方法。
CN201810628418.5A 2018-06-19 2018-06-19 用于目标检测的卷积神经网络模型的压缩方法和系统 Active CN108898168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810628418.5A CN108898168B (zh) 2018-06-19 2018-06-19 用于目标检测的卷积神经网络模型的压缩方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810628418.5A CN108898168B (zh) 2018-06-19 2018-06-19 用于目标检测的卷积神经网络模型的压缩方法和系统

Publications (2)

Publication Number Publication Date
CN108898168A CN108898168A (zh) 2018-11-27
CN108898168B true CN108898168B (zh) 2021-06-01

Family

ID=64345092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810628418.5A Active CN108898168B (zh) 2018-06-19 2018-06-19 用于目标检测的卷积神经网络模型的压缩方法和系统

Country Status (1)

Country Link
CN (1) CN108898168B (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109671020B (zh) * 2018-12-17 2023-10-24 北京旷视科技有限公司 图像处理方法、装置、电子设备和计算机存储介质
CN111353944B (zh) * 2018-12-20 2024-05-28 深圳市中兴微电子技术有限公司 一种图像重建方法、装置及计算机可读存储介质
CN109816636B (zh) * 2018-12-28 2020-11-27 汕头大学 一种基于智能终端的裂缝检测方法
CN109344921B (zh) * 2019-01-03 2019-04-23 湖南极点智能科技有限公司 一种基于深度神经网络模型的图像识别方法、装置及设备
CN109800877B (zh) * 2019-02-20 2022-12-30 腾讯科技(深圳)有限公司 神经网络的参数调整方法、装置及设备
CN109919300B (zh) * 2019-02-25 2021-03-05 北京市商汤科技开发有限公司 神经网络训练方法及装置以及图像处理方法及装置
CN111695671B (zh) * 2019-03-12 2023-08-08 北京地平线机器人技术研发有限公司 训练神经网络的方法及装置、电子设备
CN110033083B (zh) * 2019-03-29 2023-08-29 腾讯科技(深圳)有限公司 卷积神经网络模型压缩方法和装置、存储介质及电子装置
WO2020199056A1 (zh) * 2019-03-30 2020-10-08 华为技术有限公司 一种数据处理方法、服务器和可读介质
CN111767204B (zh) * 2019-04-02 2024-05-28 杭州海康威视数字技术股份有限公司 溢出风险检测方法、装置及设备
CN110059740A (zh) * 2019-04-12 2019-07-26 杭州电子科技大学 一种针对嵌入式移动端的深度学习语义分割模型压缩方法
CN110222705B (zh) * 2019-04-23 2023-10-24 华为技术有限公司 一种网络模型的训练方法以及相关装置
CN110830435A (zh) * 2019-08-27 2020-02-21 国家电网有限公司信息通信分公司 一种网络流量时空特征提取和异常检测的方法及装置
CN110674878A (zh) * 2019-09-26 2020-01-10 苏州航韧光电技术有限公司 一种双模决策级图像融合的目标检测方法及设备
WO2021068180A1 (en) * 2019-10-11 2021-04-15 Beijing Didi Infinity Technology And Development Co., Ltd. Method and system for continual meta-learning
CN112784978A (zh) * 2019-11-08 2021-05-11 佳能株式会社 训练神经网络的方法、装置和系统及存储指令的存储介质
CN112825143A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 深度卷积神经网络压缩方法、装置、存储介质及设备
CN111031312B (zh) * 2019-12-16 2022-02-25 山东浪潮科学研究院有限公司 基于网络实现注意力机制的图像压缩方法
CN111291637A (zh) * 2020-01-19 2020-06-16 中国科学院上海微系统与信息技术研究所 一种基于卷积神经网络的人脸检测方法、装置及设备
CN111368634B (zh) * 2020-02-05 2023-06-20 中国人民解放军国防科技大学 基于神经网络的人头检测方法、系统及存储介质
CN111340223A (zh) * 2020-02-27 2020-06-26 上海商汤临港智能科技有限公司 神经网络压缩、目标检测、行驶控制方法以及装置
CN111461212B (zh) * 2020-03-31 2023-04-07 中国科学院计算技术研究所 一种用于点云目标检测模型的压缩方法
CN111614358B (zh) * 2020-04-30 2023-08-04 合肥的卢深视科技有限公司 基于分通道量化的特征提取方法、系统、设备及存储介质
WO2022021029A1 (zh) * 2020-07-27 2022-02-03 深圳市大疆创新科技有限公司 检测模型训练方法、装置、检测模型使用方法及存储介质
CN111882555B (zh) * 2020-08-07 2024-03-12 中国农业大学 基于深度学习的网衣检测方法、装置、设备及存储介质
CN112070233B (zh) * 2020-08-25 2024-03-22 北京百度网讯科技有限公司 模型联合训练方法、装置、电子设备和存储介质
CN114202796B (zh) * 2020-08-27 2023-08-04 中国电信股份有限公司 模型自适应的目标检测的方法及装置
CN112132279B (zh) * 2020-09-23 2023-09-15 平安科技(深圳)有限公司 卷积神经网络模型压缩方法、装置、设备及存储介质
CN112200062B (zh) * 2020-09-30 2021-09-28 广州云从人工智能技术有限公司 一种基于神经网络的目标检测方法、装置、机器可读介质及设备
CN112232491A (zh) * 2020-10-29 2021-01-15 深兰人工智能(深圳)有限公司 基于卷积神经网络模型的特征提取方法和装置
CN112308019B (zh) * 2020-11-19 2021-08-17 中国人民解放军国防科技大学 基于网络剪枝和知识蒸馏的sar舰船目标检测方法
CN112598020A (zh) * 2020-11-24 2021-04-02 深兰人工智能(深圳)有限公司 目标识别方法及系统
CN112561866B (zh) * 2020-12-04 2022-03-01 重庆忽米网络科技有限公司 基于ai与云计算技术的半导体基板光刻胶层缺陷检测系统
CN112545452B (zh) * 2020-12-07 2021-11-30 南京医科大学眼科医院 高度近视眼底病变图像识别装置
CN112597867B (zh) * 2020-12-17 2024-04-26 佛山科学技术学院 戴口罩人脸识别方法、系统、计算机设备及存储介质
CN112836801A (zh) * 2021-02-03 2021-05-25 上海商汤智能科技有限公司 深度学习网络确定方法、装置、电子设备及存储介质
CN112819252A (zh) * 2021-03-01 2021-05-18 云南电网有限责任公司电力科学研究院 一种卷积神经网络模型构建方法
CN112990446B (zh) * 2021-05-19 2021-09-24 神威超算(北京)科技有限公司 一种异常团体识别方法、装置和智能芯片
CN113221908B (zh) * 2021-06-04 2024-04-16 深圳龙岗智能视听研究院 一种基于深度卷积神经网络的数字识别方法及设备
CN113610049A (zh) * 2021-08-25 2021-11-05 云南电网有限责任公司电力科学研究院 一种移动端人脸检测方法
CN113486185B (zh) * 2021-09-07 2021-11-23 中建电子商务有限责任公司 一种基于联合训练的知识蒸馏方法、处理器及存储介质
CN113919444B (zh) * 2021-11-10 2022-12-13 北京市商汤科技开发有限公司 目标检测网络的训练方法、目标检测方法及装置
CN113822389B (zh) * 2021-11-24 2022-02-22 紫东信息科技(苏州)有限公司 一种基于内窥镜图片的消化道疾病分类系统
CN114881227B (zh) * 2022-05-13 2023-07-04 北京百度网讯科技有限公司 模型压缩方法、图像处理方法、装置和电子设备
CN115062777B (zh) * 2022-08-17 2022-11-22 珠海亿智电子科技有限公司 卷积神经网络的量化方法、量化装置、设备及存储介质
CN116758481A (zh) * 2023-06-30 2023-09-15 江苏方天电力技术有限公司 一种基于机器视觉算法的电力站房监测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247989A (zh) * 2017-06-15 2017-10-13 北京图森未来科技有限公司 一种神经网络训练方法及装置
CN107368885A (zh) * 2017-07-13 2017-11-21 北京智芯原动科技有限公司 基于多粒度剪枝的网络模型压缩方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548234A (zh) * 2016-11-17 2017-03-29 北京图森互联科技有限责任公司 一种神经网络剪枝方法及装置
US10726244B2 (en) * 2016-12-07 2020-07-28 Samsung Electronics Co., Ltd. Method and apparatus detecting a target
CN110969250B (zh) * 2017-06-15 2023-11-10 北京图森智途科技有限公司 一种神经网络训练方法及装置
CN107644221A (zh) * 2017-10-31 2018-01-30 南京航空航天大学 基于参数压缩的卷积神经网络交通标志识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247989A (zh) * 2017-06-15 2017-10-13 北京图森未来科技有限公司 一种神经网络训练方法及装置
CN107368885A (zh) * 2017-07-13 2017-11-21 北京智芯原动科技有限公司 基于多粒度剪枝的网络模型压缩方法及装置

Also Published As

Publication number Publication date
CN108898168A (zh) 2018-11-27

Similar Documents

Publication Publication Date Title
CN108898168B (zh) 用于目标检测的卷积神经网络模型的压缩方法和系统
CN109558832B (zh) 一种人体姿态检测方法、装置、设备及存储介质
US11967151B2 (en) Video classification method and apparatus, model training method and apparatus, device, and storage medium
CN110348428B (zh) 眼底图像分类方法、装置及计算机可读存储介质
CN112446270B (zh) 行人再识别网络的训练方法、行人再识别方法和装置
CN108764195B (zh) 手写模型训练方法、手写字识别方法、装置、设备及介质
CN111950649B (zh) 基于注意力机制与胶囊网络的低照度图像分类方法
WO2020228525A1 (zh) 地点识别及其模型训练的方法和装置以及电子设备
CN111444881A (zh) 伪造人脸视频检测方法和装置
CN111079764B (zh) 一种基于深度学习的低照度车牌图像识别方法及装置
CN117456297A (zh) 图像生成方法、神经网络的压缩方法及相关装置、设备
CN111414946B (zh) 基于人工智能的医疗影像的噪声数据识别方法和相关装置
CN113326930B (zh) 数据处理方法、神经网络的训练方法及相关装置、设备
CN111368672A (zh) 一种用于遗传病面部识别模型的构建方法及装置
CN107944381B (zh) 人脸跟踪方法、装置、终端及存储介质
CN111401192B (zh) 基于人工智能的模型训练方法和相关装置
CN112016467A (zh) 交通标志识别模型训练方法、识别方法、系统、设备及介质
CN112966574A (zh) 人体三维关键点预测方法、装置及电子设备
US20230143985A1 (en) Data feature extraction method and related apparatus
CN115601820A (zh) 一种人脸伪造图像检测方法、装置、终端及存储介质
CN115577768A (zh) 半监督模型训练方法和装置
CN114529750A (zh) 图像分类方法、装置、设备及存储介质
CN117746015A (zh) 小目标检测模型训练方法、小目标检测方法及相关设备
CN117252778A (zh) 基于语义保持的颜色恒常性方法和系统
She et al. Facial image inpainting algorithm based on attention mechanism and dual discriminators

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant