CN112767320A - 图像检测方法、装置、电子设备及存储介质 - Google Patents
图像检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112767320A CN112767320A CN202011645110.5A CN202011645110A CN112767320A CN 112767320 A CN112767320 A CN 112767320A CN 202011645110 A CN202011645110 A CN 202011645110A CN 112767320 A CN112767320 A CN 112767320A
- Authority
- CN
- China
- Prior art keywords
- image
- module
- standard
- student
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
Abstract
本发明涉及图像检测技术,揭露了一种图像检测方法,包括:获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像,利用所述标准图像训练预构建的教师网络,得到标准教师模型,根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络,利用所述标准图像训练所述混合网络,得到标准学生模型,利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。此外,本发明还涉及区块链技术,所述图像检测结果可存储在区块链的节点中。本发明还提出一种图像检测装置、电子设备以及计算机可读存储介质。本发明可以解决图像检测准确性较低的问题。
Description
技术领域
本发明涉及图像检测技术领域,尤其涉及一种图像检测方法、装置、电子设备及计算机可读存储介质。
背景技术
随着现代科技和人工智能的发展,适用于边缘设备的模型越来越重要。比如,高级驾驶辅助系统(ADAS)已经成为了汽车行业重点研究和开发的系统项目,其中行人检测系统作为ADAS中的一个重要组成部分,是关乎人类生命安全的重要研究领域。在目前的行人检测系统的研发中,检测速度和精度是制约车载识人发展的两大难点和痛点。1、基于深度学习的算法比起传统的算法来说具有更高的特征提取能力,以及更快的检测速度。但是大量的用于目标检测的深度卷积网络,具有较高的参数量和计算量,不仅模型占用较大存储空间,而且进行推理时需要强有力的图形处理器(Graphics Processing Unit,GPU),难以直接实现在边缘设备端的实际部署与应用。2、利用知识蒸馏进行轻量级网络训练。知识蒸馏是一种标准的教师——学生学习框架,它采用更大的预训练教师模型指导轻量型学生模型训练,从而使学生模型接近教师模型的性能,达到模型压缩的效果。但是传统的知识蒸馏方法利用学生模型模仿教师模型以尽可能达到教师模型的性能,这些方法需要基于教师网络的响应定义不同的知识,如“软化”后的输出、特征注意力等。然而在这样的过程中,教师仅扮演学生模仿的目标,学生并未与教师互动,且学生模型的特征提取能力要比教师模型的弱,那么学生模型通过模仿学习到的知识就无法达到教师模型的程度,影响图像检测的准确性。
发明内容
本发明提供一种图像检测方法、装置及计算机可读存储介质,其主要目的在于解决图像检测准确性较低的问题。
为实现上述目的,本发明提供的一种图像检测方法,包括:
获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像;
利用所述标准图像训练预构建的教师网络,得到标准教师模型;
根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络;
利用所述标准图像训练所述混合网络,得到标准学生模型;
利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。
可选地,所述获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像,包括:
对所述原始图像进行平移、旋转处理,得到转换图像;
利用预设的随机函数生成高斯噪声,并将所述高斯噪声添加至所述转换图像中,得到标准图像。
可选地,所述利用所述标准图像训练预构建的教师网络,得到标准教师模型,包括:
利用所述教师网络中的图像特征提取模块及图像特征增强模块对所述标准图像进行特征提取及特征增强,得到特征图像;
利用所述教师网络中的检测模块得到所述特征图像的预测框,基于所述预测框及真实框,利用预设的教师损失函数计算得到损失值,直到所述损失值小于预设的阈值,得到所述标准教师模型。
可选地,所述根据所述标准教师模型和预构建的学生网络构建混合模块,包括:
将所述标准教师模型中的模块作为教师模块,及将所述预构建的学生网络中的模块作为学生模块;
将所述教师模块和对应的学生模块进行匹配,匹配成功后得到所述混合模块。
可选地,所述基于所述混合模块及所述学生网络得到混合网络,包括:
在所述混合模块中,以随机选择的方式设置教师模块替换学生模块的概率,得到标准混合模块;
利用所述标准混合模块替换所述学生网络中的学生模块,得到包含所述标准混合模块的混合网络。
可选地,所述利用所述标准图像训练所述混合网络,得到标准学生模型,包括:
初始化所述标准混合模块中学生模块的参数;
利用所述标准图像训练所述学生模块,并根据预设的损失函数调整所述学生模块的参数;
当所述预设的损失函数满足预设的损失阈值时,以此时更新的参数作为学生模块的参数,并删除所述混合模块中的教师模块,得到所述标准学生模型。
可选地,所述利用所述标准学生模型对待检测图像进行检测,得到图像检测结果,包括:
利用所述标准学生模型对所述待检测图像进行框选及分类,得到检测图像;
对所述检测图像进行识别,得到识别框及标注,汇总所述识别框及标注得到所述图像检测结果。
为了解决上述问题,本发明还提供一种图像检测装置,所述装置包括:
图像处理模块,用于获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像;
教师模型构建模块,用于利用所述标准图像训练预构建的教师网络,得到标准教师模型;
混合网络构建模块,用于根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络;
学生模型训练模块,用于利用所述标准图像训练所述混合网络,得到标准学生模型;
图像检测模块,用于利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的图像检测方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的图像检测方法。
本发明通过对所述原始图像进行空间转换及数据增强处理,得到标准图像,可以提高图像的多样性,使得所述标准图像中的图像信息更加丰富。并且根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络,由于所述混合模块中包括教师模块及学生模块,实现了教师模块和学生模块的交互式知识蒸馏,提高了知识蒸馏的效率。同时,利用所述标准图像训练所述混合网络,得到标准学生模型,由于所述混合模块中教师模块在训练时出现的不确定性,提高了所述标准学生模型的鲁棒性,使得图像检测准确率更高。因此本发明提出的图像检测方法、装置、电子设备及计算机可读存储介质,可以解决图像检测准确性较低的问题。
附图说明
图1为本发明一实施例提供的图像检测方法的流程示意图;
图2为图1中其中一个步骤的详细实施流程示意图;
图3为图1中另一个步骤的详细实施流程示意图;
图4为图1中另一个步骤的详细实施流程示意图;
图5为图1中另一个步骤的详细实施流程示意图;
图6为本发明一实施例提供的图像检测装置的功能模块图;
图7为本发明一实施例提供的实现所述图像检测方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种图像检测方法。所述图像检测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述图像检测方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的图像检测方法的流程示意图。在本实施例中,所述图像检测方法包括:
S1、获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像。
本发明实施例中,所述原始图像可以为KITTI行人检测数据集中的图像。本发明实施例对所述原始图像中的行人进行框选得到真实框,并根据所述真实框打上标签,比如,行人在原始图像中的右上方,则打上标签“右上”。
具体地,参照图2所示,所述对所述原始图像进行空间转换及数据增强处理,得到标准图像,包括:
S10、对所述原始图像进行平移、旋转处理,得到转换图像;
S11、利用预设的随机函数生成高斯噪声,并将所述高斯噪声添加至所述转换图像中,得到标准图像。
其中,所述平移、旋转是按照预设的定点进行相应平移或旋转处理。本发明实施例中,可以使用Matlab中的函数对所述原始图像进行空间转换,同时对所有的原始图像进行空间转换后,得到的转换图像的标签也进行相应改变,比如,可以使用函数B=imrotate(A,180°)进行旋转处理,其中,所述函数表示将A原始图像按照中心点逆时针旋转180°得到B,所述A原始图像的标签为“右上”,则得到的转换图像B的标签为“左下”。所述高斯噪声是指它的概率密度函数服从高斯分布(即正态分布)的一类噪声。常见的高斯噪声包括起伏噪声、宇宙噪声、热噪声和散粒噪声等。所述预设的随机函数可以为randn()函数。通过对原始图像进行空间转换及添加高斯噪声,可以提高所述原始图像的多样性及添加一定的误差,使得所述标准图像更有训练价值。
本发明实施例通过对原始图像进行空间转换及数据增强处理,可以提高图像的多样性,使得所述标准图像中的图像信息更加丰富。
S2、利用所述标准图像训练预构建的教师网络,得到标准教师模型。
本发明实施例中,所述预构建的教师网络可以为YOLOv4网络,所述YOLOv4网络包括图像特征提取模块(Backbone)、图像特征增强模块(Neck)及检测模块(Head)等。
详细地,参照图3所示,所述S2包括:
S20、利用所述教师网络中的图像特征提取模块及图像特征增强模块对所述标准图像进行特征提取及特征增强,得到特征图像;
S21、利用所述教师网络中的检测模块得到所述特征图像的预测框,基于所述预测框及真实框,利用预设的教师损失函数计算得到损失值,直到所述损失值小于预设的阈值,得到所述标准教师模型。
本发明实施例中,所述预设的教师损失函数可以为LIOU:
具体地,本发明实施例中,所述图像特征提取模块(Backbone)可以为CSPDarknet53网络。所述图像特征增强模块(Neck)可以包括SPP(Spatial PyramidPooling,空间金字塔池化)及PANet(Path Aggregation Network,路径聚合网络),利用所述SPP提取所述标准图像中不同尺寸的特征,并且通过所述PANet将不同尺寸的特征进行特征融合。所述检测模块(Head)可以为YOLOv3网络。
本发明实施例中,通过所述标准图像训练预构建的教师网络,使得训练得到的标准教师模型在图像检测方面更加准确。
S3、根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络。
本发明实施例中,所述预构建的学生网络可以为YOLOv4-tiny网络,所述YoloV4-tiny网络是YoloV4的简化版,极大幅度的提升了速度,是一个轻量级网络。所述YoloV4-tiny网络中包括下述轻量级模块:轻量特征提取模块(Backbone)、轻量特征增强模块(Neck)及轻量检测模块(Head)等。
详细地,参照图4所示,所述根据所述标准教师模型和预构建的学生网络构建混合模块,包括:
S30、将所述标准教师模型中的模块作为教师模块,及将所述预构建的学生网络中的模块作为学生模块;
S31、将所述教师模块和对应的学生模块进行匹配,匹配成功后得到所述混合模块。
其中,所述教师模块包括:图像特征提取模块、图像特征增强模块及检测模块等。所述学生模块包括:轻量特征提取模块、轻量特征增强模块及轻量检测模块等。所述教师模块和对应的学生模块匹配成功后,得到的混合模块是一个双通道混合模块。
具体地,所述基于所述混合模块及所述学生网络得到混合网络,包括:
在所述混合模块中,以随机选择的方式设置教师模块替换学生模块的概率,得到标准混合模块;
利用所述标准混合模块替换所述学生网络中的学生模块,得到包含所述标准混合模块的混合网络。
其中,以随机选择的方式进行设置是指在混合模块中,每个学生模块被教师模块替换的概率相同,这就表示每个位置的教师模块都能指导相应的学生模块学习。同时,混合模块中的教师模块来源于所述标准教师模型,即所述教师模块的参数是固定不变的。
本发明实施例中,根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络,由于所述混合模块中包括教师模块及学生模块,实现了教师模块和学生模块的交互式知识蒸馏,提高了知识蒸馏的效率。
S4、利用所述标准图像训练所述混合网络,得到标准学生模型。
详细地,参照图5所示,所述S4包括:
S40、初始化所述标准混合模块中学生模块的参数;
S41、利用所述标准图像训练所述学生模块,并根据预设的损失函数调整所述学生模块的参数;
S42、当所述预设的损失函数满足预设的损失阈值时,以此时更新的参数作为学生模块的参数,并删除所述混合模块中的教师模块,得到所述标准学生模型。
本发明实施例中,所述预设的损失函数可以为:
具体地,在所述混合网络的训练过程中,教师模块的参数固定不变,仅更新学生模块的参数,相当于教师模块对于学生模块是一种参照,这样在预设的损失函数满足预设的损失阈值之前,每次训练只更新参数量较少的学生模块的信息,可以加速收敛。当所述混合网络收敛(即预设的损失函数满足预设的损失阈值)后,删除所述混合网络中的教师模块,便得到了一个高效的知识蒸馏学生模型。并且从损失函数可看出,利用所述混合模块构建的交互式知识蒸馏不需要额外的蒸馏损失,也不需要对损失函数进行搜索超参数等操作,同时输入的图像数据无需通过学生网络与教师网络分别处理一次,因此训练过程更加快速高效。
本发明实施例中,由于所述混合模块中教师模块在训练时出现的不确定性(即教师模块替换学生模块的概率),因此使得所述标准学生模型的鲁棒性更强。
S5、利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。
本发明实施例中,所述标准学生模型是一种轻量型网络,因此可直接部署在边缘设备中,比如,汽车的高级驾驶辅助系统(ADAS)等。同时,由于所述标准学生模型通过交互式知识蒸馏得到,因此检测准确率更高。
详细地,所述利用所述标准学生模型对待检测图像进行检测,得到图像检测结果,包括:
利用所述标准学生模型对所述待检测图像进行框选及分类,得到检测图像;
对所述检测图像进行识别,得到识别框及标注,汇总所述识别框及标注得到所述图像检测结果。
其中,所述待检测图像可以为从边缘设备的摄像头获取的图像数据。所述标准学生模型对所述待检测图像中的物体进行框选及分类。比如,一张待检测图像中包括:行人、狗及自行车,所述标准学生模型对行人、狗及自行车分别进行框选,并进行识别,得到的图像检测结果包括三个识别框及识别后的标注。
本发明通过对所述原始图像进行空间转换及数据增强处理,得到标准图像,可以提高图像的多样性,使得所述标准图像中的图像信息更加丰富。并且根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络,由于所述混合模块中包括教师模块及学生模块,实现了教师模块和学生模块的交互式知识蒸馏,提高了知识蒸馏的效率。同时,利用所述标准图像训练所述混合网络,得到标准学生模型,由于所述混合模块中教师模块在训练时出现的不确定性,提高了所述标准学生模型的鲁棒性,使得图像检测准确率更高。因此本发明实施可以解决图像检测准确性较低的问题。
如图6所示,是本发明一实施例提供的图像检测装置的功能模块图。
本发明所述图像检测装置100可以安装于电子设备中。根据实现的功能,所述图像检测装置100可以包括图像处理模块101、教师模型构建模块102、混合网络构建模块103、学生模型训练模块104及图像检测模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述图像处理模块101,用于获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像。
本发明实施例中,所述原始图像可以为KITTI行人检测数据集中的图像。本发明实施例对所述原始图像中的行人进行框选得到真实框,并根据所述真实框打上标签,比如,行人在原始图像中的右上方,则打上标签“右上”。
具体地,所述图像处理模块101通过下述操作得到标准图像:
对所述原始图像进行平移、旋转处理,得到转换图像;
利用预设的随机函数生成高斯噪声,并将所述高斯噪声添加至所述转换图像中,得到标准图像。
其中,所述平移、旋转是按照预设的定点进行相应平移或旋转处理。本发明实施例中,可以使用Matlab中的函数对所述原始图像进行空间转换,同时对所有的原始图像进行空间转换后,得到的转换图像的标签也进行相应改变,比如,可以使用函数B=imrotate(A,180°)进行旋转处理,其中,所述函数表示将A原始图像按照中心点逆时针旋转180°得到B,所述A原始图像的标签为“右上”,则得到的转换图像B的标签为“左下”。所述高斯噪声是指它的概率密度函数服从高斯分布(即正态分布)的一类噪声。常见的高斯噪声包括起伏噪声、宇宙噪声、热噪声和散粒噪声等。所述预设的随机函数可以为randn()函数。通过对原始图像进行空间转换及添加高斯噪声,可以提高所述原始图像的多样性及添加一定的误差,使得所述标准图像更有训练价值。
本发明实施例通过对原始图像进行空间转换及数据增强处理,可以提高图像的多样性,使得所述标准图像中的图像信息更加丰富。
所述教师模型构建模块102,用于利用所述标准图像训练预构建的教师网络,得到标准教师模型。
本发明实施例中,所述预构建的教师网络可以为YOLOv4网络,所述YOLOv4网络包括图像特征提取模块(Backbone)、图像特征增强模块(Neck)及检测模块(Head)等。
本发明实施例中,所述教师模型构建模块102通过下述操作得到标准教师模型:
利用所述教师网络中的图像特征提取模块及图像特征增强模块对所述标准图像进行特征提取及特征增强,得到特征图像;
利用所述教师网络中的检测模块得到所述特征图像的预测框,基于所述预测框及真实框,利用预设的教师损失函数计算得到损失值,直到所述损失值小于预设的阈值,得到所述标准教师模型。
本发明实施例中,所述预设的教师损失函数可以为LIOU:
具体地,本发明实施例中,所述图像特征提取模块(Backbone)可以为CSPDarknet53网络。所述图像特征增强模块(Neck)可以包括SPP(Spatial PyramidPooling,空间金字塔池化)及PANet(Path Aggregation Network,路径聚合网络),利用所述SPP提取所述标准图像中不同尺寸的特征,并且通过所述PANet将不同尺寸的特征进行特征融合。所述检测模块(Head)可以为YOLOv3网络。
本发明实施例中,通过所述标准图像训练预构建的教师网络,使得训练得到的标准教师模型在图像检测方面更加准确。
所述混合网络构建模块103,用于根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络。
本发明实施例中,所述预构建的学生网络可以为YOLOv4-tiny网络,所述YoloV4-tiny网络是YoloV4的简化版,极大幅度的提升了速度,是一个轻量级网络。所述YoloV4-tiny网络中包括下述轻量级模块:轻量特征提取模块(Backbone)、轻量特征增强模块(Neck)及轻量检测模块(Head)等。
详细地,所述混合网络构建模块103通过下述操作构建混合模块:
将所述标准教师模型中的模块作为教师模块,及将所述预构建的学生网络中的模块作为学生模块;
将所述教师模块和对应的学生模块进行匹配,匹配成功后得到所述混合模块。
其中,所述教师模块包括:图像特征提取模块、图像特征增强模块及检测模块等。所述学生模块包括:轻量特征提取模块、轻量特征增强模块及轻量检测模块等。所述教师模块和对应的学生模块匹配成功后,得到的混合模块是一个双通道混合模块。
详细地,所述混合网络构建模块103通过下述操作得到混合网络:
在所述混合模块中,以随机选择的方式设置教师模块替换学生模块的概率,得到标准混合模块;
利用所述标准混合模块替换所述学生网络中的学生模块,得到包含所述标准混合模块的混合网络。
其中,以随机选择的方式进行设置是指在混合模块中,每个学生模块被教师模块替换的概率相同,这就表示每个位置的教师模块都能指导相应的学生模块学习。同时,混合模块中的教师模块来源于所述标准教师模型,即所述教师模块的参数是固定不变的。
本发明实施例中,根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络,由于所述混合模块中包括教师模块及学生模块,实现了教师模块和学生模块的交互式知识蒸馏,提高了知识蒸馏的效率。
所述学生模型训练模块104,用于利用所述标准图像训练所述混合网络,得到标准学生模型。
详细地,所述学生模型训练模块104通过下述操作得到标准学生模型:
初始化所述标准混合模块中学生模块的参数;
利用所述标准图像训练所述学生模块,并根据预设的损失函数调整所述学生模块的参数;
当所述预设的损失函数满足预设的损失阈值时,以此时更新的参数作为学生模块的参数,并删除所述混合模块中的教师模块,得到所述标准学生模型。
本发明实施例中,所述预设的损失函数可以为:
具体地,在所述混合网络的训练过程中,教师模块的参数固定不变,仅更新学生模块的参数,相当于教师模块对于学生模块是一种参照,这样在预设的损失函数满足预设的损失阈值之前,每次训练只更新参数量较少的学生模块的信息,可以加速收敛。当所述混合网络收敛(即预设的损失函数满足预设的损失阈值)后,删除所述混合网络中的教师模块,便得到了一个高效的知识蒸馏学生模型。并且从损失函数可看出,利用所述混合模块构建的交互式知识蒸馏不需要额外的蒸馏损失,也不需要对损失函数进行搜索超参数等操作,同时输入的图像数据无需通过学生网络与教师网络分别处理一次,因此训练过程更加快速高效。
本发明实施例中,由于所述混合模块中教师模块在训练时出现的不确定性(即教师模块替换学生模块的概率),因此使得所述标准学生模型的鲁棒性更强。
所述图像检测模块105,用于利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。
本发明实施例中,所述标准学生模型是一种轻量型网络,因此可直接部署在边缘设备中,比如,汽车的高级驾驶辅助系统(ADAS)等。同时,由于所述标准学生模型通过交互式知识蒸馏得到,因此检测准确率更高。
详细地,所述图像检测模块105通过下述操作得到图像检测结果:
利用所述标准学生模型对所述待检测图像进行框选及分类,得到检测图像;
对所述检测图像进行识别,得到识别框及标注,汇总所述识别框及标注得到所述图像检测结果。
其中,所述待检测图像可以为从边缘设备的摄像头获取的图像数据。所述标准学生模型对所述待检测图像中的物体进行框选及分类。比如,一张待检测图像中包括:行人、狗及自行车,所述标准学生模型对行人、狗及自行车分别进行框选,并进行识别,得到的图像检测结果包括三个识别框及识别后的标注。
如图7所示,是本发明一实施例提供的实现图像检测方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如图像检测程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如图像检测程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如图像检测程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图7仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图7示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的图像检测程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像;
利用所述标准图像训练预构建的教师网络,得到标准教师模型;
根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络;
利用所述标准图像训练所述混合网络,得到标准学生模型;
利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。
具体地,所述处理器10对上述指令的具体实现方法可参考图1至图5对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像;
利用所述标准图像训练预构建的教师网络,得到标准教师模型;
根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络;
利用所述标准图像训练所述混合网络,得到标准学生模型;
利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种图像检测方法,其特征在于,所述方法包括:
获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像;
利用所述标准图像训练预构建的教师网络,得到标准教师模型;
根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络;
利用所述标准图像训练所述混合网络,得到标准学生模型;
利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。
2.如权利要求1所述的图像检测方法,其特征在于,所述获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像,包括:
对所述原始图像进行平移、旋转处理,得到转换图像;
利用预设的随机函数生成高斯噪声,并将所述高斯噪声添加至所述转换图像中,得到标准图像。
3.如权利要求1所述的图像检测方法,其特征在于,所述利用所述标准图像训练预构建的教师网络,得到标准教师模型,包括:
利用所述教师网络中的图像特征提取模块及图像特征增强模块对所述标准图像进行特征提取及特征增强,得到特征图像;
利用所述教师网络中的检测模块得到所述特征图像的预测框,基于所述预测框及真实框,利用预设的教师损失函数计算得到损失值,直到所述损失值小于预设的阈值,得到所述标准教师模型。
4.如权利要求1所述的图像检测方法,其特征在于,所述根据所述标准教师模型和预构建的学生网络构建混合模块,包括:
将所述标准教师模型中的模块作为教师模块,及将所述预构建的学生网络中的模块作为学生模块;
将所述教师模块和对应的学生模块进行匹配,匹配成功后得到所述混合模块。
5.如权利要求4所述的图像检测方法,其特征在于,所述基于所述混合模块及所述学生网络得到混合网络,包括:
在所述混合模块中,以随机选择的方式设置教师模块替换学生模块的概率,得到标准混合模块;
利用所述标准混合模块替换所述学生网络中的学生模块,得到包含所述标准混合模块的混合网络。
6.如权利要求5所述的图像检测方法,其特征在于,所述利用所述标准图像训练所述混合网络,得到标准学生模型,包括:
初始化所述标准混合模块中学生模块的参数;
利用所述标准图像训练所述学生模块,并根据预设的损失函数调整所述学生模块的参数;
当所述预设的损失函数满足预设的损失阈值时,以此时更新的参数作为学生模块的参数,并删除所述混合模块中的教师模块,得到所述标准学生模型。
7.如权利要求1至6中任意一项所述的图像检测方法,其特征在于,所述利用所述标准学生模型对待检测图像进行检测,得到图像检测结果,包括:
利用所述标准学生模型对所述待检测图像进行框选及分类,得到检测图像;
对所述检测图像进行识别,得到识别框及标注,汇总所述识别框及标注得到所述图像检测结果。
8.一种图像检测装置,其特征在于,所述装置包括:
图像处理模块,用于获取原始图像,对所述原始图像进行空间转换及数据增强处理,得到标准图像;
教师模型构建模块,用于利用所述标准图像训练预构建的教师网络,得到标准教师模型;
混合网络构建模块,用于根据所述标准教师模型和预构建的学生网络构建混合模块,并基于所述混合模块及所述学生网络得到混合网络;
学生模型训练模块,用于利用所述标准图像训练所述混合网络,得到标准学生模型;
图像检测模块,用于利用所述标准学生模型对待检测图像进行检测,得到图像检测结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的图像检测方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的图像检测方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011645110.5A CN112767320A (zh) | 2020-12-31 | 2020-12-31 | 图像检测方法、装置、电子设备及存储介质 |
PCT/CN2021/083708 WO2022141859A1 (zh) | 2020-12-31 | 2021-03-30 | 图像检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011645110.5A CN112767320A (zh) | 2020-12-31 | 2020-12-31 | 图像检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112767320A true CN112767320A (zh) | 2021-05-07 |
Family
ID=75698783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011645110.5A Pending CN112767320A (zh) | 2020-12-31 | 2020-12-31 | 图像检测方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112767320A (zh) |
WO (1) | WO2022141859A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113284164A (zh) * | 2021-05-19 | 2021-08-20 | 中国农业大学 | 虾群自动计数方法、装置、电子设备及存储介质 |
CN115631178A (zh) * | 2022-11-03 | 2023-01-20 | 昆山润石智能科技有限公司 | 自动晶圆缺陷检测方法、系统、设备及存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115082690B (zh) * | 2022-07-12 | 2023-03-28 | 北京百度网讯科技有限公司 | 目标识别方法、目标识别模型训练方法及装置 |
CN115131747A (zh) * | 2022-08-25 | 2022-09-30 | 合肥中科类脑智能技术有限公司 | 基于知识蒸馏的输电通道工程车辆目标检测方法及系统 |
CN116071608B (zh) * | 2023-03-16 | 2023-06-06 | 浙江啄云智能科技有限公司 | 目标检测方法、装置、设备和存储介质 |
CN116977919B (zh) * | 2023-06-21 | 2024-01-26 | 北京卓视智通科技有限责任公司 | 一种着装规范的识别方法、系统、存储介质和电子设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674714B (zh) * | 2019-09-13 | 2022-06-14 | 东南大学 | 基于迁移学习的人脸和人脸关键点联合检测方法 |
CN111027403B (zh) * | 2019-11-15 | 2023-06-06 | 深圳市瑞立视多媒体科技有限公司 | 手势估计方法、装置、设备及计算机可读存储介质 |
CN112115783B (zh) * | 2020-08-12 | 2023-11-14 | 中国科学院大学 | 基于深度知识迁移的人脸特征点检测方法、装置及设备 |
CN111950638B (zh) * | 2020-08-14 | 2024-02-06 | 厦门美图之家科技有限公司 | 基于模型蒸馏的图像分类方法、装置和电子设备 |
CN112116030B (zh) * | 2020-10-13 | 2022-08-30 | 浙江大学 | 一种基于向量标准化和知识蒸馏的图像分类方法 |
-
2020
- 2020-12-31 CN CN202011645110.5A patent/CN112767320A/zh active Pending
-
2021
- 2021-03-30 WO PCT/CN2021/083708 patent/WO2022141859A1/zh active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113284164A (zh) * | 2021-05-19 | 2021-08-20 | 中国农业大学 | 虾群自动计数方法、装置、电子设备及存储介质 |
CN115631178A (zh) * | 2022-11-03 | 2023-01-20 | 昆山润石智能科技有限公司 | 自动晶圆缺陷检测方法、系统、设备及存储介质 |
CN115631178B (zh) * | 2022-11-03 | 2023-11-10 | 昆山润石智能科技有限公司 | 自动晶圆缺陷检测方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2022141859A1 (zh) | 2022-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112767320A (zh) | 图像检测方法、装置、电子设备及存储介质 | |
CN112287916B (zh) | 视频图文课件文本提取方法、装置、设备及介质 | |
CN112380343A (zh) | 问题解析方法、装置、电子设备及存储介质 | |
CN112396005A (zh) | 生物特征图像识别方法、装置、电子设备及可读存储介质 | |
WO2022141858A1 (zh) | 行人检测方法、装置、电子设备及存储介质 | |
CN112446544A (zh) | 交通流预测模型训练方法、装置、电子设备及存储介质 | |
WO2023159755A1 (zh) | 虚假新闻检测方法、装置、设备及存储介质 | |
CN115374189B (zh) | 基于区块链的食品安全溯源方法、装置及设备 | |
CN112988963A (zh) | 基于多流程节点的用户意图预测方法、装置、设备及介质 | |
CN112580684A (zh) | 基于半监督学习的目标检测方法、装置及存储介质 | |
CN113298159A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN115205225A (zh) | 医学图像识别模型的训练方法、装置、设备及存储介质 | |
CN112990374B (zh) | 图像分类方法、装置、电子设备及介质 | |
CN114385817A (zh) | 实体关系的识别方法、设备及可读存储介质 | |
CN112560855B (zh) | 图像信息提取方法、装置、电子设备及存储介质 | |
CN113157739A (zh) | 跨模态检索方法、装置、电子设备及存储介质 | |
CN112269875A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN116630712A (zh) | 基于模态组合的信息分类方法、装置、电子设备及介质 | |
CN115346095A (zh) | 视觉问答方法、装置、设备及存储介质 | |
CN115471775A (zh) | 基于录屏视频的信息验证方法、装置、设备及存储介质 | |
CN115146064A (zh) | 意图识别模型优化方法、装置、设备及存储介质 | |
CN115114992A (zh) | 分类模型训练的方法、装置、设备及存储介质 | |
CN113627394A (zh) | 人脸提取方法、装置、电子设备及可读存储介质 | |
CN114913371A (zh) | 多任务学习模型训练方法、装置、电子设备及存储介质 | |
CN114595321A (zh) | 问题标注方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |