CN112101313B - 一种机房机器人巡检方法及系统 - Google Patents

一种机房机器人巡检方法及系统 Download PDF

Info

Publication number
CN112101313B
CN112101313B CN202011281344.6A CN202011281344A CN112101313B CN 112101313 B CN112101313 B CN 112101313B CN 202011281344 A CN202011281344 A CN 202011281344A CN 112101313 B CN112101313 B CN 112101313B
Authority
CN
China
Prior art keywords
model
training
sample set
target
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011281344.6A
Other languages
English (en)
Other versions
CN112101313A (zh
Inventor
陈飞
胡坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing mengpa Xinchuang Technology Co., Ltd
Shanghai mengpa Intelligent Technology Co.,Ltd.
Original Assignee
Beijing Mengpa Xinchuang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mengpa Xinchuang Technology Co ltd filed Critical Beijing Mengpa Xinchuang Technology Co ltd
Priority to CN202011281344.6A priority Critical patent/CN112101313B/zh
Publication of CN112101313A publication Critical patent/CN112101313A/zh
Application granted granted Critical
Publication of CN112101313B publication Critical patent/CN112101313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明涉及一种机房机器人巡检方法及系统,包括以下步骤:在预设目标的坐标位置采集若干目标图片,并将若干目标图片分为训练样本集和测试样本集;对训练样本集中的目标图片进行迭代训练输出基础训练深度学习模型;通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性,删除低重要性的组件,并输出剪枝模型;对剪枝模型进行微调,并通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求;基于满足预设要求的模型对机房巡检中采集的若干待检测的目标图片进行检测并输出巡检结果。本发明可以提高检测的实时性,并且缩短机房监控响应时间。

Description

一种机房机器人巡检方法及系统
技术领域
本发明属于设备检测领域,尤其涉及一种机房机器人巡检方法及系统。
背景技术
机房巡检是保障机房安全运行的一项重要制度。鉴于传统人工巡检存在工作量大,受巡检员的经验等主观因素影响大,手工记录难以保存等问题,越来越多的智能巡检机器人在机房中得到了实际应用,有效的提高了机房设备自动识别和故障报警的效率,降低了运维人员的劳动强度,为机房无人值守提供了强有力的技术支撑。然而,由于机器人内部工控机的硬件计算能力较差,在进行目标检测任务时,需要大量的算法参数,较大的内存和较长的推理时间,这些情况会导致机房的监控响应时间过长,使其无法满足目标检测实时性的要求。
发明内容
针对上述现有技术中存在的缺陷,本发明的目的在于提供一种机房机器人巡检方法及系统,可以提高检测的实时性,并且缩短机房监控响应时间。
为了达到上述目的,本发明提供一种机房机器人巡检方法,其特征在于,包括以下步骤:
在预设目标的坐标位置采集若干目标图片,并将若干目标图片分为训练样本集和测试样本集;
对训练样本集中的目标图片进行迭代训练输出基础训练深度学习模型;
通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性,删除低重要性的组件,并输出剪枝模型;
对剪枝模型进行微调,并通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求;
基于满足预设要求的模型对机房巡检中采集的若干待检测的目标图片进行检测并输出巡检结果。
在一个实施例中,在采集若干目标图片后,对采集到的目标图片进行标注,以使得每一所述目标图片上标注有至少一个检测目标窗口、与其对应的目标类别、以及检测的结果。
在一个实施例中,所述检测目标窗口为左上角顶点和右下角顶点的两个坐标表示,所述目标类别为根据机房检测需求对目标进行的分类。
在一个实施例中,在进行迭代训练时,获取预训练权重,并通过深度学习YOLOv3算法对训练样本集中标注的目标图片进行迭代训练。
在一个实施例中,通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性,输出剪枝模型具体包括:
通过减小基础训练深度学习模型的神经网络权重,以使得基础训练深度学习模型一半以上的神经网络权重等于或约等于0;
剪去等于或约等于0的神经网络权重对应特征图的通道,以及等于0的神经网络权重对应的上下卷积层的卷积核,并输出剪枝模型。
在一个实施例中,减小基础训练深度学习模型的神经网络权重具体包括:通过带L1正则化项的次梯度法减小每个BN层的权重值,其中,BN层为批标准化层;
设减小的权重值为γ,则其公式为:
Figure 765942DEST_PATH_IMAGE001
式中,u为损失函数的学习率;
Figure 89607DEST_PATH_IMAGE002
为原始损失函数的梯度;η为超参数,决定了带 L1正则化项的次梯度法的每次梯度下降大小, 并且η取值处于10-5~10-4之间;
Figure 400503DEST_PATH_IMAGE003
决定带L1正则化项的次梯度法的损失方向,γ的下标表示更新的意思,即将上一次得到的 数值放入公式更新后得到下一次的数值。
在一个实施例中,输出剪枝模型具体包括:
将输入特征图中所有参数规整至均值为0, 方差为1的正态分布范围内,其公式如下:
Figure 451504DEST_PATH_IMAGE004
Figure 62614DEST_PATH_IMAGE005
式中,τ为正态变量,u为均值,
Figure 291601DEST_PATH_IMAGE006
为方差,
Figure 89793DEST_PATH_IMAGE007
为输入的每个通道的特征图,B代表 一个批量大小,它表示批量中包含有多少个样本,H为输入图片的高度,W为输入图片的宽 度,l为对应的序号;
使得规整后每个参数在训练过程中学习得到对应的两个调节因子γβ,其公式如下:
Figure 23114DEST_PATH_IMAGE008
式中,
Figure 347785DEST_PATH_IMAGE009
为标准化后的特征图,γ i β i 为特征图对应的两个调节因子。
在一个实施例中,所述组件包括权重和卷积核。
在一个实施例中,通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求,具体包括:将测试样本集输入微调后的模型,并将输出的巡检结果与实际的巡检结果进行比对,若测试样本集的比对匹配结果大于95%,则该微调后的模型满足预设要求。
另一方面,本发明还提供一种机房机器人巡检系统,包括:
采集模块,其用于采集若干目标图片,并将若干目标图片分为训练样本集和测试样本集;
基础训练模块,其用于对训练样本集中的目标图片进行迭代训练输出基础训练深度学习模型;
稀疏模块,其用于通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性;
剪枝模块,其用于删除低重要性的组件,并输出剪枝模型;
微调评估模块,其用于对剪枝模型进行微调,并通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求;
巡检模块,其用于基于满足预设要求的模型对机房巡检中采集的若干待检测的目标图片进行检测并输出巡检结果。
与现有技术相比,本发明通过对用于目标检测的模型进行剪枝后,使其参数量、模型大小整体降低,并且提高了检测模型前向推断的速度,还可以保持mAP(mean AveragePrecision,平均精度均值)基本不变。在采用剪枝后的监测模型时,可以提高目标检测的实时性,并且缩短机房监控的响应时间。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:
图1是示出根据本发明实施例的一种基于模型剪枝的机房机器人巡检方法流程图;
图2是示出根据本发明某一实施例的基于模型剪枝的机房机器人巡检方法的流程图;
图3是示出根据本发明某一实施例的基础训练的流程图;
图4是示出根据本发明实施例一种机房机器人巡检系统的系统结构框图;以及
图5是示出根据本发明实施例的一种电子设备的示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述……,但这些……不应限于这些术语。这些术语仅用来将……区分开。例如,在不脱离本发明实施例范围的情况下,第一……也可以被称为第二……,类似地,第二……也可以被称为第一……。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者装置中还存在另外的相同要素。
下面结合附图详细说明本发明的可选实施例。
实施例一
参见图1所示,本发明实施例为了解决现有的目标检测算法在机器人内部的工控机上部署时存在的一些问题,提出了一种基于模型剪枝的机房机器人巡检方法,其实现步骤为:
在预设目标的坐标位置采集若干目标图片,并将若干目标图片分为训练样本集和测试样本集;
对训练样本集中的目标图片进行迭代训练输出基础训练深度学习模型;
通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性,删除低重要性的组件,并输出剪枝模型;其中,组件包括权重和卷积核。重要性的确定主要由于在神经网络的训练中,权值越大,对神经网络精确度的影响越高,所以可将权重排序后,确定每个组件的重要性。
对剪枝模型进行微调,并通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求;其中,经过剪枝后的模型,精度和性能会有所下降,对修剪后的模型参数通过训练进行微调后得到新的模型,微调的过程主要是在前期的测试样本集上面进行测试,直到精度达到最优即可。
基于满足预设要求的模型对机房巡检中采集的若干待检测的目标图片进行检测并输出巡检结果。
本发明实施例是基于模型剪枝的加速方法,其主要思想为挑选出模型中不重要的权重或卷积核将其移除;移除不重要的权重或卷积核后,通过再训练来恢复模型的性能,这样就可以在保证模型性能的前提下,最大程度的压缩模型参数,实现模型加速。
为了便于本领域技术人更好地理解本发明实施例的技术方案,对其进行详细说明。在采集若干目标图片后,对采集到的目标图片进行标注,以使得每一所述目标图片上标注有至少一个检测目标窗口、与其对应的目标类别、以及检测的结果。
进一步地,对采集到的目标图片进行标注,可以包括:手动控制机器人摄像头多角度拍摄含有目标的照片,对照片进行过滤,收集若干张(例如,2000张)照片,使用可视化的图像标注工具LabelImg,借助此工具标定图像中的目标,生成遵循 PASCAL VOC 的格式的XML 文件,并将XML文件转为TXT文件。
在确定检测目标窗口的位置时,所述检测目标窗口可以为左上角顶点和右下角顶点的两个坐标表示,所述目标类别为根据机房检测需求对目标进行的分类。进一步,检测目标窗口的形状可以根据不同应用场景进行选择,例如,检测目标窗口可以为方形、长方形、圆形等。另外,目前机房检测需求是检测设备上面的指示灯,因此,对目标进行的分类可根据机房场景将指示灯划分为红灯,绿灯,黄灯和蓝灯等不同类别。
在进行迭代训练时,获取预训练权重,并通过深度学习YOLOv3算法对训练样本集中标注的目标图片进行迭代训练。
另外,通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性,输出剪枝模型具体包括:
通过减小基础训练深度学习模型的神经网络权重,以使得基础训练深度学习模型一半以上的神经网络权重等于或约等于0;
剪去等于或约等于0的神经网络权重对应特征图的通道,以及等于0的神经网络权重对应的上下卷积层的卷积核,并输出剪枝模型。
进一步,减小基础训练深度学习模型的神经网络权重具体包括:通过带L1正则化项的次梯度法减小每个BN层的权重值,其中,BN层为批标准化层;
设减小的权重值为γ,则其公式为:
Figure 872307DEST_PATH_IMAGE010
式中,u为损失函数的学习率;
Figure 33161DEST_PATH_IMAGE011
为原始损失函数的梯度;η为超参数,决定了带 L1正则化项的次梯度法的每次梯度下降大小, 并且η取值处于10-5~10-4之间;
Figure 566911DEST_PATH_IMAGE012
决定带L1正则化项的次梯度法的损失方向,另外,γ的下标表示更新的 意思,即将上一次得到的数值
Figure 746088DEST_PATH_IMAGE013
放入公式更新后得到下一次的数值
Figure 910353DEST_PATH_IMAGE014
,其更新次 数一般为几万次,主要取决于参数设置和数据量等因素。
其中,本发明实施例主要在于增加深度,神经网络可以更好地近似损失函数,并且增加非线性,获得更好的特征表示。然而增加深度,网络的复杂性也会增加,使得网络难以优化并且更易过拟合。 故本发明实施例采用带 L1 正则化生成稀疏权重的方法来训练大而密的网络,然后删除网络中贡献较小的权重,即删掉一些冗余连接。
具体地,输出剪枝模型可以包括:
将输入特征图中所有参数规整至均值为0, 方差为1的正态分布范围内,其公式如下:
Figure 683137DEST_PATH_IMAGE015
Figure 364785DEST_PATH_IMAGE016
式中,τ为正态变量,u为均值,
Figure 804994DEST_PATH_IMAGE017
为方差,
Figure 795952DEST_PATH_IMAGE018
为输入的每个通道的特征图,B代表 一个批量大小,它表示批量中包含有多少个样本,H为输入图片的高度,W为输入图片的宽 度,l为对应的序号;其中,关于B中批量的释义:在深度学习中所涉及到的数据比较多,一般 采用小批量数据处理原则,相对海量的的数据集和内存容量,小批量处理需要更少的内存 就可以训练网络。例如将一个大样本分成11小样本(每个样本100个数据),采用小批量训练 网络时,每次传播后更新权重,就传播了11批,在每批次后我们均更新了网络的(权重)参 数。
其中,在卷积神经网络的每个卷积层,数据都是以三维形式存在的,可以将数据看成许多个二维图片叠在一起,每一个二维图片称为一个特征图。
使得规整后每个参数在训练过程中学习得到对应的两个调节因子γβ,其公式如下:
Figure 56032DEST_PATH_IMAGE019
式中,
Figure 869268DEST_PATH_IMAGE020
为标准化后的特征图,γ i β i 为特征图对应的两个调节因子,并且γ i 为特征图的通道i的权重。
本发明实施例通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求,具体包括:将测试样本集输入微调后的模型,并将输出的巡检结果与实际的巡检结果进行比对,若测试样本集的比对匹配结果大于95%,则该微调后的模型满足预设要求。更具体地,用微调后模型参数对神经网络的权值进行初始化,然后将测试集中的样本输入到网络中进行前向传播,并经过每层的网络计算得到结果,将网络的输出结果(输出的巡检结果)与已经标记的测试样本(实际的巡检结果)进行对比,判断输出结果是否正确。如果正确率(匹配)大于95%,则该模型满足预设要求。进一步地,微调的具体操作为:建立文件夹,将标注后的标注文件和图片按训练要求放入,根据转换脚本将标注文件转换成yolo格式的文件,在剪枝后的模型上执行训练脚本进行训练,以完成对模型的微调。
实施例二
参见图2所示,在实施例一的基础上,本实施例还包括以下内容:
机器人在机房巡检中根据预设坐标位置采集大量待检测的目标图片;
对采集到的目标图片进行标注;
在预训练权重基础上对标注的目标图片进行基础训练得到模型;
在基础训练得到的模型上进行稀疏训练;
对稀疏训练后的模型进行剪枝;
对剪枝后的模型进行微调后部署于机房机器人。
实施例三
在实施例二的基础上,本实施例还包括以下内容:
所述基础训练为:下载预训练权重,配置data文件,修改cfg文件,并使用yolov3.weights初始化权重。
进一步地,参见图3所示,所述基础训练为:人工标注含有目标的图片中所有检测目标窗口以及类别,检测目标区域用窗口左上角顶点和右下角顶点的两个坐标进行表示,即(x 1 ,y 1)和(x 2 ,y 2 )。
根据机房的检测需求对目标分类,并随机打乱目标图片顺序,从中选取多张图片(例如,3000张图片)作为训练样本集,多张图片(例如,300张图片)作为测试样本集。
从darknet官网下载预训练权重yolov3.weights,并用深度学习YOLOv3算法对所标记的训练样本图片进行迭代训练,训练样本图片通过训练迭代学习输出基础训练深度学习模型。
实施例四
在实施例三的基础上,本实施例还可以包括以下内容:
所述稀疏训练为:在基础训练得到的模型基础上,通过L1损失(Least AbosuloteError,最小化绝对误差)减少神经网络权重(即对权重的更新加以L1正则项进行诱导,使其更加稀疏), 使得大部分权重接近于0(例如,半数以上权重接近于0),最后一层和bias层通常不进行稀疏。
另外,所述模型剪枝为:首先评估稀疏训练后的模型的每个组件的重要性,然后会删除不太重要的组件,移除的组件可以是单独的神经连接或网络结构。为了定义每个组件的重要性,可根据它们的贡献对网络的每个神经元进行排序。
在基础训练中,深度学习通过大量的参数计算推理得到预测结果,但是其中有相当多的参数都是冗余且是对预测结果无影响的,导致在模型训练时,原始网络需要一个足够大的参数空间以充分的寻找最优解。但是当模型训练完之后会发现,只要保留最优的参数也一样可以达到和原参数空间一样的效果。因此,本发明实施例通过对模型进行剪枝,可以在原有模型构成的参数空间里中搜寻了一条最有价值的计算路径,通过剪枝的模型的精度不会降低, 还可以使得模型运行的更有效率。即采用模型剪枝的方法可以对训练后模型进行保持原精度情况下计算量和参数总量的缩减。
本发明实施例通过采用对BN层 (Batch Normalization,批标准化层) 进行 L1惩罚的方式进行通道剪枝。进一步,L0正则化的值是模型参数中非零参数的个数。L1正则化表示各个参数绝对值之和。L2正则化表示各个参数的平方的和的开方值。L1正则化在实际中往往替代L0正则化,来防止过拟合。L1正则化之所以可以防止过拟合,是因为L1范数就是各个参数的绝对值相加得到的,参数值大小和模型复杂度是成正比的。因此复杂的模型,其L1范数就大,最终导致损失函数就大,说明这个模型就不够好。
在神经网络的计算中,BN 层实际上进行了两步运算,如式 (1) 所示: 1) 对输入特征图所有参数规整到均值为 0, 方差为 1 的正态分布范围内。 2) 让每个规整后所有参数在训练过程中学习到对应的两个调节因子 γ 和β, 对标准化后的值进行微调, 使之更适于梯度下降。
Figure 773770DEST_PATH_IMAGE021
(1)
其中,a i代表输入的每个通道的特征图,并且
Figure 342154DEST_PATH_IMAGE022
u
Figure 948585DEST_PATH_IMAGE023
分别为均值和方差;γ i β i 是每个通道特征图所对应的两个调节因子,并且γ i 为特征图的通道i的权重。
在一个应用场景中,γ可以视为BN层特征图每一个通道的权重, 如果当前输入的通道C i 对应的权重γ i 出现γ i =0或γ i ≈0的情况,则会有γ i ×τ=0,特征图对应的输出通道即全为常数 0,不会再对深度学习的运算产生影响。因此,本发明实施例利用BN层中的缩放因子γ衡量特征图每个通道的重要性,当γ i =0 或者γ i ≈0时,即可剪去γ i 对应特征图的通道,最终剪去γ=0对应的上下卷积层的卷积核,以此完成减少计算量和缩小模型体积的任务。然而,在基础训练之后神经网络中的γ值通常呈正态分布, 并不会存在很多参数等于或者靠近0。因此,本发明实施例在训练网络的同时减小γ,即为稀疏化训练。通常使用L1 次梯度法稀疏每个BN层的γ值,如式 (2) 所示:
Figure 565511DEST_PATH_IMAGE024
(2)
其中,u代表损失函数的学习率;
Figure 449154DEST_PATH_IMAGE025
代表稀疏训练中原始损失函数的梯度,其 可以从损失的反向传播中得出;η为超参数,决定带L1正则化项的次梯度法的每次梯度下降 大小,该η应在10-5~10-4之间取得;
Figure 798226DEST_PATH_IMAGE026
决定带L1正则化项的次梯度法的损失 方向,另外,γ的下标表示更新的意思,即将上一次得到的数值
Figure 767320DEST_PATH_IMAGE027
放入公式更新后得到 下一次的数值
Figure 109308DEST_PATH_IMAGE028
,其更新次数一般为几万次,主要取决于参数设置和数据量等因素。
实施例五
在实施例四的基础上,本实施还可以包括以下内容:
所述模型微调为:经过剪枝后的模型,精度和性能会有所下降,可以对剪枝后的模型参数通过训练进行微调后得到新的模型,并将新的模型在测试样本集上进行测试,直到精度达到最优。
本发明实施例可以解决针对使用巡检机器人进行目标检测过程中,存在模型体积大(约为246.4MB),参数多(约为61.5M),前向推断(问题的解决方案通常包括初始数据和事实以便得出解决方案。这些未知的事实和信息用于推断结果。当解决方案采用这种推理方式时,则称为前向推断)耗时长的问题。具体的,本发明经过剪枝后模型的参数量、模型大小降为原来的1/6 ,FLOPs(卷积层浮点数操作计算量)降为原来的1/3,前向推断的速度可以提高至原来的3倍,同时本发明实施例还可以保持mAP(mean Average Precision,平均精度均值)基本不变。在机房机器人采用本发明实施例剪枝后的监测模型时,可以提高目标检测的实时性,并且缩短机房监控的响应时间。
实施例六
参见图4所示,在上述实施例的基础上,本发明实施例还提供了一种机房机器人巡检系统400,其包括:
采集模块401,其用于采集若干目标图片,并将若干目标图片分为训练样本集和测试样本集;
基础训练模块402,其用于对训练样本集中的目标图片进行迭代训练输出基础训练深度学习模型;
稀疏模块403,其用于通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性;
剪枝模块404,其用于删除低重要性的组件,并输出剪枝模型;
微调评估模块405,其用于对剪枝模型进行微调,并通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求;
巡检模块406,其用于基于满足预设要求的模型对机房巡检中采集的若干待检测的目标图片进行检测并输出巡检结果。
实施例七
参见图5所示,本实施例还提供一种电子设备500,所述电子设备500,包括:至少一个处理器501;以及,与所述至少一个处理器501通信连接的存储器502;其中,
所述存储器502存储有可被所述一个处理器501执行的指令,所述指令被所述至少一个处理器501执行,以使所述至少一个处理器501能够执行如上实施例所述的方法步骤。
实施例八
本公开实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行如上实施例所述的方法步骤。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(AN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
以上介绍了本发明的较佳实施方式,旨在使得本发明的精神更加清楚和便于理解,并不是为了限制本发明,凡在本发明的精神和原则之内,所做的修改、替换、改进,均应包含在本发明所附的权利要求概括的保护范围之内。

Claims (7)

1.一种机房机器人巡检方法,其特征在于,包括以下步骤:
在预设目标的坐标位置采集若干目标图片,并将若干目标图片分为训练样本集和测试样本集;
对训练样本集中的目标图片进行迭代训练输出基础训练深度学习模型;
通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性,删除低重要性的组件,并输出剪枝模型,具体包括:
-通过减小基础训练深度学习模型的神经网络权重,以使得基础训练深度学习模型一半以上的神经网络权重等于或约等于0;
-剪去等于或约等于0的神经网络权重对应特征图的通道,以及等于0的神经网络权重对应的上下卷积层的卷积核,并输出剪枝模型;
对剪枝模型进行微调,并通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求;
基于满足预设要求的模型对机房巡检中采集的若干待检测的目标图片进行检测并输出巡检结果;
其中,所述减小基础训练深度学习模型的神经网络权重包括:通过带L1正则化项的次梯度法减小每个BN层的权重值,其中,BN层为批标准化层;
设减小的权重值为γ,则其公式为:
Figure DEST_PATH_IMAGE001
式中,u为损失函数的学习率;
Figure 522671DEST_PATH_IMAGE002
为原始损失函数的梯度;η为超参数,决定了带L1正则化项的次梯度法的每次梯度下降大小, 并且η取值处于10-5~10-4之间;
Figure DEST_PATH_IMAGE003
决定带L1正则化项的次梯度法的损失方向,γ的下标表示更新的意思,即将上一次得到的数值放入公式更新后得到下一次的数值;
所述输出剪枝模型包括:
将输入特征图中所有参数规整至均值为0, 方差为1的正态分布范围内,其公式如下:
Figure 705391DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
式中,τ为正态变量,u为均值,
Figure 970281DEST_PATH_IMAGE006
为方差,a i 为输入的每个通道的特征图,B代表一个批量大小,它表示批量中包含有多少个样本,H为输入图片的高度,W为输入图片的宽度,l为对应的序号;
使得规整后每个参数在训练过程中学习得到对应的两个调节因子γβ,其公式如下:
Figure DEST_PATH_IMAGE007
式中,
Figure 631069DEST_PATH_IMAGE008
为标准化后的特征图,γ i β i 为特征图对应的两个调节因子。
2.如权利要求1所述的方法,其特征在于,其中在采集若干目标图片后,对采集到的目标图片进行标注,以使得每一所述目标图片上标注有至少一个检测目标窗口、与其对应的目标类别、以及检测的结果。
3.如权利要求2所述的方法,其特征在于,其中所述检测目标窗口为左上角顶点和右下角顶点的两个坐标表示,所述目标类别为根据机房检测需求对目标进行的分类。
4.如权利要求2所述的方法,其特征在于,其中在进行迭代训练时,获取预训练权重,并通过深度学习YOLOv3算法对训练样本集中标注的目标图片进行迭代训练。
5.如权利要求1所述的方法,其特征在于,其中所述组件包括权重和卷积核。
6.如权利要求1所述的方法,其特征在于,其中通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求,具体包括:将测试样本集输入微调后的模型,并将输出的巡检结果与实际的巡检结果进行比对,若测试样本集的比对匹配结果大于95%,则该微调后的模型满足预设要求。
7.一种实施如权利要求1至6任意一项所述方法的机房机器人巡检系统,其特征在于,包括:
采集模块,其用于采集若干目标图片,并将若干目标图片分为训练样本集和测试样本集;
基础训练模块,其用于对训练样本集中的目标图片进行迭代训练输出基础训练深度学习模型;
稀疏模块,其用于通过减小基础训练深度学习模型的神经网络权重以评估基础训练深度学习模型每个组件的重要性;
剪枝模块,其用于删除低重要性的组件,并输出剪枝模型;
微调评估模块,其用于对剪枝模型进行微调,并通过测试样本集评估微调后的模型,以确定微调后的模型是否满足预设要求;
巡检模块,其用于基于满足预设要求的模型对机房巡检中采集的若干待检测的目标图片进行检测并输出巡检结果。
CN202011281344.6A 2020-11-17 2020-11-17 一种机房机器人巡检方法及系统 Active CN112101313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011281344.6A CN112101313B (zh) 2020-11-17 2020-11-17 一种机房机器人巡检方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011281344.6A CN112101313B (zh) 2020-11-17 2020-11-17 一种机房机器人巡检方法及系统

Publications (2)

Publication Number Publication Date
CN112101313A CN112101313A (zh) 2020-12-18
CN112101313B true CN112101313B (zh) 2021-03-19

Family

ID=73785678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011281344.6A Active CN112101313B (zh) 2020-11-17 2020-11-17 一种机房机器人巡检方法及系统

Country Status (1)

Country Link
CN (1) CN112101313B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780342A (zh) * 2021-08-04 2021-12-10 杭州国辰机器人科技有限公司 一种基于自监督预训练的智能检测方法、装置及机器人
CN117058525B (zh) * 2023-10-08 2024-02-06 之江实验室 一种模型的训练方法、装置、存储介质及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108189043B (zh) * 2018-01-10 2021-03-30 北京飞鸿云际科技有限公司 一种应用于高铁机房的巡检方法及巡检机器人系统
CN110598731B (zh) * 2019-07-31 2021-08-20 浙江大学 一种基于结构化剪枝的高效图像分类方法
CN110807514A (zh) * 2019-10-25 2020-02-18 中国科学院计算技术研究所 一种基于lo正则的神经网络剪枝方法
CN110895714A (zh) * 2019-12-11 2020-03-20 天津科技大学 一种YOLOv3的网络压缩方法
CN111192377B (zh) * 2020-01-08 2021-08-27 中国银联股份有限公司 一种图像处理方法及装置

Also Published As

Publication number Publication date
CN112101313A (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN109800736B (zh) 一种基于遥感影像和深度学习的道路提取方法
CN108846835B (zh) 基于深度可分离卷积网络的图像变化检测方法
US10725008B2 (en) Automatic siting for air quality monitoring stations
CN112101313B (zh) 一种机房机器人巡检方法及系统
CN111507370A (zh) 获得自动标注图像中检查标签的样本图像的方法和装置
CN111612002A (zh) 一种基于神经网络的多目标物体运动追踪方法
CN112285807B (zh) 一种气象信息预测方法及装置
CN110751209B (zh) 一种融合深度图像分类和检索的智能台风定强方法
CN110555841B (zh) 基于自注意图像融合和dec的sar图像变化检测方法
CN113033516A (zh) 对象识别统计方法及装置、电子设备、存储介质
CN113255590A (zh) 一种缺陷检测模型训练方法、缺陷检测方法、装置及系统
CN112580780A (zh) 模型训练的处理方法、装置、设备和存储介质
CN107316296A (zh) 一种基于对数变换的遥感图像变化检测方法及装置
CN115953652B (zh) 目标检测网络批归一化层剪枝方法、装置、设备及介质
CN111782978A (zh) 兴趣点数据的处理方法及装置、电子设备、可读介质
CN116777865A (zh) 一种水下裂缝的识别方法、系统、装置及存储介质
CN113240340B (zh) 基于模糊分类的大豆种植区分析方法、装置、设备和介质
CN115861610A (zh) 一种基于改进CondInst的砂石骨料图像的分割处理方法
US11062446B2 (en) Analyzing method for perovskite structure using machine learning
CN114648060A (zh) 基于机器学习的故障信号规范化处理及分类方法
CN113867410A (zh) 一种无人机航拍数据的采集模式识别方法和系统
CN113723536A (zh) 一种电力巡检目标识别方法及系统
CN113408816A (zh) 一种基于深度神经网络的电网灾情评估方法
CN113269678A (zh) 接触网输电线路的故障点定位方法
CN112580781A (zh) 深度学习模型的处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211103

Address after: 200137 floor 1-5, building 14, No. 528, Yanggao North Road, Pudong New Area, Shanghai

Patentee after: Shanghai mengpa Information Technology Co.,Ltd.

Patentee after: Beijing mengpa Xinchuang Technology Co.,Ltd.

Address before: 1110, 1 / F, building a, 98 Guangqu Road, Chaoyang District, Beijing 100022

Patentee before: Beijing mengpa Xinchuang Technology Co.,Ltd.

TR01 Transfer of patent right
CP03 Change of name, title or address

Address after: 200137 room 108, block a, building 8, No. 1879, jiangxinsha Road, Pudong New Area, Shanghai

Patentee after: Shanghai mengpa Intelligent Technology Co.,Ltd.

Patentee after: Beijing mengpa Xinchuang Technology Co., Ltd

Address before: 200137 floor 1-5, building 14, No. 528, Yanggao North Road, Pudong New Area, Shanghai

Patentee before: Shanghai mengpa Information Technology Co.,Ltd.

Patentee before: Beijing mengpa Xinchuang Technology Co., Ltd

CP03 Change of name, title or address