CN111179338A - 一种用于移动供电接收端的轻量化目标定位方法 - Google Patents
一种用于移动供电接收端的轻量化目标定位方法 Download PDFInfo
- Publication number
- CN111179338A CN111179338A CN201911260957.9A CN201911260957A CN111179338A CN 111179338 A CN111179338 A CN 111179338A CN 201911260957 A CN201911260957 A CN 201911260957A CN 111179338 A CN111179338 A CN 111179338A
- Authority
- CN
- China
- Prior art keywords
- receiving end
- power supply
- lightweight
- mobile power
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种用于移动供电接收端的轻量化目标定位方法,包括以下步骤:1)获取可能包含移动供电接收端的图片;2)以Mask RCNN作为目标检测框架的基线模型,分别对Backbone骨干网络和Head部分进行轻量化处理,并且对轻量化处理后的Mask RCNN网络进行自适应通道剪枝;3)将可能包含移动供电接收端的图片作为输入,最终获得移动供电接收端的位置信息。与现有技术相比,本发明具有提高定位效率、减少检测框架的计算量、自适应通道剪枝优化等优点。
Description
技术领域
本发明涉及计算机视觉领域,尤其是涉及一种用于移动供电接收端的轻量化目标定位方法。
背景技术
随着近几年电池续航能力达到瓶颈,而移动设备的供电需求仍在不断增长,无线充电技术由此得到越来越多的关注。RBC(Resonant Beam Charging)远场无线充电技术使用激光作为传输媒介,能实现类似Wifi的随时随地安全、可移动能量传输。
在激光充电开始前,RBC的发射端先定位接收端,即明确往哪个方向传输能量。现有定位方案通过发射激光探测信号遍历扫描,效率较低。而对接收端的定位可以看成目标检测问题,通过深度卷积神经网络解决。但RBC发射端作为嵌入式设备,存在算力、功耗方面的限制,因此高性能的神经网络无法直接进行有效的计算和应用。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种用于移动供电接收端的轻量化目标定位方法。
本发明的目的可以通过以下技术方案来实现:
一种用于移动供电接收端的轻量化目标定位方法,包括以下步骤:
1)获取可能包含移动供电接收端的图片;
2)以Mask RCNN作为目标检测框架的基线模型,分别对Backbone骨干网络和Head部分进行轻量化处理,并且对轻量化处理后的Mask RCNN网络进行自适应通道剪枝;
3)将可能包含移动供电接收端的图片作为输入,最终获得移动供电接收端的位置信息。
所述的步骤2)中,对Backbone骨干网络进行轻量化处理,骨干网络的前向过程具体为:
21)骨干网络经过5个卷积stage,提取包含图片高维特征且大小不同的特征图;
22)在FPN结构中将5个不同尺度的特征图进行特征融合,分别输入RPN层提取可能存在接收端的区域;
23)根据score值对RNP输出区域进行排序,选出500个候选区域。
所述的步骤21)中,在卷积stage提取特征图的过程中,通过增加深度可分离卷积将两次3*3卷积替换为两次3*3的DW卷积和1*1的PW卷积。
Backbone骨干网络采用34层ResNet网络。
所述的步骤2)中,对Head部分进行轻量化处理具体为:
24)通过增加Large Separable Convolution将候选区域的特征图缩放为10个通道,再将特征图输入到全连接层;
25)全连接层后接sofmax类别分类器和定位框回归,输出目标的类别和位置;
26)将所有目标框做非极大值抑制后处理。
所述的全连接层的数量为1.
所述的步骤24)中,在Head部分的RoI pooling前,通过采用一个1*N和N*1的分离卷积计算,将特征图缩放到10个通道。
所述的步骤2)中,自适应通道剪枝具体为:
首先以BN层的γ系数作为通道重要性的判断指标,按照γ值从小到大排序,每次从前往后删除一定比例,包括30%、20%、10%和5%,删除通道后微调,若网络准确度下降程度在10%以内,则继续下一个循环,若网络准确度下降程度超过10%,则返回删除前,重新删除更少比例的通道,当已经达到删除比例的最小值,即5%,则通道剪枝结束。
与现有技术相比,本发明具有以下优点:
本发明研究了远距离充电场景中的接收端定位问题,提出轻量化的目标检测框架,提高了接收端定位效率,相比于传统的微波定位、声波定位等方法,基于目标检测的定位方案只需确保发射端有摄像头,不需要在接收端增加多余设备,准确度依赖于深度学习算法而不用担心硬件误差,适用于远距离无线充电的轻量化目标检测方案同样也适用于各种嵌入式设备场景,将有效扩展人工智能的应用场景,具体为:
(1)应用层面,本专利将深度学习与远距离充电场景结合,提高了对待充电接收端的定位效率,且本专利的轻量化检测框架适用于嵌入式场景,长远来看具有重要实用意义。
(2)网络结构方面,设计了轻量化的目标检测框架,针对目标检测中每个候选区域庞大的全连接层计算,设计了一种将计算量前置而候选区域做池化计算的轻量化结构,借鉴深度可分离卷积方法,进一步减少检测框架的计算量。
(3)网络压缩方面,训练完成后的网络仍然存在通道冗余,因此本专利删去部分不重要的通道,然后fine tune微调网络,针对现有通道裁剪方案中不确定每次删除多少以及循环多少次的问题,提出了给出自适应通道剪枝的优化方案。
附图说明
图1a为现有的Head结构。
图1b为本发明的轻量化Head结构。
图2a为现有的残差结构。
图2b为本发明的轻量化残差结构。
图3为自适应通道剪枝流程。
图4为本发明采用的轻量化Mask-RCNN网络结构。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
本发明提供了一种用于移动供电接收端的轻量化目标定位方法。通过自适应通道裁剪的模型压缩方法,能有效删去卷积网络框架中的通道冗余,尽可能减少模型的参数量和计算量。另一方面采用了深度可分离卷积方法,从结构上减少卷积运算需要的浮点运算数,降低了模型空间存储大小,也提高了模型运行的时间效率。此外,本专利通过优化候选区域的特征提取顺序,避免了现有目标检测框架中多个候选区域逐个经过厚重的全连接层计算的问题,让模型进一步轻量化。
目标检测模型的训练数据包括自制的4000张手机图片和COCO数据集。模型首先在COCO数据集上训练拟合,然后按照迁移学习的思想在手机数据集上fine tune微调。
本专利采用的目标检测算法的基础框架使用了Mask RCNN,也可以是其他检测框架,如Faster RCNN或者RetinaNet。本发明的定位方法包括以下步骤:
1)骨干网络ResNet-34经过5个卷积stage,提取包含图片高维特征的特征图;
2)5个stage不同尺度的特征图融合特征,分别进入RPN层提取可能存在接收端的区域;
3)对RNP输出区域排序,选出500个候选区域,再将对应的特征图输入到全连接层;
4)全连接层接类别分类器和定位框回归,输出目标类别和位置;
5)将所有目标框做非极大值抑制后处理,完善得到最终结果。
如图4所示,在以Mask RCNN为基线模型的基础上,增加轻量化检测结构、轻量化骨干网络和自适应通道剪枝。下文对各个部分的可选设计方案进行细分和详述。
A.轻量化Head结构
本专利的目标检测框架以Mask RCNN为基线模型。Mask RCNN的检测流程可以分为两部分:用于特征提取的Backbone骨干部分和计算类别、位置信息的Head特征计算头部。Head部分输入一个可能存在目标区域的特征图,经过RoI pooling和Global pooling,然后连3个全连接层,接sofmax分类器得到类别标签,接回归器得到位置信息。问题在于Head部分可能会输入500多个特征图,计算量庞大。
本专利针对Head部分的庞大计算量,提出了轻量化Head结构设计:在RoI pooling前,用一个1*N和N*1的分离卷积计算,把特征图缩放到10个通道,大大减少通道数。然后在对每个候选区域做RoI pooling,固定大小,通道是10。然后接一个全连接层,同样是softmax分类器得到类别标签,回归器得到位置信息。由于在当前测试环境下接收端主要以手机为主,因此特征图直接放缩到了10个,不影响模型的准确率,同时大大减少了传统Head中多个全连接层带来的运算量。
B.轻量化骨干网络
ResNet作为经典的深度卷积神经网络,活跃在目标检测、目标分割和目标识别领域,是近些年最常用的Backbone之一。ResNet的核心是残差结构,通过恒等映射,解决了神经网络的退化问题,一举将网络深度提升到了100层以上。通过堆叠残差结构,ResNet有34层、50层、101层和152层四种经典结构。但如此深的网络在资源有限的嵌入式设备中无法发挥原有的效果,因此本专利的目标检测框架以结合了深度可分离卷积(DepthwiseSeparable Convolution)的轻量化ResNet为基础骨干网络。
深度可分离卷积借鉴自MobileNet,由DW卷积与PW卷积组成。常规的卷积操作每次卷积操作会计算所有通道的参数,而DW卷积每个卷积核只计算一个通道的参数,大大减少了计算量。经过DW卷积的特征图再通过一个1*1的PW卷积,将通道特征融合。
修改ResNet的残差结构,保持原本的恒等连接不变,保留ReLU激活层和BN批量归一化层,优化结构:把两次3*3卷积替换为两次3*3的DW卷积和1*1的PW卷积。粗略计算,模型的计算量减少到原来的九分之一。
C.自适应通道剪枝
本专利的目标检测框架以通道剪枝作为模型的后处理压缩方案。剪枝是模型训练完成后最常用的压缩方法,核心思想是删去权重矩阵中相对不重要的权值,然后再finetune微调网络。该过程通常是循环的,微调之后可以继续删除不重要的权值,再进入微调。通道裁剪是当下卷积神经网络剪枝的主流做法。
本专利的自适应通道剪枝过程:
1)网络完成训练之后,进入通道剪枝流程;
2)根据每个通道对应的BN层的γ缩放因子作为通道重要程度的衡量标准,按照γ值将通道按从小到大排序;
3)删除排序靠前的、相对不重要的通道,如64个通道减少为40个通道;
4)删除通道后对网络微调,如果网络准确度下降程度在可接受范围,则继续下一个循环;
5)如果准确度下降程度不能接受,则回到删除前,删除更少比例的通道,如果到达删除比例的最小值,则跳出循环,通道剪枝结束。
本专利针对RPN层输出区域分别进入厚重的全连接层计算的问题,将这部分的计算统一归纳到一个全连接层中,减少通道数,后面只接一个计算量很小的全连接层。这部分实现的结构图如1b所示。
本专利所述的轻量化骨干网络使用在ResNet-34基础上使用深度可分离卷积和1*1点积将通道信息充分融合。ResNet-34中的轻量化残差结构设计如图2b所示。
如图3所示,本专利公开的通道裁剪方法首先以BN层的γ系数作为通道重要性的判断指标。按照γ值从小到大排序,每次从前往后删除一定比例,包括30%,20%,10%和5%。删除通道后微调,如果网络准确度下降程度10%以内,则继续下一个循环;如果准确度下降程度超过10%,则回到删除前,重新删除更少比例的通道,如果已经是定义下删除比例的最小值,即5%,则跳出循环,通道剪枝结束。
综上所述,本申请提出的轻量化接收端定位方案能有效地在嵌入式设备上运行,针对远距离无线充电场景,在无线充电的发射端增加摄像头以获取图片,经过轻量化检测算法得到接收端位置,从而提高发射端与接收端配对的效率。
以上所述,仅是本申请的一个实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。
Claims (8)
1.一种用于移动供电接收端的轻量化目标定位方法,其特征在于,包括以下步骤:
1)获取可能包含移动供电接收端的图片;
2)以Mask RCNN作为目标检测框架的基线模型,分别对Backbone骨干网络和Head部分进行轻量化处理,并且对轻量化处理后的Mask RCNN网络进行自适应通道剪枝;
3)将可能包含移动供电接收端的图片作为输入,最终获得移动供电接收端的位置信息。
2.根据权利要求1所述的一种用于移动供电接收端的轻量化目标定位方法,其特征在于,所述的步骤2)中,对Backbone骨干网络进行轻量化处理,骨干网络的前向过程具体为:
21)骨干网络经过5个卷积stage,提取包含图片高维特征且大小不同的特征图;
22)在FPN结构中将5个不同尺度的特征图进行特征融合,分别输入RPN层提取可能存在接收端的区域;
23)根据score值对RNP输出区域进行排序,选出500个候选区域。
3.根据权利要求2所述的一种用于移动供电接收端的轻量化目标定位方法,其特征在于,所述的步骤21)中,在卷积stage提取特征图的过程中,通过增加深度可分离卷积将两次3*3卷积替换为两次3*3的DW卷积和1*1的PW卷积。
4.根据权利要求2所述的一种用于移动供电接收端的轻量化目标定位方法,其特征在于,Backbone骨干网络采用34层ResNet网络。
5.根据权利要求3所述的一种用于移动供电接收端的轻量化目标定位方法,其特征在于,所述的步骤2)中,对Head部分进行轻量化处理具体为:
24)通过增加Large Separable Convolution将候选区域的特征图缩放为10个通道,再将特征图输入到全连接层;
25)全连接层后接sofmax类别分类器和定位框回归,输出目标的类别和位置;
26)将所有目标框做非极大值抑制后处理。
6.根据权利要求5所述的一种用于移动供电接收端的轻量化目标定位方法,其特征在于,所述的全连接层的数量为1。
7.根据权利要求5所述的一种用于移动供电接收端的轻量化目标定位方法,其特征在于,所述的步骤24)中,在Head部分的RoI pooling前,通过采用一个1*N和N*1的分离卷积计算,将特征图缩放到10个通道。
8.根据权利要求1所述的一种用于移动供电接收端的轻量化目标定位方法,其特征在于,所述的步骤2)中,自适应通道剪枝具体为:
首先以BN层的γ系数作为通道重要性的判断指标,按照γ值从小到大排序,每次从前往后删除一定比例,包括30%、20%、10%和5%,删除通道后微调,若网络准确度下降程度在10%以内,则继续下一个循环,若网络准确度下降程度超过10%,则返回删除前,重新删除更少比例的通道,当已经达到删除比例的最小值,即5%,则通道剪枝结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911260957.9A CN111179338B (zh) | 2019-12-10 | 2019-12-10 | 一种用于移动供电接收端的轻量化目标定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911260957.9A CN111179338B (zh) | 2019-12-10 | 2019-12-10 | 一种用于移动供电接收端的轻量化目标定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111179338A true CN111179338A (zh) | 2020-05-19 |
CN111179338B CN111179338B (zh) | 2023-08-04 |
Family
ID=70650128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911260957.9A Active CN111179338B (zh) | 2019-12-10 | 2019-12-10 | 一种用于移动供电接收端的轻量化目标定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111179338B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860472A (zh) * | 2020-09-24 | 2020-10-30 | 成都索贝数码科技股份有限公司 | 电视台标检测方法、系统、计算机设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108898087A (zh) * | 2018-06-22 | 2018-11-27 | 腾讯科技(深圳)有限公司 | 人脸关键点定位模型的训练方法、装置、设备及存储介质 |
WO2019144575A1 (zh) * | 2018-01-24 | 2019-08-01 | 中山大学 | 一种快速行人检测方法及装置 |
-
2019
- 2019-12-10 CN CN201911260957.9A patent/CN111179338B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019144575A1 (zh) * | 2018-01-24 | 2019-08-01 | 中山大学 | 一种快速行人检测方法及装置 |
CN108898087A (zh) * | 2018-06-22 | 2018-11-27 | 腾讯科技(深圳)有限公司 | 人脸关键点定位模型的训练方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
HAO LI等: "Lightweight Mask R-CNN for Long-Range Wireless Power Transfer Systems" * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860472A (zh) * | 2020-09-24 | 2020-10-30 | 成都索贝数码科技股份有限公司 | 电视台标检测方法、系统、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111179338B (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110619385B (zh) | 基于多级剪枝的结构化网络模型压缩加速方法 | |
Luo et al. | Thinet: A filter level pruning method for deep neural network compression | |
CN110516536B (zh) | 一种基于时序类别激活图互补的弱监督视频行为检测方法 | |
US10740593B1 (en) | Method for recognizing face using multiple patch combination based on deep neural network with fault tolerance and fluctuation robustness in extreme situation | |
CN111461322B (zh) | 一种深度神经网络模型压缩方法 | |
US20200279156A1 (en) | Feature fusion for multi-modal machine learning analysis | |
US20150134583A1 (en) | Learning apparatus, learning program, and learning method | |
CN103927531B (zh) | 一种基于局部二值和粒子群优化bp神经网络的人脸识别方法 | |
CN111600851A (zh) | 面向深度强化学习模型的特征过滤防御方法 | |
CN108629291B (zh) | 一种抗网格效应的人脸深度预测方法 | |
CN116229295A (zh) | 基于融合卷积注意力机制的遥感图像目标检测方法 | |
CN113283426B (zh) | 基于多目标神经网络搜索的嵌入式目标检测模型生成方法 | |
CN109635661B (zh) | 一种基于卷积神经网络的远场无线充电接收目标检测方法 | |
CN113239784A (zh) | 一种基于空间序列特征学习的行人重识别系统及方法 | |
CN113837376B (zh) | 基于动态编码卷积核融合的神经网络剪枝方法 | |
CN111460980A (zh) | 基于多语义特征融合的小目标行人的多尺度检测方法 | |
CN111476248A (zh) | 利用用于识别图像的1x1卷积的CNN方法及装置 | |
CN115330620A (zh) | 一种基于循环生成对抗网络的图像去雾方法 | |
US20230252294A1 (en) | Data processing method, apparatus, and device, and computer-readable storage medium | |
CN113255479A (zh) | 轻量化人体姿态识别模型训练方法、动作切分方法及装置 | |
CN106126668A (zh) | 一种基于哈希重建的图像特征点匹配方法 | |
CN111179338A (zh) | 一种用于移动供电接收端的轻量化目标定位方法 | |
CN114973071A (zh) | 基于长短期时序特征的无监督视频目标分割方法及系统 | |
CN114742221A (zh) | 深度神经网络模型剪枝方法、系统、设备及介质 | |
CN117421657A (zh) | 一种基于过采样策略的带噪标签样本筛选学习方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |