CN109711382A

CN109711382A - 一种基于深度学习的可视化定位方法

Info

Publication number: CN109711382A
Application number: CN201910011058.9A
Authority: CN
Inventors: 高俊山; 徐海兵; 张玉双
Original assignee: Harbin University of Science and Technology
Current assignee: Harbin University of Science and Technology
Priority date: 2019-01-07
Filing date: 2019-01-07
Publication date: 2019-05-03

Abstract

本发明公开了一种基于深度学习的可视化定位方法，包括以下步骤：A、选择ResNet_34网络模型作为研究对象，并对ResNet_34网络模型进行合适的改进；B、对三维图像进行预处理，得到提取后的图像；C、改进模型关于图像分类和物体检测的算法，提高分类和检测物体的准确度；D、改进网络关于物体定位的算法，采用热力图成像达到定位效果；E、采用DPN双通道网络和基本聚类的算法改进ResNet_34网络模型，提高定位的准确度；本发明采用的定位方法能够提高图像的可视化定位效果，而且定位速度快，准确度高。

Description

一种基于深度学习的可视化定位方法

技术领域

本发明属于图像处理及可视化定位技术领域，具体为一种基于深度学习的可视化方法。

背景技术

可视化（Visualization）是利用计算机图形学和图像处理技术，将数据转换成图形或图像在屏幕上显示出来，并进行交互处理的理论、方法和技术。它涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域，成为研究数据表示、数据处理、决策分析等一系列问题的综合技术。定位可以理解为计算机视觉通过对卷积神经网络的feature map后的Global Average Pooling（GAP）层，把那些用于Softmax分类但却已经失去spatial信息的一维特征向量在各个类别上的response映射回带有spatial信息的feature map上去可以辨识出图像的主要目标：图片中物体的突出特征区域，并进行定位。通过深度学习技术使计算机能够分析出一幅图片或者一段视频中的物体的突出特征，这一可视化定位技术在计算机视觉中具有突破性意义，使计算机具有了分析判断主体的功能，并使计算机视觉变得更加智能。

发明内容

本发明的目的在于提供一种基于深度学习的可视化定位方法，该方法设计过程简单清晰，并且能取得良好的定位效果。

本发明采用如下技术方案：

一种基于深度学习的可视化定位方法,其特征在于：具体包括以下步骤：

A、选择ResNet_34网络模型作为研究对象，并对ResNet_34网络模型进行合适的改进；

B、对三维图像进行预处理，得到提取后的图像；

C、改进模型关于图像分类和物体检测的算法，提高分类和检测物体的准确度；

D、改进网络关于物体定位的算法，采用热力图成像达到定位效果；

E、采用DPN双通道网络和基本聚类的算法改进ResNet_34网络模型，提高定位的准确度。

作为一种优选的实施方式，步骤A所述的对ResNet_34网络模型改进方法如下：

去掉ResNet_34网络模型的最后一层，并用transfer layer和Pooling layer替代。

作为一种优选的实施方式，步骤B所述的对三维图像进行预处理方法如下：

a、对于色偏、过饱和或饱和度不足的彩色图像，采用PIL工具中的ImageEnhance模块，进行色彩平衡调整、亮度调整、对比度调整；

b、使用高斯滤波器，滤波模板核尺寸设置为3×3，再一次滤除噪声，平滑图像。

作为一种优选的实施方式，步骤C所述的改进模型关于图像分类和物体检测的算法方法如下：

a、采用迁移学习算法对图像分类和物体检测算法进行改进；

b、采用sigmoid激活函数，增强网络模型的非线性，提高网络模型的训练速度；

c、采用Batchnorm对数据做归一化，不仅能提升模型训练速度，大大加快收敛速度，还能增加分类效果。

作为一种优选的实施方式，步骤E所述的改进网络关于物体定位的算法如下：

a、在ResNeXt算法的基础上引入了DenseNet的核心内容，使得模型对特征的利用更加充分；

b、采用互熵损失（cross-entropy cost function）函数，增强网络模型的鲁棒性；

c、采用dropout作用在layer上面，降低节点之间的耦合度，使节点对于其他节点不再那么敏感，实现更好的模型正则化。

作为一种优选的实施方式，步骤E之后设置有步骤F：通过caffe框架、python程序、opencv视觉工具，仿真出相应的热力图来定位物体的突出特征，并能够尽可能多的定位目标区域；将改进后的ResNet_34网络模型放入到ImageNet测试定位的准确度。

与现有技术相比，本发明的有益效果是：

（1）本发明采用的图像预处理方法，具有实现复杂度低、降噪性能好的特点；

（2）本发明采用的分类方法能够提高图像的分类效果，而且分类精度高，有效的提高了分类准确性；

（3）本发明采用DPN双通道网络和基本聚类的算法改进ResNet_34网络模型，降低成本，提高定位的准确度；

（4）本发明采用热力图成像达到定位效果。

附图说明

图1为本发明流程图。

图2为残差网络的基本组成结构图。

图3为可视化定位效果图。

具体实施方式

下面将结合本发明实例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种技术方案：一种基于深度学习的可视化定位方法,包括以下步骤：

B、对三维图像进行预处理，得到提取后的图像；

本发明中，步骤A中对ResNet_34网络模型改进方法如下：

本发明中，步骤B中对三维图像进行预处理方法如下：

本发明采用的图像预处理方法能够实现对原始图像数据的降噪，具有实现复杂度低、降噪性能好的特点。

本发明中，步骤C中改进模型关于图像分类和物体检测的算法方法如下：

a、采用迁移学习算法对图像分类和物体检测算法进行改进；

c、采用Batchnorm对数据做归一化，不仅能提升模型训练速度，大大加快收敛速度，还能增加分类效果；

d、探索模型对其他数据集的泛化能力，只需重新训练softmax分类器。

本发明采用的分类方法能够提高图像的分类效果，而且分类精度高，有效的提高了分类准确性。

本发明中，步骤E中改进网络关于物体定位的算法如下：

本发明中，步骤E之后设置有步骤F：通过caffe框架、python程序、opencv视觉工具，仿真出相应的热力图来定位物体的突出特征，并能够尽可能多的定位目标区域；将改进后的ResNet_34网络模型放入到ImageNet测试定位的准确度。

本发明采用DPN双通道网络和基本聚类的算法改进ResNet_34网络模型，降低成本，提高定位的准确度，并采用热力图成像达到定位效果。

综上所述，本发明采用的定位方法能够提高图像的可视化定位效果，而且定位速度快，准确度高。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于深度学习的可视化定位方法,其特征在于：包括以下步骤：

A、选择ResNet_34_34网络模型作为研究对象，并对ResNet_34网络模型进行合适的改进；

B、对三维图像进行预处理，得到提取后的图像；

2.根据权利要求1所述的一种基于深度学习的可视化定位方法，其特征在于：所述步骤A中对ResNet_34网络模型改进方法如下：

3.根据权利要求1所述的一种基于深度学习的可视化定位方法，其特征在于：所述步骤B中对三维图像进行预处理方法如下：

4.根据权利要求1所述的一种基于深度学习的可视化定位方法，其特征在于：所述步骤C中改进模型关于图像分类和物体检测的算法方法如下：

a、采用迁移学习算法对图像分类和物体检测算法进行改进；

5.根据权利要求1所述的一种基于深度学习的可视化定位方法，其特征在于：所述步骤E中改进网络关于物体定位的算法如下：

6.根据权利要求1所述的一种基于深度学习的可视化定位方法，其特征在于：所述步骤E之后设置有步骤F：通过caffe框架、python程序、opencv视觉工具，仿真出相应的热力图来定位物体的突出特征，并能够尽可能多的定位目标区域；将改进后的ResNet_34网络模型放入到ImageNet测试定位的准确度。