CN111612803B - 一种基于图像清晰度的车辆图像语义分割方法 - Google Patents

一种基于图像清晰度的车辆图像语义分割方法 Download PDF

Info

Publication number
CN111612803B
CN111612803B CN202010363326.6A CN202010363326A CN111612803B CN 111612803 B CN111612803 B CN 111612803B CN 202010363326 A CN202010363326 A CN 202010363326A CN 111612803 B CN111612803 B CN 111612803B
Authority
CN
China
Prior art keywords
semantic segmentation
definition
image
backbone network
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010363326.6A
Other languages
English (en)
Other versions
CN111612803A (zh
Inventor
颜成钢
沈少强
孙垚棋
张继勇
张勇东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202010363326.6A priority Critical patent/CN111612803B/zh
Publication of CN111612803A publication Critical patent/CN111612803A/zh
Application granted granted Critical
Publication of CN111612803B publication Critical patent/CN111612803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像清晰度的车辆图像语义分割方法。本发明设计了一个清晰度判别模块,并将结果导入总的损失函数中,实现更加精确的分割效果,具体实现如下:步骤1、采用Tenengrad函数来对输入的车辆图像进行清晰度判定;步骤2、采用DeepLab V3+作为语义分割主干网络进行训练;步骤3、用训练完的网络输出语义分割结果。本发明对于清晰度做出判定,根据判别结果,本发明设计了相应的损失函数LD,并将其加入到语义分割主干网络的损失函数中,从而使网络具有判别车辆图像清晰度的能力,增加了网络对车辆图像语义分割的针对性,提高语义分割主干网络的分割精度。

Description

一种基于图像清晰度的车辆图像语义分割方法
技术领域
本发明属于计算机视觉技术领域,具体涉及基于深度学习的语义分割技术,针对车辆图像这一特定类别,结合图像清晰度获得更高精确度的语义分割结果。
背景技术
图像语义分割技术作为计算机视觉领域经典和基础研究课题,不仅应用广泛,在场景解析、自动驾驶、人机交互、图像搜索引擎等领域具有重要意义,而且对于后续处理图像内容将产生直接影响,所以一直以来,图像语义分割技术都是计算机视觉领域最为活跃的一部分,许多研究人员先后对此做出巨大贡献。
图像语义分割是从像素水平,识别、理解并区分图像中的内容,对图像中的每一个像素点予以相应的类别,因此也可以将之视为密集预测问题,这是一项富有挑战性和意义的课题。
传统的语义分割主要有两大类,基于非监督的分割方法和基于概率图模型的分割方法。基于非监督的分割方法通常依靠提取图片的低级特征,检测一致的区域或区域的边界,从而获得分割的结果,但分割的结果没有语义的标注,因此不能算作严格意义上的语义分割。基于概率图的分割方法则是利用参数统计方法,基于几个简单的特征对图像进行过渡分割,然后使用马尔可夫随机场(MRF)方法,对每个像素点进行分类,选取概率高的作为分类类别。
随着计算机算力的提升,深度学习取得了突飞猛进的发展,研究人员逐步将深度学习引入到图像语义分割领域中,取得了卓越的成果。在这一过程中,Long等人在2015年提出的全卷积神经网络FCN(Fully ConvolutionalNetwork)无疑是当中的开山之作,该模型创新性地将深度卷积神经网络最后的全连接层替换为卷积层,实现对任意大小的输入图像进行语义分割,形成了端到端、像素点到像素点的网络框架,从此语义分割进入崭新的时代,越来越多基于FCN的分割网络被提出。BadrinarayananV等人提出的SegNet网络,在进行池化操作时存储最大池化索引,解码器使用在相应编码器的最大池化索引来执行非线性上采样,上采样的特征图是稀疏的,然后与可训练的滤波器卷积以生成密集的特征图,在减少计算量的同时提高了分割的准确率。Chen等人则先后发表了DeepLab系列论文,先后引入了膨胀卷积、空间金字塔池化等模块,在保留输入图像信息的同时结合多尺度的特征图,从而实现更好的分割效果。
本发明针对监控系统下的车辆图像,根据获得图像的清晰度,结合语义分割主干网络的训练过程,生成更加适合监控系统的车辆图像分割网络。
发明内容
本发明针对现有技术的不足,提供一种基于图像清晰度的车辆图像语义分割方法。本发明针对监控系统获得车辆图像进行图像语义分割,由于监控系统下,车辆处于运动状态,获得的车辆图像可能会出现不同程度的模糊,从而给分割带来较大误差,导致后续识别、追踪等操作难以进行。针对可能会出现的因运动导致的车辆图像模糊,本发明设计了一个清晰度判别模块,并将结果导入总的损失函数中,实现更加精确的分割效果。
本发明解决其技术问题所采用的技术方案如下:
步骤1、设计清晰度判别模块:
本发明采用Tenengrad函数来对输入的车辆图像进行清晰度判定,Tenengrad函数采用Sobel算子分别提取水平和垂直方向的梯度值,基于Tenengrad函数的图像清晰度D(f)定义为:
D(f)=∑yx|G(x,y)| (1)
其中,G(x,y)的表达如下:
其中,Gx(x,y)是像素点(x,y)处于Sobel水平方向边缘检测算子gx的卷积,Gy(x,y)是像素点(x,y)处于Sobel垂直方向边缘检测算子gy的卷积,算子gx和gy分别为:
根据清晰度判别模块计算所得的D(f),设计清晰度损失函数LD如下:
LD=-logD(f) (5)
再将清晰度损失函数LD加入语义分割主干网络的损失函数中,共同作用于网络训练过程。
步骤2、语义分割主干网络训练
本发明采用DeepLabV3+作为语义分割主干网络,将输入图像沿语义分割主干网络依次进行下采样、池化操作,得到高分辨率特征图;将得到的高分辨率特征图分别进行不同比例的膨胀卷积(分别为6,12,18,24),再经过空间金字塔池化模块,以concatenate操作将所得的不同比例膨胀卷积下的特征图拼接在一起,从而融合多尺度的上下文信息,最后经过卷积操作得到最终的预测结果;对预测结果进行上采样,从而得到与原输入图像大小一致的高精度像素级语义分割结果图。
步骤3、输出语义分割结果
网络训练完成后,得到针对监控系统下获得的车辆图像的语义分割网络,对于给定输入测试图像,经过该语义分割网络,在清晰度判别模块和语义分割主干网络的共同作用下,能够得到输入图像的高精度像素级语义分割结果图。从而为后续的相关操作提供可能。
本发明的有益效果:
本发明提出了一种基于图像清晰度的车辆图像语义分割方法,针对监控系统下的车辆图像可能会存在的模糊问题,从而导致语义分割精度不高,设计了一种清晰度判别模块,对于清晰度做出判定,根据判别结果,本发明设计了相应的损失函数LD,并将其加入到语义分割主干网络的损失函数中,从而使网络具有判别车辆图像清晰度的能力,增加了网络对车辆图像语义分割的针对性,提高语义分割主干网络的分割精度。
附图说明
图1为本发明的总体流程。
具体实施方式
下面结合附图和实例对本发明做进一步详细说明,但是本发明不局限于该实例。
VeRi是一个城市监控系统下大规模车辆图像的基准数据集,是由20台摄像机在1KM2的城市区域内24小时拍摄而来,包含776辆车的超过50000张图像,车辆图像是在真实世界的无约束监控系统下捕获的,因此具有很高的现实意义,对车辆图像进行人工标注,类别共59种包括背景在内,本实例基于上述发明方法,如图1所示,其步骤如下:
步骤1:数据集处理
从VeRi数据集中选取2000张作为训练图像集,选取1000张图像作为测试图像集,并对训练图像数据集进行数据增强操作,使训练图像的数量增加到10000张。
步骤2:初始化语义分割主干网络
导入DeeepLabV3+网络对应层的参数,对语义分割主干网络进行初始化,加速训练过程中网络收敛所需时间。
步骤3:训练添加有清晰度判别模块的语义分割主干网络;
将输入图像和对应的groundtruth导入到网络中,首先经过清晰度判别模块,对每一张输入图像依次进行如下操作:
D(f)=∑yx|G(x,y)| (1)
其中,(x,y)对应输入图像的每一个像素点,而G(x,y)的计算方式为:
其中,Gx(x,y)是像素点(x,y)处于Sobel水平方向边缘检测算子gx的卷积,Gy(x,y)是像素点(x,y)处于Sobel垂直方向边缘检测算子gy的卷积,算子gx和gy分别为:
将清晰度判别模块计算所得的D(f)作为清晰度损失函数导入到总损失函数中:
LD=-logD(f) (5)
将输入车辆图像和groundtruth导入语义分割主干网络,采用随机梯度下降算法优化导入清晰度损失函数后的总损失函数,运用反向传播算法更新语义分割主干网络的参数,直到总损失函数的值不再下降,结束训练。
为了加速语义分割主干网络的收敛,引入参数学习的的学习率,学习率按照如下公式进行变化:
公式(6)中,t为迭代次数,l0为初始学习率,值为0.007,power为动量,值为0.9。
步骤4:对测试图像集进行语义分割
在对测试图像集进行语义分割的过程中,不需要清晰度判别模块,可以将步骤3中所得网络中的清晰度判别模块去掉,简化网络模型用于部署,将测试图像集依次导入简化后的网络中,即可得到高进度的语义分割结果。通过清晰度判别模块,网络对于清晰度做出判定,根据判别结果,本发明设计了相应的损失函数LD,并将其加入到语义分割主干网络的损失函数中,从而使网络具有判别车辆图像清晰度的能力,增加了网络对车辆图像语义分割的针对性,提高语义分割主干网络的分割精度。
上述实例旨在进一步阐述本发明的实施过程,其描述较为具体和详实,但不意味着本发明只有这一种用途,在不脱离本发明构思的前提下,还可以做出若干改进,这些都属于本发明的保护范围。

Claims (3)

1.一种基于图像清晰度的车辆图像语义分割方法,其特征在于包括如下步骤:
步骤1:数据集处理
从VeRi数据集中选取2000张作为训练图像集,选取1000张图像作为测试图像集,并对训练图像数据集进行数据增强操作,使训练图像的数量增加到10000张;
步骤2:初始化语义分割主干网络;
导入DeeepLabV3+网络对应层的参数,对语义分割主干网络进行初始化,加速训练过程中网络收敛所需时间;
步骤3:训练添加有清晰度判别模块的语义分割主干网络;
步骤4:对测试图像集进行语义分割;
步骤3具体实现如下:
将输入图像和对应的groundtruth导入到语义分割主干网络中,首先经过清晰度判别模块,对每一张输入图像依次进行如下操作:
D(f)=∑yx|G(x,y)| (1)
其中,(x,y)对应输入图像的每一个像素点,而G(x,y)的计算方式为:
其中,Gx(x,y)是像素点(x,y)处于Sobel水平方向边缘检测算子gx的卷积,Gy(x,y)是像素点(x,y)处于Sobel垂直方向边缘检测算子gy的卷积,算子gx和gy分别为:
将清晰度判别模块计算所得的D(f)作为清晰度损失函数导入到总损失函数中:
LD=-logD(f) (5)
将输入车辆图像和groundtruth导入语义分割主干网络,采用随机梯度下降算法优化导入清晰度损失函数后的总损失函数,运用反向传播算法更新语义分割主干网络的参数,直到总损失函数的值不再下降,结束训练;
为了加速语义分割主干网络的收敛,引入参数学习的的学习率,学习率按照如下公式进行变化:
公式(6)中,t为迭代次数,l0为初始学习率,值为0.007,power为动量,值为0.9。
2.根据权利要求1所述的一种基于图像清晰度的车辆图像语义分割方法,其特征在于步骤4在对测试图像集进行语义分割的过程中,不需要清晰度判别模块,因此需要将步骤3中所得的语义分割主干网络中的清晰度判别模块去掉,简化语义分割主干网络用于部署,将测试图像集依次导入简化后的语义分割主干网络中,即可得到高进度的语义分割结果。
3.根据权利要求2所述的一种基于图像清晰度的车辆图像语义分割方法,其特征在于采用DeepLabV3+作为语义分割主干网络,将输入图像沿语义分割主干网络依次进行下采样、池化操作,得到高分辨率特征图;将得到的高分辨率特征图分别进行不同比例的膨胀卷积,得到不同比例膨胀卷积下的特征图;再经过空间金字塔池化模块,以concatenate操作将所得的不同比例膨胀卷积下的特征图拼接在一起,从而融合多尺度的上下文信息,最后经过卷积操作得到最终的预测结果;对预测结果进行上采样,从而得到与原输入图像大小一致的高精度像素级语义分割结果图。
CN202010363326.6A 2020-04-30 2020-04-30 一种基于图像清晰度的车辆图像语义分割方法 Active CN111612803B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010363326.6A CN111612803B (zh) 2020-04-30 2020-04-30 一种基于图像清晰度的车辆图像语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010363326.6A CN111612803B (zh) 2020-04-30 2020-04-30 一种基于图像清晰度的车辆图像语义分割方法

Publications (2)

Publication Number Publication Date
CN111612803A CN111612803A (zh) 2020-09-01
CN111612803B true CN111612803B (zh) 2023-10-17

Family

ID=72201222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010363326.6A Active CN111612803B (zh) 2020-04-30 2020-04-30 一种基于图像清晰度的车辆图像语义分割方法

Country Status (1)

Country Link
CN (1) CN111612803B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257623B (zh) * 2020-10-28 2022-08-23 长沙立中汽车设计开发股份有限公司 一种路面清洁度判定和自动清扫方法及自动清扫环卫装置
CN113255500A (zh) * 2021-05-18 2021-08-13 山东交通学院 一种车辆随意变道检测的方法及装置

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850836A (zh) * 2015-05-15 2015-08-19 浙江大学 基于深度卷积神经网络的害虫图像自动识别方法
CN106125246A (zh) * 2016-07-19 2016-11-16 湖北三江航天红峰控制有限公司 一种自寻激光焦平面的方法
CN106548468A (zh) * 2016-10-13 2017-03-29 广州酷狗计算机科技有限公司 图像清晰度的判别方法及装置
CN108446616A (zh) * 2018-03-09 2018-08-24 西安电子科技大学 基于全卷积神经网络集成学习的道路提取方法
CN109558901A (zh) * 2018-11-16 2019-04-02 北京市商汤科技开发有限公司 一种语义分割训练方法及装置、电子设备、存储介质
CN109711413A (zh) * 2018-12-30 2019-05-03 陕西师范大学 基于深度学习的图像语义分割方法
WO2019136623A1 (en) * 2018-01-10 2019-07-18 Nokia Technologies Oy Apparatus and method for semantic segmentation with convolutional neural network
CN110136154A (zh) * 2019-05-16 2019-08-16 西安电子科技大学 基于全卷积网络与形态学处理的遥感图像语义分割方法
KR20190119261A (ko) * 2018-04-12 2019-10-22 가천대학교 산학협력단 멀티 스케일 이미지와 멀티 스케일 확장된 컨볼루션 기반의 완전 컨볼루션 뉴럴 네트워크를 이용한 시맨틱 이미지 세그먼테이션 장치 및 그 방법
US10467500B1 (en) * 2018-12-31 2019-11-05 Didi Research America, Llc Method and system for semantic segmentation involving multi-task convolutional neural network
CN110443818A (zh) * 2019-07-02 2019-11-12 中国科学院计算技术研究所 一种基于涂鸦的弱监督语义分割方法与系统
CN110490884A (zh) * 2019-08-23 2019-11-22 北京工业大学 一种基于对抗的轻量级网络语义分割方法
WO2020003434A1 (ja) * 2018-06-28 2020-01-02 株式会社島津製作所 機械学習方法、機械学習装置、及び機械学習プログラム
CN110675408A (zh) * 2019-09-19 2020-01-10 成都数之联科技有限公司 基于深度学习的高分辨率影像建筑物提取方法及系统
CN110807491A (zh) * 2019-11-05 2020-02-18 上海眼控科技股份有限公司 车牌图像清晰度模型训练方法、清晰度检测方法及装置
CN110826596A (zh) * 2019-10-09 2020-02-21 天津大学 一种基于多尺度可变形卷积的语义分割方法
CN110992365A (zh) * 2019-11-04 2020-04-10 杭州电子科技大学 一种基于图像语义分割的损失函数及其设计方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024351B2 (en) * 2001-08-21 2006-04-04 Microsoft Corporation Method and apparatus for robust efficient parsing
US9916522B2 (en) * 2016-03-11 2018-03-13 Kabushiki Kaisha Toshiba Training constrained deconvolutional networks for road scene semantic segmentation
US10410350B2 (en) * 2017-10-30 2019-09-10 Rakuten, Inc. Skip architecture neural network machine and method for improved semantic segmentation

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850836A (zh) * 2015-05-15 2015-08-19 浙江大学 基于深度卷积神经网络的害虫图像自动识别方法
CN106125246A (zh) * 2016-07-19 2016-11-16 湖北三江航天红峰控制有限公司 一种自寻激光焦平面的方法
CN106548468A (zh) * 2016-10-13 2017-03-29 广州酷狗计算机科技有限公司 图像清晰度的判别方法及装置
WO2019136623A1 (en) * 2018-01-10 2019-07-18 Nokia Technologies Oy Apparatus and method for semantic segmentation with convolutional neural network
CN108446616A (zh) * 2018-03-09 2018-08-24 西安电子科技大学 基于全卷积神经网络集成学习的道路提取方法
KR20190119261A (ko) * 2018-04-12 2019-10-22 가천대학교 산학협력단 멀티 스케일 이미지와 멀티 스케일 확장된 컨볼루션 기반의 완전 컨볼루션 뉴럴 네트워크를 이용한 시맨틱 이미지 세그먼테이션 장치 및 그 방법
WO2020003434A1 (ja) * 2018-06-28 2020-01-02 株式会社島津製作所 機械学習方法、機械学習装置、及び機械学習プログラム
CN109558901A (zh) * 2018-11-16 2019-04-02 北京市商汤科技开发有限公司 一种语义分割训练方法及装置、电子设备、存储介质
CN109711413A (zh) * 2018-12-30 2019-05-03 陕西师范大学 基于深度学习的图像语义分割方法
US10467500B1 (en) * 2018-12-31 2019-11-05 Didi Research America, Llc Method and system for semantic segmentation involving multi-task convolutional neural network
CN110136154A (zh) * 2019-05-16 2019-08-16 西安电子科技大学 基于全卷积网络与形态学处理的遥感图像语义分割方法
CN110443818A (zh) * 2019-07-02 2019-11-12 中国科学院计算技术研究所 一种基于涂鸦的弱监督语义分割方法与系统
CN110490884A (zh) * 2019-08-23 2019-11-22 北京工业大学 一种基于对抗的轻量级网络语义分割方法
CN110675408A (zh) * 2019-09-19 2020-01-10 成都数之联科技有限公司 基于深度学习的高分辨率影像建筑物提取方法及系统
CN110826596A (zh) * 2019-10-09 2020-02-21 天津大学 一种基于多尺度可变形卷积的语义分割方法
CN110992365A (zh) * 2019-11-04 2020-04-10 杭州电子科技大学 一种基于图像语义分割的损失函数及其设计方法
CN110807491A (zh) * 2019-11-05 2020-02-18 上海眼控科技股份有限公司 车牌图像清晰度模型训练方法、清晰度检测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
3D CNN-Based Semantic Labeling Approach for Mobile Laser Scanning Data;Balázs Nagy etal;IEEE Sensors Journal;全文 *
基于DeepLabV3+与超像素优化的语义分割;任凤雷;光学精密工程;全文 *
基于深度学习的语义分割网络;代具亭;汤心溢;刘鹏;;红外(第04期);全文 *

Also Published As

Publication number Publication date
CN111612803A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
CN109543502B (zh) 一种基于深度多尺度神经网络的语义分割方法
CN109190752B (zh) 基于深度学习的全局特征和局部特征的图像语义分割方法
CN113052210B (zh) 一种基于卷积神经网络的快速低光照目标检测方法
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN111639564B (zh) 一种基于多注意力异构网络的视频行人重识别方法
CN112990065B (zh) 一种基于优化的YOLOv5模型的车辆分类检测方法
CN117079139B (zh) 一种基于多尺度语义特征的遥感图像目标检测方法及系统
CN110781850A (zh) 道路识别的语义分割系统和方法、计算机存储介质
CN114202743A (zh) 自动驾驶场景下基于改进faster-RCNN的小目标检测方法
CN113066025B (zh) 一种基于增量学习与特征、注意力传递的图像去雾方法
CN112488229A (zh) 一种基于特征分离和对齐的域自适应无监督目标检测方法
CN114048822A (zh) 一种图像的注意力机制特征融合分割方法
CN110599459A (zh) 基于深度学习的地下管网风险评估云系统
CN111612803B (zh) 一种基于图像清晰度的车辆图像语义分割方法
CN114037674A (zh) 一种基于语义上下文的工业缺陷图像分割检测方法及装置
CN110852199A (zh) 一种基于双帧编码解码模型的前景提取方法
CN112861840A (zh) 基于多特征融合卷积网络的复杂场景字符识别方法及系统
CN111275732B (zh) 一种基于深度卷积神经网络的前景对象图像分割方法
CN116958786A (zh) 一种基于YOLOv5和ResNet50神经网络的化工废渣动态视觉识别方法
CN112785610B (zh) 一种融合低层特征的车道线语义分割方法
CN114333062A (zh) 基于异构双网络和特征一致性的行人重识别模型训练方法
CN112419352B (zh) 一种基于轮廓的小样本语义分割方法
CN117994573A (zh) 一种基于超像素和可形变卷积的红外弱小目标检测方法
CN111582057B (zh) 一种基于局部感受野的人脸验证方法
CN117274355A (zh) 一种基于加速引导区域卷积神经网络和并行多尺度统一网络的排水管道流量智能测量方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant