CN117649635B - 狭窄水道场景影消点检测方法、系统及存储介质 - Google Patents

狭窄水道场景影消点检测方法、系统及存储介质 Download PDF

Info

Publication number
CN117649635B
CN117649635B CN202410127370.5A CN202410127370A CN117649635B CN 117649635 B CN117649635 B CN 117649635B CN 202410127370 A CN202410127370 A CN 202410127370A CN 117649635 B CN117649635 B CN 117649635B
Authority
CN
China
Prior art keywords
data set
water channel
narrow water
scene
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410127370.5A
Other languages
English (en)
Other versions
CN117649635A (zh
Inventor
石兵华
张运胜
齐航
桑金燕
代毅
张紫藤
徐林炬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HUBEI UNIVERSITY OF ECONOMICS
Original Assignee
HUBEI UNIVERSITY OF ECONOMICS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HUBEI UNIVERSITY OF ECONOMICS filed Critical HUBEI UNIVERSITY OF ECONOMICS
Priority to CN202410127370.5A priority Critical patent/CN117649635B/zh
Publication of CN117649635A publication Critical patent/CN117649635A/zh
Application granted granted Critical
Publication of CN117649635B publication Critical patent/CN117649635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种狭窄水道场景影消点检测方法、系统及存储介质,其方法包括以下步骤:构建狭窄水道检测数据集,对所述狭窄水道检测数据集进行影消点位置标注;构建改进后的AlexNet网络;基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络;基于训练完成的AlexNet网络对待识别狭窄水道场景进行检测,得到待识别狭窄水道场景的影消点检测位置;因此可解决狭窄水道场景影消点检测问题中公开数据集缺乏的问题,以及复杂狭窄水道场景中的影消点探测问题。

Description

狭窄水道场景影消点检测方法、系统及存储介质
技术领域
本发明涉及影消点检测技术领域,特别涉及一种狭窄水道场景影消点检测方法、系统及存储介质。
背景技术
在自动驾驶领域,利用深度学习方法检测道路车道线影消点的技术已经相对成熟,但关于水环境中影消点检测的研究相对较少。对于海洋等广阔区域,不存在影消点,而对于狭窄区域,影消点在无人水面飞行器(USV)的位置检测和路径设计中发挥着重要作用。USV 是一种集成技术的水面机器人,由智能遥控、无线通信、自主导航和避障算法等多门学科组成。全面、准确、有效地感知导航环境并做出定位决策对USV的自主导航具有重要意义。与陆地和开阔水域环境不同,狭窄水域环境相对复杂,这给USV的自主定位和导航带来了新的挑战。
影消点是指三维图形中各平行边的延长线所产生的交点,影消点常见于田野、铁路、街道、隧道、森林、建筑物、梯子等物体。影消点不同于平面上的其他特征点,它包含了直线的方向信息,通过对影消点的分析,可以显示出场景的大量三维结构和方向信息,从而在很大程度上简化了场景描述。
通过识别图像中影消点的位置,系统可自动调整USV的姿态,确保其在狭窄水域中稳定航行。传统的影消点检测方法包括 Gabor 滤波器、高斯滤波器或查找Hough变换线的交点,这些方法主要基于投票方案,其时间复杂度较高。为了减少或弥补这一缺陷,一方面可以通过海天划分等方法减少搜索区域,将导航场景划分为通航区域和非通航区域,影消点必须存在于通航区域或两个区域的边界上。另一方面,也有一些研究使用 4 个Gabor方向通道和选择性投票来加快投票过程。同时考虑到深度学习方法极大地改进了计算机视觉、物体识别和图像分割等许多机器学习领域的最新成果。传统的影消点检测方法需要从图像中提取大量的线段和轮廓线,特别费时费力。此外,场景中存在一些不相关的线条和轮廓也会影响检测的准确性。
虽然上述这些成果能够对影消点进行一定精度的估算,但是传统的影消点检测方法使用线检测来定位点,主要针对人造或室内环境。然而当应用于更复杂的自然场景时,譬如狭窄水道场景,现阶段完整标注的狭窄水道航行场景视觉图像数据集较少,且传统方法可能会受到不规则线方向所产生的模糊信息的影响,因此需要一种方案以复杂狭窄水道场景中的影消点探测问题。
发明内容
本发明的提供一种狭窄水道场景影消点检测方法、系统及存储介质,可解决狭窄水道场景影消点检测问题中公开数据集缺乏的问题,以及复杂狭窄水道场景中的影消点探测问题。
第一方面,提供一种狭窄水道场景影消点检测方法,具体包括以下步骤:
基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集,将筛选出的数据集与所述狭窄水道场景内陆数据集混合得到狭窄水道检测数据集,对所述狭窄水道检测数据集进行影消点位置标注;
构建改进后的AlexNet网络;
基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络;
基于训练完成的AlexNet网络对待识别狭窄水道场景进行检测,得到待识别狭窄水道场景的影消点检测位置。
根据第一方面,在第一方面的第一种可能的实现方式中,所述基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集步骤,具体包括以下步骤:
将谷歌街道道路数据集与狭窄水道场景内陆数据集分别转换为对应的灰度图像,并构建灰度图像的灰度共生矩阵;
通过所述灰度共生矩阵从每一幅图像中分别提取能量纹理特征、熵纹理特征、对比度纹理特征、反差矩纹理特征及相关性纹理特征;
将提取到的所述能量纹理特征、所述熵纹理特征、所述对比度纹理特征、所述反差矩纹理特征及所述相关性纹理特征组合成每一幅图像的纹理特征量;
根据所述纹理特征量,基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度,并从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集。
根据第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述灰度图像的灰度共生矩阵为:
式中,和 />为/>尺寸的图像I中在方向/>上相隔距离为d的两个像素点的横纵坐标;i和j分别为两个像素点具有的灰度值。
根据第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述能量纹理特征ASM为:
所述熵纹理特征ENT为:
所述对比度纹理特征CON为:
所述反差矩纹理特征为:
所述相关性纹理特征为:
式中,为在/>方向上、相隔距离d的一对像素点分别具有灰度值i和j;/>和/>分别为归一化灰度共生矩阵沿行方向和列方向元素的平均值;/>和/>分别为归一化灰度共生矩阵沿行方向和列方向元素的均方值;/>为为图像的灰度级。
根据第一方面的第一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述根据所述纹理特征量,并基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度步骤,具体包括以下步骤:
根据所述狭窄水道场景内陆数据集中的纹理特征向量E0,及所述谷歌街道道路数据集中的纹理特征量E1
基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度D如下:
式中,T为矩阵转置;s为协方差矩阵;为协方差矩阵的导数。
根据第一方面,在第一方面的第五种可能的实现方式中,所述对所述狭窄水道检测数据集进行影消点位置标注步骤,具体包括以下步骤:
将所述狭窄水道检测数据集中的每一幅图像均划分成15×15的网格,其中横纵各15条网格线之间的距离分布基于高斯分布进行非等间隔分布;
所述每一幅图像的影消点位置标注于对应的网格图中的其中一个网格。
根据第一方面,在第一方面的第六种可能的实现方式中,所述构建改进后的AlexNet网络步骤,具体包括以下步骤:
将原始的AlexNet网络结构修改为交替顺序连接的4层卷积层及四层池化层;
将Inception A结构引入第一层卷积层,并在所述第一卷积层中构建1×1、3×3及5×5尺度的卷积核;
将Inception C结构引入第二层卷积层,并在所述第二卷积层中构建1×1、1×7及7×1尺度的卷积核。
根据第一方面,在第一方面的第七种可能的实现方式中,所述基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络步骤,具体包括以下步骤:
基于标注后的所述狭窄水道检测数据集训练改进后的AlexNet网络,判断每一次迭代训练的改进后的AlexNet网络的损失值是否收敛于稳定值或是否达到设定的最大迭代步数,若是,则结束训练,得到训练完成的AlexNet网络。
第二方面,还提供了一种狭窄水道场景影消点检测系统,包括:
数据集模块,用于基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集,将筛选出的数据集与所述狭窄水道场景内陆数据集混合得到狭窄水道检测数据集,对所述狭窄水道检测数据集进行影消点位置标注;
网络改进模块,用于构建改进后的AlexNet网络;
训练模块,与所述数据集模块及所述网络改进模块通信连接,用于基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络;以及,
检测模块,与所述训练模块通信连接,用于基于训练完成的AlexNet网络对所述测试集进行检测,得到狭窄水道场景影消点检测位置。
第三方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的狭窄水道场景影消点检测方法。
与现有技术相比,本发明的优点如下:通过构建狭窄水道检测数据集及改进后的AlexNet网络,再通过狭窄水道检测数据集对改进后的AlexNet网络进行训练,最后根据训练完成的AlexNet网络检测得到狭窄水道场景影消点检测位置,因此可解决狭窄水道场景影消点检测问题中公开数据集缺乏的问题,以及复杂狭窄水道场景中的影消点探测问题。
附图说明
图1是本发明一种狭窄水道场景影消点检测方法的一实施例的流程示意图;
图2是本发明的狭窄水道检测数据集准备流程图;
图3是本发明的用于影消点检测的改进型轻量级 AlexNet 网络示意图;
图4是不同改进型AlexNet 网络在消融实验下的损耗值;
图5是不同改进型AlexNet 网络在消融实验下的精度;
图6是本发明的改进后的AlexNet 网络对狭窄水道场景的影消点检测效果;
图7是本发明一种狭窄水道场景影消点检测系统的结构示意图。
具体实施方式
现在将详细参照本发明的具体实施例,在附图中例示了本发明的例子。尽管将结合具体实施例描述本发明,但将理解,不是想要将本发明限于所述的实施例。相反,想要覆盖由所附权利要求限定的在本发明的精神和范围内包括的变更、修改和等价物。应注意,这里描述的方法步骤都可以由任何功能块或功能布置来实现,且任何功能块或功能布置可被实现为物理实体或逻辑实体、或者两者的组合。
为了使本领域技术人员更好地理解本发明,下面结合附图和具体实施方式对本发明作进一步详细说明。
注意:接下来要介绍的示例仅是一个具体的例子,而不作为限制本发明的实施例必须为如下具体的步骤、数值、条件、数据、顺序等等。本领域技术人员可以通过阅读本说明书来运用本发明的构思来构造本说明书中未提到的更多实施例。
参见图1所示,本发明实施例提供一种狭窄水道场景影消点检测方法,具体包括以下步骤:
S100,基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集,将筛选出的数据集与所述狭窄水道场景内陆数据集混合得到狭窄水道检测数据集,对所述狭窄水道检测数据集进行影消点位置标注;
由于目前可用来辅助影消点的图像数据集大多集中在城市和室外道路上,专门用于狭窄水道的图像较少。因此可选择狭窄水道场景内陆数据集 USVID,它是首个多传感器、多天气条件下真实狭窄水道场景的内陆数据集。在不同的内陆狭窄河道场景数据集中,共收集了 19600 张图像,包含 5 种天气条件场景,即多云、薄雾、阴天、雨天和晴天。
由于深度学习方法通常需要大量的训练实例。考虑到道路影消点检测与狭窄水域航行场景中影消点检测的相似性。为此,可采用基于图像纹理特征相似度计算方法,计算出谷歌街道道路数据集 GSRD 的相似度,GSRD包含 1053425 幅图像,其中包含来自21个国家24条航线的1053425幅分辨率为像素的图像,用于计算相似度。从中筛选出与复杂狭窄水道通航场景相似的图像场景,并将筛选出的GSRD与USVID混合,以弥补数据集规模不足以进行狭窄水道影消点检测的问题。
S200,构建改进后的AlexNet网络;
S300,基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络;
S400,基于训练完成的AlexNet网络对待识别狭窄水道场景进行检测,得到待识别狭窄水道场景的影消点检测位置。
具体地,本实施例中,本发明通过构建狭窄水道检测数据集及改进后的AlexNet网络,再通过狭窄水道检测数据集对改进后的AlexNet网络进行训练,最后根据训练完成的AlexNet网络检测得到狭窄水道场景影消点检测位置,因此可解决狭窄水道场景影消点检测问题中公开数据集缺乏的问题,以及复杂狭窄水道场景中的影消点探测问题。
优选地,在本申请另外的实施例中,所述S100,基于基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集步骤,具体包括以下步骤:
S110,将谷歌街道道路数据集与狭窄水道场景内陆数据集分别转换为对应的灰度图像,并构建灰度图像的灰度共生矩阵;
S120,通过所述灰度共生矩阵从每一幅图像中分别提取能量纹理特征、熵纹理特征、对比度纹理特征、反差矩纹理特征及相关性纹理特征;
S130,将提取到的所述能量纹理特征、所述熵纹理特征、所述对比度纹理特征、所述反差矩纹理特征及所述相关性纹理特征组合成每一幅图像的纹理特征量;
S140,根据所述纹理特征量,基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度,并从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集。
具体地,本实施例中,在进行精确的影消点检测之前,必须区分捕捉到的实际航行环境,以确定USV的航行场景是在开阔水域还是复杂水域。开阔水域通常指视野开阔的外部水域,因此海平面检测相对简单。然而,复杂水域场景通常是交通繁忙的内河和港口,复杂场景中的海平面检测容易受到多种因素的影响。由于空间关系被视为两个像素之间距离的函数,因此纹理特征可用于计算两个不同数据集的相似性。
使用灰度共现矩阵GLCM (Grey-Level Co-occurrence Matrix) 从图像中提取纹理特征。Haralick 提出了多种统计特征量来描述不同图像的纹理特征,具体包括:能量、熵、对比度、逆差矩、相关性、方差、和均值、和方差、和熵、差方差、差均值、差熵、相关信息量和最大相关系数,但这些特征量之间存在重复和冗余问题。为了解决这个问题,本发明筛选出了相关性小、易于计算的五个纹理特征量,即能量、熵、对比度、逆差矩和相关性。在构建GLCM 之前,需要将原始的狭窄水道场景转换为灰度图像,公式如下:
表示狭窄水道方案中的三个水道。
纹理特征提取后,GSRD 中的图像将与 USVID 中的图像进行相似度匹配计算。可使用 Mahalanobis 距离来衡量两个数据集之间的相似度,这是Mahalanobis提出的衡量两个数据集相似度的有效方法。
优选地,在本申请另外的实施例中,所述灰度图像的灰度共生矩阵为:
式中,和 />为/>尺寸的图像I中在方向/>上相隔距离为d的两个像素点的横纵坐标;i和j分别为两个像素点具有的灰度值。
优选地,在本申请另外的实施例中,能量纹理特征ASM 通常用于描述狭窄水道场景灰度分布的均匀性。当 GLCM 中的元素分布更集中于主对角线附近时,越小表明像素灰度分布越均匀,纹理越精细;反之,则表明像素灰度分布不均匀,纹理粗糙。所述能量纹理特征ASM为:
熵(ENT)用于描述狭窄水道场景中包含的信息量,如果场景图像不包含纹理特征,其 GLCM 矩阵为零,对应的ENT 值为零;相反,场景中包含的纹理信息量越大,对应的ENT值越大。所述熵纹理特征ENT为:
对比度(CON)用来反映图像纹理沟壑的深浅程度和图像的清晰度,在特定的狭窄水道场景中,图像纹理越清晰,相邻灰度对的变异性越大,其 CON 值就越大;反之,CON 值就越小。所述对比度纹理特征CON为:
反差矩(IDM)是反映图像纹理局部变化程度的统计特征量。当 IDM 值较大时,表明狭窄水道场景中不同区域纹理之间的差异较小;反之,则表明其中不同区域纹理之间的差异较大。所述反差矩纹理特征为:
相关性(COR)用于衡量 GLCM 元素在行或列方向上的相似程度,当行或列相似度高时,COR 值越大,对应的场景图像复杂度越小,反之复杂度越大。所述相关性纹理特征为:
式中,为在/>方向上、相隔距离d的一对像素点分别具有灰度值i和j;/>和/>分别为归一化灰度共生矩阵沿行方向和列方向元素的平均值;/>和/>分别为归一化灰度共生矩阵沿行方向和列方向元素的均方值;/>为图像的灰度级。
综合上述各纹理特征参数,可以提取出狭窄水道场景图像的上述五种不同特征参数,并组合成纹理特征向量如下:
优选地,在本申请另外的实施例中,所述S140,根据所述纹理特征量,基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度步骤,具体包括以下步骤:
根据所述狭窄水道场景内陆数据集中的纹理特征向量E0,及所述谷歌街道道路数据集中的纹理特征量E1
基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度D如下:
式中,T为矩阵转置;s为协方差矩阵;为协方差矩阵的导数。
优选地,在本申请另外的实施例中,所述对所述狭窄水道检测数据集进行影消点位置标注步骤,具体包括以下步骤:
将所述狭窄水道检测数据集中的每一幅图像均划分成15×15的网格,其中横纵各15条网格线之间的距离分布基于高斯分布进行非等间隔分布;
所述每一幅图像的影消点位置标注于对应的网格图中的其中一个网格。
具体地,本实施例中,同时参见图2所示,将狭窄水道检测数据集中的每一幅图像都分成的网格,共计225个网格。其中横纵各15条线之间的距离不是等间隔分布的,所以是非均匀网格级标注。
15条线在图像画面中的分布情况,参考了已有数据集中点的数学分布(高斯分布),将高斯分布进行等距离采样,落实到15条线上就是中间密两边稀,从而就形成了非均匀网格分布。
在标注过程中,如果影消点落在了这225个格子里面的任意一个,就代表该网格里面有影消点,AlexNet模型检测输出影消点位置其实是格子的编号(1~225)。因此图像中阴影影消点检测问题等同于一个有 225 个类别的分类问题。
优选地,在本申请另外的实施例中,所述S200,构建改进后的AlexNet网络步骤,具体包括以下步骤:
S210,将原始的AlexNet网络结构修改为交替顺序连接的4层卷积层及四层池化层;
S220,将Inception A结构引入第一层卷积层,并在所述第一卷积层中构建1×1、3×3及5×5尺度的卷积核;
S230,将Inception C结构引入第二层卷积层,并在所述第二卷积层中构建1×1、1×7及7×1尺度的卷积核。
具体地,本实施例中,为了降低经典 AlexNet 网络的高复杂度问题,减少非必要的训练成本,本发明提出了一种改进的轻量级 AlexNet 网络模型。将网络模型将5层卷积简化为4层卷积(增加了一个池化层),设计为4个卷积层和4个池化层的交替顺序连接。考虑到第一个卷积层的内核为11×11,其计算参数较大。因此,在前两个卷积层中分别加入了Inception A 和 Inception C 结构,以分解卷积代替传统的卷积进行特征提取,从而进一步降低网络计算成本。具体改动如下:
第一层卷积采用了 Inception A 结构,其网络结构参数如所示。从表1可以看出,构建了1×1、3×3及5×5三种不同尺度的卷积核,而不是 11×11 卷积,并进行多通道特征提取,同时计算输入值的池化结果,然后依次融合各通道。这样,原始 11 ×11 卷积核的参数量和计算量可从 121 个计算单元减少到 46 个计算单元。
表1
第二层卷积改用 Inception C结构,其网络结构如表2所示。在保持底层 1×1 尺度卷积核不变的基础上,三组 1×7 和 7×1 卷积核进行分解卷积,并根据新输入层的特征图数量增加 96 个通道。使用3组1×7卷积核 、3组7×1卷积核代替5×5卷积核进行分解卷积时,可使参数量核计算量从原本的25个计算单元减少到21个计算单元。
表2
通过上述操作得到的狭窄水道场景影消点检测检测网络模型如图3 所示。首先,该网络模型以 AlexNet 为基本网络结构,构建 4 层交替连接的卷积层和池化层,实现轻量级处理。然后,在前两层卷积层中融合了 Inception V3 模块中的 Inception A 和Inception C 结构,以分解卷积取代传统卷积,在减少模型参数计算量的同时提高了模型的准确性。最后,将特征提取后的特征图像送入全连接层,调用 Softmax 分类器计算输入图像属于 225 类别的概率,从而确认狭窄水道影消点在图像场景中的位置。
优选地,在本申请另外的实施例中,S300,所述基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络步骤,具体包括以下步骤:
基于标注后的所述狭窄水道检测数据集训练改进后的AlexNet网络,判断每一次迭代训练的改进后的AlexNet网络的损失值是否收敛于稳定值或是否达到设定的最大迭代步数,若是,则结束训练,得到训练完成的AlexNet网络。
具体地,本实施例中,基于标注后的所述狭窄水道检测数据集训练改进后的AlexNet网络,将每一次迭代训练的输出结果(网络输出的影消点位置)与实际影消点位置(数据集中标注的影消点位置)进行对比并计算损失值,若损失值未收敛于稳定值或未达到设定的最大迭代步数,则对AlexNet网络中的参数进行优化改进,并继续进行迭代训练,使训练中的AlexNet网络模型的输出结果越来越接近期望输出,直至网络的损失值收敛于一个稳定值或达到最大迭代步数时结束训练,得到此时训练完成的AlexNet网络。
下面对本发明进行有效性实验验证。
为了保证训练效率和节省计算资源,上述图像场景均统一为 300 ×300×3分辨率的图像进行分类评级。使用的编译语言为 Python 3.7,网络模型基于 Pytorch 深度学习框架构建,网络模型加载到 GPU 进行处理,服务器显卡型号为 RTX4080。处理器为第13代英特尔(R)酷睿(TM)i7-13700K 3.40 GHz。为了验证本发明对影消点位置检测的有效性,做如下实验,实验由两部分组成:一部分是验证狭窄水道方案的数据集有效性,第二部分是测试基于改进的轻量级 AlexNet 的网络模型在狭窄水道影消点检测中的有效性。
第一部分:狭窄水道方案的数据集
USVID 和 GSRD 共包含 29 个特定场景。USVID 按照 7:3 随机分为训练集和测试集,而 GSRD 则根据相似度计算结果依次分配到不同的训练数据集组,如 A 组 ~ H 组,共 8 组对比实验。A 组包括所有 USVID,代表标准狭窄水道场景;B 组在 A 组的基础上增加了 GSRD 中的斯德哥尔摩场景,与标准狭窄水道场景最为相似。C 组在 B 组的基础上增加了巴黎场景,这是与标准窄水道场景第二相似的场景。D 组包括标准窄水道场景和 GSRD的前三个最相似场景。E 组包括标准窄水道场景和 GSRD 中的三个随机场景。F 组包括标准狭窄水道场景和 GSRD 中最相似的前四个场景。G 组包括标准狭窄水道场景和来自GSRD 的四个随机场景。H 组由所有 29 个场景组成。
对于不同组的数据集,采用经典的 AlexNet 网络模型进行训练,激活函数为ReLU 函数。初始学习率设置为 0.001,每训练 10 轮将学习率调整为 0.5,"batch size "设置为 100,"epoch "设置为 50,在全连接层中使用 Dropout 层以防止过拟合。相应参数设置为 0.5,以防止过度拟合。每组实验重复 10 次,取训练时间和训练准确率的平均值并记录在表3中。
表3
从表中结果可以看出,A 组代表了典型的狭窄水道场景,模型在训练中的准确率可以达到 86.42%,但在测试中的准确率较差,只有 58.33%,这可能有两个原因,一是模型本身拟合过度,二是训练数据集和测试集中的标签分布不均匀。针对这两点,可分别采取了两种措施:一是进一步优化模型结构,比如下文中改进的轻量级 AlexNet 模型。其趋势是随着窄水影取消点检测数据集的规模越来越大,训练阶段的准确率逐渐缓慢上升,最后稳定在 90% 左右。而测试时的准确率不仅受训练数据集大小的影响,还受训练数据集中窄水域样本纹理特征相似度的影响。这种影响表现为:用于训练的数据集的相似度越高,测试集上的准确度就越高。
对比 D 组与 E 组、F 组与 G 组的结果,可以发现,这两组对比实验的数据规模基本相同,但 D 组和 F 组的准确率要优于 E 组和 G 组。另外,对于数据集大小对模型的影响,对比几组实验结果可以看到,随着数据集大小的变大,训练时间的长度越来越长,但测试集的准确率在达到 90% 之后并没有提高,反而随着数据集大小的增加而回落。这是因为 GSRD 中大部分场景的纹理特征与 USVID 有较大差异,该数据集的训练对模型性能的提高并没有积极意义。因此,上述结果表明,基于图像纹理相似性的窄水影消逝点检测数据集的建立是有效的。但由于模型的精度和训练时间过长,还需要进一步改进AlexNet网络模型,以缩短训练时间,提高检测精度。
第二部分:改进后的轻量级 AlexNet 网络性能分析
为了验证我们的网络改进效果,专门设计了Inception V3模块中的前两层卷积层做消融实验,在实验其他条件都类似的情况下设计了5个不同的网络分别是:网络R1,经典的AlexNet网络文献,网络R2,在原有网络基础上的轻量级改进,即把原有的5层卷积简化为4层卷积并增加了1个池化层。网络 R3 基于 R2,将第一个卷积层纳入初始 A 结构。网络R4 以 R2 为基础,将第二层卷积层加入到接收 C 结构中。网络 R5 以 R2 为基础,同时包含 Inception A 和 Inception C 结构。这五个网络的识别准确率和损失值分别记录在图4和图 5 中。
从结果对比可以看出,在经典网络 R1 中,损失函数在多次迭代训练中收敛效果不佳,需要在 30 次迭代后才能稳定在 90.62%的准确率。对于网络 R2,轻量化改进后的效果与网络 R2 相比,收敛效果和识别准确率基本一致,但其模型参数由原来的 60.7MB,减少到 27.5MB,说明经典模型的轻量化操作并不影响模型的性能。网络 R3 和网络 R4 分别被纳入 Inception A 和 Inception C 结构,从结果来看,精度网络 R3 的精度明显优于网络 R4 和网络 R2,最高精度达到 93.75%,提高了 3.45%。这种现象可能是由于网络 R3与网络 R4 相比,侧重于优化浅层特征的提取,而浅层特征对于阴影消除点的检测相对重要。而网络 R5 则同时加入了 Inception A 和 Inception C 结构,加入后,模型参数数量比网络 R2 增加,达到 44.7MB,但仍小于网络 R1,而且取得了最好的效果,损失值最先开始收敛,准确率达到 96.33%。这一准确率也超过了 DeepVP 网络的 92%。
同时,我们从测试集中随机选取了 16 幅狭窄水道场景图像进行测试,其影消点检测结果如图 6所示。图中符号表示人工标注的影消点位置,小方框为我们提出的网络模型 R5 的检测结果。从结果可以看出,16 对图像的检测结果都与人工标注的结果一致。从模型的轻量级效果来看,本发明提出的 R5 模型的平均识别时间约为 664 毫秒,受融合模块的影响,比 R2 模型多了 11 毫秒,但与耗时最长的网络模型 R1 的 691 毫秒相比,耗时减少了 27 毫秒,虽然本发明提出的 R5 模型与轻量级模型相比增加了复杂度,但其识别效果确实有所提高。
同时参见图7所示,本发明还提供了一种狭窄水道场景影消点检测系统,包括:
数据集模块,用于基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集,将筛选出的数据集与所述狭窄水道场景内陆数据集混合得到狭窄水道检测数据集,对所述狭窄水道检测数据集进行影消点位置标注,并将标注后的所述狭窄水道检测数据集划分为训练集及测试集;
网络改进模块,用于构建改进后的AlexNet网络;
训练模块,与所述数据集模块及所述网络改进模块通信连接,用于基于所述训练集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络;以及,
检测模块,与所述数据集模块及所述训练模块通信连接,用于基于训练完成的AlexNet网络对所述测试集进行检测,得到狭窄水道场景影消点检测位置。
无人水面航行器(USV)在狭窄水道场景中航行时,能否准确、快速地检测到影消点对于保障航行安全和实现自动导航具有重要意义。本发明提出了一种基于改进的轻量级AlexNet 网络检测影消点的新方法。首先,提出一种基于图像纹理特征的相似性评估计算方法,从谷歌街道道路数据集(GSRD)中筛选出一些场景。然后,将这些过滤后的场景与 USVInland Dataset(USVID)一起组成训练数据集,并按照非均匀分布的网格级进行人工标注。接下来,通过构建 4 个卷积层和 4 个池化层的顺序交替连接,并在前两个卷积层中分别加入 Inception A 和 Inception C 结构,对经典 AlexNet 进行调整和优化。在模型训练过程中,将影消点检测作为一个分类问题,使用一个包含 225 个离散可能影消点位置的输出层。最后,我们将标注的影消点与检测到的影消点进行对比分析,因此本发明改进的轻量级 AlexNet 网络可应用于狭窄水道的航行场景,并可为 USV 的自动驾驶提供技术参考。
具体的,本实施例与上述方法实施例一一对应,各个模块的功能在相应的方法实施例中已经进行详细说明,因此不再一一赘述。
基于同一发明构思,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的所有方法步骤或部分方法步骤。
本发明实现上述方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
基于同一发明构思,本申请实施例还提供一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法中的所有方法步骤或部分方法步骤。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
存储器可用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现计算机装置的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(例如声音播放功能、图像播放功能等);存储数据区可存储根据手机的使用所创建的数据(例如音频数据、视频数据等)。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、服务器或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、服务器和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种狭窄水道场景影消点检测方法,其特征在于,具体包括以下步骤:
基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集,将筛选出的数据集与所述狭窄水道场景内陆数据集混合得到狭窄水道检测数据集,对所述狭窄水道检测数据集进行影消点位置标注;
构建改进后的AlexNet网络;
基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络;
基于训练完成的AlexNet网络对待识别狭窄水道场景进行检测,得到待识别狭窄水道场景的影消点检测位置;
所述基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集步骤,具体包括以下步骤:
将谷歌街道道路数据集与狭窄水道场景内陆数据集分别转换为对应的灰度图像,并构建灰度图像的灰度共生矩阵;
通过所述灰度共生矩阵从每一幅图像中分别提取能量纹理特征、熵纹理特征、对比度纹理特征、反差矩纹理特征及相关性纹理特征;
将提取到的所述能量纹理特征、所述熵纹理特征、所述对比度纹理特征、所述反差矩纹理特征及所述相关性纹理特征组合成每一幅图像的纹理特征量;
根据所述纹理特征量,基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度,并从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集;
所述构建改进后的AlexNet网络步骤,具体包括以下步骤:
将原始的AlexNet网络结构修改为交替顺序连接的4层卷积层及四层池化层;
将Inception A结构引入第一层卷积层,并在所述第一层卷积层中构建1×1、3×3及5×5尺度的卷积核;
将Inception C结构引入第二层卷积层,并在所述第二层卷积层中构建1×1、1×7及7×1尺度的卷积核。
2.如权利要求1所述的狭窄水道场景影消点检测方法,其特征在于,所述灰度图像的灰度共生矩阵为:
式中,和/>为/>尺寸的图像I中在方向/>上相隔距离为d的两个像素点的横纵坐标;i和j分别为两个像素点具有的灰度值。
3.如权利要求1所述的狭窄水道场景影消点检测方法,其特征在于,
所述能量纹理特征ASM为:
所述熵纹理特征ENT为:
所述对比度纹理特征CON为:
所述反差矩纹理特征为:
所述相关性纹理特征为:
式中,为在/>方向上、相隔距离d的一对像素点分别具有灰度值i和j;/>和/>分别为归一化灰度共生矩阵沿行方向和列方向元素的平均值;/>和/>分别为归一化灰度共生矩阵沿行方向和列方向元素的均方值;/>为图像的灰度级。
4.如权利要求1所述的狭窄水道场景影消点检测方法,其特征在于,所述根据所述纹理特征量,基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度步骤,具体包括以下步骤:
根据所述狭窄水道场景内陆数据集中的纹理特征向量E0,及所述谷歌街道道路数据集中的纹理特征量E1
基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度D如下:
式中,T为矩阵转置;s为协方差矩阵;为协方差矩阵的导数。
5.如权利要求1所述的狭窄水道场景影消点检测方法,其特征在于,所述对所述狭窄水道检测数据集进行影消点位置标注步骤,具体包括以下步骤:
将所述狭窄水道检测数据集中的每一幅图像均划分成15×15的网格,其中横纵各15条网格线之间的距离分布基于高斯分布进行非等间隔分布;
所述每一幅图像的影消点位置标注于对应的网格图中的其中一个网格。
6.如权利要求1所述的狭窄水道场景影消点检测方法,其特征在于,所述基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络步骤,具体包括以下步骤:
基于标注后的所述狭窄水道检测数据集训练改进后的AlexNet网络,判断每一次迭代训练的改进后的AlexNet网络的损失值是否收敛于稳定值或是否达到设定的最大迭代步数,若是,则结束训练,得到训练完成的AlexNet网络。
7.一种狭窄水道场景影消点检测系统,其特征在于,包括:
数据集模块,用于基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集,将筛选出的数据集与所述狭窄水道场景内陆数据集混合得到狭窄水道检测数据集,对所述狭窄水道检测数据集进行影消点位置标注;
网络改进模块,用于构建改进后的AlexNet网络;
训练模块,与所述数据集模块及所述网络改进模块通信连接,用于基于标注后的所述狭窄水道检测数据集对改进后的AlexNet网络进行训练,得到训练完成的AlexNet网络;以及,
检测模块,与所述训练模块通信连接,用于基于训练完成的AlexNet网络对待识别狭窄水道场景进行检测,得到狭窄水道场景影消点检测位置;
所述基于图像纹理特征相似度算法,从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集步骤,具体包括以下步骤:
将谷歌街道道路数据集与狭窄水道场景内陆数据集分别转换为对应的灰度图像,并构建灰度图像的灰度共生矩阵;
通过所述灰度共生矩阵从每一幅图像中分别提取能量纹理特征、熵纹理特征、对比度纹理特征、反差矩纹理特征及相关性纹理特征;
将提取到的所述能量纹理特征、所述熵纹理特征、所述对比度纹理特征、所述反差矩纹理特征及所述相关性纹理特征组合成每一幅图像的纹理特征量;
根据所述纹理特征量,基于Mahalanobis距离算法计算所述谷歌街道道路数据集与所述狭窄水道场景内陆数据集之间的相似度,并从谷歌街道道路数据集中筛选出与狭窄水道场景内陆数据集之间的相似度大于相似度阈值的数据集;
所述构建改进后的AlexNet网络步骤,具体包括以下步骤:
将原始的AlexNet网络结构修改为交替顺序连接的4层卷积层及四层池化层;
将Inception A结构引入第一层卷积层,并在所述第一层卷积层中构建1×1、3×3及5×5尺度的卷积核;
将Inception C结构引入第二层卷积层,并在所述第二层卷积层中构建1×1、1×7及7×1尺度的卷积核。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的狭窄水道场景影消点检测方法。
CN202410127370.5A 2024-01-30 2024-01-30 狭窄水道场景影消点检测方法、系统及存储介质 Active CN117649635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410127370.5A CN117649635B (zh) 2024-01-30 2024-01-30 狭窄水道场景影消点检测方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410127370.5A CN117649635B (zh) 2024-01-30 2024-01-30 狭窄水道场景影消点检测方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN117649635A CN117649635A (zh) 2024-03-05
CN117649635B true CN117649635B (zh) 2024-06-11

Family

ID=90043752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410127370.5A Active CN117649635B (zh) 2024-01-30 2024-01-30 狭窄水道场景影消点检测方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN117649635B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856051B1 (en) * 2011-04-08 2014-10-07 Google Inc. Augmenting metadata of digital objects
CN109086799A (zh) * 2018-07-04 2018-12-25 江苏大学 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109583474A (zh) * 2018-11-01 2019-04-05 华中科技大学 一种用于工业大数据处理的训练样本生成方法
CN110175329A (zh) * 2019-05-28 2019-08-27 上海优扬新媒信息技术有限公司 一种样本扩充的方法、装置、电子设备与存储介质
WO2020098708A1 (zh) * 2018-11-14 2020-05-22 北京市商汤科技开发有限公司 车道线的检测及驾驶控制方法、装置和电子设备
CN111582083A (zh) * 2020-04-25 2020-08-25 华南理工大学 一种基于消失点估计与语义分割的车道线检测方法
CN112435336A (zh) * 2020-11-13 2021-03-02 武汉中海庭数据技术有限公司 一种弯道类型识别方法、装置、电子设备及存储介质
WO2021189889A1 (zh) * 2020-03-26 2021-09-30 平安科技(深圳)有限公司 场景图像中的文本检测方法、装置、计算机设备及存储介质
CN113989768A (zh) * 2021-09-29 2022-01-28 中智行(上海)交通科技有限公司 一种自动驾驶测试场景分析方法及系统
KR20220104368A (ko) * 2021-01-18 2022-07-26 서강대학교산학협력단 유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법
CN115375675A (zh) * 2022-10-24 2022-11-22 山东济矿鲁能煤电股份有限公司阳城煤矿 一种基于图像数据的煤炭质量检测方法
CN116030298A (zh) * 2022-12-22 2023-04-28 湖北经济学院 船舶航行图像的场景复杂度分类方法、存储介质及装置
CN116352700A (zh) * 2023-02-01 2023-06-30 南京大学 基于随机网络预测误差的专家数据扩增方法和装置
CN116630641A (zh) * 2023-03-17 2023-08-22 西安理工大学 基于注意力机制的长时目标跟踪方法
CN117173175A (zh) * 2023-11-02 2023-12-05 湖南格尔智慧科技有限公司 一种基于超像素的图像相似度检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117253099A (zh) * 2022-06-08 2023-12-19 英业达科技有限公司 影像数据扩增装置以及方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856051B1 (en) * 2011-04-08 2014-10-07 Google Inc. Augmenting metadata of digital objects
CN109086799A (zh) * 2018-07-04 2018-12-25 江苏大学 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109583474A (zh) * 2018-11-01 2019-04-05 华中科技大学 一种用于工业大数据处理的训练样本生成方法
WO2020098708A1 (zh) * 2018-11-14 2020-05-22 北京市商汤科技开发有限公司 车道线的检测及驾驶控制方法、装置和电子设备
CN110175329A (zh) * 2019-05-28 2019-08-27 上海优扬新媒信息技术有限公司 一种样本扩充的方法、装置、电子设备与存储介质
WO2021189889A1 (zh) * 2020-03-26 2021-09-30 平安科技(深圳)有限公司 场景图像中的文本检测方法、装置、计算机设备及存储介质
CN111582083A (zh) * 2020-04-25 2020-08-25 华南理工大学 一种基于消失点估计与语义分割的车道线检测方法
CN112435336A (zh) * 2020-11-13 2021-03-02 武汉中海庭数据技术有限公司 一种弯道类型识别方法、装置、电子设备及存储介质
KR20220104368A (ko) * 2021-01-18 2022-07-26 서강대학교산학협력단 유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법
CN113989768A (zh) * 2021-09-29 2022-01-28 中智行(上海)交通科技有限公司 一种自动驾驶测试场景分析方法及系统
CN115375675A (zh) * 2022-10-24 2022-11-22 山东济矿鲁能煤电股份有限公司阳城煤矿 一种基于图像数据的煤炭质量检测方法
CN116030298A (zh) * 2022-12-22 2023-04-28 湖北经济学院 船舶航行图像的场景复杂度分类方法、存储介质及装置
CN116352700A (zh) * 2023-02-01 2023-06-30 南京大学 基于随机网络预测误差的专家数据扩增方法和装置
CN116630641A (zh) * 2023-03-17 2023-08-22 西安理工大学 基于注意力机制的长时目标跟踪方法
CN117173175A (zh) * 2023-11-02 2023-12-05 湖南格尔智慧科技有限公司 一种基于超像素的图像相似度检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Regression convolutional network for vanishing point detection;Y. Tiantian et al.;《2017 32nd Youth Academic Annual Conference of Chinese Association of Automation 》;20170630;全文 *
基于多层次融合与卷积神经网络的道路交通标线检测与识别;李强;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;20190115(第1期);全文 *
基于数据扩充的深度置信网络地铁轨排故障识别方法研究;程俊斌 等;《铁道建筑技术》;20231130(第11期);43-47 *
基于迁移学习的高分辨率遥感影像场景分类研究;周黎鸣;陈璐;刘金明;左宪禹;葛强;陈小潘;;河南大学学报(自然科学版);20200716(04);全文 *
智能船舶航行场景复杂度感知方法研究;石兵华 等;《中国海洋大学学报》;20230930;第53卷(第9期);147-153 *

Also Published As

Publication number Publication date
CN117649635A (zh) 2024-03-05

Similar Documents

Publication Publication Date Title
CN108509978B (zh) 基于cnn的多级特征融合的多类目标检测方法及模型
CN113298818B (zh) 基于注意力机制与多尺度特征的遥感图像建筑物分割方法
CN110427839B (zh) 基于多层特征融合的视频目标检测方法
CN103049763B (zh) 一种基于上下文约束的目标识别方法
CN111160311A (zh) 基于多注意力机制双流融合网络的黄河冰凌语义分割方法
KR102279376B1 (ko) CNN(Convolutional Neural Network)을 사용하여 차선을 검출하기 위한 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치
CN107633226B (zh) 一种人体动作跟踪特征处理方法
CN111259827B (zh) 一种面向城市河道监管的水面漂浮物自动检测方法及装置
CN111461039B (zh) 基于多尺度特征融合的地标识别方法
CN109285162A (zh) 一种基于局部区域条件随机场模型的图像语义分割方法
CN109753959B (zh) 基于自适应多尺度特征融合的路面交通标志检测方法
CN109635726B (zh) 一种基于对称式深度网络结合多尺度池化的滑坡识别方法
Chao et al. Multi-lane detection based on deep convolutional neural network
CN110717886A (zh) 复杂环境下基于机器视觉的路面坑塘检测方法
CN113269224A (zh) 一种场景图像分类方法、系统及存储介质
CN114596500A (zh) 一种基于通道-空间注意力和DeeplabV3plus的遥感影像语义分割方法
CN113129336A (zh) 一种端到端多车辆跟踪方法、系统及计算机可读介质
CN115410081A (zh) 一种多尺度聚合的云和云阴影辨识方法、系统、设备及存储介质
CN116246169A (zh) 基于SAH-Unet的高分辨率遥感影像不透水面提取方法
CN117649607B (zh) 基于SegNet深度学习模型的海草床遥感识别方法、装置
CN116861262B (zh) 一种感知模型训练方法、装置及电子设备和存储介质
CN107529647B (zh) 一种基于多层无监督稀疏学习网络的云图云量计算方法
CN113421210A (zh) 一种基于双目立体视觉的表面点云重建方法
CN113989612A (zh) 基于注意力及生成对抗网络的遥感影像目标检测方法
CN117649635B (zh) 狭窄水道场景影消点检测方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant