CN107918776B - 一种基于机器视觉的用地规划方法、系统及电子设备 - Google Patents
一种基于机器视觉的用地规划方法、系统及电子设备 Download PDFInfo
- Publication number
- CN107918776B CN107918776B CN201711060490.4A CN201711060490A CN107918776B CN 107918776 B CN107918776 B CN 107918776B CN 201711060490 A CN201711060490 A CN 201711060490A CN 107918776 B CN107918776 B CN 107918776B
- Authority
- CN
- China
- Prior art keywords
- terrain
- layer
- convolution
- neural network
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 110
- 230000011218 segmentation Effects 0.000 claims abstract description 54
- 239000000203 mixture Substances 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 70
- 238000012549 training Methods 0.000 claims description 58
- 230000006870 function Effects 0.000 claims description 46
- 230000000007 visual effect Effects 0.000 claims description 33
- 238000011176 pooling Methods 0.000 claims description 28
- 238000013139 quantization Methods 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 238000005070 sampling Methods 0.000 claims description 19
- 238000003062 neural network model Methods 0.000 claims description 18
- 230000015654 memory Effects 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 abstract description 10
- 238000005516 engineering process Methods 0.000 abstract description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 239000003643 water by type Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012876 topography Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及地形分割识别技术领域,特别涉及一种基于机器视觉的用地规划方法、系统及电子设备。所述方法包括:采集目标区域的地形图像数据;构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划。本申请省去了大量的人工户外测绘作业,应用场景的限制条件少,能够广泛,识别精度高。
Description
技术领域
本申请涉及地形分割识别技术领域,特别涉及一种基于机器视觉的用地规划方法、系统及电子设备。
背景技术
图像处理和计算机视觉是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步用计算机做图像处理,生成更适合人眼观察或传送给仪器检测的图像。
机器学习应用在图像(视频)识别上具有准确率高、识别速度快的优势。机器学习是人工智能的一个分支。人工智能的研究是从以“推理”为重点到以“知识”为重点,再到以“学习”为重点,一条自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。
湖南大学的邓维在硕士论文中提出了一种基于道路地形图的道路识别技术研究,该研究对比了各种图像分割技术,分析了阈值分割方法、边缘检测方法、区域分割方法等技术的主要特点。结合道路地形图像的道路特征,采用图像灰度化算法、灰度直方图均衡化算法,引入权植参数,提出了一种改进的中值滤波算法,在对图像进行对比度扩展后进行滤波去噪处理,然后针对道路地形特征,运用改进的中值滤波、阈值分割等图像处理技术,采用图像骨架的方式提取图像特征,对道路地形图进行识别提取,并给出了一套较为完整的目标识别算法与流程。最后,实现了一个道路地形识别系统,实现了对道路地形目标的识别定位,验证了该算法的正确性、可靠性和可行性。该方法针对于道路的识别速度效率较高,具有一定的实用性,但通过图像处理之后的图片仍然需要专业人员去阅读图片获取有效信息。
浙江大学和国家重点实验室(杭州)的朱文忠提出一种基于颜色特征的地形图要素分割和识别,该研究在《模式识别和人工智能》1996年9卷第2期中刊出。地图模式识别的基础技术是要素分,该研究在讨论分析了系列比例尺地形图的颜色特征和形状特征的基础上,结合图像处理技术和模式识别原理,提出了基于颜色特征的地形图要素分割和识别。该方法实现了地形图要素的自动分版,减少了地形图单要素识别和矢遗化的难度,但其仅仅完成主要目标的提取、识别和分类,并没有分割出各个类别目标的区域。
地形地貌对农林业的影响至关重要,在规划农垦区和林业区的过程中,如何高效准确地划分出平原和丘陵山岭地区,是地形合理规划的关键。而随着中国计算机科学和农林业自动化与智能化的发展,机器学习的相关研究成果在生产生活的应用越来越多。然而,基于机器学习的对象识别和分割技术对农垦区和林区用地进行规划目前还处于空白状态。
发明内容
本申请提供了一种基于机器视觉的用地规划方法、系统及电子设备,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种基于机器视觉的用地规划方法,包括:
步骤a:采集目标区域的地形图像数据;
步骤b:构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
步骤c:将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
步骤d:根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划。
本申请实施例采取的技术方案还包括:在所述步骤a中,所述地形图像数据为通过航拍设备采集的地形视频数据。
本申请实施例采取的技术方案还包括:在所述步骤a中,所述采集地形图像数据还包括:
步骤a1:按照数据分割间隔时间将采集的地形视频数据分割成包含地形对象的地形图片;
步骤a2:对每幅地形图片分别进行垂直翻转和镜像处理;
步骤a3:对每幅地形图片进行向下采样;
步骤a4:分别标注每幅地形图片中各地形对象的地形类别标签、各地形对象对应的地形位置标注框以及地形区域标注值;其中,所述地形类别标签是指各地形对象的地貌形态,所述地形位置标注框是指各地形对象在地形图片中所在的位置,所述地形区域标注值是指各地形对象在地形图片中的像素点分割标注值。
本申请实施例采取的技术方案还包括:所述步骤b还包括:将所述训练集中的地形图片输入基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,对卷积神经网络模型进行训练。
本申请实施例采取的技术方案还包括:在所述步骤b中,所述区域卷积神经网络分支包括输入层、可视化卷积网络、区域化目标网络层、活跃区域池化层、第一卷积层、第二卷积层、第一全连接层、第二全连接层和输出层;所述对卷积神经网络模型进行训练具体包括:
步骤b1:通过所述输入层输入地形图片;
步骤b2:通过所述可视化卷积网络使用叠加五次的卷积层和池化层提取地形图片的原始地形特征;
步骤b3:通过所述区域化目标网络根据原始地形特征提取带有地形位置候选框的地形图片特征集;
步骤b4:通过所述活跃区域池化层对所述带有地形位置候选框的地形图片特征集下采样处理;
步骤b5:通过所述第一卷积层和第二卷积层对所述下采样后的地形图片特征集进行两次卷积处理,得到尺寸和维数不变的地形图片特征集;
步骤b6:通过所述第一全连接层和第二全连接层采用RELU激活函数和drop对地形图片特征集进行处理,得到地形特征集合;
步骤b7:通过输出层根据地形特征集合输出各地形对象对应的地形类别和地形位置候选框。
本申请实施例采取的技术方案还包括:在所述步骤b中,所述对象区域全卷积分支的可视化卷积网络和区域化目标网络层与区域卷积神经网络分支共享同一个网络,所述对象区域全卷积分支还包括活跃区域量化层、具备残差网络结构的特征金字塔网络、第三卷积层、第四卷积层和第五卷积层,所述对卷积神经网络模型进行训练还包括:
步骤b8:通过所述活跃区域量化层对带有地形位置候选框的地形图片特征集进行下采样;
步骤b9:通过所述具备残差网络结构的特征金字塔网络对下采样后的地形图片特征集提取不同层次的地形图片特征集;
步骤b10:通过所述第三卷积层和第四卷积层对所述不同层次的地形图片特征集进行卷积处理,并通过所述第五卷积层输出各地形对象对应的地形区域。
本申请实施例采取的技术方案还包括:所述对卷积神经网络模型进行训练还包括:根据输出的地形对象的地形类别、地形位置候选框和地形区域与所述地形图片中标注的地形类别标签、地形位置标注框以及地形区域标注值间的误差构成损失函数L,并采用反向传播算法调整网络参数,直到损失函数L满足最小值后保存网络参数。
本申请实施例采取的技术方案还包括:所述损失函数L包括三个分量:
上述公式中,pi、ti和Ki分别为各地形对象的地形类别、地形位置候选框和地形区域的损失函数分量;其中:
上述公式中,参数i是一个小型batch中的anchor的索引值,参数Nclass代表地形类别的总数,参数Nbbox代表各地形对象的地形位置候选框中anchor的总数,参数Nmask代表各地形对象的地形区域的anchor的总数,参数pi代表第i个anchor预测值,参数ti表示各地形对象的地形位置候选框bbox的4个参数化坐标的向量,代表bbox和anchor活跃度的关系,参数Ki表示各地形对象的地形位置候选框bbox内的第i类地形类别的地形区域的像素点矩阵,参数E代表单位矩阵,函数式F(e,Ki)代表先将地形图片中的各个坐标点(x,y)的地形类别保存于Ki矩阵,参数λ、β是三个损失分量的平衡参数,用于将Lclass、Lbbox和Lmask三个分量进行归一化。
本申请实施例采取的另一技术方案为:一种基于机器视觉的地形识别系统,包括:
数据采集模块:用于采集目标区域的地形图像数据;
网络构建模块:用于构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
地形识别模块:用于将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
用地规划模块:用于根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划。
本申请实施例采取的技术方案还包括:所述地形图像数据为通过航拍设备采集的地形视频数据。
本申请实施例采取的技术方案还包括:
数据分割模块:用于按照数据分割间隔时间将采集的地形视频数据分割成包含地形对象的地形图片;
数据预处理模块:用于对每幅地形图片分别进行垂直翻转和镜像处理后,对每幅地形图片进行向下采样,并分别标注每幅地形图片中各地形对象的地形类别标签、各地形对象对应的地形位置标注框以及地形区域标注值;其中,所述地形类别标签是指各地形对象的地貌形态,所述地形位置标注框是指各地形对象在地形图片中所在的位置,所述地形区域标注值是指各地形对象在地形图片中的像素点分割标注值。
本申请实施例采取的技术方案还包括网络训练模块,所述网络训练模块用于将所述训练集中的地形图片输入基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,对卷积神经网络模型进行训练。
本申请实施例采取的技术方案还包括:所述区域卷积神经网络分支包括输入层、可视化卷积网络、区域化目标网络层、活跃区域池化层、第一卷积层、第二卷积层、第一全连接层、第二全连接层和输出层;所述网络训练模块包括:
输入单元:用于通过输入层输入地形图片;
第一特征提取单元:用于通过可视化卷积网络使用叠加五次的卷积层和池化层提取地形图片的原始地形特征;
第二特征提取单元:用于通过区域化目标网络根据原始地形特征提取带有地形位置候选框的地形图片特征集;
第一下采样单元:用于通过活跃区域池化层对所述带有地形位置候选框的地形图片特征集下采样处理;
第一卷积单元:用于通过第一卷积层和第二卷积层对所述下采样后的地形图片特征集进行两次卷积处理,得到尺寸和维数不变的地形图片特征集;
集合输出单元:用于通过第一全连接层和第二全连接层采用RELU激活函数和drop对地形图片特征集进行处理,得到地形特征集合;
第一结果输出单元:用于通过输出层根据地形特征集合输出各地形对象对应的地形类别和地形位置候选框。
本申请实施例采取的技术方案还包括:所述对象区域全卷积分支的可视化卷积网络和区域化目标网络层与区域卷积神经网络分支共享同一个网络,所述对象区域全卷积分支还包括活跃区域量化层、具备残差网络结构的特征金字塔网络、第三卷积层、第四卷积层和第五卷积层,所述网络训练模块还包括:
第二下采样单元:用于通过活跃区域量化层对带有地形位置候选框的地形图片特征集进行下采样;
第三特征提取单元:用于通过具备残差网络结构的特征金字塔网络对下采样后的地形图片特征集提取不同层次的地形图片特征集;
第二卷积单元:用于通过第三卷积层和第四卷积层对所述不同层次的地形图片特征集进行卷积处理;
第二结果输出单元:用于通过第五卷积层输出各地形对象对应的地形区域。
本申请实施例采取的技术方案还包括:所述网络训练模块还包括损失函数计算单元,所述损失函数计算单元用于根据输出的地形对象的地形类别、地形位置候选框和地形区域与所述地形图片中标注的地形类别标签、地形位置标注框以及地形区域标注值间的误差构成损失函数L,并采用反向传播算法调整网络参数,直到损失函数L满足最小值后保存网络参数。
本申请实施例采取的技术方案还包括:所述损失函数L包括三个分量:
上述公式中,pi、ti和Ki分别为各地形对象的地形类别、地形位置候选框和地形区域的损失函数分量;其中:
上述公式中,参数i是一个小型batch中的anchor的索引值,参数Nclass代表地形类别的总数,参数Nbbox代表各地形对象的地形位置候选框中anchor的总数,参数Nmask代表各地形对象的地形区域的anchor的总数,参数pi代表第i个anchor预测值,参数ti表示各地形对象的地形位置候选框bbox的4个参数化坐标的向量,代表bbox和anchor活跃度的关系,参数Ki表示各地形对象的地形位置候选框bbox内的第i类地形类别的地形区域的像素点矩阵,参数E代表单位矩阵,函数式F(e,Ki)代表先将地形图片中的各个坐标点(x,y)的地形类别保存于Ki矩阵,参数λ、β是三个损失分量的平衡参数,用于将Lclass、Lbbox和Lmask三个分量进行归一化。
本申请实施例采取的又一技术方案为:一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的基于机器视觉的用地规划方法的以下操作:
步骤a:采集目标区域的地形图像数据;
步骤b:构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
步骤c:将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
步骤d:根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的基于机器视觉的用地规划方法、系统及电子设备通过用大量的带有地形类别、各地形对象对应的地形位置标注框以及地形区域标注值的地形图片数据构建“区域卷积神经网络分支+对象区域全卷积分支”的神经网络模型;并利用航拍设备采集目标区域的地形图像或视频,将地形图像或视频输入训练好的“区域卷积神经网络分支+对象区域全卷积分支”的神经网络模型进行地形对象的分类和各地形对象的地形区域分割。相对于现有技术,本申请至少具有以下优点:
1、本申请通过将采集的地形图像数据分割成包含地形对象的地形图片,再对地形图片进行识别和分割,保留了地形视频数据中各地形类别的时空特征,有利于提高识别精度;
2、通过在对象区域全卷积分支引入残差网络和特征金字塔网络进行地形特征的提取,增强了训练的拟合度,并且减少了计算量,模型参数少,降低了硬件设备的计算性能要求,提高了算法的适用性和鲁棒性;
3、通过剔除近似量化过程的活跃区域量化层来构成卷积神经网络模型,进行地形区域的分割,使得地形图片中的地形区域分割更加精确,地形区域的边缘分割处理更加高效;
4、本申请借助航拍图片的处理而非实地测绘,应用场景的限制条件少,能够广泛,将训练好的卷积神经网络模型移植到硬件平台,可以做到单机识别,并便于后续的系统升级和更新;
5、本申请使用更先进的”区域卷积神经网络分支+对象区域全卷积分支”识别算法,可以根据地形视频数据的连续帧图片进行识别和分割,并且可以后期将各个片段拼接成整体的规划图,精度更高且具备完整性;
6、本申请不需要规划人员使用等高线等其他的测绘数据,省去了大量的人工户外测绘作业,优化了规划者的使用体验。
附图说明
图1是本申请第一实施例的基于机器视觉的用地规划方法的流程图;
图2是本申请第二实施例的基于机器视觉的用地规划方法的流程图;
图3为本申请实施例的卷积神经网络模型的结构示意图;
图4是本申请实施例的区域卷积神经网络分支训练方式的流程图;
图5是本申请实施例的区域化目标网络层的结构示意图;
图6是本申请实施例的对象区域全卷积分支训练方式的流程图;
图7是本申请实施例的基于机器视觉的地形识别系统的结构示意图;
图8是本发明实施例提供的基于机器视觉的用地规划方法的硬件设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请第一实施例的基于机器视觉的用地规划方法的流程图。本申请第一实施例的基于机器视觉的用地规划方法包括以下步骤:
步骤a:采集目标区域的地形图像数据;
步骤b:构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
步骤c:将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
步骤d:根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划。
本申请实施例的基于机器视觉的用地规划方法通过用大量的带有地形类别、各地形对象对应的地形位置标注框以及地形区域标注值的地形图片数据构建“区域卷积神经网络分支+对象区域全卷积分支”的神经网络模型;在地形识别时,利用航拍设备采集目标区域的地形图像或视频,并将地形图像或视频输入训练好的“区域卷积神经网络分支+对象区域全卷积分支”的神经网络模型,神经网络模型对输入的地形图像或视频进行地形对象的识别分类,并根据地形对象分类结果进行各地形对象对应的地形区域分割。本申请不需要利用等高线等测绘数据的计算就可以直接输出分类和分割结果,在保证了分类和分割精度的同时,分类和分割的速度更快。本申请适用于农林、建筑物、道路、岛屿、群岛等不同类型的地形识别,为了更加清楚的解释本申请的技术方案,以下实施例中,仅以农林类型的地形识别为例进行具体说明。
具体地,请参阅图2,是本申请第二实施例的基于机器视觉的用地规划方法的流程图。本申请第二实施例的基于机器视觉的用地规划方法包括以下步骤:
步骤200:采集地形图像数据;
在步骤200中,采集的地形图像数据为在拍摄区域内合适的天气情况下(无降雨,少云雾,风力影响较小)通过无人机、航拍飞行器等航拍设备采集的包括平原、丘陵、山岭以及水域等不同地貌形态的地形视频数据。在本申请实施例中,采集的地形视频数据以每帧大小为120×160像素,视频帧数为每秒25帧为例,具体的像素尺寸和视频帧数可根据采集需求进行设定。在采集地形图像数据时,所有区域类型的航拍高度均在相同范围内,且航拍设备的拍摄速度大致相同。
步骤210:按照设定的数据分割间隔时间将采集的地形图像数据分割成多个包含地形对象的地形图片,将分割的地形图片作为神经网络模型的训练集;
在步骤210中,以设定数据分割间隔时间为三十秒到一分钟为例,即可得到150×26×4个地形图片组成的训练集(即训练集中包含15600个训练样本),其中,150代表航拍设备的航拍起飞次数,26代表每次航拍的分钟数(经调研,无人机的一般续航时间为半小时左右),4代表每分钟采集的地形图像数据的数量。具体数据分割间隔时间可根据实际应用进行设定。
步骤220:对训练集中的每幅地形图片分别进行垂直翻转和镜像处理,以增加训练样本的示例数;
步骤230:对训练集中的地形图片进行数据预处理;
在步骤230中,对地形图片进行预处理具体为:
步骤231:对地形图片进行向下采样;
在步骤231中,下采样即模糊处理,例如将地形图片分辨率由120×160变成60×80,下采样处理后,可以压缩内存占用空间,提高算法效率。
步骤232:分别标注每幅地形图片中各地形对象的地形类别标签、各地形对象对应的地形位置标注框以及地形区域标注值。
在步骤232中,地形类别标签是指各地形对象的平原、丘陵、山岭以及水域等不同地貌形态,每幅地形图片中可以包括多个相同或不同的地形类别标签;地形位置标注框是指各类地形对象在地形图片中所在的位置,本申请实施例中,地形位置标注框为规则的矩形方框;地形区域标注值是指各类地形对象在地形图片中的像素点分割标注值。
步骤240:构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
在步骤240中,在步骤250中,本申请通过基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型对地形图片进行像素级别的识别与分割。具体如图3所示,为本申请实施例的卷积神经网络模型的结构示意图。卷积神经网络模型分为两个并行的分支,第一个分支是区域卷积神经网络分支,用于得到各地形对象的地形类别和对应的地形位置候选框;第二个分支是对象区域全卷积分支,用于以地形位置候选框为输入,经过残差网络的处理得到各地形对象的地形特征信息,并输出各地形对象对应的地形区域结果。
具体地,区域卷积神经网络分支依次包括输入层、可视化卷积网络、区域化目标网络层、活跃区域池化层、第一卷积层、第二卷积层、第一全连接层、第二全连接层和输出层;可视化卷积网络包括叠加五次的卷积层和池化层,最后一层池化层通过第一全连接层和第二全连接层全连接到Softmax地形类别分类器和regressor地形位置候选框分类器。输入层用于输入地形图片,可视化卷积网络用于提取地形图片的原始地形特征,区域化目标网络用于通过提取的原始地形特征提取带有地形位置候选框的地形图片特征集,并经活跃区域池化层对地形图片特征集下采样处理后,通过第一卷积层和第二卷积层得到尺寸和维数不变的地形图片特征集,最后通过第一全连接层和第二全连接层将地形图片特征集全连接到Softmax地形类别分类器和regressor地形位置候选框分类器,并通过输出层输出各地形对象的地形类别和对应的地形位置候选框。
对象区域全卷积分支的可视化卷积网络和区域化目标网络层与区域卷积神经网络分支共享同一个网络。不同的是,对象区域全卷积分支的区域化目标网络层之后依次是活跃区域量化层、具备残差网络结构的特征金字塔网络、第三卷积层、第四卷积层和第五卷积层;首先,带有地形位置候选框的地形图片特征集经过活跃区域量化层进行准确值量化保证地形图片的空间信息完整;地形位置候选框作为输入经过残差网络的处理得到各地形对象的地形特征,经过特征金字塔网络得到不同层次的地形图片特征集,并通过第三卷积层和第四卷积层的卷积处理后,通过第五卷积层输出各地形对象对应的地形区域。
步骤250:将训练集中的地形图片输入基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,对基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型进行训练;
为了清楚说明卷积神经网络模型的训练方式,以下分别通过两个实施例分别对区域卷积神经网络分支和对象区域全卷积分支的训练方式进行具体说明,而实施例中代入的参数仅用于举例说明,具体可根据实际应用进行设定。
请参阅图4,是本申请实施例的区域卷积神经网络分支训练方式的流程图。本申请实施例的区域卷积神经网络分支训练方式包括以下步骤:
步骤2501a:通过输入层输入一张120×160×3的地形图片;
步骤2502a:通过可视化卷积网络提取地形图片的原始地形特征,得到14*14*25的地形图片特征集;其中,14*14是尺寸,25是维数;
在步骤2502a中,原始地形特征的提取方式具体为:
1、可视化卷积网络的第一深度开始是卷积核为7*7*96、步长为2、padding(填充)为3的卷积层,再经过3*3窗口、步长为2、padding为1的max pooling(对上一层中的数据取最大值)层,提取地形图片数据中的原始地形特征;原始地形特征具体是指:湖泊等水域的原始地形特征表现在地形图片中为蓝色或深蓝色的水域颜色,山地在地形图片中的原始地形特征表现为树木丛林的分布密度,以及山体外形、山脉走势等特征。
2、可视化卷积网络的第二深度开始是卷积核为5*5*56、步长为2、padding为2、用bias(偏差)对地形对象分类结果进行修正的卷积层,再重复第一深度中的max pooling层结构,提取地形图片中各地形对象的原始地形特征;
3、可视化卷积网络的第三、第四深度均是卷积核为3*3*384、步长为1、padding为1的卷积层,并且都采用bias对地形对象的分类结果进行修正;
4、可视化卷积网络的第五深度是卷积核为3*3*256、步长为1、padding为1的卷积层,采用bias对地形对象的分类结果进行修正。
步骤2503a:通过区域化目标网络层以可视化卷积网络输出的地形图片特征集为输入,并输出300个带有地形位置候选框的14*14*25的地形图片特征集;
在步骤2503a中,区域化目标网络层的结构如图6所示。在训练的时候,使用区域化目标网络预测候选的地形图片ROI(region ofinterest,感兴趣区域)列表,ROI列表是指地形图片中各地形对象的地形区域信息列表,包括各地形对象的地形类别以及位置坐标等;预测的ROI列表可能会训练速度很慢或者loss就不收敛,因此需要对预测到的ROI列表中的地形特征数据进行一些改造:
1、将各地形对象对应的地形位置标注框加入到活跃区域中;
2、通过将活跃区域和各地形类别对应的地形位置标注框对比,调整地形区域结果和原始地形图片中的地形区域覆盖比例。
步骤2504a:活跃区域池化层以区域化目标网络输出的带有地形位置候选框的14*14*25的地形图片特征集以及可视化卷积网络输出的14*14*256的地形图片特征集为输入,通过下采样对地形图片特征集进行近似处理,得到尺寸大小为51*39、维数为256的地形图片特征集;
在步骤2504a中,在测试的时候,活跃区域池化层从区域化目标网络得到候选的地形图片ROI列表,通过第五层卷积层得到所有地形对象的地形特征,例如平原、丘陵、山岭以及水域等,进行后面的分类和回归。
步骤2505a:通过第一卷积层和第二卷积层采用3*3的卷积核和ReLU(RectifiedLinear Unit)激活函数对地形图片特征集进行两次卷积处理,得到尺寸和维数不变的地形图片特征集;
在步骤2505a中,利用ReLU的梯度不饱和和计算速度相对较快的优点,对输入的尺寸大小51*39且维数为256的地形图片特征集进行处理,得到尺寸和维数不变的地形图片特征集。
步骤2506a:通过第一全连接层和第二全连接层采用RELU激活函数和drop,对输入的尺寸大小51*39且维数为256的地形图片特征集进行处理,得到大小为2048的地形特征集合;
步骤2507a:通过输出层对大小为2048的地形特征集合进行处理后,输出各地形对象对应的地形类别和地形位置候选框结果。
在步骤2507a中,由于地形复杂不规则的原因,地形位置候选框会有重叠部分。
请参阅图6,是本申请实施例的对象区域全卷积分支训练方式的流程图。本申请实施例的对象区域全卷积分支训练方式包括以下步骤:
步骤2501b:通过活跃区域量化层对带有地形位置候选框的地形图片特征集进行下采样,得到尺寸大小51*39且维数为256的地形图片特征集;
在步骤2501b中,活跃区域量化层的输入是经过反卷积网络处理得到的14*14*25的地形图片特征集、带有300个地形位置候选框的14*14*25的地形图片特征集和带有地形类别和地形位置候选框分类结果的地形图片特征集;通过活跃区域量化层解决活跃区域池化层量化引入的问题,避免对目标地形类别活跃区域(目标地形类别活跃区域属于要分割识别的地形类别)的边界或bins进行近似量化,使用线性差值精确计算每个RoI和bin,最后组合起来,从而得到的输出是尺寸大小51*39且维数为256的地形图片特征集。
步骤2502b:通过特征金字塔网络提取不同层次的地形图片特征集;
在步骤2502b中,特征金字塔网络的输入51*39*256的地形图片特征集,通过结合残差网络的网络结构设计实现特征金字塔网络,分n个层次地提取地形特征,并且有效地提高了拟合度,从而得到n个不同层次的51*39*256的地形图片特征集。特征金字塔网络沿着特征金字塔的低端向顶端一层一层做池化。有256个这样的filter(滤波器),每个filter对应一张13x13的地形图片响应图。特征金字塔网络将地形图片响应图分成1x1、2x2、4x4不同层次的三张子图,并分别做max pooling后,提取出来的地形特征就是(16+4+1)x256维度。如果输入的地形图片尺寸发生变化,输出的地形特征依然是(16+4+1)x256维度。这样就实现了不管地形图片尺寸如何池化,输出的地形特征永远是(16+4+1)x256维度。
步骤2530b:通过第三卷积层和第四卷积层采用3*3的卷积核和RELU激活函数对输入的尺寸大小为51*39且维数为256的地形图片特征集进行两次卷积处理,得到尺寸和维数不变的地形图片特征集;
步骤2504b:通过第五卷积层采用1*1的卷积核对输入的尺寸大小51*39且维数为256的地形图片特征集进行处理,并输出尺寸大小不变、维数变为地形类别数目的地形区域结果;
在步骤2504b中,地形类别数目为4,包括平原类别、丘陵类别、山地类别和水域类别,具体的地形类别数目可根据实际情况进行设定。
上述中,各个卷积层的权值矩阵Wi的更新公式为:
Wi=Wi-1+Wi-1 T
上述公式中,Wi是第i层卷积层的权值矩阵,Wi-1、Wi-1 T分别是第i-1层即上一层卷积层的权值矩阵和其转置矩阵。。
本申请实施例在模型训练过程中根据输出的地形对象的地形类别、地形位置候选框和地形区域与原地形图片中标注的地形类别标签、地形位置标注框以及地形区域标注值间的误差构成损失函数L,并采用反向传播算法(BP算法)调整网络参数,直到损失函数L满足最小值后保存网络参数,模型训练结束,从而得到一个以地形图片为输入,并输出地形图片中各地形对象对应的地形类别的识别结果、以及包括地形位置候选框和地形区域的分割结果。
具体地,根据地形类别class、地形位置候选框bbox和地形区域mask这三个输出,每个ROI的损失函数L分为三个分量:
上述公式中,L({pi},{ti},{Ki})中的三个分量pi、ti和Ki分别为各地形对象的地形类别、地形位置候选框和地形区域的损失函数分量。其中:
上述公式中,参数i是一个小型batch中的anchor的索引值;
参数Nclass代表地形类别的总数,在本申请实施例中,Nclass=4,即平原、丘陵、山岭和水域,共4类。
参数Nbbox代表各地形对象的地形位置候选框中anchor的总数,本申请实施例中,Nbbox值为2400,具体可根据实际应用进行设定。
参数Ki表示地形图片中各地形对象的地形位置候选框bbox内的第i类地形类别的地形区域的像素点矩阵,该矩阵中像素点(x,y)若为地形对象则值取1,否则该像素点值取0。
参数E代表单位矩阵。
参数λ、β是三个损失分量的平衡参数,用于将Lclass、Lbbox和Lmask三个部分进行归一化。在训练中本申请实施例将参数λ、β的值分别设置为10和16。
步骤260:将目标区域的地形图片输入训练好的卷积神经网络,通过卷积神经网络模型提取地形图片的地形特征,根据地形特征进行地形对象的识别分类,并根据类别分类结果进行地形区域的分割;
在步骤260中,在进行地形识别时,首先通过带有摄像头的无人机、航拍飞行器等航拍设备采集目标区域的地形视频图像,并将地形视频图像进行分割及预处理,得到包含地形对象的地形图片;然后进入用于用地规划的地形识别分割系统,系统会提示用户输入目标区域(待规划区域)的地形图片,并会显示用地规划方案供用户选择,用地规划方案包括农垦区规划、林区规划、农区和林区规划等,用户也可在系统内自定义用地规划方案。用户选择地形图片并输入地形识别分割系统后,地形识别分割系统通过卷积神经网络模型提取地形图片的地形特征,并自动输出地形对象分类结果和各地形对象的地形区域分割结果。
步骤270:根据地形对象分类结果和各地形对象的地形区域分割结果判断目标区域的地形组成,并以此对目标区域进行用地规划;
在步骤270中,完成用地规划后通过显示设备显示并存储用地规划结果供规划者参考,不需要规划人员使用等高线等其他的测绘数据,省去了大量的人工户外测绘作业,优化了规划者的使用体验,规划者也可以根据系统给出的规划参考目标区域区的规划结果进行制定和调节。
请参阅图7,是本申请实施例的基于机器视觉的地形识别系统的结构示意图。本申请实施例的基于机器视觉的地形识别系统包括数据采集模块、数据分割模块、数据预处理模块、网络构建模块、网络训练模块、地形识别模块、用地规划模块和显示模块。
数据采集模块:用于采集地形图像数据;其中,数据采集模块为带有摄像头的无人机、航拍飞行器等航拍设备,采集的地形图像数据为在拍摄区域内合适的天气情况下(无降雨,少云雾,风力影响较小)包括平原、丘陵、山岭以及水域等不同地貌形态的地形视频数据。在本申请实施例中,采集的地形视频数据以每帧大小为120×160像素,视频帧数为每秒25帧为例,具体的像素尺寸和视频帧数可根据采集需求进行设定。在采集地形图像数据时,所有区域类型的航拍高度均在相同范围内,且航拍设备的拍摄速度大致相同,航拍图像比卫星遥感图像能保留更多的特征信息,有利于地形识别的准确性。
数据分割模块:用于按照设定的数据分割间隔时间将采集的地形图像数据分割成多个包含地形对象的地形图片,将分割的地形图片作为神经网络模型的训练集;其中,以设定数据分割间隔时间为三十秒到一分钟为例,即可得到150×26×4个地形图片组成的训练集(即训练集中包含15600个训练样本),其中,150代表航拍设备的航拍起飞次数,26代表每次航拍的分钟数,4代表每分钟采集的地形图像数据的数量。具体数据分割间隔时间可根据实际应用进行设定。
数据预处理模块:用于对训练集中的每幅地形图片分别进行垂直翻转和镜像处理,并对训练集中的地形图片进行数据预处理;其中,对地形图片进行预处理具体为:对地形图片进行向下采样,并分别标注每幅地形图片中各地形对象的地形类别标签、各地形对象对应的地形位置标注框以及地形区域标注值。下采样即模糊处理,例如将地形图片分辨率由120×160变成60×80,下采样处理后,可以压缩内存占用空间,提高算法效率。标注的地形类别标签是指各地形对象的平原、丘陵、山岭以及水域等不同地貌形态,每幅地形图片中可以包括多个相同或不同的地形类别标签;地形位置标注框是指各类地形对象在地形图片中所在的位置,本申请实施例中,地形位置标注框为规则的矩形方框;地形区域标注值是指各类地形对象在地形图片中的像素点分割标注值。
网络构建模块:用于构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;本申请实施例的卷积神经网络模型分为两个并行的分支,第一个分支是区域卷积神经网络分支,用于得到各地形对象的地形类别和对应的地形位置候选框;第二个分支是对象区域全卷积分支,用于以地形位置候选框为输入,经过残差网络的处理得到各地形对象的地形特征信息,并输出各地形对象对应的地形区域结果。
具体地,区域卷积神经网络分支依次包括输入层、可视化卷积网络、区域化目标网络层、活跃区域池化层、第一卷积层、第二卷积层、第一全连接层、第二全连接层和输出层;可视化卷积网络包括叠加五次的卷积层和池化层,最后一层池化层通过第一全连接层和第二全连接层全连接到Softmax地形类别分类器和regressor地形位置候选框分类器。输入层用于输入地形图片,可视化卷积网络用于提取地形图片的原始地形特征,区域化目标网络用于通过提取的原始地形特征提取带有地形位置候选框的地形图片特征集,并经活跃区域池化层对地形图片特征集下采样处理后,通过第一卷积层和第二卷积层得到尺寸和维数不变的地形图片特征集,最后通过第一全连接层和第二全连接层将地形图片特征集全连接到Softmax地形类别分类器和regressor地形位置候选框分类器,并通过输出层输出各地形对象的地形类别和对应的地形位置候选框。
对象区域全卷积分支的可视化卷积网络和区域化目标网络层与区域卷积神经网络分支共享同一个网络。不同的是,对象区域全卷积分支的区域化目标网络层之后依次是活跃区域量化层、具备残差网络结构的特征金字塔网络、第三卷积层、第四卷积层和第五卷积层;首先,带有地形位置候选框的地形图片特征集经过活跃区域量化层进行准确值量化保证地形图片的空间信息完整;地形位置候选框作为输入经过残差网络的处理得到各地形对象的地形特征,经过特征金字塔网络得到不同层次的地形图片特征集,并通过第三卷积层和第四卷积层的卷积处理后,通过第五卷积层输出各地形对象对应的地形区域。
网络训练模块:用于将训练集中的地形图片输入基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,对卷积神经网络模型进行训练;具体地,网络训练模块包括:
输入单元:用于通过输入层输入一张120×160×3的地形图片;
第一特征提取单元:用于通过可视化卷积网络提取地形图片的原始地形特征,得到地形图片的特征集为14*14*25,其中,14*14是尺寸,25是维数;中,原始地形特征的提取方式具体为:
1、可视化卷积网络的第一深度开始是卷积核为7*7*96、步长为2、padding(填充)为3的卷积层,再经过3*3窗口、步长为2、padding为1的max pooling(对上一层中的数据取最大值)层,提取地形图片数据中的原始地形特征;原始地形特征具体是指:湖泊等水域的原始地形特征表现在地形图片中为蓝色或深蓝色的水域颜色,山地在地形图片中的原始地形特征表现为树木丛林的分布密度,以及山体外形、山脉走势等特征。
2、可视化卷积网络的第二深度开始是卷积核为5*5*56、步长为2、padding为2、用bias(偏差)对地形对象分类结果进行修正的卷积层,再重复第一深度中的max pooling层结构,提取地形图片中各地形对象的原始地形特征;
3、可视化卷积网络的第三、第四深度均是卷积核为3*3*384、步长为1、padding为1的卷积层,并且都采用bias对地形对象的分类结果进行修正;
4、可视化卷积网络的第五深度是卷积核为3*3*256、步长为1、padding为1的卷积层,采用bias对地形对象的分类结果进行修正。
第二特征提取单元:用于通过区域化目标网络层以可视化卷积网络输出的地形图片特征集为输入,并输出300个带有地形位置候选框的14*14*25的地形图片特征集;在训练的时候,使用区域化目标网络预测候选的地形图片ROI列表,ROI列表是指地形图片中各地形对象的地形区域信息列表,包括各地形对象的地形类别以及位置坐标等;预测的ROI列表可能会训练速度很慢或者loss就不收敛,因此需要对预测到的ROI列表中的地形特征数据进行一些改造:
1、将各地形对象对应的地形位置标注框加入到活跃区域中;
2、通过将活跃区域和各地形类别对应的地形位置标注框对比,调整地形区域结果和原始地形图片中的地形区域覆盖比例。
第一下采样单元:用于通过活跃区域池化层以区域化目标网络输出的带有地形位置候选框的14*14*25的地形图片特征集以及可视化卷积网络输出的14*14*256的地形图片特征集为输入,通过下采样对地形图片特征集进行近似处理,得到尺寸大小为51*39、维数为256的地形图片特征集;其中,在测试的时候,活跃区域池化层从区域化目标网络得到候选的地形图片ROI列表,通过第五层卷积层得到所有地形对象的地形特征,例如平原、丘陵、山岭以及水域等,进行后面的分类和回归。
第一卷积单元:用于通过第一卷积层和第二卷积层采用3*3的卷积核和ReLU(Rectified Linear Unit)激活函数对地形图片特征集进行两次卷积处理,得到尺寸和维数不变的地形图片特征集;其中,利用ReLU的梯度不饱和和计算速度相对较快的优点,对输入的尺寸大小51*39且维数为256的地形图片特征集进行处理,得到尺寸和维数不变的地形图片特征集。
集合输出单元:用于通过第一全连接层和第二全连接层采用RELU激活函数和drop,对输入的尺寸大小51*39且维数为256的地形图片特征集进行处理,得到大小为2048的地形特征集合;
第一结果输出单元:用于通过输出层对大小为2048的地形特征集合进行处理后,输出各地形对象对应的地形类别和地形位置候选框结果。
第二下采样单元:用于通过活跃区域量化层对带有地形位置候选框的地形图片特征集进行下采样,得到尺寸大小51*39且维数为256的地形图片特征集;其中,活跃区域量化层的输入是经过反卷积网络处理得到的14*14*25的地形图片特征集、带有300个地形位置候选框的14*14*25的地形图片特征集和带有地形类别和地形位置候选框分类结果的地形图片特征集;通过活跃区域量化层解决活跃区域池化层量化引入的问题,避免对目标地形类别活跃区域(目标地形类别活跃区域属于要分割识别的地形类别)的边界或bins进行近似量化,使用线性差值精确计算每个RoI和bin,最后组合起来,从而得到的输出是尺寸大小51*39且维数为256的地形图片特征集。
第三特征提取单元:用于通过特征金字塔网络提取不同层次的地形图片特征集;其中,特征金字塔网络的输入51*39*256的地形图片特征集,通过结合残差网络的网络结构设计实现特征金字塔网络,分n个层次地提取地形特征,并且有效地提高了拟合度,从而得到n个不同层次的51*39*256的地形图片特征集。特征金字塔网络沿着特征金字塔的低端向顶端一层一层做池化。有256个这样的filter(滤波器),每个filter对应一张13x13的地形图片响应图。特征金字塔网络将地形图片响应图分成1x1、2x2、4x4不同层次的三张子图,并分别做max pooling后,提取出来的地形特征就是(16+4+1)x256维度。如果输入的地形图片尺寸发生变化,输出的地形特征依然是(16+4+1)x256维度。这样就实现了不管地形图片尺寸如何池化,输出的地形特征永远是(16+4+1)x256维度。
第二卷积单元:用于通过第三卷积层和第四卷积层采用3*3的卷积核和RELU激活函数对输入的尺寸大小为51*39且维数为256的地形图片特征集进行两次卷积处理,得到尺寸和维数不变的地形图片特征集;
第二结果输出单元:用于通过第五卷积层采用1*1的卷积核对输入的尺寸大小51*39且维数为256的地形图片特征集进行处理,并输出尺寸大小不变、维数变为地形类别数目的地形区域结果;其中,地形类别数目为4,包括平原类别、丘陵类别、山地类别和水域类别,具体的地形类别数目可根据实际情况进行设定。
上述中,各个卷积层的权值矩阵Wi的更新公式为:
Wi=Wi-1+Wi-1 T
上述公式中,Wi是第i层卷积层的权值矩阵,Wi-1、Wi-1 T分别是第i-1层即上一层卷积层的权值矩阵和其转置矩阵。
损失函数计算单元:用于根据输出的地形对象的地形类别、地形位置候选框和地形区域与原地形图片中标注的地形类别标签、地形位置标注框以及地形区域标注值间的误差构成损失函数L,并采用反向传播算法(BP算法)调整网络参数,直到损失函数L满足最小值后保存网络参数;模型训练结束之后,即可得到一个以地形图片为输入,并输出地形图片中各地形对象对应的地形类别的识别结果、以及包括地形位置候选框和地形区域的分割结果。
具体地,根据地形类别class、地形位置候选框bbox和地形区域mask这三个输出,每个ROI的损失函数L分为三个分量:
上述公式中,L({pi},{ti},{Ki})中的三个分量pi、ti各Ki分别为各地形对象的地形类别、地形位置候选框和地形区域的损失函数分量。其中:
上述公式中,参数i是一个小型batch中的anchor的索引值;
参数Nclass代表地形类别的总数,在本申请实施例中,Nclass=4,即平原、丘陵、山岭和水域,共4类。
参数Nbbox代表各地形对象的地形位置候选框中anchor的总数,本申请实施例中,Nbbox值为2400,具体可根据实际应用进行设定。
参数Ki表示地形图片中各地形对象的地形位置候选框bbox内的第i类地形类别的地形区域的像素点矩阵,该矩阵中像素点(x,y)若为地形对象则值取1,否则该像素点值取0。
参数E代表单位矩阵。
函数式F(e,Ki)代表先将地形图片中的各个坐标点(x,y)的地形类别值保存于Ki矩阵,Ki矩阵中的各元素值ki(x,y)替换为得到F(e,Ki),如代表各像素点是否属于该地形类别,属于则为一1,否则为0,则
参数λ、β是三个损失分量的平衡参数,用于将Lclass、Lbbox和Lmask三个部分进行归一化。在训练中本申请实施例将参数λ、β的值分别设置为10和16。
地形识别模块:用于将目标区域的地形图片输入训练好的卷积神经网络模型,通过卷积神经网络模型提取地形图片的地形特征,根据地形特征进行地形对象的识别分类,并根据类别分类结果进行地形区域的分割;其中,在进行地形识别时,首先(通过电视、电脑等设备)进入用于用地规划的地形识别分割系统,系统会提示用户输入目标区域(待规划区域)的地形图片,并会显示用地规划方案供用户选择,用地规划方案包括农垦区规划、林区规划、农区和林区规划等,用户也可在系统内自定义用地规划方案。
用地规划模块:用于根据地形对象分类结果和各地形对象的地形区域分割结果判断目标区域的地形组成,并以此对目标区域进行用地规划;
显示模块:用于显示并存储用地规划结果;在本申请实施例中,显示模块为电视或PC等终端设备。
图8是本发明实施例提供的计算候选公交站点的方法的硬件设备结构示意图。如图8所示,该设备包括一个或多个处理器以及存储器。以一个处理器为例,该设备还可以包括:输入系统和输出系统。
处理器、存储器、输入系统和输出系统可以通过总线或者其他方式连接,图8中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例的处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入系统可接收输入的数字或字符信息,以及产生信号输入。输出系统可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个处理器执行时,执行上述任一方法实施例的以下操作:
步骤a:采集目标区域的地形图像数据;
步骤b:构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
步骤c:将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
步骤d:根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例提供的方法。
本发明实施例提供了一种非暂态(非易失性)计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行以下操作:
步骤a:采集目标区域的地形图像数据;
步骤b:构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
步骤c:将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
步骤d:根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划。
本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行以下操作:
步骤a:采集目标区域的地形图像数据;
步骤b:构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
步骤c:将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
步骤d:根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划。
本申请实施例的基于机器视觉的用地规划方法、系统及电子设备通过用大量的带有地形类别、各地形对象对应的地形位置标注框以及地形区域标注值的地形图片数据构建“区域卷积神经网络分支+对象区域全卷积分支”的神经网络模型;并利用航拍设备采集目标区域的地形图像或视频,将地形图像或视频输入训练好的“区域卷积神经网络分支+对象区域全卷积分支”的神经网络模型进行地形对象的分类和各地形对象的地形区域分割。相对于现有技术,本申请至少具有以下优点:
1、本申请通过将采集的地形图像数据分割成包含地形对象的地形图片,再对地形图片进行识别和分割,保留了地形视频数据中各地形类别的时空特征,有利于提高识别精度;
2、通过在对象区域全卷积分支引入残差网络和特征金字塔网络进行地形特征的提取,增强了训练的拟合度,并且减少了计算量,模型参数少,降低了硬件设备的计算性能要求,提高了算法的适用性和鲁棒性;
3、通过剔除近似量化过程的活跃区域量化层来构成卷积神经网络,进行地形区域的分割,使得地形图片中的地形区域分割更加精确,地形区域的边缘分割处理更加高效;
4、本申请借助航拍图片的处理而非实地测绘,应用场景的限制条件少,能够广泛,将训练好的卷积神经网络移植到硬件平台,可以做到单机识别,并便于后续的系统升级和更新;
5、本申请使用更先进的”区域卷积神经网络分支+对象区域全卷积分支”识别算法,可以根据地形视频数据的连续帧图片进行识别和分割,并且可以后期将各个片段拼接成整体的规划图,精度更高且具备完整性;
6、本申请不需要规划人员使用等高线等其他的测绘数据,省去了大量的人工户外测绘作业,优化了规划者的使用体验。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (17)
1.一种基于机器视觉的用地规划方法,其特征在于,包括:
步骤a:采集目标区域的地形图像数据;
步骤b:构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
步骤c:将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
步骤d:根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划;
其中,所述区域卷积神经网络分支包括输入层、可视化卷积网络、区域化目标网络层、活跃区域池化层、第一卷积层、第二卷积层、第一全连接层、第二全连接层和输出层;
所述对象区域全卷积分支包括活跃区域量化层、具备残差网络结构的特征金字塔网络、第三卷积层、第四卷积层和第五卷积层。
2.根据权利要求1所述的基于机器视觉的用地规划方法,其特征在于,在所述步骤a中,所述地形图像数据为通过航拍设备采集的地形视频数据。
3.根据权利要求2所述的基于机器视觉的用地规划方法,其特征在于,在所述步骤a中,所述采集地形图像数据还包括:
步骤a1:按照数据分割间隔时间将采集的地形视频数据分割成包含地形对象的地形图片;
步骤a2:对每幅地形图片分别进行垂直翻转和镜像处理;
步骤a3:对每幅地形图片进行向下采样;
步骤a4:分别标注每幅地形图片中各地形对象的地形类别标签、各地形对象对应的地形位置标注框以及地形区域标注值;其中,所述地形类别标签是指各地形对象的地貌形态,所述地形位置标注框是指各地形对象在地形图片中所在的位置,所述地形区域标注值是指各地形对象在地形图片中的像素点分割标注值。
4.根据权利要求3所述的基于机器视觉的用地规划方法,其特征在于,所述步骤b还包括:将训练集中的地形图片输入基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,对卷积神经网络模型进行训练。
5.根据权利要求4所述的基于机器视觉的用地规划方法,其特征在于,在所述步骤b中,所述对卷积神经网络模型进行训练具体包括:
步骤b1:通过所述输入层输入地形图片;
步骤b2:通过所述可视化卷积网络使用叠加五次的卷积层和池化层提取地形图片的原始地形特征;
步骤b3:通过所述区域化目标网络根据原始地形特征提取带有地形位置候选框的地形图片特征集;
步骤b4:通过所述活跃区域池化层对所述带有地形位置候选框的地形图片特征集下采样处理;
步骤b5:通过所述第一卷积层和第二卷积层对所述下采样后的地形图片特征集进行两次卷积处理,得到尺寸和维数不变的地形图片特征集;
步骤b6:通过所述第一全连接层和第二全连接层采用RELU激活函数和drop对地形图片特征集进行处理,得到地形特征集合;
步骤b7:通过输出层根据地形特征集合输出各地形对象对应的地形类别和地形位置候选框。
6.根据权利要求5所述的基于机器视觉的用地规划方法,其特征在于,在所述步骤b中,对象区域全卷积分支的可视化卷积网络和区域化目标网络层与区域卷积神经网络分支共享同一个网络,所述对卷积神经网络模型进行训练还包括:
步骤b8:通过所述活跃区域量化层对带有地形位置候选框的地形图片特征集进行下采样;
步骤b9:通过所述具备残差网络结构的特征金字塔网络对下采样后的地形图片特征集提取不同层次的地形图片特征集;
步骤b10:通过所述第三卷积层和第四卷积层对所述不同层次的地形图片特征集进行卷积处理,并通过所述第五卷积层输出各地形对象对应的地形区域。
7.根据权利要求6所述的基于机器视觉的用地规划方法,其特征在于,所述对卷积神经网络模型进行训练还包括:根据输出的地形对象的地形类别、地形位置候选框和地形区域与所述地形图片中标注的地形类别标签、地形位置标注框以及地形区域标注值间的误差构成损失函数L,并采用反向传播算法调整网络参数,直到损失函数L满足最小值后保存网络参数。
8.根据权利要求7所述的基于机器视觉的用地规划方法,其特征在于,所述损失函数L包括三个分量:
上述公式中,L({pi}、{ti}、{Ki})中的三个分量pi、ti和Ki分别为各地形对象的地形类别、地形位置候选框和地形区域的损失函数分量;其中:
上述公式中,参数i是一个小型batch中的anchor的索引值,参数Nclass代表地形类别的总数,参数Nbbox代表各地形对象的地形位置候选框中anchor的总数,参数Nmask代表各地形对象的地形区域的anchor的总数,参数pi代表第i个anchor预测值,如果该anchor是活跃的,即属于识别的地形类别,则值取1,否则值取0,参数ti表示各地形对象的地形位置候选框bbox的4个参数化坐标的向量,代表bbox和anchor活跃度的关系,参数Ki表示各地形对象的地形位置候选框bbox内的像素点矩阵,参数E代表单位矩阵,函数式F(e,Ki)代表先将地形图片中的各个坐标点(x,y)的地形类别保存于Ki矩阵,Ki矩阵中的各元素值ki(x,y)替换为得到F(e,Ki),参数λ、β是三个损失分量的平衡参数,用于将Lclass、Lbbox和Lmask三个分量进行归一化。
9.一种基于机器视觉的地形识别系统,其特征在于,包括:
数据采集模块:用于采集目标区域的地形图像数据;
网络构建模块:用于构建基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型;
地形识别模块:用于将所采集的地形图像数据输入所述基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,通过该卷积神经网络模型提取所述地形图像数据中各地形对象的地形特征,并根据所述地形特征进行地形对象分类以及地形区域分割;
用地规划模块:用于根据地形对象分类以及地形区域分割结果判断所述目标区域的地形组成,并对所述目标区域进行用地规划;
其中,所述区域卷积神经网络分支包括输入层、可视化卷积网络、区域化目标网络层、活跃区域池化层、第一卷积层、第二卷积层、第一全连接层、第二全连接层和输出层;
所述对象区域全卷积分支包括活跃区域量化层、具备残差网络结构的特征金字塔网络、第三卷积层、第四卷积层和第五卷积层。
10.根据权利要求9所述的基于机器视觉的地形识别系统,其特征在于,所述地形图像数据为通过航拍设备采集的地形视频数据。
11.根据权利要求10所述的基于机器视觉的地形识别系统,其特征在于,还包括:
数据分割模块:用于按照数据分割间隔时间将采集的地形视频数据分割成包含地形对象的地形图片;
数据预处理模块:用于对每幅地形图片分别进行垂直翻转和镜像处理后,对每幅地形图片进行向下采样,并分别标注每幅地形图片中各地形对象的地形类别标签、各地形对象对应的地形位置标注框以及地形区域标注值;其中,所述地形类别标签是指各地形对象的地貌形态,所述地形位置标注框是指各地形对象在地形图片中所在的位置,所述地形区域标注值是指各地形对象在地形图片中的像素点分割标注值。
12.根据权利要求11所述的基于机器视觉的地形识别系统,其特征在于,还包括网络训练模块,所述网络训练模块用于将训练集中的地形图片输入基于“区域卷积神经网络分支+对象区域全卷积分支”的卷积神经网络模型,对卷积神经网络模型进行训练。
13.根据权利要求12所述的基于机器视觉的地形识别系统,其特征在于,所述网络训练模块包括:
输入单元:用于通过输入层输入地形图片;
第一特征提取单元:用于通过可视化卷积网络使用叠加五次的卷积层和池化层提取地形图片的原始地形特征;
第二特征提取单元:用于通过区域化目标网络根据原始地形特征提取带有地形位置候选框的地形图片特征集;
第一下采样单元:用于通过活跃区域池化层对所述带有地形位置候选框的地形图片特征集下采样处理;
第一卷积单元:用于通过第一卷积层和第二卷积层对所述下采样后的地形图片特征集进行两次卷积处理,得到尺寸和维数不变的地形图片特征集;
集合输出单元:用于通过第一全连接层和第二全连接层采用RELU激活函数和drop对地形图片特征集进行处理,得到地形特征集合;
第一结果输出单元:用于通过输出层根据地形特征集合输出各地形对象对应的地形类别和地形位置候选框。
14.根据权利要求13所述的基于机器视觉的地形识别系统,其特征在于,对象区域全卷积分支的可视化卷积网络和区域化目标网络层与区域卷积神经网络分支共享同一个网络,所述网络训练模块还包括:
第二下采样单元:用于通过活跃区域量化层对带有地形位置候选框的地形图片特征集进行下采样;
第三特征提取单元:用于通过具备残差网络结构的特征金字塔网络对下采样后的地形图片特征集提取不同层次的地形图片特征集;
第二卷积单元:用于通过第三卷积层和第四卷积层对所述不同层次的地形图片特征集进行卷积处理;
第二结果输出单元:用于通过第五卷积层输出各地形对象对应的地形区域。
15.根据权利要求14所述的基于机器视觉的地形识别系统,其特征在于,所述网络训练模块还包括损失函数计算单元,所述损失函数计算单元用于根据输出的地形对象的地形类别、地形位置候选框和地形区域与所述地形图片中标注的地形类别标签、地形位置标注框以及地形区域标注值间的误差构成损失函数L,并采用反向传播算法调整网络参数,直到损失函数L满足最小值后保存网络参数。
16.根据权利要求15所述的基于机器视觉的地形识别系统,其特征在于,所述损失函数L包括三个分量:
上述公式中,L({pi}、{ti}、{Ki})中的三个分量pi、ti和Ki分别为各地形对象的地形类别、地形位置候选框和地形区域的损失函数分量;其中:
上述公式中,参数i是一个小型batch中的anchor的索引值,参数Nclass代表地形类别的总数,参数Nbbox代表各地形对象的地形位置候选框中anchor的总数,参数Nmask代表各地形对象的地形区域的anchor的总数,参数pi代表第i个anchor预测值,如果该anchor是活跃的,即属于识别的地形类别,则值取1,否则值取0,参数ti表示各地形对象的地形位置候选框bbox的4个参数化坐标的向量,代表bbox和anchor活跃度的关系,参数Ki表示各地形对象的地形位置候选框bbox内的像素点矩阵,参数E代表单位矩阵,函数式F(e,Ki)代表先将地形图片中的各个坐标点(x,y)的地形类别保存于Ki矩阵,Ki矩阵中的各元素值ki(x,y)替换为得到F(e,Ki),参数λ、β是三个损失分量的平衡参数,用于将Lclass、Lbbox和Lmask三个分量进行归一化。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述权利要求1至8任一项所述的基于机器视觉的用地规划方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711060490.4A CN107918776B (zh) | 2017-11-01 | 2017-11-01 | 一种基于机器视觉的用地规划方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711060490.4A CN107918776B (zh) | 2017-11-01 | 2017-11-01 | 一种基于机器视觉的用地规划方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107918776A CN107918776A (zh) | 2018-04-17 |
CN107918776B true CN107918776B (zh) | 2022-03-22 |
Family
ID=61895146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711060490.4A Active CN107918776B (zh) | 2017-11-01 | 2017-11-01 | 一种基于机器视觉的用地规划方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107918776B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921131B (zh) * | 2018-07-26 | 2022-05-24 | 中国银联股份有限公司 | 一种生成人脸检测模型、三维人脸图像的方法及装置 |
CN109215036A (zh) * | 2018-08-01 | 2019-01-15 | 浙江深眸科技有限公司 | 基于卷积神经网络的人体分割方法 |
CN109558904A (zh) * | 2018-11-21 | 2019-04-02 | 咪咕文化科技有限公司 | 图像局部特征的分类方法、装置和存储介质 |
CN109871806A (zh) * | 2019-02-21 | 2019-06-11 | 山东大学 | 基于深度残差纹理网络的地形识别方法及系统 |
CN111723829B (zh) * | 2019-03-18 | 2022-05-06 | 四川大学 | 一种基于注意力掩模融合的全卷积目标检测方法 |
CN110263113A (zh) * | 2019-06-04 | 2019-09-20 | 广州市城市规划勘测设计研究院 | 地形图中地物要素的更新方法、系统及设备 |
CN110428146A (zh) * | 2019-07-11 | 2019-11-08 | 陕西华地勘察设计咨询有限公司 | 一种城镇低效用地精准识别与智能规划系统 |
CN111275112A (zh) * | 2020-01-20 | 2020-06-12 | 上海高仙自动化科技发展有限公司 | 机器人控制方法、机器人和可读存储介质 |
CN112115641A (zh) * | 2020-09-11 | 2020-12-22 | 同济大学 | 一种智能城市信息基础设施规划系统 |
CN113119112B (zh) * | 2021-03-18 | 2022-08-09 | 上海交通大学 | 适用于六自由度机器人视觉测量的运动规划方法及系统 |
CN113420840B (zh) * | 2021-08-23 | 2021-12-21 | 常州微亿智造科技有限公司 | 基于低分辨率图像的目标检测方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102938073A (zh) * | 2012-10-23 | 2013-02-20 | 中国人民解放军空军工程大学 | 一种遥感图像的分类方法 |
WO2015041295A1 (ja) * | 2013-09-18 | 2015-03-26 | 国立大学法人東京大学 | 地表種別分類方法および地表種別分類プログラム並びに地表種別分類装置 |
CN107145867A (zh) * | 2017-05-09 | 2017-09-08 | 电子科技大学 | 基于多任务深度学习的人脸及人脸遮挡物检测方法 |
CN107239775A (zh) * | 2017-07-28 | 2017-10-10 | 湖南大学 | 地物分类方法及装置 |
CN107256414A (zh) * | 2017-06-27 | 2017-10-17 | 哈尔滨工业大学 | 基于空域特征图谱的极化sar图像卷积神经网络分类方法 |
-
2017
- 2017-11-01 CN CN201711060490.4A patent/CN107918776B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102938073A (zh) * | 2012-10-23 | 2013-02-20 | 中国人民解放军空军工程大学 | 一种遥感图像的分类方法 |
WO2015041295A1 (ja) * | 2013-09-18 | 2015-03-26 | 国立大学法人東京大学 | 地表種別分類方法および地表種別分類プログラム並びに地表種別分類装置 |
CN107145867A (zh) * | 2017-05-09 | 2017-09-08 | 电子科技大学 | 基于多任务深度学习的人脸及人脸遮挡物检测方法 |
CN107256414A (zh) * | 2017-06-27 | 2017-10-17 | 哈尔滨工业大学 | 基于空域特征图谱的极化sar图像卷积神经网络分类方法 |
CN107239775A (zh) * | 2017-07-28 | 2017-10-10 | 湖南大学 | 地物分类方法及装置 |
Non-Patent Citations (5)
Title |
---|
Automatic land cover classification of geo-tagged field photos by deep learning;Xu, Guang 等;《ENVIRONMENTAL MODELLING & SOFTWARE》;20170531;全文 * |
Deep Pyramidal Residual Networks;D Han 等;《arxiv》;20161031;全文 * |
Robust Visual Terrain Classification with Recurrent Neural Networks;S Otte 等;《Computational Intelligence and Machine Learning》;20150430;全文 * |
基于多级金字塔卷积神经网络的快速特征表示方法;王冠皓 等;《计算机应用研究》;20150831;全文 * |
深度卷积神经网络特征提取用于地表覆盖分类初探;张伟 等;《中国图象图形学报》;20170831;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107918776A (zh) | 2018-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107918776B (zh) | 一种基于机器视觉的用地规划方法、系统及电子设备 | |
CN111986099B (zh) | 基于融合残差修正的卷积神经网络的耕地监测方法及系统 | |
JP6771449B2 (ja) | 航空画像からの自動物体検出のための方法およびシステム | |
CN108596101B (zh) | 一种基于卷积神经网络的遥感图像多目标检测方法 | |
CN113392775B (zh) | 一种基于深度神经网络的甘蔗幼苗自动识别与计数方法 | |
CN108710863A (zh) | 基于深度学习的无人机航拍场景语义分割方法及系统 | |
CN108229519B (zh) | 图像分类的方法、装置及系统 | |
Jagannathan et al. | Deep learning for the prediction and classification of land use and land cover changes using deep convolutional neural network | |
CN110325981A (zh) | 基于变化检测的地图界面更新系统 | |
CN112712535A (zh) | 基于模拟困难样本的Mask-RCNN滑坡分割方法 | |
CN112801158A (zh) | 基于级联融合和注意力机制的深度学习小目标检测方法及装置 | |
Shen et al. | Biomimetic vision for zoom object detection based on improved vertical grid number YOLO algorithm | |
CN112560623A (zh) | 一种基于无人机的红树植物种类快速识别方法 | |
JP2024117069A (ja) | 背景フィルタリングに基づく少量データ学習の作物樹冠被覆率の計算方法および装置 | |
CN111079807A (zh) | 一种地物分类方法及装置 | |
CN116258976A (zh) | 一种分层次Transformer的高分辨率遥感图像语义分割方法及系统 | |
CN117392382A (zh) | 一种基于多尺度密集实例检测的单木果树分割方法与系统 | |
CN116883650A (zh) | 一种基于注意力和局部拼接的图像级弱监督语义分割方法 | |
Zhao et al. | Image dehazing based on haze degree classification | |
Comert et al. | Rapid mapping of forested landslide from ultra-high resolution unmanned aerial vehicle data | |
CN114972646A (zh) | 一种实景三维模型独立地物的提取与修饰方法及系统 | |
CN117808708A (zh) | 云雾遥感影像的处理方法、装置、设备和介质 | |
Babu et al. | ABF de-hazing algorithm based on deep learning CNN for single I-Haze detection | |
Arya et al. | From global challenges to local solutions: A review of cross-country collaborations and winning strategies in road damage detection | |
CN113673369A (zh) | 遥感图像场景规划方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |