CN109493360B - 一种人工地物散乱形状点自动生成建筑物轮廓的方法 - Google Patents
一种人工地物散乱形状点自动生成建筑物轮廓的方法 Download PDFInfo
- Publication number
- CN109493360B CN109493360B CN201811176798.XA CN201811176798A CN109493360B CN 109493360 B CN109493360 B CN 109493360B CN 201811176798 A CN201811176798 A CN 201811176798A CN 109493360 B CN109493360 B CN 109493360B
- Authority
- CN
- China
- Prior art keywords
- model
- decoder
- input
- training
- gradient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/149—Segmentation; Edge detection involving deformable models, e.g. active contour models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10032—Satellite or aerial image; Remote sensing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种人工地物散乱形状点自动生成建筑物轮廓的方法,将Pointer Network网络模型应用于建筑物区域描述任务中,对于人工地物的散乱形状点,能够准确的输出较好的封闭连线方案,自动生成人工地物地面轮廓。本发明包括如下步骤:(1)构建人工地物散乱形状点数据集;(2)构建Pointer Network网络模型;(3)调整网络参数使模型能够收敛;(4)训练并得到最终模型。本发明可适用于任意的自动生成封闭区域的任务,且能够应用于大规模样本,有较高的鲁棒性,能适用于现实世界中各种复杂的生成封闭区域的任务,具有广阔的应用前景。
Description
技术 领域
本发明属于地理信息科学技术领域,具体涉及一种人工地物散乱形状点自动生成建筑物轮廓的方法。
背景技术
人工地物作为城市地类的重要构成部分,与城市的人口数量、经济发展、城市化程度等因素密切相关,能够准确、快速地反映出城市区域地发展变化规律,因此,在构建数字城市的过程中,人工地物信息的提取与处理成为后续工作的基础。
工程师们可以采用全站仪等方法测量建筑物地面轮廓点,所谓地面轮廓点,即建筑物轮廓区域中有明显转折的边角点。对于这些稀疏的地物散乱形状点,如果其凸包包含了所有的形状点,则由这些形状点生成的封闭区域是唯一的,但在现实世界中,建筑物地面轮廓往往是凹多边形,其封闭连线的方案并不唯一,因此,需要在一定的约束条件下,搜索生成最优、最符合实际情况的凹多边形,这涉及到组合优化问题,与TSP(TravelingSalesman Problem,平面旅行商问题) 任务相似,实际可以看作是按照一定约束规则对点数据进行排序的任务。目前,基于散乱点的多边形自动生成算法已经比较成熟,主要包括二分排序法、2-Opt Moves、SteadyGrowth以及Inward Denting等算法,但这些算法仅适用于简单且具有良好凹凸性的多边形,不能很好地恢复凹多边形。
发明内容
技术问题:本发明提供一种人工地物散乱形状点自动生成建筑物轮廓的方法,解决由采集得到的地物散乱形状点恢复建筑物地面形状轮廓的问题,能输出较好的封闭连线方案,自动生成人工地物地面轮廓。
技术方案:本发明所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法,包括以下步骤:
(1)读取地区的遥感影像图,筛选出地物形状点数据作为训练样本并对其进行样本增量处理;
(2)构建Pointer Network网络模型;
(3)调整网络参数使网络模型能够收敛;
(4)对网络模型进行训练,达到期望精度或达到设定最大迭代次数,得到基于Pointer Network网络的自动生成人工地物地面轮廓的模型。
所述步骤(1)具体包括以下步骤:
(11)将地区的遥感影像图转为shapefile格式,利用GDAL/OGR库读取该文件;
(12)根据读取到的多边形顶点坐标数据对多边形进行凹凸性判断,并保存凹多边形顶点坐标数据;
(13)取多边形第一个顶点为起点,标签值设为1,按顺时针方向,其他点标签依次为2,3,…,n;
(14)对单个多边形顶点数据进行全排列处理,并保持其每个顶点与原始标签的一一对应关系。
所述步骤(2)包括以下步骤:
(21)在输入层加入数据归一化处理,即对于单个多边形,找出所有顶点坐标中最小的横坐标值,所有顶点的横坐标值以这个最小值作归一化,对于纵坐标,则以最小的纵坐标值作归一化;
(22)模型框架为解码器-编码器(Encoder-Decoder),编码器与解码器均采用单层LSTM网络,由编码器读入输入信息,将编码器最后的隐状态作为解码器隐状态的初值,编码器最后的输出作为解码器输入的初始值;
ht=f(ht-1,xt)
s0=hT
其中,ht表示t时刻编码器的隐状态,s0表示解码器的初始状态,xt为t时刻模型的输入,f为非线性函数,表示一个LSTM单元的隐状态的计算方式;
(23)模型解码模块选用贪婪搜索(greedy search)方法,只取概率最大的值作为输出值,在每个步骤中,解码器通过softmax概率分布函数产生一系列指向输入序列中元素的指针,将当前时刻指向的输入序列中的元素作为下一时刻解码器的输入:
p(Ci|C1,...,Ci-1,P)=softmax(ui)
其中,v、W1、W2是模型的可学习参数,hj为j时刻编码器的隐状态,si为i时刻解码器的隐状态,tanh为激活函数,softmax函数将向量ui归一化为输入字典上的输出分布;
(24)模型输入为平面点集P={P1,…,Pn},其中,n为多边形的顶点数,Pj= (xj,yj)为多边形的顶点坐标,模型输出为Cp={C1,…,Cm(p)}表示与点集P相对应的解的序列,元素Ci是对应于序列P中元素位于1和n之间的索引,或者表示序列开始或结束的特殊标记。
所述步骤(3)包括以下步骤:
(31)对参数进行随机初始化;
(32)采用批处理,每次投入batch组输入数据进行训练,更新参数;
(33)采用梯度裁剪技术:首先设置一个梯度阈值clip_gradient,在模型后向传播中求出各个参数的梯度,并计算出梯度的L2范数||g||,比较其与预先设定的梯度阈值的大小,若前者大,则计算缩放因子将原梯度乘上缩放因子得到最后的梯度。
所述步骤(4)在训练同时,用验证集对模型进行验证,结合训练过程中loss 变化与验证集准确率,若训练损失不再下降或者达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。
有益效果:与现有技术相比,本发明的有益效果为:1、将Pointer Network 网络模型应用于建筑物区域描述任务中,对于人工地物的散乱形状点,能够准确的输出较好的封闭连线方案,自动生成人工地物地面轮廓;2、本发明能够应用于大规模样本,有较高的鲁棒性,适用于现实世界中各种复杂的生成封闭区域的任务,具有广阔的应用前景。
附图说明
图1为本发明方法的流程示意图;
图2为采集到的某个建筑物的稀疏形状点分布图;
图3为按模型输出的形状点排序方案组成的封闭区域图。
具体实施方式
下面结合附图对本发明作进一步详细说明,图1为本发明的流程图。如图1 所示,本发明包括以下步骤:
1、读取某一地区的遥感影像图,筛选出地物形状点数据作为训练样本并对其进行样本增量处理。
(1)将该地区的遥感影像图转为shapefile格式,利用GDAL/OGR库读取该文件。
(2)根据读取到的多边形顶点坐标数据对多边形进行凹凸性判断。从凹多边形与凸多边形的定义出发,即判断多边形中是否含有大于180度的顶角,如有,则判定为凹多边形;反之则为凸多边形。鉴于实际中建筑物的地面形状数据会存在误差,如部分“平角”略大于180度,可将“平角”定义为190度。由于凸多边形在数学上是可以被唯一恢复的,所以不考虑凸多边形,最后仅保存凹多边形顶点坐标数据。
(3)取多边形的第一个顶点为起点,标签值设为1,按顺时针方向,其他顶点标签依次为2,3,…,n。
(4)对单个多边形顶点数据进行全排列处理,并保持其每个顶点与原始标签的一一对应关系。
2、构建Pointer Network网络模型。
(1)在输入层加入数据归一化处理,即对于单个多边形,找出所有顶点坐标中最小的横坐标值,所有顶点的横坐标值以这个最小值作归一化,对于纵坐标,则以最小的纵坐标值作归一化。
(2)模型框架为解码器-编码器(Encoder-Decoder),编码器与解码器均采用单层LSTM网络,首先由编码器读入输入信息,将编码器最后的隐状态作为解码器隐状态的初值,编码器最后的输出作为解码器输入的初始值;
ht=f(ht-1,xt)
s0=ht
式中,ht表示t时刻编码器的隐状态,s0表示解码器的初始状态,xt为t时刻模型的输入,f为非线性函数,表示一个LSTM单元的隐状态的计算方式。
(3)模型解码模块选用贪婪搜索(greedy search)方法,只取概率最大的值作为输出值,在每个步骤中,解码器通过softmax概率分布函数产生一系列指向输入序列中元素的指针,将当前时刻指向的输入序列中的元素作为下一时刻解码器的输入;
p(Ci|C1,...,Ci-1,P)=softmax(ui)
式中,v、W1、W2是模型的可学习参数,hj为j时刻编码器的隐状态,si为i时刻解码器的隐状态,tanh为激活函数。softmax函数将向量ui(长度为n) 归一化为输入字典上的输出分布,即将作为指向输入元素的指针得到向量维度和输入维度一致。
(4)模型输入为平面点集P={P1,…,Pn},其中,n为多边形的顶点数,Pj= (xj,yj)为多边形的顶点坐标,模型输出为Cp={C1,…,Cm(p)}表示与点集P相对应的解的序列,元素Ci是对应于序列P中元素位于1和n之间的索引,或者表示序列开始或结束的特殊标记。
3、调整网络参数使网络模型能够收敛。
(1)参数使用均匀分布(-0.08,0.08)进行随机初始化。
(2)采用分批处理技术(Mini Batch),每次投入batch组输入数据进行训练,更新参数,取batch大小为500。
(3)引入梯度裁剪技术(clip gradient),首先设置一个梯度阈值 clip_gradient,在模型后向传播中求出各个参数的梯度,并计算出梯度的L2 范数||g||,比较其与预先设定的梯度阈值的大小。若前者大,则计算缩放因子将原梯度乘上缩放因子得到最后的梯度。
(4)隐层节点数设为512。
4、设置模型期望精度与最大训练迭代次数,对网络模型进行训练,模型达到期望精度或训练达到设定最大迭代次数后,停止训练,得到基于Pointer Network网络的自动生成人工地物地面轮廓的模型。对于人工地物的散乱形状点,模型能够准确的输出较好的封闭连线方案,自动生成人工地物地面轮廓,具体为,训练的同时,用验证集对模型进行验证,结合训练过程中训练损失 (loss)的变化与验证集的准确率,若训练损失在多次迭代后不再发生明显变化或者验证集的准确率达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。测试时,依次输入多边形顶点坐标信息,模型会输出对应的封闭连线方案,例如:输入有4个顶点的多边形坐标信息 (x1,y1,x2,y2,x3,y3,x4,y4),模型输出(2,3,1,4),意为封闭连线方案为(x3,y3 )→(x1,y1)→(x2,y2)→(x4,y4)→(x3,y3)。如图2为采集到的某个建筑物的稀疏形状点分布图,图3为根据模型输出的该形状点的封闭连线方案还原的建筑物地面轮廓。
Claims (4)
1.一种人工地物散乱形状点自动生成建筑物轮廓的方法,其特征在于,包括以下步骤:
(1)读取地区的遥感影像图,筛选出地物形状点数据作为训练样本并对其进行样本增量处理;
(2)构建Pointer Network网络模型;
(3)调整网络参数使网络模型能够收敛;
(4)对网络模型进行训练,达到期望精度或达到设定最大迭代次数,得到基于PointerNetwork网络的自动生成人工地物地面轮廓的模型;
所述步骤(2)包括以下步骤:
(21)在输入层加入数据归一化处理,即对于单个多边形,找出所有顶点坐标中最小的横坐标值,所有顶点的横坐标值以这个最小值作归一化,对于纵坐标,则以最小的纵坐标值作归一化;
(22)模型框架为解码器-编码器(Encoder-Decoder),编码器与解码器均采用单层LSTM网络,由编码器读入输入信息,将编码器最后的隐状态作为解码器隐状态的初值,编码器最后的输出作为解码器输入的初始值;
ht=f(ht-1,xt)
s0=hT
其中,ht表示t时刻编码器的隐状态,s0表示解码器的初始状态,xt为t时刻模型的输入,f为非线性函数,表示一个LSTM单元的隐状态的计算方式;
(23)模型解码模块选用贪婪搜索(greedy search)方法,只取概率最大的值作为输出值,在每个步骤中,解码器通过softmax概率分布函数产生一系列指向输入序列中元素的指针,将当前时刻指向的输入序列中的元素作为下一时刻解码器的输入:
p(Ci|C1,…,Ci-1,P)=softmax(ui)
其中,v、W1、W2是模型的可学习参数,hj为j时刻编码器的隐状态,si为i时刻解码器的隐状态,tanh为激活函数,softmax函数将向量ui归一化为输入字典上的输出分布;
(24)模型输入为平面点集P={P1,…,Pn},其中,n为多边形的顶点数,Pj=(xj,yj)为多边形的顶点坐标,模型输出为Cp={C1,…,Cm(p)}表示与点集P相对应的解的序列,元素Ci是对应于序列P中元素位于1和n之间的索引,或者表示序列开始或结束的特殊标记。
2.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法,其特征在于,所述步骤(1)具体包括以下步骤:
(11)将地区的遥感影像图转为shapefile格式,利用GDAL/OGR库读取文件;
(12)根据读取到的多边形顶点坐标数据对多边形进行凹凸性判断,并保存凹多边形顶点坐标数据;
(13)取多边形第一个顶点为起点,标签值设为1,按顺时针方向,其他点标签依次为2,3,…,n;
(14)对单个多边形顶点数据进行全排列处理,并保持其每个顶点与原始标签的一一对应关系。
4.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法,其特征在于,所述步骤(4)在训练同时,用验证集对模型进行验证,结合训练过程中loss变化与验证集准确率,若训练损失不再下降或者达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811176798.XA CN109493360B (zh) | 2018-10-10 | 2018-10-10 | 一种人工地物散乱形状点自动生成建筑物轮廓的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811176798.XA CN109493360B (zh) | 2018-10-10 | 2018-10-10 | 一种人工地物散乱形状点自动生成建筑物轮廓的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109493360A CN109493360A (zh) | 2019-03-19 |
CN109493360B true CN109493360B (zh) | 2021-07-09 |
Family
ID=65690146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811176798.XA Active CN109493360B (zh) | 2018-10-10 | 2018-10-10 | 一种人工地物散乱形状点自动生成建筑物轮廓的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109493360B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110120058B (zh) * | 2019-04-30 | 2022-08-12 | 河海大学 | 一种高程散点生成紧致外边界的方法 |
CN110378412B (zh) * | 2019-07-17 | 2021-07-27 | 湖南视比特机器人有限公司 | 基于局部几何特征序列建模的二维轮廓形状识别分类方法 |
CN111652892A (zh) * | 2020-05-02 | 2020-09-11 | 王磊 | 一种基于深度学习的遥感影像建筑物矢量提取及优化方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678844A (zh) * | 2016-01-06 | 2016-06-15 | 东南大学 | 一种基于地物散乱点逐点增加的轮廓构建算法 |
CN107967257A (zh) * | 2017-11-20 | 2018-04-27 | 哈尔滨工业大学 | 一种级联式作文生成方法 |
-
2018
- 2018-10-10 CN CN201811176798.XA patent/CN109493360B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678844A (zh) * | 2016-01-06 | 2016-06-15 | 东南大学 | 一种基于地物散乱点逐点增加的轮廓构建算法 |
CN107967257A (zh) * | 2017-11-20 | 2018-04-27 | 哈尔滨工业大学 | 一种级联式作文生成方法 |
Non-Patent Citations (3)
Title |
---|
Extracting Building Boundaries from High Resolution Optical Images and LiDAR Data by Integrating the Convolutional Neural Network and the Active Contour Model;Ying Sun 等;《remote sensing》;20180912;第1,5-7页 * |
Pointer Networks;Oriol Vinyals 等;《https://arxiv.org/pdf/1506.03134.pdf》;20170102;第1-6页 * |
融合航空影像和LIDAR点云的建筑物探测及轮廓提取;程效军 等;《中国激光》;20160531;正文第1-9页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109493360A (zh) | 2019-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107703564B (zh) | 一种降雨预测方法、系统及电子设备 | |
CN109493360B (zh) | 一种人工地物散乱形状点自动生成建筑物轮廓的方法 | |
JP2020030786A (ja) | 建築物レンダリング及びビルディングインフォメーションモデリングデータの機械学習システム | |
CN107784288B (zh) | 一种基于深度神经网络的迭代定位式人脸检测方法 | |
US8237706B2 (en) | Apparatus and method for simplifying three-dimensional mesh data | |
CN108805157B (zh) | 基于部分随机监督离散式哈希的遥感图像分类方法 | |
US9659122B2 (en) | Aerodynamic design optimization using information extracted from analysis of unstructured surface meshes | |
CN113223042A (zh) | 一种遥感影像深度学习样本智能采集方法及设备 | |
CN112001293A (zh) | 结合多尺度信息和编解码网络的遥感影像地物分类方法 | |
CN115761303A (zh) | 基于机载激光雷达点云和遥感影像数据的地物分类方法 | |
CN117454495A (zh) | 一种基于建筑草图轮廓序列的cad矢量模型生成方法及装置 | |
CN112241676A (zh) | 一种地形杂物自动识别的方法 | |
CN112381945B (zh) | 三维模型过渡面的重建方法及系统 | |
CN110969609B (zh) | 一种微波遥感亮温图像云检测方法 | |
CN117152427A (zh) | 基于扩散模型和知识蒸馏的遥感图像语义分割方法与系统 | |
CN113903016B (zh) | 分岔点检测方法、装置、计算机设备和存储介质 | |
CN113516766B (zh) | 一种基于神经网络算法的独立坐标系参数分析方法及系统 | |
Aguerre et al. | Importance-driven approach for reducing urban radiative exchange computations | |
KR102218179B1 (ko) | 초단기 예보 모델의 복사 물리 모수화를 에뮬레이션 하는 시스템 및 방법 | |
CN114241470A (zh) | 一种基于注意力机制的自然场景文字检测方法 | |
Kolibarov et al. | Roof Segmentation Towards Digital Twin Generation in LoD2+ Using Deep Learning | |
Ali et al. | Statistical downscaling of precipitation and temperature using gene expression programming | |
CN116882031B (zh) | 一种基于点云的建筑模型构建方法及系统 | |
CN117576339B (zh) | 一种最高分辨率1km的非结构网格生成方法 | |
CN112686254B (zh) | 一种基于红外卫星云图的台风中心定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |