CN109493360B

CN109493360B - 一种人工地物散乱形状点自动生成建筑物轮廓的方法

Info

Publication number: CN109493360B
Application number: CN201811176798.XA
Authority: CN
Inventors: 张小国; 高烨; 张开心; 王慧青
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2018-10-10
Filing date: 2018-10-10
Publication date: 2021-07-09
Anticipated expiration: 2038-10-10
Also published as: CN109493360A

Abstract

本发明公开了一种人工地物散乱形状点自动生成建筑物轮廓的方法，将Pointer Network网络模型应用于建筑物区域描述任务中，对于人工地物的散乱形状点，能够准确的输出较好的封闭连线方案，自动生成人工地物地面轮廓。本发明包括如下步骤：(1)构建人工地物散乱形状点数据集；(2)构建Pointer Network网络模型；(3)调整网络参数使模型能够收敛；(4)训练并得到最终模型。本发明可适用于任意的自动生成封闭区域的任务，且能够应用于大规模样本，有较高的鲁棒性，能适用于现实世界中各种复杂的生成封闭区域的任务，具有广阔的应用前景。

Description

一种人工地物散乱形状点自动生成建筑物轮廓的方法

技术领域

本发明属于地理信息科学技术领域，具体涉及一种人工地物散乱形状点自动生成建筑物轮廓的方法。

背景技术

人工地物作为城市地类的重要构成部分，与城市的人口数量、经济发展、城市化程度等因素密切相关，能够准确、快速地反映出城市区域地发展变化规律，因此，在构建数字城市的过程中，人工地物信息的提取与处理成为后续工作的基础。

工程师们可以采用全站仪等方法测量建筑物地面轮廓点，所谓地面轮廓点，即建筑物轮廓区域中有明显转折的边角点。对于这些稀疏的地物散乱形状点，如果其凸包包含了所有的形状点，则由这些形状点生成的封闭区域是唯一的，但在现实世界中，建筑物地面轮廓往往是凹多边形，其封闭连线的方案并不唯一，因此，需要在一定的约束条件下，搜索生成最优、最符合实际情况的凹多边形，这涉及到组合优化问题，与TSP(TravelingSalesman Problem，平面旅行商问题) 任务相似，实际可以看作是按照一定约束规则对点数据进行排序的任务。目前，基于散乱点的多边形自动生成算法已经比较成熟，主要包括二分排序法、2-Opt Moves、SteadyGrowth以及Inward Denting等算法，但这些算法仅适用于简单且具有良好凹凸性的多边形，不能很好地恢复凹多边形。

发明内容

技术问题：本发明提供一种人工地物散乱形状点自动生成建筑物轮廓的方法，解决由采集得到的地物散乱形状点恢复建筑物地面形状轮廓的问题，能输出较好的封闭连线方案，自动生成人工地物地面轮廓。

技术方案：本发明所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法，包括以下步骤：

(1)读取地区的遥感影像图，筛选出地物形状点数据作为训练样本并对其进行样本增量处理；

(2)构建Pointer Network网络模型；

(3)调整网络参数使网络模型能够收敛；

(4)对网络模型进行训练，达到期望精度或达到设定最大迭代次数，得到基于Pointer Network网络的自动生成人工地物地面轮廓的模型。

所述步骤(1)具体包括以下步骤：

(11)将地区的遥感影像图转为shapefile格式，利用GDAL/OGR库读取该文件；

(12)根据读取到的多边形顶点坐标数据对多边形进行凹凸性判断，并保存凹多边形顶点坐标数据；

(13)取多边形第一个顶点为起点，标签值设为1，按顺时针方向，其他点标签依次为2，3，…，n；

(14)对单个多边形顶点数据进行全排列处理，并保持其每个顶点与原始标签的一一对应关系。

所述步骤(2)包括以下步骤：

(21)在输入层加入数据归一化处理，即对于单个多边形，找出所有顶点坐标中最小的横坐标值，所有顶点的横坐标值以这个最小值作归一化，对于纵坐标，则以最小的纵坐标值作归一化；

(22)模型框架为解码器-编码器(Encoder-Decoder)，编码器与解码器均采用单层LSTM网络，由编码器读入输入信息，将编码器最后的隐状态作为解码器隐状态的初值，编码器最后的输出作为解码器输入的初始值；

h_t＝f(h_t-1，x_t)

s₀＝h_T

其中，h_t表示t时刻编码器的隐状态，s₀表示解码器的初始状态，x_t为t时刻模型的输入，f为非线性函数，表示一个LSTM单元的隐状态的计算方式；

(23)模型解码模块选用贪婪搜索(greedy search)方法，只取概率最大的值作为输出值，在每个步骤中，解码器通过softmax概率分布函数产生一系列指向输入序列中元素的指针，将当前时刻指向的输入序列中的元素作为下一时刻解码器的输入：

p(C_i|C₁，...，C_i-1，P)＝softmax(uⁱ)

其中，v、W₁、W₂是模型的可学习参数，h_j为j时刻编码器的隐状态，s_i为i时刻解码器的隐状态，tanh为激活函数，softmax函数将向量uⁱ归一化为输入字典上的输出分布；

(24)模型输入为平面点集P＝{P₁，…，P_n}，其中，n为多边形的顶点数，P_j＝ (x_j，y_j)为多边形的顶点坐标，模型输出为C_p＝{C₁，…，C_m(p)}表示与点集P相对应的解的序列，元素C_i是对应于序列P中元素位于1和n之间的索引，或者表示序列开始或结束的特殊标记。

所述步骤(3)包括以下步骤：

(31)对参数进行随机初始化；

(32)采用批处理，每次投入batch组输入数据进行训练，更新参数；

(33)采用梯度裁剪技术：首先设置一个梯度阈值clip_gradient，在模型后向传播中求出各个参数的梯度，并计算出梯度的L2范数||g||，比较其与预先设定的梯度阈值的大小，若前者大，则计算缩放因子

将原梯度乘上缩放因子得到最后的梯度。

所述步骤(4)在训练同时，用验证集对模型进行验证，结合训练过程中loss 变化与验证集准确率，若训练损失不再下降或者达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。

有益效果：与现有技术相比，本发明的有益效果为：1、将Pointer Network 网络模型应用于建筑物区域描述任务中，对于人工地物的散乱形状点，能够准确的输出较好的封闭连线方案，自动生成人工地物地面轮廓；2、本发明能够应用于大规模样本，有较高的鲁棒性，适用于现实世界中各种复杂的生成封闭区域的任务，具有广阔的应用前景。

附图说明

图1为本发明方法的流程示意图；

图2为采集到的某个建筑物的稀疏形状点分布图；

图3为按模型输出的形状点排序方案组成的封闭区域图。

具体实施方式

下面结合附图对本发明作进一步详细说明，图1为本发明的流程图。如图1 所示，本发明包括以下步骤：

1、读取某一地区的遥感影像图，筛选出地物形状点数据作为训练样本并对其进行样本增量处理。

(1)将该地区的遥感影像图转为shapefile格式，利用GDAL/OGR库读取该文件。

(2)根据读取到的多边形顶点坐标数据对多边形进行凹凸性判断。从凹多边形与凸多边形的定义出发，即判断多边形中是否含有大于180度的顶角，如有，则判定为凹多边形；反之则为凸多边形。鉴于实际中建筑物的地面形状数据会存在误差，如部分“平角”略大于180度，可将“平角”定义为190度。由于凸多边形在数学上是可以被唯一恢复的，所以不考虑凸多边形，最后仅保存凹多边形顶点坐标数据。

(3)取多边形的第一个顶点为起点，标签值设为1，按顺时针方向，其他顶点标签依次为2，3，…，n。

(4)对单个多边形顶点数据进行全排列处理，并保持其每个顶点与原始标签的一一对应关系。

2、构建Pointer Network网络模型。

(1)在输入层加入数据归一化处理，即对于单个多边形，找出所有顶点坐标中最小的横坐标值，所有顶点的横坐标值以这个最小值作归一化，对于纵坐标，则以最小的纵坐标值作归一化。

(2)模型框架为解码器-编码器(Encoder-Decoder)，编码器与解码器均采用单层LSTM网络，首先由编码器读入输入信息，将编码器最后的隐状态作为解码器隐状态的初值，编码器最后的输出作为解码器输入的初始值；

h_t＝f(h_t-1，x_t)

s₀＝h_t

式中，h_t表示t时刻编码器的隐状态，s₀表示解码器的初始状态，x_t为t时刻模型的输入，f为非线性函数，表示一个LSTM单元的隐状态的计算方式。

(3)模型解码模块选用贪婪搜索(greedy search)方法，只取概率最大的值作为输出值，在每个步骤中，解码器通过softmax概率分布函数产生一系列指向输入序列中元素的指针，将当前时刻指向的输入序列中的元素作为下一时刻解码器的输入；

p(C_i|C₁，...，C_i-1，P)＝softmax(uⁱ)

式中，v、W1、W₂是模型的可学习参数，h_j为j时刻编码器的隐状态，s_i为i时刻解码器的隐状态，tanh为激活函数。softmax函数将向量uⁱ(长度为n) 归一化为输入字典上的输出分布，即将

作为指向输入元素的指针得到向量维度和输入维度一致。

(4)模型输入为平面点集P＝{P₁，…，P_n}，其中，n为多边形的顶点数，P_j＝ (x_j，y_j)为多边形的顶点坐标，模型输出为C_p＝{C₁，…，C_m(p)}表示与点集P相对应的解的序列，元素C_i是对应于序列P中元素位于1和n之间的索引，或者表示序列开始或结束的特殊标记。

3、调整网络参数使网络模型能够收敛。

(1)参数使用均匀分布(-0.08，0.08)进行随机初始化。

(2)采用分批处理技术(Mini Batch)，每次投入batch组输入数据进行训练，更新参数，取batch大小为500。

(3)引入梯度裁剪技术(clip gradient)，首先设置一个梯度阈值 clip_gradient，在模型后向传播中求出各个参数的梯度，并计算出梯度的L2 范数||g||，比较其与预先设定的梯度阈值的大小。若前者大，则计算缩放因子

将原梯度乘上缩放因子得到最后的梯度。

(4)隐层节点数设为512。

4、设置模型期望精度与最大训练迭代次数，对网络模型进行训练，模型达到期望精度或训练达到设定最大迭代次数后，停止训练，得到基于Pointer Network网络的自动生成人工地物地面轮廓的模型。对于人工地物的散乱形状点，模型能够准确的输出较好的封闭连线方案，自动生成人工地物地面轮廓，具体为，训练的同时，用验证集对模型进行验证，结合训练过程中训练损失 (loss)的变化与验证集的准确率，若训练损失在多次迭代后不再发生明显变化或者验证集的准确率达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。测试时，依次输入多边形顶点坐标信息，模型会输出对应的封闭连线方案，例如：输入有4个顶点的多边形坐标信息 (x₁，y₁，x₂，y₂，x₃，y₃，x₄，y₄)，模型输出(2，3，1，4)，意为封闭连线方案为(x₃，y₃ )→(x₁，y₁)→(x₂，y₂)→(x₄，y₄)→(x₃，y₃)。如图2为采集到的某个建筑物的稀疏形状点分布图，图3为根据模型输出的该形状点的封闭连线方案还原的建筑物地面轮廓。

Claims

1.一种人工地物散乱形状点自动生成建筑物轮廓的方法，其特征在于，包括以下步骤：

(2)构建Pointer Network网络模型；

(3)调整网络参数使网络模型能够收敛；

(4)对网络模型进行训练，达到期望精度或达到设定最大迭代次数，得到基于PointerNetwork网络的自动生成人工地物地面轮廓的模型；

所述步骤(2)包括以下步骤：

h_t＝f(h_t-1,x_t)

s₀＝h_T

p(C_i|C₁,…,C_i-1,P)＝softmax(uⁱ)

(24)模型输入为平面点集P＝{P₁,…,P_n}，其中，n为多边形的顶点数，P_j＝(x_j,y_j)为多边形的顶点坐标，模型输出为C_p＝{C₁,…,C_m(p)}表示与点集P相对应的解的序列，元素C_i是对应于序列P中元素位于1和n之间的索引，或者表示序列开始或结束的特殊标记。

2.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法，其特征在于，所述步骤(1)具体包括以下步骤：

(11)将地区的遥感影像图转为shapefile格式，利用GDAL/OGR库读取文件；

3.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法，其特征在于，所述步骤(3)包括以下步骤：

(31)对参数进行随机初始化；

将原梯度乘上缩放因子得到最后的梯度。

4.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法，其特征在于，所述步骤(4)在训练同时，用验证集对模型进行验证，结合训练过程中loss变化与验证集准确率，若训练损失不再下降或者达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。