CN109493360A - 一种人工地物散乱形状点自动生成建筑物轮廓的方法 - Google Patents

一种人工地物散乱形状点自动生成建筑物轮廓的方法 Download PDF

Info

Publication number
CN109493360A
CN109493360A CN201811176798.XA CN201811176798A CN109493360A CN 109493360 A CN109493360 A CN 109493360A CN 201811176798 A CN201811176798 A CN 201811176798A CN 109493360 A CN109493360 A CN 109493360A
Authority
CN
China
Prior art keywords
man
model
decoder
polygon
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811176798.XA
Other languages
English (en)
Other versions
CN109493360B (zh
Inventor
张小国
高烨
张开心
王慧青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201811176798.XA priority Critical patent/CN109493360B/zh
Publication of CN109493360A publication Critical patent/CN109493360A/zh
Application granted granted Critical
Publication of CN109493360B publication Critical patent/CN109493360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/149Segmentation; Edge detection involving deformable models, e.g. active contour models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种人工地物散乱形状点自动生成建筑物轮廓的方法,将Pointer Network网络模型应用于建筑物区域描述任务中,对于人工地物的散乱形状点,能够准确的输出较好的封闭连线方案,自动生成人工地物地面轮廓。本发明包括如下步骤:(1)构建人工地物散乱形状点数据集;(2)构建Pointer Network网络模型;(3)调整网络参数使模型能够收敛;(4)训练并得到最终模型。本发明可适用于任意的自动生成封闭区域的任务,且能够应用于大规模样本,有较高的鲁棒性,能适用于现实世界中各种复杂的生成封闭区域的任务,具有广阔的应用前景。

Description

一种人工地物散乱形状点自动生成建筑物轮廓的方法
所属领域
本发明属于地理信息科学技术领域,具体涉及一种人工地物散乱形状点自动生成建筑物轮廓的方法。
背景技术
人工地物作为城市地类的重要构成部分,与城市的人口数量、经济发展、城市化程度等因素密切相关,能够准确、快速地反映出城市区域地发展变化规律,因此,在构建数字城市的过程中,人工地物信息的提取与处理成为后续工作的基础。
工程师们可以采用全站仪等方法测量建筑物地面轮廓点,所谓地面轮廓点,即建筑物轮廓区域中有明显转折的边角点。对于这些稀疏的地物散乱形状点,如果其凸包包含了所有的形状点,则由这些形状点生成的封闭区域是唯一的,但在现实世界中,建筑物地面轮廓往往是凹多边形,其封闭连线的方案并不唯一,因此,需要在一定的约束条件下,搜索生成最优、最符合实际情况的凹多边形,这涉及到组合优化问题,与TSP(TravelingSalesman Problem,平面旅行商问题)任务相似,实际可以看作是按照一定约束规则对点数据进行排序的任务。目前,基于散乱点的多边形自动生成算法已经比较成熟,主要包括二分排序法、2-Opt Moves、SteadyGrowth以及Inward Denting等算法,但这些算法仅适用于简单且具有良好凹凸性的多边形,不能很好地恢复凹多边形。
发明内容
技术问题:本发明提供一种人工地物散乱形状点自动生成建筑物轮廓的方法,解决由采集得到的地物散乱形状点恢复建筑物地面形状轮廓的问题,能输出较好的封闭连线方案,自动生成人工地物地面轮廓。
技术方案:本发明所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法,包括以下步骤:
(1)读取地区的遥感影像图,筛选出地物形状点数据作为训练样本并对其进行样本增量处理;
(2)构建Pointer Network网络模型;
(3)调整网络参数使网络模型能够收敛;
(4)对网络模型进行训练,达到期望精度或达到设定最大迭代次数,得到基于Pointer Network网络的自动生成人工地物地面轮廓的模型。
所述步骤(1)具体包括以下步骤:
(11)将地区的遥感影像图转为shapefile格式,利用GDAL/OGR库读取该文件;
(12)根据读取到的多边形顶点坐标数据对多边形进行凹凸性判断,并保存凹多边形顶点坐标数据;
(13)取多边形第一个顶点为起点,标签值设为1,按顺时针方向,其他点标签依次为2,3,…,n;
(14)对单个多边形顶点数据进行全排列处理,并保持其每个顶点与原始标签的一一对应关系。
所述步骤(2)包括以下步骤:
(21)在输入层加入数据归一化处理,即对于单个多边形,找出所有顶点坐标中最小的横坐标值,所有顶点的横坐标值以这个最小值作归一化,对于纵坐标,则以最小的纵坐标值作归一化;
(22)模型框架为解码器-编码器(Encoder-Decoder),编码器与解码器均采用单层LSTM网络,由编码器读入输入信息,将编码器最后的隐状态作为解码器隐状态的初值,编码器最后的输出作为解码器输入的初始值;
ht=f(ht-1,xt)
s0=hT
其中,ht表示t时刻编码器的隐状态,s0表示解码器的初始状态,xt为t时刻模型的输入,f为非线性函数,表示一个LSTM单元的隐状态的计算方式;
(23)模型解码模块选用贪婪搜索(greedy search)方法,只取概率最大的值作为输出值,在每个步骤中,解码器通过softmax概率分布函数产生一系列指向输入序列中元素的指针,将当前时刻指向的输入序列中的元素作为下一时刻解码器的输入:
p(Ci|C1,...,Ci-1,P)=softmax(ui)
其中,v、W1、W2是模型的可学习参数,hj为j时刻编码器的隐状态,si为i时刻解码器的隐状态,tanh为激活函数,softmax函数将向量ui归一化为输入字典上的输出分布;
(24)模型输入为平面点集P={P1,…,Pn},其中,n为多边形的顶点数,Pj=(xj,yj)为多边形的顶点坐标,模型输出为Cp={C1,…,Cm(p)}表示与点集P相对应的解的序列,元素Ci是对应于序列P中元素位于1和n之间的索引,或者表示序列开始或结束的特殊标记。
所述步骤(3)包括以下步骤:
(31)对参数进行随机初始化;
(32)采用批处理,每次投入batch组输入数据进行训练,更新参数;
(33)采用梯度裁剪技术:首先设置一个梯度阈值clip_gradient,在模型后向传播中求出各个参数的梯度,并计算出梯度的L2范数||g||,比较其与预先设定的梯度阈值的大小,若前者大,则计算缩放因子将原梯度乘上缩放因子得到最后的梯度。
所述步骤(4)在训练同时,用验证集对模型进行验证,结合训练过程中loss变化与验证集准确率,若训练损失不再下降或者达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。
有益效果:与现有技术相比,本发明的有益效果为:1、将Pointer Network网络模型应用于建筑物区域描述任务中,对于人工地物的散乱形状点,能够准确的输出较好的封闭连线方案,自动生成人工地物地面轮廓;2、本发明能够应用于大规模样本,有较高的鲁棒性,适用于现实世界中各种复杂的生成封闭区域的任务,具有广阔的应用前景。
附图说明
图1为本发明方法的流程示意图;
图2为采集到的某个建筑物的稀疏形状点分布图;
图3为按模型输出的形状点排序方案组成的封闭区域图。
具体实施方式
下面结合附图对本发明作进一步详细说明,图1为本发明的流程图。如图1所示,本发明包括以下步骤:
1、读取某一地区的遥感影像图,筛选出地物形状点数据作为训练样本并对其进行样本增量处理。
(1)将该地区的遥感影像图转为shapefile格式,利用GDAL/OGR库读取该文件。
(2)根据读取到的多边形顶点坐标数据对多边形进行凹凸性判断。从凹多边形与凸多边形的定义出发,即判断多边形中是否含有大于180度的顶角,如有,则判定为凹多边形;反之则为凸多边形。鉴于实际中建筑物的地面形状数据会存在误差,如部分“平角”略大于180度,可将“平角”定义为190度。由于凸多边形在数学上是可以被唯一恢复的,所以不考虑凸多边形,最后仅保存凹多边形顶点坐标数据。
(3)取多边形的第一个顶点为起点,标签值设为1,按顺时针方向,其他顶点标签依次为2,3,…,n。
(4)对单个多边形顶点数据进行全排列处理,并保持其每个顶点与原始标签的一一对应关系。
2、构建Pointer Network网络模型。
(1)在输入层加入数据归一化处理,即对于单个多边形,找出所有顶点坐标中最小的横坐标值,所有顶点的横坐标值以这个最小值作归一化,对于纵坐标,则以最小的纵坐标值作归一化。
(2)模型框架为解码器-编码器(Encoder-Decoder),编码器与解码器均采用单层LSTM网络,首先由编码器读入输入信息,将编码器最后的隐状态作为解码器隐状态的初值,编码器最后的输出作为解码器输入的初始值;
ht=f(ht-1,xt)
s0=ht
式中,ht表示t时刻编码器的隐状态,s0表示解码器的初始状态,xt为t时刻模型的输入,f为非线性函数,表示一个LSTM单元的隐状态的计算方式。
(3)模型解码模块选用贪婪搜索(greedy search)方法,只取概率最大的值作为输出值,在每个步骤中,解码器通过softmax概率分布函数产生一系列指向输入序列中元素的指针,将当前时刻指向的输入序列中的元素作为下一时刻解码器的输入;
p(Ci|C1,...,Ci-1,P)=softmax(ui)
式中,v、W1、W2是模型的可学习参数,hj为j时刻编码器的隐状态,si为i时刻解码器的隐状态,tanh为激活函数。softmax函数将向量ui(长度为n)归一化为输入字典上的输出分布,即将作为指向输入元素的指针得到向量维度和输入维度一致。
(4)模型输入为平面点集P={P1,…,Pn},其中,n为多边形的顶点数,Pj=(xj,yj)为多边形的顶点坐标,模型输出为Cp={C1,…,Cm(p)}表示与点集P相对应的解的序列,元素Ci是对应于序列P中元素位于1和n之间的索引,或者表示序列开始或结束的特殊标记。
3、调整网络参数使网络模型能够收敛。
(1)参数使用均匀分布(-0.08,0.08)进行随机初始化。
(2)采用分批处理技术(Mini Batch),每次投入batch组输入数据进行训练,更新参数,取batch大小为500。
(3)引入梯度裁剪技术(clip gradient),首先设置一个梯度阈值clip_gradient,在模型后向传播中求出各个参数的梯度,并计算出梯度的L2范数||g||,比较其与预先设定的梯度阈值的大小。若前者大,则计算缩放因子将原梯度乘上缩放因子得到最后的梯度。
(4)隐层节点数设为512。
4、设置模型期望精度与最大训练迭代次数,对网络模型进行训练,模型达到期望精度或训练达到设定最大迭代次数后,停止训练,得到基于Pointer Network网络的自动生成人工地物地面轮廓的模型。对于人工地物的散乱形状点,模型能够准确的输出较好的封闭连线方案,自动生成人工地物地面轮廓,具体为,训练的同时,用验证集对模型进行验证,结合训练过程中训练损失(loss)的变化与验证集的准确率,若训练损失在多次迭代后不再发生明显变化或者验证集的准确率达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。测试时,依次输入多边形顶点坐标信息,模型会输出对应的封闭连线方案,例如:输入有4个顶点的多边形坐标信息(x1,y1,x2,y2,x3,y3,x4,y4),模型输出(2,3,1,4),意为封闭连线方案为(x3,y3)→(x1,y1)→(x2,y2)→(x4,y4)→(x3,y3)。如图2为采集到的某个建筑物的稀疏形状点分布图,图3为根据模型输出的该形状点的封闭连线方案还原的建筑物地面轮廓。

Claims (5)

1.一种人工地物散乱形状点自动生成建筑物轮廓的方法,其特征在于,包括以下步骤:
(1)读取地区的遥感影像图,筛选出地物形状点数据作为训练样本并对其进行样本增量处理;
(2)构建Pointer Network网络模型;
(3)调整网络参数使网络模型能够收敛;
(4)对网络模型进行训练,达到期望精度或达到设定最大迭代次数,得到基于PointerNetwork网络的自动生成人工地物地面轮廓的模型。
2.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法,其特征在于,所述步骤(1)具体包括以下步骤:
(11)将地区的遥感影像图转为shapefile格式,利用GDAL/OGR库读取该文件;
(12)根据读取到的多边形顶点坐标数据对多边形进行凹凸性判断,并保存凹多边形顶点坐标数据;
(13)取多边形第一个顶点为起点,标签值设为1,按顺时针方向,其他点标签依次为2,3,…,n;
(14)对单个多边形顶点数据进行全排列处理,并保持其每个顶点与原始标签的一一对应关系。
3.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法,其特征在于,所述步骤(2)包括以下步骤:
(21)在输入层加入数据归一化处理,即对于单个多边形,找出所有顶点坐标中最小的横坐标值,所有顶点的横坐标值以这个最小值作归一化,对于纵坐标,则以最小的纵坐标值作归一化;
(22)模型框架为解码器-编码器(Encoder-Decoder),编码器与解码器均采用单层LSTM网络,由编码器读入输入信息,将编码器最后的隐状态作为解码器隐状态的初值,编码器最后的输出作为解码器输入的初始值;
ht=f(ht-1,xt)
s0=hT
其中,ht表示t时刻编码器的隐状态,s0表示解码器的初始状态,xt为t时刻模型的输入,f为非线性函数,表示一个LSTM单元的隐状态的计算方式;
(23)模型解码模块选用贪婪搜索(greedy search)方法,只取概率最大的值作为输出值,在每个步骤中,解码器通过softmax概率分布函数产生一系列指向输入序列中元素的指针,将当前时刻指向的输入序列中的元素作为下一时刻解码器的输入:
p(Ci|C1,...,Ci-1,P)=softmax(ui)
其中,v、W1、W2是模型的可学习参数,hj为j时刻编码器的隐状态,si为i时刻解码器的隐状态,tanh为激活函数,softmax函数将向量ui归一化为输入字典上的输出分布;
(24)模型输入为平面点集P={P1,…,Pn},其中,n为多边形的顶点数,Pj=(xj,yj)为多边形的顶点坐标,模型输出为Cp={C1,…,Cm(p)}表示与点集P相对应的解的序列,元素Ci是对应于序列P中元素位于1和n之间的索引,或者表示序列开始或结束的特殊标记。
4.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法,其特征在于,所述步骤(3)包括以下步骤:
(31)对参数进行随机初始化;
(32)采用批处理,每次投入batch组输入数据进行训练,更新参数;
(33)采用梯度裁剪技术:首先设置一个梯度阈值clip_gradient,在模型后向传播中求出各个参数的梯度,并计算出梯度的L2范数||g||,比较其与预先设定的梯度阈值的大小,若前者大,则计算缩放因子将原梯度乘上缩放因子得到最后的梯度。
5.根据权利要求1所述的一种人工地物散乱形状点自动生成建筑物轮廓的方法,其特征在于,所述步骤(4)在训练同时,用验证集对模型进行验证,结合训练过程中loss变化与验证集准确率,若训练损失不再下降或者达到设定期望精度或者训练迭代次数达到设定最大迭代次数则停止训练。
CN201811176798.XA 2018-10-10 2018-10-10 一种人工地物散乱形状点自动生成建筑物轮廓的方法 Active CN109493360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811176798.XA CN109493360B (zh) 2018-10-10 2018-10-10 一种人工地物散乱形状点自动生成建筑物轮廓的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811176798.XA CN109493360B (zh) 2018-10-10 2018-10-10 一种人工地物散乱形状点自动生成建筑物轮廓的方法

Publications (2)

Publication Number Publication Date
CN109493360A true CN109493360A (zh) 2019-03-19
CN109493360B CN109493360B (zh) 2021-07-09

Family

ID=65690146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811176798.XA Active CN109493360B (zh) 2018-10-10 2018-10-10 一种人工地物散乱形状点自动生成建筑物轮廓的方法

Country Status (1)

Country Link
CN (1) CN109493360B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110120058A (zh) * 2019-04-30 2019-08-13 河海大学 一种高程散点生成紧致外边界的方法
CN110378412A (zh) * 2019-07-17 2019-10-25 湖南视比特机器人有限公司 基于局部几何特征序列建模的二维轮廓形状识别分类方法
CN111652892A (zh) * 2020-05-02 2020-09-11 王磊 一种基于深度学习的遥感影像建筑物矢量提取及优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678844A (zh) * 2016-01-06 2016-06-15 东南大学 一种基于地物散乱点逐点增加的轮廓构建算法
CN107967257A (zh) * 2017-11-20 2018-04-27 哈尔滨工业大学 一种级联式作文生成方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678844A (zh) * 2016-01-06 2016-06-15 东南大学 一种基于地物散乱点逐点增加的轮廓构建算法
CN107967257A (zh) * 2017-11-20 2018-04-27 哈尔滨工业大学 一种级联式作文生成方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ORIOL VINYALS 等: "Pointer Networks", 《HTTPS://ARXIV.ORG/PDF/1506.03134.PDF》 *
YING SUN 等: "Extracting Building Boundaries from High Resolution Optical Images and LiDAR Data by Integrating the Convolutional Neural Network and the Active Contour Model", 《REMOTE SENSING》 *
程效军 等: "融合航空影像和LIDAR点云的建筑物探测及轮廓提取", 《中国激光》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110120058A (zh) * 2019-04-30 2019-08-13 河海大学 一种高程散点生成紧致外边界的方法
CN110120058B (zh) * 2019-04-30 2022-08-12 河海大学 一种高程散点生成紧致外边界的方法
CN110378412A (zh) * 2019-07-17 2019-10-25 湖南视比特机器人有限公司 基于局部几何特征序列建模的二维轮廓形状识别分类方法
CN110378412B (zh) * 2019-07-17 2021-07-27 湖南视比特机器人有限公司 基于局部几何特征序列建模的二维轮廓形状识别分类方法
CN111652892A (zh) * 2020-05-02 2020-09-11 王磊 一种基于深度学习的遥感影像建筑物矢量提取及优化方法

Also Published As

Publication number Publication date
CN109493360B (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
US11562186B2 (en) Capturing network dynamics using dynamic graph representation learning
CN108052984B (zh) 计数方法及装置
CN109493360A (zh) 一种人工地物散乱形状点自动生成建筑物轮廓的方法
CN110543906B (zh) 基于Mask R-CNN模型的肤质自动识别方法
CN107392128A (zh) 基于双低秩表示和局部约束矩阵回归的鲁棒图像识别方法
CN107145991B (zh) 一种考虑路段相关性的时变随机网络动态路径搜索方法
CN103676649A (zh) 局部自适应小波神经网络训练系统、设备及方法
CN103927554A (zh) 一种基于拓扑结构的图像稀疏表征面部表情特征提取系统和方法
CN103093237B (zh) 一种基于结构化模型的人脸检测方法
CN110232445A (zh) 一种基于知识蒸馏的文物真伪鉴定方法
CN107704848A (zh) 一种基于多约束条件卷积神经网络的密集人脸对齐方法
Feng et al. Calibrating nonparametric cellular automata with a generalized additive model to simulate dynamic urban growth
CN104424276A (zh) 基于流形学习的指纹库自更新方法和装置
CN115345297A (zh) 一种基于生成对抗网络的台区样本生成方法及系统
Wang et al. EQSM: An efficient high quality surface grid generation method based on remeshing
Gao et al. Distributed quasi-Newton derivative-free optimization method for optimization problems with multiple local optima
Vietinghoff et al. Visual analysis of spatio-temporal trends in time-dependent ensemble data sets on the example of the North Atlantic Oscillation
CN106960225A (zh) 一种基于低秩监督的稀疏图像分类方法
Liu et al. Hybrid spatiotemporal graph convolutional network for detecting landscape pattern evolution from long-term remote sensing images
KR102583178B1 (ko) 발전량 예측 방법 및 장치
CN116050579A (zh) 基于深度特征融合网络的建筑能耗预测方法及系统
CN116010875A (zh) 电表故障的分类方法、装置、电子设备及计算机存储介质
CN115455899A (zh) 一种基于图神经网络的解析布局方法
CN115270686A (zh) 一种基于图神经网络的芯片布局方法
CN113516766A (zh) 一种基于神经网络算法的独立坐标系参数分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant