CN104036550A - 基于形状语义的建筑立面激光雷达点云解译与重建的方法 - Google Patents

基于形状语义的建筑立面激光雷达点云解译与重建的方法 Download PDF

Info

Publication number
CN104036550A
CN104036550A CN201410286813.1A CN201410286813A CN104036550A CN 104036550 A CN104036550 A CN 104036550A CN 201410286813 A CN201410286813 A CN 201410286813A CN 104036550 A CN104036550 A CN 104036550A
Authority
CN
China
Prior art keywords
building
elevation
subdivision
shape
grid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410286813.1A
Other languages
English (en)
Other versions
CN104036550B (zh
Inventor
张立强
徐翔
张良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN201410286813.1A priority Critical patent/CN104036550B/zh
Publication of CN104036550A publication Critical patent/CN104036550A/zh
Application granted granted Critical
Publication of CN104036550B publication Critical patent/CN104036550B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

建筑立面建模是城市建模的重要组成部分。本发明基于形状语义和增强学习优化策略,提出了一种建筑立面激光点云解译和重建的方法。首先基于数据驱动对点云进行建筑学语义上的预分类,接着设计了可以灵活应用于各种建筑立面风格的二分形状语义,最后将建筑立面的最佳形状语义求解的问题建模为马尔科夫决策过程,采用增强学习算法结合支持向量机预分类的结果优化求解,实现对建筑立面的解译和三维重建。本发明提出的方法不仅能够较为精确的对建筑立面进行精细建模,而且能够适应于各种风格建筑立面的解译,对于建筑立面点云缺失的情况也有很好的鲁棒性。

Description

基于形状语义的建筑立面激光雷达点云解译与重建的方法
一、技术领域
本发明涉及基于形状语义的建筑立面激光点云解译与重建的方法,属于空间信息技术领域。
二、背景技术
建筑立面的重建是数字城市建模的重要组成部分。传统的建筑立面建模方法主要是从二维的图像中来提取建筑的精细结构。近年来,随着激光雷达技术的发展,可以通过车载激光雷达或是机载激光雷达对地面进行快速的扫描从而获得城市模型的点云。与传统的图片相比,激光雷达点云是建筑模型的直接三维表示,包含了恢复建筑结构特征的几乎所有特征。一些研究显示了激光雷达数据可以高效地应用于城市的重建中。
本申请专利探索如何从激光雷达点云中提取建筑精细的结构特征,从而为建筑的自动化三维重建提供基础。数据驱动的方法利用建筑图像或激光雷达点云自身的信息,构造相应的特征属性自底向上对建筑进行分类和识别。数据驱动的方法虽然很精确,但是却无法很好显示建筑的语义特征(比如,建筑由门、窗、阳台、屋顶等建筑学意义上的物体组成)。为此人们提出了形状语义的概念用来自顶向下对建筑进行建筑学语义上的建模。采用形状语义的难点在于定义适合建筑的语义以及如何高效地求解最优语义。本申请专利将研究如何设计形状语义对建筑的点云立面进行解译并进行高效地求解,以实现对不规则且存在点云缺失的立面进行建模。
三、发明内容
1、目的:建筑立面的重建是数字城市建模的重要组成部分。传统的建模方法主要是基于人工或是半自动的重建,由于城市里的建筑数量庞大,且建筑形状复杂,人工建立城市模型需要建模者要有一定的经验,并耗费大量时间。目前存在一些半自动生成建筑模型的方法,但效果都不令人满意。与传统的基于图像的建模方法相比,激光雷达点云是建筑模型的直接三维表示。本申请专利实现了从激光雷达点云中自动提取建筑立面精细的结构特征,从而为城市建筑的自动化三维重建提供基础。
2、技术方案
基于形状语义的建筑立面激光点云解译与重建的方法,其特征在于,包括如下步骤(如图1):
步骤一:点云噪声去除
点云中噪声的存在对于后面计算曲度会有较大的影响,因此,采用统计方法去除点云噪声。对于输入点云的每一点,计算它到邻近点的距离的均值μ和标准差σ。那些距离落在μ±α·σ之外的点则被视为噪声而移除,其中α是和选取的邻近点的数目相近的一个值。本申请专利中,α=1.0,邻近点的数目为20。
步骤二:坐标系转换
为了方便后续的处理,把建筑立面所在的平面转换到X-Y平面中去,即,建筑的水平方向与X轴平行,竖直方向与Y轴平行。这样一来建筑立面点云的z坐标就代表了建筑结构的深度信息,并且建筑的水平和竖直方向与坐标轴平行,以便于下文对建筑立面进行网格剖分。
建筑立面的坐标系变换陈述为如下问题,给定建筑点云当前所处的基M1={α1,α2,α3}以及目标坐标系的基M2={β1,β2,β3},求M1到M2的过渡矩阵。其中,β1={1,0,0},β2={0,1,0},β3={0,0,1}。而要得到两组基之间的过渡矩阵P,只需要给出目标坐标系的基中的每个向量(β1,β2,β3)在当前所处基下的坐标(p1,p2,p3),依次以这些坐标为列向量组成矩阵即是从M1到M2的过渡矩阵P。
目前的任务是计算(β1,β2,β3)在当前所处基下的坐标(p1,p2,p3)。由前述知,建筑的水平方向对其到X轴,建筑的竖直方向对齐到Y轴,因此,基向量β1在当前基下对应的坐标p1是建筑立面水平方向的向量,基向量β2对应的坐标p2则是建筑立面竖直方向的向量,基向量p3对应的坐标则是建筑平面的法向量。
采用随机抽样一致模型计算建筑立面的平面参数,继而得到其归一化的法向量,即为p3。对于p2,使用建筑墙面边缘线所处的向量表示,而p1则可以由p2和p3的外积求得。得到过渡矩阵P后,对原始点云中的点X应用变换P即可得到在新坐标系下的坐标X'。
步骤三:点云特征提取
为了有效识别建筑立面的结构(如门、窗户、阳台),设计了基于网格的点云特征提取方法。首先对建筑立面进行剖分,使得建筑立面由一系列三维的小网格组成。在本申请专利中,网格的大小设置为0.1米。这样对点云分类的任务就变成了对这些网格的分类。本申请专利设计了三种网格的属性,用来通过支持向量机对建筑立面点云中的结构单元分类。
(1)曲度
曲度反映了建筑局部结构的变化情况,对于提取建筑结构的变化有很大作用。定义网格内的曲度特征是网格内所有点的曲度的平均值。计算每点的曲度近似为计算该点和邻近的k个点近似组成的平面的曲度,二者可以通过分析邻近点的协相关矩阵的特征向量和特征矩阵得到。
对于一点pi,它的协相关矩阵为:
C = 1 k Σ i = 1 k ( p i - p ‾ ) · ( p i - p ‾ ) T , C · v j → = λ j · v j → , j ∈ { 0,1,2 } - - - ( 1 )
其中,k是pi的邻近点的数目,代表邻近点的三维中心坐标,λj是协相关矩阵的第j个特征值,是第j个特征向量。
点pi的曲度为:
γpi=λ0/(λ012) (2)
假设网格G中有n个点,那么该网格的曲度则表示为:
γ G = 1 n Σ i = 1 n γ pi - - - ( 3 )
(2)密度
除了曲度外,网格内点的密度变化同样能反映不同的建筑结构,另外,对于密度还能够明确地反映数据缺失或是背景网格。
设网格G中有n个点,点数最多网格内的点数为N,则该网格的密度dG表示为:
dG=n/N (4)
(3)深度
由于建筑表面各个结构通常位于不同的平面,通过深度值可以较容易识别出不同的建筑立面结构。步骤二已经将建筑平面转换到了X-Y平面,因此点云的z坐标就表示了深度的信息。
假设网格G中有n个点,那么该网格的深度表示为:
s G = 1 n Σ i = 1 n z i - - - ( 5 )
其中zi为点i的z坐标。
以上三种特征将作为网格的特征向量用于步骤四的支持向量机分类中。
步骤四:基于支持向量机的建筑立面点云分类
由于建筑立面的建筑学意义上的结构(如窗户、阳台、门、屋顶等)是从人类认知角度去定义的,采用非监督的方法往往很难得到满意的结果。为此,本申请专利采用了支持向量机的方法进行分类。
首先选择训练集,训练集里的每一个样本都有一个类别标签及多个属性值。用数学的语言来描述就是:给定一个训练集(x1,y1),i=1,…,l,xi∈Rn表示样本的特征向量,y∈{-1,1}l表示样本的类别向量,支持向量机求解以下正定规划的最优解:
训练向量的特征分别是曲度、密度和深度。本申请专利选择了半径基函数作为核函数,并设定γ=1。在步骤三中定义的三种网格属性分别归化到[-1,1]之间,对样本集进行训练,最后进行预测。
在分类完成之后,便可以得到了某个网格属于特定建筑结构的概率:
步骤五:建筑立面的二分形状语义表达
从给定的建筑立面点云中得到表达墙面结构的最佳剖分树,就可以重建建筑立面。用数学语言描述如下:
给定建筑立面点云O,二分形状语义G=(N,T,R,ω),其中N是非终端形状语义的集合,如果一个带标号的矩形c(x,y,w,h)出现在一个规则的左边,那么它就是非终端形状语义;T是终端语义的集合,,(x,y,w,h)定义了矩形在坐标系中的位置、宽度w和高度h;如果一个带标号的矩形c(x,y,w,h)不能出现在一个规则的左边,那么它就是终端形状语义;ω是一个特殊的非终端形状语义,称为初始形状,剖分总是从初始形状开始进行。R是一个有限的剖分规则的集合。设L(G)为二分形状语义的所有可能的剖分树(剖分方式)。寻找到一个最佳的剖分语言s∈L(G),使得如下的目标函数最大:
arg s max s ∈ L ( G ) Σ x , y ∈ facade p ( s ( x , y ) | x , y ) - - - ( 8 )
其中,s(x,y)表示剖分s得到的网格(x,y)的建筑结构类别;p(s(x,y)|x,y)即为步骤四得到的网格(x,y)处建筑类别为s(x,y)的概率。从上式(8)可以看出,评价一个剖分的好坏在于它剖分得到的终端形状的类别与预分类的结果是否一致。本申请专利采用了逐网格进行累加的方式对建筑立面上的所有网格进行判断,看剖分的结果与预分类的结果是否一致,若一致则进行累加1,否则累加0,最终的累加值则反映了该剖分的好坏。最大化式(15)便可以得到建筑立面的最佳剖分。
步骤六:城市建筑立面三维建模
二分形状语义可以有效表达建筑立面结构的生成过程,只要构建建筑立面的二分形状语义剖分树后,就可以对该建筑立面的解译。从二分语义的剖分过程来看,可以把求解(8)式看成是一个马尔科夫决策过程(MDP)。
(1)最优形状语义的求解
二分形状语义产生建筑的过程用MDP来建模,下面是MDP里的各个要素在建筑剖分中代表的含义。
智能体:MDP中的智能体表示的是形状语义剖分建筑立面的过程。在剖分建筑立面的时候,每一步都要处理一个非终端形状,智能体则决定采用哪种规则及规则参数应用于该形状。
环境:马尔可夫过程中的环境与智能体交互,指的是随着剖分进行不断建立的剖分树。随着剖分的不断进行,剖分树不断完善,环境也就有了对模型更多的知识。
状态:为剖分树中的结点。该结点表示了当前剖分所对应的形状及其位置,用state(x,y,symbol)表示,其中(x,y)为当前状态所处的位置,symbol表示当前形状的名字,symbol只能是非终端形状。
行为:为智能体可以选择的语法规则,用action(rule,parameter)表示,其中rule表示语法,parameter表示剖分的宽度。
回报值:设马尔可夫决策在t时刻执行动作action(rule,parameter)得到的终端形状为A(x,y,w,h,a),那么相应的回报值为,
R t = Σ i = x x + w Σ j = y y + h p ( a | x , y ) - - - ( 9 )
其中p(a|x,y)表示建筑立面(x,y)处是a类别的概率。
设MDP决策过程的序列为T,那么长期的回报为:
R = Σ t = 0 T R t - - - ( 10 )
由于MDP决策完毕后,把建筑立面剖分完毕,因此有,
R = Σ t = 0 T R t = Σ x , y ∈ I p ( x , y , s ( x , y ) ) - - - ( 11 )
MDP的最优解即是获取的最优形状语义。
采用增强学习算法求解以上叙述的MDP问题。增强学习采用的是Q-Learning算法。
(2)建筑立面深度信息的恢复
强化学习得到的最佳语义可以表示为剖分树的形式,其中剖分树的叶子节点是组成立面的所有建筑结构(终端形状),记为Leafi(c,x,y,w,h),c表示叶子节点i所属的建筑类别,(x,y,w,h)定义了建筑结构的外包矩形R。通过这些叶子节点,计算各类建筑结构在建筑立面上的分布情况,并构造出建筑该建筑立面的二维平面。还需要得到各种建筑结构的深度以完成最后的三维建模,为此,查询点云中R内的所有点,利用随机抽样一致模型得到这些点所的平面,设该平面为:
aix+biy+ciz+di=0 (12)
在上述坐标系转换中,已经求得建筑主平面所在的方程:
Ax+By+Cx+D=0 (13)
由于建筑结构的平面与主平面平行,则建筑类别c离主平面的深度d为:
d = | d i - D A 2 + B 2 + C 2 | - - - ( 14 )
如此便恢复了建筑结构c的深度信息。
3、优点及功效:本申请专利基于形状语义和增强学习优化策略,提出了一种建筑立面激光雷达点云解译和重建的方法。首先基于数据驱动对点云进行建筑学语义上的预分类,接着设计了灵活应用于各种建筑立面风格的二分形状语义,最后将建筑立面的最佳形状语义求解的问题建模为马尔科夫决策过程,采用增强学习算法结合支持向量机预分类的结果优化求解,实现对建筑立面的解译和三维重建。本申请专利提出的方法不仅能够较为精确的对建筑立面进行精细建模,而且能够适应于各种风格建筑立面的解译,对于建筑立面点云缺失的情况也有很好的鲁棒性。
四、附图说明
图1本发明方法的流程示意图。
图2一个立面建模过程。(a)原始点云;(b)形状语义解译结果;(c)恢复深度建模结果。
图3建筑建模立面建模过程。(a)原始点云;(b)形状语义解译结果;(c)恢复深度建模结果。
图4北师大科技楼立面建模过程。(a)原始点云;(b)形状语义解译结果;(c)恢复深度建模结果。
图5点云严重缺失的立面建模过程。(a)原始点云;(b)形状语义解译结果;(c)恢复深度建模结果。
五、具体实施方式
基于形状语义的建筑立面激光点云解译与重建的方法,其特征在于,包括如下步骤(如图1):
步骤一:点云噪声去除
点云中噪声的存在对于后面计算曲度会有较大的影响,因此,采用统计方法去除点云噪声。对于输入点云的每一点,计算它到邻近点的距离的均值μ和标准差σ。那些距离落在μ±α·σ之外的点则被视为噪声而移除,其中α是和选取的邻近点的数目相近的一个值。本申请专利中,α=1.0,邻近点的数目为20。
步骤二:坐标系转换
为了方便后续的处理,把建筑立面所在的平面转换到X-Y平面中去,即,建筑的水平方向与X轴平行,竖直方向与Y轴平行。这样一来建筑立面点云的z坐标就代表了建筑结构的深度信息,并且建筑的水平和竖直方向与坐标轴平行,以便于下文对建筑立面进行网格剖分。
建筑立面的坐标系变换陈述为如下问题,给定建筑点云当前所处的基M1={α1,α2,α3}以及目标坐标系的基M2={β1,β2,β3},求M1到M2的过渡矩阵。其中,β1={1,0,0},β2={0,1,0},β3={0,0,1}。而要得到两组基之间的过渡矩阵P,只需要给出目标坐标系的基中的每个向量(β1,β2,β3)在当前所处基下的坐标(p1,p2,p3),依次以这些坐标为列向量组成矩阵即是从M1到M2的过渡矩阵P。
目前的任务是计算(β1,β2,β3)在当前所处基下的坐标(p1,p2,p3)。由前述知,建筑的水平方向对其到X轴,建筑的竖直方向对齐到Y轴,因此,基向量β1在当前基下对应的坐标p1是建筑立面水平方向的向量,基向量β2对应的坐标p2则是建筑立面竖直方向的向量,基向量p3对应的坐标则是建筑平面的法向量。
采用随机抽样一致模型计算建筑立面的平面参数,继而得到其归一化的法向量,即为p3。对于p2,使用建筑墙面边缘线所处的向量表示,而p1则可以由p2和p3的外积求得。得到过渡矩阵P后,对原始点云中的点X应用变换P即可得到在新坐标系下的坐标X'。
步骤三:点云特征提取
为了有效识别建筑立面的结构(如门、窗户、阳台),设计了基于网格的点云特征提取方法。首先对建筑立面进行剖分,使得建筑立面由一系列三维的小网格组成。在本申请专利中,网格的大小设置为0.1米。这样对点云分类的任务就变成了对这些网格的分类。本申请专利设计了三种网格的属性,用来通过支持向量机对建筑立面点云中的结构单元分类。
(1)曲度
曲度反映了建筑局部结构的变化情况,对于提取建筑结构的变化有很大作用。定义网格内的曲度特征是网格内所有点的曲度的平均值。计算每点的曲度近似为计算该点和邻近的k个点近似组成的平面的曲度,二者可以通过分析邻近点的协相关矩阵的特征向量和特征矩阵得到。
对于一点pi,它的协相关矩阵为:
C = 1 k Σ i = 1 k ( p i - p ‾ ) · ( p i - p ‾ ) T , C · v j → = λ j · v j → , j ∈ { 0,1,2 } - - - ( 1 )
其中,k是pi的邻近点的数目,代表邻近点的三维中心坐标,λj是协相关矩阵的第j个特征值,是第j个特征向量。
点pi的曲度为:
γpi=λ0/(λ012) (2)
假设网格G中有n个点,那么该网格的曲度则表示为:
γ G = 1 n Σ i = 1 n γ pi - - - ( 3 )
(2)密度
除了曲度外,网格内点的密度变化同样能反映不同的建筑结构,另外,对于密度还能够明确地反映数据缺失或是背景网格。
设网格G中有n个点,点数最多网格内的点数为N,则该网格的密度dG表示为:
dG=n/N (4)
(3)深度
由于建筑表面各个结构通常位于不同的平面,通过深度值可以较容易识别出不同的建筑立面结构。步骤二已经将建筑平面转换到了X-Y平面,因此点云的z坐标就表示了深度的信息。
假设网格G中有n个点,那么该网格的深度表示为:
s G = 1 n Σ i = 1 n z i - - - ( 5 )
其中zi为点i的z坐标。
以上三种特征将作为网格的特征向量用于步骤四的支持向量机分类中。
步骤四:基于支持向量机的建筑立面点云分类
由于建筑立面的建筑学意义上的结构(如窗户、阳台、门、屋顶等)是从人类认知角度去定义的,采用非监督的方法往往很难得到满意的结果。为此,本申请专利采用了支持向量机的方法进行分类。
首先选择训练集,训练集里的每一个样本都有一个类别标签及多个属性值。用数学的语言来描述就是:给定一个训练集(xi,yi),i=1,…,l,xi∈Rn表示样本的特征向量,y∈{-1,1}l表示样本的类别向量,支持向量机求解以下正定规划的最优解:
训练向量的特征分别是曲度、密度和深度。本申请专利选择了半径基函数作为核函数,并设定γ=1。在步骤三中定义的三种网格属性分别归化到[-1,1]之间,对样本集进行训练,最后进行预测。
在分类完成之后,便可以得到了某个网格属于特定建筑结构的概率:
步骤五:建筑立面的二分形状语义表达
从给定的建筑立面点云中得到表达墙面结构的最佳剖分树,就可以重建建筑立面。用数学语言描述如下:
给定建筑立面点云O,二分形状语义G=(N,T,R,ω),其中N是非终端形状语义的集合,如果一个带标号的矩形c(x,y,w,h)出现在一个规则的左边,那么它就是非终端形状语义;T是终端语义的集合,,(x,y,w,h)定义了矩形在坐标系中的位置、宽度w和高度h;如果一个带标号的矩形c(x,y,w,h)不能出现在一个规则的左边,那么它就是终端形状语义;ω是一个特殊的非终端形状语义,称为初始形状,剖分总是从初始形状开始进行。R是一个有限的剖分规则的集合。设L(G)为二分形状语义的所有可能的剖分树(剖分方式)。寻找到一个最佳的剖分语言s∈L(G),使得如下的目标函数最大:
arg s max s ∈ L ( G ) Σ x , y ∈ facade p ( s ( x , y ) | x , y ) - - - ( 8 )
其中,s(x,y)表示剖分s得到的网格(x,y)的建筑结构类别;p(s(x,y)|x,y)即为步骤四得到的网格(x,y)处建筑类别为s(x,y)的概率。从上式(8)可以看出,评价一个剖分的好坏在于它剖分得到的终端形状的类别与预分类的结果是否一致。本申请专利采用了逐网格进行累加的方式对建筑立面上的所有网格进行判断,看剖分的结果与预分类的结果是否一致,若一致则进行累加1,否则累加0,最终的累加值则反映了该剖分的好坏。最大化式(15)便可以得到建筑立面的最佳剖分。
步骤六:城市建筑立面三维建模
二分形状语义可以有效表达建筑立面结构的生成过程,只要构建建筑立面的二分形状语义剖分树后,就可以对该建筑立面的解译。从二分语义的剖分过程来看,可以把求解(8)式看成是一个马尔科夫决策过程(MDP)。
(1)最优形状语义的求解
二分形状语义产生建筑的过程用MDP来建模,下面是MDP里的各个要素在建筑剖分中代表的含义。
智能体:MDP中的智能体表示的是形状语义剖分建筑立面的过程。在剖分建筑立面的时候,每一步都要处理一个非终端形状,智能体则决定采用哪种规则及规则参数应用于该形状。
环境:马尔可夫过程中的环境与智能体交互,指的是随着剖分进行不断建立的剖分树。随着剖分的不断进行,剖分树不断完善,环境也就有了对模型更多的知识。
状态:为剖分树中的结点。该结点表示了当前剖分所对应的形状及其位置,用state(x,y,symbol)表示,其中(x,y)为当前状态所处的位置,symbol表示当前形状的名字,symbol只能是非终端形状。
行为:为智能体可以选择的语法规则,用action(rule,parameter)表示,其中rule表示语法,parameter表示剖分的宽度。
回报值:设马尔可夫决策在t时刻执行动作action(rule,parameter)得到的终端形状为A(x,y,w,h,a),那么相应的回报值为,
R t = Σ i = x x + w Σ j = y y + h p ( a | x , y ) - - - ( 9 )
其中p(a|x,y)表示建筑立面(x,y)处是a类别的概率。
设MDP决策过程的序列为T,那么长期的回报为:
R = Σ t = 0 T R t - - - ( 10 )
由于MDP决策完毕后,把建筑立面剖分完毕,因此有,
R = Σ t = 0 T R t = Σ x , y ∈ I p ( x , y , s ( x , y ) ) - - - ( 11 )
MDP的最优解即是获取的最优形状语义。
采用增强学习算法求解以上叙述的MDP问题。增强学习采用的是Q-Learning算法。
(2)建筑立面深度信息的恢复
强化学习得到的最佳语义可以表示为剖分树的形式,其中剖分树的叶子节点是组成立面的所有建筑结构(终端形状),记为Leafi(c,x,y,w,h),c表示叶子节点i所属的建筑类别,(x,y,w,h)定义了建筑结构的外包矩形R。通过这些叶子节点,计算各类建筑结构在建筑立面上的分布情况,并构造出建筑该建筑立面的二维平面。还需要得到各种建筑结构的深度以完成最后的三维建模,为此,查询点云中R内的所有点,利用随机抽样一致模型得到这些点所的平面,设该平面为:
aix+biy+ciz+di=0 (12)
在上述坐标系转换中,已经求得建筑主平面所在的方程:
Ax+By+Cx+D=0 (13)
由于建筑结构的平面与主平面平行,则建筑类别c离主平面的深度d为:
d = | d i - D A 2 + B 2 + C 2 | - - - ( 14 )
如此便恢复了建筑结构c的深度信息。
实施例1:
图2显示了一个建筑结构数目较少,但是层间是不对称的立面,下面一层的窗户分布明显要不同于其它的楼层。本申请专利方法建模得到的结果很好地体现了原始建筑的结构特征。图3-4显示了对更为复杂的墙面进行建模的结果,可以看出,对于墙面结构众多的情况,算法也具有很好的表现。图5显示了在点云严重缺失的情况下,本申请专利提出的算法也能很好地对其建模。

Claims (1)

1.基于形状语义的建筑立面激光点云解译与重建的方法,其特征在于,包括如下步骤:
步骤一:点云噪声去除
对于输入点云的每一点,计算它到邻近点的距离的均值μ和标准差σ,那些距离落在μ±α·σ之外的点则被视为噪声而移除,其中α是和选取的邻近点的数目相近的一个值,本申请专利中,α=1.0,邻近点的数目为20;
步骤二:坐标系转换
把建筑立面所在的平面转换到X-Y平面中去,即,建筑的水平方向与X轴平行,竖直方向与Y轴平行;
建筑立面的坐标系变换陈述为如下问题,给定建筑点云当前所处的基M1={α1,α2,α3}以及目标坐标系的基M2={β1,β2,β3},求M1到M2的过渡矩阵,其中,β1={1,0,0},β2={0,1,0},β3={0,0,1},而要得到两组基之间的过渡矩阵P,只需要给出目标坐标系的基中的每个向量(β1,β2,β3)在当前所处基下的坐标(p1,p2,p3),依次以这些坐标为列向量组成矩阵即是从M1到M2的过渡矩阵P;
基向量β1在当前基下对应的坐标p1是建筑立面水平方向的向量,基向量β2对应的坐标p2则是建筑立面竖直方向的向量,基向量p3对应的坐标则是建筑平面的法向量;
采用随机抽样一致模型计算建筑立面的平面参数,继而得到其归一化的法向量,即为p3,对于p2,使用建筑墙面边缘线所处的向量表示,而p1则可以由p2和p3的外积求得,得到过渡矩阵P后,对原始点云中的点X应用变换P即可得到在新坐标系下的坐标X';
步骤三:点云特征提取
首先对建筑立面进行剖分,使得建筑立面由一系列三维的小网格组成,在本申请专利中,网格的大小设置为0.1米,设计了下面三种网格属性,用来通过支持向量机对建筑立面点云中的结构单元分类;
(1)曲度
定义网格内的曲度特征是网格内所有点的曲度的平均值,计算每点的曲度近似为计算该点和邻近的k个点近似组成的平面的曲度,二者可以通过分析邻近点的协相关矩阵的特征向量和特征矩阵得到;
对于一点pi,它的协相关矩阵为:
C = 1 k Σ i = 1 k ( p i - p ‾ ) · ( p i - p ‾ ) T , C · v j → = λ j · v j → , j ∈ { 0,1,2 } - - - ( 1 )
其中,k是pi的邻近点的数目,代表邻近点的三维中心坐标,λj是协相关矩阵的第j个特征值,是第j个特征向量;
点pi的曲度为:
γpi=λ0/(λ012) (2)
假设网格G中有n个点,那么该网格的曲度则表示为:
γ G = 1 n Σ i = 1 n γ pi - - - ( 3 )
(2)密度
设网格G中有n个点,点数最多网格内的点数为N,则该网格的密度dG表示为:
dG=n/N (4)
(3)深度
假设网格G中有n个点,那么该网格的深度表示为:
s G = 1 n Σ i = 1 n z i - - - ( 5 )
其中zi为点i的z坐标;
以上三种特征将作为网格的特征向量用于步骤四的支持向量机分类中;
步骤四:基于支持向量机的建筑立面点云分类
首先选择训练集,训练集里的每一个样本都有一个类别标签及多个属性值,用数学的语言来描述就是:给定一个训练集(xi,yi),i=1,…,l,xi∈Rn表示样本的特征向量,y∈{-1,1}l表示样本的类别向量,支持向量机求解以下正定规划的最优解:
训练向量的特征分别是曲度、密度和深度,本申请专利选择了半径基函数作为核函数,并设定γ=1,在步骤三中定义的三种网格属性分别归化到[-1,1]之间,对样本集进行训练,最后进行预测;
在分类完成之后,便可以得到了某个网格属于特定建筑结构的概率:
步骤五:建筑立面的二分形状语义表达
从给定的建筑立面点云中得到表达墙面结构的最佳剖分树,就可以重建建筑立面,用数学语言描述如下:
给定建筑立面点云O,二分形状语义G=(N,T,R,ω),其中N是非终端形状语义的集合,如果一个带标号的矩形c(x,y,w,h)出现在一个规则的左边,那么它就是非终端形状语义;T是终端语义的集合,(x,y,w,h)定义了矩形在坐标系中的位置、宽度w和高度h;如果一个带标号的矩形c(x,y,w,h)不能出现在一个规则的左边,那么它就是终端形状语义;ω是一个特殊的非终端形状语义,称为初始形状,剖分总是从初始形状开始进行,R是一个有限的剖分规则的集合,设L(G)为二分形状语义的所有可能的剖分树(剖分方式),寻找到一个最佳的剖分语言s∈L(G),使得如下的目标函数最大:
arg s max s ∈ L ( G ) Σ x , y ∈ facade p ( s ( x , y ) | x , y ) - - - ( 8 )
其中,s(x,y)表示剖分s得到的网格(x,y)的建筑结构类别;p(s(x,y)|x,y)即为步骤四得到的网格(x,y)处建筑类别为s(x,y)的概率,本申请专利采用了逐网格进行累加的方式对建筑立面上的所有网格进行判断,看剖分的结果与预分类的结果是否一致,若一致则进行累加1,否则累加0,最终的累加值则反映了该剖分的好坏,最大化式(15)得到建筑立面的最佳剖分;
步骤六:城市建筑立面三维建模
从二分语义的剖分过程来看,把求解(8)式看成是一个马尔科夫决策过程(MDP);
(1)最优形状语义的求解
二分形状语义产生建筑的过程用MDP来建模,下面是MDP里的各个要素在建筑剖分中代表的含义;
智能体:MDP中的智能体表示的是形状语义剖分建筑立面的过程,在剖分建筑立面的时候,每一步都要处理一个非终端形状,智能体则决定采用哪种规则及规则参数应用于该形状;
环境:马尔可夫过程中的环境与智能体交互,指的是随着剖分进行不断建立的剖分树,随着剖分的不断进行,剖分树不断完善,环境也就有了对模型更多的知识;
状态:为剖分树中的结点,该结点表示了当前剖分所对应的形状及其位置,用state(x,y,symbol)表示,其中(x,y)为当前状态所处的位置,symbol表示当前形状的名字,symbol只能是非终端形状;
行为:为智能体可以选择的语法规则,用action(rule,parameter)表示,其中rule表示语法,parameter表示剖分的宽度;
回报值:设马尔可夫决策在t时刻执行动作action(rule,parameter)得到的终端形状为A(x,y,w,h,a),那么相应的回报值为,
R t = Σ i = x x + w Σ j = y y + h p ( a | x , y ) - - - ( 9 )
其中p(a|x,y)表示建筑立面(x,y)处是a类别的概率;
设MDP决策过程的序列为T,那么长期的回报为:
R = Σ t = 0 T R t - - - ( 10 )
由于MDP决策完毕后,把建筑立面剖分完毕,因此有,
R = Σ t = 0 T R t = Σ x , y ∈ I p ( x , y , s ( x , y ) ) - - - ( 11 )
MDP的最优解即是获取的最优形状语义;
采用增强学习算法求解以上叙述的MDP问题,增强学习采用的是Q-Learning算法;
(2)建筑立面深度信息的恢复
强化学习得到的最佳语义可以表示为剖分树的形式,其中剖分树的叶子节点是组成立面的所有建筑结构(终端形状),记为Leafi(c,x,y,w,h),c表示叶子节点i所属的建筑类别,(x,y,w,h)定义了建筑结构的外包矩形R,通过这些叶子节点,计算各类建筑结构在建筑立面上的分布情况,并构造出建筑该建筑立面的二维平面,还需要得到各种建筑结构的深度以完成最后的三维建模,为此,查询点云中R内的所有点,利用随机抽样一致模型得到这些点所的平面,设该平面为:
aix+biy+ciz+di=0 (12)
在上述坐标系转换中,已经求得建筑主平面所在的方程:
Ax+By+Cx+D=0 (13)
由于建筑结构的平面与主平面平行,则建筑类别c离主平面的深度d为:
d = | d i - D A 2 + B 2 + C 2 | - - - ( 14 )
如此便恢复了建筑结构c的深度信息。
CN201410286813.1A 2014-06-25 2014-06-25 基于形状语义的建筑立面激光雷达点云解译与重建的方法 Expired - Fee Related CN104036550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410286813.1A CN104036550B (zh) 2014-06-25 2014-06-25 基于形状语义的建筑立面激光雷达点云解译与重建的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410286813.1A CN104036550B (zh) 2014-06-25 2014-06-25 基于形状语义的建筑立面激光雷达点云解译与重建的方法

Publications (2)

Publication Number Publication Date
CN104036550A true CN104036550A (zh) 2014-09-10
CN104036550B CN104036550B (zh) 2017-02-15

Family

ID=51467308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410286813.1A Expired - Fee Related CN104036550B (zh) 2014-06-25 2014-06-25 基于形状语义的建筑立面激光雷达点云解译与重建的方法

Country Status (1)

Country Link
CN (1) CN104036550B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108307050A (zh) * 2018-01-18 2018-07-20 大连理工大学 一种基于智能手机传感器的建筑工人动作识别集成方法
CN108710367A (zh) * 2018-05-23 2018-10-26 广州视源电子科技股份有限公司 激光数据识别方法、装置、机器人及存储介质
CN109493344A (zh) * 2018-09-18 2019-03-19 北京大学 一种大规模城市三维场景的语义分割方法
CN109885783A (zh) * 2019-01-17 2019-06-14 广州城投发展研究院有限公司 一种三维建筑模型的加载方法及其装置
CN111815776A (zh) * 2020-02-04 2020-10-23 山东水利技师学院 综合机载和车载三维激光点云及街景影像的三维建筑物精细几何重建方法
WO2021116875A1 (en) * 2019-12-10 2021-06-17 International Business Machines Corporation Formally safe symbolic reinforcement learning on visual inputs
CN114092775A (zh) * 2021-11-23 2022-02-25 中国人民解放军战略支援部队航天工程大学士官学校 监督型建筑物窗户提取方法、系统及设备
CN114792372A (zh) * 2022-06-22 2022-07-26 广东工业大学 一种基于多头两级注意力的三维点云语义分割方法及系统
CN116541943A (zh) * 2023-07-06 2023-08-04 清华大学 智能交互式建筑结构设计方法、装置、平台及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186538A (zh) * 2011-12-27 2013-07-03 阿里巴巴集团控股有限公司 一种图像分类方法和装置、图像检索方法和装置
CN102682475B (zh) * 2012-05-11 2016-02-17 北京师范大学 一种基于地面激光雷达点云数据自适应构建三维树木骨架的方法
CN102982072B (zh) * 2012-10-29 2016-05-04 北京工商大学 一种可视化概念检测器及构造语义场的方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108307050A (zh) * 2018-01-18 2018-07-20 大连理工大学 一种基于智能手机传感器的建筑工人动作识别集成方法
CN108710367B (zh) * 2018-05-23 2022-02-11 广州视源电子科技股份有限公司 激光数据识别方法、装置、机器人及存储介质
CN108710367A (zh) * 2018-05-23 2018-10-26 广州视源电子科技股份有限公司 激光数据识别方法、装置、机器人及存储介质
CN109493344A (zh) * 2018-09-18 2019-03-19 北京大学 一种大规模城市三维场景的语义分割方法
CN109885783A (zh) * 2019-01-17 2019-06-14 广州城投发展研究院有限公司 一种三维建筑模型的加载方法及其装置
WO2021116875A1 (en) * 2019-12-10 2021-06-17 International Business Machines Corporation Formally safe symbolic reinforcement learning on visual inputs
GB2606917A (en) * 2019-12-10 2022-11-23 Ibm Formally safe symbolic reinforcement learning on visual inputs
US11513520B2 (en) 2019-12-10 2022-11-29 International Business Machines Corporation Formally safe symbolic reinforcement learning on visual inputs
CN111815776A (zh) * 2020-02-04 2020-10-23 山东水利技师学院 综合机载和车载三维激光点云及街景影像的三维建筑物精细几何重建方法
CN114092775A (zh) * 2021-11-23 2022-02-25 中国人民解放军战略支援部队航天工程大学士官学校 监督型建筑物窗户提取方法、系统及设备
CN114092775B (zh) * 2021-11-23 2024-08-20 中国人民解放军战略支援部队航天工程大学士官学校 监督型建筑物窗户提取方法、系统及设备
CN114792372A (zh) * 2022-06-22 2022-07-26 广东工业大学 一种基于多头两级注意力的三维点云语义分割方法及系统
CN116541943A (zh) * 2023-07-06 2023-08-04 清华大学 智能交互式建筑结构设计方法、装置、平台及电子设备

Also Published As

Publication number Publication date
CN104036550B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN104036550B (zh) 基于形状语义的建筑立面激光雷达点云解译与重建的方法
Tao et al. An object detection system based on YOLO in traffic scene
CN109145939B (zh) 一种小目标敏感的双通道卷积神经网络语义分割方法
CN103413133B (zh) 无序激光点云数据中自动提取电力线方法
CN107368845A (zh) 一种基于优化候选区域的Faster R‑CNN目标检测方法
CN109034210A (zh) 基于超特征融合与多尺度金字塔网络的目标检测方法
CN106778835A (zh) 融合场景信息和深度特征的遥感图像机场目标识别方法
CN102279929B (zh) 一种基于对象语义树模型的遥感人造地物目标识别方法
CN109741268B (zh) 一种针对壁画的破损图像补全方法
CN106203283A (zh) 基于三维卷积深度神经网络和深度视频的动作识别方法
CN104166163B (zh) 基于三维大数据量地震数据体的断层曲面自动提取方法
CN105741355A (zh) 一种三角网格模型的块分割方法
CN104392486A (zh) 一种点云场景重建方法
CN102509327B (zh) 一种图像空洞填补的多尺度全局采样方法
CN103198330B (zh) 基于深度视频流的实时人脸姿态估计方法
CN106803253A (zh) 岩石三维图像裂缝提取方法
CN108304357A (zh) 一种基于字体流形的中文字库自动生成方法
CN105893968A (zh) 基于深度学习的文本无关的端到端的笔迹识别方法
CN103473572B (zh) 一种手写汉字美观度的评价方法
CN107146237A (zh) 一种基于在线状态学习与估计的目标跟踪方法
CN106599515A (zh) 基于stl网格特征识别的汽车覆盖件板料冲压工艺优选方法
CN104537353A (zh) 基于三维点云的三维人脸年龄分类装置及方法
CN105138983A (zh) 基于加权部件模型和选择性搜索分割的行人检测方法
CN104504381A (zh) 非刚体目标检测方法及其系统
CN105023029B (zh) 一种联机手写藏文音节识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

Termination date: 20170625