CN102567523A - 一种集聚分布型地理要素的自适应空间抽样方案设计方法 - Google Patents

一种集聚分布型地理要素的自适应空间抽样方案设计方法 Download PDF

Info

Publication number
CN102567523A
CN102567523A CN2011104496159A CN201110449615A CN102567523A CN 102567523 A CN102567523 A CN 102567523A CN 2011104496159 A CN2011104496159 A CN 2011104496159A CN 201110449615 A CN201110449615 A CN 201110449615A CN 102567523 A CN102567523 A CN 102567523A
Authority
CN
China
Prior art keywords
sampling
particulate
sampling point
gathering
geographic element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104496159A
Other languages
English (en)
Other versions
CN102567523B (zh
Inventor
刘耀林
刘殿锋
何建华
焦利民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201110449615.9A priority Critical patent/CN102567523B/zh
Publication of CN102567523A publication Critical patent/CN102567523A/zh
Application granted granted Critical
Publication of CN102567523B publication Critical patent/CN102567523B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种集聚分布型地理要素的自适应空间抽样方案设计方法。1,选取地理要素作为抽样指标,选取抽样指标的预采样样点数据,确定抽样单元和抽样框;2,分析1中的预采样样点数据,判断抽样指标是否具有空间集聚性分布特征;3,输入微粒群聚类算法参数和类别数,利用微粒群聚类算法对预采样样点数据进行聚类分析,得到聚类中心作为抽样指标的初始抽样样点;4,输入二进制微粒群优化算法参数,利用二进制微粒群优化算法对3生成的初始抽样样点进行样点加密,得到集聚型地理要素的抽样方案。本发明操作简单、智能化程度高,适用于具有集聚分布特征的地理要素指标的空间抽样,可有效保持样点的集聚特征,提高抽样样点的代表性和抽样精度。

Description

一种集聚分布型地理要素的自适应空间抽样方案设计方法
技术领域
本发明涉及一种自适应空间抽样方案设计方法,尤其是涉及一种集聚分布型地理要素的自适应空间抽样方案设计方法。
背景技术
地理要素包括自然地理要素和人文地理要素,在空间上主要呈现规则、随机和集群等分布方式。规则和随机分布的地理要素相对较多,如土壤属性、地形和水文等,其空间变异特征和分布规律能够采用已有的基于模型和基于设计的方法进行拟合,因此相关研究与应用较为广泛。而对于部分空间分布呈现集聚性的地理要素,反映其空间变异结构的样点通常趋近于集群分布,且具有明显的分布中心或分布轴线,如稀疏树种、传染病和土壤点源污染等,传统的抽样方法将导致集聚而不存在抽样目标区域内的抽样单元入样概率增加,稀疏而存在抽样目标区域内的抽样单元入样概率减小,从而使得抽样方案不具有代表,无法准确估计抽样精度。传统的集聚性地理要素空间抽样主要应用定性分析法进行样点布设,但是该类方法过于依赖专家的认知水平,缺少对样本精度和代表性的客观评价机制。基于此,发展一种定量化的,能充分估计点群的集聚分布性的抽样方法成为学者们的共识。
与传统抽样方法相比,适应性抽样方法(Adaptive cluster sampling,ACS)具有原理简单、方便操作的特性,主要适用于抽样目标稀少、具有聚类特征的总体,样点与其周围邻近的抽样单元具有较高的同一性可能,典型的应用为稀有动物或者生态资源的空间抽样调查或者传染病空间分布趋势估计等。但是,适应性抽样的抽样效率受到样本空间单元大小、初始样本大小和选取周围样本方法等主观因素的影响较大,并且对实际抽样中样本的分布特征要求较为严格,样点选择规则过于简化,实际抽样中在样本的分布特征变化较大的复杂地理区域应用效果一般。
微粒群算法通过模拟鸟类的捕食行为求解复杂问题,具有框架开放、搜索速度快、结构简单、易于实现的特点,自提出后被广泛应用于模型参数优化、分类、资源优化配置、电力系统优化、图像处理和机器人智能领域等。其开放的算法框架包括目标函数、约束体系和搜索策略,能够通过设定不同的目标函数和约束体系满足空间聚类和空间优化等不同需求。因此,采用微粒群算法对适应性抽样方法进行改进,优化其初始样点选择和加密样点选择策略,有利于提高集聚型指标的抽样样点代表性和抽样精度,从而推动适应性聚类算法在集聚性地理要素空间抽样领域的应用。
发明内容
本发明主要是解决现有技术所存在的技术问题;提供了一种操作简单、智能化程度高、具有自组织、自学习的能力,适用于具有集聚分布特征的地理要素指标的空间抽样,可有效保持样点的集聚特征,提高抽样样点的代表性和抽样精度的一种集聚分布型地理要素的自适应空间抽样方案设计方法。
本发明的上述技术问题主要通过下述技术方案得以解决:
一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,包括以下步骤:
步骤1,选取地理要素作为抽样指标,选取抽样指标的预采样样点数据,确定抽样单元和抽样框;
步骤2,采用Voronoi分析方法分析步骤1中的预采样样点数据,判断抽样指标是否具有空间集聚性分布特征;若有,执行步骤3,否则,中断所有步骤;
步骤3,输入微粒群聚类算法参数和类别数,利用微粒群聚类算法对完成步骤2的预采样样点数据进行聚类分析,得到聚类中心作为抽样指标的初始抽样样点;
步骤4,输入二进制微粒群优化算法参数,利用二进制微粒群优化算法对步骤3生成的初始抽样样点进行样点加密,得到集聚型地理要素的抽样方案。
本发明的特点是通过于适应性抽样方法进行集聚型地理要素的抽样方案设计,通过微粒群算法改进了传统适应性聚类抽样方法的初始样点和加密样点选择策略,保证了指标的空间集聚性分布特征,提高了抽样样点的代表性;以极大类间距准则和最小克里金方差为优化目标,采用抽样可达性、分布中心/分布轴线吸引性和抽样费用作为样点布设的条件约束,提高了抽样样点布设过程的自组织性和合理性;采用微粒群聚类算法和二进制微粒群优化算法进行问题求解,提高了方法效率,减少了抽样方案设计的时间。本发明方法继承了适应性聚类抽样方法和微粒群算法的特性,具有操作简单、自组织、自学习的能力,智能化程度高,适用于具有集聚分布特征的地理要素指标的空间抽样,可有效保持样点的集聚特征,提高抽样样点的代表性和抽样精度。
在上述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,所述的步骤3具体操作方法如下:
步骤3.1,构建微粒群聚类算法中微粒与聚类中心的映射关系;
步骤3.2,将预采样样点随机划分为步骤3设定的类别数,采用平均欧式距离原则计算各子类的聚类中心,依据步骤3.1中的映射关系,利用聚类中心初始化微粒群中的所有微粒Sp,其中p=1,2,..,P为微粒编号;
步骤3.3,计算步骤3.2中初始化后的微粒群中每个微粒的适应度,确定t+1时刻微粒的个体历史最优位置Sbp(t+1)和微粒群的全局历史最优位置Sg(t+1),基于以下公式:
Sb p ( t + 1 ) = Sb p ( t ) if [ f ( Sb p ( t + 1 ) ) ≥ f ( Sb p ( t ) ) ] S p ( t + 1 ) otherwise , 其中f()为适应度函数,式一;
Sg(t)=Sbk(t)if[f(Sbk(t))=min1≤i≤Pf(Sbi(t))]式二;
步骤3.4,利用个体历史最优位置和全局历史最优位置计算t+1时刻微粒的速度,并利用该速度更新微粒位置:
V p ( t + 1 ) = χ ( w V p ( t ) + c 1 r 1 ( Sb p ( t ) - S p ( t ) ) + c 2 r 3 ( Sg ( t ) - S p ( t ) ) ) S p ( t + 1 ) = S p ( t ) + V p ( t + 1 ) 式三;
步骤3.5,判断是否满足终止条件,如果不满足则返回步骤3.3开始下一次迭代,满足则聚类分析完成,输出全局最优微粒中的聚类中心作为抽样指标的初始抽样样点。
在上述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,所述步骤4的具体操作方法如下:
步骤4.1,构建二进制微粒群优化算法中微粒与抽样单元的映射关系;
步骤4.2,依据步骤4.1构建的映射关系,利用步骤3.5生成的初始抽样样点初始化二进制微粒群;
步骤4.3,计算每个微粒的适应度,确定微粒的个体历史最优位置和微粒群的全局历史最优位置;
步骤4.4,根据个体历史最优位置和全局历史最优位置更新二进制微粒位置,更新过程受限于分布轴线/分布中心吸引作用、样点可标识性和抽样费用;
步骤4.5,判断是否满足终止条件,如果不满足则返回步骤4.3开始下一次迭代,满足则样点加密完成,输出全局最优微粒作为集聚性地理要素指标的抽样方案。
在上述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,所述的步骤2中,进行Voronoi分析的步骤为首先生成预采样样点的Voronoi多边形,然后计算Voronoi多边形面积的标准差与平均值的比值,如果比值大于64%,则抽样指标具有空间集聚特性。
在上述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,所述的步骤3中,微粒群聚类算法的参数包括种群规模、最大迭代次数、惯性权重、随机参数1、随机参数2、个体信息加速常数、社会信息加速常数和收敛因子,采用最大迭代次数作为算法终止条件。
在上述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,所述的步骤3.1构建的微粒与聚类中心的映射关系中,一个微粒表示为一种抽样指标预采样样点的聚类方案,微粒中的每一维代表一个聚类中心。
在上述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,所述的步骤3.3中,采用微粒中包含的聚类中心对预采样数据进行划分,得到的子类之间的离散度用于衡量微粒的适应度:
Σ k = 1 K Σ s i ∈ C k d ( s i , c k ) 式四;
其中ck为第k个子类Ck的聚类中心,(c1,c2,...,cK)表示一个微粒,d(si,ck)为样点si到相应聚类中心的距离。
在上述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,所述的步骤4.1构建的映射关系中,一个二进制微粒表示为一种抽样方案,微粒中的每一个维度代表一个抽样单元,维度值为1表示相应抽样单元被选为样点,维度值为0表示相应抽样单元未被选为样点;
所述的步骤4.2中,初始微粒中与步骤3生成的初始抽样样点对应的维度其值为1;
所述的步骤4.3中,微粒的适应度采用平均克里金方差衡量。
在上述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,所述的步骤4.4中微粒t+1位置更新即确定微粒p中维度i的取值xp,i(t+1):
V p , i ( t + 1 ) = χ ( wV p , i ( t ) + c 1 r 1 ( Sb p , i ( t ) - S p , i ( t ) ) + c 2 r 2 ( Sg i ( t ) - S p , i ( t ) ) ) x p , i ( t + 1 ) = 0 if [ r ≥ sig ( V p , i ( t + 1 ) ) ] 1 otherwise 式五;
其中,分布中心周围的抽样单元被选为样点的概率以该中心为圆心向外呈同心圆方式不断衰减,分布轴线周围的抽样单元被选为样点的概率以轴线为中心向外成哑铃型衰减,当到达该分布轴线或分布中心所在的聚类区域边界时,概率衰减为0;
所述抽样费用限制特征在于样点数量由总抽样费用、基础抽样费用和单个样点调查费用决定:
N1≤(FT-FB)/FS    式六;
式中,FT为总采样费用,FB为基础采样费用,N1为样点数量,FS为单个样点采样费用。
因此,本发明具有如下优点:操作简单、智能化程度高,具有自组织、自学习的能力,适用于具有集聚分布特征的地理要素指标的空间抽样方案设计,可有效保持样点的集聚特征,提高抽样样点的代表性和抽样精度。
附图说明
图1是本发明采用的微粒群算法进化原理图。
图2是本发明采用的标准微粒群算法流程图。
图3是简单适应性聚类抽样方法的示意图。
图4是本发明的流程示意图。
图5是本发明中微粒与聚类中心的映射关系图。
图6是本发明中聚类微粒群初始化示意图。
图7是本发明中微粒与抽样单元的映射关系。
图8是分布轴线、分布中心周围抽样单元被选为样点概率衰减示意图。
图9是抽样费用的组成关系图。
图10是本发明实施例的试验区位置与商业用地地价预采样样点图。
图11是本发明实施例的初始样点布局图。
图12是本发明实施例的城镇商业用地地价指标的抽样方案图。
图13是实施例的分布轴线与分布中心的影响作用对比图。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。
实施例:
本发明的理论基础如下:
为了准确揭示集聚型地理要素的空间变化规律,需要分别从全域和局部两个层面对其加以描述。从全域角度看,描述抽样空间中的集聚区域可以抽象为一个点(通常指该集聚区域的质心),则依据基于设计的方法(Design based inference),此时形成的质心点集合可视为服从随机分布。即设抽样区域D分为K个子类Ck,每个Ck由Ki个抽样单元组成,ck∈Ck为Ck的质心或中心,则根据基于设计的推断思想可知,质心ck的取值Z(ck)为随机变量。在抽样过程中,ck的取值将保持不变,而其是否被选为样点则是随机的,即每个样点均具有一定的入样概率(Brus and de Gruijter,1997)。由于入样概率通常由专家指定(Human induced),因此要求抽样总体必须为有限总体。
从局部角度看,每个集聚区域内部样本量相对较小,样点主要呈随机性和结构性分布,因此可用基于模型的方法进行空间抽样,则局部集聚空间具体描述为,设抽样区域D中存在集聚分区Ck,xkj∈Dk表示样点的位置,根据基于模型的推断(Model based inference)原理,Ck中样点xij的观测值Z(xkj)满足地统计学相关假设,即可以通过构建地统计学变异函数模型来描述Ck的真实总体,而抽样优化的目的是通过调整样点位置使样本的拟合总体能尽可能逼近该真实总体。
适应性聚类抽样(Adaptive Cluster Sampling,ACS)方法的核心思想是根据概率选择一定数量的样点作为初始样本,如果初始样本中第i个样点相邻抽样单元的数量超过预先设定值或者样点的观测值满足一定条件,则以样本i为中心对其周围的格网采样,以此类推直到遍历所有抽样单元(附图3)。算法具体步骤如下:
①、确定抽样区域,将之划分为适当大小的格网单元;
②、根据概率随机选择一定格网单元作为初始样本S;
③、设定采样规则,通常设定样点周围可存在的样点数量n或者样点的观测值阈值范围;
④、抽取取初始样本S中的一个样点Si
⑤、判断样点Si的观测值是否在设定的阈值范围以内,则在该样点周围随机抽取数量不超过n的抽样单元作为样点,进入步骤⑥,否则返回步骤④;
⑥、判断是否遍历了所有初始样本中的样点,如果遍历完毕则结束算法;否则返回步骤④;
设yi为样点Si的观测值,错误!未找到引用源。为标准ACS方法的示意,其中为随机确定的初始样点,○为yi>1和yi>10时确定的新样点:
微粒群优化算法(Particle swarm optimization,PSO)的核心思想来源于对鸟类觅食行为的模仿,其具备群体智能算法通有的邻近性、优质性、种群多样性、稳定性和自适应性。在微粒群求解过程中,问题的搜索空间被映射为鸟类的飞行空间,每只鸟抽象为一个无质量无体积的微粒用以表征问题的一个候选解,问题的最优解则代表了鸟群要寻找的食物源,微粒群中的个体在独自飞行的同时获取其邻域个体的社会共享信息,并依据个体自身的最佳位置和邻域的最佳位置不断地更新飞行方向,直到无限靠近最优解(附图1)。其中,个体和邻域的最佳位置主要采用微粒的适宜度函数进行评价和确定。
设定D为优化问题的解搜索空间,微粒群中第p个微粒在时刻t的位置和速度分别为Sp(t)和Vp(t),应用适宜度评价函数确定的t时刻微粒i所经过的个体最佳位置和全局最佳位置分别为Sbp(t)和Sg(t),则微粒可以依据以下公式更新其速度和位置:
V p ( t + 1 ) = χ ( w V p ( t ) + c 1 r 1 ( Sb p ( t ) - S p ( t ) ) + c 2 r 3 ( Sg ( t ) - S p ( t ) ) ) S p ( t + 1 ) = S p ( t ) + V p ( t + 1 ) 式三;
由位置更新公式可见,微粒的飞行方向主要受自身飞行速度、自身历史最优位置和种群历史最优位置三个因素的影响。与其它进化算法相比,微粒群算法仅通过记忆个体和种群历史最优位置的方式,应用简单的速度-位置公式对个体和种群进行更新操作,从而避免了复杂的个体进化过程(如遗传算法的交叉、变异等),因此具有较高的搜索效率。基本微粒群优化算法的流程如附图2所示。
本发明的具体实施方法如附图4所示:
步骤1,选取地理要素作为抽样指标,选取抽样指标的预采样样点数据,将抽样区域进行网格划分,以每个网格单元作为抽样单元,抽样单元集合为抽样框;地理要素通常包括土壤、水文、植被、道路等,如果对土壤进行抽样,则确定需要抽样的土壤指标,比如土壤水分、土壤PH值等。这种选取完全取决于决策者对什么数据感兴趣,如果想了解土壤空间分布情况,可以选择土壤指标作为抽样指标,如果希望了解道路信息,则选择道路指标作为抽样指标。抽样指标的预采样数据是在确定抽样指标后,通过在抽样区域均匀布点的方式(或随机等方式)确定预采样的样点位置,然后实地获取抽样指标的数据。预采样数据主要用于描述区域内抽样指标的空间变化情况。抽样单元是在实地多大的面积代表一个样点,通常包括网格单元、三角单元、五边形等多种形式,抽样框则是所有抽样单元的集合,抽样单元和抽样框主要用于构建微粒群。
步骤2,采用Voronoi分析方法分析预采样样点数据,生成预采样样点的Voronoi多边形,计算Voronoi多边形面积的标准差与面积的比值,根据比值判断抽样指标是否具有空间集聚性分布特征,如果比值大于64%,则抽样指标属于空间集聚分布;
步骤3,输入微粒群聚类算法参数包括种群规模、最大迭代次数、惯性权重、随机参数1、随机参数2、个体信息加速常数、社会信息加速常数和收敛因子,采用最大迭代次数作为算法终止条件,输入预采样数据划分的类别数,利用微粒群聚类算法对预采样样点数据进行聚类分析,得到聚类中心作为抽样指标的初始抽样样点,具体包括以下5个步骤:
步骤3.1,构建微粒群聚类算法中微粒与聚类中心的映射关系,一个微粒表示为一种抽样指标预采样样点的聚类方案,微粒中的每一维代表一个聚类中心(附图5);
步骤3.2,将预采样样点随机划分为步骤3设定的类别数,采用平均欧式距离原则计算各子类的聚类中心,依据步骤3.1中的映射关系,利用聚类中心初始化微粒群(附图6);
步骤3.3,采用微粒中包含的聚类中心对预采样数据进行划分,得到的子类之间的离散度用于衡量微粒的适应度:
Σ k = 1 K Σ s i ∈ C k d ( s i , c k ) 式四;
其中ck为第k个子类Ck的聚类中心,(c1,c2,...,cK)表示一个微粒,d(si,ck)为样点si到相应聚类中心的距离。
采用下列公式确定微粒的个体历史最优位置和微粒群的全局历史最优位置:
Sb p ( t + 1 ) = Sb p ( t ) if [ f ( Sb p ( t + 1 ) ) ≥ f ( Sb p ( t ) ) ] S p ( t + 1 ) otherwise , 其中f()为适应度函数,式一;
Sg(t)=Sbk(t) if[f(Sbk(t))=min1≤i≤Pf(Sbi(t))]      式二;
步骤3.4,利用个体历史最优位置和全局历史最优位置更新微粒群:
V p ( t + 1 ) = χ ( w V p ( t ) + c 1 r 1 ( Sb p ( t ) - S p ( t ) ) + c 2 r 3 ( Sg ( t ) - S p ( t ) ) ) S p ( t + 1 ) = S p ( t ) + V p ( t + 1 ) 式三;
步骤3.5,判断是否满足终止条件,如果满足则返回步骤3.3开始下一次迭代,满足则聚类分析完成,输出全局最优微粒中的聚类中心作为集聚型地理要素抽样指标的初始抽样样点;
步骤4,输入二进制微粒群优化算法参数包括种群规模、最大迭代次数、惯性权重、随机参数1、随机参数2、个体信息加速常数、社会信息加速常数和收敛因子,采用最大迭代次数作为算法终止条件,利用二进制微粒群优化算法对初始抽样样点进行样点加密,得到集聚型地理要素抽样指标的抽样方案,具体包括以下5个步骤:
步骤4.1,构建二进制微粒群优化算法中微粒与抽样单元的映射关系,一个二进制微粒表示为一种抽样方案,微粒中的每一个维度代表一个抽样单元,维度值为1表示相应抽样单元被选为样点,维度值为0表示相应抽样单元未被选为样点(附图7);
步骤4.2,依据步骤4.1构建的映射关系初始化二进制微粒群,微粒代表抽样单元集合,微粒维度表示抽样单元,初始微粒中与步骤3生成的初始抽样样点对应的维度其值为1;
步骤4.3,采用样点的平均克里金方差f1衡量微粒的适应度:
f 1 = 1 N Σ i = 1 N ( cov ( 0 ) - W T cov ( x i x ij ) )
式中,cov(0)为抽样指标预采样数据的方差,WT为样点xi邻近区域内样点xij的权重矩阵,cov(xixij)为样点xi邻近区域内样点xij的协方差。根据普通克里金法,协同差为样点xi到邻近区域内样点xij距离的函数,因此f1的取值仅与样点的空间分布有关,与样点的具体取值无关。
采用式3确定微粒的个体历史最优位置和微粒群的全局历史最优位置;
步骤4.4,根据个体历史最优位置和全局历史最优位置更新二进制微粒群:
V p , i ( t + 1 ) = χ ( wV p , i ( t ) + c 1 r 1 ( Sb p , i ( t ) - S p , i ( t ) ) + c 2 r 2 ( Sg i ( t ) - S p , i ( t ) ) ) x p , i ( t + 1 ) = 0 if [ r ≥ sig ( V p , i ( t + 1 ) ) ] 1 otherwise 式五;
更新过程受限于分布轴线/分布中心吸引作用、样点可标识性和抽样费用。其中,位置更新在于确定微粒中每个维度的取值,分布轴线与分布中心的吸引作用是指距离分布轴线、分布中心距离近的样点包含着抽样指标的绝大部分信息,分布中心周围的抽样单元被选为样点的概率以该中心为圆心向外呈同心圆方式不断衰减,分布轴线周围的抽样单元被选为样点的概率以轴线为中心向外成哑铃型衰减,当到达该分布轴线或分布中心所在的聚类区域边界时,概率衰减为0(附图8);样点可标识性具体包括样点的稳定性和可达性,稳定性是指抽样样点在较长时间内不会消失,否则对于揭示集聚型地理要素空间变化特征意义不大,可达性是指样点必须是可调查,抽样区域是允许进入的;抽样费用是指样点数量由总抽样费用、基础抽样费用和单个样点调查费用决定(附图9):
N1≤(FT-FB)/FS                式六;
式中,FT为总采样费用,FB为基础采样费用,N1为样点数量,FS为单个样点采样费用。
步骤4.5,判断是否满足终止条件,如果不满足则返回步骤4.3开始下一次迭代,满足则样点加密完成,输出全局最优微粒作为集聚型地理要素抽样指标的空间抽样方案。
下面是采用上述的方法的具体实施例:
选择武汉市汉口城区作为实验区,依据本发明编写计算机程序,对实验区商业用地地价样点进行抽样。
(1)数据与预处理:实验数据包括汉口城区路网数据、河流水系数据、2001年宗地数据和商业用地定价与基准地价评价数据,以及2001年商业用地地价调查样点(附图10)。其中路网数据、河流水系数据、宗地数据和商业用地定级估价数据主要作为布设样点的约束条件,商业用地地价调查样点作为实验区的先验知识用于对地价总体均值、方差等参数及其空间变异结构的估计。
商业用地地价调查数据共计包括6897个样点,其中商业铺面出租样点6630个,商业用地出让样点270个。对样本数据进行分布检验并剔除其中异常点最后得到5385个有效样点,具体统计信息如表1所示:
表1汉口商业用地地价调查样点数据统计特征
Figure BDA0000126495030000131
(2)样点集聚性探测:应用Voronoi图分析上述5385个样点的空间分布特征,计算得到其Cv=549.71%>64%,根据Duyckaerts and Godefroy(2000)的结论可知研究区样点服从集群分布,符合模型验证数据的要求。
(3)设置聚类类别为10,微粒群聚类算法参数如表2所示:
表2微粒群算法参数设定
  P   Tmax   c1/c2   r1/r2   w   χ
  20   500   2.05   [0,1]   [0,1.2]   0.79
(4)以实验区商业用地调查样点地价及其空间位置作为聚类变量,采用微粒群空间聚类法进行空间聚类分析,并将聚类结果中同属一类而空间上不邻接的样点簇作为独立子类处理。处理后选取各个类的聚类中心作为初始抽样样点,生成的初始样点的样本量分别为74(附图11)。应用Voronoi图分析上述初始样点的空间分布特征,得到初始样点的Cv为116.53%,可见本发明能维持预采样数据的集聚特征。
表3生成的初始样点统计信息
Figure BDA0000126495030000141
(5)采用初始抽样方案对二进制微粒群进行初始化,设置微粒群算法的参数,利用二进制微粒群算法进行样点加密(附图12)。本发明形成的样点在长江与汉江交汇的三角地带分布相对密集,并成辐射状向外蔓延,从整体看初始抽样方案已经基本确定了商业用地的空间集聚中心和集聚轴线,随机样点则相对均衡地分布于初始样点周围,进一步提高了抽样方案的信息含量和代表性,对上述优化结果进行统计分析,得到不同抽样样本的优化目标值、均值和方差等统计数据,从表4中可以看出本发明方法获取的抽样样本均值与方差接近预采样数据,保留了预采样数据的大部分信息。
表4本发明生成的抽样样点与预采样样点的对比分析
应用Voronoi图分析样点空间分布特征,计算得到本发明生成的样点的Cv值分别为261.44%,根据(Duyckaerts and Godefroy,2000)的结论可知样点服从集群分布,说明本发明的方法能够准确描述城镇商业用地空间抽样样点的集聚特征。另外,实验分析了汉口城区武汉新世界百货商场、世贸大厦、以及解放大道等商贸中心和轴线周围样点密度(附图13)。结果显示,在考虑分布轴线(中心)的情况下,初始样本周围的随机样点受吸引性的影响呈现向其周围分布轴线(中心)靠近的趋势,而如果不考虑分布轴线/中心的影响,样点分布则相对分散。例如(a)中武汉新世界百货商场、世贸大厦、以及一级道路周围的随机样点明显要较(b)中的密集。应用Voronoi图对样点集聚特性进行分析,得到图(a)和(b)中样点的Cv值分别为261.44%和116.86%,表明(a)中样点更加接近预采样样本的集聚特征。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (9)

1.一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,包括以下步骤:
步骤1,选取地理要素作为抽样指标,选取抽样指标的预采样样点数据,确定抽样单元和抽样框;                 
步骤2,采用Voronoi分析方法分析步骤1中的预采样样点数据,判断抽样指标是否具有空间集聚性分布特征;若有,执行步骤3,否则,中断所有步骤;
步骤3,输入微粒群聚类算法参数和类别数,利用微粒群聚类算法对完成步骤2的预采样样点数据进行聚类分析,得到聚类中心作为抽样指标的初始抽样样点;
步骤4,输入二进制微粒群优化算法参数,利用二进制微粒群优化算法对步骤3生成的初始抽样样点进行样点加密,得到集聚型地理要素的抽样方案。
2.根据权利要求1所述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,所述的步骤3具体操作方法如下:
步骤3.1,构建微粒群聚类算法中微粒与聚类中心的映射关系;
步骤3.2,将预采样样点随机划分为步骤3设定的类别数,采用平均欧式距离原则计算各子类的聚类中心,依据步骤3.1中的映射关系,利用聚类中心初始化微粒群中的所有微粒                                                ,其中为微粒编号;
步骤3.3,计算步骤3.2中初始化后的微粒群中每个微粒的适应度,确定t+1时刻微粒的个体历史最优位置
Figure 2011104496159100001DEST_PATH_IMAGE003
和微粒群的全局历史最优位置,基于以下公式:
Figure 859596DEST_PATH_IMAGE004
式一;       
Figure 2011104496159100001DEST_PATH_IMAGE005
                            式二;
步骤3.4,利用个体历史最优位置和全局历史最优位置计算t+1时刻微粒的速度,并利用该速度更新微粒位置;
Figure 577016DEST_PATH_IMAGE006
            式三;
步骤3.5,判断是否满足终止条件,如果不满足则返回步骤3.3开始下一次迭代,满足则聚类分析完成,输出全局最优微粒中的聚类中心作为抽样指标的初始抽样样点。
3.根据权利要求1所述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,所述步骤4的具体操作方法如下:
步骤4.1,构建二进制微粒群优化算法中微粒与抽样单元的映射关系;
步骤4.2,依据步骤4.1构建的映射关系,利用步骤3.5生成的初始抽样样点初始化二进制微粒群;
步骤4.3,计算每个微粒的适应度,确定微粒的个体历史最优位置和微粒群的全局历史最优位置;
步骤4.4,根据个体历史最优位置和全局历史最优位置更新二进制微粒位置,更新过程受限于分布轴线/分布中心吸引作用、样点可标识性和抽样费用;
步骤4.5,判断是否满足终止条件,如果不满足则返回步骤4.3开始下一次迭代,满足则样点加密完成,输出全局最优微粒作为集聚性地理要素指标的抽样方案。
4.根据权利要求1所述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,所述的步骤2中,进行Voronoi分析的步骤为首先生成预采样样点的Voronoi多边形,然后计算Voronoi多边形面积的标准差与平均值的比值,如果比值大于64%,则抽样指标具有空间集聚特性。
5.根据权利要求1所述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,所述的步骤3中,微粒群聚类算法的参数包括种群规模、最大迭代次数、惯性权重、随机参数1、随机参数2、个体信息加速常数、社会信息加速常数和收敛因子,采用最大迭代次数作为算法终止条件。
6.根据权利要求2所述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,所述的步骤3.1构建的微粒与聚类中心的映射关系中,一个微粒表示为一种抽样指标预采样样点的聚类方案,微粒中的每一维代表一个聚类中心。
7.根据权利要求2所述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,所述的步骤3.3中,采用微粒中包含的聚类中心对预采样数据进行划分,得到的子类之间的离散度用于衡量微粒的适应度:
                                            式四;
其中为第k个子类
Figure 2011104496159100001DEST_PATH_IMAGE009
的聚类中心,
Figure 973548DEST_PATH_IMAGE010
表示一个微粒,
Figure 2011104496159100001DEST_PATH_IMAGE011
为样点
Figure 2011104496159100001DEST_PATH_IMAGE013
到相应聚类中心的距离,。
8.根据权利要求3所述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,
所述的步骤4.1构建的映射关系中,一个二进制微粒表示为一种抽样方案,微粒中的每一个维度代表一个抽样单元,维度值为1表示相应抽样单元被选为样点,维度值为0表示相应抽样单元未被选为样点;
所述的步骤4.2中,初始微粒中与步骤3生成的初始抽样样点对应的维度其值为1;
所述的步骤4.3中,微粒的适应度采用平均克里金方差衡量。
9.根据权利要求8所述的一种集聚分布型地理要素的自适应空间抽样方案设计方法,其特征在于,所述的步骤4.4中微粒t+1位置更新即确定微粒
Figure 733694DEST_PATH_IMAGE014
中维度
Figure 187678DEST_PATH_IMAGE016
的取值
Figure 2011104496159100001DEST_PATH_IMAGE017
Figure 324261DEST_PATH_IMAGE018
     式五;
其中,分布中心周围的抽样单元被选为样点的概率以该中心为圆心向外呈同心圆方式不断衰减,分布轴线周围的抽样单元被选为样点的概率以轴线为中心向外成哑铃型衰减,当到达该分布轴线或分布中心所在的聚类区域边界时,概率衰减为0;
所述抽样费用限制特征在于样点数量由总抽样费用、基础抽样费用和单个样点调查费用决定:
                      式六;
式中,
Figure 180091DEST_PATH_IMAGE020
为总采样费用,
Figure 2011104496159100001DEST_PATH_IMAGE021
为基础采样费用,
Figure 173454DEST_PATH_IMAGE022
为样点数量,为单个样点采样费用。
CN201110449615.9A 2011-12-29 2011-12-29 一种集聚分布型地理要素的自适应空间抽样方案设计方法 Active CN102567523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110449615.9A CN102567523B (zh) 2011-12-29 2011-12-29 一种集聚分布型地理要素的自适应空间抽样方案设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110449615.9A CN102567523B (zh) 2011-12-29 2011-12-29 一种集聚分布型地理要素的自适应空间抽样方案设计方法

Publications (2)

Publication Number Publication Date
CN102567523A true CN102567523A (zh) 2012-07-11
CN102567523B CN102567523B (zh) 2014-02-26

Family

ID=46412922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110449615.9A Active CN102567523B (zh) 2011-12-29 2011-12-29 一种集聚分布型地理要素的自适应空间抽样方案设计方法

Country Status (1)

Country Link
CN (1) CN102567523B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809336A (zh) * 2015-04-15 2015-07-29 同济大学 一种考虑空间相关性的区域要素抽样方法
CN106815551A (zh) * 2016-12-08 2017-06-09 新疆农业大学 一种森林资源管理的变异函数参数拟合的优化方法
CN107194592A (zh) * 2017-05-26 2017-09-22 北京师范大学 一种土地监管抽样方法及系统
CN110426230A (zh) * 2019-08-08 2019-11-08 中山市疾病预防控制中心 一种食品监测采样点空间分布的评估方法
CN113515758A (zh) * 2021-05-14 2021-10-19 北京农业信息技术研究中心 一种稀疏区域的样本点加密方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293099A (ja) * 1999-04-09 2000-10-20 Toyota Motor Corp 地図データベース
CN101877034A (zh) * 2009-11-19 2010-11-03 武汉大学 一种土地利用自动分区方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293099A (ja) * 1999-04-09 2000-10-20 Toyota Motor Corp 地図データベース
CN101877034A (zh) * 2009-11-19 2010-11-03 武汉大学 一种土地利用自动分区方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
焦利民,刘耀林,任周桥: "《基于自组织神经网络的空间点群聚类及其应用分析》", 《武汉大学学报·信息科学版》, vol. 33, no. 2, 29 February 2008 (2008-02-29), pages 168 - 171 *
焦利民,洪晓峰,刘耀林: "《空间和属性双重约束下的自组织空间聚类研究》", 《武汉大学学报·信息科学版》, vol. 36, no. 7, 31 July 2011 (2011-07-31), pages 862 - 866 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809336A (zh) * 2015-04-15 2015-07-29 同济大学 一种考虑空间相关性的区域要素抽样方法
CN106815551A (zh) * 2016-12-08 2017-06-09 新疆农业大学 一种森林资源管理的变异函数参数拟合的优化方法
CN107194592A (zh) * 2017-05-26 2017-09-22 北京师范大学 一种土地监管抽样方法及系统
CN110426230A (zh) * 2019-08-08 2019-11-08 中山市疾病预防控制中心 一种食品监测采样点空间分布的评估方法
CN113515758A (zh) * 2021-05-14 2021-10-19 北京农业信息技术研究中心 一种稀疏区域的样本点加密方法及系统
CN113515758B (zh) * 2021-05-14 2022-03-01 北京市农林科学院信息技术研究中心 一种稀疏区域的样本点加密方法及系统

Also Published As

Publication number Publication date
CN102567523B (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
White et al. Modeling cities and regions as complex systems: From theory to planning applications
Van der Zanden et al. Representing composition, spatial structure and management intensity of European agricultural landscapes: a new typology
CN108364467B (zh) 一种基于改进型决策树算法的路况信息预测方法
Manley et al. A heuristic model of bounded route choice in urban areas
Li et al. Calibrating cellular automata based on landscape metrics by using genetic algorithms
Kamath et al. Crop yield forecasting using data mining
Pontius Jr et al. Accuracy assessment for a simulation model of Amazonian deforestation
Jun et al. Selection of target LEED credits based on project information and climatic factors using data mining techniques
CN102567523B (zh) 一种集聚分布型地理要素的自适应空间抽样方案设计方法
CN111814079B (zh) 结合聚类与cmab的群智感知车联网用户筛选方法
CN106781489A (zh) 一种基于递归神经网络的路网状态预测方法
Saxena et al. Capturing heterogeneous urban growth using SLEUTH model
CN110288202A (zh) 一种城市公园绿地设施状态评估优化方法
CN112365708B (zh) 基于多图卷积网络的景区交通量预测模型建立和预测方法
CN112785450A (zh) 一种土壤环境质量分区方法及系统
Zhong et al. Distinguishing the land use effects of road pricing based on the urban form attributes
CN104361255B (zh) 一种改进元胞自动机城市扩张模拟方法
CN112419711B (zh) 基于改进gmdh算法的封闭式停车场停车需求预测方法
Mustafa et al. Measuring the effect of stochastic perturbation component in cellular automata urban growth model
Xu et al. Land-use change modeling with cellular automata using land natural evolution unit
CN110222133A (zh) 一种考虑景观指数的多类土地利用模拟预测方法及装置
Yang et al. Simulating land use change by integrating landscape metrics into ANN-CA in a new way
CN116433017A (zh) 土壤重金属污染评估方法、装置、设备及存储介质
Reyes et al. Dynamic grouping of vehicle trajectories
Shepelev et al. Forecasting the amount of traffic-related pollutant emissions by neural networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant