CN113515758B - 一种稀疏区域的样本点加密方法及系统 - Google Patents

一种稀疏区域的样本点加密方法及系统 Download PDF

Info

Publication number
CN113515758B
CN113515758B CN202110529271.6A CN202110529271A CN113515758B CN 113515758 B CN113515758 B CN 113515758B CN 202110529271 A CN202110529271 A CN 202110529271A CN 113515758 B CN113515758 B CN 113515758B
Authority
CN
China
Prior art keywords
sample point
sample
sparse
area
sample points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110529271.6A
Other languages
English (en)
Other versions
CN113515758A (zh
Inventor
董士伟
潘瑜春
唐柜彪
吴亚楠
郜允兵
顾晓鹤
金小花
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Center of Information Technology of Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
Research Center of Information Technology of Beijing Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Center of Information Technology of Beijing Academy of Agriculture and Forestry Sciences filed Critical Research Center of Information Technology of Beijing Academy of Agriculture and Forestry Sciences
Priority to CN202110529271.6A priority Critical patent/CN113515758B/zh
Publication of CN113515758A publication Critical patent/CN113515758A/zh
Application granted granted Critical
Publication of CN113515758B publication Critical patent/CN113515758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Storage Device Security (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种稀疏区域的样本点加密方法及系统,包括:确定目标稀疏样本点及其加密采样区域;对加密采样区域空间离散化,并确定待选样本点子集合;将每个待选样本点子集合中的待选样本点与原样本点构成一个样本点空间布局,并从中选择最优样本点空间布局,以将最优样本点空间布局中的待选样本点作为加密样本点,对稀疏区域进行样本点加密处理。迭代执行上述加密处理步骤,直至不存在稀疏样本点。本发明通过迭代的方式,依次确定当前样本点空间布局中的目标稀疏样本点,并确定其加密采样区域相关的加密样本点,能够确保每次迭代加密样本点的全局最优性,有效地提高样本点数据的代表性和无偏性,保证了样本点数据分析评价的准确性和可靠性。

Description

一种稀疏区域的样本点加密方法及系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种稀疏区域的样本点加密方法及系统。
背景技术
土壤采样是调查和监测区域土壤污染状况的重要手段,样本点的空间分布是样点数据质量评价和挖掘分析的关键因素。样本点的空间分布一般呈现聚集分布、均匀分布和稀疏分布三种模式。聚集分布是指样本点空间分布成聚集状的空间分布格局;均匀分布是指样本点空间分布成均匀状的空间分布格局;稀疏分布是指样本点空间分布成稀疏状的空间分布格局。样本点的稀疏分布严重影响了样本点数据质量,无法保证样本点数据的代表性和无偏性,降低了样本点数据分析与评价结果的准确性和可靠性。
在稀疏区域中,科学合理的加密布设样本点可以提高样本点数据的代表性和无偏性。目前现有技术中,加密布设样本点的方法主要包括:在稀疏区域内随机加密布点、基于历史时期的样本点数据加密布点和基于泰森多边形边的中点位置加密布点。
采用随机加密布点,无法准确确定样本点空间位置;采用基于历史时期样本点数据加密布点,容易受到历史样本点空间位置的限制;而基于泰森多边形边的中点位置加密布点,无法达到全局最优。
因此,在稀疏区域中如何进行样本点的加密布设,包括具体确定加密样本点的空间位置,对于样本点数据的分析与评价结果来说非常关键。
发明内容
针对现有技术存在的问题,本发明提供一种稀疏区域的样本点加密方法及系统。
本发明提供一种稀疏区域的样本点加密方法,包括:
S1,确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;所述目标稀疏样本点所在的泰森多边形的面积最大;
S2,确定所述目标稀疏样本点的加密采样区域,并确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N;
S3,对所述加密采样区域进行空间离散化处理,以获取待选样本点集合;所述待选样本点集合中的所有待选样本点的数量为K,K>N;
S4,获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合;
S5,分别将每个待选样本点子集合中的N个待选样本点与所述采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局;
S6,根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,并将所述最优样本点空间布局中的N个所述待选样本点作为加密样本点;
S7,利用所述加密样本点,对所述目标稀疏样本点的稀疏区域进行样本点加密处理;
S8,迭代执行S1-S7,直至所述采样区域内不存在稀疏样本点为止。
根据本发明提供的一种稀疏区域的样本点加密方法,所述确定采样区域内的所有稀疏样本点,包括:筛选出所在的泰森多边形的面积大于平均采样面积的所有样本点,并计算被筛选出的每个所述样本点的泰森多边形面积与平均采样面积的比值,以确定比值均值μ和比值标准差σ;所述平均采样面积为所述采样区域的面积与所述采样区域内的样本点个数之间的比值;计算μ+zσ,作为稀疏点判断值,z为任一正整数;选取大于所述稀疏点判断值的比值所对应的样本点,作为所述稀疏样本点。
根据本发明提供的一种稀疏区域的样本点加密方法,所述确定所述目标稀疏样本点的加密采样区域,包括:确定所述目标稀疏样本点的所有相邻样本点,所述相邻样本点所在的泰森多边形与所述目标稀疏样本点所在的泰森多边形相邻;确定每个所述相邻样本点的聚集区域和所述目标稀疏样本点的聚集区域;获取所述目标稀疏样本点的稀疏区域与所述采样区域的交集;所述目标稀疏样本点的稀疏区域,包含所述目标稀疏样本点所在的泰森多边形,与其所有相邻样本点所在的泰森多边形的并集;在所述交集中空间擦除所述目标稀疏样本点的聚集区域以及每个所述相邻样本点的聚集区域之后,获取所述目标稀疏样本点的加密采样区域。
根据本发明提供的一种稀疏区域的样本点加密方法,所述确定每个所述相邻样本点的聚集区域和所述目标稀疏样本点的聚集区域,包括:将以所述相邻样本点为圆心,由预设半径所确定的圆形区域,作为所述相邻样本点的聚集区域;将以所述目标稀疏样本点为圆心,由所述预设半径所确定的圆形区域,作为所述目标稀疏样本点的聚集区域;
所述预设半径的计算公式为:
Figure BDA0003066611300000031
其中,r为所述预设半径;S0为平均采样面积,p为任一正整数。
根据本发明提供的一种稀疏区域的样本点加密方法,所述确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N,包括:获取所述目标稀疏样本点所在的泰森多边形面积与平均采样面积的比值;将所述比值减1,并作四舍五入取整后,获取所述加密样本点的数量N。
根据本发明提供的一种稀疏区域的样本点加密方法,所述对所述加密采样区域进行空间离散化处理,以获取待选样本点集合,包括:利用正方形格网,将所述加密采样区域空间离散化成均匀分布的K个正方形格网区域;确定每个所述正方形格网区域的中心点,并在每个所述中心点采样一个所述待选样本点,以构建所述待选样本点集合。
根据本发明提供的一种稀疏区域的样本点加密方法,所述根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,包括:针对任一样本点空间布局,若构成所述任一样本点空间布局的待选样本点子集合中的任一待选样本点,不满足第一判断规则,则从所述M个样本点空间布局中剔除所述任一样本点空间布局,以获取剩余的T个样本点空间布局。
所述第一判断规则为:所在泰森多边形面积与平均采样面积的比值,不小于μ-tσ且不大于μ+tσ,t为任一正整数;分别计算所述T个样本点空间布局中每个样本点空间布局的地理空间分布均匀度;根据所述地理空间分布均匀度,从所述T个样本点空间布局中筛选出所述最优样本点空间布局,所述最优样本点空间布局的地理空间分布均匀度最小。
根据本发明提供的一种稀疏区域的样本点加密方法,所述地理空间分布均匀度的计算公式为:
Figure BDA0003066611300000041
其中,I表示地理空间分布均匀度,n表示样本点空间布局中的样本点个数;Si表示第i个样本点所在的泰森多边形面积;S0表示平均采样面积。
根据本发明提供的一种稀疏区域的样本点加密方法,所述T个样本点空间布局中筛选出所述最优样本点空间布局,还包括:
若在所述T个样本点空间布局中,存在Q个样本点空间布局的地理空间分布均匀度均为最小值的情况下,则从所述Q个样本点空间布局中筛选出所述最优样本点空间布局;所述最优样本点空间布局所对应的N个待选样本点所在的泰森多边形的面积之和,与N倍目标平均采样面积之间的差值绝对值最小;所述目标平均采样面积为所述采样区域的面积,与当前的样本点空间布局中的样本点个数之间的比值。
本发明还提供一种稀疏区域的样本点加密系统,包括:第一处理单元,用于确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;所述目标稀疏样本点所在的泰森多边形的面积最大;第二处理单元,用于确定所述目标稀疏样本点的加密采样区域,并确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N;第三处理单元,用于对所述加密采样区域进行空间离散化处理,以获取待选样本点集合;所述待选样本点集合中的所有待选样本点的数量为K,K>N;第四处理单元,用于获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合;第五处理单元,用于分别将每个待选样本点子集合中的N个待选样本点与所述采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局;第六处理单元,用于根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,并将所述最优样本点空间布局中的N个所述待选样本点作为加密样本点;第七处理单元,用于利用所述加密样本点,对所述目标稀疏样本点的稀疏区域进行样本点加密处理;第八处理单元,用于控制第一处理单元至第七处理单元的迭代运行,直至所述采样区域内不存在稀疏样本点为止。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述稀疏区域的样本点加密方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述稀疏区域的样本点加密方法的步骤。
本发明提供的稀疏区域的样本点加密方法及系统,通过迭代的方式,依次确定当前样本点空间布局中的目标稀疏样本点,并确定其加密采样区域相关的加密样本点,能够确保每次迭代加密样本点的全局最优性,有效地提高样本点数据的代表性和无偏性,保证了样本点数据分析评价的准确性和可靠性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的稀疏区域的样本点加密方法的流程示意图;
图2是本发明提供的确定采样区域内的稀疏样本点的示意图;
图3是本发明提供的确定相邻样本点的空间分布示意图;
图4是本发明提供的最终的样本点空间布局相关的第一判断规则判断结果示意图;
图5是本发明提供的最终的样本点空间布局示意图;
图6是本发明提供的稀疏区域的样本点加密系统的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明实施例的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
下面结合图1-图7描述本发明实施例所提供的稀疏区域的样本点加密方法和系统。
图1是本发明提供的稀疏区域的样本点加密方法的流程示意图,如图1所示,包括但不限于以下步骤:
S1,确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;目标稀疏样本点所在的泰森多边形的面积最大。
在采样区域内的所有样本点的空间分布一般呈现聚集分布、均匀分布和稀疏分布三种模式。其中,稀疏分布是指样本点空间分布成稀疏状的空间分布格局,样本点的稀疏分布会一定程度影响样本点数据质量。有鉴于此,本发明通过在样本点稀疏分布的区域(即稀疏区域)内合理的增加加密样本点,能有效地解决这一缺陷。
在步骤S1中,首先需要将采样区域内的所有样本点按照空间分布的情况进行划分,以从中筛选出所有的稀疏样本点。
泰森多边形是由一组连接两邻点线段的垂直平分线组成的连续多边形组成。泰森多边形是对空间平面的一种剖分,其特点是多边形内的任何位置离该多边形的样本点的距离最近,离相邻泰森多边形内样本点的距离远,且每个泰森多边形内含且仅包含一个样本点。由于泰森多边形在空间剖分上的等分性特征,因此可用于解决最近点、最小封闭圆等问题,以及许多空间分析问题,如邻接、接近度和可达性分析等。
本发明提供的稀疏样本点的确定方法,包括:先根据样本点空间布局,利用ArcGIS软件,将采样区域划分为多个泰森多边形,其中每个泰森多边形内部包含且仅包含一个样本点。统计整个采样区域的总面积以及每个样本点所在的泰森多边形面积。然后,根据每个样本点所在的泰森多边形面积与采样区域的总面积之间的关系,确定所有样本点中的所有稀疏样本点,本发明不对稀疏样本点的确认方式作具体地限定。
在确定了采样区域内的所有稀疏样本点之后,还需要从中选择出一个目标稀疏样本点。其中,该目标稀疏样本点是指所有稀疏样本点中,其所在的泰森多边形面积最大的一个稀疏样本点。
需要说明的是,在实际操作过程中,不排除会出现同时存在多个泰森多边形面积相同且为最大的情况,此时可以选择将任一泰森多边形面积最大的稀疏样本点作为目标稀疏样本点。
假设在步骤S1中所确定的稀疏样本点的数量是3,三个稀疏样本点所在的泰森多边形的面积为S1、S2、S3且存在S1>S2>S3,则将S1所对应的稀疏样本点,设置为目标稀疏样本点。
本发明提供确定目标稀疏样本点,相当于是在当前的样本点空间布局中,确定了泰森多边形面积最大的一个稀疏样本点作为目标稀疏样本点。
步骤S2,确定目标稀疏样本点的加密采样区域,并确定对加密采样区域进行样本点加密所需的加密样本点的数量N。
步骤S2主要是用于确定目标稀疏样本点的加密采样区域以及对加密采样区域进行样本点加密处理中所需要增加的加密样本点的数量。
其中,在确定目标稀疏样本点的加密采样区域之前,可以先定位出目标稀疏样本点的所有相邻样本点;在确定了目标稀疏样本点的所有相邻样本点之后,则可以进一步确定每个相邻样本点的聚集区域,以及目标稀疏样本点的稀疏区域。
对于任一样本点来说,相邻样本点是指与该样本点所在的泰森多边形相邻的泰森多边形所对应的样本点;稀疏区域是指样本点所在的泰森多边形及其相邻的泰森多边形的交集区域;聚集区域是指以样本点为圆心的一定范围内的圆形区域。
其中,目标稀疏样本点的相邻样本点,是指与目标稀疏样本点所在的泰森多边形相邻的泰森多边形所对应的样本点。因此,可以在获取目标稀疏样本点的稀疏区域与采样区域的交集之后,再空间擦除目标稀疏样本点的聚集区域以及相应地相邻样本点的聚集区域,以获取到目标稀疏样本点的加密采样区域。其中,目标稀疏样本点的稀疏区域是指目标稀疏样本点所在的泰森多边形,与其所有相邻样本点所在的泰森多边形的并集。
进一步地,可以根据目标稀疏样本点所在的泰森多边形的面积,与平均采样面积的比值关系,确定出对目标稀疏样本点的加密采样区域进行样本点加密处理的加密样本点的数量,记为N。
S3,对加密采样区域进行空间离散化处理,以获取待选样本点集合;待选样本点集合中的所有待选样本点的数量为K,K>N。
上述对加密采样区域进行空间离散化处理的步骤可以基于ArcGIS软件实现。
本发明采用空间离散化(Spatial Discretization)对加密采样区域进行处理,相当于是利用预设的格网(如正方形格网)对加密采样区域进行切分,以获取到对应数量的正方形格网区域(各正方形格网区域的形状、面积相同),并在每个正方形格网区域的中心点采样一个样本点,作为待选样本点。最后,可以将所有待选样本点构建成一个待选样本点集合,设待选样本点集合中所有待选样本点的数量为K(也即是正方形格网区域的数量)。
S4,获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合。
本发明利用K个待选样本点构建M个待选样本点子集合的方式可以采用随机排列组合的方式实现。其中,M的数量计算公式为:
Figure BDA0003066611300000101
S5,分别将每个待选样本点子集合中的N个待选样本点与采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局。
在本发明所提供的样本点加密方法,在构建出M个待选样本点子集合后,随机抽取出一个待选样本点子集合,并将其中的N个待选样本点与当前采样区域内的所有样本点构成一个新的样本点空间布局。基于上述方法,遍历M个待选样本点子集合,则可以获取到M个新的样本点空间布局。
S6,根据预设判断规则,从M个样本点空间布局中确定最优样本点空间布局,并将最优样本点空间布局中的N个待选样本点作为加密样本点。
在步骤S6中,由于获取到了M个新的样本点空间布局,故需要通过据预设判断规则,从中选择出一个最优样本点空间布局,以确保在将最优样本点空间布局中的N个待选样本点作为加密样本点加入至采样区域后,能有效地防止因原有的样本点分布稀疏引起的不确定性。
可选地,上述预设判断规则,包括:首先,需要保证在采样区域中加入N个待选样本点后,不会造成样本点的聚集分布或稀疏分布;另外,可以根据地理空间分布均匀度,从M个新的样本点空间布局中筛选出地理空间分布均匀度最小的一个样本点空间布局作为最优样本点空间布局。
地理空间分布均匀度能有效地反映样本点在地理空间内分布的均匀度,在同一采样区域内分布多个样本点,不同的布局可能带来不同的均匀度。地理空间分布均匀度越小,表示样本点在地理空间的分布越均匀;反之,样本点分布越趋向于聚集或稀疏。
S7,利用加密样本点,对目标稀疏样本点的稀疏区域进行样本点加密处理。
在从M个新的样本点空间布局中筛选出最优样本点空间布局之后,则将最优样本点空间布局中的N个待选样本点作为加密样本点,完成对加密采样区域的样本点加密(即最优样本点空间布局中包含有原始的样本点和增加的N个待选样本点)。
S8,迭代执行S1-S7,直至采样区域内不存在稀疏样本点为止。
具体地,在执行步骤S7之后,由于在采样区域内增加了新的样本点,故原本在步骤S1中所确定的部分稀疏样本点可能会发生变化,故需要重新确定采样区域内是否存在稀疏样本点,若还存在稀疏样本点,则重复上述步骤S1-S7,直至采样区域内不存在稀疏样本点为止。
需要说明的是,本发明提供的样本点加密方法,每次只处理当前样本点空间布局中的一个目标稀疏样本点,在对目标稀疏样本点的加密采样区域进行样本点加密处理后,获取到新的样本点空间布局(即原始的样本点和N个待选样本点的组合)。然后重新确定新的样本点空间布局中的目标稀疏样本点,并重新对其所在的加密采样区域进行样本点加密处理;迭代执行上述步骤S1-S7直至整个采样区域内不存在稀疏样本点为止。上述样本点加密的方法,与现有的技术中所采用的随机加密布点或者基于泰森多边形边的中点位置加密布点等方法相比较,虽然说一定程度上降低了样本点加密的速度,但是能够确保在每次迭代过程中所确定出的加密样本点的全局最优,能够有效地提升样本点空间布局中样本点数据的代表性。
本发明提供的稀疏区域的样本点加密方法,通过迭代的方式,依次确定当前样本点空间布局中的目标稀疏样本点,并确定其加密采样区域相关的加密样本点,能够确保每次迭代加密样本点的全局最优性,有效地提高样本点数据的代表性和无偏性,保证了样本点数据分析评价的准确性和可靠性。
基于上述实施例的内容,作为一种可选实施例,步骤S1中所述的确定采样区域内的所有稀疏样本点,包括:筛选出所在的泰森多边形的面积大于平均采样面积的所有样本点,并计算被筛选出的每个样本点的泰森多边形面积与平均采样面积的比值,以确定比值均值μ和比值标准差σ;平均采样面积为所述采样区域的面积与采样区域内的样本点个数之间的比值;计算μ+zσ,作为稀疏点判断值,z为任一正整数;选取大于稀疏点判断值的比值所对应的样本点,作为稀疏样本点。
在本实施例中,以北京市顺义区高丽营镇、赵全营镇、牛栏山地区和北石槽镇农业用地作为采样区域,农业用地主要包括菜地、水浇地、苗圃等。
上述采样区域的总面积为114.379km2,设采样区域内当前的样本点的个数为95个,则可以计算出采样区域的平均采样面积为114.379km2/95=1.204km2
进一步地,可以从95个样本点中挑选出其所在泰森多边形面积大于平均采样面积的所有样本点共计43个,其对应比值的最小值为1.022,比值的最大值2.279。
分别计算出上述43个样本点所在的泰森多边形面积与平均采样面积的比值(即可以获取到43个比值)。
然后,分别计算上述43个比值的比值均值μ和比值标准差σ,其中:
Figure BDA0003066611300000131
其中,n在此处取值为43,xi为第i个样本点所在的泰森多边形面积。由此,可以计算出比值均值μ为1.389,比值标准差σ为0.303,稀疏点判断值μ+2σ为1.995(此时将z设置为2)。
图2是本发明提供的确定采样区域内的稀疏样本点的示意图,如图2所示,将上述43样本点所在的泰森多边形面积与平均采样面积的比值分别与1.995进行比较,并将所有比值大于1.995的样本点判断为稀疏样本点。
通过上述步骤,可以确定上述43个样本点中仅有一个样本点所在的泰森多边形面积与平均采样面积的比值大于1.995,故在本实施例中仅可以确定出一个稀疏样本点,则直接将该稀疏样本点作为目标稀疏样本点。
需要说明的是,若通过上述步骤,所确定的稀疏样本点有多个,则需要从所有稀疏样本点中选取出所在的泰森多边形的面积最大的一个,作为目标稀疏样本点。
本发明提供的样本点加密方法,利用样本点所在的泰森多边形面积与平均采样面积的比值与稀疏点判断值进行比较,以准确的确定出采样区域内的所有稀疏样本点。
基于上述实施例的内容,作为一种可选实施例,步骤S2中所述的确定目标稀疏样本点的加密采样区域,包括:确定目标稀疏样本点的所有相邻样本点,相邻样本点所在的泰森多边形与目标稀疏样本点所在的泰森多边形相邻;确定每个相邻样本点的聚集区域和目标稀疏样本点的聚集区域;获取目标稀疏样本点的稀疏区域与采样区域的交集;在交集中空间擦除目标稀疏样本点的聚集区域以及每个相邻样本点的聚集区域之后,获取目标稀疏样本点的加密采样区域。
图3是本发明提供的确定相邻样本点的空间分布示意图,在上述实施例的基础上,如图3所示,与目标稀疏样本点所在泰森多边形相邻的泰森多边形共有6个,则将上述6个泰森多边形所对应的样本点均作为目标稀疏样本点的相邻样本点。
上述确定每个相邻样本点的聚集区域,包括:将以各相邻样本点为圆心,由预设半径r所确定的圆形区域,作为各相邻样本点的聚集区域;其中,预设半径的计算公式为:
Figure BDA0003066611300000141
其中,r为所述预设半径;S0为平均采样面积。在本实施例中,
Figure BDA0003066611300000142
单位为km,p取值为1。
分别将以各相邻样本点所在的位置为圆心以r为半径所在的圆形区域,作为各相邻样本点的聚集区域。
同理,以目标稀疏样本点所在的位置为圆心以r为半径所在的圆形区域,作为目标稀疏样本点的聚集区域。
在确定目标稀疏样本点所在的稀疏区域与整个采样区域的交集之后,从整个交集中擦除各相邻样本点的聚集区域以及目标稀疏样本点的聚集区域,并将剩余的空间区域作为目标稀疏样本点的加密采样区域。
本发明提供的样本点加密方法,在确定目标稀疏样本点的加密采样区域的时候,通过空间擦除各样本点的聚集区域,能够有效避免加密样本点聚集分布的情景,从而提高了采样区域中样本点的代表性和无偏性,保证了样本点数据分析评价的准确性和可靠性。
基于上述实施例的内容,作为一种可选实施例,步骤S2中所述的确定对加密采样区域进行样本点加密所需的加密样本点的数量N,包括:获取目标稀疏样本点所在的泰森多边形面积与平均采样面积的比值;将所述比值减1,并作四舍五入取整后,获取加密样本点的数量N。
在上述实施例的基础上,计算目标稀疏样本点所在的泰森多边形面积与平均采样面积的比值为2.279;将2.279减去1之后为1.279,再对1.279进行四舍五入取整后为的结果为1,则说明本轮加密样本点的数量N=1,即在目标稀疏样本点所在的加密采样区域中需要添加一个加密样本点。
需要说明的是,在每轮对目标稀疏样本点所在的加密采样区域,进行样本点加密处理时,可能需要加密1个、2个或多个加密样本点,样本点加密处理完成后,获取新的样本点空间布局。由于经每轮样本点加密处理后,新加入了加密样本点,故新的样本点空间布局生成的各样本点所在的泰森多边形可能会存在差异,故需要在新的样本点空间布局中重新确定目标稀疏样本点。
基于上述实施例的内容,作为一种可选实施例,步骤S3中所述的对加密采样区域进行空间离散化处理,以获取待选样本点集合,包括:利用正方形格网,将加密采样区域空间离散化成均匀分布的K个正方形格网区域;确定每个正方形格网区域的中心点,并在每个中心点采样一个待选样本点,以构建待选样本点集合。
本发明提供的样本点加密方法,在确定了目标稀疏样本点所在的加密采样区域之后,以相同的正方形格网对上述加密采样区域进行空间离散化处理,以获取均匀分布的K个正方形格网区域。
其中,正方形格网的大小可以根据实际需要设定,如1m×1m,10m×10m,100m×100m等。
分别确定每个正方形格网区域的中心点,以在每个所述中心点采样一个所述待选样本点,共可以获取到K个待选样本点;由上述K个待选样本点构建成待选样本点集合。
在上述实施例的基础上,针对目标稀疏样本点,需要增加一个加密样本点。在确定了目标稀疏样本点所在的加密采样区域之后,以100m×100m的正方形格网,空间离散化该加密采样区域成1763个正方形格网区域。
分别在每个正方形格网区域中心点处采样一个样本点获取1763个待选样本点,以构建待选样本点集合(即待选样本点集合中包含上述1763个待选样本点)。
进一步地,从待选样本点集合中的1763个待选样本点中随机取出1个待选样本点,则可以获取到1763个待选样本点子集合。将每个待选样本点子集合中的待选样本点(本实施例中仅包含1个)与采样区域内原始的95个样本点一起,构成包含有96个样本点的新的样本点空间布局。由此,可以获取到1763个新的样本点空间布局。
基于上述实施例的内容,作为一种可选实施例,步骤S6中所述的根据预设判断规则,从M个样本点空间布局中确定最优样本点空间布局,包括:针对任一样本点空间布局,若构成任一样本点空间布局的待选样本点子集合中的任一待选样本点,不满足第一判断规则,则从M个样本点空间布局中剔除该任一样本点空间布局,以获取剩余的T个样本点空间布局。
第一判断规则可以为:所在泰森多边形面积与平均采样面积的比值,不小于μ-tσ且不大于μ+tσ,t为任一正整数;分别计算T个样本点空间布局中每个样本点空间布局的地理空间分布均匀度;根据地理空间分布均匀度,从T个样本点空间布局中筛选出所述最优样本点空间布局,最优样本点空间布局的地理空间分布均匀度最小。
可选地,所述地理空间分布均匀度的计算公式为:
Figure BDA0003066611300000171
其中,I表示地理空间分布均匀度,n表示样本点空间布局中的样本点个数;Si表示第i个样本点所在的泰森多边形面积;S0表示平均采样面积。
本发明提供的样本点加密方法,通过制定预设判断规则,从M个样本点空间布局中确定最优样本点空间布局,该预设判断规则如下:
(1)根据上述实施例的方法,分别筛选出其所在的泰森多边形的面积大于平均采样面积的所有样本点,计算被筛选出的每个样本点的泰森多边形面积与平均采样面积的比值,并计算比值均值μ和比值标准差σ;由于,增加的加密样本点所在的泰森多边形的面积与平均采样面积的比值的范围应在μ±2σ之间(设t=2),否则会造成样本点聚集分布(比值小于μ-2σ)或稀疏分布(比值大于μ+2σ),故本发明通过设置第一判断规则,从M个样本点空间布局中剔除不满足这一规则的样本点空间布局,设剩余T个样本点空间布局。
(2)在剩余的T个样本点空间布局中,选取表征全部样本点空间分布均匀程度的地理空间分布均匀度最小的样本点空间布局,作为最优样本点空间布局。
需要说明的是,所述根据所述地理空间分布均匀度,从所述T个样本点空间布局中筛选出所述最优样本点空间布局,还包括:
若在所述T个样本点空间布局中,存在Q个样本点空间布局的地理空间分布均匀度均为最小值的情况下,则从所述Q个样本点空间布局中筛选出所述最优样本点空间布局;所述最优样本点空间布局所对应的N个待选样本点所在的泰森多边形的面积之和,与N倍目标平均采样面积之间的差值绝对值最小;所述目标平均采样面积为所述采样区域的面积,与当前的样本点空间布局中的样本点个数之间的比值。
假设获取到的1763个新的样本点空间布局之中,存在2个样本点空间布局(即Q=2)所对应的地理空间分布均匀度相同,且是所有新的样本点空间布局所对应的地理空间分布均匀度中的最小值,则需要从这2个样本点空间布局中筛选出最优样本点空间布局。
作为一种可选的实施例,若存在这一情况,则任意选择其中一个即可。
作为另一可选的实施例,可以先分别计算出这2个样本点空间布局所增加的N个待选样本点所在的泰森多边形的面积之和,然后分别计算各自的目标平均采样面积。
其中,目标平均采样面积S的计算公式为:
Figure BDA0003066611300000181
n为样本点空间布局中的样本点个数(在增加了N个待选样本点之后),S为采样区域的面积。
进一步地,分别计算2个样本点空间布局所计算得到的N个待选样本点所在的泰森多边形的面积之和,与N倍的目标平均采样面积之间的差值绝对值,并将差值绝对值较小的一个样本点空间布局作为最优样本点空间布局。
本发明充分考虑了各种情况下最优样本点空间布局的确定方法,尤其针对如何在地理空间分布均匀度相同的样本点空间布局中确定最优样本点空间布局,提出了借助目标平均采样面积进行判断的新思路,进一步提升了进行样本点加密的全局最优,进而能够进一步提高样本点数据的代表性和无偏性。
在上述实施例的基础上,在获取到1763个新的样本点空间布局之后(即M=1763),首先针对1763个新的样本点空间布局中的任意一个(以下简称为目标样本点空间布局),分别筛选出其所在的泰森多边形的面积大于平均采样面积的所有样本点,并计算被筛选出的每个样本点的泰森多边形面积与平均采样面积的比值,以确定比值均值μ和比值标准差σ;进而,确定第一判断规则所对应的待选样本点所在泰森多边形面积与平均采样面积的比值范围(μ-2σ,μ+2σ)。
若目标样本点空间布局所对应的所有待选样本点所在的泰森多边形面积与平均采样面积的比值,均位于(μ-2σ,μ+2σ)之间,则将该目标样本点空间布局作为T个样本点空间布局之一。
基于第一判断规则,分别对1763个新的样本点空间布局进行分析判断,以从中筛选出满足要求的1330个样本点空间布局(即T=1330)。
进一步地,分别计算1330个样本点空间布局的地理空间分布均匀度,并将地理空间分布均匀度最小的样本点空间布局作为最优样本点空间布局。
进一步地,执行步骤S7,即根据步骤S6中所确定的最优样本点空间布局,将其中的加密样本点加入至上述目标稀疏样本点所在的稀疏区域。
最后,迭代执行上述步骤S1-S7,包括再次从采样区域内确定所有稀疏样本点,并确定目标稀疏样本点;对目标稀疏样本点所在的加密采样区域进行样本点加密,直至在采样区域内中不存在稀疏样本点为止,以获取到最终的样本点空间布局。
图4是本发明提供的最终的样本点空间布局相关的第一判断规则判断结果示意图,如图4所示,最终的样本点空间布局的比值均值μ=1.358、比值标准差σ=0.275,其所确定的第一判断规则对应的比值范围为(μ-2σ,μ+2σ)=(0.808,1.909)。
由图4所示,可以获知:在最终的样本点空间布局中,所有待选样本点所在泰森多边形面积与平均采样面积的比值范围均在(0.808,1.909)之间,即最终的样本点空间布局中所有待选样本点所在的泰森多边形面积与平均采样面积的比值范围均在μ±2σ之间,不会造成样本点稀疏分布或聚集分布。
图5是本发明提供的最终的样本点空间布局示意图,以图5所示为例,结合上述实施例的内容,在确定样本点空间布局中包含了96个样本点,并根据上述实施例所述的稀疏样本点判断方法,确定采样区域中已不存在稀疏样本点的情况下,则整个样本点加密终止,输出稀疏样本点相应的加密样本点的最优空间位置,即可以获取到最终的样本点空间布局。
需要说明的是,在上述本实施例中仅需经过一轮迭代,即可确保采样区域中已不存在稀疏样本点,但其不视为对本发明保护范围的具体限定。
为充分说明本发明所提供的稀疏区域的样本点加密方法的可行性,结合上述实施例的内容,分析利用本发明所提供的稀疏区域的样本点加密方法对采样区域进行样本点加密处理前后的效果,可知:
原始仅包含95个样本点的样本点空间布局,所计算的地理空间分布均匀度为0.429,采用本发明提供的样本点加密方法所获取的最终的样本点空间布局的地理空间分布均匀度为0.412,所获取的最终的样本点空间布局中共包含96个样本点。
由于经过样本点加密处理后的最终的样本点空间布局的地理空间分布均匀度0.412,小于原始的地理空间分布均匀度0.429,也表明了经过本发明所提供的样本点加密方法,对采样区域进行样本点加密处理的可行性。
本发明提供的样本点加密方法,通过迭代的方式,依次确定当前样本点空间布局中的目标稀疏样本点,并确定其加密采样区域相关的加密样本点,能够确保每次迭代加密样本点的全局最优性,有效地提高样本点数据的代表性和无偏性,保证了样本点数据分析评价的准确性和可靠性。
图6是本发明提供的稀疏区域的样本点加密系统的结构示意图,如图6所示,该系统主要包括:第一处理单元61、第二处理单元62、第三处理单元63、第四处理单元64、第五处理单元65、第六处理单元66、第七处理单元67和第八处理单元68,其中:
第一处理单元61主要用于确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;目标稀疏样本点所在的泰森多边形的面积最大;第二处理单元62主要用于确定目标稀疏样本点的加密采样区域,并确定对加密采样区域进行样本点加密所需的加密样本点的数量N;第三处理单元63主要用于对加密采样区域进行空间离散化处理,以获取待选样本点集合;待选样本点集合中的所有待选样本点的数量为K,K>N;第四处理单元64主要用于获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合;第五处理单元65主要用于分别将每个待选样本点子集合中的N个待选样本点与采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局;第六处理单元66主要用于根据预设判断规则,从M个样本点空间布局中确定最优样本点空间布局,并将最优样本点空间布局中的N个待选样本点作为加密样本点;第七处理单元67主要用于利用加密样本点,对目标稀疏样本点的稀疏区域进行样本点加密处理;第八处理单元68主要用于控制第一处理单元61至第七处理单元67的迭代运行,直至采样区域内不存在稀疏样本点为止。
本发明提供的稀疏区域的样本点加密系统,通过迭代的方式,依次确定当前样本点空间布局中的目标稀疏样本点,并确定其加密采样区域相关的加密样本点,能够确保每次迭代加密样本点的全局最优性,有效地提高样本点数据的代表性和无偏性,保证了样本点数据分析评价的准确性和可靠性。
需要说明的是,本发明实施例提供的稀疏区域的样本点加密系统,在具体执行时,可以基于上述任一实施例所述的稀疏区域的样本点加密方法来实现,对此本实施例不作赘述。
图7是本发明提供的电子设备的结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行稀疏区域的样本点加密方法,该方法包括:
S1,确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;所述目标稀疏样本点所在的泰森多边形的面积最大;
S2,确定所述目标稀疏样本点的加密采样区域,并确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N;
S3,对所述加密采样区域进行空间离散化处理,以获取待选样本点集合;所述待选样本点集合中的所有待选样本点的数量为K,K>N;
S4,获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合;
S5,分别将每个待选样本点子集合中的N个待选样本点与所述采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局;
S6,根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,并将所述最优样本点空间布局中的N个所述待选样本点作为加密样本点;
S7,利用所述加密样本点,对所述目标稀疏样本点的稀疏区域进行样本点加密处理;
S8,迭代执行S1-S7,直至所述采样区域内不存在稀疏样本点为止。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的稀疏区域的样本点加密方法,该方法包括:
S1,确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;所述目标稀疏样本点所在的泰森多边形的面积最大;
S2,确定所述目标稀疏样本点的加密采样区域,并确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N;
S3,对所述加密采样区域进行空间离散化处理,以获取待选样本点集合;所述待选样本点集合中的所有待选样本点的数量为K,K>N;
S4,获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合;
S5,分别将每个待选样本点子集合中的N个待选样本点与所述采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局;
S6,根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,并将所述最优样本点空间布局中的N个所述待选样本点作为加密样本点;
S7,利用所述加密样本点,对所述目标稀疏样本点的稀疏区域进行样本点加密处理;
S8,迭代执行S1-S7,直至所述采样区域内不存在稀疏样本点为止。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的稀疏区域的样本点加密方法,该方法包括:
S1,确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;所述目标稀疏样本点所在的泰森多边形的面积最大;
S2,确定所述目标稀疏样本点的加密采样区域,并确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N;
S3,对所述加密采样区域进行空间离散化处理,以获取待选样本点集合;所述待选样本点集合中的所有待选样本点的数量为K,K>N;
S4,获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合;
S5,分别将每个待选样本点子集合中的N个待选样本点与所述采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局;
S6,根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,并将所述最优样本点空间布局中的N个所述待选样本点作为加密样本点;
S7,利用所述加密样本点,对所述目标稀疏样本点的稀疏区域进行样本点加密处理;
S8,迭代执行S1-S7,直至所述采样区域内不存在稀疏样本点为止。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种稀疏区域的样本点加密方法,其特征在于,包括:
S1,确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;所述目标稀疏样本点所在的泰森多边形的面积最大;
S2,确定所述目标稀疏样本点的加密采样区域,并确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N;
S3,对所述加密采样区域进行空间离散化处理,以获取待选样本点集合;所述待选样本点集合中的所有待选样本点的数量为K,K>N;
S4,获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合;
S5,分别将每个待选样本点子集合中的N个待选样本点与所述采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局;
S6,根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,并将所述最优样本点空间布局中的N个所述待选样本点作为加密样本点;
S7,利用所述加密样本点,对所述目标稀疏样本点的稀疏区域进行样本点加密处理;
S8,迭代执行S1-S7,直至所述采样区域内不存在稀疏样本点为止;
其中,所述确定采样区域内的所有稀疏样本点,包括:
筛选出所在的泰森多边形的面积大于平均采样面积的所有样本点,并计算被筛选出的每个所述样本点的泰森多边形面积与平均采样面积的比值,以确定比值均值μ和比值标准差σ;所述平均采样面积为所述采样区域的面积与所述采样区域内的样本点个数之间的比值;
计算μ+zσ,作为稀疏点判断值,z为任一正整数;
选取大于所述稀疏点判断值的比值所对应的样本点,作为所述稀疏样本点;
其中,所述根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,包括:
针对任一样本点空间布局,若构成所述任一样本点空间布局的待选样本点子集合中的任一待选样本点,不满足第一判断规则,则从所述M个样本点空间布局中剔除所述任一样本点空间布局,以获取剩余的T个样本点空间布局;
所述第一判断规则为:所在泰森多边形面积与平均采样面积的比值,不小于μ-tσ且不大于μ+tσ,t为任一正整数;
分别计算所述T个样本点空间布局中每个样本点空间布局的地理空间分布均匀度;
根据所述地理空间分布均匀度,从所述T个样本点空间布局中筛选出所述最优样本点空间布局,所述最优样本点空间布局的地理空间分布均匀度最小。
2.根据权利要求1所述的稀疏区域的样本点加密方法,其特征在于,所述确定所述目标稀疏样本点的加密采样区域,包括:
确定所述目标稀疏样本点的所有相邻样本点,所述相邻样本点所在的泰森多边形与所述目标稀疏样本点所在的泰森多边形相邻;
确定每个所述相邻样本点的聚集区域和所述目标稀疏样本点的聚集区域;
获取所述目标稀疏样本点的稀疏区域与所述采样区域的交集;所述目标稀疏样本点的稀疏区域,包含所述目标稀疏样本点所在的泰森多边形,与其所有相邻样本点所在的泰森多边形的并集;
在所述交集中空间擦除所述目标稀疏样本点的聚集区域以及每个所述相邻样本点的聚集区域之后,获取所述目标稀疏样本点的加密采样区域。
3.根据权利要求2所述的稀疏区域的样本点加密方法,其特征在于,所述确定每个所述相邻样本点的聚集区域和所述目标稀疏样本点的聚集区域,包括:
将以所述相邻样本点为圆心,由预设半径所确定的圆形区域,作为所述相邻样本点的聚集区域;
将以所述目标稀疏样本点为圆心,由所述预设半径所确定的圆形区域,作为所述目标稀疏样本点的聚集区域;
所述预设半径的计算公式为:
Figure FDA0003459066160000031
其中,r为所述预设半径;S0为平均采样面积,p为任一正整数。
4.根据权利要求1所述的稀疏区域的样本点加密方法,其特征在于,所述确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N,包括:
获取所述目标稀疏样本点所在的泰森多边形面积与平均采样面积的比值;
将所述比值减1,并作四舍五入取整后,获取所述加密样本点的数量N。
5.根据权利要求1所述的稀疏区域的样本点加密方法,其特征在于,所述对所述加密采样区域进行空间离散化处理,以获取待选样本点集合,包括:
利用正方形格网,将所述加密采样区域空间离散化成均匀分布的K个正方形格网区域;
确定每个所述正方形格网区域的中心点,并在每个所述中心点采样一个所述待选样本点,以构建所述待选样本点集合。
6.根据权利要求1所述的稀疏区域的样本点加密方法,其特征在于,所述地理空间分布均匀度的计算公式为:
Figure FDA0003459066160000041
其中,I表示地理空间分布均匀度,n表示样本点空间布局中的样本点个数;Si表示第i个样本点所在的泰森多边形面积;S0表示平均采样面积。
7.根据权利要求1所述的稀疏区域的样本点加密方法,其特征在于,所述从所述T个样本点空间布局中筛选出所述最优样本点空间布局,还包括:
若在所述T个样本点空间布局中,存在Q个样本点空间布局的地理空间分布均匀度均为最小值的情况下,则从所述Q个样本点空间布局中筛选出所述最优样本点空间布局;
所述最优样本点空间布局所对应的N个待选样本点所在的泰森多边形的面积之和,与N倍目标平均采样面积之间的差值绝对值最小;
所述目标平均采样面积为所述采样区域的面积,与当前的样本点空间布局中的样本点个数之间的比值。
8.一种稀疏区域的样本点加密系统,其特征在于,包括:
第一处理单元,用于确定采样区域内的所有稀疏样本点,并从所有稀疏样本点中选取出目标稀疏样本点;所述目标稀疏样本点所在的泰森多边形的面积最大;
所述确定采样区域内的所有稀疏样本点,包括:
筛选出所在的泰森多边形的面积大于平均采样面积的所有样本点,并计算被筛选出的每个所述样本点的泰森多边形面积与平均采样面积的比值,以确定比值均值μ和比值标准差σ;所述平均采样面积为所述采样区域的面积与所述采样区域内的样本点个数之间的比值;
计算μ+zσ,作为稀疏点判断值,z为任一正整数;
选取大于所述稀疏点判断值的比值所对应的样本点,作为所述稀疏样本点;
第二处理单元,用于确定所述目标稀疏样本点的加密采样区域,并确定对所述加密采样区域进行样本点加密所需的加密样本点的数量N;
第三处理单元,用于对所述加密采样区域进行空间离散化处理,以获取待选样本点集合;所述待选样本点集合中的所有待选样本点的数量为K,K>N;
第四处理单元,用于获取从K个待选样本点中随机取出N个待选样本点的所有组合,构建M个待选样本点子集合;
第五处理单元,用于分别将每个待选样本点子集合中的N个待选样本点与所述采样区域内的所有样本点构成一个样本点空间布局,以获取M个样本点空间布局;
第六处理单元,用于根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,并将所述最优样本点空间布局中的N个所述待选样本点作为加密样本点;
所述根据预设判断规则,从所述M个样本点空间布局中确定最优样本点空间布局,包括:
针对任一样本点空间布局,若构成所述任一样本点空间布局的待选样本点子集合中的任一待选样本点,不满足第一判断规则,则从所述M个样本点空间布局中剔除所述任一样本点空间布局,以获取剩余的T个样本点空间布局;
所述第一判断规则为:所在泰森多边形面积与平均采样面积的比值,不小于μ-tσ且不大于μ+tσ,t为任一正整数;
分别计算所述T个样本点空间布局中每个样本点空间布局的地理空间分布均匀度;
根据所述地理空间分布均匀度,从所述T个样本点空间布局中筛选出所述最优样本点空间布局,所述最优样本点空间布局的地理空间分布均匀度最小;
第七处理单元,用于利用所述加密样本点,对所述目标稀疏样本点的稀疏区域进行样本点加密处理;
第八处理单元,用于控制第一处理单元至第七处理单元的迭代运行,直至所述采样区域内不存在稀疏样本点为止。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述稀疏区域的样本点加密方法步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述稀疏区域的样本点加密方法步骤。
CN202110529271.6A 2021-05-14 2021-05-14 一种稀疏区域的样本点加密方法及系统 Active CN113515758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110529271.6A CN113515758B (zh) 2021-05-14 2021-05-14 一种稀疏区域的样本点加密方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110529271.6A CN113515758B (zh) 2021-05-14 2021-05-14 一种稀疏区域的样本点加密方法及系统

Publications (2)

Publication Number Publication Date
CN113515758A CN113515758A (zh) 2021-10-19
CN113515758B true CN113515758B (zh) 2022-03-01

Family

ID=78064177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110529271.6A Active CN113515758B (zh) 2021-05-14 2021-05-14 一种稀疏区域的样本点加密方法及系统

Country Status (1)

Country Link
CN (1) CN113515758B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567523A (zh) * 2011-12-29 2012-07-11 武汉大学 一种集聚分布型地理要素的自适应空间抽样方案设计方法
CN107590514A (zh) * 2017-09-11 2018-01-16 北京农业信息技术研究中心 遥感分类精度评价的样本点优化布设方法、系统和设备
CN107705002A (zh) * 2017-09-21 2018-02-16 中国矿业大学(北京) 矿区土壤重金属含量采样点异常高值影响范围的确定方法
CN111122222A (zh) * 2019-12-24 2020-05-08 北京农业信息技术研究中心 一种样本点位置确定方法及系统
CN112308290A (zh) * 2020-09-30 2021-02-02 湘潭大学 一种污染场地调查布点的方法
CN113516731A (zh) * 2021-05-14 2021-10-19 北京农业信息技术研究中心 一种样本点数据精化方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10643263B2 (en) * 2013-02-13 2020-05-05 Rentpath, Llc Method and apparatus for apartment listings
CN106504326B (zh) * 2016-10-27 2019-03-05 滁州学院 顾及形态精度的地形高程采样点加密方法
CN112487995B (zh) * 2020-12-01 2024-08-27 江苏省气象服务中心 一种高速公路能见度时空连续性观测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567523A (zh) * 2011-12-29 2012-07-11 武汉大学 一种集聚分布型地理要素的自适应空间抽样方案设计方法
CN107590514A (zh) * 2017-09-11 2018-01-16 北京农业信息技术研究中心 遥感分类精度评价的样本点优化布设方法、系统和设备
CN107705002A (zh) * 2017-09-21 2018-02-16 中国矿业大学(北京) 矿区土壤重金属含量采样点异常高值影响范围的确定方法
CN111122222A (zh) * 2019-12-24 2020-05-08 北京农业信息技术研究中心 一种样本点位置确定方法及系统
CN112308290A (zh) * 2020-09-30 2021-02-02 湘潭大学 一种污染场地调查布点的方法
CN113516731A (zh) * 2021-05-14 2021-10-19 北京农业信息技术研究中心 一种样本点数据精化方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
The Use of Voronoi Tessellations in Processing Soil Survey Results;D. B. Arnold and W. J. Milne;《IEEE Computer Graphics and Applications》;19840331;第4卷(第3期);第22-28页 *
农业用地土壤重金属样本点数据精化方法——以北京市顺义区为例;唐柜彪 等;《农业环境科学学报》;20201031;第39卷(第10期);第2288-2296页 *
基于区域人流特征的城市功能用地属性识别方法研究;王能钱;《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅱ辑》;20210315(第03期);第C038-816页 *

Also Published As

Publication number Publication date
CN113515758A (zh) 2021-10-19

Similar Documents

Publication Publication Date Title
Zhang et al. Consensus forecasting of species distributions: The effects of niche model performance and niche properties
Tao et al. Spatial cluster detection in spatial flow data
CN105718465B (zh) 地理围栏生成方法及装置
CN109360421B (zh) 一种基于机器学习的交通信息预测方法及装置、电子终端
Bombi et al. Scaling down distribution maps from atlas data: a test of different approaches with virtual species
US10746562B2 (en) Method, apparatus and product for efficient solution of nearest object problems
Haunert et al. Optimal and topologically safe simplification of building footprints
CN110688442B (zh) 一种基于多层网格分块的电子地图点位聚合方法
D’Antonio et al. VGI edit history reveals data trustworthiness and user reputation
CN106709503B (zh) 一种基于密度的大型空间数据聚类算法k-dbscan
CN110298687B (zh) 一种区域吸引力评估方法及设备
CN111122222B (zh) 一种样本点位置确定方法及系统
Kalogiros et al. Analysis of root growth from a phenotyping data set using a density-based model
Mlakar et al. Comparing solutions under uncertainty in multiobjective optimization
CN114374449A (zh) 一种干扰源确定方法、装置、设备及介质
CN113515758B (zh) 一种稀疏区域的样本点加密方法及系统
CN113961780A (zh) 常驻小区的获取方法、装置、电子设备以及存储介质
Zhang et al. Modelling urban expansion with cellular automata supported by urban growth intensity over time
CN113515757B (zh) 一种基于线段优化的样本点加密方法及系统
CN116614392B (zh) 路由开销确定方法、路由开销监控方法及装置
Hildemann et al. Quantifying uncertainty in Pareto fronts arising from spatial data
US20150058354A1 (en) System and methods for storing and analyzing geographically-referenced data
Weerakoon GIS integrated spatio-temporal urban growth modelling: Colombo Urban Fringe, Sri Lanka
CN113689526B (zh) 地图中无效区域的划分方法及装置、电子设备
CN110837540A (zh) 一种空间位置数据的处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 1107, block a, Nongke building, No. 11, Shuguang garden middle road, Haidian District, Beijing, 100097

Applicant after: Information technology research center of Beijing Academy of agricultural and Forestry Sciences

Address before: 1107, block a, Nongke building, No. 11, Shuguang garden middle road, Haidian District, Beijing, 100097

Applicant before: BEIJING RESEARCH CENTER FOR INFORMATION TECHNOLOGY IN AGRICULTURE

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant