CN111122222B - 一种样本点位置确定方法及系统 - Google Patents

一种样本点位置确定方法及系统 Download PDF

Info

Publication number
CN111122222B
CN111122222B CN201911348833.6A CN201911348833A CN111122222B CN 111122222 B CN111122222 B CN 111122222B CN 201911348833 A CN201911348833 A CN 201911348833A CN 111122222 B CN111122222 B CN 111122222B
Authority
CN
China
Prior art keywords
sparse
sample point
region
preset
encrypted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911348833.6A
Other languages
English (en)
Other versions
CN111122222A (zh
Inventor
董士伟
潘瑜春
郝星耀
郜允兵
李淑华
黄坤
王怡蓉
唐柜彪
肖聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Research Center for Information Technology in Agriculture
Original Assignee
Beijing Research Center for Information Technology in Agriculture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Research Center for Information Technology in Agriculture filed Critical Beijing Research Center for Information Technology in Agriculture
Priority to CN201911348833.6A priority Critical patent/CN111122222B/zh
Publication of CN111122222A publication Critical patent/CN111122222A/zh
Application granted granted Critical
Publication of CN111122222B publication Critical patent/CN111122222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/02Devices for withdrawing samples
    • G01N1/04Devices for withdrawing samples in the solid state, e.g. by cutting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Pathology (AREA)
  • Operations Research (AREA)
  • Immunology (AREA)
  • Algebra (AREA)
  • Biochemistry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)

Abstract

本发明提供一种样本点位置确定方法及系统,该方法包括:根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数;根据每一预设样本点的稀疏指数,获取若干稀疏区域;对于任一稀疏区域,根据所述任一稀疏区域与其它稀疏区域之间的位置关系,确定在任一稀疏区域中增加的加密样本点的位置。本发明提供一种样本点位置确定方法及系统,首先从采样区域中获取预设样本点局部分布不均匀的稀疏区域,根据稀疏区域中目标稀疏样本点的位置和该目标稀疏样本点所在泰森多边形,确定稀疏区域中每个加密样本点的位置,从而提高了采样区域中样本点的均匀性和代表性。

Description

一种样本点位置确定方法及系统
技术领域
本发明涉及采样技术领域,尤其涉及一种样本点位置确定方法及系统。
背景技术
空间采样是调查土壤属性空间变异和空间制图的重要方式。样本点的空间分布分为均匀分布和不均匀分布两种,其中不均匀分布又包含聚集分布和稀疏分布。聚集分布是指样本点空间分布成聚集状的空间分布格局,稀疏分布是指样本点空间分布成稀疏状的空间分布格局。在空间采样中,样本点是否均匀分布是区域样本点数据质量评价的重要指标,也是样本点数据分析挖掘的关键因素。然而,目前存在的样本点数据大多数无法保证样本点在采样区域中的均匀分布,存在样本点局部分布稀疏的情景,影响了样本点均匀性和代表性,增加了样本点数据分析的不确定性。
在稀疏区域中增加样本点可以提高样本点均匀性和代表性。目前现有技术中,增加样本点方法主要是在稀疏区域内随机加密布点和基于历史时期样本点数据加密布点。
随机加密布点无法准确确定样本点空间位置,基于历史时期样本点数据加密布点容易受到历史样本点位置的限制无法达到全局最优,因此,亟需一种样本点位置确定方法。
发明内容
为了解决上述问题,本发明提供一种样本点位置确定方法及系统。
第一方面,本发明提供一种样本点位置确定方法,包括:
S1,根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定;
S2,根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,将每一稀疏样本点所在的泰森多边形分别作为一个稀疏区域;
S3,对于任一稀疏区域,目标稀疏样本点为所述任一稀疏区域中的稀疏样本点,若判断获知所述任一稀疏区域与其它稀疏区域均相离,则在所述任一稀疏区域中增加一个加密样本点,对于所述目标稀疏样本点对应的加密样本点,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,并将所述加密样本点作为一个预设样本点;
S4,若判断获知所述任一稀疏区域只与一个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与所述相邻稀疏区域的公共边中点位置增加一个加密样本点;若判断获知所述任一稀疏区域与多个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与每一相邻稀疏区域的公共边中点位置都增加一个加密样本点,并将所有加密样本点作为预设样本点;
S5,重复步骤S1至S4,直至所述采样区域中不存在稀疏样本点为止,根据最后获得的每一预设样本点的位置,进行采样。
优选地,步骤S2中,所述根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,具体包括:
对于任一预设样本点,确定所述任一预设样本点的稀疏指数大于预设阈值,则将所述任一预设样本点作为稀疏样本点。
优选地,步骤S2中,所述根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,具体包括:
按照稀疏指数从小到大的顺序对每一预设样本点进行排序,并获取稀疏曲线;
将所述稀疏曲线末端的突变点作为稀疏样本点。
优选地,步骤S3中,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,具体计算公式如下:
Φ(x)=Dmax(xi,yij),
其中,Φ(x)表示所述加密样本点的位置,xi表示第i个目标稀疏样本点,yij为第i个目标稀疏样本点所在泰森多边形的第j条边上的中点,Dmax(xi,yij)表示xi和yij之间的最大距离。
优选地,步骤S1中,所述根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,具体包括:
Figure BDA0002334133220000031
其中,Pi表示第i个预设样本点的稀疏指数,Si表示第i个预设样本点所在泰森多边形的面积,Sa表示所述平均采样面积。
优选地,步骤S1中,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定,具体为:
将所述采样区域的面积和所有预设样本点的个数的比值作为所述平均采样面积。
第二方面,本发明提供一种样本点位置确定系统,包括:
稀疏指数模块,用于根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定;
稀疏样本点模块,用于根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,将每一稀疏样本点所在的泰森多边形分别作为一个稀疏区域;
相离模块,用于对于任一稀疏区域,目标稀疏样本点为所述任一稀疏区域中的稀疏样本点,若判断获知所述任一稀疏区域与其它稀疏区域均相离,则在所述任一稀疏区域中增加一个加密样本点,对于所述目标稀疏样本点对应的加密样本点,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,并将所述加密样本点作为一个预设样本点;
相邻模块,用于若判断获知所述任一稀疏区域只与一个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与所述相邻稀疏区域的公共边中点位置增加一个加密样本点;若判断获知所述任一稀疏区域与多个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与每一相邻稀疏区域的公共边中点位置都增加一个加密样本点,并将所有加密样本点作为预设样本点;
控制模块,用于控制上述模块重复执行,直至所述采样区域中不存在稀疏样本点为止,根据最后获得的每一预设样本点的位置,进行采样。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现本发明第一方面提供的一种样本点位置确定方法的步骤。
第四方面,本发明提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本发明第一方面提供的一种样本点位置确定方法的步骤。
本发明提供一种样本点位置确定方法及系统,首先从采样区域中获取预设样本点局部分布不均匀的稀疏区域,根据稀疏区域中目标稀疏样本点的位置和该目标稀疏样本点所在泰森多边形,确定稀疏区域中每个加密样本点的位置,从而提高了采样区域中样本点的均匀性和代表性,降低了样本点分布稀疏引起的不确定性,以保证样本点数据具体分析与实际应用的准确性和可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种样本点位置确定方法流程图;
图2为本发明实施例中的原始稀疏曲线图;
图3为本发明实施例中相离模式下加密样本点的位置示意图;
图4为本发明实施例中相邻模式下加密样本点的位置示意图;
图5为本发明实施例中重新生成的稀疏曲线的示意图;
图6为本发明实施例提供的一种样本点位置确定系统的结构图;
图7为本发明实施例提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种样本点位置确定方法流程图,如图1所示,该方法包括:
S1,根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定;
S2,根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,将每一稀疏样本点所在的泰森多边形分别作为一个稀疏区域;
S3,对于任一稀疏区域,目标稀疏样本点为所述任一稀疏区域中的稀疏样本点,若判断获知所述任一稀疏区域与其它稀疏区域均相离,则在所述任一稀疏区域中增加一个加密样本点,对于所述目标稀疏样本点对应的加密样本点,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,并将所述加密样本点作为一个预设样本点;
S4,若判断获知所述任一稀疏区域只与一个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与所述相邻稀疏区域的公共边中点位置增加一个加密样本点;若判断获知所述任一稀疏区域与多个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与每一相邻稀疏区域的公共边中点位置都增加一个加密样本点,并将所有加密样本点作为预设样本点;
S5,重复步骤S1至S4,直至所述采样区域中不存在稀疏样本点为止,根据最后获得的每一预设样本点的位置,进行采样。
在对某些区域进行采样的过程中,经常会出现采样点不均匀分布的情况,常见的采样点不均匀分布有聚集分布和稀疏分布两种类型,聚集分布是指采样点空间分布成聚集状的空间分布格局,存在采样点都集中在区域一个地方的情况,从而导致这些采样点无法很好的代表该区域的特性;稀疏分布是指采样点空间分布成稀疏状的空间分布格局,此种情况下,采样点也不能很好的表示该区域的特性。本发明实施例提供的样本点位置确定方法适用于样本点稀疏分布的情况。
首先,对于采样区域中已经存在的每个预设样本点,确定每个预设样本点对应的泰森多边形,每个预设样本点分别对应一个泰森多边形。泰森多边形是一组由连接两邻点线段的垂直平分线组成的连续多边形组成。一个泰森多边形内的任一点到构成该多边形的控制点的距离小于到其他多边形控制点的距离。每个预设样本点对应的泰森多边形可由ArcGIS软件生成。
然后计算该采样区域中的平均采样面积,平均采样面积是根据采样区域的面积和预设样本点的个数确定,然后根据平均采样面积和每个预设样本点所对应的泰森多边形面积,计算每个预设样本点的稀疏指数。
稀疏指数表示预设样本点的稀疏程度,值越大表示预设样本点局部分布越趋于稀疏,反之,局部分布越趋于均匀。
然后根据每个预设样本点的稀疏指数,从所有预设样本点中选取一个或者多个预设样本点,将这些预设样本点作为稀疏样本点,稀疏样本点表示该局部采样区域内样本点分布不均匀的情况比较严重,需要在该稀疏样本点的周围增加样本点,从而使得这个局部采样区域内样本点分布更加均匀。
为了确定增加的样本点的位置,本发明实施例中将每个稀疏样本点所在泰森多边形分别作为一个稀疏区域,也就是每个稀疏样本点都分别对应一个稀疏区域。
以其中一个稀疏区域为例进行说明,如果该稀疏区域与其它所有的稀疏区域都相离,泰森多边形之间的位置关系有相邻和相离两种模式,两个泰森多边形相邻是指这两个泰森多边形之间有一条公共边,两个泰森多边形相离是指这两个泰森多边形之间没有公共边,只有一个泰森多边形可以看作相离模式,两个以上泰森多边形可以划分为相邻、相离模式的不同组合。公共边为两个泰森多边形共有的边。
当需要在该稀疏区域中增加样本点时,需要根据该稀疏区域中目标稀疏样本点的位置来确定增加的样本点的位置,目标稀疏样本点是指该稀疏区域中存在的稀疏样本点,增加的样本点称为加密样本点。
对于该稀疏区域中的目标稀疏样本点,通过该目标稀疏样本点所在的泰森多边形和该目标稀疏样本点的位置,来确定该目标稀疏样本点对应的加密样本点的位置,该加密样本点是为了增加该目标稀疏样本点所在局部采样区域的均匀性而增加的。在该相离模式下,一个稀疏区域中只有一个目标稀疏样本点,从而只需要在该稀疏区域中增加一个加密样本点。
如果该稀疏区域与另外一个稀疏区域相邻,本发明实施例中,将另外一个稀疏区域称为相邻稀疏区域。
当需要在该稀疏区域中增加样本点时,如果该稀疏区域只有一个相邻稀疏区域,在该稀疏区域与该相邻稀疏区域的公共边的中点位置增加一个加密样本点,如果该稀疏区域有多个相邻稀疏区域,在该稀疏区域与每个相邻稀疏区域的公共边的中点位置都增加一个加密样本点。公共边为该稀疏区域和相邻稀疏区域共有的边。
通过在该稀疏区域的公共边的中点位置增加样本点,可以同时改善该稀疏区域和相邻稀疏区域中预设样本点分布的均匀性。
如果该稀疏区域只有一个相邻稀疏区域,则在该稀疏区域中只增加一个加密样本点,如果该稀疏区域与多个稀疏区域相邻,则该稀疏区域存在多个相邻稀疏区域,该稀疏区域与每个相邻稀疏区域的公共边的中点位置都增加一个加密样本点。
在实际采样过程中,由于只需要增加少量样本点,就可以同时提高稀疏区域中样本点分布的均匀性,也降低了采样的工作量,提高了采样的效率。
对于其它稀疏区域,采用相同的方法确定该稀疏区域中所有加密样本点的位置。此为一个迭代过程,在该迭代过程后,将增加的加密样本点重新作为预设样本点,然后重新计算每个预设样本点对应的泰森多边形,重复上面的过程,直到采样区域中没有稀疏样本点为止。
在确定每个加密样本点的位置之后,根据采样区域中所有预设样本点的位置,对每个位置都进行一次采样。
本发明实施例中通过对每个目标稀疏样本点增加对应的加密样本点,提高了每个目标稀疏样本点所在局部采样区域分布的均匀性,从而提高了整个稀疏区域样本点分布的均匀性,进一步提高了整个采样区域中样本点分布的均匀性。
在对该采样区域进行具体采样时,对每个预设样本点和每个加密样本点所在的位置都进行采样,从而提高了样本点的均匀性和代表性。
综上,本发明实施例提供一种样本点位置确定方法,首先从采样区域中获取预设样本点局部分布不均匀的稀疏区域,根据稀疏区域中目标稀疏样本点的位置和该目标稀疏样本点所在泰森多边形,确定稀疏区域中每个加密样本点的位置,从而提高了采样区域中样本点的均匀性和代表性,降低了样本点分布稀疏引起的不确定性,以保证样本点数据具体分析与实际应用的准确性和可靠性。
在上述实施例的基础上,优选地,所述根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,具体包括:
对于任一预设样本点,确定所述任一预设样本点的稀疏指数大于预设阈值,则将所述任一预设样本点作为稀疏样本点。
在上述实施例的基础上,优选地,所述根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,具体包括:
按照稀疏指数从小到大的顺序对每一预设样本点进行排序,并获取稀疏曲线;
将所述指稀疏曲线末端的突变点作为稀疏样本点。
具体地,确定稀疏样本点的方法包括以下两种方法:
第一、将每个预设样本点的稀疏指数和预设阈值进行比较,以其中任意一个预设样本点为例进行说明,如果该预设样本点的稀疏指数大于预设阈值,将该预设样本点作为稀疏样本点。
由于稀疏指数越大表示该预设样本点所在局部采样区域内样本点分布越不均匀,需要对该预设样本点的周围增加加密样本点,从而使得该预设样本点所在的局部采样区域内样本点分布更加均匀。
实际处理过程中,预设阈值的大小可以根据实际情况确定。
第二、将每个预设样本点的稀疏指数按照从小到大的顺序排列,然后将排列后生成的曲线作为稀疏曲线,将该稀疏曲线上末端的突变点作为稀疏样本点,该突变点也称为间断跳跃点,是指该稀疏曲线中突然发生变化的点,所谓突然发生变化,可以理解为突然偏离前面预设样本点的变化规律,偏离程度的大小可以根据实际情况确定。
在上述实施例的基础上,优选地,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,具体计算公式如下:
Φ(x)=Dmax(xi,yij), (1)
其中,Φ(x)表示所述加密样本点的位置,xi表示第i个目标稀疏样本点,yij为第i个目标稀疏样本点所在泰森多边形的第j条边上的中点,Dmax(xi,yij)表示xi和yij之间的最大距离。
具体地,对于任一稀疏区域中的目标稀疏样本点,该目标稀疏样本点对应的加密样本点通过上述公式(1)确定,从该公式中可以看出,加密样本点所在的位置为距离该目标稀疏样本点距离最大的、所在泰森多边形边的中点位置。如果距离该目标稀疏样本点距离最大的点有多个,可以从中任选一个作为加密样本点的位置。
在上述实施例的基础上,优选地,所述根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,具体包括:
Figure BDA0002334133220000101
其中,Pi表示第i个预设样本点的稀疏指数,Si表示第i个预设样本点所在泰森多边形的面积,Sa表示所述平均采样面积。
具体地,本发明实施例中,通过公式(2)确定每个预设样本点的稀疏指数,从公式(2)中可以看出,只有预设样本点所在泰森多边形的面积大于平均采样面积时,该预设样本点才有稀疏指数。
如果某个预设样本点所在的泰森多边形的面积等于平均采样面积,说明该预设样本点处于均匀分布;如果某个预设样本点所在的泰森多边形的面积小于平均采样面积,说明该预设样本点处于聚集分布,不需要在该预设样本点所在局部采样区域内加密样本点,本发明实施例提供的样本点位置确定方法适用于样本点稀疏分布的情况。
通过上述稀疏指数计算公式,对预设样本点进行初步均匀性的判断,减少了本方法的计算量,提高了计算效率。
在上述实施例的基础上,优选地,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定,具体为:
将所述采样区域的面积和所有预设样本点的个数的比值作为所述平均采样面积。
本发明实施例中,将采样区域的面积和预设样本点的个数之间的比值作为平均采样面积。
在本实施例中,以北京市一块农业用地污染监测为例,采样区域总面积为9km2,预设样本点总数量为1000个,计算获得样本点的平均采样面积Sa为9000m2。基于ArcGIS软件生成1000个预设样本点的泰森多边形,利用采样区域的农业用地边界空间裁切,并计算1000个预设样本点在采样区域的泰森多边形面积。
步骤1、按照公式(2),计算获取435个预设样本点的稀疏指数。
步骤2、采样区域内每个预设样本点的稀疏指数由小到大顺序排列生成稀疏曲线。在稀疏曲线上,寻找是否存在稀疏样本点。
所谓稀疏样本点是指稀疏曲线末端存在的间断跳跃点(突变点)或稀疏指数值大于预设阈值的预设样本点,稀疏样本点所在的泰森多边形为稀疏区域。若不存在稀疏样本点,则无需处理;若存在稀疏样本点,则需要在稀疏区域加密样本点。
在本实施例中,基于435个预设样本点的稀疏指数值,由小到大顺序排列生成稀疏曲线,图2为本发明实施例中的原始稀疏曲线图,如图2所示。
稀疏曲线末端存在3个间断跳跃点(突变点)或人工设置稀疏指数大于0.9(即预设阈值),则判断该采样区域存在3个稀疏样本点和相应的3个稀疏区域,在稀疏区域需要加密样本点。
步骤3、在采样区域内依据稀疏区域的空间位置关系,采用不同方法确定稀疏区域中加密样本点的空间位置。
其中,对于任意一个稀疏区域,如果该稀疏区域与其它稀疏区域都不相邻,可看作相离模式;如果该稀疏区域与其它至少一个稀疏区域相邻,可划分为相邻模式。
在本实施例中,3个稀疏区域(泰森多边形)的空间位置关系为其中两个相邻,另外1个与之相离,则该实施例中的所有稀疏区域存在一个相邻模式和一个相离模式。
步骤4、相离模式下稀疏区域中加密样本点空间位置根据公式(1)确定,相邻模式下稀疏区域中加密样本点空间位置具体为目标稀疏样本点所在泰森多边形与相邻泰森多边形公共边的中点位置,在该空间位置加密样本点。
图3为本发明实施例中相离模式下加密样本点的位置示意图,基于相离模式下稀疏区域中加密样本点空间位置计算公式(1),确定加密样本点空间位置为距离该稀疏样本点距离最大的所在泰森多边形边的中点位置,在该空间位置加密一个样本点如图3所示。
图4为本发明实施例中相邻模式下加密样本点的位置示意图,相邻模式下稀疏区域中加密样本点空间位置具体为稀疏样本点所在泰森多边形与相邻泰森多边形公共边的中点位置,只有一条公共边,在该公共边中点位置加密一个样本点如图4所示。
步骤5、重复执行步骤1至步骤4,直至采样区域内不存在稀疏样本点为止,确定采样区域中所有加密样本点的空间位置。
在本实施例中,重复迭代执行上述步骤,重新计算样本点稀疏指数,图5为本发明实施例中重新生成的稀疏曲线的示意图,如图5所示,没有发现稀疏样本点和稀疏区域,加密样本点空间位置确定过程终止。
获取采样区域中所有加密样本点的空间位置,共加密2个样本点,具体空间位置分别如图3和图4所示。
本发明提供的稀疏区域中加密样本点的空间位置确定方法,通过计算预设样本点的稀疏指数,构建稀疏曲线来确定采样区域中的稀疏样本点和稀疏区域,划分稀疏区域为相离模式和相邻模式,采用不同的方法确定加密样本点的空间位置,重复迭代上述过程来确定采样区域中所有加密样本点的空间位置,提高了样本点的均匀性和代表性,降低了样本点分布稀疏引起的不确定性,以保证样本点数据具体分析与实际应用的准确性和可靠性。该方法操作简单,易推广,具有很好的应用价值。
图6为本发明实施例提供的一种样本点位置确定系统的结构图,如图6所示,该系统包括:稀疏指数模块601、稀疏样本点模块602、相离模块603、相邻模块604和控制模块605,其中:
稀疏指数模块601用于根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定;
稀疏样本点模块602用于根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,将每一稀疏样本点所在的泰森多边形分别作为一个稀疏区域;
相离模块603用于对于任一稀疏区域,目标稀疏样本点为所述任一稀疏区域中的稀疏样本点,若判断获知所述任一稀疏区域与其它稀疏区域均相离,则在所述任一稀疏区域中增加一个加密样本点,对于所述目标稀疏样本点对应的加密样本点,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,并将所述加密样本点作为一个预设样本点;
相邻模块604用于若判断获知所述任一稀疏区域只与一个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与所述相邻稀疏区域的公共边中点位置增加一个加密样本点;若判断获知所述任一稀疏区域与多个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与每一相邻稀疏区域的公共边中点位置都增加一个加密样本点,并将所有加密样本点作为预设样本点;
控制模块605用于控制上述模块重复执行,直至所述采样区域中不存在稀疏样本点为止,根据最后获得的每一预设样本点的位置,进行采样。
具体地,稀疏指数模块601根据平均采样面积和每个预设样本点所在泰森多边形面积,计算每个预设样本点的稀疏指数,稀疏样本点模块602根据每个样本点的稀疏指数,选取出若干稀疏样本点,并将每个稀疏样本点所在的泰森多边形分别作为一个稀疏区域,相离模块603判断某个稀疏区域与其它稀疏区域是否为相离,如果为相离,按照相离模式增加加密样本点,相邻模块604判断某个稀疏区域与其它稀疏区域是否相邻,如果为相邻,按照相邻模式增加加密样本点,控制模块605控制稀疏指数模块、稀疏样本点模块、相离模块和相邻模块重复执行,直到采样区域中不存在稀疏样本点为止。在确定每个加密样本点的位置之后,根据采样区域中所有预设样本点的位置,对每个位置都进行一次采样。
本发明实施例提供的装置实施例是为了实现上述各方法实施例的,具体流程和详细内容请参照上述方法实施例,此处不再赘述。
图7为本发明实施例提供的一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)701、通信接口(Communications Interface)702、存储器(memory)703和通信总线(bus)704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信。通信接口702可以用于电子设备的信息传输。处理器701可以调用存储器703中的逻辑指令,以执行包括如下的方法:
S1,根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定;
S2,根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,将每一稀疏样本点所在的泰森多边形分别作为一个稀疏区域;
S3,对于任一稀疏区域,目标稀疏样本点为所述任一稀疏区域中的稀疏样本点,若判断获知所述任一稀疏区域与其它稀疏区域均相离,则在所述任一稀疏区域中增加一个加密样本点,对于所述目标稀疏样本点对应的加密样本点,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,并将所述加密样本点作为一个预设样本点;
S4,若判断获知所述任一稀疏区域只与一个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与所述相邻稀疏区域的公共边中点位置增加一个加密样本点;若判断获知所述任一稀疏区域与多个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与每一相邻稀疏区域的公共边中点位置都增加一个加密样本点,并将所有加密样本点作为预设样本点;
S5,重复步骤S1至S4,直至所述采样区域中不存在稀疏样本点为止,根据最后获得的每一预设样本点的位置,进行采样。
此外,上述的存储器703中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明上述各方法实施例的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:
S1,根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定;
S2,根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,将每一稀疏样本点所在的泰森多边形分别作为一个稀疏区域;
S3,对于任一稀疏区域,目标稀疏样本点为所述任一稀疏区域中的稀疏样本点,若判断获知所述任一稀疏区域与其它稀疏区域均相离,则在所述任一稀疏区域中增加一个加密样本点,对于所述目标稀疏样本点对应的加密样本点,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,并将所述加密样本点作为一个预设样本点;
S4,若判断获知所述任一稀疏区域只与一个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与所述相邻稀疏区域的公共边中点位置增加一个加密样本点;若判断获知所述任一稀疏区域与多个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与每一相邻稀疏区域的公共边中点位置都增加一个加密样本点,并将所有加密样本点作为预设样本点;
S5,重复步骤S1至S4,直至所述采样区域中不存在稀疏样本点为止,根据最后获得的每一预设样本点的位置,进行采样。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种样本点位置确定方法,其特征在于,包括:
S1,根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定;
S2,根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,将每一稀疏样本点所在的泰森多边形分别作为一个稀疏区域;
S3,对于任一稀疏区域,目标稀疏样本点为所述任一稀疏区域中的稀疏样本点,若判断获知所述任一稀疏区域与其它稀疏区域均相离,则在所述任一稀疏区域中增加一个加密样本点,对于所述目标稀疏样本点对应的加密样本点,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,并将所述加密样本点作为一个预设样本点;
S4,若判断获知所述任一稀疏区域只与一个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与所述相邻稀疏区域的公共边中点位置增加一个加密样本点;若判断获知所述任一稀疏区域与多个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与每一相邻稀疏区域的公共边中点位置都增加一个加密样本点,并将所有加密样本点作为预设样本点;
S5,重复步骤S1至S4,直至所述采样区域中不存在稀疏样本点为止,根据最后获得的每一预设样本点的位置,进行采样;
所述根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,具体包括:
Figure FDA0002686382170000021
其中,Pi表示第i个预设样本点的稀疏指数,Si表示第i个预设样本点所在泰森多边形的面积,Sa表示所述平均采样面积;
所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,具体计算公式如下:
Φ(x)=Dmax(xi,yij),
其中,Φ(x)表示所述加密样本点的位置,xi表示第i个目标稀疏样本点,yij为第i个目标稀疏样本点所在泰森多边形的第j条边上的中点,Dmax(xi,yij)表示xi和yij之间的最大距离。
2.根据权利要求1所述的样本点位置确定方法,其特征在于,步骤S2中,所述根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,具体包括:
对于任一预设样本点,确定所述任一预设样本点的稀疏指数大于预设阈值,则将所述任一预设样本点作为稀疏样本点。
3.根据权利要求1所述的样本点位置确定方法,其特征在于,步骤S2中,所述根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,具体包括:
按照稀疏指数从小到大的顺序对每一预设样本点进行排序,并获取稀疏曲线;
将所述稀疏曲线末端的突变点作为稀疏样本点。
4.根据权利要求1所述的样本点位置确定方法,其特征在于,步骤S1中,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定,具体为:
将所述采样区域的面积和所有预设样本点的个数的比值作为所述平均采样面积。
5.一种样本点位置确定系统,其特征在于,包括:
稀疏指数模块,用于根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,所述平均采样面积根据所述采样区域的面积和所有预设样本点的个数确定;
稀疏样本点模块,用于根据每一预设样本点的稀疏指数,从中选取若干预设样本点作为稀疏样本点,将每一稀疏样本点所在的泰森多边形分别作为一个稀疏区域;
相离模块,用于对于任一稀疏区域,目标稀疏样本点为所述任一稀疏区域中的稀疏样本点,若判断获知所述任一稀疏区域与其它稀疏区域均相离,则在所述任一稀疏区域中增加一个加密样本点,对于所述目标稀疏样本点对应的加密样本点,所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,并将所述加密样本点作为一个预设样本点;
相邻模块,用于若判断获知所述任一稀疏区域只与一个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与所述相邻稀疏区域的公共边中点位置增加一个加密样本点;若判断获知所述任一稀疏区域与多个其它稀疏区域相邻,将其它稀疏区域作为相邻稀疏区域,则在所述任一稀疏区域与每一相邻稀疏区域的公共边中点位置都增加一个加密样本点,并将所有加密样本点作为预设样本点;
控制模块,用于控制上述模块重复执行,直至所述采样区域中不存在稀疏样本点为止,根据最后获得的每一预设样本点的位置,进行采样;
所述根据平均采样面积和采样区域中每一预设样本点所在泰森多边形面积,获取每一预设样本点的稀疏指数,具体包括:
Figure FDA0002686382170000041
其中,Pi表示第i个预设样本点的稀疏指数,Si表示第i个预设样本点所在泰森多边形的面积,Sa表示所述平均采样面积;
所述加密样本点的位置根据所述目标稀疏样本点和所述目标稀疏样本点所在泰森多边形确定,具体计算公式如下:
Φ(x)=Dmax(xi,yij),
其中,Φ(x)表示所述加密样本点的位置,xi表示第i个目标稀疏样本点,yij为第i个目标稀疏样本点所在泰森多边形的第j条边上的中点,Dmax(xi,yij)表示xi和yij之间的最大距离。
6.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述样本点位置确定方法的步骤。
7.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至4任一项所述样本点位置确定方法的步骤。
CN201911348833.6A 2019-12-24 2019-12-24 一种样本点位置确定方法及系统 Active CN111122222B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911348833.6A CN111122222B (zh) 2019-12-24 2019-12-24 一种样本点位置确定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911348833.6A CN111122222B (zh) 2019-12-24 2019-12-24 一种样本点位置确定方法及系统

Publications (2)

Publication Number Publication Date
CN111122222A CN111122222A (zh) 2020-05-08
CN111122222B true CN111122222B (zh) 2020-11-27

Family

ID=70501762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911348833.6A Active CN111122222B (zh) 2019-12-24 2019-12-24 一种样本点位置确定方法及系统

Country Status (1)

Country Link
CN (1) CN111122222B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516731B (zh) * 2021-05-14 2022-03-01 北京市农林科学院信息技术研究中心 一种样本点数据精化方法及系统
CN113515758B (zh) * 2021-05-14 2022-03-01 北京市农林科学院信息技术研究中心 一种稀疏区域的样本点加密方法及系统
CN114814169A (zh) * 2022-04-27 2022-07-29 深圳市政科检测有限公司 一种环境检测用土壤重金属含量检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355626A (zh) * 2016-08-15 2017-01-25 南京师范大学 一种密度控制的平面区域自适应采样方法
CN110473459A (zh) * 2018-05-11 2019-11-19 兰州交通大学 基于网络Voronoi图的点群选取

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103823977A (zh) * 2014-02-25 2014-05-28 北京农业信息技术研究中心 一种从空间采样点数据集中检测奇异样点的方法
CN104239446B (zh) * 2014-09-01 2017-06-30 北京农业信息技术研究中心 一种利用辅助变量数据进行采样点布局的方法
US10267645B2 (en) * 2016-02-17 2019-04-23 International Business Machines Corporation Method, apparatus and product for efficient solution of nearest object problems
CN107705002B (zh) * 2017-09-21 2020-07-03 中国矿业大学(北京) 矿区土壤重金属含量采样点异常高值影响范围的确定方法
CN108228722B (zh) * 2017-12-08 2020-02-14 北京农业信息技术研究中心 破碎化区域采样点的地理空间分布均匀度检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355626A (zh) * 2016-08-15 2017-01-25 南京师范大学 一种密度控制的平面区域自适应采样方法
CN110473459A (zh) * 2018-05-11 2019-11-19 兰州交通大学 基于网络Voronoi图的点群选取

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于Voronoi图的森林资源监测体系抽样调查研究";林庆水;《绿色科技》;20181031(第19期);第98-100页 *
"基于Voronoi图的测度点状目标空间分布特征的方法";张红 等;《华中师范大学学报(自然科学版)》;20050930;第39卷(第3期);第422-426页 *

Also Published As

Publication number Publication date
CN111122222A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111122222B (zh) 一种样本点位置确定方法及系统
KR102170105B1 (ko) 신경 네트워크 구조의 생성 방법 및 장치, 전자 기기, 저장 매체
US8996504B2 (en) Plan caching using density-based clustering
Antunes et al. Knee/elbow estimation based on first derivative threshold
CN108228722B (zh) 破碎化区域采样点的地理空间分布均匀度检测方法
WO2017211150A1 (zh) 指纹数据入库处理方法及装置
CN112085125A (zh) 基于线性自学习网络的缺失值填补方法、存储介质及系统
CN114116828A (zh) 多维网络指标的关联规则分析方法、设备和存储介质
CN111512283A (zh) 数据库中的基数估算
CN113254472A (zh) 一种参数配置方法、装置、设备及可读存储介质
CN115859805A (zh) 基于混合加点准则的自适应序贯试验设计方法和装置
CN110287048B (zh) 数据异常检测方法和装置
TW202001701A (zh) 影像的量化方法及神經網路的訓練方法
CN110968835A (zh) 一种近似分位数计算方法及装置
CN113516731B (zh) 一种样本点数据精化方法及系统
CN114549062A (zh) 消费者偏好预测方法、系统、电子设备、存储产品
CN113515757B (zh) 一种基于线段优化的样本点加密方法及系统
CN109388428B (zh) 图层遍历方法、控制装置及数据处理系统
CN113515758B (zh) 一种稀疏区域的样本点加密方法及系统
CN114828124B (zh) 一种目标基站的确定方法及装置
CN112153685B (zh) Rrc故障检测方法和装置
CN117056663B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN113674411B (zh) 基于位姿图调整的建图方法及相关设备
CN115809404B (zh) 一种检测阈值计算方法、装置、存储介质及电子设备
US20230396564A1 (en) Information processing apparatus and information processing method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant