CN113868818A

CN113868818A - 一种区域数据点栅格化区块大小确定方法及系统

Info

Publication number: CN113868818A
Application number: CN202111192314.2A
Authority: CN
Inventors: 陈芋志; 王涛; 周旦; 赵红专; 李文勇
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2021-10-13
Filing date: 2021-10-13
Publication date: 2021-12-31
Anticipated expiration: 2041-10-13
Also published as: CN113868818B

Abstract

本发明公开一种区域数据点栅格化区块大小确定方法及系统，通过创建基础数据信息，利用区块划分方式、区块位置识别、数据点所属区块识别、区块点数计算、区域内含点区块数计算等方法构建初始数据集；再采用所提出非递减剔除迭代法清洗初始数据集，从而可以采用9阶多项式拟合生成含点区块数量与区块边长之间的函数关系式；最后利用其曲线切线斜率变化函数求解确定最优的区块边长确定了最优区块大小。弥补现有空间栅格化技术在随意主观的确定区块划分大小的不足，填补了在寻找最优区块大小上费时费力的缺陷，为空间栅格化技术的区块大小确定提供可靠的理论依据，有利于经空间栅格化技术处理后的栅格划分效果更好的适应区域和数据点的空间分布特征。

Description

一种区域数据点栅格化区块大小确定方法及系统

技术领域

本发明涉及栅格化空间分析技术领域，尤其涉及一种区域数据点栅格化区块大小确定方法及系统。

背景技术

随着栅格化空间分析技术的快速发展，其在城市规划、土地利用规划、道路网交通流、道路事故黑点分析等领域应用广泛，特别是对于现今智能交通的相关研究和实践应用达到了前所未有的高潮。越来越多的学者在研究大范围交通问题时，时常采用栅格化空间分析技术，将所研究的区域范围切分为一个个的小区块，继而分析所持有的数据点在各个小区块的分布特性，以此推测出各个区块的性质，最后通过各个区块特性分析研究对象在整个研究区域的分布性质。在城市规划和土地利用规划中，栅格化空间分析技术常被用于对现有城市区域的土地利用性质的划分；在道路网交通流的研究中，常被应用于对道路线网的切分，从而计算区块内局部交通流特性，再基于此采用图像处理等技术对交通流进行估计、预测等；在道路事故分析研究中，栅格化空间分析技术常被应用于对事故数据所覆盖区域的划分，通过统计各个区块内的事故频率、严重程度等性质，从而挖掘区域范围内的事故风险黑点。

虽然栅格化空间分析技术应用越来越广泛，但是其中的区块大小的确定却没有一个有效的方法支撑，通常人们采用的是主观的选取多个区块大小的值，以试错的方式选取出其中主观意义上觉得满意的区块大小值。然而，这种方法不仅耗时费力，而且主观性很强，其理想的结果也只能获得一种较优值，而不是最优值。

针对上述这种情况，本发明提出了一种区域数据点栅格化区块大小确定方法及系统。通过建立含点区块数量与栅格化区块边长(可表征方形区块大小)之间的函数关系式，求解关键点从而确定最优区块大小。这将为栅格化空间分析技术中区块大小的确定，提供一种便捷且有效的科学方法。

发明内容

针对现有技术的不足，本发明提供了一种区域数据点栅格化区块大小确定方法及系统，以解决现有技术存在的以上问题，其具体方案如下：

第一方面，本发明提供了一种区域数据点栅格化区块大小确定方法，所述方法包括：

创建基础数据信息，所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y＝f(X)、初始数据集表示、采样方法；

构建初始数据集，所述初始数据集构建方式包括：确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算，从而构建用于拟合Y＝f(X)的初始数据集；

清洗初始数据集，采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据，从而获得清洗后的可用数据集并可直接用于Y＝f(X)曲线拟合；

Y＝f(X)曲线拟合，根据所述可用数据集二维散点分布特征，确定polynomial拟合法和Levenberg-Marquardt优化方法，以9阶多项式一般式拟合曲线，并求解出该曲线的数值表达式；

确定最优区块大小，根据Y＝f(X)曲线变化特征确定最优区块边长点性质，结合所述拟合曲线Y＝f(X)推导切线斜率函数曲线，建立求解公式，从而确定最优区块边长，即确定了最优区块大小。

优选地，所述创建基础数据信息，所述方法包括：

确定区块划分形式为：以研究区域的外切矩形为划分对象，以最大化形成方形区块为划分形式，区块边长代表区块大小；

获取N_a个数据点的位置数据，其中第k个数据点a_k的位置数据为

获取研究区域的外切矩形上、下、左、右的四方边界为Lat_min(上边界)，Lat_max(下边界)，Lon_min(左边界)，Lon_max(右边界)；

确定区块边长预设范围为待确定最优区块边长x_θ所属的定义域区间，该范围为：

[α_min,α_max]，x_θ∈[α_min,α_max]

其中，α_max为预设区块边长的最大值，α_min为预设区块边长的最小值；

预定义含点区块数(Y)与区块边长值(X)之间的关系为：

Y＝f(X)，X∈[α_min,α_max]

在数据点数无穷大的条件下，X和Y的取值是连续的；根据实际的有限数据可计算初始数据集D_o＝(X_o,Y_o)＝{(x_i,y_i)|x_i∈X,y_i∈Y}为离散的采样数据，采样方法为：设定一个步长s(长度单位为米)，基于所采集的数据点x_i的取值为：

优选地，所述构建初始数据集，所述方法包括：

区块划分方法，根据采用的x_i的取值，可计算所划分道路线网的区块数量为：

N＝N_h×N_v

其中，N_h为矩形区域内所划分区块的列数，N_h为矩形区域内所划分区块的行数，二者的计算公式为：

则所构建的区块集合为：

B＝{b_ij},i＝1,2,…,N_v；k＝1,2,…,J_h

其中b_ij表示矩形区域内所有区块中第i行第j列的区块；

区块位置识别，根据所述区块划分方法的划分结果，以各区块的中心点位置确定各区块位置，即区块b_ij的位置为：

b_ij＝(Lat_i,Lon_j)

Lat_i＝(i-0.5)·x_i+Lat_min

Lon_j＝(j-0.5)·x_i+Lon_min

数据点所属区块识别，结合所属区块位置识别结果，根据数据点位置数据匹配数据点所属区块，即数据点a_k所属区块

为：

其中，

为数据点a_k的第一个位置数据，

为数据点a_k的第二个位置数据。

优选地，所述方法还包括区块数据点数计算，依据所述数据点所属区块识别结果，统计各个区块内的数据点数量，区块b_ij上的事故点数量

为：

其中，I(a_k∈b_ij)为指示函数，当数据点a_k属于区块b_ij时取值为1，当数据点a_k不属于区块b_ij时取值为0。

优选地，所述方法还包括区域内含点区块数计算，依据所述的区块数据点数计算结果计算矩形区域范围内含有数据点的区块数量，计算公式为：

其中，y_i为在区块边长预设为x_i时,矩形区域范围内含数据点的区块数量；Ψ(x_i)为区块边长x_i与区域内含点区块数y_i之间的关系函数；

为指示函数，当区块b_vh不包含数据点时取值为1，当区块b_vh包含数据点时取值为0。

优选地，所述非递减剔除迭代法，是基于曲线Y＝f(X)的递减特性，每一次迭代剔除数据集D中y_i≥y_i-1时的数据(x_i,y_i)，不断迭代更新数据集D，直至D中不存在y_i≥y_i-1的情况；

所述非递减剔除迭代法，其计算方法为：

其中，D^γ为每次迭代后生成的新的数据集；D^θ为迭代完成后满足要求的数据集，即清洗完成后的数据集；

为进行第γ迭代时，数据集D^γ-1中的数据点；

表示为空集。

优选地，所述Y＝f(X)曲线拟合，利用所述清洗初始数据集得到的数据集D^θ；其中，9阶多项式左半部分与曲线Y＝f(X)具有相似性质，所以Y＝f(X)的一般式为：

f(x)＝β₀+β₁x+β₂x²+β₃x³+β₄x⁴+β₅x⁵+β₆x⁶+β₇x⁷+β₈x⁸+β₉x⁹

其中，β₀、β₁、β₂、β₃、β₄、β₅、β₆、β₇、β₈、β₉为函数f(x)的参数项；

基于所述Y＝f(X)的一般式，采用polynomial拟合法，结合Levenberg-Marquardt优化方法，求解参数，拟合曲线Y＝f(X)，其表达式为：

f(x)＝818.54663+-1.16537x+9.34931×10^-4x²-4.42708×10^-7x³+1.27003×10^- ¹⁰x⁴-2.25314×10^-14x⁵+2.61851×10^-18x⁶-2.38309×10^-22x⁷+1.91029×10^-26x⁸-8.68307×10^-31x⁹

优选地，所述确定最优区块大小，其确定依据主要考虑曲线Y＝f(X)的变化特征，其变化特征为：由于Y＝f(X)为单调递增函数，在定义域[α_min,α_max]范围内，其曲线在点(x_θ,y_θ)之前急速降低，在点(x_θ,y_θ)之后缓慢降低；

所述变化特征采用曲线Y＝f(X)的切线斜率函数曲线表示，其一般式为：

f′(x)＝β₁+2β₂x+3β₃x²+4β₄x³+5β₅x⁴+6β₆x⁵+7β₇x⁶+8β₈x⁷+9β₉x⁸

其表达式为：

f′(x)＝-1.16537+1.869862×10^-3x-1.328124×10^-6x²+5.08012×10^-10x³-1.12657×10^-13x⁴+1.571106×10^-17x⁵-1.668163×10^-21x⁶+1.528232×10^-25x⁷-7.814763×10^-30x⁸

优选地，所述方法还包括利用所述变化特征和所述的切线斜率函数曲线确定最优区块边长x_θ所在点的切线斜率，从而构建点(x_θ,y_θ)的求解方程，确定最优区块边长x_θ；

所述点(x_θ,y_θ)的求解方程的基本公式为：

其半数值公式为：

第二方面，本发明提供了一种区域数据点栅格化区块大小确定系统，所述系统包括；

创建模块，用于创建基础数据信息，所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y＝f(X)、初始数据集表示、采样方法；

构建模块，用于构建初始数据集，所述初始数据集构建方式包括：确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算，从而构建用于拟合Y＝f(X)的初始数据集；

清洗模块，用于清洗初始数据集，采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据，从而获得清洗后的可用数据集并可直接用于Y＝f(X)曲线拟合；

拟合模块，用于Y＝f(X)曲线拟合，根据所述可用数据集二维散点分布特征，确定polynomial拟合法和Levenberg-Marquardt优化方法，以9阶多项式一般式拟合曲线，并求解出该曲线的数值表达式；

确定模块，用于确定最优区块大小，根据Y＝f(X)曲线变化特征确定最优区块边长点性质，结合所述拟合曲线Y＝f(X)推导切线斜率函数曲线，建立求解公式，从而确定最优区块边长，即确定了最优区块大小。

第三方面，本发明提供了一种区域数据点栅格化区块大小确定设备，所述设备包括：

通信总线，用于实现处理器与存储器间的连接通信；

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序以实现如下步骤：

第四方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的方法。

本发明的有益效果：本发明的一种区域数据点栅格化区块大小确定方法及系统，通过建立含点区块数量与可表征方形区块大小的栅格化区块边长之间的函数关系式，求解关键点从而确定最优区块大小。主要通过创建基础数据信息，利用区块划分方式、区块位置识别、数据点所属区块识别、区块点数计算、区域内含点区块数计算等方法构建初始数据集。再采用所提出非递减剔除迭代法清洗初始数据集，从而可以采用9阶多项式拟合生成含点区块数量与区块边长(之间的函数关系式。最后利用其曲线切线斜率变化函数求解确定最优的区块边长，即确定了最优区块大小。该方法的提出将弥补现有空间栅格化技术在随意主观的确定区块划分大小的不足，也填补了在寻找最优区块大小上费时费力的缺陷。该方法的提出将进一步为空间栅格化技术的区块大小确定提供可靠的理论依据，有利于经空间栅格化技术处理后的栅格划分效果更好的适应区域和数据点的空间分布特征。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，附图中的实施例不构成对本发明的任何限制，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一种区域数据点栅格化区块大小确定方法一实施例流程示意图。

图2是本发明一种区域数据点栅格化区块大小确定系统一实施例结构示意图。

图3是本发明一种区域数据点栅格化区块大小确定设备一实施例结构示意图。

具体实施方式

下面结合附图与实施例对本发明技术方案作进一步详细的说明，这是本发明的较佳实施例。应当理解，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例；需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例技术方案的主要思想：创建基础数据信息，所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y＝f(X)、初始数据集表示、采样方法；构建初始数据集，所述初始数据集构建方式包括：确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算，从而构建用于拟合Y＝f(X)的初始数据集；清洗初始数据集，采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据，从而获得清洗后的可用数据集并可直接用于Y＝f(X)曲线拟合；Y＝f(X)曲线拟合，根据所述可用数据集二维散点分布特征，确定polynomial拟合法和Levenberg-Marquardt优化方法，以9阶多项式一般式拟合曲线，并求解出该曲线的数值表达式；确定最优区块大小，根据Y＝f(X)曲线变化特征确定最优区块边长点性质，结合所述拟合曲线Y＝f(X)推导切线斜率函数曲线，建立求解公式，从而确定最优区块边长，即确定了最优区块大小。

为了更好的理解上述的技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

实施例一

本发明一实施例提供了一种区域数据点栅格化区块大小确定方法，如图1所示，该方法具体可以包括如下步骤：

步骤S101，创建基础数据信息，所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y＝f(X)、初始数据集表示、采样方法。

在本发明申请实施例中，所述创建基础数据信息，所述方法具体地可以包括：

[α_min,α_max]，x_θ∈[α_min,α_max]

预定义含点区块数(Y)与区块边长值(X)之间的关系为：

Y＝f(X)，X∈[α_min,α_max]

步骤S102，构建初始数据集，所述初始数据集构建方式包括：确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算，从而构建用于拟合Y＝f(X)的初始数据集。

在本发明申请实施例中，所述建初始数据集，所述方法具体地可以包括：

N＝N_h×N_v

则所构建的区块集合为：

B＝{b_ij},i＝1,2,…,N_v；j＝1,2,…,N_h

其中b_ij表示矩形区域内所有区块中第i行第j列的区块；

b_ij＝(Lat_i,Lon_j)

Lat_i＝(i-0.5)·x_i+Lat_min

Lon_j＝(j-0.5)·x_i+Lon_min

为：

其中，

为数据点a_k的第一个位置数据，

为数据点a_k的第二个位置数据。

在一个可选实施例中，所述方法具体还可以包括区块数据点数计算，依据所述数据点所属区块识别结果，统计各个区块内的数据点数量，区块b_ij上的事故点数量

为：

在另一可选实施例中，所述方法具体还可以包括区域内含点区块数计算，依据所述的区块数据点数计算结果计算矩形区域范围内含有数据点的区块数量，计算公式为：

步骤S103，清洗初始数据集，采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据，从而获得清洗后的可用数据集并可直接用于Y＝f(X)曲线拟合。

作为示例，所述非递减剔除迭代法，是基于曲线Y＝f(X)的递减特性，每一次迭代剔除数据集D中y_i≥y_i-1时的数据(x_i,y_i)，不断迭代更新数据集D，直至D中不存在y_i≥y_i-1的情况；

所述非递减剔除迭代法，其计算方法为：

为进行第γ迭代时，数据集D^γ-1中的数据点；

表示为空集。

步骤S104，Y＝f(X)曲线拟合，根据所述可用数据集二维散点分布特征，确定polynomial拟合法和Levenberg-Marquardt优化方法，以9阶多项式一般式拟合曲线，并求解出该曲线的数值表达式。

在本发明申请实施例中，所述Y＝f(X)曲线拟合，利用所述清洗初始数据集得到的数据集D^θ；其中，9阶多项式左半部分与曲线Y＝f(X)具有相似性质，所以Y＝f(X)的一般式为：

步骤S105，确定最优区块大小，根据Y＝f(X)曲线变化特征确定最优区块边长点性质，结合所述拟合曲线Y＝f(X)推导切线斜率函数曲线，建立求解公式，从而确定最优区块边长，即确定了最优区块大小。

在本发明申请实施例中，所述确定最优区块大小，其确定依据主要考虑曲线Y＝f(X)的变化特征，其变化特征为：由于Y＝f(X)为单调递增函数，在定义域[α_min,α_max]范围内，其曲线在点(x_θ,y_θ)之前急速降低，在点(x_θ,y_θ)之后缓慢降低；

其表达式为：

在又一可选实施例中，所述方法具体还可以包括利用所述变化特征和所述的切线斜率函数曲线确定最优区块边长x_θ所在点的切线斜率，从而构建点(x_θ,y_θ)的求解方程，确定最优区块边长x_θ；

所述点(x_θ,y_θ)的求解方程的基本公式为：

其半数值公式为：

实施例二

本发明一实施例提供了一种区域数据点栅格化区块大小确定系统，如图2所示，所述系统具体可以包括如下模块：

创建模块，用于创建基础数据信息，所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y＝f(X)、初始数据集表示、采样方法。

[α_min,α_max]，x_θ∈[α_min,α_max]

预定义含点区块数(Y)与区块边长值(X)之间的关系为：

Y＝f(X)，X∈[α_min,α_max]

构建模块，用于构建初始数据集，所述初始数据集构建方式包括：确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算，从而构建用于拟合Y＝f(X)的初始数据集。

N＝N_h×N_v

则所构建的区块集合为：

B＝{b_ij},i＝1,2,…,N_v；j＝1,2,…,N_h

其中b_ij表示矩形区域内所有区块中第i行第j列的区块；

b_ij＝(Lat_i,Lon_j)

Lat_i＝(i-0.5)·x_i+Lat_min

Lon_j＝(j-0.5)·x_i+Lon_min

为：

其中，

为数据点a_k的第一个位置数据，

为数据点a_k的第二个位置数据。

为：

清洗模块，用于清洗初始数据集，采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据，从而获得清洗后的可用数据集并可直接用于Y＝f(X)曲线拟合。

所述非递减剔除迭代法，其计算方法为：

为进行第γ迭代时，数据集D^γ-1中的数据点；

表示为空集。

拟合模块，用于Y＝f(X)曲线拟合，根据所述可用数据集二维散点分布特征，确定polynomial拟合法和Levenberg-Marquardt优化方法，以9阶多项式一般式拟合曲线，并求解出该曲线的数值表达式。

其表达式为：

所述点(x_θ,y_θ)的求解方程的基本公式为：

其半数值公式为：

实施例三

本发明一实施例提供了一种区域数据点栅格化区块大小确定设备，如图3所示，所述设备具体可以包括如下模块：

通信总线，用于实现处理器与存储器间的连接通信；

存储器，用于存储计算机程序；存储器可能包含高速RAM存储器，也可能还包含非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器可选的可以包含至少一个存储装置。

处理器，用于执行上述计算机程序以实现如下步骤：

首先，创建基础数据信息，所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y＝f(X)、初始数据集表示、采样方法。

[α_min,α_max]，x_θ∈[α_min,α_max]

预定义含点区块数(Y)与区块边长值(X)之间的关系为：

Y＝f(X)，X∈[α_min,α_max]

其次，构建初始数据集，所述初始数据集构建方式包括：确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算，从而构建用于拟合Y＝f(X)的初始数据集。

N＝N_h×N_v

则所构建的区块集合为：

B＝{b_ij},i＝1,2,…,N_v；j＝1,2,…,N_h

其中b_ij表示矩形区域内所有区块中第i行第j列的区块；

b_ij＝(Lat_i,Lon_j)

Lat_i＝(i-0.5)·x_i+Lat_min

Lon_j＝(j-0.5)·x_i+Lon_min

为：

其中，

为数据点a_k的第一个位置数据，

为数据点a_k的第二个位置数据。

为：

然后，清洗初始数据集，采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据，从而获得清洗后的可用数据集并可直接用于Y＝f(X)曲线拟合。

所述非递减剔除迭代法，其计算方法为：

为进行第γ迭代时，数据集D^γ-1中的数据点；

表示为空集。

接着，Y＝f(X)曲线拟合，根据所述可用数据集二维散点分布特征，确定polynomial拟合法和Levenberg-Marquardt优化方法，以9阶多项式一般式拟合曲线，并求解出该曲线的数值表达式。

最后，确定最优区块大小，根据Y＝f(X)曲线变化特征确定最优区块边长点性质，结合所述拟合曲线Y＝f(X)推导切线斜率函数曲线，建立求解公式，从而确定最优区块边长，即确定了最优区块大小。

其表达式为：

所述点(x_θ,y_θ)的求解方程的基本公式为：

其半数值公式为：

本实施例中的处理器可能是一种集成电路芯片，具有信号处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。上述处理器可以是微处理器或者上述处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

实施例四

本发明一实施例提供了一种计算机可读存储介质，其上存储有计算机程序，上述计算机程序被处理器执行时实现上述的区域数据点栅格化区块大小确定方法。

综上所述，本发明实施例提供的一种区域数据点栅格化区块大小确定方法及系统，通过建立含点区块数量与可表征方形区块大小的栅格化区块边长之间的函数关系式，求解关键点从而确定最优区块大小。主要通过创建基础数据信息，利用区块划分方式、区块位置识别、数据点所属区块识别、区块点数计算、区域内含点区块数计算等方法构建初始数据集。再采用所提出非递减剔除迭代法清洗初始数据集，从而可以采用9阶多项式拟合生成含点区块数量与区块边长(之间的函数关系式。最后利用其曲线切线斜率变化函数求解确定最优的区块边长，即确定了最优区块大小。该方法的提出将弥补现有空间栅格化技术在随意主观的确定区块划分大小的不足，也填补了在寻找最优区块大小上费时费力的缺陷。该方法的提出将进一步为空间栅格化技术的区块大小确定提供可靠的理论依据，有利于经空间栅格化技术处理后的栅格划分效果更好的适应区域和数据点的空间分布特征。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本发明所必须的。

上述实施例，可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时，上述实施例可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行该计算机程序指令时，全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质。半导体介质可以是固态硬盘。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明是参照本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种区域数据点栅格化区块大小确定方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述创建基础数据信息，所述方法包括：

[α_min，α_max]，x_θ∈[α_min，α_max]

预定义含点区块数(Y)与区块边长值(X)之间的关系为：

Y＝f(X)，X∈[α_min，α_max]

在数据点数无穷大的条件下，X和Y的取值是连续的；根据实际的有限数据可计算初始数据集D_o＝(X_o，Y_o)＝{(x_i，y_i)|x_i∈X，y_i∈Y}为离散的采样数据，采样方法为：设定一个步长s(长度单位为米)，基于所采集的数据点x_i的取值为：

3.根据权利要求1所述的方法，其特征在于，所述构建初始数据集，所述方法包括：

N＝N_h×N_v

则所构建的区块集合为：

B＝{b_ij}，i＝1，2，...，N_v；j＝1，2，...，N_h

其中b_ij表示矩形区域内所有区块中第i行第j列的区块；

b_ij＝(Lat_i，Lon_j)

Lat_i＝(i-0.5)·x_i+Lat_min

Lon_j＝(j-0.5)·x_i+Lon_min

为：

其中，

为数据点a_k的第一个位置数据，

为数据点a_k的第二个位置数据。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括区块数据点数计算，依据所述数据点所属区块识别结果，统计各个区块内的数据点数量，区块b_ij上的事故点数量

为：

5.根据权利要求3所述的方法，其特征在于，所述方法还包括区域内含点区块数计算，依据所述的区块数据点数计算结果计算矩形区域范围内含有数据点的区块数量，计算公式为：

其中，y_i为在区块边长预设为x_i时，矩形区域范围内含数据点的区块数量；Ψ(x_i)为区块边长x_i与区域内含点区块数y_i之间的关系函数；

6.根据权利要求1所述的方法，其特征在于，所述非递减剔除迭代法，是基于曲线Y＝f(X)的递减特性，每一次迭代剔除数据集D中y_i≥y_i-1时的数据(x_i，y_i)，不断迭代更新数据集D，直至D中不存在y_i≥y_i-1的情况；

所述非递减剔除迭代法，其计算方法为：

为进行第γ迭代时，数据集D^γ-1中的数据点；

表示为空集。

7.根据权利要求1所述的方法，其特征在于，所述Y＝f(X)曲线拟合，利用所述清洗初始数据集得到的数据集D^θ；其中，9阶多项式左半部分与曲线Y＝f(X)具有相似性质，所以Y＝f(X)的一般式为：

f(x)＝818.54663+-1.16537x+9.34931×10^-4x²-4.42708×10^-7x³+1.27003×10^-10x⁴-2.25314×10^-14x⁵+2.61851×10^-18x⁶-2.38309×10^-22x⁷+1.91029×10^-26x⁸-8.68307×10^-31x⁹

8.根据权利要求1所述的方法，其特征在于，所述确定最优区块大小，其确定依据主要考虑曲线Y＝f(X)的变化特征，其变化特征为：由于Y＝f(X)为单调递增函数，在定义域[α_min，α_max]范围内，其曲线在点(x_θ，y_θ)之前急速降低，在点(x_θ，y_θ)之后缓慢降低；

其表达式为：

f′(x)＝-1.16537+1.869862×10^-3x-1.328124×10^-6x²+5.08012×10^-10x³-1.12657×10^-13x⁴+1.571106×10^-17x⁵-1.668163×10^-21x⁶+1.528232×10^-25x⁷-7.814763×10^-30x⁸。

9.根据权利要求8所述的方法，其特征在于，所述方法还包括利用所述变化特征和所述的切线斜率函数曲线确定最优区块边长x_θ所在点的切线斜率，从而构建点(x_θ，y_θ)的求解方程，确定最优区块边长x_θ；

所述点(x_θ，y_θ)的求解方程的基本公式为：

其半数值公式为：

10.一种区域数据点栅格化区块大小确定系统，其特征在于，所述系统包括；