CN113868818A - 一种区域数据点栅格化区块大小确定方法及系统 - Google Patents

一种区域数据点栅格化区块大小确定方法及系统 Download PDF

Info

Publication number
CN113868818A
CN113868818A CN202111192314.2A CN202111192314A CN113868818A CN 113868818 A CN113868818 A CN 113868818A CN 202111192314 A CN202111192314 A CN 202111192314A CN 113868818 A CN113868818 A CN 113868818A
Authority
CN
China
Prior art keywords
block
data
curve
data set
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111192314.2A
Other languages
English (en)
Other versions
CN113868818B (zh
Inventor
陈芋志
王涛
周旦
赵红专
李文勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202111192314.2A priority Critical patent/CN113868818B/zh
Publication of CN113868818A publication Critical patent/CN113868818A/zh
Application granted granted Critical
Publication of CN113868818B publication Critical patent/CN113868818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/18Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Geometry (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Mathematics (AREA)
  • Marketing (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种区域数据点栅格化区块大小确定方法及系统,通过创建基础数据信息,利用区块划分方式、区块位置识别、数据点所属区块识别、区块点数计算、区域内含点区块数计算等方法构建初始数据集;再采用所提出非递减剔除迭代法清洗初始数据集,从而可以采用9阶多项式拟合生成含点区块数量与区块边长之间的函数关系式;最后利用其曲线切线斜率变化函数求解确定最优的区块边长确定了最优区块大小。弥补现有空间栅格化技术在随意主观的确定区块划分大小的不足,填补了在寻找最优区块大小上费时费力的缺陷,为空间栅格化技术的区块大小确定提供可靠的理论依据,有利于经空间栅格化技术处理后的栅格划分效果更好的适应区域和数据点的空间分布特征。

Description

一种区域数据点栅格化区块大小确定方法及系统
技术领域
本发明涉及栅格化空间分析技术领域,尤其涉及一种区域数据点栅格化区块大小确定方法及系统。
背景技术
随着栅格化空间分析技术的快速发展,其在城市规划、土地利用规划、道路网交通流、道路事故黑点分析等领域应用广泛,特别是对于现今智能交通的相关研究和实践应用达到了前所未有的高潮。越来越多的学者在研究大范围交通问题时,时常采用栅格化空间分析技术,将所研究的区域范围切分为一个个的小区块,继而分析所持有的数据点在各个小区块的分布特性,以此推测出各个区块的性质,最后通过各个区块特性分析研究对象在整个研究区域的分布性质。在城市规划和土地利用规划中,栅格化空间分析技术常被用于对现有城市区域的土地利用性质的划分;在道路网交通流的研究中,常被应用于对道路线网的切分,从而计算区块内局部交通流特性,再基于此采用图像处理等技术对交通流进行估计、预测等;在道路事故分析研究中,栅格化空间分析技术常被应用于对事故数据所覆盖区域的划分,通过统计各个区块内的事故频率、严重程度等性质,从而挖掘区域范围内的事故风险黑点。
虽然栅格化空间分析技术应用越来越广泛,但是其中的区块大小的确定却没有一个有效的方法支撑,通常人们采用的是主观的选取多个区块大小的值,以试错的方式选取出其中主观意义上觉得满意的区块大小值。然而,这种方法不仅耗时费力,而且主观性很强,其理想的结果也只能获得一种较优值,而不是最优值。
针对上述这种情况,本发明提出了一种区域数据点栅格化区块大小确定方法及系统。通过建立含点区块数量与栅格化区块边长(可表征方形区块大小)之间的函数关系式,求解关键点从而确定最优区块大小。这将为栅格化空间分析技术中区块大小的确定,提供一种便捷且有效的科学方法。
发明内容
针对现有技术的不足,本发明提供了一种区域数据点栅格化区块大小确定方法及系统,以解决现有技术存在的以上问题,其具体方案如下:
第一方面,本发明提供了一种区域数据点栅格化区块大小确定方法,所述方法包括:
创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法;
构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集;
清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合;
Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式;
确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
优选地,所述创建基础数据信息,所述方法包括:
确定区块划分形式为:以研究区域的外切矩形为划分对象,以最大化形成方形区块为划分形式,区块边长代表区块大小;
获取Na个数据点的位置数据,其中第k个数据点ak的位置数据为
Figure BDA0003301673760000011
获取研究区域的外切矩形上、下、左、右的四方边界为Latmin(上边界),Latmax(下边界),Lonmin(左边界),Lonmax(右边界);
确定区块边长预设范围为待确定最优区块边长xθ所属的定义域区间,该范围为:
minmax],xθ∈[αminmax]
其中,αmax为预设区块边长的最大值,αmin为预设区块边长的最小值;
预定义含点区块数(Y)与区块边长值(X)之间的关系为:
Y=f(X),X∈[αminmax]
在数据点数无穷大的条件下,X和Y的取值是连续的;根据实际的有限数据可计算初始数据集Do=(Xo,Yo)={(xi,yi)|xi∈X,yi∈Y}为离散的采样数据,采样方法为:设定一个步长s(长度单位为米),基于所采集的数据点xi的取值为:
Figure BDA0003301673760000021
优选地,所述构建初始数据集,所述方法包括:
区块划分方法,根据采用的xi的取值,可计算所划分道路线网的区块数量为:
N=Nh×Nv
其中,Nh为矩形区域内所划分区块的列数,Nh为矩形区域内所划分区块的行数,二者的计算公式为:
Figure BDA0003301673760000022
Figure BDA0003301673760000023
则所构建的区块集合为:
B={bij},i=1,2,…,Nv;k=1,2,…,Jh
其中bij表示矩形区域内所有区块中第i行第j列的区块;
区块位置识别,根据所述区块划分方法的划分结果,以各区块的中心点位置确定各区块位置,即区块bij的位置为:
bij=(Lati,Lonj)
Lati=(i-0.5)·xi+Latmin
Lonj=(j-0.5)·xi+Lonmin
数据点所属区块识别,结合所属区块位置识别结果,根据数据点位置数据匹配数据点所属区块,即数据点ak所属区块
Figure BDA0003301673760000024
为:
Figure BDA0003301673760000025
Figure BDA0003301673760000026
Figure BDA0003301673760000031
其中,
Figure BDA0003301673760000032
为数据点ak的第一个位置数据,
Figure BDA0003301673760000033
为数据点ak的第二个位置数据。
优选地,所述方法还包括区块数据点数计算,依据所述数据点所属区块识别结果,统计各个区块内的数据点数量,区块bij上的事故点数量
Figure BDA0003301673760000034
为:
Figure BDA0003301673760000035
Figure BDA0003301673760000036
其中,I(ak∈bij)为指示函数,当数据点ak属于区块bij时取值为1,当数据点ak不属于区块bij时取值为0。
优选地,所述方法还包括区域内含点区块数计算,依据所述的区块数据点数计算结果计算矩形区域范围内含有数据点的区块数量,计算公式为:
Figure BDA0003301673760000037
Figure BDA0003301673760000038
其中,yi为在区块边长预设为xi时,矩形区域范围内含数据点的区块数量;Ψ(xi)为区块边长xi与区域内含点区块数yi之间的关系函数;
Figure BDA0003301673760000039
为指示函数,当区块bvh不包含数据点时取值为1,当区块bvh包含数据点时取值为0。
优选地,所述非递减剔除迭代法,是基于曲线Y=f(X)的递减特性,每一次迭代剔除数据集D中yi≥yi-1时的数据(xi,yi),不断迭代更新数据集D,直至D中不存在yi≥yi-1的情况;
所述非递减剔除迭代法,其计算方法为:
Figure BDA00033016737600000310
其中,Dγ为每次迭代后生成的新的数据集;Dθ为迭代完成后满足要求的数据集,即清洗完成后的数据集;
Figure BDA00033016737600000311
为进行第γ迭代时,数据集Dγ-1中的数据点;
Figure BDA00033016737600000312
表示为空集。
优选地,所述Y=f(X)曲线拟合,利用所述清洗初始数据集得到的数据集Dθ;其中,9阶多项式左半部分与曲线Y=f(X)具有相似性质,所以Y=f(X)的一般式为:
f(x)=β01x+β2x23x34x45x56x67x78x89x9
其中,β0、β1、β2、β3、β4、β5、β6、β7、β8、β9为函数f(x)的参数项;
基于所述Y=f(X)的一般式,采用polynomial拟合法,结合Levenberg-Marquardt优化方法,求解参数,拟合曲线Y=f(X),其表达式为:
f(x)=818.54663+-1.16537x+9.34931×10-4x2-4.42708×10-7x3+1.27003×10- 10x4-2.25314×10-14x5+2.61851×10-18x6-2.38309×10-22x7+1.91029×10-26x8-8.68307×10-31x9
优选地,所述确定最优区块大小,其确定依据主要考虑曲线Y=f(X)的变化特征,其变化特征为:由于Y=f(X)为单调递增函数,在定义域[αminmax]范围内,其曲线在点(xθ,yθ)之前急速降低,在点(xθ,yθ)之后缓慢降低;
所述变化特征采用曲线Y=f(X)的切线斜率函数曲线表示,其一般式为:
f′(x)=β1+2β2x+3β3x2+4β4x3+5β5x4+6β6x5+7β7x6+8β8x7+9β9x8
其表达式为:
f′(x)=-1.16537+1.869862×10-3x-1.328124×10-6x2+5.08012×10-10x3-1.12657×10-13x4+1.571106×10-17x5-1.668163×10-21x6+1.528232×10-25x7-7.814763×10-30x8
优选地,所述方法还包括利用所述变化特征和所述的切线斜率函数曲线确定最优区块边长xθ所在点的切线斜率,从而构建点(xθ,yθ)的求解方程,确定最优区块边长xθ
所述点(xθ,yθ)的求解方程的基本公式为:
Figure BDA0003301673760000041
其半数值公式为:
Figure BDA0003301673760000042
第二方面,本发明提供了一种区域数据点栅格化区块大小确定系统,所述系统包括;
创建模块,用于创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法;
构建模块,用于构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集;
清洗模块,用于清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合;
拟合模块,用于Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式;
确定模块,用于确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
第三方面,本发明提供了一种区域数据点栅格化区块大小确定设备,所述设备包括:
通信总线,用于实现处理器与存储器间的连接通信;
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如下步骤:
创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法;
构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集;
清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合;
Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式;
确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。
本发明的有益效果:本发明的一种区域数据点栅格化区块大小确定方法及系统,通过建立含点区块数量与可表征方形区块大小的栅格化区块边长之间的函数关系式,求解关键点从而确定最优区块大小。主要通过创建基础数据信息,利用区块划分方式、区块位置识别、数据点所属区块识别、区块点数计算、区域内含点区块数计算等方法构建初始数据集。再采用所提出非递减剔除迭代法清洗初始数据集,从而可以采用9阶多项式拟合生成含点区块数量与区块边长(之间的函数关系式。最后利用其曲线切线斜率变化函数求解确定最优的区块边长,即确定了最优区块大小。该方法的提出将弥补现有空间栅格化技术在随意主观的确定区块划分大小的不足,也填补了在寻找最优区块大小上费时费力的缺陷。该方法的提出将进一步为空间栅格化技术的区块大小确定提供可靠的理论依据,有利于经空间栅格化技术处理后的栅格划分效果更好的适应区域和数据点的空间分布特征。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,附图中的实施例不构成对本发明的任何限制,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种区域数据点栅格化区块大小确定方法一实施例流程示意图。
图2是本发明一种区域数据点栅格化区块大小确定系统一实施例结构示意图。
图3是本发明一种区域数据点栅格化区块大小确定设备一实施例结构示意图。
具体实施方式
下面结合附图与实施例对本发明技术方案作进一步详细的说明,这是本发明的较佳实施例。应当理解,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例技术方案的主要思想:创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法;构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集;清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合;Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式;确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
为了更好的理解上述的技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
本发明一实施例提供了一种区域数据点栅格化区块大小确定方法,如图1所示,该方法具体可以包括如下步骤:
步骤S101,创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法。
在本发明申请实施例中,所述创建基础数据信息,所述方法具体地可以包括:
确定区块划分形式为:以研究区域的外切矩形为划分对象,以最大化形成方形区块为划分形式,区块边长代表区块大小;
获取Na个数据点的位置数据,其中第k个数据点ak的位置数据为
Figure BDA0003301673760000061
获取研究区域的外切矩形上、下、左、右的四方边界为Latmin(上边界),Latmax(下边界),Lonmin(左边界),Lonmax(右边界);
确定区块边长预设范围为待确定最优区块边长xθ所属的定义域区间,该范围为:
minmax],xθ∈[αminmax]
其中,αmax为预设区块边长的最大值,αmin为预设区块边长的最小值;
预定义含点区块数(Y)与区块边长值(X)之间的关系为:
Y=f(X),X∈[αminmax]
在数据点数无穷大的条件下,X和Y的取值是连续的;根据实际的有限数据可计算初始数据集Do=(Xo,Yo)={(xi,yi)|xi∈X,yi∈Y}为离散的采样数据,采样方法为:设定一个步长s(长度单位为米),基于所采集的数据点xi的取值为:
Figure BDA0003301673760000062
步骤S102,构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集。
在本发明申请实施例中,所述建初始数据集,所述方法具体地可以包括:
区块划分方法,根据采用的xi的取值,可计算所划分道路线网的区块数量为:
N=Nh×Nv
其中,Nh为矩形区域内所划分区块的列数,Nh为矩形区域内所划分区块的行数,二者的计算公式为:
Figure BDA0003301673760000063
Figure BDA0003301673760000064
则所构建的区块集合为:
B={bij},i=1,2,…,Nv;j=1,2,…,Nh
其中bij表示矩形区域内所有区块中第i行第j列的区块;
区块位置识别,根据所述区块划分方法的划分结果,以各区块的中心点位置确定各区块位置,即区块bij的位置为:
bij=(Lati,Lonj)
Lati=(i-0.5)·xi+Latmin
Lonj=(j-0.5)·xi+Lonmin
数据点所属区块识别,结合所属区块位置识别结果,根据数据点位置数据匹配数据点所属区块,即数据点ak所属区块
Figure BDA0003301673760000071
为:
Figure BDA0003301673760000072
Figure BDA0003301673760000073
Figure BDA0003301673760000074
其中,
Figure BDA0003301673760000075
为数据点ak的第一个位置数据,
Figure BDA0003301673760000076
为数据点ak的第二个位置数据。
在一个可选实施例中,所述方法具体还可以包括区块数据点数计算,依据所述数据点所属区块识别结果,统计各个区块内的数据点数量,区块bij上的事故点数量
Figure BDA0003301673760000077
为:
Figure BDA0003301673760000078
Figure BDA0003301673760000079
其中,I(ak∈bij)为指示函数,当数据点ak属于区块bij时取值为1,当数据点ak不属于区块bij时取值为0。
在另一可选实施例中,所述方法具体还可以包括区域内含点区块数计算,依据所述的区块数据点数计算结果计算矩形区域范围内含有数据点的区块数量,计算公式为:
Figure BDA00033016737600000710
Figure BDA00033016737600000711
其中,yi为在区块边长预设为xi时,矩形区域范围内含数据点的区块数量;Ψ(xi)为区块边长xi与区域内含点区块数yi之间的关系函数;
Figure BDA00033016737600000712
为指示函数,当区块bvh不包含数据点时取值为1,当区块bvh包含数据点时取值为0。
步骤S103,清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合。
作为示例,所述非递减剔除迭代法,是基于曲线Y=f(X)的递减特性,每一次迭代剔除数据集D中yi≥yi-1时的数据(xi,yi),不断迭代更新数据集D,直至D中不存在yi≥yi-1的情况;
所述非递减剔除迭代法,其计算方法为:
Figure BDA0003301673760000081
其中,Dγ为每次迭代后生成的新的数据集;Dθ为迭代完成后满足要求的数据集,即清洗完成后的数据集;
Figure BDA0003301673760000082
为进行第γ迭代时,数据集Dγ-1中的数据点;
Figure BDA0003301673760000083
表示为空集。
步骤S104,Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式。
在本发明申请实施例中,所述Y=f(X)曲线拟合,利用所述清洗初始数据集得到的数据集Dθ;其中,9阶多项式左半部分与曲线Y=f(X)具有相似性质,所以Y=f(X)的一般式为:
f(x)=β01x+β2x23x34x45x56x67x78x89x9
其中,β0、β1、β2、β3、β4、β5、β6、β7、β8、β9为函数f(x)的参数项;
基于所述Y=f(X)的一般式,采用polynomial拟合法,结合Levenberg-Marquardt优化方法,求解参数,拟合曲线Y=f(X),其表达式为:
f(x)=818.54663+-1.16537x+9.34931×10-4x2-4.42708×10-7x3+1.27003×10- 10x4-2.25314×10-14x5+2.61851×10-18x6-2.38309×10-22x7+1.91029×10-26x8-8.68307×10-31x9
步骤S105,确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
在本发明申请实施例中,所述确定最优区块大小,其确定依据主要考虑曲线Y=f(X)的变化特征,其变化特征为:由于Y=f(X)为单调递增函数,在定义域[αminmax]范围内,其曲线在点(xθ,yθ)之前急速降低,在点(xθ,yθ)之后缓慢降低;
所述变化特征采用曲线Y=f(X)的切线斜率函数曲线表示,其一般式为:
f′(x)=β1+2β2x+3β3x2+4β4x3+5β5x4+6β6x5+7β7x6+8β8x7+9β9x8
其表达式为:
f′(x)=-1.16537+1.869862×10-3x-1.328124×10-6x2+5.08012×10-10x3-1.12657×10-13x4+1.571106×10-17x5-1.668163×10-21x6+1.528232×10-25x7-7.814763×10-30x8
在又一可选实施例中,所述方法具体还可以包括利用所述变化特征和所述的切线斜率函数曲线确定最优区块边长xθ所在点的切线斜率,从而构建点(xθ,yθ)的求解方程,确定最优区块边长xθ
所述点(xθ,yθ)的求解方程的基本公式为:
Figure BDA0003301673760000091
其半数值公式为:
Figure BDA0003301673760000092
实施例二
本发明一实施例提供了一种区域数据点栅格化区块大小确定系统,如图2所示,所述系统具体可以包括如下模块:
创建模块,用于创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法。
在本发明申请实施例中,所述创建基础数据信息,所述方法具体地可以包括:
确定区块划分形式为:以研究区域的外切矩形为划分对象,以最大化形成方形区块为划分形式,区块边长代表区块大小;
获取Na个数据点的位置数据,其中第k个数据点ak的位置数据为
Figure BDA0003301673760000093
获取研究区域的外切矩形上、下、左、右的四方边界为Latmin(上边界),Latmax(下边界),Lonmin(左边界),Lonmax(右边界);
确定区块边长预设范围为待确定最优区块边长xθ所属的定义域区间,该范围为:
minmax],xθ∈[αminmax]
其中,αmax为预设区块边长的最大值,αmin为预设区块边长的最小值;
预定义含点区块数(Y)与区块边长值(X)之间的关系为:
Y=f(X),X∈[αminmax]
在数据点数无穷大的条件下,X和Y的取值是连续的;根据实际的有限数据可计算初始数据集Do=(Xo,Yo)={(xi,yi)|xi∈X,yi∈Y}为离散的采样数据,采样方法为:设定一个步长s(长度单位为米),基于所采集的数据点xi的取值为:
Figure BDA0003301673760000094
构建模块,用于构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集。
在本发明申请实施例中,所述建初始数据集,所述方法具体地可以包括:
区块划分方法,根据采用的xi的取值,可计算所划分道路线网的区块数量为:
N=Nh×Nv
其中,Nh为矩形区域内所划分区块的列数,Nh为矩形区域内所划分区块的行数,二者的计算公式为:
Figure BDA0003301673760000095
Figure BDA0003301673760000101
则所构建的区块集合为:
B={bij},i=1,2,…,Nv;j=1,2,…,Nh
其中bij表示矩形区域内所有区块中第i行第j列的区块;
区块位置识别,根据所述区块划分方法的划分结果,以各区块的中心点位置确定各区块位置,即区块bij的位置为:
bij=(Lati,Lonj)
Lati=(i-0.5)·xi+Latmin
Lonj=(j-0.5)·xi+Lonmin
数据点所属区块识别,结合所属区块位置识别结果,根据数据点位置数据匹配数据点所属区块,即数据点ak所属区块
Figure BDA0003301673760000102
为:
Figure BDA0003301673760000103
Figure BDA0003301673760000104
Figure BDA0003301673760000105
其中,
Figure BDA0003301673760000106
为数据点ak的第一个位置数据,
Figure BDA0003301673760000107
为数据点ak的第二个位置数据。
在一个可选实施例中,所述方法具体还可以包括区块数据点数计算,依据所述数据点所属区块识别结果,统计各个区块内的数据点数量,区块bij上的事故点数量
Figure BDA0003301673760000108
为:
Figure BDA0003301673760000109
Figure BDA00033016737600001010
其中,I(ak∈bij)为指示函数,当数据点ak属于区块bij时取值为1,当数据点ak不属于区块bij时取值为0。
在另一可选实施例中,所述方法具体还可以包括区域内含点区块数计算,依据所述的区块数据点数计算结果计算矩形区域范围内含有数据点的区块数量,计算公式为:
Figure BDA00033016737600001011
Figure BDA00033016737600001012
其中,yi为在区块边长预设为xi时,矩形区域范围内含数据点的区块数量;Ψ(xi)为区块边长xi与区域内含点区块数yi之间的关系函数;
Figure BDA0003301673760000111
为指示函数,当区块bvh不包含数据点时取值为1,当区块bvh包含数据点时取值为0。
清洗模块,用于清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合。
作为示例,所述非递减剔除迭代法,是基于曲线Y=f(X)的递减特性,每一次迭代剔除数据集D中yi≥yi-1时的数据(xi,yi),不断迭代更新数据集D,直至D中不存在yi≥yi-1的情况;
所述非递减剔除迭代法,其计算方法为:
Figure BDA0003301673760000112
其中,Dγ为每次迭代后生成的新的数据集;Dθ为迭代完成后满足要求的数据集,即清洗完成后的数据集;
Figure BDA0003301673760000113
为进行第γ迭代时,数据集Dγ-1中的数据点;
Figure BDA0003301673760000114
表示为空集。
拟合模块,用于Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式。
在本发明申请实施例中,所述Y=f(X)曲线拟合,利用所述清洗初始数据集得到的数据集Dθ;其中,9阶多项式左半部分与曲线Y=f(X)具有相似性质,所以Y=f(X)的一般式为:
f(x)=β01x+β2x23x34x45x56x67x78x89x9
其中,β0、β1、β2、β3、β4、β5、β6、β7、β8、β9为函数f(x)的参数项;
基于所述Y=f(X)的一般式,采用polynomial拟合法,结合Levenberg-Marquardt优化方法,求解参数,拟合曲线Y=f(X),其表达式为:
f(x)=818.54663+-1.16537x+9.34931×10-4x2-4.42708×10-7x3+1.27003×10- 10x4-2.25314×10-14x5+2.61851×10-18x6-2.38309×10-22x7+1.91029×10-26x8-8.68307×10-31x9
确定模块,用于确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
在本发明申请实施例中,所述确定最优区块大小,其确定依据主要考虑曲线Y=f(X)的变化特征,其变化特征为:由于Y=f(X)为单调递增函数,在定义域[αminmax]范围内,其曲线在点(xθ,yθ)之前急速降低,在点(xθ,yθ)之后缓慢降低;
所述变化特征采用曲线Y=f(X)的切线斜率函数曲线表示,其一般式为:
f′(x)=β1+2β2x+3β3x2+4β4x3+5β5x4+6β6x5+7β7x6+8β8x7+9β9x8
其表达式为:
f′(x)=-1.16537+1.869862×10-3x-1.328124×10-6x2+5.08012×10-10x3-1.12657×10-13x4+1.571106×10-17x5-1.668163×10-21x6+1.528232×10-25x7-7.814763×10-30x8
在又一可选实施例中,所述方法具体还可以包括利用所述变化特征和所述的切线斜率函数曲线确定最优区块边长xθ所在点的切线斜率,从而构建点(xθ,yθ)的求解方程,确定最优区块边长xθ
所述点(xθ,yθ)的求解方程的基本公式为:
Figure BDA0003301673760000121
其半数值公式为:
Figure BDA0003301673760000122
实施例三
本发明一实施例提供了一种区域数据点栅格化区块大小确定设备,如图3所示,所述设备具体可以包括如下模块:
通信总线,用于实现处理器与存储器间的连接通信;
存储器,用于存储计算机程序;存储器可能包含高速RAM存储器,也可能还包含非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器可选的可以包含至少一个存储装置。
处理器,用于执行上述计算机程序以实现如下步骤:
首先,创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法。
在本发明申请实施例中,所述创建基础数据信息,所述方法具体地可以包括:
确定区块划分形式为:以研究区域的外切矩形为划分对象,以最大化形成方形区块为划分形式,区块边长代表区块大小;
获取Na个数据点的位置数据,其中第k个数据点ak的位置数据为
Figure BDA0003301673760000123
获取研究区域的外切矩形上、下、左、右的四方边界为Latmin(上边界),Latmax(下边界),Lonmin(左边界),Lonmax(右边界);
确定区块边长预设范围为待确定最优区块边长xθ所属的定义域区间,该范围为:
minmax],xθ∈[αminmax]
其中,αmax为预设区块边长的最大值,αmin为预设区块边长的最小值;
预定义含点区块数(Y)与区块边长值(X)之间的关系为:
Y=f(X),X∈[αminmax]
在数据点数无穷大的条件下,X和Y的取值是连续的;根据实际的有限数据可计算初始数据集Do=(Xo,Yo)={(xi,yi)|xi∈X,yi∈Y}为离散的采样数据,采样方法为:设定一个步长s(长度单位为米),基于所采集的数据点xi的取值为:
Figure BDA0003301673760000124
其次,构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集。
在本发明申请实施例中,所述建初始数据集,所述方法具体地可以包括:
区块划分方法,根据采用的xi的取值,可计算所划分道路线网的区块数量为:
N=Nh×Nv
其中,Nh为矩形区域内所划分区块的列数,Nh为矩形区域内所划分区块的行数,二者的计算公式为:
Figure BDA0003301673760000131
Figure BDA0003301673760000132
则所构建的区块集合为:
B={bij},i=1,2,…,Nv;j=1,2,…,Nh
其中bij表示矩形区域内所有区块中第i行第j列的区块;
区块位置识别,根据所述区块划分方法的划分结果,以各区块的中心点位置确定各区块位置,即区块bij的位置为:
bij=(Lati,Lonj)
Lati=(i-0.5)·xi+Latmin
Lonj=(j-0.5)·xi+Lonmin
数据点所属区块识别,结合所属区块位置识别结果,根据数据点位置数据匹配数据点所属区块,即数据点ak所属区块
Figure BDA0003301673760000133
为:
Figure BDA0003301673760000134
Figure BDA0003301673760000135
Figure BDA0003301673760000136
其中,
Figure BDA0003301673760000137
为数据点ak的第一个位置数据,
Figure BDA0003301673760000138
为数据点ak的第二个位置数据。
在一个可选实施例中,所述方法具体还可以包括区块数据点数计算,依据所述数据点所属区块识别结果,统计各个区块内的数据点数量,区块bij上的事故点数量
Figure BDA0003301673760000139
为:
Figure BDA00033016737600001310
Figure BDA00033016737600001311
其中,I(ak∈bij)为指示函数,当数据点ak属于区块bij时取值为1,当数据点ak不属于区块bij时取值为0。
在另一可选实施例中,所述方法具体还可以包括区域内含点区块数计算,依据所述的区块数据点数计算结果计算矩形区域范围内含有数据点的区块数量,计算公式为:
Figure BDA0003301673760000141
Figure BDA0003301673760000142
其中,yi为在区块边长预设为xi时,矩形区域范围内含数据点的区块数量;Ψ(xi)为区块边长xi与区域内含点区块数yi之间的关系函数;
Figure BDA0003301673760000143
为指示函数,当区块bvh不包含数据点时取值为1,当区块bvh包含数据点时取值为0。
然后,清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合。
作为示例,所述非递减剔除迭代法,是基于曲线Y=f(X)的递减特性,每一次迭代剔除数据集D中yi≥yi-1时的数据(xi,yi),不断迭代更新数据集D,直至D中不存在yi≥yi-1的情况;
所述非递减剔除迭代法,其计算方法为:
Figure BDA0003301673760000144
其中,Dγ为每次迭代后生成的新的数据集;Dθ为迭代完成后满足要求的数据集,即清洗完成后的数据集;
Figure BDA0003301673760000145
为进行第γ迭代时,数据集Dγ-1中的数据点;
Figure BDA0003301673760000146
表示为空集。
接着,Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式。
在本发明申请实施例中,所述Y=f(X)曲线拟合,利用所述清洗初始数据集得到的数据集Dθ;其中,9阶多项式左半部分与曲线Y=f(X)具有相似性质,所以Y=f(X)的一般式为:
f(x)=β01x+β2x23x34x45x56x67x78x89x9
其中,β0、β1、β2、β3、β4、β5、β6、β7、β8、β9为函数f(x)的参数项;
基于所述Y=f(X)的一般式,采用polynomial拟合法,结合Levenberg-Marquardt优化方法,求解参数,拟合曲线Y=f(X),其表达式为:
f(x)=818.54663+-1.16537x+9.34931×10-4x2-4.42708×10-7x3+1.27003×10- 10x4-2.25314×10-14x5+2.61851×10-18x6-2.38309×10-22x7+1.91029×10-26x8-8.68307×10-31x9
最后,确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
在本发明申请实施例中,所述确定最优区块大小,其确定依据主要考虑曲线Y=f(X)的变化特征,其变化特征为:由于Y=f(X)为单调递增函数,在定义域[αminmax]范围内,其曲线在点(xθ,yθ)之前急速降低,在点(xθ,yθ)之后缓慢降低;
所述变化特征采用曲线Y=f(X)的切线斜率函数曲线表示,其一般式为:
f′(x)=β1+2β2x+3β3x2+4β4x3+5β5x4+6β6x5+7β7x6+8β8x7+9β9x8
其表达式为:
f′(x)=-1.16537+1.869862×10-3x-1.328124×10-6x2+5.08012×10-10x3-1.12657×10-13x4+1.571106×10-17x5-1.668163×10-21x6+1.528232×10-25x7-7.814763×10-30x8
在又一可选实施例中,所述方法具体还可以包括利用所述变化特征和所述的切线斜率函数曲线确定最优区块边长xθ所在点的切线斜率,从而构建点(xθ,yθ)的求解方程,确定最优区块边长xθ
所述点(xθ,yθ)的求解方程的基本公式为:
Figure BDA0003301673760000151
其半数值公式为:
Figure BDA0003301673760000152
本实施例中的处理器可能是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。上述处理器可以是微处理器或者上述处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
实施例四
本发明一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述的区域数据点栅格化区块大小确定方法。
综上所述,本发明实施例提供的一种区域数据点栅格化区块大小确定方法及系统,通过建立含点区块数量与可表征方形区块大小的栅格化区块边长之间的函数关系式,求解关键点从而确定最优区块大小。主要通过创建基础数据信息,利用区块划分方式、区块位置识别、数据点所属区块识别、区块点数计算、区域内含点区块数计算等方法构建初始数据集。再采用所提出非递减剔除迭代法清洗初始数据集,从而可以采用9阶多项式拟合生成含点区块数量与区块边长(之间的函数关系式。最后利用其曲线切线斜率变化函数求解确定最优的区块边长,即确定了最优区块大小。该方法的提出将弥补现有空间栅格化技术在随意主观的确定区块划分大小的不足,也填补了在寻找最优区块大小上费时费力的缺陷。该方法的提出将进一步为空间栅格化技术的区块大小确定提供可靠的理论依据,有利于经空间栅格化技术处理后的栅格划分效果更好的适应区域和数据点的空间分布特征。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行该计算机程序指令时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明是参照本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种区域数据点栅格化区块大小确定方法,其特征在于,所述方法包括:
创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法;
构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集;
清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合;
Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式;
确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
2.根据权利要求1所述的方法,其特征在于,所述创建基础数据信息,所述方法包括:
确定区块划分形式为:以研究区域的外切矩形为划分对象,以最大化形成方形区块为划分形式,区块边长代表区块大小;
获取Na个数据点的位置数据,其中第k个数据点ak的位置数据为
Figure FDA0003301673750000011
获取研究区域的外切矩形上、下、左、右的四方边界为Latmin(上边界),Latmax(下边界),Lonmin(左边界),Lonmax(右边界);
确定区块边长预设范围为待确定最优区块边长xθ所属的定义域区间,该范围为:
min,αmax],xθ∈[αmin,αmax]
其中,αmax为预设区块边长的最大值,αmin为预设区块边长的最小值;
预定义含点区块数(Y)与区块边长值(X)之间的关系为:
Y=f(X),X∈[αmin,αmax]
在数据点数无穷大的条件下,X和Y的取值是连续的;根据实际的有限数据可计算初始数据集Do=(Xo,Yo)={(xi,yi)|xi∈X,yi∈Y}为离散的采样数据,采样方法为:设定一个步长s(长度单位为米),基于所采集的数据点xi的取值为:
Figure FDA0003301673750000012
3.根据权利要求1所述的方法,其特征在于,所述构建初始数据集,所述方法包括:
区块划分方法,根据采用的xi的取值,可计算所划分道路线网的区块数量为:
N=Nh×Nv
其中,Nh为矩形区域内所划分区块的列数,Nh为矩形区域内所划分区块的行数,二者的计算公式为:
Figure FDA0003301673750000013
Figure FDA0003301673750000014
则所构建的区块集合为:
B={bij},i=1,2,...,Nv;j=1,2,...,Nh
其中bij表示矩形区域内所有区块中第i行第j列的区块;
区块位置识别,根据所述区块划分方法的划分结果,以各区块的中心点位置确定各区块位置,即区块bij的位置为:
bij=(Lati,Lonj)
Lati=(i-0.5)·xi+Latmin
Lonj=(j-0.5)·xi+Lonmin
数据点所属区块识别,结合所属区块位置识别结果,根据数据点位置数据匹配数据点所属区块,即数据点ak所属区块
Figure FDA0003301673750000021
为:
Figure FDA0003301673750000022
Figure FDA0003301673750000023
Figure FDA0003301673750000024
其中,
Figure FDA0003301673750000025
为数据点ak的第一个位置数据,
Figure FDA0003301673750000026
为数据点ak的第二个位置数据。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括区块数据点数计算,依据所述数据点所属区块识别结果,统计各个区块内的数据点数量,区块bij上的事故点数量
Figure FDA0003301673750000027
为:
Figure FDA0003301673750000028
Figure FDA0003301673750000029
其中,I(ak∈bij)为指示函数,当数据点ak属于区块bij时取值为1,当数据点ak不属于区块bij时取值为0。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括区域内含点区块数计算,依据所述的区块数据点数计算结果计算矩形区域范围内含有数据点的区块数量,计算公式为:
Figure FDA00033016737500000210
Figure FDA00033016737500000211
其中,yi为在区块边长预设为xi时,矩形区域范围内含数据点的区块数量;Ψ(xi)为区块边长xi与区域内含点区块数yi之间的关系函数;
Figure FDA00033016737500000212
为指示函数,当区块bvh不包含数据点时取值为1,当区块bvh包含数据点时取值为0。
6.根据权利要求1所述的方法,其特征在于,所述非递减剔除迭代法,是基于曲线Y=f(X)的递减特性,每一次迭代剔除数据集D中yi≥yi-1时的数据(xi,yi),不断迭代更新数据集D,直至D中不存在yi≥yi-1的情况;
所述非递减剔除迭代法,其计算方法为:
Figure FDA0003301673750000031
其中,Dγ为每次迭代后生成的新的数据集;Dθ为迭代完成后满足要求的数据集,即清洗完成后的数据集;
Figure FDA0003301673750000032
为进行第γ迭代时,数据集Dγ-1中的数据点;
Figure FDA0003301673750000033
表示为空集。
7.根据权利要求1所述的方法,其特征在于,所述Y=f(X)曲线拟合,利用所述清洗初始数据集得到的数据集Dθ;其中,9阶多项式左半部分与曲线Y=f(X)具有相似性质,所以Y=f(X)的一般式为:
f(x)=β01x+β2x23x34x45x56x67x78x89x9
其中,β0、β1、β2、β3、β4、β5、β6、β7、β8、β9为函数f(x)的参数项;
基于所述Y=f(X)的一般式,采用polynomial拟合法,结合Levenberg-Marquardt优化方法,求解参数,拟合曲线Y=f(X),其表达式为:
f(x)=818.54663+-1.16537x+9.34931×10-4x2-4.42708×10-7x3+1.27003×10-10x4-2.25314×10-14x5+2.61851×10-18x6-2.38309×10-22x7+1.91029×10-26x8-8.68307×10-31x9
8.根据权利要求1所述的方法,其特征在于,所述确定最优区块大小,其确定依据主要考虑曲线Y=f(X)的变化特征,其变化特征为:由于Y=f(X)为单调递增函数,在定义域[αmin,αmax]范围内,其曲线在点(xθ,yθ)之前急速降低,在点(xθ,yθ)之后缓慢降低;
所述变化特征采用曲线Y=f(X)的切线斜率函数曲线表示,其一般式为:
f′(x)=β1+2β2x+3β3x2+4β4x3+5β5x4+6β6x5+7β7x6+8β8x7+9β9x8
其表达式为:
f′(x)=-1.16537+1.869862×10-3x-1.328124×10-6x2+5.08012×10-10x3-1.12657×10-13x4+1.571106×10-17x5-1.668163×10-21x6+1.528232×10-25x7-7.814763×10-30x8
9.根据权利要求8所述的方法,其特征在于,所述方法还包括利用所述变化特征和所述的切线斜率函数曲线确定最优区块边长xθ所在点的切线斜率,从而构建点(xθ,yθ)的求解方程,确定最优区块边长xθ
所述点(xθ,yθ)的求解方程的基本公式为:
Figure FDA0003301673750000034
其半数值公式为:
Figure FDA0003301673750000035
10.一种区域数据点栅格化区块大小确定系统,其特征在于,所述系统包括;
创建模块,用于创建基础数据信息,所述基础数据信息包括路网图区块划分形式、数据点经纬度数据、区域四方边界、自变量定义域的区块边长预设范围、预设函数关系Y=f(X)、初始数据集表示、采样方法;
构建模块,用于构建初始数据集,所述初始数据集构建方式包括:确定路网图区块划分方法、区块位置识别、数据点所属区块识别、区块内数据点数计算、区域内含点区块数计算,从而构建用于拟合Y=f(X)的初始数据集;
清洗模块,用于清洗初始数据集,采用非递减剔除迭代法剔除由划分位置对栅格化效果造成不良影响的初始数据集的数据,从而获得清洗后的可用数据集并可直接用于Y=f(X)曲线拟合;
拟合模块,用于Y=f(X)曲线拟合,根据所述可用数据集二维散点分布特征,确定polynomial拟合法和Levenberg-Marquardt优化方法,以9阶多项式一般式拟合曲线,并求解出该曲线的数值表达式;
确定模块,用于确定最优区块大小,根据Y=f(X)曲线变化特征确定最优区块边长点性质,结合所述拟合曲线Y=f(X)推导切线斜率函数曲线,建立求解公式,从而确定最优区块边长,即确定了最优区块大小。
CN202111192314.2A 2021-10-13 2021-10-13 一种区域数据点栅格化区块大小确定方法及系统 Active CN113868818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111192314.2A CN113868818B (zh) 2021-10-13 2021-10-13 一种区域数据点栅格化区块大小确定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111192314.2A CN113868818B (zh) 2021-10-13 2021-10-13 一种区域数据点栅格化区块大小确定方法及系统

Publications (2)

Publication Number Publication Date
CN113868818A true CN113868818A (zh) 2021-12-31
CN113868818B CN113868818B (zh) 2024-04-02

Family

ID=78999138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111192314.2A Active CN113868818B (zh) 2021-10-13 2021-10-13 一种区域数据点栅格化区块大小确定方法及系统

Country Status (1)

Country Link
CN (1) CN113868818B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1701275A2 (en) * 2005-03-11 2006-09-13 Roche Diagnostics GmbH PCR elbow determination by rotational transform
CN107944175A (zh) * 2017-12-06 2018-04-20 浙江大学 一种考虑风湍流强度的风机真实功率曲线获取方法
CN110351665A (zh) * 2019-07-31 2019-10-18 中国联合网络通信集团有限公司 用户惯常地的识别方法、设备及计算机可读存储介质
CN112000115A (zh) * 2020-09-15 2020-11-27 湖南文理学院 一种自主式水下机器人的路径规划方法及相关设备
CN113433936A (zh) * 2021-06-02 2021-09-24 北京迈格威科技有限公司 移动设备绕障方法、装置、移动设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1701275A2 (en) * 2005-03-11 2006-09-13 Roche Diagnostics GmbH PCR elbow determination by rotational transform
CN107944175A (zh) * 2017-12-06 2018-04-20 浙江大学 一种考虑风湍流强度的风机真实功率曲线获取方法
CN110351665A (zh) * 2019-07-31 2019-10-18 中国联合网络通信集团有限公司 用户惯常地的识别方法、设备及计算机可读存储介质
CN112000115A (zh) * 2020-09-15 2020-11-27 湖南文理学院 一种自主式水下机器人的路径规划方法及相关设备
CN113433936A (zh) * 2021-06-02 2021-09-24 北京迈格威科技有限公司 移动设备绕障方法、装置、移动设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙刘诚;孙焰;郑文家;: "不规则物流园区功能区块布局模型与算法", 交通运输系统工程与信息, no. 02, 15 April 2017 (2017-04-15) *

Also Published As

Publication number Publication date
CN113868818B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
Mongus et al. An efficient approach to 3D single tree-crown delineation in LiDAR data
Tung et al. Enabling scalable spectral clustering for image segmentation
CN112669463B (zh) 三维点云的曲面重建方法、计算机设备和计算机可读存储介质
CN109658509B (zh) 一种狭长图斑分块方法、装置、计算机设备和存储介质
CN104899849B (zh) 一种多目标交互式图像分割方法和装置
Kim et al. Pycnophylactic interpolation revisited: integration with the dasymetric-mapping method
CN107067405B (zh) 基于尺度优选的遥感影像分割方法
CN110647852A (zh) 一种车流量统计方法、终端设备及存储介质
US7010564B2 (en) Region calculation method, spatial data mining apparatus, geographical information display apparatus, spatial data mining system and storage medium
CN115239644B (zh) 混凝土缺陷识别方法、装置、计算机设备和存储介质
CN101587189B (zh) 用于合成孔径雷达图像的纹理基元特征提取方法
CN111126211B (zh) 标牌识别方法和装置、电子设备
WO2020258772A1 (zh) 样本聚类方法、装置、设备及存储介质
Su et al. A new hierarchical moving curve-fitting algorithm for filtering lidar data for automatic DTM generation
Jasiewicz et al. Multi-scale segmentation algorithm for pattern-based partitioning of large categorical rasters
Zhang et al. Establishment of channel networks in a digital elevation model of the prairie region through hydrological correction and geomorphological assessment
CN115631372A (zh) 基于土壤遥感数据的土地信息分类管理方法
CN113379269B (zh) 多因素空间聚类的城市商业功能区划方法、装置及介质
CN115035316A (zh) 目标区域图像识别方法、装置、计算机设备
CN109919843B (zh) 一种基于自适应四分法的皮肤图像纹理评估方法及系统
CN113868818A (zh) 一种区域数据点栅格化区块大小确定方法及系统
CN110728675A (zh) 肺结节分析装置、模型训练方法、装置及分析设备
CN116703132B (zh) 共享车辆动态调度的管理方法、装置及计算机设备
Prerna et al. Evaluation of LiDAR and image segmentation based classification techniques for automatic building footprint extraction for a segment of Atlantic County, New Jersey
CN116611678B (zh) 数据处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant