CN105260249B - 空间计算域计算强度特征提取方法 - Google Patents
空间计算域计算强度特征提取方法 Download PDFInfo
- Publication number
- CN105260249B CN105260249B CN201510600934.3A CN201510600934A CN105260249B CN 105260249 B CN105260249 B CN 105260249B CN 201510600934 A CN201510600934 A CN 201510600934A CN 105260249 B CN105260249 B CN 105260249B
- Authority
- CN
- China
- Prior art keywords
- calculating
- strength characteristic
- computational domain
- intensity
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种空间计算域计算强度特征提取方法,该方法包括以下步骤:将影响空间计算域计算强度的因素选取为计算强度候选特征;采集空间计算域的计算样本;对计算样本进行线性回归分析,获得每个计算强度特征的显著性;依次从计算强度候选特征集中剔除显著性最大的计算强度特征;迭代进行线性回归分析,直到每个计算强度特征的显著性均小于目标阈值,最终提取出空间计算域的计算强度特征。本发明基于每个计算强度特征在计算强度线性回归模型中的显著性,依次剔除计算强度线性回归模型中的冗余特征,有效地提取出空间计算域的计算强度特征,为高性能空间计算中空间计算域计算强度的度量奠定了基础。
Description
技术领域
本发明涉及高性能空间计算技术,尤其涉及一种空间计算域计算强度特征提取方法。
背景技术
空间计算域计算强度特征提取是高性能空间计算领域迫切需要解决的难题,只有有效提取出计算强度特征,才能够建立空间计算域的计算强度模型。目前缺乏有效的方法提取空间计算域的计算强度特征,空间计算域的计算强度特征大多根据经验选取,使得在高性能空间计算中对空间计算任务的计算强度度量不准确,影响并行计算过程中的任务分配和调度,难以实现并行环境下的负载均衡。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种空间计算域计算强度特征提取方法。
本发明解决其技术问题所采用的技术方案是:一种空间计算域计算强度特征提取方法,包括以下步骤:
1)将影响空间计算域计算强度的所有因素选取为计算强度候选特征;
2)采集空间计算域的n个计算样本,对每个样本记录其计算强度候选特征和对应空间计算域的计算时间,将计算时间作为空间计算域的计算强度;
其中,为了保证结果的有效性,样本的个数n不小于16;
3)将计算强度候选特征集中各个特征作为自变量,计算时间作为因变量,对计算样本进行线性回归分析,获得每个计算强度特征在线性回归模型中的显著性,判断是否所有计算强度特征的显著性都小于目标阈值,如果是,进入步骤6);如果否,则转步骤4)。
4)选择线性回归模型中显著性最高的自变量对应的计算强度特征,将其作为冗余特征;
5)将冗余特征从计算强度候选特征集中剔除,获得新的计算强度候选特征集,转步骤3)迭代进行下一次回归分析;
6)结束计算强度特征提取过程,该回归分析模型中的自变量对应的计算强度特征即为空间计算域的计算强度特征。
按上述方案,所述步骤1)中影响空间计算域计算强度的因素包括空间要素个数、地理坐标点个数、空间要素几何类型等。
按上述方案,所述步骤3)中目标阈值取值为0.05。
本发明产生的有益效果是:本发明方法能够从众多的计算强度候选特征中有效地提取出空间计算域的计算强度特征,解决了根据经验选取计算强度特征造成计算强度评价不准确问题,为高性能空间计算中对空间计算域计算强度的评价奠定基础,有助于实现并行计算环境下的空间计算负载均衡。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例的空间计算域计算强度特征提取方法流程图;
图2是本发明实施例的以可视化空间计算域的计算强度特征提取为例的方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
图1是本发明的空间计算域计算强度特征提取方法流程图,如图1所示,一种空间计算域计算强度特征提取方法,包括以下步骤:
步骤1)由于空间计算域计算过程中的各个参数对空间计算域的计算时间都有不同程度的影响,则将这些参数全部选取为空间计算域的计算强度候选特征,组成计算强度候选特征集;
步骤2)借助随机数生成器生成一组计算强度特征各不相同的空间计算域,各个参数的随机取值均控制在该参数的有效取值范围内,执行生成的各个空间计算域的计算任务,采集空间计算域的计算样本,在每个样本中记录计算强度特征和空间计算域的计算时间,将计算时间作为空间计算域的计算强度;
步骤3)将计算强度候选特征集中各个特征作为自变量,计算时间作为因变量,使用统计分析软件对计算样本进行线性回归分析,获得每个计算强度特征在线性回归模型中的显著性,判断是否所有计算强度特征的显著性都小于目标阈值,如果是,进入步骤6);如果否,则转步骤4);
步骤4)选择线性回归模型中显著性最高的自变量对应的计算强度特征,将其作为将要被剔除的冗余特征,若显著性最高的自变量超过一个,则任意删除其中一个。
步骤5)将选定的冗余特征从计算强度候选特征集中剔除,获得新的计算强度候选特征集,转步骤3)迭代进行下一次回归分析;
步骤6)结束计算强度特征提取过程,至此,冗余的计算强度特征已全部被剔除,当前回归分析模型中的自变量对应的计算强度特征即为空间计算域的计算强度特征。
本发明的创新在于借助统计分析功能,根据线性回归模型中的自变量显著性分析结果,将冗余的计算强度特征从众多的计算强度候选特征中剔除,有效地提取出空间计算域的计算强度特征,为高性能空间计算中对空间计算域的计算强度的评价奠定了基础,对实现并行计算中的负载均衡具有重要的意义。
实施例一:
为了更清晰地说明本发明的思想,下面结合附图2以矢量数据可视化空间计算域的计算强度特征的提取为实施例进行进一步的说明,在该实施例中,使用国土调查矢量数据作为实验数据,统计分析软件使用IBM SPSS,显著性目标阈值设置为0.05,空间计算域样本数为157个。具体实施步骤如下:
步骤200)选取矢量数据可视化空间计算域计算过程中的各个参数,包括可视化目标要素个数f、可视化空间范围内的地理坐标点个数d、空间要素几何类型g、可视化窗口宽度cw、可视化窗口高度ch,将这些参数选取为空间计算域的计算强度候选特征,组成计算强度候选特征集;
步骤201)使用随机数生成器在各个参数的有效取值范围内随机生成一个值,生成157个矢量数据可视化空间计算域,从中获取各个空间计算域的各个计算参数值(f,d,g,cw,ch),执行各个空间计算域的计算任务,获得每个空间计算域的计算时间t,采集空间计算域的计算样本,在每个样本中记录计算强度特征(f,d,g,cw,ch)的值和空间计算域的计算时间(t),将计算时间作为空间计算域的计算强度;
步骤202)将计算强度候选特征集中5个特征(f,d,g,cw,ch)作为自变量,计算时间(t)作为因变量,使用SPSS统计分析软件对157个计算样本进行线性回归分析,获得每个计算强度特征在线性回归模型中的显著性,判断是否所有计算强度特征的显著性都小于0.05,如果是,进入步骤205);如果否,则转步骤203)。
第一次执行该步骤的结果如表1所示:
表1第一次计算强度特征显著性分析结果
第二次执行该步骤的结果如表2所示:
表2第二次计算强度特征显著性分析结果
第三次执行该步骤的结果如表3所示:
表3第三次计算强度特征显著性分析结果
第四次执行该步骤的结果如表4所示,至此,所有计算强度特征的显著性均小于0.05,表明各个计算强度特征与计算强度之间的线性关系都是显著的,此时将转步骤205)停止计算强度特征的提取过程;
表4第四次计算强度特征显著性分析结果
步骤203)选择矢量数据可视化空间计算域的计算强度线性回归模型中显著性最高的自变量对应的计算强度特征,将其作为将要被剔除的冗余特征;
第一次执行该步骤时,显著性最高的计算强度特征是cw(见表1),将cw作为被剔除的冗余特征。
第二次执行该步骤时,显著性最高的计算强度特征是ch(见表2),将ch作为被剔除的冗余特征。
第三次执行该步骤时,显著性最高的计算强度特征是d(见表3),将d作为被剔除的冗余特征。
步骤204)将显著性最高的计算强度特征作为冗余特征从计算强度候选特征集中剔除,获得新的计算强度候选特征集,转步骤202)迭代进行下一次回归分析;
第一次执行该步骤时,将cw从计算强度候选特征集中剔除,新的计算强度候选特征集为(f,d,g,ch)。
第二次执行该步骤时,将ch从计算强度候选特征集中剔除,新的计算强度候选特征集为(f,d,g)。
第三次执行该步骤时,将d从计算强度候选特征集中剔除,新的计算强度候选特征集为(f,g)。
步骤205)结束计算强度特征提取过程,至此,冗余的计算强度特征已全部被剔除,当前回归分析模型中的自变量对应的计算强度特征为(f,g),最终将f和g提取为矢量数据可视化空间计算域的计算强度特征。
矢量数据可视化是WebGIS中最常用的功能之一,矢量数据可视化空间计算域计算强度特征的提取是对其进行计算代价估计的基础,该实施例通过统计分析手段,借助线性回归分析中各个自变量的显著性分析结果,逐步的将冗余的计算特征剔除,最终有效地提取出矢量数据可视化空间计算域的计算强度特征,即可视化目标要素个数f和空间要素几何类型g。本发明可用于提取任意类型空间计算域的计算强度特征,为空间计算域的计算强度的有效评估奠定基础并提供了技术支撑,对实现高性能空间计算中的负载均衡具有重要的意义。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (2)
1.一种空间计算域计算强度特征提取方法,其特征在于,包括以下步骤:
1)在影响空间计算域计算强度的所有因素中选取计算强度候选特征;所述计算强度候选特征包括可视化目标要素个数f、可视化空间范围内的地理坐标点个数d、空间要素几何类型g、可视化窗口宽度cw和可视化窗口高度ch;
2)采集空间计算域的n个计算样本,对每个样本记录其计算强度候选特征和对应空间计算域的计算时间,将计算时间作为空间计算域的计算强度;
3)将计算强度候选特征集中各个特征作为自变量,计算时间作为因变量,对计算样本进行线性回归分析,获得每个计算强度特征在线性回归模型中的显著性,判断是否所有计算强度特征的显著性都小于目标阈值,如果是,进入步骤6);如果否,则转步骤4);
4)选择线性回归模型中显著性最高的自变量对应的计算强度特征,将其作为冗余特征;
5)将冗余特征从计算强度候选特征集中剔除,获得新的计算强度候选特征集,转步骤3)迭代进行下一次回归分析;
6)结束计算强度特征提取过程,该线性回归模型中的自变量对应的计算强度特征即为空间计算域的计算强度特征。
2.根据权利要求1所述的空间计算域计算强度特征提取方法,其特征在于,所述步骤3)中目标阈值取值为0.05。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510600934.3A CN105260249B (zh) | 2015-09-19 | 2015-09-19 | 空间计算域计算强度特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510600934.3A CN105260249B (zh) | 2015-09-19 | 2015-09-19 | 空间计算域计算强度特征提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105260249A CN105260249A (zh) | 2016-01-20 |
CN105260249B true CN105260249B (zh) | 2019-04-23 |
Family
ID=55099951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510600934.3A Expired - Fee Related CN105260249B (zh) | 2015-09-19 | 2015-09-19 | 空间计算域计算强度特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105260249B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650774A (zh) * | 2016-10-11 | 2017-05-10 | 国云科技股份有限公司 | 一种数据分析中获取因变量与自变量回归关系的方法 |
CN107632931B (zh) * | 2017-09-08 | 2021-02-19 | 中国农业银行股份有限公司 | 一种软件缺陷描述的规范化系统及方法 |
CN110852005B (zh) * | 2019-10-21 | 2021-06-15 | 北京理工大学 | 一种大规模并行计算的自适应扩大计算域的数值模拟方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010084139A1 (en) * | 2009-01-21 | 2010-07-29 | Universiteit Gent | Geodatabase information processing |
CN102750363A (zh) * | 2012-06-13 | 2012-10-24 | 天津市规划信息中心 | 一种城市地理信息数据仓库的构建方法 |
CN103942253A (zh) * | 2014-03-18 | 2014-07-23 | 深圳市房地产评估发展中心 | 一种负载均衡的空间数据处理方法和系统 |
CN104778451A (zh) * | 2015-03-31 | 2015-07-15 | 中国科学院上海技术物理研究所 | 一种考虑草地高度因子的草地生物量遥感反演方法 |
-
2015
- 2015-09-19 CN CN201510600934.3A patent/CN105260249B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010084139A1 (en) * | 2009-01-21 | 2010-07-29 | Universiteit Gent | Geodatabase information processing |
CN102750363A (zh) * | 2012-06-13 | 2012-10-24 | 天津市规划信息中心 | 一种城市地理信息数据仓库的构建方法 |
CN103942253A (zh) * | 2014-03-18 | 2014-07-23 | 深圳市房地产评估发展中心 | 一种负载均衡的空间数据处理方法和系统 |
CN104778451A (zh) * | 2015-03-31 | 2015-07-15 | 中国科学院上海技术物理研究所 | 一种考虑草地高度因子的草地生物量遥感反演方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105260249A (zh) | 2016-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105512799B (zh) | 一种基于海量在线历史数据的电力系统暂态稳定评估方法 | |
Caro et al. | Multiple bad data identification considering measurement dependencies | |
CN105008887B (zh) | 使用非接触测量和动态响应重构技术的涡轮机叶片疲劳寿命分析 | |
CN105260249B (zh) | 空间计算域计算强度特征提取方法 | |
JP2011248885A5 (zh) | ||
RU2016149454A (ru) | Система и способ измерения дефектов в ферромагнитных материалах | |
Fernandes et al. | Pavement pathologies classification using graph-based features | |
CN107203467A (zh) | 一种分布式环境下监督学习算法的基准测试方法和装置 | |
CN109343019B (zh) | 一种地质雷达数据解释方法及装置 | |
CN105203327B (zh) | 一种应用于发动机气路分析的气路测量参数选择方法 | |
JPWO2020255413A5 (ja) | データ解析装置、データ解析方法、及びプログラム | |
CN103902798A (zh) | 数据预处理方法 | |
CN104198998A (zh) | 非均匀背景下基于聚类处理的恒虚警检测方法 | |
CN110123297A (zh) | 心率测量方法、装置、计算机设备及存储介质 | |
CN110017998A (zh) | 车辆检测方法、装置和设备 | |
CN103514445A (zh) | 基于多流形学习的带钢表面缺陷识别方法 | |
CN108615041A (zh) | 一种角点检测方法 | |
Rambli et al. | Outlier detection in a circular regression model | |
La Boissonière et al. | Atom based grain extraction and measurement of geometric properties | |
Zhou et al. | Data Inspecting and Denoising Method for Data‐Driven Stochastic Subspace Identification | |
Micelotta et al. | Dust polarization studies on MHD simulations of molecular clouds: comparison of methods for the relative-orientation analysis | |
CN106847069B (zh) | 一种鉴定地图平面数学基础的方法 | |
CN103744789B (zh) | 一种三维曲面表示的软件错误定位方法 | |
CN104298729B (zh) | 数据分类方法及装置 | |
CN106780532A (zh) | 一种面向df图的互调频率方程快速检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200723 Address after: 430074 Wuhan Road, Hongshan, Shandong Province, Lu Lu Road, No. 388, No. Patentee after: Wuhan in the big asset management Co.,Ltd. Address before: 430074 Wuhan Road, Hongshan, Shandong Province, Lu Lu Road, No. 388, No. Patentee before: CHINA University OF GEOSCIENCES (WUHAN CITY) |
|
TR01 | Transfer of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190423 Termination date: 20210919 |
|
CF01 | Termination of patent right due to non-payment of annual fee |