CN116862315A - 一种低效工业用地绩效评分方法、装置、设备及存储介质 - Google Patents
一种低效工业用地绩效评分方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116862315A CN116862315A CN202310953653.0A CN202310953653A CN116862315A CN 116862315 A CN116862315 A CN 116862315A CN 202310953653 A CN202310953653 A CN 202310953653A CN 116862315 A CN116862315 A CN 116862315A
- Authority
- CN
- China
- Prior art keywords
- training
- land
- data
- target
- performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000013077 scoring method Methods 0.000 title abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 273
- 238000000034 method Methods 0.000 claims abstract description 70
- 230000008569 process Effects 0.000 claims abstract description 29
- 238000011160 research Methods 0.000 claims abstract description 18
- 238000012163 sequencing technique Methods 0.000 claims abstract description 12
- 238000011156 evaluation Methods 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 13
- 238000013210 evaluation model Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 10
- 230000011664 signaling Effects 0.000 claims description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 8
- 230000008901 benefit Effects 0.000 description 22
- 238000011161 development Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 230000004913 activation Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 238000009430 construction management Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请属于土地研究技术领域,公开了一种低效工业用地绩效评分方法、装置、设备及存储介质,该方法包括:获取包括多个训练土地块的训练样本;基于层次分析法得到训练样本中各训练土地块的绩效分数;基于土地多源数据得到各训练土地块的训练特征;基于各训练土地块的绩效分数和训练特征构建多个样本对;将各样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型;获取目标土地块和训练样本中绩效分数最高的训练土地块;基于土地多源数据得到目标土地块的目标特征;将目标特征和绩效分数最高的训练土地块的训练特征输入训练好的评分预测模型,得到目标土地块的目标绩效评分。本申请可以使标绩效评分的计算更加客观、科学,准确性更高。
Description
技术领域
本申请涉及土地研究技术领域,尤其涉及一种低效工业用地绩效评分方法、装置、设备及存储介质。
背景技术
在现有研究和实践探索中,“城镇低效用地”的定义得以明确,即布局散乱、利用粗放、用途不合理、建筑危旧的城镇存量建设用地;然而,在国土空间规划建设管理工作全域覆盖、全要素管控、全过程统筹的发展要求下,低效用地的研究范畴由城镇扩展至城乡。本申请的研究对象“低效工业用地”(简称低效用地)特指处于闲置、遗弃状态,或已利用但效率低下,投资强度、开发强度、土地产出率、环保和能耗不符合要求,公服设施或基础设施配置不达标,土地价值未完全显化的存量城乡工业用地。面对低效工业用地数量巨大、分布零散、类型多样、数据获取难、形成机制复杂等特征,已有研究普遍采用主成分分析法、线性加权法、熵权法等方法计算土地利用绩效得分,其中无论是指标、权重的确定,还是判别低效的标准都较为主观,导致低效工业用地的绩效评分不够准确、科学有效性差。
发明内容
本申请提供了一种低效工业用地绩效评分方法、装置、设备及存储介质,能够减少计算绩效分数时主观因素的加入和作用,且构建样本对的操作使模型的训练具有更好的准确性、稳定新和拓展性,从而使得对目标土地块的目标绩效评分的计算更加客观、科学,准确性更高。
第一方面,本申请实施例提供了一种低效工业用地绩效评分方法,该方法包括:
获取包括多个训练土地块的训练样本;
基于层次分析法得到训练样本中各训练土地块的绩效分数;
获取土地多源数据,基于土地多源数据得到各训练土地块的训练特征;
基于各训练土地块的绩效分数和训练特征构建多个样本对;
将各样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型;
获取目标土地块和训练样本中绩效分数最高的训练土地块;
基于土地多源数据得到目标土地块的目标特征;
将目标特征和绩效分数最高的训练土地块的训练特征输入训练好的评分预测模型,得到目标土地块的目标绩效评分。
进一步的,上述基于层次分析法得到土地训练样本中各个训练土地块的绩效分数,包括:
采用层次分析法构建总体评价模型;
获取低效用地历史指标数据和各训练土地块的训练指标数据;
根据低效用地历史指标数据确定总体评价模型中的多个评价要素;
基于特尔斐法和熵值法确定各评价要素的要素权重;
根据训练指标数据得到各训练土地块对应各评价要素的要素评分;
基于自然断点法、各要素权重和各训练土地块对应的各要素评分进行计算,得到各训练土地块的绩效分数。
进一步的,训练指标数据包括各训练土地块的三调用地数据、四标四实数据、税务部门数据、租金数据、地价数据、手机信令数据、公共服务设施点数据、生态数据、水源数据、企业数据、科研机构数据和孵化器数据。
进一步的,评价要素包括:容积率、建筑密度、建筑质量、单位税收、单位销售收入、租金水平、基准地价、就业人口密度、配套服务水平、绿地率、生态管控冲突率、高新企业、科研机构和孵化器。
进一步的,上述基于各训练土地块的绩效分数和训练特征构建多个样本对,包括:
将训练样本作为待选取队列;
选取步骤:在待选取队列中随机进行选取,得到第一土地块;
将训练样本中除第一土地块以外的各训练土地块均作为第二土地块;
将第一土地块的训练特征作为第一训练特征;
将各第二土地块的训练特征均作为第二训练特征;
将第一训练特征分别与各第二训练特征进行匹配,得到多个样本对;
判断第一土地块的绩效分数是否大于第二训练特征对应的第二土地块的绩效分数;若是,则样本对的标签为第一预设值,否则为第二预设值;
将第一土地块从待选取样本剔除后返回选取步骤,直至待选取队列为空。
进一步的,预训练排序模型包括第一编码器、第二编码器、连接器和预测网络;上述将各样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型,包括:
步骤S51,将样本对中的第一训练特征输入第一编码器,得到第一特征向量;
步骤S52,将样本对中的第二训练特征输入第二编码器,得到第二特征向量:
步骤S53,将第一特征向量和第二特征向量输入连接器,得到连接特征;
步骤S54,将连接特征输入预测网络进行预测,得到预测结果;
步骤S55,根据预测结果和样本对的标签对预测网络的损失函数进行优化;
步骤S56,重复步骤S51-S55,直至损失函数达到预设值,得到训练好的评分预测模型。
进一步的,土地多源数据包括各训练土地块和目标土地块的道路数据、经济产出数据、手机信令数据、夜间灯光数据、企业数据、位置服务数据、知识产权数据、高分辨率遥感数据和三调用地数据。
第二方面,本申请实施例提供了一种低效工业用地绩效评分装置,该装置包括:
第一获取模块,用于获取包括多个训练土地块的训练样本;
绩效获取模块,用于基于层次分析法得到训练样本中各训练土地块的绩效分数;
第一特征模块,用于获取土地多源数据,基于土地多源数据得到各训练土地块的训练特征;
构建模块,用于基于各训练土地块的绩效分数和训练特征构建多个样本对;
训练模块,用于将各样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型;
第二获取模块,用于获取目标土地块和训练样本中绩效分数最高的训练土地块;
第二特征模块,用于基于土地多源数据得到目标土地块的目标特征;
评分模块,用于将目标特征和绩效分数最高的训练土地块的训练特征输入训练好的评分预测模型,得到目标土地块的目标绩效评分。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时执行如上述任一实施例的一种低效工业用地绩效评分方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一实施例的一种低效工业用地绩效评分方法的步骤。
综上,与现有技术相比,本申请实施例提供的技术方案带来的有益效果至少包括:
本申请提供的一种低效工业用地绩效评分方法,通过基于层次分析法和土地多源数据得到的训练样本中各个训练土地块的绩效分数和训练特征,来构建样本对,并将多个样本对输入预训练排序模型中进行训练,利用训练好的评分预测模型实现对目标土地块的绩效的评分;上述方法中评分预测模型的训练和使用过程减少了计算绩效分数时主观因素的加入和作用,同时构建样本对的操作避免了训练样本数量不足的问题,使模型的训练具有更好的准确性、稳定新和拓展性,从而使得对目标土地块的目标绩效评分的计算更加客观、科学,准确性更高。
附图说明
图1为本申请一个示例性实施例提供的一种低效工业用地绩效评分方法的流程图。
图2为本申请一个示例性实施例提供的绩效分数计算步骤的流程图。
图3为本申请又一个示例性实施例提供的绩效分数计算步骤的流程图。
图4为本申请一个示例性实施例提供的样本对构建步骤的流程图。
图5为本申请一个示例性实施例提供的预训练排序模型的结构图。
图6为本申请一个示例性实施例提供的模型训练步骤的流程图。
图7为本申请一个示例性实施例提供的一种低效工业用地绩效评分装置的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参见图1,本申请实施例提供了一种低效工业用地绩效评分方法,该方法具体包括:
步骤S1,获取包括多个训练土地块的训练样本。
其中,训练样本中的各个训练土地块均为低效工业用地。
步骤S2,基于层次分析法得到训练样本中各训练土地块的绩效分数。
具体地,请参见图2,首先利用AHP层次分析法构建总体评价模型,总体评价模型包括建立目标层、准则层、要素层三级评价结构,目标层即本次的研究目标(绩效分数),准则层包括土地开发强度、经济效益、社会效益、环境效益、创新能力等五个维度,要素层即评价要素,土地开发强度包括容积率、建筑密度和建筑质量;经济效益包括单位销售收入、单位税收、基准地价和租金水平;社会效益包括就业人口密度和配套服务水平;环境效益包括生态管控冲突率、绿地率;创新能力包括高新企业、科研机构和孵化器。
“选取评价要素”必须包括土地开发强度、经济效益、社会效益、环境效益、创新能力等五个维度,缺一不可,此处主要结合低效用地历史指标数据,即某些省份的政策文件中相对成熟的低效用地评价依据成果;确定指标权重包括采用特尔斐法(专家打分法)和熵值法确定各评价要素的要素权重;“构建评价模型”是综合上述评价要素和要素权重后,对每块训练土地块的综合评分,包括给每块训练土地块不同评价要素的客观赋值、结合要素权重综合判定图斑的用地效益;“确定评价标准”中使用自然断点法对训练土地块计算最终的绩效分数,即测算每块训练土地块在各评价要素的综合作用下的工业使用效益评价结果,其作用是根据规划价值判断和实际项目经验判断低效利用、中度利用、集约利用的评价阈值。
上述内容中提到的特尔斐法、熵值法、自然断点法等均是已有项目实践和文献研究中的常用方法,因此本申请不在此处做过多赘述。
步骤S3,获取土地多源数据,基于土地多源数据得到各训练土地块的训练特征。
其中,土地多源数据包括各训练土地块和目标土地块的道路数据、经济产出数据、手机信令数据、夜间灯光数据、企业数据、位置服务数据、知识产权数据、高分辨率遥感数据和三调用地数据。本申请基于这些数据提取出来了13种具有代表性与普适性的土地特征,作为土地绩效评估的指标,包括:区位、经济产出、就业人口数量、夜间灯光强度、工业企业点数量、工业企业注册资本数量、是否在产业园区内、生产服务设施数量、发明专利数量、基础设施数量、道路网密度、容积率和建筑量。
步骤S4,基于各训练土地块的绩效分数和训练特征构建多个样本对。
具体地,样本对包含两个部分,一是训练特征,二是标签;训练特征作为模型的输入,标签用来验证预训练排序模型的输出:在构建样本对的时候,会采用两两配对的方式,假设有1到100号100个训练土地块,那么1号的训练特征会跟2-100号的训练特征分别形成99组样本对,2号的训练特征会跟1号以及3到100号的训练特征形成99组样本对。所以,原则上,对于n个训练土地块的训练样本,可以形成n*(n-1)个样本对。在形成样本对的过程中,假设令1号的训练特征会跟2-100号的训练特征分别形成99组样本对,则在1号的训练特征L1和2号的训练特征L2构成样本对(L1,L2)后,判断1号的绩效分数和2号的绩效分数谁大谁小,若1号的绩效分数大于2号的,则样本对(L1,L2)的标签为1,否则标签为0;假设令2号的训练特征会跟1号以及3到100号的训练特征形成99组样本对,则在2号的训练特征L2和1号的训练特征L1构成样本对(L2,L1)后,判断2号的绩效分数和1号的绩效分数谁大谁小,若2号的绩效分数小于1号的,则样本对(L2,L1)的标签为0,否则标签为1。
步骤S5,将各样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型。
步骤S6,获取目标土地块和训练样本中绩效分数最高的训练土地块。
其中,目标土地块即为要评分的低效工业用地。
步骤S7,基于土地多源数据得到目标土地块的目标特征。
土地多源数据为低效工业用地的多源数据,因此目标特征和训练特征均可以由此得到。
步骤S8,将目标特征和绩效分数最高的训练土地块的训练特征输入训练好的评分预测模型,得到目标土地块的目标绩效评分。
具体地,可以将绩效分数最高的训练土地块作为标准地块,训练好的评分预测模型可以根据目标特征和标准地块的训练特征计算得到目标土地块比标准地块的排序大(即绩效分数大)的概率,然后把这个概率作为目标土地块的目标绩效评分。
上述实施例提供的一种低效工业用地绩效评分方法,通过基于层次分析法和土地多源数据得到的训练样本中各个训练土地块的绩效分数和训练特征,来构建样本对,并将多个样本对输入预训练排序模型中进行训练,利用训练好的评分预测模型实现对目标土地块的绩效的评分;上述方法中评分预测模型的训练和使用过程减少了计算绩效分数时主观因素的加入和作用,同时构建样本对的操作避免了训练样本数量不足的问题,使模型的训练具有更好的准确性、稳定新和拓展性,从而使得对目标土地块的目标绩效评分的计算更加客观、科学,准确性更高。
请参见图2和图3,在一些实施例中,上述基于层次分析法得到土地训练样本中各个训练土地块的绩效分数,具体可以包括:
步骤S21,采用层次分析法构建总体评价模型。
步骤S22,获取低效用地历史指标数据和各训练土地块的训练指标数据。
其中,低效用地历史指标数据和训练指标数据所包括的数据种类均为表1中所示,区别只在于地域位置和时间不同,例如低效用地历史指标数据为A省、B省在过去3-5年的指标数据,而训练指标数据为训练土地块在当前时间的指标数据。
步骤S23,根据低效用地历史指标数据确定总体评价模型中的多个评价要素。
步骤S24,基于特尔斐法和熵值法确定各评价要素的要素权重。
步骤S25,根据训练指标数据得到各训练土地块对应各评价要素的要素评分。
步骤S26,基于自然断点法、各要素权重和各训练土地块对应的各要素评分进行计算,得到各训练土地块的绩效分数。
请参见下面表1,首先利用AHP层次分析法构建总体评价模型,总体评价模型包括建立目标层、准则层、要素层三级评价结构,目标层即本次的研究目标(绩效分数),准则层包括土地开发强度、经济效益、社会效益、环境效益、创新能力等五个维度,要素层即评价要素,土地开发强度包括容积率、建筑密度和建筑质量;经济效益包括单位销售收入、单位税收、基准地价和租金水平;社会效益包括就业人口密度和配套服务水平;环境效益包括生态管控冲突率(与生态管控要素冲突情况)、绿地率;创新能力包括高新企业、科研机构和孵化器。
“选取评价要素”必须包括土地开发强度、经济效益、社会效益、环境效益、创新能力等五个维度,缺一不可,此处主要结合低效用地历史指标数据,即某些省份的政策文件中相对成熟的低效用地评价依据成果;确定指标权重包括采用特尔斐法(专家打分法)和熵值法确定各评价要素的要素权重;“构建评价模型”是综合上述评价要素和要素权重后,对每块训练土地块的综合评分,包括给每块训练土地块不同评价要素的客观赋值、结合要素权重综合判定图斑的用地效益;“确定评价标准”中使用自然断点法对训练土地块计算最终的绩效分数,即测算每块训练土地块在各评价要素的综合作用下的工业使用效益评价结果,其作用是根据规划价值判断和实际项目经验判断低效利用、中度利用、集约利用的评价阈值。
表1.评价要素与来源指标数据
由上述表1可知,训练指标数据包括各训练土地块的三调用地数据、四标四实数据、税务部门数据、租金数据、地价数据(国有建设用地使用权基准地价数据)、手机信令数据、公共服务设施点数据、生态数据(生态保护红线)、水源数据(水源保护区数据)、企业数据(高新企业数据)、科研机构数据和孵化器数据。评价要素包括:容积率、建筑密度、建筑质量、单位税收、单位销售收入、租金水平、基准地价、就业人口密度、配套服务水平、绿地率、生态管控冲突率(与生态管控要素冲突情况)、高新企业、科研机构和孵化器。
上述实施例解决了已有研究多基于自下而上的逐级摸底调查或传统统计数据收集,耗时长、精度低、范围小且更新慢,难以推广应用的问题,上述实施例所采用的这些指标数据普适易得的且具有代表性,获取难度低、覆盖范围广、更新频率高,使本申请具有更强的推广意义。
请参见图4,在一些实施例中,上述基于各训练土地块的绩效分数和训练特征构建多个样本对,具体可以包括:
步骤S41,将训练样本作为待选取队列。
步骤S42,在待选取队列中随机进行选取,得到第一土地块。
步骤S43,将训练样本中除第一土地块以外的各训练土地块均作为第二土地块。
步骤S44,将第一土地块的训练特征作为第一训练特征。
步骤S45,将各第二土地块的训练特征均作为第二训练特征。
步骤S46,将第一训练特征分别与各第二训练特征进行匹配,得到多个样本对。
步骤S47,判断第一土地块的绩效分数是否大于第二训练特征对应的第二土地块的绩效分数;若是,则样本对的标签为第一预设值,否则为第二预设值。
步骤S48,将第一土地块从待选取样本剔除后返回步骤S42,直至待选取队列为空。
具体地,在不对训练土地块进行编号时,可以采用待选取队列的方式,令每一个训练土地块的训练特征都分别与其他所有训练土地块的训练特征组成样本对,同时避免样本对重复。
在训练土地块有编号的情况下,待选取队列便可按编号来逐次构建样本对:假设有1到100号100个训练土地块,那么1号的训练特征会跟2-100号的训练特征分别形成99组样本对,2号的训练特征会跟1号以及3到100号的训练特征形成99组样本对。所以,原则上,对于n个训练土地块的训练样本,可以形成n*(n-1)个样本对。在形成样本对的过程中,假设令1号的训练特征会跟2-100号的训练特征分别形成99组样本对,则在1号的训练特征L1和2号的训练特征L2构成样本对(L1,L2)后,判断1号的绩效分数和2号的绩效分数谁大谁小,若1号的绩效分数大于2号的,则样本对(L1,L2)的标签为1,否则标签为0;假设令2号的训练特征会跟1号以及3到100号的训练特征形成99组样本对,则在2号的训练特征L2和1号的训练特征L1构成样本对(L2,L1)后,判断2号的绩效分数和1号的绩效分数谁大谁小,若2号的绩效分数小于1号的,则样本对(L2,L1)的标签为0,否则标签为1。
上述实施例的操作大大增加了用来训练模型的样本数量,有效避免了训练样本数量不足、样本标签不均匀的影响,时被训练的模型具有更好的准确性、稳定性与拓展性,从而令目标绩效评分的计算更加客观高效和准确。
在一些实施例中,请参见图5和图6,预训练排序模型包括第一编码器、第二编码器、连接器和预测网络;上述将各样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型,具体可以包括:
步骤S51,将样本对中的第一训练特征输入第一编码器,得到第一特征向量。
步骤S52,将样本对中的第二训练特征输入第二编码器,得到第二特征向量。
步骤S53,将第一特征向量和第二特征向量输入连接器,得到连接特征。
步骤S54,将连接特征输入预测网络进行预测,得到预测结果。
步骤S55,根据预测结果和样本对的标签对预测网络的损失函数进行优化。
步骤S56,重复步骤S51-S55,直至损失函数达到预设值,得到训练好的评分预测模型。
具体地,对于样本对(第一训练特征)与/>(第二训练特征),分别作为第一编码器和第二编码器的输入,得到编码后的第一特征向量/>与第二特征向量/>
其中W1、W2、b1、b2为可学习的参数,Relu(·)表示Relu激活函数。通过引入激活函数,可以增加模型非线性表达能力。值得注意的是,两个编码器均可根据需要叠加多层网络,本申请的实施例中目前只呈现出利用两层的全连接神经网络进行编码的情况。
请注意,第一编码器和第二编码器共享权重,为同一个神经网络。
接着,将编码后的两个特征向量输入连接器进行连接:
其中表示连接特征,Concat(·)表示两个特征向量的连接函数。
之后,将样本对的连接特征作为预测网络的输入,得到预测结果:
其中r1,2为预测结果,Sigmoid(·)与Relu(·)分别为激活函数,W3、W4、b3、b4均为可学习参数。当r1,2>0.5,则认为该样本对的预测结果为1;否则为0。
本申请采用交叉熵损失函数作为损失函数,利用Adam优化器对模型进行训练,在二分类的情况下,模型最后需要达到的预测结果只有两种,对于每个预测结果得到的预测概率分别为p和1-p;此时的损失函数的预设值可以表示为:
其中,yi为第i个样本对的标签;pi表示第i个样本对预测结果为正确(即预测结果=样本对的标签)的概率,N为构建的样本对的数量。
在预测阶段,对于需要评分的目标土地块l,首先提取其目标特征接着,从训练样本中选取绩效分数最高的训练土地地块,同样得到其训练特征/>(若分数最高的训练土地块存在多个,则对它们的每个训练特征取平均)。接着,将/>与/>作为训练好的评分预测模型的输入,得到最后的结果r,作为目标土地块的目标绩效评分:
其中,W3、W4、b3、b4均为模型训练过程中已经训练好的模型参数。
在一实施例中,土地多源数据包括各训练土地块和目标土地块的道路数据(按内环路、环城高速、绕城高速划分)、经济产出数据(基于区位、土地利用、人类活动、生产活动和设施配置等维度的多源数据,构建宗地尺度经济产出数据精细化模拟)、手机信令数据、夜间灯光数据、企业数据、位置服务(POI)数据、知识产权数据、高分辨率遥感数据和三调用地数据。
请参见表2,具体地,土地多源数据包括所有低效工业用地的多源数据,既包括训练土地块的,也包括待预测的目标土地块的,因此训练特征和目标特征均可通过土地多源数据获得。
表2.特征与对应来源的土地多源数据
本申请基于这些数据提取出来了13种具有代表性与普适性的土地特征,作为土地绩效评估的指标,包括:区位、经济产出、就业人口数量、夜间灯光强度、工业企业点数量、工业企业注册资本数量、是否在产业园区内、生产服务设施数量、发明专利数量、基础设施数量、道路网密度、容积率和建筑量。上述训练特征和目标特征均包括这13种特征指标。
上述实施例给出的这些土地多源数据和指标数据一样普适易得,具有获取难度低、覆盖范围广、更新频率高的特点,使本申请更容易被推广应用。
请参见图7,本申请另一实施例提供了一种低效工业用地绩效评分装置,该装置包括:
第一获取模块101,用于获取包括多个训练土地块的训练样本。
绩效获取模块102,用于基于层次分析法得到训练样本中各训练土地块的绩效分数。
第一特征模块103,用于获取土地多源数据,基于土地多源数据得到各训练土地块的训练特征。
构建模块104,用于基于各训练土地块的绩效分数和训练特征构建多个样本对。
训练模块105,用于将各样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型。
第二获取模块106,用于获取目标土地块和训练样本中绩效分数最高的训练土地块。
第二特征模块107,用于基于土地多源数据得到目标土地块的目标特征。
评分模块108,用于将目标特征和绩效分数最高的训练土地块的训练特征输入训练好的评分预测模型,得到目标土地块的目标绩效评分。
上述实施例提供的一种低效工业用地绩效评分装置,通过基于层次分析法和土地多源数据得到的训练样本中各个训练土地块的绩效分数和训练特征,来构建样本对,并将多个样本对输入预训练排序模型中进行训练,利用训练好的评分预测模型实现对目标土地块的绩效的评分;上述装置中评分预测模型的训练和使用过程减少了计算绩效分数时主观因素的加入和作用,同时构建样本对的操作避免了训练样本数量不足的问题,使模型的训练具有更好的准确性、稳定新和拓展性,从而使得对目标土地块的目标绩效评分的计算更加客观、科学,准确性更高。
本实施例中提供的关于一种低效工业用地绩效评分装置的具体限定,可以参见上文中关于一种低效工业用地绩效评分方法的实施例,于此不再赘述。上述一种低效工业用地绩效评分装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本申请实施例提供了一种计算机设备,该计算机设备可以包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。处计算机程序被处理器执行时,使得处理器执行如上述任一实施例的一种低效工业用地绩效评分方法的步骤。
本实施例提供的计算机设备的工作过程、工作细节和技术效果,可以参见上文中关于一种低效工业用地绩效评分方法的实施例,于此不再赘述。
本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一实施例的一种低效工业用地绩效评分方法的步骤。其中,所述计算机可读存储介质是指存储数据的载体,可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等,所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。本实施例提供的计算机可读存储介质的工作过程、工作细节和技术效果,可以参见上文中关于一种低效工业用地绩效评分方法的实施例,于此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种低效工业用地绩效评分方法,其特征在于,所述方法包括:
获取包括多个训练土地块的训练样本;
基于层次分析法得到所述训练样本中各所述训练土地块的绩效分数;
获取土地多源数据,基于所述土地多源数据得到各所述训练土地块的训练特征;
基于各所述训练土地块的所述绩效分数和所述训练特征构建多个样本对;
将各所述样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型;
获取目标土地块和所述训练样本中绩效分数最高的训练土地块;
基于所述土地多源数据得到所述目标土地块的目标特征;
将所述目标特征和绩效分数最高的所述训练土地块的所述训练特征输入所述训练好的评分预测模型,得到所述目标土地块的目标绩效评分。
2.根据权利要求1所述的方法,其特征在于,所述基于层次分析法得到土地训练样本中各个训练土地块的绩效分数,包括:
采用所述层次分析法构建总体评价模型;
获取低效用地历史指标数据和各所述训练土地块的训练指标数据;
根据所述低效用地历史指标数据确定所述总体评价模型中的多个评价要素;
基于特尔斐法和熵值法确定各所述评价要素的要素权重;
根据所述训练指标数据得到各所述训练土地块对应各所述评价要素的要素评分;
基于自然断点法、各所述要素权重和各所述训练土地块对应的各所述要素评分进行计算,得到各所述训练土地块的所述绩效分数。
3.根据权利要求2所述的方法,其特征在于,所述训练指标数据包括各所述训练土地块的三调用地数据、四标四实数据、税务部门数据、租金数据、地价数据、手机信令数据、公共服务设施点数据、生态数据、水源数据、企业数据、科研机构数据和孵化器数据。
4.根据权利要求2所述的方法,其特征在于,所述评价要素包括:容积率、建筑密度、建筑质量、单位税收、单位销售收入、租金水平、基准地价、就业人口密度、配套服务水平、绿地率、生态管控冲突率、高新企业、科研机构和孵化器。
5.根据权利要求1所述的方法,其特征在于,所述基于各所述训练土地块的所述绩效分数和所述训练特征构建多个样本对,包括:
将所述训练样本作为待选取队列;
选取步骤:在所述待选取队列中随机进行选取,得到第一土地块;
将所述训练样本中除所述第一土地块以外的各所述训练土地块均作为第二土地块;
将所述第一土地块的所述训练特征作为第一训练特征;
将各所述第二土地块的所述训练特征均作为第二训练特征;
将所述第一训练特征分别与各所述第二训练特征进行匹配,得到多个所述样本对;
判断所述第一土地块的所述绩效分数是否大于所述第二训练特征对应的所述第二土地块的所述绩效分数;若是,则所述样本对的标签为第一预设值,否则为第二预设值;
将所述第一土地块从所述待选取样本剔除后返回所述选取步骤,直至所述待选取队列为空。
6.根据权利要求5所述的方法,其特征在于,所述预训练排序模型包括第一编码器、第二编码器、连接器和预测网络;
所述将各所述样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型,包括:
步骤S51,将所述样本对中的第一训练特征输入第一编码器,得到第一特征向量;
步骤S52,将所述样本对中的第二训练特征输入第二编码器,得到第二特征向量:
步骤S53,将所述第一特征向量和所述第二特征向量输入所述连接器,得到连接特征;
步骤S54,将所述连接特征输入所述预测网络进行预测,得到预测结果;
步骤S55,根据所述预测结果和所述样本对的标签对所述预测网络的损失函数进行优化;
步骤S56,重复步骤S51-S55,直至所述损失函数达到预设值,得到所述训练好的评分预测模型。
7.根据权利要求1所述的方法,其特征在于,所述土地多源数据包括各所述训练土地块和所述目标土地块的道路数据、经济产出数据、手机信令数据、夜间灯光数据、企业数据、位置服务数据、知识产权数据、高分辨率遥感数据和三调用地数据。
8.一种低效工业用地绩效评分装置,其特征在于,所述装置包括:
第一获取模块,用于获取包括多个训练土地块的训练样本;
绩效获取模块,用于基于层次分析法得到所述训练样本中各所述训练土地块的绩效分数;
第一特征模块,用于获取土地多源数据,基于所述土地多源数据得到各所述训练土地块的训练特征;
构建模块,用于基于各所述训练土地块的所述绩效分数和所述训练特征构建多个样本对;
训练模块,用于将各所述样本对输入预训练排序模型中进行训练,得到训练好的评分预测模型;
第二获取模块,用于获取目标土地块和所述训练样本中绩效分数最高的训练土地块;
第二特征模块,用于基于所述土地多源数据得到所述目标土地块的目标特征;
评分模块,用于将所述目标特征和绩效分数最高的所述训练土地块的所述训练特征输入所述训练好的评分预测模型,得到所述目标土地块的目标绩效评分。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310953653.0A CN116862315A (zh) | 2023-07-31 | 2023-07-31 | 一种低效工业用地绩效评分方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310953653.0A CN116862315A (zh) | 2023-07-31 | 2023-07-31 | 一种低效工业用地绩效评分方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116862315A true CN116862315A (zh) | 2023-10-10 |
Family
ID=88232259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310953653.0A Pending CN116862315A (zh) | 2023-07-31 | 2023-07-31 | 一种低效工业用地绩效评分方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116862315A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117829684A (zh) * | 2024-03-04 | 2024-04-05 | 中国科学院地理科学与资源研究所 | 一种生态环境质量的评估方法及相关设备 |
-
2023
- 2023-07-31 CN CN202310953653.0A patent/CN116862315A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117829684A (zh) * | 2024-03-04 | 2024-04-05 | 中国科学院地理科学与资源研究所 | 一种生态环境质量的评估方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Long-term traffic prediction based on lstm encoder-decoder architecture | |
CN109034448B (zh) | 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法 | |
He et al. | Mining transition rules of cellular automata for simulating urban expansion by using the deep learning techniques | |
Feng et al. | A heuristic cellular automata approach for modelling urban land-use change based on simulated annealing | |
CN110969290A (zh) | 一种基于深度学习的径流概率预测方法及系统 | |
CN109409561B (zh) | 多时间尺度时间序列协同预测模型的构建方法 | |
CN116862315A (zh) | 一种低效工业用地绩效评分方法、装置、设备及存储介质 | |
CN116128282A (zh) | 基于轨迹预测的目标人员动态风险预警方法及相关设备 | |
CN112949784B (zh) | 一种居民出行链模型构建方法及居民出行链获取方法 | |
CN104732091A (zh) | 基于自然选择蚁群算法的元胞自动机河床演变预测方法 | |
Xiao et al. | Modeling dynamic land use changes in the eastern portion of the hexi corridor, China by cnn-gru hybrid model | |
CN110310012B (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN109214610B (zh) | 一种基于长短期记忆神经网络的饱和电力负荷预测方法 | |
Zhai et al. | Using spatial heterogeneity to strengthen the neighbourhood effects of urban growth simulation models | |
CN114529154A (zh) | 人口规模预测指标体系的构建方法、预测方法、装置及系统 | |
CN116756695B (zh) | 一种融合地理特征和流特征的城市功能协同优化方法 | |
Guo et al. | Simulating urban growth by coupling macro-processes and micro-dynamics: a case study on Wuhan, China | |
CN110264010B (zh) | 新型乡村电力饱和负荷预测方法 | |
Feng et al. | The effects of factor generalization scales on the reproduction of dynamic urban growth | |
Lin | [Retracted] Big Data Technology in the Macrodecision‐Making Model of Regional Industrial Economic Information Applied Research | |
CN112418508B (zh) | 基于物理空间与社交网络空间交互的人口分布预测方法 | |
CN110728403B (zh) | 农村中长期电网负荷预测方法 | |
Verheugd | Predicting water pipe failures: A Neural Hawkes Process approach | |
Yang | [Retracted] Urban Traffic Flow Prediction with Deep Neural Network | |
Fang et al. | An attention-based deep learning model for multi-horizon time series forecasting by considering periodic characteristic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |