CN109146563A - 一种基于迁移学习的城市住宅地价评估方法 - Google Patents
一种基于迁移学习的城市住宅地价评估方法 Download PDFInfo
- Publication number
- CN109146563A CN109146563A CN201810920928.XA CN201810920928A CN109146563A CN 109146563 A CN109146563 A CN 109146563A CN 201810920928 A CN201810920928 A CN 201810920928A CN 109146563 A CN109146563 A CN 109146563A
- Authority
- CN
- China
- Prior art keywords
- price
- land price
- layer
- land
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0278—Product appraisal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Abstract
本发明公开了一种基于迁移学习的城市住宅地价评估方法,该方法涉及迁移学习的平复方法,属于资产评估领域,特别是在土地价格分类定级领域。本发明主要针对城市住宅地价数据集的特点,提出了一种基于迁移学习的城市住宅地价特征提取算法,针对现有地价回归评估模型的缺点,引入分类定级评估模型,对城市住宅地价数据集的缺陷进行克服。首先,对地价特征提取器进行训练,基于房价数据集,使用深度置信网络(Deep Belief Network,DBN)对蕴含在房价数据集中的房价与其特征因子之间的关系进行拟合。其次,保留训练好的DBN模型参数设置,基于DBN模型进行住宅地价特征提取。最后,基于已提取到地价特征集,利用不同的地价分类评估模型,对住宅地价实施分类定级评估。
Description
技术领域
本发明涉及迁移学习的平复方法,属于资产评估领域,特别是在土地价格分类定级领域。
背景技术
城市住宅地价评估是土地市场管理的重要内容之一,常规的住宅地价评估方法主要包含特征选取、特征量化、特征提取、主体建模、地价评估等步骤。其中,住宅地价特征量化过程中存在主观性量化误差,住宅地价数据存在样本总量小、类别不平衡等缺陷。现有的城市住宅地价评估方法主要基于BP神经网络和曲面拟合模型对住宅地价与其影响因子之间的非线性关系进行拟合,忽略了特征量化过程中引入的主观误差以及住宅地价数据的缺陷,由此得到得的住宅地价回归模型将很难模拟出住宅地价与其影响因子的准确关系,现有的城市住宅地价评估方法就具有周期长、低效率、误差大等缺点。因此,提出一种适合住宅地价数据特征的快速评估方法很有必要,其研究成果具有很高的应用价值。
发明内容
针对上述城市住宅地价数据缺陷给模型训练带来的挑战,本发明提出了一种新的城市住宅地价评估框架,并针对城市住宅地价的数据特点,提出了新的城市住宅地价特征提取算法。
本发明主要针对城市住宅地价数据集的特点,提出了一种基于迁移学习的城市住宅地价特征提取算法,针对现有地价回归评估模型的缺点,引入分类定级评估模型,对城市住宅地价数据集的缺陷进行克服。首先,对地价特征提取器进行训练,基于房价数据集,使用深度置信网络(Deep Belief Network,DBN)对蕴含在房价数据集中的房价与其特征因子之间的关系进行拟合。其次,保留训练好的DBN模型参数设置,基于DBN模型进行住宅地价特征提取。最后,基于已提取到地价特征集,利用不同的地价分类评估模型,对住宅地价实施分类定级评估。因此本发明的技术方案为一种基于迁移学习的城市住宅地价评估方法,该方法包括:
步骤1:收集待评估区域中各地块的地价和不同类型房屋的房价,收集影响各地块地价与住宅房屋价格的影响因子,确定各影响因子对地价和房价的影响权重;
步骤2:确定两个待训练的DBN模型,并采用步骤1得到的各地块不同类型房屋的房价数据对两个待训练的DBN模型进行训练;
其中一个为降维型DBN模型包括:输入层,中间三层隐含层,输出层;该降维型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数小于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;
另一个为扩展型DBN模型包括:输入层,中间三层隐含层,输出层;该扩展型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数大于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;
步骤3:将步骤1中影响各地块价格的影响因子作为步骤2训练好的两个DBN模型的输入,获得每层隐含层的输出,将两个DBN模型中每层隐含层的输出组成集合作为各地块地价的特征集;
步骤4:确定3个地价评估模型:BP神经网络模型、支持向量机(Support VectorMachine,SVM)模型、随机森林模型,采用各地块的地价和其对应的特征集对3个地价评估模型进行训练;
步骤5:对无标签地块的价格进行评估;
步骤5.1:获取对无标签地块有影响的影响因子,各影响因子的影响权重与步骤1中影响权重相同;
步骤5.2:采用步骤3的方法获得该无标签地块的特征集;
步骤5.3:分别采用BP神经网络模型、SVM模型、随机森林模型来确定城市住宅地价无标签地块的价格,再对个模型评估的价格求平均得到最终的评估价格。
步骤5.4:根据步骤5.2的特征集,采用步骤5.3确定的地价评估模型评估出该无标签地块的地价。
进一步的,所述影响因子为下列影响因子中的一项或多项:城市快速路、高速公路、公交、地铁、中学、小学、幼稚园、商服发达度、医院、餐饮网点密度、金融服务网点密度、汽车服务网点密度、公园绿地、旅游景区、区域规划前景、人口密度。
进一步的,所述步骤4中首先对各地块地价进行归一化处理,将归一化处理后的数据和其对应的特征集对3个地价评估模型进行训练。
通过基于迁移学习的城市住宅地价分类评估方法,可以对于一座城市的地价进行快速而准确地评估,减少地价的小样本性对地价评估带来的致命缺陷,提高模型的准确拟合程度,从而提高地价评估精度。
附图说明
图1为基于迁移学习的城市住宅地价评估框架图;
图2为基于迁移学习的城市住宅地价特征提取算法流程图;
图3为地价数据箱式图示意图;
图4为地价数据归一化分维可视化图;
图5为SVM不同训练数据交叉验证结果图;
图6为BP神经网络交叉验证结果图;
图7为不同特征集关于三种模型平均分类精度图;
图8为三种模型分类精度对比图。
具体实施方式
步骤1.根据选择的研究区域,本专利以深圳市为例,搜集了深圳市十个区县的房价与地价数据,主要包括兴趣点的坐标信息及其相关属性信息;运用德尔菲法和主成分分析方法对种类繁多的深圳市住宅地价特征因子进行分析,去除相关性强、重要程度低的特征因子,确定了包含城市快速路、高速公路、公交、地铁、中学、小学、幼稚园、商服发达度、医院、餐饮网点密度、金融服务网点密度、汽车服务网点密度、公园绿地、旅游景区、区域规划前景、人口密度等影响房价与地价的16个影响因子。对于各个影响因子的量化方式,结合各个影响因子对房地价的作用方式,分别采用绝对量化、相对量化、加权量化、等级量化的方式。
步骤2.由于DBN模型具有对数据集特征提取能力,基于降维型DBN模型各层维度为16-12-12-10-7和扩展型DBN模型各层维度为16-20-20-20-7,使用带房价类别标签的、因子信息量丰富的、类别分布均衡的房价数据对两种DBN特征提取器进行训练,并进行精度分析。其中,房价类别采用正交向量编码唯一识别,则输出层为7维向量;中间三层隐含层采用Sigmoid函数,输出层采用Softmax分类函数;同时为防止模型过拟合,对中间层采用Dropout策略,第一层设置保留系数设置为0.2,第二次至第五层保留系数设置为0.5;
步骤3.基于第二步训练好的DBN模型,保留两种模型的参数、激活函数、结构等信息,使用处理归一化处理后的地价数据集作为DBN模型的输入数据,每个模型的三个隐含层将分别获得三个不同的地价特征集,该特征集是对原始地价数据集的抽象与提取,数据集特征更接近于地价分类特征,然后将新提取特征集用于地价分类定级评估;
步骤4.对第三步优化提取的地价特征集进行分类定级评估。为防止模型选择给地价特征集评估带来的影响,使用三种不同的分类评估模型(BP神经网络、SVM模型、随机森林模型)分别对提取的地价特征集进行分类定级评估,使用分类混淆矩阵、总体分类精度及Kappa系数作为分类评估指标,取三种模型的平均分类精度作为所提取地价特征集的分类定级精度;
步骤5.基于预训练好的地价特征提取器、选取三种分类模型中分类效果最好的分类器作为地价评估模型,对无标签地块的地价进行分类定价评估;
通过以上步骤,实验结果表明迁移学习所得地价特征集分类精度高于归一化和主成分分析方法地价特征集的分类精度;距离地价特征提取器的分类层越近,所得特征集分类精度越高;三种分类模型中,整体上随机森林分类模型的分类精度最高。
其中,图1为本发明所提出的城市住宅地价评估流程图;图2为本发明的地价特征提取原理图;图3为深圳市2012年城市住宅地价216个样本点资源要素取值分布图;图4为深圳市2012年城市住宅地价216个样本点资源要素分维展示图;图5为基于SVM模型对深圳市城市住宅地价分类评估结果;图6为基于BP神经网络对深圳市城市住宅地价分类评估结果;图7为三种地价评估方法的平均分类精度图;图8为3种地价评估方法的精度比较图。
Claims (3)
1.一种基于迁移学习的城市住宅地价评估方法,该方法包括:
步骤1:收集待评估区域中各地块的地价和不同类型房屋的房价,收集影响各地块地价与住宅房屋价格的影响因子,确定各影响因子对地价和房价的影响权重;
步骤2:确定两个待训练的DBN模型,并采用步骤1得到的各地块不同类型房屋的房价数据对两个待训练的DBN模型进行训练;
其中一个为降维型DBN模型包括:输入层,中间三层隐含层,输出层;该降维型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数小于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;
另一个为扩展型DBN模型包括:输入层,中间三层隐含层,输出层;该扩展型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数大于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;
步骤3:将步骤1中影响各地块价格的影响因子作为步骤2训练好的两个DBN模型的输入,获得每层隐含层的输出,将两个DBN模型中每层隐含层的输出组成集合作为各地块地价的特征集;
步骤4:确定3个地价评估模型:BP神经网络模型、支持向量机(Support VectorMachine,SVM)模型、随机森林模型,采用各地块的地价和其对应的特征集对3个地价评估模型进行训练;
步骤5:对无标签地块的价格进行评估;
步骤5.1:获取对无标签地块有影响的影响因子,各影响因子的影响权重与步骤1中影响权重相同;
步骤5.2:采用步骤3的方法获得该无标签地块的特征集;
步骤5.3:分别采用BP神经网络模型、SVM模型、随机森林模型来确定城市住宅地价无标签地块的价格,再对个模型评估的价格求平均得到最终的评估价格。
步骤5.4:根据步骤5.2的特征集,采用步骤5.3确定的地价评估模型评估出该无标签地块的地价。
2.如权利要求1所述的一种基于迁移学习的城市住宅地价评估方法,其特征在于所述影响因子为下列影响因子中的一项或多项:城市快速路、高速公路、公交、地铁、中学、小学、幼稚园、商服发达度、医院、餐饮网点密度、金融服务网点密度、汽车服务网点密度、公园绿地、旅游景区、区域规划前景、人口密度。
3.如权利要求1所述的一种基于迁移学习的城市住宅地价评估方法,其特征在于所述步骤4中首先对各地块地价进行归一化处理,将归一化处理后的数据和其对应的特征集对3个地价评估模型进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810920928.XA CN109146563A (zh) | 2018-08-14 | 2018-08-14 | 一种基于迁移学习的城市住宅地价评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810920928.XA CN109146563A (zh) | 2018-08-14 | 2018-08-14 | 一种基于迁移学习的城市住宅地价评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109146563A true CN109146563A (zh) | 2019-01-04 |
Family
ID=64793181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810920928.XA Pending CN109146563A (zh) | 2018-08-14 | 2018-08-14 | 一种基于迁移学习的城市住宅地价评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109146563A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399569A (zh) * | 2019-07-19 | 2019-11-01 | 银联智策顾问(上海)有限公司 | 一种基于大数据评估土地价值的方法及评估装置 |
CN110490218A (zh) * | 2019-06-10 | 2019-11-22 | 内蒙古工业大学 | 一种基于两级dbn的滚动轴承故障自学习方法 |
CN111125727A (zh) * | 2019-12-03 | 2020-05-08 | 支付宝(杭州)信息技术有限公司 | 混淆电路生成方法、预测结果确定方法、装置和电子设备 |
CN117077005A (zh) * | 2023-08-21 | 2023-11-17 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
CN117077005B (zh) * | 2023-08-21 | 2024-05-10 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
-
2018
- 2018-08-14 CN CN201810920928.XA patent/CN109146563A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490218A (zh) * | 2019-06-10 | 2019-11-22 | 内蒙古工业大学 | 一种基于两级dbn的滚动轴承故障自学习方法 |
CN110490218B (zh) * | 2019-06-10 | 2022-11-29 | 内蒙古工业大学 | 一种基于两级dbn的滚动轴承故障自学习方法 |
CN110399569A (zh) * | 2019-07-19 | 2019-11-01 | 银联智策顾问(上海)有限公司 | 一种基于大数据评估土地价值的方法及评估装置 |
CN111125727A (zh) * | 2019-12-03 | 2020-05-08 | 支付宝(杭州)信息技术有限公司 | 混淆电路生成方法、预测结果确定方法、装置和电子设备 |
CN111125727B (zh) * | 2019-12-03 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 混淆电路生成方法、预测结果确定方法、装置和电子设备 |
CN117077005A (zh) * | 2023-08-21 | 2023-11-17 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
CN117077005B (zh) * | 2023-08-21 | 2024-05-10 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107621626B (zh) | 基于深度卷积神经网络的雷达信号铁路路基病害检测方法 | |
CN109816581A (zh) | 一种综合业态大数据与建筑形态的城市用地自动识别系统 | |
Li et al. | Data mining of cellular automata's transition rules | |
CN101894275B (zh) | 一种弱监督的sar图像分类方法 | |
CN107945153A (zh) | 一种基于深度学习的路面裂缝检测方法 | |
CN109977780A (zh) | 一种基于深度学习算法的硅藻的检测与识别方法 | |
CN109614985A (zh) | 一种基于密集连接特征金字塔网络的目标检测方法 | |
CN110175613A (zh) | 基于多尺度特征和编解码器模型的街景图像语义分割方法 | |
CN105427309A (zh) | 面向对象高空间分辨率遥感信息提取的多尺度分层处理方法 | |
CN109146563A (zh) | 一种基于迁移学习的城市住宅地价评估方法 | |
CN109840483B (zh) | 一种滑坡裂缝检测与识别的方法及装置 | |
CN110120218A (zh) | 基于gmm-hmm的高速公路大型车辆识别方法 | |
CN110413973A (zh) | 计算机自动生成套卷的方法及其系统 | |
CN107808358A (zh) | 图像水印自动检测方法 | |
CN109214308A (zh) | 一种基于焦点损失函数的交通异常图片识别方法 | |
CN103048329A (zh) | 一种基于主动轮廓模型的路面裂缝检测方法 | |
CN110717464B (zh) | 一种基于雷达数据的铁路路基病害智能识别方法 | |
CN112668375B (zh) | 景区内游客分布分析系统及方法 | |
Eisank et al. | A generic procedure for semantics-oriented landform classification using object-based image analysis | |
CN106991666A (zh) | 一种适用于多尺寸图片信息的病害图像识别方法 | |
CN107818321A (zh) | 一种用于车辆年检的水印日期识别方法 | |
CN103679214B (zh) | 基于在线面积估计和多特征决策融合的车辆检测方法 | |
CN116863274A (zh) | 一种基于半监督学习的钢板表面缺陷检测方法及系统 | |
CN103310235B (zh) | 一种基于参数识别与估计的隐写分析方法 | |
CN111783589A (zh) | 基于场景分类和多尺度特征融合的复杂场景人群计数方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190104 |