CN112597403A - 一种获取房地产价格特征的方法及系统 - Google Patents
一种获取房地产价格特征的方法及系统 Download PDFInfo
- Publication number
- CN112597403A CN112597403A CN202011547594.XA CN202011547594A CN112597403A CN 112597403 A CN112597403 A CN 112597403A CN 202011547594 A CN202011547594 A CN 202011547594A CN 112597403 A CN112597403 A CN 112597403A
- Authority
- CN
- China
- Prior art keywords
- space
- price
- data
- real estate
- assignment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012360 testing method Methods 0.000 claims description 20
- 238000007689 inspection Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000007418 data mining Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 238000000528 statistical test Methods 0.000 claims description 4
- 238000013500 data storage Methods 0.000 claims description 3
- 238000009877 rendering Methods 0.000 claims description 3
- 238000012800 visualization Methods 0.000 abstract description 8
- 238000012216 screening Methods 0.000 abstract description 7
- 238000010276 construction Methods 0.000 abstract description 4
- 230000007547 defect Effects 0.000 abstract description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Abstract
本发明公开了一种获取房地产价格特征的方法及系统,该方法包括如下步骤:获取空间数据和属性数据;空间自相关性检验;根据空间数据和属性数据,进行特征指标空间赋值;根据空间赋值结果,进行特征价格模型构建,得到预测结果;预测结果检验,并提供一种获取房地产价格特征的系统。本发明提供的空间和数学相结合的方法对房地产价格特征的客观空间赋值、全面筛选和成果可视化,很好的弥补了传统的房地产价格特征筛选方法不能穷尽所有的价格影响因素的缺陷,同时又突出不同城市影响房地产价格特征的差异性,模型构建结果空间可视,具有较好的可解释性,模型的更新维护成本较低,具有较强的实用性。
Description
技术领域
本发明涉及一种获取价格特征的方法及系统,尤其涉及一种获取房地产价格特征的方法及系统。
背景技术
目前房地产价格特征的获取方式主要有以下两种:
(1)区位状况调整法:是指将可比实例在其区位状况下的价格调整为在估价对象区位下的价格,即将可比实例相对于待估对象因区位条件不同造成的价格差异进行剔除。区位状况没有规范量化的数值来评价,主要是通过估价人员对可比实例与待估房地产比较后打分,受估价人员主观影响因素较强,结果的科学性和可靠性有待进一步商榷。
(2)调查获取法:主要应用于特征价格法,受到房地产自身特征的综合影响,表现为区域状况影响因素,如商服繁华度、交通状况、配套设施等,具体通过调查获取可能影响房地产价值的特征变量,并进行赋值。该方法存在一定缺陷,主观赋值法的评价结果会受到比较大的主观因素的影响,往往会夸大或降低某些指标的作用,致使排序的结果不能完全真实的反映特征和房地产价格的现实关系。
发明内容
发明目的:本发明的第一目的为提供一种客观、全面的获取房地产价格特征的方法,本发明的第二目的为提供一种能够有力提高房地产价格批量估值的效率和精度的获取房地产价格特征的系统。
技术方案:本发明的获取房地产价格特征的方法,包括如下步骤:
(1)获取空间数据和属性数据;
(2)空间自相关性检验;
(3)根据空间数据和属性数据,进行特征指标空间赋值;
(4)根据空间赋值结果,进行特征价格模型构建,得到预测结果;
(5)预测结果空间检验。
进一步地,步骤(3)中,特征指标为小区周边POI在城市的分布个数及距离。
根据业务模型的需求,获取城市内小区的基本属性和业务数据进行数据,同时对地图POI点数据进行数据挖掘、图属关联、数据入库和批量空间量算。
步骤(2)中,利用Moran’s I对空间自相关进行检验。
房价在城市存在很强的正空间自相关性。通过对一个城市内住宅小区外部特征的观察,一个小区与附近的小区在外部环境上存在一定的相似性,因此在空间上也有一定的相似性,因此各个指标特征之间也存在空间自相关性,利用Moran’s I对空间自相关进行检验,如果该指标在空间上服从独立同分布,即采用普通的距离和个数的指标进行分析;如果该指标存在空间自相关性,即采用合适的方法对指标进行空间插值。
步骤(3)具体包括如下步骤,根据POI在城市的分布个数以及属性数据,具体实施中根据不同城市能级情况进行适当调整,对空间指标做出以下分类:
x<5,采用直线距离法或者等时圈法进行空间赋值,例如飞机场、火车站、高铁站、汽车站、市政府等唯一性布局指标;
5<x<100,采用反距离加权插值法进行空间赋值,例如大型超市、市级商业网点、区级商业网点、三甲医院等相对稀疏但是具有重要影响力的POI点;
100<x<1000,采用泰森多边形的覆盖面积进行空间赋值,每个多边形内含且仅包含一个样点,例如加油站、汽车服务点、派出所、社区医院、写字楼等POI点;
当x>1000,采用核密度估计法进行空间赋值,根据单变量的样本点群,计算空间平滑估计值,适用于局部函数拟合,样本量较大时误差较小,x为POI在城市的分布个数。例如餐馆、公交站等POI点。
步骤(5)中,检验为通过经济意义检验、统计检验、计量经济学检验和模型结果预测检验。
优选的,步骤(5)中,根据模型的预测结果进行结果可视化,利用Arc GIS从小区、街区维度在地图上进行专题分级渲染,并通过Kriging插值法进行空间插值检验。
本发明方法为空间与数学相结合获取房地产价格特征的方法,通过观察、分析特征变量的变动规律,利用数学统计和空间统计方法进行客观赋值和修正,探究城市房地产价格和各特征变量之间的定量关系。房地产特征价格模型需要通过经济意义检验、统计检验、计量经济学检验以及预测成果空间可视化检验。通过上述所有检验之后,模型建立成功,可以得出估价范围内所有估价对象的房地产价值。
步骤(4)中,根据空间客观赋值的最优结果,观察分析城市房价的变动规律,对模型和每个特征变量不断地进行尝试和修正,找出合理的价格与各特征变量之间的定量关系,构建特征价格模型。
本发明的获取房地产价格特征的系统,包括数据获取模块、空间赋值模块和价格预测模块;数据获取模块用于获取空间数据和属性数据并进行空间自相关性检验;空间赋值模块用于根据空间数据和属性数据,进行特征指标空间赋值;价格预测模块用于根据空间赋值结果,进行特征价格模型构建,得到预测结果,并进行预测结果空间检验。
有益效果:与现有技术相比,本发明具有如下显著优点:获取房地产价格特征的方法及系统提供的空间和数学相结合的方法对房地产价格特征的全面筛选、客观空间赋值和成果可视化,很好的弥补了传统的房地产价格特征筛选方法不能穷尽所有的价格影响因素的缺陷,同时又突出不同城市影响房地产价格特征的差异性,具有较好的可解释性,评估结论可接受度较高,模型更新的维护成本较低,有很强的实用性。
附图说明
图1是空间与数学结合获取房地产价格特征方法的总体思路图;
图2是反距离加权插值法的基本思路;
图3是泰森多边形赋值法示意图;
图4是核密度估计法的基本思路;
图5是预测价格在街区的分布结果;
图6是预测价格在街区分布结果的Kriging插值图。
具体实施方式
下面结合实施例对本发明的技术方案作进一步说明。
本实施例的获取房地产价格特征的方法,在进行房地产价格特征构建时,依据高德地图上获取到的23大类下的266小类POI点,通过全面观察、分析房价的变动规律,利用数学统计和空间统计方法进行客观赋值和修正,探究城市房地产价格和各特征变量之间的定量关系。该城市房地产价格和每个影响特征的定量关系模型需要通过经济意义检验、统计检验、计量经济学检验以及预测成果空间可视化检验。与现有技术相比,本发明提供的空间和数学相结合的方法对房地产价格特征的客观空间赋值、全面筛选和成果可视化,很好的弥补了传统的房地产价格特征筛选方法不能穷尽所有的价格影响因素的缺陷,同时又突出不同城市影响房地产价格特征的差异性,模型构建结果空间可视,具有较强的实用性。
该空间与数学相结合获取房地产价格特征的方法,如图1所示,具体步骤如下:
1)数据采集
根据业务模型的需求,对城市内小区的基本属性和业务数据进行数据挖掘,同时对互联网地图开放平台上23大类下的266小类POI点数据进行数据采集、图属关联、数据入库和批量空间量算等工作。在扬州的数据挖掘工程中,共爬取了5万多个POI点,27万地理基础数据和生成1452万条属性数据。
2)空间特性检验
房价在城市存在很强的正空间自相关性。通过对一个城市内住宅小区外部特征的观察,一个小区与附近的小区在外部环境上存在一定的相似性,因此在空间上也有一定的相似性,因此各个指标特征之间也存在空间自相关性,空间自相关用Moran’s I检验,将Pearson相关系数式表达的x和y的关系中的y用临近的x值替代,再做简单的数学技巧修正,计算公式如下:
根据Moran’s I的检验结果,大体位于[-1,1],-1表示高度负相关,却表示高度正相关,0表示没有关系。
3)特征指标空间赋值
根据POI在城市的分布个数(即下文中x),具体实施中根据不同城市能级情况进行适当调整,对空间指标做出以下分类:
①x<5,采用直线距离法或者等时圈法进行空间赋值,例如飞机场、火车站、高铁站、汽车站、市政府等唯一性布局指标。
②5<x<100,采用反距离加权插值法进行空间赋值,例如大型超市、市级商业网点、区级商业网点、三甲医院等相对稀疏但是具有重要影响力的POI点。反距离加权法是以插值点与样本点之间的距离为权重的插值方法,简单易行,具体思路如图2,计算公式如下:
③100<x<1000,采用泰森多边形的覆盖面积进行空间赋值,每个多边形内含且仅包含一个样点,例如加油站、汽车服务点、派出所、社区医院、写字楼等POI点,具体示意如图3。
④当x>1000,采用核密度估计法进行空间赋值,根据单变量的样本点群,计算空间平滑估计值,适用于局部函数拟合,样本量较大时误差较小。例如餐馆、公交站、理发店、公厕等POI点,具体思路如图4所示,计算公式如下:
4)全面特征价格模型构建
根据空间客观赋值的最优结果,观察分析房价的变动规律,对模型和每个特征变量不断地进行尝试和修正,找出合理的价格与各特征变量之间的定量关系,构建特征价格模型。
5)预测结果检验
利用线性回归、LASSO、随机森林、AdaBoost、XGBoost、LGBM等6种回归模型对1085个小区进行模拟,根据预测模型的平均误差和R2,选取平均误差最小和R2最大的LGBM回归模型作为预测模型。为了验证结果的稳定性,从1085个训练集中随机抽取530个样本,将这一步骤进行了1000次交叉验证,整个模型的R2水平保持在0.91-0.94之间,平均R2水平为0.924。
6)结果可视化
针对模型的预测结果,利用Arc GIS等空间技术从小区、街区(如图5所示)两个维度在地图上进行专题分级渲染,并通过Kriging插值法进行空间插值,依据协方差函数对随机过程进行空间建模和预测(插值),Kriging法能够给出最优线性无偏估计,对模型结果进行直观的空间检验(如图6所示)。
采用上述方法,以扬州为案例进行具体实践,对房地产价格特征的全面筛选、客观空间赋值和成果可视化,模型构建结果空间可视且精度较高,实用性较强。
Claims (8)
1.一种获取房地产价格特征的方法,其特征在于,包括如下步骤:
(1)获取空间数据和属性数据;
(2)空间自相关性检验;
(3)根据空间数据和属性数据,进行特征指标空间赋值;
(4)根据空间赋值结果,进行特征价格模型构建,得到预测结果;
(5)预测结果空间检验。
2.根据权利要求1所述的获取房地产价格特征的方法,其特征在于:步骤(3)中,所述特征指标为小区周边POI在城市的分布个数及距离。
3.根据权利要求1所述的获取房地产价格特征的方法,其特征在于:步骤(1)具体包括如下步骤:根据业务模型的需求,获取城市内小区的基本属性和业务数据进行数据,同时对地图POI点数据进行数据挖掘、图属关联、数据入库和批量空间量算。
4.根据权利要求1所述的获取房地产价格特征的方法,其特征在于:步骤(2)中,利用Moran’s I对空间自相关进行检验。
5.根据权利要求1所述的获取房地产价格特征的方法,其特征在于:步骤(3)具体包括如下步骤,根据POI在城市的分布个数以及属性数据,对空间指标做出以下分类:
x<5,采用直线距离法或者等时圈法进行空间赋值;
5<x<100,采用反距离加权插值法进行空间赋值;
100<x<1000,采用泰森多边形的覆盖面积进行空间赋值;
当x>1000,采用核密度估计法进行空间赋值,其中,x为POI在城市的分布个数。
6.根据权利要求1所述的获取房地产价格特征的方法,其特征在于:步骤(5)中,所述检验为通过经济意义检验、统计检验、计量经济学检验和模型预测结果检验。
7.根据权利要求1所述的获取房地产价格特征的方法,其特征在于:步骤(5)中,根据模型的预测结果进行结果可视化,利用Arc GIS从小区、街区维度在地图上进行专题分级渲染,并通过Kriging插值法进行空间插值检验。
8.一种获取房地产价格特征的系统,其特征在于:包括数据获取模块、空间赋值模块和预测结果模块;所述数据获取模块用于获取空间数据和属性数据并进行空间自相关性检验;所述空间赋值模块用于根据空间数据和属性数据,进行特征指标空间赋值;所述预测结果模块用于根据空间赋值结果,进行特征价格模型构建,得到预测结果,并进行预测结果空间检验。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011547594.XA CN112597403A (zh) | 2020-12-24 | 2020-12-24 | 一种获取房地产价格特征的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011547594.XA CN112597403A (zh) | 2020-12-24 | 2020-12-24 | 一种获取房地产价格特征的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112597403A true CN112597403A (zh) | 2021-04-02 |
Family
ID=75200915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011547594.XA Pending CN112597403A (zh) | 2020-12-24 | 2020-12-24 | 一种获取房地产价格特征的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112597403A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113962744A (zh) * | 2021-10-29 | 2022-01-21 | 重庆汇集源科技有限公司 | 房地产租金动态监测系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107230113A (zh) * | 2017-08-01 | 2017-10-03 | 江西理工大学 | 一种多模型融合的房产评估方法 |
CN109272364A (zh) * | 2018-10-11 | 2019-01-25 | 北京国信达数据技术有限公司 | 自动估值模型建模方法 |
CN109656967A (zh) * | 2018-11-09 | 2019-04-19 | 北京京东金融科技控股有限公司 | 基于空间的大数据挖掘处理方法、装置、介质及电子设备 |
CN111199322A (zh) * | 2020-01-08 | 2020-05-26 | 广西鑫朗通信技术有限公司 | 房价预测方法及计算机可读存储介质 |
-
2020
- 2020-12-24 CN CN202011547594.XA patent/CN112597403A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107230113A (zh) * | 2017-08-01 | 2017-10-03 | 江西理工大学 | 一种多模型融合的房产评估方法 |
CN109272364A (zh) * | 2018-10-11 | 2019-01-25 | 北京国信达数据技术有限公司 | 自动估值模型建模方法 |
CN109656967A (zh) * | 2018-11-09 | 2019-04-19 | 北京京东金融科技控股有限公司 | 基于空间的大数据挖掘处理方法、装置、介质及电子设备 |
CN111199322A (zh) * | 2020-01-08 | 2020-05-26 | 广西鑫朗通信技术有限公司 | 房价预测方法及计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113962744A (zh) * | 2021-10-29 | 2022-01-21 | 重庆汇集源科技有限公司 | 房地产租金动态监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | The propagation of uncertainty through travel demand models: an exploratory analysis | |
CN111651545A (zh) | 一种基于多源数据融合的城市边缘区提取方法 | |
CN111489008B (zh) | 一种交通事故影响因素空间效应分析方法及其应用 | |
Ghassoun et al. | Intra-urban variation of ultrafine particles as evaluated by process related land use and pollutant driven regression modelling | |
CN114399204A (zh) | 一种城市内涝灾害风险评估方法 | |
Sreelekha et al. | Assessment of topological pattern of urban road transport system of Calicut city | |
CN107832910B (zh) | 一种评价道路交通特征对一氧化碳排放浓度影响的方法 | |
McCluskey et al. | Detecting and validating residential housing submarkets: A geostatistical approach for use in mass appraisal | |
Lin et al. | Comprehensive evaluation of urban air quality using the relative entropy theory and improved TOPSIS method | |
Rao et al. | Regional frequency analysis of Wabash River flood data by L-moments | |
CN117078077A (zh) | 一种高速公路路域的生态脆弱性评价方法 | |
CN112347652A (zh) | 基于水文气象地区线性矩频率分析的暴雨高风险区划方法 | |
CN112597403A (zh) | 一种获取房地产价格特征的方法及系统 | |
Hagen-Zanker et al. | Map comparison methods for comprehensive assessment of geosimulation models | |
CN111797188B (zh) | 一种基于开源地理空间矢量数据的城市功能区定量识别方法 | |
KR20100123408A (ko) | Gis 기반의 가맹점 마케팅 지원 시스템 및 방법 | |
CN112148821B (zh) | 一种城市混合职住空间计算方法和系统 | |
CN111008730A (zh) | 基于城市空间结构的人群聚集度预测模型构建方法及装置 | |
CN116386311A (zh) | 一种考虑极端天气条件的交通可达性评估方法 | |
Shen et al. | Understanding the roles of urban configuration on spatial heterogeneity and submarket regionalisation of house price pattern in a mix-scale hedonic model: the case of Shanghai, China | |
CN113780880A (zh) | 一种基于空间代表性的pm2.5观测站点布局评价方法 | |
CN113672788A (zh) | 一种基于多源数据和权重系数法的城市建筑功能分类方法 | |
Li et al. | Identifying urban form typologies in seoul with mixture model based clustering | |
Bohari et al. | Residential property valuation using GIS | |
Wang et al. | Evaluating the quality of public geocoding services for crime analysis in China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |