CN109146278A - 一种基于机器学习的不动产评估方法 - Google Patents
一种基于机器学习的不动产评估方法 Download PDFInfo
- Publication number
- CN109146278A CN109146278A CN201810920411.0A CN201810920411A CN109146278A CN 109146278 A CN109146278 A CN 109146278A CN 201810920411 A CN201810920411 A CN 201810920411A CN 109146278 A CN109146278 A CN 109146278A
- Authority
- CN
- China
- Prior art keywords
- real estate
- price
- appraisal
- data
- assessment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0278—Product appraisal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Abstract
本发明涉及一种基于机器学习的不动产评估方法,具体包括以下步骤:(1)前期准备:大数据存储采用分布式文件系统,首先部署好大数据存储系统;(2)开始评估流程,将待评估不动产和数据库中的信息通过大数据分析和数据挖掘分析技术进行比对分析,识别不动产的特征;(3)根据步骤(2)中得出的不动产的特征系统自动从多种评估方法匹配所需使用的评估方法,选定评估方法后,参照比对数据的参考因子,根据计算公式,计算并给出最终评估价值;同时将此次评估的不动产的资料、运算经验存储至学习成果库和数据库后,结束此次评估流程。基于计算机机器学习,不断学习,积累成果库信息,优化评估计算参考因子,使评估结果更加科学客观。
Description
技术领域
本发明涉及机器学习技术领域,尤其涉及一种基于机器学习的不动产评估方法。
背景技术
随着不动产登记制度的确立及实施,房产、土地、林业、草地、矿产、海洋等资源已经统一纳入不动产范围,在同一套‘不动产登记系统’中进行登记。人们的物权意识逐渐提高,不动产交易日趋活跃,带动了不动产评估产业的兴起。
传统的不动产评估方法,由人工根据相关情况,进行比较、估算,参考因素不全面、受主观因素影响较大、费时费力,跟不上社会经济发展速度。
计算机技术不断向前发展,各种信息越来越紧密地和计算机进行结合,形成信息产业。近年来,机器学习领域取得长足发展,人工智能技术也已经让人们认识到其强大威力及巨大的发展前景。其中又必不可少地涉及到大数据、数据挖掘等分支技术。
利用计算机信息系统,可以更快更全面提供评估参考因素,再通过机器学习,不断完善‘学习成果库’,扩充不动产数据资料,优化评估算法,使不动产评估更加科学高效。因此机器学习和传统不动产评估的结合,越发水到渠成。
目前广泛采用的不动产评估方法,多为人工或小型软件,根据其掌握的信息,进行分类评估;主要存在以下弊端:
(1)信息不全面:中介或评估公司掌握的信息,来源于中介公司或评估公司既有的评估信息,只代表不动产所在地部分信息。
(2)信息不准确:不动产价值信息来源与网上中介信息或线下合同信息,并不是不动产真正成交的价值。
(3)评估效率低:没有采用大数据技术,传统数据存储及分析方法,很难跟上海量不动产信息快速变化的节奏。
(4)评估不科学:使用一般的评估软件或方法,其评估理论依据一成不变,没有自我提升能力,是一种‘以不变应万变’的方式来评估差异化的不动产,很难做精准评估。现有的不动产评估方法,多为不动产评估机构根据各自收录的历史不动产资料信息,与待评估不动产进行比较,基于主观判断,得出评估结果。其中,历史资料不完全,内容未必真实有效。而参考因素也不甚全面客观。评估效率低下且客观性不高。未见与本发明专利相似的技术方案或发明专利。
因此,有必要开发一种能高效客观评估不动产的基于机器学习的不动产评估方法。
发明内容
本发明要解决的技术问题是,提供一种不断扩充学习成果库,基于成果数据进行数据分析、挖掘,自我学习,不断优化评估依据及算法且能高效客观评估不动产的基于机器学习的不动产评估方法,使不动产评估更加准确快速,提高评估效率和评估的客观性。
为了解决上述技术问题,本发明采用的技术方案是:该基于机器学习的不动产评估方法,具体包括以下步骤:
(1)前期准备:大数据存储采用分布式文件系统,首先部署好大数据存储系统;
(2)开始评估流程,将待评估不动产和数据库中的信息通过大数据分析和数据挖掘分析技术进行比对分析,识别不动产的特征;
(3)根据步骤(2)中得出的不动产的特征系统自动从多种评估方法匹配所需使用的评估方法,选定评估方法后,参照比对数据的参考因子,根据计算公式,计算并给出最终评估价值;同时将此次评估的不动产的资料、运算经验存储至学习成果库和数据库后,结束此次评估流程。
采用上述技术方案,选取效用相同、条件相近的房地产,其价格总是相互牵引,趋于一致,因此,可以利用与估价对象同类型的具有替代性的交易实例的价格来推测待评估不动产可能实现的市场价格;假设重新复制被评估不动产所需要的成本为依据而评估不动产价值,即以重置一宗与被评估不动产可以产生同等效应的不动产,所需投入的各项费用之和为依据,再加上一定的利润和应纳税金来确定待评估不动产价值;将估价对象不动产的预期开发后的价值,扣除其预期的正常开发费用、销售费用、销售税金及开发利润,根据剩余之数来确定估价对象不动产价格;采用大数据作为支撑,其中数据存储于非关系型数据库,避免传统关系统型数据库的各种限制以及检索速度,使用映射-归约方式分类数据,提高搜索速度;通过归纳学习,积累参照资料,不断修正参考因子,改进方法公式,进行估值,估值完成后,又将此次估值的经验资料保存到学习成果库,以便下次评估时参考使用;根据机器学习成果资料库,识别不动产特征,自动选择最合适的评估方法,评估方法包括市场比较法、收益还原法、成本估价法、假设开发法。选定评估方法后,根据计算公式,计算并给出最终估值,同时将本次估值的不动产资料、运算经验存入学习成果库,以供下次评估时参考使用;如此循环,逐渐增大数据库的内容,不断扩充学习成果库,基于成果数据进行数据分析、挖掘,自我学习,不断优化评估依据及算法,使得评估越来越快速越来越客观更加的科学;其中所述机器学习是指:让计算机从大量的数据中学习到相关的规律和逻辑,然后利用学习来的规律来预测以后的未知事物;所述学习成果资料库,使用大数据技术,存储数据、搜索算法优化进行数据挖掘。
作为本发明的优选技术方案,所述大数据存储系统采用Hadoop分布式文件系统HDFS,以Hadoop为根基建立Hive数据仓库基础构架;数据挖掘分析技术采用映射-归纳方式分类数据,通过归纳学习,积累参照资料,不断修正参考因子,改进方法公式,进行估值;大数据分析采用MapReduce编程模型。评估完成后,将此次评估的不动产的资料、运算经验存储至学习成果库和数据库。使用Hadoop分布式文件系统HDFS,HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序;HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据;大数据时代的数据分析任务比传统的数据分析任务要复杂,因为往往涉及的数据量巨大,而对于大规模的数据处理任务来说,就不是一台电脑同时做许多任务了,而是许多电脑同时做一件任务的逻辑关系;MapReduce就是这样的一个编程模型,一个复杂的任务按照这个抽象的模型去实现,就可以有效进行并行计算;MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算;概念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性;它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上;当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组;传统的关系型数据库,已经不能满足大数据的存储、检索要求;HBase–Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群;传统的SQL对于百万级别以上的数据检索,效率相当低;而Hive是建立在Hadoop上的数据仓库基础构架;它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制;Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据;同时,这个语言也允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作。
作为本发明的优选技术方案,多种评估方法包括市场比较法、收益还原法、成本评估法和假设开发法。采用不同的评估方法适用于不同类型的不动产,即市场比较法、收益还原法、成本估价法、假设开发法分别适用于不同类型的不动产;使用计算机技术,将待评估不动产进行准确分类,和现在数据进行比对,选择最合适的评估方法,使评估价值更加科学;在实践中,计算机不断进行自我学习,综合考虑各种学习方法出现的历史渊源、知识表示、推理策略、结果评估的相似性、研究人员交流的相对集中性以及应用领域等诸因素,形成以下几种学习方法:
(1)经验性归纳学习(empirical inductive learning):经验性归纳学习采用一些数据密集的经验方法(如版本空间法、ID3法,定律发现方法)对例子进行归纳学习;其例子和学习结果一般都采用属性、谓词、关系等符号表示。它相当于基于学习策略分类中的归纳学习,但扣除联接学习、遗传算法、加强学习的部分;
(2)类比学习:它相当于基于学习策略分类中的类比学习;在这一类型的学习中比较引人注目的研究是通过与过去经历的具体事例作类比来学习,称为基于范例的学习(case_based learning),或简称范例学习;
(3)增强学习(reinforcement learning):增强学习的特点是通过与环境的试探性(trial and error)交互来确定和优化动作的选择,以实现所谓的序列决策任务;在这种任务中,学习机制通过选择并执行动作,导致系统状态的变化,并有可能得到某种强化信号(立即回报),从而实现与环境的交互;强化信号就是对系统行为的一种标量化的奖惩;系统学习的目标是寻找一个合适的动作选择策略,即在任一给定的状态下选择哪种动作的方法,使产生的动作序列可获得某种最优的结果(如累计立即回报最大)。
作为本发明的优选技术方案,所述市场比较法的评估过程具体包括以下步骤:
S11收集不动产交易实例资料,资料收集范围包括:不动产位置、面积、用途、成交时间、双方当事人、使用年期、交易条件、影响地价的区域和个别因素、土地价格;
S12确定比较实例:要求选取三个以上的比较实例;比较实例应选择与估价期日最接近,与估价不动产用途相同,土地条件基本一致,属同一供需圈内相邻地区或类似地区的正常交易实例;
S13建立价格可比基础:根据选取的比较实例,建立价格可比基础;
S14交易情况修正:将由于特殊因素造成的比较实例的价格偏差予以排除,将其成交价格修正为正常的市场价格;
S15区域因素修正:将区域因素中的各因子对地价的影响程度求和,得出区域因素条件指数,再按公式计算;区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度;
S16计算比准价格:根据上述交易情况修正和区域因素修正后求取出在评估基准日待评估的不动产的比准价格。
所述市场比较法,理论依据是经济学中的替代原理。这一替代原理作用于不动产市场,便表现为效用相同、条件相近的房地产价格总是相互牵引,趋于一致,因此,可以利用与估价对象同类型的具有替代性的交易实例的价格,来推测委估不动产可能实现的市场价格。应用方法包括:(1)收集不动产交易实例(2)确定比较实例(3)建立价格可比基础(4)交易情况修正(5)区域因素修正(6)计算比准价格;估价调查中重视原始数据收录与处理,提升了不动产开发公司的市场竞争力与技术创新力;在修正过上述的交易情况、交易期日、区域因素、个别因素、容积率、土地使用年限之后,就可以求取出在评估基准日待估不动产的比准价格;不动产市场调查中,重视原点数据收录于分析,体现了分析结果真实性原则;原始数据是市场环境的客观反映,把握原始数据层能够带动数据库革新,为不动产提供准确的市场比较结果,也更加切合经济发展之实际情况;任何一个产业可持续发展,必须依赖于真实的数据分析,只有把握原始数据才能获得真实的分析结果;“估价”是企业服务于客户中的硬指标,只有达到预定估价才能实现营运发展,带动企业客户资源群体的扩大化;不动产交易模式日趋扩大化发展,业务模式也更加灵活多变,原始数据收集与处理模式多种多样。交易情况修正是排除交易行为中的一些特殊因素所造成的比较实例的价格偏差,将其成交价格修正为正常市场价格;不同用途的土地,影响其价格的区域因子不同,区域因素修正的具体因子应根据估价对象的用途确定。
作为本发明的进一步改进在于,所述收益还原法的计算公式,其中净收益每年不变收益为有限年期的公式:
其中V:不动产价格,a:不动产年净收益,r:折现率,n:剩余收益年期;
无限年期公式:
其中a:不动产年净收益,r:折现率;
所述收益还原法适用于土地价格评估、建筑物评估和承租土地使用权价格评估;
当用于土地价格评估时,根据房地产客观收益和客观费用,求得房地净收益;通过房屋重置价格求得房屋现值,用房屋还原率求得房屋净收益;从房地净收益中扣除房屋净收益即可得到土地净收益;用土地还原率,采用公式求得估价时点的土地价格;
当适用于建筑物评估时,计算过程包括以下步骤:
A)首先求取土地价格;
B)以建筑物与其相应范围内土地所产生的总的净收益中,减掉归属于土地的净收益,求得建筑物的净收益;
C)将次净收益以建筑物的还原率还原,就可求取建筑物的收益价格;
当适用于承租土地使用权价格的评估时,是收益还原法的应用购买年法的应用,是将市场租金与实际支付。
所述收益还原法,适用有收益或潜在收益的不动产;可以利用收益还原法评估:土地价格、建筑物价格、承租土地使用权价格。
作为本发明的优选技术方案,所述成本评估法适用于土地评估、新建不动产评估和旧建筑物评估;其计算公式为:
1)土地评估的计算公式:
土地价值=待开发土地取得费+土地开发费+利息+利润+税费+土地增值收益;
2)新建不动产评估的计算公式:
新建不动产价值=土地取得费用+开发成本+管理费用+利息+销售税费+利润;
3)旧建筑物评估的计算公式:
建筑物价值=重置成本-年贬值额×已使用年限。
所述成本估价法,是以假设重新复制被评估不动产所需要的成本为依据而评估不动产价值的一种方法;即以重置一宗与被评估不动产可以产生同等效应的不动产,所需投入的各项费用之和为依据,再加上一定的利润和应纳税金来确定被估不动产价值;成本评估法一般适用于无收益的不动产评估(即不能适用收益评估法的不动产),不动产市场发育不成熟,成交实例不多(不能使用市场法),无法利用收益法、市场法等方法进行评估的情况;成本评估法在土地评估中应用范围受到一定限制:由于土地的价格大部分取决于它的效用,并非仅仅是它所花费的成本,也就是说,由于土地成本的增加并不一定会增加它的使用价值;不动产评估使用成本评估法主要对象:政府的办公楼、学校、医院、图书馆、军队营房、机场、博物馆、纪念馆、公园、新开发土地等没有收益,也很难进入市场交易,则可选择成本法。
作为本发明的优选技术方案,所述假设开发法适用于待开发的不动产价格评估,其计算公式为:待开发不动产的价值=开发完成后的不动产价值-开发成本-管理费用-投资利息-销售税费-开发利润-购买待开发不动产应负担的税费。所述假设开发法,是将估价对象不动产的预期开发后的价值,扣除其预期的正常开发费用、销售费用、销售税金及开发利润,根据剩余之数来确定估价对象不动产价格的一种估价方法。其基本理论依据与收益法相同,是预期原理。
作为本发明的优选技术方案,Hive数据仓库基础构架的根基还包括MapReduce编程模型,Hive数据仓库基础构架包括服务端组件和客户端组件,所述服务端组件包括Driver组件、Metastore组件和Thrift服务组件,
所述Driver包括Complier、Optimizer和Executor组件,所述Driver组件用于把写的HiveQL语句进行解析、编译优化,生成执行计划,然后调用底层的mapreduce计算框架;
所述Metastore组件是元数据服务组件,用于存储Hive的元数据,Hive的元数据存储在关系数据库里,Hive支持的关系数据库有derby、mysql;
所述Thrift服务组件是facebook开发的一个软件框架,用于进行可扩展且跨语言的服务的开发,Hive集成了该服务,能让不同的编程语言调用Hive的接口;
所述客户端组件包括CLI、Thrift客户端和WEBGUI;所述CLI为命令行接口;
所述Thrift客户端包括JDBC接口和ODBC接口;所述WEBGUI对应Hive的hwi组件,使用前要启动hwi服务。
与现有技术相比,本发明具有的有益效果是:
(1)信息全面:基于不动产登记机构的权威、行政区范围全覆盖的不动信息;
(2)信息准确:不动产价值信息来源于不动产登记机构的最终登记数据,杜绝虚假内容;
(3)评估效率高:依托大数据技术,摒弃了传统数据分析速度低下的缺点;
(4)数据安全性高:使用分布式文件系统及非关系型数据库,使得数据多处备份,即使某处损坏,亦能快速通过其它备份恢复。;
(5)评估科学:基于计算机机器学习,不断学习,积累成果库信息,优化评估计算参考因子,使评估结果更加科学客观。
附图说明
下面结合附图进一步描述本发明的技术方案:
图1是本发明的基于机器学习的不动产评估方法中的基于大数据存储HBase数据模型图;
图2是本发明的基于机器学习的不动产评估方法中的基于数据挖掘MapReduce模型图;
图3是本发明的基于机器学习的不动产评估方法中的基于数据挖掘MapReduce应用程序的架构图;
图4是本发明的基于机器学习的不动产评估方法中的基于大数搜索Hive架构图;
图5是本发明的基于机器学习的不动产评估方法的机器学习与人类学习类比模型;
图6是本发明的基于机器学习的不动产评估方法的评估流程示意图。
具体实施方式
为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。
实施例:该基于机器学习的不动产评估方法,具体包括以下步骤:
(1)前期准备:大数据存储采用分布式文件系统,首先部署好大数据存储系统;
如图1所示为基于大数据存储HBase数据模型图,HBase是可以提供实时计算的分布式数据库,数据被保存在HDFS分布式文件系统上,由HDFS保证期高容错性,但是在生产环境中,HBase上的数据是以StoreFile(HFile)二进制流的形式存储在HDFS上block块儿中;但是HDFS并不知道的hbase存的是什么,它只把存储文件是为二进制文件,也就是说,hbase的存储数据对于HDFS文件系统是透明的;
(2)开始评估流程,将待评估不动产和数据库中的信息通过大数据分析和数据挖掘分析技术进行比对分析,识别不动产的特征;
(3)根据步骤(2)中得出的不动产的特征系统自动从多种评估方法匹配所需使用的评估方法,选定评估方法后,参照比对数据的参考因子,根据计算公式,计算并给出最终评估价值;同时将此次评估的不动产的资料、运算经验存储至学习成果库和数据库后,结束此次评估流程。上述评估流程如图6所示;采用大数据作为支撑,其中数据存储于非关系型数据库,避免传统关系统型数据库的各种限制以及检索速度,使用映射-归约方式分类数据,提高搜索速度;通过归纳学习,积累参照资料,不断修正参考因子,改进方法公式,进行估值,估值完成后,又将此次估值的经验资料保存到学习成果库,以便下次评估时参考使用。
其中,所述大数据存储系统采用Hadoop分布式文件系统HDFS,以Hadoop为根基建立Hive数据仓库基础构架;数据挖掘分析技术采用映射-归纳方式分类数据,通过归纳学习,积累参照资料,不断修正参考因子,改进方法公式,进行估值;如图2-3所示,图2为基于数据挖掘MapReduce模型图,大数据分析采用MapReduce编程模型;图3是基于数据挖掘MapReduce应用程序的架构图,MapReduce的核心概念是把输入的数据分成不同的逻辑块,Map作业首先对每一块进行独立而并行的处理;这些独立的处理块的结果会被重新组合成不同的排序的集合,这些集合最后由Reduce作业进行处理;一个Map作业可以执行在集群中的任何一个计算机节点上;多个Map作业可以并行的执行在集群中的多个节点上;Map作业负责转换输入记录成为名值对;所有Map作业的输出会被重新组合成多个排序的集合,这里面的每一个集合会被派发给一个单独的Reduce作业;Reduce作业会对集合中排序的键值和关联在键值的多个数据值进行处理;Reduce任务也是并行的运行在集群中的;应用程序开发人员仅仅需要提供4项输入给Hadoop框架:读取和转换输入记录到键值对的作业类,一个Map方法,一个Reduce方法和一个转换键值到输出记录的Reduce作业类;使用Hadoop能够把很容易的把分布式应用程序并行的运行在集群上,集群上的一个节点的失败不会影响其他节点的操作,一个作业在一个节点上的失败,Hadoop会分配其他的节点进行重试;评估完成后,将此次评估的不动产的资料、运算经验存储至学习成果库和数据库;使用Hadoop分布式文件系统HDFS,HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序;HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据;大数据时代的数据分析任务比传统的数据分析任务要复杂,因为往往涉及的数据量巨大,而对于大规模的数据处理任务来说,就不是一台电脑同时做许多任务了,而是许多电脑同时做一件任务的逻辑关系;MapReduce就是这样的一个编程模型,一个复杂的任务按照这个抽象的模型去实现,就可以有效进行并行计算;MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算;概念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性;它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上;当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组;传统的关系型数据库,已经不能满足大数据的存储、检索要求;HBase–Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群;传统的SQL对于百万级别以上的数据检索,效率相当低;而Hive是建立在Hadoop上的数据仓库基础构架;它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制;Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据;同时,这个语言也允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作。
所采用的多种评估方法包括市场比较法、收益还原法、成本评估法和假设开发法。采用不同的评估方法适用于不同类型的不动产,即市场比较法、收益还原法、成本估价法、假设开发法分别适用于不同类型的不动产;使用计算机技术,将待评估不动产进行准确分类,和现在数据进行比对,选择最合适的评估方法,使评估价值更加科学;在实践中,计算机不断进行自我学习,综合考虑各种学习方法出现的历史渊源、知识表示、推理策略、结果评估的相似性、研究人员交流的相对集中性以及应用领域等诸因素,形成以下几种学习方法:
(1)经验性归纳学习(empirical inductive learning):经验性归纳学习采用一些数据密集的经验方法(如版本空间法、ID3法,定律发现方法)对例子进行归纳学习;其例子和学习结果一般都采用属性、谓词、关系等符号表示。它相当于基于学习策略分类中的归纳学习,但扣除联接学习、遗传算法、加强学习的部分;
(2)类比学习:它相当于基于学习策略分类中的类比学习;在这一类型的学习中比较引人注目的研究是通过与过去经历的具体事例作类比来学习,称为基于范例的学习(case_based learning),或简称范例学习;
(3)增强学习(reinforcement learning):增强学习的特点是通过与环境的试探性(trial and error)交互来确定和优化动作的选择,以实现所谓的序列决策任务;在这种任务中,学习机制通过选择并执行动作,导致系统状态的变化,并有可能得到某种强化信号(立即回报),从而实现与环境的交互;强化信号就是对系统行为的一种标量化的奖惩;系统学习的目标是寻找一个合适的动作选择策略,即在任一给定的状态下选择哪种动作的方法,使产生的动作序列可获得某种最优的结果(如累计立即回报最大)。如图5所示,机器学习与人类学习类比模型,首先,我们需要在计算机中存储历史的数据;接着,我们将这些数据通过机器学习算法进行处理,这个过程在机器学习中叫做“训练”,处理的结果可以被我们用来对新的数据进行预测,这个结果一般称之为“模型”;对新数据的预测过程在机器学习中叫做“预测”;“训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型”指导“预测”,可以看出,机器学习更加快速客观。
其中,所述市场比较法的评估过程具体包括以下步骤:
S11收集不动产交易实例资料,资料收集范围包括:不动产位置、面积、用途、成交时间、双方当事人、使用年期、交易条件、影响地价的区域和个别因素、土地价格;不动产市场调查中,重视原点数据收录于分析,体现了分析结果真实性原则;
S12确定比较实例:要求选取三个以上的比较实例;比较实例应选择与估价期日最接近,与估价不动产用途相同,土地条件基本一致,属同一供需圈内相邻地区或类似地区的正常交易实例;原始数据是市场环境的客观反映,把握原始数据层能够带动数据库革新,为不动产提供准确的市场比较结果,也更加切合经济发展之实际情况;
S13建立价格可比基础:根据选取的比较实例,建立价格可比基础;任何一个产业可持续发展,必须依赖于真实的数据分析,只有把握原始数据才能获得真实的分析结果;“估价”是企业服务于客户中的硬指标,只有达到预定估价才能实现营运发展,带动企业客户资源群体的扩大化;
S14交易情况修正:将由于特殊因素造成的比较实例的价格偏差予以排除,将其成交价格修正为正常的市场价格;不动产交易模式日趋扩大化发展,业务模式也更加灵活多变,原始数据收集与处理模式多种多样;交易情况修正是排除交易行为中的一些特殊因素所造成的比较实例的价格偏差,将其成交价格修正为正常市场价格;
S15区域因素修正:将区域因素中的各因子对地价的影响程度求和,得出区域因素条件指数,再按公式计算;区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度;不同用途的土地,影响其价格的区域因子不同,区域因素修正的具体因子应根据估价对象的用途确定;
S16计算比准价格:根据上述交易情况修正和区域因素修正后求取出在评估基准日待评估的不动产的比准价格。
估价调查中重视原始数据收录与处理,提升了不动产开发公司的市场竞争力与技术创新力。在修正过上述的交易情况、交易期日、区域因素、个别因素、容积率、土地使用年限之后,就可以求取出在评估基准日待估不动产的比准价格。
所述收益还原法的计算公式,其中净收益每年不变收益为有限年期的公式:
其中V:不动产价格,a:不动产年净收益,r:折现率,n:剩余收益年期;
无限年期公式:
其中a:不动产年净收益,r:折现率;
所述收益还原法适用于土地价格评估、建筑物评估和承租土地使用权价格评估;
当用于土地价格评估时,根据房地产客观收益和客观费用,求得房地净收益;通过房屋重置价格求得房屋现值,用房屋还原率求得房屋净收益;从房地净收益中扣除房屋净收益即可得到土地净收益;用土地还原率,采用公式求得估价时点的土地价格;
当适用于建筑物评估时,计算过程包括以下步骤:
A)首先求取土地价格;
B)以建筑物与其相应范围内土地所产生的总的净收益中,减掉归属于土地的净收益,求得建筑物的净收益;
C)将次净收益以建筑物的还原率还原,就可求取建筑物的收益价格。
当适用于承租土地使用权价格的评估时,是收益还原法的应用购买年法的应用,是将市场租金与实际支付。
所述成本评估法适用于土地评估、新建不动产评估和旧建筑物评估;其计算公式为:
1)土地评估的计算公式:
土地价值=待开发土地取得费+土地开发费+利息+利润+税费+土地增值收益;
2)新建不动产评估的计算公式:
新建不动产价值=土地取得费用+开发成本+管理费用+利息+销售税费+利润;
3)旧建筑物评估的计算公式:
建筑物价值=重置成本-年贬值额×已使用年限。
成本评估法一般适用于无收益的不动产评估(即不能适用收益评估法的不动产),不动产市场发育不成熟,成交实例不多(不能使用市场法),无法利用收益法、市场法等方法进行评估的情况;成本评估法在土地评估中应用范围受到一定限制:由于土地的价格大部分取决于它的效用,并非仅仅是它所花费的成本,也就是说,由于土地成本的增加并不一定会增加它的使用价值;不动产评估使用成本评估法主要对象:政府的办公楼、学校、医院、图书馆、军队营房、机场、博物馆、纪念馆、公园、新开发土地等没有收益,也很难进入市场交易,则可选择成本法。
所述假设开发法适用于待开发的不动产价格评估,其计算公式为:待开发不动产的价值=开发完成后的不动产价值-开发成本-管理费用-投资利息-销售税费-开发利润-购买待开发不动产应负担的税费。
如图4所示,Hive数据仓库基础构架的根基还包括MapReduce编程模型,Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据。同时,这个语言也允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作;Hadoop和mapreduce是hive架构的根基;Hive架构包括如下组件:CLI(command line interface)、JDBC/ODBC、Thrift Server、WEB GUI、metastore和Driver(Complier、Optimizer和Executor),Hive数据仓库基础构架包括服务端组件和客户端组件,所述服务端组件包括Driver组件、Metastore组件和Thrift服务组件,
所述Driver包括Complier、Optimizer和Executor组件,所述Driver组件用于把写的HiveQL语句进行解析、编译优化,生成执行计划,然后调用底层的mapreduce计算框架;
所述Metastore组件是元数据服务组件,用于存储Hive的元数据,Hive的元数据存储在关系数据库里,Hive支持的关系数据库有derby、mysql;元数据对于hive十分重要,因此hive支持把metastore服务独立出来,安装到远程的服务器集群里,从而解耦hive服务和metastore服务,保证hive运行的健壮性,这个方面的知识,我会在后面的metastore小节里做详细的讲解;
所述Thrift服务组件是facebook开发的一个软件框架,用于进行可扩展且跨语言的服务的开发,Hive集成了该服务,能让不同的编程语言调用Hive的接口;所述客户端组件包括CLI、Thrift客户端和WEBGUI;所述CLI为命令行接口;所述Thrift客户端包括JDBC接口和ODBC接口;所述WEBGUI对应Hive的hwi组件,使用前要启动hwi服务。
对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。
Claims (8)
1.一种基于机器学习的不动产评估方法,其特征在于,具体包括以下步骤:
(1)前期准备:大数据存储采用分布式文件系统,首先部署好大数据存储系统;
(2)开始评估流程,将待评估不动产和数据库中的信息通过大数据分析和数据挖掘分析技术进行比对分析,识别不动产的特征;
(3)根据步骤(2)中得出的不动产的特征系统自动从多种评估方法匹配所需使用的评估方法,选定评估方法后,参照比对数据的参考因子,根据计算公式,计算并给出最终评估价值;同时将此次评估的不动产的资料、运算经验存储至学习成果库和数据库后,结束此次评估流程。
2.根据权利要求1所述的不动产评估方法,其特征在于,所述大数据存储系统采用Hadoop分布式文件系统HDFS,以Hadoop为根基建立Hive数据仓库基础构架;数据挖掘分析技术采用映射-归纳方式分类数据,通过归纳学习,积累参照资料,不断修正参考因子,改进方法公式,进行估值;大数据分析采用MapReduce编程模型。
3.根据权利要求2所述的不动产评估方法,其特征在于,多种评估方法包括市场比较法、收益还原法、成本评估法和假设开发法。
4.根据权利要求3所述的不动产评估方法,其特征在于,所述市场比较法的评估方法具体包括以下步骤:
S11收集不动产交易实例资料:资料收集范围包括:不动产位置、面积、用途、成交时间、双方当事人、使用年期、交易条件、影响地价的区域和个别因素、土地价格;
S12确定比较实例:要求选取三个以上的比较实例;比较实例应选择与估价期日最接近,与估价不动产用途相同,土地条件基本一致,属同一供需圈内相邻地区或类似地区的正常交易实例;
S13建立价格可比基础:根据选取的比较实例,建立价格可比基础;
S14交易情况修正:将由于特殊因素造成的比较实例的价格偏差予以排除,将其成交价格修正为正常的市场价格;
S15区域因素修正:将区域因素中的各因子对地价的影响程度求和,得出区域因素条件指数,再按公式计算;区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度;
S16计算比准价格:根据上述交易情况修正和区域因素修正后求取出在评估基准日待评估的不动产的比准价格。
5.根据权利要求3所述的不动产评估方法,其特征在于,所述收益还原法的计算公式,其中净收益每年不变收益为有限年期的公式:
其中V:不动产价格,a:不动产年净收益,r:折现率,n:剩余收益年期;无限年期公式:
其中a:不动产年净收益,r:折现率;
所述收益还原法适用于土地价格评估、建筑物评估和承租土地使用权价格评估;
当用于土地价格评估时,根据房地产客观收益和客观费用,求得房地净收益;通过房屋重置价格求得房屋现值,用房屋还原率求得房屋净收益;从房地净收益中扣除房屋净收益即可得到土地净收益;用土地还原率,采用公式求得估价时点的土地价格;
当适用于建筑物评估时,计算过程包括以下步骤:
A)首先求取土地价格;
B)以建筑物与其相应范围内土地所产生的总的净收益中,减掉归属于土地的净收益,求得建筑物的净收益;
C)将次净收益以建筑物的还原率还原,就可求取建筑物的收益价格;
当适用于承租土地使用权价格的评估时,是收益还原法的应用购买年法的应用,是将市场租金与实际支付。
6.根据权利要求3所述的不动产评估方法,其特征在于,所述成本评估法适用于土地评估、新建不动产评估和旧建筑物评估;其计算公式为:
1)土地评估的计算公式:
土地价值=待开发土地取得费+土地开发费+利息+利润+税费+土地增值收益;
2)新建不动产评估的计算公式:
新建不动产价值=土地取得费用+开发成本+管理费用+利息+销售税费+利润;
3)旧建筑物评估的计算公式:
建筑物价值=重置成本-年贬值额×已使用年限。
7.根据权利要求3所述的不动产评估方法,其特征在于,所述假设开发法适用于待开发的不动产价格评估,其计算公式为:待开发不动产的价值=开发完成后的不动产价值-开发成本-管理费用-投资利息-销售税费-开发利润-购买待开发不动产应负担的税费。
8.根据权利要求3所述的不动产评估方法,其特征在于,Hive数据仓库基础构架的根基还包括MapReduce编程模型,Hive数据仓库基础构架包括服务端组件和客户端组件,所述服务端组件包括Driver组件、Metastore组件和Thrift服务组件,
所述Driver包括Complier、Optimizer和Executor组件,所述Driver组件用于把写的HiveQL语句进行解析、编译优化,生成执行计划,然后调用底层的mapreduce计算框架;
所述Metastore组件是元数据服务组件,用于存储Hive的元数据,Hive的元数据存储在关系数据库里,Hive支持的关系数据库有derby、mysql;
所述Thrift服务组件是facebook开发的一个软件框架,用于进行可扩展且跨语言的服务的开发,Hive集成了该服务,能让不同的编程语言调用Hive的接口;
所述客户端组件包括CLI、Thrift客户端和WEBGUI;所述CLI为命令行接口;
所述Thrift客户端包括JDBC接口和ODBC接口;所述WEBGUI对应Hive的hwi组件,使用前要启动hwi服务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810920411.0A CN109146278A (zh) | 2018-08-14 | 2018-08-14 | 一种基于机器学习的不动产评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810920411.0A CN109146278A (zh) | 2018-08-14 | 2018-08-14 | 一种基于机器学习的不动产评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109146278A true CN109146278A (zh) | 2019-01-04 |
Family
ID=64793201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810920411.0A Pending CN109146278A (zh) | 2018-08-14 | 2018-08-14 | 一种基于机器学习的不动产评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109146278A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110838003A (zh) * | 2019-10-31 | 2020-02-25 | 珠海市蜜蜂科技有限公司 | 共享办公的管理系统、方法、设备及可读介质 |
CN111815366A (zh) * | 2020-07-22 | 2020-10-23 | 江阴逐日信息科技有限公司 | 一种基于要素匹配的服装成本快速核算方法 |
CN112668818A (zh) * | 2019-10-15 | 2021-04-16 | 李俊鹏 | 一种模块化的企业整体价值自动资产评估及更新系统 |
TWI773414B (zh) * | 2021-07-01 | 2022-08-01 | 致理學校財團法人致理科技大學 | 利用機器學習的不動產估價系統及方法 |
CN116843043A (zh) * | 2023-06-13 | 2023-10-03 | 南京智绘星图信息科技有限公司 | 一种基于智能网关的智能化数据处理方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799622A (zh) * | 2012-06-19 | 2012-11-28 | 北京大学 | 基于MapReduce扩展框架的分布式SQL查询方法 |
US20140279692A1 (en) * | 2013-03-12 | 2014-09-18 | Brad A. Boothby | Optimizing return on investment in real property |
CN106874368A (zh) * | 2016-12-30 | 2017-06-20 | 江苏号百信息服务有限公司 | 一种rtb竞价广告位价值分析方法及系统 |
CN107230113A (zh) * | 2017-08-01 | 2017-10-03 | 江西理工大学 | 一种多模型融合的房产评估方法 |
CN107749007A (zh) * | 2017-11-08 | 2018-03-02 | 北京中金永嘉大数据技术有限公司 | 一种基于收益还原法的房地产估价方法 |
-
2018
- 2018-08-14 CN CN201810920411.0A patent/CN109146278A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799622A (zh) * | 2012-06-19 | 2012-11-28 | 北京大学 | 基于MapReduce扩展框架的分布式SQL查询方法 |
US20140279692A1 (en) * | 2013-03-12 | 2014-09-18 | Brad A. Boothby | Optimizing return on investment in real property |
CN106874368A (zh) * | 2016-12-30 | 2017-06-20 | 江苏号百信息服务有限公司 | 一种rtb竞价广告位价值分析方法及系统 |
CN107230113A (zh) * | 2017-08-01 | 2017-10-03 | 江西理工大学 | 一种多模型融合的房产评估方法 |
CN107749007A (zh) * | 2017-11-08 | 2018-03-02 | 北京中金永嘉大数据技术有限公司 | 一种基于收益还原法的房地产估价方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112668818A (zh) * | 2019-10-15 | 2021-04-16 | 李俊鹏 | 一种模块化的企业整体价值自动资产评估及更新系统 |
CN110838003A (zh) * | 2019-10-31 | 2020-02-25 | 珠海市蜜蜂科技有限公司 | 共享办公的管理系统、方法、设备及可读介质 |
CN110838003B (zh) * | 2019-10-31 | 2023-08-15 | 珠海市蜜蜂科技有限公司 | 共享办公的管理系统、方法、设备及可读介质 |
CN111815366A (zh) * | 2020-07-22 | 2020-10-23 | 江阴逐日信息科技有限公司 | 一种基于要素匹配的服装成本快速核算方法 |
TWI773414B (zh) * | 2021-07-01 | 2022-08-01 | 致理學校財團法人致理科技大學 | 利用機器學習的不動產估價系統及方法 |
CN116843043A (zh) * | 2023-06-13 | 2023-10-03 | 南京智绘星图信息科技有限公司 | 一种基于智能网关的智能化数据处理方法及系统 |
CN116843043B (zh) * | 2023-06-13 | 2024-02-09 | 南京智绘星图信息科技有限公司 | 一种基于智能网关的智能化数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109146278A (zh) | 一种基于机器学习的不动产评估方法 | |
Frazzetto et al. | Prescriptive analytics: a survey of emerging trends and technologies | |
Belhadi et al. | An ensemble machine learning approach for forecasting credit risk of agricultural SMEs’ investments in agriculture 4.0 through supply chain finance | |
Dantas et al. | Effort estimation in agile software development: An updated review | |
Carreteiro et al. | A knowledge management approach for software engineering projects development | |
Sanyal et al. | Simulation and big data challenges in tuning building energy models | |
Petrović et al. | Decision support based on data mining for post COVID-19 tourism industry | |
Qin et al. | Personalized federated darts for electricity load forecasting of individual buildings | |
Ngoc Hai et al. | An empirical research on the effectiveness of different LSTM architectures on vietnamese stock market | |
Relich et al. | Knowledge discovery in enterprise databases for forecasting new product success | |
Xu et al. | Application of improved decision tree method based on rough set in building smart medical analysis CRM system | |
Wang et al. | Prediction based on integration of decisional DNA and a feature selection algorithm RELIEF-F | |
Liao et al. | Recent advances in data mining of enterprise data: algorithms and applications | |
Benkhider et al. | Digital transformation process based-technology infrastructure and employee training: evidence from World Bank | |
Maccanti et al. | Knowledge management framework for software reuse | |
Raji | Exploring how artificial intelligence (AI) can support start-ups to manage crisis situations for future sustainable business in the agri-food industry | |
Sträßer et al. | Knowledge Management of Private Banks as an Asset Improved by Artificial Intelligence Discipline—Applied to Strategic McKinsey Portfolio Concept as Part of the Portfolio Management | |
Kolahdouz-Rahimi et al. | Requirement Formalisation using Natural Language Processing and Machine Learning: A Systematic Review | |
Nathani et al. | Foundations of Machine Learning | |
Ghani et al. | A method for analyzing and designing microservice holistically | |
Gong et al. | Exploration and Analysis of Collaborative Matching Algorithm Empowering Large Data Fiscal Budget | |
Patil | Time Series Analysis and Stock Price Forecasting using Machine Learning Techniques” | |
Sigl | Don't fear the REAPER: A framework for materializing and reusing deep-learning models | |
Singh et al. | A Review: Analysis on Data Warehousing and Data Mining | |
van der Walt et al. | Data Migration in Support of Business Intelligence in a Growing Organization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190104 |
|
RJ01 | Rejection of invention patent application after publication |