CN109389530A - 一种基于ffm算法的房屋租金预测方法 - Google Patents

一种基于ffm算法的房屋租金预测方法 Download PDF

Info

Publication number
CN109389530A
CN109389530A CN201811134327.2A CN201811134327A CN109389530A CN 109389530 A CN109389530 A CN 109389530A CN 201811134327 A CN201811134327 A CN 201811134327A CN 109389530 A CN109389530 A CN 109389530A
Authority
CN
China
Prior art keywords
house
rent
data
value
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811134327.2A
Other languages
English (en)
Inventor
李智星
舒海东
胡峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhiting (beijing) Intelligent Technology Co Ltd
Original Assignee
Zhiting (beijing) Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhiting (beijing) Intelligent Technology Co Ltd filed Critical Zhiting (beijing) Intelligent Technology Co Ltd
Priority to CN201811134327.2A priority Critical patent/CN109389530A/zh
Publication of CN109389530A publication Critical patent/CN109389530A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于FFM算法的房屋租金预测方法,采用FFM算法对大量房屋出租信息进行数据清洗、特征提取、数据转换、特征建模,使用构建的模型对房租租金进行预测并找出异常租金数据。本发明不仅可以通过对数据进行清洗、特征提取、建模来实现对房屋租金的预测,还能够很好的检测到异常的房屋租金信息。本发明所提出的基于FFM算法的房租预测方法能很好的应对房屋数据稀疏的情况,能够自动学习特征之间的隐藏联系,是对房租预测的一种十分有效的方法。

Description

一种基于FFM算法的房屋租金预测方法
技术领域
本发明涉及机器学习、大数据、数据分析领域,尤其涉及房屋租赁中的一种基于FFM算法的房屋租金预测方法。
背景技术
随着科技的迅猛发展,互联网给人们带来了各种各样的便捷服务,例如房屋租赁公司可以为客户在线提供服务,这为人们提供了一个更加便利的租房方式,但是与此同时也给人们带来了一定的安全隐患。例如,在线房屋租赁公司接收出租户的房屋信息,发布在租赁网站上,但是可能由于审核不严谨或者出租户提供虚假或者虚高的价格信息而给租客带来损失。
随着大数据与人工智能的迅速发展,可以结合机器学习与数据分析来解决上述问题。通过租赁网站获取大量房屋信息,对这些数据进行清洗、去噪、缺失值填充等一系列数据分析处理。接着利用清洗后的数据对提取相关的特征,可以发现数据之间隐藏的信息。最后利用机器学习相关算法对数据进行建模。通过该模型不仅可以对房屋租金进行预测,还可以通过对比模型的预测房租与真实房租判断该房租是否异常,由此可大幅度减小租户在租房时所承担的风险。
FFM(Field-aware Factorization Machine)场感知分解机最初的概念来自于Yu-Chin Juan与其比赛队员,借鉴了Michael Jahrer的论文中field概念,提出的FM的升级版模型。虽然FFM主要用于点击率预测,但是由于FFM能够很好的处理稀疏的数据且能学习稀疏数据之间的联系,所以很适合房租预测任务。
发明内容
本发明提供了一种基于FFM算法的房屋租金预测方法,能有效的对房屋租金进行预测,并且对异常租金值进行检测,实现大幅度的减小租户在租房时所承担的风险。
本发明采用以下技术方案:
一种基于FFM算法的房屋租金预测方法,包括以下几个步骤:
Q1、对房屋数据清洗,即在房屋数据中,对缺失值进行处理;对城市与省份无法对应的记录进行修正;将租金值低于200与租金值高于5000的数据去除;将租金值为“面议”的数据去除;将房屋面积高于200的数据去除;将楼层值不详的数据去除;
Q2、对清洗后的房屋数据进行特征提取,所述特征包括:房屋结构;房屋楼层高度;房屋总楼层;房屋朝向;房屋面积;房屋所在省市;房屋所在地区;房屋所在小区;房屋所提供的家具;房屋出租类型;房屋租金支付方式;所提供的房屋图片数量;
所述提取包括:对房屋楼层高度、房屋朝向、房屋所在地区、房屋所在省市、房屋出租类型、房屋租金支付方式进行one-hot编码,对房屋所提供的家具进行n-hot编码;
选择房屋所在省市、房屋所在小区、房屋所在地区、房屋朝向、房屋所在楼层高度的特征作为排序特征,依据特征值排序;
Q3、将数据转换为FFM算法需要的格式,将Q2中所述特征的值转换成“field_id:feat_id:value”格式,field_id代表特征所属field的编号,feat_id是特征编号,value是特征的值;
Q4、对提取出来的特征构建租金预测模型,公式为:
|yreal-ypred|/yreal>0.45
其中yreal代表真实租金,ypred代表预测租金;
Q5、对房屋租金进行预测;
Q6、通过对比预测租金值与真实租金值找出异常租金数据。
本发明的技术效果:本发明不仅可以通过对数据进行清洗、特征提取、建模来实现对房屋租金的预测,还能够很好的检测到异常的房屋租金信息。本发明所提出的基于FFM算法的房租预测方法能很好的应对房屋数据稀疏的情况,能够自动学习特征之间的隐藏联系,是对房租预测的一种十分有效的方法。
附图说明
图1为基于FFM算法的房租预测方法流程图。
图2为FFM算法指定数据格式。
具体实施方式
下面将结合本发明的附图和实施例,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据图1所示,一种基于FFM算法的房屋租金预测方法,包括以下几个步骤:
Q1、对房屋数据清洗,即在房屋数据中,对缺失值进行处理;对城市与省份无法对应的记录进行修正;将租金值低于200与租金值高于5000的数据去除;将租金值为“面议”的数据去除;将房屋面积高于200的数据去除;将楼层值不详的数据去除;如表1为原始数据,表2为经过数据清洗之后的数据。
表1、原始数据
room hall toilet rent_money province city toward area level floor
3 1 1 850 山东 莱芜 南北 95 高层 6
1 1 1 450 四川 资阳 40 高层 8
1 0 1 8000 云南 昆明 35 中层 32
3 1 1 900 江苏 沛县 94 高层 6
3 2 1 550 四川 资阳 100 高层 6
3 1 1 900 四川 资阳 西南 100 中层 7
3 2 1 800 四川 资阳 东西 103 中层 6
2 1 1 面议 四川 资阳 90 高层 7
1 1 1 1000 湖南 湘潭 南北 50 中层 19
2 2 1 1600 广西 贵港 83 低层 30
1 1 1 1000 山东 淄博 西 43 中层 6
3 2 1 100 四川 资阳 南北 97 高层 6
3 2 2 2600 广东 中山 114 高层 32
1 1 1 1300 四川 重庆 48 中层 25
2 2 1 1690 广西 北海 90 中层 28
2 2 1 面议 四川 资阳 80 高层 22
5 5 1 1000 安徽 马鞍山 400 地下 18
表2、经过数据清洗之后的数据
room hall toilet ent_mone province city toward area level floor
3 1 1 850 山东省 莱芜市 南北 95 高层 6
1 1 1 450 四川省 资阳市 40 高层 8
3 1 1 900 江苏省 沛县 94 高层 6
3 2 1 550 四川省 资阳市 100 高层 6
3 1 1 900 四川省 资阳市 西南 100 中层 7
3 2 1 800 四川省 资阳市 东西 103 中层 6
1 1 1 1000 湖南省 湘潭市 南北 50 中层 19
2 2 1 1600广 西壮族自治 区贵港市 83 低层 30
1 1 1 1000 山东省 淄博市 西 43 中层 6
3 2 2 2600 广东省 中山市 114 高层 32
1 1 1 1300 重庆市 重庆市 48 中层 25
2 2 1 1690 广西省 北海市 90 中层 28
5 5 1 1000 安徽省 马鞍山市 400 地下 18
Q2、对清洗后的房屋数据进行特征提取,所述特征包括:房屋结构;房屋楼层高度;房屋总楼层;房屋朝向;房屋面积;房屋所在省市;房屋所在地区;房屋所在小区;房屋所提供的家具;房屋出租类型;房屋租金支付方式;所提供的房屋图片数量;
所述提取包括:对房屋楼层高度、房屋朝向、房屋所在地区、房屋所在省市、房屋出租类型、房屋租金支付方式进行one-hot编码如表3所示:
表3、one-hot编码
toward 南北 西南 东西 南北 西
南北 1 0 0 0 0 0 0
0 1 0 0 0 0 0
0 1 0 0 0 0 0
0 1 0 0 0 0 0
西南 0 0 1 0 0 0 0
东西 0 0 0 0 0 0 0
南北 0 0 0 1 0 0 0
0 1 0 0 1 0 0
西 0 0 0 0 0 0 1
0 1 0 0 0 0 0
0 0 0 0 0 1 0
0 1 0 0 0 0 0
0 1 0 0 0 0 0
对房屋所提供的家具进行n-hot编码见表4;
表4、n-hot编码
facility 衣柜 冰箱 洗衣机 空调 热水器 电视 阳台 沙发
0 0 0 0 0 0 0 0 0
床.衣柜.冰箱.洗衣机.空调.热水器 1 1 1 1 1 1 0 0 0
床.衣柜.电视.空调.热水器.阳台 1 1 0 0 0 1 0 1 0
床.衣柜.沙发.热水器.阳台 1 1 0 0 0 1 0 1 1
床.衣柜.沙发.冰箱.空调.热水器.阳台 1 1 1 0 1 1 0 1 1
床.衣柜.沙发.电视.冰箱.洗衣机.空调 1 1 1 1 1 0 1 0 1
床.衣柜.沙发.电视.冰箱.洗衣机.空调.热水器.宽带.暖气.阳 1 1 1 1 1 1 1 1 1
床.衣柜.沙发.电视.冰箱.洗衣机.空调 1 1 1 1 1 0 1 0 1
空调.热水器.宽带.暖气.阳台 0 0 0 0 1 1 0 1 0
床.衣柜.沙发.电视.冰箱.洗衣机.空调.热水器.阳台 1 1 1 1 1 1 1 1 1
床.洗衣机.空调.阳台.冰箱.卫生间.可做饭.电视 1 0 1 1 1 0 1 1 0
床.衣柜.沙发.电视.冰箱.洗衣机.空调.热水器.阳台 1 1 1 0 1 1 1 1 0
0 0 0 0 0 0 0 0 0
选择房屋所在省市、房屋所在小区、房屋所在地区、房屋朝向、房屋所在楼层高度的特征作为排序特征,依据特征值排序;
Q3、将数据转换为FFM算法需要的格式,将Q2中所述特征的值转换成“field_id:feat_id:value”格式,field_id代表特征所属field的编号,feat_id是特征编号,value是特征的值;
Q4、对提取出来的特征构建租金预测模型,公式为:
|yreal-ypred|/yreal>0.45
其中yreal代表真实租金,ypred代表预测租金;
Q5、对房屋租金进行预测,Q4中,如果比值大于0.45,则租金异常,如比值小于0.45,则租金处于正常范围;
Q6、通过对比预测租金值与真实租金值找出异常租金数据,将Q5中的比值大于0.45的租金异常数值找出对应的房屋。
本发明通过判断Q5中数值,完成租金预测,实现对异常租金值进行检测。
根据图2所示,该图是一种基于FFM算法的房屋租金预测方法的数据转换模式图,提取之后的所有特征需要按照该图中的模式进行转换,其主要包含的内容如下:
Field,一个field一些性质相同的特征的组合,就本例而言,经过one-hot以及n-hot之后的特征都是属于同一field,如出租类型、城市、朝向等。而数据本身就是数值型的特征则自成一个field,如楼层特征。
Feat,一个feat就是一个特征向量,就本例而言,经过one-hot以及n-hot之后的每一个特征向量都是一个feat,而本身就是数值型的特征向量本身就是一个feat,如楼层特征。
Target,target就是FFM算法需要预测的目标,就本例而言,房屋的租金就是target,即value。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (2)

1.一种基于FFM算法的房屋租金预测方法,其特征在于:包括以下几个步骤:
Q1、对房屋数据清洗,即在房屋数据中,对缺失值进行处理;对城市与省份无法对应的记录进行修正;将租金值低于200与租金值高于5000的数据去除;将租金值为“面议”的数据去除;将房屋面积高于200的数据去除;将楼层值不详的数据去除;
Q2、对清洗后的房屋数据进行特征提取,所述特征包括:房屋结构;房屋楼层高度;房屋总楼层;房屋朝向;房屋面积;房屋所在省市;房屋所在地区;房屋所在小区;房屋所提供的家具;房屋出租类型;房屋租金支付方式;所提供的房屋图片数量;
所述提取包括:对房屋楼层高度、房屋朝向、房屋所在地区、房屋所在省市、房屋出租类型、房屋租金支付方式进行one-hot编码,对房屋所提供的家具进行n-hot编码;
选择房屋所在省市、房屋所在小区、房屋所在地区、房屋朝向、房屋所在楼层高度的特征作为排序特征,依据特征值排序;
Q3、将数据转换为FFM算法需要的格式,将Q2中所述特征的值转换成“field_id:feat_id:value”格式,field_id代表特征所属field的编号,feat_id是特征编号,value是特征的值;
Q4、对提取出来的特征构建租金预测模型,公式为:
|yreal-ypred|/yreal>0.45
其中yreal代表真实租金,ypred代表预测租金;
Q5、对房屋租金进行预测;
Q6、通过对比预测租金值与真实租金值找出异常租金数据。
2.根据权利要求1所述的一种基于FFM算法的房屋租金预测方法,其特征在于,所述Q2中,将房屋所在小区进行经纬度转换,若无法查询到该小区的经纬度则利用该小区所在城市的经纬度进行替代。
CN201811134327.2A 2018-09-27 2018-09-27 一种基于ffm算法的房屋租金预测方法 Withdrawn CN109389530A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811134327.2A CN109389530A (zh) 2018-09-27 2018-09-27 一种基于ffm算法的房屋租金预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811134327.2A CN109389530A (zh) 2018-09-27 2018-09-27 一种基于ffm算法的房屋租金预测方法

Publications (1)

Publication Number Publication Date
CN109389530A true CN109389530A (zh) 2019-02-26

Family

ID=65419161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811134327.2A Withdrawn CN109389530A (zh) 2018-09-27 2018-09-27 一种基于ffm算法的房屋租金预测方法

Country Status (1)

Country Link
CN (1) CN109389530A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378508A (zh) * 2019-05-29 2019-10-25 广东工业大学 一种基于大数据的智能预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355453A (zh) * 2016-09-30 2017-01-25 上海天华迈卓管理咨询有限公司 写字楼租金预测方法
US20170357984A1 (en) * 2015-02-27 2017-12-14 Sony Corporation Information processing device, information processing method, and program
CN108038720A (zh) * 2017-12-06 2018-05-15 电子科技大学 一种基于因子分解机的广告点击率预测方法
CN108038713A (zh) * 2017-11-22 2018-05-15 链家网(北京)科技有限公司 房价预估方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170357984A1 (en) * 2015-02-27 2017-12-14 Sony Corporation Information processing device, information processing method, and program
CN106355453A (zh) * 2016-09-30 2017-01-25 上海天华迈卓管理咨询有限公司 写字楼租金预测方法
CN108038713A (zh) * 2017-11-22 2018-05-15 链家网(北京)科技有限公司 房价预估方法及装置
CN108038720A (zh) * 2017-12-06 2018-05-15 电子科技大学 一种基于因子分解机的广告点击率预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378508A (zh) * 2019-05-29 2019-10-25 广东工业大学 一种基于大数据的智能预测方法

Similar Documents

Publication Publication Date Title
CN109389247A (zh) 一种基于大数据的区域房屋租金预测方法
Ural et al. Building population mapping with aerial imagery and GIS data
Limsombunchao House price prediction: hedonic price model vs. artificial neural network
Roueche et al. Empirical approach to evaluating the tornado fragility of residential structures
Lucas et al. Lead contamination in French children's homes and environment
CN112991353A (zh) 一种跨域遥感图像的无监督语义分割方法
CN109389530A (zh) 一种基于ffm算法的房屋租金预测方法
de Castro Mazarro et al. Spatializing inequality across residential built-up types: A relational geography of urban density in Sao Paulo, Brazil.
CN111311029A (zh) 基于空间特征和XGBoost-神经网络融合模型的住宅价格预测方法
Dines et al. Constantly evoked but under-researched: the conundrum of vertical stratification in Naples
Isikdag et al. Interactive modelling of buildings in Google Earth: A 3D tool for Urban Planning
Fang et al. Automated portfolio-based strategic asset management based on deep neural image classification
CN112183561A (zh) 一种用于图像特征提取的联合融减自动编码器算法
Burns et al. Effects of resident control and ownership in self-help housing
Aina Popular settlements in metropolitan Lagos, Nigeria: a socio-economic and structural survey of the habitat of the urban poor
Weber et al. Areal interpolation of population in the USA using a combination of national parcel data and a national building outline layer
Machline et al. The ‘Green’Premium in Israel: Measuring the Effects of Environmental Certification on Housing Prices
Zhou et al. Sinicisation and ethnicity: spatial characteristics of Shui vernacular architecture in Guizhou, Southwest China
Rajabifard et al. A New Method for Integrating 3D spatial information about vertically stratified ownership properties into the property map base
JP2899507B2 (ja) 混構造建築物の積算方式
Aktaş et al. An urban paradox: urban resilience or human needs
Fang et al. Automated portfolio-based strategic asset management approach based on deep neural image classification
Srinivasan et al. Web‐based GIS for live GV of land generation through utilitarian association rule mining and multiple regression analysis for Chennai district
Köhler et al. Urban Mining Cadastre—A Geospatial Data Challenge
Mehmood et al. 3D Spatial Analysis of Temporal Maintenance for Multi-use High-rise Buildings: Case Study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190226