CN110148009A - 楼盘房价数据生成方法、装置、设备及计算机存储介质 - Google Patents

楼盘房价数据生成方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN110148009A
CN110148009A CN201910297282.9A CN201910297282A CN110148009A CN 110148009 A CN110148009 A CN 110148009A CN 201910297282 A CN201910297282 A CN 201910297282A CN 110148009 A CN110148009 A CN 110148009A
Authority
CN
China
Prior art keywords
information
building
room rate
current
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910297282.9A
Other languages
English (en)
Inventor
郑来良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Urban Construction Technology Shenzhen Co Ltd
Original Assignee
Ping An Urban Construction Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Urban Construction Technology Shenzhen Co Ltd filed Critical Ping An Urban Construction Technology Shenzhen Co Ltd
Priority to CN201910297282.9A priority Critical patent/CN110148009A/zh
Publication of CN110148009A publication Critical patent/CN110148009A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种楼盘房价数据生成方法、装置、设备及计算机存储介质,所述方法首先调用预设地图以获取当前楼盘对应的城市区域和楼盘环境配套信息,然后获取当前楼盘的房价信息,并根据城市区域查找对应的人口特征信息和名义生产总值,同时从网络信息源中抓取与所述城市区域相关的政策信息文本,并对政策信息文本进行语义分析得到相关的影响参数,再将所述影响参数、人口特征信息、名义生产总值和楼盘环境配套信息送入预设房产数据模型中进行分析,以确定政策信息文本对当前楼盘的房价影响指数;最后根据当前楼盘的房价信息和房价影响指数生成当前楼盘的房价数据。进而能够十分直观清楚、高效快捷地生成当前楼盘的房价数据。

Description

楼盘房价数据生成方法、装置、设备及计算机存储介质
技术领域
本发明涉及计算机信息技术领域,尤其涉及一种楼盘房价数据生成方法、装置、设备以及计算机存储介质。
背景技术
购房者在看到某个楼盘后,由于并没有去过该楼盘的所在片区,尤其对于身处外地的购房者来说想来该城市买房却无法实地考察该楼盘周围的配套信息,很不方便;虽然目前已经存在少数对房价进行预估的APP应用程序,但是这些APP应用程序对房价数据的预估不够准确,用户在使用这些APP应用程序时体验不佳;同时,由于各地政府频频出台房地产相关政策,最后通过计算机程序生成的房价数据更加的不准确。
发明内容
本发明的主要目的在于提供了一种楼盘房价数据生成方法、设备、装置以及计算机存储介质,旨在解决用户使用常规的房价预估应用程序最后生成的房价数据不准确,给用户造成不好体验的问题。
为实现上述目的,本发明提供了一种楼盘房价数据生成方法,所述方法包括:
响应输入的当前楼盘查找指令,调用预设地图获取当前楼盘对应的城市区域和楼盘环境配套信息;
获取所述当前楼盘的房价信息;
根据所述城市区域查找对应的人口特征信息和名义生产总值;
从网络信息源中抓取与所述城市区域相关的政策信息文本;
根据所述政策信息文本测算所述楼盘环境配套信息的影响参数、所述人口特征信息的影响参数、以及所述名义生产总值的影响参数;
将所述人口特征信息的影响参数、所述名义生产总值的影响参数、所述楼盘环境配套信息的影响参数、所述人口特征信息、所述名义生产总值和所述楼盘环境配套信息送入预设房产数据模型中进行分析,根据分析结果确定所述政策信息文本对所述当前楼盘的房价影响指数;
根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据;
其中,所述人口特征信息包括人口流动量和人口年龄结构;所述预设房产数据模型通过公式(一)表征,所述公式(一)为:
其中,h表征当前楼盘的房价影响指数;表示用于计算楼盘的环境配套信息对房价走势的影响指标,k1表示在所述房价影响指数中的系数比重,e1表示所述楼盘环境配套信息的影响参数,其中e1为非负整数;
p[(ageing,mobility),e2]表示用于计算当前楼盘所在城市区域的当前人口特征信息对房价走势的影响指标,ageing表示当前楼盘所在城市区域的人口年龄结构,mobility表示当前楼盘所在城市区域的人口流动量,k2表示p[(ageing,mobility),e2]在所述房价影响指数中的系数比重,e2表示所述人口特征信息的影响参数;
g(GDP,e3)用于计算当前楼盘所在城市区域的名义GDP对房价走势的影响指标,k3表示g(GDP,e3)在所述房价影响指数中的系数比重,e3表示所述名义生产总值的影响参数。
优选地,所述根据所述政策信息文本测算所述楼盘环境配套信息的影响参数、所述人口特征信息的影响参数、以及所述名义生产总值的影响参数,具体包括:
对所述政策信息文本进行分词,得到所述政策信息文本的多个分词词语;
从所述政策信息文本的多个分词词语中分别确定与所述楼盘环境配套信息相关的第一类别特征词、与所述人口特征信息相关的第二类别特征词、以及与所述名义生产总值相关的第三类别特征词;
从所述政策信息文本中分别提取与所述第一类别特征词对应的第一目标文本,与所述第二类别特征词对应的第二目标文本,以及与所述第三类别特征词对应的第三目标文本;
从各个目标文本中分别提取目标特征词,所述目标特征词表征反映政策信息的正负面维度;
分别计算各个目标特征词在所述政策信息的权重值;
根据所述第一目标文本的目标特征词权重值测算所述楼盘环境配套信息的影响参数;根据所述第二目标文本的目标特征词权重值测算所述人口特征信息的影响参数;根据所述第三目标文本的目标特征词权重值测算所述名义生产总值的影响参数。
优选地,所述分别计算各个目标特征词在所述政策信息的权重值的步骤,包括:
分别计算各个目标特征词在对应的目标文本中的词频;
分别计算各个目标特征词在所述政策信息中的逆文档频率;
分别根据各个目标特征词对应的词频和逆文档频率计算在所述政策信息的权重值。
优选地,所述房价信息包括当前房价信息和历史房价信息;
所述根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据的步骤,包括:
将所述当前房价信息与所述历史楼盘房价信息进行比较,生成第一比较结果;
从数据库中获取所述城市区域的人均收入;
将所述人均收入与所述当前房价信息进行比较,生成第二比较结果;
根据所述第一比较结果、所述第二比较结果和所述房价影响指数生成所述当前楼盘的房价数据。
优选地,所述响应输入的当前楼盘查找指令,调用预设地图获取当前楼盘对应的城市区域和楼盘环境配套信息的步骤,包括:
响应输入的当前楼盘查找指令,调用预设地图确定当前楼盘的位置信息,并获取所述预设地图中的当前实景图像;
根据所述位置信息确定所述当前楼盘对应的城市区域;
获取以所述位置信息为圆心且半径为预设距离的区域范围内的设施模型;
获取各设施模型的设施名称,分别将各个设施模型嵌入所述当前实景图像中,并对嵌入成功后的设施模型的设施名称进行语音播报。
优选地,所述根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据的步骤之后,还包括:
确定所述当前楼盘所在城市,获取并展示所述城市其他楼盘的房价数据;
将所述当前楼盘的房价数据与所述其他楼盘的房价数据进行比对,并展示比对结果。
此外,为实现上述目的,本发明还提出一种楼盘房价数据生成装置,所述装置包括:
调用模块,用于响应输入的当前楼盘查找指令,调用预设地图获取当前楼盘对应的城市区域和楼盘环境配套信息;
获取模块,用于获取所述当前楼盘的房价信息;
查找模块,用于根据所述城市区域查找对应的人口特征信息和名义生产总值;
抓取模块,用于从网络信息源中抓取与所述城市区域相关的政策信息文本;
测试模块,用于根据所述政策信息文本测算所述楼盘环境配套信息的影响参数、所述人口特征信息的影响参数、以及所述名义生产总值的影响参数;
分析模块,用于将所述人口特征信息的影响参数、所述名义生产总值的影响参数、所述楼盘环境配套信息的影响参数、所述人口特征信息、所述名义生产总值和所述楼盘环境配套信息送入预设房产数据模型中进行分析,根据分析结果确定所述政策信息文本对所述当前楼盘的房价影响指数;
生成模块,用于根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据。
此外,为实现上述目的,本发明还提出一种用于楼盘房价数据生成的设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的楼盘房价数据生成程序,所述楼盘房价数据生成程序配置为实现如上所述的楼盘房价数据生成方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机存储介质,所述计算机存储介质存储有楼盘房价数据生成程序,所述楼盘房价数据生成程序配置为实现如上所述的楼盘房价数据生成方法的步骤。
本发明首先调用预设地图以获取当前楼盘对应的城市区域和楼盘环境配套信息,然后获取当前楼盘的房价信息,并根据城市区域查找对应的人口特征信息和名义生产总值,同时从网络信息源中抓取与所述城市区域相关的政策信息文本,并对政策信息文本进行语义分析得到相关的影响参数,再将所述影响参数、人口特征信息、名义生产总值和楼盘环境配套信息送入预设房产数据模型中进行分析,以确定政策信息文本对当前楼盘的房价影响指数;最后根据当前楼盘的房价信息和房价影响指数生成当前楼盘的房价数据。进而能够十分直观清楚、高效快捷地生成当前楼盘的房价数据,为购房者提供了便利。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的用于楼盘房价数据生成的设备的结构示意图;
图2为本发明一种楼盘房价数据生成方法一实施例的流程示意图;
图3为本发明一种楼盘房价数据生成方法第二实施例的流程示意图;
图4为本发明一种楼盘房价数据生成方法第三实施例的流程示意图;
图5为本发明一种楼盘房价数据生成方法第四实施例流程示意图;
图6为本发明一种楼盘房价数据生成装置的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
参照图1,图1为本发明实施例方案涉及的硬件运行环境的用于楼盘房价数据生成的设备的结构示意图。
如图1所示,该设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对所述设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接收模块以及楼盘房价数据生成程序。
在图1所示的设备中,本发明的楼盘房价数据生成装置通过处理器1001调用存储器1005中存储的楼盘房价数据生成程序,并执行楼盘房价数据生成方法的步骤。
基于上述硬件运行环境,提出本发明一种楼盘房价数据生成方法第一实施例。参照图2,图2本发明一种楼盘房价数据生成方法第一实施例的流程示意图。
本实施例中,所述楼盘房价数据生成方法包括以下步骤:
步骤S10:响应输入的当前楼盘查找指令,调用预设地图获取当前楼盘对应的城市区域和楼盘环境配套信息。
需要说明的是,本实施例的执行主体为上述用于楼盘房价数据生成的设备的处理器。
可理解的是,一个城市内很多个楼盘,购房者往往会看花了眼,不知道买哪个城市区域的楼盘会增值,也无法比较各个楼盘之间的优点和缺点,购房者在看到某个楼盘后,由于并没有去过该楼盘的所在片区,尤其对于身处外地的购房者想来该城市买房却无法实地考察该楼盘周围的配套信息。
本实施例购房者可通过一个预设地图对该楼盘的地理位置信息进行定位,获取该楼盘对应的经度纬度信息,进而能够确定该楼盘是属于一线城市还是二线三线城市等,然后能够确定该楼盘所处的城市区域是否属于该城市的市中心还是三环以为等。
具体地,该预设地图会预先存储有3D城市模型建筑,能够真实地还原城市内的实景图像(包括各种街道、绿化规模和建筑设施);所述楼盘环境配套信息可以包括商业街、医院、学校、餐厅、购物中心、电影院等建筑设施。
步骤S20:获取所述当前楼盘的房价信息。
可理解的是,在确定当前楼盘的以上信息后,会实时从数据库中获取该楼盘的当前房价信息和历史房价信息,进而能够获取当前楼盘房价的当前走势。
步骤S30:根据所述城市区域查找对应的人口特征信息和名义生产总值。
具体地,可根据所述城市区域从数据库中查找对应的人口特征信息和名义生产总值,本实施例中的数据库会按照预设时段(例如一个月)同步更新各个城市区域对应的人口特征信息和名义生产总值;
可理解的是,所述人口特征信息包括所述当前楼盘所处城市区域的人口流动量和人口年龄结构,如果人口流量越大则对房价有上涨的影响趋势;如果人口年龄结构越趋于年轻化则对房价有上涨的影响趋势,相反,人口年龄结构越趋于老龄化则对房价有下降的影响趋势;
所述名义生产总值即所述当前楼盘所处城市区域的名义GDP(也成货币GDP),可理解的是,一般名义GDP会和房价成正比,即该区域的名义GDP比其他区域的名义GDP要高,那么即该区域的范围内的楼盘房价也会相应地比其他区域的楼盘房价要高。
步骤S40:从网络信息源中抓取与所述城市区域相关的政策信息文本。
具体地,本实施例可通过Python脚本作为预设网络爬虫工具从网络信息源中方便快捷地抓取与所述城市区域相关的政策信息文本。从网页、论坛、微博、社交应用等网络信息来源获取政策信息文本。
步骤S50:根据所述政策信息文本测算所述楼盘环境配套信息的影响参数、所述人口特征信息的影响参数、以及所述名义生产总值的影响参数;
步骤S60:将所述人口特征信息的影响参数、所述名义生产总值的影响参数、所述楼盘环境配套信息的影响参数、所述人口特征信息、所述名义生产总值和所述楼盘环境配套信息送入预设房产数据模型中进行分析,根据分析结果确定所述政策信息文本对所述当前楼盘的房价影响指数。
在具体实现中,本实施例可通过对所述政策信息文本进行语义分析来获取该政策信息文本对当前楼盘的楼盘环境配套信息的影响,通过对所述政策信息文本进行语义分析来获取该政策信息文本对当前楼盘所在城市区域的人口特征信息的影响,通过对所述政策信息文本进行语义分析来获取该政策信息文本对当前楼盘所在城市区域的名义生产总值的影响。
再将所述人口特征信息的影响参数、所述名义生产总值的影响参数,以及所述楼盘环境配套信息的影响参数、所述人口特征信息、所述名义生产总值和所述楼盘环境配套信息送入预设房产数据模型中进行分析。
具体地,可通过公式(一)对预设房产数据模型进行表征,
其中,h表征当前楼盘的房价影响指数,h越大则房价上升趋势越明显,即影响的正面作用越大;需要说明的是,k1、k2、k3分别表示房价的各个影响指标在预估房价影响指数中的系数比重;在程序员开发楼盘房价数据生成程序的过程中,可根据房地产专家的分析意见对k1、k2、k3自行设定,因为在不同时期,房价影响指标可能会存在差异,例如某段时期,环境配套信息对房价的影响力度要大于名义生产总值的对房价的影响力度;也可能在下一段时期名义生产总值对房价的影响度要大于环境配套信息对房价的影响度。
表示用于计算当前楼盘的环境配套信息对房价的影响指标,j表示该城市区域可能新增的配套设施;e1表示所述楼盘环境配套信息的影响参数,e1也表示j的上界,e1为非负整数;
若对政策信息的语义分析结果中获得的信息涉及到该城市区域可能会修建地铁、或者商业性建筑,则楼盘环境配套信息的影响参数e1为正数,这些设施可以是酒店、电影院、餐馆或者超市等建筑设施,这些设施用j表示,修建的建筑越多则e1值越大,的值也越高,
具体地,若对政策信息的语义分析结果中获得的信息涉及到该城市区域可能会修建新的酒店、新的电影院、餐馆和超市等设施建筑,统计新修建的设施建筑的数量j,相应的房价影响指数表示为:
其中,F(school)、F(subway)、F(restaurant)、F(market)分别表示学校设施指标、地铁建筑指标、餐馆设施指标和超市设施指标,即e1值越大,则影响房价的指标累加的个数越多,对房价上涨的正面影响作用越大;
本实施例会为不同的建筑设施的影响指标设置预设参数,例如:地铁建筑指标的对房价上涨的正面作用明显大于其他建筑指标,上述四种不同的建筑设施的影响指标对应的预设参数按照正面影响作用又大到小的排序可以为:F(subway)>F(school)=F(market)>F(restaurant)。
p[(ageing,mobility),e2]表示用于计算当前楼盘所在城市区域的当前人口特征信息对房价的影响指标,k2表示p[(ageing,mobility),e2]在房价影响指数中的系数比重,e2表示所述人口特征信息的影响参数;ageing表示当前楼盘所在城市区域的目前的人口年龄结构,如果该年龄结构趋于老年化则ageing的值越大,如果该年龄结构趋于年轻化则ageing的值越小;mobility表示当前楼盘所在城市区域的目前的人口流动量;
若对政策信息的语义分析结果中获得的信息涉及到该城市区域可能会增加人流量的内容,例如该城市出台一个政策以大学生公积金优惠的政策希望留着当地的大学生,这样e2来表征该政策对该城市区域人口特征的影响度;
具体地,
mobility表示当前楼盘所在城市区域的目前的人口流动量,可以表征该城市区域的预估的人口流动量,e2越大,则表示该城市区域的预估的人口流动量会越大;
ageing表示当前楼盘所在城市区域的目前的人口年龄结构,可以表征该城市区域的预估的人口年龄结构,e2越大,则表示该城市区域的预估的人口年龄结构越年轻化。p[(ageing,mobility),e2]值越大,则房价上升趋势越明显,即影响的正面作用越大。
g(GDP,e3)用于计算当前楼盘所在城市区域的名义GDP对房价的影响指标,k3表示g(GDP,e3)在房价影响指数中的系数比重,e3表示所述名义生产总值的影响参数,GDP表示所述楼盘所在城市区域目前的名义GDP;本实施例中g(GDP,e3)=e3×GDP–GDP;
例如,假设对政策信息的语义分析结果为:涉及到国家将出台降准降息的政策,那么该城市区域的名义GDP可能因该政策而呈现增长的势头,e3可用来表征的该政策的一个积极效力值,此时e3>1,当e3越大,则g(GDP,e3)的值越大,说明该区域的名义GDP会增长,则房价上升趋势越明显,即影响的正面作用越大。如果对政策信息的语义分析结果中获得的信息可能会抑制到该城市区域名义GDP的增长,则e3可用来表征的该政策的一个消极效力值,此时e3<1,此时g(GDP,e3)为负值,对房价的上涨起负面影响。。
步骤S70:根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据。
可理解的是,本实施例最终会给房价走势确定4个级别走势,如果是A级别则代表该楼盘房价上涨空间很高,即h(A)的值很大;如果是B级别则代表该楼盘房价上涨空间平缓,即h(B)的值适中;如果是C级别代表该楼盘房价上涨空间不高,即h(C)的值很小,如果是D级别则代表该楼盘房价可能会降低,即h(D)的值为负。
具体地,本实施例会将当前楼盘的当前房价信息与历史楼盘房价信息进行比较,生成第一比较结果;同时还会从数据库中获取所述城市区域的人均收入,将所述人均收入与所述当前房价信息进行比较,生成第二比较结果;
例如所述历史房价信息可以为当前楼盘所在区域5年以内的房价走势;如果历史房价到当前房价呈持续增长势头,且所述房价正面影响指数大于预设指数阈值,所述当前房价不超过所述城市区域的人均收入的3倍,则当前楼盘的房价上涨空间为A级别;
例如如果历史房价到当前房价呈平缓增长势头,且所述房价正面影响指数大于预设指数阈值,所述当前房价为所述城市区域的人均收入的5倍,则当前楼盘的房价上涨空间为C级别。
需要说明的是,以上最终得到房价走势是根据历史房价信息、当前房价信息、所述城市区域的人均收入以及所述房价影响指数生成的,即根据所述第一比较结果、所述第二比较结果和所述房价影响指数生成所述当前楼盘的房价数据,其中,具体的生成方式中涉及比较的阈值可以由开发人员自行设置。
本实施例首先调用预设地图以获取当前楼盘对应的城市区域和楼盘环境配套信息,然后获取当前楼盘的房价信息,并根据城市区域查找对应的人口特征信息和名义生产总值,同时从网络信息源中抓取与所述城市区域相关的政策信息文本,并对政策信息文本进行语义分析得到相关的影响参数,再将所述影响参数、人口特征信息、名义生产总值和楼盘环境配套信息送入预设房产数据模型中进行分析,以确定政策信息文本对当前楼盘的房价影响指数;最后根据当前楼盘的房价信息和房价影响指数生成当前楼盘的房价数据。进而能够十分直观清楚、高效快捷地分析出当前楼盘的房价数据,为购房者提供了便利。
参照图3,图3本发明一种楼盘房价数据生成方法第二实施例的流程示意图,基于上述楼盘房价数据生成方法第一实施例,提出一种楼盘房价数据生成方法第二实施例。
本实施例中,所述步骤S50,具体包括:
步骤S051:对所述政策信息文本进行分词,得到所述政策信息文本的多个分词词语;
可理解的是,本实施例首先分别对每个新闻文本进行分词处理、以及词性标注操作,使得政策信息文本具有多个不同词性成分的词语。
步骤S052:从所述政策信息文本的多个分词词语中分别确定与所述楼盘环境配套信息相关的第一类别特征词、与所述人口特征信息相关的第二类别特征词、以及与所述名义生产总值相关的第三类别特征词;
可理解的是,所述第一类别特征词为与所述楼盘环境配套信息相关的词汇,主要以名词或者动词为主,例如“商业街”、“招标”等词语;所述第二类别特征词为与所述人口特征信息相关的词汇,例如“大学生”、“养老”、“老龄化”等;所述第三类别特征词为与所述名义生产总值相关的词汇,例如“贷款”、“高新产业”等词语。本实施例会预先将以上类别特征词存入关系型数据库中的数据表中,例如可以建立政策信息表(包括类别特征词对应的政策信息)和词汇表(包括大量词汇),词汇表中的词汇与政策信息表中的政策信息建立主外键映射关系,通过主外键映射关系就能够确定词汇表中的词汇是对应政策信息表中哪种类别特征词。
步骤S053:从所述政策信息文本中分别提取与所述第一类别特征词对应的第一目标文本,与所述第二类别特征词对应的第二目标文本,以及与所述第三类别特征词对应的第三目标文本;
本实施例会按照第一类别特征词、第二类别特征词以及第三类别特征词分别对政策信息文本进行截取,本实施例以分为三段文本为例进行说明,即
对所述政策信息文本中涉及到包含第一类别特征词的内容进行截取,形成第一目标文本;对所述政策信息文本中涉及到包含第二类别特征词的内容进行截取,形成第二目标文本;对所述政策信息文本中涉及到包含第三类别特征词的内容进行截取,形成第三目标文本。
步骤S054:从各个目标文本中分别提取目标特征词,所述目标特征词表征反映政策信息的正负面维度;
可理解的是,每一个目标文本中都存在能够对政策信息产生积极或消极影响的目标特征词。本实施例会预先将能够反映政策信息的正负面维度的名词、动词和形容词作为目标特征词保存到关系型数据库中;
各目标文本分别与政策信息表的类别特征词对应,类别特征词又与政策信息对应,对应的关系为:第一目标文本-第一类别特征词-楼盘环境配套信息;第二目标文本-第二类别特征词-人口特征信息;第三目标文本-第三类别特征词-名义生产总值。
例如,从第一目标文本中提取能够对楼盘环境配套信息产生积极或消极影响的目标特征词,例如第一目标文本中的某句为“对商业性建筑进行扩建”,则“扩建”一词属于对楼盘配套环境产生积极影响的目标特征词。
步骤S055:分别计算各个目标特征词在所述政策信息文本的权重值;
步骤S056:根据所述第一目标文本的目标特征词权重值测算所述楼盘环境配套信息的影响参数e1;根据所述第二目标文本的目标特征词权重值测算所述人口特征信息的影响参数e2;根据所述第三目标文本的目标特征词权重值测算所述名义生产总值的影响参数e3。
可理解的是,权重值表征相对于政策信息产生积极影响程度或消极影响程度,例如“扩建”一词作为第一目标文本的目标特征词(第一目标文本-第一类别特征词-楼盘环境配套信息),需要计算“扩建”一词在在所述政策信息文本中的权重值。该目标特征词“扩建”在整个政策信息文本中的权重值越高,则说明该目标特征词越能反映对政策信息的影响。
本实施例可通过计算所述目标特征词“扩建”在所述政策信息文本中的逆文档频率来确定该目标特征词在所述政策信息文本中的权重值。本实施例中,如果某些指定目标特征词(例如“扩建”)在其所属的目标文本(例如第一目标文本)中出现的频率高,但是在所述政策信息文本中的其他文本(第三目标文本或第二目标文本)中很少出现,则说明该指定目标特征词的逆文档频率较高,该指定目标特征词具有很好的类别区分能力。基于逆文档频率可以更加准确地计算该目标特征词在所述政策信息文本中的权重值。
在具体实现中,可分别计算各个目标特征词在对应的目标文本中的词频;
然后分别计算各个目标特征词在所述政策信息中的逆文档频率;
最后分别根据各个目标特征词对应的词频和逆文档频率计算在所述政策信息的权重值。
例如在计算第一目标文本中的“扩建”一词在所述政策信息的权重值时,可通过以下公式(a)计算“扩建”一词在所述第一目标文本中的词频,
其中,tfi表示指定目标特征词ti在其对应的目标文本Test中的频率值,ni为所述目标文本Test中词语ti的频次;Testk为所述目标文本Test中第k个词语的频次,将目标文本Test中出现的每个词语的频次相加作为分母,可求得指定目标特征词ti在其对应的目标文本Test中的频率值。
通过以下公式(b)计算该指定目标特征词ti在所述政策信息文本中的逆文档频率,
其中,|D|表示所述政策信息文本的文本总数量(即对政策信息文本进行截取后,划分成的文本数量为|D|);|d:ti∈d|表示所述政策信息文本中包括指定目标特征词ti的出现的文本数量;idfi表示该指定目标特征词ti在所述政策信息文本中的逆文档频率;
通话以下公式(c)计算该指定目标特征词在所述政策信息文本中的权重值,
(tf/idf)i=tfi×idfi 公式(c)
其中,(tf/idf)i表示该指定目标特征词ti在所述政策信息文本中的权重值。
同理,按照上述公式(a)-公式(b)-公式(c)的顺序,能够分别得出第一目标文本的第i个目标特征词在所述政策信息的权重值We1(i)、第二目标文本的第i个目标特征词在所述政策信息的权重值We2(i),以及第三目标文本的第i个目标特征词在所述政策信息的权重值We3(i)。
进一步地,本实施例可通过来测算楼盘环境配套信息对楼盘房价的影响参数e1,即将第一目标文本中每个目标特征词在所述政策信息文本的权重值相加,得到影响参数e1;
可通过来测算人口特征信息对楼盘房价的影响参数e2,即将第二目标文本中每个目标特征词在所述政策信息文本的权重值相加,得到影响参数e2;
可通过来测算名义生产总值对楼盘房价的影响参数e3,即将第三目标文本中每个目标特征词在所述政策信息文本的权重值相加,得到影响参数e3。
参照图4,图4本发明一种楼盘房价数据生成方法第三实施例的流程示意图,基于上述楼盘房价数据生成方法第一实施例,提出一种楼盘房价数据生成方法第三实施例。
本实施例中,所述步骤S10,包括:
步骤S101,响应输入的当前楼盘查找指令,调用预设地图确定当前楼盘的位置信息,并获取所述预设地图中的当前实景图像;
步骤S102,根据所述位置信息确定所述当前楼盘对应的城市区域。
需要说明的是,上述用于楼盘房价数据生成的设备可以是为用户(即购房者)随身携带的一种特制的多功能设备(比如智能眼镜、智能安全帽等);也可以是手机、平板电脑等移动终端;
本实施例以手机为例,手机中存储有预设地图软件,用户打开预设地图软件,同时用户输入当前楼盘查找指令后(该指令包括当前楼盘的具体名称、所属城市以及所属房地产公司等信息),预设地图软件会确定当前楼盘的位置信息(经纬度),此时手机的屏幕画面中会生成与所述当前楼盘相关的实景图像,并可以播报所述当前楼盘对应的城市区域(市中心、二环、三环…四环以外…)。
步骤S103,获取以所述位置信息为圆心且半径为预设距离的区域范围内的设施模型;
可理解的是,手机的处理器会以所述当前楼盘的位置坐标为圆心,搜索方圆1.5公里以内的可以表征楼盘环境配套信息的设施模型,这些设施模型可以包括商业街、医院、学校、餐厅、购物中心和电影院等建筑设施。这些预场景模型是预先通过使用360度全景摄像机拍摄的,并生成数字化(具有坐标系的)三维虚拟建筑场景模型后录入后台模型数据库中,该三维虚拟建筑场景模型是和现实建筑各层楼内场景一一对应的虚拟场景。
步骤S104,获取各设施模型的设施名称,分别将各个设施模型嵌入所述当前实景图像中,并对嵌入成功后的设施模型的设施名称进行语音播报;
在具体实现中,手机的处理器会获取在方圆1.5公里以内搜索到的各设施模型的设施名称,分别将各个设施模型嵌入所述当前实景图像中,同时对嵌入成功后的设施模型的设施名称进行语音播报,进而能够让用户更加清楚地了解到所述当前楼盘周围的楼盘环境配套信息,提高用户的体验。
参照图5,图5本发明一种楼盘房价数据生成方法第四实施例的流程示意图,基于上述楼盘房价数据生成方法第一实施例,提出一种楼盘房价数据生成方法第四实施例。
本实施例中,所述步骤S70之后,还包括:
步骤S71,确定所述当前楼盘所在城市,获取并展示所述城市其他楼盘的房价数据;
步骤S72,将所述当前楼盘的房价数据与所述其他楼盘的房价数据进行比对,并展示比对结果。
可理解的是,用户在购买某一个城市的房产时,肯定会“货比三家”,用户在使用所述设备确定所述当前楼盘的房价数据后,设备的处理器会获取并展示该用户在此前使用所述设备生成的该城市其他楼盘的房价数据;
具体地,将所述当前楼盘的房价数据与所述其他楼盘的房价数据进行比对,形成一个列表,并对比对结果进行展示,这样购房者能够更加方便的对不同的楼盘进行比较和选择。
此外,参照图5,本发明还提出一种楼盘房价数据生成装置,所述装置包括:
调用模块10,用于响应输入的当前楼盘查找指令,调用预设地图获取当前楼盘对应的城市区域和楼盘环境配套信息;
获取模块20,用于获取所述当前楼盘的房价信息;
查找模块30,用于根据所述城市区域查找对应的人口特征信息和名义生产总值;
抓取模块40,用于从网络信息源中抓取与所述城市区域相关的政策信息文本;
测试模块50,用于根据所述政策信息文本测算所述楼盘环境配套信息的影响参数、所述人口特征信息的影响参数、以及所述名义生产总值的影响参数;
分析模块60,用于将所述人口特征信息的影响参数、所述名义生产总值的影响参数、所述楼盘环境配套信息的影响参数、所述人口特征信息、所述名义生产总值和所述楼盘环境配套信息送入预设房产数据模型中进行分析,根据分析结果确定所述政策信息文本对所述当前楼盘的房价影响指数;
生成模块70,用于根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据。
可理解的是,本实施的楼盘房价数据生成装置可以是一种APP应用程序,该APP应用程序装载在上述实施例的用于楼盘房价数据生成的设备中,本发明楼盘房价数据生成装置的具体实现方式可参照上述楼盘房价数据生成方法实施例,此处不再赘述。
此外,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有楼盘房价数据生成程序,所述楼盘房价数据生成程序被处理器执行时实现如上所述的楼盘房价数据生成方法步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种楼盘房价数据生成方法,其特征在于,所述方法包括:
响应输入的当前楼盘查找指令,调用预设地图获取当前楼盘对应的城市区域和楼盘环境配套信息;
获取所述当前楼盘的房价信息;
根据所述城市区域查找对应的人口特征信息和名义生产总值;
从网络信息源中抓取与所述城市区域相关的政策信息文本;
根据所述政策信息文本测算所述楼盘环境配套信息的影响参数、所述人口特征信息的影响参数、以及所述名义生产总值的影响参数;
将所述人口特征信息的影响参数、所述名义生产总值的影响参数,以及所述楼盘环境配套信息的影响参数、所述人口特征信息、所述名义生产总值和所述楼盘环境配套信息送入预设房产数据模型中进行分析,根据分析结果确定所述政策信息文本对所述当前楼盘的房价影响指数;
根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据;
其中,所述人口特征信息包括人口流动量和人口年龄结构;所述预设房产数据模型通过公式(一)表征,所述公式(一)为:
其中,h表征当前楼盘的房价影响指数;表示用于计算楼盘的环境配套信息对房价走势的影响指标,k1表示在所述房价影响指数中的系数比重,e1表示所述楼盘环境配套信息的影响参数,其中e1为非负整数;
p[(ageing,mobility),e2]表示用于计算当前楼盘所在城市区域的当前人口特征信息对房价走势的影响指标,ageing表示当前楼盘所在城市区域的人口年龄结构,mobility表示当前楼盘所在城市区域的人口流动量,k2表示p[(ageing,mobility),e2]在所述房价影响指数中的系数比重,e2表示所述人口特征信息的影响参数;
g(GDP,e3)用于计算当前楼盘所在城市区域的名义GDP对房价走势的影响指标,k3表示g(GDP,e3)在所述房价影响指数中的系数比重,e3表示所述名义生产总值的影响参数。
2.如权利要求1所述的方法,其特征在于,所述根据所述政策信息文本测算所述楼盘环境配套信息的影响参数、所述人口特征信息的影响参数、以及所述名义生产总值的影响参数,具体包括:
对所述政策信息文本进行分词,得到所述政策信息文本的多个分词词语;
从所述政策信息文本的多个分词词语中分别确定与所述楼盘环境配套信息相关的第一类别特征词、与所述人口特征信息相关的第二类别特征词、以及与所述名义生产总值相关的第三类别特征词;
从所述政策信息文本中分别提取与所述第一类别特征词对应的第一目标文本,与所述第二类别特征词对应的第二目标文本,以及与所述第三类别特征词对应的第三目标文本;
从各个目标文本中分别提取目标特征词,所述目标特征词表征反映政策信息的正负面维度;
分别计算各个目标特征词在所述政策信息的权重值;
根据所述第一目标文本的目标特征词权重值测算所述楼盘环境配套信息的影响参数;根据所述第二目标文本的目标特征词权重值测算所述人口特征信息的影响参数;根据所述第三目标文本的目标特征词权重值测算所述名义生产总值的影响参数。
3.如权利要求2所述的方法,其特征在于,所述分别计算各个目标特征词在所述政策信息的权重值的步骤,包括:
分别计算各个目标特征词在对应的目标文本中的词频;
分别计算各个目标特征词在所述政策信息中的逆文档频率;
分别根据各个目标特征词对应的词频和逆文档频率计算在所述政策信息的权重值。
4.如权利要求1-3所述的方法,其特征在于,所述房价信息包括当前房价信息和历史房价信息;
所述根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据的步骤,包括:
将所述当前房价信息与所述历史楼盘房价信息进行比较,生成第一比较结果;
从数据库中获取所述城市区域的人均收入;
将所述人均收入与所述当前房价信息进行比较,生成第二比较结果;
根据所述第一比较结果、所述第二比较结果和所述房价影响指数生成所述当前楼盘的房价数据。
5.如权利要求1-3任一项所述的方法,其特征在于,所述响应输入的当前楼盘查找指令,调用预设地图获取当前楼盘对应的城市区域和楼盘环境配套信息的步骤,包括:
响应输入的当前楼盘查找指令,调用预设地图确定当前楼盘的位置信息,并获取所述预设地图中的当前实景图像;
根据所述位置信息确定所述当前楼盘对应的城市区域;
获取以所述位置信息为圆心且半径为预设距离的区域范围内的设施模型;
获取各设施模型的设施名称,分别将各个设施模型嵌入所述当前实景图像中,并对嵌入成功后的设施模型的设施名称进行语音播报。
6.如权利要求1-3任一项所述的方法,其特征在于,所述根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据的步骤之后,还包括:
确定所述当前楼盘所在城市,获取并展示所述城市其他楼盘的房价数据;
将所述当前楼盘的房价数据与所述其他楼盘的房价数据进行比对,并展示比对结果。
7.一种楼盘房价数据生成装置,其特征在于,所述装置包括:
调用模块,用于响应输入的当前楼盘查找指令,调用预设地图获取当前楼盘对应的城市区域和楼盘环境配套信息;
获取模块,用于获取所述当前楼盘的房价信息;
查找模块,用于根据所述城市区域查找对应的人口特征信息和名义生产总值;
抓取模块,用于从网络信息源中抓取与所述城市区域相关的政策信息文本;
测算模块,用于根据所述政策信息文本测算所述楼盘环境配套信息的影响参数、所述人口特征信息的影响参数、以及所述名义生产总值的影响参数;
分析模块,用于将所述人口特征信息的影响参数、所述名义生产总值的影响参数、所述楼盘环境配套信息的影响参数、所述人口特征信息、所述名义生产总值和所述楼盘环境配套信息送入预设房产数据模型中进行分析,根据分析结果确定所述政策信息文本对所述当前楼盘的房价影响指数;
生成模块,用于根据所述当前楼盘的房价信息和所述房价影响指数生成所述当前楼盘的房价数据。
8.一种用于楼盘房价数据生成的设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的楼盘房价数据生成程序,所述楼盘房价数据生成程序配置为实现如权利要求1至6中任一项所述的楼盘房价数据生成方法的步骤。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有楼盘房价数据生成程序,所述楼盘房价数据生成程序配置为实现如权利要求1至6中任一项所述的楼盘房价数据生成方法的步骤。
CN201910297282.9A 2019-04-12 2019-04-12 楼盘房价数据生成方法、装置、设备及计算机存储介质 Pending CN110148009A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910297282.9A CN110148009A (zh) 2019-04-12 2019-04-12 楼盘房价数据生成方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910297282.9A CN110148009A (zh) 2019-04-12 2019-04-12 楼盘房价数据生成方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN110148009A true CN110148009A (zh) 2019-08-20

Family

ID=67588894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910297282.9A Pending CN110148009A (zh) 2019-04-12 2019-04-12 楼盘房价数据生成方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN110148009A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149771A (zh) * 2020-09-30 2020-12-29 成都新潮传媒集团有限公司 一种楼盘卖点标签的采集方法、装置及计算机设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149771A (zh) * 2020-09-30 2020-12-29 成都新潮传媒集团有限公司 一种楼盘卖点标签的采集方法、装置及计算机设备

Similar Documents

Publication Publication Date Title
CN111343075B (zh) 在基于地图的社交媒体平台上的位置隐私关联
EP2820616B1 (en) Empirical expert determination and question routing system and method
US9824463B2 (en) Methods and systems for providing mapping, data management, and analysis
Goodchild et al. Crowdsourcing geographic information for disaster response: a research frontier
WO2017076205A1 (zh) 一种获取聊天发起句的回复提示内容的方法及装置
JP5413170B2 (ja) アノテーション表示システム,方法及びサーバ装置
CN107424043A (zh) 一种产品推荐方法及装置,电子设备
US20090089149A1 (en) Systems, techniques, and methods for providing location assessments
US20130321466A1 (en) Determining to Display Designations of Points of Interest Within a Map View
JP4950508B2 (ja) 施設情報管理システム、施設情報管理装置、施設情報管理方法および施設情報管理プログラム
TW201508680A (zh) 來自社群和事件資料的即時活動建議
CN113826092A (zh) 使用实况数据流和/或搜索查询来确定关于发展中的事件的信息
CN110362242A (zh) 一种地图展示方法及终端设备
US11449898B2 (en) Method, device, and storage medium for recommending point of interest for location-based service
Wali et al. Development of an android-based tourism guide (A case study: Sabang City, Indonesia)
CN115100643B (zh) 融合三维场景语义的单目视觉定位增强方法和设备
US9811539B2 (en) Hierarchical spatial clustering of photographs
CN111538745A (zh) 一种面向应急领域的专题数据poi检索系统及检索方法
CN111813910B (zh) 客服问题的更新方法、系统、终端设备及计算机存储介质
KR20200122701A (ko) 맛집 정보 제공 방법 및 이를 위한 서비스 서버
Liu et al. Enriching the GIScience research agenda: Fusing augmented reality and location‐based social networks
JP2006113984A (ja) 情報提供システム,メタデータ収集解析サーバ,およびコンピュータプログラム
KR20210065773A (ko) 빅데이터 기반의 감성정보 분석평가 시스템 및 그 구동방법
CN110148009A (zh) 楼盘房价数据生成方法、装置、设备及计算机存储介质
CN107241219B (zh) 用户信任度预测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190820

WD01 Invention patent application deemed withdrawn after publication