CN109409951A - 一种基于价格指数的房地产市场监测预警方法和系统 - Google Patents
一种基于价格指数的房地产市场监测预警方法和系统 Download PDFInfo
- Publication number
- CN109409951A CN109409951A CN201811224204.8A CN201811224204A CN109409951A CN 109409951 A CN109409951 A CN 109409951A CN 201811224204 A CN201811224204 A CN 201811224204A CN 109409951 A CN109409951 A CN 109409951A
- Authority
- CN
- China
- Prior art keywords
- sample
- price
- data
- real
- price index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于价格指数的房地产市场监测预警方法和系统,涉及信息处理、计算机技术领域。该方法包括通过网页抓取的方式获取各小区的房屋交易信息及房屋特征;将收集到的数据进行编码导入数据库;计算价格指数;利用指数确定房地产市场运行的状态区间并进行预警预报。本发明基于数据抓取技术与房地产价格指数,提高了数据的收集效率、准确度与样本量,可以有效地提高监测预警的实时性与精确性并降低监测预警的成本。
Description
技术领域
本发明涉及信息处理、计算机技术领域,特别是涉及一种基于价格指数的房地产市场监测预警方法和系统。
背景技术
房地产行业作为我国经济的支柱行业,是我国社会经济发展的晴雨表。房地产是一种特殊的商品,其有限性和无法移动性等特征,导致其容易被人们炒作,并产生泡沫,而房地产泡沫一旦破灭,将对一个国家的宏观经济、社会生活的各个方面造成极其严重的后果。房地产市场的暴涨暴跌具有极大的危害性,对房地产走势和市场运行状态做出事前预警,并通过宏观调控促使市场健康有序发展,也有助于贯彻“房子是用来住的、不是用来炒”的指导理念,进一步促进社会经济发展。
房地产市场监测预警指标及指标体系是房地产市场监测预警系统的基础,而房地产价格指数是反映不同时期房地产市场变化趋势和程度最为直观的指标。当前我国的官方房地产编制方法采用的是传统的拉式公式法,在房产交易数据指数型增长、房价结构性差异不断扩大的背景下,传统的指数计算方法不再适应当下的需求,有时更会导致指数与房价市场走势的严重脱节甚至背离。此外,对于房价变动警域和警度方面并没有明确的界限与技术支持,无法满足对当前房地产价格的监测预警。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于价格指数的房地产市场监测预警系统,可有效解决上述问题。本发明所采用的具体技术方案如下:
本发明是通过以下技术方案实现:
一种基于价格指数的房地产市场监测预警方法,该方法步骤如下:
S1:获取待监测区域内各小区的房屋交易信息及其房屋特征数据;
S2:将获取到的数据进行编码并导入数据库,得到初始样本数据;
S3:计算房地产价格指数,具体计算方法如子步骤S301~S304:
S301:构建差分模型,模型形式如下式:
其中,Pb,s,j和Pa,r,j是一个样本对中的两个价格变量原样本,分别为样本b发生在s时刻的住房交易价格和样本a发生在r时刻的住房交易价格,两者共同构成新样本j,且有s>r;Xb,s,j,k和Xa,r,j,k分别为Pb,s,j和Pa,r,j对应的第k个住房特征,αk第k个住房特征所对应的特征价格,m为住房特征的总个数,D′t为第t个周期内的时间哑元变量,βt为第t个周期内反映住房价格中时间固定影响的系数,T为所述初始样本数据中的总期数,εs,r,b,a,j为随机误差项;
S302:根据差分模型的数据要求对所述数据库中的数据进行变形,对单价、合同面积和所在层取对数形式;根据签约时间排序后进行编码,利用编码生成虚拟变量Dt,Dt在当期为1,其他期为0;
S303:以楼栋作为样本匹配空间,采用“单间隔”匹配原则进行样本匹配,得到用于拟合差分模型的新样本;所述“单间隔”匹配原则的具体实现方法为:按时间排序后,将且仅将任意两个相邻时间上的样本进行匹配构成样本对;若第n期没有交易发生,则将第(n-1)期样本直接与第(n+1)期样本进行匹配构成样本对;对于每对样本对,将样本对中的两个样本数据逐项进行求差运算,作为新样本的样本数据;
S304:利用所述新样本对所述差分模型进行拟合,得到βt的拟合值,对βt的拟合值进行指数化,得到无量纲的且仅反映住房市场平均价格变动轨迹的房价指数,具体计算公式为:
其中,Pt即为第t期的价格指数,其中P1为基期价格指数;
S4:以价格指数Pt为样本,根据3σ原则确定当前房地产市场运行的状态区间。
作为优选,所述S1中,房屋交易信息及其房屋特征数据包括:每套交易的房屋所在城区、组团、楼盘名称、幢号、单价、合同面积、所在层、总层数、签约时间。
作为优选,所述S2中,需要在数据库中进行数据异常值的删查。
作为优选,所述的S3中,住房特征共两个,分别为取对数后的合同面积和取对数后的所在层。
作为优选,所述S4中,根据3σ原则确定当前房地产市场运行的状态区间的具体方法如下:根据3σ原则,以S3中计算得到的价格指数Pt为样本数据,计算σ值:
其中,N是价格指数样本数据中的样本数量,即样本Pt的期数,μ是样本Pt的均值;
预警区间如下:过冷区间(-∞,μ-3σ)、偏冷区间[μ-3σ,μ-σ)、合理区间[μ-σ,μ+σ)、偏热区间[μ+σ,μ+3σ)和过热区间[μ+3σ,μ+∞)。
本发明的另一目的在于提供一种基于价格指数的房地产市场监测预警系统,该系统中包括:
数据采集模块:用于获取待监测区域内各小区的房屋交易信息及其房屋特征数据;
数据库模块:用于将获取到的数据进行编码并导入数据库,得到初始样本数据;
指数算法模块:用于计算房地产价格指数,具体计算方法如步骤S301~S304:
S301:构建差分模型,模型形式如下式:
其中,Pb,s,j和Pa,r,j是一个样本对中的两个价格变量原样本,分别为样本b发生在s时刻的住房交易价格和样本a发生在r时刻的住房交易价格,两者共同构成新样本j,且有s>r;Xb,s,j,k和Xa,r,j,k分别为Pb,s,j和Pa,r,j对应的第k个住房特征,αk第k个住房特征所对应的特征价格,m为住房特征的总个数,D′t为第t个周期内的时间哑元变量,βt为第t个周期内反映住房价格中时间固定影响的系数,T为所述初始样本数据中的总期数,εs,r,b,a,j为随机误差项;
S302:根据差分模型的数据要求对所述数据库中的数据进行变形,对单价、合同面积和所在层取对数形式;根据签约时间排序后进行编码,利用编码生成虚拟变量Dt,Dt在当期为1,其他期为0;
S303:以楼栋作为样本匹配空间,采用“单间隔”匹配原则进行样本匹配,得到用于拟合差分模型的新样本;所述“单间隔”匹配原则的具体实现方法为:按时间排序后,将且仅将任意两个相邻时间上的样本进行匹配构成样本对;若第n期没有交易发生,则将第(n-1)期样本直接与第(n+1)期样本进行匹配构成样本对;对于每对样本对,将样本对中的两个样本数据逐项进行求差运算,作为新样本的样本数据;
S304:利用所述新样本对所述差分模型进行拟合,得到βt的拟合值,对βt的拟合值进行指数化,得到无量纲的且仅反映住房市场平均价格变动轨迹的房价指数,具体计算公式为:
其中,Pt即为第t期的价格指数,其中P1为基期价格指数;
预警预报模块:用于以价格指数Pt为样本,根据3σ原则确定当前房地产市场运行的状态区间。
作为优选,所述数据采集模块中,房屋交易信息及其房屋特征数据包括:每套交易的房屋所在城区、组团、楼盘名称、幢号、单价、合同面积、所在层、总层数、签约时间。
作为优选,所述数据库模块中,需要在数据库中进行数据异常值的删查。
作为优选,所述的指数算法模块中,住房特征共两个,分别为取对数后的合同面积和取对数后的所在层。
作为优选,所述预警预报模块中,根据3σ原则确定当前房地产市场运行的状态区间的具体方法如下:根据3σ原则,以指数算法模块中计算得到的价格指数Pt为样本数据,计算σ值:
其中,N是价格指数样本数据中的样本数量,即样本Pt的期数,μ是样本Pt的均值;
预警区间如下:过冷区间(-∞,μ-3σ)、偏冷区间[μ-3σ,μ-σ)、合理区间[μ-σ,μ+σ)、偏热区间[μ+σ,μ+3σ)和过热区间[μ+3σ,μ+∞)。
上述技术方案具有如下有益效果:1、具有数据采样方便、准确与样本量大的优点;2、本发明使用类重复交易法计算指数,符合现实情况,具有理论上的科学性,避免房价结构性差异带来的误导;3、使用科学的σ统计指标进行监控,具有统计学上的科学性;4、实时自动监控房地产价格走势并发出警示,避免信息滞后性。
附图说明
图1是系统的总体架构;
图2是房地产运行的状态区间图;
图3是预警罗盘图;
图4是房价预警热力图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
如图1所示,在本发明中构建了一种基于价格指数的房地产市场监测预警系统,该系统包括数据采集模块、数据库模块、指数算法模块和预警预报模块四个主要模块。下面介绍每个模块的具体作用。
数据采集模块:用于获取待监测区域内各小区的房屋交易信息及其房屋特征数据。房屋交易信息及其房屋特征数据包括:每套交易的房屋所在城区、组团、楼盘名称、幢号、单价、合同面积、所在层、总层数、签约时间等各种可能影响房价的因素,可从当地公布房屋交易信息的网站上抓取。
数据库模块:用于将获取到的数据进行编码并导入数据库,在数据库中进行数据异常值的删查,得到初始样本数据。异常值删查的标准可以根据实际情况进行确定,以删除明显偏离正常交易状态的数据为准。
指数算法模块:用于计算房地产价格指数,具体计算方法如步骤S301~S304:
S301:构建差分模型,模型形式如下式:
其中,Pb,s,j和Pa,r,j是一个样本对中的两个价格变量原样本,分别为样本b发生在s时刻的住房交易价格和样本a发生在r时刻的住房交易价格,两者共同构成新样本j,且有s>r;Xb,s,j,k和Xa,r,j,k分别为Pb,s,j和Pa,r,j对应的第k个住房特征,αk第k个住房特征所对应的特征价格,m为住房特征的总个数,D′t为第t个周期内的时间哑元变量,βt为第t个周期内反映住房价格中时间固定影响的系数,T为所述初始样本数据中的总期数,εs,r,b,a,j为随机误差项;
S302:根据差分模型的数据要求对所述数据库中的数据进行变形,对单价、合同面积和所在层取对数形式;根据签约时间排序后进行编码,利用编码生成虚拟变量Dt,Dt在当期为1,其他期为0。在房地产监控中,一般以月为周期,当然需要时也可以选择季度和年为周期。
要准确地实现房地产市场的监测预警,样本匹配空间的选择的至关重要的。样本匹配空间的选择,即根据某些条件选择一个具有明确范围的样本匹配空间,在该空间内部的样本之间进行相互匹配,在该空间以外的样本不与空间内样本进行匹配。由于匹配空间的选择越精细,样本之间的同质性往往越高(不可观测的异质性主要来自于区位特征),因此匹配空间很大程度上决定了类重复交易指数的计算精度。对于房地产而言,匹配空间有三种,分别是楼“小区”、“销售批次”和“楼栋”,“小区”是以一个完整的住宅小区边界划定样本匹配空间;“销售批次”是以住房销售许可证文号划定样本匹配空间;“楼栋”即将没移动住宅楼栋作为独立的样本匹配空间,每一个“小区”、每一个“销售批次”都可能包含多个“楼栋”。毫无疑问,来自于统一楼栋中的住房样本具有最为接近的区位属性和物理属性,在“楼栋”层面上进行差分模型估计可以减轻一楼变量对模型估计结果的影响。因为“楼栋”层面精度最高,因此,我们选择“楼栋”作为样本的匹配空间进行后续步骤。在选定了空间范围后,即可对同一空间范围内的所有交易样本按照交易发生的时间构造有序样本对,从而获得新的“匹配样本”,具体见S303。
S303:以楼栋作为样本匹配空间,采用“单间隔”匹配原则进行样本匹配,得到用于拟合差分模型的新样本。其中“单间隔”匹配原则的具体实现方法为:按时间排序后,将且仅将任意两个相邻时间上的样本进行匹配构成样本对;若第n期没有交易发生,则将第(n-1)期样本直接与第(n+1)期样本进行匹配构成样本对;对于每对样本对,将样本对中的两个样本数据逐项进行求差运算,作为新样本的样本数据;
上述样本匹配步骤使得本发明具有了另一个优势,即样本量在数理统计中的“扩容”,样本量决定了模型估计的精确度,大样本量能够更好地满足大数定律和中心极限定理的前提假设,提高模型估计结果的有效性。匹配样本之所以“扩容”,是因为匹配过程进行的是两两配对,因此样本量以二次方级的速度增加。
S304:在获得匹配样本后,即可通过差分方程估计时间固定效应,即住房价格随时间的变化情况,具体为:
利用上述S303所产生的新样本对所述差分模型进行拟合,得到βt的拟合值。在拟合时,所采用的住房特征共两个,分别为取对数后的合同面积和取对数后的所在层。
然后对获得的βt拟合值进行指数化(取自然常数e为底的指数函数),得到无量纲的且仅反映住房市场平均价格变动轨迹的房价指数,具体计算公式为:
其中,Pt即为第t期的价格指数,其中P1为基期价格指数,取值为100,β1=0。
预警预报模块:用于以价格指数Pt为样本,根据基于正态分布假设的3σ原则确定当前房地产市场运行的状态区间。3σ原则是以上述计算过程中得到的价格指数Pt为样本数据的,σ代表正态分布中的标准差,μ代表均值。首先需要计算σ值:
其中,N是价格指数样本数据中的样本数量,即样本Pt的期数,μ是样本Pt的均值。
基于该计算方法,偏热偏冷区间采用1个正负标准差σ,过热过冷区间采用3个正负标准差σ。具体预警区间如下:过冷区间(-∞,μ-3σ)、偏冷区间[μ-3σ,μ-σ)、合理区间[μ-σ,μ+σ)、偏热区间[μ+σ,μ+3σ)和过热区间[μ+3σ,μ+∞)。
下面结合具体实施例,以某市的地产市场监测预警为例,对本发明做进一步描述,以便本领域技术人员更好地理解本发明的实质。
如图1所示,一种基于价格指数的房地产市场监测预警系统,包括数据采集模块、数据库模块、指数算法模块和预警预报模块四个主要模块。
1、数据采集模块:利用网页抓取技术收集相关房屋交易数据,包括:城区、组团、楼盘名称、幢号、单价、总价、合同面积、所在层、总层数、签约时间等。
其中,房屋交易相关的数据信息会实时公布到房管局网上,本实施例中,利用计算机网页抓取技术可在第一时间得到需要的相关数据。
数据库模块:将收集到的数据进行编码导入数据库,在数据库中进行数据异常值的删查,将排屋别墅等非公寓类住宅交易信息删除。
最终,数据库中所存储的数据格式如表1所示。
表1房屋信息库
编码 | 城区 | 楼盘名 | 幢号 | 签约时间 | 单价 | 合同面积 | 所在层 | 总层数 | …… |
1 | 主城区 | A | 1 | 2010.1.15 | 16909 | 89.6 | 9 | 13 | …… |
2 | 主城区 | A | 1 | 2010.1.19 | 16612 | 89.6 | 6 | 13 | …… |
3 | 主城区 | A | 1 | 2010.1.20 | 17018 | 125.8 | 9 | 13 | …… |
…… | …… | …… | …… | …… | …… | …… | …… | …… | …… |
2、指数算法模块:基于类重复交易法进行房地产价格指数计算,包括:
a)构建差分模型,具体模型如下式:
其中,Pb,s,j和Pa,r,j是一个样本对中的两个价格变量原样本,分别为样本b发生在s时刻的住房交易价格(单价)和样本a发生在r时刻的住房交易价格(单价),两者共同构成新样本j,且有s>r;Xb,s,j,k和Xa,r,j,k分别为Pb,s,j和Pa,r,j对应的第k个住房特征,αk第k个住房特征所对应的特征价格,m为住房特征的总个数,D′t为第t个周期内的时间哑元变量,βt为第t个周期内反映住房价格中时间固定影响的系数,T为所述初始样本数据中的总期数,εs,r,b,a,j为随机误差项;
b)通过数据变形符合差分模型的数据要求。具体的,用对数函数对单价、合同面积、所在层取对数形式;根据签约时间进行编码,利用编码进行虚拟变量生成,当期为1,其他期为0,本实施例中以每月为一期。
c)以楼栋作为样本匹配空间,采用“单间隔”匹配原则进行样本匹配。具体的,按时间排序后,将且仅将任意两个相邻时间上的样本进行匹配,构成一个样本对。若第n期没有交易发生,则将第(n-1)期样本直接与“单间隔”的第(n+1)期样本进行配对。
以A区1幢为例,选取1-3月部分数据进行样本匹配方法说明。实例中,以a1、a2形式表示单元格,如g1表示取对数后的单价lnp列第一行,即值为9.7356的单元格。
表2A区1幢1-3月样本数据
步骤一:2010年1月、2月样本匹配
将4、5、6行数据分别与1、2、3行数据进行匹配,此时2月为被减数,1月为减数。以lnp列为例,分别进行求差运算:g4-g1、g4-g2、g4-g3,得到2月第一个数据g4与1月的匹配结果;g5-g1、g5-g2、g5-g3,得到2月第二个数据g5与1月的匹配结果;g6-g1、g6-g2、g6-g3,得到2月第三个数据g6与1月的匹配结果。同理将所在层、合同面积及时间虚拟变量进行匹配。需要特别说明的是,时间虚拟变量匹配的结果,减数月为1,被减数月为-1。至此,1月与2月的样本数据匹配结束,得到3×3=9个样本匹配结果。
步骤二:2月、3月样本匹配
即将7、8、9行数据分别与4、5、6行数据进行匹配,此时3月为被减数,2月为减数。
以lnp列为例,g7-g4、g7-g5、g7-g6,得到3月第一个数据g7与2月的匹配结果;g8-g4、g8-g5、g8-g6,得到3月第二个数据g8与2月的匹配结果;g9-g1、g9-g2、g9-g3,得到3月第三个数据g9与2月的匹配结果。同理将所在层、合同面积及时间虚拟变量进行匹配。至此,2月与3月的样本数据匹配结束,得到3×3=9个样本匹配结果。
表三匹配结果
lnp | 合同面积 | 所在层 | D1 | D2 | D3 |
-0.048 | -20 | -8 | -1 | 1 | 0 |
-0.0303 | -20 | -5 | -1 | 1 | 0 |
-0.0553 | -56.2 | -8 | -1 | 1 | 0 |
-0.0118 | 0 | -2 | -1 | 1 | 0 |
0.0059 | 0 | 1 | -1 | 1 | 0 |
-0.0191 | -36.2 | -2 | -1 | 1 | 0 |
-0.0163 | 0.3 | 1 | -1 | 1 | 0 |
0.0014 | 0.3 | 4 | -1 | 1 | 0 |
-0.0236 | -35.9 | 1 | -1 | 1 | 0 |
0.0217 | 20.3 | 7 | 0 | -1 | 1 |
-0.0145 | 0.3 | 1 | 0 | -1 | 1 |
-0.01 | 0 | -2 | 0 | -1 | 1 |
0.048 | 20.3 | 8 | 0 | -1 | 1 |
0.0118 | 0.3 | 2 | 0 | -1 | 1 |
0.0163 | 0 | -1 | 0 | -1 | 1 |
0.0409 | 56.2 | 4 | 0 | -1 | 1 |
0.0047 | 36.2 | -2 | 0 | -1 | 1 |
0.0092 | 35.9 | -5 | 0 | -1 | 1 |
假如该楼栋2月没有数据,只有1月和3月的销售数据,那么就对1月和3月的样本进行匹配。总之,原则就是按照时间排序,相邻时间的样本进行匹配。
但需要指出的是,上述案例中为了表述方便,仅展示了部分数据。在本实施例的实际操作过程中,需要用上述方法,将ln单价、ln总价、ln合同面积、ln所在层、合同面积、所在层以及时间虚拟变量Dt字段进行“单间隔”匹配,其余字段(城区、楼盘名称、组团、幢号、年、月)作为数据信息保留,由此得到了用于拟合差分模型的新样本数据,样本量得以“扩容”。
d)经过上述处理后,得到了新样本数据,其包含某市2010年1月至2016年5月份共78期新建商品房楼栋层面的数据,按照a)中构建的差分模型,利用SPSS软件对数据进行回归得到βt。在拟合时,所采用的住房特征共两个,分别为取对数后的合同面积ln合同面积和取对数后的所在层ln所在层,lnPb,s,j-lnPa,r,j即lnp,本方法以楼栋、小区进行匹配差分,这些特征经过差分后已被去除,不需要再进入模型。
利用SPSS软件对数据进行线性回归,点击菜单分析-回归-线性,得到若干统计性表格。其中两张表格具有代表性,如下表(部分截图),分别是模型汇总表和系数表。
表四模型汇总表
模型 | R | R方 | 调整R方 | 标准估计的误差 | Durbin-Watson |
1 | 0.926 | 0.858 | 0.858 | 0.0839889 | 0.897 |
表五模型回归系数表
系数表中的βt序列即为反映住房价格中时间固定效应的系数向量,D1默认为1,对虚拟变量D2至D77的系数βt进行指数化(取自然常数e为底的指数函数),得到无量纲的且仅反映住房市场平均价格变动轨迹的房价指数,具体计算公式为:
其中,Pt即为第t期的价格指数,其中P1为基期价格指数,取值为100,β1=0。最终得到的各期房价指数如表六所示。
表六各期的房价指数
指数每一期更新都会利用上述类重复交易法进行参数估计。本实施例中,均采用五年期作为指数计算模型中的样本时序长度。例如,在更新2017年1月的指数时,用于构建模型的样本时间范围为2012年2月至2017年1月的数据,仍然共72期。
将上述方法计算出来的价格指数与统计局公布的70个大中城市新建商品住宅销售价格指数对比,其结果较为接近,表明该方法准确、可靠。因此该指数可用于后续的预警预报。
4、预警预报模块:利用3σ警界控制原理(基于正态分布假设的3σ原则)确定房地产运行的状态区间(图2),并设计预警罗盘(图3)与热力图(图4)。具体预警区间如下:过冷区间(-∞,μ-3σ)、偏冷区间[μ-3σ,μ-σ)、合理区间[μ-σ,μ+σ)、偏热区间[μ+σ,μ+3σ)和过热区间[μ+3σ,μ+∞)。即当房地产价格指数落在一个±σ内时,表明房价合理,在热力图中用绿色区域显示。落在+(-)2σ内时,表明房价偏高(低),在热力图中用黄色区域显示;落在+(-)3σ内时,表明房价过高(低),在热力图中用红色区域显示,并向监测人员的通讯工具发送预警信息。σ值的计算如下式:
因此,本实施例中当房地产价格指数落在(98.82,101.78)时,表明房价合理;在(97.35,98.82)时表明房价偏低;在(101.78,103.27)时,表明房价偏高;在(-∞,97.35)时,表明房价过低;在(103.27,+∞)时表明房价过高,需要向监测人员发送预警信息。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (10)
1.一种基于价格指数的房地产市场监测预警方法,其特征在于,步骤如下:
S1:获取待监测区域内各小区的房屋交易信息及其房屋特征数据;
S2:将获取到的数据进行编码并导入数据库,得到初始样本数据;
S3:计算房地产价格指数,具体计算方法如子步骤S301~S304:
S301:构建差分模型,模型形式如下式:
其中,Pb,s,j和Pa,r,j是一个样本对中的两个价格变量原样本,分别为样本b发生在s时刻的住房交易价格和样本a发生在r时刻的住房交易价格,两者共同构成新样本j,且有s>r;Xb,s,j,k和Xa,r,j,k分别为Pb,s,j和Pa,r,j对应的第k个住房特征,αk第k个住房特征所对应的特征价格,m为住房特征的总个数,D′t为第t个周期内的时间哑元变量,βt为第t个周期内反映住房价格中时间固定影响的系数,T为所述初始样本数据中的总期数,εs,r,b,a,j为随机误差项;
S302:根据差分模型的数据要求对所述数据库中的数据进行变形,对单价、合同面积和所在层取对数形式;根据签约时间排序后进行编码,利用编码生成虚拟变量Dt,Dt在当期为1,其他期为0;
S303:以楼栋作为样本匹配空间,采用“单间隔”匹配原则进行样本匹配,得到用于拟合差分模型的新样本;所述“单间隔”匹配原则的具体实现方法为:按时间排序后,将且仅将任意两个相邻时间上的样本进行匹配构成样本对;若第n期没有交易发生,则将第(n-1)期样本直接与第(n+1)期样本进行匹配构成样本对;对于每对样本对,将样本对中的两个样本数据逐项进行求差运算,作为新样本的样本数据;
S304:利用所述新样本对所述差分模型进行拟合,得到βt的拟合值,对βt的拟合值进行指数化,得到无量纲的且仅反映住房市场平均价格变动轨迹的房价指数,具体计算公式为:
其中,Pt即为第t期的价格指数,其中P1为基期价格指数;
S4:以价格指数Pt为样本,根据3σ原则确定当前房地产市场运行的状态区间。
2.如权利要求1所述的基于价格指数的房地产市场监测预警方法,其特征在于,所述S1中,房屋交易信息及其房屋特征数据包括:每套交易的房屋所在城区、组团、楼盘名称、幢号、单价、合同面积、所在层、总层数、签约时间。
3.如权利要求1所述的基于价格指数的房地产市场监测预警方法,其特征在于,所述S2中,需要在数据库中进行数据异常值的删查。
4.如权利要求1所述的基于价格指数的房地产市场监测预警方法,其特征在于,所述的S3中,住房特征共两个,分别为取对数后的合同面积和取对数后的所在层。
5.如权利要求1所述的基于价格指数的房地产市场监测预警方法,其特征在于,所述S4中,根据3σ原则确定当前房地产市场运行的状态区间的具体方法如下:根据3σ原则,以S3中计算得到的价格指数Pt为样本数据,计算σ值:
其中,N是价格指数样本数据中的样本数量,即样本Pt的期数,μ是样本Pt的均值;
预警区间如下:过冷区间(-∞,μ-3σ)、偏冷区间[μ-3σ,μ-σ)、合理区间[μ-σ,μ+σ)、偏热区间[μ+σ,μ+3σ)和过热区间[μ+3σ,μ+∞)。
6.一种基于价格指数的房地产市场监测预警系统,其特征在于,包括:
数据采集模块:用于获取待监测区域内各小区的房屋交易信息及其房屋特征数据;
数据库模块:用于将获取到的数据进行编码并导入数据库,得到初始样本数据;
指数算法模块:用于计算房地产价格指数,具体计算方法如步骤S301~S304:
S301:构建差分模型,模型形式如下式:
其中,Pb,s,j和Pa,r,j是一个样本对中的两个价格变量原样本,分别为样本b发生在s时刻的住房交易价格和样本a发生在r时刻的住房交易价格,两者共同构成新样本j,且有s>r;Xb,s,j,k和Xa,r,j,k分别为Pb,s,j和Pa,r,j对应的第k个住房特征,αk第k个住房特征所对应的特征价格,m为住房特征的总个数,D′t为第t个周期内的时间哑元变量,βt为第t个周期内反映住房价格中时间固定影响的系数,T为所述初始样本数据中的总期数,εs,r,b,a,j为随机误差项;
S302:根据差分模型的数据要求对所述数据库中的数据进行变形,对单价、合同面积和所在层取对数形式;根据签约时间排序后进行编码,利用编码生成虚拟变量Dt,Dt在当期为1,其他期为0;
S303:以楼栋作为样本匹配空间,采用“单间隔”匹配原则进行样本匹配,得到用于拟合差分模型的新样本;所述“单间隔”匹配原则的具体实现方法为:按时间排序后,将且仅将任意两个相邻时间上的样本进行匹配构成样本对;若第n期没有交易发生,则将第(n-1)期样本直接与第(n+1)期样本进行匹配构成样本对;对于每对样本对,将样本对中的两个样本数据逐项进行求差运算,作为新样本的样本数据;
S304:利用所述新样本对所述差分模型进行拟合,得到βt的拟合值,对βt的拟合值进行指数化,得到无量纲的且仅反映住房市场平均价格变动轨迹的房价指数,具体计算公式为:
其中,Pt即为第t期的价格指数,其中P1为基期价格指数;
预警预报模块:用于以价格指数Pt为样本,根据3σ原则确定当前房地产市场运行的状态区间。
7.如权利要求1所述的基于价格指数的房地产市场监测预警系统,其特征在于,所述数据采集模块中,房屋交易信息及其房屋特征数据包括:每套交易的房屋所在城区、组团、楼盘名称、幢号、单价、合同面积、所在层、总层数、签约时间。
8.如权利要求1所述的基于价格指数的房地产市场监测预警系统,其特征在于,所述数据库模块中,需要在数据库中进行数据异常值的删查。
9.如权利要求1所述的基于价格指数的房地产市场监测预警系统,其特征在于,所述的指数算法模块中,住房特征共两个,分别为取对数后的合同面积和取对数后的所在层。
10.如权利要求1所述的基于价格指数的房地产市场监测预警系统,其特征在于,所述预警预报模块中,根据3σ原则确定当前房地产市场运行的状态区间的具体方法如下:根据3σ原则,以指数算法模块中计算得到的价格指数Pt为样本数据,计算σ值:
其中,N是价格指数样本数据中的样本数量,即样本Pt的期数,μ是样本Pt的均值;
预警区间如下:过冷区间(-∞,μ-3σ)、偏冷区间[μ-3σ,μ-σ)、合理区间[μ-σ,μ+σ)、偏热区间[μ+σ,μ+3σ)和过热区间[μ+3σ,μ+∞)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811224204.8A CN109409951A (zh) | 2018-10-19 | 2018-10-19 | 一种基于价格指数的房地产市场监测预警方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811224204.8A CN109409951A (zh) | 2018-10-19 | 2018-10-19 | 一种基于价格指数的房地产市场监测预警方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109409951A true CN109409951A (zh) | 2019-03-01 |
Family
ID=65468653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811224204.8A Pending CN109409951A (zh) | 2018-10-19 | 2018-10-19 | 一种基于价格指数的房地产市场监测预警方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109409951A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110179A (zh) * | 2019-03-16 | 2019-08-09 | 平安城市建设科技(深圳)有限公司 | 房市热力地图生成方法、装置、设备及存储介质 |
CN111179010A (zh) * | 2019-09-27 | 2020-05-19 | 任我游(厦门)科技发展有限公司 | 不合理价格产品的在线公证方法、系统、设备和介质 |
CN112418911A (zh) * | 2020-11-05 | 2021-02-26 | 中国科学院城市环境研究所 | 一种住宅价格指数预警方法、终端设备及存储介质 |
CN113793236A (zh) * | 2021-09-16 | 2021-12-14 | 深圳壹账通智能科技有限公司 | 基于多层感知器的房价指数的显示方法、装置以及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102254277A (zh) * | 2011-06-27 | 2011-11-23 | 中国建设银行股份有限公司 | 一种用于房地产估值的数据处理系统与方法 |
CN102682462A (zh) * | 2012-04-28 | 2012-09-19 | 廊坊市大华夏神农信息技术有限公司 | 农产品价格动态云图分析法 |
US20130103459A1 (en) * | 2008-10-18 | 2013-04-25 | Kevin Leon Marshall | Method and system for providing a home data index model |
-
2018
- 2018-10-19 CN CN201811224204.8A patent/CN109409951A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130103459A1 (en) * | 2008-10-18 | 2013-04-25 | Kevin Leon Marshall | Method and system for providing a home data index model |
CN102254277A (zh) * | 2011-06-27 | 2011-11-23 | 中国建设银行股份有限公司 | 一种用于房地产估值的数据处理系统与方法 |
CN102682462A (zh) * | 2012-04-28 | 2012-09-19 | 廊坊市大华夏神农信息技术有限公司 | 农产品价格动态云图分析法 |
Non-Patent Citations (2)
Title |
---|
刘斌 等: "上海Case-Shiller二手房价格指数的编制与应用研究", 《上海金融》 * |
郑思齐 等: "类重复交易房价指数编制方法与应用", 《统计研究》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110179A (zh) * | 2019-03-16 | 2019-08-09 | 平安城市建设科技(深圳)有限公司 | 房市热力地图生成方法、装置、设备及存储介质 |
CN111179010A (zh) * | 2019-09-27 | 2020-05-19 | 任我游(厦门)科技发展有限公司 | 不合理价格产品的在线公证方法、系统、设备和介质 |
CN112418911A (zh) * | 2020-11-05 | 2021-02-26 | 中国科学院城市环境研究所 | 一种住宅价格指数预警方法、终端设备及存储介质 |
CN113793236A (zh) * | 2021-09-16 | 2021-12-14 | 深圳壹账通智能科技有限公司 | 基于多层感知器的房价指数的显示方法、装置以及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409951A (zh) | 一种基于价格指数的房地产市场监测预警方法和系统 | |
AU2012301523B2 (en) | Dynamic tagging to create logical models and optimize caching in energy management systems | |
Räsänen et al. | Reducing energy consumption by using self-organizing maps to create more personalized electricity use information | |
CN105260803A (zh) | 一种系统用电量预测方法 | |
CN108959424A (zh) | 一种用于电力系统负荷监测的城市用电地图的操作方法 | |
Monien et al. | Comparison of building modelling assumptions and methods for urban scale heat demand forecasting | |
CN106651025B (zh) | 交通情况预测方法及装置 | |
CN110084439A (zh) | 一种基于nesma功能点估算的软件成本度量方法及云系统 | |
Leprince et al. | Data mining cubes for buildings, a generic framework for multidimensional analytics of building performance data | |
Capelo et al. | Near–real time burst location and sizing in water distribution systems using artificial neural networks | |
CN112907063A (zh) | 人口流动率和房屋空置率确定方法及终端设备 | |
Song et al. | Improved price index for condominiums | |
Zhao et al. | Short-term microgrid load probability density forecasting method based on k-means-deep learning quantile regression | |
Silva et al. | Modeling water consumption in multifamily buildings: a case study in Southern Brazil | |
Demirdöğen et al. | Determination of business intelligence and analytics-based healthcare facility management key performance indicators | |
CN114693351A (zh) | 信息预测方法、装置以及电子设备 | |
Sanderford et al. | Factors influencing US homebuilders' adoption of green homebuilding products | |
Cui et al. | Energy consumption prediction and household feature analysis for different residential building types using machine learning and SHAP: Toward energy-efficient buildings | |
Wen et al. | Measuring 3D process plant model similarity based on topological relationship distribution | |
Chen et al. | The use of a CUSUM residual chart to monitor respiratory syndromic data | |
Ha et al. | ERAM as a complementary method of Spatial Syntax: Comparison of methodologies by linking spatial analysis with income-producing efficiency for a retail outlet in South Korea | |
Peplinski et al. | A machine learning framework to estimate residential electricity demand based on smart meter electricity, climate, building characteristics, and socioeconomic datasets | |
CN114186785A (zh) | 构建房屋资源禀赋图谱的方法和提供房屋资源信息的方法 | |
Mehar et al. | Analytical model for residential predicting energy consumption | |
Liu et al. | The influence of calculation error of hourly marine meteorological parameter on building energy consumption calculation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190301 |