CN112819231A - 用于预测家庭户数的方法、装置及设备 - Google Patents

用于预测家庭户数的方法、装置及设备 Download PDF

Info

Publication number
CN112819231A
CN112819231A CN202110158026.9A CN202110158026A CN112819231A CN 112819231 A CN112819231 A CN 112819231A CN 202110158026 A CN202110158026 A CN 202110158026A CN 112819231 A CN112819231 A CN 112819231A
Authority
CN
China
Prior art keywords
family
area
users
model
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110158026.9A
Other languages
English (en)
Inventor
马欣雨
李沫
吴立成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Minglue Zhaohui Technology Co Ltd
Original Assignee
Beijing Minglue Zhaohui Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Minglue Zhaohui Technology Co Ltd filed Critical Beijing Minglue Zhaohui Technology Co Ltd
Priority to CN202110158026.9A priority Critical patent/CN112819231A/zh
Publication of CN112819231A publication Critical patent/CN112819231A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及机器学习技术领域,公开一种用于预测家庭户数的方法,包括:获取待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据;将人口数量、家庭户籍数和经济特征数据输入第一预设模型,获取家庭户占比预测值;根据家庭户占比预测值获取备选家庭户数;根据所述备选家庭户数获取家庭户数。在预测待预测年份的家庭户数时,考虑了人口数量、家庭户籍数和经济特征数据和家庭户数,提高了对家庭户数预测的准确性。本申请还公开一种用于预测家庭户数的装置及设备。

Description

用于预测家庭户数的方法、装置及设备
技术领域
本申请涉及机器学习技术领域,例如涉及一种用于预测家庭户数的方法、装置及设备。
背景技术
家庭户是我国人口最基本的社会组织,是人们生活的微观环境,它的发展将直接影响到生育子女、养老事业、货币储蓄、商品消费、住房建设和迁移流动等各个方面,影响到生活方式和社会文化的发展。因而,家庭户数预测是社会、经济和环境发展规划必不可少的重要基础。
在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:现有技术需要在预测待预测年份的家庭户数时,通常只考虑了待预测年份以前的家庭户数历史数据,难以准确预测出家庭户数。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于预测家庭户数的方法、装置及设备,能够提高对家庭户数预测的准确性。
在一些实施例中,所述方法包括:获取待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据;将所述人口数量、所述家庭户籍数和所述经济特征数据输入第一预设模型,获取家庭户占比预测值;根据所述家庭户占比预测值获取备选家庭户数;根据所述备选家庭户数获取家庭户数。
在一些实施例中,所述装置包括:处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述的用于预测家庭户数的方法。
在一些实施例中,所述设备包括上述的用于预测家庭户数的装置。
本公开实施例提供的用于预测家庭户数的方法、装置及设备,可以实现以下技术效果:通过将待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据输入第一预设模型,获取家庭户占比预测值,根据家庭户占比预测值获取备选家庭户数,根据备选家庭户数获得家庭户数。在预测待预测年份的家庭户数时,考虑了人口数量、家庭户籍数和经济特征数据和家庭户数,提高了对家庭户数预测的准确性。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一个用于预测家庭户数的方法的示意图;
图2是本公开实施例提供的另一个用于预测家庭户数的方法的示意图;
图3是本公开实施例提供的一个用于预测家庭户数的装置的示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
结合图1所示,本公开实施例提供一种用于预测家庭户数的方法,包括:
步骤S101,获取待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据。
步骤S102,将待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据输入第一预设模型,获取家庭户占比预测值。
步骤S103,根据家庭户占比预测值获取待测区域的备选家庭户数。
步骤S104,根据待测区域的备选家庭户数获取待测区域的家庭户数。
采用本公开实施例提供的用于预测家庭户数的方法,通过将待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据输入第一预设模型,获取家庭户占比预测值,根据家庭户占比预测值获取备选家庭户数,根据备选家庭户数获得家庭户数。在预测待预测年份的家庭户数时,考虑了人口数量、家庭户籍数和经济特征数据和家庭户数,提高了对家庭户数预测的准确性。
可选地,待测区域对应的人口数量为待测区域对应的户籍人口数量。可选地,待测区域对应的经济特征数据包括待测区域的GDP(Gross Domestic Product,国内生产总值)、待测区域的人均GDP等。
可选地,家庭户占比为待测区域的家庭户数占其归属地的家庭户数的比例。例如:城市的家庭户占比为城市的家庭户数占所属省份的家庭户数的比例。可选地,备选家庭户数为待测区域常住家庭户数。
可选地,第一预设模型为随机森林回归模型,第一预设模型通过以下方式获得:获取待测区域对应的人口数量样本数据、待测区域对应的家庭户籍数样本数据和待测区域对应的经济特征样本数据;将人口数量样本数据、家庭户籍数样本数据和经济特征样本数据输入随机森林回归模型进行训练,获得第一预设模型。
可选地,在中国统计年鉴中获取待测区域对应的人口数量样本数据、待测区域对应的家庭户籍数样本数据和待测区域对应的经济特征样本数据。可选地,人口数量样本数据为户籍人口数量。可选地,经济特征样本数据包括待测区域的GDP样本数据、待测区域的人均GDP样本数据等。
可选地,将人口数量样本数据、家庭户籍数样本数据和经济特征样本数据输入随机森林回归模型进行训练,获得第一预设模型,包括:将人口数量样本数据、家庭户籍数样本数据和经济特征样本数据输入随机森林回归模型进行迭代训练;在每次训练后获取训练后的备选模型;获取备选模型的拟合优度;将满足第一预设条件的拟合优度所对应的备选模型确定为第一预设模型。
可选地,将人口数量样本数据、家庭户籍数样本数据、经济特征样本数据和家庭户占比样本值作为第一预设模型的样本数据。在一些实施例中,如表1所示,表1为山东省部分城市2010年的样本数据的示例表。
Figure BDA0002935184720000041
表1
如表1所示,2010年济南市的户籍人口数量为730.77万人,2010年济南市的家庭户籍数为237.5881万户,2010年济南市的GDP为4456.857亿元,2010年济南市的人均GDP为100339.4元,2010年济南市的家庭户数占山东省的家庭户数的比例为0.081681。
可选地,获取备选模型的拟合优度,包括:通过计算
Figure BDA0002935184720000051
获得备选模型的拟合优度;其中,R2为备选模型的拟合优度,
Figure BDA0002935184720000052
为第i年的家庭户占比预测值,
Figure BDA0002935184720000053
为家庭户占比样本值的平均值,yi为第i年的家庭户占比样本值。
可选地,将满足第一预设条件的拟合优度所对应的备选模型确定为第一预设模型,包括:将达到第一设定阈值的拟合优度所对应的备选模型确定为第一预设模型。可选地,第一设定阈值为0.75。
在一些实施例中,将第一预设模型的样本数据按照8:2的比例划分为训练集和测试集,将训练集输入随机森林回归模型进行迭代训练,在每次训练后获取训练后的备选模型,并根据备选模型的拟合优度确定出第一预设模型,并通过测试集对第一预设模型进行性能测试,从而确保最后确定出的第一预设模型的准确度较高。
在一些实施例中,家庭户数的变化是一种社会关系的变化,考虑到这种变化与人口的自然增长、迁入迁出、以及当地的经济水平等有关,通过建立这些因素与家庭户数占比之间的回归模型,从而找到家庭户数与多个因素之间的联系,在预测待预测年份的家庭户数时,不是从待预测年份以前的家庭户数历史数据这一个单一的因素进行预测,而是从人口数量样本数据、家庭户籍数样本数据和经济特征样本数据多个因素建立模型,提高了模型的准确性,从而提高了预测家庭户数的准确性。
可选地,获取待测区域对应的人口数量,包括:获取待测区域对应的历史人口数量;将该历史人口数量输入第二预设模型,获取待测区域对应的人口数量。在一些实施例中,在获取待测区域2019年对应的人口数量的情况下,获取待测区域对应2010年至2018年的历史人口数量,将2010年至2018年的历史人口数量输入第二预设模型,获得待测区域2019年对应的人口数量。这样,能够利用第二预设模型获取待测区域对应的人口数量,在无法直接获取到待测区域对应的人口数量的情况下,能够根据待测区域对应的历史人口数量获取待测区域对应的人口数量,从而实现对家庭户数的预测。
可选地,通过计算
Figure BDA0002935184720000061
获得待测区域对应的人口数量;其中,
Figure BDA0002935184720000062
为待测区域对应的人口数量,θ0,θ1,θ2,……,θn为第二预设模型对应的回归系数,X1,X2,……,Xn为待测区域对应的历史人口数量。
可选地,第二预设模型为线性回归模型,第二预设模型通过以下方式获得:获取待测区域对应的历史人口数量样本数据;利用该历史人口数量样本数据对线性回归模型进行训练,获得第二预设模型。在一些实施例中,获取待测区域对应2010至2018年的历史人口数量样本数据;利用2010年至2018年的历史人口数量样本数据对线性回归模型进行训练,获得第二预设模型。
可选地,获取待测区域对应的家庭户籍数,包括:获取待测区域对应的历史家庭户籍数;将该历史家庭户籍数输入第三预设模型,获取待测区域对应的家庭户籍数。在一些实施例中,在获取待测区域2019年对应的家庭户籍数的情况下,获取待测区域对应2010年至2018年的历史家庭户籍数,将2010年至2018年的历史家庭户籍数输入第三预设模型,获得待测区域2019年对应的家庭户籍数。
这样,能够利用第三预设模型获取待测区域对应的家庭户籍数,在无法直接获取到待测区域对应的家庭户籍数的情况下,能够根据待测区域对应的历史家庭户籍数获取待测区域对应的家庭户籍数,从而实现对家庭户数的预测。
可选地,通过计算
Figure BDA0002935184720000063
获得待测区域对应的家庭户籍数;其中,
Figure BDA0002935184720000064
为待测区域对应的家庭户籍数,θ0′,θ1′,θ2′,……,θn′为第三预设模型对应的回归系数,X1′,X2′,……,Xn′为待测区域对应的历史家庭户籍数。
可选地,第三预设模型为线性回归模型,第三预设模型通过以下方式获得:获取待测区域对应的历史家庭户籍数样本数据;利用该历史家庭户籍数样本数据对线性回归模型进行训练,获得第三预设模型。在一些实施例中,获取待测区域对应2010至2018年的历史家庭户籍数样本数据,利用2010年至2018年的历史家庭户籍数样本数据对线性回归模型进行训练,获得第三预设模型。
可选地,获取待测区域对应的经济特征数据,包括:获取待测区域对应的历史经济特征数据;将该历史经济特征数据输入第四预设模型,获取待测区域对应的经济特征数据。这样,能够利用第四预设模型获取待测区域对应的经济特征数据,在无法直接获取到待测区域对应的经济特征数据的情况下,能够根据待测区域对应的历史经济特征数据获取待测区域对应的经济特征数据,从而实现对家庭户数的预测。
可选地,通过计算
Figure BDA0002935184720000071
获得待测区域对应的经济特征数据;其中,
Figure BDA0002935184720000073
为待测区域对应的经济特征数据,θ0″,θ1″,θ2″,……,θn″为第四预设模型对应的回归系数,X1″,X2″,……,Xn″为待测区域对应的历史经济特征数据。在一些实施例中,如表2所示,表2为山东省部分城市2010至2018年的历史经济特征数据和预测出的2019年山东省部分城市对应的经济特征数据。
Figure BDA0002935184720000072
表2
如表2所示,山东省烟台市2010至2018年的城市GDP分别为4358.5亿元、4906.8亿元、5281.4亿元、5613.9亿元、6002.1亿元、6446.1亿元、6925.7、7343.5亿元、7832.6亿元;将烟台市2010至2018年的城市GDP输入第四预设模型,获取山东省烟台市2019年对应的城市GDP为8189.6亿元。
可选地,第四预设模型为线性回归模型,第四预设模型通过以下方式获得:获取待测区域对应的历史经济特征样本数据;利用该历史经济特征样本数据对线性回归模型进行训练,获得第四预设模型。在一些实施例中,获取待测区域对应2010至2018年的历史经济特征样本数据,利用2010年至2018年的历史经济特征样本数据对线性回归模型进行训练,获得第四预设模型。
可选地,根据家庭户占比预测值获取待测区域的备选家庭户数,包括:获取待测区域归属地的家庭户数;根据待测区域归属地的家庭户数和家庭户占比预测值确定待测区域的备选家庭户数。
可选地,通过计算a=b*c,获得待测区域的备选家庭户数;其中,a为待测区域的备选家庭户数,b为待测区域归属地的家庭户数,c为家庭户占比预测值。
可选地,在获取待测区域的备选家庭户数之前,还包括:对家庭户占比预测值进行归一化处理,使得归一化后的属于同一归属地的各待测区域家庭户占比预测值之和为1。例如,归一化后的属于同一省份的各城市家庭户占比预测值之和为1。
可选地,根据待测区域的备选家庭户数,获取待测区域的家庭户数,包括:获取户均人口数;在户均人口数满足第二预设条件的情况下,将备选家庭户数确定为家庭户数;在户均人口数不满足第二预设条件的情况下,根据户均人口数对备选家庭户数进行调整,直至调整后的备选家庭户数所对应的户均人口数满足第二预设条件。
可选地,户均人口数包括预测户均人口数和历史户均人口数。
可选地,通过计算
Figure BDA0002935184720000081
获取预测户均人口数;其中,s为预测户均人口数,z为待测区域对应的人口数量,u为待测区域的备选家庭户数。
可选地,通过计算
Figure BDA0002935184720000091
获取历史户均人口数;其中,j为历史户均人口数,k为待测区域对应的历史人口数量,l为待测区域对应的历史家庭户籍数。
可选地,满足第二预设条件包括:预测户均人口数和历史户均人口数之间的差值在预设范围。可选地,预设范围为v-1.5<v<v+1.5;其中,v为预测户均人口数和历史户均人口数之间的差值。
可选地,在户均人口数不满足第二预设条件的情况下,在属于同一归属地的各待测区域家庭户占比预测值之和为1的基础上,对家庭户占比预测值进行调整,获取待测区域调整后的备选家庭户数,并重新计算调整后的备选家庭户数所对应的预测户均人口数,直至调整后的备选家庭户数所对应的预测户均人口数和历史户均人口数之间的差值在预设范围内,将调整后的备选家庭户数确定为家庭户数。
可选地,通过计算a′=b*c′,获得待测区域调整后的备选家庭户数,其中,a′为待测区域调整后的备选家庭户数,b为待测区域归属地的家庭户数,c′为待测区域调整后的家庭户占比预测值。
可选地,对家庭户占比预测值进行调整,包括:若预测户均人口数小于历史户均人口数,说明备选家庭户数较大,则将家庭户占比预测值增加第二设定阈值;若预测户均人口数大于历史户均人口数,说明备选家庭户数较小,则将家庭户占比预测值减小第二设定阈值。可选地,第二设定阈值为0.1。
在一些实施例中,获取2010年历史户均人口数和2019年预测户均人口数;将2010年历史户均人口数和2019年预测户均人口数进行比对,在2010年历史户均人口数和2019年预测户均人口数之间的差值在预设范围内的情况下,将2019年预测户均人口数对应的备选家庭户数确定为家庭户数;在2010年历史户均人口数和2019年预测户均人口数之间的差值不在预设范围内的情况下,若2019年预测户均人口数为小于2010年历史户均人口数,则将2019年家庭户占比预测值0.15加上0.1;根据调整后的家庭户占比预测值0.16再次计算获得调整后的备选家庭户数;若2019年预测户均人口数大于2010年历史户均人口数,则将2019年家庭户占比预测值0.15减去0.1;根据调整后的家庭户占比预测值0.14再次计算获得调整后的备选家庭户数;在同省份下各城市的家庭户占比预测值之和为1的基础上重复调整,直至2019年预测户均人口数和2010年历史户均人口数之间的差值在预设范围内,将调整后的2019年备选家庭户数确定为2019年家庭户数。
这样,在备选家庭户数不满足第二预设条件的情况下,能根据户均人口数对家庭户占比预测值进行调整,获取待测区域调整后的备选家庭户数,从而确定家庭户数,在预测待预测年份待测区域的家庭户数时,提高了对家庭户数预测的准确性。
结合图2所示,本公开实施例提供一种用于预测家庭户数的方法,包括:
步骤S201,获取待测区域对应的历史人口数量、待测区域对应的历史家庭户籍数和待测区域对应的历史经济特征数据。
步骤S202,将待测区域对应的历史人口数量输入第二预设模型,获取待测区域对应的人口数量;将待测区域对应的历史家庭户籍数输入第三预设模型,获取待测区域对应的家庭户籍数;将待测区域对应的历史经济特征数据输入第四预设模型,获取待测区域对应的经济特征数据。
步骤S203,将人口数量、家庭户籍数和经济特征数据输入第一预设模型,获取家庭户占比预测值。
步骤S204,根据家庭户占比预测值获取备选家庭户数。
步骤S205,获取预测户均人口数和历史户均人口数。
步骤S206,在预测户均人口数和历史户均人口数之间的差值在预设范围的情况下,将备选家庭户数确定为调整家庭户数;在预测户均人口数和历史户均人口数之间的差值不在预设范围的情况下,对家庭户占比预测值进行调整,直至调整后的备选家庭户数所对应的户均人口数预测户均人口数和历史户均人口数之间的差值在预设范围,将调整后的备选家庭户数确定为家庭户数。
采用本公开实施例提供的用于预测家庭户数的方法,通过第二预测模型、第三预测模型和第四预测模型分别获取待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据,并通过第一预设模型获取家庭户占比预测值,根据家庭户占比预测值获取备选家庭户数,根据预测户均人口数和历史户均人口数之间的差值,对家庭户占比预测值进行调整,从而确定获得家庭户数。在预测待预测年份的家庭户数时,考虑了人口数量、家庭户籍数和经济特征数据和家庭户数,提高了对家庭户数预测的准确性。
结合图3所示,本公开实施例提供一种用于预测家庭户数的装置,包括处理器(processor)100和存储有程序指令的存储器(memory)101。可选地,该装置还可以包括通信接口(Communication Interface)102和总线103。其中,处理器100、通信接口102、存储器101可以通过总线103完成相互间的通信。通信接口102可以用于信息传输。处理器100可以调用存储器101中的程序指令,以执行上述实施例的用于预测家庭户数的方法。
此外,上述的存储器101中的程序指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器101作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器100通过运行存储在存储器101中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于预测家庭户数的方法。
存储器101可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器101可以包括高速随机存取存储器,还可以包括非易失性存储器。
采用本公开实施例提供的用于预测家庭户数的装置,通过将待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据输入第一预设模型,获取家庭户占比预测值,根据家庭户占比预测值获取备选家庭户数,根据备选家庭户数获得家庭户数。在预测待预测年份的家庭户数时,考虑了人口数量、家庭户籍数和经济特征数据和家庭户数,提高了对家庭户数预测的准确性。
本公开实施例提供了一种设备,包含上述的用于预测家庭户数的装置。
可选地,设备包括:计算机、服务器等。
该设备通过将待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据输入第一预设模型,获取家庭户占比预测值,根据家庭户占比预测值获取备选家庭户数,根据备选家庭户数获得家庭户数。在预测待预测年份的家庭户数时,考虑了人口数量、家庭户籍数和经济特征数据和家庭户数,提高了对家庭户数预测的准确性。
本公开实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为执行上述用于预测家庭户数的方法。
本公开实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述用于预测家庭户数的方法。
上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

Claims (10)

1.一种用于预测家庭户数的方法,其特征在于,包括:
获取待测区域对应的人口数量、待测区域对应的家庭户籍数和待测区域对应的经济特征数据;
将所述人口数量、所述家庭户籍数和所述经济特征数据输入第一预设模型,获取家庭户占比预测值;
根据所述家庭户占比预测值获取备选家庭户数;
根据所述备选家庭户数获取家庭户数。
2.根据权利要求1所述的方法,其特征在于,所述第一预设模型为随机森林回归模型,所述第一预设模型通过以下方式获得:
获取待测区域对应的人口数量样本数据、待测区域对应的家庭户籍数样本数据和待测区域对应的经济特征样本数据;
将所述人口数量样本数据、所述家庭户籍数样本数据和所述经济特征样本数据输入随机森林回归模型进行训练,获得第一预设模型。
3.根据权利要求2所述的方法,其特征在于,将所述人口数量样本数据、所述家庭户籍数样本数据和所述经济特征样本数据输入随机森林回归模型进行训练,获得第一预设模型,包括:
将所述人口数量样本数据、所述家庭户籍数样本数据和所述经济特征样本数据输入随机森林回归模型进行迭代训练;
在每次训练后获取训练后的备选模型;
获取所述备选模型的拟合优度;
将满足第一预设条件的拟合优度所对应的备选模型确定为第一预设模型。
4.根据权利要求3所述的方法,其特征在于,将满足第一预设条件的拟合优度所对应的备选模型确定为第一预设模型,包括:
将达到第一设定阈值的所述拟合优度所对应的备选模型确定为第一预设模型。
5.根据权利要求1所述的方法,其特征在于,获取待测区域对应的人口数量,包括:
获取待测区域对应的历史人口数量;
将所述历史人口数量输入第二预设模型,获取待测区域对应的人口数量。
6.根据权利要求1所述的方法,其特征在于,获取待测区域对应的家庭户籍数,包括:
获取待测区域对应的历史家庭户籍数;
将所述历史家庭户籍数输入第三预设模型,获取待测区域对应的家庭户籍数。
7.根据权利要求1所述的方法,其特征在于,获取待测区域对应的经济特征数据,包括:
获取待测区域对应的历史经济特征数据;
将所述历史经济特征数据输入第四预设模型,获取待测区域对应的经济特征数据。
8.根据权利要求1至7任一项所述的方法,其特征在于,根据所述备选家庭户数,获取家庭户数,包括:
获取户均人口数;
在所述户均人口数满足第二预设条件的情况下,将备选家庭户数确定为家庭户数;
在所述户均人口数不满足第二预设条件的情况下,根据所述户均人口数对所述备选家庭户数进行调整,直至调整后的备选家庭户数所对应的户均人口数满足第二预设条件。
9.一种用于预测家庭户数的装置,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至8任一项所述的用于预测家庭户数的方法。
10.一种设备,其特征在于,包括如权利要求9所述的用于预测家庭户数的装置。
CN202110158026.9A 2021-02-05 2021-02-05 用于预测家庭户数的方法、装置及设备 Pending CN112819231A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110158026.9A CN112819231A (zh) 2021-02-05 2021-02-05 用于预测家庭户数的方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110158026.9A CN112819231A (zh) 2021-02-05 2021-02-05 用于预测家庭户数的方法、装置及设备

Publications (1)

Publication Number Publication Date
CN112819231A true CN112819231A (zh) 2021-05-18

Family

ID=75861510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110158026.9A Pending CN112819231A (zh) 2021-02-05 2021-02-05 用于预测家庭户数的方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112819231A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114004396A (zh) * 2021-10-26 2022-02-01 广东电网有限责任公司 面向能源管理的在家人数预测方法、系统、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8364518B1 (en) * 2009-07-08 2013-01-29 Experian Ltd. Systems and methods for forecasting household economics
CN105868849A (zh) * 2016-03-25 2016-08-17 傅崇辉 基于家庭结构变化的生活能源消费量预测方法及装置
CN109697522A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 一种数据预测的方法和装置
CN111667095A (zh) * 2020-04-30 2020-09-15 百度在线网络技术(北京)有限公司 预测经济状态、建立经济状态预测模型的方法及对应装置
CN112308270A (zh) * 2019-07-30 2021-02-02 国网上海市电力公司 一种长期用电负荷预测方法、装置及计算机实现系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8364518B1 (en) * 2009-07-08 2013-01-29 Experian Ltd. Systems and methods for forecasting household economics
CN105868849A (zh) * 2016-03-25 2016-08-17 傅崇辉 基于家庭结构变化的生活能源消费量预测方法及装置
CN109697522A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 一种数据预测的方法和装置
CN112308270A (zh) * 2019-07-30 2021-02-02 国网上海市电力公司 一种长期用电负荷预测方法、装置及计算机实现系统
CN111667095A (zh) * 2020-04-30 2020-09-15 百度在线网络技术(北京)有限公司 预测经济状态、建立经济状态预测模型的方法及对应装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林芳琦;: "江西省"十二五"期间居民住房需求预测", 科技广场, no. 04, 30 April 2010 (2010-04-30) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114004396A (zh) * 2021-10-26 2022-02-01 广东电网有限责任公司 面向能源管理的在家人数预测方法、系统、设备和介质

Similar Documents

Publication Publication Date Title
CN108628811B (zh) 地址文本的匹配方法和装置
CN106844407B (zh) 基于数据集相关性的标签网络产生方法和系统
CN110489507B (zh) 确定兴趣点相似度的方法、装置、计算机设备和存储介质
CN110807547A (zh) 家庭人口结构的预测方法及系统
Chen et al. Identifying home locations in human mobility data: an open-source R package for comparison and reproducibility
CN111639690A (zh) 基于关系图谱学习的欺诈分析方法、系统、介质及设备
Sandeep Kumar et al. Location identification for real estate investment using data analytics
CN112818377A (zh) 权限数据推荐、权限设置方法及系统、电子设备及介质
CN115829124A (zh) 充电桩选址方法、装置、设备及存储介质
CN110807546A (zh) 社区网格人口变化预警方法及系统
CN106503045B (zh) 一种更新模板库的方法及装置
CN112819231A (zh) 用于预测家庭户数的方法、装置及设备
Fontanelli et al. Beyond Zipf’s law: the Lavalette rank function and its properties
CN112241458B (zh) 文本的知识结构化处理方法、装置、设备和可读存储介质
CN113326255A (zh) 有效测试数据的筛选方法、装置、终端设备及存储介质
CN107622409B (zh) 购车能力的预测方法和预测装置
CN110019193A (zh) 相似帐号识别方法、装置、设备、系统及可读介质
CN110633890A (zh) 一种土地利用效率判断方法和系统
CN113538011B (zh) 一种电力系统中非在册联系信息与在册用户的关联方法
Yuan et al. Location recommendation algorithm based on temporal and geographical similarity in location-based social networks
CN115878877A (zh) 基于概念漂移的航空服务器访问爬虫的可视检测方法
Si et al. A time-aware poi recommendation method exploiting user-based collaborative filtering and location popularity
CN112001742A (zh) 网站访客行为习惯评估方法及系统
CN113408579A (zh) 一种基于用户画像的内部威胁预警方法
CN111259117A (zh) 短文本批量匹配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination