CN109858695B - 基于模糊逻辑预测统计人口总数的方法 - Google Patents
基于模糊逻辑预测统计人口总数的方法 Download PDFInfo
- Publication number
- CN109858695B CN109858695B CN201910090243.1A CN201910090243A CN109858695B CN 109858695 B CN109858695 B CN 109858695B CN 201910090243 A CN201910090243 A CN 201910090243A CN 109858695 B CN109858695 B CN 109858695B
- Authority
- CN
- China
- Prior art keywords
- population
- fuzzy
- max
- value
- year
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000013598 vector Substances 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000009193 crawling Effects 0.000 claims description 3
- 230000018109 developmental process Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于模糊逻辑预测统计人口总数的方法,采用模糊时间序列模型来预测,将精确记录的时间序列观测值表示为具有模糊特征的语言变量并且建立具有多前间的模糊逻辑关系,最后将模型输出去模糊化得到精确预测值。本发明能够减少误差,提高预测的准确度。通过将模糊论和时间序列相结合,它能够在数据资料不完整和含有噪音的情况下,消除动态系统中不确定性因素的影响,从而充分利用历史数据隐含未来变动的信息,来提高预测结果的准确性。因此,基于模糊时间序列的人口预测比传统方法更好。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于模糊逻辑预测统计人口总数的方法。
背景技术
人口预测的需求是随着社会经济发展而提出来的。一个国家人口总量直接影响经济、社会资源的利用。因此,能否正确预测国家的统计人口总量是非常重要的。首先,人口增长的变化会影响到国家政策的指定。改革开放以来,我国从世界第一人口大国,劳动力资源过剩,享受人口红利,渐渐地转变为新生儿不足,青壮年劳动力巨减,老龄化问题严重的社会。因此,国家在生育方面的政策也从倡导“一胎政策”转变为“鼓励二胎”,养老制度和税收制度也发生了相应改变。其次,人口增长的变化也会对经济的发展产生巨大的影响。由于青壮年劳动力短缺,人工成本上升,国家经济必须向高端制造业转型,不能再像从前一样靠廉价劳动力,低端制造业来吸引外资和走向世界。最后,人口增长的变化也会对社会的稳定产生巨大影响。国家可能会考虑效仿新加坡、日本等发达国家,放宽移民政策来引入外来人口弥补劳动力短缺。而外来移民人口的进入,必然会引起一系列社会变化。因此,正确预测人口数量对我国社会、经济和政策的发展都至关重要,它确保我们在合适的时机推出合适的人口政策,有利于社会的稳定和经济的健康发展。
尽管自2000年以来,很多中国学者采用了平均增长率法和指数平滑法等传统的时间序列方法来预测未来的人口数据,但是,与中国统计局年度公报人口数据想对比,基于上述方法的人口预测出现较大的误差。导致误差的原因主要有两点。首先,它要求有精确的历史数据。由于传统方法都是以时间序列的精确值为基础的,所以,数据的精确与否对预测的结果会产生巨大的影响。而模糊时间序列能够在数据资料不完整和含有噪音的情况下,得到精确的预测。其次,它假设与现实世界是不符合的。传统方法假设社会系统是确定不变的,认为时间序列的未来值与当前值、过去值以及白噪声之间存在着确定、明确的函数关系。但是,真实社会是复杂的动态系统,充满着不确定性因素,很难以用确定的函数关系来描述人口的变化。也就是说传统方法的假设与真实世界是不符合的。因此,采用传统的方法得出的结果就不够准确。因此,需要采用一种准确性更高的方法来预测统计人口。
发明内容
为了解决现有技术中的问题,本发明提供了一种基于模糊时间序列预测统计人口总数的方法,能够提高预测准确度,节约成本。
本发明通过以下技术方案来实现:
一种基于模糊时间序列预测统计人口总数的方法,包括从国家统计局官网中,利用爬虫爬取n年的中国统计人口总数的历史数据和对应的年份,得到历史人口数据{Xt,t=1,2,…n};然后,对收集到的数据作如下操作:
第一步,计算出每年统计人口总量的历史数据中两个相邻年份的人口增加值Vi(i=1,2,...,n-1)。。通过比较这些增加值,得到最大增加Vmax和最小增加量Vmin。
第三步,构建论域U的每个区间对应的语言变量,记为Aj(j=1,2,...,m)。Aj表示的是人口变动有最小到最大的程度;
第四步,依据隶属度函数计算每年历史数据变化量的模糊子集向量。隶属度公式如下:
其中C是常数,Vi是第一步中计算出的每年的变动值,i=1,2,..n-1,j=1,2,...,m;
第五步,选取前n-2年的模糊隶属度向量来构成矩阵O(n-2)*j,取出第n-1年的隶属度来构建向量K1*j;然后,取出矩阵O(n-2)*j的第j列中的元素和向量K1*j中的第j个元素一一比较,j=1,2,...,m,如果O(n-2)*j中的元素取值比K1*j大,就用K1*j的值替换它,得到一个新的矩阵O′(n-2)*j;
第六步,取出O′(n-2)*j中的每列的最大值,保存到向量F(n)中:
F(n)=[μt(1)=Max(O′11O′21…O′(n-2)1),
μt(2)=Max(O′12O′22…O′(n-2)2),
………………………………
μt(m)=[Max(O′1mO′2m…O′(n-2)m)]
简写为F(n)=[μt(1),μt(2),...,μt(m)];
第七步,去模糊化:将第六步中的结果带入下式中,求出第n+1年的人口增长量Vn:
第八步,将Vn和第n年的历史统计总人口相加,得到的就是第n+1年的统计人口预测值。
作为本发明的进一步改进,n≥10。
作为本发明的进一步改进,α取值20%。
作为本发明的进一步改进,A1表示“最低人口增长”;A2表示“很低人口增长”;…Am表示“最高人口增长”。
本发明的有益效果是:与现有技术相比,基于模糊时间序列的人口预测法能够减少误差,提高预测的准确度。通过将模糊论和时间序列相结合,它能够在数据资料不完整和含有噪音的情况下,消除动态系统中不确定性因素的影响,从而充分利用历史数据隐含未来变动的信息,来提高预测结果的准确性。因此,基于模糊时间序列的人口预测比传统方法更好。
附图说明
图1是本发明的基于模糊时间序列预测统计人口总数的方法流程图。
具体实施方式
结合附图说明及具体实施方式对本发明作进一步说明。
如图1所示,本发明的基于模糊时间序列预测统计人口总数的方法,包括从国家统计局官网中,利用爬虫爬取n年的中国统计人口总数的历史数据和对应的年份,得到历史人口数据{Xt,t=1,2,…n},其中,n根据需要,可选择的10年,20年均可(n≥10)。然后,对收集到的数据作如下操作:
第一步,计算出每年统计人口总量的历史数据中两个相邻年份的人口增加值Vi(i=1,2,...,n-1)。通过比较这些增加值,得到最大增加Vmax和最小增加量Vmin。
第二步,确定论域。定义论域U=[Vmin*(1-α),Vmax*(1+α),其中,α可以取20%左右。将论域U等长度为j个区间(j=1,2,…,m),分别是u1,u2,…um。取出每个区间的中值,赋值为
第三步,构建论域U的每个区间对应的语言变量,记为Aj(j=1,2,...,m)。Aj表示的是人口变动有最小到最大的程度。可以理解为A1表示“最低人口增长”;A2表示“很低人口增长”;…Am表示“最高人口增长”。
第四步,依据隶属度函数计算每年历史数据变化量的模糊子集向量。隶属度公式如下:
第五步,选取前n-2年的模糊隶属度向量来构成矩阵O(n-2)*j,取出第n-1年的隶属度来构建向量K1*j。然后,取出矩阵O(n-2)*j的第j列中的元素和向量K1*j中的第j个元素一一比较(j=1,2,...,m),如果O(n-2)*j中的元素取值比K1*j大,就用K1*j的值替换它,得到一个新的矩阵O′(n-2)*j。
第六步,取出O′(n-2)*j中的每列的最大值,保存到向量F(n)中。也就是说,
F(n)=[μt(1)=Max(O′11O′21…O′(n-2)1),
μt(2)=Max(O′12O′22…O′(n-2)2),
………………………………
μt(m)=[Max(O′1mO′2m…O′(n-2)m)]
可以简写为F(n)=[μt(1),μt(2),…μt(m)。
第七步,去模糊化。将第六步中的结果带入公式(2)中,求出第n+1年(预测的目标年)的人口增长量Vn:
第八步,将Vn和第n年的历史统计总人口相加,得到的就是第n+1年(预测的目标年)的统计人口预测值。
如果采用模糊时间序列来做预测的话,能够大大提高人口预测的准确度。采用模糊时间序列模型来预测,将精确记录的时间序列观测值表示为具有模糊特征的语言变量并且建立具有多前间的模糊逻辑关系,最后将模型输出去模糊化得到精确预测值。结果表明这一方法更能较全面反映系统的复杂特征并且有利于在复杂环境中提高预测精度。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (4)
1.一种基于模糊时间序列预测统计人口总数的方法,包括从国家统计局官网中,利用爬虫爬取n年的中国统计人口总数的历史数据和对应的年份,得到历史人口数据{Xt,t=1,2,...,n};然后,对收集到的数据作如下操作:
第一步,计算出每年统计人口总量的历史数据中两个相邻年份的人口增加值Vi(i=1,2,...,n-1),通过比较这些增加值,得到最大增加量Vmax和最小增加量Vmin;
第二步,确定论域:定义论域U=[Vmin*(1-α),Vmax*(1+α)]其中,0<α<1;将论域U等长度为j个区间(j=1,2,...,m),分别是u1,u2,...,um;取出每个区间的中值,赋值为
第三步,构建论域U的每个区间对应的语言变量,记为Aj(j=1,2,...,m),Aj表示的是人口变动由最小到最大的程度;
第四步,依据隶属度函数计算每年历史数据变化量的模糊子集向量,隶属度公式如下:
第五步,选取前n-2年的模糊隶属度向量来构成矩阵O(n-2)*j,取出第n-1年的隶属度来构建向量K1*j;然后,取出矩阵O(n-2)*j的第j列中的元素和向量K1*j中的第j个元素一一比较,j=1,2,...,m,如果O(n-2)*j中的元素取值比K1*j大,就用K1*j的值替换它,得到一个新的矩阵O′(n-2)*j;
第六步,取出O′(n-2)*j中的每列的最大值,保存到向量F(n)中:
F(n)=[μt(1)=Max(O′11 O′21 ... O′(n-2)1),
μt(2)=Max(O′12 O′22 ... O′(n-2)2),
…………………………………
μt(m)=[Max(O′1m O′2m ... O′(n-2)m)]
简写为F(n)=[μt(1),μt(2),...,μt(m)];
第七步,去模糊化:将第六步中的结果代入 下式中,求出第n+1年的人口增长量Vn:
第八步,将Vn和第n年的历史统计总人口相加,得到的就是第n+1年的统计人口预测值。
2.根据权利要求1所述的方法,其特征在于:n≥10。
3.根据权利要求1所述的方法,其特征在于:α取值20%。
4.根据权利要求1所述的方法,其特征在于:A1表示“最低人口增长”;A2表示“很低人口增长”;Am表示“最高人口增长”。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910090243.1A CN109858695B (zh) | 2019-01-29 | 2019-01-29 | 基于模糊逻辑预测统计人口总数的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910090243.1A CN109858695B (zh) | 2019-01-29 | 2019-01-29 | 基于模糊逻辑预测统计人口总数的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109858695A CN109858695A (zh) | 2019-06-07 |
CN109858695B true CN109858695B (zh) | 2021-01-26 |
Family
ID=66896722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910090243.1A Active CN109858695B (zh) | 2019-01-29 | 2019-01-29 | 基于模糊逻辑预测统计人口总数的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109858695B (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101632986B1 (ko) * | 2014-11-11 | 2016-06-23 | 순천향대학교 산학협력단 | Mr-댐퍼가 있는 콘크리트 구조물의 비선형 움직임을 예측하기 위한 웨이블릿 기반 시간 지연 퍼지-신경망 추론 시스템 |
CN106779247A (zh) * | 2017-01-11 | 2017-05-31 | 陕西师范大学 | 基于熵值法组合优化的旅游需求的预测方法 |
CN109118009A (zh) * | 2018-08-24 | 2019-01-01 | 山东师范大学 | 基于极坐标模糊信息粒的时间序列预测方法、系统及介质 |
-
2019
- 2019-01-29 CN CN201910090243.1A patent/CN109858695B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109858695A (zh) | 2019-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107529651B (zh) | 一种基于深度学习的城市交通客流预测方法和设备 | |
CN110648014B (zh) | 一种基于时空分位数回归的区域风电预测方法及系统 | |
Xiao et al. | A combined forecasting approach based on fuzzy soft sets | |
CN109754113A (zh) | 基于动态时间规整与长短时间记忆的负荷预测方法 | |
CN114595874B (zh) | 一种基于动态神经网络的超短期电力负荷预测方法 | |
CN111798991B (zh) | 基于lstm的新冠肺炎疫情群体态势预测方法 | |
CN112598248B (zh) | 负荷预测方法、装置、计算机设备和存储介质 | |
Heng et al. | Probabilistic and deterministic wind speed forecasting based on non-parametric approaches and wind characteristics information | |
CN114386324A (zh) | 一种基于转折性时段识别的超短期风电功率分段预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
US20230095676A1 (en) | Method for multi-task-based predicting massiveuser loads based on multi-channel convolutional neural network | |
CN112733997A (zh) | 基于woa-lstm-mc的水文时间序列预测优化方法 | |
CN111985719A (zh) | 一种基于改进的长短期记忆网络的电力负荷预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN115310355A (zh) | 考虑多能耦合的综合能源系统多元负荷预测方法及系统 | |
CN116885699A (zh) | 基于双重注意力机制的电力负荷预测方法 | |
CN115659254A (zh) | 一种双模态特征融合的配电网电能质量扰动分析方法 | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
CN116227180A (zh) | 基于数据驱动的机组组合智能决策方法 | |
CN109784562B (zh) | 一种基于大数据时空聚类的智慧电网电力负荷预测方法 | |
CN115017970A (zh) | 一种基于迁移学习的用气行为异常检测方法及系统 | |
CN118013277A (zh) | 具有时变权重的多模型组合径流预报方法 | |
CN107704944B (zh) | 一种基于信息论学习的股市波动区间预测模型的构建方法 | |
Xu et al. | Deep‐learning‐based scenario generation strategy considering correlation between multiple wind farms | |
Ahani et al. | A feature weighting and selection method for improving the homogeneity of regions in regionalization of watersheds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Method for Predicting the Total Population Based on Fuzzy Logic Granted publication date: 20210126 Pledgee: Shenzhen Branch of China Merchants Bank Co.,Ltd. Pledgor: SHENZHEN AEROSPACE SMART CITY SYSTEM TECHNOLOGY CO.,LTD. Registration number: Y2024980021712 |