CN107133693A - 我国省市预期寿命时序加密估算及其与夜光时空耦合方法 - Google Patents

我国省市预期寿命时序加密估算及其与夜光时空耦合方法 Download PDF

Info

Publication number
CN107133693A
CN107133693A CN201710284304.9A CN201710284304A CN107133693A CN 107133693 A CN107133693 A CN 107133693A CN 201710284304 A CN201710284304 A CN 201710284304A CN 107133693 A CN107133693 A CN 107133693A
Authority
CN
China
Prior art keywords
time
mrow
age group
age
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710284304.9A
Other languages
English (en)
Inventor
李畅
王安丽
龚胜生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong Normal University
Original Assignee
Huazhong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong Normal University filed Critical Huazhong Normal University
Priority to CN201710284304.9A priority Critical patent/CN107133693A/zh
Publication of CN107133693A publication Critical patent/CN107133693A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Computational Mathematics (AREA)
  • Primary Health Care (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Educational Administration (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Child & Adolescent Psychology (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种我国省市(本发明中“市”专指直辖市)预期寿命时序加密估算及其与夜光时空耦合方法,包括计算省/市夜间灯光总量SOL、计算省/市人口平均预期寿命e x 、构建省/市夜间灯光总量与预期寿命时空耦合模型等三个步骤;本发明不仅首次建立并证实省市尺度夜间灯光与预期寿命存在很强的相关性,更提供了从夜间灯光角度估算和分析省市尺度不同年份预期寿命的新视角,为用常规的简略寿命表法计算出的省市尺度预期寿命提供了夜光遥感领域的佐证,此外,二者相关性的证实也促进了夜光遥感与健康地理学科间的融合,丰富发展了相关理论与方法体系。

Description

我国省市预期寿命时序加密估算及其与夜光时空耦合方法
技术领域
本发明属于夜光遥感与健康地理技术领域,具体涉及一种我国省市预期寿命时序加密估算及其与夜间灯光总量时空耦合模型构建方法。
背景技术
预期寿命(life expectancy,ex)(又称平均预期寿命,或期望寿命)是指已经活到一定岁数的人平均还能再活的年数,在不特别指明岁数的情况下,是指0岁人口的平均预期寿命。
当前计算预期寿命一般选用简略寿命,表1为海南省2010年简略寿命表;
表1 海南省2010年简略寿命表
该表的编制主要依赖人口普查或1%人口抽样调查中完整年龄组数据,然而,人口普查每10年进行一次调查,1%人口抽样调查只在逢“5”的年份进行,中间年份年龄组数据缺失,导致预期寿命无法计算。具有同等权威力的统计年鉴数据虽每年统计一次,但年龄组不完整也导致无法直接利用简略寿命表计算预期寿命。针对人口普查、1%人口抽样调查采样间隔过长、统计年鉴年龄组指标不全现状,能否找到科学合理的方法融合人口普查数据、1%人口抽样调查数据和统计年鉴数据进行中间缺失年份预期寿命时序加密(即时间序列上对缺失指标进行补充使得样本由稀疏变为密集)估算变得迫切而紧要。本发明在尊重已有客观数据(人口普查、抽样调查和统计年鉴)基础上对缺失指标提出了科学的时序加密算法,为科学研究中应对时间序列数据缺失问题提供新的思路和方法。
稳定夜间灯光产品(来自美国军事气象卫星Defense Meteorological SatelliteProgram(DMSP)搭载的Operational Linescan System(OLS)传感器)(1992~2013)在学术界的应用领域主要侧重于反映和分析地区的能源消耗水平及经济发展状况,很少涉足对人类健康状况的监测。反映人口健康状况综合性指标的预期寿命受很多因素影响,如经济发展水平、生活习惯和生活方式、环境质量、医疗卫生服务水平、受教育水平等。一方面,伴随夜间照明设施的发展、夜生活的丰富,熬夜已成为一种习惯,不规律的生活作息和习惯无疑会对人类健康产生巨大的威胁;另一方面,消耗大量能源的工业排放了大量废弃物,污染了环境,直接影响人类健康水平;此外,研究表明,光污染对人类健康会造成伤害,如女性乳腺癌和男性前列腺癌与强亮的夜间灯光有显著的关系。因此,与夜间照明、能源消耗及光污染密切相关的夜间灯光与预期寿命是否存在相关关系值得深入挖掘研究。本发明首次建立并证实省市(本发明中“市”专指直辖市)尺度夜间灯光总量(Sum Of Lights,SOL)与预期寿命存在很强的相关性,使得从遥感角度监测省市尺度人口健康成为可能;提供了从夜间灯光角度估算和分析省市尺度不同年份预期寿命的新视角,为用常规的简略寿命表法计算省市尺度预期寿命提供了夜光遥感领域的佐证,为相关研究提供数据参照;二者相关性的证实促进了夜光遥感与健康地理学科间的融合,丰富发展了相关理论与方法体系。
发明内容
本发明的目的在于提供一种基于逼近思想利用已知指标时序加密估算未知数据(缺失完整年龄组数据年份的省市预期寿命)的科学计算方法——拉格朗日插值法,进而探究连续时间序列上省市尺度夜间灯光总量(SOL)与预期寿命(ex)的时空耦合性,从时空角度挖掘预期寿命随夜间灯光强度(体现为SOL)变化的规律。
本发明所采用的技术方案是:一种我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于,包括以下步骤:
步骤1:计算省/市夜间灯光总量SOL;
步骤2:计算省/市人口平均预期寿命ex
步骤3:构建省/市夜间灯光总量与预期寿命时空耦合模型。
本发明一方面结合人口普查、1%人口抽样调查和统计年鉴数据利用拉格朗日插值对中间缺失完整年龄组数据年份的省市预期寿命进行时序加密估算,另一方面,选择夜间灯光数据作为客观数据源,尝试对两种数据(SOL与ex)相互结合来探索连续时间序列上省市尺度预期寿命的耦合、建模、预测。本发明不仅为科学研究中应对时间序列数据缺失问题提供新的思路和方法,而且首次建立并证实省市尺度SOL与ex存在很强的相关性,提供了从夜光遥感角度估算和分析省市尺度不同年份预期寿命的新视角,为相关研究提供数据参照。本发明系统的建立可以低成本监测省市尺度下人口健康水平,为国家医疗资源的省市分配提供理论依据。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例中海南省夜间灯光(SOL)与预期寿命(ex)时空耦合最优模型;
图3为本发明实施例中海南省2010年DMSP/OLS夜间灯光数据示意图;
图4为本发明实施例中海南省(a)夜间灯光(SOL)与预期寿命(ex)时空耦合模型(j=1插值);(b)夜间灯光(SOL)与预期寿命(ex)时空耦合模型(j=2插值)。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
实施例中,在《海南统计年鉴》获得海南省除0岁组和1~4岁组外1992~1999有个别(仅3个)缺省值的完整年龄组死亡率(nmx)数据(见表2),因此,可将研究时间序列由本发明举例时间序列2000~2013向前延至1992。
表2海南省1992-1999年年龄组死亡率(nmx)
注:1996年85-89岁为85岁及以上数据
请见图1,本发明提供的一种我国省市预期寿命时序加密估算及其与夜光时空耦合方法,包括以下步骤:
步骤1:省市夜间灯光总量(SOL)提取,实现如下;
选取稳定DMSP/OLS夜间灯光数据(以2000~2013为例),在ArcGIS中定义或转换省/市矢量行政边界坐标投影与其一致,按照坐标投影一致后的省/市矢量行政边界提取每个年份的夜间灯光影像;
依据提取出的每个年份的夜间灯光数据,计算对应的SOL,包含饱和灯光像元的省市计算SOL前需对夜间灯光影像去饱和处理;
基于DMSP/OLS数据,统计每个年份夜间灯光总量(SOL)的公式如下,
式中,num表示像元灰度级数,Ni表示研究区内第i亮度等级的像元总数,Bi表示研究区内第i亮度等级的像元的亮度值;
本实施例进行海南省相应年份(1992~2013)夜间灯光总量(SOL)提取。步骤如下:
选取稳定DMSP/OLS夜间灯光数据(1992~2013),在ArcGIS中将海南省矢量行政边界坐标投影定义或转换与其一致,按照坐标投影一致后的海南省矢量行政边界按年份依次进行裁剪(海南省2010年DMSP/OLS夜间灯光数据见附图3);
依据提取出的各年份海南省夜间灯光数据,计算并统计其对应的SOL(海南省经济发展水平中等,可不考虑灯光像元亮度值过饱和问题),基于DMSP/OLS数据,夜间灯光总量(SOL)的计算公式见公式(1)。
夜间灯光总量(SOL)即感兴趣区内灯光像元不同等级亮度值与其对应的像元总数的乘积之和。DMSP/OLS夜间灯光数据记录的是6位灰度图,故其灰度级为2的6次方,即num=64个等级,i的变化范围为0~63,计算时可取1到63。因此,对于夜间灯光亮度值过饱和的省市,灯光像元亮度等级受到限制,导致SOL值偏小,为减少误差,在计算SOL前需基于NDVI或EVI对DMSP/OLS夜间灯光数据进行去饱和处理。
步骤2:省市预期寿命计算相关必需指标缺失弥补,实现如下;
基于人口普查数据(年份逢“0”)和1%人口抽样调查数据(年份逢“5”)查找或计算省市相应年份完整年龄组平均人口数(nPx)和完整年龄组实际死亡数(nDx),其中x表示该年龄组的下限值,n表示该年龄组组距,在其对应简略寿命表中将年龄组合并成三个年龄段(0~14岁、15~64岁、65岁以上),计算各年龄组平均人口数(nPx)占所在年龄段人口数比例p1和各年龄组实际死亡数(nDx)占总平均人口数比例p2(因p1、p2是比例形式,也可基于完整年龄组的nPxnDx样本数据按上述方法直接推算),因此,各个年龄组的p1、p2在2000、2005、2010三个年份均可获得,再利用拉格朗日插值得出其他年份的p1和p2
拉格朗日插值计算公式的一般形式如下,
式中,记号
ωj+1(x)=(x-x0)(x-x1)…(x-xj) (3)
ω′j+1(xk)=(xk-x0)…(xk-xk-1)(xk-xk+1)…(xk-xj) (4)
而且,Lj(x)表示拉格朗日j次插值函数(本发明举例中对应待插的p1或p2),x为自变量(本发明举例中对应相应的待插年份),当j=1时为线性函数,当j=2时为抛物线,实际应用中,可根据相关数据特点,选取合适的j值。本发明举例中考虑到三个年份(2000、2005、2010)对应的p1或p2已知,可取j=1或2,插值节点的选择按照尽量内插及邻近选取已知点原则(减小误差),对2000~2013中其他年份的p1或p2进行插值弥补,并对两种插值结果(j=1或2时)构建的模型实行对比。
当j=1时,公式(2)~(4)中插值节点(x0,y0)、(x1,y1)取与待插年份最邻近(最好分布在待插年份两侧)的年份并对应已知的p1或p2组成的坐标点。因此,2001~2004年的p1、p2用2000、2005并对应其p1、p2组成的坐标点线性插值得到,2006~2013年的p1、p2用2005、2010并对应其p1、p2组成的坐标点线性插值获得;
当j=2时,公式(2)~(4)中插值节点(x0,y0)、(x1,y1)、(x2,y2)按照同样选取原则选择相应年份并对应已知的p1或p2组成的坐标点。因此,2000~2013年的p1、p2用2000、2005、2010并对应其p1、p2组成的坐标点抛物线插值得到;
本实施例中,在中华人民共和国国家统计局官网http://www.stats.gov.cn获得2000、2010全国各省人口普查数据(包括海南省完整年龄组的nPxnDx数据);在《海南1%人口抽样调查资料》获取海南省2005完整年龄组的nPxnDx样本数据。此外,在《海南统计年鉴》获得海南省除0岁组和1~4岁组外1992~1999有个别(仅3个)缺省值的完整年龄组死亡率(nmx)数据。基于所得数据,将海南省2000、2005、2010对应年份年龄组合并成三个年龄段(0~14岁、15~64岁、65岁以上),计算各年龄组的p1和p2
为减少误差,依据海南省统计数据特点结合插值节点选取原则,将海南省原始数据分两段处理:1992~2000待插指标选年龄组死亡率(nmx);2000~2013待插指标选其他年份的p1和p2(除2000、2005、2010)。拉格朗日插值一般公式见公式(2)~(4),考虑到插值节点的选取原则及海南省两个分段中各自至少都有三个年份的插值节点指标已知,为更精确地逼近缺失指标,j可取1或2。
实施例中,年龄组死亡率(nmx)缺省值(1992~2000)、0岁/1~4岁死亡率(1992~2000)、其他年份的p1和p2(2000~2013)依据拉格朗日插值结合插值节点选取原则,具体实施方式如下:
当j=1时,
①年龄组死亡率nmx缺省值(1992~2000)(仅3个):用缺省的nmx前后最邻近2个年份的nmx值与对应年份组成坐标点(x0,y0)、(x1,y1),线性插值出所缺的nmx值;
②0岁/1~4岁死亡率(1992~2000):基于《中国人口统计年鉴》直接获取1992、1993“省、自治区、直辖市分年龄别的死亡率”(包含海南省1992、1993的0岁/1~4岁nmx),结合2000年海南省0岁/1~4岁nmx(可直接计算),将0岁/1~4岁nmx与对应年份分别组成坐标点,分别线性插值出所缺的0岁/1~4岁nmx值。鉴于邻近可以减少误差,1994~1995年0岁/1~4岁nmx值采用1992、1993对应坐标点;1996~1999年0岁/1~4岁nmx值选取1993、2000对应坐标点;
③其他年份的p1、p2(2000~2013):将p1、p2与对应年份分别组成坐标点(2000、2005、2010年的p1、p2已知),利用拉格朗日插值公式分别进行线性插值,2001~2004选择2000、2005对应坐标点,2006~2013利用2005、2010对应坐标点。
当j=2时,
①分年龄组死亡率nmx缺省值(1992~2000)(仅3个):用缺省的nmx前后最邻近3个年份的nmx值与对应年份组成坐标点(x0,y0)、(x1,y1)、(x2,y2),抛物线插值出所缺的nmx值;
②0岁/1~4岁死亡率(1992~2000):基于《中国人口统计年鉴》直接获取1992、1993“省、自治区、直辖市分年龄别的死亡率”(包含海南省1992、1993的0岁/1~4岁nmx),结合2000年海南省0岁/1~4岁nmx(可直接计算),将0岁/1~4岁nmx与对应年份分别组成坐标点,分别抛物线插值出所缺的0岁/1~4岁nmx值(已知插值节点选择1992、1993、2000对应坐标点);
③其他年份的p1、p2(2000~2013):将p1、p2与对应年份分别组成坐标点(2000、2005、2010年的p1、p2已知),利用拉格朗日插值公式进行抛物线插值,已知插值节点选择2000、2005、2010对应坐标点。
需要注意的是,若抛物线插值结果中出现负值,说明各年份对应的某一年龄组数据不适用于该模型,该年龄组插值可改为线性插值或负值部分使用邻近插值(近似估计),不对其他年龄组产生影响;若统计年鉴中某些所求年份完整nPx数据可获取但首尾年龄分组与编制的简略寿命表不同,为最大限度利用已有数据减少误差,可按该所求年份的首尾年龄分组合并人口普查数据和1%人口抽样调查数据的对应年龄组,再计算其各年龄组占合并后的年龄段比例,按同样插值方法进行缺失指标弥补。
实施例中,海南省2000~2013年龄组20~24岁的p2抛物线插值在2013出现负值,说明抛物线模型不能很好地逼近这一年龄组死亡人数的总体发展趋势,整个年龄组可改为线性模型逼近,其他年龄组仍用抛物线插值;《海南省统计年鉴》中获得2009分年龄组人口数,但其0~4岁和95岁以上作为首尾年龄组和简略寿命表(见表1)不吻合,因此,为最大限度利用已有数据减少数据失真,可先将2000、2005、2010的年龄组按照0~4岁和95岁以上年龄段进行合并,分别计算这三个年份对应年龄组人口数占所在年龄段(0~4岁、95岁以上)人口数比例p′1,再按同样方法插值出2009相应年龄组的p′1、再用2009的p′1分别乘以2009对应的0~4岁或95岁以上年龄组人口数,最终获得如表1所示的完整年龄组的nPx
步骤3:研究时间序列有条件扩充,实现如下;
若获得研究时间序列之外至少某一年份可计算年龄组死亡率(nmx)的完整年龄组的nPxnDx数据(或所有年份完整nmx数据),则可扩大研究时间序列。对于本发明举例时间序列2000~2013,若在具体省市年鉴中,获得1990~2000(举例时间序列之外)某一个或多个年份可计算年龄组死亡率(nmx)的完整年龄组的nPxnDx数据(或1992-1999完整nmx数据),则遵从尽量内插及邻近选取插值节点原则,按照步骤2中弥补缺失指标的原理方法,可将研究的时间序列扩展至1992~2013(为夜间灯光DMSP/OLS数据的完整时间序列范围),此类年份数据获取越多(插值节点越多),对缺失指标的弥补越精确;
实施例中,由于获得海南省除0岁组和1~4岁组外1992~1999有个别(仅3个)缺省值的完整年龄组死亡率(nmx)数据(即2000年之前所有年份完整nmx数据),在保证可接受误差范围内,将研究时间序列从举例时间序列2000~2013扩展至1992~2013。
而且,年龄组死亡率(nmx),表示某年龄组人口在n年内的平均死亡水平,它根据各年龄组平均人口数(nPx)和各年龄组实际死亡数(nDx)计算,公式如下,
步骤4:各年份省市预期寿命(ex)计算,实现如下,
依据步骤2,可获得两组p1、p2(j=1或2时),根据省市统计年鉴查找或推算某省(市)所求年份年龄段(0~14岁、15~64岁、65岁以上)人口数和总平均人口数,基于插值得出的p1、p2计算其相应年份的nPxnDx,推算nmx,进而获得两组ex;或者,利用中国人口和就业统计年鉴各年份“各地区人口年龄构成和抚养比”样本数据(包含各省各年份0~14岁、15~64岁、65岁以上年龄段样本人口数及样本总人口)结合2000、2005、2010对应年龄段的p1、p2(比例与样本数据相同)利用上述方法插值推算出样本数据的p1、p2nmx(比例与总体数据相同),再计算两组ex
需要说明的是,简略寿命表年龄组中,除0岁组和1~4岁组外,其他年龄组分组间隔一般为5,表中各指标含义及预期寿命(ex)计算的公式如下,x表示该年龄组的下限值,n表示年龄组组距,表示最后一个年龄组:
①简略寿命表中年龄“X~”指刚满年龄(exact age),如“1~”即刚满一岁的儿童;年龄组死亡概率(nqx)表示假想的同时出生的一代人,刚满x岁的尚存者在今后n年内死亡的可能性,它是寿命表中的关键指标,需根据年龄组死亡率(nmx)计算;编制寿命表时,一般用婴儿死亡率或校正婴儿死亡率作为0岁组死亡概率的估计值,即为1m0,最后一个年龄组的死亡概率为1,其他各年龄组中,当年龄组距n≤5时,nqxnmx近似函数关系表达式如下,
②尚存人数(lx)表示假想的同时出生的一代人到刚活满x岁的人时尚生存的人数。一般假定“0~”岁组的人数为l0=100000;死亡人数ndx是假想的同时出生的一代人死于各年龄组x~(x+n)的人数。二者的关系表达式如下,
ndx=lx·nqx (7)
lx+n=lx-ndx (8)
③生存人年数(nLx)是指x岁尚存者在今后n年内的生存人年数,即lx曲线下,x~(x+n)间的面积,其计算公式如下,
式中,L0应将0~岁组死亡者的平均存活年数计算在内,a0为每个死亡婴儿平均存活年数,可根据世界卫生组织提供的婴儿死亡率与a0关系的经验系数推算。我国a0的经验系数:男性为0.1450,女性为0.1525,男女合计为0.15;1d0为0岁组的死亡人数;为最后一个年龄组的死亡概率。
④生存总人年数(Tx)是指活满x岁者今后尚能生存的总人年数,即x岁及以上各年龄组生存人年数(nLx)的总和,生存总人年数由下向上累计,计算公式如下,
Tx=∑nLx (10)
⑤预期寿命(ex)是指活满x岁者今后尚能存活的年数(即岁数),计算公式如下,
需要说明的是,官方公布的预期寿命数值在按上述方法计算之前,对年龄组死亡率(nmx)进行了处理,因此,按照上述方法直接计算出的预期寿命在保持与官方数据总趋势一致下会略有出入,本发明统一采用按上述方法直接计算出的预期寿命值。
本实施例中海南省预期寿命计算,对于1992~2000,用插值获得的两组nmx缺省值和0岁/1~4岁死亡率数值各自对应放入简略寿命表,推算出海南省两组预期寿命(ex);对于2000-2013,可采用两种方式,如下,
①基于总体数据:利用插值获得的两组p1、p2分别各自乘以所求年份统计年鉴中年龄组所在年龄段(0~14岁、15~64岁、65岁以上)人口数和总平均人口数,计算nPxnDx,利用公式(5)~(11)推算出两组预期寿命(ex)。若在统计年鉴不能直接获取年龄段(0~14岁、15~64岁、65岁以上)人口数,可利用统计年鉴上人口负担系数与总人口的关系或各年龄段人口占总人口的比例进行推算。人口负担系数与总人口的关系如下,
总负担系数=(0~14岁人口+65岁以上人口)/15~64岁人口*100%,
少年儿童负担系数=0~14岁人口/15~64岁人口*100,
老年人口负担系数=65岁以上人口/15~64岁人口*100,
而且,0~14岁人口+65岁以上人口+15~64岁人口=总人口。
海南省2000~2013不同年份年龄段(0~14岁、15~64岁、65岁以上)人口数中2001~2002是基于人口负担系数推算的;2002~2013是基于各年龄段占总人口的比例获得的;总平均人口数选取统计年鉴“人口变动抽样调查主要指标”中与人口负担系数或各年龄段占的比例数同时统计的总人口近似为总平均人口。
②基于样本数据:利用中国人口和就业统计年鉴各年份“各地区人口年龄构成和抚养比”样本数据(包含海南省0~14岁、15~64岁、65岁以上年龄段样本人口数及样本总人口)结合海南省2000、2005、2010对应年龄段的p1、p2(比例与样本数据相同)利用上述方法插值推算出样本数据的p1、p2nmx(比例与总体数据相同),基于公式(5)~(11)获得两组ex
步骤5:省市尺度夜间灯光(SOL)与预期寿命(ex)时空耦合模型构建,实现如下;
基于步骤1和步骤4,采用最小二乘法,构建我国省市夜间灯光与预期寿命时空耦合模型。由于统计数据本身在采集的过程中不可避免地带有误差,这里在判断模型成立之前,先进行基于RANSAC(RANndom Sample Consensus)的数据质量控制,对模型构建相关数据进行异常值剔除,避免较大粗差数据对模型精度的影响,最终模型表达式如下,
ex=f(SOL) (12)
式中,ex表示某一省(市)某一年份的预期寿命,SOL表示该省(市)相应年份的夜间灯光总量。
RANSAC算法为现有技术,实施步骤主要包括:
(1)随机抽取两个必要观测数据,计算相应的模型;
(2)计算每个模型中,各个样本点(除去样本子集)与计算出来的模型的偏差;
(3)设定阈值,比较其与偏差的大小,获得每个模型对应的支持点集,然后统计确定内点集,即可实现去除数据的粗差。
实施例中,通过对海南省夜间灯光与预期寿命模型构建相关数据进行质量控制发现,该实施例的数据不存在较大粗差数据,所有年份均可参与模型运算。
模型通用表达式见公式(12)。需要说明的是,该模型在应用过程中,可综合考虑各种常见的函数模型(例如一次函数、二次函数、对数函数等)作为f,根据反演精度对模型进行选择;此函数模型的具体形式,需按本发明方法结合具体省市数据得出。具体到本发明实施例中,海南省夜间灯光总量与预期寿命时空耦合模型为:y=-1E-10x2+9E-05x+67.703。若模型相关性很弱且不稳定,可能是区域尺度选择问题,或者数据本身还存在较大粗差,可以再做适当调整。
步骤6:基于拟合精度选取最优模型,实现如下;
比较拉格朗日插值j=1和j=2时推算的两组模型的稳定性。选取所有年份夜间灯光总量(SOL)和j=1或j=2时相应的预期寿命ex,利用散点图进行趋势线拟合,分别分析j=1和j=2时用不同函数关系拟合时可决系数R2的变化态势,选取R2较大且变化较稳定的一组作为最忧模型;
实施例中,为表示方便,将海南省预期寿命设为y,夜间灯光总量设为x,模型ex=f(SOL)对应的拟合类型及表达式如表3所示。由表3可知,j=2(对应模型见附图4(b))时模型对应的R2平均值及稳定性明显优于j=1(对应模型见附图4(a)),因此,海南省夜间灯光与预期寿命时空耦合的最优模型应选择j=2时拉格朗日插值估算的ex与对应夜间灯光总量进行拟合。最优模型拟合类型为二次多项式,表达式为:y=-1E-10x2+9E-05x+67.703(见附图2)。
表3模型ex=f(SOL)对应的拟合类型及表达式
步骤7:基于实例验证省市尺度夜间灯光(SOL)与预期寿命(ex)时空耦合系统;
实施例中,按照本发明方法获取海南省1992~2013夜间灯光总量(SOL)与对应年份预期寿命(ex)并对省市夜间灯光(SOL)与预期寿命(ex)时空偶合系统进行了验证,得到二者良好稳定的相关性。
步骤8,基于省市尺度夜间灯光(SOL)与预期寿命(ex)时空耦合系统预测该省/市某一年份的预期寿命;
实施例中,基于步骤7,利用海南省SOL与ex时空耦合模型y=-1E-10x2+9E-05x+67.703(即最优模型)可对海南省历史或未来年份预期寿命进行推算与预测。
需要注意的是,我国省市预期寿命时序加密估算及其与夜光时空耦合系统构建的技术方案如前所述,但涉及到具体省市,由于经济发展水平和省/市情不同,导致同样技术方案构建出的模型各异,因此在对具体省/市的预期寿命做预测时,模型也要具体化。
具体实施时,本发明所提供方法可基于软件技术实现自动运行流程,也可采用模块化方式实现相应系统。本发明提供我国省市预期寿命时序加密估算及其与夜光时空耦合系统,其包含模块及具体实现过程可参见发明内容及相关步骤,这里不再赘述。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (8)

1.一种我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于,包括以下步骤:
步骤1:计算省/市夜间灯光总量SOL;
步骤2:计算省/市人口平均预期寿命ex
步骤3:构建省/市夜间灯光总量与预期寿命时空耦合模型。
2.根据权利要求1所述的我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于,步骤1的具体实现包括以下子步骤:
步骤1.1:选取稳定DMSP/OLS夜间灯光数据,在ArcGIS中定义或转换省/市矢量行政边界坐标投影与其一致,按照坐标投影一致后的省/市矢量行政边界提取每个年份的夜间灯光影像数据;
步骤1.2:计算每个年份夜间灯光总量SOL;
<mrow> <mi>S</mi> <mi>O</mi> <mi>L</mi> <mo>=</mo> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mi>u</mi> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>N</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>B</mi> <mi>i</mi> </msub> <mo>;</mo> </mrow>
式中,num表示像元灰度级数,Ni表示研究区内第i亮度等级的像元总数,Bi表示研究区内第i亮度等级的像元的亮度值;包含饱和灯光像元的省市计算SOL前需对夜间灯光影像去饱和处理。
3.根据权利要求1所述的我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:针对年份区间[M1,M2],基于年份逢“0”的人口普查数据和年份逢“5”的1%人口抽样调查数据查找或计算省/市相应年份完整年龄组平均人口数nPx和完整年龄组实际死亡数nDx,其中x表示该年龄组的下限值,n表示该年龄组组距,在其对应简略寿命表中将年龄组合并成三个年龄段A1、A2、A3,计算各年龄组平均人口数nPx占所在年龄段人口数比例p1和各年龄组实际死亡数nDx占总平均人口数比例p2,利用拉格朗日插值得出其他年份的p1和p2
步骤2.2:计算省/市人口平均预期寿命ex
根据省/市统计年鉴查找或推算某省/市所求年份年龄段A1、A2、A3人口数和总平均人口数,基于插值得出的两组p1、p2,计算其相应年份的nPxnDx,推算nmx,进而获得两组ex
或利用中国人口和就业统计年鉴各年份“各地区人口年龄构成和抚养比”样本数据,结合插值得出的对应年龄段的p1、p2,推算出样本数据的p1、p2nmx,再计算两组ex
4.根据权利要求3所述的我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于,步骤2.1中,若获得年份区间[M1,M2]之外至少某一年份Mi可计算年龄组死亡率nmx的完整年龄组数据或者获得年份区间[Mi,M1]或[M2,Mi]所有年份完整nmx数据,则遵从内插及邻近选取插值节点原则,按照步骤2.1中原理,可将研究的年份扩展至[Mi,M2]或[M1,Mi];其中,年龄组死亡率nmx表示某年龄组人口在n年内的平均死亡水平,它根据各年龄组平均人口数nPx和各年龄组实际死亡数nDx计算:
<mrow> <msub> <mmultiscripts> <mi>m</mi> <mi>n</mi> </mmultiscripts> <mi>x</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mmultiscripts> <mi>D</mi> <mi>n</mi> </mmultiscripts> <mi>x</mi> </msub> </mrow> <mrow> <msub> <mmultiscripts> <mi>P</mi> <mi>n</mi> </mmultiscripts> <mi>x</mi> </msub> </mrow> </mfrac> <mo>.</mo> </mrow>
5.根据权利要求3所述的我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于,步骤2.2的具体实现包括以下子步骤:
步骤2.2.1:编制寿命表时,用婴儿死亡率或校正婴儿死亡率作为0岁组死亡概率的估计值,即为1m0,最后一个年龄组的死亡概率为1,其他各年龄组中,当年龄组距n≤5时,nqxnmx函数关系表达式如下,
其中,x表示年龄组的下限值,n表示年龄组组距,表示最后一个年龄组;简略寿命表中年龄“X~”指刚满年龄,年龄组死亡概率nqx表示假想的同时出生的一代人,刚满x岁的尚存者在今后n年内死亡的可能性,根据年龄组死亡率nmx计算;
步骤2.2.2:计算尚存人数lx
ndx=lx·nqx
lx+n=lx-ndx
其中,尚存人数lx表示假想的同时出生的一代人到刚活满x岁的人时尚生存的人数,一般假定0岁组的尚存人数为:l0=100000;死亡人数ndx是假想的同时出生的一代人死于各年龄组x~(x+n)的人数;
步骤2.2.3:计算生存人年数nLx
其中,生存人年数nLx是指x岁尚存者在今后n年内的生存人年数,即lx曲线下,x~(x+n)间的面积;a0为每个死亡婴儿平均存活年数;1d0为0岁组的死亡人数;为最后一个年龄组的死亡概率;
步骤2.2.4:计算生存总人年数Tx
Tx=∑nLx
其中,生存总人年数Tx是指活满x岁者今后尚能生存的总人年数,即x岁及以上各年龄组生存人年数nLx的总和,生存总人年数由下向上累计;
步骤2.2.5:计算预期寿命ex
<mrow> <msub> <mi>e</mi> <mi>x</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>T</mi> <mi>x</mi> </msub> <msub> <mi>l</mi> <mi>x</mi> </msub> </mfrac> <mo>;</mo> </mrow>
其中,预期寿命ex是指活满x岁者今后尚能存活的年数。
6.根据权利要求1所述的我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于,步骤3的具体实现过程是:采用最小二乘法,构建省/市夜间灯光总量与预期寿命时空耦合模型:
ex=f(SOL);
式中,ex表示某一省/市某一年份的预期寿命,SOL表示该省/市相应年份的夜间灯光总量,f表示二者时空耦合函数关系。
7.根据权利要求1-6任意一项所述的我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于:步骤2中,基于年份逢“0”的人口普查数据和年份逢“5”的1%人口抽样调查数据查找或计算省/市相应年份完整年龄组平均人口数nPx和完整年龄组实际死亡数nDx,其中x表示该年龄组的下限值,n表示该年龄组组距,在其对应简略寿命表中将年龄组合并成三个年龄段A1、A2、A3,计算各年龄组平均人口数nPx占所在年龄段人口数比例p1和各年龄组实际死亡数nDx占总平均人口数比例p2,再利用拉格朗日插值得出其他年份的p1和p2
拉格朗日插值计算公式为:
<mrow> <msub> <mi>L</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>j</mi> </munderover> <msub> <mi>y</mi> <mi>k</mi> </msub> <mfrac> <mrow> <msub> <mi>&amp;omega;</mi> <mrow> <mi>j</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>(</mo> <mi>x</mi> <mo>-</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>)</mo> <msub> <msup> <mi>&amp;omega;</mi> <mo>&amp;prime;</mo> </msup> <mrow> <mi>j</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>(</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> </mfrac> <mo>,</mo> <mrow> <mo>(</mo> <mi>k</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>;</mo> </mrow>
ωj+1(x)=(x-x0)(x-x1)…(x-xj);
ω′j+1(xk)=(xk-x0)…(xk-xk-1)(xk-xk+1)…(xk-xj);
其中,Lj(x)表示拉格朗日j次插值函数,对应待插的p1或p2;x为自变量,对应相应的待插年份;当j=1时为线性函数,当j=2时为抛物线;
比较拉格朗日插值j=1和j=2时推算的两组模型的稳定性;选取年份区间[M1,M2]所有年份的夜间灯光总量SOL和j=1或j=2时相应的人口平均预期寿命ex,利用散点图进行趋势线拟合,分别分析j=1和j=2时用不同函数关系拟合时可决系数R2的变化态势,选取R2较大且变化较稳定的一组作为最忧模型。
8.根据权利要求7所述的我国省市预期寿命时序加密估算及其与夜光时空耦合方法,其特征在于:j=2时利用抛物线插值,若结果中出现负值,说明各年份对应的某一年龄组数据不适用于该模型,该年龄组插值则改为线性插值或负值部分使用邻近插值,不对其他年龄组产生影响;若统计年鉴中某些所求年份完整nPx数据可获取但首尾年龄分组与编制的简略寿命表不同,则按该所求年份的首尾年龄分组合并人口普查数据和1%人口抽样调查数据的对应年龄组,再计算其各年龄组占合并后的年龄段比例,按同样插值方法进行缺失指标弥补。
CN201710284304.9A 2017-04-26 2017-04-26 我国省市预期寿命时序加密估算及其与夜光时空耦合方法 Pending CN107133693A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710284304.9A CN107133693A (zh) 2017-04-26 2017-04-26 我国省市预期寿命时序加密估算及其与夜光时空耦合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710284304.9A CN107133693A (zh) 2017-04-26 2017-04-26 我国省市预期寿命时序加密估算及其与夜光时空耦合方法

Publications (1)

Publication Number Publication Date
CN107133693A true CN107133693A (zh) 2017-09-05

Family

ID=59715239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710284304.9A Pending CN107133693A (zh) 2017-04-26 2017-04-26 我国省市预期寿命时序加密估算及其与夜光时空耦合方法

Country Status (1)

Country Link
CN (1) CN107133693A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256015A (zh) * 2018-01-08 2018-07-06 中国科学院遥感与数字地球研究所 一种基于夜间灯光数据的中国人口空间格网化方法
CN108804394A (zh) * 2018-05-23 2018-11-13 河海大学 一种城市夜光总量-城镇人口回归模型的构建方法
CN111861797A (zh) * 2020-07-31 2020-10-30 生态环境部环境规划院 一种快速核算城镇和农村生活二氧化碳排放的方法及核算系统
CN115690576A (zh) * 2022-10-17 2023-02-03 武汉大学 基于夜光影像多特征的贫困率估算方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256015A (zh) * 2018-01-08 2018-07-06 中国科学院遥感与数字地球研究所 一种基于夜间灯光数据的中国人口空间格网化方法
CN108804394A (zh) * 2018-05-23 2018-11-13 河海大学 一种城市夜光总量-城镇人口回归模型的构建方法
CN111861797A (zh) * 2020-07-31 2020-10-30 生态环境部环境规划院 一种快速核算城镇和农村生活二氧化碳排放的方法及核算系统
CN115690576A (zh) * 2022-10-17 2023-02-03 武汉大学 基于夜光影像多特征的贫困率估算方法及系统
CN115690576B (zh) * 2022-10-17 2024-05-31 武汉大学 基于夜光影像多特征的贫困率估算方法及系统

Similar Documents

Publication Publication Date Title
Allam et al. On big data, artificial intelligence and smart cities
CN107133693A (zh) 我国省市预期寿命时序加密估算及其与夜光时空耦合方法
La Rosa Accessibility to greenspaces: GIS based indicators for sustainable planning in a dense urban context
CN105512289B (zh) 基于深度学习和哈希的图像检索方法
Madureira et al. Green structure and planning evolution in Porto
CN106780089B (zh) 基于神经网络元胞自动机模型的永久性基本农田划定方法
CN105513370B (zh) 基于稀疏车牌识别数据挖掘的交通小区划分方法
CN105608697A (zh) 基于遥感气溶胶和萤火虫群算法的空气污染源识别方法
CN106815850A (zh) 基于激光雷达技术获取甚高郁闭度森林蓄积量的方法
CN104021586A (zh) 基于北斗定位的空地一体城市生态文明管理系统及方法
CN106056591A (zh) 一种融合光谱图像和激光雷达数据进行城市密度估计方法
CN110532337A (zh) 面向智慧社区的公共设施服务能力提升方法
CN102902956A (zh) 一种地基可见光云图识别处理方法
CN109272487A (zh) 一种基于视频的公共区域内人群的数量统计方法
Chen et al. Improved GDP spatialization approach by combining land-use data and night-time light data: A case study in China’s continental coastal area
Nazir et al. Role of green infrastructure in determining house value in Labuan using hedonic pricing model
CN105467100B (zh) 基于遥感与gis的县域土壤侵蚀时空动态监测方法
CN102270343B (zh) 一种基于Ising图模型的图像分割方法
Efremova et al. AI-based evaluation of the SDGs: The case of crop detection with earth observation data
CN116612595A (zh) 一种基于联邦学习的森林火灾预测方法及系统
CN116451931A (zh) 一种公共服务设施选址行政管理决策的数据处理方法
CN107341449A (zh) 一种基于云块特征变化的静止气象卫星降水估算方法
Ortega-Córdova Urban vegetation modeling 3D levels of detail
Wang et al. A GIS and remote sensing-based analysis of land use change using the asymmetric relation analysis method: A case study from the City of Hangzhou, China
CN107452001A (zh) 一种基于改进fcm算法的遥感图像序列分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170905

RJ01 Rejection of invention patent application after publication