CN104537254A

CN104537254A - 一种基于社会统计数据的精细化制图方法

Info

Publication number: CN104537254A
Application number: CN201510006907.3A
Authority: CN
Inventors: 廖一兰; 李丹丹; 王劲峰
Original assignee: Institute of Geographic Sciences and Natural Resources of CAS
Current assignee: Institute of Geographic Sciences and Natural Resources of CAS
Priority date: 2015-01-07
Filing date: 2015-01-07
Publication date: 2015-04-22
Anticipated expiration: 2035-01-07
Also published as: CN104537254B

Abstract

本发明涉及一种基于社会统计数据的精细化制图方法，该方法首先以社会统计数据空间分布所需环境为依据，确定社会统计数据空间分布的影响要素体系；然后整合多源数据，结合遗传规划(GP)算法和粒子群(PSO)算法，进行统一快速社会统计数据精细空间化生产；接着确定精细化社会统计数据分布图的平面图层结构与图层配合方案，图例系统及表达方式，以经纬网为基本控制网，以此排列布置中英文注记，最终质检定稿后印刷出图。本发明可有效解决社会统计数据精细化生产过程中快速、准确地寻找影响因子和社会统计数据之间关系定量表达方式的难题；可用于实现同一套社会统计数据在多个不同空间尺寸范围内的智能精细化表达。

Description

一种基于社会统计数据的精细化制图方法

技术领域

本发明涉及一种社会统计数据精细化制图方法，可有效解决精细化社会统计数据生产过程中选择合理的关系表达方式的难题；可实现同一套社会统计数据在多个不同空间尺寸范围内的智能精细化表达。

背景技术

随着计算机、互联网等技术的高速发展，人类快速进入了信息爆炸时代。于是人们就有了数字化的手段来处理整个地球的自然和社会活动等诸多方面问题，最大限度地利用现有资源的需求。“数字地球”、“智慧城市”等的空间信息革命由此展开。社会统计数据是指那些以行政区划为单元所搜集、整理的各种反映该行政区内的社会、经济等特征属性的统计数据资料的总称。只有建立一个高分辨率的基础地理单元，将社会统计数据和自然环境数据共同转换到这一基础地理单元里，才能最终实现真正的“数字地球”和“智慧城市”。

在社会统计数据精细空间化过程中，无可避免地会遇到多个难题——如何准确地寻找影响社会统计数据空间分布的要素？如何精确建立其和社会统计数据之间的数学关系表达式？如何高效率地同时进行多个地区的社会统计数据精细空间化？在国内外很多社会统计数据精细化生产方法中是通过建立影响要素和社会统计数据之间线性或非线性回归模型的方法来实现影响要素选取和社会统计数据精细空间化的。现有的回归分析、EM、方程组求解和最小二乘法等建模和优化方法，将它们看成一个整体进行建模，存在模型精度低的不足，并且模型优化困难等问题。而且在进行多个地区的社会统计数据同时精细化时，这些建模和优化方法所建立的统一的数学关系表达式很难反映多个地区社会统计数据分布规律。另外现有的已生产出来的多源社会统计数据缺乏统一的制图标准，无论是投影、坐标系统，还是地图专题和符号类型，随意性大，给不同精细空间化的社会统计数据融合造成困难。

发明内容

本发明要解决的技术问题是：本发明提供一种基于社会统计数据的精细化制图方法，以社会统计数据空间分布所需环境为依据，科学地确定社会统计数据空间分布的影响要素体系。同时，本发明还提供一种在遗传规划算法和粒子群算法相嵌套基础上的社会统计数据精细空间化动态建模方法，有效地解决现有精细空间化方法建模精度低、模型优化效果差、难以适用于多个地区数据精细空间化等问题。另外本发明确定了统一的精细化社会统计数据分布图的结构与图层配合方案，图例系统及表达方式，使得社会统计数据精细化分布图的编制逐渐向规范化、标准化方向发展。

本发明解决上述技术问题采用的技术方案为：一种基于社会统计数据的精细化制图方法，首先以社会统计数据空间分布所需环境为依据，确定社会统计数据空间分布的影响要素体系；然后整合多源数据，结合遗传规划(genetic programming,GP)算法和粒子群(ParticleSwarm Optimization,PSO)算法，进行统一快速社会统计数据精细空间化生产；接着确定精细化社会统计数据分布图的平面图层结构与图层配合方案，图例系统及表达方式，以经纬网为基本控制网，以此排列布置中英文注记，最终质检定稿后印刷出图，其具体步骤如下：

步骤(1)、以社会统计数据空间分布所需环境为依据，在文献纵览的基础上列出可能的影响因子清单，通过专家或者专家系统打分等方法，确定最终的有可能对社会统计数据空间分布产生影响的自然和社会经济影响要素体系。其中，所述的可能的影响要素包括自然要素(坡度、土地利用类型、植被覆盖程度、到水源的距离等)和社会经济要素(夜间灯光指数、交通可及性、周边区域影响等)。

步骤(2)、获取自然和社会经济等多源影响要素数据，所存储的格式不同，所依附的地物也各不相同。利用地理信息系统(GIS)技术，对于以点、线、面等不同格式存储的初始影响要素地图数据进行统一的图层坐标转换，投影转换等图层格式化处理，形成投影和坐标体系一致的最终影响要素图层；然后通过图层的插值、叠加、剪切等操作处理，形成最终的以规则格网形式表达的各种影响要素图层。

步骤(3)、初始化遗传规划算法和粒子群算法参数；将所述最终影响因素图层的归一化属性值作为遗传规划算法的输入，组成搜索空间，来求解具有最佳评价指标值的社会统计数据精细化数学关系式；利用粒子群算法对由遗传规划算法所得到的社会统计数据精细化数学关系式进行优化，最终实现社会统计数据精细化的快速建模与优化；利用所建立的社会统计数据精细化模型，进行快速、智能社会统计数据精细空间化生产。

所述的初始化遗传规划算法参数有种群规模，即种群中的个体数GP_Size、样本量GP_N、遗传代数GP_Gen、最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_P_c和变异概率GP_P_m；初始化粒子群算法参数有粒子数PSO_Size、算法迭代次数PSO_Gen、样本量PSO_N；然后用遗传规划算法和粒子群算法相嵌套的方法快速求解具有最佳评价指标值的社会统计数据精细空间化模型，即：

A.用遗传规划算法快速构建社会统计数据精细化数学关系式，其步骤如下：

步骤①、首先确定遗传规划算法搜索空间中的基本组成单元，包括n种影响因素归一化值的基本算子(f₁,f₂,...,f_n)和基本算术运算符，再由基本组成单元随机形成GP_Size个个体。这些个体都是社会统计数据精细空间化模型的备选方案，即社会统计数据分布和输入影响因素变量之间的可能的数学关系表达式。同时为了有利于对同类模型结构的识别，对由基本组成单元随机形成的个体进行规范化处理，所有系数项均位于运算符的右边。遗传规划算法中的个体一般具有以下函数形式：

SOC_DATA＝f(X₁f₁,X₂f₂,...,X_nf_n) (1)

式中SOC_DATA为社会统计数据变量；(f₁,f₂,...,f_n)和(X₁,X₂,...,X_n)分别为各类输入影响因素变量及其系数。

步骤②、根据Kpid(i)_GP计算出每个规则格网里的待精细化的社会经济数据理论值，然后按照待精细化的社会统计数据所依附的最小行政单元(即样本)和规则格网空间位置之间覆盖叠加的关系，来汇总计算针对个体Kpid(i)_GP(1≤i≤GP_Size)的所有样本计算理论值与实测值之间的决定系数，将其作为第t代(1≤t≤GP_Gen)中该个体的评价指标BsJi(i,t)_GP，其评价函数公式为：

BsJi (i, t)_GP = \frac{Σ_{j = 1}^{GP_N} (P_GP (j) - \overset{&OverBar;}{P}) (P^{'}_GP (j) - {\overset{&OverBar;}{P}}^{'})}{\sqrt{Σ_{j = 1}^{GP_N} {(P_GP (j) - \overset{&OverBar;}{P})}^{2} Σ_{j = 1}^{GP_N} {(P^{'}_GP (j) - {\overset{&OverBar;}{P}}^{'})}^{2}}} - - - (2)

式中和分别为所有样本实测值和计算理论值的平均值；P'_GP(j)为个体Kpid(i)_GP在样本j(1≤j≤GP_N)的计算理论值；P_GP(j)为样本j的实测值即各个行政单元里待精细化的社会统计数据。

步骤③、根据公式(2)所确定的评价指标值，采取竞争选择策略来选择复制个体以产生新个体,即随机从群体中选取一组个体，比较该组每个成员的评价指标值，选出实际最好的个体Kpid(BesOpt)_GP＝f(X₁f₁,X₂f₂,...,X_nf_n)，复制优化后的个体以取代该组最差的；

步骤④、遗传规划算法对选择复制后的新个体进行交叉和变异操作；

步骤⑤、以最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_P_c和变异概率GP_P_m为遗传规划算法运行的约束条件，循环运行步骤③、④，直到遗传代数t＝GP_Gen或评价指标值最好值等于预先设定值时，所得的最优个体Kpid(Best)_GP＝f(X₁f₁,X₂f₂,...,X_nf_n)，为具有最佳评价指标值的社会统计数据精细空间化数学关系式。

B.用粒子群算法对由遗传规划算法所得到的社会统计数据精细化数学关系式f(X₁f₁,X₂f₂,...,X_nf_n)进行快速精确的参数优化，其步骤如下：

步骤Ⅰ、根据社会统计数据精细化数学表达式中待优化的变量系数f₁,f₂,...,f_n，随机生成问题搜索空间中PSO_Size个粒子,这些粒子是这些变量系数的随机解；每个粒子是由三个n维向量组成，其三个部分分别为：当前位置:x_i＝(x_i1,x_i2,...,x_in)(i≤PSO_Size),历史最优指标值所对应的粒子位置：p_i＝(p_i1,p_i2,...,p_in)，和当前的速度:V_i＝(v_i1,v_i2,...,v_in)；另外整个粒子群中迄今为止搜索得到的最优指标值所对应的粒子位置为p_g＝(p_g1,p_g2,...,p_gn)；

步骤Ⅱ、设定粒子群中每个粒子，其第d(1≤d≤n)维根据如下公式变化：

v_{id}^{k + 1} = w_{id}^{k} v_{id}^{k} + c_{1} \times r_{1} \times (p_{id}^{k} - x_{id}^{k}) + c_{2} \times r_{2} \times (p_{gd}^{k} - x_{id}^{k}) - - - (3)

x_{id}^{k + 1} = x_{id}^{k} + v_{id}^{k + 1} - - - (4)

其中，r₁和r₂为区间[0,1]内均匀分布的随机数，加速因子c₁和c₂分别为粒子跟踪自己历史最优评价指标值的权重系数和跟踪群体最优评价指标值的权重系数，即粒子调整个体和群体方向飞行的最大步长；是惯性权重因子，它是保持原来速度的系数；和分别为经过k代后第i个粒子搜索到的历史最优评价指标值和所有粒子搜索到的最优评价指标值所对应的位置；最大速度v_max决定了问题空间搜索的力度，粒子的每一维速度v_id都被限制在[-v_max,v_max]；

w_{id}^{k} = w_{ini} - τ_{1} \times (1 - h_{id}^{k}) + τ_{2} \times s - - - (5)

其中：

h_{id}^{k} = | \frac{\min (p_{id}^{k - 1}, p_{id}^{k})}{\max (P_{id}^{k - 1}, P_{id}^{k})} |, s = | \frac{\min (p_{gd}^{k}, \overset{&OverBar;}{p_{k}})}{\max (p_{gd}^{k}, \overset{&OverBar;}{p_{k}})} |,

表示所有粒子在第k代中的评价指标值所对应的位置的平均值；w_ini表示惯性因子的初始值，τ₁和τ₂均为[0,1]之间均匀分布的随机数；

步骤Ⅲ、与c步骤中作法相似，计算针对粒子x_i的所有样本的计算理论值与实测值之间标准误差，将其作为第k代(1≤t≤PSO_Gen)中该粒子的评价指标fi(k,i)_PSO，其计算公式为：

fi (k, i)_PSO = \sqrt{Σ_{j_{PSO} = 1}^{PSO_N} {(P_PSO (j_{PSO}) - P^{'}_PSO (j_{PSO}))}^{2} / PSO_N} - - - (6)

式中P_PSO(j_PSO)为粒子x_i在样本j_PSO(1≤j_PSO≤PSO_N)的计算理论值；P′_PSO(j_PSO)为样本j_PSO的实测值；

步骤Ⅳ、通过公式(3)和公式(4)计算每个粒子的当前代的评价指标值，以及该粒子搜索到的历史最优评价指标值和所有粒子搜索到的最优评价指标值；对每个粒子，用它的当前代的评价指标值与该粒子所搜索到的历史最优评价指标值比较，如果当前代的评价指标值小于粒子的历史最优评价指标值，则用当前代的评价指标值所对应的位置替换原来的该粒子搜索到的历史最优评价指标值所对应的位置,成为最新的粒子的历史最优评价指标值所对应的位置；然后再用当前代的评价指标值与所有粒子搜索到的最优评价指标值比较，如果当前代的评价指标值小于所有粒子的最优评价指标值，则用当前代的评价指标值所对应的位置替换所有粒子搜索到的最优评价指标值所对应的位置，成为最新的所有粒子搜索到的最优评价指标值所对应的位置；

步骤Ⅴ、分别计算当前代的每个粒子历史最优评价指标值和所有粒子搜索到的最优评价指标值及其分别所对应的位置后，根据给定的c₁和c₂以及w_ini，按照(3)及(4)式更新下一代的每个粒子的位置和速度；

步骤Ⅵ、从初始位置开始，对所有粒子重复步骤Ⅳ和Ⅴ的操作，直到达到所设定的迭代代数t＝PSO_Gen或评价指标值最小值等于预先设定值时，则当前代的评价指标值最小的粒子为最优粒子，其所对应的位置即为各个待优化的变量参数的最优解；

C.根据所建立的社会统计数据精细化模型，利用规则网格化的可能的影响要素图层的归一化属性值，实现目标社会统计数据的自动精细化生产。

步骤(4)、对所生产的基于规则网格的精细化社会统计数据进行图层管理时，根据地图专题和符号类型等因素，利用多层面设计方法来表示地图。确定行政区域边界、交通路网、河流、主要行政中心等地物要素和形态符号及指定宽度的规则网格为精细化社会统计数据分布图的图例系统；采用色差表示社会统计数据的数值等级，以不同点线符号或文字来表示行政区域边界等地物要素。整个分布图采用中英文注记方式，以经纬网为基本控制网，同时也作为注记排列布置的依据。最终质检定稿后印刷出图。即：

A.在制图过程中，首先以经纬网作为控制网，以经纬度交点作为误差控制点，由此形成误差校正方案，以确保精细化社会统计数据分布图的数学精度和与多源地理数据顺利进行整合和数据生产。

B.确定精细化社会统计数据分布图的平面图层结构与图层配合方案。在对精细化社会统计数据分布图进行图层管理时，本发明主要考虑了地图专题和符号类型等因素，通过多层面设计方法，尽可能清晰地表示一些地图内容。精细化社会统计数据分布图的图面内容自上而下依次为：①附图、附表和整饰层；②主要行政中心点和符号层；③交通路网和河流等线划和符号层；④行政区域层；⑤规则网格化社会统计数据图层。在进行图层表达时，本发明用拉开层面的方法以表达各地图要素的不同重要性，如用色差法表示的规则网格化社会统计数据图层位于第一层面，以图斑内部无填充形式表示的行政区域层分布则位于第二层面。同时也利用点、线、面等不同类型地图符号的整饰效果，将重要性相当的不同要素拉开一定的档次。

C.确定精细化社会统计数据分布图的图例系统及表达方法。精细化社会统计数据分布图的图例系统包括点、线和面符号库的设计以及色彩库的设计。其中图例系统包括基础地理要素和形态符号及规则网格。而精细化社会统计数据分布图代号表示方法则采用色差表示社会统计数据数量等级。

D.确定中英文注记的排列方式。本发明以经纬网为中英文注记排列布置的基本依据，并可对制图区域内的纬线以1°纬差进行内插。精细化社会统计数据分布图中英文注记分层分类、字库选择、字形定义和注记排列方式，参见表。

表1精细化社会统计数据分布图中英文注记分层分类、字库选择、字形定义和注记排列方式

本发明与现有技术相比的优点在于：本发明克服了传统上对社会统计数据精细空间化建模精度低、模型优化效果差的缺点，将遗传规划算法和粒子群算法相嵌套，引入到社会统计数据精细空间化的建模和优化中，以遗传程序设计优化模型结构，以遗传算法优化模型参数，成功地实现了社会统计数据精细空间化建模过程自动化。另外本发明统一制定了地图制作生产规范，使得社会统计数据精细化分布图的编制逐渐向规范化、标准化方向发展。生产的模式化可实现同一套社会统计数据同时在同一地区不同空间尺寸范围或多个地区内的智能精细表达。

附图说明

图1为本发明的一种基于社会统计数据的精细空间化动态建模方法的流程图。

图2为精细化社会统计数据分布图的符号图例系统。

图3为我国中东部部分省市碳排放量数据精细化分布图。

具体实施方式

下面以“我国中东部部分省市碳排放量数据精细化分布图”为具体实例，具体介绍本发明中社会统计数据精细化制图方法的具体步骤(如图1所示)：

步骤1、以碳排放量空间分布所需环境为依据，通过文献纵览和专家打分，确定最终的有可能对碳排放量空间分布产生影响的自然和社会经济影响要素体系：地区生产总值、地区人口总数、人均地区生产总值、三产比重和地区道路网密度。

步骤2、获取五种影响要素数据和部分城市单元的碳排放分布数据，利用GIS技术，对于所有影响要素地图数据和城市碳排放量数据进行统一的图层坐标转换，投影转换等图层格式化处理，形成投影和坐标体系一致的图层；生成覆盖整个研究区域的10km*10km大小的格网图层，然后通过图层的插值、叠加、剪切等操作处理，形成最终的以规则格网形式表达的各种影响要素图层。

步骤3、初始化遗传规划算法和粒子群算法参数；将所述最终影响因素图层的归一化属性值作为遗传规划算法的输入，组成搜索空间，来求解具有最佳评价指标值的碳排放量数据精细化数学关系式；利用粒子群算法对由遗传规划算法所得到的碳排放量数据精细化数学关系式进行优化，最终实现碳排放量数据精细化的快速建模与优化；利用所建立的碳排放量数据精细化模型，进行快速、智能碳排放量数据精细空间化生产。具体步骤如下：

步骤(1)、对遗传规划算法和粒子群算法的参数进行初始化；初始化遗传规划算法的参数主要有种群规模，种群中的个体数GP_Size(＝500)、样本量GP_N(＝138)、遗传代数GP_Gen(＝1000)、最大生成深度Max_Dep(＝10)、最大交叉深度Max_CDep(＝17)、交叉概率GP_P_c(＝0.7)和变异概率GP_P_m(＝0.05)；初始化粒子群算法参数有粒子数PSO_Size(＝50)、算法迭代次数PSO_Gen(＝1000)、样本量PSO_N(＝138)。

步骤(2)、对地区生产总值、地区人口总数、人均地区生产总值、三产比重和地区道路网密度五种社会统计数据分布影响因素的原始属性值进行归一化处理。归一化处理的公式是：

f_{jk} = \frac{{org}_{jk} - \min}{\max - \min} - - - (1)

式中org_jk和f_jk分别表示样本(城市单元)j(1≤j≤GP_N)第k(1≤k≤5)类影响因素属性的原始值和归一化值，max和min分别为样本数据的最大和最小值。

步骤(3)、完成上面两步后，最后用遗传规划算法和粒子群算法相嵌套的进化建模算法快速求解具有最佳评价指标值的碳排放量数据精细空间化模型。

A.用遗传规划算法快速构建碳排放量数据精细化数学关系式，其步骤如下：

步骤①、先确定遗传规划算法搜索空间中的基本组成单元，包括五种影响因素归一化值的基本算子(f₁,f₂,f₃,f₄,f₅)和基本算术运算符{+,-,*,/,ln(),exp()}；然后由基本组成单元根据五种影响因子的指标权重进行空间聚类，根据聚类的结果从每一类中随机选取形成GP_Size个个体。对个体进行规范化处理，所有系数项均位于运算符的右边，这样有利于对同类模型结构的识别。

步骤②、根据Kpid(i)_GP计算出每个规则格网里的待精细化的碳排放量数据，然后按照待精细化的碳排放量数据所依附的城市单元(样本)和规则格网空间位置之间覆盖叠加的关系，来汇总计算针对个体Kpid(i)_GP(1≤i≤GP_Size)的所有样本碳排放量数据的计算理论值与实测值之间的决定系数，将其作为第t代(1≤t≤GP_Gen)中该个体的评价指标BsJi(i,t)_GP，其评价函数计算公式为：

BsJi (i, t)_GP = \frac{Σ_{j = 1}^{GP_N} (P_GP (j) - \overset{&OverBar;}{P}) (P^{'}_GP (j) - {\overset{&OverBar;}{P}}^{'})}{\sqrt{Σ_{j = 1}^{GP_N} {(P_GP (j) - \overset{&OverBar;}{P})}^{2} Σ_{j = 1}^{GP_N} {(P^{'}_GP (j) - {\overset{&OverBar;}{P}}^{'})}^{2}}} - - - (2)

式中和分别为所有样本实测值和计算理论值的平均值；P'_GP(j)为个体Kpid(i)_GP在样本j(1≤j≤GP_N)的碳排放量的计算理论值；P_GP(j)为样本j的碳排放量的实测值；

步骤③、根据公式(2)所确定的评价指标值，采取竞争选择策略来选择复制个体以产生新个体,即随机从群体中选取一组个体，比较该组每个成员的评价指标值，选出实际最好的个体Kpid(BesOpt)_GP＝f(X₁f₁,X₂f₂,...,X₅f₅)，复制优化后的个体以取代该组最差的；需要说明的是，当代个体是有放回的选取，所以同一个体可能会被多次选中或复制。

步骤④、遗传规划算法对选择复制后的新个体进行交叉和变异操作。交叉操作就是随机选取两个个体的交叉点，然后相互交换这两个交叉点以下的子树来生成两个新个体。而变异操作则是随机选定父代个体的变异点及其下属分支子树后，删除突变点，再用其下属分支子树来代替它。

步骤⑤、以最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_P_c和变异概率GP_P_m为遗传规划算法运行的约束条件，循环运行步骤③、④，直到遗传代数t＝GP_Gen或评价指标值最好值等于预先设定值时，所得的最优个体Kpid(Best)_GP＝f(X₁f₁,X₂f₂,...,X₅f₅)，为具有最佳评价指标值的碳排放量数据精细空间化数学关系式。其中：f₁,f₂,f₃,f₄,f₅分别为五种影响要素的基本算子，X₁,X₂,X₃,X₄,X₅分别为基本算子所对应的系数。

B.用粒子群算法对由遗传规划算法所得到的社会统计数据精细化数学关系式f(X₁f₁,X₂f₂,...,X₅f₅)进行快速精确的参数优化，其步骤如下：

步骤Ⅰ、根据社会统计数据精细化数学表达式中待优化的变量系数f₁,f₂,...,f₅，随机生成问题搜索空间中PSO_Size个粒子,这些粒子是这些变量系数的随机解；每个粒子是由三个5维向量组成，其三个部分分别为：当前位置:x_i＝(x_i1,x_i2,...,x_i5)(i≤PSO_Size),历史最优指标值所对应的粒子位置：p_i＝(p_i1,p_i2,...,p_i5)，和当前的速度:V_i＝(v_i1,v_i2,...,v_i5)；另外整个粒子群中迄今为止搜索得到的最优指标值所对应的粒子位置为p_g＝(p_g1,p_g2,...,p_g5)。

步骤Ⅱ、设定粒子群中每个粒子，其第d(1≤d≤5)维根据如下公式变化：

v_{id}^{k + 1} = w_{id}^{k} v_{id}^{k} + c_{1} \times r_{1} \times (p_{id}^{k} - x_{id}^{k}) + c_{2} \times r_{2} \times (p_{gd}^{k} - x_{id}^{k}) - - - (3)

x_{id}^{k + 1} = x_{id}^{k} + v_{id}^{k + 1} - - - (4)

其中，r₁和r₂为区间[0,1]内均匀分布的随机数，加速因子c₁和c₂分别为粒子跟踪自己历史最优评价指标值的权重系数和跟踪群体最优评价指标值的权重系数，即粒子调整个体和群体方向飞行的最大步长，c₁＝c₂＝2；是惯性权重因子，它是保持原来速度的系数，为区间[0.4,0.9]内的随机数；和分别为经过k代后第i个粒子搜索到的历史最优评价指标值和所有粒子搜索到的最优评价指标值所对应的位置；最大速度v_max决定了问题空间搜索的力度，粒子的每一维速度v_id都被限制在[-v_max,v_max]。

w_{id}^{k} = w_{ini} - τ_{1} \times (1 - h_{id}^{k}) + τ_{2} \times s - - - (5)

其中：

h_{id}^{k} = | \frac{\min (p_{id}^{k - 1}, p_{id}^{k})}{\max (P_{id}^{k - 1}, P_{id}^{k})} |, s = | \frac{\min (p_{gd}^{k}, \overset{&OverBar;}{p_{k}})}{\max (p_{gd}^{k}, \overset{&OverBar;}{p_{k}})} |,

表示所有粒子在第k代中的评价指标值所对应的位置的平均值；w_ini表示惯性因子的初始值，为0.8；τ₁和τ₂均为[0,1]之间均匀分布的随机数。

fi (k, i)_PSO = \sqrt{Σ_{j_{PSO} = 1}^{PSO_N} {(P_PSO (j_{PSO}) - P^{'}_PSO (j_{PSO}))}^{2} / PSO_N} - - - (6)

式中P_PSO(j_PSO)为粒子x_i在样本j_PSO(1≤j_PSO≤PSO_N)的计算理论值；P′_PSO(j_PSO)为样本j_PSO的实测值。

步骤Ⅳ、通过公式(3)和公式(4)计算每个粒子的当前代的评价指标值，以及该粒子搜索到的历史最优评价指标值和所有粒子搜索到的最优评价指标值。对每个粒子，用它的当前代的评价指标值与该粒子所搜索到的历史最优评价指标值比较，如果当前代的评价指标值小于粒子的历史最优评价指标值，则用当前代的评价指标值所对应的位置替换原来的该粒子搜索到的历史最优评价指标值所对应的位置,成为最新的粒子的历史最优评价指标值所对应的位置。然后再用当前代的评价指标值与所有粒子搜索到的最优评价指标值比较，如果当前代的评价指标值小于所有粒子的最优评价指标值，则用当前代的评价指标值所对应的位置替换所有粒子搜索到的最优评价指标值所对应的位置,成为最新的所有粒子搜索到的最优评价指标值所对应的位置。

步骤Ⅴ、分别计算当前代的每个粒子历史最优评价指标值和所有粒子搜索到的最优评价指标值及其分别所对应的位置后，根据给定的c₁和c₂以及w_ini，按照(3)及(4)式更新下一代的每个粒子的位置和速度。

步骤Ⅵ、从初始位置开始，对所有粒子重复步骤Ⅳ和Ⅴ的操作，直到达到所设定的迭代代数t＝PSO_Gen或评价指标值最小值等于预先设定值时，则当前代的评价指标值最小的粒子为最优粒子，其所对应的位置即为最终的碳排放量数据精细空间化模型中各个变量参数的最优解。

C.根据所建立的社会统计数据精细化模型，利用规则网格化的可能的影响要素图层的归一化属性值，实现目标碳排放量数据的自动精细化生产。

步骤4、对所生产的基于规则网格的精细化碳排放量数据进行图层管理时，根据地图专题和符号类型等因素，利用多层面设计方法来表示地图。确定行政区域边界、交通路网、主要行政中心等地物要素和形态符号及指定宽度的规则网格为精细化碳排放量数据分布图的图例系统；采用色差表示碳排放量数据的数值等级，以不同点线符号或文字来表示行政区域边界等地物要素。整个分布图采用中英文注记方式，以经纬网为基本控制网，同时也作为注记排列布置的依据。最终质检定稿后印刷出图。即：

(1)在制图过程中，首先以经纬网作为控制网，以经纬度交点作为误差控制点，由此形成误差校正方案，以确保碳排放量数据分布图的数学精度和与多源地理数据顺利进行整合和数据生产。

(2)确定精细化碳排放量数据分布图的平面图层结构与图层配合方案。在对精细化碳排放量数据分布图进行图层管理时，本发明主要考虑了地图专题和符号类型等因素，通过多层面设计方法，尽可能清晰地表示一些地图内容。精细化社会统计数据分布图的图面内容自上而下依次为：①附图、附表和整饰层；②主要行政中心点和符号层；③交通路网层；④行政区域层；⑤规则网格化碳排放量数据图层。在进行图层表达时，本发明用拉开层面的方法以表达各地图要素的不同重要性，如用色差法表示的规则网格化碳排放量数据图层位于第一层面，以图斑内部无填充形式表示的行政区域层分布则位于第二层面。同时也利用点、线、面等不同类型地图符号的整饰效果，将重要性相当的不同要素拉开一定的档次。

(3)确定精细化碳排放量数据分布图的图例系统及表达方法。精细化碳排放量数据分布图的图例系统包括点、线和面符号库的设计以及色彩库的设计。其中图例系统包括基础地理要素和形态符号及规则网格。而精细化碳排放量数据分布图代号表示方法则采用色差表示碳排放量数据数量等级。

(4)确定中英文注记的排列方式。本发明以经纬网为中英文注记排列布置的基本依据，并可对制图区域内的纬线以1°纬差进行内插。精细化碳排放量数据分布图中英文注记分层分类、字库选择、字形定义和注记排列方式，参见表。

表1精细化碳排放量数据分布图中英文注记分层分类、字库选择、字形定义和注记排列方式

本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种基于社会统计数据的精细化制图方法，其特征在于包括以下步骤：

步骤(1)、以社会统计数据空间分布所需环境为依据，在文献纵览的基础上列出可能影响因子清单，通过专家或者专家系统打分的方法，确定最终的有可能对社会统计数据空间分布产生影响的自然和社会经济影响要素体系；

步骤(2)、获取自然和社会经济多源影响要素数据，利用地理信息系统(GIS)技术，对于以点、线、面不同格式存储的初始影响要素地图数据进行统一格式化处理，形成投影和坐标体系一致的最终影响要素图层；

步骤(3)、初始化遗传规划算法和粒子群算法参数；将所述最终影响因素图层的归一化属性值作为遗传规划算法的输入，组成搜索空间，来求解具有最佳评价指标值的社会统计数据精细化数学关系式；利用粒子群算法对由遗传规划算法所得到的社会统计数据精细化数学关系式进行优化，最终实现社会统计数据精细化的快速建模与优化；利用所建立的社会统计数据精细化模型，进行快速、智能社会统计数据精细空间化生产；

所述的步骤(3)中用遗传规划算法和粒子群算法快速求解具有最佳评价指标值的社会统计数据精细空间化模型，并以此进行社会统计数据快速、智能精细化生产，其步骤如下：

步骤a.首先读取最终的影响要素图层，设定图层的归一化属性值的基本算子分别为f₁,f₂,...,f_n-1,f_n，n为影响要素的个数；

步骤b.初始化遗传规划算法参数有种群规模，即种群中的个体数GP_Size、样本量GP_N、遗传代数GP_Gen、最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_P_c和变异概率GP_P_m；初始化粒子群算法参数有粒子数PSO_Size、算法迭代次数PSO_Gen、样本量PSO_N；

步骤c.用遗传规划算法快速构建社会统计数据精细化数学关系式，其步骤如下：

步骤①、首先确定遗传规划算法搜索空间中的基本组成单元，包括n种影响因素归一化值的基本算子(f₁,f₂,...,f_n)和基本算术运算符，再由基本组成单元随机形成GP_Size个个体，这些个体都是社会统计数据精细空间化模型的备选方案，即社会统计数据分布和输入影响因素变量之间的可能的数学关系表达式，同时为了有利于对同类模型结构的识别，对由基本组成单元随机形成的个体进行规范化处理，所有系数项均位于运算符的右边，遗传规划算法中的个体一般具有以下函数形式：

SOC_DATA＝f(X₁f₁,X₂f₂,...,X_nf_n) (1)

式中SOC_DATA为社会统计数据变量；(f₁,f₂,...,f_n)和(X₁,X₂,...,X_n)分别为各类输入影响因素变量及其系数；

BsJi (i, t)_GP = \frac{Σ_{j = 1}^{GP_N} (P_GP (j) - \overset{&OverBar;}{P}) (P^{'}_GP (j) - {\overset{&OverBar;}{P}}^{'})}{\sqrt{Σ_{j = 1}^{GP_N} {(P_GP (j) - \overset{&OverBar;}{P})}^{2} Σ_{j = 1}^{GP_N} {(P^{'}_GP (j) - {\overset{&OverBar;}{P}}^{'})}^{2}}} - - - (2)

式中和分别为所有样本实测值和计算理论值的平均值；P'_GP(j)为个体Kpid(i)_GP在样本j(1≤j≤GP_N)的计算理论值；P_GP(j)为样本j的实测值即各个行政单元里待精细化的社会统计数据；

步骤⑤、以最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_P_c和变异概率GP_P_m为遗传规划算法运行的约束条件，循环运行步骤③、④，直到遗传代数t＝GP_Gen或评价指标值最好值等于预先设定值时，所得的最优个体Kpid(Best)_GP＝f(X₁f₁,X₂f₂,...,X_nf_n)，为具有最佳评价指标值的社会统计数据精细空间化数学关系式；

步骤d.用粒子群算法对由遗传规划算法所得到的社会统计数据精细化数学关系式f(X₁f₁,X₂f₂,...,X_nf_n)进行快速精确的参数优化，其步骤如下：

v_{id}^{k + 1} = w_{id}^{k} v_{id}^{k} + c_{1} \times r_{1} \times (p_{id}^{k} - x_{id}^{k}) + c_{2} \times r_{2} \times (p_{gd}^{k} - x_{id}^{k}) - - - (3)

x_{id}^{k + 1} = x_{id}^{k} + v_{id}^{k + 1} - - - (4)

w_{id}^{k} = w_{ini} - τ_{1} \times (1 - h_{id}^{k}) + τ_{2} \times s - - - (5)

其中：

h_{id}^{k} = | \frac{\min (p_{id}^{k - 1}, p_{id}^{k})}{\max (P_{id}^{k - 1}, P_{id}^{k})} |, s = | \frac{\min (p_{gd}^{k}, \overset{&OverBar;}{p_{k}})}{\max (p_{gd}^{k}, \overset{&OverBar;}{p_{k}})} |,

fi (k, i)_PSO = \sqrt{Σ_{j_{PSO} = 1}^{PSO_N} {(P_PSO (j_{PSO}) - P^{'}_PSO (j_{PSO}))}^{2} / PSO_N} - - - (6)

步骤Ⅳ、通过公式(3)和公式(4)计算每个粒子的当前代的评价指标值，以及该粒子搜索到的历史最优评价指标值和所有粒子搜索到的最优评价指标值；对每个粒子，用它的当前代的评价指标值与该粒子所搜索到的历史最优评价指标值比较，如果当前代的评价指标值小于粒子的历史最优评价指标值，则用当前代的评价指标值所对应的位置替换原来的该粒子搜索到的历史最优评价指标值所对应的位置，成为最新的粒子的历史最优评价指标值所对应的位置；然后再用当前代的评价指标值与所有粒子搜索到的最优评价指标值比较，如果当前代的评价指标值小于所有粒子的最优评价指标值，则用当前代的评价指标值所对应的位置替换所有粒子搜索到的最优评价指标值所对应的位置，成为最新的所有粒子搜索到的最优评价指标值所对应的位置；

步骤Ⅵ、从初始位置开始，对所有粒子重复步骤Ⅳ和Ⅴ的操作，直到达到所设定的迭代代数t＝PSO_Gen或评价指标值最小值等于预先设定值，则当前代的评价指标值最小的粒子为最优粒子，其所对应的位置即为各个待优化的变量参数的最优解；

e.根据所建立的社会统计数据精细化模型，利用规则网格化的可能的影响要素图层的归一化属性值，实现目标社会统计数据的自动精细化生产；

步骤(4)、确定精细化社会统计数据分布图的平面图层结构与图层配合方案、图例系统及表达方式，采用经纬网作为基本控制网表达方式，并以此为基本依据排列布置中英文注记，最后通过质检定稿后印刷出图。

2.根据权利要求1所述的一种基于社会统计数据的精细化制图方法，其特征在于：步骤(1)中所述可能的影响要素包括自然要素和社会经济要素，其中，自然要素包括坡度、土地利用类型、植被覆盖程度和到水源的距离，社会经济要素包括夜间灯光指数、交通可及性和周边区域影响。

3.根据权利要求1所述的一种基于社会统计数据的精细化制图方法，其特征在于：所述的步骤(4)中对所生产的基于规则网格的精细化社会统计数据进行图层管理时，根据地图专题和符号类型因素，利用多层面设计方法来表示地图，确定行政区域边界、交通路网、河流、主要行政中心地物要素和形态符号及指定宽度的规则网格为精细化社会统计数据分布图的图例系统；采用色差表示社会统计数据的数值等级，以不同点线符号或文字来表示行政区域边界地物要素，整个分布图采用中英文注记方式，以经纬网为基本控制网，同时也作为注记排列布置的依据，最终质检定稿后印刷出图。