CN108520345A

CN108520345A - 基于ga-bp神经网络模型的耕地质量评价方法及系统

Info

Publication number: CN108520345A
Application number: CN201810269561.XA
Authority: CN
Inventors: 胡月明; 赵小娟; 马昊翔
Original assignee: South China Agricultural University
Current assignee: South China Agricultural University
Priority date: 2018-03-29
Filing date: 2018-03-29
Publication date: 2018-09-11

Abstract

本发明提供了一种基于GA‑BP神经网络的耕地质量评价方法及系统，该方法中基于遗传算法求出BP神经网络的最优初始权值和最优初始阈值，可有效减少BP神经网络的训练次数，对提高评价效率具有良好的实用性；另一方面，基于神经网络进行耕地质量评价，可一定程度上避免传统方法的主观性，使耕地质量评价结构更加客观。

Description

基于GA-BP神经网络模型的耕地质量评价方法及系统

技术领域

本发明涉及土地利用研究领域，具体涉及一种基于GA-BP神经网络模型的耕地质量评价方法及系统。

背景技术

目前耕地质量评价所采用的主要方法包括经验判断指数和法、主成分分析法、层次分析法、模糊综合评价法、聚类分析法、物元分析法、回归分析法、地统计学方法和灰色关联度分析法等一些综合评价方法，采用智能化评价方法的研究则并不多见。上述所用大部分耕地质量评价方法中，在确定评价指标体系的基础上都需要确定指标权重这个步骤，而在权重确定中大多依靠专家知识与经验，却又不可避免地存在人为主观因素影响。

因此，有必要发明一种智能化耕地质量评价方法，避免设定指标权重，同时提高评价效率。

遗传算法(Genetic Algorithm，GA)是一类借鉴生物界的进化规律演化而来的随机化搜索方法，其主要特点是直接对结构对象进行操作，不存在求导和函数连续性的限定；具有内在的隐并行性和更好的全局寻优能力；采用概率化的寻优方法，能自动获取和指导优化的搜索空间，自适应地调整搜索方向，不需要确定的规则。

神经网络(Back Propagation net－work，BP)是一种在理论和应用方面发展都较为成熟的逆向传播算法的多层前馈式网络，具有多层神经网络结构。常规的BP网络模型一般包含输入层、中间层(隐含层)和输出层，其应用十分广泛，但是其存在学习速度慢、容易陷入局部极小值等缺点。

发明内容

为了克服传统BP神经网络学习速度慢、容易陷入局部极小值的缺点，本发明提供了一种基于GA-BP神经网络的耕地质量评价方法及系统，该方法中遗传算法提供了一种求解复杂系统优化问题的通用框架，它不依赖于问题的具体领域，有很强的鲁棒性。同时，遗传算法也具有较好的全局搜索能力，快速搜索解空间，其内在并行性，便于进行分布式计算，加快求解速度。

相应的，本发明提供的一种基于GA-BP神经网络模型的耕地质量评价方法，包括以下步骤：

将研究区域划分为多个评价单元；

构建评价指标体系；

基于所述评价指标体系，以所述评价单元为单位，获取评价指标数据；

构建BP神经网络模型；

基于遗传算法计算所述BP神经网络模型的最优初始权值和最优初始阈值；

导入样本数据并基于所述最优初始权值和最优初始阈值训练所述BP神经网络模型，得出最优权值和最优阈值；

基于所述最优权值和最优阈值并基于所述最优权值和最优阈值建立最优 BP神经网络模型。

优选的实施方式，所述将研究区域划分为多个评价单元为基于网格法进行划分。

优选的实施方式，所述构建评价指标体系，包括以下步骤：

筛选评价指标；

评价指标标准化。

优选的实施方式，所述BP神经网络模型包括输入层、隐含层和输出层，隐含层神经元个数根据公式得出，其中，Nhid为隐含层神经元数，Nin为输入层神经元数，Nout为输出层神经元数，a为1￣10的常数。

优选的实施方式，所述基于遗传算法计算所述BP神经网络模型的最优初始权值和最优初始阈值包括以下步骤：

对所述BP神经网络的权值和阈值组合进行编码；

随机确定编码，得到初始种群；

对参与训练的种群进行解码，得到权值和阈值组合；

导入样本数据进行遗传训练，计算适应度并保留高适应度编码种群；

对高适应度编码种群执行变异操作和交叉操作后，导入样本数据继续进行遗传训练，直至遗传训练次数达到预设次数；

导出最优初始权值和最优初始阈值组合。

优选的实施方式，所述适应度通过适应度函数 E(i)＝∑_m∑_k(U_k-Y_k)²进行计算，其中i＝1，2，3，…，N表示编码种群内的个体数量；k是输出层神经元数；m是训练样本数；Y_k是实际输出，U_k为期望输出。

优选的实施方式，所述保留高适应度编码种群基于轮盘赌选择方法，计算种群内每一个编码的适应度并将其排序，按公式计算其概率值p_i，保留p_i较大的编码。

相应的，本发明还提供了一种基于GA-BP神经网络模型的耕地质量评价系统，包括评价单元划分模块：用于将研究区域划分成多个评价单元；

评价指标体系构建模块：用于构建研究区域的评价指标体系；

评价单元数据导入模块：用于导入评价单元的评价指标数据；

BP神经网络模型构建模块：用于构建BP神经网络模型；

遗传算法模块：用于基于遗传算法计算所述BP神经网络模型的最优初始权值和最优初始阈值；

BP神经网络训练模块：用于导入样本数据并基于所述最优初始权值和最优初始阈值训练所述BP神经网络模型，，得出最优权值和最优阈值；

最优BP神经网络模型构建模块：用于基于所述最优权值和最优阈值并基于所述最优权值和最优阈值建立最优BP神经网络模型。

本发明提供了一种基于GA-BP神经网络模型的耕地质量评价方法及系统，该方法避免设定指标权重，可在一定程度上减少人为主观性影响，与传统的特菲尔专家法等方法相比，具有更好的客观性和科学性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出了本发明实施例的基于GA-BP神经网络模型的耕地质量评价方法流程图；

图2示出了本发明实施例的评价指标体系表；

图3示出了本发明实施例的BP神经网络模型结构示意图；

图4示出了本发明实施例的BP神经网络模型具有不同隐含层节点数时的训练次数与误差汇总表；

图5示出了本发明实施例的样本采集地图；

图6示出了传统神经网络模型与本发明实施例的GA-BP神经网路模型的对比示意图；

图7示出了不同方法下评价单元的耕地质量分比较汇总表；

图8示出了本发明实施例的基于GA-BP神经网络模型的耕地质量评价系统结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明实施例提供了一种基于GA-BP神经网络模型的耕地质量评价方法，该方法避免设定指标权重，可在一定程度上减少人为主观性影响，与传统的特菲尔专家法等方法相比，具有更好的客观性和科学性。

遗传算法提供了一种求解复杂系统优化问题的通用框架，它不依赖于问题的具体领域，有很强的鲁棒性，同时，也具有较好的全局搜索能力。其内在存在并行性，便于进行分布式计算，加快求解速度。因此，针对神经网络的缺陷引进遗传算法，构建应用于耕地质量评价的GA-BP神经网络模型。实践证明， GA-BP神经网络结合遗传算法的全局收敛性和神经网络局部快速搜索等优点，能显著地提高神经网络的性能。

需要说明的是，在本发明实施例中，为了训练神经网络、测试神经网络和验证最终生成的GA-BP神经网络模型是否符合实际情况，从目标区域内采集了大量的样本数据。

为了从样本数据中抽出典型样本，本发明实施例采用均匀设计法，依据农用地分级等首先在每个县区内随机选取不同等级的耕地作为样本，对于等级差异较大的县区，增加样本数量。并根据样本空间位置进行调整，以实现空间分布的均匀性；同时根据样本属性进行调整，兼顾地域分布平衡，具有良好的代表性。

本发明实施例按照以上方法共选取了3000个评价单元作为训练样本。

本发明实施例提供的基于GA-BP神经网络模型的耕地质量评价方法步骤如下：

S101：划分评价单元；

评价单元是指用于本发明实施例的GA-BP神经网络模型运算、执行的最小单元，具体实施中，可将研究区域按照一定规律划分为多个评价单元，使其能适应模型和数据的要求。

在耕地质量评价中，各项指标及其数据均有其计算或获取的单元，这样就会存在多种计算单元，社会经济数据多是以行政单元进行统计的，而自然属性数据多以自然单元为基础，因此，为了能够较为容易的结合行政单元和自然单元，本发明实施例采用网格法划分评价单元，以实现自然数据与人文数据的划分。

本发明实施例的研究区域为珠三角区域，考虑到珠三角区域的评价因素差异及面积，这里以500×500m网格作为评价单元，共划分为24215个评价单元。

需要说明的是，本发明实施例采集的样本是以评价单元做为单位的，每一个样本即是一个评价单元。

S102：筛选评价指标；

影响耕地质量的自然因素包括气候、地形、土壤、水文、生物等，除此之外，还包括环境质量状况以及社会经济因素。耕地质量评价的社会经济因素可以分为农田基础设施建设、区位条件和农户生产行为方式等。农户是耕地的直接利用者，其利用决策、利用方式、农业投入对耕地质量有很大影响。

因此，本发明实施例中，根据珠三角区域特点，遵循综合性、主导性、差异性、科学性、可操作性等原则，采用资料统计和专家咨询法，从自然质量、经济质量、利用质量、生态质量4个方面，选择土壤有机质、全氮、有效磷、速效钾、表层土壤质地、有效土层厚度、pH值、年日照时数、年降雨量、单位耕地化肥投入、单位耕地机械投入、单位耕地劳动力投入、中心城镇影响度、交通通达度、耕地利用类型、水资源保证率、排水条件、耕地连片度、地形坡度、地址灾害易发程度、农药污染指数共21项评价指标。

S103：评价指标标准化

为了对指标进行量化，并采用同一个分值标准，以更好的进行统计，具体实施中，需要对每一个指标采用同一个分值范围进行评分，本发明实施例采用百分制[0，100]进行赋分，各个指标的分值按照其对耕地质量影响衰减程度及特尔菲法确定。

其中，有关土壤特性的指标，例如PH值、有效土层厚度、表层土壤质地、地形坡度等指标，具体因子级别临界值和等级划分标准可参考《耕地地力调查与质量评价技术规程》、《广东省农用地分等定级与估价技术方案》、《农用地质量分等规程》及《农用地定级规程》。

气候条件：采用协同克里金法对气象站点的近10年均降雨量和年均日照时数数据进行插值分析，使用交叉验证法来检查插值效果。本发明实施例的年降雨量插值结果标准均方根误差为1.120，标准平均值误差为－0.013；年日照时数插值结果标准均方根误差为0.954，标准平均值误差为－0.008，检验结果是有效的。

土壤养分：主要涉及土壤有机质、全氮、有效磷、速效钾等元素，根据国内外对土壤肥力评价的研究结果，结合T型和S型效应土壤肥力因子分级标准综合评价法，确定土壤养分各因子权重，分别取值为0.3、0.3、0.2、0.2，通过加权处理方式计算土壤养分综合分值；因此，土壤有机质、全氮、有效磷、速效钾四项指标最终输出的为一综合分值，该四项指标后文以土壤养分分值进行代替。

单位面积投入：包括单位耕地化肥投入、单位耕地机械投入和单位耕地劳动力投入三项指标。由于该三项指标主要反映农户生产行为方式，根据珠三角实际情况分别赋予0.3、0.3、0.4的权重进行加权综合分值输出，因此，在后续流程中，单位耕地化肥投入、单位耕地机械投入和单位耕地劳动力投入三项指标可以用单位面积投入分值进行代替。

耕地连片度：采用空间相连性计算法，利用ArcGIS的空间分析功能，定量计算地块的集中连片程度。公式如下：

式中，P为地块的集中连片程度；S_i为连片面积现状值，单位为hm²；S_min为连片面积最小值，单位为hm²；S_max为最大值，单位为hm²；集中连片程度P 指标值取值结果范围为[0，1)。经统计后发现，本发明实施例的目标区域，即珠三角区域，耕地的集中连片度的取值范围为(0，0.923)。

水资源保证率：用各地有效灌溉面积占年末实有耕地面积的比重来表示。

地质灾害易发程度：可根据历史统计数据进行统计，也可使用地方发布的地质灾害防治规划中统计的地质灾害易发情况的区域进行分级；在本发明实施例中，根据收集到的广东省地质灾害防治规划对广东省地质灾害易发情况的区域划分。

区位条件：包括交通通达度和中心城镇影响度，利用ArcGIS中的多级缓冲分析，设定不同的缓冲距离，再与耕地评价单元进行空间链接得到评价单元值。

农药污染指数：采用单位耕地面积农药施用量来表示农药的可能污染程度。

式中，ACP_i为研究年农药污染风险；y_i为年农药施用总量，x_i为年末耕地面积。ACP_i越大，说明研究年耕地农药施用量较多，农药污染的风险上升，反之，则下降。

社会经济数据：采用中心点归属结合面积占优的方法实现从行政单元向网格单元的转化，如下公式：

其中，P_i是栅格i上的某指标值，p为某区域行政单元该指标的统计值， A_i为栅格i的面积，n是该区域行政单元的栅格个数。

图2示出了本发明实施例的评价指标体系示意图表。通过步骤S102￣S103，实现评价指标的筛选以及评价指标分值和等级的划分，最终可构建出目标区域的评价指标体系。本发明实施例最终构建的评价指标体系如图2所示，其中，评价指标共有21项，评价指标的输出分值项为16项；即每个评价单元具有 16项具有分值的评价指标。

需要说明的是，本发明采集的样本包括有16项具有分值的评价指标数据和对应的实际综合耕地质量分，实际综合耕地质量分是在农用地分等定级成果的基础上确定指标权重计算得来。

S104：以评价单元为单位，获取评价指标数据；

在步骤S103中，已对大部分涉及到的评价指标数据的获取方法进行了初步介绍；在本发明实施例中，研究数据涉及气象、水文、土壤、地貌等自然条件统计资料，包括珠三角区域2014年行政区划图、交通道路图；珠三角及周边区域41个气象站点近10年的年日照时数、年降雨量等数据；土壤属性数据来源于第二次土壤普查资料，包括土壤志、土种志、土壤普查报告；珠三角各地市农用地分等数据；地质灾害易发区相关数据来源于广东省地质灾害防治规划(2011－2020)。影像数据主要是在地理空间数据云平台下载的2014年多幅 30m分辨率TM遥感数据。社会经济数据主要来源于2015年《广东农村统计年鉴》、《广东统计年鉴》及各地市统计年鉴、国民经济和社会发展统计公报。

其中，遥感影像数据的接收时间是7－12月份，选择无云或少云，影像质量高的数据。对影像数据的预处理主要包括辐射定标、大气校正以及影像的拼接和裁剪等。遥感数据分类参考土地利用现状分类GB/T21010－2007以及中科院土地利用覆盖分类体系，结合珠三角区域TM遥感影像特点和景观异质性，分为耕地、林地、草地、水域、建设用地和未利用地。分类结果的精度检验是从遥感图像上随机选择了100个样点，保证各地类都有覆盖，采用目视解译的方法结合实地调查与第二次土地调查成果，结果表明影像分类总体精度达到 87.3％，Kappa系数也超过了0.7，分类达到使用要求。

S105：构造BP神经网络模型；

图3示出了本发明实施例的BP神经网络模型结构示意图。BP神经网络模型基本结构包括输入层、隐含层和输出层3层，其中，输入层和输出层为单层结构，隐含层的数量可以为单层或多层。结合本发明实施例的实际情况，输入层、隐含层和输出层均为单层结构。鉴于本发明实施例输入的数据为评价单元的16项分值指标的分值，因此，输入层具有16个神经元；输出的数据为评价单元的综合耕地质量分，因此，输出层具有1个神经元。

在神经网络设计过程中，隐含层的神经元数的数量确定十分重要。隐含层神经元个数过多，会加大神经网络计算量并容易产生过度拟合问题；神经元个数过少，则会影响神经网络性能，达不到预期效果。神经网络中隐含层神经元的数目与实际问题的复杂程度、输入层和输出层的神经元数以及对期望误差的设定有着直接的联系。目前，对于隐含中神经元数目的确定尚没有明确的公式，只有一些经验公式，神经元个数的最终确定还是需要根据经验和多次实验来确定。本文在选取隐含层神经元个数的问题上参照了以下的经验公式：式中，N_hid为隐含层神经元数，N_in为输入层神经元数，N_out为输出层神经元数，a为1～10的常数。在本发明实施例中，即隐含层神经元数在5～14之间选择，当隐含层采用不同数量的神经元数时，会对神经网络的训练次数和最终的均方误差产生影响。

图4示出了本发明实施例的BP神经网络以不同隐含层节点数的网络训练次数与均方误差统计表。本发明实施例以不同的隐含层神经元数量进行后续计算，并统计其训练次数和均方误差；综合考虑拟合和预测效果以及训练时间，在珠三角耕地质量评价神经网络模型中，当隐含层个数为9时，效果较好。

需要说明的是，最优隐含层个数需要通过多次遍历式的迭代计算才可以求出。具体实施中，可在经验公式所求得的隐含层神经元数量区间范围内，优先取位于区间中部的数量首先进行计算；通过反复代入运算，筛选出训练次数较少、均方误差较优的隐含层神经元数量，以用于确定最优的BP神经网络结构。

本发明实施例中，神经网络结构为16－9－1，即输入层具有16个神经元，隐含层具有9个神经元，输出层具有1个神经元。

神经网络中的每个神经元接受输入值，并会产生一个输出值传递给下一层，在神经网络中，输入值和输出值之间具有函数关系，该函数关系统统称为激励函数。鉴于在MATLAB软件中能较为方便的进行神经网络的训练，本发明实施例以MATLAB软件中的设置进行算法的讲解。

本发明实施例采用自适应梯度下降法进行神经网络训练，网络训练函数采用trainbp函数，输入层激励函数采用tansig函数，隐含层神经元的激励函数采用S型正切函数tansig，输出层神经元的激励函数采用Purelin函数。

需要说明的是，激励函数主要用于分割数据，以二进制数值0和1为例，当输入数值满足神经元激励函数的激活条件时，该神经元的输出值为1；当输入数值不满足神经元激励函数的激活条件时，该神经元的输出值为0。实际上，某些数据是可以被线性分割的，但是也有很多数据是不可被线性分割的，因此，激励函数也是多种多样的，具体实施中，可根据需求设计激励函数。

学习速率倾向于选取较慢的学习速率以保证系统的稳定性，学习速率的范围在0.01￣0.7之间较优。本发明实施例选取的学习速率为0.01。

S106：对BP神经网络的权值和阈值编码；

根据本发明实施例的BP神经网络结构可得，本发明实施例的权值数量为 16＊9+9＊1＝153个，阈值数量为9+1＝10个，因此，遗传算法需要优化参数的个数为153+10＝163个；在遗传算法中，可将163个权值和阈值的组合当做为一条DNA链，并基于遗传算法的交叉和变异操作进行随机性的变化。

编码的主要目的是使权值和阈值的值规则化，便于后续交叉和变异操作的进行，编码后每一组权值和阈值的组合都具有唯一对应的编码，每一组权值和阈值的组合与其对应的编码为映射关系，在变异和交叉操作中以编码为基础执行，在通过映射关系逆推出相应的权值和阈值组合。

常用的编码方法有二进制法和十进制法，假如需要表示相同数量的编码，十进制的编码长度需要更加长，因此，为了避免运算速度下降，本发明实施例采用实数编码方式，编码长度为S＝R＊S1+R＊S2+S1+S2，其中R为正整常数， S1为输入层节点数，S2为输出层节点数，通常R的取值小于或等于隐含层的神经元数量，从而能缩小编码长度。在本发明实施例中，如果R等于隐含层的神经元数量，则编码长度为163；如果R为1，则编码长度为34；为了保证编码与权值和阈值的组合具有一定的对应性且提高权值和阈值的精度，编码长度不宜太短。

假如当编码长度为163时，由于本发明实施例采用实数编码方式，可简单的认为每一个权值和阈值分别对应编码上的一位，共有0￣9共10种取值；在数值上最小的编码数为0000…0000共163个0，数值上最大的编码数为9999… 9999共163个9，共有10¹⁶³组编码方式；其中，前144位用于编码输入层与隐含层的连接权值，接下来的9位用于编码隐含层阈值，之后的9位用于编码输入层与输出层连接权值，最后一位用于编码输出层阈值。

具体实施中，可通过增加编码长度，增加每个权值和阈值取值的个数，从而提高精度，但过长的编码长度会造成运算速度几何级的降低，具体应视实际情况和计算机性能决定。

需要说明的是，由于数据经过标准化处理，遗传算法中神经网络的权值在[0，1]区间取值。

S107：随机确定编码，得到初始种群；

该初始编码种群用于神经网络训练的第一次运行，其值可在编码区间内任意选取；为了避免种群规模过大，初始种群的初始个体数量一般设置在40￣100 之间，本发明实施例设置在60。

由于在本发明实施例中设置的遗传训练次数较大，可避免初始编码种群组成的不同对最优初始权值和最优初始阈值的确定造成干扰。

S108：对参与训练的种群进行解码，得到权值和阈值组合；

通过编码的解码，按照初始设定的映射关系，可逆推出种群内所有编码的权值和阈值函数。

S109：导入样本数据进行遗传训练，计算适应度并保留高适应度编码种群；

采用遗传算法筛选权值和阈值的取值，一方面，可在一定程度上避免标准传统的BP神经网络陷入局部极小值的缺陷；另一方面，基于遗传原理，保留种群中的最适个体，并使最适个体在种群内的规模变大，对确定BP神经网络训练的最优初始权值和最优初始阈值具有较佳的效果。

在本发明实施例中，对于耕地质量评价而言，其评价结果输出要求是非负的，为了更直观的看出适应度函数和实际效果的关系，可将均方误差的倒数作为适应度函数，其值越大或占比越大则表明其实际评价效果更优秀，计算公式为：

其中i＝1，2，3，…，N表示染色体数，即本发明实施例中编码种群内的个体数量60；k是输出层节点数，本发明实施例中k＝1；m是学习样本数，本发明实施例的学习样本数量为3000份；Y_k是实际输出，即本发明实施例通过某一组权值阈值得出的估测综合评价分值；U_k是期望输出，即本发明实施例的评价单元的实际综合评价分值。

当f_i在一定程度上接近1时，即被认为达到网络的精度要求；越接近1，则其精确性越高。

在第一次遗传算法训练中，初始种群中具有60个编码个体，由于本发明实施例的种群规模设置在60，因此，第一次遗传算法训练中，60个编码个体完全保留；然后每一次遗传训练，会在上一次训练保留的种群规模中，增加 60个个体，为了保证种群规模不会产生爆发，需要对种群内的个体进行筛选，即对权值和阈值的组合进行筛选，以确保种群规模保持在60。

具体选择方法可采用轮盘赌选择方法，对于适应度为f_i的权值阈值组合成的编码个体，计算每一个编码个体评价函数，并将其排序，按公式计算其概率值p_i，进行个体的筛选，概率值p_i反映了个体适应度在所有个体适应度总和中所占比例，所占比例越高，则其适应度越好；每次种群内进行保留的编码为p_i较大的60个个体。

S110：遗传训练次数是否达到预设次数？

为了保证通过遗传算法产生的最优初始权值和初始阈值的组合具有一定的可靠性，遗传算法的遗传训练次数需要进行设置，本发明实施例设置为1000 次；较少的遗传训练次数会造成种群内的最适个体规模未能凸显，较多的遗传训练次数会造成无用的重复训练。

当训练次数未达到预设次数时，执行步骤S114，以重复执行遗传算法；

当训练次数达到预设次数时，执行步骤S111，开始进行BP神经网络的训练。此时高适应度编码种群内的个体趋于相同，执行变异和交叉操作后，根据适应度进行筛选后也无法大程度的改变高适应度编码种群内的个体占比，即某一组权值和阈值组合占种群内的绝大部分，变异和交叉操作以无法进一步的获得更优权值和阈值的组合，该组权值阈值组合可作为最优初始权值和最优初始阈值参与BP神经网络的训练并以下步骤的计算。

S111：对高适应度编码种群内的编码进行交叉操作和变异操作，形成新编码种群；

在本发明实施例的遗传算法应用中，交叉操作和变异操作主要用于随机获取不同的编码值，由于本发明实施例的编码长度为163，在文字说明中不便于表示，下面以编码长度为8位长度的编码进行介绍。

变异操作为编码中的某一位或多位编码数值在遗传时发生改变；假设A 组编码为2222 2222，当发生单位变异时，可变异为2222 3222，第五位编码发生变异；当发生多位变异时，可变异为2223 3222；由于本发明实施例采用实数编码方式，在变异中采用非均匀变异算子，每一位的数值可在0、1、2、 3、4、5、6、7、8、9之间发生变异，变异的概率与非均匀变异算子相关联。具体实施中，还可以采用均匀变异算子，即变异概率为常数。

交叉操作指两组编码之中的一位或多位发生交换；假设A组编码为2222 2222，B组编码为8888 8888；当某一编码位发生交叉时，A组编码可变为2228 2222，B组编码则变为8882 8888，两组编码之间同一位的编码产生交换。与变异操作同理，交叉操作亦会存在一个交叉发生的概率，一般称为交叉概率。

由于编码值对应的为不同权值和阈值的组合，因此，当发生交叉和变异后，根据新的编码重新逆推出对应的新的权值和阈值组合，新的权值和阈值组合相对于原编码对应的权值和阈值组合发生了改变，相当于随机生成了不同的权值和阈值组合，即从高适应度编码种群中产生了新的种群。传统的随机数遍历算法，在一些存在局部最优解的问题上永远跳不出局部最优解，导致计算陷入死循环；而遗传算法相对于传统的随机数遍历计算而言，由于编码交叉和变异特性，新生成的编码与原编码之间可能存在较大的变化，这有利于算法的广阔搜索能力。

具体实施中，交叉操作和变异操作通常结合一起执行，其产生的作用相同，因此，其执行顺序并无特殊要求。

结合前文遗传算法相关内容，即步骤S107、S108、S109、S110和S111，可得出本发明实施例用于遗传算法实现的主要参数，其中包括：遗传训练次数、交叉概率、变异概率、种群规模、适应度函数和遗传训练样本。

S112：将最优初始权值和最优初始阈值代入至BP神经网络中，使用训练样本训练网络；

一般的BP神经网络的权值和阈值一般是通过初始化为[－0.5，0.5]区间的随机数，这个初始化参数对网络训练的影响很大，但是又无法准确获得，对于相同的初始权重值和阈值，神经网络的训练结果是一样的，引入遗传算法就是为了优化出神经网络最优的初始权值和阈值。

以达到遗传训练次数后的权值和阈值组合作为最优初始权值和最优初始阈值，代入至步骤S105构建的BP神经网络，开始BP神经网络的训练。

本发明实施例选择均方误差MSE(mean squared error)作为性能评价参数。结束训练的条件是在检验误差没有出现增大趋势时训练样本的均方误差小于10^-4，均方误差的计算公式为其中m是输出层节点数；p是训练样本集的总数目，即本发明实施例的3000个训练样本；是神经网络的期望输出值；y_pj是神经网络的实际输出值；针对于本发明实施例而言，训练样本集指的是不同评价单元的评价指标数据，实际输出值为通过该神经网络模型运算后得出的综合评分值，期望输出值为常规法分值，常规法是在农用地分等定级成果的基础上确定指标权重计算得来。

神经网络训练本质上为一个不断修正权值和阈值的过程，通过训练不断修正权值和阈值，使得神经网络的输出误差越来越小；在本发明实施例中，输出误差是指均方误差MSE，当均方误差MSE小于10^－4时，网络训练结束。

S113：得出最优权值和最优阈值，并基于最优权值和最优阈值建立神经网络模型；

当均方误差MSE小于10－4时，将此时的权值和阈值组合作为最优权值和最优阈值，回代至神经网络模型中，此时，神经网络的各个要素已经确定；通过该成型的神经网络即可进行耕地质量分的运算。

具体执行中，在MATLAB中进行模型运算，分别基于BP神经网络模型与 GA-BP网络模型对珠三角24215个评价单元的综合质量分进行5次实验，试验结果汇总表如图7所示。

由结果可知，GA-BP神经网络模型的训练次数明显小于BP网络，BP神经网络模型的平均训练次数为76次，而GA-BP神经网络才32次，说明GA-BP 神经网络算法能减少模型训练的迭代次数，在全局搜索能力上更为有效，在一定程度上避免了标准BP网络陷入局部极小值，同时其收敛速度也优于BP神经网络模型；GA-BP网络模型中均方误差都比BP模型的小，并且最大和最小均方误差的差值也比BP神经网络模型的差值小0.1116，GA-BP神经网络模型更稳定，适应度更好。

在部分县区随机抽取共20个评价单元，对BP神经网络和GA-BP神经网络模型的耕地质量评价结果进一步验证分析，如图8所示。验证结果表示，常规法是在农用地分等成果的基础上确定指标权重计算得来，通过上表结果可知，两种模型的质量分与常规法都相差不大，表明在耕地质量分计算中应用神经网络是可行的，并且也不需要人为确定权重，可直接向训练样本“学习”。在耕地质量分等中可在确定各因子分值的基础上，通过对模型进行训练和测试，然后计算耕地质量分，简化计算工作，结果更科学合理。综合来看，运用GA-BP神经网络进行耕地质量评价是合理可靠的。

图8示出了本发明实施例的基于GA-BP神经网络模型的耕地质量评价系统结构示意图。相应的，有一种基于GA-BP神经网络模型的耕地质量评价系统，包括

评价单元划分模块：用于将研究区域划分成多个评价单元；

BP神经网络模型构建模块：用于构建BP神经网络模型；

本发明实施例提供的一种基于GA-BP网络模型的耕地质量评价方法及系统，通过采用GA-BP神经网络模型进行耕地质量评价研究，避免设定指标权重，可在一定程度上减少人为主观性影响。遗传算法提供了一种求解复杂系统优化问题的通用框架，它不依赖于问题的具体领域，有很强的鲁棒性。同时也具有较好的全局搜索能力，快速搜索解空间；其内在并行性，便于进行分布式计算，加快求解速度。因此，针对BP神经网络的缺陷引进遗传算法，构建应用于耕地质量评价中的GA-BP神经网络模型。实践证明，GA-BP神经网络结合GA的全局收敛性和BP局部快速搜索等优点，能显著地提高神经网络的性能。对耕地质量评价方法的深入研究有助于探索出符合实际、较为准确高效的方法以提高评价效率，使其向更合理、规范、科学的方向发展，也为其他类似研究提供一定的借鉴与参考。

以上对本发明实施例所提供的一种基于GA-BP网络模型的耕地质量评价方法及系统进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于GA-BP神经网络模型的耕地质量评价方法，其特征在于，包括以下步骤：

将研究区域划分为多个评价单元；

构建评价指标体系；

构建BP神经网络模型；

基于所述最优权值和最优阈值建立最优BP神经网络模型。

2.如权利要求1所述的基于GA-BP神经网络模型的耕地质量评价方法，其特征在于，所述将研究区域划分为多个评价单元为基于网格法进行划分。

3.如权利要求2所述的基于GA-BP神经网络模型的耕地质量评价方法，其特征在于，所述构建评价指标体系，包括以下步骤：

筛选评价指标；

评价指标标准化。

4.如权利要求3所述的基于GA-BP神经网络模型的耕地质量评价方法，其特征在于，所述BP神经网络模型包括输入层、隐含层和输出层，隐含层神经元个数根据公式得出，其中，N_hid为隐含层神经元数，N_in为输入层神经元数，N_out为输出层神经元数，a为区间[1,10]内的常数。

5.如权利要求4所述的基于GA-BP神经网络模型的耕地质量评价方法，其特征在于，所述基于遗传算法计算所述BP神经网络模型的最优初始权值和最优初始阈值包括以下步骤：

对所述BP神经网络的权值和阈值组合进行编码；

随机确定编码，得到初始种群；

对参与训练的种群进行解码，得到权值和阈值组合；

对高适应度编码种群执行变异操作和交叉操作后，导入样本数据继续进行遗传训练，直至遗传训练次数达到预设遗传训练次数；

导出最优初始权值和最优初始阈值组合。

6.如权利要求5所述的基于GA-BP神经网络模型的耕地质量评价方法，其特征在于，所述适应度通过适应度函数E(i)＝∑_m∑_k(U_k-Y_k)²进行计算，其中i＝1，2，3，…，N表示编码种群内的个体数量；k是输出层神经元数；m是训练样本数；Y_k是实际输出，U_k为期望输出。

7.如权利要求6所述的基于GA-BP神经网络模型的耕地质量评价方法，其特征在于，所述保留高适应度编码种群基于轮盘赌选择方法，计算种群内每一个编码的适应度并将其排序，按公式计算其概率值p_i，保留p_i较大的编码。

8.一种基于GA-BP神经网络模型的耕地质量评价系统，其特征在于，包括

评价单元划分模块：用于将研究区域划分成多个评价单元；

BP神经网络模型构建模块：用于构建BP神经网络模型；