CN109886456B - 基于pca与混合核函数lssvr的泥石流预测方法 - Google Patents

基于pca与混合核函数lssvr的泥石流预测方法 Download PDF

Info

Publication number
CN109886456B
CN109886456B CN201910032106.2A CN201910032106A CN109886456B CN 109886456 B CN109886456 B CN 109886456B CN 201910032106 A CN201910032106 A CN 201910032106A CN 109886456 B CN109886456 B CN 109886456B
Authority
CN
China
Prior art keywords
kernel function
formula
debris flow
lssvr
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910032106.2A
Other languages
English (en)
Other versions
CN109886456A (zh
Inventor
温宗周
程少康
李丽敏
徐根祺
郭伏
李璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Polytechnic University
Original Assignee
Xian Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Polytechnic University filed Critical Xian Polytechnic University
Priority to CN201910032106.2A priority Critical patent/CN109886456B/zh
Publication of CN109886456A publication Critical patent/CN109886456A/zh
Application granted granted Critical
Publication of CN109886456B publication Critical patent/CN109886456B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开的基于PCA与混合核函数LSSVR的泥石流预测方法,首先,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因子,并且通过PCA将获取的初始影响因子进行降维;其次,利用降维后的初始影响因子构建混合核函数LSSVR泥石流灾害模型;然后,运用鲸鱼算法优化建立的混合核函数LSSVR泥石流灾害模型,得到优化后的组合模型参数;最后,利用得到的组合模型参数,重构混合核函数LSSVR泥石流灾害模型,输出泥石流发生的预测结果。本发明公开的方法大大降低了模型结构的复杂性,防止维数灾难;引用混合核函数机制来平衡模型学习能力与泛化能力,提升预测精确度。

Description

基于PCA与混合核函数LSSVR的泥石流预测方法
技术领域
本发明属于地质灾害监测技术领域,具体涉及一种基于PCA与混合核 函数LSSVR的泥石流预测方法。
背景技术
泥石流是山区常见的地质灾害之一,因其分布地域广、发生频率高、成 灾速度快等特点,严重威胁着山区人民的生命财产安全与经济社会的可持续 发展。因此,能否提供有效的泥石流灾害预报方法成为人们所关注的焦点。
相关领域科研工作者针对泥石流成灾特点进行深入研究,并提出多种泥 石流灾害预报方法,其方式各有利弊。曹禄来等运用模糊系统理论与人工神 经网络模型相结合评价泥石流发生危险等级,将模糊逻辑推理知识作为危险 性评价系统,以人工神经网络作为训练模型,降低数据处理复杂度与主观影 响,但在训练过程中模型本身易陷入局部极值而影响精确度;李丽敏等将多 传感器信息融合理论运用于泥石流预报模型中,利用多个泥石流影响因素综 合预测危险度,较好地解决以往因单一监测手段造成的漏报问题,但并未分析多个致灾影响因素之间的相关性,若选取较多影响因素时,可能导致因素 之间信息相互叠加,易发生维数灾难;董佳祺等利用支持向量机模型建立泥 石流堆积物分维数模型,将多个影响因素作为模型输入,优点在于具有较好 普适性,但模型中选取的单核局部核函数虽然学习能力较强,但泛化能力较 弱,在实现模型训练最优组合上还存在一定上升空间。支持向量机(Support Vector Machine,SVM)是建立于统计学习理论的结构风险最小化原则上的 机器学习系统,其特点在于能够自主设计模型复杂程度,避免维度灾难,且 具有良好的泛化能力;而最小二乘支持向量回归(Least Squares Support Vector Regression,LSSVR)是在支持向量运算框架下,改变其内部标准SVM 的约束条件与风险函数,在继承传统支持向量机优点的同时,还能够很好地 解决数据量少、过学习等实际问题,提升了模型训练效率与准确性,在回归 预测分析中具有良好效果。
鉴于此,本发明提出了基于主成分分析与混合核函数LSSVR的泥石流 预测方法。首先,建立泥石流监测预警系统,以获取泥石流灾害初始影响因 子,其次运用主成分分析法(Principal Component Analysis,PCA)降维得到 泥石流灾害主成分影响因子,然后将已重构的主成分影响因子数据输入至混 合核函数LSSVR模型中,并运用鲸鱼优化算法(Whale Optimization Algorithm,WOA)进行模型参数寻优,最后输出泥石流发生概率以及与其 对应的灾害预警等级,完成预测预报。
发明内容
本发明的目的是提供一种基于PCA与混合核函数LSSVR的泥石流预测 方法,解决了当前泥石流灾害发生受多重因素影响而导致的预测维数灾难, 以及最小二乘支持向量回归模型中因选取单核函数而导致的模型训练性能 部分缺陷、精确度低的问题。
本发明所采用的技术方案是,基于PCA与混合核函数LSSVR的泥石流 预测方法,具体包括如下步骤:
步骤1,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因 子,并且通过PCA将获取的初始影响因子进行降维;
步骤2,利用步骤1降维后的初始影响因子构建混合核函数LSSVR泥 石流灾害模型;
步骤3,运用鲸鱼算法优化步骤2建立的混合核函数LSSVR泥石流灾 害模型,得到优化后的组合模型参数;
步骤4,利用步骤3得到的组合模型参数,重构混合核函数LSSVR泥 石流灾害模型,输出泥石流发生的预测结果。
本发明的其他特点还在于,
步骤1中对获取的初始泥石流灾害发生影响因子通过PCA进行降维的 具体过程如下:
步骤1.1,设获取到的样本数据为n个,每个样本中含有a个初始影响 因子,其中,a1为日降雨量(mm)、a2为次声(Hz)、a3为泥位(mA)、a4 为土壤含水率(%)、a5为孔隙水压力(kPa)、a6为坡度(°)、a7为相对 高差(m);则每个样本包含m维的矩阵如式(1)所示:
Figure BDA0001944606020000031
式中,xij(i=1,2,…,n;j=1,2,…,a)代表每个样本数据;
步骤1.2,利用PCA法进行数据降维;
将样本矩阵X进行标准化处理,设标准化后的矩阵为Z且样本数据为zij, 样本标准化如式2所示:
Figure BDA0001944606020000032
式中,
Figure BDA0001944606020000033
为初始影响因子数据的均值;sj为初始影响因子数据的方差; 其表达式分别如式(3)和式(4)所示:
Figure BDA0001944606020000041
Figure BDA0001944606020000042
然后,计算标准化后的矩阵Z的相关系数矩阵R(rij=rji),如式(5)所 示:
Figure BDA0001944606020000043
其中,rij为初始影响因子i与初始影响因子j的相关系数,表达式如式 (6)所示:
Figure BDA0001944606020000044
根据特征方程计算矩阵R的特征值λi(i=1,2,…,a),λ1≥λ2≥…≥λa与 特征向量μi,其中,特征方程的表达式如式(7)所示:
(λE-R)μ=0   (7)
根据计算出的特征值λi(i=1,2,…,a)计算主成分影响因子,定义累计贡 献率≥85%的标准,筛选出的b(b<a)个主成分因子:
由特征值计算出的个体贡献率表达式如式(8)所示:
Figure BDA0001944606020000045
其中,Ti代表每个主成分的个体贡献度;a为初始影响因子;
累计贡献率的表达式如式(9)所示:
Figure BDA0001944606020000051
其中,T代表每个主成分的累计贡献度;b为选取的主成分影响因子,a 为初始影响因子;
Figure BDA0001944606020000052
为初始因子总特征值;
Figure BDA0001944606020000053
为主成分因子总特征值;
因此,利用筛选出的主成分影响因子取代原有的初始影响因子,并根据 主成分表达式Y计算出新样本数据,主成分表达式Y如式(10)所示:
Figure BDA0001944606020000054
其中,Yd代表主成分重构的新样本数据输出结果;λmn代表成分矩阵中 的各维数特征值。
步骤2的具体过程如下:
步骤2.1,将式(10)中已重构的主成分灾害影响因子数据按照训练集: 测试集=6:1的比例进行分配,将其作为混合核函数LSSVR泥石流预测模型 的输入部分;
步骤2.2,将步骤2.1中已给定的训练集作为模型输入,训练集的表达式 如式(11)所示:
T={(x1,y1),…(xk,yk)}   (11)
式中,xi∈Rn;yi∈R;i=1,…,k,k为样本总数;
将给定的训练集作非线性映射φ:Rn→F,n为数据维数,构造出 LSSVR函数的表达式如式(12)所示:
y=f(x)=wTφ(x)+b   (12)
其中,w和b均为结构风险化最小化模型参数,且w代表空间F的权向 量,b∈R代表偏差量;f(x)为被估计函数;
在确定决策参数w、b时,求解问题如式(13)所示:
Figure BDA0001944606020000061
s.t.yi=wTφ(xi)+b+ξi
式中,ξk∈R为松弛因子,γ为惩罚参数;
根据拉格朗日函数与非线性规则优化条件得出LSSVR的预测表达式如 式(14)所示:
Figure BDA0001944606020000062
其中,不为零的元素αi所对应的样本(xi,yi)为支持向量;K(xi,xj)为 核函数;
核函数一般分为全局核函数与局部核函数,将全局核函数与局部核函数 相结合,其组合表达式如式(15)所示:
Kmix=uKGlobal+(1-u)KLocal   (15)
其中,u∈[0,1]为组合权重系数;当u→1时,全局核函数产生较大影 响作用;当u→0时,局部核函数产生较大影响作用;Kmix为混合核函数表 达式;KGlobal为全局核函数表达式;KLocal为局部核函数表达式;
拟选取的全局核函数为多项式核函数,局部核函数为径向基核函数,因 此,构造的混合核函数如式(16)所示:
Figure BDA0001944606020000071
式中,Kmix为混合核函数表达式;KRBF为径向基核函数表达式;Kpoly为 多项式核函数表达式;γ为可调超参数,σ为RBF核参数;q为多项式阶数; u为组合权重系数。
步骤3的具体过程如下:
步骤3.1,针对混合核函数LSSVR模型式(16)中需要优化的四个参数: 可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u;设置鲸鱼 空间位置维数D=4,鱼种群规模S=40和最大迭代次数为Tmax=200;
步骤3.2,赋予每条鲸鱼随机位置,根据适应度函数评价处于最优的个 体位置,定义最优个体位置为X*,其中适应度函数MSE的表达式如式(17) 所示:
Figure BDA0001944606020000072
步骤3.3,若当前的迭代次数小于最大迭代次数,更新优化算法结构中 的参数:系数向量
Figure BDA0001944606020000073
Figure BDA0001944606020000074
系数分量
Figure BDA0001944606020000075
随机数l以及收缩包围机制概率p;
各表达式如下所示:
Figure BDA0001944606020000076
Figure BDA0001944606020000077
Figure BDA0001944606020000078
其中,
Figure BDA0001944606020000079
为系数向量;系数分量
Figure BDA00019446060200000710
在整个过程中自2到0呈线性下降; 
Figure BDA00019446060200000711
为[-1,1]区间的随机数;
Figure BDA00019446060200000712
代表鲸鱼螺旋式捕捉猎物的更新位置; 
Figure BDA00019446060200000713
为个体随机位置,t为当前迭代的次数;
式中,
Figure BDA0001944606020000082
代表鲸鱼螺旋式捕捉猎物的更新位置;b为定义螺旋形状 的常数;随机数l∈[-1,1];
Figure BDA0001944606020000083
为当前最佳位置,
Figure BDA0001944606020000084
为第i条鲸鱼与猎物 之间的距离;
步骤3.4,产生判断机制:当p<0.5时,若则对应式(21)中的 更新个体位置,若则对应式(20)中的 更新个体位置;当p≥0.5时,则对应式(21) 中的更新个体位置;
步骤3.5,根据适应度函数(17)得出每个个体适应度,更新最佳位置
Figure BDA00019446060200000810
根据每次迭代不断更新最佳位置,如果达到最大迭代,则输出最佳位置,其 坐标为模型需要优化的参数[γ,σ,q,u];否则,返回步骤3.3依次执行步骤 3.3至步骤3.5循环过程,直至满足要求。
步骤4的具体过程如下:
将步骤3.5得到的可调超参数γ、RBF核参数σ、多项式阶数q和组合 权重系数u带入到式(16)中,重构混合核函数LSSVR泥石流灾害模型, 并输入式(10)中已重构数据中的测试样本,输出泥石流发生概率值,将概 率与泥石流预警等级相对应来判定泥石流危险度,其中,泥石流预警等级共 分为四个预警等级,分别是常规级、预测级、预警级、警报级,完成预测预 报。
本发明的有益效果是,基于PCA与混合核函数LSSVR的泥石流预测方 法,解决了当前泥石流灾害发生受多重因素影响而导致的预测维数灾难,以 及最小二乘支持向量回归模型中因选取单核函数而导致的模型训练性能部 分缺陷、精确度低的问题。本发明的方法具有以下有益效果:
(1)通过建立泥石流监测预警系统,实时获取泥石流发生影响因子;
(2)采用PCA法将泥石流7维初始影响因子降维至3维,大大降低了 模型结构的复杂性,防止维数灾难;
(3)将WOA优化混合核核函数LSSVR模型运用至泥石流灾害预测中, 引用混合核函数机制来平衡模型学习能力与泛化能力,提升精确度,构建最 优参数模型来预测泥石流发生概率。
附图说明
图1是本发明的基于PCA与混合核函数LSSVR的泥石流预测方法流程 图;
图2是本发明的基于PCA与混合核函数LSSVR的泥石流预测方法使用 的泥石流监测预警系统结构示意图;
图3是本发明的基于PCA与混合核函数LSSVR的泥石流预测方法使用 的仪器监测管理模块的平台显示图;
图4是本发明的基于PCA与混合核函数LSSVR的泥石流预测方法的所 使用的无限测量柱布设图;
图5是本发明的实施例中的PCA提取变量图;
图6是本发明的实施例中的概率预测图与实际概率对比图;
图7是本发明的实施例中的预测等级与实际预警等级对比图。
图中,1.泥石流遥测终端,2.监测总站,3.客户端,4.仪器监测管理模块, 5.视频监控管理模块,6.应急管理模块,7.爆闪灯,8.模型管理模块,9.系统 管理模块,10.地质灾害管理模块,11.雨量传感器,12.土壤墒情传感器,13. 泥位传感器,14.孔隙水压力传感器,15.次声传感器,16.倾角传感器,17. 无线测量柱。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明的基于PCA与混合核函数LSSVR的泥石流预测方法,如图1所 示,具体包括如下步骤:
步骤1,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因 子,并且通过PCA将获取的初始影响因子进行降维;
步骤1的泥石流监测预警系统,其结构示意图如图2所示,包括泥石流 遥测终端1、监测总站2和客户端3,泥石流遥测终端1安装在监测区域现 场附近,通过无线通信方式上传数据给监测总站2,监测总站2通过无线通 信方式上传数据至客户端3;
泥石流遥测终端1包括仪器监测管理模块4、视频监控管理模块5和应 急管理模块6;仪器监测管理模块4包括安装在监测坡体上多个传感器,传 感器通过无线通信方式连接监测总站2;视频监控管理模块5通过无线通信 方式连接监测总站2;应急管理模块6包括设置泥石流遥测终端1外部的爆 闪灯7。
监测总站2包括模型管理模块8,用于接收泥石流遥测终端1采集的坡 体实时数据,通过对数据处理做出预测判断,并通过无线通信的方式上传给 客户端3和应急管理模块6的爆闪灯7。
监测总站2还包括系统管理模块9和地质灾害管理模块10,系统管理模 块9内部包括权限管理设置模块、值班人员管理模块和信息小助手模块。
地质灾害管理模块10是管理在研究区内的历史地质灾害发生坐标位置 与灾害范围内所能够产生威胁的房区、施工、公路等数据,它的主要功能包 括地质灾害坐标位置数据、地质灾害区域负责人员数据、应急预案与安全撤 离路线管理、查询统计信息与研究区GIS遥感地图显示等模块;
其中,仪器监测管理模块10的平台显示如图3所示,仪器监测管理模 块10的传感器主要包含雨量传感器11、土壤墒情传感器12、泥位传感器13、 孔隙水压力传感器14、次声传感器15以及倾角传感器16;其中,雨量传感 器11型号为TH-RSA2000,主要采集点累计降雨量值,安装于坡体或地平 面上,应先制作水泥台,将雨量传感器11垂直安置在水泥台上;土壤墒情 传感器12的型号为TDR-6,主要采集土壤内的湿度状态值,采取埋地测量 法,根据测量需求垂直挖大约8cm或13cm或18cm的土坑,将传感器钢针 水平插入土坑内,然后将坑内土壤填平;泥位传感器13主要利用电磁波雷 达测距原理,在泥石流的流通渠道上方加装电磁波雷达物位计对泥水位进行 监测;孔隙水压力传感器14为振弦式孔隙水压力计,主要采集土壤内的孔 隙(渗透)水压力,主要埋设于坡体土壤中;次声传感器15主要采集山体泥石流的次生信息,提取信号的时间一频率一能量的分布特征,应先在坡体 山脚下较开阔地制作水泥台,次声传感器15垂直安置于水泥台上;倾角传 感器16为双轴数字输出型传感器,主要采集坡体的倾斜角度,安装于坡面 上,传感器与被测面完全紧靠,且传感器底边线与被测物体轴线不存在夹角; 另外,本发明在使用各类地埋式传感器时可安装无线测量柱布置策略,图4 为无线测量柱在土壤中的布设事例图,无线测量柱的安装深度原则上与当地 研究区监测点的基岩深度保持一致,根据研究位置的地质与水文情况来布设 各类传感器数量,它将土壤墒情传感器和孔隙水压力传感器的信息集成于无 线传感器节点,以无线通信方式将信息上传至模型管理模块8中。
视频监控管理模块6是在研究区现场所安装的视频监控设备,能够对山 体泥石流等地质灾害发生情况与山谷内河流流量进行实时监控,以便全天记 录灾害点的位置与河水径流状况。
模型管理模块8的功能是将所收集到的影响因子信息数据进行储存,通 过对接收到的数据进行分析与预测判断,如果达到预警要求则及时上传预警 信息给客户端3或下发报警提示给应急管理模块8;
应急管理模块6的功能为预警信息发布与地质灾害信息查询。预警信息 发布采用现场爆闪灯7,若模型管理模块8判定为报警模式,则下发的报警 信息被应急管理模块6所接收,现场安装的爆闪灯7点亮,爆闪灯7主要安 装于临近公路、施工、现场监测站或人员活动范围内较易观测的地点,以告 知管理人员警情。
系统管理模块9包括权限管理设置、值班人员管理、信息小助手。权限 管理设置主要针对所有管理模块的信息等进行统一管理,设置不同用户可取 得的权限与相对应的工作领域(范围)等;值班人员管理主要显示当前值班 人员的基本信息;信息小助手供客户端获取因特网当前研究区的相关信息与 资讯。
客户端3可以为手机或PC客户端,模型管理模块8将做出的预警信息 能够直接通过无线通信的方式传送到客户端,及时的让人们了解到监测区域 的泥石流灾害,并且及时做出应对策略;并且检测系统管理模块9中的信息 小助手能够实时推送监测区域的相关信息和资讯到客户端,以便人们掌握研 究的实时信息,提早做到防范措施。
步骤1中对获取的初始泥石流灾害发生影响因子通过PCA进行降维的 具体过程如下:
步骤1.1,设获取到的样本数据为n个,每个样本中含有a个初始影响 因子,其中,a1为日降雨量(mm)、a2为次声(Hz)、a3为泥位(mA)、 a4为土壤含水率(%)、a5为孔隙水压力(kPa)、a6为坡度(°)、a7为相 对高差(m);则每个样本包含m维的矩阵如式(1)所示:
Figure BDA0001944606020000131
式中,xij(i=1,2,…,n;j=1,2,…,a)代表每个样本数据;
步骤1.2,利用PCA法进行数据降维;
将样本矩阵X进行标准化处理,设标准化后的矩阵为Z且样本数据为zij, 样本标准化如式2所示:
Figure BDA0001944606020000132
式中,
Figure BDA0001944606020000133
为初始影响因子数据的均值;sj为初始影响因子数据的方差; 其表达式分别如式(3)和式(4)所示:
Figure BDA0001944606020000134
Figure BDA0001944606020000135
然后,计算标准化后的矩阵Z的相关系数矩阵R(rij=rji),如式(5)所 示:
Figure BDA0001944606020000136
其中,rij为初始影响因子i与初始影响因子j的相关系数,表达式如式 6所示:
Figure BDA0001944606020000141
根据特征方程计算矩阵R的特征值λi(i=1,2,…,a),λ1≥λ2≥…≥λa与 特征向量μi,其中,特征方程的表达式如式7所示:
(λE-R)μ=0   (7)
根据计算出的特征值λi(i=1,2,…,a)计算主成分影响因子,定义累计贡 献率≥85%的标准,筛选出的b(b<a)个主成分因子:
由特征值计算出的个体贡献率表达式如式(8)所示:
Figure BDA0001944606020000142
其中,Ti代表每个主成分的个体贡献度;a为初始影响因子;
累计贡献率的表达式如式(9)所示:
Figure BDA0001944606020000143
其中,T代表每个主成分的累计贡献度;b为选取的主成分影响因子,a 为初始影响因子;
Figure BDA0001944606020000144
为初始因子总特征值;
Figure BDA0001944606020000145
为主成分因子总特征值。
因此,利用筛选出的主成分影响因子取代原有的初始影响因子,并根据 主成分表达式Y计算出新样本数据,主成分表达式Y如式(10)所示:
Figure BDA0001944606020000151
其中,Yd代表主成分重构的新样本数据输出结果;λmn代表成分矩阵中 的各维数特征值。
步骤2,利用步骤1降维后的初始影响因子构建混合核函数LSSVR泥 石流灾害模型;
步骤2的具体过程如下:
步骤2.1,将式(10)中已重构的主成分灾害影响因子数据按照训练集: 测试集=6:1的比例进行分配,将其作为混合核函数LSSVR泥石流预测模型 的输入部分;
步骤2.2,将步骤2.1中已给定的训练集作为模型输入,训练集的表达式 如式(11)所示:
T={(x1,y1),…(xk,yk)}   (11)
式中,xi∈Rn;yi∈R;i=1,…,k,k为样本总数;
将给定的训练集作非线性映射φ:Rn→F,n为数据维数,构造出 LSSVR函数的表达式如式12所示:
y=f(x)=wTφ(x)+b   (12)
其中,w和b均为结构风险化最小化模型参数,且w代表空间F的权向 量,b∈R代表偏差量;f(x)为被估计函数;
在确定决策参数w、b时,求解问题如式13所示:
Figure BDA0001944606020000152
s.t.yi=wTφ(xi)+b+ξi
式中,ξk∈R为松弛因子,γ为惩罚参数;
根据拉格朗日函数与非线性规则优化条件得出LSSVR的预测表达式如 式(14)所示:
Figure BDA0001944606020000161
其中,不为零的元素αi所对应的样本(xi,yi)为支持向量;K(xi,xj)为 核函数;
核函数一般分为全局核函数与局部核函数,不同类型的核函数存在不同 优点。全局核函数随着与测试点距离的增加而对核函数影响也随之增加的特 性,它的泛化能力较强,但学习能力较弱;局部核函数随着与测试点距离的 减小而对核函数影响也随之减少的特性,它的学习能力较强,但泛化能力较 弱。
由此可看出,全局核函数与局部核函数相结合能够实现优势互补的效 果,将全局核函数与局部核函数相结合,其组合表达式如式15所示:
Kmix=uKGlobal+(1-u)KLocal   (15)
其中,u∈[0,1]为组合权重系数;当u→1时,全局核函数产生较大影 响作用;当u→0时,局部核函数产生较大影响作用;Kmix为混合核函数表 达式;KGlobal为全局核函数表达式;KLocal为局部核函数表达式。
拟选取的全局核函数为多项式核函数,局部核函数为径向基核函数,因 此,构造的混合核函数如式16所示:
Figure BDA0001944606020000162
式中,Kmix为混合核函数表达式;KRBF为径向基核函数表达式;Kpoly为 多项式核函数表达式;γ为可调超参数,σ为RBF核参数;q为多项式阶数; u为组合权重系数。
步骤3,运用鲸鱼算法优化步骤2建立的混合核函数LSSVR泥石流灾 害模型,得到优化后的组合模型参数;
步骤3的具体过程如下:
步骤3.1,针对混合核函数LSSVR模型式(16)中需要优化的四个参数: 可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u;设置鲸鱼 空间位置维数D=4,鱼种群规模S=40和最大迭代次数为Tmax=200;
步骤3.2,赋予每条鲸鱼随机位置,根据适应度函数评价处于最优的个 体位置,定义最优个体位置为X*,其中适应度函数MSE的表达式如式(17) 所示:
Figure BDA0001944606020000171
步骤3.3,若当前的迭代次数小于最大迭代次数,更新优化算法结构中 的参数:系数向量
Figure BDA0001944606020000172
Figure BDA0001944606020000173
系数分量
Figure BDA0001944606020000174
随机数l以及收缩包围机制概率p;
各表达式如下所示:
Figure BDA0001944606020000175
Figure BDA0001944606020000176
Figure BDA0001944606020000177
其中,
Figure BDA0001944606020000178
为系数向量;系数分量
Figure BDA0001944606020000179
在整个过程中自2到0呈线性下降; 
Figure BDA00019446060200001710
为[-1,1]区间的随机数;
Figure BDA00019446060200001711
代表鲸鱼螺旋式捕捉猎物的更新位置; 
Figure BDA00019446060200001712
为个体随机位置,t为当前迭代的次数;
式中,
Figure BDA0001944606020000182
代表鲸鱼螺旋式捕捉猎物的更新位置;b为定义螺旋形状 的常数;随机数l∈[-1,1];
Figure BDA0001944606020000183
为当前最佳位置,
Figure BDA0001944606020000184
为第i条鲸鱼与猎物 之间的距离;
步骤3.4,产生判断机制:当p<0.5时,若则对应式(21)中的 更新个体位置,若则对应式(20)中的 更新个体位置;当p≥0.5时,则对应式(21) 中的更新个体位置;
步骤3.5,根据适应度函数式(17)得出每个个体适应度,更新最佳位 置
Figure BDA00019446060200001810
根据每次迭代不断更新最佳位置,如果达到最大迭代,则输出最佳位 置,其坐标为模型需要优化的参数[γ,σ,q,u];否则,返回步骤3.3依次执行 步骤3.3至步骤3.5循环过程,直至满足要求。
步骤4,利用步骤3得到的组合模型参数,重构混合核函数LSSVR泥 石流灾害模型,输出泥石流发生的预测结果;
步骤4的具体过程如下:
将步骤3.5得到的可调超参数γ、RBF核参数σ、多项式阶数q和组合 权重系数u带入到式(16)中,重构混合核函数LSSVR泥石流灾害模型, 并输入式(10)中已重构数据中的测试样本,输出泥石流发生概率值,将概 率与泥石流预警等级相对应来判定泥石流危险度,其中,泥石流预警等级共 分为四个预警等级,分别是常规级、预测级、预警级、警报级,如表1所示, 完成预测预报。
表1分类等级划分图
Figure BDA0001944606020000191
实施例
以陕西省安康市紫阳县城关镇太平村磨子沟监测数据进行试验验证,分 别为a1:日降雨量(mm)、a2:次声(Hz)、a3:泥位(mA)、a4:土壤含 水率(%)、a5:孔隙水压力(KPa)、a6:坡度(°)、a7:相对高差(m) 7个参数作为初始评定影响因子,以泥石流可能发生的概率作为预测对象, 建立泥石流发生概率与影响因子之间的预测模型。将90组原始数据利用主成分分析法进行主成分影响因子特征筛选。其经PCA提取后的变量如图5 所示,与核主成分矩阵结果如表2所示。
由图5可知,前3个成分的累计贡献率分别为47.9%、78.2%、85.6%, 根据主成分的定义选取标准,前3个主成分的累计贡献率已大于所定义主成 分选取标准80%,能够较为全面的反应初始7种影响因子所反映的信息。因 此,将前3种影响因子作为新的变量取代初始影响因子作为混合核函数 LSSVR泥石流预测模型的新影响因子。通过PCA法来降维,模型维度由初 始的7维至3维,大大简化了模型数据结构的复杂度。
表2核主成分矩阵
Figure BDA0001944606020000201
根据表2中的主成分矩阵可得,3种主成分的表达式为:
Y1=0.043a1+0.144a2-0.119a3-0.185a4+0.433a5+0.365a6+0.426a7   (22)
Y2=0.505a1+0.568a2-0.068a3-0.126a4+0.158a5+0.029a6+0.002a7   (23)
Y3=-0.055a1-0.144a2+0.550a3+0.616a4-0.080a5+0.016a6-0.209a7   (24)
将经PCA得到的90组重构主成分影响因子数据,按照训练集:测试集 =6:1的比例进行分配,设置编号前1~75组数据为训练集,用于建立预测 模型;76~90组数据为测试集,测试集的数量共15个用于验证预测模型准确 度。实验中采用混合核函数LSSVR作为泥石流概率预测模型,利用WOA 算法对其进行最佳参数寻优。得出的泥石流实际发生概率与模型预测的对比 图如图6所示;并根据预测概率对应相应预警等级,由图7的模型预测出的结果与实际预警等级对比可得,本发明提出的混合核函数LSSVR模型精确 度达到93.3%,体现出较好的预测性能,具有相对可靠性。

Claims (3)

1.基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,具体包括如下步骤:
步骤1,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因子,并且通过PCA将获取的初始影响因子进行降维,具体过程如下:
步骤1.1,设获取到的样本数据为n个,每个样本中含有a个初始影响因子,其中,a1为日降雨量,单位为mm、a2为次声,单位为Hz、a3为泥位,单位为mA、a4为土壤含水率,单位为%、a5为孔隙水压力,单位为kPa、a6为坡度,单位为°、a7为相对高差,单位为m;则每个样本包含m维的矩阵如式(1)所示:
Figure FDA0004123664950000011
式中,xij代表每个样本数据,其中,i=1,2,…,n;j=1,2,…,a;
步骤1.2,利用PCA法进行数据降维;
将样本矩阵X进行标准化处理,设标准化后的矩阵为Z且样本数据为zij,样本标准化如式(2)所示:
Figure FDA0004123664950000012
式中,
Figure FDA0004123664950000013
为初始影响因子数据的均值;sj为初始影响因子数据的方差;其表达式分别如式(3)和式(4)所示:
Figure FDA0004123664950000014
Figure FDA0004123664950000021
然后,计算标准化后的矩阵Z的相关系数矩阵R,其中,rij=rji,如式(5)所示:
Figure FDA0004123664950000022
其中,rij为初始影响因子i与初始影响因子j的相关系数,表达式如式6所示:
Figure FDA0004123664950000023
根据特征方程计算矩阵R的特征值λi,i=1,2,…,a,λ1≥λ2≥…≥λa与特征向量μi,其中,特征方程的表达式如式7所示:
Figure FDA0004123664950000024
根据计算出的特征值λi计算主成分影响因子,其中,i=1,2,...,a,定义累计贡献率≥85%的标准,筛选出的b个主成分因子,其中,b<a;
由特征值计算出的个体贡献率表达式如式(8)所示:
Figure FDA0004123664950000025
其中,Ti代表每个主成分的个体贡献度;a为初始影响因子;
累计贡献率的表达式如式(9)所示:
Figure FDA0004123664950000031
其中,T代表每个主成分的累计贡献度;b为选取的主成分影响因子,a为初始影响因子;
Figure FDA0004123664950000032
为初始因子总特征值;
Figure FDA0004123664950000033
为主成分因子总特征值;
因此,利用筛选出的主成分影响因子取代原有的初始影响因子,并根据主成分表达式Y计算出新样本数据,主成分表达式Y如式(10)所示:
Figure FDA0004123664950000034
其中,Yd代表主成分重构的新样本数据输出结果;λmn代表成分矩阵中的各维数特征值;
步骤2,利用步骤1降维后的初始影响因子构建混合核函数LSSVR泥石流灾害模型,具体过程如下:
步骤2.1,将式(10)中已重构的主成分灾害影响因子数据按照训练集:测试集=6:1的比例进行分配,将其作为混合核函数LSSVR泥石流预测模型的输入部分;
步骤2.2,将步骤2.1中已给定的训练集作为模型输入,训练集的表达式如式(11)所示:
T={(x1,y1),…(xk,yk)}    (11)
式中,xi∈Rn;yi∈R;i=1,…,k,k为样本总数;
将给定的训练集作非线性映射φ:Rn→F,n为数据维数,构造出LSSVR函数的表达式如式(12)所示:
y=f(x)=wTφ(x)+b    (12)
其中,w和b均为结构风险化最小化模型参数,且w代表空间F的权向量,b∈R代表偏差量;f(x)为被估计函数;
在确定决策参数w、b时,求解问题如式(13)所示:
Figure FDA0004123664950000041
式中,ξk∈R为松弛因子,γ为惩罚参数;
根据拉格朗日函数与非线性规则优化条件得出LSSVR的预测表达式如式(14)所示:
Figure FDA0004123664950000042
其中,不为零的元素αi所对应的样本(xi,yi)为支持向量;K(xi,xj)为核函数;
核函数一般分为全局核函数与局部核函数,将全局核函数与局部核函数相结合,其组合表达式如式(15)所示:
Kmix=uKGlobal+(1-u)KLocal    (15)
其中,u∈[0,1]为组合权重系数;当u→1时,全局核函数产生较大影响作用;当u→0时,局部核函数产生较大影响作用;Kmix为混合核函数表达式;KGlobal为全局核函数表达式;KLocal为局部核函数表达式;
拟选取的全局核函数为多项式核函数,局部核函数为径向基核函数,因此,构造的混合核函数如式(16)所示:
Figure FDA0004123664950000051
式中,Kmix为混合核函数表达式;KRBF为径向基核函数表达式;Kpoly为多项式核函数表达式;γ为可调超参数,σ为RBF核参数;q为多项式阶数;u为组合权重系数;
步骤3,运用鲸鱼算法优化步骤2建立的混合核函数LSSVR泥石流灾害模型,得到优化后的组合模型参数;
步骤4,利用步骤3得到的组合模型参数,重构混合核函数LSSVR泥石流灾害模型,输出泥石流发生的预测结果。
2.如权利要求1所述的基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,所述步骤3的具体过程如下:
步骤3.1,针对混合核函数LSSVR模型式(16)中需要优化的四个参数:可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u;设置鲸鱼空间位置维数D=4,鱼种群规模S=40和最大迭代次数为Tmax=200;
步骤3.2,赋予每条鲸鱼随机位置,根据适应度函数评价处于最优的个体位置,定义最优个体位置为X*,其中适应度函数MSE的表达式如式(17)所示:
Figure FDA0004123664950000052
步骤3.3,若当前的迭代次数小于最大迭代次数,更新优化算法结构中的参数:系数向量
Figure FDA0004123664950000053
Figure FDA0004123664950000054
系数分量
Figure FDA0004123664950000055
随机数l以及收缩包围机制概率p;
各表达式如下所示:
Figure FDA0004123664950000056
Figure FDA0004123664950000061
Figure FDA0004123664950000062
其中,
Figure FDA0004123664950000063
为系数向量;系数分量
Figure FDA0004123664950000064
在整个过程中自2到0呈线性下降;
Figure FDA0004123664950000065
为[-1,1]区间的随机数;
Figure FDA0004123664950000066
代表鲸鱼螺旋式捕捉猎物的更新位置;
Figure FDA0004123664950000067
为个体随机位置,t为当前迭代的次数;
Figure FDA0004123664950000068
式中,
Figure FDA0004123664950000069
代表鲸鱼螺旋式捕捉猎物的更新位置;b为定义螺旋形状的常数;随机数l∈[-1,1];
Figure FDA00041236649500000610
为当前最佳位置,
Figure FDA00041236649500000611
为第i条鲸鱼与猎物之间的距离;
步骤3.4,产生判断机制:当p<0.5时,若
Figure FDA00041236649500000612
则对应式(21)中的
Figure FDA00041236649500000613
更新个体位置,若
Figure FDA00041236649500000614
则对应式(20)中的
Figure FDA00041236649500000615
更新个体位置;当p≥0.5时,则对应式(21)中的
Figure FDA00041236649500000616
更新个体位置;
步骤3.5,根据适应度函数(17)得出每个个体适应度,更新最佳位置
Figure FDA00041236649500000617
根据每次迭代不断更新最佳位置,如果达到最大迭代,则输出最佳位置,其坐标为模型需要优化的参数[γ,σ,q,u];否则,返回步骤3.3依次执行步骤3.3至步骤3.5循环过程,直至满足要求。
3.如权利要求2所述的基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,所述步骤4的具体过程如下:
将步骤3.5得到的可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u带入到式(16)中,重构混合核函数LSSVR泥石流灾害模型,并输入式(10)中已重构数据中的测试样本,输出泥石流发生概率值,将概率与泥石流预警等级相对应来判定泥石流危险度,其中,泥石流预警等级共分为四个预警等级,分别是常规级、预测级、预警级、警报级,完成预测预报。
CN201910032106.2A 2019-01-14 2019-01-14 基于pca与混合核函数lssvr的泥石流预测方法 Active CN109886456B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910032106.2A CN109886456B (zh) 2019-01-14 2019-01-14 基于pca与混合核函数lssvr的泥石流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910032106.2A CN109886456B (zh) 2019-01-14 2019-01-14 基于pca与混合核函数lssvr的泥石流预测方法

Publications (2)

Publication Number Publication Date
CN109886456A CN109886456A (zh) 2019-06-14
CN109886456B true CN109886456B (zh) 2023-04-18

Family

ID=66926000

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910032106.2A Active CN109886456B (zh) 2019-01-14 2019-01-14 基于pca与混合核函数lssvr的泥石流预测方法

Country Status (1)

Country Link
CN (1) CN109886456B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598914B (zh) * 2019-08-21 2021-12-10 武汉理工大学 一种多因素影响下矿井灾害气体浓度区间预测方法及系统
CN110568374B (zh) * 2019-09-02 2021-04-27 东北电力大学 基于考虑内外特性的锂离子电池剩余使用寿命预测方法
CN112668234B (zh) * 2020-12-07 2023-08-15 辽宁科技大学 一种转炉炼钢终点智能控制方法
CN112802307B (zh) * 2020-12-30 2023-04-28 中国地质调查局成都地质调查中心 一种用于地质勘察的地质监测预警方法及系统
CN113770570B (zh) * 2021-11-11 2022-02-08 陕西斯瑞新材料股份有限公司 一种铍材与不锈钢的薄壁件焊接工艺

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005030843A (ja) * 2003-07-10 2005-02-03 Hitachi Ltd 土砂災害予知システム、地域情報提供システム及び土砂災害予知方法
CN106650767A (zh) * 2016-09-20 2017-05-10 河海大学 基于聚类分析和实时校正的洪水预报方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104331744A (zh) * 2014-10-17 2015-02-04 中国科学院、水利部成都山地灾害与环境研究所 一种泥石流危险度评价方法
CN106815971B (zh) * 2016-12-21 2019-11-26 西安工程大学 一种基于rbf神经网络的滑坡灾害预报方法
CN108615555A (zh) * 2018-04-26 2018-10-02 山东师范大学 基于标记基因和混合核函数svm的结直肠癌预测方法和装置
CN109102884A (zh) * 2018-07-19 2018-12-28 南京邮电大学 基于混合核函数支持向量机模型的帕金森疾病诊断方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005030843A (ja) * 2003-07-10 2005-02-03 Hitachi Ltd 土砂災害予知システム、地域情報提供システム及び土砂災害予知方法
CN106650767A (zh) * 2016-09-20 2017-05-10 河海大学 基于聚类分析和实时校正的洪水预报方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于改进KPCA 与混合核函数LSSVR 的泥石流预测;李丽敏等;《信息与控制》;20190831;第48卷(第5期);第536-544页 *

Also Published As

Publication number Publication date
CN109886456A (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
CN109886456B (zh) 基于pca与混合核函数lssvr的泥石流预测方法
CN114443982B (zh) 一种大区域土壤重金属检测与时空分布特征分析方法及系统
CN106651211A (zh) 一种不同尺度区域洪水灾害风险评估的方法
Zhou et al. Impacts of building configurations on urban stormwater management at a block scale using XGBoost
CN114611778B (zh) 一种基于入库流量的水库水位预警方法及系统
CN107423857B (zh) 一种区域长期来水多目标联合概率预测方法
CN113487123A (zh) 高光谱监测与gis耦合山洪灾害动态风险评估方法
CN117037432B (zh) 基于多方法协同的风险评价地质灾害预警方法
CN209433536U (zh) 一种泥石流监测预警装置
CN109598310B (zh) 一种多因子敏感设施识别方法
CN116402951A (zh) 基于数字孪生的边坡安全管理方法及系统
CN116502748A (zh) 融合多影响因素的滑坡空间风险性预警决策机制研究方法
Zanella et al. Internet of things for hydrology: Potential and challenges
CN116050837A (zh) 一种面向尾矿库多元灾害的综合监测预警和安全评估方案
Evora et al. Combining artificial neural network models, geostatistics, and passive microwave data for snow water equivalent retrieval and mapping
CN116090696A (zh) 适用于山区铁路沿线的滑坡地质灾害风险分类预测方法
Huang et al. Landslide susceptibility evaluation using different slope units based on BP neural network
CN114935759A (zh) 基于高频地波雷达观测的波浪场缺失值填补方法及系统
Zanella et al. Sensor Networks, Data Processing, and Inference: The Hydrology Challenge
Kherde et al. Integrating Geographical Information Systems (GIS) with Hydrological Modelling—Applicability and Limitations
Kumar et al. Comparative analysis of gridded rainfall datasets over the Bagmati river basin, India
Efstratiadis et al. Hydrometeorological network for flood monitoring and modeling
Abdelhamed et al. The Ability of Hydrologic-Land Surface Models to Concurrently Simulate Permafrost and Hydrology
Fatima et al. Improved representation of soil moisture simulations through incorporation of cosmic-ray neutron count measurements in a large-scale hydrologic model
CN111767649B (zh) 一种软基地区变电站地质变形安全评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant