CN113033668A - 基于样本欧氏距离的ls-svm算法测深训练样本抽稀方法 - Google Patents

基于样本欧氏距离的ls-svm算法测深训练样本抽稀方法 Download PDF

Info

Publication number
CN113033668A
CN113033668A CN202110331002.9A CN202110331002A CN113033668A CN 113033668 A CN113033668 A CN 113033668A CN 202110331002 A CN202110331002 A CN 202110331002A CN 113033668 A CN113033668 A CN 113033668A
Authority
CN
China
Prior art keywords
sample
thinning
training sample
euclidean distance
sounding training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110331002.9A
Other languages
English (en)
Inventor
黄贤源
陆秀平
黄谟涛
徐广袖
熊雄
张博
李凯锋
王耿峰
王许
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINESE PEOPLE'S LIBERATION ARMY 92859 TROOPS
Original Assignee
CHINESE PEOPLE'S LIBERATION ARMY 92859 TROOPS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHINESE PEOPLE'S LIBERATION ARMY 92859 TROOPS filed Critical CHINESE PEOPLE'S LIBERATION ARMY 92859 TROOPS
Priority to CN202110331002.9A priority Critical patent/CN113033668A/zh
Publication of CN113033668A publication Critical patent/CN113033668A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种基于样本欧氏距离的LS‑SVM算法测深训练样本抽稀方法,包括以下技术特点:选取用于构建海底趋势面函数的测深训练样本;确定测深训练样本的样本中心,逐一计算测深训练样本到样本中心的欧氏距离;采用不同的欧氏距离对测深训练样本进行第一次和第二次抽稀,比较第一次和第二次抽稀的均方差对海底趋势面函数模型的精度指标进行判断,在保证海底趋势面函数模型精度的前提下确定欧氏距离的阈值;利用欧氏距离阈值对测深训练样本进行抽稀,调整LS‑SVM算法的组合参数构造海底趋势面函数模型。本发明不仅加快了函数模型的构建速度,而且提高了函数模型构建的合理性与准确性。

Description

基于样本欧氏距离的LS-SVM算法测深训练样本抽稀方法
技术领域
本发明属于海洋测量技术领域,涉及专门应用LS-SVM算法构造海底趋势面的方法,尤其是基于样本欧氏距离的LS-SVM算法测深训练样本抽稀方法。
背景技术
LS-SVM算法将构造海底趋势面的过程转变为求解高维空间线性最小二乘问题,与标准支持向量机相比,LS-SVM算法计算的复杂性得到简化。但是利用LS-SVM构造海底趋势面仍存在以下问题:在利用LS-SVM算法构造模型函数的过程中,选取的测深训练样本都对海底趋势面函数的构造产生影响,随着测深训练样本的不断增加,趋势面函数的构造将变得异常复杂,模型构建的计算量和存储量也相应增加,这极大地限制了LS-SVM算法的应用。
利用LS-SVM算法构造的海底趋势面合理与否取决于选取的测深训练样本及核函数是否真正反映海底地形的实际变化,现需要一种能够有效弥补选取的测深训练样本不具备稀疏性的缺陷,同时在保证函数模型精度的前提下通过调整组合参数得到模型函数的方法。
发明内容
本发明的目的在于克服现有技术的不足之处,提供一种在保证函数模型精度的前提下可有效提高海底趋势面函数的构造效率的基于样本欧氏距离的LS-SVM算法测深训练样本抽稀方法。
本发明解决技术问题所采用的技术方案是:
一种基于样本欧氏距离的LS-SVM算法测深训练样本抽稀方法,包括以下步骤:
步骤1、选取用于构建海底趋势面函数的测深训练样本。
步骤2、确定测深训练样本的样本中心,逐一计算测深训练样本到样本中心的欧氏距离。
步骤3、采用不同的欧氏距离对测深训练样本进行第一次和第二次抽稀,比较第一次和第二次抽稀的均方差对海底趋势面函数模型的精度指标进行判断,在保证海底趋势面函数模型精度的前提下确定欧氏距离的阈值。
步骤4、利用欧氏距离阈值对测深训练样本进行抽稀,调整LS-SVM算法的组合参数构造海底趋势面函数模型。
而且,所述步骤2的具体实现方法为:
分别以选取的每个测深训练样本为中心,计算其它测深训练样本到该样本中心的欧氏距离并求和,欧氏距离之和最小的样本就是样本中心,假设其坐标为(xi,yi),然后逐一计算测深训练样本(xj,yj)相对于样本中心(xi,yi)的欧氏距离
Figure BDA0002996161990000021
而且,所述步骤3的具体实现方法为:
对测深训练样本进行第一次抽稀,将第一次抽稀的测深训练样本坐标信息(xk,yk)代入表达式:
Figure BDA0002996161990000022
得到基于最优海底趋势面函数模型的预测值Lk′,与实际水深Lk进行比较,得残差值vk=Lk-Lk′,计算残差值序列的均方差
Figure BDA0002996161990000023
n是第一次抽稀后测深训练样本的样本数;
调高欧氏距离阈值,对测深训练样本进行第二次抽稀,并将抽稀后的测深训练样本坐标信息(xm,ym)代入表达式:
Figure BDA0002996161990000024
得到基于最优海底趋势面函数模型的预测值L′m,与实际水深Lm进行比较,得残差值vm=Lm-L′m,计算残差值序列的均方差
Figure BDA0002996161990000025
n′是第二次抽稀后的样本数;
取0.001作为均方差限差,当均方差限差小于0.001则海底趋势面函数模型精确指标正常,取第一次抽稀所用的欧氏距离作为阈值;当均方差限差大于0.001则海底趋势面函数模型的精度指标下降,相应提高欧氏距离阈值。
本发明的优点和积极效果是:
本发明在利用LS-SVM算法构建海底趋势面过程中,对选取的测深训练样本利用欧氏距离进行抽稀,得到具有稀疏性的LS-SVM算法,通过调整核参数得到稳健的海底趋势面模型函数,弥补了选取的测深训练样本不具备稀疏性的缺陷,不仅加快了函数模型的构建速度,而且提高了函数模型构建的合理性与准确性。
附图说明
图1为本发明的测深训练样本统计图。
具体实施方式
下面通过具体实施例对本发明作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。
在传统的利用LS-SVM算法构建海底趋势面函数的过程中,所有的训练样本点都是支持向量,均对海底趋势面的构造产生影响。
假设选取的测深训练样本为{(xi,yi),Li},(i=1,2,···,n),n为样本总数。将测深点平面坐标(xi,yi)作为LS-SVM算法的输入信息;测深值Li作为输出值,则最优趋势面模型函数的优化目标和约束条件分别为:
Figure BDA0002996161990000031
Figure BDA0002996161990000032
式中,非线性映射
Figure BDA0002996161990000033
为测深点平面坐标函数,ω为权向量,b为实常数;ξi为误差变量;C为惩罚因子。
引入拉格朗日函数F求解上式的优化问题:
Figure BDA0002996161990000034
式中,ai为Lagrange乘子,称对应于ai≠0的样本点为支持向量。根据KKT优化条件
Figure BDA0002996161990000035
得到如下的表达式:
Figure BDA0002996161990000036
从表达式(4)可以看出,拉格朗日乘子都与误差向量成正比,且在实际情况中,误差向量不为零,因此LS-SVM算法的解是非稀疏的。
定义核函数为
Figure BDA0002996161990000037
得到如下的线性方程组:
Figure BDA0002996161990000038
通过求解实常数b及拉格朗日乘子ai,则利用LS-SVM构造的海底趋势面:
Figure BDA0002996161990000041
从表达式(6)可以看出,在支持向量解非稀疏的情况下,所有的训练数据都对最终的构造海底趋势面函数起作用,增加了算法的运算量和存储空间,随着样本的不断增加,海底趋势面函数模型的构造将变得异常复杂。
本发明提出一种基于样本欧氏距离的LS-SVM算法测深训练样本抽稀方法,包括以下步骤:
步骤1、选取用于构建海底趋势面函数的测深训练样本。
步骤2、确定测深训练样本的样本中心,逐一计算测深训练样本到样本中心的欧氏距离。
在本步骤中,原则上,测深训练样本相对于样本中心应具有变化平缓的特点,因此欧氏距离
Figure BDA0002996161990000042
可反映测深训练样本对海底趋势面函数模型构建的合理程度。以选取的每个测深训练样本为样本中心,计算其它测深训练样本到该样本中心的欧氏距离并求和,欧氏距离之和最小的样本就是样本中心,假设其坐标为(xi,yi),如图1所示,然后逐一计算测深训练样本(xj,yj)相对于样本中心(xi,yi)的欧氏距离
Figure BDA0002996161990000043
由于选取的测深训练样本相对于样本中心具有变化平缓的特点,因此欧氏距离可反映测深训练样本对海底趋势面函数模型构建的重要程度。
步骤3、采用不同的欧氏距离对测深训练样本进行第一次和第二次抽稀,比较第一次和第二次抽稀的均方差对海底趋势面函数模型的精度指标进行判断,在保证海底趋势面函数模型精度的前提下确定欧氏距离的阈值。
在本步骤中,先利用欧氏距离阈值(0.8*欧氏距离)对测深训练样本进行第一次抽稀,将第一次抽稀的测深训练样本坐标信息(xk,yk)代入表达式:
Figure BDA0002996161990000044
得到基于最优海底趋势面函数模型的预测值Lk′,与实际水深Lk进行比较,得残差值vk=Lk-Lk′,计算残差值序列的均方差
Figure BDA0002996161990000045
n是第一次抽稀后测深训练样本的样本数;
调高欧氏距离阈值(0.7*欧氏距离)对测深训练样本进行第二次抽稀,并将抽稀后的测深训练样本坐标信息(xm,ym)代入表达式:
Figure BDA0002996161990000051
得到基于最优海底趋势面函数模型的预测值L′m,与实际水深Lm进行比较,得残差值vm=Lm-L′m,计算残差值序列的均方差
Figure BDA0002996161990000052
n′是第二次抽稀后的样本数;
取0.001作为均方差限差,当均方差限差小于0.001则海底趋势面函数模型精确指标正常,取第一次抽稀所用的欧氏距离作为阈值(0.8*欧氏距离);当均方差限差大于0.001则海底趋势面函数模型的精度指标下降,相应提高欧氏距离阈值,欧氏距离阈值能够保证海底趋势面构造的合理性。
步骤4、利用欧氏距离阈值对测深训练样本进行抽稀,调整LS-SVM算法的组合参数构造海底趋势面函数模型。
以上所述的仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (3)

1.一种基于样本欧氏距离的LS-SVM算法测深训练样本抽稀方法,其特征在于:包括以下步骤:
步骤1、选取用于构建海底趋势面函数的测深训练样本;
步骤2、确定测深训练样本的样本中心,逐一计算测深训练样本到样本中心的欧氏距离;
步骤3、采用不同的欧氏距离对测深训练样本进行第一次和第二次抽稀,比较第一次和第二次抽稀的均方差对海底趋势面函数模型的精度指标进行判断,在保证海底趋势面函数模型精度的前提下确定欧氏距离的阈值;
步骤4、利用欧氏距离阈值对测深训练样本进行抽稀,调整LS-SVM算法的组合参数构造海底趋势面函数模型。
2.根据权利要求1所述的基于样本欧氏距离的LS-SVM算法测深训练样本抽稀方法,其特征在于:所述步骤2的具体实现方法为:
分别以选取的每个测深训练样本为样本中心,计算其它测深训练样本到该样本中心的欧氏距离并求和,欧氏距离之和最小的样本就是样本中心,假设其坐标为(xi,yi),然后逐一计算测深训练样本(xj,yj)相对于样本中心(xi,yi)的欧氏距离
Figure FDA0002996161980000011
3.根据权利要求1所述的基于样本欧氏距离的LS-SVM算法测深训练样本抽稀方法,其特征在于:所述步骤3的具体实现方法为:
对测深训练样本进行第一次抽稀,将第一次抽稀的测深训练样本坐标信息(xk,yk)代入表达式:
Figure FDA0002996161980000012
得到基于最优海底趋势面函数模型的预测值L′k,与实际水深Lk进行比较,得残差值vk=Lk-L′k,计算残差值序列的均方差
Figure FDA0002996161980000013
n是第一次抽稀后测深训练样本的样本数;
调高欧氏距离阈值,对测深训练样本进行第二次抽稀,并将抽稀后的测深训练样本坐标信息(xm,ym)代入表达式:
Figure FDA0002996161980000014
得到基于最优海底趋势面函数模型的预测值L′m,与实际水深Lm进行比较,得残差值vm=Lm-L′m,计算残差值序列的均方差
Figure FDA0002996161980000021
n′是第二次抽稀后的样本数;
取0.001作为均方差限差,当均方差限差小于0.001则海底趋势面函数模型精确指标正常,取第一次抽稀所用的欧氏距离作为阈值;当均方差限差大于0.001则海底趋势面函数模型的精度指标下降,相应提高欧氏距离阈值。
CN202110331002.9A 2021-03-29 2021-03-29 基于样本欧氏距离的ls-svm算法测深训练样本抽稀方法 Pending CN113033668A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110331002.9A CN113033668A (zh) 2021-03-29 2021-03-29 基于样本欧氏距离的ls-svm算法测深训练样本抽稀方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110331002.9A CN113033668A (zh) 2021-03-29 2021-03-29 基于样本欧氏距离的ls-svm算法测深训练样本抽稀方法

Publications (1)

Publication Number Publication Date
CN113033668A true CN113033668A (zh) 2021-06-25

Family

ID=76473321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110331002.9A Pending CN113033668A (zh) 2021-03-29 2021-03-29 基于样本欧氏距离的ls-svm算法测深训练样本抽稀方法

Country Status (1)

Country Link
CN (1) CN113033668A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901964A (zh) * 2021-12-07 2022-01-07 北京惠朗时代科技有限公司 一种用于智能公司管理的员工面部兴奋度检测方法及系统
CN114019519A (zh) * 2022-01-05 2022-02-08 视丰达科技(深圳)有限公司 一种水准测距探鱼器的轨迹记录方法及其设备
CN115099370A (zh) * 2022-08-23 2022-09-23 北京全应科技有限公司 面向流程型工业生产数据流的评测数据集构建方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102568009A (zh) * 2010-12-17 2012-07-11 上海博泰悦臻电子设备制造有限公司 用于电子地图的线段抽稀装置及其方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102568009A (zh) * 2010-12-17 2012-07-11 上海博泰悦臻电子设备制造有限公司 用于电子地图的线段抽稀装置及其方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
XIANYUAN HUANG 等: "Seabed modelling with a least-squares support-vector machine and sample cross-validation", 《ICE》 *
曹丛华等著: "《黄海绿潮灾害应急遥感监测与预测预警系统》", 31 August 2017 *
缪志修等: "基于机载LiDAR数据构建的DEM抽稀算法研究", 《铁道勘察》 *
赵荻能 等: "声速剖面精简运算的改进D-P算法及其评估", 《测绘学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901964A (zh) * 2021-12-07 2022-01-07 北京惠朗时代科技有限公司 一种用于智能公司管理的员工面部兴奋度检测方法及系统
CN114019519A (zh) * 2022-01-05 2022-02-08 视丰达科技(深圳)有限公司 一种水准测距探鱼器的轨迹记录方法及其设备
CN115099370A (zh) * 2022-08-23 2022-09-23 北京全应科技有限公司 面向流程型工业生产数据流的评测数据集构建方法及系统
CN115099370B (zh) * 2022-08-23 2022-12-02 北京全应科技有限公司 面向流程型工业生产数据流的评测数据集构建方法及系统

Similar Documents

Publication Publication Date Title
CN113033668A (zh) 基于样本欧氏距离的ls-svm算法测深训练样本抽稀方法
GB2547816B (en) Actually-measured marine environment data assimilation method based on sequence recursive filtering three-dimensional variation
CN112269134B (zh) 一种基于深度学习的电池soc和soh联合估计方法
CN113505477B (zh) 基于svae-wgan的过程工业软测量数据补充方法
CN111900731B (zh) 一种基于pmu的电力系统状态估计性能评价方法
CN108074015B (zh) 一种风电功率超短期预测方法及系统
CN113762625A (zh) 一种基于图卷积网络的配电网状态评估方法和系统
CN115222949B (zh) 一种基于激光卫星数据的浅海区域光子去噪方法
CN107492120A (zh) 点云配准方法
CN117892886A (zh) 基于置信区间的船舶运动极短期概率预报方法及系统
CN109887012B (zh) 一种结合自适应搜索点集的点云配准方法
Kang et al. Point cloud smooth sampling and surface reconstruction based on moving least squares
WO2022188574A1 (zh) 一种回归任务的深度学习方法和装置
CN116029618A (zh) 一种电力系统动态安全分区评估方法及系统
CN110135621A (zh) 一种基于pso优选模型参数的短期电力负荷预测方法
CN115758911A (zh) 融合点云残差网络和考虑滑移的流场和压力场预测方法
CN114091751A (zh) 一种基于t样条的螺旋桨叶自适应测点规划方法
CN114818462A (zh) 一种基于离散不变性网格卷积算子的流场建模方法
Sun et al. Research on target classification method for dense matching point cloud based on improved random forest algorithm
CN117915456B (zh) 一种基于深度指纹度量学习的室内定位方法及系统
CN116663465B (zh) 基于深度学习的考虑mis效应的单元统计延时模型构建方法
CN108062433A (zh) 基于增材再制造点云模型的梯度曲面分层方法
CN114035529B (zh) 基于atl-bma的非线性工业过程低成本建模方法
CN117150231B (zh) 基于相关性和生成对抗网络的量测数据填补方法与系统
CN117892096B (zh) 一种基于迁移学习的小样本海洋声速剖面预报方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210625