CN110705631B - 一种基于svm的散货船舶设备状态检测方法 - Google Patents

一种基于svm的散货船舶设备状态检测方法 Download PDF

Info

Publication number
CN110705631B
CN110705631B CN201910925709.5A CN201910925709A CN110705631B CN 110705631 B CN110705631 B CN 110705631B CN 201910925709 A CN201910925709 A CN 201910925709A CN 110705631 B CN110705631 B CN 110705631B
Authority
CN
China
Prior art keywords
training data
training
svm
data samples
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910925709.5A
Other languages
English (en)
Other versions
CN110705631A (zh
Inventor
刘东航
何晓
孟浩
段懿洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSSC Systems Engineering Research Institute
Original Assignee
CSSC Systems Engineering Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSSC Systems Engineering Research Institute filed Critical CSSC Systems Engineering Research Institute
Priority to CN201910925709.5A priority Critical patent/CN110705631B/zh
Publication of CN110705631A publication Critical patent/CN110705631A/zh
Application granted granted Critical
Publication of CN110705631B publication Critical patent/CN110705631B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于SVM的散货船舶设备状态检测方法,该方法包括:S1,获取散货船舶设备状态总训练数据集,随机选取初始量的训练数据样本;S2,采用所述训练数据样本训练SVM模型得到粗糙的分离平面,找出并去除不是支持向量的训练数据样本,根据训练后SVM模型预测剩余训练数据样本量,依据边界数据决策函数值确定训练数据样本的去除或保留,以重建训练数据集;S3,从所述重建训练数据集增量选取船舶设备状态训练数据样本,转至步骤S2,逐步训练SVM模型筛选出支持向量直至最终重建训练数据样本;S4,对最终重建训练数据样本进行全局SVM训练得到分类超平面,并根据分类超平面得到船舶设备状态检测结果。本发明解决了SVM训练过程耗时长,占用内存大的问题。

Description

一种基于SVM的散货船舶设备状态检测方法
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种基于SVM的散货船舶设备状态检测方法。
背景技术
随着科技发展,对于船舶工业来说,随着网络技术和信息技术的广泛应用,船舶自动化、控制以及导航等系统正朝着分布型、网络型、智能型系统方向发展。从船舶营运角度来说,随着船舶自动化和信息化程度的提高,船上积累的数据越来越多,这些海量数据包含了船舶设备状态的所有信息,但对于船东来说,这些信息并不是直观能够理解的,而基于数据的船舶管理能够帮助船东充分收集和利用这些信息,加以提炼和分析,能为单船乃至整个船队的状态提供评估、预测、管理、决策等服务,进一步提升船舶营运的安全性和效益。由于船舶的种类、功用、船型相差极大,针对散货船舶设备状态检测,要采取相应的清洗与处理手段,以满足对于高维大量船舶数据的分析要求。
支持向量机(SVM)是在机器学习领域一个被大家熟知的算法,它主要解决分类问题和回归问题。在很多现实生活的领域中都有应用,并且展现出很好的处理效果。由于SVM是基于良好的数学公式和很高的准确率,它被用于解决各种各样的现实问题。传统的SVM在数据量大的情况下,由于内存和时间消耗太大,所以对SVM模型的优化研究时不可待。现已有一系列算法来解决该问题,主要有优化模型阶段,预处理阶段和使用并行处理方式等等。并行处理方式是解决对分布式系统中庞大数据集问题。对单体硬件要求降低,并可以海量数据读取与计算。但是这种办法,并没有解决算法无法处理大数据的问题。
发明内容
鉴于上述的分析,本发明旨在提供一种基于SVM的散货船舶设备状态检测方法,以解决现有SVM模型训练过程耗时长,占用硬件资源内存大,无法满足对高维大量船舶数据快速处理以检测散货船舶设备状态的问题。
本发明的目的主要是通过以下技术方案实现的:
本发明提供了一种基于SVM的散货船舶设备状态检测方法,包括以下步骤:S1,获取散货船舶设备状态总训练数据集,并随机选取初始量的训练数据样本;S2,采用所述训练数据样本训练SVM模型得到粗糙的分离平面,找出并去除不是支持向量的训练数据样本,再根据训练后SVM模型预测剩余训练数据样本量,依据边界数据决策函数值确定训练数据样本的去除或保留,以重建训练数据集;S3,从所述重建训练数据集中依次增量选取船舶设备状态训练数据样本,转至步骤S2,逐步训练SVM模型筛选出支持向量直至最终重建训练数据样本;S4,对最终重建训练数据样本进行全局SVM训练得到分类超平面,并根据分类超平面得到船舶设备状态检测结果。
进一步地,步骤S1中所述随机选取初始量设定为相对于总训练数据集指定百分比的阈值范围。
进一步地,所述训练数据样本训练SVM模型得到粗糙的分离平面的函数为:
Figure BDA0002218857330000031
其中,αi为拉格朗日乘数,C≥αi≥0,i=1,2,…,n,对应于αi不为0的xi为支持向量,V是支持向量的集合,D={(xi,yi)|xi∈Rn,yi∈{+1,-1}},i=1,2,…,n,D为训练数据样本集,n为训练数据样本量,b为常数,k(xi,xj)=<Φ(xi),Φ(xj)>=Φ(xi)TΦ(xj),向量Φ(x)为一个特征空间。
进一步地,所述依据边界数据决策函数值确定训练数据样本的去除或保留包括:
若边界数据决策函数值大于阈值δ,则去除所述边界数据决策函数值对应的训练数据样本;
若边界数据决策函数值小于阈值δ,则保留所述边界数据决策函数值对应的训练数据样本;
所述阈值δ的初始设置为1.5。
进一步地,所述边界数据决策函数值为随机样本点到分离平面的距离归一化值,计算公式如下:
Figure BDA0002218857330000032
其中,||ω||为f(x)的模,
Figure BDA0002218857330000033
为SVM的决策函数。
进一步地,所述SVM的决策函数的构建基于径向基核函数映射,所述径向基核函数为:
Figure BDA0002218857330000034
其中,γ为高斯核参数,xi和xj为SVM模型的输入训练数据样本。
进一步地,步骤S3中从所述重建训练数据集增量选取船舶设备状态训练数据样本的过程将每次循环的增量值设置为常数。
进一步地,对每次循环增量选取船舶设备状态训练数据样本进行训练SVM模型筛选出支持向量时,每次缩小阈值δ来确定训练数据样本的去除或保留。
进一步地,所述最终重建训练数据样本为多次增量选取后对训练数据样本进行去除或保留后所得。
进一步地,步骤S4中对最终重建训练数据样本进行全局SVM训练得到分类超平面,并根据分类超平面得到船舶设备状态检测结果包括:分类超平面不同的分类边界划分对应不同的船舶设备状态。
本发明技术方案的有益效果:本发明公开了一种基于SVM的散货船舶设备状态检测方法,将散货船舶数据筛选后,根据当前的参数状态,作为有监督训练样本数据,已知一部分数据的当前的船舶设备状态,根据设备运行机理,选取与设备状态相关的运行参数,并进行特征提取后,转化为特征值,并采用增量选取技术逐步逼近最优的分类超平面,同时为解决输入样本维度大的问题,采用SVM模型的中间输出决策函数来估计样本到分类边界的距离,重塑的训练数据样本将比原始输入样本减少很多数据,解决SVM训练过程耗时长,占用内存大的问题,同时还保证模型的训练精度。本发明方法可以有效判定散货船舶设备状态,并且可以快速剔除非支持向量。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其它优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例的一种基于SVM的散货船舶设备状态检测方法流程图;
图2为本发明实施例的增量选取逐步逼近法流程图;
图3为本发明实施例的支持向量与间隔之间关系示意图;
图4为本发明实施例的径向基核函数映射示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
本发明的技术构思:船上积累的数据越来越多,海量数据包含了船舶设备状态的所有信息,但这些大量的数据需要被有效利用,进而用来检测船舶的设备状态。基于SVM建模原理,对于高维大数据训练样本来说,训练SVM模型是相当耗时的,并且占用很多硬件资源。针对该问题,提出增量选取技术,逐步逼近最优的SVM模型,并重塑训练数据样本,解决SVM训练过程耗时长,占用内存大的问题,同时还保证模型的训练精度,利用该种SVM衍生方法可以有效解决船舶高维大数据问题,进而对船舶设备状态进行有效检测。
本发明的一个具体实施例,如图1所示,公开了一种基于SVM的散货船舶设备状态检测方法,包括以下步骤:
S1,获取散货船舶设备状态总训练数据集,并随机选取初始量的训练数据样本;
S2,采用所述训练数据样本训练SVM模型得到粗糙的分离平面,找出并去除不是支持向量的训练数据样本,再根据训练后SVM模型预测剩余训练数据样本量,依据边界数据决策函数值确定训练数据样本的去除或保留,以重建训练数据集;
S3,从所述重建训练数据集中依次增量选取船舶设备状态训练数据样本,转至步骤S2,逐步训练SVM模型筛选出支持向量直至最终重建训练数据样本;
S4,对最终重建训练数据样本进行全局SVM训练得到分类超平面,并根据分类超平面得到船舶设备状态检测结果。
与现有技术相比,本发明采用增量选取技术逐步逼近最优的分类超平面,同时为解决输入样本维度大的问题,采用SVM模型的中间输出决策函数来估计样本到分类边界的距离,重塑的训练数据样本将比原始输入样本减少很多数据,解决SVM训练过程耗时长,占用内存大的问题,同时还保证模型的训练精度。
需要说明的是,将散货船舶数据筛选后,保留对船舶设备状态判断有影响的数据,包括船舶轴功率,航速,吃水,发电机功率,锅炉蒸汽温度等相关参数,获得散货船舶设备状态总训练数据集,作为判断船舶设备状态的输入向量。同时,根据当前的参数状态,作为有监督训练样本数据,已知一部分数据的当前的船舶设备状态。基于SVM模型的稀疏特性,不是支持向量的数据将不会对得到最佳分离平面有所贡献。此外,距离支持向量最近的样本都分布在决策边界附近。因此,原则是在训练过程中训练数据集中的大部分样本是不必要。本发明实施例在初始阶段找到一个粗略的分离边界,不需要以特殊方式选择代表性的样本,粗糙的分离边界是基于随机选取的部分训练数据集找出来的。此外,粗糙模型对确切的模型有一定的偏差。采用增量选取法避免第一步使用分离边界保留的样本会导致SVM训练成本增大。换句话说,分类器可能不适合解决整体数据。其余的数据仍然有在第一步无法检测到的不必要的样本。因此,增量选择需要一次又一次地应用,直到剩余的数据对于单独的边界几乎是必需的。所以,选择更多的数据最后选择训练出的更准确的SVM模型。
具体地,采用增量选取技术逐步逼近最优的分类超平面的过程主要有以下几个步骤:
步骤1、初步随机选择训练数据开始训练;
步骤2、使用选择的数据训练SVM模型以获得初始分离平面,移除不是支持向量的样本。
步骤3、使用获取的SVM模型预测剩余的训练数据,去除决策函数值大于阈值的样本,保留决策函数小于阈值的样本。
步骤4、用剩余的样本重新构建训练数据。
步骤5、从重建数据中逐次增加选择训练数据,重新训练SVM,删除不必要的样本和重建训练数据多次,直到没有更多的不必要的样品进行消除。
步骤6、利用最终重建数据进行全局SVM训练。
显然,这种方法可以逐步缩小训练数据大小,更快进行SVM训练过程。为了更加明确地描述增量选择方法,在图2中详细的展示了整个过程。不同于基于聚类或基于KNN必须计算在每对数据样本之间距离的选择方法,本发明的方法很好地适应了高维度大数据集。
本发明的一个具体实施例,步骤S1中所述随机选取初始量设定为相对于总训练数据集指定百分比的阈值范围。
具体地,随机选择m百分比的训练数据(m是基于训练数据集)。训练数据集随机选取样本可能丢弃一些重要的对象。确定了随机选择次数的影响很小,从1000到10000个样本的不同选择,用来训练初始SVM来获取粗糙的分离平面。随机抽取的每个选择的支持向量数量几乎相同。它们之间的小差异将在增量选择部分恢复。通常,设定一个相对于总训练样本为10%的阈值范围,以保证训练模型的泛化能力。
本发明的一个具体实施例,所述训练数据样本训练SVM模型得到粗糙的分离平面的函数为:
Figure BDA0002218857330000081
其中,αi为拉格朗日乘数,C≥αi≥0,i=1,2,…,n,对应于αi不为0的xi为支持向量,V是支持向量的集合,D={(xi,yi)|xi∈Rn,yi∈{+1,-1}},i=1,2,…,n,D为训练数据样本集,n为训练数据样本量,b为常数,k(xi,xj)=<Φ(xi),Φ(xj)>=Φ(xi)TΦ(xj),向量Φ(x)为一个特征空间。
需要说明得是,使用SVM模型,之后将会应用SVM模型的输出来估计距离。假设分类问题是二分类问题,D是训练样本集。
D={(xi,yi)|xi∈Rn,yi∈{+1,-1}}
i=1,2,…,n
训练SVM得到找到最佳分离面或解决以下QP问题(原始问题):
Figure BDA0002218857330000082
s.t.yiTΦ(xi)+b)≥1-ξi,
ξi≥0,i=1,2,…,n.
QP问题转化为下式,其中拉格朗日乘数αi≥1,
Figure BDA0002218857330000091
Figure BDA0002218857330000092
C≥αi≥0,i=1,2,…,n
对应于αi不为0的xi成为支持向量,设V是支持向量的集合,满足下面的KKT条件:
Figure BDA0002218857330000093
分离平面可以表示为
Figure BDA0002218857330000094
本发明的一个具体实施例,所述依据边界数据决策函数值确定训练数据样本的去除或保留包括:
若边界数据决策函数值大于阈值δ,则去除所述边界数据决策函数值对应的训练数据样本;
若边界数据决策函数值小于阈值δ,则保留所述边界数据决策函数值对应的训练数据样本;
所述阈值δ的初始设置为1.5。
具体地,本发明使用获取的SVM模型预测剩余的训练数据,去除决策函数值大于阈值的样本,保留决策函数小于阈值的样本。
也就是说,本发明使用决策函数而不是计算距离来检测靠近分离平面的样本。决策函数的值是距离的归一化值,设置一个阈值来确定应该保留或删除哪些类型的样本,阈值的值可以决定将消除多少数据。在增量选择方法的开始步骤中,设置了一个值很小的阈值。这表示找出了比当前SVM模型软间隔距离分离平面更大的间隔外的样本。即使初始SVM模型不太精确,也几乎不会清除必要的样本。
本发明的一个具体实施例,所述边界数据决策函数值为随机样本点到分离平面的距离归一化值,如图3所示的支持向量与间隔距离之间关系,计算公式如下:
Figure BDA0002218857330000101
其中,||ω||为f(x)的模,
Figure BDA0002218857330000102
为SVM的决策函数。
需要说明的是,增量选出训练数据后,重要的在于如何确定选取数据,也就是构建边界决策函数。根据SVM模型的机理特点,SVM的决策函数可以表示为
Figure BDA0002218857330000103
其中,k(xi,xj)=<Φ(xi),Φ(xj)>=Φ(xi)TΦ(xj),向量Φ(x)表示为一个特征空间。根据线性SVM理论,映射到特征空间的向量将能够进行线性分离,这个过程已经将核心信息映射应用于特征空间。在构建SVM模型的过程中,最重要的一步就是将输入样本映射到特征空间中,映射后的样本表达方式与输入特征是等价的。这一步在于SVM模型可构建一个非线性决策函数,虽然SVM模型是基于线性的判别方法。继而,SVM在优化过程中只需要计算核函数而不是计算映射函数本身。将SVM的核函数构建成一个更有效的计算函数,是将输入数据映射到一个无限维空间,在该空间中数据分布稀疏。在构建边界数据决策函数时,使用f(x)来检测靠近决策边界的样本。f(x)的值越大,表示对应于当前f(x)的样本越接近于边界。此外,当f(x)的值不大于1时,表明可以选择与当前f(x)相对应的样本作为支持向量。
本发明的一个具体实施例,所述SVM的决策函数的构建基于径向基核函数映射,如图4所示,所述径向基核函数为:
Figure BDA0002218857330000111
其中,γ为高斯核参数,xi和xj为SVM模型的输入训练数据样本。
需要说明的是,径向基核函数是基于输入样本的关系构建的。本发明采用的核函数为径向基函数:
Figure BDA0002218857330000112
径向基核函数的可分性,就是将输入数据转化到特征空间能否将样本清晰地分类。高斯非线性核函数对输入数据有着很好的适用性,并且分类结果一般会高于其他非线性核函数。在SVM模型优化过程中,当拉格朗日乘数αi和松弛参数ξi满足αi>0,ξi=0,则高斯核参数γ→∞,并且符合该条件的样本都是支持向量,并且在正确的分类边界侧。当高斯核参数γ→∞时,
Figure BDA0002218857330000113
高斯核函数只对小邻域内样本产生影响,而当样本距离大于该邻域范围,高斯核得出结果趋于0。所以高斯核函数易于找出局部样本之间的性质。
本发明的一个具体实施例,步骤S3中从所述重建训练数据集增量选取船舶设备状态训练数据样本的过程将每次循环的增量值设置为常数。
需要说明的是,在方法的增量选择过程中有一些参数需要调整,通常,将增量值设置为常数。然而,当训练数据太大时,支持向量的数量变大。如果不增加增量值,则需要两次以获取最终的重建数据集。因此,在每个循环的增量值上增加一个小值,以便更快地收敛。
本发明的一个具体实施例,对每次循环增量选取船舶设备状态训练数据样本进行训练SVM模型筛选出支持向量时,每次缩小阈值δ来确定训练数据样本的去除或保留。
需要说明的是,为了快速接近收敛,在每个循环回路上稍微减小阈值δ的值。从原始数据集中,阈值δ的值可能设置得太小。当阈值δ几乎等于1时,这意味着只选择当前分离边界周围的样本,结果是基于整个训练数据集的接近分离平面的许多样本将被误认为是不必要的样本。如果阈值δ的值太大,则会导致许多不必要的样本不能去除。本实施例中将δ的值初始设置为1.5,以防由于δ过小而去除掉重要样本,然后在每个循环中值减少一些,例如δ依次取值1.3、1.05作为收敛参数对影响进行评估。本技术方案对于许多训练数据集是有效的。每个循环的减少将更快的获得最终的重建数据集,并且迭代次数随之更少。
也就是说,增量选择方法可以补偿随机选择的不准确性,逐渐接近于确切的分离边界,可以检测到更多的不能确定为不必要的样品数据,通过增加每次迭代的增量值以加速修改SVM模型。此外,SVM模型由于越来越精确,在每次迭代中都会略微降低阈值。
本发明的一个具体实施例,所述最终重建训练数据样本为多次增量选取后对训练数据样本进行去除或保留后所得。也即,通过训练数据逐步重建的过程得到最优化的分离平面。
本发明的一个具体实施例,步骤S4中对最终重建训练数据样本进行全局SVM训练得到分类超平面,并根据分类超平面得到船舶设备状态检测结果包括:分类超平面不同的分类边界划分对应不同的船舶设备状态。
本发明将散货船舶数据筛选后,根据当前的参数状态,作为有监督训练样本数据,已知一部分数据的当前的船舶设备状态,根据设备运行机理,选取与设备状态相关的运行参数,并进行特征提取后,转化为特征值。使用本文提出方法可以有效判定散货船舶设备状态,并且可以快速剔除离群点。
在典型SVM(support vector machine)模型中,训练过程所耗时间和所占内存,与训练样本数n有着密切的关系。对于高维大数据训练样本来说,训练SVM模型是相当耗时的,并且占用很多硬件资源。SVM分类器由仅一部分数据决定,这部分数据称作为支持向量。支持向量分布在分类边界的间隔上或间隔内部。因此,将非支持向量数据移除并不会影响分类超平面的法向量,并且还减少了输入样本数,在根源上解决了SVM训练大数据困难的问题。所以,本发明基于增量选取技术,逐步将支持向量候选样本保存下来,与此同时将非支持向量样本从训练样本中移除。
在本发明技术方法中,采用增量选取技术逐步逼近最优的分类超平面。为解决输入样本维度大的问题,本发明采用SVM模型的中间输出决策函数来估计样本到分类边界的距离。重塑的训练数据样本将比原始输入样本减少很多数据,解决SVM训练过程耗时长,占用内存大的问题,同时还保证模型的训练精度。也就是说,本发明技术方案达到了以下有益效果:
(1)减少训练高维船舶设备状态数据集所需时间。
(2)避免计算每两个船舶设备状态样本之间的距离以检测近似的分离边界。
(3)将从船舶设备状态样本点到分离边界的距离近似为SVM模型的输出。
(4)逐渐去除不必要的船舶设备状态样本点,以纠正船舶设备状态分类模型。
综上所述,本发明公开了一种基于SVM的散货船舶设备状态检测方法,包括以下步骤:S1,获取散货船舶设备状态总训练数据集,并随机选取初始量的训练数据样本;S2,采用所述训练数据样本训练SVM模型得到粗糙的分离平面,找出并去除不是支持向量的训练数据样本,再根据训练后SVM模型预测剩余训练数据样本量,依据边界数据决策函数值确定训练数据样本的去除或保留,以重建训练数据集;S3,从所述重建训练数据集增量选取船舶设备状态训练数据样本,转至步骤S2,逐步训练SVM模型筛选出支持向量直至最终重建训练数据样本;S4,对最终重建训练数据样本进行全局SVM训练得到分类超平面,并根据分类超平面得到船舶设备状态检测结果。本发明采用增量选取技术逐步逼近最优的分类超平面,同时为解决输入样本维度大的问题,采用SVM模型的中间输出决策函数来估计样本到分类边界的距离,重塑的训练数据样本将比原始输入样本减少很多数据,解决SVM训练过程耗时长,占用内存大的问题,同时还保证模型的训练精度。
本领域技术人员可以理解,实现上述实施例中方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种基于SVM的散货船舶设备状态检测方法,其特征在于,包括以下步骤:
S1,获取散货船舶设备状态总训练数据集,并随机选取初始量的训练数据样本;
S2,采用所述训练数据样本训练SVM模型得到粗糙的分离平面,找出并去除不是支持向量的训练数据样本,再根据训练后SVM模型预测剩余训练数据样本量,依据边界数据决策函数值确定训练数据样本的去除或保留,以重建训练数据集;其中,所述训练数据样本训练SVM模型得到粗糙的分离平面的函数为:
Figure FDA0003780310590000011
其中,αi为拉格朗日乘数,C≥αi≥0,i=1,2,…,n,对应于αi不为0的xi为支持向量,V是支持向量的集合,D={(xi,yi)|xi∈Rn,yi∈{+1,-1}},i=1,2,…,n,D为训练数据样本集,n为训练数据样本量,b为常数,k(xi,xj)=<Φ(xi),Φ(xj)>=Φ(xi)TΦ(xj),向量Φ(x)为一个特征空间;
S3,从所述重建训练数据集中依次增量选取船舶设备状态训练数据样本,缩小所述边界数据决策函数值的阈值,并转至步骤S2,逐步训练SVM模型筛选出支持向量直至最终重建训练数据样本;其中,所述边界数据决策函数值为随机样本点到分离平面的距离归一化值,计算公式如下:
Figure FDA0003780310590000012
其中,||ω||为f(x)的模,
Figure FDA0003780310590000013
为SVM的决策函数;
其中,所述SVM的决策函数的构建基于径向基核函数映射,所述径向基核函数为:
Figure FDA0003780310590000021
其中,γ为高斯核参数,xi和xj为SVM模型的输入训练数据样本;
S4,对最终重建训练数据样本进行全局SVM训练得到分类超平面,并根据分类超平面得到船舶设备状态检测结果。
2.根据权利要求1所述的方法,其特征在于,步骤S1中所述随机选取初始量设定为相对于总训练数据集指定百分比的阈值范围。
3.根据权利要求1所述的方法,其特征在于,所述依据边界数据决策函数值确定训练数据样本的去除或保留包括:
若边界数据决策函数值大于阈值δ,则去除所述边界数据决策函数值对应的训练数据样本;
若边界数据决策函数值小于阈值δ,则保留所述边界数据决策函数值对应的训练数据样本;
所述阈值δ的初始设置为1.5。
4.根据权利要求1所述的方法,其特征在于,步骤S3中从所述重建训练数据集增量选取船舶设备状态训练数据样本的过程将每次循环的增量值设置为常数。
5.根据权利要求3或4所述的方法,其特征在于,对每次循环增量选取船舶设备状态训练数据样本进行训练SVM模型筛选出支持向量时间,每次缩小阈值δ来确定训练数据样本的去除或保留。
6.根据权利要求1所述的方法,其特征在于,所述最终重建训练数据样本为多次增量选取后对训练数据样本进行去除或保留后所得。
7.根据权利要求1或6所述的方法,其特征在于,步骤S4中对最终重建训练数据样本进行全局SVM训练得到分类超平面,并根据分类超平面得到船舶设备状态检测结果包括:分类超平面不同的分类边界划分对应不同的船舶设备状态。
CN201910925709.5A 2019-09-27 2019-09-27 一种基于svm的散货船舶设备状态检测方法 Active CN110705631B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910925709.5A CN110705631B (zh) 2019-09-27 2019-09-27 一种基于svm的散货船舶设备状态检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910925709.5A CN110705631B (zh) 2019-09-27 2019-09-27 一种基于svm的散货船舶设备状态检测方法

Publications (2)

Publication Number Publication Date
CN110705631A CN110705631A (zh) 2020-01-17
CN110705631B true CN110705631B (zh) 2022-12-09

Family

ID=69196859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910925709.5A Active CN110705631B (zh) 2019-09-27 2019-09-27 一种基于svm的散货船舶设备状态检测方法

Country Status (1)

Country Link
CN (1) CN110705631B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709090B (zh) * 2020-06-17 2023-04-07 上海船舶研究设计院(中国船舶工业集团公司第六0四研究院) 模型构建方法、装置、电子设备及计算机可读存储介质
CN112651927A (zh) * 2020-12-03 2021-04-13 北京信息科技大学 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102054179A (zh) * 2010-12-14 2011-05-11 广州大学 一种旋转机械在线状态监测与故障诊断装置及方法
CN105974265A (zh) * 2016-04-29 2016-09-28 北京四方继保自动化股份有限公司 一种基于svm分类技术的电网故障原因诊断方法
CN108376264A (zh) * 2018-02-26 2018-08-07 上海理工大学 一种基于支持向量机增量学习的冷水机组故障诊断方法
CN109325535A (zh) * 2018-09-25 2019-02-12 南京审计大学 一种分类器及其设计方法和增量学习方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8429102B2 (en) * 2011-03-31 2013-04-23 Mitsubishi Electric Research Laboratories, Inc. Data driven frequency mapping for kernels used in support vector machines

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102054179A (zh) * 2010-12-14 2011-05-11 广州大学 一种旋转机械在线状态监测与故障诊断装置及方法
CN105974265A (zh) * 2016-04-29 2016-09-28 北京四方继保自动化股份有限公司 一种基于svm分类技术的电网故障原因诊断方法
CN108376264A (zh) * 2018-02-26 2018-08-07 上海理工大学 一种基于支持向量机增量学习的冷水机组故障诊断方法
CN109325535A (zh) * 2018-09-25 2019-02-12 南京审计大学 一种分类器及其设计方法和增量学习方法

Also Published As

Publication number Publication date
CN110705631A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
US8108324B2 (en) Forward feature selection for support vector machines
CN109934293B (zh) 图像识别方法、装置、介质及混淆感知卷积神经网络
CN113408605A (zh) 基于小样本学习的高光谱图像半监督分类方法
CN107784288A (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
CN113887580B (zh) 一种考虑多粒度类相关性的对比式开放集图像识别方法及装置
CN110705631B (zh) 一种基于svm的散货船舶设备状态检测方法
CN110991247B (zh) 一种基于深度学习与nca融合的电子元器件识别方法
CN116777006A (zh) 基于样本缺失标签增强的多标签学习方法、装置和设备
CN114444668A (zh) 网络量化方法及系统及装置及介质及图像处理方法
US11829442B2 (en) Methods and systems for efficient batch active learning of a deep neural network
CN114528913A (zh) 基于信任和一致性的模型迁移方法、装置、设备及介质
CN117112992A (zh) 一种聚酯酯化阶段的故障诊断方法
US20230134508A1 (en) Electronic device and method with machine learning training
CN116189130A (zh) 基于图像标注模型的车道线分割方法及装置
CN111931747B (zh) 一种适于多任务迭代学习记忆的遥感图像分类方法
CN115238645A (zh) 资产数据识别方法、装置、电子设备和计算机存储介质
Abeysinghe et al. Clustering algorithms on imbalanced data using the SMOTE technique for image segmentation
Chen et al. Pruning deep feature networks using channel importance propagation
CN116561591B (zh) 科技文献语义特征提取模型训练方法、特征提取方法及装置
US20220405599A1 (en) Automated design of architectures of artificial neural networks
CN117671704B (zh) 一种手写体数字识别方法、装置及计算机存储介质
CN115713765A (zh) 细胞样本图片提取分析对比检测方法
Powell Deep Active Learning for Surface Defect Classification Based on Informativeness and Diversity
Russold et al. Incremental Whole Plate ALPR Under Data Availability Constraints.
Taha Machine Learning Techniques for Identifying the Defective Patterns in Semiconductor Wafer Maps: A Survey, Empirical, and Experimental Evaluations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant