CN102005135A - 基于遗传算法优化的支持向量回归船舶交通流量预测方法 - Google Patents

基于遗传算法优化的支持向量回归船舶交通流量预测方法 Download PDF

Info

Publication number
CN102005135A
CN102005135A CN2010105813202A CN201010581320A CN102005135A CN 102005135 A CN102005135 A CN 102005135A CN 2010105813202 A CN2010105813202 A CN 2010105813202A CN 201010581320 A CN201010581320 A CN 201010581320A CN 102005135 A CN102005135 A CN 102005135A
Authority
CN
China
Prior art keywords
support vector
function
genetic algorithm
prediction
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105813202A
Other languages
English (en)
Inventor
张�浩
肖英杰
白响恩
杨小军
李松
郑剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Maritime University
Original Assignee
Shanghai Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Maritime University filed Critical Shanghai Maritime University
Priority to CN2010105813202A priority Critical patent/CN102005135A/zh
Publication of CN102005135A publication Critical patent/CN102005135A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于遗传算法优化的支持向量回归船舶交通流量预测方法,其包括如下步骤:(1)通过加权主成分分析法把可能对船舶流量产生影响的因素维数降低,选取累计贡献率较高的影响因素;(2)原始船舶交通流时序数据归一化预处理,生成数据集并分组;(3)选择核函数,确定SVM回归参数;(4)构造遗传算法优化的支持向量回归预测模型;(5)输入数据集,生成预测函数;(6)根据上一步骤生成的预测函数进行预测,并进行预测误差评价分析;如果误差较大则返回步骤2,重新调整参数,再次进行预测。本发明具有较高预测精度,且预测精度的稳定性较高。

Description

基于遗传算法优化的支持向量回归船舶交通流量预测方法
技术领域
本发明涉及一种船舶交通流量预测技术,具体涉及基于遗传算法优化的支持向量回归船舶交通流量预测方法。
背景技术
船舶交通流量的预测研究是与船舶定线制的建立密不可分的。船舶定线制的制定要求对该水域或航道的近期和未来总体船舶交通流量有一个清楚的认识,流量预测为未来航道航线的规划、设计和优化提供基础流量数据,这也是制定管理政策和方案的最基本、最重要的依据。
大连海事大学吕靖和方祥麟提出的CSFM模型是在对我国沿海主要港口辖区水域船舶交通流分析的基础上,考虑到过去预测方法中存在不足而提出来的。该模型运用系统分析的原理,定性与定量方法相结合,时间序列分析、主观概率及专家咨询等方法相结合,同时考虑到政治,政策及人为因素等影响,不仅能提高预测的系统性和适用性,而且也能提高预测的准确度。
武汉理工大学刘敬贤在CSFM模型基础上提出基于港口特征、船舶行为特征和历史相关统计数据建立的船舶交通流预测模型,并针对CSFM模型的固定权重问题,采用线性规划方法来确定组合预测的变权系数。通过改进,使得组合预测模型更加合理,能真实的反应一个水道或港口的船舶交通流量的发展趋势。
上海海事大学黄洪琼提出智能融合算法应用于船舶交通流量预测系统,融合预测能够对多个数据源进行预测,并可以减缓单种预测方法单独预测的不确定性,从而增加了预测的准确性和整个预测系统的鲁棒性,较好地解现有船舶预测算法中存在的预测精度不高,依赖于经验等不足。
以上方法均是基于传统的时序数据的时序预测模型,预测准确度不高。
发明内容
本发明针对现有船舶交通流量的预测模型预测准确度不高的问题,而提供一种基于遗传算法优化的支持向量回归船舶交通流量预测方法,该方法能够有效的提高预测准确度。
为了达到上述目的,本发明采用如下技术方案:
基于遗传算法优化的支持向量回归船舶交通流量预测方法,该预测方法包括如下步骤:
(1)通过加权主成分分析法把可能对船舶流量产生影响的因素维数降低,选取累计贡献率较高的影响因素;
(2)原始时序数据归一化预处理,生成数据集并分组,即把样本数据转化为0~1或者0~2之间的数据;
(3)选择核函数,确定SVM回归参数:得到数据集之后,选择径向基函数(RBF)作为核函数,包含宽度参数、二次规划的优化参数;
(4)构造遗传算法优化的支持向量回归预测模型;
(5)输入数据集,生成预测函数;
(6)根据上一步骤生成的预测函数进行预测,并进行预测误差评价分析;如果误差较大则返回步骤2,重新调整参数,再次进行预测。
所述步骤(4)中的遗传算法优化步骤如下:
(4.1)随机产生一组支持向量机参数,采用某编码方案对每个支持向量机参数进行编码,进而构造初始群体;
(4.2)计算它的误差函数,从而确定其适应度,若误差越大,则适应度越小;
(4.3)选择若干适应度大的个体,直接遗传给下一代;
(4.4)利用遗传操作算子对当前一代群体进行处理,产生下一代群体;
(4.5)重复步骤(4.2),使初始确定的一组支持向量机参数不断进化,直到训练目标满足条件为止。
本发明提出的基于机器学习和统计学习的人工智能预测模型。在利用支持向量机进行预测的过程中,参数的选取起关键性作用,若参数选取不合理,则往往会造成计算的欠学习和过学习现象,从而直接影响预测精度和运行时间。本方法采用遗传算法对SVM的参数进行优选,避免了人为选择支持向量机参数的盲目性,提高了支持向量机预测的精度和推广泛化能力,随着预测时间延长,基于遗传算法优化的支持向量机仍具有较高预测精度,预测精度的稳定性较高。总之,该方法通过实证检验,获得了良好的改进效果,说明了所提出的改进发明在预测中的有效性。
附图说明
以下结合附图和具体实施方式来进一步说明本发明。
图1为本发明的流程图。
图2为不敏感函数下的线性回归示意图。
图3为归一化后的1991-2008年船舶进出港签证艘次统计图。
图4为最佳适应度曲线图。
图5为参数g、c和MSE的等高线图。
图6为参数g和c的等高线图。
图7为原始数据和预测数据对比图。
图8为相对误差量示意图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
本发明在针对现有船舶流量预测方法的不足之处,提出改进的支持向量机的船舶流量预测方法,其步骤如下(参见图1):
步骤1:通过加权主成分分析法把可能对船舶流量产生影响的因素维数降低,选取累计贡献率较高的影响因素。
下面详细介绍一下加权主成分赋权法的一般步骤:
(1)采集p维随机向量X=[X1,X2,…,Xp]T的n个样本xi=[xi1,xi2,…,xip]T,整理出观察资料矩阵X=(xij)n×p
(2)根据情况确定是否对样本阵中原始数据进行标准化处理;
利用下式对变量进行标准化处理:
x ij * = x ij - x ‾ j var ( x j ) , i = 1,2 , · · · , n ; j = 1,2 , · · · , p
式中:-第j个变量的平均值
Figure BDA0000037146530000041
-第j个变量的标准薹
(3)计算样本相关系数矩阵R=[rij]p×p
(4)计算样本系数矩阵R的特征方程,得p个特征值;
(5)计算主成分Yi=u′iX,i=1,2,…,p;
(6)计算特征值的累积方差贡献率:
Figure BDA0000037146530000042
将E≥85%或者特征值λ≥1时m的最小整数作为m的值;
(7)提取前m个主成分Y;
(8)计算前m个主成分Y的因子载荷矩阵
Figure BDA0000037146530000043
bij为第i个因子在第j个主成分中的载荷;
(9)计算前m个主成分的方差贡献率矩阵A=[al…ak…am]T,其中ak为第k个主成分的方差贡献率,2≤k≤m-1;
(10)计算主成分法所赋因子权重矩阵C:
Figure BDA0000037146530000044
式中ck为第k个因子权重,取绝对值,2≤k≤m-1;
(11)计算加权主成分赋权法所赋因子权重矩阵W:
Figure BDA0000037146530000045
式中G=[gl…gk…gp]为p个因子的重要度权重矩阵,gk为第k个因子的重要度权重,wk为第k个因子的加权主成分赋权法所赋的因子权重;为便于计算,在此将主成分法所赋因子权重矩阵C写成对角矩阵形式;
(12)确定评价模型方程F
F=WX=[wl…wk…wp][xl…xk…xp]T=wlxl+…+wkxk+…+wpxp
式中X=[xl…xk…xp]T为p维因子矩阵,xk为第k个因子得分。
将每个可能影响船舶交通流进出港艘次的指标输入模型方程F,便可以得到影响船舶交通流进出港艘次的主要指标的评价结果,F值越大,即该指标对船舶交通流流量产生较大作用,选取累计贡献率较大的指标。
步骤2:原始时序数据归一化预处理,生成数据集并分组。即把样本数据转化为0~1或者0~2之间的数据。
步骤3:选择核函数,确定SVM参数。得到数据集之后,选择径向基函数(RBF)作为核函数,包含宽度参数、二次规划的优化参数,由于基于先验知识选择参数,会导致不同数据对先验知识适应程度不同,如果误差超过标准要不断地进入步骤3重新设置,无论从效率或从预测精度都不是理想的解决方案。
步骤4:构造遗传算法优化的支持向量回归预测模型
遗传算法优化步骤如下:
(1)随机产生一组支持向量机参数,采用某编码方案对每个支持向量机参数进行编码,进而构造初始群体。
(2)计算它的误差函数,从而确定其适应度。若误差越大,则适应度越小。
(3)选择若干适应度大的个体,直接遗传给下一代。
(4)利用交叉、变异等遗传操作算子对当前一代群体进行处理,产生下一代群体。
(5)重复步骤2,使初始确定的一组支持向量机参数不断进化,直到训练目标满足条件为止。
步骤5:输入数据集,生成预测函数。
步骤6:预测并进行误差分析。根据上一步骤生成的预测函数进行预测,并进行预测误差评价分析。如果误差较大则返回步骤2,重新调整参数,再次进行预测。
上述方案的实现原理如下:
支持向量机回归预测原理
SVM是从线性可分情况下的最优分类面发展而来的,所谓最优分类线就是要求分类线不但能将两类正确分开,使训练错误率为0,而且还要使分类间隔最大。前者保证经验风险最小;使分类间隔最大实际上就是使推广性界中的置信范围最小,从而使真实风险最小。推广到高维空间,最优分类线就成为了最优分类面。常用的核函数有多项式核函数、径向基函数和Sigmoid函数等。
考虑给定n个学习样本(Xi,yi),Xi∈Rd,yi∈R,i=1,2,..n,线性回归研究的目标就是找到回归函数:f(x)=(WοX)+b    (1)
式中为W∈Rd,b∈R,ο为W与X的内积.在以往的学习算法中,优化目标是使经验风险即样本损失函数L(Xi)=g(yi-f(Xi))(2)的累积Remp(f)最小化,如最小二乘法,所求的(W,b)应满足
min R emp ( f ) = Σ i = 1 n ( y i - f ( X i ) ) 2 - - - ( 3 )
然而,统计学习理论指出,经验风险最小并不能保证期望风险最小.在结构风险最小的优化目标下,线性回归方程中的参数(W,b)应满足
( W , b ) = 1 2 | | W | | 2 + CR emp ( f ) - - - ( 4 )
上式中的反映了回归函数f的泛化,C为惩罚因子。式(5.4.4)表明,结构风险最小化能够考虑回归函数的经验风险和泛化能力,因此,回归函数具有更好的性能。
式(2)中常用的损失函数L(Xi)包括二次函数,Huber函数、Laplace函数和ε-不敏感函数等。其中ε-不敏感函数能够忽略ε范围内的回归误差Lε(Xi)=0,|yi-f(Xi)|≤ε;&Lε(Xi)=yi-f(Xi)|-ε,|yi-f(Xi)|>ε(5)
如果,|yi-(wοXi)-b|<ε(i=1,2,...,n)成立,对应图1中外面两条直线所围区域内的样本点,即所有样本损失函数都为0,因此有Remp(f)=0,式(5)可改写为:
min Q ( W , b ) = 1 2 | | W | | 2 , - - - ( 6 )
s.t.yi-(WοXi)-b≤ε,(7)
(WοXi)+b-yi≤ε.(8)
显然,约束条件(7)和式(8)并不总能得到满足,此时则必须引入松弛因子εi≥0和εi *≥0,在ε-不敏感损失函数下,式(4)的优化问题变为
min Q ( W , b ) = 1 2 | | w | | 2 + c Σ i = 1 n ( ϵ i + ϵ i * ) . - - - ( 9 )
Figure BDA0000037146530000073
Figure BDA0000037146530000074
ϵ i , ϵ i * ≥ 0 . - - - ( 12 )
引入参数αi,αi *,ηi
Figure BDA0000037146530000076
构造Lagrange函数对上述优化问题进行求解
Figure BDA0000037146530000077
Figure BDA0000037146530000078
考虑到上式关于W,b,ηi
Figure BDA0000037146530000079
取极小,因此对L关于W,b,εi
Figure BDA00000371465300000710
求偏导,并令它们等于0
∂ L ∂ b = 0 → Σ i = 1 n ( α i * - α i ) = 0 , - - - ( 14 )
∂ L ∂ w = 0 → W = Σ i = 1 n ( α i * - α i ) X i , - - - ( 15 )
∂ L ∂ ϵ i = 0 → C - α i - η i = 0 , - - - ( 16 )
∂ L ∂ ϵ i * = 0 → C - α i * - η i * = 0 . - - - ( 17 )
将式(10)式(13)带入式(9),得到对偶优化问题
max Q ( α i - α i * ) = - 1 2 Σ i , j = 1 n ( α i - α i * ) ( α j - α j * ) ( X i , X j )
- ϵ Σ i = 1 n ( α i + α i * ) + Σ i = 1 n y i ( α i - α i * ) . - - - ( 18 )
s . t . Σ i = 1 n ( α i * - α i ) = 0 , - - - ( 19 )
0≤αi,αi *≤C.(20)
由上述优化方程,可求出αi和αi *。实际上只有一部分αii *≠0,与之对应的样本(Xi,yi)称为支持向量(Support Vector,SV)。进一步由式(1)和式(15)得到回归方程
Figure BDA0000037146530000083
根据KKT条件,任选一支持向量,上式中依下式计算b=yi-(WοXi)-ε,αi∈(0,C)
Figure BDA0000037146530000084
将式(15)带入上式得
Figure BDA0000037146530000085
Figure BDA0000037146530000086
对于非线性问题,引入核函数K(Xi,Xj)代替样本向量的内积运算,实现据空间到特征空间的非线性映射,并使低维数据空间的非线性问题转化为高征空间的线性问题.在核函数下,式(8)、式(11)和式(13)变为如下形式
Figure BDA0000037146530000087
Figure BDA0000037146530000088
Figure BDA0000037146530000089
Figure BDA0000037146530000091
其中式(24)的约束条件依然为式(19)和式(20),对式(24)进行求解可得αi
Figure BDA0000037146530000092
式(25)即为支持向量回归模型。从上面的论述中,不难发现与常规的回归方法相比,支持向量回归模型有两方面的优势:采用结构风险最小化作为结构目标,提高了回归函数的泛化能力;引入了核方法,实现了低维数据空间与高维特征空间的非线性映射,提高了函数的非线性数据处理能力。
支持向量回归中核函数和超参数选择
核函数选择
ε-SVR,υ-SVR及LS-SVR是目前用于回归估计最常用的3种SVR形式。为了回归估计非线性函数,Vapnik引入了ε不敏感损失函数,得到ε-SVR。ε直接控制函数的估计精度,使ε-SVR具有鲁棒性和稀疏性,且这种稀疏性对在高维空间中用大量数据估计依赖性关系来说是非常重要的。Scholkopf等提出υ-SVR,υ可以根据模型复杂度和松弛变量自动地调节ε,从而更加有效地控制支持向量的数量。Suykens等提出的LS-SVM(Least Squares-SVM)是SVM的一种扩展,它将目标函数中的松弛项改为二次方型,不等式约束改成等式约束,使对偶问题变为线性KKT系统的求解,降低了计算的复杂性。
肖建等将SVR核的选择方法归纳为5个主要类型:(1)直接利用常规的核函数或利用核函数闭包性质构造混合核函数;(2)根据函数逼近论,利用一维函数核的乘积构造多维核函数;(3)利用正则化算子构造核函数;(4)利用谱密度或频域信息构造核函数;(5)直接学习SVR的核矩阵。
利用支持向量机解决问题时,通过特征空间中估计内积的核,隐式地实现输入向量到高维特征空间的映射,然后在高维特征空间中构建线性回归函数,对应原空间非线性问题的求解。它并不涉及特征空间的维数,从而避免了维数灾难问题。核函数必须满足有限半正定性,核函数虽然是定义在原始空间上的双变量函数,却实现了高维空间的内积。核函数不仅要在理论上满足Mercer条件,而且在实际应用中要能够反映样本数据的分布特性。Mercer定理是有限半正定性的等价形式,利用特征空间中的内积形式理解核,而SVR就是基于Mercer核的学习机器。根据Hilbert-Schmidt定理,Mercer核可保证核矩阵是半正定的,从而确保SVR解的唯一性。由此可见,SVR的性能很大程度上依赖于核函数的选择。因此,核函数的选择是支持向量机理论研究的一个核心问题,但是目前还没有一种统一的构造合适核函数的有效方法。在实际应用中最常用的核函数主要有多项式核、径向基核、多层感知机核等。此外还有Fourier级数核、B-样条核等多种。
根据不同的核的选择方法,将其分为两个部分:核的构造及核参数的调整。核的构造指利用核函数和核矩阵的性质通过运算构造更加复杂的有用的核。核参数通常也称为超参数,关于核参数的调整可以归结为超参数的确定问题。
一般而言,径向基核和多项式核优于Sigmoid核函数。从核函数参数数量的角度考察径向基核和多项式核,前者比后者少,由于核函数参数能够反映模型选择的复杂程度,径向基核函数是一个普适的核函数,通过选择合适的核函数参数,它可以适用于任意的分布的样本。
径向基核函数
Figure BDA0000037146530000101
是目前在支持向量基中被应用的最广泛的核函数。因此,本发明选择径向基核作为核函数。
超参数的选择
在确定RBF核为核函数后,需要获得最佳(C,γ)参数组合。目前最常用的求解最佳(C,γ)参数的方法为双线性搜索法和网格搜索法两种方法。但双线性搜索法对线性SVM的最优参数的准确性依赖较大,而网格搜索法的计算量较大,并且两种方法并不能保证找到全局最优解。惩罚参数C决定着SVR模型的复杂度与误差精度之问的折衷,C取得大表示VC维权重小,SVR模型泛化能力差;C取得小则使ε不敏感,训练误差变大。ε在SVR中控制着支持向量的稀疏性,ε的选择影响回归估计模型的精度。υ起着调节ε与模型复杂度和松弛变量之间的折衷作用,可以更加有效地控制支持向量的数量。因此,选择合适的超参数对SVR的性能很重要。本发明采用启发式的粒子群优化算法的搜索方式。
遗传算法优化算法
遗传算法(Genetic Algorithm,GA)是一种更为宏观意义下的仿生算法,它模仿的机制是一切生命与智能的产生与进化过程。遗传算法利用生物遗传学的观点,结合了适者生存和随机信息交换的思想,通过自然选择、交换、变异等作用机制,实现种群的进化。在寻优过程中,GA在解空间随机产生多个起始点并同时开始搜索,由适应度函数来指导搜索方向,该方法是一种能够在复杂搜索空间快速寻求全局优化解的搜索技术,适宜于最佳核函数和惩罚因子的连续参数优化问题,优化过程中,编码区间、适应度函数、遗传算子的选择是关键。它通过模拟达尔文“优胜劣汰、适者生存”的原理激励好的结构;通过模拟孟德尔遗传变异理论在迭代过程中保持已有的结构,同时寻找更好的结构。
构造支持向量回归预测模型优化的遗传算法需要以下步骤:
(1)编码区间
随机产生一组支持向量机参数,采用某编码方案对每个支持向量机参数进行编码,进而构造初始群体。设定种群数目n,种群数目太小,遗传算法的性能将变得很差或根本找不出问题的解,太大,则会增加计算量,使收敛时间增长,种群数目一般取为30-50个。
(2)惩罚因子的确定
惩罚因子C的作用是对Lagrange因子ai的取值加以限制,当C较小时,误差较大,且随着C的增大而减小,出现欠学习现象;当C逐步增大时,误差在一定阶段处于平稳,但当C过大时,误差随C的增大而增大,为过学习现象,一般C的取值范围在[1,1000]即可,为此实验中确定C的搜索空间为[1,1000]。
(3)适应度函数的确定
在实际应用中,对于实际测得的时间序列{x1,x2,…},可以利用其一部分数据建模,而用另一部分数据来对所建模型进行验证,如果预测值是实测值相差越少,显然模型越理想,理想情况是预测值与实测值相等,则达到完美预测。通常衡量预测值与实测值差别的变量采用平均相对变动值(Average RelativeVariance:ARV),其定义为:
ARV = Σ i = 1 N [ x ( i ) - x ^ ( i ) ] 2 Σ i = 1 N [ x ( i ) - x ‾ ( i ) ] 2 - - - ( 27 )
其中:N-比较数据个数;x(i)-实测数据值;
Figure BDA0000037146530000121
-实测数据平均值;
Figure BDA0000037146530000122
-预测值。显然,平均相对变动值ARV越小,也表明预测效果越好,ARV=0表示达到了理想预测效果,当ARV=1时,表明模型仅达到平均值的预测效果。由于ARV反映了网络的泛化能力,所以定义适应度函数为:
f = 1 ARV - - - ( 28 )
(4)对种群解码,计算每条基因串的适应度
(5)遗传算子运算
将适应度最大的个体无条件地复制到下一代新种群中,然后对父代种群进行选择、交叉和变异等遗传算子运算,从而繁殖出下一代新种群其它n-1个基因串。采用转轮法作为选取方法,适应度大的基因串选择的机会大,从而被遗传到下一代的机会大。交叉和变异是产生新个体的遗传算子,交叉率太大,将使高适应度的基因串结构很快被破坏掉,太小则使搜索停止不前,一般取为0.5-0.9。变异率太大,将使遗传算法变为随机搜索,太小则不会产生新个体,一般取为0.01-0.1。使初始确定的一组支持向量机参数不断进化,直到训练目标满足条件为止。
归一化预处理
由于衡量的指标各不相同,原始样本各个分量数值的数量级有很大的差异,所以有必要对原始样本进行适度的规范化处理,对其输入幅值重新进行合理的调整,使其变化范围大致均匀分布在某一区间。本发明采用了如下式进行归一化预处理:
Pn=2×(p-minp)/(maxp-minp)(29)
其中p是欲归一化的样本数据,Pn是归一化后的值,maxp和minp是样本数据中的最大和最小值。即把样本数据转化为0~2之间的数据。
预测精度的测定
预测精度的一般含义:是指预测模型拟合的好坏程度,即由预测模型所产生的模拟值与历史实际值拟合程度的优劣。如何提高预测精度是预测研究的一项重要任务。
预测误差的方差公式为:
MSE = Σ i = 1 n e i 2 n = 1 n Σ i = 1 n ( y i - y ^ i ) 2
基于上述技术方案,本发明的具体实施如下:
采用人工智能和机器学习中的SVM方法,重点研究了影响港口船舶交通流量的各种因素,通过对影响船舶交通流量相关因素的分析,认为交通流量的解释变量应该能够反映当地经济的发展及港口的变化。本发明选择船舶进出港签证艘次为被解释变量,选择外轮进出艘次、对外贸易总额、所在港口GDP、集装箱标准箱、港口货物吞吐量5个因素作为解释变量,建立船舶进出港签证艘次与各解释变量之间的支持向量机回归模型如表1。研究中采用统计数据中1991年至2007年的17个样本作为训练样本,2008、2009年的数据作为测试样本对模型进行校验。应用MATLAB语言编写了GA-SVM船舶交通流量预测模型计算程序,遗传算法中(c,g)可行解范围设为[1,1000;0.01,20],种群规模为20,选择函数中选择最优个体的概率为0.08,交叉概率为0.8,变异概率为0.05,最大进化代数取为50,数据归一化、遗传优化参数g为0.125和c为11.3137、适应度值、预测误差的结果如图2至7所示。训练样本的准确率达到了99.97%,测试平均误差为4.63%。为了对GA-SVM模型的预报精度有更清晰的了解,将与SVM回归模型、SPO回归模型作比较,模型预测比较结果如表2所示。
表1宁波-舟山港船舶进出港签证艘次与各解释变量数据
Figure BDA0000037146530000132
Figure BDA0000037146530000141
表2预测方式的比较
上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (2)

1.基于遗传算法优化的支持向量回归船舶交通流量预测方法,其特征在于,所述预测方法包括如下步骤:
(1)通过加权主成分分析法把可能对船舶流量产生影响的因素维数降低,选取累计贡献率较高的影响因素;
(2)原始时序数据归一化预处理,生成数据集并分组,即把样本数据转化为0~1或者0~2之间的数据;
(3)选择核函数,确定SVM回归参数:得到数据集之后,选择径向基函数作为核函数,包含宽度参数、二次规划的优化参数;
(4)构造遗传算法优化的支持向量回归预测模型;
(5)输入数据集,生成预测函数;
(6)根据上一步骤生成的预测函数进行预测,并进行预测误差评价分析;如果误差较大则返回步骤2,重新调整参数,再次进行预测。
2.根据权利要求1所述的基于遗传算法优化的支持向量回归船舶交通流量预测方法,其特征在于,所述步骤(4)中的遗传算法优化步骤如下:
(4.1)随机产生一组支持向量机参数,采用某编码方案对每个支持向量机参数进行编码,进而构造初始群体;
(4.2)计算它的误差函数,从而确定其适应度,若误差越大,则适应度越小;
(4.3)选择若干适应度大的个体,直接遗传给下一代;
(4.4)利用遗传操作算子对当前一代群体进行处理,产生下一代群体;
(4.5)重复步骤(4.2),使初始确定的一组支持向量机参数不断进化,直到训练目标满足条件为止。
CN2010105813202A 2010-12-09 2010-12-09 基于遗传算法优化的支持向量回归船舶交通流量预测方法 Pending CN102005135A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105813202A CN102005135A (zh) 2010-12-09 2010-12-09 基于遗传算法优化的支持向量回归船舶交通流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105813202A CN102005135A (zh) 2010-12-09 2010-12-09 基于遗传算法优化的支持向量回归船舶交通流量预测方法

Publications (1)

Publication Number Publication Date
CN102005135A true CN102005135A (zh) 2011-04-06

Family

ID=43812462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105813202A Pending CN102005135A (zh) 2010-12-09 2010-12-09 基于遗传算法优化的支持向量回归船舶交通流量预测方法

Country Status (1)

Country Link
CN (1) CN102005135A (zh)

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102253301A (zh) * 2011-04-20 2011-11-23 哈尔滨工业大学 基于微分进化算法和回声状态网络静态分类的模拟电路故障诊断方法
CN102298706A (zh) * 2011-08-12 2011-12-28 河海大学 限制条件下内河航道船舶大型化预测方法
CN102324082A (zh) * 2011-09-08 2012-01-18 上海烟草集团有限责任公司 基于多元线性回归分析的卷烟市场价格预测方法
CN102590247A (zh) * 2012-03-05 2012-07-18 上海海事大学 一种基于x光图像处理技术的钢丝绳损伤检测方法
CN102663224A (zh) * 2012-03-07 2012-09-12 吉首大学 基于信息熵的交通流量集成预测模型
CN102841979A (zh) * 2012-06-26 2012-12-26 广州市新之地环保产业有限公司 一种基于pca-ga-svr的污泥回流量预测方法
CN102880881A (zh) * 2012-09-25 2013-01-16 常州大学 一种基于二类支持向量机和遗传算法的轿车车型识别方法
CN102902985A (zh) * 2012-10-10 2013-01-30 常州大学 基于二类支持向量机和粒子群算法的近海水质评价方法
CN103700255A (zh) * 2013-12-30 2014-04-02 复旦大学 一种基于时空关联数据挖掘的交通流预测方法
CN104091470A (zh) * 2014-07-15 2014-10-08 南京大学 一种基于多数据融合的航道交通信息预测方法及应用
CN104268639A (zh) * 2014-09-12 2015-01-07 河海大学常州校区 一种基于森林模型与改进遗传算法的船舶引航排班方法
CN104392119A (zh) * 2014-11-13 2015-03-04 成都新核中创信息科技有限公司 一种基于多相支持向量回归机的地震波峰波谷建模方法
CN104596572A (zh) * 2014-10-11 2015-05-06 芜湖扬宇机电技术开发有限公司 电缆监测系统及方法
CN104951834A (zh) * 2015-06-24 2015-09-30 上海大学 基于遗传算法和粒子群集成的lssvm风速预测方法
CN105118516A (zh) * 2015-09-29 2015-12-02 浙江图维电力科技有限公司 基于声音线性预测倒谱系数的工程机械的识别方法
CN105513428A (zh) * 2015-11-20 2016-04-20 大连海事大学 船舶定线制水域交通饱和度智能分析方法
CN106292296A (zh) * 2016-10-25 2017-01-04 大唐(北京)水务工程技术有限公司 基于ga‑svm的水岛加药在线控制方法和装置
CN106447098A (zh) * 2016-09-22 2017-02-22 许昌许继软件技术有限公司 一种光伏超短期功率预测方法及装置
CN106655186A (zh) * 2016-12-08 2017-05-10 国网青海省电力公司 一种离网光伏电站直流侧谐波的svc抑制指数预测方法
CN106779184A (zh) * 2016-11-30 2017-05-31 中国矿业大学 一种基于大数据建模的海上船舶流量预测方法
CN106951921A (zh) * 2017-03-14 2017-07-14 西安电子科技大学 基于贝叶斯多核学习支持向量机的sar目标识别方法
CN107025468A (zh) * 2017-05-18 2017-08-08 重庆大学 基于pca‑ga‑svm算法的高速公路拥堵识别方法
CN107292406A (zh) * 2016-03-30 2017-10-24 中国石油化工股份有限公司 基于向量回归机和遗传算法的地震属性优选方法
CN107316501A (zh) * 2017-06-28 2017-11-03 北京航空航天大学 一种基于网格搜索的支持向量机行程时间预测方法
CN107357966A (zh) * 2017-06-21 2017-11-17 山东科技大学 一种回采巷道围岩稳定性预测与评估方法
CN108038084A (zh) * 2017-12-08 2018-05-15 成都谷问信息技术有限公司 一种有效分类的信息处理系统
CN108875319A (zh) * 2018-05-29 2018-11-23 广西中烟工业有限责任公司 一种Windows环境下基于改进SVM的软件管理系统
CN109242133A (zh) * 2018-07-11 2019-01-18 北京石油化工学院 一种地表灾害预警的数据处理方法及系统
CN109905778A (zh) * 2019-01-03 2019-06-18 上海大学 基于组稀疏编码的单个非结构化视频的可扩展缩略的方法
CN109978270A (zh) * 2019-03-29 2019-07-05 大连海事大学 一种集装箱船航次装箱量预测方法
CN109977488A (zh) * 2019-03-05 2019-07-05 东南大学 基于支持向量回归的铸造铝合金流动性预测方法
CN110111606A (zh) * 2019-03-18 2019-08-09 上海海事大学 一种基于eemd-iaga-bp神经网络的船舶交通流预测方法
CN110163444A (zh) * 2019-05-28 2019-08-23 河北工程大学 一种基于gasa-svr的需水预测方法
CN110458054A (zh) * 2019-07-26 2019-11-15 哈尔滨工业大学 一种极化sar图像停泊舰船检测方法
CN111063218A (zh) * 2019-06-24 2020-04-24 武汉理工大学 一种船舶避碰决策方法
CN111191764A (zh) * 2019-12-30 2020-05-22 内蒙古工业大学 基于spgapso-svm算法的公交客流量试验方法及系统
CN111383469A (zh) * 2018-12-27 2020-07-07 上海宝康电子控制工程有限公司 基于大数据线性回归预测算法实现实时信号计算功能的方法
CN111639715A (zh) * 2020-06-01 2020-09-08 重庆大学 基于ls-svm的汽车仪表组装质量预测方法与系统
CN112329344A (zh) * 2020-11-03 2021-02-05 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 一种基于主成分分析法的风机风速软测量方法
CN112380945A (zh) * 2020-11-06 2021-02-19 中国电力科学研究院有限公司 一种输电通道环境隐患的识别方法和系统
CN112434466A (zh) * 2020-11-20 2021-03-02 福建商学院 一种基于遗传支持向量机的河口盐度预报模型
CN113139346A (zh) * 2021-05-06 2021-07-20 河北工业大学 一种基于iofa-svm的短期风电功率预测方法
CN113343433A (zh) * 2021-05-19 2021-09-03 暨南大学 基于kkt条件和差分进化算法的一阶可靠性分析方法
CN113408192A (zh) * 2021-05-31 2021-09-17 国网山东省电力公司营销服务中心(计量中心) 基于ga-fsvr的智能电表误差预测方法
CN113553391A (zh) * 2021-08-02 2021-10-26 中国港湾工程有限责任公司 一种基于gis技术的港口腹地划分方法
CN113657589A (zh) * 2021-07-08 2021-11-16 南方科技大学 优化问题的求解方法、系统、装置及存储介质
CN113722995A (zh) * 2021-08-30 2021-11-30 中南大学 一种岩石弹性变形能指数的测定方法、系统、终端及可读存储介质
CN113837474A (zh) * 2021-09-27 2021-12-24 北京信息科技大学 区域土壤重金属污染指数预测方法及装置
CN114005302A (zh) * 2021-10-15 2022-02-01 中远海运科技股份有限公司 沿海船舶空船指数生成方法及系统
CN114299633A (zh) * 2021-12-28 2022-04-08 中国电信股份有限公司 汽车驾驶事故预测方法、装置、电子设备及存储介质

Cited By (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102253301B (zh) * 2011-04-20 2013-07-10 哈尔滨工业大学 基于微分进化算法和回声状态网络静态分类的模拟电路故障诊断方法
CN102253301A (zh) * 2011-04-20 2011-11-23 哈尔滨工业大学 基于微分进化算法和回声状态网络静态分类的模拟电路故障诊断方法
CN102298706A (zh) * 2011-08-12 2011-12-28 河海大学 限制条件下内河航道船舶大型化预测方法
CN102298706B (zh) * 2011-08-12 2014-05-07 河海大学 限制条件下内河航道船舶大型化预测方法
CN102324082A (zh) * 2011-09-08 2012-01-18 上海烟草集团有限责任公司 基于多元线性回归分析的卷烟市场价格预测方法
CN102590247A (zh) * 2012-03-05 2012-07-18 上海海事大学 一种基于x光图像处理技术的钢丝绳损伤检测方法
CN102663224A (zh) * 2012-03-07 2012-09-12 吉首大学 基于信息熵的交通流量集成预测模型
CN102841979A (zh) * 2012-06-26 2012-12-26 广州市新之地环保产业有限公司 一种基于pca-ga-svr的污泥回流量预测方法
CN102880881A (zh) * 2012-09-25 2013-01-16 常州大学 一种基于二类支持向量机和遗传算法的轿车车型识别方法
CN102902985A (zh) * 2012-10-10 2013-01-30 常州大学 基于二类支持向量机和粒子群算法的近海水质评价方法
CN103700255A (zh) * 2013-12-30 2014-04-02 复旦大学 一种基于时空关联数据挖掘的交通流预测方法
CN103700255B (zh) * 2013-12-30 2015-10-07 复旦大学 一种基于时空关联数据挖掘的交通流预测方法
CN104091470A (zh) * 2014-07-15 2014-10-08 南京大学 一种基于多数据融合的航道交通信息预测方法及应用
CN104091470B (zh) * 2014-07-15 2016-05-11 南京大学 一种基于多数据融合的航道交通信息预测方法及应用
CN104268639A (zh) * 2014-09-12 2015-01-07 河海大学常州校区 一种基于森林模型与改进遗传算法的船舶引航排班方法
CN104268639B (zh) * 2014-09-12 2017-07-28 河海大学常州校区 一种基于森林模型与改进遗传算法的船舶引航排班方法
CN104596572A (zh) * 2014-10-11 2015-05-06 芜湖扬宇机电技术开发有限公司 电缆监测系统及方法
CN104392119A (zh) * 2014-11-13 2015-03-04 成都新核中创信息科技有限公司 一种基于多相支持向量回归机的地震波峰波谷建模方法
CN104951834A (zh) * 2015-06-24 2015-09-30 上海大学 基于遗传算法和粒子群集成的lssvm风速预测方法
CN105118516A (zh) * 2015-09-29 2015-12-02 浙江图维电力科技有限公司 基于声音线性预测倒谱系数的工程机械的识别方法
CN105513428A (zh) * 2015-11-20 2016-04-20 大连海事大学 船舶定线制水域交通饱和度智能分析方法
CN105513428B (zh) * 2015-11-20 2017-09-01 大连海事大学 船舶定线制水域交通饱和度智能分析方法
CN107292406A (zh) * 2016-03-30 2017-10-24 中国石油化工股份有限公司 基于向量回归机和遗传算法的地震属性优选方法
CN106447098B (zh) * 2016-09-22 2020-05-19 许昌许继软件技术有限公司 一种光伏超短期功率预测方法及装置
CN106447098A (zh) * 2016-09-22 2017-02-22 许昌许继软件技术有限公司 一种光伏超短期功率预测方法及装置
CN106292296B (zh) * 2016-10-25 2017-11-03 阳城国际发电有限责任公司 基于ga‑svm的水岛加药在线控制方法和装置
CN106292296A (zh) * 2016-10-25 2017-01-04 大唐(北京)水务工程技术有限公司 基于ga‑svm的水岛加药在线控制方法和装置
CN106779184B (zh) * 2016-11-30 2017-10-24 中国矿业大学 一种基于大数据建模的海上船舶流量预测方法
CN106779184A (zh) * 2016-11-30 2017-05-31 中国矿业大学 一种基于大数据建模的海上船舶流量预测方法
CN106655186A (zh) * 2016-12-08 2017-05-10 国网青海省电力公司 一种离网光伏电站直流侧谐波的svc抑制指数预测方法
CN106951921A (zh) * 2017-03-14 2017-07-14 西安电子科技大学 基于贝叶斯多核学习支持向量机的sar目标识别方法
CN107025468A (zh) * 2017-05-18 2017-08-08 重庆大学 基于pca‑ga‑svm算法的高速公路拥堵识别方法
CN107357966A (zh) * 2017-06-21 2017-11-17 山东科技大学 一种回采巷道围岩稳定性预测与评估方法
CN107357966B (zh) * 2017-06-21 2020-07-03 山东科技大学 一种回采巷道围岩稳定性预测的评估方法
CN107316501A (zh) * 2017-06-28 2017-11-03 北京航空航天大学 一种基于网格搜索的支持向量机行程时间预测方法
CN107316501B (zh) * 2017-06-28 2020-04-14 北京航空航天大学 一种基于网格搜索的支持向量机行程时间预测方法
CN108038084A (zh) * 2017-12-08 2018-05-15 成都谷问信息技术有限公司 一种有效分类的信息处理系统
CN108875319A (zh) * 2018-05-29 2018-11-23 广西中烟工业有限责任公司 一种Windows环境下基于改进SVM的软件管理系统
CN109242133B (zh) * 2018-07-11 2022-03-22 北京石油化工学院 一种地表灾害预警的数据处理方法及系统
CN109242133A (zh) * 2018-07-11 2019-01-18 北京石油化工学院 一种地表灾害预警的数据处理方法及系统
CN111383469A (zh) * 2018-12-27 2020-07-07 上海宝康电子控制工程有限公司 基于大数据线性回归预测算法实现实时信号计算功能的方法
CN109905778A (zh) * 2019-01-03 2019-06-18 上海大学 基于组稀疏编码的单个非结构化视频的可扩展缩略的方法
CN109905778B (zh) * 2019-01-03 2021-12-03 上海大学 基于组稀疏编码的单个非结构化视频的可扩展缩略的方法
CN109977488A (zh) * 2019-03-05 2019-07-05 东南大学 基于支持向量回归的铸造铝合金流动性预测方法
CN109977488B (zh) * 2019-03-05 2023-04-07 东南大学 基于支持向量回归的铸造铝合金流动性预测方法
CN110111606A (zh) * 2019-03-18 2019-08-09 上海海事大学 一种基于eemd-iaga-bp神经网络的船舶交通流预测方法
CN109978270A (zh) * 2019-03-29 2019-07-05 大连海事大学 一种集装箱船航次装箱量预测方法
CN110163444A (zh) * 2019-05-28 2019-08-23 河北工程大学 一种基于gasa-svr的需水预测方法
CN111063218A (zh) * 2019-06-24 2020-04-24 武汉理工大学 一种船舶避碰决策方法
CN110458054B (zh) * 2019-07-26 2021-07-06 哈尔滨工业大学 一种极化sar图像停泊舰船检测方法
CN110458054A (zh) * 2019-07-26 2019-11-15 哈尔滨工业大学 一种极化sar图像停泊舰船检测方法
CN111191764A (zh) * 2019-12-30 2020-05-22 内蒙古工业大学 基于spgapso-svm算法的公交客流量试验方法及系统
CN111639715A (zh) * 2020-06-01 2020-09-08 重庆大学 基于ls-svm的汽车仪表组装质量预测方法与系统
CN112329344A (zh) * 2020-11-03 2021-02-05 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 一种基于主成分分析法的风机风速软测量方法
CN112380945A (zh) * 2020-11-06 2021-02-19 中国电力科学研究院有限公司 一种输电通道环境隐患的识别方法和系统
CN112434466A (zh) * 2020-11-20 2021-03-02 福建商学院 一种基于遗传支持向量机的河口盐度预报模型
CN113139346A (zh) * 2021-05-06 2021-07-20 河北工业大学 一种基于iofa-svm的短期风电功率预测方法
CN113343433A (zh) * 2021-05-19 2021-09-03 暨南大学 基于kkt条件和差分进化算法的一阶可靠性分析方法
CN113343433B (zh) * 2021-05-19 2022-08-09 暨南大学 基于kkt条件和差分进化算法的一阶可靠性分析方法
CN113408192A (zh) * 2021-05-31 2021-09-17 国网山东省电力公司营销服务中心(计量中心) 基于ga-fsvr的智能电表误差预测方法
CN113657589A (zh) * 2021-07-08 2021-11-16 南方科技大学 优化问题的求解方法、系统、装置及存储介质
CN113657589B (zh) * 2021-07-08 2024-05-14 南方科技大学 优化问题的求解方法、系统、装置及存储介质
CN113553391A (zh) * 2021-08-02 2021-10-26 中国港湾工程有限责任公司 一种基于gis技术的港口腹地划分方法
CN113553391B (zh) * 2021-08-02 2024-05-10 中国港湾工程有限责任公司 一种基于gis技术的港口腹地划分方法
CN113722995A (zh) * 2021-08-30 2021-11-30 中南大学 一种岩石弹性变形能指数的测定方法、系统、终端及可读存储介质
CN113837474A (zh) * 2021-09-27 2021-12-24 北京信息科技大学 区域土壤重金属污染指数预测方法及装置
CN114005302A (zh) * 2021-10-15 2022-02-01 中远海运科技股份有限公司 沿海船舶空船指数生成方法及系统
CN114299633A (zh) * 2021-12-28 2022-04-08 中国电信股份有限公司 汽车驾驶事故预测方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN102005135A (zh) 基于遗传算法优化的支持向量回归船舶交通流量预测方法
US7162461B2 (en) Hybrid neural network generation system and method
Xiang et al. Forecasting short-term wind speed based on IEWT-LSSVM model optimized by bird swarm algorithm
CN108876001B (zh) 一种基于孪生支持向量机的短期电力负荷预测方法
CN109685277A (zh) 用电量预测方法及装置
Lv et al. A newly combination model based on data denoising strategy and advanced optimization algorithm for short-term wind speed prediction
Prasanna et al. An analysis on stock market prediction using data mining techniques
CN109858665A (zh) 基于特征筛选与anfis-pso的光伏短期功率预测方法
CN108876038A (zh) 大数据、人工智能、超算协同的材料性能预测方法
CN113780679B (zh) 一种基于泛在电力物联网的负荷预测方法及装置
Han et al. A Hybrid BPNN-GARF-SVR PredictionModel Based on EEMD for Ship Motion.
Wendong et al. A multi-factor analysis model of quantitative investment based on GA and SVM
Wang et al. Optimizing of SVM with hybrid PSO and genetic algorithm in power load forecasting
CN102708298B (zh) 一种车载通信系统电磁兼容指标分配方法
Zhai et al. Combining PSO-SVR and Random Forest Based Feature Selection for Day-ahead Peak Load Forecasting.
Jin et al. Carbon emission prediction models: A review
CN113962440A (zh) 一种融合dpc和gru的光伏预测方法和系统
Shen et al. An interval analysis scheme based on empirical error and MCMC to quantify uncertainty of wind speed
Mbarek et al. Using fuzzy logic to renewable energy forecasting: a case study of France
Zhang et al. A Novel Combined Model Based on Hybrid Data Decomposition, MSWOA and ENN for Short-Term Wind Speed Forecasting
Fan [Retracted] Research on Forecast of Macroeconomic Indicators Based on Multiobjective Optimization
Zhang et al. Integrating harmony search algorithm and deep belief network for stock price prediction model
Pourdaryaei et al. An efficient framework for short-term electricity price forecasting in deregulated power market
Wang et al. Research on House Price Forecast Based on Hyper Parameter Optimization Gradient Boosting Regression Model
Duan et al. Henry Hub monthly natural gas price forecasting using CEEMDAN–Bagging–HHO–SVR

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110406