CN104376148B - 一种基于相关性原理的动态样本点选取方法 - Google Patents

一种基于相关性原理的动态样本点选取方法 Download PDF

Info

Publication number
CN104376148B
CN104376148B CN201410582917.7A CN201410582917A CN104376148B CN 104376148 B CN104376148 B CN 104376148B CN 201410582917 A CN201410582917 A CN 201410582917A CN 104376148 B CN104376148 B CN 104376148B
Authority
CN
China
Prior art keywords
sample point
error
point
sample
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410582917.7A
Other languages
English (en)
Other versions
CN104376148A (zh
Inventor
常海超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
常海超
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 常海超 filed Critical 常海超
Priority to CN201410582917.7A priority Critical patent/CN104376148B/zh
Publication of CN104376148A publication Critical patent/CN104376148A/zh
Application granted granted Critical
Publication of CN104376148B publication Critical patent/CN104376148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于相关性原理的动态样本点选取方法,是基于相关性的原理,根据初始选取的样本点信息,计算每个样本点的留一误差,针对留一误差较大的样本点,采用变异函数计算每个变量方向留一误差的影响范围,进而确定该样本点处每个变量方向的加点区域范围,最后在每个加点区域增选样本点,实现样本点的针对性选取。本发明充分利用性能空间的特性来指导样本点的选取区间,进而实现样本点的“按需分配”,在样本点的选取上考虑了函数空间对样本点分布的需求,对应的近似模型的精确度明显高于一次性样本点选取所对应的近似模型,样本点的利用效率更高。

Description

一种基于相关性原理的动态样本点选取方法
技术领域
本发明涉及一种样本的的选取方法,具体是一种基于相关性原理的动态样本点选取方法。
背景技术
由于船型性能的数值计算很耗时,而船型优化中需要对成百上千的船型方案进行性能计算,因此为了提高船型优化的效率,实现其工程应用,往往需要构建船型相关性能的近似模型。在构建近似模型的过程中,样本点的选取至关重要,因为它为近似模型的构建提供数据依据。这里的每个样本点代表着一种方案,也就是一个船型方案。传统的做法是根据变量的变化范围,在变量空间Gs中均匀地选取样本点Pn(P1,P2,…Pn),然后计算每个样本点对应船型的相关性能,最后根据样本点的计算结果构建相关的近似模型,具体流程如图1所示。
这类方法的实质是把整个变量空间同等对待,没有考虑船型性能空间的差异性,本质上是一种静态的样本点选取方法。这一方式的优点是操作简单,易于实现,但缺点是样本点利用率不高,不能根据得到的性能空间信息进行样本点“有选择”地分布。因为其缺乏对船型性能F(X)空间特性的考虑,将整个变量空间同等考虑。某一区域样本点的数量仅取决于该变量区域在整个变量空间中所占比例的大小,而没有考虑该变量区域对应的船型性能空间的变化。如果该区域船型性能空间变化剧烈,则需要更多的样本点才能保证近似模型的精确度,反之较少的样本点就能构建出高精确度的近似模型。
以Farhang-Mehr函数为例,如果直接应用均匀设计方法在变量空间选取均匀分布的21个样本点,其分布如图2中点所示。可见样本点分布的多少仅与区间大小有关,即每个单位区域分布的样本点数量是一定的,但是将样本点对应到目标函数空间中,发现目标函数空间对样本点的需求却不是均衡的。在这种情况下,如果想提高近似模型的精确度只能通过不断地增加样本点数,这对实际优化问题来说是难以接受的。
对于船舶性能空间而言,同样存在上述问题。图3所示为船体曲面参数对应的船体兴波阻力空间,其中实线圆圈区域对应的性能空间较为平缓,虚线圆圈区域对应的性能空间振荡更加剧烈。而实线圆圈区域对应的变量空间稍大,因此采用均匀设计方法选取样本点时,该区域会比虚线圆圈区域有更多的样本点,但是从性能空间的特性来看,反而是虚线圆圈区域需要更多的样本点。此时采用均匀设计选取样本点就会存在样本点“分配”不合理的问题,没有实现样本点的“按需分配”。
发明内容
本发明的目的在于提供一种近似模型精确度更好、样本点利用率更高的基于相关性原理的动态样本点选取方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于相关性原理的动态样本点选取方法,是基于相关性的原理,根据初始选取的样本点信息,计算每个样本点的留一误差,针对留一误差较大的样本点,采用变异函数计算每个变量方向留一误差的影响范围,进而确定该样本点处每个变量方向的加点区域范围,最后在每个加点区域增选样本点,实现样本点的针对性选取;
所述基于相关性原理的动态样本点选取方法的具体流程,包括如下步骤:
1)首先确定优化变量及其取值范围,同时根据优化变量数和取值范围,采用均匀设计方法初次选取一定数量均匀分布的样本点;
2)计算初次选取的样本点的目标函数值,即对应船型的相关性能值;
3)将数据归一化处理便于分析以及后续神经网络近似模型的建立,再采用留一法分别计算每个初始样本点的留一误差,并判断其留一误差是否满足要求,如果所有样本点的留一误差均满足要求则构建整个性能空间的近似模型,否则继续进行后续步骤;
4)计算每个变量方向的变异函数,求取每个变量方向的变程,从而确定留一误差在该变量方向的影响范围;
5)针对每个留一误差较大的样本点,根据变程分别确定其在每个变量方向的加点区域范围,进而确定该样本点处的加点区域,最后采用均匀设计方法在每个加点区域增选样本点;
6)判断增选样本点后的样本点数是否达到优化所能承受的最大样本点数,如果达到,则构建整个性能空间的近似模型,否则继续进行后续步骤;
7)计算每个增选样本点的留一误差,如果留一误差满足要求,则构建整个性能空间的近似模型,否则计算增选样本点区域的变异函数,并回到步骤4)。
作为本发明进一步的方案:所述留一法的基本原理是从所有样本点中抽取一个作为测试点,用剩余的样本点构建近似模型,并用该近似模型对测试点进行预报,计算其留一误差,这一过程持续到每个样本点都被当作一次测试点为止。
作为本发明进一步的方案:所述变程是令距离为h的协方差减函数不为零的最大距离,代表了从存在相关性的状态向不存在相关性的状态转变的分界线。
作为本发明再进一步的方案:变异函数是用于描述变量变化程度的函数,描述变量的空间结构性,在整个空间的变异程度仅与距离有关,而与点的位置无关,它被定义为变量在某方向上相距h的增量的方差。
与现有技术相比,本发明的有益效果是:
本发明充分利用性能空间的特性来指导样本点的选取区间,进而实现样本点的“按需分配”,在样本点的选取上考虑了函数空间对样本点分布的需求,对应的近似模型的精确度明显高于一次性样本点选取所对应的近似模型,样本点的利用效率更高。
附图说明
图1为近似模型构建的一般流程示意图。
图2为Farhang-Mehr函数静态样本点的分布示意图。
图3为船体曲面参数对应的船体兴波阻力空间示意图。
图4为Farhang-Mehr函数动态样本点的分布及对比示意图。
图5为基于相关性原理的动态样本点选取方法的流程示意图。
图6为留一误差较大的点示意图之一。
图7为留一误差较大的点示意图之二。
图8为变异函数与协方差之间关系示意图。
图9为实施例中Peaks函数空间示意图。
图10为实施例中初次选取的样本点分布示意图。
图11为实施例中增选样本点的区域示意图。
图12为实施例中增选样本点的分布示意图。
图13为实施例中对比样本点分布示意图。
图14为实施例中选取的测试点分布示意图之一。
图15为实施例中选取的测试点分布示意图之二。
图16为实施例中选取的测试点分布示意图之三。
图17为实施例中选取的测试点分布示意图之四。
图18为实施例中近似模型的平均绝对预报误差示意图。
图19为实施例中近似模型的平均相对误差示意图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
一种基于相关性原理的动态样本点选取方法,是基于相关性的原理,根据初始选取的样本点信息,计算每个样本点的留一误差,针对留一误差较大的样本点,采用变异函数计算每个变量方向留一误差的影响范围,进而确定该样本点处每个变量方向的加点区域范围,最后在每个加点区域增选样本点,实现样本点的针对性选取,即根据初次选取样本点反馈的性能空间信息,判断需要增加样本的区域,然后在各区域内分别增加样本,最后构建近似模型,充分利用性能空间的特性来指导样本点的选取区间,进而实现样本点的“按需分配”。
请参阅图4,对于Farhang-Mehr函数,考虑其函数空间特性,可见应用动态样本点选取方法后,样本点更能体现函数空间的特性,对构建高精确度的近似模型更加有利。
请参阅图5,所述基于相关性原理的动态样本点选取方法的具体流程,包括如下步骤:
1)首先确定优化变量及其取值范围,同时根据优化变量数和取值范围,采用均匀设计方法初次选取一定数量均匀分布的样本点;
2)计算初次选取的样本点的目标函数值,即对应船型的相关性能值;
3)将数据归一化处理便于分析以及后续神经网络近似模型的建立,再采用留一法分别计算每个初始样本点的留一误差,并判断其留一误差是否满足要求,如果所有样本点的留一误差均满足要求则构建整个性能空间的近似模型,否则继续进行后续步骤;
4)计算每个变量方向的变异函数,求取每个变量方向的变程,从而确定留一误差在该变量方向的影响范围;
5)针对每个留一误差较大的样本点,根据变程分别确定其在每个变量方向的加点区域范围,进而确定该样本点处的加点区域,最后采用均匀设计方法在每个加点区域增选样本点;
6)判断增选样本点后的样本点数是否达到优化所能承受的最大样本点数,如果达到,则构建整个性能空间的近似模型,否则继续进行后续步骤;
7)计算每个增选样本点的留一误差,如果留一误差满足要求,则构建整个性能空间的近似模型,否则计算增选样本点区域的变异函数,并回到步骤4)。
所述留一法最初是用来验证近似模型的精确度,留一法的基本原理是从所有样本点中抽取一个作为测试点,用剩余的样本点构建近似模型,并用该近似模型对测试点进行预报,计算其留一误差,这一过程持续到每个样本点都被当作一次测试点为止。
xi点处的留一误差的计算公式如下:
式中y(xi)表示实际目标函数值,表示近似模型预报值。
请参阅图6,留一法不仅仅能够用来衡量近似模型的精确度,还可以用它来确定某些样本点附近是否有足够的样本点分布,即样本点附近是否需要增选样本点,图6中计算方框点处的留一误差时,因为其附近点的目标函数值与该点的值相差较大,空间变化剧烈,因此该点处拟合的曲线,即图中虚线与实际曲线有较大差别,导致则该点处的预报误差较大,即留一误差较大。
在采用留一法确定了误差较大的样本点之后,为了弥补该处样本点不足的问题,需要在该样本点附近增加样本。增选样本点首先需要确定留一误差的影响范围,然后在该范围内再增加样本点。统计学中的协方差函数是用来表征数据之间相关程度的函数,因此通过该函数来定义留一误差影响范围。
协方差函数表示随机变量Z(x)和Z(x+h)之间的相关程度,通常是距离为h的减函数。当点x和x+h之间的距离太大时,Z(x)和Z(x+h)之间的相关程度往往会消失,即当|h|→∞,有C(h)→0。实际上,只要h大到一定程度,两点之间的就可以认为不具有相关性,即当|h|≥a,有C(h)=0;令C(h)不为零的最大距离a称为变程,代表了从存在相关性的状态向不存在相关性的状态转变的分界线。
变异函数是用于描述变量变化程度的函数,也就是变异程度,它既能描述变量的空间结构性,在整个空间的变异程度仅与距离有关,而与点的位置无关,它被定义为变量在某方向上相距h的增量的方差。其定义如下:
在二阶平稳假设或者本征假设下,变异函数为:
在二阶平稳假设或者本征假设下,协方差函数为:
则变异函数与协方差函数的关系为:
γ(h)=C(0)-C(h) (5)
可见当两点之间的距离h达到变程a时,变异函数的值达到稳定,此时协方差为0,也就是两者之间不再具有相关性。因此采用变异函数来判断留一误差较大点的影响范围,也就是求取其变程a。
在实际计算中,变异函数的计算采用如下公式:
其中h为两点之间的距离,N(h)是间距为h的样本点对数。
针对不同距离h分别求取其变异函数值,当变异函数值趋于稳定时所对应的距离h值即为变程a,则变量xi方向增选样本点的范围为[xi-a,xi+a]。
实施例
请参阅图9-19,采用Peaks函数作为优化变量,Peaks函数的表达式为:
请参阅图10,采用均匀设计方法在Peaks函数上午整个空间选取33个样本点,并将数据归一化。然后采用留一法分别计算每个样本点的留一误差,近似模型采用径向基神经网络模型,分别计算x方向和y方向的变异函数,得到变程值ax和ay,如表1所示:
表1变量的变程
经过比较,留一误差较大点分别为第12点、第14点、第15点、第16点、第17点、第18点、第19点、第21点和第22点,根据每个变量方向的变程值ax和ay,计算得到每个样本点处的加点范围,如表2和图11所示:
表2加点区域
其中第12点与第19点、第14点与第21点、第15点与第22点的加点区域有重合部分,因此将其合并成一个加点区域,增选的样本点分布如图12所示,经过增选,样本点总数达到100个。
作为对比,采用均匀设计方法选取了100个均匀分布的样本点作为对比,如图13所示,并分别采用径向基神经网络回归近似模型。同时采用LHS方法选取四组测试点,每组100个点,如图14-17所示,分别用回归的近似模型对其进行预报,近似模型精确度采用平均绝对预报误差MAPE和平均相对误差RAAE进行评价,其中:
式中n为样本数,表示近似模型预报值,yi表示目标函数实际值,STD表示标准差。
对比结果如图18、图19和表3所示:
表3近似模型精确度比较
通过对测试点预报结果对比可以得出如下结论:
由于均匀设计方法选取的样本点在变量空间内均匀分布,没有考虑函数空间的特点,而动态样本点选取方法考虑了函数空间对样本点分布的需求,因此在同样数量的样本点下,对于同一组测试点,动态样本点选取方法所对应的近似模型的精确度明显要高于均匀设计方法。例如对于第1组测试点,均匀设计方法对应的近似模型的MAPE值为13.967,RAAE值为0.076,而动态样本点选取方法对应的近似模型的MAPE值为2.633,RAAE值为0.067。MAPE值降低了81.1%,RAAE值降低了11.8%,这说明动态样本点选取方法对应的近似模型精确度明显高于一次性样本点选取所对应的近似模型,样本点的利用效率更高。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下作出各种变化。

Claims (4)

1.一种基于相关性原理的动态样本点选取方法,其特征在于,是基于相关性的原理,根据初始选取的样本点信息,计算每个样本点的留一误差,针对留一误差较大的样本点,采用变异函数计算每个变量方向留一误差的影响范围,进而确定该样本点处每个变量方向的加点区域范围,最后在每个加点区域增选样本点,实现样本点的针对性选取;基于相关性原理的动态样本点选取方法的具体流程,包括如下步骤:
1)首先确定优化变量及其取值范围,同时根据优化变量数和取值范围,采用均匀设计方法初次选取一定数量均匀分布的样本点;
2)计算初次选取的样本点的目标函数值,即对应船型的相关性能值;
3)将数据归一化处理便于分析以及后续神经网络近似模型的建立,再采用留一法分别计算每个初始样本点的留一误差,并判断其留一误差是否满足要求,如果所有样本点的留一误差均满足要求则构建整个性能空间的近似模型,否则继续进行后续步骤;
4)计算每个变量方向的变异函数,求取每个变量方向的变程,从而确定留一误差在该变量方向的影响范围;
5)针对每个留一误差较大的样本点,根据变程分别确定其在每个变量方向的加点区域范围,进而确定该样本点处的加点区域,最后采用均匀设计方法在每个加点区域增选样本点;
6)判断增选样本点后的样本点数是否达到优化所能承受的最大样本点数,如果达到,则构建整个性能空间的近似模型,否则继续进行后续步骤;
7)计算每个增选样本点的留一误差,如果留一误差满足要求,则构建整个性能空间的近似模型,否则计算增选样本点区域的变异函数,并回到步骤4)。
2.根据权利要求1所述的基于相关性原理的动态样本点选取方法,其特征在于,所述留一法的基本原理是从所有样本点中抽取一个作为测试点,用剩余的样本点构建近似模型,并用该近似模型对测试点进行预报,计算其留一误差,这一过程持续到每个样本点都被当作一次测试点为止。
3.根据权利要求1所述的基于相关性原理的动态样本点选取方法,其特征在于,所述变程是令距离为h的协方差减函数不为零的最大距离,代表了从存在相关性的状态向不存在相关性的状态转变的分界线。
4.根据权利要求1所述的基于相关性原理的动态样本点选取方法,其特征在于,所述变异函数是用于描述变量变化程度的函数,描述变量的空间结构性,在整个空间的变异程度仅与距离有关,而与点的位置无关,它被定义为变量在某方向上相距h的增量的方差。
CN201410582917.7A 2014-10-28 2014-10-28 一种基于相关性原理的动态样本点选取方法 Active CN104376148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410582917.7A CN104376148B (zh) 2014-10-28 2014-10-28 一种基于相关性原理的动态样本点选取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410582917.7A CN104376148B (zh) 2014-10-28 2014-10-28 一种基于相关性原理的动态样本点选取方法

Publications (2)

Publication Number Publication Date
CN104376148A CN104376148A (zh) 2015-02-25
CN104376148B true CN104376148B (zh) 2017-11-17

Family

ID=52555054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410582917.7A Active CN104376148B (zh) 2014-10-28 2014-10-28 一种基于相关性原理的动态样本点选取方法

Country Status (1)

Country Link
CN (1) CN104376148B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207934A (zh) * 2013-04-08 2013-07-17 常海超 一种船型融合空间的典型样本点选取方法
CN103530435A (zh) * 2013-05-07 2014-01-22 常海超 一种基于敏感度的船体型线设计方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060036561A1 (en) * 2002-09-27 2006-02-16 Carnegie Mellon University Pattern search algorithm for component layout
US8892412B2 (en) * 2009-03-11 2014-11-18 Exxonmobil Upstream Research Company Adjoint-based conditioning of process-based geologic models

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207934A (zh) * 2013-04-08 2013-07-17 常海超 一种船型融合空间的典型样本点选取方法
CN103530435A (zh) * 2013-05-07 2014-01-22 常海超 一种基于敏感度的船体型线设计方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
极限学习机的快速留一交叉验证算法;刘学艺等;《上海交通大学学报》;20110831;全文 *
船型优化中样本点选取方法对近似模型精度的影响研究;常海超等;《中国造船》;20131231;全文 *
近似技术在船型阻力性能优化中的应用研究;常海超等;《中国造船》;20120331;全文 *

Also Published As

Publication number Publication date
CN104376148A (zh) 2015-02-25

Similar Documents

Publication Publication Date Title
CN112365029B (zh) 用于空调负荷预测的缺失值处理方法及空调负荷预测系统
CN104866692A (zh) 一种基于自适应代理模型的飞行器多目标优化方法
CN108052387B (zh) 一种移动云计算中的资源分配预测方法及系统
CN107451102A (zh) 一种改进自训练算法的半监督高斯过程回归软测量建模方法
CN106709625A (zh) 一种电力市场需求响应规划评估方法
CN108074015B (zh) 一种风电功率超短期预测方法及系统
CN105225149A (zh) 一种征信评分确定方法及装置
CN106599230A (zh) 一种分布式数据挖掘模型评估的方法与系统
CN108564592A (zh) 基于动态多种群集成差分进化算法的图像分割方法
CN110428270A (zh) 基于逻辑回归算法的渠道潜在偏好客户识别方法
CN103106535A (zh) 一种基于神经网络解决协同过滤推荐数据稀疏性的方法
CN104070083A (zh) 一种基于集成pca-elm穿孔机导盘转速测量方法
CN110490369A (zh) 一种基于ewt和lssvm模型的短期电力负荷预测方法
Cheng et al. Application of a modified CES production function model based on improved PSO algorithm
CN109241493A (zh) 基于马尔可夫随机场和em算法的关键性能指标软测量方法
CN103853939A (zh) 一种基于社会经济因素影响的电力系统月度负荷的组合预测方法
Chen et al. Combining fuzzy iteration model with dynamic programming to solve multiobjective multistage decision making problems
CN112819225A (zh) 基于bp神经网络和arima模型的碳市场价格预测方法
CN109902267B (zh) 一种受下游湖泊顶托影响的河道安全泄量计算方法
CN109598070A (zh) 一种时间序列预测方法及平台
CN104376148B (zh) 一种基于相关性原理的动态样本点选取方法
CN110751400B (zh) 一种风险评估方法及装置
CN111461329A (zh) 一种模型的训练方法、装置、设备及可读存储介质
CN106202694A (zh) 基于组合预测方法的组合Kriging模型构建方法
CN106875101B (zh) 一种能源管理系统控制方法及控制装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Chang Haichao

Inventor after: Liu Zuyuan

Inventor after: Feng Baiwei

Inventor after: Cheng Xide

Inventor after: Zhan Chengsheng

Inventor before: Chang Haichao

CB03 Change of inventor or designer information
TR01 Transfer of patent right

Effective date of registration: 20180724

Address after: 430070 Hubei Province, Wuhan city Hongshan District Luoshi Road No. 122

Patentee after: Wuhan University of Technology

Address before: 430000 1040 Heping Road, Wuchang District, Wuhan, Hubei.

Patentee before: Chang Haichao

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180925

Address after: No. 122, Lo lion Road, Hongshan District, Wuhan, Hubei

Patentee after: Wuhan University of Technology

Address before: 430000 1040 Heping Road, Wuchang District, Wuhan, Hubei.

Patentee before: Chang Haichao

TR01 Transfer of patent right