CN107025349A - 基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法 - Google Patents

基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法 Download PDF

Info

Publication number
CN107025349A
CN107025349A CN201710232173.XA CN201710232173A CN107025349A CN 107025349 A CN107025349 A CN 107025349A CN 201710232173 A CN201710232173 A CN 201710232173A CN 107025349 A CN107025349 A CN 107025349A
Authority
CN
China
Prior art keywords
tantile
function
formula
maximum entropy
confidence interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710232173.XA
Other languages
English (en)
Inventor
温卫东
吴福仙
陈波
翁晶萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201710232173.XA priority Critical patent/CN107025349A/zh
Publication of CN107025349A publication Critical patent/CN107025349A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/13Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/04Ageing analysis or optimisation against ageing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Architecture (AREA)
  • Civil Engineering (AREA)
  • Structural Engineering (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提出基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法,其包括步骤1)建立基于第k次序统计量分散系数法的最大熵分位值函数置信区间估计模型;2)将全体次序统计量边界系数视为服从某概率分布,结合最大熵分位值函数模型建立基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法。本发明提出的基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法能成功地应用于小样本情况下航空结构件可靠性分析中的分位值函数置信区间估计问题,相比现有的小样本模型及方法,本发明的分位值函数置信区间估计精度及稳定性均较高,提高了航空结构件可靠性评定置信水平。

Description

基于概率边界系数法的最大熵分位值函数置信区间估计模型 与方法
技术领域
本发明涉及航空结构件可靠性评估领域,具体涉及小样本情况下航空结构件可靠性分析中的分位值函数置信区间估计。
背景技术
由于航空结构件实验成本昂贵、周期长,工程上一般仅能通过少量构件实验确定其安全寿命,若基于经典统计学模型进行可靠性评定,由于现场实验数据少,评定结果置信度低,难以反映航空结构件的真实可靠性水平。发展用较少样本个数得到高置信度预测结果和给定置信度、误差情况下确定最少样本个数是目前工程上研究热点,因此研究小样本条件下的航空结构件分位值函数置信区间估计模型与方法具有重要的工程和理论意义。
目前应用较多的小样本技术(分位值函数置信区间估计模型与方法)包括Bayes方法、Bootstrap方法及分散系数法等,但每种方法都存在各自的缺点:(1)Bayes方法必须要事先知道先验分布,若没有先验信息则无法应用;(2)Bootstrap方法计算稳定性受样本个数的影响,特别在样本个数较少时较为明显;(3)应用分散系数法时需事先确定样本的概率分布类型及参数,会引入人为假设误差。
发明内容
发明目的:为了克服上述现有模型的缺点,提高在小样本情况下航空结构件分位值函数置信区间估计精度及稳定性,本发明提出了基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法。
本发明采用如下技术方案:基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法,其包括如下步骤:
1)建立基于第k次序统计量分散系数法的最大熵分位值函数置信区间估计模型
若X是一个连续随机变量,x为随机变量X的实现值,则其概率密度函数为f(x),累积分布函数为F(x),次序统计量表示为(X(1)≤X(2)≤…≤X(n)),则第k次序统计量X(k)的概率密度函数fk(x)为:
由式(1)推导出第k次序统计量X(k)的累积分布函数Fk(x)为:
定义第k次序统计量X(k)置信水平为γ的置信上限X(k)γ满足:
P(X(k)<X(k)γ)=γ (15)
令u(k)=F(X(k)γ),将式(3)代入式(2),则u(k)由下式求出:
在γ置信限下,随机变量X基于第k次序统计量的分位值估计表示为:
式中,u表示累积分布函数,x(k)表示随机变量X的第k次序统计量样本,SF(k,γ,u)表示分散系数,由下式确定:
式中,X(u)表示随机变量X的理论分位值函数;将式(6)代入式(5),得到随机变量X在γ置信限下、基于第k次序统计量的分位值函数估计
设随机变量X的理论分位值函数X(u)可根据随机样本值应用最大熵分位值函数模型近似确定,则理论分位值函数X(u)表示为:
式中,λqf,j(j=0,1,...,m)为拉格朗日乘子,m表示拉格朗日乘子阶数;
将式(8)代入式(7),同时考虑式(2)-式(4),则得到随机变量X基于次序样本(x(1)≤x(2)≤…≤x(n)),在γ置信限下、基于第k次序统计量的分位值函数估计
式中,当γ>0.5时,为γ置信下限的分位值函数;当γ<0.5,为(1-γ)置信上限分位值函数;u(k)由式(4)确定;式(9)为基于第k次序统计量分散系数法的最大熵分位值函数置信区间估计模型;
2)建立基于概率边界系数法的最大熵分位值函数置信区间估计模型
基于式(9),定义B(k)(γ)为第k次序统计量、置信度为γ的边界系数:
则式(9)为:
B(k)(γ)由统计量次序及样本值决定,且各个次序统计量边界系数不相等;将置信度为γ的边界系数B(k)(γ)视为随机变量B′(γ),各次序统计量边界系数B(k)(γ)为随机变量B′(γ)的样本值;则基于概率边界系数法的最大熵分位值函数置信区间估计模型为:
式(12)中,表示置信度为γ、累积分布函数值为u的分位值函数;B′(γ,p)为随机变量B′(γ)可靠度为p的分位值。
优选的,步骤1)中,拉格朗日乘子λqf,j(j=0,1,...,m)由对偶型最大熵分位值函数模型、无约束最小二乘最大熵分位值函数模型或带约束最小二乘最大熵分位值函数模型确定。
优选的,步骤1)中,所述次序统计量分散系数法为最大次序统计量分散系数法或最小次序统计量分散系数法,式(9)为基于第k最大次序统计量分散系数法的最大熵分位值函数置信区间估计模型时式(9)中k取1;式(9)为基于第k最小次序统计量分散系数法的最大熵分位值函数置信区间估计模型时式(9)中k取n。
优选的,步骤2)中,针对样本个数一般、较多或较少时p的取值为0.5、0.4或0.7。
本发明具有如下有益效果:
本发明基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法能够成功地应用于小样本情况下航空结构件可靠性分析分位值函数置信区间估计问题,相比现有的小样本模型及方法,本发明的分位值函数置信区间估计精度及稳定性均较高,提高了航空结构件可靠性评定置信水平。
附图说明
图1为基于最小、最大分散系数法组合的最大熵分位值函数置信区间估计模型与基于概率边界系数法的最大熵分位值函数置信区间估计模型计算精度对比。
图2为基于最小、最小分散系数法组合的最大熵分位值函数置信区间估计模型与基于概率边界系数法的最大熵分位值函数置信区间估计模型计算精度对比。
图3为基于最大、最小分散系数法组合的最大熵分位值函数置信区间估计模型与基于概率边界系数法的最大熵分位值函数置信区间估计模型计算精度对比。
图4为基于最大、最大分散系数法组合的最大熵分位值函数置信区间估计模型与基于概率边界系数法的最大熵分位值函数置信区间估计模型计算精度对比。
图5置信上限边界系数的正态概率坐标图。
图6置信下限边界系数的正态概率坐标图。
具体实施方式:
本发明包括如下步骤:
1)建立基于第k次序统计量分散系数法的最大熵分位值函数置信区间估计模型
若X是一个连续随机变量,x为随机变量X的实现值,则其概率密度函数为f(x),累积分布函数为F(x),次序统计量表示为(X(1)≤X(2)≤…≤X(n)),则第k次序统计量X(k)的概率密度函数fk(x)为:
由式(1)推导出第k次序统计量X(k)的累积分布函数Fk(x)为:
定义第k次序统计量X(k)置信水平为γ的置信上限X(k)γ满足:
P(X(k)<X(k)γ)=γ (3)
令u(k)=F(X(k)γ),将式(3)代入式(2),则u(k)可由下式求出:
在γ置信限下,随机变量X基于第k次序统计量的分位值估计可表示为:
式中,u表示累积分布函数,x(k)表示随机变量X的第k次序统计量样本,SF(k,γ,u)表示分散系数,由下式确定:
式中,X(u)表示随机变量X的理论分位值函数。将式(6)代入式(5),得到随机变量X在γ置信限下、基于第k次序统计量的分位值函数估计
设随机变量X的理论分位值函数X(u)可根据随机样本值应用最大熵分位值函数模型近似确定,则理论分位值函数X(u)可表示为:
式中,λqf,j(j=0,1,...,m)为拉格朗日乘子,m表示拉格朗日乘子阶数,拉格朗日乘子可由对偶型最大熵分位值函数模型、无约束最小二乘最大熵分位值函数模型、带约束最小二乘最大熵分位值函数模型等确定。
将式(8)代入式(7),同时考虑式(2)-式(4),则得到随机变量X基于次序样本(x(1)≤x(2)≤…≤x(n)),在γ置信限下、基于第k次序统计量的分位值函数估计
式中,当γ>0.5时,为γ置信下限的分位值函数;当γ<0.5,为(1-γ)置信上限分位值函数;u(k)由式(4)确定。称式(9)为基于第k次序统计量分散系数法的最大熵分位值函数置信区间估计模型。工程中,常用的分散系数法有最大、最小次序统计量分散系数法,对应式(9)中k分别取1和n。
2)建立基于概率边界系数法的最大熵分位值函数置信区间估计模型
由于基于最大、最小次序统计量分散系数法的最大熵分位值函数置信区间估计模型计算精度容易受到样本影响,导致计算结果不稳定。针对这个问题,本发明进一步提出基于概率边界系数法的最大熵分位值函数置信区间估计模型(PQFCIM)。
基于式(9),定义B(k)(γ)为第k次序统计量、置信度为γ的边界系数:
则式(9)可写成:
B(k)(γ)由统计量次序及样本值决定,且各个次序统计量边界系数不相等。由于实际样本的随机性,各次序统计量边界系数B(k)(γ)也具有随机性,若使用单次序统计量边界系数确定分位值函数(式(11)),计算结果受样本值影响较大,稳定性不高。本发明将置信度为γ的边界系数B(k)(γ)视为随机变量B′(γ),各次序统计量边界系数B(k)(γ)为随机变量B′(γ)的样本值;提出基于概率边界系数法的最大熵分位值函数置信区间估计模型
式中,表示置信度为γ、累积分布函数值为u的分位值函数;B′(γ,p)为随机变量B′(γ)可靠度为p的分位值。p的取值可根据经验选取,一般取0.5;p值越小,置信区间长度越短,计算结果越危险;p值越大,置信区间长度越长,计算结果越保守;研究表明当样本较少时(5个样本)可取0.7,样本较多时(大于10个样本)可取0.4。
下面结合附图和实施例对本发明进一步说明。
令X服从对数正态分布logN(0,0.3),对数均值为0,对数标准差为0.3;利用MonteCarlo方法产生15个样本,应用基于概率边界系数法的最大熵分位值函数置信区间估计模型(PQFCIM)估算随机变量X的分位值函数置信区间包括如下步骤:
1)将随机变量X的样本点按从小到大排序,应用中位秩公式得到随机样本点的经验累积分布函数值,称排序后的样本点为中位秩点,如图1-图4中的Middle rank methodpoint。
2)应用带约束最小二乘最大熵分位值函数模型获得50%置信水平的分位值函数,见图1-图4中的CDF curve based on LSMEQFMCC,分位值函数公式见式(8)。
3)将50%置信水平的分位值函数近似代替随机变量X的理论分位值函数。
4)应用式(10)计算各中位秩点对应的置信度为γ的边界系数B(k)(γ),本例中γ=0.95。
5)基于15个边界系数确定随机变量B′(γ)的分布类型及分布参数。本例中置信上限及置信下限的随机变量B′(γ)都服从正态分布,见图5-图6,表1。
6)由经验选取随机变量B′(γ)可靠度p,获得对应的分位值B′(γ,p),本例中由于样本个数较多,取p=0.4。由公式(12)得到随机变量X置信度为95%的置信上限及下限曲线,见图1-图4中的Upper and lower bounds based on PQFCIM。
7)同时,为了验证基于概率边界系数法的最大熵分位值函数置信区间估计模型(PQFCIM)的优越性,本例应用基于分散系数法组合的最大熵分位值函数置信区间估计模型(SQFCIM)来估算随机变量X的分位值函数置信区间,并比较两种模型的计算精度与稳定性。分散系数法组合采用四种组合(最大(Max)、最小(Min)次序统计量分散系数法两两组合),包括[Min,Min],[Min,Max],[Max,Min],[Max,Max]分散系数法组合。
8)图1-图4及表2显示:[Min,Min]、[Max,Min]、[Max,Max]组合SQFCIM计算精度较差,均不能满足置信度要求。分析其原因为SQFCIM易受样本点取值影响,本例中应用最大次序统计量分散系数法估算分位值函数置信下限、最小次序统计量分散系数法估算分位值函数置信上限时,样本值处于置信区间外侧导致计算失败。
PQFCIM与[Min,Max]组合SQFCIM均使样本全部落入置信区间,置信区间相对误差分别为41.749%、53.165%。进一步说明PQFCIM较SQFCIM不仅稳定性好且计算精度高。相对误差定义如下式:
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
表1边界系数正态分布参数估计
表2SQFCIM与PQFCIM计算精度对比列表

Claims (4)

1.基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法,其特征在于,包括如下步骤:
1)建立基于第k次序统计量分散系数法的最大熵分位值函数置信区间估计模型
若X是一个连续随机变量,x为随机变量X的实现值,则其概率密度函数为f(x),累积分布函数为F(x),次序统计量表示为(X(1)≤X(2)≤…≤X(n)),则第k次序统计量X(k)的概率密度函数fk(x)为:
由式(1)推导出第k次序统计量X(k)的累积分布函数Fk(x)为:
定义第k次序统计量X(k)置信水平为γ的置信上限X(k)γ满足:
P(X(k)<X(k)γ)=γ (3)
令u(k)=F(X(k)γ),将式(3)代入式(2),则u(k)由下式求出:
在γ置信限下,随机变量X基于第k次序统计量的分位值估计表示为:
式中,u表示累积分布函数,x(k)表示随机变量X的第k次序统计量样本,SF(k,γ,u)表示分散系数,由下式确定:
式中,X(u)表示随机变量X的理论分位值函数;将式(6)代入式(5),得到随机变量X在γ置信限下、基于第k次序统计量的分位值函数估计
设随机变量X的理论分位值函数X(u)可根据随机样本值应用最大熵分位值函数模型近似确定,则理论分位值函数X(u)表示为:
式中,λqf,j(j=0,1,...,m)为拉格朗日乘子,m表示拉格朗日乘子阶数;
将式(8)代入式(7),同时考虑式(2)-式(4),则得到随机变量X基于次序样本(x(1)≤x(2)≤…≤x(n)),在γ置信限下、基于第k次序统计量的分位值函数估计
式中,当γ>0.5时,为γ置信下限的分位值函数;当γ<0.5,为(1-γ)置信上限分位值函数;u(k)由式(4)确定;式(9)为基于第k次序统计量分散系数法的最大熵分位值函数置信区间估计模型;
2)建立基于概率边界系数法的最大熵分位值函数置信区间估计模型
基于式(9),定义B(k)(γ)为第k次序统计量、置信度为γ的边界系数:
则式(9)为:
B(k)(γ)由统计量次序及样本值决定,且各个次序统计量边界系数不相等;将置信度为γ的边界系数B(k)(γ)视为随机变量B′(γ),各次序统计量边界系数B(k)(γ)为随机变量B′(γ)的样本值;则基于概率边界系数法的最大熵分位值函数置信区间估计模型为:
式(12)中,表示置信度为γ、累积分布函数值为u的分位值函数;B′(γ,p)为随机变量B′(γ)可靠度为p的分位值。
2.根据权利要求1所述的基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法,其特征在于,步骤1)中,拉格朗日乘子λqf,j(j=0,1,...,m)由对偶型最大熵分位值函数模型、无约束最小二乘最大熵分位值函数模型或带约束最小二乘最大熵分位值函数模型确定。
3.根据权利要求1所述的基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法,其特征在于,步骤1)中,所述次序统计量分散系数法为最大次序统计量分散系数法或最小次序统计量分散系数法,式(9)为基于第k最大次序统计量分散系数法的最大熵分位值函数置信区间估计模型时式(9)中k取1;式(9)为基于第k最小次序统计量分散系数法的最大熵分位值函数置信区间估计模型时式(9)中k取n。
4.根据权利要求1所述的基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法,其特征在于,步骤2)中,针对样本个数一般、较多或较少时p的取值为0.5、0.4或0.7。
CN201710232173.XA 2017-04-11 2017-04-11 基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法 Pending CN107025349A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710232173.XA CN107025349A (zh) 2017-04-11 2017-04-11 基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710232173.XA CN107025349A (zh) 2017-04-11 2017-04-11 基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法

Publications (1)

Publication Number Publication Date
CN107025349A true CN107025349A (zh) 2017-08-08

Family

ID=59526368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710232173.XA Pending CN107025349A (zh) 2017-04-11 2017-04-11 基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法

Country Status (1)

Country Link
CN (1) CN107025349A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109768549A (zh) * 2019-01-23 2019-05-17 东北电力大学 一种电力系统热稳定安全域构建的方法
CN110758480A (zh) * 2019-08-20 2020-02-07 北京交通大学 数据通信系统中轨旁传输媒介的故障检测方法及装置
CN110991789A (zh) * 2019-10-17 2020-04-10 腾讯科技(深圳)有限公司 置信区间的确定方法和装置、存储介质及电子装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109768549A (zh) * 2019-01-23 2019-05-17 东北电力大学 一种电力系统热稳定安全域构建的方法
CN110758480A (zh) * 2019-08-20 2020-02-07 北京交通大学 数据通信系统中轨旁传输媒介的故障检测方法及装置
CN110758480B (zh) * 2019-08-20 2021-06-08 北京交通大学 数据通信系统中轨旁传输媒介的故障检测方法及装置
CN110991789A (zh) * 2019-10-17 2020-04-10 腾讯科技(深圳)有限公司 置信区间的确定方法和装置、存储介质及电子装置
CN110991789B (zh) * 2019-10-17 2021-09-24 腾讯科技(深圳)有限公司 置信区间的确定方法和装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
US11205129B2 (en) GBDT model feature interpretation method and apparatus
CN107025349A (zh) 基于概率边界系数法的最大熵分位值函数置信区间估计模型与方法
US10450841B2 (en) Methods for statistical prediction of well production and reserves
de Haan et al. On tail trend detection: modeling relative risk
CN109858779A (zh) 一种水环境数学模型水质参数不确定性与敏感性分析方法
CN108959188A (zh) 基于量化最小误差熵准则的格兰杰因果判辨方法
Chen et al. Quantile and tolerance-interval estimation in simulation
US20060095236A1 (en) Circuit analysis utilizing rank revealing factorization
CN107180293B (zh) 一种面向勘探目标的地质评价水平测定方法
Fernandez et al. Improved estimation of weibull parameters considering unreliability uncertainties
CN106096029B (zh) 一种基于用户双向关系的推荐方法
CN109829000B (zh) 一种河川年径流量数据的一致性处理方法及装置
Durot et al. Nonparametric species richness estimation under convexity constraint
Martinez-Vazquez et al. Modelling boundary shear stress distribution in open channels using a face recognition technique
Lee The effect of nonzero autocorrelation coefficients on the distributions of Durbin-Watson test estimator: Three autoregressive models
Goovaerts Accounting for rate instability and spatial patterns in the boundary analysis of cancer mortality maps
Schöbi et al. PC-Kriging: A new meta-modelling method and its application to quantile estimation
Andrich et al. On a law of ordinal error
Mehtätalo Localizing a predicted diameter distribution using sample information
Saghir et al. On the Performance of Phase‐I Bivariate Dispersion Charts to Non‐Normality
CN109347691B (zh) 一种用于Web服务的数据采样方法、装置及设备
Archambeault et al. Quantifying the quality of agreement between simulation and validation data for multiple data sets
CN110717359A (zh) 基于数理统计的反向传播优化方法、装置及电子设备
US11455372B2 (en) Parameter estimation apparatus, parameter estimation method, and computer-readable recording medium
Damilano et al. Efficiency of a linear combination of the median and the sample mean: the double truncated normal distribution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170808