CN101008936A - 一种校正测量数据显著误差与随机误差的方法 - Google Patents
一种校正测量数据显著误差与随机误差的方法 Download PDFInfo
- Publication number
- CN101008936A CN101008936A CNA2007100668376A CN200710066837A CN101008936A CN 101008936 A CN101008936 A CN 101008936A CN A2007100668376 A CNA2007100668376 A CN A2007100668376A CN 200710066837 A CN200710066837 A CN 200710066837A CN 101008936 A CN101008936 A CN 101008936A
- Authority
- CN
- China
- Prior art keywords
- independent variable
- error
- reliability
- appreciable error
- instrument
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Complex Calculations (AREA)
Abstract
本发明公开了一种校正测量数据显著误差与随机误差的方法。该方法首先利用贝叶斯法则从历史数据中对提取测量仪表的可靠性,然后将可靠性引入显著误差检测中作为确定确定检测误差的基准。利用在显著误差检测中获得的信息,减少数据校正的计算量。本发明的优点:利用仪表的历史运行数据作为可靠性的基础,从而通过确定一批可靠性较高的仪表来减少计算量;考虑了基准中出现显著误差的情况,通过更新可靠性来处理基准中的显著误差,从而改善显著误差检出率;利用较少的计算量得到显著误差候选集,改善显著误差检测效率;通过共用关联矩阵的方法将显著误差检测与数据校正联系起来,降低数据校正步骤的计算复杂度。
Description
技术领域
本发明涉及一种校正测量数据显著误差与随机误差的方法。
背景技术
在化工企业中,测量数据含有无法避免的随机误差和显著误差,由于这些误差的存在,使得这些测量数据往往无法满足物料和能量的平衡。因此,在利用生产数据对企业的生产和经营做出决策之前,对数据进行显著误差检测和数据协调已经成为许多企业信息化建设者的共识。过程数据中的随机误差是由各种随机因素,如仪表误差、信号转换的影响产生的,具有不可避免,满足随机分布的特点。而显著误差是由于仪表故障,操作不稳定或过程泄漏等引起的,显著误差的出现频率比随机误差要小的多,但是误差的偏差范围则要大得多。
虽然现代计算机和数据库技术的使用大大便利了过程数据的采集和处理,然而由于受到企业经济条件、仪表技术或地理位置的影响,不是所有的变量都可测,这就导致了部分数据的缺失。数据的缺失和不可避免的误差会使企业的流程控制,在线优化和经济指标考核受到不同程度的影响,而随着信息技术的发展,如何处理好数据已经成为一个不能回避的问题,显著误差检测和数据协调技术正是为了解决这一问题而产生的。
在现代化工企业中,以一个班次(8小时)或一天为周期的静态数据校正已经得到了广泛的应用。有着紧密联系的显著误差校正和数据协调技术也各自有了很大的发展,如广泛采用的数据协调投影矩阵法和零度矩阵法,以及显著误差的测量数据检测法,节点检测法和主元分析法等,然而显著误差的检测无法避免的存在漏判和误判的情况,那么如何利用历史数据提高对显著误差的检出率,对无法检测的显著误差提供人工干预同时提高数据协调的计算效率成为了一个有挑战性的命题。
发明内容
本发明的目的是提供一种校正测量数据显著误差与随机误差的方法,以实现在测量数据含有测量误差和显著误差情况下利用仪表运行历史数据和独立变量改善显著误差检出率同时改善数据协调过程计算效率。
由于显著误差的产生跟仪表的故障是紧密联系在一起的,那么每个仪表的可靠性都不同,而以往的显著误差检测方法都没有将仪表的历史运行数据作为判定仪表可靠性的方法。同时一般的显著误差和数据校正都是同时进行的,给出的结果往往通过了大量计算而且由于测量网络的结构问题将会导致有些显著误差是无法被测出的,正是基于这些问题,我们提出了将仪表的历史运行数据作为判定仪表可靠性的基础,改善显著误差的检出率,用共用关联矩阵的方式改善数据协调的计算效率,同时将显著误差以候选集的方式给出,得到测量数据的校正值
本发明的校正测量数据显著误差与随机误差的方法,其特征包括以下步骤:
1)从数据库中得到仪表历史运行数据,根据其历史运行状况,生成所有测量仪表的预期显著误差发生概率:
其中li表示仪表Si以前出现错误的次数,mi表示仪表Si正常工作的时间,τi(t))表示距上次检查仪表Si的时间,Γ(·)表示Γ-分布;
2)设1-Pi(t)是预期无显著误差出现概率,定义预期无显著误差出现概率为仪表的可靠性,利用可靠性对所有测量点的值进行加权,同时将所有未测变量的权值赋为0;
3)利用Kruskal法对测量网络进行最小生成树计算,将所有的测量变量分为生成树的弦和生成树的枝两类,定义弦为独立变量,枝为非独立变量,同时获得测量变量与独立变量之间的关系矩阵:
4)根据P×CM计算得出测量变量的估计值,CM为独立变量的测量值向量,将每个非独立变量的估计值与其测量值进行比较,如果绝对误差超过根据正态分布概率选定的标准值,则将该非独立变量放入显著误差候选集中;
5)如果与某个独立变量相关的所有非独立变量都在显著误差候选集中,那么计算相关的非独立变量的综合可靠性
其中B表示相关的非独立变量集合,若Rbr大于该独立变量的可靠性,则将该独立变量的可靠性降为0.1,而将所有不在候选集中的非独立变量的可靠性提高到1,然后回到步骤3)进行循环计算,如果Rbr小于该独立变量的可靠性或候选集中不包括与任意一独立变量相关的所有非独立变量,那么进行下一步;
本发明的有益效果:
1)本发明采用仪表历史运行数据和贝叶斯法则来判定仪表的可靠性,将可靠性引入显著误差检测中,在改善显著误差的计算效率的同时有效的改善显著误差检出率,减少漏判和误判的情况。
2)本发明采用共用独立变量的方法来减少显著误差和数据校正中计算变量的个数,使数据校正步骤的计算效率得到提高。
3)本发明将显著误差检测和随机误差的消除分两步骤进行,在紧密联系两者的同时,能降低显著误差对校正结果的负面影响。
本发明方法可广泛用于石化,矿业等流程工业,改善测量数据的精确性,帮助企业做出更优的经营决策。
附图说明
图1是本发明的校正测量数据显著误差与随机误差的方法流程图;
图2是换热网络流程示意图;
图3是用于说明本发明方法的效率和效果的一个蒸汽系统流程图
具体实施方式
图1所示是本发明的校正测量数据显著误差与随机误差的方法流程图。
该方法过程如下:
根据工厂实际可知,除了无法避免的随机误差外,显著误差将会对测量数据的真实性造成很大影响。仪表的故障是显著误差产生的主要原因,每一个仪表的故障,都会使一段时期的测量数据形成很大的偏差,而这些仪表的故障都会和仪表的检修记录一起存放在企业的历史数据库中,我们有必要利用这些信息提高当前的显著误差检测的效率和效果。利用贝叶斯法来进行显著误差检测是由Tamhane,Jordache和Mah在1988年提出的,他们基于贝叶斯法则推导出显著误差的出现概率:
其中li表示仪表Si以前出现错误的次数,mi表示仪表Si正常工作的时间,τi(t)表示距上次检查仪表Si的时间,Γ(·)表示Γ-分布。
由于Pi(t)表示的是仪表出现故障的概率,那么
即表示仪表正常工作的概率,我们将之定义为仪表的可靠性。而仪表的可靠性将会在显著误差检测的过程中被用来作为基准值的选择标准。
由于仪表的可靠性不同,那么对某些可靠性比较高的仪表,在先期可以假设它们没有产生故障,以它们的测量值作为检验其他测量值是否含有显著误差的基准,本发明采用Kruskal法产生最小生成树的方法来选择作为基准的一批高可靠性仪表。
系统的流程图加上用于代表输入输出的环境节点可以形成一个连通图,生成树是连通图的一个子图,它的特点是本身不包括任何回路,而添加任意不相邻的点之间的连线就能构成一个回路。定义生成树上的边为枝,不在生成树上的边为弦,那最小生成树就是枝的权值和最小的那个生成树。由最小生成树的定义可知,枝的权值和最小,那就意味着弦的权值和最大,由于权值被定义为测量点的可靠性,那么最小生成树的弦就是可靠性较高的测量点,这些测量点就是独立变量。
本发明利用Kruskal法这个效率较高的连通图最小生成树算法来确定独立变量,假设连通图有m个节点和n条边,那么这一方法的步骤如下:
1)若连通图的边数n=m-1,则连通图即为所求的最小生成树,否则,一定有n>m-1。
2)将网络的n条边按权值自小到大顺序排列。
3)将连通图中的边都去掉,只留下m个孤立顶点作为初始的最小生成树,再按边的排放顺序逐个考察,若与当前边集中的边不构成回路,便将它加入到边集中,直至边集中边数满(m-1)。
边集中的边为最小生成树的枝,而连通图的不属于边集的边即为最小生成树的弦。
当独立变量被确定下来,本发明采用基本割集的概念来计算独立变量和非独立变量之间的关系,即确定关联矩阵P。连通图的割集定义为构成该连通图的支路的集合,若从连通图中移去某一条(或某一组)边,其剩余子图将成为两个孤立的连通网络,则移去的边的集合称为该网络的一个割集。一个生成树的基本割集则表示只含有一条枝的割集,由于基本割集只含有一条枝,那么这条枝(测量变量)就能被基本割集中的其他弦(独立变量)所表示,这样P矩阵就能表示成如下形式:
同时可以得到于每个独立变量相关的非独立变量个数向量Re,定义独立变量的测量值为列向量CM,那么所有测量值的估计值向量E就能由下式得出:
E=P×CM (3)
从中可以得到所有枝的估计值向量Br_E,根据测量值的随机误差满足于正态分布的特性,定义偏差限为
其中Ch_De和Br_De分别为独立变量和非独立变量测量仪表的标准方差,而λ由用户根据正态分布的概率自行选取。
计算非独立变量估计值Br_E与测量值Br_M的绝对差值,如果某一非独立变量测量值与估计值的绝对差值大于偏差限,并且该独立变量不在显著误差候选集中,那么将该非独立变量放入显著误差候选集,同时在Re中与该非独立变量相关的独立变量的值减去1,直到检查完所有估计值。
遍历Re中的值,如果有值为0,例独立变量x1仅与非独立变量x2,x3相关而x2,x3都在显著误差候选集中,那么Re(1)将为0,计算相关的非独立变量综合可靠性Rbr1=1-P2(t)×P3(t),如果Rbr1大于1-P1(t),那么将所有不在候选集中的非独立变量的可靠性提高到1而将x1的可靠性降为0.1(为了将其于未测变量区分开),然后返回计算独立变量步骤进行计算,反之用变量的估计值替换显著误差候选集中变量的测量值,剔除显著误差,然后根据:
实施例1
以图2所示的某一换热网络为例,共有分流器SPL、热交换器HX、混合器MIX和阀门VAL四个装置和位于装置输入、输出端的6个测量点。表1列出了该网络测量点的真实值,测量值,标准方差和其可靠性。
表1
测量点编号 | 真实值 | 1#测量值 | 2#测量值 | 标准方差 | 可靠性 |
F1 | 100 | 160.91* | 100.91 | 4.2 | 0.8 |
F2 | 64 | 44.45* | 64.45 | 2.8 | 0.8 |
F3 | 36 | 34.65 | 84.65* | 1.75 | 0.9 |
F4 | 64 | 64.25 | 24.20* | 2.8 | 0.9 |
F5 | 36 | 36.44 | 36.44 | 1.75 | 0.8 |
F6 | 100 | 98.88 | 98.88 | 4.2 | 0.8 |
注:*--测量数据含有显著误差
在1#测量值中,因为测量点F3和F4的可靠性比其它的测量点高,他们被选为独立变量,则计算P矩阵为:
P×CM=[99.89,65.24,34.65,65.24,34.65,99.89],由于F1和F2含有显著误差,F1和F2与它们估计值的绝对差分别为62.02和20.79,大于根据方差确定的标准值,所以F1和F2的显著误差将会在第一轮检测中被检测出来。
在2#测量值中,F1,F3中含有显著误差,第一轮关联矩阵和独立变量的选择将会相同。但由于F3含有显著误差,那么与F3相关的F1,F5,F6都会被加入显著误差候选集。但是由于F1,F5,F6的综合可靠性是1-(1-0.8)3=0.992大于F3的可靠性,那么F3将替代F1,F5,F6进入显著误差候选集,同时F3的可靠性被降为0.1,由于F2和F4被确认为不含显著误差,它们的可靠性将被提高到1。因此F2和F5将会在下一循环被选独立变量,同时P矩阵变为:
那么F1和F3的显著误差将会在第二轮中被检测出来。
剔除显著误差后,根据公式
得到的校正结果如表2所示
表2
测量点编号 | 真实值 | 1#测量值 | 1#校正值 | 2#测量值 | 2#校正值 |
F1 | 100 | 160.91* | 98.9904 | 100.91 | 99.8939 |
F2 | 64 | 44.45* | 64.0240 | 64.45 | 63.4475 |
F3 | 36 | 34.65 | 34.9664 | 84.65* | 36.4464 |
F4 | 64 | 64.25 | 64.0240 | 24.20* | 63.4475 |
F5 | 36 | 36.44 | 34.9664 | 36.44 | 36.4464 |
F6 | 100 | 98.88 | 98.9904 | 98.88 | 99.8939 |
注:*--测量数据含有显著误差
实施例2
以附图3所示的含有11个节点和28条流股的蒸汽系统作为实例对本发明进行检验,引进国际上被广泛采用的标准:
对显著误差检测的效果进行了评价。表3给出了应用的效果及与常用的MIMT显著误差检测方法的比较。
表3.显著误差检测效果
仿真次数 | 显著误差数 | 虚警个数 | OP | AVTI | |
100 | 425 | 143 | 0.685 | 1.24 | |
一次校正所需CPU时间 | |||||
0.036s | |||||
显著误差数 | 仿真次数 | 显著误差检出率 | 显著误差检出率 | ||
12345 | 2020202020 | 8087.566.761.2552 | 7070635452 |
由表3可以看出,该方法的显著误差检出率比MIMT方法有了比较高的提高,共用关联矩阵的方法使得数据校正同时受益,提高了数据校正的效率。
Claims (1)
1、一种校正测量数据显著误差与随机误差的方法,其特征包括以下步骤:
1)从数据库中得到仪表历史运行数据,根据其历史运行状况,生成所有测量仪表的预期显著误差发生概率:
其中li表示仪表Si以前出现错误的次数,mi表示仪表Si正常工作的时间,τi(t)表示距上次检查仪表Si的时间,Γ(·)表示Γ-分布;
2)设1-Pi(t)是预期无显著误差出现概率,定义预期无显著误差出现概率为仪表的可靠性,利用可靠性对所有测量点的值进行加权,同时将所有未测变量的权值赋为0;
3)利用Kruskal法对测量网络进行最小生成树计算,将所有的测量变量分为生成树的弦和生成树的枝两类,定义弦为独立变量,枝为非独立变量,同时获得测量变量与独立变量之间的关系矩阵:
4)根据P×CM计算得出测量变量的估计值,CM为独立变量的测量值向量,将每个非独立变量的估计值与其测量值进行比较,如果绝对误差超过根据正态分布概率选定的标准值,则将该非独立变量放入显著误差候选集中;
5)如果与某个独立变量相关的所有非独立变量都在显著误差候选集中,那么计算相关的非独立变量的综合可靠性
,其中B表示相关的非独立变量集合,若Rbr大于该独立变量的可靠性,则将该独立变量的可靠性降为0.1,而将所有不在候选集中的非独立变量的可靠性提高到1,然后回到步骤3)进行循环计算,如果Rbr小于该独立变量的可靠性或候选集中不包括与任意一独立变量相关的所有非独立变量,那么进行下一步;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007100668376A CN100440200C (zh) | 2007-01-24 | 2007-01-24 | 一种校正测量数据显著误差与随机误差的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007100668376A CN100440200C (zh) | 2007-01-24 | 2007-01-24 | 一种校正测量数据显著误差与随机误差的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101008936A true CN101008936A (zh) | 2007-08-01 |
CN100440200C CN100440200C (zh) | 2008-12-03 |
Family
ID=38697370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007100668376A Expired - Fee Related CN100440200C (zh) | 2007-01-24 | 2007-01-24 | 一种校正测量数据显著误差与随机误差的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100440200C (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102024045A (zh) * | 2010-12-14 | 2011-04-20 | 成都市华为赛门铁克科技有限公司 | 信息分类处理方法、装置和终端 |
CN102426671A (zh) * | 2011-07-29 | 2012-04-25 | 北京航星机器制造公司 | 一种基于综合成本最优的排故方法 |
CN102662832A (zh) * | 2012-03-20 | 2012-09-12 | 浙江大学 | 一种生产过程数据校正软件的评测方法 |
CN104950852A (zh) * | 2015-06-16 | 2015-09-30 | 河南中烟工业有限责任公司 | 一种卷烟企业能源管控系统的数据校验系统与方法 |
CN105424827A (zh) * | 2015-11-07 | 2016-03-23 | 大连理工大学 | 一种代谢组学数据随机误差的筛选和校正方法 |
CN106199241A (zh) * | 2016-06-24 | 2016-12-07 | 清华大学 | 一种基于数据协调及假设检验的电站系统多故障诊断方法 |
CN108762228A (zh) * | 2018-05-25 | 2018-11-06 | 江南大学 | 一种基于分布式pca的多工况故障监测方法 |
CN116310940A (zh) * | 2022-12-29 | 2023-06-23 | 苏州斯曼克磨粒流设备有限公司 | 一种机电设备运行状态的风险评估方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6252732B1 (en) * | 1994-12-01 | 2001-06-26 | International Business Machines Corporation | Method and apparatus for correcting systematic errors in timing pattern generation |
CN1447280A (zh) * | 2003-04-18 | 2003-10-08 | 清华大学 | 动态系统过失误差的侦破与识别方法 |
CN1694109B (zh) * | 2005-06-20 | 2011-05-18 | 浙江大学 | 一种应用于化工炼油生产过程的物流数据校正方法 |
-
2007
- 2007-01-24 CN CNB2007100668376A patent/CN100440200C/zh not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102024045A (zh) * | 2010-12-14 | 2011-04-20 | 成都市华为赛门铁克科技有限公司 | 信息分类处理方法、装置和终端 |
CN102426671A (zh) * | 2011-07-29 | 2012-04-25 | 北京航星机器制造公司 | 一种基于综合成本最优的排故方法 |
CN102426671B (zh) * | 2011-07-29 | 2014-07-09 | 北京航星机器制造公司 | 一种基于综合成本最优的排故方法 |
CN102662832A (zh) * | 2012-03-20 | 2012-09-12 | 浙江大学 | 一种生产过程数据校正软件的评测方法 |
CN104950852A (zh) * | 2015-06-16 | 2015-09-30 | 河南中烟工业有限责任公司 | 一种卷烟企业能源管控系统的数据校验系统与方法 |
CN105424827A (zh) * | 2015-11-07 | 2016-03-23 | 大连理工大学 | 一种代谢组学数据随机误差的筛选和校正方法 |
CN106199241A (zh) * | 2016-06-24 | 2016-12-07 | 清华大学 | 一种基于数据协调及假设检验的电站系统多故障诊断方法 |
CN106199241B (zh) * | 2016-06-24 | 2019-01-29 | 清华大学 | 一种基于数据协调及假设检验的电站系统多故障诊断方法 |
CN108762228A (zh) * | 2018-05-25 | 2018-11-06 | 江南大学 | 一种基于分布式pca的多工况故障监测方法 |
CN116310940A (zh) * | 2022-12-29 | 2023-06-23 | 苏州斯曼克磨粒流设备有限公司 | 一种机电设备运行状态的风险评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN100440200C (zh) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100440200C (zh) | 一种校正测量数据显著误差与随机误差的方法 | |
CN101738991B (zh) | 检测产品品质超规与评估产品实际测量值的方法 | |
CN104835103A (zh) | 基于神经网络和模糊综合评价的移动网络健康评价方法 | |
CN104794059A (zh) | 一种基于函数调用记录的缺陷定位方法及装置 | |
CN108898311A (zh) | 一种面向智能配电网抢修调度平台的数据质量检测方法 | |
CN102426334B (zh) | 一种放大电路的贮存性能表征参数确定方法 | |
CN110348150A (zh) | 一种基于相关概率模型的故障检测方法 | |
CN105786678A (zh) | 一种基于相关性模型的测试性预计方法 | |
CN105512011B (zh) | 一种电子装备测试性建模评估方法 | |
CN103902451A (zh) | 一种智能电能表软件品质评价方法 | |
CN107067023A (zh) | 一种故障诊断方法和装置 | |
CN114565065B (zh) | 一种水文序列数据异常值检测方法 | |
CN116432123A (zh) | 一种基于cart决策树算法的电能表故障预警方法 | |
WO2016138805A1 (zh) | 一种分布数据异动判断定位方法及系统 | |
CN106855990A (zh) | 核电机组仪表通道测量误差论证方法 | |
CN102207474B (zh) | 一种基于xrf光谱仪合金牌号鉴定的智能方法 | |
CN101714190B (zh) | 一种桥梁结构状态角色诊断系统 | |
CN113985339A (zh) | 智能电表的误差诊断方法及系统、设备、存储介质 | |
CN106250993A (zh) | 一种基于舰船维修剖面的测量设备计量周期调整方法 | |
Gunasekara et al. | Split sampling technique for selecting a flood frequency analysis procedure | |
CN110472872A (zh) | 考虑风险临界性的关键质量特性解耦分析方法 | |
CN112163189A (zh) | 基于测试顺序概率矩阵的装备故障诊断方法 | |
CN110487315A (zh) | 一种仪表漂移的分析系统及方法 | |
CN107196290A (zh) | 基于量测平衡指标和设备状态相似度寻优的支路与母线连接关系辨识方法 | |
CN108647717A (zh) | 一种考虑温度的变压器故障率计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20081203 Termination date: 20140124 |