CN103852562B - 判断样品检测数据可疑值的方法 - Google Patents

判断样品检测数据可疑值的方法 Download PDF

Info

Publication number
CN103852562B
CN103852562B CN201410088717.6A CN201410088717A CN103852562B CN 103852562 B CN103852562 B CN 103852562B CN 201410088717 A CN201410088717 A CN 201410088717A CN 103852562 B CN103852562 B CN 103852562B
Authority
CN
China
Prior art keywords
data
laboratory
measurement result
sample
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410088717.6A
Other languages
English (en)
Other versions
CN103852562A (zh
Inventor
徐本平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pangang Group Panzhihua Iron and Steel Research Institute Co Ltd
Original Assignee
Pangang Group Panzhihua Iron and Steel Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pangang Group Panzhihua Iron and Steel Research Institute Co Ltd filed Critical Pangang Group Panzhihua Iron and Steel Research Institute Co Ltd
Priority to CN201410088717.6A priority Critical patent/CN103852562B/zh
Publication of CN103852562A publication Critical patent/CN103852562A/zh
Application granted granted Critical
Publication of CN103852562B publication Critical patent/CN103852562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analyzing Materials Using Thermal Means (AREA)

Abstract

一种判断样品检测数据可疑值的方法,该方法包括:对m个实验室的同一种样品的同一个元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;根据所述实验室样品检测数据的稳健Z比分数的大小范围判断样品检测数据的可疑值。

Description

判断样品检测数据可疑值的方法
技术领域
本发明涉及样品数据可疑值判断领域,更具体的讲,涉及一种判断样品(尤其是,冶金样品元素)检测数据可疑值的方法。
背景技术
通常,在样品检测数据统计分析中采用数理统计的方法和规则进行,例如:采用格拉布斯检验、狄克逊检验等,但在实际应用过程中,发现样品数据离群数值的格拉布斯检验和狄克逊检验往往存在盲区,在非正态分布的情况下(即存在极端值),往往一些超常数据无法发现和剔除,降低了检测数据的准确性和可靠性。
发明内容
本发明采用稳健统计技术对数据进行处理,可以有效的克服通用的格拉布斯检验和狄克逊可疑值检验的盲区,并取得很好的效果。为了实现上述目的,本发明的目的在于提供了一种利用稳健统计技术判断样品检测数据可疑值的方法。
本发明提供了一种判断样品检测数据可疑值的方法,包括:对m个实验室的同一种样品的同一元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值。
优选地,m可以为大于等于6的整数,n可以为大于等于1的整数。优选地,根据所述实验室样品检测数据的稳健Z比分数的大小范围判断样品检测数据的可疑值的步骤可包括:当第m个实验室的稳健Z比分数的绝对值大于等于第一阈值时,认为所述第m个实验室的测定结果为离群结果,舍弃所述第m个实验室的测定结果;当第m个实验室的稳健Z比分数的绝对值小于第一阈值且大于第二阈值时,认为所述第m个实验室的测定结果为可疑结果;当第m个实验室的稳健Z比分数的绝对值小于等于第二阈值时,认为所述第m个实验室的测定结果数据为满意结果,保留所述第m个实验室的测定结果。
第一阈值可以是3,第二阈值可以是2。
优选地,在认为所述第m个实验室的测定结果为可疑结果的情况下,根据标准GB/T223.59对可疑结果进一步进行判断:当第m个实验室的测定结果与推荐值的差值大于等于允许上限时,舍弃所述第m个实验室的测定结果;当第m个实验室的测定结果与推荐值的差值小于允许上限时,保留所述第m个实验室的测定结果。
优选地,通过下面的等式1来计算稳健Z比分数:
Z = x - X m NormIQR 等式1
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
优选地,可通过下面的等式2来计算等式1中的标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1等式2
其中,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
优选地,所述样品可以为冶金样品元素。
根据本发明的判断样品检测数据可疑值的方法,可以有效的剔除样品检测数据的可疑值、离群值,大大提高了检测数据的准确性和可靠性。
附图说明
通过下面结合附图进行的详细描述,本发明的上述和其它目的、特点和优点将会变得更加清楚,其中:
图1是示出根据本发明实施例的判断样品检测数据可疑值方法的流程图。
具体实施方式
现在,详细描述本发明的实施例,其示例在附图中表示。以下通过参考附图描述实施例以解释本发明。
图1是示出根据本发明实施例的判断样品检测数据可疑值的方法的流程图。
在步骤S101,对m个实验室的同一种样品的同一元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数。
在步骤S102,对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果。
具体的讲,通过步骤S101得到每个实验室的n个数值。在步骤S102对每个实验室的n个数值计算平均值,因此得到m个数据,所得m个数据作为样品检测数据的测定结果,其中,检测同一种样品的同一元素检测实验室的个数m例如,至少六个。
样品平均值用下面的公式(1)表示:
样品平均值是 x ‾ = 1 n Σ i = 1 n x i - - - ( 1 )
其中,xi是X的第i行。
在步骤S103,根据样品检测数据的测定结果来计算每个实验室样品检测数据测定结果的稳健Z比分数。
具体的讲,可通过公式(2)来计算稳健Z比分数:
Z = x - X m NormIQR - - - ( 2 )
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
公式(2)中的中位值和标准化四分位距NormIQR分别由下面的公式(3)和公式(4)来计算:
中位值:公式(3)
标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1公式(4)
其中,Xm表示中位值,m表示结果总数,n表示测定结果的个数,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
随后,在步骤S104,根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值。
具体的讲,在得到了各实验室的稳健Z比分数之后,要根据样品检测数据的稳健Z比分数的绝对值的大小范围来判断样品检测数据的可疑值。
具体的讲,可通过下面的式子来进行判断:
│Z│≥3为离群结果;
2<│Z│<3为可疑结果;
│Z│≤2为满意结果。
如上所示,当确定稳健Z比分数的绝对值大于等于3时,测定结果为离群值,舍弃第m组实验室的测定结果。
当确定稳健Z比分数的绝对值大于3且小于2时,测定结果为可疑值。
具体的讲,在认为所述第m个实验室的测定结果为可疑结果的情况下,可根据标准GB/T223.59对可疑结果进一步进行判断:当第m个实验室的测定结果与推荐值的差值大于等于允许上限例如0.001~0.003%时,舍弃所述第m个实验室的测定结果;当第m个实验室的测定结果与推荐值的差值小于允许上限例如0.001~0.003%时,保留所述第m个实验室的测定结果。
此外,当确定稳健Z比分数的绝对值小于等于2时,测定结果为满意结果,保留所述第m个实验室的测定结果。
优选地,满意结果保留并参与统计,最后报出结果。
表1是示出根据本发明实施例的判断样品检测数据可疑值方法对钒氮合金元素P的定值统计剔除可疑值和离群值之前的统计数据表。
表2是示出根据本发明实施例的判断样品检测数据可疑值方法对钒氮合金元素P的定值统计剔除可疑值和离群值之后的统计数据表。
如表1和表2所示,该示例中对钒氮合金元素P的定值统计应用,其中,具体的描述如下:
计算所得各组实验室测定数据的中值(即,表1中的中位值)。由于实验室个数为奇数,所以中值是0.009248;IQR值是0.0025,从而可计算每个实验室稳健Z比分数,并根据判定条件进行判断。
表1钒氮合金元素P的定值统计剔除可疑值和离群值之前数据统计表
如表1所示,序号为5的实验室,钒氮合金元素P的定值的稳健Z比分数是2.6390,Z的绝对值小于阈值3且大于阈值2,所以判断序号为5的实验室的测定数据是可疑值,可疑值是舍弃还是保留根据标准GB/T223.59对可疑结果进一步进行判断,用测定结果0.0159%减去推荐值0.0109%的差值的大小范围来确定,因为差值是0.005%,不在允许上限0.001~0.003%的范围内,所以舍弃。
序号为1的实验室,钒氮合金元素P的定值的稳健Z比分数是3.7282,Z的绝对值大于阈值3,判断序号为1的实验室的测定数据是离群值,所以舍弃。
剩下的7个实验室,钒氮合金元素P的定值的稳健Z比分数的绝对值都小于阈值2,满足保留的条件,所以保留。
表2钒氮合金元素P的定值统计剔除可疑值和离群值之后数据统计表
如表2所示,舍弃了可疑值和离群值后,剩下的七组实验室的钒氮合金元素P的定值的检测数据是满意结果,参与统计并报出结果。
尽管上面已经结合附图和示例性实施例描述了本发明,但是本领域普通技术人员应该清楚,在不脱离权利要求的精神和范围的情况下,可以对上述实施例进行各种修改。

Claims (5)

1.一种判断样品检测数据可疑值的方法,包括:
对m个实验室的同一种样品的同一个元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;
对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;
根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;
根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值,针对样品检测数据的判断结果,保留满意结果以参与统计,并报出统计结果,
其中,当第m个实验室的稳健Z比分数的绝对值大于等于第一阈值时,认为所述第m个实验室的测定结果为离群结果,舍弃所述第m个实验室的测定结果;当第m个实验室的稳健Z比分数的绝对值小于第一阈值且大于第二阈值时,认为所述第m个实验室的测定结果为可疑结果;当第m个实验室的稳健Z比分数的绝对值小于等于第二阈值时,认为所述第m个实验室的测定结果数据为满意结果,保留所述第m个实验室的测定结果,
其中,在认为所述第m个实验室的测定结果为可疑结果的情况下,根据标准GB/T223.59-2008对可疑结果进一步进行判断:当第m个实验室的测定结果与推荐值的差值大于等于允许上限时,舍弃所述第m个实验室的测定结果;当第m个实验室的测定结果与推荐值的差值小于允许上限时,保留所述第m个实验室的测定结果,
其中,所述同一种样品的同一个元素为磷元素。
2.如权利要求1所述的判断样品检测数据可疑值的方法,其中,m为大于等于6的整数,n为大于等于1的整数。
3.如权利要求1所述的判断样品检测数据可疑值的方法,其中,第一阈值是3,第二阈值是2。
4.如权利要求1所述的判断样品检测数据可疑值的方法,其中,通过下面的等式1来计算稳健Z比分数:
Z = x - X m N o r m I Q R 等式1
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
其中,通过下面的等式2来计算等式1中的标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1等式2
其中,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
5.如权利要求1所述的判断样品检测数据可疑值的方法,其中,所述样品为冶金样品元素。
CN201410088717.6A 2014-03-11 2014-03-11 判断样品检测数据可疑值的方法 Active CN103852562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410088717.6A CN103852562B (zh) 2014-03-11 2014-03-11 判断样品检测数据可疑值的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410088717.6A CN103852562B (zh) 2014-03-11 2014-03-11 判断样品检测数据可疑值的方法

Publications (2)

Publication Number Publication Date
CN103852562A CN103852562A (zh) 2014-06-11
CN103852562B true CN103852562B (zh) 2016-01-20

Family

ID=50860470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410088717.6A Active CN103852562B (zh) 2014-03-11 2014-03-11 判断样品检测数据可疑值的方法

Country Status (1)

Country Link
CN (1) CN103852562B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557652A (zh) * 2016-11-14 2017-04-05 攀钢集团攀枝花钢铁研究院有限公司 判断样品检测数据可疑值的方法
CN112945785A (zh) * 2021-02-04 2021-06-11 华润怡宝饮料(中国)有限公司 一种利用铝箔片检验耐破度仪性能的方法
CN113484468A (zh) * 2021-06-25 2021-10-08 广州市广软科技有限公司 基于四分位数算法的机动车环保检测分析方法和系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
实验室检测结果质量控制的方法;张文华等;《中国质量》;20090831(第8期);第92页中"(二) 重复性和再现性试验" *
实验室测量审核结果的评定方法研讨;佟艳春等;《冶金分析》;20090731;第29卷(第7期);全文 *
稳健技术法用于实验室比对数据统计处理;徐增芹,赵贵芬;《冶金分析》;20081130;第28卷;全文 *
能力验证结果稳健统计值与有证参考物质认定值的符合性比较研究;王海舟等;《冶金分析》;20101130;第30卷(第11期);全文 *
铝合金中Si、Fe含量测定的实验室间比对结果分析;邱跃龙等;《中国无机分析化学》;20110630;第1卷(第2期);第67~68页中第2.1、2.4、2.5、3.1、3.3和4.2节以及表1~2和图3~4 *

Also Published As

Publication number Publication date
CN103852562A (zh) 2014-06-11

Similar Documents

Publication Publication Date Title
Müller et al. Accuracy of fatigue limits estimated by the staircase method using different evaluation techniques
CN106709242A (zh) 一种鉴别污水监测数据真伪的方法
CN103852562B (zh) 判断样品检测数据可疑值的方法
CN107515965A (zh) 一种基于不确定过程的加速退化建模评估方法
CN104951842A (zh) 一种新的油田产量预测方法
CN102864766A (zh) 基于标准贯入和静力触探试验相关关系的液化判别方法
CN104062305A (zh) 一种集成电路缺陷的分析方法
CN106557652A (zh) 判断样品检测数据可疑值的方法
CN104180822A (zh) 一种变形监测基准点稳定性检验方法
Ramaswamy et al. Time truncated chain sampling plans for generalized Rayleigh distribution
CN104198998A (zh) 非均匀背景下基于聚类处理的恒虚警检测方法
CN103106332A (zh) 一种测量不确定度的分析方法
CN101592692B (zh) 测量机台的评估方法
CN109670143B (zh) 一种环境激励下土木工程结构振动频域响应信号统计规律检测方法
CN116522085A (zh) 一种全自动拉索频率提取、定阶和索力识别方法与应用
JP6394787B2 (ja) 製品検査装置、製品検査方法及びコンピュータプログラム
Ramaswamy et al. Time truncated chain sampling plans for generalized exponential distribution
CN106525716A (zh) 一种钢管套管接箍连接的关键点自动检测方法
Şahintürk et al. The comparison of hypothesis tests determining normality and similarity of samples
CN103063176B (zh) 一种圈盘周长的标准值计算方法、检测台校准方法及装置
CN101944236A (zh) 基于采样值分布特性的具有压缩感知过程的信号检测方法
Dhawale et al. Evaluating measurement capabilities by gauge R&R using ANOVA for reliability
CN112116014A (zh) 一种配电自动化设备测试数据离群值检测方法
CN106055741B (zh) 一种基于Taylor摄动级数法的金属结构疲劳裂纹扩展寿命预测方法
CN112132435A (zh) 一种基于半定量计算的化工风险评价方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant