CN103852562B - 判断样品检测数据可疑值的方法 - Google Patents
判断样品检测数据可疑值的方法 Download PDFInfo
- Publication number
- CN103852562B CN103852562B CN201410088717.6A CN201410088717A CN103852562B CN 103852562 B CN103852562 B CN 103852562B CN 201410088717 A CN201410088717 A CN 201410088717A CN 103852562 B CN103852562 B CN 103852562B
- Authority
- CN
- China
- Prior art keywords
- data
- laboratory
- measurement result
- sample
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Investigating Or Analyzing Materials Using Thermal Means (AREA)
Abstract
一种判断样品检测数据可疑值的方法,该方法包括:对m个实验室的同一种样品的同一个元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;根据所述实验室样品检测数据的稳健Z比分数的大小范围判断样品检测数据的可疑值。
Description
技术领域
本发明涉及样品数据可疑值判断领域,更具体的讲,涉及一种判断样品(尤其是,冶金样品元素)检测数据可疑值的方法。
背景技术
通常,在样品检测数据统计分析中采用数理统计的方法和规则进行,例如:采用格拉布斯检验、狄克逊检验等,但在实际应用过程中,发现样品数据离群数值的格拉布斯检验和狄克逊检验往往存在盲区,在非正态分布的情况下(即存在极端值),往往一些超常数据无法发现和剔除,降低了检测数据的准确性和可靠性。
发明内容
本发明采用稳健统计技术对数据进行处理,可以有效的克服通用的格拉布斯检验和狄克逊可疑值检验的盲区,并取得很好的效果。为了实现上述目的,本发明的目的在于提供了一种利用稳健统计技术判断样品检测数据可疑值的方法。
本发明提供了一种判断样品检测数据可疑值的方法,包括:对m个实验室的同一种样品的同一元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值。
优选地,m可以为大于等于6的整数,n可以为大于等于1的整数。优选地,根据所述实验室样品检测数据的稳健Z比分数的大小范围判断样品检测数据的可疑值的步骤可包括:当第m个实验室的稳健Z比分数的绝对值大于等于第一阈值时,认为所述第m个实验室的测定结果为离群结果,舍弃所述第m个实验室的测定结果;当第m个实验室的稳健Z比分数的绝对值小于第一阈值且大于第二阈值时,认为所述第m个实验室的测定结果为可疑结果;当第m个实验室的稳健Z比分数的绝对值小于等于第二阈值时,认为所述第m个实验室的测定结果数据为满意结果,保留所述第m个实验室的测定结果。
第一阈值可以是3,第二阈值可以是2。
优选地,在认为所述第m个实验室的测定结果为可疑结果的情况下,根据标准GB/T223.59对可疑结果进一步进行判断:当第m个实验室的测定结果与推荐值的差值大于等于允许上限时,舍弃所述第m个实验室的测定结果;当第m个实验室的测定结果与推荐值的差值小于允许上限时,保留所述第m个实验室的测定结果。
优选地,通过下面的等式1来计算稳健Z比分数:
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
优选地,可通过下面的等式2来计算等式1中的标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1等式2
其中,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
优选地,所述样品可以为冶金样品元素。
根据本发明的判断样品检测数据可疑值的方法,可以有效的剔除样品检测数据的可疑值、离群值,大大提高了检测数据的准确性和可靠性。
附图说明
通过下面结合附图进行的详细描述,本发明的上述和其它目的、特点和优点将会变得更加清楚,其中:
图1是示出根据本发明实施例的判断样品检测数据可疑值方法的流程图。
具体实施方式
现在,详细描述本发明的实施例,其示例在附图中表示。以下通过参考附图描述实施例以解释本发明。
图1是示出根据本发明实施例的判断样品检测数据可疑值的方法的流程图。
在步骤S101,对m个实验室的同一种样品的同一元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数。
在步骤S102,对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果。
具体的讲,通过步骤S101得到每个实验室的n个数值。在步骤S102对每个实验室的n个数值计算平均值,因此得到m个数据,所得m个数据作为样品检测数据的测定结果,其中,检测同一种样品的同一元素检测实验室的个数m例如,至少六个。
样品平均值用下面的公式(1)表示:
样品平均值是
其中,xi是X的第i行。
在步骤S103,根据样品检测数据的测定结果来计算每个实验室样品检测数据测定结果的稳健Z比分数。
具体的讲,可通过公式(2)来计算稳健Z比分数:
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
公式(2)中的中位值和标准化四分位距NormIQR分别由下面的公式(3)和公式(4)来计算:
中位值:公式(3)
标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1公式(4)
其中,Xm表示中位值,m表示结果总数,n表示测定结果的个数,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
随后,在步骤S104,根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值。
具体的讲,在得到了各实验室的稳健Z比分数之后,要根据样品检测数据的稳健Z比分数的绝对值的大小范围来判断样品检测数据的可疑值。
具体的讲,可通过下面的式子来进行判断:
│Z│≥3为离群结果;
2<│Z│<3为可疑结果;
│Z│≤2为满意结果。
如上所示,当确定稳健Z比分数的绝对值大于等于3时,测定结果为离群值,舍弃第m组实验室的测定结果。
当确定稳健Z比分数的绝对值大于3且小于2时,测定结果为可疑值。
具体的讲,在认为所述第m个实验室的测定结果为可疑结果的情况下,可根据标准GB/T223.59对可疑结果进一步进行判断:当第m个实验室的测定结果与推荐值的差值大于等于允许上限例如0.001~0.003%时,舍弃所述第m个实验室的测定结果;当第m个实验室的测定结果与推荐值的差值小于允许上限例如0.001~0.003%时,保留所述第m个实验室的测定结果。
此外,当确定稳健Z比分数的绝对值小于等于2时,测定结果为满意结果,保留所述第m个实验室的测定结果。
优选地,满意结果保留并参与统计,最后报出结果。
表1是示出根据本发明实施例的判断样品检测数据可疑值方法对钒氮合金元素P的定值统计剔除可疑值和离群值之前的统计数据表。
表2是示出根据本发明实施例的判断样品检测数据可疑值方法对钒氮合金元素P的定值统计剔除可疑值和离群值之后的统计数据表。
如表1和表2所示,该示例中对钒氮合金元素P的定值统计应用,其中,具体的描述如下:
计算所得各组实验室测定数据的中值(即,表1中的中位值)。由于实验室个数为奇数,所以中值是0.009248;IQR值是0.0025,从而可计算每个实验室稳健Z比分数,并根据判定条件进行判断。
表1钒氮合金元素P的定值统计剔除可疑值和离群值之前数据统计表
如表1所示,序号为5的实验室,钒氮合金元素P的定值的稳健Z比分数是2.6390,Z的绝对值小于阈值3且大于阈值2,所以判断序号为5的实验室的测定数据是可疑值,可疑值是舍弃还是保留根据标准GB/T223.59对可疑结果进一步进行判断,用测定结果0.0159%减去推荐值0.0109%的差值的大小范围来确定,因为差值是0.005%,不在允许上限0.001~0.003%的范围内,所以舍弃。
序号为1的实验室,钒氮合金元素P的定值的稳健Z比分数是3.7282,Z的绝对值大于阈值3,判断序号为1的实验室的测定数据是离群值,所以舍弃。
剩下的7个实验室,钒氮合金元素P的定值的稳健Z比分数的绝对值都小于阈值2,满足保留的条件,所以保留。
表2钒氮合金元素P的定值统计剔除可疑值和离群值之后数据统计表
如表2所示,舍弃了可疑值和离群值后,剩下的七组实验室的钒氮合金元素P的定值的检测数据是满意结果,参与统计并报出结果。
尽管上面已经结合附图和示例性实施例描述了本发明,但是本领域普通技术人员应该清楚,在不脱离权利要求的精神和范围的情况下,可以对上述实施例进行各种修改。
Claims (5)
1.一种判断样品检测数据可疑值的方法,包括:
对m个实验室的同一种样品的同一个元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;
对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;
根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;
根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值,针对样品检测数据的判断结果,保留满意结果以参与统计,并报出统计结果,
其中,当第m个实验室的稳健Z比分数的绝对值大于等于第一阈值时,认为所述第m个实验室的测定结果为离群结果,舍弃所述第m个实验室的测定结果;当第m个实验室的稳健Z比分数的绝对值小于第一阈值且大于第二阈值时,认为所述第m个实验室的测定结果为可疑结果;当第m个实验室的稳健Z比分数的绝对值小于等于第二阈值时,认为所述第m个实验室的测定结果数据为满意结果,保留所述第m个实验室的测定结果,
其中,在认为所述第m个实验室的测定结果为可疑结果的情况下,根据标准GB/T223.59-2008对可疑结果进一步进行判断:当第m个实验室的测定结果与推荐值的差值大于等于允许上限时,舍弃所述第m个实验室的测定结果;当第m个实验室的测定结果与推荐值的差值小于允许上限时,保留所述第m个实验室的测定结果,
其中,所述同一种样品的同一个元素为磷元素。
2.如权利要求1所述的判断样品检测数据可疑值的方法,其中,m为大于等于6的整数,n为大于等于1的整数。
3.如权利要求1所述的判断样品检测数据可疑值的方法,其中,第一阈值是3,第二阈值是2。
4.如权利要求1所述的判断样品检测数据可疑值的方法,其中,通过下面的等式1来计算稳健Z比分数:
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
其中,通过下面的等式2来计算等式1中的标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1等式2
其中,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
5.如权利要求1所述的判断样品检测数据可疑值的方法,其中,所述样品为冶金样品元素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410088717.6A CN103852562B (zh) | 2014-03-11 | 2014-03-11 | 判断样品检测数据可疑值的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410088717.6A CN103852562B (zh) | 2014-03-11 | 2014-03-11 | 判断样品检测数据可疑值的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103852562A CN103852562A (zh) | 2014-06-11 |
CN103852562B true CN103852562B (zh) | 2016-01-20 |
Family
ID=50860470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410088717.6A Active CN103852562B (zh) | 2014-03-11 | 2014-03-11 | 判断样品检测数据可疑值的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103852562B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557652A (zh) * | 2016-11-14 | 2017-04-05 | 攀钢集团攀枝花钢铁研究院有限公司 | 判断样品检测数据可疑值的方法 |
CN112945785A (zh) * | 2021-02-04 | 2021-06-11 | 华润怡宝饮料(中国)有限公司 | 一种利用铝箔片检验耐破度仪性能的方法 |
CN113484468A (zh) * | 2021-06-25 | 2021-10-08 | 广州市广软科技有限公司 | 基于四分位数算法的机动车环保检测分析方法和系统 |
-
2014
- 2014-03-11 CN CN201410088717.6A patent/CN103852562B/zh active Active
Non-Patent Citations (5)
Title |
---|
实验室检测结果质量控制的方法;张文华等;《中国质量》;20090831(第8期);第92页中"(二) 重复性和再现性试验" * |
实验室测量审核结果的评定方法研讨;佟艳春等;《冶金分析》;20090731;第29卷(第7期);全文 * |
稳健技术法用于实验室比对数据统计处理;徐增芹,赵贵芬;《冶金分析》;20081130;第28卷;全文 * |
能力验证结果稳健统计值与有证参考物质认定值的符合性比较研究;王海舟等;《冶金分析》;20101130;第30卷(第11期);全文 * |
铝合金中Si、Fe含量测定的实验室间比对结果分析;邱跃龙等;《中国无机分析化学》;20110630;第1卷(第2期);第67~68页中第2.1、2.4、2.5、3.1、3.3和4.2节以及表1~2和图3~4 * |
Also Published As
Publication number | Publication date |
---|---|
CN103852562A (zh) | 2014-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Müller et al. | Accuracy of fatigue limits estimated by the staircase method using different evaluation techniques | |
CN106709242A (zh) | 一种鉴别污水监测数据真伪的方法 | |
CN103852562B (zh) | 判断样品检测数据可疑值的方法 | |
CN107515965A (zh) | 一种基于不确定过程的加速退化建模评估方法 | |
CN104951842A (zh) | 一种新的油田产量预测方法 | |
CN102864766A (zh) | 基于标准贯入和静力触探试验相关关系的液化判别方法 | |
CN104062305A (zh) | 一种集成电路缺陷的分析方法 | |
CN106557652A (zh) | 判断样品检测数据可疑值的方法 | |
CN104180822A (zh) | 一种变形监测基准点稳定性检验方法 | |
Ramaswamy et al. | Time truncated chain sampling plans for generalized Rayleigh distribution | |
CN104198998A (zh) | 非均匀背景下基于聚类处理的恒虚警检测方法 | |
CN103106332A (zh) | 一种测量不确定度的分析方法 | |
CN101592692B (zh) | 测量机台的评估方法 | |
CN109670143B (zh) | 一种环境激励下土木工程结构振动频域响应信号统计规律检测方法 | |
CN116522085A (zh) | 一种全自动拉索频率提取、定阶和索力识别方法与应用 | |
JP6394787B2 (ja) | 製品検査装置、製品検査方法及びコンピュータプログラム | |
Ramaswamy et al. | Time truncated chain sampling plans for generalized exponential distribution | |
CN106525716A (zh) | 一种钢管套管接箍连接的关键点自动检测方法 | |
Şahintürk et al. | The comparison of hypothesis tests determining normality and similarity of samples | |
CN103063176B (zh) | 一种圈盘周长的标准值计算方法、检测台校准方法及装置 | |
CN101944236A (zh) | 基于采样值分布特性的具有压缩感知过程的信号检测方法 | |
Dhawale et al. | Evaluating measurement capabilities by gauge R&R using ANOVA for reliability | |
CN112116014A (zh) | 一种配电自动化设备测试数据离群值检测方法 | |
CN106055741B (zh) | 一种基于Taylor摄动级数法的金属结构疲劳裂纹扩展寿命预测方法 | |
CN112132435A (zh) | 一种基于半定量计算的化工风险评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |