CN103852562A - 判断样品检测数据可疑值的方法 - Google Patents
判断样品检测数据可疑值的方法 Download PDFInfo
- Publication number
- CN103852562A CN103852562A CN201410088717.6A CN201410088717A CN103852562A CN 103852562 A CN103852562 A CN 103852562A CN 201410088717 A CN201410088717 A CN 201410088717A CN 103852562 A CN103852562 A CN 103852562A
- Authority
- CN
- China
- Prior art keywords
- data
- laboratory
- value
- measurement result
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Investigating Or Analyzing Materials Using Thermal Means (AREA)
Abstract
一种判断样品检测数据可疑值的方法,该方法包括:对m个实验室的同一种样品的同一个元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;根据所述实验室样品检测数据的稳健Z比分数的大小范围判断样品检测数据的可疑值。
Description
技术领域
本发明涉及样品数据可疑值判断领域,更具体的讲,涉及一种判断样品(尤其是,冶金样品元素)检测数据可疑值的方法。
背景技术
通常,在样品检测数据统计分析中采用数理统计的方法和规则进行,例如:采用格拉布斯检验、狄克逊检验等,但在实际应用过程中,发现样品数据离群数值的格拉布斯检验和狄克逊检验往往存在盲区,在非正态分布的情况下(即存在极端值),往往一些超常数据无法发现和剔除,降低了检测数据的准确性和可靠性。
发明内容
本发明采用稳健统计技术对数据进行处理,可以有效的克服通用的格拉布斯检验和狄克逊可疑值检验的盲区,并取得很好的效果。为了实现上述目的,本发明的目的在于提供了一种利用稳健统计技术判断样品检测数据可疑值的方法。
本发明提供了一种判断样品检测数据可疑值的方法,包括:对m个实验室的同一种样品的同一元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值。
优选地,m可以为大于等于6的整数,n可以为大于等于1的整数。优选地,根据所述实验室样品检测数据的稳健Z比分数的大小范围判断样品检测数据的可疑值的步骤可包括:当第m个实验室的稳健Z比分数的绝对值大于等于第一阈值时,认为所述第m个实验室的测定结果为离群结果,舍弃所述第m个实验室的测定结果;当第m个实验室的稳健Z比分数的绝对值小于第一阈值且大于第二阈值时,认为所述第m个实验室的测定结果为可疑结果;当第m个实验室的稳健Z比分数的绝对值小于等于第二阈值时,认为所述第m个实验室的测定结果数据为满意结果,保留所述第m个实验室的测定结果。
第一阈值可以是3,第二阈值可以是2。
优选地,在认为所述第m个实验室的测定结果为可疑结果的情况下,根据标准GB/T223.59对可疑结果进一步进行判断:当第m个实验室的测定结果与推荐值的差值大于等于允许上限时,舍弃所述第m个实验室的测定结果;当第m个实验室的测定结果与推荐值的差值小于允许上限时,保留所述第m个实验室的测定结果。
优选地,通过下面的等式1来计算稳健Z比分数:
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
优选地,可通过下面的等式2来计算等式1中的标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1 等式2
其中,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
优选地,所述样品可以为冶金样品元素。
根据本发明的判断样品检测数据可疑值的方法,可以有效的剔除样品检测数据的可疑值、离群值,大大提高了检测数据的准确性和可靠性。
附图说明
通过下面结合附图进行的详细描述,本发明的上述和其它目的、特点和优点将会变得更加清楚,其中:
图1是示出根据本发明实施例的判断样品检测数据可疑值方法的流程图。
具体实施方式
现在,详细描述本发明的实施例,其示例在附图中表示。以下通过参考附图描述实施例以解释本发明。
图1是示出根据本发明实施例的判断样品检测数据可疑值的方法的流程图。
在步骤S101,对m个实验室的同一种样品的同一元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数。
在步骤S102,对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果。
具体的讲,通过步骤S101得到每个实验室的n个数值。在步骤S102对每个实验室的n个数值计算平均值,因此得到m个数据,所得m个数据作为样品检测数据的测定结果,其中,检测同一种样品的同一元素检测实验室的个数m例如,至少六个。
样品平均值用下面的公式(1)表示:
样品平均值是
其中,xi是X的第i行。
在步骤S103,根据样品检测数据的测定结果来计算每个实验室样品检测数据测定结果的稳健Z比分数。
具体的讲,可通过公式(2)来计算稳健Z比分数:
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
公式(2)中的中位值和标准化四分位距NormIQR分别由下面的公式(3)和公式(4)来计算:
中位值: 公式(3)
标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1 公式(4)
其中,Xm表示中位值,m表示结果总数,n表示测定结果的个数,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
随后,在步骤S104,根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值。
具体的讲,在得到了各实验室的稳健Z比分数之后,要根据样品检测数据的稳健Z比分数的绝对值的大小范围来判断样品检测数据的可疑值。
具体的讲,可通过下面的式子来进行判断:
│Z│≥3为离群结果;
2<│Z│<3为可疑结果;
│Z│≤2为满意结果。
如上所示,当确定稳健Z比分数的绝对值大于等于3时,测定结果为离群值,舍弃第m组实验室的测定结果。
当确定稳健Z比分数的绝对值大于3且小于2时,测定结果为可疑值。
具体的讲,在认为所述第m个实验室的测定结果为可疑结果的情况下,可根据标准GB/T223.59对可疑结果进一步进行判断:当第m个实验室的测定结果与推荐值的差值大于等于允许上限例如0.001~0.003%时,舍弃所述第m个实验室的测定结果;当第m个实验室的测定结果与推荐值的差值小于允许上限例如0.001~0.003%时,保留所述第m个实验室的测定结果。
此外,当确定稳健Z比分数的绝对值小于等于2时,测定结果为满意结果,保留所述第m个实验室的测定结果。
优选地,满意结果保留并参与统计,最后报出结果。
表1是示出根据本发明实施例的判断样品检测数据可疑值方法对钒氮合金元素P的定值统计剔除可疑值和离群值之前的统计数据表。
表2是示出根据本发明实施例的判断样品检测数据可疑值方法对钒氮合金元素P的定值统计剔除可疑值和离群值之后的统计数据表。
如表1和表2所示,该示例中对钒氮合金元素P的定值统计应用,其中,具体的描述如下:
计算所得各组实验室测定数据的中值(即,表1中的中位值)。由于实验室个数为奇数,所以中值是0.009248;IQR值是0.0025,从而可计算每个实验室稳健Z比分数,并根据判定条件进行判断。
表1 钒氮合金元素P的定值统计剔除可疑值和离群值之前数据统计表
如表1所示,序号为5的实验室,钒氮合金元素P的定值的稳健Z比分数是2.6390,Z的绝对值小于阈值3且大于阈值2,所以判断序号为5的实验室的测定数据是可疑值,可疑值是舍弃还是保留根据标准GB/T223.59对可疑结果进一步进行判断,用测定结果0.0159%减去推荐值0.0109%的差值的大小范围来确定,因为差值是0.005%,不在允许上限0.001~0.003%的范围内,所以舍弃。
序号为1的实验室,钒氮合金元素P的定值的稳健Z比分数是3.7282,Z的绝对值大于阈值3,判断序号为1的实验室的测定数据是离群值,所以舍弃。
剩下的7个实验室,钒氮合金元素P的定值的稳健Z比分数的绝对值都小于阈值2,满足保留的条件,所以保留。
表2 钒氮合金元素P的定值统计剔除可疑值和离群值之后数据统计表
如表2所示,舍弃了可疑值和离群值后,剩下的七组实验室的钒氮合金元素P的定值的检测数据是满意结果,参与统计并报出结果。
尽管上面已经结合附图和示例性实施例描述了本发明,但是本领域普通技术人员应该清楚,在不脱离权利要求的精神和范围的情况下,可以对上述实施例进行各种修改。
Claims (7)
1.一种判断样品检测数据可疑值的方法,包括:
对m个实验室的同一种样品的同一个元素检测数据均进行n次测定,以形成m组数据,每组数据中均有n个数值,其中,m和n是大于等于1的整数;
对每个实验室的所述n个数值计算平均值,得到m个数据,所述m个数据作为样品检测数据的测定结果;
根据样品检测数据的测定结果,计算每个实验室样品检测数据测定结果的稳健Z比分数;
根据所述实验室样品检测数据的稳健Z比分数的大小范围来判断样品检测数据的可疑值。
2.如权利要求1所述的判断样品检测数据可疑值的方法,其中,m为大于等于6的整数,n为大于等于1的整数。
3.如权利要求1所述的判断样品检测数据可疑值的方法,其中,根据所述实验室样品检测数据的稳健Z比分数的大小范围判断样品检测数据的可疑值的步骤包括:
当第m个实验室的稳健Z比分数的绝对值大于等于第一阈值时,认为所述第m个实验室的测定结果为离群结果,舍弃所述第m个实验室的测定结果;
当第m个实验室的稳健Z比分数的绝对值小于第一阈值且大于第二阈值时,认为所述第m个实验室的测定结果为可疑结果;
当第m个实验室的稳健Z比分数的绝对值小于等于第二阈值时,认为所述第m个实验室的测定结果数据为满意结果,保留所述第m个实验室的测定结果。
4.如权利要求3所述的判断样品检测数据可疑值的方法,其中,第一阈值是3,第二阈值是2。
5.如权利要求3所述的判断样品检测数据可疑值的方法,其中,在认为所述第m个实验室的测定结果为可疑结果的情况下,根据标准GB/T223.59对可疑结果进一步进行判断:
当第m个实验室的测定结果与推荐值的差值大于等于允许上限时,舍弃所述第m个实验室的测定结果;
当第m个实验室的测定结果与推荐值的差值小于允许上限时,保留所述第m个实验室的测定结果。
6.如权利要求1所述的判断样品检测数据可疑值的方法,其中,通过下面的等式1来计算稳健Z比分数:
其中,Z表示稳健Z比分数,x表示测定结果,Xm表示中位值,NormIQR表示标准化四分位距,m表示结果总数;
其中,通过下面的等式2来计算等式1中的标准化四分位距NormIQR:
NormIQR=0.7413×IQR=Q3-Q1 等式2
其中,IQR表示四分位距,Q1表示下四分位数值,Q3表示上四分位数值。
7.如权利要求1所述的判断样品检测数据可疑值的方法,其中,所述样品为冶金样品元素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410088717.6A CN103852562B (zh) | 2014-03-11 | 2014-03-11 | 判断样品检测数据可疑值的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410088717.6A CN103852562B (zh) | 2014-03-11 | 2014-03-11 | 判断样品检测数据可疑值的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103852562A true CN103852562A (zh) | 2014-06-11 |
CN103852562B CN103852562B (zh) | 2016-01-20 |
Family
ID=50860470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410088717.6A Active CN103852562B (zh) | 2014-03-11 | 2014-03-11 | 判断样品检测数据可疑值的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103852562B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557652A (zh) * | 2016-11-14 | 2017-04-05 | 攀钢集团攀枝花钢铁研究院有限公司 | 判断样品检测数据可疑值的方法 |
CN112945785A (zh) * | 2021-02-04 | 2021-06-11 | 华润怡宝饮料(中国)有限公司 | 一种利用铝箔片检验耐破度仪性能的方法 |
CN113484468A (zh) * | 2021-06-25 | 2021-10-08 | 广州市广软科技有限公司 | 基于四分位数算法的机动车环保检测分析方法和系统 |
-
2014
- 2014-03-11 CN CN201410088717.6A patent/CN103852562B/zh active Active
Non-Patent Citations (6)
Title |
---|
佟艳春等: "实验室测量审核结果的评定方法研讨", 《冶金分析》, vol. 29, no. 7, 31 July 2009 (2009-07-31) * |
张文华等: "实验室检测结果质量控制的方法", 《中国质量》, no. 8, 31 August 2009 (2009-08-31) * |
徐增芹,赵贵芬: "稳健技术法用于实验室比对数据统计处理", 《冶金分析》, vol. 28, 30 November 2008 (2008-11-30) * |
王海舟等: "能力验证结果稳健统计值与有证参考物质认定值的符合性比较研究", 《冶金分析》, vol. 30, no. 11, 30 November 2010 (2010-11-30) * |
程坚平等: "《中华人民共和国国家标准GB/T 223.59-2008》", 19 August 2008, article "钢铁及合金 磷含量的测定 铋磷钼蓝分光光度法和锑磷钼蓝分光光度法" * |
邱跃龙等: "铝合金中Si、Fe含量测定的实验室间比对结果分析", 《中国无机分析化学》, vol. 1, no. 2, 30 June 2011 (2011-06-30) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557652A (zh) * | 2016-11-14 | 2017-04-05 | 攀钢集团攀枝花钢铁研究院有限公司 | 判断样品检测数据可疑值的方法 |
CN112945785A (zh) * | 2021-02-04 | 2021-06-11 | 华润怡宝饮料(中国)有限公司 | 一种利用铝箔片检验耐破度仪性能的方法 |
CN113484468A (zh) * | 2021-06-25 | 2021-10-08 | 广州市广软科技有限公司 | 基于四分位数算法的机动车环保检测分析方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103852562B (zh) | 2016-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Müller et al. | Accuracy of fatigue limits estimated by the staircase method using different evaluation techniques | |
Cardoso et al. | A robust methodology for modal parameters estimation applied to SHM | |
Artyushenko et al. | Statistical characteristics of envelope outliers duration of non-Gaussian information processes | |
CN104951842A (zh) | 一种新的油田产量预测方法 | |
CN106529094A (zh) | 一种基于典型飞行动作的飞机严重载荷谱编制方法 | |
CN103246821A (zh) | 一种基于仿真的多应力小样本加速寿命试验方案设计优化方法 | |
CN103852562B (zh) | 判断样品检测数据可疑值的方法 | |
CN106557652A (zh) | 判断样品检测数据可疑值的方法 | |
CN104715160B (zh) | 基于kmdb的软测量建模数据异常点检测方法 | |
CN104198998A (zh) | 非均匀背景下基于聚类处理的恒虚警检测方法 | |
CN113569432A (zh) | 一种液气密元件的模拟检测方法及系统 | |
CN111863151B (zh) | 基于高斯过程回归的聚合物分子量分布的预测方法 | |
US20170307750A1 (en) | Waveform estimation device and waveform estimation method | |
CN105930632B (zh) | 机电整机产品贮存寿命建模方法 | |
CN105095658B (zh) | 水文流量波动情势识别方法及系统 | |
CN108108863B (zh) | 基于质控数据的实验室系统误差允许范围评估方法 | |
Agbedeyi et al. | Robust method for testing the significance of bivariate correlation of ordinal data | |
CN109146840B (zh) | 基于高斯概率统计的数据几何定位精度评估方法及装置 | |
Zhou et al. | Data Inspecting and Denoising Method for Data‐Driven Stochastic Subspace Identification | |
Cox et al. | Discrete-event simulation of process control in low volume high value industries | |
CN112115654A (zh) | 一种融合实测数据的管道流场压力分布评估方法及装置 | |
CN112116014A (zh) | 一种配电自动化设备测试数据离群值检测方法 | |
Berlinger | Generalized anderson-darling test | |
JP6259749B2 (ja) | 埋設金属体の交流腐食リスク計測評価方法 | |
CN105893696B (zh) | 一种多台产品逐次投入的多阶段可靠性增长评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |