CN112765011A - 质控状态判定方法、装置及电子设备 - Google Patents
质控状态判定方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112765011A CN112765011A CN202011601347.3A CN202011601347A CN112765011A CN 112765011 A CN112765011 A CN 112765011A CN 202011601347 A CN202011601347 A CN 202011601347A CN 112765011 A CN112765011 A CN 112765011A
- Authority
- CN
- China
- Prior art keywords
- data
- dimension
- quality control
- control state
- euclidean distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003908 quality control method Methods 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000005070 sampling Methods 0.000 claims abstract description 104
- 238000001514 detection method Methods 0.000 claims abstract description 72
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 238000012360 testing method Methods 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims description 10
- 238000004088 simulation Methods 0.000 claims description 9
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 abstract description 5
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000010534 mechanism of action Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000013522 software testing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3604—Software analysis for verifying properties of programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Automatic Analysis And Handling Materials Therefor (AREA)
Abstract
本申请提供了一种质控状态判定方法、装置及电子设备,该方法应用于服务器,服务器中预存有多个数据维度分别对应的距离阈值,方法包括:获取目标检测系统采集的第一原始数据;第一原始数据为目标检测系统对目标质控物进行测试得到的按测试时间顺序排列的数据;从第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据;对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离;基于各数据维度分别对应的欧式距离及距离阈值,确定目标检测系统的质控状态。本申请基于维度规则进行质控状态判定,对误差的描述和反应更加精确,可以提高质控状态的检测精度,而且方便扩展到更多数据维度的质控检测。
Description
技术领域
本申请涉及软件测试技术领域,尤其是涉及一种质控状态判定方法、装置及电子设备。
背景技术
根据国家相关标准,临床实验室需要至少每个自然日监控检测系统的精密度。通过一系列质控规则判断当前检测系统的精密度状态是否可以接受。可接受的状态称为“在控”,不可接受则称为“失控”。这一系列质控规则一般使用传统的“Westgard多规则”。对于传统“Westgard多规则”的大致描述如下:
假设当前检测系统采集的第一原始数据服从或近似服从正态分布。首先对第一原始数据进行标准化处理,使其服从标准正态分布。处理后的数据称为第一原始数据的Z值(Z=(第一原始数据-均值)/SD,其中均值和SD是一段时间内通过第一原始数据计算的算数均数和标准差)。根据规范,至少每个自然日检测两个浓度水平的质控物以获得一对第一原始数据,然后转换为一对Z值。当有序排列的Z值出现特定排布方式时,判定精密度不可接受(检测结果出现了不可接受的差异)。这些特定排布方式由Westgard提出,并命名为“Westgard规则”。常用的规则大致有:1-3s(1个数据z值的绝对值大于3)、2-2s(连续两个数据的z值均大于2或小于-2)、4-1s(连续4个数据的z值均大于1或小于-1)、R4s(分析批内连续两个数据的z值之差大于4或小于-4)、(连续10个数据的z值同号)。通过这些规则的组合可以形成多轨则精密度控制方案。如:使用1-3s加2-2s组合;1-3s加2-2s加4-1s组合,等。
由于每个规则和各种组合规则的应用并没有强制的标准,所以实际使用时,不同的实验室可以对某个检测项目使用任意的规则或规则组合。于是对规则(或规则组合)是否适用;以及规则对监控精密度的实际效果就需要进行评估。评估方法主要使用两个指标:误差检出率(Ped)和假拒绝概率(Pfr)。具体定义为:误差检出率:当检测系统存在系统误差时,检测数据出现所选质控规则排布的概率。假拒绝概率:当检测系统不存在系统误差时,检测数据出现所选质控规则排布的概率。
一般使用蒙特卡洛法模拟数据,以进行上述评估。具体步骤如下:
1,选定需要评估的规则组合。
2,随机生成一组服从标准正态分布且两两配对的数据。保证足够多的对数(如50000对),观察数据对中是否出现待评估规则组合的排布,并计数出现的次数。计算出现概率即为Pfr。
3,随机生成一组服从标准正态分布且两两配对的数据。对生成的数据均加0.1以模拟0.1个SD的系统误差。保证足够多的对数(如50000对),观察数据对中是否出现待评估规则组合的排布,并计数出现的次数。计算出现概率即为在0.1SD系统误差下该规则的Ped。
4,以0.1SD步进,模拟并计算不同大小系统下的Ped,直至Ped接近于1。
5,以系统误差大小为横轴,出现特定排布的概率为纵轴,绘制曲线。
现有技术使用的Westgard多规则的判定过程均与Z值有关,而Z值的计算依赖于标准差SD,即Z为数据偏差所占SD的倍数,而标准差SD在正态分布下是一个大单位,有时对某些有明显差异的数据并不做区分,因此,该规则对误差的描述和反应不够精确,对失控状态的检测精度不够高,且无法进行规则扩展。
发明内容
本申请的目的在于提供一种质控状态判定方法、装置及电子设备,基于维度规则进行质控状态判定,对误差的描述和反应更加精确,可以提高质控状态的检测精度,而且方便扩展到更多数据维度的质控检测。
第一方面,本申请实施例提供一种质控状态判定方法,方法应用于服务器,服务器中预存有多个数据维度分别对应的距离阈值,数据维度与数据数量有关,方法包括:获取目标检测系统采集的第一原始数据;第一原始数据为目标检测系统对目标质控物进行测试得到的按测试时间顺序排列的数据;从第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据;对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离;基于各数据维度分别对应的欧式距离及距离阈值,确定目标检测系统的质控状态。
进一步,上述从第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据的步骤,包括:按照测试时间顺序,从第一原始数据中有序采样指定数据维度对应的初始采样数据;将指定数据维度包含的每个数据维度作为当前数据维度,均执行以下操作:按照当前数据维度对应的数据数量,对顺序排列的初始采样数据进行顺序分组处理,得到当前数据维度对应的至少一个采样数据;顺序分组处理为以数据数量为窗口大小的滑动窗口操作。
进一步,上述对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离的步骤,包括:将每个数据维度作为当前数据维度,均执行以下操作:将当前数据维度对应的每个采样数据作为当前采样数据;计算当前采样数据与原点的欧式距离;将多个当前采样数据与原点的欧式距离确定为当前数据维度对应的欧式距离。
进一步,上述计算当前采样数据与原点的欧式距离的步骤,包括:将当前采样数据进行标准化处理,得到当前采样数据对应服从标准正态分布的数值;将数值代入欧式距离计算公式,得到当前采样数据与原点的欧式距离。
进一步,上述将当前采样数据进行标准化处理,得到当前采样数据对应服从标准正态分布的数值的步骤之前,还包括:判断当前采样数据是否服从正态分布;如果否,将当前采样数据转换为服从正态分布的数据。
进一步,上述多个数据维度分别对应的距离阈值的确定过程如下:获取目标质控物的第二原始数据;利用蒙特卡洛法对第二原始数据进行模拟,得到多个数据维度分别对应的模拟数据;将每个数据维度作为当前数据维度,针对当前数据维度下的模拟数据,均执行以下操作:计算每个模拟数据到原点的欧式距离;对多个欧式距离进行排序;在顺序排列的多个欧式距离中,确定指定百分位数处对应的目标欧式距离;将目标欧式距离确定为当前数据维度对应的距离阈值。
进一步,上述基于各数据维度分别对应的欧式距离及距离阈值,确定目标检测系统的质控状态的步骤,包括:检测各数据维度分别对应的欧式距离中,是否所有的欧式距离均小于其维度对应的距离阈值;如果是,确定目标检测系统的质控状态为在控状态;如果否,确定目标检测系统的质控状态为失控状态。
第二方面,本申请实施例还提供一种质控状态判定装置,装置应用于服务器,服务器中预存有多个数据维度分别对应的距离阈值,数据维度与数据数量有关,装置包括:数据获取模块,用于获取目标检测系统采集的第一原始数据;第一原始数据为目标检测系统对目标质控物进行测试得到的按测试时间顺序排列的数据;数据采样模块,用于从第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据;距离计算模块,用于对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离;状态确定模块,用于基于各数据维度分别对应的欧式距离及距离阈值,确定目标检测系统的质控状态。
第三方面,本申请实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面所述的方法。
第四方面,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述第一方面所述的方法。
本申请实施例提供的质控状态判定方法、装置及电子设备中,首先获取目标检测系统采集的第一原始数据;第一原始数据为目标检测系统对目标质控物进行测试得到的按测试时间顺序排列的数据;从第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据;对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离;基于各数据维度分别对应的欧式距离及距离阈值,确定目标检测系统的质控状态。本申请实施例可针对不同数据维度进行有序数据采样,对各数据维度的采样数据计算与原点的欧式距离,通过欧式距离与其对应数据维度的距离阈值的对比,确定出目标检测系统的质控状态,这种以维度规则进行的质控状态判定,不依赖于现有技术中所述的Z值,对误差的描述和反应更加精确,可以提高质控状态的检测精度,而且方便扩展到更多数据维度的质控检测。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种质控状态判定方法的流程图;
图2为本申请实施例提供的一种质控状态的判定结果示意图;
图3为本申请实施例提供的一种质控状态判定作用机制示意图;
图4为本申请实施例提供的一种质控状态判定装置的结构框图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合实施例对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,现有技术使用的质控判定规则为“Westgard多规则”,该规则的判定过程均与Z值有关,而Z值的计算依赖于标准差SD,即Z为数据偏差所占SD的倍数,而标准差SD在正态分布下是一个大单位。如:4-1s规则对如下两组明显有差异的数据(均以z值计)是不做区分的:A组:1.1、1.2、1.1、1.1;B组:2.2、1.9、2.5、1.9。因此,现有规则对系统质控状态的检测精度不够高,且无法进行扩展。基于此,本申请实施例提供一种质控状态判定方法、装置及电子设备,基于维度规则进行质控状态判定,可以提高质控状态的检测精度,而且方便扩展到更多数据维度。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种质控状态判定方法进行详细介绍。
图1为本申请实施例提供的一种质控状态判定方法的流程图,该方法应用于服务器,服务器中预存有多个数据维度分别对应的距离阈值,数据维度与数据数量有关,比如,数据数量为1,那么其对应的数据维度就是一维,数据数量是2,那么其对应的数据维度就是二维,以此类推。上述方法为一种基于维度规则的质控状态判定方法,该方法具体包括以下步骤:
步骤S102,获取目标检测系统采集的第一原始数据;第一原始数据为目标检测系统对目标质控物进行测试得到的按测试时间顺序排列的数据。
上述目标检测系统为本申请实施例中要进行质控状态检测的对象,首先获取通过该目标检测系统对目标质控物进行测试得到的第一原始数据,目标质控物可以是血清之类的物质,上述第一原始数据可以是目标检测系统在同一天对目标质控物进行测试得到的按时间顺序排列的多个数据。
国家相关标准和行业标准要求至少需要对2个不同浓度的样本做每天的精密度检测。在实际观测中,精密度的统计参数SD是和浓度相关的。一般浓度值越高,SD也会越高。所以使用1个浓度来评估一定检测范围内的精密度是不够的。为了符合相关要求和提高准确度,还可以对两个以上不同浓度的目标质控物进行数据检测,得到按测试时间排列的多个数据。
步骤S104,从第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据。
针对上述第一原始数据进行数据采样时,可以先指定一个数据维度,也就是最高的数据维度,比如,最高数据维度为3,那么采样到的数据数量也为3,最高数据维度3包含的数据维度有一维、二维和三维。然后分别确定出每个数据维度分别对应的采样数据,即一维、二维和三维分别对应的采样数据。上述一维对应的采样数据中,一个数据就可以作为一个采样数据,上述二维对应的采样数据中,两个顺序排列的数据就可以作为一个采样数据,上述三维对应的采样数据中,三个顺序排列的数据作为一个采样数据。
需要说明的是,由于实验室每天都会有新的测试数据产生,甚至可能累积超过1年的数据。所以理论上最高维甚至可以达到100+。实验室可以根据实际临床需求,自定义一个指定数据维度,即最高数据维度N。
最高数据维度N可以通过以下方式确定:初步选定最高数据维度N。确定Pfr目标(惯例为1%)。获取每个数据维度对应的能效曲线,评估上述设置的Ped,令其满足临床实验室对Ped的需求,一般将N设定为8以内。
步骤S106,对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离。
还以上述例子进行说明,即针对上述一维、二维和三维分别对应的采样数据进行欧式距离计算,得到一维、二维和三维分别对应的多个欧式距离。
步骤S108,基于各数据维度分别对应的欧式距离及距离阈值,确定目标检测系统的质控状态。
具体的,检测各数据维度分别对应的欧式距离中,是否所有的欧式距离均小于其维度对应的距离阈值;如果是,确定目标检测系统的质控状态为在控状态;如果否,确定目标检测系统的质控状态为失控状态。
本申请实施例提供的质控状态判定方法,可针对不同数据维度进行有序数据采样,对各数据维度的采样数据计算与原点的欧式距离,通过欧式距离与其对应数据维度的距离阈值的对比,确定出目标检测系统的质控状态,这种以维度规则进行的质控状态判定,不依赖于现有技术中所述的Z值,对误差的描述和反应更加精确,可以提高质控状态的检测精度,而且方便扩展到更多数据维度的质控检测。
为了提高质控状态的检测精度,上述指定数据维度可以设定为较高的数据维度,指定数据维度越高,误差检出率(Ped)就越高。设定好最高采样数据维度后,就可以进行数据采样过程,具体的数据采样过程可以参见以下步骤实现:
(1)按照测试时间顺序,从第一原始数据中有序采样指定数据维度对应的初始采样数据。比如,上述指定数据维度为3,那么,按照测试时间顺序,从第一原始数据中有序采样3个数据作为指定数据维度对应的初始采样数据,分别为A1、A2、A3。
(2)将指定数据维度包含的每个数据维度作为当前数据维度,均执行以下操作:按照当前数据维度对应的数据数量,对顺序排列的初始采样数据进行顺序分组处理,得到当前数据维度对应的至少一个采样数据;顺序分组处理为以数据数量为窗口大小的滑动窗口操作。
还以上述例子为例进行说明,初始采样数据为A1、A2、A3,指定数据维度3包括的数据维度有一维、二维和三维,按照上述顺序分组处理,一维对应的采样数据包括三个,分别为:A1、A2和A3;二维对应的采样数据包括两个,分别为:[A1、A2]和[A2、A3];三维对应的采样数据包括一个,为:[A1、A2、A3]。
然后进一步对上述各数据维度对应的采样数据进行欧式距离计算,具体的计算过程如下:
将每个数据维度作为当前数据维度,均执行以下操作:
(1)将当前数据维度对应的每个采样数据作为当前采样数据;用上述二维对应的采样数据[A1、A2]和[A2、A3]进行说明,首先将[A1、A2]作为当前采样数据,执行(2)。
(2)计算当前采样数据与原点的欧式距离;具体的,将当前采样数据进行标准化处理,得到当前采样数据对应服从标准正态分布的数值;将数值代入欧式距离计算公式,得到当前采样数据与原点的欧式距离。比如,对[A1、A2]进行标准化处理,得到对应的服从标准正态分布的数值[Z1、Z2]。具体标准化处理可根据下式进行:
Z=(原始数据-均值)/标准差;其中,均值和标准差均为基于第一原始数据计算的结果。
需要说明的是,将当前采样数据进行标准化处理,得到当前采样数据对应服从标准正态分布的数值的步骤之前,还可以包括以下步骤:判断当前采样数据是否服从正态分布;如果否,将当前采样数据转换为服从正态分布的数据。在当前采样数据服从正态分布的情况下,再将其标准化处理为服从标准正态分布的数据。
另外,这里标准化处理的步骤也可以在步骤S102后执行,即获取到第一原始数据后,就进行标准化处理,将第一原始数据全部转换为服从标准正态分布的数据Z值,然后再从该Z值中进行后续数据采样过程,在计算欧式距离时就可以直接将Z值代入欧式距离公式进行计算了。
(3)将多个当前采样数据与原点的欧式距离确定为当前数据维度对应的欧式距离。
比如,将上述基于二维对应的采样数据[A1、A2]和[A2、A3],计算出的欧式距离D12、D23,确定为二维对应的欧式距离。
同理,基于上述一维对应的采样数据A1、A2和A3,可以计算出一维对应的欧式距离分别为:D1、D2、D3;基于上述三维对应的采样数据[A1、A2、A3],计算出三维对应的欧式距离为D123。
然后再基于上述各数据维度对应的欧式距离,进行质控状态的判断,检测各数据维度分别对应的欧式距离中,是否所有的欧式距离均小于其维度对应的距离阈值;如果是,确定目标检测系统的质控状态为在控状态;如果否,确定目标检测系统的质控状态为失控状态。
比如,将上述一维对应的欧式距离D1、D2、D3,分别与一维数据维度对应的距离阈值d1进行比较,将上述二维对应的欧式距离D12、D23,分别与二维数据维度对应的距离阈值d2进行比较,将上述三维对应的欧式距离D123,分别与三维数据维度对应的距离阈值d3进行比较,上述多个欧式距离中,只要有一个比相应距离阈值大,就可以确定目标检测系统的质控状态为失控状态,只有所有的欧式距离均小于其对应的距离阈值,才可以确定目标检测系统的质控状态为在控状态。
如图2所示的本申请实施例提供的一种质控状态的判定结果示意图,该实施例中,最高数据维度为2,图中的20个抽样对z1、z2为连续20天的检测的原始数据对应的标准化处理后的数值。z1、z2作为两个一维采样数据,其与原点的欧式距离的计算结果与z1、z2相同,可以将z1、z2当作欧式距离,z1、z2作为二维采样数据,其与原点的欧式距离的计算结果为d2,1维阈值=2.82,2维阈值=3.35,从图中可以看出,第3天的z2超过了1维阈值,即第3天的目标检测系统的质控状态为失控状态,如图中X表示,第16天的z2超过了1维阈值,且d2超过了2维阈值,因此,第16天的目标检测系统的质控状态为失控状态。
下面对上述多个数据维度分别对应的距离阈值的确定过程进行阐述,具体包括以下步骤:
(1)获取目标质控物的第二原始数据;第二原始数据可以与第一原始数据一样,也可以是另采集的一批数据,数据量可以达到20000到50000个,甚至可以更多。
(2)利用蒙特卡洛法对第二原始数据进行模拟,得到多个数据维度分别对应的模拟数据。
也就是,将第二原始数据转换为服从标准正态分布的Z值。每个数据维度对应的模拟数据类似于上述每个数据维度对应的采样数据,只不过采样数据为抽样的几个,而模拟数据为针对由第二原始数据对应Z值组成的数据集进行多维采样得到的。
(3)将每个数据维度作为当前数据维度,针对当前数据维度下的模拟数据,均执行以下操作:计算每个模拟数据到原点的欧式距离;对多个欧式距离进行排序;在顺序排列的多个欧式距离中,确定指定百分位数处对应的目标欧式距离;将目标欧式距离确定为当前数据维度对应的距离阈值。
上述计算每个模拟数据到原点的欧式距离的过程与前述计算采样数据到原点的欧式距离类似,在此不再赘述。上述指定百分位数在本申请实施例中由假拒绝概率Pfr决定,比如,Pfr设定为1%,那么指定百分位数则为99%。
比如,针对二维对应的模拟数据Z值计算完欧式距离后,对多个欧式距离进行从小到大排序,然后从小到大的顺序找到整体数据的99%位置处的欧式距离,或者或者从大到小的顺序找到1%位置处的欧式距离,实际是同一个欧式距离,将该欧式距离作为二维对应的距离阈值,也就是说,有99%的欧式距离均小于该阈值,根据Pfr的定义,3.35就是二维数据维度对应的距离阈值。同理,可以确定出任意维度下的距离阈值,比如,一维数据维度对应的距离阈值为2.82,三维数据维度对应的距离阈值为3.81等。
下面用本申请的观点解释现有技术和本技术中质控规则的作用机制:
现有的规则所涉及的数据维度。1-3s只涉及一个数据因此是一维的;2-2s和R4s是二维的;4-1s是四维的;是10维的,如图3所示,横轴和纵轴分别是两次数据抽样。均以Z值计。1-3s规则对应平行于坐标轴的4条直线,将在控区域划为中间边长为6的正方形。R4s规则对应图中两条斜线,斜线所夹部分为在控。2-2s在上述两个规则在控区域的交集内,进一步去除了深灰小方块的区域。最终,现有技术在2维内确定的在控区域是一个不规则的多边形(图中中心圆和白色区域的并集)。
本申请实施例中不使用上述规则,在任意维度,本申请实施例只用一个规则。在该维度确定一个以原点为中心的开球作为在控区域。如图3中所示的中心圆。该开球的半径由Pfr决定。
下面列举几个现有技术的缺陷和本技术的对应改进:
第一,现有技术对Pfr和Ped的计算存在偏差。
以上述二维的情形为例。现有技术划分的在控区域是一个不规则的多边形。当检测出现系统误差时,导致数据均值可以从原点向各个方向移动。而不同的移动方向所计算得到的Ped是不同的。进而导致绘制到的功效函数的不同。而现有技术对Ped的计算只考虑了上图中,均值沿y=x直线移动的情况。在大多数情况下,Ped的计算出现了假性增高,从而增加了检测风险。
本申请实施例中的技术由于无论维度值是多少,均以对称的开球为在控区域。无论移动方向如何,其Ped均为定值。
第二,现有技术提供的规则不具备可扩展性。
目前使用的规则无法进行扩展。最多考虑10个维度,且精度不佳。本申请实施例中的技术理论上可以无限扩展维度,为大数据统计做好准备。第三,现有技术提供的规则对误差的描述和反应不够精确。
现有技术使用的规则均与z值有关。而Z值的计算依赖于标准差SD,即Z为数据偏差所占SD的倍数,而标准差SD在正态分布下是一个大单位。如:4-1s规则对如下两组明显有差异的数据(均以z值计)是不做区分的:A组:1.1、1.2、1.1、1.1;B组:2.2、1.9、2.5、1.9。
本申请实施例中的技术由于使用每个数据到原点的欧式距离,可以考虑每个数据对偏差的贡献。最终得到更为精确的阈值。对偏差的定量估计也更精确。
第四,现有技术无法控制Pfr。
现有技术无法通过Pfr确定阈值,导致某些规则的Pfr过大或过小。导致Ped和Pfr无法做到合理的平衡(Ped越大越好,Pfr越小越好,但两者必定同向变化)。
本申请实施例中的技术可以按照实际需求以Pfr划定阈值,在应用中得到最佳平衡点。
第五,现有技术对失控状态的灵敏度较低。
原理同上述第三点。
本申请实施例提供的质控状态判定方法,在标准正态分布下,将失控状态抽象统一理解为检测值距离原点的距离过大。本申请实施例提供的技术只有一条规则,暂定名为“维度规则”。由于所有数据均服从正态分布,单数据抽样时服从一维正态分布。由于每次都是独立抽样,多数据抽样时就服从r=0的n维正态分布。在特定维数组成的Rn空间内,以有序抽样数据为坐标确定一个空间中的抽样点,计算抽样点到原点的欧式距离d。如该距离d超过阈值,则判定出现失控。
关于阈值的确定。以合适的Pfr确定各维度合适的阈值。假设以Pfr=1%为目标确定阈值。在1维时,d约为2.82;2维时,d约为3.35;3维时,d约为3.81,等等。其中Pfr使用蒙特卡罗法模拟数据并计算。本技术预计算Pfr=1%时,1到10维的能效曲线。在目前的临床实验室应用场景中,已能满足需求。并可方便地向更高维扩展。
上述方法可以多维联合应用。确定一个最高维数N,对其中包含的1到N维的所有可能抽样计算对应的d,并配合各维度对应的阈值进行联合判断。只要其中任意维的d超过该维度阈值,都判定为失控。联合应用可以大幅提高Ped。
基于上述方法实施例,本申请实施例还提供一种质控状态判定装置,装置应用于服务器,服务器中预存有多个数据维度分别对应的距离阈值,数据维度与数据数量有关,参见图4所示,该装置包括:
数据获取模块402,用于获取目标检测系统采集的第一原始数据;第一原始数据为目标检测系统对目标质控物进行测试得到的按测试时间顺序排列的数据;数据采样模块404,用于从第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据;距离计算模块406,用于对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离;状态确定模块408,用于基于各数据维度分别对应的欧式距离及距离阈值,确定目标检测系统的质控状态。
进一步,上述数据采样模块404还用于:按照测试时间顺序,从第一原始数据中有序采样指定数据维度对应的初始采样数据;将指定数据维度包含的每个数据维度作为当前数据维度,均执行以下操作:按照当前数据维度对应的数据数量,对顺序排列的初始采样数据进行顺序分组处理,得到当前数据维度对应的至少一个采样数据;顺序分组处理为以数据数量为窗口大小的滑动窗口操作。
进一步,上述距离计算模块406还用于:将每个数据维度作为当前数据维度,均执行以下操作:将当前数据维度对应的每个采样数据作为当前采样数据;计算当前采样数据与原点的欧式距离;将多个当前采样数据与原点的欧式距离确定为当前数据维度对应的欧式距离。
进一步,上述距离计算模块406还用于:将当前采样数据进行标准化处理,得到当前采样数据对应服从标准正态分布的数值;将数值代入欧式距离计算公式,得到当前采样数据与原点的欧式距离。
进一步,上述距离计算模块406还用于:判断当前采样数据是否服从正态分布;如果否,将当前采样数据转换为服从正态分布的数据。
进一步,上述装置还包括阈值确定模块用于:获取目标质控物的第二原始数据;利用蒙特卡洛法对第二原始数据进行模拟,得到多个数据维度分别对应的模拟数据;将每个数据维度作为当前数据维度,针对当前数据维度下的模拟数据,均执行以下操作:计算每个模拟数据到原点的欧式距离;对多个欧式距离进行排序;在顺序排列的多个欧式距离中,确定指定百分位数处对应的目标欧式距离;将目标欧式距离确定为当前数据维度对应的距离阈值。
进一步,上述状态确定模块408还用于:检测各数据维度分别对应的欧式距离中,是否所有的欧式距离均小于其维度对应的距离阈值;如果是,确定目标检测系统的质控状态为在控状态;如果否,确定目标检测系统的质控状态为失控状态。
本申请实施例提供的质控状态判定装置,可针对不同数据维度进行有序数据采样,对各数据维度的采样数据计算与原点的欧式距离,通过欧式距离与其对应数据维度的距离阈值的对比,确定出目标检测系统的质控状态,这种以维度规则进行的质控状态判定,不依赖于现有技术中所述的Z值,可以提高质控状态的检测精确度,且可以方便地扩展为更高维度的质控检测。
本申请实施例提供的质控状态判定装置,其实现原理及产生的技术效果和前述质控状态判定方法实施例相同,为简要描述,质控状态判定装置的实施例部分未提及之处,可参考前述质控状态判定方法实施例中相应内容。
本申请实施例还提供了一种电子设备,如图5所示,为该电子设备的结构示意图,其中,该电子设备包括处理器51和存储器50,该存储器50存储有能够被该处理器51执行的计算机可执行指令,该处理器51执行该计算机可执行指令以实现上述方法。
在图5示出的实施方式中,该电子设备还包括总线52和通信接口53,其中,处理器51、通信接口53和存储器50通过总线52连接。
其中,存储器50可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口53(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线52可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线52可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器51可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器51中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器51可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器51读取存储器中的信息,结合其硬件完成前述实施例的方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令在被处理器调用和执行时,该计算机可执行指令促使处理器实现上述方法,具体实现可参见前述方法实施例,在此不再赘述。
本申请实施例所提供的方法、装置和电子设备的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本申请的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种质控状态判定方法,其特征在于,所述方法应用于服务器,所述服务器中预存有多个数据维度分别对应的距离阈值,所述数据维度与数据数量有关,所述方法包括:
获取目标检测系统采集的第一原始数据;所述第一原始数据为所述目标检测系统对目标质控物进行测试得到的按测试时间顺序排列的数据;
从所述第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据;
对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离;
基于各数据维度分别对应的欧式距离及距离阈值,确定所述目标检测系统的质控状态。
2.根据权利要求1所述的方法,其特征在于,从所述第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据的步骤,包括:
按照测试时间顺序,从所述第一原始数据中有序采样所述指定数据维度对应的初始采样数据;
将所述指定数据维度包含的每个数据维度作为当前数据维度,均执行以下操作:
按照所述当前数据维度对应的数据数量,对顺序排列的所述初始采样数据进行顺序分组处理,得到所述当前数据维度对应的至少一个采样数据;所述顺序分组处理为以所述数据数量为窗口大小的滑动窗口操作。
3.根据权利要求1所述的方法,其特征在于,对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离的步骤,包括:
将每个数据维度作为当前数据维度,均执行以下操作:
将所述当前数据维度对应的每个采样数据作为当前采样数据;
计算所述当前采样数据与原点的欧式距离;
将多个当前采样数据与原点的欧式距离确定为所述当前数据维度对应的欧式距离。
4.根据权利要求3所述的方法,其特征在于,计算所述当前采样数据与原点的欧式距离的步骤,包括:
将所述当前采样数据进行标准化处理,得到所述当前采样数据对应服从标准正态分布的数值;
将所述数值代入欧式距离计算公式,得到所述当前采样数据与原点的欧式距离。
5.根据权利要求4所述的方法,其特征在于,将所述当前采样数据进行标准化处理,得到所述当前采样数据对应服从标准正态分布的数值的步骤之前,还包括:
判断所述当前采样数据是否服从正态分布;
如果否,将所述当前采样数据转换为服从正态分布的数据。
6.根据权利要求1所述的方法,其特征在于,所述多个数据维度分别对应的距离阈值的确定过程如下:
获取所述目标质控物的第二原始数据;
利用蒙特卡洛法对所述第二原始数据进行模拟,得到多个所述数据维度分别对应的模拟数据;
将每个所述数据维度作为当前数据维度,针对所述当前数据维度下的模拟数据,均执行以下操作:
计算每个模拟数据到原点的欧式距离;
对多个欧式距离进行排序;
在顺序排列的多个欧式距离中,确定指定百分位数处对应的目标欧式距离;
将所述目标欧式距离确定为所述当前数据维度对应的距离阈值。
7.根据权利要求1所述的方法,其特征在于,基于各数据维度分别对应的欧式距离及距离阈值,确定所述目标检测系统的质控状态的步骤,包括:
检测各数据维度分别对应的欧式距离中,是否所有的欧式距离均小于其维度对应的距离阈值;
如果是,确定所述目标检测系统的质控状态为在控状态;
如果否,确定所述目标检测系统的质控状态为失控状态。
8.一种质控状态判定装置,其特征在于,所述装置应用于服务器,所述服务器中预存有多个数据维度分别对应的距离阈值,所述数据维度与数据数量有关,所述装置包括:
数据获取模块,用于获取目标检测系统采集的第一原始数据;所述第一原始数据为所述目标检测系统对目标质控物进行测试得到的按测试时间顺序排列的数据;
数据采样模块,用于从所述第一原始数据中有序采样指定数据维度包含的各数据维度分别对应的采样数据;
距离计算模块,用于对各数据维度分别对应的采样数据进行欧式距离计算,得到各数据维度分别对应的欧式距离;
状态确定模块,用于基于各数据维度分别对应的欧式距离及距离阈值,确定所述目标检测系统的质控状态。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011601347.3A CN112765011B (zh) | 2020-12-30 | 2020-12-30 | 质控状态判定方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011601347.3A CN112765011B (zh) | 2020-12-30 | 2020-12-30 | 质控状态判定方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112765011A true CN112765011A (zh) | 2021-05-07 |
CN112765011B CN112765011B (zh) | 2023-10-10 |
Family
ID=75697186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011601347.3A Active CN112765011B (zh) | 2020-12-30 | 2020-12-30 | 质控状态判定方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112765011B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002241847A (ja) * | 2001-02-20 | 2002-08-28 | Kawasaki Steel Corp | 鋼材の製品品質管理装置 |
CN107887032A (zh) * | 2016-09-27 | 2018-04-06 | 中国移动通信有限公司研究院 | 一种数据处理方法及装置 |
CN108171142A (zh) * | 2017-12-26 | 2018-06-15 | 中南大学 | 一种确定复杂工业过程中关键变量因果关系的方法 |
CN111370067A (zh) * | 2020-02-28 | 2020-07-03 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 一种面向lc/gc-ms的代谢组学数据质量控制方法及系统 |
-
2020
- 2020-12-30 CN CN202011601347.3A patent/CN112765011B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002241847A (ja) * | 2001-02-20 | 2002-08-28 | Kawasaki Steel Corp | 鋼材の製品品質管理装置 |
CN107887032A (zh) * | 2016-09-27 | 2018-04-06 | 中国移动通信有限公司研究院 | 一种数据处理方法及装置 |
CN108171142A (zh) * | 2017-12-26 | 2018-06-15 | 中南大学 | 一种确定复杂工业过程中关键变量因果关系的方法 |
CN111370067A (zh) * | 2020-02-28 | 2020-07-03 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 一种面向lc/gc-ms的代谢组学数据质量控制方法及系统 |
Non-Patent Citations (3)
Title |
---|
CHAO DING 等: ""Convex optimization learning of faithful Euclidean distance representations in nonlinear dimensionality reduction"", 《MATHEMATICAL PROGRAMMING》, pages 341 * |
RUNDA JIA 等: ""Robust PLS model based product quality control strategy for solvent extraction process"", 《2013 25TH CHINESE CONTROL AND DECISION CONFERENCE (CCDC)》, pages 1217 - 1222 * |
陶然 等: ""医学检验所自动预警程序的建立和运营"", 《临床检验杂志》, vol. 35, no. 6, pages 97 - 100 * |
Also Published As
Publication number | Publication date |
---|---|
CN112765011B (zh) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110600098A (zh) | 一种临床化学自动审核方法、系统、装置和存储介质 | |
JP2019148583A (ja) | 誤検知を減少させた分光学的定量化のための識別 | |
CN115691722A (zh) | 医疗数据检测的质控方法、装置、设备、介质及程序产品 | |
CN108647737A (zh) | 一种基于聚类的自适应时间序列异常检测方法及装置 | |
CN113053535A (zh) | 一种医疗信息预测系统及医疗信息预测方法 | |
CN108900622A (zh) | 基于物联网的数据融合方法、装置与计算机可读存储介质 | |
CN105045220B (zh) | 一种用于实验室诊断领域或工业生产领域的基于多变量z分数质量控制图的质量控制方法 | |
Chromiński et al. | Comparison of outlier detection methods in biomedical data | |
CN111860698A (zh) | 确定学习模型的稳定性的方法和装置 | |
CN117152152B (zh) | 检测试剂盒的生产管理系统及方法 | |
CN112765011B (zh) | 质控状态判定方法、装置及电子设备 | |
CN114944208B (zh) | 质量控制方法、装置、电子设备及存储介质 | |
CN110600090A (zh) | 一种临床检验数据处理方法、装置、介质及终端设备 | |
CN108109675B (zh) | 一种实验室质量控制数据管理系统 | |
CN114550865A (zh) | 一种影响学生体测的多维度数据分析方法及装置 | |
CN113392086B (zh) | 基于物联网的医疗数据库构建方法、装置及设备 | |
CN111640096B (zh) | 电子产品外观的检测方法、装置及终端 | |
CN107103134A (zh) | 基于贝叶斯网络的低速无线传感器网络测试性分析方法 | |
CN111932142A (zh) | 方案分组和数据分组方法、装置、设备及存储介质 | |
JP2011007686A (ja) | 臨床検査結果の分析装置及び分析方法 | |
CN113674796B (zh) | 一种建立抗药抗体计算阈值群的方法及用于实现该方法的系统 | |
CN114996318B (zh) | 一种检测数据异常值处理方式的自动判别方法及系统 | |
CN115620042B (zh) | 一种基于目标检测和聚类的齿轮型号判定方法及判定系统 | |
CN113434408B (zh) | 一种基于测试预言的单元测试用例排序方法 | |
CN113804244B (zh) | 缺陷分析方法及装置、电子装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240226 Address after: Room 503, No. 42 Guangzhou Road, Zhongxing Street, Development Zone, Nantong City, Jiangsu Province, 226010 Patentee after: Kunlai Biotechnology (Nantong) Co.,Ltd. Country or region after: China Address before: 200080 room 109, area B, building 1, no.2601, Songhuajiang Road, Hongkou District, Shanghai Patentee before: SHANGHAI QUALAB BIOTECHNOLOGY CO.,LTD. Country or region before: China |
|
TR01 | Transfer of patent right |