CN112819751B - 多肽芯片检测结果的数据处理方法及装置 - Google Patents
多肽芯片检测结果的数据处理方法及装置 Download PDFInfo
- Publication number
- CN112819751B CN112819751B CN202011638707.7A CN202011638707A CN112819751B CN 112819751 B CN112819751 B CN 112819751B CN 202011638707 A CN202011638707 A CN 202011638707A CN 112819751 B CN112819751 B CN 112819751B
- Authority
- CN
- China
- Prior art keywords
- pattern
- sample
- polypeptide chip
- sub
- detection result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 273
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 273
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 273
- 238000001514 detection method Methods 0.000 title claims abstract description 179
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012545 processing Methods 0.000 title claims description 36
- 238000004458 analytical method Methods 0.000 claims abstract description 165
- 230000002159 abnormal effect Effects 0.000 claims abstract description 40
- 238000003672 processing method Methods 0.000 claims abstract description 8
- 238000013461 design Methods 0.000 claims description 69
- 238000009826 distribution Methods 0.000 claims description 66
- 238000011156 evaluation Methods 0.000 claims description 22
- 238000010586 diagram Methods 0.000 claims description 19
- 238000003860 storage Methods 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 10
- 238000012417 linear regression Methods 0.000 claims description 9
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 239000000523 sample Substances 0.000 description 148
- 238000003908 quality control method Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 15
- 238000012937 correction Methods 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 8
- 239000000243 solution Substances 0.000 description 7
- 101001026578 Hordeum vulgare Ent-kaurenoic acid oxidase 1 Proteins 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010219 correlation analysis Methods 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 102000007079 Peptide Fragments Human genes 0.000 description 3
- 108010033276 Peptide Fragments Proteins 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 206010018910 Haemolysis Diseases 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000008588 hemolysis Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004989 laser desorption mass spectroscopy Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
- G06T7/001—Industrial image inspection using an image reference approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30148—Semiconductor; IC; Wafer
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本申请公开了一种多肽芯片检测结果的数据处理方法及装置。其中,该方法包括:获取多肽芯片检测结果数据集,其中,所述多肽芯片检测结果数据集中包括一个和/或多个样本的检测结果数据;采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,其中,所述至少一种分析方式包括:仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式;依据分析结果判断所述多肽芯片检测结果数据集中的数据是否存在异常。
Description
技术领域
本申请涉及数据处理领域,具体而言,涉及一种多肽芯片检测结果的数据处理方法及装置。
背景技术
多肽芯片是一种基于衬底材料(例如玻璃、硅等)的芯片,一张多肽芯片上通常包括成千上万甚至十万、百万、千万个特征,一个特征通常是一簇序列相同的肽段,多肽芯片上的大多数特征之间的肽段序列是不一样的,也有一部分特征具有相同的探针序列,称为重复特征。多肽芯片可被用于不同领域的研究,在这些研究中,通常一次实验会检测多个目标样本,此外还会包括用于质量控制的质控样本(包括阳性质控样本和阴性质控样本)。待测样本被加载到芯片上后,其中的一些分子会和特征进行结合,把不能结合的分子冲洗掉后,通过施加外部刺激(例如激光),使得结合物或者其上的附加物(例如荧光基团)产生可检测的信号(例如荧光),然后通过检测仪器采集这些信号,并输出芯片中每个特征的信号强度,即多肽芯片检测结果数据。但是,因为在整个实验过程中,有许多因素会对结果数据产生影响,例如实验参数(例如曝光时间太长导致信号过饱和)、芯片质量(例如:制造工艺不稳定或者人为意外划伤等引起)、操作错误(例如加错样本、样本标记错误等)、特征定位错误或特征定位不佳等,这些因素可能仅影响单个待测样本的结果,也可能影响整批实验所有的待测样本的结果;因此对于多肽芯片的检测结果数据需要进行全面有效的分析,以避免不合格的检测结果数据影响后续的分析和利用。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种多肽芯片检测结果的数据处理方法及装置,以至少解决相关技术中尚无对多肽芯片检测结果数据进行全面分析的解决方案,而影响后续数据利用的技术问题。
根据本申请实施例的一个方面,提供了一种多肽芯片检测结果的数据处理方法,包括:获取多肽芯片检测结果数据集,其中,所述多肽芯片检测结果数据集中包括一个和/或多个样本的检测结果数据;采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,其中,所述至少一种分析方式包括:仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式;依据分析结果判断所述多肽芯片检测结果数据集中的数据是否存在异常。
根据本申请实施例的一个方面,提供了一种多肽芯片检测结果的数据处理方法,包括:获取图像采集器采集的目标图像,其中,所述目标图像为所述多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;从所述目标图像中确定所述多肽芯片中各个特征的特征位置;获取由在所述特征位置检测到的信号组成的第一图案;计算所述第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,所述第二图案为依据所述多肽芯片的设计参数确定的,所述设计参数包括所述多肽芯片上所述指定特征在芯片上的位置信息和预期的信号强度信息;依据所述可信度和目标调整量对所述第一图案进行调整。
根据本申请实施例的一个方面,提供了一种多肽芯片检测结果的数据处理装置,包括:获取模块,用于获取多肽芯片检测结果数据集,其中,所述多肽芯片检测结果数据集中包括一个和/或多个样本的检测结果数据;分析模块,用于采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,其中,所述至少一种分析方式包括:仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式;判断模块,用于依据分析结果判断所述多肽芯片检测结果数据集中的数据是否存在异常。:
根据本申请实施例的一个方面,提供了一种多肽芯片检测结果的数据处理装置,包括:第一获取模块,用于获取图像采集器采集的目标图像,其中,所述目标图像为所述多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;确定模块,用于从所述目标图像中确定所述多肽芯片中各个特征的特征位置;第二获取模块,用于获取由在所述特征位置检测到的信号组成的第一图案;计算模块,用于计算所述第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,所述第二图案为依据所述多肽芯片的设计参数确定的,所述设计参数包括所述多肽芯片上所述指定特征在芯片上的位置信息和预期的信号强度信息;调整模块,用于依据可信度和目标调整量对所述第一图案进行调整。
根据本申请实施例的一个方面,提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行以上所述的多肽芯片检测结果的数据处理方法。
在本申请实施例中,对多肽芯片检测结果数据集中的数据,采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,其中,所述至少一种分析方式包括:仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式,并依据分析结果确定检测结果数据是否异常,从而实现了对对多肽芯片检测结果数据进行质控的技术效果,进而解决了相关技术中尚无对多肽芯片检测结果数据进行全面分析的解决方案,而影响后续数据利用技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例中的一种多肽芯片检测结果的数据处理方法的流程示意图;
图2a是本申请实施例中的对正常样本多肽芯片检测结果的信号强度分布曲线示意图;
图2b是本申请实施例中的存在溶血情况的样本的多肽芯片检测结果的信号强度分布曲线示意图;
图2c是本申请实施例中的信号强度分布曲线重合度较高的信号强度分布曲线示意图;
图2d是本申请实施例中的信号强度分布曲线重合度较低的信号强度分布曲线示意图;
图2e是本申请实施例中的饱和质控失败的信号强度分布曲线示意图;
图3a是本申请实施例中的特征定位正确的定位结果示意图;
图3b是本申请实施例中的特征定位错误的定位结果示意图;
图4是本申请实施例中的一种对特征图案进行矫正的流程图;
图5是本申请实施例中的一种掩膜分析的分析评估图示意图;
图6a是本申请实施例中的一种信号强度亮度示意图;
图6b是本申请实施例中的另一种信号强度亮度示意图;
图6c是本申请实施例中的另一种信号强度亮度示意图;
图7是本申请实施例中的样本相关性热图示意图;
图8是本申请实施例中的一种数据处理流程示意图;
图9是本申请实施例中的一种多肽芯片检测结果的数据处理装置的结构示意图;
图10是本申请实施例中的另一种多肽芯片检测结果的数据处理方法的流程图;
图11是本申请实施例中的另一种多肽芯片检测结果的数据处理装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了更好地理解上述实施例,以下将本申请实施例中涉及的术语解释如下:
掩膜:多肽芯片生产过程中,承载有设计图形,以用于控制曝光区域的部件。
相关技术中,在待测样本被加载到多肽芯片上后,其中的一些分子会和多肽芯片中的特征进行结合,把不能结合的分子冲洗掉后,通过施加外部刺激(例如激光),使得结合物或者其上的附加物(例如荧光基团)产生可检测的信号(例如荧光),然后通过检测仪器采集这些信号,并输出芯片中每个特征的信号强度,即多肽芯片检测结果数据。但是,因为在整个实验过程中,有许多因素会对结果数据产生影响,例如实验参数(例如曝光时间太长导致信号过饱和)、芯片质量(例如:制造工艺不稳定或者人为意外划伤等引起)、操作错误(例如加错样本、样本标记错误等)、特征定位错误或特征定位不佳等,这些因素可能仅影响单个待测样本的结果,也可能影响整批实验所有的待测样本的结果;因此对于多肽芯片的检测结果数据需要进行全面的质量评估,以避免不合格的检测结果数据影响后续的分析和利用。
为实现上述目的,本申请实施例采用多种分析方法对多肽芯片检测结果数据集中的数据进行分析,从而能够同时实现单个样本和多个样本的多肽芯片检测结果质或/分析,提示是否存在异常情况;尤其是能分析识别存在出特征定位错误的多肽芯片检测结果;还可根据分析的结果可以一定程度的提示出现相关异常的原因。以下结合具体实施例详细说明。
本申请实施例还提供一种多肽芯片技术平台,该平台包括多肽芯片,荧光成像仪(例如Melecular Device Image Xpress Micro-4),芯片离心机(例如Labnet C1303T-230V),洗板机(例如BioTek Instruments,405TSUVS),96孔板轨道式振荡器(例如Thermoscientific,88880026),恒温混匀器(例如Eppendorf Thermomixer C)。需要说明的是,在实际应用中,该平台中的设备可以具有比上述平台较多或较少的设备。
在上述运行环境下,根据本申请实施例,提供了一种多肽芯片检测结果的数据处理的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的一种多肽芯片检测结果的数据处理方法的流程示意图,如图1所示,该方法包括步骤S102-S106,具体地:
步骤S102,获取多肽芯片检测结果数据集,其中,多肽芯片检测结果数据集中包括一个和/或多个样本的检测结果数据;
待测样本被加载到芯片上后,其中的一些分子会和特征进行结合,将不能结合的分子冲洗掉后,通过施加外部刺激(例如激光),使得结合物或者其上的附加物(例如荧光基团)产生可检测的信号(例如荧光),然后通过检测仪器采集这些信号,并输出芯片中每个特征的信号强度,即多肽芯片检测结果数据。
步骤S104,采用以下至少一种分析方式对多肽芯片检测结果数据集中的数据进行分析,其中,至少一种分析方式包括:
仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式;其中,支持对多个样本的检查结果数据进行分析的分析方式,可以为用于对多个样本的检查结果数据之间的相关性进行分析的分析方式,但不限于此。
例如,上述至少一种分析方式包括但不限于:信号强度分布分析;过饱和分析;特征定位分析;掩膜分析;离群值分析;样本相关性分析。其中,信号强度分布分析适用于单样本分析和多样本分析(存在重复样本的情况);过饱和分析适用于单样本分析;特征定位分析适用于单样本分析;掩膜分析适用于单样本分析和;所述离群值分析适用于单样本分析;样本相关性分析适用于多样本分析。
步骤S106,依据分析结果判断多肽芯片检测结果数据集中的数据是否存在异常。即依据判断结果可以确定多肽芯片检测结果数据集中的数据通过质量评估。在一些实施例中,在确定存在异常时,可以生成提示信息,并输出提示信息,其中,提示信息的输出方式包括但不限于:在人机交互界面中展示提示信息;以语音播报的方式播放提示信息;声光报警。
需要说明的是,在采用多种分析方式对多肽芯片检测结果数据集中的数据集进行分析时,在任意一个分析结果不满足相应的条件时,则确定所述多肽芯片检测结果数据集中的数据存在异常,即质量评估不通过;在多种分析方式对应的分析结果均满足相应的条件时,则确定多肽芯片检测结果数据集中的数据不存在异常,即正常。
正如上面所述,上述至少一种分析方式包括但不限于:信号强度分布分析;过饱和分析;特征定位分析;掩膜分析;离群值分析。以下详细说明各自分析方式的具体实现过程:
信号强度分布分析:
获取多肽芯片检测结果数据集中每个样本的信号强度,并基于信号强度确定每个样本的信号强度分布曲线;基于信号强度分布曲线对每个样本的多肽芯片检测结果数据进行分析。
具体地,确定信号强度分布曲线的曲线形状;比较曲线形状与基准信号强度分布曲线的形状;基于比较结果对每个样本的多肽芯片检测结果数据进行分析。在一些实施例中,基准信号强度分布曲线是基于正常的多肽芯片检测结果数据来确定的。需要说明的是,可以计算信号强度分布曲线的曲线形状与基准信号强度分布曲线的形状的相似度,在相似度大于等于相似度阈值时,则确定两者比较接近,信号强度分布曲线对应的多肽芯片检测结果数据通过信号强度分布分析,否则,信号强度分布曲线对应的多肽芯片检测结果数据未能通过信号强度分布分析,即确定多肽芯片检测结果数据集中存在数据异常,质控失败。另外,某些未能通过信号强度分布分析的信号强度分布曲线的形状与异常原因存在映射关系,在与这些未能通过信号强度分布分析的信号强度分布曲线的形状比对后,便可以初步确定数据异常的原因。
例如,一个正常样本的信号强度分布曲线(可作为基准信号强度分布曲线)如图2a所示;而存在溶血情况的样本的信号强度分布曲线通常存在双峰(如图2b所示);在获得检测结果数据前的图像采集过程中过曝,或者待检测样本的上样浓度过高的样本的信号分布曲线通常存在右侧翘尾的情况(如图2e)。
在进行信号强度分布分析时,还可以对所述多肽芯片检测结果数据中同一样本的重复检测结果对应的信号强度分布图的重合度进行分析,具体地:确定多肽芯片检测结果数据集中同一样本的重复检测结果对应的信号强度分布图,其中,信号强度分布图中包括对同一样本执行至少两次多肽芯片检测分别得到的至少两个信号强度分布曲线;确定至少两个信号强度分布曲线的重合度;基于重合度对同一样本的多肽芯片检测结果数据进行分析。
例如:把重复检测样本的信号强度分布曲线绘制到同一个图中,可以通过信号强度曲线的重合情况判断重复样本的检测结果是否合理。一个良好的重复检测的样本的信号强度分布曲线如图2c所示。如果存在样本标记错误、加样错误或者其它异常操作,重复检测样本的信号强度曲线的重合情况通常较差,如图2d所示。
过饱和分析
获取多肽芯片检测结果数据集中每个样本的过饱和特征,其中,过饱和特征为样本的多肽芯片检测结果中信号强度大于等于第一阈值的特征;计算每个样本的过饱和特征数量在各自样本中的多肽芯片检测结果数据中所占的特征数量的比例;比较比例和第二阈值,并依据比较结果对多肽芯片检测结果数据集中的数据进行分析。例如,判断各样本的检测结果数据中过饱和特征的比例是否达到或超过第二预设阈值,如果达到或超过相应的阈值,则确定多肽芯片检测结果数据集中存在数据异常。
例如,在获得检测结果数据前的图像采集过程存在过曝,或者待检测样本的上样浓度过高等情况往往会导致检测结果数据中过饱和特征比例较高,本步骤可以提示相关异常情况。在本申请的一个实施例中,第一阈值可为具体使用的图像采集器的信号检测上限(例如FG>=65535),达到或超过信号检测上限的特征为过饱和特征。所述第二预设阈值可以是依据经验预先设定的,例如,可以为0.5%、1%、2%、3%。
对于过饱和分析失败的样本,可以进一步去检查样本浓度是否过高、曝光参数是否合适等。绘制所有过饱和质控失败样本的信号强度分布图(如图2e)以便于进一步查看。
特征定位分析
获取图像采集器采集的目标图像,其中,目标图像为多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;从目标图像中确定多肽芯片中各个特征的特征位置;从目标图像中获取指定特征的信号组成的第一图案,其中,指定特征为多肽芯片上的预设特征;计算第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,第二图案为依据多肽芯片的设计参数确定的,设计参数包括多肽芯片上指定特征在芯片上的位置信息和预期的信号强度信息;依据可信度和目标调整对第一图案进行调整。其中,在相似度落入预设的阈值范围时,则确定对第一图案进行调整;否则,则确定不需要对第一图案进行调整。
上述第一图案可以是由多个特征组成的图案,该多个特征可以位于不同区域,其中,每个区域对应一个图案。具体地:从目标图像的至少一个指定区域图像中获取指定特征的信号,并基于至少一个指定区域图像中的指定特征的信号确定至少一个子图案;基于至少一个子图案确定第一图案。
其中,依据可信度和目标调整对特第一图案进行调整的过程可以通过以下方式实现:确定至少一个子图案与相应的设计图案之间的相似度,其中,设计图案为依据多肽芯片的设计参数确定的;基于至少一个子图案与相应的设计图案之间的相似度确定至少一个子图案的可信度和目标调整,其中,可信度用于确定子图案的目标调整量是否可信,所述目标调整量依据子图案与相应的设计图案之间的差异确定;基于至少一个子图案的可信度和目标调整量对第一图案进行调整。在一些实施例中,上述相似度可以直接作为相应子图案的可信度。
在第一图案中存在多个子图案时,比较多个子图案的目标调整量;在多个子图案的目标调整量均不同时,则选择可信度最高的子图案对应的目标调整量对第一图案进行调整;在多个子图案的目标调整量中部分相同时,则对多个子图案的目标调整量进行分组;基于每个分组中子图案的可信度计算每个分组的可信度;选择可信度最高的分组所对应的目标调整量对第一图案进行矫正;在多个子图案的目标调整量均相同时,则随机选择一个子图案的目标调整量对第一图案进行矫正。
需要说明的是,目标调整量用于表示目标调整方式,该目标调整方式除了包括调整值之外,还包括调整方向。其可以表现为:向目标方向移动预设数量的单位距离,例如,往上移动2个单位距离、往下移动2个单位距离。
在选择可信度最高的分组所对应的目标调整量对第一图案进行矫正之前,比较各个分组的可信度与第三阈值的大小;在各个分组的可信度中存在大于第三阈值的可信度的情况下,确定从大于第三阈值的可信度中选择可信度最高的分组作对应的目标调整量对第一图案进行矫正;在各个分组的可信度中不存在大于第三阈值的可信度的情况下,确定不对第一图案进行矫正。
在本申请的一些实施例中,上述矫正过程主要为同一平面内的矫正,上述平面为同一多肽芯片上各个特征所在的平面。
为便于理解,现将特征定位方式的具体过程进行举例说明:
步骤1,图像定位技术获得图像采集器获得的图片中多肽芯片上各个特征的位置,并基于各个特征的位置确定实际的特征图案;
步骤2,根据多肽芯片的设计参数中的特征(即制备多肽芯片时多肽芯片上设计的若干个特定的特征(预设特征))组成的图案与前述步骤实际获得特征图案(可以仅是前述若干个特定的特征组成的图案)进行相似度比较,获得相似度,并进一步获得可信度和目标调整量,根据可信度判断定位是否可信(利用可信度阈值进行判断,例如0.8及以上为定位可信,然后按照目标调整量进行调整)。
步骤2中的方案,可用于判断在获得多肽芯片检测结果数据之前的图像定位步骤是否异常。芯片上设计有一些特定的特征,这些特征所在的位置可组成的一定的图案(也可以是分区域组成不同的图案,例如在芯片的4个角,分别组成相应的4个图案,此时,步骤2中会有4个可信度,此时,可根据这4个可信度得出综合可信度,并将该综合可信度与可信度阈值进行比较判断,具体实现可有多种方案)。如果图像定位正常,那么设计的图案和实际成像得到的图案可以完全重合(如图3a所示),否则两个图案之间会存在错位的情况(图3b所示)。
步骤1中的图像定位技术可以通过以下方式确定:
依据多肽芯片的设计参数将目标图像划分为多个网格区域,其中,每个网格区域中包括至少一个特征点,该特征点为多肽芯片对待检测样本进行检测得到的信号;基于特征点确定每个网格区域中的特征区域,其中,该特征区域中包含有目标图像的有效特征信息。
由于对目标图像进行了网格划分,并基于网格区域对其中的特征区域进行了定位,因此,可以有效提升特征定位的精度,从而可以提高图像识别的效率,进而解决了相关技术中无法对多肽芯片采集的图像中的特征点进行准确定位,导致图像识别效率不高技术问题
依据各个多肽探针的分布信息确定多个网格区域的分布信息,并依据网格区域的分布信息将目标图像划分为多个网格区域。具体的,各个多肽探针的分布信息包括:各个多肽探针之间的相对位置;此时,依据相对位置分别确定多肽探针之间在水平方向上的第一相对距离和在竖直方向上的第二相对距离;依据第一相对距离和第二相对距离确定各个多肽探针的位置信息,该位置信息包括位置和尺寸;依据各个多肽探针的分布信息确定各个多肽探针的位置信息。
具体地,依据芯片设计参数等距地选取特征中心,组成候选的特征点集合;依据芯片设计参数选取特征中心是指依据多肽芯片技术特征(或者称探针)的排列布局信息,例如相对位置等设计参数。然后根据多肽芯片技术特征(即探针)之间的相对位置生成一个体现特征布局的模板(即以水平方向两个相邻特征点的距离和竖直方向两个相邻特征点的距离进行绘制网格,绘制的网格的每一个格子的长等于水平方向两个相邻特征点的距离,宽等于竖直方向两个相邻特征点的距离。其中,网格的长和宽的尺寸,可以依据芯片的设计参数确定。其中,上述特征点是一个方块的中心位置)。比如可以在图片上每隔固定数量个像素取一个点,这样取固定数量个点,这些点就是一组“候选的特征点”。)
确定多肽芯片的设计参数中各个探针的位置信息;基于各个探针的位置信息确定用于提取特征数据的数据区,对数据区进行划分,得到多个网格区域。其中,该过程也可以认为是对步骤1中基于特征点确定每个网格区域中的特征区域的进一步的优化过程,例如,在确定特征区域即数据区后,对数据区进一步进行网格化处理。
其中,依据多肽芯片的设计参数将目标图像划分为多个网格区域包括:将目标图像分成多个切块;从多个切块中选择出切块集合;分别对切块集合中的各个切块进行网格化处理,得到多个网格区域。其中,在对各个切块进行网格化处理时,可以依据多肽芯片的设计参数进行网格化处理,例如,在每个切块内,依据相邻多肽片段之间的间隔对目标图像进行网格化处理,例如,对目标图像采用等间隔的方式对每个切块进行网格化处理。
为了保证特征定位的准确性,需要对上述第一图像进行矫正,具体地,判断是否能够对第一图案进行矫正,如能矫正,则按矫正建议进行矫正,并根据矫正后的情况输出多肽芯片上各个特征的位置,如不能矫正,则按原方法输出多肽芯片上各个特征的位置。
图4是根据本申请实施例的一种可选的对特征图案进行矫正的流程图。如图4所示,该流程包括以下步骤:
步骤S402,获得设计特征范围(比如四个角)内的区域图像,其中,设计特征范围为依据多肽芯片上的特征所在位置确定的区域。
步骤S404,对区域图像进行二值化处理。
步骤S406,使用二值化后的图像分别与对应的设计特征的图案进行相似性匹配计算,每个区域得到一个相似度和一个设计特征在这块区域上的位置;
需要注意的是,进行二值化的图像区域的面积大于特征图案的面积,这样可以保证二值化的图像区域中包含设计特征区域;并且,由于进行二值化的图像区域(大小为H xW)比特征图案(大小为h x w)所在的区域大,所以每个图像区域(比如每个角)计算相似度得到的是一个相似度组成的矩阵,矩阵大小为(H-h+1)x(W-w+1),该矩阵中最大的值就是这个区域(子图像/特征图案)的可信度,该最大的相似度在矩阵上的位置就是设计特征在这块区域上的位置;其中,每个区域具有两个信息:信号区域的位置索引,以及这个位置索引的可信度,N个区域就有N组这样的信息(即位置索引和可信度)。
步骤S408,分别依据各自的设计特征在这块区域上的位置确定各自的设计特征所在区域左上角在整张区域图象上的位置索引,然后根据各自的设计特征的位置索引确定各自的目标调整量;
步骤S410,判断N个的目标调整量是否都不同;如果是,则转步骤S412,否则,转步骤S414;
步骤S412,取可信度最高的值对应的目标调整量进行矫正;
步骤S414,对这N个目标调整量进行分组,同样的目标调整量分在一组,记为n组,每组再计算一个新的可信度,比如一个计算方法是:取本组最大的可信度作为基数a,a在0到1之间,其他可信度记为bi,i是下标,则新的可信度A为:
A=a+∑i((1-a)bi)
步骤S416,判断n组新的可信度是否有超过阈值(第三阈值,例如0.85、0.9、0.95)的可信度,如果是,转步骤S418,否则转步骤S420;
步骤S418,取可信度最高的值对应的目标调整量进行矫正;
步骤S420,不矫正,即停止矫正过程。
所述位置索引为建议的矫正方式,包括移动的方向信息和移动的距离信息,例如:往上移动2个单位距离、往下移动2个单位距离。单位距离为预先设定的距离。
掩膜分析
获取多肽芯片检测结果数据集中各个检测结果中指定特征所对应的掩膜信息;以掩膜信息为自变量,以多肽芯片中的指定特征的实际信号强度值为因变量,构建多元线性回归模型;基于多元线性回归模型确定每个自变量的回归系数的均方根值和用于度量拟合优度的可决系数;基于均方根值和可决系数判断多肽芯片检测结果数据集中的数据是否存在异常。
以HealthTell公司的多肽芯片为例,例如V13,其上有一组特别设计的特征,以合成特征代表的肽段时使用的掩膜信息为自变量,以特征的实际信号强度为因变量,可以构建多元线性回归模型。基于该模型可以构建两个指标。
模型中每个自变量的回归系数的均方根值rms.coefs。计算公式为:
其中,N为自变量的数量,bi为第i个自变量的回归系数。
度量模型拟合优度的可决系数r2。计算公式为:
其中,表示预测的信号强度值,/>表示实际信号强度值的均值,y表示实际信号强度值。
对于血清/血浆样本来说,如果rms.coefs和r2小于一定阈值(例如0.3),则样本质控不通过。
使用rms.coefs和r2值可以绘制掩膜分析评估图,具体如图5所示。
采用掩膜分析方式可以用于评估是否存在以下异常情况:a)图像定位异常;b)加样错误;c)样本没有震荡均匀。
离群值分析
对多肽芯片检测结果数据集中的数据按照样本类型进行分类,得到一个或多个样本集合,其中,每个样本集合对应一个样本类型;对于每个样本集合中的每个样本,计算每个样本中指定特征的评价指标,其中,评价指标是基于指定特征的信号强度值和其他信号强度值共同确定的,其他信号强度值为样本集合中所有样本的指定特征的信号强度值;基于评价指标确定每个特征是否为异常特征,并对每个样本的异常特征进行筛选,得到离群特征簇;统计每个样本中所有离群特征簇中包含的特征数量;依据所有离群特征簇中包含的特征数量和每个样本的总特征数量确定每个样本的检测结果是否通过验证。
其中,在确定每个样本是否通过验证时,计算所有离群特征簇中包含的特征数量与每个样本的总特征数量的比值;比较比值和第四阈值的大小;依据比较结果确定每个样本是否通过验证。在大于或等于第四阈值时,确定验证失败;否则,验证成功。
在一些实施例中,上述评价指标是通过以下方式确定的:计算其他信号强度值的中位数;依据中位数和指定特征的信号强度值确定评价指标。
本步骤可以评估样本在实验过程是否存在操作不当(例如导致芯片划痕)及污染(例如小颗粒物附着)等。这些情况可能会导致芯片上存在一簇信号强度值异常的特征。该步骤按照样本类型(例如血清和血浆、或病人血清和正常人血清)把样本分成不同的组别。对于一个样本的每个特征,都计算一个分数Z,计算公式如下:
其中,NLFG表示一个样本的一个特征的信号强度值,median表示取中位数,NLFGs表示该样本所在的分组包括的所有样本的该特征的信号强度值。
当Z值大于一定阈值时(例如2.5)则判定该特征属于异常特征。如果有超过一定数量(例如3)的异常特征,并且对于这些异常特征中的任意一个异常特征(记为a),至少存在另外一个异常特征(记为b),而且异常特征a和b之间的距离小于等于一定阈值(例如2个单位距离,即中间间隔了一个特征的两个特征),则这些异常特征构成一个离群特征簇。如果一个样本上所有的离群特征簇中包含的特征的数量占总的特征的比例达到一定阈值(第四阈值,例如1%、2%、3%),则判定该样本的离群值质控结果为失败。
通过样本的信号强度值绘制信号强度的亮度图(如图6a-图6c所示)。图6中过亮或者过暗的点形成离群簇,其形状特征可以用于辅助判断导致异样的原因。如实验过程中的操作不当出现液滴污染(如图6a所示)、芯片上有划痕(如图6b所示)、样本上机不均匀(如图6c所示)。
样本相关性分析
确定多肽芯片检测结果数据集中各个样本的信号强度值;对于来自相同个体的样本,确定来自相同个体的样本之间的相关性;比较相关性和第五阈值;依据比较结果确定多肽芯片检测结果数据集中各个样本的检测结果是否通过验证。
具体地,根据信号强度计算多肽芯片检测结果数据中各样本的距离(例如欧式距离),并进一步进行层次聚类,然后判断多肽芯片检测结果数据中来源于相同个体的样本之间的相关性是否大于等于预设相关系数,并在层次聚类时被聚在同一类。
样本相关性分析方式,可以根据样本的信号强度值(NLFG)分别计算该批次所有样本、NTC(阴性质控)样本、PTC(阳性质控)样本的相关性,并绘制相应的热图(如图7所示)。热图中还包括了对样本彼此之间用信号强度计算出来的距离(例如欧式距离)后进行层次聚类的结果。对于同一个个体的多个样本,它们之间的相关性应该较高(例如相关系数,即第五阈值大于0.8、0.85等等),并且它们在聚类结果中通常应该被聚到同一个类中。对于不满足这些情况的样本,可以进一步去分析是否存在样本标记错误、加样错误、实验操作/条件异常等情况。
利用不同芯片上的质控样本绘制热图可以用来检查芯片之间是否有芯片过期等异常。
在采用上述分析方式对多肽芯片检测结果数据集中的数据进行分析后,将本次分析过程的基本情况(例如样本数量等信息)和各个分析结果整合到一个文件中,生成质控报告。该质控报告可为markdown格式、PDF、HTML格式等。
从上面的内容可以看出,本申请实施例提供的方案中包括一整套微阵列信号输出处理及质控方案,其能够一键化、简单快速完成微阵列信号从下机图像到最终数据处理、输出质控报告及结果上传等步骤。尤其对于多肽芯片数据,能够快速准确的完成批量数据的处理及时发现数据可能存在的问题,保证数据的质量。上述方法和和步骤均可被封装到一个docker镜像中,增加了其在不同平台之间的通用性。
以下结合图8详细说明镜像中的处理流程。如图8所示,该处理流程包括以下步骤:
获取下机图像文件(例如tiff格式的文件);
下机图像文件上传:基于实验所使用的芯片(slide)编号列表,自动匹配本次实验生成的下机图像文件(tiff格式)的储存路径,然后将储存路径下的下机图像文件传输到分析节点供后续数据处理。
下机图像转换:使用图像转换工具,例如图像处理模块,将下机图像文件转换为gpr5格式的文件。该模块会对指定目录中的文件进行监控,自动将目录下的tiff文件进行处理,并对原始图像进行定位、信号识别转换,最终将图像信号转换为数值,储存在gpr5格式的文件中。
下机样本信息提取:根据实验操作采用的方式不同(包括自动上机和手动上机),通过不同方式获得样本信息(包括样本编号、样本类型、稀释度、质控类别等)。在自动上机情况下,通过样本信息管理系统(LIMS)获取样本信息。在手动上机的情况下,通过实验平台填写的实验排版信息表和实验设计表获取样本信息。基于获取的样本信息生成后续数据处理所需的样本信息表。
数据预处理及质控:样本信息提取;通过样本信息表和gpr5文件,生成结果信息文件(META文件);数据加载及标准化;加载图像处理模块处理后的信号信息,即gpr5格式的文件,提取所需信息。具体地:加载图像处理模块处理后的信号信息,即gpr5格式的文件,提取所需信息。包括:每个特征前景(feature foreground)区域信号的中位数(FG)、每个特征背景(feature background)区域信号的中位数(BG)、每个特征标准(feature standard)区域信号的均值(EG)、每个特征前景区域信号的CV值(FCV)、每个特征背景区域信号的CV值(BCV)等。生成包括该批次所有样本的信号信息的矩阵(例如:csv格式),供下游分析使用。下游可以根据需要选择FG、BG、EG等信号中的一种或者多种来使用。一种使用FG信号生成三种矩阵的方式如下:
原始信号矩阵:直接使用FG信号。
对数化后的信号矩阵:对FG信号对数化之后得到的信号(LFG),公式如下:
LFG=log10(FG+1)
中位数矫正后的信号矩阵:对各个样本的LFG信号进行中位数矫正之后得到的信号(NLFG),公式如下:
NLFG=LFG-median(LFG)
其中,median表示取中位数。
生成质控报告:将本次实验的基本情况(例如样本数量等)和上述质控步骤的结果整合到一个文件中,生成质控报告。该质控报告可为markdown格式、PDF、HTML格式等。
结果上传:将该批次实验数据的处理结果上传到数据库。
本申请实施例还提供一种多肽芯片检测结果的数据处理装置,该装置用于实现图1所示的方法。如图9所示,该装置包括:
获取模块90,用于获取多肽芯片检测结果数据集,其中,多肽芯片检测结果数据集中包括一个和/或多个样本的检测结果数据;
分析模块92,用于采用以下至少一种分析方式对多肽芯片检测结果数据集中的数据进行分析,其中,至少一种分析方式包括:仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式;
判断模块94,用于依据分析结果判断多肽芯片检测结果数据集中的数据是否存在异常。
可选地,分析模块92,还用于获取多肽芯片检测结果数据集中每个样本的信号强度,并基于信号强度确定每个样本的信号强度分布曲线;基于信号强度分布曲线对每个样本的多肽芯片检测结果数据进行分析。
具体地,分析模块92,还用于确定信号强度分布曲线的曲线形状;比较曲线形状与基准信号强度分布曲线的形状;基于比较结果对每个样本的多肽芯片检测结果数据进行分析。
在一些实施例中,分析模块92,用于确定多肽芯片检测结果数据集中同一样本的重复检测结果对应的信号强度分布图,其中,信号强度分布图中包括对同一样本执行至少两次多肽芯片检测分别得到的至少两个信号强度分布曲线;确定至少两个信号强度分布曲线的重合度;基于重合度对同一样本的多肽芯片检测结果数据进行分析。
在本申请的一些实施例中,分析模块92,还用于获取多肽芯片检测结果数据集中每个样本的过饱和特征数量,其中,过饱和特征为样本的多肽芯片检测结果中信号强度大于等于第一阈值的特征;计算每个样本的过饱和特征数量在各自样本中的多肽芯片检测结果数据中所占的比例;比较比例和第二阈值,并依据比较结果对多肽芯片检测结果数据集中的数据进行分析。
在本申请的另一些实施例中,分析模块92,还用于获取图像采集器采集的目标图像,其中,目标图像为多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;从目标图像中确定多肽芯片中各个特征的特征位置;从目标图像中获取指定特征的信号组成的第一图案,其中,指定特征为多肽芯片上的预设特征;计算第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,第二图案为依据多肽芯片的设计参数确定的,设计参数包括多肽芯片上指定特征在芯片上的位置信息和预期的信号强度信息;依据可信度和目标调整量对第一图案进行调整。所述的信号强度为特征值,信号分布信息为特征的位置信息。
具体地,分析模块92,还用于从目标图像的至少一个指定区域图像中获取指定特征的信号,并基于至少一个指定区域图像中的指定特征的信号确定至少一个子图案;基于至少一个子图案确定第一图案;
具体地,分析模块92,还用于确定至少一个子图案与相应的设计图案之间的相似度,其中,设计图案为依据多肽芯片的设计参数确定的;基于至少一个子图案与相应的设计图案之间的相似度确定至少一个子图案的可信度和目标调整量,其中,可信度用于确定子图案的目标调整量是否可信,所述目标调整量依据子图案与相应的设计图案之间的差异确定;基于至少一个子图案的可信度和目标调整量对第一图案进行调整。
在本申请的另一些实施例中,分析模块92,还用于在第一图案中存在多个子图案时,比较多个子图案的目标调整量;在多个子图案的目标调整量均不同时,则选择可信度最高的子图案对应的目标调整量对第一图案进行调整;在多个子图案的目标调整量中部分相同时,则对多个子图案的目标调整量进行分组;基于每个分组中的子图案的可信度计算每个分组的可信度;选择可信度最高的分组所对应的目标调整量对第一图案进行矫正;在多个子图案的目标调整量均相同时,则随机选择一个子图案的目标调整量对第一图案进行矫正。
具体地,分析模块92,还用于比较各个分组的可信度与第三阈值的大小;在各个分组的可信度中存在大于第三阈值的可信度的情况下,确定从大于第三阈值的可信度中选择可信度最高的分组作对应的目标调整量对第一图案进行矫正;在各个分组的可信度中不存在大于第三阈值的可信度的情况下,确定不对第一图案进行矫正。
在本申请的一些实施例中,分析模块92,还用于获取多肽芯片检测结果数据集中各个检测结果中指定特征所对应的掩膜信息;以掩膜信息为自变量,以多肽芯片中的指定特征的实际信号强度值为因变量,构建多元线性回归模型;基于多元线性回归模型确定每个自变量的回归系数的均方根值和用于度量拟合优度的可决系数;基于均方根值和可决系数判断多肽芯片检测结果数据集中的数据是否存在异常。
分析模块92,还用于对多肽芯片检测结果数据集中的数据按照样本类型进行分类,得到一个或多个样本集合,其中,每个样本集合对应一个样本类型;对于每个样本集合中的每个样本,计算每个样本中指定特征的评价指标,其中,评价指标是基于指定特征的信号强度值和其他信号强度值确定的,其他信号强度值为样本集合中所有样本在指定特征处检测到的信号强度值;基于评价指标确定每个特征是否为异常特征,并对每个样本的异常特征进行筛选,得到离群特征簇;统计每个样本中所有离群特征簇中包含的特征数量;依据所有离群特征簇中包含的特征数量和每个样本的总特征数量确定每个样本的检测结果是否通过验证。
具体地,分析模块92,还用于计算所有离群特征簇中包含的特征数量与每个样本的总特征数量的比值;比较比值和第四阈值的大小;依据比较结果确定每个样本是否通过验证。
其中,上述评价指标是通过以下方式确定的:计算其他信号强度值的中位数;依据中位数和指定特征的信号强度值确定评价指标。
在本申请的一些实施例中,分析模块92,还用于确定多肽芯片检测结果数据集中各个样本的信号强度值;对于来自相同个体的样本,确定来自相同个体的样本之间的相关性;比较相关性和第五阈值;依据比较结果确定多肽芯片检测结果数据集中各个样本的检测结果是否通过验证。
需要说明的是,图9中的各个模块可以是存储在存储器中的程序指令,该程序指令被与存储器连接的处理器执行;还可以是实现相应功能的硬件电路模块,但不限于此。
本申请实施例还提供另一种多肽芯片检测结果的数据处理方法,如图10所示,该方法包括步骤S1002-S1010,其中:
S1002,获取图像采集器采集的目标图像,其中,目标图像为多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;
S1004,从目标图像中确定多肽芯片中各个特征的特征位置;
S1006,获取由在特征位置检测到的信号组成的第一图案;
具体地,从目标图像的至少一个指定区域图像中获取指定特征的信号,并基于至少一个指定区域图像中的指定特征的信号确定至少一个子图案;基于至少一个子图案确定第一图案。
S1008,计算第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,第二图案为依据多肽芯片的设计参数确定的,设计参数包括多肽芯片上指定特征在芯片上的位置信息和预期的信号强度信息;
S1010,依据可信度和目标调整量对第一图案进行调整。
具体地,确定至少一个子图案与相应的设计图案之间的相似度,其中,设计图案为依据多肽芯片的设计参数确定的;基于至少一个子图案与相应的设计图案之间的相似度确定至少一个子图案的可信度和目标调整量,其中,可信度用于确定子图案的目标调整量是否可信,所述目标调整量依据子图案与相应的设计图案之间的差异确定;基于至少一个子图案的可信度和目标调整量对第一图案进行调整。
在第一图案中存在多个子图案时,比较多个子图案的目标调整量;在多个子图案的目标调整量均不同时,则选择可信度最高的子图案对应的目标调整量对第一图案进行调整;在多个子图案的目标调整量中部分相同时,则对多个子图案的目标调整量进行分组;基于每个分组中的子图案的可信度计算每个分组的可信度;选择可信度最高的分组所对应的目标调整量对第一图案进行矫正;在多个子图案的目标调整量均相同时,则随机选择一个子图案的目标调整量对第一图案进行矫正。
其中,选择可信度最高的分组所对应的目标调整量对第一图案进行矫正之前,比较各个分组的可信度与第三阈值的大小;在各个分组的可信度中存在大于第三阈值的可信度的情况下,确定从大于第三阈值的可信度中选择可信度最高的分组作对应的目标调整量对第一图案进行矫正;在各个分组的可信度中不存在大于第三阈值的可信度的情况下,确定不对第一图案进行矫正。
需要说明的是,图10所示实施例的优选实施方式可以参见图1-9所对应实施例的相关描述,此处不再赘述。
本申请实施例还提供一种多肽芯片检测结果的数据处理装置,该装置用于实现图10所示的方法,如图11所示,该装置包括:
第一获取模块110,用于获取图像采集器采集的目标图像,其中,目标图像为多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;
确定模块112,用于从目标图像中确定多肽芯片中各个特征的特征位置;
第二获取模块114,用于获取由在特征位置检测到的信号组成的第一图案;
计算模块116,用于计算第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,第二图案为依据多肽芯片的设计参数确定的,设计参数包括多肽芯片上指定特征在芯片上的位置信息和预期的信号强度信息;
调整模块118,用于依据可信度和目标调整量对第一图案进行调整。
需要说明的是,图11中的各个模块可以是存储在存储器中的程序指令,该程序指令被与存储器连接的处理器执行;还可以是实现相应功能的硬件电路模块,但不限于此。
本申请实施例还提供一种非易失性存储介质,其中,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以上所述的多肽芯片检测结果的数据处理方法。
例如,非易失性存储介质用于存储实现以下功能的程序指令:获取多肽芯片检测结果数据集,其中,所述多肽芯片检测结果数据集中包括一个和/或多个样本的检测结果数据;采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,其中,所述至少一种分析方式包括:仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式;依据分析结果判断所述多肽芯片检测结果数据集中的数据是否存在异常。
又例如,非易失性存储介质用于存储实现以下功能的程序指令:获取图像采集器采集的目标图像,其中,所述目标图像为所述多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;从所述目标图像中确定所述多肽芯片中各个特征的特征位置;获取由在所述特征位置检测到的信号组成的第一图案;计算所述第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,所述第二图案为依据所述多肽芯片的设计参数确定的,所述设计参数包括所述多肽芯片上所述指定特征在芯片上的位置信息和预期的信号强度信息;依据所述可信度和目标调整量对所述第一图案进行调整。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (35)
1.一种多肽芯片检测结果的数据处理方法,包括:
获取多肽芯片检测结果数据集,其中,所述多肽芯片检测结果数据集中包括一个和/或多个样本的检测结果数据;
采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,其中,所述至少一种分析方式包括:
仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式;
所述至少一种分析方式还包括:获取图像采集器采集的目标图像,其中,所述目标图像为所述多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;从所述目标图像中确定所述多肽芯片中各个特征的特征位置;从所述目标图像中获取指定特征的信号组成的第一图案,其中,所述指定特征为所述多肽芯片上的预设特征;计算所述第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,所述第二图案为依据所述多肽芯片的设计参数确定的,所述设计参数包括所述多肽芯片上所述指定特征在芯片上的位置信息和预期的信号强度信息;依据所述可信度和目标调整量对所述第一图案进行调整;
依据分析结果判断所述多肽芯片检测结果数据集中的数据是否存在异常。
2.根据权利要求1所述的方法,其中,采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,包括:
获取所述多肽芯片检测结果数据集中每个样本的信号强度,并基于所述信号强度确定所述每个样本的信号强度分布曲线;基于所述信号强度分布曲线对所述每个样本的多肽芯片检测结果数据进行分析。
3.根据权利要求2所述的方法,其中,基于所述信号强度分布曲线对所述每个样本的多肽芯片检测结果数据进行分析,包括:
确定所述信号强度分布曲线的曲线形状;比较所述曲线形状与基准信号强度分布曲线的形状;基于比较结果对所述每个样本的多肽芯片检测结果数据进行分析。
4.根据权利要求2所述的方法,其中,基于所述信号强度分布曲线对所述每个样本的多肽芯片检测结果数据进行分析,包括:
确定所述多肽芯片检测结果数据集中同一样本的重复检测结果对应的信号强度分布图,其中,所述信号强度分布图中包括对所述同一样本执行至少两次多肽芯片检测分别得到的至少两个信号强度分布曲线;
确定所述至少两个信号强度分布曲线的重合度;基于所述重合度对所述同一样本的多肽芯片检测结果数据进行分析。
5.根据权利要求1所述的方法,其中,采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,包括:
获取所述多肽芯片检测结果数据集中每个样本的过饱和特征数量,其中,所述过饱和特征为样本的多肽芯片检测结果中信号强度大于等于第一阈值的特征;
计算所述每个样本的过饱和特征数量在各自样本的多肽芯片检测结果数据中所占的特征数量的比例;
比较所述比例和第二阈值,并依据比较结果对所述多肽芯片检测结果数据集中的数据进行分析。
6.根据权利要求1所述的方法,其中,从所述目标图像中获取指定特征的信号组成的第一图案,包括:
从所述目标图像的至少一个指定区域图像中获取所述指定特征的信号,并基于所述至少一个指定区域图像中的所述指定特征的信号确定至少一个子图案;基于所述至少一个子图案确定所述第一图案。
7.根据权利要求6所述的方法,其中,依据所述可信度和目标调整量对所述第一图案进行调整,包括:
确定所述至少一个子图案与相应的设计图案之间的相似度,其中,所述设计图案为依据所述多肽芯片的设计参数确定的;
基于所述至少一个子图案与相应的设计图案之间的相似度确定所述至少一个子图案的可信度和目标调整量,其中,所述可信度用于确定所述子图案的目标调整量是否可信,所述目标调整量依据子图案与相应的设计图案之间的差异确定;
基于所述至少一个子图案的可信度和目标调整量对所述第一图案进行调整。
8.根据权利要求7所述的方法,其中,基于所述至少一个子图案的可信度和目标调整量对所述第一图案进行调整,包括:
在所述第一图案中存在多个子图案时,比较所述多个子图案的目标调整量;
在所述多个子图案的目标调整量均不同时,则选择可信度最高的子图案对应的目标调整量对所述第一图案进行调整;
在所述多个子图案的目标调整量中部分相同时,则对所述多个子图案的目标调整量进行分组;基于每个分组中的子图案的可信度计算每个分组的可信度;选择可信度最高的分组所对应的目标调整量对所述第一图案进行矫正;
在所述多个子图案的目标调整量均相同时,则随机选择一个子图案的目标调整量对所述第一图案进行矫正。
9.根据权利要求8所述的方法,其中,选择可信度最高的分组所对应的目标调整量对所述第一图案进行矫正之前,所述方法还包括:
比较各个分组的可信度与第三阈值的大小;
在所述各个分组的可信度中存在大于所述第三阈值的可信度的情况下,确定从大于所述第三阈值的可信度中选择可信度最高的分组作对应的目标调整量对所述第一图案进行矫正;
在所述各个分组的可信度中不存在大于所述第三阈值的可信度的情况下,确定不对所述第一图案进行矫正。
10.根据权利要求1所述的方法,其中,采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,包括:
获取所述多肽芯片检测结果数据集中各个检测结果中指定特征所对应的掩膜信息;
以所述掩膜信息为自变量,以所述多肽芯片中的指定特征的实际信号强度值为因变量,构建多元线性回归模型;
基于所述多元线性回归模型确定每个自变量的回归系数的均方根值和用于度量拟合优度的可决系数;
基于所述均方根值和所述可决系数判断所述多肽芯片检测结果数据集中的数据是否存在异常。
11.根据权利要求1所述的方法,其中,采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,包括:
对所述多肽芯片检测结果数据集中的数据按照样本类型进行分类,得到一个或多个样本集合,其中,每个样本集合对应一个样本类型;
对于每个所述样本集合中的每个样本,计算所述每个样本中指定特征的评价指标,其中,所述评价指标是基于所述指定特征的信号强度值和其他信号强度值确定的,所述其他信号强度值为所述样本集合中所有样本的所述指定特征的信号强度值;
基于所述评价指标确定所述每个特征是否为异常特征,并对所述每个样本的异常特征进行筛选,得到离群特征簇;
统计所述每个样本中所有离群特征簇中包含的特征数量;
依据所述所有离群特征簇中包含的特征数量和所述每个样本的总特征数量确定所述每个样本的检测结果是否通过验证。
12.根据权利要求11所述的方法,其中,依据所述所有离群特征簇中包含的特征数量在所述每个样本的总特征数量确定所述每个样本是否通过验证,包括:
计算所述所有离群特征簇中包含的特征数量与所述每个样本的总特征数量的比值;比较所述比值和第四阈值的大小;依据比较结果确定所述每个样本是否通过验证。
13.根据权利要求11所述的方法,其中,所述评价指标是通过以下方式确定的:
计算所述其他信号强度值的中位数;依据所述中位数和指定特征的信号强度值确定所述评价指标。
14.根据权利要求1所述的方法,其中,采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,包括:
确定所述多肽芯片检测结果数据集中各个样本的信号强度值;
对于来自相同个体的样本,确定来自相同个体的样本之间的相关性;
比较所述相关性和第五阈值;依据比较结果确定所述多肽芯片检测结果数据集中各个样本的检测结果是否通过验证。
15.一种多肽芯片检测结果的数据处理方法,其中,包括:
获取图像采集器采集的目标图像,其中,所述目标图像为所述多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;
从所述目标图像中确定所述多肽芯片中各个特征的特征位置;
获取由在所述特征位置检测到的信号组成的第一图案;
计算所述第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,所述第二图案为依据所述多肽芯片的设计参数确定的,所述设计参数包括所述多肽芯片上指定特征在芯片上的位置信息和预期的信号强度信息;
依据所述可信度和目标调整量对所述第一图案进行调整。
16.根据权利要求15所述的方法,其中,从所述目标图像中获取指定特征的信号组成的第一图案,包括:
从所述目标图像的至少一个指定区域图像中获取所述指定特征的信号,并基于所述至少一个指定区域图像中的所述指定特征确定至少一个子图案;基于所述至少一个子图案确定所述第一图案。
17.根据权利要求16所述的方法,其中,依据所述可信度和目标调整量对所述第一图案进行调整,包括:
确定所述至少一个子图案与相应的设计图案之间的相似度,其中,所述设计图案为依据所述多肽芯片的设计参数确定的;
基于所述至少一个子图案与相应的设计图案之间的相似度确定所述至少一个子图案的可信度和目标调整量,其中,所述可信度用于确定所述子图案的目标调整量是否可信,所述目标调整量依据子图案与相应的设计图案之间的差异确定;
基于所述至少一个子图案的可信度和目标调整量对所述第一图案进行调整。
18.根据权利要求17所述的方法,其中,基于所述至少一个子图案的可信度和目标调整量对所述第一图案进行调整,包括:
在所述第一图案中存在多个子图案时,比较所述多个子图案的目标调整量;
在所述多个子图案的目标调整量均不同时,则选择可信度最高的子图案对应的目标调整量对所述第一图案进行调整;
在所述多个子图案的目标调整量中部分相同时,则对所述多个子图案的目标调整量进行分组;基于每个分组中的子图案的可信度计算每个分组的可信度;选择可信度最高的分组所对应的目标调整量对所述第一图案进行矫正;
在所述多个子图案的目标调整量均相同时,则随机选择一个子图案的目标调整量对所述第一图案进行矫正。
19.根据权利要求18所述的方法,其中,选择可信度最高的分组所对应的目标调整量对所述第一图案进行矫正之前,所述方法还包括:
比较各个分组的可信度与第三阈值的大小;
在所述各个分组的可信度中存在大于所述第三阈值的可信度的情况下,确定从大于所述第三阈值的可信度中选择可信度最高的分组作对应的目标调整量对所述第一图案进行矫正;
在所述各个分组的可信度中不存在大于所述第三阈值的可信度的情况下,确定不对所述第一图案进行矫正。
20.一种多肽芯片检测结果的数据处理装置,其中,包括:
获取模块,用于获取多肽芯片检测结果数据集,其中,所述多肽芯片检测结果数据集中包括一个和/或多个样本的检测结果数据;
分析模块,用于采用以下至少一种分析方式对所述多肽芯片检测结果数据集中的数据进行分析,其中,所述至少一种分析方式包括:仅支持对单个样本的多肽芯片结果数据进行分析的第一种分析方式、支持对多个样本的多肽芯片检测结果数据进行分析的第二种分析方式、支持对单个样本和多个样本的多肽芯片检测结果数据进行分析的第三种分析方式;
所述分析模块还用于:获取图像采集器采集的目标图像,其中,所述目标图像为所述多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;从所述目标图像中确定所述多肽芯片中各个特征的特征位置;从所述目标图像中获取指定特征的信号组成的第一图案,其中,所述指定特征为所述多肽芯片上的预设特征;计算所述第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,所述第二图案为依据所述多肽芯片的设计参数确定的,所述设计参数包括所述多肽芯片上所述指定特征在芯片上的位置信息和预期的信号强度信息;依据所述可信度和目标调整量对所述第一图案进行调整;
判断模块,用于依据分析结果判断所述多肽芯片检测结果数据集中的数据是否存在异常。
21.根据权利要求20所述的装置,其中,所述分析模块,还用于获取所述多肽芯片检测结果数据集中每个样本的信号强度,并基于所述信号强度确定所述每个样本的信号强度分布曲线;基于所述信号强度分布曲线对所述每个样本的多肽芯片检测结果数据进行分析。
22.根据权利要求21所述的装置,其中,所述分析模块,还用于确定所述信号强度分布曲线的曲线形状;比较所述曲线形状与基准信号强度分布曲线的形状;基于比较结果对所述每个样本的多肽芯片检测结果数据进行分析。
23.根据权利要求21所述的装置,其中,所述分析模块,还用于确定所述多肽芯片检测结果数据集中同一样本的重复检测结果对应的信号强度分布图,其中,所述信号强度分布图中包括对所述同一样本执行至少两次多肽芯片检测分别得到的至少两个信号强度分布曲线;确定所述至少两个信号强度分布曲线的重合度;基于所述重合度对所述同一样本的多肽芯片检测结果数据进行分析。
24.根据权利要求20所述的装置,其中,所述分析模块,还用于获取所述多肽芯片检测结果数据集中每个样本的过饱和特征数量,其中,所述过饱和特征为样本的多肽芯片检测结果中信号强度大于等于第一阈值的特征;计算所述每个样本的过饱和特征数量在各自样本的多肽芯片检测结果数据中所占的比例;比较所述比例和第二阈值,并依据比较结果对所述多肽芯片检测结果数据集中的数据进行分析。
25.根据权利要求20所述的装置,其中,所述分析模块,还用于从所述目标图像的至少一个指定区域图像中获取所述指定特征的信号,并基于所述至少一个指定区域图像中的所述指定特征的信号确定至少一个子图案;基于所述至少一个子图案确定所述第一图案。
26.根据权利要求25所述的装置,其中,所述分析模块,还用于确定所述至少一个子图案与相应的设计图案之间的相似度,其中,所述设计图案为依据所述多肽芯片的设计参数确定的;基于所述至少一个子图案与相应的设计图案之间的相似度确定所述至少一个子图案的可信度和目标调整量,其中,所述可信度用于确定所述子图案的目标调整量是否可信,所述目标调整量依据子图案与相应的设计图案之间的差异确定;基于所述至少一个子图案的可信度和目标调整量对所述第一图案进行调整。
27.根据权利要求26所述的装置,其中,所述分析模块,还用于在所述第一图案中存在多个子图案时,比较所述多个子图案的目标调整量;在所述多个子图案的目标调整量均不同时,则选择可信度最高的子图案对应的目标调整量对所述第一图案进行调整;在所述多个子图案的目标调整量中部分相同时,则对所述多个子图案的目标调整量进行分组;基于每个分组中的子图案的可信度计算每个分组的可信度;选择可信度最高的分组所对应的目标调整量对所述第一图案进行矫正;在所述多个子图案的目标调整量均相同时,则随机选择一个子图案的目标调整量对所述第一图案进行矫正。
28.根据权利要求27所述的装置,其中,所述分析模块,还用于比较各个分组的可信度与第三阈值的大小;在所述各个分组的可信度中存在大于所述第三阈值的可信度的情况下,确定从大于所述第三阈值的可信度中选择可信度最高的分组作对应的目标调整量对所述第一图案进行矫正;在所述各个分组的可信度中不存在大于所述第三阈值的可信度的情况下,确定不对所述第一图案进行矫正。
29.根据权利要求20所述的装置,其中,所述分析模块,还用于获取多肽芯片检测结果数据集中各个检测结果中指定特征所对应的掩膜信息;以所述掩膜信息为自变量,以所述多肽芯片中的指定特征的实际信号强度值为因变量,构建多元线性回归模型;基于所述多元线性回归模型确定每个自变量的回归系数的均方根值和用于度量拟合优度的可决系数;基于所述均方根值和所述可决系数判断所述多肽芯片检测结果数据集中的数据是否存在异常。
30.根据权利要求20所述的装置,其中,所述分析模块,还用于对所述多肽芯片检测结果数据集中的数据按照样本类型进行分类,得到一个或多个样本集合,其中,每个样本集合对应一个样本类型;对于每个所述样本集合中的每个样本,计算所述每个样本中指定特征的评价指标,其中,所述评价指标是基于所述指定特征的信号强度值和其他信号强度值确定的,所述其他信号强度值为所述样本集合中所有样本在所述指定特征处检测到的信号强度值;基于所述评价指标确定所述每个特征是否为异常特征,并对所述每个样本的异常特征进行筛选,得到离群特征簇;统计所述每个样本中所有离群特征簇中包含的特征数量;依据所述所有离群特征簇中包含的特征数量和所述每个样本的总特征数量确定所述每个样本的检测结果是否通过验证。
31.根据权利要求30所述的装置,其中,所述分析模块,还用于计算所述所有离群特征簇中包含的特征数量与所述每个样本的总特征数量的比值;比较所述比值和第四阈值的大小;依据比较结果确定所述每个样本是否通过验证。
32.根据权利要求30所述的装置,其中,所述评价指标是通过以下方式确定的:
计算所述其他信号强度值的中位数;依据所述中位数和指定特征的信号强度值确定所述评价指标。
33.根据权利要求20所述的装置,其中,所述分析模块,还用于确定所述多肽芯片检测结果数据集中各个样本的信号强度值;对于来自相同个体的样本,确定来自相同个体的样本之间的相关性;比较所述相关性和第五阈值;依据比较结果确定所述多肽芯片检测结果数据集中各个样本的检测结果是否通过验证。
34.一种多肽芯片检测结果的数据处理装置,其中,包括:
第一获取模块,用于获取图像采集器采集的目标图像,其中,所述目标图像为所述多肽芯片对样本进行检测后产生的用于反映信号强度和信号分布信息的图像;
确定模块,用于从所述目标图像中确定所述多肽芯片中各个特征的特征位置;
第二获取模块,用于获取由在所述特征位置检测到的信号组成的第一图案;
计算模块,用于计算所述第一图案和第二图案的相似度,并进一步计算第一图案的可信度和目标调整量,其中,所述第二图案为依据所述多肽芯片的设计参数确定的,所述设计参数包括所述多肽芯片上指定特征在芯片上的位置信息和预期的信号强度信息;
调整模块,用于依据所述可信度和目标调整量对所述第一图案进行调整。
35.一种非易失性存储介质,其中,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至14中任意一项所述的多肽芯片检测结果的数据处理方法,或者执行权利要求15至19中任意一项所述的多肽芯片检测结果的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011638707.7A CN112819751B (zh) | 2020-12-31 | 2020-12-31 | 多肽芯片检测结果的数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011638707.7A CN112819751B (zh) | 2020-12-31 | 2020-12-31 | 多肽芯片检测结果的数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112819751A CN112819751A (zh) | 2021-05-18 |
CN112819751B true CN112819751B (zh) | 2024-01-26 |
Family
ID=75857769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011638707.7A Active CN112819751B (zh) | 2020-12-31 | 2020-12-31 | 多肽芯片检测结果的数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819751B (zh) |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1472527A (zh) * | 2002-08-02 | 2004-02-04 | ƽ | 多标志物生物芯片信号分析系统 |
EP1703464A1 (en) * | 2005-03-17 | 2006-09-20 | Institut Curie | Method for analyzing an image of a biochip, computer program and device for analyzing this image |
JP2008108150A (ja) * | 2006-10-27 | 2008-05-08 | Nec Corp | ChIPonChipデータと遺伝子発現データの統合解析システム及び方法 |
CN102260738A (zh) * | 2011-05-30 | 2011-11-30 | 华南农业大学 | 一种寡核苷酸基因芯片及其在检测多种病菌方面的应用 |
CN103093122A (zh) * | 2011-11-08 | 2013-05-08 | 北京健数通生物计算技术有限公司 | 高通量生物芯片检测结果的一种判读工具 |
JP2013224894A (ja) * | 2012-04-23 | 2013-10-31 | Toray Ind Inc | マイクロアレイの解析方法 |
CN103390277A (zh) * | 2013-07-23 | 2013-11-13 | 济南凌空信息科技有限公司 | 图像分析方法 |
CN104560697A (zh) * | 2015-01-26 | 2015-04-29 | 上海美吉生物医药科技有限公司 | 一种基因组拷贝数不稳定性的检测装置 |
CN105277726A (zh) * | 2014-07-25 | 2016-01-27 | 广州瑞博奥生物科技有限公司 | 一种蛋白芯片全自动化高通量分析方法及装置 |
CN105483232A (zh) * | 2015-12-24 | 2016-04-13 | 四川国际旅行卫生保健中心 | 一种立克次体液相基因芯片的检测方法 |
CN106033087A (zh) * | 2015-03-18 | 2016-10-19 | 王峥 | 内置性标准曲线检测物质分子数之方法系统 |
CN107694649A (zh) * | 2016-09-28 | 2018-02-16 | 中国科学院苏州纳米技术与纳米仿生研究所 | 基于编码芯片的微阵列、其制备方法及应用 |
CN108291909A (zh) * | 2015-04-28 | 2018-07-17 | 奥菲迪亚有限公司 | 分析物检测及其方法 |
CN110196242A (zh) * | 2019-07-01 | 2019-09-03 | 安徽健朗医疗器械有限公司 | 一种全自动高通量生物芯片检测平台 |
CN110349621A (zh) * | 2019-06-04 | 2019-10-18 | 中国科学院计算技术研究所 | 肽段-谱图匹配可信度检验方法、系统、存储介质及装置 |
CN110501407A (zh) * | 2019-10-09 | 2019-11-26 | 济南大学 | 一种基于马来酰亚胺功能的琼脂糖凝胶基蛋白微阵列免疫传感器的制备方法及应用 |
CN111157664A (zh) * | 2019-03-22 | 2020-05-15 | 深圳碳云智能数字生命健康管理有限公司 | 生物代谢组学数据处理方法、分析方法及装置和应用 |
CN111316106A (zh) * | 2017-09-05 | 2020-06-19 | 迪森德克斯公司 | 自动化样品工作流程门控和数据分析 |
CN111863645A (zh) * | 2019-04-12 | 2020-10-30 | 长鑫存储技术有限公司 | 加工工艺参数确定方法、装置、存储介质及电子设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2002001477A1 (ja) * | 2000-06-28 | 2004-03-04 | 株式会社先端科学技術インキュベーションセンター | 遺伝子発現データの処理方法および処理プログラム |
US7901873B2 (en) * | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
US20030152255A1 (en) * | 2002-02-14 | 2003-08-14 | Ngk Insulators, Ltd. | Probe reactive chip, apparatus for analyzing sample and method thereof |
US7200254B2 (en) * | 2002-02-14 | 2007-04-03 | Ngk Insulators, Ltd. | Probe reactive chip, sample analysis apparatus, and method thereof |
US7136517B2 (en) * | 2002-06-19 | 2006-11-14 | Commissariat A L'energie Atomique | Image analysis process for measuring the signal on biochips |
US8965076B2 (en) * | 2010-01-13 | 2015-02-24 | Illumina, Inc. | Data processing system and methods |
-
2020
- 2020-12-31 CN CN202011638707.7A patent/CN112819751B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1472527A (zh) * | 2002-08-02 | 2004-02-04 | ƽ | 多标志物生物芯片信号分析系统 |
EP1703464A1 (en) * | 2005-03-17 | 2006-09-20 | Institut Curie | Method for analyzing an image of a biochip, computer program and device for analyzing this image |
JP2008108150A (ja) * | 2006-10-27 | 2008-05-08 | Nec Corp | ChIPonChipデータと遺伝子発現データの統合解析システム及び方法 |
CN102260738A (zh) * | 2011-05-30 | 2011-11-30 | 华南农业大学 | 一种寡核苷酸基因芯片及其在检测多种病菌方面的应用 |
CN103093122A (zh) * | 2011-11-08 | 2013-05-08 | 北京健数通生物计算技术有限公司 | 高通量生物芯片检测结果的一种判读工具 |
JP2013224894A (ja) * | 2012-04-23 | 2013-10-31 | Toray Ind Inc | マイクロアレイの解析方法 |
CN103390277A (zh) * | 2013-07-23 | 2013-11-13 | 济南凌空信息科技有限公司 | 图像分析方法 |
CN105277726A (zh) * | 2014-07-25 | 2016-01-27 | 广州瑞博奥生物科技有限公司 | 一种蛋白芯片全自动化高通量分析方法及装置 |
CN104560697A (zh) * | 2015-01-26 | 2015-04-29 | 上海美吉生物医药科技有限公司 | 一种基因组拷贝数不稳定性的检测装置 |
CN106033087A (zh) * | 2015-03-18 | 2016-10-19 | 王峥 | 内置性标准曲线检测物质分子数之方法系统 |
CN108291909A (zh) * | 2015-04-28 | 2018-07-17 | 奥菲迪亚有限公司 | 分析物检测及其方法 |
CN105483232A (zh) * | 2015-12-24 | 2016-04-13 | 四川国际旅行卫生保健中心 | 一种立克次体液相基因芯片的检测方法 |
CN107694649A (zh) * | 2016-09-28 | 2018-02-16 | 中国科学院苏州纳米技术与纳米仿生研究所 | 基于编码芯片的微阵列、其制备方法及应用 |
CN111316106A (zh) * | 2017-09-05 | 2020-06-19 | 迪森德克斯公司 | 自动化样品工作流程门控和数据分析 |
CN111157664A (zh) * | 2019-03-22 | 2020-05-15 | 深圳碳云智能数字生命健康管理有限公司 | 生物代谢组学数据处理方法、分析方法及装置和应用 |
CN111863645A (zh) * | 2019-04-12 | 2020-10-30 | 长鑫存储技术有限公司 | 加工工艺参数确定方法、装置、存储介质及电子设备 |
CN110349621A (zh) * | 2019-06-04 | 2019-10-18 | 中国科学院计算技术研究所 | 肽段-谱图匹配可信度检验方法、系统、存储介质及装置 |
CN110196242A (zh) * | 2019-07-01 | 2019-09-03 | 安徽健朗医疗器械有限公司 | 一种全自动高通量生物芯片检测平台 |
CN110501407A (zh) * | 2019-10-09 | 2019-11-26 | 济南大学 | 一种基于马来酰亚胺功能的琼脂糖凝胶基蛋白微阵列免疫传感器的制备方法及应用 |
Non-Patent Citations (2)
Title |
---|
Omar Salem Baans ; Asral Bahari Jambek.Software profiling analysis for DNA microarray image processing algorithm. 2017 IEEE International Conference on Signal and Image Processing Applications (ICSIPA).2017,129 - 132. * |
基于微流控芯片对流感嗜血杆菌的快速检测;高菊逸,吴传安,杨伟康,罗裕旋,徐小平;实用检验医师杂志;第12卷(第1期);51-54 * |
Also Published As
Publication number | Publication date |
---|---|
CN112819751A (zh) | 2021-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3784603B2 (ja) | 検査方法及びその装置並びに検査装置における検査条件設定方法 | |
KR100742544B1 (ko) | 데이터 분석용 방법 및 장치 | |
US5777901A (en) | Method and system for automated die yield prediction in semiconductor manufacturing | |
CN108062558B (zh) | 使用位故障和虚拟检查产生一种晶片检查过程 | |
JP4374303B2 (ja) | 検査方法及びその装置 | |
US9262821B2 (en) | Inspection recipe setup from reference image variation | |
US20150006103A1 (en) | Method, computer system and apparatus for recipe generation for automated inspection semiconductor devices | |
KR20040067875A (ko) | 반도체 테스팅 방법 및 장치 | |
CN109804462A (zh) | 用于大量图案搜索的检验和设计之间的漂移的自动校正的系统及方法 | |
JP5907649B2 (ja) | データ解析のための方法および装置 | |
US11404331B2 (en) | System and method for determining cause of abnormality in semiconductor manufacturing processes | |
CN113095444B (zh) | 图像标注方法、装置及存储介质 | |
KR20170127549A (ko) | 공정 윈도우 결정을 위한 적응형 샘플링 | |
JP2004177139A (ja) | 検査条件データ作成支援プログラム及び検査装置及び検査条件データ作成方法 | |
US6872582B2 (en) | Selective trim and wafer testing of integrated circuits | |
US7983859B2 (en) | System and method for analyzing defects on a wafer | |
CN117330882B (zh) | 一种用于滤波器的自动化测试方法及系统 | |
CN112819751B (zh) | 多肽芯片检测结果的数据处理方法及装置 | |
JPH06123718A (ja) | 螢光x線定性分析方法 | |
TWI808595B (zh) | 分析缺陷的方法 | |
CN111595438B (zh) | 一种模组awb的烧录光源稳定性检测方法及装置 | |
US20130283227A1 (en) | Pattern review tool, recipe making tool, and method of making recipe | |
US20110172941A1 (en) | Screening apparatus, screening method, and program | |
JP7390851B2 (ja) | 欠陥分類装置、欠陥分類プログラム | |
CN115376612B (zh) | 一种数据评测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |