CN117355898A - 用于审查和操纵数字pcr数据的方法 - Google Patents

用于审查和操纵数字pcr数据的方法 Download PDF

Info

Publication number
CN117355898A
CN117355898A CN202280036306.5A CN202280036306A CN117355898A CN 117355898 A CN117355898 A CN 117355898A CN 202280036306 A CN202280036306 A CN 202280036306A CN 117355898 A CN117355898 A CN 117355898A
Authority
CN
China
Prior art keywords
partitions
corrected
signal
partition
negative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280036306.5A
Other languages
English (en)
Inventor
玛丽亚·沃兹尼克
凯文·马塔哈伊
马特乌斯·弗罗布莱夫斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qiagen GmbH
Original Assignee
Qiagen GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiagen GmbH filed Critical Qiagen GmbH
Publication of CN117355898A publication Critical patent/CN117355898A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Sorption Type Refrigeration Machines (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明提供了用于对dPCR数据进行可视化、审查和操纵的方法。此外,本发明提供了用于dPCR数据可视化、审查和操纵的系统以及具有用于dPCR数据可视化、审查和操纵的指令的计算机可读存储介质。此外,提供了用于dPCR数据可视化、审查和操纵的此类系统和计算机可读存储介质的使用。

Description

用于审查和操纵数字PCR数据的方法
技术领域
本发明提供了用于可视化、审查和操纵由生物分析系统(诸如数字聚合酶链反应(dPCR))获得的数据的改进方法。此外,本发明提供了一种用于审查和操纵由生物分析系统获得的数据的系统和计算机可读存储介质。
背景技术
由于需要以有用的方式向用户显示大量数据点,因此由能够同时处理大量样本的生物分析系统获得的数据的可视化的方法具有高相关性。此类生物分析系统通常用于聚合酶链式反应(PCR)、测序、基因分型和其他应用中以提供定量数据。
近年来获得越来越重要的一个技术是数字PCR(dPCR)。在dPCR中,含有少量靶核酸的每个样本被分成许多子样本,也称为分区。因此,每个分区或包含靶核酸或不包含靶核酸。随后,执行根据标准协议的端点PCR,并且在某个位置测量每个分区的信号。例如,对于包含靶核酸的分区,由于扩增反应,可以测量阳性检测信号,而对于不包含靶核酸的分区,由于没有发生扩增反应,因此不产生检测信号。因此,dPCR使用端时间PCR的标准进程,但将PCR分成许多单个分区,其中靶随机分布在所有可用分区上。当靶随机分布时,可以使用泊松统计来计算每个阳性分区的靶核酸的量。这样的dPCR系统将高通量筛选和多路复用能力与高灵敏度、优异的精度和非常好的再现性结合起来。几种dPCR系统可商购获得,例如QIAcuity系统(QIAGEN,Hilden),其被设计用于作为稀有突变检测、拷贝数变异、基因表达分析、NGS(下一代测序)库定量、(低级)病原体检测、病毒载量检测、基因分型、miRNA研究、lncRNA分析和基因修饰生物体(GMO)检测的应用。
分区、热循环、成像(即数据收集)和分析的过程通常在生物分析系统(诸如,QIAGEN,Hilden)中实现。这些系统至少包括热循环仪、光学系统、一个或更多个处理器、存储器、存储设备和显示器。在dPCR中,信号通常是由荧光团发射并根据发射信号的波长在不同通道中检测的荧光信号。通常,使用一种或多种荧光团。基于在一个通道中检测到的所有信号,可以计算阈值以区分该通道中的阳性分区和阴性分区,对应于发生扩增反应或未发生扩增反应的分区。结果,这些系统提供每微升靶核酸的拷贝集中的浓度以及质量控制,诸如阳性样本或非模板对照(NTC)。
由于在dPCR应用中同时施行大量扩增反应,因此获得了需要进一步处理和可视化以允许用户进行数据解释的大量数据。通常,经处理的数据经由图形用户界面(GUI)在显示器处显示给用户。现有技术已经公开了用于dPCR数据可视化的不同方法。
例如,EP 3014506 A1教导了通过显示在芯片上检测到底层信号的相对位置(x,y坐标)来可视化dPCR数据的方法。
此外,数据可以以可视化所选靶通道(例如FAM)的荧光强度值的分布的直方图显示。x轴表示荧光强度,y轴表示具有该荧光强度的分区的数目。通常,发生扩增反应的分区将具有高荧光强度,而未检测到扩增反应的分区将具有产生两个不同峰的低荧光强度。
此外,数据可以被可视化为散布图。例如,二维(2D)散点图通过绘制一个通道的荧光强度与另一个通道的荧光强度来显示来自两个选定通道的荧光强度。没有扩增反应(阴性)的分区发生在两个通道中具有低荧光强度的簇,而检测到信号(阳性)的分区根据用于靶核酸标记的相应染料进行聚类。例如,在FAM通道中可以检测到信号的分区表现为一个聚类,在Cy5通道中可以检测到信号的分区表现为第二聚类,在两个通道中可以检测到信号的分区表现为第三聚类,并且在FAM或Cy5通道中都不能检测到信号(阴性)的分区表现为第四聚类。二维散点图的这种表示在US2015/0269756 A1中描述并且由QIAcuity软件(QIAGEN,Hilden)提供。
用户可以通过调整阳性分区和阴性分区之间的区别的信号强度阈值来操纵数据可视化。对某个阈值的选择相应地改变数据的可视化。
此外,在一些分区中,可检测到不同于用于成功扩增的预期信号的阳性信号(假阳性),或发生导致那些分区无效的任何其它错误事件。在这种情况下,重要的是识别那些事件并相应地通过排除必须从分析中校正以允许可靠的数据解释的所有分区来校正数据。在QIAcuity软件(QIAGEN,Hilden)中提供了通过排除无效信号进行数据校正的这种方法。
来自每个分区的信号的特定特性导致可用于分析的样本的许多信息。必须以有用的方式可视化该信息,使得可以评估数据的质量并且适当地解释结果。在需要对复杂样本中的最小量的靶核酸或靶核酸检测进行精确定量的情况下,诸如针对严重急性呼吸综合征冠状病毒2型(SARS-CoV-2)的废水测试或包括癌症突变的最罕见的遗传疾病的识别,需要校正的分区的识别是特别重要的。就这一点而言,必须被校正的分区对数据分析和解释和后续措施具有显著影响。然而,现有技术方法仅通过排除必须如上所述校正的分区来提供错误事件和后续数据校正的识别,但不允许重新考虑或可视化信号或分区被校正的原因。因此,直到今天没有提供允许通过根据校正的原因在不同类别的经校正的信号之间或经校正的分区之间进行区分来进行可视化的用于dPCR数据可视化的方法。此外,现有技术方法不允许用户手动地从不同类别的成员的可视化和重新分类中排除这样的类别或包括这样的类别。
发明内容
本发明克服了现有技术的核心缺陷。特别地,本发明提供了用于审查和操纵在生物分析系统中施行的由生物化验(诸如dPCR)获得的数据的改进方法,其允许可靠的结果作为数据解释的基础。分别表示预处理或校正数据的信号图,即分别用于每个有效或正确分配的分区的信号强度用作本发明的方法的基础。
特别地,提供了用于处理由生物分析系统确定的数据的有用方法,诸如dPCR数据,其允许可靠地解释所分析的样本中存在或不存在靶分子,诸如核酸。本文描述的技术基于在包含分析的样本的衬底的区域中从称为分区的反应位点发射的检测到的信号的分类。此外,本文中所揭示的方法提供必须被校正的信号的优选自动识别及必须根据校正原因而校正的那些信号的优选自动分类。本文公开的审查方法根据其在该区域中的空间位置并且根据相应的类别或分类来提供表示位于基板的区域处的分区的信号图中的数据的自动可视化。另外,操纵方法响应于第一交互式工具的操纵而提供用户对信号图中的类别或分类的表示的手动调整。第二交互式工具允许用户手动重新分类已经被自动分类到不同类别的单个分区。因此,本发明的方法特别改善了dPCR数据处理,并且在生物样本中存在或不存在靶核酸时提供更可靠的结果。本文所述的方法特别适用于检测复杂生物样本和/或生物样本中的靶核酸,其中靶核酸仅存在于定期导致错误测量的最小量。因此,与传统的实时PCR和易于出错的样本的可靠数据分析相比,本文提供的方法组合了dPCR的更高准确度。因此,本发明对现有技术做出了重要的贡献。
根据第一方面,提供了一种用于审查和操纵从由生物分析系统确定的信号获得的数据的方法,包括以下步骤:
(A)从位于经受生物测定的衬底的区域处的多个分区接收多个检测到的信号;
(B)选择用于信号强度阈值的值;
(C)将在信号强度阈值以上检测到信号强度的分区分类为阳性,和/或将在信号强度阈值以下检测信号强度的分区分类为阴性;
(D)识别必须被校正的分区,使得必须被校正的分区中的一些或所有被分类为阴性和/或无效,使得必须被校正的分区是经校正的分区,并且将被分类为阳极和阴极的所有分区分类为有效;
(E)显示包括检测到的信号的信号图的图形用户界面,其中,信号图通过其信号强度来表示有效分区,其中,根据其他阴性分区的信号强度来表示经校正的阴性分区;
(F)根据校正的原因将经校正的分区分类为类别;
(G)显示信号图,其中,所有阳性分区由第一指示符表示;以及
(H)显示信号图,其中,表示校正原因的类别中的每个由第二、第三、第四或另外的指示符表示;
其中,图形用户界面还包括至少两个交互工具,其中,响应于用户对至少两个交互工具中的至少一个的操纵,所述方法还包括以下步骤中的至少一个:
(I)通过从显示中排除和/或包括至少一个类别来调整所显示的信号图;和/或
(J)针对一个或更多个分区和/或针对至少一个分区的一个或更多个类别而选择类别,从而将所述分区重新分类为所选择的不同类别,以及
显示所述信号图,其中,所选择的不同类别由特定于所述类别的指示符表示。
根据第一方面的方法对于审查和操纵在生物分析系统中确定的指示存在或不存在靶分子(优选是核酸)的生物分析(诸如dPCR数据)获得的数据特别有利。如本文所公开的,该方法特别适用于揭示可靠结果作为用户数据解释的基础的dPCR数据处理。
根据第二方面,提供了一种用于审查和操纵从由生物分析系统确定的信号获得的数据的系统,包括:
(a)至少一个处理器,用于施行根据第一方面的方法;以及
(b)存储器,编码有用于施行根据第一方面的方法的指令。
根据第二方面的系统还可以包括:
(c)显示器;
(d)热循环仪;
(e)光学系统;
(f)存储设备;以及
(g)可选地,输入设备。
根据第二方面的系统特别适用于通过使用基于PCR的方法(诸如dPCR)并且通过施行用于根据第一方面审查和操纵所获得的数据的方法来检测生物样本中靶分子(诸如核酸)的存在或不存在。
根据第三方面,提供了一种计算机可读存储介质,其被编码有可由处理器执行以用于对数据进行审查和操纵的指令,该指令包括用于施行根据第一方面的方法的指令。
根据第四方面,本公开涉及根据第二方面的用于施行根据第一方面的方法的系统的使用。
根据第五方面,提供了根据第三方面的计算机可读存储介质的使用,以用于施行根据第一方面的方法。
根据以下描述和所附权利要求,本申请的其他目的、特征、优点和方面对于本领域技术人员将变得显而易见。然而,应当理解,以下描述、所附权利要求和具体示例在指示本申请的优选实施例的同时仅以说明的方式给出。
附图说明
图1:(A)根据相机获取的多孔板(multi-well plate)的一个孔中的其空间位置的具有荧光信号强度的原始图像。(B)根据底层原始信号的空间位置的表示阳性分区的信号图。
图2:(A)根据相机获取的多孔板的一个孔中的其空间位置的具有荧光信号强度的原始图像。包围的亮点标记由灰尘引起的亮信号。(B)根据基础原始信号的空间位置的表示阳性分区并且针对由灰尘引起的假阳性(即,必须被校正的分区或信号)信号进行校正的信号图。从灰尘发出的信号现在从表示中被排除。
图3:根据本发明的用于dPCR数据审查和操纵的方法的示例性工作流程。在包括图形用户界面(GUI)的显示器处显示信号图。(A)将展示根据其空间位置的经预处理(经校正)的dPCR数据的信号图用作基础(上部框)。经校正的分区可从表示中排除,而有效分区根据其信号强度来表示。或者,经校正的分区可由第一指示符(例如,颜色(黑色))表示。阳性分区可以由第二指示符表示,诸如颜色(由具有粗对角线的圆圈表示的颜色1)。此外,根据校正的原因,诸如“灰尘”或“比例”(中间框),经校正的信号被可视化。每个类别的经校正的信号由不同指示符(例如,颜色或图案)指示。用户可以通过将单独的类别切换为关闭和打开(底部框)来手动选择应显示哪些类别。这通过诸如每个类别的按钮的第一交互式工具来实现。因此,第一交互式工具提供对类别的所有分区的选择。(B)用户(上部框)可以手动选择来自不同类别的单个分区或成员并对其进行重新分类。通过诸如框选择工具的第二交互式工具来实现选择,该第二交互式工具使得用户能够独立于如白框所示的其类别来选择信号图的某个部分或区的分区。所选区的分区可以被重新分类为已经可视化的不同类别或新类别。为了重新分类到新类别,可以由用户分配该新类别,例如“手动”(底部框)。结果相应地更新。
具体实施方式
本文公开的本发明的不同方面和实施例对本领域做出了重要的贡献,这也在下面解释。
根据第一方面的方法
根据第一方面,提供了一种用于审查和操纵从由生物分析系统确定的信号获得的数据的方法,包括以下步骤:
(A)从位于经受生物测定的衬底的区域处的多个分区接收多个检测到的信号;
(B)选择用于信号强度阈值的值;
(C)将在信号强度阈值以上检测到信号强度的分区分类为阳性,和/或将在信号强度阈值以下检测到信号强度为负的分区分类为阴性;
(D)识别必须被校正的分区。使得必须被校正的分区中的一些或所有被分类为阴性的和/或无效的,使得必须被校正的分区为经校正的分区并且将被分类为阳性和阴性的所有分区分类为有效;
(E)显示包括检测到的信号的信号图的图形用户界面,其中,信号图通过其信号强度来表示有效分区,其中,根据其他阴性分区的信号强度来表示经校正的阴性分区;
(F)根据校正的原因将经校正的分区分类为类别;
(G)显示信号图,其中,所有阳性分区由第一指示符表示;以及
(H)显示信号图,其中,表示校正原因的类别中的每个由第二、第三、第四或另外的指示符表示;
其中,图形用户界面还包括至少两个交互工具,其中,响应于用户对所述至少两个交互工具中的至少一个的操纵,方法还包括以下步骤中的至少一个:
(I)通过从显示中排除和/或包括至少一个类别来调整所显示的信号图;和/或
(J)针对一个或更多个分区和/或针对至少一个分区的一个或更多个类别而选择类别,从而将所述分区重新分类为所选择的不同类别,以及
显示所述信号图,其中,所选择的不同类别由特定于所述类别的指示符表示。
根据一个实施例,阴性分区由信号图中与步骤(G)、(H)和(J)的指示符不同的另外的指示符表示。
根据一个实施例,指示符选自颜色、几何形状、图案、记号、图标、数字、字符、符号或适于在类别之间进行区分的任何其他方式。根据有利实施例,指示器是颜色。
术语“类别”或“分类”可以用于以下类别或分类:“阳性分区”、“阴性分区”、“有效分区”、“无效分区”、“假阴性分区”和“假阳性分区”。此外,术语“类别”或“分类”可用于与校正原因相关的类别或分类。
现在将详细描述根据第一方面的方法的各个步骤和优选实施例。
步骤(A)至(C)
在步骤(A)中,从位于经受生物测定的衬底的区域处的多个分区接收多个检测到的信号。
根据一个实施例,检测到的信号是由光学系统检测到的信号。根据一个实施例,信号是从至少一个荧光团发射的荧光信号。根据有利实施例,检测到的信号是从至少一个荧光团发射并由光学系统检测的荧光信号。光学系统可以是适于检测从所使用的至少一个荧光团发射的波长的相机。
根据一个实施例,从至少一个荧光团发射的荧光信号的波长在500-700nm的范围内,优选地在选自由510-550nm、550-570nm、580-610nm、610-655nm和655-700nm组成的组的范围内。从荧光团发射的每个信号可以根据光学系统的通道被检测。根据有利实施例,使用两个或更多个、三个或更多个、四个或更多个或者五个或更多个荧光团检测光学系统的两个或更多个、三个或更多个、四个或更多个或者五个或更多个不同通道中的信号。用于根据本发明的方法的几种合适的荧光团是可商购的,其中一些示例性地呈现在下表中。
衬底包括数百、数千、数万或数十万个反应位点,也称为分区。如本文所公开的反应位点或分区可以包括但不限于通孔、孔、压痕、斑点、空腔、样本保持区和反应室。根据一个实施例,衬底包括至少20,000个分区、至少50,000个分区,优选地至少200,000个分区、至少600,000个分区、至少800,000个分区。根据一个实施例,衬底是多孔板,诸如8孔板、24孔板或96孔板,每孔包括多个分区。根据有利实施例,多孔板选自由每孔具有26,000个分区的24孔板、每孔具有8,500个分区的24孔板和每孔具有8,500个分区的96孔板。根据一个实施例,衬底是微流体dPCR板。根据一个实施例,衬底的区域由多孔板的一个或更多个孔表示。本领域技术人员可以选择合适的衬底用于任何生物学测定,特别是对于dPCR。此类dPCR衬底可商购获得,例如QIAcuity Nanoplate(QIAGEN,Hilden)。
根据一个实施例,在生物分析系统中施行的生物测定是扩增反应。根据一个实施例,扩增反应具有以下特性中的一个或更多个:(i)其为聚合酶链反应(PCR);(ii)其为数字聚合酶链反应(dPCR);(iii)其为逆转录扩增反应;(iv)其为逆转录PCR(RT-PCR);(v)其为等温扩增反应;(vi)其为定量PCR;(vii)其为定量逆转录PCR;(viii)其为等位基因特异性PCR;(ix)其为不对称PCR;(x)其为连接酶介导的PCR;(xi)其为多重PCR;(xii)其为巢式PCR;(xii)其为桥接PCR。根据有利实施例,生物测定是数字PCR或数字逆转录PCR。如本文所用,术语“dPCR”是指数字PCR和数字RT-PCR两者。dPCR系统将待分析的样本分成数百、数千、十万或几千个子样本。例如,这在包括数百、数千、数万或数十万个反应位点的微流体纳米板中,在包括数百、数千、数万或数十万个反应位点(基于芯片的dPCR)的微流体芯片中或通过将样本分成数百、数千、数万或数十万个液滴(基于液滴的dPCR)来实现。几种数字(RT-)PCR系统可商购获得,诸如QIAcuity系统(QIAGEN,Hilden)。
在实施例中,生物样本可以包含一种或多种类型的生物靶标,包括DNA序列(包括无细胞DNA)、RNA序列、基因、寡核苷酸、分子、蛋白质、生物标志物、细胞(例如,循环肿瘤细胞)或任何其他合适的靶生物分子。
生物样本可以从任何生物源获得。根据一个实施例,生物样本具有以下特性中的一个或更多个:
(i)其为身体样本;
(ii)其为人样本;
(iii)其为病原性样本,诸如细菌样本或病毒样本;
(iv)其为动物样本;
(v)其为细胞培养样本;
(vi)其为组织样本;
(vii)其为环境样本;
(viii)其为废水样本;和/或
(ix)其为植物样本。
身体样本可以是液体身体样本,诸如血液、血清、血浆或唾液,或固体身体样本,诸如来自任何组织的活检。此外,生物样本可以是拭子,包括鼻拭子、口腔拭子、鼻咽拭子和口咽拭子。可以从疑似感染病原体或具有遗传障碍的人类受试者获得样本。此外,样本可以包含人材料,诸如人细胞或细胞组分,例如人蛋白或人核酸。
根据一个实施例,生物样本包含核酸。核酸可以包含DNA或基本上由DNA组成,包括基因组DNA、人DNA、病原DNA、病毒DNA、环境DNA(eDNA)。或者,核酸可包含RNA或基本上由RNA组成,包括mRNA、miRNA、siRNA、lncRNA、人RNA、病原RNA、病毒RNA。
根据一个实施例,针对有效分区检测的信号基于在生物分析系统中分析的生物样本中是否存在至少一种靶核酸。
根据一个实施例,在每个分区中,施行PCR,导致在生物样本中存在至少一种靶核酸。如果发生扩增反应,则可以通过相应分区中的光学系统检测到指示相应分区中至少一个靶核酸的存在的信号,诸如荧光信号。在没有发生扩增反应的情况下,光学系统未检测到指示相应分区中不存在至少一个靶核酸的信号。
根据一个实施例,所述至少一种靶核酸具有以下特性中的一个或更多个:
(i)选自RNA和/或DNA;
(ii)它源自人
(iii)其源自病原体,其中,病原体选自由病毒、细菌、原生动物、病毒和真菌组成的组;和/或
(iv)选自病毒RNA和病毒DNA。
根据一个实施例,靶核酸来源于RNA病毒。根据一个实施例,靶核酸来源于严重急性呼吸综合征相关冠状病毒,优选地严重急性呼吸综合征冠状病毒2(SARS-CoV-2)、严重急性呼吸综合征冠状病毒(SARS-CoV或SARS-CoV-1)或中东呼吸综合征(MERS),可选地其中,靶核酸来源于SARS-CoV-2,可选地,其中,一个或更多个靶核酸序列选自SARS-CoV-2基因N、N1、N2、RdRP、E和Orf1a/b。
根据一个实施例,生物样本包含与遗传病症相关的至少一种靶核酸。由于存在或不存在与遗传障碍相关的靶核酸,可检测任何遗传障碍,包括癌症突变、代谢障碍、单基因障碍、x连锁障碍、y连锁障碍和染色体疾病。
根据一个实施例,生物样本包含与基因组编辑相关的至少一个靶核酸。基因编辑可由基因组中DNA的插入、缺失、修饰或置换引起。几种基因工程技术是可用的,诸如利用锌指核酸酶或利用CRISPR(聚类的规则间隔的短棕榈重复)方法的基因编辑。
在步骤(B)中,选择用于信号强度阈值的值。信号强度可以在真实荧光单元(RFU)中给出。根据一个实施例,根据从位于经受生物测定的衬底的区域处的多个分区检测到的所有信号的信号强度的分布来生成信号强度阈值。
在步骤(C)中,信号强度被检测到高于信号强度阈值的分区被分类为阳性和/或信号强度被检测到低于信号强度阈值的分区被分类为阴性。信号强度阈值可以由用户响应于交互式工具的操纵而手动调整,从而相应地改变被分类为阳性和阴性的分区的数量。
步骤(D)至(H)
在步骤(D)中,尤其自动地识别必须被校正的分区。根据一个实施例,步骤(D)还包括对必须被校正为阴性和/或无效的分区中的一些或所有进行分类。此外,步骤(D)包括将分类为阳性和阴性的所有分区分类为有效。在一些实施例中,必须被校正的分区是指在其中检测到不满足表示成功扩增反应的信号的特性的信号的分区。在另外的实施例中,当分区位于衬底的区域的表示与衬底的该区域的所有区相比阳性分区的不均匀分布的区内时,分区可以被分配为“待校正”。必须被校正的分区的识别可以基于若干不同的校正原因。例如,确定必须被校正的信号的可能原因可以是灰尘或其他粒子、发射由光学系统检测到的信号的划痕或其他干扰因素、阳性分区的不均匀分布、阳性分区的统计上不可能的聚类或任何其他错误事件。
因此,术语“必须被校正的分区”包括给出校正的原因的分区。校正的原因可由分区自身的强度信号引起,或者可由形成具有所考虑分区的线或区域的分区和/或相邻分区的强度信号引起。如果分区已经被识别为必须被校正的分区并且分区被校正,即“(重新)分类”,则分区是校正分区。
在实施例中,为了识别必须由灰尘或其他颗粒、划痕或任何其他干扰因素引起的分区,确定不同的信号特性。由这些干扰因素分别引起的假阳性或必须被校正的其他分区的识别可以基于以下原因:
-形状:由于包括亮度分布的成功扩增反应,灰尘/颗粒/划痕的形状与阳性分区的形状之间的不匹配;
-位置:图像中x和y坐标之间的不匹配,因为分区规则地布置在网格中;
-大小:不遵循从成功扩增反应接收的阳性分区的常规亮度分布的亮像素的数量;
-亮度/聚类(仅执行多达一定数量的阳性的阈值):仅具有几个阳性分区的图像,其中具有许多阳性分区的某些区由于扩散灰尘而发生。
在另外的实施例中,对于由阳性分区的不均匀分布导致的要校正的分区的识别,首先,对图像中的阳性分区的总数进行计数。在阳性分区的数量达到某个值时,执行以下指令。将图像划分为更小的区,诸如正方形、矩形、菱形、圆形、省略号或适合于图像划分的任何其他均值,然后对每个区的阳性分区的数量进行计数。在其中一个区示出过多或太少的阳性分区的情况下,该区中的分区被分类为必须被校正的分区。
在另外的实施例中,在不违反阳性的不等分布的情况下执行对阳性(例如,在行或列中)的统计不可能的聚类的识别。基于正到阴性分区的数目,施行根据泊松的概率计算。如果存在不可能的聚类,则除特定数量的分区之外的所有阳性分区,诸如识别的一个、两个、三个或更多个分区——取决于必须被校正的分区的总数,被分类为假阳性,即,作为必须被校正的分区。
在识别必须被校正的分区之后,必须被校正的分区中的一些或所有被分类为阴性和/或无效,使得必须被校正的分区是经校正的分区。此外,被分类为阳性或阴性的所有分区被进一步分类为有效。阴性分区和阳性分区,即有效分区,被包括在最终靶核酸定量中,而无效分区最终靶核酸定量中被排除。然而,无效分区在最终靶核酸定量之前被进一步包括在数据审查和操纵过程中。
因此,在步骤(D)中,分区可以被识别为必须被校正的分区,并且必须被校正的分区被分类为校正的阴性和/或无效,使得必须被校正的分区是经校正的分区,其中作为阳性、阴性和经校正的阴性分区的所有分区是有效分区。因此,将衬底的区域处的每个分区分类为阳性、阴性、经校正的阴性和/或无效的至少一个分类,并且将分类为阳性、阴性和经校正的阴性(即,有效分区)的分区包括在数据中,并且将分类为无效的分区从数据中排除。因此,所有有效分区可以被包括在数据中,并且所有无效分区可以作为分析的基础从数据中排除,诸如核酸定量。
例如,在步骤(D)中,被识别为必须被校正并且发射高于阈值强度(即,假阳性)的信号的分区的分区可以被分类为经校正的阴性。该校正可能影响定量的结果,因为被分类为被分析的衬底中的阴性(包括经校正的阴性分区)的分区的总数增加,这可能导致相应孔中的靶分析物的总量与必须被校正的分区将被排除并且因此将不可用于定量的分析相比更低。因此,步骤(D)中的识别和分类提高了靶分析物(例如靶核酸)的定量的准确性,并导致生物测定(诸如dPCR)的更可靠的结果。
在实施例中,在步骤(D)中被分类为无效的经校正的分区是“经校正的无效分区”。
在步骤(E)中,显示包括检测到的信号的信号图的图形用户界面。如本文所述的“信号图”是指在分区和/或分区的类别在x、y坐标中的空间分布的可视化。在步骤(E)中,信号图通过其信号强度表示有效分区。有效分区都是阳性分区和阴性分区,包括经校正的阴性分区和经校正的阳性分区。根据取决于信号图中表示的其他阴性分区的信号强度的值来在信号图中表示经校正的阴性分区。经校正的阴性分区可以由信号图中表示的其他阴性分区的平均值来表示。经校正的阴性分区也可以由与信号强度阈值相关的值表示,该信号强度阈值又取决于阴性分区的值。经校正的阳性分区根据其信号强度来表示。在示例中示出了具有每个分区的原始信号或经预处理的信号(即,经校正的信号)的此类信号图。
在实施例中,步骤(E)中的信号图可以通过信号强度表示被分类为阳性的有效分区和被分类为阴性的有效分区,并且被分类为经校正的阴性的有效分区可以根据取决于被分类为阴性的分区的信号强度的值来表示。因此,信号图可表示有效(即,阳性、阴性、经校正的阴性)且因此包含于数据分析中的所有分区。
根据一个实施例,通过不同于步骤(G)、(H)和(J)的指示符的特定指示符在步骤(E)的信号图中表示经校正的分区。因此,所有经校正分区可由一个指示符表示,且未被识别为必须被校正的分区(即,真阳性及真阴性分区)的分区可根据其信号强度来表示。根据一个实施例,在步骤(E)中,可以从信号图中的表示中排除经校正的分区。这可能有利于仅可视化未被识别为必须被校正的分区的分区,即真实阳性分区和真实阴性分区,因此用户可以评估真实阳性分区和真实阴性分区的模式以用于在步骤(J)中做出决策。
在步骤(F)中,根据校正的原因将经校正的分区分类为类别。如上所述,校正的若干原因可能导致分区被认为是必须被校正的分区,诸如灰尘或其他粒子、划痕、发射信号的其他干扰因素、阳性分区的不均匀分布以及阳性分区的统计上不可能的聚类。技术人员知道可能导致假阳性或可能必须被校正的其他信号的任何错误事件。
在实施例中,根据本发明的方法的步骤(C)、(D)和/或(F),可以将衬底的区域处的每个分区在至少一个分类中分类为阳性、阴性、经校正的阴性、无效和/或根据校正的原因分类为类别。此外,被分类为阳性、阴性和/或经校正的阴性的分区(即,有效分区)可以被包括在数据中,并且被分类为无效的分区可以被排除在数据之外。
在步骤(G)中,显示其中所有阳性分区由第一指示符表示的信号图。如上所述,指示符可以是颜色、几何形状、图案、记号、图标、数字、字符、符号和/或适于在类别之间进行区分的任何其他方式。如示例中所示,使用颜色作为用于可视化和区分不同类别的指示符特别有利。
在步骤(H)中,显示信号图,其中表示校正原因的类别中的每个由第二、第三、第四或另外的指示符表示,尤其是根据所显示的类别的数目。根据一个实施例,步骤(G)和(H)同时施行。如实例中所展示,信号图可由第一颜色表示阳性分区、由第二颜色表示由灰尘引起的经校正分区以及由第三颜色表示由不等分布引起的经校正的分区。
步骤(H)中的信号图表示可以提供用户进行数据解释和决策的基础,如下面关于步骤(J)进一步解释的。
步骤(I)和(J)
根据第一方面的方法进一步允许用户操纵经处理的数据。因此,图形用户界面还包括至少两个交互式工具。
根据一个实施例,响应于用户对至少两个交互式工具中的至少一个的操纵,方法还包括步骤(I),其中通过从显示中排除和/或包括至少一个类别来调整信号图。如示例中所展示的,这样的交互式工具可以是用于每个类别的按钮、示出所有类别的下拉菜单、选择信号图上某个类别的一个成员并且由此选择该类别的所有分区的空闲手选择工具,或者可以使用任何其他合适的交互式工具来选择特定类别并且因此选择该选择的类别的所有分区。根据一个实施例,由系统接收响应于该交互式工具的操纵的指令,并且相应地可视化用于在信号图中表示的所选类别的每个分区的指示符。替选地,原始信号或经预处理的数据(诸如如上所述的从表示排除经校正的分区)被可视化。
根据一个实施例,响应于用户对至少两个交互式工具中的其他至少一个交互式工具的操纵,方法还包括步骤(J),其中选择用于一个或更多个分区和/或用于至少一个分区的一个或更多个类别的类别,从而将所述分区重新分类为所选择的不同类别并且其中显示信号图,其中,所选择的不同类别由特定于所述类别的指示符表示。如实例中所展示,此交互式工具可为框选择工具以通过选择单个分区来选择包含一个或更多个分区或自由手选择工具的信号图的部分或区。可以使用适合于选择单个分区或独立于相应类别的分区组的任何工具。根据一个实施例,可以将所选择的分区重新分类为已经显示的不同类别,并且相应地更新信号图。根据替选实施例,所选择的分区可以被重新分类为由用户分配的新类别并且指示不同的校正原因。根据一个实施例,图形用户界面可以提供用于手动输入新类别的标志的框。根据有利实施例,该新类别由可选地由用户选择的不同指示符显示,并且相应地更新信号图。根据一个实施例,提供了建议,其分区也可以被分类为不同的类别,因为也可以满足不同类别的标准。当光标在某个分区上移动时或者通过任何其他合适的均值来指示某个分区也可以被分类到不同的类别中时,可以通过弹出消息来显示这样的建议。
根据一个实施例,步骤(I)和(J)一个接一个地进行。
因此,本发明的方法可以帮助用户由于根据对每个经校正的分区的校正的原因(步骤(H))的类别的可视化,由于信号图的调整(步骤(I))以及可选地由于相应分区也可以被分类为不同类别的建议(例如,以弹出消息的形式)而在步骤(J)中施行重新分类。
在步骤(J)中,尤其自动地重新分类包括经校正的分区的经分类的分区可影响定量结果。步骤(H)的信号图表示和步骤(I)中的经调整的信号图可以帮助用户在步骤(J)中做出重新分类的决定,因为它根据校正的原因将类别对用户可视化。例如,如果用户将被识别为在步骤(D)中必须被校正和分类为校正和无效的分区的分区重新分类,并且因此将其从数据中排除,作为阳性或阴性(即,有效),从该分区获得的先前从数据中排除的数据被包括在数据中,并且因此被包括在靶分析物(例如,dPCR中的靶核酸)的定量中。在实施例中,经校正的分区可以被用户重新分类为阳性的。因此,靶分析物(诸如靶核酸)的最终量可能更高,因为衬底的区域中的阳性分区的总数增加。在替选实施例中,经校正的分区可由用户重新分类为阴性。因此,靶分析物(诸如靶核酸)的最终量可能较低,因为衬底的区域中的阴性分区的数量增加。在另外的实施例中,被分类为阳性、阴性或经校正的阴性(即,有效)的分区可以被用户重新分类为无效。因此,定量中包括的分区的总数减少,影响结果。因此,除了由步骤(D)提供的提高的准确度之外,由用户在步骤(J)中重新分类提供了靶分析物(例如靶核酸)的定量的准确性的进一步增加,并且导致生物测定(例如dPCR)的更可靠的结果。
在实施例中,根据步骤(C)、(D)、(F)和/或(J)中的任何一个,将衬底的区域处的每个分区在与分类对应的至少一个类别中分类为阳性、经校正的阳性、阴性、经校正的阴性、无效和/或根据校正的原因分类为类别。在实施例中,“经校正的阳性分区”是在步骤(C)或(D)中被分类为阴性、经校正的阴性或无效且在步骤(J)中被用户重新分类为阳性的分区。在实施例中,“经校正的阳性分区”是有效分区。在实施例中,“经校正的有效分区”是在步骤(D)中被分类为无效并且在步骤(J)中被用户重新分类为阳性或阴性(即,有效)的分区。
根据一个实施例,被分类为阳性、经校正的阳性、阴性和/或经校正的阴性(即,有效分区)的分区被包括在数据中,并且被分类为无效的分区被排除在数据之外。
因此,本发明的方法的分类提供了对包括在分析中的数据的准确选择,从而提高了数据分析的准确性。
根据第一方面的方法的进一步实施例
根据一个实施例,显示还包括连同信号图一起显示表示在不同通道中检测到的信号发射强度的数据点的多维散布图。信号强度可以在RFU中给出。根据一个实施例,显示还包括连同信号图一起显示数据点的一维散布图,其中,分析的分区绘制在x轴上,并且信号强度绘制在y轴上。根据一个实施例,显示还包括连同信号图一起显示表示在两个或更多个不同通道中检测到的信号发射强度的数据点的至少一个二维散点图,其中,在两个不同通道中检测到的信号强度彼此相对绘制。多维散布图的维数可以根据所使用的具有不同发射波长的荧光团的数量。合适的荧光团及其发射波长在本文其他地方有所描述。根据该实施例,可以获得发射类似信号特性的分区簇。例如,在二维散点图中,由于在扩增反应中使用两个不同荧光团而在两个不同通道中检测到的信号强度彼此相对绘制。在两个通道中检测到具有高强度的信号的分区可以表示一个聚类,在其中一个通道聚类中检测到具有高强度的信号的分区一起聚类,以及在两个通道聚类中检测到具有低强度或无信号的信号的分区一起聚类。该多维散布图允许进一步的数据处理。例如,可以施行聚类分析和/或主成分分析以识别具有相似信号特性的分区的聚类。
根据一个实施例,显示还包括连同信号图一起并且可选地利用多维散布图来显示直方图表示,其中,在直方图中,信号强度被绘制在x轴上,并且发射信号强度的分区的数量被绘制在y轴上。信号强度可以在RFU中给出。直方图表示允许可视化和审查衬底的区域中的阳性分区和阴性分区的数量和分布。根据一个实施例,直方图表示包括信号强度阈值的表示,诸如通过垂直线。
根据一个实施例,可以由用户响应于操纵至少一个图形交互工具而调整信号强度阈值。这样的工具可以被包括在直方图表示中,诸如用于输入用于信号强度阈值的值的框或滑块。根据一个实施例,响应于对用于调整信号强度阈值的至少一个图形交互工具的操纵,相应地调整分类和显示步骤。通过调整信号强度阈值,阳性分区和阴性分区的分类,以及必须被校正分区的识别,可以相应地改变。因此,也可改变经校正的分区到表示校正原因的类别中的分类,并且因此也可改变信号图表示。
因此,本发明的方法可以提高数据分析/评估的准确性,因为——尽管可以提供自动校正——用户提供了可能的准确类型的校正,用户可以由本发明的交互式工具影响该校正类型。令人惊讶地发现,尽管自动校正为用户提供了支持,但是来自用户的可能支持的影响示出了导致分析准确性的改善的结果。
在实施例中,提供了一种用于审查和操纵从由生物分析系统确定的信号获得的数据的方法,特别是用于提高关于数据评估的准确性,包括以下步骤:
(A)从位于经受生物测定的衬底的区域处的多个分区接收多个检测到的信号;
(B)选择用于信号强度阈值的值;
(C)将在信号强度阈值以上检测到信号强度的分区分类为阳性,和/或将在信号强度阈值以下检测信号强度的分区分类为阴性;
(D)将分区识别为必须被校正的分区,并且将必须被校正的分区分类为经校正的阴性和/或无效,使得必须被校正的分区是经校正的分区,其中,具有阳性、阴性和经校正的阴性分区的所有分区是有效分区;
(E)显示包括检测到的信号的信号图的图形用户界面,其中,信号图通过信号强度表示被分类为阳性的有效分区和被分类为阴性的有效分区,并且其中,被分类为经校正的阴性的有效分区根据取决于被分类为阴性的分区的信号强度的值来表示;
(F)根据校正的原因将经校正的分区分类为类别;
(G)显示信号图,其中,所有阳性分区由第一指示符表示;以及
(H)显示信号图,其中,表示校正原因的类别中的每个由第二、第三、第四或另外的指示符表示;
其中,图形用户界面还包括至少两个交互工具,其中,响应于用户对至少两个交互工具中的至少一个的操纵,方法还包括以下步骤中的至少一个:
(I)通过从显示中排除和/或包括至少一个类别来调整所显示的信号图;和/或
(J)针对一个或更多个分区和/或针对至少一个分区的一个或更多个类别选择类别,从而将所述分区重新分类为所选择的不同类别,以及
显示信号图,其中,所选择的不同类别由特定于所述类别的指示符表示。
总之,由于包括在数据中或从数据中排除的分区的准确(自动和/或手动)选择,根据第一方面的方法实现了对从生物测定(特别是dPCR)获得的数据的分析和评估的更高准确度。因此,与现有技术方法相比,本发明的方法提供了dPCR结果的改进的可靠性,现有技术方法仅提供必须通过进一步分析来校正的分区的识别和完全排除。
根据第二方面的系统
根据第二方面,提供了一种用于审查和操纵从由生物分析系统确定的信号获得的数据的系统,该系统包括:
(a)至少一个处理器,用于施行根据第一方面的方法;以及
(b)存储器,编码有用于施行根据第一方面的方法的指令。
根据一个实施例,存储器是动态存储器,优选随机存取存储器(RAM)。这种RAM可以具有4GB、8GB、16GB、32GB或64GB,优选地,RAM具有至少16GB。根据一个实施例,存储器是静态存储设备,诸如只读存储器(ROM)。
根据一个实施例,系统还包括:
(c)显示器;
(d)热循环仪;
(e)光学系统;
(f)存储设备;以及
(g)可选地,输入设备。
根据一个实施例,显示器包括输入设备。根据一个实施例,显示器是触摸屏。输入设备可以是字母数字键和其他键,其被耦合到总线以用于将信息和命令选择传送到处理器、光标控件(诸如鼠标)、轨迹球或光标方向键以用于向处理器传送信息和命令选择以及用于控制显示器上的光标移动。
根据一个实施例,部件(a)至(b)或(a)至(g)被连接以传送和处理信息。系统可以包括用于传送信息的总线或其他通信机制,以及与总线耦合以用于处理信息的处理器。
系统提供数据处理,例如dPCR数据处理。响应于处理器执行一个或更多个指令的一个或更多个序列以施行根据包含在存储器中的第一方面的方法,由系统提供根据第一方面的方法的数据处理。此类指令可从另一计算机可读媒体(诸如,存储设备)读取到存储器中。
根据第三方面的计算机可读存储介质
在第三方面,本发明涉及一种编码有指令的计算机可读存储介质,该指令可由处理器执行以用于对数据进行审查和操纵,指令包括用于施行根据第一方面的方法的指令。
如本文所使用的术语“计算机可读介质”通常是指涉及提供用于施行第一方面的方法的一个或更多个序列或一个或更多个指令以用于处理器执行使得系统能够施行本发明的实施例的特征或功能的任何介质。
根据一个实施例,计算机可读存储介质选自由非易失性介质、易失性介质和传输介质组成的组。根据一个实施例,计算机可读存储介质是USB(通用串行总线)闪存驱动器。根据一个实施例,计算机可读存储介质是光盘只读存储器(CD-ROM)。计算机可读存储介质可以由通过直接硬件连接到处理器的设备读取,或者计算机可读存储介质可以存储在设备的远程,尤其是在处理器可以访问的云中。
根据第四和第五方面的使用
根据第四方面,提供了根据第二方面的系统的使用,以施行根据第一方面的方法的用于数据审查和操纵的方法。
根据第五方面,提供了第三方面的计算机可读存储介质的使用以施行根据第一方面的方法的用于数据审查和操纵的方法。
示例
应当理解,以下示例仅用于说明目的,而不应被解释为以任何方式限制本发明。
以下实施例证明根据本发明的用于可视化dPCR数据的方法的优异性能。
缩写:
dPCR 数字聚合酶链反应
GUI 图形用户界面
PCR 聚合酶链式反应
RFU 真实荧光单元
以下实施例优选利用QIAcuity系统(QIAGEN,Hilden)和对应的配套组件施行。关于样本制备、耗材、缓冲剂和试剂、热循环、成像和进一步的设备,需要参考QIAcuity UserManual(QIAGEN、Hilden、03/2021和Extension 12/2020)。QIAcuity软件套件(QIAGEN,Hilden)为每个孔提供信号图作为本发明的方法的基础。
为了施行本发明的方法,根据QIAcuity User Manual(QIAGEN,Hilden,03/2021)推荐以下系统需求:
-处理器:x64兼容处理器,具有4个物理核和2.5GHz;
-存储器:16GB RAM;
-存储设备:至少500GB;以及
-图形:至少1920x1080像素。
示例1:从dPCR数据可视化中自动排除无效信号
在dPCR中,每个孔被分成许多子样本,即分区。对于这些子样本中的每一个,执行端点PCR并且在某个物理位置中测量信号。图1A示出了表示由相机获取的一个9mm×9mm孔的分区的原始信号的图像。每个分区根据其各自的空间位置及其信号强度(RFU,真实荧光单元)来表示。信号强度(RFU)取决于扩增反应,这意味着发生扩增反应的分区由亮信号(图1A中的白点)表示,而对于没有发生扩增反应的分区,没有检测到信号。在其中发生扩增反应但存在少量靶核酸分子的分区中,仍可检测信号,但其可具有较低强度。根据信号的具体特性,对分区进行分类。分区的位置连同其在信号图中的分类或类别的可视化提供了用于数据解释的总体场境。
阳性分区的自动分类和可视化
基于信号强度阈值,分区相对于信号强度(即,靶核酸的扩增)被自动分类为阳性/阴性。基于在相应孔中检测到的所有信号强度的分布来计算该阈值。还可以由用户手动设置或调整信号强度阈值,例如,在图形用户界面(GUI)上呈现所有检测到的信号强度的直方图的情况下,可以包括交互式工具,诸如用于输入值的框或滑块。表现出高于信号强度阈值的信号强度值(RFU)的分区被分类为阳性,而表现出低于该阈值的信号强度值的分区被分类为阴性。然后可以通过第一指示器(诸如颜色、几何形状、图案、记号、图标、数字、字符或任何其他合适的指示器(图1B中的亮点))在信号图中可视化阳性分区。
必须被校正的分区的自动识别和校正
另外,针对孔的某些分区或区检测到的信号可以被认为是不正确的,这意味着在这些分区中检测到的信号不满足表示成功扩增反应的信号的特性,或者其他错误事件发生,导致相应分区的不正确分配。例如,校正的可能原因可以是灰尘或发射信号的其他粒子、阳性分区的不均匀分布、阳性分区的统计上不可能的聚类或任何其他错误事件。
为了识别必须由灰尘或其他颗粒和刮擦引起的分区,确定不同的信号特性,然后将其识别为相应必须被校正的分区(参见图2A中的环绕灰尘)。灰尘的识别可以基于以下原因:
-形状:灰尘/颗粒/划痕的形状与包括亮度分布的阳性分区的形状之间的不匹配;
-位置:图像中x和y坐标之间的不匹配,因为分区规则地布置在网格中;
-大小:不遵循阳性分区的常规亮度分布的亮像素的数目;
-亮度/聚类(仅执行多达一定数量的阳性的阈值):仅具有几个阳性分区的图像,其中具有许多阳性分区的某些区由于扩散灰尘而发生。
对于由阳性分区的不均匀分布导致的必须被校正的分区的识别,首先,对图像中的阳性分区的总数进行计数。在阳性分区的数量达到某个值时,执行以下指令。将整体图像划分为更小的区,诸如正方形、矩形、菱形、圆形、省略号或适合于图像划分的任何其他方式,然后对每个区的阳性分区的数量进行计数。在其中一个区示出过多或太少的阳性分区的情况下,它被自动分类为必须被校正的分区。
在不违反阳性的不等分布的情况下执行对阳性(例如,行)的统计不可能的聚类的识别。基于正到阴性分区的数目,施行根据泊松的概率计算。如果存在不可能的聚类,则除特定数量的分区之外的所有阳性分区,诸如一个、两个、三个或更多个分区——取决于必须被校正的分区的总数,被分类为假阳性,即作为经校正的分区。
根据校正的原因,经校正的分区中的一些或所有被分类为阴性,例如在不可能的阳性的聚类的情况下,和/或被分类为无效的。
然后校正由第一指示符(例如,颜色)表示阳性分区的信号图,使得排除经校正的信号,即不再显示(参见图2B)。
示例2:由于用户进行校正和操纵的原因,经校正的分区的类别的可视化
由于靶核酸的定量是基于指示靶核酸的存在或不存在的阳性和阴性分区(即有效分区),因此无效分区被排除在最终靶核酸定量之外。然而,包括无效分区的经校正的分区被包括在数据审查和操纵过程中,以允许用户在分析中包括或排除未由现有技术方法提供的某些分区。
根据本发明的方法扩展了自动可视化以不仅区分阳性/阴性和有效/无效信息,而且还包括关于每个分区的校正原因的信息。此外,用户可以手动选择将一起显示哪些信息。更进一步地,用户可以手动改变自动有效性判断,例如从结果中排除某些分区或重新分类可视化数据。
图3示出了根据本发明的方法的示例性工作流。这些工作流可有利地在QIAcuity系统(QIAGEN,Hilden)中实现。作为基础,如上所述,可选地利用预处理或经校正的数据可视化示出分区的每个孔的信号图。在示例性工作流程中,信号图根据相应的荧光信号强度表示有效信号,而无效/经校正的信号或分区可以自动地被识别和排除在可视化之外或由如上所述的第一指示符表示(图3A的上部框)。
经校正分区的类别的自动可视化
根据本发明的方法,由不同指示符(诸如颜色、几何形状、图案、记号、图标、数字、字符或适合于区分的类似表示)表示的若干叠加归因于校正的原因而可视化经校正的分区的不同类别。
如上所述,自动识别必须被校正的分区。然而,根据本发明,无效/经校正的分区不像现有技术方法那样从可视化中排除,而是根据校正的相应原因而可视化(例如,灰尘/颗粒/划痕、阳性分区的不均匀分布、阳性分区的统计上不可能的聚类等)。校正的每个原因由某个指示符指示,诸如颜色、几何形状、图案、记号、图标、数字、字符或以类似的方式。图3A示出了不仅表示相同颜色(颜色1,具有粗对角线的圆)中的阳性分区,而且表示颜色2中的类别“灰尘”(具有起伏状图案的圆)和颜色3(具有细对角线的圆)中的“比例”(用于不等分布)的信号图(中间框,图3A)。因此,用户接收关于某些分区或某些区的校正原因的信息。
用户手动选择类别
根据本发明,用户可以选择应显示哪些类别。这通过呈现在GUI上的允许用户交互的交互式工具来实现。这样的交互式工具可以是用于每个类别的按钮,如图3中的按钮所示。替选地或附加地,用户可以直接在信号图上或通过下拉菜单选择特定类别的一个成员,从而关闭或开启相应类别。然而,可以使用任何其他合适的交互式工具来选择特定类别。
响应于该交互式工具的操纵的指令由系统接收,并且相应地更新在信号图中呈现的指示符(例如,颜色)。例如,用户可以关闭由“灰尘”(图3A中用颜色2表示的中部或底部框)引起的经校正的分区的可视化。此外,类别“灰尘”可以再次开启。
用户手动重新分类
本发明的方法还提供用户通过另一交互式工具从不同类别中选择单个分区或成员。这种交互式工具可以是框选择工具,以通过选择单个分区来选择信号图的部分或区(参见图3B中的上部框,由白框示出)或空闲手选择工具。可以使用适合于选择单个分区或独立于相应类别的分区的组的任何工具。系统可以提供关于也可以满足不同类别的标准的分区的建议。可以通过弹出消息或类似的方式向用户显示这样的建议。
然后可以将所选择的分区重新分类到已经显示的不同类别,并且相应地更新信号图。可替选地,可以将所选择的分区重新分类为由用户分配的新类别并且指示不同的校正原因。因此,GUI可以提供用于手动输入新类别的标志的框。该新类别由不同的指示器/颜色显示,可选地由用户选择,并且相应地更新信号图(图3B中的底部框;由颜色4表示的类别“手动”(具有棋盘图案的圆圈))。
本发明的方法扩展了用于dPCR数据可视化、用户审查和操纵的现有技术方法,从而提供了改进的和可靠的dPCR数据分析,尤其是在从病毒、细菌、遗传紊乱或也在复杂样本和含有最小量的靶核酸的样本中的任何其他靶核酸获得的核酸的测试品中。
示例3:对于数据分析必须被校正的分区的准确选择
本发明的方法提供对必须针对数据分析进行校正的分区的准确选择。通过将必须被校正的分区分类为经校正的阴性(即,有效),那些分区包括在数据分析中。相反,必须被校正为无效的分区的分类导致排除来自数据分析的那些分区。此外,用户可以通过使用本发明的交互式工具手动地包括或排除来自分析的数据。结果,与现有技术方法相比,可以实现更大的准确度。
根据本发明的方法,被识别为必须被校正的分区的分区可以被分类为经校正的阴性。那些经校正的阴性分区在信号图中根据取决于被分类为阴性并且未被识别为必须被校正的分区的分区的信号强度的值来表示。此外,经校正的阴性分区被包括在数据中,因为这些分区是有效分区。因此,必须被校正的分区都不可避免地不被排除在进一步的分析之外,因为它是现有技术方法中的情况,但是在所识别的分区被分类为校正的阴性的情况下被包括在定量中。
类似地,本发明的方法的用户交互工具之一允许重新考虑被识别为必须被校正并且被分类为无效并且因此从数据中排除的分区的分区。通过利用该交互式工具,用户可以手动重新分类那些分区,这些分区由于分类为无效而被自动排除,如阳性的或阴性的。因此,那些经校正的分区是有效的并且被包括在靶核酸定量中。此外,被自动分类为有效的那些分区(阳性、阴性或经校正的阴性)可能被用户手动重新分类为无效,因此被排除在定量之外。
本发明的方法还允许响应于对用于调整信号强度阈值的至少一个另外的图形交互工具的操纵而调整分类和显示步骤。通过调整信号强度阈值,相应地调整分区分类为阳性和阴性。结果,调整分区的自动分类为经校正的阴性和/或无效。因此,也调整了信号图表示。例如,在信号图中表示经校正的阴性分区的信号强度可以改变,因为被分类为阴性的分区的数量由于信号强度阈值的调整而改变。此外,用户可以使用交互式工具来手动改变表示和/或重新分类经调整的分类。因此,有效且包含于数据中的分区的数目以及无效且从数据排除的分区的数目也经调整且因此影响数据分析。
因此,可以进一步提高数据分析的准确度,因为向用户提供了可能的准确类型的校正,其可能由于本发明的方法所提供的交互式工具而被用户影响。来自用户的这种可能支持的影响示出了导致分析准确性的改善的结果。
总之,本发明的方法提供对包括或排除在dPCR中的靶核酸定量中的数据的准确选择。因此,与现有技术方法相比,本发明的方法提供了更高的准确性和提高的dPCR结果的可靠性,现有技术方法仅提供必须从进一步分析中校正并且不允许重新考虑排除的分区的分区的识别和自动排除。

Claims (21)

1.一种用于审查和操纵从由生物分析系统确定的信号获得的数据的方法,包含以下步骤:
(A)从位于经受生物测定的衬底的区域处的多个分区接收多个检测到的信号;
(B)选择用于信号强度阈值的值;
(C)将在所述信号强度阈值以上检测到信号强度的分区分类为阳性,和/或将在所述信号强度阈值以下检测到信号强度的分区分类为阴性;
(D)将分区识别为必须被校正的分区,使得必须被校正的分区中的一些或所有被分类为阴性和/或无效,使得必须被校正的分区是经校正的分区,并且将被分类为阳性和阴性的所有分区分类为有效;
(E)显示包含所述检测到的信号的信号图的图形用户界面,其中,所述信号图通过其信号强度表示有效分区,其中,经校正的阴性分区根据取决于所述信号图中表示的其他阴性分区的所述信号强度的值来表示;
(F)根据校正的原因将经校正的分区分类为类别;
(G)显示所述信号图,其中,所有阳性分区由第一指示符表示;以及
(H)显示所述信号图,其中,表示校正的原因的所述类别中的每个由第二、第三、第四或另外的指示符表示;
其中,所述图形用户界面还包含至少两个交互工具,其中,响应于用户对所述至少两个交互工具中的至少一个的操纵,所述方法还包含以下步骤中的至少一个:
(I)通过从显示中排除和/或包括至少一个类别来调整所显示的信号图;和/或
(J)针对一个或更多个分区和/或针对至少一个分区的一个或更多个类别选择类别,从而将所述分区重新分类为所选择的不同类别,以及
显示所述信号图,其中,所选择的不同类别由特定于所述类别的指示符表示。
2.根据权利要求1所述的方法,其中,(E)中的所述信号图具有以下特性之一:
(i)其通过不同于步骤(G)、(H)和(J)的指示符的特定指示符来表示经校正的分区;或
(ii)从表示中排除经校正的分区。
3.根据权利要求1或2所述的方法,其中,所述阴性分区由所述信号图中与步骤(G)、(H)和(J)的指示符不同的另外的指示符表示。
4.根据权利要求1-3中的任一项所述的方法,其中,同时施行步骤(G)和(H)。
5.根据权利要求1-4中的任一项所述的方法,其中,步骤(I)和(J)一个接一个地进行。
6.根据权利要求1-5中的任一项所述的方法,其中,所述指示符选自颜色、几何形状、图案、记号、图标、数字、字符、符号和/或适于在所述类别之间进行区分的任何其他方式。
7.根据权利要求1-6中的任一项所述的方法,其中,所述检测到的信号是从由光学系统检测到的一个或更多个、两个或更多个、三个或更多个、四个或更多个、或者五个或更多个荧光团发射的荧光信号。
8.根据权利要求1-7中的任一项所述的方法,其中,所述信号强度阈值是根据从位于经受生物测定的衬底的区域处的多个分区检测到的所有信号的信号强度的分布来生成的。
9.根据权利要求1-8中的任一项所述的方法,其中,所述信号强度阈值能够由所述用户响应于对至少一个图形交互式工具的操纵来调整。
10.根据权利要求9所述的方法,其中,响应于用于调整所述信号强度阈值的至少一个图形交互工具的操纵,相应地调整所述分类和显示步骤。
11.根据权利要求1-10中的任一项所述的方法,其中,所述衬底具有以下特性中的一个或更多个:
(i)其包含至少20,000、至少50,000个分区,优选地至少200,000个分区,至少600,000个分区,至少800,000个分区;
(ii)其是每孔包含多个分区的多孔板;和/或
(iii)其包含至少一个区域,可选地,其中,衬底的区域由多孔板的一个或更多个孔表示。
12.根据权利要求1-11中的任一项所述的方法,其中,在所述生物测定中分析的生物样本包含核酸。
13.根据权利要求1-12中的任一项所述的方法,其中,针对所述有效分区检测到的信号基于在所述生物分析系统中分析的所述样本中是否存在靶核酸。
14.根据权利要求1-13中的任一项所述的方法,其中,在所述生物分析系统中施行的所述生物测定是扩增反应。
15.根据权利要求14所述的方法,其中,所述扩增反应具有以下特性中的一个或更多个:(i)其为聚合酶链反应(PCR);(ii)其为数字聚合酶链反应(dPCR);(iii)其为逆转录扩增反应;(iv)其为逆转录PCR(RT-PCR);(v)其为等温扩增反应;(vi)其为定量PCR;(vii)其为定量逆转录PCR。
16.根据权利要求1-15中的任一项所述的方法,其中,所述方法包含以下特性中的一个或更多个:
(i)其中,根据步骤(C)、(D)、(F)和/或(J)中的任一个,在对应于所述分类的至少一个类别中将在衬底的区域处的每个分区分类为阳性、经校正的阳性、阴性、经校正的阴性、无效和/或根据校正的原因分类为类别;和/或
(ii)其中,被分类为阳性、经校正的阳性、阴性和/或经校正的阴性的分区被包括在所述数据中,并且被分类为无效的分区被从所述数据排除。
17.一种用于审查和操纵从由生物分析系统确定的信号获得的数据的系统,所述系统包含:
(a)至少一个处理器,所述至少一个处理器用于施行根据权利要求1-15或16中的任一项所述的方法;以及
(b)存储器,所述存储器编码有用于施行根据权利要求1-15或16中的任一项所述的方法的指令。
18.根据权利要求17所述的系统,其中,所述系统还包含:
(c)显示器;
(d)热循环仪;
(e)光学系统;
(f)存储设备;以及
(g)可选地,输入设备。
19.根据权利要求17或18所述的系统,其中,所述部件(a)至(b)或(a)至(g)被连接以传送和处理信息。
20.一种编码有指令的计算机可读存储介质,所述指令可由处理器执行以用于对数据进行审查和操纵,所述指令包含用于施行根据权利要求1-15或16中的任一项所述的方法的指令。
21.一种用于审查和操纵从由生物分析系统确定的信号获得的数据的方法,包含以下步骤:
(A)从位于经受生物测定的衬底的区域处的多个分区接收多个检测到的信号;
(B)选择用于信号强度阈值的值;
(C)将在所述信号强度阈值以上检测到信号强度的分区分类为阳性,和/或将在所述信号强度阈值以下检测到信号强度的分区分类为阴性;
(D)将分区识别为必须被校正的分区,并且将必须被校正的分区分类为经校正的阴性和/或无效,使得必须被校正的分区是经校正的分区,其中,作为阳性、阴性和经校正的阴性分区的所有分区是有效分区;
(E)显示包含所述检测到的信号的信号图的图形用户界面,其中,所述信号图通过它们的信号强度表示被分类为阳性的有效分区和被分类为阴性的有效分区,并且其中,被分类为经校正的阴性的有效分区根据取决于被分类为阴性的分区的信号强度的值来表示;
(F)根据校正的原因将经校正的分区分类为类别;
(G)显示所述信号图,其中,所有阳性分区由第一指示符表示;以及
(H)显示所述信号图,其中,表示校正的原因的所述类别中的每个由第二、第三、第四或另外的指示符表示;
其中,所述图形用户界面还包含至少两个交互工具,其中,响应于用户对所述至少两个交互工具中的至少一个的操纵,所述方法还包含以下步骤中的至少一个:
(I)通过从显示中排除和/或包括至少一个类别来调整所显示的信号图;和/或
(J)针对一个或更多个分区和/或针对至少一个分区的一个或更多个类别选择类别,从而将所述分区重新分类为所选择的不同类别,以及
显示所述信号图,其中,所选择的不同类别由特定于所述类别的指示符表示。
CN202280036306.5A 2021-06-01 2022-06-01 用于审查和操纵数字pcr数据的方法 Pending CN117355898A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21177157.1 2021-06-01
EP21177157.1A EP4099332A1 (en) 2021-06-01 2021-06-01 Method for reviewing and manipulating of digital pcr data
PCT/EP2022/064882 WO2022253887A1 (en) 2021-06-01 2022-06-01 Method for reviewing and manipulating of digital pcr data

Publications (1)

Publication Number Publication Date
CN117355898A true CN117355898A (zh) 2024-01-05

Family

ID=76250089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280036306.5A Pending CN117355898A (zh) 2021-06-01 2022-06-01 用于审查和操纵数字pcr数据的方法

Country Status (6)

Country Link
EP (2) EP4099332A1 (zh)
JP (1) JP2024520358A (zh)
CN (1) CN117355898A (zh)
AU (1) AU2022285871A1 (zh)
CA (1) CA3220288A1 (zh)
WO (1) WO2022253887A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2917862B1 (en) 2012-11-07 2021-12-08 Life Technologies Corporation Visualization tools for digital pcr data
AU2014302101A1 (en) 2013-06-28 2016-02-04 Life Technologies Corporation Methods and systems for visualizing data quality

Also Published As

Publication number Publication date
CA3220288A1 (en) 2022-12-08
EP4348655A1 (en) 2024-04-10
JP2024520358A (ja) 2024-05-24
AU2022285871A1 (en) 2023-11-16
WO2022253887A1 (en) 2022-12-08
EP4099332A1 (en) 2022-12-07

Similar Documents

Publication Publication Date Title
Smyth et al. Statistical issues in cDNA microarray data analysis
US11417037B2 (en) Visualization tools for digital PCR data
KR102531008B1 (ko) 증폭 데이터 표시 방법 및 장치
US20060173628A1 (en) Method and system for determining feature-coordinate grid or subgrids of microarray images
EP2976434B1 (en) Methods and systems for analyzing biological reaction systems
US10777303B2 (en) Tool for visualizing PCR results
CN113278712A (zh) 分析绵羊毛色的基因芯片、分子探针组合、试剂盒及应用
Tzonev Fundamentals of counting statistics in digital PCR: I just measured two target copies–what does it mean?
EP1190762B1 (en) Method for displaying result of hybridization experiment using biochip
EP4099332A1 (en) Method for reviewing and manipulating of digital pcr data
Reed et al. Identifying individual DNA species in a complex mixture by precisely measuring the spacing between nicking restriction enzymes with atomic force microscope
CN113293220B (zh) 分析绵羊耳部大小的基因芯片、分子探针组合、试剂盒及应用
US20030156136A1 (en) Method and system for visualization of results of feature extraction from molecular array data
Santos-Barriopedro et al. Robust higher-order multiplexing in digital PCR by color-combination
US20040019433A1 (en) Method for locating areas of interest of a substrate
CN117106936B (zh) 分析山羊毛色性状的分子标记组合及应用
CN117089636B (zh) 分析山羊肉用性能的分子标记组合及应用
US20240046482A1 (en) Methods and systems for image processing
Ramakrishnan et al. DNA microarray data classification via Haralick’s parameters
GB2551091A (en) Genotype determination device and method
CN111929429A (zh) 一种单分子定量的检测技术的信号分析方法以及系统
CN117089633A (zh) 分析山羊毛用性能的分子标记组合及应用
Khojasteh Lakelayeh Quality filtering and normalization for microarray-based CGH data
Oh Investigation of epigenetics in cell populations using three-dimensional quantitative DNA methylation imaging

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination