CN103069427B - qPCR基因分型数据的可视化工具 - Google Patents

qPCR基因分型数据的可视化工具 Download PDF

Info

Publication number
CN103069427B
CN103069427B CN201180024260.7A CN201180024260A CN103069427B CN 103069427 B CN103069427 B CN 103069427B CN 201180024260 A CN201180024260 A CN 201180024260A CN 103069427 B CN103069427 B CN 103069427B
Authority
CN
China
Prior art keywords
data
data set
collection
processor
illustrative plates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180024260.7A
Other languages
English (en)
Other versions
CN103069427A (zh
Inventor
戈登·亚纳威
陈咏婵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Inc
Original Assignee
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Inc filed Critical Life Technologies Inc
Publication of CN103069427A publication Critical patent/CN103069427A/zh
Application granted granted Critical
Publication of CN103069427B publication Critical patent/CN103069427B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning

Abstract

用于显示从qPCR仪器获得的数据的系统和方法。两个或更多个样品的每一个用第一标记探针和第二标记探针探测。在第一循环数时从qPCR仪器接收到第一数据集,其包括每一样品的第一标记探针强度和第二标记探针强度。在第二循环数时接收到第二数据集,其包括每一样品的第一标记探针强度和第二标记探针强度。利用第一数据集,生成第一标记探针强度作为第二标记探针强度函数的第一图谱。利用第二数据集生成第一标记探针强度作为第二标记探针强度函数的第二图谱。响应用户定义的输入,第一图谱和第二图谱被显示从而提供基因分型数据的动态和实时分析。

Description

qPCR基因分型数据的可视化工具
技术领域
本发明涉及用于基因分型数据的可视化工具的计算机实现方法以及用于基因分型数据的可视化的系统。
背景技术
定量聚合酶链式反应(qPCR)仪器或循环仪允许在每一循环期间收集数据。PCR数据通常在每一循环利用qPCR仪器内的光学系统来收集,该光学系统能够检测与被qPCR仪器分析的每一核酸样品连接的一个或多个标记探针发射的电磁辐射。因此PCR数据包括每一循环或与循环相关的每一时间的每一样品的一个或多个标记探针强度值。
发明内容
按照本教导的系统的多种实施方案包括qPCR仪器,以及用于控制和/或监测qPCR仪器的处理器或计算机。处理器用于生成和修改发送到qPCR仪器的实验参数和/或监测qPCR仪器以及实验后分析从qPCR仪器接收的PCR数据。尽管qPCR系统接收和分析qPCR数据,但是它们一般仅在终点或PCR实验结束后显示有用的或有差别的信息。另外,尽管qPCR仪器和qPCR系统的处理器能够通过网络通信,但每一qPCR系统可以包括一个qPCR仪器和一个处理器。最后,尽管高通量实验流程可能要求同一PCR实验在多批样品上运行,但qPCR系统可能经常需要为置于qPCR仪器中的每批样品输入实验参数。
附图说明
本领域技术人员会理解,下文描述的附图仅用于示例目的。这些附图并不意欲以任何方式限制本教导的范围。
图1是示例性的流程图,示出了用于显示从qPCR仪器获得的数据的方法,基于此可以实施本教导的实施方案。
图2是举例说明聚合酶链式反应(PCR)仪器的方框图,基于此可以实施本教导的实施方案。
图3是举例说明计算机系统的方框图,基于此可以实施本教导的实施方案。
图4是用于联网热循环仪器的系统的图解,基于此可以实施本教导的实施方案。
图5是示例性的扩增图谱,基于此可以实施本教导的实施方案。
图6是终点数据的示例性等位基因鉴别图谱,其中等位基因鉴别是明显的,基于此可以实施本教导的实施方案。
图7是终点数据的示例性等位基因鉴别图谱,其中等位基因鉴别是不明显的,基于此可以实施本教导的实施方案。
图8是来自产生图6数据的同一实验在循环数为30时的示例性等位基因鉴别图谱,基于此可以实施本教导的实施方案。
图9是来自产生图6数据的同一实验在循环数为35时的示例性等位基因鉴别图谱,基于此可以实施本教导的实施方案。
图10是来自产生图6数据的同一实验在循环数为40时的示例性等位基因鉴别图谱,基于此可以实施本教导的实施方案。
图11是来自产生图6数据的同一实验在循环数为40时的示例性等位基因鉴别图谱,显示了代表来自先前循环数的数据的轨迹线,基于此可以实施本教导的实施方案。
图12是来自产生图7数据的同一实验在循环数为40时的示例性等位基因鉴别图谱,显示了代表来自先前循环数的数据的轨迹线,基于此可以实施本教导的实施方案。
图13A-13C显示了按照本教导的多种实施方案的示例性用户界面的互动性。
图14A-14C显示了按照本教导的多种实施方案的示例性用户界面的互动性。
具体实施方式
用于qPCR基因分型数据的可视化工具的系统和方法的多种实施方案,可以响应终端用户输入提供给终端用户基因分型数据的动态显示。本教导的系统和方法的多种实施方案的互动性允许终端用户控制大量的信息,这些信息显示为基于时间的数据图谱,所述数据可以以逐步的方式从用户输入存取,或者可以作为视频显示从用户输入存取。在用于qPCR基因分型数据的可视化工具的系统和方法的多种实施方案中,样品表可以与样品图谱有关,该样品表可以具有大量的与表中出现的每一样品有关的信息。在本教导的系统和方法的多种实施方案中,终端用户可以以任何所需的方式选择出现在样品表上的一个或多个样品;每一样品具有与其相关的丰富的样品信息,以及所选的一个或多个样品可以显示在基因分型数据的图谱上。因此,通过这种可视化工具,终端用户可以动态地理解各种实验条件对基因分型实验结果的影响。这种分析可以提供给终端用户以下能力:例如但不限于检修有歧义的终点数据、作出人工基因分型、提高基因分型分配、优化测定和分析条件。
图1是流程图,描绘了本教导用于显示和分析来自基因分型样品数据的系统和方法的多种实施方案。如之前讨论的,多种方法实施方案可以基于其实施的系统实施方案包括可以通信的qPCR仪器和处理器。这种通信可以包括例如数据或控制信息的交换。
如本领域普通技术人员所获悉的,在热循环仪器上进行PCR分析,所述热循环仪器具有通过多个热循环进行循环的多种操作方案以便扩增基因靶标。在本教导的多种实施方案中,为了扩增而进行的循环数可以为约20-40个循环。对于本教导的多种实施方案,为了扩增而进行的循环数可以大于40个循环。为了扩增基因靶标,热循环仪器可以在与第一热循环数相关的一定循环时间内进行PCR试验的第一热循环。
在基因分型分析的多种实施方案中,两个或更多个DNA样品用第一探针和第二探针探测。如图1的步骤110所示,基于用于数据收集的多种操作方案的任一种,处理器可以从qPCR仪器接收第一时间的第一数据集,其包括两个或更多个DNA样品的每一个在第一时间的第一探针强度和第二探针强度。按照本教导的多种实施方案,以及如在图1的步骤120所示,基于用于数据收集的多种操作方案的任一种,处理器可以从qPCR仪器接收第二时间的第二数据集,其包括两个或更多个DNA样品的每一个在第二时间的第一探针强度和第二探针强度。
按照本教导的多种实施方案,用户界面可以呈现给终端用户用于分析在第一时间和第二时间接收的数据集的可视化工具。如以前提及的,可以在一批中处理多个样品,用于基因分型分析,从而产生数据-密集性数据集。本教导的系统和方法的多种实施方案提供可以辅助终端用户评价和分析这种数据密集性数据集的可视化工具的实施方案。如在图1的步骤140中所示,对于按照本教导的系统和方法的多种实施方案,响应来自终端用户的输入,处理器可以利用第一数据集生成第一探针强度对第二探针强度的第一图谱。此外,如图1的步骤145所示,响应来自终端用户的输入,处理器可以利用第二数据集生成第一探针强度作为第二探针强度的函数的第二图谱。如图1的步骤150和155所示,按照本教导的系统和方法的多种实施方案,响应来自终端用户的输入,处理器可以显示第一图谱和第二图谱。在多种实施方案中,输入可以是与用户界面的互动过程从而以逐步方式显示数据。在这种实施方案中,终端用户可以以任何顺序选择任何数据集来显示。对于多种实施方案,来自终端用户的输入可以包括例如点击或使用图形用户界面的任何图标,包括但不限于滑动条、滚动条、按钮、文本框和样品表的表示。对于多种实施方案,输入可以是用户以视频显示数据的选择。
在如图1所示的系统和方法的多种实施方案中,处理器可以在PCR实验运行时间接收数据。例如,处理器可以在收集第一数据集之后以及在收集第二数据集之前接收来自qPCR仪器的第一数据集。此外,该操作方案可以延长至整个运行时间以使得,例如处理器可以在收集第二数据集之后以及收集随后的数据集之前接收来自qPCR仪器的第二数据集。
按照本教导的系统和方法的多种实施方案,处理器可以接收在热循环结束后接收来自qPCR仪器的第一数据集和第二数据集。例如,处理器可以在其已被储存在计算机可读介质上之后接收第一数据集和第二数据集。.
按照本教导的系统和方法的多种实施方案,如图1中所示,响应用户输入,可视化工具可以辅助终端用户显示多方面的基因分型数据集,由此促进基因分型数据的分析。在多种实施方案中,处理器可以显示展示了第二数据集和第一数据集间的轨迹线的图谱。在多种实施方案中,处理器可以在第一图谱上显示第一数据集的质量值以及在第二图谱上显示第二数据集的质量值。按照多种实施方案,用户界面提供了在样品表上作的选择和在基因分型数据图谱上动态显示的选择之间的互动作用。在多种实施方案中,终端用户从可视化工具的用户界面所作的选择可以提供,例如但不限于动态分析,例如但不限于使得终端用户能够检修有歧义的终点数据、作出人工基因分型、利用轨迹线以辅助群集可视化从而提高基因分型分配、优化测定条件(即标记探针、测定缓冲液等)和优化分析条件。
按照本教导的方法和系统的多种实施方案可以利用数据集,其可以例如但不限于按照图6所示的图形表示。这种表示法可以起因于利用具有不同波长的发射物的两种染料的分析,所述染料可以与针对生物样品中基因组座位两种等位基因之一的每种标记探针相关联。在这种双联反应中,产生三种可能基因型的每种的离散信号集。在如图6所示的信号2对信号1的笛卡尔坐标系统中,展示在这种图示法上的每一数据点可以在所给的三个离散信号集之一中具有坐标,例如参考图6,如对于(信号2,信号2),显示了数据点群集610;对于(信号2,信号1),显示了数据点群集630;以及对于(信号1,信号1),显示了数据点群集620。因此,对于每一数据点,多个样品的离散信号集可以储存为数据集中的数据点。这种数据集可以储存在多种计算机可读介质中,并在分析期间进行动态分析或在分析后进行分析,如随后更为详细讨论的。
一种用于证实基因分型数据可视化的方法和系统的实施方案特征的这类测定可以利用试剂,以及可以利用例如但不限于FAM和VIC染料标记物,如随后所讨论的。然而,本领域的普通技术人员会认识到,可以利用包括标记探针试剂在内的多种测定来产生可按照本教导的方法和系统的多种实施方案进行分析的数据。
按照多种实施方案,术语“标记探针”一般指用于扩增反应的分子,通常用于定量或qPCR分析,以及终点分析。这种标记探针可以用于监测靶多核苷酸的扩增。在一些实施方案中,存在于扩增反应中的寡核苷酸标记探针适用于监测作为时间函数产生的扩增子的量。这种寡核苷酸标记探针包括但不限于,本文描述的5'-核酸外切酶测定标记探针(还参见美国专利号5,538,848)、多种茎-环分子信标(参见,例如,美国专利号6,103,476和5,925,517,以及Tyagi and Kramer,1996,NatureBiotechnology 14:303-308)、无茎或线型信标(参见,例如,WO 99/21881)、PNA分子信标(PNA Molecular BeaconsTM,参见,例如,美国专利号6,355,421和6,593,091)、线型PNA信标(参见,例如,Kubista et al.,2001,SPIE 4264:53-58)、非-FRET标记探针(参见,例如,美国专利号6,150,097)、Sunrise标记探针(美国专利号6,548,250)、茎-环和双股ScorpionTM标记探针(Solinas et al.,2001,Nucleic Acids Research 29:E96和美国专利号6,589,743)、凸环标记探针(美国专利号6,590,091)、伪结标记探针(美国专利号6,589,250)、环形标(cyclicon)(美国专利号6,383,752)、MGB EclipseTM探针(Epoch Biosciences)、发夹标记探针(美国专利号6,596,490)、肽核酸(PNA)点亮标记探针、自组装纳米微粒标记探针、以及二茂铁修饰的标记探针,例如在美国专利号6,485,901;Mhlanga et al.,2001,Methods 25:463-471;Whitcombe et al.,1999,Nature Biotechnology.17:804-807;Isacsson et al.,2000,Molecular Cell Labeling probes.14:321-328;Svanvik et al.,2000,Anal Biochem.281:26-35;Wolffs et al.,2001,Biotechniques 766:769-771;Tsourkas et al.,2002,Nucleic AcidsResearch.30:4208-4215;Riccelli et al.,2002,Nucleic Acids Research30:4088-4093;Zhang et al.,2002Shanghai.34:329-332;Maxwell et al.,2002,J.Am.Chem.Soc.124:9606-9612;Broude et al.,2002,Trends Biotechnol.20:249-56;Huang et al.,2002,Chem Res.Toxicol.15:1 18-126;和Yu et al.,2001,J.Am.Chem.Soc 14:1 1 155-1 1 161中描述的。标记探针还可以包括黑洞淬灭剂(Biosearch)、Iowa Black(IDT)、QSY淬灭剂(MolecularLabeling probes)、以及Dabsyl和Dabcel磺酸盐/羧酸盐淬灭剂(Epoch)。标记探针还可以包括两种标记探针,其中例如荧光团在一种探针上,以及淬灭剂在另一种探针上,其中两种标记探针一起杂交在靶标上淬灭信号,或者其中在靶标上杂交通过荧光变化改变信号特征。标记探针还可以包括带有磺酸基而不是羧酸基的荧光素染料的磺酸盐衍生物、荧光素的亚磷酰胺形式、CY5的亚磷酰胺形式(例如可从Amersham购买)。
如本文所用的,术语“核酸样品”指存在于按照本教导的生物样品中的核酸。预期可以有创性或无创性收集样品。样品可以在纤维、织物、香烟、口香糖、粘性材料、土壤或无生命物之上、之中、之内、来自这些物质或者被发现与这些物质结合。本文所用的“样品”以其广义来使用,指包含核酸的样品,基因靶标或靶多核苷酸可以来源于所述核酸。样品可以包括细胞、从细胞分离的染色体(例如,分散的中期染色体)、基因组DNA、RNA、cDNA等。样品可以是动物或植物来源的,包括含有核酸的任何生物体,包括但不限于植物、牲畜、家养宠物和人类样品,以及可以来自多种来源。这些来源可以包括但不限于全血、毛发、血液、尿液、组织活检、淋巴、骨骼、骨髓、牙齿、羊水、毛发、皮肤、精液、肛门分泌物、阴道分泌物、汗液、唾液、颊拭子、多种环境样品(例如农业的水和土壤)、研究样品、纯化样品和裂解的细胞。应认识到,利用本领域已知的多种样品制备方案的任一种,例如包括利用如机械力、超声波降解法、限制性内切核酸酶裂解这类操作方法、或本领域已知的任何方法,可以将含靶多核苷酸序列的核酸样品从样品中分离。
如本文所用的术语“靶多核苷酸”、“基因靶标”等在本文可互换使用,指感兴趣的特定核酸序列。“靶标”可以是寻求扩增的多核苷酸序列,并且能够在其他核酸分子存在的情况下存在或者可以存在于更大核酸分子内。靶多核苷酸可以从任何来源获得,并且能够包含任何数量的不同的组成组分。例如,靶标可以是核酸(例如DNA或RNA)。靶标可以是甲基化的、非甲基化的、或两者都是。此外,应认识到,用于感兴趣的特定核酸序列语境下的“靶标”还指其替代物(例如扩增产物)以及天然序列。在一些实施方案中,感兴趣的特定核酸序列是来自降解源的短DNA分子,诸如可以在例如但不限于法医学样品中存在。本教导的感兴趣的特定核酸序列可以来自上文所述的多种生物体和来源的任一种。
如本文所用的,“DNA”指本领域所理解的多种形式的脱氧核糖核酸,诸如基因组DNA、cDNA、分离的核酸分子、载体DNA和染色体DNA。“核酸”指任何形式的DNA或RNA。分离的核酸分子的实例包括但不限于包含在载体中的重组DNA分子、维持在异源宿主细胞中的重组DNA分子、部分或基本上纯化的核酸分子以及合成的DNA分子。一般地,“分离的”核酸没有在核酸来源的生物体的基因组DNA中天然位于核酸侧翼的序列(即,位于核酸5'和3'端的序列)。而且,“分离的”核酸分子诸如cDNA分子通过重组技术产生时通常基本上没有其他细胞物质或培养基,或者通过化学方法合成时通常基本上没有化学前体或其他化学制品。
计算机和仪器系统
用于本教导基因分型数据分析的系统和方法的多种实施方案可以利用图2所示的方框图描绘的计算机系统的多种实施方案。
图2是方框图,举例说明了按照多种实施方案可以用于执行处理功能的计算机系统200,基于此可以实施本教导的实施方案。计算系统200可以包括一个或多个处理器,诸如处理器204。处理器204可以利用通用或专用处理引擎诸如例如微处理器、控制器或其他控制逻辑单元被应用。在该实例中,处理器204与总线202或其他通信媒介连接。
此外,应认识到,图2的计算系统200可以体现为多种形式的任何一种,诸如机架式计算机、主机、超级计算机、服务器、客户端、台式电脑、手提电脑、平板电脑、手持式计算装置(例如PDA、手机、智能手机、掌上电脑等)、集群网格、上网本、嵌入式系统、或者可以满足或适合给定应用或环境的任何其他类型的专用或通用计算装置。另外,计算系统200可以包括常规网络系统,包括客户端/服务器环境以及一种或多种数据库服务器、或与LIS/LIMS基础结构整合。包括局域网(LAN)或广域网(WAN)、以及包括无线和/或有线组件的多种常规网络系统是本领域已知的。另外,客户端/服务器环境、数据库服务器和网络在本领域有很好的记载。
计算系统200可以包括总线202或其他用于信息通信的通信机构、以及与总线202连接用于处理信息的处理器204。
计算系统200还包括存储器206,其可以是与总线202连接的随机存取存储器(RAM)或其他动态存储器,用于储存待被处理器204执行的指令。存储器206还可以在待被处理器204执行的指令执行期间,用于储存临时变量或其他中间信息。计算系统200还包括与总线202连接的只读存储器(ROM)208或其他静态存储设备用于储存静态信息和处理器204的指令。
计算系统200还可以包括存储设备210,诸如磁盘、光盘、或固态硬盘(SSD),其被提供与总线202连接用于储存信息和指令。存储设备210可以包括介质驱动器和可移动存储接口。介质驱动器可以包括驱动器或支持固定的或可移动存储介质的其他机构,诸如硬盘驱动器、软盘驱动器、磁带驱动器、光盘驱动器、CD或DVD驱动器(R或RW)、闪盘驱动器或其他可移动或固定的介质驱动器。如这些实例所阐明的,存储介质可以包括计算机可读存储介质,其中已经储存了特定的计算机软件、指令和/或数据。
在可选的实施方案中,存储设备210可以包括允许计算机程序或其他指令或数据加载到计算系统200的其他类似的机构。这种机构可以包括例如可移动存储单元和接口诸如程序盒和盒式接口、可移动存储器(例如闪速存储器或其他可移动存储器模块)和存储器插槽、以及允许软件和数据从存储设备210转移至计算系统200的其他可移动存储单元和接口。
计算系统200还可以包括通信接口218。通信接口218可以用于允许软件和数据在计算系统200和外部设备之间传输。通信接口218的实例可以包括调制解调器、网络接口(诸如以太网或其他NIC卡)、通信端口(诸如例如USB端口、RS-232C串行端口)、PCMCIA插槽和卡、蓝牙等。通过通信接口218传输的软件和数据为信号的形式,其可以是能够被通信接口218接收的电、电磁、光学或其他信号。这些信号可以通过诸如无线介质、电线或电缆、光纤、或其他通信介质的通道被通信接口218传送和接收。通道的一些实例包括电话线、移动电话链路、RF链路、网络接口、局域网或广域网以及其他通信通道。
计算系统200可以通过通信接口218与显示器212通信,用于将信息显示给计算机用户,所述显示器诸如阴极射线管(CRT)、液晶显示器(LCD)以及发光二极管(LED)显示器。在多种实施方案中,计算系统200可以通过总线与显示器连接。包括字母数字和其他键的输入设备214与总线202连接用于将信息和命令选择传递给例如处理器204。输入设备还可以是配置有接触式屏幕输入功能的显示器,诸如LCD显示器。另一类用户输入设备是光标控制器216,诸如鼠标、轨迹球或光标方向键,用于将方向信息和命令选择传递给处理器204以及用于控制光标在显示器212上的移动。该输入设备通常具有在两个轴(第一轴(例如,x)和第二轴(例如,y))上的两个自由度,这允许该设备在平面上指定位置。计算系统200提供数据处理以及提供这类数据的置信水平。与本教导的实施方案的某些实施一致,计算系统200响应执行容纳在存储器206内的一条或多条指令的一个或多个序列的处理器204,提供数据处理和置信值。这种指令可以从诸如存储设备210的另一计算机可读介质读取到存储器206。存储器206容纳的指令序列的执行导致处理器204执行本文描述的进程状态。可选地,硬接线电路可以用于代替软件指令或与软件指令组合来实施本教导的实施方案。因此,本教导实施方案的实施不局限于硬件电路和软件的任何具体的组合。
本文所用的术语“计算机可读介质”和“计算机程序产品”一般指参与提供一条或多条序列或一条或多条指令给处理器204来执行的任何介质。这种指令一般被称为“计算机程序代码”(其可以被归类为计算机程序形式或其他类别),其被执行时能够使计算系统200运行本发明的实施方案的特征或功能。这些和其他形式的计算机可读介质可以采用许多形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如固态盘、光盘或磁盘,诸如存储设备210。易失性介质包括动态存储器,诸如存储器206。传输介质包括同轴电缆、铜线和光纤,包括与总线202的连通。
计算机可读介质的常见形式包括例如软盘、软磁盘(flexible disk)、硬盘、磁带或任何其他的磁性介质,CD-ROM、任何其他的光学介质,打孔卡、纸带、任何其他的有孔模式的物理介质,RAM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或磁片盒,后文描述的载波、或者计算机可以读取的任何其他介质。
多种形式的计算机可读介质可以参与将一条或多条指令的一条或多条序列运载到处理器204执行。例如,指令最初可以携带在远程计算机的磁盘上。远程计算机可以将指令加载到它的动态存储器内,并且利用调制解调器通过电话线发送指令。计算系统200本地的调制解调器可以接收电话线上的数据并利用红外发射器将数据转换为红外信号。与总线202连接的红外检测器可以接收红外信号携带的数据并将数据置于总线202上。总线202将数据运载到存储器206,处理器204从存储器206检索并执行指令。由存储器206接收的指令可以任选地在处理器204执行之前或之后储存在存储设备210上。
本领域的技术人员会认识到,根据需要利用硬件、软件、固件或其组合可以实施多种实施方案的操作。例如,在软件、固件或硬接线逻辑单元的控制下,可以利用处理器或其他数字电路实施一些处理。(如本领域技术人员所认识到的,本文的术语“逻辑单元”指固定的硬件、可编程逻辑单元和/或其合适的组合以完成所述的功能)。软件和固件可以储存在计算机可读介质上。一些其他的处理可以利用本领域普通技术人员熟知的模拟电路来实施。另外,存储器或其他存储装置,以及通信组件可以应用在本发明的实施方案中。
应认识到,出于清楚的目的,上面的说明已经结合不同的功能单元和处理器描述了本发明的实施方案。然而,显而易见地,可以使用不同功能单元、处理器或域间的任何适当的功能分配,而不脱离本发明。例如,通过单独的处理器或控制器运行的所示功能可以通过同一处理器或控制器来运行。因此,提及的具体功能单元仅被视为用于提供所述功能的合适元件的参考,而不是表明严格的逻辑或物理结构或组织。
本教导用于基因分型数据分析的方法和系统的多种实施方案可以利用如图3所示的方框图中描绘的循环仪器的多种实施方案。
图3是方框图,举例说明了定量聚合酶链式反应(qPCR)仪器300,基于此可以实施本教导的实施方案。PCR仪器300可以包括加热盖330,其置于包含在样品支持装置(未显示)中的多个样品340之上。在多种实施方案中,样品支持装置可以是具有多个样品区的玻璃、金属或塑料载片,该样品区在样品区和加热盖330间具有盖。样品支持装置的一些实例可以包括但不限于,多孔板诸如标准的微量滴定96-孔板、384-孔板,每一分析能够处理数以千计的样品的微装置诸如多种微流体装置、微卡装置和微芯片装置。样品支持装置多种实施方案中的样品区可以包括凹陷、缺口、小孔、凸脊和其组合,在基质表面形成规则或不规则阵列的图案。qPCR仪器的多种实施方案包括样品模块350、用于加热和冷却的元件360、热交换器370、控制系统380和用户界面390。在本教导中,提及了终点分析。对于专用于进行终点分析的PCR仪器而言,直至热循环结束时才进行检测。这种PCR仪器通常不包括成像仪310和光学件320。
对于图3所示的qPCR仪器,在生物样品分析的运行时间进行检测。检测系统可以具有发射电磁能的照明源(未显示)、用于接收来自样品支持装置中样品340的电磁能的检测器或成像仪310、以及用于指引来自每一样品的电磁能到成像仪310的光学件320。对于按照本教导的PCR仪器的实施方案,控制系统380可以用于控制检测系统、加热盖和热模块组件的功能。终端用户可以通过用户界面390接近控制系统380。另外,如图2所示的计算机系统200可以起到为本教导的多种PCR仪器提供控制功能的作用,以及提供用户界面功能。此外,图2的计算机系统可以提供数据处理、显示和报告准备功能。所有这些仪器控制功能可以专用于本地的PCR仪器,或者图2的计算机系统200可以提供部分或全部控制、分析和报告功能的远程控制。
如以前提及的,本教导的系统和方法的多种实施方案可以具有直接控制热循环仪器并与其通信的计算机。本教导用于分析基因分型数据的方法和系统的多种实施方案可以利用联网热循环仪器的多种实施方案,如图4所示。
图4是用于联网qPCR仪器的系统400的图,基于此可以实施本教导的实施方案。系统400包括网络410、两个或更多个qPCR仪器420以及处理器430。两个或更多个qPCR仪器420和处理器430通信。该通信可以包括例如数据或控制信息的交换。
处理器430可以接收来自两个或更多个qPCR仪器420中每个的标记探针强度。换句话说,处理器430能够基本上在同一时间监测来自两个或更多个qPCR仪器420的两个或更多个实验。处理器430和两个或更多个qPCR仪器420间的通信不局限于PCR探针强度,处理器430可以发送和接收用于控制两个或更多个qPCR仪器420的PCR实验文件以及由两个或更多个qPCR仪器420生成的任何数据。图4表明系统400提供处理器430和两个或更多个qPCR仪器420间的一对多的关系。
在多种实施方案中,系统400提供了一个qPCR仪器和两个或更多个处理器(未显示)之间的一对多关系。例如,系统400允许一个qPCR仪器将来自PCR实验的相同测量的探针强度发送到两个或更多个处理器。换句话说,系统400允许一个qPCR仪器被两个或更多个处理器监测。
在多种实施方案中,处理器430显示与网络410连接的所有PCR仪器的列表。该列表可以用于例如选择仪器主动监测。该列表可以接着展示当前被监测的仪器的窗口显示。在多种实施方案中,在PCR实验创建期间,该列表还可以用于选择进行实验的仪器。处理器430通过创建包括实验的所有参数的文件而创建用于两个或更多个qPCR仪器420中一个或多个的实验。然后将该文件通过网络410发送到两个或更多个qPCR仪器420中的一个。例如与网络连接的所有PCR仪器的列表是在用于输入实验文件信息的屏幕上的下拉式选择列表。
在多种实施方案中,处理器430显示了它主动监测的两个或多个PCR仪器的列表。该列表可以用于选择仪器,从该仪器可以获得关于PCR实验的其他状态信息。
在多种实施方案中,处理器430可以用于创建按序在同一PCR仪器上运行的两个或更多个实验。例如,这两个或更多个实验是成批实验。为包括例如能够相继加载两个或更多个样品板的机械臂的PCR仪器创建成批实验。例如,处理器430显示一个或多个可选择的参数,其可以用于创建将以成批模式运行的两个或更多个PCR实验。可选地,在多种实施方案中,处理器430提供命令行接口,其可以用于创建将以成批模式运行的两个或更多个PCR实验。
在多种实施方案中,处理器340显示能够使数据文件从PCR实验自动输出的可选择参数。一般地,qPCR仪器储存来自PCR仪器上的实验的输出数据。然后通过利用处理器诸如处理器430访问qPCR仪器并索取数据,来检索该输出。在成批处理中,通过指示qPCR仪器在实验结束时自动发送输出数据到处理器430,可以增加通量。例如,可以通过在处理器430创建的实验文件中置入一个参数,指示qPCR仪器输出文件。除了索取输出数据文件的输出,处理器430还可以指定其他参数,其包括但不限于输出文件的命名约定和输出数据应被发送到的存储介质上的位置。例如,命名约定可以包括将条形码的板号添加至输出数据文件名。
在多种实施方案中,处理器430可以显示窗口,其中可以指定偏爱的日期、时间和数据的数字间隔模式。
在多种实施方案中,处理器430可以显示允许包括校正信息的文件被选择用于创建的特定PCR实验的窗口。
在多种实施方案中,处理器430可以显示基因表达实验的可选择的样品类型列表,可以显示可选择的基因靶标列表,以及可以将每一选择的基因靶标的循环阈值标绘为样品类型的函数作为质量控制。
尽管结合网络系统的多种实施方案详述了上文的实施方案,但本领域的普通技术人员会认识到,本教导可以应用于与处理器、存储器和显示器通信的单个qPCR仪器。
可视化工具:qPCR数据的动态显示
如上所述,尽管PCR系统接收和分析数据,但它们通常仅在终点或PCR实验结束后显示有用或有差别的信息。例如,在基于定量PCR的基因分型中,可以在每一循环的运行时间动态获得两个等位基因特异性标记探针的强度数据。一般地,作为扩增图谱来查看该qPCR数据。扩增图谱显示了针对具有循环数间隔的时间标绘的多个样品的一个等位基因特异性标记探针的强度,以方便终端用户。如循环仪器领域的普通技术人员所获悉的,可以利用多种操作方案从检测器收集数据,并且随着时间采集。然而,扩增图谱通常不显示等位基因鉴别程度。
传统上,等位基因鉴别程度已经在仅利用终点数据的等位基因鉴别图谱中显示。例如,等位基因鉴别图谱显示针对多个样品的第二等位基因特异性标记探针强度标绘的相同多个样品的第一等位基因特异性标记探针的强度。等位基因鉴别图谱中的等位基因鉴别程度显示为数据群集之间的距离。此外,等位基因鉴别图谱还可以显示聚类算法的结果,其通过标记具有分型的等位基因值的群集进行基因型分型。
图5是示例性的扩增图谱500,基于此可以实施本教导的实施方案。例如,展示在图5中的强度是等位基因特异性标记探针的强度以提供荧光检测。图谱500中大量样品的等位基因特异性标记探针的扩增是明显的。然而,等位基因鉴别程度是不明显的。
图6是来自生成图5数据的同一实验的终点数据的示例性等位基因鉴别图谱600,其中等位基因鉴别是明显的,基于此可以实施本教导的实施方案。图谱600中的等位基因鉴别程度从数据群集610、620和630间的距离看来是明显的。此外,利用例如基因分型聚类算法,图谱600所示的数据被进行其他处理以使得样品被明确标记为不确定的640、第一等位基因650、第二等位基因660、两种等位基因670或无模板对照(NTC)680。尽管图谱600的终点数据展示了等位基因鉴别程度,但并非所有终点数据都保证能展示类似结果。
图7是来自不同PCR实验的终点数据的示例性等位基因鉴别图谱700,其中等位基因鉴别是不明显的,该实验利用与用于生成图5数据的样品相同的样品,基于该图可以实施本教导的实施方案。例如,利用不同的测定设计或不同的样品制备,可以生成图7的图谱700的数据以及图6的图谱600的数据。图7的图谱700几乎没有显示等位基因鉴别,几乎所有样品值都位于一个大区域710中。此外,聚类算法将图谱700中所有数据点标记为不确定的。
按照本教导的多种实施方案,扩增图谱所示的时间维度(经常显示为循环数)可以被添加至等位基因鉴别图谱的等位基因鉴别能力,从而增加诸如在图6所示的鉴别明显的结果的置信度,或者检验诸如在图7所示的那些的不确定的结果。在对应的两个或更多个时间时的两个或更多个等位基因鉴别图谱可以连续显示,从而展示作为循环数函数的等位基因鉴别的进展。例如,这两个或更多个等位基因鉴别图谱可以在用户控制下以用户界面提供的互动过程来显示,或者作为用户选择将基于时间的数据显示为视频。这两个或更多个等位基因鉴别图谱可以在数据收集的运行时间动态显示,或者在数据收集后从储存的数据显示。图8-10是对应于热循环三个不同时间的三个等位基因鉴别图谱,其展示了作为循环数函数的等位基因鉴别的进展。按照本教导的多种实施方案,一旦数据被储存,它可以在用户选择的任何时间被检验。在多种实施方案中,时间可以显示为循环数。
图8是按照本教导的多种实施方案的示例性的等位基因鉴别图谱800,其利用图6的数据生成。在图8中,显示了按照本教导的图形用户界面,其呈现给用户通过选择循环数来选择时间,显示循环数为30。图谱800显示了在循环数30时,数据群集是定义明确的,即便它们之间的距离是短的。
该数据的置信度或质量值也显示在图谱800中。样品表820提供每一样品的单元格,其中可以显示关于样品的多个信息,如下文更详细讨论的。例如,在单元格830中,显示了特定样品的90%的置信值。例如,样品表820可以包括所有样品的置信值(未显示)。图谱800还包括空白对照值或无模板对照(NTC)值840。按照多种实施方案,可以通过阴性对照来限定原点。阴性对照可以被称为无模板对照(NTC),其为不含感兴趣的靶基因组座位的样品。对于基因分型测定的多种实施方案,阴性对照或NTC可以不含寡核苷酸物质,以及可以包含例如但不限于与被测定的生物样品等同体积的所有试剂。按照基因分型测定的其他实施方案,NTC可以包含例如但不限于被确认不含被测定的靶基因组座位序列的寡核苷酸样品。如本领域的普通技术人员获悉的,这种NTC样品仍然可以产生可以被检测的背景信号。在这方面,一个或多个NTC样品可以用于限定原点以及基线,从所述原点和基线可以确定发射三个可能等位基因每个的离散信号集的样品角度。在多种实施方案中,多个NTC样品可以用于确定原点和与其关联的基线。如本领域普通技术人员所获悉的,可以存在从多个NTC样品处理数据的多种方法以确定原点值,包括但不限于确定多个NTC样品的平均值、中值和形心。NTC 840用于确认如果不存在样品则不会发现强度。
置信度或质量值还可以被显示为信息列表的一部分。线850显示了90%的置信度或质量值列表,以及孔标签、每一等位基因的强度值和基因型分型。例如,可以显示所有样品的线(未显示)。
图9是来自生成图6数据的同一实验的循环数为35的示例性等位基因鉴别图谱900,基于此可以实施本教导的实施方案。图谱900表明循环数为35时,数据群集仍是定义明确的,并且群集间的距离在增加。单元格830所示的样品的置信值更高。
图10是来自生成图6数据的同一实验的循环数为40的示例性等位基因鉴别图谱1000,基于此可以实施本教导的实施方案。图谱1000表明循环数为40时,数据群集仍是定义明确的,并且群集间的距离甚至增加更多。单元格830所示的样品的置信值仍更高。
图8-10表明,响应来自终端用户的输入显示两个或更多个等位基因鉴别图谱可以提供额外的信息,并使多个额外或可选的处理步骤成为可能。例如,图8-10使用户相信图6所示的终点数据是正确的。
此外,在整个反应进程中显示的定义明确的群集和高置信值可以表明,图6和8-10的PCR实验在低于通常的运行40循环时可以产生可信的结果,例如少至30或35个循环。因此,可以通过将两个或更多个等位基因鉴别图谱看作时间函数来改进和提高基因分型鉴别的某些测定。在多种实施方案中,如果具有高置信度的良好结果被PCR系统在热循环时识别,它可以停止运行并进行基因型分型。该自动步骤可以通过减少基于qPCR数据的热循环时间增加实验通量。
另外,图8-10所示的实例包括通过基因分型算法生成的等位基因标签。在多种实施方案中,两个或更多个等位基因鉴别图谱可以显示为时间的函数,并不包括来自基因分型算法的信息。因此,利用本教导的多种实施方案分析数据可以提供给终端用户手动进行基因型分型的能力。例如,通过利用显示的信息,诸如定义明确的群集、群集间的距离和置信值,可以提供给终端用户进行基因型分型的充分信息。
最后,在一个传统基因分型工作流程中,在任一热循环运行前,利用qPCR仪器读取每一样品的等位基因特异性标记探针的强度,其常被称为预读取数据采集。然后将样品在PCR仪器上循环固定循环数,该PCR仪器不包括读取样品的等位基因特异性标记探针强度的性能。固定循环数之后,将样品返回到qPCR系统,并进行后读取或终点数据采集。在此类工作流程中,可以通过比较后读取和预读取数据采集的等位基因鉴别图谱,进行基因型分型。在多种实施方案中,显示来自qPCR系统的两个或更多个等位基因鉴别图谱可以排除基因分型流程中的后读取和预读取数据采集的需要。两个或更多个等位基因鉴别图谱可以提供足够的进行基因型分型的信息。
图8-10显示了作为循环数函数的等位基因鉴别在三个单独图谱的进展。在多种实施方案中,这三个单独图谱中提供的信息可以集合显示在一个图谱中。例如,图8-10的数据可以绘制在一个等位基因鉴别图谱上,可以在不同循环数值间画线。这些线可以被称为轨迹线。
图11是来自生成图5数据的同一实验的循环数为40的示例性等位基因鉴别图谱1100,其显示了代表来自先前循环数的数据的轨迹线1110,基于此可以实施本教导的实施方案。轨迹线1110显示了等位基因鉴别随循环数的进展。例如,在多种实施方案中,受用户的控制,可以将轨迹线1110添加至图谱1000或从图谱1000去除。
图谱1100中的数据以笛卡尔坐标显示。在多种实施方案中,该数据可以以极坐标绘制。例如,极坐标与一些聚类算法更相关。
轨迹线1110会合于在原点1120处的第一循环数的数据。该会合表明,在热循环开始时极少或没有观察到强度。传统地,通过将空白对照或NTC添加到板孔提供了类似的信息。因此,在多种实施方案中,提供早期循环数的轨迹线可以取消对空白对照或NTC的需要。取消空白对照或NTC增加样品在板上的空间,由此增加实验通量。
图谱1100显示了来自观察基因组的一个特定位点的结果。在多种实施方案中,图谱1100可以显示从基因组的两个或更多个位点的分析产生的数据。例如,该数据称为复用数据。例如,来自基因组每一位点的数据的轨迹可以具有不同的原点。来自基因组每一位点的数据的轨迹还可以具有不同的强度范围。
在数据显示前,对图8-10中所示的数据运行聚类算法。如上所述,取决于每一循环数显示的数据的置信度,可以进行基因型分型。类似地,在多种实施方案中,等位基因鉴别图谱的轨迹可以聚集成组,并且这些组可以用于进行基因型分型。例如,可以利用杂交递归匹配(HRM)算法。
一般地,聚类算法需要将一定数目的样品聚集在一起以能够进行基因型分型。例如,在单核苷酸多态性(SNP)基因分型中,给定的测定可以需要24个样品以便将样品聚集为两个纯合群和一个杂合群。在多种实施方案中,可以从单个轨迹线进行基因型分型。例如,直线移动而后向右倾斜的轨迹可以称为第一等位基因纯合的,直线移动而后向左倾斜的轨迹可以称为第二等位基因纯合的,以及没有弯曲的轨迹可以称为杂合的。这种类型的轨迹模式识别可以取消对数据聚类算法的需求。
在多种实施方案中,分析等位基因鉴别图谱的轨迹可以用于援救稀有SNP。带有稀有SNP时,几乎所有轨迹都是纯合的。因此,样品值靠近在一起,聚类算法对群集分型没有基础。然而,轨迹线显示所有数据点在同一点开始,并且在一个方向移动。因此,可以从轨迹线进行基因型分型。
在多种实施方案中,显示等位基因鉴别进展的图谱可以用于检验不确定的结果或援救宝贵的样品。图7是提供了不确定结果的终点数据的等位基因鉴别图谱。然而,因为图6从用于图5的相同样品绘制,所以已知对这些样品进行基因分型是可能的。
图12是来自生成图6数据的同一实验的循环数为40的示例性等位基因鉴别图谱1200,其显示了代表来自先前循环数的数据的轨迹线1210,基于此可以实施本教导的实施方案。轨迹线1210表明三个群集在早期循环数时的确是分离的。因此轨迹线1210可以用于检验图7的数据。如果图7的数据从宝贵样品生成,图12的轨迹线1210可以用于援救这些数据。宝贵样品是提供极小样品输入的样品。例如,宝贵样品包括来自法医学、几个细胞或激光捕获显微切割术的样品。在多种实施方案中,通过允许循环数的选择成为具有允许基因型分型的足够质量的数据,轨迹线1210用于援救来自宝贵样品的数据。然后将该循环数的数据用于基因型分型。
图12显示数据群集在热循环期间分离,然后接近结束时再次会合。没有显示等位基因鉴别随着循环数的进展,该分离和会合是不明显的。在多种实施方案中,PCR系统在PCR运行期可以自动监测分离和会合。例如,如果发现从分离到会合的转变,PCR系统可以调整热循环以增加分离。例如,PCR系统可以增加退火温度。
在按照本教导的系统和方法的多种实施方案中,提供基因分型数据动态显示的用户界面包括提供样品表和基因分型数据图谱间互动作用的特征。在多种实施方案中,这种样品表可以具有与表中出现的每一样品相关的大量信息。按照多种实施方案,信息可以涉及与每一样品有关的广泛属性。在多种实施方案中,这种样品属性可以包括但不限于样品、生物分组、靶标、任务、输入质量、时间、时间单位、样品来源、处理以及终端用户的评价。对于多种实施方案,与样品表中每一样品有关的信息可以涉及样品在qPCR仪器上运行的操作方案。在本教导的系统和方法的多种实施方案中,终端用户可以以任何希望的方式选择样品表上出现的一个样品或多个样品;每一样品具有与其相关的丰富的样品信息,以及所选的一个样品或多个样品可以在基因分型数据图谱上显示。按照多种实施方案,终端用户可以滚动样品表中输入的样品,并且观察与每一样品相关的信息。在这方面,通过这种可视化工具,终端用户可以动态地理解多种实验条件对基因分型实验结果的影响。
例如,在图13A-13C中,显示了在基因分型实验中分析的多个样品的数据。在图13A中,三群样品1310、1320和1330分别代表纯合的(2/2)、纯合的(1/1)、和杂合的(1/2)样品群集。本领域的普通技术人员会认识到,样品表代表分析多达384个样品的测定模式,其中每一样品出现在为行和列以字母数字命名的单元格中。如可以从样品表中看到的,有91个分析的样品(U=未知)、2个无模板对照(N)以及被分析的靶基因的三个阳性对照(1/1,2/2,和1/2)。在图13B中,终端用户可以选择特定的样品组,并且突出它们用于在图谱上观察和分析。在图13C中,终端用户可以选择样品表上的特定感兴趣区,以及相关的样品被显示在图谱上。在多种实施方案中,终端用户可以滚动样品表并观察与每一样品有关的信息(未显示)。以这种方式,终端用户可以获得对影响基因分型结果的条件的快速分析。
按照本教导的系统和方法的多种实施方案,在基因分型测定的整个运行过程中采集的qPCR数据集提供了多个样品中每一样品随着时间进程的快照(snap-shot)。在本教导的系统和方法的多种实施方案中,响应终端用户的输入呈现的可视化工具可以提供基因分型数据的逐步显示,或者它可以提供以视频运行的显示。在按照本教导的多种实施方案中,这种可视化工具可以为终端用户提供作为时间函数的所有数据的动态回顾,以助于基因分型数据的分析。
例如,图14A代表了完成的分析,其中三个数据群集1610、1620和1630已被明确分型。然而,群集1615和1625没有被用于分析基因分型数据的算法分型,代表了终点数据集中6个未分型的样品。如图14B中所示,终端用户可以选择时间(为了方便终端用户,以循环数表示)来观察在早于终点时间的时间时样品的状态。如观察图14B所看到的,在循环数为34时,样品集中没有通过基因分型算法作出可信分型的样品数目减少到3个未分型的样品。最后,在图14C中,在循环数为30时,未分型的样品数减少到2个样品。尽管出于解释的目的,图14A-14C以颠倒的时间顺序呈现,但按照本教导的系统和方法的多种实施方案,终端用户可以以任何顺序选择多个样品基因分型测定进程的任何时间段。另外,本领域技术人员会认识到,尽管这些数据通过选择少于40个循环表示的时间示例对结果的改善,但在某些情况下,对于运行更多循环数的多个样品,分析结果也可以提高。例如,对于稀有或受损样品中的基因靶标,终端用户可以选择多于40个循环的操作方案。在这种情况下,利用按照本教导的可视化工具的多种实施方案,可以利用所有的数据进行分析。
出于举例和说明的目的,已经呈现了本教导的多种实施。它们不是穷举的,并不将本教导局限于公开的确切形式。相反,正如本领域的技术人员所认识到的,本教导包括多种替代选择、变型和等同物。结合上述教导,变型和改变是可能的或者可以从实施本教导中获得变型和改变。另外,描述的实施包括软件,但本教导可以以硬件和软件的组合或以单独的硬件来实施。本教导可以用面向对象的和非面向对象的程序化系统来实施。
此外,在描述多种实施方案中,说明书可能以特定的步骤顺序呈现方法和/或过程。然而,只要方法或过程不依赖于本文所列的特定步骤顺序,该方法或过程不应局限于所述的特定步骤顺序。如本领域普通技术人员认识到的,其他步骤顺序是可能的。因此,说明书中所列的特定步骤顺序不应解释为对权利要求的限制。此外,涉及方法和/或过程的权利要求不应局限于以所写的顺序执行它们的步骤,并且本领域技术人员能够容易地认识到,顺序可以变化并仍在多种实施方案的精神和范围内。

Claims (16)

1.用于基因分型数据的可视化工具的计算机实现方法,所述方法包括:
通过处理器接收第一时间的第一数据集,其中所述第一数据集包含第一探针的第一强度信号和第二探针的第一强度信号;
通过处理器接收第二时间的第二数据集,其中所述第二数据集包含第一探针的第二强度信号和第二探针的第二强度信号;
在计算机上处理所述数据集以分析基因分型数据,所述处理包括:用可视化工具呈现给终端用户,其中所述可视化工具提供选自以下的数据的动态显示:通过处理器从所述第一数据集生成第一图谱,并显示所述第一图谱;以及通过处理器从所述第二数据集生成第二图谱,并显示所述第二图谱;其中所述数据的动态显示提供基因分型数据的分析。
2.如权利要求1所述的计算机实现方法,其中所述数据的动态显示的选择响应于终端用户的输入。
3.如权利要求2所述的计算机实现方法,其中所述终端用户的输入是所述数据显示的逐步选择。
4.如权利要求2所述的计算机实现方法,其中所述终端用户的输入是所述数据视频显示的选择。
5.如权利要求1所述的计算机实现方法,其中所述处理器与热循环仪器通信。
6.如权利要求5所述的计算机实现方法,其中所述处理器在热循环已完成后接收所述第一数据集和所述第二数据集。
7.如权利要求5所述的计算机实现方法,其中所述处理器在热循环期间接收所述第一数据集和所述第二数据集。
8.如权利要求1所述的计算机实现方法,其中所述显示包含所述第一数据集和所述第二数据集间的轨迹线。
9.用于基因分型数据的可视化的系统,其包含:
处理器;以及
与所述处理器通信的存储器,所述存储器储存用于以下的指令:
通过所述处理器接收第一时间的第一数据集,其中所述第一数据集包含第一探针的第一强度信号和第二探针的第一强度信号;
通过所述处理器接收第二时间的第二数据集,其中所述第二数据集包含第一探针的第二强度信号和第二探针的第二强度信号;
用可视化工具呈现给终端用户,其中所述可视化工具提供选自以下的数据的动态显示:通过所述处理器从所述第一数据集生成第一图谱,并显示所述第一图谱;以及通过所述处理器从所述第二数据集生成第二图谱,并显示所述第二图谱;其中所述数据的动态显示提供基因分型数据的分析。
10.如权利要求9所述的系统,其中所述数据的动态显示的选择响应于终端用户的输入。
11.如权利要求10所述的系统,其中所述终端用户的输入是所述数据显示的逐步选择。
12.权利要求10所述的系统,其中所述终端用户的输入是所述数据视频显示的选择。
13.如权利要求9所述的系统,其中所述处理器与热循环仪器通信。
14.如权利要求13所述的系统,其中所述处理器在热循环已完成后接收所述第一数据集和所述第二数据集。
15.如权利要求13所述的系统,其中所述处理器在热循环期间接收所述第一数据集和所述第二数据集。
16.如权利要求9所述的系统,其中所述显示包含所述第一数据集和所述第二数据集间的轨迹线。
CN201180024260.7A 2010-04-09 2011-04-08 qPCR基因分型数据的可视化工具 Active CN103069427B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US32274910P 2010-04-09 2010-04-09
US61/322,749 2010-04-09
PCT/US2011/031855 WO2011127454A2 (en) 2010-04-09 2011-04-08 VISUALIZATION TOOL FOR qPCR GENOTYPING DATA

Publications (2)

Publication Number Publication Date
CN103069427A CN103069427A (zh) 2013-04-24
CN103069427B true CN103069427B (zh) 2016-11-23

Family

ID=44761837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180024260.7A Active CN103069427B (zh) 2010-04-09 2011-04-08 qPCR基因分型数据的可视化工具

Country Status (6)

Country Link
US (4) US8572506B2 (zh)
EP (1) EP2556458B1 (zh)
JP (2) JP5908886B2 (zh)
CN (1) CN103069427B (zh)
SG (1) SG184480A1 (zh)
WO (1) WO2011127454A2 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103069427B (zh) * 2010-04-09 2016-11-23 生命技术公司 qPCR基因分型数据的可视化工具
EP3985676A1 (en) 2012-11-07 2022-04-20 Life Technologies Corporation Visualization tools for digital pcr data
KR20160025597A (ko) * 2013-06-28 2016-03-08 라이프 테크놀로지스 코포레이션 데이터 품질을 시각화하기 위한 방법 및 시스템
CN106233239B (zh) * 2014-03-03 2019-06-25 生命技术公司 用于传递数据获取和分析设定的图形用户接口系统和方法
JP6496417B2 (ja) * 2015-02-06 2019-04-03 ライフ テクノロジーズ コーポレーション 実験設計および分析のための方法およびシステム
US11004540B2 (en) 2015-06-05 2021-05-11 Life Technologies Corporation Determining the limit of detection of rare targets using digital PCR
WO2017015133A1 (en) * 2015-07-17 2017-01-26 Life Technologies Corporation Tool for visualizing pcr results
EP3703060A1 (en) * 2016-05-27 2020-09-02 Life Technologies Corporation Methods and systems for graphical user interfaces for biological data
CN108107024A (zh) * 2016-11-25 2018-06-01 苏州百源基因技术有限公司 一种智能化pcr仪
WO2019066238A2 (ko) * 2017-09-28 2019-04-04 주식회사 씨젠 증폭 데이터 표시 방법 및 장치
EP3844757A1 (en) * 2018-08-30 2021-07-07 Life Technologies Corporation Machine learning system for genotyping pcr assays
CN110176277A (zh) * 2019-06-06 2019-08-27 福州大学 一套基于图像识别技术的智能qPCR仪检测系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058517B1 (en) * 1999-06-25 2006-06-06 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6027880A (en) * 1995-08-02 2000-02-22 Affymetrix, Inc. Arrays of nucleic acid probes and methods of using the same for detecting cystic fibrosis
US6300063B1 (en) * 1995-11-29 2001-10-09 Affymetrix, Inc. Polymorphism detection
US6953663B1 (en) * 1995-11-29 2005-10-11 Affymetrix, Inc. Polymorphism detection
US7348181B2 (en) * 1997-10-06 2008-03-25 Trustees Of Tufts College Self-encoding sensor with microspheres
EP1078257A4 (en) 1998-05-09 2007-07-18 Iconisys Inc METHOD AND APPARATUS FOR COMPUTER-ASSISTED DIAGNOSIS OF RARE CELLS, INCLUDING FETAL CELLS
JP5138141B2 (ja) * 2000-05-19 2013-02-06 ルミネックス コーポレーション 核酸の検出用物質及び検出方法
US7197400B2 (en) * 2000-12-12 2007-03-27 Affymetrix, Inc. System and computer software products for comparative gene expression analysis
US20040138821A1 (en) * 2002-09-06 2004-07-15 Affymetrix, Inc. A Corporation Organized Under The Laws Of Delaware System, method, and computer software product for analysis and display of genotyping, annotation, and related information
US20050287575A1 (en) * 2003-09-08 2005-12-29 Affymetrix, Inc. System and method for improved genotype calls using microarrays
KR100601937B1 (ko) * 2003-12-26 2006-07-14 삼성전자주식회사 분별 프로브와 암플리콘 프로브가 고정화되어 있는 dna칩을 이용하여 유전자형을 판별하는 강건한 방법 및 이에사용되는 dna 칩
US20050255485A1 (en) * 2004-05-14 2005-11-17 Livak Kenneth J Detection of gene duplications
KR100601980B1 (ko) * 2005-01-04 2006-07-18 삼성전자주식회사 유전자형 데이터 분석 방법 및 장치
US7919242B2 (en) 2005-06-30 2011-04-05 Roche Molecular Systems, Inc. Light emission modifiers and their uses in nucleic acid detection, amplification and analysis
US7634363B2 (en) * 2005-12-07 2009-12-15 Affymetrix, Inc. Methods for high throughput genotyping
US7660675B2 (en) * 2006-07-24 2010-02-09 Agilent Technologies, Inc. Method and system for analysis of array-based, comparative-hybridization data
US7524942B2 (en) * 2006-07-31 2009-04-28 Agilent Technologies, Inc. Labeled nucleotide composition
US20080125979A1 (en) * 2006-10-13 2008-05-29 Zohar Yakhini Method and system for determining ranges for the boundaries of chromosomal aberrations
US8293684B2 (en) * 2006-11-29 2012-10-23 Exiqon Locked nucleic acid reagents for labelling nucleic acids
US8200440B2 (en) * 2007-05-18 2012-06-12 Affymetrix, Inc. System, method, and computer software product for genotype determination using probe array data
CA2710195A1 (en) * 2007-12-28 2009-07-09 Abbott Laboratories Allelic discrimination analysis using an efficiency related value (efr)
EP2406400B1 (en) * 2009-03-09 2016-07-13 Life Technologies Corporation Methods for the determination of a copy number of a genomic sequence in a biological sample
CN103069427B (zh) * 2010-04-09 2016-11-23 生命技术公司 qPCR基因分型数据的可视化工具
CN104937600B (zh) * 2012-09-14 2018-01-16 生命技术公司 为数字pcr实验设计者所用的方法和系统
US9624532B2 (en) * 2013-02-05 2017-04-18 Neil Gordon Ultra-sensitive detection of extremely low level biological analytes using electrochemical signal amplification and biosensor
US20140325418A1 (en) * 2013-04-30 2014-10-30 Microsoft Corporation Automatically manipulating visualized data based on interactivity
US20150058774A1 (en) * 2013-08-22 2015-02-26 Intuit Inc. Gesture-based visualization of financial data
US10372302B2 (en) * 2013-08-29 2019-08-06 Sui Yan Dimension based dynamic determination of visual analytics
US8806361B1 (en) * 2013-09-16 2014-08-12 Splunk Inc. Multi-lane time-synched visualizations of machine data events
US9576263B2 (en) * 2013-09-19 2017-02-21 Oracle International Corporation Contextualized report building
US10489711B1 (en) * 2013-10-22 2019-11-26 EMC IP Holding Company LLC Method and apparatus for predictive behavioral analytics for IT operations
US20150113460A1 (en) * 2013-10-23 2015-04-23 Wal-Mart Stores, Inc. Data Analytics Animation System and Method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058517B1 (en) * 1999-06-25 2006-06-06 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data

Also Published As

Publication number Publication date
EP2556458A2 (en) 2013-02-13
US10629290B2 (en) 2020-04-21
US8572506B2 (en) 2013-10-29
WO2011127454A2 (en) 2011-10-13
EP2556458B1 (en) 2020-06-03
US9390227B2 (en) 2016-07-12
SG184480A1 (en) 2012-11-29
CN103069427A (zh) 2013-04-24
US20110252353A1 (en) 2011-10-13
JP5908886B2 (ja) 2016-04-26
JP2016127825A (ja) 2016-07-14
US20140053095A1 (en) 2014-02-20
US10127348B2 (en) 2018-11-13
EP2556458A4 (en) 2016-03-16
JP2013523167A (ja) 2013-06-17
US20190130995A1 (en) 2019-05-02
WO2011127454A3 (en) 2011-12-29
US20170011165A1 (en) 2017-01-12

Similar Documents

Publication Publication Date Title
CN103069427B (zh) qPCR基因分型数据的可视化工具
Yan et al. Network approaches to systems biology analysis of complex disease: integrative methods for multi-omics data
CN106068330B (zh) 将已知等位基因用于读数映射中的系统和方法
US10108778B2 (en) Method and system for genome identification
Imbeaud et al. ‘The 39 steps’ in gene expression profiling: critical issues and proposed best practices for microarray experiments
US20050055193A1 (en) Computer systems and methods for analyzing experiment design
CN110257547A (zh) 基于kasp技术开发的玉米核心snp标记及其应用
US11227668B2 (en) Systems and methods for genotyping by angle configuration search
Quackenbush Extracting meaning from functional genomics experiments
JP2001178463A (ja) 類似発現パターン抽出方法及び関連生体高分子抽出方法
US20030077643A1 (en) Method for analyzing trait map
Rashmi et al. ENHANCED STRATEGY TO STUDY GENE BONDINGS
Varshney ENHANCED STRATEGY TO STUDY GENE BONDINGS.
KR100882899B1 (ko) 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체
Faisal Retrieval of Gene Expression Measurements with Probabilistic Models
Lee et al. Contrasting Cluster Mining in Microarray Data
Veeranki et al. Application of data science and bioinformatics in healthcare technologies
GUPTA BIOINFORMATICS APPROACH TO UNDERSTAND PLANT GENOMICS
Henckel Development of a software infrastructure to mine GeneChip expression data and to combine datasets from different Medicago truncatula expression profiling platforms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant