CN106715721A - 用于无创产前测试的数字pcr的设计 - Google Patents

用于无创产前测试的数字pcr的设计 Download PDF

Info

Publication number
CN106715721A
CN106715721A CN201580050951.2A CN201580050951A CN106715721A CN 106715721 A CN106715721 A CN 106715721A CN 201580050951 A CN201580050951 A CN 201580050951A CN 106715721 A CN106715721 A CN 106715721A
Authority
CN
China
Prior art keywords
chromosome
control
molecule
amplification
dpcr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580050951.2A
Other languages
English (en)
Other versions
CN106715721B (zh
Inventor
N.舍恩布伦纳
Y.C.台
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN106715721A publication Critical patent/CN106715721A/zh
Application granted granted Critical
Publication of CN106715721B publication Critical patent/CN106715721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Public Health (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)

Abstract

提供了用于确定用于检测来自怀有胎儿的女性的血浆样本中的染色体非整倍体的dPCR实验的设置的技术。可以使用关于样本、dPCR过程以及期望准确度的数据来确定该设置。此类设置可以包括用于dPCR实验的控制染色体分子的最小输入数目、用于预扩增程序的控制染色体分子的最小数目以及预扩增程序中的PCR循环的数目。这些设置可以用来满足由准确度数据指定的准确度。因此,可以将dPCR实验设计成在降低成本的同时实现期望的准确度,例如通过不使用比需要的更多的样本且不执行比需要的更多的预扩增或不执行比需要的更多的操纵。

Description

用于无创产前测试的数字PCR的设计
技术领域
本公开一般地涉及数字式PCR,并且更具体地涉及设计用于执行无创产前测试的数字式PCR实验(例如,确定预扩增循环的数目)。
背景技术
数字式PCR(dPCR)是用于无创产前测试([1]、[2]、[3]、[4])的简单、快速而且准确的技术。然而,尚未有用于设计此应用中的dPCR实验的任何很好地确立的统计工具。某些现有方法(例如,[1]和[7])尚未考虑此应用中特定的重要量。
例如,参考文献[1]提供了一种估计分区数的方法,其假设阳性隔室的比例是1/3以便以5%假阳性率检测非整倍体(aneuploidy)。除其它的之外,其方法并未考虑假阴性比率,并且未考虑预扩增步骤。参考文献[7]提供了用于dPCR精度的公式(可以以小于1%的假阳性和小于1%的假阴性可靠地检测的最小浓度差)。其环境处于SNV检测和拷贝数差异中,并且其未考虑胎儿分数。其也未考虑预扩增步骤。
因此,需要用于设计用于产前测试的dPCR实验的改善的系统和方法。
发明内容
本发明的实施例提供了用于确定用于检测来自怀有胎儿的女性的血浆样本中的染色体非整倍体的dPCR实验的设置的技术。可以使用关于样本、dPCR过程以及期望准确度的数据来确定该设置。此类设置可以包括用于dPCR实验的控制染色体分子的最小输入数目、用于预扩增程序的控制染色体分子的最小数目以及预扩增程序中的PCR循环的数目。这些设置可以用来满足由用于该应用的要求所指定的准确度。因此,可以将dPCR实验设计成在降低成本的同时实现期望的准确度,例如通过不使用比需要的更多的样本且不执行比需要的更多的预扩增。
在一个方面,提供了一种确定用于涉及到来自怀有胎儿的女性的血浆样本中的DNA分子的预扩增的数字式PCR(dPCR)实验的设置的方法,所述dPCR实验用于检测染色体非整倍体,该方法包括:在计算机系统处接收数据,该数据包括测试染色体和控制染色体中的每一个上的位点(locus)的数目;在血浆样本中测得的胎儿DNA分数;胎儿DAN分数的测量结果中的胎儿DNA分数误差容限;误差控制数,其控制未知预期胎儿DNA分数与来自血浆的所估计的胎儿DNA分数之间的相对误差在胎儿DNA分数误差容限内的概率;正在测试的非整倍体的程度;部分约束,其指定要输入到dPCR实验的预扩增程序所引起的DNA分子的一部分,预扩增程序将来自血浆样本的DNA扩增;关于用于预扩增程序的PCR效率的数据;以及包括假阳性比率和假阴性比率的差错率准则;由计算机系统基于差错率准则、胎儿DNA分数、关于PCR效率的数据以及非整倍体的程度来计算用于dPCR实验的控制染色体分子的最小输入数目;由计算机系统基于胎儿DNA分数、胎儿DNA分数误差容限以及误差控制数来计算用于预扩增程序的控制染色体分子的最小数目;由计算机系统基于用于dPCR实验的控制染色体分子的最小输入数目、用于预扩增程序的控制染色体分子的最小数目、关于用于预扩增程序的PCR效率的数据、用于预扩增的位点的数目以及部分约束来估计预扩增程序中的PCR循环的数目。在一个实施例中,所述方法还包括基于用于输入到预扩增程序的DNA分子的最小数目来确定样本的尺寸。在另一实施例中,所述方法还包括使用用于预扩增程序的控制染色体分子的最小数目、预扩增程序中的PCR循环的估计数目以及用于dPCR实验的控制染色体分子的最小输入数目来执行预扩增程序和dPCR实验;
基于用于来自测试染色体和一个或多个控制染色体的DNA片断的正分区来获得测试度量;以及将测试度量与截止值相比较以确定胎儿是否具有染色体非整倍体。在某些实施例中,输入到预扩增程序的样本尺寸至少提供用于输入到预扩增程序的DNA分子的最小数目,其中,预扩增程序至少执行估计数目的PCR循环,并且其中至少最小输入数目的控制染色体分子被输入到dPCR实验。在某些实施例中,关于PCR效率的数据包括以下各项中的至少一个:用于PCR效率的预先指定下界;关于测试染色体和控制染色体的相等平均PCR效率的假设;以及用于针对测试染色体和控制染色体的预扩增程序的PCR效率比率。在某些实施例中,该方法还包括使用差错率准则、胎儿DNA分数以及到数字式PCR实验的控制染色体分子的输入数目来计算用于数字式PCR实验的最小可检测相对差;以及使用最小可检测相对差来计算用于dPCR实验的控制染色体分子的最小输入数目。在某些实施例中,计算用于dPCR实验的控制染色体分子的最小输入数目由下式确定:
其中
其中,f是胎儿DNA分数,h是非整倍体的程度,R是关于PCR效率的数据且对应于控制染色体和测试染色体的位点处的效率的比,g(1)是h=1时的g(h)的值,α是假阳性比率且β是假阴性比率,z1-α是标准正态分布的第分位数,z1-β是标准正态分布的第分位数。在这些实施例中的某些中,
其中,L c 是一个或多个控制染色体上的位点的数目,Lt是测试染色体上的位点的数目,p是预扩增循环的数目,并且y是特定位点处的效率。在这些实施例中的某些中,R是
在某些实施例中,计算用于预扩增程序的控制染色体分子的最小数目由下式确定:
其中,ψ是胎儿DNA分数误差容限,f是胎儿DNA分数,η是误差控制数,并且是标准正态分布的第分位数。
在某些实施例中,估计预扩增程序中的PCR循环的数目由下式确定:
其中,是用于dPCR实验的控制染色体分子的最小输入数目,τ是部分约束,y0是预扩增程序中的用于PCR效率的下界,L c 是一个或多个控制染色体上的位点的数目,并且等于测试染色体上的位点的数目,并且是用于预扩增程序的控制染色体分子的最小数目。在某些实施例中,胎儿DNA分数误差容限是0.05,误差控制数是0.05,并且部分约束是0.005。在某些实施例中,仅使用一个控制染色体,其中,在测试染色体和控制染色体上使用多个位点,并且其中,在测试染色体和控制染色体上使用相同数目的位点。
在另一方面,提供了一种计算机产品,其包括存储多个指令的非临时计算机可读介质,所述多个指令在被执行时控制计算机系统以确定用于涉及到来自怀有胎儿的女性的血浆样本中的DNA分子的预扩增的数字式PCR(dPCR)实验的设置,所述dPCR实验用于检测染色体非整倍体,所述指令包括:接收数据,该数据包括测试染色体和控制染色体中的每一个上的位点的数目;在血浆样本中测得的胎儿DNA分数;胎儿DAN分数的测量结果中的胎儿DNA分数误差容限;误差控制数,其控制未知预期胎儿DNA分数与来自血浆的所估计的胎儿DNA分数之间的相对误差在胎儿DNA分数误差容限内的概率;正在测试的非整倍体的程度;部分约束,其指定要输入到dPCR实验的预扩增程序所引起的DNA分子的一部分,预扩增程序将来自血浆样本的DNA扩增;关于用于预扩增程序的PCR效率的数据;以及包括假阳性比率和假阴性比率的差错率准则;基于差错率准则、胎儿DNA分数、关于PCR效率的数据以及非整倍体的程度来计算用于dPCR实验的控制染色体分子的最小输入数目;基于胎儿DNA分数、胎儿DNA分数误差容限以及误差控制数来计算用于预扩增程序的控制染色体分子的最小数目;基于用于dPCR实验的控制染色体分子的最小输入数目、用于预扩增程序的控制染色体分子的最小数目、关于用于预扩增程序的PCR效率的数据、用于预扩增的位点的数目以及部分约束来估计预扩增程序中的PCR循环的数目。在某些实施例中,计算用于dPCR实验的控制染色体分子的最小输入数目由下式确定:
其中
其中,f是胎儿DNA分数,h是非整倍体的程度,R是关于PCR效率的数据且对应于控制染色体和测试染色体的位点处的效率的比,g(1)是h=1时的g(h)的值,α是假阳性比率且β是假阴性比率,z1-α是标准正态分布的第分位数,z1-β是标准正态分布的第分位数。在某些实施例中,
其中,L c 是一个或多个控制染色体上的位点的数目,Lt是测试染色体上的位点的数目,p是预扩增循环的数目,并且y是特定位点处的效率。在某些实施例中,R是
在某些实施例中,计算用于预扩增程序的控制染色体分子的最小数目由下式确定:
其中,ψ是胎儿DNA分数误差容限,f是胎儿DNA分数,η是误差控制数,并且是标准正态分布的第分位数。在某些实施例中,估计预扩增程序中的PCR循环的数目由下式确定:
其中,是用于dPCR实验的控制染色体分子的最小输入数目,τ是部分约束,y0是预扩增程序中的用于PCR效率的下界,L c 是一个或多个控制染色体上的位点的数目,并且等于测试染色体上的位点的数目,并且是用于预扩增程序的控制染色体分子的最小数目。在某些实施例中,关于PCR效率的数据包括以下各项中的至少一个:用于PCR效率的预先指定下界;关于测试染色体和控制染色体的相等平均PCR效率的假设;以及用于针对测试染色体和控制染色体的预扩增程序的PCR效率比率。在某些实施例中,所述指令还包括:使用差错率准则、胎儿DNA分数以及到数字式PCR实验的控制染色体分子的输入数目来计算用于数字式PCR实验的最小可检测相对差;以及使用最小可检测相对差来计算用于dPCR实验的控制染色体分子的最小输入数目。
其它实施例针对与本文中所述的方法相关联的系统、便携式消费装置以及计算机可读介质。
参考以下详细描述和附图可获得对本发明的实施例的本质和优点的更好理解。
附图说明
图1示出了根据本发明的实施例的测试样本正常时以及当测试样本是非整倍体时的检验统计量的分布的图100。
图2A—2C图示出根据本发明的实施例的到预扩增程序的输入控制染色体分子的数目对所估计的胎儿分数的标准误差的影响。
图2D图示出标准正态分布的第97.5%分位数。
图3是根据本发明的实施例的确定用于涉及到来自怀有胎儿的女性的血浆样本中的DNA分子的预扩增的数字式PCR(dPCR)实验的设置的方法300的流程图。
图4示出了根据本发明的实施例的到预扩增的分子的数目输入的推导。
图5是根据本发明的实施例的示出了不同胎儿分数下的到预扩增程序的控制染色体分子的最小输入数目的表格。
图6是根据本发明的实施例的示出了用于dPCR实验以便检测T21所需的控制染色体分子的最小输入数目的表格。
图7是根据本发明的实施例的示出了用于预扩增以便从输入到预扩增(图5)的最小数目的控制染色体分子实现输入到dPCR实验(图6)的最小数目的控制染色体分子所需的PCR循环的最小数目的表格。
图8A—8C示出了针对不同水平的FP和FN比率的分子的预期数目的最小可检测相对差(黑色实线)与控制染色体分子的数目之间的关系。彩色线是不同胎儿分数下的分子的预期数目的相对差。
图9示出了可与根据本发明的实施例的系统和方法一起使用的示例性计算机系统10的框图。
图10是示出了可以用来实现本发明的方法的软件和硬件资源之间的关系的一般框图的示例。
图11是示例性地示出了数字式PCR装置与计算机系统之间的关系的一般框图的示例。
定义
分子的预期数目的相对差基于指定输入变量来量化平均起来在患者的血浆中(包含一定分数的无细胞胎儿DNA)比正常染色体分子多多少的非整倍染色体分子在预扩增之后被输入到dPCR实验。该相对差可以取决于各种值,诸如胎儿DNA分数和非整倍体的程度。
分子的预期数目的最小可检测相对差对应于在指定假阳性和假阴性比率内可以可靠地检测到的预扩增之后的正常染色体和非整倍染色体之间的DNA分子的预期数目的相对差。该差可以包括作为一个染色体相对于另一个染色体的不同位点数目的结果的乘数。
检验统计量是基于观察数据计算的量以测量观察数据针对测试染色体正常的零假设提供多少证据。检验统计量的示例包括来自测试染色体和控制染色体的分子的数目的差或比。
输入到预扩增的分子的数目对应于输入到预扩增的母亲血浆中的单倍体基因组的数目。输入DNA体积可以确定此数目,即使无细胞DNA的片断小块在血浆中。预扩增之前的每个位点处的无细胞DNA的数目与输入到预扩增的分子的数目相同。用于预扩增的位点越多,输入到预扩增的无细胞DNA越多,即使到预扩增的分子输入数目保持相同。分子的最小数目对应于每个位点处的分子的最小数目,假设跨位点的分子的数目是相同的。因此,位点越多,输入分子越多。
输入到dPCR实验的分子的数目对应于从预扩增产生并输入到dPCR实验的无细胞DNA的数目。这不同于到预扩增的分子的输入数目。
具体实施方式
实施例提供了用于设计用于无创产前测试的数字式聚合酶链反应(dPCR)实验的统计框架。此类产前测试使用来自胎儿的无细胞DNA,其可以在来自怀孕女性的样本中找到。例如,在母亲血浆中可以找到无细胞胎儿DNA。
dPCR实验在无创产前测试中的应用及其它dPCR应用之间的关键差别是无细胞胎儿DNA在前一种环境下是非常有限的。为了达到用于检测非整倍染色体与正常染色体之间的小差异的功效,实施例在进行dPCR实验之前在多个位点处对研究中的染色体执行预扩增。实施例可以用来确定用于dPCR实验的特定设置以提供期望的准确度。示例性设置可以包括要使用的母亲样本的量(例如,由用于预扩增程序的控制染色体分子的最小数目确定)、预扩增循环的数目以及要输入到dPCR实验的DNA的量(例如,由用于dPCR实验的控制染色体分子的最小输入数目来确定)。
I. 介绍
实施例在实际dPCR实验之前执行预扩增。在使用一个位点和小母亲样本(出于举例说明的目的)的简单示例中,假设母亲样本具有来自染色体1上的第一位点的100个DNA分子和来自染色体21上的第二位点的105个DNA分子(5%无细胞胎儿DNA)。在正常样本中,DNA分子的数目应是相等的,具有一定的测量变化性。在这里,差是五个DNA分子,其可能难以检测。
这205个DNA分子可以被输入到预扩增程序以获得来自第一位点的79496.15个DNA分子以及来自第二位点的83470.96个DNA分子(假设预扩增期间的用于两个染色体的0.95和10个PCR循环的PCR效率)。该差现在是3974.81个DNA分子,其可能检测起来更容易。
多个位点不仅可以用来用较少的PCR循环获得期望数量的DNA分子,而且可以平均掉跨位点的PCR效率和胎儿分数中的不平衡。这可能是重要的,因为无细胞胎儿DNA的量是有限的。并且,为了以期望的功效检测非整倍体,必须输入足够的分子。此外,应以认真的方式设计dPCR实验以获得期望的准确度,例如由差错率准则定义,诸如假阳性比率和假阴性比率。并且,并不想执行太多的预扩增循环,因为其将引入太多的PCR噪声,诸如扩增不平衡或错误插入。
A. 具有预扩增的数字式PCR实验
预扩增的一个挑战是当将非常低的胎儿分数的血浆的一部分采样到预扩增中时,采样血浆的胎儿分数的标准误差可能是相当大的。必须确保到预扩增的分子的输入数目足够大,使得采样血浆中的胎儿分数是足够精确的。
实施例可以解决以下几点:(1)输入到dPCR实验的正常染色体与非整倍染色体之间的分子的预期数目的最小可检测相对差是什么及总共必须向dPCR实验输入多少控制染色体分子以便在假阳性和假阴性比率的某些水平下可靠地检测非整倍体(2)总共必须向预扩增输入多少分子以便将胎儿分数标准误差控制在可容许水平(3)对于预扩增而言需要多少PCR循环
实施例可以通过首先计算预扩增之后的非整倍染色体与正常染色体之间的分子的预期数目的相对差来解决这些问题。在一个实施方式中,分子的预期数目的此相对差结合了生物样本中的胎儿DNA分数、PCR循环的数目以及PCR扩增效率。在一个实施例中,可以假设测试染色体和控制染色体的平均PCR效率是相同的,并且因此不需要PCR循环数目和PCR效率来估计到dCPR实验的分子的输入数目。
可以使用分子的预期数目的相对差来估计分子的预期数目的最小可检测相对差,其是一个染色体相对于另一个染色体的DNA分子的最小差,其中,可以在假阳性和假阴性比率的指定水平下可靠地检测此最小相对差。可以使用方差稳定化变换检验统计量来确定此差。
可以使用分子的预期数目的相对差来提供dPCR实验所需的分子的最小总数以便检测指定水平的假阳性和假阴性比率下的非整倍体。实施例还可以提供用以估计输入到预扩增的分子的所需总数以便将胎儿DNA分数中的标准误差控制在可容许水平的方式。
给定需要输入到dPCR实验的分子的最小总数和需要输入到预扩增的分子的总数,实施例可以估计用于预扩增的PCR循环的所需数目。结果(下面提供)显示可以在1%的假阳性和1%假阴性比率下、甚至在低至3%的胎儿分数下检测非整倍体。胎儿分数越低,需要输入到预扩增的分子的总数越多。假阳性和假阴性比率越严格或者胎儿分数越低,需要越多的分子总数以输入到dPCR实验以便检测非整倍体。在输入到dCPR实验室的分子的一定数目下,胎儿DNA分数越高,越有可能能够检测非整倍体。用于预扩增的位点的数目越多,需要的PCR循环的数目越少。
B. 检验统计量
当分析样本以确定是否存在胎儿非整倍体时,针对该样本获得检验统计量。检验统计量是根据此样本的dPCR输出数据计算的量,其测量测试染色体是非整倍体的证据的数量。例如,可以使用来自测试染色体的第一数目的DNA分子和来自一个或多个控制染色体的第二数目的DNA分子来确定检验统计量。然后可以将该检验统计量与截止值相比较以将样本分类,例如分类为非整倍体或正常或者当使用两个截止值时潜在地不分类。检验统计量的示例是差或比。当使用差时,可以执行归一化,使得检验统计量结合差的标准误差。
截止的选择影响假阳性和假阴性比率。在其中使用一个截止值的示例中,较大的截止值将降低假阳性比率,但是将增加假阴性比率。并且,较低的截止值将降低假阴性比率,但是将增加假阳性比率。
可以使用两个截止值,其中,第一截止值小于第二截止值。例如,如果检验统计量低于第一截止,则可以将该样本识别为正常。如果检验统计量高于第二截止,则可以将胎儿识别为具有非整倍体。如果检验统计量在第一截止与第二截止之间,则样本可能是不确定的。如果使得第一截止较低以减少假阴性和/或增加第二截止值以减少假阳性,则不确定样本的数目增加,这也是个问题。现在描述特定检验统计量和差错率的描述。
图1示出了根据本发明的实施例的用于正常样本和非整倍体样本的检验统计量的分布的图100。横轴101对应于用于检验统计量J的不同值。竖轴102对应于观察特定检验统计量的时间的比例,并被标记为密度。在本示例中,统计J对应于测试分子(即,来自测试染色体)的测试数与控制分子(即,来自控制染色体)的控制数之间的差,用此差的标准误差标准化。因此,在使用一个控制染色体的本示例中,将预期正常样本具有为零的检验统计量值,因为许多DNA分子应是相同的。将预期非整倍体样本针对检验统计量J具有较高的值。
分布110示出了用于正常样本的检验统计量的概率分布。由于关于哪些DNA分子碰巧在样本中的自然变化,某些正常样本将具有比控制分子更多或更少的测试分子。但是,最有可能的值是零,其处于概率分布110的峰值。该分布遵循正态分布,并且在这里为了举例说明而提出。
分布120示出了用于非整倍体样本的检验统计量的概率分布。分布120的峰值对应于Δ125。Δ125的值取决于实验中的分子的数目。输入到dPCR实验的分子越多,Δ越大。Δ125的值还取决于样本中的胎儿DNA分数。当胎儿DNA分数较大时,存在更多的测试分子(即,因为这些样本具有非整倍体),并且检验统计量具有较大的值。
在图100中,使用截止值130来示出假阳性比率α和假阴性比率β。大于截止值130的分布110的值将被不正确地分类为具有非整倍体,并且因此是假阳性的。小于截止值130的分布120的值将被不正确地分类为正常,并且因此是假阴性。
因此,为了控制假阳性比率不大于α,如果J大于截止值130,标记为,则实施例可以拒绝无效假设。根据替换假设(即,非整倍体),针对本示例,检验统计量J具有正态分布,其具有平均值Δ和标准偏差1。给定截止值,假阴性比率不大于β。换言之,功效为至少1–β。输入控制染色体分子的数目将影响Δ。亦即,分子越多,Δ离零越远。因此,分子越多,在分布110和120之间存在越少的重叠,并且假阴性比率越低。在某些实施例中,由于J是方差稳定化检验统计量,所以两个正太曲线的宽度保持恒定,即使当分子的数目增加时。
如可以看到的,截止值130的选择决定假阳性比率和假阴性比率。减小假阴性比率的一个方式是增加输入到dPCR实验的分子的数目,因为这将增加Δ125。分布110和120的宽度将保持相同,因此两个分布的重叠的量将减小,并且假阴性比率将减小。然而,用于实验的分子的较大数目招致附加的成本和时间。实施例可以确定用于dPCR实验实现期望差错率的输入分子的最小数目。此备忘录值可以用来在实现期望差错率的同时使时间和成本最小化。
在一个实施例中,在p个PCR循环的预扩增之后来自测试染色体21(可以使用其它测试染色体)的DNA分子的测试数被标记为,并且来自控制染色体的DNA分子的控制数被标记为。单体积dPCR实验对应于dPCR仪器的所有分区具有相同体积的情况。多体积dPCR实验对应于分区具有不同的体积的情况。
针对单体积dPCR实验,在某些实施例中,可以执行泊松修正。使用泊松等式:来计算分子的估计总数,其中,对于特定dPCR实验而言,分别是染色体21和控制染色体通道中的阳性分区的比例,并且其中,N是分区的总数。可以使用将每个通道中的分区划分成阳性和阴性分区的任何方法来计算这两个比例。
在一个实施例中,为了计算,可以对2维空间中的所有分区的强度执行聚类,并且记入两个通道中的阳性分区的数目。可以将这些计数除以分区的总数N。针对多体积dPCR实验,其可以分别地通过针对每mL的染色体21和控制染色体分子的估计数目对参考文献[11]中的等式(8)求解来估计,并且使用以下等式将这些浓度转换成,其中,如在参考文献[11]中定义的和,是第i孔体积(mL),是孔体积处的分区的数目,并且m是不同孔体积的总数。
C. 测量胎儿DNA分数
如上所述,当胎儿具有非整倍体时,胎儿DNA分数将影响测试染色体上的测试DNA分子的数目。可以用各种方式来测量胎儿DNA分数,例如,如下所述。测量结果将具有一定程度的误差,其可以影响期望的假阴性比率,因为高估的胎儿分数导致到dPCR实验的输入DNA分子的数量不足。在上述示例中,此类高估将使预期值Δ朝着0移动,并且因此将增加假阴性比率。
低估胎儿分数将导致比需要输入到dPCR实验的更多的分子,并且因此将导致较低的假阴性比率而导致较高的实验成本。因此,作为测得胎儿分数的替代,可以简单地使用用于胎儿分数的下界来确保足以在足够的资源可用时检测非整倍体的统计功效。实施例可以在胎儿DNA分数的测量中虑及误差容限,例如以便确定用于预扩增程序的控制DNA分子的最小数目。
通常通过使用仅在胎儿DNA上存在而在母亲DNA上不存在的遗传标记来测量胎儿DNA分数,以将胎儿分子与母亲分子区别开。通常在预扩增之前,对包含胎儿特定的遗传标记和为胎儿和母亲两者所共有的至少一个标记的至少一个位点使用s个PCR循环来扩增所提取的母亲的血浆的一部分。可以使用胎儿DNA标记来计算胎儿DNA分子的计数,并且可以使用公共位点来计算总DNA分子的计数,并且因此胎儿DNA计数除以总DNA计数的比提供胎儿DNA分数。还可以引入两者的因子以虑及一个胎儿等位基因与位点处的母亲等位基因相同。
存在可以用于这种方法的两个不同类型的胎儿标记。第一个是利用仅针对胎儿DNA以特定形式存在的表观遗传标记。可以用生物化学方式将表观遗传标记转换成可区别扩增的形式,使得特异引物序列仅扩增最初非甲基化或甲基化的DNA。示例包括用将非甲基化dC残余物转换成dU的亚硫酸氢钠来处理。可以用于这种方法以测量胎儿分数的另一种标记仅针对男性怀孕。当胎儿是男性时,可以使用染色体来测量胎儿分子的数目。
图2A-2C图示出根据本发明的实施例的到预扩增程序的输入控制染色体分子的数目对输入血浆中的胎儿分数的标准误差的影响。执行模拟以示出到预扩增的输入控制染色体分子的数目如何影响胎儿分数的标准误差。
假设从患者提取的整体血浆100μl,其包含7500个控制染色体分子,并且这些分子的5%是胎儿DNA。假设我们对用于预扩增的整体血浆的3个不同部分进行采样:25μl、5μl和1μl,其分别包含总共1875、 375和 75个分子。针对每个体积随机地提取子样本1000次。在图2A—C中绘出了用于这3个不同体积的胎儿分数的分布,其中,图2A对应于25μl,图2B对应于5μl,并且图2C对应于1μl。图2A—2C示出对越多的分子采样,胎儿分数的标准误差越小。因此,样本中的较高数目的DNA分子提供更准确的胎儿分数。
图2D示出了涉及胎儿DNA分数的准确度的正态分布的绘图。误差控制数(在本文中标记为η)控制相对误差在一定容限水平内的概率。下面描述的等式(32)中的值(210)是标准正态分布的第分位数。例如,如果η=0.05,则是标准正态分布的第97.5%分位数,其在图2D中是1.96。
一般地,标准正态分布的x%分位数是这样的值,在该值处从左侧直至此点的钟形曲线下面的面积是x%。误差控制数η控制整体血浆中的未知真(预期)胎儿分数与来自采样血浆的胎儿分数之间的相对误差在一定容限水平内的概率。误差控制数η可以由用户设定,并且将影响输入到预扩增程序的DNA分子的最小数目,使得胎儿DNA分数在误差容限内的概率是令人满意的。误差控制数η的示例性值是0.01、0.05和0.1。
II. 获得设置
可以用各种设置来定义dPCR实验。一个设置是用于预扩增程序的DNA分子的数目。可以相对于来自控制染色体的控制DNA分子的数目定义DNA分子的此数目。另一设置是预扩增程序中的循环(例如,PCR循环)的数目。另一设置是用于dPCR实验的DNA分子的最小输入数目。还可以相对于来自控制染色体的控制DNA分子的数目定义DNA分子的此数目。
A. 输入
可以使用各种数据来确定dPCR实验的设置。例如,可以使用关于样本的数据。此类样本数据可以包括在血浆样本中测得的胎儿DNA分数。胎儿DNA分数影响相对于来自测试染色体的分子的数量而言的来自控制染色体的分子的数量,并且因此影响所需的分子的最小数目。胎儿分数越高,控制和测试染色体之间的差越大,并且需要的分子数目越少。
还可以使用关于dPCR实验的物理过程的数据。此类过程数据可以包括测试染色体和一个或多个控制染色体中的每个上的位点的数目。下面是dPCR过程数据的示例。位点的数目对应于在预扩增步骤中预扩增的位点的数目,其影响预扩增循环的数目以获得用于输入到dPCR实验的最少控制分子。关于用于预扩增程序的PCR效率的数据可以影响PCR循环的数目。此类数据可以采取各种形式,诸如:用于PCR效率的预先指定下界、关于测试染色体和控制染色体的相等平均PCR效率的假设以及用于针对测试染色体和控制染色体的预扩增程序的PCR效率比率。
作为过程数据的另一示例,由dPCR实验测试的非整倍体的程度影响所测试的非整倍体与正常之间的预期数目的相对差(例如,针对四体性将比针对三体性预期更大的差)。另外,部分约束可以指定要输入到dPCR实验的从预扩增程序得到的DNA分子的一部分。来自正在使用的预扩增程序的DNA分子的部分越高,需要越少的预扩增循环以获得最小数目的分子。
还可以使用关于dPCR实验的期望准确度的数据。可以基于外部要求(例如,规制要求)或内部要求来确定期望的准确度。作为示例,准确度数据包括胎儿DNA分数的测量结果中的胎儿DNA分数误差容限。较大的误差容限导致预扩增程序所需的较少控制染色体分子。误差控制数可以控制未知预期胎儿DNA分数与来自血浆的所估计的胎儿DNA分数之间的相对误差在胎儿DNA分数误差容限内的概率。较小的误差控制数要求预扩增程序所需的更多控制染色体分子。准确度数据还可以包括差错率准则(例如,假阳性比率和假阴性比率)。
B. 方法
图3是根据本发明的实施例的确定用于涉及到来自怀有胎儿的女性的血浆样本中的DNA分子的预扩增的数字式PCR(dPCR)实验的设置的方法300的流程图。dPCR实验是为了检测染色体非整倍体。可以由计算机系统来执行方法300。
在步骤310中,接收数据。该数据可以包括上文所述的数据。例如,接收到的数据可以包括样本数据、dPCR过程数据以及准确度数据。
在步骤320中,可以基于接收数据的至少一部分来计算用于dPCR实验的控制染色体分子的最小输入数。例如,可以使用差错率准则、胎儿DNA分数、关于PCR效率的数据以及非整倍体的程度来计算控制染色体分子的最小输入数。在一个实施例中,可以使用下述等式(29)来计算用于dPCR实验的控制染色体分子的最小输入数。在另一实施例中,可以例如通过识别用于给定差错率的预期数目的可检测相对差何时与用于胎儿DNA分数的值匹配而使用预期数目的最小可检测相对差来计算用于dPCR实验的控制染色体分子的最小输入数。
在步骤330中,可以基于接收数据的至少一部分来计算用于预扩增程序的控制染色体分子的最小数目。例如,可以使用胎儿DNA分数、胎儿DNA分数误差容限以及误差控制数。在一个实施例中,使用等式(34)。图4描述了可以使用的各种实施例。
在步骤340中,可以基于接收数据的至少一部分来估计预扩增程序中的PCR循环的数目。例如,可以使用用于dPCR实验的控制染色体分子的最小输入数目、用于预扩增程序的控制染色体分子的最小数目、关于用于预扩增程序的PCR效率的数据、用于预扩增的位点的数目以及部分约束。在一个实施例中,使用等式(37)。
在步骤350中,基于用于预扩增程序的控制染色体分子的最小数目来确定样本的尺寸。可以使用每体积的DNA的数量来确定样本的尺寸。例如,基于到预扩增程序的分子的最小数目,可以基于样本中的DNA的浓度来确定样本的尺寸。在一个实施例中,可以将DNA和等离子体的浓度假设为每毫升约1,500个基因组当量(GE)或者每毫微克约315 GE。
在步骤360中,执行dPCR实验。dPCR实验可以提供对于来自控制染色体上的多个位点中的任何一个的DNA片断而言为阳性的第一数目的分区和对于来自测试染色体上的多个位点中的任何一个的DNA片断而言为阳性的第二数目的分区。可以使用该数目来确定测试度量,可以将该度量与截止值相比较以提供胎儿是否具有正在测试的特定染色体非整倍体的检测。
III. 用于数字式PCR的DNA的所需量
本节描述了根据各种实施例的要输入到dPCR实验以实现期望差错率的DNA的所需量的确定。不同的差错率和潜在地其它输入可以影响DNA的所需数量。可以用各种方式来量化DNA的所需量,例如用整个样本中的所有DNA分子的总数量或者用用于控制染色体的控制DNA分子的数目。此外,可以计算分子的预期数目的相对差,其进而可以用来确定要输入到dPCR实验的DNA的所需数量。
在这里,我们在预扩增之后针对任何程度的非整倍体计算用于分子的预期数目的相对差的一般公式。虽然我们聚焦于染色体21中的非整倍体,但该公式适用于任何染色体中的非整倍体。
A. 符号
在这里,我们介绍与预扩增程序有关的某些符号,并且用来举例说明某些计算。
:用于染色体i的位点的数目,i=1,…,23。
:用于位点l处的染色体i的每个循环的预扩增PCR效率,i=1,…,23,l=1,…,Li,其中,染色体23表示性染色体。
:到预扩增的位点l处的输入染色体i胎儿分子的数目,i=1,…,23,l=1,…,Li
:到预扩增的位点l处的输入染色体i母亲分子的数目,i=1,…,23,l=1,…,Li
:在时的理想情况下从具有p个PCR循环的预扩增得到的位点l处的染色体i胎儿分子的数目,i=1,…,23,l=1,…,Li
:在时的理想情况下从具有p个PCR循环的预扩增得到的位点l处的染色体i母亲分子的数目i=1,…,23,l=1,…,Li
:在时的真实情况下从具有p个PCR循环的预扩增得到的位点l处的染色体i胎儿分子的数目, i=1,…,23,l=1,…,Li
:在时的真实情况下从具有p个PCR循环的预扩增得到的位点l处的染色体i母亲分子的数目, i=1,…,23,l=1,…,Li
:在时的理想情况下从具有p个PCR循环的预扩增得到的染色体i胎儿分子的数目,i=1,…,23。
:在时的理想情况下从具有p个PCR循环的预扩增得到的染色体i母亲分子的数目,i=1,…,23。
:在时的真实情况下从具有p个PCR循环的预扩增得到的染色体i胎儿分子的数目,i=1,…,23.。
:在时的真实情况下从具有p个PCR循环的预扩增得到的染色体i母亲分子的数目,i=1,…,23。
B. 分子的预期数目的相对差
分子的预期数目的相对差基于指定输入变量来量化平均起来在患者的血浆中(包含一定分数的无细胞胎儿DNA)比正常染色体分子多多少的非整倍染色体分子在预扩增之后被输入到dPCR实验。该相对可以差取决于各种值,诸如胎儿DNA分数和非整倍体的程度。下面的讨论聚焦于染色体21是测试染色体,但是本讨论同样地适用于使用其它测试染色体。
1. 假设和预扩增
为了便于说明而进行各种假设。在实际计算中可以使用这些假设,或者可以获得确切值。在一个方面,假设到预扩增的分子的输入数目跨染色体上的位点相等是合理的。在理想扩增中,位点处的分子的数目针对每个扩增循环加倍。位点处的胎儿分子的起始数目与胎儿分子的结果数目之间的关系提供为。针对实际(非理想)扩增,该关系是。因此,用于理想扩增和实际扩增的结果得到的数目之间的关系如下:
该关系适用于
可以将用于母亲和胎儿的特定染色体上的分子的总数确定为特定染色体上的每个位点中的值的和。分子的位点特定和染色体特定数目之间的关系如下:
其中
为了便于注释且根据我们的模型的特殊情况,我们可以针对所有染色体假设相同的位点数目,使得。假设除染色体21之外的所有胎儿染色体都是正常的,并且所有母亲染色体都是正常的,我们具有以下关系:
当等式(3)和(4)适用时,可以使用除染色体21之外的染色体作为控制染色体。
2. 预扩增之前的胎儿分数
本节描述了使用来自整体母亲血浆的血浆的一部分来确定预扩增之前的胎儿分数的估计。我们将来自整体母亲血浆的血浆的与用于预扩增的部分分开的部分用于测量胎儿分数,因为用来测量胎儿分数的遗传标记可能被预扩增过程毁坏。我们对血浆的此分开部分执行s个循环的PCR以便测量胎儿分数,并且假设此PCR产品中的胎儿分数在包含遗传标记的相同位点处与输入到预扩增的血浆的另一部分中的胎儿分数相同。我们在预扩增之前使用第一方法基于染色体i将表示成所估计的胎儿分数。
在数学上,
其中,()是s个PCR循环之后的测量胎儿分数的血浆部分中的包含遗传标记的位点处的(胎儿、母亲)分子的数目,并且()是测得胎儿分数的血浆的相同部分中的包含遗传标记的位点处的(胎儿、母亲)分子的初始数目。等式(5)的第二个相等来自我们的假设,即用于测得胎儿分数的血浆部分中的胎儿分数与输入到预扩增的血浆的另一部分中的胎儿分数相同。为了满足此假设,我们使用与用于预扩增的量相同量的血浆来测量胎儿分数。
等式(3)、(4)和(5)暗示所有是相同的,亦即。因此,
在男性怀孕的情况下,还可以用染色体Y分子的数目的两倍除以染色体i分子的总数来使用与用于预扩增的血浆部分分开的血浆的一部分()来测量胎儿分子的分数,其中,。在数学上
如在女性胎儿情况下,所有等于。我们表示。以下讨论对胎儿DNA分数使用单个符号。
3. 预扩增的效率
用于预扩增循环的效率对于每个染色体上的每个位点而言可以是不同的。并且,位点的数目对于测试染色体和控制染色体而言可以是不同的。下面的讨论虑及不同位点处的不同效率。对效率求平均值以获得染色体上的分子的真实数目。在等式(8)中提供了胎儿/母亲分子的起始数目和胎儿/母亲分子的结尾数目之间的关系,在预扩增程序之后,其有效地对跨给定染色体的位点的效率求平均值,并且然后将该值乘以染色体上的分子的理想数目。
使c为用于控制染色体的索引。我们具有以下关系
L 21 是染色体21上的位点的数目。L c 是控制染色体上的位点的数目。可以如参考文献[9]和[10]中所述地测量用于每个位点的效率。
4. 非整倍体的程度
非整倍体的程度h对应于正在测试的非整倍体的类型。非整倍体的程度对于三体性而言大于一,对于单体性而言小于一。大于三体性的非整倍体具有高于三体性的非整倍体的程度。非整倍体的程度将影响图1中的期望值Δ125的位置,因为非整倍体的较高程度将引起较大的期望值Δ125。
在一个实施例中,非整倍体的程度h被定义成胎儿染色体21分子的输入数目与位点l的胎儿控制染色体的数目的比。
换言之,对于三体性而言h=1.5,对于正常的而言h=1,并且对于单体性而言h=0.5。
5. 母亲控制与胎儿测试之间的关系
一旦定义了非整倍体的程度,可以在理想预扩增之后定义用于测试染色体的分子的数目与用于控制染色体的分子的数目之间的关系。以下等式适用
第一部分示出染色体21的胎儿分子的结尾数目与控制染色体的胎儿分子的结尾数目之间的关系,每个染色体的位点的数目可以不同。第二部分示出了控制染色体的母亲分子的结尾数目与控制染色体上的胎儿分子的结尾数目之间的关系,其取决于胎儿DNA分数f。此第二部分由关系式定义。
可以如下确定非理想预扩增之后的控制染色体的母亲分子的数目与测试染色体上的胎儿分子的数目之间的关系。通过等式(8),我们有
其中
6. 到dPCR实验的输入
在某些实施例中,从预扩增程序得到的仅一小部分分子被输入到dPCR实施例,例如由于输入DNA体积中的仪器特定约束和稀释预扩增程序的输出的需要。dPCR实验具有一定数目的分区,其中的每一个可以容纳直至最大量的体积。因此,存在体积限制,其在需要稀释预扩增输出、例如以稀释出来自预扩增程序的反应物(例如,引物)时变得更严重。作为示例,可以执行大约或至少10倍稀释。
在本文中,分数对应于从输入到dPCR实验的预扩增程序得到的分子的分数。可以在本文中所述的计算之前选择的值。的示例性值是0.005。因此,是指定要输入到dPCR实验的从预扩增程序得到的DNA分子的一部分的 部分约束。
将等式(11)的两侧乘并且在两侧取期望值,等式(13)提供用于输入到dPCR实验的胎儿染色体21分子的预期数目的表达式。
由于对于母亲而言,所以等式(8)意味着,这进一步意味着
因此,输入到dPCR实验的胎儿染色体21分子的预期数目变成
同样地,输入到dPCR实验的胎儿控制染色体分子的预期数目是
等式(15)和(16)分别导致输入到dPCR实验的染色体21()和控制染色体()分子的预期数目,
7. 分子的预期数目的相对差
我们定义,即输入到dPCR实验的染色体21和控制染色体分子的预期数目之间的差。因此,分子的预期数目的相对差是
在男性怀孕的情况下,可以测量胎儿DNA的分数而不是。我们可以示出。因此,当胎儿是男性时,我们可以简单地用来替换。等式(19)变成
为了便于举例说明,在使R因数下降的同时基于等式(19)和(20)
当存在染色体21三体性时,我们针对胎儿分数60%、50%、40%和30%使比为1.3、1.25、和1.15。等式(19)中的相对差可以帮助定义最小的可检测相对差,如下所述。
C. 输入到dPCR实验的控制染色体分子的最小数目
在本节中,使用统计假设检验框架来估计当将假阳性和假阴性比率控制在一定水平时的dPCR实验所需的控制染色体分子的最小数目和分子的预期数目的最小可检测相对差。来自dCPR实验的数据包含用于两个或更多不同通道的信号强度(至少一个测量从所有分区测试的染色体的强度,并且至少一个测量控制染色体强度)。在dPCR中,分区中的强度的量值不确定该分区中的分子的数目。该信号仅传达分区是否包含任何分子类型(即,对应于特定通道,其可以是特定位点)。因此,可用于后续分析的数据是二进制的:对于每个分子类型而言为阳性或阴性分区。
在本文中,表示从阳性分区的观察比例计算的染色体21和控制染色体分子的估计数目。可以计算这些数目,如上所述。例如,在单体积实验中,可以分别地使用具有均值的泊松分布来确定分子的数目,其中,N是分区的数目。其它实施例可以使用阳性分区的数目作为分子的数目。
可以比较输入到dPCR实验()的染色体21和控制染色体分子的预期数目以确定样本的分类,例如正常或非整倍体。作为示例,可以通过取两个值的差、比或此类函数的组合或者具有这些期望值作为输入的函数的差或比来对两个预期数目彼此比较。等价于(正常)和(例如,三体性、四体性或五体性)的无效和替换假设是
针对以下讨论,我们聚焦于测试染色体的额外拷贝的非整倍体。在用代替替换假设的情况下,类似参数可以适用于单体性。给定的固定值,函数g(h)_是h的单调递增函数,使得,并且由等式(19)定义为
虽然可以使用来自每个染色体的分子数目的差的比(例如,)作为检验统计量,但可以使用其它检验统计量。例如,可以使用参考文献[6]中的检验统计量W1-W4。为了比较两个泊松率,使用简单、保守且具有高功效的方差稳定化变换检验统计量。由于假阴性比率的控制在无创产前测试中可以比假阳性比率更关键,所以使用以下检验统计量以便达到比其它检验统计量更高的功效(较低的假阴性比率)。该检验统计量是
其中,。由[5]和[6],遵循标准正态分布。
针对本描述的其余部分,我们简单地用J来表示。为了将假阳性比率控制为小于或等于α,我们需要适用以下关系式:
为了将假阴性比率控制在β,我们需要适用以下关系式:
如参考文献[6]中所示,为了使等式(25)和(26)适用,函数必须大于或等于0,其中
其中,Z1-α和Z1-β分别是标准正态分布的第和第分位数。在单体性的情况下,函数必须小于或等于0。作为提示,更多的分子将移动用于替换假设的期望值远离无效假设的期望值,从而允许较低的假阴性比率。为了使等式(27)≥0,差错率越严格,Z1-β和Z1-α越大,并且必须越大。换言之,必须输入更多的分子以便达到期望的差错率。当使用不同的测试度量时将得到其它等式。
此关系式对实验设计目的有用。针对给定,可以使用来确定将假阳性和假阴性比率控制在一定水平下的分子的预期数目的最小可检测相对差。可以通过将固定到特定值并找到最小h、使得h>1且v(h, )≥0而根据等式(27)来计算分子的预期数目的最小可检测相对差。
其次,通过假定,给定a、(例如,在T21的情况下h=1.5),可以使用下面的不等式来确定到dPCR实验的控制染色体分子的所需要的输入数目,以便检测假阴性率和假阳性率的一定水平下的非整倍体。
其中
在单体性的情况下,等式(29)在用0.5替换h的情况下也适用。
等式(29)从要输入到dPCR实验的控制染色体(也称为控制分子)提供DNA分子的最小数,其将提供期望误差准则。可以用各种方式来获得控制分子的最小数目,例如使较大数目的控制分子被输入到预扩增程序、使用染色体上的更多位点以及在预扩增程序中执行更多循环。在一个实施方式中,可以通过将固定到特定值并找到最小h、使得h>1且v(h,) ≥ 0而根据等式(27)来计算分子数目的最小可检测相对差。
因此,在一个实施例中,可以使用误差准则α和β、非整倍体的程度h、关于预扩增效率的数据(例如,以用于效率的下界或R或者简单地假设相等平均效率和因此的表示)以及胎儿DNA分数f来确定来自控制染色体的DNA分子的最小数目。
差错率越小,用于z 1-α z 1-β 的值越大,并且因此需要越多的输入分子,因为较低的差错率要求更多的分子以将分布分离。g(h)的值越大,h>1,需要数目越少的分子。胎儿DNA分数越大,两个分布之间的间隔越大。并且,高度非整倍体将全部增加两个分布之间的间隔。
IV. 输入到预扩增的控制染色体分子的最小数目
为了控制输入到预扩增的采样等离子体的胎儿分数的标准误差,实施例可以将整体血浆中的未知预期胎儿分数(f0)与来自采样血浆的胎儿分数()之间的在等式(30)中定义的相对误差控制为小于或等于ψ。
等式(30)等价于以下等式
ψ是胎儿DNA分数误差容限。因此,ψ指定胎儿DNA分数在采样血浆中有多接近于实际胎儿分数。ψ的示例性值是1%(即,0.01),其对应于血浆样本中的胎儿DNA分数与实际胎儿DNA分数的≤1%相对误差。ψ越小,采样血浆中的胎儿分数越准确。
为了将相对误差小于或等于ψ的概率控制在至少,实施例可以要求用于预期胎儿分数的置信区间(CI)的宽度比短2ψ,
其中,是标准正态分布的第分位数。η的示例性值是5%,从而提供采样血浆中的胎儿分数在容限内的95%的概率。因此,η是误差控制数,其控制未知预期胎儿DNA分数与来自血浆的胎儿DNA分数之间的相对误差在胎儿DNA分数误差容限ψ内的概率。
因此,输入到预扩增的控制染色体分子的所需总数必须满足以下不等式
其中
等式(34)提供用于预扩增程序的控制染色体分子的最小数目。因此,在一个实施例中,可以基于胎儿DNA分数f、胎儿DNA分数误差容限ψ以及误差控制数η来确定用于预扩增程序的控制染色体分子的最小数目,其中,使用从整体血浆分离的血浆部分来测量胎儿分数f。通过使用与用于预扩增的相同量的血浆用于测量胎儿分数,我们确保测得胎儿分数的准确度在合理范围内。
概率越高,最小数目越高,因为其消耗更多的分子以达到在误差容限内的更高概率。并且,误差容限越小,最小数目越大,因为在较小数目的分子的情况下存在更多的变化。并且,胎儿DNA分数越小,需要越多的分子,因为其需要更多分子来获得足够的胎儿DNA分子以达到更准确的胎儿DNA分数。
图4示出了根据本发明的实施例的到预扩增的分子的输入数目的推导。通过示出如果我们以使得等式(31)的区间覆盖用于整体血浆中的未知预期胎儿分数的置信区间的方式选择等式(31)的区间,则此区间包含整体血浆中的未知预期胎儿分数的概率为至少。为了看到这一点,假定用于预扩增的采样血浆中的胎儿分数是5.01%。通过在等式(31)中将ψ设置成1%,相应区间是[4.96,5.06](红色垂直短划线410和420)。
假设图4中的两个黑色垂直实线430、440是用于95% CI的上界和下界。通过放置红色垂直短划线410和420,使得其形成的间隔覆盖由两个黑色垂直实线430和440形成的间隔,存在其中预期胎儿分数可以落入位置(1)、(2)和(3)的三个可能性。如果预期胎儿分数落在(1)处,则来自等式(31)的间隔和95% CI两者将其覆盖。如果预期胎儿分数落在(2)处,则只有来自等式(31)的间隔将其覆盖。如果预期胎儿分数落在(3)处,则各间隔中没有一个将其覆盖。因此,来自等式(31)的间隔覆盖预期胎儿分数的概率为至少95%。最后,来自等式(31)的间隔覆盖 CI的要求导致等式(32)。
在其它实施例中,如果存在大量的位点和具有体积足够大的dPCR仪器,则有可能跳过预扩增步骤。
V. 计算PCR循环
因此,基于等式(29)和(34),实施例可以使用以下不等式来计算预扩增所需的PCR循环的数目:
实际上,可以通过为PCR效率分配下界而使用下面的闭合型公式来求解等式(35),并且因此
其中
可以从该要求导出等式(35),即预扩增分子的输入数目乘以用于控制染色体的平均效率比率(和除以位点的数目)提供输出控制分子的数目,其如果多于dPCR实验所需的最小输入的话被部分约束τ减少。
因此,可以基于用于dPCR实验的控制染色体分子的最小输入数目、用于预扩增程序的控制染色体分子的最小输入数目、用于针对预扩增程序的PCR效率的下界、用于预扩增的位点的数目以及部分约束来确定预扩增程序中的PCR循环的数目。
VI. 结果
在本节中描述的所有结果假设所有PCR效率等于0.95,胎儿分数相对误差容限ψ=0.05,胎儿分数误差控制数η=0.05,并且输入到dPCR实验的预扩增体积的部分是τ=0.005。我们假设用于测试染色体和控制染色体的相等的位点数目,并且尝试3个不同的位点数目(1、12和96个位点)以看到位点的数目如何影响PCR循环的所需数目。给定某些假阳性和假阴性比率,我们首先使用等式(29)来估计需要输入到dPCR实验的控制染色体分子的数目。给定胎儿分数,我们使用等式(34)来估计需要输入到预扩增的控制染色体分子的数目。然后,我们基于这2个数目来获得用于针对预扩增的PCR循环的所需数目的估计。我们使用PCR循环的此最小所需数目来计算分子的预期数目的最小可检测相对差并对其进行绘图。该最小可检测相对差是有帮助的,因为已知临床样本中的DNA浓度的范围,其定义输入到dPCR中的分子(在没有预扩增的情况下);或者如果进行预扩增,则可以基于预扩增有多少循环和初始输入来控制多少被输入到dPCR。
图5是根据本发明的实施例的示出了不同胎儿分数520下的到预扩增程序的控制染色体分子410的最小输入数目的表格500。根据本发明的实施例,表格500提供控制染色体分子510的最小输入数目,其符合将整体血浆中的未知预期胎儿分数与来自采样血浆的所估计的胎儿分数之间的相对误差小于等于5%(胎儿DNA分数误差容限)的概率控制为至少95%(由误差控制数指定)。使用等式(34)来确定表格500中的最小数目。
图6是根据本发明的实施例的示出了需要输入到dPCR实验以便在FP (650)、FN(660)比率和胎儿分数的不同情形下检测T21的控制染色体分子610—640的最小总数的表格600。当h=1.5时,基于等式(29)来计算控制染色体分子610—640的最小总数。如所示,如果将至少49,683个控制染色体分子输入到预扩增并将至少194,590个控制染色体分子输入到dPCR实验,则可能在低至3%的胎儿分数下检测到1% FP和1% FN比率下的三体性。
如预期的,针对FP和FN比率的固定值,胎儿分数越高,用于dPCR实验的分子的所需总数越小。针对胎儿分数的固定值,FP和FN比率越严格,针对dPCR实验需要的分子总数越多。
图7是根据本发明的实施例的列出在不同情形下预扩增所需的PCR循环710—740的最小数目的表格700。各种情形包括位点的数目、FP 750、FN 760比率以及胎儿分数以便从需要输入到预扩增的控制染色体分子的总数(表格500)实现需要输入到dPCR实验的控制染色体分子的数目(表格600)。使用等式(37)来确定表格700中的循环的数目。
例如低至3%的胎儿分数下的1% FP和1% FN比率及仅1个位点,这在49,683个控制染色体分子的预扩增中要求至少10个PCR循环以获得到dPCR实验中的194,590个控制染色体分子(即,给定用于要输入到dPCR实验的预扩增输入分子的分数0.005的部分约束)。在这种情况下,当位点的数目增加至12个时,PCR循环的所需数目下降至7个。在相同情况下,当位点的数目增加至大得多的值96时,PCR循环的所需数目进一步下降至4。
不同的dPCR仪器具有不同的体积,因此体积约束跨各平台是不同的。在这里我们用体积约束是0.05的假设来完成计算。具有较大体积约束的平台将进一步减少PCR循环数目。因此,用大数目的位点(例如06)和具有较大体积的dPCR平台,可以跳过预扩增步骤,这将帮助减少实验噪声。然而,设计许多试验可能由于引物—二聚物问题而是非常困难的。如果不能实现位点的期望数目,则预扩增步骤仍是必需的。
图8A—8C示出根据本发明的实施例的针对不同水平的FP和FN比率的分子的预期数目的最小可检测相对差(黑色实线)与控制染色体分子的预期总数之间的关系的绘图。在图8A中,最小可检测相对差810(例如,如由等式(27)确定)随着增加而减小,因为更多的分子允许检测较小的差(例如,由于低胎儿DNA分数)。线811—814(由等式(19)确定)分别地表示不同的胎儿DNA分数3%、5%、10%和15%。当胎儿分数是10%时,最小可检测相对差810和蓝色实线813交叉处的是用于检测T21的最小所需
因此,类似于图8A的分析还可以用来确定分子的最小所需数目(即,作为等式27—29的替代)。图8A—8C示出了和误差率如何影响最小可检测相对差。图6还示出通过增加误差率,可以减少分子的最小所需数目。图6还可以用于确定是否存在对预扩增的需要。假设知道临床样本的输入DNA的范围低于分子的最小所需数目(即范围低于 ,在该处黑线和彩色线交叉),则我们知道我们需要预扩增以便在一定的误差率下检测非整倍体。相反地,如果范围高于分子的最小所需数目,则可以跳过预扩增。
图8A对应于1%的假阳性比率和假阴性比率。图8B对应于2.5%的假阳性比率和假阴性比率。图8C对应于5%的假阳性比率和1%的假阴性比率,这是其中两个比率不同的示例。如可以看到的,图8B中的最小可检测相对差820在图8A中的最小可检测相对差810之前穿过5%胎儿DNA分数,这是预期的,因为图8A具有更严格的误差率。图8C中的最小可检测相对差830在与图8B中大约相同的控制分子数处穿过5%胎儿DNA分数。这是较高假阳性比率、但较低的假阴性比率的结果。
总而言之,实施例提供了用于设计用于无创产前测试的dPCR实验的统计框架。具体地,实施例可以提供用于确定测试染色体和控制染色体的分子的预期数目的最小可检测相对差,以及需要输入到dPCR实验以便检测一定水平的假阳性和假阴性比率下的非整倍体的控制染色体分子的最小总数、需要输入到预扩增以便控制一定水平下的采样血浆中的胎儿分数的相对误差的控制染色体分子的最小总数,以及预扩增需要的PCR循环的最小数目的工具。我们示出可以针对低至3%的胎儿分数检测1% FP和1% FN比率下的三体性。
在某些实施例中,计算机系统可以计算结合了PCR效率、PCR循环的数目以及胎儿分数的分子的预期数目的相对差,并且使用该相对差来执行用于被测试的患者是否具有非整倍体胎儿的统计假设检验。这还得出dPCR实验所需的控制染色体分子的最小可检测相对差和最小总数。我们还考虑用于在预扩增之前测量胎儿分数的不同方式。
本发明的各种实施例的示例性优点包括以下各项。一是具有预扩增步骤的实验性工作流程下的分子的预期数目的相对差的计算(例如,该相对差结合了PCR效率、PCR循环数目、非整倍体的程度以及胎儿分数)。我们表明预扩增步骤在此应用中由于无细胞胎儿DNA的有限量而是必需的。第二是非整倍体的检测并不取决于分区的数目,而是取决于输入分子的总数。因此,可以将实施例应用于除dPCR仪器之外的技术,只要可以以足够的精度(例如NGS技术)对DNA分子计数即可。第三是比较两个泊松率(和 )的检验统计量比由参考文献[5]、[8]和[6]所提出的其它现有方法更强大。第四是实验性工作流程所特定的附加感兴趣量的使用:分子的预期数目的最小可检测相对差、预扩增和dPCR实验所需的控制染色体分子的最小总数以及预扩增所需的PCR循环的最小数目。总而言之,实施例提供了供在规划用于无创产前测试的dPCR实验时使用的重要量。
VII. 计算机系统
在本文中提到的任何计算机系统可以利用任何适当数目的子系统。在计算机设备10中,在图9中示出了此类子系统的示例。在某些实施例中,计算机系统包括单个计算机设备,其中,该子系统可以是计算机设备的组件。在其它实施例中,计算机系统可以包括多个计算机设备,每个是子系统,具有内部组件。
图9中所示的子系统经由系统总系75互连。示出了附加子系统,诸如打印机74、键盘78、存储装置79、监视器76(其被耦合到显示适配器82)以及其他附加子系统。被耦合到I/O控制器71的外围设备和输入/输出(I/O)装置可以用本领域中已知的任何数目的手段(诸如输入/输出(I/O)端口77(例如,USB、FireWire®))连接到计算机系统。例如,可以使用I/O端口77或外部接口81(例如以太网、Wi-Fi等)将计算机系统10连接到广域网(诸如因特网)、鼠标输入装置或扫描仪。经由系统总线75的互连允许中央处理器73与每个子系统通信并控制来自系统存储器72或存储装置79(例如,固定盘,诸如硬盘驱动器或光盘)的指令的执行以及子系统之间的信息的交换。系统存储器72和/或存储装置79可以体现计算机可读介质。本文中提到的任何数据可以被从一个组件输出到另一组件,并且可以被输出给用户。
计算机系统可以包括例如被外部接口81或被内部接口连接在一起的多个相同组件或子系统。在某些实施例中,计算机系统、子系统或设备可以通过网络进行通信。在这种情况下,可以将一个计算机视为客户端,并将另一计算机视为服务器,其中,每个可以是同一计算机系统的一部分。客户端和服务器每个可以包括多个系统、子系统或组件。
应理解的是可以使用硬件(例如专用集成电路或现场可编程门阵列)以控制逻辑的形式和/或以模块化或集成方式使用计算机软件与一般可编程处理器来实现本发明的任何实施例。如本文中所使用的,处理器包括单核处理器、同一集成芯片上的多核处理器或者在单个电路板上或被联网的多个处理单元。基于本文中提供的公开和讲授,本领域普通技术人员将了解并认识到使用硬件及硬件和软件的组合来实现本发明的实施例的其它方式和/或方法。
可以将本申请中描述的任何软件组件或功能实现为软件代码以便由处理器使用任何适当的计算机语言(诸如例如,R、Java、C、C++、C#、Objective-C、Swift或脚本语言(诸如Perl或Python),其使用例如常规或面向对象技术)来执行。可以将软件代码存储为计算机可读介质上的一系列指令或命令以用于存储和/或传输,适当的介质包括随机存取储器(RAM)、只读存储器(ROM)、诸如硬盘驱动器或软盘之类的磁性介质或者诸如紧凑式盘(CD)或DVD(数字多功能盘)等光学介质、闪存,等等。计算机可读介质可以是此类存储或传输装置的任何组合。
此类程序还可以被编码并使用适合于经由符合各种协议的有线、光学和/或无线网络(包括因特网)传输的载波信号来传输。同样地,可以使用用此类程序编码的数据信号来创建根据本发明的实施例的计算机可读介质。可以用兼容装置来封装或者从其它装置单独地提供(例如,经由因特网下载)具有程序代码编码的计算机可读介质。任何此类计算机可读介质可以驻留于单个计算机产品(例如,硬盘驱动器、CD或整个计算机系统)上或其内部,并且可以存在于系统或网络内的不同计算机产品上或其内部。计算机系统可以包括用于向用户提供本文中提到的任何结果的监视器、打印机或其它适当显示器。
本文中所描述的任何方法可以全部或部分地用包括一个或多个处理器(其可以被配置成执行步骤)的计算机系统来执行。因此,实施例可以针对被配置成执行本文中所述的任何方法的步骤的计算机系统,潜在地具有执行相应步骤或相应组步骤的不同组件。虽然提出为编号步骤,但本文中的方法的步骤可以同时或者按照不同的顺序执行。另外,可以将那些步骤的各部分与来自其它方法的其它步骤的各部分一起使用。并且,步骤的全部或部分可以是可选的。另外,任何所述方法的任何步骤可以用模块、电路或用于执行这些步骤的其它手段来执行。
在某些方面,本发明还提供了数字式PCR系统。在图10和图11中显示了示例性数字式PCR系统。图10示出了解释可以用来实现本文中公开的方法的软件和硬件资源之间的关系的一般框图。图11中描绘的数字式PCR系统包括可以位于dPCR仪器中的dPCR分析模块和作为计算机系统的一部分的智能模块。数据集经由网络连接或直接连接从分析模块传输到只能模块,或反之亦然。可以例如根据如图3上描绘的流程图来处理该数据集。此流程图可以方便地例如根据如图10上描绘的流程图由存储在计算机系统的硬件上的软件实现。参考图10,计算机系统(100)可以包括例如用于接收任何样本数据、dPCR过程数据和准确度数据的接收部件(110)、用于计算用于dPCR实验的控制染色体分子的最小输入数目的第一计算部件(120)、用于计算用于预扩增程序的控制染色体分子的最小数目的第二计算部件(130)以及用于估计预扩增程序中的PCR循环的数目的估计部件(140)。在某些实施例中,该系统还可以包括用于在计算机屏幕上显示结果的显示部件。图11图示出dPCR装置与计算机系统之间的交互。该系统包括可以位于dPCR仪器中的dPCR分析模块和作为计算机系统的一部分的智能模块。数据集经由网络连接或直接连接从分析模块传输到智能模块,或反之亦然。根据图10,该数据集可以被在处理器上运行的计算机代码处理并存储在智能模块的存储装置上,并且在处理之后被传输到dPCR分析模块的存储装置,可以在显示装置上从该存储装置显示该数据或该数据可以用来在dPCR装置上实施dPCR实验,或者存储在计算机系统的存储介质上,可以在显示装置上从该存储介质显示数据以形成用于执行dPCR实验的基础。在某些实施例中,还可以在dPCR仪器上实现智能模块。
可以以任何适当方式将特定实施例的特定细节组合。然而,本发明的其它实施例可以针对涉及每个单独方面或这些单独方面的特定组合的特定实施例。
本发明的示例性实施例的以上描述已出于举例说明和描述的目的而提出。选择并描述实施例是为了最好地解释本发明的原理及其实际应用,从而使得本领域其他技术人员能够在各种实施例中最好地利用本发明,并且具有适合于设想的特定用途的各种修改。
“一”、“一个”或“该”的叙述意图意指“一个或多个”,除非具体地相反指示。“或”的使用意图意指“包括的或”且不是“排除性或”,除非具体地相反指示。
VIII. 参考文献
1. H. Christina Fan and Stephen R. Quake. Detection of aneuploidy withdigital polymerase chain reaction. Analytical Chemistry, 79(19):7576–7579,2007.
2. Y. M. Dennis Lo, Fiona M. F. Lun, K. C. Allen Chan, Nancy B. Y. Tsui,Ka C. Chong, Tze K. Lau, Tak Y. Leung, Benny C. Y. Zee, Charles R. Cantor,and Rossa W. K. Chiu. Digital pcr for the molecular detection offetalchromosomal aneuploidy. Proceedings of the National Academy of Sciences,104(32):13116–13121, 2007.
3. Fiona M. F. Lun, Nancy B. Y. Tsui, K. C. Allen Chan, Tak Y. Leung,TzeK. Lau, Pimlak Charoenkwan, Katherine C. K. Chow, Wyatt Y. W. Lo, ChananeWanapirak, Torpong Sanguansermsri, Charles R. Cantor, Rossa W. K. Chiu, andY. M. Dennis Lo. Noninvasive prenatal diagnosis ofmonogenic diseases bydigital size selection and relative mutation dosage on DNA in maternalplasma. Proceedings of the National Academy of Sciences,105(50):19920–19925,2008.
4. Bernhard G. Zimmermann, Simon Grill, Wolfgang Holzgreve, XiaoYanZhong, Laird G. Jackson, and Sinuhe Hahn. Digital pcr: a powerful newtoolfor noninvasive prenatal diagnosis Prenatal Diagnosis, 28(12):1087–1093,2008.
5. Michael D. Huffman. An improved approximate two-sample poissontest.Journal of the Royal Statistical Society. Series C (Applied Statistics),33:224–226, 1984.
6. Kangxia Gu, Hon Keung Tony Ng, Man Lai Tang, andWilliam R. Schucany.Testing the ratio of two poisson rates. Biometrical Journal, 50:283–298,2008.
7. Kevin A Heyries, Carolina Tropini, Michael VanInsberghe, CallumDoolin, Oleh I Petriv, Anupam Singhal, Kaston Leung, Curtis B Hughesman, andCarl L Hansen. Megapixel digital pcr. Nat Meth, 8:649–651, 2011.
8. Hon Keung Tony Ng and Man-Lai Tang. Testing the equality of twopoisson means using the rate ratio. Statistics in Medicine, 24:955–965, 2005.
9. Izaskun Mallona, Julia Weiss, and Marcos Egea-Cortines.“pcrEfficiency: a Web tool for PCR amplification efficiency prediction,” BMCBioinformatics 2011, 12:404.
10. Jan M. Ruijter, Michael W. Pfaffl, Sheng Zhao, Andrej Spiess, GregoryBoggy, Jochen Blom, Robert G. Rutledge, Davide Sisti, Antoon Lievens, KatleenDe Preter, Stefaan Derveaux, Jan Hellemans, and Jo Vandesompele., “Evaluationof qPCR curve analysis methods for reliable biomarker discovery: Bias,resolution, precision, and implications,” Methods 59 (2013) 32–46.
11. Jason E. Kreutz, Todd Munson, Toan Huynh, Feng Shen, Wenbin Du, andRustem F. Ismagilov. Theoretical design and analysis of multivolume digitalassays with wide dynamic range validated experimentally with microfluidicdigital PCR. Anal. Chem. 83: 8158-8168, 2011.

Claims (20)

1.一种确定用于涉及到来自怀有胎儿的女性的血浆样本中的DNA分子的预扩增的数字式PCR(dPCR)实验的设置的方法,所述dPCR实验用于检测染色体非整倍体,该方法包括
- 在计算机系统处接收数据,该数据包括:
- 测试染色体和控制染色体中的每一个上的位点的数目;
- 在血浆样本中测得的胎儿DNA分数;
- 胎儿DAN分数的测量结果中的胎儿DNA分数误差容限;
- 误差控制数,其控制未知预期胎儿DNA分数与来自血浆的所估计的胎儿DNA分数之间的相对误差在胎儿DNA分数误差容限内的概率;
- 正在测试的非整倍体的程度;
- 部分约束,其指定要输入到dPCR实验的预扩增程序所引起的DNA分子的一部分,预扩增程序将来自血浆样本的DNA放大;
- 关于用于预扩增程序的PCR效率的数据;以及
- 包括假阳性比率和假阴性比率的差错率准则;
- 由计算机系统基于差错率准则、胎儿DNA分数、关于PCR效率的数据以及非整倍体的程度来计算用于dPCR实验的控制染色体分子的最小输入数目;
- 由计算机系统基于胎儿DNA分数、胎儿DNA分数误差容限以及误差控制数来计算用于预扩增程序的控制染色体分子的最小数目;
- 由计算机系统基于用于dPCR实验的控制染色体分子的最小输入数目、用于预扩增程序的控制染色体分子的最小数目、关于用于预扩增程序的PCR效率的数据、用于预扩增的位点的数目以及部分约束来估计预扩增程序中的PCR循环的数目。
2.权利要求1的方法,还包括:
- 基于用于输入到预扩增程序的DNA分子的最小数目来确定样本的尺寸。
3.权利要求2的方法,还包括:
- 使用用于预扩增程序的控制染色体分子的最小数目、预扩增程序中的PCR循环的估计数目以及用于dPCR实验的控制染色体分子的最小输入数目来执行预扩增程序和dPCR实验;
- 基于用于来自测试染色体和一个或多个控制染色体的DNA片断的正分区来获得测试度量;以及
- 将测试度量与截止值相比较以确定胎儿是否具有染色体非整倍体。
4.权利要求2或3的方法,其中,输入到预扩增程序的样本尺寸至少提供用于输入到预扩增程序的DNA分子的最小数目,其中,所述预扩增程序执行至少估计次数的CPR循环,并且其中,至少最小输入数目的控制染色体分子被输入到dPCR实验。
5.权利要求1至4中的任一项的方法,其中,关于PCR效率的数据包括以下各项中的至少一个:
- 用于PCR效率的预先指定下界;
- 关于测试染色体和控制染色体的相等平均PCR效率的假设;以及
- 用于针对测试染色体和控制染色体的预扩增程序的PCR效率比率。
6.权利要求1至5中的任一项的方法,还包括:
- 使用差错率准则、胎儿DNA分数以及到数字式PCR实验的控制染色体分子的输入数目来计算用于数字式PCR实验的最小可检测相对差;以及
- 使用最小可检测相对差来计算用于dPCR实验的控制染色体分子的最小输入数目。
7.权利要求1至6中的任一项的方法,其中,计算用于dPCR实验的控制染色体分子的最小输入数目由下式确定:
其中
其中,f是胎儿DNA分数,h是非整倍体的程度,R是关于PCR效率的数据且对应于控制染色体和测试染色体的位点处的效率的比,g(1)是h=1时的g(h)的值,α是假阳性比率且β是假阴性比率,z1-α是标准正态分布的第分位数,z1-β是标准正态分布的第分位数。
8.权利要求7的方法,其中:
其中,Lc是一个或多个控制染色体上的位点的数目,Lt是测试染色体上的位点的数目,p是预扩增循环的数目,并且y是特定位点处的效率。
9.权利要求7的方法,其中,R是
10.权利要求1至9中的任一项的方法,其中,计算用于预扩增程序的控制染色体分子的最小数目由下式确定:
其中,ψ是胎儿DNA分数误差容限,f是胎儿DNA分数,η是误差控制数,并且是标准正态分布的第分位数。
11.权利要求1至10中的任一项的方法,其中,估计预扩增程序中的PCR循环的数目由下式确定:
其中,是用于dPCR实验的控制染色体分子的最小输入数目,τ是部分约束,y0是预扩增程序中的用于PCR效率的下界,Lc是一个或多个控制染色体上的位点的数目,并且等于测试染色体上的位点的数目,并且是用于预扩增程序的控制染色体分子的最小数目。
12.权利要求1至11中的任一项的方法,其中,所述胎儿DNA分数误差容限是0.05,所述误差控制数是0.05,并且部分约束是0.005。
13.权利要求3至12中的任一项的方法,其中,仅使用一个控制染色体,其中,在测试染色体和控制染色体上使用多个位点,并且其中,在测试染色体和控制染色体上使用相同数目的位点。
14.一种计算机产品,其包括存储多个指令的非临时计算机可读介质,所述多个指令在被执行时控制计算机系统以确定用于涉及到来自怀有胎儿的女性的血浆样本的DNA分子的预扩增的数字式PCR(dPCR)实验的设置,所述dPCR实验用于检测染色体非整倍体,所述指令包括
- 接收数据,所述数据包括:
- 测试染色体和控制染色体中的每一个上的位点的数目;
- 在血浆样本中测得的胎儿DNA分数;
- 胎儿DAN分数的测量结果中的胎儿DNA分数误差容限;
- 误差控制数,其控制未知预期胎儿DNA分数与来自血浆的所估计的胎儿DNA分数之间的相对误差在胎儿DNA分数误差容限内的概率;
- 正在测试的非整倍体的程度;
- 部分约束,其指定要输入到dPCR实验的预扩增程序所引起的DNA分子的一部分,预扩增程序将来自血浆样本的DNA放大;
- 关于用于预扩增程序的PCR效率的数据;以及
- 包括假阳性比率和假阴性比率的差错率准则;
- 基于差错率准则、胎儿DNA分数、关于PCR效率的数据以及非整倍体的程度来计算用于dPCR实验的控制染色体分子的最小输入数目;
- 基于胎儿DNA分数、胎儿DNA分数误差容限以及误差控制数来计算用于预扩增程序的控制染色体分子的最小数目;
- 基于用于dPCR实验的控制染色体分子的最小输入数目、用于预扩增程序的控制染色体分子的最小数目、关于用于预扩增程序的PCR效率的数据、用于预扩增的位点的数目以及部分约束来估计预扩增程序中的PCR循环的数目。
15.权利要求14的计算机产品,其中,计算用于dPCR实验的控制染色体分子的最小输入数目由下式确定:
其中
其中,f是胎儿DNA分数,h是非整倍体的程度,R是关于PCR效率的数据且对应于控制染色体和测试染色体的位点处的效率的比,g(1)是h=1时的g(h)的值,α是假阳性比率且β是假阴性比率,z1-α是标准正态分布的第分位数,z1-β是标准正态分布的第分位数。
16.权利要求15的计算机产品,其中:
其中,Lc是一个或多个控制染色体上的位点的数目,Lt是测试染色体上的位点的数目,p是预扩增循环的数目,并且y是特定位点处的效率。
17.权利要求14至16中的任一项的计算机产品,其中,计算用于预扩增程序的控制染色体分子的最小数目由下式确定:
其中,ψ是胎儿DNA分数误差容限,f是胎儿DNA分数,η是误差控制数,并且是标准正态分布的第分位数。
18.权利要求14至17中的任一项的计算机产品,其中,估计预扩增程序中的PCR循环的数目由下式确定:
其中,是用于dPCR实验的控制染色体分子的最小输入数目,τ是部分约束,y0是预扩增程序中的用于PCR效率的下界,Lc是一个或多个控制染色体上的位点的数目,并且等于测试染色体上的位点的数目,并且是用于预扩增程序的控制染色体分子的最小数目。
19.权利要求14至18中的任一项的计算机产品,其中,关于PCR效率的数据包括以下各项中的至少一个:
- 用于PCR效率的预先指定下界;
- 关于测试染色体和控制染色体的相等平均PCR效率的假设;以及
- 用于针对测试染色体和控制染色体的预扩增程序的PCR效率比率。
20.权利要求14至19中的任一项的计算机产品,其中,所述指令还包括:
- 使用差错率准则、胎儿DNA分数以及到数字式PCR实验的控制染色体分子的输入数目来计算用于数字式PCR实验的最小可检测相对差;以及
- 使用最小可检测相对差来计算用于dPCR实验的控制染色体分子的最小输入数目。
CN201580050951.2A 2014-09-22 2015-09-22 用于无创产前测试的数字pcr的设计 Active CN106715721B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/493271 2014-09-22
US14/493,271 US10612080B2 (en) 2014-09-22 2014-09-22 Digital PCR for non-invasive prenatal testing
PCT/EP2015/071685 WO2016046183A1 (en) 2014-09-22 2015-09-22 Design of digital pcr for non-invasive prenatal testing

Publications (2)

Publication Number Publication Date
CN106715721A true CN106715721A (zh) 2017-05-24
CN106715721B CN106715721B (zh) 2024-05-21

Family

ID=54249450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580050951.2A Active CN106715721B (zh) 2014-09-22 2015-09-22 用于无创产前测试的数字pcr的设计

Country Status (6)

Country Link
US (2) US10612080B2 (zh)
EP (1) EP3198496B1 (zh)
JP (1) JP6669733B2 (zh)
CN (1) CN106715721B (zh)
CA (1) CA2961433C (zh)
WO (1) WO2016046183A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784197A (zh) * 2017-10-27 2018-03-09 华东医药(杭州)基因科技有限公司 一种pcr实验优化方法
CN109192243A (zh) * 2018-08-13 2019-01-11 成都凡迪医学检验所有限公司 染色体比例的修正方法、装置、介质
CN109355380A (zh) * 2018-12-29 2019-02-19 苏州恩科金生物科技有限公司 检测母体外周血染色体异常的引物、试剂盒及检测方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3665297A4 (en) * 2017-08-11 2021-05-12 Atila Biosystems Incorporated DIGITAL AMPLIFICATION WITH LIMITED NUCLEOTIDIC COMPOSITION PRIMERS
CN109520448A (zh) * 2018-10-29 2019-03-26 绍兴文理学院 一种基于简单随机抽样原理的结构面粗糙度系数统计测量样本数确定方法
WO2021219675A1 (en) * 2020-04-30 2021-11-04 F. Hoffmann-La Roche Ag A method for detecting reaction volume deviations in a digital polymerase chain reaction

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101821619A (zh) * 2007-09-07 2010-09-01 弗卢丁公司 拷贝数变化确定、方法和系统
CN103608818A (zh) * 2011-02-09 2014-02-26 纳特拉公司 非侵入性产前倍性识别方法
CN103911427A (zh) * 2014-01-27 2014-07-09 上海涌泰生物医药科技有限公司 一种基于数字pcr平台检测基因点突变的方法和试剂盒
CN104053784A (zh) * 2011-11-17 2014-09-17 好奇诊断有限责任公司 进行定量测定的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HRP20230134T1 (hr) * 2009-11-05 2023-03-31 The Chinese University Of Hong Kong Analiza genoma fetusa iz biološkog uzorka majke
JP6105485B2 (ja) * 2011-01-05 2017-04-05 ザ・チャイニーズ・ユニバーシティー・オブ・ホンコンThe Chinese University Of Hong Kong 胎児の性染色体遺伝子型の非侵襲的出生前同定
US20140100126A1 (en) * 2012-08-17 2014-04-10 Natera, Inc. Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data
BR112015005702A2 (pt) 2012-09-14 2017-07-04 Life Technologies Corp métodos e sistemas para um projetor de experimento de pcr digital
WO2014200579A1 (en) * 2013-06-13 2014-12-18 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101821619A (zh) * 2007-09-07 2010-09-01 弗卢丁公司 拷贝数变化确定、方法和系统
CN103608818A (zh) * 2011-02-09 2014-02-26 纳特拉公司 非侵入性产前倍性识别方法
CN104053784A (zh) * 2011-11-17 2014-09-17 好奇诊断有限责任公司 进行定量测定的方法
CN103911427A (zh) * 2014-01-27 2014-07-09 上海涌泰生物医药科技有限公司 一种基于数字pcr平台检测基因点突变的方法和试剂盒

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FAN C 等: "Detection of Aneuploidy with Digital Polymerase Chain Reaction", 《ANALYTICAL CHEMISTRY》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784197A (zh) * 2017-10-27 2018-03-09 华东医药(杭州)基因科技有限公司 一种pcr实验优化方法
CN109192243A (zh) * 2018-08-13 2019-01-11 成都凡迪医学检验所有限公司 染色体比例的修正方法、装置、介质
CN109355380A (zh) * 2018-12-29 2019-02-19 苏州恩科金生物科技有限公司 检测母体外周血染色体异常的引物、试剂盒及检测方法

Also Published As

Publication number Publication date
EP3198496B1 (en) 2018-06-13
WO2016046183A1 (en) 2016-03-31
US10612080B2 (en) 2020-04-07
CN106715721B (zh) 2024-05-21
US11866772B2 (en) 2024-01-09
CA2961433C (en) 2020-04-21
JP6669733B2 (ja) 2020-03-18
US20160083787A1 (en) 2016-03-24
EP3198496A1 (en) 2017-08-02
JP2017535841A (ja) 2017-11-30
CA2961433A1 (en) 2016-03-31
US20200181693A1 (en) 2020-06-11

Similar Documents

Publication Publication Date Title
CN106715721A (zh) 用于无创产前测试的数字pcr的设计
Jin et al. Estimating the null and the proportion of nonnull effects in large-scale multiple comparisons
Xavier et al. Development and validation of the VISAGE AmpliSeq basic tool to predict appearance and ancestry from DNA
CN108319813A (zh) 循环肿瘤dna拷贝数变异的检测方法和装置
CN103093119A (zh) 一种利用网络结构信息识别显著生物通路的方法
CN112185464A (zh) 一种基于孟德尔随机化的多性状全转录组关联分析方法、系统及其应用
KR20220073732A (ko) 분석물질 레벨의 적응적 정규화를 위한 방법, 장치 및 컴퓨터 판독가능 매체
CN117253539B (zh) 基于胚系突变检测高通量测序中样本污染的方法和系统
Fernandes et al. A reproducible effect size is more useful than an irreproducible hypothesis test to analyze high throughput sequencing datasets
CN107075565B (zh) 个体单核苷酸多态性位点分型方法及装置
US11473133B2 (en) Methods for validation of microbiome sequence processing and differential abundance analyses via multiple bespoke spike-in mixtures
CN102576389B (zh) 用于扩增反应的分析工具
Wei et al. NGS-based likelihood ratio for identifying contributors in two-and three-person DNA mixtures
CN117012274B (zh) 基于高通量测序识别基因缺失的装置
CN113195741A (zh) 从循环核酸中鉴定全基因组序列数据中的全局序列特征
CN105316223A (zh) 生物学样品分析系统及方法
Furlan et al. Genome-wide dynamics of RNA synthesis, processing and degradation without RNA metabolic labeling
CN116153411B (zh) 多病原体探针库组合的设计方法及应用
Schwarz Identification and clinical translation of biomarker signatures: statistical considerations
CN112342276A (zh) 核酸二级结构非特异荧光吸附用于微流控芯片检测的方法
Zhao Theory and Application About Variable Selection Approaches for High Dimensional Genomic Data
Karakurt et al. Evaluation of Differences of Fast and High Accuracy Base Calling Models of Guppy on Variant Calling Using Low Coverage WGS Data
Pecanka Multi-step statistical methods for simultaneous inference in genetics
Sun et al. W-Test for Genetic Epistasis Testing
Henry Peak detection and statistical analysis of karyotypic variation from flow cytometry data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant