CN109689888A - 无细胞核酸标准品及其用途 - Google Patents
无细胞核酸标准品及其用途 Download PDFInfo
- Publication number
- CN109689888A CN109689888A CN201780052680.3A CN201780052680A CN109689888A CN 109689888 A CN109689888 A CN 109689888A CN 201780052680 A CN201780052680 A CN 201780052680A CN 109689888 A CN109689888 A CN 109689888A
- Authority
- CN
- China
- Prior art keywords
- cfna
- nucleic acid
- standard items
- polynucleotides
- abundance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2545/00—Reactions characterised by their quantitative nature
- C12Q2545/10—Reactions characterised by their quantitative nature the purpose being quantitative analysis
- C12Q2545/113—Reactions characterised by their quantitative nature the purpose being quantitative analysis with an external standard/control, i.e. control reaction is separated from the test/target reaction
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开内容提供了包含基因组多核苷酸的无细胞核酸标准品以及使用包含基因组多核苷酸的无细胞核酸标准品来建立、优化和验证无细胞核酸测定的方法。
Description
交叉引用
本申请要求2016年6月23日提交的第62/353,779号美国临时专利申请的权益,该美国临时申请通过引用以整体并入本文用于所有目的。
发明背景
1948年首次描述了在血浆中存在cfDNA。最近的研究显示,一些cfDNA向血液中的释放与癌细胞的凋亡有关。已经发现,癌症患者中最丰富的cfDNA片段大小约为180个碱基对(bp),伴随有大小为180bp的倍数的较大DNA片段,这使人联想到由凋亡细胞所示的核小体DNA片段的阶梯模式。凋亡过程中DNA裂解成核小体DNA片段是由胱天蛋白酶活化的DNA酶(CAD,也称为DFF40)介导的。CAD切割核小体之间的连接体区并留下5'-磷酸基团和3'-羟基。
快速建立cfDNA测定技术,如高通量的下一代测序(NGS)、qPCR或数字PCR,使得能够对cfDNA样品进行特征分析。然而,由于样品的可变性和技术偏差,性能评价和不同测定之间的比较可能具有挑战性。
发明内容
与从人血浆中提取的人类cfDNA非常相似的cfDNA参考标准品对于在不同平台和实验室之间评价和验证cfDNA测定非常重要。目前可用的通过机械剪切产生的“人工cfDNA”通常包含具有平端、3'-和/或5'-突出端的多核苷酸的异质混合物,突出端可能缺乏5'-磷酸基团和3'-羟基,而MNA酶消化产生5'-羟基和3'-磷酸核苷酸。因此,这些人工cfDNA可能与真正的cfDNA有不同的表现。例如,具有3'-磷酸基团和/或5'-羟基的人工cfDNA可能具有不代表体内cfDNA的不同程度的连接效率。
鉴于前述内容,需要更好地代表体内cfDNA的诸如cfDNA标准品的无细胞核酸标准品。本公开内容解决了这些需求,并且还提供了其他优点。
在一方面,提供了一种用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中存在的靶核酸的丰度的方法,所述方法包括:(a)对所述CFNA样品中的所述靶核酸的拷贝数进行定量,以获得所述靶核酸的观测丰度;(b)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的所述参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(c)通过使用所述校准方案调整所述靶核酸的观测丰度来估算所述CFNA样品中的所述靶核酸的丰度。在一些实施方案中,所述CFNA标准品的少于50%的单个基因组多核苷酸具有相同的序列。在一些实施方案中,所述CFNA标准品包含具有相同成员的基因组多核苷酸的至少一个子集。在一些实施方案中,所述子集代表所述CFNA标准品的少于50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。在一些实施方案中,至少30%的所述基因组多核苷酸具有范围为约100-300个碱基的长度。在一些实施方案中,至少50%的所述基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。在一些实施方案中,基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶生成的。在一些实施方案中,所述CFNA标准品的所述基因组多核苷酸可以以至少约50%的效率连接。在一些实施方案中,所述CFNA标准品的基因组多核苷酸可以以通过定量聚合酶链反应(PCR)测定所确定的至少约50%的效率连接。在一些实施方案中,所述CFNA标准品的所述基因组多核苷酸在不存在磷酸供体的情况下是可连接的。
在一些实施方案中,CFNA标准品中存在的所述参考核酸的预期丰度小于20%。在一些实施方案中,所述参考核酸包含突变等位基因。在一些实施方案中,所述突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。
在一些实施方案中,生成所述校准方案还包括将附加CFNA标准品中存在的所述参考核酸的观测丰度与所述附加CFNA标准品中存在的所述参考核酸的预期丰度相关联。在一些实施方案中,所述附加CFNA标准品中存在的所述参考核酸的预期丰度不同于所述CFNA标准品中存在的所述参考核酸的预期丰度。
在一些实施方案中,生成所述校准方案还包括将所述CFNA标准品中存在的至少一种附加参考核酸的观测丰度与所述CFNA标准品中存在的所述至少一种附加参考核酸的预期丰度相关联。在一些实施方案中,所述CFNA标准品中存在的所述至少一种附加参考核酸的预期丰度小于20%。在一些实施方案中,所述至少一种附加参考核酸包含附加突变等位基因。在一些实施方案中,所述附加突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。
在一些实施方案中,所述CFNA标准品包含单链基因组多核苷酸。在一些实施方案中,所述CFNA标准品包含双链基因组多核苷酸。在一些实施方案中,在生成所述校准方案之前,使所述双链基因组多核苷酸变性以形成单链基因组多核苷酸。
在一些实施方案中,所述校准方案包括校准算法,该校准算法针对所述参考核酸的多个预期丰度水平调整所述参考核酸的观测丰度与所述参考核酸的预期丰度的偏差。在一些实施方案中,所述校准方案包括最佳拟合线。
在一些实施方案中,通过扩增反应确定所述靶核酸的观测丰度。在一些实施方案中,所述扩增反应包括数字聚合酶链反应(dPCR)。在一些实施方案中,所述扩增反应包括小液滴数字聚合酶链反应(ddPCR)。在一些实施方案中,所述扩增反应包括定量聚合酶链反应(qPCR)。在一些实施方案中,所述扩增反应使用对所述靶核苷酸具有特异性的扩增引物进行。
在一些实施方案中,所述CFNA标准品中存在的所述靶核酸的观测丰度通过以下步骤确定:(a)对多个扩增产物进行测序以生成多个序列读取,其中所述多个扩增产物是通过扩增所述CFNA样品中的所述靶核酸和非靶核酸生成的;以及(b)分析所述序列读取以计算所述靶核酸的观测丰度。
在一些实施方案中,在扩增之前,使所述靶核酸和所述非靶核酸环化以产生多个环化靶核酸和多个环化非靶核酸。在一些实施方案中,通过使存在于所述CFNA样品中的所述靶核酸和所述非靶核酸经历连接反应来实现环化。在一些实施方案中,在不存在磷酸供体的情况下,使所述靶核酸和所述非靶核酸环化。在一些实施方案中,所述靶核酸和所述非靶核酸以至少50%的效率环化。在一些实施方案中,所述方法进一步包括在扩增之前降解未环化的靶核酸和未环化的非靶核酸。
在一些实施方案中,扩增包括滚环扩增。在一些实施方案中,扩增包括随机引物的延伸。在一些实施方案中,扩增包括对靶序列具有特异性的一种或多种引物的延伸。在一些实施方案中,所述引物包含标签序列、测序引物结合序列或其两者。
在一些实施方案中,所述靶核酸和所述非靶核酸在扩增之前与衔接子多核苷酸连接,以产生多个衔接子标记的靶核酸和多个衔接子标记的非靶核酸。在一些实施方案中,通过使所述靶核酸和所述非靶核酸经历连接反应来实现与衔接子多核苷酸的连接。在一些实施方案中,在不存在磷酸供体的情况下将所述靶核酸和所述非靶核酸与衔接子多核苷酸连接。在一些实施方案中,所述靶核酸和所述非靶核酸以至少50%的效率与衔接子多核苷酸连接。在一些实施方案中,所述靶核酸和所述非靶核酸在A-加尾后以至少50%的效率与衔接子多核苷酸连接。
在一些实施方案中,所述衔接子多核苷酸包含标签序列、测序引物结合序列或其两者。在一些实施方案中,扩增包括对所述衔接子多核苷酸的引物结合序列具有特异性的一种或多种引物的延伸。
在一些实施方案中,所述靶核酸包含与所述参考核酸的核苷酸序列至少90%相同的核苷酸序列。在一些实施方案中,所述靶核酸的估算丰度是浓度。在一些实施方案中,所述靶核酸包含突变等位基因。在一些实施方案中,所述靶核酸的估算丰度是等位基因频率。
在一方面,一种用于评估无细胞核酸(CFNA)测定的检测极限的方法包括:(a)用多个CFNA标准品进行CFNA测定以对每个标准品获得每个标准品中存在的参考多核苷酸的观测丰度,所述多个CFNA标准品涵盖所述参考多核苷酸的给定范围的预期丰度,其中所述多个标准品中的每个标准品具有与所述多个标准品中的其他标准品不同的参考多核苷酸预期丰度,并且其中每个标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)对于所述多个标准品中的单个标准品,所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)对于所述多个标准品中的单个标准品,大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)鉴定所述参考多核苷酸的相应观测丰度在统计上无法与背景测量值区分时的预期丰度,从而将所述预期丰度判定为所述CFNA测定的检测极限。在一些实施方案中,所述参考多核苷酸的预期丰度的给定范围为约0.001%至20%。在一些实施方案中,所述参考多核苷酸包含突变等位基因。在一些实施方案中,所述预期丰度是等位基因频率。在一些实施方案中,等位基因频率的范围为约0.001%至50%。
在一些实施方案中,所述多个CFNA标准品的给定标准CFNA标准品的少于50%的单个基因组多核苷酸具有相同的序列。在一些实施方案中,所述多个CFNA标准品的至少一个包含具有相同成员的基因组多核苷酸的至少一个子集。在一些实施方案中,所述子集代表所述CFNA标准品的少于50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。在一些实施方案中,所述多个CFNA标准品的给定CFNA标准品的至少30%的所述基因组多核苷酸具有范围为约100-300个碱基的长度。在一些实施方案中,所述多个CFNA标准品的给定CFNA标准品的至少50%的所述基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。在一些实施方案中,基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶生成的。在一些实施方案中,所述多个CFNA标准品的给定CFNA标准品的所述基因组多核苷酸可以以至少约50%的效率连接。在一些实施方案中,所述多个CFNA标准品的给定CFNA标准品的所述基因组多核苷酸在不存在磷酸供体的情况下是可连接的。
在一些实施方案中,所述CFNA测定包括使所述CFNA标准品的所述基因组多核苷酸环化以产生多个环化基因组多核苷酸。在一些实施方案中,通过使所述基因组多核苷酸经历连接反应来实现环化。在一些实施方案中,所述基因组多核苷酸以至少50%的效率环化。
在一些实施方案中,所述CFNA测定包括将基因组多核苷酸与衔接子多核苷酸连接以产生多个衔接子标记的基因组多核苷酸。在一些实施方案中,通过使基因组多核苷酸经历连接反应来实现所述基因组多核苷酸与衔接子多核苷酸的连接。在一些实施方案中,所述基因组多核苷酸以至少50%的效率与衔接子多核苷酸连接。在一些实施方案中,所述基因组多核苷酸在A-加尾后以至少50%的连接效率与衔接子多核苷酸连接。
在一些实施方案中,所述多个CFNA标准品的给定CFNA标准品包含单链基因组多核苷酸。在一些实施方案中,所述多个CFNA标准品的给定CFNA标准品包含双链基因组多核苷酸。在一些实施方案中,所述CFNA测定包括下一代测序(NGS)、数字聚合酶链反应(dPCR)、小液滴数字聚合酶链反应(ddPCR)和/或定量聚合酶链反应(qPCR)。
在一方面,一种评估用于检测以给定预期丰度存在于CFNA标准品中的参考多核苷酸的无细胞核酸(CFNA)测定的灵敏度的方法包括:(a)用包含多个参考多核苷酸的CFNA标准品进行CFNA测定,以获得所述多个参考多核苷酸中的每个参考多核苷酸的阳性或阴性检测判定,其中每个参考多核苷酸以给定预期丰度存在于所述CFNA标准品中,其中所述CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,并且其中:(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)确定产生阳性检测判定的参考多核苷酸的分数,从而评估用于检测以给定预期丰度存在于所述CFNA标准品中的参考多核苷酸的所述CFNA测定的灵敏度。
在一方面,一种用于评估无细胞核酸(CFNA)测定的特异性的方法包括:(a)用CFNA标准品进行CFNA测定以获得多个参考多核苷酸中的每个参考多核苷酸的阳性或阴性检测判定,其中每个参考多核苷酸在所述CFNA标准品中不存在,并且其中:(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)确定产生阴性检测判定的参考多核苷酸的分数,从而评估所述CFNA测定的特异性。
在一些实施方案中,所述CFNA标准品的少于50%的单个基因组多核苷酸具有相同的序列。在一些实施方案中,所述CFNA标准品包含具有相同成员的基因组多核苷酸的至少一个子集。在一些实施方案中,所述子集代表所述CFNA标准品的少于50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。在一些实施方案中,至少30%的所述基因组多核苷酸具有范围为约100-300个碱基的长度。在一些实施方案中,至少50%的所述基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。在一些实施方案中,基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶生成的。在一些实施方案中,所述CFNA标准品的所述基因组多核苷酸可以以至少50%的效率连接。在一些实施方案中,所述CFNA标准品的所述基因组多核苷酸在不存在磷酸供体的情况下是可连接的。
在一些实施方案中,所述给定预期丰度小于20%。在一些实施方案中,所述CFNA标准品的每个参考多核苷酸包含突变等位基因。在一些实施方案中,每个突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。在一些实施方案中,所述多个参考多核苷酸包含至少两个参考多核苷酸。
在一些实施方案中,所述CFNA测定包括使所述CFNA标准品的所述基因组多核苷酸环化以产生多个环化基因组多核苷酸。在一些实施方案中,通过使所述基因组多核苷酸经历连接反应来实现环化。在一些实施方案中,所述基因组多核苷酸以至少50%的效率环化。
在一些实施方案中,所述CFNA测定包括将基因组多核苷酸与衔接子多核苷酸连接以产生多个衔接子标记的基因组多核苷酸。在一些实施方案中,通过使基因组多核苷酸经历连接反应来实现所述基因组多核苷酸与衔接子多核苷酸的连接。在一些实施方案中,所述基因组多核苷酸以至少50%的效率与衔接子多核苷酸连接。在一些实施方案中,所述基因组多核苷酸在A-加尾后以至少50%的连接效率与衔接子多核苷酸连接。
在一些实施方案中,所述CFNA标准品包含单链基因组多核苷酸。在一些实施方案中,所述CFNA标准品包含双链基因组多核苷酸。在一些实施方案中,所述CFNA测定包括下一代测序(NGS)、数字聚合酶链反应(dPCR)、小液滴数字聚合酶链反应(ddPCR)和/或定量聚合酶链反应(qPCR)。
在一方面,一种建立无细胞核酸(CFNA)测定的方法包括:(a)在多个测定条件下用CFNA标准品进行CFNA测定以产生一组性能指标,其中当在参考CFNA测定中使用时,所述CFNA标准品与一组参考性能指标相关联,其中所述CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)调整一个或多个测定条件以相对于至少一个参考性能指标改善至少一个性能指标,从而建立所述CFNA测定。
在一些实施方案中,至少一个性能指标是检测率(观测丰度/预期丰度)或检测极限。在一些实施方案中,所述测定包括连接反应。在一些实施方案中,测定条件是连接时间或连接温度。在一些实施方案中,所述测定包括扩增反应。在一些实施方案中,测定条件是扩增温度、扩增步骤的长度或扩增循环的数目。
在一些实施方案中,所述标准品包含至少一种参考核酸。在一些实施方案中,所述至少一种参考核酸以小于20%的预期丰度存在于所述CFNA标准品中。在一些实施方案中,所述至少一种参考核酸包含突变等位基因。在一些实施方案中,所述突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。
在一方面,提供了一种用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中的靶核酸丰度的系统,其包括:定量系统,其被配置用于确定所述CFNA样品中的所述靶核酸的拷贝数,以产生所述靶核酸的观测丰度;计算机,其被配置用于(a)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的所述参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)通过使用所述校准方案调整所述靶核酸的观测丰度来估算所述CFNA样品中的所述靶核酸的丰度。在一些实施方案中,所述系统还包括向接收者发送报告的报告生成器,其中所述报告包含以下至少一种:所述靶核酸的观测丰度、所述靶核酸的估算丰度、所述参考核酸的观测丰度、所述参考核酸的预期丰度和校准方案。
在一些实施方案中,提供了一种包含代码的计算机可读介质,所述代码在由一个或多个处理器执行时实现用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中的靶核酸丰度的方法,所述方法包括:(a)响应于用户请求,进行定量反应以确定所述CFNA样品中所述靶核酸的拷贝数,并产生所述靶核酸的观测丰度;(b)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的所述参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(c)通过使用所述校准方案调整所述靶核酸的观测丰度来估算所述CFNA样品中的所述靶核酸的丰度。在一些实施方案中,所述方法进一步包括(d)生成包含以下至少一种的报告:所述靶核酸的观测丰度、所述靶核酸的估算丰度、所述参考核酸的观测丰度、所述参考核酸的预期丰度和校准方案。
在一些方面,一种试剂盒包含:(a)包含多个基因组多核苷酸的无细胞核酸(CFNA)标准品,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)关于在CFNA分析中使用所述CFNA标准品的用户说明书。
在一些实施方案中,所述CFNA标准品的少于50%的单个基因组多核苷酸具有相同的序列。在一些实施方案中,所述试剂盒中的所述CFNA标准品包含具有相同成员的基因组多核苷酸的至少一个子集。在一些实施方案中,所述子集代表所述CFNA标准品的少于50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。在一些实施方案中,至少30%的所述基因组多核苷酸具有范围为约100-300个碱基的长度。在一些实施方案中,至少50%的所述基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。在一些实施方案中,基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶生成的。在一些实施方案中,所述CFNA标准品的所述基因组多核苷酸可以以至少50%的效率连接。在一些实施方案中,所述CFNA标准品的所述基因组多核苷酸在不存在磷酸供体的情况下是可连接的。
在一些实施方案中,所述CFNA标准品包含参考核酸。在一些实施方案中,所述参考核酸以小于20%的预期丰度存在于所述CFNA标准品中。在一些实施方案中,所述参考核酸包含突变等位基因。在一些实施方案中,所述突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。在一些实施方案中,所述CFNA标准品包含多种参考核酸。在一些实施方案中,所述多种参考核酸中的每种参考核酸包含突变等位基因。在一些实施方案中,每个突变等位基因以小于50%的等位基因频率存在。
在一些实施方案中,所述CFNA标准品包含单链基因组多核苷酸。在一些实施方案中,所述CFNA标准品包含双链基因组多核苷酸。
在一些实施方案中,所述试剂盒进一步包含连接酶。在一些实施方案中,所述试剂盒进一步包含连接反应缓冲液。
援引并入
本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。
附图说明
本发明的新颖特征在所附权利要求书中进行了具体阐述。通过参考以下对利用了本发明原理的说明性实施方案加以阐述的详细描述及其附图,将会获得对本发明的特征和优点的更好的了解,在附图中:
图1A示出了对照cfDNA样品的生物分析仪(Bioanalyzer)结果。
图1B示出了无细胞核酸(CFNA)标准品的生物分析仪结果。
图2示出了(i)未处理的、(ii)连接酶处理的以及(iii)连接酶+外切核酸酶处理的对照cfDNA、CFNA标准品和声处理的基因组DNA样品的电泳结果。
具体实施方式
除非另有说明,否则本文公开的一些方法的实施采用了本领域技术范围内的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术。参见,例如,Sambrook和Green,Molecular Cloning:A Laboratory Manual,第四版(2012);Current Protocols in Molecular Biology系列(F.M.Ausubel等编著);Methods InEnzymology系列(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编著(1995));Harlow和Lane编著(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of BasicTechnique and Specialized Applications,第6版(R.I.Freshney编著(2010))。
如在说明书和权利要求书中所使用的,除非上下文另外明确指出,否则单数形式“一个”、“一种”和“该”包括复数指代物。例如,术语“一种靶核酸”包括多种靶核酸,包括其混合物。
术语“约”或“大约”意指如本领域普通技术人员所确定的特定值在可接受的误差范围内,其部分地取决于该值是如何测量或确定的,即,测量系统的限制。例如,“约”可以是指根据本领域的实践,在1个或大于1个标准偏差内。或者,“约”可以是指给定值的高达20%、高达10%、高达5%或高达1%的范围。或者,尤其是对于生物系统或过程,该术语可以是指在数值的一个数量级内,优选地在5倍以内,更优选地在2倍以内。在本申请和权利要求书中描述特定值时,除另有说明外,术语“约”应该被认为是指在特定值的可接受的误差范围内。
术语“多核苷酸”、“核酸”和“寡核苷酸”是可以互换使用的。它们是指任意长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)或其类似物的聚合形式。多核苷酸可以具有任意三维结构,并且可以行使任何已知的或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码或非编码区、通过连锁分析确定的一个(多个)基因座、外显子、内含子、信使RNA(mRNA)、转运RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任意序列的分离的DNA、任意序列的分离的RNA、包括无细胞DNA(cfDNA)和无细胞RNA(cfRNA)在内的无细胞多核苷酸、核酸探针和引物。多核苷酸可以包含一个或多个修饰的核苷酸,例如甲基化核苷酸和核苷酸类似物。如果存在,对核苷酸结构的修饰可以在聚合物装配之前或之后赋予。核苷酸序列可以被非核苷酸组分打断。多核苷酸可以在聚合后被进一步修饰,例如,通过与标记组分偶联。
多核苷酸可以具有5’端和3’端,是指多核苷酸或核酸的单链的端到端化学取向。在线性DNA或RNA的单链中,命名核苷酸糖环中的碳原子的化学惯例意味着通常存在5’端和3’端,5’端常常含有附接至5'碳的磷酸基团,3’端通常未从核糖-OH取代基(羟基)修饰。在一些情况下,多核苷酸可以在5’端具有-OH取代基或羟基,并且在3’端具有-P基或磷酸基团。附接至5'-端的磷酸基团允许连接两个核苷酸,例如5'-磷酸与另一个核苷酸的3'-羟基的共价结合,从而形成磷酸二酯键。去除5'-磷酸可以抑制或阻止连接。3'-羟基也很重要,因为它在连接中与5'-磷酸接合。
术语“无细胞核酸”或“CFNA”是指细胞外核酸。细胞外核酸可见于诸如血液、尿液和粪便等生物来源中。CFNA可以指无细胞DNA(cfDNA)、无细胞RNA(cfRNA)或两者。CFNA可能是由于核酸从经历凋亡或坏死的细胞中脱落所导致的。以前的研究已经证明,CFNA,例如cfDNA,以稳态水平存在,并且可以随着细胞损伤或坏死而增加。在某些情况下,CFNA从异常细胞或不健康细胞如肿瘤细胞脱落。在一些情况下,可以使用基因组信息,如通过鉴定遗传变异,包括区分正常细胞和异常细胞的突变和/或基因融合,将从肿瘤细胞脱落的cfDNA与从正常或健康细胞脱落的cfDNA区分开。在一些情况下,CFNA从与胎儿相关的细胞脱落到母体循环中。在一些情况下,CFNA可以源自已经感染宿主如受试者(例如,患者)的病原体。
如本文所用,术语“基因组多核苷酸”是指来源于或分离自染色体的多核苷酸。基因组多核苷酸可以指任何长度的染色体的连续部分。
如本文所用,术语“靶多核苷酸”和“靶核酸”是指具有靶序列的核酸分子起始群体中的核酸分子或多核苷酸,该靶序列的存在、量和/或核苷酸序列或其中一个或多个的改变希望加以确定。靶多核苷酸可以是较大多核苷酸的一部分(例如待扩增、待测序或有待以其他方式分析的部分),或可用于指包含靶序列的较大多核苷酸。通常,术语“靶序列”是指在核酸单链上的核酸序列。靶序列可以是基因的一部分,调节序列,基因组DNA,包括cfDNA和/或cfRNA在内的CFNA,cDNA,融合基因,包括mRNA、miRNA、rRNA在内的RNA,等等。靶序列可以是来自样品的靶序列或次级靶标如扩增反应的产物。靶序列可包含等位基因(例如,野生型等位基因或变异等位基因)。
如本文所用,术语“等位基因”是指基因在特定基因座处的任何一种或多种替代形式,所有这些形式可涉及特定基因座处的一种性状或特征。在生物体的二倍体细胞中,给定基因的等位基因可位于染色体上的特定位置或基因座(多个基因座)处。在不同等位基因之间不同的这些变异位点处的序列被称为“变体”、“多态性”或“突变”。
当与等位基因或序列结合使用时,术语“野生型”通常是指编码在特定天然群体中最常见的表型的等位基因或序列。在一些情况下,野生型等位基因可以指群体中以最高频率存在的等位基因。在一些情况下,野生型等位基因或序列是指相对于异常状态如疾病状态,与正常状态相关的等位基因或序列。
当与等位基因或序列结合使用时,术语“突变的”或“变异的”通常是指不编码在特定天然群体中最常见的表型的等位基因或序列。在一些情况下,突变等位基因可以指相对于野生型等位基因在群体中以较低频率存在的等位基因。在一些情况下,突变等位基因或序列可以指从野生型序列突变为突变序列的等位基因或序列,该突变序列呈现与疾病状态相关的表型。突变等位基因和序列与野生型等位基因和序列可以仅一个碱基不同,也可以有多达数个碱基不同。当与基因结合使用时,术语突变通常是指基因中的一个或多个序列突变,包括点突变、单核苷酸多态性(SNP)、插入、缺失、置换、转座、易位、拷贝数变异或其他基因突变、改变或序列变异。
如本文所用,术语“等位基因频率”或“等位基因的频率”通常是指样品中等位基因(例如,基因的变体)的相对频率,例如表示为分数或百分比。在一些情况下,等位基因频率可以指诸如无细胞核酸样品的样品中等位基因(例如,基因的变体)的相对频率。在一些情况下,等位基因频率可以指诸如无细胞核酸标准品的样品中等位基因(例如,基因的变体)的相对频率。突变等位基因的等位基因频率可以指诸如无细胞核酸样品等样品中突变等位基因相对于野生型等位基因的频率。例如,如果样品包含100个拷贝的基因,其中5个是突变等位基因,且其中95个是野生型等位基因,则突变等位基因的等位基因频率为约5/100或约5%。可以使用不具有突变等位基因拷贝的样品(例如,约0%等位基因频率),例如,作为阴性对照。阴性对照可以是预期不会检测到突变等位基因的样品。以约50%的等位基因频率包含突变等位基因的样品可以例如代表种系杂合突变。
通常,术语“序列变体”是指序列中相对于一个或多个参考序列的任何变异。一般而言,对于参考序列已知的个体的给定群体,序列变体以比参考序列更低的频率发生。在一些情况下,参考序列为单个已知的参考序列,如单个个体的基因组序列。在一些情况下,参考序列是通过对多个已知序列,如用作参考群体的多个个体的基因组序列,或来自相同个体的多核苷酸的多个测序读取进行比对而形成的共有序列。在一些情况下,序列变体在群体中以低频率存在(也称为“罕见”序列变体)。例如,序列变体可以以约为或低于约5%、4%、3%、2%、1.5%、1%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.04%、0.03%、0.02%、0.01%、0.005%、0.001%或更低的频率存在。在一些情况下,序列变体以约为或低于约0.1%的频率存在。序列变体可以是相对于参考序列的任何变异。序列变异可以由一个核苷酸或多个核苷酸(例如2、3、4、5、6、7、8、9、10个或更多个核苷酸)的变化、插入或缺失组成。当序列变体包含两个或更多个核苷酸差异时,不同的核苷酸可以是彼此相邻近的,或不连续的。序列变体类型的非限制性实例包括单核苷酸多态性(SNP)、缺失/插入多态性(DIP)、拷贝数变体(CNV)、短串联重复(STR)、简单序列重复(SSR)、可变数目串联重复(VNTR)、扩增片段长度多态性(AFLP)、基于反转录转座子的插入多态性、序列特异性扩增多态性和可检测为序列变体的表观遗传标记的差异(例如,甲基化差异)。在一些实施方案中,序列变体可以指染色体重排,包括但不限于易位或融合基因。
如本文所用,术语“观测丰度”通常是指例如观察、检测或测量的样品(例如,核酸样品)中特定物质(例如,靶核酸)的相对表示。例如,观测丰度可以指多核苷酸样品中靶多核苷酸的相对表示,其例如通过诸如无细胞核酸测定(CFNA测定)等测定来观察或检测。这可以是,例如,多核苷酸样品中的靶多核苷酸分子的数目相对于多核苷酸的总数。如果靶多核苷酸包含突变等位基因或变异等位基因,则观测丰度可以指样品中突变体的所观察、检测或测得的等位基因频率。丰度可以被描述为例如相对于全体或全体的子集的分数或百分比(例如,相对于样品中存在的所有等位基因(包括野生型和其他突变体)的突变等位基因)。在一些情况下,丰度可以被描述为浓度,包括但不限于质量浓度、摩尔浓度、数量浓度和体积浓度,或其他可接受的测量单位。
如本文所用,术语“预期丰度”通常是指例如样品(例如,核酸样品)中的特定物质(例如,靶核酸)的相对表示,预期这是该样品的特征。例如,预期丰度可以指多核苷酸样品中靶多核苷酸的相对表示,预期这是该样品的特征(例如参考样品或标准品样品)。例如,如果通过向多核苷酸样品中掺入或添加已知量的靶多核苷酸来人工产生样品(该量也是已知的),则可以预期多核苷酸样品中靶多核苷酸的相对表示。丰度可以被描述为例如相对于全体的分数或百分比(例如,样品中靶多核苷酸分子的数目相对于多核苷酸分子的总数)或相对于全体的子集的分数或百分比(例如,突变等位基因的分子数相对于包括突变和野生型等位基因在内的基因的分子总数)。在一些情况下,丰度可以被描述为浓度,包括但不限于质量浓度、摩尔浓度、数量浓度和体积浓度,或其他可接受的测量单位。
如本文所用,术语“估算丰度”通常是指例如样品(例如,无细胞核酸样品)中的特定物质(例如,靶核酸)的相对表示的估计值。估算丰度可以是通过用校准或校正方案调整观测丰度而获得的值,该校准或校正方案考虑了测量方法和/或系统的可变性或误差。在测量方法或系统具有很小的可变性和/或误差并且高度灵敏、高度特异和/或高度准确的情况下,估算丰度和观测丰度可能不会明显地偏离。在测量方法或系统具有高可变性和/或低灵敏度、低特异性和/或低准确度的情况下,估算丰度和观测丰度可能显著不同。丰度可以被描述为例如相对于全体的分数或百分比(例如,靶多核苷酸分子的数目相对于多核苷酸分子的总数)或相对于全体的子集的分数或百分比(例如,突变等位基因的分子数相对于包括突变和野生型等位基因在内的基因的分子总数)。在一些情况下,丰度可以被描述为浓度,包括但不限于质量浓度、摩尔浓度、数量浓度和体积浓度,或其他可接受的测量单位。
如本文所用,术语“标准品”或“参考”通常是指被制备成某些预定标准并且可用于评估例如测定法的某些方面的物质。标准品或参考优选地产生可再现的、一致的和可靠的结果。这些方面可包括性能指标,其实例包括但不限于准确度、特异性、灵敏度、线性度、再现性和检测极限或定量极限。标准品或参考可用于测定建立、测定验证和/或测定优化。标准品可用于评价测定的定量和定性方面。
如本文所用,术语“检测极限”通常是指对于给定程序(例如,测定或分析)可以以合理的确定性检测到的物质的最低量或含量。检测极限可以指仪器检测极限和/或方法检测极限,其中仪器检测极限与仪器或装置的操作中的固有限制相关,而方法检测极限与执行特定方法的步骤相关。
如本文所用,术语“连接”是指在两个多核苷酸末端之间形成核苷酸间连接的任何酶促或非酶促过程,该末端任选地与模板相邻地杂交。例如,DNA片段的末端可以通过在一个DNA末端的3'-羟基与另一个DNA末端的5'-磷酰基之间形成磷酸二酯键来连接。在一些情况下,核苷酸间连接在两个多核苷酸片段之间形成(分子间)。在一些情况下,核苷酸间连接在单个片段的两个末端(5’端和3’端)之间形成(分子内)。RNA片段的末端可以类似地通过形成磷酸二酯键而连接。可以连接的多核苷酸可以是单链或双链的。双链核酸可包含交错末端、突出端或粘端,其中在DNA或RNA分子的3'或5’端存在未配对的核苷酸。双链核酸可包含平端,其中末端核苷酸在DNA或RNA分子的3'或5’端配对。连接可包括诸如连接酶等酶的使用。
如本文所用,术语“杂交”和“退火”通常是指这样的反应,在该反应中,一个或多个多核苷酸发生反应以形成复合体,该复合体通过在核苷酸残基的碱基之间的氢键键合而得到稳定。该氢键键合可以通过Watson Crick碱基配对、Hoogstein结合或以任意其他序列特异性方式而发生。该复合体可包含形成双链体结构的两条链、形成多链复合体的三条或更多条链、自杂交的单链或其任意组合。杂交反应可以构成更广泛的过程中的步骤,例如PCR的起始,或核酶对多核苷酸的酶切。可以通过与第二序列的核苷酸残基的碱基发生氢键键合而稳定化的第一序列被称为可与第二序列“杂交”。在这种情况下,第二序列也可被称为可与第一序列杂交。
如本文所用,术语“扩增”、“扩增的”通常是指由靶多核苷酸或其部分形成一个或多个拷贝的任何过程。可获得多种扩增多核苷酸(例如DNA和/或RNA)的方法,其一些实例在本文中描述。扩增可以是线性的、指数的或在多相扩增过程中涉及线性和指数相两者。扩增方法可以涉及温度的变化,如热变性步骤,或者可以是不需要热变性的等温过程。
如本文所用,术语“引物”是指这样的单链寡核苷酸,其在至少一种核苷三磷酸和用于聚合的试剂如DNA或RNA聚合酶或逆转录酶的存在下,在合适的条件如缓冲液和温度下,能够作为模板指导的DNA合成的起始点。在任何给定的情况下,引物的长度取决于例如引物的预期用途,并且通常为约10至30个核苷酸。短引物分子通常需要较低的温度以与模板形成足够稳定的杂交复合物。引物不需要反映模板的准确序列,但必须足够互补以与这种模板杂交。引物位点是模板上与引物杂交的区域。引物对是一组引物,包括与待扩增序列的5’端杂交的5'上游引物和与待扩增序列的3’端的互补序列杂交的3'下游引物。
如本文所用,术语“互补体”、“互补”和“互补性”通常是指与给定序列完全互补且可杂交的序列。在一些情况下,如果给定区域上的碱基序列能够与其结合配偶体的碱基序列互补地结合,使得例如形成A-T、A-U、G-C和G-U碱基对,则与该给定核酸杂交的序列被称为给定分子的“互补体”或“反向互补体”。通常,可与第二序列杂交的第一序列与该第二序列特异性或选择性地杂交,使得在杂交反应期间,与第二序列或第二序列组的杂交相对于与非靶序列的杂交是优选的(例如,在给定的一组条件,如本领域常用的严格条件下更加热力学稳定)。一般而言,可杂交序列在其各自的全长或部分长度上具有一定程度的序列互补性,如25%-100%的互补性,包括至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和100%的序列互补性。序列同一性,例如为了评估互补性百分比,可以通过任何合适的比对算法进行测量,包括但不限于Needleman-Wunsch算法(参见,例如,EMBOSS Needle比对器,可从www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html获得,任选地具有默认设置)、BLAST算法(参见,例如,BLAST比对工具,可从blast.ncbi.nlm.nih.gov/Blast.cgi获得,任选地具有默认设置)或者Smith-Waterman算法(参见,例如,EMBOSS Water比对器,可从www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html获得,任选地具有默认设置)。最优算法可以使用所选定算法的任意合适的参数(包括默认参数)进行评估。在一些实施方案中,捕获探针通过捕获探针的预定的非随机序列与靶序列之间的互补性与指定的靶序列特异性杂交。
术语“受试者”、“个体”和“患者”在本文中可互换使用,是指脊椎动物,优选哺乳动物,更优选人。哺乳动物包括但不限于鼠类、猿猴、人类、农场动物、运动动物和宠物。还包括在体内获得的或在体外培养的生物实体的组织、细胞及其后代。
在各个方面,本公开内容提供了包含无细胞核酸(CFNA)标准品的组合物和试剂盒以及使用无细胞核酸标准品的方法。CFNA通常是指细胞外核酸,其可以从例如任何受试者(诸如人、非人灵长类动物、啮齿动物如小鼠和大鼠、狗、猫、猪、绵羊、兔等)的血清、血浆、血液、汗液、唾液、尿液、粪便、精液、粘膜排泄物、脊髓液、羊水和淋巴液中获得(例如,体内CFNA)。存在于非细胞来源中的无细胞核酸可以由细胞死亡(例如,凋亡或坏死)或细胞脱落产生。分析CFNA可用于表征衍生出CFNA的细胞或细胞群体,如肿瘤细胞(例如,癌症检测)、胎儿细胞(例如,产前诊断)、来自移植的组织的细胞(例如,移植失败的早期检测)或病原体(例如,细菌或病毒)。在一些受试者中,体内CFNA包含来自受试者的正常、健康细胞的核酸和来自肿瘤细胞(或其他不健康组织)的核酸、来自胎儿的核酸、来自非自体来源(例如,细胞或组织移植)和/或病原体(例如,细菌或病毒)的核酸的混合物。在一些情况下,来源于肿瘤细胞的CFNA可以基于核苷酸序列与来源于非肿瘤细胞的CFNA区分开。例如,肿瘤细胞可以在特定基因处具有突变等位基因,而正常细胞的相应基因具有野生型等位基因。具有突变等位基因序列的CFNA可以指示,例如,特定核酸来源于肿瘤细胞,而具有野生型等位基因序列的CFNA可以指示,例如,该特定核酸来源于正常细胞。类似地,可以将胎儿细胞、移植物的非自体细胞和病原体与受试者的正常健康细胞区分开。
在一些实施方案中,本文公开的CFNA标准品可用于建立CFNA测定、验证CFNA测定、优化CFNA测定和/或评价CFNA测定的性能,该CFNA测定例如是用来检测肿瘤核酸、胎儿核酸、移植细胞的非自体核酸和/或病原体核酸的CFNA测定。在一些实施方案中,本文公开的CFNA标准品可用于证实、验证和/或归一化从CFNA测定,例如用来检测肿瘤核酸、胎儿核酸、移植细胞的非自体核酸和/或病原体核酸的CFNA测定获得的结果。
本文公开的CFNA标准品可具有与天然存在的无细胞核酸(例如从受试者的生物样品中分离的无细胞DNA(例如,体内CFNA))相似的和/或代表性的性质或特征。具有与体内CFNA如无细胞DNA(cfDNA)相似的和/或代表性的性质或特征的CFNA标准品可用于CFNA测定。在一些情况下,与具有物理和/或生物化学性质与体内CFNA不太相似的核酸的CFNA标准品相比,本文公开的CFNA标准品在包括但不限于分子间和/或分子内连接的酶促反应中可能表现得更类似于体内CFNA。例如,本文进一步描述的CFNA标准品可包含其长度反映从生物样品中获得的CFNA(例如,体内CFNA)的大小分布的核酸。除了核酸长度之外,本文的CFNA标准品的核酸也可以模拟体内CFNA的某些生物学特征。例如,本文公开的CFNA标准品的大多数核酸可以在5’末端处包含磷酸基团且在3’末端处包含羟基。
一方面,本公开内容提供了包含多个基因组多核苷酸的无细胞核酸(CFNA)标准品。所述多个基因组多核苷酸的单个成员具有5’末端和3’末端。在一些实施方案中,所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度。在一些实施方案中,该标准品的大多数基因组多核苷酸在5’末端处具有磷酸基团且在3’末端处具有羟基,并且可以例如在分子内和/或分子间连接,而不需要在5’末端处生成磷酸基团和/或在3’末端处生成羟基。
体内cfDNA的片段大小通常集中在约160-180个碱基对附近,大致是缠绕核小体的DNA加上其连接体的长度。本文公开的CFNA标准品的基因组多核苷酸可具有与体内cfDNA相似的大小分布。在一些实施方案中,所述基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度。例如,本文公开的标准品的至少30%(例如,至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸具有范围为约100-300个碱基的长度。在一些实施方案中,本文公开的标准品的大多数基因组多核苷酸具有约100-300个碱基的长度。例如,本文公开的标准品的至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸具有范围为约100-300个碱基的长度。
在一些实施方案中,在没有多核苷酸末端修复和/或不存在磷酸供体的情况下,所述CFNA标准品的大多数基因组多核苷酸是可连接的或准备好被连接的。在5’末端缺少磷酸基团和/或在3’末端缺少羟基的核酸可能以低效率连接,或者在一些情况下,可能不会在分子间或分子内连接。为了提高连接效率,可以在连接之前或期间修复在5’末端处缺少磷酸基团和/或在3’末端处缺少羟基的核酸的末端,例如通过使用诸如多核苷酸激酶等酶。多核苷酸激酶可以在磷酸供体的存在下生成在5’末端具有磷酸基团的可连接的多核苷酸。末端修复过程的非限制性实例包括5’末端核苷酸的磷酸化、3’末端核苷酸的去磷酸化、用具有3'至5'外切核酸酶活性的聚合酶进行聚合,或这些的组合,以生成可连接的多核苷酸。
本文公开的CFNA标准品中的基因组多核苷酸是可连接的或准备好被连接的,而无需这样的末端修复。在一些实施方案中,至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。在一些实施方案中,所述CFNA标准品中的基因组多核苷酸可以在没有末端修复的情况下以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率连接。在一些实施方案中,该CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如分子内连接)。在一些实施方案中,该CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与衔接子多核苷酸连接(例如,分子间连接)。需要时,对本文公开的CFNA标准品的基因组多核苷酸进行末端修复,和/或在磷酸供体的存在下连接本文公开的CFNA标准品的基因组多核苷酸(例如,分子内和/或分子间)。需要时,例如在TA克隆之前,对本文公开的CFNA标准品的基因组多核苷酸进行A-加尾(例如,向多核苷酸的3’端添加‘A’碱基)。在一些实施方案中,在A-加尾之后,CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与衔接子多核苷酸连接(例如,分子间连接)。在一些实施方案中,通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。
在一些实施方案中,所述基因组多核苷酸是单链多核苷酸。在一些实施方案中,所述基因组多核苷酸是双链多核苷酸。在一些情况下,使双链多核苷酸变性以产生单链多核苷酸。在一些实施方案中,单链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如,分子内连接)。在一些实施方案中,双链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如,分子内连接)。在一些实施方案中,所述CFNA标准品中的单链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与单链衔接子多核苷酸连接。在一些实施方案中,所述CFNA标准品中的双链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与双链衔接子多核苷酸连接。在一些实施方案中,通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。
一方面,本公开内容提供了一种生成包含多个基因组多核苷酸的无细胞核酸(CFNA)标准品的方法。在一些实施方案中,所述生成CFNA标准品的方法包括(a)使从细胞分离的细胞核的染色质与内切核酸酶接触,以生成包含核小体DNA片段的多个基因组多核苷酸,和(b)任选地选择基因组多核苷酸的子集,例如按照大小。在一些实施方案中,所述内切核酸酶在核小体之间的区域切割DNA。通过使从细胞分离的细胞核染色质与内切核酸酶接触而生成的所述多个基因组多核苷酸的至少一个子集可具有约100-300个碱基的长度。通过使从细胞分离的染色质与内切核酸酶接触而生成的大多数基因组多核苷酸可以在5’末端处具有磷酸基团且在3’末端处具有羟基。
所述标准品的基因组多核苷酸可以与基因组序列相关联。在一些实施方案中,标准品包含基因组多核苷酸的至少一个子集(例如,至少2、3、4、5、6、7、8、9或10个子集)。本文提供的CFNA标准品可包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490或500个子集。在一些实施方案中,基因组多核苷酸的子集包含相同的或非独特的成员,例如,基于核苷酸序列和长度,不能将该子集的给定成员与该子集的所有其他成员区分开。在一些实施方案中,相同成员的子集包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、75或100个相同的成员。具有相同或非独特成员的基因组多核苷酸子集中的成员数目可取决于各种因素,包括但不限于从中分离细胞核的细胞的数目、从中获得细胞核的细胞的类型和用于生成所述多个基因组多核苷酸的内切核酸酶。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于75%(例如,该标准品的少于70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%)。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于100%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于90%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于80%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于70%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于60%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于50%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于40%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于30%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于20%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于10%。在一些实施方案中,少于50%的单个基因组多核苷酸(例如,少于45%、40%、35%、30%、25%、20%、15%、10%、5%的单个基因组多核苷酸或更少)有相同的序列。
可以从任何细胞群体中分离细胞核。为了获得具有代表正常或非病变细胞的核苷酸序列的基因组多核苷酸,可以从正常细胞群体中分离细胞核。为了获得具有代表病变或异常细胞的核苷酸序列的基因组多核苷酸,可以从异常或病变细胞如癌细胞群体中分离细胞核。病变细胞的基因组多核苷酸可包含例如代表疾病状况和/或与疾病状况相关的一种或多种突变或非野生型等位基因。为了获得具有代表胎儿细胞的核苷酸序列的基因组多核苷酸,可以从胎儿细胞群体中分离细胞核。
可以使用各种细胞裂解试剂从细胞中分离细胞核。用于细胞裂解的示例性透化剂包括但不限于Triton X-100、Tween-20、皂苷、SDS、NP40、链球菌溶血素O、蛋白酶K、链霉蛋白酶和三乙醇胺以及有机溶剂,如甲醇和丙酮。还可以使用低渗休克和/或超声处理使细胞样品透化。当细胞核完整时,基因组DNA可能作为核小体DNA和染色质与组蛋白保持缔合。收获的细胞核可以用酶如内切核酸酶处理,以将核小体DNA(例如基因组DNA)切割成单核小体长度的DNA片段。在一些实施方案中,诸如内切核酸酶等酶在核小体之间的区域切割DNA。在一些情况下,可以用酶如内切核酸酶处理从细胞或分离的细胞核中分离的核小体DNA,以将核小体DNA(例如基因组DNA)切割成单核小体长度的DNA片段。可以在没有收获细胞核的中间步骤的情况下收获核小体DNA。在一些实施方案中,通过用内切核酸酶切割核小体DNA产生的大多数片段在5’末端处包含磷酸基团并且在3’末端处包含羟基,并且是可连接的或准备好连接的,而无需末端修复。在一些实施方案中,至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的通过用内切核酸酶切割核小体DNA而生成的基因组多核苷酸在5’末端处包含磷酸基团并且在3’末端处包含羟基。在一些实施方案中,在没有末端修复和/或不存在磷酸供体的情况下,所述CFNA标准品中的基因组多核苷酸可以以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率连接。用于生成基因组多核苷酸的内切核酸酶的实例包括但不限于胱天蛋白酶活化的DNA酶(CAD)、DNA酶I,包括单链特异性和双链特异性DNA酶、DNA酶γ和内切核酸酶G。在一些实施方案中,所述基因组多核苷酸不是通过声处理(例如通过声处理基因组DNA以生成基因组多核苷酸)而生成的。在一些实施方案中,所述基因组多核苷酸不是通过使核小体DNA与微球菌核酸酶接触而生成的。
所述基因组多核苷酸可在使用前,例如在用于CFNA测定之前纯化。可以对基因组多核苷酸进行大小排阻色谱分析,借此保留及丢弃小试剂,或在单独的体积中保留并释放基因组多核苷酸。用于核小体DNA纯化的试剂盒是可用的,例如由Zymo Research提供的试剂盒。可任选地在使用之前针对大小(例如,长度)选择基因组多核苷酸,例如以便富集长度为单核小体的基因组多核苷酸的比例。
本文公开的CFNA标准品可包含代表某些体内CFNA样品的核酸的混合物,该样品例如是包含来自受试者的正常、健康细胞的核酸和来源于肿瘤细胞的核酸、来源于胎儿细胞的核酸、来源于非自体来源(例如,细胞或组织移植物)和/或病原体(例如,细菌或病毒)的核酸的混合物的样品。可以通过将例如来自肿瘤细胞或胎儿细胞的基因组多核苷酸(例如参考核酸或参考多核苷酸)掺入到包含健康细胞的基因组多核苷酸的样品中来生成代表包含核酸混合物的体内CFNA样品的CFNA标准品。健康细胞和病变细胞或胎儿细胞的基因组多核苷酸可以以特定比例混合在一起,以生成包含以所需量(例如,预期丰度)存在于标准品中的参考多核苷酸的CFNA标准品。
在这类标准品的一些实施方案中,使用包含来自肿瘤或胎儿核酸的突变等位基因作为参考多核苷酸的核酸来建立CFNA测定、验证CFNA测定、优化CFNA测定和/或评价CFNA测定的性能。在一些实施方案中,参考多核苷酸的检测用来证实、验证和/或归一化从CFNA测定获得的结果。在一些实施方案中,可评价CFNA测定的检测细胞样品中是否存在参考多核苷酸的能力。这种检测CFNA标准品中是否存在参考多核苷酸的能力可以代表该测定的检测无细胞核酸样品中的靶核酸的能力。
一方面,本公开内容提供了一种用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中存在的靶核酸的丰度的方法。在一些实施方案中,该方法包括:(a)对CFNA样品中的靶核酸的拷贝数进行定量,以获得靶核酸的观测丰度;(b)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)大多数基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(c)通过使用所述校准方案调整靶核酸的观测丰度来估算该CFNA样品中的靶核酸丰度。
CFNA样品可包含从受试者,例如从受试者的生物样品中获得的无细胞核酸(例如cfDNA和/或cfRNA)。在一些实施方案中,该受试者是健康的,因此从该受试者获得的无细胞核酸可能不包含与疾病或病症相关的序列变体。在一些实施方案中,怀疑该受试者患有疾病或病症,因此从该受试者获得的无细胞核酸可能包含与疾病或病症相关的序列变体。在一些实施方案中,该受试者是怀孕的,因此从该受试者获得的无细胞核酸包含胎儿核酸。在一些实施方案中,该受试者是已经历移植的患者,因此从该受试者获得的无细胞核酸包含来自非自体细胞或组织的无细胞核酸。在一些实施方案中,怀疑该受试者被病原体如细菌、病毒或真菌感染,因此从该受试者获得的无细胞核酸包含来源于该病原体的核酸。
样品的靶核酸可以指任何希望检测到的核酸。例如,在从怀疑患有诸如癌症或肿瘤的疾病的受试者获得的样品中,靶核酸可以指已知与被怀疑的癌症或肿瘤(例如,弱、中等或强烈)相关的突变等位基因。样品中存在突变等位基因可以指示受试者存在疾病(例如,癌症)。因此,在一些情况下,通过检测突变等位基因的存在,可以推断疾病(例如,癌症)的存在。在靶核酸是突变等位基因的情况下,非靶核酸可以指野生型等位基因。在一些情况下,非靶核酸可以指样品中不是靶核酸的整个核酸群体。
可以通过各种方法分析CFNA样品,以对样品中靶核酸的拷贝数(例如,样品中靶核酸分子的数目)进行定量,以产生靶核酸的观测丰度。观测丰度是指例如使用特定的测定或方法在样品中检测到的丰度。在一些情况下,由于两种方法或测定之间的差异,如各种样品操作阶段(例如,核酸提取、纯化、扩增、连接、消化等)中样品回收效率的差异和/或与每个阶段相关的错误,通过第一种方法或测定检测到的CFNA样品中靶核酸的观测丰度可能与通过第二种方法或测定检测到的相同CFNA样品中相同靶核酸的观测丰度不同。
观测丰度可以被描述为例如相对于全体的分数或百分比(例如,在整个样品中所观察到的靶多核苷酸分子的总数相对于所观察到的多核苷酸分子的总数)或相对于全体的子集的分数或百分比(例如,所观察到的突变等位基因的分子总数相对于所观察到的基因(包括突变和野生型等位基因)的分子总数)。在一些情况下,丰度可以被描述为浓度,包括但不限于质量浓度、摩尔浓度、数量浓度和体积浓度,或其他可接受的测量单位。当靶核酸是突变等位基因时,观测丰度可以表示为突变等位基因的等位基因频率。
在一些实施方案中,通过扩增反应如数字聚合酶链反应(dPCR)、小液滴数字聚合酶链反应(ddPCR)或定量聚合酶链反应(qPCR)确定靶核酸的观测丰度。扩增反应(例如,dPCR、ddPCR或qPCR)可以用对靶核酸具有特异性的扩增引物进行。例如,如果靶核酸是突变等位基因,则引物可以是等位基因特异性引物。
在一些实施方案中,CFNA标准品中存在的参考核酸的观测丰度通过以下步骤来确定:(a)对多个扩增产物进行测序以生成多个序列读取,其中所述多个扩增产物是通过扩增CFNA样品中的靶核酸和非靶核酸而生成的;以及(b)分析所述序列读取以计算靶核酸的观测丰度。
如果起始材料的量低和/或不足以例如评估靶核酸的拷贝数,则可以利用扩增靶核酸和非靶核酸来增加可用于分析,例如测序分析的材料的量。在一些实施方案中,在扩增之前,使包含靶核酸和非靶核酸的核酸样品环化以产生多个环化靶核酸和多个环化非靶核酸。在一些实施方案中,通过使存在于CFNA样品中的靶核酸和非靶核酸经历连接反应来实现环化。连接可以例如通过连接酶来完成。可以在不存在磷酸供体和/或没有先前末端修复步骤的情况下,使在5’末端处具有磷酸基团且在3’末端处具有羟基的核酸环化(例如,使用多核苷酸激酶)。在一些实施方案中,靶核酸和非靶核酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化。在一些实施方案中,单链靶核酸和单链非靶核酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化。在一些实施方案中,双链靶核酸和双链非靶核酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化。需要时,对核酸样品的靶核酸和非靶核酸进行末端修复,和/或在磷酸供体的存在下(例如,分子内和/或分子间)连接核酸样品的靶核酸和非靶核酸。可以通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。在一些实施方案中,在扩增之前,例如通过降解或消化来除去未环化的靶核酸和未环化的非靶核酸。
在一些实施方案中,扩增环化靶核酸和环化非靶核酸包括等温扩增,如滚环扩增。在一些实施方案中,通过滚环扩增进行扩增包括随机引物的延伸。具有随机核苷酸序列的随机引物可以杂交并引发环状靶多核苷酸的各个随机区域。在一些实施方案中,扩增包括对靶序列具有特异性的一种或多种引物的延伸,例如对靶核酸具有特异性的引物的延伸。在一些实施方案中,引物延伸中使用的引物可包含至少一种选自扩增引物结合位点、测序引物结合位点、条形码序列、样品索引序列(sample index sequence)、将多核苷酸与流动池结合以供下一代测序的序列和/或限制酶序列的序列元件。序列元件可以促进进一步的下游分析。例如,测序引物结合序列可用于对扩增产物进行测序。
在一些实施方案中,靶核酸和非靶核酸在扩增之前与衔接子多核苷酸连接,以产生多个衔接子标记的靶核酸和多个衔接子标记的非靶核酸。衔接子多核苷酸通常是指在多核苷酸的5'和/或3’端掺入的寡核苷酸,用以促进一个或多个下游分析步骤,例如在扩增和/或测序反应中。例如,衔接子多核苷酸可含有多种序列元件中的一种或多种,包括但不限于扩增引物结合位点、测序引物结合位点、条形码序列、样品索引序列、将多核苷酸与流动池结合以供下一代测序的序列和/或限制酶序列。在一些实施方案中,通过使靶核酸和非靶核酸经历连接反应来实现与衔接子多核苷酸的连接。连接可以例如通过连接酶来完成。
在5’末端处具有磷酸基团且在3’末端处具有羟基的核酸可以在不存在磷酸供体和/或没有先前末端修复步骤的情况下与衔接子多核苷酸连接(例如,使用多核苷酸激酶)。在一些实施方案中,靶核酸和非靶核酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与衔接子多核苷酸连接。在一些实施方案中,单链靶核酸和单链非靶核酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与单链衔接子多核苷酸连接。在一些实施方案中,双链靶核酸和双链非靶核酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与双链衔接子多核苷酸连接。需要时,对核酸样品的靶核酸和非靶核酸进行末端修复,和/或在磷酸供体的存在下(例如,分子内和/或分子间)连接核酸样品的靶核酸和非靶核酸。需要时,例如在TA克隆之前,对本文公开的CFNA标准品的基因组多核苷酸进行A-加尾(例如,向多核苷酸的3’端添加‘A’碱基)。在一些实施方案中,在A-加尾之后,CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与衔接子多核苷酸连接(例如,分子间连接)。在一些实施方案中,通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。
在一些实施方案中,扩增衔接子标记的核酸包括对衔接子多核苷酸的引物结合序列具有特异性的一种或多种引物的延伸。扩增可包括等温扩增反应或热循环扩增反应。
可以测定包含基因组多核苷酸的CFNA标准品以生成校准方案。可以通过将标准品中参考核酸的观测丰度与参考核酸的预期丰度相关联来生成校准方案。在一些实施方案中,生成校准方案还包括将附加CFNA标准品中存在的参考核酸的观测丰度与附加CFNA标准品中存在的参考核酸的预期丰度相关联。在一些实施方案中,附加CFNA标准品中存在的参考核酸的预期丰度不同于CFNA标准品中存在的参考核酸的预期丰度。使用具有两种不同预期丰度的参考核酸的两种不同标准品生成可用于生成校准方案的两个数据点(例如,校准数据点)。在一些实施方案中,使用至少3、4、5、6、7、8、9、10个或多于10个CFNA标准品来生成校准方案,每个标准品具有以不同的预期丰度存在的相同参考核酸。
在一些实施方案中,校准方案包括校准算法,该校准算法用于调整靶核酸的观测丰度以产生靶核酸的估算丰度,例如针对参考核酸的多个预期丰度水平,校正参考核酸观测丰度与参考核酸预期丰度的偏差。在一些实施方案中,校准方案包括最佳拟合线,例如对于多个校准数据点的最佳拟合线。
可以基于CFNA样品和/或测定系统的假设或验证的特征或性质来选择CFNA标准品中存在的参考核酸的预期丰度。例如,选择用于CFNA测定的CFNA标准品可包含一定预期丰度的参考核酸,该预期丰度最接近地类似于样品中靶核酸的预测丰度。预测丰度是指基于样品的某些特征而假设的丰度,但不一定被预期或被认为是正确的。选择用于CFNA测定的CFNA标准品可包含一定预期丰度的参考核酸,备选地,该预期丰度已经针对与特定方法或测定而不是与CFNA样品一起使用进行了优化。在一些实施方案中,CFNA标准品中存在的参考核酸的预期丰度小于20%(例如,小于10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)。在一些实施方案中,该参考核酸包含突变等位基因。在参考核酸包含突变等位基因的情况下,预期丰度可以表示为等位基因频率。在一些实施方案中,突变等位基因以约50%(例如,代表种系杂合突变)的等位基因频率存在于CFNA标准品中。在一些实施方案中,突变等位基因以小于50%(例如,小于40%、30%、20%、10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)的等位基因频率存在于CFNA标准品中。
在一些实施方案中,CFNA标准品在单个CFNA标准品中包含多种参考核酸(例如,至少一种附加参考核酸)。多种参考核酸的存在可以允许多重分析。多种参考核酸可以在单个CFNA标准品中独立地鉴定(例如,通过扩增和/或测序)。多种参考核酸中的每一种可以以大致相同的预期丰度存在。在一些情况下,多种参考核酸中的每一种以与标准品中的每一种其他参考核酸不同的预期丰度存在。在一些实施方案中,生成校准方案还包括将单个CFNA标准品中存在的至少一种附加参考核酸的观测丰度与单个CFNA标准品中存在的至少一种附加参考核酸的预期丰度相关联。在一些实施方案中,单个CFNA标准品中的至少3、4、5、6、7、8、9、10种或多于10种独特的参考核酸用于生成校准方案,每个标准品以大致相同的预期丰度存在。在一些实施方案中,单个CFNA标准品中存在的至少一种附加参考核酸的预期丰度小于20%(例如,小于10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)。在一些实施方案中,至少一种附加参考核酸包含附加突变等位基因。在至少一种附加参考核酸包含突变等位基因的情况下,附加参考核酸的预期丰度可以表示为等位基因频率。在一些实施方案中,附加突变等位基因以约50%(例如,代表种系杂合突变)的等位基因频率存在于单个CFNA标准品中。在一些实施方案中,附加突变等位基因以小于50%(例如,小于40%、30%、20%、10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)的等位基因频率存在于单个CFNA标准品中。
根据一个实施方案,CFNA标准品的基因组多核苷酸可具有反映体内CFNA的大小分布的长度。在一些实施方案中,基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度。例如,至少30%(例如,至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸具有范围为约100-300个碱基的长度。在一些实施方案中,大多数基因组多核苷酸具有范围为约100-300个碱基的长度。例如,至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸具有范围为约100-300个碱基的长度。
在一些实施方案中,标准品包含基因组多核苷酸的至少一个子集(例如,至少2、3、4、5、6、7、8、9或10个子集)。在一些实施方案中,本文提供的CFNA标准品包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490或500个子集。基因组多核苷酸的子集可以包含相同的或非独特的成员,例如,基于核苷酸序列和长度,不能将该子集的给定成员与该子集的所有其他成员区分开。在一些实施方案中,相同成员的子集包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、75或100个相同的成员。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于75%(例如,该标准品的少于70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%)。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于100%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于90%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于80%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于70%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于60%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于50%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于40%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于30%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于20%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于10%。在一些实施方案中,CFNA标准品中的少于50%的单个基因组多核苷酸(例如,少于45%、40%、35%、30%、25%、20%、15%、10%、5%或少于5%的基因组多核苷酸)具有相同的序列。
在一些实施方案中,所述CFNA标准品包含单链基因组多核苷酸。在一些实施方案中,所述CFNA标准品包含双链基因组多核苷酸。在需要时,可以例如通过变性来处理双链基因组多核苷酸,以产生单链多核苷酸。
可以通过与用来获得CFNA样品中靶核酸的观测丰度的方法相同的方法,对CFNA标准品中参考多核苷酸的观测丰度进行定量。例如,CFNA样品中的参考核酸的观测丰度可以通过扩增反应如dPCR、ddPR或qPCR来确定。或者,可以通过对多个扩增产物进行测序以产生多个序列读取来确定CFNA样品中的参考核酸的观测丰度,所述多个扩增产物通过扩增CFNA标准品而产生。在一些实施方案中,在扩增之前,使CFNA标准品的核酸环化,例如通过分子内连接。在一些实施方案中,在扩增之前,使CFNA标准品的核酸与衔接子多核苷酸连接,例如通过分子间连接。连接(例如,分子内和/或分子间)可以例如通过连接酶完成。
可以在不存在磷酸供体和/或没有先前末端修复步骤的情况下,使在5’末端处具有磷酸基团并且在3’末端处具有羟基的核酸环化和/或连接至衔接子多核苷酸(例如,使用多核苷酸激酶)。例如,在5’末端处具有磷酸基团且在3’末端处具有羟基的CFNA标准品的基因组多核苷酸是可连接的或准备好被连接的,而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基。在一些实施方案中,至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸在5’末端处包含磷酸基团并且在3’末端处包含羟基。在一些实施方案中,CFNA标准品中的基因组多核苷酸可以以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率连接。在一些实施方案中,CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如分子内连接)。在一些实施方案中,单链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如,分子内连接)。在一些实施方案中,双链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如,分子内连接)。在一些实施方案中,CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与衔接子多核苷酸连接。在一些实施方案中,CFNA标准品中的单链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与单链衔接子多核苷酸连接。在一些实施方案中,CFNA标准品中的双链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与双链衔接子多核苷酸连接。在一些实施方案中,通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。
在一些实施方案中,基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶例如在末端修复过程中生成的。也就是说,CFNA标准品的基因组多核苷酸是可连接的或准备好被连接的,而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基,例如在除了从基因组DNA产生标准品的单个成员的初始过程之外的修复过程中产生。在一些实施方案中,CFNA标准品的基因组多核苷酸在不存在磷酸供体的情况下是可连接的或准备好被连接的。需要时,对CFNA标准品的基因组多核苷酸进行末端修复,和/或在磷酸供体的存在下连接CFNA标准品的基因组多核苷酸。
在一些实施方案中,参考核酸的核苷酸序列与靶核酸至少85%相同(例如,至少90%、95%或大于95%相同)。
在一方面,本公开内容提供了一种用于评估无细胞核酸(CFNA)测定的检测极限的方法。在一些实施方案中,该方法包括(a)用多个CFNA标准品进行CFNA测定以对每个标准品获得每个标准品中存在的参考多核苷酸的观测丰度,所述多个CFNA标准品涵盖参考多核苷酸的给定范围的预期丰度,其中所述多个标准品中的每个标准品具有与所述多个标准品中的其他标准品不同的参考多核苷酸预期丰度,并且其中每个标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)大多数基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(c)鉴定参考多核苷酸的相应观测丰度在统计上无法与背景测量值区分时的预期丰度,从而将该预期丰度判定为该CFNA测定的检测极限。
本文公开的CFNA标准品可用于确定测定的检测极限,例如涉及仪器(例如,dPCR仪、ddPCR仪、qPCR仪、NGS仪等)或特定方法(例如,包括核酸提取、纯化、连接、扩增、消化等步骤的方法)的CFNA测定的检测极限。例如,可以用多个CFNA标准品进行该测定,每个CFNA标准品具有预期丰度的参考多核苷酸,并且总体上,标准品的参考多核苷酸的预期丰度跨越给定范围。在一些实施方案中,所述多个CFNA标准品包含至少2个CFNA标准品(例如,至少3、4、5、6、7、8、9、10个或多于10个CFNA标准品)。对于每个标准品,可以将参考多核苷酸的观测丰度与不含核酸的样品的观测丰度(例如,背景测量值或噪音水平)进行比较,以确定标准品的参考多核苷酸的观测丰度无法与背景测量值区分时的预期丰度。
本文公开的CFNA标准品可用于确定测定的检测极限,例如涉及仪器(例如,dPCR仪、ddPCR仪、qPCR仪、NGS仪等)或特定方法(例如,包括核酸提取、纯化、连接、扩增、消化等步骤的方法)的CFNA测定的检测极限。例如,可以用具有多个独特参考多核苷酸(例如,每个参考多核苷酸可以例如通过扩增和/或测序独立地鉴定)的单个CFNA标准品进行该测定。单个CFNA标准品可包含至少2个参考多核苷酸(例如,至少3、4、5、6、7、8、9、10个或多于10个参考多核苷酸)。存在于CFNA标准品中的每个参考多核苷酸可以以大致相同的预期丰度存在于标准品中。在一些实施方案中,相同的预期丰度小于约20%、10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.0001%。在一些实施方案中,CFNA标准品的每个参考多核苷酸包含突变等位基因。当CFNA标准品的每个参考多核苷酸包含突变等位基因时,参考多核苷酸的预期丰度可以是小于约50%、40%、30%、20%、10%、5%、1%、0.5%、0.1%、0.01%或0.001%的等位基因频率。在一些实施方案中,突变等位基因的等位基因频率小于0.05%。
在一方面,本公开内容提供了一种评估用于检测以给定预期丰度存在于CFNA标准品中的参考多核苷酸的无细胞核酸(CFNA)测定的灵敏度的方法,该方法包括:(a)用包含多个参考多核苷酸的CFNA标准品进行CFNA测定,以获得所述多个参考多核苷酸中的每个参考多核苷酸的阳性或阴性检测判定,其中每个参考多核苷酸以给定预期丰度存在于该CFNA标准品中,其中该标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,并且其中:所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且大多数基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)确定产生阳性检测判定的参考多核苷酸的分数,从而评估用于检测以给定预期丰度存在于该CFNA标准品中的参考多核苷酸的CFNA测定的灵敏度。测定的灵敏度是指该测定在正确鉴定或测量阳性事件中的性能的量度,例如正确地判定标准品中参考多核苷酸的存在。可以通过确定阳性检测判定的分数来计算用于检测CFNA标准品中的预定或给定数目的参考多核苷酸的CFNA测定的灵敏度。
在一方面,本公开内容提供了一种用于评估无细胞核酸(CFNA)测定的特异性的方法,其包括:(a)用CFNA标准品进行CFNA测定以获得多个参考多核苷酸中的每个参考多核苷酸的阳性或阴性检测判定,其中每个参考多核苷酸在该CFNA标准品中不存在,并且其中所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)确定产生阴性检测判定的参考多核苷酸的分数,从而评估该CFNA测定的特异性。CFNA测定的特异性是指该测定在正确鉴定或测量阴性事件中的性能的量度,例如正确地判定标准品中不存在参考多核苷酸。可以通过确定关于标准品中不存在的多个参考多核苷酸的阴性检测判定的分数来计算CFNA测定的特异性。
在单个CFNA标准品中存在多种参考核酸可以允许多重分析,例如在评估CFNA测定的检测极限、灵敏度和/或特异性时。当评估CFNA测定的检测极限时,可以平行测定单个CFNA标准品的每个参考多核苷酸的观测丰度,例如通过扩增(例如,dPCR、ddPCR、qPCR)和/或测序。由于每个参考多核苷酸相对于其他参考多核苷酸是独特的,因此每个参考多核苷酸产生包含观测丰度和相应的预期丰度的数据点。例如,可以在具有10个参考多核苷酸的单个CFNA标准品上进行CFNA测定,以产生10个参考多核苷酸中的每一个的观测丰度值。如果对于至少大多数参考多核苷酸(例如,至少50%、55%、60%、65%、70%75%、80%、85%、90%、95%或多于95%的参考多核苷酸),观测丰度在预期丰度的约20%(例如,约15%、10%、5%、4%、3%、2%、1%或小于1%)内,则该测定的检测极限可以被判定为参考多核苷酸的相同预期丰度。在一些实施方案中,当标准品中存在的至少75%的参考多核苷酸以大约预期丰度检测到时,检测极限被判定为参考多核苷酸的预期丰度。如果CFNA标准品作为单一样品处理,则存在于单个CFNA标准品中的多个参考多核苷酸允许多个参考多核苷酸(例如,至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或多于100个参考多核苷酸)在相同或相似的测定条件下进行分析,例如在确定CFNA测定的灵敏度和/或特异性时。这可以减少由实验间变异性引起的灵敏度和/或特异性测量值的变异性。
在一些实施方案中,参考多核苷酸的预期丰度的给定范围为约0.001%至20%(例如,约0.001%至15%、0.001%至10%、0.001%至5%、0.001%至4%、0.001%至3%、0.001%至2%、0.001%至1%、0.001%至0.5%、0.001%至0.1%或0.001%至0.01%)。在一些实施方案中,参考多核苷酸包含突变等位基因。在参考多核苷酸包含突变等位基因的情况下,预期丰度可以表示为突变等位基因的等位基因频率。包含突变等位基因的参考多核苷酸的预期丰度的给定范围可以是约0.001%至50%(例如,约0.001%至45%、0.001%至40%、0.001%至35%、0.001%至30%、0.001%至25%、0.001%至20%、0.001%至15%、0.001%至10%、0.001%至5%、0.001%至4%、0.001%至3%、0.001%至2%、0.001%至1%、0.001%至0.5%、0.001%至0.1%或0.001%至0.01%)。
可用于评估CFNA测定的检测极限、CFNA测定的灵敏度和/或CFNA测定的特异性的CFNA标准品的基因组多核苷酸可具有反映体内CFNA的大小分布的长度。在一些实施方案中,基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度。例如,至少30%(例如,至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸具有范围为约100-300个碱基的长度。在一些实施方案中,至少大多数基因组多核苷酸具有范围为约100-300个碱基的长度。例如,至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸具有范围为约100-300个碱基的长度。
在一些实施方案中,可用于评估CFNA测定的检测极限、CFNA测定的灵敏度和/或CFNA测定的特异性的标准品包含基因组多核苷酸的至少一个子集(例如,至少2、3、4、5、6、7、8、9或10个子集)。在一些实施方案中,CFNA标准品包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490或500个子集。在一些实施方案中,基因组多核苷酸的子集包含相同的或非独特的成员,例如,基于核苷酸序列和长度,不能将子集的给定成员与子集的所有其他成员区分开。在一些实施方案中,相同成员的子集包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、75或100个相同的成员。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸的子集代表该标准品的少于75%(例如,该标准品的少于70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%)。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于100%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于90%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于80%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于70%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于60%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于50%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于40%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于30%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于20%。在一些实施方案中,具有相同成员的标准品的基因组多核苷酸子集代表该标准品的少于10%。在一些实施方案中,CFNA标准品中的少于50%的单个基因组多核苷酸(例如,少于45%、40%、35%、30%、25%、20%、15%、10%、5%或少于5%的基因组多核苷酸)具有相同的序列。
在一些实施方案中,所述CFNA标准品包含单链基因组多核苷酸。在一些实施方案中,所述CFNA标准品包含双链基因组多核苷酸。在需要时,可以例如通过变性来处理双链基因组多核苷酸,以产生单链多核苷酸。
在一些实施方案中,所述CFNA测定包括扩增反应,如数字聚合酶链反应(dPCR)、小液滴数字聚合酶链反应(ddPCR)或定量聚合酶链反应(qPCR)。扩增反应(例如,dPCR、ddPCR或qPCR)可以用对参考多核苷酸具有特异性的扩增引物进行。例如,如果参考多核苷酸是突变等位基因,则引物可以是等位基因特异性引物。
在一些实施方案中,所述CFNA测定包括(a)对多个扩增产物进行测序以产生多个序列读取,其中所述多个扩增产物是通过扩增CFNA样品的多核苷酸而产生的;以及(b)分析该序列读取以计算参考多核苷酸的观测丰度。
在一些实施方案中,在扩增之前,使CFNA标准品环化以产生多个环化基因组多核苷酸。在一些实施方案中,通过使CFNA标准品经历连接反应来实现环化。连接可以例如通过连接酶来完成。在5’末端处具有磷酸基团且在3’末端处具有羟基的核酸(例如基因组多核苷酸)可以在不存在磷酸供体和/或没有先前末端修复步骤(例如,使用多核苷酸激酶)的情况下环化(例如,使用多核苷酸激酶)。在一些实施方案中,至少50%的基因组多核苷酸(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%的基因组多核苷酸)在5’末端处包含磷酸基团并且在3’末端处包含羟基。在一些实施方案中,基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶例如在末端修复过程中生成的。也就是说,CFNA标准品的基因组多核苷酸是可连接的或准备好被连接的而不需要在5’末端处生成磷酸基团和/或在3'末端处生成羟基。在一些实施方案中,CFNA标准品的基因组多核苷酸在不存在磷酸供体的情况下是可连接的或准备好被连接的。在一些实施方案中,CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如分子内连接)。在一些实施方案中,CFNA标准品中的单链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如分子内连接)。在一些实施方案中,CFNA标准品中的双链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化。需要时,对CFNA标准品的基因组多核苷酸进行末端修复,和/或在磷酸供体的存在下连接CFNA标准品的基因组多核苷酸。在一些实施方案中,在扩增之前,例如通过降解或消化来除去未环化的多核苷酸。在一些实施方案中,通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。
在一些实施方案中,扩增环化基因组多核苷酸包括等温扩增,如等温滚环扩增。在一些实施方案中,通过滚环扩增进行扩增包括随机引物的延伸。具有随机核苷酸序列的随机引物可以杂交并引发环状基因组多核苷酸的各个随机区域。在一些实施方案中,扩增包括对多核苷酸具有特异性的一种或多种引物的延伸,例如对参考多核苷酸具有特异性的引物的延伸。在一些实施方案中,引物延伸中使用的引物可包含至少一种选自扩增引物结合位点、测序引物结合位点、条形码序列、样品索引序列、将多核苷酸与流动池结合以供下一代测序的序列和/或限制酶序列的序列元件。序列元件可以促进进一步的下游分析。例如,测序引物结合序列可用于对扩增产物进行测序。
在一些实施方案中,在扩增之前,CFNA标准品的基因组多核苷酸与衔接子多核苷酸连接,以产生多个衔接子标记的基因组多核苷酸。在一些实施方案中,通过使基因组多核苷酸经历连接反应来实现与衔接子多核苷酸的连接。连接可以例如通过连接酶来完成。在5’末端处具有磷酸基团且在3’末端处具有羟基的核酸可以在不存在磷酸供体和/或没有先前末端修复步骤的情况下与衔接子多核苷酸连接(例如,使用多核苷酸激酶)。在一些实施方案中,基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与衔接子多核苷酸连接。在一些实施方案中,单链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与单链衔接子多核苷酸连接。在一些实施方案中,双链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与双链衔接子多核苷酸连接。需要时,对CFNA标准品的基因组多核苷酸进行末端修复,和/或在磷酸供体的存在下连接CFNA标准品的基因组多核苷酸。需要时,例如在TA克隆之前,对本文公开的CFNA标准品的基因组多核苷酸进行A-加尾(例如,向多核苷酸的3’端添加‘A’碱基)。在一些实施方案中,在A-加尾之后,CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与衔接子多核苷酸连接(例如,分子间连接)。在一些实施方案中,通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。
衔接子多核苷酸可含有多种序列元件中的一种或多种,包括但不限于扩增引物结合位点、测序引物结合位点、条形码序列、样品索引序列、将多核苷酸与流动池结合以供下一代序列的序列和/或限制酶序列。在一些实施方案中,扩增衔接子标记的基因组多核苷酸包括对衔接子多核苷酸的引物结合序列具有特异性的一种或多种引物的延伸。扩增可包括等温扩增反应或热循环扩增反应。
在一方面,一种建立无细胞核酸(CFNA)测定的方法包括:(a)在多个测定条件下用CFNA标准品进行CFNA测定以产生一组性能指标,其中当在参考CFNA测定中使用时,该CFNA标准品与一组参考性能指标相关联,其中该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)大多数基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)调整一个或多个测定条件以相对于至少一个参考性能指标改善至少一个性能指标,从而建立CFNA测定。在一些实施方案中,该标准品包含至少一种参考核酸。所述至少一种参考核酸可以以小于20%(例如,小于10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)的预期丰度存在于CFNA标准品中。在一些实施方案中,所述至少一种参考核酸包含突变等位基因。在一些实施方案中,突变等位基因以约50%(例如,代表种系杂合突变)的等位基因频率存在于CFNA标准品中。突变等位基因可以以小于50%(例如,小于40%、30%、20%、10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)的等位基因频率存在于CFNA标准品中。
由于难以获得患者相关材料,因此建立用于分析无细胞核酸如cfDNA的CFNA测定可能具有挑战性。本文公开的CFNA标准品可以代表体内CFNA并且可用于建立CFNA测定。可以在多个测定条件下用CFNA标准品进行CFNA测定以产生一组性能指标。这些性能指标可包括但不限于检测率,例如在包含多种参考核酸的标准品中可检测到的参考核酸的比例;准确性;精度;灵敏度;特异性;再现性;和/或检测极限(例如,检测限)。当在参考测定中使用时,CFNA标准品,例如本领域接受的金标准,可以产生一组参考性能指标。例如,金标准参考可包括dPCR、ddPCR和/或qPCR。可以在改变至少一种测定条件的同时重复CFNA测定。
在一些实施方案中,所述测定包括连接反应。当测定包括连接反应时,改变的测定条件可包括连接时间或连接温度。例如,可以延长或缩短连接时间。再例如,可以提高、降低或循环连接温度。还可以改变酶浓度、核酸模板浓度和各自的相对比例以改善测定。在一些实施方案中,改变测定条件可包括使用替代的连接酶或替代的连接缓冲液配方。
在一些实施方案中,所述测定包括扩增反应。当测定包括等温扩增反应时,改变的测定条件可包括扩增时间或扩增温度。在一些实施方案中,所述测定包括热循环扩增反应,其包括不同亚阶段的多个循环。在热循环反应中,变化的测定条件可包括亚阶段温度、亚阶段长度(例如,时间)或扩增循环数。例如,可以提高或降低热循环扩增反应的亚阶段的扩增温度。或者,可以延长或缩短亚阶段的长度。也可以增加或减少扩增循环数。在一些实施方案中,提高或降低诸如聚合酶的酶浓度。在一些实施方案中,使用替代的聚合酶或缓冲液配方。在一些实施方案中,可以调节扩增反应的引物。例如,可以提高引物浓度,或者可以改变引物的GC含量和/或引物的解链温度。
通过改变不同的测定条件并评价CFNA测定的性能,可以优化该测定。可以优化该测定,使得其性能指标匹配或超过金标准的性能指标。
在一方面,提供了用于执行本公开内容的方法的系统。在一些实施方案中,一种用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中的靶核酸丰度的系统包括:定量系统,其被配置用于确定该CFNA样品中的靶核酸的拷贝数,以产生靶核酸的观测丰度;计算机,其被配置用于(a)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)大多数基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)通过使用所述校准方案调整靶核酸的观测丰度来估算该CFNA样品中的靶核酸丰度。
CFNA样品(例如cfDNA和/或cfRNA)可从受试者,例如从受试者的生物样品中获得。CFNA样品可以从怀疑患有疾病、怀孕、先前进行细胞或组织移植并且怀疑有移植排斥或具有病原体感染的受试者中获得。样品的靶核酸可以指任何希望检测到的核酸。例如,在从怀疑患有诸如癌症或肿瘤的疾病的受试者获得的样品中,靶核酸可以指已知与被怀疑的癌症或肿瘤弱或强相关的突变等位基因。
一种被配置用于确定CFNA样品中靶核酸的拷贝数的定量系统可以实施扩增反应,如dPCR、ddPCR或qPCR。或者,一种被配置用于确定拷贝数的定量系统可以(a)对多个扩增产物进行测序以生成多个序列读取,其中所述多个扩增产物是通过扩增CFNA样品中的靶核酸和非靶核酸而生成的;以及(b)分析所述序列读取以计算靶核酸的观测丰度。
计算机可以被配置用于通过将CFNA标准品中存在的参考核酸的观测丰度与CFNA标准品中存在的参考核酸的预期丰度相关联来生成校准方案。该计算机可以被配置用于通过使用如本文其他地方描述的校准方案调整靶核酸的观测丰度来估算CFNA样品中靶核酸的丰度。
在一些实施例中,所述系统还包括向接收者发送报告的报告生成器。该报告包含以下至少一种:靶核酸的观测丰度、靶核酸的估算丰度、参考核酸的观测丰度、参考核酸的预期丰度和校准方案。
在一方面,本公开内容提供了包括代码的计算机可读介质,该代码在由一个或多个处理器执行时实现本公开内容的方法。在一些实施方案中,提供了一种包含代码的计算机可读介质,该代码在由一个或多个处理器执行时实现用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中的靶核酸丰度的方法。在一些实施方案中,该方法包括:(a)响应于用户请求,进行定量反应以确定CFNA样品中的靶核酸的拷贝数,并产生靶核酸的观测丰度;(b)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)大多数基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(c)通过使用所述校准方案调整靶核酸的观测丰度来估算CFNA样品中的靶核酸丰度。
在一些实施方案中,由代码实现的方法进一步包括(d)生成包含以下至少一种的报告:靶核酸的观测丰度、靶核酸的估算丰度、参考核酸的观测丰度、参考核酸的预期丰度和校准方案。
在一个方面,本公开内容提供了用于本公开内容的方法的试剂盒。在一些实施方案中,本公开内容提供了一种试剂盒,其包含(a)包含多个基因组多核苷酸的无细胞核酸(CFNA)标准品,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:(i)所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且(ii)大多数基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及(b)关于在CFNA分析中使用所述CFNA标准品的用户说明书。
CFNA标准品的基因组多核苷酸可具有与体内cfDNA相似的大小分布。在一些实施方案中,所述多个基因组多核苷酸的至少一个子集具有约100-300个碱基的长度。例如,标准品的至少30%(例如,至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸具有约100-300个碱基的长度。在一些实施方案中,标准品的大多数基因组多核苷酸具有约100-300个碱基的长度。例如,本文公开的标准品的至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸具有约100-300个碱基的长度。
在5’末端具有磷酸基团且在3’末端具有羟基的CFNA标准品的基因组多核苷酸是可连接的或准备好被连接的,而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基。在一些实施方案中,至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或多于95%)的基因组多核苷酸在5’末端处包含磷酸基团并且在3’末端处包含羟基。在一些实施方案中,CFNA标准品中的基因组多核苷酸可以以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率连接。在一些实施方案中,CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如分子内连接)。在一些实施方案中,CFNA标准品中的基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与衔接子多核苷酸连接。在一些实施方案中,通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。
在一些实施方案中,所述基因组多核苷酸是单链多核苷酸。在一些实施方案中,所述基因组多核苷酸是双链多核苷酸。在一些情况下,在需要时可以例如通过变性来处理双链基因组多核苷酸,以生成单链多核苷酸。在一些实施方案中,单链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如,分子内连接)。在一些实施方案中,双链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率环化(例如,分子内连接)。在一些实施方案中,CFNA标准品中的单链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与单链衔接子多核苷酸连接。在一些实施方案中,CFNA标准品中的双链基因组多核苷酸以至少50%(例如,至少55%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率与双链衔接子多核苷酸连接。
在一些实施方案中,所述标准品的基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶例如在末端修复过程中生成的。也就是说,CFNA标准品的基因组多核苷酸是可连接的或准备好被连接的,而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基。在一些实施方案中,CFNA标准品的基因组多核苷酸在不存在磷酸供体的情况下是可连接的或准备好被连接的。
在一些实施方案中,所述标准品包含至少一种参考核酸。所述至少一种参考核酸可以以小于20%(例如,小于10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)的预期丰度存在于CFNA标准品中。在一些实施方案中,所述至少一种参考核酸包含突变等位基因。突变等位基因可以以约50%(例如,代表种系杂合突变)的等位基因频率存在于CFNA标准品中。突变等位基因可以以小于50%(例如,小于40%、30%、20%、10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)的等位基因频率存在于CFNA标准品中。
在一些实施方案中,所述CFNA标准品在单个CFNA标准品中包含多种参考核酸(例如,至少一种附加参考核酸)。在一些实施方案中,单个CFNA标准品中存在的所述至少一种附加参考核酸的预期丰度小于20%(例如,小于10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)。在一些实施方案中,所述至少一种附加参考核酸包含附加突变等位基因。在所述至少一种附加参考核酸包含突变等位基因的情况下,所述至少一种附加参考核酸的预期丰度可以表示为等位基因频率。在一些实施方案中,附加突变等位基因以约50%的等位基因频率存在于单个CFNA标准品中。在一些实施方案中,附加突变等位基因以小于50%(例如,小于40%、30%、20%、10%、5%、1%、0.5%、0.1%、0.01%、0.001%或小于0.001%)的等位基因频率存在于单个CFNA标准品中。在一些实施方案中,单个CFNA标准品中存在至少3、4、5、6、7、8、9、10种或多于10种参考核酸。在一些实施方案中,所述试剂盒包含多个CFNA标准品(例如,至少2、3、4、5、6、7、8、9、10个或多于10个CFNA标准品)。
在一些实施方案中,所述试剂盒进一步包含连接酶。连接酶可用于分子间连接(例如,连接衔接子多核苷酸)和/或用于分子内连接(例如,环化)。在一些实施方案中,连接酶包括ATP依赖性双链多核苷酸连接酶、NAD+依赖性DNA或RNA连接酶或单链多核苷酸连接酶。连接酶可以是野生型、突变同工型和基因工程变体。在一些实施方案中,所述试剂盒进一步包含连接反应缓冲液。连接反应缓冲液可包含缓冲组分、小分子连接增强剂和其他反应组分如ATP。
本公开内容的实施方案可以使用任何无细胞多核苷酸。在本文方面的各个实施方案中,无细胞核酸(CFNA)样品包含无细胞多核苷酸,包括但不限于无细胞DNA或RNA(cfDNA或cfRNA)。无细胞多核苷酸可以源自细胞,但也可以从非细胞来源获得。无细胞多核苷酸可以来源于健康或非病变细胞。无细胞多核苷酸可以来源于病变细胞来源,如来自肿瘤或癌细胞。无细胞多核苷酸可以是胎儿来源的或来自胎儿的。无细胞多核苷酸可以来源于病原体,如细菌或病毒,并且在一些情况下,指示由病原体引起的疾病(例如,细菌感染和/或病毒感染)。
无细胞多核苷酸可从受试者如任何动物或活生物体获得。受试者的非限制性实例是哺乳动物,诸如人、非人灵长类动物、啮齿动物如小鼠和大鼠、狗、猫、猪、羊、兔等。在一些实施方案中,受试者是健康的,因此从该受试者获得的无细胞多核苷酸可能不包含与疾病或病症相关的序列变体。在一些实施方案中,怀疑受试者患有疾病或病症,因此从该受试者获得的无细胞多核苷酸可能包含与疾病或病症相关的序列变体。在一些实施方案中,受试者是怀孕的,因此从该受试者获得的无细胞多核苷酸包括胎儿多核苷酸。
在一些实施方案中,无细胞核酸样品包含来源于健康或非病变细胞和病变细胞和/或胎儿细胞的无细胞多核苷酸的混合物。在一些实施方案中,从患有诸如癌症等疾病的受试者或患者获得的无细胞核酸样品可包含来自健康或非病变细胞和病变细胞(例如癌细胞)的无细胞核酸。无细胞肿瘤核酸与来自非病变细胞的无细胞核酸的相对比例可取决于疾病或肿瘤的严重程度。在一些实施方案中,无细胞肿瘤核酸可代表核酸样品的少于约10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%或更少。在一些实施方案中,无细胞核酸样品的靶核酸包含基因中的至少一个序列突变,包括点突变、单核苷酸多态性(SNP)、插入、缺失、置换、转座、易位、拷贝数变异或其他基因突变、改变或序列变异。该序列突变可以指示疾病,如癌症。在一些实施方案中,靶核酸包含染色体重排。染色体重排是例如缺失、复制、倒位或易位。
在一些实施方案中,从怀孕的受试者获得的无细胞核酸样品包含来自母亲和胎儿两者的无细胞核酸。来自母亲和来自胎儿的无细胞核酸的相对比例可以因受试者而异。在一些实施方案中,无细胞胎儿核酸可代表核酸样品的少于约10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%或更少。在一些实施方案中,无细胞核酸样品的靶核酸可包含胎儿的突变等位基因,例如与诸如囊性纤维化、β-地中海贫血、镰状细胞贫血、脊髓性肌肉萎缩、肌强直性营养不良、脆性X综合征、杜氏肌营养不良症和血友病等单基因疾病相关的突变等位基因。在一些实施方案中,无细胞核酸样品的靶核酸可包含被怀疑为非整倍性或以异常数量(例如,三体性或四体性)存在的染色体的基因或区域。
在一些实施方案中,从受试者获得的无细胞核酸样品包含受试者的无细胞核酸和病原体如细菌或病毒的无细胞核酸的混合物。来自病原体的遗传物质或核酸的存在可用于诊断和/或监测病原体感染,如细菌感染和/或病毒感染。在一些实施方案中,来自病原体如细菌或病毒的无细胞核酸可代表核酸样品的少于约5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%或更少。
无细胞多核苷酸可从各种非细胞来源获得。可获得无细胞多核苷酸的非细胞来源的非限制性实例是血清、血浆、血液、汗液、唾液、尿液、粪便、精液、粘膜排泄物、脊髓液、羊水和淋巴液。用于收集可获得无细胞多核苷酸的非细胞来源的样品的各种方法是可用的。在一些实施方案中,从受试者获得可获得无细胞多核苷酸的非细胞来源的样品。在一些实施方案中,通过静脉穿刺获得样品。在一些实施方案中,通过抽吸获得样品。
各种方法和商用试剂盒可用于从样品获得无细胞多核苷酸,如无细胞DNA。用于提取和分离无细胞多核苷酸(包括无细胞DNA)的方法和试剂盒的实例是苯酚/氯仿提取、苯酚/氯仿/异戊醇(PCI)-糖原提取、NaI(碘化钠)提取、胍树脂提取、带有载体RNA的QIAmpDNA Blood Midi试剂盒、ChargeSwitch血清试剂盒、ZR血清DNA试剂盒、QiagenQubitTMdsDNA HS Assay试剂盒、AgilentTMDNA 1000试剂盒、TruSeqTMSequencing LibraryPreparation以及Puregene DNA纯化系统Blood试剂盒。
无细胞多核苷酸(包括无细胞DNA)可以通过分隔步骤从体液中提取和分离,该分隔步骤中无细胞多核苷酸与体液的细胞和其他非可溶性组分相分离。分隔技术的实例是离心和过滤。在一些实施方案中,没有首先将细胞与无细胞多核苷酸相分隔,而是首先进行裂解。在一些实施方案中,通过选择性沉淀来分隔完整细胞的基因组DNA。无细胞多核苷酸(包括DNA)可保持可溶性,并可与不溶性基因组DNA相分离并被提取。根据一些程序,在添加缓冲液以及不同试剂盒特定的其他洗涤步骤后,可以使用异丙醇沉淀来沉淀DNA。可以使用进一步的清理步骤,如基于二氧化硅的柱来去除污染物或盐。通用步骤可针对特定应用进行优化。例如,可以在整个反应期间添加非特异性批量载体多核苷酸以优化该程序的某些方面,如产率。
在一些实施方案中,无细胞DNA片段的长度大致均匀。在一些实施方案中,无细胞DNA片段的长度并非大致均匀。在一些实施方案中,无细胞DNA片段具有约50至约1000个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约50至约500个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约50至约250个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约50至约200个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约50至约100个核苷酸的平均长度。在一些实施方案中,DNA片段具有约100至约300个核苷酸的平均长度。
样品中多核苷酸的起始量可以很小。在一些实施方案中,起始多核苷酸的量小于50ng,如小于45ng、40ng、35ng、30ng、25ng、20ng、15ng、10ng、5ng、4ng、3ng、2ng、1ng、0.5ng、0.1ng或更低。在一些实施方案中,起始多核苷酸的量在0.1-100ng的范围内,如1-75ng、5-50ng或10-20ng。通常,较低的起始材料增加了从各种处理步骤中提高回收率的重要性。对于大量的起始材料(例如从实验室培养的细菌中纯化),这可能不是实质性障碍。然而,对于起始材料显著较低的样品,在该低范围内的回收可能是检测足够罕见变体的实质性障碍。因此,在一些实施方案中,本公开内容的方法中,样品在从一个步骤回收到另一个步骤,例如,输入到可用于输入后续扩增步骤(或测序步骤)中的环化步骤的质量分数约为或大于约50%、60%、75%、80%、85%、90%、95%或更多。从特定步骤的回收可能接近100%。回收可以针对特定形式,如从非环状多核苷酸的输入中回收环状多核苷酸。
在本文方面的各个实施方案中,确定无细胞核酸样品中的靶核酸或标准品中的参考多核苷酸的拷贝数以获得观测丰度。可以使用各种合适的方法来确定分子的拷贝数或分子数,这些方法包括但不限于数字PCR(dPCR)、小液滴数字PCR(ddPCR)、定量PCR和下一代序列(NGS)方法。
在一些实施方案中,使用dPCR获得靶核酸和/或参考多核苷酸的拷贝数和/或观测丰度。dPCR是指这样一种技术,其中在大量单独的PCR反应中进行样品的有限稀释,使得大多数反应不具有模板分子并产生阴性扩增结果。在反应终点处为阳性的那些反应被计数为在原始样品中以1比1关系存在的单个模板分子。该方法是绝对计数方法,其中将溶液分区到容器中,直到平均概率为每两个容器存在一个分子或者当PO=(1-e-n/c)=1/2时;其中n为分子数且c为容器数,或者n/c为0.693。假定进行定量分区,动态范围由可用于随机分离的容器数决定。然后通过PCR来检测分子,并对阳性容器的数目进行计数。例如,可以使用荧光团标记的用于PCR的靶标特异性引物检测这些分子。每个成功的扩增被计数为一个分子,与产物的实际量无关。在本文方面的各个实施方案中,使用小液滴数字PCR(ddPCR)获得拷贝数和/或观测丰度。小液滴数字PCR(ddPCR)是一种用于进行数字PCR的方法,其通常基于水-油乳液小液滴技术。ddPCR包括将样品分级分离成小液滴,并对每个单独的小液滴中的模板分子进行PCR扩增。在一些实施方案中,可以通过多路化来检测多个靶标(例如,靶核酸或参考多核苷酸)。例如,为了检测两种靶核酸——野生型和突变体,可以使用对野生型具有特异性的引物和对突变体具有特异性的引物。这两组引物——野生型和突变体,可以用相同的荧光团标记。为了区分两种产物——野生型和突变体扩增产物,针对野生型和突变体的引物可以以不同的浓度使用,例如以2:1的比例使用。可以对样品进行分区,使得每个分区或小液滴包含所有PCR试剂、引物和≤1个拷贝的模板DNA。除了比较与引物浓度相关的荧光强度之外,还可以通过对位置扩增的数目进行计数来确定野生型和突变分子的存在。在某些情况下,可以使用两种不同的荧光团。
在一些实施方案中,使用“实时PCR”或定量实时聚合酶链反应(Q-PCR/qPCR/qrt-PCR)或动力学聚合酶链反应(KPCR)获得靶核酸的拷贝数和/或观测丰度。实时PCR或qPCR是指一种基于PCR的技术,其用于扩增并同时量化靶DNA分子。它允许对DNA样品中的一种或多种特定序列进行检测和定量(作为拷贝的绝对数,或者当相对于DNA输入或额外的归一化基因进行归一化时,作为相对量)。它基于PCR产物扩增期间按比例产生的荧光信号的检测。通常,随着循环的进行,荧光的量增加,并且响应于此,形成图。在从标准品样品获得PCR标准曲线后,将未知样品的PCR Ct值应用于该标准曲线并进行定量。可以针对任何靶核酸,例如基因的特定等位基因,设计用于qPCR扩增的引物。
在本文方面的各个实施方案中,在扩增反应如dPCR、ddPCR和qPCR中使用扩增引物检测靶核酸。引物可以是任何合适长度的核苷酸或碱基。例如,引物的长度可为约或至少约10个碱基(例如,长度为至少约15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或约100个碱基)。引物可以具有用来检测所需靶标的任何合适的序列,例如与以下这些互补的序列:突变等位基因、野生型等位基因、染色体重排、特定染色体、参考多核苷酸或与这些中的任何一个相邻的序列。
在一些实施方案中,使用核酸测序如下一代测序技术获得靶核酸的拷贝数和/或观测丰度。测序可用来确定无细胞核酸样品中的核苷酸序列或多核苷酸身份。在一些实施方案中,对多核苷酸的扩增产物进行测序,而不是直接对来自样品的多核苷酸进行测序。然后可以分析序列数据,以确定样品中靶核酸的拷贝数。
下一代测序(NGS)技术可以允许以高度平行的方式确定核苷酸序列。核酸扩增和下一代测序(NGS)技术包括但不限于单分子实时测序、离子半导体测序、焦磷酸测序、合成测序(SBS)、连接测序(SBL)、链终止测序、大规模平行标记测序、聚合酶克隆测序、DNA纳米球测序、Heliscope单分子测序、Nanopore DNA测序、杂交测序、质谱法测序、微流体Sanger测序和基于显微术的测序技术。
可用于NGS反应的模板类型包括源自单个DNA分子和单个DNA分子模板的克隆扩增的模板。制备克隆扩增模板的方法包括乳液PCR(emPCR)和固相扩增。制备克隆扩增模板的其他方法包括多重置换扩增(MDA),其中随机六聚体引物与模板退火,并且通过高保真酶(如通常为phi29)在恒定温度或接近恒定温度下合成DNA。
单分子模板是另一种类型的可用于NGS反应的模板。可以通过各种方法将空间分离的单分子模板固定在固体支持物上。在一种方法中,各个引物分子共价附接到固体支持物上。将衔接子添加到模板中,然后使模板与固定的引物杂交。在另一种方法中,通过从固定的引物引发和延伸单链单分子模板,将单分子模板共价附接到固体支持物上。然后可以使通用引物与模板杂交。在另一种方法中,将单个聚合酶分子附接到固体支持物上,被引发的模板与该固体支持物结合。
模板制备后,可以进行测序。用于NGS的示例性测序和成像方法包括但不限于循环可逆终止(CRT)、连接测序(SBL)、单分子添加(例如,焦磷酸测序)和实时测序。用于NGS的其他测序方法包括但不限于纳米孔测序、杂交测序、基于纳米晶体管阵列的测序、聚合酶克隆测序、基于扫描隧道显微术(STM)的测序和基于纳米线-分子传感器的测序。双端测序方法也可用于NGS。
在本文方面的各个实施方案中,在扩增之前,使无细胞核酸样品的核酸(例如,靶核酸和非靶核酸)或无细胞核酸标准品(例如,核酸标准品的基因组多核苷酸)环化,以产生多个环化核酸和/或环化多核苷酸。环化核酸(例如,靶和非靶)可以通过各种方法由线性核酸形成。在一些实施方案中,通过末端连接使单个线性靶多核苷酸环化。在一些实施方案中,第一线性靶多核苷酸与第二线性靶多核苷酸连接,然后第一靶多核苷酸的未连接末端与第二线性靶多核苷酸的未连接末端连接以形成包含第一和第二靶多核苷酸的环状靶多核苷酸。待环化的核酸可以是单链或双链的。在需要单链环的情况下,多核苷酸可以是最初分离的单链核酸,或者可以进行处理以使该核酸成为单链(例如通过变性)。在一些实施方案中,用于使核酸环化的方法涉及酶,例如使用连接酶(例如RNA连接酶或DNA连接酶)。
在一些实施方案中,可以包括外切核酸酶步骤以在环化反应后消化任何未连接的核酸。也就是说,闭合环不含游离5’或3’端,因此引入5’或3’外切核酸酶不会消化闭合环,但会消化未连接的组分。环化之后,反应产物可在扩增或测序之前进行纯化以提高可参与后续步骤的环化多核苷酸的相对浓度或纯度(例如,通过环状多核苷酸的分离或反应中一种或多种其他分子的去除)。例如,可处理环化反应或其组分以去除单链(未环化的)多核苷酸,例如通过外切核酸酶处理。作为进一步的实例,环化反应或其部分可进行大小排阻色谱分析,借此保留及丢弃小试剂,或在单独的体积中保留并释放环化产物。多种用于清理连接反应的试剂盒是可用的,例如由Zymo Reserch制造的Zymo寡核苷酸纯化试剂盒所提供的试剂盒。在一些实施方案中,纯化包括用于去除或降解在环化反应中使用的连接酶和/或将环化多核苷酸从该连接酶中纯化的处理。在一些实施方案中,用于降解连接酶的处理包括用蛋白酶如蛋白酶K进行的处理。蛋白酶K处理可遵循制造商的方案或标准方案(例如,如Sambrook和Green,Molecular Cloning:A Laboratory Manual,第4版(2012)所提供的)。蛋白酶处理之后还可进行提取和沉淀。在一个实例中,环化多核苷酸如下纯化:在0.1%SDS和20mM EDTA的存在下进行蛋白酶K(Qiagen)处理,用1:1苯酚/氯仿和氯仿抽提,并用乙醇或异丙醇沉淀。在一些实施方案中,沉淀在乙醇中进行。
在本文方面的各个实施方案中,在扩增之前,将核酸与衔接子多核苷酸连接以产生多个衔接子标记的核酸。衔接子多核苷酸通常是指在多核苷酸的5'和/或3’端掺入的寡核苷酸,以促进一个或多个下游分析步骤,例如在扩增和/或测序反应中。例如,衔接子多核苷酸可含有多种序列元件中的一种或多种,包括但不限于扩增引物结合位点、测序引物结合位点、条形码序列、样品索引序列、将多核苷酸与流动池结合以供下一代序列的序列和/或限制酶序列。两个或更多个序列元件可以彼此不相邻(例如,被一个或多个核苷酸隔开)、彼此相邻、部分重叠或完全重叠。例如,扩增引物退火序列也可以用作测序引物退火序列。序列元件可位于3’端处或附近、5’端处或附近,或衔接子多核苷酸内部。衔接子多核苷酸与核酸的连接可以通过酶实现,例如使用连接酶(例如RNA连接酶或DNA连接酶)实现。
在一些实施方案中,衔接子多核苷酸含有通用扩增引物结合位点或衔接子多核苷酸共有的位点,使得所有衔接子标记的核酸可以用相同的引物序列扩增。在一些实施方案中,使用衔接子多核苷酸将多核苷酸与流动池结合以供下一代测序。下一代测序方法的非限制性实例是单分子实时测序、离子半导体测序、焦磷酸测序、合成测序、连接测序和链终止。用于流动池附接的测序衔接子可包含与下一代测序系统如454测序、Ion TorrentProton或PGM和Illumina X10相容的任何合适的序列。用于下一代测序方法的测序衔接子的非限制性实例包括适用于Illumina测序系统的P5和P7衔接子;TruSeq通用衔接子;和TruSeq索引化衔接子。在一些实施方案中,测序衔接子可用于富集包含衔接子序列的多核苷酸,例如经由扩增,如聚合酶链反应(PCR)。
可用于将线性靶多核苷酸连接成环状靶多核苷酸和/或将衔接子多核苷酸连接到核酸的酶的非限制性实例包括ATP依赖性双链多核苷酸连接酶、NAD+依赖性DNA或RNA连接酶以及单链多核苷酸连接酶。连接酶的非限制性实例是CircLigase I和CircLigase II(Epicentre;Madison,WI)、大肠杆菌DNA连接酶、丝状栖热菌DNA连接酶、Tth DNA连接酶、水管致黑栖热菌DNA连接酶(I型和II型)、T3 DNA连接酶、T4 DNA连接酶、T4 RNA连接酶、T7DNA连接酶、Taq连接酶、Ampligase(Technologies Corp.)、VanC-型连接酶、9°N DNA连接酶、Tsp DNA连接酶、DNA连接酶I型、DNA连接酶III型、DNA连接酶IV型、Sso7-T3DNA连接酶、Sso7-T4 DNA连接酶、Sso7-T7 DNA连接酶、Sso7-Taq DNA连接酶、Sso7-大肠杆菌DNA连接酶、Sso7-Ampligase DNA连接酶,以及热稳定连接酶。连接酶可以是野生型、突变同工型和基因工程化变体。连接反应可含有缓冲组分、小分子连接增强剂和其他反应组分。
在一些实施方案中,调节核酸和酶的浓度以促进分子间连接而不是分子内连接。在一些实施方案中,调节反应温度和反应时间或反应的长度。也可调节反应温度和时间。在一些实施方案中,使用60℃来促进分子内环的形成。在一些实施方案中,反应时间为12-16小时。反应条件可以是所选择的酶的制造商所规定的条件。在一些实施方案中,连接核酸的末端以形成环状核酸(直接连接至其自身或连接至一种或多种其他核酸,例如,包含两种靶核酸的环状靶核酸)产生具有接头序列的接头。
在本文方面的各个实施方案中,核酸(包括CFNA样品和/或CFNA标准品的核酸)在5’末端处包含磷酸基团且在3’末端处包含羟基,它们不是由多核苷酸激酶生成的,并且该核酸在不存在磷酸供体的情况下是可连接的(例如,分子间和分子内)。在5’端缺少磷酸基团和/或在3’端缺少羟基的核酸可能以低效率连接,或者在一些情况下,可能不会在分子间或分子内连接。在连接之前,可以使用酶修复在5’末端缺少磷酸基团和/或在3’末端缺少羟基的核酸的末端。末端修复可包括5’末端核苷酸的磷酸化、3’末端核苷酸的去磷酸化或两者,以产生可连接的多核苷酸。可用于末端修复的酶包括多核苷酸激酶,如T4多核苷酸激酶,其可催化Pi从ATP的γ位置转移和交换到多核苷酸的5'-羟基末端(双链和单链DNA和RNA)和核苷3'-单磷酸上。除腺苷三磷酸(ATP)或脱氧腺苷三磷酸(dATP)之外的任何合适的磷酸供体可以用于使用PNK的末端修复反应。合适的磷酸供体包括但不限于鸟苷三磷酸(GTP)、胞苷三磷酸(CTP)、尿苷三磷酸(UTP)或脱氧胸苷三磷酸(dTTP)。一些多核苷酸激酶还可以催化从3'-磷酰基多核苷酸、脱氧核苷3'-单磷酸和脱氧核苷3'-二磷酸上去除3'-磷酰基。PNK的组合也可用于末端修复反应。本公开内容的CFNA标准品的基因组多核苷酸可以以至少50%(例如,55%、56%、60%、65%、70%、75%、80%、85%、90%或95%)的效率例如在分子内连接以生成环化核酸或在分子间与衔接子多核苷酸连接以生成衔接子标记的核酸。本公开内容的无细胞核酸的核酸在没有预先使用多核苷酸激酶进行末端修复的情况下可以以至少50%(例如,55%、56%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率例如在分子内连接以生成环化核酸或在分子间与核苷酸衔接子连接以生成衔接子标记的核酸。本公开内容的无细胞核酸的核酸在不存在磷酸供体的情况下可以以至少50%(例如,55%、56%、60%、65%、70%、75%、80%、85%、90%、95%或高于95%)的效率例如在分子内连接以生成环化核酸或在分子间与核苷酸衔接子连接以生成衔接子标记的核酸。在一些实施方案中,通过聚合酶链反应(PCR)测定,如定量PCR测定,来确定连接效率。
在本文方面的各个实施方案中,核酸(例如,靶核酸、非靶核酸、环化核酸和衔接子标记的线性核酸)在引物延伸和扩增反应中被扩增。引物延伸反应可涉及温度变化(热循环)或恒温(等温)。在一些实施方案中,引物延伸反应包括聚合酶链反应(PCR)。PCR通常涉及通过多个阶段的变性、引物对与相反链退火,以及用于使靶序列拷贝数指数增加的引物延伸而进行的循环,这些阶段中的至少一些通常在不同的反应温度下发生。PCR扩增技术的非限制实例是定量PCR(qPCR或实时PCR)、逆转录PCR(RT-PCR)、数字PCR(dPCR或dePCR)、靶标特异性PCR以及定量逆转录PCR(qRT-PCR)。例如,在使用Taq DNA聚合酶的常规PCR中,双链靶核酸可以在>90℃的温度下变性,引物在50℃-75℃的温度下退火,并且引物在72℃-78℃的温度下延伸。反应体积通常为几百纳升(例如200nL)至几百μL(例如200μL)。可用于PCR的聚合酶的实例为热稳定聚合酶,包括但不限于嗜热栖热菌HB8;突变Thermus oshimai;水管致黑栖热菌;嗜热栖热菌1B21;嗜热栖热菌GK24;水生栖热菌聚合酶(FS或Taq(G46D;F667Y),Taq(G46D;F667Y;E6811)和Taq(G46D;F667Y;T664N;R660G));激烈火球菌聚合酶;Thermococcus gorgonarius聚合酶;火球菌属物种GB-D聚合酶;栖热球菌属(菌株9°N-7)聚合酶;嗜热脂肪芽胞杆菌聚合酶;Tsp聚合酶;ThermalAceTM聚合酶(Invitrogen);黄栖热菌聚合酶;Thermus litoralis聚合酶;栖热菌属Z05聚合酶;δZ05聚合酶(例如,δZ05 Gold DNA聚合酶);以及其突变体、变体或其衍生物。可用于PCR的聚合酶的其他实例是非热稳定聚合酶,包括但不限于DNA聚合酶I;突变DNA聚合酶I,包括但不限于Klenow片段和Klenow片段(3’至5’外切核酸酶(-));T4 DNA聚合酶;突变T4 DNA聚合酶;T7DNA聚合酶;突变T7 DNA聚合酶;phi29 DNA聚合酶;以及突变phi29 DNA聚合酶。在一些实施方案中,使用热启动聚合酶。热启动聚合酶是需要热激活的DNA聚合酶的修饰形式。这样的聚合酶可用于例如进一步提高敏感度、特异性和产率;并且/或者进一步改善低拷贝靶标扩增。通常,热启动酶以非活性状态提供。热活化后,释放修饰物或改性剂,从而生成活性酶。许多热启动聚合酶可从各种商业来源获得,如Applied Biosystems;Bio-Rad;eEnzymeLLC;Eppendorf North America;Finnzymes Oy;GeneChoice,Inc.;Invitrogen;JenaBioscience GmbH;MIDSCI;Minerva Biolabs GmbH;New England Biolabs;Novagen;Promega;QIAGEN;Roche Applied Science;Sigma-Aldrich;Stratagene;Takara MirusBio;USB Corp.;Yorkshire Bioscience Ltd;等等。
在一些实施方案中,引物延伸和扩增反应包括等温反应。等温扩增技术的非限制性实例是连接酶链反应(LCR)(例如,美国专利号5,494,810和5,830,711);转录介导的扩增(TMA)(例如,美国专利号5,399,491、5,888,779、5,705,365、5,710,029);基于核酸序列的扩增(NASBA)(例如,Malek等人,美国专利号5,130,238);信号介导的RNA扩增技术(SMART)(例如,Wharam等人,Nucleic Acids Res.2001,29,e54);链置换扩增(SDA)(例如,美国专利号5,455,166);嗜热SDA(Spargo等人,Mol Cell Probes 1996,10:247-256;欧洲专利号0684315);滚环扩增(RCA)(例如,Lizardi,“Rolling Circle Replication ReporterSystems,”美国专利号5,854,033);环介导的DNA等温扩增(LAMP)(例如,Notomi等人,“Process for Synthesizing Nucleic Acid,”美国专利号6,410,278);解旋酶依赖性扩增(HDA)(例如,美国专利申请US 20040058378);单引物等温扩增(SPIA)(例如,WO2001020035和美国专利号6,251,639);以及环状解旋酶依赖性扩增(cHDA)(例如,美国专利申请US.10/594,095)。
在一些实施方案中,引物延伸反应通过具有链置换活性的聚合酶实现如对于RCA。在一些实施方案中,等温扩增包括滚环扩增(RCA)。RCA反应混合物可包含一种或多种引物、具有链置换活性的聚合酶,和dNTP。链置换是指在合成期间置换下游DNA的能力。具有链置换活性的聚合酶可具有不同程度的链置换活性。在一些实施方案中,聚合酶可具有弱链置换活性或没有链置换活性。在一些实施方案中,聚合酶可具有强链置换活性。在一些实施方案中,具有链置换活性的聚合酶可在不同反应温度下具有不同水平的链置换活性。在一些实施方案中,聚合酶可以在中等温度例如20℃-37℃下显示链置换活性。在一些实施方案中,聚合酶可以在升高的温度例如65℃下显示链置换活性。可调节反应温度以有利于具有链置换活性的聚合酶的活性水平。在一些实施方案中,反应温度为至少20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃或90℃。在一些实施方案中,反应温度为20℃至80℃。在一些实施方案中,反应温度为20℃至70℃。在一些实施方案中,反应温度为20℃至60℃。在一些实施方案中,反应温度为20℃至50℃。在一些实施方案中,可以在不同阶段中循环通过不同反应温度以提高或降低聚合酶的链置换活性。具有链置换活性的聚合酶的非限制性实例包括Bst DNA聚合酶,大片段;Bsu DNA聚合酶,大片段;DeepVentR TM DNA聚合酶;Deep VentR TM(exo-)DNA聚合酶;Klenow片段(3’-5’exo-);DNA聚合酶I,大片段;M-MuLV逆转录酶;phi29 DNA聚合酶;DNA聚合酶;以及(exo-)DNA聚合酶。
实施例
下列实施例是为了说明本公开内容的各个实施方案而给出的,并非意在以任何方式限制本公开内容。本领域技术人员将会想到由权利要求范围限定的本发明精神内所包含的其变化和其他应用。
实施例1—CFNA标准品的生成
通过使从细胞分离的细胞核与内切核酸酶接触以生成多个基因组多核苷酸而生成本文公开的CFNA标准品。细胞核可以从任何细胞(例如细胞系的细胞)群体中分离。在细胞核分离之前,用磷酸盐缓冲盐水(PBS)洗涤细胞,并通过离心进行沉淀,以除去培养基和可能干扰下游过程的其他试剂。将细胞沉淀物重悬于含有透化剂如Triton X-100、Tween-20、皂苷、SDS、NP40、链球菌溶血素O、蛋白酶K、链霉蛋白酶或三乙醇胺的细胞裂解缓冲液中。或者,使用低渗休克和/或超声处理使细胞样品透化。
通过离心使细胞核沉淀。然后用酶如内切核酸酶(例如,胱天蛋白酶活化的DNA酶(CAD)、DNA酶I,包括单链特异性和双链特异性DNA酶、DNA酶γ和内切核酸酶G)处理收获的细胞核,以将核小体DNA切割成单核小体-长度的DNA片段(例如,基因组多核苷酸)。
基因组多核苷酸在使用前纯化,例如通过柱纯化或大小排阻色谱法。任选地在使用前针对大小(例如,长度)选择基因组多核苷酸,例如以便富集长度为单核小体的基因组多核苷酸的比例。
实施例2—本文公开的CFNA标准品的大小分布
通过生物分析仪分析如本文公开的对照cfDNA和CFNA标准品,以比较每个样品中核酸的大小分布。图1A示出了对照cfDNA样品的生物分析仪数据。图1B示出了使用本文公开的方法生成的CFNA标准品的生物分析仪数据。通过取A曲线下面积(长度为约100-300个碱基的核酸)与B曲线下面积(长度为约50-1000个碱基的核酸)的比例来对每个样品中长度为约100-300个碱基的核酸的百分比(%)进行定量。在对照cfDNA样品中,约56%的核酸具有约100-300个碱基的长度。在CFNA标准品中,约50%的核酸具有约100-300个碱基的长度。
实施例3—分子间连接效率的比较
比较对照无细胞DNA、本文公开的CFNA标准品和声处理的基因组DNA的分子间连接效率。使用标准KAPA NGS文库构建试剂盒进行连接反应。简言之,按照制造商的方案进行末端修复、A-加尾和衔接子连接。使用KAPA quant qPCR试剂盒测量连接的分子的百分比(%)(表1)。如表1所示,使用标准KAPA NGS文库构建试剂盒和声处理的基因组DNA(‘声处理的基因组DNA’)产生的连接分子的%低于使用本文公开的CFNA标准品(‘CFNA标准品’)得到的结果。
表1.分子间连接效率的比较
分子间连接效率 | 连接的分子的% |
对照cfDNA | 61% |
CFNA标准品 | 77% |
声处理的基因组DNA | 32% |
实施例4—分子内连接效率的比较
比较平均长度为~150bp的对照无细胞DNA(‘对照’)、本文公开的CFNA标准品(‘CFNA标准品’)和声处理的基因组DNA(‘声处理的DNA’)的分子内连接效率。连接反应如下进行:对于每个连接反应,通过在95℃加热30秒并在冰上冷却2分钟使30ng纯化的DNA片段变性。然后,将8μl含有2μl的10x CircLigase缓冲液、4μl的5M甜菜碱、1μl的50mM MnCl2和1μl的CircLigase II的连接混合物添加到变性的DNA样品中,并将反应在60℃下温育至少3个小时。对每种样品类型(对照、CFNA标准品和声处理的DNA)设置两个重复。
在连接过程结束时,用外切核酸酶混合物处理每种样品类型的两个重复之一,以除去剩余的线性单链DNA分子。对于外切核酸酶处理,首先将连接产物在80℃加热45秒,然后添加1μl外切核酸酶混合物(ExoI 20U/μl:ExoIII 100U/μl,1:2比例)。将样品在热循环仪上在37℃下温育30分钟,然后在80℃下温育20分钟。然后用15%mini-PROTEAN TBE-尿素凝胶分析原始线性DNA、连接的DNA(例如连接酶处理的)、连接的和外切核酸酶处理的DNA样品(例如,连接酶和外切核酸酶处理的)。如图2所示,在对照和CFNA标准品样品中,DNA分子的显著一部分得到环化,如条带移位所示。然而,对于声处理的基因组DNA,几乎不存在环化DNA。用连接酶和外切核酸酶处理的声处理的DNA在泳道中存在的剩余线性DNA可能是不完全外切核酸酶消化的结果。
尽管本文中已经示出并描述了本发明的优选实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本发明的情况下现将想到多种变化、改变和替代。应当理解,本文中所述的本发明实施方案的各种替代方案均可用于实施本发明。旨在由以下权利要求来限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。
Claims (127)
1.一种用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中存在的靶核酸的丰度的方法,所述方法包括:
(a)对所述CFNA样品中的所述靶核酸的拷贝数进行定量,以获得所述靶核酸的观测丰度;
(b)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的所述参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5'末端和3'末端,其中:
(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且
(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5'末端处具有磷酸基团并且在3'末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5'末端处生成磷酸基团和/或在3'末端处生成羟基;以及
(c)通过使用所述校准方案调整所述靶核酸的观测丰度来估算所述CFNA样品中的所述靶核酸的丰度。
2.根据权利要求1所述的方法,其中所述CFNA标准品的少于50%的单个基因组多核苷酸具有相同的序列。
3.根据权利要求1所述的方法,其中所述CFNA标准品包含具有相同成员的基因组多核苷酸的子集,并且其中所述子集代表所述CFNA标准品的少于50%。
4.根据权利要求1所述的方法,其中至少30%的所述基因组多核苷酸具有范围为约100-300个碱基的长度。
5.根据权利要求1所述的方法,其中至少50%的所述基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。
6.根据权利要求1-5中的任一项所述的方法,其中基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶生成的。
7.根据权利要求1-6中的任一项所述的方法,其中所述CFNA标准品的所述基因组多核苷酸可以以至少约50%的效率连接。
8.根据权利要求7所述的方法,其中所述CFNA标准品的所述基因组多核苷酸可以以通过定量聚合酶链反应(PCR)测定所确定的至少约50%的效率连接。
9.根据权利要求1-6中的任一项所述的方法,其中所述CFNA标准品的所述基因组多核苷酸在不存在磷酸供体的情况下是可连接的。
10.根据权利要求1所述的方法,其中所述CFNA标准品中存在的所述参考核酸的预期丰度小于20%。
11.根据权利要求1所述的方法,其中所述参考核酸包含突变等位基因。
12.根据权利要求11所述的方法,其中所述突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。
13.根据权利要求1所述的方法,其中生成所述校准方案还包括将附加CFNA标准品中存在的所述参考核酸的观测丰度与所述附加CFNA标准品中存在的所述参考核酸的预期丰度相关联。
14.根据权利要求13所述的方法,其中所述附加CFNA标准品中存在的所述参考核酸的预期丰度不同于所述CFNA标准品中存在的所述参考核酸的预期丰度。
15.根据权利要求1所述的方法,其中生成所述校准方案还包括将所述CFNA标准品中存在的至少一种附加参考核酸的观测丰度与所述CFNA标准品中存在的所述至少一种附加参考核酸的预期丰度相关联。
16.根据权利要求15所述的方法,其中所述CFNA标准品中存在的至少一种附加参考核酸的预期丰度小于20%。
17.根据权利要求15所述的方法,其中所述至少一种附加参考核酸包含附加突变等位基因。
18.根据权利要求17所述的方法,其中所述附加突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。
19.根据权利要求1-18中的任一项所述的方法,其中所述CFNA标准品包含单链基因组多核苷酸。
20.根据权利要求1-18中的任一项所述的方法,其中所述CFNA标准品包含双链基因组多核苷酸。
21.根据权利要求20所述的方法,其中在生成所述校准方案之前,使所述双链基因组多核苷酸变性以形成单链基因组多核苷酸。
22.根据权利要求1所述的方法,其中所述校准方案包括校准算法,所述校准算法针对所述参考核酸的多个预期丰度水平调整所述参考核酸的观测丰度与所述参考核酸的预期丰度的偏差。
23.根据权利要求1所述的方法,其中所述校准方案包括最佳拟合线。
24.根据权利要求1所述的方法,其中通过扩增反应确定所述靶核酸的观测丰度。
25.根据权利要求24所述的方法,其中所述扩增反应包括数字聚合酶链反应(dPCR)。
26.根据权利要求24所述的方法,其中所述扩增反应包括小液滴数字聚合酶链反应(ddPCR)。
27.根据权利要求24所述的方法,其中所述扩增反应包括定量聚合酶链反应(qPCR)。
28.根据权利要求25-27中的任一项所述的方法,其中所述扩增反应用对所述靶核酸具有特异性的扩增引物进行。
29.根据权利要求1所述的方法,其中所述CFNA标准品中存在的所述靶核酸的观测丰度通过以下步骤确定:
(a)对多个扩增产物进行测序以生成多个序列读取,其中所述多个扩增产物是通过扩增所述CFNA样品中的所述靶核酸和非靶核酸而生成的;以及
(b)分析所述序列读取以计算所述靶核酸的观测丰度。
30.根据权利要求29所述的方法,其中在扩增之前,使所述靶核酸和所述非靶核酸环化以产生多个环化靶核酸和多个环化非靶核酸。
31.根据权利要求30所述的方法,其中通过使存在于所述CFNA样品中的所述靶核酸和所述非靶核酸经历连接反应来实现环化。
32.根据权利要求31所述的方法,其中在不存在磷酸供体的情况下,使所述靶核酸和所述非靶核酸环化。
33.根据权利要求31或32所述的方法,其中所述靶核酸和所述非靶核酸以至少50%的效率环化。
34.根据权利要求30-33中的任一项所述的方法,进一步包括在扩增之前降解未环化的靶核酸和未环化的非靶核酸。
35.根据权利要求30-34中的任一项所述的方法,其中扩增包括滚环扩增。
36.根据权利要求30-35中的任一项所述的方法,其中扩增包括随机引物的延伸。
37.根据权利要求30-35中的任一项所述的方法,其中扩增包括对靶序列具有特异性的一种或多种引物的延伸。
38.根据权利要求36或37所述的方法,其中所述引物包含标签序列、测序引物结合序列或两者。
39.根据权利要求29所述的方法,其中所述靶核酸和所述非靶核酸在扩增之前与衔接子多核苷酸连接,以产生多个衔接子标记的靶核酸和多个衔接子标记的非靶核酸。
40.根据权利要求39所述的方法,其中通过使所述靶核酸和所述非靶核酸经历连接反应来实现与衔接子多核苷酸的连接。
41.根据权利要求40所述的方法,其中在不存在磷酸供体的情况下将所述靶核酸和所述非靶核酸与衔接子多核苷酸连接。
42.根据权利要求40所述的方法,其中所述靶核酸和所述非靶核酸以至少50%的效率与衔接子多核苷酸连接。
43.根据权利要求40所述的方法,其中所述靶核酸和所述非靶核酸在A-加尾后以至少50%的效率与衔接子多核苷酸连接。
44.根据权利要求39-43中的任一项所述的方法,其中衔接子多核苷酸包含标签序列、测序引物结合序列或两者。
45.根据权利要求44所述的方法,其中扩增包括对所述衔接子多核苷酸的引物结合序列具有特异性的一种或多种引物的延伸。
46.根据权利要求1-45中的任一项所述的方法,其中所述靶核酸包含与所述参考核酸的核苷酸序列至少90%相同的核苷酸序列。
47.根据权利要求1-46中的任一项所述的方法,其中所述靶核酸的估算丰度是浓度。
48.根据权利要求1-46中的任一项所述的方法,其中所述靶核酸包含突变等位基因。
49.根据权利要求48所述的方法,其中所述靶核酸的估算丰度是等位基因频率。
50.一种用于评估无细胞核酸(CFNA)测定的检测极限的方法,其包括:
(a)用多个CFNA标准品进行CFNA测定以对每个标准品获得每个标准品中存在的参考多核苷酸的观测丰度,所述多个CFNA标准品涵盖所述参考多核苷酸的给定范围的预期丰度,其中所述多个标准品中的每个标准品具有与所述多个标准品中的其他标准品不同的参考多核苷酸预期丰度,并且其中每个标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:
(i)对于所述多个标准品中的单个标准品,所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且
(ii)对于所述多个标准品中的单个标准品,大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及
(b)鉴定所述参考多核苷酸的相应观测丰度在统计上无法与背景测量值区分时的预期丰度,从而将所述预期丰度判定为所述CFNA测定的检测极限。
51.根据权利要求50所述的方法,其中所述参考多核苷酸的预期丰度的给定范围为约0.001%至20%。
52.根据权利要求50所述的方法,其中所述参考多核苷酸包含突变等位基因。
53.根据权利要求52所述的方法,其中所述预期丰度是等位基因频率。
54.根据权利要求53所述的方法,其中等位基因频率的范围为约0.001%至50%。
55.根据权利要求50所述的方法,其中所述多个CFNA标准品的给定CFNA标准品的少于50%的单个基因组多核苷酸具有相同的序列。
56.根据权利要求50所述的方法,其中所述多个CFNA标准品的给定CFNA标准品包含具有相同成员的基因组多核苷酸的子集,并且其中所述子集代表所述CFNA标准品的少于50%。
57.根据权利要求50所述的方法,其中所述多个CFNA标准品的给定CFNA标准品的至少30%的所述基因组多核苷酸具有范围为约100-300个碱基的长度。
58.根据权利要求50所述的方法,其中所述多个CFNA标准品的给定CFNA标准品的至少50%的所述基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。
59.根据权利要求50-58中的任一项所述的方法,其中基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶生成的。
60.根据权利要求50-59中的任一项所述的方法,其中所述多个CFNA标准品的给定CFNA标准品的所述基因组多核苷酸可以以至少50%的效率连接。
61.根据权利要求50-59中的任一项所述的方法,其中所述多个CFNA标准品的给定CFNA标准品的所述基因组多核苷酸在不存在磷酸供体的情况下是可连接的。
62.根据权利要求50-61中的任一项所述的方法,其中所述CFNA测定包括使所述CFNA标准品的所述基因组多核苷酸环化以产生多个环化基因组多核苷酸。
63.根据权利要求62所述的方法,其中通过使所述基因组多核苷酸经历连接反应来实现环化。
64.根据权利要求62或63所述的方法,其中所述基因组多核苷酸以至少50%的效率环化。
65.根据权利要求50-61中的任一项所述的方法,其中所述CFNA测定包括将基因组多核苷酸与衔接子多核苷酸连接以产生多个衔接子标记的基因组多核苷酸。
66.根据权利要求65所述的方法,其中通过使基因组多核苷酸经历连接反应来实现所述基因组多核苷酸与衔接子多核苷酸的连接。
67.根据权利要求66所述的方法,其中所述基因组多核苷酸以至少50%的效率与衔接子多核苷酸连接。
68.根据权利要求66所述的方法,其中所述基因组多核苷酸在A-加尾后以至少50%的连接效率与衔接子多核苷酸连接。
69.根据权利要求50所述的方法,其中所述多个CFNA标准品的给定CFNA标准品包含单链基因组多核苷酸。
70.根据权利要求50所述的方法,其中所述多个CFNA标准品的给定CFNA标准品包含双链基因组多核苷酸。
71.根据权利要求50所述的方法,其中所述CFNA测定包括下一代测序(NGS)、数字聚合酶链反应(dPCR)、小液滴数字聚合酶链反应(ddPCR)和/或定量聚合酶链反应(qPCR)。
72.一种评估用于检测以给定预期丰度存在于CFNA标准品中的参考多核苷酸的无细胞核酸(CFNA)测定的灵敏度的方法,所述方法包括:
(a)用包含多个参考多核苷酸的CFNA标准品进行CFNA测定,以获得所述多个参考多核苷酸中的每个参考多核苷酸的阳性或阴性检测判定,其中每个参考多核苷酸以给定预期丰度存在于所述CFNA标准品中,其中所述CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,并且其中:
(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且
(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及
(b)确定产生阳性检测判定的参考多核苷酸的分数,从而评估用于检测以给定预期丰度存在于所述CFNA标准品中的参考多核苷酸的所述CFNA测定的灵敏度。
73.一种用于评估无细胞核酸(CFNA)测定的特异性的方法,其包括:
(a)用CFNA标准品进行CFNA测定以获得多个参考多核苷酸中的每个参考多核苷酸的阳性或阴性检测判定,其中每个参考多核苷酸在所述CFNA标准品中不存在,并且其中:
(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且
(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及
(b)确定产生阴性检测判定的参考多核苷酸的分数,从而评估所述CFNA测定的特异性。
74.根据权利要求72或73所述的方法,其中所述CFNA标准品的少于50%的单个基因组多核苷酸具有相同的序列。
75.根据权利要求72或73所述的方法,其中所述CFNA标准品包含具有相同成员的基因组多核苷酸的子集,并且其中所述子集代表所述CFNA标准品的少于50%。
76.根据权利要求72或73所述的方法,其中至少30%的所述基因组多核苷酸具有范围为约100-300个碱基的长度。
77.根据权利要求72或73所述的方法,其中至少50%的所述基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。
78.根据权利要求72-77中的任一项所述的方法,其中基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶生成的。
79.根据权利要求72-78中的任一项所述的方法,其中所述CFNA标准品的所述基因组多核苷酸可以以至少50%的效率连接。
80.根据权利要求72-78中的任一项所述的方法,其中所述CFNA标准品的所述基因组多核苷酸在不存在磷酸供体的情况下是可连接的。
81.根据权利要求72所述的方法,其中所述给定预期丰度小于20%。
82.根据权利要求72或73所述的方法,其中所述CFNA标准品的每个参考多核苷酸包含突变等位基因。
83.根据权利要求82所述的方法,其中每个突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。
84.根据权利要求72或73所述的方法,其中所述多个参考多核苷酸包含至少两个参考多核苷酸。
85.根据权利要求72-84中的任一项所述的方法,其中所述CFNA测定包括使所述CFNA标准品的所述基因组多核苷酸环化以产生多个环化基因组多核苷酸。
86.根据权利要求85所述的方法,其中通过使所述基因组多核苷酸经历连接反应来实现环化。
87.根据权利要求85所述的方法,其中所述基因组多核苷酸以至少50%的效率环化。
88.根据权利要求72-84中的任一项所述的方法,其中所述CFNA测定包括将基因组多核苷酸与衔接子多核苷酸连接以产生多个衔接子标记的基因组多核苷酸。
89.根据权利要求88所述的方法,其中通过使基因组多核苷酸经历连接反应来实现所述基因组多核苷酸与衔接子多核苷酸的连接。
90.根据权利要求89所述的方法,其中所述基因组多核苷酸以至少50%的效率与衔接子多核苷酸连接。
91.根据权利要求89所述的方法,其中所述基因组多核苷酸在A-加尾后以至少50%的连接效率与衔接子多核苷酸连接。
92.根据权利要求72或73所述的方法,其中所述CFNA标准品包含单链基因组多核苷酸。
93.根据权利要求72或73所述的方法,其中所述CFNA标准品包含双链基因组多核苷酸。
94.根据权利要求72或73所述的方法,其中所述CFNA测定包括下一代测序(NGS)、数字聚合酶链反应(dPCR)、小液滴数字聚合酶链反应(ddPCR)和/或定量聚合酶链反应(qPCR)。
95.一种建立无细胞核酸(CFNA)测定的方法,其包括:
(a)在多个测定条件下用CFNA标准品进行CFNA测定以产生一组性能指标,其中当在参考CFNA测定中使用时,所述CFNA标准品与一组参考性能指标相关联,其中所述CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:
(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且
(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及
(b)调整一个或多个测定条件以相对于至少一个参考性能指标改善至少一个性能指标,从而建立所述CFNA测定。
96.根据权利要求95所述的方法,其中至少一个性能指标是检测率(观测丰度/预期丰度)或检测极限。
97.根据权利要求95所述的方法,其中所述测定包括连接反应。
98.根据权利要求97所述的方法,其中测定条件是连接时间或连接温度。
99.根据权利要求95所述的方法,其中所述测定包括扩增反应。
100.根据权利要求99所述的方法,其中测定条件是扩增温度、扩增步骤的长度或扩增循环的数目。
101.根据权利要求95所述的方法,其中所述标准品包含至少一种参考核酸。
102.根据权利要求101所述的方法,其中所述至少一种参考核酸以小于20%的预期丰度存在于所述CFNA标准品中。
103.根据权利要求101所述的方法,其中所述至少一种参考核酸包含突变等位基因。
104.根据权利要求103所述的方法,其中所述突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。
105.一种用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中的靶核酸丰度的系统,其包括:
定量系统,其被配置用于确定所述CFNA样品中的所述靶核酸的拷贝数,以产生所述靶核酸的观测丰度;
计算机,其被配置用于
(a)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的所述参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:
(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且
(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及
(b)通过使用所述校准方案调整所述靶核酸的观测丰度来估算所述CFNA样品中的所述靶核酸的丰度。
106.根据权利要求105所述的系统,进一步包括向接收者发送报告的报告生成器,其中所述报告包含以下至少一种:所述靶核酸的观测丰度、所述靶核酸的估算丰度、所述参考核酸的观测丰度、所述参考核酸的预期丰度和校准方案。
107.一种包含代码的计算机可读介质,所述代码在由一个或多个处理器执行时实现用于估算包含靶核酸和非靶核酸的无细胞核酸(CFNA)样品中的靶核酸丰度的方法,所述方法包括:
(a)响应于用户请求,进行定量反应以确定所述CFNA样品中所述靶核酸的拷贝数,并产生所述靶核酸的观测丰度;
(b)通过将CFNA标准品中存在的参考核酸的观测丰度与该CFNA标准品中存在的所述参考核酸的预期丰度相关联来生成校准方案,该CFNA标准品包含多个基因组多核苷酸,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:
(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且
(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及
(c)通过使用所述校准方案调整所述靶核酸的观测丰度来估算所述CFNA样品中的所述靶核酸的丰度。
108.根据权利要求107所述的计算机可读介质,其中所述方法进一步包括(d)生成包含以下至少一种的报告:所述靶核酸的观测丰度、所述靶核酸的估算丰度、所述参考核酸的观测丰度、所述参考核酸的预期丰度和校准方案。
109.一种试剂盒,其包含:
(a)包含多个基因组多核苷酸的无细胞核酸(CFNA)标准品,所述多个基因组多核苷酸中的单个成员具有5’末端和3’末端,其中:
(i)所述CFNA标准品的所述多个基因组多核苷酸的至少一个子集具有范围为约100-300个碱基的长度;并且
(ii)所述CFNA标准品的大多数所述基因组多核苷酸在5’末端处具有磷酸基团并且在3’末端处具有羟基,所述大多数基因组多核苷酸是可连接的而无需在5’末端处生成磷酸基团和/或在3’末端处生成羟基;以及
(b)关于在CFNA分析中使用所述CFNA标准品的用户说明书。
110.根据权利要求109所述的试剂盒,其中所述CFNA标准品的少于50%的单个基因组多核苷酸具有相同的序列。
111.根据权利要求109所述的试剂盒,其中所述CFNA标准品包含具有相同成员的基因组多核苷酸的子集,并且其中所述子集代表所述CFNA标准品的少于50%。
112.根据权利要求109所述的方法,其中至少30%的所述基因组多核苷酸具有范围为约100-300个碱基的长度。
113.根据权利要求109所述的方法,其中至少50%的所述基因组多核苷酸在5’末端处包含磷酸基团且在3’末端处包含羟基。
114.根据权利要求109-113中的任一项所述的试剂盒,其中基因组多核苷酸的5’末端处的磷酸基团和3’末端处的羟基不是由多核苷酸激酶生成的。
115.根据权利要求109-114中的任一项所述的试剂盒,其中所述CFNA标准品的所述基因组多核苷酸可以以至少50%的效率连接。
116.根据权利要求109-114中的任一项所述的试剂盒,其中所述CFNA标准品的所述基因组多核苷酸在不存在磷酸供体的情况下是可连接的。
117.根据权利要求109所述的试剂盒,其中所述CFNA标准品包含参考核酸。
118.根据权利要求117所述的试剂盒,其中所述参考核酸以小于20%的预期丰度存在于所述CFNA标准品中。
119.根据权利要求117所述的试剂盒,其中所述参考核酸包含突变等位基因。
120.根据权利要求119所述的试剂盒,其中所述突变等位基因以小于50%的等位基因频率存在于所述CFNA标准品中。
121.根据权利要求109所述的试剂盒,其中所述CFNA标准品包含多种参考核酸。
122.根据权利要求121所述的试剂盒,其中所述多种参考核酸中的每种参考核酸包含突变等位基因。
123.根据权利要求122所述的试剂盒,其中所述每个突变等位基因以小于50%的等位基因频率存在。
124.根据权利要求109所述的方法,其中所述CFNA标准品包含单链基因组多核苷酸。
125.根据权利要求109所述的方法,其中所述CFNA标准品包含双链基因组多核苷酸。
126.根据权利要求109-125中任一项所述的试剂盒,其进一步包含连接酶。
127.根据权利要求126所述的试剂盒,其进一步包括连接反应缓冲液。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662353779P | 2016-06-23 | 2016-06-23 | |
US62/353,779 | 2016-06-23 | ||
PCT/US2017/038844 WO2017223366A1 (en) | 2016-06-23 | 2017-06-22 | Cell-free nucleic acid standards and uses thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109689888A true CN109689888A (zh) | 2019-04-26 |
CN109689888B CN109689888B (zh) | 2022-10-25 |
Family
ID=60783422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780052680.3A Active CN109689888B (zh) | 2016-06-23 | 2017-06-22 | 无细胞核酸标准品及其用途 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20190323073A1 (zh) |
EP (1) | EP3475449B1 (zh) |
CN (1) | CN109689888B (zh) |
WO (1) | WO2017223366A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117987558A (zh) * | 2024-04-07 | 2024-05-07 | 北京求臻医疗器械有限公司 | 人met基因14号外显子跳跃突变核酸标准物质及应用 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11859246B2 (en) | 2013-12-11 | 2024-01-02 | Accuragen Holdings Limited | Methods and compositions for enrichment of amplification products |
US11286519B2 (en) | 2013-12-11 | 2022-03-29 | Accuragen Holdings Limited | Methods and compositions for enrichment of amplification products |
KR20240025725A (ko) | 2013-12-11 | 2024-02-27 | 아큐라젠 홀딩스 리미티드 | 희귀 서열 변이를 검출하기 위한 조성물 및 방법 |
CN114807323A (zh) | 2015-10-09 | 2022-07-29 | 安可济控股有限公司 | 用于富集扩增产物的方法及组合物 |
EP3458586B1 (en) | 2016-05-16 | 2022-12-28 | Accuragen Holdings Limited | Method of improved sequencing by strand identification |
SG11201901296TA (en) | 2016-08-15 | 2019-03-28 | Accuragen Holdings Ltd | Compositions and methods for detecting rare sequence variants |
US11203782B2 (en) | 2018-03-29 | 2021-12-21 | Accuragen Holdings Limited | Compositions and methods comprising asymmetric barcoding |
KR20230045097A (ko) * | 2020-08-19 | 2023-04-04 | 아큐라젠 홀딩스 리미티드 | 선택적 무세포 핵산 분석을 위한 방법 |
WO2022103750A1 (en) * | 2020-11-11 | 2022-05-19 | Accuragen Holdings Limited | Methods and systems for sample normalization |
CA3218561A1 (en) | 2021-05-19 | 2022-11-24 | Seqstant Gmbh | Method for parallel real-time sequence analysis |
WO2024055320A1 (zh) * | 2022-09-16 | 2024-03-21 | 中国疾病预防控制中心传染病预防控制所 | 一种基因测序方法、装置、设备和介质 |
CN118028444A (zh) * | 2022-09-16 | 2024-05-14 | 中国疾病预防控制中心传染病预防控制所 | 一种基因测序方法、装置、设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130224740A1 (en) * | 2010-09-03 | 2013-08-29 | Centre National De La Recherche Scientifique(Cnrs) | Analytical methods for cell free nucleic acids and applications |
WO2014014498A1 (en) * | 2012-07-20 | 2014-01-23 | Verinata Health, Inc. | Detecting and classifying copy number variation in a fetal genome |
CN105408496A (zh) * | 2013-03-15 | 2016-03-16 | 夸登特健康公司 | 检测稀有突变和拷贝数变异的系统和方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20240025725A (ko) * | 2013-12-11 | 2024-02-27 | 아큐라젠 홀딩스 리미티드 | 희귀 서열 변이를 검출하기 위한 조성물 및 방법 |
-
2017
- 2017-06-22 EP EP17816242.6A patent/EP3475449B1/en active Active
- 2017-06-22 WO PCT/US2017/038844 patent/WO2017223366A1/en unknown
- 2017-06-22 CN CN201780052680.3A patent/CN109689888B/zh active Active
- 2017-06-22 US US16/311,339 patent/US20190323073A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130224740A1 (en) * | 2010-09-03 | 2013-08-29 | Centre National De La Recherche Scientifique(Cnrs) | Analytical methods for cell free nucleic acids and applications |
WO2014014498A1 (en) * | 2012-07-20 | 2014-01-23 | Verinata Health, Inc. | Detecting and classifying copy number variation in a fetal genome |
CN105408496A (zh) * | 2013-03-15 | 2016-03-16 | 夸登特健康公司 | 检测稀有突变和拷贝数变异的系统和方法 |
Non-Patent Citations (2)
Title |
---|
DEVONSHIRE ALISON S.等: "Towards standardisation of cell-free DNA measurementin plasma: controls for extraction efficiency, fragment size biasand quantification", 《ANALYTICAL AND BIOANALYTICAL CHEMISTRY》 * |
SARAH BREITBACH 等: "Direct Quantification of Cell-Free, Circulating DNA fromUnpurified Plasma", 《PLOS ONE》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117987558A (zh) * | 2024-04-07 | 2024-05-07 | 北京求臻医疗器械有限公司 | 人met基因14号外显子跳跃突变核酸标准物质及应用 |
Also Published As
Publication number | Publication date |
---|---|
CN109689888B (zh) | 2022-10-25 |
EP3475449A1 (en) | 2019-05-01 |
WO2017223366A1 (en) | 2017-12-28 |
EP3475449B1 (en) | 2022-08-17 |
US20190323073A1 (en) | 2019-10-24 |
EP3475449A4 (en) | 2019-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109689888A (zh) | 无细胞核酸标准品及其用途 | |
US11697843B2 (en) | Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing | |
US20210254134A1 (en) | Methods and compositions for forming ligation products | |
US9745614B2 (en) | Reduced representation bisulfite sequencing with diversity adaptors | |
CN108220392A (zh) | 富集和确定靶核苷酸序列的方法 | |
CN117778527A (zh) | 用于识别核酸分子的组合物和方法 | |
US20180363039A1 (en) | Methods and compositions for forming ligation products | |
CN109563541A (zh) | 用于制备无细胞dna/rna定序库的rna差异性标记方法 | |
US20080182239A1 (en) | Methods, Compositions, and Kits for Detection of microRNA | |
JP6739339B2 (ja) | カバーされた配列変換dnaおよび検出方法 | |
US20200010884A1 (en) | Method of improved sequencing by strand identification | |
CN105899680A (zh) | 核酸探针和检测基因组片段的方法 | |
US20240076730A1 (en) | Methods, systems, and compositions for nucelic acid sequencing | |
WO2016181128A1 (en) | Methods, compositions, and kits for preparing sequencing library | |
US11591646B2 (en) | Small RNA detection method based on small RNA primed xenosensor module amplification | |
US20220205032A1 (en) | Compositions and methods comprising asymmetric barcoding | |
CN110869515A (zh) | 用于基因组重排检测的测序方法 | |
WO2021053008A1 (en) | Immune repertoire profiling by primer extension target enrichment | |
CN111433359B (zh) | 制备cDNA文库的方法 | |
GB2621159A (en) | Methods of preparing processed nucleic acid samples and detecting nucleic acids and devices therefor | |
WO2023287876A1 (en) | Efficient duplex sequencing using high fidelity next generation sequencing reads | |
CN114032292A (zh) | 一种绝对定量细胞内dna双链断裂数量的方法及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |