CN112912514A - 核酸的条形编码 - Google Patents

核酸的条形编码 Download PDF

Info

Publication number
CN112912514A
CN112912514A CN201980068108.5A CN201980068108A CN112912514A CN 112912514 A CN112912514 A CN 112912514A CN 201980068108 A CN201980068108 A CN 201980068108A CN 112912514 A CN112912514 A CN 112912514A
Authority
CN
China
Prior art keywords
nucleotide sequence
primer
sequence
nucleic acid
amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980068108.5A
Other languages
English (en)
Inventor
M·贾斯珀
S·梅尔斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Perkin Elmer Health Sciences Australia Pty Ltd
Original Assignee
Perkin Elmer Health Sciences Australia Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2018903923A external-priority patent/AU2018903923A0/en
Application filed by Perkin Elmer Health Sciences Australia Pty Ltd filed Critical Perkin Elmer Health Sciences Australia Pty Ltd
Publication of CN112912514A publication Critical patent/CN112912514A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/15Modifications characterised by incorporating a consensus or conserved sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/543Detection characterised by immobilisation to a surface characterised by the use of two or more capture oligonucleotide primers in concert, e.g. bridge amplification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开涉及用于条形编码核酸的方法、试剂盒和产物。在某些实施方案中,本公开提供了一种产生用于利用固体基质上的克隆扩增来测序的核酸的方法,所述方法包括:(a)提供用于测序的核酸样本;(b)采用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增所述核酸样本,以产生扩增的核酸;以及(c)使用包含(i)所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和包含(ii)所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所述扩增的核酸,其中所述第一接头核苷酸序列或所述第二接头核苷酸序列提供用于随后从附接到固体基质的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板中引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中的一个或更多个包含特异性标识符序列以识别用所述第一引物、所述第二引物和/或所述扩增引物扩增的核酸;从而产生利用在固体基质上的克隆扩增来测序的核酸。

Description

核酸的条形编码
优先权要求
本申请要求2018年10月17日提交的澳大利亚临时专利申请2018903923的权益,其内容通过引用整体并入本文。
技术领域
本公开涉及用于条形编码(barcoding)核酸的方法、试剂盒和产物。
背景技术
DNA测序技术的进步推动了人们对增加从高通量测序平台上单次运行获得的序列数据的数量和类型的需求。多重测序允许合并大量文库并在一次运行期间同时测序,在同时执行用于拷贝数检测的低通测序和靶向特异性基因组区域时是尤其有利的。
已采用“条形码”序列来辅助多重测序。在下一代测序(“NGS”)文库制备期间将单个条形码序添加至样本的每个DNA片段中,以使每个读数(read)可识别为属于此样本并在进行最终数据分析之前分选至样本箱(sample bin)中。合并样本增加了在一次NGS运行中待分析样本的数量,显著降低了测序成本和时间。
已经制定了整个基因组扩增(“WGA”)方案来辅助测序方法,特别是在输入的DNA的量受到限制的情况下。例如,将WGA法用作第一步,为文库制备提供足够的DNA,以便为NGS准备胚胎活检,例如用于非整倍体的植入前基因检测(“PGT-A”)。WGA不仅可用于扩增整个基因组而且还富集用于测序的靶标序列。
与顺序WGA和标准NGS文库制备相比,在WGA期间加入PCR条形编码将提供实验室效率,例如通过减少操作员操作时间和总方案时间,并减少样本制备的试剂要求。
因而,有需要开发允许对用于测序的样本进行扩增和PCR条形编码的新的方法技术。
发明内容
本公开涉及用于条形编码核酸的方法、试剂盒和产物。
本公开的某些实施方案提供了一种利用固体基质(solid substrate)上的克隆扩增来产生用于测序的核酸的方法,所述方法包括:
(a)提供用于测序的核酸样本;
(b)采用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增所述核酸样本,以产生扩增的核酸;以及
(c)使用包含(i)所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和包含(ii)所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所述扩增的核酸,
其中所述第一接头核苷酸序列或所述第二接头核苷酸序列提供用于随后从附接到固体基质的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板中引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中的一个或更多个包含特异性标识符序列以识别用所述第一引物、所述第二引物和/或所述扩增引物扩增的核酸;
从而产生用于利用固体基质上的克隆扩增来测序的核酸。
本公开的某些实施方案提供了一种使用本文描述的方法产生用于测序的核酸的试剂盒。
本公开的某些实施方案提供了通过本文描述的方法产生的用于测序的核酸。
本公开的某些实施方案提供了一种包含本文描述的核酸的固体基质。
本公开的某些实施方案提供了一种对核酸进行测序的方法,所述方法包括通过本文描述的方法产生用于测序的核酸,以及对所述核酸进行测序。
本公开的某些实施方案提供了一种对核酸进行测序的方法,所述方法包括:
(a)提供用于测序的核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增所述核酸,以产生扩增的核酸;以及
(c)使用(i)包含所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和(ii)包含所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所述扩增的核酸,
其中所述第一接头核苷酸序列或所述第一接头核苷酸序列提供用于随后从附接到所述固体基质的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中的一个或更多个包含特异性标识符序列以识别用所述第一引物、所述第二引物和/或所述扩增引物扩增核酸,从而产生进一步扩增的核酸;以及
(d)利用固体基质上的克隆扩增对进一步扩增的核酸测序。
本公开的某些实施方案提供了一种对靶标进行测序的方法,所述方法包括:
(a)提供包含靶标的用于测序的核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物和靶标特异性引物扩增所述核酸样本,以产生扩增的核酸;
(c)使用(i)包含所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物、(ii)包含所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物和(iii)靶标特异性引物进一步扩增所述扩增的核酸,
其中所述第一接头核苷酸序列或所述第二接头核苷酸序列提供用于随后从附接到所述固体基质上的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板随后引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中一个或更多个包含识别特异性标识符序列以用所述第一引物、所述第二引物和/或所述扩增引物扩增的核酸,从而产生进一步扩增的核酸;以及
(d)利用固体基质上的克隆扩增对所述进一步扩增的核酸测序以对所述靶标测序。
本公开的某些实施方案提供了一种扩增核酸的方法,所述方法包括:
(a)提供用于测序的核酸样本;
(b)使用包含简并序列和5’固定的核苷酸序列的引物扩增所述核酸样本,以产生扩增的核酸;以及
(c)使用(i)包含所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和(ii)包含所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所述扩增的核酸,
其中所述第一接头核苷酸序列或所述第二接头核苷酸序列提供用于随后从附接到所述固体基质上的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中一个或更多个包含特异性标识符序列以识别用所述第一引物、所述第二引物和/或所述扩增引物扩增的核酸;
从而扩增所述核酸。
本公开的某些实施方案提供了一种用于使用本文描述的方法扩增核酸的试剂盒。
本公开的某些实施方案提供了通过本文描述的方法产生的扩增的核酸。
本公开的某些实施方案提供了一种对核酸进行测序的方法,所述方法包括通过本文所述的方法扩增核酸以及对所述核酸测序。
本公开的某些实施方案提供了一种分离的核酸,包含以下核苷酸序列中的一个:
5’-CCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:1);
5’-CCATCTCATCCCTGCGTGTCTCCGACTCAGTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO:8);
5’-CACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATCCAGCCTTGC-3’(SEQ ID NO:6);
5’-TCTAACGGACCCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:9);以及
5’-CCGCTTTCCTCTCTATGGGCAGTCGGTGATTCTAACGGACCCAGCCTTGC-3’(SEQ IDNO.10);
或者前述核苷酸序列的反向互补序列,或者具有至少90%序列同一性的前述核苷酸序列中的一个的变体,或者具有至少90%序列同一性的反向互补序列。
本公开的某些实施方案提供了一种扩增包含本文描述的一个或更多个核酸的核酸的方法。
本公开的某些实施方案提供了一种试剂盒,包含本文描述的一个或更多个核酸。
本文描述了其它实施方案。
附图说明
通过以下附图示出了某些实施方案。应理解,以下描述仅用于描述特定实施方案,并不旨在对该描述进行限制。
图1示出了使用用于扩增单细胞和多细胞样本的靶标序列富集(“TSE”)方案制备的WGA DNA样本的凝胶电泳。泳道1-4:使用5-细胞样本的WGA+TSE;泳道5-8:使用单细胞样本的WGA+TSE;泳道9:NTC;泳道10:DNA Ladder(100bp)。
图2示出了WGA DNA样本的凝胶电泳。泳道1、2、3、5、7、8:扩增的单细胞;泳道4:失败的WGA反应;泳道6:不佳的WGA反应;泳道9:NTC;泳道10:DNA Ladder(100bp)。
图3示出了组合的WGA和TSE单细胞产物接种到靶标特异性PCR中后半定量第二轮靶标特异性PCR生成产物的凝胶电泳。与对照组(仅WGA)(黄色圆圈,6-9泳道)相比,由于添加了0.5uM D4S43靶标特异性引物(绿色圆圈,2-5泳道)而实现了靶标D4S43标记物的富集扩增。
图4示出了使用不同的靶标特异性引物浓度的具有TSE的WGA DNA样本的凝胶电泳。泳道1、2:10μM;泳道3、4:5μM;泳道5、6:2.5μM;泳道7:不含TSE引物的对照WGA样本;泳道8:NTC;泳道9:DNA Ladder。
图5示出了根据本公开第一实施方案的具有靶标序列富集的PCR条形编码的第一工作流程的示意图。
图6示出了根据本公开第一实施方案的在具有靶标序列富集的PCR条形编码的第一工作流程中使用的引物。
图7示出了根据本公开第一实施方案的在PCR条形编码的第一工作流程的每个步骤中使用的引物。
图8示出了根据本公开的第一实施方案的在PCR条形编码的第一工作流程中用于靶标序列富集的引物以及期望的PCR产物的示例。
图9示出了根据本公开的第一实施方案的在PCR条形编码的第一工作流程中用于靶标序列富集的引物,以及期望的PCR产物的示例。
图10示出了根据本公开的第一实施方案的通过PCR条形编码制备并随后进行测序以产生图9所示结果的样本的凝胶电泳。
图11示出了半定量血红蛋白亚单位β(“HBB”)特异性PCR的凝胶电泳。使用两种不同的DNA模板,(1)WGA与TSE一起用于HBB以及(2)无TSE的WGA用于HBB。根据本公开的第一实施方案,泳道1,pUC19 DNA标记;泳道2-3,无TSE的对照WGA模板;泳道4-5,具TSE的WGA模板。
图12示出了集成基因组查看器(IGV;Robinson等(2011)《自然生物技术》29,24-26;Thorvaldsdóttir等(2013)《生物信息学简报》14,178-192)以下截图:(A)HBB,仅WGA样本和在WGA期间用TSE富集靶标DNA,或在组合WGA+TSE+HBB多重PCR产物后(1:10稀释),用Illumina测序制剂制备并在Illumina NGS平台上测序,以及(B)HBB,根据本公开的第一实施方案,用于PCR条形编码+TSE的第一个工作流程,在ThermoFisher NGS平台上测序。
图13示出了根据本公开第一实施方案的5-细胞样本的NGS结果,其中(A)在染色体8上存在7Mb缺失和32Mb复制(GM14485;由科里尔医学研究所的NIGMS人类遗传细胞库获得)和(B)染色体13的完整复制(GM02948B;科里尔医学研究所)。
图14示出了根据本公开第二实施方案的在第一轮PCR后存在或不存在合并的情况下的PCR条形编码方法的实施方案的两个备选工作流程的示例。
图15示出了根据本公开第二实施方案的在PCR条形编码的第一工作流程中使用的引物。
图16示出了根据本公开的第二实施方案的在PCR条形编码的第一工作流程的每个步骤中使用的引物以及期望的PCR产物的示例。
图17示出了根据本公开第二实施方案的在用于PCR条形编码方法的实施方案的凝胶电泳后的PCR产物。
图18示出了根据本公开第二实施方案的5-细胞样本的结果,其中(A)在染色体8上存在7Mb缺失和32Mb复制(GM14485;科里尔医学研究所)和(B)染色体21和XXY非整倍体的完整复制(GM04965;科里尔医学研究所)。
图19示出了根据对比例的在PCR条形编码的第一工作流程的每个步骤中使用的引物以及PCR产物的示例。
图20示出了根据对比例的在用于PCR条形编码方法的实施方案的电泳后的PCR产物。
图21示出了根据对比例的5-细胞样本的结果,其中(A)染色体15的完全复制(GM07189;科里尔医学研究所)和(B)染色体21和XXY非整倍体的完全复制(GM04965;科里尔医学研究所)。
图22示出了根据本公开另一个实施方案的在PCR条形编码的第一个工作流程中使用的引物。
图23示出了根据本公开另一实施方案的在用于PCR条形编码法的实施方案的电泳后的PCR产物。
图24示出了根据本公开另一个实施方案的在PCR条形编码的第一个工作流程中使用的引物。
图25示出了根据本公开另一实施方案的在用于PCR条形编码法的实施方案的电泳后的PCR产物。
图26示出了根据本公开的另一个实施方案的具有整倍体雌性(G00318;PerkinElmer Health Sciences(Australia)Pty Ltd(PKHS(a)Pty Ltd))的5-细胞样本的结果。
具体实施方式
本公开涉及用于核酸条形编码的方法、试剂盒和产物。
本公开基于以下认识实现的:有可能利用用于单管扩增的WGA和用于NGS的条形编码的特征。开发的方案具有很多优势,特别是在植入前基因测试中,如用于非整倍体的植入前基因测试(“PGT-A”),用于结构重排的植入前基因测试(“PGT-SR”)和用于单基因疾病的植入前基因测试(“PGT-M”)。例如,在一些实施方案中,可使用所公开的方法、产品和系统来分析来自废胚胎培养基、卵裂球或滋养外胚层胚胎活检样本或囊胚液样本(单/多细胞或低模板DNA)的皮克数量的DNA以进行植入前基因测试。
本公开的某些实施方案具有一个或多个优点。例如,与使用WGA然后再进行DNA片段化、末端修复和接头连接的顺序NGS文库制备流程相比,某些实施方案的一些优点包括多个实验室效率。该效率包括但不限于减少操作员的操作时间和总方案时间、减少样本制备的试剂要求、降低工作流程步骤、减少样本交叉污染的风险和减少操作员错误中的一个或更多个。
本公开某些实施方案提供了一种产生用于测序的核酸的方法。
在某些实施方案中,本公开提供了一种产生用于利用固体基质上的克隆扩增来测序的核酸的方法,所述方法包括:
(a)提供用于测序的核酸样本;
(b)采用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增核酸样本,以产生扩增的核酸;以及
(c)使用包含(i)5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和包含(ii)5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增该扩增的核酸,
其中第一接头核苷酸序列或第二接头核苷酸序列提供用于随后从附接到固体基质的核苷酸序列引发(priming)DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,并且其中第一引物、第二引物和扩增引物中的一个或更多个包含特异性标识符序列以识别用第一引物、第二引物和/或扩增引物扩增的核酸;
从而产生用于利用固体基质上的克隆扩增来测序的核酸。
本文所使用的术语“核酸”是指多核苷酸或寡核苷酸并包括例如DNA、RNA、DNA/RNA、变体或DNA和/或RNA(例如,磷酸糖骨架的变体和/或一个或更多个碱基的变体,如甲基化),可以是单链、双链、非甲基化、甲基化或其其他形式。在某些实施方案中,核酸是非天然存在的核酸、天然存在的核酸、基因组来源的核酸、线粒体核酸、cDNA来源的核酸(衍生自mRNA)、衍生自病毒的核酸、合成来源的核酸、单链DNA、双链DNA、DNA和/或RNA的类似物,和/或前述中任意一者的衍生物、片段和/或组合。可以考虑其他类型的核酸。
还应理解,术语“核酸”包括单个核酸分子或多个核酸分子,并且对于本文所述的任意特定引用的序列,该术语应理解为包括此序列的反向互补序列或与所引用序列或反向互补序列有至少90%序列同一性的序列。
用于测序的核酸包括DNA、RNA或DNA/RNA杂交体。
DNA的示例包括基因组DNA、细胞DNA、线粒体DNA和病毒DNA。DNA可以例如从原核或真核细胞DNA、病毒DNA、体细胞DNA、生殖细胞DNA、配子DNA、极体DNA、胚胎细胞DNA、胎儿DNA、外显子DNA、内含子DNA、非编码DNA、RNA编码DNA、非重复DNA、重复DNA、转座DNA、染色体外DNA、细胞器DNA、叶绿体DNA、病毒DNA、质粒DNA、核DNA,外显子DNA、核外DNA、细胞质DNA、cDNA、无细胞DNA或合成DNA中分离、加工或提取。
在某些实施方案中,用于测序的核酸包括基因组DNA、线粒体DNA、细胞DNA、叶绿体DNA、外体DNA、位点特异性DNA(例如,基因或其部分、一个或更多个外显子、一个或更多个内含子、启动子、增强子、未翻译区、转录区)、无细胞DNA、cDNA、染色体外元件、细菌DNA、病毒DNA、载体、质粒,非天然存在的DNA、RNA、细胞RNA、rRNA、转录的RNA、mRNA、病毒RNA、miRNA、无细胞RNA或非天然存在的RNA。可以考虑其他类型的用于测序的核酸。
在某些实施方案中,用于测序的核酸包括来自单个细胞、多个细胞、细胞群、活组织检查、液体活组织检查、生物样本、培养基、胚胎细胞、癌细胞、用于基因检测的细胞或无细胞DNA的DNA或RNA。可以考虑其他细胞来源的DNA或RNA。
用于引发DNA合成的核苷酸序列是指用于引发特定模板的DNA合成的核苷酸序列,或者用于引发特定模板的DNA合成的核苷酸序列的互补序列。
利用固体基质上的克隆扩增进行测序的方法在本领域是已知的。这些是为了增加任何特定DNA测序的DNA序列的数量而对附接到固体基质上的DNA序列进行扩增从而增加测序信号的方法。虽然考虑了其它类型的固体基质,但是诸如珠和流动池等固体基质在本领域是已知的。
在某些实施方案中,利用克隆扩增进行的测序包括诸如以下商业上可提供的方法:Illumina(边合成边测序技术,TruSeq合成长读技术)或ThermFisher(离子激流技术,离子质子技术(Ion Proton technology))。可以考虑其他测序方法。
例如,Illumina NGS包括以下步骤:
(i)文库制备——随机或靶向片段化DNA或cDNA样本,然后进行5’和3’接头连接,从而制备得到测序文库。有时,还会再对接头连接的片段进行PCR扩增。
(ii)簇生成——对于簇生成,将文库加载到流动池中,这里片段被捕获在与文库接头互补的表面的结合寡核苷酸坪(lawn)上。然后通过桥式扩增将每个片段扩增为独特的克隆簇。当簇生成完成时,即可对模板进行测序。
(iii)测序——该技术使用基于专有的可逆终止子的方法,该方法可检测到单个碱基,当它们整合到了DNA模板链时。由于在每个测序循环中都存在四种可逆终止子结合的dNTPs,所以与其他技术相比,自然竞争可以最大限度地减少掺入偏差并降低原始错误率。其结果是高度准确的碱基测序。
(iv)数据分析——在数据分析和比对期间,将新识别的序列读数与参考基因组比对。比对后,可进行多种变型的分析,如单核苷酸多态性(SNP)、单核苷酸变异(SNV)、拷贝数变异(CNV)或插入缺失(indel)鉴定、用于DNA方法的读取计数、用于RNA方法的读取计数、系统发育或宏基因组分析。
核酸样本的示例包括来自单个细胞、多个细胞、细胞群、活组织检查、液体活组织检查、生物样本、培养基、胚胎细胞、癌细胞、用于基因检测的细胞或无细胞DNA的核酸。
在某些实施方案中,用于测序的核酸样本是已处理的核酸。例如,可通过裂解获得来自感兴趣细胞的核酸以产生用于测序的核酸。
术语“扩增(amplifying)”或变体,如“扩增(amplification)”和“扩增的(amplified)”,是指拷贝核酸以产生所有或部分核酸的进一步拷贝的过程。例如,可使用聚合酶链反应(PCR)、使用诸如适宜的聚合酶进行多重置换扩增的等温方法或者滚环扩增酶促地实现核酸的扩增。可以考虑其他类型的扩增方法。本文描述了进行扩增的方法。
扩增核酸的方法在本领域中是已知的。
在某些实施方案中,扩增包括聚合酶链反应。本文描述了使用聚合酶链反应的方法。例如,Fakruddin等(2013)J Pharm Bioall Sci 5(4):245-252中描述了进行扩增的方法。
在某些实施方案中,扩增包括等温扩增反应。进行扩增的方法在本领域中是已知的,如环介导等温扩增(LAMP)、链置换扩增(SDA)、多重置换扩增(MDA)、线性扩增(例如通过转运插入(LIANTI)、螺旋酶依赖性扩增(HDA)和缺口酶扩增反应(NEAR)。在某些实施方案中,扩增包括使用多重置换扩增的反应。进行多重置换扩增WGA的方法在本领是已知的,如Dean等(2002)Proc Natl.Acad.Sci USA 99:5261中所述。在某些实施方案中,扩增包括使用滚环扩增的反应。可以考虑其他类型的扩增。例如,以下文献中描述了用于扩增的方法:Walker等(1992)Nucleic Acids Res.20:1691-1696、Walker等(1993)PCR MethodsAppl.3:1-6、Notomi等(2000)Nucleic Acids Res.28:e63、Tomita N等(2008)Nat.Protoc.3:877-882、Lizardi等(1998)Nat.Genet.19:225-232、Blanco等(1989)J.Biol.Chem.264:8935-8940和Dean等(2001)Genome Res.11:1095-1099、Chen等(2017)Science 356:189-194、Lage等(2003)Genome Res.13:294-307和Fakruddin等(2013)JPharm Bioall Sci 5(4):245-252。
在某些实施方案中,扩增包括全基因组扩增。
用于产生如本文所述的引物的方法在本领域是已知的,如化学合成。用于产生简并引物或者包括简并核苷酸序列的引物的方法在本领域是已知的。
术语“简并寡核苷酸序列”是指寡核苷酸序列的混合物,其中在某些位置处含有多个可能的碱基,给出了具有相似序列的覆盖全部所有核酸组合的核苷酸群,和/或具有与一个以上碱基结合的能力的一个或更多个碱基的混合物,例如2氨基嘌呤、5-甲基异脱氧胞嘧啶(Me-isodC)、5-硝基吲哚、肌苷脱氧、肌苷核糖或异脱氧鸟苷dG。
在某些实施方案中,扩增引物的简并核苷酸序列是完全简并核苷酸序列。
在某些实施方案中,扩增引物包含3至16个核苷酸的简并核苷酸序列。可考虑其他尺寸。
在某些实施方案中,简并核苷酸序列由6个核苷酸组成。
在某些实施方案中,扩增引物包含在简并核苷酸序列3’的固定的核苷酸序列。可以考虑固定的核苷酸序列与简并寡核苷酸序列的相对位置的其它变体。
在某些实施方案中,在简并核苷酸序列3’的固定的核苷酸序列包括3至10个核苷酸。
在某些实施方案中,在简并核苷酸序列3’的固定的核苷酸序列由6个核苷酸的核苷酸序列组成。
在某些实施方案中,在简并核苷酸序列3’的固定的核苷酸序列由核苷酸序列5’-ATGTGG-3’、5’-ATCTCA-3’或5’-TGAGAT-3组成。
在某些实施方案中,5’固定的核苷酸序列包含在基因组内高频出现的短基序(例如,人基因组中的重复元件)。
在某些实施方案中,5’固定的核苷酸序列包含6到40个核苷酸的核苷酸序列。考虑其他尺寸。
在某些实施方案中,5’固定的核苷酸序列由10个核苷酸的核苷酸序列组成。
在某些实施方案中,5’固定的核苷酸序列由以下核苷酸序列中的一个组成:
5’-CCAGCCTTGC-3’(SEQ ID NO:2);
5’-CCGACTCGAG-3’(SEQ ID NO:23);
5’-GATGCTCGAG-3’(SEQ ID NO:24);
5’-GATGCCTTGC-3’(SEQ ID NO:25);
5’-GCTCTTCCGATCT-3’(SEQ ID NO:26);
5’-GCTCTTCCGATCTACTCGAG-3’(SEQ ID NO:18);
5’-GCTCTTCCGATCTGAG-3’(SEQ ID NO:27);
5’-AGTTCAGACGTGTGCTCTTCCGATCT-3’(SEQ ID NO:28);或
5’-CAGACGTGTGCTCTTCCGATCT-3’(SEQ ID NO:29)
5’-GTCTCCGACTCAG-3’(SEQ ID NO.52)。
在某些实施方案中,核酸样本的扩增包括少于0.5pg、少于1pg、少于2.5pg、少于5pg、少于10pg、少于25pg、少于50pg、少于100pg、少于250pg、少于500pg、少于1ng、少于2.5ng、少于5ng或少于10ng的待扩增DNA量。可以考虑其他量。
在某些实施方案中,核酸样本的扩增包括至少0.5pg、至少1pg、至少2.5pg、至少5pg、至少10pg、至少25pg、至少50pg、至少100pg、至少250pg、至少500pg、至少1ng、至少2.5ng、至少5ng或至少10ng的待扩增DNA量。考虑其他量。
在某些实施方案中,核酸样本的扩增包括0.5pg至10ng、1pg至10ng、2.5pg至10ng、5pg至10ng、10pg至10ng、25pg至10ng、50pg至10ng、100pg至10ng、250pg至10ng、500pg至10ng、1ng至10ng、2.5ng至10ng、5ng至10ng、0.5pg至5ng、1pg至5ng、2.5pg至5ng、5pg至5ng、10pg至5ng、25pg至5ng、50pg至5ng、100pg至5ng、250pg至5ng、500pg至5ng、1ng至5ng、2.5ng至5ng、0.5pg至2.5ng、1pg至2.5ng、2.5pg至2.5ng、5pg至2.5ng、10pg至2.5ng、25pg至2.5ng、50pg至2.5ng、100pg至2.5ng、250pg至2.5ng、500pg至2.5ng、1ng至2.5ng、0.5pg至1ng、1pg至1ng、2.5pg至1ng、5pg至1ng、10pg至1ng、25pg至1ng、50pg至1ng、100pg至1ng、250pg至1ng、500pg至1ng、0.5pg至500pg、1pg至500pg、2.5pg至500pg、5pg至500pg、10pg至500pg、25pg至500pg、50pg至500pg、100pg至500pg、250pg至500pg、0.5pg至250pg、1pg至250pg、2.5pg至250pg、5pg至250pg、10pg至250pg、25pg至250pg、50pg至250pg、100pg至250pg、0.5pg至100pg、1pg至100pg、2.5pg至100pg、5pg至100pg、10pg至100pg、25pg至100pg、50pg至100pg、0.5pg至50pg、1pg至50pg、2.5pg至50pg、5pg至50pg、10pg至50pg、25pg至50pg、0.5pg至25pg、1pg至25pg、2.5pg至25pg、5pg至25pg、10pg至25pg、0.5pg至10pg、1pg至10pg、2.5pg至10pg、5pg至10pg、0.5pg至5ng、1pg至5ng、2.5pg至5pg、0.5pg至2.5pg、1pg至2.5pg或0.5pg至1pg的待扩增DNA量。可以考虑其他量。
在某些实施方案中,核酸样本包含来自1到50个细胞的DNA。在某些实施方案中,基因组DNA包含来自单个细胞、1到10个细胞、1到20个细胞、1到50个细胞、多于10个细胞、少于10个细胞、多于50个细胞、少于50个细胞、多于100个细胞或少于100个细胞的DNA。可以考虑来自其他细胞数量的DNA。
在某些实施方案中,核酸样本包含来自1至50个细胞的RNA。在某些实施方案中,基因组RNA包含来自单个细胞、1至10个细胞、1至20个细胞、1至50个细胞、多于10个细胞、少于10个细胞、多于50个细胞、少于50个细胞、多于100个细胞或少于100个细胞的RNA。可以考虑来自其他细胞数量的RNA。
细胞类型的示例包括一种或更多种胚胎细胞、卵母细胞或其极体、精子、一种或更多种生殖细胞、一种或更多种体细胞、一种或更多种人细胞、一种或更多种动物细胞、一种或更多种植物细胞、一种或更多种微生物细胞、一种或更多种用于筛选疾病、状况或状态的细胞,一种或更多种癌细胞或癌前细胞、一种或更多种病毒粒子、一种或更多种外显体、活检细胞、一个或更多个胎儿细胞、组织样本细胞、体液中或来自体液的细胞、血样中或来自血样的细胞、羊水中或来自羊水的细胞、培养基中或来自培养基的细胞、尿液中或来自尿液的细胞、血浆中或来自血浆的细胞、血清中或来自血清的细胞,刮腮中或来自刮腮的细胞、毛囊细胞、唾液中或来自唾液的细胞、汗液中或来自汗液的细胞、乳头吸液中或来自乳头吸液的细胞、福尔马林固定样本中或来自福尔马林固定样本的细胞、石蜡包埋样本中或来自石蜡包埋样本的细胞、拭子中或来自拭子的细胞。可以考虑其他类型的细胞和细胞源。获得细胞的方法在本领域是已知的。
在某些实施方案中,第一接头核苷酸序列包括核苷酸序列5’-CCGCTTTCCTCTCTATGGGCAGTCGGTGAT-3’(SEQ ID NO:11)。
在某些实施方案中,第一接头核苷酸序列包括核苷酸序列5’-CCTCTCTATGGGCAGTCGGTGAT-3’(SEQ ID NO:47)。
在某些实施方案中,第二接头核苷酸序列包括核苷酸序列5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’(SEQ ID NO:4)。
在某些实施方案中,第一接头核苷酸序列在5’-末端还包括核苷酸序列5’-CCACTACGCCTCCGCTTT-3’(SEQ ID NO:30)的3’末端的任意部分。例如,在5’末端,第一个接头核苷酸序列可以是5’-TCCACTACGCCTCCGCTTT 3(SEQ ID NO:31)、5’-TTCCACTACGCCTCCGCTTT 3’(SEQ ID NO:32)、5’-TTTCCACTACGCCTCCGCTTT 3’(SEQ ID NO:33)、5’-CTTTCCACTACGCCTCCGCTTT 3’(SEQ ID NO:34)、5’-GCTTTCCACTACGCCTCCGCTTT 3’(SEQ ID NO:35)、5’-CGCTTTCCACTACGCCTCCGCTTT 3’(SEQ ID NO:36)或者5’-CCGCTTTCCACTACGCCTCCGCTTT 3’(SEQ ID NO:37)等等。
在某些实施方案中,第一引物包含用于随后从附接到固体基质的核苷酸序列引发DNA合成的第一接头核苷酸序列,第二引物包含用于随后从随后引发形成的模板引发DNA合成的第二接头序列。
在某些实施方案中,第一引物包含与附接到固体基质的核苷酸序列相同的第一接头核苷酸序列。
在某些实施方案中,第一引物包含与附接到固体基质的核苷酸序列互补的第一接头核苷酸序列。
在某些实施方案中,第一引物和第二引物包含与附接到固体基质的核苷酸序列相同或互补的核苷酸序列。
术语“特异性标识符序列”是指允许对核酸序列进行分选以进行数据分析的条形码序列。
在某些实施方案中,第一引物、第二引物和扩增引物包含多个特异性标识符序列。
在某些实施方案中,第一引物、第二引物和扩增引物包含特异性标识符序列。
在某些实施方案中,特异性标识符序列包括6到12个核苷酸的核苷酸序列。
在某些实施方案中,特异性标识符序列由10个核苷酸的核苷酸序列组成。
在某些实施方案中,特异性标识符序列包括核苷酸序列5’-TCTAACGGAC-3(SEQ IDNO:3)。
其他特异性标识符序列的示例为包含以下核苷酸序列的序列:5’-CTAAGGTAAC-3(SEQ ID NO:38);5’-TAAGGAGAAC-3(SEQ ID NO:39);5’-AAGAGGATTC-3(SEQ ID NO:40);5’-TACCAAGATC-3(SEQ ID NO:41);5’-CAGAAGGAAC-3(SEQ ID NO:42);5’-CTGCAAGTTC-3(SEQ ID NO:43);5’-TTCGTGATTC-3(SEQ ID NO:44);5’-TTCCGATAAC-3(SEQ ID NO:45);和5’-TGAGCGGAAC-3(SEQ ID NO:46)。
在某些实施方案中,特异性标识符序列由8个核苷酸的核苷酸序列组成。
在某些实施方案中,特异性标识符序列包含核苷酸序列5’-TCTCTGTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-TGTACGTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-ATCGTCTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-TAGCTCTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-AGTATCTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-TCGAGCTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-TCATACTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-TACGACTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-ACTCACTG-3。在某些实施方案中,特异性标识符序列包含核苷酸序列5’-AGAGTATG-3。
在某些实施方案中,扩增引物包含特异性标识符序列,第一引物包含用于随后引发DNA合成的第一接头序列,所述第二引物包括与附接到固体基质的核苷酸序列相同或互补的核苷酸序列和特异性标识符序列。
在某些实施方案中,第一引物包含用于随后引发DNA合成的第一接头序列和特异性标识符序列,第二引物包含与附接到固体基质的核苷酸序列相同或互补的核苷酸序列。
在某些实施方案中,第一引物包含用于随后引发DNA合成的第一接头序列和与附接到固体基质的核苷酸序列相同或互补的核苷酸序列,第二引物包含与附接到固体基质的另一核苷酸序列相同或互补的核苷酸序列和特异性标识符序列。
在某些实施方案中,第一引物包含用于随后引发DNA合成的第一接头序列、与连接到固体基质的核苷酸序列相同或互补的核苷酸序列和特异性标识符序列,第二引物包含与附接到固体基质的另一核苷酸序列相同或互补的核苷酸序列和特异性识别序列。
在某些实施方案中,该方法还包括用一个或更多个靶标特异性引物扩增核酸。设计靶标特异性引物的方法在本领域是已知的。
在某些实施方案中,该方法还包括用步骤(b)中的一个或更多个靶标特异性引物进行扩增和/或用步骤(c)中的一个或更多个靶标特异性引物进行进一步扩增。
在某些实施方案中,该方法包括对RNA进行测序,RNA通过用逆转录酶聚合转化为DNA以产生用于测序的核酸样本。用逆转录酶将RNA转化为DNA的方法在本领域是已知的。
本公开的某些实施方案提供了用于执行本文所述方法的试剂盒。
本公开的某些实施方案提供了一种试剂盒,用于使用本文所述的方法产生用于测序的核酸。试剂盒可含有本文所述的试剂和/或说明书。
本公开的某些实施方案提供了用于通过本文所述方法产生的用于测序的核酸。
本公开的某些实施方案提供了一种固体基质,其包含如本文所述产生的核酸。
用于将核酸附接到固体基质以进行测序的方法在本领是已知的。
在某些实施方案中,固体基质是流动池。在某些实施方案中,固体基质是芯片。
在某些实施方案中,固体基质是微珠或离子球粒子(ISP)。
本公开的某些实施方案提供了一种对核酸进行测序的方法,该方法包括产生用于对本文所述方法进行测序的核酸以及对核酸进行测序。
测序方法在本领域是已知的并且如本文所述。
在某些实施方案中,用于测序的核酸包含特异性靶标。
在某些实施方案中,本公开提供了一种核酸测序方法,该方法包括:
(a)提供用于测序的核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增核酸样本,以产生扩增的核酸;以及
(c)用(i)包含5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和(ii)包含5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所扩增的核酸,
其中,第一接头核苷酸序列或第二接头核苷酸序列提供用于随后从附接到固体基质的核苷酸序列引发DNA合成的序列,并且其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,其中第一引物、第二引物和扩增引物中的一个或更多个包含特异性标识符序列以识别用第一引物、第二引物和/或扩增引物扩增的核酸,从而产生进一步扩增的核酸;以及
(d)利用固体基质上的克隆扩增对进一步扩增的核酸进行测序。
在某些实施方案中,本公开提供了一种对靶标进行测序的方法,该方法包括:
(a)用于测序的靶标的用于测序的核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物和靶标特异性引物扩增核酸样本,产生扩增的核酸;
(c)使用(i)包含5’固定的核苷酸序列和第一接头核苷酸序列的第一引物,(ii)包含5’固定的核苷酸序列和第二接头核苷酸序列的第二引物和(iii)靶标特异性引物进一步扩增所扩增的核酸,
其中,第一接头核苷酸序列或第二接头核苷酸序列提供用于随后从附接到固体基质的核苷酸序列引发DNA合成的序列,并且其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,其中第一引物、第二引物和扩增引物中的一个或更多个包含特异性标识符序列以识别用第一引物、第二引物和/或扩增引物扩增的核酸,从而产生进一步扩增的核酸;以及
(d)利用固体基质上的克隆扩增对进一步扩增的核酸进行测序以对靶标测序。
本公开的某些实施方案提供了一种使用本文所述方法进行测序的试剂盒。
本公开的某些实施方案提供了一种扩增核酸的方法。
在某些实施方案中,本公开提供了一种扩增核酸的方法,该方法包括:
(a)提供核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的引物扩增核酸样本,产生扩增的核酸;以及
(c)使用(i)包含5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和(ii)包含5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所扩增的核酸,
其中,第一接头核苷酸序列或第二接头核苷酸序列提供用于随后从附接到固体基质的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板随后引发DNA合成的序列,并且其中第一引物、第二引物和扩增引物中的一个或更多个包含特异性标识符序列以识别用第一引物、第二引物和/或扩增引物扩增的核酸;
从而扩增核酸。
用于评估核酸扩增的方法在本领域是已知的。
本公开的某些实施方案提供了一种用于使用本文所述的方法扩增核酸的试剂盒。
试剂盒可包含一种或更多种试剂和/或说明书,如本文所述。
本公开的某些实施方案提供了通过本文所述方法产生的扩增的核酸。
本公开的某些实施方案提供了一种对核酸进行测序的方法,该方法包括通过本文所述的方法扩增核酸以及对核酸进行测序。
本公开的某些实施方案提供了一种产生用于利用不需要克隆扩增的方法测序的核酸的方法。
在某些实施方案中,本公开提供了一种产生用于测序的核酸的方法,该方法包括:
(a)提供用于测序的核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增核酸样本,产生扩增的核酸;和
(c)使用(i)包含5’固定的核苷酸序列和第一接头核苷酸序列的第一引物以及(ii)包含5’固定的核苷酸序列和第二接头核苷酸序列的第二引物扩增所扩增的核酸,
其中,第一接头核苷酸序列和/或第二接头核苷酸序列提供用于随后引发DNA合成的序列,并且其中第一引物、第二引物和扩增引物中的一个或更多个包含特异性标识符序列以识别用第一引物、第二引物和/或扩增引物扩增的核酸;
从而产生用于测序的核酸。
本实施方案中使用的方法和引物如本文所述。
在某些实施方案中,测序方法包括诸如由PacBio(SMRT测序技术)或OxfordNanopore Technologies(纳米孔测序技术)在商业上提供的那些方法。
在某些实施方案中,测序方法包括利用固体基质上的克隆扩增的方法。利用固体基质上的克隆扩增来进行测序的方法如本文所述,并且包括例如由Illumina(边合成边测序技术、TruSeq合成长读取技术)或ThermoFisher(离子激流技术、离子质子技术)在商业上提供的那些方法。
在某些实施方案中,该方法用于对特异性靶标进行测序。
在某些实施方案中,该方法还包括用一个或更多个靶标特异性引物扩增核酸。设计靶标特异性引物的方法在本领域是已知的。
在某些实施方案中,该方法还包括在步骤(b)中用一个或更多个靶标特异性引物进行扩增和/或用一个或更多个靶标特异性引物上述步骤(a)中进行进一步扩增。
在某些实施方案中,本公开提供了一种核酸测序方法,该方法包括:
(a)提供用于测序的核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增核酸样本,产生扩增的核酸;和
(c)使用(i)包含5’固定的核苷酸序列和第一接头核苷酸序列的第一引物以及(ii)包含5’固定的核苷酸序列和第二接头核苷酸序列的第二引物扩增所扩增的核酸,
其中,第一接头核苷酸序列和/或第二接头核苷酸序列提供用于随后引发DNA合成的序列,并且其中第一引物、第二引物和扩增引物中的一个或更多个包含特异性标识符序列以识别用第一引物、第二引物和/或扩增引物扩增的核酸,从而产生进一步扩增的核酸;以及
(d)对进一步扩增的核酸进行测序。
本公开的某些实施方案提供分离的核酸。
术语“分离的”是指从其自然或原始环境中分离(部分或全部地)的种类,例如核酸,并且包括其他分子复杂混合物中的核酸、基本上纯化的核酸混合物中的核酸、基本上纯化的核酸或者合成的核酸。
在某些实施方案中,分离的核酸包含以下核苷酸序列之一:
5’-CCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:1);
5’-CCATCTCATCCCTGCGTGTCTCCGACTCAGTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO:8);
5’-CACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATCCAGCCTTGC-3’(SEQ ID NO:6);
5’-TCTAACGGACCCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:9);和
5’-CCGCTTTCCTCTCTATGGGCAGTCGGTGATTCTAACGGACCCAGCCTTGC-3’(SEQ IDNO.10);
5’-CCTCTCTATGGGCAGTCGGTGAT-3’(SEQ ID NO.47);
或上述序列的反向互补序列,或具有至少90%序列同一性的核苷酸序列中的一个的变体,或具有至少90%序列同一性的反向互补序列。
在某些实施方案中,本公开提供了一种分离的核酸序列,其包含如本文所述的一个或更多个核酸,或其反向互补序列,或具有至少90%序列同一性的核酸变体或具有至少90%序列同一性的反向互补序列。
在某些实施方案中,本公开提供一种分离的核酸,其包含根据SEQ ID NO:1至47中任一者的核苷酸序列,或前述序列的反向互补序列,或具有至少90%序列同一性的核苷酸序列中的一个的变体,或具有至少90%序列同一性的反向互补序列。
产生核酸的方法在本领是已知的。用于评估核酸之间的序列同一性的方法在本领域是已知的。
在某些实施方案中,分离的核酸由以下序列之一组成:
5’-CCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:1);
5’-CCATCTCATCCCTGCGTGTCTCCGACTCAGTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO:8);
5’-CACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATCCAGCCTTGC-3’(SEQ ID NO:6);
5’-TCTAACGGACCCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:9);和
5’-CCGCTTTCCTCTCTATGGGCAGTCGGTGATTCTAACGGACCCAGCCTTGC-3’(SEQ IDNO.10);
或上述序列的反向互补序列,或具有至少90%序列同一性的核苷酸序列中的一个的变体,或具有至少90%序列同一性的反向互补序列。
本公开的某些实施方案提供了一种扩增核酸的方法,包括使用本文所述的一个或更多个核酸。
本公开的某些实施方案提供了一种包含一个或更多个核酸的试剂盒,如本文所述。
本公开的某些实施方案提供了一种使用本文所述方法的系统。
标准技术和设备可用于重组DNA技术、寡核苷酸合成、分子生物学和酶促反应。上述技术和程序通常可根据本领域已知的方法和/或商业上可获得的方法来执行,并且如Sambrook等人《分子克隆:实验室手册》(第4版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989))和Ausubel等人的现有方案中所述的分子生物学(2003)John Wiley&Sons,两者均通过引用并入本文。
本公开由以下实施例进一步说明。应当理解,以下描述仅用于描述特定实施例,并不旨在限制上述描述。
实施例1–通用方案、试剂盒和产品
使用各种试剂盒、成分和说明书进行DNA条形编码的通用方案如下:
1.试剂盒内容物
扩增用试剂盒可包含以下成分:
·PCR级H2O
·细胞裂解酶
·细胞裂解缓冲液
·WGA聚合酶
·WGA PCR缓冲液
·WGA引物
2.方案的概述
全基因组扩增(WGA)可用于从单个细胞、少量细胞或其DNA等价物中产生总DNA的代表性扩增。WGA可复制地扩增单个细胞的总DNA,产生微克数量的扩增的DNA。该方案可成功地用于细胞、无细胞和纯化的基因组DNA输入。
有可能使用多种不同的WGA引物。WGA引物的示例包括具有允许在特定位置处有可能存在一个以上碱基的其核苷酸序列的一部分,和可与一个或更多个其它碱基形成碱基对的引物。
方案包括以下一般步骤:
(i)样本采集
·将样本置于<2μl转移缓冲液(如PBS、TM)中的PCR管内
·在管上标记样本位置
(ii)裂解
·在样本上方添加3μl裂解溶液
·轻敲PCR管以使裂解溶液在样本上方滚动
·根据裂解程序孵育15分钟
可以理解,在某些情况下,可以省略细胞裂解步骤,从而例如允许在无细胞DNA上使用该方案,或者该方案可通过使用细胞直接进入扩增方案来实现,并且在扩增之前不具有离散裂解步骤。
(iii)全基因组扩增和靶标序列富集(如果需要)。
·向溶解的样本中添加22μl PCR主混合物(master mix)
·使用WGA PCR程序和靶标特异性引物进行PCR
·通过琼脂糖凝胶电泳评估WGA
3.输入规格
(i)细胞数
此处描述的方案适用于单个细胞或其DNA等效物,以及少量细胞(例如<10个细胞)。
(ii)细胞采集方法
流式分选、微流体、稀释和微操作是与方案兼容的收集方法。单个细胞应转移到带有最小转移缓冲液(<2μl)的PCR管中。试管中细胞的位置应使用永久性记号笔在试管外侧用一个点标记,以便于对于裂解步骤能够简单细胞定位。
(iii)DNA稀释
建议在10mM Tris-HCl(pH 8.0)(无EDTA)中将DNA稀释至最终浓度30pg/μl。
(iv)兼容缓冲液
推荐的细胞转移缓冲液包括10mM Tris-HCl(pH 8.0)(不含EDTA)和PBS(不含Mg2+、Ca2+和BSA)。
4.方案:扩增
(i)细胞裂解
在此可选步骤中,通过添加细胞裂解混合物并在PCR热循环仪中短时间温育来裂解细胞并使DNA可溶。
消耗品:
·0.2mL或0.5mL无菌PCR管
·PCR级H2O
·细胞裂解酶
·细胞裂解缓冲液
·细胞或DNA样本
准备:
·从储存品中取出PCR级H2O和细胞裂解缓冲液,并解冻至室温。
·从储存品中取出细胞裂解酶,并于4℃存储在冷块中。
·充分混合试剂,然后短暂离心,收集试管底部的内容物。
·计算细胞裂解混合物所需的试剂体积。
程序:
组合以下试剂,在4℃冷块中制备细胞裂解酶稀释液1:
成分 体积
PCR级H<sub>2</sub>O 6.5μl
细胞裂解酶 1.0μl
总体积 7.5μl
充分混合,然后短暂离心
组合以下试剂,于4℃在冷块中制备细胞裂解混合物,以达到所需的反应次数:
成分 1裂解反应的体积
PCR级H<sub>2</sub>O 2.7μl
细胞裂解酶 0.15μl
细胞裂解酶稀释液1 0.15μl
总体积 3.0μl
裂解单细胞/多细胞样本的步骤:
(a)在PCR管中的细胞样本上方添加3μl细胞裂解混合物。通过轻轻敲击工作台上的试管确保溶解混合物在试管上标记的样本位置上滚动。不混合或涡流。
(b)如果需要在试管底部收集内容物,在微型离心机中短暂旋转。
(c)用其他样本重复上述步骤。
无模板对照(NTC)准备步骤:
(a)向1个标记NTC的无菌PCR管中添加3μl细胞裂解混合物。
(b)向标记NTC的试管中添加1μl PCR级H2O。
WGA PCR前DNA样本制备步骤(如需要):
(a)向所需数量的无菌空PCR管中添加3μl细胞裂解混合物。
(b)向每个含有细胞裂解混合物的试管中添加1μl 30pg/μl DNA样本。继续下一步。
在热循环仪中孵育所有样本和NTC,程序如下:
Figure BDA0003021946230000191
将裂解的样本置于冷块中。
(ii)全基因组扩增和靶标序列富集(如果需要)
在该步骤中,在基于简并寡核苷酸引物(DOP)PCR的WGA之前,创建主混合物并将其添加到裂解样本中。这就产生了来自细胞的总DNA或其DNA等价物的代表性扩增。在低和高严谨PCR循环之间,添加靶标特异性引物和/或连接的标记引物以促进感兴趣区域的靶向扩增。这提供了靶标序列富集。
消耗品:
·1.5mL无菌管
·PCR级H2O
·WGA PCR缓冲液
·WGA引物
·WGA聚合酶
·裂解样本和NTC(来自细胞裂解)
·靶标特异性或连接的标记引物(如果要进行靶标序列富集)。
准备:
·在用户提供的PCR级H2O中将靶标特异性引物或连接的标记引物稀释至所需浓度。
·对于多重靶标特异性引物或连接的标记引物,在单个引物池中以相等体积组合所有引物。
·从存储中取出PCR级H2O、WGA PCR缓冲液和WGA引物,并解冻至室温。
·从存储中取出WGA聚合酶,并于4℃存储在冷块中。
·充分混合试剂,然后短暂离心,收集试管底部的内容物。
·计算WGA主混合物所需的试剂体积。应为所有样本和1个NTC加1-2个额外反应准备足够的WGA主混合物。不将序列特异性引物或连接的标记引物添加到主混合物中。
程序:
·通过在1.5mL无菌试管中按下列顺序混合下列试剂来制备所需反应次数的WGA主混合物:
Figure BDA0003021946230000201
·充分混合,然后在微型离心机中快速旋转。
·将22μl WGA主混合物转移到含有裂解模板(样本或NTC细胞内裂解混合物)的单个试管中。为防止任何DNA从裂解的样本中移除,不要将移液管尖端插入溶解的样本混合物中。不混合或涡流PCR管。在微型离心机中短暂离心或旋转,收集试管底部的内容物。
·(如果基因组DNA扩增需要)将22μl WGA主混合物转移到在细胞裂解混合物中含有DNA模板的单个试管中。为防止任何DNA从样本中移除,不要将移液管尖端插入到裂解的样本混合物中。充分混合,然后短暂离心,收集管底部的内容物。
·在热循环仪中培养所有样本和NTC,程序如下:
Figure BDA0003021946230000202
Figure BDA0003021946230000211
·在PCR程序的保持(HOLD)步骤中,将2.8μl靶标特异性引物池转移到每个在WGAPCR混合物中含有DNA模板的试管中,包括NTC。为防止任何样本DNA被移除,不要将移液管尖端插入样本混合物中。取而代之的是,用移液管将引物移到PCR管的侧面,刚好高于样本主混合物水平。
·短暂离心,收集管底部的内容物。
·重新以TSE PCR程序开始WGA。
·PCR完成后,将DNA短期储存在4℃或长期储存在-20℃,或直接进行步骤4.6WGA质量控制。
(iii)WGA质量控制
为了确认DNA样本的扩增和检查NTC中的污染,运行琼脂糖凝胶。
消耗品:
·凝胶加载缓冲液
·DNA Ladder 100-3000+bp(Geneworks DMW-100M)
·琼脂糖
·0.5x TBE
·WGA产物
·Gel Red(Biotium 41003)
准备:
·通过将1g琼脂糖、100mL 0.5x TBE和5μLGel Red混合形成并倒出1%琼脂糖凝胶。调整体积以适应电泳系统的大小。
程序:
1.将在凝胶加载缓冲液中的2μl PCR产物施加到凝胶中。
2.加载DNA Ladder。
3.在100伏电压下电泳约30分钟。
确定WGA DNA质量的步骤
a.WGA扩增产物应呈现拖尾,大小约为200bp-2000bp。NTC应看起来干净,并存在引物二聚体(见图1)。
b.与标准
Figure BDA0003021946230000221
试剂盒WGA样本相比,TSE扩增的样本的PCR产率通常略低。这是因为靶标特异性引物对WGA有小的抑制作用。
c.存在引物二聚体但没有较大扩增产物的证据表明WGA扩增失败(见图2,泳道4)。可能的原因是样本没有成功转移到PCR管中,或者样本位于PCR管中裂解和PCR试剂的上方。应丢弃失败的样本。
d.低密度拖尾或PCR产物明显大于或小于在同一琼脂糖凝胶上观察到的其他样本的预期大小范围表明WGA扩增不良(见图2,泳道6)。建议丢弃这些样本,但如果不可能,则应谨慎解释这些样本的结果,因为由于模板扩增较差,它们更有可能提供假阳性结果。
确任富集感兴趣靶标区域的步骤
根据WGA-TSE样本的终点分析,如果使用基因特异性PCR和PCR产物的电泳分析(sizing),则可需要将WGA-TSE DNA样本稀释至低于PCR典型推荐输入浓度的浓度。由于在WGA中富集靶标序列,使用标准推荐的DNA浓度会导致额外的弱扩增PCR产物的出现,这些弱扩增PCR产物可能是由不完整的DNA片段产生的。为了减少这些部分PCR产物的电泳显带,调整(titrate)WGA TSE样本浓度以进行终点分析。通常应在模板标准浓度的1:20-1:10范围内进行。
a.与仅作为PCR模板的WGA相比,使用WGA+TSE的半定量靶标特异性PCR(其中使用少量PCR循环,以便在凝胶上刚好可见靶带)来确认序列富集(参见图3,泳道2-5与6-9)。不要将PCR运行到稳定阶段。也可以使用替代方法;例如,可以使用针对靶标区域的巢式PCR来确认已发生靶标序列富集。
b.WGA+TSE-DNA及其作为模板产生的序列特异性PCR产物与一系列方法兼容,包括下一代测序(NGS)、PCR、电泳和Sanger测序。
c.为了增加用于NGS分析的富集序列的覆盖深度,序列特异性PCR产物可以与WGA+TSE-DNA合并并作为单个样本进行条形编码。序列特异性PCR产物可以使用DNA在1:20到1:1的范围内稀释,这取决于NGS分析所需的覆盖深度。然后可以按照标准PG SeqTM试剂盒方案或类似方案进行进行测序。
(iv)TSE方案序列特异性引物浓度的优化
建议在测试样本上使用TSE方案之前,使用30pg gDNA作为模板,优化特定单个或多重引物的浓度,以添加到TSE方案的
Figure BDA0003021946230000222
中。这只需要做一次,同一浓度可以用于使用该引物组进行所有后续的TSE扩增。需要对每个单独或多重引物组执行此过程。
以下方案将用作引物浓度优化的指南。
细胞裂解
1.用以下标签标记11个无菌空PCR管:
管标签
A-1
B-1
C-2
D-2
E-5
F-5
G-10
H-10
I-0
J-0
K-NTC
2.根据
Figure BDA0003021946230000231
试剂盒TSE方案准备足够的细胞裂解混合物,用于12个样本。
3.向无菌空PCR管中添加3μl细胞裂解混合物。
4.向每个试管(NTC除外)中添加1μl在PBS或PCR级H2O中稀释的30pg gDNA。
5.向NTC中添加1μl PCR级H2O。
6.在热循环仪中按照程序培养所有试管:RHS裂解。
全基因组扩增与靶标序列富集
1.稀释所有正向和反向序列特异性引物,如果引物被多重化,则将所有引物等体积混合。注意,通过比较下面步骤8中产生的序列特异性产物的量,可以进一步优化添加到复合物中的每个引物组的浓度。用PCR级H2O将引物池稀释至1μM、2μM、5μM和10μM的工作储备浓度。
2.根据
Figure BDA0003021946230000232
试剂盒TSE方案,准备足够的WGA mastermix,用于12个样本。注意,序列特异性引物未添加到该mastermix中。
3.将22μl WGA mastermix转移到11个试管中。有剩余的WGA mastermix,丢弃。
4.根据程序:具有TSE的RHS WGA(第10页)在热循环仪中孵育所有试管。
5.在PCR程序的保持步骤中,向每个试管中添加2.8μl相应序列特异性引物稀释液。
管标签 TSE引物添加
A-1 2.8uL 1μM池
B-1 2.8uL 1μM池
C-2 2.8uL 2μM池
D-2 2.8uL 2μM池
E-5 2.8uL 5μM池
F-5 2.8uL 5μM池
G-10 2.8uL 10μM池
H-10 2.8uL 10μM池
I-0 2.8uL PCR级H<sub>2</sub>O
J-0 2.8uL PCR级H<sub>2</sub>O
K-NTC 2.8uL PCR级H<sub>2</sub>O
6.使用TSE PCR程序重新开始RHS WGA。
7.为了确认DNA样本的扩增,并确定TSE的靶标特异性引物的最佳添加浓度,运行琼脂糖凝胶。比较具有TSE的WGA-PCR样本的产量与未添加序列特异性引物I-0和J-0的对照样本的产量(图4)。
8.为了评估靶标序列的富集度,使用相同的序列特异性引物进行PCR,并使用来自每个WGA TSE PCR的DNA作为模板(管A-1、B-1、C-2、D-2、E-5、F-5、G-10H-10、I-0和J-0)。如有必要,稀释每个WGA TSE扩增子样本(约1:20-1:10作为参考)或使用neat作为序列特异性PCR扩增的模板。
9.序列特异性引物的最佳浓度将是对WGA产量影响最小的最高浓度,并使用WGATSE扩增子作为模板在第二序列特异性PCR中产生可检测的PCR产物(图3)。
实施例2–使用条形编码的接头引物进行PCR条形编码
图5提供了根据第一实施方案的第一工作流程的示意图,示出了使用本文所述方案的条形编码(左面板)或在右侧面板中合并靶标特异性富集。
使用的引物序列如图6所示。
步骤1–WGA PCR:
5’-CCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:1)–具有简并核苷酸序列(NNNNNN,其中N是任意核苷酸)和5’固定序列(CCAGCCTTGC(SEQ ID NO:2))的扩增引物。
步骤2-接头/条形编码PCR:
5’CCATCTCATCCCTGCGTGTCTCCGACTCAG<条形码>CCAGCCTTGC-3’—第一引物,包括5’固定的核苷酸序列(5’-CCAGCCTTGC-3’(SEQ ID NO:2))、选择的特异性标识符序列(“条形码”;5’-TCTAACGGAC-3’SEQ ID NO:3)和用于随后引发DNA合成的接头序列(“A-接头”;5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’(SEQ ID NO:4))。本实施方案中的整个引物序列为5’-CCATCTCATCCCTGCGTGTCTCCGACTCAGGATTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO:5)。
5’-CACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATCCAGCCTTGC-3’(SEQ ID NO:6)–第二引物,包含5’固定的核苷酸序列(‘-CCAGCCTTGC-3’(SEQ ID NO:2))和接头序列(“P1接头”;5’-CACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT-3’(SEQ ID NO:7))。
工作流程如图5和图7所示。
对于靶标特异性富集(TSE),如图5中步骤1a所示,引物序列如下:
5’-CCAGCCTTGC<正向靶标特异性序列>-3’—正向TSE引物,包含5’固定的核苷酸序列(CCAGCCTTGC(SEQ ID NO:2))和正向靶标特异性序列,该序列与靶标区侧翼的序列相同或几乎相同,或者互补。
5’-CCAGCCTTGC<反向靶标特异性序列>-3’—反向TSE引物,包含5’固定的核苷酸序列(CCAGCCTTGC(SEQ ID NO:2))和反向靶标特异性序列,该序列与靶标区侧翼的序列(在与正向靶标特异性序列互补的链上)相同或几乎相同,或者互补。
对于靶标序列富集(TSE),如图5中步骤2a所示,正向和反向引物序列与步骤1a中使用的相同。
TSE的工作流程如图5、8和9所示。
TSE步骤1a(TSE)、2a(靶标区特异性PCR)和2b(TSE产物的接头/条形码PCR)的引物序列如图8和9所示。
5’-CCATCTCATCCCTGCGTGTCTCCGACTCAGTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO:8)是第一引物,包含5’固定的核苷酸序列(CCAGCCTTGC(SEQ ID NO:2)),选择的特异性标识符序列(“条形码”,5’-TCTAACGGAC-3’(SEQ ID NO:3))和随后引发DNA合成的接头序列(“A接头”;5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’(SEQ ID NO:4))。
5’-CACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATCCAGCCTTGC-3’(SEQ ID NO:6)是第二引物,包含5’固定的核苷酸序列(CCAGCCTTGC(SEQ ID NO:2))和接头序列(“P1接头”;5’-CACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT-3’(SEQ ID NO:7))。
方法:
从非整倍体细胞系(Coriell医学研究所)中手动分选5-细胞样本,并使用图1所示的两阶段单管方案准备测序。使用标准
Figure BDA0003021946230000251
试剂盒试剂和WGA PCR引物扩增DNA(图11)。随后,在同一PCR管内利用第二PCR步骤合并公开可获得的Ion TorrentTM(美国赛默飞世尔)NGS接头序列和条形码。使用qPCR(Kapa Biosystems,US)和接头序列特异性引物(PerkinElmer Health Sciences Australia Pty Ltd)对接头序列(在扩增的DNA的5’和3’端)的掺入进行定量,提供文库活力评分(library viability score)。
图10示出了通过PCR条形码方法的实施方案制备的样本的1%琼脂糖凝胶电泳,它们被测序。泳道2和3采用TSE方案。
图11示出了,使用靶标序列富集工作流程的实施方案,仅使用WGA(泳道2-3)和靶标序列富集(泳道4-5)模板的靶标特异性PCR产物的1%琼脂糖凝胶电泳。
使用Ion-ChefTM系统(美国赛默飞世尔公司)合并条形编码的样本并准备测序,并使用Ion-PGMTM系统测序。测序数据与hg19进行生物信息学比对,整理测序指标并分析数据,确定样本倍性状态。
仅WGA和具有靶标序列富集样本的WGA以及具有靶标序列富集的PCR条形编码样本的HBB集成基因组学查看器(IGV)屏幕截图如图16所示。
5-细胞样本的全染色体非整倍体结果与47,XY,+13(图13B)和46,XY细胞系的预期核型一致。
使用5-细胞样本对染色体8上7Mb缺失和32Mb复制进行的检测也与所用细胞系的预期核型一致(GM14485;科里尔医学研究所)(图13A)。
平均mtDNA含量为0.08-0.36%。
结论
该新方法为在Thermo Fisher(US)NGS平台上进行测序提供了单管扩增和条形编码方案,以实现快速、可扩展和经济的PGT-A测序,以及合并靶标序列富集方案(PerkinElmer Health Sciences Australia Pty Ltd)用于来自单个胚胎活检的组合PGT-M和PGT-A。
实施例3–使用条形编码的WGA引物进行PCR条形编码
图14提供了根据第二实施方案另一实施方案的工作流程的示意图。本实施方案的变型在左右两侧的面板中示出。
使用的引物序列如图15所示。
在前述实施例中描述了此工作流中使用的方案。
步骤1–WGA/条形编码PCR:
5’-<条形码>CCAGCCTTGCNNNNNNATGTGG-3–具有简并核苷酸序列(NNNNNN,N为任何核苷酸)、5’固定序列(5’-CCAGCCTTGC-3’(SEQ ID NO:2))和选择的特异性标识符序列(“条形码”;5’-TCTAACGGAC-3’(SEQ ID NO:3))的扩增引物。本实施方案中的整个引物序列为5’-TCTAACGGACCCAGCCTTGCNNNNNNATGTGG(SEQ ID NO:9)。
步骤2-接头PCR:
5’-CCATCTCATCCCTGCGTGTCTCCGACTCAGTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO:8)—第一引物,包含5’固定的核苷酸序列(CCAGCCTTGC(SEQ ID NO:2)、选择的特异性标识符序列(“条形码”;5’-TCTAACGGAC-3’(SEQ ID NO:3))和用于随后引发DNA合成的接头序列(“A-接头”;5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’(SEQ ID NO:4))。
5’-CCGCTTTCCTCTCTATGGGCAGTCGGTGATTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO:10)—第二引物,包含5’固定的核苷酸序列(CCAGCCTTGC(SEQ ID NO:2)和与附接到固体基质的核苷酸序列相同或互补的接头序列(“P1接头”);5’-CCGCTTTCCTCTCTATGGGCAGTCGGTGAT-3’(SEQ ID NO:11)。
工作流程和引物如图14至16所示。
图17示出了使用PCR条形码方法的实施方案制备的样本的1%琼脂糖凝胶电泳。
图18示出了5-细胞样本结果,其中(A)染色体8上存在7Mb缺失和32Mb复制(GM14485),以及(B)染色体21和XXY非整倍体的全染色体复制(GM04965)。
结论
该新方法为在赛默飞世尔(美国)NGS平台上的测序提供了单管扩增和条形编码方案,以实现快速、可扩展和经济的PGT-A测序,以及合并靶标序列富集方案(PerkinElmerHealth Sciences Australia Pty Ltd)用于来自单个胚胎活检的组合PGT-M和PGT-A。
实施例4–使用用于WGA和条形编码的变体引物进行DNA条形编码的效率不高
根据使用变体扩增引物以及变体第一和第二引物的比较例进行的工作流程提供在图19中。在该比较例中,扩增效率不高。
步骤1–WGA PCR/条形编码:
5’-GTCTCCGACTCAG<条形码>GATNNNNNNATGTGG-3’–扩增引物,包含具有简并核苷酸序列(NNNNNN)的核苷酸序列5’-GATNNNNNNATGTGG-3’(经改动的DOP-PCR;SEQ ID NO:12)、选择的特异性标识符序列(“条形码”)和接头A的一部分(5’-GTCTCCGACTCAG-3’(SEQID NO:13)。
步骤2-接头PCR:
5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’(SEQ ID NO:14)–第一引物,包括包含引物位点的截短的接头A。
5’-CCTCTCTATGGGCAGTCGGTGATNNNNNNATGTGG-3’(SEQ ID NO:15)–第二引物,包含如上所述的经改动的DOP-PCR序列和接头P1序列(5’-CCTCTCTATGGGCAGTCGGT-3’(SEQ IDNO:16)。
图20示出了在通过1%琼脂糖凝胶电泳后的用于PCR条形编码方法实施方案的PCR产物。
图21A示出了M4 CNV图。条形编码的PCR产物的Illumina文库制备。XY+15。图21B示出了M4 CNV图。条形编码的PCR产物的Illumina文库制备。XXY+21。
该单管PCR扩增和条形编码的方法突出了低效方案的一些特点。生成的DNA文库的特征可包括低DNA产量、不完全的接头并入和/或偏向的接头并入。
这些结果表明,对于核酸的条形编码,在WGA引物和第一和第二引物上使用简并引物5’的固定序列进行的扩增提供了更有效的扩增NGS文库制备工作流程。这允许将条形码序列的使用引入WGA引物和/或引入第一和第二引物中的任一者或两者中,从而高效地产生已条形编码的核酸。
实施例5–工作流程的比较详细信息
下表示出了实施例2中所述方法的比较。实施例3和实施例4在WGA PCR和清理之后。
ng/ul
实施例4 10-20
实施例3 60-80
实施例2 60-80
从图10、17、20和21中的凝胶的比较可以看出实施例4(图20)具有次优产物尺寸(大范围)和过量的引物二聚体(尽管实施例3(图17)也具有过量的引物二聚体)。产物大小的目标范围应在~200-500bp之间,因为片段>500bp的文库的克隆扩增和测序在一些Thermo Fisher(US)NGS平台上是有问题的。当文库的范围较大时,可以选择大小,但仍需要小于500bp的片段才能有效。在实施例4(图20)中,如相对于DNA标记的亮度所示,产物产率要低得多,这表明PCR效率次优。
针对实施例2和3,成功地实现了PCR掺入IonTorrentTM条形码。
根据观察到的DNA产量、片段大小和文库活力的差异,选择最有效和通用的方法(实施例2),如下表所示:
PCR条形编码选择方法中WGA-PCR-DNA特征概况。
Figure BDA0003021946230000281
最省时的方案在3小时内(包括清理时间)产生扩增、测序就绪的样本,实际操作时间约为1小时。
结论:
本文所述的新方法为在Thermo Fisher(美国)NGS平台上测序提供了单管扩增和条形编码方案,以实现快速、可伸缩和经济的PGT-A测序,以及合并用于来自单个胚胎活检的组合PGT-M和PGT-A的靶标序列富集方案(PerkinElmer Health Sciences AustraliaPty Ltd)。
实施例6–使用条形编码的扩增引物v2进行PCR条形编码
图22提供了根据另一实施方案的另一工作流程的示意图。
在前述实施例中描述了此工作流程中使用的方案。
步骤1–WGA PCR:
5’-GCTCTTCCGATCTACTCGAGNNNNNNNATGTGG-3’(SEQ ID NO:17)–具有简并核苷酸序列(5’-NNNNNN-3’)和5’固定序列(5’-GCTCTTCCGATCTACTCGAG-3’(SEQ ID NO:18))的扩增引物。
步骤2–接头/条形编码PCR:
5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTACTCGAG-3’(SEQ ID NO:19)–3’序列,包括与扩增引物的5’固定的核苷酸序列相同的序列(5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTACTCGAG-3’(SEQ ID NO:48))和与P5读取序列引物相同或互补的P5读取序列,以及与附接到固体基质的P5序列相同或互补的P5接头序列(5’-AATGATACGGCGACCACCGAGATCT-3’(SEQ ID NO:49))。
5’-CAAGCAGAAGACGGCATACGAGAT<条形码>GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACTCGAG-3’-3’序列,包括与扩增引物5’固定的核苷酸序列(5’-GCTCTTCCGATCTACTCGAG-3’(SEQ ID NO:18))相同的序列,与P5读取序列引物相同或互补的P5读取序列,选择的特异性标识符序列(“条形码”)以及与附接到固体基质的P7核苷酸序列相同或互补的P7接头序列(5’-CAAGCAGAAGACGGCATACGAGAT-3’(SEQ ID NO:21))。整个引物序列为5’-CAAGCAGAAGACGGCATACGAGATXXXXXXXXGTGACTGGAGTTCAGACGTGTGC TCTTCCGATCTACTCGAG-3’(SEQ IDNO:22),其中XXXXXXXX是选择的特异性序列。
图23示出了用于PCR条形编码方法的实施方案的通过1%琼脂糖凝胶电泳后的PCR产物。
实施例7–使用条形编码的扩增引物v3进行PCR条形编码
图24提供了根据另一实施方案的另一工作流程的示意图。
在前述实施例中描述了此工作流中使用的方案。
步骤1–WGA和条形码PCR:
5’-GCTCTTCCGATCT<条形码>GAGNNNNNNATGTGG-3’-具有简并核苷酸序列(5’-NNNNNN-3’)、条形码序列和5’固定序列(5’-GCTCTTCCGATCT-3’(SEQ ID NO:26))的扩增引物。
步骤2–接头PCR:
5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC T-3’(SEQID NO:50)—3’序列,包括与扩增引物5’固定的核苷酸序列(5’-GCTCTTCCGATCT-3’(SEQ IDNO:18))相同的序列,与P5读取序列引物相同或互补的P5读取序列,以及与附接到固体基质的P5核苷酸序列相同或互补的P5接头序列(5’-AATGATACGGCGACCACCGAGATCT-3’(SEQ IDNO:49))。
5’-CAAGCAGAAGACGGCATACGAGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT CT-3’(SEQID NO:51)–3’序列,包括与扩增引物5’固定的核苷酸序列(5’-GCTCTTCCGATCT-3’(SEQ IDNO:18))相同的序列,与P5读取序列引物相同或互补的P5读取序列,以及与附接到固体基质的P7核苷酸序列相同或互补的P7接头序列(5’-CAAGCAGAAGACGGCATACGAGAT-3’(SEQ IDNO:21))。
图25示出了用于PCR条形编码方法的实施方案的通过1%琼脂糖凝胶电泳后的PCR产物。图26显示根据本公开第二实施方案的具有整倍体雌性(G00318;PKHS(a)Pty Ltd)的5-细胞样本结果。
结论
本实施方案提供了用于在Illumina(US)NGS平台上进行测序的单管扩增和条形编码方案,以允许对来自单个胚胎活检的PGT-A进行快速、可扩增和经济的测序。该方案的好处是能够在第一轮中进行条形编码,从而简化下游流程。
尽管已经参考特定的实施方案描述了本公开,但是应当理解,本公开可以许多其他形式体现。还将理解,本文所描述的公开易受除具体描述的那些以外的变化和修改的影响。应当理解,本公开包括所有这些变化和修改。本公开还包括本说明书中单独或共同提及或指示的所有步骤、特征、组合物和化合物,以及任何两个或更多步骤或特征的任何和所有组合。
此外,应注意,如本文所用,除非上下文另有规定,否则单数形式“a”、“an”和“the”包括复数方面。
在本说明书中,除非上下文另有要求,否则“包含”一词或“包含”或者“包含”、“包括”等变体,应理解为包含所述元素或整数或一组元素或整数,但不排除任何其他元素或整数或一组元素或整数。
本说明书中对任何现有技术的引用不是,也不应被视为,对该现有技术构成任何国家公知常识的一部分的承认或任何形式的建议。
包括本文使用的主题标题仅为方便读者参考,不应用于限制整个披露或权利要求中的主题。主题标题不应用于解释权利要求的范围或权利要求的限制。
本文提供的描述涉及关于若干实施方案,这些实施方案可以共享共同的特征和特征。应当理解,一个实施方案的一个或多个特征可以与其他实施方案的一个或多个特征组合。另外,实施方案的单个特征或特征的组合可以构成附加实施方案。
除非本文另有说明或与上下文明显矛盾,否则本文所述的所有方法都可以任意适当的顺序执行。使用本文提供的任何和所有示例或示例性语言(例如,“例如”)仅旨在更好地说明示例性实施例,并且除非另外要求保护,否则不对所要求保护的发明的范围构成限制。说明书中的任何语言都不应被解释为表明任何未声明的元素是必要的。
未来的专利申请可以在本申请的基础上提出,例如,通过要求本申请的优先权、要求分案状态和/或要求延续状态。应当理解,所附权利要求仅作为示例提供,并不旨在限制在任何此类未来申请中可能要求保护的内容的范围。权利要求也不应被视为限制对本公开的理解(或排除对本公开的其他理解)。特征可以在稍后的日期添加到示例权利要求或从示例权利要求中省略。
序列表
<110> 珀金埃尔默保健科学(澳大利亚)私人有限公司
<120> 核酸的条形编码
<130> 1155561
<160> 52
<170> PatentIn version 3.5
<210> 1
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 扩增引物
<220>
<221> misc_feature
<223> N任意核苷酸的简并核苷酸序列
<220>
<221> misc_feature
<222> (11)..(16)
<223> N任意核苷酸
<400> 1
ccagccttgc nnnnnnatgt gg 22
<210> 2
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 5' 固定序列
<400> 2
ccagccttgc 10
<210> 3
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 条形码序列的示例
<400> 3
tctaacggac 10
<210> 4
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A-接头序列
<400> 4
ccatctcatc cctgcgtgtc tccgactcag 30
<210> 5
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 5
ccatctcatc cctgcgtgtc tccgactcag gattctaacg gacccagcct tgc 53
<210> 6
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 6
cactacgcct ccgctttcct ctctatgggc agtcggtgat ccagccttgc 50
<210> 7
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> P1-接头序列
<400> 7
cactacgcct ccgctttcct ctctatgggc agtcggtgat 40
<210> 8
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 8
ccatctcatc cctgcgtgtc tccgactcag tctaacggac ccagccttgc 50
<210> 9
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<220>
<221> misc_feature
<222> (21)..(26)
<223> N任意核苷酸
<400> 9
tctaacggac ccagccttgc nnnnnnatgt gg 32
<210> 10
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 10
ccgctttcct ctctatgggc agtcggtgat tctaacggac ccagccttgc 50
<210> 11
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> P1-接头
<400> 11
ccgctttcct ctctatgggc agtcggtgat 30
<210> 12
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 改动的 DOP-PCR
<220>
<221> misc_feature
<222> (4)..(9)
<223> N任意核苷酸
<400> 12
gatnnnnnna tgtgg 15
<210> 13
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 部分A接头
<400> 13
gtctccgact cag 13
<210> 14
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 14
ccatctcatc cctgcgtgtc tccgactcag 30
<210> 15
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<220>
<221> misc_feature
<222> (24)..(29)
<223> n is a, c, g, or t
<400> 15
cctctctatg ggcagtcggt gatnnnnnna tgtgg 35
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 接头 P1序列
<400> 16
cctctctatg ggcagtcggt 20
<210> 17
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<220>
<221> misc_feature
<222> (21)..(27)
<223> n为a, c, g, 或t
<400> 17
gctcttccga tctactcgag nnnnnnnatg tgg 33
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 5' 固定序列
<400> 18
gctcttccga tctactcgag 20
<210> 19
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 19
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctac 60
tcgag 65
<210> 20
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> P5 接头序列
<400> 20
aatgatacgg cgaccaccga gatctacact ctttccctac acgac 45
<210> 21
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> P7 接头序列
<400> 21
caagcagaag acggcatacg agat 24
<210> 22
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<220>
<221> misc_feature
<222> (25)..(32)
<223> N选择的核苷酸
<400> 22
caagcagaag acggcatacg agatnnnnnn nngtgactgg agttcagacg tgtgctcttc 60
cgatctactc gag 73
<210> 23
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 23
ccgactcgag 10
<210> 24
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 24
gatgctcgag 10
<210> 25
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 25
gatgccttgc 10
<210> 26
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 26
gctcttccga tct 13
<210> 27
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 27
gctcttccga tctgag 16
<210> 28
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 28
agttcagacg tgtgctcttc cgatct 26
<210> 29
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 29
cagacgtgtg ctcttccgat ct 22
<210> 30
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 30
ccactacgcc tccgcttt 18
<210> 31
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 31
tccactacgc ctccgcttt 19
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 32
ttccactacg cctccgcttt 20
<210> 33
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 33
tttccactac gcctccgctt t 21
<210> 34
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 34
ctttccacta cgcctccgct tt 22
<210> 35
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 35
gctttccact acgcctccgc ttt 23
<210> 36
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 36
cgctttccac tacgcctccg cttt 24
<210> 37
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 37
ccgctttcca ctacgcctcc gcttt 25
<210> 38
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 38
ctaaggtaac 10
<210> 39
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<400> 39
taaggagaac 10
<210> 40
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 40
aagaggattc 10
<210> 41
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 41
taccaagatc 10
<210> 42
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 42
cagaaggaac 10
<210> 43
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 43
ctgcaagttc 10
<210> 44
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 44
ttcgtgattc 10
<210> 45
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 45
ttccgataac 10
<210> 46
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 46
tgagcggaac 10
<210> 47
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列
<400> 47
cctctctatg ggcagtcggt gat 23
<210> 48
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物序列的一部分
<400> 48
acactctttc cctacacgac gctcttccga tctactcgag 40
<210> 49
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> P5 接头序列
<400> 49
aatgatacgg cgaccaccga gatct 25
<210> 50
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 50
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 51
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 51
caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatct 58
<210> 52
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 52
gtctccgact cag 13

Claims (42)

1.一种产生用于利用固体基质上的克隆扩增来测序的核酸的方法,所述方法包括:
(a)提供用于测序的核酸样本;
(b)采用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增所述核酸样本,以产生扩增的核酸;以及
(c)使用包含(i)所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和包含(ii)所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所述扩增的核酸,
其中所述第一接头核苷酸序列或所述第二接头核苷酸序列提供用于随后从附接到所述固体基质的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中的一个或更多个包含特异性标识符序列以识别用所述第一引物、所述第二引物和/或所述扩增引物扩增的核酸;
从而产生用于利用所述固体基质上的克隆扩增来测序的核酸。
2.根据权利要求1所述的方法,其中所述简并寡核苷酸序列是完全简并核苷酸序列。
3.根据权利要求1或2所述的方法,其中所述扩增引物包含3至16个核苷酸的简并核苷酸序列。
4.根据权利要求1至3中任意一项所述的方法,其中所述扩增引物包含由6个核苷酸组成的简并核苷酸序列。
5.根据权利要求1至4中任意一项所述的方法,其中所述扩增引物在所述简并核苷酸序列3’包含固定的核苷酸序列。
6.根据权利要求5所述的方法,其中在所述简并核苷酸序列3’的所述固定的核苷酸序列包含3至10个核苷酸。
7.根据权利要求5或6所述的方法,其中在所述简并核苷酸序列3’的所述固定的核苷酸序列由6个核苷酸的核苷酸序列组成。
8.根据权利要求7所述的方法,其中在所述简并核苷酸序列3’的所述固定的核苷酸序列由核苷酸序列5’-ATGTGG-、5’-ATCTCA-3’或TGAGAT组成。
9.根据权利要求1至8中任意一项所述的方法,其中所述5’固定的核苷酸序列包含6至40个核苷酸的核苷酸序列。
10.根据权利要求1至9中任意一项所述的方法,其中所述5’固定的核苷酸序列由10个核苷酸的核苷酸序列组成。
11.根据权利要求1至10中任意一项所述的方法,其中所述5’固定的核苷酸序列由核苷酸序列5’-CCAGCCTTGC-3’(SEQ ID NO:2)、5’-CCGACTCGAG-3’(SEQ ID NO:23)、5’-GATGCTCGAG-3’(SEQ ID NO:24)、5’-GATGCCTTGC-3’(SEQ ID NO:25)、5’-GCTCTTCCGATCT-3’(SEQ ID NO:26)、5’-GCTCTTCCGATCTACTCGAG-3’(SEQ ID NO:27)、5’-GCTCTTCCGATCTGAG-3’(SEQ ID NO:18)、5’-AGTTCAGACGTGTGCTCTTCCGATCT-3’(SEQ ID NO:28)或5’-CAGACGTGTGCTCTTCCGATCT-3’(SEQ ID NO:29)组成。
12.根据权利要求1至11中任意一项所述的方法,其中所述第一接头核苷酸序列包括核苷酸序列5’-CCGCTTTCCTCTCTATGGGCAGTCGGTGAT-3’(SEQ ID NO:11)或5’-CCTCTCTATGGGCAGTCGGTGAT-3’(SEQ ID NO:47)。
13.根据权利要求1至12中任意一项所述的方法,其中所述第二接头核苷酸序列包括核苷酸序列5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’(SEQ ID NO:14)。
14.根据权利要求1至13中任意一项所述的方法,其中所述第一引物包含用于随后引发DNA合成的第一接头核苷酸序列,第二引物包含与附接到所述固体基质上的核苷酸序列相同或互补的第二接头序列。
15.根据权利要求1至14中任意一项所述的方法,其中所述第一引物和所述第二引物包含与附接到所述固体基质上的核苷酸序列相同或互补的核苷酸序列。
16.根据权利要求1至15中任意一项所述的方法,其中所述第一引物、所述第二引物和所述扩增引物包含多个特异性标识符序列。
17.根据权利要求1至16中任意一项所述的方法,其中所述第一引物、所述第二引物和所述扩增引物包含特异性标识符序列。
18.根据权利要求1至17中任意一项所述的方法,其中所述特异性标识符序列包括6至12个核苷酸的核苷酸序列。
19.根据权利要求1至18中任意一项所述的方法,其中所述特异性标识符序列由10个核苷酸的核苷酸序列组成。
20.根据权利要求17至19中任意一项所述的方法,其中所述特异性标识符序列包括核苷酸序列5’-TCTAACGGAC-3(SEQ ID NO:3)。
21.根据权利要求1至20中任意一项所述的方法,其中所述扩增引物包含特异性标识符序列,所述第一引物包含用于随后引发DNA合成的第一接头序列,所述第二引物包含与附接到所述固体基质上的核苷酸序列相同或互补的核苷酸序列和特异性标识符序列。
22.根据权利要求1至21中任意一项所述的方法,其中所述第一引物包含用于随后引发DNA合成的第一接头序列和特异性标识符序列,所述第二引物包含与附接到所述固体基质上的核苷酸序列相同或互补的核苷酸序列。
23.根据权利要求1至22中任意一项所述的方法,其中所述第一引物包含用于随后引发DNA合成的第一接头序列和与附接到所述固体基质上的核苷酸序列相同或互补的核苷酸序列,所述第二引物包含与附接到所述固体基质上的另一核苷酸序列相同或互补的核苷酸序列和特异性标识符序列。
24.根据权利要求1至23中任意一项所述的方法,其中所述第一引物包含用于随后引发DNA合成的第一接头序列、与附接到所述固体基质上的核苷酸序列相同或互补的核苷酸序列和特异性标识符序列,所述第二引物包含与附接到所述固体基质上的另一核苷酸序列相同或互补的核苷酸序列和所述特异性标识符序列。
25.根据权利要求1至24中任意一项所述的方法,其中所述方法还包括用一个或更多个靶标特异性引物扩增核酸。
26.根据权利要求1至25中任意一项所述的方法,其中所述方法还包括在步骤(b)中用一个或更多个靶标特异性引物进行扩增和/或在步骤(c)中用一个或更多个靶标特异性引物进行进一步扩增。
27.根据权利要求1至26中任意一项所述的方法,其中所述方法包括对RNA测序并通过以逆转录酶聚合将RNA转化为DNA以产生用于测序的核酸样本。
28.一种试剂盒,用于使用根据权利要求1至27中任意一项所述的方法产生用于测序的核酸。
29.通过根据权利要求1至27中任意一项所述的方法产生的用于测序的核酸。
30.一种固体基质,包含根据权利要求29所述的核酸。
31.一种对核酸进行测序的方法,所述方法包括通过根据权利要求1至27中任意一项所述的方法产生用于测序的核酸以及对所述核酸进行测序。
32.根据权利要求31所述方法,其中所述核酸为特异性靶标。
33.一种对核酸进行测序的方法,所述方法包括:
(a)提供用于测序的核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物扩增所述核酸样本,以产生扩增的核酸;以及
(c)使用(i)包含所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物和(ii)包含所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所述扩增的核酸,
其中所述第一接头核苷酸序列或所述第二接头核苷酸序列提供用于随后从附接到所述固体基质的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中的一个或更多个包含特异性标识符序列以识别用所述第一引物、所述第二引物和/或所述扩增引物扩增的核酸,从而产生进一步扩增的核酸;以及
(d)利用所述固体基质上的克隆扩增对所述进一步扩增的核酸测序。
34.一种对靶标进行测序的方法,所述方法包括:
(a)提供包含所述靶标的用于测序的核酸样本;
(b)使用包含简并核苷酸序列和5’固定的核苷酸序列的扩增引物和靶标特异性引物扩增所述核酸样本,以产生扩增的核酸;
(c)使用(i)包含所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物、(ii)包含所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物和(iii)靶标特异性引物进一步扩增所述扩增的核酸,
其中所述第一接头核苷酸序列或所述第二接头核苷酸序列提供用于随后从附接到所述固体基质上的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中的一个或更多个包含特异性标识符序列以识别用所述第一引物、所述第二引物和/或所述扩增引物扩增的核酸,从而产生进一步扩增的核酸;以及
(d)利用固体基质上的克隆扩增对所述进一步扩增的核酸进行测序以对所述靶标测序。
35.一种扩增核酸的方法,所述方法包括:
(a)提供用于测序的核酸样本;
(b)使用包含简并序列和5’固定的核苷酸序列的引物扩增所述核酸样本,以产生扩增的核酸;以及
(c)使用(i)包含所述5’固定的核苷酸序列和第一接头核苷酸序列的第一引物、(ii)包含所述5’固定的核苷酸序列和第二接头核苷酸序列的第二引物进一步扩增所述扩增的核酸,
其中所述第一接头核苷酸序列或所述第二接头核苷酸序列提供用于随后从附接到所述固体基质上的核苷酸序列引发DNA合成的序列,其他接头核苷酸序列提供用于随后从随后引发产生的模板引发DNA合成的序列,并且其中所述第一引物、所述第二引物和所述扩增引物中一个或更多个包含识别用所述第一引物、所述第二引物和/或所述扩增引物扩增的核酸的特异性标识符序列;
从而扩增所述核酸。
36.一种试剂盒,用于使用根据权利要求35所述的方法扩增核酸。
37.通过根据权利要求35所述的方法产生的扩增的核酸。
38.一种对核酸进行测序的方法,所述方法包括通过根据权利要求35所述的方法扩增核酸以及对所述核酸测序。
39.一种分离的核酸,包含以下核苷酸序列中的一个:
5’-CCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:1);
5’-CCATCTCATCCCTGCGTGTCTCCGACTCAGTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO:8);
5’-CACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATCCAGCCTTGC-3’(SEQ ID NO:6);
5’-TCTAACGGACCCAGCCTTGCNNNNNNATGTGG-3’(SEQ ID NO:9);和
5’-CCGCTTTCCTCTCTATGGGCAGTCGGTGATTCTAACGGACCCAGCCTTGC-3’(SEQ ID NO.10);或者具有至少90%序列同一性的前述核苷酸序列中的一个的变体。
40.根据要求39所述的核酸,其中所述核酸由所述核苷酸序列中的一个组成。
41.一种扩增核酸的方法,包括使用根据权利要求39或40所述的一个或更多个核酸来扩增所述核酸。
42.一种试剂盒,包含根据权利要求39或40所述的一个或更多个核酸。
CN201980068108.5A 2018-10-17 2019-10-16 核酸的条形编码 Pending CN112912514A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2018903923 2018-10-17
AU2018903923A AU2018903923A0 (en) 2018-10-17 Barcoding of nucleic acids
PCT/AU2019/051121 WO2020077400A1 (en) 2018-10-17 2019-10-16 Barcoding of nucleic acids

Publications (1)

Publication Number Publication Date
CN112912514A true CN112912514A (zh) 2021-06-04

Family

ID=70282826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980068108.5A Pending CN112912514A (zh) 2018-10-17 2019-10-16 核酸的条形编码

Country Status (9)

Country Link
US (1) US20210381027A1 (zh)
EP (1) EP3867402A4 (zh)
JP (1) JP2022508834A (zh)
KR (1) KR20210079309A (zh)
CN (1) CN112912514A (zh)
AU (1) AU2019359771A1 (zh)
IL (1) IL281941A (zh)
MX (1) MX2021004370A (zh)
WO (1) WO2020077400A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020168239A1 (en) * 2019-02-15 2020-08-20 Takara Bio Usa, Inc. Methods of preparing and analyzing nucleic acid libraries

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016010856A1 (en) * 2014-07-15 2016-01-21 Qiagen Sciences, Llc Semi-random barcodes for nucleic acid analysis
CN107699957A (zh) * 2017-05-27 2018-02-16 领星生物科技(上海)有限公司 基于dna的融合基因定量测序建库、检测方法及其应用
EP2770090B1 (en) * 2011-10-18 2018-04-18 BGI Shenzhen Co., Limited Method for preparing nucleic acid library, its uses and kits

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2770090B1 (en) * 2011-10-18 2018-04-18 BGI Shenzhen Co., Limited Method for preparing nucleic acid library, its uses and kits
WO2016010856A1 (en) * 2014-07-15 2016-01-21 Qiagen Sciences, Llc Semi-random barcodes for nucleic acid analysis
CN107699957A (zh) * 2017-05-27 2018-02-16 领星生物科技(上海)有限公司 基于dna的融合基因定量测序建库、检测方法及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SHASTA D MCCLENAHAN等: "Optimization of virus detection in cells using massively parallel sequencing", 《BIOLOGICALS》, vol. 42, no. 1, pages 2 - 2 *

Also Published As

Publication number Publication date
EP3867402A4 (en) 2022-07-13
IL281941A (en) 2021-05-31
KR20210079309A (ko) 2021-06-29
WO2020077400A1 (en) 2020-04-23
AU2019359771A1 (en) 2021-05-06
JP2022508834A (ja) 2022-01-19
MX2021004370A (es) 2021-08-19
US20210381027A1 (en) 2021-12-09
EP3867402A1 (en) 2021-08-25

Similar Documents

Publication Publication Date Title
US20190106738A1 (en) Dna amplification method
US20220259638A1 (en) Methods and compositions for high throughput sample preparation using double unique dual indexing
US20120003657A1 (en) Targeted sequencing library preparation by genomic dna circularization
JP2020522243A (ja) 核酸のマルチプレックス末端タギング増幅
JP7033602B2 (ja) ロングレンジ配列決定のためのバーコードを付けられたdna
EP3555305B1 (en) Method for increasing throughput of single molecule sequencing by concatenating short dna fragments
US11339431B2 (en) Methods and compositions for enrichment of target polynucleotides
US20230159984A1 (en) Gene target region enrichment method and kit
US20210180050A1 (en) Methods and Compositions for Enrichment of Target Polynucleotides
US20230056763A1 (en) Methods of targeted sequencing
EP3346006A1 (en) Method for amplifying dna
WO2017058936A1 (en) High molecular weight dna sample tracking tags for next generation sequencing
US20180100180A1 (en) Methods of single dna/rna molecule counting
CN112912514A (zh) 核酸的条形编码
EP3483287A1 (en) Internal amplification control
KR20200102895A (ko) 단일염기다형성 마커를 이용한 동물 개체 식별 방법
EP4048812B1 (en) Methods for 3&#39; overhang repair
CN112941147A (zh) 一种高保真靶标基因建库方法及其试剂盒
WO2022256228A1 (en) Method for producing a population of symmetrically barcoded transposomes
WO2024112758A1 (en) High-throughput amplification of targeted nucleic acid sequences

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination