CN113518829A - 检测同一样品中dna和rna的方法 - Google Patents

检测同一样品中dna和rna的方法 Download PDF

Info

Publication number
CN113518829A
CN113518829A CN201980093249.2A CN201980093249A CN113518829A CN 113518829 A CN113518829 A CN 113518829A CN 201980093249 A CN201980093249 A CN 201980093249A CN 113518829 A CN113518829 A CN 113518829A
Authority
CN
China
Prior art keywords
nppf
target
sequence
sample
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980093249.2A
Other languages
English (en)
Inventor
D·汤普森
M·鲁内塞维尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HTG Molecular Diagnostics Inc
Original Assignee
HTG Molecular Diagnostics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HTG Molecular Diagnostics Inc filed Critical HTG Molecular Diagnostics Inc
Publication of CN113518829A publication Critical patent/CN113518829A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开提供了用于对核酸靶标(例如,样品混合物中共同扩增的DNA和RNA,例如通过使用RNA的替代物)进行测序的方法。此类方法可用于确定样品中是否存在一种或更多种核酸靶标。

Description

检测同一样品中DNA和RNA的方法
相关申请的交叉引用
本申请要求于2018年12月31日提交的美国临时申请号62/787,114的优先权,其通过引用以其全文并入本文。
技术领域
本公开提供了定量核酸酶保护测序(qNPS)方法,其允许对核酸靶标进行测序(例如通过共同扩增同一样品中的DNA和RNA替代物)。此类方法可用于确定样品中是否存在一种或更多种核酸靶标,并且在一些实例中是定量的。
背景技术
尽管核酸分子测序的方法是已知的,但仍需要允许对样品混合物中共同扩增的RNA和DNA进行测序的方法。利用在样品混合物中共同扩增的DNA和RNA的多重核酸分子测序反应方法尚未以最理想的性能或简易的水平实现。
发明内容
提供了改进先前的定量核酸酶保护测序(qNPS)方法(诸如美国公开号US 2011-0104693和美国专利号8,741,564中公开的那些方法)并且代表对当前核酸测序方法的改进的方法。在一些实例中,所公开的方法通过共同扩增来自同一样品的两种分子,通过使用RNA替代物分子,对同一样品(诸如同一活检样品或同一组织样品)中的至少一种靶DNA和至少一种靶RNA进行测序或检测。在一些实例中,同时分析多个不同的(例如,唯一的)样品。在一些实例中,靶RNA和DNA分子具有点突变、缺失、插入或其组合。在一些实例中,该方法确定一种或更多种靶RNA的丰度(例如,定量或定性)并确定一种或更多种靶DNA序列中是否存在基因组突变。
所公开的确定样品(例如,经固定的样品,诸如经福尔马林固定的样品)中靶DNA分子(例如,靶基因组分子)和靶RNA分子(例如,靶mRNA或靶miRNA分子)的序列的方法可以包括用裂解缓冲液(例如,包括去污剂和/或离液剂的裂解缓冲液)裂解样品,从而产生包含靶DNA分子和靶RNA分子的裂解物。该裂解物被分成至少两个不同的部分,例如具有等体积或等核酸含量。
使用至少一种引物(例如,靶DNA引物,诸如第一正向引物和第一反向引物)从裂解物的第一部分扩增靶DNA,从而产生带侧翼的扩增子区(FAR)。在一些实例中,从细胞裂解物的第一部分扩增靶DNA使用至少两种引物(例如,至少两种靶DNA引物),每种DNA引物在其5'端具有侧翼序列。例如,第一靶DNA引物(诸如正向引物)可以在其5'端具有侧翼序列,该侧翼序列是包含侧翼序列的核酸酶保护探针(NPPF-见下文)的3'-侧翼序列的反向互补序列,而第二靶DNA引物(诸如反向引物)可以在其5'端具有与NPPF的5'-侧翼序列相同的侧翼序列。DNA引物上的这些侧翼序列允许将侧翼序列添加至DNA扩增子中,从而产生带侧翼的扩增子区(FAR)。在一些实例中,添加的侧翼序列各自为约10至50个核苷酸(nt),诸如各自25nt。在一些实例中,从靶标扩增的DNA的长度为约40至150nt,诸如40至125nt或40至100nt。在一些实例中,生成的FAR的长度为约100至200nt,诸如160至200nt。
在足以使NPPF与存在于裂解物的第二部分中的靶RNA分子特异性结合的条件下,将裂解物的第二(即不同的)部分与至少一种包含侧翼序列的核酸酶保护探针(NPPF)孵育。在一些实例中,NPPF是长度为约50至200nt,诸如60至200nt、75至150、或65至100nt的DNA分子。NPPF包括(1)5'端,(2)3'端,(3)与靶RNA分子的全部或一部分互补的序列(例如,长度为约10-60nt,诸如16至50nt),从而允许靶RNA分子和NPPF之间的特异性结合或杂交,和(4)侧翼序列。例如,与靶RNA分子的区域互补的NPPF的区域以高特异性与靶RNA分子的该区域结合或杂交。在一些实例中,侧翼序列位于与靶RNA分子互补的序列的5'、3'或两者,诸如处于与靶RNA分子互补的序列的5'的5'-侧翼序列和处于与靶RNA分子互补的序列的3'的3'-侧翼序列。在一些实例中,侧翼序列包括在样品中存在的核酸分子中未发现的至少12个连续核苷酸。
在一些实例中,NPPF包括5'-侧翼序列,并且该方法进一步包括在足以使5'-侧翼序列与与5'-侧翼序列互补的序列(5CFS)特异性杂交的条件下,使裂解物的第二部分与包括5CFS的核酸分子(例如,DNA或RNA)接触。在一些实例中,NPPF包括3'-侧翼序列,并且该方法进一步包括在足以使3'-侧翼序列与与3'-侧翼序列互补的序列(3CFS)特异性杂交的条件下,使裂解物的第二部分与包括3CFS的核酸分子(例如,DNA或RNA)接触。在一些实例中,NPPF包括3'-和5'-侧翼序列,并且该方法进一步包括在足以使3'-侧翼序列与3CFS特异性杂交并且5'-侧翼序列与5CFS特异性杂交的条件下,使裂解物的第二部分与3CFS和5CFS接触。杂交导致产生双链(ds)核酸分子,即与(1)靶RNA分子和(2)5CFS和/或3CFS杂交的NPPF。在一些实例中,NPPF中的至少一个核苷酸与靶RNA分子中的相应核苷酸不具有互补性或者与5CFS或3CFS中的相应核苷酸不具有互补性。
在足以降解(水解)或去除裂解物的第二部分中未结合的单链(ss)核酸分子的条件下,使存在于裂解物的第二部分中的所得双链(ds)核酸分子,即与(1)靶RNA分子,和(2)5CFS和/或3CFS杂交的NPPF与对ss核酸分子具有特异性的核酸酶(例如,核酸外切酶、核酸内切酶或其组合,诸如S1核酸酶)接触。因此,例如,未结合靶RNA或CFS的NPPF、未结合的RNA分子、靶RNA分子的未结合部分、未结合的CFS、和裂解物第二部分中的其他ss核酸分子被降解。这导致裂解物的第二部分含有经消化的样品,该经消化的样品包括与其靶RNA分子杂交、与其相应的3CFS杂交、与其相应的5CFS杂交、或与其相应的3CFS及其相应的5CFS杂交的NPPF。
裂解物的第二部分中的这种ds核酸分子(NPPF:靶RNA分子:CFS)可以分离成其相应的ss核酸分子(例如通过加热,例如加热至95℃至100℃),从而产生ssNPPF、ssCFS和ss靶RNA分子的混合物。在一些实例中,这种分离作为如下描述的第二扩增(FAR和ssNPPF的扩增)的第一步发生。在一个实例中,NPPF:RNA靶标的RNA链可以通过用RNase H处理复合体以选择性去除,该RNase H选择性去除DNA:RNA复合体的RNA部分(例如,如果靶分子是RNA,NPPF是DNA,3CFS和5CFS是DNA)。可以使用其他核酸酶任选地从DNA单独降解RNA。
该方法包括将样品裂解物的第一部分中产生的FAR与含有ssNPPF的样品裂解物的第二部分混合或合并,从而产生DNA扩增子/ssNPPF混合物。在一些实例中,将含有DNA扩增子的细胞裂解物的第一部分加入含有ssNPPF的细胞裂解物的第二部分(或反之亦然)。在一些实例中,1:1、1:2、1:3、1:4、1:5或1:10比率的ssNPPF:FAR用于后续扩增步骤。
在同一反应容器(例如,同一微量离心管或多孔板的同一孔)中共同扩增FAR和ssNPPF的条件下,将所得FAR/ssNPPF混合物与合适的引物(诸如正向和反向引物)孵育。在一些实例中,不同的引物被用于扩增FAR,并用于扩增ssNPPF。在一些实例中,相同的正向和反向引物用于扩增FAR,并用于扩增ss NPPF,例如由于FAR和ssNPPF上存在相同的5'-和3-侧翼序列(例如,NPPF包括5'-侧翼序列和3'-侧翼序列,并且FAR包括与NPPF中相同的5'-侧翼序列和相同的3'-侧翼序列)。例如,扩增可以使用具有与5'-侧翼序列相同的区域的第一扩增引物和具有与3'-侧翼序列互补的区域的第二扩增引物。此类引物可以进一步包括在FAR和单链NPPF的扩增过程中允许将实验标签、测序接头或两者附着至FAR扩增子或NPPF扩增子(例如附着至所得扩增子的5'端、3'端或两者)的一个或更多个序列。在一些实例中,该方法进一步包括在扩增FAR和ssNPPF之后但在对FAR扩增子和NPPF扩增子进行测序之前去除扩增引物。
在一些实例中,NPPF包括5'-侧翼序列和3'-侧翼序列(诸如5'端的侧翼序列与3'端的侧翼序列不同),并且FAR包括与NPPF中相同的5'-侧翼序列和相同的3'-侧翼序列。因此,在将ds NPPF:RNA靶标:CFS分子分离成ss NPPF分子之后,但在测序之前,该方法可以包括使ssNPPF(以及在一些实例中还包括具有相同5'端和3'端侧翼序列的FAR)与包括与3'-侧翼序列互补的区域的第一扩增引物和与包括与5'-侧翼序列互补的区域的第二扩增引物接触。例如,第一和第二扩增引物可以允许将实验标签(例如,允许识别样品、受试者、治疗或者靶RNA或DNA分子的核酸序列)和/或测序接头(例如,允许捕获到测序平台上的核酸序列)附着至所得的NPPF扩增子(和FAR扩增子)(诸如实验标签或序列接头在NPPF扩增子和FAR扩增子的5'端或3'端上),诸如允许将第一实验标签和/或第一测序接头附着至NPPF扩增子和FAR扩增子的第一扩增引物以及允许将第二实验标签和/或第二测序接头附着至NPPF扩增子和FAR扩增子的第二扩增引物。在一些实例中,该方法进一步包括在扩增之后但在测序之前去除第一和第二扩增引物(诸如,在测序步骤之前,在使用至少一种靶DNA引物从裂解物的第一部分扩增靶DNA之后去除扩增引物,在扩增FAR和单链NPPF后去除第一和第二扩增引物,或去除两组扩增引物)。
该方法可以进一步包括对所得NPPF扩增子的至少一部分和FAR扩增子的至少一部分进行测序(例如,二代测序或单分子测序),从而确定样品中的靶DNA分子的序列(通过FAR扩增子),靶RNA分子的序列(和/或丰度)(通过NPPF扩增子)。
在一些实例中,该方法对至少两种不同的靶RNA分子进行测序或检测(例如,其中使样品与至少两种不同的NPPF接触,诸如其中每种NPPF对不同的靶RNA分子具有特异性,或其中样品与至少一种对至少两种不同靶RNA分子具有特异性的NPPF接触,诸如从不同基因座转录的单独RNA分子,或从相同基因座转录的多于一种可变转录物或剪接亚型)。在一些实例中,该方法对至少两种不同的靶DNA分子(例如,其中至少两种不同的靶DNA分子包括野生型基因序列和基因序列中的至少一种突变)进行测序或检测。在具体实例中,该方法可以对多个样品进行,例如,在多个样品的每一个中检测到至少两种不同的靶RNA分子和至少两种不同的靶DNA分子。在具体实例中,至少一种NPPF对miRNA靶核酸分子具有特异性,并且至少一种NPPF对mRNA靶核酸分子具有特异性。
还提供了分离的核酸分子,例如包含SEQ ID NO:4、5、6、7、8、9、10、11、12、13、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31或32中任一项的核酸序列或由其组成的一种分离的核酸分子。还提供了核酸引物组,例如作为试剂盒的一部分。在一些实例中,该组包括以下项的核酸序列:SEQ ID NO:4和5;SEQ ID NO:6和7;SEQ ID NO:8和9;SEQ ID NO:10和11;SEQ ID NO:12和13;SEQ ID NO:17和18;SEQ ID NO:19和20;SEQ ID NO:21和22;SEQ ID NO:23和24;SEQ ID NO:25和26;SEQ ID NO:27和28;SEQ ID NO:29和30;SEQ IDNO:31和32;或这些组的组合(诸如这些组中的至少两组或至少三组)。
本公开内容的前述和其他目的和特征将从以下参照附图的详细描述中变得更加显而易见。
附图说明
图1A是显示示例性具有侧翼序列的核酸酶保护探针(NPPF)100的示意图。NPPF100包括具有与靶核酸序列(例如,靶RNA序列)特异性结合/杂交的序列的区域102。NPPF还包括5'-侧翼序列104、3'-侧翼序列106或两者(显示了具有两者的实施方式)。
图1B是显示示例性具有侧翼序列的核酸酶保护探针(NPPF)120的示意图。在该实例中,NPPF 120由两个单独的核酸分子128、130组成,而不是如图1A所示的单个核酸分子。NPPF 120包括具有与靶核酸序列特异性结合/杂交的序列的区域122。NPPF还包括5'-侧翼序列124、3'-侧翼序列126或两者(显示了具有两者的实施方式)。
图2是显示说明性方法的步骤概览的示意图,用于溶解样品10,将溶解的样品分成至少两部分,其中对第一部分12中的靶DNA进行扩增,产生靶DNA特异的FAR,并且靶RNA与NPPF杂交,经核酸酶消化,并且ds核酸分子变性,在第二部分14中产生靶RNA特异的ssNPPF,然后在测序和数据提取18之前,组合第一和第二部分的至少一部分并在混合物16中共同扩增FAR和NPPF。
图3是显示用于对至少一种靶DNA分子和至少一种靶RNA分子进行测序的说明性方法的步骤概览的示意图,其中对混合物中的DNA和RNA的替代物进行扩增。步骤1显示了样品(诸如细胞或FFPE组织),其与样品破碎缓冲液接触(例如以允许样品中细胞和组织裂解),然后分成至少两部分(第一部分和第二部分)。步骤2A显示了在允许引物与靶DNA 230杂交的条件下,将细胞裂解物的第一部分与两个扩增引物(例如,靶DNA引物),诸如含有5'延伸序列234的第一引物和含有5'延伸序列232的第二引物孵育。步骤2B显示了使用引物234、232扩增靶DNA分子230,产生带有来自引物的5'和3'延伸序列的带侧翼的扩增子区(FAR)236(在一些实例中,FAR的5'-和3'-延伸序列(分别显示为238、239)与NPPF(204,206)的5'-和3'-侧翼序列相同)。步骤2AA显示了在允许NPPF 202与靶RNA 200和CFS 208、210特异性杂交的条件下,将细胞裂解物的第二部分与至少一种NPPF 202及其互补的5CFS 208和3CFS210孵育。步骤2BB显示了将在步骤2AA中产生的所得ds核酸分子与对ss核酸分子具有特异性的核酸酶(诸如S1核酸酶、绿豆核酸酶、BAL 31核酸酶或P1核酸酶)孵育,产生ds NPPF/RNA/CFS靶标复合体212。步骤2CC显示了ds NPPF/RNA靶复合体212然后被分离或变性成其单核酸链,产生ssRNA 200,ss CFS 208、210和ssNPPF 202的混合物。在步骤3中,ssRNA200,ss CFS 208、210和ssNPPF 202的混合物与DNA扩增子236合并。在步骤4中,合并的ssNPPF 202和FAR 236在同一反应中共同扩增,例如,通过使用适当引物的PCR,然后测序。
图4是显示使用正向和反向引物(箭头)扩增ssNPPF 200(RNA靶标替代物)和FAR236的示意图,分别产生NPPF扩增子226和FAR扩增子246。引物可以包括允许将测序接头218、220、248、240和/或实验标签222、224、242、244分别添加至NPPF扩增子226和FAR扩增子246的序列。得到的NPPF扩增子226用于检测靶RNA(以及可以用于确定靶RNA序列和/或其丰度),并且FAR扩增子246用于检测靶DNA(以及可以用于确定靶DNA序列)。在一些实例中,引物序列用于将扩增子(诸如NPPF扩增子226和FAR扩增子246)识别为同一样品的产物,其中,方法的一些实例包括其中接头和/或标签序列相同(例如,在此类实例中,序列218、222与248、242相同,并且序列224、220与244、240相同)。
图5A-5B显示了来自经福尔马林固定的石蜡包埋的(FFPE)样品(图5A)和细胞系混合物样品(图5B)的三次重复实验的原始数据的具有Pearson相关性的散点图。
图6显示了在来自三次重复实验的细胞系滴定系列中测量的指定RNA的表达。
图7显示了来自在三个不同天进行的三次重复实验的在细胞系样品中检测到的DNA突变,显示为占指定区域(BRAF左,KRAS右)的总计数的百分比。
图8显示了在三个不同天进行三次重复实验的细胞系滴定中原始计数的平均值(BRAF V600E左,KRAS G12D右)
图9显示了在使用的不同条件下,一个样品的NPPFs/RNA(灰色)和FARs/DNA(灰条纹)消耗的总读数的百分比。
图10显示了所有七个FFPE样品的一组条件(14个循环和4μl加入量)的结果。该图显示了NPPF或RNA(灰色)以及FAR或DNA(灰条纹)消耗的总读数的百分比。
图11显示了八个FFPE样品中DNA突变信息和BRAF突变检测,显示为总BRAF信号的百分比(SEQ ID NO:14-16,从上至下)。
图12A-12B显示了对于八个FFPE样品中的两个(FFPE1(肺,图12A)和FFPE7591(黑色素瘤,图12B))使用一组470NPPS产生的RNA表达数据的散点图。三次重复测量的Pearson相关(r)在散点图上显示。
图13显示了来自细胞系HD300、HD301和HD789的样品的九次重复的RNA表达数据的主成分分析(PCA)图。三种不同的细胞系被强烈分开,表明表达谱具有差异。重复紧密聚集在一起,表明技术重复和在不同日期运行的重复之间具有极好重复性。
图14是显示三个参考标准和三个混合物样品中每一个的等位基因频率观察值和预期值的表格。
图15显示了表明DNA变体的个体测量的可重复性的条形图和表格。
序列表
核酸和蛋白质序列使用37C.F.R.1.822中定义的核苷酸碱基的标准字母缩写显示。仅显示每个核酸序列的一条链,但互补链被理解为包括在对展示链的任何引用中。2019年12月2日创建的且大小为约4KB的命名为“序列表(seq listing)”的文本文件的内容在此通过引用以其全文并入。
SEQ ID NO:1显示了示例性5'-侧翼序列。
SEQ ID NO:2显示了示例性3'-侧翼序列。
SEQ ID NO:3显示了示例性3'-侧翼序列的反向互补序列。
SEQ ID NO:4和5分别显示了用于扩增BRAF的示例性正向和反向引物。
SEQ ID NO:6和7分别显示了用于扩增KRAS的示例性正向和反向引物。
SEQ ID NO:8和9分别显示了用于扩增EGFR的示例性正向和反向引物。
SEQ ID NO:10和11分别显示了用于扩增EGFR的示例性正向和反向引物。
SEQ ID NO:12和13显示了可用于向所得扩增子添加实验标签的示例性引物。
SEQ ID NO:14-16显示了三个BRAF序列:野生型、导致V600E突变的nt突变和导致V600E2突变的另一个nt突变。
SEQ ID NO:17和18分别显示了用于扩增BRAF以检测V600突变的示例性正向和反向引物。
SEQ ID NO:19和20分别显示了用于扩增EGFR以检测G719突变的示例性正向和反向引物。
SEQ ID NO:21和22分别显示了用于扩增EGFR以检测外显子19内的突变的示例性正向和反向引物。
SEQ ID NO:23和24分别显示了用于扩增EGFR以检测外显子20内的突变的示例性正向和反向引物。
SEQ ID NO:25和26分别显示了用于扩增EGFR以检测L858F或L858-L861突变的示例性正向和反向引物。
SEQ ID NO:27和28分别显示了用于扩增KRAS以检测G12突变的示例性正向和反向引物。
SEQ ID NO:29和30分别显示了用于扩增KRAS以检测Q61突变的示例性正向和反向引物。
SEQ ID NO:31和32分别显示了用于扩增PIK3CA的示例性正向和反向引物。
具体实施方式
除非另有说明,否则技术术语均按惯例使用。分子生物学中常用术语的定义可见于Benjamin Lewin,Genes VII,Oxford University Press出版,2000(ISBN 019879276X);Kendrew et al.(eds.),The Encyclopedia of Molecular Biology,published byBlackwell Publishers,1994(ISBN 0632021829);Robert A.Meyers(ed.),MolecularBiology and Biotechnology:a Comprehensive Desk Reference,Wiley,John&Sons,Inc.出版,1995(ISBN0471186341);和George P.Rédei,Encyclopedic Dictionary ofGenetics,Genomics,and Proteomics,2nd Edition,2003(ISBN:0-471-26821-6)。
单数形式“a”、“an”和“the”是指一个或多于一个,除非上下文另有明确规定。例如,术语“包含an NPPF”包括单个或多个NPPF,并被认为等同于短语“包含至少一个NPPF”。除非上下文另有明确指示,否则术语“或”是指所述可选的要素中的单个要素或两个或更多个要素的组合。如本文所用,“包含”是指“包括”。因此,“包含A或B”是指“包括A、B、或A和B”,但不排除另外的要素。
还应理解,针对核酸或多肽给出的所有碱基大小或氨基酸大小以及所有分子量或分子量值均是近似值,并且提供用于描述。尽管与本文描述的那些方法和材料相似或等效的方法和材料可用在本公开内容的实践或测试中,但下文描述了合适的方法和材料。本文提及的所有出版物、专利申请、专利和其他参考文献均通过引用以其全文并入本文,对于
Figure BDA0003234235430000071
登录号(用于2018年12月31日提供的序列)也是如此。如有冲突,以本说明书(包括术语解释)为准。此外,材料、方法和实例仅是说明性的而不旨在限制。
除非另有说明,本公开内容的方法和技术通常根据本领域公知的常规方法进行并且如在本说明书通篇引用和讨论的各种常规和更具体的参考文献中所述。参见,例如,Sambrook et al.,Molecular Cloning:A Laboratory Manual,2d ed.,Cold SpringHarbor Laboratory Press,1989;Sambrook et al.,Molecular Cloning:A LaboratoryManual,3d ed.,Cold Spring Harbor Press,2001;Ausubel et al.,Current Protocolsin Molecular Biology,Greene Publishing Associates,1992(and Supplements to2000);Ausubel et al.,Short Protocols in Molecular Biology:A Compendium ofMethods from Current Protocols in Molecular Biology,4th ed.,Wiley&Sons,1999;Harlow and Lane,Antibodies:A Laboratory Manual,Cold Spring Harbor LaboratoryPress,1990;和Harlow and Lane,Using Antibodies:A Laboratory Manual,Cold SpringHarbor Laboratory Press,1999。
I.概述
本公开提供了允许对在样品混合物中共同扩增(co-amplified)的靶核酸分子诸如靶DNA和靶RNA(使用NPPF替代物)进行测序的方法,该方法可以进一步是多重的(例如,检测单个样品中的多个DNA和RNA靶标)或适用于高通量(例如,检测多个样品(例如不同的样品)中的DNA和RNA靶标)或者是多重的且高通量(例如,检测多个样品(例如不同的样品)中的多个DNA和RNA靶标)。所公开的方法提供了对当前可用测序方法的若干改进。例如,因为这些方法在同一反应容器中共同扩增靶DNA(产生扩增子,在本文中称为FAR扩增子)和NPPF(产生NPPF扩增子,其作为靶RNA的替代物),这些允许分析来自同一样品的DNA和RNA,而不是来自两个不同的样品(即,一个样品用于DNA分析,另一个/不同的样品用于RNA分析)。此外,所公开的方法消除了在分析之前从样品中提取核酸分子的需要。相反,样品被简单地裂解。与标准方法相比,所公开的方法允许使用极小输入大小(input size)。例如,当从FFPE样品提取RNA和DNA例如以进行DNA和RNA测序时,这通常需要来自FFPE样品的10-12个组织切片。相反,所公开的方法可以使用少于1个FFPE切片来分析RNA和DNA。类似地,所公开的方法可以仅使用几千个细胞来分析RNA和DNA(诸如仅裂解1000至10,000个细胞用于分析,诸如1000至5000个细胞或1000至2000个细胞)。由于这些方法需要较少的靶核酸分子加工,因此可以减少或消除由这种加工引入的偏倚或材料损失(尤其是小片段的损失)。例如,在一些当前的方法中,当靶标是DNA和RNA(诸如mRNA和/或miRNA)时,方法通常采用从样品中分离或提取核酸的步骤。例如,在现有方法中,通常从样品中分离RNA,对其进行逆转录、扩增、连接或其组合。现有方法还可能需要消耗或分离步骤以去除非期望的核酸分子或非期望的文库分子。在所公开方法的一些实施方式中,不需要进行此类步骤。结果,这些方法允许人们分析一系列否则就不适合通过测序检测的样品类型。此外,这导致样品中靶标损失较少,从而提供更准确的结果。
该方法可用于检测同一样品(诸如同一单个FFPE组织切片/载玻片)中的DNA和RNA(例如,序列,确定其量)。例如,该方法可用于检测突变,诸如一个或更多个核苷酸/核糖核苷酸插入、取代、缺失或其组合,例如基因融合、插入或缺失;串联重复序列,单核苷酸多态性(SNP);单核苷酸(或核糖核苷酸)变体(SNV);微卫星重复序列;以及DNA甲基化状态。在一个实例中,该方法用于检测靶核酸分子中的点突变。这种突变可以是已知的突变或使用所公开的方法新发现的突变。例如,该方法可用于检测单个靶核酸分子中或多个靶核酸分子中的一个或更多个点突变(诸如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个或更多个点突变,诸如1、2、3、4、5、6、7、8、9或10个不同的点突变)。该方法可用于检测单个靶核酸分子中或多个靶核酸分子中的插入和/或缺失,诸如插入和缺失(插入缺失(indel),诸如小于约10kb、小于约1kb、小于100个碱基或小于50个碱基)。在一些实例中,每个不同的点突变被认为是不同的靶核酸分子。在一些实例中,该方法可用于检测两个或更多个不同靶核酸分子中的一个或更多个点突变。该方法扩增DNA以产生FAR扩增子以检测靶DNA,并且使用核酸探针,本文称为包含侧翼序列的核酸酶保护探针(NPPF),其与靶RNA结合,从而用作检测靶RNA的替代物。该方法扩增ssNPPF以生成NPPF扩增子以检测靶RNA。FAR和ssNPPF的扩增在同一反应容器中同时发生,无需两个单独的样品进行DNA和RNA分析。这些方法可以是多重的,并且在一些实例中,大致保留了经测序的靶DNA和RNA分子的化学计量。
在第一扩增反应中用于扩增靶DNA的引物允许将侧翼序列添加至所得FAR中,其中侧翼序列可以与NPPF上的相同。NPPF包括侧翼序列。在第二扩增反应过程中,由于存在相同的侧翼序列,可以使用相同的扩增引物将测序接头和/或实验标签添加至FAR和ssNPPF。所得测序文库(由FAR扩增子和NPPF扩增子组成)上存在实验标签,使得无需对整个靶标本身进行测序,即可识别靶标,或允许将来自不同患者或不同实验的样品或以其他方式组合成单一测序运行。实验标签可以包括在3'端或5'端或两端,例如,以增加多重性。测序接头允许附着特定测序平台所需的序列并形成一些测序平台的簇。由FAR扩增子和NPPF扩增子组成的测序文库还简化了被分析(例如,测序)的测序仪输入的复杂性,因为测序文库包含目标靶DNA和RNA的已知部分而不是整个靶标、整个靶标的许多片段、或未知靶标。与其他测序方法所需的相比,FAR扩增子和NPPF扩增子的测序简化了数据分析,减少了对测序扩增子和NPPF扩增子进行简单计数的算法,而不必将序列与基因组匹配并对从标准测序方法获得的每个基因的多个序列进行解卷积。
在一个实例中,本公开提供了用于对样品中至少一种靶DNA分子(通过对FAR扩增子进行测序)和至少一种RNA分子(通过对NPPF扩增子进行测序)进行测序的方法(诸如至少3种、至少4种、至少5种、至少10种、至少20种、至少30种、至少40种、至少50种、至少100种、至少500种、至少1000种、至少2000种、或至少3000种不同的靶核酸分子)。在一个实例中,对约2-100种、2-50种、5-50种、5-100种、50-100种、50-500种、100-1000种、100-2000种、500-3000种、2-40,0000种、2-30,000种、2-20,000种、2-10,000种、100-40,0000种、或30,000-40,000种不同的靶DNA和RNA分子进行分析。将样品(例如,单个FFPE组织切片)裂解并分离或分成至少两部分(例如,具有相同或不同体积或量的核酸,诸如DNA:RNA反应的体积比为至少约1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:30、1:35、1:40、1:45、或1:50或者1:1-1:5、1:1-1:10、1:10-1:15、1:15-1:20、1:10-1:25、1:10-1:50、或约1:14;在一些实例中,DNA反应比RNA反应具有更少的核酸分子或者每个测序深度的扩增子可能需要更多或更少的读数(reads))。在一些实例中,样品是经固定的样品(诸如石蜡包埋的经福尔马林固定(FFPE)样品、苏木素和伊红染色的组织、或经戊二醛固定的组织)。在一些实例中,样品是从相同样品(例如,从FFPE组织切片的单个切片)获得的分离的基因组DNA和分离的RNA。在一些实例中,样品是单个FFPE组织切片(例如,个体切片),或单个(例如,个体切片)FFPE组织切片的一部分。在一些实例中,样品包含少于10,000个细胞、少于5000个细胞、或少于1000个细胞,诸如1000-10,000、1000-5000、1000-3000、1000-2000或100-1000个细胞。例如,靶核酸分子(例如,DNA、RNA或两者)可以是经固定的、交联的或不溶的。
在一些实例中,样品(或其一部分),诸如包括核酸(诸如DNA和RNA)的样品,被加热以使样品中核酸分子变性,例如以允许后续样品中靶DNA分子和至少一种靶DNA扩增引物(诸如正向和反向靶DNA扩增引物)之间,以及NPPF和样品中的靶RNA分子之间的杂交,以及NPPF和其相应的CFS之间的杂交。
在一些实例中,所公开的方法包括同时或同步对多个样品中的至少一种靶RNA分子(通过NPPF替代物)和至少一种靶DNA分子进行测序。同时测序是指在同一时间或基本上同一时间发生和/或在同一测序文库或同一测序反应中发生或在同一测序流动池或半导体芯片上进行(例如,同步)的测序。在一些实例中,事件发生在彼此相隔的1微秒至120秒内(例如在0.5至120秒、1至60秒、或1至30秒、或1至10秒内)。在一些实例中,所公开的方法对样品(例如FFPE组织的单个切片)中的两个或更多个靶DNA分子进行测序(例如同时或同步),例如(1)在靶DNA的第一扩增步骤中的使用至少两组不同的扩增引物,每组对不同的靶DNA分子具有特异性,(2)通过使用一组对多种不同靶DNA分子具有特异性的扩增引物。在一个实例中,裂解样品的至少一部分与多个扩增引物组(诸如至少2、3、4、5、10、15、20、25、50、75、100、200、300、500、1000、2000、3000、4000、5000或更多个扩增引物组)接触,其中每个扩增引物组与特定的靶DNA分子特异性结合。例如,如果有10种靶DNA分子,则裂解样品的至少一部分可以与10种不同的扩增引物组接触,每组对10种DNA靶标中的一种具有特异性。然而,在一些实例中,裂解样品的至少一部分与至少一个扩增引物组(诸如至少2、3、4、5、10、15、20、25、50、75、100、200、300、500、1000、2000、3000、4000、5000、10,000、15,000、20,000、25,000、30,000或更多个扩增引物组)接触,其中每个扩增引物组与至少两种(诸如至少2、3、4、5、6、7、8、9、10种或更多种)不同的靶DNA分子(诸如野生型基因和野生型基因的一个或更多个突变,诸如EGFR、BRAF、PIK3CA或KRAS)特异性结合。在一些实例中,使裂解样品的至少一部分与各自与特定靶DNA分子特异性结合的一个或更多个扩增引物组接触,并且与各自与至少两种不同靶DNA分子(诸如野生型基因和野生型基因的一个或更多个突变,诸如wtEGFR、具有L861Q突变的EGFR、具有G719S突变的EGFR、具有T790M突变的EGFR和具有L858R突变的EGFR;例如,见图14)特异性结合的一个或更多个扩增引物组接触。在一些实例中,至少10个不同的扩增引物组与裂解样品的一部分孵育。然而,应理解,在一些实例中,可以使用对单个靶DNA分子具有特异性的多于一个扩增引物组(例如2、3、4、5、10、20或更多个扩增引物组),诸如对同一靶DNA的不同区域具有特异性的一群扩增引物,或可以与靶DNA及其变异(诸如具有突变或多态性的那些)结合的一群扩增引物(例如SEQ ID NO:36-43以检测不同的EGFR突变)。例如,相对于已知具有一个目标多态性的DNA靶标(表1和7中提供的具体实例),已知在其序列上具有多个目标多态性的特定DNA靶标可能具有更多与其杂交的扩增引物。因此,一群扩增引物组可以包括至少两个不同的扩增引物组群(诸如2、3、4、5、10、20或50个不同的扩增引物组),其中每个扩增引物群(或序列)与不同的靶DNA分子特异性结合。
在一些实例中,所公开的方法对样品(例如,相同或单个样品)中的两种或更多种靶RNA分子进行测序(例如同时或同步),例如使用(1)至少两种不同的NPPF,每种NPPF对不同的靶RNA分子具有特异性,(2)通过使用对多种不同的靶RNA分子具有特异性的一种NPPF。在一个实例中,使裂解样品的至少一部分与多种NPPF(诸如至少2、3、4、5、10、15、20、25、50、75、100、200、300、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000或更多种NPPF)接触,其中每个扩增引物组与特定的靶DNA分子特异性结合。例如,如果有10种靶RNA分子,则裂解样品的至少一部分可以与10种不同的NPPF接触,每种NPPF对10种RNA靶标中的一种具有特异性。然而,在一些实例中,使裂解样品的至少一部分与至少一种NPPF(诸如至少2、3、4、5、10、15、20、25、50、75、100、200、300、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35000、40,000、45,000、50,000或更多种NPPF)接触,其中每种NPPF与至少两种(诸如至少2、3、4、5、6、7、8、9、10或更多种)不同的靶RNA分子(诸如从不同基因座转录的单独RNA分子,或多于一种可变转录物或从同一基因座转录的剪接亚型)特异性结合。在一些实例中,使裂解样品的至少一部分与一种或更多种各自与特定靶RNA分子特异性结合的NPPF接触,并且与各自与至少两种不同靶RNA分子(诸如野生型RNA和野生型RNA的一个或更多个突变)的一种或更多种特异性结合的NPPF接触。在一个实例中,至少一种NPPF对miRNA靶核酸分子具有特异性,并且至少一种NPPF对mRNA靶核酸分子具有特异性。在一些实例中,至少10种不同的NPPF与样品孵育。然而,应理解,在一些实例中,可以使用对单个靶RNA分子特异的多于一种NPPF(诸如2、3、4、5、10、20或更多种NPPF),诸如对同一靶RNA的不同区域具有特异性的一群NPPF或可以与靶RNA及其变异结合的一群NPPF(诸如具有外显子可变剪接、可变转录起始位点、组织特异性亚型或结构变化(诸如插入、缺失或融合转录本)的那些)。例如,相对于以更高水平表达的RNA靶标,低表达的RNA靶标可能具有更多与其杂交的NPPF,诸如与低表达的RNA靶标杂交的四种NPPF和与高表达的RNA靶标杂交的单种NPPF。因此,一群NPPF可以包括至少两种不同的NPPF群(诸如2、3、4、5、10、20或50种不同的NPPF序列),其中每个NPPF群(或序列)与不同的靶RNA分子特异性结合。
该方法还包括在足以使引物与裂解样品中靶DNA分子特异性结合或杂交的条件下,使裂解样品的至少一部分(诸如裂解样品的第一部分)与至少一种靶DNA扩增引物(诸如由两种靶DNA扩增引物组成的组,诸如正向和反向引物组)接触。在一些实例中,靶DNA扩增引物包括允许向所得扩增子添加5'-和3'-侧翼序列的序列,其中添加的5'-和3'-侧翼序列与NPPF的5'-和3'-侧翼序列相同。该方法包括在足以使NPPF与裂解样品中的靶RNA分子特异性结合或杂交的条件下,使(例如,单个或个体)裂解样品的至少一部分(诸如裂解样品的第二部分)与至少一种包含侧翼序列的核酸酶保护探针(NPPF)接触。杂交是发生的过程,其中两种核酸分子之间存在足够程度的互补性使得第一(例如,NPPF或引物)和第二核酸分子(例如,RNA靶标和CFS,或DNA靶标)之间发生稳定且特异的结合(例如,碱基配对)。
NPPF分子包括5'端和3'端,以及之间的与靶RNA分子的全部或部分互补的序列。核酸序列的5'端是末端残基的5'位置未被核苷酸结合的地方。核酸分子的3'端是在末端残基的3'端没有与其结合的核苷酸的末端。这允许NPPF和靶RNA分子之间的特异性结合或杂交。例如,与靶RNA分子的区域互补的NPPF区域以高特异性与靶RNA分子的该区域结合或杂交。在一些实例中,与靶RNA分子的区域互补的NPPF的区域为约40-150nt,诸如40-100nt、45-60nt,诸如50nt(例如,如果靶标是mRNA),或约15-27nt(例如,如果靶标是miRNA)。NPPF分子进一步包括一个或更多个侧翼序列,其位于NPPF的5'端和/或3'端。因此,一个或更多个侧翼序列位于与靶核酸分子互补的序列的5'、3'或两者。每个侧翼序列包括几个连续的核苷酸,产生也存在于样品中的核酸分子中未发现的序列(诸如至少约8、10、12、14、16、18、20、25、30或35个连续核苷酸,或约8-30、8-25、8-20或10-15个连续核苷酸,或至少约25个连续核苷酸)。如果NPPF在5'端和3'端均包括侧翼序列,则在一些实例中每种NPPF的序列不同且彼此不互补。
侧翼序列与互补侧翼序列(CFS)互补并提供通用杂交/扩增序列,其与扩增引物的至少一部分互补。在一些实例中,侧翼序列与FAR的侧翼序列相同。在一些实例中,侧翼序列可以包括(或允许添加)实验标签、测序接头或其组合。该方法进一步包括在足以使CFS与NPPF的侧翼序列特异性结合或杂交的条件下,使样品的至少一部分(诸如样品的第二部分)与至少一种与侧翼序列具有互补性的核酸分子(CFS)接触。例如,如果NPPF具有5'-侧翼序列,则在足以使5'-侧翼序列与与5'-侧翼序列具有序列互补性的核酸分子(5CFS)特异性结合的条件下,使样品的至少一部分与5CFS接触。类似地,如果NPPF具有3'-侧翼序列,则在足以使3'-侧翼序列与与3'-侧翼序列具有序列互补性的核酸分子(3CFS)特异性结合的条件下,使样品的至少一部分与3CFS接触。本领域技术人员将理解,代替使用单个CFS来保护侧翼序列,可以使用多个CFS来保护侧翼序列(例如,可以使用多个5CFS来保护5'-侧翼序列)。5CFS和3CFS可以是DNA或RNA。在一些实例中,5CFS和/或3CFS是RNA-DNA杂合寡核苷酸,例如其中5CFS的一个或更多个5'碱基和/或3CFS的一个或更多个3'碱基是RNA,并且其余的5CFS和3CFS是DNA。在一些实例中,一个或更多个CFS含有对碱基的修饰,或对CFS的3'或5'端的修饰,诸如硫代磷酸酯键、将导致锁核酸(LNA)(例如,用连接2'氧和4'碳的额外桥修饰的核糖)、或链终止子(例如,ddCTP或倒T碱基)。
这导致产生与靶RNA分子(或其部分)以及CFS结合的NPPF分子,从而产生包括参与与靶RNA和CFS上的互补核糖碱基或碱基杂交的NPPF的碱基的双链分子。CFS杂交并由此保护其相应的侧翼序列免于在后续步骤中被核酸酶消化。在一些实例中,每个CFS是其对应的侧翼序列的精确长度。在一些实例中,CFS与其对应的侧翼序列完全互补。然而,本领域技术人员将理解保护5'端侧翼序列的5CFS的3'端或保护3'端侧翼序列的3CFS的5'端可以具有差异,诸如在这些位置的每个位置处的核苷酸错配、上文讨论的修饰或其组合。
在允许靶RNA分子和CFS与NPPF结合后,该方法进一步包括在足以去除未与互补碱基杂交的核酸碱基(或核糖碱基)的条件下,使样品的至少一部分与对单链(ss)核酸分子或核酸分子的ss区具有特异性的核酸酶(诸如S1核酸酶)接触。因此,例如,未结合靶RNA分子或CFS的NPPF,以及未结合的单链靶RNA分子、样品中的其他ss核酸分子和未结合的CFS,被降解。这产生消化的样品,其包括作为与5CFS、3CFS或两者以及至少一部分靶RNA杂交的双链加合物而存在的完整的NPPF。在一些实例中,NPPF由DNA组成并且核酸酶包括核酸外切酶、核酸内切酶或其组合。
在一些实例中,双链(ds)NPPF:靶RNA:CFS分子被分离成其组分ss核酸分子(例如通过创建促进变性的环境,诸如加热(例如,约95℃至100℃,在缓冲液或dH2O中)、增加样品的pH值(例如用NaOH处理)、或用50%甲酰胺/0.02%
Figure BDA0003234235430000131
去污剂处理)、或这些处理的组合,从而产生ssNPPF、ss CFS和ss靶RNA的混合物。此类方法允许对释放的NPPF进行进一步分析(诸如扩增、测序或两者)。在一些实例中,将ds NPPF:靶RNA:CFS分子分离成其相应的ss核酸分子包括用RNase处理。因此,RNA靶标从NPPF降解、裂解、消化或分离,或其组合,从而允许释放ssNPPF以进一步分析(诸如扩增、测序或两者),因此允许ssNPPF作为靶RNA的替代物。由于ssNPPF由DNA组成,因此它可以与裂解样品的另一部分中产生的DNA扩增子共同扩增。本领域技术人员将理解,ds NPPF:靶RNA:CFS的扩增(即,第二扩增步骤)将从变性步骤开始,这也可以作为在扩增和测序之前或期间产生ssNPPF的方法。
因此,将在裂解样品的第一部分(FAR)中产生的扩增子和在裂解样品的第二部分中产生的释放的ssNPPF组合并扩增。在一些实例中,一旦产生DNA扩增子和释放的ssNPPF,将裂解样品的第一部分和裂解样品的第二部分简单组合,加入扩增引物,并使混合物经受核酸扩增条件,诸如PCR扩增。在一些实例中,含有释放的ssNPPF的裂解样品的第二部分与含有FAR的裂解样品的第一部分的体积比为1:1、1:2、1:3、1:4、1:5、1:15、1:10或1:20。此类扩增可用于向所得扩增子添加实验标签和/或序列接头,和/或增加FAR和ssNPPF的拷贝数。对所得FAR扩增子和NPPF扩增子的至少一部分进行测序,从而分别确定样品中至少一种靶DNA分子和至少一种靶RNA分子的序列。
在裂解样品的第一部分中产生的FAR和在裂解样品的第二部分中产生的释放的ssNPPF可以使用一种或更多种扩增引物进行扩增,从而产生FAR扩增子和NPPF扩增子。一种或更多种扩增引物可以包括用作FAR扩增子和NPPF扩增子的实验标签和/或测序接头的一个或更多个序列。在一些实例中,一种或更多种扩增引物被诸如生物素部分标记,以允许标记所得的FAR扩增子和NPPF扩增子。在一些实例中,FAR和NPPF具有相同的侧翼序列,允许使用相同的引物或多个引物对它们进行扩增。
在一个实例中,用于扩增ssNPPF的至少一种引物包括与NPPF的侧翼序列互补的区域。在一些实例中,使用两种扩增引物来扩增ssNPPF,其中一种扩增引物具有与5'侧翼序列的区域具有同一性的区域,而另一种扩增引物具有与3'侧翼序列的区域具有互补性的区域,其中互补性足以允许引物与ssNPPF杂交。在一些实例中,FAR和NPPF具有相同的侧翼序列,允许使用相同的引物扩增它们。在一些实例中,使用一种扩增引物(例如进行线性扩增),其中扩增引物具有与3'侧翼序列的区域互补的区域。
在一些实例中,在共同扩增过程中,实验标签和测序接头被添加至FAR和ssNPPF,例如,在所得扩增子的相对端。例如,使用此类引物可以产生从扩增子的5'端或3'端或从3'端和5'端延伸的实验标签和/或序列接头,以增加多重性的可能。实验标签可以包括允许识别样品、受试者或靶核酸序列的唯一核酸序列。测序接头可以包括允许将所得扩增子捕获到测序平台上的核酸序列。在一些实例中,在测序之前从混合物中去除引物。
对FAR扩增子和NPPF扩增子进行测序。可以使用任何测序方法,并且本公开内容不限于特定的测序方法。在一些实例中,使用的测序方法是链终止测序、染料终止测序、焦磷酸测序、纳米孔测序或大规模平行测序(也称为二代测序(或NGS)),例如ThermoFisher IonTorrentTM测序仪(例如Ion Torrent Personal Genome Machine(PGMTM、S5TM或GenexusTM系统)、Illumina品牌的NGS测序仪(例如MiSeqTM、NextSeqTM)(或衍生自SolexaTM测序的其他测序仪)和来自Roche Life Sciences的454测序。在一些实例中,使用单分子测序。在一些实例中,该方法还包括将获得的FAR扩增子或NPPF扩增子的序列中的至少一种与序列或突变数据库进行比较,例如,以确定是否存在靶突变。在一些实例中,该方法包括确定每个获得的FAR扩增子和NPPF扩增子(例如,野生型、SNP、新识别的变体等)的数量(例如,计数),例如使用bowtie、bowtie2、TMAP或其他序列比对器。在一些实例中,该方法包括将测序结果与合适的基因组(例如,如果靶核酸分子是人的,则合适的基因组是人基因组)或其部分比对。在一个实例中,该方法包括仅与预期靶序列比对但列举与预期序列的匹配以及预期序列内的任何变化。
II.测序方法
本文公开了对样品(诸如单个或个体样品(例如,来自FFPE组织的单个FFPE切片))中存在的至少一种靶DNA分子和至少一种靶RNA分子(间接通过用于RNA的NPPF替代物)进行测序的方法。在一些实例中,该至少一种靶DNA分子和至少一种靶RNA分子(间接通过NPPF替代物)在同一混合物中扩增。在一些实例中,在至少两个不同的样品或测定中(例如,在来自不同患者的样品中)检测到相同的靶核酸分子。因此,所公开的方法可以是多重的(例如,检测单个样品中多个靶标)、高通量的(例如,检测多个样品中靶标)、或多重的且高通量的(例如,检测多个样品中的多个靶标)。
在所公开的方法中,在裂解之后,将样品(诸如单个或个体样品,诸如来自FFPE组织的单个FFPE切片)分离成至少两部分。在足以扩增一种或更多种DNA靶标的条件下,使裂解样品的至少第一部分与靶DNA特异性引物(诸如含有侧翼序列的引物)接触,从而产生FAR。在足以使NPPF与一种或更多种RNA靶标(以及CFS与NPPF)杂交的条件下,使裂解样品的至少第二部分与NPPF和相应的CFS接触,从而产生NPPF::靶RNA:CFS复合体。然后在足以使裂解样品的第二部分中的ss核酸分子进行核酸酶消化的条件下,使NPPF:靶RNA:CFS复合体与至少一种对ss核酸具有特异性的核酸酶(诸如S1核酸酶)接触。然后将杂交的NPPF:靶RNA:CFS复合体分离,从而产生ssNPPF、ssCFS和ssRNA。裂解样品的第一部分产生的FAR与裂解样品的第二部分产生的ssNPPF组合,从而产生FAR(代表样品中的DNA)、ssNPPF(用作样品中RNA的替代物)的混合物。然后将所得混合物与引物在足以扩增FAR和ssNPPF(其可以由DNA组成)的条件下孵育,从而产生可测序的FAR扩增子和NPPF扩增子。
在一些实例中,ssNPPF和FAR可以在相同的反应混合物中共同扩增,例如,通过使用具有与NPPF的侧翼序列互补的区域(并且可以包括允许将实验标签和/或序列接头掺入靶标的序列)的引物和具有与DNA扩增子的区域(诸如在第一扩增反应过程中添加的侧翼序列,在一些实例中,其与NPPF的侧翼序列相同)互补的区域的引物。在一些实例中,所公开的方法提供具有与检测样品中核酸分子相似相对量的已测序核酸分子,诸如变动不超过20%、不超过15%、不超过10%、不超过9%、不超过8%、不超过7%、不超过6%、不超过5%、不超过4%、不超过3%、不超过2%、不超过1%、不超过0.5%、或不大于0.1%,诸如0.001%-5%、0.01%-5%、0.1%-5%、或0.1%-1%。
图1A和1B是显示示例性NPPF的示意图,NPPF可用作靶RNA的“替代物”。NPPF充当靶RNA的“替代物”或代表。因此,如果待检测或测序多种靶RNA,则可以在所公开的测定中使用多种NPPF。如图1A所示,具有至少一个侧翼序列的核酸酶保护探针(NPPF)100包括区域102,其包括与靶RNA序列(例如,靶RNA序列的至少一部分)特异性结合(例如杂交)的序列。靶RNA可以是mRNA、miRNA、tRNA、siRNA、rRNA、lncRNA、snRNA、其他非编码RNA或其组合。NPPF包括一个或更多个侧翼序列104和106。图1A显示了具有5'-侧翼序列104和3'-侧翼序列106的NPPF 100。然而,一些实例中的NPPF仅具有一个侧翼序列(例如,仅104或106中的一个)。图1A显示了示例性NPPF 100,其是单个核酸分子。图1B显示了由两个单独的核酸分子128、130组成的示例性NPPF 120。例如,如果NPPF 100是100聚体,则NPPF 120的128、130可以是50聚体。与图1A所示的NPPF 100类似,NPPF 120包括区域122,其包括与靶RNA序列(例如,靶RNA序列的至少一部分)特异性结合(例如,杂交)的序列,以及一个或更多个侧翼序列124和126。
图2是显示所公开的用于样品混合物中DNA和RNA替代物的核酸扩增的方法的实施方式的概览的示意图。首先,样品10用裂解缓冲液裂解,从而产生包含靶DNA分子和靶RNA分子的裂解物。所得裂解物被分成或分离成至少两个部分(fraction)或部分(portion)12、14。部分12中的靶DNA被扩增,从而产生FAR。在允许NPPF与靶RNA特异性结合或杂交的条件下,部分14中的靶RNA与对靶RNA具有特异性的NPPF孵育,从而形成双链(ds)核酸分子,由与靶RNA杂交的NPPF组成。与靶RNA分子复合体杂交的NPPF与对单链核酸分子具有特异性的核酸酶孵育,从而产生包含与靶RNA分子杂交的NPPF的裂解物的经消化的第二部分,然后将NPPF与靶RNA分离。将在部分14中获得的含有ss NPPF(由DNA组成)和ss靶RNA的所得混合物与在部分12中获得的FAR混合,并将混合物16进行核酸扩增(例如,PCR),从而使FAR和ssNPPF同时在同一反应混合物中扩增。然后可以对所得扩增子进行测序18,其中NPPF产生的扩增子用作样品中RNA的替代物。具体实例如图3所示。
图3是显示用于使用样品混合物中DNA和RNA替代物进行扩增的所公开方法的实施方式的概览的更详细的示意图。如步骤1所示,样品(诸如已知或疑似含有靶RNA200和DNA230的样品)用样品破坏缓冲液处理(例如,裂解或以其他方式处理以使核酸可使用),然后分离成至少两个部分。如步骤2A所示,一部分用于扩增靶DNA,从而产生FAR 236(FAR是双链的,但为了简单起见,此处仅显示了一条链)。例如,至少一种靶DNA 230与至少一种引物(例如,靶DNA引物,诸如至少两种靶DNA引物234、232),诸如具有延伸序列的靶DNA引物(例如,将与NPPF上相同的侧翼序列添加至FAR)接触或孵育。靶标特异性引物(例如,引物对)可用于每个目标靶DNA。因此,在一些实例中,反应包括至少两组不同的引物,每组对靶DNA具有特异性(尽管人们将认识到在一些实例中单个引物组可以扩增多个目标DNA靶标)。如图3的步骤2B所示,在足以扩增(诸如通过PCR)的条件下,靶DNA与引物(例如,靶DNA引物)孵育或接触,从而产生带侧翼的扩增子区236。在一些实例中,该步骤中靶DNA的扩增利用将5'-和3'-侧翼序列添加至FAR的引物,其中添加的5'端侧翼序列238与NPPF 204的5'端侧翼序列相同,并且添加的3'端侧翼序列239与NPPF 206的3'端侧翼序列相同。
如图3的步骤2AA所示,样品的至少第二部分(即,不同于第一部分,但仍来自相同样品)用于获得单链NPPF,其用作靶RNA的替代物。例如,将裂解样品的第二部分与具有一个或更多个侧翼序列的核酸酶保护探针(NPPF)202(此处显示为分别具有5'-和3'-侧翼序列204和206)接触或孵育,其与第一靶标RNA 200特异性结合。在一些实例中,NPPF 202可以结合多种靶RNA分子,诸如特定RNA的不同剪接亚型。该反应可以包括与第二靶标RNA(或与多种另外的靶RNA分子)特异性结合的另外的NPPF,等等。在一个实例中,该方法使用一种或更多种不同的NPPF,这些NPPF被设计为对每种唯一的靶RNA分子具有特异性。因此,测量100种不同的RNA靶标(例如,基因表达产物)可以使用至少100种不同的NPPF,每种RNA靶标至少使用一种NPPF(诸如几种不同的NPPF/靶标)。在另一个实例中,该方法使用一种或更多种不同的NPPF,这些NPPF被设计为对多种靶RNA分子具有特异性,诸如不同的剪接亚型或野生型RNA及其变体。因此,测量多种不同的RNA靶标可以使用单个NPPF。在一些实例中,这两种类型的NPPF的组合用于单个反应。因此,该方法可以使用至少2种不同的NPPF,至少3种、至少4种、至少5种、至少10种、至少25种、至少50种、至少75种、至少100种、至少200种、至少500种、至少1000种、至少2000种、或至少2000种不同的NPPF(诸如2至500种、2至100种、2至40,000种、2至30,000种、2至20,000种、2至10,000种、2至1000种、5至10种、2至10种、2至20种、100至500种、100至1000种、500至5000种、1000至3000种、30,000至40,000、或1000至30,000种不同的NPPF)。此外,人们将理解,在一些实例中,多种NPPF可以包括对单个靶核酸分子具有特异性的多于一种(诸如2、3、4、5、10、20、50种或更多种)NPPF(其被称为平铺组NPPF)。该反应还包括与侧翼序列互补的核酸分子(CFS)208、210。因此,如果NPPF具有5'-侧翼序列204,则反应将包括与5'-侧翼序列互补的序列(5CFS)208,并且如果NPPF具有3'-侧翼序列206,则反应将包括与3'-侧翼序列互补的序列(3CFS)210。本领域技术人员将理解,CFS的序列将根据存在的侧翼序列而变化。此外,可以使用多个CFS来确保侧翼区受到保护(例如,可以使用至少两个与单个侧翼序列的不同区域结合的CFS)。CFS可以包括天然或非天然碱基,并且可以是RNA或DNA。
在样品的第二部分(步骤2AA)中,在足以使NPPF与其各自的靶RNA分子特异性结合(例如,杂交)并且使CFS与其在NPPF侧翼序列上的互补序列结合(例如,杂交)的条件下,将NPPF和CFS孵育。在一些实例中,CFS 208、21以超过NPPF 202的量添加,例如CFS比NPPF多至少2倍(摩尔过量),诸如CFS比NPPF多至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少20倍、至少40倍、至少50倍、或至少100倍。在一些实例中,NPPF202以超过样品中总核酸分子的量添加,例如NPPF比样品中总核酸分子多至少50倍(摩尔过量),诸如NPPF比样品中总核酸分子多至少75倍、至少100倍、至少200倍、至少500倍、或至少1000倍。为了实验方便,可以包括每种NPPF的类似浓度以制备混合物(cocktail),这样对于测量的丰度最高的RNA靶标,该RNA靶标的NPPF将至少增加50倍,诸如至少100倍过量。使用的所有NPPF的实际过量和总量仅受核酸酶(例如S1核酸酶)破坏所有未与靶RNA杂交的NPPF的能力的限制。在一些实例中,步骤2AA的反应被加热,例如在50℃下孵育过夜(诸如16小时)。这导致产生与(1)其靶RNA分子和(2)3CFS、5CFS或3CFS和5CFS两者杂交的NPPF。
在NPPF与其靶RNA杂交(以及CFS与其侧翼序列杂交)之后,如图3中的步骤2BB所示,在足以去除(或水解或消化)ss核酸分子,诸如未结合的核酸分子(诸如未结合的NPPF、未结合的CFS和未结合的靶RNA分子,或这些分子中保持单链的部分,诸如未与NPPF结合的靶RNA分子的部分)的条件下,使样品与对单链(ss)核酸分子具有特异性的试剂(诸如核酸酶)接触。这导致产生ds NPPF/靶RNA/CFS复合体(或双链体)212。将样品与对ss核酸分子具有特异性的核酸酶孵育导致存在的任何ss核酸分子降解,留下完整的双链核酸分子,包括已经与CFS和靶RNA分子结合的NPPF。例如,该反应可以在50℃下与S1核酸酶孵育1.5小时(尽管水解可以在其他温度下发生并进行其他时长,并且在某种程度上,所需的时间和温度将取决于核酸酶的量、需要水解的核酸的量,以及受保护的双链区域的Tm)。
如图3的步骤2CC所示,ds NPPF/RNA靶标/CFS复合体212被暴露于允许靶RNA序列200和CFS(例如,5CFS 208、3CFS 210或两者)与NPPF分离的条件,从而产生ssRNA 200、ssNPPF 202和ssCFS(诸如208和210)。尽管显示了两个CFS,但是本公开还设想了单个CFS实施方式。如果NPPF上仅存在一个侧翼序列,则在NPPF/靶标复合体中将仅结合一个CFS。CFS可以是DNA或RNA(或两种核苷酸类型的混合物)。在一个实例中,5CFS 208和/或3CFS 210是DNA。在一些实例中,可以在允许NPPF 202与杂交的RNA靶标200解离的条件下加热反应或改变pH(例如,以导致反应具有碱性pH),从而产生ssNPPF 202和ss靶核酸(例如,ssRNA靶标)200的混合群。在一些实例中,如图3的步骤4的第一步进行图3的步骤2CC,即不进行单独的变性步骤,而是如第二扩增反应中的第一步将ds NPPF/RNA靶标/CFS复合体212解离成ss核酸分子。
如图3的的步骤3所示,将在步骤2CC之后获得的含有ssNPPF 202(或在图3的步骤2BB之后获得的ds NPPF/RNA靶标/CFS复合体212)的混合物,和在步骤2B之后获得的含有FAR(其是双链的)236的混合物组合成单一的混合物。如图3的步骤4所示,在测序之前,所得混合物经受核酸扩增条件(例如,使用PCR)以产生扩增子。因此,FAR和ssNPPF(或RNA dsNPPF/RNA靶标/CFS复合体212)替代物在同一反应中扩增,产生扩增子,然后可以对其进行测序。图4箭头所示为示例性PCR引物或探针,可用于步骤4所示的扩增反应。PCR引物或探针可以包括一种或更多种实验标签222、224、242、244(例如,允许识别样品或患者)和/或测序接头218、220、248、240(例如,允许靶标由特定测序平台测序,因此,此类接头与例如测序芯片或流动池上的捕获序列互补)。PCR引物/探针的至少一部分对侧翼序列204、206(并且在一些实例中还有238、239)具有特异性。在一些实例中,引物的浓度超过ssNPPF 200和/或FAR 236,例如,超过至少10,000倍、至少50,000倍、至少100,000倍、至少150,000倍、至少200,000倍、至少400,000倍、至少500,000倍、至少600,000倍、至少800,000倍、或至少1,000,000倍。在一些实例中,反应中引物208的浓度为至少200nM(诸如至少400nM、至少500nM、至少600nM、至少750nM或至少1000nM)。
在图3的步骤4中,可以对步骤3中产生的扩增子进行测序。在一些实例中,多个FAR扩增子和NPPF扩增子并行测序,例如同时或同步进行。因此,该方法可用于对多个靶核酸序列进行测序。
A.示例性杂交条件
本文公开了足以(1)使扩增引物与其互补核酸分子(例如,与裂解样品中DNA靶分子、FAR和ssNPPF)特异性杂交,和(2)一种或多种NPPF与靶RNA分子(此类RNA存在于裂解样品的至少一部分中)特异性杂交,以及与与侧翼序列互补的CFS特异性杂交的条件。在一些实例中,多种NPPF包括至少2种、至少5种、至少10种、至少20种、至少100种、至少500种、至少1000种、至少3000种、至少10,000种、至少15,000种、至少20,000种、至少25,000种、至少30,000种、至少35,000种、至少40,000种、至少45,000种、或至少50,000种(诸如2至5000种、2至3000种、10至1000种、50至500种、25至300种、50至300种、10至100种、50至100种、500至1000种、1000至5000种、2000至10,000种、100至50,000种、100至40,000种、100至30,000种、100至20,000种、100至10,000种、10至50,000种、10至40,000种、10至30,000种、10至20,000种、10至10,000种、或30,000至40,000种)唯一的NPPF序列。
杂交是互补的单链DNA、RNA或DNA/RNA杂合体形成双链体分子(也称为杂交复合体)的能力。例如,可以基于本公开确定使核酸(例如,NPPF)能够在选定的严格性条件下与另一种核酸(例如,靶RNA或CFS)杂交同时最小化与其他物质或分子的非特异性杂交的特征(诸如长度、碱基组成和互补程度)。“特异性杂交”和“特异性互补”是表示足够程度的互补性的术语,使得在第一核酸分子(例如,NPPF或引物)和第二核酸分子(诸如核酸靶标,例如,DNA或RNA靶标,或CFS)之间发生稳定且特异的结合。第一和第二核酸分子不需要100%互补即可特异性杂交。特异性杂交在本文中也称为“特异性结合”。导致特定严格程度的杂交条件将根据杂交方法的性质以及杂交核酸序列的组成和长度而变化。通常,杂交温度和杂交缓冲液的离子强度(诸如Na+浓度)将决定杂交的严格程度。关于获得特定严格度的杂交条件的计算在Sambrook et al.,(1989)Molecular Cloning,second edition,Cold SpringHarbor Laboratory,Plainview,NY(chapters 9and 11)中讨论。
NPPF的特性在下文第III节进行更详细的讨论。通常,NPPF的区域将具有与其相应的靶RNA分子具有足够互补性以使其能够在选定的严格杂交条件下杂交的核酸序列(例如,图1A,102),以及与其对应的CFS具有足够互补性以使其能够在选定的严格杂交条件下杂交的区域(例如,图1A,104、106)。在一些实例中,NPPF与其靶RNA序列具有至少90%、至少92%、至少95%、至少98%、至少99%或100%的互补性。示例性杂交条件包括在约37℃或更高(诸如约37℃、42℃、50℃、55℃、60℃、65℃、70℃、75℃或更高,诸如45-55℃或48-52℃)温度杂交。可以改变的杂交反应参数包括盐浓度、缓冲液、pH、温度、孵育时间、变性剂(诸如甲酰胺)的量和类型。例如,可以将核酸(例如,多种NPPF)以在缓冲液(诸如含有NaCl、KCl、H2PO4、EDTA、0.05%Triton X-100或其组合的缓冲液)诸如裂解缓冲液中约10pM至约10nM(诸如约30pM至5nM、约100pM至约1nM,诸如1nM NPPF)范围的浓度加入样品的至少一部分。
在一些实例中,在样品的至少一部分中添加的NPPF超过相应的靶RNA分子,诸如相对于样品的至少一部分中的相应靶RNA分子,至少10倍、至少50倍、至少75倍、至少100倍、至少250倍、至少1,000倍、至少10,000倍、至少100,000倍、至少1,000,000倍、或至少10,000,000倍摩尔过量或更多的NPPF。在一个实例中,将每种NPPF以至少10pM,诸如至少20pM、至少30pM、至少50pM、至少100pM、至少100pM、至少150pM、至少200pM、至少500pM、至少1nM、或至少10nM的终浓度加入样品的至少一部分中。在一个实例中,将每种NPPF以约125pM的终浓度加入样品的至少一部分中。在另一个实例中,将每种NPPF以约167pM的终浓度加入样品的至少一部分中。在另一个实例中,将每种NPPF以约1nM的终浓度加入样品的至少一部分中。在另一个实例中,将每种NPPF以至少约100,000,000、至少300,000,000、或至少约3,000,000,000个拷贝/μl加入样品的至少一部分中。在一些实例中,CFS以超过NPPF的量添加,诸如相对于NPPF,至少2倍、至少3倍、至少4倍、至少5倍、或至少10倍摩尔过量的CFS。在一个实例中,将每种CFS以探针量的约至少6倍,诸如探针量的至少10倍或至少20倍(诸如探针量的6至20倍)的终浓度加入样品的至少一部分中。在一个实例中,将每种CFS(例如,5CFS和3CFS)以至少1nM、至少5nM、至少10nM、至少50nM、至少100nM、或至少200nm(诸如1至100、5至100或5至50nM)添加。例如,如有六种探针,每种探针为166pM,则每种CFS可以5至50nM添加。
在与NPPF和CFS杂交之前,样品的至少一部分中的核酸被变性,使它们成为单链并可用于杂交(例如在约85℃至约105℃下约5-15分钟,例如85℃持续10分钟)。通过使用不同的变性溶液,可以修改该变性温度,只要温度和缓冲液组成的组合导致形成单链靶DNA或RNA或两者。
在用于获得样品中存在的RNA替代物的NPPF的部分裂解样品中,裂解样品的至少一部分中的核酸以及5CFS、3CFS或两者与多种NPPF在约4℃至约70℃范围(例如,约37℃至约65℃、约42℃至约60℃、或约50℃至约60℃,诸如50℃)的温度下杂交持续约10分钟至约72小时(例如,至少约1小时至48小时、约2至16小时、约6小时至24小时、约12小时至18小时、约16小时、或过夜,诸如2至20小时)。在一个实例中,杂交在50℃下进行2至20小时。杂交条件将根据所使用的特定NPPF和CFS而变化,但设置为确保NPPF与靶RNA分子和CFS杂交。在一些实例中,在至少约37℃、至少约40℃、至少约45℃、至少约50℃、至少约55℃、至少约60℃、至少约65℃、或至少约70℃的温度下,多种NPPF和CFS与裂解样品的至少一部分孵育。在一个实例中,在约37℃、约42℃或约50℃下,多种NPPF和CFS与样品孵育。
在一些实施方式中,该方法不包括核酸纯化(例如,在样品裂解之前或之后不进行核酸纯化,诸如在使裂解样品的一部分与NPPF和CFS或与用于靶DNA扩增的核酸引物接触之前不进行,和/或在使样品与NPPF和CFS或与用于靶DNA扩增的核酸引物接触之后不进行核酸纯化)。在一些实例中,除了细胞裂解外,不需要对样品进行预处理。在一些实例中,细胞裂解和使样品与(1)引物接触以扩增靶DNA或与(2)多种NPPF和CFS接触依次发生。
B.核酸酶处理
如图3的步骤2BB所示,在NPPF与靶RNA和CFS杂交之后,裂解样品的至少一部分经受核酸酶保护程序。与NPPF杂交的靶RNA分子和CFS(一种或两种CFS,取决于NPPF上是否有5'-和3'-侧翼序列或仅有一者)不会被核酸酶水解,随后可以被扩增和/或测序。
核酸酶是裂解磷酸二酯键的酶。核酸内切酶切割核苷酸链中的内部磷酸二酯键(与核酸外切酶切割核苷酸链末端的磷酸二酯键相反)。因此,核酸内切酶、核酸外切酶及其组合可用于所公开的方法中。核酸内切酶包括限制性核酸内切酶或其他位点特异性核酸内切酶(在序列特异性位点处切割DNA)、DNase I、胰腺RNAse、Bal 31核酸酶、S1核酸酶、绿豆核酸酶、核糖核酸酶A、核糖核酸酶T1、RNase I、RNase PhyM、RNase U2、RNase CLB、微球菌核酸酶和无嘌呤/无嘧啶核酸内切酶。核酸外切酶包括核酸外切酶III和核酸外切酶VII。在特定实例中,核酸酶对单链核酸具有特异性,诸如S1核酸酶、P1核酸酶、绿豆核酸酶或BAL31核酸酶。这些酶的反应条件是已知的并且可以根据经验进行优化。
用一种或更多种核酸酶处理可以破坏所有ss核酸分子(包括未与NPPF杂交(因此不受保护)的裂解样品中的RNA和DNA、未与靶RNA杂交的NPPF、以及未与NPPF杂交的CFS),但不破坏ds核酸分子,诸如存在于至少一部分裂解样品中已与CFS以及靶核酸分子杂交的NPPF。例如,非期望的核酸,诸如一种或更多种非靶DNA(诸如基因组DNA、cDNA)和非靶RNA(例如,非靶标、tRNA、rRNA、mRNA、miRNA),以及未与互补NPPF序列(诸如突出端)杂交的靶RNA分子部分,在mRNA靶标的情况下,其将构成大部分核酸靶序列,可以在该步骤中基本上被破坏。在一些实施方式中,该步骤留下约化学计量量的靶RNA/CFS/NPPF双链体。如果靶RNA分子在固定后与组织交联,则NPPF与交联的靶RNA分子杂交,在一些实施方式中,无需逆转交联,或以其他方式从与其交联的组织中释放靶核酸。
在一些实例中,将在缓冲液(诸如含有乙酸钠、NaCl、KCl、ZnSO4、抗微生物剂(诸如ProClinTM杀生物剂)或其组合的缓冲液)中稀释的S1核酸酶加入杂交的NPPF/靶RNA/CFS样品混合物并在约37℃至约60℃(诸如约50℃)下孵育10-120分钟(例如,10-30分钟、30至60分钟、60-90分钟、90分钟、或120分钟)以消化来自裂解样品的至少一部分的非杂交核酸以及非杂交NPPF、RNA和CFS。在一个实例中,核酸酶消化通过在核酸酶缓冲液中将至少一部分裂解样品与核酸酶在50℃下孵育60至90分钟来进行。
在核酸酶消化之后,可以任选地处理裂解样品的该至少一部分以灭活或去除残留的酶(例如,通过苯酚提取、沉淀、柱过滤、添加蛋白酶K、添加核酸酶抑制剂、螯合核酸酶活性所需的二价阳离子、加热或其组合)。在一些实施例中,对裂解样品的至少一部分进行处理以将pH调节至约7至约8,例如,通过加入KOH或NaOH或缓冲液(诸如含有pH 9的Tris-HCl或pH 8的Tris–HCl)。提高pH值可以防止DNA脱嘌呤并阻止许多ss特异性核酸酶(例如,S1)充分发挥作用。在一些实例中,裂解样品的该至少一部分被加热(例如80-100℃)以使核酸酶失活,例如持续10-30分钟。
C.从靶核酸中分离ssNPPF
如图3的步骤2CC所示,在对含有双链NPPF/靶RNA/CFS复合体的裂解样品的至少一部分进行核酸酶处理后,将NPPF与ss核酸靶标和CFS分离(例如,变性)。因此,双链NPPF/靶RNA/CFS复合体可以分离成单链核酸分子、ssNPPF和ss靶核酸(例如,ssRNA)(以及ss CFS)。
在一些实例中,按照图3的步骤4的第一步进行图3的步骤2CC。例如,代替进行单独的变性/分离步骤,将ds NPPF/RNA靶标/CFS复合体212解离成ss核酸分子作为第二扩增反应的第一步(例如,图3的步骤4的第一步)。
D.核酸扩增
如图3所示,该方法包括两个核酸扩增步骤,使用诸如聚合酶链反应(PCR)或其他形式的酶促扩增的方法。第一扩增扩增部分裂解样品中的靶DNA(步骤2B)。第二扩增扩增第一扩增产生的FAR以及杂交、核酸酶消化和变性后获得的ss NPPF(步骤4)。
在一些实例中,在每个扩增步骤进行不超过30个扩增循环,诸如不超过25个扩增循环、不超过20个扩增循环、不超过15个扩增循环、不超过10个扩增循环、扩增不超过8个循环、或扩增不超过5个循环,诸如每个扩增步骤进行扩增2至30个循环、5至30个循环、8至30个循环、8至25个循环、2至25个循环、5至25个循环、5至20个循环、5至15个循环、或5至10个循环。
在第一扩增步骤(靶DNA扩增)期间,使用所需的最少扩增循环数,以减少扩增过程中引入的错误数量。在一些实例中,在第一扩增中进行5至20个扩增循环,诸如5至15个循环,诸如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个循环。在一些实例中,在第一扩增中进行10个扩增循环。在一些实例中,第一扩增步骤中使用的引物具有约50-62℃的Tm。在一些实例中,第一扩增反应中使用的退火温度为至少50℃、至少56℃、或至少58℃,诸如约50℃至60℃,诸如约56℃至60℃,诸如约52℃至58℃,诸如56℃、57℃或58℃。在一些实例中,从第一扩增步骤产生的FAR为约70至200bp,诸如70至150、70至125、90至150bp,诸如约70bp、约100bp或约140bp。
在一些实例中,在第二扩增步骤(FAR和ssNPPF扩增)期间,在第二扩增中进行8至30个扩增循环,诸如15至25或8至25个循环,诸如8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个循环。在一些实例中,在第二扩增中进行19个扩增循环。在一些实例中,用于第二扩增步骤的引物具有约50-62℃的Tm。在一些实例中,第二扩增反应中使用的退火温度为至少50℃、至少56℃、或至少56℃,诸如约50℃至60℃,诸如约52℃至58℃,诸如56℃。在一些实例中,由第二扩增步骤产生的FA扩增子为约150至250bp,诸如150至200bp,诸如约180bp。在一些实例中,从第二扩增步骤产生的NPPF扩增子为约150至250bp,诸如150至200bp,诸如约155bp或180bp。
在一些实例中,退火至其靶标的扩增引物的部分为约15-25nt(诸如22nt),具有约50%的GC含量。在一些实例中,扩增引物的长度为约50至100nt(诸如60至100nt)。
可以使用的核酸扩增方法包括导致核酸分子诸如靶DNA(或其扩增子)、靶RNA替代物(即,间接通过ssNPPF的扩增)、和/或其一部分的拷贝数增加的那些方法。产生的产物称为扩增产物或扩增子。通常,此类方法包括在允许引物与核酸分子杂交的条件下,将待扩增材料(例如,靶DNA(或其扩增子)或ssNPPF)与一个或一对寡核苷酸引物接触以被扩增。引物在合适的条件下延伸,从模板上解离,然后再退火、延伸、解离以扩增核酸分子的拷贝数。
可以使用的体外扩增方法的实例包括但不限于PCR、定量实时PCR、等温扩增方法、链置换扩增;无转录等温扩增;修复链式反应扩增;和NASBATMRNA无转录扩增。在一个实例中,引物与NPPF侧翼序列的至少一部分特异性杂交。在一个实例中,使用解旋酶依赖性扩增。
在FAR和ssNPPF的第二扩增过程中,可以将实验标签和/或测序接头作为例如引物的一部分掺入(见图4)。但是,添加此类标签/接头是任选的。例如,包括与全部或部分5'-或3'-侧翼序列(例如,图3的238、239、204、206)互补的第一部分的扩增引物可以包括与期望实验标签和/或测序接头互补的第二部分。本领域技术人员将理解,可以将实验标签和/或测序接头的不同组合添加至FAR或ssNPPF的任一末端。
在一个实例中,裂解样品中的DNA使用第一引物以及第二引物扩增,该第一引物包括与全部或部分靶DNA序列互补的第一部分和互补于(或包含)期望的侧翼序列(例如,与NPPF的5'-侧翼序列互补)的第二部分,该第二引物包括与全部或部分靶DNA序列互补的第一部分和互补于(或包含)期望的侧翼序列(例如,与NPPF的5'-侧翼序列互补)的第二部分(见图3,步骤2A),使得侧翼序列238、239被掺入所得扩增子中(见图3,步骤2B)。在一个实例中,使用两种不同的侧翼序列。
在一个实例中,使用第一扩增引物和第二扩增引物扩增FAR和ssNPPF,该第一扩增引物包括与全部或部分5'侧翼序列互补的第一部分和互补于(或包含)期望的测序接头的第二部分,该第二扩增引物包括与全部或部分3'侧翼序列互补的第一部分和互补于(或包含)期望的实验标签的第二部分(例如,见图4)。在一个实例中,使用两种不同的测序接头和两种不同的实验标签。在一些实例中,使用两种不同的测序接头和一种实验标签。在另一个实例中,使用第一扩增引物和第二扩增引物扩增FAR和ssNPPF,该第一扩增引物包括与5'侧翼序列相同(或互补)的第一部分的全部或一部分以及互补于(或包含)期望的测序接头和期望的实验标签的第二部分,第二扩增引物包括与全部或部分3'侧翼序列互补的第一部分和互补于(或包含)期望的实验标签的第二部分。
扩增还可用于将可检测标签引入产生的靶核酸扩增子(例如,如果需要另外标记)或允许检测或猝灭的其他分子。例如,扩增引物可以包括在扩增过程中掺入靶核酸扩增子中的可检测标记、半抗原或猝灭剂。这种标签、半抗原或猝灭剂可以在靶标扩增子的任一端(或两端)或中间的任何地方引入。
在一些实例中,所得FAR扩增子和NPPF扩增子在测序前被纯化。例如,可以在测序前使用本领域已知的方法(例如,凝胶纯化、生物素/抗生物素蛋白捕获和释放、毛细管电泳、尺寸排阻纯化、与顺磁珠结合和释放(固相可逆固定))纯化扩增反应混合物。在一个实例中,FAR扩增子和NPPF扩增子被生物素化(或包括另一种半抗原)并捕获到亲和素或抗半抗原包被的微珠或表面上,洗涤,然后释放用于测序。同样,FAR扩增子和NPPF扩增子可以被捕获到互补的寡核苷酸(诸如结合到表面的寡核苷酸)上,洗涤,然后释放用于测序。扩增子的捕获不需要特别具体,因为公开的方法消除了大部分基因组或转录组,留下期望的扩增子。如有需要,可以使用其他方法来纯化FAR扩增子和NPPF扩增子。
FAR扩增子和NPPF扩增子还可以在扩增的最后一步后、仍是双链时纯化,通过使用水解单链寡核苷酸的核酸酶(诸如核酸外切酶I)的方法,该核酸酶可以在继续下一步(诸如测序)之前被灭活。
1.引物
可以使用与侧翼序列(例如,NPPF和FAR的5'和/或3'侧翼序列)特异性结合或杂交的扩增引物,以及那些对靶DNA具有特异性的引物启动扩增,诸如PCR扩增。因此,与侧翼序列具有序列互补性的引物可以通过核酸杂交退火至NPPF以在引物和替代NPPF的侧翼序列之间形成杂交体,然后引物通过聚合酶沿互补链延伸。类似地,与靶DNA具有序列互补性的引物可以通过核酸杂交退火至靶DNA,形成引物和靶DNA的杂交体,然后通过聚合酶使引物沿互补链延伸。
此外,扩增引物可用于将核酸标记物(诸如一种或更多种实验标签和/或测序接头)和/或可检测标签引入所得靶核酸扩增子。
引物是短核酸分子,诸如长度为至少12个核苷酸(诸如约15、20、25、30、50、60、61、62、63、64、65、66、67、68、69、70、75或80个核苷酸或更多个,诸如15至25nt、50至80nt、60-70nt或60-66nt)的DNA寡核苷酸。
对于第一扩增,在一些实例中的引物包括与靶DNA具有互补性的约15-25nt的区域,以及在一末端上的另外25nt延伸序列(例如,与NPPF的5'-或3'-侧翼序列互补)。
对于第二扩增,一些实例中的引物包括与NPPF或FAR的5'-或3'-侧翼序列具有互补性的约15-25nt的区域,以及具有允许将序列接头、实验标签或两者添加至所得扩增子中的核酸分子的区域。它还可以包括具有核酸序列的区域,该区域导致向所得扩增子添加可检测标签。可以在扩增子的5'-和/或3'端引入实验标签和/或测序接头。在一些实例中,两种或更多种实验标签和/或测序接头被添加至扩增子的一端或两端,例如使用具有导致添加两种或更多种实验标签和/或测序接头的核酸序列的单个引物。例如,可以使用实验标签来区分一个样品或序列。序列接头允许通过特定的测序平台捕获产生的扩增子。
2.添加实验标签
实验标签是短序列或修饰的碱基,用作一种或数种反应的标识符,由例如:患者、样品、细胞类型、时程时间点或治疗的独立区分。实验标签可以是NPPF和FAR的侧翼序列的一部分。在另一个实例中,在扩增(例如,FAR和ssNPPF的扩增)过程中添加实验标签,导致扩增子(例如,FAR扩增子和NPPF扩增子)含有实验标签。侧翼序列中通用序列的存在允许使用通用引物,其可以例如在扩增过程中将其他序列引入到NPPF扩增子上。实验标签也可用于扩增,诸如嵌套扩增或两阶段扩增。示例性实验标签在表3-5中提供。
实验标签,诸如区分一个样品与另一个样品的标签,可用于识别特定靶序列。因此,实验标签可用于区分实验或患者。在一个实例中,实验标签是所得扩增子的5'端和/或3'端的前三个、五个、十个、二十个或三十个核苷酸。在一些实例中,将实验标签置于测序引物位点附近。对于
Figure BDA0003234235430000251
测序,实验标签紧邻Read 1和Read 2引物位点。对于一些测序平台,实验标签通常是前数个碱基读数。在特定实例中,实验标签的长度为至少3个核苷酸,诸如长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、或至少50个核苷酸,诸如3-50、3-20、12-50、6-8、8-10、6-12或12-30个核苷酸,例如,长度为3、4、5、6、7、8,9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。
在一个实例中,实验标签用于区分一个样品与另一个样品。例如,此类序列可以用作条形码,以允许将检测到的特定序列与特定样品、患者或实验(诸如特定反应孔、天或一组反应条件)相关联。这允许被测序的特定靶核酸扩增子与例如特定患者或样品或实验相关联。此类标签的使用提供了一种降低每个样品成本并提高样品通量的方法,因为可以标记多种靶核酸扩增子,然后进行组合(例如,来自不同的实验或患者),例如,在单次测序运行或检测阵列中。这使得能够在同一仪器通道或测序耗材(诸如流通池或半导体芯片)内将不同的实验或患者样品组合至一次运行中。例如,此类标签允许在单个流动池或芯片内的单次运行中对100或1,000个不同实验进行测序。此外,如果该方法包括对已完成的扩增反应进行凝胶纯化的步骤(或其他不需要实际分离的纯化或净化方法),则每次检测或测序运行仅需运行一个凝胶(或净化或纯化反应或过程)。类似地,如果测序需要定量步骤,则可以在测序前对单个样品或仅样品池进行定量。然后可以将测序的靶核酸扩增子分类,例如,通过实验标签。
在一个实例中,实验标签用于识别特定靶序列。在这种情况下,使用与特定靶序列对应的实验标签可以缩短所需的测序时间或数量,因为对靶核酸扩增子的末端而不是整个靶核酸扩增子进行测序已足够。例如,如果此类实验标签存在于靶核酸扩增子的3'端,则整个靶核酸扩增子序列本身不必被测序以识别靶序列。相反,仅需要对含有实验标签的靶核酸扩增子的3'端进行测序。这可以显著减少测序时间和资源,因为需要测序的材料更少。
3.添加测序接头
测序接头可以但不必是NPPF和FAR产生时的侧翼序列的一部分。在另一个实例中,在核酸扩增(例如,FAR或ssNPPF的扩增)过程中添加测序接头,导致扩增子含有测序接头。侧翼序列中通用序列的存在允许使用通用扩增引物,其可以将其他序列引入NPPF替代物和FAR上,例如在扩增过程中。
可以使用测序接头将特定测序平台所需的序列添加至核酸(例如,FAR和替代物NPPF)。例如,一些测序平台(诸如454品牌(Roche)、Ion Torrent品牌和Illumina品牌)要求待测序的核酸分子在其5'端和/或3'端包括特定序列,例如,以捕获待测序的分子。例如,合适的测序接头被测序芯片或微珠上的互补序列识别,并且扩增子通过存在测序接头而被捕获。
在一个实例中,在第二PCR扩增过程中将poly-A(或poly-T),诸如长度为至少10个核苷酸的poly-A或poly-T添加至核酸(例如,FAR和ssNPPF)。在特定实例中,poly-A(或poly-T)被添加至FAR和ssNPPF的3'端。在一些实例中,使用端脱氧核苷酸转移酶(TdT)在这个添加的序列的3'端聚腺苷酸化。
在特定实例中,添加的测序接头长度为至少12个核苷酸(nt),诸如长度为至少15、至少20、至少25、至少30、至少40、至少50、至少60、或至少70nt,诸如长度为12-50、20-35、50-70、20-70或12-30nt。
E.对核酸扩增子测序
所得核酸扩增子(例如,用于靶DNA的FAR扩增子和用于靶RNA的替代物NPPF扩增子)例如通过测序扩增子或其一部分进行测序(诸如足以允许识别靶核酸分子或允许确定特定突变存在或不存在的量)。本公开不限于特定的测序方法。应当理解,核酸扩增子(例如,DNA扩增子)可以设计用于通过当前或将来已知的任何测序仪上的任何方法进行测序。靶核酸本身不限制所使用的测序方法,也不限制所使用的测序酶。其他测序方法正在或将被开发,本领域技术人员可以理解产生的核酸扩增子将适用于在这些系统上测序。在一些实例中,在单个反应中对多种不同的靶核酸扩增子进行测序。因此,多种靶核酸扩增子可以并行测序,例如,同时或同步进行。
可用于确定所得FAR扩增子和NPPF扩增子(诸如由DNA组成的扩增子)的序列的示例性测序方法包括但不限于链终止法、染料终止子测序和焦磷酸测序(诸如Biotage(用于低通量测序)和454 Life Sciences(用于高通量测序)商业化的方法)。在一些实例中,使用
Figure BDA0003234235430000271
(例如,NovaSeq、MiSeq)、Ion
Figure BDA0003234235430000272
Helicos、
Figure BDA0003234235430000273
(Applied
Figure BDA0003234235430000278
)或任何其他商业测序系统对扩增子进行测序。在一个实例中,测序方法使用桥式PCR(例如,
Figure BDA0003234235430000274
)。在一个实例中,使用
Figure BDA0003234235430000279
Figure BDA00032342354300002710
单分子测序方法。在一个实例中,使用二代测序仪(NGS),诸如来自
Figure BDA0003234235430000275
Genapsys或Thermo Fisher
Figure BDA00032342354300002711
的那些,例如,来自Thermo Fisher
Figure BDA00032342354300002712
Figure BDA0003234235430000276
S5、来自
Figure BDA00032342354300002713
的NovaSeq/NextSeq/MiSeq,或来自
Figure BDA00032342354300002714
的GSFLX
Figure BDA0003234235430000277
测序接头(诸如存在于FAR扩增子和NPPF扩增子上的特定序列或poly-A或poly T,例如,如使用PCR引入的)可用于捕获扩增子以在特定平台上进行测序。在一个实例中,使用纳米孔型测序仪。
尽管通过Ion
Figure BDA00032342354300002715
Figure BDA00032342354300002716
进行的测序通常涉及核酸制备,通过核酸的随机片段化,随后通过常见接头序列的体外连接来完成,但对于所公开的方法,待测序的核酸的随机片段化步骤可以消除,并且接头序列的体外连接被NPPF扩增子或FAR扩增子中存在的序列替代,诸如NPPF扩增子或FAR扩增子中存在的实验标签或者NPPF或FAR中存在的测序接头序列,或在扩增过程中添加至NPPF扩增子或FAR扩增子中。对于一些测序方法,测序引物在测序芯片/微珠扩增子上扩增后与扩增子杂交。
F.对照
在一些实例中,对照包括包括在与样品接触的多种NPPF中的“阳性对照”NPPF(例如,对应于已知存在于样品中的靶RNA,或对应于有意加入样品或杂交反应中的合成靶标)和相应CFS。例如,可以在与多种检测NPPF和相应CFS杂交之前或期间将相应阳性对照NPPF和相应CFS加入样品中。在一些实例中,对照包括包括在与样品接触的多种NPPF中的“阴性对照”NPPF(例如,已知样品中不存在的靶RNA)和相应CFS。例如,可以在与多种检测NPPF和相应CFS杂交之前或期间将相应阴性对照NPPF和相应CFS加入样品中。
在一些实例中,对照包括包括在与样品接触的多种NPPF中的“阳性对照”NPPF(例如,已知存在于样品中的靶RNA)和相应CFS。例如,可以在与多种检测NPPF和相应CFS杂交之前或期间将相应阳性对照NPPF和相应CFS加入样品中。在一些实例中,对照包括包括在与样品接触的多种NPPF中的“阴性对照”NPPF(例如,已知样品中不存在的靶RNA)和相应CFS。例如,可以在与多种检测NPPF和相应CFS杂交之前或期间将相应阴性对照NPPF和相应CFS加入样品中。
在一些实例中,对照包括包括在其中DNA被扩增的裂解样品的部分中的“阳性对照”DNA(例如,已知存在于样品中的靶DNA)和相应引物。例如,相应的阳性对照DNA和相应的引物可以在与靶DNA扩增引物杂交之前或期间加入样品中(例如,图3的步骤2A)。在一些实例中,对照包括包括在其中DNA被扩增的裂解样品的部分中的“阴性对照”DNA(例如,已知样品中不存在的靶DNA)。例如,可以在与靶DNA扩增引物杂交之前或期间将相应的阴性对照DNA和引物加入样品中(例如,图3的步骤2A)。
在一些实例中,该阳性对照是变量(诸如每个样品裂解的细胞数、RNA或DNA的回收率、杂交效率、或由扩增和测序引入的错误)的内部标准化对照。在一些实例中,阳性对照包括一种或更多种NPPF和对应的CFS,其特异于已知存在于样品中的RNA(例如可能存在于被测物种中的核酸序列,诸如一种或更多种基础水平或组成型管家RNA)。示例性DNA阳性对照靶标包括但不限于结构基因(例如,肌动蛋白、微管蛋白或其他)或DNA结合蛋白(例如,转录调节因子或其他),以及管家基因。
在一些实例中,阳性对照靶标包括一种或更多种NPPF和相应的CFS,其特异于来自3-磷酸甘油醛脱氢酶(GAPDH)、肽酰丙基异构酶A(PPIA)、大核糖体蛋白(RPLP0)、核糖体蛋白L19(RPL19)、SDHA(琥珀酸脱氢酶)、HPRT1(次黄嘌呤磷酸核糖转移酶1)、HBS1L(HBS1样蛋白)、β-肌动蛋白(ACTB)、5-氨基乙酰丙酸合酶1(ALAS1)、β-2微球蛋白(B2M)、α血红蛋白稳定蛋白(AHSP)、核糖体蛋白S13(RPS13)、核糖体蛋白S20(RPS20)、核糖体蛋白L27(RPL27)、核糖体蛋白L37(RPL37)、核糖体蛋白38(RPL38)、鸟氨酸脱羧酶抗酶1(OAZ1)、聚合酶(RNA)II(DNA定向)多肽A,220kDa(POLR2A)、硫氧还蛋白样1(TXNL1)、yes相关蛋白1(YAP1)、酯酶D(ESD)、蛋白酶体(前体、巨蛋白因子)26S亚基、ATPase,1(PSMC1)、真核翻译起始因子3、亚基A(EIF3A)或18S rRNA。在一些实例中,阳性对照靶标包括一种或更多种这些DNA分子(或其一部分)。在一些实例中,阳性对照靶标是重复DNA元件,诸如HSAT1、ACRO1和LTR3。在一些实例中,阳性对照靶标是单拷贝基因组DNA序列(假设是单倍体基因组)。
在一些实例中,阳性对照包括一种或更多种NPPF和相应的CFS,其互补物(complement)是掺入的(例如,添加的)的靶核酸分子(诸如一种或更多种体外转录的核酸、从无关样品分离的核酸、合成核酸诸如DNA或RNA寡核苷酸)),在多种NPPF和相应的CFS杂交之前或期间加入样品。在一个实例中,阳性对照NPPF和掺入物(spike ins)具有单核苷酸错配。在一个实例中,加入多种NPPF和掺入物,以已知浓度范围(诸如1pM、10pM和100pM)加入掺入物,以形成输入“梯度”并在最终测序输出中展示检测的动态范围。
在一些实例中,“阴性对照”包括一种或更多种NPPF和相应的CFS,其互补物已知在样品中不存在,例如作为杂交特异性的对照,诸如来自被测物种以外的物种的核酸序列,例如,当待分析人核酸时的植物核酸序列(例如,拟南芥AP2样乙烯反应性转录因子(ANT)),或自然界中未发现的核酸序列。在一些实例中,“阴性对照”包括一种或更多种已知不存在于样品中的DNA(和相应的引物),例如,来自除被测物种之外的物种的DNA,例如,当待分析人核酸时的植物核酸序列(例如,拟南芥AP2样乙烯反应性转录因子(ANT)),或自然界中未发现的核酸序列。
在一些实例中,对照用于确定方法中的特定步骤是否正常运行。在一些实例中,在最终测序结果中评估阳性或阴性对照。在一个此类实例中,该分析包括使用Taqman或其他可检测qPCR探针作为用于评估核酸酶的有效性的阴性对照探针。所有阴性对照NPPF均应通过核酸酶步骤去除,因此,如果阴性对照NPPF的量很高,则可能表明核酸酶保护未正确执行,样品可能受到损害。在另一个此类实例中,用于阴性对照探针的Taqman测定与整个捕获靶标量的同时测量定量组合(即,使用基于SYBR的qPCR方法)。
在一个实例中,在执行所公开的方法之前,将待分析的样品暴露于扩增条件(例如,qPCR),以确定样品是否具有足够量(和质量)的核酸分子。例如,可以使用扩增目标靶区域(诸如KRAS或BRAF)、管家RNA基因(诸如GAPDH)或重复DNA元件(诸如LTR3)的引物进行qPCR,以确定样品中可评估的核酸。在一个实例中,引物被设计成使得它们扩增接近靶区域大小的区域,以确定可用核酸是否大到足以被评估。在一个实例中,可接受的样品量和质量的范围是通过实验确定的,例如使用特定的样品类型(例如,肺或黑色素瘤样品)或形式(例如,福尔马林固定的组织或细胞系)。
III.带有侧翼序列的核酸酶保护探针(NPPF)
所公开的方法允许对同一样品中DNA和RNA进行测序,部分地通过使用RNA的替代物,即NPPF。NPPF扩增子和FAR扩增子可以同时或同步从同一混合物中进行测序。基于靶RNA,可以使用本文中阐述的标准并组合本领域技术人员的知识来设计NPPF以用于所公开的方法中。在一些实例中,所公开的方法包括产生一种或更多种用于检测特定靶RNA分子的合适NPPF。如果样品中存在此类靶RNA,则NPPF在多种条件下(已知或经验确定的)与靶RNA或其部分特异性结合(或能够特异性结合,例如,特异性杂交)。
图1A显示了具有区域102的示例性NPPF 100,该区域包括与靶核酸序列特异性结合或杂交的序列,以及分别位于NPPF的5'端和3'端的侧翼序列104、106,其中侧翼序列与其互补序列(本文称为CFS)结合或杂交。尽管显示了两个侧翼序列,但在一些实例中,NPPF仅有一个侧翼序列,诸如一个在5'端或一个在3'端。在一些实例中,NPPF包括两个侧翼序列:一个在5'端和另一个在3'端。在一些实例中,5'端的侧翼序列不同于3'端的侧翼序列。图1B显示了由两个单独的核酸分子128、130组成的NPPF 120的实施方式。在一个实例中,NPPF是100nt,每个侧翼序列104、106为25nt以及与靶核酸序列特异性结合或杂交的区域102为50nt。
NPPF(以及与NPPF结合的CFS)可以是任何核酸分子,诸如DNA或RNA分子,并且可以包括非天然碱基。因此,NPPF(以及与NPPF结合的CFS)可以由天然(诸如核糖核苷酸(RNA)或脱氧核糖核苷酸(DNA))或非天然核苷酸(诸如锁核酸(LNA,参见,例如,美国专利号6,794,499)、肽核酸(PNA))等组成。NPPF可以是单链或双链的。在一个实例中,NPPF和CFS是ssDNA。在一个实例中,NPPF是ss DNA,并且CFS是RNA(例如,并且靶标是RNA)。在一些实例中,NPPF(以及与NPPF结合的CFS)包括一种或更多种合成碱基或替代碱基(诸如肌苷)。修饰的核苷酸、非天然核苷酸、合成的或替代的核苷酸可用于NPPF中的一个或更多个位置(诸如1、2、3、4、5或更多个位置)。例如,NPPF和/或CFS可以包括一种或更多种含有修饰碱基和/或修饰磷酸骨架的核苷酸。在一些实例中,相对于不包括修饰的核酸的相同长度和组成的NPPF的Tm,在NPPF中使用一种或更多种修饰的或非天然核苷酸可以增加NPPF的Tm。本领域技术人员可以设计包括此类修饰核苷酸的探针以获得具有期望Tm的探针。在一个实例中,NPPF由DNA或RNA组成,诸如单链(ssDNA)或分支DNA(bDNA)。在一个实例中,NPPF是适体。
NPPF包括与一个或更多个与靶RNA分子互补的区域。在同一反应中使用的NPPF可以设计为具有相似的Tm。在一个实例中,至少一种NPPF存在于反应中,其对单个靶RNA序列具有特异性。在此类实例中,如果有2、3、4、5、6、7、8、9或10个不同的靶RNA序列使用NPPF作为替代物进行检测或测序,则该方法可以相应地使用至少2、3、4、5、6、7、8、9或10种不同的NPPF(其中每种NPPF对应于/具有足够的互补性以与特定的RNA靶标杂交)。因此,在一些实例中,该方法使用至少两种NPPF,其中每种NPPF对不同的靶RNA分子具有特异性。然而,人们将理解,可以为特定的靶RNA分子生成几种不同的NPPF,诸如单个靶RNA序列的许多不同区域。
然而,在一些实例中,反应中存在的单个NPPF对两种或更多种靶RNA序列(诸如野生型RNA序列和特定RNA的一种或更多种可变序列)具有特异性。因此,在一些实例中,反应中存在的单个NPPF特异于两种或更多种靶RNA序列(诸如野生型RNA序列和特定RNA的一种或更多种突变序列或一种或更多种不同的剪接亚型(诸如来自同一RNA的2-15种不同的转录本))。例如,如果有2、3、4、5、6、7、8、9、10、11、12、13、14或15种不同的RNA亚型,本领域技术人员将理解,NPPF可以被设计为仅与一种剪接同种型杂交,从而使NPPF在剪接点上或在该亚型特有的序列区域中杂交。
NPPF的组合可用于单个反应,诸如(1)一种或更多种NPPF,每种对单种靶RNA序列具有特异性(例如,互补性)(例如,仅与单种靶RNA分子充分杂交),和(2)一种或更多种NPPF,每种NPPF对单种靶RNA具有特异性(例如,互补性),但具有检测该RNA中多个变异的能力(例如,可以与靶RNA的两个或多个变异充分杂交,诸如野生型序列和至少一种剪接亚型,诸如野生型RNA序列的2、3、4、5、6、7、8、9、10、11、12、13、14或15种不同的转录本)。在一些实例中,反应包括(1)至少2种、至少3种、至少4种、至少5种、至少10种、至少15种、至少20种、至少25种、或至少30种不同的NPPF,每种对单个靶RNA序列具有特异性(例如,互补性),和(2)至少2种、至少3种、至少4种、至少5种、至少10种、至少15种、至少20种、至少25种、或至少30种不同的NPPF,每种对单个靶RNA具有特异性(例如,互补性),但能够检测该RNA中的多个变异。
因此,单个样品的至少一部分(诸如第二部分)可以与一种或更多种NPPF接触。一组NPPF是两种或更多种NPPF的集合,每种NPPF对(1)不同的靶RNA序列和/或同一靶RNA的不同部分具有特异性,或对(2)单种靶RNA具有特异性,但能够检测RNA序列的变异。一组NPPF可以包括至少、高达或恰好2、3、4、5、6、7、8、9、10、12、15、20、25、30、50、100、500、1000、2000、3000、5000、10,000、15,000、20,000、25,000、30,000、35,000、40,000或50,000种不同的NPPF。在一些实例中,样品的至少一部分(诸如第二部分)与足够量的NPPF接触,以超过此类NPPF的靶标,诸如100倍、500倍、1000倍、10,000倍、100,000倍或106倍过量。在一些实例中,如果使用一组NPPF,则该组中的每种NPPF可以在样品的至少一个部分(诸如第二部分)中提供超过其各自的一种或更多种靶标(或一种或更多种靶标的一部分)。过量的NPPF可以促进结合特定靶标的NPPF量的定量。一些方法实施方式涉及多个样品(例如,至少、高达或恰好10、25、50、75、100、500、1000、2000、3000、5000或10,000个不同的样品),其中至少有一个部分(诸如第二部分)同时或同步与相同的NPPF或一组NPPF接触。
根据经验确定用于特定靶标或样品(诸如经固定的或交联的样品)的NPPF的适当大小的方法是常规方法。在具体实施方式中,NPPF的长度可以是高达500个核苷酸,诸如长度高达400个、高达250个、高达100个、或高达75个核苷酸,包括,例如,长度范围为20至1500、20至1250、25至1200、25至1100、25-75、25至150、75至100、90至110、100至250、或125至200nt。在一个非限制性实例中,NPPF的长度为至少35nt,诸如长度为至少40、至少45、至少50、至少75、至少100、至少150、至少180、或至少200nt,诸如长度为50至200、50至150、50至100、75至200、40至80、35至150,或者36、72、75、100、125、150、100、160、170、180、190或200nt。在一个实例中,RNA靶标是mRNA并且NPPF是100nt。在一个实例中,RNA靶标是miRNA,并且NPPF是75nt。特定的NPPF实施方式可以更长或更短,这取决于期望的功能性。在一些实例中,NPPF的尺寸适当(例如,足够小)以渗透经固定的和/或交联的样品。经固定的或交联的样品的固定或交联程度可能不同;因此,普通技术人员可以确定特定样品条件或类型的合适NPPF大小,例如,通过使用具有已知、固定靶浓度的样品进行一系列实验并将NPPF大小与靶信号强度进行比较。在一些实例中,样品(以及,因此,至少部分靶标)是经固定的或交联的,并且NPPF足够小以使保持高信号强度并且基本上不随NPPF大小而变化。
影响NPPF靶标和NPPF-CFS杂交特异性的因素包括NPPF和CFS的长度、解链温度、自身互补性、以及重复或非唯一序列的存在。参见,例如,Sambrook et al.,MolecularCloning:A Laboratory Manual,3d ed.,Cold Spring Harbor Press,2001;Ausubel etal.,Current Protocols in Molecular Biology,Greene Publishing Associates,1992(and Supplements to 2000);Ausubel et al.,Short Protocols in MolecularBiology:A Compendium of Methods from Current Protocols in Molecular Biology,4th ed.,Wiley&Sons,1999。导致特定杂交程度(严格程度)的条件将根据杂交方法的性质以及杂交核酸序列的组成和长度而变化。通常,杂交温度和杂交缓冲液的离子强度(诸如Na+浓度)将决定杂交的严格程度。在一些实例中,所公开的方法中使用的NPPF具有至少约37℃、至少约42℃、至少约45℃、至少约50℃、至少约55℃、至少约60℃、至少约65℃、至少约70℃、至少约75℃、至少约80℃,诸如约42℃-80℃(例如,约37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80℃)的Tm。在一个非限制性实例中,公开的方法中使用的NPPF具有约42℃的Tm。计算探针的Tm的方法是本领域技术人员已知的(参见,例如,Sambrooket al.,Molecular Cloning:A Laboratory Manual,3d ed.,Cold Spring Harbor Press,2001,Chapter 10)。在一些实例中,选择特定反应的NPPF以使其各自具有相同或相似的Tm以促进样品中多种靶核酸分子的同时检测或测序,诸如彼此的Tms+/-约10℃,诸如彼此的+/-10℃、9℃、8℃、7℃、6℃、5℃、4℃、3℃、2℃或1℃。
A.与靶标杂交的区域
NPPF序列(图1所示)102(或122)的与靶RNA特异性杂交的部分在序列上与目标靶RNA序列互补。这种互补性可以被设计成使得NPP仅与单个靶RNA序列杂交或可以与多个靶RNA序列杂交,诸如野生型RNA及其变体。
本领域技术人员将理解,序列102(或122)不需要与整个靶RNA互补(例如,如果靶标是100,000个核苷酸的基因,则序列102(或122)可以是该基因的一部分,诸如至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少100个、或更多个与特定靶RNA分子互补的连续核苷酸)。探针的特异性随长度增加。因此,例如,与包括25个连续核糖核苷酸的靶RNA序列特异性结合的序列102(或122)将以比仅15个核糖核苷酸的相应序列更高的特异性退火至靶序列。因此,本文公开的NPPF可以具有与靶RNA序列特异性结合的序列102(或122),其包括至少6个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少100个、或更多个与特定靶RNA分子互补的连续核苷酸(诸如约6至50个、6至60个、10至40个、10至60个、15至30个、15至27个、16至27个、16至50个、15至50个、18至23个、19至22个、或20至25个与靶RNA互补的连续核苷酸)。
与靶RNA序列特异性结合的序列102(或122)的特定长度可以是用于实践本公开内容的方法的NPPF的一部分,包括6、7、8、9、10、11、12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,736、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个与靶RNA分子互补的连续核苷酸。在一个实例中,与靶RNA特异性结合的序列102(或122)的长度为50nt。在靶RNA分子是miRNA(或siRNA)的一些实例中,与靶RNA序列特异性结合的序列102(或122)的长度可以更短,诸如长度为16至27个核苷酸(诸如16、17、18、19、20、21、22、23、24、25、26或27nt)以匹配miRNA(或siRNA)长度。然而,本领域技术人员将理解与靶RNA特异性结合的序列102(或122)不需要与靶RNA分子100%互补。在一些实例中,与靶标和靶RNA互补的NPPF区域共享至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的互补性,但其中任何错配均可以在核酸酶的消化中继续存在。
B.侧翼序列
侧翼序列104、106(或124、126)的序列提供了CFS可以特异性杂交的互补序列(类似地,图3中的侧翼序列238、239的序列具有互补序列,第二扩增步骤中的扩增引物可与该序列杂交)。因此,每个侧翼序列104、106(或124、126)与CFS的至少一部分互补(例如,5'-侧翼序列与5CFS互补并且3'-侧翼序列与3CFS互补)。侧翼序列与也在样品中发现的序列不相似(例如,未在人类基因组中发现)。因此,侧翼序列包括未在也存在于样品中的核酸分子中发现的连续核苷酸序列。例如,如果靶核酸是人序列,则侧翼序列的序列与在靶标(例如,人)基因组中发现的序列不相似。这有助于减少可能存在于靶基因组中的非靶序列与NPPF的非特异性结合(或交叉反应)。分析序列与基因组相似性的方法是已知的。
NPPF可以包括一个或两个侧翼序列(例如,一个在5'端,一个在3'端,或两者),并且侧翼序列可以相同或不同。在具体实例中,每个侧翼序列不与任何其他NPPF序列(例如,序列102、122或其他侧翼序列)或样品的任何组分特异性结合。在一些实例中,如果存在两个侧翼序列,则每个侧翼序列104、106(或124、126)的序列不同。如果存在两个不同的侧翼序列(例如,同一NPPF上的两个不同侧翼序列和/或一组NPPF中其他NPP的侧翼序列),则在一些实例中每个侧翼序列104、106(或124、126)具有相似解链温度(Tm),诸如彼此的Tm+/-约10℃或+/-5℃,诸如+/-4℃、3℃、2℃或1℃。
在一个实例中,NPPF的侧翼序列104、106(或124、126)部分包括至少一个核苷酸错配。即,至少一个核苷酸与其在CFS中的相应核苷酸不互补,因此不会在该位置形成碱基对。
NPPF(和FAR)的侧翼序列可以提供通用扩增点,该扩增点与图3的步骤4中使用的扩增引物的至少一部分互补。因此,侧翼序列允许使用相同的扩增引物来扩增特异于不同靶RNA分子的替代NPPF并扩增靶DNA分子的FAR。因此,侧翼序列的至少一部分序列可以与用于第二扩增反应的扩增引物的至少一部分互补。如图4所示,这允许引物与侧翼序列杂交,并扩增靶RNA的ssNPPF和靶DNA的FAR。由于侧翼序列在NPPF(和FAR)之间可以具有同一性,而特异于不同靶核酸分子的区域有所不同,这允许在相同的反应中使用相同的引物扩增(1)针对不同RNA靶标的任意数量的不同ssNPPF和(2)针对不同DNA靶标的任意数量的不同FAR(例如,共同扩增不同的ssNPPF和不同的FAR)。因此,包括与5'侧翼序列互补的序列的扩增引物和包括与3'侧翼序列互补的序列的扩增引物均可用于单个反应以扩增NPPF和FAR,即使NPPF靶向RNA序列不同且FAR靶向DNA序列不同。
在一些实例中,侧翼序列不包括实验标签序列和/或测序接头序列。在一些实例中,侧翼序列包括实验标签序列和/或测序接头序列或由其组成。在其他实例中,用于扩增ssNPPF和FAR(其包括至少一个侧翼序列)的引物包括实验标签序列和/或测序接头序列(诸如一些测序平台所需的poly-A或poly-T序列),因此,允许在NPPF扩增过程中将实验标签和/或测序接头掺入NPPF扩增子和FAR扩增子中(图3中的步骤4)。实验标签和测序接头在上文第II节D中进行了描述。人们将意识到可以包括多于一种实验标签(诸如至少2种、至少3种、至少4种、或至少5种不同的实验标签),诸如用于唯一识别靶DNA或RNA或识别样品的那些。
在特定实例中,NPPF(或FAR)的侧翼序列104、106(或124、126)部分的长度为至少12个核苷酸,或长度为至少25个核苷酸,诸如长度为至少15个、至少20个、至少25个、至少30个、至少40个、或至少50个核苷酸,诸如12至50个、12至25个、或12至30个核苷酸,例如,长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸,其中在待测样品中存在的核酸分子中未发现连续核苷酸。在一个实例中,NPPF(或FAR)的侧翼序列104、106(或124、126)部分的长度为25nt。通过将分子与具有与侧翼序列(CFS)互补的序列的侧翼序列杂交来保护侧翼序列免于被核酸酶降解。
IV.互补侧翼序列(CFS)
每个CFS(例如,图3的208或210)与其对应的NPPF的侧翼序列互补。该方法可以使用至少一个CFS。例如,该方法可以使用单个CFS(NPPF具有一个侧翼序列)或两个CFS(NPPF具有两个侧翼序列),一个在靶RNA的5'端,另一个在其3'端。例如,如果NPPF包括5'-侧翼序列,则方法中将使用5CFS。如果NPPF包括3'-侧翼序列,则该方法中将使用3CFS。如果5'-和3'-侧翼序列彼此不同,则5CFS和3CFS将彼此不同。本领域技术人员将理解,CFS和NPPF的侧翼序列不需要是100%互补的(即不需要具有100%互补性),只要NPPF与其RNA靶标和相应的CFS之间可以发生杂交即可。在一些实例中,NPPF和CFS的侧翼序列共享至少80%、至少90%、至少95%、至少98%、至少99%或100%的互补性。在一些实例中,CFS的长度与其相应的NPPF侧翼序列的长度相同。例如,如果侧翼序列是25nt,则CFS可以是25nt。
在一些实例中,CFS与在靶基因组中发现的序列不相似。例如,如果靶RNA是人序列,则CFS的序列(和相应的侧翼序列)与在靶基因组中发现的RNA序列不相似。这有助于减少可能存在于靶基因组中的非靶序列与CFS(和NPPF)的结合。分析序列与基因组相似性的方法是已知的。
V.样品
样品是包含一种或更多种个靶标的任何集合,诸如生物样品或生物标本,诸如从受试者(诸如人或其他哺乳动物受试者,诸如兽医受试者,例如已知或疑似患有肿瘤或感染的受试者)获得的那些。可以使用本领域普通技术人员已知的方法收集或获得样品。在公开的方法中使用的样品可以包括包括核酸(诸如基因组DNA、cDNA、病毒DNA或RNA、rRNA、tRNA、mRNA、miRNA、寡核苷酸、核酸片段、修饰的核酸、合成核酸等)的任何样本。在一个实例中,样品包括RNA和DNA。在一些实例中,待测序的靶核酸分子在样品中是交联的(诸如交联的DNA、mRNA、miRNA或vRNA)或在样品中是可溶的。在一些实例中,样品是经固定的样品,诸如包括引起靶分子交联的试剂的样品(因此在一些实例中靶核酸分子可以是经固定的)。在一些实例中,在检测或测序靶核酸分子(或其替代物)之前,样品中的靶核酸未经提取、溶解或两者。在一些实例中,样品是异位(ex situ)生物样品。
在一些实例中,所公开的方法包括在分析样品之前获得样品。在一些实例中,所公开的方法包括选择患有特定疾病或肿瘤的受试者,然后在一些实例中进一步选择一种或更多种靶DNA和一种或更多种RNA以基于受试者的特定疾病或肿瘤进行检测,例如,以确定受试者的诊断或预后或用于选择一种或更多种疗法。在一些实例中,首先从样品中分离、提取、浓缩或以其组合处理待分析样品中的核酸分子。在一些实例中,待分析样品中核酸分子在其分析之前未从样品中分离、提取、浓缩或以其组合处理。
在一些实例中,提及“a”或“the”样品是指一个单个或个体样品,诸如来自FFPE组织块的一个薄片或切片。在一些实例中,使用所公开的方法分析的单个或个体样品具有少于250,000个细胞(例如少于100,000、少于50,000、少于10,000、少于1,000、少于500、少于200、少于100个细胞,或少于10个细胞,诸如1至250,000个细胞、1至100,000个细胞、1至10,000个细胞、1至1000个细胞、1至100个细胞、1至50个细胞、1至25个细胞,或约1个细胞)。在一些实例中,使用所公开的方法同时(但在一些实例中单独地)分析两个或更多个单个或个体样品,例如其中每个单个或个体样品不同,例如来自不同的受试者、来自不同的组织、或来自同一组织的不同部分。
在一些实例中,裂解样品,例如异位样品。某些实例中的裂解缓冲液可以使降解RNA的酶失活,但有限稀释到杂交稀释缓冲液中可允许核酸酶活性并促进具有严格特异性的杂交。可以加入稀释缓冲液以中和裂解和其他缓冲液的抑制活性,诸如对其他酶(例如聚合酶)的抑制活性。可选地,裂解缓冲液和其他缓冲液的组成可以改变为例如聚合酶或连接酶耐受的组成。
在一些实例中,该方法包括同时或同步分析多个样品。例如,该方法可以同时或同步分析至少两个不同样品(例如来自不同受试者,例如患者)。在一个此类实例中,该方法还可以在至少两个不同的样品(诸如至少5个、至少10个、至少100个、至少500个、至少1000个、或至少10,000个不同的样品)同时或同步检测或测序至少两种不同的靶DNA和至少两种不同的RNA分子(诸如2、3、4、5、6、7、8、9或10种不同的靶标)。
示例性样品包括但不限于细胞,细胞裂解物,血涂片,细胞离心制备物,流式分选或以其他方式选择的细胞群,细胞学涂片,染色体制备物,体液(例如,血液及其组分诸如白细胞、血清或血浆;唾液;痰;尿液;脊髓液;胃液;汗;精液;乳头抽吸液(NAF)等),口腔细胞,组织、细胞或器官的提取物,组织活检(例如,肿瘤或淋巴结活检),液体活检,细针抽吸物,支气管镜灌洗物,穿孔活检,循环肿瘤细胞,细胞外囊泡,来自肿瘤的循环核酸,骨髓,羊膜穿刺样品,尸检材料,新鲜组织,冷冻组织,经固定的组织,经固定和蜡(例如石蜡)包埋的组织,骨髓和/或组织切片(例如,低温恒温器组织切片和/或石蜡包埋的组织切片)。生物样品还可以是实验室研究样品,诸如细胞培养样品或上清液。在一个实例中,分析的样品是约5微米厚的单个FFPE组织。
示例性样品可以获自正常细胞或组织,或获自肿瘤性细胞或组织。瘤形成是一种生物学状况,其中一个或更多个细胞经历特征性间变,伴有分化丧失、生长速度增加、周围组织侵入,并且其中细胞可以能够转移。在特定实例中,生物样品包括肿瘤样品,诸如含有肿瘤性细胞的样品。
示例性肿瘤性细胞或组织可以被包括在实体瘤中或从实体瘤中分离,包括肺癌(例如,非小细胞肺癌,诸如肺鳞状细胞癌)、乳腺癌(例如,小叶癌和导管癌)、肾上腺皮质癌、成釉细胞瘤、壶腹癌、膀胱癌、骨癌、宫颈癌、胆管瘤、结肠直肠癌、子宫内膜癌、食道癌、胃癌、神经胶质瘤、颗粒细胞瘤、头颈癌、肝细胞癌、葡萄胎、淋巴瘤、黑色素瘤、间皮瘤、骨髓瘤、神经母细胞瘤、口腔癌、骨软骨瘤、骨肉瘤、卵巢癌、胰腺癌、毛母细胞瘤、前列腺癌、肾细胞癌、唾液腺肿瘤、软组织肿瘤、Spitz痣、鳞状细胞癌、畸胎瘤和甲状腺癌。示例性肿瘤性细胞还可以被包括在血液癌症中或从血液癌症中分离,包括白血病,包括急性白血病(诸如急性淋巴细胞白血病、急性髓细胞白血病、急性髓性白血病、红白血病、以及成粒细胞、早幼粒细胞、粒单核细胞和单核细胞白血病)、慢性白血病(诸如慢性髓细胞(粒细胞)白血病、慢性髓性白血病和慢性淋巴细胞白血病)、真性红细胞增多症、淋巴瘤诸如霍奇金或非霍奇金淋巴瘤(惰性和高级别形式)、多发性骨髓瘤、华氏巨球蛋白血症、重链病、骨髓增生异常综合征和骨髓增生异常。
例如,可以通过手术切除全部或部分肿瘤、通过活检技术诸如针活检、通过从肿瘤收集细针抽吸物以及其他方法来获得来自含有细胞材料的肿瘤的样品。在一些实例中,将组织或细胞样品施加到基质上并进行分析以确定一种或更多种靶DNA和一种或更多种靶RNA的存在。在所公开的方法中有用的固体支持物仅需要承载生物样品,并且任选地允许方便地检测样品中组分(例如,蛋白质和/或核酸序列)。示例性支持物包括显微镜载玻片(例如,玻璃显微镜载玻片或塑料显微镜载玻片)、盖玻片(例如,玻璃盖玻片或塑料盖玻片)、组织培养皿、多孔板、膜(例如,硝酸纤维素或聚偏二氟乙烯(PVDF))或BIACORETM芯片。
所公开的方法是灵敏且特异的,并且允许对含有甚至有限数量细胞的样品中靶核酸分子进行测序。包括少量细胞的样品,诸如少于250,000个细胞(例如少于100,000、少于50,000、少于10,000、少于1,000、少于500、少于200、少于100、或少于10个细胞,包括但不限于FFPE样品,细针抽吸物(例如来自肺、前列腺、淋巴、乳腺或肝脏的那些),穿孔活检,针活检,骨髓活检,分选细胞或循环肿瘤细胞的小细胞群(例如,FACS),肺吸出物,少量激光捕获的、流式分选的或大体解剖的细胞或循环肿瘤细胞,外泌体和其他亚细胞颗粒或体液(诸如血浆、血清、脊髓液、唾液、精液和乳房抽吸物)。例如,靶DNA和靶RNA(例如,通过替代物)可以在少至100个细胞(诸如包括100个或更多个细胞,诸如100、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、50,000个或更多个细胞)中测序(并由此检测)。在一些实例中,可在约1000至100,000个细胞中检测靶DNA和靶RNA的表达,例如约1000至50,000个、1000至15,000个、1000至10,000个、1000至5000个、3000至50,000个细胞)。在一些实例中,可以在约100至250,000个细胞中检测到靶DNA和靶RNA的表达,例如约100至100,000个、100至50,000个、100至10,000个、100至5000个、100至500个、100至200个、或100至150个细胞。在其他实例中,靶DNA和靶RNA(例如,通过替代物)可以在约1至1000个细胞(诸如约1至500个细胞、约1至250个细胞、约1至100个细胞、约1至50个细胞、约1至25个细胞、或约1个细胞)中进行测序。
在使样品与靶标特异性试剂(诸如针对靶RNA的NPPF和相应的CFS,或针对靶DNA的引物)接触之前(或同时),可以以多种方式处理样品。一种相对简单的处理是将样品悬浮于缓冲液中,例如裂解缓冲液,其将样品的所有组分保存在单一溶液中。在一些实例中,处理样品以从样品中部分或完全分离(例如,提取)靶标(例如,DNA和mRNA)。当靶标(诸如DNA和RNA)从样品中其他非靶标生物组分中纯化出来时,它即被分离或提取。纯化是指将靶标与样品中一种或更多种外来组分(例如,细胞器、蛋白质)分离。与未纯化的或非提取的样品相比,从混合的标本或样品分离、提取或纯化的组分通常富集至少50%、至少60%、至少75%、至少90%、或至少98%、或甚至至少99%。
从样品中分离生物组分是耗时的,并且承担被分离组分丢失的风险,例如,由于用于分离的过程的降解和/或低效率或不完整。此外,对于一些样品,诸如经固定的组织、靶标(诸如DNA和RNA(例如,mRNA或miRNA))很难以高保真度进行分离(例如,与新鲜或冷冻组织相比),因为人们认为至少部分靶标与经固定的样品中其他组分交联,因此不容易被分离或溶解,并且可能在分离可溶性和不溶性部分时丢失。此外,从经固定的样品中分离出的DNA和RNA通常碎裂成短片。非常短的DNA和RNA片段可能在沉淀或基质结合步骤中丢失,从而导致测量偏倚。因此,在一些实施例中,所公开的对靶核酸进行测序的方法不需要或不涉及在裂解的样品与扩增引物或NPPF和相应的CFS接触之前,从样品中纯化、提取或分离靶核酸分子,和/或仅涉及将样品悬浮于溶液中,例如裂解缓冲液,在样品与扩增引物或NPPF和相应的CFS接触之前保留样品的所有组分。因此,在一些实例中,该方法不包括在分析之前从样品中分离核酸分子。
在一些实例中,样品中细胞在水溶液中被裂解或透化(例如使用裂解缓冲液)。水溶液或裂解缓冲液包括去污剂(诸如十二烷基硫酸钠)和一种或更多种离液剂(诸如甲酰胺、盐酸胍、异硫氰酸胍或尿素)。该溶液还可以包含缓冲液(例如SSC)。在一些实例中,裂解缓冲液包括约8%至60%甲酰胺(v/v)、约0.01%至0.1%SDS和约0.5-6X SSC(例如,约3XSSC)。缓冲液可以任选地包括tRNA(例如,约0.001至约2mg/ml);核糖核酸酶;DNase;蛋白酶K;降解蛋白质、基质、碳水化合物、脂质或一种寡核苷酸或其组合的酶(例如胶原酶或脂肪酶)。裂解缓冲液还可以包括pH指示剂,诸如酚红。将细胞在水溶液中(任选地用油覆盖)孵育足够的时间(诸如约1分钟至约6小时,例如约30分钟至3小时、约2至6小时、约3至6小时、约5分钟至约20分钟、或约10分钟)和在足够的温度下(诸如约22℃至约110℃,例如约80℃至约105℃、约37℃至约105℃,或约90℃至约100℃)以裂解或透化细胞。在一些实例中,裂解在约50℃、65℃、95℃或105℃下进行。在一个实例中,样品是FFPE样品(诸如FFPE切片或从此类样品中分离的RNA和DNA),并且细胞被裂解至少2小时,诸如至少3小时、至少4小时、至少5小时、或至少6小时,例如在50℃下,随后在95℃或105℃下一小段时间。在一个实例中,蛋白酶K包含在裂解缓冲液中。
在一些实例中,粗细胞裂解物无需进一步纯化而直接使用。粗细胞裂解液可以分成一个或更多个部分,诸如等体积的部分,其中将一种或更多种NPPF和相应的CFS加入至少一个第一部分,并且将一种或更多种扩增引物加入不同的/第二部分。在其他实例中,在使裂解物与一种或更多种NPPF和相应的CFS或与扩增引物接触之前,从细胞裂解物中分离核酸(诸如DNA和RNA)。
在其他实例中,组织样品通过将组织固定和包埋在培养基中来制备,或者包括将细胞悬液制备为固体支持物(诸如载玻片)上的单层,例如通过将细胞涂抹或离心到固体支持物上。在进一步的实例中,新鲜冷冻(例如,未固定的)组织或组织切片可用于本文公开的方法中。在特定实例中,FFPE组织切片用于所公开的方法。
在一些实例中,使用包埋介质。包埋介质是一种惰性材料,其中包埋组织和/或细胞以助于保存它们以备将来分析。包埋还能够使组织样品切成薄片。包埋介质包括石蜡、火棉胶、OCTTM化合物、琼脂、塑料或丙烯酸树脂。许多包埋介质是疏水的;因此,在分析之前可需要去除惰性材料,分析主要使用亲水性试剂。术语去石蜡化(deparaffinization)或脱蜡(dewaxing)是指从生物样品中部分或完全去除任何类型的包埋介质。例如,石蜡包埋的组织切片通过有机溶剂(诸如甲苯、二甲苯、柠檬烯或其他合适的溶剂)脱蜡。在其他实例中,直接使用石蜡包埋的组织切片(例如,无脱蜡步骤)。
组织可以通过任何合适的方法进行固定,包括灌注或浸没在固定剂中。固定剂可分为交联剂(诸如醛类,例如,甲醛、多聚甲醛和戊二醛,以及非醛类交联剂)、氧化剂(例如,金属离子和络合物,诸如四氧化锇和铬酸)、蛋白质变性剂(例如,乙酸、甲醇和乙醇)、机制未知的固定剂(例如,氯化汞、丙酮和苦味酸)、组合试剂(例如,Carnoy固定剂、methacarn、Bouin液、B5固定液、Rossman液和Gendre液)、微波和其他固定液(例如,排除体积固定和蒸汽固定)。固定剂中还可以包含添加剂,诸如缓冲剂、去污剂、单宁酸、苯酚、金属盐(诸如氯化锌、硫酸锌和锂盐)和镧。制备组织或细胞样品中最常用的固定剂是甲醛,通常为福尔马林溶液形式(4%甲醛的缓冲溶液,简称10%缓冲福尔马林)。在一个实例中,固定剂是10%中性缓冲福尔马林,因此在一些实例中,样品是经福尔马林固定的。
在一些实例中,样品是环境样品(诸如土壤、空气、空气过滤器或水样品,或从表面获得的样品(例如通过擦拭),或食物样品(诸如含有样品的蔬菜、水果、乳制品或肉类),例如以检测可能存在的病原体。
VI.靶核酸
靶核酸分子(诸如靶DNA或靶RNA)是旨在使用所公开的方法确定(例如以定量或定性方式)其检测、量和/或序列的核酸分子。在一些实例中,DNA通过扩增来自样品的DNA直接检测,而RNA通过使用替代物诸如NPPF间接检测。在一个实例中,靶标是核酸分子如目标DNA或RNA的限定区域或特定部分。在靶核酸序列是靶DNA和靶RNA的实例中,此类靶标可以由以下方式来定义:其特定的序列或功能;其基因或蛋白质名称;或从其他核酸中唯一地识别该靶标的任何其他方式。
在一些实例中,靶核酸序列(例如,DNA和/或RNA)的改变与疾病或病症“相关”。即,靶核酸序列的测序(直接或间接,诸如通过检测或测序替代物,诸如DNA扩增子或NPPF扩增子)可用于就样品推断疾病或病症的状态。例如,靶核酸序列可以两种(或更多种)可区分的形式存在,使得第一种形式与疾病或病症的不存在相关,而第二种(或不同的)形式与疾病和病症的存在相关。两种不同形式可以定性区分,诸如通过核苷酸(或核糖核苷酸)多态性或突变,和/或两种不同形式可以定量区分,诸如通过存在于样品中的靶核酸序列的拷贝数。
靶标包括单链、双链和/或其他多链核酸分子(诸如DNA(例如,基因组、线粒体或合成的)、RNA(诸如mRNA、miRNA、tRNA、siRNA、长链非编码(nc)RNA、生物存在的反义RNA、Piwi相互作用的RNA(piRNA)和/或小核仁RNA(snoRNA),无论是来自真核生物、原核生物、病毒、真菌、细菌、寄生虫还是其他生物有机体。基因组DNA靶标可以包括基因组的一个或几个部分,诸如编码区(例如,基因或外显子)、非编码区(无论是否具有已知或未知的生物学功能,例如增强子、启动子、调节区、端粒或“无义”DNA)。在一些实施方式中,靶标可以含有突变(例如,种系或体细胞突变)或可能是自然发生或以其他方式诱导的突变(例如,化学或辐射诱导的突变)的结果。此类突变可以包括(或源于)基因组重排(诸如移位、插入、缺失或倒位)、单核苷酸变异和/或基因组扩增。在一些实施方式中,靶标可以含有一种或更多种修饰或合成的单体单元(例如,肽核酸(PNA)、锁核酸(LNA)、甲基化核酸、翻译后修饰的氨基酸、交联核酸、或交联氨基酸)。
NPPF可特异性结合或扩增引物扩增的靶核酸分子的部分也可称为“靶标”,再次如上下文所指示,但更具体可称为靶部分、互补区(CR)、靶位点、受保护的靶区域或受保护的位点,或类似的。与其互补区域特异性结合的NPPF形成复合体,该复合体可以作为一个整体与靶标和/或样品保持整合,或者作为一个整体与靶标和/或样品分离(或分离的或变得分离)。在一些实施方式中,NPPF/CR复合体与作为整体的靶RNA和/或样品分离(或变得解离)。
可以使用所公开的方法分析所有类型的靶核酸分子,诸如至少一种DNA和至少一种RNA。在一个实例中,靶标包括核糖核酸(RNA)分子,诸如信使RNA(mRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、siRNA、反义RNA、或病毒RNA (vRNA)。在另一个实例中,靶标包括脱氧核糖核酸(DNA)分子,诸如基因组DNA(gDNA)、线粒体DNA(mtDNA)、叶绿体DNA(cpDNA)、病毒DNA(vDNA)、cDNA或转染的DNA。在一个具体实例中,靶标包括反义核苷酸。在一些实例中,可以使用所公开的方法对细胞或组织的整个转录组进行测序。在一个实例中,一种待测序的靶核酸分子是稀有核酸分子,例如仅在样品中出现少于约100,000次、少于约10,000次、少于约5,000次、少于约100次、少于10次、或仅出现一次,诸如核酸分子在样品中仅出现1至10,000次、1至5,000次、1至100次、或1至10次。
多种DNA和RNA靶标可以在同一样品或测定中,或者甚至在多个样品或测定中,例如同时或同步进行测序。类似地,可以对多个样品中单种RNA靶标和单种DNA进行测序,例如同时或同步进行。在一个实例中,靶核酸分子是DNA和RNA(例如,miRNA或mRNA)。因此,在此类实例中,该方法将包括使用至少一组对靶DNA特异的扩增引物和一种对RNA特异的NPPF(例如,至少一种对miRNA具有特异性的NPPF或至少一种对mRNA具有特异性的NPPF)。在一个实例中,靶核酸分子包括两种不同的RNA分子。因此,在此类实例中,该方法可以包括使用至少一种对第一靶RNA具有特异性的NPPF和至少一种对第二靶RNA具有特异性的NPPF。在一些实例中,DNA靶标在样品的至少一部分(例如,第一部分,诸如使用至少一种靶DNA引物)中直接扩增,产生FAR。在此类实例中,至少一种引物(例如,至少两种靶DNA引物)可以包括延伸序列(例如,5'和/或3'侧翼序列),诸如用于之后的扩增步骤。
在一些实例中,所公开的方法允许对DNA或RNA单核苷酸多态性(SNP)或变体(sNPV)、剪接点、甲基化DNA、基因融合或其他突变、蛋白质结合的DNA或RNA还有cDNA,以及表达水平(诸如DNA拷贝数或RNA表达,诸如cDNA表达、mRNA表达、miRNA表达、rRNA表达、siRNA表达或tRNA表达)进行测序。可以通过所公开的方法定量和识别可以直接扩增和/或可以设计NPPF以与其杂交的任何核酸分子。
在一个实例中,通过使用NPPF检测DNA甲基化,该NPPF在已发生或未发生甲基化的位点处包括碱基错配,从而在处理靶样品时,甲基化碱基转化为不同的碱基,与在NPPF中的碱基互补。因此,在一些实例中,该方法包括用亚硫酸氢盐处理样品。
本领域技术人员将理解,靶标可以包括天然或非天然碱基,或其组合。
在特定的非限制性实例中,选择与肿瘤(例如,癌症)相关的靶核酸(诸如靶DNA或靶RNA)。许多染色体异常(包括易位和其他重排、重复或缺失)或突变已在肿瘤性细胞中被发现,尤其是在癌细胞中,诸如B细胞和T细胞白血病、淋巴瘤、乳腺癌、结肠癌、神经系统癌症等。
在一些实例中,靶核酸分子包括野生型和/或突变的:δ-氨基乙酰丙酸合酶1(ALAS1)(例如,GenBank登录号NM_000688.5或OMIM 125290)、60S核糖体蛋白L38(RPL38)(例如,GenBank登录号NM_000999.3或OMIM 604182)、原癌基因B-Raf(BRAF)(例如,GenBank登录号NM_004333.4或OMIM 164757)(诸如野生型BRAF或V600E、V600K、V600E2和/或V600D突变,例如,见图10)、叉头盒蛋白L2(FOXL2)(例如,GenBank登录号NM_023067.3或OMIM605597)(诸如野生型FOXL2或nt820 snp C->G);表皮生长因子受体(EGFR)(例如,GenBank登录号NM_005228.3或OMIM 131550)(诸如野生型EGFR,和/或T790M、L858R、D761Y、G719A、G719S和G719C中的一种或更多种突变,或图9中所示的其他突变);GNAS(例如,GenBank登录号NM_000516.5或OMIM 139320);或KRAS(例如,GenBank登录号NM_004985.4或OMIM190070)(诸如野生型KRAS、D761Y突变、G12突变,诸如G12D、G12V、G12A、G12C、G12S、G12R、G13突变中的一种或更多种,诸如G13D和/或Q61突变,诸如Q61E、Q61R、Q61L、Q61H-C和/或Q61H-T中的一种或更多种)。
在一些实例中,靶核酸分子包括GAPDH(例如,GenBank登录号NM_002046)、PPIA(例如,GenBank登录号NM_021130)、RPLP0(例如,GenBank登录号NM_001002或NM_053275)、RPL19(例如,GenBank登录号NM_000981)、ZEB1(例如,GenBank登录号NM_030751)、Zeb2(例如,GenBank登录号NM_001171653或NM_014795)、CDH1(例如,GenBank登录号NM_004360)、CDH2(例如,GenBank登录号NM_007664)、VIM(例如,GenBank登录号NM_003380)、ACTA2(例如,GenBank登录号NM_001141945或NM_001613)、CTNNB1(例如,GenBank登录号NM_001904、NM_001098209、或NM_001098210)、KRT8(例如,GenBank登录号NM_002273)、SNAI1(例如,GenBank登录号NM_005985)、SNAI2(例如,GenBank登录号NM_003068)、TWIST1(例如,GenBank登录号NM_000474)、CD44(例如,GenBank登录号NM_000610、NM_001001389、NM_00100390、NM_001202555、NM_001001391、NM_001202556、NM_001001392、NM_001202557)、CD24(例如,GenBank登录号NM_013230)、FN1(例如,GenBank登录号NM_212474、NM_212476、NM_212478、NM_002026、NM_212482、NM_054034)、IL6(例如,GenBank登录号NM_000600)、MYC(例如,GenBank登录号NM_002467)、VEGFA(例如,GenBank登录号NM_001025366、NM_001171623、NM_003376、NM_001171624、NM_001204384、NM_001204385、NM_001025367、NM_001171625、NM_001025368、NM_001171626、NM_001033756、NM_001171627、NM_001025370、NM_001171628、NM_001171622、NM_001171630)、HIF1A(例如,GenBank登录号NM_001530、NM_181054)、EPAS1(例如,GenBank登录号NM_001430)、ESR2(例如,GenBank登录号NM_001040276、NM_001040275、NM_001214902、NM_001437、NM_001214903)、PRKCE(例如,GenBank登录号NM_005400)、EZH2(例如,GenBank登录号NM_001203248、NM_152998、NM_001203247、NM_004456、NM_001203249)、DAB2IP(例如,GenBank登录号NM_032552、NM_138709)、B2M(例如,GenBank登录号NM_004048)、和SDHA(例如,GenBank登录号NM_004168)。
在一些实例中,靶miRNA包括hsa-miR-205(MIR205,例如,GenBank登录号NR_029622)、hsa-miR-324(MIR324,例如,GenBank Accession No.NR_029896)、hsa-miR-301a(MIR301A,例如,GenBank登录号NR_029842)、hsa-miR-106b(MIR106B,例如,GenBank登录号NR_029831)、hsa-miR-877(MIR877,例如,GenBank登录号NR_030615)、hsa-miR-339(MIR339,例如,GenBank登录号NR_029898)、hsa-miR-10b(MIR10B,例如,GenBank登录号NR_029609)、hsa-miR-185(MIR185,例如,GenBank登录号NR_029706)、hsa-miR-27b(MIR27B,例如,GenBank登录号NR_029665)、hsa-miR-492(MIR492,例如,GenBank登录号NR_030171)、hsa-miR-146a(MIR146A,例如,GenBank登录号NR_029701)、hsa-miR-200a(MIR200A,例如,GenBank登录号NR_029834)、hsa-miR-30c(例如,GenBank登录号NR_029833,NR_029598)、hsa-miR-29c(MIR29C,例如,GenBank登录号NR_029832)、hsa-miR-191(MIR191,例如,GenBank登录号NR_029690)、或hsa-miR-655(MIR655,例如,GenBank登录号NR_030391)。
在一个实例中,靶标包括病原体核酸,诸如病毒RNA或DNA。示例性病原体包括但不限于病毒、细菌、真菌、寄生虫和原生动物。在一个实例中,靶标包括病毒RNA。病毒包括正链RNA病毒和负链RNA病毒。示例性正链RNA病毒包括但不限于:小核糖核酸病毒(诸如口疮病毒科[例如口蹄疫病毒(FMDV)])、心脏病毒科;肠道病毒科(诸如柯萨奇病毒、埃可病毒、肠道病毒和脊髓灰质炎病毒);Rhinoviridae(鼻病毒));Hepataviridae(甲型肝炎病毒);披膜病毒(其实例包括风疹;甲病毒(诸如西方马脑炎病毒、东方马脑炎病毒和委内瑞拉马脑炎病毒));黄病毒(诸如登革热病毒、西尼罗河病毒和日本脑炎病毒);和冠状病毒(其实例包括SARS冠状病毒,诸如Urbani株)。示例性负链RNA病毒包括但不限于:正粘病毒(诸如流感病毒)、弹状病毒(诸如狂犬病病毒)和副粘病毒(诸如麻疹病毒、呼吸道合胞病毒和副流感病毒)。在一个实例中,靶标包括来自DNA病毒的病毒DNA,诸如疱疹病毒(诸如水痘-带状疱疹病毒,例如Oka株;和单纯疱疹病毒(HSV)1型和2型)、腺病毒(诸如1型腺病毒和41型腺病毒)、痘病毒(诸如痘苗病毒)和细小病毒(诸如细小病毒B19)。在另一个实例中,靶标是逆转录病毒核酸,诸如来自人类免疫缺陷病毒1型(HIV-1)的核酸,诸如C亚型、HIV-2;马传染性贫血病毒;猫免疫缺陷病毒(FIV);猫白血病病毒(FeLV);猿猴免疫缺陷病毒(SIV);和禽肉瘤病毒。在一个实例中,靶核酸包括细菌核酸。在一个实例中,细菌核酸来自革兰氏阴性细菌,诸如大肠埃希氏菌(Escherichia coli)(K-12和O157:H7)、痢疾志贺氏菌(Shigelladysenteriae)和霍乱弧菌(Vibrio cholerae)。在另一个实例中,细菌核酸来自革兰氏阳性细菌,诸如炭疽芽孢杆菌(Bacillus anthracis)、金黄色葡萄球菌(Staphylococcusaureus)、肺炎球菌(pneumococcus)、淋球菌(gonococcus)或脑膜炎链球菌(streptococcalmeningitis)。在一个实例中,靶核酸包括来自原生动物、线虫或真菌的核酸。示例性原生动物包括但不限于疟原虫、利什曼原虫、棘阿米巴原虫、贾第鞭毛虫、内阿米巴原虫、隐孢子虫、等孢子虫、毛囊虫、毛滴虫、锥虫、奈格勒虫和弓形虫。示例性真菌包括但不限于粗球孢子菌(Coccidiodes immitis)和皮炎芽生菌(Blastomyces dermatitidis)。
本领域技术人员可以识别可以使用本文公开的方法检测的另外的靶DNA或RNA和/或另外的靶miRNA。
VII.测定输出
在一些实施方式中,所公开的方法包括确定样品中一种或更多种靶核酸分子的序列,其可以包括对检测到的序列的定量。在一些实例中,靶RNA的序列是使用NPPF替代物间接确定的,诸如从ssNPPF替代物(其与样品中靶RNA结合)产生的扩增子。在一些实例中,使用从样品中靶DNA产生的FAR直接确定靶DNA的序列。可以将方法的结果以可感知的输出提供给用户(诸如科学家、临床医生或其他卫生保健工作者、实验室人员或患者),该输出提供关于检测结果的信息。在一些实例中,输出可以是纸质输出(例如,书面或打印输出)、屏幕上的显示、图形输出(例如,图形、图表或其他图表)或声音输出。在一个实例中,输出是包括样品中已测序(或未检测到序列的)的靶DNA和RNA的存在或量(诸如标准化量)的定性或定量指标的表格或图表。在实施方式的其他实例中,输出是样品中一种或更多种靶DNA和RNA核酸分子的序列,此类报告指示靶分子中特定突变的存在。
输出可提供定量信息(例如,特定靶核酸分子的量或特定靶核酸分子相对于对照样品或值的量),或可提供定性信息(例如,确定特定靶核酸分子是否存在)。在另外的实例中,输出可以提供关于样品中靶核酸分子的相对量的定性信息,诸如识别相对于对照的增加或减少或相对于对照没有变化。
如本文所讨论的,最终扩增子NPPF扩增子和FAR扩增子可以包括一种或更多种实验标签,其可用于例如识别特定患者、样品、实验、或靶序列。此类标签的使用允许对已测序的靶标(例如,用于靶RNA的NPPF扩增子或用于靶DNA的FAR扩增子)进行“分类”或甚至计数,因此,允许在单个反应中分析多个不同的样品(例如来自不同患者)、多个不同的靶标(例如至少两种不同的核酸靶标)或它们的组合。在一个实例中,Illumina和Bowtie 2或其他序列比对软件可用于此类分析。
在一个实例中,用于靶RNA的NPPF扩增子和用于靶DNA的FAR扩增子包括对于每种不同的靶核酸分子唯一的实验标签。此类标签的使用允许人们仅对该标签进行测序或检测,而无需对整个靶标(例如,NPPF扩增子和FAR扩增子)进行测序,以识别靶标(例如,样品中存在的DNA或RNA靶标)。此外,当分析多种核酸靶标时,对每种靶标使用唯一的实验标签简化分析,因为可以对每种检测到或测序的实验标签进行分类,并在需要时进行计数。这允许对样品中靶核酸进行半定量或定量,因为NPPF扩增子和FAR扩增子与样品中靶标大致成化学计量比例。例如,如果在样品中检测或测序多个靶核酸,则该方法允许通过简单地检测或测序然后分选实验标签来生成显示每个靶序列和检测或测序的拷贝数的表格或图表。
在另一个实例中,NPPF扩增子和FAR扩增子包括每个不同样品唯一的实验标签(诸如每个患者样品的唯一标签)。这种标签的使用允许人们将特定的检测目标(例如,通过NPPF扩增子和FAR扩增子)与特定样品相关联。因此,如果在同一个反应(诸如同一个孔或同一个测序反应)中分析多个样品,对每个样品使用唯一的实验标签可以简化分析,因为每个检测或测序的NPPF扩增子和FAR扩增子可以与特定样品关联。例如,如果对样品中的靶核酸进行检测或测序,则该方法允许生成显示每个样品分析结果的表格或图表。
本领域技术人员将理解,每种靶标(例如,NPPF扩增子和FAR扩增子)可以包括多种实验标签(诸如至少2、3、4、5、6、7、8、9或10种实验标签),诸如代表靶序列的标签和代表样品的另一标签。一旦每个标签被检测到或测序,就可以使用适当的软件以任何期望格式(诸如图形或表格)对数据进行分类。例如,这允许同时或同步分析多个样品中多种靶序列。类似地,可以对NPPF扩增子或FAR扩增子的靶区域的前约5至25个碱基进行测序并用于识别RNA或DNA(即,它不需要是添加的标签)。
在一些实例中,将测序的靶标(例如,用于靶标RNA的NPPF扩增子或用于靶标DNA的FAR扩增子)与每个靶标核酸序列的已知序列的数据库进行比较。在一些实例中,这种比较允许检测突变,诸如SNV。在一些实例中,这种比较允许将参考NPPF的丰度与NPPF探针的丰度进行比较,这可以代表样品中靶RNA的表达。
实施例1
同时对多种NPPF和FAR测序以便以单碱基分辨率同时测量RNA丰度和DNA
本实施例描述了用于生成具有侧翼序列的核酸酶保护探针(NPPF)和带侧翼的扩增子区(FAR)并对其共同测序的方法。一组470个NPPF被设计用于RNA靶标。每个NPPF的长度为100个碱基,包括对特定靶核酸分子具有特异性的50个碱基的区域,以及5'和3'端的侧翼序列。所有470个探针的100个碱基NPPF的平均Tm为81.0℃(仅保护区域为73.2℃)。还产生了一组4个DNA引物。每个引物组扩增大小在50至80个碱基之间的基因组DNA区域。这4个区域中的每一个均涵盖一个已知有时具有一个突变或更多个突变的位点。每个引物在其5'端带有侧翼或延伸序列。4个DNA引物组的平均Tm为69.7℃。
在本实施例中,对于所有NPPF,无论其靶标如何,5'-和3'-侧翼序列(FS)彼此不同,但每个NPPF上的每个5'FS和每个3'FS均相同。5'-侧翼序列(5'AGTTCAGACGTGTGCTCTTCCGATC 3';SEQ ID NO:1)为25个核苷酸,Tm为56℃,3'-侧翼序列(5'GATCGTCGGACTGTAGAACTCTGAA 3';SEQ ID NO:2)为25个核苷酸,Tm为53.3℃。在本实施例中,每个DNA引物还在5'端带有一个侧翼序列。指定为5'特异性或“正向”引物携带引物的3'FS的反向互补物(5'TTCAGAGTTCTACAGTCCGACGATC 3';SEQ ID NO:3),并且那些指定为3'特异性或“反向”引物的那些引物携带5'-FS(5'AGTTCAGACGTGTGCTCTTCCGATC 3';SEQ ID NO:1)。所使用的4个引物组的完整序列如表1所示。
表1:引物组
Figure BDA0003234235430000451
在本实施例中,使用了经福尔马林固定的、石蜡包埋的(FFPE)样本和细胞系样品。通过将样品加入裂解缓冲液来制备样品。未进行核酸提取,也未在任何时候从DNA中分离RNA。为了证明测量DNA突变的能力,使用在KRAS和BRAF基因组位点处具有已知突变状态的两种市售细胞系。第一个LS 174T(“KRAS mut细胞系”),是KRAS35G>T碱基变化(G12D氨基酸变化)的杂合子,并且是BRAF的野生型。第二个是COLO-205(“BRAF mut细胞系”),带有BRAF1799T>A碱基变化(V600E氨基酸变化)并且是KRAS的野生型。已知后一种细胞系对于BRAF基因座是三倍体,其中三个基因座中的两个携带突变等位基因。
本实施例中裂解和使用的一些样品是一组源自上述两种细胞系的细胞系混合物。细胞在裂解缓冲液中稀释。每种混合物在每微升裂解缓冲液中总共含有~400个细胞。两种细胞系按比例稀释系列混合在一起,其中每个样品的细胞总数相同,但每个样品的组成不同。形成了8个不同的样品,如表2中所述。
表2:分析的样品
Figure BDA0003234235430000461
来自给定样品的两份裂解物用于两个独立的反应。一个是核酸酶保护反应,用于测量上述470种NPPF靶向的RNA分子的丰度。第二个是使用上述4个DNA引物组从样品中扩增基因组DNA区域的扩增反应。在所有情况下,产生三次重复反应。在某些情况下,在不同的天数进行三次重复反应,每个样品总共进行九次重复。
为了测量RNA丰度,第一个反应用一部分裂解材料构建。将上述470种NPPF合并,并与溶液中的样品以及与每种NPPF互补的CFS杂交。在95℃下初始变性后,在50℃下进行杂交。杂交后,通过在缓冲液中加入S1酶对杂交混合物进行S1消化。S1反应在50℃下孵育90分钟。在S1介导的未杂交靶RNA、NPPF和CFS消化后,通过将混合物加入含有终止溶液的新鲜容器中来停止反应。将反应加热至100℃10分钟,然后冷却至室温。
平行地,将裂解样品的第二部分与上述4种DNA引物组的混合物一起孵育。使用包括校对结构域的DNA聚合酶进行10次扩增循环。
然后将一部分完成的核酸酶保护实验(含有靶RNA特异的NPPF)和一部分完成的DNA扩增反应(含有靶DNA特异的FAR)合并,并在共同扩增反应中与DNA引物一起孵育。一个引物包括与5'-侧翼序列互补的序列,第二个引物包括与3'-侧翼序列互补的序列。两种引物还包括允许将实验标签掺入所得扩增子的序列,以便使用这些引物扩增的单个样品中每个扩增的NPPF或FAR具有相同的两个核苷酸实验标签。两种引物还包括允许使用二代测序仪器对它们进行测序的序列(本文称为测序接头)。进行了19个扩增循环。
第一个引物,
(5’AATGATACGGCGACCACCGAGATCTACACxxxxxxCGACAGGTTCAGAGTTCTACAGTCCGACG3’;SEQ ID NO:12)的长度为64个碱基,并带有一个六核苷酸的实验标签(在上面的序列中指定为“xxxxxx”)。引物的22个核苷酸与3'-侧翼区域完全互补,Tm为约50℃。
第二个引物:
(5’CAAGCAGAAGACGGCATACGAGATxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCG 3’;SEQ ID NO:13)的长度为60个碱基,并带有一个六核苷酸的实验标签(在上面的序列中指定为“xxxxxx”)。这些碱基中有22个与5'-侧翼序列相同,Tm为约53℃。
上面指定为“xxxxxx”的实验标签是表3中所示的序列之一。
表3:示例性实验标签序列。
指定 5'条码序列(引物中5'-3') 3'条码序列(引物中5'-3')
F1 ATTGGC
F2 GCCAAT
F3 TGACCA
F4 CACTGT
F5 TAGCTT
F6 ACATCG
F7 TGGTCA
F8 CTGATC
F9 GATCTG
R1 ACATCG
R2 ATTGGC
R3 GATCTG
R4 TTAGGC
R5 ACAGTG
R6 GCCAAT
R7 ACTTGA
R8 CGTACG
每个反应均在单独的PCR反应中进行扩增,并且每个反应均使用不同的实验标签组合进行扩增,因此可以在合并反应的测序后分别识别每个反应。
然后使用基于微珠的样品净化物(sample cleanup)(来自BeckmanCoulter的AMPure XP PCRTM)分别净化样品(含有NPPF扩增子和FAR扩增子,用其唯一的实验标签“标记”)。每个样品均单独定量,并将等量的每个样品合并到一个文库池中进行测序。测序在Illumina测序仪上进行。虽然实验标签可以位于多个位置,但在本实施例中,它们位于扩增子的两侧,紧邻与索引读取测序引物互补的区域。因此,Illumina测序分三个步骤进行,其中包括序列的初始读取,然后使用两个其他测序引物对实验标签进行两次较短的读取。本文描述和使用的测序方法是在Illumina平台上对多重样品进行测序的标准方法。
测序后,每个测序分子首先根据实验标签按样品分类;接下来,在每个实验标签组内,对每个不同标签识别的分子数量进行计数。使用开源软件Bowtie 2将序列结果(无论是源自NPPF还是FAR)与预期序列进行比较(Langmead B and Salzberg S.,NatureMethods.,2012,9:357-359)。
图5-8显示了对组合反应进行测序的结果。首先,RNA表达的测量是高度可重复的,如对于重复三次的样品大于0.95的Pearson相关性所证明的(图5A-5B)。显示的数据是470个RNA测量的原始数据,经log2转换。已针对每个比较绘制成对相关性,图中清楚地显示了比较的r值。两个样品的三次重复结果作为示例显示:一个FFPE样品(图5A)和一个细胞系混合物样品(图5B)。
其次,在整个滴定系列中测量RNA表达。将四个元素(HLA-DQB1、CPS1、UPP1和测定阴性对照)的表达数据跨滴定系列绘制,并且与细胞系中的已知表达一致。对于每个样品,使用三次重复实验的平均值。来自三次重复实验的原始数据被标准化(每个样品的计数总数设置为相等,每个信号重新计算为总计数的比例)。图6显示了四个元素的结果。CPS1在100%KRAS细胞系样品中表达良好,但在100%BRAF样品中不表达,而HLA-DQB1显示相反的模式。这两个转录本的表达水平在基于100%细胞系结果的滴定系列中发生变化。对于两个对照元素,UPP1被用作“管家”(在图表上标记为“HK”),因为它在细胞系之间不发生变化,因此在整个滴定系列中保持不变。还显示了测定阴性对照,对于所有样品,它是并且应该为零或接近于零。
再次,数据显示可以以单碱基分辨率测量DNA突变,并可靠地产生与这些细胞系中已知突变一致的结果。这在图7中每种细胞系的100%样品的DNA结果(表1中的样品1和8)中得到了例证。在BRAF细胞系中,预期有约67%的BRAF V600E和约33%的野生型BRAF的组成(请记住,该细胞系在BRAF基因座处已知为三倍体,因此预期为三倍体,其中两个携带V600E突变)。在G12D突变杂合的KRAS细胞系中,预期50%-50%的WT和突变比例。图7中的数据是通过对样品1和8的9次重复(在三个不同的天数进行三次测量)的原始计数进行平均而生成的。测量整个基因座(BRAF或KRAS)的总计数设置为100%,突变体或WT序列计算为这些总计数的百分比。数据被标记为“观察值(observed)”,并在预期值(标记为“预期值(expected)”)旁边绘制。从这些结果可以清楚地看出,使用上述方法正确测量了细胞系的DNA突变状态。
最后,即使突变存在于该基因座总序列的1%以下,也可以使用这些方法可靠地测量突变的等位基因。这由两种细胞系的滴定系列证明(样品1-8)。在样品2和7中,携带突变的一种细胞系仅占总样品的1%(~10个细胞)。在这两种情况下,1%细胞系携带的突变均得到了清晰可靠的测量,并且测量结果远高于背景。图8中的数据是通过平均每个样品9次测量的原始值(在三个不同的天数运行三次)并绘制原始值而生成的。值得注意的是,每个突变军以杂合形式存在于细胞系中。因此,即使在样品中少于1%的测量基因座携带突变时,这些方法也可以识别基因组DNA中的单碱基变化。
这些结果表明,公开的方法既可以可靠地测量多个RNA的表达水平,也可以辨别多个基因组区域的单碱基变化,即使单碱基变化在给定基因座处占总DNA的比例低于1%。
实施例2
校正NPPF和FAR的相对数量
本实施例描述了用于生成和测序NPPF和FAR以及校正最终样品中NPPF(RNA)和FAR(DNA)读数平衡的方法。本实施例展示了可以使用一个或更多个描述的参数来校正平衡。这种校正有助于测定的灵活性;并且可以在实验之前对所需的总信号和信号平衡进行建模。
所用的四个DNA引物组和470个NPPF如实施例1中所述。产生一组七个样品。这些样品是商业采购的,经福尔马林固定的、石蜡包埋的(FFPE),5微米厚,并固定在玻璃载玻片上。通过将样品以每微升裂解缓冲液0.5mm2组织加入裂解缓冲液来裂解样品。未进行RNA或DNA提取。部分裂解样品用于两个反应。如实施例1,一个是核酸酶保护反应,用于测量470个NPPF靶向的RNA分子的丰度。第二个是使用四个DNA引物组从样品中扩增基因组DNA区域的扩增反应。
为了测量RNA丰度,第一个反应使用一部分裂解材料构建。将上述470个NPPF合并并与溶液中的样品以及与NPPF上的FS完全互补的CFS杂交。在85℃下初始变性后,在50℃下进行杂交。杂交后,通过在缓冲液中加入S1酶对杂交混合物进行S1消化。S1反应在50℃下孵育90分钟。在S1介导的未杂交靶RNA、NPPF和CFS消化后,通过将混合物加入含有终止溶液的新鲜容器中来停止反应。将反应加热至100℃10分钟,然后冷却至室温。
平行地,将裂解样品的第二部分与实施例1中描述的四种DNA引物组的混合物一起孵育。使用DNA聚合酶进行12或14个扩增循环。每个样品在每个循环数扩增一次。
然后将一部分完成的核酸酶保护实验(NPPF)和一部分完成的DNA扩增反应(FAR)合并,并在共同扩增反应中与DNA引物一起孵育。在所有情况下,使用恒定的4微升NPPF反应,但12次循环或14次循环FAR以4微升(1比1)、8微升(2比1)或12微升(3比1)加入,对于每个样品共有6种不同的共同扩增反应。共同扩增反应中使用的DNA引物与实施例1所述完全相同;它们包括一个允许将实验标签并入所得扩增子的序列和一个允许使用二代测序仪器对其进行测序的序列。进行了十九个扩增循环。每个反应均在单独的PCR反应中扩增,并且每个反应均使用不同的实验标签组合进行扩增,因此每个反应都可以在合并反应的测序后单独识别
对于七个样品中一个,反应条件(DNA扩增循环和加入共同扩增反应中的FAR的数量)和共同扩增反应的实验标签序列如表4所示。除了分配给每个样品和条件的实验标签组合是唯一的之外,其他六个样品的处理方式相同。
表4:反应条件
Figure BDA0003234235430000501
然后使用基于微珠的样品净化物(来自BeckmanCoulter的AMPure XP)分别净化样品(含有NPPF扩增子和FAR扩增子,现在用它们唯一的实验标签“标记”)。每个样品均单独定量,并将等量的每个样品合并到一个文库池中进行测序。测序在Illumina测序仪上进行。虽然实验标签可以位于多个位置,但在本实施例中,它们位于扩增子的两侧,紧邻与索引读取测序引物互补的区域。因此,Illumina测序分三个步骤进行,包括序列的初始读取,然后使用两个其他测序引物对实验标签进行两次较短的读取。本文描述和使用的测序方法是在Illumina平台上对多重样品进行测序的标准方法。
测序后,每个测序分子首先根据实验标签按样品分类;接下来,在每个实验标签组内,对每个不同标签识别的分子数量进行计数。使用开源软件Bowtie 2将序列结果(无论是源自NPPF还是FAR)与预期序列进行比较(Langmead and Salzberg,Nature Methods.,2012,9:357-359.)。
图9-10显示了对单个样品的组合反应进行测序的结果,并显示了所描述的方法可用于校正分配给单个样品的NPPF(RNA)和FAR(DNA)信号之间的平衡。展示在图9中的图标显示了在使用的不同条件下,一个样品的NPPFs/RNA(灰色)和FARs/DNA(灰条纹)消耗的总读数的百分比。在该样品中,由于校正扩增循环和加入共同扩增反应而产生的DNA读数范围为约5%至约40%。因此,可以通过校正扩增循环数或加入共同扩增反应中的材料进一步改变该范围。因此,初始DNA扩增中的扩增循环和添加至共同扩增反应中的FAR体积均是可校正的条件。第三个可调参数是用于测量的检测器(在本实施例中,具有特定套件和特定先天错误率的测序仪)。
结果还证明使用所公开的方法测量的DNA和RNA分析物的相对百分比在不同样品之间保持恒定。图10显示了所有七个FFPE样品的一组条件(14个循环和4μl加入量)的结果。在图9中,该图显示了NPPF或RNA(灰色)以及FAR或DNA(灰条纹)消耗的总读数的百分比。图10表明,对于给定的一组条件,不同样品中测得的RNA和DNA百分比相似,尽管在一个范围内。
本实施例证明本文所述的方法允许测量的DNA区域的数量和/或NPPF的数量是灵活的。因此,期望的总信号和分配给任一组分的信号可以根据分析物的总数、不同类型分析物的相对数量、期望的测量检测限(灵敏度)和检测器的容量(在本实施例中,测序仪上的计数或测序读取数)而变化。检测器通过其将产生的总信号的容量或数量以及检测器系统的先天错误(诸如测序期间的碱基检出错误)以两种方式影响灵敏度。上述参数均可以建模,以给出一组特定条件下的总读数的理论数量和相对百分比,这反过来又提供了判断“调试”或校正实验成功与否的可接受标准。
实施例3
同时评估临床FFPE样品的BRAF突变和RNA表达状态
本实施例描述了用于评估具有已知BRAF基因组突变状态的8个商用经福尔马林固定的石蜡包埋的(FFPE)肺和黑色素瘤样品中RNA表达和BRAF基因组突变状态的方法。
对于本实施例,使用的四个DNA引物组和470个NPPF如实施例1所述。FFPE样品被切成5微米厚的部分,并在使用前固定在载玻片上。通过将样品以每微升裂解缓冲液0.17mm2组织加入裂解缓冲液中来裂解样品。未进行RNA或DNA提取。如实施例1中所述,部分裂解样品用于两个反应中。一个反应是核酸酶保护反应,用于测量470个NPPF靶向的RNA分子的丰度。第二个是使用四个DNA引物组从样品中扩增基因组DNA区域的扩增反应。每个样品重复三次运行。
为了测量RNA丰度,第一个反应使用一部分裂解材料构建。将上述470个NPPF合并,并与溶液中的样品以及与NPPF上的侧翼区域互补的CFS杂交。在85℃下初始变性后,在50℃下进行杂交。杂交后,通过在缓冲液中加入S1酶对杂交混合物进行S1消化。S1反应在50℃下孵育90分钟。在S1介导的未杂交靶RNA、NPPF和CFS消化后,通过将混合物加入含有终止溶液的新鲜容器中来停止反应。将反应加热至100℃10分钟,然后冷却至室温。
平行地,将裂解样品的第二部分与上述四个DNA引物组的混合物一起孵育。使用包含校对结构域的DNA聚合酶或聚合酶混合物进行10个扩增循环。
然后将一部分完成的核酸酶保护实验和一部分完成的DNA扩增反应合并,并在共同扩增反应中与DNA引物一起孵育。该共同扩增反应中使用的引物如实施例1和2中所述。进行了19个扩增循环。每个反应都在单独的PCR反应中进行扩增,并且每个反应均使用不同的实验标签组合进行扩增,因此可以在合并反应的测序后分别识别每个反应。使用的实验标签如表5所示。
表5:实验标签
Figure BDA0003234235430000511
Figure BDA0003234235430000521
然后使用基于微珠的样品净化物(来自BeckmanCoulter的AMPure XP)分别净化样品(含有NPPF扩增子和FAR扩增子,现在用它们唯一的实验标签“标记”)。每个样品均单独定量,并将等量的每个样品合并到一个文库池中进行测序。测序在Illumina测序仪上进行。虽然实验标签可以位于多个位置,但在本实施例中,它们位于扩增子的两侧,紧邻与索引读取测序引物互补的区域。因此,Illumina测序分三个步骤进行,包括序列的初始读取,然后使用两个其他测序引物对实验标签进行两次较短的读取。本文描述和使用的测序方法是在Illumina平台上对多重样品进行测序的标准方法。测序后,每个测序分子首先根据实验标签按样品分类;接下来,在每个实验标签组内,对每个不同标签识别的分子数量进行计数。使用开源软件Bowtie 2将序列结果(无论是源自NPPF还FAR)与预期序列进行比较(Langmead and Salzberg,Nature Methods.,2012,9:357-359)。
图11-12显示了对来自每个样品的NPPF和FAR进行共同测序的结果。DNA突变信息如图11所示。显示的图表是通过首先平均三份样品的原始计数生成的。从BRAF区域产生的计数总数,无论是野生型还是突变体,均进行相加,并计算每个样品的野生型或突变体信号的比例。这些比例显示在图11的图表中。该图还显示了BRAF基因组序列。野生型序列如该图的上图所示,下面有两个已知突变(V600E和V600E2),变化标记为红色。
这些数据表明,所描述的方法可用于正确识别这些临床FFPE样品中BRAF V600E突变。进行了三个观察。一,单个样品携带V600E2突变(序列如图所示),证明了这些方法区分这两个相似突变的能力。该样品被供应商描述为带有“V600E”突变,但之前对该样品的测序显示存在E2突变。这两种突变具有相同的效果(氨基酸变化V>E),并且无法通过大多数基于PCR的分析进行区分,这意味着供应商可能不知道确切的突变。该结果表明所公开的方法可以揭示未知突变。第三,肺癌样品FFPE1和FFPE2的结果与其先前生成的外显子组测序数据非常匹配;FFPE2中V600E突变的等位基因频率通过外显子组测序估计为0.22,使用本文所述方法估计为0.25。FFPE1通过外显子组测序显示为BRAF的野生型,并且在本实施例中显然也是野生型。
图12A-12B和下表显示了这八个样品产生的RNA表达数据的各个方面。对于FFPE1(肺,图12A)和FFPE7591(黑色素瘤,图12B),显示了整个470NPPF组的三次重复测量的Pearson相关性。所有相关性均极好,r值大0.95。显示的数据是原始数据,经log2转换。再次对两个样品FFPE1(肺腺癌)和FFPE7591(黑色素瘤),显示了一些相关转录物的测量的表达水平(见表3)。已知肺癌标本是一种腺癌,并且清楚地显示出肺特异性标志物(如MUC1和SFTPA2)以及腺癌标志物KRT7和NAPSA的强表达。相反,黑色素瘤样品显示出黑色素细胞标志物PMEL和TYR以及黑色素瘤标志物SOX10和MITF的强表达。还显示了每个样品的阳性和阴性测定对照元素和B2M(管家)的水平,以证明样品之间这些测量的相似性。表6中显示的数据是重复三次样品的原始数据的平均值,标准化(参见实施例1)以设置每个样品的总计数彼此相等。
表6:肺癌和黑色素瘤样品中RNA表达水平
样品 FFPE1(肺腺癌) FFPE7951(黑色素瘤)
阴性对照 1 2
阳性对照 1502 1172
B2M(管家) 12887 10161
KRT7 3820 25
NAPSA 17526 206
MUC1 4928 140
SFTPA2 71536 161
PMEL 15 95282
TYR 341 26976
MLANA 290 9711
SOX10 65 10884
MITF 196 4758
本实施例展示了所描述的方法在经固定的临床相关样品中共同检测RNA表达和DNA突变状态的能力。DNA突变在单碱基水平上被清楚地区分,例如在本实施例中评估的样品所携带的BRAF V600E和V600E2突变之间。重复样品中RNA表达的测量具有高度可重复性,并且预期的标志物由已知组织来源的样品表达。此外,这些结果是使用少量(~6mm2)固定组织生成的,未提取RNA或DNA,证明了使用少量临床相关样品时所描述的方法能够很好地工作。
实施例4
使用NPPF和FAR测定同时评估FFPE参考标准的DNA突变、插入和缺失以及RNA表达状态
本实施例描述了用于在来自三种类型癌症的三个独立的个体样品中生成和共同测序NPPF和FAR的方法。在本实施例中,使用的样品是市售的、经表征的参考标准,携带已知等位基因频率的已知DNA变异。将通过以下描述的所公开的方法为这些样品生成的数据与参考材料供应商报告的预期结果进行比较。
对于本实施例,使用的470个NPPF如实施例1中所述。
在本实施例中,设计了一组8对DNA引物来生成FAR。如前述实施例,每个DNA引物的5'端都有一个侧翼序列。指定为5'特异性或“正向”引物带有3'FS的反向互补物(5'TTCAGAGTTCTACAGTCCGACGATC 3',SEQ ID NO:3),并且那些被指定为3'特异性或“反向”引物携带5'-FS(5'AGTTCAGACGTGTGCTCTTCCGATC 3'SEQ ID NO:1)。使用的八组引物的完整序列如表7所示。这些引物中的每一个均在其3'端的最后两个碱基之间包含一个硫代磷酸酯键。
表7.使用的引物
Figure BDA0003234235430000541
为了证明所描述的技术测量DNA突变的能力,从Horizon Discovery获得了经表征的参考标准-以已知的等位基因频率存在已知突变。获得了三个这样的参考样品(HD300、HD301、HD789)。这些样品以FFPE切片获得。通过将FFPE部分加入裂解缓冲液中来制备样品。未进行核酸提取,也未在任何时候从DNA中分离RNA。
每个裂解样品单独运行并作为总共六个样品的混合物的一部分。混合物被设计成允许在1%或更低的等位基因频率下测量突变,并且通过将一个裂解样品以20%:80%的比例稀释到另一个中来产生。
来自一个样品(HD300、HD301或HD789)的两份裂解物用于两个独立的反应。用于每个反应的总输入为约1000个细胞。一部分用于核酸酶保护反应,以测量上述470个NPPF靶向的RNA分子的丰度。使用上述DNA引物组,将第二部分用于扩增反应以从样品中扩增基因组DNA区域。在所有情况下,进行三次重复反应。在不同的天数进行三次重复反应,每个样品总共进行九次重复。
为了测量RNA丰度,核酸酶保护反应使用裂解材料的第一部分构建。将上述470个NPPF合并,并与溶液中的样品以及称为CFS的寡核苷酸杂交-这些与NPPF上的侧翼区域完全互补。在85℃下初始变性后,在50℃下进行杂交。杂交后,通过在缓冲液中加入S1酶对杂交混合物进行S1消化。S1反应在50℃下孵育90分钟。在S1介导的未杂交靶RNA、NPPF和CFS消化后,通过将混合物加入含有终止溶液的新鲜容器中来停止反应。将反应加热至100℃10分钟,然后冷却至室温。
平行地,将裂解样品的第二部分与上述DNA引物组的混合物一起孵育。使用包含校对域的DNA聚合酶或聚合酶混合物进行10个扩增循环。使用基于微珠的样品净化物(来自BeckmanCoulter的AMPure XP)净化PCR反应。
然后将完成的核酸酶保护实验的一部分和净化的DNA扩增反应的一部分合并,并在共同扩增反应中与DNA引物一起孵育,如前述实施例中所述。进行了十九个扩增循环。
每个反应均在单独的PCR反应中进行扩增,并且每个反应均使用不同的实验标签组合进行扩增,因此可以在合并反应的测序后分别识别每个反应。合并样品,重复三份,并使用基于微珠的样品净化物(来自BeckmanCoulter的AMPure XP)对合并池进行净化。每个池单独定量,将等量的每个池合并成一个文库池用于测序。双端测序在Illumina测序仪上进行,每端进行100次测序循环,以及各有6个碱基的两个标签特异性读数。实验标签位于扩增子两侧的文库中,紧邻与索引读取测序引物互补的区域。Illumina测序分四个步骤进行:序列的初始读取,然后使用两个其他测序引物对实验标签进行两次较短的读取,最后从另一端对插入物进行第二次读取。本文描述和使用的测序方法是在Illumina平台上对多路复用样品进行双端测序的标准方法。
测序后,每个测序的分子首先根据实验标签按样品分类,或解复用。解复用的fastq文件被处理两次以提取DNA和RNA信息。对于后者(RNA),使用开源软件Bowtie 2将fastq文件与预期的NPPF序列比对(Langmead and Salzberg,Fast gapped-readalignment with Bowtie 2.Nature Methods.2012,9:357-359),并针对编译的每个比对进行计数。在PCA分析之前,对计数数据进行log2转换和标准化。对于前者(DNA),fastq文件与基因组序列比对,同样使用Bowtie2,编译每个区域和变体的计数,每个扩增子区域的总计数设置为100%。
可重复性和差异表达(RNA):使用所公开的方法测量RNA表达具有高度的可重复性和生物学反映性。这由图13所示的主成分分析(PCA)图证明,该图使用来自样品HD300、HD301和HD789的9次重复的RNA数据构建。前两个主成分绘制在X轴和Y轴上。三种不同的细胞系强分离,表明表达谱和及由此在生物学方面存在预期差异,但重复品紧密聚集在一起,表明技术重复品和不同天数运行的重复品之间具有极好的可重复性。
使用参考标准(DNA)检测已知等位基因频率的已知突变的结果如图14所示。图14显示了三个参考标准和三个混合物样品中每一个的观察到的和预期的等位基因频率的表格。每对样品和相应的混合物/稀释样品分别显示,以突出显示该样品携带的突变。这些样品中DNA变异包括EGFR(L861Q、L858R、T790M、G719S)、KRAS(G12D、G13D、Q61H)和PIK3CA(E545)中的单核苷酸变异,以及15个碱基缺失变异(EGFRΔE746-A750))和9个碱基插入变体(EGFR V769_D770insASV)。在所有情况下,这些变体的预期和观察到的等位基因频率均具有良好的相关性。尽管1000个细胞的样本量很小,但在从1%起的一系列频率上可靠地检测到突变。重要的是,未检测到假阳性信号;即,如果预期样品中不存在变异,则不会检测到该突变的显著计数。
图15显示了DNA变体的单个测量的可重复性。显示了代表性样品(HD300)和代表性扩增子(EGFR 858),并显示了野生型和指定变体的百分比。九次重复中的每一次均由图中的条形表示。
从这些结果可以清楚地看出,这些参考样品的DNA突变状态是使用所公开的方法忠实可靠地测量的。虽然在实施例3中也检测到低等位基因频率(1%或更低)的突变,但本实施例中使用的参考样品是由外部人员制备和检测的,因此代表了所描述技术灵敏度的极好校准标记。此外,这些标准不仅包括单核苷酸变体,还包括插入和缺失变体,并提供了极好的实例,说明所描述的技术能够检测单个样品中多个变异,同时对同一样品进行RNA分析。
总体上,结果表明所公开的方法既可以可靠地测量多种RNA的表达水平,也可以在DNA水平上辨别一系列单碱基、插入和缺失变化,与参考样品中预期结果相匹配,甚至当DNA突变占该位点总等位基因频率的1%或更少时。
鉴于可以应用所公开的发明的原理的许多可能的实施方式,应当认识到,所示出的实施方式仅是本公开的实例并且不应被视为限制本公开的范围。相反,本发明的范围由所附权利要求限定。因此,我们要求将落入这些权利要求的范围和精神内的所有内容作为我们的发明。
序列表
<110> HTG分子诊断有限公司
D·汤普森
M·鲁内塞维尔
<120> 检测同一样品中DNA和RNA的方法
<130> 8736-101564-02
<150> 62/787,114
<151> 2018-12-31
<160> 32
<170> PatentIn 3.5版
<210> 1
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 示例性5'-侧翼序列
<400> 1
agttcagacg tgtgctcttc cgatc 25
<210> 2
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 示例性3'- 侧翼序列
<400> 2
gatcgtcgga ctgtagaact ctgaa 25
<210> 3
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 示例性正向引物
<400> 3
ttcagagttc tacagtccga cgatc 25
<210> 4
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 示例性BRAF引物
<400> 4
ttcagagttc tacagtccga cgatccagta aaaataggtg attttggtct agc 53
<210> 5
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 示例性BRAF引物
<400> 5
agttcagacg tgtgctcttc cgatcctgat gggacccact ccatc 45
<210> 6
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 示例性KRAS引物
<400> 6
ttcagagttc tacagtccga cgatcaaatg actgaatata aacttgtggt ag 52
<210> 7
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 示例性KRAS引物
<400> 7
agttcagacg tgtgctcttc cgatcaatga ttctgaatta gctgtat 47
<210> 8
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 示例性EGFR引物
<400> 8
ttcagagttc tacagtccga cgatcatctg cctcacctcc accg 44
<210> 9
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 示例性EGFR引物
<400> 9
agttcagacg tgtgctcttc cgatcgcagc cgaagggcat ga 42
<210> 10
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 示例性EGFR引物
<400> 10
ttcagagttc tacagtccga cgatctcttg aggatcttga aggaaactga 50
<210> 11
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 示例性EGFR引物
<400> 11
agttcagacg tgtgctcttc cgatctatac accgtgccga acgca 45
<210> 12
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 示例性第一引物
<220>
<221> misc_feature
<222> (30)..(35)
<223> n为a, c, g, t或u
<400> 12
aatgatacgg cgaccaccga gatctacacn nnnnncgaca ggttcagagt tctacagtcc 60
gacg 64
<210> 13
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 示例性第二引物
<220>
<221> misc_feature
<222> (25)..(30)
<223> n为a, c, g, t或u
<400> 13
caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60
<210> 14
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 示例性BRAF序列
<400> 14
ggtgattttg gtctagctac agtgaaatct cgatggagtg ggtcccatca 50
<210> 15
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 示例性BRAF序列
<400> 15
ggtgattttg gtctagctac agagaaatct cgatggagtg ggtcccatca 50
<210> 16
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 示例性BRAF序列
<400> 16
ggtgattttg gtctagctac agaaaaatct cgatggagtg ggtcccatca 50
<210> 17
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> BRAF引物
<400> 17
ttcagagttc tacagtccga cgatctgttc aaactgatgg gacc 44
<210> 18
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> BRAF引物
<400> 18
agttcagacg tgtgctcttc cgatccatga agacctcaca gtaaa 45
<210> 19
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> EGFR引物
<400> 19
ttcagagttc tacagtccga cgatcccagg gaccttacct tatac 45
<210> 20
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> EGFR引物
<400> 20
agttcagacg tgtgctcttc cgatcgctct cttgaggatc ttgaa 45
<210> 21
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> EGFR引物
<400> 21
ttcagagttc tacagtccga cgatccacac agcaaagcag aaac 44
<210> 22
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> EGFR引物
<400> 22
agttcagacg tgtgctcttc cgatcccaga aggtgagaaa gttaa 45
<210> 23
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> EGFR引物
<400> 23
ttcagagttc tacagtccga cgatccagga agcctacgtg atg 43
<210> 24
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> EGFR引物
<400> 24
agttcagacg tgtgctcttc cgatcagccg aagggcatga g 41
<210> 25
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> EGFR引物
<400> 25
ttcagagttc tacagtccga cgatccaccg cagcatgtca a 41
<210> 26
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> EGFR引物
<400> 26
agttcagacg tgtgctcttc cgatcaccta aagccacctc ctt 43
<210> 27
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> KRAS引物
<400> 27
ttcagagttc tacagtccga cgatcattct gaattagctg tatcgt 46
<210> 28
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> KRAS引物
<400> 28
agttcagacg tgtgctcttc cgatcatgac tgaatataaa cttgtggt 48
<210> 29
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> KRAS引物
<400> 29
ttcagagttc tacagtccga cgatcgcaag tagtaattga tggagaa 47
<210> 30
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> KRAS引物
<400> 30
agttcagacg tgtgctcttc cgatcggcaa atacacaaag aaagc 45
<210> 31
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> PIK3CA引物
<400> 31
ttcagagttc tacagtccga cgatcaaagc aatttctaca cgagat 46
<210> 32
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> PIK3CA引物
<400> 32
agttcagacg tgtgctcttc cgatcactta cctgtgactc catag 45

Claims (40)

1.一种确定样品中靶DNA分子和靶RNA分子的序列的方法,包括:
用裂解缓冲液裂解所述样品,从而产生包含所述靶DNA分子和所述靶RNA分子的裂解物;
使用至少一种靶DNA引物从所述裂解物的第一部分扩增所述靶DNA,从而产生带侧翼的扩增子区(FAR);
在足以使包含侧翼序列的核酸酶保护探针(NPPF)与所述靶RNA分子特异性结合的条件下,将所述裂解物的第二部分与至少一种NPPF孵育,
其中所述NPPF包含:
5'端和3'端,
与所述靶RNA分子的区域互补的序列,允许所述NPPF和所述靶RNA分子之间的特异性结合,
其中所述侧翼序列位于与所述靶RNA分子互补的序列的5'、3'或两者,其中5'-侧翼序列处于与所述靶RNA分子互补的序列的5',并且3'-侧翼序列处于与所述靶RNA分子互补的序列的3',
其中所述侧翼序列包含在所述样品中存在的核酸分子中未发现的至少12个连续核苷酸,
如果所述NPPF包含5'-侧翼序列,则在足以使所述5'-侧翼序列与与所述5'-侧翼序列互补的序列(5CFS)特异性杂交的条件下,使所述裂解物的所述第二部分与包含所述5CFS的核酸分子接触;
如果所述NPPF包含3'-侧翼序列,则在足以使所述3'-侧翼序列与与所述3'-侧翼序列互补的序列(3CFS)特异性杂交的条件下,使所述裂解物的所述第二部分与包含所述3CFS的核酸分子接触;
产生与所述靶RNA分子杂交、与所述3CFS杂交、与所述5CFS杂交、或与所述3CFS和所述5CFS两者杂交的NPPF;
在足以去除未结合的核酸分子的条件下,使所述裂解物的所述第二部分与对单链核酸分子具有特异性的核酸酶接触,从而产生所述裂解物的经消化的第二部分,其包含与所述靶RNA分子杂交、与所述3CFS杂交、与所述5CFS杂交、或与所述3CFS和所述5CFS两者杂交的NPPF;
任选地将所述NPPF与所述靶RNA分子以及与所述3CFS、5CFS、或所述3CFS和所述5CFS两者分离,从而产生单链NPPF;
将所述FAR和(i)单链NPPF或(ii)与所述靶RNA分子杂交、与所述3CFS杂交、与所述5CFS杂交、或与所述3CFS和所述5CFS杂交的NPPF合并,从而产生FAR:单链NPPF混合物;
扩增所述FAR:单链NPPF混合物中的所述FAR和所述单链NPPF,从而产生FAR扩增子和NPPF扩增子;并且
对至少一部分所述FAR扩增子和至少一部分所述NPPF扩增子进行测序,从而确定所述样品中所述靶DNA分子和所述靶RNA分子的序列。
2.根据权利要求1所述的方法,其中所述NPPF包含5'-侧翼序列和3'-侧翼序列,并且扩增所述FAR和所述单链NPPF包括使所述FAR和所述单链NPPF与包含与所述5'-侧翼序列相同的区域的第一扩增引物和包含与所述3'-侧翼序列互补的区域的第二扩增引物接触。
3.根据权利要求2所述的方法,其中所述第一扩增引物和/或所述第二扩增引物进一步包含在所述FAR和所述单链NPPF的扩增过程中允许将实验标签、测序接头或两者附着至所述FAR扩增子或NPPF扩增子的一个或更多个序列。
4.根据权利要求3所述的方法,其中所述实验标签或测序接头的长度为12至50个核苷酸。
5.根据权利要求1至4中任一项所述的方法,其中所述至少一种靶DNA引物包含至少两种靶DNA引物,每种在其5'端包含侧翼序列,其中第一靶DNA引物包括包含所述3'-侧翼序列的反向互补序列的侧翼序列,并且其中第二靶DNA引物包括包含所述5'-侧翼序列的序列的侧翼序列。
6.根据权利要求1至5中任一项所述的方法,其中从所述裂解物的第一部分扩增所述靶DNA包括8至12个扩增循环。
7.根据权利要求1至6中任一项所述的方法,其中扩增所述FAR和所述单链NPPF的扩增包括8至25个扩增循环。
8.根据权利要求1至7中任一项所述的方法,其中所述靶DNA分子是靶基因组DNA分子。
9.根据权利要求1至8中任一项所述的方法,其中所述裂解缓冲液包含去污剂和离液剂。
10.根据权利要求1至9中任一项所述的方法,其中所述5CFS和3CFS是DNA。
11.根据权利要求1至10中任一项所述的方法,其中确定所述样品中所述靶RNA分子的序列包括确定所述样品中所述靶RNA的绝对或相对丰度。
12.根据权利要求1至11中任一项所述的方法,其中所述NPPF包含DNA分子。
13.根据权利要求1至12中任一项所述的方法,其中所述NPPF的长度为35至200个核苷酸。
14.根据权利要求1至13中任一项所述的方法,其中与所述靶核酸分子的区域互补的序列的长度为10至60个核苷酸。
15.根据权利要求1至4中任一项所述的方法,其中每个侧翼序列的长度为12至50个核苷酸。
16.根据权利要求1至14中任一项所述的方法,其中所述NPPF包含位于5'端和3'端的侧翼序列,并且其中所述位于5'端的侧翼序列与所述位于3'端的侧翼序列不同。
17.根据权利要求1至16中任一项所述的方法,其中所述FAR的长度为100至200个核苷酸。
18.根据权利要求1-17中任一项所述的方法,其中所述至少一种靶DNA引物包括50℃至62℃的Tm,并且所述第一和第二扩增引物包括50℃至62℃的Tm。
19.根据权利要求1至18中任一项所述的方法,其中所述靶RNA分子是经固定的、交联的或不溶的。
20.根据权利要求1至19中任一项所述的方法,其中所述样品是经固定的。
21.根据权利要求1至20中任一项所述的方法,其中所述样品是经福尔马林固定的。
22.根据权利要求1至21中任一项所述的方法,其中所述NPPF是DNA,并且所述核酸酶包括核酸外切酶、核酸内切酶或其组合。
23.根据权利要求1至22中任一项所述的方法,其中所述对单链核酸分子具有特异性的核酸酶包括S1核酸酶。
24.根据权利要求1至23中任一项所述的方法,其中所述方法同时对多个样品中一种或更多种靶RNA分子和一种或更多种靶DNA分子进行测序或检测。
25.根据权利要求1至24中任一项所述的方法,其中所述方法对至少两种不同的靶RNA分子进行测序或检测,并且其中所述样品与至少两种不同的NPPF接触,每种NPPF对不同的靶RNA分子具有特异性。
26.根据权利要求1至25中任一项所述的方法,其中所述方法对至少两种不同的靶RNA分子进行测序或检测,并且其中使所述样品与对所述至少两种不同的靶RNA分子具有特异性的至少一种NPPF接触。
27.根据权利要求1至25中任一项所述的方法,其中所述方法对至少两种不同的靶DNA分子进行测序或检测,其中所述至少两种不同的靶DNA分子包括野生型基因序列和所述基因序列中的至少一个突变。
28.根据权利要求1至27中任一项所述的方法,其中对多个样品进行所述方法并且在所述多个样品的每一个中检测到至少两种不同的靶RNA分子和至少两种不同的靶DNA分子。
29.根据权利要求1至28中任一项所述的方法,其中至少一种NPPF对miRNA靶核酸分子具有特异性,并且至少一种NPPF对mRNA靶核酸分子具有特异性。
30.根据权利要求1至29中任一项所述的方法,其中所述至少一种NPPF包括至少10种不同的NPPF。
31.根据权利要求1至30中任一项所述的方法,其中测序包括二代测序或单分子测序。
32.根据权利要求1至31中任一项所述的方法,其中确定所述至少一种靶DNA分子的序列确定所述靶DNA分子是否包含点突变、插入和/或缺失,并且确定所述至少一种靶RNA分子的序列确定所述靶RNA分子的丰度。
33.根据权利要求2至32中任一项所述的方法,进一步包括
在所述测序之前,
在使用至少一种靶DNA引物从所述裂解物的第一部分扩增所述靶DNA之后去除扩增引物,
在扩增所述FAR和所述单链NPPF之后去除所述第一和第二扩增引物,
或两者。
34.根据权利要求2至33中任一项所述的方法,其中所述实验标签包括允许识别样品、受试者、治疗或者靶RNA或DNA分子的核酸序列。
35.根据权利要求2至34中任一项所述的方法,其中所述测序接头包含允许捕获到测序平台上的核酸序列。
36.根据权利要求2至35中任一项所述的方法,其中在扩增所述FAR和所述单链NPPF之后,所述实验标签或测序接头存在于所述FAR扩增子和NPPF扩增子的5'端或3'端。
37.根据权利要求1-36中任一项所述的方法,进一步包括:
将至少一种NPPF扩增子序列与参考数据库进行比较,并且确定每个已识别的至少一种NPPF扩增子序列的数量;和/或
将至少一种FAR扩增子序列与参考数据库进行比较,并且确定所述至少一种FAR扩增子序列中的任何突变。
38.根据权利要求1-36中任一项所述的方法,其中所述至少一种靶DNA引物在其3'端的最后两个碱基之间包含硫代磷酸酯连接。
39.一种分离的核酸分子,包含SEQ ID NO:4-13和17-32中任一项的核酸序列或由其组成。
40.一组核酸引物,包括:
SEQ ID NO:4和5;
SEQ ID NO:6和7;
SEQ ID NO:8和9;
SEQ ID NO:10和11;
SEQ ID NO:12和13;
SEQ ID NO:17和18;
SEQ ID NO:19和20;
SEQ ID NO:21和22;
SEQ ID NO:23和24;
SEQ ID NO:25和26;
SEQ ID NO:27和28;
SEQ ID NO:29和30;
SEQ ID NO:31和32;或
其组合。
CN201980093249.2A 2018-12-31 2019-12-02 检测同一样品中dna和rna的方法 Pending CN113518829A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862787114P 2018-12-31 2018-12-31
US62/787,114 2018-12-31
PCT/US2019/064041 WO2020142153A1 (en) 2018-12-31 2019-12-02 Methods of detecting dna and rna in the same sample

Publications (1)

Publication Number Publication Date
CN113518829A true CN113518829A (zh) 2021-10-19

Family

ID=69056138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980093249.2A Pending CN113518829A (zh) 2018-12-31 2019-12-02 检测同一样品中dna和rna的方法

Country Status (8)

Country Link
US (1) US20220106640A1 (zh)
EP (1) EP3906321A1 (zh)
JP (1) JP2022515639A (zh)
CN (1) CN113518829A (zh)
AU (1) AU2019418340A1 (zh)
BR (1) BR112021012938A2 (zh)
CA (1) CA3124489A1 (zh)
WO (1) WO2020142153A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115747208A (zh) * 2022-11-14 2023-03-07 南京诺唯赞生物科技股份有限公司 一种dna/rna混合物的处理方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024059622A2 (en) * 2022-09-13 2024-03-21 Board Of Regents, The University Of Texas System Methods for simultaneous amplification of dna and rna

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103649335A (zh) * 2011-05-04 2014-03-19 Htg分子诊断有限公司 定量核酸酶保护测定(qnpa)和测序(qnps)的改进
US20140243238A1 (en) * 2011-09-28 2014-08-28 Htg Molecular Diagnostics, Inc. Methods of co-detecting mrna and small non-coding rna
CN104854241A (zh) * 2012-05-25 2015-08-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
CN108026568A (zh) * 2016-01-31 2018-05-11 阿费梅特里克斯公司 通过结合条形码标记的多核苷酸探针进行核酸分析
CN109072296A (zh) * 2016-02-11 2018-12-21 Htg分子诊断有限公司 利用核酸酶保护进行直接标靶测序的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
AU2010315303B2 (en) 2009-11-03 2015-08-06 Htg Molecular Diagnostics, Inc. Quantitative Nuclease Protection Sequencing (qNPS)

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103649335A (zh) * 2011-05-04 2014-03-19 Htg分子诊断有限公司 定量核酸酶保护测定(qnpa)和测序(qnps)的改进
US20140087954A1 (en) * 2011-05-04 2014-03-27 Htg Molecular Diagnostics, Inc. Quantitative nuclease protection assay (qnpa) and sequencing (qnps) improvements
US20140243238A1 (en) * 2011-09-28 2014-08-28 Htg Molecular Diagnostics, Inc. Methods of co-detecting mrna and small non-coding rna
CN104854241A (zh) * 2012-05-25 2015-08-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
CN108026568A (zh) * 2016-01-31 2018-05-11 阿费梅特里克斯公司 通过结合条形码标记的多核苷酸探针进行核酸分析
CN109072296A (zh) * 2016-02-11 2018-12-21 Htg分子诊断有限公司 利用核酸酶保护进行直接标靶测序的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115747208A (zh) * 2022-11-14 2023-03-07 南京诺唯赞生物科技股份有限公司 一种dna/rna混合物的处理方法
CN115747208B (zh) * 2022-11-14 2023-08-29 南京诺唯赞生物科技股份有限公司 一种dna/rna混合物的处理方法

Also Published As

Publication number Publication date
AU2019418340A1 (en) 2021-07-22
WO2020142153A1 (en) 2020-07-09
CA3124489A1 (en) 2020-07-09
EP3906321A1 (en) 2021-11-10
US20220106640A1 (en) 2022-04-07
JP2022515639A (ja) 2022-02-21
BR112021012938A2 (pt) 2021-09-14

Similar Documents

Publication Publication Date Title
JP7256748B2 (ja) エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法
EP2705165B1 (en) Quantitative nuclease protection assay (qnpa) and sequencing (qnps) improvements
CN108699553B (zh) 用于筛选甲状腺癌中突变的组合物和方法
EP2496715B1 (en) Quantitative nuclease protection sequencing (qnps)
EP2929048B1 (en) Restriction enzyme-free target enrichment
EP3899029A1 (en) Nuclease-based rna depletion
EP3390671B1 (en) Method of direct target sequencing using nuclease protection
CN113518829A (zh) 检测同一样品中dna和rna的方法
US20220136043A1 (en) Systems and methods for separating decoded arrays
US11913062B2 (en) System and method for isolation and qualification of nucleic acids
JP2020516274A (ja) ライブラリーの定量および定性
AU2015203545A1 (en) Quantitative nuclease protection assay (qnpa) and sequencing (qnps) improvements
WO2023034747A1 (en) Epitranscriptome evaluation
CN105247076B (zh) 使用拼装序列扩增片段化的目标核酸的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20211019

WD01 Invention patent application deemed withdrawn after publication