CN111154845A - 借助于茎环反向多核苷酸的直接rna纳米孔测序 - Google Patents

借助于茎环反向多核苷酸的直接rna纳米孔测序 Download PDF

Info

Publication number
CN111154845A
CN111154845A CN201911077294.7A CN201911077294A CN111154845A CN 111154845 A CN111154845 A CN 111154845A CN 201911077294 A CN201911077294 A CN 201911077294A CN 111154845 A CN111154845 A CN 111154845A
Authority
CN
China
Prior art keywords
polynucleotide
rna
stem
rna polynucleotide
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911077294.7A
Other languages
English (en)
Other versions
CN111154845B (zh
Inventor
黄意巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Healthcare GmbH
Original Assignee
Siemens Healthcare GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Healthcare GmbH filed Critical Siemens Healthcare GmbH
Publication of CN111154845A publication Critical patent/CN111154845A/zh
Application granted granted Critical
Publication of CN111154845B publication Critical patent/CN111154845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请提供了借助于茎环反向多核苷酸的直接RNA纳米孔测序。本发明涉及表征目标RNA多核苷酸的方法,包括:提供RNA多核苷酸;通过使包含3'末端随机多聚体节段且具有茎环形式的多核苷酸退火和连接来修饰RNA多核苷酸;任选进行RNA多核苷酸的反转录;切割退火的多核苷酸的茎环节段以产生3'A悬突;将与RNA移位酶关联的接头多核苷酸复合物和至少一种胆固醇系连节段连接至获得的多核苷酸;将获得的修饰RNA多核苷酸与跨膜孔接触从而使RNA移位酶控制RNA多核苷酸通过跨膜孔移动且胆固醇系连将RNA多核苷酸锚定在跨膜孔附近;以及在RNA多核苷酸通过跨膜孔移动期间,进行一次或多次测量。

Description

借助于茎环反向多核苷酸的直接RNA纳米孔测序
技术领域
本发明涉及表征目标RNA多核苷酸(靶RNA多核苷酸)的方法,其包括:(i)提供RNA多核苷酸;(ii)通过使包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸退火和连接来修饰所述RNA多核苷酸;(iii)任选地进行所述RNA多核苷酸的反转录;(iv)切割所述退火的多核苷酸的茎环节段以产生3'A悬突(悬突部分、悬端,overhang);(v)将与RNA移位酶关联(结合,associate)的接头(adaptor)多核苷酸复合物和至少一种胆固醇系连节段(cholesterol tether segment)连接至步骤(iv)中所获得的多核苷酸;(vi)将步骤(v)中所获得的修饰的RNA多核苷酸与跨膜孔接触从而使得所述RNA移位酶控制所述RNA多核苷酸通过所述跨膜孔移动并且所述胆固醇系连将所述RNA多核苷酸锚定在所述跨膜孔的附近;和(vii)在所述RNA多核苷酸通过所述跨膜孔的移动期间,进行一次或多次测量,其中所述测量指示所述RNA多核苷酸的一种或多种特征,借此表征所述目标RNA多核苷酸。还提供了用于表征目标RNA多核苷酸的试剂盒以及包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸用于RNA多核苷酸修饰的用途。
背景技术
转录组学的一般目标是对样品中所有转录物质进行完全测序,确定基因(包括剪接变体和融合基因)的转录结构,定量不同发展(发育)阶段和不同环境中的转录本的表达水平的变化,以及确定在生物细胞中所发生的反义转录。用于下一代RNA-测序的最广泛使用的策略包括多聚-T引发或者核糖核酸(RNA)片段化,随后进行合成互补DNA(cDNA)的随机六聚体起始。然后,通常使用包括PCR的文库制备方法来制备这些cDNA链,用于在给定测序系统上进行分析。然而,在文库制备中所使用的PCR的类型将引入偏差。例如,所得文库将不如mRNA的总量复杂(丰富),因为并非所有的转录本都将以相同的效率扩增,从而导致了某些RNA物质消失而其他物质过度扩增。另外,PCR扩增产生了原始RNA链的合成拷贝并且潜在的表观遗传信息(epigenetic information)可能会丢失。因此,在出于测序目的的文库制备期间,显然需要较高程度地避免RNA分子的扩增。
基于PCR的文库制备的例外情况包括Illumina平台上的FRT-Seq,其中在杂交至流动池(流动槽,flow cell)表面的RNA单链上进行第一链cDNA合成反应。另一个实例是Helicos平台上的直接RNA测序,它是使用天然RNA链作为模板的边合成边测序(sequencing-by-synthesis)反应。在两种情况下,均避免了PCR扩增,从而除去了失真(distortion)的来源,因此所获得的数据更加如实地反映原始样品中RNA的丰度。然而,这些方法仍基于原始RNA链的合成拷贝,从而未保留有关修饰的信息。另外,两种方法必然产生短序列读序(read),这些读序有些不利,因为真核生物中的转录本通常经历可替换的剪接,从而产生多种不同的同种型,例如,具有不同的转录起始位点、编码序列和非翻译区。然而,短读序测序通常不能跨过整个转录本并且可能错过新的剪接变体。
Oxford Nanopore Technologies开发了新的直接RNA测序方法。这种方法(图1中也示出了这种方法)是基于多聚-T引物对mRNA分子的多聚-A-尾的退火。因此,它排他性地只有在使用具有多聚-A尾的RNA分子时才有效,排除了所有其他RNA分子。
因此,需要一种改进的直接RNA测序方法,使得能够对所有RNA物质测序,即,也包括那些不具有多聚-A-尾的RNA分子。
发明内容
本发明解决了这种需求,并且提供了表征目标RNA多核苷酸的方法,其包括:(i)提供RNA多核苷酸;(ii)通过使包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸退火和连接来修饰所述RNA多核苷酸;(iii)任选地进行所述RNA多核苷酸的反转录;(iv)切割所述退火的多核苷酸的茎环节段以产生3'A悬突;(v)将与RNA移位酶关联的接头多核苷酸复合物和至少一种胆固醇系连节段连接至步骤(iv)中所获得的多核苷酸;(vi)将步骤(v)中所获得的修饰的RNA多核苷酸与跨膜孔接触从而使得所述RNA移位酶控制所述RNA多核苷酸通过所述跨膜孔移动并且所述胆固醇系连(tether)将所述RNA多核苷酸锚定在所述跨膜孔的附近;和(vii)在所述RNA多核苷酸通过所述跨膜孔移动期间,进行一次或多次测量,其中所述测量指示所述RNA多核苷酸的一种或多种特征,借此表征所述目标RNA多核苷酸。
基于随机多聚体序列,本发明所述的方法有利地使得能够使用所有RNA物质,而不是仅包含多聚-A-尾的那些RNA物质(即mRNA)来进行直接RNA测序。因此,还可以对不同来源的mRNA片段进行测序。所述茎环多核苷酸进一步使得转录本稳定,并且使得可在所述茎环多核苷酸的3'端呈现随机多聚体。此外,所述茎环多核苷酸中限制性内切酶(限制酶)识别位点的存在进一步使得所述多核苷酸能够被切割,从而产生3'A悬突,3'A悬突随后可以用于连接与RNA移位酶(其为RNA分子移位通过跨膜孔所必需的)关联的接头多核苷酸复合物从而获得其序列。
在另一个方面,本发明涉及制备用于跨膜测序的目标RNA多核苷酸的方法,其包括:(i)提供RNA多核苷酸;(ii)通过使包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸退火和连接来修饰所述RNA多核苷酸;(iii)任选地进行所述RNA多核苷酸的反转录;(iv)切割所述退火的多核苷酸的茎环节段以产生3'A悬突;以及(v)将与RNA移位酶关联的接头多核苷酸复合物和至少一种胆固醇系连节段连接至步骤(iv)中所获得的多核苷酸。
在上述方法的一个实施方式中,所述包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸是包含一个或多个非DNA核苷酸的DNA多核苷酸。
优选地,所述包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸包含一个或多个5-甲基-isoC(异胞嘧啶)-isoG(异鸟嘌呤)碱基对。
在其他实施方式中,至少在所述茎环多核苷酸的每个第4、第5或第6位置处提供所述5-甲基-isoC-isoG碱基对。
在本发明的其他实施方式中,所述随机多聚体节段是随机六聚体、随机七聚体、随机八聚体、随机九聚体或随机十聚体节段。优选地,所述随机多聚体节段是随机六聚体节段。
根据本发明的另一个实施方式,所述包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸包含序列5'-ACAGT-3'或者5'-TCAGA-3'的限制性内切酶识别位点。
在其他实施方式中,酶Hpy188I用于切割限制性内切酶识别位点5'-TCAGA-3';或者酶Bst4CI、HpyCH4III或TaaI用于切割限制性内切酶识别位点5'-ACAGT-3'。
在另一个实施方式中,所述包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸还包含条形码部分(barcoding section)。
在本发明的另一个实施方式中,在所述RNA多核苷酸移位通过所述跨膜孔期间所测量的所述RNA多核苷酸的一种或多种特征为:(i)RNA多核苷酸的长度,(ii)RNA多核苷酸的特性(身份、个性、独特性,identity),(iii)RNA多核苷酸的序列,和(iv)RNA多核苷酸中核苷酸修饰的存在。优选地,要测量的特征是RNA多核苷酸的序列。
在其他实施方式中,所述RNA多核苷酸是任何RNA多核苷酸。在具体的实施方式中,它是mRNA、mRNA片段、前体mRNA(pre-mRNA)、ncRNA、rRNA、miRNA、snoRNA、srRNA、tmRNA、siRNA或piRNA。
在另一个实施方式中,根据本发明,所述RNA移位酶是SF2解旋酶(helicase)、NS3解旋酶、NPH-II解旋酶、Upf1解旋酶或RIG-I移位酶或其衍生物,或者能够移位RNA多核苷酸的DNA解旋酶(如Hel308解旋酶、RecD解旋酶、XPD解旋酶或Dda解旋酶)的衍生物。
根据其他实施方式,所述跨膜孔蛋白是来源于溶血素(hemolysin)、杀白细胞素(leukocidin)、MspA、MspB、MspC、MspD、CsgG、胞溶素(lysenin)、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A、奈瑟氏球菌(Neisseria)自转运蛋白脂蛋白(NalP,Neisseria autotransporter lipoprotein)或WZA的孔蛋白。
在另一个方面,本发明涉及用于表征包含含有3'末端随机多聚体节段并且具有茎环形式的多核苷酸的目标RNA多核苷酸的试剂盒,其中所述茎环形式包含一个或多个5-甲基-isoC-isoG碱基对,目标RNA多核苷酸优选地包含如本文所定义的具有3'末端随机多聚体节段并且具有茎环形式的多核苷酸。
在另一个方面,本发明涉及包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸的用途,其中所述茎环形式包含用于RNA多核苷酸修饰的一个或多个5-甲基-isoC-isoG碱基对,借此制备用于通过跨膜孔直接RNA测序的所述RNA多核苷酸。
应理解,不仅可以在所指明的各个组合中使用上述特征和以下将解释的那些特征,而且还可以在不背离本发明范围的情况下,在其他组合中或单独使用。
附图说明
图1示出了受限于包含多聚-A-尾的RNA多核苷酸的RNA测序方法的示意图。
图2示出了根据本发明实施方式的所述方法步骤的示意图,其包括使用包含茎环形式的多核苷酸,提供随机多聚体,向所述分子添加移位酶和系连元件,以及通过经由跨膜孔的移位来确定序列。
图3示出了根据本发明实施方式的包含茎环形式的多核苷酸的实例。
具体实施方式
尽管将针对具体实施方式描述本发明,但是这种描述不应视为限制性含义。
在详细描述本发明的示例性实施方式之前,提供了对于理解本发明来说重要的定义。
除非上下文明确规定其他情形,否则如在本说明书和在所附权利要求中所使用的,单数形式的“一个”和“一种”还包括各自的复数形式。
在本发明的背景中,术语“约”和“大约”表示本领域技术人员将理解仍能确保所讨论的特征的技术效果的准确度区间。该术语通常表示与所指明的数值偏差±20%,优选±15%,更优选±10%,并且甚至更优选±5%。
应理解术语“包含(包括)”不是限制性的。出于本发明的目的,术语“由...组成”或者“基本上由...组成”被认为是术语“包含”的优选实施方式。如果在下文中将组定义为包含至少一定数目的实施方式,则这表示还涵盖了优选仅由这些实施方式组成的组。
此外,说明书或权利要求中的术语“(i)”、“(ii)”、“(iii)”,或者“(a)”、“(b)”、“(c)”、“(d)”,或者“第一”、“第二”、“第三”等用于区分类似的元素(元件)并且不必然用于描述顺序或时间次序。
应理解,在适当情况下,所使用的术语是可互换的,本文所述的本发明的实施方式能够以不同于本文中所述或所示的其他顺序操作。除非另外说明,否则在术语涉及方法、程序或应用步骤的情况下,步骤之间没有时间或时间间隔连贯性,即可以同时进行所述步骤或者在这些步骤之间可以存在数秒、数分钟、数小时、数天、数周等的时间间隔。
应理解,本发明不局限于本文所述的具体方法、规程等,因为这些是可以变化的。还应理解,本文所使用的术语仅出于描述具体实施方式的目的,不旨在限制本发明的范围(其仅由所附权利要求限定)。
附图应认为是示意图,并且附图所示的元件不必按比例显示。相反,示出了多个元件,使得它们的功能和一般目的对于本领域技术人员将变得显而易见。
除非另外定义,否则本文所使用的所有技术和科学术语具有与本领域技术人员通常理解的含义相同的含义。
如上所述,在一个方面,本发明涉及表征目标RNA多核苷酸的方法,其包括:(i)提供RNA多核苷酸;(ii)通过使包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸退火和连接来修饰所述RNA多核苷酸;(iii)任选地进行所述RNA多核苷酸的反转录;(iv)切割所述退火的多核苷酸的茎环节段以产生3'A悬突;(v)将与RNA移位酶关联的接头多核苷酸复合物和至少一种胆固醇系连节段连接至步骤(iv)中所获得的多核苷酸;(vi)将步骤(v)中所获得的修饰的RNA多核苷酸与跨膜孔接触从而使得所述RNA移位酶控制所述RNA多核苷酸通过所述跨膜孔移动并且所述胆固醇系连将所述RNA多核苷酸锚定在所述跨膜孔附近;和(vii)在所述RNA多核苷酸通过所述跨膜孔移动期间,进行一次或多次测量,其中所述测量指示所述RNA多核苷酸的一种或多种特征,借此表征所述目标RNA多核苷酸。
因此,在本发明所述方法的第一步中提供了RNA多核苷酸。
如本文所使用的术语“RNA多核苷酸”或者“目标RNA多核苷酸”涉及任何包含两个或更多个核糖核苷酸的大分子。核糖核苷酸通常含有核碱基、核糖和至少一种磷酸基。核碱基通常是腺嘌呤、鸟嘌呤、胞嘧啶和尿嘧啶。RNA多核苷酸通常是单链分子,然而,还可以通过部分互补碱基配对以双链形式提供。RNA多核苷酸通常不形成长的双螺旋延伸(链段,stretch)。RNA多核苷酸可以是天然存在的或者是人工的。除上述元件(要素)之外,它可以包含修饰,如氧化或甲基化核苷酸。在某些实施方式中,RNA多核苷酸还可以包含人工添加物,如标签或标记物。
RNA多核苷酸可以具有任何可能来源,例如,原核、真核、古细菌或病毒来源。根据本发明要表征的RNA多核苷酸可以具有任何已知可能的生物学或细胞学功能。例如,它可以是任何天然存在的或合成的多核苷酸,如信使RNA(mRNA)、核糖体RNA(rRNA)、不均一核RNA(hnRNA)、转运RNA(tRNA)、转运信使RNA(tmRNA)、微小RNA(miRNA)、小核RNA(snRNA)、剪接前导RNA(SL RNA)、核仁小RNA(snoRNA)、反义RNA(asRNA)、向导RNA(gRNA)、长链非编码RNA(lncRNA)、小干扰RNA(siRNA)、Piwi-相互作用RNA(piRNA)、反式作用RNA(tasiRNA)、前体mRNA(pre-mRNA)或重复相关siRNA(rasiRNA)。所提及的RNA物质(种类,species)通常在尺寸、核苷酸组成、折叠状态以及是否存在3'延伸方面不同。例如,真核生物中的mRNA分子通常包含3'多聚-A尾,其由多个单磷酸腺苷构成并且在转录之后通过多聚腺苷酸聚合酶连接至所述分子。其他RNA物质或真核mRNA的片段可以不包含这种延伸。例如,前体mRNA(pre-mRNA)是尚未被多聚腺苷酸聚合酶修饰的包含内含子序列的未加工mRNA分子。在优选的实施方式中,所述目标RNA多核苷酸是mRNA、mRNA片段、前体mRNA分子、ncRNA、miRNA、snoRNA、tmRNA、siRNA或piRNA。特别优选地,所述目标RNA是在3'端不包含多聚-A尾或者寡聚-A尾的RNA多核苷酸。例如,不包含mRNA 3'部分的mRNA多核苷酸片段通常不包含多聚-A尾。另外,前体mRNA分子通常不包含多聚-A尾。类似地,不属于真核mRNA组的RNA多核苷酸物质通常不包含多聚-A延伸。这些物质是优选的目标,这是因为:由于不需要存在多聚-A延伸,因此本发明所述的方法能够表征这些多核苷酸。在某些实施方式中,所述目标RNA多核苷酸还可以是典型的真核mRNA分子,其也可以根据本发明进行表征。
RNA多核苷酸的提供可以包括RNA分子的提取和/或纯化,例如,通过异硫氰酸胍裂解、与细胞碎片分离、过滤、柱(如二氧化硅膜柱)洗脱、离心、消化(例如,DNA酶消化)、或除去样品中核苷酸或蛋白组分等。优选在包含防止RNA降解的任何适合成分的缓冲溶液中提供所述RNA多核苷酸。所述缓冲液可以例如是包含EDTA(例如,0.1mM)或者TE缓冲液(10mMTris,1mM EDTA)的不含RNA酶的H2O缓冲液。所述缓冲液可以优选包含RNA酶阻断化合物或者RNA酶抑制剂,如RNaseZap、Superase、RNaseOUT、核糖核酸酶抑制剂、RNasin等。
在其他实施方式中,RNA多核苷酸的提供还可以包括采用适合条件以保持RNA分子或其部分处于单链形式。这些条件可以包括在本发明所述方法实施之前或实施期间,采用特定的温度或温度范围,和/或采用特定的缓冲液或盐条件以避免所述RNA分子形成二级结构。优选通过短暂的热变性使所述RNA多核苷酸或其部分成为单链。例如,当使如本文所述的包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸退火时,可以应用这种短暂的热变性。
RNA多核苷酸的提供还可以包括从受试者采集样品以及对它们进行处理,例如,RNA提取或者有利于RNA提取的准备步骤。如本文所使用的术语“来自受试者的样品”涉及通过本领域技术人员已知的适合方法从受试者获得的任何生物材料。应优选以临床可接受的方式,更优选以保留RNA多核苷酸的方式采集在本发明背景中所使用的样品。所述生物样品可以包括身体组织和/或流体,如血液、或血液组分(如血清或血浆)、汗液、痰液或唾液、精液和尿液以及排泄物或粪便样品。此外,所述生物样品可以含有来源于上皮细胞的细胞提取物或者包括上皮细胞的细胞群体,优选肿瘤上皮细胞或者来源于怀疑为肿瘤组织的上皮细胞。作为另外一种选择,所述生物样品可以来源于环境,例如,来源于土壤、湖、河等,或者来源于动物来源。
在某些实施方式中,细胞可以用作RNA多核苷酸的原始来源。因此,如有必要,可以从所获得的身体组织和流体中纯化细胞,然后进一步处理以获得RNA多核苷酸。在某些实施方式中,可以将样品(具体地,初始处理之后的样品)汇集(合并,pool)。本发明优选考虑使用非汇集样品。
在本发明的具体实施方式中,还可以对生物样品的成分(内容物,content)进行富集步骤。例如,样品可以与对于某些细胞类型的细胞膜或细胞器特异的配体接触,所述配体例如用磁性颗粒官能化(功能化)。随后,借助磁性颗粒而浓缩(聚集)的材料可以用于RNA多核苷酸的提取。在本发明的其他实施方式中,可以获得和/或使用活组织检查或切除样品。这些样品可以包含细胞或细胞裂解液。此外,可以通过流体或液体样品(例如,血液、尿液、汗液等)的过滤处理来富集细胞(例如,肿瘤细胞)。这些过滤处理还可以与如上文所述的基于配体特异性相互作用的富集步骤相结合。
在本发明所述方法的下一步中,修饰如上所述的RNA多核苷酸。所述修饰首先是通过包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸的退火。如本文所使用的术语“退火多核苷酸”涉及单链RNA多核苷酸与互补的单链多核苷酸通过氢键配对形成双链多核苷酸。所述互补的多核苷酸可以是RNA分子或DNA多核苷酸中的任一种。它还可以包含一个或多个修饰,如包含一个或多个非天然存在的核苷酸、对核苷酸的化学修饰、标签或间隔元件的存在等。优选所述互补的多核苷酸是DNA多核苷酸或修饰的DNA多核苷酸。
退火多核苷酸可以具有任何适合的总尺寸或长度,例如,它可以具有约20至100个核苷酸的总长度,优选地,约25至75个核苷酸的总长度,更优选地,约30至50个核苷酸,例如,30、35、40、45或50个核苷酸的总长度,或者在所提及数值之间的任何总长度。
如本文所使用的术语“3'末端随机多聚体”表示能够与所述RNA多核苷酸退火的互补区在3'末端具有多聚体随机序列。相应节段通常是单链的并因此能够形成氢键,从而导致产生包含所述RNA多核苷酸和与之退火的第二多核苷酸的双链多核苷酸。这些随机节段可以包含具有随机碱基序列(即无预定序列)的5至15个核苷酸。所述随机碱基序列通常涵盖了在所覆盖的延伸中所有的序列可能性,包括单核苷酸延伸,如多聚-T、多聚-A、多聚-G、多聚-C。因此,将所述多核苷酸用作一组不同的多核苷酸以涵盖所有的可能性。用于退火步骤的不同多核苷酸的数目取决于通过长序列所覆盖的序列的尺寸,与短序列相比,长序列需要更多不同多核苷酸以涵盖所有可能的序列变化。优选地,所述随机节段包含6、7、8、9或10个核苷酸,即所述随机节段是六聚体、七聚体、八聚体、九聚体或十聚体。特别优选使用6个核苷酸(六聚体)。所述随机多聚体的存在使得能够与所存在的任何RNA多核苷酸退火,而与所述RNA多核苷酸的序列或者多聚-A尾的存在无关。因此,有利的是,可以不仅表征mRNA分子,而且还表征其非多聚-A片段,以及任何其他RNA分子。
如本文所使用的术语“茎环形式”表示与所述RNA多核苷酸退火的多核苷酸在邻近于所述随机多聚体节段的部分中包含部分双链的节段,所述节段包含双链的茎部分以及连接所述双链部分的发夹或发夹环部分。因此,所述茎部分通常包含同一链的两个区,当以相反方向读取时,其核苷酸序列是互补的。这些节段可以碱基配对并形成以未配对环结束的双螺旋。
不希望受理论束缚,据信茎环结构的形成取决于所产生的螺旋和环区的稳定性。第一必要条件通常是可以向后折叠到自身上以形成配对双螺旋的序列的存在。主要可以通过其长度、其可含有的错配或凸出(bulge)的数目以及配对区的碱基组成来确定这种螺旋的稳定性。由于鸟嘌呤和胞嘧啶之间的配对具有三个氢键,因此与仅具有两个氢键的腺嘌呤-胸腺嘧啶配对相比,它们更稳定。在特定实施方式中,所述茎节段包含比腺嘌呤-胸腺嘧啶配对更多的鸟嘌呤-胞嘧啶配对。
此外,环的稳定性可对茎环结构的形成具有影响。优选地,所述发夹环不小于三个碱基,例如,为4、5、6、7、8或更多个碱基长度。还优选地,所述环不长于约10至12个碱基,因为大环通常往往是不稳定的。在某些实施方式中,所述环可具有大于12个碱基的尺寸并且显示出其他二级结构,如假结结构(伪结结构,pseudoknot)。特别优选地,所述环具有约4-8个碱基的长度。在一些实施方式中,所述环具有序列5'-TNCG-3',即它是四环(四元环),该四环由于其组成核苷酸的碱基堆积相互作用(base-stacking interaction)而稳定化。
在本发明优选的实施方式中,通过所述多核苷酸中非DNA核苷酸的存在使所述茎环形式稳定化。如本文所使用的术语“非DNA核苷酸”涉及非天然存在的人工核苷酸。优选地,所述人工核苷酸产生强于胞嘧啶-鸟嘌呤和腺嘌呤-胸腺嘧啶的碱基配对。这些核苷酸的实例是5-甲基-异-胞嘧啶和异-鸟嘌呤。这些核苷酸的其他详细信息是技术人员已知的并且可以获自适合的文献来源,如Bande等人,Chem.Eur.J.,2015,21,5009-5022。根据本发明的实施方式,通过其随机多聚体与目标RNA多核苷酸退火的多核苷酸包含一个或多个以允许碱基配对的方式定位的5-甲基-异-胞嘧啶和异-鸟嘌呤核苷酸。优选地,所述碱基配对导致了如上所述的发夹环,优选4至8个碱基的发夹环的存在。
在其他优选的实施方式中,根据本发明所述的退火多核苷酸的茎环节段包含2、3、4、5、6、7、8、9、10或更多个5-甲基-异-胞嘧啶和异-鸟嘌呤碱基配对。通常,可以彼此相距一定距离来提供这些碱基配对。例如,根据本发明所述的退火多核苷酸的茎环节段可以设计使得在所述茎环节段的每个第4、第5或第6位置处出现5-甲基-异-胞嘧啶和异-鸟嘌呤碱基配对。还设想了不同的距离,如在所述茎环节段的每个第2、第3位置处,或者在较长结构的情况下,在每个第7、第8或第9个位置处存在5-甲基-异-胞嘧啶和异-鸟嘌呤碱基配对。可以进一步改变所述位置,例如,可以将2个或更多个,例如,2、3、4个5-甲基-异-胞嘧啶和异-鸟嘌呤碱基配对聚簇(聚集成组,group),随后是没有这些碱基配对的链段,然后是单一的5-甲基-异-胞嘧啶和异-鸟嘌呤碱基配对或者是另一聚簇的2个或更多个碱基配对等。优选地,设计5-甲基-异-胞嘧啶和异-鸟嘌呤碱基配对,从而使得当结合至如本文所述的RNA多核苷酸时,它们能够避免破坏随机多聚体。所述茎环节段中不是5-甲基-异-胞嘧啶和异-鸟嘌呤碱基配对的碱基配对可以是G-C或A-T、或A-U碱基配对。优选地,所述碱基配对是G-C碱基配对。
如上所述的RNA多核苷酸的修饰,在退火之后,其次是如上所述的包含3'末端随机多聚体节段并且具有茎环形式的退火的多核苷酸与所述RNA多核苷酸连接。所述连接发生在所述退火的多核苷酸的5’末端。因此,本发明设想所述多核苷酸的5’末端包含磷酸酯残基。在某些实施方式中,例如,当它不存在时,可以通过磷酸化酶活性将这种磷酸酯残基加入至所述多核苷酸。适合的酶的实例是激酶,如T4多核苷酸激酶。
所述连接可以是化学或酶促连接。化学连接通常需要缩合剂(condensingreagent)的存在。本发明所设想的化学连接的实例利用亲电子磷酸硫酯基团。其他实例包括使用溴化氰作为缩合剂。
例如,随后可以使用技术人员已知的任何适合的酶促连接酶来进行要表征的RNA多核苷酸和如上所述的包含3'末端随机多聚体节段并且具有茎环形式的退火的多核苷酸之间的酶促连接。适合的连接酶的实例包括T4 DNA连接酶。作为另外一种选择,可以使用连接酶,如大肠杆菌(E.coli)DNA连接酶、Taq DNA连接酶、Tma DNA连接酶、9°N DNA连接酶、T4聚合酶1、T4聚合酶2或热稳定性5'App DNA/RNA连接酶。
为了使磷酸化和/或连接适当进行,提供适合的缓冲条件并且存在适合的成分。例如,对于磷酸化,需要提供ATP(例如,1mM)。适合的缓冲液还可以包含Tris-HCl,例如,浓度为50mM;MgCl2,例如,浓度为10mM;以及DTT,例如,浓度为10mM。可以将pH调节至7.8。
对于连接,例如,可以提供T4 DNA连接酶缓冲液、ATP(例如,10mM的量)和PEG(例如,50%的PEG8000)。对于不同的连接酶,例如,可以根据生产商的说明,改变这些条件。
本发明所述的方法通常不包括目标多核苷酸的扩增或反转录以减少表征目标RNA多核苷酸所需工作流的量。
然而,在某些实施方式中,可以任选地实施反转录步骤以获得RNA-cDNA构建体,其能够例如通过避免RNA二级或三级结构等来稳定所述RNA多核苷酸。因此,本发明在这些实施方式中设想了从包含3'末端随机多聚体节段并且具有茎环形式的退火的多核苷酸起始对所述RNA多核苷酸进行反转录。可以使用技术人员已知的任何适合的反转录酶进行反转录。这些适合的反转录酶的实例是不包含RNA酶H-活性的反转录酶。具体实例包括无RNA酶H活性的MMLV反转录酶或者可商购的反转录酶,如SuperScript、SuperScript II、SuperScript III、StrataScript等。
使用适合的缓冲液或在存在适合的缓冲液的情况下进行反转录酶反应。这种缓冲液例如可以包含Tris-HCl(例如,250mM的浓度)、KCl(例如,375mM的浓度)、MgCl2(例如,15mM的浓度)和DTT(例如,0.1M的浓度),优选pH为8.3。另外,必需使用适合量的dNTP,例如,dATP、dCTP、cGTP和cTTP,例如,其处于适合的浓度下,如10mM。
在根据本发明所述方法的下一步中,切割所述退火的多核苷酸的茎环节段。如本文所使用的术语“切割”是指双链核酸分子中的双链断口,即通过每条链的切口,通常通过限制性内切酶或限制性核酸内切酶进行。
可以通过任何适合的限制性内切酶进行切割。所述切割可以在所述茎环节段内的任何适合的位置发生。通常,所述切割可以发生在所述茎环节段的茎部分中。通过切割所述茎环节段的茎部分,可以在切割位点产生任何适合的末端。这种末端可以是粘性末端,即包含5'或3'悬突(overhang),或者可以是钝端,即没有悬突。优选获得粘性末端。还优选所述粘性末端是3'悬突。根据具体实施方式,所述悬突可以具有任何适合的长度,例如,1、2、3、4、5、6或更多个核苷酸。在特别优选的实施方式中,所述悬突是1个核苷酸的3'悬突。本发明还具体地设想了所述3'悬突是1个核苷酸的A悬突。
可以在任何适合的条件下进行切割。例如,所采用的限制性内切酶可以在适合的缓冲液中使用。例如,这种缓冲液可以包含NaCl(例如,50mM)、Tris-HCl(例如,10mM)、MgCl2(例如,10mM)和BSA(例如,100μg/ml);或者乙酸钾(例如,50mM)、Tris-乙酸盐(例如,20mM)、Mg-乙酸盐(例如,10mM)和BSA(例如,100μg/ml)、bis-Tris-丙烷-HCl(例如,10mM)、MgCl2(例如,10mM)和BSA(例如,100μg/ml)。所述缓冲液可例如具有7.9的pH。
在具体的实施方式组中,在限制性内切酶识别位点5'-ACAGT-3'或5'-TCAGA-3'进行切割。因此,根据本发明的包含3'末端随机多聚体节段和茎环形式的多核苷酸可以包含限制性内切酶识别位点5'-ACAGT-3'或5'-TCAGA-3'。可以作为单一位点或者以多(位点)形式提供所述位点。优选地,所述位点是单一位点。根据其他实施方式,可以在第三位置切割所述限制性内切酶识别位点5'-ACAGT-3'以获得5'-ACA/GT-3',因此提供1个核苷酸的3'悬突,更具体地提供1个核苷酸的3'A悬突。根据不同的实施方式,可以在第三位置切割所述限制性内切酶识别位点5'-TCAGA-3'以获得5'-TCA/GA-3',因此提供1个核苷酸的3'悬突,更具体地提供1个核苷酸的3'A悬突。可以在本发明所述方法内使用识别所提及的序列并且将其切割以获得1个核苷酸的3'悬突的任何限制性内切酶。
优选地,如本文以上所述的非DNA核苷酸,例如,5-甲基-isoC或isoG碱基不是限制性内切酶识别位点5'-ACAGT-3'或5'-TCAGA-3'的一部分。
在其他实施方式中,在本发明所述方法内使用酶Hpy188I以切割所述茎环节段。已知酶Hpy188I识别限制性内切酶识别位点5'-TCAGA-3'。在其他替代性实施方式中,在本发明所述方法内使用酶Bst4CI、HpyCH4III或TaaI以切割所述茎环节段。已知酶Bst4CI、HpyCH4III和TaaI识别限制性内切酶识别位点5'-ACAGT-3'。
因此,如果根据本发明所述的包含3'末端随机多聚体节段和茎环形式的多核苷酸的茎环节段包含限制性内切酶识别位点5'-TCAGA-3',则可以在本发明所述方法中使用同源性限制性内切酶Hpy188I来切割它。作为另外一种选择,如果根据本发明所述的包含3'末端随机多聚体节段和茎环形式的多核苷酸的茎环节段包含限制性内切酶识别位点5'-ACAGT-3',则可以在本发明所述方法中使用同源性限制性内切酶Bst4CI、HpyCH4III或TaaI来切割它。
如上所述根据本发明所述的包含3'末端随机多聚体节段和茎环形式的多核苷酸的茎环节段,在具体的实施方式中,还可以包含条形码部分。如本文所使用的术语“条形码部分”涉及人工包含在多核苷酸中、并且在表征步骤之后(例如,在测序之后)用于识别(identification)目的的序列。因此,所述条形码节段可以告知用户正在表征(例如,测序)的是若干样品中的哪一个。因此,条形码部分包含仅提供一次的独特序列,即仅用于如上所述的一个分子/多核苷酸。所述条形码序列优选地不同于已知的天然存在的序列基序。在其他实施方式中,优选地,所述条形码足够长以避免与天然存在的序列或者不同的条形码序列混淆。根据优选的实施方式,所述条形码序列具有至少6个至约12个或更多个核苷酸的长度。在某些实施方式中,条形码节段可以在本发明所述的多核苷酸中出现一次或多次。如果存在超过一个条形码节段,例如,2、3、4或5个或更多个,则每个节段的区分(即索引)序列是不同的,因此使得能够进行两个或更多个独立的识别方法。其他详细信息是技术人员已知的并且可以获自适合的文献来源,如Kozarewa等人,2011,Methods Mol.Biol.733,279-298。
在本发明所述方法的其他步骤中,将与RNA移位酶关联的接头(adaptor)多核苷酸复合物和至少一个胆固醇系连节段连接至在前一个步骤中所获得的多核苷酸(即与如本文以上所定义的多核苷酸关联的RNA多核苷酸,其已在所述多核苷酸的茎环部分中切割)。如本文所使用的术语“接头多核苷酸复合物”是指包含尤其有利于RNA移位酶进入跨膜孔的序列的非RNA多核苷酸的复合物。在本发明的具体实施方式中,所述接头多核苷酸复合物包含两个至少部分互补的非RNA多核苷酸对。所述非RNA多核苷酸可以包含一个或多个非RNA核苷酸;优选DNA多核苷酸。
在某些实施方式中,与RNA移位酶关联的接头复合物的一部分可以包含前导序列。通常,所述前导序列穿入如本文所述的跨膜孔中。所述前导序列还可以包含其他节段,如一个或多个间隔区。所述间隔区例如可以包含能够使RNA移位酶停留(stalling)的序列。特别优选地,所述前导序列包含RNA移位酶的结合位点。如本文所使用的术语“RNA移位酶结合位点”包括具有允许一个或多个RNA移位酶结合其上的长度的DNA或DNA类似物序列。结合位点的长度通常取决于应结合其上的RNA移位酶的数目。RNA移位酶能够结合的区域优选是多核苷酸,如DNA、修饰的多核苷酸(例如,脱碱基DNA)、PNA、LNA或聚乙二醇(PEG)。优选地,所述RNA移位酶结合位点是单链、非杂交区。因此,在优选的实施方式中,所述接头多核苷酸复合物预结合至一个或多个RNA移位酶。如本文所使用的术语“RNA移位酶”涉及马达蛋白(动力蛋白),其能够与如本文所述的跨膜孔相互作用并因此将多核苷酸作为单链实体(物质,entity)转运通过所述孔,即控制如本文所述的多核苷酸(例如,如上定义的RNA多核苷酸)的移位。适合的移位酶的实例包括SF2解旋酶、NS3解旋酶、NPH-II解旋酶、Upf1解旋酶或RIG-I移位酶或其衍生物,或者能够移位RNA多核苷酸的DNA解旋酶(如Hel308解旋酶、RecD解旋酶、XPD解旋酶或Dda解旋酶)的衍生物。
在其他实施方式中,所述前导序列可以包含能够防止所述RNA移位酶向后移动或者所述酶从所述跨膜孔的任何滑脱的一个或多个阻断位点。
所述接头多核苷酸复合物还可以结合至系连节段(tether segment)或者包含系连节段。如本文所使用的术语“系连节段”涉及能够将所述接头多核苷酸复合物和连接至其的任何其他元件连接(couple)至双分子层膜的元件。所述连接通常是瞬时的并且通过任何适合的分子(优选胆固醇实体或脂肪酸,更优选胆固醇实体,如胆固醇-TEG分子)提供。因此,所述连接帮助将所述接头多核苷酸复合物及其相关元件锚定在跨膜孔处或跨膜孔附近,并借此允许引入有待进入所述跨膜孔并进行表征的RNA多核苷酸。
可以用于连接至膜的替代化合物包括生物素、硫醇或脂质。除所述连接官能性之外,所述系连通常包括如上定义的非RNA多核苷酸,其连接至所述连接实体(例如,胆固醇实体)。所述系连节段还可以包括一个或多个连接子(接头,linker)节段,例如,具有不同长度的部分,其可以用于增加目标RNA多核苷酸和跨膜孔之间的距离以有利于其表征。在其他实施方式中,所述连接子可以包括如本文以上所定义的RNA移位酶结合位点。
可以通过退火和连接步骤进行所述多核苷酸复合物与在前一个步骤中所获得的多核苷酸的连接。例如,所述接头多核苷酸的一条链的5'T悬突可以与在用如本文以上所定义的限制性内切酶切割之后的根据本发明的包含茎环节段的多核苷酸中的3'A悬突退火。作为另外一种选择,可以使用任何其他适合的连接方法,例如,通过点击化学或共价键连等的化学附接。优选地,实施所述连接从而使得所述RNA移位酶连接至要表征的RNA多核苷酸,并且所述系连元件连接至互补链(例如,包括如本文以上所定义的茎环节段的一部分,任选地还包括通过如本文以上所述的反转录酶所产生的cDNA序列)。在所述接头复合物已连接至如本文所定义的多核苷酸和目标RNA多核苷酸之后,所述复合物的构型的示意性图示可以获自图2,标记符号为8和9。这种构型使得能够表征目标RNA多核苷酸,同时优选不表征任何任选存在的cDNA链,所述cDNA链是出于稳定性和构象原因才提供的。
在本发明所述方法的其他步骤中,将在先前步骤(v)中所获得的修饰的RNA多核苷酸与跨膜孔接触从而使得所述RNA移位酶控制所述RNA多核苷酸通过所述跨膜孔移动并且所述胆固醇系连将所述RNA多核苷酸锚定在所述跨膜孔的附近。通常,如本文所述的系连锚(tether anchor)的功能是将所述分子引至所述跨膜孔所位于的膜表面。在这种情况下,由于可以更容易地到达所述跨膜孔,因此有利于RNA多核苷酸的表征。如本文所使用的术语“跨膜孔”涉及跨过双层膜的蛋白,其包含能够引导多核苷酸(优选地,RNA或DNA多核苷酸,或其变化形式,例如,包含一个或多个非天然存在的核苷酸,如isoG或isoC,或其衍生物)通过的开孔。所述跨膜孔可以是任何适合的蛋白。优选的跨膜蛋白的实例包括来源于溶血素、杀白细胞素、MspA、MspB、MspC、MspD、CsgG、胞溶素、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A、奈瑟氏球菌(Neisseria)自转运蛋白脂蛋白(NalP)或WZA的孔蛋白。还设想了可商购的跨膜孔蛋白,如由Oxford Nanopore Technology提供或描述的孔蛋白。
在本发明所述方法的最后步骤中,在所述RNA多核苷酸通过所述跨膜孔移动期间,进行一个或多个测量。所述测量可以指示RNA多核苷酸的一种或多种特征,其使得能够表征所述目标RNA多核苷酸。如本文所使用的术语“测量”涉及跨膜孔处的光学和/或电学测量,优选涉及电学测量。通常,在目标RNA多核苷酸或与所述RNA多核苷酸互补的cDNA多核苷酸穿过所述跨膜孔时,测量通过所述跨膜孔的电流。所测量的电流通常指示所分析的多核苷酸的一种或多种特征。例如可以使用如现有技术中所述的设备(例如,WO 2008/102120中大体公开的设备)、或其衍生或改良形式来实施所述方法。一般地,可以使用膜片钳或电压钳来实施所述方法,以检测在所述多核苷酸移位通过所述孔时跨过所述跨膜孔的电流的变化。在某些实施方式中,所述测量包括使用电荷载流子,如金属盐、氯化物盐、离子液体、有机盐,具体地,NaCl、KCl、CsCl;还设想了使用适合的缓冲液,例如,HEPES、Tris-HCl等;还设想了使用可用于移位酶活性的核苷酸,例如,AMP、ADP、ATP、dAMP、dADP、dATP等;以及酶辅因子(辅酶因子),如二价金属离子,包括Mg2+、Ca2+、Co2+
在一个实施方式中,根据本发明要确定的RNA多核苷酸的特征之一是(i)所述RNA多核苷酸的长度。所述方法还使得能够确定通过反转录任选提供的、与所述RNA多核苷酸互补的cDNA多核苷酸。可以通过对跨膜孔处的相互作用(即电流变化)次数进行计数来测量如上所述的长度。由于对通过所述孔的每个核苷酸均预期了电流变化,因此所述相互作用的总和提供了对所分析的多核苷酸长度的指示。
在其他实施方式中,根据本发明要确定的RNA多核苷酸的另一个特征是(ii)所述RNA多核苷酸的特性(身份,identity)。例如可以通过如本文以下所述确定多核苷酸的序列、或者通过确定多核苷酸内的特异性基序或元件(它们使得能够获得所述多核苷酸的特性)如条形码等(这是通过扫描所述元件而实现),从而确定这种特征。
在其他实施方式中,根据本发明要确定的RNA多核苷酸的另一个特征是(iii)所述RNA多核苷酸的序列。可以例如通过确定所述多核苷酸的序列来确定这种特征,如在Shaghayegh等人,2016,J.Phys.D:Appl.Phys.49,413001;或者在Timp等人,IEEE TransNanotechnol.,2010,9,3,281–294中所描述的。一般地,所测量的通过所述跨膜孔的核苷酸A、U、G、C中的每一个均产生可测量的独特的电流模式,因此代表着所述多核苷酸的序列。
在其他实施方式中,根据本发明要确定的RNA多核苷酸的其他特征是(iv)所述RNA多核苷酸中核苷酸修饰的存在。通常,对RNA多核苷酸的特异性修饰将导致特异性的电流模式,其可以被记录并与所述修饰相关联。例如,基于两种实体(物质)的不同化学组成,DNA可以与RNA相区分。
优选地,要确定的特征是目标RNA多核苷酸的序列。
在不同的方面,本发明设想了制备用于跨膜测序的RNA多核苷酸的方法,其包括以下步骤:
(i)提供RNA多核苷酸;
(ii)通过使包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸退火和连接来修饰所述RNA多核苷酸;
(iii)任选地进行所述RNA多核苷酸的反转录;
(iv)切割所述退火的多核苷酸的茎环节段以产生3'A悬突;和
(v)将与RNA移位酶关联的接头多核苷酸复合物和至少一种胆固醇系连节段连接至步骤(iv)中所获得的多核苷酸。
所提及的制备方法的特征对应于本文以上所定义的那些特征。通过以上所述用于制备跨膜测序用RNA多核苷酸的方法所获得的产物,可以用于如本文以上所解释的后续测序行为中。在替代性实施方式中,所述产物可以储存用于随后的步骤,或者运输至不同位置等。还设想了进一步的修饰步骤,其并非直接地引入至通过跨膜测序的分子表征。在具体的实施方式中,制备用于跨膜测序的RNA多核苷酸的方法可以仅包括如本文以上所定义的步骤(i)至(iv)。还设想了仅包括如本文以上所定义的步骤(i)和(ii),或者如本文以上所定义的步骤(i)至(iii)的方法。
在另一个方面,本发明涉及用于表征包含含有3'末端随机多聚体节段并且具有茎环形式的多核苷酸的目标RNA多核苷酸的试剂盒,其中所述茎环形式包含一个或多个5-甲基-isoC-isoG碱基对,优选地包含如本文所定义的具有3'末端随机多聚体节段并且具有茎环形式的多核苷酸。如本文以上所定义的方法的特征还适用于本发明所述的试剂盒。所述试剂盒可以例如包含如本发明所述方法的一个或多个步骤中所定义的试剂和组分。例如,所述试剂盒可以包含通过使如上定义的包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸退火和连接来修饰所述RNA多核苷酸的试剂或组分。在不同的实施方式中,所述试剂盒可以包含、或者可以另外包含用于实施所述RNA多核苷酸的反转录的试剂或组分。在其他实施方式中,所述试剂盒可以包含、或者可以另外包含用于切割所述退火的多核苷酸的茎环节段以产生3'A悬突的试剂或组分。在其他实施方式中,所述试剂盒可以包含、或者可以另外包含用于将与RNA移位酶关联的接头多核苷酸复合物和至少一种胆固醇系连节段连接至如本文所述的多核苷酸的试剂或组分。在其他实施方式中,所述试剂盒可以包含、或者可以另外包含用于将如本文所定义的修饰的RNA多核苷酸与跨膜孔接触从而使得所述RNA移位酶控制所述RNA多核苷酸通过所述跨膜孔移动并且所述胆固醇系连将所述RNA多核苷酸锚定在所述跨膜孔附近的试剂或组分。在另一个实施方式中,所述试剂盒可以包含、或者可以另外包含在所述RNA多核苷酸通过所述跨膜孔移动期间进行一次或多次测量的试剂或组分,其中如以上所定义的,所述测量指示所述RNA多核苷酸的一种或多种特征,借此表征所述目标RNA多核苷酸。所述试剂盒还可以包含如以上所定义的两种或更多种组分或试剂组,例如,用于实施如本文所定义的2个步骤,如本文所定义的3个步骤,如本文所定义的4个步骤等的组分或试剂。
一般地,所述试剂盒可以包含适合的缓冲溶液、标记物或清洗液等。此外,所述试剂盒可以包含一定量的已知核酸分子或蛋白,其可以用于所述试剂盒的校准或者用作内部对照。相应成分对于技术人员是已知的。
另外,所述试剂盒可以包含说明书活页和/或可以提供有关其应用等的信息。
还设想了实施上述方法步骤的设备。所述设备可以例如由不同模块组成,这些模块可以实施本发明所述方法的一个或多个步骤。这些模块可以以任何适合的方式组合,例如,它们可以存在于单一位置或者是分离的。还设想了所述方法在不同时间点和/或不同位置实施。在如本文所定义的所述方法的一些步骤之后可以是间歇或暂停,其中适当保存所述试剂或产物等,例如,在冷冻机或冷却装置中保存。在如本文所定义的设备的特定模块中实施这些步骤的情况下,所述模块可以用作储存媒介(storage vehicle)。所述模块还可以用于将反应产物或试剂运输至不同的位置,例如,不同的实验室等。
在另一个方面,本发明涉及包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸的用途,其中所述茎环形式包含用于RNA多核苷酸修饰的一个或多个5-甲基-isoC-isoG碱基对,借此制备用于通过跨膜孔直接RNA测序的所述RNA多核苷酸。如本文以上所定义的方法的特征还适用于包含3'末端随机多聚体节段并且具有茎环形式的多核苷酸的用途,其中所述茎环形式包含用于本发明所述RNA多核苷酸的修饰的一个或多个5-甲基-isoC-isoG碱基对。
现转到图1,示出了受限于包含多聚-A-尾的RNA多核苷酸1,即全长RNA多核苷酸的RNA测序方法的示意图。多聚-T-引物2退火3至这些分子。可以任选地使所得的部分双链的分子4反转录5,从而导致产生RNA/cDNA杂合链6。随后,将包含移位酶和系连元件的测序接头7连接8至所述杂合链6,从而导致产生制备用于测序的RNA/cDNA杂合链9。在下一步中,制备用于测序的RNA/cDNA杂合链9移位10至跨膜孔11,其中对所述RNA多核苷酸1进行表征,即测序。对于前两步,约100分钟的时间段是常见的(12)。对于后面的步骤,15分钟的时间段是典型的(13)。
图2显示了根据本发明所述的方法步骤的示意图,其采用所有种类的RNA多核苷酸20(包括包含多聚-A-尾的RNA多核苷酸和包含非多聚-A-尾的RNA多核苷酸)均有效。具有随机多聚体的茎环引物21退火22至所述RNA多核苷酸20,从而导致产生部分双链的核酸23。随后,可以任选地实施反转录24,从而导致产生具有茎环引物结构的RNA/cDNA杂合链25。在下一步中,使用限制性内切酶切割26所述茎环引物以获得具有A悬突的RNA/cDNA杂合链27。随后,将包含移位酶和系连元件的测序接头7连接8至所述杂合链27,从而导致产生制备用于测序的RNA/cDNA杂合链9。在最后一步中,制备用于测序的RNA/cDNA杂合链9移位10至跨膜孔11,在那里对所述RNA多核苷酸20进行表征,即测序。
图3显示了根据本发明实施方式的包含茎环形式的多核苷酸的实例。所述茎环多核苷酸21包含环节段30、限制性内切酶识别位点31、5-甲基-isoC-isoG碱基对32以及随机多聚体节段33。
附图标记列表
1 包含多聚-A-尾的RNA多核苷酸
2 多聚-T-引物
3 退火反应
4 部分双链的分子
5 反转录反应
6 RNA/cDNA杂合链
7 包含移位酶和系连元件的测序接头。
8 连接反应
9 制备用于测序的RNA/cDNA杂合链
10 移位至跨膜孔
11 跨膜孔
12 前两步的时间段
13 后面步骤的时间段
20 所有种类的RNA多核苷酸
21 具有随机多聚体的茎环引物
22 使用茎环引物的退火反应
23 包含具有随机多聚体的茎环引物的部分双链的核酸
24 从具有随机多聚体的茎环引物起始的反转录反应
25 具有茎环引物结构的RNA/cDNA杂合链
26 利用限制性内切酶在茎环引物中的切割
27 具有A悬突的RNA/cDNA杂合链
30 环节段
31 限制性内切酶识别位点
32 5-甲基-isoC-isoG碱基对
33 随机多聚体节段
出于说明性目的提供了以下附图。因此,应理解附图不应视为限制性的。本领域技术人员将明显能够设想对本文所述原理的进一步改变。
序列表
<110> 西门子医疗有限公司(Siemens Healthcare GmbH)
<120> 借助于茎环反向多核苷酸的直接RNA纳米孔测序
<130> 2018P13543EP
<140> 18 205 148.2
<141> 2018-11-08
<160> 3
<170> PatentIn version 3.5
<210> 1
<211> 17
<212> RNA
<213> 智人
<400> 1
aaaaaaaaaa aaaaaaa 17
<210> 2
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 延伸的多聚-T寡核苷酸
<400> 2
tttttttttt ttttttt 17
<210> 3
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 具有随机多聚体的茎环引物
<220>
<221> misc_feature
<222> (43)..(48)
<223> n是a, c, g或t
<400> 3
ctcaactctc agattccgtg aggtcggaat ctgagagttg agnnnnnn 48

Claims (15)

1.一种表征目标RNA多核苷酸的方法,包括:
(i)提供RNA多核苷酸;
(ii)通过退火并连接包含3'末端随机多聚体节段且具有茎环形式的多核苷酸来修饰所述RNA多核苷酸;
(iii)任选地进行所述RNA多核苷酸的反转录;
(iv)切割经退火的所述多核苷酸的茎环节段以产生3'A悬突;
(v)将与RNA移位酶关联的接头多核苷酸复合物和至少一种胆固醇系连节段连接至步骤(iv)中获得的所述多核苷酸;
(vi)将步骤(v)中获得的经修饰的所述RNA多核苷酸与跨膜孔接触,使得所述RNA移位酶控制所述RNA多核苷酸通过所述跨膜孔移动,且所述胆固醇系连将所述RNA多核苷酸锚定在所述跨膜孔的附近;以及
(vii)在所述RNA多核苷酸通过所述跨膜孔移动期间,进行一次或多次测量,其中所述测量指示所述RNA多核苷酸的一种或多种特征,借此表征所述目标RNA多核苷酸。
2.一种制备用于跨膜测序的目标RNA多核苷酸的方法,包括:
(i)提供RNA多核苷酸;
(ii)通过退火并连接包含3'末端随机多聚体节段且具有茎环形式的多核苷酸来修饰所述RNA多核苷酸;
(iii)任选地进行所述RNA多核苷酸的反转录;
(iv)切割经退火的所述多核苷酸的茎环节段以产生3'A悬突;以及
(v)将与RNA移位酶关联的接头多核苷酸复合物和至少一种胆固醇系连节段连接至步骤(iv)中获得的所述多核苷酸。
3.根据权利要求1或2所述的方法,其中,包含3'末端随机多聚体节段且具有茎环形式的所述多核苷酸是包含一个或多个非DNA核苷酸的DNA多核苷酸。
4.根据权利要求1-3中任一项所述的方法,其中,包含3'末端随机多聚体节段且具有茎环形式的所述多核苷酸包含一个或多个5-甲基-isoC-isoG碱基对。
5.根据权利要求4所述的方法,其中,至少在茎环多核苷酸的每个第4、第5或第6位置处提供所述5-甲基-isoC-isoG碱基对。
6.根据权利要求1-5中任一项所述的方法,其中,所述随机多聚体节段是随机六聚体、随机七聚体、随机八聚体、随机九聚体或随机十聚体节段,优选随机六聚体节段。
7.根据权利要求1-6中任一项所述的方法,其中,包含3'末端随机多聚体节段且具有茎环形式的所述多核苷酸包含序列5'-ACAGT-3'或5'-TCAGA-3'的限制性内切酶识别位点。
8.根据权利要求7所述的方法,其中,使用酶Hpy188I来切割所述限制性内切酶识别位点5'-TCAGA-3';或者其中,使用酶Bst4CI、HpyCH4III或TaaI来切割所述限制性内切酶识别位点5'-ACAGT-3'。
9.根据权利要求1-8中任一项所述的方法,其中,包含3'末端随机多聚体节段且具有茎环形式的所述多核苷酸还包含条形码部分。
10.根据权利要求1或3-9中任一项所述的方法,其中,所述RNA多核苷酸的一种或多种特征为:(i)所述RNA多核苷酸的长度,(ii)所述RNA多核苷酸的特性,(iii)所述RNA多核苷酸的序列,和/或(iv)所述RNA多核苷酸中核苷酸修饰的存在,优选所述RNA多核苷酸的序列。
11.根据权利要求1-10中任一项所述的方法,其中,所述RNA多核苷酸是任何RNA多核苷酸,如mRNA、mRNA片段、前体mRNA、ncRNA、rRNA、miRNA、snoRNA、srRNA、tmRNA、siRNA或piRNA。
12.根据权利要求1或3-11中任一项所述的方法,其中,所述RNA移位酶是SF2解旋酶、NS3解旋酶、NPH-II解旋酶、Upf1解旋酶或RIG-I移位酶或其衍生物,或者能够移位RNA多核苷酸的DNA解旋酶如Hel308解旋酶、RecD解旋酶、XPD解旋酶或Dda解旋酶的衍生物。
13.根据权利要求1或3-12中任一项所述的方法,其中,所述跨膜孔蛋白是来源于溶血素、杀白细胞素、MspA、MspB、MspC、MspD、CsgG、胞溶素、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A、奈瑟氏球菌(Neisseria)自转运蛋白脂蛋白(NalP)或WZA的孔蛋白。
14.一种用于表征目标RNA多核苷酸的试剂盒,所述目标RNA多核苷酸包含含有3'末端随机多聚体节段且具有茎环形式的多核苷酸,其中,所述茎环形式包含一个或多个5-甲基-isoC-isoG碱基对,所述目标RNA多核苷酸优选包含如权利要求1-9中任一项所定义的具有3'末端随机多聚体节段且具有茎环形式的多核苷酸。
15.包含3'末端随机多聚体节段且具有茎环形式的多核苷酸的用途,其中,所述茎环形式包含用于RNA多核苷酸修饰的一个或多个5-甲基-isoC-isoG碱基对,借此制备用于通过跨膜孔直接RNA测序的所述RNA多核苷酸。
CN201911077294.7A 2018-11-08 2019-11-06 借助于茎环反向多核苷酸的直接rna纳米孔测序 Active CN111154845B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP18205148.2A EP3650559B1 (en) 2018-11-08 2018-11-08 Direct rna nanopore sequencing with help of a stem-loop polynucleotide
EP18205148.2 2018-11-08

Publications (2)

Publication Number Publication Date
CN111154845A true CN111154845A (zh) 2020-05-15
CN111154845B CN111154845B (zh) 2023-10-20

Family

ID=64267654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911077294.7A Active CN111154845B (zh) 2018-11-08 2019-11-06 借助于茎环反向多核苷酸的直接rna纳米孔测序

Country Status (4)

Country Link
US (2) US11505824B2 (zh)
EP (1) EP3650559B1 (zh)
CN (1) CN111154845B (zh)
ES (1) ES2927412T3 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108884462A (zh) * 2016-01-26 2018-11-23 日产化学株式会社 单链寡核苷酸
WO2023125605A1 (zh) * 2021-12-30 2023-07-06 深圳华大生命科学研究院 单分子纳米孔测序方法
WO2023123344A1 (zh) * 2021-12-31 2023-07-06 深圳华大生命科学研究院 能够阻断马达蛋白的核酸分子及其构建方法和用途
EP4202056A4 (en) * 2020-11-18 2024-05-29 Xforest Therapeutics Co., Ltd. RNA PROBE FOR MUTATION PROFILING AND ITS USE

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3650559B1 (en) * 2018-11-08 2022-06-29 Siemens Healthcare GmbH Direct rna nanopore sequencing with help of a stem-loop polynucleotide
GB202107192D0 (en) * 2021-05-19 2021-06-30 Oxford Nanopore Tech Ltd Method
US20230257789A1 (en) * 2022-02-11 2023-08-17 Microsoft Technology Licensing, Llc Enzymatic oligonucleotide assembly using hairpins and enzymatic cleavage
WO2023196738A1 (en) * 2022-04-05 2023-10-12 The Regents Of The University Of California Nanopore sequencing of rna using reverse transcription

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004059289A2 (en) * 2001-05-22 2004-07-15 Epicentre Technologies Target-dependent transcription using deletion mutants of n4 rna polymerase
US20060257914A1 (en) * 2005-05-13 2006-11-16 Pronucleotein Biotechnologies, Llc Methods of producing interachain fluorophore-quencher FRET-aptamers and assays
CN103370423A (zh) * 2010-11-12 2013-10-23 加利福尼亚太平洋生物科学股份有限公司 核酸模板的分类
WO2014041337A1 (en) * 2012-09-14 2014-03-20 Oxford Nanopore Technologies Limited Sample preparation method
WO2016059436A1 (en) * 2014-10-17 2016-04-21 Oxford Nanopore Technologies Limited Method for nanopore rna characterisation
US20170067097A1 (en) * 2014-04-11 2017-03-09 Redvault Biosciences, Lp Systems and methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications
US20200149101A1 (en) * 2018-11-08 2020-05-14 Siemens Healthcare Gmbh Direct rna nanopore sequencing with help of a stem-loop reverse polynucleotide
CN113039285A (zh) * 2018-11-07 2021-06-25 西门子医疗有限公司 用于纳米孔测序的液体样品工作流程

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2126588A1 (en) 2007-02-20 2009-12-02 Oxford Nanopore Technologies Limited Formation of lipid bilayers
US20090023190A1 (en) * 2007-06-20 2009-01-22 Kai Qin Lao Sequence amplification with loopable primers

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004059289A2 (en) * 2001-05-22 2004-07-15 Epicentre Technologies Target-dependent transcription using deletion mutants of n4 rna polymerase
US20060257914A1 (en) * 2005-05-13 2006-11-16 Pronucleotein Biotechnologies, Llc Methods of producing interachain fluorophore-quencher FRET-aptamers and assays
CN103370423A (zh) * 2010-11-12 2013-10-23 加利福尼亚太平洋生物科学股份有限公司 核酸模板的分类
WO2014041337A1 (en) * 2012-09-14 2014-03-20 Oxford Nanopore Technologies Limited Sample preparation method
US20170067097A1 (en) * 2014-04-11 2017-03-09 Redvault Biosciences, Lp Systems and methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications
WO2016059436A1 (en) * 2014-10-17 2016-04-21 Oxford Nanopore Technologies Limited Method for nanopore rna characterisation
CN107109489A (zh) * 2014-10-17 2017-08-29 牛津纳米孔技术公司 纳米孔rna表征方法
CN113039285A (zh) * 2018-11-07 2021-06-25 西门子医疗有限公司 用于纳米孔测序的液体样品工作流程
US20200149101A1 (en) * 2018-11-08 2020-05-14 Siemens Healthcare Gmbh Direct rna nanopore sequencing with help of a stem-loop reverse polynucleotide

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A.K. SHCHYOLKINA等: "Parallel-Stranded Oligonucleotides with Alternating d(A-isoG)/d(T.C) and d(A.G)/d(T.m 5 isoC) Sequences" *
DANIEL R GARALDE等: "Highly parallel direct RNA sequencing on an array of nanopores" *
周翔等: "RNA表观遗传修饰及其纳米检测探针研究进展" *
汪晗等: "应用纳米孔的脱氧核糖核酸序列测定技术" *
汪荣亮等: "纳米孔传感技术应用于核酸检测的研究进展" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108884462A (zh) * 2016-01-26 2018-11-23 日产化学株式会社 单链寡核苷酸
EP4202056A4 (en) * 2020-11-18 2024-05-29 Xforest Therapeutics Co., Ltd. RNA PROBE FOR MUTATION PROFILING AND ITS USE
WO2023125605A1 (zh) * 2021-12-30 2023-07-06 深圳华大生命科学研究院 单分子纳米孔测序方法
WO2023123344A1 (zh) * 2021-12-31 2023-07-06 深圳华大生命科学研究院 能够阻断马达蛋白的核酸分子及其构建方法和用途

Also Published As

Publication number Publication date
CN111154845B (zh) 2023-10-20
US11505824B2 (en) 2022-11-22
US20230295713A1 (en) 2023-09-21
US20200149101A1 (en) 2020-05-14
ES2927412T3 (es) 2022-11-04
EP3650559A1 (en) 2020-05-13
EP3650559B1 (en) 2022-06-29

Similar Documents

Publication Publication Date Title
CN111154845B (zh) 借助于茎环反向多核苷酸的直接rna纳米孔测序
US20240141426A1 (en) Compositions and methods for identification of a duplicate sequencing read
CN107922970B (zh) 通过单探针引物延伸的靶标富集
AU2019222723B2 (en) Methods for the epigenetic analysis of DNA, particularly cell-free DNA
CN109937254B (zh) 核酸样品制备方法
US20220333186A1 (en) Method and system for targeted nucleic acid sequencing
CN111757934A (zh) 通过单向双重探针引物延伸的靶标富集
Welch et al. EnD-Seq and AppEnD: sequencing 3′ ends to identify nontemplated tails and degradation intermediates
US20190169603A1 (en) Compositions and Methods for Labeling Target Nucleic Acid Molecules
AU2022202281A1 (en) Preparation Of Nucleic Acid Libraries From RNA And DNA
CN110869515A (zh) 用于基因组重排检测的测序方法
US9879318B2 (en) Methods and compositions for nucleic acid sample preparation
US20210388427A1 (en) Liquid sample workflow for nanopore sequencing
WO2024121293A1 (en) System and method for total nucleic acid library preparation via template-switching
WO2023137292A1 (en) Methods and compositions for transcriptome analysis
CN105247076B (zh) 使用拼装序列扩增片段化的目标核酸的方法
WO2023194331A1 (en) CONSTRUCTION OF SEQUENCING LIBRARIES FROM A RIBONUCLEIC ACID (RNA) USING TAILING AND LIGATION OF cDNA (TLC)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant