CN103261416A - 利用真核tRNA连接酶的连接方法 - Google Patents

利用真核tRNA连接酶的连接方法 Download PDF

Info

Publication number
CN103261416A
CN103261416A CN201180060308XA CN201180060308A CN103261416A CN 103261416 A CN103261416 A CN 103261416A CN 201180060308X A CN201180060308X A CN 201180060308XA CN 201180060308 A CN201180060308 A CN 201180060308A CN 103261416 A CN103261416 A CN 103261416A
Authority
CN
China
Prior art keywords
rna
adapter
group
sample
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201180060308XA
Other languages
English (en)
Other versions
CN103261416B (zh
Inventor
G.蔡纳
R.A.阿克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of CN103261416A publication Critical patent/CN103261416A/zh
Application granted granted Critical
Publication of CN103261416B publication Critical patent/CN103261416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种制备RNA样品的方法,包括:a)获得RNA样品,其包含:i.长RNA分子,其可以是未断裂的或者可以被断裂而含有5’-OH基团和2’-3’-环磷酸基团;和ii.包含5’-磷酸基团和3’-OH基团的短RNA分子;和b)在真核tRNA连接酶的存在下,使RNA样品与包含2’-PO基团与3’-OH基团、或者包含2’,3’-环磷酸基团的衔接头(adaptor)接触,藉此产生经连接的RNA样品,其中a)所述短RNA分子被选择性地与所述衔接头连接,或者b)所述短RNA分子和所述长RNA片段被选择性地与所述衔接头连接。

Description

利用真核tRNA连接酶的连接方法
相关申请交叉引用
根据35U.S.C.§119(e),本专利申请要求于2010年12月16日提交的美国临时专利申请序列号61/424,008的优先权,本文通过援引并入该申请的公开内容。
引言
总RNA样品典型地包含长度不同的RNA分子。例如,从哺乳动物细胞获得的典型总RNA样品可能含有mRNA分子(其大小范围一般为数百个碱基团到数kb),lincRNA分子(其被归类为长度至少200个碱基),18S和28SrRNA分子(其分别为大约1.9kb和5kb),tRNA分子(其长度一般低于100nt),和多种小RNA分子(例如短干扰RNA、微小RNA、细小非编码RNA、小调节RNA和与piwi蛋白相互作用的RNA,其中一些的长度范围是18-25个碱基。
概要
本申请提供了一种制备RNA样品的方法,包括:a)获得RNA样品,其包含:i.长RNA分子,其可以是未断裂或断裂的,其中断裂的长RNA包含5’-OH基团和2’-3’-环磷酸基团;和ii.短RNA分子,其包含5’磷酸基团和3’-OH基团;和b)在真核tRNA连接酶的存在下,使该RNA样品与衔接头接触,该衔接头包含2’-PO基团与3’-OH基团,或者包含2’,3’-环磷酸基团。根据样品是断裂还是未断裂的,该连接步骤产生经连接的RNA样品,其中a)短RNA分子被选择性地与该衔接头连接,或b)短RNA分子和长RNA片段被选择性地与该衔接头连接。
在一些实施方案中,该方法包括:a)获得断裂的RNA样品,其包含:i.长RNA分子的RNA片段,其中所述片段包括5’-OH基团和2’-3’-环磷酸基团;和ii.未断裂的短RNA分子,所述分子包含5’磷酸基团和3’-OH基团;和b)在真核tRNA连接酶的存在下,使该断裂的RNA样品与一个或多个衔接头接触,所述衔接头包含5’-PO基团和/或如下所述的3’末端:其含有2’-PO基团和3’-OH基团,或者含有2’,3’-环磷酸基团,藉此产生连接的RNA样品。还提供了用于实施该方法的试剂盒。
还提供了制备RNA样品的方法,包括:a)获得未断裂的RNA样品,其包含:i.长RNA分子;和ii.包含5’磷酸基团和3’OH基团的短RNA分子;和b)在真核tRNA连接酶的存在下,使该断裂的RNA样品与衔接头接触,该衔接头包含封闭的5’端并包含2’-PO基团与3’-OH基团或者2’,3’-环磷酸基团,藉此产生经连接的RNA样品,其中所述短RNA分子被选择性地与所述衔接头连接。
本公开还提供了一种用于防止不含有RNA插入物(无论来源于断裂的长RNA还是miRNA)的5’-衔接头:3’-衔接头“衔接头二聚体”连接产物的形成的方法。
在一个实施方案中,该方法可以包括:a)获得第一单链衔接头和第二单链衔接头,其中该第一衔接头和第二衔接头分别含有供归巢性核酸内切酶(homing endonuclease)用的部分识别位点,并且当在没有干扰插入RNA的存在下连接在一起时,产生含有归巢性内切核酸酶识别位点的衔接头二聚体;b)将所述第一单链衔接头与RNA样品中RNA分子的第一末端连接;c)将所述第二衔接头与所述样品中RNA分子的末端连接;d)从步骤c)的产物产生双链cDNA;和e)用所述归巢性核酸内切酶切割该双链cDNA,藉此从样品中除去衔接头二聚体。该方法可以进一步包括使用与所述衔接头序列杂交的引物对经切割的样品进行PCR。
在一个备选的实施方案中,该方法可以包括:a)将第一单链衔接头与RNA样品中RNA分子的第一末端连接;b)将第一单链衔接头与互补寡核苷酸杂交,产生不含有该单链衔接头的可连接突出端的双链体,藉此除去第一单链衔接头,作为用于将来连接的底物;和c)使用真核tRNA连接酶将第二衔接头与该RNA样品中RNA分子的另一个末端连接,藉此产生在两端均连接有衔接头的RNA样品。这些衔接头可以任选地含有部分归巢性核酸内切酶识别元件,以便使得上述的两种衔接头二聚体除去方法能够实施。
附图简述
图1A和1B.图1A显示了野生型tRNA连接酶的域结构;CPD=2’,3’-环磷酸二酯酶。图1B列出了野生型真核tRNA连接酶的三种酶活性。
图2A和2B.图2A显示了一种示例的缺少功能性环磷酸二酯酶结构域(点突变用星号指示)的修饰真核tRNA连接酶的域结构。图2B示意性地图解了一种能够用于产生适合于用RNLΔCPD酶进行微阵列谱分析(microarray profiling)的总RNA文库的二步方法。第一,利用Mg2+和加热来断裂总RNA。第二,一起添加RNLΔCPD酶和通用的5’荧光-偶联的衔接头探针。RNLΔCPD酶的激酶结构域将断裂的大RNA的5’OH转变成5’PO4。miRNA和经修复的断裂的大RNA均参与与荧光5’衔接头探针的连接反应。由于经断裂的RNA的3’末端仍然处于2’,3’-环磷酸基团形式,该3’末端不能参与连接。类似地,由于miRNA具有3’OH基团但没有2’PO基团,该3’末端不能参与连接。
图3示意性图解了使用真核tRNA连接酶产生适合于高通量测序的总RNA文库的方法。
图4A和4B.4A显示了一种示例性的缺少功能性激酶结构域(点突变用星号指示)的修饰真核tRNA连接酶的域结构。图4B示意性地图解了一种用于产生适合于cRNA产生和微阵列谱分析的mRNA/ncRNA cDNA文库的三步方法。第一,利用Mg2+和加热来断裂总RNA。第二,一起添加RNLΔ激酶与3’衔接头探针。RNLΔ激酶的环磷酸二酯酶结构域将已断裂的大RNA的2’,3-环磷酸分解成2’PO和3’OH。含有2’PO的经断裂RNA现在是RNLΔ激酶用以与3’衔接头连接的底物。cDNA能够从该3’衔接头被引发,以纳入适合于产生cRNA并随后进行微阵列杂交的T7启动子。因为miRNA具有3’OH基团但没有2’PO基团,所以该3’末端不能参与连接。
图5显示了一个指示酶效率的时间过程的结果。
图6小图A和B显示的图表明,重复测定是高度可重复的。
图7显示了对总共72,272个探针,集成RNA测定(1μg)与标准外显子阵列数据的log2比值的比较。
图8显示的数个图提供集成RNA阵列miRNA数据与标准miRNA阵列的比较。
图9示意性图解了一个涉及归巢性内切核酸酶的实施方案。从下到下:SEQ ID NOS:1-7。
图10显示了一个连接测定(ligation assay)的结果。
图11示意性显示了一种用于产生衔接头连接的RNA(adaptor ligatedRNA)的示例方法。
定义
术语“RNA样品”,如这里使用的,涉及多种材料的混合物,典型地,尽管不是必须的,其处于液体形式,含有一种或多种RNA分子。RNA样品可以从细胞例如哺乳动物细胞获得。RNA样品可以含有一群不同的RNA分子,在此情况下它可以含有超过1,000种,超过10,000种,超过50,000种,或者超过100,000种,最多达1M或更多种不同的RNA,即不同序列的RNA分子。RNA样品可以含有长RNA分子,其是长度至少50nt的RNA分子。长RNA分子包括mRNA分子、rRNA分子、tRNA分子、前miRNA、snRNA和长非编码RNA分子,例如大基团因间RNA(lincRNA)分子。一些长RNA分子的长度可以为50-10kb的范围,例如长200nt-10kb。RNA样品还可以包含短RNA分子,其是长度低于50nt的RNA分子。短RNA分子是多种小的非编码的调节性RNA,它们在本文中可以被概括地称作“小RNA”,即短干扰RNA、微小RNA、细小非编码RNA、与piwi蛋白相互作用的小RNA(piRNAs)和小调节RNA。
术语“核苷酸”意图包括这样的模块,它们不仅含有已知的嘌呤核嘧啶碱基,还包含其它已经过修饰的杂环碱基。这些修饰包括甲基化嘌呤或嘧啶、酰基化嘌呤或嘧啶、烷基化核糖或其它杂环。此外,术语“核苷酸”包括这样的模块,它们含有半抗原或荧光标记,并可以不仅含有常规的核糖和脱氧核糖,还含有其它糖。修饰的核苷或核苷酸还包括糖模块上的修饰,例如其中一个或多个羟基被卤原子或脂肪族基团代替,被官能化为酯、胺等。核苷酸可以包括那些在被掺入核酸的延伸链时使得延伸能够持续的核苷酸(非链终止性核苷酸),和那些阻止随后的延伸的核苷酸(例如链终止子)。
术语“核酸”和“多核苷酸”在本文中可替换使用,用于描述任何长度的聚合物,例如大于大约2个碱基,大于大约10个碱基,大于大约100个碱基,大于大约500个碱基,大于大约1000个碱基,多达大约10,000个或更多个碱基团,由核苷酸例如脱氧核糖核苷酸或核糖核苷酸构成,并可以通过酶促或合成产生(例如美国专利No.5,948,902和本文引用的参考文献中描述的PNA),其能够以类似于两个天然存在的核酸的序列特异性的方式与天然存在的核酸杂交,例如,能够参与Watson-Crick碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分别为G、C、A和T)。
术语“核糖核酸”和“RNA”如本文中使用的意思是由核糖核苷酸构成的聚合物。
术语“脱氧核糖核酸”和“DNA”如本文中使用的意思是由脱氧核糖核苷酸构成的聚合物。
“分离的”或“纯化的”一般是指物质(化合物、多核苷酸、蛋白质、多肽、多肽组合物)的分离,从而使该物质占据其所在样品的显著百分比(例如大于1%,大约2%,大于5%,大于10%,大于20%,大于50%,或者更多,通常高达大约90%-100%)。在某些实施方案中,基本上纯化的组分构成样品的至少50%,80%-85%,或者90-95%。纯化感兴趣的多核苷酸和多肽的技术是本领域众所周知的,并且包括例如,离子交换色谱、亲和色谱和根据密度沉降。一般地,当某种物质在样品中以与样品的其它组分相比不是自然存在的量存在时,则它是被纯化的。
术语“寡核苷酸”,如本文中所使用的,是指大约2-500个核苷酸、例如2-200个核苷酸的单链核苷酸多聚体。寡核苷酸可以是合成的或者可以通过酶促制成,而且,在一些实施方案中,长度为4-50个核苷酸。寡核苷酸可以包含核糖核苷酸单体(即可以是RNA寡核苷酸)或者脱氧核糖核苷酸单体。寡核苷酸的长度可以是例如5-20,11-30,31-40,41-50,51-60,61-70,71-80,80-100,100-150,或150-200,高达500个核苷酸。
术语“双链体”或“双链”,如本文中所使用的,是指由两个含有互补序列的单链核酸杂交形成的核酸。在大多数情况下,基团因组DNA是双链的。
术语“互补”,如本文中所使用的,是指通过非共价键与感兴趣的靶核酸碱基配对的核苷酸序列。在经典的Watson-Crick碱基团配对中,在DNA中,腺苷酸(A)与胸腺嘧啶(T)形成碱基对,鸟嘌呤(G)与胞嘧啶(C)形成碱基对。在RNA中,胸腺嘧啶被尿嘧啶(U)代替。这样,A与T互补,G与C互补。在RNA中,A与U互补,反之亦然。典型地,“互补”是指至少部分互补的核苷酸序列。术语“互补”还可包括完全互补的双链体,从而使一条链中的每一个核苷酸与另一条链中相应位置的每一个核苷酸互补。在一些实例中,核苷酸序列可以和靶部分地互补,其中不是所有核苷酸均与靶核酸中所有相应位置上的每一个核苷酸互补。
术语“探针”,如本文中所使用的,是指与感兴趣的核苷酸序列互补的核酸。在某些情况下,靶分析物的检测需要探针对靶的杂交。在某些实施方案中,探针可以是表面束缚的(surface-tethered),即被固定在基底的表面上,其中基底可具有多种构型,例如片(sheet)、珠(bead)或其它结构。在某些实施方案中,探针可以存在于平面支持物的表面上,例如处于阵列的形式。
短语“表面结合的核酸”是指被固定在固体基底表面上的核酸,其中基底可具有多种构型,例如片、珠或其它结构。在某些实施方案中,这里采用的核酸探针存在于相同平面支持物的表面上,例如处于阵列的形式。
短语“经标记的核酸群”是指核酸的混合物,所述核酸被可检测地标记,例如荧光标记,从而该核酸的存在可以通过评估标记物的存在加以检测。
术语“阵列”涵盖术语“微阵列”,是指提供来用于结合核酸等的有序阵列。
“阵列”,包括任何可寻址区域(例如空间可寻址区域或光学可寻址区域)的二维或三维排列,所述可寻址区域携带核酸,特别是寡核苷酸或其合成模拟物等。在一些实例中,阵列的可寻址区域可以不是彼此物理连接的,例如可以通过光学或其它方法区分的多个珠可以构成一个阵列。当阵列为核酸阵列时,核酸可以在沿着核酸链的任何一点或多个点被吸附、物理吸附、化学吸附或共价结合于阵列。
任何给定的基底可以携带一个、两个、四个或更多个布置在基底表面上的阵列。根据用途,任何或全部阵列可以是相同的,或者彼此不同的,并且每一个可以含有多个点或特征(feature)。阵列可以在小于20cm2或者甚至小于10cm2的面积内,例如小于大约5cm2,包括小于大约1cm2,小于大约1mm2,例如100μm2,或者甚至更小的面积内包含一个或多个,包括多于2个,多于10个,多于100个,多于1000个,多于1万个,或者甚至多于数十万个特征。例如,特征的宽度(即直径,就圆点而言)范围是5μm-1.0cm。在其它实施方案中,每一个特征的宽度范围可以是1.0μm-1.0mm,通常为5.0μm-500μm,更通常是10μm-200μm。非圆形特征的面积范围可以与具有前述宽度(直径)范围的圆形特征相当。至少一部分或者全部特征具有不同的组成(例如,当每种特征组分的任何重复被排除后,剩余的特征可能占特征总数的至少5%、10%、20%、50%、95%、99%或100%)。典型地(但不是至关重要的),会存在特征间区域(Inter-feature areas),该区域不携带任何核酸(或者与构成所述特征的类型属于同一类型的其它生物聚合物或化学模块)。这样的特征间区域在阵列为通过涉及试剂的液滴沉积(drop deposition)的方法形成的情况下通常存在,但在使用例如光刻阵列制造方法的情况下,则可能不存在。但是应当意识到,当存在时,特征间区域可以具有各种尺寸和构型。
每一个阵列可以覆盖小于200cm2,或者甚至小于50cm2,5cm2,1cm2,0.5cm2,或0.1cm2的面积。在某些实施方案中,携带一个或多个阵列的基团底一般将成形为矩形固体(尽管其它的形状是可能的),长度大于4mm并小于150mm,通常大于4mm并小于80mm,更通常地小于20mm;宽度大于4mm并小于150mm,通常小于80mm,更通常小于20mm;厚度大于0.01mm并小于5.0mm,通常大于0.1mm并小于2mm,更通常大于0.2mm并小于1.5mm,例如大于大约0.8mm并小于大约1.2mm。
阵列可以利用从前体单元(例如核苷酸或氨基酸单体)(在原位制造的情况下)或者先前获得的核酸的脉冲喷射进行液滴沉积加以制造。这些方法在例如先前引用的参考文献中有详细描述,包括US6,242,266,US6,232,072,US6,180,351,US6,171,797,US6,323,043,Caren等的美国专利申请公开No.20040203138,和它们中引用的参考文献。如已经提到的,本文通过援引并入这些参考文献的内容。其它的液滴沉积方法可以用于制造,如先前在本文中记载的。另外,作为液滴沉积方法的替代,可以使用光刻阵列制造方法。特征内区域尤其在通过光刻方法制造阵列的场合不需要存在,如那些专利所述的。
阵列还可以通过将预合成的与珠子(也称作微球)连接的核酸分散到固体支持物上来制造。在某些实施方案中,珠子内掺入有独特的光学标志(signature),例如荧光染料,所述标志能够用来鉴别任意特定珠子上的化学官能。因为珠子首先用光学标志编码,由此可以随后将阵列解码,从而在制成阵列之后,可以建立阵列上单个位点的位置与该特定位点处的探针之间的相关性。这些方法在例如美国专利No.6,355,431,7,033,754和7,060,431中有详细描述。
在如下情况下,阵列是“可寻址的”:阵列具有多个具有不同模块(例如不同寡核苷酸序列)的区域,使得阵列上特定的预定位置(即“地址”)处的区域(即阵列的“特征”或“点”)含有特定的序列。各阵列特征典型地,但不是必需的,被居间空间所分开。如果阵列的每一个特征都具有可通过光学手段检测的、可鉴定该特征处存在的模块的标志,则阵列也是“可寻址的”。如果阵列的每一个特征具有可通过非光学手段检测的、可鉴定该特征处存在的模块的标志,则阵列也是“可寻址的”。
术语“确定”、“测量”、“评价”、“评估”、“分析”和“测定”在本申请中可以互换使用,指示任何形式的测量,包括确定某要素是否存在。这些术语包括定量和/或定性确定二者。评估可以是相对性的或者绝对的。“评估……的存在”包括确定某物质的存在的量,以及确定其是否存在。
术语“使用”具有其常规的意思,如此,其意思是采用某种方法或组合物(例如使之工作),以达到某种目的。例如,如果使用程序产生一个文件,则执行该程序产生一个文件,该文件通常是该程序的输出。在另一个实例中,如果使用计算机文件,则通常访问并读取该文件,并采用该文件中存储的信息达到某种目的。类似地,如果使用一个独特的标识符(identifier),例如条形码,则通常读取该独特的标识符用以鉴定例如与该独特标识符相关的目标或文件。
如本申请中使用的,术语“Tm”是指寡核苷酸双链体中有一半双链体保持杂交,一半双链体被解离成单链的熔解温度。寡核苷酸双链体的Tm可以通过实验确定,或者用如下的公式预测:Tm=81.5+16.6(log10[Na+])+0.41(G+C分数)–(60/N),其中N是链长,[Na+]小于1M。见Sambrook and Russell(2001;Molecular Cloning:A Laboratory Manual,3rd ed.,Cold Spring Harbor Press,Cold Spring Harbor N.Y.,ch.10)。取决于多种多样的杂交条件,也可以使用其它更先进的依赖多种不同参数的模型来预测寡核苷酸双链体的Tm
如本文中所使用的,术语“Tm-匹配的”是指具有处于限定的范围内(例如±5°C,±10°C,或±15°C)的Tm的多个核酸双链体。
术语“杂交条件”,如本文中所使用的,是指足以将具有足够长度的与探针核苷酸序列互补的寡核苷酸与探针退火的杂交条件。杂交条件为在短长度区域内(例如小于50,小于30,小于30,或小于20个连续的核苷酸)退火的双链体的解离提供条件。这些条件可以在每次实验之间不同,取决于互补区域的长度和核苷酸组成。在某些情况下,低严格杂交的温度可以比计算出的所得双链体在所用条件下的Tm低5°-10°C。
术语“严格测定条件”,如本文中所使用的,是指如下的条件,其适合于(compatible)产生具有足够互补性的核酸(例如探针和靶)的结合对,从而为测定中期望水平的特异性提供条件,但不适合于(incompatible)具有不充分互补性的结合成员之间形成结合对,从而为期望的特异性提供条件。术语“严格测定条件”是指杂交和清洗条件的组合。
术语“混合物”,如本文中所使用的,是指要素的组合,要素是散布的并且没有任何特定的次序。混合物是异质的,并且无法在空间上区分成其不同的组分。要素的混合物的实例包括溶解在相同水溶液中的若干不同的要素,或者随机地或者无特定顺序地附着在固体支持物上的若干不同的要素,其中不同的要素在空间上没有区别。换言之,混合物是不可寻址的。具体地讲,结合于表面的寡核苷酸的阵列,在本领域公知的并且在下文中描述的,不是结合于表面的寡核苷酸的混合物,因为结合于表面的寡核苷酸的诸种类在空间上是有区别的,并且该阵列是可寻址的。
如本文中所使用的,术语“数据”是指有组织的信息的集合,其一般得自于实验室或计算机上的(in silico)实验结果,本领域技术人员可得的其它数据,或一系列条件(premises)的集合。数据可以呈数字、文字、注释或图像的形式,作为一系列变量的测量或观察结果。数据可以用各种形式的电子介质储存,以及从辅助数据库获得。
如果核酸探针“对应于”或者“针对”某种RNA,则该核酸探针的碱基对与该RNA配对,即特异性杂交。如下文中将更详细讨论的,针对特定RNA的核酸探针和该特定RNA,或其互补物,含有至少一个在序列上相同的连续核苷酸区域。
如本文中所使用的,术语“总细胞RNA”是至少含有tRNA、rRNA、mRNA、lincRNA和小RNA的RNA样品。
如本文中所使用的,术语“耗尽”,在已经耗尽了tRNA、rRNA或其它类型RNA的总细胞RNA样品的语境下,是指已经减去,即除去了tRNA、rRNA或其它类型RNA的总细胞RNA样品。
如本文中所使用的,术语“初始RNA样品”是指没有暴露于断裂条件,且含有完整RNA分子的RNA样品。这种样品可以含有,例如,总细胞RNA或已经耗尽了rRNA和/或tRNA或另一种类型RNA的总细胞RNA。初始RNA样品含有至少一种类型的完整长RNA和一种类型的短RNA。
如本文中所使用的,术语“断裂的RNA样品”是指含有RNA片段的样品。断裂的RNA样品可以通过将初始RNA样品暴露于断裂条件而从初始RNA样品制得。断裂的RNA样品包括从福尔马林固定的石蜡包埋组织(FPET)样品中提取的RNA。
如本文中所使用的,术语“长RNA分子”是指长度为至少50nt的RNA分子。长RNA分子包括mRNA分子、rRNA分子、tRNA分子、前-miRNA、snRNA和长非编码RNA分子,例如大基因间RNA(lincRNA)分子。一些长RNA分子的长度范围可以是50-10kb,例如长200nt-10kb。
如本文中所使用的,术语“短RNA分子”是指长度低于50nt的RNA分子。短RNA分子包括tRNA分子和各种小非编码调节RNA,它们在这里被一般地称作“小RNA”,即短干扰RNA、微小RNA、微小非编码RNA、与piwi蛋白相互作用的小RNA(piRNAs)和小调节RNA。
如本文中所使用的,术语“长RNA分子的片段”是指通过断裂长RNA分子获得的RNA片段。取决于断裂的方式,长RNA分子的片段在3’末端具有一个5’OH基团和一个2’,3’环磷酸基团。
如本文中所使用的,术语“断裂条件”是指诱导长RNA分子发生非序列特异性断裂的环境或作用剂。如下文中将更详细描述的,当断裂同时含有长RNA分子和短RNA分子的样品时,可以对断裂条件加以裁量,使得长RNA分子断裂,而短RNA分子则断裂不显著。
如本文中所使用的,术语“衔接头”是指由任何类型的核苷酸构成的寡核苷酸。衔接头可以是例如RNA衔接头、DNA衔接头,或者可以同时由核糖核苷酸和脱氧核糖核苷酸或其类似物构成。衔接头可以被标记或不被标记,在某些情况下长度可以是5-50个碱基,例如6-12个碱基,或者更长,这取决于应用。
如本文中所使用的,术语“5’-OH”和“5’-羟基”是指核酸5’末端的核苷酸,该核苷酸在5’位置具有羟基基团。
如本文中所使用的,术语“3’-OH”和“3’-羟基”是指核酸3’末端的核苷酸,该核苷酸在3’位置具有羟基基团。
如本文中所使用的,术语“3’-P”或“3’-磷酸(3’-phosphate)”是指核酸3’末端的核苷酸,该核苷酸在3’位置具有磷酸基团(phosphate group)。
如本文中所使用的,术语“5’-P”或“5’-磷酸(5’-phosphate)”是指核酸5’末端的核苷酸,该核苷酸在5’位置具有磷酸基团(phosphate group)。
如本文中所使用的,术语“2’-PO和3’-OH”和“2’-磷酸(2’-phosphate)和3’-羟基”,在3’末端的语境中,是指核酸3’末端的核苷酸,其中该核苷酸的糖模块在2’位置具有磷酸基团(phosphate group),且在3’位置具有羟基基团。
如本文中所使用的,术语“2’,3’-环磷酸”(2’,3’-cyclic phosphate),在包含2’,3’-环磷酸的3’末端的语境中,是指核酸3’末端的核苷酸,其中该核苷酸的糖模块具有与2’和3’位置连接的磷酸基团,如下所示:
Figure BDA00003346225700111
如本文中所使用的,术语“真核tRNA连接酶”是指一种多功能酶,其具有:a)连接酶活性,其催化具有5’-磷酸的核酸的5’末端与具有具备2’-磷酸和3’-羟基的3’末端的核酸的3’末端连接,产生在连接位点含有2’磷酸的连接产物;和任选地b)环磷酸二酯酶(CPD)活性,其催化2’,3’-环磷酸基团的水解,产生2’-磷酸和3’-羟基;和/或c)激酶活性,其催化5’-羟基磷酸化,产生5’-磷酸。野生型tRNA连接酶具有全部三种活性,并按照如下排列:N端连接酶组件,中央激酶组件,和C端2’3’-环磷酸二酯酶组件。这些酶已经在酵母和植物中被鉴定和表征,并预期存在于多种其他真核生物中,例如哺乳动物和古细菌(见例如Ramirez RNA200814:1737-45;Englert Nuc.AcidsRes.200533:388-399;Sawaya J.Biol.Chem.2003278:43928-43928;ApostolJ.Biol.Chem1991266:7445-7455;Phizicky J.Biol.Chem.1986261:2978-2986;Nandakumar Mol.Cell.200831:278-286;Sugahara RNA200713:671-681;and Schutz RNA201016:621-631)。如将在下文中更详细描述的,主题方法中采用的真核tRNA连接酶可能仅具有连接酶活性,并且任选地具有激酶和/或环磷酸二酯酶活性。因此,在特定的情况下,该方法中使用的真核tRNA连接酶可能最少具有这样的连接酶结构域,其具有与野生型真核tRNA连接酶的连接酶结构域的氨基酸至少80%相同的氨基酸序列。连接酶结构域足以催化具有5’-磷酸的核酸的5’末端与具有具备2’-磷酸和3’-羟基的3’末端核酸的3’末端连接,产生在连接位点含有2’磷酸的连接产物。2’磷酸基团可以在NAD+的存在下通过对2’-磷酸基团特异的特异性磷酸转移酶加以去除,或者如果需要,用非特异性碱性磷酸酶加以去除(Culver J.Biol.Chem.1997:13203-13210;Schutz RNA201016:621-631)。
示例实施方案的说明
在更详细描述本发明之前,应当理解,本发明不仅限于所描述的特殊实施方案,并且当然可以变化。还应当理解,这里使用的术语仅仅是出于描述特定的实施方案的目的,并不意图具有限制性,因为本发明的范围仅由随附的权利要求所限定。
当提供一个数值范围时,应当理解,除非上下文中明确地另有指示,则该范围上下限之间的每一个居间的值,精确至该下限的单位的十分之一,以及该声明的范围内的任何其它声明的值或居间的值,均包含在本发明之内。
除非另外定义,本申请中使用的所有技术和科学术语均具有与本发明所属领域普通技术人员所公知的相同的意思。下面将描述优选的方法和材料,不过,在实施或测试本发明时也可以使用任何与本申请中所述相似或等同的方法和材料。
本申请通过援引并入本申请中引用的全部出版物和专利,如同明确地、个别地援引并入每一篇出版物或专利一样;而且,本申请中援引并入这些出版物和专利是为了公开和描述与对这些出版物的引用相关的方法和/或材料。对任何出版物的引用是为了引用其在申请日之前的公开,而不应当解释为承认本发明无权基于发明在先而早于这些出版物。而且,所提供的出版日期可能与实际出版日期不同,这可能需要独立地加以确认。
必须注意,如这里和附加权利要求中所使用的,除非上下文中明确地指出,否则单数形式“一”、“一个”、和“该”包括复数个指示物。进一步需要注意,权利要求可能被撰写为排除任何任选的要素。在这样的情况下,该表述是意图作为对记载的权利要求要素使用的相关排他性用语如“唯一的”、“仅”等的在先引用基础,或用于“否定式”限定。
本领域的技术人员在阅读本公开时会显见,本申请中描述和例示的每一个单独实施方案具有离散的组分和特征,在不背离本发明精神和范围的前体下,它们可以容易地与其它多个实施方案中任一个的特征分离或组合。记载的任何方法均可按照所记载的事件的顺序、或者按照任何其它逻辑上可能的顺序来实施。
样品分析方法
方法的某些实施方案涉及断裂含有完整长RNA和完整短RNA的初始RNA样品,以获得断裂的RNA样品。初始样品中的长RNA的长度为至少50个核苷酸,并可以包括例如细胞mRNA、长非编码RNA(例如lincRNA)和/或tRNA和rRNA。mRNA、tRNA和rRNA的限定特征是众所周知的。lincRNA是相对新近发现的,并被认为参与调节多种多样的过程,例如胚胎干细胞多能性、细胞增殖、癌症和染色质结构。Tingeras(Nature Biotechnology200927:346-347)综述了这类分子。初始样品中的短RNA的长度小于50个核苷酸,并且包括多种小非编码调节RNA,本文中一般地称作“小RNA”,即短干扰RNA、微小RNA(microRNA)、细小非编码RNA(tiny non-codingRNA)、与piwi蛋白相互作用的小RNA(piRNAs)和小调节性RNA。小RNA是一组非编码的调节性RNA,其具有确定的序列并且长度范围是18-31个核苷酸(nt)。许多小RNA的长度大约为19-25nt。
小RNA在Novina等(Nature2004430:161-164)中有一般的综述,并可以分成至少5组:a)短干扰RNA(siRNAs),b)微小-RNA(miRNAs),c)细小非编码RNAs(tncRNAs),d)与piwi蛋白相互作用的RNA(piRNAs)和e)小调节性RNA(smRNAs)。siRNA是一类双链RNA,长度大约为21-22nt,自双链RNA生成。siRNA被认为通过促进mRNA的切割而沉默基因的表达。而另一方面,miRNA是一类单链RNA,长度为大约19-25nt。miRNA似乎在进化上是保守的,并被认为通过抑制翻译而沉默基因的表达。tncRNA是一类大约20-22个核苷酸的RNA。tncRNA似乎是在发育上受调节的,尽管它们的功能未知。smRNA是参与成人神经元中神经元特异基因表达的调节的双链RNA。piRNA通过与piwi蛋白相互作用形成RNA-蛋白复合体。
miRNA特别令人感兴趣。在微小RNA登记处(microRNAregistry)(Griffiths-Jones,Nucl.Acids Res.200432:D109-D111)和由曼彻斯特大学生命科学学院(英国)管理的miRBase中可以发现数百种来自不同物种(,包括人)的miRNA的序列。本文中援引并入在微小RNA登记处存储中的所有微小RNA的序列,包括227种来自人的微小RNA序列(见Lagos-Quintana etal,Science294:853-858(2001);Grad et al,Mol Cell11:1253-1263(2003);Mourelatos et al,Genes Dev16:720-728(2002);Lagos-Quintana et al,Curr Biol12:735-739(2002);Lagos-Quintana et al,RNA9:175-179(2003);Dostie et al,RNA9:180-186(2003);Lim et al,Science299:1540(2003);Houbaviy et al,DevCell5:351-358(2003);Michael et al,Mol Cancer Res1:882-891(2003);Kim et al,Proc Natl Acad Sci U S A101:360-365(2004);Suh et al,Dev Biol270:488-498(2004);Kasashima et al,Biochem Biophys Res Commun322:403-410(2004);和Xie et al,Nature434:338-345(2005))。上文和下文中描述的方法和组合物可用于检测存储在微小RNA登记处以及其它数据库中的任何微小RNA。如下文中将更详细描述的,这里描述的核酸探针可特别用于检测18-31个核苷酸的小RNA。
如上面指出的,该方法包括获得断裂的RNA样品,其包含:i.长RNA分子的RNA片段,其中所述片段包含5’-OH基团和2’-3’-环磷酸基团;和ii.未断裂的短RNA分子,包含5’磷酸基团和3’-OH基团。该短RNA分子在细胞中作为含有5’磷酸基团和3’OH基团的分子天然存在。这样,那些分子不需要进一步的修饰。然而,在特殊情况下,可以或可以不用酶,例如激酶,处理短RNA分子,以进一步保证那些分子的末端含有5’磷酸基团和3’OH基团。另一方面,长RNA分子被断裂,以产生含有5’-OH基团和具备2’-3’-环磷酸基团的3’末端。
一般而言,断裂的RNA样品是通过将包含完整长RNA分子和短RNA分子的初始RNA样品暴露于如下的断裂条件而制备的:所述条件相对于短RNA分子的断裂,更有利于(例如最大化)长RNA分子的断裂。通过这种方法产生的片段含有5’-OH和具备2’-3’-环磷酸基团的3’末端。尽管有其它产生这些片段的方法,但是一个实施方案涉及在至少50°C的温度下将初始RNA样品(其可以包含,例如,总细胞RNA、耗尽了一种或多种类型的RNA(例如rRNA和/或tRNA)的总RNA,或mRNA和小RNA,长非编码RNA和小RNA,尽管也考虑了其它的组合)暴露于金属离子一段合适的时间。
用于断裂RNA而产生含有5’-OH基团和具备2’-3’-环磷酸基团的3’末端的片段的方法包括化学、酶学或热断裂方法,它们的操作规程是已知的(见例如Chandler et al,Appl.Environ.Microbiol.200369:2950-2958,Guschin et alAppl.Environ.Microbiol.199763:2397-2402;Kelly et al,Anal.Biochem.2002311:103-118,Liu et al Environ.Microbiol.20013:619-629,Mehlmann et al,Anal.Biochem.2005347:316-323,Nguyen Nucleic Acids Res.200028:3904-3909,Proudnikov Nucleic Acids Res.200624:4535-4542,Small et al,Appl.Environ.Microbiol.200167:4708-4716)。在一个实施方案中,断裂完整的RNA可以使用碱,通过例如在NaOH(例如50mM NaOH)中高温(例如55°C)下温育一定时间(例如10-30分钟)来进行,如Liu等(Applied andEnvironmental Microbiology,200773:73-82)所述。在另一个实施方案中,断裂可以由金属离子催化,其中可以将完整的RNA与金属离子,例如镧系的离子或二价金属离子如Mg2+或Zn2+(其浓度可为例如5mM-200mM)在高温下(例如50°C-95°C的范围)温育一定的时间,例如1分钟-1小时,如例如Brown等(J.Am.Chem.Soc.2002124:7950–7962)等所述。例如,可以通过在60°C用溶于25mM Tris-HCl(pH7.4)的10mM硫酸锌(ZnSO4)或氯化锌(ZnCl2)温育30min来断裂RNA,如前文Liu等所述。在另一个实例中,可以将RNA与溶于10mM Tris-HCl pH7中的10mM ZnCl2在70°C温育15min来断裂RNA,从而产生长度为60-200个碱基的片段。RNA在40mM Tris-乙酸pH8.1、100mM KOAc及30mM MgOA中75°C温育20-30min会产生长度一般为38-150个碱基的片段,如Mehlmann等(Analytical biochemistry2005347:316-323)所述。上面描述的所有温育时间均可以改变,以便根据期望增加或减少所得片段的长度。断裂的样品可以含有平均长度范围是30-300nt,例如长度50-200nt,的RNA片段。
因为使用上述方法的断裂在整个RNA上几乎随机的位置上非特异地发生,所以平均而言,以每个分子计,断裂在更长的RNA中发生,因为更长的RNA分子含有更多可供发生断裂的潜在位点。例如,将RNA断裂成60-200个碱基长度的片段的断裂条件,平均而言,使长度3kb的RNA分子在大约15-50个位置断裂,而不会断裂长度为大约18-31个核苷酸的小RNA分子。因此,对含有长RNA分子和短RNA分子的RNA样品的进行断裂产生这样的经断裂样品,其含有:a)长RNA分子的片段和b)大体完整的短RNA分子。经断裂样品中的短RNA分子具有确定的末端,因为该分子各末端的核苷酸序列是已知的,而长RNA的片段(因为切割不是序列特异的)则不具有确定的末端。短RNA分子一般不断裂。
该方法的下一步包括在真核tRNA连接酶的存在下使经断裂的RNA样品与衔接头接触,藉此产生经连接的RNA样品,其中所述衔接头包含5’-磷酸基团和/或如下所述的3’末端:该3’末端包含2’-PO基团及3’-OH基团,或包含2’,3’-环磷酸基团。
如在下文中将更详细描述的,该方法可以用多种不同的方式实现。在一些实施方案中,所用的衔接头可具有封闭的(即不可连接的)5’末端,和含有2’-PO基团和3’-OH基团、或含有2’,3’-环磷酸基团的3’末端。在这些实施方案中,只有衔接头的3’末端可以与经断裂RNA样品中的RNA连接。在采用荧光标记衔接头的实施方案中,衔接头可以在任何位置被标记。在一个实施方案中,衔接头的5’末端可以被荧光标签封闭。,衔接头与RNA的连接(ligation)在一些情况下标记该RNA。在其它实施方案中,所用的衔接头可具有5’-磷酸基团和封闭的(即不可连接的)3’末端,从而只有衔接头的5’末端与经断裂的RNA样品的RNA连接。在其它实施方案中,所用的衔接头可具有5’-磷酸基团以及包含2’-PO基团和3’-OH基团或包含2’,3’-环磷酸基团的3’末端,从而该衔接头的两端均可与经断裂RNA样品中的RNA连接。
真核tRNA连接酶已经进化成特异性催化已被切断的tRNA的修复和联结,该切开可以是有意为之的(通过tRNA内含子的切除,其是tRNA生物合成过程的正常环节)或者是防御性的(由于一些外源核糖体毒素的作用)。与噬菌体T4RNA连接酶不同,已显示真核tRNA连接酶识别经切割的tRNA底物的方式与tRNA的序列或结构无关。相反,真核tRNA连接酶的连接底物特异性唯一依赖于上游tRNA片段的末端处的一个异常核苷酸修饰(一个2’PO,3’OH基团)的存在(见图1)。因此,为真核tRNA提供含有2’-PO,3’-OH基团的合成RNA寡核苷酸,将导致该合成的寡核苷酸与任何含有5’-磷酸基团的受体RNA的5’末端连接,而与其序列或结构无关。
利用RNL酶活性产生带标签的RNA文库,在某些情况下能够比其它方法更有优势。首先,总RNA(大的和小的)可以在同一反应中用真核tRNA连接酶同时加以标记。第二,仅需要一个酶添加步骤,这可以显著缩短每一个现有的个别RNA文库生成规程的时间,从而减少对使用者技术熟练水平的要求。第三,与噬菌体T4RNA连接酶不同,真核tRNA连接酶独特的不依赖RNA序列和RNA结构的底物识别机制理想地适合于复杂的RNA文库产生。第四,标记miRNA的5’端(与现有的标记miRNA3’端的规程不同)可以规避现有的与某些miRNA的3’端的不均一的序列内容(其能够产生与微阵列探针序列的错配)相关的潜在微阵列杂交问题。第五,与现有的mRNA表达微阵列谱分析规程不同,通过真核tRNA连接酶产生总RNA文库不需要文库扩增,因此最终的数据不会因扩增假象造成失真。
本方法中使用的真核tRNA连接酶可根据该方法实现的方式来加以裁量。例如,如果不期望该酶的激酶活性,可以通过改变酶的激酶域的氨基酸序列使之失活。类似地,如果不期望该酶的环磷酸二酯酶活性,可以通过改变改变酶的环磷酸二酯酶结构域的氨基酸序列使之失活。如上面指出的,本方法中使用的真核tRNA连接酶可以最少具有这样的连接酶域,该连接酶域具有与野生型真核tRNA连接酶的连接酶域的氨基酸至少80%相同的氨基酸序列。在特定的实施方案中,所用的酶的连接酶域可以具有与野生型真核tRNA连接酶的连接酶结构域的氨基酸序列至少85%、至少90%、至少95%或高达100%相同的氨基酸序列。如果存在激酶和环磷酸二酯酶域,那么它们与野生型真核tRNA连接酶的域的氨基酸序列有至少85%、至少90%、至少95%或高达100%相同。因为这些酶是模块性的(modular),所以所用的酶可以具有来自不同物种的嵌合序列。例如,在一个实施方案中,所用的酶可具有:a)连接酶域,其与来自第一物种的真核tRNA连接酶的连接酶域至少80%相同,和任选地b)环磷酸二酯酶域,其与来自第二物种的真核tRNA连接酶的环磷酸二酯酶域至少80%相同,和/或c)激酶域,其与来自第三物种的真核tRNA连接酶的激酶域至少80%相同。关于改变哪些氨基酸以便使真核tRNA连接酶的激酶和/或环磷酸二酯酶活性失活的指导可以从关于这些酶的出版材料以及关于其它激酶和环磷酸二酯酶的知识中获得。在特定的实例中,连接可以在存在或不存在ATP的情况下完成。
如上面指出的,本方法可以用各种不同的方式实现。在一个实现方式中,该方法可以用于(I)快速产生5’标记的总RNA文库,其适用于仅用2步与阵列进行杂交(图2所示)。该方法的另一种实现方式(II)是通过使用真核tRNA连接酶与T4RNA连接酶的混合物进行一个额外的3’-衔接头连接步骤;所得的侧翼有合成寡核苷酸的总RNA文库可通过逆转录拷贝到cDNA中,并在任何可用的平台上进行下一代测序(图3)。或者,如果终端用户仅对使用针对cRNA优化的阵列平台进行RNA分析感兴趣,则可以调整该方法以快速产生3’-标记的mRNA文库(缺少miRNA),其然后可以被转变成cRNA,并与微阵列杂交(图4)。这些实施方案在下文有更详细的描述。
在一些实施方案中(以及图2的实例所例示的),该方法可以用于向短RNA和断裂的长RNA的5’末端添加衔接头。在该实施方案中,真核tRNA连接酶可以具有激酶活性而没有环磷酸二酯酶活性,并且衔接头可以包含封闭的(即不可连接的)5’末端和包含2’-PO基团与3’-OH基团的3’末端。在该实施方案中,激酶活性将片段的5’-OH基团转变成5’-PO基团,该接触导致衔接头的3’末端连接于:i.RNA片段的5’末端而非3’末端,和ii.短RNA分子的5’末端而非3’末端。在一些实施方案中,衔接头可以在任何位置被标记,并且在特定的实施方案中,衔接头可以在5’末端被标记,在那里该标记使得衔接头的5’末端不能够连接。
图2示意性地图解了一个可以实现该方法的示例途径。参考图2,将总RNA样品悬浮在含有10mM MgCl2的1x真核tRNA连接酶缓冲液中。重悬浮的总RNA样品首先通过将该混合物在95°C加热20分钟加以断裂。添加携带2’-PO、3’-OH基团(即经分解的2’,3’-环磷酸基团)的、缀合有5’荧光基团的寡核苷酸衔接头,和携带导致环磷酸二酯酶域失活的点突变的RNLΔCPD。因为环磷酸二酯酶域是无活性的,所以断裂的大RNA3’末端的2’,3’-环磷酸基团不被酶修复。RNLΔCPD的激酶域将磷酸基团附接到断裂的大RNA的5’末端。miRNA(其含有天然的5’-PO基团)和经修复的大RNA被连接到含有缀合有5’荧光基团的含有2’-P,3’-OH基团的衔接头上。该衔接头将帮助延长miRNA,从而使它们能够在更高Tm下与Agilent微阵列杂交,从而提高特异性,所述微阵列将被设计成具有合适的探针加以接纳经连接的衔接头。另外,应当仅有很少或者没有非期望的连接(例如miRNA与断裂的大RNA之间的连接),因为每种类型RNA的3’末端均不会被RNLΔCPD识别。RNL已被报道的高特异活性应当为高效连接提供可能,从而可以对少量的总RNA进行谱分析。另外,5’荧光基团缀合的衔接头可以用多种荧光基团装饰,以增强可检测信号。最后,因为这是一种直接的RNA谱分析方法,所以可以编码扩增假象。
在衔接头连接后,使衔接头连接的样品与核酸探针阵列杂交,并读取该阵列,以获得初始RNA样品中长RNA的丰度的估计,和初始RNA样品中短RNA的丰度的估计。在特定的实施方案中,读取阵列,以独立地获得对初始RNA样品中多个(即至少10个、至少100个、至少500个、至少1,000个、至少10,000个、或者至少50,000个,高达至少100,000个)不同长RNA和不同短RNA的丰度的估计。用于检测小RNA的核酸探针含有与短RNA互补的序列,以及与衔接头序列互补的序列,而用于检测长RNA的核酸探针含有与长RNA互补的序列,但没有与衔接头互补的序列。
具体地讲,在衔接头的连接之后,衔接头连接的样品含有:i.衔接头连接的短RNA,其含有衔接头部分和短RNA部分;和ii.衔接头连接的长RNA片段,其包括衔接头部分和长RNA部分。该衔接头连接的样品与阵列杂交,该阵列包含:i.第一核酸探针,其含有与衔接头连接的短RNA的衔接头部分与RNA部分二者均互补的核苷酸序列;和ii.第二探针,其含有与衔接头连接的长RNA的长RNA部分互补、但是不与衔接头连接的长RNA的衔接头部分互补的核苷酸序列。
向短RNA添加衔接头和在核酸探针中包含衔接头序列有效地增加短RNA与互补探针之间互补区域的长度(其可以长达25-40个碱基对,而没有衔接头时仅有18-25个碱基对),藉此增加短RNA与相应的探针之间形成的杂交体的Tm。这使得杂交可以在更高温度下进行,还允许阵列上的大多数探针(即相应于长RNA的探针以及相应于短RNA的探针)在温度上匹配。由于长RNA大体上是随机断裂的,所以衔接头对长RNA的添加发生在随机的位置,这样,对应于长RNA的探针含有与衔接头互补的序列就是没有必要或者没有优势的。
合适的标记包括荧光染料,其包括呫吨染料,如荧光素和罗丹明染料,例如异硫氰酸荧光素(FITC),6-羧基荧光素(通常知晓的缩写为FAM和F),6-羧基-2',4,7,4,7-六氯荧光素(HEX),6-羧基-4’,5’-二氯-2’,7’-二甲氧基荧光素(JOE或J),N,N,N',N'-四甲基-6-羧基罗丹明(TAMRA或T),6-羧基团-X-罗丹明(ROX或R),5-羧基罗丹明-6G(R6G5或G5),6-羧基罗丹明-6G(R6G6或G6),和罗丹明110;花青染料,例如Cy3,Cy5和Cy7染料;香豆素,例如伞形酮;苯甲亚胺染料,如Hoechst33258;菲啶染料,如德克萨斯红;溴化乙锭染料;吖啶染料;咔唑染料;吩恶嗪染料;卟啉染料;聚甲炔(polymethine)染料,例如花青染料,如Cy3,Cy5,等;BODIPY染料和喹啉染料。在一些应用中共同使用的具体的感兴趣的荧光基团包括:芘、香豆素、二乙基氨基香豆素、FAM、荧光素氯均三嗪、R110、曙红、JOE、R6G、四甲基罗丹明、TAMRA、丽丝胺、ROX、萘荧光素(napthofluorescein)、德克萨斯红、萘荧光素(napthofluorescein)、Cy3和Cy5等。
可用于本主题方法的合适的可区分荧光标签对包括Cy-3和Cy-5(Amersham Inc.,Piscataway,NJ),Quasar570和Quasar670(BiosearchTechnology,Novato CA),Alexafluor555和Alexafluor647(Molecular Probes,Eugene,OR),BODIPY V-1002和BODIPY V1005(Molecular Probes,Eugene,OR),POPO-3和TOTO-3(Molecular Probes,Eugene,OR),和POPRO3和TOPRO3(Molecular Probes,Eugene,OR)。其他合适的可区分的可检测的标记物可以在Kricka等(Ann Clin Biochem.39:114-29,2002)中找到。
在某些实例中,RNA可以用通用连接系统(ULSTM,KREATECHDiagnostics;van Gijlswijk等.Universal Linkage System:versatile nucleic acidlabeling technique Expert Rev.Mol.Diagn.20011:81-91)加以标记。简而言之,ULSTM标记是基于铂(II)与核酸的稳定结合性质。ULS分子由与选定的可检测分子偶联的单功能铂复合物构成。其他方法可以用于标记RNA,例如在下列文献中提出的:Ausubel等,(Short Protocols in Molecular Biology,3rd ed.,Wiley&Sons,1995)和Sambrook等,(Molecular Cloning:A LaboratoryManual,Third Edition,(2001)Cold Spring Harbor,N.Y.)。在采用ULS标记规程的实施方案中,标记的RNA作为ULS标记方法的一部分可以被断裂,其可以导致RNA片段的产生。
在其它实施方案中(如图3中的实例所例示的),该方法可用于制造用于下一代测序的总RNA文库。在该实施方案中,真核tRNA连接酶具有激酶活性和磷酸二酯酶活性,并且衔接头包含5’-PO基团,和含有i.2’-PO基团和3’-OH基团,或ii.2’,3’-环磷酸基团的3’末端。在这些实施方案中,激酶活性将RNA片段的5’-OH基团转变成5’-PO,且环磷酸二酯酶活性将(所述片段的,以及任选地,所述衔接头的)2’-3’-环磷酸基团转变成2’-PO基团和3’-OH基团。在该方法中,接触导致产生:i.环形RNA分子,每一个环形RNA分子含有衔接头和RNA片段,和ii.线性RNA分子,其包含衔接头和短RNA。在特定的情况下,接触可以在第二衔接头的存在下实现,并且所得的环状分子除了包含该第一衔接头和短RNA之外,还可以包含第二衔接头。这些方法实施方案可以进一步包括使线性RNA分子与T4RNA连接酶接触,藉此产生包含衔接头和短RNA的环形分子。该连接步骤还可以在第二衔接头的存在下实现。
图3示意性地图解了一个可以实现本方法的示例途径。参考图3,如上文所述的方法制备总RNA样品,只是衔接头不含有封闭的5’端。衔接头序列的分子间连接会产生环形衔接头/RNA,可以对其进行引发用于cDNA合成,对其用限制性内切酶消化,并进行PCR扩增以形成文库,该文库将被输入到下一代测序仪中的。因为miRNA缺少2’PO,3’OH基团(并且因此不是连接酶活性的底物),所以可以在RNL之后添加T4RNA连接酶,以封闭环形衔接头/miRNA。
通过在总RNA混合物中提供摩尔过量的衔接头,与衔接头的连接反应的普通产物(common products of ligation with the adapter)应当是(i)衔接头/RNA环(circles),(ii)衔接头-多聚体/RNA环(circles),和(iii)没有RNA的衔接头多聚体环(circles)。在逆转录的过程中,将通过工程化一个独特的限制位点(该限制位点是在衔接头头尾(head-to-tail)连接时产生的)而在cDNA合成之后切除“空”衔接头多聚体,因此衔接头-衔接头cDNA的PCR扩增将会显著减少。作为该消化的另一个结果,衔接头-多聚体/RNA环可以被分解为线性单衔接头/RNA,其与上述方法中所述的相同。
在特定情况下,取决于所用的条件,该连接的产物可以包括具有结构[衔接头-片段-]n的多聚体,其是游离末端的头尾连接的结果。因为衔接头可能是摩尔过量的,所以也可能存在接头-接头-接头多聚体,单个的可测序单元(sequenceable unites)可能是由于逆转录酶偶然接触(bumping into)与已连接的衔接头退火的上游寡核苷酸的结构。这些长多聚体可以是环形的(如果不包含短RNA),或者线性短RNA会“加帽”于3’末端(因为3’-OH不能被tRNA连接酶连接)。
通过该方法生成的产物一般与一种或多种下一代测序平台兼容。在某些实施方案中,产物可以在体外克隆扩增,例如使用乳化PCR(emulsion PCR)或通过桥梁PCR,然后测序,例如使用可逆转的终止子方法(reversibleterminator method)(Illumina and Helicos),通过焦磷酸测序(454)或通过连接测序(SOLiD)。这些方法的实例在下列参考文献中有描述;Margulies等(Genomesequencing in microfabricated high-density picolitre reactors".Nature2005437:376–80);Ronaghi等(Real-time DNA sequencing using detection ofpyrophosphate release Analytical Biochemistry1996242:84–9);Shendure(Accurate Multiplex Polony Sequencing of an Evolved Bacterial GenomeScience2005309:1728);Imelfort等(De novo sequencing of plant genomesusing second-generation technologies Brief Bioinform.200910:609-18);Fox等(Applications of ultra-high-throughput sequencing.Methods Mol Biol.2009;553:79-108);Appleby等(New technologies for ultra-high throughputgenotyping in plants.Methods Mol Biol.2009;513:19-39)和Morozova(Applications of next-generation sequencing technologies in functional genomics.Genomics.200892:255-64),本文援引并入它们的内容用于一般地描述方法和方法的特定步骤,包括所有起始产物、试剂、和每个步骤的最终产物。上面描述的方法可用于研究任何序列已知或未知的基因组,例如植物(单子叶或双子叶)的基因组、动物例如脊椎动物如哺乳动物(人、小鼠、大鼠等)、两栖动物、爬行动物、鱼、鸟类或无脊椎动物(例如昆虫)的基因组,或微生物,例如细菌或酵母等的基因组。
在其它实施方案中(如图4中的实例所示),该方法可用于制作适合于产生cRNA的加尾RNA文库(tailed RNA)。在该实施方案中,真核tRNA连接酶可以具有环磷酸二酯酶活性,但是没有激酶活性;并且衔接头可以包含5’磷酸和不可连接的3’末端。在该实施方案中,环磷酸二酯酶活性将(片段的,以及任选地,衔接头的)2’-3’-环磷酸基团转变成2’-PO基团和3’-OH基团。该接触导致衔接头的5’末端连接于:i.RNA片段的3’末端而非5’末端,和ii.既非短RNA的3’末端也非其5’末端。在特定的情况下,衔接头可以含有供噬菌体RNA聚合酶启动子用的序列(a sequence for abacteriophage polymerase promoter),藉此允许用噬菌体RNA聚合酶(例如T3-T7等)将经连接的片段进行扩增。
图4示意性地图解了可以实现本方法的一个示例性方式。参考图4,使用经过修饰的tRNA连接酶快速制备适合于产生cRNA的3’-加尾mRNA/ncRNA文库。如果终端用户对miRNA谱分析不感兴趣,并且希望快速获得经扩增的cRNA文库,则可以根据图4所示使用RNLΔ激酶。将RNA断裂,并与含有T7RNA聚合酶启动子元件的3’衔接头寡核苷酸同时添加RNLΔ激酶。RNLΔ激酶会分解2’,3’-环磷酸基团但不分解5’OH基团,且连接酶域会将3’衔接头附接于含有2’-PO的断裂RNA末端。miRNA不会被连接,因为其末端缺少2’-PO基团。为了制作cDNA,可以通过添加与3’衔接头杂交的引物和逆转录酶来将3’衔接头连接的长RNA逆转录。所得的cDNA可以用作模板,用于通过添加T7RNA聚合酶产生RNA。
其他实施方案
在另一个实施方案中,真核tRNA连接酶可以用于将一个或多个适宜设计的衔接头与未断裂的RNA样品(例如没有经过任何断裂程序的总RNA)连接。在这些实施方案中,样品可以包含:i.未断裂的长RNA分子(其可以含有例如5’m7G帽)和ii.未断裂的短RNA分子,其包含5’磷酸基团和3’OH基团。在这些实施方案中,衔接头可以含有2’-PO基团和3’-OH基团,或含有2’,3’-环磷酸基团。该衔接头的5’末端可以被封闭,例如用标记物或亲和标签加以封闭,藉此让衔接头仅与短RNA分子连接。该方法可以包括:a)获得未断裂的RNA样品,其包含:i.长RNA分子,和ii.含有5’磷酸基团和3’OH基团的短RNA分子;和b)在真核tRNA连接酶的存在下,使未断裂的RNA样品与衔接头接触,所述衔接头包含
封闭的5’末端;和
2’-PO基团及3’-OH基团,或2’,3’-环磷酸基团;
藉此产生经连接的RNA样品,其中短RNA分子被选择性地与衔接头连接。
在任何包含上述实施方案的实施方案中,连接产物可以直接杂交于阵列(例如如果第一衔接头被标记),或者可以从阵列中的其它产物纯化出来(例如,如果第一衔接头具有亲和标签,例如“生物素模块”,即一种包含生物素或生物素类似物,例如脱硫生物素、氧代生物素、2’-亚氨基生物素、二氨基生物素、生物素亚砜、生物胞素等的亲和剂。生物素模块以至少为10-8M的亲和力与链霉亲和素结合。生物素亲和剂还可以包含接头,例如─LC-生物素、─LC-LC-生物素、─SLC-生物素或─PEGn-生物素,其中n是3-12)。或者,经连接的衔接头可以含有RNA聚合酶启动子,在合成第一和第二链cDNA之后,其可以被测序或用于直接转录衔接头连接的RNA;这些被转录的RNA可以在转录过程中用荧光染料标记,并且可以将样品与阵列杂交以检测经扩增的带标记的RNA分子。
在一些实施方案中,可以对样品中断裂的较长RNA和未断裂的短RNA进行测序,例如通过使用下一代测序技术。为了实施这种方法,可以将RNA逆转录成cDNA,其含有位于待测序RNA侧翼的衔接头。侧翼衔接头可用于引发测序反应。
有数种方法将衔接头与待测序RNA的每个末端连接。一种方法涉及使用第一衔接头随机引发以产生cDNA,然后将该cDNA与另一个衔接头连接。在另一种方法中,在cDNA合成之前直接将衔接头添加到RNA上。该技术称作“直接衔接头连接”。这种方法的一个实例如图11示意性所示。
直接衔接头连接方法是有利的,因为它允许:a)产生定向(directional)RNA文库,它们将序列映射到一条链上(如果使用随机引发生产cDNA的话,这种信息的保存是一个技术挑战)和b)对小RNA的谱分析,小RNA例如微小RNA和其它类型的小RNA(它们太小而不能随机引发)。然而,由于5’衔接头(即与RNA5’端连接的衔接头)与3’衔接头(即与RNA3’端连接的衔接头)的连接,衔接头连接方法经常产生不想要的副产物。这些产物经常被称作“衔接头二聚体”,它们一贯是导致效率低下的源头,因为它们不含有关于被测序的转录组的信息。
下面的方法是可以在cDNA文库产生期间除去或避免衔接头二聚体的途径。
在一个实施方案中,如图9所示,5’衔接头和3’衔接头可以如此设计:它们每一个均含有归巢性内切核酸酶的部分识别序列,当它们被连接在一起产生衔接头二聚体并以双链形式存在时,衔接头二聚体含有归巢性内切核酸酶识别位点。归巢性内切核酸酶与限制性内切核酸酶的不同之处在于,它们识别20-30个核苷酸大小范围的DNA序列元件,并且它们的识别序列是非回文的。这样,在许多哺乳动物基因组中,可能有零个或有一个归巢性内切核酸酶靶位点。归巢性内切核酸酶的实例包括属于如下家族者:LAGLIDADG,GIY-YIG,His-Cys盒,H-N-H,PD-(D/E)xK和类Vsr。SceI是可以使用的酶的一个实例,尽管还存在许多其它的。
在该实施方案中,并且如图9所示,可以把衔接头添加到可产生两种可能的连接产物的连接反应中。如图9左侧所示,RNA插入物与5’衔接头和3’衔接头连接。或者(如图9右侧所示),没有连接插入物,衔接头直接彼此连接,产生衔接头二聚体。在第一和第二链cDNA合成之后,连接产物将是双链cDNA。添加归巢性内切核酸酶SceI导致衔接头二聚体被切割(右侧),而含有插入物的产物不被切割(左侧)。经切割的衔接头二聚体可以基于尺寸或电荷与未经消化的产物分离。作为替代或补充,在消化后,可以通过PCR扩增双链产物,其会产生过量的侧翼有衔接头的插入物,而几乎没有衔接头二聚体。经扩增的cDNA随后可以在任何合适的测序平台上测序。
该方法可以包括:a)获得第一单链衔接头和第二单链衔接头,其中第一衔接头和第二衔接头各自含有归巢性内切核酸酶的部分识别位点,且当连接在一起时,它们提供含有所述归巢性内切核酸酶识别位点的衔接头二聚体;b)将所述第一单链衔接头与RNA样品中RNA分子的第一末端连接;c)将所述第二衔接头与所述样品中RNA分子的末端连接;d)自步骤c)的产物产生双链cDNA,和e)用所述归巢性内切核酸酶切割所述双链cDNA,藉此从所述样品中除去衔接头二聚体。该方法可以进一步包括使用与所述的衔接头序列退火的引物对经切割的样品进行PCR。
在一个备选的实施方案中,可以利用真核tRNA连接酶对单链末端的底物偏好。在这些实施方案中,方法涉及:将一个衔接头(例如3’衔接头)连接RNA,并在连接后,使互补的寡核苷酸与剩余的未连接衔接头杂交,以便让连接酶“找不到”该衔接头。接着,使用真核tRNA连接酶连接该另一个衔接头(例如5’衔接头)。因为第一衔接头具有双链末端,它实际上是连接酶找不到的,所以不被用于产生衔接头二聚体。在这些实施方案中,添加的互补寡核苷酸可以相对于其设计用于封闭的衔接头摩尔过量,例如过量至少2倍,至少5倍,至少10倍,至少50倍,至少100倍,至少1,000倍或者更多。当与互补寡核苷酸双链体化后,衔接头的5’末端相对于互补寡核苷酸的末端可能是平齐的(flush)或者是凹入的(recessed),藉此使连接酶不能接触它。容易想到的是,互补寡核苷酸的末端可以适宜地加以封闭,从而使其本身不会干扰连接。该方法可以包括:a)将第一单链衔接头与RNA样品的RNA分子的第一末端连接;b)将第一单链衔接头与互补寡核苷酸杂交,从而产生不含有所述单链衔接头的可连接突出端(ligatable overhang)的双链体,藉此去除作为进一步连接的底物的所述第一单链衔接头;和c)使用真核tRNA连接酶向RNA样品中RNA分子的另一端连接第二衔接头,藉此提供两端均连接有衔接头的RNA样品。
试剂盒
主题发明还提供了用于实施如上所述的主题方法的试剂盒。在某些实施方案中,主题试剂盒至少包含:
a)衔接头,其含有:
5’-PO基团,和/或
含有i.2’-PO基团与3’-OH基团或ii.2’,3’-环磷酸基团的3’末端;
b)真核tRNA连接酶。该试剂盒还可包含用于从细胞分离RNA的试剂,用于标记RNA的试剂,用于将被标记的小RNA与阵列杂交的试剂,对照RNA,和用于断裂RNA的试剂等。根据期望,试剂盒的各种组分可以存在于分离的容器中,或者可以将某些相容的组分预先组合在一个容器中。
除了上述组分之外,本主题试剂盒可以进一步包括关于使用试剂盒的组分来使用主题方法的说明书,例如用于样品分析的说明书。用于实施主题方法的说明书一般被记录在合适的记录介质上。例如,使用说明可以印刷在基材,例如纸或塑料上,等等。这样,说明书可以作为包装插页存在于试剂盒中,置于试剂盒或其组分容器的标签内(即与包装或次级包装关联)等。在其它实施方案中,说明书作为存储在合适计算机可读存储介质,例如CD-ROM、磁盘等的电子存储数据文件存在。在另外的实施方案中,试剂盒内不存在实物说明书,而是提供可以自远程来源,例如通过互联网获得说明书的手段。该实施方案的一个实例是包含网址的试剂盒,在该网址可以观看说明书和/或下载说明书。与说明书同样,获得说明书的手段被记录在合适的基材上。
功用
主题方法可用于多种诊断、药物发现和研究应用,包括但不仅限于:高通量测序、基因分型、和基因表达分析。在特定的实施方案中,该方法可以用于诊断或监视疾病或状况(其中短和/或长RNA的表达提供该疾病或状况的标志),发现药物靶标(其中短和/或长RNA在疾病或异常中差异表达,并可以作为药物治疗的靶标),药物筛选(其中通过评估短和/或长RNA的水平监视药物的效果),确定药物敏感性(其中药物敏感性与短和/或长RNA的特定分布谱(profile)有关),和基础研究(其中期望鉴定样品中短和/或长RNA的存在,或者在某些实施方案中,鉴定两个或多个样品中特定短和/或长RNA的相对水平)。
在某些实施方案中,可以用上述方法获得并比较两个或更多个不同的小RNA样品中小短和/或长RNA的相对水平。在这些实施方案中,从上述方法获得的结果通常相对于样品中的RNA总量或对照RNA(例如组成型RNA)进行标准化,并比较。这可以通过比较比值或通过其它方法实现。在特定的实施方案中,可以比较两个或更多个不同样品中短和/或长RNA的分布谱,以鉴定与特定疾病或状况相关的短和/或长RNA(例如被疾病或状况诱导,因此被认为是该疾病或状况所牵涉的信号转导通路的一部分的短和/或长RNA)。
这些不同的样品可以由“实验”样品,即感兴趣的样品,和可用于与实验样品进行比较的“对照”样品组成。在许多实施方案中,不同的样品是成对的细胞类型或其级分,其中一种细胞类型是感兴趣的细胞类型,例如异常细胞,另一种是对照,例如正常细胞。如果比较细胞的两个级分,则所述级分通常是来自两种细胞中每一种的相同级分。但是,在某些实施方案中,可以比较同意细胞的两个级分。成对细胞类型的实例包括,例如,从组织活检分离的细胞(例如从具有疾病如结肠、乳腺、前列腺、肺、皮肤癌,或者被病原体等感染的组织)和来自相同组织的正常细胞,通常来自同一个患者;组织培养中生长的永生的细胞(例如具有增殖突变或永生化转基因的细胞),被病原体感染的细胞或经处理(例如用环境或化学剂,如肽、激素、改变的温度、生长条件、物理胁迫、细胞转化等),和正常细胞(例如除了非永生、未经感染或处理等之外,与实验细胞相同的细胞);从患有癌症、疾病的哺乳动物、老年哺乳动物或暴露于某种条件的哺乳动物分离的细胞,和从相同物种,优选地来自相同家族(family)的健康或年轻的哺乳动物分离的细胞;和来自相同哺乳动物的分化细胞和未分化细胞(例如一种细胞是哺乳动物中另一种细胞的祖先)。在一个实施方案中,可以使用不同类型的细胞,例如神经元和非神经元细胞,或不同状态的细胞(例如对细胞进行刺激之前和之后)。在本发明的另一个实施方案中,实验材料是对病原体,例如病毒,如人免疫缺陷病毒(HIV)等的感染敏感的细胞,而对照材料是对该病原体感染有抗性的细胞。在本发明的另一个实施方案中,成对样品的代表是未分化细胞,例如干细胞,和分化细胞。
来自酵母、植物和动物(例如鱼类、鸟类、爬行动物、两栖动物和哺乳动物)的细胞可用于本方法。在某些实施方案中,可以使用哺乳动物细胞,即来自小鼠、家兔、灵长动物或人的细胞,或其培养衍生物。因此,除了其它之外,本方法可用于将某些基因的表达与特定的生理事件相关联。
实施例1
材料和方法
用于在变性丙烯酰胺凝胶上分析的连接的时间过程
为了确定AtRNLT1001A的体外反应动力学,进行了连接的时间过程。连接反应含有5’封闭(5’-Cy3)的具有2’PO,3’OH下游末端的底物RNA寡核苷酸,和第二RNA寡核苷酸5’OH-let-7a-Cy5。将这些RNA底物在50mMTris-HCl(pH8)和10mM MgCl2存在下在95°C变性1分钟,随后在冰上冷却。然后将这些寡核苷酸在20μl反应体系中与AtRNL T1001A温育,该反应体系含有5皮摩尔OH-let-7a-Cy5,50mM Tris-HCl pH8,10mM MgCl2,1mM ATP,1mM GTP,1nmol Cy3-标记的RNA寡核苷酸,2.5pmol AtRNL T1001A,40URNA酶抑制剂和2mM二硫苏糖醇。在不同时间通过添加100%甲酰胺停止连接反应,在95°C变性1min,然后在冰上冷却。随后在15%变性聚丙烯酰胺凝胶上分离该反应体系,用PhosphorImager(ABI)在650nm检测Cy5。
对于这些反应,AtRNL T1001A为2.4uM。OH-let-7a-Cy5是一种22聚体RNA寡核苷酸,具有如下序列5’-UGA GGU AGU AGG UUG UAU AGUU/3Cy5Sp-3’(SEQ ID NO:8),并且Cy3-标记的RNA寡核苷酸具有序列Cy3-UAU UGA CA-3’OH,2’P。
用于微阵列应用的总RNA标记
纯化人总RNA样品用5’-Cy3-标记的RNA-2’PO,3’OH寡核苷酸如下地进行末端标记。将200ng纯化总RNA重悬在8ul含有50mM Tris-HCl(pH8),10mM MgCl2的缓冲液中。通过95°C加热反应混合物10min然后冰上冷却断裂RNA。然后,将断裂的RNA与AtRNL T1001A和5’-Cy3-标记的8聚体RNA寡核苷酸在30ul反应体系中37°C温育30分钟,该反应体系包含200ng所述断裂的RNA,50mM Tris-HCl pH8,10mM MgCl2,1mM ATP,1mMGTP,1nmol Cy3-RNA寡核苷酸,2.5pmol AtRNL T1001A和2mM二硫苏糖醇。为了进行杂交,将反应体系重悬在标准Agilent杂交缓冲液中,最终体积为110ul,90°C变性3分钟,并在冰上冷却。然后将样品装载到DNA微阵列上,该微阵列含有针对17,306种mRNAs(137,526个外显子),5274种长非编码RNA(lincRNAs)(22,134个外显子)和191种miRNA的探针。然后,将阵列在65°C温育大约17个小时,并根据Agilent的标准基因表达阵列规程进行清洗。这里所用的AtRNL T1001A为2.4uM。Cy3-标记的RNA寡核苷酸是具有一个5’-Cy3和一个3’OH,2’P的8聚体(Cy3-UAUUGACA-3’OH,2’P)。
结果
检测了拟南芥tRNA连接酶(AtRNL),以确定其是否能够将具有2’磷酸和3’羟基基团的5’-Cy3-标记RNA寡核苷酸与具有5’羟基和3’Cy5荧光标签的人let-7a RNA底物相连接。将这两种RNA与AtRNL温育5-60分钟,并通过凝胶电泳及随后的PhosphorImager分析对各反应进行测定(图5)。发现反应进行得非常迅速,95%的let-7a RNA底物在15分钟内被磷酸化和连接。
对总RNA样品进行测定。首先通过在镁存在下加热10分钟断裂人总RNA,随后使用AtRNLT1001A将片段与含有2’P,3’OH的5’-Cy3-标记RNA寡核苷酸连接。连接后,将样品与含有针对mRNAs,lincRNAs、和微小RNAs(miRNAs)的探针的DNA微阵列杂交。清洗和扫描后,对重复杂交的数据进行分析(图6)。点图显示了mRNA探针(图7)和miRNA探针(图8)的来自重复杂交的信号彼此相对描点作图。数据的线性表明标记和杂交是高度可重复的。
实施例2
在下面描述的实验中,有一个未标记的“底物”RNA(其作为断裂的总RNA的代表(proxy))和两种具有不同长度和序列的3’末端Cy5-标记寡核苷酸(称作let-7a-Cy5和10-mer-Cy5)。结果如图10所示。左边的泳道含有AtRNL催化的标准连接反应体系中的全部三种寡聚体。在该泳道中可以见到两个连接产物(如连接的let-7箭头和连接的10-mer箭头所示)。右边的泳道含有相同的三种寡聚体,但是有10倍过量的反义Let-7a,该反义Let-7a在添加AtRNL之前进行了预先退火。
结果表明,10-mer在两个反应中同等地与底物RNA连接。与之相对地,底物+let-7a-Cy5的连接产物仅在没有反义let-7存在的条件下才可见,表明在连接反应中,AtRNL并不高效地使用双链3’衔接头。由于10-mer在这些反应中仍然被连接(且其与反义let-7寡聚体不互补),因此,对let-7底物的偏恶很可能是由于AtRNL对具有单链5’磷酸供体末端的RNA具有偏好。
Figure IDA00003346226300011

Claims (24)

1.一种制备RNA样品的方法,包括:
a)获得断裂的RNA样品,其包含:
i.长RNA分子的RNA片段,其中所述片段包含5’-OH基团和2’-3’-环磷酸基团;和
ii.包含5’磷酸基团和3’OH基团的未断裂的短RNA分子;和
b)在真核tRNA连接酶的存在下,使所述断裂的RNA样品与衔接头接触,该衔接头包含
5’-PO;和/或
3’末端,其包含2’-PO基团与3’-OH基团,或者包含2’,3’-环磷酸基团;
藉此产生经连接的RNA样品。
2.权利要求1的方法,其中所述断裂的RNA样品是通过将含有完整的长RNA分子和未断裂的短RNA分子的初始RNA样品暴露于断裂条件而制成的,其中该断裂条件相比于所述短RNA分子更有利于所述长RNA分子的断裂。
3.权利要求2的方法,其中所述暴露包括在至少50°C的温度使所述初始RNA样品与二价阳离子接触。
4.前述任一权利要求的方法,其中:
a)所述真核tRNA连接酶具有激酶活性,但是没有环磷酸二酯酶活性;且
b)所述衔接头包含
不可连接的5’末端、以及
含有2’-PO基团和3’-OH基团的3’末端;
其中所述激酶活性将所述片段的5’-OH基团转变成5’-PO基团,并且所述接触导致所述衔接头的3’末端连接于:
i.所述RNA片段的5’端而非3’末端,和
ii.所述短RNA分子的5’末端而非3’末端。
5.权利要求4的方法,其中所述衔接头是被标记的。
6.权利要求5的方法,其中所述衔接头在其5’末端被标记。
7.权利要求1-3中任一项的方法,其中:
a)所述真核tRNA连接酶具有激酶活性和环磷酸二酯酶活性;和
b)所述衔接头含有5’-PO和3’末端,该3’末端包含i.2’-PO和3’-OH或ii.2’,3’-环磷酸基团;
其中所述激酶活性将所述RNA片段的5’-OH基团转变成5’-PO基团,并且所述环磷酸二酯酶活性将所述RNA片段的2’,3’-环磷酸基团、及任选地所述衔接头的2’,3’-环磷酸基团转变成2’-PO和3’-OH基团,并且所述接触导致下述的产生:
i.环状RNA分子,它们各自包含衔接头和RNA片段;和
ii.线性RNA分子,它们包含衔接头和短RNA。
8.权利要求1的方法,其中所述衔接头与所述断裂RNA样品中RNA分子的5’端连接。
9.权利要求8的方法,其中所述方法进一步包括:在5’端连接后,将衔接头与所述断裂RNA样品中的RNA分子的3’端连接。
10.权利要求1-3中任一项的方法,其中:
a)所述真核tRNA连接酶具有环磷酸二酯酶活性但没有激酶活性;和
b)所述衔接头包含5’磷酸基团和不可连接的3’末端;
其中所述环磷酸二酯酶活性将所述RNA片段的2’,3’-环磷酸基团、及任选地所述衔接头的2’,3’-环磷酸基团转变成2’-PO和3’-OH基团,并且所述接触导致所述衔接头的5’末端连接于:
i.所述RNA片段的3’末端而非其5’末端,和
ii.既非所述短RNA分子的3’末端也非其5’末端。
11.权利要求1-3中任一项的方法,其中所述衔接头包含供噬菌体RNA聚合酶启动子用的序列。
12.权利要求10的方法,进一步包括使用噬菌体RNA聚合酶扩增步骤b的产物。
13.权利要求2的方法,其中所述初始RNA样品包括总细胞RNA。
14.权利要求2的方法,其中所述初始RNA样品包括已经除去了tRNA和rRNA的总细胞RNA。
15.权利要求1-14中任一项的方法,其中所述短RNA分子包括选自下组的小RNA分子:短干扰RNA(siRNA)分子,微小RNA(miRNA)分子,细小非编码RNA(tncRNA)分子,小调节RNA(smRNA)分子和与piwi蛋白相互作用的小RNA(piRNA)。
16.权利要求1-15中任一项的方法,其中所述衔接头长度范围是6-12个核苷酸。
17.一种制备RNA样品的方法,包括:
a)获得未断裂的RNA样品,其包含:
i.长RNA分子;和
ii.包含5’磷酸基团和3’-OH基团的短RNA分子;和
b)在真核tRNA连接酶的存在下,使所述断裂的RNA样品与衔接头接触,该衔接头包含
封闭的5’末端;和
2’-PO基团与3’-OH基团,或2’,3’-环磷酸基团;
藉此产生经连接的RNA样品,其中短RNA分子被选择性地与所述衔接头连接。
18.权利要求17的方法,其中所述未断裂的RNA样品是总RNA。
19.一种试剂盒,包括:
a)衔接头,其包含
5’-PO,和/或
3’末端,其包含i.2’-PO基团与3’-OH基团或ii.2’,3’-环磷酸基团;
b)真核tRNA连接酶。
20.权利要求19的试剂盒,进一步包括用于断裂RNA样品的试剂。
21.一种方法,包括:
a)获得第一单链衔接头和第二单链衔接头,其中该第一衔接头和第二衔接头各自含有归巢性内切核酸酶的部分识别位点,并且当连接在一起时,提供含有所述归巢性内切核酸酶的识别位点的衔接头二聚体;
b)将该第一单链衔接头与RNA样品的RNA分子的第一末端连接;
c)将该第二衔接头与所述样品中RNA分子的末端连接;
d)从步骤c)产物产生双链cDNA;和
e)用所述归巢性内切核酸酶切割该双链cDNA,藉此从该样品中除去衔接头二聚体。
22.权利要求22的方法,进一步包括用与所述衔接头序列杂交的引物对步骤e)的经切割的样品进行PCR。
23.一种方法,包括:
a)将第一单链衔接头与RNA样品中RNA分子的第一末端连接;
b)将第一单链衔接头与互补寡核苷酸杂交,产生不含有单链衔接头的可连接突出端的双链体,藉此除去作为用于将来连接的底物的第一单链衔接头;和
c)使用真核tRNA连接酶将第二衔接头与RNA样品中RNA分子的另一个末端连接,藉此产生在两端均连接有衔接头的RNA样品。
24.权利要求23的方法,其中所述第一末端是5’端,且所述第二末端是3’端。
CN201180060308.XA 2010-12-16 2011-12-15 利用真核tRNA连接酶的连接方法 Active CN103261416B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US42400810P 2010-12-16 2010-12-16
US61/424,008 2010-12-16
PCT/US2011/065268 WO2012083072A2 (en) 2010-12-16 2011-12-15 LIGATION METHOD EMPLOYING EUKARYOTIC tRNA LIGASE

Publications (2)

Publication Number Publication Date
CN103261416A true CN103261416A (zh) 2013-08-21
CN103261416B CN103261416B (zh) 2016-08-10

Family

ID=46234891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180060308.XA Active CN103261416B (zh) 2010-12-16 2011-12-15 利用真核tRNA连接酶的连接方法

Country Status (4)

Country Link
US (1) US8927245B2 (zh)
EP (1) EP2652133B1 (zh)
CN (1) CN103261416B (zh)
WO (1) WO2012083072A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106801050A (zh) * 2017-02-20 2017-06-06 广州永诺生物科技有限公司 一种环状rna高通量测序文库的构建方法及其试剂盒
CN104328112B (zh) * 2014-10-31 2017-12-01 江汉大学 一种用于非疾病诊断目的的定量检测内源环状rna的方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2914741B1 (en) 2012-11-02 2017-08-16 Life Technologies Corporation Novel compositions and methods for enhancing pcr specificity
US10563250B2 (en) 2015-03-13 2020-02-18 Life Technologies Corporation Methods, compositions and kits for small RNA capture, detection and quantification
US10787703B1 (en) * 2016-01-08 2020-09-29 Georgia Tech Research Corporation Methods to detect ribonucleotides in deoxyribonucleic acid
IT201900015914A1 (it) * 2019-09-09 2021-03-09 Immagina Biotechnology S R L Procedimento per preparare un campione di rna per il sequenziamento e relativo kit

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100167954A1 (en) * 2006-07-31 2010-07-01 Solexa Limited Method of library preparation avoiding the formation of adaptor dimers

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
EP2045334A1 (en) 1998-06-24 2009-04-08 Illumina, Inc. Decoding of array sensors with microspheres
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6323043B1 (en) 1999-04-30 2001-11-27 Agilent Technologies, Inc. Fabricating biopolymer arrays
US20040203047A1 (en) 1999-04-30 2004-10-14 Caren Michael P. Polynucleotide array fabrication
US6242266B1 (en) 1999-04-30 2001-06-05 Agilent Technologies Inc. Preparation of biopolymer arrays
US6180351B1 (en) 1999-07-22 2001-01-30 Agilent Technologies Inc. Chemical array fabrication with identifier
US6232072B1 (en) 1999-10-15 2001-05-15 Agilent Technologies, Inc. Biopolymer array inspection
US6171797B1 (en) 1999-10-20 2001-01-09 Agilent Technologies Inc. Methods of making polymeric arrays

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100167954A1 (en) * 2006-07-31 2010-07-01 Solexa Limited Method of library preparation avoiding the formation of adaptor dimers

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ALI MORTAZAVI ET AL.: "Mapping and quantifying mammalian transcriptomes by RNA-Seq", 《NATURE METHODS》 *
AMBION: "RNA Fragmentation Reagents", 《AMBION CATALOG #: AM8740》 *
CHENG LU ET AL.: "Construction of small RNA cDNA libraries for deep sequencing", 《METHODS》 *
KEVIN SCHUTZ ET AL.: "Capture and sequence analysis of RNAs with terminal 2’,3’-cyclic phosphates", 《RNA》 *
MARKUS ENGLERT AND HILDBURG BEIER: "Plant tRNA ligases are multifunctional enzymes that have diverged in sequence and substrate specificity from RNA ligases of other phylogenetic origins", 《NUCLEIC ACIDS RESEARCH》 *
V M. SHELTON AND J R. MORROW: "Catalytic transesterification and hydrolysis of RNA by zinc(II) complexes", 《INORG. CHEM.》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104328112B (zh) * 2014-10-31 2017-12-01 江汉大学 一种用于非疾病诊断目的的定量检测内源环状rna的方法
CN106801050A (zh) * 2017-02-20 2017-06-06 广州永诺生物科技有限公司 一种环状rna高通量测序文库的构建方法及其试剂盒

Also Published As

Publication number Publication date
US20120156730A1 (en) 2012-06-21
EP2652133B1 (en) 2023-05-10
EP2652133A4 (en) 2017-04-26
US8927245B2 (en) 2015-01-06
WO2012083072A3 (en) 2013-01-10
EP2652133A2 (en) 2013-10-23
WO2012083072A2 (en) 2012-06-21
CN103261416B (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
US8815782B2 (en) Use of DNAzymes for analysis of an RNA sample
Hafner et al. RNA-ligase-dependent biases in miRNA representation in deep-sequenced small RNA cDNA libraries
ES2550237T3 (es) Composiciones de extremo del transposón y métodos para modificar ácidos nucleicos
US20220042090A1 (en) PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
US9102936B2 (en) Method of adaptor-dimer subtraction using a CRISPR CAS6 protein
US10370702B2 (en) Methods of making oligonucleotide probes
EP2867366B1 (en) Method for isothermal dna amplification starting from an rna template in a single reaction mixture
CN104080958A (zh) 用于定向核酸扩增和测序的组合物和方法
CN103261416A (zh) 利用真核tRNA连接酶的连接方法
CN114829623A (zh) 用于使用双独特双索引的高通量样品制备的方法和组合物
CN104619894A (zh) 用于非期望核酸序列的阴性选择的组合物和方法
CN102268428A (zh) 使用编码双链启动子一条链的引物的方法
CN102076851A (zh) Rna的选择性的5′连接标记
US20110287412A1 (en) Methods for Identifying RNA Segments Bound by RNA-Binding Proteins or Ribonucleoprotein Complexes
US9074203B2 (en) Ligation method employing RtcB
CN108350492A (zh) 连接酶辅助的核酸环化和扩增
JP2022066190A (ja) 細胞成分をマトリックスに結合させるための方法
US9163329B2 (en) RNA labeling method
US11254982B2 (en) Osmiumtetroxide-based conversion of RNA and DNA containing thiolated nucleotides
Tang et al. Identification and exploration of 2’-O-methylation sites in rRNA and mRNA with a novel RNase based platform
Maghami Development, characterization, and application of RNA catalysts for in situ labeling of target RNA molecules
Maghami et al. Nucleic Acid‐Catalyzed RNA Ligation and Labeling
US20120122713A1 (en) Rna labeling method
GB2497480A (en) Nucleic acid libraries depleted in unwanted nucleic acid sequences

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant