CN102533941A - 修饰5-羟甲基胞嘧啶的组合物和方法 - Google Patents

修饰5-羟甲基胞嘧啶的组合物和方法 Download PDF

Info

Publication number
CN102533941A
CN102533941A CN2010105812110A CN201010581211A CN102533941A CN 102533941 A CN102533941 A CN 102533941A CN 2010105812110 A CN2010105812110 A CN 2010105812110A CN 201010581211 A CN201010581211 A CN 201010581211A CN 102533941 A CN102533941 A CN 102533941A
Authority
CN
China
Prior art keywords
nucleic acid
molecule
udp
hydroxymethyl cytosine
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105812110A
Other languages
English (en)
Inventor
金赟懿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2010105812110A priority Critical patent/CN102533941A/zh
Publication of CN102533941A publication Critical patent/CN102533941A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及修饰5-羟甲基胞嘧啶的组合物和方法。更具体地,本发明涉及用于检测、评价和/或定位核酸分子中的5-羟甲基胞嘧啶碱基的方法和组合物。

Description

修饰5-羟甲基胞嘧啶的组合物和方法
技术领域
本发明大体上涉及分子生物学领域。更具体地,本发明涉及用于检测、评价和/或定位核酸分子中的5-羟甲基-修饰的胞嘧啶碱基的方法和组合物。 
背景技术
5-甲基胞嘧啶(5-mC)占人类基因组DNA中总胞嘧啶的约2-8%,其具有多种生物学功能,包括基因表达、基因组完整性的维持、亲本印记、X-染色体失活、发育、衰老和癌症的调节。最近,在胚胎和神经干细胞中、某些成人脑细胞中以及一些癌细胞中发现了氧化的5-mC、5-羟甲基胞嘧啶(5-hmC)。 
需要用于检测和评价真核生物基因组中的5-hmC的方法和组合物。 
发明内容
对5-羟甲基胞嘧啶和5-甲基胞嘧啶不能加以区分,这给更好地研究和理解基因组DNA中5-甲基胞嘧啶的内源性羟基化的意义带来了挑战。能够检测或定位羟甲基状态的解决方案对于诊断和治疗应用具有意义。因此,提供并描述了方法和组合物。 
在一些实施方式中,提供了用于区分核酸分子中的5-羟甲基胞嘧啶和5-甲基胞嘧啶的方法,用于修饰包含至少一个5-羟甲基胞嘧啶的核酸分子的方法,用于鉴定基因组DNA中5-羟甲基胞嘧啶的方法,和基于第一核酸样品中是否存在5-羟甲基胞嘧啶来比较第一核酸样品与至少一个第二核酸样品的方法。 
所述方法可以包括以下描述的任意步骤。在一些实施方式中,所述方法包括将核酸分子与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子一起温育,从而使核酸分子中的5-羟甲基胞嘧啶被修饰的葡萄糖(Glu)分子糖基化。在其它实施方式中,所述方法可以包括将核酸与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子在促进核酸中的5-羟甲基胞嘧啶被修饰的葡萄糖(Glu)分子糖基化的条件下混合。特别考虑到该反应涉及任何可以被时间、酶浓度、底物浓度和/或模板浓度限定或限制的酶。例如,可以对核酸分子进行部分限制性酶消化或部分糖基化。可以调整反应条件,从而使反应在完成大约、至少大约或至多大约20,30,40,50,60,70,80,90,95,96,97,98,99,100%,或其中的任意范围的条件下进行。 
在一些实施方式中,所述方法还可以在核酸的糖基化之前和/或同时包括关于核酸的以下一项或多项操作:获取核酸分子;从生物样品中获取核酸分子;从受试者获取包含核酸的生物样品;分离核酸分子;纯化核酸分子;获取包含待糖基化的核酸的阵列或微阵列;剪切或切割核酸;使核酸分子变性;使核酸分子杂交;将核酸分子与β-葡萄糖基转移酶之外的酶温育;将核酸分子与限制性酶温育;将一种或多种化学基团或化合物连接到核酸上;将一种或多种化学基团或化合物缀合到核酸上;将核酸分子与酶温育,所述酶通过添加或删除一个或多个元件、化学基团或化合物而对所述核酸分子进行修饰。 
所述方法还可以在核酸的糖基化的同时和/或之后包括以下一个或多个步骤:分离被修饰 的葡萄糖糖基化的核酸;基于对葡萄糖的修饰分离糖基化的(和修饰的)核酸;基于对葡萄糖的修饰纯化糖基化的(和修饰的)核酸;将糖基化的核酸暴露于酶、与酶一起温育或与酶混合,所述酶将使用糖基化的核酸作为底物,但不依赖于对葡萄糖的修饰;将糖基化的核酸暴露于酶、与酶一起温育或与酶混合,所述酶将使用糖基化的核酸作为底物,除非对葡萄糖的修饰会修饰、改变、阻止或阻碍所述的酶;将糖基化的核酸暴露于酶、与酶一起温育或与酶混合,所述酶将使用糖基化的核酸作为底物,除非修饰会对该酶造成空间阻碍或抑制;富集包含修饰的和糖基化的核酸的核酸;使用修饰的葡萄糖分子鉴定核酸中的5-羟甲基胞嘧啶;通过将糖基化的核酸与未糖基化的核酸进行对比来鉴定核酸中的5-羟甲基胞嘧啶;定位核酸分子中的5-羟甲基胞嘧啶;使糖基化的核酸进行引物延伸测定并将结果与对照核酸进行比较;使糖基化的核酸进行杂交测定并将结果与对照核酸进行比较;和/或对糖基化的核酸进行测序并将结果与对照核酸进行比较。 
所述方法还可以包括以下步骤:克隆β-葡萄糖基转移酶;合成β-葡萄糖基转移酶或其功能片段;分离β-葡萄糖基转移酶;纯化β-葡萄糖基转移酶;合成β-葡萄糖基转移酶;将β-葡萄糖基转移酶置于无菌容器中;运输处于容器中的纯化的或分离的β-葡萄糖基转移酶;和/或提供关于使用β-葡萄糖基转移酶的说明书;将β-葡萄糖基转移酶与UDP-葡萄糖分子和核酸底物在促进核酸被葡萄糖分子(其可以是修饰的或未修饰的)糖基化的条件下温育,并产生在一个或多个5-羟甲基胞嘧啶上糖基化了的核酸。 
本发明的方法和组合物可以涉及纯化的核酸、修饰的UDP-Glu和/或酶,例如β-葡萄糖基转移酶。这些程序对本领域技术人员是已知的。在一些实施方式中,纯化可以使分子的纯度相对于任何污染成分是大约或至少大约70,75,80,85,90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.799.8,99.9%或更高,或其中的任何范围(w/w或w/v)。 
在其它方法中,可以有以下步骤,包括但不限于,获取关于核酸样品中的一个或多个5-羟甲基胞嘧啶的信息(定性和/或定量);定制测定、鉴定和/或定位核酸样品中的5-羟甲基胞嘧啶的测试法;报告关于核酸样品中的一个或多个5-羟甲基胞嘧啶的信息(定性和/或定量);将该信息与对照的或相当的样品中关于5-羟甲基胞嘧啶的信息进行对比。除非另有指明,否则在提及样品时的术语“测定”、“分析”、“测试”和“评价”是指转化该样品以收集关于该样品的定性和/或定量的数据。 
在一些实施方式中,核酸分子可以是DNA、RNA或二者的组合。核酸可以是重组的、基因组的或合成的。在其它实施方式中,所述方法涉及分离的和/或纯化的核酸。在一些实施方式中,所述核酸可以从细胞或生物样品中纯化。一些实施方式包括从真核细胞、哺乳动物或人类细胞中分离核酸。在一些实施方式中,核酸分子是真核的。在一些情况下,核酸是哺乳动物的,所述哺乳动物可以是人。这意味着核酸分子可以分离自人类细胞和/或具有将其鉴定为人的序列。在具体的实施方式中,考虑到核酸分子不是原核的核酸,例如细菌核酸分子。在其它实施方式中,分离的核酸分子位于阵列上。在具体的情况下,所述阵列是微阵列。在一些情况下,核酸分子通过本领域技术人员已知的任何技术分离,包括但不限于,使用凝胶、柱、基质或过滤器来分离核酸。在一些实施方式中,所述凝胶是聚丙烯酰胺或琼脂糖凝胶。 
本发明的方法和组合物还可以包括修饰的UDP-Glu。在一些实施方式中,所述修饰的UDP-Glu包含修饰部分(modification moity)。在一些实施方式中,包括一种以上的修饰部分。术语“修饰部分”是指添加到UDP-Glu分子上的化学化合物或元件。修饰的UDP-Glu是指具有下列的UDP-Glu分子:i)修饰部分,或ii)替换UDP-Glu中的分子的化学化合物或元件,从而得到的修饰的化合物具有不同于未修饰的UDP-Glu的化学式。特别考虑到修饰的 UDP-Glu不包括,仅仅将UDP-Glu中的分子或化合物替换为相同的分子或化合物(例如仅仅是具有放射活性的分子或化合物)而产生的具有放射性的UDP-Glu。在一些实施方式中,考虑到不使用修饰的UDP-Glu,而是使用一种或多种化学化合物,其为相同分子的有放射活性的版本。 
在一些实施方式中,修饰的UDP-Glu或修饰部分可以包含一个或多个可检测部分。所述可检测部分是指能够被检测的化学化合物或元件。在具体的实施方式中,修饰的UDP-Glu不是具有放射活性的UDP-Glu版本,在具体的实施方式中,修饰的UDP-Glu不含放射活性的碳。在一些实施方式中,所述可检测部分是荧光、放射活性、酶学的、电化学的或比色法的。在一些实施方式中,所述可检测部分是荧光团。在具体的实施方式中,FRET可以用于检测糖基化的核苷酸。 
在一些实施方式中,修饰部分可以是官能部分。在一些实施方式中,修饰部分包括叠氮接头(azide linker)或巯基接头(thiol linker)。在其它实施方式中,官能部分可以是分离标签,意思是标签可用于分离与该标签连接的分子。在一些实施方式中,分离标签是生物素或组氨酸标签。在一些情况下,标签是修饰的,例如以可检测的部分修饰。 
在其它实施方式中,修饰部分包含抑制或阻断酶的分子或化合物,使所述酶不能使用核酸分子中的糖基化的5-羟甲基胞嘧啶作为底物。在一些实施方式中,抑制足以完全阻止检测涉及糖基化的5-羟甲基胞嘧啶的酶促反应。考虑到阻断酶的分子或化合物可以通过对酶进行空间阻碍来进行。特别考虑到这样的空间阻断部分作为修饰部分。在具体的实施方式中,空间阻断部分包含1、2或3个环式结构,包括但不限于芳香环结构。在一些实施方式中,所述阻断部分是聚乙二醇。在其它实施方式中,在其它实施方式中,阻断部分是核酸、氨基酸、碳水化合物或脂肪酸(包括单、二或三脂肪酸)。 
除了β-葡萄糖基转移酶之外,本发明的方法和组合物还可以涉及一种或多种酶。在一些实施方式中,所述酶是限制性酶或聚合酶。在一些情况下,实施方式涉及限制性酶。所述限制性酶可以是甲基化不敏感的。在其它实施方式中,所述酶是聚合酶。在一些实施方式中,在核酸分子被修饰的UDP-Glu糖基化之前、与之同时或之后,核酸与限制性酶接触。可以在核酸暴露于限制性酶之前或之后使糖基化的核酸与聚合酶接触。 
本发明的方法和组合物涉及在修饰5-羟甲基胞嘧啶、但不修饰甲基胞嘧啶之后,区分5-羟甲基胞嘧啶和甲基胞嘧啶。所述方法可以包括,通过将糖基化的核酸与未糖基化的核酸或与糖基化状态已知的核酸进行比较来鉴定核酸中的5-羟甲基胞嘧啶。修饰的检测可以包括多种重组核酸技术。在一些实施方式中,将糖基化的核酸分子与聚合酶、至少一种引物和一种或多种核苷酸在允许糖基化的核酸聚合的条件下温育。在其它实施方式中,所述方法可以包括对糖基化的核酸分子进行测序。在其它实施方式中,糖基化的核酸用于引物延伸测定。 
本发明的核酸和组合物可以包括对照核酸。所述对照可以用于评价是否正在发生糖基化或其它酶促反应。或者,所述对照可用于比较糖基化状态。对照可以是阴性对照或阳性对照。对照可以不与糖基化反应中的一种或多种试剂一起温育。或者,对照核酸可以是参照核酸(reference nucleic acid),意思是其糖基化状态(基于5-羟甲基胞嘧啶上的糖基化的定性和/或定量信息,或者,其不存在)用于比较待评价的核酸。在一些实施方式中,来自不同来源的多个核酸提供对照核酸的基础。此外,在一些情况下,对照核酸来自正常的样品(就某特性而言,例如疾病或病况,或其它表型)。在一些实施方式中,对照样品来自不同的患者群、不同的细胞类型或器官类型、不同的疾病状态、不同的疾病状态的时期或严重性、不同的预后、不同的发育阶段等。 
在具体的实施方式中,提供了区分核酸分子中的5-羟甲基胞嘧啶和5-甲基胞嘧啶的方法,包括将核酸分子与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子一起温育,从而使核酸分子中的5-羟甲基胞嘧啶被修饰的葡萄糖分子糖基化。 
其它方法涉及对包含至少一个5-羟甲基胞嘧啶的核酸分子进行修饰,包括将所述核酸分子与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子一起温育,从而使核酸分子中的5-羟甲基胞嘧啶被修饰的葡萄糖分子糖基化。 
具体的实施方式涉及鉴定基因组DNA中的5-羟甲基胞嘧啶,其包括:a)分离基因组DNA;b)将所述基因组DNA剪切或切割成片段;c)将所述基因组DNA片段与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子在促进基因组DNA中的5-羟甲基胞嘧啶被修饰的UDP-Glu分子糖基化的条件下温育;和d)使用修饰的UDP-Glu分子鉴定基因组DNA中的5-羟甲基胞嘧啶。 
在其它实施方式中,提供了鉴定核酸分子中的5-羟甲基胞嘧啶的方法,其包括:a)将核酸分子与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子在促进核酸中的5-羟甲基胞嘧啶被修饰的UDP-Glu分子糖基化的条件下温育;b)将糖基化的核酸与甲基化敏感的限制性酶混合,其中所述修饰的UDP-Glu分子包括这样的分子或化合物,它们能够阻止核酸分子在某位点被切割,所述位点是:如果所述核酸分子未被修饰的UDP-Glu糖基化,则会在该位点被切割;和c)使用修饰的UDP-Glu分子鉴定核酸分子中的5-羟甲基胞嘧啶。 
其它实施方式可以包括定位核酸分子中的5-羟甲基胞嘧啶的方法,其包括将核酸分子与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子一起温育,从而使核酸分子中的5-羟甲基胞嘧啶被修饰的UDP-Glu分子糖基化;然后定位核酸分子中的5-羟甲基胞嘧啶。如上所述,可以通过多种方法进行核酸中的5-羟甲基胞嘧啶的定位,包括通过对糖基化的核酸进行测序并将结果与对照核酸进行比较,或者,使糖基化的核酸进行引物延伸测定并将结果与对照核酸进行比较。在一些实施方式中,通过使糖基化的核酸进行杂交测定并将结果与对照核酸进行比较来定位核酸中的5-羟甲基胞嘧啶。 
其它实施方式包括可用于实现本发明方法的试剂盒。在一些实施方式中,提供了包含纯化的β-葡萄糖基转移酶和一种或多种修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子的试剂盒。所述分子可以包括或涉及多种不同类型的修饰。在其它实施方式中,所述试剂盒可以包括一种或多种缓冲液,例如用于核酸的缓冲液或用于涉及核酸的反应的缓冲液。,试剂盒中可以包括除了β-葡萄糖基转移酶之外的其它酶,或替代β-葡萄糖基转移酶的酶。在一些实施方式中,所述酶是聚合酶。试剂盒还可以包括与聚合酶一起使用的核苷酸。在一些情况下,除了β-葡萄糖基转移酶之外,试剂盒中可以包括限制性酶,或替代β-葡萄糖基转移酶的限制性酶。 
本发明使用的“一个”当与术语“包含”一起用于权利要求和/或说明书中时,其表示单数的“一个”或者表示复数“一个或多个”、“至少一个”和“一个或多个”。 
本文描述的任何实施方式可以根据本发明的任意方法和组合物实施,反之亦然。此外,本发明的组合物和试剂盒可用于实现本发明的方法。 
在本申请中,术语“大约”表示数值包括用于测定该数值的设备或方法的标准偏差或误差。 
除非明确指明权利要求中的术语“或”仅仅是指替代物或替代物相互排斥,否则“或”的意思是“和/或”,虽然说明书中有仅仅提及替代物和“和/或”的定义。还考虑到通过术语“或”连接的任何物质也可以被特异性地排除。 
本说明书和权利要求书中使用的术语“包含”和“包括”以及“具有”、“含有”是包含式的开放式的,其不排除其它的、未提及的元件或方法步骤。 
以下具体描述了本发明的其它目标、特征和优点。但是应该理解,仅仅是通过举例方式描述具体实施方式和具体实施例,它们指明了本发明的具体的实施方式。本领域技术人员在阅读本说明书之后可以获知本发明精神和范围内的各种改变和修饰。 
附图说明
以下附图构成本说明书的一部分,其进一步说明了本发明的某些方面。可以根据以下具体实施方式的详细描述并通过参考一个或多个附图更好地理解本发明。 
图1A-1B.修饰和鉴定5-hmC的一般策略。图1A:使用β-葡萄糖基转移酶(βGT)修饰双链DNA中的5-hmC,β-葡萄糖基转移酶将UDP-葡萄糖(UDP-Glu)中的葡萄糖分子共价连接至羟甲基修饰的碱基以产生5-gmC。可以使用合成修饰的UDP-Glu向5-hmC引入官能标签基团(X)。图1B:核酸分子内的5-hmC的官能标签化(例如使用巯基或叠氮反应基)允许共价连接另外的官能团,例如生物素,其已用于多种分子生物学技术。 
图2.含有CC*GG的40mer DNA(其中C*=C、5-meC、5-hmC或5-gmC)的限制性酶切检测。双链DNA中的5-gmC修饰完全阻断了限制性酶MspI的活性。 
图3.叠氮基取代的UDP-Glu的合成图示。 
图4.检测基因组DNA中的5-hmC修饰的高通量方法。图4A:可以利用5-meC、5-hmC和5-gmC与亚硫酸氢盐反应的差异来区分5-hmC或5-gmC与5-meC。图4B:5-gmC上的光敏剂可以引起标记的(5-gmC)pG的光敏氧化,以及随后对该区域选择性的碱介导的链切割。 
图5.模型实验中含有5-hmC、5-N3-gmC和生物素-5-N3-gmC的11-mer DNA的质谱(MS)表征。A.含有5-hmC、5-N3-gmC和生物素-5-N3-gmC的11-mer DNA的MALDI-TOF图谱,显示了计算分子量和观测分子量。B.βGT催化的形成5-N3-gmC的反应,以及随后的无铜点击化学以产生双链DNA中的生物素-5-N3-gmC。在具有互补链的双链DNA中进行反应;但是,MS监测含有修饰的单链DNA。 
图6.生物素-5-N3-gmC的链霉亲和素加合阻碍引物的延伸。A.用于引物延伸的40-merDNA的序列,其包含胞嘧啶修饰(*C)。箭头代表用于引物延伸的反向PCR引物。B.用于测定包含不同胞嘧啶修饰的40-mer DNA的引物延伸测试,旁边显示了Sanger测序梯。*C位置上的常规胞嘧啶、5-mC、5-hmC或生物素-5-N3-gmC都不阻碍引物延伸。当使用6至48当量的链霉亲和素处理含有生物素-5-N3-gmC的DNA时,引物延伸被完全阻断。最显著的阻断位置是修饰碱基前的一个碱基,在修饰的位置(位置25,箭头)也观察到了显著阻碍。延伸实验使用REDTaq DNA聚合酶(Sigma),在72℃进行1分钟。 
具体实施方式
具体实施方式涉及修饰、检测和/或评价核酸中的5-hmC的方法和组合物。在一些方面,5-hmC被糖基化。在其它方面,5-hmC偶联至标记的或修饰的葡萄糖部分。使用本文描述的方法,可以将众多可检测基团(生物素、荧光标签、放射性基团等)通过葡萄糖修饰偶联至5-hmC。 
可以使用β-葡萄糖基转移酶(βGT)或类似的酶进行5-hmC的修饰,这些酶催化葡萄糖部分从二磷酸尿苷葡萄糖(UDP-Glu)转移至5-hmC的羟基,从而产生β-糖基-5-羟甲基-胞嘧啶(5-gmC)。本发明人发现,这种酶促糖基化提供了引入修饰的葡萄糖分子从而对真核核酸中的5-hmC进行标记或加标签的策略。例如,经化学修饰为包含叠氮基(-N3)的葡萄糖分子可以通过这种酶催化的糖基化反应共价连接至5-hmC。然后,可以通过与叠氮物的反应 向糖基化的5-hmC中特异性地引入磷化氢激活的试剂,包括但不限于,生物素-磷化氢、荧光团-磷化氢、NHS-磷化氢,或其它亲和标签。 
化学标签可用于通过高通量方式测定5-hmC的精确位置。本发明人已经表明,5-gmC修饰赋予了标记的DNA对限制性酶切和/或聚合化的抗性。在一些方面,可以使用限制性酶处理糖基化的和未修饰的基因组DNA,然后进行各种测序以揭示阻碍消化的各个胞嘧啶修饰的精确位置。 
本发明人表明,可以使用本文描述的方法向DNA中引入官能团(例如叠氮基)。官能团的引入允许使用生物素和其它标签进一步对胞嘧啶残基进行标记或标签化。5-hmC的标记或标签化可以使用例如点击化学(click chemistry)或本领域技术人员已知的其它官能团/偶联基团。可以分离包含5-bmC的标记的或标签化的DNA片段并使用目前使用的评价包含5-mC的核酸的方法来对其进行评价。 
此外,本发明的方法和组合物可用于向5-hmC引入空间上的大基团。DNA模板链上大基团的存在会干扰DNA聚合酶或RNA聚合酶合成核酸链,或者干扰限制性核酸内切酶对DNA的有效切割,或者抑制对含有5-hmC的核酸的其它酶促修饰。结果是,可以应用例如引物延伸或其它测定法来评价一定长度的部分延伸的引物,并且可以通过对部分延伸的引物进行测序来揭示修饰位点。还考虑到其它的利用这种化学标记方法的方案。 
在一些方面,可以评价两个或更多个样品之间不同的核酸修饰。以心、肝、肺、肾、肌肉、睾丸、脾和脑进行的研究表明,在正常条件下,5-hmC主要存在于正常脑细胞中。其它的研究表明,5-hmC也存在于小鼠胚胎干细胞中。已经鉴定出Ten-eleven translocation 1(TET1)蛋白是将5-mC转化为5-hmC的催化剂。研究表明,TET1的表达与5-mC的表达逆向相关。细胞中TET1的过表达似乎与5-hmC表达的增加相关。另外,已知TET1参与小儿和成人急性骨髓性白血病和急性淋巴细胞性白血病。因此,评价并比较5-hmC的水平可以用于评价各种疾病状态并比较各种核酸样品。 
有多种酶对5-hmC的糖基化是敏感的。这些酶包括但不限于,Klenow片段(3′→5′外切)、Pfu、Sequenase Version 2.0DNA聚合酶(usb)和Taq聚合酶。 
I.5-hmC的修饰 
一些实施方式涉及修饰包含5-hmC的真核核酸的方法和组合物。在一些方面,将目标核酸与β-葡萄糖基转移酶和包含修饰的或可修饰的葡萄糖部分的UDP底物接触。 
A.β-葡萄糖基转移酶(βGT) 
葡萄糖基-DNAβ-葡萄糖基转移酶(EC 2.4.1.28,β-葡萄糖基转移酶(βGT))是催化这样的化学反应的酶:将β-D-葡萄糖基残基从UDP-葡萄糖转移至核酸中的葡萄糖基羟甲基胞嘧啶残基。从这个方面而言,该酶类似于DNA β-葡萄糖基转移酶。该酶属于糖基转移酶、尤其是己糖基转移酶家族。该类酶的系统命名法名称是UDP-葡萄糖:D-葡萄糖基-DNAβ-D-葡萄糖基转移酶。其它通用名包括:T6-葡萄糖基-HMC-β-葡萄糖基转移酶、T6-β-葡萄糖基转移酶、二磷酸尿苷葡萄糖-葡萄糖基脱氧核糖核酸(uridine diphosphoglucose-glucosyldeoxyribonucleate)和β-葡萄糖基转移酶。 
在一些方面,所述β-葡萄糖基转移酶是His标签融合蛋白。例如,根据Protein Expr.Purif.2006,47,446-454的描述通过连接非依赖性克隆(LIC)方法将βGT克隆进入靶载体pMCSG19。将得到的质粒通过热击法转化进入包含pRK1037(Science Reagents,Inc.)的BL21star(DE3)感受态细胞。使用150μg/ml氨比西林和30μg/ml卡那霉素选择阳性菌落。使来自1∶100稀释的过夜培养物的1升细胞生长于37℃。当OD600达到0.6-0.8时,使用1mM的IPTG诱导细 胞。在16℃在摇床培养过夜后,通过离心收集细胞,悬浮于30mLNi-NTA缓冲液A(20mMTris-HCl pH 7.5,150mM NaCl,30mM咪唑,和10mM β-ME)与蛋白酶抑制剂PMSF中。装载上Ni-NTA柱,使用0-100%梯度的Ni-NTA缓冲液B(20mM Tris-HCl pH 7.5,150mM NaCl,400mM咪唑,和10mM β-ME)洗脱蛋白。通过MonoS(缓冲液A:10mM Tris-HCl pH 7.5;缓冲液B:10mM Tris-HCl pH 7.5,和1M NaCl)进一步纯化含βGT的级份以除掉DNA。最后,将收集的蛋白级份装载至Superdex 200(GE)凝胶-过滤柱(使用50mM Tris-HCl pH 7.5,20mMMgCl2,和10mM β-ME平衡)。SDS-PAGE凝胶显示了高纯度的βGT。将βGT浓缩至45μM并储存于-80℃,添加30%的甘油。 
B.修饰的葡萄糖分子 
官能化的或经标记的葡萄糖分子可以和βGT联合用于修饰核酸聚合物例如DNA或RNA中的5-hmC。 
在一些方面,βGT UDP底物包含官能化的或经标记的葡萄糖部分。在其它方面,可以使用点击化学或本领域已知的其它偶联化学法对所述葡萄糖部分进行修饰或官能化。点击化学是由K.Barry Sharpless于2001年开发的化学理论,描述了通过小单元的拼接来快速可靠地生成物质的化学法。 
标记物可以是任何被检测的或能够被检测的标记。适当的标记物的例子包括例如,发色标记物、放射性标记物、荧光标记物和生物素化的标记物。因此,标记物可以是例如,荧光葡萄糖、生物素标记的葡萄糖、放射性标记的葡萄糖等。在一些方面,标记物是发色标记物。术语“发色标记物”包括所有具有独特颜色或可检测标志物的试剂。除了具有内在的、可见光范围内易观察的颜色的化学结构之外,使用的其它标志物包括荧光基团、生物素标签、酶(可用于生成有色产物的反应)、磁性和同位素标志物等等。上述可检测标志物的列举仅仅是示例性的目的,绝非限制性的或穷举式的。 
可以使用本领域已知的方法将标记物连接至试剂。所述标记物包括连接至葡萄糖分子的任何可检测基团,或不干扰其功能的检测剂。另外的可用的标记物包括荧光标记物,例如荧光素、Texas Red、LuciferYellow、若丹明、Nile-red、四甲基-若丹明-5-异硫氰酸盐、1,6-二苯基-1,3,5-己三烯、顺式-十八碳四烯酸、藻红蛋白、别藻蓝蛋白(Allophycocyanin)、4′,6-二脒基-2-苯基吲哚(DAPI)、Hoechst 33258、2-氨基苯甲酰胺等。另外的标记物包括电子密集金属例如金,配体,半抗原例如生物素,放射性标记物。 
1.点击化学 
Huisgen 1,3-双偶极环加成反应,特别是Cu(I)-催化的逐步变体,通常被简称为“点击反应”。Cu(I)-催化的变体首先由来自丹麦Carlsberg Laboratory的Morten Meldal及其同事报道,用于在固体载体上合成peptidotriazole。Fokin和Sharpless独立地将其描述为可信赖的催化过程,其提供了“空前的选择性、可信赖性水平和那些依赖于在不同模块之间产生共价键的有机合成的范围”,其为满足点击标准的最可信赖的过程之一。 
点击化学理论中最常见的反应之一是在室温使用Cu催化剂进行的叠氮炔Huisgen环加成,其由K.Barry Sharpless和Morten Meldal的研究组同时独立地发现。这相对于RolfHuisgen在1970年代最初推广的相同反应(其在较高温度、无水、无铜催化剂的情况下进行)是一种改进。叠氮物和炔都是动力学上稳定的。铜和钌是反应中经常使用的催化剂。 
铜催化的点击反应基本上在末端炔上进行。铜经过金属插入反应进入末端炔。常用的溶剂是极性的质子惰性的溶剂,例如THF、DMSO、CH3CN、DMF,以及非极性的质子惰性的溶剂,例如甲苯。可以使用单独的溶剂或其混合物。 
点击化学具有广泛的应用。其中有:制备型有机合成1,4-取代的三唑;使用三唑修饰肽功能;修饰天然产品和药物;药物发现;使用Cu(1)催化的三唑偶联进行巨环化;通过三唑连接进行DNA和核苷酸的修饰;超分子化学;杯芳烃、轮烷、索烃;树状大分子(dendrimer)的设计;使用Cu(1)催化的三唑连接反应进行碳水化合物成簇和碳水化合物缀合;聚合物;材料科学;和纳米技术。 
2.携带巯基或叠氮基的修饰的二磷酸尿苷葡萄糖(UDP-Glu)的合成 
5-hmC糖基化的最初成功产生了以下假设:巯基或叠氮基修饰的葡萄糖可以类似地被转移至双链DNA中的5-hmC。因此,本发明人预期合成巯基-或叠氮基-取代的UDP-Glu以用于5-hmC的标记。叠氮标签是优选的,因为该官能团不存在于细胞内。用于标记该基团的点击化学是完全生物正交的(bio-orthogonal),意思是没有来自生物样品的干涉。图3中显示了叠氮基取代的UDP-Glu。叠氮基取代的葡萄糖可以被转移至5-hmC,如下所示。 
Figure DEST_PATH_GSB00000438027000011
方案1:6-N3-Glu-UDP(7)的合成 
3.基因组DNA中的5-hmC的生物素化,以用于亲和纯化 
可以分别使用商售的与生物素连接的马来酰亚胺或炔(点击化学)容易地对5-grmC上的官能团进行标记。巯基与马来酰亚胺的反应是高效的;但是,这个标记反应不适用于携带巯基的蛋白或小分子。因此,必须在标记前将基因组DNA从其它细胞成分中分离出来,这可以很容易地实现。使用商售的生物素连接的炔进行的叠氮标记是完全生物正交的,因此可以直接使用与蛋白结合的基因组DNA。在这两种情况下,均可以使用链霉亲和素将生物素标记的DNA片段拉出(pull down)并进行高通量测序以描绘染色体中5-hmC的总体分布和位置。这将揭示特定细胞或细胞系的不同发育阶段的基因组DNA中的5-hmC的分布图。 
4.使用光敏剂标记5-gmC 
另一个不依赖于将5-hmC:G碱基对转化成不同的碱基对的替代性策略是,使用图4所示的方法将光敏剂连接到5-gmC上。光敏的单电子氧化可以引起修饰的5-gmC或邻近的鸟嘌呤 的位点特异性氧化。随后的碱(哌啶)处理将引起氧化位点的特异性链切割(图4B)。因此,包含光敏剂标记的5-gmC的基因组DNA可以进行光氧化和碱处理。最后将在氧化位点产生DNA片段。高通量测序将揭示这些修饰位点。产生的DNA损伤需要进行局部控制,需要对该想法进行测试和验证以避免不想要的DNA损伤。 
5.将空间大基团连接至5-gmC 
在另一个策略中,可以向巯基或叠氮基修饰的5-gmC引入空间大基团,例如聚乙二醇(PEG)、树枝状大分子、蛋白例如链霉亲和素。虽然双链DNA中的5-gmC并不干扰通过各种不同的聚合酶催化的聚合反应,但是DNA模板链中的5-gmC上存在的另外的空间大基团可以干扰DNA聚合酶合成新链。结果是,引物延伸将产生一定长度的部分延伸的引物。可以通过对部分延伸的引物进行测序来揭示修饰位点。这种方法可以是通用的。其可用于确定给定的目标启动子位点的修饰位点。也可以开发高通量形式。含有多个5-hmC的DNA片段可以进行亲和纯化,随机的或设计的引物可用于在这些DNA片段上进行引物延伸实验。可以收集部分延伸的引物并使用如限制性酶切方法中描述的相似程序进行高通量测序。大的修饰可以在修饰位点之前数个碱基的地方终止聚合反应。同样,该方法也会将修饰位点定位到几个碱基的分辨率。考虑到多数5-hmC存在于CpG序列中,所以该分辨率对于多数应用是足够的。在5-gmC中存在大的取代的情况下,可以阻断除了MspI之外的限制性酶对修饰的DNA的消化,以进行基于限制性酶消化的测试。 
II.使用5-hmC修饰进行测定 
核酸分析和评价包括对经过或未经修饰的核酸进行扩增、片段化和/或杂交的各种方法。 
A.基因组分析 
目前有进行大规模序列分析的方法学。在一些方面,描述的方法应用这些基因组分析方法学并使其适用于包括本文描述的方法学的用途。在一些情况下,方法可用于对基因组DNA中数千个CpG进行高分辨率的甲基化分析。因此,方法涉及分析基因组DNA样品中的甲基化状态,其包括以下一个或多个步骤:(a)将样品片段化,并就包含CpG岛(CpG island)的序列对样品进行富集;(b)产生单链DNA文库;(c)将样品进行亚硫酸氢盐处理;(d)通过PCR(例如乳液PCR)扩增所述单链DNA文库中的各个成员;和(e)对扩增的单链DNA文库进行测序。 
本方法允许分析完整基因组的全部区域的甲基化状态,其中预期甲基化状态的改变将对基因表达产生一定影响。由于亚硫酸氢盐处理、扩增和高通量测序的组合,使得可以平行地分析至少1000个、优选5000个CpG岛的甲基化状态。 
本文使用的“CpG岛”是指,相对于目标生物的全部基因组而言,具有高含量的G/C和高频率的CpG二核苷酸。本领域中还有一个可替换地使用的术语即“CG岛”。“CpG岛”中的“p”是指胞嘧啶和鸟嘌呤核苷酸之间的磷酸二酯键。 
可以从目标生物中分离DNA,所述目标生物包括但不限于真核生物和原核生物,优选为哺乳动物,例如人类。 
在一些方面,可以以不同的方式进行“就包含CpG岛的序列对样品进行富集”的步骤。用于富集的一种技术是使用甲基-胞嘧啶特异性抗体对甲基化的DNA进行免疫沉淀。或者富集步骤可以包括使用一种或多种更常切割不含CpG岛的DNA区域且不常切割包含CpG岛的区域的限制性酶来消化样品,并分离具有特定大小范围的DNA片段。 
本发明人已经证明:虽然甲基化不敏感的限制性酶MspI可以完全切割C(5-meC)GG并部分切割C(5-hmC)GG,但是其活性被C(5-gmC)GG完全阻断。这表明引入的葡萄糖部分可以 改变双链DNA中的5-hmC的性质。当5-hmC上具有更大的基团时,可以阻断其它识别包含CpG的DNA序列的限制性酶的消化。由于5-gmC能够阻断限制性酶的消化,所以经过5-gmC修饰的基因组DNA可以经历或不经历限制性酶处理,并进行已知的对5-hmC修饰的基因组范围的分布和位置进行描绘的方法。 
本领域技术人员可以使用常规的生物信息学方法选择此类限制性酶。适当的酶的选择对于最终产生和测序的片段的平均大小也有实质性影响。可以按照如下方式设计合适的酶的选择,即,其促进一定长度的片段的富集。因此,可以根据最终使用的测序方法的种类来调整酶的选择。对于多数测序方法,100至1000bp的片段长度被证明是有效的。因此,在一个实施方式中,所述片段大小范围是100、200或300碱基对至400、500、600、700、800、900或1000碱基对(bp),包括其中的所有范围和数值。 
人类基因组参考序列(NCBI Build 36.1,2006年3月;仅组装部分染色体)的长度是3,142,044,949bp,其包含26,567个有注解的CpG岛,它们的总长度是21,073,737bp(0.67%)。在一些方面,如果DNA读取(DNA read)与CpG重叠至少50bp,则该读取命中CpG。 
作为非限制性例子,以下酶或它们的同裂酶(isoschizomers)(具有以下限制性位点)可用于根据本发明的方法:MseI(TTAA),Tsp509(AATT),AluI(AGCT),N1aIII(CATG),BfaI(CTAG),HpyCH4(TGCA),Dpul(GATC),MboII(GAAGA),M1yI(GAGTC),BCCI(CCATC)。同裂酶是对相同的识别序列具有特异性并在相同位置切割的限制性酶对。 
实施方式包括通过使用优选在非CG岛区域切割的几种限制性酶进行消化来从基因组DNA产生富含CG岛的文库。在一些方面,按照以下方式选择限制性酶:消化可以产生大小范围在300、400、500、600至500、600、800、900bp的片段,包括其中所有的范围和数值。将文库片段连接至接头。然后根据本领域熟知的方法进行常规的亚硫酸氢盐处理。结果为,未甲基化的胞嘧啶残基被转化为尿嘧啶残基,与未经亚硫酸氢盐处理的参照相比,其在后续的测序反应碱基调取(base calling)中被鉴定为“T”而非“C”。亚硫酸氢盐处理之后,将样品进行常规的测序。 
作为一个例子,454基因组测序系统(454Genome Sequencer System)支持对来自众多起始物质(包括但不限于,真核或细菌基因组DNA)的样品进行测序。使用限制性酶的合适的特定组合(其富集包含CpG岛的片段)将基因组DNA切割为小的100-至1000-bp的片段。在一个实施方式中,用于本发明方法的限制性酶选自MseI,Tsp509,Alul,N1aIII,BfaI,HpyCH4,Dpul,MboII,MlyI和BCCI,或任意上述酶的同裂酶。优选地,选择4至5种不同的酶。 
使用一系列标准的分子生物学技术,将短的接头(A和B)添加到每个片段。接头用于纯化、扩增和测序步骤。具有A和B接头的单链片段构成用于后续步骤的相同文库。 
在连接接头之前,可以将片段进行完全的双链化,没有任何单链悬突。使用例如大肠杆菌T4 DNA聚合酶进行片段抛光反应(polishing reaction)。在一个实施方式中,在存在甲基-dCTP而非dCTP的情况下进行抛光反应。在另一个实施方式中,在存在缺少纠错活性的DNA聚合酶(例如Tth DNA聚合酶,见Roche Applied Science Cat.No:11 480 014 001)的情况下进行片段抛光反应。 
将两个不同的双链接头A和B连接至片段的末端。接头A和B的一些或全部的C残基可以是甲基-C残基。随后,将包含至少一个B接头的片段固定在链霉亲和素包被的固体载体上,使用标准的置换酶例如Bst聚合酶(New England Biolabs)进行缺口修复填充合成。优选地,所述反应在甲基-dCTP替代dCTP的情况下进行。随后,按照Margulies et al.,Nature 437(2005)376-380中公开的方法将包含一个接头A和一个接头B的单链分子从链霉亲和素包被的珠子 上除掉。在甲基-dCTP替代dCTP的情况下,其浓度可以与最初的程序中使用的dCTP相同。 
可以根据本领域熟知的标准方法进行亚硫酸氢盐处理。可以通过例如Sephadex尺寸排阻柱或至少通过沉淀的方式对样品进行纯化。如下操作也是本领域技能范围之内:亚硫酸氢盐处理后、或亚硫酸氢盐处理并纯化之后,直接通过常规PCR(使用具有对应于A和B接头序列的序列的扩增引物)扩增样品。 
在一些方面,将亚硫酸氢盐处理的和任选经纯化的和/或扩增的单链DNA文库固定于特异性设计的DNA捕获珠子。每个珠子携带唯一的单链DNA文库片段。 
文库片段可以在其自身微反应器中扩增,所述微反应器包括油包水乳液,排除了竞争性或污染性序列。可以平行地进行整个片段集合的扩增;对于每个片段,这会产生如下拷贝数目:每个珠子上有唯一片段的数百万克隆扩增的拷贝。在乳液中进行PCR扩增之后,将乳液破碎,扩增的片段仍然保持与其特异性珠子结合。 
B.修饰敏感性的酶 
在众多原核和真核细胞中发现了DNA甲基转移酶(MTase),其将甲基从S-腺苷甲硫氨酸转移至腺嘌呤或胞嘧啶残基。当使用限制性核酸内切酶消化DNA时,应该考虑到甲基化,因为,当识别位点中的特定碱基被甲基化或另外修饰时,切割会被阻断或破坏。 
在原核细胞中,MTase通常被鉴定为限制/修饰系统的元件,所述系统保护宿主DNA免受相应的限制性内切酶的切割。多数大肠杆菌实验室菌株包含三个位点特异性DNA甲基化酶。当从表达Dam或Dcm甲基化酶的菌株中分离时,如果甲基化酶识别位点与核酸内切酶识别位点重叠,则限制性核酸内切酶的一些或全部位点可能对切割具有抗性。例如,从dam+大肠杆菌分离的质粒DNA对于MboI(其切割GATC位点)的切割具有完全抗性。 
不是所有的分离自大肠杆菌的DNA都有相同程度的甲基化。虽然pBR322 DNA是完全修饰的(因此对MboI消化具有完全抗性),但是仅有大约50%的λDNA Dam位点是甲基化的,可能是因为,在DNA被装配进入噬菌体头部之前,甲基化酶没有机会将其完全甲基化。结果是,被Dam或Dcm修饰阻断的酶将产生λDNA的部分消化模式。可以通过将DNA克隆进入大肠杆菌的dam-、dcm-菌株,例如dam-/dcm-Competent E.coli(NEB#C2925),使被Dam或Dcm甲基化阻断的限制性位点去甲基化。 
在高等真核细胞(例如Dnmt1)中发现的CpG甲基转移酶将甲基转移至胞嘧啶残基的C5位。CpG的甲基化模式是可遗传的、组织特异性的且与基因表达相关。后来假设CpG甲基化在分化和基因表达中具有一定作用。当消化真核的基因组DNA时,CpG甲基化的效应是一个主要问题。一旦DNA被克隆进入细菌宿主,则CpG的甲基化模式不再被保留。 
下表总结了NEB限制性酶的甲基化敏感性,指明了如果/当与每个识别位点重叠时,切割是否被Dam、Dcm或CpG甲基化阻断。关于更详细的信息和具体例子,可以查询限制性酶的数据库REBASE。 
Figure BSA00000379888800111
Figure BSA00000379888800121
Figure BSA00000379888800131
Figure BSA00000379888800141
Figure BSA00000379888800151
Figure BSA00000379888800161
Figure BSA00000379888800171
Figure BSA00000379888800181
Figure BSA00000379888800191
Figure BSA00000379888800201
C.微阵列分析 
微阵列方法可以与本文描述的方法联合用于同时测定人类基因组的多个遗传改变。本文描述的主题还可用于多个领域以极大地改善核酸分析、染色体绘图和遗传检测的精确性和可信赖性。阵列中可以包括选择的染色体靶元件并联合与核酸阵列的杂交来评价5-hmC的含量。在使用诊断阵列(下称“阵列”,例如用于比较型基因组杂交(CGH)的微阵列)的应用中,可以选择临床上相关的染色体基因座的广泛集合并评价5-hmC的状态或含量。使用放射性标记物、荧光标记物或可扩增信号特异性地标记基因组DNA片段中的5-hmC。然后使用微阵列通过杂交来筛选这些标记的靶DNA片段。 
D.基于FRET的杂交测定 
将荧光标签连接至5-hmC。与包含带有荧光标签(其作为前者的FRET伴侣)的核苷酸的探针杂交。如果探针中标记的碱基与标记的5-hmC毗邻,则将观察到FRET信号。 
E.电化学标记 
该方法涉及使用AC阻抗作为5-hmC存在的度量。简而言之,将待分析序列的特异性核酸探针固定于金电极上。加入待分析的DNA片段并允许其与探针杂交。使用核酸酶消化多余的未杂交的、单链的DNA。在杂交之前或之后使用本发明的方法将生物素共价连接至5-hmC。亲和素-HRP结合至生物素化的DNA序列,然后加入4-氯萘酚。如果HRP分子与金电极附近的杂交的靶DNA结合,则HRP将4-氯萘酚氧化为疏水性产物,其吸附至电极表面。如果靶DNA中存在5-hmC,这会产生相对于不含5-hmC的对照序列较高的AC阻抗。 
F.染色体染色 
使用本领域已知的标准核型分析技术制备染色体DNA。使用可检测部分(荧光团、放射 性标签、可扩增信号)标记染色体DNA中的5-hmC,并在完整染色体的环境下成像。 
III.试剂盒 
本发明还提供了用于修饰核酸的胞嘧啶碱基和/或对此类修饰的核酸进行进一步分析的试剂盒。试剂盒的内容物可以包括一种或多种修饰试剂、用于检测或修饰葡萄糖或5-hmC的标记试剂、如果需要的话,还有底物,其包含或能够结合一个或多个修饰的5-gmC。所述底物可以是例如微球、抗体或其它结合剂。 
每个试剂盒优选包括一种或多种5-hmC修饰试剂,例如βGT及其官能化底物。优选以适合于本发明的储存的固体形式或液体缓冲液的形式提供一种或多种试剂,当实施使用这些试剂的方法时,将其加入反应介质中。提供了合适的包装。所述试剂盒任选提供用于该程序的其它成分。这些可选的成分包括缓冲剂、捕获剂、显色剂、标记物、反应表面、检测工具、对照样品、说明书和解释信息。 
所述试剂盒任选可以包括检测标记物或修饰的与葡萄糖结合的试剂,如果需要,还包括用于检测所述结合试剂的试剂。 
实施例
给出以下实施例以解释本发明的不同实施方式,其不是为了以任何方式限制本发明。本领域技术人员将容易地认识到本发明可以进行良好改装以实现目标并获得提及的结果和优点,以及本文暗含的那些目标、结果和优点。本实施例以及本文描述的方法代表优选的实施方式,是示例性的,不是本发明范围的限制。本领域技术人员将认识到包括在如权利要求书所定义的范围的本发明的实质内对其做出的改变和其它应用。 
βGT催化的双链DNA中5-hmC的糖基化
本发明人合成了5-hmC的亚磷酰胺(现可从Glen Research购买)并制备了在特异性位点引入5-hmC的双链DNA。βGT基因克隆自T4噬菌体基因组DNA,表达蛋白并纯化至高度均一性。本发明人发现,在37℃使用10%的纯化的βGT将包含5-hmC的双链DNA(15mer或40mer)温育3个小时,导致5-hmC完全转化为5-gmC,如质谱分析和将DNA消化为单一的核苷以进行HPLC分析所测得(图5)。引物延伸和PCR实验证明DNA中存在的5-gmC对于所测的4种不同聚合酶催化的聚合反应不造成任何干扰,在互补链中在5-gmC的相对位置引入了鸟嘌呤(图6)。该结果证明:以葡萄糖分子修饰5-hmC不足以在引物延伸和其它基于聚合酶的测定中确定该修饰的精确位置;优选使用官能修饰的葡萄糖分子向5-hmC加入更大的基团。 
基于限制性酶消化检测5-hmC的精确位置的方法
本发明人测试了使用在中部含有CC*GG序列(其中C*=C、5-meC、5-hmC或5-gmC)的40mer DNA进行的限制性酶消化测试。如所预期的那样,甲基化敏感的限制性酶HpaII不切割含有5-meC、5-hmC或5-gmC的序列。然而,如图2所示,虽然甲基化不敏感的限制性酶MspI能够完全切割C(5-meC)GG并部分切割C(5-hmC)GG,但其活性被C(5-gmC)GG完全阻断。这表明引入的葡萄糖部分可以改变双链DNA中5-hmC的特性。当5-hmC上具有更大的基团时,可以阻断其它识别包含CpG的DNA序列的限制性酶的消化。 
由于5-gmC能够阻断限制性酶的消化,所以经过5-gmC修饰的基因组DNA可以经历或不经历限制性酶处理。可以将两个样品进行下一代测序从而绘制出相应的限制性酶识别的特异性序列中5-hmC修饰的基因组范围的分布和位置。简而言之,将MspI-消化的基因组DNA连接至双链接头,所述接头在上链具有生物素化。通过部分核酸酶消化进一步剪切DNA,选择300-500bp范围的大小。然后将第二个接头连接至未被第一个接头填充的末端。然后通过 链霉亲和素包被的珠子将生物素化的片段拉出(pull down),变性将释放侧翼是两种类型接头的单链片段。通过PCR扩增这些片段以进行高通量测序。序列读取中的内部MspI位点指示对MspI消化的抗性,从而指示在那些位点存在5-hmC。可以引入大基团与修饰的葡萄糖以干扰其它限制性酶。 
带有巯基或叠氮基的修饰的二磷酸尿苷葡萄糖(UDP-Glu)的合成
5-hmC糖基化的最初成功产生了以下假设:巯基或叠氮基修饰的葡萄糖可以类似地被转移至双链DNA中的5-hmC。因此,本发明人预期合成巯基-和叠氮基-取代的UDP-Glu以用于5-hmC的标记。叠氮标签是优选的,因为该官能团不存在于细胞内。用于标记该基团的点击化学是完全生物正交的,意思是没有来自生物样品的干涉。图3中显示了叠氮基取代的UDP-Glu。叠氮基取代的葡萄糖可以被转移至5-hmC,如下所示。 
使用修饰的UDP-Glu(包括叠氮基取代的UDP-Glu)进行5-hmC的糖基化
已经解决了βGT与结合的UDP-Glu的结构,并且显示UDP-Glu的葡萄糖中的6-羟基暴露于蛋白表面,具有注水的通道,该通道直接位于其上,这暗示了可以对该6-羟基进行修饰以引入官能团。本发明人合成了叠氮基取代的UDP-Glu(图3,化合物8)。本发明人证明βGT能够催化6-叠氮基-葡萄糖转移至含有5-hmC的双链DNA。叠氮基取代的UDP-Glu的反应与UDP-Glu同样有效。这些结果证明,该位置的叠氮基取代仍可以被βGT容纳并识别。在与叠氮基相同的位置进行的其它取代也预期可以作为该反应的底物。 
基因组DNA中的5-hmC的生物素化,以用于亲和纯化和测序
可以分别使用商售的与生物素连接的马来酰亚胺或炔(点击化学)容易地对5-gmC上的官能团进行标记。巯基与马来酰亚胺的反应是高效的;但是,这个标记反应不适用于携带巯基的蛋白或小分子。因此,必须在标记前将DNA从其它细胞成分中分离出来,这可以很容易地实现。使用商售的生物素连接的炔进行的叠氮标记是完全的生物正交的,因此可以直接使用与蛋白结合的基因组DNA。在这两种情况下,均可以使用链霉亲和素将生物素标记的DNA片段拉出(pull down)并进行高通量测序以描绘染色体中5-hmC的总体分布和位置。这将揭示特定细胞或细胞系的不同发育阶段的基因组DNA中的5-hmC的分布图。 
改进的亚硫酸氢盐测序方法
DNA中的5-meC与亚硫酸氢盐的反应是缓慢的,最可能是由于5-甲基取代对于胞嘧啶环的给电子效应。亚硫酸氢盐实际上首先与5-hmC的羟基反应,而不是首先攻击胞嘧啶的6-位。已经表明在pH 4.5时该过程是迅速的。产生的5-亚甲基磺酸胞嘧啶缓慢地脱去氨基以产生5-亚甲基磺酸尿嘧啶(图4A)。但是,5-亚甲基磺酸取代使该基团相对于甲基取代的给电子效应更低。通过改变反应温度或pH,本发明人相信鉴定出亚硫酸氢盐与5-hmC反应而不与5-meC反应的条件是可行的。或者,在较高温度,5-meC和5-hmC都将与亚硫酸氢盐缓慢地反应。但是,5-gmC应该是活性极低的,因为葡萄糖上的羟基的磺化对于胞嘧啶环具有最小的电子效应。通过反应条件的系统性改变,可以开发改进的亚硫酸氢盐测序方法,其允许区分5-meC、5-hmC和5-gmC。 
使用光敏剂标记5-gmC以进行高通量测序
另一个不依赖于将5-hmC:G碱基对转化成不同的碱基对的替代性策略是,使用图4所示的方法将光敏剂连接到5-gmC上。光敏的单电子氧化可以引起修饰的5-gmC或邻近的鸟嘌呤的位点特异性氧化。随后的碱(哌啶)处理将引起氧化位点的特异性链切割(图4B)。因此,包含光敏剂标记的5-gmC的基因组DNA可以进行光氧化和碱处理。最后将在氧化位点产生DNA片段。高通量测序将揭示这些修饰位点。产生的DNA损伤需要进行局部控制,需要对 该想法进行测试和验证以避免不想要的DNA损伤。 
将空间大基团连接至5-gmC
在另一个策略中,可以向巯基或叠氮基修饰的5-gmC引入空间大基团,例如聚乙二醇(PEG)、树枝状大分子、蛋白例如链霉亲和素。虽然双链DNA中的5-gmC并不干扰通过各种不同的聚合酶催化的聚合反应,但是DNA模板链中的5-gmC上存在的另外的空间大基团可以干扰DNA聚合酶合成新链。结果是,引物延伸将产生一定长度的部分延伸的引物。可以通过对部分延伸的引物进行测序来揭示修饰位点。这种方法可以是通用的。其可用于确定给定的目标启动子位点的修饰位点。也可以开发高通量形式。含有多个5-hmC的DNA片段可以进行亲和纯化,随机的或设计的引物可用于在这些DNA片段上进行引物延伸实验。可以收集部分延伸的引物并使用如限制性酶切方法中描述的相似程序进行高通量测序。大的修饰可以在修饰位点之前数个碱基的地方终止聚合反应。同样,该方法也会将修饰位点定位到几个碱基的分辨率。考虑到多数5-hmC存在于CpG序列中,所以该分辨率对于多数应用是足够的。在5-gmC中存在大的取代的情况下,可以阻断除了MspI之外的限制性酶对修饰的DNA的消化,以进行基于限制性酶消化的测试。 
在胚胎干细胞和神经干细胞中的应用
为了测试该方法并证明其与真实生物情形的相关性,本发明人将其应用于几种哺乳动物细胞类型中的5-hmC的定位。这包括两种方式。第一,对小鼠胚胎干细胞(ESC)和纤维原细胞中的5-hmC进行定位。这将产生关于多能干细胞和末端分化的细胞之间的5-hmC模式对比与差异的一般性图谱。第二,对小鼠神经干细胞(NSC)以及通过这些NSC的分化衍生的神经元和星细胞中的5-hmC进行定位。这会阐明谱系分化过程如何影响5-hmC模式。 
选择这些细胞类型以对比全基因组表观遗传学研究的全部集合,包括使用亚硫酸氢盐测序法描绘甲基化组(methylome)(其不会区分5-mC和5-hmC)、转录子组和众多参与基因调节的组蛋白修饰,例如H3K4乙酰化和H3K4、H3K9和H3K27的甲基化。此外,最近还鉴定出一种新的表观遗传学状态,称为“阻塞(occlusion)”,其中通过顺式作用染色质机制通过“阻断它们对细胞中的反式作用转录激活子作出相应”的方式使受影响的基因沉默。 
就5-hmC进行富集的亲和纯化的基因组DNA片段可直接进行高通量测序以鉴定这些片段。 
在癌症筛选中的应用
在几乎每种已知的人类肿瘤类型中都很好地记录了癌细胞中5-meC的重分布,并且改变DNA甲基化状态的药物已经成为骨髓增生异常综合征患者的标准治疗,并且对于其它血液肿瘤患者具有前景。最近,在多个骨髓增生异常综合征中发现了TET2基因的突变,包括大约50%的慢性骨髓单核细胞性白血病(CMML)病例。TET2基因与TET1密切相关,其编码能够将5-meC转化成5-hmC的酶,这提出了以下问题:患有CMML的患者中5-hmC的含量或分布发生变化。确实,当使用慢病毒将白血病细胞中的TET2水平增加3倍时,薄层色谱显示5-hmC的含量增加了1.5倍,并且具有纯合TET2突变的患者的骨髓显示出5-hmC水平降低20%。 
这些数据表明TET2水平的改变影响骨髓肿瘤中5-hmC的数量和/或位置。为了研究该假设,本发明人考虑到使用描述的方法来确定三例TET2突变的CMML与两例具有野生型TET2的CMML中5-hmC碱基的精确位置。使用冷冻的肿瘤库鉴定病例,所述肿瘤库包含几千例冷冻的人类白血病样品。鉴定CMML的病例,并完成TET2编码区的完全测序。选择三例TET2突变的CMML,优选是具有高疾病负担(超过85%的骨髓牵涉其中)并具有足够细胞数目的 样品。为了比较,分析两例具有野生型TET2的CMML。确定这些样品中的5-hmC将允许我们测定5-hmC的含量以及该修饰碱基的精确位置。尤其要注意的是,5-hmC碱基是否优选发生在启动子/CpG岛/CpG短区域、重复元件或接近着丝粒,以及5-hmC是否集中于特定染色体上。 
RNA样品中5-hmC的标记。TET1的同源物TET2作用于RNA。5-hmC存在于人类RNA中。TET2在各种白血病中是缺失的。 
对5-hmC的糖基化敏感的酶包括Klenow片段(3′→5′外切)、Pfu、和Sequenase Version 2.0DNA聚合酶(usb),以确定糖基化是否阻断聚合。Taq能够很好地发挥作用。 
叠氮修饰的UDP-葡萄糖可以按照以下反应方案来合成。 
Figure DEST_PATH_GSB00000438027000021
方案1:6-N3-Glu-UDP(7)的合成 
用于基因组DNA分析的方法可以分成两个一般性策略。首先将基因组DNA片段化,例如通过超声处理或限制性酶消化。片段化之后,基因组DNA中的5-hmC被可检测地修饰,例如引入叠氮-葡萄糖之后使用点击化学。在第一个策略中,使用亲和素柱拉出(pull down)生物素标记的DNA片段。就5-hmC富集这些亲和纯化的基因组DNA片段并将其直接进行高通量测序以进行序列鉴定。这会产生关于所分析的基因组DNA中5-hmC的全局分布图。这样的分析可以在不同发育阶段或在不同组织或细胞样品中进行。 
在第二个策略中,将生物素标记的基因组DNA片段连接至具有已知序列的接头,然后进行引物延伸反应以绘制5-hmC的精确位置。 

Claims (8)

1.用于区分核酸分子中的5-羟甲基胞嘧啶和5-甲基胞嘧啶的方法,所述方法包括将核酸分子与β-葡萄糖基转移酶和具有修饰部分的修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子一起温育,从而使核酸分子中的5-羟甲基胞嘧啶被修饰的葡萄糖分子糖基化。
2.用于修饰包含至少一个5-羟甲基胞嘧啶的核酸分子的方法,所述方法包括将核酸分子与β-葡萄糖基转移酶和具有修饰部分的修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子一起温育,从而使核酸分子中的5-羟甲基胞嘧啶被修饰的葡萄糖分子糖基化。
3.鉴定基因组DNA中的5-羟甲基胞嘧啶的方法,所述方法包括:
a)分离基因组DNA;
b)将所述基因组DNA剪切或切割成片段;
c)将所述基因组DNA片段与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子在促进基因组DNA中的5-羟甲基胞嘧啶被修饰的UDP-Glu分子糖基化的条件下温育;和
d)使用修饰的葡萄糖分子鉴定基因组DNA中的5-羟甲基胞嘧啶。
4.鉴定核酸分子中的5-羟甲基胞嘧啶的方法,所述方法包括:
a)将核酸分子与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子在促进核酸分子中的5-羟甲基胞嘧啶被修饰的葡萄糖分子糖基化的条件下温育;
b)将糖基化的核酸与甲基化敏感的限制性酶混合,其中所述修饰的UDP-Glu分子包括这样的分子或化合物,它们能够阻止核酸分子在某位点被切割,所述位点是:如果所述核酸分子未被修饰的葡萄糖分子糖基化,则会在该位点被切割;和
c)使用修饰的葡萄糖分子鉴定核酸分子中的5-羟甲基胞嘧啶。
5.定位核酸分子中的5-羟甲基胞嘧啶的方法,所述方法包括将核酸分子与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子一起温育,从而使核酸分子中的5-羟甲基胞嘧啶被修饰的葡萄糖分子糖基化;然后定位核酸分子中的5-羟甲基胞嘧啶。
6.比较第一核酸样品与至少一个第二核酸样品的方法,所述方法基于第一核酸样品中是否存在5-羟甲基胞嘧啶,所述方法包括:
a)将第一核酸样品与β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-Glu)分子一起温育,其中修饰的葡萄糖通过酶促方式地连接至第一核酸样品中的核酸分子的5-羟甲基胞嘧啶;
b)基于UDP-Glu的存在检测或测定5-羟甲基胞嘧啶,从而确定第一核酸样品中5-羟甲基胞嘧啶的状态;和
c)比较第一核酸样品的5-羟甲基胞嘧啶状态与至少一个第二核酸样品的5-羟甲基胞嘧啶状态。
7.比较第一核酸样品与至少一个第二核酸样品的方法,所述方法基于第一核酸样品中是否存在5-羟甲基胞嘧啶,所述方法包括:从生物样品获取第一核酸样品;获取鉴定第一核酸样品中是否存在5-羟甲基胞嘧啶的信息;和,将该信息与鉴定所述至少一个第二核酸样品中是否存在5-羟甲基胞嘧啶的信息进行比较,从而鉴定两个样品之间5-羟甲基胞嘧啶方面的任何差异。
8.试剂盒,其包含纯化的β-葡萄糖基转移酶和修饰的二磷酸尿苷葡萄糖(UDP-G1u)分子。
CN2010105812110A 2010-12-10 2010-12-10 修饰5-羟甲基胞嘧啶的组合物和方法 Pending CN102533941A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105812110A CN102533941A (zh) 2010-12-10 2010-12-10 修饰5-羟甲基胞嘧啶的组合物和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105812110A CN102533941A (zh) 2010-12-10 2010-12-10 修饰5-羟甲基胞嘧啶的组合物和方法

Publications (1)

Publication Number Publication Date
CN102533941A true CN102533941A (zh) 2012-07-04

Family

ID=46341969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105812110A Pending CN102533941A (zh) 2010-12-10 2010-12-10 修饰5-羟甲基胞嘧啶的组合物和方法

Country Status (1)

Country Link
CN (1) CN102533941A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102912024A (zh) * 2012-10-30 2013-02-06 武汉大学 一种检测dna中5-甲基胞嘧啶的化学方法
GB2523919A (en) * 2012-11-06 2015-09-09 New England Biolabs Inc Mapping cytosine modifications
CN112326637A (zh) * 2020-10-30 2021-02-05 山东师范大学 一种检测5-羟甲基胞嘧啶的化学发光生物传感器及其检测方法和应用
CN112646860A (zh) * 2020-01-15 2021-04-13 中国医学科学院北京协和医院 一种dna甲基化靶向富集的方法及其应用
CN115992203A (zh) * 2022-07-26 2023-04-21 生工生物工程(上海)股份有限公司 一种全基因组羟甲基化捕获测序的文库构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006123154A2 (en) * 2005-05-18 2006-11-23 Iseao Technologies Limited Improved methods and kits for detecting an enzyme capable of modifying a nucleic acid
CN101654712A (zh) * 2009-10-10 2010-02-24 上海交通大学 核酸单分子测序方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006123154A2 (en) * 2005-05-18 2006-11-23 Iseao Technologies Limited Improved methods and kits for detecting an enzyme capable of modifying a nucleic acid
CN101654712A (zh) * 2009-10-10 2010-02-24 上海交通大学 核酸单分子测序方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ALEKSANDRA SZWAGIERCZAK ET.AL.,: "Sensitive enzymatic quantification of 5-hydroxymethylcytosine in genomic DNA", 《NUCLEIC ACIDS RESEARCH》 *
ALICE VRIELINK ET.AL.,: "Crystal structure of the DNA modifying enzyme β-glucosyltransferase in the presence and absence of the substrate uridine diphosphoglucose", 《THE EMBO JOURNAL》 *
MALCOLM GEFTER ET.AL.,: "The Enzymatic Methylation of Ribonucleic Acid and Deoxyribonucleic Acid", 《THE JOURNAL OF BIOLOGICAL CHEMISTRY》 *
MAMTA TAHILIANI ET.AL.,: "Conversion of 5-methylcytosine to 5-hydroxymethylcytosine in mammalian DNA by the MLL fusion partner, TET1", 《SCIENCE》 *
RICHARD R. DRAKE ET.AL.,: "Synthesis and Properties of 5-Azido-UDP-Glucose", 《THE JOURNAL OF BIOLOGICACL CHEMISTRY》 *
SEUNG-GI JIN ET.AL.,: "Examination of the specificity of DNA methylation profiling techniques towards 5-methylcytosine and 5-hydroxymethylcytosine", 《NUCLEIC ACIDS RESEARCH》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102912024A (zh) * 2012-10-30 2013-02-06 武汉大学 一种检测dna中5-甲基胞嘧啶的化学方法
GB2523919A (en) * 2012-11-06 2015-09-09 New England Biolabs Inc Mapping cytosine modifications
GB2523919B (en) * 2012-11-06 2017-07-05 New England Biolabs Inc Mapping cytosine modifications
CN112646860A (zh) * 2020-01-15 2021-04-13 中国医学科学院北京协和医院 一种dna甲基化靶向富集的方法及其应用
CN112326637A (zh) * 2020-10-30 2021-02-05 山东师范大学 一种检测5-羟甲基胞嘧啶的化学发光生物传感器及其检测方法和应用
CN112326637B (zh) * 2020-10-30 2022-07-19 山东师范大学 一种检测5-羟甲基胞嘧啶的化学发光生物传感器及其检测方法和应用
CN115992203A (zh) * 2022-07-26 2023-04-21 生工生物工程(上海)股份有限公司 一种全基因组羟甲基化捕获测序的文库构建方法

Similar Documents

Publication Publication Date Title
CN103228798B (zh) 使用固定的引物直接捕获、扩增及测序靶标dna
AU2015294354B2 (en) Polynucleotide enrichment using CRISPR-Cas systems
Plongthongkum et al. Advances in the profiling of DNA modifications: cytosine methylation and beyond
CN102925561B (zh) 用于多态性的高通量鉴定和检测的策略
US20220042090A1 (en) PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
CN109804086B (zh) 制备双标签dna库用于亚硫酸盐转化定序的方法
US20110301045A1 (en) Composition and Methods Related to Modification of 5-Hydroxymethylcytosine (5-hmC)
CN101395280A (zh) 基于测序的高通量SNPs连接检测技术
CN102046811A (zh) 捕获核酸的方法和测定
JP2020501554A (ja) 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法
JP2022505050A (ja) プーリングを介した多数の試料の効率的な遺伝子型決定のための方法および試薬
CN102533941A (zh) 修饰5-羟甲基胞嘧啶的组合物和方法
CN114341638A (zh) 用于邻近连接的方法和组合物
JP2023508795A (ja) Dnaおよびrna修飾の濃縮および検出のための方法およびキット、ならびに機能モチーフ
EP3667672A1 (en) Method for detecting gene rearrangement by using next generation sequencing
Jiang et al. UdgX-mediated uracil sequencing at single-nucleotide resolution
Liang et al. Visualizing single-nucleotide variations in a nuclear genome using colocalization of dual-engineered CRISPR probes
US20200232010A1 (en) Methods, compositions, and systems for improving recovery of nucleic acid molecules
CN101235418B (zh) 基因变异检体的检测方法、专用设备及用具组
Kang et al. Application of multi-omics in single cells
US11905555B2 (en) Methods for the amplification of bisulfite-treated DNA
US20240093180A1 (en) Oligonucleotide adapters and method
Zhang et al. Mini-review of DNA Methylation Detection Techniques and Their Potential Applications in Disease Diagnosis, Prognosis, and Treatment
WO2024084439A2 (en) Nucleic acid analysis
Jurkowska Analyzing DNA methyltransferase enzymatic activity: Basic methods and applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120704