CN116463336A - 基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术 - Google Patents

基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术 Download PDF

Info

Publication number
CN116463336A
CN116463336A CN202210028996.1A CN202210028996A CN116463336A CN 116463336 A CN116463336 A CN 116463336A CN 202210028996 A CN202210028996 A CN 202210028996A CN 116463336 A CN116463336 A CN 116463336A
Authority
CN
China
Prior art keywords
udgx
single strand
nucleic acid
dna
double
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210028996.1A
Other languages
English (en)
Inventor
陈义汉
马红辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai East Hospital Tongji University Affiliated East Hospital
Original Assignee
Shanghai East Hospital Tongji University Affiliated East Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai East Hospital Tongji University Affiliated East Hospital filed Critical Shanghai East Hospital Tongji University Affiliated East Hospital
Priority to CN202210028996.1A priority Critical patent/CN116463336A/zh
Priority to PCT/CN2023/071070 priority patent/WO2023134584A1/zh
Publication of CN116463336A publication Critical patent/CN116463336A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术。具体地,本发明提供了一种基于UdgX交联和聚合酶停止的测序技术(“Ucaps‑seq”),从而实现单碱基分辨率水平的DNA中的dU的检测。本发明的Ucaps‑seq法是一个强大的工具,具有高灵敏性、高特异性和高分辨率等优点,并且具有广泛的潜在应用,尤其是疾病诊断以及评估基因编辑的准确性等方面。

Description

基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测 技术
技术领域
本发明涉及基因工程领域,具体地涉基于UdgX的在单碱基分辨率水平上的 DNA脱氧尿嘧啶的检测技术。
背景技术
脱氧尿嘧啶(dU)既能通过C碱基脱氨产生,又能顶替T碱基掺入到DNA中。它参 与多种生理和病理过程。探究dU在全基因组上的分布对于研究这些生理和病理过程 很重要。目前检测dU全基因组分布的方法都依赖于尿嘧啶-DNA-N-糖苷酶(UNG), 并且在分辨率、特异性和灵敏度方面未能满足要求。
尿嘧啶是一种嘧啶碱基,具有与胸腺嘧啶相似的化学结构,并与腺嘌呤形成碱 基配对。由于大多数DNA聚合酶无法区分胸腺嘧啶和尿嘧啶,它们有时会将dU而非 脱氧胸腺嘧啶(dT)掺入DNA中,尤其是在胸腺嘧啶的合成受到干扰时。另一方面, 尿嘧啶也可以通过胞嘧啶脱氨作用在AID/APOBEC家族蛋白催化下或通过自发水解 催化产生,导致C到T的转换。UNG可以有效地从脱氧核糖上切除尿嘧啶,生成一个 无嘧啶位点(AP位点),该位点可以通过碱基切除修复(BER)途径进一步修复。尽管在 正常情况下尿嘧啶在哺乳动物基因组中的频率非常低(每个核苷酸约10-7个),但它在 不同的生物过程中却发挥着关键作用。如果尿嘧啶不断掺入DNA,过度活跃的BER 可能会导致DNA断裂甚至细胞死亡。这种称为“无胸腺嘧啶细胞死亡”的概念已在 多种化疗药物中得到应用。此外,B细胞成熟过程中的两个基本过程,体细胞超突 变(SHM)和抗体类别转换重组(CSR),是由AID催化免疫球蛋白基因中的胞嘧啶脱氨 所启动的。另外,APOBEC的失调也会在基因组中积累C-to-T突变,这可能促进特 定癌症亚型的进展。同时,胞嘧啶脱氨作用介导的C-to-T转换已应用于基因组编辑 工具CBE(胞嘧啶碱基编辑器),该工具在治疗遗传疾病方面具有巨大潜力。因此, 对在全基因组上定位脱氧尿嘧啶的需求也在不断增长。
虽然目前已经开发了一些检测核酸序列上dU的方法,但是现有方法存在众多缺点,例如灵敏度低、特异性差、分辨率低、操作复杂等。
因此,本领域迫切需要开发一种高灵敏性、高特异性和高分辨率等优点的DNA 脱氧尿嘧啶的检测技术。
发明内容
本发明的目的就是提供一种高灵敏性、高特异性和高分辨率的DNA脱氧尿嘧啶 的检测技术。
在本发明的第一方面,提供了一种双链核酸复合物,所述的双链核酸复合物包括:
第一单链,所述第一单链为ssDNA,并且所述的ssDNA的原dU位置存在共价连 接的UdgX,其中,按第一单链的5'至3'方向,所述原dU位置为第W0位;和
第二单链,所述的第二单链是通过引物延伸反应形成的互补链,并且所述的第 二单链的3'端核苷酸对应于第一单链的第W0+1位的核苷酸。
在另一优选例中,所述的第二单链为ssDNA、ssRNA、或其组合。
在另一优选例中,所述的第一单链包括人工合成的、天然存在的、或分离的核 酸分子。
在另一优选例中,所述的第一单链是通过对双链DNA分子进行变性形成的 ssDNA。
在另一优选例中,所述的双链DNA分子是经片段化处理的核酸分子。
在另一优选例中,所述的经片段化处理的核酸分子是用于测序反应的核酸分 子。
在另一优选例中,所述的经片段化处理的核酸分子的长度为100-600bp,较佳地200-500bp。
在另一优选例中,所述的第一单链分离自细胞、组织、培养物、病毒、或其组 合。
在另一优选例中,所述的第一单链是来自经过基因编辑的核酸分子。
在另一优选例中,所述的基因编辑包括用碱基编辑器(Base Editor)进行碱基替换。
在另一优选例中,所述的基因编辑器包括用胞嘧啶碱基编辑器(CBE)进行碱基 替换(即C→U或C→T)。
在另一优选例中,所述的第二单链是用高保真聚合酶通过引物延伸反应形成 的。
在另一优选例中,所述的第二单链是用高保真聚合酶,以第一单链为模板,用 位于原dU位置下游(即3'端一侧)的引物,通过引物延伸反应形成的。
在另一优选例中,所述的第二单链的长度为20-1000bp,较佳地30-800bp,更佳 地50-500bp。
在另一优选例中,所述的UdgX包括选自下组的野生型或其突变型的UdgX:
耻垢分枝杆菌(M.smegmatis)的UdgX酶,登录号为WP 011726794.1;
鸟分枝杆菌(M.avium)的UdgX酶,登录号为ZP 05218036.1;
胞内分枝杆菌(M.intracellulare)的UdgX酶,登录号为ZP 05227544.1;
嗜血杆菌(M.haemophilum)的UdgX酶,登录号为ZP 21917190.1;
M.chubuense的UdgX酶,登录号为YP 006453151.1;
M.rhodesiae的UdgX酶,登录号为WP 014212855.1;
R.imtechensis的UdgX酶,登录号为ZP 10004147.1;
G.namibiense的UdgX酶,登录号为ZP 10960189.1;
S.coelicolor的UdgX酶,登录号为NP 628659.1;
M.lupini的UdgX酶,登录号为ZP 21028631.1;
N.farcinica的UdgX酶,登录号为YP 118940.1;或其组合。
在另一优选例中,所述的UdgX为来自耻垢分枝杆菌(Mycobacterium smegmatis)。
在另一优选例中,所述的UdgX具有SEQ ID No:1所示的氨基酸序列或第2-209 位:
MAGAQDFVPHTADLAELAAAAGECRGCGLYRDATQAVFGAGGRSARIMM IGEQPGDKEDLAGLPFVGPAGRLLDRALEAADIDRDALYVTNAVKHFKFTRAAG GKRRIHKTPSRTEVVACRPWLIAEMTSVEPDVVVLLGATAAKALLGNDFRVTQH RGEVLHVDDVPGDPALVATVHPSSLLRGPKEERESAFAGLVDDLRVAADVRP(S EQ IDNo:1)。
在另一优选例中,所述的UdgX具有SEQ ID No:2所示的氨基酸序列(即 AviTag-UdgX):
GLNDIFEAQKIEWHEAGAQDFVPHTADLAELAAAAGECRGCGLYRDATQA VFGAGGRSARIMMIGEQPGDKEDLAGLPFVGPAGRLLDRALEAADIDRDALYVT NAVKHFKFTRAAGGKRRIHKTPSRTEVVACRPWLIAEMTSVEPDVVVLLGATAA KALLGNDFRVTQHRGEVLHVDDVPGDPALVATVHPSSLLRGPKEERESAFAGLVDDLRVAADVRP(SEQ ID No:2)
在另一优选例中,所述的UdgX带有纯化标签、带有可检测标记物、偶联有用 于分离的分离元件、或可捕获元件(如biotin)。
在另一优选例中,所述的纯化标签选自下组:AviTag(即 GLNDIFEAQKIEWHE)、6His标签、Flag标签。
在另一优选例中,所述的UdgX偶联有生物素。
在另一优选例中,所述的UdgX偶联于磁珠、和/或吸附于磁珠。
在另一优选例中,所述双链核酸复合物中,所述的UdgX通过生物素-亲和素连 接于固相载体(如磁珠、微球)。
在另一优选例中,所述双链核酸复合物中,所述的UdgX与第一单链在原dU位 置上形成式I结构:
其中,
表示原dU位置上的脱氧核糖;
表示UdgX通过对应于第109位His与原dU位置上的脱氧核糖形成 共价键;
DNA-和-DNA表示分别位于原dU位置两侧的DNA单链。
在本发明的第二方面,提供了一种本发明第一方面所述的双链核酸复合物的制备方法,包括步骤:
(a)提供一待分析的单链DNA分子;
(b)将所述待分析的单链DNA分子与UdgX进行混合,从而形成第一单链,所述 第一单链为ssDNA,并且所述的ssDNA的原dU位置存在共价连接的UdgX,其中,按 第一单链的5'至3'方向,所述原dU位置为第W0位;
(c)对所述第一单链进行引物延伸,合成互补的第二单链,并形成“第一单链- 第二单链双链结构”,即所述的双链核酸复合物,
其中所述的第二单链的3'端核苷酸对应于第一单链的第W0+1位的核苷酸。
在另一优选例中,在步骤(b)中,所述UdgX的用量是等量的,即UdgX的用量与 所述待分析的单链DNA分子中预计的dU的数量是相同或基本相同的。
在另一优选例中,在步骤(b)中,所述UdgX的用量是过量的,即UdgX的用量与 所述待分析的单链DNA分子中预计的dU的数量之比>1,如为1.05-20,较佳地1.1-10, 更佳地2-5。
在另一优选例中,在步骤(a)之前,所述方法还包括:
(a0)对双链DNA分子其进行变性处理,从而形成待分析的单链DNA分子。
在另一优选例中,在步骤(a0)之前,所述方法还包括:对长链的DNA分子或基 因组DNA分子进行片段化处理,从而形成片段化的DNA分子。
在另一优选例中,所述的片段化的DNA分子的长度为100-600bp,较佳地 200-500bp。
在另一优选例中,所述的片段化处理包括超声处理。
在本发明的第三方面,提供了一种检测核酸序列的dU的方法,包括步骤:
(S1)提供本发明第一方面所述的双链核酸复合物;
其中,所述的双链核酸复合物包括:第一单链,所述第一单链为ssDNA,并且 所述的ssDNA的原dU位置存在共价连接的UdgX,其中,按第一单链的5'至3'方向, 所述原dU位置为第W0位;和
第二单链,所述的第二单链是通过引物延伸反应形成的互补链,并且所述的第 二单链的3'端核苷酸对应于第一单链的第W0+1位的核苷酸;
(S2)从所述的双链核酸复合物分离出所述的第二单链;
(S3)对第二单链进行测序,从而获得第二单链的序列;
(S4)基于所述第二单链的序列,将对应于所述第一单链的序列的第W0位确定 为dU。
在另一优选例中,如果第二单链的测序无结果,则提示所述核酸序列中不存在 dU序列。
在另一优选例中,在步骤(S2)中,用NaOH洗脱方式将第二单链与第一单链进行 分离。
在另一优选例中,在步骤(S3)中,包括以下子步骤:
(S3-1)对所述的第二单链,在其3'端添加扩增接头,从而形成“扩增接头-第二 单链”复合物;
(S3-2)对所述“扩增接头-第二单链”复合物进行扩增,从而形成待测序的经扩 增产物;
(S3-3)对待测序的经扩增产物进行测序,从而获得第二单链的序列。
在另一优选例中,所述的扩增接头具有式II结构:
式中,
Y2为与第二单链连接的扩增引物核酸序列(通常,长度为10-50nt,较佳地 20-40nt,更佳地30-35nt,例如33nt);
Y1为与Y2互补的核酸序列(通常,长度为10-50nt,较佳地20-40nt,更佳地 30-35nt,例如33nt);
NNNNN为4-10nt的简并序列;
“||”表示Y1和Y2之间互补碱基形成的氢键(即A-T和C-G之间的氢键)。
在另一优选例中,所述的Y1和Y2是完全互补的。
在另一优选例中,在步骤(S4)中,对应于所述第一单链的序列的第W0位,被定 义为位于Y2(或Y1)与所述第二单链的3'端核苷酸之间的位置。
在本发明的第四方面,提供了一种用于检测核酸序列的dU的试剂盒,包括以下 组分:
(a)第一检测试剂,所述的第一试剂为UdgX,并且,所述的UdgX带有纯化标 签、带有可检测标记物、偶联有用于分离的分离元件、或可捕获元件(如biotin);
(b)用于形成本发明第一方面所述的双链核酸复合物的引物;
(c)用于测序的试剂;
(d)扩增接头;
其中,所述试剂盒中,除了包括组分(a)之外,还包括组分(b)、(c)、(d)中至少 一种组分。
在另一优选例中,所述试剂盒中,除了包括组分(a)之外,还包括组分(b)、(c)、 和(d)。
在另一优选例中,所述的纯化标签选自下组:AviTag(即 GLNDIFEAQKIEWHE)、6XHis标签、Flag标签。
在另一优选例中,所述的UdgX偶联有生物素。
在另一优选例中,所述的UdgX偶联于磁珠、和/或吸附于磁珠。
在另一优选例中,所述双链核酸复合物中,所述的UdgX通过生物素-亲和素连 接于固相载体(如磁珠、微球)。
在本发明的第五方面,提供了一种检测核酸序列的dU的测序方法,包括步骤:
(t1)提供待测序的核酸样品;
(t2)对所述核酸样品进行片段化处理,形成片段化的核酸分子;
(t3)将所述片段化的核酸分子进行变性,形成ssDNA分子;
(t4)使所述ssDNA分子与UdgX混合,从而形成第一单链,所述第一单链为 ssDNA,并且所述的ssDNA的原dU位置存在共价连接的UdgX,其中,按第一单链的 5'至3'方向,所述原dU位置为第W0位;
(t5)以所述第一单链为模板,进行引物延伸,从而形成第二单链,所述的第二 单链是通过引物延伸反应形成的互补链,并且所述的第二单链的3'端核苷酸对应于 第一单链的第W0+1位的核苷酸;
(t6)分离所述的第二单链;
(t7)对第二单链在其3'端添加扩增接头,从而形成“扩增接头-第二单链”复合物;
(t8)对所述“扩增接头-第二单链”复合物进行扩增,从而形成待测序的经扩增 产物;
(t9)对待测序的经扩增产物进行测序,从而获得第二单链的序列;和
(t10)基于所述第二单链的序列,将对应于所述第一单链的序列的第W0位确定 为dU。
在本发明的第六方面,提供了一种评估基因编辑的准确性的方法,包括步骤:
(a)提供一经基因编辑的核酸样品,
(b)用本发明第三方面所述的方法或第五方面所述的方法,来检测所述核酸样品中核酸序列的dU;
(c)基于步骤(b)的检测结果,来评价基因编辑的准确性。
在另一优选例中,所述的评价基因编辑的准确性的方法为定量方法。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中 具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限 于篇幅,在此不再一一累述。
附图说明
图1显示了Ucaps-seq的策略,(a)UdgX对带有各种修饰的ssDNA的反应性。通过 碱热处理停止反应,碱热处理也可以裂解AP位点(第10和11道)。(b)UdgX对ssDNA 和dsDNA底物的活性。(c)UdgX-dU交联阻断引物延伸。M53、M54和M80是指示延 伸产物分别在尿嘧啶之前、尿嘧啶位点和绕过尿嘧啶的一个核苷酸处停止的标记。 Comp,DNA-UdgX复合物。Free,游离的DNA。(d)Ucaps-seq的工作流程。
图2显示了合成DNA上的Ucaps-seq。(a)通过合成DNA验证Ucaps-seq的示意图。(b)测序后与合成DNA的每条链对齐的读数分布。(c)聚合酶在含dU的链上停滞的位 置。
图3显示了培美曲塞处理细胞上的Ucaps-seq。(a)Ucaps-seq在未处理和PMX处理的UNG-/-HeLa细胞上预测尿嘧啶位点周围的核苷酸频率。显示了重复A。(b)序列标 识图显示了PMX处理细胞中预期尿嘧啶位点处dU/dT(左)或dA+dG+dC(右)周围的碱 基频率。“位置1”是测序读数的第一个核苷酸,“位置0”是预测的尿嘧啶位点。 (c)PMX处理细胞的Ucaps-seq(左)、input(中)和相对dU频率(右)的读数密度作为复制 时间的函数。显示了重复A。
图4显示了检测目标编辑位点,其中(a)为碱基编辑示意图。CBE是一种融合蛋 白,由胞嘧啶脱氨酶(APOBEC)、突变的Cas9切口酶(nCas9)和一种或多种尿嘧啶糖 基化酶抑制剂(UGI)单体组成。在nCas9和gRNA的引导下,APOBEC被带到特定位 点,在编辑窗口内将C转换为U,从而实现C:G到T:A的转换。(b,c)为由Sanger测序确 定的RNF2(b)和site3(c)基因座的编辑效率。编辑后的C用紫色阴影表示。(d)Ucaps-seq 在RNF2目标位点的测序截图。编辑的DNA用未编辑的DNA稀释以评估Ucaps-seq的 灵敏度。(e)在site3的目标位点上的Ucaps-seq的测序截图。(d,e)编辑的窗口用粉红色 阴影表示。
图5显示了HEK293T细胞中新型RNF2脱靶事件的鉴定。(a)Ucaps-seq识别的编 辑位点列表。彩色框表示每百万过滤读取的唯一dU读取数。(b)OT1的截图。与相应 gRNA(RNF2)不匹配的核苷酸以绿色字体显示。编辑后的胞嘧啶用红色方块标记。 (c)使用靶向扩增子测序来确认每个位点的C-to-T突变频率。
图6显示了生物素化UdgX的纯化。(a)生物素化UdgX的表达和Ni-NTA亲和纯 化。来自不同步骤的级分以及Ulp1蛋白酶通过SDS-PAGE分离并通过考马斯蓝染色。 (b)来自Superdex75凝胶过滤柱纯化的洗脱组分的两个主要峰,对应于>440kD(洗脱组 分1)和~29kD(洗脱组分2),通过SDS-PAGE进行分析。在以下实验中使用洗脱组分2。 (c)使用抗生物素抗体对纯化的生物素化UdgX进行蛋白质印迹分析。
图7显示了UdgX反应条件的优化。(a和b)UdgX反应时间(a)和蛋白质量(b)的滴定。UdgX在载体DNA存在下在冰上与FAM-SSU100底物一起孵育。(a)泳道1至5的 反应时间分别为0、0.5、1、2、3小时。(b)泳道1至4中UdgX的量分别为0、0.25、0.5、 1μg。Comp,复合物;Free,游离的DNA。(c)链霉亲和素珠纯化和引物延伸的效率。 在载体DNA存在下,FAM-SSU100底物与生物素-UdgX一起孵育。然后用蛋白酶K 消化1/4的反应产物作为输入(泳道1)。剩余的产物被纯化以去除过量的UdgX并被链 霉亲和素珠捕获。在连续洗涤步骤之后,1/3的珠子用蛋白酶K处理以洗脱 FAM-SSU100(第2道)。其余珠子与5'FAM标记的引物进行引物延伸反应。然后用蛋 白酶K消化一半珠子以释放FAM-SSU100和FAM标记的延伸产物(第3道),另一半用 NaOH孵育以释放FAM标记的延伸产物(第4道)。所有样品均通过8%变性PAGE分离 并通过荧光成像仪进行观察。使用ImageJ软件量化相对条带强度并显示在底部。Temp:模板(FAM-SSU100),Exten:延伸样本。对于泳道3,*表示上条带的强度, #表示下条带的强度。
图8显示了合成DNA的质量。(a)显示UF的组成的图表。(b)input库中UF上随机 区域大小的分布。
图9显示了培美曲塞处理细胞中尿嘧啶的全基因组图谱。(a)显示培美曲塞可以抑制dTTP合成并导致尿嘧啶错误掺入基因组的图表。(b)在HeLa细胞中显示UNG敲 除的Sanger序列。UNG-/-HeLa细胞的两个等位基因均显示移码突变。(c)蛋白质印 迹实验证实UNG在HeLa细胞中被敲除。GAPDH用作内参蛋白。(d)用培美曲塞处理 的WT和UNG-/-HeLa细胞的集落存活分析。UNG-/-细胞对培美曲塞更敏感, P<0.0001(e)基于UdgX的改良斑点印迹分析的示意图。使基因组DNA变性并与UdgX 反应。去除多余的UdgX后,将生物素-UdgX-DNA复合物加载到尼龙膜上。然后将 膜与抗生物素的抗体一起孵育,通过增强的化学发光检测。(f)未处理和PMX处理的 UNG-/-HeLa细胞的尿嘧啶水平。未处理样品中的尿嘧啶水平太低而无法检测,这与 之前的报告一致,即缺乏UNG不会导致尿嘧啶显着增加。(g)Ucaps-seq文库的质量 检查。2%的连接产物用指定的循环进行PCR扩增,并通过5%PAGE分离。值得注意 的是,PMX处理的样品比未处理的细胞需要更少的循环来获得可比较的PCR产物,这表明该样品在PCR扩增前的产量更高。(h)与主要图3a相同,只是呈现了副本B。(i) 与主要图3b相同,只是呈现了副本B。(j)序列标识图显示参考基因组上dT周围碱基 的普遍性。(k)与主图3c相同,只是呈现了副本B。(l)序列标识图显示不同复制域中 参考基因组上dT周围的碱基频率。
图10显示了CBE编辑站点的检测。(a)用户消化的连接介导的PCR测定 (ULM-PCR)的示意图。基因组DNA用USER消化并与接头连接,然后进行PCR扩 增。如果编辑窗口中有一个可以被USER剪切的dU,则会观察到截断的PCR片段, 否则会产生全长产物。RE,限制酶。(b)通过ULM-PCR证实在RNF2和site3位点存在 尿嘧啶。NdeI(用于RNF2或PspOMI(用于站点3)用于模拟dU的USER消化(泳道3)。将 未处理的和模拟消化的DNA等量混合以模拟50%的编辑(第2道)。(c)该图显示了在同 一编辑窗口中有两个dU时的两种可能情况。(d)用于在目标和脱靶位点识别dU的生 物信息学管道。(e)在分别用gRNA靶向位点3或RNF2基因座转染的样品中,通过靶 向扩增子测序证实的C到T突变频率。测试了图5a列表中的站点。编辑效率略低(与图 5c相比)是由于转染后缺乏荧光细胞分选。
具体实施方式
本发明人经过广泛而深入的研究,首次意外地开发了一种基于酶法的DNA脱氧 尿嘧啶(dU)单碱基分辨率的检测技术。优选地,本发明提供了UdgX介导的DNA脱氧 尿嘧啶(dU)单碱基分辨率的检测技术,该方法被称为基于UdgX交联和聚合酶停止的 测序技术(“Ucaps-seq”)。本发明方法不仅灵敏性好、特异性强,而且分辨率高, 可实现单碱基分辨率水平的DNA中的dU的检测。在此基础上完成了本发明。
具体地,本发明人首先在合成的DNA探针上证实了Ucaps-seq的特异性。然后在 两个不同来源的基因组上验证了本发明方法的有效性。Ucaps-seq不仅确定了在培美 曲塞处理的尿嘧啶整体水平升高的癌细胞中dT位点上dU的富集,而且还在激活的B 细胞中“WRC”序列上的dC位点检测到dU,并发现这些细胞DNA在特定区域有dU 的增加。此外,本发明人利用Ucaps-seq检测由胞嘧啶碱基编辑器(nCas9-APOBEC) 引入的dU,并在细胞内鉴定了一个新的发生频率低的脱靶位点,这充分证明了本发 明方法具有高灵敏性、高特异性和高分辨率等优点。
UdgX酶
在本发明的基于酶法的DNA脱氧尿嘧啶(dU)单碱基分辨率的检测技术中,一种 至关重要的酶是UdgX酶。
如本文所用,术语“UdgX酶”、“UdgX蛋白”、“UdgX多肽”可互换使用。
在本发明中,所述的UdgX酶可以是野生型或突变型。
在本发明中,代表性的UdgX包括(但并不限于)以下野生型或其突变型的UdgX:
耻垢分枝杆菌(M.smegmatis)的UdgX酶,登录号为WP 011726794.1;
鸟分枝杆菌(M.avium)的UdgX酶,登录号为ZP 05218036.1;
胞内分枝杆菌(M.intracellulare)的UdgX酶,登录号为ZP 05227544.1;
嗜血杆菌(M.haemophilum)的UdgX酶,登录号为ZP 21917190.1;
M.chubuense的UdgX酶,登录号为YP 006453151.1;
M.rhodesiae的UdgX酶,登录号为WP 014212855.1;
R.imtechensis的UdgX酶,登录号为ZP 10004147.1;
G.namibiense的UdgX酶,登录号为ZP 10960189.1;
S.coelicolor的UdgX酶,登录号为NP 628659.1;
M.lupini的UdgX酶,登录号为ZP 21028631.1;
N.farcinica的UdgX酶,登录号为YP 118940.1;或其组合。
特别优选的UdgX为来自耻垢分枝杆菌(Mycobacterium smegmatis)。
在另一优选例中,所述的UdgX具有SEQ ID No:1所示的氨基酸序列或第2-209 位:
MAGAQDFVPHTADLAELAAAAGECRGCGLYRDATQAVFGAGGRSARIMM IGEQPGDKEDLAGLPFVGPAGRLLDRALEAADIDRDALYVTNAVKHFKFTRAAG GKRRIHKTPSRTEVVACRPWLIAEMTSVEPDVVVLLGATAAKALLGNDFRVTQH RGEVLHVDDVPGDPALVATVHPSSLLRGPKEERESAFAGLVDDLRVAADVRP(S EQ IDNo:1)。
相应的DNA编码序列为SEQ ID No:3:
atggcgggtgcgcaagatttcgtcccccacacggcggacctggccgaactcgctgccgcggcaggcgaatgccgag gctgcgggttgtatcgcgacgccacgcaggcggtcttcggcgcgggcgggcgctcggcacgcatcatgatgatcggcgagca gcccggtgacaaagaggacctggcgggcctgcccttcgtgggtcccgcgggccggctcctggaccgcgcgctggaagccgc ggacatcgaccgcgatgccctctacgtcaccaacgcggtcaagcacttcaagttcacgcgggcagcgggaggcaaacgacgc atccacaagacccccagtcgtaccgaggtggtggcgtgccgtccctggctcatcgccgagatgacctccgtggagcccgatgt cgtggtgctgctcggcgcaaccgccgccaaggcactgctgggcaacgactttcgcgtcacgcagcatcgcggcgaggtcctg cacgtcgacgacgtaccgggagatccggcgctggtcgccaccgttcacccgtcgtctctgctgcgcggacccaaggaggaac gcgaatccgcgttcgcgggcctggtcgacgatctgcgtgtcgcagcagatgtcaggcca(SEQ ID No:3)
在另一优选例中,所述的UdgX具有SEQ ID No:2所示的氨基酸序列(即 AviTag-UdgX融合蛋白):
GLNDIFEAQKIEWHEAGAQDFVPHTADLAELAAAAGECRGCGLYRDATQA VFGAGGRSARIMMIGEQPGDKEDLAGLPFVGPAGRLLDRALEAADIDRDALYVT NAVKHFKFTRAAGGKRRIHKTPSRTEVVACRPWLIAEMTSVEPDVVVLLGATAA KALLGNDFRVTQHRGEVLHVDDVPGDPALVATVHPSSLLRGPKEERESAFAGLVDDLRVAADVRP(SEQ ID No:2)
相应的DNA编码序列为SEQ ID No:4:
ggcctgaacgatatttttgaagcgcagaaaattgaatggcatgaagcgggtgcgcaagatttcgtcccccacacggcgg acctggccgaactcgctgccgcggcaggcgaatgccgaggctgcgggttgtatcgcgacgccacgcaggcggtcttcggcgc gggcgggcgctcggcacgcatcatgatgatcggcgagcagcccggtgacaaagaggacctggcgggcctgcccttcgtggg tcccgcgggccggctcctggaccgcgcgctggaagccgcggacatcgaccgcgatgccctctacgtcaccaacgcggtcaa gcacttcaagttcacgcgggcagcgggaggcaaacgacgcatccacaagacccccagtcgtaccgaggtggtggcgtgccgt ccctggctcatcgccgagatgacctccgtggagcccgatgtcgtggtgctgctcggcgcaaccgccgccaaggcactgctggg caacgactttcgcgtcacgcagcatcgcggcgaggtcctgcacgtcgacgacgtaccgggagatccggcgctggtcgccacc gttcacccgtcgtctctgctgcgcggacccaaggaggaacgcgaatccgcgttcgcgggcctggtcgacgatctgcgtgtcgc agcagatgtcaggcca
本发明还包括UdgX蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、 “衍生物”和“类似物”是指基本上保持本发明的天然UdgX蛋白相同的生物学功能 或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或 非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基 酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具 有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合 物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列 而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与 抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属 于本领域熟练技术人员公知的范围。
在本发明中,术语“UdgX多肽”指具有UdgX蛋白活性的SEQ ID NO:1序列的多 肽。该术语还包括具有与UdgX蛋白相同功能(即可特异性地将ssDNA的dU切除,形成 一个缺口)的、SEQ ID NO:1序列的变异形式。这些变异形式包括(但并不限于):一 个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的 缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内, 较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或 相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N 末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括UdgX蛋白 的活性片段和活性衍生物。
该多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、 诱导突变体、在高或低的严紧度条件下能与UdgX蛋白DNA杂交的DNA所编码的蛋白、 以及利用抗UdgX多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包 含UdgX多肽或其片段的融合蛋白(如SEQ ID NO:2所示的融合蛋白)。除了几乎全长 的多肽外,本发明还包括了UdgX多肽的可溶性活性片段。通常,该片段具有UdgX多 肽序列的至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100 个连续氨基酸。
发明还提供UdgX蛋白或多肽的类似物。这些类似物与天然UdgX多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。 这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通 过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物 学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物, 以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发 明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步 骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的 酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基 酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高 了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,“UdgX蛋白保守性变异多肽”指与SEQ ID NO:1的氨基酸序列相 比,有至多10个,较佳地至多8个,更佳地至多5个,最佳地至多3个氨基酸被性质相 似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表A进行氨基酸 替换而产生。
表A
/>
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或 人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码 成熟多肽的编码区序列可以与SEQ ID NO:1所示的编码区序列相同或者是简并的变异 体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:1的蛋白质, 但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。
编码SEQ ID NO:1的成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列; 成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码 序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还 包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位 变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和 插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是 一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所 述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子 强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有 变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条 序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多 核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长 度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至 少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码 UdgX蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的UdgX蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或 人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤 其是开放阅读框序列来设计引物,通过扩增而得有关序列。当序列较长时,常常需 要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是 将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到 有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常, 通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍 生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如 载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。用于PCR的引物可根据本文所公开的本发明的序列信 息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩 增的DNA/RNA片段。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或UdgX蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚 核苷酸序列可用来表达或生产重组的UdgX多肽。一般来说有以下步骤:
(1).用本发明的编码UdgX多肽的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,所述的UdgX蛋白或其活性片段或其融合蛋白可带有纯化标签、带 有可检测标记物、偶联有用于分离的分离元件、或可捕获元件(如biotin)。
在另一优选例中,所述的纯化标签选自下组:AviTag(即 GLNDIFEAQKIEWHE)、6His标签、Flag标签。
在另一优选例中,所述的UdgX偶联有生物素。
在另一优选例中,所述的UdgX偶联于磁珠、和/或吸附于磁珠。
在另一优选例中,所述双链核酸复合物中,所述的UdgX通过生物素-亲和素连 接于固相载体(如磁珠、微球)。
在本发明中,UdgX能够将ssDNA的dU切除,形成一个缺口。在所述缺口处(第一 单链中原有的dU位置),所述的UdgX与第一单链在原dU位置上形成式I结构:
Ucaps-seq法
如本文所用,术语“本发明测序方法”、“本发明的dU测序方法”“本发明的 DNA脱氧尿嘧啶(dU)检测方法”、“本发明的Ucaps-seq法”、“Ucaps-seq法”、“本 发明的DNA中dU检测方法”、“UdgX介导的DNA脱氧尿嘧啶单碱基分辨率的检测方 法”等可互换使用,指基于UdgX酶的DNA脱氧尿嘧啶(dU)的检测方法。
为了便于理解,本发明人提供以下Ucaps-seq方法原理供参考。应理解,本发 明的保护范围并不受该机理的限制。
在本发明的dU测序方法中,首先找到巧妙地利用一个合适“钩子”(优选耻垢 分枝杆菌来源的名为UdgX的新型糖苷酶)。UdgX能够将DNA上的dU切除,形成一个缺 口,并同时与对应的核糖形成共价键,最终将其捕获,形成复合物(即在所述的ssDNA 的原dU位置形成共价连接的UdgX)。
作为“钩子”的UdgX“钓”到含dU的DNA片段后,本发明人意外地发现,当采 用核酸聚合酶(如DNA聚合酶,优选DNA高保真聚合酶)进行引物延伸时,这个核酸聚 合酶就如同行驶在DNA轨道上的列车,当碰到被UdgX标记的dU的缺口时,会被动地原 地“停车”,从而形成所述的第二单链。
然后,结合高通量测序技术,将“停车”信号放大,最终在单个碱基的水平上 精确地定位dU在DNA乃至基因组上的位置。
本发明的主要包括:
(a)本发明的DNA脱氧尿嘧啶(dU)检测方法具有高分辨率,第一次用酶法在单碱基分辨率水平上精准检测DNA中的dU,实现了DNA中dU碱基检测技术的根本性突破。
(b)本发明方法具有高灵敏度。
(c)本发明方法具有高特异性,不受5FU等dU类似物的干扰。
(d)本发明方法(包括Ucaps-seq法)是一个强大的工具,具有许多潜在的应用, 尤其是在评估基因编辑的准确性方面。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本 发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常 按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。 除非另外说明,否则百分比和份数是重量百分比和重量份数。
通用方法和材料
序列如表1所示:
表1
/>
1.UdgX表达质粒的构建
合成耻垢分枝杆菌UdgX的开放阅读框(ORF)并用引物UdgX-Fw和UdgX-Rev进 行PCR扩增。正向引物含有可被BirA.1-2生物素标记的Avi-tag (GLNDIFEAQKIEWHE)的编码序列,然后将PCR产物用BamHI(NEB)和XhoI(NEB) 消化,并连接到pCDFDuet-1载体(科磊生物科技有限公司)用相同的酶消化,产生 pCDFDuet-Avi-UdgX构建体。然后以pEF1a-BirA-V5-neo质粒(科磊生物科技有限公 司)为模板,用引物BirA-Fw和BirA-Rev对编码BirA的基因进行PCR扩增。将bira基因 克隆到pCDFDuet-Avi-UdgX载体的第二个ORF中NdeI/XhoI位点之间,以生成 pCDFDuet-Avi-UdgX/BirA构建体。使用pPEI-His-SUMO质粒3作为模板,使用引物 SUMO-Fw和SUMO-Rev对编码His-SUMO标签的序列进行PCR扩增。得到的片段用 NcoI和BamHI消化,并连接到pCDFDuet-Avi-UdgX/BirA质粒中Avi-UdgX序列5'端的 NcoI/BamHI位点,产生pCDFDuet-His-SUMO-Avi-UdgX/BirA构造。该质粒通过 Sanger测序得到证实。
2.蛋白质表达和纯化
将pCDFDuet-His-SUMO-Avi-UdgX/BirA质粒转化到大肠杆菌Rosetta(DE3) 中。细菌细胞在含有链霉素(50μg/mL)和0.01%FeCl3的2L 2xYT培养基中于37℃培养 至OD600~0.6,然后在16℃下用0.1mM IPTG和80微克生物素诱导14小时。将细胞 沉淀并重悬于40mL裂解缓冲液(20mM Tris-Cl pH 8.0、150mM NaCl、1mM DTT、 10%甘油、1mM PMSF)中。细胞通过高压细胞破碎机(Union-Biotech Shanghai Co. UH-24)在600bar下破碎,裂解物通过在4℃下以12,000g离心30分钟澄清。然后将所 得上清液与Ni-NTA亲和树脂(SmartLifesciences)在4℃下孵育1小时。然后用补充有 25mM咪唑的裂解缓冲液洗涤样品,并在Ulp1反应缓冲液(20mM Tris-Cl pH 7.5,150 mM NaCl)中用带有His标签的Ulp1蛋白酶(如前所述3)在4℃下消化过夜至从 His-SUMO标签中释放生物素标记的Avi-UdgX。收集的样品用2倍体积的缓冲液 A(20mM Tris-HCl pH 7.5)稀释至终浓度为50mM NaCl。将样品上样到带有 AKTA/FPLC系统(GE Healthcare)的Hitrap Q HP柱(GE Healthcare)上,并用缓冲液A/ 缓冲液B(缓冲液A加1.5M NaCl)的线性梯度从100/0洗脱到65/35。使用Ultracel-10K离心过滤器(Millipore)浓缩含有UdgX的级分,并使用AKTA/FPLC系统将其施加到Superdex 75 10/300GL凝胶过滤柱(GE Healthcare)上,并用Superdex缓冲液(20mM Tris-HCl)洗脱pH 8.0,500mM氯化钠)。在洗脱过程中看到两个主要峰,对应于分子 量>440kD和~29kD。通过12%SDS-PAGE分析两个峰(图6c)。使用Ultracel-10K离心 过滤器(Millipore)将洗脱组分2浓缩至1μg/μL,并补充有20%甘油以在-80℃下长期储 存。用于后续实验。
3.纯化的UdgX的蛋白质印迹分析
(1)如前所述4进行蛋白质印迹分析以确认生物素的存在。
将UdgX加载到12%SDS-PAGE凝胶上,并将蛋白质转移到硝酸纤维素膜上。将 膜与抗生物素单克隆抗体(Cell Signaling Technology)一起孵育,然后与辣根过氧化物 酶偶联的山羊抗兔IgG(Beyotime)一起孵育。该膜使用ECL检测试剂(Beyotime)显影, 并由GEAmersham Imager 600系统扫描。
(2)接头的准备。
Ad-inp、Ad1、Ad2和Ad-lm是通过相应的正向(XX-F)和反向(XX-R)寡核苷酸的 退火产生的。将等量的两种低聚物(各20nmol)混合在50微升杂交缓冲液(10mM Tris-HClpH7.5、100mM NaCl、0.1mM EDTA)中,煮沸2分钟,然后缓慢冷却至25℃.
(3)UdgX活性测定底物的制备。
根据说明,通过与UDG(NEB)孵育从SSU70产生具有AP位点的ssDNA。根据已 发表的实验步骤,含有5fU的ssDNA由5hmU70由KRuO4氧化而成。5dsU100和dsT100 分别通过用R100对SSU100和SST100进行退火而产生,如上所述。
(4)UdgX的活性测定。
在标准活性反应中,在UDGX缓冲液(50mM Tris-HCl pH 8.0、10mM EDTA、 10mMDTT、25μg/mL BSA)中将UdgX(0.5μg)与指定底物(1pmol)在37℃条件下一起 孵育30分钟。通过添加NaOH至最终浓度为0.1M并在98℃下加热5分钟来停止反应。 为了滴定UdgX反应时间和蛋白质量(图7a、7b),在鲑鱼精子DNA(500ng,Thermo Fisher)存在的情况下在冰上进行反应,以模拟文库制备过程中的大量基因组DNA。 为了避免载体DNA对结果分析的干扰,使用FAM标记的SSU100,并通过荧光成像 对凝胶进行可视化。对于UdgX-SSU100共价复合物的亲和纯化,反应后通过DNA FragSelect XP磁珠(Smart Lifesciences)纯化去除过量的UdgX。SSU100在通过蛋白酶K 消化(NEB)进行亲和纯化之前和之后从UdgX-SSU100复合体中释放出来。
(5)引物延伸测定
将纯化的UdgX-SSU100共价复合物与5μLDynabeads MyOne链霉亲和素 C1(Invitrogen)浆液在20μl 1×B&W缓冲液(5mM Tris-HCl pH 8.0、0.5mM EDTA、1M NaCl、0.1%Tween 0.1%)中孵育,0.1%CA630)在室温下放置1小时。然后用1×B&W 缓冲液洗涤珠子并重新悬浮在6l 0.1×TE(1×TE:10mM Tris-Cl pH 8.0,1mM EDTA) 中。接下来,将珠子与1.5微升PrimerU(10pmol)和7.5μl预激活的KAPA HiFi HotStart ReadyMix(Roche)一起在热循环仪中孵育,步骤如下:98℃ 20秒、58℃ 30秒、68 ℃ 1分钟。反应后,珠用1×B&W缓冲液洗涤,延伸产物用0.1M NaOH室温洗脱1分 钟。在8%变性PAGE上分析产物。
4.细胞培养和处理
UNG-/-和WT HeLa细胞(ATCC)、HEK293T细胞(ATCC)维持在补充有10%FBS(Gibco)和1%青霉素/链霉素(Gibco)的DMEM培养基(Gibco)中。AID-/-和UNG-/- CH12F3细胞6与RPMI1640(Corning)、10%FBS(Gibco)、50微升β-巯基乙醇(Sigma)、 1%青霉素/链霉素(Gibco)和2mM谷氨酰胺(Thermo Fisher)。细胞在37℃、5%CO2 气氛的加湿培养箱中培养。
为了用培美曲塞处理HeLa细胞,将细胞铺板并生长至50%至70%的密度。然后,加入培美曲塞(Selleck)至终浓度为20nM,细胞再生长48小时并收获。
CH12F3 AID-/-和UNG-/-细胞系刺激如前所述6。用抗CD40(Ebioscience;1微克 /微升)、TGF-β(Novoprotein;0.5ng/μL)和IL4(Novoprotein;5ng/μL)刺激细胞,并在 刺激后48小时收获DNA隔离。
UNG-/-HeLa细胞的生成。以下向导RNA用于生成UNG敲除HeLa细胞:GTAAAGCAACTGTACCTGGG。根据标准方案将gRNA序列克隆到PX459载体 (Addgene)中。7将得到的gRNA/Casg9表达质粒转染到HeLa细胞中。24小时后,用嘌 呤霉素(2ug/mL)筛选细胞48小时,稀释后接种到96孔培养皿中。挑取单菌落并通过 TA克隆检查。Sanger测序证实UNG-/-细胞系的两个盟友都具有移码突变。UNG的蛋 白质印迹证实UNG在UNG-/-细胞系中被敲除(图9c)。与野生型细胞相比,UNG-/-细 胞系对培美曲塞表现出明显更高的敏感性(图图9d)。
5.用于定量尿嘧啶的基于UdgX的斑点印迹分析
尿嘧啶的定量是基于UdgX和尿嘧啶可以化学计量地形成共价复合物的事实,并且UdgX可以通过斑点印迹分析由于其生物素标签进行定量。斑点印迹测量在两个独 立的重复中进行。来自未处理和20nM PMX处理的UNG-/-细胞以及SSU100(75ng)的 变性基因组DNA(200ng)与UdgX(0.5μg)在冰上孵育3小时。通过使用DNA FragSelect XP磁珠、苯酚提取、苯酚/氯仿提取和乙醇沉淀的顺序纯化,去除过量的 UdgX。UdgX-SSU100共价复合物被稀释为标准品。使用1×TE将所有样品调节至 400μl的最终体积,并使用Bio-Dot SF微滤装置(Bio-Rad)点样到预先润湿的带正电荷 的尼龙膜(Amersham Hybond-N+,GEHealthcare)上。在依次用1×TE和2×SSC洗涤后, 通过UV交联剂(UVP)用1500J/m2 UV-C(254nm)照射膜。以下步骤与蛋白质印迹方 法中描述的相同。
Ucaps-seq文库制备。按照制造商的指南,使用DNAzol提取基因组DNA。接下 来,通过Qsonica Q800对基因组DNA进行超声处理,生成平均长度约为600bp的片 段。用等体积的DNA FragSelect XP磁珠纯化后,剪切的DNA(最多5μg)被末端修复, 加dA尾并与Ad1在4℃下通过NEBNext UltraTM II DNA Library Prep Kit for Illumina(用于Illumina合成DNA和HeLa细胞)或NEBNext End Repair、dA-Tailing和 Quick Ligation Modules(用于基因编辑细胞)根据制造商的指南。选择不同的试剂盒是 因为前者最多可处理1μg DNA,而后者可处理5μg DNA,但操作较为复杂。连接的 产物用0.7×DNA FragSelect XP MagneticBeads纯化,并在22μl 0.1×TE中洗脱。然 后通过煮沸2分钟并立即放在冰水中1分钟使DNA变性。DNA与终体积为30μl 1×UDGX缓冲液的0.5μg UdgX在冰上孵育3小时。通过加入SDS至终浓度为1%并在 98℃下加热5分钟来终止反应。通过使用1.2×DNA FragSelect XP磁珠、苯酚提取、苯 酚/氯仿提取和乙醇沉淀的顺序纯化去除过量的UdgX。将反应产物与10μg鲑鱼精子 DNA(Thermo Fisher)混合,并用10μl Dynabeads MyOne链霉亲和素C1浆液在40μl结合缓冲液(10mM Tris-HCl pH 8.0、1mM EDTA、500mM NaCl)中缓慢旋转,5mM MgCl2,0.1%Tween20,0.1%CA630,0.5%SDS)室温下1h。然后,用以下每种缓冲液 将珠子洗涤两次:1×B&W缓冲液、洗涤缓冲液II(100mM Tris-HCl pH 8.0、1mM EDTA、500mM LiCl、1%Tween20、1%Na-DOC)和洗涤缓冲液III(1mM Tris-HCl pH 8.0、0.1mM EDTA、100mM NaCl、2%SDS)、0.1×TE。将珠子重新悬浮在6μl 0.1× TE中,并与1.5μlO3p(10pmol)和7.5μl预激活的KAPA HiFi HotStart ReadyMix一起在 热循环仪中按照以下步骤孵育:98℃ 20秒,68℃ 2分钟。通过在37℃下孵育15分 钟,用Exo1(1.5μl,NEB)消化过量的O3p。然后用以下缓冲液中的每一种将珠洗涤两 次:1×B&W缓冲液、洗涤缓冲液II和洗涤缓冲液III。通过在室温下与25μl 0.1M NaOH孵育1分钟并用乙酸中和来洗脱延伸产物。为了去除未封闭的延伸产物,将样 品与70μl缓冲液SH(10mM Tris-HCl PH8.0、500mM NaCl、0.5mM EDTA)中的50pmol生物素化oligo SH混合,煮沸1分钟并自然冷却至室温温度。与oligo SH杂交的 DNA通过与25μl链霉亲和素珠6FF(Smart Lifesciences)浆液在100μl 1×B&W缓冲液 中室温孵育1小时而被捕获。收集上清液并通过乙醇沉淀浓缩。DNA溶解在6.5μl 0.1×TE中,98℃加热3分钟,然后转移到冰浴中。然后将其与总体积为15μl的 40pmolAd2和7.5μl 2×InstantStick Ends Ligase Master Mix(NEB)一起在4℃下孵育过 夜。对于文库质量检查,2%的连接产物进行PCR扩增,并通过5%天然聚丙烯酰胺凝 胶电泳进行分析。之后,所有剩余的连接产物通过NEBNext Ultra II Q5 Master Mix (NEB)用NEBNext Multiplex Oligosfor Illumina进行PCR扩增。PCR产物通过DNA FragSelect XP磁珠纯化,浓度通过QubitdsDNA HS试剂盒(Thermo Fisher)测定。 Mingma Technologies在NovaSeq6000平台上以2×150bp格式对文库进行测序。
Input库准备。使用NEBNext Ultra II DNA文库制备试剂盒(NEB)对片段化的基因组DNA(1ng)进行末端修复、添加dA尾并在37℃下与Ad-inp连接30分钟。0.9×DNAFragSelect XP Magnetic Beads纯化后,产物用12μl 0.1×TE洗脱,NEBNext Ultra II Q5Master Mix进行PCR扩增测序。
用于Ucaps-seq的合成DNA的制备。为了生成含有一个dU(UN)或用周围随机序 列替代dT(TN)的128bpdsDNA,UN59/TN59与UR99/TR99退火并通过Phanta UC超 保真DNA聚合酶(Vazyme)进行延伸。然后根据说明通过T4 PNK(NEB)磷酸化UN和 TN的5'末端。
合成DNA文库制备。使用NEBNext Ultra II DNA文库制备试剂盒(NEB)对2 pmolUN和2pmol TN的混合物进行末端修复和dA加尾。然后将混合物分成两份,分 别用于Ucaps-seq和Input测序。除了DNA FragSelect XP磁珠的体积为1.8倍且Input通 过Phanta UCSuper-Fidelity DNA聚合酶扩增外,以下步骤与上述相同。
在293T细胞中进行碱基编辑。如前所述构建pGL3-U6-gRNA-PGK-嘌呤霉素8。 为了同时转染RNF2和site3 gRNA,将HEK293T细胞接种在100mm培养皿中,并通过HighGene转染试剂(ABclonal)以80%密度转染12μg pCMV-AncBE4max-P2A-GFP (Addgene)(AncBE4max是BE4max的变体,具有略高的编辑效率和可比的脱靶活性9 和8μg pGL3-U6-RNF2-Site3-PGK-嘌呤霉素,遵循制造商的说明。转染后24小时, GFP阳性细胞通过FACS Aria II(BDBiosciences)分选并用于基因组DNA提取。为了 分别转染RNF2和Site3 gRNA,使用SF CellLine 4D-Nucleofector X Kit(Lonza)将总共 3μg pCMV-AncBE4max-P2A-GFP和1.5μgpGL3-U6-sgRNA质粒转染到2×106 HEK293T细胞中遵循制造商的步骤。转染后24小时,收集细胞用于基因组DNA提 取。
USER消化的连接介导PCR(ULM-PCR)检测。ULM-PCR检测根据已发布的方 案进行了修改。为了分析每个样品,基因组DNA(50ng)用1微升限制性内切酶消 化(HindIII-HF(NEB)用于RNF2基因座,BamHI-HF(NEB)用于site3 locus)和1微升 USER (NEB)在30μl 1×Cutsmart缓冲液中37℃ 3小时,并通过1.8×DNA FragSelect XP磁珠纯化。对于dU模拟样品,使用限制性内切酶(RNF2基因座的NdeI (NEB),site3基因座的PspOMI(NEB))代替USER。DNA与25pmol生物素化引物 RNF-1/primersite3-1和12.5微升一起孵育预激活(95℃ 3分钟)KAPA HiFi HotStart ReadyMix,总体积为25微升,步骤如下:98℃ 20秒,69℃3分钟。纯化的延伸产 物通过与5微升Dynabeads MyOne链霉亲和素C1浆液在20μl 1×B&W缓冲液中室温 孵育1小时而富集。珠子依次用1×B&W缓冲液洗涤一次,用洗涤缓冲液II洗涤两次,用洗涤缓冲液III洗涤两次,用1×B&W缓冲液洗涤一次,用0.1×TE洗涤一次。接下来, 将珠子重新悬浮在7微升0.1×TE中,并与1μlKlenowexo-(NEB)和1μl dATP(10mM, NEB)在总体积为10微升1×NEB缓冲液2中在37℃下孵育dA拖尾30分钟。用 1×B&W缓冲液和0.1×TE依次洗涤后,将珠子与20pmolAd-lm和5μl Blunt/TA Ligase Master Mix以10μl的总体积在室温下混合15分钟。反应后,珠用1×B&W缓冲液洗涤 并悬浮在6微升0.1×TE中。一微升重悬珠用于通过KAPA HiFi HotStart ReadyMix与引 物lm-pcr-R和引物RNF-2/primersite3-2进行PCR扩增30个循环。产物用8%天然聚丙烯 酰胺凝胶电泳分析。
靶向扩增子测序。为了验证Ucaps-seq检测到的脱靶位点,将引物设计到目标位点侧翼的区域,并添加8-nt条形码。对于第一轮PCR,25ng基因组DNA用NEBQ5U 热启动高保真DNA聚合酶扩增10个循环。1.8×DNA FragSelect XP磁珠纯化后,产物 经KAPA HiFiHotStart ReadyMix PCR扩增。
使用NEBNext Multiplex Oligos for Illumina进行20个循环。
6.数据分析
(1)Ucaps-seq预分析。
使用BWA(v0.7.17)和默认参数将配对末端读数与适当的参考基因组(智人的hg19和小家鼠的mm10)对齐。根据映射的基因组坐标对bam格式的对齐读数进行排 序,并使用Picard(v2.25.0)删除PCR重复项。除非另有说明,所有下游分析均在非重 复读数上进行。接下来,使用带有pysam包(v0.16.0.1)的内部Python脚本直接将bam 文件转换为bam文件。排除具有以下特征之一的序列读数:a)映射质量<60;b)映射 不是唯一的;c)双端读数不在基因组中正确配对;d)成对的第二读;e)Read 1的5'端 包括定制的接头序列。基于Read 1的映射链(+/-),预测的尿嘧啶(U)位点通过以下规 则计算:对于映射到正链的Read1,U位点位于read起始的1-nt上游;对于映射到负 链的读取1,U位点位于读取端下游的1-nt。使用上述规则生成具有单bp分辨率数据 的床文件并用于进一步分析。
(2)合成DNA的数据处理。
对于合成DNA测序数据,使用cutadapt(v2.10)参数 --discard-trimmed--pair-filter=any对于Ucaps-seq样本丢弃在5'端带有适配器序列的测 序读数。在UF和TF中使用了99nt-long的固定序列作为参考基因组。与该基因组对齐 后,重复项未被删除。然后根据上述排除标准过滤读数。因为在固定序列的5'端有 一个随机合成的序列,每个SAM记录必须在CIGAR字符串中有一个软剪辑(S)。从理 论上讲,对于映射到UF的那些读取(使用CIGAR:14S99M37S),确切的尿嘧啶位点应 位于软修剪Read1起始上游的15nt(即,软未修剪Read1起始上游的1nt)。然后,收集 了Ucaps-seq样本和输入样本的左软剪裁值大于10且对齐匹配(M)值等于99的读数, 收集的读数用于计算映射到UF、UR、分别为TF、TR。
(3)用于在HeLa细胞中进行分析
用Bam文件用于计算预测尿嘧啶位置周围的核苷酸百分比。然后将DNA中尿嘧 啶位点的胸腺嘧啶(T)核苷酸记录用于不同DNA复制时间(RT)区域的统计分析。从复 制域网站(https://www2.replicationdomain.com/;登陆号:Int93773609;Human Referencebuild:hg19;GEO登陆号:GSM923449)。通过平均1kb分辨率的原始分数 来平滑T/U信号,计算了沿人类基因组的10kb滑动窗口中的RT分数。四个RT类别(即 早期、早中期、中晚期和晚期)按RT分数的分位数进行分类。最后,计算了每百万 映射读取的读取(RPM)在所有HeLa样品的所有窗口中。为了分析相对dU频率,将 PMX处理样品的RPM标准化为输入和AT比。此外,使用R包ggseqlogo(v3.6.1)进行 DNA序列分析。
(4)用于在CH12F3细胞中进行分析
激活诱导的胞苷脱氨酶(AID)热点区域是从HTGTS方法的结果中获得的。包括 DNA中尿嘧啶位点胞嘧啶(C)核苷酸的记录以供进一步分析。计算了该区域中每个预 测U位点的参考基因组序列上下文。为了验证CSR激活的UNG-/-组和AID缺陷组之间 该区域胞嘧啶分布的差异,开发了一个统计模型,该模型假设位于基因组区域内 WRC基序序列中的读数数量如下泊松分布。简而言之,使用AID缺陷样本来构建模 型并计算lambda,然后在将UNG-/-样本测序深度缩放到与AID缺陷样本相同后,对 位于motif中的读数数量的差异进行统计测试。
(5)CBE编辑样本的分析
具有单bp分辨率的读数堆积在一些感兴趣的基因组区域中,如图4d、4e、5b所 示。为了用不同的gRNA识别CBE的潜在脱靶,过滤掉了不满足图10d中所示条件的 位点。除了ENOCDE数据库中显示的ChIP-seq数据的黑名单之外,本发明人还在实 验样本和控制样本,这些有争议的区域中存在的站点也被删除。考虑到大约20bp的 基因编辑窗口大小,以剩余位点为中心并将其横向扩展到30bp,然后计算这些扩展 区域中输入样本的读取次数和读取次数。R包DESeq2(v3.6.0)用于检验差异是否具有 统计学意义。最后,保留了调整后P值<0.05的区域,用于靶向扩增子测序。值得注 意的是,与Ucaps-seq的分析不同,靶向扩增子测序数据中的重复项使用条形码去除。 如果两个读数具有相同的基因组坐标和相同的配对条形码,则它们将被标记为重复 项,并将在后续步骤中被丢弃。
实施例1
UdgX融合蛋白的制备、表征和Ucaps-seq的建立
通过将UdgX与N端Avi标签融合并与在Avi标签上加生物素的BirA连接酶共表 达来纯化UdgX蛋白(图6)。为了确定UdgX对尿嘧啶的特异性,将UdgX蛋白与含有 dU、dT、AP位点或其他dT衍生物如5-羟甲基尿嘧啶(5hmU)和5fU的合成的单链DNA (ssDNA)一起孵育。反应后,凝胶位移结果显示UdgX仅与尿嘧啶定量反应(图1a)。 尽管存在关于UdgX与双链DNA(dsDNA)或ssDNA中的尿嘧啶的反应性的争论,结果 表明UdgX只能与ssDNA上的尿嘧啶有效反应,而不能与dsDNA上的尿嘧啶有效反应 (图1b),这对设计正确的测序工作流程很重要。为了检查聚合酶在DNA聚合反应中 是否以及在何处停止,对与UdgX交联的含有dU的ssDNA进行了引物延伸反应。如 图1c所示,聚合酶恰好在尿嘧啶位点之前的核苷酸处停止,表明可以通过与UdgX交 联和引物延伸可以准确检测尿嘧啶的确切位置。
根据以上结果,开发了“Ucaps-seq”用于基因组中的dU检测(图1d)。首先,基因 组DNA被超声、末端修复并连接到接头1。由于UdgX仅与ssDNA反应,连接的产物 被变性并随后与UdgX反应。进一步优化了反应条件,通过与UdgX(每1μg DNA与 0.5μg酶反应)在冰上孵育3小时,实现基因组DNA中尿嘧啶的最大标记效率(图7a, 7b)。去除多余的游离UdgX后,DNA-UdgX复合物被链霉亲和素磁珠捕获。然后将 引物与接头1的3'末端互补配对并用KAPAHiFi DNA聚合酶进行延伸。通过碱处理从 磁珠上释放延伸产物并连接到接头2,然后进行PCR扩增以生成测序文库。
实施例2
Ucaps-seq法的性能评估
采用合成的DNA来评估Ucaps-seq工作流程。为此,将等量的未修饰的和含dU的dsDNA混合并用于input和Ucaps-seq文库(图2a)。
测序结果表明,与input相比,含dU的链(UF)在Ucaps-seq中高度富集(98.74%,图2b)。更重要的是,聚合酶主要在已知尿嘧啶位点(~85.2%)之前停止(图2c)。总之, 这些结果表明Ucaps-seq是一种特异的和精确的尿嘧啶测序方法。
实施例3
应用Ucaps-seq来绘制哺乳动物基因组中的尿嘧啶
鉴于正常的细胞中dU的丰度非常低,决定用培美曲塞(PMX)处理细胞并使用未 处理的细胞作为对照。PMX是一种抗叶酸化疗药物,可抑制胸苷酸合酶,导致细胞 dUMP积累和尿嘧啶错误掺入到基因组中(图9a)。为了防止掺入的尿嘧啶修复,敲除 HeLa细胞中的UNG,并通过Sanger测序、蛋白质印迹以及PMX敏感性测定(图9b、 9c、9d)。通过改进的基于UdgX的斑点印迹方法证实PMX处理的UNG-/-HeLa细胞中 尿嘧啶含量升高(每1.7×104个核苷酸约1个)(图9e,9f)。Ucaps-seq文库的质量检查显 示,经PMX处理的样品产量更高(图9g),与该样品中较高的尿嘧啶含量一致。如图 1d所示,DNA聚合酶在dU位点之前停止,因此尿嘧啶应位于与读到的序列5'末端相 邻的核苷酸处,这应该是PMX处理细胞的参考基因组中的胸腺嘧啶。胸腺嘧啶确实 在PMX处理的细胞中的预期位置高度富集(图3a,9h)。相比之下,由于UNG-/-细胞中 的内源性dU非常低(据报道每3×106个核苷酸约1个)并且可以来源于错误掺入(在dT 位点)和脱氨基(在dC位点)作用,在未处理的细胞中只观察到轻微的胞嘧啶而不是胸 腺嘧啶的富集(图3a,9h)。然后分析了PMX处理细胞中检测到的修饰位点的附近的 碱基,并在dU(dT)的5'上游位点确定了偏向于掺入T和C(图3b,9i)。在其他非特异性 碱基(A、G和C)(图3b,9i)周围没有观察到这种模式,排除了在文库构建过程中引入 人工偏好的可能性。此外,dT的相邻碱基在参考基因组中是随机的(图9j),表明对dU 周围碱基的偏好是由于选择性掺入而不是周围固定序列的分布的差异。
由于在PMX处理后的是在DNA复制过程中掺入了尿嘧啶,分析了不同复制时间 区域中的尿嘧啶分布,发现早期复制区域(ERD)中的尿嘧啶含量最低(图3c,图9k)。 为了研究这是否是由于周围局部序列的差异,计算了不同复制区域中参考基因组中 dT周围碱基的分布频率。如图9l所示,相邻核苷酸的分布模式在不同复制区域之间 是相似的,而且排除了周围固有序列的影响。一种可能的解释是ERD与开放染色质 状态密切相关,并且更容易被UNG敲除细胞中的其他尿嘧啶糖苷酶(例如SMUG1)靠 近,因此修复得更快,尿嘧啶更少。
实施例4
用Ucaps-seq法测量源自胞嘧啶脱氨基的尿嘧啶
AID产生的尿嘧啶可以启动抗体类别转换,决定抗体的多样性。AID优先使5'Sμ 区域和下游受体S区域内的胞嘧啶脱氨基(W=A,T;R=A,G)基序,主要是位于AGCT基 序上。
结果表明,Ucaps-seq发现尿嘧啶主要位于WRC,尤其是CSR激活的UNG-/-B淋 巴细胞中最强的AID热点区域内的AGCT基序,而不是在AID缺陷细胞中(图9),这表 明Ucaps-seq法也可用于检测区域特异性dU。
讨论
最近,已经开发了几种基于UNG的尿嘧啶测序方法。他们通常利用UNG将尿嘧 啶转化为AP位点,然后通过化学标记或AP核酸内切酶切开以生成游离3'OH以进一 步捕获。或者,应用切除有缺陷的UNG衍生物来富集含尿嘧啶的DNA片段。这些 方法可能会因预先存在的DNA链断裂、AP位点或其他带有醛基的修饰核苷酸(包括 5-醛基脱氧尿嘧啶(5fU)和5-醛基胞嘧啶(5fC))而产生假阳性,尽管适当的预处理可能 会减少一些干扰。此外,在这些方法中,只有Excision-seq和AI-seq可以单碱基分辨 率检测dU。然而,Excision-seq需要在彼此靠近的两条链上都有尿嘧啶,以通过 UNG/Endo IV处理产生合适大小的双链DNA片段。因此,它仅限于含有较高频率的 尿嘧啶的基因组,例如:修复有缺陷的酿酒酵母和大肠杆菌(每103个核苷酸约3-8个 dU)。AI-seq将UNG生成的AP位点化学转化为叠氮胞嘧啶,并通过与原始序列进行 比较来确定这些修饰碱基的位置。因此,为了检测胞嘧啶脱氨产生的尿嘧啶,应在 原始序列中观察到一定比例的U:G错配,这需要特定位点的高比例(20%)dU和超过20 倍的测序深度覆盖原始样本。因此,这提示,直接标记dU而不形成反应性AP中间体和DNA链断裂的新方法将比这些基于UNG的方法更有优势。
最近从耻垢分枝杆菌(Mycobacterium smegmatis)中发现了UDG超家族的一个新成员,名为UdgX。它不仅能特异性地识别并从DNA中切除尿嘧啶,而且还能与脱 氧核糖形成不可逆的共价键,使其有别于其他UDG家族成员。即使在SDS、NaOH 和热等条件下,这种UdgX-DNA复合物也非常稳定,这使得UdgX能够检测尿嘧啶。
在这里,本发明人描述了一种称为“Ucaps-seq(UdgX交联和聚合酶阻挡测序)” 的方法,它结合了UdgX的独特特性和高保真DNA聚合酶被阻挡的策略,以在单碱 基分辨率下精确定位尿嘧啶。在验证了该方法对合成DNA的特异性后,Ucaps-seq成 功应用于检测源自错误掺入和胞嘧啶脱氨来源的dU。此外,它被用来追踪胞嘧啶碱 基编辑器的编辑事件,并在体内确定了一个新的脱靶位点,表明Ucaps-seq是评估碱 基编辑器保真度的新工具。
尿嘧啶是胞嘧啶碱基编辑器(CBE)介导的C到T转换中的关键中间体(图4a),因此,Ucaps-seq可用于通过捕获dU中间体来搜索脱靶位点。为了增加脱靶编辑的发生 率,将两个特征明确的gRNA,即“HEK_293_site3”(site3)和“RNF2”同时转染到具有 AncBE4max的HEK293T细胞中。目标基因位点的编辑效率通过Sanger测序得到证实 (图4b、4c),并且编辑窗口中dU的出现通过改进的连接介导的PCR测定得到证实(图 10a、10b)。正如预期的那样,Ucaps-seq的测序截图显示在目标位点有明显的峰(图 4d、4e),表明本发明的方法可以很容易地检测到目标位点。为了进一步评估Ucaps-seq 的灵敏性,来自编辑样本的基因组DNA用未编辑的DNA稀释并进行Ucaps-seq。如图 4d所示,Ucaps-seq可以可靠地检测稀释50倍的样品的目标位点,甚至能够检测稀释 100倍的样品中的尿嘧啶。这表明本发明的方法对dU检测具有高灵敏性,并且能够 检测编辑频率低至1%到2%的位点,表明可以检测编辑效率远低于目标位点的脱靶 位点。为此,本发明人开发了一个新的生物信息学算法(图10d,详见方法)并确定了 六个候选位点,每百万过滤后的读数具有大约0.2-3.8个特异的dU读数(图5a)。前五 个位点是RNF2和site3的靶向基因座,第六个位点(OT1)显示出与RNF2基因座的高度 序列相似性(图5b)。检测到OT1位点是出乎意料的,因为据报道RNF2在体内没有脱 靶。靶向扩增子测序证实OT1表现出大约2.6%的编辑率(图5c)。为了验证OT1是RNF2 真正的脱靶位点,在HEK293T细胞中,site3或RNF2 gRNA分别与AncBE4max共表达。 靶向扩增子测序证实OT1仅在用RNF2 gRNA处理的细胞中被编辑(图10e)。
在本发明中开发了Ucaps-seq,方法是使用一种名为“UdgX”的新型蛋白质以单 碱基分辨率绘制尿嘧啶全基因组图谱。Ucaps-seq与之前的基于UNG的dU测序方法 相比具有多项优势。与可以同时切除dU和5fU以产生AP位点的UNG不同,UdgX仅 与dU反应形成共价复合物,避免了AP位点和单链断裂等预先存在的DNA损伤的干 扰。此外,DNA聚合酶的阻断不仅确保了单碱基分辨率,而且还增加了其它的dU验 证步骤。如果没有UdgX-dU交联,聚合酶可以延伸到模板的5'端,生成一个全长产 物,包含第一个接头5'端的互补序列,可以在之后的步骤中挑选出来(图1d和方法)。 与之前基于UNG的单碱基分辨率dU测序方法(即excision-seq和AI-seq)相比, Ucaps-seq对所有dU表现出比excision-seq和AI-seq检测dC衍生的dU更高的灵敏性,从 而使得Ucaps-seq能够评估胞嘧啶碱基编辑脱靶。
Ucaps-seq的特异性和准确性首先在合成DNA探针上进行验证。此外,在PMX 处理的细胞中在预期位点的dT上的富集为评估Ucaps-seq的特异性提供了另一种证 据。在人类基因组中,T的比例约为30%,这意味着T:(A+G+C)的比例约为 30%/(1-30%)=0.43。由于非特异性的分布是随机的,T的非特异性比率可以从A+G+C 的比率计算。然后可以得到特定T(dU)在所有T中的比率。如图3a所示,PMX处理细 胞的T比率为75%,A+G+C的总和为25%,因此T的非特异性比率为 25%×0.43=10.75%。因此,特定的Ts(Us)应占预测位点所有Ts的约 (1-10.75/75)×100%≈86%,表明Ucaps-seq能够检测基因组中每1.7×104个核苷酸约1个 dU的发生频率的脱氧尿嘧啶核苷酸。
基因组编辑工具的脱靶长期以来一直是一个问题,并且已经开发了许多方法来检测它们,其中大多数捕获通过Cas9核酸酶诱导的DNA双链断裂(DSB)。但是,CBE 可以在不生成DSB的情况下编辑基因组。此外,其他方法虽然可通过dU测序评估 CBE的特异性,但仍然依赖于UNG,并且没有达到单碱基分辨率,并且灵敏度低, 例如在转染了BE4max和RNF2gRNA的HEK293T细胞中无法有效发现脱靶位点。当 使用具有相同gRNA的AncBE4max变体时,Ucaps-seq检测到脱靶位点(OT1),并通过 靶向扩增子测序进行验证。此外,本发明的结果表明,CBE和经典Cas9核酸酶具有 不同的脱靶效应,这意味着它可能是评估CBE保真度的新方法。
应该注意的是,Ucaps-seq很难同时检测到同一DNA上几个目标dU(例如,RNF2 基因座上的C3和site3基因座上的C5)。根据Ucaps-seq的程序,当编辑窗口中有两个 dU(但不是彼此相邻)时,聚合酶将被下游dU阻断(图10c,左)。这可能解释了RNF2 基因座上C3的Ucaps-seq信号减少的原因,尽管它被有效编辑。此外,虽然在site3位 点的C4和C5都被编辑了,但Ucaps-seq只识别了C4而不是下游的C5。一个可能的原 因是,当两个相邻的dU存在时,它们与UdgX的反应会相互干扰,尤其是3'dU的反 应会受到抑制(图10c,右)。然而,由于两个原因,检测脱靶事件的灵敏度不会受到 影响。首先,由于发生率较低,脱靶位点的dU对识别周围编辑位点的影响很小。此 外,即使在同一个编辑窗口中有多个编辑过的Cs,Ucaps-seq也可以识别至少一个dU, 然后进行靶向扩增子测序(参见方法)可以检测周围的编辑事件。
总之,利用UdgX蛋白和高保真DNA聚合酶的Ucaps-seq是探索尿嘧啶相关话题 (例如失调的APOBEC热点和CBE的特异性)的有价值的技术。此外,由于许多其他蛋 白质可以与特定的碱基修饰(例如HMCES和AP位点)共价交联,Ucaps-seq还提供了一 种新的方式来探究这些修饰。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域 技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利 要求书所限定的范围。
序列表
<110> 上海市东方医院(同济大学附属东方医院)
<120> 基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术
<130> P2022-0038
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 209
<212> PRT
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 1
Met Ala Gly Ala Gln Asp Phe Val Pro His Thr Ala Asp Leu Ala Glu
1 5 10 15
Leu Ala Ala Ala Ala Gly Glu Cys Arg Gly Cys Gly Leu Tyr Arg Asp
20 25 30
Ala Thr Gln Ala Val Phe Gly Ala Gly Gly Arg Ser Ala Arg Ile Met
35 40 45
Met Ile Gly Glu Gln Pro Gly Asp Lys Glu Asp Leu Ala Gly Leu Pro
50 55 60
Phe Val Gly Pro Ala Gly Arg Leu Leu Asp Arg Ala Leu Glu Ala Ala
65 70 75 80
Asp Ile Asp Arg Asp Ala Leu Tyr Val Thr Asn Ala Val Lys His Phe
85 90 95
Lys Phe Thr Arg Ala Ala Gly Gly Lys Arg Arg Ile His Lys Thr Pro
100 105 110
Ser Arg Thr Glu Val Val Ala Cys Arg Pro Trp Leu Ile Ala Glu Met
115 120 125
Thr Ser Val Glu Pro Asp Val Val Val Leu Leu Gly Ala Thr Ala Ala
130 135 140
Lys Ala Leu Leu Gly Asn Asp Phe Arg Val Thr Gln His Arg Gly Glu
145 150 155 160
Val Leu His Val Asp Asp Val Pro Gly Asp Pro Ala Leu Val Ala Thr
165 170 175
Val His Pro Ser Ser Leu Leu Arg Gly Pro Lys Glu Glu Arg Glu Ser
180 185 190
Ala Phe Ala Gly Leu Val Asp Asp Leu Arg Val Ala Ala Asp Val Arg
195 200 205
Pro
<210> 2
<211> 223
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu Ala
1 5 10 15
Gly Ala Gln Asp Phe Val Pro His Thr Ala Asp Leu Ala Glu Leu Ala
20 25 30
Ala Ala Ala Gly Glu Cys Arg Gly Cys Gly Leu Tyr Arg Asp Ala Thr
35 40 45
Gln Ala Val Phe Gly Ala Gly Gly Arg Ser Ala Arg Ile Met Met Ile
50 55 60
Gly Glu Gln Pro Gly Asp Lys Glu Asp Leu Ala Gly Leu Pro Phe Val
65 70 75 80
Gly Pro Ala Gly Arg Leu Leu Asp Arg Ala Leu Glu Ala Ala Asp Ile
85 90 95
Asp Arg Asp Ala Leu Tyr Val Thr Asn Ala Val Lys His Phe Lys Phe
100 105 110
Thr Arg Ala Ala Gly Gly Lys Arg Arg Ile His Lys Thr Pro Ser Arg
115 120 125
Thr Glu Val Val Ala Cys Arg Pro Trp Leu Ile Ala Glu Met Thr Ser
130 135 140
Val Glu Pro Asp Val Val Val Leu Leu Gly Ala Thr Ala Ala Lys Ala
145 150 155 160
Leu Leu Gly Asn Asp Phe Arg Val Thr Gln His Arg Gly Glu Val Leu
165 170 175
His Val Asp Asp Val Pro Gly Asp Pro Ala Leu Val Ala Thr Val His
180 185 190
Pro Ser Ser Leu Leu Arg Gly Pro Lys Glu Glu Arg Glu Ser Ala Phe
195 200 205
Ala Gly Leu Val Asp Asp Leu Arg Val Ala Ala Asp Val Arg Pro
210 215 220
<210> 3
<211> 627
<212> DNA
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 3
atggcgggtg cgcaagattt cgtcccccac acggcggacc tggccgaact cgctgccgcg 60
gcaggcgaat gccgaggctg cgggttgtat cgcgacgcca cgcaggcggt cttcggcgcg 120
ggcgggcgct cggcacgcat catgatgatc ggcgagcagc ccggtgacaa agaggacctg 180
gcgggcctgc ccttcgtggg tcccgcgggc cggctcctgg accgcgcgct ggaagccgcg 240
gacatcgacc gcgatgccct ctacgtcacc aacgcggtca agcacttcaa gttcacgcgg 300
gcagcgggag gcaaacgacg catccacaag acccccagtc gtaccgaggt ggtggcgtgc 360
cgtccctggc tcatcgccga gatgacctcc gtggagcccg atgtcgtggt gctgctcggc 420
gcaaccgccg ccaaggcact gctgggcaac gactttcgcg tcacgcagca tcgcggcgag 480
gtcctgcacg tcgacgacgt accgggagat ccggcgctgg tcgccaccgt tcacccgtcg 540
tctctgctgc gcggacccaa ggaggaacgc gaatccgcgt tcgcgggcct ggtcgacgat 600
ctgcgtgtcg cagcagatgt caggcca 627
<210> 4
<211> 669
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ggcctgaacg atatttttga agcgcagaaa attgaatggc atgaagcggg tgcgcaagat 60
ttcgtccccc acacggcgga cctggccgaa ctcgctgccg cggcaggcga atgccgaggc 120
tgcgggttgt atcgcgacgc cacgcaggcg gtcttcggcg cgggcgggcg ctcggcacgc 180
atcatgatga tcggcgagca gcccggtgac aaagaggacc tggcgggcct gcccttcgtg 240
ggtcccgcgg gccggctcct ggaccgcgcg ctggaagccg cggacatcga ccgcgatgcc 300
ctctacgtca ccaacgcggt caagcacttc aagttcacgc gggcagcggg aggcaaacga 360
cgcatccaca agacccccag tcgtaccgag gtggtggcgt gccgtccctg gctcatcgcc 420
gagatgacct ccgtggagcc cgatgtcgtg gtgctgctcg gcgcaaccgc cgccaaggca 480
ctgctgggca acgactttcg cgtcacgcag catcgcggcg aggtcctgca cgtcgacgac 540
gtaccgggag atccggcgct ggtcgccacc gttcacccgt cgtctctgct gcgcggaccc 600
aaggaggaac gcgaatccgc gttcgcgggc ctggtcgacg atctgcgtgt cgcagcagat 660
gtcaggcca 669

Claims (10)

1.一种双链核酸复合物,其特征在于,所述的双链核酸复合物包括:
第一单链,所述第一单链为ssDNA,并且所述的ssDNA的原dU位置存在共价连接的UdgX,其中,按第一单链的5'至3'方向,所述原dU位置为第W0位;和
第二单链,所述的第二单链是通过引物延伸反应形成的互补链,并且所述的第二单链的3'端核苷酸对应于第一单链的第W0+1位的核苷酸。
2.如权利要求1所述的双链核酸复合物,其特征在于,所述的第二单链为ssDNA、ssRNA、或其组合。
3.如权利要求1所述的双链核酸复合物,其特征在于,所述的第一单链是来自经过基因编辑的核酸分子。
4.如权利要求3所述的双链核酸复合物,其特征在于,所述的基因编辑包括用碱基编辑器(Base Editor)进行碱基替换。
5.如权利要求1所述的双链核酸复合物,其特征在于,所述的UdgX包括选自下组的野生型或其突变型的UdgX:
耻垢分枝杆菌(M.smegmatis)的UdgX酶,登录号为WP 011726794.1;
鸟分枝杆菌(M.avium)的UdgX酶,登录号为ZP 05218036.1;
胞内分枝杆菌(M.intracellulare)的UdgX酶,登录号为ZP 05227544.1;
嗜血杆菌(M.haemophilum)的UdgX酶,登录号为ZP 21917190.1;
M.chubuense的UdgX酶,登录号为YP 006453151.1;
M.rhodesiae的UdgX酶,登录号为WP 014212855.1;
R.imtechensis的UdgX酶,登录号为ZP 10004147.1;
G.namibiense的UdgX酶,登录号为ZP 10960189.1;
S.coelicolor的UdgX酶,登录号为NP 628659.1;
M.lupini的UdgX酶,登录号为ZP 21028631.1;
N.farcinica的UdgX酶,登录号为YP 118940.1;或其组合。
6.如权利要求1所述的双链核酸复合物,其特征在于,所述的UdgX为来自耻垢分枝杆菌(Mycobacterium smegmatis)。
7.如权利要求1所述的双链核酸复合物的制备方法,其特征在于,包括步骤:
(a)提供一待分析的单链DNA分子;
(b)将所述待分析的单链DNA分子与UdgX进行混合,从而形成第一单链,所述第一单链为ssDNA,并且所述的ssDNA的原dU位置存在共价连接的UdgX,其中,按第一单链的5'至3'方向,所述原dU位置为第W0位;
(c)对所述第一单链进行引物延伸,合成互补的第二单链,并形成“第一单链-第二单链双链结构”,即所述的双链核酸复合物,
其中所述的第二单链的3'端核苷酸对应于第一单链的第W0+1位的核苷酸。
8.一种检测核酸序列的dU的方法,其特征在于,包括步骤:
(S1)提供权利要求1所述的双链核酸复合物;
其中,所述的双链核酸复合物包括:第一单链,所述第一单链为ssDNA,并且所述的ssDNA的原dU位置存在共价连接的UdgX,其中,按第一单链的5'至3'方向,所述原dU位置为第W0位;和
第二单链,所述的第二单链是通过引物延伸反应形成的互补链,并且所述的第二单链的3'端核苷酸对应于第一单链的第W0+1位的核苷酸;
(S2)从所述的双链核酸复合物分离出所述的第二单链;
(S3)对第二单链进行测序,从而获得第二单链的序列;
(S4)基于所述第二单链的序列,将对应于所述第一单链的序列的第W0位确定为dU。
9.一种用于检测核酸序列的dU的试剂盒,其特征在于,包括以下组分:
(a)第一检测试剂,所述的第一试剂为UdgX,并且,所述的UdgX带有纯化标签、带有可检测标记物、偶联有用于分离的分离元件、或可捕获元件(如biotin);
(b)用于形成权利要求1所述的双链核酸复合物的引物;
(c)用于测序的试剂;
(d)扩增接头;
其中,所述试剂盒中,除了包括组分(a)之外,还包括组分(b)、(c)、(d)中至少一种组分。
10.一种检测核酸序列的dU的测序方法,其特征在于,包括步骤:
(t1)提供待测序的核酸样品;
(t2)对所述核酸样品进行片段化处理,形成片段化的核酸分子;
(t3)将所述片段化的核酸分子进行变性,形成ssDNA分子;
(t4)使所述ssDNA分子与UdgX混合,从而形成第一单链,所述第一单链为ssDNA,并且所述的ssDNA的原dU位置存在共价连接的UdgX,其中,按第一单链的5'至3'方向,所述原dU位置为第W0位;
(t5)以所述第一单链为模板,进行引物延伸,从而形成第二单链,所述的第二单链是通过引物延伸反应形成的互补链,并且所述的第二单链的3'端核苷酸对应于第一单链的第W0+1位的核苷酸;
(t6)分离所述的第二单链;
(t7)对第二单链在其3'端添加扩增接头,从而形成“扩增接头-第二单链”复合物;
(t8)对所述“扩增接头-第二单链”复合物进行扩增,从而形成待测序的经扩增产物;
(t9)对待测序的经扩增产物进行测序,从而获得第二单链的序列;
(t10)基于所述第二单链的序列,将对应于所述第一单链的序列的第W0位确定为dU。
CN202210028996.1A 2022-01-11 2022-01-11 基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术 Pending CN116463336A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210028996.1A CN116463336A (zh) 2022-01-11 2022-01-11 基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术
PCT/CN2023/071070 WO2023134584A1 (zh) 2022-01-11 2023-01-06 基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210028996.1A CN116463336A (zh) 2022-01-11 2022-01-11 基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术

Publications (1)

Publication Number Publication Date
CN116463336A true CN116463336A (zh) 2023-07-21

Family

ID=87177500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210028996.1A Pending CN116463336A (zh) 2022-01-11 2022-01-11 基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术

Country Status (2)

Country Link
CN (1) CN116463336A (zh)
WO (1) WO2023134584A1 (zh)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111041023A (zh) * 2018-10-11 2020-04-21 中国科学院天津工业生物技术研究所 特定核酸结合蛋白及其富集特定核酸的方法

Also Published As

Publication number Publication date
WO2023134584A1 (zh) 2023-07-20

Similar Documents

Publication Publication Date Title
JP7127104B2 (ja) 連続性を維持した転位
KR102458022B1 (ko) 혼합물 중 핵산의 서열분석 방법 및 그와 관련된 조성물
JP7100680B2 (ja) ゲノム適用および治療適用のための、核酸分子のクローン複製および増幅のためのシステムおよび方法
ES2886923T3 (es) Métodos y composición para generar sondas de ADN de secuencia única, marcaje de sondas de ADN y el uso de estas sondas
CN107109486A (zh) 用于检测基因组中遗传剪刀的脱靶位点的方法
US20110189677A1 (en) Methods For Preparing Sequencing Libraries
KR20160048992A (ko) Rna-염색질 상호작용 분석용 조성물 및 이의 용도
CN110392739B (zh) 检测dna突变的测序方法
WO2022115608A1 (en) Multiplexed profiling of rna and dna modifications
CN113528612B (zh) 用于检测染色质开放位点间染色质相互作用的NicE-C技术
WO2024112441A1 (en) Double-stranded dna deaminases and uses thereof
CN116463336A (zh) 基于UdgX的在单碱基分辨率水平上的DNA脱氧尿嘧啶的检测技术
KR101230362B1 (ko) 나노아케움 이퀴탄스 dna 중합효소의 단백질 트랜스 스플라이싱을 기반으로 한 핫―스타트 pcr 수행방법
CN111094587A (zh) 转座酶组合物、制备方法和筛选方法
CA3211616A1 (en) Cell barcoding compositions and methods
KR20150017525A (ko) 차세대 염기서열 분석법을 이용한 체성돌연변이 검출방법
US20220127600A1 (en) Methods of Detecting Analytes and Compositions Thereof
CN114075602A (zh) 检测人ccdc6-ret融合基因的探针、试剂、试剂盒、检测方法及应用
CN113614228A (zh) 使用poly(a)聚合酶对rna的尺寸选择
JP2020507326A (ja) 組換え事象および再編成事象の検出に関する方法および組成物
US11802306B2 (en) Hybridization immunoprecipitation sequencing (HIP-SEQ)
US20080248958A1 (en) System for pulling out regulatory elements in vitro
US20220348996A1 (en) Method and kit for non-specific amplification of natural short-fragment nucleic acid
CA3223202A1 (en) Multicolor whole-genome mapping and sequencing in nanochannel for genetic analysis
CN112359096A (zh) 一种检测dna碱基切除修复通路关键突变基因的试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination