CN114402071A

CN114402071A - 用于基因特异性脱甲基和激活的方法和组合物

Info

Publication number: CN114402071A
Application number: CN202080062113.8A
Authority: CN
Inventors: 刘燕婧; D·G·特恩; A·迪罗斯科; A·K·埃布拉利德
Original assignee: Beth Israel Deacon Medical Center Ltd; National University of Singapore
Current assignee: Beth Israel Deacon Medical Center Ltd; National University of Singapore
Priority date: 2019-07-15
Filing date: 2020-07-15
Publication date: 2022-04-26
Also published as: WO2021011649A2; EP3999641A2; US20220290139A1; EP3999641A4; WO2021011649A3

Abstract

本文提供了用于基因特异性脱甲基和/或激活的方法和试剂。提供了寡核苷酸构建体，该寡核苷酸构建体包含：[1]靶向部分，该靶向部分与基因内、基因附近或两者的基因组DNA区域具有序列互补性和结合亲和力；和[2]单向导RNA(sgRNA)支架部分，其中该sgRNA的四环部分被修饰并且包含DNMT1相互作用RNA(DiR)的R2茎环，并且其中该sgRNA的茎环2部分被修饰并且包含DiR的R5阶梯环。可以与失活(死)Cas9(dCas9)一起使用寡核苷酸构建体以用于在对其有需要的细胞或受试者中提供基因特异性脱甲基和/或所关心的基因的激活。

Description

用于基因特异性脱甲基和激活的方法和组合物

技术领域

本发明一般地涉及基因脱甲基和/或激活。更具体地，本发明涉及使用寡核苷酸构建体和失活的Cas9，用于基因特异性脱甲基和/或激活的方法和组合物。

背景技术

表观遗传和DNA甲基化异常在一些重要疾病，特别是癌症中起重要作用。通过甲基化抑制基因表达，特别是在CpG-富集启动子处，已与一些肿瘤抑制基因(TSG)相关，并且可以与恶性细胞中的长期基因沉默有关。一种或多种肿瘤抑制基因以靶向或特异性方式的再激活在治疗领域中是非常期望的。

不幸地，已证明用于逆转基因甲基化和再激活异常甲基化基因表达的方法和处理的开发是困难的。已积极研究了开发广泛的脱甲基试剂(即阿扎胞苷、地西他滨)来治疗高甲基化-相关疾病，但是对于基因座缺少特异性以及高度毒性为这些方法带来了困难。

的确，在本领域中，仍在努力探索提供用于基因-特异性脱甲基和激活，特别是用于抗-癌应用的方法和试剂。以更密切模拟自然过程的方式提供用于脱甲基和/或激活的方法是特别期望的。

用于基因脱甲基的传统方法是非特异性的并且通常使用小分子试剂，如阿扎胞苷或地西他滨。非特异性方法可以产生多种非故意或不希望的影响。Crispr和Cas9的发现已基于与向导RNA靶向序列的序列互补性产生了靶向基因组DNA内的特定序列或区域的方法；然而，Crispr/Cas9通常用作基因编辑系统，并且基因编辑不易于处理通过甲基化的基因失活。

作为另外一种选择，用于提供基因-特异性脱甲基和/或激活的其他和/或改善的方法和试剂是所期望的。

发明内容

本文提供了用于基因特异性脱甲基和/或激活的方法和组合物。如本文以下详细描述的，目前已开发了用于提供一种或多种所关心的基因的靶向脱甲基，从而导致其激活和表达升高的寡核苷酸和方法。使用设计用于抑制DNA甲基转移酶1(DNMT1)活性的靶向寡核苷酸构建体和失活(死)的Cas9(dCas9)，本文显示DNA甲基化可以在靶向甲基化基因组区域中减少，从而导致所关心的靶标基因的基因表达升高。在某些实施方式中，与常规非特异性脱甲基试剂相比，本文所描述的方法可以提供更天然和靶向的脱甲基效果，并且本文所提供的结果观察到在延长的时间段内的脱甲基和激活。显著地，如本文所描述的，发现与靶向基因组DNA的模板链相比，用所述寡核苷酸靶向基因组DNA的非模板链提供了显著更好的基因脱甲基/激活。

在一个实施方式中，本文提供了寡核苷酸，其包括：

靶向部分，该靶向部分与基因内、基因附近或两者的基因组DNA区域具有序列互补性和结合亲和力；和

单向导RNA(sgRNA)支架部分，其中所述sgRNA的四环部分被修饰并且包含DNMT1相互作用RNA(DiR)的R2茎环，并且其中所述sgRNA的茎环2部分被修饰并且包含DiR的R5阶梯环(step loop)。

在上述寡核苷酸的另一个实施方式中，所述靶向部分可以与基因内、基因附近或两者的基因组DNA的非模板链具有序列互补性和结合亲和力。

在任何上述一种或多种寡核苷酸的另一个实施方式中，DiR的R2和R5茎环可以来自外编码CEBPA(ecCEBPA)。

在任何上述一种或多种寡核苷酸的另一个实施方式中，所述靶向部分可以靶向基因组DNA的甲基化区域。

在任何上述一种或多种寡核苷酸的另一个实施方式中，所述靶向部分可以靶向启动子区域内或附近或者基因的脱甲基核心区域(例如，涵盖内含子1区域的近端启动子-外显子1-起始的区域)内或附近的基因组DNA区域，优选地其中所述靶向部分可以靶向基因的第一外显子的5'端处或附近的区域(例如，近端启动子区域)或者第一外显子的3'端处或附近的区域(例如，内含子1的起始部分)或者基因的第一外显子的中间区域(例如，在位于一侧的近端启动子和位于另一侧的内含子1的起始之间的区域)。在某些实施方式中，所述中间区域可以包含外显子1内的任何部分或区域。在某些实施方式中，所述靶向部分可以靶向与第一外显子相关的近端启动子区域处或附近的区域和/或第一内含子的起始处或附近的区域和/或基因的第一外显子的中间区域。优选地，在某些实施方式中，可以使用至少两种寡核苷酸，一种寡核苷酸具有靶向第一外显子的5'端处或附近的区域(例如，近端启动子区域)的靶向部分，并且一种寡核苷酸具有靶向基因的第一外显子的3'端处或附近的区域(例如，内含子1的起始部分)的靶向部分，从而同时靶向脱甲基核心区域的两端。在某些实施方式中，可以使用具有靶向基因的第一外显子的中间区域(例如，在位于一侧的近端启动子和位于另一侧的内含子1的起始之间的区域)的靶向部分的寡核苷酸。在某些实施方式中，可以使用至少3种寡核苷酸，一种寡核苷酸具有靶向第一外显子的5'端处或附近的区域(例如，近端启动子区域)的靶向部分，一种寡核苷酸具有靶向基因的第一外显子的3'端处或附近的区域(例如，内含子1的起始部分)的靶向部分，并且一种寡核苷酸具有靶向基因的第一外显子的中间区域(例如，在位于一侧的近端启动子和位于另一侧的内含子1的起始之间的区域)的靶向部分，从而同时靶向脱甲基核心区域的两端和中间区域。据考虑当使用寡核苷酸的组合时，不同的寡核苷酸可以用于同时、顺序或组合施用。通常，所述寡核苷酸可以用于施用，从而它们同时起作用；然而，还考虑在某些实施方式中，可以在不同时间点或不同阶段使用不同的寡核苷酸或寡核苷酸组合以用于调控基因激活。

在任何上述一种或多种寡核苷酸的另一个实施方式中，所述寡核苷酸可以包含以下序列：

(R_a)GUUUR_bAGAGCUA(R_c)UAGCAAGUUR_dAAAUAAGGCUAGUCCGUUAUCAACUU(R_e)AGUGGCACCGAGUCGGUGC(R_f)

(式I)

其中

R_a包含所述靶向部分，并且长度包含约20至约21个核苷酸；

R_b是A、G或C，并且R_d是R_b的互补碱基对；

R_c包含DiR的R2茎环，其包含序列CCCGGGACGCGGGUCCGGGACAG(SEQ ID NO：7)；

R_e包含DiR的R5阶梯环，其包含序列CUGAGGCCUUGGCGAGGCUUCU(SEQ ID NO：8)；和

R_f是任选地存在的，并且包含多聚U转录终止序列。

(R_a)GUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGTGGCACCGAGUCGGUGCUUUUUU；

(式II)

其中R_a包含所述靶向部分，并且长度包含约20至约21个核苷酸。

在任何上述一种或多种寡核苷酸的另一个实施方式中，所述基因可以是P16，并且R_a可以包括：

GCUCCCCCGCCUGCCAGCAA(SEQ ID NO：9)；

GCUAACUGCCAAAUUGAAUCG(SEQ ID NO：10)；

GACCCUCUACCCACCUGGAU(SEQ ID NO：11)；或

GCCCCCAGGGCGUCGCCAGG(SEQ ID NO：12)。

在另一个实施方式中，本文提供了编码本文所描述的任何一种或多种寡核苷酸的质粒或载体。

在另一个实施方式中，本文提供了包含本文所描述的任何一种或多种寡核苷酸和死Cas9(dCas9)的组合物。

在另一个实施方式中，本文提供了包含以下任何一种或多种的组合物：

如本文所描述的寡核苷酸；

如本文所描述的质粒或载体；

药物可用的载体、赋形剂、稀释剂或缓冲剂；

死Cas9(dCas9)；或者

编码死Cas9(dCas9)的寡核苷酸、质粒或载体。

在上述组合物的另一个实施方式中，所述dCas9可以包含D10A和H840A突变。

在另一个实施方式中，本文提供了组合物，其包含本文所描述的任何一种或多种寡核苷酸，其中所述靶向部分靶向基因的第一外显子的5'区域；和本文所描述的任何一种或多种寡核苷酸，其中所述靶向部分靶向基因的第一外显子的3'区域。

在另一个实施方式中，本文提供了组合物，其包含：

如本文所描述的任何一种或多种寡核苷酸，其中所述靶向部分靶向基因的第一外显子的5'端处或附近的区域(例如，近端启动子区域)；和

如本文所描述的任何一种或多种寡核苷酸，其中所述靶向部分靶向基因的第一外显子的3'端处或附近的区域(例如，内含子1的起始区域)；和

任选地，还包括本文所描述的任何一种或多种寡核苷酸，其中所述靶向部分靶向基因的第一外显子的中间区域；

优选地，其中所述组合物包含如本文所描述的寡核苷酸，其中所述靶向部分靶向与第一外显子相关的近端启动子区域处或附近的区域；和如本文所描述的寡核苷酸，其中所述靶向部分靶向第一内含子起始处或附近的区域；并且任选地还包括如本文所描述的寡核苷酸，其中所述靶向部分靶向基因的第一外显子的中间区域。

在另一个实施方式中，本文提供了下列的组合：本文所描述的任何一种或多种寡核苷酸，其中所述靶向部分靶向基因的第一外显子的5'端处或附近的区域；和本文所描述的任何一种或多种寡核苷酸，其中所述靶向部分靶向基因的第一外显子的3'端处或附近的区域。

在另一个实施方式中，本文提供了基因靶向脱甲基和/或激活的方法，所述方法包括：

将死Cas9(dCas9)和一种或多种寡核苷酸引入到细胞中，所述一种或多种寡核苷酸分别包含：

单向导RNA(sgRNA)支架部分，其中所述sgRNA的四环部分被修饰并且包含DNMT1相互作用RNA(DiR)的R2茎环，并且其中所述sgRNA的茎环2部分被修饰并且包含DiR的R5阶梯环；

借此通过抑制DNA甲基转移酶1(DNMT1)对所述基因的活性使所述基因脱甲基和/或激活。

在上述方法的另一个实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以与基因内、基因附近或两者的基因组DNA的非模板链具有序列互补性和结合亲和力。

在任何上述一种或多种方法的另一个实施方式中，引入步骤包括将所述一种或多种寡核苷酸和所述dCas9在所述细胞中转染、递送或表达。

在任何上述一种或多种方法的另一个实施方式中，所述一种或多种寡核苷酸包含如本文所描述的任何一种或多种寡核苷酸。

在任何上述一种或多种方法的另一个实施方式中，可以将至少两种寡核苷酸引入细胞，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'区域。

在任何上述一种或多种方法的另一个实施方式中，可以将至少两种寡核苷酸引入所述细胞，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'端处或附近的区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'端处或附近的区域；优选地其中所述第一寡核苷酸的靶向部分靶向与所述第一外显子相关的近端启动子区域处或附近的区域并且所述第二寡核苷酸的靶向部分靶向所述第一内含子起始处或附近的区域；任选地其中可以将第三寡核苷酸引入所述细胞，其中所述第三寡核苷酸的靶向部分靶向所述第一外显子的中间区域。

在任何上述一种或多种方法的另一个实施方式中，可以将细胞暴露于dCas9和所述一种或多种寡核苷酸至少约3天、至少约4天、至少约5天、至少约6天、至少约7天或者至少约8天或者约3天至约1周的时间。

在另一个实施方式中，本文提供了如本文所描述的任何一种或多种寡核苷酸、质粒或者质粒或载体或者载体、一种或多种组合物或者一种或多种组合用于基因的靶向脱甲基和/或激活的用途。

在另一个实施方式中，本文提供了用于治疗对其有需要的受试者中与由于异常DNA甲基化所造成的至少一种基因表达降低有关的疾病或病症的方法，所述方法包括：

用死Cas9(dCas9)和一种或多种寡核苷酸治疗所述受试者，所述一种或多种寡核苷酸分别包括：

借此通过抑制DNA甲基转移酶1(DNMT1)对所述基因的活性使所述基因脱甲基和/或激活，并治疗所述疾病或病症。

在上述方法的另一个实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以与基因内、在基因附近或两者的基因组DNA的非模板链具有序列互补性和结合亲和力。

在任何上述一种或多种方法的另一个实施方式中，治疗步骤可以包括将一种或多种寡核苷酸和dCas9在受试者的至少一种细胞中转染、递送或表达。

在任何上述一种或多种方法的另一个实施方式中，所述一种或多种寡核苷酸可以包含如本文所描述的一种或多种寡核苷酸。

在任何上述一种或多种方法的另一个实施方式中，可以使用至少两种寡核苷酸，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'区域。

在任何上述一种或多种方法的另一个实施方式中，可以使用至少两种寡核苷酸，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'端处或附近的区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'端处或附近的区域；优选地其中所述第一寡核苷酸的靶向部分靶向与所述第一外显子相关的近端启动子区域处或附近的区域并且所述第二寡核苷酸的靶向部分靶向所述第一内含子起始处或附近的区域；任选地其中使用第三寡核苷酸，其中所述第三寡核苷酸的靶向部分靶向所述第一外显子的中间区域。

在任何上述一种或多种方法的另一个实施方式中，可以将受试者暴露于dCas9和所述一种或多种寡核苷酸至少约3天、至少约4天、至少约5天、至少约6天、至少约7天或者至少约8天或者约3天至约1周的时间。

在另一个实施方式中，本文提供了如本文所描述的任何一种或多种寡核苷酸、质粒或者质粒或载体或者载体、一种或多种组合物或者一种或多种组合用于治疗对其有需要的受试者中与由于异常DNA甲基化所造成的至少一种基因表达降低有关的疾病或病症的用途。

在任何上述方法或使用的另一个实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以靶向所述基因的启动子区域内或附近或者所述基因的脱甲基核心区域内或附近的位点，优选地其中所述靶向部分靶向所述第一外显子的5'端处或附近的区域或者所述基因的第一外显子的3'端处或附近的区域。

在任何上述方法或使用的另一个实施方式中，可以使用至少两种寡核苷酸，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'端处或附近的区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'端处或附近的区域。

在任何上述方法或使用的另一个实施方式中，所述启动子区域可以是具有至少一定甲基化的富含CpG的区域。

在任何上述方法或使用的另一个实施方式中，所述疾病或病症可以包含癌症。

在任何上述方法或使用的另一个实施方式中，所述基因可以是肿瘤抑制基因。

在任何上述方法或使用的另一个实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以靶向所述基因的启动子区域内或附近或者所述基因的脱甲基核心区域内或附近的位点，具体地其中所述靶向部分可以靶向所述第一外显子的5'端处或附近的区域或者所述基因的第一外显子的3'端处或附近的区域，其中所述基因是肿瘤抑制基因。

在任何上述方法或使用的另一个实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以靶向P16基因的区域D1或D3。

在任何上述方法或使用的另一个实施方式中，所述一种或多种寡核苷酸可以包含具有靶向所述区域D1的靶向部分的至少一种寡核苷酸，和具有靶向所述区域D3的靶向部分的至少一种寡核苷酸，并且任选地还包含具有靶向所述区域D2的靶向部分的至少一种寡核苷酸。

在任何上述方法或使用的另一个实施方式中，所述一种或多种寡核苷酸可以包含以下中的一种或多种：

G19sgR2R5(SEQ ID NO：1)：

GCUCCCCCGCCUGCCAGCAAGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU；

G36sgR2R5(SEQ ID NO：2)：

GCUAACUGCCAAAUUGAAUCGGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU；

G110sgR2R5(SEQ ID NO：3)：

GACCCUCUACCCACCUGGAUGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU；

G111sgR2R5(SEQ ID NO：4)：

GCCCCCAGGGCGUCGCCAGGGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU；

G108sgR2R5(SEQ ID NO：5)：

GUGGCCAGCCAGUCAGCCGAGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU；或

G122sgR2R5(SEQ ID NO：6)：

GCCGCAGCCGCCGAGCGCACGGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU；

或它们的任意组合。

在另一个实施方式中，本文提供了用于识别一个或多个脱甲基靶向位点以激活基因在细胞中的表达的方法，所述方法包括：

用非特异性脱甲基试剂处理所述细胞；

识别所述基因的转录起始位点周围的一个或多个区域，所述区域通过用非特异性脱甲基试剂处理而大部分脱甲基；和

将所识别的一个或多个区域用作脱甲基靶向位点以激活基因表达。

在上述方法的另一个实施方式中，所述非特异性脱甲基试剂可以包含地西他滨(2'-脱氧-5-氮杂胞苷)。

在任何上述一种或多种方法的另一个实施方式中，可以用非特异性脱甲基试剂处理约3天。

在任何上述一种或多种方法的另一个实施方式中，识别所述基因的转录起始位点周围的一个或多个区域(所述区域通过用非特异性脱甲基试剂处理而大部分脱甲基)的步骤可以包括实施亚硫酸氢盐Sanger-测序或者全基因组亚硫酸氢盐测序，并且任选地将结果与对照未处理细胞相比较。

在任何上述一种或多种方法的另一个实施方式中，转录起始位点周围的一个或多个区域的选择可以促进启动子处或附近、所述基因的第一外显子处或附近、所述基因的第一内含子处或附近、所述基因的第一外显子的5'端处或附近的区域处或附近、所述基因的第一外显子的3'端处或附近的区域处或附近、CpG岛处或附近、另一个重要调控区域处或附近的区域或它们的任意组合的选择。

在任何上述一种或多种方法的另一个实施方式中，转录起始位点周围的一个或多个区域的选择可以促进所述基因的第一外显子的5'区域处或附近的至少一个区域和所述基因的第一外显子的3'区域处或附近的至少一个区域的选择。

在任何上述一种或多种方法的另一个实施方式中，所述方法还可以包括使用本文所描述的任何一种或多种方法实施靶向脱甲基和基因激活，其中所述一种或多种寡核苷酸的靶向部分对所识别的脱甲基靶向位点具有序列互补性。

在任何上述一种或多种方法的另一个实施方式中，所述一个或多个区域可以是非模板链区域。

附图说明

参考以下描述和附图，将进一步理解这些及其他特征，其中：

图1显示CRISPR-R2R5系统通过靶向启动子CpG岛引起了中等基因激活和脱甲基。在图1(a)中，显示了sgRNA(无DiR)和sgR2R5(具有DiR)的结构、靶向位点G2和转染方法。在图1(b)中，显示了72小时处理后，每个样品中p16 mRNA的表达。在图1(c)中，显示了MSP数据，该数据显示了基因脱甲基。(缩写-sgOri：无DiR的原始sgRNA；sgR2R5：与R2,R5环融合的sgRNA；G2：向导RNA；MSP：甲基化特异性PCR)；

图2显示了典型单向导RNA(sgRNA)的序列和结构组织；

图3显示了同时靶向P16区域D1和D3的CRISPR-DiR的结果，其中4个向导靶向每个区域中的两条链。图3(a)显示了靶向策略；图3(b)显示了P16 mRNA表达谱；图3(c)显示了P16蛋白恢复谱；图3(d)显示了通过COBRA所测量的区域D1和D3中的甲基化；并且图3(e)显示了第53天处理样品的细胞周期分析；

图4显示了同时靶向P16区域D1和D3的CRISPR-DiR的结果，其中每个样品中仅靶向一条DNA链。图4(a)显示了靶向策略，图4(b)显示了P16表达谱，并且图4(c)显示了通过COBRA所测量的区域D1和D3中的甲基化谱。靶向表示向导RNA序列(即靶向部分)与靶向链互补。mRNA序列(有义链)与非模板链相同。因此，在COBRA数据中，S(靶向有义链)是指靶向非模板链(NT)，AS(靶向反义链)是指靶向模板(T)链；

图5显示了用2.5uM DAC处理3和5天时的SNU-398野生型细胞的甲基化和基因表达谱。图5(a)显示了P16基因座中检查甲基化的5个区域；图5(b)显示了细胞样品中的P16基因表达；和图5(c)显示了区域A、C、D和E中野生型细胞和DAC处理的细胞的亚硫酸氢盐测序数据。每个黑色或白色的点代表CG位点，黑色的点表示甲基化的C，而白色的点代表未甲基化的C；

图6显示了通过4个混合的向导RNA(G113、G114、G115、G116)靶向P16区域E的CRISPR-DiR的结果。在图6(a)中，显示了靶向策略；在图6(b)中，显示了追踪3个月的P16表达谱；在图6(c)中，显示了通过COBRA测量的第0天、第天、第28天和第41天中的CRISPR-DiR处理样品的甲基化。红色箭头表示未消化的DNA，它是不可以被切割的脱甲基DNA。在图6(d)中，显示了靶向区域E 41天后区域D1中的甲基化；在图6(e)中，显示了靶向区域E 41天后区域D2中的甲基化；和在图6(f)中，显示了靶向区域E 41天后区域D3中的甲基化；

图7显示了使用相同向导RNA，但无dCas9时CRISPR-DiR靶向区域E的结果。“未加载”表示没有加载足够的样品；然而，未加载的样品是未切割的对照，因此未切割的条带信息仍可以得自其他未切割的样品，但是所有未切割的DNA的长度应该是相同的；

图8显示了对于每个区域通过4种混合的向导RNA靶向P16区域E，或区域A，或区域E+A的CRISPR-DiR。图8(a)显示了靶向策略；图8(b)显示了P16表达谱；图8(c)显示了通过COBRA测量的CRISPR-DiR处理样品的区域E中的甲基化，对区域E靶向72天，而区域A靶向19天；和图8(d)显示了靶向区域E后的区域A中的甲基化，对区域E靶向72天，而区域A靶向19天；

图9显示了对于每个区域通过4种混合的向导RNA靶向P16区域E，或区域D1，或区域E+D1的CRISPR-DiR。在图9(a)中，显示了靶向策略；在图9(b)中，显示了P16表达谱；在图9(c)中，显示了通过COBRA所测量的CRISPR-DiR处理样品的区域E和区域D1中的甲基化，对区域E靶向92天，而区域D1靶向18天；

图10显示了P16区域E、D1、D2和D3或者区域D1的CRISPR-DiR靶向。通过4种混合的向导RNA靶向每个区域。在图10(a)中，显示了靶向策略；在图10(b)，显示了P16表达谱；在图10(c)，显示了通过COBRA所测量的区域D1中的甲基化；在图10(d)中，显示了通过COBRA所测量的区域D3中的甲基化；在图10(e)中，显示了通过COBRA所测量的区域E中的甲基化；在图10(f)中，显示了通过COBRA所测量的区域C中的甲基化。靶向区域E 116天，靶向区域D1 33天，靶向区域D2 28天，靶向区域D3 13天。红色框突出显示即使不直接靶向，区域C和E脱甲基；

图11显示了CRISPR-DiR处理样品的动态脱甲基过程的亚硫酸氢盐PCR测序结果，并且附有图3中所示的数据；

图12显示了如通过COBRA所测量的，在整个53天CRISPR-DiR处理期间，在区域C、D1、D2、D3和E中的甲基化谱。同时靶向p16区域D1和D3的CRISPR-DiR，其中4个向导靶向每个区域中的两条链；

图13显示了同时靶向p16区域D1和D3的CRISPR-DiR的结果，其中每个样品中仅靶向一条DNA链。图13(a)显示了靶向策略；图13(b)显示了p16表达谱；并且图13(c)显示了通过COBRA所测量的区域D1和D3中的甲基化谱。靶向表示向导RNA序列与靶向链互补。mRNA序列(有义链)与非模板链相同。因此，在COBRA数据中，S(有义链)是指靶向非模板链(NT)，AS(反义链)是指靶向模板(T)链；

图14显示了CRISPR-DiR系统的实施方式的设计。如所示的，来自ecCEBPA的短DNMT1相互作用RNA环可以融合至原始sgRNA支架、四环和茎环2；

图15显示了在U2OS细胞系中同时靶向p16区域D1和D3非模板链(NT)的CRISPR-DiR的结果。图15(a)显示了靶向策略，图15(b)显示了p16表达谱，并且图15(c)显示了通过COBRA所测量的区域D1和D3中的甲基化谱；

图16显示了通过向导1.6sgDiR(sg1.6，GCTGCGGCTGCTGCTCGCCC(SEQ ID NO：13))，CRISPR-DiR靶向SALL4非模板链进行脱甲基和基因激活的结果。图16(a)显示了靶向测量，图16(b)显示了SALL4 mRNA表达谱，图16(c)显示了SALL4蛋白恢复，并且图16(d)显示了对照细胞和CRISPR-DiR处理细胞的靶向区域中的脱甲基；

图17显示了通过CRISPR-DiR靶向51天，U2OS细胞中的CEBPA mRNA表达和p14 mRNA表达；

图18显示了dcas9诱导的CRISPR-DiR系统在SNU-398细胞中的结果。图18(a)显示了靶向策略，图18(b)显示了p16表达谱，并且图18(c)显示了通过COBRA所测量的区域D1中的甲基化谱；

图19显示了CRISPR-DiR处理的53个细胞的组蛋白标志物ChIP-qPCR结果。图19(a)显示了ChIP-qPCR检查的组蛋白标志物的位置，P16是CRISPR-DiR靶向基因，而P14、P15、下游10Kb是附近的非靶向基因座；图19(b)显示了活性组蛋白标志物H3K4me3的富集；图19(c)显示了活性组蛋白标志物H3K27ac的富集；和图19(d)显示了沉默组蛋白标志物H3K9me3的富集；

图20显示了CRISPR-DiR系统的实施方式的开发。图20(a)显示了CRISPR-DiR设计的这种实施方式的原理。在修饰的sgDiR(MsgDiR)中，将来自ecCEBPA的短DNMT1相互作用RNA(DiR)环R2和R5融合至原始sgRNA支架、四环和/或茎环2区域。图20(b)显示了原始sgRNA对照和8种不同的MsgDiR设计形式的图示。以靶向p16基因近端启动子的向导G2使用所有sgRNA和MsgDiR构建体。图20(c)显示了基因p16以及sgRNA对照和MsgDiR的靶向位点(G2)的示意图。图20(d)显示了甲基化敏感性PCR(MSP)数据，其证实转染后72小时在SNU-398细胞系中的p16脱甲基。空对照：转染试剂和H₂O；sgRNA：dCas9+sgRNA(无DiR)的共转染；Msg1-8：根据图20(c)中所示的设计，dCas9+MsgDiR(具有DiR)的共转染；NTC：无模板对照。图20(e)是筛选后优选的CRISPR-DiR系统的示意图：dCas9+MsgDiR6，其中R2融合至sgRNA四环2，而R5融合至sgRNA茎环2；

图21显示了p16激活与外显子1而不是启动子CpG岛中的脱甲基相关。图21(a)显示了全基因组亚硫酸氢盐测序(WGBS)结果，其显示在野生型SNU-398(WT)和用2.5uM地西他滨处理72h的SNU-398(DAC)的PrExI区域(p16启动子(区域D1)-外显子1(区域D2)-内含子1(区域D3))中的甲基化谱。蓝色柱的高度代表了每个CpG残基的甲基化水平。图21(b)显示了野生型和地西他滨处理的SNU-398细胞中p16基因表达的实时-定量PCR(RT-qPCR)，WT：野生型；DAC：地西他滨。图21(c)是p16基因座中区域D1、区域D2和区域D3以及这3个区域中的CRISPR-DiR靶向位点的位置的示意图。为了靶向区域D1，在CRISPR-DiR中使用了向导G36和G19；为了靶向区域D2，使用了向导G108和G123；为了靶向区域D3，使用了向导G110和G111。图21(d)显示了用CRISPR-DiR慢病毒稳定转导的SNU-398细胞系中p16 RNA的实施-定量PCR(RT-qPCR)结果。平均值±SD，n＝3，*P<0.05；**P<0.01；***p<0.001；

图22显示了同时靶向p16区域D1和区域D3的CRISPR-DiR引起了脱甲基和基因再激活的动态过程。图22(a)是p16中区域D1、区域D2和区域D3的位置的示意图，CRISPR-DiR靶向策略：同时靶向p16区域D1(G36，G19)和区域D3(G110，G111)。图22(b)显示了亚硫酸氢盐测序PCR(BSP)结果，其显示了在SNU-398细胞中CRISPR-DiR处理后，从第0至第53天在p16区域D1、D2和D3中的逐渐脱甲基谱。图22(c)显示了实时-定量PCR(RT-qPCR)结果，其显示了在SNU-398细胞中CRISPR-DiR处理后的p16 mRNA表达。图22(d)显示了CRISPR-DiR处理后评价p16蛋白的免疫印迹。将β肌动蛋白(ACTB)用作加样对照。图22(e)显示了RT-qPCR结果，其显示在相同CRISPR-DiR处理后，在人骨肉瘤U2OS细胞系中p16的逐渐mRNA谱。图22(f)显示了结合亚硫酸氢盐的限制性酶分析(COBRA)，其表明在U2OS细胞中，通过相同CRISPR-DiR处理，在第0至第53天在p16区域D1、D2、D3(PrExI)中的逐渐脱甲基谱。U＝未切割，C＝切割的DNA。切割(泳道“C”)后迁移等于未切割的条带代表脱甲基DNA，并且将其用红色箭头表示。平均值±SD，n＝3，*P<0.05；**P<0.01；***p<0.001；

图23显示CRISPR-DiR影响维持超过1个月，并且PrExI脱甲基导致组蛋白修饰的动态变化。图23(a)显示了实时-定量PCR(RT-qPCR)结果，其显示在可诱导的CRISPR-DiR SNU-398细胞中p16 mRNA远大于一个月。在诱导系统中，使用了图22A中所示的相同靶向策略(区域D1+区域D3)，并且在用脱氧胞苷(Dox)处理后将dCas9表达诱导0天、3天、8天或32天。培养所有处理并在第0天、第3天、第8天或第32天测定。图23(b)显示了结合亚硫酸氢盐的限制性酶分析(或COBRA)，其表明了可诱导的CRISPR-DiR SNU-398细胞中p16的脱甲基谱。通过短至3天诱导，脱甲基状态维持超过1个月。切割(泳道C)后具有与未切割(泳道U)相等的迁移的条带代表脱甲基DNA，用红色箭头表示。图23(c)是ChIP-qPCR引物的位置的示意图(参见表7)。Neg 1和Neg 2：阴性对照引物1和2，分别位于p16上游50kb和下游10kb。用绿色表示CpG岛。图23(d)显示了ChIP-qPCR结果，其显示在如图22A所示，用靶向D1+D3的CRISPR-DiR稳定转导的SNU 398细胞中的p16 PrExI区域中H3K4Me3和H3K27Ac逐渐增加而H3K9Me3富集减少。图23(e)是用靶向区域D1+D3的CRISPR-DiR稳定转导的SNU 398细胞中p16mRNA、甲基化和组蛋白修饰变化的动态比较。平均值±SD，n＝3，*P<0.05；**P<0.01；***p<0.001；

图24显示通过CTCF，CRISPR-DiR诱导的p16 PrExI特异性脱甲基重塑染色质结构以激活基因表达。图24(a)是p16区域D1、D2和D3中DNA甲基化、组蛋白标记(H3K4Me3、H3K27Ac和H3K4Me1)和CTCF ChIP-Seq谱的示意图。从在我们的研究中实施的SNU-398细胞(野生型和地西他滨处理两者)收集WGBS甲基化数据；通过得自ENCODE的7个细胞系(GM12878、H1-hESC、HSMM、HUVEC、K562、NHEK、NHLF)间的ChIP-seq所确定的组蛋白标记富集；在我们的研究中，使用来自通过TFregulomeR分析的细胞系的ChIP-seq数据分析CTCF结合(FB8470、GM12891、GM19240、前列腺上皮细胞和H1-来源的间质干细胞)。图24(b)显示了在p16外显子1区域中预测的CTCF结合基序。图24(c)显示了ChIP-qPCR结果，其显示了在CRISPR-DiR诱导的脱甲基后，在p16PrExI区域中CTCF的富集。引物与组蛋白ChIP-qPCR相同(图23C)。平均值±SD，n＝3，*P<0.05；**P<0.01；***p<0.001。图24(d)显示了CRISPR-DiR诱导的PrExI区域的脱甲基的假想模型导致了通过CTCF富集的远端调控元件招募，其显示了覆盖800bp脱甲基区域(PrExI)的4C测定视点1(通过限制性内切酶Csp6I产生)。图24(e)显示了CRISPR-DiR处理13天的样品(GN2非靶向对照和D1+D3靶向)的环化染色体构象捕获(4C)-Seq分析。显示了p16视点1和潜在远端调控元件之间通过4C捕获的相互作用。通过对GN2对照归一化靶向样品(D1+D3)的相互作用确定相互作用变化；通过底部从蓝色至红色的曲线表示强相互作用变化，并且将最强相互作用(潜在远端增强子元件)突出显示并标记为E1至E6。图24(f)和24(g)显示了使用覆盖600bp p16启动子区域和p16外显子1的视点2(通过限制性内切酶DpnII产生)，图24(d)和24(e)的假想模型和4C-Seq分析。

图25是脱甲基攻击中心(PrExI)中CRISPR-DiR诱导的靶向脱甲基的示意图，其引起了局部和远端染色质重新缠绕以用于基因激活。将基因沉默与转录起始位点(TSS)周围区域中的异常DNA甲基化以及异染色质结构(左上)相结合。通过CRISPR-DiR的上游启动子和内含子1区域的起始的同时靶向引起了脱甲基攻击中心的基因座特异性脱甲基，其引起局部染色质重塑和远端远程相互作用的表观遗传波动，最终导致基因座特异性激活(右侧)；

图26显示了MsgDiR6+dCas9瞬时转染单独诱导P16脱甲基和中等基因激活。图26(a)是p16基因座和靶向位置的示意图。sgRNA(无DiR)和MsgDiR6(具有R2和R5)两者通过向导G2靶向p16启动子CpG岛。图26(b)显示了甲基化敏感性PCR(MSP)数据，其显示转染后72小时在SNU-398细胞系中的p16脱甲基。空对照：转染试剂和H₂O；sgRNA：仅转染sgRNA(无DiR)或dCas9+sgRNA(无DiR)的共转染；MsgDiR6：仅转染MsgDiR6(具有DiR)或者dCas9+MsgDiR6(具有DiR)的共转染，如图26A所示。图26(c)显示了实时-定量PCR(RT-qPCR)结果，其显示了瞬时转染后72小时在SNU-398细胞中的p16基因表达。将sgRNA和MsgDiR6转染到具有和不具有dCas9的细胞中。平均值±SD，n＝3，*P<0.05；**P<0.01；***p<0.001；

图27显示了sgRNA、sgSAM和MsgDiR的最小自由能(MFE)结构和质心二级结构分析。结构显示MsgDiR6是具有相同MFE结构和质心二级结构作为sgSAM结构(MS2适体融合至sgRNA支架)的唯一设计。图27(a)显示了sgRNA(T)、sgRNA(G)、sgSAM和MsgDiR1-8的最小自由能(MFE)结构分析。通过RNAfold进行分析(79)。通过碱基配对概率对结构填色。对于未配对的区域，颜色表示未配对的概率。图27(b)显示了sgSAM和MsgDiR3-7的质心二级结构分析。MsgDiR3-7均具有与sgSAM类似的MFE结构，但仅MsgDiR6具有稳定的MFE和类似于sgSAM的质心二级结构。通过RNAfold进行分析。通过碱基配对概率对结构填色。对于未配对的区域，颜色表示未配对的概率；

图28显示了通过CRISPR-DiR诱导的靶向特异性脱甲基。图28(a)是p16基因座和区域C、区域D1、区域D2、区域D3和区域E的示意图。通过慢病毒用向导将靶向单一区域或组合区域的CRISPR-DiR全部稳定转导至SNU-398细胞中。表4中列出了(并且在以下详细说明中描述了)sgDiR向导，并且将每个区域的位置列于表5(并且描述于以下详细说明)中。图28(b)显示了p16区域D1中的脱甲基谱的结合亚硫酸氢盐的限制性酶分析(COBRA)分析。在13天处理后，分析了所有用CRISPR-DiR非靶向(GN2)对照和靶向区域D1、区域D2、区域D3和区域D1+区域D3的CRISPR-DiR转导的SNU-398细胞的区域D1甲基化。***U：未切割的样品，C：通过BstUI切割。在切割后迁移等于未切割条带的条带代表脱甲基DNA。图28(c)显示了如对于图28B所实施的p16区域D3中的脱甲基谱的结合亚硫酸氢盐的限制性酶分析(或COBRA)分析。图28(d)显示了结合亚硫酸氢盐的限制性酶分析(或COBRA)，其表明了以CRISPR-DiR靶向区域D1+区域D3 53天，p16区域C、D1、D2、D3和E中的脱甲基谱。U：未切割，C：切割。引物和限制性内切酶可见于表6。区域D1和区域D3中引起的脱甲基仅随时间延伸至中间区域D2，但是不延伸至侧接区域C或E。图28(e)显示了实时-定量PCR(RT-qPCR)结果，其显示了通过CRISPR-DiR非靶向对照、靶向区域D1+D3或者靶向区域C+E的CRISPR-DiR的SNU-398细胞中的p16基因表达。图28(f)显示了实时-定量PCR(RT-qPCR)结果，其显示了在U2OS细胞中CRISPR-DiR靶向p16区域D1+区域D3的53天期间，基因p14和基因CEBPA RNA的变化。p14在U2OS中是高甲基化且沉默的(不可检测的)，而CEBPA不是高甲基化的但是在U2OS中表达。在CRISPR-DiR靶向p16的过程期间，未观察到这两种基因的显著表达变化。平均值±SD，n＝3，*P<0.05；**P<0.01；***p<0.001；

图29显示了使用视点1(Csp6I)和视点2(DpnII)通过4C分析检测的远端相互作用。图29显示了在SNU-398细胞中，CRISPR-DiR处理13天的样品(GN2非靶向对照和靶向区域D1+区域D3)的环化染色体构象捕获(4C)-Seq分析。上半部分显示了对于视点1(Csp6I)所捕获的相互作用，而下半部分显示了对于视点2(DpnII)的相互作用。在CRISPR-DiR“区域D1+区域D3”靶向脱甲基之后，将相互作用变化对相同时间点(第13天)的非靶向对照(GN2)样品归一化，并且通过相互作用弧线以蓝色至红色的颜色表示强相互作用变化，其表示从两倍至最高变化倍数的相互作用变化倍数。对于两种视点，在顶部突出显示了具有最强相互作用的潜在远端增强子元件，从p16上游至下游(负取向)标记为E1、E2、E3、E4、E5和E6；

图30显示了亚硫酸氢盐测序PCR结果，其显示了野生型Kasumi-1和KG-1细胞中的p15启动子-外显子1-内含子1区域中的甲基化谱，按照p16中相同的模式，将低甲基化区域突出显示为区域D1和区域D3。黑色的点表示甲基化CG位点，而白色的点表示未甲基化的CG位点；和

图31显示了MsgDiR1-8构建体，以及常规和修饰的sgRNA和用作对比的sgSAM的序列。

具体实施方式

本文描述了用于基因特异性脱甲基和/或激活的方法和组合物。将理解出于旨在对于本领域技术人员说明性的目的提供实施方式和实施例，并且这些实施方式和实施例不旨在以任何方式进行限制。

在一些肿瘤抑制基因(TSG)中富含CpG的启动子的甲基化与恶性细胞中的长期基因沉默有关，因此回复这种机制的治疗方法可以提供恢复异常甲基化基因表达的策略。尚缺少低毒性且基因-特异的脱甲基试剂。

本文提供了改良的CRISPR-基平台以实现基因-特异性脱甲基和激活。对于该平台，单向导RNA(sgRNA)支架的两个突出环可以被DNA甲基转移酶1(DNMT1)相互作用RNA(DiRs)的两个茎环-样序列替换(Di Ruscio等人,2013)。DiR-修饰的sgRNA(sgDiR)可以以基因-特异性方式阻断DNMT1酶活力。如本文所描述的，使用sgDiR靶向肿瘤抑制基因P16不仅使P16成功脱甲基，同时还恢复了mRNA和蛋白表达两者，但是诱导了P16-依赖性细胞周期阻滞。使用靶向SALL4基因座的sgDiR获得了类似的结果，这支持可以将该策略用作多个基因的一般方法。在某些实施方式中，可以在追踪表观遗传调控的动态过程中使用如本文所描述的CRISPR-DiR系统，和/或所述系统可以提供通过RNA调节基因-特异性DNA甲基化的工具。在某些实施方式中，据考虑如本文所描述的CRISPR-DiR系统可以提供用于多种应用的RNA-基基因-特异性脱甲基工具，如(例如)癌症治疗和/或通过异常DNA甲基化引发的遗传性疾病的治疗。

在某些实施方式中，与常规非特异性脱甲基试剂相比，本文所描述的方法可以提供更天然和靶向的脱甲基效果，并且本文所提供的结果观察到在延长的时间段内的脱甲基和激活。显著地，如本文所描述的，发现与靶向基因组DNA的模板链相比，用所述寡核苷酸靶向基因组DNA的非模板链(有义链)提供了显著更好的基因脱甲基/激活。此外，已在来自第一内含子的基因转录起始位点(TSS)上游2Kb的研究中仔细探索了用于基因再激活的相关和/或特别有效的脱甲基靶向区域，并且结果清楚地表明不是靶向高甲基化启动子，而是与靶向基因启动子或第一外显子中的任何单一区域或者在所实施的研究中同时靶向任何其他两个区域相比，第一外显子的5'和3'的同时靶向脱甲基显著提高了基因激活。第一外显子的靶向对于P16基因激活特别有效，并且还可以很好地应用于例如SALL4激活。

本文所描述的寡核苷酸构建体的实施方式可以允许有效转录和稳定RNA结构。如本文所描述的方法可以提供使所关心的基因座脱甲基的RNA-基策略，和/或可以提供可适用于修饰和/或递送的天然且灵活的策略。据考虑在某些实施方式中，例如，如本文所描述的方法可以用于将特定TF或其他因子递送至靶向位置。

在某些实验中，据观察起始使用如本文所描述的实施方式的基因脱甲基和激活并且其在约1周后变得稳定。继续追踪处理细胞显示可以发现脱甲基和激活效果逐渐升高并且在连续稳定系或dCas9-诱导型细胞系(诱导dCas9表达3天或8天，例如)中维持至少一个月。在某些实施方式中，据考虑如本文所描述的方法可以用于探索基因表达的动态调控机制，和/或可以用于开发用于多种疾病的治疗策略。

近期的工作(Di Ruscio等人,2013)证明一类RNA，DNMT1相互作用RNA(DiRs)，以高于DNA的亲合力结合至维持DNA甲基转移酶1(DNMT1)，并且可以在调控基因组-范围的DNA甲基化谱中起到重要作用。作为模型使用，识别了甲基化敏感性基因CEBPA，来源于该位点的核非多聚腺苷酸化RNA，称为外编码CEBPA(ecCEBPA)，其以比DNA相应序列更强的亲合力与DNMT1相互作用，并且调控CEBPA位点DNA甲基化。DNMT1-RNA相互作用可以依赖于ecCEBPA，并且更通常地，依赖于RNA第二茎环样结构，借此抑制DNMT1酶活力和防止DNA甲基化。此外，基础数据表明RNA的引入能够(1)通过形成RNA-DNA三股螺旋结构靶向CEBPA位点；和(2)与DNMT1相互作用，导致CEBPA mRNA的激活和基因座脱甲基。

正在开发用于基因-特异性靶向的单向导RNA(sgRNA)-Cas9/死Cas9(dCas9)CRISPR系统。通过在Cas9基因的催化残基中引入两个点突变(D10A和H840A)，所产生的dCas9失去了核酸酶活性，但是例如可以用作将其他转录调控蛋白携带至靶标的优良平台。一些研究已尝试将转录激活/抑制域融合至dCas9或sgRNA(Konermann等人,2015,Gilbert等人,2014,Gilbert等人,2013)。已实施了结晶学研究来探索sgRNA-dCas9的原子结构(Nishimasu等人,2014)。基于晶体结构，已研究了sgRNA支架的塑性，分析了结构，并且识别sgRNA四环和茎环2伸出到dCas9-sgRNA复合物以外，其中每个茎环的4个碱基对不含与dCas9氨基酸侧链的相互作用。表明四环和茎环2序列中的替换和缺失不影响Cas9催化功能的数据进一步显示这两个区域可以耐受RNA适体(sgRNA(MS2))的添加，从而经由代替向dCas9的融合/与向dCas9的融合一起的RNA适体(称为协同激活介体(SAM))，通过招募其他功能域来增加功能(Konermann等人,2015)。然而，在本领域中仍积极探索用于基因-特异性脱甲基和激活作用的有效系统，特别是提供更天然-类型效果的那些。其他CRISPR系统似乎集中在将功能蛋白融合至dCas9(例如，dCas9-VP64；dCas9-Tet1)，例如，这可能导致产生更大的系统、递送困难的系统、不模拟天然过程的系统和/或可以具有毒性的系统。

如本文所描述的，通过将短DiR环(来自ecCEBPA的R2和R5)融合至sgRNA四环和茎环2，现已开发了改良的CRISPR脱甲基方法，其在本文中称为CRISPR-DiR(参见图14，其显示了达到可以加载到dCas9中的修饰的寡核苷酸构建体处的DNMT1相互作用RNA(DiR)与sgRNA支架的组合的实例)。

本文提供了用于基因特异性脱甲基和/或激活的方法和试剂。提供了寡核苷酸构建体，其可以与失活(死)的Cas9(dCas9)一起用于在对其有需要的细胞或受试者中提供基因特异性脱甲基和/或所关心的基因的激活。

在一个实施方式中，本文提供了寡核苷酸，其包括：

单向导RNA(sgRNA)支架部分，其中所述sgRNA的四环部分被修饰并且包含DNMT1相互作用RNA(DiR)的R2茎环，并且其中所述sgRNA的茎环2部分被修饰并且包含DiR的R5阶梯环。

如将理解的，所述靶向部分可以包含对基因内、基因附近或两者(或者在可以期望脱甲基的另一个位点)的基因组DNA的区域具有至少部分序列互补性和结合亲和力的任何适合的序列。通常，所述靶向部分可以设计以与基因组DNA的预期靶向区域具有完全或基本互补性，从而提供优良的靶标识别和结合，同时减少脱靶结合的情况。在某些实施方式中，所述靶向部分可以包含与基因组DNA的预期靶向部分具有完全互补性的序列，或者与之具有至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的同一性的序列。

在某些实施方式中，可以使用对于其他CRISPR策略所开发的方法和/或规则来设计和选择所述靶向部分。例如，使用本领域中所开发的设计规则，程序和网址对于CRISPR向导RNA的设计和分析可用。通常，对于常规CRISPR向导设计所开发的程序将为所期望的靶向区域提供向导RNA列表，所述向导RNA通常为约20nt长并且与所述靶向DNA区域100％互补，并且提供预测的中靶得分和脱靶得分。在某些实施方式中，可以以这种方式选择所述靶向部分，其旨在高中靶得分和低脱靶得分。在其中所设计的向导RNA从“G”开始的实施方式中，则考虑在本文所描述的某些实施方式中，所述靶向部分可以包含从“G”开始的20nt向导RNA序列或者由其组成。在其中所设计的向导RNA不从“G”开始的实施方式中，则考虑在本文所描述的某些实施方式中，所述靶向部分可以包含具有任选地添加至向导RNA起始处(即5'端)的额外的“G”的20nt向导RNA序列以提供21nt序列或者由其组成，特别是当期望将“G”定位在起始处以用作受U6启动子驱动的sgRNA的转录起始时，举例而言。

在某些实施方式中，通过所述靶向部分所靶向的基因组DNA区域可以是位于基因内、基因附近或两者的任何适合的区域。在某些实施方式中，所述基因组DNA区域可以包含甲基化或位于甲基化区附近的基因组DNA区域。在某些实施方式中，所述基因组DNA区域可以包含与疾病、病症或病况有关的异常甲基化的或者位于该区域附近的基因组DNA区域。在某些实施方式中，所述基因组DNA区域可以包含与癌症有关的异常甲基化的或者位于该区域附近的基因组DNA区域。在某些实施方式中，通过所述靶向部分所靶向的基因组DNA区域可以包含位于所关心的基因的启动子区域内或附近或者所关心的基因的脱甲基核心区域内或附近的基因组DNA区域。在某些实施方式中，通过所述靶向部分所靶向的基因组DNA区域可以包含位于所述基因的第一外显子的5'端处或附近的区域。在某些实施方式中，通过所述靶向部分所靶向的基因组DNA区域可以包含位于所述基因的第一外显子的3'端处或附近的区域。在某些实施方式中，可以使用至少两种寡核苷酸，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'区域。

在某些实施方式中，脱甲基核心区域可以包含覆盖所述基因的近端启动子区域、外显子1和内含子1的至少起始部分(在某些实施方式中，其可以包含内含子1中的约500nt)的基因的基因组区域。

在某些实施方式中，位于所述第一外显子的5'端处或附近的区域可以包含距所述外显子起始+/-约500nt的任何位置的区域或者其中的任何子区域。在某些实施方式中，位于所述第一外显子的3'端处或附近的区域可以包含距所述外显子末端+/-约500nt的任何位置的区域或者其中的任何子区域。位于所述第一外显子的5'端处或附近的区域涵盖了与所述第一外显子相关的近端启动子区域。位于所述第一外显子的3'端处或附近的区域涵盖了所述第一内含子的起始。在某些实施方式中，可以实施对位于所述基因的第一外显子的5'端处或附近的区域和位于所述基因的第一外显子的3'端处或附近的区域的靶向。如将理解的，在某些实施方式中，位于所述基因的第一外显子的5'端处或附近的区域可以包含上游或近端启动子区域，并且位于所述基因的第一外显子的3'端处或附近的区域可以包含内含子1起始处或附近的区域，举例而言。

在某些实施方式中，可以使用至少两种寡核苷酸，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'端处或附近的区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'端处或附近的区域；优选地其中所述第一寡核苷酸的靶向部分靶向与所述第一外显子相关的近端启动子区域处或附近的区域并且所述第二寡核苷酸的靶向部分靶向所述第一内含子起始处或附近的区域；并且任选地其中可以使用第三寡核苷酸，其中所述第三寡核苷酸的靶向部分靶向所述第一外显子的中间区域。

优选地，在某些实施方式中，可以使用至少两种寡核苷酸，一种寡核苷酸具有靶向第一外显子的5'端处或附近的区域(例如，近端启动子区域)的靶向部分，并且一种寡核苷酸具有靶向基因的第一外显子的3'端处或附近的区域(例如，内含子1的起始部分)的靶向部分，从而同时靶向脱甲基核心区域的两端。

在某些实施方式中，可以使用具有靶向基因的第一外显子的中间区域(例如，在位于一侧的近端启动子和位于另一侧的内含子1的起始之间的区域)的靶向部分的寡核苷酸。

在某些实施方式中，可以使用至少3种寡核苷酸，一种寡核苷酸具有靶向第一外显子的5'端处或附近的区域(例如，近端启动子区域)的靶向部分，一种寡核苷酸具有靶向基因的第一外显子的3'端处或附近的区域(例如，内含子1的起始部分)的靶向部分，并且一种寡核苷酸具有靶向基因的第一外显子的中间区域(例如，在位于一侧的近端启动子和位于另一侧的内含子1的起始之间的区域)的靶向部分，从而同时靶向脱甲基核心区域的两端和中间区域。

在某些实施方式中，据考虑当使用寡核苷酸的组合时，不同的寡核苷酸可以用于同时、顺序或组合施用。通常，所述寡核苷酸可以用于施用，从而它们同时或一致地起作用；然而，还考虑在某些实施方式中，可以在不同时间点或不同阶段使用不同的寡核苷酸或寡核苷酸组合以用于调控基因激活。

如将理解的，以上对所述第一外显子的5'端和3'端方向性的提及是相对于要靶向的基因的取向和方向性的，从而指明5'和3'取向是相对于非模板DNA链的方向的(按照惯例，其对应于所述基因的方向)。

在本文所描述的研究中，已发现代替靶向启动子，CRISPR-DiR可以如本文所描述的通过同时靶向区域D1和D3来诱导显著的基因激活。换言之，在本文中识别通过同时使用具有不同靶向区域的CRISPR-DiR靶向所述第一外显子的5'区域处或附近和所述第一外显子的3'区域处或附近两者，在本文所描述的研究中观察到了显著的基因激活。的确，本文中对于基因激活所识别的高效脱甲基和靶向策略不仅靶向TSS上游的上游/近端启动子(这是研究最好的区域和最流行的靶向区)，而且还靶向“近端启动子+内含子1的起始”。在以下实施例中，在p16和p15肿瘤抑制基因两者中显示了该靶向策略。此外，数据显示靶向启动子和内含子1区域两者是非常有效的，并且中间外显子1区域也是相关的。如以下实施例3中所描述的，将启动子-外显子1-内含子1(PrExI)区鉴别为具有调控作用的“脱甲基攻击中心(DFC)”。在某些实施方式中，可以单独实施对启动子区域(例如，区域D1)、外显子1(例如，区域D2)或内含子1(例如，区域D3)的靶向。在下文中所获得和所描述的结果中，当仅靶向这3个区域之一时，靶向外显子1(例如，区域D2)实际上引起了最高的基因激活。当一起靶向启动子和内含子1(例如，D1和D3)或者一起靶向启动子、外显子1和内含子1(例如，D1、D2和D3)时，获得了显著更好的激活结果，并且启动子和内含子1以及启动子、外显子1和内含子1策略之间的结果类似。因此，在某些实施方式中，可以在所关心的基因的近端启动子区域和所关心的基因的内含子1区域的起始处或附近，并且任选地另外在所关心的基因的外显子1的中间区域处或附近实施靶向(中间区域可以包含在位于一侧的近端启动子和位于另一侧的内含子1的起始之间定位的区域，从而在某些实施方式中，所述中间区域可以包含所述基因的第一外显子的一般任何区域或部分)。下文所提供的结果表明即使不靶向外显子1的中间，脱甲基可能延伸至外显子1的中间区域。

在某些实施方式中，例如，所关心的基因的外显子1的中间区域可以是或包含可以通过实验确定为由于非特异性脱甲基试剂处理而大部分或高度脱甲基的区域的外显子1的区域(例如，通过野生型和地西他滨处理的SNU-398样品的全基因组亚硫酸氢盐测序数据)。在另一个实施方式中并且举例来说，以下实施例3表明结合p16，所述基因的外显子1的中间区域可以是或包括含有用于远端增强子相互作用的CTCF结合位点的重要调控区域。在某些实施方式中，例如，所述基因的外显子1的中间区域可以是或包含基因组-范围的其他靶标的重要甲基化相关调控区域。

在某些实施方式中，据考虑来自同时靶向所述靶标基因的第一外显子的5'区域处或附近和3'区域处或附近的这些结果(参见以下实施例中靶向区域D1和D3的结果)可以应用于给定基因的其他重要调控区域的靶向，如其中一个、一些或大部分调控因子结合的调控区域。在某些实施方式中，据考虑靶向其中重要转录因子或甚至远端增强子结合的重要调控区域周围的两侧可以是期望的。在某些实施方式中，代替或除了靶向所述靶标基因的第一外显子的5'区域处或附近和3'区域处或附近两者，可以期望靶向所述靶标基因的另一个重要调控区域的5'区域处或附近和3'区域处或附近两者。在某些实施方式中，据考虑重要调控区域可以包含所述基因的启动子处或附近，所述基因的第一外显子处或附近，所述基因的第一内含子处或附近，CpG岛处或附近，另一个重要调控区域处或附近的一个或多个区域或它们的任意组合。在某些实施方式中，可以期望使用如本文所描述的CRISPR-DiR系统来靶向侧接靶标基因的一个或多个重要调控区域(如其中一个、一些或大部分调控因子结合的那些)的两侧。在某些实施方式中，所述重要调控区域例如可以包含确定为给定基因的最重要的调控区域的区域。

在某些实施方式中，所述靶向部分可以与基因内、基因附近或两者的基因组DNA的非模板链(即有义链)具有互补性和结合亲和力。因此，在某些实施方式中，所述靶向部分可以设计以靶向基因组DNA的非模板(NT)链。如以下实施例中所描述的，在所描述的研究中靶向非模板链可以提供更有效的脱甲基和/或基因激活。

在某些实施方式中，单向导RNA(sgRNA)支架部分可以包含与dCas9相容的任何适合的序列，并且其中修饰所述sgRNA的四环部分并且其包含DNMT1相互作用RNA(DiR)的R2茎环，并且其中修饰所述sgRNA的茎环2部分并且该部分包含DiR的R5阶梯环。在图2中通过说明性实施例显示了典型的未修饰单向导RNA(sgRNA)的结构，其显示了四环和茎环2区域。在本发明的寡核苷酸的sgRNA支架部分中，可以修饰所述sgRNA的四环部分并且其包括DNMT1相互作用RNA(DiR)的R2茎环，并且可以修饰所述sgRNA的茎环2部分并且该部分包括DiR的R5阶梯环。在某些实施方式中，DiR的R2和R5茎环可以来自外编码CEBPA(ecCEBPA)。在某些实施方式中，可以修饰所述sgRNA的四环部分以包括DiR的R2茎环，其包含序列CCCGGGACGCGGGUCCGGGACAG(SEQ ID NO：7)或者与之具有至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的同一性的序列。在某些实施方式中，可以修饰所述sgRNA的茎环2部分以包括DiR的R5阶梯环，其包含序列CUGAGGCCUUGGCGAGGCUUCU(SEQ ID NO：8)或者与之具有至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的同一性的序列。在某些实施方式中，所述sgRNA支架部分可以定位在所述寡核苷酸的靶向部分的3'。

如将理解的，在某些实施方式中，可以从典型sgRNA的序列在除所述四环和茎环2部分以外的一个或多个其他位置修饰所述sgRNA支架部分的序列。举例来说，在以下紧跟的实施方式中，位置R_b处的核苷酸可以从典型的U改变为A、G或C，并且R_d可以从典型的A改变为R_b的互补碱基对。据考虑如以下所描述的，例如，这种修饰可以提供受U6启动子驱动的更有效的sgDiR转录，和/或可以使所述RNA结构更稳定。

在某些实施方式中，所述寡核苷酸可以包括以下序列：

(R_a)GUUUR_bAGAGCUA(R_c)UAGCAAGUUR_dAAAUAAGGCUAGUCCGUUAUCAACUU(R_e) AGUGGCACCGAGUCGGUGC(R_f)

(式I)

其中：

R_a包含所述靶向部分，并且长度包含约20至约21个核苷酸；

并且所述靶向部分之后是sgRNA支架部分(以下划线显示)，其中

R_b是A、G或C，并且R_d是R_b的互补碱基对；

R_f是任选地存在的，并且包含多聚U转录终止序列；

或者与之具有至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的同一性的序列。

在某些实施方式中，所述寡核苷酸可以包括以下序列：

(式II)

其中R_a包含所述靶向部分，并且长度包含约20至约21个核苷酸；

在某些实施方式中，在四环部分用R2茎环修饰并且在茎环2部分用R5茎环修饰所修饰的寡核苷酸构建体可以提供未修饰的sgRNA二级结构的良好维持，并且可以通过将位置R_b处的典型“U”修饰为“G”，并且将位置R_d处的典型“A”修饰为“C”(出于与R_b的互补性)(在某些实施方式中，这还可以有助于转录效率)使该二级结构进一步稳定。据考虑当设计修饰的寡核苷酸时，原始sgRNA结构的维持可以是所期望的，从而在某些实施方式中，避免破坏所述寡核苷酸与Cas9/dCas9的结合以形成用于靶向特异性DNA区域的复合物的能力。

在某些实施方式中，可以设计所述靶向部分以靶向P16基因，并且R_a(即靶向部分)可以包括：

GCUCCCCCGCCUGCCAGCAA(SEQ ID NO：9)；

GCUAACUGCCAAAUUGAAUCG(SEQ ID NO：10)；

GACCCUCUACCCACCUGGAU(SEQ ID NO：11)；或

GCCCCCAGGGCGUCGCCAGG(SEQ ID NO：12)。

如将理解的，本文还考虑和提供了包含、编码和/或能够表达如本文所描述的任何寡核苷酸的质粒、表达载体、盒和其他序列(双链和单链DNA或RNA两者)，以及与如本文所描述的任何寡核苷酸互补或者能够与之结合的寡核苷酸。

在某些实施方式中，本文考虑和提供了包含或编码或表达如本文所描述的任何寡核苷酸、如本文所描述的dCas9或两者的质粒、表达载体、盒和其他序列。在某些实施方式中，可以提供含有或能够表达sgDiR寡核苷酸和dCas9的一种或多种质粒，并且可以通过慢病毒(例如)将其递送至细胞，在此可以将DNA序列插入细胞基因组，然后转录为sgRNA或最终翻译为dCas9。

在某些实施方式中，递送工具，如慢病毒可以用于将DNA构建体递送至细胞，然后可以将DNA转录为RNA(即如本文所描述的寡核苷酸，如sgR2R5)。在某些实施方式中，可以将sgR2R5 RNA引入或递送至细胞。当将如本文所描述的寡核苷酸引入或递送至细胞时，在某些实施方式中，可以将它们单独或与dCas9组合提供至细胞。

技术人员将认识到适合于将如本文所描述的寡核苷酸递送或另外引入至细胞和/或适合于将dCas9递送或另外引入至细胞的多种转染或递送方法、试剂和媒介物。在某些实施方式中，所述寡核苷酸、dCas9或两者可以在细胞内表达。在某些实施方式中，所述寡核苷酸、dCas9或两者可以转染、引入或递送至细胞。

可以将表达载体(病毒、质粒等)转染、电穿孔或另外引入至细胞，其然后可以表达所述寡核苷酸、dCas9或两者。作为另外一种选择，可以将寡核苷酸(如RNA寡核苷酸构建体)引入细胞，例如，通过电穿孔或转染(即使用转染试剂，如Lipofectamine^TM、Oligofectamine^TM或者本领域中已知的任何其他适合的递送试剂)或者通过本领域中已知的靶标核酸媒介物。

适合于相对短的寡核苷酸向细胞的递送或引入的方法、试剂和媒介物是熟知的。举例来说，已发展了多种策略来将基因沉默RNA(即siRNA)递送至细胞，并且据考虑这些方法还可以用于递送如本文所描述的寡核苷酸。同样，已发展了多种化学修饰来稳定RNA序列，如基因沉默RNA(即siRNA)，并且据考虑这些方法还可以用于稳定如本文所描述的寡核苷酸。举例来说，据考虑可以修饰本文所描述的任何寡核苷酸以包括一个或多个非天然核苷酸，如2'-O-甲基、2'-氟代或者其他这些修饰的核苷酸(参见，例如，Gaynor等人,RNAinterference:a chemist's perspective.Chem.Soc.Rev.(2010)39:4196-4184)。多种递送媒介物和/或试剂是本领域熟知的，其中一些是可商购的。寡核苷酸的递送策略描述于，例如，Yuan等人,Expert Opin.Drug Deliv.(2011)8:521-536；Juliano等人,Acc.Chem.Res.(2012)45:1067-1076；和Rettig等人,Mol.Ther.(2012)20:483-512。转染方法的实例描述于，例如，Ausubel等人,(1994)Current Protocols in Molecular Biology,John Wiley&Sons,New York。表达载体的实例描述于，例如，Cloning Vectors:ALaboratory Manual(Pouwels等人,1985,Supp.1987)。

如本文所提及的，相对于特定序列或其指明部分的百分比(％)同一性或者序列同一性％可以理解为在比对序列并引入缺口(如有必要)以实现序列同一性百分比最大化后，候选序列中与受试序列(或其指明部分)中的核苷酸相同的核苷酸的百分比，如使用设置为缺省值的搜索参数，通过程序WU-BLAST-2.0所产生的(Altschul等人,J.Mol.Biol.(1990)215:403-410；网址：blast.wustl.edu/blast/README.html)。举例来说，可以通过将相配的相同核苷酸数目除以报告百分比同一性的序列长度来确定同一性％。寡核苷酸比对算法，如，例如，BLAST(GenBank；使用缺省参数)可以用于计算序列同一性％。

在另一个实施方式中，本文提供了编码如本文所描述的任何一种或多种寡核苷酸的质粒或载体。

在另一个实施方式中，本文提供了组合物，其包含如本文所描述的任何一种或多种寡核苷酸和死Cas9(dCas9)。

对于Cas9和死Cas9，存在一些序列形式。对于以下实施例，首先筛选Cas9质粒的一些形式，并且鉴别具有最强切割效率的形式。然后，在编码Cas9的基因的两个催化残基中引入点突变(D10A和H840A)以制备有效的死Cas9。作为选择标志物，在dCas9之后还添加了mCherry序列。所使用的dCas9-mCherry的序列为：

ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACGCCATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGGGCGGTGAGGGCAGAGGAAGTCTGCTAACATGCGGTGACGTCGAGGAGAATCCTGGCCCAATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAG

(SEQ ID NO：14)

在另一个实施方式中，本文提供了组合物，其包含表达如本文所描述的任何一种或多种寡核苷酸、死Cas9(dCas9)或两者的一种或多种载体。

在另一个实施方式中，本文提供了组合物，其包含如本文所描述的一种或多种寡核苷酸和死Cas9(dCas9)或编码dCas9的mRNA中的任何一种或多种；或者编码如本文所描述的一种或多种寡核苷酸和死Cas9(dCas9)或编码dCas9的mRNA中的任何一种或多种的一种或多种质粒或载体。

如本领域技术人员将已知的，用于表达特定序列(核酸、蛋白或两者)的核苷酸序列可以编码或包括如以下中所描述的特征："Genes VII",Lewin,B.Oxford UniversityPress(2000)或“Molecular Cloning:A Laboratory Manual”,Sambrook等人,Cold SpringHarbour Laboratory,第3版(2001)。可以将编码特定寡核苷酸序列和/或蛋白的核苷酸序列引入适合的载体，如可商购载体。可以单独构建或使用标准分子生物学技术修饰载体，如(例如)Sambrook等人,Cold Spring Harbour Laboratory,第3版(2001)中所列。本领域技术人员将认识到载体可以包括编码可以可操作性地连接至编码所关心的寡核苷酸或氨基酸序列的核苷酸序列的所期望的元件的核苷酸序列。编码所期望的元件的这些核苷酸序列可以包括转录启动子、转录增强子、转录终止子、翻译起始子、翻译终止子、核糖体结合位点、5'-未翻译区、3'-未翻译区、帽结构、多聚腺苷酸尾和/或复制起点。适合的载体的选择可以基于一些因素，其无限制地包括引入载体的核酸的尺寸，所期望的转录和翻译控制元件的类型、所期望的表达水平、所期望的拷贝数、是否期望染色体整合、所期望的选择过程的类型或者旨在转化的宿主细胞或宿主范围。

如将理解的，载体可以包含配置用于在细胞中表达所关心的寡核苷酸或蛋白的任何适合的核酸构建体。在某些实施方式中，例如，载体可以包括适合的质粒、载体或表达盒。

本文提供了一些寡核苷酸序列。将理解除本文所提供的序列之外，还考虑了包含与本文所提供的序列互补或部分互补的序列的寡核苷酸和核酸。还将理解考虑了单链序列的双链形式，并且反之亦然。考虑了本文所提供的RNA序列的DNA形式，并且反之亦然。例如，当本文提供给定单链RNA序列时，技术人员将认识到还提供了多种其他相关寡核苷酸或核酸，如双链DNA质粒、载体或表达盒，其编码或能够编码单链RNA序列。此外，还考虑了与本文所提供的任何序列具有至少80％，至少81％，至少82％，至少83％，至少84％，至少85％，至少86％，至少87％，至少88％，至少89％，至少90％，至少91％，至少92％，至少93％，至少94％，至少95％，至少96％，至少97％，至少98％或至少99％序列同一性的序列。

如本文所描述的寡核苷酸；

如本文所描述的质粒或载体；

药物可用的载体、赋形剂、稀释剂或缓冲剂；

死Cas9(dCas9)；或者

编码死Cas9(dCas9)的寡核苷酸、质粒或载体。

在某些实施方式中，所述dCas9可以包含D10A和H840A突变。在某些实施方式中，dCas9可以包含任何适合的无催化活性的Cas9，其可以通过引入一个或多个点突变或其他变化，从而使得Cas9不能切割dsDNA，但是保留了靶向DNA的能力来完成。

如将理解的，在某些实施方式中，脱甲基可以包括通过一种或多种寡核苷酸的靶向部分靶向整个基因来全局降低基因的甲基化水平，或者在所述位点处或附近的一个或多个区域处降低。在某些实施方式中，基因的激活可以包括就转录、翻译或两者而言，基因表达水平升高。

在某些实施方式中，据考虑无论是不是编码基因的一部分，如本文所描述的CRISPR-DiR可以用于一般地使任何所关心的靶向区域脱甲基。已实施实验来检查p16附近区域(p16转录起始位点(TSS)上游2.5Kb，一直到p16 TSS下游1.2KB)。发现一旦被CRISPR-DiR靶向，每个区域可以脱甲基。例如，可以靶向区域A(p16 TSS上游2.5Kb)，或者可以靶向区域E(p16 TSS下游1.2Kb)并且脱甲基。因此，据考虑在某些实施方式中，可以或可以不选择靶向进行脱甲基的区域以提供基因激活，并且在某些实施方式中，例如，出于研究性目的，靶向与基因或基因表达无关的基因组DNA区域并使其脱甲基和/或提供不同的影响可以是所关心的。

在某些实施方式中，引入步骤可以包括向细胞提供死Cas9和所述一种或多种寡核苷酸。在某些实施方式中，可以用dCas9和所述一种或多种寡核苷酸通过(例如)转染或者通过使用递送媒介物的细胞递送来处理细胞。在某些实施方式中，可以在细胞内通过转染或者向细胞引入编码和表达所述一种或多种寡核苷酸、dCas9或两者的表达载体或质粒来表达所述一种或多种寡核苷酸、dCas9或两者。在某些实施方式中，例如，可以在细胞中从所引入的载体表达dCas9，可以作为蛋白引入细胞中(例如，通过递送媒介物递送至细胞中)或者在细胞中从所引入的mRNA表达。在某些实施方式中，例如，可以通过从编码所述一种或多种寡核苷酸的载体或质粒转录在细胞中表达所述一种或多种寡核苷酸，或者可以通过用递送媒介物转染将所述一种或多种寡核苷酸引入细胞。在某些实施方式中，例如，可以通过质粒的瞬时转染或者通过使用慢病毒制备稳定细胞系来引入寡核苷酸和dCas9。在某些实施方式中，例如，可以作为寡核苷酸-dCas9RNP复合物制备预先复合的CRISPR-DiR向导并使用如纳米孔颗粒、胞外囊泡(EV)或者红细胞胞外囊泡(RBCEV)的递送方法递送至细胞中。

如将理解的，在某些实施方式中，抑制DNA甲基转移酶1(DNMT1)的活性可以包括降低影响所述基因的DNMT1甲基化活性，其通过一种或多种寡核苷酸的靶向部分靶向整个基因来全局降低，或者在所述位点处或附近的一个或多个区域处降低。降低DNMT1甲基化活性可以包括降低或防止DNMT1的甲基化维持活性，从而所述基因可以随时间变得脱甲基和/或激活。

在某些实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以与基因内、基因附近或两者的基因组DNA的非模板链具有序列互补性和结合亲和力。

在某些实施方式中，引入步骤可以包括将所述一种或多种寡核苷酸和dCas9在细胞中转染、递送或表达。在某些实施方式中，所述一种或多种寡核苷酸可以包括本文中详细描述的一种或多种寡核苷酸。

在某些实施方式中，可以将细胞暴露于dCas9和所述一种或多种寡核苷酸至少约3天、至少约4天、至少约5天、至少约6天、至少约7天或者至少约8天的时间。在某些实施方式中，例如，可以将细胞暴露于dCas9和所述一种或多种寡核苷酸约3天至约1周的时间或者处于它们之间的任何持续时间。

通过连续稳定系，追踪细胞53天并观察到逐渐升高的脱甲基和基因表达。在大约第4-6天引起脱甲基，并且在13天后显著脱甲基。还早在第一周引起基因表达，但是在至少1周至13天或者更长时间(如果染色质结构高度封闭)发生明确且稳定的基因激活。通过dCas9诱导系统，如果诱导CRISPR-DiR处理3天或8天，则观察到逐渐升高的基因脱甲基水平以及表达，其也在第一周内开始并且在1周后变得明确且稳定。在诱导的系统中，据观察通过仅3天或8天诱导，脱甲基和基因激活作用可以维持至少1个月。

在某些实施方式中，可以在大约第4-6天引起靶向区域的脱甲基，并且所述脱甲基可以随时间而逐渐增加，并且一般可以在约1周或以上检测到稳健的基因激活，并且表达水平可以随更长的处理时间而逐渐增加，同时可以通过更长的处理而发生蛋白恢复。在诱导系统中，基因脱甲基和激活两者可以维持至少一个月，特别是如果诱导处理8天，然后结束CRISPR-DiR处理。

在另一个实施方式中，本文提供了如本文所描述的任何一种或多种寡核苷酸、质粒或载体、或组合物用于基因的靶向脱甲基和/或激活的用途。

单向导RNA(sgRNA)支架部分，其中所述sgRNA的四环部分被修饰并且包含DNMT1相互作用RNA(DiR)的R2茎环，并且其中所述sgRNA的茎环2被修饰并且包含DiR的R5阶梯环；

在某些实施方式中，所述疾病或病症可以包括在对其有需要的受试者中与由于异常DNA甲基化所造成的至少一种基因的降低表达有关的疾病或病症。举例来说，在某些实施方式中，所述疾病或病症可以包括癌症。在某些实施方式中，所述癌症可以包括其特征在于一种或多种肿瘤抑制基因的高甲基化或其他甲基化-相关失活，从而所述一种或多种肿瘤抑制基因不表达或以低水平或不充分的水平表达的癌症。在某些实施方式中，所述疾病或病症可以包括印记疾病或遗传疾病，如脆性X综合征。在某些实施方式中，所述疾病或病症可以包括癌症，其可以是MDS、乳腺癌、黑素瘤、前列腺癌、结肠癌或者通过异常DNA甲基化引发的另一种疾病。在某些实施方式中，可以靶向肿瘤抑制基因进行激活，其可以包括(例如)DAPK1、CEBPA、钙粘素1、P15或P16。对于P16，该基因在几乎所有种类的肿瘤中频繁高甲基化且沉默，如黑素瘤、前列腺癌、肝癌和结肠癌，并因此据考虑在某些实例中，可以靶向P16和/或可以治疗黑素瘤、前列腺癌、肝癌和/或结肠癌。

在某些实施方式中，治疗受试者的步骤可以包括向所述受试者施用死Cas9和所述一种或多种寡核苷酸，或者在所述受试者中表达死Cas9和所述一种或多种寡核苷酸，从而dCas9和所述一种或多种寡核苷酸能够接近所述受试者的一个或多个细胞的基因组DNA，特别是与要治疗的疾病或病症有关的所述受试者的一个或多个细胞。在某些实施方式中，可以用dCas9和所述一种或多种寡核苷酸通过(例如)转染或者通过使用递送媒介物的细胞递送来治疗受试者。在某些实施方式中，可以在所述受试者的一个或多个细胞内通过转染或者向所述一个或多个细胞引入编码和表达所述一种或多种寡核苷酸、dCas9或两者的表达载体或质粒来表达所述一种或多种寡核苷酸、dCas9或两者。在某些实施方式中，例如，可以在所述一个或多个细胞中从所引入的载体表达dCas9，可以作为蛋白引入所述一个或多个细胞中(例如，通过递送媒介物递送至细胞中)或者在所述一个或多个细胞中从所引入的mRNA表达。在某些实施方式中，例如，可以通过从编码所述一种或多种寡核苷酸的载体或质粒转录在所述一个或多个细胞中表达所述一种或多种寡核苷酸，或者可以通过用递送媒介物转染将所述一种或多种寡核苷酸引入所述一个或多个细胞。在某些实施方式中，可以向所述受试者全身或局部或两者施用所述治疗。在某些实施方式中，处理步骤可以包括将所述一种或多种寡核苷酸和dCas9在所述受试者的至少一种细胞中转染、递送或表达。

在某些实施方式中，所述一种或多种寡核苷酸可以包括如本文所描述的一种或多种寡核苷酸。

在另一个实施方式中，可以将受试者暴露于dCas9和所述一种或多种寡核苷酸至少约3天、至少约4天、至少约5天、至少约6天、至少约7天或者至少约8天的时间。在某些实施方式中，例如，可以将受试者暴露于dCas9和所述一种或多种寡核苷酸约3天至约1周的时间或者处于它们之间的任何持续时间。

通过连续稳定系，追踪细胞53天并观察到逐渐升高的脱甲基和基因表达。在大约第4-6天引起脱甲基，并且在8-13天后显著脱甲基。还早在第一周引起基因表达，但是在至少1周至13天或者更长时间(如果染色质结构高度封闭)发生明确且稳定的基因激活。通过dCas9诱导系统，如果诱导CRISPR-DiR处理3天或8天，则观察到逐渐升高的基因脱甲基水平以及表达，其也在第一周内开始并且在1周后变得明确且稳定。在诱导的系统中，据观察通过仅3天或8天诱导，脱甲基和基因激活作用可以维持至少1个月。

在另一个实施方式中，本文提供了任何如本文所描述的一种或多种寡核苷酸、如本文所描述的质粒或载体或者如本文所描述的组合物用于治疗对其有需要的受试者中与由于异常DNA甲基化所造成的至少一种基因表达降低有关的疾病或病症的用途。

在某些实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以靶向所述基因的启动子区域内或附近的位点。在某些实施方式中，所述启动子区域可以包括具有至少一些甲基化的CpG-富集区域。

在某些实施方式中，所述疾病或病症可以包括癌症。在另一个实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以靶向所述基因的启动子区域内或附近的位点，其中所述基因可以是肿瘤抑制基因。在另一个实施方式中，所述启动子区域可以包括具有至少一些甲基化的CpG-富集区域。在另一个实施方式中，所述一种或多种寡核苷酸中的至少一种的靶向部分可以靶向P16基因的区域D1或D3。在另一个实施方式中，所述一种或多种寡核苷酸可以包括具有靶向区域D1的靶向部分的至少一种寡核苷酸，和具有靶向区域D3的靶向部分的至少一种寡核苷酸，并且任选地还可以包括具有靶向区域D2的靶向部分的至少一种寡核苷酸。

区域D1可以被理解为近端启动子区域(p16转录起始位点上游200bp)，或者可以被认为是第一外显子的5'部分，GRCh38/hg38，chr9：21975134-21975333。

区域D2可以被理解为属于p16第一外显子，其在区域D1和D3中间，GRCh38/hg38，chr9：21974812-21975008。

区域D3可以被理解为第一外显子末端和第一内含子起始处的区域，或者可以被认为是第一外显子的3'部分，GRCh38/hg38，chr9：21974284-21974811。在另一个实施方式中，所述一种或多种寡核苷酸可以包括以下中的任何一种或多种：

G19sgR2R5(SEQ ID NO：1)：

G36sgR2R5(SEQ ID NO：2)：

G110sgR2R5(SEQ ID NO：3)：

G111sgR2R5(SEQ ID NO：4)：

G108sgR2R5(SEQ ID NO：5)：

G122sgR2R5(SEQ ID NO：6)：

或它们的任意组合。

在本文所描述的某些研究中，使用以下方法选择CRISPR-DiR的靶向位点。

对于基因P16和SALL4两者，用非特异性脱甲基试剂地西他滨(2'-脱氧-5-氮杂胞苷)处理细胞3天，然后对野生型细胞和地西他滨处理细胞两者进行亚硫酸氢盐Sanger-测序或者全基因组亚硫酸氢盐测序，以比较所关心的靶标基因的TSS周围脱甲基最严重的区域。假设这些脱甲基最严重的区域可以是脱甲基与基因激活相关的重要调控区域。对于P16，进一步挑选一些高度脱甲基区域并使用CRISPR-DiR单独或同时靶向这些区域。结果表明尽管靶向p16启动子或第一外显子中的单一区域可以引起靶向脱甲基和基因激活，但是同时靶向p16第一外显子的5'和3'显著且剧烈提高基因表达(值得注意的，p16第一外显子的5'和3'区域(区域D1和D3)也是通过地西他滨处理所筛选的高度脱甲基区域)。对于SALL4，测试了靶向第一外显子内的一个高度脱甲基区域。基于使用另一个系统的初步数据，还怀疑P15基因座中的类似靶向规则(即靶向第一外显子的5'和3')。

在某些实施方式中，靶向位点选择可以包括首先用地西他滨(2'-脱氧-5-氮杂胞苷)或者另一种这种试剂处理细胞，然后在重要调控区域中确定几个高度脱甲基区域(例如，启动子、CpG岛、第一外显子、第一内含子)，然后探索这些区域的靶向。不希望受理论束缚，假设a)第一外显子的脱甲基对于基因激活可以是重要的，因此靶向第一外显子两侧可以使得脱甲基更有效并延伸至中间区域以提高整个第一外显子的脱甲基；和/或b)靶向重要调控区域周围两侧，其中在某些实施方式中，重要转录因子或甚至远端增强子结合可以是期望的；和/或c)区域D1和D3两者可以是具有重要转录因子结合的重要调控区域；和/或d)直接靶向最重要的调控区域可以是期望的；和/或e)启动子CpG岛的脱甲基对于转录起始可以是重要的，而第一外显子-内含子接合点的脱甲基对于剪接可以是重要的，因此同时靶向这两个区域可以进一步提高基因激活。

由于通常在肝细胞癌(HCC)中的不利预后和缺少治疗选择以及P16在调控细胞周期中的重要作用，以下实施例中所描述的某些研究在人HCC细胞系SNU-398中使用p16来开发如本文所描述的基因-特异性脱甲基和激活工具。在CRISPR-DiR系统中，可以通过设计p16 sgRNA向导将DiR环特异性递送至p16基因座，并且在某些实施方式中，DiR环可以模拟内源DNMT1-RNA相互作用以阻断DNMT1甲基转移酶活性，借此在更天然的过程中再激活p16以使基因表达恢复至更天然的水平。因此，本文提供了用于基因-特异性脱甲基和/或基因激活的CRISPR-DiR系统。

在转录期间，RNA Pol II结合至反义链(AS)，使用反义链作为模板链(T)与互补碱基合成RNA转录本，其与有义链(S)序列，也称为非模板链(NT)相同。有义链(S)是碱基序列对应于所产生的RNA转录本的碱基序列的DNA链。因此，有义链(S)或非模板链(NT)与编码基因的基因组取向相同。当提及具有靶向某些DNA链的靶向部分的单向导RNA(sgRNA)时，它表示sgRNA的靶向部分与靶向链完全或基本互补。例如，对于具有靶向P16基因的有义链(非模板链)的靶向部分的sgRNA，sgRNA的靶向部分与P16基因的有义链(非模板链)互补，因此靶向部分序列与反义链(模板链)基本类似或相同。

如以下实施例中所示，将DNMT1相互作用RNA(DiR)短环(R2和R5)融合至CRISPR单向导RNA(sgRNA)可以通过将CEBPA-DiR转换用途为所关心的其他特异性基因座提供使所选靶向区域脱甲基和/或恢复基因表达的策略。

如本文所描述的，来自ecCEBPA的内源DNMT1相互作用RNA环可以改换用途至其他基因座(例如p16、SALL4)，其可以提供基于RNA的脱甲基和/或激活方法，并且在某些实施方式中，可以导致产生a)更天然的使基因脱甲基和激活的方式；b)更灵活的修饰系统的方式；c)用于基因特异性调控的RNA-基疗法；或其任意组合。

如本文所描述的CRISPR-DiR系统可以使用RNA作为基因-特异性脱甲基工具。对于使用RNA分子作为治疗工具是非常感兴趣的，并且该技术可以提供靶向疗法。据考虑这种方法可以提供优于现有低甲基化-基规程的优势，如：a)相对高的基因特异性；b)相对低的细胞毒性；和/或c)某些药物-基脱靶副作用的潜在不存在。控制正确位置处基因表达的能力在临床应用中可以是特别关心的。还考虑如本文所描述的工具可以用于进一步理解表观遗传调控过程和重要调控因子的鉴定以及治疗性治疗的新靶点。在某些实施方式中，据考虑如本文所描述的CRISPR-DiR系统可以提供(例如)用于疾病治疗的基于RNA的基因-特异性脱甲基工具。

在某些实施方式中，如本文所描述的CRISPR-DiR系统可以提供用于基因组-范围的特异性靶向的CRISPR-基系统。在某些实施方式中，据考虑可以提供以特异性和有效的方式对基因座的调控，其可以比基因组范围的脱甲基试剂(5aza等)毒性更低，和/或在某些实施方式中，可以在人基因组中，甚至在异染色质区域中一般地应用于任何所关心的区域。不同于5aza或其他CRISPR系统，据考虑如本文所描述的CRISPR-DiR系统可以模拟内源脱甲基和表观遗传调控过程，和/或可以在某些实施方式中，以更天然的方式使特定基因脱甲基和激活。

用非特异性脱甲基试剂处理所述细胞；

在上述方法的另一个实施方式中，非特异性脱甲基试剂可以包括地西他滨(2'-脱氧-5-氮杂胞苷)、阿扎胞苷(5-氮杂胞苷)或者另一种脱甲基试剂，如第二代脱甲基试剂(参见Agrawal等人,Nucleosidic DNA demethylating epigenetic drugs–A comprehensivereview from discovery to clinic,Pharmacology&Therapeutics,2018,188:45-79,https://doi.org/10.1016/j.pharmthera.2018.02.006，该文献以其全部内容作为参考并入本文)或它们的任意组合。

在任何上述一种或多种方法的另一个实施方式中，识别所述基因的转录起始位点周围的一个或多个区域(所述区域通过用非特异性脱甲基试剂处理而大部分脱甲基)的步骤可以包括实施基于测序的技术，如单基因座基因组亚硫酸氢盐测序、低分辨率亚硫酸氢盐测序、全基因组亚硫酸氢盐测序、AR或阵列-基策略，如Infinium Methylation EPICBeadChip，并且任选地将结果与对照未处理的细胞相比较。

在任何上述一种或多种方法的另一个实施方式中，转录起始位点周围的一个或多个区域的选择可以促进启动子处或附近、所述基因的第一外显子处或附近、所述基因的第一内含子处或附近、所述基因的第一外显子的5'区域处或附近、所述基因的第一外显子的3'区域处或附近、CpG岛处或附近、另一个重要调控区域处或附近的区域或它们的任意组合的选择。

在任何上述一种或多种方法的另一个实施方式中，所述方法还可以包括使用本文所描述的任何一种或多种使用CRISPR-DiR的方法实施靶向脱甲基和基因激活，其中所述CRISPR-DiR系统的一种或多种寡核苷酸的靶向部分对所识别的脱甲基靶向位点具有序列互补性。

如以下实施例中所述，已将靶向p16和SALL4的CRISPR-DiR系统通过慢病毒分别转导至HCC细胞系SNU-398和SNU-387，并且在以下所描述的研究中，在细胞水平在两种基因中成功实现了基因-特异性脱甲基和激活以及功能恢复。

实施例1——使用P16的初始CRISPR-DiR研究

在本实施例中，使用P16开发和测试了用于基因激活和脱甲基的改良的CRISPR/dCAS9系统。定位在CEBPA基因座(ecCEBPA)中的DiR改换用途为用于脱甲基和再激活的其他特异性基因靶标。与DNMT1(1)相互作用的RNA茎环(R2和R5)融合至单向导RNA(sgRNA)支架中的四环和茎环2以获得修饰的sgRNA(MsgRNA，图1中的sgDiR，在以下实施例3中也称为MsgDiR6)。用dCas9质粒和一个靶向P16启动子模板链的MsgRNA(使用向导G2：GCACUCAAACACGCCUUUGC(SEQ ID NO：29)，图1中作为G2sgDiR显示了具有向导G2的MsgRNA，作为靶向部分)瞬时转染其中通过启动子甲基化使P16沉默的肝细胞癌(HCC)细胞系SNU-398。

转染后72小时，在用MsgRNA处理的细胞系中通过qRT-PCR观察到P16 mRNA增加两倍(图1a)。通过结合亚硫酸氢盐的限制性酶分析(COBRA)，与用未修饰的sgRNA转染的细胞相比，还观察到了基因座的DNA甲基化的失去(图1b，c)。

图1显示CRISPR-R2R5系统通过靶向启动子CpG岛引起了中等基因激活和脱甲基。在图1(a)中，显示了sgRNA(无DiR)和sgR2R5(具有DiR)的结构、靶向位点G2和转染方法。在图1(b)中，显示了72小时处理后，每个样品中p16 mRNA的表达。在图1(c)中，显示了MSP数据，该数据显示了基因脱甲基。(缩写-sgOri：无DiR的原始sgRNA；sgR2R5：与R2,R5环融合的sgRNA；G2：向导RNA；MSP：甲基化特异性PCR)。

在本研究中，寡核苷酸构建体(MsgRNA)具有以下结构：

GCACUCAAACACGCCUUUGCGUUUUAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU

(SEQ ID NO：15)

其中加下划线的纯文本表示靶向部分，纯文本表示单向导RNA(sgRNA)支架部分，加粗文本表示已在sgRNA的四环部分引入的DNMT1相互作用RNA(DiR)的R2茎环，并且加粗且加下划线的文本表示已在sgRNA的茎环2部分引入的DNMT1相互作用RNA(DiR)的R5茎环。

这种设计允许将DNMT1相互作用RNA环引入sgRNA结构，同时保留与原始未修饰的sgRNA类似的MsgRNA的二级结构(通过RNAfold-http://rna.tbi.univie.ac.at/cgi-bin/ RNAWebSuite/RNAfold.cgi预测RNA二级结构)。在图2中显示了典型的单向导RNA(sgRNA)的结构，该结构显示了如靶标、四环和茎环2的区域。

本研究将dCas9质粒与一个MsgRNA质粒(G2sgDiR)一起瞬时转染至SNU398细胞，在不选择阳性转染细胞的情况下培养三天。向导G2靶向P16启动子的模板链(也称为反义链)中的一个位点；并且一开始出于两个原因进行选择：1)该序列是P16基因研究(3)中所使用的3个向导之一，和2)G2靶向P16启动子区域，其甲基化和脱甲基被认为是基因调控的重要因素。另外，在对P16所报道的3个向导中(3)，向导G2显示出最低的脱靶效果，如通过在https://portals.broadinstitute.org/gpp/public/analysis-tools/sgrna-design可用的在线工具所预测的，并且由于它在SAM系统中起作用，因此可以具有最高的靶向效率(3)。

如所测量的，这些初始结果实现了P16 mRNA水平的升高和基因座DNA甲基化的降低。尽管令人鼓舞，但是本研究中的P16脱甲基和激活可以是相对中等的。据考虑当评价P16mRNA表达时，本初始研究中的技术限制可能稍微提高了P16表达测量。用于评价P16再激活的qPCR引物组位于外显子1内，不覆盖外显子接合点(正向：CCCCTTGCCTGGAAAGATAC(SEQ IDNO：16)，反向：AGCCCCTCCTCTTTCTTCCT(SEQ ID NO：17))。因此，所测量的P16mRNA的两倍升高例如可以至少部分包括P16外显子1的升高，但不必需包括整个P16 mRNA或可变剪接变体。此外，在本研究中未检测到P16蛋白激活。

因此，根据本研究的结果，实施了进一步的研究、开发和加强研究以进一步改善本技术。以下实施例2详细描述了这些进一步开发的结果。

实施例2——用于基因-特异性脱甲基和激活的CRISPR-DiR

在本实施例中，相对于以上实施例1中所开发的，提高了用于寡核苷酸构建体的序列设计，包括靶向区域、向导、靶向链和sgRNA支架修饰的进一步开发以提供稳定性和/或转录效率。另外，用其中选择细胞并追踪长达53天的稳定系统替代实施例1的瞬时(72小时)系统。如本文所讨论的，观察到了CRISPR-DiR系统的稳定性和效率的改善，以及P16脱甲基和恢复的显著增强(就mRNA表达和蛋白功能两者而言)。

本实施例中所使用的稳定系统为DNA甲基化和动态表观遗传调控提供信息，因为当细胞周期和大部分细胞获得类似表型时，发生DNA甲基化变化并且变得明显。同时，稳定系统模拟并能够追踪DNA甲基化、组蛋白修饰、染色质结构等天然表观遗传调控过程。在实施例1的系统中，通过MSP观察变化，但是不能确定(例如)一周后，甲基化模式可以如何保持或改变，也不能确定动态调控过程。

同样，在本实施例中，还研究了寡核苷酸构建体的靶向部分所靶向的基因区域。值得注意地，如以下所描述的，据发现如本文所描述的CRISPR-DiR系统可以通过不仅启动子区域，而且还有第一内含子的开始处的靶向和脱甲基来提供脱甲基-基P16基因激活。P16启动子是已广泛认为是基因调控并且与异常甲基化有关的重要区域的主要区域，并且上述CRISPR-激活域(VP64、VP16等)系统通常表明了近端启动子区域中的靶向。然而，本文所描述的CRISPR-DiR系统可以模拟天然基因调控过程，并且在本文中就DNA脱甲基和基因恢复而言还表明了第一内含子区域的重要性。仍在研究第一内含子区域的调控功能，并且据考虑这些结果可以指导或帮助设计靶向基因组-范围其他基因的CRISPR-DiR向导。

还如本实施例中所述，本研究中的CRISPR-DiR系统显示出明显的链偏好，其中设计向导寡核苷酸构建体的靶向部分以靶向基因组DNA的非模板链提供了显著优于比较研究中靶向基因组DNA的模板链时所获得的那些结果的特异性基因脱甲基和激活结果。

在本文所描述的研究中，重新设计用于测量P16 mRNA水平的qPCR引物组以覆盖外显子接合点(正向：CAACGCACCGAATAGTTACG(SEQ ID NO：18)，反向：AGCACCACCAGCGTGTC(SEQID NO：19))，从而提供对P16 mRNA水平的更好评价。如图3和图4所示，并且如以下进一步详细描述的，在本实施例中，当靶向P16的区域D1(启动子)和D3(内含子1的开始)的非模板链(也称为有义链)时，CRISPR-DiR系统提供了脱甲基的P16靶向区域并且恢复了P16 mRNA以及蛋白表达。

寡核苷酸设计：

典型的单向导RNA(sgRNA)序列如下所示：

(G)nnnnnnnnnnnnnnnnnnnGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU

(式III)

并且可以在末端包括4-6个U(显示了6个)以用于U6启动子的终止序列，(还参见，图2)其中前20个碱基(加下划线的纯文本)表示靶向部分(也称为向导RNA)，其设计与靶标DNA链互补(即选择每个“n”，从而所述靶向部分基本或完全与靶标序列互补)；接着的76个碱基表示sgRNA支架部分，其在具有不同的向导RNA的典型sgRNA中是保守的并且用于招募并与Cas9/dCas9蛋白形成复合物，其中加粗以及加粗且加下划线的文本表示在本文所描述的CRISPR-DiR系统中改变或被R2和R5 DiR环序列代替的核苷酸；且最后4至6个尿嘧啶(UUUUUU)是sgRNA转录的终止信号。

根据sgRNA-Cas9/dCas9复合物的晶体结构(3，4)，sgRNA支架中的四环(GAAA，加粗，在CRISPR-DiR系统中改变为R2茎环)和茎环2(GAAAA，加粗且加下划线，在CRISPR-DiR系统中改变为R5茎环)伸出Cas9/dCas9-sgRNA核糖核蛋白复合物外，其中每个茎的远端4个碱基对(bp)完全不与Cas9/dCas9氨基酸侧链相互作用，并且显示能够被其他RNA茎环(例如，RNA适体MS2、PP7、boxB)替换(3，5)。最后4至6个尿嘧啶(黑色TTTTTT)是sgRNA转录的终止信号。

在以上实施例1中所使用的构建体具有以下结构：

(G)nnnnnnnnnnnnnnnnnnnGUUUUAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU

(式IV)

其中加下划线的纯文本表示靶向部分(即选择每个“n”，从而所述靶向部分基本或完全与靶标序列互补)，纯文本表示单向导RNA(sgRNA)支架部分，加粗文本表示已在sgRNA的四环部分引入的DNMT1相互作用RNA(DiR)的R2茎环，并且加粗且加下划线的文本表示已在sgRNA的茎环2部分引入的DNMT1相互作用RNA(DiR)的R5茎环。

在本研究中，已认识到通常转录单向导RNA的最流行的启动子是U6启动子，它是产生短RNA(shRNA、sgRNA、tRNA、rRNA 5S等)的最优RNA聚合酶III(RNAPIII)启动子。它允许以准确的5'和3'序列表达非编码RNA分子(5'以G开始，并且3'以一排的一系列T(5-6个)终止)。然而，在典型的sgRNA支架的开始位置中以及在实施例1中所使用的sgRNA支架中存在推定的POL-III终止子(4个连续的T)，其可以引起一些过早终止，因此潜在降低效率。几乎没有研究尝试修饰sgRNA支架以提高它们的稳定性。一种选择可以是通过将第四个U/T替换为A(6)或C(7)或G(7)来除去该推定的POL-III终止子(4个连续的U)。在其他系统中，U/T替换为C或者U/T替换为G可以比U/T替换为A(7)更有效地起作用。因此，在本研究中，第四个U/T(以下加粗、斜体、加下划线)被G替换，从而通过使得能够有效转录，同时保留基本相同的二级结构并降低最小自由能(MFE)来使得结构更稳定。因此，相应的A被C替换(以下加粗、斜体)以保持与“G”碱基配对。这提供了在这些研究中所使用的第二代寡核苷酸构建体设计，如下：

其中选择每个“n”，从而所述靶向部分基本或完全与所关心的靶标序列互补。

在本研究中，一些向导RNA(即靶向部分)设计以靶向P16基因的基因座的不同区域。代替如实施例1中使用向导G2靶向P16启动子的模板链，小心设计所述靶向部分以开发靶向两条DNA链的有效向导。如以下所描述的，实现了两个向导(G19和G36)靶向P16启动子(区域D1)的非模板链，而另外两个向导(G110和G111)靶向P16内含子1(区域D3)的非模板链。以下提供了序列。以下详细提供了用于确定良好靶向区域和靶向链的方法。

G19sgR2R5(SEQ ID NO：1)：

GCUCCCCCGCCUGCCAGCAAGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU

G36sgR2R5(SEQ ID NO：2)：

GCUAACUGCCAAAUUGAAUCGGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU

G110sgR2R5(SEQ ID NO：3)：

GACCCUCUACCCACCUGGAUGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU

G111sgR2R5(SEQ ID NO：4)：

GCCCCCAGGGCGUCGCCAGGGUUUGAGAGCUACCCGGGACGCGGGUCCGGGACAGUAGCAAGUUCAAAUAAGGCUAGUCCGUUAUCAACUUCUGAGGCCUUGGCGAGGCUUCUAAGUGGCACCGAGUCGGUGCUUUUUU

在本实施例中，所有其他向导(sgDiR中的靶向部分)共有相同的sgDiR支架，这与上述相同：

[向导]

其他向导序列的列表如下所示：

除进一步优化寡核苷酸设计以及靶向区域和靶向链之外，本研究还将实施例1的72h瞬时转染系统改变为稳定系统，从而允许追踪几乎两个月的P16脱甲基和激活。使用慢病毒将具有不同向导的dCas9以及sgR2R5引入SNU-398细胞，并且对mCherry(对于dCas9阳性细胞)和GFP(对于sgR2R5阳性细胞)双阳性细胞进行分选。如以上所提及的，当检查P16mRNA表达时，使用扩大外显子-外显子接合点的一对新的引物(正向：CAACGCACCGAATAGTTACG(SEQ ID NO：41)，反向：AGCACCACCAGCGTGTC(SEQ ID NO：42))，从而揭示在所测试的条件下，它花费约6-8天来引起P16脱甲基并且花费大于13天来激活P16mRNA(参见图3)。此外，通过本文所描述的稳定的CRISPR-DiR第二代系统，观察到了P16蛋白恢复及其细胞周期阻滞功能。

本研究的稳定系统为DNA甲基化和动态表观遗传调控提供信息，因为如果细胞周期和大部分细胞获得类似表型，则发生DNA甲基化变化并且变得明显。另外，稳定系统模拟并允许追踪DNA甲基化、组蛋白修饰、染色质结构等天然表观遗传调控过程。在实施例1的系统中，通过MSP观察变化，但是不能确定(例如)一周后，甲基化模式可以如何保持或改变，也不能确定动态调控过程。

结果：

图3显示了同时靶向P16区域D1和D3的CRISPR-DiR的结果，其中4个向导靶向每个区域中的两条链。图3(a)显示了靶向策略，图3(b)显示了P16表达谱，图3(c)显示了第53天中的P16蛋白恢复，图3(d)显示了通过COBRA所测量的区域D1和D3中的甲基化，并且图3(e)显示了第53天处理样品的细胞周期分析。图11显示了CRISPR-DiR处理样品的动态脱甲基过程的亚硫酸氢盐PCR测序结果，并且附有图3中所示的数据。

然后，进一步研究了CRISPR-DiR的靶向链特异性。通过靶向P16区域D1和D3的相同向导RNA，仅靶向一条DNA链的效果与靶向两条链相当。

图4显示了同时靶向P16区域D1和D3的CRISPR-DiR的结果，其中每个样品中仅靶向一条DNA链。图4(a)显示了靶向策略，图4(b)显示了P16表达谱，并且图4(c)显示了通过COBRA所测量的区域D1和D3中的甲基化谱。靶向表示向导RNA序列(即靶向部分)与靶向链互补。mRNA序列(有义链)与非模板链相同。因此，在COBRA数据中，S(有义链)是指靶向非模板链(NT)，AS(反义链)是指靶向模板(T)链。

然后，将CRISPR-DiR应用于另一个细胞系和另一个基因，以显示广泛的可应用性。

考虑到SNU-398细胞系中对于p16基因的良好结果，对于在其他细胞系和其他基因中的应用测试了CRISPR-DiR方法。U2OS人骨肉瘤细胞是良好模型，因为p14和p16基因是高甲基化的并且在该细胞系中沉默。制备了U2OS-dCas9稳定系，并且将相同的sgR2R5慢病毒转导至细胞以靶向p16区域D1和D3的非模板链。如图15所示，还对细胞追踪53天，并且分析基因表达和脱甲基。与SNU-398结果类似，p16区域D1和D3的脱甲基发生在约第8天，而mRNA激活晚几天。在U2OS细胞中，在第20天至第30天期间，p16 mRNA稳定激活，这比SNU-398细胞中更慢。不希望受理论束缚，据考虑p14基因可以是高甲基化的并在U2OS而不是SNU-398中沉默，因此p14/p16基因座中的染色质结构在U2OS细胞中比在SNU-398中更致密，因此在U2OS细胞中可能要花费更长时间来打开p16基因座并重新表达。这种系统可能对于在完整脱甲基和基因表达过程期间，进一步研究p16基因座的组蛋白修饰和染色质可接近性是所关心的。

图19显示了组蛋白标志物的ChIP-qPCR数据。通过ChIP-qPCR研究了CRISPR-DiR处理第53天的SNU-398细胞中的组蛋白标志物变化。如图19所示，在p16近端启动子区域中，存在基因激活标志物H3K4me4和H3K27ac的显著升高，同时存在基因沉默标志物H3K9me3的降低。这些组蛋白变化在p16基因座中是特异的，因为在附近的基因(P14，P15)和下游阴性区域(P16的10Kb下游)中无变化。组蛋白变化与CRISPR-DiR引起的P16脱甲基和激活一致，并且特异性也表明CRISPR-DiR是基因特异的方法。图19显示了CRISPR-DiR处理的53个细胞的组蛋白标志物ChIP-qPCR结果。图19(a)显示了ChIP-qPCR检查的组蛋白标志物的位置，P16是CRISPR-DiR靶向基因，而P14、P15、下游10Kb是附近的非靶向基因座；图19(b)显示了活性组蛋白标志物H3K4me3的富集；图19(c)显示了活性组蛋白标志物H3K27ac的富集；和图19(d)显示了沉默组蛋白标志物H3K9me3的富集。

图15显示了在U2OS细胞系中同时靶向p16区域D1和D3非模板链(NT)的CRISPR-DiR的结果。图15(a)显示了靶向策略，图15(b)显示了p16表达谱，并且图15(c)显示了通过COBRA所测量的区域D1和D3中的甲基化谱。

另外，将CRISPR-DiR方法应用于在SNU-387HCC细胞系中高甲基化且沉默的SALL4基因。一致地，将所述基因成功脱甲基并且恢复了SALL4表达以及功能(参见图16)。还观察到当靶向SALL4的非模板链(NT)时，CRISPR-DiR仅提供显著影响。

图16显示了通过向导1.6sgDiR(sg1.6，GCUGCGGCUGCUGCUCGCCC.SEQ ID NO：13)，CRISPR-DiR靶向SALL4非模板链进行脱甲基和基因激活的结果。图16(a)显示了靶向测量，图16(b)显示了SALL4 mRNA表达谱，图16(c)显示了SALL4蛋白恢复，并且图16(d)显示了对照细胞和CRISPR-DiR处理细胞的靶向区域中的脱甲基。

这些研究显示CRISPR-DiR方法不仅限于SNU-398细胞中的p16基因座，而且还可以更广泛地应用于其他细胞和基因，如通过使用另一个细胞系(U2OS)和另一个基因(SALL4)的该其他数据所示。因此，据考虑该方法可以应用于多种适合的基因。在某些实施方式中，据考虑如本文所描述的CRISPR-DiR方法可以用于进一步靶向其他基因，和/或制备用于不同靶向的向导RNA池，以扩大这种工具的用途。在某些实施方式中，CRISPR-DiR可以用于进一步理解其他基因座中的表观遗传调控。

由于某些CRISPR系统的潜在脱靶效果，进一步研究了CRISPR-DiR方法的基因座特异性。首先检查接近于p16基因座的p14、p15基因，以及远离p16的CEBPA和SALL4基因。在U2OS细胞系中，p14和p16两者是高甲基化的且沉默的，同时表达CEBPA。如图17所示，当从第0天至第51天追踪CRISPR-DiR处理的U2OS细胞时，未观察到p14的激活(不可检测的)，并且也未观察到CEBPA的显著变化。这些结果表明了CRISPR-DiR方法对靶向基因座的高度特异性。图17显示了通过CRISPR-DiR靶向51天，U2OS细胞中的CEBPA mRNA表达和p14 mRNA表达。

还研究了CRISPR-DiR影响维持的持续时间。假设一旦CRISPR-DiR诱导p16的脱甲基，则其他表观遗传调控以及可能的RNA调控可以参与动态过程以激活该基因。因此，首先研究如果一旦起始脱甲基，则取消处理，这时CRISPR-DiR效果是否可以维持。先前的结果显示CRISPR-DiR在不仅存在sgR2R5，而且还存在dCas9的情况下起作用。因此，制备了Tet-OndCas9可诱导的SNU-398细胞系，其中dCas9仅将在添加多西环素时表达。将相同的sgR2R5用于靶向区域D1和D3的非模板链(NT)，并且以这种方式，可以通过添加或取消多西环素来起始或终止CRISPR-DiR处理以控制dCas9的存在。由于在SNU-398和U2OS细胞两者中在第8天发生脱甲基，因此添加多西环素8天以引起脱甲基，然后停止添加以取消CRISPR-DiR处理，但是继续培养细胞以追踪变化。在第0天、第8天、第13天、第20天、第32天收获细胞，并且比较无多西环素的细胞、多西环素处理8天的细胞以及始终用多西环素处理的细胞。图18b显示了每个时间点不同处理的细胞的基因表达水平，并且图18c是每个样品的区域D1的脱甲基谱。发现诱导系统良好起作用，因为如果细胞从未被多西环素诱导，则在任何时间点均没有基因激活或脱甲基，同时如果始终将多西环素添加至细胞，则脱甲基和基因激活与上述非诱导系统一致。有趣地，当将使用CRISPR-DiR进行8天(多西环素添加8天)的细胞与始终进行CRISPR-DiR(始终添加多西环素)的细胞相比时，在取消药物后立即观察到p16 mRNA剧烈升高，其高于相同时间点时的始终进行CRISPR-DiR的细胞。然而，CRISPR-DiR处理8天的细胞中的p16逐渐降低至与始终进行CRISPR-DiR的细胞相同的水平。尽管多西环素处理8天的细胞中p16的表达存在升高或降低的变化，但是在取消多西环素后，p16激活和脱甲基维持超过2周。不希望受理论束缚，这些结果可以支持以下假设：一旦在基因的基因座中起始脱甲基，则可以包括一些其他调控机制以维持脱甲基照旧或者打开染色质结构，并启动基因。在取消多西环素之后观察到sgR2R5表达降低，不希望受理论束缚，这可以表明在没有dCas9的情况下，sgR2R5 RNA可能不太稳定。整体上，这些结果表明在这些研究条件下，CRISPR-DiR效果维持了约1个月。

图18显示了dcas9诱导的CRISPR-DiR系统在SNU-398细胞中的结果。图18(a)显示了靶向策略，图18(b)显示了p16表达谱，并且图18(c)显示了通过COBRA所测量的区域D1中的甲基化谱。

本文已提供了支持上述结果的详细研究和数据。

确定P16的有效靶向区域：

设法研究1)其中脱甲基将与P16激活相关的最佳靶向区域；和2)使用CRISPR-DiR设计(CRISPR-R2R5)，对于所述效果更长的时间点。

尽管理论上DNMT1抑制剂5aza和地西他滨是基因组-范围的脱甲基试剂，但是科学家已报道了功能性脱甲基区域的存在(8)。为了研究P16的功能性脱甲基区域以及这些区域与P16 mRNA表达之间的相关性，用地西他滨处理野生型SNU-398细胞3天和5天，然后如图5b所示，检查每个样品的mRNA表达。从P16基因的-2.5Kb至+1.2Kb(+1表示转录起始位点)实施亚硫酸氢盐测序PCR(BSP)以获得每个CG二核苷酸的甲基化变化。决定研究-2.5Kb至+1.2Kb区域的原因在于大部分CG二核苷酸位于该区域中。如图5a所示，将该长区域进一步分成5个子区域(区域A、B、C、D和E)，并且对于除区域B以外的所有子区域进行BSP，因为存在两个Alu重复元件，它们本身难以测序和定位。从SNU-398野生型细胞以及用地西他滨处理3天和5天的细胞提取基因组DNA，然后将3个DNA样品亚硫酸氢盐转化并通过覆盖区域A、C、D和E的4对引物PCR扩增。然后，实施TA克隆以将PCR产物克隆到载体中，并且纯化每个PCR产物的10个克隆并送去Sanger测序。检查每个子区域的甲基化水平并比较野生型SNU-398和地西他滨处理样品之间的甲基化。意外地，图5c中所示的BSP结果表明地西他滨处理3天后，脱甲基最多的区域不仅是启动子CpG岛，而且还有CpG岛下游的第一外显子区域(区域E)。该结果表明通过地西他滨的P16激活不能与CpG岛脱甲基完全相关，并且作为替代，区域E可以是重要的功能性脱甲基区或者简单地易于脱甲基区域。这与常规看法：启动子CpG岛的高甲基化与基因沉默有关不一致。然而，有趣地，在地西他滨处理5天的样品中观察到了区域D(CpG岛)中更强的脱甲基，并且脱甲基未均匀分布在区域D中。区域D的5'和3'脱甲基，而区域D的中间仍是高甲基化的。已表明SP1是积极调控P16转录的阳性转录因子之一。SP1的结合基序是GC盒。在P16启动子和外显子1区域中存在5个GC盒，并且据报道GC盒1、2、4在P16调控中起到关键作用(9)。据报导共有Sp1-结合位点以外的CG位点处的甲基化可以直接降低Sp1/Sp3结合其DNA的能力。因此，基于脱甲基和GC盒在区域D中的分布，将其进一步划分为区域D1、D2和D3。区域D1(包括GC盒1、2和3)和区域D3是高甲基化的，而区域D2(包括GC盒子4和5)未脱甲基。同时，区域A在地西他滨处理3天和5天的样品中获得了中等脱甲基。

图5显示了用2.5uM DAC处理3和5天时的SNU-398野生型细胞的甲基化和基因表达谱。图5(a)显示了P16基因座中检查甲基化的5个区域；图5(b)显示了细胞样品中的P16基因表达；和图5(c)显示了区域A、C、D和E中野生型细胞和DAC处理的细胞的亚硫酸氢盐测序数据。每个黑色或白色的点代表CG位点，黑色的点表示甲基化的C，而白色的点代表未甲基化的C。

总体上，这些BSP结果提供了P16激活不仅与启动子CpG岛(区域D1)有关，而且还与区域E、D3和A有关的重要信息。具体地，区域E可以是优良靶向区域，因为区域E中发生的脱甲基甚至比区域D1、D3和A中的更早且更强。并且通过G2向导RNA靶向的上述区域D1(参见实施例1)可能不是最有效的靶向区域，特别是如果仅追踪细胞3天。然而，不可以排除以下可能性：区域D1、D3和A中的脱甲基也是重要的，从而它们更难脱甲基并且可能需要等待更长时间。此外，在P16转录起始位点周围的短区域内追踪甲基化，并且基因组-范围的甲基化谱可以提供有关高度脱甲基区域和即使使用基因组-范围的脱甲基试剂难以脱甲基的区域的其他信息。

因此，对于野生型SNU-398细胞和地西他滨处理3天的细胞实施完整的基因组亚硫酸氢盐测序(WGBS)。通过WGBS数据所示的P16的-2.5Kb至+1.2kb的脱甲基区域与BSP数据一致。当将该细胞系的RNA-seq、H3K27me3 CHIP-seq和WGBS数据组合在一起时，获得了在SNU-398细胞中沉默的基因以及它们在转录起始位点周围的脱甲基区域的列表。该信息对于靶向其他基因或制备sgRNA池以靶向不同基因以用于CRISPR-DiR诱导的脱甲基和激活可以是有用的。

对于P16区域A、D、E，可以设计单独和同时具有靶向这些区域的向导RNA的CRISPR-DiR，但是在技术上，决定首先靶向区域E并且追踪CRISPR-DiR处理的细胞更长时间，因为BSP结果显示即使使用高浓度的地西他滨处理，P16的脱甲基不如一开始所认为的快。据信CRISPR-DiR的脱甲基机制基于DNMT1的阻断，其对于脱甲基需要几个周期。另外，在临床上，即使对于MDS使用5'aza可能需要几个月来起反应。

CRISPR-DiR靶向区域E进行脱甲基：

为了靶向区域E并且追踪处理的细胞更长时间，设计了靶向区域E的两条DNA链的一些向导RNA，然后实施体外切割测定以测试每个向导的效率。挑选G113和G114以引导CRISPR-DiR靶向区域E中的模板链(T)，同时选择G115、G116以靶向相同基因座中的非模板链(NT)(参见图6(a))。将所有这些sgR2R5寡核苷酸构建体(G113sgR2R5、G114sgR2R5、G115sgR2R5、G116sgR2R5)制备为慢病毒，并单独(一个细胞系中一个向导)或一同(同样混合G113sgR2R5、G114sgR2R5、G115sgR2R5、G116sgR2R5慢病毒)转导至野生型SNU398和SNU398-dCas9稳定系。将sgR2R5转导至野生型细胞和dCas9稳定细胞两者中的原因在于期望研究是否可能需要dCas9脱甲基和激活或者只要sgR2R5就可以提供脱甲基和/或激活。

将RFP信号用于分选dCas9阳性细胞，而将GFP信号用于检查sgR2R5的成功整合。在制备SNU398-CRISPR-DiR稳定系之后，将这些CRISPR-DiR靶细胞培养3个月，并在几个时间点分析P16表达以及脱甲基。qPCR结果(参见图6(b))和结合亚硫酸氢盐的限制性酶分析(COBRA)结果(参见图6(c))表明通过混合4个向导RNA使CRISPR-DiR靶向区域E的确成功激活P16表达并引起区域E的脱甲基。值得注意的，靶向模板和非模板链两者的4个向导RNA的混合物比仅一个向导RNA在P16mRNA激活中更好地起作用，并且CRISPR-DiR与dCas9一起的作用要好得多，这是因为如果仅将sgR2R5转导至野生型SNU-398中而无dCas9，则没有检测到基因激活或脱甲基(图7)。

图6显示了通过4个混合的向导RNA(G113、G114、G115、G116)靶向P16区域E的CRISPR-DiR的结果。在图6(a)中，显示了靶向策略；在图6(b)中，显示了追踪3个月的P16表达谱；在图6(c)中，显示了通过COBRA测量的第0天、第天、第28天和第41天中的CRISPR-DiR处理样品的甲基化。红色箭头表示未消化的DNA，它是不可以被切割的脱甲基DNA。在图6(d)中，显示了靶向区域E 41天后区域D1中的甲基化；在图6(e)中，显示了靶向区域E 41天后区域D2中的甲基化；和在图6(f)中，显示了靶向区域E 41天后区域D3中的甲基化。

图7显示了使用相同向导RNA，但无dCas9时CRISPR-DiR靶向区域E的结果。“未加载”表示没有加载足够的样品；然而未加载的样品是未切割的对照，因此未切割的条带信息仍可以得自其他未切割的样品，但是所有未切割的DNA的长度应该是相同的。

意外地，结果表明脱甲基和基因激活两者需要相对长的时间来起始和保持稳定。从第8天，CRISPR-DiR诱导区域E轻微脱甲基，并且在第28天及之后，诱导更明显的脱甲基。然而，P16 mRNA表达从第28天开始并且在第41天之后已显著并稳定升高。考虑到P16的高甲基化和异染色质结构，假设CRISPR-DiR需要几个细胞周期来靶向P16并起始脱甲基，然后区域E中的脱甲基可以进一步导致附近区域的DNA脱甲基或者起始最终将打开染色质结构并在随后的时间点激活mRNA转录的其他组蛋白修饰变化。

为了测试该假设，首先检查了CRISPR-DiR靶向8天、28天和41天的样品的CpG岛区域(D1、D2和D3)的脱甲基。如图6(d)、6(e)和6(f)所示，当CRISPR-DiR靶向区域E时，区域E的脱甲基从第8天开始并逐渐升高。当在第41天，区域E的脱甲基相当强，并且在该时间点，还观察到区域D1的轻微脱甲基以及区域D2和D3中更强的脱甲基。该结果表明DNA脱甲基可以缓慢延伸至附近区域或者可能延伸至重要的转录调控区域。因此，这可以是所关心的系统以研究特异性基因座的动态表观遗传调控(DNA脱甲基延伸、功能性脱甲基区域、组蛋白修饰变化和染色质可接近性变化等)。

CRISPR-DiR靶向区域E和A进行脱甲基：

在靶向区域E数月后，注意到即使它的确引起了脱甲基和基因激活，探索其他区域对于获得有关重要脱甲基和调控区域的补充理解以及获得最大基因恢复也是所关心的。基于BSP结果(参见图5c)，在地西他滨处理后显示出脱甲基的其他区域包括区域A、D1和D3。在这三个区域中，似乎区域A比D1和D3更早脱甲基。另外，根据脱甲基从区域E延伸至附近区域(区域D2、D3获得明显的脱甲基，而D1轻微脱甲基)，提出了以下问题：共同靶向区域E和A是否更好，从而可以靶向通过地西他滨获得脱甲基的两个区域，并且这两个区域的脱甲基可能能够延伸至区域D，因为它们处于区域D的5'和3'位置。

因此，设计并筛选了靶向区域A DAN的两条链的一些向导RNA，并且挑选了靶向模板链(T)的向导G100、G101和靶向非模板链(NT)的G102、G103(有关序列参见上表)。此外，对这4种sgR2R5(G100sgR2R5、G101 sgR2R5、G102sgR2R5、G103sgR2R5)制备了慢病毒(有关序列参见上表)，并且将它们共同实施于SNU-398-dCas9细胞系或者通过CRISPR-DiR靶向区域E 53天的细胞系。以这种方式，获得了具有1)仅靶向区域A的CRISPR-DiR，2)仅靶向区域E的CRISPR-DiR和3)靶向区域E和A两者的CRISPR-DiR的细胞系。然后，将细胞培养另外一个月以比较通过不同靶向的影响。然而，如图8(b)、8(d)所示，尽管仅靶向区域A的确导致区域A脱甲基，但是它不能有效激活mRNA表达，并且脱甲基仅在区域A中，而不在区域E中。如果共同靶向区域A和E，则两个区域脱甲基，但是靶向E和A的基因激活水平与仅靶向区域E相同。这表明CRISPR-DiR能够使任何靶向区特异性脱甲基，但是这种脱甲基不必需导致基因激活。因此，尽管通过地西他滨处理使区域A脱甲基并且也可以通过CRISPR-DiR使区域A脱甲基，但是该区域的脱甲基可能不与P16表达相关，因为它可能不是P16的功能性脱甲基区域。

图8显示了对于每个区域通过4种混合的向导RNA靶向P16区域E，或区域A，或区域E+A的CRISPR-DiR。图8(a)显示了靶向策略；图8(b)显示了P16表达谱；图8(c)显示了通过COBRA测量的CRISPR-DiR处理样品的区域E中的甲基化，对区域E靶向72天，而区域A靶向19天；和图8(d)显示了靶向区域E后的区域A中的甲基化，对区域E靶向72天，而区域A靶向19天。

尽管通过靶向区域A未进一步提高激活，但是本文的结果提供了有价值的信息：1)CRISPR-DiR可以脱甲基并仅使靶向区域脱甲基(尽管脱甲基可以在随后的时间点延伸，这可能是由于其他表观遗传过程)；和2)可以通过在关键区域中靶向脱甲基来实现CRISPR-DiR起始的P16激活(区域A可以提供阴性对照)。

CRISPR-DiR靶向区域E和D1进行脱甲基：

尽管区域A不是强靶向区域，研究了区域D1、D2和D3，因为1)它们是启动子-外显子1CpG岛区，其已报道与基因表达相关；2)区域D1和D3的确在地西他滨处理5天后脱甲基；3)区域E的脱甲基在随后的时间点(第41天)延伸至区域D1、D2和D3；和4)在这些区域中存在一些GC盒，其可能对于SP1结合以及P16表达是重要的。因此，从区域D1开始研究这三个区域。

设计并筛选了靶向区域D1 DAN的两条链的几个向导RNA，并且选择了靶向模板链(T)的向导G2、G82和靶向非模板链(NT)的G19、G36(有关序列参见上表)。对这4种sgR2R5(G2sgR2R5、G19sgR2R5、G36sgR2R5、G82sgR2R5)制备了慢病毒(有关序列参见上表)，并且将这些共同实施于SNU-398-dCas9细胞系或者通过CRISPR-DiR靶向区域E83天的细胞系。以这种方式，获得了具有1)仅靶向区域D1的CRISPR-DiR，2)仅靶向区域E的CRISPR-DiR和3)靶向区域E和D1两者的CRISPR-DiR的细胞系。然后，将细胞培养18天以比较通过不同靶向的影响。在对于区域D1转导sgR2R5慢病毒之后第6天、第15天、第18天获得了细胞样品，并且分析了非靶向对照细胞(GN2)、区域D1靶向细胞、区域E靶向细胞和区域E和D1两者靶向细胞的基因表达和脱甲基。有趣地，尽管仅靶向区域D1未显著过多激活P16表达，但是靶向E和D1的组合的确显著高于仅靶向区域E提高了基因表达(图9b)。就脱甲基而言，获得了靶向区域D1第18天的样品，并且在该时间点，靶向区域E 92天。实施结合亚硫酸氢盐的限制性酶分析(COBRA)测定以检查在区域D1和区域E中发生的脱甲基。靶向区域E和D1两者导致两个区域中脱甲基，而靶向区域E主要使区域E脱甲基，区域D1中仅有非常微弱的脱甲基。然而，有趣地，仅靶向区域D1不仅导致区域D1脱甲基，而且还导致区域E脱甲基，尽管如果通过CRISPR-DiR靶向该区域，则区域E中的脱甲基甚至更强(图9c)。值得注意的，当靶向D1时，在第18天清楚地观察到了这种从区域D1延伸至区域E的脱甲基，因此延伸的起始可能更早，并且检查更早的时间点以及区域D2、D3可能为这种脱甲基延伸提供甚至进一步的理解。

图9显示了对于每个区域通过4种混合的向导RNA靶向P16区域E，或区域D1，或区域E+D1的CRISPR-DiR。在图9(a)中，显示了靶向策略；在图9(b)中，显示了P16表达谱；在图9(c)中，显示了通过COBRA所测量的CRISPR-DiR处理样品的区域E和区域D1中的甲基化，对区域E靶向92天，而区域D1靶向18天。

本研究观察到通过靶向区域D1和E两者的CRISPR-DiR所提高的P16激活，尽管仅靶向区域D1不能良好起作用。当靶向区域D1 18天时，区域D1和E两者脱甲基，从而显示了脱甲基的延伸过程。这些结果表明区域D1的重要作用，并且导致进一步研究了区域D2和D3以进一步理解这些区域。

CRISPR-DiR靶向区域E、D1、D2、D3进行脱甲基：

设计并筛选了靶向区域D2和D3 DAN的两条链的一些向导RNA，并且选择了靶向区域D2的模板链(T)的向导G107、G123，靶向区域D2的模板链(T)的G108、G122，靶向区域D3的模板链(T)的G109、G112和靶向区域D3的非模板链(NT)的G110、G111。对于这8种sgR2R5(G107sgR2R5、G108sgR2R5、G122sgR2R5、G123sgR2R5、G109sgR2R5、G110 sgR2R5、G111sgR2R5、G112sgR2R5)产生慢病毒，并且将它们转导至一些细胞系，从而获得了具有1)仅靶向区域D1的CRISPR-DiR，2)仅靶向区域D2的CRISPR-DiR，3)仅靶向区域D3的CRISPR-DiR，4)仅靶向区域E的CRISPR-DiR，5)靶向区域E和D1两者的CRISPR-DiR，6)靶向区域D1和D3两者的CRISPR-DiR，7)靶向区域D2和D3两者的CRISPR-DiR，8)靶向区域D1、D2和D3的CRISPR-DiR的细胞系。

选择3个时间点来检查基因表达，尽管不在相同时间CRISPR-DiR处理每个区域。如图10(b)所示，仅靶向区域D1或者D2或者D3不会明显激活P16，而仅靶向区域E起始了中等基因表达。然而，靶向区域D1和E两者提高基因表达，而共同靶向D1、D3或D1、D2、D3的组合导致了最高的激活。注意，尽管在早期时间点，共同靶向D1、D2、D3具有比靶向D1和D3更高的基因表达，但是基因表达水平在随后的时间点变得相同。另外，将第二时间点的样品用于研究区域C、D1、D2、D3和E的脱甲基。当通过CRISPR-DiR靶向该区域时，每个区域获得脱甲基，并且如果靶向全部D1、D2和D3时，区域C和E也脱甲基。此外，结果表明1)CRISPR-DiR可以诱导基因座特异性脱甲基，2)区域D中的脱甲基可以延伸至侧接区域，和3)关键调控区域中的脱甲基导致基因激活。

图10显示了P16区域E、D1、D2和D3或者区域D1的CRISPR-DiR靶向。通过4种混合的向导RNA靶向每个区域。在图10(a)中，显示了靶向策略；在图10(b)，显示了P16表达谱；在图10(c)，显示了通过COBRA所测量的区域D1中的甲基化；在图10(d)中，显示了通过COBRA所测量的区域D3中的甲基化；在图10(e)中，显示了通过COBRA所测量的区域E中的甲基化；在图10(f)中，显示了通过COBRA所测量的区域C中的甲基化。靶向区域E 116天，靶向区域D1 33天，靶向区域D2 28天，靶向区域D3 13天。红色框突出显示即使不直接靶向，区域C和E脱甲基。

多个区域靶向结果表明在所有区域中，区域D1和D3可能是关键区域，其中脱甲基与最高基因激活相关。因此，通过CRISPR-DiR，对于P16脱甲基和激活鉴别了高度有效的所识别的靶向区域。基于所有这些研究和结果，发现CRISPR-DiR系统是非常有趣的，因为它不仅将内源RNA环改换用途以使另一个基因座特异性脱甲基并恢复基因表达，而且它可以模拟更天然的脱甲基和表观遗传调控过程，其可以提供追踪从沉默基因的脱甲基开始的整个表观遗传调控和转录机制。因此，该系统用于研究基因调控的动态变化。这些研究主要集中在区域D1和D3上以制备同时靶向多个区域的新型稳定细胞系，并且从CRISPR-DiR处理最开始追踪细胞。

所识别的用于最有效的P16脱甲基和激活的靶向区域D1和D3的CRISPR-DiR：

由于识别了特别有效的CRISPR-DiR设计(sgR2R5-dCas9)和特别有效的靶向区域(D1和D3)，因此将所有具有靶向区域D1和D3的向导的sgR2R5(G2sgR2R5、G19sgR2R5、G36sgR2R5、G82sgR2R5、G109sgR2R5、G110sgR2R5、G111sgR2R5、G112sgR2R5)(有关序列参见上表)转导至SNU398-dCas9稳定细胞系。转导sgR2R5的时间为第0天，并且将细胞培养53天以研究基因表达和脱甲基过程。

CRISPR-DiR成功诱导P16脱甲基并恢复基因表达和功能两者：

在第0天、第3天、第6天、第8天、第13天、第20天、第30天、第43天和第53天检查了区域D1和D3靶向细胞的P16表达和脱甲基。qPCR结果显示在第13天P16 mRNA表达稳定激活，并且在整个过程中逐渐提高(图3b)。图3d中所示的COBRA数据表明区域D1脱甲基在第6天开始，而区域D3脱甲基在第8天开始。还检查了未靶向的附近区域(区域C、D2和E)中的脱甲基。如图12所示，5'侧接区域C在整个过程中无脱甲基，而3'侧接区域E从第20天开始获得部分脱甲基。对于中间区域D2，尽管未直接靶向，它从第8天开始脱甲基。当同时在区域D1和D3中靶向细胞时，已重复了成功的P16脱甲基和激活，并且一致地，在mRNA表达之前发生基因脱甲基，并且脱甲基可以延伸至附近区域，其假设通过基因激活过程经历脱甲基是更容易且重要的。值得注意的，脱甲基从区域D向E的中等延伸需要一个月来发生，并且区域C在53天追踪期内未脱甲基，这与BSP数据一致(图5c)：即使用地西他滨处理3或5天，区域C未脱甲基。这表明如果在某些区域中，而不是在整个启动子中实现脱甲基并且CRISPR-DiR诱导的脱甲基是高度基因座特异性的，则可以实现P16激活。可以实施基因组范围的甲基化分析和RNA-seq以进一步研究脱靶效果。

图3显示了同时靶向P16区域D1和D3的CRISPR-DiR，其中4个向导靶向每个区域中的两条链。图3(a)显示了靶向策略；图3(b)显示了P16表达谱；图3(c)显示了第53天中的P16蛋白恢复；图3(d)显示了通过COBRA所测量的区域D1和D3中的甲基化；并且图3(e)显示了第53天处理样品的细胞周期分析。图11显示了CRISPR-DiR处理样品的动态脱甲基过程的亚硫酸氢盐PCR测序结果，并且附有图3中所示的数据。

图12显示了如通过COBRA所测量的，在整个53天CRISPR-DiR处理期间，在区域C、D1、D2、D3和E中的甲基化谱。同时靶向p16区域D1和D3的CRISPR-DiR，其中4个向导靶向每个区域中的两条链。

P16是重要的细胞周期调控因子，其减缓了细胞从G1期向S期的进程。因此，由于已在这些研究中成功激活了P16 mRNA，并且观察到D1、D3靶向细胞的更缓慢的生长，因此进一步检查了P16的功能恢复。收获了具有最高基因表达的第53天的细胞，并且研究了蛋白恢复以及细胞周期。如图3c所示，在具有靶向区域D1和D3的CRISPR-DiR的第53天的细胞中，而不是在相同时间点的非靶向对照细胞中重新表达P16蛋白。另外，与相同天数的非靶向细胞相比，在靶向细胞中观察到了G1期群体的升高以及S和G2群体的降低(图3e)。因此，CRISPR-DiR诱导的脱甲基不仅起始了mRNA表达，而且还起始了基因功能恢复。

CRISPR-DiR具有链特异性：

CRISPR-DiR优选靶向基因非模板链以用于脱甲基和激活：

然后，进一步研究了本文所描述的CRISPR-DiR方法的链特异性。一开始，考虑到DNMT1在半甲基化DNA中维持DNA甲基化的作用，将向导RNA设计用于区域E，靶向两条DNA链。当在4个向导的混合物以及单一向导之间比较脱甲基和基因激活的影响时，据观察4个向导RNA的混合物比任何单一向导更好地起作用，因此在以下实验中使用了4个gRNA的混合物以靶向两条链。随后，认识到最有效的向导是靶向区域D1和D3，而不是靶向区域E的那些。

因此，然后比较了仅靶向一条DNA链和靶向两条链的效果。用在区域D1和D3域中，以与P16(S)相同的基因组取向靶向(与之互补)有义链(非模板链，NT)的4个sgR2R5慢病毒(G19、G36、G110、G111)或者在区域D1和D3域中以反义(模板链，T)方向(AS)靶向(与之互补)的4个sgR2R5慢病毒(G2、G82、G109、G112)(有关序列参见上表)新转导SNU-398-dCas9稳定细胞。意外地，在追踪所处理的细胞的20天期间，仅通过靶向S链(非模板链，NT)的CRISPR-DiR(第二代)观察P16激活。有义链(非模板链)sgR2R5靶向细胞中的P16的表达水平甚至比S和AS gR2R5两者所靶向的那些更高。相反，在AS(模板链靶向)gR2R5靶向细胞中，仅存在非常微弱的基因激活。在两种细胞系中进一步分析了DNA脱甲基的程度。对于两种DNA链，当靶向S链(非模板)时，区域D1和D3是高度脱甲基的，而当仅靶向AS链(模板)时，区域D1中仅存在微弱的脱甲基并且在区域D3中无脱甲基。对于两种DNA链实施COBRA以检查相同区域中的甲基化并且获得了相同的结果。这些结果排除了以下可能性：CRISPR-DiR(第二代)仅使AS(模板)链脱甲基，其显示仅靶向区域D1和D3中的S(非模板)链的CRISPR-DiR在两条链中诱导基因脱甲基并因此起始mRNA激活。

图13显示了同时靶向p16区域D1和D3的CRISPR-DiR的结果，其中每个样品中仅靶向一条DNA链。图13(a)显示了靶向策略；图13(b)显示了p16表达谱；并且图13(c)显示了通过COBRA所测量的区域D1和D3中的甲基化谱。靶向表示向导RNA序列与靶向链互补。mRNA序列(有义链)与非模板链相同。因此，在COBRA数据中，S(有义链)是指靶向非模板链(NT)，AS(反义链)是指靶向模板(T)链。

在本研究中，研究了一些CRISPR-DiR结构设计以识别特别有效的CRISPR-DiR设计(即sgR2R5-dCas9)和特别有效的p16的靶向区域(即D1和D3)。将所有具有靶向区域D1和D3的向导的sgR2R5(G2sgR2R5、G19sgR2R5、G36sgR2R5、G82sgR2R5、G109sgR2R5、G110sgR2R5、G111sgR2R5、G112sgR2R5)(有关序列参见上表)转导至SNU398-dCas9稳定细胞系(参见图3)。转导sgR2R5的时间为第0天，并且将细胞培养53天以研究基因表达和脱甲基过程。在这些研究中，CRISPR-DiR成功诱导p16脱甲基并恢复基因表达和功能两者。在第0天、第3天、第6天、第8天、第13天、第20天、第30天、第43天和第53天检查了区域D1和D3靶向细胞的p16表达和脱甲基。qPCR结果显示在第13天p16 mRNA表达稳定激活，并且在整个过程中逐渐提高(图3b)。图3d中所示的COBRA数据表明区域D1脱甲基在第6天开始，而区域D3脱甲基在第8天开始。还检查了未靶向的附近区域(区域C、D2和E)中的脱甲基。如图12所示，5'侧接区域C在整个过程中无脱甲基，而3'侧接区域E从第20天开始获得部分脱甲基。对于中间区域D2，尽管未直接靶向，它从第8天开始脱甲基。当同时在区域D1和D3中靶向细胞时，已重复了成功的p16脱甲基和激活，并且一致地，在mRNA表达之前发生基因脱甲基，并且脱甲基可以延伸至附近区域，据考虑其通过基因激活过程经历脱甲基可能是更容易且重要的。值得注意的，脱甲基从区域D向E的中等延伸需要一个月来发生，并且区域C在53天追踪期内未脱甲基，这与BSP数据一致：即使用地西他滨处理3或5天，区域C未脱甲基。这表明可以通过在某些区域中，而不是在整个启动子中的脱甲基来提供p16激活，并且CRISPR-DiR诱导的脱甲基可能是高度基因座特异性的。

在CRISPR-Cas9系统中，通过与基因组靶标位点互补的通常20nt的单向导RNA(sgRNA)将具有核酸酶活性的Cas9蛋白引导至基因组基因座(11，12)。Cas9-sgRNA复合物将靶标双链DNA解开并引起sgRNA与靶标DNA的碱基配对，并且随后使得在靶标DNA处双链断裂(DSB)以用于基因敲入或敲除应用。因此，通常在这些应用中不存在靶向链选择性。就死Cas9(dCas9)而言，它是Cas9的核酸酶-缺陷型突变体，在RuvC和HNH核酸酶域中具有突变，并且保留了与sgRNA形成复合物的能力和通过sgRNA引导的DNA-结合能力(13)。在真核细胞中用于基因转录调控的大部分CRISPR-dCas9系统中，将dCas9与一些调控域融合以加强转录激活或抑制。为了促进转录，已将激活域，常用作效应子来上调真核细胞中的基因表达(14)，如VP64(VP16的4个拷贝)、p65、VP160(VP16的10个拷贝)、VP192(VP16的12个拷贝)和合成GCN4肽的串联重复(SunTag)融合至dCas9蛋白：即dCas9–VP64、dCas9–p65、dCas9-VP160、dCas9-VP192和dCas9–SunTag(15，16)。通过sgRNA将这些激活域引导至特异性基因座并增强哺乳动物细胞中靶向内源基因的表达(17-19)。为了抑制转录，可以将Kruppel-相关盒(KRAB)域(20)和mSin3相互作用域的4个拷贝(SID4X)融合至dCas9(dCas9-KRAB和dCas9-SID4X)以作为转录抑制系统。然而，以上CRISPR-Cas9/dCas9系统中无一基于链-特异性，如对于本发明所描述的CRISPR-DiR系统所发现的。的确，靶向模板或非模板链通常对其他系统中的基因调控显示出相同的效果。明显地，已对于本发明所描述的CRISPR-DiR系统发现了链特异性/优选性，并且其可以用于提供特别有效的脱甲基和/或基因激活。

基于天然修饰的gRNA，本发明所描述的CRISPR-dCas9系统实现了特异性基因脱甲基和激活，并且显示出非模板链选择性/优选性。如图4所示，在相同时间点，与靶向相同区域的模板和非模板链两者的gRNA(向导RNA G19、G36、G110、G111与非模板链互补，而向导RNA G2、G82、G109、G112与模板链互补)相比，靶向P16区域D1和D3的非模板链(向导RNAG19、G36、G110、G111与非模板链互补)导致了更高的P16表达(图4A)。重要地，靶向模板链的向导RNA(向导RNA G2、G82、G109、G112与模板链互补)不在区域D3中引起显著脱甲基，并且区域D1中的脱甲基非常弱，且对P16 mRNA表达无影响。

尽管脱靶效应可能在一定程度上，在某些条件下是可能的，但是在本发明的研究中，当通过CRISPR-DiR靶向p16时，分析了接近于p16(p14和p15)或者远离靶向区域(CEBPA、SALL4)的一些基因的甲基化和mRNA表达水平，并且在任何这些基因座中，数据显示无变化。

本文所描述的CRISPR-dCas9 DiR系统基于使用天然现有序列的sgRNA修饰，而无需将蛋白融合至dCas9，并且在本文所描述的研究中已发现当靶向非模板链，而不是模板链时，表现明显更好。当设法设计对于脱甲基和/或基因激活特别有效的寡核苷酸构建体时，CRISPR-DiR的非模板链特异性/优选性可以提供重要设计规则。在本文中，观察到本发明所开发的CRISPR-DiR系统是使用DNMT1相互作用RNA短环阻断特定位点处DNMT1甲基转移酶活性的基因-特异性脱甲基和激活工具。

DNA甲基化异常在癌症疾病中起到重要作用。已研究了开发脱甲基试剂(阿扎胞苷、地西他滨)来治疗高甲基化相关疾病，但是对于基因座缺少特异性以及高度毒性带来了困难。特异性的RNA种类(DNMT1相互作用RNA，DiR)能够通过茎环结构结合至DNMT1并且保护多种DiR-表达基因座以避免甲基化和沉默。如本文所描述的，现已作为基因-特异性脱甲基和激活工具开发了CRISPR-DiR系统。在这种系统中，将DNMT1相互作用RNA(DiR)茎环融合至单一CRISPR向导RNA(sgRNA)支架中。因此，DiR环可以被递送至特异性基因座并与DNMT1相互作用以阻断甲基转移酶活性。通过设计特异性靶向p16启动子CpG岛以及第一外显子的CRISPR-DiR向导，使p16成功脱甲基并且使该肿瘤抑制基因mRNA和蛋白表达以及SNU-398HCC细胞系和U2OS骨肉瘤细胞中的细胞周期阻滞功能恢复。有趣地，CRISPR-DiR诱导的脱甲基需要1周来发生，而基因转录的起始需要甚至更长时间。因此，据考虑该方法可能不仅提供了强大的基因座特异性脱甲基工具，而且还可以更密切地模拟更天然的脱甲基过程，这可以允许进一步追踪整个调控过程。另外，CRISPR-DiR对SALL4基因的成功应用表明本发明所描述的系统可以是用于多个基因的一般方法。

通过ChIP-qPCR研究了CRISPR-DiR处理第53天的细胞中的组蛋白标志物变化。如图19所示，在p16近端启动子区域中，存在基因激活标志物H3K4me4和H3K27ac的显著升高，同时存在基因沉默标志物H3K9me3的降低。这些组蛋白变化在p16基因座中是特异的，因为在附近的基因(P14，P15)和下游阴性区域(P16的10Kb下游)中无变化。组蛋白变化与CRISPR-DiR引起的P16脱甲基和激活一致，并且特异性也表明CRISPR-DiR是基因特异的方法。

如本文详细描述的，现已作为基因-特异性脱甲基的RNA-基工具开发了CRISPR-DiR。对于使用RNA分子作为治疗工具具有很大兴趣(Kole等人,2012,Reebye等人,2014)。据考虑在某些实施方式中，如本文所描述的方法可以提供优于现有的低甲基化-基规程的益处。例如，据考虑在某些实施方式中，可以提供高基因特异性；低细胞毒性(相对于某些其他药物)；和/或c)某些药物-相关的脱靶副作用的不存在。在临床应用中，控制正确位置处的基因表达可以是特别关心的，并且还考虑如本文所描述的工具可以用于进一步研究表观遗传调控过程和/或用于鉴定关键调控因子和/或治疗性治疗的靶标。在某些实施方式中，如本文所描述的CRISPR-DiR系统可以提供(例如)用于疾病治疗的基于RNA的基因-特异性脱甲基工具。

实施例3——靶向基因内脱甲基引起染色质重新缠绕(Chromatin Rewiring)以用于基因激活

根据以上实施例1和2的结果，本实施例进一步研究和描述了Crispr-DiR和基因激活。实施例1和2的结果(以下重复)和本实施例所述的其他结果表明通过CRISPR-DiR的基因座脱甲基重塑了染色质结构并且特异性地再激活了其同源基因。

本实施例中的结果表明了以下直接证据：代替仅甲基化的近端启动子，覆盖近端启动子-外显子1-内含子1(PrExI)区域的专用“脱甲基攻击中心(DFC)”通过引起局部表观遗传修饰和500kb远端染色质重塑两者的波动而与基因再激活更相关(参见图25)。该发现通过CRISPR-DiR以基因座特异性方式得到证实，其通过基于RNA的甲基转移酶活性阻断逆转了靶向区域的甲基化状态。

转录起始位点周围区域中的异常DNA甲基化是癌症中基因沉默的标志。在本领域，目前批准的脱甲基试剂缺乏特异性并且显示出高毒性。已频繁报道异常DNA甲基化，特别是转录起始位点上游5'启动子区域中的甲基化与癌症中肿瘤抑制基因的沉默有关。然而，脊髓发育不良综合征中包括非特异性低甲基化试剂，如5氮杂胞苷的研究尚未证实与该上游区域的脱甲基和基因再激活良好相关。另外，尚不清楚哪些其他潜在的元件与启动子区域一起作用，从而导致基因座特异性DNA脱甲基，进而造成基因激活，或者不清楚其他局部和远端染色质重塑事件是否由短功能性基因内区域的脱甲基起始。不清楚这些问题的原因之一在于上述可以有效引起靶向特异性脱甲基并允许下游内源表观遗传调控过程的基因座特异性脱甲基工具的缺乏。

本实施例使用基因座特异性脱甲基系统CRISPR-DiR提供了对这些问题的新的理解。介导肿瘤压制基因的甲基化的DNA甲基转移酶I(DNMT1)以基因选择性方式受某些非编码RNA调控并且可以通过某些非编码RNA抑制(ncRNA，其被称为DNMT1相互作用RNA或者DiR)，并且所述相互作用基于RNA二级茎环结构(Di Ruscio等人,Nature,2013)。在CRISPR-DiR系统中，短DiR茎环已插入CRISPR单向导RNA(sgRNA)支架，并因此可以改换用途至几乎任何靶向位点进行脱甲基。在本实施例中，使用报道最多的高甲基化肿瘤抑制基因之一p16作为模型，CRISPR-DiR对转录起始位点周围一些不同区域的应用显示重要的表观遗传调控功能位于上游启动子区域和基因内外显子1-内含子1区两者中。该近端启动子-外显子1-内含子1区域(PrExI)的特征在于“脱甲基攻击中心(DFC)”，其起始表观遗传波动以重塑局部组蛋白修饰和远端染色质相互作用两者，并因此恢复基因表达。

的确，本实施例显示使用p16基因作为实例，启动子-外显子1-内含子1(PrExI)区域的靶向脱甲基引起了局部染色质重塑和远端远程相互作用的表观遗传波动，从而导致了基因座特异性激活。通过开发其中专门编辑的向导以基因座特异性方式阻断甲基转移酶活性的CRISPR-DiR，本实施例表明脱甲基与表观遗传和拓扑变化相联系。这些结果表明了专用“脱甲基攻击中心(DFC)”的存在，其可以通过用于基因座特异性转录激活的可修改和选择性RNA-介导方法打开。

DNA甲基化是涉及转录调控、正常细胞发育和功能的重要表观遗传机制(29)。大多数发生在CpG二核苷酸内的甲基添加是由3种主要的DNA甲基转移酶(DNMT)家族成员催化的：DNMT1、DNMT3a和DNMT3b。大量研究已在异常DNA甲基化和疾病中基因沉默之间建立了联系(30，31)。

肿瘤抑制基因(例如，p16、p15、MLH1、DAPK1、CEBPA、CDH1、MGMT、BRCA1)沉默通常与异常5'CpG岛(CGI)DNA甲基化(32)有关，并且它被认为是大部分(如果不是全部)癌症的标志(33)。由于70％注释的基因启动子与CGI重叠(34)，因此本领域中的大部分研究仅集中在CpG岛启动子甲基化和转录抑制的相关性，特别是集中在转录起始位点(TSS)上游紧邻区域(30，35-37)，但是忽视了显示TSS下游区域的调控重要性的一些研究(38，39)。因此，基因内甲基化对基因表达的调控重要性和机制尚不清楚。常规脱甲基试剂在实验和治疗上的应用有限，因为它们无差别地作用于整个基因组(40)。因此，能够选择性调节DNA甲基化的方法代表了用于基因座特异性表观遗传调控及其研究的有效方法，并且是恢复病理学状况中通过DNA甲基化异常沉默的基因的表达的潜在无毒治疗选择。

表观遗传控制取决于DNA甲基化、组蛋白修饰、核小体定位以及它们各自参与特异性拓扑域形成的遗传对应物：DNA、RNA和远端调控序列之间的精细相互作用(41)。这种结构化组织是基因激活或抑制两者的驱动力(42)。尚不清楚基因座特异性DNA脱甲基促进染色质结构重排，从而造成沉默基因的激活的程度。在本领域，促进未处理和局部特异性脱甲基的方法的缺乏已成为理解使得基因座能够特异性激活的后续机制方面的主要限制。

先前，我们组(43)鉴别了抑制DNMT1酶活力并且以基因座特异性方式保护避免基因沉默的RNA，并将其称为DNMT1相互作用RNA(DiR)。这种相互作用依赖于RNA茎环-样结构的存在，并且在所述结构不存在时失去这种相互作用。如本文所描述的，通过将DiR的脱甲基特征与CRISPR-死Cas9(dCas9)系统的靶向性质组合，已开发了CRISPR-DiR平台来引起准确的基因座特异性脱甲基和激活。DiR-诱饵向单一向导RNA(sgRNA)支架的掺入使得能够将RNA DNMT1相互作用域递送至所选位置，同时招募dCas9(36，44，45)。

在本实施例中选择了p16以进一步测试CRISPR-DiR平台，因为它是癌症中最经常被启动子甲基化沉默的第一肿瘤抑制基因之一(46)。如所描述的，据观察不仅在上游启动子中，而且还在外显子1-内含子1区域中基因-特异性脱甲基引起稳健的逐步过程，随后获得活性染色质标记(例如，H3K4Me3和H3K27Ac)，甲基化敏感性调控因子的富集(例如，CTCF)和与远端调控元件的相互作用，最终导致了稳定的基因座转录激活。整体上，这些研究表明作为对RNA-介导的控制起反应并且控制基因座转录激活的“脱甲基攻击中心”发现并开发了专用启动子-外显子1-内含子1区域，从而阐明了基因内外显子1-内含子1脱甲基对于活性基因转录的先前未知的重要性。

CRISPR-DiR系统的开发：

在以上实施例1和2中详细描述了CRISPR-DiR系统的开发。在本文中进一步描述了8种不同设计的初始筛选结果，其表明具有R2-R5设计的CRISPR-DiR系统(如以上实施例1和2中所使用的那些)是优选且有效的设计。如所示的，肿瘤抑制基因p16(也称为p16^INK4a、CDKN2A)是通常在几乎所有癌症类型，包括肝细胞癌(HCC)中被异常DNA甲基化沉默的第一基因之一(32、47、48)，并因此将其选择作为研究基因-特异性脱甲基影响的模型。Cas9/dCas9-sgRNA-DNA复合物的二级结构的研究，包括原始系统，如CRISPR-SAM(36)和CRISPR-Rainbow(44)的发展表明sgRNA支架的四环和茎环2是RNA适体，如MS2和PP7可替换的，同时不损害所述复合物的稳定性或其功能性。如本文所讨论的，对应于ecCEBPA DiR的R2和R5的短环序列的掺入(43)可以使得能够以基因-特异性方式结合和抑制DNMT1(参见图20A)。测试了一些R2/R5-四/茎环2设计(参见图20B)，以获得平台，其中1)sgRNA-dCas9复合物结构是稳定的；和2)递送有效的脱甲基和基因激活。从在其他研究中成功使用的向导序列(G2)开始(36)，设计了修饰的sgRNA(MsgDiR)，其中四环和茎环体现了靶向p16近端启动子(参见图20C)的R2和R5 DiR环(参见图20B)的不同组合。如所示的，测试了8种不同设计。图31和表3中显示了序列。将dCas9与未修饰的sgRNA(无DiR环)或修饰的MsgDiR共转染至其中p16甲基化并沉默的SNU 398，HCC细胞系中。转染后72小时，仅MsgDiR6模型引起p16脱甲基(参见图20D)。具有或不具有dCas9的MsgDiR6在细胞中通过非靶向对照向导(GN2)或p16向导(G2；定位至p16启动子区域)进行脱甲基的进一步验证(参见图26A、26B)证实p16在dCas9阳性细胞中具有中等激活，而在不存在dCas9时未观察到效果(参见图26C)。有趣地，将DiR环R2引入sgRNA四环并将DiR环R5引入sgRNA茎环2的MsgDiR6(参见图20B、20E，此后称为sgDiR)是能够形成相容的预测和功能性二级结构的唯一结构，如对于原始sgRNA和sgSAM所报道的(参见图27A、27B)(36，45)，表明当在sgRNA设计中编辑突出的环时，保持原始结构是所期望的。预测的dCas9-R2R5系统的二级结构更接近于原始Crispr系统，从而表明，例如，就靶向而言，dCas9-R2R5可以相对更稳定和/或有效。CRISPR-DiR平台引起基因座特异性脱甲基。结果表明在所测试的系统和条件下，功能性RNA向sgRNA四环和茎环2中的一些融合不是强激活剂，然而具体地，MsgDiR6是该组表现最好的构建体。

CRISPR-DiR展开p16转录激活子核心：

尽管初始分析确认了基因座特异性脱甲基，但是通过靶向转录起始位点(TSS)上游的p16近端启动子的sgDiR(G2)仅观察到了中等mRNA激活(参见图26C)。寻求理解是否除启动子以外，基因座内其他基因内区域的脱甲基对于转录激活是所期望或重要的。为了识别脱甲基-反应性元件，决定通过全基因组亚硫酸氢盐测序(WGBS)分析用低甲基化试剂地西他滨(DAC)处理的SNU-398细胞的甲基化组。还如以上实施例2所描述的，预期在良好研究的上游启动子区域(区域D1，包括从p16 TSS起的-199至-1碱基对(bp)之间)中脱甲基。然而，在p16外显子1中(区域D2，相对于TSS从+1至+456bp)和内含子1的前200bp中(区域D3，包括相对于TSS从+457至+663bp的区域)检测到更高程度的脱甲基，表明基因内区域脱甲基和基因激活之间的潜在相关性(还参见图21A，21B)。为了检验D2和D3区域对基因激活的贡献，设计了对区域D1、D2或D3特异的多个sgDiR，其单独靶向单一区域或者组合靶向多个区域(参见图21C)。单独靶向每个区域的sgDiR(参见图21C，28A)可以引起一定程度的脱甲基(参见图28B，28C)和RNA生产(参见图21D)，其中靶向区域D2的CRISPR-DiR导致p16 RNA大于2倍的增加(参见图21D)。

还研究了系统优化，特别是相对于靶向策略和靶向5'近端启动子和3'起始内含子1区两者。在本实施例中所描述的研究中，还研究了是否a)同时靶向区域D1+D2+D3，或者b)靶向侧接潜在“种子”区D2的5'和3'端两者(区域D1+D3)中的脱甲基，其将导致大于任何单独各个区域的基因激活。的确，靶向区域D1+D2+D3或者区域D1+D3的CRISPR-DiR的组合作用在p16 RNA中引起了比靶向任何单一区域显著更大的升高。靶向区域D1+D3实现了与靶向全部区域D1+D2+D3一样大的基因激活(参见图21D)，因此代表了最简单且最有效的基因激活靶向策略。

还描述了Crispr-DiR和近端启动子+内含子1起始的靶向策略向另一个重要且高甲基化肿瘤抑制基因p15的应用。如所描述的，为了研究脱甲基-基因再激活最相关区域，将p16转录起始位点(TSS)周围区域分成区域D1(TSS上游近端启动子)、区域D2(外显子1)和区域D3(内含子1的起始)。比较通过单独或组合靶向这些区域的基因脱甲基和p16再激活效率，观察到尽管靶向这3个区域中的每一个引起了一定水平的p16激活，但是区域D1(上游启动子)中的脱甲基与基因激活的相关程度不是最大(图21A、21C、21D)；相反，靶向区域D1+D2+D3或者区域D1+D3的CRISPR-DiR的组合作用在p16 RNA中引起了比靶向任何单一区域显著更大的提高(图21D)。靶向区域D1+D3实现了与靶向全部区域D1+D2+D3一样大的基因激活(图21D)，因此代表了最简单且最有效的基因激活靶向策略。

总体而言，这些结果证明基因的核心表观遗传调控元件不必需包含在TSS上游启动子内，但是通过下游外显子1和相邻内含子1区域放大。作为CRISPR-DiR诱导的脱甲基和基因激活的有效靶向策略，证实了“区域D1+D3”靶向策略或者靶向“近端启动子+内含子1的起始”，而不是仅集中在近端启动子的大多数其他策略。

基于CRISPR系统的基因组-范围的特异性靶向能力，CRISPR-DiR脱甲基和基因激活系统可以通过设计与靶向位点互补的特异性向导用于几乎任何靶向位点。以上实施例描述了CRISPR-DiR对另一个基因座SALL4的成功应用，从而支持了CRISPR-DiR基因组-范围的广泛使用。进一步研究了1)CRISPR-DiR是否还可以应用于另一个肿瘤抑制基因，和2)靶向“近端启动子+内含子1的起始”的策略是否不仅对于p16基因座有效，而且还对其他基因座有效。为了确定该情况，已将另一个重要的肿瘤抑制基因p15用作模型。p15是MDS和AML中最经常通过异常启动子甲基化沉默的基因(约60-70％，在继发性AML中达到80％)(30，32，84)。显著地，p15启动子甲基化与不良预后有关并且与MDS发展为AML相关(84)。p15在临床治疗方案中的成功重新表达可能不仅导致对白血病细胞的控制，而且还可能改善免疫系统的抗-白血病功能。为了测试脱甲基-基因表达最相关区域，对于野生型AML细胞系Kasumi-1和覆盖p15基因座中整个近端启动子-外显子1-内含子1区起始(PrExI)的KG1(大于90个CpG位点)实施了亚硫酸氢盐测序PCR(BSP)(图30)。据报道p15在Kasumi-1和KG1细胞系两者中是高甲基化的，同时与KG1相比，Kasumi-1具有更高的p15表达基础水平并且更易于脱甲基(81)。因此，假设p15在Kasumi-1中的甲基化低于KG-1。一致地，BSP结果显示Kasumi-1中的p15的甲基化低于KG1，并且更重要地，未甲基化区域正好是近端上游启动子(区域D1)和内含子1的起始(区域D3)。这表明在另一个肿瘤抑制基因p15中，脱甲基-基因表达最相关区域还符合p16基因座中发现的模式，它是“近端启动子+内含子1的起始”或者“区域D1+D3”(图30)。

总体而言，这些结果证明基因的核心表观遗传调控元件不必需包含在TSS上游启动子内，但是通过下游外显子1和相邻内含子1区域放大。

用于基因激活的CRISPR-DiR介导的基因内脱甲基(区域D1和D3中引起的脱甲基可以延伸至中间外显子1区域)：

在稳定表达CRISPR-DiR的细胞中p16转录模式需要超过一周开始变化(参见图21D)的观察结果提示我们追踪p16脱甲基在延长的时间内的动态变化。因此，通过在SNU398细胞中递送最有效的靶向策略D1+D3，对p16脱甲基和各个基因表达追踪53天。亚硫酸氢盐测序PCR(BSP)分析显示从区域D1和D3起始的脱甲基从第8天及之后逐渐升高，并且在第13天延伸至中间D2区域(参见图22A，22B)。一致地，p16 mRNA表达在第13天之后显著升高(参见图22C)，并且p16蛋白水平在第20天之后达到峰值(参见图22D)，从而表明CRISPR-DiR在转录激活和蛋白表达之前引起脱甲基。显著地，未观察到脱甲基“延伸”至周围区域(区域C和E)(参见图28A，28D，28E)，从而表明CRISPR-DiR介导的脱甲基可能受限，并且延伸仅在调控核心区域(D2)内(49)。为了证实这种效果不限于单一细胞系，将CRISPR-DiR递送至U2OS，具有沉默的p16的人骨肉瘤系(参见图22E，22F)，并且在脱甲基谱和RNA表达中观察到了类似趋势。另外，在相邻p14基因(位于p16上游20Kb，其也甲基化且无可检测的表达)或CEBPA(位于另一个染色体上并且活性表达)的RNA中未检测到变化，借此支持所述方法的选择性(参见图28F)。

靶向基因内脱甲基引起染色质重塑：

为了更好地评价一旦起始，通过CRISPR-DiR的脱甲基是否是持久效果，产生了稳定表达Tet-On dCas9的SNU-398细胞系，其中可以有条件地诱导dCas9并且通过多西环素添加表达(还参见以上实施例2)。在快至3天的诱导处理内，观察到p16脱甲基和激活并且其持续至少一个月(参见图23A，23B)。这些发现以及我们先前证实脱甲基和RNA在接近2个月内的稳定升高的观察结果(参见图22B，22C)表明了由初始脱甲基事件和基因激活所造成的其他表观遗传变化的潜在涉及。

因此，假设启动子-外显子1-内含子1(PrExI)脱甲基核心区域内的DNA甲基化的丧失将有助于组蛋白变化和染色质构造以用于基因激活。为了在这两个事件之间建立直接相关性，在野生型和CRISPR-DiR处理的(D1+D3)SNU-398细胞中与定量PCR结合实施了使用抗激活组蛋白标记H3K4Me3和H3K27Ac或者抑制标记H3K9Me3的抗体的染色质免疫沉淀(ChIP)(ChIP-qPCR)(参见图23C)。在p16 PrExI脱甲基核心区域内，在第8天至第13天之间观察到了H3K4Me3和H3K27Ac标记的富集，其与H3K9Me3沉默标记的进行性丧失负相关(参见图23D，23E)，这证实了以下假设：脱甲基可以是CRISPR-DiR诱导的第一个事件(第8天)，随后在沉默标记丧失的同时转录激活标记增加(第8-13天)。

局部诱导的脱甲基对引起远端远程相互作用是重要的：

大部分结合至p16启动子的转录因子对DNA甲基化敏感(33，50，51)，因为DNA甲基化将防止接近它们的识别位点。因此，提议在CRISPR-DiR诱导覆盖启动子-外显子-内含子1的PrExI区域内的脱甲基后，转录因子可以重新获得接近并且能够结合至该区域。使用基序分析工具TFregulomeR(52)(与大量ChIP-seq数据概要有关的TF结合位点分析工具)，在5种不同细胞系间发现了外显子1中的CTCF(CCCTC-结合因子)结合峰(参见图24A)，以及其他预测结合位点(参见图24B)。CTCF是染色质结构的主要调控因子，它可以起到绝缘子的作用，以限定染色质边界并介导环的形成，因此促进或抑制转录(53)。此外，CTCF是p15-p14-p16基因座的正调控因子(51，54)并且可以通过DNA甲基化替换(55，56)。这使得我们测试了CRISPR-DiR-介导的脱甲基是否可以恢复CTCF结合。的确，据观察在CRISPR-DiR诱导后13天，在800-bp脱甲基核心区域中富集CTCF(参见图24C)，这是发生强脱甲基的时间点(参见图22B，23E)。这种发现支持通过脱甲基恢复CTCF结合的模型，从而有助于在第13天后p16mRNA表达的增强。

一些研究已报道p16增强子区域位于p16 TSS上游～150千碱基(kb)(57-59)。然后，尚未研究与p16基因座的远程相互作用以及基因座特异性脱甲基的影响。进一步提议CRISPR-DiR-诱导的脱甲基和所产生的CTCF结合将在远端调控元件和p16基因座之间引起远程相互作用，并因此使得染色质结构重新缠绕并促进基因转录。为了评价DNA甲基化丧失对p16基因座拓扑结构的影响，对CRISPR-DiR非靶向(GN2)或靶向(D1+D3)的第13天样品实施了环化染色体构象捕获(4C)。尽可能接近启动子-外显子1-内含子1脱甲基核心区域设计了两个视点(“诱饵”)：视点1，正好覆盖靶向区域D1至D3(参见图24D)；而视点2，覆盖上游启动子-外显子1区域(参见图24F)。尽管视点1提供了对靶向区域更仔细的检查，但是视点2重叠了更多的启动子。这两种视点设计使得能够分别内部验证远程相互作用，并仔细分析远端调控元件和启动子-外显子1(视点2)或者外显子1-内含子1(视点1)区域之间的不同相互作用(参见图29)。比较靶向(D1+D3)样品与非靶向(GN2)对照，检测了远端元件和p16脱甲基基因座之间的相互作用变化，其散布在包含p16靶向脱甲基核心区域(PrExI)的500kb内(参见图24E，24G，29)。对于两种视点，鉴别了通过脱甲基所起始的最强相互作用增加(参见图29)，其可以代表p16基因转录的潜在远端增强子。要注意，在通过CRISPR-DiR诱导的脱甲基的这些强相互作用中，不仅在Anril-p15-p14基因座(E3、E4)内或者p16 TSS下游大于100kb(E5、E6)处检测到了位于上游大于200kb(E1)的新型相互作用区域，而且还观察到了与先前所描述的位于p16 TSS上游～150kb处(E2)的增强子区域的相互作用(57-59)。这些结果表明了分析的可重复性和可靠性，因为在两种视点之间强相互作用重叠的非常好(参见图29)并且包括了已知的增强子区域。此外，它们表明了潜在的新型p16增强子元件并且突出了p16和相邻基因座Anril-p15-p14之间的密切相互作用。

讨论：

本实施例研究了内源RNA向新型基因座特异性脱甲基的功能化，以及在本文中称为CRISPR-DiR(DNMT1相互作用RNA)的激活技术。通过将短功能性DiR序列引入单一向导RNA支架，已开发了用于未处理和局部脱甲基和激活的可放大、可定制且准确的系统。

作为模型使用p16基因座(在癌症中频繁被DNA甲基化沉默的肿瘤抑制基因)，本实施例显示基因激活的核心表观遗传调控元件不包含在广泛研究的p16 TSS上游的CpG-富集启动子区域，而是涵盖了近端启动子-外显子1-内含子1区域(PrExI)(区域D1至D3，相对于TSS的-199至+663)。通过同时接合侧接激活子核心的5'(启动子)和3'(内含子)区域，本发明的设计提供了一致且有效的脱甲基延伸(区域D2，参见图22B)并且提供了在仅靶向直接启动子(immediate promoter)的其他CRISPR-基平台中丢失的特征(35-37，60)。有趣地，CRISPR-DiR诱导的脱甲基波动向内传播到外显子1区域中间，而在周围区域中未观察到脱甲基(区域C和E，参见图28D、28E)，尽管CpG含量较高，这与先前所表明的相反(61，62)。这些发现证实了关键调控核心区域的脱甲基如何是p16基因激活的重要条件，这也对于SALL4基因座得到证实(63)。结果表明脱甲基波动引起了逐步过程，随后是活性组蛋白标记的获得，结构蛋白CTCF(其结合至非甲基化DNA)的招募和p16基因座的染色质重构，从而最终控制与远端调控元件的远程相互作用(参见图24和25)。除了先前所报道的位于p16上游约150KB的增强子区域外(57-59)，据证实核心区域的脱甲基促进了与位于远至500kb的一些元件的相互作用，从而表明DNA甲基化的局部且非常特异性的调整可以广泛影响染色质构造和拓扑重排(参见图25)。

Lu等人,Reprogrammable CRISPR/dCas9-based recruitment of DNMT1 forsite-specific DNA demethylation and gene regulation,Cell Discovery,2019,5:22(80)描述了双重R2设计。然而，如上文所描述的，本文测试了具有R2/R2构造的构建体并且它在本文所测试的条件下不是有效的，并且与将DiR环R2引入sgRNA四环并且将DiR环R5引入sgRNA茎环2的MsgDiR6相反，它表现不好。另外，本文所描述的研究显示单独的启动子中的脱甲基与强基因表达不能良好相关(Lu等人关注靶向转录起始位点(TSS)上游的近端启动子)，特别是当与本文所描述的其中通过靶向基因“近端启动子+内含子1的起始”所观察到的显著提高的基因激活的策略相比时，该策略不仅应用于p16，而且还应用于p15，显示了通用性和广泛或基因组-范围的可应用性。Lu等人，2019中的基因靶标含有非常有限数目和稀疏分布的CpG位点，从而表明了可能更易于接近和调控的更开放的染色质结构。Lu等人的靶标基因中的CG密度为每100bp仅1个CpG位点(靶向区域中约4个CG位点)，而在本发明的研究中所靶向的基因p16具有非常致密的CG比(800bp区域中63个CG位点，因此每100bp约9个CpG位点)和封闭的染色质结构。在大部分真沉默的肿瘤抑制基因的情况下(例如，p16、p15)，在TSS周围存在超致密CG位点和异染色质结构，这使得该区域难以接近或脱甲基。如本文所描述的，已使用稳定细胞系和可诱导系统配置而不是瞬时转染，使用真、难以脱甲基和激活的基因实例(p16-非常致密的CG比和封闭的染色质结构，类似于大部分肿瘤抑制基因)而不是其他易于调控的基因，开发并测试了本发明所描述的CRISPR-DiR系统，从而支持本发明所描述的系统甚至对于致密CG位点和异染色质结构也是可靠且有效的工具。在本文所描述的实验中，在评价脱甲基和基因激活两者的严格测试中，本发明所描述的Crispr-DiR系统还恢复了蛋白表达和基因功能。在本文中还观察到了本发明所描述的CRISPR-DiR诱导系统的持续影响(通过核心PrExI区域(启动子-外显子1-内含子1)中的CRISPR-DiR靶向的脱甲基所诱导的组蛋白修饰和远端相互作用)。如本文所描述的CRISPR-DiR系统的高效率以及本文所靶向的真实调控的核心PrExI区域(启动子-外显子1-内含子1)两者支持广泛或基因组-范围的靶向策略，其甚至对于对CpG大量富集且高度甲基化的基因座(并因此在异染色质状况下)也可以有效作用。如本文所描述的，Crispr-DiR还恢复蛋白表达以及基因功能。

本实施例描述了基于RNA的CRISPR-DiR技术的进一步开发和优化，以使功能性RNA节段改换用途为特异性靶向位点并以基因座特异性方式操纵甲基化谱、表观遗传标记和基因表达。同样，提供了仅上游启动子区域中的脱甲基与基因激活微弱相关的直接证据，而整个启动子-外显子1-内含子1区域(PrExI)中的脱甲基显著提高基因转录。实施例2显示靶向SALL4基因5'UTR-外显子1-内含子1区域的CRISPR-DiR有效恢复基因表达与功能。因此，PrExI靶向区域和“脱甲基攻击中心(DFC)”机制可以是基因组-范围的常规机制。本文中的结果阐明了800bp“脱甲基攻击中心(DFC)”的脱甲基起始了DNA甲基化、组蛋白修饰和染色质重塑之间相互作用的重塑波动。这种逐步过程包括局部脱甲基、活性染色质标记的获得(例如，H3K4Me3和H3K27Ac)、甲基化敏感调控因子的富集(例如CTCF)以及与远至500kb的假定远端调控元件的相互作用，从而最终导致产生了稳定的基因座转录激活。通过CRISPR-DiR脱甲基所观察到的远端相互作用包括先前报道的p16增强子元件和p16的新型增强子候选两者。的确，新鉴定的远端相互作用还表明Anril-p15-p14-p16区域内的自调控机制。结果突出显示了通过将功能性内源RNA融合至CRISPR系统，将基于RNA的DNA甲基化调控改换用途至任何所选择的基因座的可能性，从而支持(例如)用于癌症及其他疾病的RNA-基基因-特异性脱甲基疗法。

靶向区域D1+D3为p16基因座基于Crispr-DiR的脱甲基和激活提供了增强的靶向策略，这可能(不希望受理论束缚)是通过在“种子”区域(例如，外显子1的中间区域)内从两侧引起脱甲基波动进行的，这不仅在整个核心区域中引起脱甲基而且还将脱甲基延伸至中间种子区域，因此使用最少数目的sgDiR实现了高度激活，其还可以由于较少的靶标而提供降低的脱靶风险。

总之，本发明的数据显示了CRISPR-DiR诱导的约800bp中保留的小核心元件的脱甲基如何能够传播远至500kb，从而证实了基因内转录起始子核心的存在，所述起始子核心控制基因激活，同时起到协调染色质相互作用的多种因子的作用。CRISPR-DiR引起的基因座特异性800bp脱甲基使500kb染色质结构重新缠绕。不仅在上游启动子中，而且还在基因内外显子1-内含子1区域中的用于局部和远端染色质重塑和基因激活的脱甲基表明了用于基因调控的新型调控机制和靶向策略。这在其中多种重要肿瘤抑制基因沉默和甲基化的癌症中可以是特别重要的。临床上正在使用常规一般脱甲基试剂，但是它们的效力受到它们缺少特异性的阻碍。结果支持(例如)用于甲基化研究、靶向候选筛选和用于RNA-基疗法的CRISPR-DiR基因-特异性脱甲基和激活平台，其以基因座特异性方式起作用。结果表明所述系统是坚实、可重复且有效的，并且其甚至可以应用于具有异染色质结构的致密高甲基化肿瘤抑制基因座(例如，p16)。结果显示一旦诱导短至3天，则所述系统将脱甲基和基因激活效果维持超过一个月。该技术的特征可以(例如)帮助鉴定用于临床应用的新型靶标、开发替代性基于脱甲基的筛选平台和设计伴有DNA甲基化的癌症或其他疾病的治疗方法。

材料和方法：

细胞培养

将人肝细胞癌(HCC)细胞系SNU-398在补充有10％胎牛血清(FBS)(Invitrogen)和2mM L-谷氨酰胺(Invitrogen)的洛斯维帕克纪念研究所1640培养基(RPMI)(LifeTechnologies,Carlsbad,CA)中培养。将人HEK293T和人骨肉瘤细胞系U2OS维持在补充有10％胎牛血清(FBS)的达尔伯克氏改良伊格尔培养基(DMEM)中。如ATCC建议，将所有细胞系维持在37℃，具有5％CO₂的加湿气氛中，并且如果未另外说明，在不存在抗生素的情况下培养。

RNA分离

按照生产商的说明，使用AllPrep DNA/RNA Mini试剂盒(Qiagen,Valencia,CA)提取并用无RNA酶的DNA酶组(RNase-free DNase Set，Qiagen)处理总RNA，或者用TRIzol(Invitrogen)分离总RNA。如果用TRIzol法进行RNA分离，则在本研究中使用的所有RNA样品均用无RNA酶的重组DNA酶I(Roche)(10U DNA酶I每3mg总RNA；37℃，1小时；在存在RNA酶抑制剂的情况下)处理。在DNA酶I处理后，用酸性酚(pH 4.3)提取RNA样品以消除任何残留的痕量DNA。

基因组DNA提取

对于BSP、MSP和COBRA测定，通过AllPrep DNA/RNA Mini试剂盒(Qiagen,Valencia,CA)提取基因组DNA，或者如果全基因组亚硫酸氢盐测序(WGBS)需要极高质量的DNA样品，则通过酚-氯仿法提取。如所描述的，实施酚-氯仿DNA提取(64)。简要地，用冷PBS清洗细胞小粒两次。将2mL gDNA裂解缓冲液(50mM Tris-HCl pH 8，100mM NaCl，25mM EDTA和1％SDS)直接应用于所述细胞。将裂解液在65℃与2mg蛋白酶K(Ambion)培育过夜。在添加1mg RNA酶A(PureLink)之前，用TE缓冲液将裂解液稀释2倍，并随后在37℃培育1小时。随后，将NaCl浓度调节至200mM，随后在pH 8进行酚-氯仿提取和乙醇沉淀。将gDNA小粒溶于TEpH 8缓冲液。

实时定量PCR(qRT-PCR)

使用Qscript cDNA Supermix(QuantaBio)反转录1μg RNA。将cDNA稀释3倍以用于表达分析。在384孔板上，在QS5系统(Thermo Scientific)上，使用GoTaq qPCR Master Mix(Promega,Madison,WI)对cDNA或ChIP-DNA进行qRT-PCR。使用1.2版QuantStudio^TM Design&Analysis软件(ThermoFisher Scientific)计算样品的变化倍数或输入百分比并表示为相对表达(ΔΔCt)。所有测量重复三次。在本研究中使用的引物列于表1。

5-氮杂-2'-脱氧胞苷(地西他滨)处理

根据生产商的说明，用2.5μM 5-氮杂-2'-脱氧胞苷(Sigma-Aldrich)处理SNU-398细胞。每24h更新培养基和药物。在3天(72h)处理后，分离RNA和基因组DNA。

脱氧胞苷(Dox)处理

在dCas9 Tet-On SNU-398细胞(图23A，23B中所示的可诱导的CRISPR-DiR系统)中，使用如22A中所示的相同靶向策略(区域D1+区域D3)，并且在用脱氧胞苷(Dox)处理后诱导dCas9表达。对于Dox+样品每天将Dox新添加至培养基(1μM)中，而在无Dox的正常培养基中培养Dox-样品。对于Dox诱导3天/8天的样品，将1μM Dox相应加入至新鲜培养基3天和8天，然后将细胞在无Dox培养基中保持至第32天；对于Dox诱导32天的样品，每天将1μM Dox加入至新鲜培养基，添加32天。培养所有处理的细胞并在第3天、第8天和第32天测定。

瞬时转染

如生产商所描述的，在使用jetPRIME转染试剂(Polyplus Transfection)转染前24小时，将SNU-398细胞以3.5×10⁵个细胞/孔的密度接种至6-孔板中。将2μg sgRNA/MsgDiR和dCas9质粒(sgRNA/MsgDiR：dCas9摩尔比1:1)的混合物转染到每个孔中的细胞。在转染后12小时，更换培养基。作为另外一种选择，根据生产商的说明将Neon^TM转染系统(Thermo Fisher)用于细胞电穿孔。在Neon中使用与jetPRIME转染中相同的质粒的量和比值。用于最高SNU-398转染效率的参数是在100μl试剂中，0.7比150万个细胞，电压1550V，宽度35ms和1个脉冲。在转染后24小时，更换培养基。在本研究中使用的质粒列于表2。

慢病毒的产生

使用TransIT-LT1试剂(Mirus)，将pMD2.G、psPAX2和慢病毒载体(plv-dCas9-mCherry、pcw-dCas9-puro、plv-GN2sgDiR-EGFP、plv-G19sgDiR-EGFP、plv-G36sgDiR-EGFP、plv-G108sgDiR-EGFP、plv-G122sgDiR-EGFP、plv-G110sgDiR-EGFP、plv-G111sgDiR-EGFP)转染到1000万个293T中，慢病毒载体：psPAX2：pMD2.G为9μg：9μg：1μg。转染后18小时更换培养基，并且在转染后48hr和72hr收获病毒上清液。通过0.45μm微过滤器过滤收集的病毒并储存在-80℃。在本研究中使用的质粒列于表2。注意，一些研究已尝试改变sgRNA支架以提高它们的稳定性。一种选择是通过将第四个T替换为或G(65)来除去该推定的POL-III终止子(在sgRNA支架起始处的4个连续的T)。因此，在CRISPR-DiR设计中，第四个T(以下加粗、斜体、加下划线)被G替换，从而通过使得能够有效转录，同时保留基本相同的二级结构并降低最小自由能(MFE)来使得结构更稳定。因此，将相应的A用C替换以保持与“G”的碱基配对。所有sgRNA、MsgDiR支架序列列于表3并示于图31，向导RNA序列列于表4并且每个区域(区域C、D1、D2、D3和E)的位置列于表5。

产生CRISPR-DiR和可诱导的CRISPR-DiR稳定细胞系

在转导前24小时将SNU-398和U2OS细胞两者接种在T75烧瓶或10cm板中，并且首先用dCas9或可诱导的dCas9病毒培养基(从-80℃融化)与4μg/mL聚凝胺(Santa Cruz)一起转导以制备SNU398-dCas9、U2OS-dCas9或可诱导的SNU398-dCas9稳定系。一旦在5％CO2的加湿气氛中，在37℃培育24小时，则具有病毒的培养基可以更换为正常培养基。在新加坡癌症科学学会流式细胞研究室(Cancer Science Institute of Singapore flow cytometryfacility)，使用通过FACS Aria机(BD Biosciences)设置的mcherry滤光片对dCas9阳性细胞进行分选，同时通过在培养基中每隔一天以2μg/ml浓度添加嘌罗霉素来选择可诱导的dCas9阳性细胞。将细胞进一步培养1周以上以获得稳定细胞系。一旦产生dCas9和可诱导的dCas9细胞系，则将具有不同向导RNA的sgDiR病毒以相等体积混合并使用如以上所描述的相同方法转导至dCas9或可诱导的dCas9稳定系中。用于产生每个稳定细胞系的sgDiR、每个sgDiR的位置以及区域D1、区域D2和区域D3的定义可见于表4和表5。在新加坡癌症科学学会流式细胞研究室，通过FACS Aria机(BD Biosciences)，使用EGFP滤光片对所有sgDiR稳定细胞系进行分选，并定期通过显微镜检查效率来进一步在培养中进行评价。

免疫印迹分析

在RIPA缓冲液(150mM NaCl、1％Nonidet P-40、50mM Tris，pH8.0、蛋白酶抑制剂混合物)中收获总细胞裂解液并通过考马斯亮蓝蛋白质测定(Bio-Rad Laboratories,Inc.Hercules,CA,USA)确定蛋白浓度，并在Tecan

2000 PRO酶标仪(Tecan,Seestrasse,Switzerland)上在595nm测量吸光度。将来自每个裂解液的等量蛋白与3X上样染料一起混合并在95℃加热10分钟。通过12％SDS-PAGE分离样品(运行缓冲液：25mM Tris，192mM甘氨酸和0.1％SDS)，然后转移至PVDF膜(转移缓冲液：25mM Tris，192mM甘氨酸和20％(v/v)甲醇(Fischer Chemical))。用含有5％脱脂乳的TBST缓冲液在室温下边温和振荡边封闭膜1小时。用TBST缓冲液进一步清洗封闭的膜三次并用第一抗体CDKN2A/p16INK4a(ab108349，Abcam，1:1000)、β-肌动蛋白(Santa Cruzβ-肌动蛋白(C4)小鼠单克隆IgG1#sc-47778，1:5000)在4℃培育过夜，随后在室温下与HRP-缀合的第二抗体培育1小时。将第一和第二抗体在5％BSA-TBST缓冲液中稀释，并且以温和振荡模式实施所有培育。使用LuminataCrescendo Western HRP底物(Millipore)检测免疫-反应性蛋白。

亚硫酸氢盐处理

通过基于亚硫酸氢盐-转化的测定评价p16基因座或者全基因组的甲基化谱。对于DNA亚硫酸氢盐转化，按照生产商的说明，通过EpiTect亚硫酸氢盐试剂盒(Qiagen)转化每个样品1.6-1.8μg的基因组DNA。

甲基化-特异性PCR(MSP)、结合亚硫酸氢盐的限制性酶分析(COBRA)和亚硫酸氢盐测序PCR(BSP)

通过三种不同的基于PCR的方法，在不同的甲基化谱测定中进一步分析了亚硫酸氢盐转化的DNA样品。对于甲基化-特异性PCR(MSP)，将p16的甲基化特异性引物和非甲基化特异性引物两者用于相同亚硫酸氢盐转化的样品的PCR(sgRNA和MsgDiR1-8筛选测定中的瞬时转染样品)。根据生产商的说明，使用ZymoTaq PreMix(ZYMO RESEARCH)通过以下程序进行PCR：95℃10min，35次循环(95℃30s，56℃30s，72℃1min)，72℃7min，4℃保持。获得每个样品的两种PCR产物(甲基化和非甲基化)并在1.5％琼脂糖凝胶中进行分析。对于结合亚硫酸氢盐的限制性酶分析(COBRA)，引物特异性扩增每个区域中的甲基化和非甲基化DNA(引物退火至无任何CG位点的特异性基因座)以用于亚硫酸氢盐转化的样品的PCR。根据生产商的说明，使用ZymoTaq PreMix(ZYMO RESEARCH)通过以下程序进行PCR：2次循环(95℃10min，55℃2min，72℃2min)，38次循环(95℃30s，55℃2min，72℃2min)，72℃7min，4℃保持。因此，将PCR产物上样至1％琼脂糖凝胶并切下具有预测扩增尺寸的条带并凝胶纯化。将400ng纯化的PCR片段在20μl体积中与表6中所总结的1μl限制性内切酶培育2.5h-3h。作为未切割对照，将100ng相同的PCR片段仅与限制性内切酶缓冲液在相同条件下培育。然后，在2.5％琼脂糖凝胶上分离未切割和切割的DNA并用溴化乙锭染色。对于亚硫酸氢盐测序PCR，引物特异性扩增区域D中的甲基化和非甲基化DNA(引物退火至无任何CG位点的特异性基因座)以用于亚硫酸氢盐转化的样品的PCR。根据生产商的说明，使用ZymoTaq PreMix(ZYMORESEARCH)通过以下程序进行PCR：2次循环(95℃10min，55℃2min，72℃2min)，38次循环(95℃30s，55℃2min，72℃2min)，72℃7min，4℃保持。将PCR产物从1％TAE琼脂糖凝胶中凝胶-纯化(Qiagen)并克隆至pGEM-T Easy载体系统(Promega)进行转化。将克隆载体转化到Stbl3感受态细胞中并实施miniprep以提取质粒用于通过测序引物T7或SP6的Sanger测序。使用QUMA(用于甲基化分析的定量工具，Quantification tool for MethylationAnalysis)分析测序结果。从我们的分析中排除转化率小于95％且序列同一性小于90％的样品以及克隆变体。每个测序条件的最小克隆数为8。所有MSP、COBRA和BSP引物以及限制性内切酶可见于表6。

全基因组亚硫酸氢盐测序(WGBS)

用冷PBS清洗野生型SNU-398细胞和地西他滨处理的SNU-398细胞的10cm板两次。将2mL gDNA裂解缓冲液(50mM Tris-HCl pH 8、100mM NaCl、25mM EDTA和1％SDS)直接添加至细胞。将裂解液在65℃与2mg蛋白酶K(Ambion)培育过夜。在添加1mg RNA酶A(PureLink)之前，用TE缓冲液将裂解液稀释2倍，并随后在37℃培育1小时。随后，将NaCl浓度调节至200mM，随后在pH 8进行酚-氯仿提取和乙醇沉淀。将gDNA小粒溶于1mL TE pH 8缓冲液并与100ug/mL浓度的RNA酶A(Qiagen)在37℃培育1小时。通过酚-氯仿pH 8提取回收纯gDNA，并乙醇沉淀，并溶于TE pH 8缓冲液。将10ug每种gDNA样品(野生型和地西他滨处理)送至BGI(北京基因组研究所，Beijing Genomics Institute)用于WGBS文库构建和测序。在Hiseq X平台上以2X150成对末端读序对样品测序以近似30X人基因组覆盖度(～90Gb)。

染色质免疫沉淀(ChIP)

如上所述实施ChIP(66)。简要地，通过用室温PBS清洗1次使6000万个细胞样品胰蛋白酶化，然后将每5000-6000万个细胞在30ml室温PBS中再混悬。在室温下，通过旋转用1％甲醛固定细胞8min。用0.25M甘氨酸淬灭过量的甲醛。用补充有1mM PMSF的冷PBS清洗固定细胞两次。在用PBS清洗后，用ChIP SDS裂解缓冲液(100mM NaCl、50mM Tris-Cl pH 8.0、5mM EDTA、0.5％SDS、0.02％NaN₃和无EDTA的新鲜蛋白酶抑制剂完整片剂(5056489001，Roche))裂解细胞，然后在-80℃储存直至进一步处理。通过在4℃以3000rpm离心10min收集核。将核小粒在IP溶液(2体积ChIP SDS裂解缓冲液加1体积ChIP triton稀释缓冲液(100mMTris-Cl pH 8.6、100mM NaCl、5mM EDTA、5％Triton X-100)和新鲜蛋白酶抑制因子)中以1000万个细胞/ml IP缓冲液浓度(对于组蛋白标志物ChIP)或者2000万个细胞/ml IP缓冲液浓度(对于CTCF ChIP)再混悬以用于使用Bioruptor(8-10次循环，30s开，30s关，大功率)超声处理以获得200bp至500bp的DNA片段。在离心除去碎片后，通过添加50μl清洗的dynabeads蛋白A(Thermo Scientific)使1.2ml超声处理的染色质预澄清并在4℃旋转2小时。将预澄清的染色质与抗体预结合的dynabeads蛋白A(Thermo Scientific)在4℃培育过夜。对于组蛋白标志物抗体，将50μl Dynabeads蛋白A与3μg抗体一起加载。对于CTCF，将50μl Dynabeads蛋白A与20μl抗体一起加载。第二天，通过以下步骤清洗磁珠：缓冲液1(150mMNaCl、50mM Tris-Cl、1mM EDTA、5％蔗糖、0.02％NaN₃、1％Triton X-100、0.2％SDS，pH8.0)两次；缓冲液2(0.1％去氧胆酸、1mM EDTA、50mM HEPES、500mM NaCl、1％Triton X-100、0.02％NaCl，pH8.0)两次；缓冲液3(0.5％去氧胆酸、1mM EDTA、250mM LiCl、0.5％NP40、0.02％NaN₃)两次；TE缓冲液1次。为了逆转交联，将样品与20μg/ml蛋白酶K(Ambion)在65℃培育过夜。然后，通过苯酚：氯仿：异戊醇(25：24：1)提取样品，随后在存在糖原的情况下氯仿、乙醇沉淀，并在10mM Tris缓冲液(pH 8)中再混悬。在逆转交联并纯化DNA之后，使用表7所列引物进行qPCR。简要地，检测所有组蛋白标志物和CTCF富集的p16引物位于TSS周围100bp内的近端启动子区域中；位于p16上游50kb(Neg 1)和位于p16下游10kb(Neg 2)的引物是位于无任何上述蛋白富集的区域中的阴性对照引物。ChIP测定中所使用的抗体是：H3K4Me3(C42D8,#9751,Cell Signaling Technologies)、H3K27Ac(ab45173,Abcam)、H3K9Me3(D4W1U,#13969,Cell Signaling Technologies)、CTCF(#07-729,Sigma)、兔IgG单克隆(ab172730,Santa Cruz)。

环化染色体构象捕获(4C)-Seq

如上所述(67)并加以修改(68)实施4C-seq。简要地，将稳定CRISPR-DiR处理13天的SNU398细胞用于4C-seq。在旋转的情况下，将a)通过GN2非靶向所引导的3000万个样品和b)通过靶向区域D1+D3的向导(G19、G36、G110和G111)所引导的3000万个样品在1％甲醛中在RT下交联10min。然后，通过添加2.5M甘氨酸至最终浓度0.25M并在RT旋转5min中和甲醛。在冷PBS中清洗后，将细胞在9ml裂解缓冲液(10mM Tris-HCl pH 8.0、10mM NaCl、5mMEDTA、0.5％NP 40，添加无EDTA蛋白酶抑制剂(完整片剂，新鲜溶于无核酸酶的水中以制备100×母液，5056489001，Roche))中再混悬并通过在冰上在10min培育期间每2-3min再混悬来进行多次裂解。裂解后，将每个裂解液分成两个15ml falcon管以分别用于视点1(Csp6I)或视点2(DpnII)(4.5ml/管，1500万个细胞)。在以3,000rpm在4℃离心10min后，用来自NEB的500μl 1X CutSmart缓冲液清洗每个核制剂并在4℃以800g离心10min，随后再混悬至450μl无核酸酶(NF)H₂O中并将450μl样品完全转移至1.5mL Eppendorf管中。向每个管中，将与相应限制性内切酶(视点1：10X缓冲液B(ER0211,Invitrogen)；视点2：10X NEBuffer^TMDpnII(R0543M,NEB))一起提供的60μl 10X限制性内切酶缓冲液与15μl 10％SDS缓冲液一起添加至450μl样品，随后边振荡(900RPM，Eppendorf Thermomixer)边在37℃培育1小时，随后添加75μl 20％Triton X-100至每个管中以用于边振荡(900RPM)边在37℃培育1小时。从每个管中取出20μl样品作为“未消化”样品并在-20℃储存。对于视点1，将50μl Csp6I(ER0211,Invitrogen)(500U每管)与5.6μl 10X缓冲液B(ER0211,Invitrogen)一起添加以用于在37℃边振荡(700RPM)边消化18小时；对于视点2，将10μl DpnII(R0543M,NEB)(500U每管)与8μl NF H₂O和2μl 10X NEBuffer^TM DpnII一起添加以用于在37℃边振荡(700RPM)边消化18小时。第二天，在除去20μl样品用于去交联后，确认消化效率大于80％并实施PicoGreen DNA定量以检查每个反应中的DNA浓度，取出10ug消化的DNA至新管中，并用NFH₂O调节体积至600μl。将样品在65℃热失活20min。将热失活的染色质加入至补充有1％Triton X-100、0.1mg/ml BSA的1X连接缓冲液(EL0013,Invitrogen)中，并用NF H2O将体积调节至10ml，且最终DNA浓度为1ng/μl。在添加660U T4 DNA连接酶(EL0013,Invitrogen30U/μl)后，将样品在16℃在热培育箱中在不振荡的条件下培育。第二天，将最终浓度0.5％的SDS和0.05mg/ml的蛋白酶K(Ambion)加入至每个样品，随后在65℃培育过夜以用于去交联。第二天，在添加30μl RNA酶A(10mg/ml,PureLink)后，将样品在37℃培育1小时，随后进行酚：氯仿DNA纯化。用酚：氯仿：异戊醇(25:24:1)提取染色质，然后在存在糖原的情况下用氯仿、乙醇沉淀(分成5ml/管并用NF H2O加满至15ml，然后添加100％乙醇至68％以避免SDS沉淀)并溶于10mM Tris缓冲液(pH8)。通过琼脂糖凝胶电泳分析连接的染色质并通过QUBITHS DNA试剂盒确定浓度。在不振荡的条件下，在37℃用10U特异性第二切割剂NlaIII(R0125S,NEB)在具有CutSmart缓冲液(NEB)的100μl系统中消化7μg连接的染色质过夜。在热失活前，通过凝胶电泳分析5μl消化的染色质。通过将染色质在65℃培育20min使限制性内切酶热失活。用T4 DNA连接酶(EL0013,Invitrogen,30U/μl)以20U/ml在1X连接缓冲液(EL0013,Invitrogen)中，在16℃培育过夜来连接7μg NlaIII消化的染色质。通过酚：氯仿：异戊醇(25:24:1)提取和乙醇沉淀来回收连接的DNA。将100ng每个样品的DNA用于4C文库制备。使用KAPA HiFi HotStart ReadyMix(KK2602)，通过反向PCR和巢式PCR构建文库。以100ng DNA+1.75μl第1PCR引物混合物+12.5μl KAPA HiFi HotStart ReadyMix+H2O至25μl来实施第1PCR。第1PCR程序为95℃，3min，15次循环(98℃，20s；65℃，15s；72℃，1min)，72℃，5min，4℃保持。通过MinElute PCR纯化试剂盒(28004，Qiagen)纯化第1PCR产物并以试剂盒中的13μl洗脱缓冲液洗脱。以纯化的第1PCR产物+1.75μl第2PCR引物混合物+12.5μlKAPA HiFi HotStart ReadyMix+H2O至25μl来实施第2PCR。第2PCR程序为95℃，3min，13次循环(98℃，20s；65℃，15s；72℃，1min)，72℃，5min，4℃保持。通过MinElute PCR纯化试剂盒(28004，Qiagen)纯化第2PCR产物并以试剂盒中的10μl洗脱缓冲液洗脱。所述引物混合物为5μl 100M正向引物+5μl 100M反向引物+90μl H2O。所有引物序列和条型码列于表8。在4-20％TBE PAGE凝胶(Thermo Scientific)上对文库进行大小选择(250-600bp)。在180V运行TBE凝胶55min，用Sybr Safe染色并用gel safe显象，并且使用凝胶粉碎规程(gel crushprotocol)从PAGE提取文库。实施Picogreen定量、生物分析仪(Bioanalyzer)和KAPA文库定量以检查所回收的文库的质量、大小和量，并且将NextSeq 500/550Mid输出试剂盒V2.5(150次循环)(20024904,Illumina)用于单端Nextseq测序。

统计分析

使用在线甲基化分析工具QUMA(http://quma.cdb.riken.jp/)计算通过亚硫酸氢盐测序PCR(BSP)所分析的克隆的甲基化变化，并且通过R功能(http://www.r-project.org)产生图22B。对于mRNA qRT-PCR和ChIP-qPCR，在GraphPad Prism软件中通过t检验计算p值。P值<0.05认为是统计学显著的(*P<0.05；**P<0.01；***P<0.001)。报告了三次重复的平均值±SD。

生物信息学分析

TF结合和基序分析

使用TFregulomeR软件包搜索p16转录起始位点周围的TF直接结合基序，所述软件包是连接至人中1,468个公开的TF ChIP-seq数据集的TF基序分析工具(52)。具体地，将来自TFregulomeR软件包的功能intersectPeakMatrix用于定位整个所关心的基因组区域上来源于ChIP-seq的TF基序的出现。在我们的研究中使用来自通过TFregulomeR分析的细胞系(FB8470、GM12891、GM19240、前列腺上皮细胞和H1-来源的间质干细胞)的ChIP-seq数据分析了CTCF结合。

组蛋白标记ChIP-seq分析

通过得自ENCODE的7个细胞系(GM12878、H1-hESC、HSMM、HUVEC、K562、NHEK、NHLF)间的ChIP-seq数据确定图24A中所示的组蛋白标记(H3K4Me3、H3K27Ac、H3K4Me1)的富集。

WGBS分析

对于WGBS分析，通过TrimGalore从双端读序去掉前3个碱基和接头序列。通过BISMARK分析所得FASTQ文件(69)。通过SAMtools rmdup除去PCR重复(70)。然后，bismark_methylation_extractor继续在每个胞嘧啶位点上提取DNA甲基化状态。通过bedGraphToBigWig将DNA甲基化水平转化为bedGraph，然后转化为bigWig格式。

4C-Seq分析

对于4C-seq分析，首先使用CSI端口处理通过4C-seq实验所产生的远程基因组相互作用区域(71)。简要地，使用bwa mem将原始fq文件与掩蔽的hg19参考进行比对(掩蔽空位、重复和模糊序列)。通过bedtools genomecov将Bam文件转化为读序覆盖文件(73)。根据测序深度，将读序覆盖度进行归一化。通过bedGraphToBigWig，将比对的bams的BedGraph文件转化为bigWig格式。然后，使用r3CSeq(74)并且使用相关掩蔽的hg19基因组(BSgenome.Hsapiens.UCSC.hg19.masked)(75)从R Bioconductor资源库分析所处理的比对文件。将染色体9选作视点，并且将Csp6I、DpnII用作限制性内切酶来消化基因组。使用来自deeptoolssuite的bamCoverage(76)，以标志(flags)“--normalizeUsing RPGC--binSize2000--smoothLength 6000--effectiveGenomeSize 2864785220--outFileFormat bedgraph”产生平滑的bam覆盖度定位图，并使用Bioconductor软件包Sushi(77)作图以获得视点覆盖度深度定位图。手动产生UCSC的BigInteract文件和bedpe文件并将“得分”值计算为-log(interaction_q-value_from_r3CSeq+1*10^-10)。然后将Sushi用于对bedpe文件作图以获得4C环图。为了识别差异相互作用峰，将HOMER(78)的get DifferentialPeaks(获得差异峰)与标志“-F 1.5”一起使用，然后如所描述的，产生相应的biginteract和bedpe文件。

可以在Gene Expression Omnibus中访问通过本研究所产生的WGBS数据和4C seq数据(登录号GSE153563)。

已通过举例说明描述了一种或多种说明性实施方式。本领域技术人员将理解可以在不背离如权利要求中所定义的本发明的范围的情况下做出一些改变和修改。

表1：用于qRT-PCR的引物序列

引物名称	序列(5'至3')	SEQ ID NO:
			p16-F	CAACGCACCGAATAGTTACG	56
p16-R	AGCACCACCAGCGTGTC	57
			CEBPA-F	TATAGGCTGGGCTTCCCCTT	58
CEBPA-R	AGCTTTCTGGTGTGACTCGG	59
			p14-F	GCAGGTTCTTGGTGACCCTC	60
p14-R	CCATCATCATGACCTGGTCTTCTA	61
			p15-F	TAGTGGAGAAGGTGCGACAG	62
p15-R	GCGCTGCCCATCATCATG	63
			ACTB-F	TGAAGTGTGACGTGGACATC	64
ACTB-R	GGAGGAGCAATGATCTTGAT	65

表2：在瞬时转染中使用的质粒和慢病毒产生的稳定系

表3：sgRNA和MsgDiR1-8的序列

表4：向导RNA序列

*对于20nt向导RNA，通过RNA Pol III识别第一个“G”以起始sgRNA转录。因此，对于在它们与p16 DNA互补的原始序列中不以“G”起始的一些向导，我们将第一个碱基对改变为“G”，同时将整个向导长度保留为20nt。

表5：区域C、区域D1、区域D2、区域D3和区域E的位置

表6：对于甲基化测定的引物和限制性内切酶

用于区域C、D1、D2、D3和E的COBRA引物和酶：

BSP引物：

MSP引物：

表7：用于ChIP-qPCR的引物序列

表8：用于4C-seq的引物序列

第一轮PCR引物：

第二轮PCR引物：

*第二轮PCR引物内斜体且加粗显示的序列是出于测序目的的i5和i7条型码。i5条型码用于第一切割(Csp6I/DpnII0)末端中的引物，而i7条型码用于第二切割(NlaIII)末端。加下划线的部分表示对每个样品序列特异的引物。

4C PCR引物组：

参考文献

1.L.S.Qi et al.,Repurposing CRISPR as an RNA-guided platform forsequence-specific control of gene expression.Cell 152,1173(Feb 28,2013).

2.F.S.Howe et al.,CRISPRi is not strand-specific at all loci andredefines the transcriptional landscape.eLife 6,e29878(2017/10/23,2017).

3.S.Konermann et al.,Genome-scale transcriptional activation by anengineered CRISPR-Cas9 complex.Nature 517,583(Jan 29,2015).

4.H.Nishimasu et al.,Crystal structure of Cas9 in complex with guideRNA and target DNA.Cell 156,935(Feb 27,2014).

5.H.Ma et al.,Multiplexed labeling of genomic loci with dCas9 andengineered sgRNAs using CRISPRainbow.Nature biotechnology 34,528(May,2016).

6.B.Chen et al.,Dynamic imaging of genomic loci in living human cellsby an optimized CRISPR/Cas system.Cell 155,1479(Dec 19,2013).

7.Y.Dang et al.,Optimizing sgRNA structure to improve CRISPR-Cas9knockout efficiency.Genome biology 16,280(Dec 15,2015).

8.S.Kalari,G.P.Pfeifer,in Advances in Genetics,Z.Herceg,T.Ushijima,Eds.(Academic Press,2010),vol.70,pp.277-308.

9.L.Xue et al.,Sp1 is involved in the transcriptional activation ofp16INK4 by p21Waf1 in HeLa cells.FEBS Letters 564,199(2004/04/23/,2004).

10.Y.Stelzer,C.S.Shivalila,F.Soldner,S.Markoulaki,R.Jaenisch,TracingDynamic Changes of DNA Methylation at Single-Cell Resolution.Cell 163,218(Sep24,2015).

11.M.Jinek et al.,A Programmable Dual-RNA–Guided DNA Endonuclease inAdaptive Bacterial Immunity.Science 337,816(2012).

12.L.Cong et al.,Multiplex genome engineering using CRISPR/Cassystems.Science(New York,N.Y.)339,819(2013).

13.M.H.Larson et al.,CRISPR interference(CRISPRi)for sequence-specific control of gene expression.Nature protocols 8,2180(Nov,2013).

14.D.W.Ballard et al.,The 65-kDa subunit of human NF-kappa Bfunctions as a potent transcriptional activator and a target for v-Rel-mediated repression.Proceedings of the National Academy of Sciences of theUnited States of America 89,1875(1992).

15.M.K.Jensen,Design principles for nuclease-deficient CRISPR-basedtranscriptional regulators.FEMS yeast research 18,(Jun 1,2018).

16.H.Mitsunobu,J.Teramoto,K.Nishida,A.Kondo,Beyond Native Cas9:Manipulating Genomic Information and Function.Trends in biotechnology 35,983(Oct,2017).

17.L.A.Gilbert et al.,CRISPR-mediated modular RNA-guided regulationof transcription in eukaryotes.Cell 154,442(Jul 18,2013).

18.N.A.Kearns et al.,Cas9 effector-mediated regulation oftranscription and differentiation in human pluripotent stem cells.Development(Cambridge,England)141,219(2014).

19.M.L.Maeder et al.,CRISPR RNA-guided activation of endogenous humangenes.Nature methods 10,977(2013).

20.J.F.Margolin et al.,Krüppel-associated boxes are potenttranscriptional repression domains.Proceedings of the National Academy ofSciences of the United States of America 91,4509(1994).

21.F.Farzadfard,S.D.Perli,T.K.Lu,Tunable and multifunctionaleukaryotic transcription factors based on CRISPR/Cas.ACS synthetic biology 2,604(2013).

22.M.Deaner,J.Mejia,H.S.Alper,Enabling Graded and Large-ScaleMultiplex of Desired Genes Using a Dual-Mode dCas9 Activator in Saccharomycescerevisiae.ACS synthetic biology 6,1931(2017/10/20,2017).

23.K.G.Vanegas,B.J.Lehka,U.H.Mortensen,SWITCH:a dynamic CRISPR toolfor genome engineering and metabolic pathway control for cell factoryconstruction in Saccharomyces cerevisiae.Microbial cell factories 16,25(2017).

24.DI RUSCIO,A.,EBRALIDZE,A.K.,BENOUKRAF,T.,AMABILE,G.,GOFF,L.A.,TERRAGNI,J.,FIGUEROA,M.E.,DE FIGUEIREDO PONTES,L.L.,ALBERICH-JORDA,M.,ZHANG,P.,WU,M.,D'ALO,F.,MELNICK,A.,LEONE,G.,EBRALIDZE,K.K.,PRADHAN,S.,RINN,J.L.&TENEN,D.G.2013.DNMT1-interacting RNAs block gene-specific DNAmethylation.Nature,503,371-6.

25.GILBERT,L.A.,HORLBECK,M.A.,ADAMSON,B.,VILLALTA,J.E.,CHEN,Y.,WHITEHEAD,E.H.,GUIMARAES,C.,PANNING,B.,PLOEGH,H.L.,BASSIK,M.C.,QI,L.S.,KAMPMANN,M.&WEISSMAN,J.S.2014.Genome-Scale CRISPR-Mediated Control of GeneRepression and Activation.Cell,159,647-661.

26.GILBERT,L.A.,LARSON,M.H.,MORSUT,L.,LIU,Z.,BRAR,G.A.,TORRES,S.E.,STERN-GINOSSAR,N.,BRANDMAN,O.,WHITEHEAD,E.H.,DOUDNA,J.A.,LIM,W.A.,WEISSMAN,J.S.&QI,L.S.2013.CRISPR-mediated modular RNA-guided regulation oftranscription in eukaryotes.Cell,154,442-451.

27.KONERMANN,S.,BRIGHAM,M.D.,TREVINO,A.E.,JOUNG,J.,ABUDAYYEH,O.O.,BARCENA,C.,HSU,P.D.,HABIB,N.,GOOTENBERG,J.S.,NISHIMASU,H.,NUREKI,O.&ZHANG,F.2015.Genome-scale transcriptional activation by an engineered CRISPR-Cas9complex.Nature,517,583-8.

28.NISHIMASU,H.,RAN,F.A.,HSU,P.D.,KONERMANN,S.,SHEHATA,S.I.,DOHMAE,N.,ISHITANI,R.,ZHANG,F.&NUREKI,O.2014.Crystal structure of Cas9 in complexwith guide RNA and target DNA.Cell,156,935-49.

29.P.A.Jones,Functions of DNA methylation:islands,start sites,genebodies and beyond.Nat Rev Genet 13,484-492(2012).

30.J.G.Herman,S.B.Baylin,Gene silencing in cancer in association withpromoter hypermethylation.N Engl J Med 349(21),2042-2054(2003).

31.P.A.Jones,S.B.Baylin,The fundamental role of epigenetic events incancer.Nature Reviews Genetics 3,415-428(2002).

32.M.Esteller,P.G.Corn,S.B.Baylin,J.G.Herman,A Gene HypermethylationProfile of Human Cancer.Cancer Research 61,3225(2001).

33.R.L.Momparler,V.Bovenzi,DNA methylation and cancer.J Cell Physiol183(2),145-154(2000).

34.S.Saxonov,P.Berg,D.L.Brutlag,A genome-wide analysis of CpGdinucleotides in the human genome distinguishes two distinct classes ofpromoters.Proceedings of the National Academy of Sciences 103,1412(2006).

35.L.A.Gilbert et al.,CRISPR-mediated modular RNA-guided regulationof transcription in eukaryotes.Cell 154,442-451(2013).

36.S.Konermann et al.,Genome-scale transcriptional activation by anengineered CRISPR-Cas9 complex.Nature 517,583-588(2015).

37.A.Taghbalout et al.,Enhanced CRISPR-based DNA demethylation byCasilio-ME-mediated RNA-guided coupling of methylcytosine oxidation and DNArepair pathways.Nat Commun 10,4296(2019).

38.A.Sakamoto et al.,DNA Methylation in the Exon 1 Region and ComplexRegulation of Twist1 Expression in Gastric Cancer Cells.PLoS One 10,e0145630(2015).

39.R.Tirado-Magallanes,K.Rebbani,R.Lim,S.Pradhan,T.Benoukraf,Wholegenome DNA methylation:beyond genes silencing.Oncotarget 8,5629-5637(2017).

40.S.Mani,Z.Herceg,DNA demethylating agents and epigenetic therapy ofcancer.Adv Genet 70,327-340(2010).

41.M.V.C.Greenberg,D.Bourc’his,The diverse roles of DNA methylationin mammalian development and disease.Nature Reviews Molecular Cell Biology20,590-607(2019).

42.B.Li,M.Carey,J.L.Workman,The role of chromatin duringtranscription.Cell 128,707-719(2007).

43.A.Di Ruscio et al.,DNMT1-interacting RNAs block gene-specific DNAmethylation.Nature 503,371-376(2013).

44.H.Ma et al.,Multiplexed labeling of genomic loci with dCas9 andengineered sgRNAs using CRISPRainbow.Nat Biotechnol 34,528-530(2016).

45.M.Jinek et al.,Structures of Cas9 endonucleases reveal RNA-mediated conformational activation.Science 343,1247997(2014).

46.M.Gonzalez-Zulueta et al.,Methylation of the 5′CpG Island of thep16/CDKN2 Tumor Suppressor Gene in Normal and Transformed Human TissuesCorrelates with Gene Silencing.Cancer Research 55,4531(1995).

47.J.Shen et al.,Genome-wide DNA methylation profiles inhepatocellular carcinoma.Hepatology 55(6),1799-1808(2012).

48.Y.H.Shim,H.-J.Yoon Gs Fau-Choi,Y.H.Choi Hj Fau-Chung,E.Chung YhFau-Yu,E.Yu,p16 Hypermethylation in the early stage of hepatitis B virus-associated hepatocarcinogenesis.Cancer Lett 190(2),213-219(2003).

49.K.Pandiyan et al.,Functional DNA demethylation is accompanied bychromatin accessibility.Nucleic Acids Research 41,3973-3985(2013).

50.J.Gil,G.Peters,Regulation of the INK4b-ARF-INK4a tumour suppressorlocus:all for one or one for all.Nat Rev Mol Cell Biol 7,667-677(2006).

51.C.Rodriguez et al.,CTCF is a DNA methylation-sensitive positiveregulator of the INK/ARF locus.Biochem Biophys Res Commun 392,129-134(2010).

52.Q.X.X.Lin,D.Thieffry,S.Jha,T.Benoukraf,TFregulomeR revealstranscription factors'context-specific features and functions.Nucleic acidsresearch 48,e10-e10(2020).

53.F.Recillas-Targa,E.De La Rosa-Velazquez Ia Fau-Soto-Reyes,L.Soto-Reyes E Fau-Benitez-Bribiesca,L.Benitez-Bribiesca,Epigenetic boundaries oftumour suppressor gene promoters:the CTCF connection and its role incarcinogenesis.J Cell Mol Med 10(3),554-568(2006).

54.M.Witcher,B.M.Emerson,Epigenetic silencing of the p16(INK4a)tumorsuppressor is associated with loss of CTCF binding and a chromatinboundary.Mol Cell 34,271-284(2009).

55.A.T.Hark et al.,CTCF mediates methylation-sensitive enhancer-blocking activity at the H19/Igf2 locus.Nature 405(6785),486-489(2000).

56.C.-T.Ong,V.G.Corces,CTCF:an architectural protein bridging genometopology and function.Nature Reviews Genetics 15,234-246(2014).

57.A.Visel et al.,Targeted deletion of the 9p21 non-coding coronaryartery disease risk interval in mice.Nature 464,409-412(2010).

58.Q.Li et al.,FOXA1 mediates p16(INK4a)activation during cellularsenescence.EMBO J 32,858-873(2013).

59.Y.T.Liu et al.,Identification of De Novo Enhancers Activated byTGFbeta to Drive Expression of CDKN2A and B in HeLa Cells.Mol Cancer Res 17,1854-1866(2019).

60.M.L.Maeder et al.,CRISPR RNA-guided activation of endogenous humangenes.Nat Methods 10,977-979(2013).

61.A.R.Karpf,Epigenetic alterations in oncogenesis.(Springer,NewYork,NY,2013).

62.A.Fuso et al.,Early demethylation of non-CpG,CpC-rich,elements inthe myogenin 5'-flanking region:a priming effect on the spreading of activedemethylation.Cell Cycle 9,3965-3976(2010).

63.J.K.e.al,Pseudogene-mediated DNA demethylation leads to oncogeneactivation.Unpublished,(2020).

64.M.R.Dimitrov et al.,Successive DNA extractions improvecharacterization of soil microbial communities.PeerJ 5,e2915-e2915(2017).

65.Y.Dang et al.,Optimizing sgRNA structure to improve CRISPR-Cas9knockout efficiency.Genome Biology 16,280(2015).

66.D.Gonzalez et al.,ZNF143 protein is an important regulator of themyeloid transcription factor C/EBPα.J Biol Chem 292(46),18924-18936(2017).

67.M.Matelot,D.Noordermeer,Determination of High-Resolution 3DChromatin Organization Using Circular Chromosome Conformation Capture(4C-seq).Methods Mol Biol 1480,223-241(2016).

68.P.H.L.Krijger,G.Geeven,V.Bianchi,C.R.E.Hilvering,W.de Laat,4C-seqfrom beginning to end:A detailed protocol for sample preparation and dataanalysis.Methods 170,17-32(2020).

69.F.Krueger,S.R.Andrews,Bismark:a flexible aligner and methylationcaller for Bisulfite-Seq applications.Bioinformatics 27(11),1571-1572(2011).

70.H.Li et al.,The Sequence Alignment/Map format andSAMtools.Bioinformatics 25,2078-2079(2009).

71.O.An et al.,CSI NGS Portal:An Online Platform for Automated NGSData Analysis and Sharing.Int J Mol Sci 21,(2020).

72.H.Li,R.Durbin,Fast and accurate long-read alignment with Burrows–Wheeler transform.Bioinformatics 26,589-595(2010).

73.A.R.Quinlan,I.M.Hall,BEDTools:a flexible suite of utilities forcomparing genomic features.Bioinformatics 26,841-842(2010).

74.S.Thongjuea,F.G.Stadhouders R Fau-Grosveld,E.Grosveld Fg Fau-Soler,B.Soler E Fau-Lenhard,B.Lenhard,r3Cseq:an R/Bioconductor package forthe discovery of long-range genomic interactions from chromosome conformationcapture and next-generation sequencing data.Nucleic Acids Res 41(13),132(2013).

75.T.TBD,BSgenome.Hsapiens.UCSC.hg19.masked:Full masked genomesequences for Homo sapiens(UCSC version hg19,based on GRCh37.p13).R packageversion 1.3.993.,(2020).

76.F.Ramírez et al.,deepTools2:a next generation web server for deep-sequencing data analysis.Nucleic Acids Res 44(W1),W160-W165(2016).

77.P.DH,Sushi:Tools for visualizing genomics data.R package version1.26.0.,(2020).

78.S.Heinz et al.,Simple combinations of lineage-determiningtranscription factors prime cis-regulatory elements required for macrophageand B cell identities.Molecular cell 38,576-589(2010).

79.A.R.Gruber,R.Lorenz,S.H.Bernhart,R.

I.L.Hofacker,The ViennaRNA websuite.Nucleic acids research 36,W70-W74(2008).

80.Lu et al.,Reprogrammable CRISPR/dCas9-based recruitment of DNMT1for site-specific DNA demethylation and gene regulation,Cell Discovery,2019,5:22(80).

81.Berg,T.,Guo,Y.,Abdelkarim,M.,Fliegauf,M.,&Lubbert,M.(2007).Reversal of p15/INK4b hypermethylation in AML1/ETO-positive and-negativemyeloid leukemia cell lines.Leuk Res,31(4),497-506.doi:10.1016/j.leukres.2006.08.008

82.Konermann,S.,Brigham,M.D.,Trevino,A.E.,Joung,J.,Abudayyeh,O.O.,Barcena,C.,...Zhang,F.(2015).Genome-scale transcriptional activation by anengineered CRISPR-Cas9 complex.Nature,517(7536),583-588.doi:10.1038/nature14136

83.Lu,A.,Wang,J.,Sun,W.,Huang,W.,Cai,Z.,Zhao,G.,&Wang,J.(2019).Reprogrammable CRISPR/dCas9-based recruitment of DNMT1 for site-specific DNAdemethylation and gene regulation.Cell Discovery,5(1),22.doi:10.1038/s41421-019-0090-1.

84.R.Itzykson,P.Fenaux,Epigenetics of myelodysplasticsyndromes.Leukemia 28,497-506(2014).

在本文中以及说明书中的其他处所引用的所有参考文献以其全部内容作为参考入本文。

序列表

<110> 新加坡国立大学

贝斯以色列女执事医疗中心有限公司

<120> 用于基因特异性脱甲基和激活的方法和组合物

<130> 08942729WO

<150> US 62/874,160

<151> 2019-07-15

<160> 113

<170> PatentIn version 3.5

<210> 1

<211> 139

<212> RNA

<213> 人工序列

<220>

<223> G19sgR2R5

<400> 1

gcucccccgc cugccagcaa guuugagagc uacccgggac gcggguccgg gacaguagca 60

aguucaaaua aggcuagucc guuaucaacu ucugaggccu uggcgaggcu ucuaaguggc 120

accgagucgg ugcuuuuuu 139

<210> 2

<211> 140

<212> RNA

<213> 人工序列

<220>

<223> G36sgR2R5

<400> 2

gcuaacugcc aaauugaauc gguuugagag cuacccggga cgcggguccg ggacaguagc 60

aaguucaaau aaggcuaguc cguuaucaac uucugaggcc uuggcgaggc uucuaagugg 120

caccgagucg gugcuuuuuu 140

<210> 3

<211> 139

<212> RNA

<213> 人工序列

<220>

<223> G110sgR2R5

<400> 3

gacccucuac ccaccuggau guuugagagc uacccgggac gcggguccgg gacaguagca 60

aguucaaaua aggcuagucc guuaucaacu ucugaggccu uggcgaggcu ucuaaguggc 120

accgagucgg ugcuuuuuu 139

<210> 4

<211> 139

<212> RNA

<213> 人工序列

<220>

<223> G111sgR2R5

<400> 4

gcccccaggg cgucgccagg guuugagagc uacccgggac gcggguccgg gacaguagca 60

aguucaaaua aggcuagucc guuaucaacu ucugaggccu uggcgaggcu ucuaaguggc 120

accgagucgg ugcuuuuuu 139

<210> 5

<211> 139

<212> RNA

<213> 人工序列

<220>

<223> G108sgR2R5

<400> 5

guggccagcc agucagccga guuugagagc uacccgggac gcggguccgg gacaguagca 60

aguucaaaua aggcuagucc guuaucaacu ucugaggccu uggcgaggcu ucuaaguggc 120

accgagucgg ugcuuuuuu 139

<210> 6

<211> 140

<212> RNA

<213> 人工序列

<220>

<223> G122sgR2R5

<400> 6

gccgcagccg ccgagcgcac gguuugagag cuacccggga cgcggguccg ggacaguagc 60

aaguucaaau aaggcuaguc cguuaucaac uucugaggcc uuggcgaggc uucuaagugg 120

caccgagucg gugcuuuuuu 140

<210> 7

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> DiR的R2茎环

<400> 7

cccgggacgc ggguccggga cag 23

<210> 8

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> DiR的R5茎环

<400> 8

cugaggccuu ggcgaggcuu cu 22

<210> 9

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> P16靶向部分实例

<400> 9

gcucccccgc cugccagcaa 20

<210> 10

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> P16靶向部分实例

<400> 10

gcuaacugcc aaauugaauc g 21

<210> 11

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> P16靶向部分实例

<400> 11

gacccucuac ccaccuggau 20

<210> 12

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> P16靶向部分实例

<400> 12

gcccccaggg cgucgccagg 20

<210> 13

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 向导1.6 sgDiR

<400> 13

gcugcggcug cugcucgccc 20

<210> 14

<211> 5040

<212> DNA

<213> 人工序列

<220>

<223> dCas9-mCherry质粒

<400> 14

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gacaagaagt acagcatcgg cctggccatc ggcaccaact ctgtgggctg ggccgtgatc 180

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggacgccatc 2640

gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120

cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200

ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260

aagaaaaagg gcggtgaggg cagaggaagt ctgctaacat gcggtgacgt cgaggagaat 4320

cctggcccaa tggtgagcaa gggcgaggag gataacatgg ccatcatcaa ggagttcatg 4380

cgcttcaagg tgcacatgga gggctccgtg aacggccacg agttcgagat cgagggcgag 4440

ggcgagggcc gcccctacga gggcacccag accgccaagc tgaaggtgac caagggtggc 4500

cccctgccct tcgcctggga catcctgtcc cctcagttca tgtacggctc caaggcctac 4560

gtgaagcacc ccgccgacat ccccgactac ttgaagctgt ccttccccga gggcttcaag 4620

tgggagcgcg tgatgaactt cgaggacggc ggcgtggtga ccgtgaccca ggactcctcc 4680

ctgcaggacg gcgagttcat ctacaaggtg aagctgcgcg gcaccaactt cccctccgac 4740

ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct cctccgagcg gatgtacccc 4800

gaggacggcg ccctgaaggg cgagatcaag cagaggctga agctgaagga cggcggccac 4860

tacgacgctg aggtcaagac cacctacaag gccaagaagc ccgtgcagct gcccggcgcc 4920

tacaacgtca acatcaagtt ggacatcacc tcccacaacg aggactacac catcgtggaa 4980

cagtacgaac gcgccgaggg ccgccactcc accggcggca tggacgagct gtacaagtag 5040

<210> 15

<211> 139

<212> RNA

<213> 人工序列

<220>

<223> MsgRNA

<400> 15

gcacucaaac acgccuuugc guuuuagagc uacccgggac gcggguccgg gacaguagca 60

aguuaaaaua aggcuagucc guuaucaacu ucugaggccu uggcgaggcu ucuaaguggc 120

accgagucgg ugcuuuuuu 139

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P16正向引物

<400> 16

ccccttgcct ggaaagatac 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P16反向引物

<400> 17

agcccctcct ctttcttcct 20

<210> 18

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P16正向引物

<400> 18

caacgcaccg aatagttacg 20

<210> 19

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> P16反向引物

<400> 19

agcaccacca gcgtgtc 17

<210> 20

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> GN2向导序列

<400> 20

guuaggaaua aaagcuuuga 20

<210> 21

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G100向导序列

<400> 21

gugaaccgag agagaucgug 20

<210> 22

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G101向导序列

<400> 22

gcccccauua agaaccacug u 21

<210> 23

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G102向导序列

<400> 23

gguugccagg augggaggga 20

<210> 24

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G103向导序列

<400> 24

guucuucuca aaaaagaaag u 21

<210> 25

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G25向导序列

<400> 25

gacaggacag uauuugaagc 20

<210> 26

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G126向导序列

<400> 26

gguuuauuua auacggacgg 20

<210> 27

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G127向导序列

<400> 27

gacagccguu uuacacgcag g 21

<210> 28

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G128向导序列

<400> 28

gcaggugauu ucgauucucg g 21

<210> 29

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G2向导序列

<400> 29

gcacucaaac acgccuuugc 20

<210> 30

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G82向导序列

<400> 30

guaucgcgga ggaaggaaac g 21

<210> 31

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G107向导序列

<400> 31

gcauggagcc uucggcugac 20

<210> 32

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G108向导Se

<400> 32

guggccagcc agucagccga 20

<210> 33

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G122向导序列

<400> 33

gccgcagccg ccgagcgcac g 21

<210> 34

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G123向导序列

<400> 34

gaggggcugg cuggucacca g 21

<210> 35

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G109向导序列

<400> 35

gcaccgaaua guuacggucg g 21

<210> 36

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G112向导序列

<400> 36

gaaaaagggg aggcuuccug 20

<210> 37

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G113向导序列

<400> 37

ggauuaucag uggaaaucug 20

<210> 38

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G114向导序列

<400> 38

gaaagaaaug uaagaugugc u 21

<210> 39

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G115向导序列

<400> 39

gaagaaagau aagcuccauc c 21

<210> 40

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G116向导序列

<400> 40

gugaagggau uacaaggcgu g 21

<210> 41

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P16正向引物

<400> 41

caacgcaccg aatagttacg 20

<210> 42

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> P16反向引物

<400> 42

agcaccacca gcgtgtc 17

<210> 43

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> R2序列

<400> 43

cccgggacgc ggguccggga cag 23

<210> 44

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> R5序列

<400> 44

cugaggccuu ggcgaggcuu cu 22

<210> 45

<211> 100

<212> RNA

<213> 人工序列

<220>

<223> 原始sgRNA序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 45

nnnnnnnnnn nnnnnnnnng uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu 100

<210> 46

<211> 100

<212> RNA

<213> 人工序列

<220>

<223> sgRNA序列修改

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 46

nnnnnnnnnn nnnnnnnnng uuugagagcu agaaauagca aguucaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu 100

<210> 47

<211> 160

<212> RNA

<213> 人工序列

<220>

<223> sgSAM对比序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 47

nnnnnnnnnn nnnnnnnnng uuuuagagcu aggccaacau gaggaucacc caugucugca 60

gggccuagca aguuaaaaua aggcuagucc guuaucaacu uggccaacau gaggaucacc 120

caugucugca gggccaagug gcaccgaguc ggugcuuuuu 160

<210> 48

<211> 119

<212> RNA

<213> 人工序列

<220>

<223> MsgDiR1 R2-茎环2序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 48

nnnnnnnnnn nnnnnnnnng uuugagagcu acccgggacg cggguccggg acaguagcaa 60

guucaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuuuu 119

<210> 49

<211> 118

<212> RNA

<213> 人工序列

<220>

<223> MsgDiR2 R5-茎环2序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 49

nnnnnnnnnn nnnnnnnnng uuugagagcu acugaggccu uggcgaggcu ucuuagcaag 60

uucaaauaag gcuaguccgu uaucaacuug aaaaaguggc accgagucgg ugcuuuuu 118

<210> 50

<211> 118

<212> RNA

<213> 人工序列

<220>

<223> MsgDiR3四环-R2序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 50

nnnnnnnnnn nnnnnnnnng uuugagagcu agaaauagca aguucaaaua aggcuagucc 60

guuaucaacu ucccgggacg cggguccggg acagaguggc accgagucgg ugcuuuuu 118

<210> 51

<211> 117

<212> RNA

<213> 人工序列

<220>

<223> MsgDiR4 四环-R5序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 51

nnnnnnnnnn nnnnnnnnng uuugagagcu agaaauagca aguucaaaua aggcuagucc 60

guuaucaacu ucugaggccu uggcgaggcu ucuaguggca ccgagucggu gcuuuuu 117

<210> 52

<211> 138

<212> RNA

<213> 人工序列

<220>

<223> MsgDiR5 R5-R2序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 52

nnnnnnnnnn nnnnnnnnng uuugagagcu acugaggccu uggcgaggcu ucuuagcaag 60

uucaaauaag gcuaguccgu uaucaacuuc ccgggacgcg gguccgggac agaaguggca 120

ccgagucggu gcuuuuuu 138

<210> 53

<211> 138

<212> RNA

<213> 人工序列

<220>

<223> MsgDiR6 R2-R5序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 53

nnnnnnnnnn nnnnnnnnng uuugagagcu acccgggacg cggguccggg acaguagcaa 60

guucaaauaa ggcuaguccg uuaucaacuu cugaggccuu ggcgaggcuu cuaaguggca 120

ccgagucggu gcuuuuuu 138

<210> 54

<211> 139

<212> RNA

<213> 人工序列

<220>

<223> MsgDiR7 R2-R2序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 54

nnnnnnnnnn nnnnnnnnng uuugagagcu acccgggacg cggguccggg acaguagcaa 60

guucaaauaa ggcuaguccg uuaucaacuu cccgggacgc ggguccggga cagaaguggc 120

accgagucgg ugcuuuuuu 139

<210> 55

<211> 137

<212> RNA

<213> 人工序列

<220>

<223> MsgDiR8 R5-R5序列

<220>

<221> misc_feature

<222> (1)..(19)

<223> n是a、c、g或u

<400> 55

nnnnnnnnnn nnnnnnnnng uuugagagcu acugaggccu uggcgaggcu ucuuagcaag 60

uucaaauaag gcuaguccgu uaucaacuuc ugaggccuug gcgaggcuuc uaaguggcac 120

cgagucggug cuuuuuu 137

<210> 56

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> p16-F引物

<400> 56

caacgcaccg aatagttacg 20

<210> 57

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> p16-R引物

<400> 57

agcaccacca gcgtgtc 17

<210> 58

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CEBPA-F引物

<400> 58

tataggctgg gcttcccctt 20

<210> 59

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CEBPA-R引物

<400> 59

agctttctgg tgtgactcgg 20

<210> 60

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> p14-F引物

<400> 60

gcaggttctt ggtgaccctc 20

<210> 61

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> p14-R引物

<400> 61

ccatcatcat gacctggtct tcta 24

<210> 62

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> p15-F引物

<400> 62

tagtggagaa ggtgcgacag 20

<210> 63

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> p15-R引物

<400> 63

gcgctgccca tcatcatg 18

<210> 64

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> ACTB-F引物

<400> 64

tgaagtgtga cgtggacatc 20

<210> 65

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> ACTB-R引物

<400> 65

ggaggagcaa tgatcttgat 20

<210> 66

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> GN2向导RNA

<400> 66

guuaggaaua aaagcuuuga 20

<210> 67

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G2向导RNA

<400> 67

gcacucaaac acgccuuugc 20

<210> 68

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G19向导RNA

<400> 68

gcucccccgc cugccagcaa 20

<210> 69

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G36向导RNA

<400> 69

gcuaacugcc aaauugaauc g 21

<210> 70

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G108向导RNA

<400> 70

guggccagcc agucagccga 20

<210> 71

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> G122向导RNA

<400> 71

gccgcagccg ccgagcgcac g 21

<210> 72

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G110向导RNA

<400> 72

gacccucuac ccaccuggau 20

<210> 73

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> p16-BSP-C-F1引物

<400> 73

tggtttttgg attattgtgt aatttt 26

<210> 74

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> p16-BSP-C-R1引物

<400> 74

ctttcctaat tataaaaacc ccacc 25

<210> 75

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> p16-BSP-4F引物

<400> 75

aatttggtag ttaggaaggt tgta 24

<210> 76

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> p16-BSP-4R引物

<400> 76

tccccaccta ccccccaca 19

<210> 77

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> p16_BSP_original_F引物

<400> 77

tttttagagg atttgaggga tagg 24

<210> 78

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> p16_BSP_original_R引物

<400> 78

ctacctaatt ccaattcccc taca 24

<210> 79

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> Fp16-BSP-D3-F1引物

<400> 79

tttaggtggg tagagggttt gtag 24

<210> 80

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> Rp16-BSP-D3-R1引物

<400> 80

aactcctcat tcctcttcct taact 25

<210> 81

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> p16-E-BSP-F1引物

<400> 81

ttaggtgggt agagggtttg tag 23

<210> 82

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> p16-E-BSP-R1引物

<400> 82

caaactaaaa taaaataact ccatct 26

<210> 83

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> p16_BS_F引物

<400> 83

atttggtagt taggaaggtt gta 23

<210> 84

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> p16 _BS_R引物

<400> 84

ccaaaaaacc tccccttttt cc 22

<210> 85

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> p16_BS_F引物

<400> 85

atttggtagt taggaaggtt gta 23

<210> 86

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> p16_BS_R引物

<400> 86

ccaaaaaacc tccccttttt cc 22

<210> 87

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> p16外显子1 UF引物

<400> 87

ttattagagg gtggggtgga ttgt 24

<210> 88

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> p16外显子1 UR引物

<400> 88

ccacctaaat caacctccaa cca 23

<210> 89

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> p16外显子1 MF引物

<400> 89

ttattagagg gtggggcgga tcgc 24

<210> 90

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> p16外显子1 MR引物

<400> 90

ccacctaaat cgacctccga ccg 23

<210> 91

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> P16-F

<400> 91

ggtggggctc tcacaact 18

<210> 92

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> P16-R

<400> 92

ccttcctccg cgatacaa 18

<210> 93

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P14-F（阳性对照）

<400> 93

agaagtctgc cgctcctcta 20

<210> 94

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P14-R（阳性对照）

<400> 94

acagatcaga cgtcaagccc 20

<210> 95

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P15-F（阳性对照）

<400> 95

gtgaagccca agtactgcct 20

<210> 96

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P15-F（阳性对照）

<400> 96

tcactgtgga gacgttggtg 20

<210> 97

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Down10K-1F（阴性对照）

<400> 97

aggagcccat agcttgtgga 20

<210> 98

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> Down10K-1R（阴性对照）

<400> 98

gatacttcca ctagacatct tgtca 25

<210> 99

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> Up50K-1F（阴性对照）

<400> 99

ataaagcatt gcaggagctt aca 23

<210> 100

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> Up50K-1R（阴性对照）

<400> 100

cctacacatt tttgtggcct gttt 24

<210> 101

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> Csp6I-NlaIII-1F引物

<400> 101

gcctccgacc gtaactattc g 21

<210> 102

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> Csp6I-NlaIII-1R引物

<400> 102

aggacgaagt ttgcagggg 19

<210> 103

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> DpnII-NlaIII-1F引物

<400> 103

cattggaagg acggactcca tt 22

<210> 104

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> DpnII-NlaIII-1R引物

<400> 104

tggaaagata ccgcggtcc 19

<210> 105

<211> 92

<212> DNA

<213> 人工序列

<220>

<223> Csp6I-NlaIII-C-502引物

<400> 105

aatgatacgg cgaccaccga gatctacacc tctctattcg tcggcagcgt cagatgtgta 60

taagagacag aagccaagga agaggaatga gg 92

<210> 106

<211> 92

<212> DNA

<213> 人工序列

<220>

<223> Csp6I-NlaIII-C-501引物

<400> 106

aatgatacgg cgaccaccga gatctacact agatcgctcg tcggcagcgt cagatgtgta 60

taagagacag aagccaagga agaggaatga gg 92

<210> 107

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> Csp6I-NlaIII-N-703引物

<400> 107

caagcagaag acggcatacg agatttctgc ctgtctcgtg ggctcggaga tgtgtataag 60

agacagccag ccagtcagcc gaag 84

<210> 108

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> Csp6I-NlaIII-N-701引物

<400> 108

caagcagaag acggcatacg agattcgcct tagtctcgtg ggctcggaga tgtgtataag 60

agacagccag ccagtcagcc gaag 84

<210> 109

<211> 92

<212> DNA

<213> 人工序列

<220>

<223> DpnII-NlaIII-D-501引物

<400> 109

aatgatacgg cgaccaccga gatctacact agatcgctcg tcggcagcgt cagatgtgta 60

taagagacag tgctcagtgt tctagaagca ga 92

<210> 110

<211> 92

<212> DNA

<213> 人工序列

<220>

<223> DpnII-NlaIII-D-502引物

<400> 110

aatgatacgg cgaccaccga gatctacacc tctctattcg tcggcagcgt cagatgtgta 60

taagagacag tgctcagtgt tctagaagca ga 92

<210> 111

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> DpnII-NlaIII-N-704引物

<400> 111

caagcagaag acggcatacg agatgctcag gagtctcgtg ggctcggaga tgtgtataag 60

agacagggag agggggagag cagg 84

<210> 112

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> DpnII-NlaIII-N-702引物

<400> 112

caagcagaag acggcatacg agatctagta cggtctcgtg ggctcggaga tgtgtataag 60

agacagggag agggggagag cagg 84

<210> 113

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> G111向导RNA

<400> 113

gcccccaggg cgucgccagg 20

Claims

1.一种寡核苷酸，包含：

靶向部分，所述靶向部分与基因内、基因附近或基因内及附近的基因组DNA区域具有序列互补性和结合亲和力；和

2.根据权利要求1所述的寡核苷酸，其中所述靶向部分与所述基因内、所述基因附近或所述基因内及附近的所述基因组DNA的非模板链具有序列互补性和结合亲和力。

3.根据权利要求1所述的寡核苷酸，其中所述DiR的R2和R5茎环来自外编码CEBPA(ecCEBPA)。

4.根据权利要求1所述的寡核苷酸，其中所述靶向部分靶向所述基因组DNA的甲基化区域。

5.根据权利要求1所述的寡核苷酸，其中所述靶向部分靶向启动子区域内或附近或者所述基因的脱甲基核心区域内或附近的基因组DNA区域；优选地其中所述靶向部分靶向所述基因的第一外显子的5'端处或附近的区域和/或第一外显子的3'端处或附近的区域和/或第一外显子的中间区域；更优选地其中所述靶向部分靶向与所述基因的第一外显子相关的近端启动子区域处或附近的区域和/或第一内含子的起始处或附近的区域和/或第一外显子的中间区域。

6.根据权利要求1所述的寡核苷酸，其中所述寡核苷酸包含以下序列：

(式I)

其中

R_a包含所述靶向部分，并且长度包含约20至约21个核苷酸；

R_b是A、G或C，并且R_d是R_b的互补碱基对；

R_c包含所述DiR的R2茎环，包含序列CCCGGGACGCGGGUCCGGGACAG(SEQ ID NO：7)；

R_e包含所述DiR的R5阶梯环，包含序列CUGAGGCCUUGGCGAGGCUUCU(SEQ ID NO：8)；并且

R_f是任选地存在的，并且包含多聚U转录终止序列。

7.根据权利要求6所述的寡核苷酸，包含以下序列：

(式II)

8.根据权利要求6所述的寡核苷酸，其中所述基因是P16，并且R_a包含：

GCUCCCCCGCCUGCCAGCAA(SEQ ID NO：9)；

GCUAACUGCCAAAUUGAAUCG(SEQ ID NO：10)；

GACCCUCUACCCACCUGGAU(SEQ ID NO：11)；或

GCCCCCAGGGCGUCGCCAGG(SEQ ID NO：12)。

9.一种质粒或载体，编码根据权利要求1-8中任一项所述的寡核苷酸。

10.一种组合物，包含根据权利要求1-8中任一项所述的寡核苷酸和死Cas9(dCas9)。

11.一种组合物，包含以下中的任何一者或多者：

根据权利要求1-8中任一项所述的寡核苷酸；

质粒或载体，编码根据权利要求1-8中任一项所述的寡核苷酸；

药物可用的载体、赋形剂、稀释剂或缓冲剂；

死Cas9(dCas9)；或者

编码死Cas9(dCas9)的寡核苷酸、质粒或载体。

12.根据权利要求11所述的组合物，其中所述dCas9包含D10A和H840A突变。

13.一种组合物，包含：

根据权利要求1-7中任一项所述的寡核苷酸，其中所述靶向部分靶向基因的第一外显子的5'端处或附近的区域；和

根据权利要求1-7中任一项所述的寡核苷酸，其中所述靶向部分靶向所述基因的第一外显子的3'端处或附近的区域；和

任选地，还包含根据权利要求1-7中任一项所述的寡核苷酸，其中所述靶向部分靶向所述基因的第一外显子的中间区域；

优选地，其中所述组合物包含根据权利要求1-7中任一项所述的寡核苷酸，其中所述靶向部分靶向与所述第一外显子结合的近端启动子区域处或附近的区域；和根据权利要求1-7中任一项所述的寡核苷酸，其中所述靶向部分靶向第一内含子起始处或附近的区域；并且任选地还包含根据权利要求1-7中任一项所述的寡核苷酸，其中所述靶向部分靶向所述基因的第一外显子的中间区域。

14.根据权利要求1-7中任一项所述的寡核苷酸的组合，其中所述靶向部分靶向基因的第一外显子的5'端处或附近的区域；和根据权利要求1-7中任一项所述的寡核苷酸，其中所述靶向部分靶向所述基因的第一外显子的3'端处或附近的区域。

15.一种用于基因靶向脱甲基和/或激活的方法，所述方法包括：

与基因内、基因附近或基因内及附近的基因组DNA区域具有序列互补性和结合亲和力的靶向部分；和

借此通过抑制DNA甲基转移酶1(DNMT1)对所述基因的活性而使所述基因脱甲基和/或激活。

16.根据权利要求15所述的方法，其中所述一种或多种寡核苷酸中的至少一种的所述靶向部分与所述基因内、所述基因附近或所述基因内及附近的所述基因组DNA的非模板链具有序列互补性和结合亲和力。

17.根据权利要求15所述的方法，其中所述引入步骤包括将所述一种或多种寡核苷酸和所述dCas9在所述细胞中转染、递送或表达。

18.根据权利要求15所述的方法，其中所述一种或多种寡核苷酸包含：

19.根据权利要求15所述的方法，其中将至少两种寡核苷酸引入所述细胞，其中所述第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'端处或附近的区域；并且其中所述第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'端处或附近的区域；优选地其中所述第一寡核苷酸的靶向部分靶向与所述第一外显子相关的近端启动子区域处或附近的区域并且所述第二寡核苷酸的靶向部分靶向第一内含子起始处或附近的区域；任选地其中将第三寡核苷酸引入所述细胞，其中所述第三寡核苷酸的靶向部分靶向所述第一外显子的中间区域。

20.根据权利要求15所述的方法，其中将所述细胞暴露于所述dCas9和所述一种或多种寡核苷酸至少约3天、至少约4天、至少约5天、至少约6天、至少约7天或者至少约8天或者约3天至约1周的时间。

21.根据权利要求1-8中任一项所述的寡核苷酸用于基因靶向脱甲基和/或激活的用途。

22.一种用于治疗对其有需要的受试者中与由于异常DNA甲基化所造成的至少一种基因表达降低有关的疾病或病症的方法，所述方法包括：

借此通过抑制DNA甲基转移酶1(DNMT1)对所述基因的活性而使所述基因脱甲基和/或激活，并且治疗所述疾病或病症。

23.根据权利要求22所述的方法，其中所述一种或多种寡核苷酸中的至少一种的靶向部分与所述基因内、所述基因附近或所述基因内及附近的所述基因组DNA的非模板链具有序列互补性和结合亲和力。

24.根据权利要求22所述的方法，其中所述治疗步骤包括将所述一种或多种寡核苷酸和所述dCas9在所述受试者的至少一种细胞中转染、递送或表达。

25.根据权利要求22所述的方法，其中所述一种或多种寡核苷酸包含：靶向部分，所述靶向部分与基因内、基因附近或基因内及附近的基因组DNA区域具有序列互补性和结合亲和力；和

26.根据权利要求22所述的方法，其中使用至少两种寡核苷酸，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'端处或附近的区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'端处或附近的区域；优选地其中所述第一寡核苷酸的靶向部分靶向与所述第一外显子相关的近端启动子区域处或附近的区域并且所述第二寡核苷酸的靶向部分靶向第一内含子起始处或附近的区域；任选地其中使用第三寡核苷酸，其中所述第三寡核苷酸的靶向部分靶向所述第一外显子的中间区域。

27.根据权利要求22所述的方法，其中将所述受试者暴露于所述dCas9和所述一种或多种寡核苷酸至少约3天、至少约4天、至少约5天、至少约6天、至少约7天或者至少约8天或者约3天至约1周的时间。

28.根据权利要求1-8中任一项所述的寡核苷酸用于治疗对其有需要的受试者中与由于异常DNA甲基化所造成的至少一种基因表达降低有关的疾病或病症的用途。

29.根据权利要求22所述的方法，其中所述一种或多种寡核苷酸中的至少一种的靶向部分靶向所述基因的启动子区域内或附近的位点或者所述基因的脱甲基核心区域内或附近的位点，优选地其中所述靶向部分靶向所述第一外显子的5'端处或附近的区域或者所述基因的第一外显子的3'端处或附近的区域或者所述基因的第一外显子的中间区域。

30.根据权利要求29所述的方法，其中使用至少两种寡核苷酸，其中第一寡核苷酸的靶向部分靶向所述基因的第一外显子的5'端处或附近的区域；并且其中第二寡核苷酸的靶向部分靶向所述基因的第一外显子的3'端处或附近的区域。

31.根据权利要求29所述的方法，其中所述启动子区域是具有至少一些甲基化的CpG-富集区域。

32.根据权利要求22所述的方法，其中所述疾病或病症包含癌症。

33.根据权利要求32所述的方法，其中所述基因是肿瘤抑制基因。

34.根据权利要求32所述的方法，其中所述一种或多种寡核苷酸中的至少一种的靶向部分靶向所述基因的启动子区域内或附近的位点或者所述基因的脱甲基核心区域内或附近的位点，优选地其中所述靶向部分靶向所述基因的所述第一外显子的5'端处或附近的区域或者所述第一外显子的3'端处或附近的区域，其中所述基因是肿瘤抑制基因。

35.根据权利要求34所述的方法，其中所述启动子区域是具有至少一些甲基化的CpG-富集区域。

36.根据权利要求32所述的方法，其中所述一种或多种寡核苷酸中的至少一种的所述靶向部分靶向P16基因的区域D1或D3。

37.根据权利要求36所述的方法，其中所述一种或多种寡核苷酸包括具有靶向所述区域D1的靶向部分的至少一种寡核苷酸，和具有靶向所述区域D3的靶向部分的至少一种寡核苷酸，并且任选地还包括具有靶向区域D2的靶向部分的至少一种寡核苷酸。

38.根据权利要求22所述的方法，其中所述一种或多种寡核苷酸包含以下中的一种或多种：

G19sgR2R5(SEQ ID NO：1)：

G36sgR2R5(SEQ ID NO：2)：

G110sgR2R5(SEQ ID NO：3)：

G111sgR2R5(SEQ ID NO：4)：

G108sgR2R5(SEQ ID NO：5)：

G122sgR2R5(SEQ ID NO：6)：

或它们的任意组合。

39.一种用于识别一个或多个脱甲基靶向位点以激活基因在细胞中的表达的方法，所述方法包括：

用非特异性脱甲基试剂处理所述细胞；

40.根据权利要求39所述的方法，其中所述非特异性脱甲基试剂包括地西他滨(2'-脱氧-5-氮杂胞苷)。

41.根据权利要求39所述的方法，其中用所述非特异性脱甲基试剂处理约3天。

42.根据权利要求39所述的方法，其中识别所述基因的转录起始位点周围的一个或多个通过用所述非特异性脱甲基试剂处理而大部分脱甲基的区域的步骤包括实施亚硫酸氢盐Sanger-测序或者全基因组亚硫酸氢盐测序，并且任选地将结果与对照未处理细胞相比较。

43.根据权利要求39所述的方法，其中所述转录起始位点周围的所述一个或多个区域的选择有利于所述启动子处或附近、所述基因的第一外显子处或附近、所述基因的第一内含子处或附近、所述基因的第一外显子的5'区域处或附近、所述基因的第一外显子的3'区域处或附近、CpG岛处或附近、另一个重要调控区域处或附近的区域或它们的任意组合的选择。

44.根据权利要求43所述的方法，其中所述转录起始位点周围的一个或多个区域的选择有利于所述基因的第一外显子的5'端处或附近的区域处或附近的至少一个区域和所述基因的第一外显子的3'端处或附近的区域处或附近的至少一个区域的选择。

45.根据权利要求39所述的方法，其中所述方法还包括：将死Cas9(dCas9)和一种或多种寡核苷酸引入所述细胞，所述一种或多种寡核苷酸分别包含：靶向部分，所述靶向部分与基因内、基因附近或基因内及附近的基因组DNA区域具有序列互补性和结合亲和力；和单向导RNA(sgRNA)支架部分，其中所述sgRNA的四环部分被修饰并且包含DNMT1相互作用RNA(DiR)的R2茎环，并且其中所述sgRNA的茎环2部分被修饰并且包含DiR的R5阶梯环；借此通过抑制DNA甲基转移酶1(DNMT1)对所述基因的活性而使所述基因脱甲基和/或激活；其中所述一种或多种寡核苷酸的靶向部分与所识别的脱甲基靶向位点具有序列互补性。

46.根据权利要求39所述的方法，其中所述一个或多个区域是所述非模板链区域。