CN106460050A - 使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰 - Google Patents

使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰 Download PDF

Info

Publication number
CN106460050A
CN106460050A CN201580023619.7A CN201580023619A CN106460050A CN 106460050 A CN106460050 A CN 106460050A CN 201580023619 A CN201580023619 A CN 201580023619A CN 106460050 A CN106460050 A CN 106460050A
Authority
CN
China
Prior art keywords
sequence
nucleic acid
cell
epigenetic modification
cytimidine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580023619.7A
Other languages
English (en)
Inventor
G.D.戴维斯
康巧华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sigma Aldrich Co LLC
Original Assignee
Sigma Aldrich Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sigma Aldrich Co LLC filed Critical Sigma Aldrich Co LLC
Publication of CN106460050A publication Critical patent/CN106460050A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2503/00Use of cells in diagnostics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Abstract

本公开提供了包含具有预定表观遗传修饰的染色体整合合成序列的遗传改造细胞系,其中预定表观遗传修饰与已知的诊断、预后或对疾病治疗的敏感性水平相关。还提供了试剂盒,其包括可用作用于预测对治疗性处理的响应性、诊断疾病或预测疾病预后的参照标准的所述表观遗传修饰的合成核酸或包含所述表观遗传修饰的合成核酸的细胞。

Description

使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰
发明领域
本公开涉及基因组序列的表观遗传修饰。具体而言,本公开内容涉及包含具有预定表观遗传修饰的染色体整合的核酸序列的遗传改造细胞系。
背景
基因功能异常和基因表达模式改变是许多疾病和病状的关键特征。越来越多的证据表明,表观遗传改变与遗传畸变共同参与引起调控异常。基因组DNA的表观遗传修饰的检测和量化的最近进展正在产生用于许多疾病(例如,癌症)的新一代诊断和预后测定。此外,表观遗传改变已被证实与对某些疾病治疗方案的敏感性水平相关,并且因此被用于治疗决策中。
仅管基于表观遗传修饰的诊断和预后测定以及治疗方案的开发有所进展,但目前仍缺乏可用于评估表观遗传改变状态的细胞参照标准。
发明概述
近年来,利用基因组编辑技术的进展来修饰人细胞的基因组以产生反映出临床样本中观测到的基因型的疾病模型一直备受关注。除了出于研究目的分析表型之外,遗传或表观遗传改造细胞还可用作临床测定的基因分型参照或标准。此类工程参照细胞系的优点是:(1)它们在进行细胞裂解(或福尔马林固定、石蜡包埋(FFPE)提取)、DNA分离和扩增的所有后续的诊断处理步骤的天然细胞和基因组环境内提供了DNA测定模板,以及(2)可以将遗传的或表观遗传的改变模型化成稳定且提供大量基因组DNA的细胞类型。
本公开的一个方面提供了包含具有预定表观遗传修饰的至少一种染色体整合核酸的遗传改造细胞系,其中所述预定表观遗传修饰与已知的诊断、预后和/或对疾病治疗的敏感性水平相关。在一些方面,所述表观遗传修饰是胞嘧啶的修饰,例如胞嘧啶的甲基化。在某些方面,表观遗传修饰的核酸与和疾病有关的基因的控制元件或控制元件的一部分的核酸具有基本的序列同一性。在其它方面,表观遗传修饰的核酸与和疾病有关的基因的编码区或编码区的一部分的核酸具有基本的序列同一性。本文提供了具有与疾病和/或疾病治疗结果有关的表观遗传改变的基因的实例。在一些方面,表观遗传修饰的核酸可以替换表观遗传修饰的核酸所来源于的内源性染色体序列。因此,内源性染色体序列的天然表观遗传状态可以变成插入的合成核酸的预定表观遗传状态。另选地,具有预定表观遗传修饰的核酸可以在具有相邻的绝缘元件或有助于维持插入的核酸的预定表观遗传修饰状态的其它元件的基因座诸如AAVS1、CCR5或SOSA26处插入。在此类情况下,可以使对应于合成的表观遗传修饰序列的内源性染色体序列失活或缺失。整合的核酸的表观遗传修饰状态可以是稳定的或亚稳定的。具有表观遗传修饰的核酸可以使用靶向性核酸内切酶来插入目标染色体位置中。靶向性核酸内切酶可以是锌指核酸酶、基于CRISPR的核酸内切酶、大范围核酸酶、转录激活因子样效应物核酸酶(TALEN)、I-TevI核酸酶或相关单体杂交体或人工的靶向DNA双链断裂诱导剂。任选地,包含整合的表观遗传修饰序列的细胞还可以包含至少一种编码重组蛋白的核酸。工程细胞系可以是哺乳动物细胞系,包括人细胞系。
包含具有预定表观遗传修饰的整合核酸的工程细胞或细胞系具有若干用途。在某些方面,携带改变调控区的表观遗传状态的合成序列的插入的工程细胞可以用于控制或改变基因表达。例如,具有除了不正常修饰的(即,不正常甲基化的或过甲基化的)内源性调控染色体序列之外的或代替其的表观遗传修饰的合成序列(诸如,甲基化序列)的插入的细胞可用于改变基因表达。相反地,使用没有表观遗传修饰的合成序列替换已知具有表观遗传修饰的内源性调控序列或插入没有表观遗传修饰的合成序列可以用于改变基因表达。在另一方面,可以使用具有表观遗传修饰序列的插入的工程细胞基于插入序列的表观遗传修饰模式或状态的先验知识来分析修饰序列在细胞中的表观遗传稳定性。在其它方面,具有表观遗传修饰序列的插入的工程细胞可以凭借它们已知的或预定的表观遗传修饰状态而在诊断和/或预后测定中用作参照细胞系,所述表观遗传修饰状态允许工程细胞在所述测定中充当诊断和/或预后标准。在另外方面,具有表观遗传修饰序列的插入的细胞可以在测定中用来评估药物治疗方案的适用性(参见,图3)。因此,表观遗传修饰的序列和含有所述序列的细胞可以在用于诊断疾病(诸如,癌症)、预测疾病结果、监测疾病行为和测量对靶向疗法的应答的测定中用作参照标准。
本公开还提供用于预测受试者中疾病对治疗性处理的响应性、诊断受试者的疾病或预测受试者的疾病的预后的试剂盒,其中试剂盒包括至少一种具有预定表观遗传修饰的核酸,所述预定表观遗传修饰与已知的诊断、预后或对疾病治疗的敏感性水平相关。
本公开的其它方面和迭代在以下进行了更详细的描述。
附图简述
图1A示出使用锌指核酸酶(ZFN)技术进行的合成的甲基化DNA的靶向整合。示出了AAVS1靶位点被靶向ZFN裂解,并且包含19bp MGMT基因片段的供体序列通过细胞DNA修复过程整合到靶位点中。
图1B示出三种不同的预定甲基化模式。*符号是指MGMT基因片段内的四个CpG位点(即,1、2、3、4)。
图2示出合成甲基化模式随时间推移的稳定性。绘出了在培养物中49天或80天后菌落#1或菌落#7中MGMT基因片段中的每个CpG位点处的甲基化百分比。
图3呈现了示出使用MGMT启动子甲基化状态以确定是否将替莫唑胺开具处方以治疗成胶质细胞瘤的示意图。
发明详述
本公开提供包含表观遗传修饰的合成核酸,以及包含如本文所详述的所述合成序列的工程细胞或细胞系。表观遗传修饰对疾病表型(特别是关于癌症)的影响被日益理解。包含具有根据本公开的表观遗传修饰的合成序列的细胞可模型化成稳定且提供可用于研究和临床目的的大量基因组DNA的细胞类型。本公开的细胞还可以充当用于涉及哺乳动物细胞中的表观遗传修饰的测定的生理上相关的和稳健的细胞参照标准。此类标准可用于诊断和预后测定以及个体受试者中治疗方案的评估。
I.具有预定表观遗传修饰的核酸
(a)表观遗传修饰
本公开提供具有预定表观遗传修饰的核酸,其中所述预定表观遗传修饰与已知的诊断、预后或对疾病治疗的敏感性水平相关。一般来讲,表观遗传修饰的核酸是以化学方法产生所述表观遗传修饰的合成核酸。在一个方面,所述表观遗传修饰为胞嘧啶修饰。胞嘧啶修饰可以是本领域普通技术人员已知的任何此类修饰,诸如胞嘧啶的甲基化(包括5-甲基胞嘧啶(5mC)、3-甲基胞嘧啶(3mC)和5-羟甲基胞嘧啶)、5-甲酰基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC)。在一个实施方案中,所述表观遗传修饰是胞嘧啶的甲基化,包括例如5-甲基胞嘧啶(5mC)、3-甲基胞嘧啶(3mC)和5-羟甲基胞嘧啶。在一种情况下,修饰的胞嘧啶为5-甲基胞嘧啶。在一个实施方案中,所述甲基化的胞嘧啶存在于CpG中,所述CpG可以以单个CpG位点存在或聚集在CpG簇(称为CpG岛)中。
在一个方面,胞嘧啶修饰是甲基化状态胞嘧啶的修饰,其包括甲基化和羟甲基化两者。甲基化状态是指诸如序列中甲基化胞嘧啶残基的数目或百分比(即,甲基化水平)或序列内甲基化残基的模式的特征。预定甲基化状态可以基于目标基因以及产物的预期用途进行定制。在一些方面,细胞参照标准合乎希望地表现出高水平的甲基化,或另选地,可能优选低甲基化或无甲基化。应当理解,用于计算甲基化水平的若干不同的准则是本领域的普通技术人员已知的。例如,甲基化水平可以是特定的CpG岛中甲基化残基的百分比,或若干CpG岛上的甲基化的平均值。本领域的技术人员将理解,除CpG岛之外的特征结构也可以是甲基化的,诸如一般具有CHG和CHH形式的序列,其中H为A、C或T(例如,CAG、CTG、CAA、CAT等等)。还可以跨越整个染色体序列总体地测量甲基化水平。
可以使用任何适合的惯例将核酸描述为甲基化的或非甲基化的。例如,如果在特定的岛中至少10%的CpG残基是甲基化的,那么本领域的普通技术人员可以认为核酸是甲基化的,而如果小于10%的CpG残基是甲基化的,那么可以认为核酸是非甲基化的。当然,如果除CpG残基之外的特征结构是甲基化的,那么也可以视情况将此类甲基化包括在计算中。另选地,也可以将核酸描述为具有一定百分比的甲基化水平,例如,约1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的胞嘧啶残基是甲基化的。还应当理解,设想了居间值。还设想了具有0%或约0%甲基化的核酸。本领域的普通技术人员还易于定性地鉴定甲基化水平,例如,“高”、“中等”或“低”。在必要时参考以下方面可以容易地定义此类术语:(1)在正常或健康细胞的内源性染色体序列中发现的甲基化水平,(2)在具有特定表型的细胞的内源性染色体序列中发现的甲基化水平,所述特定表型包括但不限于异常表型或疾病表型和/或具有药物治疗敏感性或抗性的表型,(3)在对应于正常基因表达水平的内源性染色体序列中发现的甲基化水平;以及(4)在对应于异常基因表达水平(即,过表达或低表达)的内源性染色体序列中发现的甲基化水平。
甲基化状态可以指目标核酸中的单独的或与甲基化残基百分比组合的特定甲基化模式。然而,应当理解,本领域的普通技术人员能够解释本公开的核酸的甲基化与取自受试者的样本中检测到的内源性染色体序列的甲基化之间的异同,以及先前已知的或确定的甲基化水平和/或模式。
用于确定甲基化的水平和/或模式的方法在本领域中是已知的,并且包括例如,数字量化(Li等,Nature Biotechnology,27:858-863(2009)和补充材料(doi:10.1038/nbt.1559));甲基化特异性PCR(MSP),其涉及使染色体序列与亚硫酸氢钠反应,随后进行PCR(Herman等,PNAS,93:9821-9826(1996);Gonzalgo等,Cancer Res.,57:594-599(1997);Hegi等,Clin.Cancer Res.,10:1871-1874(2004));全基因组硫酸氢盐测序(BS-Seq);HELP测定,其涉及限制性内切酶区别地裂解甲基化和未甲基化的DNA的能力(使用甲基化敏感性限制性内切酶或依赖甲基化的限制性内切酶);ChIP-on-chip测定,其基于抗体结合到DNA甲基化相关蛋白的能力;限制性标记的基因组扫描,其类似于HELP测定(Hayashizaki等,Electrophoresis,14:251-258(1993);Costello等,Nat Genet,24:132-138(2000));甲基化DNA免疫沉淀(MeDIP),其用于分离甲基化DNA片段;硫酸氢盐处理的DNA的焦磷酸测序(Tost等,BioTechniques,35:152-156(2003));MS-qFRET(Bailey等,Genome Res,19:1455-1461(2009));定量差异甲基化区(QDMR);甲基敏感的southern印迹(类似于HELP测定);甲基化荧光(MethylLight)、MS HRM、(在Biochemistry,Genetics andMolecular Biology,第5章“DNA Methylation-from Genomics to Technology;T.Tatarinova和O.Kerton编,In-Tech,2012年3月,第93-116页中的McCarthy等,“A Quantitative,Sensitive,and Bisulfate-free Method for Analysisof DNA Methylation”);GLIB(Pastor等,Nature,473:394-397(2011));抗CMS(Pastor等,Nature,473:394-397(2011));以及CpG结合蛋白的使用,所述CpG结合蛋白用于将天然DNA分成甲基化和未甲基化部分。在Szwagierczak等,Nuc.Acids Res.,38:e181(2010)中描述了检测DNA甲基化(包括5-羟甲基胞嘧啶)的其它方法。
(b)具有预定表观遗传修饰的核酸的序列
具有本文公开的预定表观遗传修饰的核酸通常具有与目标基因的转录控制元件、转录控制元件的一部分、编码区或编码区的一部分的核苷酸序列具有基本的序列同一性的核苷酸序列,其中所述目标基因与疾病或病症有关。如本文所用,短语“基本的序列同一性”是指具有至少约75%序列同一性的序列。在各方面,具有表观遗传修饰的合成染色体序列可以与目标基因具有约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
在一些方面,具有预定表观遗传修饰的核酸与和目标基因有关的转录控制元件的核酸具有基本的序列同一性。所述控制元件可以是启动子、增强子、沉默子、基因座控制元件或调控基因转录的任何序列。所述转录控制元件可以位于目标基因的上游、下游,或目标基因的编码区或非编码区(例如,内含子)内。在具体方面,所述控制元件是位于转录起始位点的上游或目标基因的5'区内的启动子或启动子的一部分。在一些方面,控制元件的表观遗传修饰(例如,胞嘧啶甲基化)完全或部分地沉默基因的转录。
在其它方面,具有预定表观遗传修饰的核酸与和疾病有关的基因的编码区(即,一个或多个外显子)或编码区的一部分的核酸具有基本的序列同一性。在一个实施方案中,具有预定表观遗传修饰的核酸与对应的天然或内源性染色体序列(即,在正常的或非患病细胞中的对应的内源性序列或在正常基因表达(不同于过表达和低表达)过程中发现的对应的内源性序列)相比是过甲基化的。在另一个实施方案中,具有预定表观遗传修饰的核酸与对应的天然或内源性染色体序列相比是低甲基化的。包含外显子和内含子的染色体区域已知通过CpG位置(其可以作为CpG岛存在或不作为CpG岛存在)的甲基化来调节基因表达。除了如本文所提供的许多其它实例之外,具有已知的外显子和内含子甲基化应答的基因的实例还包括MGMT和CXCR4。
在一些方面,具有预定表观遗传修饰的核酸来源于与疾病有关的基因。目标基因包括已知具有表观遗传修饰序列的那些基因以及与疾病诸如癌症、自身免疫疾病(诸如1型糖尿病、炎性肠病)、炎性疾病(诸如哮喘)、代谢障碍、自闭症谱系障碍和与异常基因表达有关的其它病状有关的那些基因。特定的目标基因包括MGMT、BRCA1、BRCA2、Septin9、PITX2、GSTP1、APC、RASSF1、HER2、P15INK4B、p16INK4A、Rb、E-cad以及在本节中描述的其它基因。此外,下表A提供了目标基因的非限制性列表。
本文描述的基因包括已知被启动子区中的表观遗传修饰(诸如,被异常的DNA甲基化)完全或部分地沉默的基因(Jones等,Cell,128:683-692(2007);Jones等,Nat.Genet.,21:163-167(1999);Jones等,Nat.Rev.Genet.,3,415-428(2002))。例如过甲基化,特别是高水平的5-甲基胞嘧啶,是通过启动子区抑制转录从而阻止受影响的基因的表达的主要表观遗传修饰之一。众所周知,某些癌症与基因的过甲基化的启动子区有关,所述基因诸如肿瘤抑制基因(例如,Rb、p16ink4a、p15ink4b、p73、APC和VHL)、转录因子基因(例如,GATA-4、GATA-5、HIC1和E-钙粘素)、DNA修复基因(例如,BRCA1、WRN、FANCF、RAD51C、MGMT、MLH1、MSH2、NEIL1、FANCB、MSH4、ATM和GSTP1)、涉及细胞周期调控的基因(例如,p16ink4a、p15ink4b、p14arf和CDKN2B)、涉及凋亡的基因、涉及转移和侵袭的基因(例如,CDH1、TIMP3和DAPK)和代谢酶基因。例如,乳腺癌、卵巢癌、胃肠(胃和结肠)癌、胰腺癌、肝癌、肾癌、结直肠癌、肺癌、膀胱癌、宫颈癌、脑癌、神经胶质瘤、白血病、黑色素瘤、前列腺癌以及头颈癌与BRCA1、WRN、FANCF、RAD51C、MGMT、MLH1、MSH2、NEIL1、FANCB、MSH4、Rb、p16ink4a、p15ink4b、p73、APC、VHL、GATA-4、GATA-5、HIC1、E-钙粘素、p14arf、CDH1、TIMP3、DAPK和ATM(即,乳腺—GSTP1、BRCA1、p16ink4a、WRN;卵巢—BRCA1、WRN、FANCF、GSTP1、p16ink4a、RAD51C;结直肠—MGMT、APC、WRN、MLH1、p16ink4a、p14arf、MSH2;头颈—MGMT、MLH1、NEIL1、FANCB、MSH4、p16ink4a、DAPK、ATM;膀胱—p16ink4a、DAPK;宫颈—p16ink4a;黑色素瘤—p16ink4a;神经胶质瘤—p16ink4a;胃肠—p16ink4a、p14arf、MLH1、MGMT、APC;肝—GSTP1;前列腺—GSTP1;肺—DAPK、MGMT、p16ink4a)的过甲基化的启动子区有关。跨许多人类肿瘤类型的若干不同基因中的基因启动子甲基化的特征在Esteller等,Cancer Res,61:3225-3229(2001)以及本文引用的许多参考文献中有所报道。另参见,Baylor,Nature Clinical PracticeOncology,2:S4-S11(2005)。
本文所述的基因还包括启动子区的表观遗传修饰(诸如,异常DNA甲基化)已被证实与特定的预后或对某些治疗方案(诸如,某些化学疗法)的敏感性有关的基因。例如,mgmt启动子的甲基化一直与对替莫唑胺的响应性相关。参见,例如,Hegi等,Clin.CancerRes.10(6):1871-4(2004);Hegi等,New England J.Med.352(10):997-1003(2005);Boots-Sprenger等,Modern Pathol.26(7):922-9(2013)。同样地,brca1和brca2启动子的甲基化已经作为用于确定乳腺癌预后的制定的诊断方案的一部分来检查。参见,例如,Abkevich等,Br.J.Cancer,107(10):1776-82(2012)。另外,用于Septin9的甲基化测定已用于结直肠癌的病理评估。参见,例如,Grutzmann等,PLos One,3(11):e3759(2008)。而且,E-钙粘蛋白启动子的甲基化与肿瘤抑制能力减少和转移的可能性增加有关。参见,例如,Graff等,Cancer Res.55(22):5195-9(1995)。
本文提供的其它基因包括总体低甲基化与癌症的发展和进展有关的基因。例如,5-羟甲基胞嘧啶的缺失是黑素瘤的表观遗传标志(Lian等,2012,Cell,150:1135-1146);总体低甲基化与乳腺癌中抑制的染色质结构域和基因沉默有关(Hon等,2012,Genome Res22(2);246-58);并且在人类结肠癌组织中观测到总体低甲基化(Hernandez-Blazquez等,2000,Gut 47:689-93)。
目标基因还包括与自闭症谱系障碍(ASD)的发生和/或严重性有关的基因。虽然ASD的遗传力估计值很高,但是ASD的一致的单卵双生对(ASD-concordant monozygotictwin pairs)之间的症状严重性的明显差异表明了非遗传性表观遗传因素在ASD病因中的作用。(参见,C.Wong等,Mol.Psychiatry 2013(1-9),先进的在线出版物,2013年4月23日;doi:10.1038/mp.2013.41)。此类基因包括例如MBD4、AUTS2、MAP2、GABRB3、AFF2、NLGN2、JMJD1C、SNRPN、SNURF、UBE3A、KCNJ10、NFYC、PTPRCAP、RNF185、TINF2、AFF2、GNB2、GRB2、MAP4、PDHX、PIK3C3、SMEK2、THEX1、TCP1、ANKS1A、APXL、BPI、EFTUD2、NUDCD3、SOCS2、NUP43、CCT6A、CEP55、FCJ12505、SRF、DNPEP、TSNAX、FERD3L、RCN2、MBTPS2、PKIA、DAPP1、CCDC41、HOXC5、RPL14、PSMB7、TAF7、INHBB、HNRPA0、MC3R20、BDKRB1、FDFT1、RAD50、21cg03660451、RECQL5、ZNF499、ARHGAP15、PTPRCAP、C18orf22、RAFTLIN、C14orf143、SUPT5H、ANXA1、C16orf46、GAPDH、FKBP4、LOC112937、SLC30A3、ZNF681、SELENBP1、ELA2、DUSP2、CDC42SE1、PNMA2、POU4F3、DIDO1、SCUBE3、CASP8、THRAP5、ETS1、PXDN、TMEM161A、HOXA9、C11orf1、MGC3207、OR2L13、C19orf33、P2RY11、NRXN1和ISL1。
表A列出了示例性基因。
表A.目标基因
(c)核酸类型
具有本文公开的预定表观遗传修饰的核酸可以是单链的、双链的、线型的或环状的RNA、DNA。在表观遗传修饰的核酸是双链的迭代中,在两条链上的表观遗传修饰模式可以相同或不同。在一些实施方案中,两条链可以缺乏表观遗传修饰。在其它实施方案中,两条链中的一条可以具有表观遗传修饰(即,半修饰的)。在另外的实施方案中,两条链都可以具有表观遗传修饰(即,双修饰的)。在一些情况下,具有预定表观遗传修饰的核酸可以是单链线型分子,例如寡核苷酸。在其它情况下,表观遗传修饰的核酸可以是双链线型分子。双链线型核酸可以通过两条互补的单链核酸的退火来制备,或者此类核酸可以通过更长的双链核酸的酶促裂解来制备。在一些方面,双链线型核酸可以具有与由靶向核酸内切酶产生的突出端相匹配的突出端。(如以下所详述的,可以使用靶向性核酸内切酶来在细胞基因组中的特定靶向的位置处插入具有预定表观遗传修饰的核酸)。所述突出端长度可以是一个、两个、三个、四个、五个或更多个核苷酸。在其它迭代中,具有表观遗传修饰的线型(单链的或双链的)核酸中的一些或全部核苷酸可以通过硫代磷酸酯键连接。例如,任一端或两端上的末端的两个、三个、四个或更多个核苷酸可以具有硫代磷酸酯键。在其它方面,表观遗传修饰的核酸可以是环状的。例如,如下文所详述的,具有预定表观遗传修饰的核酸可以是较大的多核苷酸(例如,质粒载体)的一部分。
具有表观遗传修饰的核酸的长度可以变化。一般来讲,表观遗传修饰的核酸的长度可以在约5个核苷酸(nt)或碱基对(bp)至约200,000nt/bp范围内。在某些实施方案中,表观遗传修饰的核酸的长度可以在约5nt/bp至约200nt/bp、约200nt/bp至约1000nt/bp、约1000nt/bp至约5000nt/bp、约5,000nt/bp至约20,000nt/bp或约20,000nt/bp至约200,000nt/bp范围内。
在一些方面,表观遗传修饰的核酸还可以包含至少一个旁侧序列。所述旁侧序列可以在上游、在下游或两者。在一个方面,表观遗传修饰的核酸可以侧接包含限制性核酸内切酶位点的上游和/或下游序列。如上所述,表观遗传修饰的核酸可以侧接(在上游、在下游或两者)与由靶向性核酸内切酶产生的突出端相匹配的突出端。在另外的方面,表观遗传修饰的核酸可以侧接(在上游、在下游或两者)至少一个绝缘元件,所述绝缘元件可以使表观遗传修饰的核酸的表观遗传修饰稳定。绝缘元件在本领域中是已知的,参见,例如,West等Genes&Dev.16:271-88(2002);Barkess等,Epigenomics 4(1):67-80,(2012)。
在另外的方面,表观遗传修饰的核酸可以侧接(在上游、在下游或两者)与由靶向性核酸内切酶识别的靶位点的一侧上的序列具有基本的序列同一性的序列。例如,表观遗传修饰的核酸可以侧接上游序列和下游序列,所述上游序列和下游序列中的每个都与分别位于由靶向性核酸内切酶识别的靶位点的上游或下游的序列具有基本的序列同一性。在此类情况下,表观遗传修饰的核酸可以通过同源介导的过程来插入靶向的染色体位置中。如上所述,短语“基本的序列同一性”是指具有至少约75%序列同一性的序列。因此,侧接表观遗传修饰的核酸的上游和下游序列可以与靶向位点的上游或下游的序列具有约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在非限制性的实例中,侧接表观遗传修饰的核酸的上游和下游序列可以分别与靶向位点的上游或下游的染色体序列具有约95%或100%的序列同一性。
在一些方面,上游序列可以与直接位于靶向位点上游(即,与靶向位点相邻)的染色体序列共用基本的序列同一性。在其它方面,上游序列可以与位于靶向位点上游约一百(100)个核苷酸内的染色体序列共用基本的序列同一性。因此,例如,上游序列可以与位于靶向位点上游约1至约20、约21至约40、约41至约60、约61至约80或约81至约100个核苷酸的染色体序列共用基本的序列同一性。在一个实施方案中,下游序列与直接位于目标位点下游(即,与靶向位点相邻)的染色体序列共用基本的序列同一性。在其它方面,下游序列可以与位于靶向位点下游约一百(100)个核苷酸内的染色体序列共用基本的序列同一性。因此,例如,下游序列可以与位于靶向位点下游约1至约20、约21至约40、约41至约60、约61至约80或约81至约100个核苷酸的染色体序列共用基本的序列同一性。每个上游或下游序列的长度可以在约10个核苷酸至约5000个核苷酸范围内。在一些方面,上游和下游序列可以包含约10至约50、约50至约100、约100至约500、约500至约1000、约1000至约2000或约2000至约个核苷酸。在某些方面,上游和下游序列的长度可以在约20至约500个核苷酸范围内。
在其它方面,表观遗传修饰的核酸可以侧接(在上游、在下游或两者)由靶向性核酸内切酶识别(或裂解)的至少一个序列。在具体方面,表观遗传修饰的核酸可以在两侧侧接由靶向性核酸内切酶识别的靶位点。在此类情况下,靶向性核酸内切酶也可以裂解包含表观遗传修饰的核酸的较大的多核苷酸,从而释放作为线型分子的表观遗传修饰的核酸,所述线型分子具有与由靶向性核酸内切酶产生的染色体DNA中的突出端相匹配的突出端。结果,包含所述表观遗传修饰的核酸的释放序列可以通过直接连接来插入所需的染色体位置中。因此,待连接的序列末端可以是平末端或粘性末端。
在表观遗传修饰的核酸侧接如以上所详述的至少一个另外序列的实施方案中,表观遗传修饰的核酸可以是较大的多核苷酸的一部分。在一些情况下,包含表观遗传修饰的核酸和另外的序列的较大的多核苷酸可以是线型的。在其它情况下,包含表观遗传修饰的核酸和另外的序列的多核苷酸可以是环状的。例如,它可以是载体的一部分。
在表观遗传修饰的核酸是载体的一部分的实施方案中,可以使用多种载体。适合的载体包括但不限于质粒载体、噬菌粒、粘粒、人工/微型染色体、转座子以及病毒载体。在一个实施方案中,表观遗传修饰的核酸存在于质粒载体中。适合的质粒载体的非限制性实例包括pUC、pBR322、pET、pBluescript及其变体。所述载体可以包含另外的序列,诸如复制起点、选择标记序列(例如,抗生素抗性基因)等等。另外的信息可见于“Current Protocolsin Molecular Biology”Ausubel等,John Wiley&Sons,New York,2003或“MolecularCloning:A Laboratory Manual”Sambrook和Russell,Cold Spring Harbor Press,ColdSpring Harbor,NY,第3版,2001中。
在一些实施方案中,包括表观遗传修饰的核酸的载体还可以包含编码标记蛋白的序列。在一个方面,所述标记蛋白是荧光蛋白。适合的荧光蛋白的非限制性实例包括绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、单体AzamiGreen、CopGFP、AceGFP、ZsGreen1)、黄色荧光蛋白(例如,YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、蓝色荧光蛋白(例如,EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色荧光蛋白(例如,ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-单体、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)以及橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、单体Kusabira-Orange、mTangerine、tdTomato)。
(d)表观遗传修饰的核酸的产生
表观遗传修饰的核酸可以使用常规亚磷酰胺固相寡核苷酸合成技术来合成,但其中标准的胞嘧啶亚磷酰胺在适当的位置处被修饰的胞嘧啶亚磷酰胺替换。修饰的胞嘧啶亚磷酰胺诸如5-甲基胞嘧啶亚磷酰胺、5-羟甲基胞嘧啶亚磷酰胺、5-甲酰基胞嘧啶亚磷酰胺、5-羧基胞嘧啶亚磷酰胺、3-甲基胞嘧啶亚磷酰胺等是可商购获得的。当使用修饰的胞嘧啶亚磷酰胺时,本领域的技术人员熟悉用于修改标准的合成和去保护步骤的适合的方法。
II.包含具有表观遗传修饰的核酸的细胞
本公开还提供了遗传改造细胞或细胞系,所述遗传改造细胞或细胞系包含至少一种具有如以上第I节中所详述的预定表观遗传修饰的合成核酸。一般来讲,遗传改造细胞或细胞系包含至少一种染色体整合的表观遗传修饰的核酸,其中所述表观遗传修饰与已知的诊断、预后或对疾病治疗的敏感性水平相关。包含染色体整合的表观遗传修饰的核酸的细胞或细胞系可以通过本领域普通技术人员已知的任何方法来制备。所述表观遗传修饰优选为稳定的,使得所述细胞或细胞系可以可靠地用于本文描述的任何用途,例如为控制基因表达、在诊断和预后测定中充当参照标准和/或评估治疗方案。稳定的修饰合乎希望地在整个细胞的生长和培养期间维持,并且包含具有稳定的表观遗传修饰的染色体整合核酸的细胞可以使用本领域普通技术人员已知的技术来制备为细胞系。然而,在一些方面,所述表观遗传修饰可以是亚稳定的。可以使用携带亚稳定修饰的细胞来在对应于所述表观遗传修饰的核酸的内源性染色体序列中基于表观遗传修饰模式或状态的先验知识精确地分析表观遗传稳定性。可以使用如下文所述的靶向性核酸内切酶介导的基因组编辑来修饰细胞的基因组以包含具有预定修饰的核酸。
在本文公开的细胞或细胞系中,所述表观遗传修饰的核酸可以在具有未修饰的或天然的表观遗传状态的对应内源性染色体序列的基因座处插入,其中所述内源性染色体序列已经缺失或失活。例如,所述表观遗传修饰的核酸可以与所述表观遗传修饰的核酸所来源于的同源内源性染色体序列交换。另选地,表观遗传修饰的核酸可以在表观遗传修饰稳定的基因座处插入,所述基因座诸如具有相邻的绝缘元件的基因座,例如基因组安全港诸如AAVS1、ROSA26、HPRT和CCR5基因座。在此实施方案中,可以任选地使对应于表观遗传修饰的合成序列的内源性染色体序列失活或缺失。如本文中所进一步详细讨论的,表观遗传修饰的合成核酸与目标基因的调控序列(即,控制元件)或编码序列具有基本的序列同一性。
(a)细胞类型
本公开设想的细胞可以变化并且将会变化。一般来讲,所述细胞是真核细胞。在各种方面,所述细胞可以是人细胞、非人哺乳动物细胞、非哺乳类脊椎动物细胞、无脊椎动物细胞、昆虫细胞、植物细胞、酵母细胞或单细胞真核生物。所述细胞可以是成体细胞或胚细胞(例如,胚胎)。在其它方面,所述细胞可以是干细胞。适合的干细胞包括但不限于胚胎干细胞、ES样干细胞、胎儿干细胞、成体干细胞、多能干细胞、诱导多能干细胞、多潜能干细胞、寡能干细胞、单能干细胞以及其它干细胞。在示例性方面,所述细胞是哺乳动物细胞。
在一些方面,所述细胞是细胞系细胞。适合的哺乳动物细胞的非限制性实例包括中国仓鼠卵巢(CHO)细胞、幼小仓鼠肾(BHK)细胞;小鼠骨髓瘤NS0细胞、小鼠胚胎成纤维细胞3T3细胞(NIH3T3)、小鼠B淋巴瘤A20细胞;小鼠黑素瘤B16细胞;小鼠成肌细胞C2C12细胞;小鼠骨髓瘤SP2/0细胞;小鼠胚胎间质C3H-10T1/2细胞;小鼠癌瘤CT26细胞、小鼠前列腺DuCuP细胞;小鼠乳房EMT6细胞;小鼠肝细胞瘤Hepa1c1c7细胞;小鼠骨髓瘤J5582细胞;小鼠上皮MTD-1A细胞;小鼠心肌MyEnd细胞;小鼠肾RenCa细胞;小鼠胰腺RIN-5F细胞;小鼠黑素瘤X64细胞;小鼠淋巴瘤YAC-1细胞;大鼠成胶质细胞瘤9L细胞;大鼠B淋巴瘤RBL细胞;大鼠成神经细胞瘤B35细胞;大鼠肝细胞瘤细胞(HTC);水牛鼠肝BRL 3A细胞;犬肾细胞(MDCK);犬乳腺(CMT)细胞;大鼠骨肉瘤D17细胞;大鼠单核细胞/巨噬细胞DH82细胞;猴肾SV-40转化的成纤维细胞(COS7)细胞;猴肾CVI-76细胞;非洲绿猴肾(VERO-76)细胞;人胚肾细胞(HEK293、HEK293T);人宫颈癌细胞(HELA);人肺细胞(W138);人肝细胞(Hep G2);人U2-OS骨肉瘤细胞、人A549细胞、人A-431细胞、人SW48细胞、人HCT116细胞和人K562细胞。哺乳动物细胞系的广泛列表可见于美国典型培养物保藏中心(American Type CultureCollection)目录(ATCC,Manassas,VA)中。在具体实施方案中,所述细胞是人细胞系细胞。
(b)任选的核酸
在一些方面,包含本文公开的表观遗传修饰的核酸的细胞还可以包含编码重组蛋白的至少一种核酸序列。编码重组蛋白的核酸可以位于细胞的染色体中或者其可以是染色体外的。一般来讲,编码的重组蛋白是异源的,意指所述蛋白质对于细胞不是天然的。在一些方面,所述重组蛋白可以是治疗性蛋白质。示例性重组治疗性蛋白包括但不限于抗体、抗体片段、单克隆抗体、人源化抗体、人源化单克隆抗体、嵌合抗体、IgG分子、IgG重链、IgG轻链、IgA分子、IgD分子、IgE分子、IgM分子、疫苗、生长因子、细胞因子、干扰素、白介素、激素、凝血(或凝结)因子、血液组分、酶、营养蛋白质、前述任一者蛋白质的功能性片段或功能性变体,或包含前述蛋白质和/或其功能性片段或变体中的任一种的融合蛋白。
在其它方面,所述重组蛋白可以是赋予细胞改善的特性或赋予第一重组蛋白改善的特性的蛋白质。改善的特性的非限制性实例包括增加的稳健性、增加的生存力、增加的存活、增加的增殖、增加的细胞周期进展(即,增加的G1期至S期的进展)、增加的细胞生长、增加的细胞大小、增加的内源性蛋白的产生、增加的异源蛋白的产生、增加的重组蛋白稳定性、改变的重组蛋白质的翻译后加工以及任何上述情况的组合。在一些方面,改善细胞特性的蛋白质可以是过表达的。适合的蛋白的非限制性实例包括丝氨酸蛋白酶抑制剂蛋白(例如,SerpinB1)、细胞调控蛋白、细胞周期控制蛋白、凋亡抑制剂、代谢途径蛋白、翻译后修饰蛋白、人工转录因子、转录激活因子、转录抑制剂和增强子蛋白。
在另外的实施方案中,重组蛋白可以是标记蛋白诸如荧光蛋白(以上详述了其实例),或选择性标记蛋白诸如次黄嘌呤-鸟嘌呤转磷酸核糖基酶(HPRT)、二氢叶酸还原酶(DHFR)和/或谷氨酰胺合酶(GS)或由抗生素抗性基因编码的蛋白质。
III.使用靶向核酸内切酶来产生包含具有预定表观遗传修饰的染色体整合核酸的细胞
本公开的另一个方面提供了用于制备以上第II节中详述的细胞的方法。所述方法包括将具有预定表观遗传修饰的合成核酸插入细胞的基因组中,以及任选地使对应的内源性序列失效(失活)或缺失。表观遗传修饰的核酸可以具有胞嘧啶修饰,诸如甲基化(包括5-甲基胞嘧啶(5mC)、3-甲基胞嘧啶(3mC)和5-羟甲基胞嘧啶)、5-甲酰基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC)。在具体方面,所述修饰为胞嘧啶甲基化。与正常细胞或具有特定表型的细胞的对应的内源性序列中发现的甲基化水平相比,或与对应于正常基因表达水平或异常基因表达水平(即,过表达或低表达)的序列中发现的甲基化水平相比,合成核酸可以是过甲基化或低甲基化的。
表观遗传修饰的核酸可以在对应的内源性序列的基因座处插入或者可以在不同的基因座(例如,赋予了表观遗传修饰的核酸稳定性的基因座)处插入。
表观遗传修饰的核酸可以例如完全地替换对应的内源性染色体序列。此类替换(内源性序列的缺失和合成的表观遗传修饰序列的插入)可以使用本领域已知的方法(诸如使用靶向核酸内切酶)来完成。另选地,表观遗传修饰的核酸可以在基因组内有利的基因座处插入,所述有利的基因座诸如具有相邻的绝缘元件或在染色体整合之前帮助维持表观遗传修饰的核酸的表观遗传修饰状态(或模式)的其它遗传元件的基因座。具有稳定影响的基因座被称为基因组安全港位点,并且包括诸如AAVS1、CCR5、HPRT和ROSA26的基因座。外源性绝缘元件也可以邻近表观遗传修饰的核酸放置以有助于维持所需的修饰状态。因此,在一个方面,表观遗传修饰的核酸和绝缘元件都可以置于对应的内源性染色体序列的基因座处。如上所述,可以使用靶向性核酸内切酶将表观遗传学修饰核酸整合到目标基因组基因座中。
可以使用任何适合的靶向性核酸内切酶以在对应的内源性序列的基因座或其它有利的基因座处插入表观遗传修饰的核酸。例如,所述靶向性核酸内切酶可以是锌指核酸酶、基于CRISPR的核酸内切酶、大范围核酸酶、转录激活因子样效应物核酸酶(TALEN)、I-TevI核酸酶或相关单体杂交体、或人工的靶向DNA双链断裂诱导剂。例如,当同时插入表观遗传修饰的目标核酸时,成对的锌指核酸酶完成非同源末端连接(NHEJ)。参见,例如Orlando等,Nuc.Acids Res.,38(15):e152(2010)。另选地,可以使用修饰的RNA指导的核酸内切酶或转录激活因子样效应物核酸酶(TALEN)。使用I-TevI的催化结构域而产生的TALEN可以如Beurdeley等,Nat.Commun.4:1762doi:10.1038/ncomms2782(2013)中所述的那样来制备和使用。本领域的普通技术人员将理解,还可以使用杂交核酸内切酶,诸如在Kleinstiver等,PNAS 109(21):8061-6(2012)中所述的融合到锌指核酸内切酶或LAGLIDADG归巢核酸内切酶支架的I-Tev核酸酶结构域。也可以使用人工的靶向DNA双链断裂诱导剂诸如在Katada等,Nuc.Acid Res.40(11):e81(2012)中所述的ARCUT(人工的限制性DNA剪切物)以在本发明方法中促进同源重组。
本公开包括用于使用靶向性核酸内切酶(诸如,本文所述的靶向性核酸内切酶中的任一种)来将具有预定表观遗传修饰的合成核酸插入真核细胞中的方法。所述方法包括(i)将至少一种靶向性核酸内切酶或编码所述至少一种靶向性核酸内切酶的核酸引入细胞中,其中每个靶向性核酸内切酶靶向细胞的内源性染色体序列中的位点,以及(ii)将至少一种具有预定表观遗传修饰的合成核酸引入细胞中。在一些方面,所述表观遗传修饰的核酸可以是包含突出端的线型序列,所述突出端与由靶向性核酸内切酶产生的那些突出端相匹配。在其它方面,表观遗传修饰的核酸可以侧接与细胞基因组中的靶向裂解位点的一侧具有基本的序列同一性的上游和下游序列。在另外的方面,表观遗传修饰的核酸可以侧接由靶向性核酸内切酶识别的靶位点。所述方法还包括培养细胞,使得靶向性核酸内切酶引入至少一种双链断裂,所述双链断裂由DNA修复过程修复,所述DNA修复过程导致表观遗传修饰的核酸插入靶向位点中和/或导致靶向位点处内源性染色体序列的失活。例如,可以使用靶向性核酸内切酶以在靶向基因座处产生一种双链断裂,其中包含相匹配突出端的表观遗传修饰的核酸与内源性染色体序列连接,从而在靶向基因座处插入所述表观遗传修饰的核酸并且使所述内源性染色体序列破裂/失活。所述靶向基因座可以对应于表观遗传修饰的核酸所来源于的内源性染色体序列,或者所述靶向基因座可以是基因组安全港位点。另选地,可以使用靶向性核酸内切酶来产生一种双链断裂,其中将包含同源的上游和下游序列的表观遗传修饰的核酸通过同源介导的修复过程来插入裂解位点中。在另一方面,可以使用两种靶向性核酸内切酶来在目标基因座内的靶向位点处产生两种双链断裂,其中表观遗传修饰的核酸在双链断裂的修复过程中与内源性染色体序列交换。在又一方面,可以使用第一靶向性核酸内切酶来在插入了表观遗传修饰的核酸的第一基因座处产生双链断裂,并且使用第二靶向性核酸内切酶来在第二基因座处产生双链断裂,所述断裂由易错DNA修复过程修复,使得在第二基因座处引入失活性突变。例如,所述第一基因座可以是赋予表观遗传修饰的核酸稳定性的位点,并且所述第二基因座可以对应于表观遗传修饰的核酸所来源于的内源性染色体序列。
(a)靶向性核酸内切酶
在本文公开的方法中使用的靶向性核酸内切酶的类型可以变化并且将会变化。如上所述,所述靶向性核酸内切酶可以是大范围核酸酶、转录激活因子样效应物核酸酶(TALEN)、I-TevI核酸酶或相关单体杂交体和人工的靶向DNA双链断裂诱导剂、锌指核酸酶(ZFN)或基于CRISPR的核酸内切酶。所述靶向性核酸内切酶可以是天然存在的蛋白质或工程蛋白质。
在一些方面,所述靶向性核酸内切酶可为大范围核酸酶。大范围核酸酶是以大的识别位点为特征的脱氧核糖核酸内切酶,即识别位点通常在约12个碱基对至约40个碱基对的范围内。由于这个要求,识别位点通常仅在任何给定基因组中出现一次。在大范围核酸酶中,名为LAGLIDADG的归巢核酸内切酶的家族已成为用于基因组和基因组工程研究的有价值工具(Chevalier等,Nuc Acids Mol.Biol.16:33-27(2005))。可以通过使用本领域技术人员所熟知的技术修饰大范围核酸酶的识别序列来使所述大范围核酸酶靶向特定染色体序列。参见,例如,Silva等,Curr.Gene Ther.11(1):11-27(2011);Baxter等,Nuc.AcidsRes.40(160:7985-8000(22012)。
在其它方面,靶向性核酸内切酶可为转录激活因子样效应物(TALE)核酸酶。TALE是来自植物病原体黄单胞菌属(Xanthomonas)的转录因子,其可易于工程化以结合新的DNA靶标。TALE或其截短形式可以连接到核酸内切酶(诸如FokI)的催化结构域以产生被称为TALE核酸酶或TALEN的靶向性核酸内切酶。关于另外的信息,参见,Joung等,NatureRev.Mol.Cell Biol.14:49-55(2013)。使用I-TevI的催化结构域而产生的TALEN可以如Beurdeley等,Nat.Commun.4:1762 doi:10.1038/ncomms2782(2013)所述的那样来制备和使用。
在另外的方面,所述靶向性核酸内切酶可以是I-TevI核酸酶或相关的单体杂交体,诸如在Kleinstiver等,PNAS,109(21):8061-6(2012)中所述的融合到锌指核酸内切酶或LAGLIDADG归巢核酸内切酶支架的I-Tev核酸酶结构域。
在其它方面,所述靶向性核酸酶可为人工的靶向DNA双链断裂诱导剂。可以使用人工的靶向DNA双链断裂诱导剂诸如在Katada等,Nuc.Acid Res.40(11):e81(2012)中所述的ARCUT(人工的限制性DNA剪切物)以在本发明方法中促进同源重组。
(i)锌指核酸酶
在另外的方面,靶向性核酸内切酶可为锌指核酸酶(ZFN)。通常,锌指核酸酶包含DNA结合结构域(即锌指)和裂解结构域(即核酸酶),两者均在以下有所描述。
锌指结合结构域。可以将锌指结合结构域工程化以识别和结合于所选择的任何核酸序列。参见,例如Beerli等(2002)Nat.Biotechnol.20:135-141;Pabo等(2001)Ann.Rev.Biochem.70:313-340;Isalan等(2001)Nat.Biotechnol.19:656-660;Segal等(2001)Curr.Opin.Biotechnol.12:632-637;Choo等(2000)Curr.Opin.Struct.Biol.10:411-416;Zhang等(2000)J.Biol.Chem.275(43):33850-33860;Doyon等(2008)Nat.Biotechnol.26:702-708;和Santiago等(2008)Proc.Natl.Acad.Sci.USA 105:5809-5814。与天然存在的锌指蛋白相比,工程化的锌指结合结构域可以具有新型的结合特异性。工程化方法包括但不限于合理的设计和各种类型的选择。合理的设计包括例如,使用包含双重、三重和/或四重核苷酸序列和单独锌指氨基酸序列的数据库,其中每个双重、三重或四重核苷酸序列与锌指的结合所述具体三重或四重序列的一个或多个氨基酸序列有关。参见,例如美国专利号6,453,242和6,534,261,所述专利的公开内容以引用的方式整体并入本文。作为实例,可以使用美国专利6,453,242中所描述的算法来设计锌指结合结构域以靶向预选序列。也可以使用替代方法(诸如使用非简并识别密码表的合理设计)来设计锌指结合结构域以靶向特定序列(Sera等(2002)Biochemistry 41:7074-7081)。用于鉴定DNA序列中潜在的靶位点和设计锌指结合结构域的公开可用的基于网络的工具分别见于www.zincfingertools.org和zifit.partners.org/ZiFiT/(Mandell等(2006)Nuc.AcidRes.34:W516-W523;Sander等(2007)Nuc.Acid Res.35:W599-W605)。
可以设计锌指结合结构域以识别并结合长度为约3个核苷酸至约21个核苷酸(例如长度为约9个至约18个核苷酸)范围内的DNA序列。每个锌指识别区(即锌指)识别并结合3个核苷酸。一般来讲,本文公开的锌指核酸酶的锌指结合结构域包含至少三个锌指识别区(即,锌指)。所述锌指结合结构域可例如包含四个锌指识别区。另选地,锌指结合结构域可包含五个或六个锌指识别区。可以设计锌指结合结构域以结合任何适合的靶DNA序列。参见例如美国专利号6,607,882;6,534,261和6,453,242,所述专利的公开内容以引用的方式整体并入本文。
选择锌指识别区的示例性方法包括噬菌体展示和双杂交系统,并且在美国专利号5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759和6,242,568以及WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237中有所公开,所述专利中的每个均以引用的方式整体并入本文。此外,已在例如WO02/077227中描述了锌指结合结构域的结合特异性的增强,所述专利的公开内容以引用的方式整体并入本文。
用于设计和构造融合蛋白(和其编码多核苷酸)的锌指结合结构域和方法是本领域技术人员己知的,并且详细描述于美国专利申请公布号20050064474和20060188987中,各所述专利均以引用的方式整体并入本文。可以使用适合的接头序列(包括例如长度为五个或更多个氨基酸的接头)将锌指识别区和/或多指锌指蛋白连接在一起。关于长度为六个或更多个氨基酸的接头序列的非限制性实例参见美国专利号6,479,626;6,903,185;和7,153,949,所述专利的公开内容以引用的方式整体并入本文。本文所述的锌指结合结构域可以包括蛋白质的个别锌指(和另外的结构域)之间的适合的接头的组合。
裂解结构域。锌指核酸酶也包括裂解结构域。锌指核酸酶的裂解结构域部分可从任何核酸内切酶或核酸外切酶获得。裂解结构域可来源于的核酸内切酶的非限制性实例包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见,例如New England Biolabs目录(www.neb.com)或Belfort等(1997)Nucleic Acids Res.25:3379-3388。裂解DNA的其它酶是己知的(例如,S1核酸酶、绿豆核酸酶、胰腺DNA酶I、微球菌核酸酶、酵母HO核酸内切酶)。另参见Linn等(编)Nucleases,Cold Spring Harbor Laboratory Press,1993。这些酶(或其功能片段)中的一个或多个可以用作裂解结构域的来源。
裂解结构域还可以来源于出于裂解活性需要二聚化的如上所述的酶或其部分。裂解可能需要两个锌指核酸酶,因为每个核酸酶包含活性酶二聚体的单体。另选地,单一锌指核酸酶可包含两个单体以产生活性酶二聚体。如本文所用,“活性酶二聚体”是能够裂解核酸分子的酶二聚体。两个裂解单体可以来源于相同核酸内切酶(或其功能片段),或每个单体可以来源于不同的核酸内切酶(或其功能片段)。
当使用两个裂解单体来形成活性酶二聚体时,两个锌指核酸酶的识别位点优选经布置以便两个锌指核酸酶与其各自识别位点的结合使裂解单体彼此置于允许裂解单体例如通过二聚化来形成活性酶二聚体的空间定向中。因此,识别位点的近侧边缘可以由约5个至约18个核苷酸隔开。例如,近侧边缘可由约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17或18个核苷酸隔开。然而,应当理解,任何整数个核苷酸或核苷酸对(例如约2个至约50个核苷酸对或更多个核苷酸对)都可插入两个识别位点之间。例如像本文详细描述的锌指核酸酶的识别位点的近侧边缘可由6个核苷酸隔开。一般来讲,裂解位点位于识别位点之间。
限制核酸内切酶(限制酶)存在于许多物种中,并且能够序列特异性地结合DNA(在识别位点处)以及在结合位点处或附近裂解DNA。某些限制酶(例如,IIS型)在远离识别位点的位点处裂解DNA,并且具有可分开的结合结构域和裂解结构域。例如,IIS型酶FokI在距它的一条链上的识别位点9个核苷酸处和在距它的另一条链上的识别位点13个核苷酸处催化DNA的双链裂解。参见,例如美国专利号5,356,802;5,436,150和5,487,994;以及Li等(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li等(1993)Proc.Natl.Acad.Sci.USA90:2764-2768;Kim等(1994a)Proc.Natl.Acad.Sci.USA 91:883-887;Kim等(1994b)J.Biol.Chem.269:31,978-31,982。因此,锌指核酸酶可以包含来自至少一个IIS型限制酶的裂解结构域以及一个或多个可经或不可经工程化的锌指结合结构域。示例性IIS型限制酶在例如国际公布WO 07/014,275中描述,所述公布的公开内容以引用方式整体并入本文。另外的限制酶也含有可分开的结合结构域和裂解结构域,并且本公开也设想了这些酶。参见,例如Roberts等(2003)Nucleic Acids Res.31:418-420。
裂解结构域可与结合结构域分开的示例性IIS型限制酶是FokI。这种特定的酶以二聚体的形式起作用(Bitinaite等(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575)。因此,出于本公开的目的,在锌指核酸酶中使用的FokI酶的部分被认为是裂解单体。因此,对于使用FokI裂解结构域的靶向的双链裂解,可以使用两个各自包含FokI裂解单体的锌指核酸酶以重构活性酶二聚体。另选地,也可使用含有锌指结合结构域和两个FokI裂解单体的单一多肽分子。
裂解结构域可以包含一个或多个最大限度地减少或阻止均二聚化的工程化裂解单体,如例如在美国专利公布号20050064474、20060188987和20080131962中所描述的,所述专利中的每个均以引用的方式整体并入本文。通过非限制实例,在FokI的位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538处的氨基酸残基都是用于影响FokI裂解半结构域的二聚化的靶标。形成专性杂二聚体的FokI的示例性工程化裂解单体包括成对单体,其中第一裂解单体包括在FokI的氨基酸残基位置490和538处的突变并且第二裂解单体包括在氨基酸残基位置486和499处的突变(Miller等,2007,Nat.Biotechnol,25:778-785;Szczpek等,2007,Nat.Biotechnol,25:786-793)。例如,在一个结构域(E490K、1538K)中,位置490处的Glu(E)可以变成Lys(K)并且位置538处的Ile(I)可以变成K,并且在另一个裂解结构域(Q486E、I499L)中,位置486处的Gln(Q)可以变成E并且在位置499处的I可以变成Leu(L)。在另一方面,修饰的FokI裂解结构域可以包含三个氨基酸变化(Doyon等2011,Nat.Methods,8:74-81)。例如,一个修饰的FokI裂解结构域(其被称为ELD)可以包含Q486E、I499L、N496D突变,并且另一个修饰的FokI裂解结构域(其被称为KKR)可以包含E490K、I538K、H537R突变。
另外的结构域。在一些方面,锌指核酸酶还包含至少一种核定位信号或序列(NLS)。NLS是促进锌指核酸酶蛋白质转运到真核细胞的细胞核中的氨基酸序列。一般来讲,NLS包含一段碱性氨基酸。核定位信号在本领域是已知的(参见,例如Makkerh等人(1996)Current Biology 6:1025-1027;Lange等,J.Biol.Chem.,2007,282:5101-5105)。例如,在一个实施方案中,NLS可以是单分型序列,诸如PKKKRKV(SEQ ID NO:1)或PKKKRRV(SEQ IDNO:2)。在另一个实施方案中,NLS可以是二分型序列。在又一个实施方案中,NLS可以是KRPAATKKAGQAKKKK(SEQ ID NO:3)。NLS可以位于锌指核酸酶的N末端、C末端或内部位置中。
在其它方面,锌指核酸酶也可以包含至少一个细胞穿透结构域。在一个实施方案中,细胞穿透结构域可以是来源于HIV-1TAT蛋白的细胞穿透肽序列。例如,TAT细胞穿透序列可以是GRKKRRQRR RPPQPKKKRKV(SEQ ID NO:4)。在另一个实施方案中,细胞穿透结构域可以是TLM(PLSSIFSRIGDPPKKKRKV;SEQ ID NO:5),一种来源于人乙型肝炎病毒的细胞穿透肽序列。在又一实施方案中,细胞穿透结构域可以是MPG(GALFLGWLGAAGSTMGAPKKKRKV;SEQID NO:6或GALFLGFLGAAGSTMGAWSQPKKKRKV;SEQ I D NO:7)。在另外的实施方案中,细胞穿透结构域可以是Pep-1(KET WWETWWTEWSQPKKKRKV;SEQ ID NO:8)、VP22,一种来源于单纯疱疹病毒的细胞穿透肽或聚精氨酸肽序列。细胞穿透结构域可位于蛋白的N末端、C末端或内部位置中。
在其它方面,锌指核酸酶还可以包含至少一个标记结构域。标记结构域的非限制性实例包括荧光蛋白、纯化标签和表位标签。在一个实施方案中,标记结构域可为荧光蛋白。适合的荧光蛋白的非限制性实例包括绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、单体Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色荧光蛋白(例如YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、蓝色荧光蛋白(例如EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色荧光蛋白(例如ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-单体、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)以及橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、单体Kusabira-Orange、mTangerine、tdTomato)或任何其它适合的荧光蛋白。在另一个实施方案中,标记结构域可以是纯化标签和/或表位标签。适合的标签包括但不限于,谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、生物素羧基载体蛋白(BCCP)和钙调蛋白。标记结构域可以位于锌指核酸酶蛋白的N末端、C末端或内部位置中。
(ii)基于CRISPR的核酸内切酶
在其它方面,靶向性核酸内切酶可以是基于CRISPR的核酸内切酶,其包含至少一个允许核酸内切酶进入真核细胞的细胞核内的核定位信号。基于CRISPR的核酸内切酶是RNA指导的核酸内切酶,其包含至少一个核酸酶结构域和至少一个与指导RNA相互作用的结构域。指导RNA将基于CRISPR的核酸内切酶定向到核酸的靶向位点,在所述位点基于CRISPR的核酸内切酶裂解靶向的核酸序列中的至少一条链。由于指导RNA为靶向裂解提供特异性,那么基于CRISPR的核酸内切酶是普适的,并且可以与不同的指导RNA一起使用以裂解不同的靶核酸序列。
基于CRISPR的核酸内切酶是来源于CRISPR/Cas系统的RNA指导的核酸内切酶。细菌和古细菌已经进化了基于RNA的适应性免疫系统,其使用CRISPR(规律成簇的交替的短回文重复)和Cas(CRISPR有关的)蛋白以检测和消灭入侵的病毒或质粒。可以通过提供靶向特异性的合成指导RNA编程CRISPR/Cas核酸内切酶以引入靶向的位点特异性的双链断裂(Jinek等,2012,Science,337:816-821)。
基于CRISPR的核酸内切酶可以来源于CRISPR/Cas I型、II型或III型系统。适合的CRISPR/Cas蛋白的非限制性实例包括Cas3、Cas4、Cas5、Cas5e(或CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(或CasA)、Cse2(或CasB)、Cse3(或CasE)、Cse4(或CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csz1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966。
在一个实施方案中,基于CRISPR的核酸内切酶来源于II型CRISPR/Cas系统。在示例性实施方案中,基于CRISPR的核酸内切酶来源于Cas9蛋白。Cas9蛋白可以来源于酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌属种(Streptococcus sp.)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿产色链霉菌(Streptomycesviridochromogenes)、绿产色链霉菌(Streptomyces viridochromogenes)、玫瑰链孢囊菌(Streptosporangium roseum)、玫瑰链孢囊菌(Streptosporangium roseum)、酸热脂环酸芽孢杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacilluspseudomycoides)、还原硒酸盐芽抱杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、德氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克氏菌目细菌(Burkholderiales bacterium)、萘降解极地单胞菌(Polaromonas naphthalenivorans)、极地单胞菌属种(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝杆藻属种(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻属种(Synechococcussp.)、阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)、丹氏制氨菌(Ammonifexdegensii)、Caldicelulosiruptor becscii、暂定种金矿菌(Candidatus Desulforudis)、肉毒梭菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、热丙酸盐暗色厌氧香肠状菌(Pelotomaculum thermopropionicum)、喜温酸硫杆菌(Acidithiobacilluscaldus)、氧化亚铁酸硫杆菌(Acidithiobacillus ferrooxidans)、酒色异着色菌(Allochromatium vinosum)、海杆菌属种(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、瓦氏亚硝化球菌(Nitrosococcus watsoni)、游海假交替单胞菌(Pseudoalteromonas haloplanktis)、消旋纤线杆菌(Ktedonobacter racemifer)、调查甲烷盐菌(Methanohalobium evestigatum)、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属种(Nostoc sp.)、极大节旋藻(Arthrospiramaxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻属种(Arthrospira sp.)、鞘丝藻属种(Lyngbya sp.)、原形微鞘藻(Microcoleus chthonoplastes)、颤藻属种(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosiphoafricanus)或海洋无核绿藻(Acaryochloris marina)。在一个具体实施方案中,基于CRISPR的核酸酶来源于酿脓链球菌的Cas9蛋白。
一般来讲,CRISPR/Cas蛋白包含至少一个RNA识别和/或RNA结合结构域。RNA识别和/或RNA结合结构域与指导RNA相互作用使得CRISPR/Cas蛋白定向到特定基因组或基因组序列。CRISPR/Cas蛋白也可以包含核酸酶结构域(即DNA酶或RNA酶结构域)、DNA结合结构域、螺旋酶结构域、蛋白质相互作用结构域、二聚化结构域以及其它结构域。
本文使用的基于CRISPR的核酸内切酶可以是野生型CRISPR/Cas蛋白、修饰的CRISPR/Cas蛋白、或野生型或修饰的CRISPR/Cas蛋白的片段。可以修饰CRISPR/Cas蛋白以增加核酸结合亲和性和/或特异性,改变酶活性,和/或修改蛋白质的另一特性。例如,CRISPR/Cas蛋白的核酸酶(即DNA酶、RNA酶)结构域可以是修饰的、缺失的或失活的。可以截短CRISPR/Cas蛋白以去除对蛋白质的功能不必要的结构域。也可以截短或修饰CRISPR/Cas蛋白以优化蛋白质的活性或与CRISPR/Cas蛋白融合的效应子结构域。
在一些实施方案中,基于CRISPR的核酸内切酶可以来源于野生型Cas9蛋白或其片段。在其它实施方案中,基于CRISPR的核酸内切酶可以来源于修饰的Cas9蛋白。例如,可以修饰Cas9蛋白的氨基酸序列以改变蛋白质的一种或多种特性(例如,核酸酶活性、亲和性、稳定性等等)。另选地,可以将不涉及RNA指导的裂解的Cas9蛋白的结构域从蛋白质中消除,使得修饰的Cas9蛋白小于野生型Cas9蛋白。
一般来讲,Cas9蛋白包含至少两个核酸酶(即DNA酶)结构域。例如,Cas9蛋白可以包含RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC和HNH结构域一起作用来剪切单链以在DNA中完成双链断裂(Jinek等,2012,Science,337:816-821)。在一个实施方案中,基于CRISPR的核酸内切酶来源于Cas9蛋白并且包含两个功能核酸酶结构域,所述两个功能核酸酶结构域一起将双链断裂引入靶向位点。
靶位点由天然存在的通常具有约14-15bp长度的CRISPR/Cas系统识别(Cong等,2013,Science,339:819-823)。除了与指导RNA的5'末端互补的序列(即,称为原型间隔区序列)之后紧跟着(3'或下游)共有序列之外,靶位点没有序列限制。此共有序列又称为原型间隔区相邻基序(或PAM)。PAM的实例包括但不限于,NGG、NGGNG和NNAGAAW(其中N被定义为任何核苷酸,并且W被定义为A或T)。在典型长度时,在靶基因组内仅靶位点的约5%-7%会是独特的,这表明脱靶效应可能是显著的。可以通过需要两个结合事件延伸靶位点的长度。例如,可以修饰基于CRISPR的核酸内切酶使得它们仅可以裂解双链序列的一条链(即转变为切口酶)。因此,基于CRISPR的切口酶与两个不同的指导RNA结合使用将会基本上加倍靶位点的长度,同时仍然执行双链断裂。
在一些实施方案中,可以修饰Cas9来源的核酸内切酶以仅含有一个功能核酸酶结构域(RuvC样或HNH样核酸酶结构域)。例如,可以修饰Cas9来源的蛋白质使得核酸酶结构域中的一个缺失或突变,使它不再有功能性(即所述结构域缺乏核酸酶活性)。在一些实施方案中,其中核酸酶结构域中的一个失活,Cas9来源的蛋白质能够将切口引入双链核酸中(此蛋白被称为“切口酶”),但是不能裂解双链DNA。例如,RuvC样结构域中的天冬氨酸向丙氨酸(D10A)的转变将Cas9来源的蛋白质转变为“HNH”切口酶。同样,HNH结构域中的组氨酸向丙氨酸(H840A)的转变(在一些情况下,组氨酸位于位置839)将Cas9来源的蛋白质转变为“RuvC”切口酶。因此,例如,在一个实施方案中,Cas9来源的切口酶在RuvC样结构域中具有天冬氨酸至丙氨酸(D10A)的转变。在另一个实施方案中,Cas9来源的切口酶在HNH结构域中具有组氨酸向丙氨酸(H840A或H839A)的转变。可以使用熟知的方法修饰Cas9来源的切口酶的RuvC样和HNH样核酸酶结构域,所述方法诸如定点诱变、PCR介导的诱变和全基因合成以及本领域中已知的其它方法。
在其它实施方案中,基于CRISPR的核酸内切酶的两个核酸酶结构域都可以被突变、失活或缺失,并且所得到的蛋白质可以与异源的裂解结构域结合以产生基于CRISPR的融合蛋白。因此,通过指导RNA将所得的融合蛋白导向靶位点,并且通过异源的裂解结构域介导裂解。在某些实施方案中,异源的裂解结构域可以来源于II-S型核酸内切酶。II-S型核酸内切酶在通常距离识别位点若干个碱基对的位点裂解DNA,并且本身具有可分开的识别结构域和裂解结构域。这些酶一般是单体,所述单体瞬时缔合形成二聚体以在交错位置裂解DNA的每条链。适合的II-S型核酸内切酶的非限制性实例包括BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MboII和SapI。在示例性方面,融合蛋白的裂解结构域是FokI裂解结构域或其衍生物,这在以上第(III)节(a)(i)中有所详述。
一般来讲,基于CRISPR的核酸内切酶包含至少一种核定位信号或序列(NLS)。适合的NLS包括但不限于PKKKRKV(SEQ ID NO:1)、PKKKRRV(SEQ ID NO:2)和KRPAATKKAGQAKKKK(SEQ ID NO:3)。NLS可位于基于CRISPR的核酸内切酶的N末端、C末端或内部位置中。
另外的结构域。在其它方面,基于CRISPR的核酸内切酶也可以包含至少一种细胞穿透结构域。在一个实施方案中,细胞穿透结构域可以是来源于HIV-1TAT蛋白的细胞穿透肽序列。例如,TAT细胞穿透序列可以是GRKKRRQRRRPPQPKKKRKV(SEQ ID NO:4)。在另一个实施方案中,细胞穿透结构域可以是TLM(PLSSIFSRIGDPPK KKRKV;SEQ ID NO:5),一种来源于人乙型肝炎病毒的细胞穿透肽序列。在又一实施方案中,细胞穿透结构域可以是MPG(GALFLG WLGAAGSTMGAPKKKRKV;SEQ ID NO:6或GALFLGFLGAAGS TMGAWSQPKKKRKV;SEQ IDNO:7)。在另外的实施方案中,细胞穿透结构域可以是Pep-1(KETWWETWWTEWSQPKKKRKV;SE QID NO:8)、VP22,一种来源于单纯疱疹病毒的细胞穿透肽或聚精氨酸肽序列。细胞穿透结构域可以位于基于CRISPR的核酸内切酶的N末端、C末端或内部位置中
在其它实施方案中,基于CRISPR的核酸内切酶可以包含至少一个标记结构域。标记结构域的非限制性实例包括荧光蛋白、纯化标签和表位标签。在一个实施方案中,标记结构域可为荧光蛋白。适合的荧光蛋白的非限制性实例包括绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、单体Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色荧光蛋白(例如YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、蓝色荧光蛋白(例如EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色荧光蛋白(例如ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-单体、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)以及橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、单体Kusabira-Orange、mTangerine、tdTomato)或任何其它适合的荧光蛋白。在另一个实施方案中,标记结构域可以是纯化标签和/或表位标签。适合的标签包括但不限于,谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、生物素羧基载体蛋白(BCCP)和钙调蛋白。标记结构域可位于蛋白质的N末端、C末端或内部位置中。
指导RNA。基于CRISPR的核酸内切酶还需要至少一个将基于CRISPR的核酸内切酶定向到特定靶位点的指导RNA,在所述位点处基于CRISPR的核酸内切酶裂解靶向序列中的至少一条链。除了序列之后紧跟着(在下游)共有序列之外,靶位点没有序列限制性。此共有序列又称为原型间隔区相邻基序(PAM)。PAM的实例包括但不限于,NGG、NGGNG和NNAGAAW(其中N被定义为任何核苷酸,并且W被定义为A或T)。靶位点可以处于基因的编码区、基因的启动子控制元件、基因的内含子、基因之间的控制区等等。
指导RNA包含三个区:与靶位点处的序列互补的5'端的第一区,形成茎环结构的第二内部区以及基本上保持单链的第三3'区。每个指导RNA的第一区都不同,使得每个指导RNA将基于CRISPR的核酸内切酶导向特定靶位点。每个指导RNA的第二区和第三区在所有指导RNA中可以相同。
指导RNA的第一区与靶位点的序列互补使得指导RNA的第一区与靶位点的序列碱基配对。在各种实施方案中,指导RNA的第一区可以包含10个核苷酸至多于约25个核苷酸。例如,在基因组序列中指导RNA的第一区与靶位点之间的碱基配对的区域的长度可以为约10、11、12、13、14、15、16、17、18、19、20、22、23、24、25或多于25个核苷酸。在一个示例性实施方案中,指导RNA的第一区的长度为约20个核苷酸。
指导RNA也包含形成次级结构的第二区。在一些实施方案中,所述次级结构包含茎(或发夹结构)和环。茎和环的长度可以变化。例如,环的长度可为约3至约10个核苷酸,并且茎的长度可以在约6至约20个碱基对的范围内。茎可以包含1至10个核苷酸的一个或多个突起。因此,第二区的总长度可以在约16至约60个核苷酸的长度范围内。在一个示例性实施方案中,环的长度为约4个核苷酸,并且茎包含约12个碱基对。
指导RNA在3'末端也包含基本上保持单链的第三区。因此,第三区与目标细胞中的任何基因组序列都没有互补性,并且与指导RNA的其余部分也没有互补性。第三区的长度可以变化。一般来讲,第三区的长度多于约4个核苷酸。例如,第三区的长度可以在约5至约30个核苷酸的长度范围内。
在一些实施方案中,指导RNA包含一个分子。在其它实施方案中,指导RNA可以包含两个分开的分子。第一RNA分子可以包含指导RNA的第一区和指导RNA的第二区的“茎”的一半。第二RNA分子可以包含指导RNA的第二区的“茎”的另一半和指导RNA的第三区。因此,在本实施方案中,第一和第二RNA分子各自含有彼此互补的核苷酸序列。例如,在一个实施方案中,第一和第二RNA分子各自包含与其它序列碱基配对以形成功能性指导RNA的序列(具有约6个至约20个核苷酸)。
(b)向细胞中递送靶向性核酸内切酶和合成DNA
所述方法包括将至少一种靶向性核酸内切酶或编码至少一种靶向性核酸内切酶的核酸引入细胞中。适合的细胞在以上第(II)节(a)中有所详述。在一些方面,可以将靶向性核酸内切酶作为纯化的分离蛋白引入细胞中。在此类情况下,靶向性核酸内切酶还可以包含至少一个细胞穿透结构域。细胞穿透结构域的实例在以上描述锌指核酸酶和基于CRISPR的核酸内切酶的章节中详述。可以使用本领域熟知的技术在细菌或真核细胞中表达或纯化靶向性核酸内切酶。
在其它方面,可以将靶向性核酸内切酶作为核酸引入细胞中。核酸可以是DNA或RNA。在编码核酸是mRNA的方面,mRNA可被5'加帽和/或3'聚腺苷酸化。在靶向性核酸内切酶是锌指核酸酶的实施方案中,编码核酸可以是mRNA。编码锌指核酸酶的mRNA可以被5'加帽和3'聚腺苷酸化。用于制备RNA的方法以及用于mRNA加帽和多腺苷酸化的方法在本领域中是已知的。
在另外的方面,编码靶向性核酸内切酶的核酸可以是DNA。DNA可以是线型的或环状的。在某些方面,编码靶向性核酸内切酶的DNA可以是载体的一部分。适合的载体包括质粒载体、噬菌粒、粘粒、人工/微型染色体、转座子以及病毒载体。在非限制性实例中,编码靶向性核酸内切酶的DNA存在于质粒载体中。适合的质粒载体的非限制性实例包括pUC、pBR322、pET、pBluscript及其变体。将编码靶向性核酸内切酶的DNA可操作地连接至至少一个表达控制序列。特别是,可以将DNA编码序列可操作地连接至用于目标细胞中表达的启动子控制序列。启动子控制序列可以是组成型的、调控型的或组织特异性的。适合的组成型启动子控制序列包括但不限于巨细胞病毒立即早期启动子(CMV)、猿猴病毒(SV40)启动子、腺病毒主要晚期启动子、劳斯(Rous)氏肉瘤病毒(RSV)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、磷酸甘油酸激酶(PGK)启动子、延伸因子(ED1)-α启动子、泛素蛋白启动子、肌动蛋白启动子、微管蛋白启动子、免疫球蛋白启动子、其片段或前述任一者的组合。适合的调控型启动子控制序列的实例包括但不限于被热休克、金属、类固醇、抗生素或乙醇调控的那些调控型启动子控制序列。组织特异性启动子的非限制性实例包括B29启动子、CD14启动子、CD43启动子、CD45启动子、CD68启动子、结蛋白启动子、弹性蛋白酶-1启动子、内皮糖蛋白启动子、纤连蛋白启动子、Flt-1启动子、GFAP启动子、GPIIb启动子、ICAM-2启动子、INF-β启动子、Mb启动子、NphsI启动子、OG-2启动子、SP-B启动子、SYN1启动子和WASP启动子。启动子序列可以是野生型的或它可以被修饰以用于更高效的或有效的表达。载体可包含另外的表达控制序列(例如,增强子序列、Kozak序列、聚腺苷酸化序列、转录终止序列等)、选择性标记序列(例如,抗生素抗性基因)、复制起点等。本领域的技术人员熟悉适当的载体、启动子、其它载体控制元件。
在一些方面,其中靶向性核酸酶是基于CRISPR的核酸内切酶并且将基于CRISPR的核酸内切酶作为核酸引入细胞中,编码核酸可以是被优化的用于在目标真核细胞内有效地翻译成蛋白质的密码子。例如,可以优化密码子用于在人、小鼠、大鼠、仓鼠、牛、猪、猫、狗、鱼、两栖类、植物、酵母、昆虫等等中的表达(参见密码子使用数据库于www.kazusa.or.jp/codon)。密码子优化程序可以作为免费软件(例如在genomes.urv.es/OPTIMIZER的OPTIMIZER;在www.genscript.com/codon_opt.html的来自GenScript的OptimumGeneTM)获得。也可以获得商业的密码子优化程序。
另外,当靶向性核酸内切酶是基于CRISPR的核酸内切酶时,所述方法还包括向细胞递送至少一种指导RNA。一般来讲,基于CRISPR的核酸内切酶与指导RNA的比率为约1:1。在一些方面,可以将指导RNA作为RNA分子引入。例如,当核酸内切酶作为蛋白质被引入时,可以将基于CRISPR的核酸内切酶和指导RNA作为蛋白质/RNA复合体引入。在其它方面,可以将指导RNA作为DNA分子引入细胞中。在此类实施方案中,可以将指导RNA编码序列可操作地连接至用于真核细胞中指导RNA表达的启动子控制序列。例如,可以将RNA编码序列可操作地连接至由RNA聚合酶III(Pol III)识别的启动子序列。适合的Pol III启动子的实例包括但不限于哺乳动物U6或H1启动子。因此,在某些情况下,可以将基于CRISPR的核酸内切酶和指导RNA作为DNA序列引入细胞中。在一些迭代中,编码基于CRISPR的核酸内切酶的DNA序列和指导RNA可以是同一载体的部分。
所述方法也包括将至少一种具有预定表观遗传修饰的合成DNA序列引入细胞中。表观遗传修饰的核酸在以上第(I)节中有所详述。在一些方面,表观遗传修饰的核酸可以包含如以上第(I)节中所详述的另外的序列(例如,末端突出端、与靶向基因组基因组附近的序列有基本的序列同一性的旁侧序列、旁侧靶向性核酸内切酶识别位点、绝缘元件等等)。
可以通过多种方法将靶向性核酸内切酶分子和表观遗传修饰的合成核酸递送至细胞。在一个方面,可以通过转染方法递送分子。适合的转染方法包括核转染(或电穿孔)、磷酸钙介导的转染、阳离子聚合物转染(例如DEAE-葡聚糖或聚氮丙啶)、病毒转导、病毒体转染、病毒粒子转染、脂质体转染、阳离子脂质体转染、免疫脂质体转染、非脂质体脂质转染、树状聚合物转染、热休克转染、磁转染、脂质转染、基因枪递送、刺穿转染(impalefection)、超声穿孔(sonoporation)、光学转染和专有试剂增强的核酸的吸收。转染方法在本领域中是熟知的(参见,例如“Current Protocols in Molecular Biology”Ausubel等,John Wiley&Sons,New York,2003或“Molecular Cloning:A LaboratoryManual”Sambrook和Russell,Cold Spring Harbor Press,Cold Spring Harbor,NY,第3版,2001)。在另一方面,可通过显微注射来向细胞中递送所述分子。例如,所述分子可经显微注射到细胞的细胞核或细胞质中。
靶向性核酸内切酶分子和表观遗传修饰的合成核酸可同时或依次递送至细胞。靶向性核酸内切酶分子与表观遗传修饰的合成核酸的比率可以在约1:10至约10:1的范围内。在各个方面,靶向性核酸内切酶分子与表观遗传修饰的合成核酸的比率为约1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。非限制性的示例性比率为约1:1。
(c)使用锌指核酸酶进行修饰
可以使用锌指核酸酶将表观遗传修饰的合成核酸整合到细胞的基因组中。如上详述,所述方法包括(a)(i)将至少一种锌指核酸酶或编码至少一种锌指核酸酶的核酸引入细胞中,其中将每个锌指工程化以识别细胞基因组中的靶向位点并将双链断裂引入所述靶向位点,以及(ii)将至少一种合成的表观遗传修饰的核酸引入细胞中以插入基因组中,并且(b)孵育所述细胞使得在由所述锌指核酸酶产生双链断裂的修复时,所述表观遗传修饰的合成序列插入细胞的基因组中。
在一个方面,表观遗传修饰的合成核酸侧接与由锌指核酸酶产生的那些突出端相匹配的突出端。例如,包含突出端的表观遗传修饰的合成核酸可作为线型的寡核苷酸引入,或者它可在表观遗传修饰的合成核酸是较大的多核苷酸的一部分时原位产生,在所述较大的多核苷酸中表观遗传修饰的合成核酸侧接由锌指核酸酶识别的靶位点。在任一种情况下,可以使用一种锌指核酸酶来在基因组中的靶向位点处引入一种双链断裂,并且表观遗传修饰的合成核酸可通过由非同源的末端连接DNA修复过程介导的直接连接来插入所述位点中。表观遗传修饰合成核酸插入基因组位置中使内源性染色体序列破裂或失活。另选地,可以使用两种锌指核酸酶以在基因组中引入两种双链断裂,并且表观遗传修饰的合成核酸可与内源性染色体序列(其为离体的或缺失的)交换。
在另一个方面,表观遗传修饰的合成核酸侧接分别与靶向裂解位点的上游和下游序列具有基本的序列同一性的上游和下游序列。例如,可以使用一种锌指核酸酶以在基因组的靶向位点处引入一种双链断裂,其中在双链断裂被同源介导的DNA修复过程修复时,表观遗传修饰的合成核酸插入内源性染色体序列中或与内源性染色体序列的一部分交换。另选地,可以使用第一锌指核酸酶来在第一基因座处通过如以上所直接详述的同源介导的过程插入表观遗传修饰的合成核酸,并且可以使用第二锌指核酸酶来在第二基因座处引入双链断裂,其中第二基因座处的断裂可以由在第二基因座处引入失活突变的易错的、非同源末端连接修复过程修复。失活突变可以是至少一个核苷酸的缺失、至少一个核苷酸的插入、至少一个核苷酸的取代或其组合。
在上述迭代中的任一个中,表观遗传修饰的合成核酸可以替换对应的内源性染色体序列。另选地,表观遗传修饰的合成核酸可在赋予了表观遗传修饰稳定性的安全港基因座或位点处插入。在此迭代中,可以使对应于表观遗传修饰的合成核酸的内源性染色体序列缺失或失活(如本文所详述的)。
(d)使用基于CRISPR的核酸内切酶进行的修饰
也可以使用基于CRISPR的核酸内切酶将表观遗传修饰的合成核酸插入细胞的基因组中。所述方法包括(a)(i)将至少一种基于CRISPR的核酸内切酶或编码至少一种基于CRISPR的核酸内切酶的核酸引入细胞中,其中每个基于CRISPR的核酸内切酶能够裂解靶向基因组序列的至少一条链,和(ii)将至少一种指导RNA和编码至少一种指导RNA的DNA引入细胞中,其中每个指导RNA将基于CRISPR的核酸内切酶定向到基因组中的靶向位点,以及(iii)将至少一种表观遗传修饰的合成核酸引入细胞中以插入基因组中,并且(b)孵育所述细胞使得所述表观遗传修饰的合成核酸在DNA修复过程中插入基因组中。
在一些方面,基于CRISPR的核酸内切酶含有两个功能性核酸酶结构域使得它裂解双链序列的两条链。例如,一种基于CRISPR的核酸酶(或编码核酸)和一种指导RNA(或编码DNA)可引入细胞中(连同表观遗传修饰的合成核酸)。在表观遗传修饰的合成核酸侧接与由基于CRISPR的核酸酶产生的那些突出端相匹配的突出端的情况下,表观遗传修饰的合成核酸可通过基于非同源的修复过程直接与染色体DNA连接。在具有表观遗传修饰的表观遗传修饰的合成核酸侧接分别与靶向裂解位点的上游和下游序列共用基本的序列同一性的上游和下游序列的情况下,所述表观遗传修饰的合成核酸可通过同源介导的修复过程插入内源性染色体序列中或与内源性染色体序列的一部分交换。
在其它方面,修饰基于CRISPR的核酸内切酶以含有一个功能性核酸酶结构域使得它裂解双链序列的一条链(因此,它是切口酶)。基于CRISPR的切口酶可以与两种不同的指导RNA一起使用以在双链的相反链中引入切口,其中两个缺口足够接近以构建双链断裂。为介导此裂解,将两个指导RNA取向为5'-面向-5'构型(即,上游指导RNA结合到基因组靶标的有义链,并且下游指导RNA结合到基因组靶标的反义链)。因此,所述方法可以包括将一种基于CRISPR的切口酶(或编码核酸)、两种指导RNA(或编码DNA)和表观遗传修饰的合成核酸引入细胞中。在表观遗传修饰的合成核酸侧接与由基于CRISPR的切口酶系统产生的那些突出端相匹配的突出端的情况下,所述表观遗传修饰的合成核酸可通过基于非同源的修复过程直接与染色体DNA连接。在表观遗传修饰的合成核酸侧接分别与靶向裂解位点的上游和下游序列共用基本的序列同一性的上游和下游序列的情况下,所述表观遗传修饰的合成核酸可通过同源介导的修复过程插入内源性染色体序列中或与内源性染色体序列的一部分交换。
在其它方面,基于CRISPR的核酸酶(或编码核酸)和两种指导RNA(或编码DNA)可引入细胞中以在基因组序列中介导两种双链断裂。相似地,基于CRISPR的切口酶(或编码核酸)和四种指导RNA可引入细胞中以在基因组序列中介导两种双链断裂。在表观遗传修饰的合成核酸侧接与由基于CRISPR的蛋白质产生的那些突出端相匹配的突出端的情况下,所述表观遗传修饰的合成核酸可直接与染色体序列连接,从而用表观遗传修饰的合成序列替换内源性染色体序列。在表观遗传修饰的合成核酸侧接分别与靶向裂解位点的上游和下游序列具有基本的序列同一性的上游和下游序列的迭代中,所述表观遗传修饰的合成核酸可通过同源介导的修复过程插入染色体序列中或与染色体序列交换。另选地,表观遗传修饰的合成序列可通过同源介导的修复过程插入双链断裂位点中的一个中,并且可以由非同源修复过程通过引入失活突变(即缺失、插入、取代至少一个核苷酸)来使另一个双链断裂位点突变或失活。
在基于CRISPR的核酸内切酶介导的迭代中的任一个中,表观遗传修饰的合成核酸可以替换对应的内源性染色体序列。另选地,表观遗传修饰的合成核酸可在赋予了表观遗传修饰稳定性的安全港基因座或位点处插入。在此迭代中,可以使对应于表观遗传修饰的合成核酸的内源性染色体序列缺失或失活(如本文所详述的)。
IV.用途
具有预定表观遗传修饰的合成核酸和包含所述核酸的细胞具有若干用途。在某些方面,携带修饰调控区的表观遗传状态的表观遗传修饰的核酸的插入的工程细胞可以用于控制或改变基因的表达。例如,具有表观遗传修饰的核酸(诸如甲基化核酸)的插入除了或代替不正常修饰的(即,不正常甲基化的或过甲基化的)调控染色体序列的细胞可用于改变基因表达。相反地,使用不含表观遗传修饰的合成核酸替换已知具有表观遗传修饰的内源性调控序列或插入不含表观遗传修饰的合成核酸可以用于改变基因表达。
在其它方面,包含表观遗传修饰的合成序列(其中的表观遗传修饰是稳定的)的细胞可以充当诊断或基因分型标准。例如,表观遗传修饰的合成核酸和包含所述核酸的细胞可以在测定中用作参照标准,所述测定用于诊断疾病(诸如癌症)、预测疾病的结果、监测疾病的行为、确定疾病的适当的治疗和测量对靶向治疗的应答。此类参照标准的规定在工程化细胞系中是有利的,因为(1)它们在进行细胞裂解(或FFPE提取)、DNA分离和扩增的所有后续的诊断处理步骤的天然细胞和基因组环境内提供了DNA测定模板,以及(2)可以将遗传的或表观遗传的改变模型化成稳定且提供大量基因组DNA的细胞类型。
例如,MGMT的表达已被证实可以在使用烷化剂治疗的成胶质细胞瘤患者中用作诊断和/或预测标记。MGMT的表达与使用烷化剂(诸如替莫唑胺)治疗的差的结果相关,因为MGMT酶对抗由烷化剂引起的DNA损伤。MGMT启动子的甲基化模式可以被用作MGMT表达的指示物。因此,具有MGMT启动子高水平甲基化的患者可以从替莫唑胺治疗中得益,然而具有低水平MGMT启动子甲基化的患者对替莫唑胺无应答(图3)。参见,例如Hegi等,2004,Clin.Cancer Res.10(6):1871-4;Hegi等,2005,New England J.Med.352(10):997-1003;Boots-Sprenger等,2013,Modern Pathol.26(7):922-9。在又一种情况下,已经将BRCA1基因的甲基化与杂合性丢失(LOH)测量结合使用以预测某些卵巢癌是否是使用PARP抑制剂或铂盐治疗的候选(Abkevich等,2012,Br J Cancer 107(10):1776-82。因此,包含过甲基化或低甲基化的MGMT或BRCA1序列的工程化细胞可以用作用于评估甲基化状态的参照标准。另外,当具有良好表征水平甲基化的患者样本不存在时,具有靶向甲基化模式的工程化细胞可以充当对照样本以开发和表征新的检测测定或充当研究和诊断实验室的设立和维护中的质量对照标准。
在另外的方面,可以使用包含表观遗传修饰序列(其中的表观遗传修饰是亚稳定的)的工程化细胞基于插入序列的表观遗传修饰模式或状态的先验知识来分析细胞中修饰序列的表观遗传稳定性。例如,可以使用所述序列以分析响应于药物、环境或饮食因素的基因座的表观遗传稳定性。特别是,人工甲基化的基因座可以充当起始点以“重置”甲基化模式并且研究是什么生物学因素导致了后续的甲基化和基因表达的变化。例如,在饮食补充之后,体重和毛色的变化与鼠的肥胖相关基因的甲基化状态之间存在为人熟知的关系(Dolinoy等,2007,Pediatric Research,61:30R)。因为可以使用靶向性核酸内切酶(如上所详述)在精确的位置处插入化学修饰的序列,所以所述修饰的序列可置于天然染色体环境中,所述天然染色体环境仍受可为目标染色体区域所独有的任何基因座特异性表观遗传调控因子支配。使用异位的甲基化DNA序列进行的此类基因座特异性的实验是不可能的。
在又一方面,包含表观遗传修饰的合成序列的工程化细胞可以用作包含表观遗传修饰序列的基因组DNA的来源。例如,DNA可以使用标准技术从活细胞或固定细胞中提取、扩增并分析。另选地,可以在细胞中原位分析(例如,通过原位PCR、原位蛋白质印记(in situWestern)、免疫组织化学和其它适合的程序)具有表观遗传修饰的合成染色体序列。
V.试剂盒
本发明还提供了包含本文描述的表观遗传修饰的合成序列和/或包含所述序列的细胞的试剂盒。在一个实施方案中,提供了用于预测受试者的疾病对治疗性处理或方案(诸如癌症治疗)的响应性的试剂盒,所述试剂盒包括具有与已知的治疗结果相关的预定胞嘧啶修饰的至少一种合成核酸,连同用于解释参照标准(即表观遗传修饰的合成序列)与取自受试者的样本的比较的文件。所述试剂盒还包含对照染色体序列。在另一个实施方案中,提供了用于诊断受试者样本的疾病的试剂盒,所述试剂盒包括具有与已知的疾病状态相关的预定胞嘧啶修饰的至少一种合成核酸,连同用于解释参照标准与取自受试者的样本的比较的文件。所述试剂盒还包含对照染色体序列。在另一个实施方案中,提供了用于预测受试者样本中疾病的结果和严重性的试剂盒,所述试剂盒包括具有与已知的疾病的预后相关的预定胞嘧啶修饰的至少一种合成核酸,连同用于解释参照标准与取自受试者的样本的比较的文件。所述试剂盒还包含对照染色体序列。
在其它实施方案中,所述试剂盒包括一系列多种表观遗传修饰的合成序列,其中所述试剂盒的每个合成序列都具有不同的预定胞嘧啶修饰,所述胞嘧啶修饰与不同的已知的(1)对疾病治疗的敏感性水平、(2)疾病的诊断或(3)疾病的预后相关。此系列提供了多个标准,受试者样本的胞嘧啶修饰可以与所述标准对比以(1)确定疾病的诊断,或(2)确定疾病的预后,或(3)评估治疗方案的结果。在这些不同的试剂盒的任一个中,试剂盒还可以包括一个或多个对照染色体序列以及用于解释参照标准与取自受试者的样本的比较的文件。
在一些方面,在一种或多种固定细胞中提供表观遗传修饰的合成序列。当提供具有多种胞嘧啶修饰的合成序列时,无论它们是否并入细胞中,所述样本都将以独立的清楚标记的包装提供。
定义
除非另外定义,否则本文所使用的所有技术性和科学性术语具有本发明所属领域中的技术人员通常所理解的含义。下列参考文献为技术人员提供了许多本发明所用的术语的一般定义:Singleton等,Dictionary of Microbiology and Molecular Biology(第2版1994);The Cambridge Dictionary of Science and Technology(Walker编,1988);TheGlossary of Genetics,第5版,R.Rieger等(编),Springer Verlag(1991);和Hale和Marham,The Harper Collins Dictionary of Biology(1991)。如本文所用,除非另外指明,否则以下术语具有赋予其的含义。
当介绍本公开或其一个或多个优选方面的要素时,冠词“一个/种(a)”、“一个/种(an)”、“所述/该(the)”以及“所述(said)”意图意指存在一个或多个要素。术语“包含(comprising)”、“包括(including)”和“具有(having)"意图是包括性的,并且意味着除了所列要素之外,可能还有额外的要素。
如本文互换使用的,术语“CpG位置”和“CpG位点”是指DNA区域,其中的胞嘧啶核苷酸在碱基线型序列中沿长度在鸟嘌呤核苷酸的下一个出现,其中“CpG”是“-C-磷酸-G-”键联的缩写,即胞嘧啶和鸟嘌呤由单个磷酸盐隔开。术语“CpG岛”是指CpG位点簇。
如本文所用,术语“内源性序列”是指细胞天然具有的染色体序列。
如本文所用,术语“外源性序列”是指不是细胞天然具有的序列,或在细胞基因组中的天然位置处于不同的染色体位置的染色体序列。
如本文所用,“基因”是指编码基因产物的DNA区域(包括外显子和内含子)以及调控基因产物的产生的所有DNA区域,无论所述调控序列是否与编码序列和/或转录序列相邻。因此,基因包括但不一定限于,启动子序列、终止子、翻译调控序列(诸如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点以及基因座控制区。
术语“异源的”是指不是内源的或不是目标细胞天然的实体。例如,异源蛋白是指来源于或最初来源于外源性来源(诸如外源引入的核酸序列)的蛋白。在一些情况下,异源蛋白由目标细胞不正常地产生。
术语“核酸”和“多核苷酸”是指呈线型或环状构象且呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。出于本公开的目的,这些术语不应相对于聚合物的长度被解释为限制性的。术语可包括天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(如硫代磷酸酯骨架)中被修饰的核苷酸。一般来讲,特定核苷酸的类似物具有相同碱基配对特异性;即A的类似物将与T碱基配对。
术语“核苷酸”是指脱氧核糖核苷酸或核糖核苷酸。核苷酸可为标准核苷酸(即腺苷、鸟苷、胞苷、胸苷和尿苷)或核苷酸类似物。核苷酸类似物是指具有修饰的嘌呤或嘧啶碱基或修饰的核糖部分的核苷酸。核苷酸类似物可为天然存在的核苷酸(例如肌苷)或非天然存在的核苷酸。核苷酸的糖或碱基部分上的修饰的非限制性实例包括添加(或移除)乙酰基、氨基、羧基、羧甲基、羟基、甲基、磷酰基和硫醇基团,以及用其它原子取代碱基的碳和氮原子(例如7-脱氮嘌呤)。核苷酸类似物也包括双脱氧核苷酸、2'-O-甲基核苷酸、锁定核酸(LNA)、肽核酸(PNA)和吗啉代寡核苷酸。
术语“多肽”与“蛋白质”可互换用于指代氨基酸残基的聚合物。
用于测定核酸和氨基酸序列同一性的技术在本领域中是已知的。通常,所述技术包括测定基因的mRNA的核苷酸序列和/或测定由其编码的氨基酸序列,以及将这些序列与第二核苷酸或氨基酸序列进行比较。也可以这个方式测定和比较基因组序列。一般来讲,同一性是指两个多核苷酸或多肽序列的核苷酸对核苷酸或氨基酸对氨基酸的分别的精确对应。两个或更多个序列(多核苷酸或氨基酸)可通过确定它们的同一性百分比来进行比较。两个序列(无论核酸或氨基酸序列)的同一性百分比是两个比对序列之间的精确匹配的数目除以较短序列的长度且乘以100。核酸序列的近似比对由Smith和Waterman,Advances inApplied Mathematics 2:482-489(1981)的局部同源性算法提供。通过使用由Dayhoff,Atlas of Protein Sequences and Structure,M.O.Dayhoff编,5增刊.3:353-358,National Biomedical Research Foundation,Washington,D.C.,USA开发,且由Gribskov,Nucl.Acids Res.14(6):6745-6763(1986)加以标准化的计分矩阵,这个算法可应用于氨基酸序列。用以确定序列同一性百分比的这个算法的示例性执行程序由Genetics ComputerGroup(Madison,Wis.)在“BestFit”实用程序中提供。用于计算序列之间的同一性或类似性百分比的其它适合的程序通常在本领域中是已知的,例如另一比对程序是以缺省参数加以使用的BLAST。例如,BLASTN和BLASTP可使用以下缺省参数来加以使用:遗传密码=标准;过滤器=无;链=两者;截断=60;预期=10;矩阵=BLOSUM62;描述=50个序列;排序依据=高分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss蛋白+Spupdate+PIR。这些程序的细节可见于GenBank网站上。
因为可在不脱离本发明的范围下对上述动物、细胞和方法做出各种变化,所以在以上描述中和在以下给出的实施例中含有的所有事项都应解释为说明性的而非具有限制性意义。
实施例
以下实施例说明本发明的某些方面。
实施例1:合成的甲基化DNA的稳定整合
此研究的目的是确定合成的甲基化DNA是否可以使用ZFN靶向的基因组修饰来稳定地整合到细胞的染色体中。将具有不同的甲基化模式的人O6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)基因的片段插入人细胞的19号染色体上的AAVS1基因座的靶向位点中。图1A示出了策略。
合成包含来自人MGMT基因的19nt序列(即,5'-CGACGCCCGCAGGTCCTCG-3',SEQ IDNO:9)和。HindIII限制性核酸内切酶位点(5'-AAGCTT-3')的两种单链寡脱氧核苷酸(ssODN)以进行集落筛选。命名为1至4(从5'至3')的CpG位点在SEQ ID NO:9中以下划线表示。一种ssODN在CpG位点上含有5-甲基胞嘧啶。还合成两条互补的(甲基化或未甲基化的)ssODN。将所述ssODN的各种组合以终浓度95μM在退火缓冲液(含有5mM的Tris.HCl、pH 8.0,0.5mM的EDTA、pH 8.0,50mM的NaCl)中退火,以形成非甲基化的、半甲基化的和双甲基化的双链寡脱氧核苷酸(dsODN)(参见图1B)。dsODN上的突出端设计来与由FokI酶在靶向人AAVS1基因座的锌指核酸酶的裂解位点处产生的5'-GCCA-3'突出端相匹配。
将100μl体积的一百万个人K562细胞使用3.2μL的95μM dsODN连同5.0μg的AAVS1ZFN RNA进行核转染,重复进行三次实验。在核转染后的第2、6、8和10天收获细胞的等分试样,使用PCR来扩增携带整合序列的区域并且将PCR产物进行HindIII消化。每天在每种条件下(即,非甲基化的dsODN+ZFN、半甲基化的dsODN+ZFN和双甲基化的dsODN+ZFN)检测264bp和180bp的片段。
培养20天后,将核转染的细胞进行FAC分拣得到单个的活细胞,并接种在96孔板上。核转染三十五天后,将来源于各单个细胞集落的细胞分成两部分:将一部分冷冻,并且筛选另一部分以供dsODN序列的整合。提取基因组DNA,将携带整合序列的AAVS1区域进行PCR扩增,并且将PCR产物通过HindIII酶消化以进行RFLP分析。通过HindIII消化筛选大约1300个细胞集落,并且将那些具有正确的大小的HindIII片段的集落进行常规的DNA测序。鉴定了具有25b p的片段(即,19bp的MGMT片段和HindIII位点)正确插入AAVS1基因座的三个等位基因中的一个中的总计18个单细胞克隆。具体地,5个集落具有未甲基化插入的正确整合;4个集落具有半甲基化插入的正确整合;并且9个集落具有双甲基化插入的正确整合。修饰AA VS1基因座的序列为5'-CCTTACCTCTCTAGTCTGTGCTAGCTCTTCCAGCCCCCTGTCATGGCATCTTCCAGGGGTCCGAGAGCTCAGCTAGTCTTCTTCCTCCAACCCGGGCCCCTATGTCCACTTCAGGACAGCATGTTTGCTGCCTCCAGGGATCCTGTGTCCCCGAGCTGGGACCACCTTATATTCCCAGGGCCGGTTAATGTGGCTCTGGTTCTGGGTACTTTTATCTGTCCCCTCCACCCCACAGTGGGGCCACGACGCCCGCAGGTCCTCGAAGCTTGCCACTAGGGACAGGATTGGTGACAGAAAAGCCCCATCCTTAGGCCTCCTCCTTCCTAGTCTCCTGATATTGGGTCTAACCCCCACCTCCTGTTAGGCAGATTCCTTATCTGGTGACACACCCCCATTTCCTGGAGCCATCTCTCTCCTTGCCAGAACCTCTAAGGTTTGCTTACG-3'(SEQ ID NO:10;以粗体示出25bp插入序列,以斜体示出HindIII位点)。这些数据显示,合成的甲基化D NA可以稳定地整合到人细胞的基因组中。
实施例2:合成的甲基化DNA的稳定维持
此研究的目的是确定整合到基因组中的合成的甲基化DNA的甲基化状态是否可以稳定地维持。使具有MGMT片段在AAVS1基因座(参见,实施例1)的三个等位基因中的每个中的正确插入的九个细胞集落再生长两周。通过焦磷酸测序(EpigenDx,Hopkinton,MA)确定每个集落的甲基化状态。核转染后49天的甲基化分析示于表1中。
使集落#1(非甲基化的)和集落#7(双甲基化的)的副本(A、B)再生长31天。通过焦磷酸测序确定每个集落的甲基化状态(核转染后80天),并且示于表2中。图2总结了转染后49天和80天在这些两个不同的等位基因中的每个CpG位点处的甲基化状态。这些数据显示,甲基化状态可以从合成的DNA传递到基因组基因座,并且预定的DNA甲基化模式可以在很大程度上在世代间维持。
实施例3:具有稳定的MGMT甲基化模式的细胞的用途
具有稳定的MGMT甲基化模式的细胞(诸如以上制备的那些细胞)可以在用于确定患成胶质细胞瘤患者的适合的治疗过程的测定中用作诊断对照。可以分析患者肿瘤样本中MGMT启动子甲基化水平,并且与具有稳定的MGMT的对照(参照)细胞的MGMT启动子甲基化水平相比较。例如,可以使用标准程序从肿瘤样本和对照样本中提取DNA。将提取的DNA使用亚硫酸氢盐处理,使用甲基化特异性PCR来扩增,并测序。另选地,使用焦磷酸测序确定提取的DNA的甲基化状态。另选地,通过免疫组织化学在固定细胞中使用针对MGMT产生的甲基化特异性抗体分析MGMT启动子的甲基化状态。然后,可将患者样本的甲基化状态与对照细胞的甲基化状态相比较。如果取自患者的样本的甲基化水平低于对照细胞,则认为肿瘤对于MGMT甲基化呈阴性,并且不施用替莫唑胺。如果取自患者的样本的甲基化水平等于或大于对照细胞,则认为肿瘤对于MGMT甲基化呈阳性,并且施用替莫唑胺(参见图3)。

Claims (26)

1.一种表观遗传修饰的细胞系,其包含至少一种具有预定胞嘧啶修饰的染色体整合核酸,其中所述胞嘧啶修饰与已知的诊断、预后或对疾病治疗的敏感性水平相关。
2.如权利要求1所述的表观遗传修饰的细胞系,其中所述胞嘧啶修饰选自5-甲基胞嘧啶(5mC)、3-甲基胞嘧啶(3mC)、5-羟甲基胞嘧啶(5hmC)、5-甲酰基胞嘧啶(5fC)或5-羧基胞嘧啶(5caC)。
3.如权利要求1或权利要求2所述的表观遗传修饰的细胞系,其中所述染色体整合核酸具有与和疾病有关的基因的控制元件、控制元件的一部分、编码区或编码区的一部分的序列具有基本的序列同一性的序列。
4.如权利要求3所述的表观遗传修饰的细胞系,其中所述基因是列于表1中的基因。
5.如权利要求4所述的表观遗传修饰的细胞系,其中所述基因选自MGMT、BRCA1、BRCA2、PITX2、GSTP1、APC、RASSF1或HER2。
6.如权利要求1或权利要求2所述的表观遗传修饰的细胞系,其中所述染色体整合核酸使用靶向性核酸内切酶来插入所述细胞中的染色体位置中。
7.如权利要求6所述的表观遗传修饰的细胞系,其中所述靶向性核酸内切酶选自锌指核酸酶、基于CRISPR的核酸内切酶、大范围核酸酶、转录激活因子样效应物核酸酶(TALEN)、I-TevI核酸酶或相关单体杂交体,或人工的靶向DNA双链断裂诱导剂。
8.如权利要求1至7中任一项所述的表观遗传修饰的细胞系,其中所述染色体整合核酸替换所述染色体整合核酸所来源于的内源性染色体序列。
9.如权利要求1至7中任一项所述的表观遗传修饰的细胞系,其中所述染色体整合核酸在具有相邻的绝缘元件或有助于维持所述染色体整合核酸的原始胞嘧啶修饰状态的其它元件的基因座处插入。
10.如权利要求9所述的表观遗传修饰的细胞系,其中所述基因座选自AAVS1、CCR5、HPRT或ROSA26。
11.如权利要求9所述的表观遗传修饰的细胞系,其中对应于所述染色体整合核酸的内源性染色体序列是失活的或缺失的。
12.如权利要求1至11中任一项所述的表观遗传修饰的细胞系,其还包含至少一种编码重组蛋白的核酸序列。
13.如权利要求1至12中任一项所述的表观遗传修饰的细胞系,其中所述细胞系为人细胞系。
14.如权利要求1至13中任一项所述的表观遗传修饰的细胞系,其中所述预定胞嘧啶修饰是稳定的。
15.如权利要求1至13中任一项所述的表观遗传修饰的细胞系,其中所述预定胞嘧啶修饰是亚稳定的。
16.一种试剂盒,其用于预测受试者的疾病对治疗性处理的响应性,所述试剂盒包括至少一种具有预定胞嘧啶修饰的核酸以用作参照标准,其中所述胞嘧啶修饰与已知的诊断、预后或对疾病治疗的敏感性水平相关。
17.一种试剂盒,其用于诊断受试者的疾病,所述试剂盒包括至少一种具有预定胞嘧啶修饰的核酸以用作参照标准,其中所述胞嘧啶修饰与已知的诊断、预后或对疾病治疗的敏感性水平相关。
18.一种试剂盒,其用于预测受试者的疾病的预后,所述试剂盒包括至少一种具有预定胞嘧啶修饰的核酸以用作参照标准,其中所述胞嘧啶修饰与已知的诊断、预后或对疾病治疗的敏感性水平相关。
19.如权利要求16至18中任一项所述的试剂盒,其包含至少两种核酸,其中每种核酸具有不同的预定胞嘧啶修饰。
20.如权利要求16至19中任一项所述的试剂盒,其中所述胞嘧啶修饰选自5-甲基胞嘧啶(5mC)、3-甲基胞嘧啶(3mC)、5-羟甲基胞嘧啶(5hmC)、5-甲酰基胞嘧啶(5fC)或5-羧基胞嘧啶(5caC)。
21.如权利要求16至20中任一项所述的试剂盒,其中所述核酸具有与和疾病有关的基因的控制元件、控制元件的一部分、编码区或编码区的一部分的序列具有基本的序列同一性的序列。
22.如权利要求21所述的试剂盒,其中所述基因是列于表1中的基因。
23.如权利要求22所述的试剂盒,其中所述基因选自MGMT、BRCA1、BRCA2、PITX2、GSTP1、APC、RASSF1或HER2。
24.如权利要求16至23中任一项所述的试剂盒,其中所述核酸位于细胞的染色体内。
25.如权利要求24所述的试剂盒,其中所述细胞为固定细胞。
26.如权利要求24所述的试剂盒,其中所述核酸在从所述细胞分离的基因组DNA内。
CN201580023619.7A 2014-04-28 2015-04-24 使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰 Pending CN106460050A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461985205P 2014-04-28 2014-04-28
US61/985205 2014-04-28
PCT/US2015/027541 WO2015167959A1 (en) 2014-04-28 2015-04-24 Epigenetic modification of mammalian genomes using targeted endonucleases

Publications (1)

Publication Number Publication Date
CN106460050A true CN106460050A (zh) 2017-02-22

Family

ID=54359184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580023619.7A Pending CN106460050A (zh) 2014-04-28 2015-04-24 使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰

Country Status (6)

Country Link
US (2) US20170051354A1 (zh)
EP (1) EP3137633A4 (zh)
JP (1) JP2017517250A (zh)
CN (1) CN106460050A (zh)
SG (1) SG11201608403TA (zh)
WO (1) WO2015167959A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112430662A (zh) * 2020-12-11 2021-03-02 中国医学科学院肿瘤医院 一种用于预测肺鳞癌预后风险的试剂盒及其应用
CN114574493A (zh) * 2022-04-02 2022-06-03 中国科学院遗传与发育生物学研究所 一种编辑绵羊SOCS2基因的sgRNA组合、扩增用引物和应用

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9115386B2 (en) 2008-09-26 2015-08-25 Children's Medical Center Corporation Selective oxidation of 5-methylcytosine by TET-family proteins
EP3904533A1 (en) 2011-12-13 2021-11-03 Oslo Universitetssykehus HF Method for detection of hydroxymethylation status
ES2786984T3 (es) 2012-11-30 2020-10-14 Cambridge Epigenetix Ltd Agente oxidante para nucleótidos modificados
EP3355939A4 (en) 2015-09-30 2019-04-17 Trustees of Boston University MICROBIAL DEADMAN AND PASS CODE EMERGENCY STOP SWITCHES
KR20180134847A (ko) * 2016-01-14 2018-12-19 멤피스 미츠 인코포레이티드 생체외 배양 과정 동안 체세포의 복제 능력을 증가시키는 방법
US11078481B1 (en) 2016-08-03 2021-08-03 KSQ Therapeutics, Inc. Methods for screening for cancer targets
US11078483B1 (en) 2016-09-02 2021-08-03 KSQ Therapeutics, Inc. Methods for measuring and improving CRISPR reagent function
US20200101173A1 (en) * 2017-06-15 2020-04-02 Toolgen Incorporated Genome Editing System For Repeat Expansion Mutation
WO2019014652A1 (en) 2017-07-13 2019-01-17 Memphis Meats, Inc. COMPOSITIONS AND METHODS FOR INCREASING THE EFFICACY OF CELL CULTURES USED IN FOOD PRODUCTION
CN108624622A (zh) * 2018-05-16 2018-10-09 湖南艾佳生物科技股份有限公司 一种基于CRISPR-Cas9系统构建的能分泌小鼠白细胞介素-6的基因工程细胞株
JPWO2021171688A1 (zh) * 2020-02-26 2021-09-02
JP2023535636A (ja) 2020-07-30 2023-08-18 ケンブリッジ エピジェネティックス リミテッド 核酸解析のための組成物および方法
CA3233868A1 (en) * 2021-10-08 2023-04-13 Eddie Adams Metaepigenomics-based disease diagnostics

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4152413A (en) * 1978-08-18 1979-05-01 Chromalloy American Corporation Oral vaccine for swine dysentery and method of use
EP0590060A1 (en) * 1991-06-21 1994-04-06 Univ Cincinnati THERAPEUTIC ORAL ADMINISTRATIVE PROTEINS AND PROCESS FOR PRODUCING THE SAME.
WO1998018453A1 (en) * 1996-10-28 1998-05-07 Pfizer Inc. Oral vaccines for young animals with an enteric coating
AU5437599A (en) * 1998-08-27 2000-03-21 West Pharmaceutical Services Drug Delivery & Clinical Research Centre Limited Microparticulate composition
WO2011026111A1 (en) * 2009-08-31 2011-03-03 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Oral delivery of a vaccine to the large intestine to induce mucosal immunity
US20130280222A1 (en) * 2012-04-18 2013-10-24 Board Of Regents Of The University Of Texas System Non-disruptive gene targeting
CN104053450A (zh) * 2011-10-26 2014-09-17 约瑟夫.M.费亚德 在回肠制动上Roux-en-Y胃旁路术的口服制剂类似物;用于治疗包括胰岛素抗性、脂肪肝、高脂血症和T2D的代谢综合症表现的组合物、治疗、诊断方法和系统
CN104302278A (zh) * 2012-03-29 2015-01-21 塞拉拜姆有限责任公司 在回肠和阑尾上有活性的胃肠位点特异性口服接种疫苗制剂

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7195870B2 (en) * 2000-04-06 2007-03-27 Epigenomics Ag Diagnosis of diseases associated with gene regulation
US20090269736A1 (en) * 2002-10-01 2009-10-29 Epigenomics Ag Prognostic markers for prediction of treatment response and/or survival of breast cell proliferative disorder patients
KR20080033455A (ko) * 2005-07-26 2008-04-16 상가모 바이오사이언스 인코포레이티드 외래 핵산 서열의 표적화된 통합 및 발현
EP2521797A4 (en) * 2010-01-04 2013-07-10 Lineagen Inc DNA METHYLATION BIOMARKER FOR LUNG FUNCTION
US9255259B2 (en) * 2010-02-09 2016-02-09 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
US8902648B2 (en) * 2011-07-26 2014-12-02 Micron Technology, Inc. Dynamic program window determination in a memory device

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4152413A (en) * 1978-08-18 1979-05-01 Chromalloy American Corporation Oral vaccine for swine dysentery and method of use
EP0590060A1 (en) * 1991-06-21 1994-04-06 Univ Cincinnati THERAPEUTIC ORAL ADMINISTRATIVE PROTEINS AND PROCESS FOR PRODUCING THE SAME.
WO1998018453A1 (en) * 1996-10-28 1998-05-07 Pfizer Inc. Oral vaccines for young animals with an enteric coating
AU5437599A (en) * 1998-08-27 2000-03-21 West Pharmaceutical Services Drug Delivery & Clinical Research Centre Limited Microparticulate composition
WO2011026111A1 (en) * 2009-08-31 2011-03-03 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Oral delivery of a vaccine to the large intestine to induce mucosal immunity
CN104053450A (zh) * 2011-10-26 2014-09-17 约瑟夫.M.费亚德 在回肠制动上Roux-en-Y胃旁路术的口服制剂类似物;用于治疗包括胰岛素抗性、脂肪肝、高脂血症和T2D的代谢综合症表现的组合物、治疗、诊断方法和系统
CN104302278A (zh) * 2012-03-29 2015-01-21 塞拉拜姆有限责任公司 在回肠和阑尾上有活性的胃肠位点特异性口服接种疫苗制剂
US20130280222A1 (en) * 2012-04-18 2013-10-24 Board Of Regents Of The University Of Texas System Non-disruptive gene targeting

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
COMB等: "CpG methylation inhibits proenkephalin gene expression and binding of the transcription factor AP-2", 《NUCLEIC ACIDS RESEARCH》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112430662A (zh) * 2020-12-11 2021-03-02 中国医学科学院肿瘤医院 一种用于预测肺鳞癌预后风险的试剂盒及其应用
CN114574493A (zh) * 2022-04-02 2022-06-03 中国科学院遗传与发育生物学研究所 一种编辑绵羊SOCS2基因的sgRNA组合、扩增用引物和应用

Also Published As

Publication number Publication date
EP3137633A4 (en) 2017-11-29
US20170051354A1 (en) 2017-02-23
EP3137633A1 (en) 2017-03-08
WO2015167959A1 (en) 2015-11-05
SG11201608403TA (en) 2016-11-29
US20190271041A1 (en) 2019-09-05
JP2017517250A (ja) 2017-06-29

Similar Documents

Publication Publication Date Title
CN106460050A (zh) 使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰
CN111328343B (zh) Rna靶向方法和组合物
KR102458395B1 (ko) 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선
US11104897B2 (en) Compositions and methods for the treatment of nucleotide repeat expansion disorders
CN106103699B (zh) 体细胞单倍体人类细胞系
KR20190059966A (ko) S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드
AU2022200130B2 (en) Engineered Cas9 systems for eukaryotic genome modification
CN108291218A (zh) 核酸酶非依赖性靶向基因编辑平台及其用途
AU2016274452A1 (en) Thermostable Cas9 nucleases
CN106661569A (zh) 抗病毒细胞及其用途
CN106687585A (zh) 用于修饰基因组dna的方法和组合物
CN109415729A (zh) 具有降低毒性的基因编辑试剂
Ishikawa et al. Unfolded protein response transducer IRE1-mediated signaling independent of XBP1 mRNA splicing is not required for growth and development of medaka fish
CN110520163A (zh) 独立于dna双链断裂的靶向基因编辑平台及其用途
CN109072258A (zh) 复制型转座子系统
CN113711046B (zh) 用于揭示与Tau聚集相关的基因脆弱性的CRISPR/Cas脱落筛选平台
KR20200017479A (ko) Crispr/cas 활성제 시스템용 합성 유도 rna
WO2024012300A1 (zh) 一种基因编辑的方法和用途
CN110438083A (zh) 具有简单糖型的重组蛋白的产生
US20230287377A1 (en) Crispr/cas fusion proteins and systems
WO2018172798A1 (en) Argonaute system
KR20210042130A (ko) Acidaminococcus sp. cpf1의 dna 절단 활성을 향상시키는 신규한 돌연변이
EP3594339A1 (en) Composition containing c2cl endonuclease for dielectric calibration and method for dielectric calibration using same
JP7026304B2 (ja) 部位特異的dna開裂及び修復による標的化原位置タンパク質多様化
US11965184B2 (en) CRISPR/Cas fusion proteins and systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170222