CN110114461A - 新型crispr酶和系统 - Google Patents

新型crispr酶和系统 Download PDF

Info

Publication number
CN110114461A
CN110114461A CN201780064300.8A CN201780064300A CN110114461A CN 110114461 A CN110114461 A CN 110114461A CN 201780064300 A CN201780064300 A CN 201780064300A CN 110114461 A CN110114461 A CN 110114461A
Authority
CN
China
Prior art keywords
crispr
protein
target
cas
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780064300.8A
Other languages
English (en)
Inventor
F·张
D·A·斯科特
W·X·严
S·乔杜里
M·海登雷希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology, Broad Institute Inc filed Critical Massachusetts Institute of Technology
Publication of CN110114461A publication Critical patent/CN110114461A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/10Dispersions; Emulsions
    • A61K9/127Liposomes
    • A61K9/1271Non-conventional liposomes, e.g. PEGylated liposomes, liposomes coated with polymers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/5176Compounds of unknown constitution, e.g. material from plants or animals
    • A61K9/5184Virus capsids or envelopes enclosing drugs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/32Special delivery means, e.g. tissue-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/13011Gammaretrovirus, e.g. murine leukeamia virus
    • C12N2740/13041Use of virus, viral particle or viral elements as a vector
    • C12N2740/13042Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/13011Gammaretrovirus, e.g. murine leukeamia virus
    • C12N2740/13041Use of virus, viral particle or viral elements as a vector
    • C12N2740/13043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Nanotechnology (AREA)
  • Optics & Photonics (AREA)
  • Botany (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Dispersion Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本文公开的实施方式涉及工程化CRISPR‑Cas效应蛋白,其相对于未修饰的CRISPR‑Cas效应蛋白包含至少一个修饰,所述修饰相对于野生型增强所述CRISPR复合物与结合位点的结合和/或改变编辑偏好。在某些示例性实施方式中,CRISPR‑Cas效应蛋白是V型效应蛋白。在某些其他示例性实施方式中,V型效应蛋白是Cpf1。本文公开的实施方式涉及用于递送CRISPR‑Cas效应蛋白(包括Cpf1)的病毒载体。在某些示例性实施方式中,载体被设计为允许CRISPR‑Cas效应蛋白包装在单个载体内。在设计用于包装并因此表达更大的转基因用于靶向递送和组织特异性的紧凑型启动子的方面也越来越令人感兴趣。因此,在另一个方面,本文所公开的某些实施方式涉及用于全身递送的递送载体、构建体和递送更大基因的方法。

Description

新型CRISPR酶和系统
相关申请的交叉引用
本申请要求于2016年8月17日提交的美国临时专利申请号62/376,372和2016年12月20日提交的美国临时专利申请62/437,023。
关于联邦政府资助研究的声明
本发明是在国立卫生研究院授予的拨款号MH100706和MH110049的政府支持下完成的。政府拥有本发明的某些权利。
技术领域
本发明一般涉及系统、方法和组合物,所述系统、方法和组合物涉及规律成簇的间隔短回文重复序列(CRISPR)及其组分。本发明还一般涉及大有效载荷(payload)的递送,并且包括新型递送颗粒,特别是使用脂质和病毒颗粒,以及新型病毒衣壳,两者都适合于递送大有效载荷,例如规律成簇的间隔短回文重复序列(CRISPR)、CRISPR蛋白(例如,Cas、Cas9、Cpf1、Cas13a、Cas13b等等)、CRISPR-Cas或CRISPR系统或CRISPR-Cas复合物、其组分、核酸分子,例如载体,涉及所有前述内容和所有前述内容的用途,以及其他方面。另外,本发明涉及用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法。
背景技术
基因组测序技术和分析方法的最新进展已经显著加速了编目和定位与各种各样的生物功能和疾病相关的遗传因子的能力。需要精确的基因组靶向技术,使得能够通过允许对个体遗传元件进行选择性扰动,对因果性的遗传变异进行系统逆向工程化,以及推进合成生物学、生物技术和医学应用。尽管基因组编辑技术例如设计师锌指、转录激活子样效应物(TALEs)或归巢大范围核酸酶可用于产生靶向基因组扰动,但仍需要采用新策略和分子机制并且可负担、易于设置、可扩展、并且适用于靶向真核基因组内的多个位置的新基因组工程技术。这将为基因组工程和生物技术的新应用提供主要资源。
细菌和古细菌适应性免疫的CRISPR-Cas系统显示出蛋白质组成和基因组基因座结构的极端多样性。CRISPR-Cas系统基因座具有多于50个基因家族,并且没有严格的通用基因表明基因座结构的快速进化和极端多样性。到目前为止,采用多管齐下的方法,对93种Cas蛋白质进行了大约395种谱图的全面cas基因鉴定。分类包括签名基因谱图加上基因座结构的签名。提出了CRISPR-Cas系统的新分类,其中这些系统大致分为两类,1类具有多亚基效应复合物,2类具有单亚基效应模块,例如由Cas9蛋白示例。与2类CRISPR-Cas系统相关的新型效应蛋白可以作为强大的基因组工程工具进行开发,预测推定的新型效应蛋白及其工程和优化是重要的。
用于真核基因组编辑的CRISPR-Cas RNA指导的核酸内切酶的开发引起了对该技术用于治疗应用的强烈兴趣。
广泛的研究已经导致发现可以解决安全性和有效性挑战的不同技术。为了将这种基因组编辑技术转化至临床。需要开发用于开发基于CRISPR-Cas的治疗剂的算法,其考虑了需要考虑的不同变量。
与针对高度保守的蛋白质活性位点的小分子疗法相比,基因组水平的疾病治疗必须与患者群体中显著水平的遗传变异相抗衡。最近,来自外显子聚集联合会(ExAC)和千人基因组计划的大规模测序数据集提供了前所未有的人类遗传变异景观。这种变化可以通过破坏靶位点来影响基于CRISPR的治疗剂的功效和通过产生脱靶候选位点来影响其安全性。
本申请中任何文献的引用或识别不是承认这样的文献可用作本发明的现有技术。
发明内容
在某些示例性实施方式中,工程化CRISPR-Cas效应蛋白,其与包含指导序列的核酸复合以形成CRISPR复合物,并且其中在CRISPR复合物中,所述核酸分子靶向一个或多个多核苷酸基因座,并且所述蛋白质相对于未修饰的蛋白质包含至少一种修饰,所述修饰使与野生型相比,所述CRISPR复合物与结合位点的结合增强和/或改变编辑偏好。所述编辑偏好可以涉及插入缺失形成。在某些示例性实施方式中,所述至少一种修饰可以使靶基因座处的一种或多种特异性插入缺失的形成增加。CRISPR-Cas效应蛋白可以是V型CRISPR-Cas效应蛋白。在某些示例性实施方式中,CRISPR-Cas蛋白是Cpf1或其直系同源物。
在某些其他示例性实施方式中,本发明涉及用于递送CRISPR-Cas系统的载体,包括允许在单个载体中编码效应蛋白和指导序列两者的基于载体的系统。
在某些其他示例性实施方式中,本发明涉及用于开发或设计CRISPR-Cas系统的方法。在一个方面,本发明涉及用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法。本发明特别涉及用于改进CRISPR-Cas系统(例如,基于CRISPR-Cas系统的疗法或治疗剂)的方法。成功的CRISPR-Cas系统(例如,基于CRISPR-Cas系统的疗法或治疗剂)的关键特征涉及高特异性、高功效和高安全性。通过降低脱靶效应,可以实现高特异性和高安全性等。
本发明的方法特别涉及对选择的与CRISPR-Cas系统和/或其功能相关的参数或变量进行优化,如本文其他地方进一步所述。本文所述方法中,对CRISPR-Cas系统进行优化可取决于靶标(例如,一种或多种治疗性靶标),CRISPR-Cas系统调节(例如,基于CRISPR-Cas系统的治疗性靶标性调节)、修饰或操控的模式或类型,以及CRISPR-Cas系统组分的递送。取决于基因型和/或表型结果,可以选择一种或多种靶标。例如,取决于(遗传)疾病病因或期望的治疗结果,可以选择一种或多种治疗性靶标。(治疗性)靶标可以是单个基因、基因座或其他基因组位点,或可以是多个基因、基因座或其他基因组位点。如本领域已知的,例如通过使用多种gRNA,单个基因、基因座或其他基因组位点可以被靶向不止一次。
在考虑以下所示示例性实施方式的详细描述之后,示例性实施方式的这些和其他方面、目的、特征和优点对于本领域普通技术人员将变得显而易见。
附图说明
图1说明了原代神经元中AsCpf1效率。a)AAV 1/2感染的原代皮质培养物用抗HA(AsCpf1)、抗GFP(GFP-KASH)和NeuN(神经元标志物)抗体染色。b)感染后第7天的Surveyor测定。
图2A-C说明了用于将AsCpf1递送到小鼠海马中的立体定向AAV1/2注射。a)病毒递送3周后解剖的小鼠脑显示海马中的GFP荧光。b)分选的GFP-KASH阳性细胞核的FACS直方图。c)用核标志物Ruby Dye共染色的分选的GFP-KASH核。
图3A-B说明使用双载体方法将AsCpf1和GFP-KASH全身递送到成年小鼠中。a)全身尾静脉注射后3周的免疫染色显示将Syn-GFP-KASH载体递送到各个脑区域的神经元中。b)在全身尾静脉共注射双载体后3周解剖的各个脑区域的NGS插入缺失分析。
图4A-H说明了将AAV1/2双载体立体定向注射到成年小鼠海马中。a)载体设计。b)立体定向AAV1/2注射后3周的免疫染色。c)双重感染的神经元的定量。d)Western印迹显示AsCpf1和GFP-KASH蛋白质水平。e)立体定向注射3周后对GFP+分选细胞核的NGS插入缺失分析。f)雄性小鼠中Drd1的单等位基因和双等位基因修饰的定量。Mecp2和Nlgn3是x染色体基因,因此只有一个等位基因可以编辑。g)多重编辑效率的定量。h)示例NGS读数显示所有三个靶向的基因中的插入缺失。
图5示出了将Cpf1包装到单个AAV中。(上图)单载体设计。(下图)神经元在细胞核中表达Cpf1,surveyor分析显示指导RNA介导的切割。
图6A-C说明a)pLenti-Cpf1构建体的示意图。pLenti-Cpf1构建体是从lentiCRISPRv2质粒修饰的。SpCas9被AsCpf1替换,并且SpCas9U6指导表达盒被AsCpf1U6指导表达盒替换。与lentiCRISPRv2不同,pLenti-Cpf1中的U6指导表达盒是在相反方向上的。这种变化是需要的,因为Cpf1识别其相应的直接重复(DR)序列并切割表现出该特征的RNA分子。因此,如果慢病毒RNA表现出直接重复序列,则它易感于Cpf1介导的切割。然而,以相反顺序引入U6指导表达盒导致RNA分子没有直接重复序列。b)来自用携带单个VEGFA指导的pLenti-AsCpf1感染的两个批次(biorep)的HEK293T细胞和用编码DNMT1-EMX1-VEGFA-GRIN2b阵列的pLenti-AsCpf1感染的一个批次的HEK293T细胞的Surveyor测定结果。在嘌呤霉素选择后5天分析细胞。在靶向的基因座的所有lenti感染细胞中观察到稳健的切割。红色三角形表示切割产物。c)来自在用编码DNMT1-EMX1-VEGFA-GRIN2b阵列的pLenti-AsCpf1感染的HEK293T细胞的单细胞FACS分选后生长10天的群落的DNMT1、EMX1、VEGFA和GRIN2b的NGS结果。在嘌呤霉素选择5天后进行FACS。在检查的细胞的子集中观察到多重编辑。每一列表示一个克隆群落中,蓝色正方形表示编辑≥30%,而方块表示编辑<30%。
图7显示了lentiCRISPRv2质粒。参考Sanjana NE等,Nat Methods.2014Aug;11(8):783-4。
图8显示了AsCpf1。参考Zetsche B等,Cell.2015Sep 23.pii:S0092-8674(15)01200-3。
图9A-F描绘了人类遗传变异如何显著影响RNA指导的核酸内切酶的功效。a)示意图说明了基因组靶标、RNA指导和靶标变异。b)ExAC数据集中含有变异的个体核苷酸的残基的分数(fraction)。c)ExAC数据集中由变体改变的2-nt PAM基序的分数。d)对于每种CRISPR核酸内切酶,在不同等位基因频率下的靶标变体的百分比。e)对于每种酶,含有靶标的变体的累积百分比。f)在不同等位基因频率下含有靶标的纯合变体的分数。显示了对于所有酶的平均值和标准偏差。
图10A-C描绘了如何进行对最大化群体功效的铂靶标的选择。a)示意图显示在PCSK9-001的外显子2中的靶标变异,(外显子下面的黑线)指示ExAC数据集中含有高覆盖的区域。b)通过跨越PCSK9-001外显子2的起点的靶标的切割位置绘制的靶标变异频率,用箭头指示(a)中显示的靶标。0.01%的水平线将铂靶标(灰色)与高变异靶标(红色)分开。下面描绘了每种酶的每个靶标的分类(灰色或红色框)。c)跨越PCSK9-001的外显子2-5的每种酶的靶标的分类。
图11A-C描绘了人类遗传变异如何显著影响CRISPR核酸内切酶的治疗安全性。a)示意图说明了由于多种不同单倍型而产生的脱靶候选者。b)不同等位基因频率下每种CRISPR核酸内切酶的脱靶候选者的数量。c)每种CRISPR核酸内切酶的每个铂靶标的脱靶候选者的数量的分布。
图12A-D描绘了基因和群体特异性变异如何影响治疗设计。a)针对12种治疗相关基因的每个铂靶标的脱靶候选者的数量的分布。b)针对每种酶,跨越PCSK9-001的外显子2-5的铂靶标的全部脱靶候选者。c)主成分分析(PCA),其基于跨越12个治疗相关基因的铂靶标的患者特异性脱靶谱图将千人基因组个体分成超群体。显示了PC2和PC3。AFR,非洲;AMR,Ad混合美国;EAS,东亚;EUR,欧洲;SAS,南亚。d)提出的治疗设计框架。
图13A-E:左边,ExAC数据集中由变体改变的PAM的分数;中间,PAM改变变体频率的分布;右边,按照频率的纯合变体的分数。显示AsCpf1(a),SpCas9-VQR(b),SpCas9(c),SaCas9(d)和SpCas9-VRER(e)的数据。
图14A-D:顶部,治疗相关基因的靶标变异的分布。变异频率小于0.01%的靶标(红线)被认为是铂。底部,这些含有变异的基因中的所有靶标的分数。显示AsCpf1(a),SpCas9-VWR(b),SpCas9-WT(c),SaCas9-WT(d)的数据。
图15:基于跨越12个治疗相关基因的靶标的患者特异性脱靶谱图将千人基因组个体分成超群体。显示主成分1-5。AFR,非洲;AMR,Ad混合美国;EAS,东亚;EUR,欧洲;SAS,南亚。
图16:基于跨越12个治疗相关基因的靶标的患者特异性脱靶谱图将千人基因组个体分成群体。显示主成分1-5。CHB,中国北京的汉人;JPT,日本东京的日本人;CHS,南方汉人;CDX,中国西双版纳的傣族中国人;KHV,越南胡志明市的京族(Kinh);CEU,有北方和西方祖先的犹他州居民(CEPH);TSI,意大利托斯卡尼(Toscani);FIN,芬兰的芬兰人;GBR,英格兰和苏格兰的英国人;IBS,西班牙的伊比利亚群体;YRI,尼日利亚伊巴丹的约鲁巴人(Yoruba);LWK,肯尼亚韦布耶(Webuye)的卢希亚人;GWD,冈比亚西部区的冈比亚人;MSL,塞拉利昂的门德人;ESN,尼日利亚的埃桑人(Esan);ASW,美国西南部有非洲祖先的美国人;ACB,巴巴多斯的非洲加勒比人;MXL,来自美国洛杉矶的墨西哥祖先;PUR,来自波多黎各的波多黎各人;CLM,来自哥伦比亚麦德林的哥伦比亚人;PEL,来自秘鲁利马的秘鲁人;GIH:来自德克萨斯州休斯顿的古吉拉特印第安人;PJL,来自巴基斯坦拉合尔的旁遮普人(Punjabi);BEB,来自孟加拉国的孟加拉人;STU,来自英国的斯里兰卡泰米尔人;ITU,来自英国的印度泰卢固人(Telugu)。
图17:基于跨越12个治疗相关基因的靶标的患者特异性脱靶谱图,按性别分开千人基因组个体。显示主成分1-5。
图18A-10C。使用wt AsCpf1验证PAM筛选。A.用于含有指定PAM序列的克隆的cam/amp培养基中的群落生长。B.条形图显示野生型AsCpf1对PAM中的置换突变的敏感性。C.屏幕读数,突出耗尽的命中。每个点代表不同的Cpf1野生型(WT)或突变密码子。虚线表示15倍的耗尽。红色=终止密码子;蓝色=WT密码子。
图19A-19E显示具有截短的指导的AsCpf1和LbCpf1的Cpf1靶核酸酶活性。图19A提供了与在图B-D中描绘的指导长度相关的关键。图19B描绘了具有靶向DNMT1-3的截短的指导的AsCpf1的活性。图19C描绘了具有靶向DNMT1-4的截短的指导的AsCpf1的活性。图19D描绘了具有靶向DNMT1-3的截短的指导的LbCpf1的活性。图19E描绘了具有靶向DNMT1-4的截短的指导的AsCpf1的活性。
图20A-20E显示具有部分结合的指导的AsCpf1和LbCpf1的Cpf1靶核酸酶活性。所有指导的长度均为24nt,与范围从24nt到14nt的靶标相匹配。图20A提供了关于图B-D中描绘的部分结合指导的关键。图20B描绘了具有靶向DNMT1-3的部分匹配的指导的AsCpf1的活性。图20C描绘了具有靶向DNMT1-4的部分匹配的指导的AsCpf1的活性。图20D描绘了具有靶向DNMT1-3的部分匹配的指导的LbCpf1的活性。图20E描绘了具有靶向DNMT1-4的部分匹配的指导的AsCpf1的活性。
图21。体外切割测定。AsCpf1PAM突变体S542R/K607R具有体外改变的PAM特异性。A.S542R/K607R(RR)和A542R/K548V/N552R(RVR)变体与野生型相比的PAM偏好。对于野生型、S542R/K607R和S542R/K548V/N552R变体,表现所有4碱基PAM基序的标准化切割率。B.Cpf1变体在人类基因组中的靶向范围,包括WT(深蓝色)、S542R/K607R(黄色)和S542R/K548V/N552R(浅黄色)。百分比表示由相应的PAM表现的所有非重复指导序列(顶端和底端链两者)的比例;C.对于TTTV PAM(深蓝色)和可被任何变体切割的所有PAM(黄色),在人类基因组的非重复区域中最近的靶位点之间的距离。
图22:在HEK293细胞中验证AsCpf1 PAM突变体。对于指定的Cpf1突变体和指定的靶基因的指定PAM序列,测定插入缺失%。指定的PAM位点后面的数字表示不同的靶序列(例如TGTG-48)和对给定靶序列的不同转染(例如TGTG-48.2)。表达AsCpf1(野生型或突变体)的质粒和表达AsCpf1 DR+间隔子的质粒的共转染。转染后第3天靶向的基因组基因座的靶向深度测序。
图23A-23D。A.在TATV靶位点处S542R/K548V/N552R变体的活性;B.在TYCV位点处S542R/K607变体的活性;C.在TYCV和CCCC靶位点处S542R/K607R变体的活性和在TTTV靶位点处S542R/K548V变体的活性;D.在VYCV位点处S542R/K607R变体的活性。所有插入缺失百分比在HEK293细胞中测量。
图24。在HEK293细胞中验证AsCpf1PAM突变体S542R/K607R。对于Cpf1突变体和各种靶基因的63个不同靶位点的指定PAM序列,测定插入缺失%。表达AsCpf1(野生型或突变体)的质粒和表达AsCpf1 DR+间隔子的质粒的共转染。转染后第3天靶向的基因组基因座的靶向深度测序。
图25。AsCpf1(氨基酸球菌物种BV3L6)和LbCpf1(毛螺菌科细菌ND2006)的蛋白质比对。
图26。根据本发明的一个实施方式的编码突变Cpf1的示例性表达质粒。(A)编码AsCpf1突变体S542R/K607R的pY036。(B)编码AsCpf1突变体S542R/K607R的pcDNA。功能性特征在相应的图和序列上指示。
图27A-27D。Cpf1PAM变体的DNA靶向特异性。A.DNA双链断裂原位标记和测序(BLISS),用于HEK293细胞中的4个靶位点(VEGFA、GRIN2B、EMX1和DNMT1)。BLISS的log10双链断裂(DSB)评分由紫色热图表示,并且来自体外切割测定的相对PAM切割率由蓝色热图表示。指导的最后三个碱基中的错配没有被突出,因为它们不影响切割效率。B.用已知的TTTV脱靶位点评估另外的靶位点,证实PAM偏好对脱靶活性的贡献。C.添加K949A突变减少了脱靶DNA切割。D.将K949A与S542R/K548V/N552R和S542R/K607R PAM变体组合,保留对其优选PAM的高水平中靶活性。
图28是描绘根据某些示例性实施方式要选择和优化的示例参数的图。
图29显示了本发明的AAV-CRISPR蛋白的说明,其中Cas9蛋白与VP3融合或链接。例如,在VP3的N-末端。Cas9附着于一些但不是所有VP3亚基,以避免AAV表面上细胞进入位点的空间阻断。在AAV9.Cas9载体中,描绘了与VP1、VP2或VP3的C-末端融合或链接的Cas9蛋白。
图30A-30B显示Western印迹,证实Cas9-VP3融合蛋白在用编码Cas9和Cas9-VP3融合的质粒(AAVCas9:野生型为1:6)转染的细胞中的表达。(A)左图:来自AAVCas9:野生型为1:6的部分的SYPRO Ruby蛋白染色。右图:来自AAVCas9:野生型为1:6的部分的抗SpCas9印迹。(B)左图:来自wtAAV9的部分的SYPRO Ruby蛋白质染色。右图:来自wtAAV9的部分的抗SpCas9印迹。
图31显示了AAV9 VP3中用于蛋白质插入的外环和内部位点。
图32描绘了wtAAV的电子显微照片。暗粒子中心表示空颗粒。
图33描绘了包含50wtAAV:10AAVCas9的AAV.Cas9病毒颗粒的电子显微照片。
图34描绘了包含30wtAAV:30AAVCas9的AAV.Cas9病毒颗粒的电子显微照片。
图35A-35B描绘了分选酶介导的蛋白质连接。(A)显示了革兰氏阳性细菌中通过分选酶锚定到细胞壁的蛋白质的示意图(参见,Guimares等,Nat.Prot.2013)。(B)通过TEV-分选酶方法将Cas9与AAV连接。将CRISPR蛋白与分选酶A一起孵育。所述CRISPR蛋白在其C末端用LPXTG分选酶-识别基序进行修饰并在其后含有用于纯化的手柄(通常为His6)。分选酶切割苏氨酸-甘氨酸键,并形成酰基中间体与苏氨酸。加入包含N-末端甘氨酸残基的TEV切割的AAV(“探针”)将AAV连接到CRISPR蛋白的C末端(参见,Guimares,等,Nat.Prot.2013)。
图36描绘了通过断裂内含肽重建(split intein reconstitution)将Cas9与AAV连接。
图37A-37B显示了蛋白质的内部包装:
图38显示了内部SunTag-GFP。Western印迹检测天然VP3和VP3-GFP融合的VP3(左上)和GFP(左下)。电子显微照片显示GFP填充的衣壳(103)。
图39描绘了包装泡囊的水疱性口炎病毒(VSV)和狂犬病病毒(RV)来源。
图40显示用包装在水疱性口炎病毒-G(VSVG)泡囊中的慢病毒载体转导细胞的示意图。(Cronin等,Curr Gene Ther.5(4):387-398(2005))。
图41描绘了用具有诱导移码突变的Cas9和sgRNA的VSVG和RVG泡囊感染TLR19细胞以允许mCherry表达。Cas9RNP泡囊由VSVG(或RVG)与eSpCas9(1.1)和GFPg2质粒共转染来合成。
图42提供了AsCpf1和FnCpf1的比对,鉴定了Rad50结合结构域和内部的精氨酸和赖氨酸
图43提供了如Cpf1中发现的那些的两个相似结构域的晶体结构
图44提供了具有对应于注释的DNA结合区的区域的Aspf1的晶体结构。
本文中的附图仅用于说明目的,不一定按比例绘制。
特定的实施方式
一般定义
除非另外定义,否则本文使用的技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。常见术语和分子生物学技术的定义可见于:MolecularCloning:A Laboratory Manual,2nd edition(1989)(Sambrook,Fritsch,and Maniatis);Molecular Cloning:A Laboratory Manual,4th edition(2012)(Green and Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel等eds.);the seriesMethods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson,B.D.Hames,and G.R.Taylor eds.):Antibodies,A Laboraotry Manual(1988)(Harlow and Lane,eds.):Antibodies A Laboraotry Manual,2nd edition 2013(E.A.Greenfield ed.);Animal Cell Culture(1987)(R.I.Freshney,ed.);BenjaminLewin,Genes IX,published by Jones and Bartlet,2008(ISBN 0763752223);Kendrew等(eds.),The Encyclopedia of Molecular Biology,published by Blackwell ScienceLtd.,1994(ISBN 0632021829);Robert A.Meyers(ed.),Molecular Biology andBiotechnology:a Comprehensive Desk Reference,published by VCH Publishers,Inc.,1995(ISBN 9780471185710);Singleton等,Dictionary of Microbiology andMolecular Biology 2nd ed.,J.Wiley&Sons(New York,N.Y.1994),March,AdvancedOrganic Chemistry Reactions,Mechanisms and Structure 4th ed.,John Wiley&Sons(New York,N.Y.1992);和Marten H.Hofker and Jan van Deursen,Transgenic MouseMethods and Protocols,2nd edition(2011)。
如本文所用,单数形式“一个/种(a/an)”和“该/所述(the)”包括单数和复数指示物两者,除非上下文另有明确说明。
术语“任选的”或“任选地”是指随后描述的事件、情形或取代基可以发生或可以不发生,并且该描述包括事件或情形发生的实例和不发生的实例。
由端点表述的数值范围包括包含在相应范围内的所有数字和分数,以及所记载的端点。
当提及诸如参数、量、持续时间等的可测量值时,本文使用的术语“约”或“大约”意味着包括规定值的变化和来自规定值的变化,例如+/-10%或更少、+/-5%或更少、+/-1%或更少和+/-0.1%或更少的规定值的变化或来自规定值的变化,这是在这样的变化适合于在所公开的发明中进行的情况下。应理解,修饰语“约”或“大约”所指的值本身也是特别是且优选地公开的。
本说明书各处提到“一个实施方式”、“实施方式”、“示例性实施方式”意味着结合该实施方式描述的特定特征、结构或特性被包含在本发明的至少一个实施方式中。因此,本说明书各处出现的短语“在一个实施方式中”,“在实施方式中”或“示例性实施方式”不一定都指代同一实施方式,而是可以。此外,特定特征、结构或特性可以以任何合适的方式,如从本公开对于本领域技术人员是显而易见的,在一个或多个实施方式中组合。此外,虽然本文描述的一些实施方式包括其他实施方式中包括的一些但不是其他特征,但是不同实施方式的特征的组合也意味着是在本发明的范围内。例如,在所附权利要求中,任何要求保护的实施方式可以以任何组合使用。
应当理解,术语Cas酶、CRISPR酶、CRISPR蛋白、Cas蛋白和CRISPR Cas通常可互换使用,并且在本文提到的所有位置,与本申请中进一步描述的新型CRISPR效应蛋白类似地提到,除非在其他方面是明显的,例如通过特别提到Cas9或Cpf1。本文描述的CRISPR效应蛋白优选为Cpf1效应蛋白。
本文引用的所有出版物、公开的专利文献和专利申请均通过引用并入本文,其程度如同每份单独的出版物、公开的专利文献或专利申请被具体和单独地指出通过引用并入。
概论
在一个方面,本文公开的实施方式涉及工程化CRISPR-Cas效应蛋白,其相对于未修饰的CRISPR-Cas效应蛋白包含至少一种修饰,所述修饰使与野生型相比,CRISPR复合物与结合位点的结合增强和/或改变编辑偏好。在某些示例性实施方式中,CRISPR-Cas效应蛋白是V型效应蛋白。在某些其他示例性实施方式中,V型效应蛋白是Cpf1。下面进一步详细讨论适用于本文公开的实施方式的实例Cpf1蛋白。
在另一个方面,本文公开的实施方式涉及用于递送CRISPR-Cas效应蛋白(包括Cpf1)的病毒载体。在某些示例性实施方式中,设计载体以允许将CRISPR-Cas效应蛋白包装在单个载体内。在设计用于包装并因此表达较大转基因的紧凑启动子用于靶向递送和组织特异性的方面的兴趣也增加。因此,在另一个方面,本文公开的某些实施方式涉及用于全身递送的递送较大基因的递送载体、构建体和方法。
在另一个方面,本发明涉及用于开发或设计CRISPR-Cas系统的方法。在一个方面,本发明涉及用于开发或设计用于广泛应用的优化的CRISPR-Cas系统的方法,包括但不限于治疗开发、生物生产以及植物和农业应用。在某些基于的疗法或治疗剂中。本发明特别涉及用于改进CRISPR-Cas系统(例如,基于CRISPR-Cas系统的疗法或治疗剂)的方法。成功的CRISPR-Cas系统(例如,基于CRISPR-Cas系统的疗法或治疗剂)的关键特征涉及高特异性、高功效和高安全性。通过降低脱靶效应,可以实现高特异性和高安全性等。改进的特异性和功效同样可用于改进植物和生物生产中的应用。
因此,在一个方面,本发明涉及用于增加CRISPR-Cas系统(例如,基于CRISPR-Cas系统的疗法或治疗剂)的特异性的方法。在另一个方面,本发明涉及用于增加CRISPR-Cas系统(例如,基于CRISPR-Cas系统的疗法或治疗剂)的功效的方法。在另一个方面,本发明涉及用于增加CRISPR-Cas系统(例如,基于CRISPR-Cas系统的疗法或治疗剂)的安全性的方法。在另一个方面,本发明涉及用于增加CRISPR-Cas系统(例如,基于CRISPR-Cas系统的疗法或治疗剂)的特异性、功效和/或安全性(优选全部)的方法。
在某些实施方式中,CRISPR-Cas系统包括如本文其他地方所定义的CRISPR效应子。
本发明的方法特别涉及优化对选择的与CRISPR-Cas系统和/或其功能相关的参数或变量进行优化,如本文其他地方进一步所述。本文所述方法中,对CRISPR-Cas系统进行优化可取决于靶标(例如,一种或多种治疗性靶标),CRISPR-Cas系统调节(例如,基于CRISPR-Cas系统的治疗性靶标调节)、修饰或操控的模式或类型,以及CRISPR-Cas系统组分的递送。取决于基因型和/或表型结果,可以选择一种或多种靶标。例如,取决于(遗传)疾病病因或期望的治疗结果,可以选择一种或多种治疗性靶标。(治疗性)靶标可以是单个基因、基因座或其他基因组位点,或可以是多个基因、基因座或其他基因组位点。如本领域已知的,例如通过使用多种gRNA,单个基因、基因座或其他基因组位点可以被靶向不止一次。
CRISPR-Cas系统活性,例如,CRISPR-Cas系统设计可涉及靶标破坏,例如靶标突变,例如导致基因敲除。CRISPR-Cas系统活性,例如,CRISPR-Cas系统设计可涉及特定靶位点的替换,例如导致靶标校正。CISPR-Cas系统设计可涉及特定靶位点的移除,例如导致靶标缺失。CRISPR-Cas系统活性可涉及靶位点功能的调节,例如,靶位点活性或可及性,导致例如(转录的和/或表观遗传的)基因或基因组区域激活或者基因或基因组区域沉默。本领域技术人员将理解,靶位点功能的调节可涉及CRISPR效应子突变(例如,产生催化失活的CRISPR效应子)和/或功能化(例如CRISPR效应子与异源功能结构域(例如,转录激活子或阻遏物)的融合),如本文其他地方所述。
工程化CRISPR-Cas系统
通常,CRISPR(规律成簇的间隔短回文重复序列),也称为SPIDR(间隔子散布直接重复序列),构成通常对特定细菌物种特异的DNA基因座的家族。CRISPR基因座包含在大肠杆菌中识别的不同类型的散布短序列重复序列(SSR)(Ishino等,J.Bacteriol.,169:5429-5433;and Nakata等,J.Bacteriol.,171:3553-3556)和相关基因。相似的散布SSR已经在地中海富盐菌(Haloferax mediterranei)、化脓链球菌(Streptococcus pyogenes)、鱼腥藻(Anabaena)和结核分枝杆菌(Mycobacterium tuberculosis)中鉴定(参见,Groenen等,Mol.Microbiol.,10:1057-1065;Hoe等,Emerg.Infect.Dis.,5:254-263;Masepohl等,Biochim.Biophys.Acta 1307:26-30;和Mojica等,Mol.Microbiol.,17:85-93)。CRISPR基因座与其他SSR的区别通常在于重复序列的结构,其已被称为短规律间隔重复序列(SRSR)(Janssen等,OMICS J.Integ.Biol.,6:23-33;和Mojica等,Mol.Microbiol.,36:244-246)。通常,重复序列是以簇形式出现的短元件,所述簇由具有基本上恒定的长度的独特插入序列规则地间隔开(Mojica等,,同上)。尽管重复序列在菌株之间是高度保守的,但散布的重复序列的数量和间隔子域的序列通常因菌株而异(van Embden等,J.Bacteriol.,182:2393-2401)。CRISPR基因座在超过40种原核生物中鉴定(参见e.g.,Jansen等,Mol.Microbiol.,43:1565-1575;和Mojica等,),包括但不限于,气火菌属(Aeropyrum)、热棒菌属(Pyrobaculum)、硫化裂片菌属(Sulfolobus)、古生球菌属(Archaeoglobus)、Halocarcula、甲烷细菌属(Methanobacterium)、产甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、火球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、热原体属(Thermoplasma)、棒状杆菌属(Corynebacterium)、分支杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产水菌属(Aquifex)、卟啉单胞菌属(Porphyromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、李斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、高温厌氧杆菌属(Thermoanaerobacter)、支原体(Mycoplasma)、梭杆菌属(Fusobacterium)、Azarcus、色素细菌(Chromobacterium)、奈瑟氏菌属(Neisseria)、亚硝化单胞菌(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、地杆菌属(Geobacter)、粘球菌(Myxococcus)、弯曲菌属(Campylobacter)、沃廉菌属(Wolinella)、不动杆菌属(Acinetobacter)、欧文氏菌属(Erwinia)、埃希氏杆菌属(Escherichia)、军团菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德菌(Pasteurella)、发光杆菌属(Photobacterium)、沙门氏菌(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、,密螺旋体(Treponema)和热袍菌属(Thermotoga)。
Cpf1效应蛋白的一般特征
本发明包括Cpf1效应蛋白的用途,所述Cpf1效应蛋白衍生自表示为亚型V-A的Cpf1基因座。在本文中,这样的效应蛋白也称为“Cpf1p”,例如Cpf1蛋白(并且这种效应蛋白或Cpf1蛋白或衍生自Cpf1基因座的蛋白也称为“CRISPR酶”)。目前,亚型V-A基因座包括cas1、cas2,表示为cpf1的不同基因和CRISPR阵列。Cpf1(CRISPR相关蛋白Cpf1,亚型PREFRAN)是大蛋白质(约1300个氨基酸),其含有与Cas9的相应结构域同源的RuvC样核酸酶结构域以及Cas9的特征性富精氨酸簇的对应物。然而,Cpf1缺乏存在于所有Cas9蛋白中的HNH核酸酶结构域,并且RuvC样结构域在Cpf1序列中是连续的,这与含有包括HNH结构域的长插入物的Cas9相反。因此,在特别的实施方式中,CRISPR-Cas酶仅包含RuvC样核酸酶结构域。
鉴定新CRISPR-Cas基因座的方法
Cpf1基因在若干不同的细菌基因组中发现,通常与cas 1、cas2和cas4基因和CRISPR盒在相同的基因座中(例如,Francisella cf.novicida Fx1的FNFX1_1431-FNFX1_1428)。因此,这种新型CRISPR-Cas系统的布局似乎与II-B型类似。此外,类似于Cas9,Cpf1蛋白含有与转座子ORF-B同源的可易于识别的C-末端区域,并且包括活性RuvC样核酸酶(富精氨酸区域)和Zn指(Cas9中不存在)。然而,与Cas9不同,Cpf1也存在于没有CRISPR-Cas上下文的多个基因组中,并且其与ORF-B相对高的相似性表明它可能是转座子组分。有人提出,如果这是真正的CRISPR-Cas系统并且Cpf1是Cas9的功能类似物,那么它将是新颖的CRISPR-Cas类型,即V型(参见Annotation and Classification of CRISPR-CasSystems.Makarova KS,Koonin EV.Methods Mol Biol.2015;1311:47-75)。然而,如本文所述,Cpf1表示为亚型V-A,以将其与不具有相同结构域结构并因此表示为亚型V-B的C2c1p区分开。
本申请描述了在疗法中使用CRISPR-Cas蛋白的方法。这在本文中用Cpf1举例,借此已经鉴定了许多Cpf1直系同源物或同源物。本领域技术人员清楚进一步的Cpf1直系同源物或同源物可以被鉴定,并且本文描述的任何功能都可以被工程化到其他Cpf1直系同源物,包括包含来自多种直系同源物的片段的嵌合酶。
例如,鉴定新型CRISPR-Cas基因座的计算方法在EP3009511或US2016208243中描述并且可以包括以下步骤:检测编码Cas1蛋白的所有重叠群(contig);鉴定cas1基因的20kB内所有可预测的蛋白质编码基因;将经鉴定的基因与Cas蛋白特异性谱图相比较和预测CRISPR阵列;选择含有大于500个氨基酸(>500aa)的蛋白质的未分类候选CRISPR-Cas基因座;使用例如PSI-BLAST和HHPred的方法分析选择的候选者以筛选已知的蛋白质结构域,从而鉴定新的2类CRISPR-Cas基因座(也参见Schmakov等2015,Mol Cell.60(3):385-97)。除了上述步骤之外,可以通过在宏基因组学数据库中搜索另外的同源物来进行候选者的额外分析。另外地或替代地,为了将搜索扩展到非自主CRISPR-Cas系统,通过将CRISPR阵列用作种子,进行相同的程序。
在一个方面,检测编码Cas1蛋白的所有重叠群由GenemarkS进行,该基因预测程序在“GeneMarkS:a self-training method for prediction of gene starts inmicrobioal genomes.Implications for finding sequence motifs in regulatoryregions.”John Besemer,Alexandre Lomsadze和Mark Borodovsky,Nucleic AcidsResearch(2001)29,第2607-2618页中进一步描述,通过引入并入本文。
在一个方面,鉴定所有预测的蛋白质编码基因是通过将经鉴定的基因与Cas蛋白质特异性谱图进行比较并根据NCBI保守结构域数据库(CDD)对其进行注释来进行的,CDD是蛋白质注释来源,其由用于古代结构域和全长蛋白质的良好注释的多序列比对模型的集合组成。这些可用作位置特异性评分矩阵(PSSM)以通过RPS-BLAST快速鉴定蛋白质序列中的保守结构域。CDD内容包括NCBI-curated结构域,其使用3D结构信息以明确定义结构域边界并提供对序列/结构/功能关系以及从许多外部源数据库(Pfam,SMART,COG,PRK,TIGRFAM)导入的结构域模型的见解。在另一个方面,使用PILER-CR程序预测CRISPR阵列,PILER-CR程序是用于发现CRISPR重复序列的公共结构域软件,如“PILER-CR:fast and accurateidentification of CRISPR repeats”,Edgar,R.C.,BMC Bioinformatics,Jan 20;8:18(2007)中描述,通过引入并入本文。
在另一个方面,使用PSI-BLAST(位置特异性迭代基本局部比对搜索工具)执行逐案分析。PSI-BLAST使用蛋白质-蛋白质BLAST从检测到在给定分数阈值以上的序列的多序列比对中得到位置特异性评分矩阵(PSSM)或谱图。该PSSM用于进一步在数据库中搜索新的匹配,并且使用这些新检测到的序列进行后续迭代的更新。因此,PSI-BLAST提供了检测蛋白质之间的远距离关系的手段。
在另一个方面,使用HHpred进行逐案分析。HHpred是一种序列数据库搜索和结构预测的方法,其与BLAST或PSI-BLAST一样易于使用,同时在寻找远程同源物时更加灵敏。实际上,HHpred的灵敏度可以与当前可用的最强大的结构预测服务器竞争。HHpred是第一个基于谱图隐藏马尔可夫模型(HMM)的成对比较的服务器。虽然大多数常规序列搜索方法搜索序列数据库,例如UniProt或NR,HHpred搜索比对数据库,例如Pfam或SMART。这使命中列表极大地简化至许多序列家族而不是杂乱的单一序列。所有主要的公开可用的谱图和比对数据库都可通过HHpred获得。HHpred接受单个查询序列或多重比对作为输入。只需几分钟,它就以类似于PSI-BLAST的易于阅读的格式返回搜索结果。搜索选项包括本地或全局比对和评分二级结构相似性。HHpred可以生成成对查询-模板序列比对、合并查询-模板多重比对(例如,用于传递搜索)以及由MODELLER软件从HHpred比对计算的3D结构模型。
在某些示例性实施方式中,用于鉴定新CRISPR基因座的方法可以包括与已知的CRISPR基因座的性能和元件相比较。示例性方法在2016年8月17日提交的题为“Methodsfor identifying Class 2CRISPR-Cas systems”的美国临时申请62/376,387,2016年8月17日提交的题为“Methods for Identifying Novel Gene Editing Elements”的美国临时申请号62/376,383和Shmakov等“Diversity and evolution of class 2CRISPR-Cassystems,”Nat Rev Microbiol.2017 15(3):169-182中公开。最后,例如以上所公开的那些的方法也可适应于鉴定包含与特定的已知CRISPR客体如Cas9或Cpf1相反的一般的重复基序的基因组结构。
应进一步认识到,使用下文小标题为“用于测定中靶/脱靶活性和选择适合序列/指导的方法”的部分公开的方法,可以进一步发现和或整合推定的新CRISPR-Cas基因座,特别是对于相关的核酸酶活性。
Cpf1的直系同源物
术语“直系同源物(orthologue)”(在本文中也称为“直系同源物(ortholog)”)和“同源物(homologue)”(在本文中也称为“同源物(homolog)”)是本领域已知的。通过进一步的指导,本文使用的蛋白质的“同源物”是相同物种的蛋白质,其执行与其同源的蛋白质相同或相似的功能。同源蛋白质可以但不需要在结构上相关,或仅在结构上部分相关。如本文所用的蛋白质的“直系同源物”是不同物种的蛋白质,其执行与其直系同源的蛋白质相同或相似的功能。直系同源蛋白可以但不需要在结构上相关,或仅在结构上部分相关。同源物和直系同源物可通过同源建模鉴定(参见例如,Greer,Science vol.228(1985)1055,andBlundell等Eur J Biochem vol 172(1988),513)或"structural BLAST"(Dey F,CliffZhang Q,Petrey D,Honig B.Toward a"structural BLAST":using structuralrelationships to infer function.Protein Sci.2013Apr;22(4):359-66.doi:10.1002/pro.2225.)。另见Shmakov等(2015)在CRISPR-Cas基因座领域的应用。同源蛋白质可以但不需要在结构上相关,或仅在结构上部分相关。
Cpf1基因被发现于多种不同的细菌基因组中,通常在与cas1,cas2和cas4基因以及CRISPR盒相同的基因座中(例如,Francisella cf.novicida Fx1的FNFX1_1431-FNFX1_1428)。因此,这种推定的新型CRISPR-Cas系统的布局似乎与II-B型类似。此外,与Cas9类似,Cpf1蛋白含有可易于鉴定的C-末端区,所述C-末端区与转座子ORF-B同源,并且包含活性RuvC样核酸酶(富精氨酸区域)和Zn指(Cas9中不存在)。然而,与Cas9不同,Cpf1也存在于没有CRISPR-Cas上下文的多个基因组中,并且其与ORF-B相对高的相似性表明它可能是转座子组分。有人提出,如果这是真正的CRISPR-Cas系统并且Cpf1是Cas9的功能类似物,那么它将是新颖的CRISPR-Cas类型,即V型(参见Annotation and Classification of CRISPR-Cas Systems.Makarova KS,Koonin EV.Methods Mol Biol.2015;1311:47-75)。然而,如本文所述,Cpf1表示为亚型V-A,以将其与不具有相同结构域结构并因此表示为亚型V-B的C2c1p区分开。
在特定的实施方式中,效应蛋白是来自属的生物的Cpf1效应蛋白,属包括链球菌属(Streptococcus)、弯曲菌属(Campylobacter)、Nitratifractor、葡萄球菌属(Staphylococcus)、Parvibaculum、罗斯氏菌属(Roseburia)、奈瑟氏菌属(Neisseria)、葡糖醋杆菌属(Gluconacetobacter)、固氮螺菌属(Azospirillum)、Sphaerochaeta、乳杆菌属(Lactobacillus)、真杆菌属(Eubacterium)、Corynebacte、肉食杆菌属(Carnobacterium)、红细菌属(Rhodobacter)、李斯特菌属(Rhodobacter)、Paludibacter、梭菌属(Clostridium)、毛螺菌属(Lachnospiraceae)、Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西斯氏菌属(Francisella)、军团菌属(Legionella)、脂环酸芽孢杆菌(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌属(Porphyromonas)、普雷沃氏菌属(Prevotella)、拟杆菌属(Bacteroidetes)、创伤球菌属(Helcococcus)、Letospira、脱硫弧菌属(Desulfovibrio)、脱硫嗜盐碱菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、Tuberibacillus、芽孢杆菌属(Bacillus)、Brevibacilus、甲基杆菌属(Methylobacterium)或氨基酸球菌属(Acidaminococcus)。
在进一步的特定的实施方式中,Cpf1效应蛋白来自选自S.mutans,S.agalactiae,S.equisimilis,S.sanguinis,S.pneumonia;C.jejuni,C.coli;N.salsuginis,N.tergarcus;S.auricularis,S.carnosus;N.meningitides,N.gonorrhoeae;L.monocytogenes,L.ivanovii;C.botulinum,C.difficile,C.tetani,C.sordellii的生物。
效应蛋白可包括嵌合效应蛋白,所述嵌合效应蛋白包含来自第一效应蛋白(例如,Cpf1)直系同源物的第一片段和来自第二效应(例如,Cpf1)蛋白直系同源物的第二片段,并且其中第一和第二效应蛋白直系同源物是不同的。第一和第二效应蛋白(例如,Cpf1)直系同源物中的至少一种可以包括来自生物的效应蛋白(例如,Cpf1),所述生物包括链球菌属(Streptococcus)、弯曲菌属(Campylobacter)、Nitratifractor、葡萄球菌属(Staphylococcus)、Parvibaculum、罗斯氏菌属(Roseburia)、奈瑟氏菌属(Neisseria)、葡糖醋杆菌属(Gluconacetobacter)、固氮螺菌属(Azospirillum)、Sphaerochaeta、乳杆菌属(Lactobacillus)、真杆菌属(Eubacterium)、Corynebacte、肉食杆菌属(Carnobacterium)、红细菌属(Rhodobacter)、李斯特菌属(Rhodobacter)、Paludibacter、梭菌属(Clostridium)、毛螺菌属(Lachnospiraceae)、Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西斯氏菌属(Francisella)、军团菌属(Legionella)、脂环酸芽孢杆菌(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌属(Porphyromonas)、普雷沃氏菌属(Prevotella)、拟杆菌属(Bacteroidetes)、创伤球菌属(Helcococcus)、Letospira、脱硫弧菌属(Desulfovibrio)、脱硫嗜盐碱菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、Tuberibacillus、芽孢杆菌属(Bacillus)、Brevibacilus、甲基杆菌属(Methylobacterium)或氨基酸球菌属(Acidaminococcus);例如,嵌合效应蛋白包含第一片段和第二片段,其中第一片段和第二片段各自选自来自生物的Cpf1,所述生物包括链球菌属(Streptococcus)、弯曲菌属(Campylobacter)、Nitratifractor、葡萄球菌属(Staphylococcus)、Parvibaculum、罗斯氏菌属(Roseburia)、奈瑟氏菌属(Neisseria)、葡糖醋杆菌属(Gluconacetobacter)、固氮螺菌属(Azospirillum)、Sphaerochaeta、乳杆菌属(Lactobacillus)、真杆菌属(Eubacterium)、Corynebacte、肉食杆菌属(Carnobacterium)、红细菌属(Rhodobacter)、李斯特菌属(Rhodobacter)、Paludibacter、梭菌属(Clostridium)、毛螺菌属(Lachnospiraceae)、Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西斯氏菌属(Francisella)、军团菌属(Legionella)、脂环酸芽孢杆菌(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌属(Porphyromonas)、普雷沃氏菌属(Prevotella)、拟杆菌属(Bacteroidetes)、创伤球菌属(Helcococcus)、Letospira、脱硫弧菌属(Desulfovibrio)、脱硫嗜盐碱菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、Tuberibacillus、芽孢杆菌属(Bacillus)、Brevibacilus、甲基杆菌属(Methylobacterium)或氨基酸球菌属(Acidaminococcus),其中第一和第二片段不是来自相同的细菌;例如嵌合效应蛋白包含第一片段和第二片段,其中第一和第二片段各自选自S.mutans,S.agalactiae,S.equisimilis,S.sanguinis,S.pneumonia;C.jejuni,C.coli;N.salsuginis,N.tergarcus;S.auricularis,S.carnosus;N.meningitides,N.gonorrhoeae;L.monocytogenes,L.ivanovii;C.botulinum,C.difficile,C.tetani,C.sordellii;Francisella tularensis 1,Prevotella albensis,Lachnospiraceaebacterium MC2017 1,Butyrivibrio proteoclasticus,Peregrinibacteria bacteriumGW2011_GWA2_33_10,Parcubacteria bacterium GW2011_GWC2_44_17,Smithellasp.SCADC,Acidaminococcus sp.BV3L6,Lachnospiraceae bacterium MA2020,CandidatusMethanoplasma termitum,Eubacterium eligens,Moraxella bovoculi 237,Leptospirainadai,Lachnospiraceae bacterium ND2006,Porphyromonas crevioricanis 3,Prevotella disiens和Porphyromonas macacae的Cpf1,其中第一和第二片段不是来自相同的细菌。
在一种更优选的实施方式中,Cpf1衍生自选自Francisella tularensis 1,Prevotella albensis,Lachnospiraceae bacterium MC2017 1,Butyrivibrioproteoclasticus,Peregrinibacteria bacterium GW2011_GWA2_33_10,Parcubacteriabacterium GW2011_GWC2_44_17,Smithella sp.SCADC,Acidaminococcus sp.BV3L6,Lachnospiraceae bacterium MA2020,Candidatus Methanoplasma termitum,Eubacterium eligens,Moraxella bovoculi 237,Leptospira inadai,Lachnospiraceaebacterium ND2006,Porphyromonas crevioricanis 3,Prevotella disiens和Porphyromonas macacae的细菌物种。在某些实施方式中,Cas9p衍生自选自Acidaminococcus sp.BV3L6,Lachnospiraceae bacterium MA2020的细菌物种。在某些实施方式中,效应蛋白衍生自Francisella tularensis 1的亚种,包括但不限于Francisellatularensis subsp.Novicida。
在特定的实施方式中,本文提到的Cpf1的同源物或直系同源物具有与Cpf1至少80%,更优选至少85%,甚至更优选至少90%,例如至少95%的序列同源性或同一性。在进一步的实施方式中,本文提到的Cpf1的同源物或直系同源物具有与野生型Cpf1至少80%,更优选至少85%,甚至更优选至少90%,例如,至少95%的序列同一性。当Cpf1具有一个或多个突变(突变的)时,本文提到的所述Cpf1的同源物或直系同源物具有与突变的Cpf1至少80%,更优选至少85%,甚至更优选至少90%,例如至少95%的序列同一性。
在一个实施方式中,Cpf1蛋白可以是属的生物的直系同源物,所述属包括但不限于氨基酸球菌属(Acidaminococcus sp.)、毛螺菌科细菌(Lachnospiraceae bacterium)或Moraxella bovoculi;在特定实施方式中,V型Cas蛋白可以是种的生物的直系同源物,所述种包括但不限于氨基酸球菌物种BV3L6、毛螺菌科细菌ND2006(LbCpf1)或Moraxellabovoculi 237。在特定的实施方式中,本文提到的Cpf1的同源物或直系同源物具有与本文所公开的Cpf1序列中的一种或多种至少80%,更优选至少85%,甚至更优选至少90%,例如至少95%的序列同源性或同一性。在进一步的实施方式中,本文提到的Cpf1的同源物或直系同源物具有与野生型FnCpf1、AsCpf1或LbCpf1至少80%,更优选至少85%,甚至更优选至少90%,例如至少95%的序列同一性。
在特定的实施方式中,本发明的Cpf1蛋白具有与FnCpf1、AsCpf1或LbCpf1至少60%,更特定地至少70%,例如至少80%,更优选至少85%,甚至更优选至少90%,例如至少95%的序列同源性或同一性。在进一步的实施方式中,本文提到的Cpf1蛋白具有与野生型AsCpf1或LbCpf1至少60%,例如至少70%,更特定地至少80%,更优选至少85%,甚至更优选至少90%,例如至少95%的序列同一性。在特别的实施方式中,本发明的Cpf1蛋白与FnCpf1具有小于60%的序列同一性。技术人员将理解,这包括截短形式的Cpf1蛋白,由此在截短形式的长度上确定序列同一性。
在本发明的一个实施方式中,效应蛋白包含至少一个HEPN结构域,包括但不限于本文所述的HEPN结构域、本领域中已知的HEPN结构域,和通过与共有序列和基序比较而被识别为HEPN结构域的结构域。
PAM的测定
PAM的测定可以如下确定。本实验与在大肠杆菌中StCas9的异源表达的相似工作(Sapranauskas,R.等Nucleic Acids Res 39,9275–9282(2011))紧密平行。申请人将含有PAM和抗性基因的质粒导入异源大肠杆菌中,然后在相应的抗生素上铺板。如果存在质粒的DNA切割,则申请人观察不到有活力的菌落。
更详细地,对于DNA靶标,测定如下。在该测定中使用两种大肠杆菌菌株。一种携带编码来自细菌菌株的内源效应蛋白基因座的质粒。另一种菌株携带空质粒(例如,pACYC184,对照菌株)。所有可能的7或8bp的PAM序列置于抗生素抗性质粒(具有氨苄青霉素抗性基因的pUC19)上。PAM位于原型间隔子1(对内源效应蛋白基因座中第一个间隔子的DNA靶标)的序列旁边。克隆了两个PAM文库。一个具有原型间隔子的8随机bp 5’(例如,总共65536个不同PAM序列=复杂性)。另一个库具有原型间隔子的7随机bp 3’(例如,总复杂度为16384个不同的PAM)。对两个文库进行克隆从而每个可能的PAM平均具有500个质粒。用5’PAM和3’PAM文库在单独的转化中转化测试菌株和对照菌株,并将转化的细胞分别铺板在氨苄青霉素平板上。对质粒的识别和随后切割/干扰使细胞易受氨苄青霉素的影响并阻止生长。转化后约12小时,收集测试和对照菌株形成的所有菌落并分离质粒DNA。质粒DNA用作PCR扩增和随后深度测序的模板。在未转化文库中的所有PAM的表现显示了转化细胞中PAM的预期表现。在对照菌株中发现的所有PAM的表现显示了实际表现。测试菌株中所有PAM的表现显示了哪些PAM未被酶识别,并且与对照菌株的比较允许提取耗尽的PAM的序列。
对于迄今鉴定的Cpf1直系同源物,已经鉴定了以下PAM:氨基酸球菌物种BV3L6Cpf1(AsCpf1)和毛螺菌科细菌ND2006Cpf1(LbCpf1)可以切割TTTV PAM之后的靶位点,FnCpf1p可以切割TTN之后的位点,其中N是A/C/G或T。
密码子优化的核酸序列
当效应蛋白是作为核酸施用,本申请设想使用密码子优化的Cpf1序列。密码子优化序列的实例在这种情况下是优化用于真核生物表达的序列,例如,人类(即,优化用于在人类中表达),或本文公开的另外的真核生物、动物或哺乳动物;参见,例如,WO2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化序列作为密码子优化序列的实例(来自本领域和本公开的知识,密码子优化编码核酸分子,特别是关于效应蛋白(例如,Cpf1),是在本领域技术人员的范围内)。虽然这是优选的,但应当理解,其他实例是可能的,并且对于除人类以外的宿主物种的密码子优化,或对于特定器官的密码子优化,是已知的。在一些实施方式中,编码DNA/RNA-靶向Cas蛋白的酶编码序列经密码子优化以在特定细胞(例如,真核细胞)中表达。真核细胞可以是特定生物的或衍生自特定生物的那些,例如植物或哺乳动物,包括但不限于本文的人类或非人类真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、狗、牲畜,或非人类哺乳动物或灵长类动物。在一些实施方式中,可以排除用于修饰人类的种系遗传特性的方法和/或用于修饰动物的遗传特性的方法,所述方法可能导致它们受苦而对人或动物以及由这样的方法获得的动物没有任何实质性医学益处。通常,密码子优化是指通过将天然序列的至少一个密码子(例如,约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)替换为在宿主细胞的基因中更频繁或最频繁的密码子,同时保持天然氨基酸序列,以增强在感兴趣的宿主细胞中的表达的修饰核酸序列的过程。各种物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏好(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,其据信又取决于尤其是被翻译的密码子的特性和特定转运RNA(tRNA)分子的可用性。所选择的tRNA在细胞中的优势通常是肽合成中最常使用的密码子的反映。因此,可以基于密码子优化来剪裁基因以在给定生物中获得最佳基因表达。密码子使用表容易获得,例如,可在www.kazusa.orjp/codon/获得的“密码子使用数据库”,并且这些表可以以多种方式改编。参见Nakamura,Y.,等“Codon usage tabulated from theinternational DNA sequence databases:status for the year 2000”Nucl.AcidsRes.28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可以获得,例如Gene Forge(Aptagen;Jacobus,PA)也可以获得。在一些实施方式中,在编码DNA/RNA-靶向Cas蛋白的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定氨基酸的最频繁使用的密码子。关于酵母中的密码子使用,参考可获自http://www.yeastgenome.org/community/codon_usage.shtml的在线酵母基因组数据库,或Codon selection in yeast,Bennetzen and Hall,J BiolChem.1982Mar 25;257(6):3026-31。关于包括藻类的植物中的密码子使用,参考Codonusage in higher plants,green algae,and cyanobacteria,Campbell and Gowri,PlantPhysiol.1990Jan;92(1):1–11.;和Codon usage in plant genes,Murray等,NucleicAcids Res.1989Jan 25;17(2):477-98;或Selection on the codon bias ofchloroplast and cyanelle genes in different plant and algal lineages,MortonBR,J Mol Evol.1998Apr;46(4):449-59.
经修饰的Cpf1酶
在特定的实施方式中,令人感兴趣的是使我们获得如本文所定义的工程化Cpf1蛋白,例如Cpf1,其中所述蛋白质与包含RNA的核酸分子复合以形成CRISPR复合物,其中当在CRISPR复合物中时,核酸分子靶向一个或多个靶多核苷酸基因座,所述蛋白质与未修饰的Cpf1蛋白相比包含至少一个修饰,并且其中与包含未修饰的Cpf1蛋白的复合物相比,包含经修饰的蛋白质的CRISPR复合物具有改变的活性。应当理解,当在本文中提及CRISPR“蛋白”时,Cpf1蛋白优选是经修饰的CRISPR酶(例如,具有增加或减少(或没有)的酶活性,例如,但不限于包括Cpf1)。术语“CRISPR蛋白”可与“CRISPR酶”互换使用,而不管CRISPR蛋白是否已经相对于野生型CRISPR蛋白改变,例如,增加或减少(或没有)的酶活性。
对Cpf1核酸酶的一级结构的计算分析揭示了三个不同的区域。首先是C末端RuvC样结构域,其是唯一的功能特征结构域。第二个是N-末端α-螺旋区,第三个是位于RuvC样结构域和α-螺旋区之间的混合α和β区。
在Cas9主要结构内预测了多个非结构化区域的小延伸。暴露于溶剂并且在不同Cpf1直系同源物内不保守的非结构化区域是用于小蛋白质序列的分裂和插入的优选侧面(图10和11)。此外,这些侧面可用于在CCpf1as9直系同源物之间产生嵌合蛋白。
在一个示例性实施方式中,在某些示例性实施方式中,经修饰的Cpf1蛋白质包含至少一个与野生型相比改变编辑偏好的修饰。在某些示例性实施方式中,编辑偏好是用于靶区域内的特定插入或缺失。在某些示例性实施方式中,至少一个修饰使一个或多个特定插入缺失的形成增加。在某些示例性实施方式中,至少一个修饰位于C-末端RuvC样结构域、N-末端α-螺旋区、混合α和β区,或其组合。在某些示例性实施方式中,改变的编辑偏好是插入缺失的形成。在某些示例性实施方式中,至少一个修饰使一个或多个特定插入的形成增加。
在某些示例性实施方式中,至少一个修饰使一个或多个特定插入的形成增加。在某些示例性实施方式中,至少一个修饰导致在邻近靶区域的A、T、G或C处插入A。在另一种示例性实施方式中,至少一个修饰导致在邻近靶区域的A、T、G或C处插入T。在另一种示例性实施方式中,至少一个修饰导致在邻近靶区域的A、T、G或C处插入G。在另一种示例性实施方式中,至少一个修饰导致在邻近靶区域的A、T、G或C处插入C。插入可以是在邻近核苷酸的5’或3’。在一个示例性实施方式中,一个或多个修饰引导T插入邻近现有的T。在某些示例性实施方式中,现有的T对应于指导序列的结合区的第4个位置。在某些示例性实施方式中,一个或多个修饰产生确保更精确的单碱基插入或缺失(例如上述那些)的酶。更特别是,一个或多个修饰可以通过酶减少其他类型的插入缺失的形成。产生单碱基插入或缺失的能力可以在许多应用具有兴趣,例如在由小缺失引起的疾病中的遗传突变体的校正,更特别地在HDR不可能的情况下。例如,通过递送指导三个T的插入的三个sRNA对CFTR中的F508del突变进行校正(这是囊性纤维化的最常见基因型),或在大脑中的CDKL5中对Alia Jafar的单核苷酸缺失进行校正。由于编辑方法仅需要NHEJ,因此在例如大脑的有丝分裂后细胞中进行编辑是可能的。产生一个碱基对插入/缺失的能力在全基因组CRISPR-Cas阴性选择筛选中也是有用的。在某些示例性实施方式中,至少一个修饰是突变。在某些其他示例性实施方式中,一个或多个修饰可以与包括增加结合特异性和/或降低脱靶效应的修饰的下述一个或多个另外的修饰或突变组合。
在某些示例性实施方式中,包含与野生型相比改变编辑偏好的至少一个修饰的工程化CRISPR-Cas效应子还可以包含一个或多个另外的修饰,所述一个或多个另外的修饰改变对包含RNA或靶多肽基因座的核酸分子的结合特性,改变与核酸分子或靶分子或靶多核苷酸的结合动力学,或改变对核酸分子的结合特异性。这样的修饰的实例总结在以下段落中。基于上述信息,可以产生导致酶的失活或将双链核酸酶修饰为切口酶活性的突变体。在替代的实施方式中,该信息用于开发具有降低的脱靶效应的酶(本文其他地方描述)。
在某些上述Cpf1酶中,根据FnCpf1蛋白或任何相应的直系同源物,通过突变一个或多个残基来修饰酶,包括但不限于位置D917、E1006、E1028、D1227、D1255A、N1257。在一个方面,本发明提供了本文讨论的组合物,其中Cpf1酶是失活酶,其包含选自根据FnCpf1蛋白的D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A和N1257A或Cpf1直系同源物中的相应位置的一种或多种突变。在一个方面,本发明提供了本文讨论的组合物,其中根据FnCpf1蛋白或Cpf1直系同源物中的相应位置,CRISPR酶包含D917,或E1006和D917,或D917和D1255。
在某些上述Cpf1酶中,通过一个或多个残基(在RuvC结构域中)的突变来修饰酶,包括但不限于参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号的位置R909、R912、R930、R947、K949、R951、R955、K965、K968、K1000、K1002、R1003、K1009、K1017、K1022、K1029、K1035、K1054、K1072、K1086、R1094、K1095、K1109、K1118、K1142、K1150、K1158、K1159、R1220、R1226、R1242和/或R1252。
在某些上述非天然存在的CRISPR酶中,通过一个或多个残基(在RAD50中)结构域的突变来修饰酶,包括但不限于参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号的位置K324、K335、K337、R331、K369、K370、R386、R392、R393、K400、K404K406、K408、K414、K429、K436、K438、K459、K460、K464、R670、K675、R681、K686、K689、R699、K705、R725、K729、K739、K748和/或K752。
在某些Cpf1酶中,通过一个或多个残基的突变来修饰酶,包括但不限于参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号的位置R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、K1072、K1086、F1103、R1226和/或R1252。
在某些实施方式中,通过一个或多个残基的突变来修饰Cpf1酶,包括但不限于参考LbCpf1(毛螺菌科细菌ND2006)的氨基酸位置编号的位置R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、R1138、R1165和/或R1252。
在某些实施方式中,通过一个或多个残基的突变来修饰Cpf1酶,包括但不限于参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号的位置K15、R18、K26、Q34、R43、K48、K51、R56、R84、K85、K87、N93、R103、N104、T118、K123、K134、R176、K177、R192、K200、K226、K273、K275、T291、R301、K307、K369、S404、V409、K414、K436、K438、K468、D482、K516、R518、K524、K530、K532、K548、K559、K570、R574、K592、D596、K603、K607、K613、C647、R681、K686、H720、K739、K748、K757、T766、K780、R790、P791、K796、K809、K815、T816、K860、R862、R863、K868、K897、R909、R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、A1053、K1072、K1086、F1103、S1209、R1226、R1252、K1273、K1282和/或K1288。
在某些实施方式中,通过一个或多个残基的突变来修饰酶,包括但不限于参考FnCpf1(Francisella novicida U112)的氨基酸位置编号的位置K15、R18、K26、R34、R43、K48、K51、K56、K87、K88、D90、K96、K106、K107、K120、Q125、K143、R186、K187、R202、K210、K235、K296、K298、K314、K320、K326、K397、K444、K449、E454、A483、E491、K527、K541、K581、R583、K589、K595、K597、K613、K624、K635、K639、K656、K660、K667、K671、K677、K719、K725、K730、K763、K782、K791、R800、K809、K823、R833、K834、K839、K852、K858、K859、K869,K871、R872、K877、K905、R918、R921、K932、I960、K962、R964、R968、K978、K981、K1013、R1016、K1021、K1029、K1034、K1041、K1065、K1084和/或K1098。
在某些实施方式中,通过一个或多个残基的突变来修饰酶,包括但不限于参考LbCpf1(毛螺菌科细菌ND2006)的氨基酸位置编号的位置K15、R18、K26、K34、R43、K48、K51、R56、K83、K84、R86、K92、R102、K103、K116、K121、R158、E159、R174、R182、K206、K251、K253、K269、K271、K278、P342、K380、R385、K390、K415、K421、K457、K471、A506、R508、K514、K520、K522、K538、Y548、K560、K564、K580、K584、K591、K595、K601、K634、K640、R645、K679、K689、K707、T716、K725、R737、R747、R748、K753、K768、K774、K775、K785、K787、R788、Q793、K821、R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、K1121、R1138、R1165、K1190、K1199和/或K1208。
在某些实施方式中,通过一个或多个残基的突变来修饰酶,包括但不限于参考MbCpf1(Moraxella bovoculi 237)的氨基酸位置编号的位置K14、R17、R25、K33、M42、Q47、K50、D55、K85、N86、K88、K94、R104、K105、K118、K123、K131、R174、K175、R190、R198、I221、K267、Q269、K285、K291、K297、K357、K403、K409、K414、K448、K460、K501、K515、K550、R552、K558、K564、K566、K582、K593、K604、K608、K623、K627、K633、K637、E643、K780、Y787、K792、K830、Q846、K858、K867、K876、K890、R900、K901、M906、K921、K927、K928、K937、K939、R940、K945、Q975、R987、R990、K1001、R1034、I1036、R1038、R1042、K1052、K1055、K1087、R1090、K1095、N1103、K1108、K1115、K1139、K1158、R1172、K1188、K1276、R1293,A1319、K1340、K1349和/或K1356。
最近,描述了用于产生具有增强的特异性的Cas9直系同源物的方法(Slaymaker等,2015)。该策略可用于增强Cpf1直系同源物的特异性。目前认为以下修饰提供增强的Cpf1特异性。
表1:RuvC内的保守赖氨酸和精氨酸残基。
AsCpf1 LbCpf1
R912 R833
T923 R836
R947 K847
K949 K879
R951 K881
R955 R883
K965 R887
K968 K897
K1000 K900
R1003 K932
K1009 R935
K1017 K940
K1022 K948
K1029 K953
K1072 K960
K1086 K984
F1103 K1003
R1226 K1017
R1252 R1033
R1138
R1165
另外的候选者是在不同的直系同源物之间保守的带正电荷的残基(表X2)。
表2:保守赖氨酸和精氨酸残基
表2提供了在来自Francisella novicida U112(FnCpf1)、氨基酸球菌物种BV3L6(AsCpf1)、漆树科细菌ND2006(LbCpf1)和Moraxella bovoculi 237(MbCpf1)的Cpf1核酸酶的比对中保守赖氨酸和精氨酸残基的位置。这些可用于产生具有增强的特异性的Cpf1突变体。
采用与用于改善Cas9特异性类似的策略,Cpf1的特异性可以通过对使非靶向DNA链稳定的残基进行突变来改善。这可以在没有晶体结构的情况下通过使用线性结构比对来预测1)Cpf1的哪个结构域与哪条DNA链结合以及2)这些结构域内的哪些残基与DNA接触来完成。
然而,该方法可能由于Cpf1与已知蛋白的差的保守性而受限。因此,探测所有可能的DNA相互作用氨基酸(赖氨酸,组氨酸和精氨酸)的功能可以是期望的。
在整个Cpf1中RuvC结构域中的带正电荷的残基比在Rad50结构域中的那些更保守,表明RuvC残基在进化上较不灵活。这表明在该结构域中需要严格控制核酸结合(相对于Rad50结构域)。因此,由于需要RNA:DNA双链体稳定化(Cas9中的先例),该结构域切割靶向的DNA链是可能的。此外,在RuvC结构域中存在更多的精氨酸(RuvC的5%残基904至1307相对于所提出的Rad50结构域的3.8%),这再次表明RuvC靶向与指导RNA复合的DNA链。精氨酸更多地参与结合核酸主要和次要沟槽(Rohs等,Nature(2009):Vol461:1248-1254)。主要/次要沟槽仅存在于双链体中(例如DNA:RNA靶双链体),进一步表明RuvC切割“靶向的链”。
根据这些关于AsCpf1的具体观察,我们可以通过序列比对鉴定来自其他物种的Cpf1中的类似残基。图42中给出的AsCpf1和FnCpf1比对的实例鉴定了Rad50结合结构域和内部的精氨酸和赖氨酸。
图43提供了两种类似结构域的晶体结构,如在Cpf1中发现的那些(RuvC假日结合解离酶和Rad50DNA修复蛋白)。基于这些结构,可以推断出相关结构域在Cpf1中像什么,并推断哪些区域和残基可以与DNA接触。在每个结构中,突出接触DNA的残基。在图X4的比对中,对应于这些DNA结合区的AsCpf1的区域被注释。表4中的残基列表是在两个结合结构域中发现的那些。
表4—可探测的DNA相互作用残基的列表
失活(deactivated)/失活(inactivated)的Cpf1蛋白
在Cpf1蛋白具有核酸酶活性的情况下,Cpf1蛋白可被修饰以具有与野生型酶相比减少的核酸酶活性,例如,至少70%、至少80%、至少90%、至少95%、至少97%或100%的核酸酶失活;或者换句话说,Cpf1酶有利地具有非突变或野生型Cpf1酶或CRISPR酶的核酸酶活性的约0%,或不超过非突变或野生型Cpf1酶的核酸酶活性的约3%或约5%或约10%,例如非突变或野生型Francisella novicida U112(FnCpf1)、氨基酸球菌物种BV3L6(AsCpf1)、毛螺菌科细菌ND2006(LbCpf1)和Moraxella bovoculi 237(MbCpf1)Cpf1酶或CRIPSR酶。这可以通过将突变引入Cpf1及其直系同源物的核酸酶结构域来实现。
在某些实施方式中,CRISPR酶被工程化并且可以包含一个或多个降低或消除核酸酶活性的突变。FnCpf1p RuvC结构域中的氨基酸位置包括但不限于D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A和N1257A。申请人还鉴定了与PD-(D/E)XK核酸酶超家族和HincII核酸内切酶样最相似的推定的第二核酸酶结构域。有待在该推定的核酸酶结构域中产生的点突变基本上降低核酸酶活性包括但不限于N580A、N584A、T587A、W609A、D610A、K613A、E614A、D616A、K624A、D625A、K627A和Y629A。在优选的实施方式中,FnCpf1p RuvC结构域中的突变是D917A或E1006A,其中D917A或E1006A突变使FnCpf1效应蛋白的DNA切割活性完全失活。在另一个实施方式中,FnCpf1p RuvC结构域中的突变是D1255A,其中突变的FnCpf1效应蛋白具有显著降低的核溶解活性。
更特别地,失活的Cpf1酶包括在AsCpf1的氨基酸位置As908、As993、As1263或Cpf1直系同源物中的相应位置突变的酶。另外,失活的Cpf1酶包括在LbCpf1的氨基酸位置Lb832、925、947或1180或在Cpf1直系同源物中的相应位置突变的酶。更特别地,失活的Cpf1酶包括含有AsCpf1的突变AsD908A、AsE993A、AsD1263A或Cpf1直系同源物中的相应突变中的一种或多种的酶。另外,失活的Cpf1酶包括含有LbCpf1的突变LbD832A、E925A、D947A或D1180A或Cpf1直系同源物中的相应突变中的一种或多种的酶。
突变也可以在相邻残基处(例如,在如上所述参与核酸酶活性的那些附近的氨基酸处)进行。在一些实施方式中,仅RuvC结构域被失活,并且在其他实施方式中,另一个推定的核酸酶结构域被失活,其中效应蛋白复合物起切口酶的作用并且仅切割一条DNA链。在一个优选的实施方式中,其他推定的核酸酶结构域是HincII样内切核酸酶结构域。在一些实施方式中,使用FnCpf1、AsCpf1或LbCpf1变体(每种为不同的切口酶)来增加特异性,两种切口酶变体用于在靶标处切割DNA(其中切口酶两者切割DNA链,同时最小化或消除脱靶修饰,其中只有一条DNA链被切割并随后被修复)。在优选的实施方式中,Cpf1效应蛋白作为包含两个Cpf1效应蛋白分子的同型二聚体,切割与感兴趣的靶基因座相关或在感兴趣的靶基因座处的序列。在优选的实施方式中,同型二聚体可以包含在它们各自的RuvC结构域中包含不同突变的两个Cpf1效应蛋白分子。
失活的Cpf1 CRISPR酶可以与一个或多个功能结构域相关联(例如,通过融合蛋白),所述功能结构域包括例如,来自包括以下的组、基本上由以下组成的组、或由以下组成的组的一种或多种结构域:甲基化酶活性、去甲基酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性,和分子开关(例如,光诱导型)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在提供Fok1的情况下,提供多个Fok1功能结构域以允许功能二聚体,并且设计gRNA以为功能使用(Fok1)提供合适的间隔(如Tsai等Nature Biotechnology,Vol.32,Number 6,June 2014具体所述)是有利的。衔接蛋白可以使用已知的接头附着这样的功能结构域。在一些情况下,额外提供至少一个NLS是有利的。在一些情况下,将NLS定位在N末端是有利的。当包含多于一个功能结构域时,功能结构域可以相同或不同。
通常,一个或多个功能结构域在失活的Cpf1酶上的定位允许功能结构域的正确空间方向以影响具有归于的功能效应的靶标。例如,如果功能结构域是转录激活子(例如,VP64或p65),则转录激活子被置于允许其影响靶标的转录的空间方向。同样地,转录阻遏物将有利地定位以影响靶标的转录,并且核酸酶(例如,Fok1)将有利地定位以切割或部分切割靶标。这可以包括除CRISPR酶的N-/C-末端之外的位置。
核靶向系统的元件
通常,本申请中使用的“核酸靶向系统”共同指代转录物和涉及表达或引导核酸靶向CRISPR相关(“Cas”)基因(也在本文中称为效应蛋白)的活性的其他元件,包括编码核酸靶向Cas(效应子)蛋白和指导RNA(包含crRNA序列和反式激活CRISPR/Cas系统RNA(tracrRNA)序列)的序列,或来自核酸靶向CRISPR基因座的其他序列和转录物。在一些实施方式中,核酸靶向系统的一个或多个元件衍生自V型/VI型核酸靶向CRISPR系统。在一些实施方式中,核酸靶向系统的一个或多个元件衍生自包含内源核酸靶向CRISPR系统的特定生物。通常,核酸靶向系统的特征在于促进核酸靶向复合物在靶序列位点处形成的元件。在形成核酸靶向复合物的上下文中,“靶序列”是指引导序列被设计为具有互补性的序列,其中靶序列和指导RNA之间的杂交促进DNA或RNA靶向复合物形成。完全互补不一定是需要,条件是存在足够的互补性以引起杂交并促进核酸靶向复合物形成。靶序列可包含RNA多核苷酸。在一些实施方式中,靶序列位于细胞的细胞核或细胞质中。在一些实施方式中,靶序列可以在真核细胞的细胞器内,例如,线粒体或叶绿体。可用于重组到包含靶序列的靶向基因座中的序列或模板称为“编辑模板”或“编辑RNA”或“编辑序列”。在本发明的方面,外源模板RNA可以称为编辑模板。在本发明的一个方面,重组是同源重组。
通常,在内源核酸靶向系统的上下文中,形成核酸靶向复合物(包含与靶序列杂交并与一种或多种核酸靶向效应蛋白复合的指导RNA)导致在靶序列中或附近(例如,在1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)切割一条或者两条RNA链。在一些实施方式中,将驱动核酸靶向系统的一个或多个元件的表达的一种或多种载体导入宿主细胞中,使得核酸靶向系统的元件的表达引导核酸靶向复合物在一个或多个目标位点的形成。例如,核酸靶向效应蛋白和指导RNA可各自可操作地连接至单独载体上的单独调控元件。或者,可以将由相同或不同调控元件表达的两个或更多个元件组合在单一载体中,且一种或多种另外的载体提供不包括在第一载体中的核酸靶向系统的任何组分。在单个载体中组合的核酸靶向系统元件可以以任何合适的方向排列,例如,一个元件位于相对于第二元件的5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同或相反的链上,并且以相同或相反的方向取向。在一些实施方式中,单个启动子驱动编码核酸靶向效应蛋白的转录物和嵌入至一个或多个内含子序列内的指导RNA(例如,各自在不同的内含子中,两个或更多个在至少一个内含子中,或全部在单个内含子中)的表达。在一些实施方式中,核酸靶向效应蛋白和指导RNA可操作地连接至同一启动子并由其表达。
通常,CRISPR系统的特征在于促进CRISPR复合物在靶序列位点处形成的元件(在内源CRISPR系统的上下文中也称为原型间隔子)。在形成CRISPR复合物的上下文中,“靶序列”是指指导序列被设计为靶向(例如具有互补性)至其的序列,其中靶序列和指导序列之间的杂交促进CRISPR复合物的形成。与靶序列的互补性对于切割活性重要的指导序列的部分在本文中称为种子序列。靶序列可包含任何多核苷酸,例如DNA或RNA多核苷酸,并包含在感兴趣的靶基因座内。在一些实施方式中,靶序列位于细胞的细胞核或细胞质中。
通常,术语“指导序列”是具有与靶多核苷酸序列足够的互补性以与靶序列杂交并且指导核酸靶向复合物与靶序列序列特异性结合的任何多核苷酸序列。在一些实施方式中,当使用合适的比对算法进行最佳比对时,指导序列与其相应的靶序列之间的互补程度为约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。可以使用用于比对序列的任何合适的算法来确定最佳比对,其非限制性示例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如,Burrows WheelerAligner)、ClustalW、ClustalX、BLAT、Novoalign(NovocraftTechnologies、ELAND(Illumina,SanDiego,CA)、SOAP(可在soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。在一些实施方式中,指导序列的长度为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸。在一些实施方式中,指导序列的长度小于约75、50、45、40、35、30、25、20、15、12或更少个核苷酸。可以通过任何合适的测定评估指导序列引导核酸靶向复合物与靶序列序列特异性结合的能力(如EP3009511或US20162082中所述)。例如,足以形成核酸靶向复合物的核酸靶向系统的组分(包括待测的指导序列)可以提供给具有相应靶序列的宿主细胞(例如,通过转染编码核酸靶向CRISPR序列的组分的载体),然后,例如通过本文所述的Surveyor测定,评估靶序列内或靶序列附近的优先切割。类似地,靶多核苷酸序列(或在其附近的序列)的切割可以通过提供靶序列、包含待测指导序列和与待测指导序列不同的对照指导序列的核酸靶向复合物的组分,并比较待测和对照指导序列反应之间在靶序列处或附近的结合或切割速率在检测试管中评估。其他测定法是可能的,并且对于本领域技术人员而言将会发生。
可以选择指导序列以靶向任何靶序列。在一些实施方式中,靶序列是基因转录物或mRNA内的序列。在一些实施方式中,靶序列是细胞基因组内的序列。
在一些实施方式中,选择指导序列以降低指导序列内的二级结构的程度。二级结构可以通过任何合适的多核苷酸折叠算法确定。一些程序是基于计算最小吉布斯自由能。一种这样的算法的例子是mFold,如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所述。另一种折叠算法的例子是使用质心结构预测算法由维也纳大学理论化学研究所(Institute for Theoretical Chemistry at the University of Vienna)开发的在线网络服务器RNFfold(参见,例如,A.R.Gruber等,2008,Cell 106(1):23-24;and PA Carr andGM Church,2009,Nature Biotechnology 27(12):1151-62)。进一步的算法可见于美国申请序列号TBA(代理人案卷号44790.11.2022;Broad Reference BI-2013/004A),通过引用并入本文。
在某些实施方式中,指导RNA或crRNA可包含直接重复(DR)序列和指导序列或间隔子序列,基本上由它们组成,或由它们组成。在某些实施方式中,指导RNA或crRNA可以包含与指导序列或间隔子序列融合或连接的直接重复序列,基本上由它们组成,或由它们组成。在某些实施方式中,直接重复序列可位于指导序列或间隔子序列的上游(即5’)。在其他实施方式中,直接重复序列可位于指导序列或间隔子序列的下游(即3’)。对于迄今鉴定的Cpf1直系同源物,直接重复序列位于指导序列的上游5’。
关于核酸靶向复合物或系统,优选地,crRNA序列具有一个或多个茎环或发夹,并且长度为30或更多个核苷酸、长度为40或更多个核苷酸,或者长度为50或更多个核苷酸。在某些实施方式中,crRNA序列的长度为42至44个核苷酸,并且核酸靶向Cas蛋白为Francisella tularensis subsp.novocida U112的Cpf1。在某些实施方式中,crRNA包含直接重复的19个核苷酸和间隔子序列的23至25个核苷酸、基本由它们组成或由它们组成,并且靶向核酸的Cas蛋白是Francisella tularensis subsp.novocida U112的Cpf1。
在某些实施方式中,crRNA包含茎环,优选单茎环。在某些实施方式中,直接重复序列形成茎环,优选单茎环。
在某些实施方式中,指导RNA的间隔子长度为15至35nt。在某些实施方式中,指导RNA的间隔子长度为至少15个核苷酸。在某些实施方式中,间隔子长度为15-17nt,例如15、16或17nt,17-20nt,例如17、18、19或20nt,20-24nt,例如,20、21、22、23或24nt,23-25nt,例如23、24或25nt,24-27nt,例如24、25、26或27nt,27-30nt,例如,27、28、29或30nt,30-35nt,例如30、31、32、33、34或35nt,或35nt或更长。
在一些实施方式中,直接重复的最小长度为16nt并具有单茎环。在进一步的实施方式中,直接重复的长度大于16nt,优选大于17nt,并且具有多于一个茎环或优化的二级结构。在一些实施方式中,指导序列的长度为至少16、17、18、19、20、25个核苷酸,或16-30个,或16-25个,或16-20个核苷酸。
在一些实施方式中,可以通过搜索满足以下标准中的任一个或全部的重复基序来在计算机中鉴定直接重复:1.在II型CRISPR基因座侧翼的基因组序列的2Kb窗口中发现;2.跨度20至50bp;和3.间隔20至50bp。在一些实施方式中,可以使用这些标准中的两个,例如,1和2、2和3、或1和3。在一些实施方式中,可以使用所有3个标准。
“tracrRNA”序列或类似术语包括与crRNA序列具有足够互补性以杂交的任何多核苷酸序列。如上所述,在本发明的实施方式中,tracrRNA不是Cpf1效应蛋白复合物的切割活性所需要的。
在一些实施方式中,核酸靶向效应蛋白是包含一个或多个异源蛋白结构域的融合蛋白的一部分(例如,除核酸靶向效应蛋白外,约或多于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)。在一些实施方式中,CRISPR效应蛋白是包含一个或多个异源蛋白结构域的融合蛋白的一部分(例如,除CRISPR酶外,约或多于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)。CRISPR酶融合蛋白可以包含任何另外的蛋白质序列,并且任选地包含任何两个结构域之间的接头序列。可以与CRISPR酶融合的蛋白质结构域的实例包括,但不限于,表位标签、报告基因序列,和具有一种或多种以下活性的蛋白质结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性,和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的实例包括但不限于谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β-半乳糖苷酶、β-葡糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP),和包括蓝色荧光蛋白(BFP)的自发荧光蛋白。CRISPR酶可以与编码蛋白质或蛋白质片段的基因序列融合,其结合DNA分子或结合其他细胞分子,包括但不限于麦芽糖结合蛋白(MBP)、S标签、Lex A DNA结合结构域(DBD)融合、GAL4DNA结合结构域融合和单纯疱疹病毒(HSV)BP16蛋白融合。可以形成包含CRISPR酶的融合蛋白的一部分的另外的结构域描述于US20110059502中,其通过引用并入本文。在一些实施方式中,加标签的CRISPR酶用于鉴定靶序列的位置。
在一些实施方式中,CRISPR酶可以形成诱导型系统的组分。该系统的诱导性质将允许使用能量形式进行基因编辑或基因表达的时空控制。能量形式可以包括但不限于电磁辐射、声能、化学能和热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP,ABA等)或光诱导型系统(光敏色素、LOV结构域或隐花色素)。在一个实施方式中,CRISPR酶可以是光诱导型转录效应子(LITE)的一部分,以通过序列特异性的方式引导转录活性的变化。光的组分可以包括CRISPR酶、光响应性细胞色素异二聚体(例如,来自拟南芥(Arabidopsis thaliana))和转录激活/抑制结构域。诱导型DNA结合蛋白的进一步实例及其使用方法提供于US61/736465和US61/721,283和WO2014/018423和US8889418、US8895308、US20140186919、US20140242700、US20140273234、US20140335620、WO2014093635,其通过整体引用并入本文。
在一些实施方式中,还提供了重组模板。重组模板可以是如本文所述的另一载体的组分,包含在单独的载体中,或作为单独的多核苷酸提供。在一些实施方式中,重组模板被设计为用作同源重组的模板,例如在作为核酸靶向复合物的一部分的核酸靶向效应蛋白切口或切割的靶序列内或附近。
在一个实施方式中,模板核酸改变靶位置的序列。在一个实施方式中,模板核酸导致将修饰的或非天然存在的碱基引入靶核酸中。
模板序列可以经历破坏介导的或催化的与靶序列的重组。在一个实施方式中,模板核酸可以包括对应于在由Cas9介导的切割事件切割的靶序列上的位点的序列。在一个实施方式中,模板核酸可包括对应于以下两者的序列,在第一Cas9介导的事件中被切割的靶序列上的第一位点,和在第二Cas9介导的事件中被切割的靶序列上的第二位点。
在某些实施方式中,模板核酸可以包含导致翻译序列的编码序列改变的序列,例如,导致蛋白质产物中一个氨基酸置换另一个氨基酸的序列,例如,将突变等位基因转变为野生型等位基因,将野生型等位基因转变为突变等位基因,和/或引入终止密码子、插入氨基酸残基、缺失氨基酸残基或无义突变。在某些实施方式中,模板核酸可包括导致非编码序列改变的序列,例如,外显子或5’或3’非翻译或非转录区域的改变。这样的改变包括控制元件(例如,启动子、增强子和顺式作用或反式作用控制元件)的改变。
与靶基因中的靶位置具有同源性的模板核酸可用于改变靶序列的结构。模板序列可用于改变不想要的结构,例如,不想要的或突变的核苷酸。模板核酸可包含序列,所述序列当整合时导致降低阳性控制元件的活性;增加阳性控制元件的活性;降低阴性控制元件的活性;增加阴性控制元件的活性;降低基因的表达;增加基因的表达;增加对失调或疾病的抵抗力;增加对病毒进入的抵抗力;校正突变或改变不想要的氨基酸残基;赋予、增加、消除或降低基因产物的生物学特性,例如,增加酶的酶活性,或增加基因产物与另一分子相互作用的能力。
模板核酸可以包含序列,所述序列导致在靶序列的序列中1、2、3、4、5、6、7、8、9、10、11、12或更多个核苷酸的变化。
模板多核苷酸可以具有任何合适的长度,例如长度为约或大于约10、15、20、25、50、75、100、150、200、500、1000或更多个核苷酸。在一个实施方式中,模板核酸的长度可以是20+/-10、30+/-10、40+/-10、50+/-10、60+/-10、70+/-10、80+/-10、90+/-10、100+/-10、110+/-10、120+/-10、130+/-10、140+/-10、150+/-10、160+/-10,170+/-10、180+/-10、190+/-10、200+/-10、210+/-10、220+/-10个核苷酸。在一个实施方式中,模板核酸的长度可以是30+/-20、40+/-20、50+/-20、60+/-20、70+/-20、80+/-20、90+/-20、100+/-20、110+/-20、120+/-20、130+/-20、140+/-20、150+/-20、160+/-20、170+/-20、180+/-20、190+/-20、200+/-20、210+/-20、220+/-20个核苷酸。在一个实施方式中,模板核酸为10-1,000、20-900、30-800、40-700、50-600、50-500、50-400、50-300、50-200或50-100个核苷酸。
在一些实施方式中,模板多核苷酸与包含靶序列的多核苷酸的一部分互补。当最佳比对时,模板多核苷酸可以与靶序列的一个或多个核苷酸重叠(例如,约或多于约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100个或更多个核苷酸)。在一些实施方式中,当模板序列和包含靶序列的多核苷酸最佳比对时,模板多核苷酸的最近的核苷酸在距离靶序列约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000个或更多个核苷酸内。
外源多核苷酸模板包含被整合的序列(例如,突变的基因)。用于整合的序列可以是细胞的内源或外源序列。待整合的序列的实例包括编码蛋白质或非编码RNA(例如,microRNA)的多核苷酸。因此,用于整合的序列可以可操作地连接至一个或多个合适的控制序列。或者,待整合的序列可以提供调节功能。
上游或下游序列可包含约20bp至约2500bp,例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300,1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有约200bp至约2000bp,约600bp至约1000bp,或更特别地约700bp至约1000bp。
上游或下游序列可包含约20bp至约2500bp,例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400,1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有约200bp至约2000bp,约600bp至约1000bp或更特别是约700bp至约1000bp。
在某些实施方式中,可以缩短一个或两个同源臂以避免包括某些序列重复元件。例如,可以缩短5’同源臂以避免序列重复元件。在其他实施方式中,可以缩短3’同源臂以避免序列重复元件。在一些实施方式中,可缩短5’和3’同源臂两者以避免包含某些序列重复元件。
在一些方法中,外源多核苷酸模板可以进一步包含标志物。这样的标志物可以使筛选靶向整合变得容易。合适标志物的实例包括限制性位点、荧光蛋白或选择标记。可以使用重组技术构建本发明的外源多核苷酸模板(参见,例如,Sambrook等,2001and Ausubel等,1996)。
在某些实施方式中,用于校正突变的模板核酸可以设计以单链寡核苷酸使用。当使用单链寡核苷酸时,5’和3’同源臂的长度可以至多约200个碱基对(bp),例如,至少25、50、75、100、125、150、175或200bp。
Suzuki等描述了通过CRISPR/Cas9介导的同源性非依赖性靶向整合进行体内基因组编辑(2016,Nature 540:144–149)。
因此,当本文提到CRISPR系统时,在一些方面或实施方式中,CRISPR系统包括:(ⅰ)CRISPR蛋白或编码CRISPR效应蛋白的多核苷酸,和(ii)工程化以与CRISPR蛋白复合以形成CRISPR复合物并与靶序列复合的一种或多种多核苷酸。
在一些实施方式中,治疗剂是用于体内或离体递送(或应用或施用)至真核细胞。
在一些实施方式中,CRISPR蛋白是在靶序列的位置引导一条或两条链的切割的核酸酶,或其中CRISPR蛋白是在靶序列的位置引导切割的切口酶。
在一些实施方式中,CRISPR蛋白是与CRISPR-Cas系统RNA多核苷酸序列复合的Cpf1蛋白,其中所述多核苷酸序列包含:(a)能够与靶HBV序列杂交的指导RNA多核苷酸;和(b)直接重复RNA多核苷酸。
在一些实施方式中,CRISPR蛋白是Cpf1,并且该系统包括:I.CRISPR-Cas系统RNA多核苷酸序列,其中多核苷酸序列包含:(a)能够杂交至靶序列的指导RNA多核苷酸,和(b)直接重复RNA多核苷酸,和II.编码Cpf1的多核苷酸序列,任选地包含至少一个或多个核定位序列,其中所述直接重复序列与指导序列杂交并引导CRISPR复合物与靶序列序列特异性结合,并且其中CRISPR复合物包含与(1)与或可与靶序列杂交的指导序列和(2)直接重复序列复合的CRISPR蛋白,并且编码CRISPR蛋白的多核苷酸序列是DNA或RNA。
在一些实施方式中,CRISPR蛋白是来自氨基酸球菌物种BV3L6(AsCpf1)、毛螺菌科细菌ND2006(LbCpf1)或Moraxella bovoculi 237(MbCpf1)的Cpf1。
在一些实施方式中,CRISPR蛋白还包含一个或多个核定位序列(NLS),其能够驱动CRISPR蛋白在生物体的细胞的细胞核内积累至可检测的量。
在一些实施方式中,CRISPR蛋白包含一个或多个突变。
在一些实施方式中,CRISPR蛋白在催化结构域中具有一个或多个突变,且其中蛋白还包含功能结构域。
在一些实施方式中,CRISPR系统包含在递送系统内,任选地:
载体系统,其包括一种或多种载体,任选地其中所述载体包括一个或多个病毒载体,任选地其中所述一个或多个病毒载体包括一个或多个慢病毒、腺病毒或腺相关病毒(AAV)载体;或
颗粒或脂质颗粒,任选地其中CRISPR蛋白与多核苷酸复合以形成CRISPR复合物。
在一些实施方式中,系统、复合物或蛋白质是用于在通过操纵感兴趣的基因组基因座中的靶序列来修饰生物或非人生物的方法中使用。
在一些实施方式中,编码编码或提供CRISPR系统的序列的多核苷酸是通过脂质体、颗粒、细胞穿透肽、外泌体、微泡、或基因枪递送。在一些实施方式中,包括递送系统。在一些实施方式中,递送系统包括:载体系统,所述载体系统包括一种或多种载体,所述载体包含工程化的多核苷酸和编码CRISPR蛋白的多核苷酸,任选地其中所述载体包括一个或多个病毒载体,任选地其中所述一个或多个病毒载体包括含有CRISPR系统或CRISPR复合物的一个或多个慢病毒、腺病毒或腺相关病毒(AAV)载体;或颗粒或脂质颗粒。
在一些实施方式中,CRISPR蛋白在催化结构域中含有一个或多个突变,并且其中酶还包含功能结构域。
在一些实施方式中,提供了重组/修复模板。
Cpf1载体(10083)
通常,并且在整个说明书中,术语“载体”是指能够转运与其连接的另外的核酸的核酸分子。它是复制子,例如质粒、噬菌体或粘粒,可以向其中插入另外的DNA片段,以便引起插入片段的复制。通常,当与合适的控制元件相关联时,载体能够复制。
载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离末端、没有游离末端(例如,环状)的核酸分子;包含DNA、RNA或两者的核酸分子;和本领域已知的其他多核苷酸种类。一种类型的载体是“质粒”,质粒是指环状双链DNA环,其中可以例如通过标准的分子克隆技术,插入另外的DNA片段。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装成病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)的载体中。病毒载体还包含由病毒携带的用于转染到宿主细胞中的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起始子的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在导入宿主细胞后被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够引导可操作地连接至其的基因的表达。这样的载体在本文中称为“表达载体”。用于和导致在真核细胞中表达的载体在本文中可称为“真核表达载体”。在重组DNA技术中使用的常见表达载体通常是以质粒的形式。
重组表达载体可以包含适合在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包含一个或多个调控元件,其可以基于用于表达的宿主细胞进行选择,并且可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许核苷酸序列表达的方式与调控元件连接(例如,在体外转录/翻译系统中,或者当载体被导入宿主细胞时在宿主细胞中)。有利的载体包括慢病毒和腺相关病毒,并且还可以选择这样的载体的类型用于靶向特定类型的细胞。
关于重组和克隆方法,提及美国专利申请10/815730,其于2004年9月2日公开为US2004-0171156A1,其全部内容通过引用并入本文。
术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如,转录终止信号,例如,多腺苷酸化信号和聚U序列)。这样的调控元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,AcademicPress,San Diego,Calif.(1990)。调控元件包括在许多类型的宿主细胞中引导核苷酸序列组成型表达的那些和仅在某些宿主细胞中引导核苷酸序列表达的那些(例如,组织特异性调控序列)。组织特异性启动子可以主要在期望的感兴趣的组织,例如,肌肉、神经元、骨骼、皮肤、血液、特定器官(例如,肝脏,胰腺),或特定细胞类型(例如,淋巴细胞)中引导表达。调控元件还可以以时间依赖性方式引导表达,例如,以细胞周期依赖性或发育阶段依赖性的方式,其可以或可以不是组织或细胞类型特异性的。在一些实施方式中,载体包含一个或多个pol III启动子(例如,1、2、3,4、5或更多个pol III启动子),一个或多个pol II启动子(例如,1、2、3、4、5或更多个pol II启动子),一个或多个pol I启动子(例如,1、2、3、4、5或更多个pol I启动子),或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见,例如,Boshart等,Cell,41:521-530(1985)]、SV40启动子,二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。术语“调控元件”还包括增强子元件,例如WPRE;CMV增强子;HTLV-I的LTR中的R-U5’片段(Mol.Cell.Biol.,Vol.8(1),p.466-472,1988);SV40增强子;和兔β-珠蛋白的外显子2和3之间的内含子序列(Proc.Natl.Acad.Sci.USA.,Vol.78(3),p.1527-31,1981)。本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、期望的表达水平等因素。可将载体导入宿主细胞中从而产生由本文的核酸编码的转录物、蛋白质或肽,包括融合蛋白或肽(例如,规律成簇的间隔短回文重复序列(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。关于调控序列,提及美国专利申请10/491,026,其全部内容通过引用并入本文。关于启动子,提及PCT公开WO2011/028929和美国申请12/511,940,其全部内容通过引用并入本文。
有利的载体包括慢病毒和腺相关病毒,并且还可以选择这样的载体的类型用于靶向特定类型的细胞。
在特定实施方式中,使用双顺反子载体用于指导RNA和(任选地经修饰或突变的)CRISPR酶(例如Cas9)。用于指导RNA和(任选经修饰或突变的)CRISPR酶的双顺反子表达载体是优选的。通常并且特别是,在该实施方式中(任选地经修饰或突变的)CRISPR酶优选由CBh启动子驱动。RNA可以优选地由Pol III启动子驱动,例如U6启动子。理想地,这两者结合。
载体可以被设计用于在原核或真核细胞中表达CRISPR转录物(例如,核酸转录物、蛋白或酶)。例如,CRISPR转录物可以在细菌细胞(例如大肠杆菌)、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞中表达。合适的宿主细胞在Goeddel,GENEEXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步讨论。或者,重组表达载体可以体外转录和翻译,例如,使用T7启动子调控序列和T7聚合酶。
载体可以在原核生物或原核细胞中导入和繁殖。在一些实施方式中,原核生物用于扩增待导入真核细胞的载体的拷贝或作为在产生待导入真核细胞的载体的过程中的中间载体(例如,扩增作为病毒载体包装系统的一部分的质粒)。在一些实施方式中,原核生物用于扩增载体的拷贝并表达一种或多种核酸,例如提供一种或多种蛋白质的来源以递送至宿主细胞或宿主生物。蛋白质在原核生物中的表达通常在大肠杆菌中用含有组成型或诱导型启动子的载体进行,所述启动子引导融合蛋白或非融合蛋白的表达。融合载体添加许多氨基酸到在其中编码的蛋白质,例如重组蛋白的氨基末端。这样的融合载体可用于一个或多个目的,例如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解度;(iii)通过在亲和纯化中充当配体而协助纯化重组蛋白。通常,在融合表达载体中,在融合部分和重组蛋白的连接处引入蛋白水解切割位点,以使融合蛋白纯化后重组蛋白能够与融合部分分离。这样的酶及其关连(cognate)识别序列包括因子Xa、凝血酶和肠激酶。融合表达载体的实例包括pGEX(Pharmacia Biotech Inc;Smith and Johnson,1988.Gene 67:31-40)、pMAL(NewEngland Biolabs,Beverly,Mass.)和pRIT5(Pharmacia,Piscataway,N.J.),其分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A融合到靶重组蛋白。合适的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等,(1988)Gene 69:301-315)和pET11d(Studier等,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,SanDiego,Calif.(1990)60-89)。在一些实施方式中,载体是酵母表达载体。用于在酵母酿酒酵母(Saccharomyces cerivisae)中表达的载体的实例包括pYepSec1(Baldari,等,1987.EMBO J.6:229-234)、pMFa(Kuijan and Herskowitz,1982.Cell 30:933-943)、pJRY88(Schultz等,1987.Gene 54:113-123)、pYES2(InvitrogenCorporation,SanDiego,CA)和picZ(Invitrogen Corporation,San Diego,Calif.)。在一些实施方式中,载体使用杆状病毒表达载体在昆虫细胞中驱动蛋白质表达。可用于在培养的昆虫细胞(例如,SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith,等,1983.Mol.Cell.Biol.3:2156-2165)和pVL系列(Lucklow and Summers,1989.Virology 170:31-39)。
在一些实施方式中,载体能够使用哺乳动物表达载体在哺乳动物细胞中驱动一种或多种序列的表达。哺乳动物表达载体的实例包括pCDM8(Seed,1987.Nature 329:840)和pMT2PC(Kaufman,等,1987.EMBO J.6:187-195)。当在哺乳动物细胞中使用时,表达载体的控制功能通常由一种或多种调控元件提供。例如,常用的启动子衍生自多瘤病毒、腺病毒2、巨细胞病毒、猿猴病毒40,以及本文公开的和本领域已知的其它启动子。对于原核细胞和真核细胞两者合适的其他表达系统参见,例如,Chapters 16and 17of Sambrook,等,MOLECULAR CLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989。
在一些实施方式中,重组哺乳动物表达载体能够在特定细胞类型中优先引导核酸的表达(例如,使用组织特异性调控元件以表达核酸)。组织特异性调控元件是本领域已知的。合适的组织特异性启动子的非限制性实例包括白蛋白启动子(肝脏特异性;Pinkert,等,1987.Genes Dev.1:268-277)、淋巴样特异性启动子(Calame and Eaton,1988.Adv.Immunol.43:235-275)、特别是T细胞受体启动子(Winoto and Baltimore,1989.EMBO J.8:729-733)和免疫球蛋白(Baneiji,等,1983.Cell 33:729-740;Queen andBaltimore,1983.Cell 33:741-748)、神经元特异性启动子(例如,神经丝启动子;Byrneand Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477)、胰腺特异性启动子(Edlund,等,1985.Science 230:912-916),和乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。也包括发育调节启动子,例如,鼠hox启动子(Kesseland Gruss,1990.Science 249:374-379)和甲胎蛋白启动子(Campes and Tilghman,1989.Genes Dev.3:537-546)。关于这些原核和真核载体,提及美国专利6,750,059,其全部内容通过引用并入本文。本发明的其他实施方式可以涉及使用病毒载体,其中提及美国专利申请13/092,085,其全部内容通过引用并入本文。组织特异性调控元件是本领域已知的,并且对此提及美国专利7,776,321,其全部内容通过引用并入本文。在一些实施方式中,调控元件可操作地连接至CRISPR系统的一个或多个元件,以驱动CRISPR系统的一个或多个元件的表达。
在一些实施方式中,驱动核酸靶向系统的一个或多个元件的表达的一种或多种载体被导入宿主细胞中,使得核酸靶向系统的元件的表达引导核酸靶向复合物在一个或多个靶位点形成。例如,核酸靶向效应酶和核酸靶向指导RNA可各自可操作地连接至单独载体上的单独调控元件。可以将核酸靶向系统的RNA递送至转基因核酸靶向效应蛋白动物或哺乳动物,例如,组成型或诱导型或条件型表达核酸靶向效应蛋白的动物或哺乳动物;或以其他方式表达核酸靶向效应蛋白或具有含有核酸靶向效应蛋白的细胞的动物或哺乳动物,例如通过事先向其施用编码和表达体内核酸靶向效应蛋白的一种或多种载体。或者,可以将由相同或不同调控元件表达的元件中的两个或更多个组合在单一载体中,且一个或多个另外的载体提供不包括在第一载体中的核酸靶向系统的任何组分。在单个载体中组合的核酸靶向系统元件可以以任何合适的方向排列,例如,一个元件位于相对于第二元件的5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同或相反的链上,并且以相同或相反的方向取向。在一些实施方式中,单个启动子驱动编码核酸靶向效应蛋白的转录物和嵌入至一个或多个内含子序列内的核酸靶向指导RNA(例如,各自在不同的内含子中,两个或更多个在至少一个内含子中,或全部在单个内含子中)的表达。在一些实施方式中,核酸靶向效应蛋白和核酸靶向指导RNA可操作地连接至同一启动子并由其表达。用于表达核酸靶向系统的一个或多个元件的递送载体(vehicles)、载体(vectors)、颗粒、纳米颗粒、制剂及其组合如前述文献中所用,例如WO2014/093622(PCT/US2013/074667)。在一些实施方式中,载体包含一个或多个插入位点,例如限制性内切核酸酶识别序列(也称为“克隆位点”)。在一些实施方式中,一个或多个插入位点(例如,约或多于约1、2、3、4、5、6、7、8、9、10或更多个插入位点)位于一种或多种载体的一个或多个序列元件的上游和/或下游。当使用多种不同的指导序列时,单个表达构建体可用于将核酸靶向活性靶向至细胞内的多个不同的相应靶序列。例如,单个载体可包含约或多于约1、2、3、4、5、6、7、8、9、10、15、20种或更多种指导序列。在一些实施方式中,可以提供约或多于约1、2、3、4、5、6、7、8、9、10种或更多种的这样的含有指导序列的载体,并任选地将其递送至细胞。在一些实施方式中,载体包含可操作地连接至编码核酸靶向效应蛋白的酶编码序列的调控元件。核酸靶向效应蛋白或核酸靶向指导RNA或RNA可以单独递送;并且有利地,这些中的至少一种通过颗粒复合物递送。可以在核酸靶向指导RNA之前递送核酸靶向效应蛋白mRNA,以给予表达核酸靶向效应蛋白的时间。可以在施用核酸靶向指导RNA 1-12小时(优选约2-6小时)之前施用核酸靶向效应蛋白mRNA。或者,可以一起施用核酸靶向效应蛋白mRNA和核酸靶向指导RNA。有利地,第二加强剂量的指导RNA可以在初始施用核酸靶向效应蛋白mRNA+指导RNA 1-12小时(优选约2-6小时)之后施用。核酸靶向效应蛋白mRNA和/或指导RNA的额外施用可用于实现最有效水平的基因组修饰。
在一些实施方式中,载体编码Cpf1效应蛋白,所述Cpf1效应蛋白包含一个或多个核定位序列(NLS),例如约或多于约1、2、3、4、5、6、7、8、9,10个或更多个NLS。更特别是,载体包含一个或多个天然不存在于Cpf1效应蛋白中的NLS。最特别是,NLS在载体中位于Cpf1效应蛋白序列的5’和/或3’。在一些实施方式中,RNA靶向效应蛋白包含约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS位于氨基末端或其附近,约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS位于羧基末端或其附近,或这些的组合(例如,0或至少一个或多个NLS位于氨基末端并且0或至少一个或多个NLS位于羧基末端)。当存在多于一个NLS时,可以独立于其他选择每个NLS,使得单一NLS可以以多于一个拷贝存在和/或以一个或多个拷贝与存在的一个或多个其他NLS组合存在。在一些实施方式中,当NLS的最近的氨基酸是在离N-端或C-端沿着多肽链约1、2、3、4、5、10、15、20、25、30、40、50个或更多个氨基酸的范围内时,认为NLS在N-或C-末端附近。NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T抗原的NLS,具有氨基酸序列PKKKRKV(SEQ ID NO:2);来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK(SEQ ID NO:3)的核质蛋白二分体NLS);具有氨基酸序列PAAKRVKLD(SEQID NO:4)或RQRRNELKRSP(SEQ ID NO:5)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:6)的hRNPA1 M9 NLS;来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:7);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:8)和PPKKARED(SEQ ID NO:9);人p53的序列PQPKKKPL(SEQ ID NO:10);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:11);流感病毒NS1的序列DRLRR(SEQID NO:12)和PKQKKRK(SEQ ID NO:13);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:14);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:15);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:16);和类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:17)。通常,一个或多个NLS具有足够的强度以驱动DNA/RNA靶向Cas蛋白在真核细胞的细胞核中以可检测量累积。通常,核定位活性的强度可以源自核酸靶向效应蛋白中的NLS数量、所使用的特定NLS或这些因素的组合。可以通过任何合适的技术检测细胞核中的累积。例如,可检测的标志物可以与核酸靶向蛋白融合,使得细胞内的位置可以被可视化,例如与用于检测细胞核位置的手段组合(例如,细胞核特异性的染色,例如DAPI)。也可以从细胞中分离细胞核,然后可以通过任何合适的检测蛋白质的方法分析其内容物,例如免疫组织化学、蛋白质印迹或酶活性测定。也可以间接确定细胞核中的累积,例如通过与未暴露于核酸靶向Cas蛋白或核酸靶向复合物或暴露于缺乏一个或多个NLS的核酸靶向Cas蛋白的对照相比,测定核酸靶向复合物形成的效果(例如,测定在靶序列处的DNA或RNA切割或突变,或测定受DNA或RNA靶向复合物形成和/或DNA或RNA靶向Cas蛋白活性影响的改变的基因表达活性)。在本文所述的Cpf1效应蛋白复合物和系统的优选实施方式中,密码子优化的Cpf1效应蛋白包含附着于蛋白的C末端的NLS。在某些实施方式中,其他定位标签可以与Cas蛋白融合,例如但不限于用于将Cas定位于细胞中的特定位点,例如,细胞器,例如,线粒体、质体、叶绿体、泡囊、高尔基体、(细胞核或细胞)膜、核糖体、核仁、ER、细胞骨架、液泡、中心体、核小体、颗粒、中心粒等。
本发明还提供一种非天然存在的或工程化的组合物,或编码所述组合物的组分的一种或多种多核苷酸,或包括用于治疗性处理方法的编码所述组合物的组分的一种或多种多核苷酸的载体系统。治疗性处理方法可包括基因或基因组编辑,或基因治疗。
本文所述的核酸靶向系统、载体系统、载体和组合物可用于各种核酸靶向应用,改变或修饰基因产物的合成,例如蛋白质、核酸切割、核酸编辑、核酸剪接;靶核酸的运输,靶核酸的追踪,靶核酸的分离,靶核酸的可视化等。
通常,并且在整个说明书中,术语“载体”是指能够转运与其连接的另一种核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离末端,没有游离末端(例如,环状)的核酸分子;包括DNA、RNA或两者的核酸分子;和本领域已知的其他多核苷酸种类。一种类型的载体是“质粒”,所述质粒是指环状双链DNA环,其中可以例如通过标准的分子克隆技术,插入另外的DNA片段。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装成病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)的载体中。病毒载体还包含由病毒携带的用于转染到宿主细胞中的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起始子的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在导入宿主细胞后被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够引导可操作地连接至其的基因的表达。这样的载体在本文中称为“表达载体”。用于和导致在真核细胞中表达的载体在本文中可称为“真核表达载体”。在重组DNA技术中使用的常见表达载体通常是以质粒的形式。
在某些实施方式中,载体系统包含反向顺序的启动子-指导表达盒。
重组表达载体可以包含适合在宿主细胞中表达核酸的形式的本发明的核酸,这意味着所述重组表达载体包含一个或多个调控元件,所述调控元件可以基于用于表达的宿主细胞进行选择,并且可操作地连接至待表达的核酸序列。
有利的载体包括慢病毒和腺相关病毒,并且还可以选择这样的载体的类型用于靶向特定类型的细胞。
在一些实施方式中,驱动核酸靶向系统的一个或多个元件的表达的一种或多种载体被导入宿主细胞中,使得核酸靶向系统的元件的表达引导核酸靶向复合物在一个或多个靶位点形成。例如,核酸靶向效应酶和核酸靶向指导RNA可各自可操作地连接至单独载体上的单独调控元件。可以将核酸靶向系统的RNA递送至转基因核酸靶向效应蛋白动物或哺乳动物,例如,组成型或诱导型或条件型表达核酸靶向效应蛋白的动物或哺乳动物;或以其他方式表达核酸靶向效应蛋白或具有含有核酸靶向效应蛋白的细胞的动物或哺乳动物,例如通过事先向其施用编码和表达体内核酸靶向效应蛋白的一种或多种载体。或者,可以将由相同或不同调控元件表达的元件中的两个或更多个组合在单一载体中,且一个或多个另外的载体提供不包括在第一载体中的核酸靶向系统的任何组分。在单个载体中组合的核酸靶向系统元件可以以任何合适的方向排列,例如,一个元件位于相对于第二元件的5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同或相反的链上,并且以相同或相反的方向取向。在一些实施方式中,单个启动子驱动编码核酸靶向效应蛋白的转录物和嵌入至一个或多个内含子序列内的核酸靶向指导RNA(例如,各自在不同的内含子中,两个或更多个在至少一个内含子中,或全部在单个内含子中)的表达。在一些实施方式中,核酸靶向效应蛋白和核酸靶向指导RNA可操作地连接至同一启动子并由其表达。
在一个方面,本发明提供了包括一种或多种载体的载体系统,其中所述一种或多种载体包含:a)可操作地连接至编码如本文所限定的工程化CRISPR蛋白的核苷酸序列的第一调控元件;和任选地b)可操作地连接至编码一种或多种核酸分子的一种或多种核苷酸序列的第二调控元件,所述核酸分子包含含有指导序列、直接重复序列的指导RNA,任选地其中组分(a)和(b)位于相同或不同的载体。
本发明还提供了工程化的、非天然存在的规律成簇的间隔短回文重复序列(CRISPR)-CRISPR相关(Cas效应模块)(CRISPR-Cas效应模块)载体系统,其包括一种或多种载体,所述载体包含:a)可操作地连接至编码本文任一发明构建体的非天然存在的CRISPR酶的核苷酸序列的第一调控元件;b)可操作地连接至编码一种或多种指导RNA的一种或多种核苷酸序列的第二调控元件,所述指导RNA包含指导序列、直接重复序列,其中组分(a)和(b)位于相同或不同的载体,形成CRISPR复合物;指导RNA靶向靶多核苷酸基因座,并且酶改变多核苷酸基因座,并且CRISPR复合物中的酶具有与未修饰的酶相比降低的修饰一个或多个脱靶基因座的能力和/或CRISPR复合物中的酶具有与未修饰的酶相比增加的修饰一个或多个靶基因座的能力。
如本文所用,CRISPR Cas效应模块或CRISRP效应模块包括但不限于Cas9、Cpf1、C2c2、组13b和C2c1。在一些实施方式中,可以工程化CRISPR-Cas效应模块。
在这样的系统中,组分(II)可包含可操作地连接至包含指导序列、直接重复序列的多核苷酸序列的第一调控元件,并且其中组分(II)可包含可操作地连接至编码CRISPR酶的多核苷酸序列第二调控元件。在这样的系统中,在适用的情况下,指导RNA可以包含嵌合RNA。
在这样的系统中,组分(I)可包含可操作地连接至指导序列和直接重复序列的第一调控元件,并且其中成分(II)可包含可操作地连接至编码CRISPR酶的多核苷酸序列的第二调控元件。这样的系统可以包含一种以上的指导RNA,并且每种指导RNA具有不同的靶标,由此存在多重。组分(a)和(b)可以在相同的载体上。
在包括载体的任何这样的系统中,一种或多种载体可包括一种或多种病毒载体,例如一种或多种逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒。
在包括调控元件的任何这样的系统中,所述调控元件中的至少一种可包括组织特异性启动子。组织特异性启动子可以指导哺乳动物血细胞、哺乳动物肝细胞或哺乳动物眼中的表达。
在任何上述组合物或系统的直接重复序列可包括一种或多种蛋白质相互作用的RNA适体。一种或多种适体可位于四环中。一种或多种适体可以能够结合MS2噬菌体外壳蛋白。
在任何上述组合物或系统中,细胞可以是真核细胞或原核细胞;其中CRISPR复合物可在细胞中起作用,并且由此CRISPR复合物的酶具有与未修饰的酶相比降低的修饰细胞的一个或多个脱靶基因座的能力和/或由此CRISPR复合物中的酶具有与未修饰的酶相比增加的修饰一个或多个靶基因座的能力。
本发明还提供了任何上述组合物的CRISPR复合物或来自任何上述系统的CRISPR复合物。
本发明还提供了在细胞中修饰感兴趣的基因座的方法,其包括使细胞与任何本文所述的工程化CRISPR酶(例如工程化Cas效应模块)、组合物或任何本文所述的系统或载体系统,或其中细胞包含在细胞内存在的任何本文所述的CRISPR复合物。在这些方法中,细胞可以是原核或真核细胞,优选真核细胞。在这样的方法中,生物可包括细胞。在这些方法中,生物可以不是人或其他动物。
在某些实施方式中,本发明还提供了一种非天然存在的、工程化的组合物(例如,工程化Cas9、Cpf1、C2c2、C2c1,组29/30,13B,或任何可装配到AAV载体的Cas蛋白)。参考US8,697,359中的图19A、19B、19C、19D和20A-F,其通过引用并入本文以提供也可以使用的其他蛋白质的列表和指导。
任何这样的方法可以是离体或体外进行。
在某些实施方式中,编码所述指导RNA或Cpf1效应模块中的至少一种的核苷酸序列在细胞中与包含感兴趣的基因的启动子的调控元件可操作地连接,由此至少一种CRISPR-Cas效应模块系统组分表达由感兴趣的基因的启动子驱动。“可操作地连接”意指编码指导RNA和/或Cas效应模块的核苷酸序列以允许表达核苷酸序列的方式与调控元件连接,如本文其他地方所述。术语“调控元件”在本文其他地方也有描述。根据本发明,调控元件包含感兴趣的基因的启动子,例如优选感兴趣的内源基因的启动子。在某些实施方式中,启动子处于其内源基因组位置。在这样的实施方式中,编码CRISPR和/或Cas效应模块的核酸在其天然基因组位置处受感兴趣的基因的启动子的转录控制。在某些其他实施方式中,启动子在(分开的)核酸分子上提供,例如载体或质粒,或其他染色体外核酸,即在其天然基因组位置不提供启动子。在某些实施方式中,启动子在基因组上整合到非天然基因组位置。
本发明还提供在哺乳动物中改变感兴趣的基因组基因座的表达的方法,其包括使细胞与本文所述的工程化的CRISPR酶(例如工程化Cas效应模块)、组合物、系统或CRISPR复合物接触,由此递送CRISPR-Cas效应模块(载体)并允许CRISPR-Cas效应模块复合物形成并结合靶标,以及确定基因组基因座的表达是否已被改变,例如表达增加或减少,或修饰基因产物。
本发明进一步提供了对Cas效应模块或是如本文所述根据本发明的CRISPR酶的直系同源物的突变或修饰的Cas效应模块进行突变的方法,其包括确定该直系同源物中可以邻近或可以接触核酸分子(例如DNA、RNA、gRNA等)的氨基酸,和/或与如本文所述根据本发明的CRISPR酶中在本文被鉴定的氨基酸类似或对应的氨基酸用于修饰和/或突变,并且合成或制备或表达直系同源物包括以下,由以下组成或基本上由以下组成:如本文所讨论的修饰和/或突变或突变,例如修饰(例如改变或突变)中性氨基酸为带电荷的氨基酸,例如带正电荷的氨基酸,例如丙氨酸。如此修饰的直系同源物可用于CRISPR-Cas效应模块系统;并且表达它的核酸分子可以用于递送分子或编码如本文所讨论的CRISPR-Cas效应模块系统组分的载体系统。
在一个方面,本发明提供包括本文所述的组分中的一种或多种的试剂盒。在一些实施方式中,所述试剂盒包括载体系统和使用该试剂盒的说明书。在一些实施方式中,载体系统包括(a)可操作地连接至直接重复序列和用于在DR序列下游插入一种或多种指导序列的一个或多个插入位点的第一调控元件,其中当表达时,指导序列指导CRISPR-Cas效应模块复合物与真核细胞中的靶序列序列特异性结合,其中CRISPR-Cas效应模块复合物包含与(1)与靶序列杂交的指导序列,和(2)DR序列复合的Cas效应模块;和/或(b)与编码包含核定位序列的所述Cas效应模块(并且有利地,这包括分裂的Cas效应模块)的酶编码序列可操作地连接的第二调控元件。在一些实施方式中,所述试剂盒包括位于系统的相同或不同载体上的组分(a)和(b)。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,其中当表达时,两种或更多种指导序列各自指导CRISPR-Cas效应模块复合物与真核细胞中的不同靶序列序列特异性结合。
在一个方面,本发明提供了在真核细胞中修饰靶多核苷酸的方法。在一些实施方式中,所述方法包括允许CRISPR-Cas效应模块复合物结合靶多核苷酸以实现所述靶多核苷酸的切割,从而修饰靶多核苷酸,其中CRISPR-Cas效应模块复合物包含与与所述靶多核苷酸内的靶序列杂交的指导序列复合的Cas效应模块,其中所述指导序列与直接重复序列连接。在一些实施方式中,所述切割包括通过所述Cas效应模块而在靶序列的位置切割一条或两条链;这包括分裂的Cas效应模块。在一些实施方式中,所述切割导致靶基因的转录减少。在一些实施方式中,所述方法还包括通过与外源模板多核苷酸同源重组而修复所述切割的靶多核苷酸,其中所述修复产生包含所述靶多核苷酸的一个或多个核苷酸的插入、缺失或置换的突变。在一些实施方式中,所述突变导致从包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。在一些实施方式中,所述方法还包括向所述真核细胞递送一种或多种载体,其中所述一种或多种载体驱动以下一种或多种的表达:Cas效应模块和连接到DR序列的指导序列。在一些实施方式中,将所述载体递送至受试者的真核细胞。在一些实施方式中,所述修饰在细胞培养的所述真核细胞中发生。在一些实施方式中,所述方法还包括在所述修饰之前从受试者分离所述真核细胞。在一些实施方式中,所述方法还包括将所述真核细胞和/或由其衍生的细胞返回给所述受试者。
在一个方面,本发明提供了在真核细胞中修饰多核苷酸表达的方法。在一些实施方式中,所述方法包括允许CRISPR-Cas效应模块复合物与多核苷酸结合,使得所述结合导致所述多核苷酸的表达增加或减少;其中CRISPR-Cas效应模块复合物包含与与所述多核苷酸内的靶序列杂交的指导序列复合的Cas效应模块;其中所述指导序列与直接重复序列连接;其可包括分裂的Cas效应模块。在一些实施方式中,所述方法还包括向所述真核细胞递送一种或多种载体,其中所述一种或多种载体驱动以下一种或多种的表达:Cas效应模块和连接到DR序列的指导序列。
在一个方面,本发明提供了产生包含突变的疾病基因的模型真核细胞的方法。在一些实施方式中,疾病基因是与患有或发展疾病的风险增加相关的任何基因。在一些实施方式中,所述方法包括(a)将一种或多种载体导入真核细胞,其中所述一种或多种载体驱动以下一种或多种的表达:Cas效应模块和与直接重复序列连接的指导序列;(b)允许CRISPR-Cas效应模块复合物与靶多核苷酸结合以实现所述疾病基因内靶多核苷酸的切割,其中CRISPR-Cas效应模块复合物包含与(1)与靶多核苷酸内的靶序列杂交的指导序列,和(2)DR序列复合的Cas效应模块,从而产生包含突变的疾病基因的模型真核细胞;这包括分裂的Cas效应模块。在一些实施方式中,所述切割包括通过所述Cas效应模块而在靶序列的位置切割一条或两条链。在一种优选的实施方式中,链断裂是具有5’突出端的交错切口。在一些实施方式中,所述切割导致靶基因的转录减少。在一些实施方式中,所述方法还包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复产生包含所述靶多核苷酸的一个或多个核苷酸的插入、缺失或置换的突变。在一些实施方式中,所述突变导致从包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。
在一个方面,本发明提供了在一种或多种细胞中的基因中通过导入一个或多个突变来选择一种或多种细胞的方法,所述方法包括:将一种或多种载体导入细胞中,其中所述一种或多种载体驱动以下一种或多种的表达:Cas效应模块,连接到直接重复序列的指导序列,和编辑模板;其中编辑模板包含一个或多个消除Cas效应模块切割的突变;允许编辑模板与待选择的细胞中的靶多核苷酸同源重组;允许CRISPR-Cas效应模块复合物与靶多核苷酸结合以实现所述基因内靶多核苷酸的切割,其中CRISPR-Cas效应模块复合物包含与(1)与靶多核苷酸内的靶序列杂交的指导序列和(2)直接重复序列复合的Cas效应模块,其中Cas效应模块CRISPR-Cas效应模块复合物与靶多核苷酸结合诱导细胞死亡,从而允许选择其中导入了一个或多个突变的一种或多种细胞;这包括分裂的Cas效应模块。在本发明的另一种优选实施方式中,待选择的细胞可以是真核细胞。本发明的方面允许选择特定细胞而无需选择标志物或可包括反选择系统的两步方法。
还提供了用于如本文其他地方所限定的治疗方法的包含Cas效应模块的组合物、包含多种指导RNA的复合物或系统,优选串联排列,或编码或包含所述Cas效应模块的多核苷酸或载体、包含多种指导RNA的复合物或系统,优选串联排列。可以提供包括这样的组合物的组件的试剂盒。还提供了所述组合物在制备用于这样的治疗方法的药物中的用途。本发明还提供了Cas效应模块CRISPR系统在筛选中的用途,例如功能获得筛选。人工迫使过表达基因的细胞能够随时间下调基因(重建平衡),例如通过负反馈环。在筛选开始时,未调节的基因可能会再次减少。使用诱导型Cas效应模块激活剂允许刚好在筛选之前诱导转录,因此最小化假阴性命中的可能性。因此,通过在筛选中使用本发明,例如功能获得筛选,可以最小化假阴性结果的可能性。
在另一个方面,本发明提供了一种工程化的非天然存在的载体系统,其包括一种或多种载体,所述载体包含可操作地连接至多种Cas效应模块CRISPR系统指导RNA的第一调控元件,每种指导RNA特异性靶向编码基因产物的DNA分子,和可操作地连接至CRISPR蛋白的编码的第二个调控元件。两个调控元件可以位于系统的相同载体或不同载体上。多种指导RNA在细胞中靶向编码多种基因产物的多种DNA分子,并且CRISPR蛋白可以切割编码基因产物的多种DNA分子(它可以切割一条或两条链或基本上没有核酸酶活性),由此多种基因产物的表达被改变;并且,其中CRISPR蛋白和多种指导RNA不是天然一起发生的。在优选的实施方式中,CRISPR蛋白是Cas效应模块,任选地经密码子优化以在真核细胞中表达。在优选的实施方式中,真核细胞是哺乳动物细胞、植物细胞或酵母细胞,在更优选的实施方式中,哺乳动物细胞是人细胞。在本发明的另一个实施方式中,多种基因产物各自的表达被改变,优选降低。
在一个方面,本发明提供了包括一种或多种载体的载体系统。在一些实施方式中,所述系统包括:(a)可操作地连接至直接重复序列和用于在直接重复序列的上游或下游(无论哪种适用)插入一种或多种指导序列的一个或多个插入位点的第一调控元件,其中当表达时,一种或多种指导序列指导CRISPR复合物与真核细胞中的一个或多个靶序列序列特异性结合,其中CRISPR复合物包含与与一个或多个靶序列杂交的一种或多种指导序列复合的Cas效应模块;和(b)可操作地连接至编码所述Cas效应模块(优选包含至少一个核定位序列和/或至少一个NES)的酶编码序列的第二调控元件;其中组分(a)和(b)位于系统的相同或不同载体上。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,其中当表达时,两种或更多种指导序列各自指导CRISPR复合物与真核细胞中的不同靶序列序列特异性结合。在一些实施方式中,CRISPR复合物包含具有足够强度以驱动所述CRISPR复合物以可检测量在真核细胞的细胞核内或细胞核外积累的一个或多个核定位序列和/或一个或多个NES。在一些实施方式中,第一调控元件是聚合酶III启动子。在一些实施方式中,第二调控元件是聚合酶II启动子。在一些实施方式中,每种指导序列的长度是至少16、17、18、19、20、25个核苷酸或在16-30之间,或16-25之间,或16-20个核苷酸之间。
重组表达载体可以包含以适合于在宿主细胞中表达核酸的形式编码如本文所限定的用于多重靶向的Cas效应模块、系统或复合物,这意味着重组表达载体包含可操作地连接至待表达的核酸序列的一个或多个调控元件,其可以基于待用于表达的宿主细胞进行选择。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许核苷酸序列表达的方式与调控元件连接(例如,在体外转录/翻译系统中或当载体被导入宿主细胞时的宿主细胞中)。
在一些实施方式中,用包含编码如本文所限定的用于多重靶向的Cas效应模块、系统或复合物的多核苷酸的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方式中,细胞在其天然存在于受试者中时被转染。在一些实施方式中,转染的细胞取自受试者。在一些实施方式中,细胞衍生自取自受试者的细胞,例如细胞系。用于组织培养的多种细胞系是本领域已知的,并且在本文其他地方举例说明。细胞系可从本领域技术人员已知的多种来源获得(参见,例如,美国典型培养物保藏中心(ATCC)(Manassus,VA))。在一些实施方式中,用包含编码用于如本文所限定的多重靶向的Cas效应模块、系统或复合物的多核苷酸的一种或多种载体转染的细胞用于建立包含一种或多种载体衍生序列的新细胞系。在一些实施方式中,用如本文所限定的用于多重靶向的Cas效应模块、系统或复合物的组分瞬时转染(例如通过瞬时转染一种或多种载体,或用RNA转染)并通过Cas效应模块、系统或复合物的活性进行修饰的细胞用于建立包含含有修饰但缺乏任何其他外源序列的细胞的新细胞系。在一些实施方式中,用包含编码如本文所限定的用于多重靶向的Cas效应模块、系统或复合物的多核苷酸的一种或多种载体瞬时或非瞬时转染的细胞,或衍生自这样的细胞的细胞系,用于评估一种或多种测试化合物。
术语“调控元件”是如本文其他地方所定义。
有利的载体包括慢病毒和腺相关病毒,也可以选择这样的载体的类型用于靶向特定类型的细胞。
在一个方面,本发明提供了包含(a)可操作地连接至直接重复序列和用于在直接重复序列的上游或下游(无论哪种适用)插入一种或多种指导序列的一个或多个插入位点的第一调控元件,其中当表达时,一种或多种指导序列指导CRISPR复合物与真核细胞中分别的一个或多个靶序列序列特异性结合,其中CRISPR复合物包含与与分别的一个或多个靶序列杂交的一种或多种指导序列复合的Cas效应模块;和/或(b)可操作地连接至编码所述Cas效应模块(优选包含至少一个核定位序列和/或至少一个NES)的酶编码序列的第二调控元件。在一些实施方式中,宿主细胞包含组分(a)和(b)。在一些实施方式中,组分(a)、组分(b)或组分(a)和(b)稳定整合到宿主真核细胞的基因组中。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,并且任选地由直接重复序列分开,其中当表达时,两种或更多种指导序列各自指导CRISPR复合物与真核细胞中的不同靶序列序列特异性结合。在一些实施方式中,Cas效应模块包含具有足够的强度以驱动所述CRISPR酶以可检测的量在真核细胞的细胞核中和/或细胞核外积累的一个或多个核定位序列和/或核输出序列或NES。
本发明的多个方面涉及包括一种或多种载体的载体系统,或载体本身。载体可以设计用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物,蛋白质或酶)。例如,CRISPR转录物可以在细菌细胞中表达,例如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞。合适的宿主细胞在Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步讨论。或者,重组表达载体可以在体外转录和翻译,例如使用T7启动子调节序列和T7聚合酶。
在某些方面,本发明涉及载体。
重组表达载体可以包括适于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包含可操作地连接至待表达的核酸序列的一个或多个调控元件,其可以基于待用于表达的宿主细胞进行选择。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许核苷酸序列表达的方式与调控元件连接(例如,在体外转录/翻译系统中或当载体被导入宿主细胞时的宿主细胞中)。关于重组和克隆方法,提及美国专利申请10/815,730,2004年9月2日公布为US2004-0171156A1,其内容通过引用整体并入本文。
载体可包含调控元件,例如启动子。载体可以包含Cas编码序列,和/或单个,但可能也可包含至少3或8或16或32或48或50个指导RNA(例如,sgRNA)编码序列,例如1-2、1-3、1-4-5、3-6、3-7、3-8、3-9、3-10、3-8、3-16、3-30、3-32,3-48、3-50个RNA(例如,sgRNA)。在单个载体中,对于每个RNA(例如,sgRNA)可以存在启动子,有利地,当存在至多约16个RNA(例如,sgRNA)时;并且,当单个载体提供超过16个RNA(例如,sgRNA)时,一个或多个启动子可以驱动多于一个RNA(例如,sgRNA)的表达,例如,当有32个RNA(例如,sgRNA)时,每个启动子可以驱动两个RNA(例如,sgRNA)的表达,并且当存在48个RNA(例如,sgRNA)时,每个启动子可以驱动三个RNA(例如,sgRNA)的表达。通过简单的算术和完善的克隆方案以及本公开内容中的教导,本领域技术人员可以容易地实施关于RNA的本发明(例如,用于合适的示例性载体(例如AAV)的sgRNA,以及合适的例如,U6启动子,例如U6-sgRNAs。例如,AAV的包装限度为~4.7kb。单个U6-sgRNA的长度(加上用于克隆的限制性位点)为361bp。因此,技术人员可以在单个载体中容易地装入大约12-16个,例如13个U6-sgRNA盒。这可以通过任何合适的方法组装,例如用于TALE组装的金门策略(www.genome-engineering.org/taleffectors/)。技术人员也可以使用串联指导策略将U6-sgRNA的数量增加约1.5倍,例如,从12-16,例如13,增加到约18-24,例如,约19个U6-sgRNA。因此,本领域技术人员可以容易地在单个载体中达到约18-24个,例如约19个启动子-RNA,例如U6-sgRNA,例如AAV载体。用于增加启动子和RNA(例如载体中的sgRNA)的数量的另一种方法是使用单个启动子(例如,U6)来表达RNA阵列,例如由可切割序列分开的sgRNA。并且用于增加启动子-RNA(例如载体中的sgRNA)的数量的更进一步的方法是表达启动子-RNA阵列,例如由编码序列或基因的内含子中的可切割序列分隔的sgRNA;在这种情况下,使用聚合酶II启动子是有利的,所述聚合酶II启动子可以具有增加的表达并且能够以组织特异性方式转录长RNA。(参见例如,nar.oxfordjournals.org/content/34/7/e53.short,www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一个有利的实施方式中,AAV可以包装靶向至多约50个基因的U6串联sgRNA。因此,根据本领域的知识和本公开内容的教导,技术人员可以容易地制造和使用载体,例如表达在一种或多种启动子的控制下或可操作或功能性地连接的多种RNA或指导或sgRNA的单个载体,特别是关于本文讨论的RNA或指导或sgRNA的数量,而无需任何过度的实验。
编码序列和/或CAS编码序列的一个或多个指导RNA,例如一个或多个sgRNA(一个或多个)可以功能性地或可操作地连接到一个或多个调控元件,因此所述一个或多个调控元件驱动表达。启动子可以是组成型启动子和/或条件性启动子和/或诱导型启动子和/或组织特异性启动子。启动子可选自RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录病毒Rous肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。有利的启动子是启动子是U6。
本发明的方面涉及用于指导RNA和(任选地修饰或突变)的Cas效应模块的双顺反子载体。用于指导RNA和(任选修饰或突变的)CRISPR酶的双顺反子表达载体是优选的。通常并且特别是在该实施方式中,(任选地修饰或突变的)CRISPR酶优选由CBh启动子驱动。RNA可以优选地由Pol III启动子驱动,例如U6启动子。理想地,这两者结合。
在一些实施方式中,提供了指导RNA中的环。这可以是茎环或四元环。环优选为GAAA,但不限于该序列或实际上是长度仅4bp。实际上,用于发夹结构的优选的环形成序列的长度为4个核苷酸,最优选具有序列GAAA。然而,可以使用更长的或更短的环序列,作为可替代的序列。序列优选包括核苷酸三联体(例如,AAA)和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。
术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如转录终止信号,例如多腺苷酸化信号和聚-U序列)。
载体可以设计用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白或酶)。例如,CRISPR转录物可以在细菌细胞中表达,例如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞。合适的宿主细胞在Goeddel,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步讨论。或者,重组表达载体可以在体外转录和翻译,例如使用T7启动子调控序列和T7聚合酶。
载体可以在原核生物或原核细胞中导入和繁殖。在一些实施方式中,原核生物用于扩增待导入真核细胞的载体的拷贝或作为待导入真核细胞的载体的产生中的中间载体(例如,扩增作为病毒载体包装系统的一部分的质粒)。在一些实施方式中,原核生物用于扩增载体的拷贝并表达一种或多种核酸,例如提供一种或多种蛋白质的来源,以递送至宿主细胞或宿主生物。蛋白质在原核生物中的表达通常在大肠杆菌中用含有指导融合蛋白或非融合蛋白的表达的组成型或诱导型启动子的载体进行。融合载体在其中编码的蛋白质中添加许多氨基酸,例如重组蛋白的氨基末端。这样的融合载体可用于一个或多个目的,例如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解度;(iii)通过在亲和纯化中充当配体来帮助纯化重组蛋白。通常,在融合表达载体中,在融合部分和重组蛋白的连接处导入蛋白水解切割位点,以使融合蛋白纯化后重组蛋白与融合部分分离。这些酶及其关联识别序列包括因子Xa、凝血酶和肠激酶。示例性例融合表达载体包括将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A分别与靶重组蛋白融合的pGEX(Pharmacia Biotech Inc;Smithand Johnson,1988.Gene 67:31-40),pMAL(New England Biolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ)。合适的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等,(1988)Gene 69:301-315)和pET 11d(Studier等,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press),San Diego,Calif。(1990)60-89)。在一些实施方式中,载体是酵母表达载体。用于在酵母酿酒酵母中表达的载体的实例包括pYepSec1(Baldari等,1987.EMBO J.6:229-234),pMFa(Kuijan and Herskowitz,1982.Cell 30:933-943),pJRY88(Schultz et.al.,1987.Gene 54:113-123),pYES2(Invitrogen Corporation,San Diego,CA)和picZ(InVitrogen Corp,San Diego,CA)。在一些实施方式中,载体使用杆状病毒表达载体在昆虫细胞中驱动蛋白质表达。可用于在培养的昆虫细胞(例如SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等,1983.Mol.Cell.Biol.3:2156-2165)和pVL系列(Lucklow and Summers,1989。Virology170:31-39)。
在一些实施方式中,载体能够使用哺乳动物表达载体在哺乳动物细胞中驱动一种或多种序列的表达。哺乳动物表达载体的实例包括pCDM8(Seed,1987.Nature329:840)和pMT2PC(Kaufman等,1987.EMBOJ.6:187-195)。当在哺乳动物细胞中使用时,表达载体的控制功能通常由一种或多种调控元件提供。例如,常用的启动子衍生自多瘤病毒、腺病毒2、巨细胞病毒、猿猴病毒40和本文公开的以及本领域已知的其它启动子。对于原核细胞和真核细胞的其他合适的表达系统,参见例如Chapters 16and 17of Sambrook,等,MOLECULARCLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.,1989。
在一些实施方式中,重组哺乳动物表达载体能够优先指导核酸在特定细胞类型中的表达(例如,组织特异性调控元件用于表达核酸)。组织特异性调控元件是本领域已知的。合适的组织特异性启动子的非限制性实例包括白蛋白启动子(肝特异性;Pinkert等,1987.Genes Dev.1:268-277),淋巴特异性启动子(Calame and Eaton,1988.Adv.Immunol.43:235-275),特别是T细胞受体的启动子(Winoto and Baltimore,1989,EMBO J.8:729-733)和免疫球蛋白(Baneiji等,1983.Cell 33:729-740;Queen andBaltimore,1983.Cell 33:741-748),神经元特异性启动子(例如,神经细丝启动子;Byrneand Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477),胰腺特异性启动子(Edlund等,1985.Science 230:912-916)和乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。发育调节的启动子也包括例如鼠hox启动子(Kesseland Gruss,1990.Science 249:374-379)和甲胎蛋白启动子(Campes and Tilghman,1989.Genes Dev.3:537-546)。关于这些原核和真核载体,提及美国专利6,750,059,其内容通过引用整体并入本文。本发明的其他实施方式可以涉及病毒载体的用途,其中提及美国专利申请13/092,085,其内容通过引用整体并入本文。组织特异性调控元件是本领域已知的,就此而言,提及美国专利7,776,321,其内容通过引用整体并入本文。在一些实施方式中,调控元件可操作地连接至CRISPR系统的一种或多种元件,以驱动CRISPR系统的一种或多种元件的表达。一般来说,CRISPR(规律成簇的间隔短回文重复序列),也称为SPIDR(间隔子间隔直接重复序列),构成通常对特定细菌物种特异的DNA基因座家族。CRISPR基因座包含在大肠杆菌中识别的不同类型的间隔短序列重复(SSR)(Ishino等,J.Bacteriol.,169:5429-5433;和Nakata等,J.Bacteriol.,171:3553-3556)和相关基因。已经在Haloferaxmediterranei、化脓链球菌,鱼腥藻和结核分枝杆菌中鉴定了类似的间隔SSR(参见,Groenen等,Mol.Microbiol.,10:1057-1065;Hoe等,Emerg.Infect.Dis.,5:254-263;Masepohl等,Biochim.Biophys.Acta 1307:26-30;and Mojica等,Mol.Microbiol.,17:85-93)。CRISPR基因座与其他SSR的不同之处通常在于重复序列的结构,其被称为短规律间隔重复序列(SRSR)(Janssen等,OMICS J.Integ.Biol.,6:23-33;和Mojica等,Mol.Microbiol.,36:244-246)。通常,重复序列是以由具有基本上恒定长度的独特插入序列规则地间隔开的簇形式出现的短元件(Mojica等,,同上)。尽管重复序列在菌株之间是高度保守的,但间隔的重复序列的数量和间隔区的序列通常因菌株而异(vanEmbden等,J.Bacteriol。,182:2393-2401)。已在超过40种原核生物中鉴定出CRISPR基因座(参见例如,Jansen等,Mol.Microbiol.,43:1565-1575;and Mojica等,),包括但不限于Aeropyrum,Pyrobaculum,Sulfolobus,Archaeoglobus,Halocarcula,Methanobacterium,Methanococcus,Methanosarcina,Methanopyrus,Pyrococcus,Picrophilus,Thermoplasma,Corynebacterium,Mycobacterium,Streptomyces,Aquifex,Porphyromonas,Chlorobium,Thermus,Bacillus,Listeria,Staphylococcus,Clostridium,Thermoanaerobacter,Mycoplasma,Fusobacterium,Azarcus,Chromobacterium,Neisseria,Nitrosomonas,Desulfovibrio,Geobacter,Myxococcus,Campylobacter,Wolinella,Acinetobacter,Erwinia,Escherichia,Legionella,Methylococcus,Pasteurella,Photobacterium,Salmonella,Xanthomonas,Yersinia,Treponema和Thermotoga。
通常,在内源核酸靶向系统的背景下,形成核酸靶向复合物(包含与靶序列杂交并与一种或多种核酸靶向效应模块复合的指导RNA)导致在所述靶序列中或附近(例如,在1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)切割一条或者两条RNA链。在一些实施方式中,将驱动核酸靶向系统的一个或多个元件的表达的一种或多种载体导入宿主细胞中,使得所述核酸靶向系统的元件的表达引导核酸靶向复合物在一个或多个靶位点的形成。例如,核酸靶向效应模块和指导RNA可各自可操作地连接至单独载体上的单独调控元件。或者,可以将由相同或不同调控元件表达的两个或更多个元件组合在单个载体中,且一种或多种额外的载体提供不包含在第一载体中的核酸靶向系统的任何组分。在单个载体中组合的核酸靶向系统元件可以以任何合适的方向排列,例如,一个元件位于相对于第二元件的5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同或相反的链上,并且以相同或相反的方向取向。在一些实施方式中,单个启动子驱动编码核酸靶向效应模块的转录物和嵌入至一个或多个内含子序列内的指导RNA(例如,各自在不同的内含子中,两个或更多个在至少一个内含子中,或全部在单个内含子中)的表达。在一些实施方式中,核酸靶向效应模块和指导RNA可操作地连接至同一启动子并由其表达。
在某些实施方式中,编码至少一种指导RNA或Cpf1效应模块的核苷酸序列在细胞中与包含感兴趣的基因的启动子的调控元件可操作地连接,由此表达至少一种由感兴趣的基因的启动子驱动的CRISPR-Cas效应模块系统组分。“可操作地连接”意指编码指导RNA和/或Cas效应模块的核苷酸序列以允许表达核苷酸序列的方式与调控元件连接,如本文其他地方所述。术语“调控元件”在本文其他地方也有描述。根据本发明,调控元件包含感兴趣的基因的启动子,例如优选感兴趣的内源基因的启动子。在某些实施方式中,启动子处于其内源基因组位置。在这样的实施方式中,编码CRISPR和/或Cas效应模块的核酸在其天然基因组位置处受感兴趣的基因的启动子的转录控制。在某些其他实施方式中,启动子在(分开的)核酸分子上提供,例如载体或质粒,或其他染色体外核酸,即在其天然基因组位置不提供启动子。在某些实施方式中,启动子在基因组上整合在非天然基因组位置。
本发明还提供在哺乳动物中改变感兴趣的基因组基因座的表达的方法,包括使细胞与本文所述的工程化的CRISPR酶(例如工程化Cas效应模块)、组合物、系统或CRISPR复合物接触,由此递送CRISPR-Cas效应模块(载体)并允许CRISPR-Cas效应模块复合物形成并结合靶标,以及确定基因组基因座的表达是否已被改变,例如表达增加或减少,或修饰基因产物。
本发明进一步提供了对Cas效应模块或是如本文所述根据本发明的CRISPR酶的直系同源物的突变或修饰的Cas效应模块进行突变的方法,其包括确定该直系同源物中可以邻近或可以接触核酸分子(例如DNA、RNA、gRNA等)的氨基酸和/或与如本文所述根据本发明在CRISPR酶中在本文被鉴定的氨基酸类似或对应的氨基酸用于修饰和或突变,并且合成或制备或表达直系同源物包括以下,由以下组成或基本上由以下组成:本文所讨论的修饰和/或突变或突变,例如修饰(例如,改变或突变)中性氨基酸为带电荷的氨基酸,例如带正电荷的氨基酸,例如丙氨酸。如此修饰的直系同源物可用于CRISPR-Cas效应模块系统;表达它的核酸分子可以用于递送分子或编码如本文所讨论的CRISPR-Cas效应模块系统组分的载体系统。
在一个方面,本发明提供包括本文所述的组分中的一种或多种的试剂盒。在一些实施方式中,所述试剂盒包括载体系统和使用该试剂盒的说明书。在一些实施方式中,载体系统包含(a)可操作地连接至直接重复序列和用于在DR序列下游插入一种或多种指导序列的一个或多个插入位点的第一调控元件,其中当表达时,指导序列指导CRISPR-Cas效应模块复合物与真核细胞中的靶序列序列特异性结合,其中CRISPR-Cas效应模块复合物包含与(1)与靶杂交的指导序列和(2)DR序列复合的Cas效应模块;和/或(b)与编码包含核定位序列的所述Cas效应模块(并且有利地,这包括分裂的Cas效应模块)的酶编码序列可操作地连接的第二调控元件。在一些实施方式中,所述试剂盒包括位于系统的相同或不同载体上的组分(a)和(b)。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,其中当表达时,两种或更多种指导序列各自指导CRISPR-Cas效应模块复合物与真核细胞中的不同靶序列序列特异性结合。
在一个方面,本发明提供了在真核细胞中修饰靶多核苷酸的方法。在一些实施方式中,所述方法包括允许CRISPR-Cas效应模块复合物结合靶多核苷酸以实现所述靶多核苷酸的切割,从而修饰靶多核苷酸,其中CRISPR-Cas效应模块复合物包含与与所述靶多核苷酸内的靶序列杂交的指导序列复合的Cas效应模块,其中所述指导序列与直接重复序列连接。在一些实施方式中,所述切割包括通过所述Cas效应模块而在靶序列的位置切割一条或两条链;这包括分裂的Cas效应模块。在一些实施方式中,所述切割导致靶基因的转录减少。在一些实施方式中,所述方法还包括通过与外源模板多核苷酸的同源重组而修复所述切割的靶多核苷酸,其中所述修复产生包含所述靶多核苷酸的一个或多个核苷酸的插入、缺失或置换的突变。在一些实施方式中,所述突变导致从包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。在一些实施方式中,所述方法还包括向所述真核细胞递送一种或多种载体,其中所述一种或多种载体驱动以下一种或多种的表达:Cas效应模块和连接到DR序列的指导序列。在一些实施方式中,将所述载体递送至受试者的真核细胞。在一些实施方式中,所述修饰在细胞培养的所述真核细胞中发生。在一些实施方式中,所述方法还包括在所述修饰之前从受试者分离所述真核细胞。在一些实施方式中,所述方法还包括将所述真核细胞和/或由其衍生的细胞返回给所述受试者。
在一个方面,本发明提供了在真核细胞中修饰多核苷酸表达的方法。在一些实施方式中,所述方法包括允许CRISPR-Cas效应模块复合物与多核苷酸结合,使得所述结合导致所述多核苷酸的表达增加或减少;其中CRISPR-Cas效应模块复合物包含与所述多核苷酸内的靶序列杂交的指导序列复合的Cas效应模块(可能包括分裂的Cas效应模块);其中所述指导序列与直接重复序列连接。在一些实施方式中,所述方法还包括向所述真核细胞递送一种或多种载体,其中所述一种或多种载体驱动以下一种或多种的表达:Cas效应模块和连接到DR序列的指导序列。
在一个方面,本发明提供了产生包含突变的疾病基因的模型真核细胞的方法。在一些实施方式中,疾病基因是与患有或发展疾病的风险增加相关的任何基因。在一些实施方式中,所述方法包括(a)将一种或多种载体导入真核细胞,其中所述一种或多种载体驱动以下一种或多种的表达:Cas效应模块和与直接重复序列连接的指导序列;(b)允许CRISPR-Cas效应模块复合物与靶多核苷酸结合以实现所述疾病基因内靶多核苷酸的切割,其中CRISPR-Cas效应模块复合物包含与(1)与靶多核苷酸内的靶序列杂交的指导序列,和(2)DR序列复合的Cas效应模块,从而产生包含突变的疾病基因的模型真核细胞;这包括分裂的Cas效应模块。在一些实施方式中,所述切割包括通过所述Cas效应模块在靶序列的位置切割一条或两条链。在一种优选的实施方式中,链断裂是具有5’突出端的交错切口。在一些实施方式中,所述切割导致靶基因的转录减少。在一些实施方式中,所述方法还包括通过与外源模板多核苷酸的同源重组修复所述切割的靶多核苷酸,其中所述修复产生包含所述靶多核苷酸的一个或多个核苷酸的插入、缺失或置换的突变。在一些实施方式中,所述突变导致从包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。
在一个方面,本发明提供了在一种或多种细胞中的基因中通过导入一个或多个突变来选择一种或多种细胞的方法,所述方法包括:将一种或多种载体导入细胞中(s),其中所述一种或多种载体驱动以下一种或多种的表达:Cas效应模块,连接到直接重复序列的指导序列,和编辑模板;其中编辑模板包含一个或多个消除Cas效应模块切割的突变;允许编辑模板与待选择的细胞中的靶多核苷酸同源重组;允许CRISPR-Cas效应模块复合物与靶多核苷酸结合以实现所述基因内靶多核苷酸的切割,其中CRISPR-Cas效应模块复合物包含与(1)与靶多核苷酸内的靶序列杂交的指导序列和(2)直接重复序列复合的Cas效应模块,其中Cas效应模块CRISPR-Cas效应模块复合物与靶多核苷酸结合诱导细胞死亡,从而允许选择其中导入了一个或多个突变的一种或多种细胞;这包括分裂的Cas效应模块。在本发明的另一种优选实施方式中,待选择的细胞可以是真核细胞。本发明的各方面允许选择特定细胞而无需选择标志物或可包括反选择系统的两步方法。
还提供了用于如本文其他地方所限定的治疗方法的包含Cas效应模块的组合物,包含多种指导RNA的复合物或系统,优选串联排列,或编码或包含所述Cas效应模块的多核苷酸或载体、包含多种指导RNA的复合物或系统,优选串联排列。可以提供包括这样的组合物的组件的试剂盒。还提供了所述组合物在制备用于这样的治疗方法的药物中的用途。本发明还提供了Cas效应模块CRISPR系统在筛选中的用途,例如功能获得筛选。人工迫使过表达基因的细胞能够随时间下调基因(重建平衡),例如通过负反馈环。在筛选开始时,未调节的基因可能再次减少。使用可诱导的Cas效应模块激活剂允许人们在筛选之前诱导转录,因此最小化假阴性命中的可能性。因此,通过在筛选中使用本发明,例如功能获得筛选,可以最小化假阴性结果的可能性。
在另一个方面,本发明提供了一种工程化的非天然存在的载体系统,其包括一种或多种载体,所述载体包含可操作地连接至多种Cas效应模块CRISPR系统指导RNA的第一调控元件,每种指导RNA特异性靶向编码基因产物的DNA分子,和可操作地连接至CRISPR蛋白的编码的第二个调控元件。两个调控元件可以位于系统的的相同载体或不同载体上。多种指导RNA在细胞中靶向编码多种基因产物的多种DNA分子,并且CRISPR蛋白可以切割编码基因产物的多种DNA分子(它可以切割一条或两条链或基本上没有核酸酶活性),由此多种基因产物的表达被改变;并且,其中CRISPR蛋白和多种指导RNA不是天然一起出现的。在优选的实施方式中,CRISPR蛋白是Cas效应模块,任选地经密码子优化以在真核细胞中表达。在优选的实施方式中,真核细胞是哺乳动物细胞、植物细胞或酵母细胞,在更优选的实施方式中,哺乳动物细胞是人细胞。在本发明的另一个实施方式中,多种基因产物中的每一种的表达被改变,优选降低。
在一个方面,本发明提供了包含一种或多种载体的载体系统。在一些实施方式中,所述系统包括:(a)可操作地连接至直接重复序列和用于在直接重复序列的上游或下游(无论哪种适用)插入一种或多种指导序列的一个或多个插入位点的第一调控元件,其中当表达时,一种或多种指导序列指导CRISPR复合物与真核细胞中的一个或多个靶序列序列特异性结合,其中CRISPR复合物包含与与一个或多个靶序列杂交的一种或多种指导序列复合的Cas效应模块;和(b)可操作地连接至编码所述Cas效应模块(优选包含至少一个核定位序列和/或至少一个NES)的酶编码序列的第二调控元件;其中组分(a)和(b)位于系统的相同或不同载体上。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,其中当表达时,两种或更多种指导序列中的每一种指导CRISPR复合物与真核细胞中的不同靶序列序列特异性结合。在一些实施方式中,CRISPR复合物包含具有足够强度以驱动所述CRISPR复合物以可检测量在真核细胞的细胞核内或细胞核外积累的一个或多个核定位序列和/或一个或多个NES。在一些实施方式中,第一调控元件是聚合酶III启动子。在一些实施方式中,第二调控元件是聚合酶II启动子。在一些实施方式中,每种指导序列的长度是至少16、17、18、19、20、25个核苷酸或在16-30之间,或16-25之间,或16-20个核苷酸之间。
重组表达载体可以包含以适合于在宿主细胞中表达核酸的形式编码用于如本文所限定的多重靶向的Cas效应模块、系统或复合物,这意味着重组表达载体包含可操作地连接至待表达的核酸序列的一个或多个调控元件,其可以基于待用于表达的宿主细胞进行选择。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许核苷酸序列表达的方式与调控元件连接(例如,在体外转录/翻译系统中或当载体被导入宿主细胞时的宿主细胞中)。
在一些实施方式中,用包含编码如本文所限定的用于多重靶向的Cas效应模块、系统或复合物的多核苷酸的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方式中,细胞在其天然存在于受试者中时被转染。在一些实施方式中,转染的细胞取自受试者。在一些实施方式中,细胞衍生自取自受试者的细胞,例如细胞系。用于组织培养的多种细胞系是本领域已知的,并且在本文其他地方举例说明。细胞系可从本领域技术人员已知的多种来源获得(参见,例如,美国典型培养物保藏中心(ATCC)(Manassus,VA))。在一些实施方式中,用包含编码如本文所限定的用于多重靶向的Cas效应模块、系统或复合物的多核苷酸的一种或多种载体转染的细胞用于建立包含一种或多种载体衍生序列的新细胞系。在一些实施方式中,如本文所限定的用于多重靶向的Cas效应模块、系统或复合物的组分瞬时转染(例如通过瞬时转染一种或多种载体,或用RNA转染)并通过Cas效应模块、系统或复合物的活性进行修饰的细胞用于建立包含含有修饰但缺乏任何其他外源序列的细胞的新细胞系。在一些实施方式中,用包含编码如本文所限定的用于多重靶向的Cas效应模块、系统或复合物的多核苷酸的一种或多种载体瞬时或非瞬时转染的细胞,或衍生自这样的细胞的细胞系,用于评估一种或多种测试化合物。
术语“调控元件”是如本文其他地方所定义。
有利的载体包括慢病毒和腺相关病毒,和也可以选择这样的载体的类型用于靶向特定类型的细胞。
在一个方面,本发明提供了真核宿主细胞,其包含(a)可操作地连接至直接重复序列和用于在直接重复序列的上游或下游(无论哪种适用)插入一种或多种指导序列的一个或多个插入位点的第一调控元件,其中当表达时,一种或多种指导序列指导CRISPR复合物与真核细胞中分别的一个或多个靶序列序列特异性结合,其中CRISPR复合物包含与分别的一个或多个靶序列杂交的一种或多种指导序列复合的Cas效应模块;和/或(b)可操作地连接至编码所述Cas效应模块(优选包含至少一个核定位序列和/或至少一个NES)的酶编码序列的第二调控元件。在一些实施方式中,宿主细胞包含组分(a)和(b)。在一些实施方式中,组分(a)、组分(b)或组分(a)和(b)稳定整合到宿主真核细胞的基因组中。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,并且任选地由直接重复序列分开,其中当表达时,两种或更多种指导序列中的每一种指导CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施方式中,Cas效应模块包含具有足够的强度以驱动所述CRISPR酶以可检测的量在真核细胞的细胞核中和/或细胞核外积累的一个或多个核定位序列和/或核输出序列或NES。
本发明的多个方面涉及包括一种或多种载体的载体系统,或载体本身。载体可以设计用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物,蛋白质或酶)。例如,CRISPR转录物可以在细菌细胞中表达,例如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞。合适的宿主细胞在Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步讨论。或者,重组表达载体可以在体外转录和翻译,例如使用T7启动子调节序列和T7聚合酶。
在某些方面,本发明涉及载体。这里使用的“载体”是允许或促进实体从一个环境转移到另一个环境的工具。它是复制子,例如另一个DNA片段可以插入其中以引起插入片段的复制的质粒、噬菌体或粘粒。通常,当与适当的控制元件相关联时,载体能够复制。通常,术语“载体”是指能够转运与其连接的另外的核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离末端,没有游离末端(例如,环状)的核酸分子;包括DNA、RNA或两者的核酸分子;和本领域已知的其他多核苷酸种类。一种类型的载体是“质粒”,所述质粒是指环状双链DNA环,其中可以例如通过标准的分子克隆技术,插入额外的DNA片段。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装成病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(AAV))的载体中。病毒载体还包含由病毒携带的用于转染到宿主细胞中的多核苷酸。某些载体能够在导入它们的宿主细胞中自主复制(例如,具有细菌复制起始子的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在导入宿主细胞后被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够引导可操作地连接至其的基因的表达。这样的载体在本文中称为“表达载体”。在重组DNA技术中有用的常见表达载体通常是质粒的形式。
重组表达载体可以包括适于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包含可操作地连接至待表达的核酸序列的一个或多个调控元件,其可以基于待用于表达的宿主细胞进行选择。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许核苷酸序列表达的方式与调控元件连接(例如,在体外转录/翻译系统中或当载体被导入宿主细胞时的宿主细胞中)。关于重组和克隆方法,提及美国专利申请10/815,730,2004年9月2日公布为US2004-0171156A1,其内容通过引用整体并入本文。
载体可包含调控元件,例如启动子。载体可以包含Cas编码序列,和/或单个,但可能也可以包含至少3或8或16或32或48或50个指导RNA(例如,sgRNA)编码序列,例如1-2、1-3、1-4-5、3-6、3-7、3-8、3-9、3-10、3-8、3-16、3-30、3-32,3-48、3-50个RNA(例如,sgRNA)。在单个载体中,每个RNA(例如,sgRNA)可以存在启动子,有利地,当存在至多约16个RNA(例如,sgRNA)时;并且,当单个载体提供超过16个RNA(例如,sgRNA)时,一个或多个启动子可以驱动多于一个RNA(例如,sgRNA)的表达,例如,当有32个RNA(例如,sgRNA)时,每个启动子可以驱动两个RNA(例如,sgRNA)的表达,并且当存在48个RNA(例如,sgRNA)时,每个启动子可以驱动三个RNA(例如,sgRNA)的表达。通过简单的算术和完善的克隆方案以及本公开内容中的教导,本领域技术人员可以容易地实施关于RNA的本发明(例如,用于合适的示例性载体(例如AAV)的sgRNA,以及合适的例如,U6启动子,例如U6-sgRNAs。例如,AAV的包装限度为~4.7kb。单个U6-sgRNA的长度(加上用于克隆的限制性位点)为361bp。因此,技术人员可以在单个载体中容易地装入大约12-16个,例如13个U6-sgRNA盒。这可以通过任何合适的方法组装,例如用于TALE组装的金门策略(www.genome-engineering.org/taleffectors/)。技术人员也可以使用串联指导策略将U6-sgRNA的数量增加约1.5倍,例如,从12-16增加,例如,从13到约18-24,例如,约19个U6-sgRNA。因此,本领域技术人员可以容易地在单个载体中达到约18-24个,例如约19个启动子-RNA,例如U6-sgRNA,例如AAV载体。用于增加启动子和RNA(例如载体中的sgRNA)的数量的另一种方法是使用单个启动子(例如,U6)来表达RNA阵列,例如由可切割序列分开的sgRNA。并且用于增加启动子-RNA(例如载体中的sgRNA)的数量的更进一步的方法是表达启动子-RNA阵列,例如由编码序列或基因的内含子中的可切割序列分隔的sgRNA;在这种情况下,使用聚合酶II启动子是有利的,所述聚合酶II启动子可以具有增加的表达并且能够以组织特异性方式转录长RNA。(参见例如,nar.oxfordjournals.org/content/34/7/e53.short,www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一个有利的实施方式中,AAV可以包装靶向至多约50个基因的U6串联sgRNA。因此,根据本领域的知识和本公开内容的教导,技术人员可以容易地制造和使用载体,例如表达在一种或多种启动子的控制下或可操作或功能性地连接的多种RNA或指导或sgRNA的单个载体-特别是关于本文讨论的RNA或指导或sgRNA的数量,而无需任何过度的实验。
指导RNA,例如sgRNA编码序列,和/或CAS编码序列的,可以功能性地或可操作地连接到一个或多个调控元件,因此所述一个或多个调控元件驱动表达。启动子可以是组成型启动子和/或条件性启动子和/或诱导型启动子和/或组织特异性启动子。启动子可选自RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录病毒Rous肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。有利的启动子是启动子是U6。
本发明的方面涉及用于指导RNA和(任选地修饰或突变的)Cas效应模块的双顺反子载体。用于指导RNA和(任选修饰或突变的)CRISPR酶的双顺反子表达载体是优选的。通常并且特别是在该实施方式中,(任选地修饰或突变的)CRISPR酶优选由CBh启动子驱动。RNA可以优选地由Pol III启动子驱动,例如U6启动子。理想情况下,两者结合在一起。
在一些实施方式中,提供了指导RNA中的环。这可以是茎环或四元环。环优选为GAAA,但不限于该序列或实际上长度仅为4bp。实际上,用于发夹结构的优选的环形成序列的长度为4个核苷酸,最优选具有序列GAAA。然而,可以使用更长的或更短的环序列,作为可替代的序列。序列优选包括核苷酸三联体(例如,AAA)和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。
术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如转录终止信号,例如多腺苷酸化信号和聚-U序列)。这些调控元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,AcademicPress,San Diego,Calif.(1990)。调控元件包括在许多类型的宿主细胞中引导核苷酸序列组成型表达的那些和仅在某些宿主细胞中引导核苷酸序列表达的那些(例如,组织特异性调控序列)。组织特异性启动子可以主要在期望的感兴趣的组织中引导表达,例如,肌肉、神经元、骨骼、皮肤、血液、特定器官(例如,肝脏,胰腺)或特定细胞类型(例如,淋巴细胞)。调控元件还可以以时间依赖性方式引导表达,例如,以细胞周期依赖性或发育阶段依赖性的方式,其可以或可以不是组织或细胞类型特异性。在一些实施方式中,载体包含一个或多个pol III启动子(例如,1、2、3,4、5或更多个pol III启动子),一个或多个pol II启动子(例如,1、2、3、4、5或更多个pol II启动子),一个或多个pol I启动子(例如,1、2、3、4、5或更多个pol I启动子),或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见,例如,Boshart等,Cell,41:521-530(1985)]、SV40启动子,二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。术语“调控元件”还包括增强子元件,例如WPRE;CMV增强子;HTLV-I的LTR中的R-U5’片段(Mol.Cell.Biol.,Vol.8(1),p.466-472,1988);SV40增强子;和兔β-珠蛋白的外显子2和3之间的内含子序列(Proc.Natl.Acad.Sci.USA.,Vol.78(3),p.1527-31,1981)。本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、期望的表达水平等。可将载体导入宿主细胞中从而产生由本文所述的核酸编码的转录物、蛋白质或肽,包括融合蛋白或肽(例如,成簇的规律间隔短回文重复序列(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。关于调控序列,提及美国专利申请10/491,026,其内容通过整体引用并入本文。关于启动子,提及PCT公开WO2011/028929和美国申请12/511,940,其内容通过整体引用并入本文。
载体可以设计用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白或酶)。例如,CRISPR转录物可以在细菌细胞中表达,例如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞。合适的宿主细胞在Goeddel,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步讨论。或者,重组表达载体可以在体外转录和翻译,例如使用T7启动子调控序列和T7聚合酶。
载体可以在原核生物或原核细胞中导入和繁殖。在一些实施方式中,原核生物用于扩增待导入真核细胞的载体的拷贝或作为待导入真核细胞的载体的产生中的中间载体(例如,扩增作为病毒载体包装系统的一部分的质粒)。在一些实施方式中,原核生物用于扩增载体的拷贝并表达一种或多种核酸,例如提供一种或多种蛋白质的来源,以递送至宿主细胞或宿主生物。蛋白质在原核生物中的表达通常在大肠杆菌中用含有指导融合蛋白或非融合蛋白的表达的组成型或诱导型启动子的载体进行。融合载体在其中编码的蛋白质中添加许多氨基酸,例如重组蛋白的氨基末端。这样的融合载体可用于一个或多个目的,例如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解度;(iii)通过在亲和纯化中充当配体来帮助纯化重组蛋白。通常,在融合表达载体中,在融合部分和重组蛋白的连接处导入蛋白水解切割位点,以使融合蛋白纯化后重组蛋白与融合部分分离。这样的酶及其关联识别序列包括因子Xa、凝血酶和肠激酶。示例性例融合表达载体包括将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A分别与靶重组蛋白融合的pGEX(Pharmacia Biotech Inc;Smithand Johnson,1988.Gene 67:31-40),pMAL(New England Biolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ)。合适的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等,(1988)Gene 69:301-315)和pET 11d(Studier等,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press),San Diego,Calif。(1990)60-89)。在一些实施方式中,载体是酵母表达载体。用于在酵母酿酒酵母中表达的载体的实例包括pYepSec1(Baldari等,1987.EMBO J.6:229-234),pMFa(Kuijan and Herskowitz,1982.Cell 30:933-943),pJRY88(Schultz et.al.,1987.Gene 54:113-123),pYES2(Invitrogen Corporation,San Diego,CA)和picZ(InVitrogen Corp,San Diego,CA)。在一些实施方式中,载体使用杆状病毒表达载体在昆虫细胞中驱动蛋白质表达。可用于在培养的昆虫细胞(例如SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等,1983.Mol.Cell.Biol.3:2156-2165)和pVL系列(Lucklow and Summers,1989。Virology170:31-39)。
在一些实施方式中,载体能够使用哺乳动物表达载体在哺乳动物细胞中驱动一种或多种序列的表达。哺乳动物表达载体的实例包括pCDM8(Seed,1987.Nature329:840)和pMT2PC(Kaufman等,1987.EMBOJ.6:187-195)。当在哺乳动物细胞中使用时,表达载体的控制功能通常由一种或多种调控元件提供。例如,常用的启动子衍生自多瘤病毒、腺病毒2、巨细胞病毒、猿猴病毒40和本文公开的以及本领域已知的其它启动子。对于原核细胞和真核细胞的其他合适的表达系统,参见例如Chapters 16and 17of Sambrook,等,MOLECULARCLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.,1989。
在一些实施方式中,重组哺乳动物表达载体能够优先指导核酸在特定细胞类型中的表达(例如,组织特异性调控元件用于表达核酸)。组织特异性调控元件是本领域已知的。合适的组织特异性启动子的非限制性实例包括白蛋白启动子(肝特异性;Pinkert等,1987.Genes Dev.1:268-277),淋巴特异性启动子(Calame and Eaton,1988.Adv.Immunol.43:235-275),特别是T细胞受体的启动子(Winoto and Baltimore,1989,EMBO J.8:729-733)和免疫球蛋白(Baneiji等,1983.Cell 33:729-740;Queen andBaltimore,1983.Cell 33:741-748),神经元特异性启动子(例如,神经细丝启动子;Byrneand Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477),胰腺特异性启动子(Edlund等,1985.Science 230:912-916)和乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。发育调节的启动子也包括例如鼠hox启动子(Kesseland Gruss,1990.Science 249:374-379)和α-胎蛋白启动子(Campes and Tilghman,1989.Genes Dev.3:537-546)。关于这些原核和真核载体,提及美国专利6,750,059,其内容通过引用整体并入本文。本发明的其他实施方式可以涉及病毒载体的用途,其中提及美国专利申请13/092,085,其内容通过引用整体并入本文。组织特异性调控元件是本领域已知的,就此而言,提及美国专利7,776,321,其内容通过引用整体并入本文。在一些实施方式中,调控元件可操作地连接至CRISPR系统的一种或多种元件,以驱动CRISPR系统的一种或多种元件的表达。一般来说,CRISPR(规律成簇的间隔短回文重复序列),也称为SPIDR(间隔子间隔直接重复序列),构成通常对特定细菌物种特异的DNA基因座家族。CRISPR基因座包含在大肠杆菌中识别的不同类型的间隔短序列重复(SSR)(Ishino等,J.Bacteriol.,169:5429-5433;and Nakata等,J.Bacteriol.,171:3553-3556)和相关基因。已经在Haloferaxmediterranei、化脓链球菌,鱼腥藻和结核分枝杆菌中鉴定了类似的间隔SSR(参见,Groenen等,Mol.Microbiol.,10:1057-1065;Hoe等,Emerg.Infect.Dis.,5:254-263;Masepohl等,Biochim.Biophys.Acta 1307:26-30;and Mojica等,Mol.Microbiol.,17:85-93)。CRISPR基因座与其他SSR的不同之处通常在于重复序列的结构,其被称为短规律间隔重复序列(SRSR)(Janssen等,OMICS J.Integ.Biol.,6:23-33;and Mojica等,Mol.Microbiol.,36:244-246)。通常,重复序列是以由具有基本恒定长度的独特插入序列规则地间隔开的簇形式出现的短元件(Mojica等,,同上)。尽管重复序列在菌株之间是高度保守的,但间隔的重复序列的数量和间隔区的序列通常因菌株而异(vanEmbden等,J.Bacteriol。,182:2393-2401)。已在超过40种原核生物中鉴定出CRISPR基因座(参见例如,Jansen等,Mol.Microbiol.,43:1565-1575;and Mojica等,),包括但不限于Aeropyrum,Pyrobaculum,Sulfolobus,Archaeoglobus,Halocarcula,Methanobacterium,Methanococcus,Methanosarcina,Methanopyrus,Pyrococcus,Picrophilus,Thermoplasma,Corynebacterium,Mycobacterium,Streptomyces,Aquifex,Porphyromonas,Chlorobium,Thermus,Bacillus,Listeria,Staphylococcus,Clostridium,Thermoanaerobacter,Mycoplasma,Fusobacterium,Azarcus,Chromobacterium,Neisseria,Nitrosomonas,Desulfovibrio,Geobacter,Myxococcus,Campylobacter,Wolinella,Acinetobacter,Erwinia,Escherichia,Legionella,Methylococcus,Pasteurella,Photobacterium,Salmonella,Xanthomonas,Yersinia,Treponema和Thermotoga。
通常,在内源核酸靶向系统的背景下,形成核酸靶向复合物(包含与靶序列杂交并与一种或多种核酸靶向效应模块复合的指导RNA)导致在所述靶序列中或附近(例如,在1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)切割一条或者两条RNA链。在一些实施方式中,将驱动核酸靶向系统的一个或多个元件的表达的一种或多种载体导入宿主细胞中,使得所述核酸靶向系统的元件的表达引导核酸靶向复合物在一个或多个靶位点的形成。例如,核酸靶向效应模块和指导RNA可各自可操作地连接至单独载体上的单独调控元件。或者,可以将由相同或不同调控元件表达的两个或更多个元件组合在单个载体中,且一种或多种额外的载体提供不包括在第一载体中的核酸靶向系统的任何组分。在单个载体中组合的核酸靶向系统元件可以以任何合适的方向排列,例如,一个元件位于相对于第二元件的5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同或相反的链上,并且以相同或相反的方向取向。在一些实施方式中,单个启动子驱动编码核酸靶向效应模块的转录物的表达和嵌入至一个或多个内含子序列内的指导RNA(例如,在不同的内含子中各一个,在至少一个内含子两个或更多个,或全部在单个内含子中)。在一些实施方式中,所述核酸靶向效应模块和指导RNA可操作地连接至同一启动子并由其表达。
用于包装本发明Cpf1编码核酸分子,例如,DNA,到载体中,例如,病毒载体,以介导体内基因组修饰的方法可以包括:
·实现NHEJ介导的基因敲除:
·单病毒载体:
·包含两个或更多表达盒的载体:
·启动子-Cpf1编码核酸分子-终止子
·启动子-gRNA1-终止子
·启动子-gRNA2-终止子
·启动子-gRNA(N)-终止子(至多为载体的大小限制)
·双病毒载体:
·含有用于驱动Cpf1表达的一个表达盒的载体1
·启动子-Cpf1编码核酸分子-终止子
·含有用于驱动一种或多种指导RNA表达的一个或多个表达盒的载体2
·启动子-gRNA1-终止子
·启动子-gRNA(N)-终止子(至多为载体的大小限制)
·介导同源定向修复。
·除了上述单病毒载体和双病毒载体方法之外,还可以使用另外的载体来递送同源-定向修复模板。
用于驱动Cpf1编码核酸分子表达的启动子可包括:
-AAV ITR可用作启动子:这有利于消除对额外启动子元件(其可占据载体中的空间)的需要。释放的额外空间可用于驱动其他元件(gRNA等)的表达。此外,ITR活性相对较弱,因此可用于降低由于Cpf1过表达引起的潜在毒性。
-对于普遍存在的表达,可以使用的启动子包括:CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。
对于脑或其它CNS表达,可以使用的启动子:用于所有神经元的突触蛋白I,用于兴奋性神经元的CaMKIIα,用于GABA能神经元的GAD67或GAD65或VGAT,等。
对于肝脏表达,可以使用白蛋白启动子。
对于肺表达,可以使用SP-B。
对于内皮细胞,可以使用ICAM。
对于造血细胞,可以使用IFNβ或CD45。
对于成骨细胞,可以使用OG-2。
用于驱动指导RNA的启动子可包括:
-Pol III启动子例如U6或H1
-使用Pol II启动子和内含子盒来表达gRNA
腺相关病毒(AAV)
Cpf1和一种或多种指导RNA可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型递送,特别地,使用来自例如美国专利号8,454,972(腺病毒的制剂、剂量)、8,404,658(AAV的制剂、剂量)和5,846,946(DNA质粒的制剂、剂量)以及临床试验和关于涉及慢病毒、AAV和腺病毒的临床试验的出版物的制剂和剂量。例如,对于AAV,施用途径、制剂和剂量可以如美国专利号8,454,972和涉及AAV的临床试验中那样。对于腺病毒,施用途径、制剂和剂量可以如美国专利号8,404,658和涉及腺病毒的临床试验中那样。对于质粒递送,施用途径、制剂和剂量可以如美国专利号5,846,946和涉及质粒的临床研究中那样。剂量可以基于或外推至平均70kg个体(例如,男性成年人),并且可以针对不同体重和物种的患者、受试者、哺乳动物进行调整。施用频率在医学或兽医(例如,医生、兽医)的范围内,取决于包括患者或受试者的年龄、性别、一般健康状况、其他状况以及所针对的特定失调的通常因素。可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性基因组修饰,Cpf1的表达可以由细胞类型特异性启动子驱动。例如,肝脏特异性表达可能使用白蛋白启动子和神经元特异性表达(例如,用于靶向CNS失调)可能使用突触蛋白I启动子。
就体内递送而言,AAV优于其他病毒载体有以下多个原因:
·低毒性(这可以是由于纯化方法不需要对可以激活免疫反应的细胞颗粒进行超速离心)和
·引起插入诱变的可能性低,因为它没有整合到宿主基因组中。
AAV的包装限制为4.5或4.75Kb。这意味着Cpf1以及启动子和转录终止子必须全部装入同一病毒载体。大于4.5或4.75Kb的构建体将导致病毒产生显著减少。SpCas9相当大,基因本身超过4.1Kb,这使得包装成AAV很困难。因此,本发明的实施方式包括利用较短的Cpf1同源物。例如:
rAAV载体优选在昆虫细胞中产生,例如,在无血清悬浮培养物中生长的草地贪夜蛾(Spodoptera frugiperda)Sf9昆虫细胞。无血清昆虫细胞可购自商业供应商,例如SigmaAldrich(EX-CELL405)。
因此这些物种在一般情况下是优选的Cpf1物种。
关于AAV,AAV可以是AAV1、AAV2、AAV5或其任何组合。可以针对待靶向的细胞选择AAV的AAV;例如,可以选择AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或其任何组合用于靶向脑或神经细胞;并且可以选择AAV4用于靶向心脏组织。AAV8可用于递送至肝脏。在本文中启动子和载体优选是单独的。关于这些细胞的某些AAV血清型的列表(参见,Grimm,D.等,J.Virol.82:5887-5911(2008))如下:
慢病毒
慢病毒是复杂的逆转录病毒,其具有在有丝分裂和有丝分裂后细胞两者中感染和表达其基因的能力。最常见的慢病毒是人类免疫缺陷病毒(HIV),它使用其他病毒的包膜糖蛋白来靶向广泛的细胞类型。
慢病毒可以如下制备。在克隆pCasES10(其含有慢病毒转移质粒骨架)后,将低代的HEK293FT(p=5)在转染前一天接种到T-75烧瓶中至50%汇合(在含有10%胎牛血清和不含抗生素的DMEM中)。20小时后,将培养基更换为OptiMEM(无血清)培养基,4小时后进行转染。用10μg慢病毒转移质粒(pCasES10)和以下包装质粒转染细胞:5μg pMD2.G(VSV-g假型)和7.5μg psPAX2(gag/pol/rev/tat)。在含有阳离子脂质递送剂(50μl Lipofectamine2000和100μl Plus试剂)的4ml OptiMEM中进行转染。6个小时后,将培养基更换为含有10%胎牛血清的不含抗生素的DMEM。这些方法在细胞培养期间使用血清,但优选无血清方法。
慢病毒可以如下纯化。48小时后收获病毒上清液。首先清除上清液中的碎片并通过0.45μm低蛋白结合(PVDF)过滤器过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀在4℃下在50μl DMEM中重悬浮过夜。然后将它们等分并立即在-80℃冷冻。
在另一个实施方式中,还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,尤其是对于眼基因治疗(参见,例如,Balagaan,J Gene Med 2006;8:275–285)。在另一个实施方式中,还考虑即基于马传染性贫血病毒的慢病毒基因治疗载体,其表达血管生成抑制蛋白内皮抑素和血管抑制素,通过视网膜下注射递送以治疗年龄相关性黄斑变性的网状形式(参见例如,Binley等,HUMAN GENE THERAPY 23:980–991(September 2012)),并且该载体可以针对本发明的CRISPR-Cas系统进行修饰。
最小启动子的使用
本申请提供了一种用于将效应蛋白和至少一种CRISPR指导RNA递送至细胞的载体,所述载体包含可操作地连接至编码所述效应蛋白的多核苷酸序列的最小启动子和可操作地连接至编码至少一种指导RNA的多核苷酸序列的第二最小启动子,其中包含两个最小启动子和多核苷酸序列的载体序列的长度小于4.4Kb。在一个实施方式中,病毒是腺相关病毒(AAV)或腺病毒。在另一个实施方式中,效应蛋白是CRISPR酶。在另一个实施方式中,CRISPR酶是SaCas9、Cpf1、Cas13b或C2c2。
在一个相关方面,本发明提供一种用于将效应蛋白和至少一种CRISPR指导RNA递送至细胞的慢病毒载体,所述慢病毒载体包含可操作地连接至编码Cpf1的多核苷酸序列的启动子和可操作地连接至编码至少一种指导RNA的多核苷酸序列的第二启动子,其中所述多核苷酸序列是反向的。
在另一个方面,本发明提供了在细胞中表达效应蛋白和RNA指导的方法,所述方法包括导入根据本文公开的任何载体递送系统的载体。在用于递送效应蛋白的载体的一个实施方式中,最小启动子是Mecp2启动子、tRNA启动子或U6。在另一个实施方式中,最小启动子是组织特异性的。
CRISPR-Cas系统的优化
在另一个方面,本发明涉及用于开发或设计CRISPR-Cas系统的方法。在一个方面,本发明涉及用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法。本发明特别是涉及用于改进CRISPR-Cas系统(例如基于CRISPR-Cas系统的疗法或治疗剂)的方法。成功的CRISPR-Cas系统(例如基于CRISPR-Cas系统的疗法或治疗剂)的关键特征涉及高特异性、高功效和高安全性。通过减少脱靶效应,可以实现高特异性和高安全性等。
因此,在另一个方面,本发明涉及本文所述的方法,所述方法包括选择一种或多种(治疗性)靶标,选择一个或多个CRISPR-Cas系统的功能,和优化选择的与CRISPR-Cas系统和/或其功能相关的参数或变量。在相关方面,本发明涉及如本文所述的方法,所述方法包括(a)选择一个或多个(治疗性)靶基因座,(b)选择一种或多种CRISPR-Cas系统功能,(c)任选地选择一种或多种递送模式,以及制备、开发或设计基于步骤(a)-(c)选择的CRISPR-Cas系统。
在某些实施方式中,CRISPR-Cas系统功能包括基因组突变。在某些实施方式中,CRISPR-Cas系统功能包括单个基因组突变。在某些实施方式中,CRISPR-Cas系统功能包括多个基因组突变。在某些实施方式中,CRISPR-Cas系统功能包括基因敲除。在某些实施方式中,CRISPR-Cas系统功能包括单个基因敲除。在某些实施方式中,CRISPR-Cas系统功能包括多个基因敲除。在某些实施方式中,CRISPR-Cas系统功能包括基因校正。在某些实施方式中,CRISPR-Cas系统功能包括单基因校正。在某些实施方式中,CRISPR-Cas系统功能包括多基因校正。在某些实施方式中,CRISPR-Cas系统功能包括基因组区域校正。在某些实施方式中,CRISPR-Cas系统功能包括单基因组区域校正。在某些实施方式中,CRISPR-Cas系统功能包括多基因组区域校正。在某些实施方式中,CRISPR-Cas系统功能包括基因缺失。在某些实施方式中,CRISPR-Cas系统功能包括单基因缺失。在某些实施方式中,CRISPR-Cas系统功能包括多基因缺失。在某些实施方式中,CRISPR-Cas系统功能包括基因组区域缺失。在某些实施方式中,CRISPR-Cas系统功能包括单基因组区域缺失。在某些实施方式中,CRISPR-Cas系统功能包括多基因组区域缺失。在某些实施方式中,CRISPR-Cas系统功能包括基因或基因组区功能的调节。在某些实施方式中,CRISPR-Cas系统功能包括单基因或基因组区域功能的调节。在某些实施方式中,CRISPR-Cas系统功能包括多基因或基因组区域功能的调节。在某些实施方式中,CRISPR-Cas系统功能包括基因或基因组区域功能,例如基因或基因组区域活性。在某些实施方式中,CRISPR-Cas系统功能包括单基因或基因组区域功能,例如基因或基因组区域活性。在某些实施方式中,CRISPR-Cas系统功能包括多基因或基因组区域功能,例如基因或基因组区域活性。在某些实施方式中,CRISPR-Cas系统功能包括调节基因活性或可及性,任选地导致转录的和/或表观遗传的基因或基因组区域激活或者基因或基因组区域沉默。在某些实施方式中,CRISPR-Cas系统功能包括调节单基因活性或可接近性,任选地导致转录的和/或表观遗传的基因或基因组区域激活或者基因或基因组区域沉默。在某些实施方式中,CRISPR-Cas系统功能包括调节多基因活性或可接近性,任选地导致转录的和/或表观遗传的基因或基因组区域激活或者基因或基因组区域沉默。
如本文所述的方法可以进一步涉及选择CRISPR-Cas系统递送模式。在某些实施方式中,递送和待递送gRNA(如果需要和在需要的情况下,和tracr,任选地作为sgRNA提供)和/或CRISPR效应蛋白。在某些实施方式中,递送和待递送gRNA(如果需要和在需要的情况下,和tracr,任选地作为sgRNA提供)和/或CRISPR效应子mRNA。在某些实施方式中,递送和待递送gRNA(如果需要和在需要的情况下,和tracr,任选地作为sgRNA提供)和/或以基于DNA的表达系统提供的CRISPR效应子。在某些实施方式中,个体CRISPR-Cas系统组分的递送包括上述递送模式的组合。在某些实施方式中,递送包括递送gRNA和/或CRISPR效应蛋白、递送gRNA和/或CRISPR效应子mRNA,或递送gRNA和/或作为基于DNA的表达系统的CRISPR效应子。
因此,在一个方面,本发明涉及如本文所述的方法,所述方法包括选择一种或多种(治疗性)靶标,选择CRISPR-Cas系统功能,选择CRISPR-Cas系统递送模式,和优化选择的与CRISPR-Cas系统和/或其功能相关的参数或变量。
如本文所述的方法可以进一步涉及选择CRISPR-Cas系统递送载体和/或表达系统。递送载体和表达系统在本文其他地方描述。举例来说,核酸和/或蛋白质的递送载体包括纳米颗粒、脂质体等。用于DNA的递送载体(例如基于DNA的表达系统)包括例如基因枪、基于病毒的载体系统(例如腺病毒、AAV、慢病毒)。本领域技术人员将理解,对递送模式以及递送载体或表达系统的选择可以取决于例如待靶向的细胞或组织。在某些实施方式中,用于递送CRISPR-Cas系统或其组分的递送载体和/或表达系统包括脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统。
因此,在一个方面,本发明涉及如本文所述的方法,所述方法包括选择一种或多种(治疗性)靶标,选择CRISPR-Cas系统功能,选择CRISPR-Cas系统递送模式,选择CRISPR-Cas系统递送载体或表达系统,和优化选择的与CRISPR-Cas系统和/或其功能相关的参数或变量。
如本文的方法中对选择的参数或变量进行优化可以导致优化或改进的CRISPR-Cas系统(例如基于CISPR-Cas系统的疗法或治疗剂)、特异性、功效和/或安全性。在某些实施方式中,在如本文所述的本发明的方法中,考虑、选择或优化以下参数或变量中的一个或多个:CRISPR效应特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度、CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起(budge)耐受性、CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应蛋白尺寸、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
在某些实施方式中,选择一种或多种CRISP-Cas系统功能包括选择一种或多种最佳效应蛋白、最佳指导RNA或两者。
在某些实施方式中,选择最佳效应蛋白包括优化一种或多种效应蛋白的类型、尺寸、PAM特异性、效应蛋白稳定性、免疫原性或毒性、功能特异性和功效,或在本文其他地方所述的与CRISPR效应相关的其他参数或变量。
在某些实施方式中,效应蛋白是天然存在的或经修饰的效应蛋白。
在某些实施方式中,经修饰的效应蛋白是切口酶、脱氨酶或失活的效应蛋白。
在某些实施方式中,优化尺寸包括选择具有最小尺寸的蛋白效应子。
在某些实施方式中,优化PAM特异性包括选择具有经修饰的PAM特异性的效应蛋白。
在某些实施方式中,优化效应蛋白稳定性包括选择具有短半衰期,同时保持足够活性的效应蛋白,例如通过选择具有特定半衰期或稳定性的合适的CRISPR效应子直系同源物。
在某些实施方式中,优化免疫原性或毒性包括通过蛋白质修饰使效应蛋白免疫原性或毒性最小化。
在某些实施方式中,优化功能特异性包括选择效应蛋白,所述效应蛋白具有在指导RNA和一个或多个靶基因座之间降低的错配和/或凸起的耐受性。
在某些实施方式中,优化功效包括优化总体效率、表观遗传耐受性或两者。
在某些实施方式中,使总体效率最大化包括选择对不同染色质复杂性的靶基因座具有均一酶活性的效应蛋白、选择具有限于开放染色质可及性区域的酶活性的效应蛋白。
在某些实施方式中,使用ATAC-seq或DNA-邻近连接测定法中的一种或多种测量染色质可及性。
在某些实施方式中,优化表观遗传耐受性包括优化甲基化耐受性、表观遗传标志竞争或两者。
在某些实施方式中,优化甲基化耐受性包括选择修饰甲基化DNA的效应蛋白。
在某些实施方式中,优化表观遗传耐受性包括选择不能修饰染色体沉默区域的效应蛋白、选择能够修饰染色体沉默区域的效应蛋白,或选择不富集表观遗传标志物的靶基因座。
在某些实施方式中,选择经优化的指导RNA包括优化gRNA稳定性、gRNA免疫原性或两者,或本文其他地方所述的与gRNA相关的其他参数或变量。
在某些实施方式中,优化gRNA稳定性和/或gRNA免疫原性包括RNA修饰,或本文其他地方所述的与gRNA相关的其他参数或变量。在某些实施方式中,修饰包括从gRNA的靶互补区的3’末端移除1-3个核苷酸。在某些实施方式中,修饰包括延伸的gRNA和/或反式RNA/DNA元件,其在gRNA中产生稳定结构,其与脱靶基因座的靶标处的gRNA碱基配对竞争,或在gRNA和靶序列之间的延伸的互补核苷酸,或两者。
在某些实施方式中,递送模式包括递送gRNA和/或CRISPR效应蛋白、递送gRNA和/或CRISPR效应mRNA,或递送gRNA和/或作为基于DNA的表达系统的CRISPR效应子。在某些实施方式中,递送模式还包括从脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统选择递送载体和/或表达系统。在某些实施方式中,表达是通过选择条件型和/或诱导型表达系统来优化的时空表达,包括可控的CRISPR效应子活性、任选地去稳定的CRISPR效应子和/或分裂的CRISPR效应子,和/或细胞或组织特异性表达系统。
本文其他地方描述了上述参数或变量以及用于优化的手段。通过实例而非限制,参数或变量的优化可以如下实现。CRISPR效应子特异性可以通过选择最特异性的CRISPR效应子来优化。这可以例如通过选择最特异性的CRISPR效应子直系同源物或通过增加特异性的特定CRISPR效应子突变来实现。gRNA特异性可以通过选择最特异性的gRNA来优化。这可以例如通过选择具有低同源性(即至少一个或优选多个,例如至少2个,或优选至少3个与脱靶位点的错配)的gRNA来实现。CRISPR-Cas复合物特异性可以通过如上增加CRISPR效应子特异性和/或gRNA特异性来优化。PAM限制性可以通过选择具有最限制性的PAM识别的CRISPR效应子来优化。这可以例如通过选择具有更限制性的PAM识别的CRISPR效应子直系同源物或通过增加或改变PAM限制性的特定CRISPR效应子突变来实现。PAM类型可以通过选择合适的CRISPR效应子(例如,识别期望的PAM类型的合适的CRISPR效应子)来优化。CRISPR效应子或PAM类型可以是天然存在的,或者可以例如基于具有改变的PAM识别或PAM识别集的CRISPR效应子突变体来优化。PAM核苷酸含量可以例如通过选择合适的CRISPR效应子(例如识别期望的PAM核苷酸含量的合适的CRISPR效应子)来优化。CRISPR效应子或PAM类型可以是天然存在的,或者可以例如基于具有改变的PAM识别或PAM识别集的CRISPR效应子突变体来优化。PAM长度可以例如通过选择合适的CRISPR效应子(例如识别期望PAM核苷酸长度的合适的CRISPR效应子)来优化。CRISPR效应子或PAM类型可以是天然存在的,或者可以例如基于具有改变的PAM识别或PAM识别集的CRISPR效应子突变体来优化。靶标长度或靶序列长度可以例如通过选择合适的CRISPR效应子(例如识别期望靶标或靶序列核苷酸长度的合适的CRISPR效应子)来优化。替代地或另外地,靶(序列)长度可以通过提供具有从通常与CRISPR效应子(例如天然存在的CRISPR效应子)相关的靶(序列)长度偏离的长度的靶标来优化。CRISPR效应子或靶(序列)长度可以是天然存在的,或者可以例如基于具有改变的靶(序列)长度识别或靶(序列)长度识别集的CRISPR效应子突变体来优化。例如,增加或减少靶(序列)长度可以影响靶标识别和/或脱靶识别。CRISPR效应子活性可以通过选择最具有活性的CRISPR效应子来优化。这可以例如通过选择最具有活性的CRISPR效应子直系同源物或通过增加活性的特定CRISPR效应子突变来实现。CRISPR效应蛋白到达具有高染色质可及性的区域的能力可以通过选择合适的CRISPR效应子或其突变体来优化,并且可以考虑CRISPR效应子的尺寸、电荷或其他维度的变量等。均一CRISPR效应子活性的程度可以通过选择合适的CRISPR效应子或其突变体来优化,并且可以考虑CRISPR效应子的特异性和/或活性、PAM特异性、靶长度、错配耐受性、表观遗传耐受性、CRISPR效应子和/或gRNA稳定性和/或半衰期、CRISPR效应子,和/或gRNA免疫原性和/或毒性等。gRNA活性可以通过选择最具有活性的gRNA来优化。这可以例如通过通过RNA修饰增加gRNA稳定性来实现。CRISPR-Cas复合物活性可以通过如上增加CRISPR效应子活性和/或gRNA活性来优化。靶位点选择可以通过选择基因、基因座或其他基因组区域内的靶位点的最佳位置来优化。靶位点选择可以通过优化靶位置来优化,其包括具有低变异性的基因、基因座或其他基因组区域的靶序列。这可以例如通过选择早期和/或保守外显子或结构域中的靶位点(即具有群体内的低变异性,例如多态性)来实现。或者,靶位点可以通过最小化脱靶效应(例如,脱靶限定为与靶标相比具有1-5、1-4或优选1-3个错配和/或具有一个或多个PAM错配(例如,远端PAM错配))来选择,优选还考虑群体内的变异性。CRISPR效应子稳定性可以通过选择具有合适半衰期,例如优选短半衰期,同时仍能够保持足够活性的CRISPR效应子来优化。这可以例如通过选择具有特定半衰期的合适的CRISPR效应子直系同源物或通过影响半衰期或稳定性的特定CRISPR效应子突变或修饰(例如,包含(例如融合)稳定或去稳定结构域或序列)。CRISPR效应子mRNA稳定性可以通过增加或减少CRISPR效应子mRNA稳定性来优化。这可以例如通过通过mRNA修饰增加或减少CRISPR效应子mRNA稳定性来实现。gRNA稳定性可以通过增加或减少gRNA稳定性来优化。这可以例如通过通过RNA修饰增加或减少gRNA稳定性来实现。CRISPR-Cas复合物稳定性可以通过如上增加或减少CRISPR效应子稳定性和/或gRNA稳定来优化。CRISPR效应蛋白或mRNA的免疫原性或毒性可以通过降低CRISPR效应蛋白或mRNA的免疫原性或毒性来优化。这可以例如通过mRNA或蛋白质修饰来实现。类似地,在基于DNA的表达系统的情形中,可以降低DNA免疫原性或毒性。gRNA免疫原性或毒性可以通过降低gRNA免疫原性或毒性来优化。这可以例如通过gRNA修饰来实现。类似地,在基于DNA的表达系统的情形中,可以降低DNA免疫原性或毒性。CRISPR-Cas复合物免疫原性或毒性可以通过如上降低CRISPR效应子免疫原性或毒性和/或gRNA免疫原性或毒性,或通过选择最小免疫原性或毒性的CRISPR效应子/gRNA组合来优化。类似地,在基于DNA的表达系统的情形下,可以降低DNA免疫原性或毒性。CRISPR效应蛋白或mRNA剂量或滴度可以通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化。gRNA剂量或滴度可以通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化。CRISPR-Cas复合物剂量或滴度可以通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化。CRISPR效应蛋白尺寸可以通过选择最小的蛋白质尺寸以提高递送效率来优化,特别是对于病毒介导的递送。CRISPR效应子、gRNA或CRISPR-Cas复合物表达水平可以通过限制(或延长)表达的持续时间和/或限制(或增加)表达水平来优化。这可以例如通过使用自失活的CRISPR-Cas系统(例如,包括自靶向(例如,CRISPR效应子靶向)gRNA),通过使用具有有限的表达持续时间的病毒载体,通过使用低(或高)表达水平的合适启动子,通过组合用于个体CRISP-Cas系统组分的不同递送方法,例如病毒介导的CRISPR效应子编码核酸的递送与非病毒介导的gRNA的递送组合,或病毒介导的gRNA递送与非病毒介导的CRISPR效应蛋白或mRNA递送组合。CRISPR效应子、gRNA或CRISPR-Cas复合物时空表达可以通过对条件型和/或诱导型表达系统的合适选择来优化,包括可控的CRISPR效应子活性、任选地去稳定的CRISPR效应子,和/或分裂的CRISPR效应子和/或细胞或组织特异性表达系统。
在一个方面,本发明涉及如本文所述的方法,其包括选择一种或多种(治疗性)靶标,选择CRISPR-Cas系统功能,选择CRISPR-Cas系统递送模式,选择CRISPR-Cas系统递送载体或表达系统,和对选择的与CRISPR-Cas系统和/或其功能相关的参数或变量进行优化,任选地其中参数或变量为选自CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度、CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性、CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应蛋白尺寸、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达中的一个或多个。
在一个方面,本发明涉及如本文所述的方法,其包括任选地,选择一种或多种(治疗性)靶标,任选地,选择一种或多种CRISPR-Cas系统功能,任选地,选择一种或多种CRISPR-Cas系统递送模式,任选地,选择一种或多种CRISPR-Cas系统递送载体或表达系统,和对选择的与CRISPR-Cas系统和/或其功能相关的参数或变量进行优化,其中对特异性、功效和/或安全性进行优化,并且任选地其中对特异性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度,其中对功效进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、CRISPR效应蛋白大小、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性,和其中对安全性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
在一个方面,本发明涉及一种如本文所述的方法,其包括选择一种或多种(治疗性)靶标,选择一种或多种CRISPR-Cas系统功能,选择一种或多种CRISPR-Cas系统递送模式,选择一种或多种CRISPR-Cas系统递送载体或表达系统,和对选择的与CRISPR-Cas系统和/或其功能相关的参数或变量进行优化,其中对特异性、功效和/或安全性进行优化,并且任选地其中对特异性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度;其中对功效进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、CRISPR效应蛋白尺寸、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性;和其中对安全性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
在一个方面,本发明涉及一种如本文所述的方法,其包括对选择的与CRISPR-Cas系统和/或其功能相关的参数或变量进行优化,其中对特异性、功效和/或安全性进行优化,和任选地其中对特异性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度,其中对功效进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、CRISPR效应蛋白尺寸、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性,和其中对安全性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
应当理解,待优化的参数或变量以及优化的性质可取决于(治疗性)靶标、CRISPR-Cas系统功能、CRISPR-Cas系统递送模式和/或CRISPR-Cas系统递送载体或表达系统。
在一个方面,本发明涉及一种如本文所述的方法,其包括在群体水平上优化gRNA特异性。优选地,所述对gRNA特异性进行优化包括使群体中的gRNA靶位点序列变异最小化和/或使群体中的gRNA脱靶发生率最小化。
在一个方面,本发明涉及一种用于开发或设计CRISPR-Cas系统(任选地基于CRISPR-Cas系统的疗法或治疗剂)的方法,其包括(a)为感兴趣(治疗)基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,和从所述选择的靶位点中(亚)选择靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,或(b)为感兴趣(治疗)基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,或为感兴趣(治疗)基因座选择gRNA靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,和任选地估计治疗或以其他方式调节或操控群体所需要的(亚)选择的靶位点的数量,
任选地针对个体受试者验证(亚)选择的靶位点中的一个或多个,任选地设计识别(亚)选择的靶位点中的一个或多个的一种或多种gRNA。
在一个方面,本发明涉及一种用于开发或设计gRNA以用于CRISPR-Cas系统(任选地基于CRISPR-Cas系统的疗法或治疗剂)的方法,其包括
(a)为感兴趣(治疗)基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,和从所述选择的靶位点中(亚)选择靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,或(b)为感兴趣(治疗)基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,或为感兴趣(治疗)基因座选择gRNA靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,和任选地估计治疗或以其他方式调节或操控群体所需要的(亚)选择的靶位点的数量,任选地针对个体受试者验证(亚)选择的靶位点中的一个或多个,任选地设计识别(亚)选择的靶位点中的一个或多个的一种或多种gRNA。
在一个方面,本发明涉及一种用于开发或设计群体中的CRISPR-Cas系统(任选地基于CRISPR-Cas系统的疗法或治疗剂)的方法,其包括(a)为感兴趣(治疗)基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,和从所述选择的靶位点中(亚)选择靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,或(b)为感兴趣(治疗)基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,或为感兴趣(治疗)基因座选择gRNA靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,和任选地估计治疗或以其他方式调节或操控群体所需要的(亚)选择的靶位点的数量,任选地针对个体受试者验证(亚)选择的靶位点中的一个或多个,任选地设计识别(亚)选择的靶位点中的一个或多个的一种或多种gRNA。
在一个方面,本发明涉及一种用于开发或设计用于群体中的CRISPR-Cas系统(任选地基于CRISPR-Cas系统的疗法或治疗剂)的gRNA的方法,其包括(a)为感兴趣的基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,和从所述选择的靶位点中(亚)选择靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,或(b)为感兴趣(治疗)基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,或为感兴趣(治疗)基因座选择gRNA靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,和任选地估计治疗或以其他方式调节或操控群体所需要的(亚)选择的靶位点的数量,任选地针对个体受试者验证(亚)选择的靶位点中的一个或多个,任选地设计识别(亚)选择的靶位点中的一个或多个的一种或多种gRNA。
在另一个方面,本发明涉及一种用于开发或设计CRISPR-Cas系统,例如基于CRISPR-Cas系统的疗法或治疗剂,任选地在群体中,或用于开发或设计用于CRISPR-Cas系统(任选地基于CRISPR-Cas系统的疗法或治疗剂,任选地在群体中)的gRNA的方法,其包括:针对目标群体中的一个或多个基因座选择靶序列组,其中所述靶序列不含在所述目标群体中以高于阈值等位基因频率出现的变体(即铂靶序列);从所述选择的(铂)靶序列去除任何具有高频脱靶候选者的靶序列(相对于该组中的其他(铂)靶)以定义最终靶序列组;基于所述最终靶序列组制备一个或多个CRISPR-Cas系统,例如CRISPR-Cas系统组,任选地其中制备的许多CRISP-Cas系统(至少部分地)基于目标群体的大小。
在某些实施方式中,使用基于测序的双链断裂(DSB)检测测定法(例如本文其他地方所述)鉴定或确定脱靶候选者/脱靶、PAM限制性、靶切割效率或效应蛋白特异性。在一些实施方式中,使用基于测序的双链断裂(DSB)检测测定法(例如本文其他地方所述)鉴定或确定脱靶候选者/脱靶。在某些实施方式中,脱靶或脱靶候选者具有至少1个、优选1-3个错配或(远端)PAM错配,例如1或多个,例如1、2、3或更多个(远端)PAM错配。在某些实施方式中,基于测序的双链断裂(DSB)检测测定法包括如本文其他地方所述用包含引物结合位点的衔接子标记DSB的位点、用条形码或独特分子标识符标记DSB的位点,或其组合。
应当理解,gRNA的指导序列与靶位点100%互补,即,不包含与靶位点的任何错配。将进一步理解,gRNA“识别”(脱)靶位点以CRISPR-Cas系统的功能为先决条件,即,如果gRNA与(脱)靶位点的结合导致CRISPR-Cas系统活性(例如单链或双链DNA切割、转录调节等的诱导),则(脱)靶位点只被gRNA识别。
在某些实施方式中,具有在群体中最小的序列变异的靶位点的特征在于在所述群体的至少99%,优选至少99.9%,更优选至少99.99%中不存在序列变异。在某些实施方式中,优化靶位置包括选择在群体的至少99%,优选至少99.9%,更优选99.99%中不存在序列变异的靶序列或靶基因座。这些靶标在本文其他地方也称为“铂靶标”。在某些实施方式中,群体包括至少1000个个体,例如至少5000个个体,例如至少10000个个体,例如至少50000个个体。
在某些实施方式中,脱靶位点的特征在于脱靶位点和gRNA之间的至少一个错配。在某些实施方式中,脱靶位点的特征在于脱靶位点和gRNA之间的最多5个,优选最多4个,更优选最多3个错配。在某些实施方式中,脱靶位点的特征在于脱靶位点和gRNA之间的至少一个错配,和脱靶位点和gRNA之间的最多5个,优选最多4个,更优选最多3个错配。
在某些实施方式中,为群体中的高频单倍型确定群体中的脱靶位点的最小数量。在某些实施方式中,为群体中的脱靶位点基因座的高频单倍型确定群体中的脱靶位点的最小数量。在某些实施方式中,为群体中的脱靶位点基因座的高频单倍型确定群体中的脱靶位点的最小数量。在某些实施方式中,高频单倍型的特征在于在群体的至少0.1%中出现。
在某些实施方式,基于低频序列变异,例如在大规模测序数据集中捕获的低频序列变异,估计治疗群体所需要的亚(选择)靶位点的数量。在某些实施方式中,估计治疗给定大小的群体所需要的(亚)选择的靶位点的数量。
在某些实施方式中,方法还包括获得待治疗的受试者的基因组测序数据;和用选自CRISPR-Cas系统组的CRISPR-Cas系统治疗受试者,其中选择的CRISPR-Cas系统是(至少部分地)基于个体的基因组测序数据。
在某些实施方式中,通过基因组测序,优选全基因组测序,验证((亚)选择)的靶标。
在某些实施方式中,基于一个或多个参数的优化(进一步)选择本文所述的靶序列或基因座,所述一个或多个参数包括PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度、靶序列长度、PAM限制性、靶切割效率和基因、基因座或其他基因组区域内的靶序列位置。
在某些实施方式中,基于对靶基因座位置、靶标长度、靶标特异性和PAM特征中的一个或多个进行优化(进一步)选择本文所述的靶序列或基因座。如本文所使用的,PAM特性可以包括例如PAM序列、PAM长度和/或PAM GC含量。在某些实施方式中,优化PAM特征包括优化PAM的核苷酸含量。在某些实施方式中,优化PAM的核苷酸含量是选择具有基序的PAM,所述基序使一个或多个靶基因座中的丰度最大化、使突变频率最小化,或两者。使突变频率最小化可以例如通过选择没有或具有低或最小CpG的PAM序列。
在某些实施方式中,基于一个或多个参数的优化选择CRISPR-Cas系统组中的每个CRISPR-Cas系统的效应蛋白,所述一个或多个参数选自效应蛋白尺寸、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性、效应蛋白特异性、效应蛋白稳定性或半衰期、效应蛋白免疫原性或毒性。
在某些实施方式中,优化靶标(序列)的长度包括选择在一个或多个靶基因座内5至25个核苷酸之间的靶序列。在某些实施方式中,靶序列是20个核苷酸。
在某些实施方式中,优化靶标的特异性包括选择使脱靶候选者最小化的靶基因座。
在某些实施方式中,gRNA是tru gRNA、护送的gRNA或受保护的gRNA。
应当理解的是,如本文所述的根据本发明的CRISPR-Cas系统,例如如本文所述的用于根据本发明的方法的CRISPR-Cas系统,可以适当地用于对于CRISPR-Cas系统已知的任何类型的应用,优选在真核生物中。在某些方面,应用是治疗的,优选在真核生物中治疗,例如包括但不限于动物(包括人)、植物、藻类、真菌(包括酵母)等。替代地或另外地,在某些方面,应用可涉及实现或诱导一种或多种特定性状或特征,例如基因型和/或表型性状或特征,如本文其他地方所述。
对于如本文所述的本发明,在优化相应参数或变量时可以考虑以下标准。
CRISPR效应子的选择
1.尺寸:
目前,展示高效哺乳动物基因组编辑的CRISPR单核酸酶效应子的范围为1053个氨基酸(SaCas9)(AsCpf1,1307aa;和LbCpf1,1246)至1368个氨基酸(SpCas9)。虽然Cas9的较小直系同源物确实存在并且在体外高效切割DNA,但是比SaCas9小的Cas9直系同源物显示出降低的哺乳动物DNA切割效率。目前单效应子CRISPR核酸酶的大尺寸对于纳米颗粒蛋白递送和病毒载体递送策略都是具有挑战性的。对于蛋白质递送,每颗粒的有效负载是3D蛋白质尺寸的函数,并且对于单效应子的病毒递送,大基因尺寸限制了多重化或使用大的细胞类型特异性启动子的灵活性。与递送有关的考虑在下文中进一步详细描述。
2.蛋白质搜索:
CRISPR效应子进入具有高染色质复杂性的区域的能力可以通过两种方式来观察:1)这增加了CRISPR效应子作为基因组编辑工具的多功能性;或者2)由于与CRISPR效应子接触的细胞的基因组结构的扰动而导致的细胞失调,这可能是不期望的。
有报道称,最具有活性的Cas9指导是靶向低核小体占位的指导:https://elifesciences.org/content/5/e12677,和https://elifesciences.org/content/5/e13450;然而,在更长的时间范围内,仍然可以发生切割(当移动核小体占位时,切割也可以在复制期间发生)。与Cpf1的选择及其修饰相关的考虑在下文进一步详细描述。
3.功效:
总体效率:对于所有单效应子核酸酶,通常在开放染色质区域中跨基因组靶标的稳健且均一的酶活性是所期望的。另一方面,对于研究和治疗应用而言,具有不同染色质复杂性和表观遗传标记的跨基因组靶标上的稳健且均一的酶活性可以是不期望的。已经显示Cas9显示出对甲基化DNA的强烈切割,并且这增加了该酶的效用。另一方面,CRISPR效应子在富集表观遗传标记的基因座处的结合或切割可以使细胞进程失调。另一个需要考虑的方面是,不干扰染色质结构的酶是否是期望的。如果切割终末分化细胞中的基因座,可以期望的是使用不能穿透基因组沉默区域的酶。或者,当切割分化细胞类型的前体中的基因座时,能够在编辑时穿透基因组的非活性区域可以是有利的。
4.特异性:错配/凸起耐受性:
天然存在的Cas9直系同源物:天然存在的CRISPR效应子显示RNA指导和DNA靶标之间的错配或凸起的耐受性。这种耐受性通常不适用于治疗应用。对于治疗应用,应单独筛选患者以获得完美的靶向指导RNA互补性,并且对凸起和错配的耐受性将只增加脱靶DNA切割的可能性。已经开发了高特异性的工程化变体,例如针对Cas9的eSpCas9和Cas9-HF1;这些变体显示出对DNA靶标与RNA指导之间的错配的耐受性降低(考虑到20nt的指导RNA靶向互补性,与指导RNA的大约PAM远端12-14个核苷酸的错配相关)。
5.PAM选择:
天然PAM相对于经修饰的PAM:迄今为止发现的每种单效应子CRISPR DNA核酸内切酶的靶标需要在靶标的指导RNA互补区域侧翼的原型间隔子邻近基序(PAM)。对于迄今为止发现的DNA核酸内切酶,PAM基序具有至少2个核苷酸的特异性,例如2、3、4、5或更多个核苷酸的特异性,例如2-4或2-5个核苷酸的特异性,这减少了基因组中可被单一天然酶切割的可能靶标的部分。天然存在的DNA核酸内切酶的突变导致具有修饰的PAM特异性的蛋白变体。累积地,对于靶向不同PAM的给定蛋白质,越多这样的变体存在,可用于治疗性设计(参见群体功效)的基因组靶标的密度就越大。
核苷酸含量:由于基因组中或基因组的特定治疗性基因座中的特定基序的丰度的差异,PAM的核苷酸含量可以影响基因组的哪个部分可以被个体蛋白质靶向。另外,核苷酸含量可以影响基因组中的PAM突变频率(参见群体功效)。具有改变的PAM特异性的Cpf1蛋白可以解决该问题(如本文进一步描述的)。
PAM长度/复杂性对靶标特异性的影响:Cas9通过首先结合PAM位点来询问基因组,然后尝试通过解链双链DNA来产生稳定的RNA/DNA双链。由于PAM的复杂性限制了被询问的靶标的可能空间,因此更复杂的PAM将具有更少可能发生脱靶切割的位点。
6.酶的crRNA加工能力:多重:
对于多重,crRNA处理能力是期望的,因为从单个启动子表达的转录物可含有多个不同的crRNA。然后通过蛋白质将该转录物加工成多个组成性crRNA,并对由crRNA指定的每个靶标进行多重编辑。另一方面,RNA核酸内切酶加工多crRNA转录物为crRNAs的规则尚不完全清楚。因此,对于治疗应用,由于对内源RNA转录物的脱靶切割,crRNA加工可以是不期望的。
靶标选择:
1.靶标长度:
尽管在天然存在的Cas9和Cpf1 CRISPR阵列中观察到的大多数原型间隔子元件长于20nt,但是所得crRNA产物的原型间隔子互补区域通常被加工成20nt(Cas9)或不赋予超过20nt的特异性。指导RNA的靶互补区域超过20nt(Cpf1)的延伸可能位于蛋白质在指导RNA上的足迹(footprint)之外,并且通常被外切核酸酶处理掉(进一步讨论参见受保护的指导RNA)。
2.效率筛选:
通过研究使用不同DNA靶标敲低细胞表面蛋白质的功效,已经进行了CRISPR效应子功效的筛选。这些研究显示一些证据表明CRISPR效应子靶标和侧翼核苷酸中的位置依赖性核苷酸含量影响靶切割的功效。
3.特异性筛选:
对全基因组CRISPR核酸酶活性的无偏见研究表明,大多数脱靶活性发生在与RNA指导具有最多三个错配的基因座上。在包含小于3个错配或包含PAM远端错配的基因座更容易被切割的假设下,目前用于CRISPR效应子靶标选择的方法是通过RNA指导错配的数量和位置对在参考人类基因组中发现的脱靶候选者进行排序。然而,在个体的群体中,这种策略由于存在多个单倍型(相关变体的组)而变得复杂,其将在候选脱靶位点处包含不同位置或数量的错配(参见:群体安全性)。
指导RNA设计
多种技术已经被开发来解决功效和特异性的不同方面
1.Tru指导:
从gRNA的靶互补区的3’端修剪掉1-3nt,经常降低含有与指导RNA的至少一个错配的脱靶基因座处的活性。可能的是,在脱靶和gRNA之间的碱基配对的核苷酸较少的情况下,每个错配对于CRISPR效应子-gRNA复合物与脱靶DNA的稳定性具有更大的热力学结果。使用tru指导可以降低成功切割的靶标的百分比:即,20nt指导工作的某些位点可能用17nt指导未有效切割;但17nt工作的那些通常一样有效地切割。
2.受保护的指导:
受保护的指导利用延伸的指导RNA和/或反式RNA/DNA元件以1)在sgRNA中产生稳定的结构,其在靶标或脱靶位点处与sgRNA碱基配对竞争,或2)(任选地)延伸gRNA和靶标之间的互补核苷酸。对于延伸的RNA的实施,二级结构由指导RNA的3’延伸与指导RNA的另一个靶互补区域之间的互补性产生。对于反式的实施,DNA或RNA元件结合延伸或正常长度的指导RNA,部分地隐藏sgRNA的靶互补区域。
剂量
CRISPR组分的剂量应考虑以下因素
1.靶标搜索:CRISPR效应子/指导RNA酶复合物使用三维随机搜索来定位靶标。假设具有相同的基因组可及性,复合物发现脱靶或中靶的概率是相似的。
2.结合(靶标居住时间):
一旦定位,复合物在中靶或具有很少错配的脱靶处的结合动力学仅略微不同。因此,靶标搜索和结合可能不是在中靶或脱靶基因座处进行DNA切割的限速步骤。ChIP数据表明,随着脱靶基因座和RNA指导之间的错配增加,复合物居住时间确实减少,特别是在RNA指导的PAM近端“种子”区域。
3.切割(对假设活性构象的热力学障碍):
CRISPR效应酶活性的主要限速步骤似乎是处于DNA切割的活性构象的靶DNA和指导RNA-蛋白复合物的构型。在脱靶基因座处增加的错配降低了复合物在脱靶基因座处实现活性构型的可能性。
结合和切割之间的差异是为什么ChIP作为评估Cpf1的脱靶切割的工具具有非常低的预测能力。
如果发现脱靶或中靶的可能性相似,那么中靶和脱靶切割速率的差异可能是由于中靶位点上的切割概率大于脱靶位点(见时间控制)。随机搜索意味着Cpf1表明不正确的模型是将Cpf1视为首先优先切割中靶位点,并且只有在中靶切割饱和后才移动到脱靶位点;相反,所有位点都被随机查询,并且在PAM结合后前进至切割的概率是区分中靶相对于脱靶切割的倾向的事物。
4.在个体基因座上DNA修饰的重复:DNA双链断裂的NHEJ修复通常是高保真度的(应该找到确切的错误率)。因此,在NHEJ中的错误导致切割位点处的插入缺失之前,可能的是核酸酶必须多次切割单个基因座。观察到插入缺失的概率是观察到双链断裂的复合概率,其基于1)靶标搜索概率,2)靶标居住时间和3)克服对DNA切割的热力学障碍。
5.酶浓度:即使在非常低的浓度下,搜索仍可能在遇到中靶之前遇到脱靶。此后,脱靶中的错配的数量和位置,以及可能地,靶标的核苷酸含量,将影响DNA切割的可能性。
考虑概率术语中的中/脱靶切割,Cas9或Cpf1与基因组的每次相互作用可以被认为具有一些概率的成功切割。减少剂量将减少可用于与基因组相互作用的效应分子的数量,因此将限制在脱靶位点处重复相互作用的加性概率。
CRISPR系统的时间和空间控制
已经开发了各种技术,其为解决功效、特异性和安全性问题提供了另外的选择。更特别是,这些选择可用于允许时间控制。更特别是,这些技术允许时间/空间控制(如本文进一步描述):
1.双切口酶
2.护送的指导
3.分裂效应(split-effector)蛋白
4.“自失活”系统或“管理指导”
在下文中,更详细地描述了不同的变量以及它们如何影响基于CRISPR的编辑系统的设计。
特异性-选择最特异性的指导RNA
a.指导特异性
虽然早期的报道在准确预测具有有限脱靶活性的指导RNA的能力上相当矛盾,基于大量数据的统计分析使得有可能发现管理脱靶效应的规则。Doench等(NatBiotechnol.2016Feb;34(2):184-91)描述了数千个sgRNA的脱靶活性的谱图以及用于预测脱靶位点的度量标准的开发。
相应地,在特定实施方式中,本发明的方法涉及选择指导RNA,所述指导RNA基于统计分析不太可能产生脱靶效应。
b.指导互补性
一般设想的是指导序列与其相应的靶序列之间的互补性程度应该尽可能地高,例如大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;然而,在特定的实施方式中,特别关注的是减少脱靶相互作用,例如,减少指导与具有低互补性的靶序列相互作用。已经显示某些突变导致CRISPR-Cas系统能够区分具有高于80%至约95%互补性(例如,83%-84%或88-89%或94-95%互补性(例如,区分具有18个核苷酸的靶标和有18个核苷酸且具有1、2或3个错配的脱靶))的靶序列和脱靶序列。因此,在特定的实施方式中,选择指导使得指导序列与其相应靶序列之间的互补性程度高于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%或100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的序列与指导之间的互补性,有利的是,脱靶是100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的序列与指导之间的互补性。
c.选择指导/酶浓度
对于毒性和脱靶效应的最小化,控制递送的Cpf1蛋白和指导RNA的浓度是重要的。Cpf1蛋白和指导RNA的最佳浓度可以通过在细胞或非人真核动物模型中测试不同浓度并使用深度测序分析潜在的脱靶基因组基因座的修饰程度来确定。例如,对于在人类基因组的EMX1基因中靶向5’-GAGTCCGAGCAGAAGAAGAA-3’的指导序列,可以使用深度测序来评估在以下两个脱靶基因座1:5’-GAGTCCTAGCAGGAGAAGAA-3’和2:5’-GAGTCTAAGCAGAAGAAGAA-3’处的修饰水平。应选择产生最高中靶修饰水平,同时最小化脱靶修饰水平的浓度用于体内递送。特异性-选择最特异性的酶
a.酶修饰以增强特异性
采用与用于改善Cas9特异性(Slaymaker等2015“Rationally engineeredCas9nucleases with improved specificity”)类似的策略,Cpf1的特异性可以通过对使非靶DNA链稳定的残基突变来进一步改善。这可以在没有晶体结构的情况下通过使用线性结构比对来预测1)Cpf1的哪个结构域与哪条DNA链结合以及2)这些结构域内的哪些残基与DNA接触来完成。
然而,由于Cpf1与已知蛋白的差的保守性,该方法可能是受限的。因此,可能需要探测所有可能的DNA相互作用氨基酸(赖氨酸,组氨酸和精氨酸)的功能。
在整个Cpf1中RuvC结构域中的带正电荷的残基比在Rad50结构域中的那些更保守,表明RuvC残基在进化上较不灵活。这表明在该结构域中需要严格控制核酸结合(相对于Rad50结构域)。因此,由于需要RNA:DNA双链体稳定化(Cas9中的先例),该结构域切割靶DNA链是可能的。此外,在RuvC结构域中存在更多的精氨酸(RuvC的5%残基904至1307对比所提出的Rad50结构域的3.8%),这再次表明RuvC靶向与指导RNA复合的DNA链。精氨酸更多地参与结合核酸主要和次要沟槽(Rohs等Nature(2009):Vol461:1248-1254)。主要/次要沟槽仅存在于双链体中(例如DNA:RNA靶双链体),进一步表明RuvC切割“靶链”。
基于在RuvC和Rad50结构域的结构分析,可以推断出相关结构域在Cpf1中像什么,并推断哪些区域和残基可以与DNA接触。因此,在某些实施方式中,通过一个或多个残基(在RuvC结构域中)的突变修饰酶,包括但不限于参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号的位置R909、R912、R930、R947、K949、R951、R955、K965、K968、K1000、K1002、R1003、K1009、K1017、K1022、K1029、K1035、K1054、K1072、K1086、R1094、K1095、K1109、K1118、K1142、K1150、K1158、K1159、R1220、R1226、R1242和/或R1252。另外地或替代地,在某些实施方式中,通过一个或多个残基(在RAD50中)结构域的突变修饰酶,包括但不限于参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号的位置K324、K335、K337、R331、K369、K370、R386、R392、R393、K400、K404K406、K408、K414、K429、K436、K438、K459、K460、K464、R670、K675、R681、K686、K689、R699、K705、R725、K729、K739、K748和/或K752。
基于关于AsCpf1的这些具体观察,来自其他物种的Cpf1的相似残基可以通过序列比对鉴定。在某些实施方式中,通过突变一个或多个残基修饰Cpf1酶,包括但不限于参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号的位置R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、K1072、K1086、F1103、R1226和/或R1252。在某些实施方式中,通过突变一个或多个残基修饰酶,包括但不限于参考LbCpf1(毛螺菌科细菌ND2006)的氨基酸位置编号的位置R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、R1138、R1165和/或R1252。
b.选择合适的PAM识别
大多数CRISPR效应蛋白的原型间隔子邻近基序(PAM)的要求确保另一个水平的特异性,因为只有在酶的相关基序之前的靶标将被切割。因此,在特定的实施方式中,在可获得的情况下,可能感兴趣的是选择具有严格PAM的效应蛋白以减少脱靶效应。这种效应蛋白可以是Cpf1直系同源物或具有改变的特异性的效应蛋白。
在另一方面,Cpf1效应蛋白的使用可被其原型间隔子邻近基序(PAM)所限制,因为它只能够稳健地切割在该基序之前的靶位点。例如,已经成功用于基因组编辑的氨基酸球菌物种BV3L6(AsCpf1)只能在TTTV原型间隔子相邻基序(PAM)之前切割靶位点,这限制了其实际应用。当广泛的适用性是期望的或者需要多重化时,选择具有不同PAM特异性的效应蛋白可以是令人感兴趣的。同样,这种改变的特异性可以在Cpf1直系同源物中找到;然而,已经发现可以突变Cpf1效应蛋白以改变其PAM特异性。
通过结构引导的饱和诱变筛选进行PAM特异性的修饰以增加Cpf1的靶向范围(Linyi等2016,BioRxiv,http://dx.doi.org/10.1101/091611)。用突变体S542R/K607R和S542R/K548V/N552R工程化AsCpf1的两种变体,其可分别切割具有TYCV/CCCC和TATV PAM的靶位点且在体外和人细胞中具有增强的活性。脱靶活性的全基因组评估表明这些变体保留了高水平的DNA靶向特异性。发现通过提供额外的AsCpf1效应蛋白变体,导致在人基因组的非重复区域中每~8.7bp添加一个切割位点。
本文还设想了其他Cpf1突变体。在特别的实施方式中,使用突变的Cpf1,其中所述突变的Cpf1在位置11、12、13、14、15、16、17、34、36、39、40、43、46、47、50、54、57、58、111、126、127、128、129、130、131、132、133、134、135、136、157、158、159、160、161、162、163、164、165,166、167、168、169、170、171、172、173、174、175、176、177、178、532、533、534、535、536、537、538、539、540、541、542、543,544、545、546、547、548、549、550、551、552、553、554、555、556、565、566、567、568、569、570、571、572、573、574、575、592,593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617,618、619、620、626、627、628、629、630、631、632、633、634、635、636、637、638、642、643、644、645、646、647、648、649,651、652、653、654、655、656、676、679、680、682、683、684、685、686、687、688、689、690、691、692、693、707、711、714、715,716、717、718、719、720、721、722、739、765、768、769、773、777、778、779、780、781、782、783、784、785、786、871、872、873,874、875、876、877、878、879、880、881、882、883、884或1048包含一个或多个突变的氨基酸残基;优选地,在位置130、131、132、133、134、135、136、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、570、571、572、573、595,596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、630、631、632、646、647,648、649、650、651、652、653、683、684、685、686、687、688、689或690处的一个或多个突变氨基酸残基;更优选在AsCpf1的539、542、547、548、550、551、552、167、604和/或607或AsCpf1直系同源物、同源物或变体的相应位置的一个或多个突变氨基酸残基,优选地,在位置542或542和607处的突变的氨基酸残基,其中所述突变优选为542R和607R,例如S542R和K607R;或优选在位置542和548(和任选地552)处突变的氨基酸残基,其中所述突变优选为542R和548V(和任选的552R),例如S542R和K548V(和任选的N552R);或者在LbCpf1的532、538、542和/或595,或AsCpf1直系同源物、同源物或变体的相应位置,优选在532或532和595位的突变的氨基酸残基,其中所述突变优选为532R和595R,例如G532R和K595R;或优选在位置532和538(和任选地542)处的突变的氨基酸残基,其中所述突变优选为532R和538V(和任选地542R),例如G532R和K538V(和任选的Y542R)。
因此,这些变体增加靶向范围,从而提供对CRISPR/Cas基因组工程化工具箱的有用补充。同时,具有替代性PAM特异性的Cas9效应蛋白的提供允许选择对特定靶序列具有最佳特异性的特定变体。
减少脱靶效应的系统方法:
a.双切口酶
可替代地,为了最小化毒性和脱靶效应的水平,Cpf1切口酶可与靶向感兴趣位点的指导RNA对一起使用。使毒性和脱靶效应最小化的指导序列和策略可以如WO2014/093622(PCT/US2013/074667)中所述;或者,通过本文所述的突变。
因此,本发明设想使用两个或更多个切口酶的方法,特别是双重或双切口酶的方法。在一些方面和实施方式中,可递送单一类型的FnCpf1、AsCpf1或LbCpf1切口酶,例如本文所述的经修饰的FnCpf1、AsCpf1或LbCpf1或者经修饰的FnCpf1、AsCpf1或LbCpf1切口酶。这导致靶DNA被两个FnCpf1切口酶结合。此外,还设想可以使用不同的直系同源物,例如,在DNA的一条链(例如,编码链)上的FnCpf1、AsCpf1或LbCpf1切口酶,和在非编码或相反的DNA链上的直系同源物。直系同源物可以是,但不限于,Cpf1切口酶,例如AsCpf1切口酶或LbCpf1切口酶或FnCpf1切口酶。使用两种不同的直系同源物可以是有利的,所述两种直系同源物需要不同的PAM并且还具有不同的指导要求,从而允许用户进行更大程度的控制。在某些实施方式中,DNA切割将涉及至少四种类型的切口酶,其中每种类型被指导至靶DNA序列的不同序列,其中每个对引入第一切口至一条DNA链,并且引入第二切口至第二条DNA链。在这样的方法中,将至少两对单链断裂引入靶DNA,其中在引入第一和第二对单链断裂后,切除第一和第二对单链断裂之间的靶序列。在某些实施方式中,直系同源物之一或两者是可控制的,即可诱导的。
b.护送的指导
本文提供的方法还可以涉及护送的Cpf1 CRISPR-Cas系统或复合物的使用,特别是涉及护送的Cpf1 CRISPR-Cas系统指导的这样的系统。“护送的”是指Cpf1 CRISPR-Cas系统或复合物或指导被递送至细胞内的选择时间或地点,使得Cpf1 CRISPR-Cas系统或复合物或指导的活性在空间或时间上受控。例如,Cpf1 CRISPR-Cas系统或复合物或指导的活性和目的地可以通过护送RNA适体序列控制,所述护送RNA适体序列对适体配体(例如,细胞表面蛋白或其他局部细胞组分)具有结合亲和力。或者,护送适体可以例如响应于细胞上或细胞内的适体效应子,例如瞬时效应子,例如在特定时间施加于细胞的外部能量源。护送的指导的原理及其实施方式在WO2016094874中详细描述,通过引用并入本文。
适体是可被设计或选择以与其它配体紧密结合的生物分子,例如,使用称为通过指数富集的配体的系统进化的技术(SELEX;Tuerk C,Gold L:“Systematic evolution ofligands by exponential enrichment:RNA ligands to bacteriophage T4DNApolymerase.”Science 1990,249:505-510)。核酸适体可以例如选自随机序列寡核苷酸库,具有对广泛的生物医学相关靶标的高结合亲和力和特异性,这表明适体的广泛治疗用途(Keefe,Anthony D.,Supriya Pai,and Andrew Ellington."Aptamers astherapeutics."Nature Reviews Drug Discovery 9.7(2010):537-550)。这些特征也表明适体作为药物递送载体的广泛用途(Levy-Nissenbaum,Etgar,等"Nanotechnology andaptamers:applications in drug delivery."Trends in biotechnology 26.8(2008):442-449;和Hicke BJ,Stephens AW.“Escort aptamers:a delivery service fordiagnosis and therapy.”J Clin Invest 2000,106:923-928)。适体也可以被构建为作为分子开关发挥功能,通过改变性质而响应于队列(que),例如结合荧光团以模拟绿色荧光蛋白的活性的RNA适体(Paige,Jeremy S.,Karen Y.Wu和Samie R.Jaffrey.“RNA mimics ofgreen luorescent protein”Science333.6042(2011):642-646)。还有人提出,适体可用作靶向siRNA治疗递送系统的组分,例如靶向细胞表面蛋白(Zhou,Jiehua,and JohnJ.Rossi."Aptamer-targeted cell-specific RNA interference."Silence 1.1(2010):4)。在这方面使用的适体被设计用于改善gRNA递送,包括跨越细胞膜递送至细胞内区室,或至细胞核中。这样的结构可以包含(除了一个或多个适体之外或没有这样的一个或多个适体)一个或多个部分,以便使指导可递送、可诱导或响应于选择的效应子。在特定的实施方式中,gRNA被设计以响应于正常或病理生理条件,包括但不限于pH、缺氧、O2浓度、温度、蛋白质浓度、酶浓度、脂质结构、光照、机械破坏(例如,超声波)、磁场、电场或电磁辐射。因此,在特定的实施方式中,护送适体对细胞上或细胞内的适体配体具有结合亲和力,或护送适体对细胞上或细胞内的局部适体效应子有响应,其中存在于细胞上或细胞内的适体配体或效应子在空间或时间受到限制。
一旦引入了预期的改变,例如通过编辑细胞的基因组中的基因的预期拷贝,则该细胞中的持续的CRISPR/Cpf1表达不再是必要的。实际上,在某些情况下如果发生非预期的基因组位点处的脱靶效等,持续的表达是不期望的。因此,时间限制的表达是令人感兴趣的。
诱导型表达提供一种方法,但是此外,申请人已经工程化了自失活Cpf1 CRISPR-Cas系统,其依赖于CRISPR载体本身内的非编码指导靶序列的使用。因此,表达开始后,CRISPR系统将导致其自身的破坏,但在破坏完成之前,它将有时间编辑靶基因的基因组拷贝(其在二倍体细胞中的正常点突变下,需要最多两次编辑)。简单地说,自失活Cpf1CRISPR-Cas系统包括靶向CRISPR酶本身的编码序列或靶向与独特序列互补的一种或多种非编码指导靶序列的额外RNA(即,指导RNA),所述独特序列存在于以下的一种或多种:(a)在驱动非编码RNA元件表达的启动子内,(b)在驱动Cpf1基因表达的启动子内,(c)在Cpf1编码序列中的ATG翻译起始密码子的100bp内,(d)在病毒递送载体的反向末端重复(iTR)内,例如AAV基因组中。
诱导型系统的实例是光响应型系统。通过隐花色素-2和CIB1的活化和结合实现诱导型系统的光响应性。蓝光刺激诱导隐花色素-2的激活构象变化,导致其结合配偶体CIB1的招募。这种结合是快速且可逆的,在脉冲刺激后在<15秒内达到饱和并且在刺激结束后<15分钟返回基线。这些快速结合动力学导致仅被转录/翻译和转录体/蛋白质降解的速度时间上约束的系统,而不是诱导剂的摄取和清除。隐花色素-2激活也是高度敏感的,允许使用低光强刺激并减轻光毒性的风险。此外,在例如完整的哺乳动物大脑的上下文中,可变光强度可用于控制刺激区域的大小,允许比单独的载体递送可提供的更高的精确度。
在特定的实施方式中,例如电磁辐射、声能或热能的能量源可以引发指导。有利地,电磁辐射是可见光的组分。在优选的实施方式中,光是波长为约450至约495nm的蓝光。在特别优选的实施方式中,波长为约488nm。在另一个优选实施方式中,光刺激是通过脉冲进行的。光功率的范围可以是约0-9mW/cm2。在优选的实施方式中,低至每15秒0.25秒的刺激范例应导致最大的激活。
在特定的实施方式中,系统是化学诱导型的。化学诱导型系统的示例性设计包括:1.由脱落酸(ABA)诱导的基于ABI-PYL的系统(参见,例如,http://stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2),2.由雷帕霉素(或基于雷帕霉素的相关化学物质)诱导的基于FKBP-FRB的系统(参见,例如,http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html),3.由Gibberellin(GA)诱导的基于GID1-GAI的系统(参见,例如,http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。另一种化学诱导型系统是基于雌激素受体(ER)的系统,其由4-羟基三苯氧胺(4OHT)诱导(参见,例如,http://www.pnas.org/content/104/3/1027.abstract)。雌激素受体的突变配体结合结构域称为ERT2,在结合4-羟基三苯氧胺后易位到细胞核中。在本发明的另外的实施方式中,任何核受体、甲状腺激素受体、视黄酸受体、雌激素受体、雌激素相关受体、糖皮质激素受体、孕酮受体、雄激素受体的任何天然存在的或工程化的衍生物可用于与基于ER的诱导型系统类似的诱导型系统中。
在特定的实施方式中,化学诱导型系统是基于亚细胞定位的变化。多肽可包含DNA结合结构域,所述DNA结合结构域包含至少五种或更多种转录激活子样效应物(TALE)单体和至少一种或多种半单体,其特定地排列以靶向与至少一个或多个效应子结构域连接的感兴趣的基因组基因座,所述效应子结构域进一步连接至化学或能量敏感蛋白质。在化学或能量转移结合到化学或能量敏感蛋白质上时,该蛋白质将导致整个多肽的亚细胞定位的变化(即整个多肽从细胞质转运到细胞核中)。整个多肽从一个亚细胞区室或细胞器(其中由于缺乏效应结构域的底物而使其活性被隔绝)转运至另一亚细胞区室或细胞器(其中存在底物)将允许整个多肽与其的期望底物(即哺乳动物细胞核中的基因组DNA)接触并导致激活或抑制靶基因表达。
另一种诱导系统是基于使用基于瞬态受体电位(TRP)离子通道的系统的设计,其可通过能量、热或无线电波诱导(参见,例如,http://www.sciencemag.org/content/336/6081/604)。这些TRP家族蛋白对不同的刺激(包括光和热)作出反应。当这种蛋白质被光或热激活时,离子通道将打开并允许例如钙进入质膜。这种离子流入将与连接至多肽的细胞内离子相互作用配偶体结合,包括Cpf1 CRISPR-Cas复合物或系统的指导和其他组分,并且该结合将诱导多肽的亚细胞定位的改变,导致整个多肽进入细胞核。一旦在细胞核内,Cpf1CRISPR-Cas复合物的指导蛋白和其他组分将具有活性并调节细胞中的靶基因表达。这种类型的系统也可用于诱导细胞中感兴趣的基因组基因座的切割;在这方面,注意到Cpf1酶是核酸酶。可以用激光或其他形式的能量源产生光。在吸收来自以无线电波形式传递的能量源的能量后,通过由可以释放热的能量源或纳米颗粒造成的温度升高可以产生热量。
光诱导性提供了空间精确度的潜力。利用光电极技术的发展,可以将刺激光纤引线放置在精确的大脑区域中。然后可以通过光强度调节刺激区域大小。这可以与本发明的Cpf1 CRISPR-Cas系统或复合物的递送一起进行,或者,在转基因Cpf1动物的情况下,可以递送本发明的指导RNA,并且光电极技术可以允许在精确的大脑区域中调节基因表达。用于培养宿主细胞的培养基包括常用于组织培养的培养基,例如M199-earle base、Eagle MEM(E-MEM)、Dulbecco MEM(DMEM)、SC-UCM102、UP-SFM(GIBCO BRL)、EX-CELL302(Nichirei)、EX-CELL293-S(Nichirei)、TFBM-01(Nichirei)、ASF104等。适用于特定细胞类型的培养基可以在American Type Culture Collection(ATCC)或the European Collection of CellCultures(ECACC)中找到。培养基可以补充有氨基酸,例如L-谷氨酰胺、盐、抗真菌或抗细菌剂,例如青霉素-链霉素、动物血清等。细胞培养基可任选地不含血清。
还可以在体内实现时间精确度。这可以用于在特定发育阶段期间改变基因表达。这可以用于将遗传提示定时到特定的实验窗口。例如,涉及学习的基因可能仅在完整啮齿动物或灵长类大脑的精确区域中的学习刺激期间过表达或抑制。此外,本发明可用于仅在疾病发展的特定阶段诱导基因表达变化。例如,癌基因可能只在肿瘤达到特定大小或转移阶段时过表达。相反,阿尔兹海默症的发展中怀疑的蛋白质可能只在动物生命中和特定脑区内的确定时间点被敲低。尽管这些实例没有详尽地列出本发明的潜在应用,但是它们突出了其中本发明可能是强大的技术的一些领域。
(c)受保护的指导RNA
在一个方面,通过指导RNA对靶DNA的结合特异性的热动力学调节来进一步增强Cpf1对给定个体指导RNA的特异性是令人感兴趣的。这是引入指导序列的错配、延伸或截短以增加/减少基因组靶标与其潜在脱靶基因座之间共有的互补碱基相对于错配碱基的数量一般方法,以便给予靶基因组基因座相对于基因组脱靶的热动力学优势。因此,通过二级结构修饰指导序列以增加Cpf1 CRISPR-Cas系统的特异性,由此二级结构可以保护免受核酸外切酶活性,可以是令人感兴趣的。这可以通过将“保护者RNA”与指导序列杂交来确保,其中“保护者RNA”是与指导RNA(gRNA)的5’末端互补的RNA链,从而产生部分双链gRNA。用完全互补的保护者序列保护错配碱基降低了靶DNA与3’末端错配碱基对结合的可能性。在特定的实施方式中,还可以存在包含延伸长度的额外序列。使用受保护的指导RNA的原理在WO/2016/094867中详细描述,其通过引用并入本文。
匹配基因组靶标的指导RNA(gRNA)延伸提供了gRNA保护且增强了特异性。因此,对于个体基因组靶标,用间隔子种子的末端的远端的配对序列延伸gRNA提供了增强的特异性。在特定的实施方式中,稳定形式由保护状态产生,其中延伸由于在间隔子延伸和间隔子种子中的互补序列而与gRNA种子形成闭环。因此,受保护的指导概念还包括与在20mer间隔子结合区域远端的基因组靶序列配对的序列。如WO/2016/094867中所述,热动力学预测可用于预测导致受保护gRNA状态的完全匹配或部分匹配的指导延伸。
对应于延伸长度(ExL)的延伸序列可任选地直接附着至受保护的指导序列的3’末端的指导序列。延伸序列的长度可以是2至12个核苷酸。优选地,ExL的长度可以表示为0、2、4、6、8、10或12个核苷酸。在优选的实施方式中,ExL的长度表示为0或4个核苷酸。在更优选的实施方式中,ExL长度为4个核苷酸。延伸序列可以与靶序列互补或不互补。延伸序列可以进一步任选地直接附着至受保护的指导序列的5’末端的指导序列以及保护序列的3’末端。结果,延伸序列用作受保护的序列和保护序列之间的连接序列。不希望受理论束缚,这种连接可以将保护序列定位在受保护的序列附近,以改善保护序列与受的保护序列的结合。
(d)通过指导工程化形成RISC
在一些实施方式中,指导可以是如本文所述的受保护的指导(例如,pgRNA)或护送的指导(例如,esgRNA)。在一些实施方式中,这两者都利用RISC。RISC是RNAi的关键组分。RISC(RNA诱导的沉默复合物)是多蛋白复合物,特别是核糖核蛋白复合物,其包含双链RNA(dsRNA)片段的一条链,例如小干扰RNA(siRNA)或microRNA(miRNA),其作为RISC识别互补信使RNA(mRNA)转录物的模板。因此,mRNA被RISC的组分之一切割。
这样,RISC的形成是在一些实施方式中是有利的。根据本发明的多个方面的指导RNA,包括但不限于受保护和/或护送的指导RNA,可以适于包含促进RISC形成的RNA核苷酸,例如与可以被提供或可以例如已经在细胞中表达的siRNA或miRNA组合。这例如作为自失活系统以清除或降解指导可以是有用的。
因此,指导RNA可包含与靶miRNA或siRNA互补的序列,所述miRNA或siRNA可以存在或可以不存在细胞内。这样,只有当miRNA或siRNA存在时(例如通过表达(通过细胞或通过人为干预)),RNA序列与miRNA或siRNA才结合,然后导致细胞内指导RNA被RNA诱导的沉默复合体(RISC)切割。因此,在一些实施方式中,指导RNA包含与靶miRNA或siRNA互补的RNA序列,并且指导RNA序列与靶miRNA或siRNA的结合导致细胞内指导RNA被RNA诱导的沉默复合物(RISC)切割。
在WO2016094874中描述了通过使用护送的指导形成RISC,在WO/2016/094867中描述了通过使用受保护的指导形成RISC。
(e)使用诱导型系统
在一些实施方式中,CRISPR酶可以形成诱导型系统的组分。系统的诱导性质将允许使用能量形式对基因编辑或基因表达进行时空控制。能量形式可以包括但不限于电磁辐射、声能、化学能和热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)或光诱导型系统(光敏色素、LOV结构域或隐花色素)。在一个实施方式中,CRISPR酶可以是光诱导型转录效应子(LITE)的一部分从而以序列特异性的方式引导转录活性的变化。光的组分可以包括CRISPR酶、光响应性细胞色素异源二聚体(例如来自拟南芥属)和转录激活/抑制结构域。在US 61/736,465和US 61/721,283和WO 2014/018423 A2中提供诱导型DNA结合蛋白和它们的使用方法的实例,其全部内容通过引用并入本文。
(f)诱导型/分裂效应酶的使用
在一个方面,本发明提供如本文所述的根据本发明的(非天然存在的或工程化的)诱导型CRISPR蛋白(CRISPR-Cas系统),其包含:第一CRISPR蛋白融合构建体,其附着于诱导型二聚体的第一半部,和第二CRISPR蛋白融合构建体,其附着于所述诱导型二聚体的第二半部,其中所述第一Cpf1融合构建体可操作地连接至一个或多个核定位信号,其中所述第二CRISPR蛋白融合构建体可操作地连接至一个或多个核输出信号,其中与诱导物能量源接触使所述诱导型二聚体的第一和第二半部在一起,其中使所述诱导型二聚体的第一和第二半部在一起允许所述第一和第二CRISPR蛋白融合构建体构成功能性CRISPR蛋白(任选地,其中所述CRISPR-Cas系统包含指导RNA(gRNA),所述指导RNA包含能够与细胞中感兴趣的基因组基因座中的靶序列杂交的指导序列,和其中所述功能性CRISPR-Cas系统与所述靶序列结合,并且任选地,编辑所述基因组基因座以改变基因表达)。
在本发明的一个方面,在诱导型CRISPR-Cas系统中,诱导型二聚体是诱导型异源二聚体或包含诱导型异源二聚体或基本上由诱导型异源二聚体组成或由诱导型异源二聚体组成。在一个方面,在诱导型CRISPR-Cas系统中,诱导型异源二聚体的第一半部或第一部分或第一片段是FKBP,任选地FKBP12,或包含FKBP,任选地FKBP12,或由FKBP,任选地FKBP12组成,或基本上由FKBP,任选地FKBP12组成。在本发明的一个方面,在诱导型CRISPR-Cas系统中,诱导型异源二聚体的第二半或第二部分或第二片段是FRB或包含FRB或由FRB组成或基本上由FRB组成。在本发明的一个方面,在诱导型CRISPR-Cas系统中,第一CRISPR融合构建体的排列是以下或包含以下或由以下组成或基本上由以下组成:N’末端CRISPR部分-FRB-NES。在本发明的一个方面,在诱导型CRISPR-Cas系统中,第一CRISP融合构建体的排列是以下或包含以下或由以下组成或基本上由以下组成:NES-N’末端CRISP部分-FRB-NES。在本发明的一个方面,在诱导型CRISPR-Cas系统中,第二CRISP融合构建体的排列是以下或包含以下或基本上由以下组成或由以下组成:C’末端CRISP部分-FKBP-NLS。在一个方面,本发明提供在诱导型Cpf1 CRISPR-Cas系统中,第二CRISP融合构建体的排列是以下或包含以下或由以下组成或基本上由以下组成:NLS-C’末端CRISP部分-FKBP-NLS。在一个方面,在诱导型CRISPR-Cas系统中,可以存在将CRISP部分与诱导型二聚体的半部或部分或片段分开的接头。在一个方面,在诱导型CRISPR-Cas系统中,诱导物能量源是以下或包含以下或基本上由以下组成或由以下组成:雷帕霉素。在一个方面,在诱导型CRISPR-Cas系统中,诱导型二聚体是诱导型同源二聚体。在一个方面,在诱导型的Cpf1 CRISPR-Cas系统中,Cpf1是AsCpf1、LbCpf1或FnCpf1。
在一个方面,本发明提供(非天然存在的或工程化的)诱导型CRISPR-Cas系统,其包括:第一CRISPR融合构建体,其附着至诱导型异源二聚体的第一半部,和第二CRISPR融合构建体,其附着至诱导型异源二聚体的第二半部,其中所述第一CRISPR融合构建体可操作地连接至一个或多个核定位信号,其中所述第二CRISPR融合构建体可操作地连接至核输出信号,其中与诱导物能量源的接触使所述诱导型异源二聚体的第一和第二半部在一起,其中使所述诱导型异源二聚体的第一和第二半部在一起允许所述第一和第二CRISPR融合构建体构成功能性CRISPR(任选地其中CRISPR-Cas系统包括指导RNA(gRNA),所述指导RNA包含能够与细胞中感兴趣的基因组基因座中的靶序列杂交的指导序列,和其中功能性CRISPR-Cas系统编辑所述基因组基因座以改变基因表达)。
因此,本发明尤其包括同源二聚体以及异源二聚体,基本上没有核酸酶活性(例如,通过突变)的死亡CRISPR或CRISPR蛋白,其中存在一个或多个NLS和/或一个或多个NES的系统或复合物;与分裂Cas9连接的功能结构域;方法,包括治疗方法,和用途。
诱导物能量源可以被认为是简单的诱导物或二聚化剂。本文使用术语“诱导物能量源”以保持一致性。诱导物能量源(或诱导物)用于重构酶。在一些实施方式中,诱导物能量源通过诱导型二聚体的两个半部的作用使酶的两部分在一起。因此,诱导型二聚体的两个半部在诱导物能量源的存在下在一起。在没有诱导物能量源的情况下,二聚体的两个半部不形成二聚体(二聚化)。
因此,诱导型二聚体的两个半部与诱导物能量源配合以二聚化二聚体。这反过来通过使CRISPR的第一部分和第二部分在一起来重构CRISPR。
CRISPR蛋白融合构建体各自包含分裂的CRISPR蛋白的一部分。这些优选通过接头(例如本文所述的GlySer接头)与二聚体的两个半部之一融合。二聚体的两个半部可以是基本上相同的两种单体,它们一起形成同型二聚体,或者它们可以是一起形成异源二聚体的不同单体。因此,两种单体可以被认为是完整二聚体的一个半部。
在CRISPR蛋白酶的两个部分基本上构成功能性CRISPR蛋白的意义上,CRISPR蛋白是分裂的。该CRISPR蛋白可以作为基因组编辑酶(当与靶DNA和指导形成复合物时),例如切口酶或核酸酶(切割DNA的两条链)起作用,或者它可以是死亡的CRISPR蛋白,其由于其催化结构域中的典型突变而基本上是具有很少催化活性或没有催化活性的DNA结合蛋白。
分裂的CRISPR蛋白的两部分可以被认为是分裂的CRISPR蛋白的N’末端部分和C’末端部分。融合通常在CRISPR蛋白的分裂点处。换而言之,分裂的CRISPR蛋白的N’末端部分的C’末端与二聚体半部中的一个融合,而C’末端部分的N’末端与另一个二聚体半部融合。
在新产生断裂的意义上,CRISPR蛋白质不必是分裂的。分裂点通常在计算机中设计并克隆到构建体中。分裂CRISPR蛋白的两部分,N’末端和C’末端部分,一起形成完整的CRISPR蛋白,优选包含至少70%或更多的野生型氨基酸(或编码它们的核苷酸),优选至少80%或更多,优选至少90%或更多,优选至少95%或更多,最优选至少99%或更多的野生型氨基酸(或编码它们的核苷酸)。一些修剪可以是可能的,并设想突变体。可以完全移除非功能结构域。重要的是可以使两部分在一起并且恢复或重构所期望的CRISPR蛋白功能。
二聚体可以是同源二聚体或异源二聚体。
一个或多个NLS,优选两个NLS,可以在与第一CRISPR蛋白构建体的可操作地连接中使用。可以使用一个或多个NES,优选两个NES,与第一Cpf1构建体可操作地连接。NLS和/或NES优选位于分裂的Cpf1-二聚体(即半二聚体)融合体的侧翼,即,一个NLS可以位于第一CRISPR蛋白构建体的N’末端,并且一个NLS可以位于第一CRISPR蛋白构建体C’末端。类似地,一个NES可以位于第二CRISPR构建体的N’末端,并且一个NES可以位于第二CRISPR构建体的C’末端。当提及N’或C’末端时,应理解这些末端对应于相应核苷酸序列中的5’末端和3’末端。
优选的排列是第一CRISPR蛋白构建体排列为5’-NLS-(N’末端CRISPR蛋白部分)-接头-(二聚体的第一半部)-NLS-3’。优选的排列是第二CRISPR蛋白构建体排列为5’-NES-(二聚体的第二半部)-接头-(C’末端CRISPR蛋白部分)-NES-3’。合适的启动子优选在这些构建体的每一个的上游。这两种构建体可以单独或一起递送。
在一些实施方式中,与第二Cpf1构建体可操作地连接的一个或所有NES可以替换为NLS。然而,这通常不是优选的,并且在其他实施方式中,与第二Cpf1构建体可操作地连接的定位信号是一个或多个NES。
还应理解,NES可以可操作地连接至分裂CRISPR蛋白的N’末端片段,并且NLS可以可操作地连接至分裂CRISPR蛋白的C’末端片段。然而,NLS可操作地连接至分裂Cpf1的N’末端片段并且NES可操作地连接至分裂CRISPR蛋白的C’末端片段的排列可能是优选的。
NES用于将第二CRISPR蛋白融合构建体定位在细胞核外,至少直到提供诱导物能量源(例如,至少直到向诱导物提供能量源以执行其功能)。诱导物的存在刺激细胞质内两种CRISPR蛋白融合的二聚化,并且对二聚化的第一和第二CRISPR蛋白融合在细胞核中定位是在热力学上有价值的。不受理论束缚,申请人相信NES将第二CRISPR蛋白融合隔离到细胞质(即,细胞核外)。第一CRISPR蛋白融合的NLS将其定位于细胞核。在这两种情况下,申请人使用NES或NLS将平衡(核输送的平衡)转移到期望的方向。二聚化通常发生在细胞核外(非常小的部分可能发生在细胞核中),二聚化复合物上的NLS将核转运的平衡转移到核定位,因此二聚化并因而重构的CRISPR蛋白进入细胞核。
有利地,申请人能够在分裂CRISPR蛋白中重构功能。使用瞬时转染证实概念,二聚化发生在存在诱导物能量源的上下文中。使用CRISPR蛋白的单独片段未观察到活性。然后使用通过慢病毒递送的稳定表达对此进行开发,并显示可以使用分裂CRISPR蛋白的方法。
这种分裂CRISPR蛋白的方法是有益的,因为它允许CRISPR蛋白活性为诱导型,因此允许时间控制。此外,可以使用不同的定位序列(即,优选NES和NLS)以降低自组装复合物的背景活性。组织特异性启动子,例如第一和第二CRISPR蛋白融合构建体各自的组织特异性启动子,也可用于组织特异性靶向,从而提供空间控制。如果需要,可以使用两种不同的组织特异性启动子来施加更精细的控制。对于阶段特异性启动子可以使用相同的方法,或者可以存在阶段和组织特异性启动子的混合物,其中第一和第二Cpf1融合构建体之一处于组织特异性启动子的控制下(即,可操作地连接或包含),而第一和第二Cpf1融合构建体中的另一个处于阶段特异性启动子的控制下(即可操作地连接或包含)。
如本文所述,诱导型CRISPR蛋白CRISPR-Cas系统包含一个或多个核定位序列(NLS),例如可操作地连接至第一CRISPR蛋白融合构建体。理想地,这些核定位序列具有足够的强度以驱动第一CRISPR蛋白融合构建体在真核细胞的细胞核中以可检测的量积累。不希望受理论束缚,据信核定位序列对于真核生物中的CRISPR-Cas复合物活性不是必需的,但是包含这样的序列增强了系统的活性,尤其是对于靶向细胞核中的核酸分子,并协助现有的两部分系统的运作。
同样地,第二CRISPR蛋白融合构建体可操作地连接至核输出序列(NES)。实际上,它可以连接至一个或多个核输出序列。换而言之,对第二CRISPR蛋白融合构建体使用的输出序列的数量优选为1或2或3。通常2是优选的,但1是足够的,并且因此在一些实施方式中是优选的。NLS和NES的合适实例是本领域已知的。例如,优选的核输出信号(NES)是人蛋白酪氨酸激酶2。优选的信号是物种特异性的。
在使用FRB和FKBP系统的情况下,FKBP优选侧翼是核定位序列(NLS)。在使用FRB和FKBP系统的情况下,优选的排列是N’末端CRISPR蛋白-FRB-NES:C’末端Cpf1-FKBP-NLS。因此,第一CRISPR蛋白融合构建体将包含C’末端CRISPR蛋白部分,并且第二CRISPR蛋白融合构建体将包含N’末端CRISPR蛋白部分。
本发明的另一个有益方面是它可以被快速打开,即具有快速响应。不受理论束缚,据信与通过新融合构建体的表达(尤其是翻译)相比,通过现有(已存在的)融合构建体的二聚化(通过与诱导物能量源接触)可以更快地诱导CRISPR蛋白活性。因此,第一和第二CRISPR蛋白融合构建体可以提前在靶细胞中表达,即在需要CRISPR蛋白活性之前。然后可以在时间上控制CRISPR蛋白活性,然后通过添加诱导物能量源快速构建,其理想地比通过表达(包括诱导转录)例如以载体递送的CRISPR蛋白更快地起作用(使异源二聚体二聚化,从而提供CRISPR蛋白活性)。
申请人证实CRISPR蛋白可以分裂成两个组分,其在重新在一起时重构功能性核酸酶。采用雷帕霉素敏感性二聚化结构域,申请人产生了化学诱导型CRISPR蛋白用于对CRISPR蛋白介导的基因组编辑和转录调节的时间控制。换而言之,申请人证实CRISPR蛋白可以通过分裂成两个片段而使得是化学诱导型,并且雷帕霉素敏感性二聚化结构域可以用于CRISPR蛋白的受控重组装。申请人表明,重组装的CRISPR蛋白可用于介导基因组编辑(通过核酸酶/切口酶活性)以及转录调节(作为DNA结合结构域,所谓的“死亡CRISPR蛋白”)。
因此,使用雷帕霉素敏感性二聚化结构域是优选的。重组装CRISPR蛋白是优选的。可以通过结合活性的恢复来确定重组装。当CRISPR蛋白质是切口酶或诱导双链断裂时,本文描述了与野生型相比的合适的比较百分比。
雷帕霉素处理可持续12天。剂量可以是200nM。该时间和/或摩尔剂量是人胚肾293FT(HEK293FT)细胞系的合适剂量的实例,并且这也可以用于其他细胞系。该图对于体内治疗用途可以外推至,例如mg/kg。然而,还设想将雷帕霉素施用至受试者的标准剂量也在本文使用。“标准剂量”是指雷帕霉素的正常治疗用途或主要适应症(即施用雷帕霉素用于预防器官排斥时使用的剂量)下的剂量。
值得注意的是,CRISPR蛋白-FRB/FKBP片段的优选排列是分开的和无活性的,直到雷帕霉素诱导的FRB和FKBP二聚化导致功能性全长CRISPR蛋白核酸酶的重组装。因此,优选附着于诱导型异源二聚体的第一半部的第一CRISPR蛋白融合构建体与附着于诱导型异源二聚体的第一半部的第二Cpf1融合构建体分开递送和/或分开定位。
为了将CRISPR蛋白(N)-FRB片段隔离在不太可能与核定位的Cpf1(C)-FKBP片段二聚化的细胞质中,优选在CRISPR蛋白(N)-FRB上使用单个来自人蛋白酪氨酸激酶2(CRISPR蛋白(N)-FRB-NES)的核输出序列(NES)。在雷帕霉素存在下,CRISPR蛋白(N)-FRB-NES与CRISPR蛋白(C)-FKBP-2xNLS二聚化以重构完整的CRISPR蛋白,其将细胞核运输的平衡转向核输入并允许DNA靶向。
在一些方面或实施方式中,可以使用用于提供CRISPR蛋白的诱导型系统。在一些实施方式中,CRISPR蛋白在诱导物能量源的存在下能够与靶序列和多核苷酸形成CRISPR复合物,所述多核苷酸被工程化以与所述CRISPR蛋白和所述靶序列复合。在一些实施方式中,诱导型系统包括:第一融合蛋白或编码它的多核苷酸;和第二融合蛋白或编码它的多核苷酸。在一些实施方式中,第一融合蛋白包含CRISPR蛋白的第一部分,诱导型二聚体的第一半部和一个或多个核定位序列(NLS);第二融合蛋白包含CRISPR蛋白的第二部分,诱导型二聚体的第二半部和一个或多个核输出序列(NES)。在一些实施方式中,与诱导物能量源的接触使诱导型二聚体的第一和第二部分在一起,以便使CRISPR蛋白的第一和第二部分在一起,从而使得CRISPR蛋白能够形成CRISPR复合物。在一些实施方式中,CRISPR蛋白或CRISPR系统是诱导型的。在一些实施方式中,CRISPR蛋白可以作为单个“部分”提供。在一些实施方式中,CRISPR蛋白的递送是以蛋白质(包含在含多核苷酸的RNP复合物中)或以核苷酸的形式(包括以mRNA形式)。在一些实施方式中,编码第一融合蛋白的多核苷酸和编码第二融合蛋白的多核苷酸在相同或不同的构建体上提供。WO2015/089427描述了基于诱导型二聚体(可以是同源二聚体或异源二聚体)的诱导型CRISPR-Cas系统。Zetsche等(NatureBiotechnology 33:139–142(2015)DOI:doi:10.1038/nbt.3149)还描述了该系统。基本上,CRISPR效应蛋白被分裂成两部分,其各自融合至诱导型二聚体的一个半部,由此与诱导物能量源接触使诱导型二聚体的第一和第二半部在一起,并且使诱导型二聚体的第一和第二半部在一起允许第一和第二CRISPR效应子融合构建体构成功能性CRISPR-Cas系统,其中CRISPR-Cas系统包括指导RNA(gRNA),所述指导RNA包含能够与细胞中感兴趣的基因组基因座的靶序列杂交的指导序列。并且其中所述功能性CRISPR-Cas系统与基因组基因座结合。在特定的实施方式中,功能性CRISPR-Cas系统编辑基因组基因座以改变基因表达。在特定的实施方式中,第一半部是FKBP,第二半部是FRB。诱导物能量源可以被认为简单地是诱导物或二聚化剂,因为它起到重构CRISPR效应蛋白的作用。
诱导物的实例包括光和激素。第一和第二光诱导二聚体的两个半部的优选实例是CIB1和CRY2系统。CIB1结构域是光敏性隐花色素2(CRY2)的异源二聚体结合配偶体。在另一个实例中,蓝光响应性磁体二聚化系统(pMag和nMag)可以与分裂的Cpf1蛋白的两个部分融合。响应于光刺激,pMag和nMag二聚化并且Cpf1重组装。例如,在Nihongaki等(Nat.Biotechnol.33,755–790,2015)中描述了这个系统与Cas9的连接。诱导物能量源可以是热能、超声波、电磁能或化学能。在优选的实施方式中,诱导物能量源可以是抗生素、小分子、激素、激素衍生物、类固醇或类固醇衍生物。在更优选的实施方式中,诱导物能量源可以是脱落酸(ABA)、多西环素(DOX)、cumate、雷帕霉素、4-羟基三苯氧胺(4OHT)、雌激素或蜕皮激素。至少一个开关可选自基于抗生素的诱导系统、基于电磁能的诱导系统、基于小分子的诱导系统、基于核受体的诱导系统和基于激素的诱导系统。在更优选的实施方式中,至少一个开关可以选自四环素(Tet)/DOX诱导系统、光诱导系统、ABA诱导系统、cumate阻遏物/操纵子系统、4OHT/雌激素诱导系统、基于蜕皮激素的诱导系统和FKBP12/FRAP(FKBP12-雷帕霉素复合物)诱导系统。这样的诱导物也在本文和PCT/US2013/051418中讨论,通过引用并入本文。
此外,在WO2015/089427中描述了诱导型二聚体的半部可以通过接头连接至效应蛋白。任选地,CRISPR效应蛋白具有降低的核酸酶活性或没有核酸酶活性,例如含有一个或多个失活突变。此外,描述了一个或多个功能结构域可以与效应蛋白的一个或两个部分相关联,WO2015/089427鉴定了SpCas9内的分裂点。类似的合适的分裂点可以对Cpf1进行鉴定。
下表显示As和LbCpf1内的非限制性内潜在分裂区域。在这样的区域内的分割位点可以是合适的。
分裂区域 AsCpf1 LbCpf1
1 575-588 566-571
2 631-645 754-757
3 653-664 -
4 818-844 -
对于Fn、As和Lb Cpf1突变体,潜在分裂位点的相应位置是什么应该容易是明显的,例如,基于序列比对。对于非Fn、As和Lb酶,如果直系同源物和预期的Cpf1之间存在相对高程度的同源性,则可以使用直系同源物的晶体结构,或者可以使用计算预测。
此外,描述了CRISPR效应蛋白的第一和第二融合构建体可以在相同或分开的载体中递送。在特定的实施方式中,诱导型二聚体的第一半部与一个或多个核定位构建体融合,而第二半部与一个或多个核输出信号融合。
涉及使用诱导型二聚体的治疗方法包括向受试者施用包含第一和第二融合构建体的载体并向受试者施用诱导物能量源的步骤。在特定的实施方式中,诱导物能量源是雷帕霉素。进一步设想该方法可涉及施用在与诱导型二聚体片段相同或不同的载体中的修复模板。雷帕霉素的示例性治疗方案可持续12天。
本文描述的分裂Cpf1效应蛋白系统的使用允许进一步控制CRISPR-Cas活性。更特别是,诱导型系统的使用允许时间控制。此外,使用不同的定位序列(即,优选NES和NLS)可以降低自组装复合物的背景活性。组织特异性启动子,允许空间控制。如果需要,可以使用两种不同的组织特异性启动子来施加更精细的控制。
f)自失活系统的使用
一旦在细胞的基因组中的基因的所有拷贝已被编辑时,该细胞中持续的CRISPR/Cpf1表达不再是必要的。实际上,持续的表达是不期望的,以避免脱靶效应和其他毒性问题。WO2015089351描述了自失活CRISPR系统,其依赖于CRISPR载体本身内的非编码指导靶序列的使用。因此,表达开始后,CRISPR系统将导致其自身的破坏,但在破坏完成之前,它将有时间编辑靶基因的基因组拷贝(在二倍体细胞中具有正常的点突变时,需要最多两次编辑)。因此,该方法可以涉及使用自失活CRISPR-Cas系统,其包括靶向CRISPR酶本身的编码序列或靶向一种或多种与独特序列互补的非编码指导靶序列的额外RNA(即,指导RNA),所述独特序列存在于驱动非编码RNA元件表达的启动子内,在驱动Cpf1基因表达的启动子内,(c)在Cpf1编码序列中的ATG翻译起始密码子的100bp内,(d)在病毒递送载体的反向末端重复(iTR)内,例如AAV基因组中。
类似地,使用“管理指导”的自失活系统在US2015232881A1(也公开为WO2015070083(A1),其在本文其他地方引用并且通过引用并入本文)中举例说明,并且可以外推至Cpf1。更特别是,使用或包含编码Cpf1分子或gRNA分子的核酸(例如DNA)的方法和组合物可以额外使用或包括“管理gRNA分子”。所述管理gRNA分子可以与Cpf1分子复合以使Cpf1系统的组分失活或沉默。另外的gRNA分子,在本文中称为管理gRNA分子,包含靶向Cpf1系统组分的靶向结构域。在一个实施方式中,管理gRNA分子靶向和沉默(1)编码Cpf1分子(即,Cpf1靶向gRNA分子)的核酸,(2)编码gRNA分子(即,gRNA靶向gRNA分子)的核酸,或(3)被工程化到Cpf1组分中的核酸序列,所述核酸序列被设计为与细胞中的其他核酸分子具有最小同源性以最小化脱靶切割(工程化控制序列靶向gRNA分子)。
可以选择管理gRNA的靶序列以增加对Cpf1系统的调节或控制和/或减少或最小化系统的脱靶效应。例如,通过使编码Cpf1分子的核酸失活(例如,切割),管理gRNA可以使不期望的切割最小化,例如在Cpf1介导的靶核酸改变后的“重新切割”或Cpf1的脱靶切割。在一个实施方式中,管理gRNA对Cpf1分子/gRNA分子复合物的表达或活性水平进行了时间或其他限制。在一个实施方式中,管理gRNA减少脱靶或其他不想要的活性。
另外的指导RNA可以通过载体,例如,单独的载体或与编码CRISPR复合物相同的载体来递送。当由单独的载体提供时,靶向Cpf1表达的CRISPR RNA可以顺序或同时施用。当顺序施用时,靶向Cpf1表达的CRISPR RNA将在用于例如基因编辑或基因工程的CRISPR RNA之后递送。该时段可以是分钟的时段(例如,5分钟、10分钟、20分钟、30分钟、45分钟、60分钟)。该时段可以是小时的时段(例如2小时、4小时、6小时、8小时、12小时、24小时)。该时段可以是天的时段(例如,2天、3天、4天、7天)。该时段可以是周的时段(例如2周、3周、4周)。该时段可以是月的时段(例如2个月、4个月、8个月、12个月)。该时段可以是年的时段(2年、3年、4年)。以这种方式,Cas酶与能够与第一靶标(例如基因组基因座或靶基因座)杂交的第一gRNA相关联,并且承担CRISPR-Cas系统所需的功能(例如,基因工程);然后,Cpf1酶可以与能够与包含Cpf1或CRISPR盒的至少部分的序列杂交的第二gRNA相关联。当gRNA靶向编码Cpf1蛋白表达的序列时,酶变得受阻并且系统变得自失活。以相同的方式,通过例如如本文所述的脂质体、脂质转染(lipofectin)、纳米颗粒应用的靶向Cpf1表达的CRISPR RNA可以被顺序或同时施用。类似地,自失活可用于使用于靶向一种或多种靶标的一种或多种指导RNA失活。
在一些实施方式中,提供了能够与CRISPR酶起始密码子下游的序列杂交的单个gRNA,由此在一段时间后丧失CRISPR酶表达。在一些实施方式中,提供了一种或多种gRNA,其能够与编码CRISPR-Cas系统的多核苷酸的一个或多个编码或非编码区杂交,由此在一段时间后使一个或更多或在某些情况下全部的CRISPR-Cas系统失活。在该系统的一些方面,并且不受理论限制,细胞可包含多个CRISPR-Cas复合物,其中CRISPR复合物的第一子集包含能够靶向待编辑的基因组基因座或基因座的第一chiRNA,并且CRISPR复合物的第二子集包含能够靶向编码CRISPR-Cas系统的多核苷酸的至少一种第二chiRNA,其中CRISPR-Cas复合物的第一子集介导靶基因组基因座或基因座的编辑,并且CRISPR复合物的第二子集最终使CRISPR-Cas系统失活,从而使细胞中的进一步CRISPR-Cas表达失活。
因此,本发明提供了CRISPR-Cas系统,其包括一种或多种用于递送至真核细胞的载体,其中所述载体编码:(i)CRISPR酶;(ii)能够与细胞中的靶序列杂交的第一指导RNA;(iii)能够与编码CRISPR酶的载体中的一个或多个靶序列杂交的第二指导RNA;(iv)至少一个tracr配对序列;和(v)至少一个tracr序列。第一和第二复合物可使用相同的tracr和tracr配对,因此仅通过指导序列区分,其中当在细胞中表达时:所述第一指导RNA引导第一CRISPR复合物与细胞中的靶序列序列特异性结合;所述第二指导RNA引导第二CRISPR复合物与编码CRISPR酶的载体中的靶序列序列特异性结合;所述CRISPR复合物包含(a)与tracr序列杂交的tracr配对序列和(b)与指导RNA结合的CRISPR酶,使得指导RNA可以与其靶序列杂交;并且所述第二CRISPR复合物使CRISPR-Cas系统失活,以防止细胞继续表达所述CRISPR酶。CRISPR酶可以是Cpf1,特别是FnCpf1或AsCpf1。
载体、编码酶、指导序列等的其他特征在本文其他地方公开。例如,指导序列之一或两者可以是chiRNA序列的部分,所述chiRNA在单个RNA内提供指导、tracr配对和tracr序列,使得系统可以编码(i)CRISPR酶;(ii)包含能够与细胞中的第一靶序列杂交的序列、第一tracr配对序列和第一tracr序列的第一chiRNA;(iii)能够与编码CRISPR酶的载体杂交的第二指导RNA、第二tracr配对序列和第二tracr序列。类似地,酶可包含一个或多个NLS,等等。
各种编码序列(CRISPR酶、指导RNA、tracr和tracr配对)可以被包含在单个载体或多个载体中。例如,可以在一个载体上编码酶,而在另一个载体上编码各种RNA序列,或在一个载体上编码酶和一个chiRNA,而在另一个载体上编码剩余的chiRNA,或任何其他排列。通常,优选使用总共一种或两种不同载体的系统。
在使用多个载体时,可能以不相等的数量递送它们,并且理想地用相对于第二指导RNA过量的编码第一指导RNA的载体,从而有助于延迟CRISPR系统的最终失活直到基因组编辑有机会发生。
因此,载体中的靶序列必须能够使CRISPR效应蛋白的表达失活。合适的靶序列可以是,例如,接近或在Cpf1编码序列的翻译起始密码子内、在驱动非编码RNA元件表达的启动子内的非编码序列中、驱动Cpf1基因表达的启动子内、Cpf1编码序列的ATG翻译起始密码子的100bp内,和/或病毒递送载体的反向末端重复(iTR)内,例如AAV基因组中。该区域附近的双链断裂可以诱导Cpf1编码序列的移码,导致蛋白质表达的丧失。“自失活”指导RNA的替代性靶序列旨在编辑/失活CRISPR-Cpf1系统表达所需的调节区/序列或载体的稳定性。例如,如果Cpf1编码序列的启动子被破坏,则可以抑制或阻止转录。类似地,如果载体包含用于复制、维持或稳定的序列,则可以靶向这些序列。例如,在AAV载体中的有用靶序列是在iTR内。靶向的其他有用序列可以是启动子序列,多聚腺苷酸位点等。
此外,如果指导RNA是以阵列形式表达,同时靶向两种启动子的“自失活”指导RNA将导致从CRISPR-Cas表达构建体内切除插入的核苷酸,有效地导致其完全失活。类似地,在指导RNA靶向两种ITR或同时靶向两种或更多种其他CRISPR-Cas组分的情况下,将导致插入核苷酸的切除。本文所解释的自失活通常适用于CRISPR-Cpf1系统,以提供CRISPR-Cpf1的调节。例如,如本文所解释的自失活可以应用于突变(例如扩增障碍)的CRISPR修复,如本文所解释的。由于这种自失活,CRISPR修复只有瞬时活性。
将非靶向核苷酸加入至“自失活”指导RNA的5’端(例如1-10个核苷酸,优选1-5个核苷酸)可以作为CRISPR-Cpf1关闭之前确保在靶向的基因组基因座处的编辑的手段,用于延迟其进程和/或更改其效率。
在自失活AAV-CRISPR-Cpf1系统的一个方面,共表达一种或多种靶向感兴趣基因组序列的sgRNA(例如1-2、1-5、1-10、1-15、1-20、1-30)的质粒可以与靶向工程ATG起始位点处或附近(例如,在5个核苷酸内、15个核苷酸内、30个核苷酸内、50个核苷酸内、100个核苷酸内)的SpCpf1序列的“自失活”sgRNA一起建立。在U6启动子区域的调控序列也可以被sgRNA靶向。U6驱动的sgRNA可以以阵列形式设计,使得可以同时释放多个sgRNA序列。当第一次递送到靶组织/细胞(左细胞)中时,sgRNA开始积累,同时Cpf1蛋白水平在细胞核中升高。Cpf1与所有sgRNA复合以介导CRISPR-Cpf1质粒的基因组编辑和自失活。
自失活CRISPR-Cpf1系统的一个方面是单独或以串联阵列形式的1至至多4个或更多个不同的指导序列(例如,至多约20个或约30个指导序列)的表达。每个单独的自失活指导序列可以靶向不同的靶标。这可以从例如一种嵌合pol3转录物加工。可以使用Pol3启动子,例如U6或H1启动子。Pol2启动子,例如本文全文中提到的那些。反向末端重复(iTR)序列可位于Pol3启动子-sgRNA(s)-Pol2启动子-Cas9的侧翼。
在特定的实施方式中,一个或多个指导编辑一个或多个靶标,而一个或多个自失活指导使CRISPR/Cpf1系统失活。因此,例如,用于修复扩增障碍的CRISPR-Cpf1系统可以直接与本文所述的自失活CRISPR-Cpf1系统组合。这样的系统可以例如,含有引导至靶区域以修复的两个指导,以及引导至CRISPR-Cpf1的自失活的至少第三指导。参考申请序列号PCT/US2014/069897,标题为“Compositions And Methods Of Use Of Crispr-Cas Systems InNucleotide Repeat Disorders”,其于2014年12月12日公开为WO/2015/089351。
在特定的实施方式中,本文中描述的基因编辑系统被置于密码切断开关的控制下,所述密码切断开关是当细胞的条件被改变时有效杀死宿主细胞的机制。这是通过引入杂合的LacI-GALR家族转录因子来实现,所述转录因子需要IPTG的存在以被开启(Chan等2015 Nature Chemical Biology doi:10.1038/nchembio.1979),其可以用于驱动编码对细胞生存关键的酶的基因。通过结合对不同化学物质敏感的不同转录因子,可以产生“代码”。这个系统可以用于在空间和时间上控制CRISPR诱导的遗传修饰的程度,这可以在包括治疗应用在内的不同领域中是令人感兴趣的,并且还可以在避免GMO从其预期环境中“逃逸”的方面是令人感兴趣的。
g)“关闭开关”的使用
在特定的实施方式中,使用Cpf1的抑制剂和/或激动剂是可能的。关闭开关和开启开关可以是能够干扰Cas9效应蛋白的任何方面或者充当用于Cas9效应蛋白的任何方面的激动剂的任何分子(即肽、蛋白质、小分子、核酸)。例如,Pawluck等2016(Cell 167,1-10)描述了来自细菌的编码Cas9蛋白抑制剂的移动元件。三个抗CRISPR的家族被发现在体内和体外抑制脑膜炎奈瑟球菌的Cas9。抗CRISPR与NmeCas9直接结合。这些蛋白质被描述为人类细胞中NmeCas9基因组编辑的潜在“关闭开关”。用于鉴定影响Cas9效率的小分子的方法描述于Yu等(Cell Stem Cell 16,142-147,2015)。在某些实施方式中,小分子可用于控制Cas9。Maji等描述了小分子调节的蛋白质降解决定子结构域以控制Cas9系统的编辑。Maji等"Multidimensional chemical control of CRISPR-Cas9"Nature Chemical Biology(2017)13:9-12。在某些示例性实施方式中,抑制剂可以是噬菌体衍生的蛋白质。参见Rauch等“Inhibition of CRISPR-Cas9with Bacteriophage Proteins”Cell(2017)168(2):150-158。在某些示例性实施方式中,抗CRISPR可以通过与指导分子结合来抑制CRISPR-Cas系统。参见Shin等“Disabling Cas9by an anti-CRISPR DNA mimic”bioRxiv,April 22,2017,doi:http://dx.doi.org/10.1101/129627。
在特定的实施方式中,细胞内的DNA通过遗传编码的DNai移除,所述DNai响应于转录输入并降解用户限定的DNA,如Caliando&Voigt,Nature Communications 6:6989(2015)中所述。
功效
a.酶稳定性
蛋白质的表达水平取决于许多因素,包括mRNA的量、其稳定性和核糖体起始的速率。mRNA的稳定性或降解是重要因素。已经描述了多种增加mRNA稳定性的策略。一个方面是密码子优化。已经发现,富含GC的基因的表达比其GC含量低的对应基因更高效数倍或超过100倍。这种效应可以直接归因于增加的稳态mRNA水平,更特别是有效的转录或mRNA加工(不是降低的降解)(Kudla等Plos Biology http://dx.doi.org/10.1371/journal.pbio.0040180)。而且,已发现核糖体密度对转录物半衰期具有显著影响。更特别是,发现通过引入能够形成二级结构的核苷酸序列可以实现稳定性的增加,所述二级结构通常招募阻碍mRNA降解酶的核糖体。WO2011/141027描述了可以以这样的方式定位的慢读密码子,以导致跨越mRNA的5’端的关键区域的高核糖体占据,可以将信使的半衰期增加多达25%,并对蛋白质生产产生类似的提升。相比之下,在该关键区域之前定位甚至单个慢读密码子可显著地使mRNA不稳定并导致蛋白质表达的减弱。这种理解使得mRNA的设计能够适合期望的功能。另外,化学修饰例如本文对指导序列所述的那些可以被设想以增加mRNA稳定性。
b.指导稳定性
在某些实施方式中,方法利用化学修饰的指导RNA。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处引入2’-O-甲基(M)、2’-O-甲基3’硫代磷酸酯(MS)或2’-O-甲基3’硫代PACE(MSP)。与未修饰的指导RNA相比,这种化学修饰的指导RNA可以具有增加的稳定性和增加的活性,尽管中靶相对于脱靶特异性是不可预测的(参见,Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,在线公布2015年6月29日)。化学修饰的指导RNA还包括但不限于具有硫代磷酸酯键的RNA和锁核酸(LNA)核苷酸,所述锁核酸包含核糖环的2’和4’碳之间的亚甲基桥。
选择基因中的最佳靶位点
a)靶基因内的选择
迄今为止的研究表明,尽管sgRNA活性可以是相当高的,但sgRNA之间在它们产生期望靶切割的能力方面有显著区别。已经努力确定设计标准以最大化指导RNA的功效。Doench等(Nat Biotechnol.2014Dec;32(12):1262-1267and Nat Biotechnol.PubMedPMID:26780180)描述了优化sgRNA活性预测的定量模型的开发,以及使用该模型进行sgRNA设计的工具。因此,在特定的实施方式中,本文提供的方法包括基于活性指导RNA的统计学比较(例如Doench等描述的(上文))鉴定最佳指导序列。在特定的实施方式中,每个靶标设计至少五种gRNA,并且这些gRNA在细胞中凭经验测试以产生至少一种具有足够高活性的gRNA。
***注意,提到了题为"]"]How to design CRISPR crRNA for gene disruption“from integrated technologies which apparently mentions concept of"targetingan early 5’exon of your gene reduces the chances of functional[off-target]”的手册,但是此链接不再有效。
b)鉴定合适的指导序列
目前,使用参照人类基因组设计RNA指导;然而,未考虑人群中的变异可能混淆给定RNA指导的治疗结果。最近发布的基于60,706个个体的ExAC数据集包含在人类外显子组中平均每八个核苷酸一个变体(Lek,M.等Analysis of protein-coding geneticvariation in 60,706humans.Nature 536,285-291(2016))。由于RNA指导与特定患者靶位点中存在的变体之间存在错配,这强调了遗传变异影响某些RNA指导在患者群体中用于基于CRISPR的基因治疗的功效的可能。为了评估这种影响,我们使用ExAC数据集来编目人类参照外显子组中所有可能靶标中存在的变体,其(i)破坏靶PAM序列或(ii)在RNA指导和基因组DNA之间引入错配,其可统称为靶标变异(图9a)。对于患者群体的治疗,避免对个体患者施用的针对RNA指导的靶标变异将最大化基因组编辑治疗剂的结果的一致性。靶标变异的影响的证实在本文的实施例部分说明。
理想地,个性化的基因组医学将对每个患者定制RNA指导的核酸内切酶治疗剂。然而,为接受基因组编辑疗法的每位患者设计单独的RNA指导可能是成本过高且从监管角度不可行的。分析遗传变异对RNA指导的核酸内切酶的功效和安全性的影响激励以下框架以简化基因组编辑疗法的设计和测试(图12d)。首先,针对铂靶标的RNA指导的使用将确保99.99%的患者的完美靶向。其次,需要进一步选择这些RNA指导以最小化在患者群体中在高频单倍型上发生的脱靶候选者的数量。第三,在大规模测序数据集中捕获的低频突变可用于估计有效和安全地治疗不同大小的患者群体所需要的指导RNA-酶组合的数量。大规模测序数据集的增长将提高这些估计的准确性。第四,需要对个体患者进行治疗前全基因组测序以选择单一批准的指导RNA-酶组合用于治疗。这种框架与将进一步完善这些选择标准的快速积累的人类测序数据组合,将使得能够设计和验证基因组编辑疗法,最小化批准所必需的指导RNA-酶组合的数量和递送有效和安全的基因疗法至患者的成本。
相应地,在特定的实施方式中,本文提供的方法包括以下步骤中的一个或多个:(1)鉴定铂靶标,(2)选择指导以最小化在患者群体的高频单倍型中出现的脱靶候选者的数量;(3)基于大规模测序数据集中捕获的低频变异选择指导(和/或效应蛋白),以估计有效和安全地治疗不同大小的患者群体所需要的指导RNA-酶组合的数量,和(4)根据个体患者的治疗前全基因组测序确认或选择指导。在特定的实施方式中,“铂”靶标是不含有以≥0.01%等位基因频率出现的变体。
确定中靶/脱靶活性和选择合适的靶序列/指导的方法
在某些示例性实施方式中,参数例如但不限于,脱靶候选者、PAM限制性、靶标切割效率或者效应蛋白特异性,可以使用基于测序的双链断裂(DSB)检测测定法来测定。基于测序的DSB检测测定法的实例是sChIP-seq(Szilard等Nat.Struct.Mol.Biol.18,299-305(2010);Iacovoni等EMBO J.29,1446-1457(2010))、BLESS(Crosetto等Nat.Methods 10,361-365(2013);Ran等Nature 520,186-191(2015);Slaymaker等Science 351,84-88(2016)),GUIDEseq(Tsai等Nat.Biotech 33,187-197(2015))、Digenome-seq(Kim等Nat.Methods 12,237-43(2015))、IDLV-介导DNA断裂捕获(Wang等Nat.Biotechnol.33,179-186(2015),HTGTS(Frock等Nat.Biotechnol.33,179-186(2015)),End-Seq(Canela等Mol.Cell 63,898-911(2016),和DSB捕获(Lensing等Nat.Methods 13,855-857(2016)。可以使用其他方法评估靶切割效率,包括SITE-Seq(Cameron等Nature Methods,14,600-606(2017)和CIRCLE-seq(Tsai等Nature Methods 14,607-614(2017))。
用于评价Cpf1RNase活性的有用方法包括在Zhong等Nature Chemical BiologyJune 19,2017doi:10.1038/NCHEMBIO.2410中公开的那些。增加的RNase活性和从单个RNA聚合酶II驱动的RNA转录物中切除多个CRISPR RNA(crRNA)的能力可以简化多个基因组靶标的修饰和可用于提高Cpf1介导的编辑效率
1.BLISS
其它合适的测定法包括那些在Yan等("BLISS:quantitative and versatilegenome-wide profiling of DNA breaks in situ"BioRxiv,12/4/2016doi:http://dx.doi.org/10.1101/091629)中描述的,其描述了用于检测DSB的通用、灵敏和定量的方法,所述方法适用于细胞和组织两者的低输入样本,其可扩展用于多个样本中的高通量DSB映射。原位断裂标记和测序(BLISS)的特征在于固定在固体表面上的固定细胞或组织切片的有效原位DSB标记,通过T7介导的体外转录(IVT)线性扩增标记的DSB以获得更高的灵敏度,和通过引入独特分子标识符(UMI)进行准确的DSB定量。
2.窗帘(curtain)
已经开发另一种方法,所述方法也可以用于评估本文公开的某些参数,所述方法允许使用体外切割固定的核酸分子以直接和无偏见的方式评估核酸酶的中靶和脱靶切割。进一步参考2016年6月17日提交的题为“Unbiased Detection of Nucleic AcidModifictions”的国际专利申请No.PCT/US2017/028009。
该方法也可用于选择合适的指导RNA。该方法允许通过进行以下步骤来检测核酸修饰:i)使固定在固体支持物上的一种或多种核酸分子(固定的核酸分子)与能够诱导核酸修饰的试剂接触;和ii)使用特异性结合至引物结合位点的引物对包含核酸修饰的一种或多种固定化核酸分子的至少一部分进行测序。所述方法还允许从对选择靶序列特异的多种指导RNA中选择指导RNA。在特定的实施方式中,所述方法包括使固定在固体支持物上的多种核酸分子(固定的核酸分子)与能够诱导核酸断裂的多种RNA指导的核酸酶复合物接触,所述多种RNA指导的核酸酶复合物包含多种不同的指导RNA,从而诱导一种或多种核酸断裂;将包含引物结合位点的衔接子附着到包含核酸断裂的所述一种或多种固定的核酸分子上;使用特异性结合所述引物结合位点的引物对包含核酸断裂的所述一种或多种固定的核酸分子的至少一部分进行测序;基于所述一种或多种断裂的位置和/或量选择指导RNA。
在特定的实施方式中,所述方法包括确定一个或多个在包含断裂的一种或多种固定的核酸分子中的位置,而不是包含选择靶序列(脱靶断裂)的位置,并基于一个或多个位置选择指导RNA。在特定的实施方式中,步骤v包括确定在包含脱靶断裂的一种或多种固定的核酸分子中的多个位点,并基于位点的数量选择指导RNA。在另一个实施方式中,步骤iv包括确定脱靶断裂的位置和脱靶断裂的位置的数量。
安全性
1.选择半衰期最短的蛋白质
a)效应蛋白的固有半衰期
效应蛋白在靶位点处在已经执行其功能后继续存在对效应蛋白的脱靶效应和直接毒性都是潜在的安全问题。据报道,在通过LNP直接递送至细胞后,CRISPR效应蛋白在细胞内快速降解(Kim等Genome Res.2014Jun;24(6):1012–1019)。当效应蛋白将要从质粒表达时,主动降低蛋白质半衰期的策略可以是令人感兴趣的。
b)去稳定的结构域的使用
在某些实施方式中,本文提供的方法包括使用与去稳定的结构域(DD)相关联或融合的Cas9效应蛋白。在WO2016/106244中详细描述了与使用去稳定的结构域有关的技术,该文献通过引用并入本文。
去稳定的结构域(DD)是可以赋予各种蛋白质不稳定性的结构域;参见,例如,Miyazaki,J Am Chem Soc.Mar 7,2012;134(9):3942–3945,and Chung H NatureChemical Biology Vol.11September 2015pgs 713-720,通过引用并入本文。DD可以有利地通过接头与CRISPR酶相关联,例如融合,由此DD可以在配体存在下稳定,并且当不存在配体时,DD可以变得不稳定,由此CRISPR酶完全不稳定,或者DD可以在没有配体的情况下稳定,当配体存在时,DD可以变得不稳定;DD允许调节或控制Cpf1效应子,从而提供用于调节或控制系统的方法。例如,当感兴趣的蛋白质表达为带DD标签的融合体时,它在细胞中不稳定并被例如蛋白酶体迅速降解。因此,不存在稳定配体导致DD相关的Cpf1被降解。Cpf1效应子的峰值活性与减少脱靶效应和系统的一般安全性相关。DD系统的优点包括它可以是可剂量的、正交的(例如,配体仅影响其同源DD,因此两个或更多个系统可以独立地操作)、可运输的(例如,可以在不同的细胞类型或细胞系中起作用)并且允许时间控制。
合适的DD-稳定配体对是在本领域中已知的,并也描述于WO2016/106244。去稳定的结构域的大小会有所不同,但通常大小约为100-300个氨基酸。合适的实例包括ER50和/或DHFR50。用于ER50的相应稳定配体是例如4HT或CMP8。在一些实施方式中,一个或两个DD可以与CRISPR酶的N末端融合,一个或两个DD与CRISPR酶的C末端融合。虽然DD可以直接在Cpf1效应蛋白的N和/或C末端提供,它们也可以通过接头融合,例如GlySer接头或NLS和/或NES。市售的DD系统是CloneTech、ProteoTunerTM系统;稳定配体是Shield1。在一些实施方式中,稳定配体是“小分子”,优选其是细胞可渗透的并且对其相应的DD具有高亲和力。
2.选择最小免疫原性RNP
当施用试剂给哺乳动物,总有对于试剂和/或其递送载体的免疫应答的风险。对大多数递送载体来说,规避免疫反应是一项重大挑战。在生物体内表达免疫原性表位的病毒载体通常诱导免疫应答。纳米颗粒和基于脂质的载体在某种程度上解决了这个问题。Yin等证实了将指导RNA的病毒递送与脂质纳米颗粒介导的CRISPR效应蛋白的递送相结合的治疗方法(Nature Biotechnology 34:328–33(2016))。Ziris等描述了阳离子脂质介导的递送Cas9:指导RNA核酸酶复合物至细胞。具有细菌来源的CRISPR效应蛋白也固有地具有引发免疫应答的风险。这可以通过人源化Cpf1效应蛋白来解决。
3.在指导RNA中引入修饰以最小化免疫原性
RNA的化学修饰已被用于避免先天免疫系统的应答。Judge等(2006)证实通过选择性地将2’-O-甲基(2’OMe)尿苷或鸟苷核苷引入siRNA双链的一条链中可以完全消除合成siRNA的免疫刺激(Mol.Ther.,13(2006),pp.494–505)。Cekaite等(J.Mol.Biol.,365(2007),pp.90–108)观察到用2’-氟或2’-O-甲基修饰的对应物替换siRNA的仅仅尿苷碱基消除了参与调节免疫反应的基因的上调。相似地,Hendel等测试了具有骨架和糖修饰的sgRNA,所述糖修饰赋予核酸酶稳定性并且可以降低免疫刺激作用(Hendel等,Nat.Biotechnol.,33(2015),pp.985–989)。
相应地,在特定的实施方式中,方法包括修饰指导RNA,以便使用一种或多种这些方法来最小化免疫原性。
确定最佳剂量以最小化毒性并最大化特异性
人们普遍接受的是CRISPR组分的剂量与系统的毒性和特异性相关(Pattanayak等Nat Biotechnol.2013Sep;31(9):839–843)。Hsu等(Nat Biotechnol.2013Sep;31(9):827–832)证实可以滴定(titrate)SpCas9和sgRNA的剂量以解决这些问题。在某些示例性实施方式中,通过预先形成复合物,将指导置于强启动子的控制下,或通过定时递送以确保在效应蛋白的表达期间可用的饱和条件,使含有指导的复合物饱和,从而使毒性最小化。
确定适当的递送载体
在一些实施方式中,CRISPR系统的组分可以以各种形式递送,例如DNA/RNA或RNA/RNA或蛋白质RNA的组合。例如,Cpf1可以作为DNA编码多核苷酸或RNA编码多核苷酸或作为蛋白质递送。指导可以作为DNA编码多核苷酸或RNA递送。设想了所有可能的组合,包括混合形式的递送。
在一些方面,本发明提供一种方法,所述方法包括递送一种或多种多核苷酸,例如本文中所描述的一种或多种载体、它们的一种或更多种转录物和/或一种或多种从其转录的蛋白质,至宿主细胞。
载体
常规的基于病毒和非病毒的基因转移方法可用于在哺乳动物细胞或靶组织中导入核酸。这样的方法可用于将编码核酸靶向系统组分的核酸施用于培养的或宿主生物中的细胞。非病毒载体递送系统包括DNA质粒、RNA(例如,本文所述载体的转录物)、裸核酸和与递送载体例如脂质体复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其具有在递送至细胞后的游离或整合的基因组。关于基因治疗程序的综述,参见Anderson,Science 256:808-813(1992);Nabel&Felgner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,RestorativeNeurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British MedicalBulletin 51(1):31-44(1995);Haddada等,in Current Topics in Microbiology andImmunology,Doerfler and(eds)(1995);和Yu等,Gene Therapy 1:13-26(1994)。
非病毒递送核酸的方法包括脂质转染、核转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒粒子,和DNA的药剂增强摄取。脂质转染描述于例如美国专利号5,049,386、4,946,787和4,897,355中,并且脂质转染试剂(例如,TransfectamTM和LipofectinTM)在商业上销售。适用于多核苷酸的有效受体识别脂质转染的阳离子和中性脂质包括Felgner,WO91/17424,WO91/16024的那些。递送可以至细胞(例如体外或离体施用)或靶组织(例如体内施用)。
质粒递送涉及将指导RNA克隆到表达CRISPR效应蛋白的质粒中并将DNA转染至细胞培养中。质粒骨架可商购,并且不需要特定设备。它们具有模块化的优点,能够携带不同大小的CRISPR效应子编码序列(包括编码较大尺寸的蛋白质的那些)以及选择标志物。质粒的两个优点是它们可以确保瞬时但持续的表达。然而,质粒的递送并不简单,因此体内效率通常较低。持续表达也可能是不利的,因为它可以增加脱靶编辑。此外,CRISPR效应蛋白的过量积累可能对细胞有毒。最后,更特别是考虑到产生的双链断裂(中靶和脱靶),质粒总是具有随机整合dsDNA到宿主基因组中的风险。
包括靶向脂质体,例如免疫脂质复合物的脂质:核酸复合物的制备是本领域技术人员熟知的(参见,例如,Crystal,Science 270:404-410(1995);Blaese等,Cancer GeneTher.2:291-297(1995);Behr等,Bioconjugate Chem.5:382-389(1994);Remy等,Bioconjugate Chem.5:647-654(1994);Gao等,Gene Therapy 2:710-722(1995);Ahmad等,Cancer Res.52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。这将在下面更详细地讨论。
质粒递送的优点和缺点通过涉及将指导RNA克隆至CRISPR效应蛋白表达质粒中和在细胞培养中转染DNA的质粒递送描述。质粒骨架可商购,并且不需要特定设备。它们具有模块化的优点,能够携带不同大小的CRISPR效应子编码序列(包括编码较大尺寸的蛋白质的那些)以及选择标志物。质粒的两个优点是它们可以确保瞬时但持续的表达。然而,质粒的递送并不简单,因此体内效率通常较低。持续表达也可能是不利的,因为它可以增加脱靶编辑。此外,CRISPR效应蛋白的过量积累可能对细胞有毒。最后,更特别是考虑到产生的双链断裂(中靶和脱靶),质粒总是具有在宿主基因组中随机整合dsDNA的风险。包括靶向脂质体,例如免疫脂质复合物的脂质:核酸复合物的制备是本领域技术人员熟知的(参见,例如,Crystal,Science 270:404-410(1995);Blaese等,Cancer Gene Ther.2:291-297(1995);Behr等,Bioconjugate Chem.5:382-389(1994);Remy等,Bioconjugate Chem.5:647-654(1994);Gao等,Gene Therapy 2:710-722(1995);Ahmad等,Cancer Res.52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。这将在下面更详细地讨论。
使用基于RNA或DNA病毒的系统递送核酸利用了用于将病毒靶向体内的特定细胞并将病毒有效载荷运输到细胞核的高度进化的过程。病毒载体可以直接施用至患者(体内),或者它们可以用于体外处理体外的细胞,并且可以任选地将经修饰的细胞施用至患者(离体)。常规的基于病毒的系统可包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关和单纯疱疹病毒载体。利用逆转录病毒、慢病毒和腺相关病毒基因转移方法在宿主基因组整合是可能的,通常导致插入的转基因的长期表达。另外,已经在许多不同细胞类型和靶组织中观察到高转导效率。
逆转录病毒的趋性可以通过引入外来包膜蛋白、扩展靶细胞的潜在靶群体来改变。慢病毒载体是逆转录病毒载体,其能够转导或感染非分裂细胞并且通常产生高病毒滴度。因此逆转录病毒基因转移系统的选择将取决于靶组织。逆转录病毒载体包含顺式作用长末端重复序列,具有至多6-10kb外源序列的包装能力。最小顺式作用LTR足以用于载体的复制和包装,然后将其用于将治疗基因整合到靶细胞中以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的载体(参见,例如,Buchscher等,J.Virol.66:2731-2739(1992);Johann等,J.Virol.66:1635-1640(1992);Sommnerfelt等,Virol.176:58-59(1990);Wilson等,J.Virol.63:2374-2378(1989);Miller等,J.Virol.65:2220-2224(1991);PCT/US94/05700)。
另外,在其中优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中具有非常高的转导效率,并且不需要细胞分裂。使用这样的载体,已经获得了高滴度和表达水平。该载体可以在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体也可用于转导具有靶核酸的细胞,例如,在核酸和肽的体外产生中,以及用于体内和离体基因治疗程序(参见,例如,West等,Virology 160:38-47(1987);美国专利号4,797,368;WO 93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建在多篇文献中描述,包括美国专利号5,173,414;Tratschin等,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,等,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);和Samulski等,J.Virol.63:03822-3828(1989)。
本发明提供了含有或基本上由编码CRISPR系统的外源核酸分子组成的AVV,所述CRISPR系统,例如,多个盒,包括或由第一盒和第二盒或更多盒,有利地多至载体的包装大小限制,例如总共(包括第一盒)五个盒组成,所述第一盒包含或基本上由启动子、编码CRISPR-相关(Cas)蛋白(推定的核酸酶或解旋酶蛋白)(例如Cpf1)的核酸分子和终止子组成,所述第二盒或更多盒包含或基本上由启动子、编码指导RNA(gRNA)的核酸分子和终止子组成(例如,每个盒示意性地表示为启动子-gRNA1-终止子、启动子-gRNA2-终止子......启动子-gRNA(N)-终止子(其中N是可插入的数字,其为载体的包装大小限制的上限)),或两个或更多个个体rAAV,各自含有一个或多于一个盒的CRISPR系统,例如第一rAAV含有包含或基本上由启动子、编码Cas(例如Cas(Cpf1))的核酸分子和终止子组成的第一盒,并且第二rAAV含有多个、四个包含或基本上由启动子、编码指导RNA(gRNA)的核酸分子和终止子组成的盒(例如,每个盒示意性地表示为启动子-gRNA1-终止子、启动子-gRNA2-终止子......启动子-gRNA(N)-终止子(其中N是可插入的数字,其为载体的包装大小限制的上限)。由于rAAV是DNA病毒,本文中关于AAV或rAAV的讨论中的核酸分子有利地是DNA。在一些实施方式中,启动子有利地是人突触蛋白I启动子(hSyn)。用于将核酸递送至细胞的其他方法是本领域技术人员已知的。参见,例如,US20030087817,其通过引用并入本文。
在另一个实施方式中,科卡尔水疱病毒(Cocal vesiculovirus)包膜假型逆转录病毒载体颗粒被考虑(参见,例如,转让给Fred Hutchinson Cancer Research Center的美国专利公开号20120164118)。科卡尔病毒属于水疱病毒属,是哺乳动物水疱性口炎的致病因子。科卡尔病毒最初是从特立尼达的螨中分离出来的(Jonkers等,Am.J.Vet.Res.25:236-242(1964)),并且已经在特立尼达、巴西和阿根廷从昆虫、牛和马中鉴定。许多感染哺乳动物的水疱病毒已经从天然感染的节肢动物中分离出来,这表明它们是载体传播的。水疱病毒的抗体在生活在病毒流行和实验室获得的农村地区的人群中很常见;人类中的感染通常导致流感样症状。科卡尔病毒包膜糖蛋白在氨基酸水平上与VSV-G印第安纳株共享71.5%的同一性,并且水疱病毒的包膜基因的系统发育比较显示科卡尔病毒在水疱病毒中与VSV-G印第安纳株在血清学上不同,但最密切相关。Jonkers等,Am.J.Vet.Res.25:236-242(1964)and Travassos da Rosa等,Am.J.Tropical Med.&Hygiene 33:999-1006(1984)。科卡尔水疱病毒包膜假型逆转录病毒载体颗粒可包括例如慢病毒、α逆转录病毒、β逆转录病毒、γ逆转录病毒、δ逆转录病毒和ε逆转录病毒载体颗粒,其可包含逆转录病毒Gag、Pol和/或一种或多种辅助蛋白和科卡尔水疱病毒包膜蛋白。在这些实施方式的某些方面,Gag、Pol和辅助蛋白是慢病毒和/或γ逆转录病毒的。
在一些实施方式中,用本文所述的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方式中,细胞在其天然存在于受试者(任选地在其中再被引入)中时被转染。在一些实施方式中,被转染的细胞是取自受试者。在一些实施方式中,细胞衍生自取自受试者的细胞,例如细胞系。用于组织培养的多种细胞系是本领域已知的。细胞系的实例包括但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC,HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHODhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CMLBR293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR,及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(参见,例如,美国典型培养物保藏中心(ATCC)(Manassus,VA))。在一些实施方式中,用本文所述的一种或多种载体转染的细胞建立包含一种或多种载体衍生序列的新细胞系。在一些实施方式中,使用如本文所述的CRISPR系统的组分瞬时转染(例如通过瞬时转染一种或多种载体,或用RNA转染)并通过CRISPR复合物的活性修饰的细胞用于建立包含含有修饰但缺乏任何其他外源序列的细胞的新细胞系。在一些实施方式中,用本文所述的一种或多种载体瞬时或非瞬时转染的细胞,或衍生自这样的细胞的细胞系,被用于评估一种或多种测试化合物。
在一些实施方式中,设想将RNA和/或蛋白质直接导入宿主细胞。例如,CRISPR效应子可以以CRISPR效应子编码mRNA与体外转录的指导RNA一起递送。这样的方法可以减少确保CRISPR效应蛋白效应的时间,并进一步防止CRISPR系统组分的长期表达。
在一些实施方式中,本发明的RNA分子在脂质体或脂质转染制剂中递送,并且可以通过本领域技术人员公知的方法来制备。例如,在美国专利号593,972、5,589,466和5,580,859中描述了这样的方法,其通过引用并入本文。专门针对增强的和改进的siRNA递送至哺乳动物的递送系统已经被开发(参见,例如Shen等FEBS Let.2003,539:111-114;Xia等,Nat.Biotech.2002,20:1006-1010;Reich等,Mol.Vision.2003,9:210-216;Sorensen等,J.Mol.Biol.2003,327:761-766;Lewis等,Nat.Gen.2002,32:107-108and Simeoni等,NAR2003,31,11:2717-2724)并且可以应用于本发明。siRNA最近已成功用于抑制灵长类动物中的基因表达(参见,例如,Tolentino等,Retina24(4):660),其也可应用于本发明。
实际上,RNA递送是体内递送的有用方法。可以使用脂质体或颗粒将Cas9和gRNA(以及例如HR修复模板)递送到细胞中。因此,本发明的CRISPR酶(例如Cpf1)的递送和/或RNA的递送可以是RNA形式并且通过微泡、脂质体或颗粒。例如,可以将Cpf1mRNA和gRNA包装到脂质体颗粒中以在体内递送。脂质体转染试剂,例如LifeTechnologies的lipofectamine和市场上的其他试剂可以有效地将RNA分子递送到肝脏中。
递送RNA的手段也优选包括通过纳米颗粒(Cho,S.,Goldberg,M.,Son,S.,Xu,Q.,Yang,F.,Mei,Y.,Bogatyrev,S.,Langer,R.and Anderson,D.,Lipid-like nanoparticlesfor small interfering RNA delivery to endothelial cells,Advanced FunctionalMaterials,19:3112-3118,2010)或外泌体(Schroeder,A.,Levins,C.,Cortez,C.,Langer,R.,and Anderson,D.,Lipid-based nanotherapeutics for siRNA delivery,Journal ofInternal Medicine,267:9-21,2010,PMID:20059641)递送RNA。事实上,外泌体已经在siRNA递送(与CRISPR系统有一些类似之处的系统)中显示出特别有用。例如,El-Andaloussi S,等(“Exosome-mediated delivery of siRNA in vitro and in vivo.”NatProtoc.2012Dec;7(12):2112-26.doi:10.1038/nprot.2012.131.Epub 2012Nov 15.)描述外泌体如何是用于跨越不同生物屏障递送药物并且可以用于体外和体内递送siRNA的有前途的工具。他们的方法是通过转染表达载体产生靶向的外泌体,所述表达载体包含与肽配体融合的外泌体蛋白。然后将外泌体纯化并用转染的细胞上清液表征,随后将RNA加载到外泌体中。根据本发明的递送或施用可以用外泌体进行,特别是但不限于脑。维生素E(α-生育酚)可以与CRISPR Cas缀合并与高密度脂蛋白(HDL)一起递送至脑,例如以与Uno等(HUMANGENE THERAPY 22:711–719(June 2011))所做的相似的方式用于向大脑递送短干扰RNA(siRNA)。通过填充有磷酸盐缓冲盐水(PBS)或游离TocsiBACE或Toc-siBACE/HDL并与脑灌流试剂盒3(Alzet)连接的渗透性微型泵(型号1007D;Alzet,Cupertino,CA)对小鼠灌流。将脑灌流套管放置在中线前囟后约0.5mm处,用于灌流到背侧第三脑室。Uno等发现少至3nmol的Toc-siRNA与HDL可以通过相同的ICV灌流方法在相当程度上诱导靶标减少。本发明中,可以考虑将CRISPR Cas的类似剂量缀合到α-生育酚并且与靶向至脑的HDL共同施用于人,例如,可以考虑将约3nmol至约3μmol的CRISPR Cas靶向至脑。Zou等((HUMAN GENE THERAPY22:465-475(April 2011))描述了慢病毒介导的递送靶向PKCγ的短发夹RNA用于在大鼠脊髓中进行体内基因沉默的方法。Zou等通过鞘内导管施用了约10μl具有1×109转导单位(TU)/ml滴度的重组慢病毒。相似剂量的在慢病毒载体中表达的CRISPR Cas可以考虑在本发明中用于人,例如,可以考虑约10-50ml的在具有1×109转导单位(TU)/ml滴度的慢病毒中的CRISPR Cas。相似剂量的在靶向脑的慢病毒载体中表达的CRISPR Cas可以考虑在本发明中用于人,例如,可以考虑约10-50ml的在具有1×109个转导单位(TU)/ml滴度的慢病毒中的靶向脑的CRISPR Cas。
载体递送,例如质粒、病毒递送:CRISPR酶(例如Cpf1,和/或任何本发明的RNA,例如指导RNA)可以使用任何合适的载体(例如质粒或病毒载体,例如腺相关病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型,或其组合)递送。可以将Cpf1和一种或多种指导RNA包装到一种或多种载体中,例如质粒或病毒载体。在一些实施方式中,通过例如肌内注射将载体(例如质粒或病毒载体)递送至感兴趣的组织,而在其他时间,递送是通过静脉内、经皮、鼻内、口服、粘膜或其他递送方法递送。这样的递送可以通过单剂量或多剂量递送。本领域技术人员理解,本文中待递送的实际剂量可以变化很大,取决于多种因素,例如载体选择、靶细胞、生物、或组织、待治疗的受试者的总体条件、寻求的转化/修饰的程度、施用途径、施用模式、寻求的转化/修饰的类型等。
这样的剂量可以进一步包含例如载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油等)、稀释剂、药学上可接受的载体(例如,磷酸盐缓冲盐水)、药学上可接受的赋形剂和/或本领域已知的其他化合物。剂量可以进一步含有一种或多种药学上可接受的盐,例如无机酸盐,例如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;和有机酸的盐,例如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。另外,本文中还可以存在辅助物质,例如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球、聚合物、悬浮剂等。此外,一种或多种其他常规药物成分,例如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结块剂、填充剂、螯合剂、包衣剂、化学稳定剂等也可以存在,尤其是如果剂型是可重构形式。合适的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨醇酯80、苯乙醇、氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯,对羟基苯甲酸酯,乙基香草醛,甘油,苯酚,对氯苯酚,明胶,白蛋白及其组合。REMINGTON'S PHARMACEUTICAL SCIENCES(MackPub.Co.,N.J.1991)中有药学上可接受的赋形剂的详尽讨论,该文献通过引用并入本文。
在本文的一个实施方式中,递送是通过腺病毒,其可以是含有至少1×105个颗粒(也被称为颗粒单位,PU)的腺病毒载体的单加强剂量。在本文的一个实施方式中,剂量优选为至少约1×106个颗粒(例如,约1×106-1×1012个颗粒),更优选至少约1×107个颗粒,更优选至少约1×108个颗粒(例如,约1×108-1×1011个颗粒或约1×108-1×1012个颗粒),最优选至少约1×100个颗粒(例如,约1×109-1×1010个颗粒或约1×109-1×1012个颗粒),或甚至至少约1×1010个颗粒(例如,约1×1010-1×1012个颗粒)的腺病毒载体。或者,剂量包含不超过约1×1014个颗粒,优选不超过约1×1013个颗粒,甚至更优选不超过约1×1012个颗粒,甚至更优选不超过约1×1011个颗粒,最优选不超过约1×1010个颗粒(例如,不超过约1×109个颗粒)。因此,剂量可含有单剂量的腺病毒载体,其含有例如约1×106个颗粒单位(pu),约2×106pu,约4×106pu,约1×107pu,约2×107pu,约4×107pu,约1×108pu,约2×108pu,约4×108pu,约1×109pu,约2×109pu,约4×109pu,约1×1010pu,约2×1010pu,约4×1010pu,约1×1011pu,约2×1011pu,约4×1011pu,约1×1012pu,约2×1012pu,或约4×1012pu的腺病毒载体。参见,例如,于2013年6月4日授权的Nabel等的美国专利号8,454,972B2中的腺病毒载体;通过引用并入本文,及其第29栏第36-58行的剂量。在本文的一个实施方式中,腺病毒通过多剂量递送。
在本文的一个实施方式中,递送是通过AAV。用于将AAV体内递送至人的治疗有效剂量据信是在含有约1×1010至约1×1010功能性AAV/ml溶液的约20至约50ml的盐水溶液的范围内。可以调整剂量以平衡治疗益处与任何副作用。在本文的一个实施方式中,AAV剂量通常在约1×105至1×1050个基因组AAV、约1×108至1×1020个基因组AAV,约1×1010至约1×1016个基因组,或约1×1011至约1×1016个基因组AAV的浓度范围内。人剂量可以是约1×1013个基因组AAV。这样的浓度可以以约0.001ml至约100ml,约0.05至约50ml,或约10至约25ml的载体溶液递送。本领域普通技术人员通过建立剂量反应曲线的常规试验可以容易地确定其他有效剂量。参见,例如,于2013年3月26日授权的Hajjar等的美国专利号8,404,658B2,第27栏,第45-60行。
在可以在本发明的实践中使用的载体中,对于细胞中的宿主基因组中的整合,采用逆转录病毒基因转移方法(通常导致插入的转基因的长期表达)是可能的。在一个优选的实施方式中,逆转录病毒是慢病毒。另外,已经在许多不同细胞类型和靶组织中观察到高转导效率。逆转录病毒的趋向性可以通过引入外来包膜蛋白来改变,从而扩展靶细胞的潜在靶标群。逆转录病毒还可以被工程化以允许插入的转基因的条件型表达,使得只有某些细胞类型被慢病毒感染。细胞类型特异性启动子可用于靶向在特定细胞类型中的表达。慢病毒载体是逆转录病毒载体(因此慢病毒和逆转录病毒载体均可用于本发明的实践)。此外,优选慢病毒载体,因为它们能够转导或感染非分裂细胞并且通常产生高病毒滴度。因此,逆转录病毒基因转移系统的选择可取决于靶组织。逆转录病毒载体包含顺式作用长末端重复序列,具有至多6-10kb外源序列的包装能力。最小顺式作用LTR足以复制和包装载体,然后用于将期望的核酸整合到靶细胞中以提供永久性表达。可广泛用于本发明实践的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些(参见,例如,Buchscher等,(1992)J.Virol.66:2731-2739;Johann等,(1992)J.Virol.66:1635-1640;Sommnerfelt等,(1990)Virol.176:58-59;Wilson等,(1998)J.Virol.63:2374-2378;Miller等,(1991)J.Virol.65:2220-2224;PCT/US94/05700)。Zou等通过鞘内导管施用约10μl的具有1×109转导单位(TU)/ml滴度的重组慢病毒。这些种类的剂量可适于或外推到本发明中的逆转录病毒或慢病毒载体的使用。
Cpf1的载体包装
用于包装本发明Cpf1编码核酸分子,例如,DNA,到载体中,例如,病毒载体,以介导体内基因组修饰的方法可以包括:
·实现NHEJ介导的基因敲除:
·单病毒载体:
·包含两个或更多表达盒的载体:
·启动子-Cpf1编码核酸分子-终止子
·启动子-gRNA1-终止子
·启动子-gRNA2-终止子
·启动子-gRNA(N)-终止子(至多为载体的大小限制)
·双病毒载体:
·含有用于驱动Cpf1表达的一个表达盒的载体1
·启动子-Cpf1编码核酸分子-终止子
·含有用于驱动一种或多种指导RNA表达的一个或多个表达盒的载体2
·启动子-gRNA1-终止子
·启动子-gRNA(N)-终止子(至多为载体的大小限制)
·介导同源定向修复。
·除了上述单病毒载体和双病毒载体方法之外,还可以使用另外的载体来递送同源-定向修复模板。
用于驱动Cpf1编码核酸分子表达的启动子可包括:
-AAV ITR可用作启动子:这有利于消除对额外启动子元件(其可占据载体中的空间)的需要。释放的额外空间可用于驱动其他元件(gRNA等)的表达。此外,ITR活性相对较弱,因此可用于降低由于Cpf1过表达引起的潜在毒性。
-对于普遍存在的表达,可以使用的启动子包括:CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。
对于脑或其它CNS表达,可以使用的启动子:用于所有神经元的突触蛋白I,用于兴奋性神经元的CaMKIIα,用于GABA能神经元的GAD67或GAD65或VGAT,等。
对于肝脏表达,可以使用白蛋白启动子。
对于肺表达,可以使用SP-B。
对于内皮细胞,可以使用ICAM。
对于造血细胞,可以使用IFNβ或CD45。
对于成骨细胞,可以使用OG-2。
用于驱动指导RNA的启动子可包括:
-Pol III启动子如U6或H1
-使用Pol II启动子和内含子盒来表达gRNA
腺相关病毒(AAV)
Cpf1和一种或多种指导RNA可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型递送,特别地,使用来自例如美国专利号8,454,972(腺病毒的制剂、剂量)、8,404,658(AAV的制剂、剂量)和5,846,946(DNA质粒的制剂、剂量)以及临床试验和关于涉及慢病毒、AAV和腺病毒的临床试验的出版物的制剂和剂量。例如,对于AAV,施用途径、制剂和剂量可以如美国专利号8,454,972和涉及AAV的临床试验中那样。对于腺病毒,施用途径、制剂和剂量可以如美国专利号8,404,658和涉及腺病毒的临床试验中那样。对于质粒递送,施用途径、制剂和剂量可以如美国专利号5,846,946和涉及质粒的临床研究中那样。剂量可以基于或外推至平均70kg个体(例如,男性成年人),并且可以针对不同体重和物种的患者、受试者、哺乳动物进行调整。施用频率在医学或兽医(例如,医生、兽医)的范围内,取决于包括患者或受试者的年龄、性别、一般健康状况、其他状况以及所针对的特定失调的通常因素。可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性基因组修饰,Cpf1的表达可以由细胞类型特异性启动子驱动。例如,肝脏特异性表达可能使用白蛋白启动子和神经元特异性表达(例如,用于靶向CNS失调)可能使用突触蛋白I启动子。
就体内递送而言,AAV优于其他病毒载体有以下多个原因:
·低毒性(这可以是由于纯化方法不需要对可以激活免疫反应的细胞颗粒进行超速离心)和
·引起插入诱变的可能性低,因为它没有整合到宿主基因组中。
AAV的包装限制为4.5或4.75Kb。这意味着Cpf1以及启动子和转录终止子必须全部装入同一病毒载体。大于4.5或4.75Kb的构建体将导致病毒产生显著减少。SpCas9相当大,基因本身超过4.1Kb,这使得包装成AAV很困难。因此,本发明的实施方式包括利用较短的Cpf1同源物。例如:
rAAV载体优选在昆虫细胞中产生,例如,在无血清悬浮培养物中生长的草地贪夜蛾(Spodoptera frugiperda)Sf9昆虫细胞。无血清昆虫细胞可购自商业供应商,例如SigmaAldrich(EX-CELL405)。
因此这些物种在一般情况下是优选的Cpf1物种。
关于AAV,AAV可以是AAV1、AAV2、AAV5或其任何组合。可以针对待靶向的细胞选择AAV的AAV;例如,可以选择AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或其任何组合用于靶向脑或神经细胞;并且可以选择AAV4用于靶向心脏组织。AAV8可用于递送至肝脏。在本文中启动子和载体优选是单独的。关于这些细胞的某些AAV血清型的列表(参见,Grimm,D.等,J.Virol.82:5887-5911(2008))如下:
慢病毒
慢病毒是复杂的逆转录病毒,其具有在有丝分裂和有丝分裂后细胞两者中感染和表达其基因的能力。最常见的慢病毒是人类免疫缺陷病毒(HIV),它使用其他病毒的包膜糖蛋白来靶向广泛的细胞类型。
在另一个实施方式中,自失活慢病毒载体可以用于和/或适应于本发明的CRISPR-Cas系统,所述自失活慢病毒载体具有靶向由HIVtat/rev共有的共同外显子的siRNA、核仁定位的TAR诱饵和抗CCR5特异性锤头状核酶(参见,例如,DiGiusto等(2010)Sci TranslMed 2:36ra43)。可以收集每千克患者体重至少2.5×106个CD34+细胞,并在含有2μmol/L谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)和血小板生成素(10ng/ml)(CellGenix)的X-VIVO15培养基(Lonza)中在密度为2×106个细胞/ml下预刺激16至20小时。在75cm2铺有纤连蛋白(25mg/cm2)(RetroNectin,Takara Bio Inc.)的组织培养瓶中,可以用感染复数为5的慢病毒转导预刺激的细胞16至24小时。
已经公开了慢病毒载体用于帕金森氏病的治疗,参见,例如,美国专利公开号20120295960和美国专利号7303910和7351585。慢病毒载体也已公开用于治疗眼病,参见,例如,美国专利公开号20060281180、20090007284、US20110117189;US20090017543;US20070054961、US20100317109。还公开了慢病毒载体用于递送至脑,参见,例如,美国专利公开号US20110293571;US20110293571、US20040013648、US20070025970、US20090111106和美国专利号US7259015。
最小启动子的使用
本申请提供了一种用于将效应蛋白和至少一种CRISPR指导RNA递送至细胞的载体,所述载体包含可操作地连接至编码所述效应蛋白的多核苷酸序列的最小启动子和可操作地连接至编码至少一种指导RNA的多核苷酸序列的第二最小启动子,其中包含两个最小启动子和多核苷酸序列的载体序列的长度小于4.4Kb。在一个实施方式中,病毒是腺相关病毒(AAV)或腺病毒。在另一个实施方式中,效应蛋白是CRISPR酶。在另一个实施方式中,CRISPR酶是SaCas9、Cpf1、Cas13b或C2c2。
在一个相关方面,本发明提供一种用于将效应蛋白和至少一种CRISPR指导RNA递送至细胞的慢病毒载体,所述慢病毒载体包含可操作地连接至编码Cpf1的多核苷酸序列的启动子和可操作地连接至编码至少一种指导RNA的多核苷酸序列的第二启动子,其中所述多核苷酸序列是反向的。
在另一个方面,本发明提供了在细胞中表达效应蛋白和RNA指导的方法,所述方法包括导入根据本文公开的任何载体递送系统的载体。在用于递送效应蛋白的载体的一个实施方式中,最小启动子是Mecp2启动子、tRNA启动子或U6。在另一个实施方式中,最小启动子是组织特异性的。
载体的剂量
在一些实施方式中,通过例如肌内注射将载体(例如质粒或病毒载体)递送至感兴趣的组织,而在其他时间,递送是通过静脉内、经皮肤、鼻内、口服、粘膜或其他递送方法递送。这种递送可以通过单剂量或多剂量递送。本领域技术人员理解,本文待递送的实际剂量可以变化很大,取决于多种因素,例如载体选择、靶细胞、生物、或组织、待治疗的受试者的总体条件、寻求的转化/修饰的程度、施用途径、施用模式、寻求的转化/修饰的类型等。
这样的剂量可以进一步包含例如载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油等)、稀释剂、药学上可接受的载体(例如,磷酸盐缓冲盐水)、药学上可接受的赋形剂和/或本领域已知的其他化合物。剂量可以进一步含有一种或多种药学上可接受的盐,例如无机酸盐,例如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;和有机酸盐,例如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。另外,本文还可以存在辅助物质,例如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球、聚合物、悬浮剂等。此外,还可以存在一种或多种其他常规药物成分,例如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结块剂、填充剂、螯合剂、包衣剂、化学稳定剂等,尤其是如果剂型是可重构的形式。合适的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨醇酯80、苯乙醇、氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯,对羟基苯甲酸酯,乙基香草醛,甘油,苯酚,对氯苯酚,明胶,白蛋白及其组合。REMINGTON'S PHARMACEUTICAL SCIENCES(MackPub.Co.,N.J.1991)中有药学上可接受的赋形剂的详尽讨论,通过引用并入本文。
在本文的一个实施方式中,递送是通过腺病毒,其可以是含有至少1×105个颗粒(也被称为颗粒单位,PU)的腺病毒载体的单加强剂量。在本文的一个实施方式中,剂量优选为至少约1×106个颗粒(例如,约1×106-1×1012个颗粒),更优选至少约1×107个颗粒,更优选至少约1×108个颗粒(例如,约1×108-1×1011个颗粒或约1×108-1×1012个颗粒),最优选至少约1×100个颗粒(例如,约1×109-1×1010个颗粒或约1×109-1×1012个颗粒),或甚至至少约1×1010个颗粒(例如,约1×1010-1×1012个颗粒)的腺病毒载体。或者地,剂量包含不超过约1×1014个颗粒,优选不超过约1×1013个颗粒,甚至更优选不超过约1×1012个颗粒,甚至更优选不超过约1×1011个颗粒,最优选不超过约1×1010个颗粒(例如,不超过约1×109个颗粒)。因此,剂量可含有单剂量的腺病毒载体,其含有例如约1×106个颗粒单位(pu),约2×106pu,约4×106pu,约1×107pu,约2×107pu,约4×107pu,约1×108pu,约2×108pu,约4×108pu,约1×109pu,约2×109pu,约4×109pu,约1×1010pu,约2×1010pu,约4×1010pu,约1×1011pu,约2×1011pu,约4×1011pu,约1×1012pu,约2×1012pu,或约4×1012pu的腺病毒载体。参见,例如,于2013年6月4日授权的Nabel等的美国专利号8,454,972B2中的腺病毒载体;通过引用并入本文,以及其第29栏第36-58行的剂量。在本文的一个实施方式中,腺病毒通过多剂量递送。
在本文的一个实施方式中,递送是通过AAV。用于将AAV体内递送至人的治疗有效剂量据信是在含有约1×1010至约1×1010功能性AAV/ml溶液的约20至约50ml盐水溶液的范围内。可以调整剂量以平衡治疗益处与任何副作用。在本文的一个实施方式中,AAV剂量通常在约1×105至1×1050个基因组AAV、从约1×108至1×1020个基因组AAV,约1×1010至约1×1016个基因组,或约1×1011至约1×1016个基因组AAV的浓度范围内。人剂量可以是约1×1013个基因组AAV。这样的浓度可以以约0.001ml至约100ml,约0.05至约50ml,或约10至约25ml的载体溶液递送。本领域普通技术人员通过建立剂量反应曲线的常规试验可以容易地确定其他有效剂量。参见,例如,于2013年3月26日授权的Hajjar等的美国专利号8,404,658B2,第27栏,第45-60行。
在本文的一个实施方式中,递送是通过质粒。在这种质粒组合物中,剂量应该是引发反应的足够量的质粒。例如,质粒组合物中合适量的质粒DNA可以是每70kg个体约0.1至约2mg,或约1μg至约10μg。本发明的质粒通常包含(i)启动子;(ii)编码CRISPR酶的序列,其与所述启动子可操作地连接;(iii)可选择标志物;(iv)复制起始子;(v)在(ii)下游并与其可操作地连接的转录终止子。质粒还可以编码CRISPR复合物的RNA组分,但是这些中的一个或多个可以编码在不同的载体上。
本文的剂量是基于平均70kg的个体。施用频率在医学或兽医医师(例如,医生、兽医)或本领域技术人员的范围内。还注意到,在实验中使用的小鼠通常为约20g,并且从小鼠实验可以放大至70kg个体。
用于本文提供的组合物的剂量包括用于重复施用或重复给药的剂量。在特定的实施方式中,在数周、数月或数年的时间内重复施用。可以进行合适的测定以获得最佳剂量方案。重复施用可以允许使用较低剂量,这可以积极地影响脱靶修饰。
RNA递送
在特定的实施方式中,使用基于RNA的递送。在这些实施方式中,CRISPR效应蛋白的mRNA与体外转录的指导RNA一起递送。Liang等描述了使用基于RNA的递送的有效基因组编辑(Protein Cell.2015May;6(5):363–372)。
RNA递送:CRISPR酶(例如Cpf1)和/或任何本发明的RNA(例如指导RNA)也可以以RNA的形式递送。可以使用体外转录产生Cpf1mRNA。例如,可以使用含有以下元件的PCR盒合成Cpf1 mRNA:来自β珠蛋白-polyA尾的T7_promoter-kozak序列(GCCACC)-Cpf1-3’UTR(一串120或更多个腺嘌呤)。所述盒可用于通过T7聚合酶进行转录。指导RNA还可以使用从含有T7_启动子-GG-指导RNA序列的盒体外转录来转录。
为了增强表达并降低可能的毒性,可以修饰CRISPR酶编码序列和/或指导RNA以包含一种或多种经修饰的核苷,例如,使用假U或5-甲基-C。
mRNA递送方法目前特别适用于肝脏递送。
关于RNA递送的许多临床工作聚焦于RNAi或反义,但是这些系统可以被改进用于递送RNA以实施本发明。应相应地阅读以下对于RNAi等的参考文献。
CRISPR酶mRNA和指导RNA也可以单独递送。可以在指导RNA之前递送CRISPR酶mRNA,以给予表达CRISPR酶的时间。可以在施用指导RNA之前1-12小时(优选约2-6小时)施用CRISPR酶mRNA。
或者,CRISPR酶mRNA和指导RNA可以一起施用。有利地,第二加强剂量的指导RNA可以在初始施用CRISPR酶mRNA+指导RNA之后1-12小时(优选约2-6小时)施用。
RNP
在特定的实施方式中,预复合的指导RNA和CRISPR效应蛋白作为核糖核蛋白(RNP)递送。RNP的优势在于它们产生比RNA方法甚至更快的编辑效果,因为这个过程避免了对转录的需要。一个重要的优点是RNP递送都是瞬时的,减少了脱靶效应和毒性问题。Kim等(2014,Genome Res.24(6):1012-9),Paix等(2015,Genetics 204(1):47-54),Chu等(2016,BMC Biotechnol.16:4),和Wang等(2013,Cell.9;153(4):910-8)已经观察到不同细胞类型中的有效基因组编辑。
在特定的实施方式中,核糖核蛋白通过WO2016161516中描述的基于多肽的穿梭剂的方式递送。WO2016161516描述了使用合成肽有效转导多肽货物,所述合成肽包含与细胞穿透结构域(CPD)、富含组氨酸的结构域和CPD可操作地连接的内体渗漏结构域(ELD)。类似地,这些多肽可用于在真核细胞中递送基于CRISPR效应子的RNP。
实际上,RNA递送是体内递送的有用方法。可以使用脂质体或颗粒将Cpf1和gRNA(以及例如HR修复模板)递送到细胞中。因此,本发明的CRISPR酶(例如Cpf1)的递送和/或RNA的递送可以是RNA形式并且通过微泡、脂质体或颗粒。例如,可以将Cpf1 mRNA和gRNA包装到脂质体颗粒中以在体内递送。脂质体转染试剂,例如Life Technologies的lipofectamine和市场上的其他试剂可以有效地将RNA分子递送到肝中。
递送RNA的手段也优选包括通过纳米颗粒(Cho,S.,Goldberg,M.,Son,S.,Xu,Q.,Yang,F.,Mei,Y.,Bogatyrev,S.,Langer,R.and Anderson,D.,Lipid-like nanoparticlesfor small interfering RNA delivery to endothelial cells,Advanced FunctionalMaterials,19:3112-3118,2010)或外泌体(Schroeder,A.,Levins,C.,Cortez,C.,Langer,R.,and Anderson,D.,Lipid-based nanotherapeutics for siRNA delivery,Journal ofInternal Medicine,267:9-21,2010,PMID:20059641)递送RNA。事实上,外泌体已经在siRNA递送(与CRISPR系统有一些类似之处的系统)中显示出特别有用。例如,El-Andaloussi S,等(“Exosome-mediated delivery of siRNA in vitro and in vivo.”NatProtoc.2012Dec;7(12):2112-26.doi:10.1038/nprot.2012.131.Epub 2012Nov 15.)描述外泌体怎样是用于跨越不同生物屏障的药物递送的有前途的工具,并且可以用于体外和体内递送siRNA。他们的方法是通过转染表达载体产生靶向的外泌体,所述表达载体包含与肽配体融合的外泌体蛋白。然后将外泌体纯化并用转染的细胞上清液表征,随后将RNA加载到外泌体中。根据本发明的递送或施用可以用外泌体进行,特别是但不限于脑。维生素E(α-生育酚)可以与CRISPR Cas缀合并与高密度脂蛋白(HDL)一起递送至脑,例如以与Uno等(HUMAN GENE THERAPY 22:711–719(June 2011))所做的相似的方式用于向大脑递送短干扰RNA(siRNA)。通过填充有磷酸盐缓冲盐水(PBS)或游离TocsiBACE或Toc-siBACE/HDL并与脑灌流试剂盒3(Alzet)连接的渗透性微型泵(型号1007D;Alzet,Cupertino,CA)对小鼠灌流。将脑灌流套管放置在中线前囟后约0.5mm处,用于灌流到背侧第三脑室。Uno等发现少至3nmol的Toc-siRNA与HDL可以通过相同的ICV灌流方法在相当程度上诱导靶标减少。本发明中,可以考虑将CRISPR Cas的类似剂量缀合到α-生育酚并且与靶向至脑的HDL共同施用于人,例如,可以考虑将约3nmol至约3μmol的CRISPR Cas靶向至脑。
Zou等(HUMAN GENE THERAPY 22:465-475(April 2011))描述了慢病毒介导的递送靶向PKCγ的短发夹RNA用于在大鼠脊髓中进行体内基因沉默的方法。Zou等通过鞘内导管施用了约10μl的具有1×109转导单位(TU)/ml滴度的重组慢病毒。相似剂量的在慢病毒载体中表达的CRISPR Cas可以考虑在本发明中用于人,例如,可以考虑约10-50ml的在具有1×109转导单位(TU)/ml滴度的慢病毒中的CRISPR Cas。相似剂量的在靶向脑的慢病毒载体中表达的CRISPR Cas可以考虑在本发明中用于人,例如,可以考虑约10-50ml的在具有1×109个转导单位(TU)/ml滴度的慢病毒中的靶向脑的CRISPR Cas。
Anderson等(US 20170079916)提供了用于向受试者递送治疗剂、预防剂和/或诊断剂的经修饰的树状大分子纳米颗粒,其包含:一种或多种0至7代烷基化树状大分子;一种或多种两亲聚合物;和包封在其中的一种或多种治疗剂、预防剂和/或诊断剂。一种烷基化树状大分子可以选自聚(乙烯亚胺)、聚(聚丙烯亚胺)、二氨基丁烷胺聚丙烯亚胺四胺,和聚(酰氨基胺)。治疗剂、预防剂和诊断剂可选自蛋白质、肽、碳水化合物、核酸、脂质、小分子及其组合。
Anderson等(US 20160367686)提供了式(I)的化合物:
及其盐,其中RL的每个情况是独立地任选地取代的C6-C40烯基,和用于将试剂递送至受试者或细胞的包含所述化合物或其盐,试剂,和任选地赋形剂的组合物。试剂可以是有机分子、无机分子、核酸、蛋白质、肽、多核苷酸、靶向剂、同位素标记的化合物、疫苗、免疫剂或用于生物加工的试剂。组合物可进一步包含胆固醇、PEG化脂质、磷脂或载脂蛋白。
Anderson等(US20150232883)提供了递送颗粒制剂和/或系统,优选纳米颗粒递送制剂和/或系统,其包含(a)CRISPR-Cas系统RNA多核苷酸序列;或(b)Cas9;或(c)CRISPR-Cas系统RNA多核苷酸序列和Cas9;或(d)含有编码(a)、(b)或(c)的核酸分子的一种或多种载体,其中CRISPR-Cas系统RNA多核苷酸序列和Cas9不是天然存在在一起的。递送颗粒制剂可进一步包含表面活性剂、脂质或蛋白质,其中表面活性剂可包含阳离子脂质。
Anderson等(US20050123596)提供了微粒的实例,所述微粒被设计成在暴露于酸性条件时释放其有效负载,其中所述微粒包含至少一种待递送的试剂、pH引发剂和聚合物,其中所述聚合物选自聚甲基丙烯酸酯和聚丙烯酸酯。
Anderson等(US 20020150626)提供了用于核酸递送的脂质-蛋白质-糖颗粒,其中多核苷酸被包封在通过将多核苷酸与脂质、蛋白质和糖接触的脂质-蛋白-糖基质中;并且喷雾干燥多核苷酸、脂质、蛋白质和糖的混合物以制备微粒。
就局部递送至脑而言,这可以以各种方式实现。例如,材料可以纹状体内(intrastriatally)递送,例如,通过注射。注射可以通过开颅术立体定位进行。
增强NHEJ或HR效率也有助于递送。优选通过共表达末端加工酶例如Tre×2来增强NHEJ效率(Dumitrache等Genetics.2011 August;188(4):787–797)。优选通过瞬时抑制NHEJ机制例如Ku70和Ku86来提高HR效率。通过共表达原核或真核同源重组酶例如RecBCD、RecA也可以提高HR效率。
颗粒
在一些方面或实施方式中,可以使用包含递送颗粒制剂的组合物。在一些方面或实施方式中,制剂包含CRISPR复合物,所述复合物包括CRISPR蛋白和引导CRISPR复合物与靶序列序列特异性结合的指导。在一些实施方式中,递送颗粒包含基于脂质的颗粒,任选地脂质纳米颗粒,或阳离子脂质,和任选地可生物降解的聚合物。在一些实施方式中,阳离子脂质包含1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)。在一些实施方式中,亲水性聚合物包含乙二醇或聚乙二醇。在一些实施方式中,递送颗粒还包含脂蛋白,优选胆固醇。在一些实施方式中,递送颗粒的直径小于500nm,任选直径小于250nm,任选直径小于100nm,任选直径为35nm至约60nm。
已知多种类型的颗粒递送系统和/或制剂可用于多种生物医学应用。通常,颗粒被定义为在其运输和性质方面表现为整体单位的小物体。根据直径对颗粒进一步分类。粗颗粒的范围在2,500到10,000纳米之间。细颗粒的尺寸在100和2,500纳米之间。超细颗粒或纳米颗粒的尺寸通常在1至100纳米之间。100nm限制是基于这样的事实,即将颗粒与块状材料区分开的新特性通常在小于100nm的临界长度范围显现。
如本文所用,颗粒递送系统/制剂被定义为包含根据本发明的颗粒的任何生物递送系统/制剂。根据本发明的颗粒是具有小于100微米(μm)的最大尺寸(例如直径)的任何实体。在一些实施方式中,本发明的颗粒具有小于10μm的最大尺寸。在一些实施方式中,本发明的颗粒具有小于2000纳米(nm)的最大尺寸。在一些实施方式中,本发明的颗粒具有小于1000纳米(nm)的最大尺寸。在一些实施方式中,本发明的颗粒具有小于900nm、800nm、700nm、600nm、500nm、400nm、300nm、200nm或100nm的最大尺寸。通常,本发明的颗粒具有500nm或更小的最大尺寸(例如,直径)。在一些实施方式中,本发明的颗粒具有250nm或更小的最大尺寸(例如,直径)。在一些实施方式中,本发明的颗粒具有200nm或更小的最大尺寸(例如,直径)。在一些实施方式中,本发明的颗粒具有150nm或更小的最大尺寸(例如,直径)。在一些实施方式中,本发明的颗粒具有100nm或更小的最大尺寸(例如,直径)。在本发明的一些实施方式中,使用较小的颗粒,例如具有50nm或更小的最大尺寸。在一些实施方式中,本发明的颗粒具有25nm至200nm范围内的最大尺寸。
就本发明而言,优选的是使用纳米颗粒或脂质包膜递送CRISPR复合物的一种或多种组分,例如,CRISPR酶或mRNA或指导RNA。其他递送系统或载体可以与本发明的纳米颗粒方面结合使用。
通常,“纳米颗粒”是指直径小于1000nm的任何颗粒。在某些优选的实施方式中,本发明的纳米颗粒具有500nm或更小的最大尺寸(例如,直径)。在其他优选的实施方式中,本发明的纳米颗粒具有25nm至200nm范围内的最大尺寸。在其他优选的实施方式中,本发明的纳米颗粒具有100nm或更小的最大尺寸。在其他优选的实施方式中,本发明的纳米颗粒具有35nm和60nm范围内的最大尺寸。应当理解,在适当的情况下,本文提及的颗粒或纳米颗粒可以是可互换的。
应当理解,颗粒的尺寸将根据在装载之前或之后测量而不同。因此,在特定的实施方式中,术语“纳米颗粒”可仅适用于装载前的颗粒。
包含在本发明中的纳米颗粒可以以不同的形式提供,例如,作为固体纳米颗粒(例如,金属,例如银、金、铁、钛,非金属,基于脂质的固体、聚合物)、纳米颗粒的悬浮液或其组合。可以制备金属、电介质和半导体纳米颗粒,以及杂合结构(例如,核-壳纳米颗粒)。如果它们足够小(通常低于10nm)而发生电子能级的量子化,那么由半导体材料制成的纳米颗粒也可以是标记的量子点。这样的纳米级颗粒在生物医学应用中用作药物载体或成像剂,并且可以适应于本发明中的类似目的。
已经制造了半固体和软纳米颗粒,并且它们在本发明的范围内。半固体性质的原型纳米颗粒是脂质体。目前临床上使用各种类型的脂质体纳米颗粒作为抗癌药物和疫苗的递送系统。具有一半亲水性和另一半疏水性的纳米颗粒被称为Janus颗粒并且对于稳定乳剂特别有效。它们可以在水/油界面自组装并充当固体表面活性剂。
使用各种不同的技术进行颗粒表征(包括,例如,表征形态、尺寸等)。常用技术有电子显微镜(TEM、SEM)、原子力显微镜(AFM)、动态光散射(DLS)、X射线光电子能谱(XPS)、粉末X射线衍射(XRD)、傅立叶变换红外光谱(FTIR)、基质辅助激光解吸/电离飞行时间质谱(MALDI-TOF)、紫外-可见光谱、双极化干涉测量和核磁共振(NMR)。可以对天然颗粒(即,装载前)或在装载货物(本文中的货物是指例如CRISPR-Cas系统的一种或多种组分,例如CRISPR酶或mRNA或指导RNA,或其任何组合,并且可以包括另外的载体和/或赋形剂)之后进行表征(尺寸测量),以提供用于递送用于本发明的任何体外、离体和/或体内应用的具有最佳尺寸的颗粒。在某些优选的实施方式中,粒度(例如,直径)表征是基于使用动态激光散射(DLS)的测量。提及美国专利号8,709,843;美国专利号6,007,845;美国专利号5,855,913;美国专利号5,985,309;美国专利号5,543,158;以及James E.Dahlman and Carmen Barnes等的出版物,Nature Nanotechnology(2014)published online 11May 2014,doi:10.1038/nnano.2014.84,涉及颗粒、制备和使用它们及其测量的方法。
本发明范围内的颗粒递送系统可以任何形式提供,包括但不限于固体、半固体、乳剂或胶体颗粒。因此,本文所述的任何递送系统,包括但不限于例如基于脂质的系统、脂质体、微胶粒、微泡、外泌体或基因枪可以作为本发明范围内的颗粒递送系统提供。
可以使用颗粒或脂质包膜同时递送CRISPR酶mRNA和指导RNA;例如,本发明的CRISPR酶和RNA,例如作为复合物,可以通过颗粒递送,所述颗粒如Dahlman等,WO2015089419A2和其中引用的文献所述,例如7C1(参见,例如,James E.Dahlman andCarmen Barnes等Nature Nanotechnology(2014),于2014年5月11日在线公布,doi:10.1038/nnano.2014.84),例如,包含脂质或类脂质和亲水性聚合物的递送颗粒,所述亲水性聚合物例如是阳离子脂质和亲水性聚合物,例如其中阳离子脂质包含1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-二十四烷酰基-sn-甘油基-3-磷酸胆碱(DMPC),和/或其中亲水性聚合物包含乙二醇或聚乙二醇(PEG);和/或其中颗粒还包含胆固醇(例如,来自制剂1的颗粒=DOTAP 100、DMPC 0、PEG 0、胆固醇0;制剂编号2=DOTAP 90、DMPC 0、PEG 10、胆固醇0;制剂编号3=DOTAP 90、DMPC 0、PEG 5、胆固醇5),其中使用有效的多步骤方法形成颗粒,其中首先将效应蛋白和RNA混合在一起,例如以1:1的摩尔比,例如在室温下,例如,30分钟,例如,在无菌、无核酸酶的1X PBS中;分别地,将适用于制剂的DOTAP、DMPC、PEG和胆固醇溶解在乙醇中,例如100%乙醇;并且,将两种溶液混合在一起以形成含有复合物的颗粒。
可以使用颗粒或脂质包膜同时递送核酸靶向效应蛋白(例如V型蛋白质,如Cpf1)mRNA和指导RNA。合适的颗粒的实例包括但不限于US9,301,923中描述的那些。
例如,Su X,Fricke J,Kavanagh DG,Irvine DJ(“In vitro and in vivo mRNAdelivery using lipid-enveloped pH-responsive polymer nanoparticles”MolPharm.2011Jun 6;8(3):774-87.doi:10.1021/mp100390w.2011年4月1日在线公布)描述了具有被磷脂质双层壳包膜的聚(β-氨基酯)(PBAE)核的可生物降解的核-壳结构纳米颗粒。这些是为体内mRNA递送而开发的。选择pH响应性PBAE组分以促进内体破坏,同时选择脂质表面层以使聚阳离子核心的毒性最小化。因此,这些优选用于递送本发明的RNA。
Liu等(US 20110212179)提供了一种包含基础聚合物的双峰多孔聚合物微球,其中所述颗粒包含直径为约20至约500微米范围的大孔和直径为约1至约70微米范围的微孔,并且其中所述微球具有为约50至约1100微米的直径范围。
Berg等(US20160174546)提供了一种纳米脂质递送系统,特别是一种纳米颗粒浓缩物,其包含:包含脂质、油或溶剂的组合物,该组合物具有在25℃下小于100cP的粘度和大于25Kb的贝壳杉脂丁醇(Kauri Butanol)溶解度;和至少一种选自烷氧基化脂质、烷氧基化脂肪酸、烷氧基化醇、杂原子亲水脂质、杂原子亲水脂肪酸、杂原子亲水醇、稀释剂及其组合的两亲化合物,其中所述化合物衍生自在50℃下粘度小于1000cP的起始化合物,其中所述浓缩物配置成提供稳定的纳米乳剂,所述乳剂在稀释时具有小于100nm的D50和平均值平均粒度分布。
Liu等(US 20140301951)提供了一种原始细胞纳米结构,其包含:包含多个孔的多孔颗粒核;和包围所述多孔颗粒核以形成原始细胞的至少一个脂质双层,其中所述原始细胞能够将一种或多种货物组分装载到多孔颗粒核的多个孔中并穿过周围的脂质双层从多孔颗粒核释放一种或多种货物组分。
Chromy等(US 20150105538)提供了用于组装、溶解和/或纯化纳米脂蛋白颗粒中的膜相关蛋白的方法和系统,其包括在洗涤剂存在下进行的温度转换循环,其中在所述温度转换循环期间,纳米脂蛋白组分被带到高于和低于纳米脂蛋白颗粒的膜形成脂质的凝胶-液晶结晶转变温度的温度。
Bader等(US 20150250725)提供了一种制备脂质颗粒的方法,其包括以下步骤:i)提供包含变性载脂蛋白的第一溶液,ii)将第一溶液加入到包含至少两种脂质和洗涤剂但不含载脂蛋白的第二溶液中,和iii)从在ii)中获得的溶液中去除洗涤剂,从而产生脂质颗粒。
Mirkin等,(US20100129793)提供了一种制备复合颗粒的方法,其包括以下步骤:(a)将介电组分和磁性组分混合以形成第一中间体,(b)将所述第一中间体和金种子混合以形成第二中间体,(c)通过将所述第二中间体与金源和还原剂混合以在所述第二中间体上形成金壳,以形成所述复合颗粒。
在一个实施方式中,考虑了基于自组装生物粘附聚合物的颗粒/纳米颗粒,其可以应用于肽的口服递送、肽的静脉内递送和肽的鼻腔递送,所有这些都是到脑。也考虑其他实施方式例如口服吸收和眼部递送疏水性药物。分子包膜技术涉及工程化聚合物包膜,其被保护并递送至疾病部位(参见,例如,Mazza,M.等ACSNano,2013.7(2):1016-1026;Siew,A.,等摩尔Pharm,2012.9(1):14-28;Lalatsa,A.,等J Contr Rel,2012.161(2):523-36;Lalatsa,A.,等,摩尔Pharm,2012.9(6):1665-80;Lalatsa,A.,等摩尔Pharm,2012.9(6):1764-74;Garrett,N.L.,等J Biophotonics,2012.5(5-6):458-68;Garrett,N.L.,等JRaman Spect,2012.43(5):681-688;Ahmad,S.,等J Royal Soc Interface 2010.7:S423-33;Uchegbu,I.F.Expert Opin Drug Deliv,2006.3(5):629-40;Qu,X.,等Biomacro摩尔ecules,2006.7(12):3452-9和Uchegbu,I.F.,等Int J Pharm,2001.224:185-199)。考虑剂量为约5mg/kg,单剂量或多剂量,取决于靶组织。
在一个实施方式中,由MIT的Dan Anderson实验室开发的可以将RNA递送至癌细胞以阻止肿瘤生长的颗粒/纳米颗粒可以被使用/和/或适应于本发明的CRISPR Cas系统。特别是,Anderson实验室开发了用于新生物材料和纳米制剂的合成、纯化、表征和制剂的全自动化组合系统。参见,例如,Alabi等,Proc Natl Acad Sci U S A.2013Aug 6;110(32):12881-6;Zhang等,Adv Mater.2013Sep 6;25(33):4641-5;Jiang等,Nano Lett.2013Mar13;13(3):1059-64;Karagiannis等,ACS Nano.2012Oct 23;6(10):8484-7;Whitehead等,ACS Nano.2012Aug 28;6(8):6922-9和Lee等,Nat Nanotechnol.2012Jun 3;7(6):389-93。
由Tufts大学的Qiaobing Xu实验室开发的脂质颗粒可以用于/适应于本发明的癌症治疗递送系统。参见Wang等,J.Control Release,2017年1月31日,pii:S0168-3659(17)30038-X.doi:10.1016/j.jconrel.2017.01.037。[印刷前的电子版];等,Biomater Sci.,4(12):1773-80,2016年11月15日;Wang等,PNAS,113(11):2868-73 2016年3月15日;Wang等人,PloS One,10(11):e0141860.doi:10.1371/journal.pone.0141860.eCollection2015,2015年11月3日;Takeda等,Neural Regen Res.10(5):689-90,2015年5月;Wang等,Adv。Healthc Mater.,3(9):1398-403,2014年9月;和Wang等,Agnew Chem IntEd Engl.,53(11):2893-8,2014年3月10日。
美国专利申请20110293703涉及在多核苷酸的施用中也特别有用的类脂质化合物,其可用于递送本发明的CRISPR Cas系统。在一个方面,氨基醇类脂质化合物与待递送至细胞或受试者的试剂组合以形成微粒、纳米颗粒、脂质体或微胶粒。待由颗粒、脂质体或微胶粒递送的试剂可以是气体、液体或固体的形式,并且试剂可以是多核苷酸、蛋白质、肽或小分子。氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成或天然)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等组合以形成颗粒。然后这些颗粒可任选地与药物赋形剂组合以形成药物组合物。
美国专利公开号20110293703还提供了制备氨基醇类脂质化合物的方法。在合适的条件下,使一当量或多当量的胺与一当量或多当量的环氧化物封端的化合物反应以形成本发明的氨基醇类脂质化合物。在某些实施方式中,胺的所有氨基与环氧化物封端的化合物完全反应以形成叔胺。在其他的实施方式中,胺的所有氨基未与环氧化物封端的化合物完全反应以形成叔胺,从而在氨基醇类脂质化合物中产生伯胺或仲胺。这些伯胺或仲胺保持原样或可以与另一种亲电子试剂如不同的环氧化物封端的化合物反应。如本领域技术人员将理解的,使胺与少于过量的环氧化物封端的化合物反应将产生含有不同数量尾部的多种不同的氨基醇类脂质化合物。某些胺可以被用两种环氧化物衍生的化合物尾部完全地官能化,而其他分子将不被用环氧化物衍生的化合物尾部完全地官能化。例如,二胺或多胺可包括一个、两个、三个或四个离开分子的各个氨基部分的环氧化物衍生的化合物尾部,产生伯、仲和叔胺。在某些实施方式中,所有氨基未被完全官能化。在某些实施方式中,使用两种相同类型的环氧化物封端的化合物。在其他实施方式中,使用两种或更多种不同的环氧化物封端的化合物。氨基醇类脂质化合物的合成在有或没有溶剂的情况下进行,合成可在30-100℃,优选约50-90℃的较高温度下进行。制备的氨基醇类脂质化合物可任选地被纯化。例如,可以纯化氨基醇类脂质化合物的混合物以产生具有特定数量的环氧化物衍生的化合物尾部的氨基醇类脂质化合物。或者可以纯化混合物以产生特定的立体异构体或位置异构体。氨基醇类脂质化合物也可以被烷基卤化物(例如,甲基碘)或其他烷基化剂烷基化,和/或它们可以被酰化。
美国专利公开号20110293703还提供了通过本发明方法制备的氨基醇类脂质化合物的文库。这些氨基醇类脂质化合物可以使用涉及液体处理器、机器人、微量滴定板、计算机等的高通量技术制备和/或筛选。在某些实施方式中,氨基醇类脂质化合物通过它们转染多核苷酸或其他试剂(例如,蛋白质、肽、小分子)进入细胞的能力而筛选。
美国专利公开号20130302401涉及已经使用组合聚合制备的一类聚(β-氨基醇)(PBAA)。本发明的PBAA可以在生物技术和生物医学应用中作为包衣(例如用于医疗装置或植入物的薄膜或多层薄膜的包衣)、添加剂、材料、赋形剂、非生物污损剂、缩微成像试剂和细胞包封剂。当用作表面包衣时,这些PBAA在体外和体内均引起不同程度的炎症,取决于它们的化学结构。这类材料的大量化学多样性使我们能够识别在体外抑制巨噬细胞活化的聚合物包衣。此外,这些包衣在皮下植入羧化聚苯乙烯微颗粒后减少炎性细胞的募集并减少纤维化。这些聚合物可用于形成用于细胞包封的聚电解质复合胶囊。本发明还可以具有许多其他生物学应用,例如抗微生物包衣、DNA或siRNA递送和干细胞组织工程。美国专利公开号20130302401的教导可以应用于本发明的CRISPR Cas系统。
在另一个实施方式中,考虑了脂质纳米颗粒(LNP)。抗甲状腺素运载蛋白(antitransthyretin)小干扰RNA已被包封在脂质纳米颗粒中并递送至人(参见,例如,Coelho等,N Engl J Med 2013;369:819-29),并且这样的系统可以适应并应用于本发明的CRISPR Cas系统。考虑静脉内施用约0.01至约1mg/kg体重的剂量。考虑降低灌流相关反应风险的药物,例如地塞米松(dexamethasone)、对乙酰氨基酚(acetampinophen)、苯海拉明(diphenhydramine)或西替利嗪(cetirizine),并考虑雷尼替丁(ranitidine)。还考虑了每4周约0.3mg/kg共5剂的多剂量。
Zhu等(US20140348900)提供了使用多端口歧管制备脂质体、脂质盘和其他脂质纳米颗粒的方法,其中将含有有机溶剂的脂质溶液流与两种或更多种水溶液(例如缓冲液)混合。在一些方面,至少一些脂质流和水溶液不直接彼此相对。因此,该方法不需要稀释有机溶剂作为另外的步骤。在一些实施方式中,溶液之一还可含有活性药物成分(API)。该发明提供了用不同脂质制剂和不同有效负载制造脂质体的稳健方法。粒径、形态和生产规模可以通过改变端口尺寸和歧管端口数并通过选择脂质和水溶液的流量或流速进行控制。
Cullis等(US 20140328759)提供了直径为10-100nm的限制大小的脂质纳米颗粒,特别是包含围绕水性核的脂质双层。还公开了用于制备这种限制大小的脂质纳米颗粒的方法和设备。
Manoharan等(US 20140308304)提供了式(I)的阳离子脂质
或其盐,其中X是N或P;R’为不存在、氢或烷基;关于R1和R2,(i)R1和R2各自独立地为任选取代的烷基、烯基、炔基、环烷基、环烷基烷基、杂环或R10;(ii)R1和R2与它们所连接的氮原子一起形成任选取代的杂环;或(iii)R1和R2中的一个为任选取代的烷基、烯基、炔基、环烷基、环烷基烷基或杂环,另一个与(a)相邻的氮原子和(b)与氮原子相邻的(R)a基团形成4-10元杂环或杂芳基;R的每次出现独立地为-(CR3R4)-;R3和R4的每次出现独立地为H、卤素、OH、烷基、烷氧基、-NH2、烷基氨基或二烷基氨基;或R3和R4与它们直接连接的碳原子一起形成环烷基,其中与原子X*连接的每条链中不超过3个R基团是环烷基;R10的每次出现独立地选自PEG和基于聚(噁唑啉)、聚(环氧乙烷)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯基吡咯烷酮)、聚[N-(2-羟丙基)甲基丙烯酰胺]和聚(氨基酸)的聚合物,其中(i)PEG或聚合物是直链或支链的,(ii)PEG或聚合物由n个亚单元聚合,(iii)n是10至200个单元之间的聚合度平均数,和(iv)其中该式的化合物具有至多两个R10基团;Q为不存在或者--O--、--NH--、--S--、--C(O)O--、--OC(O)--、--C(O)N(R4)--、--N(R5)C(O)--、--S--S--、--OC(O)O--、--O--N.dbd.C(R5)--、--C(R5).dbd.N--O--、--OC(O)N(R5)--、--N(R5)C(O)N(R5)--、--N(R5)C(O)O--、--C(O)S--、--C(S)O--or--C(R5).dbd.N--O--C(O)--;Q1和Q2各自独立地为不存在、--O--、--S--、--OC(O)--、--C(O)O--、--SC(O)--、--C(O)S--、--OC(S)--、--C(S)O--、--S--S--、--C(O)(NR5)--、--N(R5)C(O)--、--C(S)(NR5)--、--N(R5)C(O)--、--N(R5)C(O)N(R5)--或--OC(O)O--;Q3和Q4各自独立地为H、-(CR3R4)-、芳基或胆固醇部分;A1、A2、A3和A4的每次出现独立地为--(CR5R5--CR5.dbd.CR5)--;R5的每次出现独立地为H或烷基;M1和M2的各自独立地为可生物降解的基团(例如,--OC(O)--、--C(O)O--、--SC(O)--、--C(O)S--、--OC(S)--、--C(S)O--、--S--S--、--C(R5).dbd.N--、--N.dbd.C(R5)--、--C(R5).dbd.N--O--、--O--N.dbd.C(R5)--、--C(O)(NR5)--、--N(R5)C(O)--、--C(S)(NR5)--、--N(R5)C(O)--、--N(R5)C(O)N(R5)--、--OC(O)O--、--OSi(R5).sub.2O--、--C(O)(CR3R4)C(O)O--或--OC(O)(CR3R4)C(O)--);Z为不存在、烯烃或--O--P(O)(OH)--O--;与Z连接的每个------为任选的键,使得当Z不存在时,Q3和Q4不直接共价键合在一起;a是1、2、3、4、5或6;b为0、1、2或3;c、d、e、f、i、j、m、n、q和r各自独立地为0、1、2、3、4、5、6、7、8、9或10;g和h各自独立地为0、1或2;k和l各自独立地为0或1,其中k和l中的至少一个为1;并且o和p各自独立地为0、1或2,其中Q3和Q4各自独立地与标有星号(X*)的叔原子通过8个或更多个原子的链分开。阳离子脂质可与其他脂质组分例如胆固醇和PEG-脂质一起使用以与寡核苷酸形成脂质纳米颗粒,以促进细胞摄取和内体逃逸,并在体外和体内敲低靶mRNA。
已经显示LNP在向肝脏递送siRNA方面非常有效(参见,例如,Tabernero等,CancerDiscovery,April 2013,Vol.3,No.4,pages 363-470),因此考虑用于递送编码CRISPR Cas的RNA至肝脏。可以考虑每两周约4剂的6mg/kg LNP的剂量。Tabernero等证实在以0.7mg/kg给药LNP的前2个周期后观察到肿瘤消退,并且到6个周期结束时,患者已经实现部分响应,淋巴结转移完全消退并且肝肿瘤显著缩小。在40个剂量后在该患者中获得完全响应,在接受剂量超过26个月后仍保持缓解并完成治疗。两名患有RCC和肝外部疾病(包括在使用VEGF通路抑制剂的先前治疗后正在进展的肾、肺和淋巴结)的患者在所有部位具有稳定的病情约8至12个月,并且一名PNET和肝转移的患者继续延长研究18个月(36个剂量),病情稳定。
然而,必须考虑LNP的电荷,因为阳离子脂质与带负电荷的脂质结合以诱导促进细胞内递送的非双层结构。因为静脉注射后带电荷的LNP被迅速从循环中清除,所以开发了pKa值低于7的可电离的阳离子脂质(参见,例如,Rosin等,摩尔ecular Therapy,vol.19,no.12,pages 1286-2200,Dec.2011)。带负电荷的聚合物例如RNA可以在其中可电离的脂质显示正电荷的低pH值(例如,pH 4)下装载到LNP中。然而,在生理pH值下,LNP表现出与较长的循环时间相兼容的低表面电荷。已经关注了四种可电离的阳离子脂质,即1,2-二亚氨基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油酰氧基-酮-N,N-二甲基-3-氨基丙烷(DLinKDMA)和1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经显示含有这些脂质的LNP siRNA系统在体内肝细胞中表现出显著不同的基因沉默特性,其效力根据使用因子VII基因沉默模型的系列DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP而变化(参见,例如,Rosin等,摩尔ecularTherapy,vol.19,no.12,pages 1286-2200,Dec.2011)。可考虑在LNP中或与LNP相关的1μg/ml剂量的LNP或CRISPR-Cas RNA的剂量,尤其是对于含有DLinKC2-DMA的制剂。
LNP和CRISPR CAS包封的制备可以从Rosin等,Molecular Therapy,vol.19,no.12,pages 1286-2200,Dec.2011使用和/或适应。阳离子脂质1,2-二亚油基-3-二甲基铵-丙烷(DLinDAP)、1,2-二乙烯基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油烯基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-O-[2”-(甲氧基聚乙二醇2000)琥珀酰基]-1,2-二肉豆蔻酰基-sn-二醇(PEG-S-DMG)和R-3-[(ω-甲氧基-聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻基丙基-3-胺(PEG-C-DOMG)可由Tekmira Pharmaceuticals(Vancouver,Canada)提供或合成。胆固醇可购自Sigma(St Louis,MO)。特定的CRISPR Cas RNA可包封在含有DLinDAP、DLinDMA、DLinK-DMA和DLinKC2-DMA(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG为40:10:40:10摩尔比)的LNP中。需要时,0.2%SP-DiOC18(Invitrogen,Burlington,Canada)可以被引入以评估细胞摄取、细胞内递送和生物分布。包封可以通过将包含阳离子脂质:DSPC:胆固醇:PEG-c-DOMG(摩尔比为40:10:40:10)的脂质混合物溶解在乙醇中至最终脂质浓度为10mmol/l来进行。该脂质的乙醇溶液可逐滴添加至50mmol/l柠檬酸盐、pH4.0,以形成多层泡囊,以产生30%乙醇体积/体积的终浓度。使用Extruder(NorthernLipids,Vancouver,Canada)通过两个堆叠的80nm核微孔聚碳酸酯过滤器在挤出多层泡囊后可以形成大的单层泡囊。可以通过将以2mg/ml溶解在含有30%乙醇体积/体积的50mg/ml、pH 4.0的柠檬酸盐的RNA逐滴加入挤出的预形成的大的单层泡囊并在31℃下孵育30分钟,同时持续混合至最终RNA/脂质重量比为0.06/1重量/重量以实现包封。使用Spectra/Por 2再生纤维素透析膜通过在pH 7.4的磷酸盐缓冲盐水(PBS)中透析16小时来进行乙醇的去除和制剂缓冲液的中和。纳米粒度分布可以通过使用NICOMP 370粒度分析仪、泡囊/强度模式和高斯拟合(Nicomp Particle Sizing,Santa Barbara,CA)的动态光散射来确定。所有三个LNP系统的粒度可以是~70nm的直径。RNA包封效率可以通过使用VivaPureDMiniH柱(Sartorius Stedim Biotech)从透析之前和之后收集的样品中除去游离RNA来确定。可以从洗脱的纳米颗粒中提取包封的RNA并在260nm处定量。通过使用来自WakoChemicals USA(Richmond,VA)的胆固醇E酶测定法测量泡囊中的胆固醇含量来确定RNA与脂质的比率。结合本文对LNP和PEG脂质的讨论,聚乙二醇化脂质体或LNP同样适用于递送CRISPR-Cas系统或其组分。
大的LNP的制备也可以从Rosin等,Molecular Therapy,vol.19,no.12,pages1286-2200,Dec.2011使用和/或适应。可以在含有DLinKC2-DMA、DSPC和胆固醇的乙醇中以50:10:38.5的摩尔比制备脂质预混合溶液(20.4mg/ml总脂质浓度)。可以以0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)将乙酸钠加入到脂质预混液中。随后通过在剧烈搅拌下将混合物与1.85体积的柠檬酸盐缓冲液(10mmol/l,pH 3.0)混合,使脂质水合,导致在含有35%乙醇的水性缓冲液中形成自发脂质体。脂质体溶液可以在37℃孵育,以允许粒度随时间增加。可以在孵育期间的不同时间取出等分试样以通过动态光散射(Zetasizer Nano ZS,MalvernInstruments,Worcestershire,UK)研究脂质体大小的变化。一旦达到期望的粒度,可以将PEG脂质水溶液(原液=10mg/ml PEG-DMG于35%(体积/体积)乙醇中)加入脂质体混合物中,得到最终PEG摩尔浓度为总脂质的3.5%。加入PEG-脂质后,脂质体应该是它们的大小,有效地淬灭进一步生长。然后可以以约1:10(重量:重量)的RNA与总脂质的比率将RNA加入空脂质体中,然后在37℃下孵育30分钟以形成负载的LNP。随后可将混合物在PBS中透析过夜,并用0.45μm注射器过滤器过滤。
预组装的包含Cpf1和crRNA的重组CRISPR-Cpf1复合物可以被转染,例如通过电穿孔,导致高突变率和不存在可检测的脱靶突变。Hur,J.K.等,Targeted mutagenesis inmice by electroporation of Cpf1 ribonucleoproteins,Nat Biotechnol.2016Jun6.doi:10.1038/nbt.3596[印刷前的电子版]。
在局部递送至大脑方面,这可以以各种方式来实现。例如,材料可以纹状体内递送,例如通过注射。注射可以通过开颅术立体定向进行。
增强NHEJ或HR效率也有助于递送。优选通过共表达末端加工酶例如Trex2来增强NHEJ效率(Dumitrache等Genetics.2011August;188(4):787–797)。优选通过瞬时抑制诸如Ku70和Ku86的NHEJ机制来提高HR效率。通过共表达原核或真核同源重组酶例如RecBCD、RecA也可以提高HR效率。
在一些实施方式中,可以使用基于糖的颗粒,例如GalNAc,如本文所述并参考WO2014118272(通过引用并入本文)和Nair,JK等,2014,Journal of the AmericanChemical Society 136(49),16958-16961)。除非另有说明,否则本文的教导,特别是关于递送的教导适用于所有颗粒。这可以被认为是基于糖的颗粒,并且本文提供了关于其他颗粒递送系统和/或制剂的进一步细节。因此,GalNAc可以被认为是本文所述的其他颗粒意义上的颗粒,使得一般用途和其他考虑因素,例如所述颗粒的递送,也适用于GalNAc颗粒。溶液-相缀合策略可以例如用于将作为PFP(五氟苯基)酯激活的三触角GalNAc簇(分子量~2000)附着到5’-己基氨基修饰的寡核苷酸(5’-HA ASO,摩尔重量~8000Da;等,Bioconjugate Chem.,2015,26(8),pp 1451–1455)上。类似地,已经描述了用于体内核酸递送的聚(丙烯酸酯)聚合物(参见WO2013158141,其通过引用并入本文)。在进一步的替代性实施方式中,可以使用将天然存在的血清蛋白与CRISPR纳米颗粒(或蛋白质复合物)预混合以改善递送(Akinc A等,2010,Molecular Therapy vol.18no.7,1357–1364)。
纳米线团(Nanoclews)
此外,可以使用纳米线团递送CRISPR系统,例如如Sun W等,Cocoon-like self-degradable DNA nanoclew for anticancer drug delivery.,J Am Chem Soc.2014Oct22;136(42):14722-5.doi:10.1021/ja5088024.Epub 2014Oct 13.;或Sun W等,Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9for GenomeEditing.,Angew Chem Int Ed Engl.2015Oct 5;54(41):12029-33.doi:10.1002/anie.201506030.Epub 2015Aug 27中所述。
LNP
在一些实施方式中,递送是通过将Cpf1蛋白或mRNA形式包封在脂质颗粒例如LNP中。因此,在一些实施方式中,考虑了脂质纳米颗粒(LNP)。抗甲状腺素运载蛋白(antitransthyretin)小干扰RNA已被包封在脂质纳米颗粒中并递送至人(参见,例如,Coelho等,N Engl J Med 2013;369:819-29),并且这样的系统可以适应并应用于本发明的CRISPR Cas系统。考虑静脉内施用约0.01至约1mg/kg体重的剂量。考虑降低灌流相关反应风险的药物,例如地塞米松(dexamethasone)、对乙酰氨基酚(acetampinophen)、苯海拉明(diphenhydramine)或西替利嗪(cetirizine),并考虑雷尼替丁(ranitidine)。还考虑了每4周约0.3mg/kg共5剂的多剂量。
已经显示LNP在向肝脏递送siRNA方面非常有效(参见,例如,Tabernero等,CancerDiscovery,April 2013,Vol.3,No.4,pages363-470),因此考虑用于递送编码CRISPR Cas的RNA至肝脏。可以考虑每两周施用约4剂6mg/kg LNP的剂量。Tabernero等证实在以0.7mg/kg LNP给药的前2个周期后观察到肿瘤消退,并且到6个周期结束时,患者已经实现部分响应,淋巴结转移完全消退并且肝肿瘤显著缩小。在40个剂量后在该患者中获得完全响应,在接受剂量超过26个月后仍保持缓解并完成治疗。两名患有RCC和肝外部疾病(包括在使用VEGF通路抑制剂的先前治疗后正在进展的肾、肺和淋巴结)的患者在所有部位具有稳定的病情约8至12个月,并且一名PNET和肝转移的患者继续延长研究18个月(36个剂量),病情稳定。
然而,必须考虑LNP的电荷,因为阳离子脂质与带负电荷的脂质结合以诱导促进细胞内递送的非双层结构。因为静脉注射后带电荷的LNP被迅速从循环中清除,所以开发了pKa值低于7的可电离的阳离子脂质(参见,例如,Rosin等,摩尔ecular Therapy,vol.19,no.12,pages 1286-2200,Dec.2011)。带负电荷的聚合物例如RNA可以在其中可电离的脂质显示正电荷的低pH值(例如,pH4)下装载到LNP中。然而,在生理pH值下,LNP表现出与较长的循环时间相兼容的低表面电荷。已经关注了四种可电离的阳离子脂质,即1,2-二亚氨基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油酰氧基-酮-N,N-二甲基-3-氨基丙烷(DLinKDMA)和1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经显示含有这些脂质的LNP siRNA系统在体内肝细胞中表现出显著不同的基因沉默特性,其效力根据使用因子VII基因沉默模型的系列DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP而变化(参见,例如,Rosin等,MolecularTherapy,vol.19,no.12,pages 1286-2200,Dec.2011)。可考虑在LNP中或与LNP相关的1μg/ml剂量的LNP或CRISPR-Cas RNA的剂量,尤其是对于含有DLinKC2-DMA的制剂。
LNP和CRISPR CAS包封的制备可以从Rosin等,Molecular Therapy,vol.19,no.12,pages 1286-2200,Dec.2011使用和/或适应。阳离子脂质1,2-二亚油基-3-二甲基铵-丙烷(DLinDAP)、1,2-二乙烯基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油烯基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-O-[2”-(甲氧基聚乙二醇2000)琥珀酰基]-1,2-二肉豆蔻酰基-sn-二醇(PEG-S-DMG)和R-3-[(ω-甲氧基-聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻基丙基-3-胺(PEG-C-DOMG)可由Tekmira Pharmaceuticals(Vancouver,Canada)提供或合成。胆固醇可购自Sigma(St Louis,MO)。特定的CRISPR Cas RNA可包封在含有DLinDAP、DLinDMA、DLinK-DMA和DLinKC2-DMA(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG为40:10:40:10摩尔比)的LNP中。需要时,0.2%SP-DiOC18(Invitrogen,Burlington,Canada)可以被引入以评估细胞摄取、细胞内递送和生物分布。包封可以通过将包含阳离子脂质:DSPC:胆固醇:PEG-c-DOMG(摩尔比为40:10:40:10)的脂质混合物溶解在乙醇中至最终脂质浓度为10mmol/l来进行。该脂质的乙醇溶液可逐滴添加至50mmol/l、pH 4.0的柠檬酸盐以形成多层泡囊,以产生30%乙醇体积/体积的终浓度。使用Extruder(NorthernLipids,Vancouver,Canada)通过两个堆叠的80nm核微孔聚碳酸酯过滤器在挤出多层泡囊后可以形成大的单层泡囊。可以通过将以2mg/ml溶解在含有30%乙醇体积/体积的50mg/ml、pH 4.0的柠檬酸盐的RNA逐滴加入挤出的预形成的大的单层泡囊并在31℃下孵育30分钟,同时持续混合至最终RNA/脂质重量比为0.06/1重量/重量以实现包封。使用Spectra/Por 2再生纤维素透析膜通过在pH 7.4的磷酸盐缓冲盐水(PBS)中透析16小时来进行乙醇的去除和制剂缓冲液的中和。纳米粒度分布可以通过使用NICOMP 370粒度分析仪、泡囊/强度模式和高斯拟合(Nicomp Particle Sizing,Santa Barbara,CA)的动态光散射来确定。所有三个LNP系统的粒度可以是~70nm的直径。RNA包封效率可以通过使用VivaPureDMiniH柱(Sartorius Stedim Biotech)从透析之前和之后收集的样品中除去游离RNA来确定。可以从洗脱的纳米颗粒中提取包封的RNA并在260nm处定量。通过使用来自WakoChemicals USA(Richmond,VA)的胆固醇E酶测定法测量泡囊中的胆固醇含量来确定RNA与脂质的比率。结合本文对LNP和PEG脂质的讨论,聚乙二醇化脂质体或LNP同样适用于递送CRISPR-Cas系统或其组分。
可以在含有DLinKC2-DMA、DSPC和胆固醇的乙醇中以50:10:38.5的摩尔比制备脂质预混合溶液(20.4mg/ml总脂质浓度)。可以以0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)将乙酸钠加入到脂质预混液中。随后通过在剧烈搅拌下将混合物与1.85体积的柠檬酸盐缓冲液(10mmol/l,pH 3.0)混合,使脂质水合,导致在含有35%乙醇的水性缓冲液中形成自发脂质体。脂质体溶液可以在37℃孵育,以允许粒度随时间增加。可以在孵育期间的不同时间取出等分试样以通过动态光散射(Zetasizer Nano ZS,Malvern Instruments,Worcestershire,UK)研究脂质体大小的变化。一旦达到期望的粒度,可以将PEG脂质水溶液(原液=10mg/ml PEG-DMG于35%(体积/体积)乙醇中)加入脂质体混合物中,得到最终PEG摩尔浓度为总脂质的3.5%。加入PEG-脂质后,脂质体应该是它们的大小,有效地淬灭进一步生长。然后可以以约1:10(重量:重量)的RNA与总脂质比率将RNA加入空脂质体中,然后在37℃下孵育30分钟以形成负载的LNP。随后可将混合物在PBS中透析过夜,并用0.45μm注射器过滤器过滤。
球形核酸(SNATM)构建体和其他纳米颗粒(特别是金纳米颗粒)也被考虑作为将CRISPR-Cas系统递送至预期靶标的手段。重要数据显示,基于核酸功能化的金纳米颗粒的AuraSense Therapeutics的球形核酸(SNATM)构建体是有用的。
可与本文教导结合使用的文献包括:Cutler等,J.Am.Chem.Soc.2011 133:9254-9257,Hao等,Small.2011 7:3158-3162,Zhang等,ACS Nano.2011 5:6962-6970,Cutler等,J.Am.Chem.Soc.2012134:1376-1391,Young等,Nano Lett.2012 12:3867-71,Zheng等,Proc.Natl.Acad.Sci.USA.2012 109:11975-80,Mirkin,Nanomedicine 20127:635-638Zhang等,J.Am.Chem.Soc.2012 134:16488-1691,Weintraub,Nature 2013 495:S14-S16,Choi等,Proc.Natl.Acad.Sci.USA.2013 110(19):7625-7630,Jensen等,Sci.Transl.Med.5,209ra152(2013)和Mirkin,等,Small,10:186-192.
含有RNA的自组装纳米颗粒可以用聚乙烯亚胺(PEI)构建,所述聚乙烯亚胺(PEI)用连接在聚乙二醇(PEG)远端的Arg-Gly-Asp(RGD)肽配体聚乙二醇化。该系统已被用作,例如,靶向表达整联蛋白(integrin)的肿瘤新血管系统并递送抑制血管内皮生长因子受体-2(VEGFR2)表达的siRNA从而实现肿瘤血管生成的手段(参见,例如,Schiffelers等,NucleicAcids Research,2004,Vol.32,No.19)。纳米复合物可以通过混合等体积的阳离子聚合物和核酸的水溶液以在2至6的范围内产生可电离的氮(聚合物)相对于磷酸盐(核酸)的净摩尔过量来制备。阳离子聚合物和核酸之间的静电相互作用导致形成具有约100nm平均粒度分布的复合物,因此在本文中称为纳米复合物。设想将约100至200mg CRISPR Cas的剂量用于递送Schiffelers等的自组装纳米颗粒。
Bartlett等的纳米复合物(PNAS,September 25,2007,vol.104,no.39)也可以应用于本发明。Bartlett等的纳米复合物是通过混合等体积的阳离子聚合物和核酸水溶液以在2至6的范围内产生可电离的氮(聚合物)与磷酸盐(核酸)的净摩尔过量来制备。阳离子聚合物与核酸之间的静电相互作用导致形成具有约100nm平均粒度分布的复合物,因此在本文中称为纳米复合物。Bartlett等的DOTA-siRNA通过如下步骤合成:从Macrocyclics(Dallas,TX)订购1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(N-羟基琥珀酰亚胺酯)(DOTA-NHSester)。将在碳酸盐缓冲液(pH 9)中的具有100倍摩尔过量的DOTA-NHS-酯的胺修饰的RNA正义链加入微量离心管中。通过在室温下搅拌4小时使内容物反应。将DOTA-RNA正义缀合物进行乙醇沉淀,重悬于水中,并与未修饰的反义链退火,得到DOTA-siRNA。用Chelex-100(Bio-Rad,Hercules,CA)预处理所有液体以除去痕量金属污染物。可以通过使用含有环糊精的聚阳离子形成Tf靶向和非靶向siRNA纳米颗粒。通常,纳米颗粒以3(+/-)的电荷比和0.5克/升的siRNA浓度在水中形成。用Tf(金刚烷-PEG-Tf)修饰靶向纳米颗粒表面上1%的金刚烷-PEG分子。将纳米颗粒悬浮在5%(重量/体积)葡萄糖载体溶液中用于注射。
Davis等(Nature,Vol 464,15April 2010)进行了使用靶向纳米颗粒递送系统的RNA临床试验(临床试验注册号NCT00689065)。在21天周期的第1、3、8和10天通过30分钟静脉内灌流向患有标准疗法难以治疗的实体癌的患者施用靶向一定剂量的纳米颗粒。纳米颗粒由合成递送系统组成,所述系统包括:(1)线性环糊精基聚合物(CDP),(2)展示在纳米颗粒的外部以接触癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体,(3)亲水聚合物(用于促进纳米颗粒在生物体液中的稳定性的聚乙二醇(PEG))和(4)设计用于降低RRM2表达的siRNA(临床中使用的序列先前表示为siR2B+5)。长期以来已知TFR在恶性细胞中上调,并且RRM2是已建立的抗癌靶标。已经显示这些纳米颗粒(临床版本表示为CALAA-01)在非人灵长类动物的多剂量研究中具有良好的耐受性。虽然患有慢性粒细胞白血病的单个患者已通过脂质体递送施用siRNA,但Davis等的临床试验是用靶向递送系统全身递送siRNA并用于治疗患有实体癌的患者的最初人体试验。为了确定靶向递送系统是否能够为人的肿瘤提供功能性siRNA的有效递送,Davis等调查了来自三个不同剂量组的三名患者的活组织检查;患者A、B和C均患有转移性黑色素瘤,并分别接受剂量为18、24和30mg m-2siRNA的CALAA-01。对于本发明的CRISPR Cas系统也可以考虑类似的剂量。本发明的递送可以通过包含线性环糊精基聚合物(CDP)、展示在纳米颗粒的外部以接触癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体,和/或亲水聚合物(例如,用于促进生物流体中纳米颗粒稳定性的聚乙二醇(PEG))的纳米颗粒来实现。
通过引用并入本文的美国专利号8,709,843提供了用于将含治疗剂的颗粒靶向递送至组织、细胞和细胞内区室的药物递送系统。本发明提供了包含与表面活性剂、亲水聚合物或脂质缀合的聚合物的靶向颗粒。
通过引用并入本文的美国专利号6,007,845提供了具有多嵌段共聚物核的颗粒,所述多嵌段共聚物通过将多官能化合物与一种或多种疏水聚合物和一种或多种亲水聚合物共价连接而形成,并且含有生物活性物质。
通过引用并入本文的美国专利号5,855,913提供了一种颗粒组合物,所述颗粒组合物包含振实密度小于0.4g/cm3、平均直径为5μm至30μm之间的空气动力学轻质颗粒,在其表面上引入表面活性剂用于向肺系统递送药物。
通过引用并入本文的美国专利号5,985,309提供了包含带正电或带负电的治疗剂或诊断剂的表面活性剂和/或亲水性或疏水性复合物以及带相反电荷的带电分子的用于递送至肺部系统的颗粒。
通过引用并入本文的美国专利号5,543,158提供了可生物降解的可注射颗粒,所述颗粒具有可生物降解的固体核,在表面上含有生物活性物质和聚(烷二醇)部分。
通过引用并入本文的WO2012135025(也公布为US20120251560)描述了缀合的聚乙烯亚胺(PEI)聚合物和缀合的氮杂大环(统称为“缀合的脂质体”或“脂质体”)。在某些实施方式中,可以设想这种缀合的脂质体可以用于CRISPR-Cas系统的背景中,以实现包括调节蛋白质表达的体外、离体和体内基因组扰动以修饰基因表达。
在一个实施方式中,纳米颗粒可以是环氧化物修饰的脂质-聚合物,有利地是7C1(参见,例如,James E.Dahlman and Carmen Barnes等Nature Nanotechnology(2014),2014年5月11日在线公布,doi:10.1038/nnano.2014.84)。通过使C15环氧化物封端的脂质与PEI600以14:1的摩尔比反应来合成C71,并与C14PEG2000一起配制以产生在PBS溶液中稳定至少40天的纳米颗粒(直径在35和60nm之间)。
环氧化物修饰的脂质聚合物可用于将本发明的CRISPR-Cas系统递送至肺、心血管或肾细胞,然而,本领域技术人员可使系统适应于递送至其他靶器官。设想的剂量范围为约0.05至约0.6mg/kg。还设想了数天或数周的剂量,总剂量为约2mg/kg。
在一些实施方式中,用于递送RNA分子的LNP由本领域已知的方法制备,如描述于以下的那些,例如,WO 2005/105152(PCT/EP2005/004920)、WO 2006/069782(PCT/EP2005/014074)、WO2007/121947(PCT/EP2007/003496)和WO2015/082080(PCT/EP2014/003274),它们通过引用并入本文。特定目的在于增强和改善siRNA递送到哺乳动物细胞中的LNP描述于例如Aleku等,Cancer Res.,68(23):9788-98(Dec.1,2008),Strumberg等,Int.J.Clin.Pharmacol.Ther.,50(1):76-8(Jan.2012),Schultheis等,J.Clin.Oncol.,32(36):4141-48(Dec.20,2014),和Fehring等,摩尔.Ther.,22(4):811-20(Apr.22,2014),它们通过引用并入本文并且可以应用于本技术。
在一些实施方式中,LNP包括WO 2005/105152(PCT/EP2005/004920)、WO 2006/069782(PCT/EP2005/014074)、WO 2007/121947(PCT/EP2007/003496)和WO 2015/082080(PCT/EP2014/003274)中公开的任何LNP。
在一些实施方式中,LNP包含至少一种具有式I的脂质:
其中R1和R2各自且独立地选自包括烷基的组,n是1-4之间的任何整数,并且R3是选自包括赖氨酰基、鸟氨酰基、2,4-二氨基丁酰基、组氨酰基和根据式II的酰基部分的组的酰基:
其中m是1至3的任何整数,Y-是药学上可接受的阴离子。在一些实施方式中,根据式I的脂质包含至少两个不对称C原子。在一些实施方式中,式I的对映异构体包括但不限于R-R;S-S;R-S和S-R对映异构体。
在一些实施方式中,R1是月桂基并且R2是肉豆蔻基。在另一个实施方式中,R1是棕榈基并且R2是油基。在一些实施方式中,m为1或2。在一些实施方式中,Y-选自卤素、乙酸根或三氟乙酸根。
在一些实施方式中,LNP包含一种或多种选自如下的脂质:
β-精氨酰-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐(式III):
β-精氨酰-2,3-二氨基丙酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐(式IV):
ε-精氨酰-赖氨酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐(式V):
在一些实施方式中,LNP还包含组分。作为实例,但不作为限制,在一些实施方式中,所述组分选自肽、蛋白质、寡核苷酸、多核苷酸、核酸或其组合。在一些实施方式中,所述组分是抗体,例如,单克隆抗体。在一些实施方式中,所述组分是选自例如核糖酶、适体、spiegelmers、DNA、RNA、PNA、LNA或其组合的核酸。在一些实施方式中,核酸是gRNA和/或mRNA。
在一些实施方式中,LNP的组分包含编码CRIPSR效应蛋白的mRNA。在一些实施方式中,LNP的组分包含编码II型、V型或VI型CRIPSR效应蛋白的mRNA。在一些实施方式中,LNP的组分包含编码RNA指导的DNA结合蛋白的mRNA。在一些实施方式中,LNP的组分包含编码RNA指导的RNA结合蛋白的mRNA。
在一些实施方式中,LNP的组分还包含一种或多种指导RNA。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至血管内皮。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至肺内皮。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至肝脏。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至肺。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至心脏。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至脾脏。在一些实施例中,LNP被配置成递送上述mRNA并将RNA引导至肾脏。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至胰腺。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至脑。在一些实施方式中,LNP被配置成递送上述mRNA并将RNA引导至巨噬细胞。
在一些实施方式中,LNP还包括至少一种辅助脂质。在一些实施方式中,所述辅助脂质选自磷脂和类固醇。在一些实施方式中,磷脂是磷酸的二和/或单酯。在一些实施方式中,磷脂是磷酸甘油酯和/或鞘脂。在一些实施方式中,类固醇是基于部分氢化的环戊[a]菲的天然存在的和/或合成的化合物。在一些实施方式中,类固醇含有21至30个C原子。在一些实施方式中,类固醇是胆固醇。在一些实施方式中,辅助脂质选自1,2-二羟基乙酰基-sn-甘油基-3-磷酸乙醇胺(DPhyPE)、神经酰胺和1,2-二油基-甘油基-3-磷酸乙醇胺(DOPE)。
在一些实施方式中,至少一种辅助脂质包含选自包括PEG部分、HEG部分、聚羟乙基淀粉(polyHES)部分和聚丙烯部分的组的部分。在一些实施方式中,所述部分具有约500至10,000Da或约2,000至5,000Da之间的分子量。在一些实施方式中,PEG部分选自1,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺,1,2-二烷基-sn-甘油基-3-磷酸乙醇胺和神经酰胺-PEG。在一些实施方式中,PEG部分具有约500至10,000Da或约2,000至5,000Da的分子量。在一些实施方式中,PEG部分具有2,000Da的分子量。
在一些实施方式中,辅助脂质为组合物的总脂质含量的约20摩尔%至约80摩尔%之间。在一些实施方式中,辅助脂质组分为LNP的总脂质含量的约35摩尔%至65摩尔%之间。在一些实施方式中,LNP包含50摩尔%的脂质,并且辅助脂质为LNP的总脂质含量的50摩尔%。
在一些实施方式中,LNP包含β-3-精氨酰-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐、β-精氨酰-2,3-二氨基丙酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐或ε-精氨酰-赖氨酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐与DPhyPE的组合中的任一种,其中DPhyPE的含量为LNP的总脂质含量的约80摩尔%、65摩尔%、50摩尔%和35摩尔%。在一些实施方式中,LNP包含β-精氨酰-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐(脂)和1,2-二植烷酰-sn-甘油基-3-磷酸乙醇胺(辅助脂质)。在一些实施方式中,LNP包含β-精氨酰-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐(脂质)、1,2-二羟基酰基-sn-甘油基-3-磷酸乙醇胺(第一辅助脂质)和1,2-二乙酰基-sn-甘油基-3-磷酸乙醇胺-PEG2000(第二辅助脂质)。
在一些实施方式中,第二辅助脂质是总脂质含量的约0.05摩尔%至4.9摩尔%之间或约1摩尔%至3%摩尔之间。在一些实施方式中,LNP包含占总脂质含量的约45摩尔%至50摩尔%的脂质、占总脂质含量的约45摩尔%至50摩尔%的第一辅助脂质,条件是聚乙二醇化的第二辅助脂质为总脂质含量的约0.1摩尔%至5摩尔%之间、约1摩尔%至4摩尔%之间或约2摩尔%,其中脂质、第一辅助脂质和第二辅助脂质的含量的总和是总脂质含量的100摩尔%,并且其中第一辅助脂质和第二辅助脂质的总和是总脂质含量的50摩尔%。在一些实施方式中,LNP包含:(a)50摩尔%的β-精氨酰-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐、48摩尔%的1,2-二植烷酰-sn-甘油基-3-磷酸乙醇胺;和2摩尔%的1,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺-PEG2000;或(b)50摩尔%的β-精氨酰-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐、49摩尔%的1,2-二植烷酰-sn-甘油基-3-磷酸乙醇胺;1摩尔%N(羰基-甲氧基聚乙二醇-2000)-1,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺或其钠盐。
在一些实施方式中,LNP含有核酸,其中核酸骨架磷酸盐相对于阳离子脂质氮原子的电荷比率为约1:1.5-7或约1:4。
在一些实施方式中,LNP还包括在体内条件下可从脂质组合物中去除的遮蔽化合物。在一些实施方式中,遮蔽化合物是生物惰性化合物。在一些实施方式中,遮蔽化合物在其表面或分子上不带有任何电荷。在一些实施方式中,遮蔽化合物是聚乙二醇(PEG)、羟乙基葡萄糖(HEG)基聚合物、聚羟乙基淀粉(聚HES)和聚丙烯。在一些实施方式中,PEG、HEG、聚HES和聚丙烯的重量在约500至10,000Da或约2000至5000Da之间。在一些实施方式中,遮蔽化合物是PEG2000或PEG5000。
在一些实施方式中,LNP包含至少一种脂质、第一辅助脂质和在体内条件下可从脂质组合物中去除的遮蔽化合物。在一些实施方式中,LNP还包含第二辅助脂质。在一些实施方式中,第一辅助脂质是神经酰胺。在一些实施方式中,第二辅助脂质是神经酰胺。在一些实施方式中,神经酰胺包含至少一个6至10个碳原子的短碳链取代基。在一些实施方式中,神经酰胺包含8个碳原子。在一些实施方式中,遮蔽化合物与神经酰胺连接。在一些实施方式中,遮蔽化合物与神经酰胺连接。在一些实施方式中,遮蔽化合物与神经酰胺共价连接。在一些实施方式中,遮蔽化合物通过接头与核酸连接。在一些实施方式中,接头在生理条件下被切割。在一些实施方式中,接头选自ssRNA、ssDNA、dsRNA、dsDNA、肽、S-S-接头和pH敏感接头。在一些实施方式中,接头部分连接至核酸正义链的3’末端。在一些实施方式中,遮蔽化合物包含pH敏感接头或pH敏感部分。在一些实施方式中,pH敏感接头或pH敏感部分是阴离子接头或阴离子部分。在一些实施方式中,阴离子接头或阴离子部分在酸性环境中较不阴离子性或中性。在一些实施方式中,pH敏感接头或pH敏感部分选自低聚(谷氨酸)、低聚酚酸盐和二亚乙基三胺五乙酸。
在前一段中的任何LNP实施方式中,LNP可具有约50至600mosmole/kg、约250至350mosmole/kg或约280至320mosmole/kg之间的渗透压,和/或其中由脂质和/或一种或两种辅助脂质和遮蔽化合物形成的LNP的粒度为约20-200nm,约30-100nm,或约40-80nm之间。
在一些实施方式中,遮蔽化合物提供了在体内更长的循环时间,并允许包含LNP的核酸的更好的生物分布。在一些实施方式中,遮蔽化合物防止LNP与LNP被施用于其中的血清化合物或其他体液或细胞质膜(例如,血管系统内皮衬里的细胞质膜)的化合物立即相互作用。另外地或替代地,在一些实施方式中,遮蔽化合物还防止免疫系统的元件立即与LNP相互作用。另外地或替代地,在一些实施方式中,遮蔽化合物充当抗调理化合物。不希望受任何机制或理论的束缚,在一些实施方式中,遮蔽化合物形成减少LNP可用于与其环境相互作用的表面积的覆盖物或包衣。另外地或替代地,在一些实施例中,遮蔽化合物遮蔽LNP的总电荷。
在另一个实施方式中,LNP包含至少一种具有式VI的阳离子脂质:
其中n为1、2、3或4,其中m为1、2或3,其中Y-为阴离子,其中每个R1和R2各自独立地选自直链C12-C18烷基和直链C12-C18烯基、甾醇化合物,其中所述甾醇化合物选自胆固醇和豆甾醇和聚乙二醇化脂质,其中所述聚乙二醇化脂质包含PEG部分,其中所述聚乙二醇化脂质选自以下:
式VII的聚乙二醇化磷酸乙醇胺:
其中R3和R4个体地且独立地为直链C13-C17烷基,p为15至130之间的任何整数;
式VIII的聚乙二醇化神经酰胺:
其中R5是直链C7-C15烷基,q是15-130之间的任何数字;和
式IX的聚乙二醇化二酰基甘油:
其中R6和R7各自个体地且独立地为直链C11-C17烷基,并且r为15至130的任何整数。
在一些实施方式中,R1和R2彼此不同。在一些实施方式中,R1是棕榈基,R2是油基。在一些实施方式中,R1是月桂基,R2是肉豆蔻基。在一些实施方式中,R1和R2是相同的。在一些实施方式中,每个R1和R2各自独立地选自C12烷基、C14烷基、C16烷基和C18烷基、C12烯基、C14烯基、C16烯基和C18烯基。在一些实施方式中,C12烯基、C14烯基、C16烯基和C18烯基各自包含一个或两个双键。在一些实施方式中,C18烯基是在C9和C10之间具有一个双键的C18烯基。在一些实施方式中,C18烯基是顺式-9-十八烷基。
在一些实施方式中,阳离子脂质是式X的化合物:
在一些实施方式中,Y-选自卤素、乙酸根和三氟乙酸根。在一些实施方式中,阳离子脂质是式III的β-精氨酰-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐:
在一些实施方式中,阳离子脂质是式IV的β-精氨酰-2,3-二氨基丙酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐:
在一些实施方式中,阳离子脂质是式V的ε-精氨酰-赖氨酸-N-月桂基-N-肉豆寇基-酰胺三盐酸盐:
在一些实施方式中,甾醇化合物是胆固醇。在一些实施方式中,甾醇化合物是豆甾醇。
在一些实施方式中,聚乙二醇化脂质的PEG部分具有约800至5000Da的分子量。在一些实施方式中,聚乙二醇化脂质的PEG部分的分子量为约800Da。在一些实施方式中,聚乙二醇化脂质的PEG部分的分子量为约2,000Da。在一些实施方式中,聚乙二醇化脂质的PEG部分的分子量为约5,000Da。在一些实施方式中,聚乙二醇化脂质为式VII的聚乙二醇化磷酸乙醇胺,其中R3和R4各自个体地且独立地为直链C13-C17烷基,并且p是来自18、19或20,或44、45或46或113、114或115的任何整数。在一些实施方式中,R3和R4是相同的。在一些实施方式中,R3和R4是不同的。在一些实施方式中,每个R3和R4各自独立地选自C13烷基、C15烷基和C17烷基。在一些实施方式中,式VII的聚乙二醇化的磷酸乙醇胺是1,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](铵盐):
在一些实施方式中,式VII的聚乙二醇化的磷酸乙醇胺是1,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-5000](铵盐):
在一些实施方式中,聚乙二醇化脂质是式VIII的聚乙二醇化神经酰胺,其中R5是直链C7-C15烷基,q是来自18、19或20,或44、45或46或113、114或115中的任何整数。在一些实施方式中,R5是直链C7烷基。在一些实施方式中,R5是直链C15烷基。在一些实施方式中,式VIII的聚乙二醇化神经酰胺是N-辛酰基-鞘氨醇-1-{琥珀酰基[甲氧基(聚乙二醇)2000]}:
在一些实施方式中,式VIII的聚乙二醇化神经酰胺是N-棕榈酰-鞘氨醇-1-{琥珀酰[甲氧基(聚乙二醇)2000]}
在一些实施方式中,聚乙二醇化脂质是式IX的聚乙二醇化二酰基甘油,其中每个R6和R7各自个体地且独立地为直链C11-C17烷基,并且r是来自18、19或20,或44、45或46或113、114或115的任何整数。在一些实施方式中,R6和R7是相同。在一些实施方式中,R6和R7是不同的。在一些实施方式中,每个R6和R7各自个体地且独立地选自直链C17烷基、直链C15烷基和直链C13烷基。在一些实施方式中,式IX的聚乙二醇化甘油二酯是1,2-二硬脂酰基-sn-甘油[甲氧基(聚乙二醇)2000]:
在一些实施方式中,式IX的聚乙二醇化甘油二酯是1,2-二棕榈酰基-sn-甘油[甲氧基(聚乙二醇)2000]:
在一些实施方式中,式IX的聚乙二醇化甘油二酯是:
在一些实施方式中,LNP包含至少一种选自式III、IV和V的阳离子脂质,至少一种选自胆固醇和豆甾醇的甾醇化合物,并且其中聚乙二醇化的脂质是选自式XI和XII中的至少一种。在一些实施方式中,LNP包含至少一种选自式III、IV和V的阳离子脂质,至少一种选自胆固醇和豆甾醇的甾醇化合物,并且其中聚乙二醇化的脂质是选自式XIII和XIV中的至少一种。在一些实施方式中,LNP包含至少一种选自式III、IV和V的阳离子脂质,至少一种选自胆固醇和豆甾醇的甾醇化合物,并且其中聚乙二醇化的脂质是选自式XV和XVI的至少一种。在一些实施方式中,LNP包含式III的阳离子脂质,作为甾醇化合物的胆固醇,并且其中聚乙二醇化的脂质是式XI。
在前一段中的任何LNP实施方式中,其中阳离子脂质组合物的含量为约65摩尔%至75摩尔%之间,甾醇化合物的含量为约24摩尔%至34摩尔%之间,并且聚乙二醇化脂质的含量为约0.5摩尔%至1.5摩尔%之间,其中脂质组合物的阳离子脂质、甾醇化合物和聚乙二醇化脂质的含量之和为100摩尔%。在一些实施方式中,阳离子脂质为约70摩尔%,甾醇化合物的含量为约29摩尔%,聚乙二醇化脂质的含量为约1摩尔%。在一些实施方式中,LNP为70摩尔%的式III、29摩尔%的胆固醇和1摩尔%的式XI。
外泌体
外泌体是运输RNA和蛋白质并且可以将RNA递送至脑和其他靶器官的内源性纳米泡囊。为了降低免疫原性,Alvarez-Erviti等(2011,Nat Biotechnol 29:341)使用自体衍生的树突细胞进行外泌体生产。通过工程化树突细胞以表达Lamp2b(与神经元特异性RVG肽融合的外泌体膜蛋白)来实现靶向至脑。通过电穿孔用外源RNA加载纯化的外泌体。经静脉注射的RVG靶向外泌体将GAPDH siRNA特异性地递送至脑中的神经元、小胶质细胞、少突胶质细胞,导致特定基因敲低。预暴露于RVG外泌体不减弱敲低,并且未观察到其他组织中的非特异性摄取。外泌体介导的siRNA递送的治疗潜力通过BACE1(阿尔茨海默病的治疗性靶标)的强mRNA(60%)和蛋白质(62%)敲低得到证实。
为了获得免疫惰性外泌体库,Alvarez-Erviti等从具有同源主要组织相容性复合物(MHC)单倍型的近交C57BL/6小鼠中收获骨髓。由于未成熟的树突细胞产生大量不含T细胞活化剂(例如MHC-II和CD86)的外泌体,Alvarez-Erviti等选择用粒细胞/巨噬细胞集落刺激因子(GM-CSF)7天的树突细胞。第二天使用完善的超速离心方案从培养上清液中纯化外泌体。产生的外泌体是物理上均匀的,通过纳米颗粒跟踪分析(NTA)和电子显微镜测定,直径大小分布在直径80nm达到峰值。Alvarez-Erviti等从每106个细胞中获得6-12μg外泌体(基于蛋白质浓度测量)。
接下来,Alvarez-Ervitiet等使用适用于纳米级应用的电穿孔方案研究了用外源货物装载修饰的外泌体的可能性。由于纳米级膜颗粒的电穿孔没有很好地表征,非特异性Cy5标记的RNA被用于电穿孔方案的经验优化。在超速离心和裂解外泌体后测定包封的RNA的量。400V和125μF的电穿孔导致RNA的最大保留,并用于所有后续实验。
Alvarez-Erviti等将包含在150μg RVG外泌体中的150μg每种BACE1siRNA施用于正常C57BL/6小鼠,并将敲低效率与四种对照进行比较:未处理小鼠、仅注射RVG外泌体的小鼠、注射与体内阳离子脂质体试剂复合的BACE1siRNA的小鼠,和注射与RVG-9R(RVG肽与9个静电结合siRNA的D-精氨酸偶联)复合的BACE1 siRNA的小鼠。在给药后3天分析皮质组织样品,并且观察到在siRNA-RVG-9R处理的和siRNARVG外泌体处理的小鼠中的显著的蛋白质敲低(45%,P<0.05,相对于62%,P<0.01),因为BACE1 mRNA水平显著降低(分别为66%[+或-]15%,P<0.001和61%[+或-]13%,P<0.01)。此外,申请人证实在RVG-外泌体处理的动物中总β-淀粉样蛋白1-42水平(阿尔茨海默病病理学中淀粉样斑块的主要成分)的显著降低(55%,P<0.05)。观察到的降低大于在正常小鼠中经脑室内注射BACE1抑制剂后证实的β-淀粉样蛋白1-40降低。Alvarez-Erviti等在BACE1裂解产物上进行cDNA末端5’-快速扩增(RACE),这提供了通过siRNA的RNAi介导的敲低的证据。
最后,Alvarez-Erviti等通过评估IL-6、IP-10、TNFα和IFN-α血清浓度研究了RNA-RVG外泌体是否在体内诱导免疫应答。在外泌体处理后,记录所有细胞因子无显著变化,这与siRNA-转染试剂处理相似而与siRNA-RVG-9R相反,siRNA-RVG-9R有效刺激IL-6的分泌,证实了外泌体处理的免疫惰性特征。鉴于外泌体仅包封20%的siRNA,使用RVG-外泌体的递送似乎比RVG-9R递送更有效,因为在没有相应水平的免疫刺激的情况下,用减少五倍的siRNA达到相当的mRNA敲低和更低的蛋白质敲低。该实验证实了RVG-外泌体技术的治疗潜力,其可以适用于与神经退行性疾病相关的基因的长期沉默。Alvarez-Erviti等的外泌体递送系统可用于将本发明的CRISPR-Cas系统递送至治疗性靶标,尤其是神经变性疾病。包封在约100至1000mg RVG外泌体中的约100至1000mg CRISPR Cas的剂量可以考虑用于本发明。
El-Andaloussi等(Nature Protocols 7,2112–2126(2012))公开了如何利用来自培养细胞的外泌体体外和体内递送RNA。该方案首先描述了通过转染表达载体来产生靶向外泌体,所述表达载体包含与肽配体融合的外泌体蛋白。接下来,El-Andaloussi等解释如何从转染的细胞上清液中纯化和表征外泌体。接下来,El-Andaloussi等详述了将RNA装载到外泌体中的关键步骤。最后,El-Andaloussi等概述了如何使用外泌体在小鼠脑中体外和体内有效地递送RNA。还提供了通过功能测定和成像评估外泌体介导的RNA递送的预期结果的实例。整个方案需要~3周。根据本发明的递送或施用可以使用从自体衍生的树突细胞产生的外泌体进行。从本文的教导中,这可以用于本发明的实践中。
在另一个实施方式中,考虑Wahlgren等(Nucleic Acids Research,2012,Vol.40,No.17e130)的血浆外泌体。外泌体是由包括树突细胞(DC)、B细胞、T细胞、肥大细胞、上皮细胞和肿瘤细胞在内的许多细胞类型产生的纳米尺寸的泡囊(大小为30-90nm)。这些泡囊通过晚期内体的向内出芽而形成,然后在与质膜融合后释放到细胞外环境中。因为外泌体天然在细胞之间携带RNA,所以这种性质可用于基因治疗,并且从本公开内容来看可以用于本发明的实践中。
来自血浆的外泌体可以通过将血沉棕黄层(buffy coat)以900g离心20分钟以分离血浆然后收获细胞上清液,以300g离心10分钟以移除细胞并在16500g离心30分钟,然后通过0.22mm过滤器过滤来制备。通过在120,000g超速离心70分钟使外泌体沉淀。根据RNAiHuman/Mouse Starter Kit(Quiagen,Hilden,Germany)中的制造商说明书将siRNA化学转染到外泌体中。将siRNA加入到100ml PBS中,终浓度为2mmol/ml。加入HiPerFect转染试剂后,将混合物在室温下孵育10分钟。为了除去过量的微胶粒,使用醛/硫酸盐乳胶珠重新分离外泌体。可以与siRNA类似地进行CRISPR Cas向外泌体的化学转染。外泌体可以与从健康供体的外周血分离的单核细胞和淋巴细胞共培养。因此,可以考虑含有CRISPR Cas的外泌体可以被导入单核细胞和淋巴细胞,并自体地再导入人体。因此,根据本发明的递送或施用可以使用血浆外泌体进行。
脂质体
本发明的脂质、脂质颗粒或脂质双层(lipid bylayer)或脂质实体可通过本领域熟知的方法制备。参见Wang等,ACS Synthetic Biology,1,403-07(2012);Wang等,PNAS,113(11)2868-2873(2016);Manoharan,等,WO 2008/042973;Zugates等,US Pat.No.8,071,082;Xu等,WO 2014/186366A1(US20160082126)。Xu等提供了制备用于递送皂草素的纳米复合物的方法,其中所述纳米复合物包含皂草素和类脂化合物,并且其中所述纳米复合物具有50nm至1000nm的粒径;皂草素通过非共价相互作用或共价键与类脂化合物结合;类脂化合物具有亲水部分、疏水部分和连接亲水部分和疏水部分的接头,亲水部分任选地带电荷,和疏水部分含有8-24个碳原子。Xu等WO2014/186348(US20160129120)提供了包含阳离子递送剂和阴离子药剂的修饰肽或蛋白质的纳米复合物的实例,其中纳米复合物具有50至1000nm的粒径,阳离子递送剂结合阴离子药剂,并且阴离子药剂是由肽和蛋白质形成的修饰肽或蛋白质以及含有阴离子基团的添加的化学部分。所述添加的化学部分通过酰胺基、酯基、醚基、硫醚基、二硫化物基、腙基、硫酸酯基、脒基、脲基、氨基甲酸酯基团、亚氨酸酯基团或碳酸盐基团与肽或蛋白质连接。更特别地,这些文献提供了可用于制备本发明的颗粒递送系统的脂质或类脂化合物的实例,包括式B1-K1-AK2-B2的化合物,其中A(亲水部分)是Ra、Ra’、Ra”和Ra”’各自独立地为C1-C20单价脂肪族基团,C1-C20单价异脂肪族基团、单价芳基或单价杂芳基;Z是C1-C20二价脂肪族基团、C1-C20二价杂脂肪族基团、二价芳基或二价杂芳基;B1(疏水部分)和B2(也是疏水部分)各自独立地是C12-20脂肪族基团或C12-20杂脂肪族基团;K1(接头)和K2(也是接头)各自独立地是O、S、Si、C1-C6亚烷基
其中m、n、p、q和t各自独立地为1-6;W是O、S或NRC;L1、L3、L5、L7和L9各自独立地为键、O、S或NRd;L2、L4、L6、L8和L10各自独立地为键、O、S或NRe;V是ORf、SRg或NRhRi,Rb、Rc、Rd、Re、Rf、Rg、Rh和Ri各自独立地为H、OH、C1-C10氧基脂肪族基团、C1-C10单价脂肪族基团,C1-C10单价杂脂肪族基团、单价芳基或单价杂芳基和具体化合物:
可用于制备本发明的颗粒递送系统的阳离子脂质的其他实例可以在US20150140070中找到,其中所述阳离子脂质具有式其中p是1和9之间的整数,包括端点;Q的每个实例独立地为O、S或NRQ;RQ为氢、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、任选取代的杂芳基、氮保护基,或式(i)、(ii)或(iii)的基团;R1的每个实例独立地为氢、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、任选取代的杂芳基、卤素、-ORA1、-N(RA1)2、-SRA1或式的基团,L是任选取代的亚烷基、任选取代的亚烯基、任选取代的亚炔基、任选取代的亚杂烷基、任选取代的亚杂烯基、任选取代的亚杂炔基、任选取代的亚碳环基(carbocyclylene)、任选取代的亚杂环基、任选取代的亚芳基或任选取代的亚杂芳基或其组合,和R6和R7各自独立地为氢、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、任选取代的杂芳基、氮保护基或式(i)、(ii)或(iii)的基团;RA1的每次出现独立地为氢、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、任选取代的杂芳基、当与氧原子连接时的氧保护基团、当与硫原子连接时的硫保护基团、当与氮原子连接时的氮保护基团,或者两个RA1基团和与其连接的氮原子一起联合形成任选取代的杂环或任选取代的杂芳基环;R2的每个实例独立地为氢、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、任选取代的杂芳基、氮保护基或式(i)、(ii)或(iii)的基团;式(i),(ii)和(iii)是:R’的每个实例独立地为氢或任选取代的烷基;X是O、S或NRX;RX为氢、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、任选取代的杂芳基或氮保护基;Y是O、S或NRY;RY是氢、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、任选取代的杂芳基或氮保护基;RP为氢、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、任选取代的杂芳基、当与氧原子连接时的氧保护基、当与硫原子连接时的硫保护基、当与氮原子连接时的氮保护基;RL是任选取代的C1-50烷基、任选取代的C2-50烯基、任选取代的C2-50炔基、任选取代的杂C1-50烷基、任选取代的杂C2-50烯基、任选取代的杂C2-50炔基或聚合物;条件是RQ、R2、R6或R7的至少一个实例为式(i)、(ii)或(iii)的基团;Liu等,(US20160200779,US 20150118216,US 20150071903,and US 20150071903)提供阳离子脂质的实例,包括聚乙烯亚胺、聚酰胺基胺(PAMAM)星爆树状大分子、Lipofectin(DOTMA和DOPE的组合)、Lipofectase、LIPOFECTAMINE.RTM.(例如,LIPOFECTAMINE.RTM.2000、LIPOFECTAMINE.RTM.3000、LIPOFECTAMINE.RTM.RNAiMAX、LIPOFECTAMINE.RTM.LTX)、SAINT-RED(Synvolux Therapeutics,Groningen Netherlands)、DOPE、Cytofectin(GileadSciences,Foster City,Calif.)和Eufectins(JBL,San Luis Obispo,Calif.)。示例性阳离子脂质体可由N-[1-(2,3-二乙氧基)-丙基]-N,N,N-三甲基氯化铵(DOTMA)、N-[1-(2,3-二油酸)-丙基]-N,N,N-三甲基甲基硫酸铵(DOTAP)、3β-[N-(N’,N’-二甲基氨基乙烷)氨基甲酰基]胆固醇(DC-Chol)、2,3,-二乙氧基-N-[2(精胺甲酰胺基)乙基]-N,N-二甲基-1-丙胺三氟乙酸盐(DOSPA)、1,2-二肉豆蔻酰氧基丙基-3-二甲基-羟乙基溴化铵;和二甲基二十八烷基溴化铵(DDAB)制成;在WO2013/093648中,提供了式(I)的阳离子脂质,其中Z=烷基接头、C2-C4烷基,Y=烷基接头、C1-C6烷基,R1和R2各自独立地为C10-C30烷基、C10-C30烯基或C10-C30炔基、C10-C30烷基、C10-C20烷基、C12-C18烷基、C13-C17烷基、C13烷基、C10-C30烯基、C10-C20烯基、C12-C18烯基、C13-C17烯基、C17烯基;R3和R4各自独立地为氢、C1-C6烷基或-CH2CH2OH、C1-C6烷基、C1-C3烷基;n是1-6;X是抗衡离子,如该术语在本领域中容易理解的,其包括任何氮抗衡离子,和特定的阳离子脂质,包括
WO2013/093648还提供了在生理pH下的其它阳离子带电脂质体的实例,包括N,N-二油基-N,N-二甲基氯化铵(DODAC)、N,N-二硬脂基-N,N-二甲基溴化铵(DDAB);N-(1,2-二肉豆蔻氧基丙-3-基)-N,N-二甲基-N-羟乙基溴化铵(DMRIE)和二十八烷基酰胺基甘氨酸甲酰胺(DOGS);在US 20160257951中,提供具有通式的阳离子脂质或其药理学上可接受的盐,其中R1和R2各自独立地为氢原子、任选被一个或多个选自取代基组α的取代基取代的C1-C6烷基、任选被一个或多个选自取代基组α的取代基取代的C2-C6烯基、任选被一个或多个选自取代基组α的取代基取代的C3-C7环烷基,或者R1和R2与键合至其的氮原子一起形成3至10元杂环,其中所述杂环任选地被一个或多个选自取代基组α的取代基取代并且除了与R1和R2键合的氮原子外任选地含有一个或多个选自氮原子、氧原子和硫原子的原子作为构成杂环的原子;R8为氢原子或任选被一个或多个选自取代基组α的取代基取代的C1-C6烷基;或者R1和R8一起是基团-(CH2)q-;取代基组α由卤原子、氧代基、羟基、磺酰基、氨基、氰基、C1-C6烷基、C1-C6卤代烷基、C1-C6烷氧基、C1-C6烷基磺酰基、C1-C6烷基氨基和C1-C7烷酰基组成;L1是任选被一个或多个选自取代基组β1的取代基取代的C10-C24烷基、任选被一个或多个选自取代基组β1的取代基取代的C10-C24烯基、任选被一个或多个选自取代基组β1的取代基取代的C3-C24炔基或任选被一个或多个选自取代基组β1的取代基取代的(C1-C10烷基)-(Q)k-(C1-C10烷基)基团;L2是独立于L1任选被一个或多个选自取代基组β1的取代基取代的C10-C24烷基、任选被一个或多个选自取代基组β1的取代基取代的C10-C24烯基、任选被一个或多个选自取代基组β1的取代基取代的C3-C24炔基、任选被一个或多个选自取代基组β1的取代基取代的(C1-C10烷基)-(Q)k-(C1-C10)基团、任选被一个或多个选自取代基组β1的取代基取代的(C10-C24烷氧基)甲基基团、任选被一个或多个选自取代基组β1的取代基取代的(C10-C24烯基)氧甲基基团、任选被一个或多个选自取代基组β1的取代基取代的(C3-C24炔基)氧甲基基团或任选被一个或多个选自取代基组β1的取代基取代的(C1-C10烷基)-(Q)k-(C1-C10烷氧基)甲基基团;取代基组β1由卤原子、氧代基、氰基、C1-C6烷基、C1-C6卤代烷基、C1-C6烷氧基、C1-C6烷基磺酰基、C1-C7烷酰基、C1-C7烷酰氧基、C3-C7烷氧基烷氧基、(C1-C6烷氧基)羰基、(C1-C6)烷氧基)羧基、(C1-C6烷氧基)氨基甲酰基和(C1-C6烷氨基)羧基组成;Q为下式基团:当L1和L2各自被一个或多个选自取代基组β1的取代基取代时,取代基组β1为C1-C6烷基、C1-C6烷氧基、C1-C6烷基磺酰基、C1-C7烷酰基或C1-C7烷酰氧基,L1中选自取代基组β1的取代基或取代基和L2中选自取代基组β1的取代基或取代基任选地彼此结合形成环状结构;k为1、2、3、4、5、6或7;m为0或1;p为0、1或2;q是1、2、3或4;并且r为0、1、2或3,条件是p+r为2或更大,或q+r为2或更大,并且具体的阳离子脂质包括
和在US20160244761中,提供了阳离子脂质,包括1,2-二硬脂基-N,N-二甲基-3-氨基丙烷(DSDMA)、1,2-二油氧基-N,N-二甲基-3-氨基丙烷(DODMA)、1,2-二苯甲酰氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二苯甲酰氧基-N,N-二甲基-3-氨基丙烷(DLenDMA)、1,2-二-γ-亚麻酰氧基-N,N-二甲基氨基丙烷(γ-DLenDMA)、1,2-二乙烯基氧基-酮-N,N-二甲基-3-氨基丙烷(DLin-K-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLin-K-C2-DMA)(也称为DLin-C2K-DMA、XTC2和C2K)、2,2-二苯甲酰基-4-(3-二甲基氨基丙基)-[1,3]-二氧戊环(DLin-K-C3-DMA)、2,2-二苯甲酰基-4-(4-二甲基氨基丁基)-[1,3]-二氧戊环(DLin-K-C4-DMA)、1,2-二苯甲酰氧基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLen-C2K-DMA)、1,2-二-γ-亚油烯氧基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(γ-DLen-C2K-DMA)、二亚油基甲基-3-二甲基氨基丙酸酯(DLin-M-C2-DMA)(也称为MC2)、(6Z,9Z,28Z,31Z)-heptatriaconta-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯(DLin-M-C3-DMA)(也称为MC3)和3-(二亚油基甲氧基)-N,N-二甲基丙-1-胺(DLin-MP-DMA))(也称为1-B11)。
在一个实施方式中,脂质化合物优选为可生物还原的材料,例如,可生物还原的聚合物和可生物可还原的类脂化合物。
在实施方式中,脂质化合物包含亲水性头部和疏水性尾部,以及任选的接头。
在一个实施方式中,亲水性头部包含一个或多个亲水性官能团,例如羟基、羧基、氨基、巯基、磷酸根、酰胺、酯、醚、氨基甲酸酯、碳酸酯(carbonate)、脲和磷酸二酯。特别是在生理条件如生理pH下,这些基团可以形成氢键并且任选带正电荷或带负电荷。
在一个实施方式中,疏水性尾部为饱和或不饱和的、直链或支链的、无环或环状的、芳族或非芳族烃部分,其中所述饱和或不饱和的、直链或支链的、无环或环状的、芳族或非芳族烃部分任选含有二硫键和/或8-24个碳原子。碳原子中的一个或多个可以用杂原子代替,例如N、O、P、B、S、Si、Sb、Al、Sn、As、Se和Ge。含有二硫键的脂质或类脂化合物可以是生物可诱导的。
在一个实施方式中,脂质或类脂化合物的接头连接亲水性头部和疏水性尾部。所述接头可以是亲水或疏水、极性或非极性的任何化学基团,例如O、S、Si、氨基、亚烷基、酯、酰胺、氨基甲酸酯、脲、碳酸酯磷酸酯、亚磷酸酯、硫酸根、亚硫酸根和硫代硫酸根。
如果适用,上述脂质或类脂化合物包括化合物本身,以及它们的盐和溶剂化物。例如,盐可以在类脂化合物上的阴离子和带正电荷的基团(例如氨基)之间形成。合适的阴离子包括氯离子、溴离子、碘离子、硫酸根、硝酸根、磷酸根、柠檬酸根、甲磺酸根、三氟乙酸根、乙酸根、苹果酸根、甲苯磺酸根、酒石酸根、肌酸、谷氨酸、葡糖醛酸、乳酸根、戊二酸根和马来酸根。同样,也可以在类脂化合物上的阳离子和带负电的基团(例如羧酸盐)之间形成盐。合适的阳离子包括钠离子、钾离子、镁离子、钙离子和铵阳离子例如四甲基铵离子。类脂化合物还包括含有季氮原子的那些盐。溶剂化物是指在类脂化合物和药学上可接受的溶剂之间形成的复合物。药学上可接受的溶剂的实例包括水、乙醇、异丙醇、乙酸乙酯、乙酸和乙醇胺。
根据本发明的递送或施用可以通过脂质体进行。脂质体是球形泡囊结构,其由围绕内部水性隔室的单层或多层脂质双层和相对不可渗透的外部亲脂性磷脂质双层组成。脂质体作为药物递送载体已经获得了相当大的关注,因为它们具有生物相容性,无毒,可以递送亲水性和亲脂性药物分子,保护其货物免受血浆酶的降解,并穿过生物膜和血脑屏障(BBB)转运其负载(参见,例如,Spuch and Navarro,Journal of Drug Delivery,vol.2011,Article ID 469679,12pages,2011.doi:10.1155/2011/469679供回顾)。
脂质体可以由多种不同类型的脂质制成;然而,磷脂最常用于产生作为药物载体的脂质体。尽管当脂质膜与水溶液混合时脂质体形成是自发的,但是也可以通过使用均化器、超声仪或挤出装置以摇动的形式施加力来加速(参见,例如,Spuch and Navarro,Journal of Drug Delivery,vol.2011,Article ID 469679,12pages,2011.doi:10.1155/2011/469679供回顾)。
可以将多种其他添加剂添加到脂质体中以改变它们的结构和性质。例如,可以将胆固醇或鞘磷脂添加到脂质体混合物中,以帮助稳定脂质体结构并防止脂质体内部货物的泄漏。此外,脂质体由氢化卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇和磷酸二十六烷基酯制备,并且它们的平均泡囊尺寸调节至约50和100nm。(参见,例如,Spuch and Navarro,Journal of Drug Delivery,vol.2011,Article ID 469679,12pages,2011.doi:10.1155/2011/469679供审阅)。
脂质体制剂可以主要包含天然磷脂和脂质,例如1,2-二硬脂酰基-sn-甘油基-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷脂。由于该制剂仅由磷脂组成,脂质体制剂遇到了许多挑战,其中之一是血浆中的不稳定性。已经进行了多种尝试以克服这些挑战,特别是在脂质膜的操作方面。其中一项尝试聚焦于胆固醇的操作。向常规制剂中添加胆固醇降低了包封的生物活性化合物向血浆的快速释放或者1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)增加了稳定性(参见,例如,Spuch and Navarro,Journal of DrugDelivery,vol.2011,Article ID 469679,12pages,2011.doi:10.1155/2011/469679供回顾)。
在一种特别有利的实施方式中,特洛伊木马脂质体(也称为分子特洛伊木马)是期望的,并且可以在http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long找到方案。这些颗粒允许在血管内注射后将转基因递送至整个脑。不受限制,据信具有缀合至表面的特异性抗体的中性脂质颗粒允许通过胞吞作用穿过血脑屏障。申请人假设利用特洛伊木马脂质体通过血管内注射将CRISPR家族的核酸酶递送到大脑,这将允许全脑转基因动物而不需要胚胎操作。可以考虑约1-5g的DNA或RNA用于脂质体的体内给药。
在另一个实施方式中,CRISPR Cas系统或其组分可以以脂质体施用,例如稳定的核酸-脂质颗粒(SNALP)(参见,例如,Morrissey等,Nature Biotechnology,Vol.23,No.8,August 2005)。考虑每日静脉内注射约1、3或5mg/kg/天的SNALP中靶向的特定CRISPR Cas。每日治疗可超过约三天,然后每周治疗约五周。在另一个实施方式中,还考虑通过静脉内注射以约1或2.5mg/kg剂量施用特定的CRISPR Cas包封的SNALP(参见,例如,Zimmerman等,Nature Letters,Vol.441,4May 2006)。SNALP制剂可含有脂质3-N-[(甲氧基聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻酰氧基-丙胺(PEG-C-DMA)、1,2-二亚油酰氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰-sn-甘油基-3-磷酸胆碱(DSPC)和胆固醇,摩尔比为2:40:10:48(参见,例如,Zimmerman等,Nature Letters,Vol.441,4May 2006)。
在另一个实施方式中,已经证实稳定的核酸-脂质颗粒(SNALP)是到高度血管化的HepG2衍生的肝肿瘤的有效递送分子,但在血管化不良的HCT-116衍生的肝肿瘤中不是(参见例如Li,Gene Therapy(2012)19,775–780)。SNALP脂质体可以通过使用25:1的脂质/siRNA比率和48/40/10/2的胆固醇/D-Lin-DMA/DSPC/PEG-C-DMA摩尔比配制D-Lin-DMA/DSPC/PEG-C-DMA、二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA来制备。得到的SNALP脂质体为约80-100nm的大小。
在另一个实施方式中,SNALP可包含合成胆固醇(Sigma-Aldrich,StLouis,MO,USA)、二棕榈酰(Avanti Polar Lipids,Alabaster,AL,USA)、3-N-[(w-甲氧基聚(乙二醇)2000)氨基甲酰基]-1,2-二咪唑氧基丙胺和阳离子1,2-二亚油酰氧基-3-N,N-二甲基氨基丙烷(参见,例如,Geisbert等,Lancet 2010;375:1896-905)。可以考虑以例如推注静脉内灌流施用每剂量约2mg/kg总CRISPR Cas的剂量。
在另一个实施方式中,SNALP可包含合成胆固醇(Sigma-Aldrich)、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DSPC;Avanti Polar Lipids Inc.)、PEG-cDMA和1,2-二亚油酰氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)(参见,例如,Judge,J.Clin.Invest.119:661-673(2009))。用于体内研究的制剂可包含最终脂质/RNA质量比为约9:1。
RNAi纳米医学的安全性已经由Alnylam Pharmaceuticals的Barros和Gollob综述(参见,例如,Advanced Drug Delivery Reviews 64(2012)1730–1737)。稳定的核酸脂质颗粒(SNALP)由四种不同的脂质组成:在低pH下为阳离子的可电离脂质(DLinDMA)、中性辅助脂质、胆固醇和可扩散的聚乙二醇(PEG)-脂质。颗粒的直径为约80nm,在生理pH下是电荷中性的。在配制期间,可电离的脂质用于在颗粒形成期间将脂质与阴离子RNA缩合。当在越来越酸性的内体条件下带正电时,可电离的脂质也介导SNALP与内体膜的融合,使RNA能够释放到细胞质中。PEG-脂质使颗粒稳定并减少配制中的聚集,并随后提供改善药代动力学性质的中性亲水外部。
迄今为止,已经使用具有RNA的SNALP制剂启动了两个临床程序。TekmiraPharmaceuticals最近在LDL胆固醇升高的成人志愿者中完成了SNALP-ApoB的I期单剂量研究。ApoB主要在肝脏和空肠中表达,并且对于VLDL和LDL的组装和分泌是必需的。17名受试者接受单剂量的SNALP-ApoB(7剂量水平的剂量递增)。没有肝脏毒性的证据(预计基于临床前研究的潜在剂量限制毒性)。最高剂量的(两个中的)一个受试者经历与免疫系统刺激一致的流感样症状,并且决定结束试验。
Alnylam Pharmaceuticals也有类似的先进ALN-TTR01,它采用上述SNALP技术并靶向突变和野生型TTR两者的肝细胞生产以治疗TTR淀粉样变性(ATTR)。已经描述了三种ATTR综合征:家族性淀粉样多发性神经病(FAP)和家族性淀粉样变性心肌病(FAC),其均由TTR中的常染色体显性突变引起;和野生型TTR引起的老年系统性淀粉样变性(SSA)。最近在ATTR患者中完成了ALN-TTR01的安慰剂对照单剂量递增I期试验。ALN-TTR01通过15分钟IV灌流施用于31名患者(23名为研究药物和8名为安慰剂),剂量范围为0.01至1.0mg/kg(基于siRNA)。治疗的耐受性良好,在肝功能测试中无显著增加。在≥0.4mg/kg的23名患者中有3名观察到灌流相关反应;所有人都对输液速度减慢做出了反应,所有这些都继续参与研究。血清细胞因子IL-6、IP-10和IL-1ra的最小和瞬时升高在2名患者中在1mg/kg的最高剂量时观察到(如临床前和NHP研究所预期的)。在1mg/kg时观察到降低血清TTR、ALN-TTR01的预期药效学效应。
在另一个实施方式中,SNALP可以通过将阳离子脂质、DSPC、胆固醇和PEG-脂质(例如以40:10:40:10的摩尔比)例如在乙醇中溶解来制备(参见Semple等,NatureNiotechnology,Volume 28Number 2February 2010,pp.172-177)。将脂质混合物加入含水缓冲液(50mM柠檬酸盐,pH 4)中,分别混合至最终乙醇和脂质浓度为30%(体积/体积)和6.1mg/ml,并在挤压前使其在22℃下平衡2分钟。使用Lipex挤出机(Northern Lipids)将水合脂质在22℃下通过两个堆叠的80nm孔径过滤器(Nuclepore)挤出,直至获得通过动态光散射分析测定的70-90nm的泡囊直径。这通常需要1-3次通过。将siRNA(溶于50mM柠檬酸盐,含有30%乙醇的pH 4水溶液)以~5ml/min的速率加入到预平衡的(35℃)泡囊中并混合。在达到0.06(重量/重量)的最终靶向siRNA/脂质比率后,将混合物在35℃下再孵育30分钟以允许泡囊重组和siRNA的包封。然后除去乙醇,并且外部缓冲液通过透析或切向流渗滤替换为PBS(155mM的氯化钠,3mM的Na2HPO4,1mM的KH2PO4,pH为7.5)。使用受控的逐步稀释方法将siRNA包封在SNALP中。KC2-SNALP的脂质成分是摩尔比为57.1:7.1:34.3:1.4的DLin-KC2-DMA(阳离子脂质)、二棕榈酰磷脂酰胆碱(DPPC;Avanti Polar Lipids)、合成胆固醇(Sigma)和PEG-C-DMA。在形成装载颗粒后,将SNALP对PBS透析,并在使用前通过0.2μm过滤器过滤灭菌。平均粒径为75-85nm,并且90-95%的siRNA被包封在脂质颗粒内。用于体内测试的制剂中的最终siRNA/脂质比率为~0.15(重量/重量)。在使用前立即将含有因子VIIsiRNA的LNP-siRNA系统在无菌PBS中稀释至合适的浓度,并且通过侧尾静脉经静脉内施用总体积为10ml/kg的制剂。该方法和这些递送系统可以外推至本发明的CRISPR Cas系统。
其他脂质
其他阳离子脂质,例如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)可用于包封CRISPR Cas或其组分或编码其的核酸分子,例如,类似于SiRNA(参见,例如,Jayaraman,Angew.Chem.Int.Ed.2012,51,8529–8533),并因此可以用于本发明的实践中。可以考虑具有以下脂质组成的预制泡囊:摩尔比分别为40/10/40/10的氨基脂质、二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基氨基甲酸酯(PEG-脂质),FVII siRNA/总脂质比率为约0.05(重量/重量)。为了确保在70-90nm范围内的窄粒度分布和0.11±0.04(n=56)的低多分散指数,可以在添加指导RNA之前通过80nm膜将颗粒挤出至多三次。可以使用含有高效氨基脂质16的颗粒,其中四种脂质组分16、DSPC、胆固醇和PEG-脂质(50/10/38.5/1.5)的摩尔比可以进一步优化以增强体内活性。
Michael S D Kormann等("Expression of therapeutic proteins afterdelivery of chemically modified mRNA in mice:Nature Biotechnology,Volume:29,Pages:154–157(2011))描述了使用脂质包膜递送RNA。在本发明中,使用脂质包膜也是优选的。
在另一个实施方式中,脂质可以与本发明的CRISPR Cas系统或其组分或编码其的核酸分子一起配制以形成脂质纳米颗粒(LNP)。脂质包括但不限于DLin-KC2-DMA4、C12-200和脂质二硬脂酰磷脂酰胆碱、胆固醇,并且可以使用自发泡囊形成程序将PEG-DMG与CRISPRCas而不是siRNA一起配制(参见,例如,Novobrantseva,Molecular Therapy–NucleicAcids(2012)1,e4;doi:10.1038/mtna.2011.3)。组分的摩尔比可为约50/10/38.5/1.5(DLIN-KC2-DMA或C12-200/二乙酰磷脂酰胆碱/胆固醇/PEG-DMG)。在DLin-KC2-DMA和C12-200脂质纳米颗粒(LNP)的情况下,最终的脂质:siRNA重量比可以分别为~12:1和9:1。制剂可具有~80nm的平均粒径,包封效率>90%。可以考虑3mg/kg剂量。
Tekmira在美国和国外具有约95个专利家族的组合,其涉及LNP和LNP制剂的各个方面(参见,例如,美国专利号7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;美国专利7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658以及欧洲专利1766035;1519714;1781593和1664316),所有这些都可以用于和/或适用于本发明。
可以将CRISPR Cas系统或其组分或编码其的核酸分子包封在PLGA微球中进行递送,所述PLGA微球(例如在美国公开申请20130252281和20130245107和20130244279(转让给Modema Therapeutics)中进一步描述)涉及包含修饰的核酸分子的组合物的配制方面,所述修饰的核酸分子可以编码蛋白质、蛋白质前体、或蛋白质或蛋白质前体的部分或完全加工形式。制剂可具有50:10:38.5:1.5-3.0的摩尔比(阳离子脂质:促融合脂质:胆固醇:PEG脂质)。PEG脂质可以选自但不限于PEG-c-DOMG、PEG-DMG。促融合脂质可以是DSPC。还参见Schrum等,Delivery and Formulation of Engineered Nucleic Acids,美国公开申请20120251618。
纳米单体的技术解决了对于广泛的治疗剂的生物利用度挑战,包括低分子量疏水性药物、肽和基于核酸的治疗剂(质粒、siRNA、miRNA)。该技术的具体给药途径已显示出明显优势,包括口服途径、穿过血脑屏障的转运、递送至实体瘤以及眼睛。参见,例如,Mazza等,2013,ACS Nano.2013Feb 26;7(2):1016-26;Uchegbu and Siew,2013,J PharmSci.102(2):305-10和Lalatsa等,2012,J Control Release.2012Jul 20;161(2):523-36。
美国专利公开号20050019923描述了用于将生物活性分子(例如多核苷酸分子、肽和多肽和/或药剂)递送至哺乳动物体的阳离子树状大分子。所述树状大分子适合于将生物活性分子靶向递送至例如肝、脾、肺、肾或心脏(或甚至脑)。树状大分子是合成的三维大分子,其由简单的分支单体单元以逐步方式制备,其性质和功能可以容易地控制和变化。树状大分子是从反复添加构建块到多功能核(发散合成法)或者向多功能核反复添加构建块(收敛合成法)来合成,并且每次增加构建块的三维壳导致形成更高代的树状大分子。聚丙烯亚胺树状大分子从二氨基丁烷核开始,通过丙烯腈双迈克尔加成到伯胺,然后氢化腈,向二氨基丁烷核添加两倍数量的氨基。这导致氨基翻倍。聚丙烯亚胺树状大分子含有100%可质子化的氮和至多64个末端氨基(第5代,DAB 64)。可质子化基团通常是胺基团,其能够在中性pH下接受质子。树状大分子作为基因递送剂的使用主要聚焦于聚酰胺基胺的使用,并且含磷化合物与胺/酰胺或N--P(O2)S的混合物分别作为缀合单元,没有关于使用低代聚丙烯亚胺树状大分子用于基因递送的报道。聚丙烯亚胺树状大分子也已被作为pH敏感性控释系统研究,用于药物递送和当由外周氨基酸基团化学修饰时其客体分子的包封。还研究了聚丙烯亚胺树状大分子与DNA的细胞毒性和相互作用以及DAB 64的转染效力。
美国专利公开号20050019923是基于以下观察:与先前的报道相反,阳离子树状大分子,例如聚丙烯亚胺树状大分子,显示出适合的性质,例如特异性靶向和低毒性,用于靶向递送生物活性分子,例如遗传物质。此外,阳离子树状大分子的衍生物还显示出用于靶向递送生物活性分子的合适性质。还参见Bioactive Polymers,美国公开申请20080267903,其公开了“各种聚合物,包括阳离子多胺聚合物和树状大分子,显示具有抗增殖活性,因此可用于治疗以不期望的细胞增殖为特征的疾病,例如肿瘤和肿瘤、炎症性疾病(包括自身免疫性疾病)、牛皮癣和动脉粥样硬化。聚合物可以单独用作活性剂,或者用作其他治疗剂的递送载体,例如用于基因治疗的药物分子或核酸。在这种情况下,聚合物本身的内在抗肿瘤活性可以补充待递送药剂的活性。”这些专利公开的公开内容可以与本文的教导结合使用,用于递送CRISPR Cas系统或其组分或编码其的核酸分子。
超带电蛋白质
超带电蛋白是一类工程化或天然存在的蛋白质,具有异常高的正或负净理论电荷,并且可用于递送CRISPR Cas系统或其组分或编码其的核酸分子。超负电荷和超正电荷的蛋白质都表现出显著的耐受热或化学诱导的聚集的能力。带正电荷的蛋白质也能够穿透哺乳动物细胞。使货物与这些蛋白质(例如质粒DNA、RNA或其他蛋白质)相关联,可以使这些大分子体外和体内功能性地递送到哺乳动物细胞中。David Liu的实验室报道了2007年超电荷蛋白的产生和表征(Lawrence等,2007,Journal of the American Chemical Society129,10110–10112)。
RNA和质粒DNA非病毒递送到哺乳动物细胞中对于研究和治疗应用都是有价值的(Akinc等,2010,Nat.Biotech.26,561–569)。将纯化的+36GFP蛋白(或其他超负电荷蛋白)与RNA在适当的无血清培养基中混合,并在添加至细胞之前使其复合。在该阶段包含血清抑制了超带电蛋白-RNA复合物的形成并降低了治疗的有效性。已发现以下方案对多种细胞系有效(McNaughton等,2009,Proc.Natl.Acad.Sci.USA 106,6111–6116)(然而,应该进行改变蛋白质和RNA剂量的试验性实验以优化特定细胞系的程序):
(1)在处理的前一天,在48孔板中铺板每孔1×105个细胞。
(2)在处理当天,将纯化的+36GFP蛋白在无血清培养基中稀释至终浓度200nM。加入RNA至终浓度为50nM。涡旋混合并在室温下孵育10分钟。
(3)在孵育期间,从细胞中吸出培养基并用PBS洗涤一次。
(4)在孵育+36GFP和RNA后,将蛋白质-RNA复合物添加到细胞中。
(5)将细胞与复合物在37℃孵育4小时。
(6)孵育后,吸出培养基并用20U/mL肝素PBS洗涤三次。取决于活性测定,将细胞与含血清培养基再孵育48小时或更长时间。
(7)通过免疫印迹、qPCR、表型分析或其他合适的方法分析细胞。
David Liu的实验室进一步发现+36GFP是在一系列细胞中有效的质粒递送试剂。由于质粒DNA是比siRNA更大的货物,因此需要更多+36GFP蛋白来有效复合质粒。为了有效的质粒递送,申请人开发了带有C-末端HA2肽标签(来自流感病毒血凝素蛋白的已知内体破坏肽)的+36GFP变体。以下方案在多种细胞中有效,但如上所述,建议针对特定细胞系和递送应用优化质粒DNA和超带电蛋白剂量。
(1)在处理的前一天,在48孔板中铺板每孔1×105个平板。
(2)在处理当天,将纯化的p36GFP蛋白在无血清培养基中稀释至终浓度2mM。加入1mg质粒DNA。涡旋混合并在室温下孵育10分钟。
(3)在孵育期间,从细胞中吸出培养基并用PBS洗涤一次。
(4)在孵育p36GFP和质粒DNA后,将蛋白质-DNA复合物轻轻地加入细胞中。
(5)将细胞与复合物在37℃孵育4小时。
(6)孵育后,吸出培养基并用PBS洗涤。将细胞在含血清的培养基中孵育并再孵育24-48小时。
(7)适当地分析质粒递送(例如,通过质粒驱动的基因表达)。
还参见,例如,McNaughton等,Proc.Natl.Acad.Sci.USA 106,6111-6116(2009);Cronican等,ACS Chemical Biology 5,747-752(2010);Cronican等,Chemistry&Biology18,833-838(2011);Thompson等,Methods in Enzymology 503,293-319(2012);Thompson,D.B.,等,Chemistry&Biology 19(7),831-843(2012)。超带电蛋白的方法可以用于和/或适应于递送本发明的CRISPR Cas系统。Lui博士的这些系统和本文结合本文教导的文献可用于递送CRISPR Cas系统或其组分或编码其的核酸分子。
细胞穿透肽(CPP)
在另一个实施方式中,考虑细胞穿透肽(CPP)用于递送CRISPR Cas系统。CPP是促进细胞摄取各种分子货物的短肽(从纳米尺寸颗粒到小化学分子和DNA的大片段)。本文所用的术语“货物”包括但不限于治疗剂、诊断探针、肽、核酸和反义寡核苷酸、质粒、蛋白质、包括纳米颗粒的颗粒、脂质体、发色团、小分子和放射性物质。在本发明的方面,货物还可以包括CRISPR Cas系统或整个功能性CRISPR Cas系统的任何组分。本发明的方面还提供了将所需货物递送到受试者体内的方法,其包括:(a)制备包含本发明的细胞穿透肽和期望的货物的复合物,和(b)经口服、关节、腹腔、鞘、动脉、鼻、脑实质、皮下、肌肉、静脉、皮肤、直肠内或局部施用复合物至受试者。货物通过共价键的化学连接或通过非共价相互作用与肽结合。
CPP的功能是将货物递送到细胞中,该过程通常通过内吞作用发生,货物递送至活哺乳动物细胞的内体。细胞穿透肽具有不同的大小、氨基酸序列和电荷,但是所有CPP具有一个独特的特征,即能够易位质膜并促进各种分子货物向细胞质或细胞器递送。CPP易位可分为三种主要进入机制:膜中的直接穿透、内吞作用介导的进入,和通过形成瞬时结构的易位。CPP已经发现在医学中作为在包括癌症的不同疾病的治疗中的药物递送剂和病毒抑制剂以及用于细胞标记的造影剂的许多应用。后者的实例包括充当GFP、MRI造影剂或量子点的载体。CPP作为用于研究和医学的体外和体内递送载体具有巨大潜力。CPP通常具有含有高相对丰度的带正电荷的氨基酸(例如赖氨酸或精氨酸)或者具有含有极性/带电荷氨基酸和非极性疏水氨基酸的交替模式的序列的氨基酸组成。这两种类型的结构分别称为聚阳离子性或两亲性。第三类CPP是疏水性肽,仅含有非极性残基,具有低净电荷或具有对细胞摄取至关重要的疏水性氨基酸基团。发现的初始CPP之一是来自人类免疫缺陷病毒1(HIV-1)的反式激活转录激活子(Tat),发现其被培养物中的许多细胞类型从周围培养基中有效地摄取。从那时起,已知CPP的数量已经大大增加,并且已经产生了具有更有效的蛋白质转导性质的小分子合成类似物。CPP包括但不限于穿透素、Tat(48-60)、运输蛋白和(R-AhX-R4)(Ahx=氨基己酰基)。
美国专利8,372,951提供了衍生自嗜酸性粒细胞阳离子蛋白(ECP)的CPP,其表现出高度的细胞穿透效率和低毒性。还提供了将CPP及其货物运送到脊椎动物受试者的方面。CPP的其他方面及其递送描述于美国专利8,575,305;8,614,194和8,044,019。CPP可用于递送CRISPR-Cas系统或其组分。在“Gene disruption by cell-penetrating peptide-mediated delivery of Cas9protein and guide RNA”,由Suresh Ramakrishna,Abu-Bonsrah Kwaku Dad,Jagadish Beloor,等Genome Res.2014Apr 2.[印刷前的电子版]中提供了CPP可用于递送CRISPR-Cas系统或其组分,Jagadish Beloor,等。Genome Res.2014年4月2日。[印刷前的电子版],其整体通过引用并入本文,其中证实用CPP缀合的重组Cas9蛋白和CPP复合的指导RNA进行处理导致人细胞系中的内源基因破坏。在该论文中,Cas9蛋白通过硫醚键与CPP缀合而引导RNA与CPP复合,形成缩合的带正电颗粒。结果表明,用修饰的Cas9和指导RNA同时和顺序处理包括胚胎干细胞、真皮成纤维细胞、HEK293T细胞、HeLa细胞和胚胎癌细胞的人类细胞,导致有效的基因破坏,同时减少质粒转染相关的脱靶突变。
可植入装置
在另一个实施方式中,还考虑了可植入装置用于递送CRISPR Cas系统或其组分或编码其的核酸分子。例如,美国专利公开20110195123公开了可植入的医疗装置,其提供了在局部和在长时间内洗脱药物,包括这种装置的多种类型、实施的治疗方式和植入方法。该装置包括聚合物基底,例如基质(例如其用作装置主体),和药物,和在一些情况下另外的支架材料(例如金属或另外的聚合物),以及增强可见性和成像的材料。可植入的递送装置可有利地在局部和在长时间内提供释放,其中药物直接释放到患病区域的细胞外基质(ECM),例如肿瘤、炎症、变性,或用于有症状的目标,或到受损的平滑肌细胞,或用于预防。如上所述,一种药物是RNA,并且该系统可以用于和/或适应于本发明的CRISPR Cas系统。在一些实施方式中,植入模式是现有的植入程序,其目前被开发并用于其他治疗,包括短距离放射治疗和针活组织检查。在这种情况下,本发明中描述的新植入物的尺寸类似于原始植入物。通常,在相同的治疗过程中植入一些装置。
美国专利公开20110195123提供了药物递送可植入或可插入系统,包括适用于腔例如腹腔和/或任何其他类型施用的系统,其中药物递送系统未锚定或附着,所述系统包括生物稳定的和/或可降解的和/或可生物吸收的聚合物基底,其可以例如任选地是基质。应注意,术语“插入”还包括植入。药物递送系统优选地作为如美国专利公开20110195123中所述的“装载器”实施。
聚合物或多种聚合物是生物相容的,引入试剂和/或多种试剂,使试剂能够以受控的速率释放,其中聚合物基底(例如基质)的总体积在一些实施方式中是任选且优选不大于允许达到药剂的治疗水平的最大体积。作为非限制性实例,根据药剂负载的体积的要求,这样的体积优选在0.1m3至1000mm3的范围内。例如当与其尺寸由功能性确定的装置结合时,例如但不限于膝关节、子宫内或颈环等,装载器可以任选地更大。
在一些实施方式中,药物递送系统(用于递送组合物)被设计为优选使用可降解聚合物,其中主要释放机制是整体侵蚀;或者在一些实施方式中,使用不可降解的或缓慢降解的聚合物,其中主要释放机制是扩散而不是整体侵蚀,因此外部部分起膜的作用,并且其内部部分起药物储库的作用,实际上在长时间内(例如从大约一周到大约多个月)不受周围环境影响。也可任选使用具有不同释放机制的不同聚合物的组合。表面上的浓度梯度优选在总药物释放期的显著期间内保持有效恒定,因此扩散速率有效地恒定(称为“零模式”扩散)。术语“恒定”是指扩散速率优选地保持在治疗有效性的下阈值之上,但是其可以仍然任选地以初始释放(burst)为特征和/或可以波动,例如增加和减少到一定程度。扩散速率优选保持较长时间,并且可以认为其恒定到一定水平以优化治疗有效期,例如有效沉默期。
药物递送系统任选且优选地设计成保护基于核苷酸的治疗剂免于无论是天然的化学物质还是由于受试者体内的酶和其他因素的攻击的降解。
美国专利公开20110195123的药物递送系统任选地通过激活和/或加速/减速的非侵入和/或最小侵入方法,与在植入装置处和/或植入装置后操作的感测和/或激活装置相关联,例如任选地包括但不限于热加热和冷却、激光束和超声,包括聚焦超声和/或RF(射频)方法或装置。
根据美国专利公开20110195123的一些实施方式,局部递送的位点可任选地包括以细胞的高异常增殖和抑制的细胞凋亡为特征的靶位点,包括肿瘤、活动性和/或慢性炎症和感染(包括自身免疫疾病状态、退化的组织(包括肌肉和神经组织)、慢性疼痛、退行性部位、和用于组织的增强或再生的骨折位置和其他伤口位置,和损伤的心脏、平滑和横纹肌。
用于植入组合物的位点,或靶位点,优选具有足够小的半径、面积和/或体积以用于靶向局部递送。例如,靶位点任选地具有约0.1mm至约5cm范围的直径。
优选选择靶位点的位置以获得最大治疗功效。例如,药物递送系统的组合物(任选地具有如上所述的用于植入的装置)任选且优选地植入肿瘤环境内或其附近,或与其相关的血液供应内或附近。
例如,组合物(任选地与装置一起)任选地植入胰腺、前列腺、乳房、肝脏内或其附近,通过乳头植入,植入血管系统内,等等。
靶标位置任选地选自包括以下,基本上由以下其组成,或由以下组成的组(仅作为非限制性实例,因为任选地,身体内的任何部位可适合于植入装载器):1.在退行部位的脑,如在基底神经节、白色和灰质处的帕金森病或阿尔茨海默病中;2.在肌萎缩侧索硬化症(ALS)情况下的脊柱;3.子宫颈以预防HPV感染;4.活动性和慢性炎症关节;5.在牛皮癣情况下的真皮;6.用于镇痛作用的交感神经和感觉神经部位;7.骨内植入;8.急性和慢性感染部位;9.阴道内;10.内耳-听觉系统,内耳迷路,前庭系统;11.气管内;12.心内;冠状动脉,心外膜;13.膀胱;14.胆系统;15.实质组织,包括但不限于肾、肝、脾;16.淋巴结;17.唾液腺;18.牙龈;19.关节内(关节);20.眼;21.脑组织;22.脑室;23.腔,包括腹腔(例如但不限于卵巢癌);24.食管内;和25.直肠内。
任选地,系统的插入(例如含有组合物的装置)与在靶位点和该位点附近注射材料到ECM以影响靶位点和该位点附近的ECM中的局部pH和/或温度和/或影响药物扩散和/或药物动力学的其他生物因素相关。
任选地,根据一些实施方式,所述药剂的释放可以与通过激活和/或加速/减速的非侵入和/或最小侵入方法,与在插入处和/或插入后操作的感测和/或激活装置相关联,包括激光束、辐射、热加热和冷却、和超声,包括聚焦超声和/或RF(射频)方法或装置和化学激活子。
根据美国专利公开20110195123的其他实施方式,药物优选包含RNA,例如用于如下所述的乳腺、胰腺、脑、肾、膀胱、肺和前列腺中的局部癌症病例。尽管用RNAi举例说明,但许多药物适用于封装在装载器中,并且可以与本发明结合使用,只要这些药物可以用装载器基质(例如基质)封装,并且该系统可以使用和/或适应于递送本发明的CRISPR Cas系统。
作为特定应用的另一种实例,神经和肌肉退行性疾病由于基因表达异常而发生。RNA的局部递送可具有干扰这种异常基因表达的治疗性质。包括小药物和大分子的抗细胞凋亡、抗炎症和抗退行性药物的局部递送也可任选地是治疗性的。在这种情况下,装载器用于以恒定速率和/或通过单独植入的专用装置延长释放。所有这些都可以用于和/或适应于本发明的CRISPR Cas系统。
作为具体应用的另一种实例,用基因修饰剂治疗精神病和认知障碍。基因敲除是治疗选项。向中枢神经系统部位局部递送药剂的装载器是精神病和认知障碍的治疗选项,包括但不限于精神病、双极疾病、神经病和行为疾病。装载器还可以在特定脑部植入时局部递送包括小药物和大分子的药物。所有这些都可以用于和/或适应于本发明的CRISPR Cas系统。
作为特定应用的另一种实例,在局部位点沉默先天和/或适应性免疫介质能够预防器官移植排斥。通过植入移植器官和/或植入部位的装载器局部递送RNA和免疫调节剂,通过抑制免疫细胞例如针对移植器官激活的CD8而引起局部免疫抑制。所有这些都可以使用/和/或适应于本发明的CRISPR Cas系统。
作为特定应用的另一种实例,包括VEGF和血管生成素等的血管生长因子对于新血管形成是必需的。局部递送因子、肽、肽模拟物或抑制其阻遏物是重要的治疗方式;沉默阻遏物和用装载器局部递送因子、肽、大分子和刺激血管生成的小药物可治疗外周、全身和心血管疾病。
插入(例如植入)方法可任选地已经用于其他类型的组织植入和/或用于插入和/或用于取样组织,在这些方法中任选地没有修饰,或者任选地仅进行非主要修饰。这些方法任选地包括但不限于近距离放射治疗方法、活组织检查、使用和/或不使用超声的内窥镜检查(例如ERCP)、进入脑组织的立体定向方法、腹腔镜检查(包括用腹腔镜植入关节、腹部器官、膀胱壁和体腔)。
可植入装置还可以包括细胞,如已被编辑或修饰以表达本文所公开的CRISPR-CAS系统的表皮祖细胞,并嵌有可植入装置,如贴片。参见,Yue等“Engineered EpidermalProgenitor Cells Can Correct Diet-Induced Obesity and Diabetes”Cell Stem Cell(2017)21(2):256-263。。
本文所讨论的可植入装置技术可结合本文中的教导使用,并因此通过本公开和本领域的知识,可以通过可植入装置递送CRISPR-CAS系统或其组分或其编码或提供组分的核酸分子。
气溶胶递送
针对肺疾病进行治疗的受试者可以例如每个肺接收在自主呼吸时通过支气管递送的药学有效剂量的雾化AAV载体系统。因此,雾化递送通常优选用于AAV递送。腺病毒或AAV颗粒可用于递送。可以将合适的基因构建体克隆到递送载体中,每个基因构建体可操作地连接至一个或多个调控序列。
杂合病毒衣壳递送系统
在一个方面,本发明提供了一种包括杂合病毒衣壳蛋白或杂合病毒外部蛋白的颗粒递送系统,其中所述杂合病毒衣壳或外部蛋白包含附着于非衣壳蛋白或肽的至少一部分的病毒衣壳或外部蛋白。病毒的遗传物质存储在称为衣壳的病毒结构中。某些病毒的衣壳被包封在称为病毒包膜的膜中。病毒包膜由嵌入病毒蛋白质(包括病毒糖蛋白)的脂质双层组成。如本文所用,“包膜蛋白”或“外部蛋白”是指在病毒颗粒表面暴露的、不是衣壳蛋白的蛋白质。例如,包膜或外部蛋白通常包含嵌入病毒包膜中的蛋白质。外部蛋白或包膜蛋白的非限制性实例包括但不限于HIV的gp41和gp120、血凝素、神经氨酸酶和流感病毒的M2蛋白。
在递送系统的一个示例性实施方式中,非衣壳蛋白或肽具有至多兆道尔顿的分子量,或具有在110至160kDa、160至200kDa、200至250kDa、250至300kDa、300至400kDa或400至500kDa范围内的分子量,非衣壳蛋白或肽包含CRISPR蛋白。
本申请提供了一种用于将效应蛋白和至少一种CRISPR指导RNA递送至细胞的载体,所述载体包含可操作地连接至编码所述效应蛋白的多核苷酸序列的最小启动子和可操作地连接至编码至少一种指导RNA的多核苷酸序列的第二最小启动子,其中包含两个最小启动子和多核苷酸序列的所述载体序列的长度小于4.4Kb。在一个实施方式中,病毒是腺相关病毒(AAV)或腺病毒。在另一个实施方式中,效应蛋白是CRISPR酶。在另一个实施方式中,CRISPR酶是SaCas9、Cpf1、Cas13b或C2c2。
在一个相关方面,本发明提供一种用于将效应蛋白和至少一种CRISPR指导RNA递送至细胞的慢病毒载体,所述慢病毒载体包含可操作地连接至编码Cpf1的多核苷酸序列的启动子和可操作地连接至编码至少一种指导RNA的多核苷酸序列的第二启动子,其中所述多核苷酸序列是在相反反向上。
在递送系统的一个实施方式中,病毒是慢病毒或鼠白血病病毒(MuMLV)。
在递送系统的一个实施方式中,病毒是腺病毒或细小病毒或逆转录病毒或弹状病毒或含有糖蛋白(G蛋白)的包膜病毒。
在递送系统的一个实施方式中,病毒是VSV或狂犬病病毒。
在递送系统的一个实施方式中,衣壳或外部蛋白包括具有VP1、VP2或VP3的衣壳蛋白。
在递送系统的一个实施方式中,衣壳蛋白是VP3,并且非衣壳蛋白插入或附着至VP3环3或环6。
在递送系统的一个实施方式中,将病毒递送到细胞内部。
在递送系统的一个实施方式中,衣壳或外部蛋白和非衣壳蛋白在递送到细胞中后能够解离。
在递送系统的一个实施方式中,衣壳或外部蛋白通过接头附着于蛋白质。
在递送系统的一个实施方式中,接头包含氨基酸。
在递送系统的一个实施方式中,接头是化学接头。
在递送系统的一个实施方式中,接头是可切割的。
在递送系统的一个实施方式中,接头是可生物降解的。
在递送系统的一个实施方式中,接头包含(GGGGS)1-3、ENLYFQG或二硫化物。
在一个实施方式中,递送系统包括蛋白酶或编码蛋白酶的核酸分子,所述蛋白酶被表达,所述蛋白酶能够切割接头,由此可以存在接头的切割。在本发明的一个实施方式中,蛋白酶与系统的颗粒组分一起递送,例如通过脂质和/或衣壳包装、混合或封闭。因此,颗粒进入细胞伴随着或随后发生有效载荷从颗粒切割和解离。在某些实施方式中,递送编码蛋白酶的可表达核酸,由此在颗粒进入细胞时或进入细胞后,存在蛋白酶表达、接头切割和有效载荷从衣壳解离。在某些实施方式中,有效载荷的解离发生在病毒复制中。在某些实施方式中,在没有有效的病毒复制的情况下发生有效载荷的解离。
在递送系统的一个实施方式中,CRISPR蛋白的每个末端通过接头附着于衣壳或外部蛋白。
在递送系统的实施方式中,非衣壳蛋白附着到衣壳或外部蛋白的外部部分。
在递送系统的一个实施方式中,非衣壳蛋白附着于衣壳或外部蛋白的内部部分。
在递送系统的一个实施方式中,衣壳或外部蛋白和非衣壳蛋白是融合蛋白。
在递送系统的实施方式中,非衣壳蛋白由衣壳或外部蛋白包封。
在递送系统的实施方式中,非衣壳蛋白附着于形成衣壳或外部蛋白之前的衣壳蛋白的组分或外部蛋白的组分。
在递送系统的一个实施方式中,蛋白质附着于形成衣壳或外部蛋白之后的衣壳或外部蛋白。
在一个实施方式中,递送系统包括靶向部分,例如本发明的脂质实体的主动靶向,例如,本发明的脂质颗粒或纳米颗粒或脂质体或脂质双层包括用于主动靶向的靶向部分。
关于靶向部分,可提及Deshpande等,“Current trends in the use ofliposomes for tumor targeting,”Nanomedicine(Lond).8(9),doi:10.2217/nnm.13.118(2013)及其引用文献,所有这些文献都通过引用并入本文。还提及WO/2016/027264及其引用文献,所有这些文献都通过引用并入本文。并且提及Lorenzer等,“Going beyond theliver:Progress and challenges of targeted delivery of siRNA therapeutics,”Journal of Controlled Release,203:1–15(2015)及其引用的文献,所有这些文献都通过引用并入本文。
通过将靶向部分(包括小分子配体,肽和单克隆抗体)缀合至脂或脂质体表面上来制备主动靶向脂质颗粒或纳米颗粒或脂质体或脂质双层递送系统(通常如本发明的实施方式,“本发明的脂质实体”递送系统);例如,某些受体(例如叶酸和转铁蛋白(Tf)受体(TfR))在许多癌细胞上过表达,并已用于制备肿瘤细胞特异的脂质体。在肿瘤微环境中积累的脂质体随后可以通过与特定细胞表面受体相互作用而被内吞到细胞中。为了有效地将脂质体靶向细胞(例如癌细胞),靶向部分对细胞表面受体具有亲和力并且以足够的量连接靶向部分以对细胞表面受体具有最佳亲和力是有用的;并且确定这些方面是在本领域技术人员的范围内。在主动靶向领域中,存在许多细胞(例如肿瘤)特异性靶向配体。
关于主动靶向,关于靶细胞表面受体(例如癌细胞表面受体),脂质体上的靶向配体可通过非内化表位提供脂质体与细胞(例如血管细胞)的附着;并且,这可以增加被递送的细胞外浓度,从而增加递送至靶细胞的量。靶细胞表面受体(例如癌细胞上的细胞表面受体,例如癌细胞上过表达的细胞表面受体)的策略是使用受体特异性配体或抗体。许多癌细胞类型显示出肿瘤特异性受体的上调。例如,响应于它们增加的代谢需求,TfR和叶酸受体(FR)被许多肿瘤细胞类型极大地过表达。叶酸可以用作特异性递送的靶向配体,因为与活化的巨噬细胞和癌细胞(例如,某些卵巢、乳腺、肺、结肠、肾和脑肿瘤)中的过表达相比,其在正常组织中易于与纳米载体缀合,其对FR具有高亲和力和相对低的FR频率。FR在巨噬细胞上的过表达是炎症性疾病(例如牛皮癣、克罗恩病、类风湿性关节炎和动脉粥样硬化)的指征;因此,本发明的叶酸介导的靶向也可用于研究、解决或治疗炎性疾病以及癌症。本发明的叶酸连接的脂质颗粒或纳米颗粒或脂质体或脂质双层(“本发明的脂质实体”)通过受体介导的内吞作用将货物递送至细胞内。细胞内运输可以被引导到促进货物释放的酸性隔室,并且最重要的是,可以改变或延迟货物的释放直到其到达细胞质或靶细胞器附近。使用具有靶向部分的本发明的脂质实体(例如本发明的叶酸连接的脂质实体)递送货物可优于本发明的非靶向脂质实体。叶酸直接连接到脂质头部基团可能不利于本发明的叶酸缀合的脂质实体的细胞内递送,因为它们可能不像通过间隔子附着于本发明的脂质实体的叶酸(可以更有效地进入癌细胞)那样有效地结合细胞。与叶酸偶联的本发明的脂质实体可用于递送脂质的复合物,例如脂质体,例如阴离子脂质体,和病毒或衣壳或包膜或病毒外部蛋白,例如本文所讨论的那些,例如腺病毒或AAV。Tf是参与铁在全身的转运的约80KDa的单体血清糖蛋白。Tf与TfR结合并通过受体介导的内吞作用转移到细胞中。TfR的表达在某些细胞中(例如肿瘤细胞)与正常细胞相比可以更高,并且与快速增殖的癌细胞中增加的铁需求相关。因此,本发明包括本发明的TfR靶向的脂质实体,例如,关于肝细胞、肝癌、乳腺细胞(例如乳腺癌细胞)、结肠(例如结肠癌细胞)、卵巢细胞(例如卵巢癌细胞)、头、颈部和肺部细胞(例如头、颈部和非小细胞肺癌细胞)、口腔细胞(例如口腔肿瘤细胞)。
同样关于主动靶向,本发明的脂质实体可以是多功能的,即,使用多于一种靶向部分(例如CPP)与Tf一起;双功能系统;例如,Tf和聚-L-精氨酸的组合可以提供穿过血脑屏障的内皮的转运。EGFR是属于ErbB受体家族的酪氨酸激酶受体,其介导细胞生长、分化和细胞(特别是非癌细胞)中的修复,但EGF在某些细胞中过表达,例如许多实体瘤,包括结肠直肠、非小细胞肺癌、卵巢鳞状细胞癌、肾、头、胰腺、颈部和前列腺,尤其是乳腺癌。本发明包括与本发明的脂质实体连接的EGFR靶向单克隆抗体。HER-2通常在乳腺癌患者中过度表达,也与肺癌、膀胱癌、前列腺癌、脑癌和胃癌相关。HER-2由ERBB2基因编码。本发明包括本发明的HER-2靶向的脂质实体,例如本发明的抗HER-2抗体(或其结合片段)脂质实体、本发明的HER-2靶向PEG化的脂质实体(例如,具有抗HER-2-抗体或其结合片段)、本发明的HER-2靶向马来酰亚胺PEG聚合物脂质实体(例如,具有抗HER-2抗体或其结合片段)。在细胞结合后,受体抗体复合物可以通过形成内体来内化以递送至细胞质。关于受体介导的靶向,技术人员考虑配体/靶亲和力和细胞表面上的受体数量,并且聚乙二醇化可以作为阻止与受体相互作用的屏障。使用本发明靶向的抗体脂质实体可以是有利的。靶向部分的多价提呈还可以增加抗体片段的摄入和信号传导特性。在本发明的实践中,技术人员考虑配体密度(例如,本发明的脂质实体上的高配体密度可以有利于增加与靶细胞的结合)。巨噬细胞的早期预防可以用本发明的空间稳定的脂质实体和将配体连接到锚定在本发明的脂质实体中(例如,脂质颗粒或纳米颗粒或脂质体或脂质双层)的分子的末端(例如PEG)来解决。可以靶向细胞团的微环境,例如肿瘤微环境;例如,靶向细胞团脉管系统(例如,肿瘤脉管系统微环境),可以是有利的。因此,本发明包括靶向VEGF。VEGF及其受体是众所周知的促血管生成分子,并且是抗血管生成治疗的充分表征的靶标。已经开发了许多受体酪氨酸激酶(例如VEGFR或碱性FGFR)的小分子抑制剂作为抗癌剂,并且本发明包括将这些肽中的任何一种或多种与本发明的脂质实体偶联,例如噬菌体IVO肽(例如,通过或具有PEG末端)、肿瘤归巢肽APRPG(例如APRPG-PEG-修饰)。VCAM,血管内皮在炎症、血栓形成和动脉粥样硬化的发病机制中起关键作用。CAM涉及炎性疾病,包括癌症,并且是合乎逻辑的靶标,E和P选择蛋白,VCAM-1和ICAM可用于靶向本发明的脂质实体,例如,利用PEG化。基质金属蛋白酶(MMP)属于锌依赖性内肽酶家族。它们参与组织重塑、肿瘤侵袭、抗凋亡和转移。存在四种MMP抑制剂,称为TIMP1-4,它们决定肿瘤生长抑制和转移之间的平衡;参与肿瘤血管血管生成的蛋白质是MT1-MMP,只在新形成的血管和肿瘤组织上表达。MT1-MMP的蛋白水解活性在质膜处切割蛋白质,例如纤连蛋白、弹性蛋白、胶原蛋白和层粘连蛋白,并激活降解基质的可溶性MMP(例如MMP-2)。抗体或其片段例如Fab'片段可用于本发明的实践中,例如用于与本发明的脂质实体连接的抗人MT1-MMP单克隆抗体,例如通过间隔子(例如PEG间隔子)。αβ-整联蛋白或整联蛋白是一组跨膜糖蛋白受体,其介导细胞与其周围组织或细胞外基质之间的附着。整联蛋白含有两个不同的链(异二聚体),称为α-和β-亚基。整联蛋白受体的肿瘤组织特异性表达可用于本发明中的靶向递送,例如,其中靶向部分可以是RGD肽,例如环状RGD。适体是ssDNA或RNA寡核苷酸,其通过与Watson-Crick碱基配对(这对于寡核苷酸的键合相互作用是典型的)相对的静电相互作用、氢键和疏水相互作用赋予靶分子高亲和力和特异性识别。作为靶向部分的适体可以具有优于抗体的优点:与抗体相比,适体可以表现出更高的靶抗原识别;与抗体相比,适体可以更稳定,尺寸更小;适体可以很容易地合成和经化学修饰用于分子缀和;并且适体可以改变顺序以提高选择性,并且可以开发以识别免疫原性差的靶标。作为sgc8适体的这样的部分可用作靶向部分(例如,通过共价连接至本发明的脂质实体,例如,通过间隔子(例如PEG间隔子))。靶向部分可以是刺激敏感性的,例如对外部施加的刺激敏感,例如磁场、超声或光;也可以使用pH引发,例如,可以在亲水部分(例如PEG)和疏水部分(例如本发明的脂质实体)之间使用不稳定连接,其仅在暴露于以特定环境或微环境(例如内吞液泡或酸性肿瘤块)为特征的相对酸性条件下切割。pH敏感性共聚物也可引入本发明的实施方式中,可提供遮蔽;二异酯、乙烯基酯、半胱氨酸可切割脂聚合物、双酯和腙是pH敏感性键的多个实例,所述键在pH 7.5时非常稳定,但是在pH 6及以下时相对快速地水解,例如,N-异丙基丙烯酰胺和甲基丙烯酸的末端烷基化共聚物,该共聚物促进本发明的脂质实体的去稳定化并在具有降低的pH值的区室中释放;或者,本发明包括用于产生本发明的pH响应性脂质实体的离子聚合物(例如,聚(甲基丙烯酸)、聚(甲基丙烯酸二乙基氨基乙酯)、聚(丙烯酰胺)和聚(丙烯酸))。温度触发的递送也在本发明的范围内。与正常组织相比,许多病理区域(例如发炎的组织和肿瘤)显示出独特的高热。利用这种高热是癌症治疗中的有吸引力的策略,因为高热与增加的肿瘤渗透性和增加的摄取相关。该技术涉及部位的局部加热以增加微血管孔径和血流量,这反过来可导致本发明实施方式的增加的溢出。本发明的温度敏感性脂质实体可由具有低临界溶解温度的热敏脂质或聚合物制备。在高于低临界溶解温度(例如,在部位例如肿瘤部位或发炎的组织部位)下,聚合物沉淀,破坏脂质体以释放。具有特定的凝胶至液相转变温度的脂质用于制备本发明的这些脂质实体;用于热敏感性实施方式的脂质可以是二棕榈酰磷脂酰胆碱。热敏聚合物还可以促进去稳定化,然后释放,并且有用的热敏聚合物是聚(N-异丙基丙烯酰胺)。另一种温度触发系统可以使用溶脂温度敏感的脂质体。本发明还包括氧化还原触发的递送:正常和发炎或肿瘤组织之间以及细胞内和细胞外环境之间的氧化还原电位差异已被用于递送;例如,GSH是在细胞中丰富的还原剂,特别是在胞质溶胶、线粒体和细胞核中。血液和细胞外基质中的GSH浓度分别是细胞内浓度的一百分之一至一千分之一。由GSH、半胱氨酸和其他还原剂引起的这种高氧化还原电位差异可破坏可还原键,使本发明的脂质实体不稳定并导致有效载荷的释放。二硫键可以用作本发明的脂质实体中的可切割/可逆接头,因为它由于二硫化物-硫醇还原反应而引起对氧化还原的敏感性;通过使用两种(例如,两种形式的二硫键缀合的多功能脂质作为二硫键的切割(例如,通过三(2-羧乙基)膦、二硫苏糖醇、L-半胱氨酸或GSH)),可以使本发明的脂质实体对还原敏感,可以导致缀合物的亲水性头部基团的去除并且改变膜组织,导致有效载荷的释放。钙从含有二硫化物缀合物的本发明的还原敏感性脂质实体中释放可以比还原非敏感性实施方式更有用。酶也可以作为释放有效加载的触发子。酶,包括MMP(如MMP2)、磷脂酶A2、碱性磷酸酶、转谷氨酰胺酶或磷脂酰肌醇特异性磷脂酶C,已经被发现在某些组织(例如肿瘤组织)中过表达。在这些酶的存在下,本发明的特别工程化的酶敏感性脂质实体可被破坏并释放有效加载。MMP2可切割的八肽(Gly-Pro-Leu-Gly-Ile-Ala-Gly-Gln)可以引入接头中,并且可以具有抗体(例如抗体2C5)靶向。本发明还包括光或能量触发的递送,例如,本发明的脂质实体可以是光敏感性的,使得光或能量可以促进结构和构象变化,这导致本发明的脂质实体与靶细胞通过膜融合、光异构、光致片段化或光聚合作用直接相互作用;这样的部分可以是苯并卟啉光敏剂。超声可以是触发递送的能量形式;具有少量特定气体(包括空气或多孔烃)的本发明的脂质实体可通过超声(例如,低频超声(LFUS))被触发以释放。磁性递送:本发明的脂质实体可以通过引入磁铁矿(例如Fe3O4或γ-Fe2O3,例如尺寸小于10nm的磁铁矿)而被磁化。然后可以通过暴露于磁场来进行靶向递送。
此外,关于主动靶向,本发明还包括细胞内递送。由于脂质体遵循内吞途径,它们被包埋在内体中(pH 6.5-6)并随后与溶酶体(pH<5)融合,在那里它们经历降解,导致较低的治疗潜力。可以利用低内体pH来逃避降解。融合脂质或肽在低pH下构象转变/活化后使内体膜不稳定。胺在酸性pH下质子化并通过缓冲作用引起内体肿胀和破裂。不饱和二油酰磷脂酰乙醇胺(DOPE)在低pH下容易采用倒六角形状,这导致脂质体融合到内体膜上。该过程使含有DOPE的脂质实体不稳定并将货物释放到细胞质中;融合脂质GALA、胆固醇-GALA和PEG-GALA可显示出高效的内体释放;成孔蛋白质李斯特菌溶血素O可以提供内体逃逸机制;并且,富含组氨酸的肽具有与内体膜融合的能力,导致孔形成,并且可以缓冲质子泵,导致膜裂解。
此外,关于主动靶向,细胞穿透肽(CPP)促进大分子通过细胞膜的摄取,并因此增强细胞内CPP修饰的分子的递送。CPP可以分为两类:两亲性螺旋肽,例如转运蛋白和MAP,其中赖氨酸残基是正电荷的主要贡献者;和富含Arg精氨酸的肽,例如TATp、触足肽(Antennapedia)或渗透肽。TATp是具有86个氨基酸的转录激活子,含有导致核定位和RNA结合的高碱性(9个残基中的2个赖氨酸和6个精氨酸)蛋白转导结构域。已经用于修饰脂质体的其他CPP包括以下:触足肽的最小蛋白质转导结构域,触足肽是果蝇同源异型蛋白,称为渗透肽,其是存在于同源结构域的第三螺旋中的16聚肽(残基43-58);27个氨基酸长的嵌合CPP,含有来自通过Lys残基结合的神经肽甘丙肽的氨基末端的肽序列,蜂毒肽,其是黄蜂毒肽;VP22,其是HSV-1的主要结构成分,促进细胞内转运和转运(transportan)(18聚)两亲模型肽,其通过能量依赖性和非依赖性机制两者易位肥大细胞和内皮细胞的质膜。本发明包括CPP修饰的本发明的脂质实体,用于可以通过能量依赖性巨胞饮作用然后内体逃逸进行细胞内递送。本发明进一步包括细胞器特异性靶向。用三苯基膦(TPP)部分表面功能化的本发明的脂质实体或含有亲脂性阳离子罗丹明123的本发明的脂质实体可有效地将货物递送至线粒体。DOPE/鞘磷脂/硬脂酰-八-精氨酸可通过膜融合将货物递送到线粒体内部。用溶酶体配体十八烷基罗丹明B表面修饰的本发明的脂质实体可以将货物递送至溶酶体。神经酰胺可用于诱导溶酶体膜渗透;本发明包括具有神经酰胺的本发明的脂质实体的细胞内递送。本发明进一步包括靶向细胞核(例如通过DNA插入部分)的本发明的脂质实体。本发明还包括用于靶向的多功能脂质体,即,将多于一个官能团连接到本发明的脂质实体的表面,例如以增强在期望位点的积累和/或促进细胞器特异性递送和/或靶向特定类型的细胞和/或响应于局部刺激,例如温度(例如,升高的)、pH(例如,降低的),响应于外部施加的刺激,例如磁场、光、能量、热或超声和/或促进货物的细胞内递送。所有这些被认为是主动靶向部分。
本发明的一个实施方式包括递送系统,其包括主动靶向脂质颗粒或纳米颗粒或脂质体或脂质双层递送系统;或包括含有靶向部分的脂质颗粒或纳米颗粒或脂质体或脂质双层,其中存在主动靶向或其中靶向部分是主动靶向部分。靶向部分可以是一个或多个靶向部分,靶向部分可以用于任何期望类型的靶向,例如靶向细胞,例如本文所述的任何细胞;或针对例如本文所述的任何细胞器;或用于靶向对例如物理条件(例如热、能量、超声、光、pH、化学物质如酶或磁刺激)的应答;或者靶向以实现特定的结果,例如将有效载荷递送到特定位置,例如通过细胞穿透。
应当理解的是,关于本文所讨论的每个可能的靶向或主动靶向部分,存在本发明的一个方面,其中递送系统包括这样的靶向或主动靶向部分。同样地,下表提供了可用于实施本发明的示例性靶向部分,并且关于本发明的每个方面,提供了包括这种靶向部分的递送系统。
因此,在递送系统的一个实施方式中,靶向部分包含受体配体,比如,例如,针对CD44受体的透明质酸、针对肝细胞的半乳糖,或抗体或其片段,例如针对期望表面受体的结合抗体片段,靶向部分各自包含受体配体,或抗体或其片段,例如其结合片段,例如针对期望的表面受体,存在的本发明一个方面,其中递送系统包括靶向部分,所述靶向部分包含受体配体,或抗体或其片段,例如其结合片段,例如针对期望的表面受体,或针对CD44受体的透明质酸,针对肝细胞的半乳糖(参见例如,Surace等,“Lipoplexes targeting theCD44hyaluronic acid receptor for efficient transfection of breast cancercells,”J.Mol Pharm 6(4):1062-73;doi:10.1021/mp800215d(2009);Sonoke等,“Galactose-modified cationic liposomes as a liver-targeting delivery systemfor small interfering RNA,”Biol Pharm Bull.34(8):1338-42(2011);Torchilin,“Antibody-modified liposomes for cancer chemotherapy,”Expert Opin.DrugDeliv.5(9),1003-1025(2008);Manjappa等,“Antibody derivatization andconjugation strategies:application in preparation of stealth immunoliposometo target chemotherapeutics to tumor,”J.Control.Release 150(1),2-22(2011);Sofou S“Antibody-targeted liposomes in cancer therapy and imaging,”ExpertOpin.Drug Deliv.5(2):189-204(2008);Gao J等,“Antibody-targeted immunoliposomesfor cancer treatment,”Mini.Rev.Med.Chem.13(14):2026-2035(2013);Molavi等,“Anti-CD30antibody conjugated liposomal doxorubicin with significantlyimproved therapeutic efficacy against anaplastic large cell lymphoma,”Biomaterials 34(34):8718-25(2013),其中的每一篇和其中引用的文献通过引用并入本文)。
此外,关于本发明的脂质实体,基于本文的教导,本领域技术人员可以容易地选择并在本发明的实践中应用期望的靶向部分。本发明包括一个实施方式,其中递送系统包括具有靶向部分的脂质实体。
在递送系统的一个实施方式中,蛋白质包含CRISPR蛋白质或其部分。
在一些实施方式中,非衣壳蛋白或不是病毒外部蛋白或病毒包膜的蛋白(本文中有时简称“非衣壳蛋白”),例如CRISPR蛋白或其部分,可以在其上具有一个或多个功能部分,例如用于靶向或定位的部分,例如NLS或NES,或活化剂或阻遏物。
在递送系统的一个实施方式中,蛋白质或其部分可包含标签。
在一个方面,本发明提供了一种病毒颗粒,其包含衣壳或外部蛋白,所述衣壳或外部蛋白包含一种或多种杂合病毒衣壳或外部蛋白,所述杂合病毒衣壳或外部蛋白包含附着于非衣壳蛋白或CRISPR蛋白的至少一部分的病毒衣壳或外部蛋白。
在一个方面,本发明提供了递送的体外方法,其包含将递送系统与细胞(优选真核细胞)接触,由此将递送系统的组分递送到细胞中。
在一个方面,本发明提供了一种递送的体外调查或研究方法,其包括使递送系统与细胞,任选地与真核细胞接触,由此将所述递送系统的组分递送到细胞中,任选地从所述接触获得数据或结果,并传输所述数据或结果。
在一个方面,本发明提供了来自体外递送方法的细胞或体外递送方法的细胞,其中所述方法包括使递送系统与细胞,任选地与真核细胞接触,由此将所述递送系统的组分递送到细胞中,任选地从所述接触获得数据或结果,并传输所述数据或结果。
在一个方面,本发明提供了来自体外递送方法的细胞或体外递送方法的细胞,其中所述方法包括使递送系统与细胞,任选地与真核细胞接触,由此将所述递送系统的组分递送到细胞中,任选地从所述接触获得数据或结果,并传输所述数据或结果;并且其中细胞产物与未与递送系统接触的细胞相比发生改变,例如是从本来是细胞的野生型但由于接触改变而来。
在一个实施方式中,细胞产物是非人的或动物的。
在一个方面,本发明提供了颗粒递送系统,其包括复合病毒颗粒,其中所述复合病毒颗粒包含脂质、病毒衣壳蛋白,和非衣壳蛋白或肽的至少一部分。非衣壳肽或蛋白质可具有至多兆道尔顿的分子量。
在一个实施方式中,颗粒递送系统包括吸附至脂质体或脂质颗粒或纳米颗粒的病毒颗粒。在一个实施方式中,病毒通过静电相互作用吸附到脂质体或脂质颗粒或纳米颗粒,或通过接头共价连接。溶解在乙酸钠缓冲液(pH 5.2)或纯H2O(pH 7)中的脂质颗粒或纳米颗粒(1mg/ml)带正电荷。大多数病毒的等电点在3.5-7范围内。它们在乙酸钠缓冲液(pH5.2)或纯H2O中具有带负电荷的表面。病毒与脂质体或合成脂质纳米颗粒之间的静电相互作用是驱动吸附的最重要因素。通过修饰脂质纳米颗粒的电荷密度,例如将中性脂质包含到脂质纳米颗粒中,可以调节脂质纳米颗粒和病毒之间的相互作用,从而调节组装。在一个实施方式中,脂质体包含阳离子脂质。
在一个实施方式中,颗粒递送系统的脂质体包含CRISPR系统组分。
在一个方面,本发明提供了一种包含一种或多种杂合病毒衣壳蛋白与脂质颗粒组合的递送系统,其中所述杂合病毒衣壳蛋白包含附着于非衣壳蛋白的至少一部分的病毒衣壳蛋白的至少一部分。
在一个实施方式中,递送系统的病毒衣壳蛋白附着于脂质颗粒的表面。当脂质颗粒是双层,例如脂质体时,脂质颗粒包含外部亲水表面和内部亲水表面。在一个实施方式中,病毒衣壳蛋白通过静电相互作用或通过疏水相互作用附着于脂质颗粒的表面。
在一个实施方式中,颗粒递送系统的直径为50-1000nm,优选100-1000nm。
在一个实施方式中,递送系统包含非衣壳蛋白或肽,其中非衣壳蛋白或肽具有至多兆道尔顿的分子量。在一个实施方式中,非衣壳蛋白或肽的分子量为110至160kDa,160至200kDa,200至250kDa,250至300kDa,300至400kDa或400至500kDa。
在一个实施方式中,递送系统包括非衣壳蛋白或肽,其中蛋白质或肽包括CRISPR蛋白或肽。在一个实施方式中,蛋白质或肽包括Cas9、Cpf1或C2c2/Cas13a。
在一个实施方式中,杂合衣壳蛋白与野生型衣壳蛋白的重量比为1:10至1:1,例如,1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9和1:10。
在一个实施方式中,递送系统的病毒是腺病毒或细小病毒或弹状病毒或含有糖蛋白的包膜病毒。在一个实施方式中,病毒是腺相关病毒(AAV)或腺病毒或VSV或狂犬病病毒。在一个实施方式中,病毒是逆转录病毒或慢病毒。在一个实施方式中,该病毒是鼠白血病病毒(MuMLV)。
在一个实施方式中,递送系统的病毒衣壳蛋白包括VP1、VP2或VP3。
在一个实施方式中,递送系统的病毒衣壳蛋白是VP3,以及非衣壳蛋白被插入或链接或连接到VP3环3或环6。
在一个实施方式中,递送系统的病毒被递送至细胞内部。
在一个实施方式中,病毒衣壳蛋白和非衣壳蛋白在递送到细胞中后能够解离。
在递送系统的一个方面,病毒衣壳蛋白通过接头附着于非衣壳蛋白。在一个实施方式中,接头包含氨基酸。在一个实施方式中,接头是化学接头。在另一个实施方式中,接头是可切割的或可生物降解的。在一个实施方式中,接头包含(GGGGS)1-3、ENLYFQG或二硫化物。
在递送系统的一个实施方式中,非衣壳蛋白的每个末端通过接头部分附着于衣壳蛋白。
在一个实施方式中,非衣壳蛋白附着于病毒衣壳蛋白的外部部分。如本文所用,“外部部分”在其指病毒衣壳蛋白时是指当其在形成的病毒衣壳中时病毒衣壳蛋白的外表面。
在一个实施方式中,非衣壳蛋白附着于衣壳蛋白的内部部分或封装在脂质颗粒内。如本文所用,“内部部分”在其指病毒衣壳蛋白时是指当其在形成的病毒衣壳中时病毒衣壳蛋白的内表面。在一个实施方式中,病毒衣壳蛋白和非衣壳蛋白是融合蛋白。
在一个实施方式中,融合蛋白附着于脂质颗粒的表面。
在一个实施方式中,在形成衣壳之前,非衣壳蛋白附着于病毒衣壳蛋白。
在一个实施方式中,在形成衣壳之后,非衣壳蛋白附着于病毒衣壳蛋白。
在一个实施方式中,非衣壳蛋白包含靶向部分。
在一个实施方式中,靶向部分包含受体配体。
在一个实施方式中,非衣壳蛋白包含标签。
在一个实施方式中,非衣壳蛋白包含一个或多个异源核定位信号(NLS)。
在一个实施方式中,蛋白质或肽包括II型CRISPR蛋白或V型CRISPR蛋白。
在一个实施方式中,递送系统还包括任选地与CRISPR蛋白复合的指导RNS。
在一个实施方式中,递送系统包括蛋白酶或编码蛋白酶的核酸分子,所述蛋白酶被表达,由此所述蛋白酶切割接头。在某些实施方式中,在没有高产病毒复制的情况下,存在蛋白酶表达、接头切割,和从衣壳解离有效加载。
在一个方面,本发明提供了一种递送系统,其包括第一杂合病毒衣壳蛋白和第二杂合病毒衣壳蛋白,其中所述第一杂合病毒衣壳蛋白包含附着于蛋白质的第一部分的病毒衣壳蛋白,并且其中所述第二杂合病毒衣壳蛋白包含附着于所述蛋白质的第二部分的第二病毒衣壳蛋白,其中所述蛋白质的第一部分和所述蛋白质的第二部分能够联合以形成功能性蛋白质。
在一个方面,本发明提供了一种递送系统,其包括第一杂合病毒衣壳蛋白和第二杂合病毒衣壳蛋白,其中所述第一杂合病毒衣壳蛋白包含附着于CRISPR蛋白的第一部分的病毒衣壳蛋白,并且其中所述第二杂合病毒衣壳蛋白包含附着于所述CRISPR蛋白的第二部分的第二病毒衣壳蛋白,其中所述CRISPR蛋白的第一部分和所述CRISPR蛋白的第二部分能够联合以形成功能性蛋白质。
在递送系统的一个实施方式中,第一杂合病毒衣壳蛋白和第二病毒衣壳蛋白在同一病毒颗粒的表面上。
在递送系统的一个实施方式中,第一杂合病毒衣壳蛋白位于第一病毒颗粒的内部,并且第二杂合病毒衣壳蛋白位于第二病毒颗粒的内部。
在递送系统的一个实施方式中,蛋白质或CRISPR蛋白的第一部分与配体对的第一成员连接,并且蛋白质或CRISPR蛋白的第二部分与配体对的第二成员连接,其中所述配体对的第一部分与所述配体对的第二部分在细胞中结合。在一个实施方式中,所述配体对的第一部分与所述配体对的第二部分的结合是诱导型的。
在递送系统的一个实施方式中,蛋白质或CRISPR蛋白的第一部分和蛋白质或CRISPR蛋白的第二部分中的任一者或两者包含一个或多个NLS。
在递送系统的一个实施方式中,蛋白质或CRISPR蛋白的第一部分和蛋白质或CRISPR蛋白的第二部分中的任一者或两者包含一个或多个核输出信号(NES)。
在某些实施方式中,病毒结构组分包含一种或多种衣壳蛋白,包括整个衣壳。在某些实施方式中,例如其中病毒衣壳包含多拷贝的不同蛋白质,递送系统可提供一种或多种相同蛋白质或这些蛋白质的混合物。例如,AAV包含3种衣壳蛋白VP1、VP2和VP3,因此本发明的递送系统可包含一种或多种VP1,和/或一种或多种VP2,和/或一种或多种VP3。因此,本发明适用于腺病毒科中的病毒,例如腺病毒(例如Odenatadeno virus D)、禽腺病毒(Aviadenovirus)(例如Fowl aviadenovirus A),Ichtadenovirus(例如Sturgeonichtadenovirus A)、哺乳动物腺病毒(Mastadenovirus)(包括腺病毒,例如所有人类的腺病毒)(例如,人乳腺病毒C(Human mastadenovirus C))和Siadenovirus(例如青蛙暹罗病毒A(Frog siadenovirus A))。因此,考虑了腺病毒科内的病毒在本发明内,本文关于腺病毒的讨论适用于其他科成员。可以使用或选择靶特异性AAV衣壳变体。非限制性实例包括经选择与慢性髓性白血病细胞、人CD34PBPC细胞、乳腺癌细胞、肺细胞、心脏、真皮成纤维细胞、黑素瘤细胞、干细胞、成胶质细胞瘤细胞、冠状动脉内皮细胞和角质形成细胞结合的衣壳变体。参见,例如,Buning等,2015,Current Opinion in Pharmacology 24,94-104。从关于腺病毒的修饰的本文的教导和本领域的知识(参见,例如,美国专利9,410,129、7,344,872、7,256,036、6,911,199、6,740,525;Matthews,“Capsid-Incorporation of Antigensinto Adenovirus Capsid Proteins for a Vaccine Approach,”Mol Pharm,8(1):3-11(2011)),以及关于AAV的修饰,技术人员可以容易地获得具有大的有效载荷蛋白质或CRISPR蛋白的经修饰的病毒,尽管迄今为止未预期可在腺病毒上提供如此大的蛋白质。并且对于与本文提及的腺病毒相关的病毒,以及与本文提及的AAV相关的病毒,从本公开和本领域的知识,本文分别关于修饰腺病毒和AAV的教导可以应用于那些病毒而无需过度实验。
在另一个方面,本发明提供与腺相关病毒(AAV)相关联的非天然存在的或工程化的CRISPR蛋白,例如,AAV包含作为融合的CRISPR蛋白,其带有或不带有接头,融合至或与AAV衣壳蛋白(例如VP1、VP2和/或VP3)融合;并且,为了简化目的,这种非天然存在的或工程化的CRISPR蛋白在本文中称为“AAV-CRISPR蛋白”。更特别是,修饰本领域的知识,例如,Rybniker等,“Incorporation of Antigens into Viral Capsids AugmentsImmunogenicity of Adeno-Associated Virus Vector-Based Vaccines,”J Virol.Dec2012;86(24):13800–13804,Lux K,等2005.Green fluorescent protein-tagged adeno-associated virus particles allow the study of cytosolic and nucleartrafficking.J.Virol.79:11776–11787,Munch RC,等2012.“Displaying high-affinityligands on adeno-associated viral vectors enables tumor cell-specific andsafe gene transfer.”Mol.Ther.[Epub ahead of print.]doi:10.1038/mt.2012.186andWarrington KH,Jr,等2004.Adeno-associated virus type 2VP2capsid protein isnonessential and can tolerate large peptide insertions at its Nterminus.J.Virol.78:6595–6609,均通过引用并入本文,可以获得本发明的修饰的AAV衣壳。本领域技术人员将理解,如果插入AAV帽(cap)基因中,本文所述的修饰可导致VP1、VP2和/或VP3衣壳亚基的修饰。或者,衣壳亚基可以独立表达,以仅在一个或两个衣壳亚基(VP1、VP2、VP3、VP1+VP2、VP1+VP3或VP2+VP3)中实现修饰。可以修饰帽基因以在期望的位置表达非衣壳蛋白,有利地是大的有效载荷蛋白,例如CRISPR蛋白。同样地,这些可以是与蛋白(例如大的有效载荷蛋白,例如以与现有技术融合类似的方式融合的CRISPR蛋白)的融合。参见,例如美国专利公开20090215879;Nance等,“Perspective on Adeno-AssociatedVirus Capsid Modification for Duchenne Muscular Dystrophy Gene Therapy,”HumGene Ther.26(12):786–800(2015)和其中引用的文献,通过引用并入本文。本领域技术人员从本公开和本领域的知识可以制备和使用如本发明中的修饰的AAV或AAV衣壳,并且通过本公开,现在人们知道大的有效载荷蛋白可以与AAV衣壳融合。申请人提供了AAV衣壳-CRISPR蛋白(例如,Cas、Cas9、dCas9、Cpf1、Cas13a、Cas13b)融合,并且那些AAV-衣壳CRISPR蛋白(例如,Cas、Cas9)融合可以是包含编码或提供CRISPR-Cas或CRISPR系统或复合RNA指导的核酸分子的重组AAV,由此CRISPR蛋白(例如Cas、Cas9)融合递送CRISPR-Cas或CRISPR系统复合物(例如,CRISPR蛋白或Cas或Cas9或Cpf1由融合提供,例如VP1、VP2、prVP3融合),并且指导RNA是由重组病毒的编码提供,由此在体内、在细胞中,CRISPR-Cas或CRISPR系统由提供指导RNA的重组的核酸分子和提供CRISPR酶或Cas或Cas9的病毒的外表面组装而成。例如,复合物在本文中可称为“AAV-CRISPR系统”或“AAV-CRISPR-Cas”或“AAV-CRISPR复合物”或“AAV-CRISPR-Cas复合物”。因此,本发明也适用于Dependoparvovirus属或细小病毒科的病毒,例如AAV,或Amdoparvovirus的病毒(例如Carnivore amdoparvovirus 1),Aveparvovirus的病毒(例如Galliform aveparvovirus 1),Bocaparvovirus的病毒(例如Ungulate bocaparvovirus1),Copiparvovirus的病毒(例如Ungulate copiparvovirus1),Dependoparvovirus的病毒(例如腺相关的Dependoparvovirus A),Erythroparvovirus的病毒(例如灵长类erythroparvovirus 1),Protoparvovirus的病毒(例如,啮齿动物erythroparvovirus 1),Tetraparvovirus(例如灵长类Tetraparvovirus 1)。因此,考虑了细小病毒科或Dependoparvovirus属中的病毒或细小病毒科内的任何其他前述属在本发明内,本文关于AAV的讨论适用于这样的其他病毒。
在一个方面,本发明提供一种非天然存在的或工程化的组合物,其包含CRISPR酶,所述CRISPR酶是AAV衣壳结构域的部分或者链接至AAV衣壳结构域的部分,即,腺相关病毒(AAV衣壳)的VP1、VP2或VP3结构域。在一些实施方式中,AAV衣壳结构域的部分或链接至AAV衣壳结构域的部分包括与AAV衣壳结构域相关联。在一些实施方式中,CRISPR酶可以与AAV衣壳结构域融合。在一些实施方式中,融合可以是在AAV衣壳结构域的N末端。因此,在一些实施方式中,CRISPR酶的C末端融合至AAV衣壳结构域的N末端。在一些实施方式中,NLS和/或接头(例如GlySer接头)可位于CRISPR酶的C末端和AAV衣壳结构域的N末端之间。在一些实施方式中,融合可以是在AAV衣壳结构域的C末端。在一些实施方式中,这不是优选的,因为AAV的VP1、VP2和VP3结构域是相同RNA的可变剪接,因此C末端融合可影响所有三个结构域。在一些实施方式中,AAV衣壳结构域是截短的。在一些实施方式中,去除一些或所有AAV衣壳结构域。在一些实施方式中,去除一些AAV衣壳结构域并用接头(例如GlySer接头)替换,通常使AAV衣壳结构域的N末端和C末端完整,例如前2个、5个或10个氨基酸。通过这种方式,VP3结构域的内部(非末端)部分可以用接头替换。特别优选的是,接头与CRISPR蛋白融合。可以使用支链接头,其中CRISPR蛋白融合至其中分支之一的末端。这允许衣壳和CRISPR蛋白之间的一定程度的空间分离。以这种方式,CRISPR蛋白是AAV衣壳结构域的一部分(或融合至AAV衣壳结构域)。
或者,CRISPR酶可以在AAV衣壳结构域的框内(即在内部)融合。因此,在一些实施方式中,AAV衣壳结构域再次优选地保留其N末端和C末端。在这种情况下,在一些实施方式中,接头优选地在CRISPR酶的一端或两端。以这种方式,CRISPR酶再次是AAV衣壳结构域的一部分(或融合)。在某些实施方式中,CRISPR酶的定位使得CRISPR酶一旦形成就位于病毒衣壳的外表面。在一个方面,本发明提供了非天然存在的或工程化的组合物,其包含与腺相关病毒(AAV)衣壳的AAV衣壳结构域相关的CRISPR酶。这里,相关联可以意味着在一些实施方式中融合,或者在一些实施方式中与之结合,或者在一些实施方式中与之链接。在一些实施方式中,CRISPR蛋白可以与VP1、VP2或VP3结构域链接。这可以通过连接蛋白或链接系统,例如生物素-链霉亲和素系统。在一个实例中,因此,生物素化序列(15个氨基酸)可以与CRISPR蛋白融合。当还提供AAV衣壳结构域(尤其是AAV AAV衣壳结构域的N末端)与链霉亲和素的融合时,两者将因此以非常高的亲和力相关联。因此,在一些实施方式中,提供了包含CRISPR蛋白-生物素融合和链霉亲和素-AAV衣壳结构域排列的组合物或系统,例如融合。当两部分组合在一起时,CRISPR蛋白-生物素和链霉亲和素-AAV衣壳结构域形成单一复合物。NLS也可以引入CRISPR蛋白和生物素之间;和/或链霉亲和素和AAV衣壳结构域之间。
替代性链接可以是将AAV衣壳结构域与结合或识别相应的RNA序列或基序的衔接蛋白融合或以其他方式链接。在一些实施方式中,衔接子是或包含结合蛋白,所述结合蛋白识别并结合(或被结合)对所述结合蛋白特异的RNA序列。在一些实施方式中,优选的实例是MS2(参见Konermann等Dec 2014,下文引用,通过引用并入本文)结合蛋白,其识别并结合(或被结合)对MS2蛋白特异的RNA序列。
当AAV衣壳结构域与衔接蛋白相关联,CRISPR蛋白可以在一些实施方式中链接至AAV衣壳结构域的衔接蛋白。在一些实施方式中,CRISPR蛋白可以通过在具有经修饰的指导的复合物中的CRISPR酶链接至AAV衣壳结构域的衔接蛋白,参见Konermann等。在一些实施方式中,经修饰的指导是sgRNA。在一些实施方式中,经修饰的指导包含不同的RNA序列;参见例如PCT/US14/70175,其通过引用并入本文。
在一些实施方式中,不同的RNA序列是适体。因此,优选相应的适体-衔接蛋白系统。一个或多个功能结构域也可以与衔接蛋白相关联。优选排列的一个例子是:
[AAV AAV衣壳结构域-衔接蛋白]-[经修饰的指导-CRISPR蛋白]
在某些实施方式中,CRISPR蛋白的定位使得CRISPR蛋白一旦形成就位于病毒衣壳的内表面。在一个方面,本发明提供了非天然存在的或工程化的组合物,其包含与AAV衣壳结构域的内表面相关联的CRISPR蛋白。这里再一次,相关联可以意味着在一些实施方式中融合、或者在一些实施方式中与之结合,或在一些实施方式中与之链接。在一些实施方式中,CRISPR蛋白可以与VP1、VP2或VP3结构域链接,使得其一旦形成就定位于病毒衣壳的内表面。这可以通过连接蛋白或链接系统,例如如上所述的生物素-链霉亲和素系统。
当CRISPR蛋白融合设计为使得CRISPR蛋白一旦形成就定位在衣壳的内表面,则CRISPR蛋白将填充衣壳的大部分或全部的内部体积。或者,可以修饰或分开CRISPR蛋白以占据较少的衣壳内部体积。因此,在某些实施方式中,本发明提供了分为两部分的CRISRP蛋白,一部分包含在一个病毒颗粒或衣壳中,第二部分包含在第二病毒颗粒或衣壳中。在某些实施方式中,通过将CRISPR蛋白质分成两部分,可获得空间以将一个或多个异源结构域连接至一个或两个CRISPR蛋白质部分。
分裂的CRISPR蛋白在本文中以及通过引用并入本文的文献中进一步详细阐述。在某些实施方式中,分裂的CRISRP蛋白的每个部分附着于特异性结合对的成员,并且当彼此结合时,特异性结合对的成员将CRISPR蛋白的部分保持在附近。在某些实施方式中,分裂的CRISPR蛋白的每个部分与诱导型结合对相关联。诱导型结合对是能够被与诱导型结合对的成员两者结合的蛋白质或小分子“开启”或“关闭”的结合对。一般来说,根据本发明,CRISPR蛋白可优选在结构域之间分裂,使结构域完整。这样的CRISPR蛋白的优选的非限制性实例包括但不限于Cas9、Cpf1、C2c2、Cas13a、Cas13b和直系同源物。关于分裂点的优选的非限制性实例包括,参考SpCas9:202A/203S之间的分裂位置;255F/256D之间的分裂位置;310E/311I之间的分裂位置;534R/535K之间的分裂位置;572E/573C之间的分裂位置;713S/714G之间的分裂位置;1003L/104E之间的分开位置;1054G/1055E之间的分裂位置;1114N/1115S之间的分裂位置;1152K/1153S之间的分裂位置;1245K/1246G之间的分裂位置;或1098和1099之间的分裂。
在一些实施方式中,任何AAV血清型是优选的。在一些实施方式中,与CRISPR酶相关的VP2结构域是AAV血清型2的VP2结构域。在一些实施方式中,与CRISPR酶相关的VP2结构域是AAV血清型8的VP2结构域。血清型可以是本领域已知的混合血清型。
CRISPR酶可形成CRISPR-CAS系统的一部分,所述CRISPR-Cas系统还包括指导RNA(sgRNA),所述指导RNA包含能够与细胞中感兴趣的基因组基因座的靶序列杂交的指导序列。在一些实施方式中,功能性CRISPR-Cas系统结合靶序列。在一些实施方式中,功能性CRISPR-Cas系统可编辑基因组基因座以改变基因表达。在一些实施方式中,功能性CRISPR-Cas系统可包括其他功能结构域。
在一些实施方式中,CRISPR酶是Cpf1。在一些实施方式中,CRISPR酶是FnCpf1。在一些实施方式中,CRISPR酶是AsCpf1,尽管设想了其他直系同源物。在一些实施方式中,FnCpf1和AsCpf1是特别优选的。
在一些实施方式中,CRISPR酶在衣壳或病毒颗粒外部。在某种意义上它不在衣壳内(被衣壳包裹或包含),但暴露在外部以便它可以接触靶标基因组DNA。在一些实施方式中,CRISPR酶切割两条DNA链以产生双链断裂(DSB)。在一些实施方式中,CRISPR酶是切口酶。在一些实施方式中,CRISPR酶是双切口酶。在一些实施方式中,CRISPR酶是死亡Cpf1。在一些通用实施方式中,CRISPR酶与一个或多个功能结构域相关联。在一些更特定的实施方式中,CRISPR酶是死亡Cpf1并且与一个或多个功能结构域相关联。在一些实施方式中,CRISPR酶包含Rec2或HD2截短。在一些实施方式中,CRISPR酶通过融合蛋白与AAV VP2结构域相关联。在一些实施方式中,CRISPR酶与去稳定的结构域(DD)融合。换而言之,DD可以通过与CRISPR酶融合而与所述CRISPR酶相关联。然后,AAV可以通过核酸分子递送稳定配体(或者可以以其他方式递送)。在一些实施方式中,酶可以被认为是经修饰的CRISPR酶,其中CRISPR酶与至少一个去稳定的结构域(DD)和VP2融合。在一些实施方式中,关联可以被认为是VP2结构域的修饰。当在本文中提及经修饰的VP2结构域时,则这将被理解为包括VP2结构域和CRISPR酶的本文讨论的任何关联。在一些实施方式中,AAV VP2结构域可以通过连接蛋白与CRISPR酶相关联(或链接),例如使用例如链霉亲和素-生物素系统的系统。因此,提供了CRISPR酶与连接蛋白的融合体,其对该连接子的高亲和力配体是特异的,而AAV VP2结构域与所述高亲和力配体结合。例如,链霉亲和素可以是与CRISPR酶融合的连接子,而生物素可以与AAV VP2结构域结合。共定位后,链霉亲和素将与生物素结合,从而将CRISPR酶连接至AAV VP2结构域。反向排列也是可能的。在一些实施方式中,生物素化序列(15个氨基酸)因此可以与AAV VP2结构域融合,尤其是AAV VP2结构域的N-末端。在一些实施方式中,还优选CRISPR酶与链霉亲和素的融合。在一些实施方式中,具有链霉亲和素-CRIS酶的生物素化的AAV衣壳在体外组装。这样,AAV衣壳应以简单的方式组装,并且可以在衣壳组装后添加CRISPR酶-链霉亲和素融合。在其他实施方式中,生物素化序列(15个氨基酸)因此可以融合至CRISPR酶,与AAV VP2结构域(尤其是AAV VP2结构域的N末端)与链霉亲和素的融合一起。为简单起见,在一些实施方式中优选CRISPR酶和AAV VP2结构域的融合。在一些实施方式中,融合可以是在CRISPR酶的N末端。换而言之,在一些实施方式中,AAV和CRISPR酶通过融合相关联。在一些实施方式中,AAV和CRISPR酶通过包括接头的融合相关联。本文讨论了合适的接头,但包括Gly Ser接头。在一些实施方式中,优选融合至AAV VP2结构域的N末端。在一些实施方式中,CRISPR酶包含至少一个核定位信号(NLS)。在一个方面,本发明提供了编码本发明的CRISPR酶和相关的AAVVP2结构域的多核苷酸。
由此提供病毒递送载体,例如经修饰的病毒递送载体。虽然AAV可以有利地是用于提供CRISPR-Cas复合物或CRISPR系统的RNA的载体,但是另外的载体也可以递送该RNA,并且本文也讨论了这样的其他载体。在一个方面,本发明提供了具有VP2-CRISPR酶衣壳蛋白的非天然存在的经修饰的AAV,其中CRISPR酶是VP2结构域的一部分或与VP2结构域链接。在一些优选的实施方式中,CRISPR酶与VP2结构域融合,从而在另一方面,本发明提供了具有VP2-CRISPR酶融合衣壳蛋白的非天然存在的经修饰的AAV。除非另有说明,否则以下实施方式同样适用于经修饰的AAV的方面。因此,本文提及的VP2-CRISPR酶衣壳蛋白也可包括VP2-CRISPR酶融合衣壳蛋白。在一些实施方式中,VP2-CRISPR酶衣壳蛋白还包含接头。在一些实施方式中,VP2-CRISPR酶衣壳蛋白进一步包含接头,由此VP2-CRISPR酶远离AAV的其余部分。在一些实施方式中,VP2-CRISPR酶衣壳蛋白还包含至少一种蛋白质复合物,例如CRISPR复合物,例如靶向特定DNA的CRISPR-Cpf1复合物指导RNA,TALE,等等。在一个方面,还提供了CRISPR复合物,例如CRISPR-Cas,其包含VP2-CRISPR酶衣壳蛋白和至少一种CRISPR复合物,例如靶向特定DNA的CRISPR-Cpf1复合物指导RNA。通常,在一些实施方式中,AAV还包含修复模板。应当理解,这里包含是指包含薄的病毒衣壳或者病毒编码所包含的蛋白质。在一些实施方式中,一种或多种,优选两种或更多种指导RNA,可以包含/包含在AAV载体内。在一些实施方式中,可以优选两种,因为它允许多重或双切口酶的方法。特别是对于多重,可以使用两种或更多种指导。事实上,在一些实施方式中,AAV中可包含/包含三种或更多种、四种或更多种、五种或更多种、或甚至六种或更多种指导RNA。由于AAV不再需要包含/包含CRISPR酶,因此在AAV内释放出更多空间。在这些实例的每一个中,还可以提供包含/包含在AAV内的修复模板。在一些实施方式中,修复模板对应于或包含DNA靶标。
在进一步的方面,本发明提供了组合物,所述组合物包含CRISPR酶和相关联的AAVVP2结构域或本文中所描述的多核苷酸或载体。还提供了包含指导RNA的CRISPR-Cas系统。
还提供一种治疗有需要的受试者的方法,其包括通过用编码系统的多核苷酸或任何本发明的载体转化受试者来诱导基因编辑。还可以提供合适的修复模板,例如通过包含所述修复模板的载体来递送。在一些实施方式中,单一载体提供CRISPR酶(通过与病毒衣壳相关联)和至少一种指导RNA;和/或修复模板。还提供了治疗有需要的受试者的方法,其包括通过用编码本系统的多核苷酸或任何本发明的载体转化受试者来诱导转录激活或抑制,其中所述多核苷酸或载体编码或包含催化失活的CRISPR酶和一个或多个相关的功能结构域。还提供了用于所述治疗方法的包含本发明系统的组合物。可以提供包括这样的组合物的组件(part)的试剂盒。还提供了本发明系统在制备用于这样的治疗方法的药物中的用途。
还提供了包含CRISPR酶的药物组合物,所述CRISPR酶是腺相关病毒(AAV)衣壳的VP2结构域的一部分或链接至腺相关病毒(AAV)衣壳的VP2结构域;或非天然存在的经修饰的AAV;或编码它们的多核苷酸。
还提供了CRISPR酶与指导RNA(例如sgRNA)的复合物。复合物可以进一步包括靶DNA。
可以使用分裂的CRISPR酶(最优选Cpf1)方法。所谓的“分裂的Cpf1”方法分裂的Cpf1允许以下内容。Cpf1被分裂成两块,并且这些各自与二聚体的一个半部融合。在二聚化时,使Cpf1的两部分在一起,并且已显示重构的Cpf1具有功能性。因此,分裂的Cpf1的一部分可以与一个VP2结构域相关联,并且分裂的Cpf1的第二部分可以与另一个VP2结构域相关联。两个VP2结构域可以在相同或不同的衣壳中。换言之,Cpf1的分裂部分可以在相同的病毒颗粒上或在不同的病毒颗粒上。
在一些实施方式中,一个或多个功能性结构域可与CRISPR酶相关联或链接至CRISPR酶和/或可以经由衔接蛋白与经修饰的指导相关联或经由衔接蛋白链接至经修饰的指导。这些可以被使用,而不管CRISPR酶还可以经由具有识别相应衔接蛋白的适体RAN序列的经修饰的指导链接至病毒外部蛋白或衣壳或包膜(例如VP2结构域或衣壳)。
在一些实施方式中,一个或多个功能性结构域包括转录激活子、阻遏物、重组酶、转座酶、组蛋白重构子,去甲基化酶、DNA甲基转移酶、隐花色素、光诱导型/控制型结构域、化学诱导型/控制型结构域、表观遗传修饰的结构域或其组合。有利地,功能结构域包括激活子、阻遏物或核酸酶。
在一些实施方式中,功能结构域可以具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性,或本文鉴定的结构域具有的活性。
激活子的实例包括P65,即单纯疱疹激活结构域VP16的四聚体(称为VP64),VP64的优化使用通过sgRNA设计和额外辅助分子加入两者的修饰来激活,系统中MS2、P65和HSF1in被称为协同激活介质(SAM)(Konermann等,“Genome-scale transcriptional activationby an engineered CRISPR-Cas9complex,”Nature 517(7536):583-8(2015));阻遏物的实例包括Kox1的KRAB(Kruppel相关的盒)结构域或SID结构域(例如,SID4X);适合于功能结构域的核酸酶或核酸酶结构域的实例包括Fok1。
合适的用于本发明的实践的功能结构域,例如激活子、阻遏物或核酸酶,也在通过引用并入本文的文献中讨论,包括本文引用的并通过引用并入本文的关于CRISPR-Cas系统的一般信息的专利和专利公开。
在一些实施方式中,CRISPR酶包含定位信号或基本由定位信号组成或由定位信号组成,所述定位信号作为CRISPR酶和AAV衣壳(例如,VP2)之间的接头或接头的一部分。HA或Flag标签也在本发明的范围内作为接头,以及甘氨酸丝氨酸接头(短至GS长至(GGGGS)3)。在这方面,提到可以在本发明的实施方式中使用的标签包括亲和标签,例如几丁质结合蛋白(CBP)、麦芽糖结合蛋白(MBP)、谷胱甘肽-S-转移酶(GST)、聚(His)标签;溶解标记例如硫氧还蛋白(TRX)和聚(NANP)、MBP和GST;色谱标签,例如由聚阴离子氨基酸组成的那些,例如FLAG标签;表位标签,例如V5标签、Myc标签、HA标签和NE标签;荧光标签,例如GFP和mCherry;可以允许特定的酶修饰(例如生物素连接酶的生物素化)或化学修饰(例如与FlAsH-EDT2反应用于荧光成像)的蛋白质标签。
还提供了治疗受试者(例如,有需要的受试者)的方法,其包括通过用AAV-CRISPR酶转化受试者来诱导基因编辑,所述AAV-CRISPR酶有利地编码并体内表达CRISPR系统的剩余部分(例如,RNA、指导)。还可以提供合适的修复模板,例如通过包含所述修复模板的载体递送。还提供了治疗受试者(例如,有需要的受试者)的方法,其包括通过用AAV-CRISPR酶转化受试者来诱导转录激活或抑制,所述AAV-CRISPR酶有利地编码并体内表达CRISPR系统的剩余部分(例如,RNA、指导);有利地,在一些实施方式中,CRISPR酶是催化失活的CRISPR酶,并且包含一个或多个相关的功能结构域。当任何治疗离体(例如,在细胞培养中)发生时,则应理解术语“受试者”可以用短语“细胞或细胞培养物”代替。
还提供了用于所述治疗方法的包含本发明的系统的组合物。可以提供包含这样的组合物的组件的试剂盒。还提供了本发明系统在制备用于这样的治疗方法的药物中的用途。本发明还提供了本发明系统在筛选中的用途,例如获得功能筛选。人工迫使过表达基因的细胞能够随时间下调基因(重建平衡),例如通过负反馈环。再筛选开始时,未调节的基因可能再次减少。
在一个方面,本发明提供了工程化的、非天然存在的CRISPR-Cas系统,其包括AAV-Cas蛋白和靶向编码细胞中的基因产物的DNA分子的指导RNA,由此,指导RNA靶向编码基因产物的DNA分子,Cas蛋白切割编码基因产物的DNA分子,从而改变基因产物的表达;并且,其中Cas蛋白和指导RNA不是天然地一起存在。本发明包含指导RNA,其包含与tracr序列融合的指导序列。在本发明的一个实施方式中,Cas蛋白是II型CRISPR-Cas蛋白,在优选的实施方式中,Cas蛋白是Cpf1蛋白。本发明进一步包括对Cas蛋白的编码,其被密码子优化以在真核细胞中表达。在优选的实施方式中,真核细胞是哺乳动物细胞,在更优选的实施方式中,哺乳动物细胞是人细胞。在本发明的另一个实施方式中,基因产物的表达降低。
在另一个方面,本发明提供了一种工程化的非天然存在的载体系统,其包括一种或多种载体和AAV-Cas蛋白,所述载体包含与CRISPR-Cas系统指导RNA可操作地连接的第一调控元件,所述CRISPR-Cas系统指导RNA靶向编码基因产物的DNA分子。组分可以位于系统的相同或不同载体上,或者可以是相同的载体,由此AAV-Cas蛋白也递送CRISPR系统的RNA。指导RNA靶向编码细胞中的基因产物的DNA分子,AAV-Cas蛋白可以切割编码基因产物的DNA分子(它可以切割一条链或两条链或基本上没有核酸酶活性),从而基因产物的表达被改变;并且,其中AAV-Cas蛋白和指导RNA不是天然地一起存在。本发明包括指导RNA,所述指导RNA包含与tracr序列融合的指导序列。在本发明的一个实施方式中,AAV-Cas蛋白是II型AAV-CRISPR-Cas蛋白,在优选的实施方式中,AAV-Cas蛋白是AAV-Cpf1蛋白。本发明进一步对AAV-Cas蛋白的编码,其被密码子优化以在真核细胞中表达。在优选的实施方式中,真核细胞是哺乳动物细胞,在更优选的实施方式中,哺乳动物细胞是人的细胞。在本发明的另一个实施方式中,基因产物的表达降低。
在另一个方面,本发明提供了一种在细胞中表达效应蛋白和指导RNA的方法,所述方法包括根据本文公开的任何载体递送系统导入载体。在用于递送效应蛋白的载体的一个实施方式中,最小启动子是Mecp2启动子、tRNA启动子或U6。在其他实施方式中,最小启动子是组织特异性的。
一种或多种多核苷酸分子可包含在一种或多种载体中。本发明包括这样的多核苷酸分子(例如这样的多核苷酸可操作地配置成表达蛋白质和/或核酸组分),以及这样的载体。
在一个方面,本发明提供了包括一种或多种载体的载体系统。在一些实施方式中,系统包括:(a)第一调控元件,所述第一调控元件可操作地连接至tracr配对序列和用于在tracr配对序列的上游插入一个或多个指导序列的一个或多个插入位点,其中当表达时,指导序列引导AAV-CRISPR复合物与真核细胞中的靶序列序列特异性结合,其中CRISPR复合物包含与(1)与靶序列杂交的指导序列和(2)与tracr序列杂交的tracr配对序列复合的AAV-CRISPR酶;和(b)所述AAV-CRISPR酶,其包含至少一个核定位序列和/或至少一个NES;其中组分(a)和(b)位于系统的相同或不同载体之上或之中。在一些实施方式中,组分(a)还包含在第一调控元件控制下的tracr配对序列下游的tracr序列。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,其中当表达时,两种或更多种指导序列各自引导AAV-CRISPR复合物与真核细胞中的不同靶序列序列特异性结合。在一些实施方式中,系统包括在第三调控元件(例如聚合酶III启动子)控制下的tracr序列。在一些实施方式中,tracr序列表现出当最佳比对时,沿着tracr配对序列的长度至少50%、60%、70%、80%、90%、95%或99%的序列互补性。确定最佳比对在本领域技术人员的能力范围内。例如,存在公开和商业上可用的比对算法和程序,例如但不限于ClustalW、Smith-Waterman in matlab、Bowtie、Geneious、Biopython和SeqMan。在一些实施方式中,AAV-CRISPR复合物包含一个或多个核定位序列,所述核定位序列具有足够的强度以驱动CRISPR复合物在真核细胞的细胞核中以可检测的量积累。不希望受理论束缚,据信核定位序列对于真核生物中的AAV-CRISPR复合物活性不是必需的,但包含这样的序列增强了系统的活性,尤其对于靶向细胞核中的核酸分子和/或使分子离开细胞核。在一些实施方式中,AAV-CRISPR酶是II型AAV-CRISPR系统酶。在一些实施方式中,AAV-CRISPR酶是AAV-Cpf1酶。在一些实施方式中,AAV-Cpf1酶衍生自S.mutans,S.agalactiae,S.equisimilis,S.sanguinis,S.pneumonia;C.jejuni,C.coli;N.salsuginis,N.tergarcus;S.auricularis,S.carnosus;N.meningitides,N.gonorrhoeae;L.monocytogenes,L.ivanovii;C.botulinum,C.difficile,C.tetani,C.sordellii;Francisella tularensis 1,Prevotella albensis,Lachnospiraceae bacterium MC2017 1,Butyrivibrioproteoclasticus,Peregrinibacteria bacterium GW2011_GWA2_33_10,Parcubacteriabacterium GW2011_GWC2_44_17,Smithella sp.SCADC,Acidaminococcus sp.BV3L6,Lachnospiraceae bacterium MA2020,Candidatus Methanoplasma termitum,Eubacterium eligens,Moraxella bovoculi 237,Leptospira inadai,Lachnospiraceaebacterium ND2006,Porphyromonas crevioricanis 3,Prevotella disiens andPorphyromonas macacae(例如,这些生物之一的Cpf1被修饰以具有至少一个AAV或与至少一个AAV相关联),并且可以包含进一步的突变或改变或者是嵌合Cpf1。酶可以是AAV-Cpf1同源物或直系同源物。在一些实施方式中,AAV-CRISPR酶经密码子优化以在真核细胞中表达。在一些实施方式中,AAV-CRISPR酶指导靶序列位置处的一条链或两条链的切割。在一些实施方式中,AAV-CRISPR酶缺乏DNA链切割活性。在一些实施方式中,第一调控元件是聚合酶III启动子。在一些实施方式中,第二调控元件是聚合酶II启动子。在一些实施方式中,指导序列的长度为至少15、16、17、18、19、20、25个核苷酸,或10-30或15-25个核苷酸或15-20个核苷酸之间。通常,并且在整个说明书中,术语“载体”是指能够转运与其连接的另外的核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离末端,没有游离末端(例如,环状)的核酸分子;包括DNA、RNA或两者的核酸分子;和本领域已知的其他多核苷酸种类。一种类型的载体是“质粒”,所述质粒是指环状双链DNA环,其中可以例如通过标准的分子克隆技术,插入另外的DNA片段。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装成病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)的载体中。病毒载体还包含由病毒携带的用于转染到宿主细胞中的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起始子的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在导入宿主细胞后被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够引导可操作地连接至其的基因的表达。这样的载体在本文中称为“表达载体”。用于和导致在真核细胞中表达的载体在本文中可称为“真核表达载体”。在重组DNA技术中使用的常见表达载体通常是以质粒的形式。
重组表达载体可以包含适合在宿主细胞中表达核酸的形式的本发明的核酸,这意味着所述重组表达载体包含一个或多个调控元件,所述调控元件可以基于用于表达的宿主细胞进行选择,并且可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许所述核苷酸序列表达的方式与所述调控元件连接(例如,在体外转录/翻译系统或当载体被导入宿主细胞时,在所述宿主细胞中)。同样,CRISPR系统的RNA虽然有利地通过AAV-CRISPR酶递送,但也可以单独递送,例如通过单独的载体递送。
在一个方面,本发明提供了包含一个或多个核定位序列和/或NES的AAV-CRISPR酶。在一些实施方式中,AAV-CRISPR酶包含在真核细胞中驱动CRISPR系统的组分(例如,RNA,例如指导RNA,和/或HR模板核酸分子)转录的调控元件,使得所述AAV-CRISPR酶递送CRISPR系统以可检测的量在真核细胞的细胞核中积累和/或从细胞核输出。在一些实施方式中,调控元件是聚合酶II启动子。在一些实施方式中,AAV-CRISPR酶是II型AAV-CRISPR系统酶。在一些实施方式中,AAV-CRISPR酶是AAV-Cpf1酶。在一些实施方式中,AAV-Cpf1酶衍生自S.mutans,S.agalactiae,S.equisimilis,S.sanguinis,S.pneumonia;C.jejuni,C.coli;N.salsuginis,N.tergarcus;S.auricularis,S.carnosus;N.meningitides,N.gonorrhoeae;L.monocytogenes,L.ivanovii;C.botulinum,C.difficile,C.tetani,C.sordellii;Francisella tularensis 1,Prevotella albensis,Lachnospiraceaebacterium MC2017 1,Butyrivibrio proteoclasticus,Peregrinibacteria bacteriumGW2011_GWA2_33_10,Parcubacteria bacterium GW2011_GWC2_44_17,Smithellasp.SCADC,Acidaminococcus sp.BV3L6,Lachnospiraceae bacterium MA2020,CandidatusMethanoplasma termitum,Eubacterium eligens,Moraxella bovoculi 237,Leptospirainadai,Lachnospiraceae bacterium ND2006,Porphyromonas crevioricanis 3,Prevotella disiens and Porphyromonas macacae(例如,Cpf1被修饰以具有至少一个AAV或与至少一个AAV相关联),并且可以包含Cpf1的进一步的突变或改变。并且可以是嵌合Cpf1。在一些实施方式中,AAV-CRISPR酶经密码子优化以在真核细胞中表达。在一些实施方式中,AAV-CRISPR酶引导在靶序列位置处的一条链或两条链的切割。在一些实施方式中,AAV-CRISPR酶缺乏或基本上DNA链切割活性(例如,与野生型酶或不具有降低核酸酶活性的突变或改变的酶相比,不超过5%的核酸酶活性)。
在一个方面,本发明提供了AAV-CRISPR酶,其包含一个或多个核定位序列,所述核定位序列具有足够的强度以驱动所述AAV-CRISPR酶在真核细胞的细胞核中以可检测的量积累。在一些实施方式中,AAV-CRISPR酶是II型AAV-CRISPR系统酶。在一些实施方式中,AAV-CRISPR酶是AAV-Cpf1酶。在一些实施方式中,AAV-Cpf1酶衍生自S.mutans,S.agalactiae,S.equisimilis,S.sanguinis,S.pneumonia;C.jejuni,C.coli;N.salsuginis,N.tergarcus;S.auricularis,S.carnosus;N.meningitides,N.gonorrhoeae;L.monocytogenes,L.ivanovii;C.botulinum,C.difficile,C.tetani,C.sordellii;Francisella tularensis 1,Prevotella albensis,Lachnospiraceaebacterium MC2017 1,Butyrivibrio proteoclasticus,Peregrinibacteria bacteriumGW2011_GWA2_33_10,Parcubacteria bacterium GW2011_GWC2_44_17,Smithellasp.SCADC,Acidaminococcus sp.BV3L6,Lachnospiraceae bacterium MA2020,CandidatusMethanoplasma termitum,Eubacterium eligens,Moraxella bovoculi 237,Leptospirainadai,Lachnospiraceae bacterium ND2006,Porphyromonas crevioricanis 3,Prevotella disiens and Porphyromonas macacae(例如,Cpf1被修饰以具有至少一个AAV或与至少一个AAV相关联),并且可以包含Cpf1的进一步的突变或改变,并且可以是嵌合Cpf1。在一些实施方式中,AAV-CRISPR酶经密码子优化以在真核细胞中表达。在一些实施方式中,AAV-CRISPR酶引导在靶序列位置处的一条链或两条链的切割。在一些实施方式中,AAV-CRISPR酶缺乏或基本上DNA链切割活性(例如,与野生型酶或不具有降低核酸酶活性的突变或改变的酶相比,不超过5%的核酸酶活性)。
在一个方面,本发明提供了真核宿主细胞,其包含(a)第一调控元件,所述第一调控元件可操作地连接至tracr配对序列和用于在tracr配对序列的上游插入一个或多个指导序列的一个或多个插入位点,其中当表达时,指导序列引导AAV-CRISPR复合物与真核细胞中靶序列序列特异性结合,其中AAV-CRISPR复合物包含与(1)与靶序列杂交的指导序列和(2)与tracr序列杂交的tracr配对序列复合的AAV-CRISPR酶;和/或(b)所述AAV-CRISPR酶,其包含至少一个核定位序列和/或至少一个NES。在一些实施方式中,宿主细胞包含组分(a)和(b)。在一些实施方式中,组分(a)、组分(b)或组分(a)和(b)稳定地整合到宿主真核细胞的基因组中。在一些实施方式中,组分(b)包括或含有组分(a)。在一些实施方式中,组分(a)还包含在第一调控元件的控制下在tracr配对序列下游的tracr序列。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,其中当表达时,两种或更多种指导序列各自引导AAV-CRISPR复合物与真核细胞中的不同靶序列序列特异性结合。在一些实施方式中,真核宿主细胞还包含可操作地连接至tracr序列的第三调控元件(例如聚合酶III启动子)。在一些实施方式中,tracr序列当最佳比对时,沿着tracr配对序列的长度表现出至少50%、60%、70%、80%、90%、95%或99%的序列互补性。在一些实施方式中,AAV-CRISPR酶包含一个或多个核定位序列和/或核输出序列,所述核定位序列和/或核输出序列具有足够的强度以驱动所述CRISPR酶在真核细胞的细胞核中以可检测的量积累。在一些实施方式中,AAV-CRISPR酶是II型CRISPR系统酶。在一些实施方式中,CRISPR酶是Cpf1酶。在一些实施方式中,AAV-Cpf1酶衍生自S.mutans,S.agalactiae,S.equisimilis,S.sanguinis,S.pneumonia;C.jejuni,C.coli;N.salsuginis,N.tergarcus;S.auricularis,S.carnosus;N.meningitides,N.gonorrhoeae;L.monocytogenes,L.ivanovii;C.botulinum,C.difficile,C.tetani,C.sordellii;Francisella tularensis 1,Prevotella albensis,Lachnospiraceae bacterium MC20171,Butyrivibrio proteoclasticus,Peregrinibacteria bacterium GW2011_GWA2_33_10,Parcubacteria bacterium GW2011_GWC2_44_17,Smithella sp.SCADC,Acidaminococcussp.BV3L6,Lachnospiraceae bacterium MA2020,Candidatus Methanoplasma termitum,Eubacterium eligens,Moraxella bovoculi 237,Leptospira inadai,Lachnospiraceaebacterium ND2006,Porphyromonas crevioricanis 3,Prevotella disiens andPorphyromonas macacae(例如,Cpf1被修饰以含有或与至少一个AAV相关联),并且可以包含Cpf1的进一步的突变或改变,并且可以是嵌合Cpf1。在一些实施方式中,AAV-CRISPR酶经密码子优化以在真核细胞中表达。在一些实施方式中,AAV-CRISPR酶引导在靶序列位置处的一条链或两条链的切割。在一些实施方式中,AAV-CRISPR酶缺乏或基本上DNA链切割活性(例如,与野生型酶或不具有降低核酸酶活性的突变或改变的酶相比,不超过5%的核酸酶活性)。在一些实施方式中,第一调控元件是聚合酶III启动子。在一些实施方式中,第二调控元件是聚合酶II启动子。在一些实施方式中,指导序列的长度为至少15、16、17、18、19、20、25个核苷酸,或10-30或15-25或15-20个核苷酸之间。在一个方面,本发明提供了一种非人的真核生物;优选多细胞真核生物,其包含根据任何所描述的实施方式的真核宿主细胞。在其他方面,本发明提供了真核生物;优选多细胞真核生物,其包含根据任何所描述的实施方式的真核宿主细胞。在这些方面的一些实施方式中,生物可以是动物;例如哺乳动物。此外,生物可以是节肢动物,例如昆虫。生物也可以是植物。此外,生物可以是真菌。有利的是,生物是AAV的宿主。
在一个方面,本发明提供了包括本文所述组分中的一种或多种的试剂盒。在一些实施方式中,试剂盒包括载体系统和使用试剂盒的说明书。在一些实施方式中,载体系统包括(a)第一调控元件,所述第一调控元件可操作地连接至tracr配对序列和用于在tracr配对序列的上游插入一个或多个指导序列的一个或多个插入位点,其中当表达时,指导序列引导CRISPR复合物与真核细胞中靶序列序列特异性结合,其中CRISPR复合物包含与(1)与靶序列杂交的指导序列和(2)与tracr序列杂交的tracr配对序列复合的CRISPR酶;和/或(b)所述AAV-CRISPR酶,其任选地包含核定位序列。在一些实施方式中,试剂盒包括组分(a)和(b),其定位在系统的相同或不同的载体之上或之中,例如,(a)可以被包含在(b)中。在一些实施方式中,组分(a)还包含在第一调控元件的控制下在tracr配对序列下游的tracr序列。在一些实施方式中,组分(a)还包含与第一调控元件可操作地连接的两种或更多种指导序列,其中当表达时,两种或更多种指导序列各自引导CRISPR复合物与真核细胞中的不同靶序列序列特异性结合。在一些实施方式中,系统还包括可操作地连接至tracr序列的第三调控元件(例如聚合酶III启动子)。在一些实施方式中,tracr序列当最佳比对时,沿着tracr配对序列的长度表现出至少50%、60%、70%、80%、90%、95%或99%的序列互补性。在一些实施方式中,CRISPR酶包含一个或多个核定位序列,所述核定位序列具有足够的强度以驱动所述CRISPR酶在真核细胞的细胞核中以可检测的量积累。在一些实施方式中,AAV-CRISPR酶是II型CRISPR系统酶。在一些实施方式中,CRISPR酶是Cpf1酶。在一些实施方式中,Cpf1酶衍生自S.mutans,S.agalactiae,S.equisimilis,S.sanguinis,S.pneumonia;C.jejuni,C.coli;N.salsuginis,N.tergarcus;S.auricularis,S.carnosus;N.meningitides,N.gonorrhoeae;L.monocytogenes,L.ivanovii;C.botulinum,C.difficile,C.tetani,C.sordellii;Francisella tularensis 1,Prevotellaalbensis,Lachnospiraceae bacterium MC2017 1,Butyrivibrio proteoclasticus,Peregrinibacteria bacterium GW2011_GWA2_33_10,Parcubacteria bacterium GW2011_GWC2_44_17,Smithella sp.SCADC,Acidaminococcus sp.BV3L6,Lachnospiraceaebacterium MA2020,Candidatus Methanoplasma termitum,Eubacterium eligens,Moraxella bovoculi 237,Leptospira inadai,Lachnospiraceae bacterium ND2006,Porphyromonas crevioricanis 3,Prevotella disiens and Porphyromonas macacae(例如,Cpf1被修饰以含有或与至少一个AAV相关联),并且可以包含Cpf1的进一步的突变或改变,并且可以是嵌合Cpf1。在一些实施方式中,AAV-CRISPR酶经密码子优化以在真核细胞中表达。在一些实施方式中,AAV-CRISPR酶引导在靶序列位置处的一条链或两条链的切割。在一些实施方式中,AAV-CRISPR酶缺乏或基本上DNA链切割活性(例如,与野生型酶或不具有降低核酸酶活性的突变或改变的酶相比,不超过5%的核酸酶活性)。在一些实施方式中,第一调控元件是聚合酶III启动子。在一些实施方式中,第二调控元件是聚合酶II启动子。在一些实施方式中,指导序列的长度为至少15、16、17、18、19、20、25个核苷酸,或10-30或15-25或15-20个核苷酸之间。
在一个方面,本发明提供了修饰真核细胞中的靶多核苷酸的方法。在一些实施方式中,方法包括允许AAV-CRISPR复合物结合靶多核苷酸,例如,以影响所述靶多核苷酸的切割,从而修饰靶多核苷酸,其中AAV-CRISPR复合物包含与指导序列复合的AAV-CRISPR酶,所述指导序列与所述靶多核苷酸内的靶序列杂交,其中所述指导序列与tracr配对序列连接,所述tracr配对序列又与tracr序列杂交。在一些实施方式中,切割包括通过AAV-CRISPR酶在靶序列的位置切割一条链或两条链。在一些实施方式中,切割导致靶基因的转录减少。在一些实施方式中,方法还包括通过与外源模板多核苷酸同源重组而修复切割的靶多核苷酸,其中所述修复产生包括靶多核苷酸的一个或多个核苷酸的插入、缺失或取代的突变。在一些实施方式中,突变导致从包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。在一些实施方式中,方法还包括将一种或多种载体递送至真核细胞,其中一种或多种载体包含AAV-CRISPR酶,并且一种或多种载体驱动以下一种或多种的表达:与tracr配对序列连接的指导序列,和tracr序列。在一些实施方式中,AAV-CRISPR酶驱动以下一种或多种的表达:与tracr配对序列连接的指导序列,和tracr序列。在一些实施方式中,将这样的AAV-CRISPR酶递送至受试者的真核细胞。在一些实施方式中,修饰在细胞培养中的真核细胞中发生。在一些实施方式中,方法还包括在修饰之前从受试者分离真核细胞。在一些实施方式中,方法还包括将真核细胞和/或由其衍生的细胞返回给受试者。
在一个方面,本发明提供了修饰真核细胞中多核苷酸表达的方法。在一些实施方式中,所述方法包括允许AAV-CRISPR复合物与多核苷酸结合,使得所述结合导致所述多核苷酸的表达增加或减少;其中AAV-CRISPR复合物包含与指导序列复合的AAV-CRISPR酶,所述指导序列与所述靶多核苷酸内的靶序列杂交,其中所述指导序列与tracr配对序列连接,所述tracr配对序列又与tracr序列杂交。在一些实施方式中,所述方法还包括向所述真核细胞递送一种或多种载体,其中所述一种或多种载体是AAV-CRISPR酶和/或驱动以下一种或多种的表达:与tracr配对序列连接的指导序列,和tracr序列。
在一个方面,本发明提供了产生包含突变疾病基因的模型真核细胞的方法。在一些实施方式中,疾病基因是与患有或发展疾病的风险增加相关的任何基因。在一些实施方式中,所述方法包括(a)将一种或多种载体导入真核细胞,其中所述一种或多种载体包含AAV-CRISPR酶和/或驱动以下一种或多种的表达:与tracr配对序列连接的指导序列,和tracr序列;和(b)允许AAV-CRISPR复合物与靶多核苷酸结合,例如,以影响在所述疾病基因内的靶多核苷酸的切割,其中AAV-CRISPR复合物包含与(1)与靶多核苷酸内的靶序列杂交的指导序列,和(2)与tracr序列杂交的tracr配对序列复合的AAV-CRISPR酶,从而产生包含突变疾病基因的模型真核细胞。因此,在一些实施方式中,AAV-CRISPR酶含有核酸分子并驱动以下一种或多种的表达:与tracr配对序列连接的指导序列,和tracr序列和/或同源重组模板和/或稳定配体(如果CRISPR酶具有去稳定结构域)。在一些实施方式中,所述切割包括通过所述AAV-CRISPR酶在靶序列的位置切割一条链或两条链。在一些实施方式中,所述切割导致靶基因的转录减少。在一些实施方式中,所述方法还包括通过与外源模板多核苷酸同源重组而修复所述切割的靶多核苷酸,其中所述修复产生包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代的突变。在一些实施方式中,所述突变导致从包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。
在一个方面,本发明提供了一种开发生物活性剂的方法,所述生物活性剂调节与疾病基因相关的细胞信号传导事件。在一些实施方式中,疾病基因是与患有或发展疾病的风险增加相关的任何基因。在一些实施方式中,所述方法包括(a)使测试化合物与任何一种所述实施方式的模型细胞接触;和(b)检测读数变化,所述读数变化指示与所述疾病基因中的所述突变相关的细胞信号传导事件的减少或增加,从而开发调节与所述疾病基因相关的所述细胞信号传导事件的生物活性剂。
在一个方面,本发明提供了重组多核苷酸,其包含tracr配对序列上游的指导序列,其中所述指导序列在表达时引导AAV-CRISPR复合物与真核细胞中存在的相应靶序列序列特异性结合。多核苷酸可以被携带在AAV-CRISPR酶内并从AAV-CRISPR酶体内表达。在一些实施方式中,靶序列是存在于真核细胞中的病毒序列。在一些实施方式中,靶序列是原癌基因或致癌基因。
在一个方面,本发明提供了通过在一个或多个细胞的基因中导入一个或多个突变来选择一种或多种细胞的方法,所述方法包括:将一种或多种载体导入细胞中,其中所述一种或多种载体包含AAV-CRISPR酶和/或驱动以下一种或多种的表达:与tracr配对序列连接的指导序列、tracr序列和编辑模板;其中,例如被表达的是在AAV-CRISPR酶内并通过AAV-CRISPR酶体内表达,和/或编辑模板包含消除AAV-CRISPR酶切割的一个或多个突变;允许编辑模板与待选择的细胞中的靶多核苷酸同源重组;允许CRISPR复合物结合靶多核苷酸以影响所述基因内的靶多核苷酸的切割,其中AAV-CRISPR复合物包含与(1)与靶多核苷酸内的靶序列杂交的指导序列,和(2)与tracr序列杂交的tracr配对序列复合的AAV-CRISPR酶,其中AAV-CRISPR复合物与靶多核苷酸的结合诱导细胞死亡,从而允许其中已经被导入一个或多个突变的一个或多个细胞被选中。在优选的实施方式中,AAV-CRISPR酶是AAV-Cpf1。在本发明的另一个方面,待选择的细胞可以是真核细胞。本发明的各方面允许选择特定细胞而无需选择标志物或可包括反选择系统的两步法。细胞可以是原核细胞或真核细胞。
关于AAV-CRISPR酶的突变,可以在对应于参考AsCpf1的氨基酸位置编号的位置908、993和1263的任何或所有残基处(可以例如通过标准序列比较工具确定),或参考FnCpf1的氨基酸位置编号的917或1006或参考LbCpf1的氨基酸位置编号的832、925、947、1180,进行突变。特别地,在AsCpf1中优选任何或所有以下突变:D908A、E993A和D1263;在FnCpf1中:D917A和H1006A;在LbCpf1中:D832A、E925A、D947A和D1180A;以及任何替代氨基酸的保守置换也被设想。在一个方面,本发明提供关于本文讨论的任何或每个或所有实施方式,其中AAV-CRISPR酶包含至少一个或多个,或至少两个或更多个突变,其中所述至少一个或多个突变或至少两个或更多个突变是如根据AsCpf1蛋白的D908、E993或D1263,例如,AsCpf1的D908A,E993A或D1263,或根据FnCpf1的D917或H1006,例如,FnCpf1的D917A或H1006A,或根据LbCpf1的D832、E925、D947或D1180,例如,LbCpf1的D832A、E925A、D947A或D1180A,或As或Fn或Lb的直系同源物的Cpf1的任何相应突变,或者CRIPSR酶包含至少一个突变,其中至少AsCpf1的D908A、E993A或D1263,或FnCpf1的D917A或H1006A,或LbCpf1的D832A、E925A、D947A或D1180A被突变;或As蛋白或Fn蛋白或Lb蛋白的直系同源物的Cpf1中的任何相应突变。
本发明的方面包括非天然存在的或工程化的组合物,其可包含指导RNA(sgRNA)和AAV-CRISPR酶,所述指导RNA包含能够与细胞中感兴趣的基因组基因座中的靶序列杂交的指导序列,所述AAV-CRISPR酶包含至少一个或多个核定位序列,其中AAV-CRISPR酶包含一个或两个或更多个突变,使得所述酶具有与野生型酶相比改变或减少的核酸酶活性,其中sgRNA的至少一个环是通过插入与一种或多种衔接蛋白结合的不同RNA序列而进行修饰,并且其中衔接蛋白进一步招募一种或多种异源功能结构域。在本发明的一个实施方式中,AAV-CRISPR酶包含一个或多个在选自包括以下、基本由以下组成或由以下组成的残基处的突变:根据AsCpf1蛋白的D908、E993或D1263;根据FnCpf1的D917或H1006;或根据LbCpf1的D832、E925、D947或D1180。在另一个实施方式中,AAV-CRISPR酶包含选自包括AsCpf1的D908A、E993A或D1263;FnCpf1的D917A或H1006A;或LbCpf1的D832A、E925A、D947A或D1180A的组的一个或两个或更多个突变。在另一个实施方式中,功能结构域包含转录激活结构域(例如,VP64),基本由转录激活结构域(例如,VP64)组成。在另一个实施方式中,功能结构域包含以下,基本由以下组成:转录抑制结构域(例如KRAB结构域、SID结构域或SID4X结构域)。在本发明的实施方式中,所述一种或多种异源功能结构域具有一种或多种活性,所述一种或多种活性选自包括以下、基本由以下组成或由以下组成的组:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。在本发明的其他实施方式中,细胞是真核细胞或哺乳动物细胞或人细胞。在其他实施方式中,衔接蛋白选自包括以下、基本由以下组成或由以下组成的组:MS2、PP7,Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、 7s、PRR1。在另一个实施方式中,sgRNA的至少一个环是四环和/或环2。本发明的一个方面包括通过本文所述的任何组合物导入至细胞中来修饰感兴趣的基因组基因座以改变细胞中的基因表达的方法。本发明的一个方面是上述元件包含在单个组合物中或包含在个体组合物中,例如,AAV-CRISPR酶递送所讨论的酶以及指导。这些组合物可以有利地应用于宿主以引起对基因组水平的功能影响。通常,sgRNA以提供针对衔接蛋白的特异性结合位点(例如,适体)的方式进行修饰,所述衔接蛋白包含用于结合的一个或多个功能结构域(例如,通过融合蛋白)。对经修饰的sgRNA进行修饰,使得一旦sgRNA形成AAV-CRISPR复合物(即AAV-CRISPR酶与sgRNA和靶标结合),则衔接蛋白结合,并且衔接蛋白上的功能结构域位于有利于归属的功能有效化的空间方向。例如,如果功能结构域包含转录激活子(例如,VP64或p65)、基本上由转录激活子(例如,VP64或p65)组成,则转录激活子被置于允许其影响靶标转录的空间方向。同样地,转录阻遏物将有利地定位以影响靶标转录,并且核酸酶(例如,Fok1)将有利地定位以切割或部分切割靶标。同样,AAV-CRISPR酶可以递送酶和经修饰的指导。技术人员将理解,对sgRNA的修饰允许衔接子+功能结构域的结合,但衔接子+功能结构域的不适当定位(例如,由于CRISPR复合物的三维结构内的空间位阻)是不期望的修饰。如本文所述,一种或多种经修饰的sgRNA可以在四环、茎环1、茎环2或茎环3处修饰,优选在四环或茎环2处修饰,最优选在四环和茎环2处修饰。
如本文所解释的,功能结构域可以是,例如,来自包括以下、基本由以下组成或由以下组成的组的一种或多种结构域:甲基化酶活性、去甲基酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性和分子开关(例如,光诱导型)。在一些情况下,额外提供至少一个NLS是有利的。在一些情况下,将NLS定位在N末端是有利的。当包括多于一个功能结构域时,功能结构域可以是相同或不同。
可以将sgRNA设计为包括对相同或不同衔接蛋白特异的多个结合识别位点(例如,适体)。sgRNA可被设计以结合转录起始位点(即TSS)上游的启动子区域-1000-+1核酸,优选-200核酸。该定位改善了影响基因激活(例如,转录激活子)或基因抑制(例如,转录阻遏物)的功能结构域。经修饰的sgRNA可以是包含在组合物中的靶向一个或多个靶基因座的一种或多种经修饰的sgRNA(例如,至少1种sgRNA、至少2种sgRNA、至少5种sgRNA、至少10种sgRNA、至少20种sgRNA、至少30种sgRNA、至少50种sgRNA)。
此外,当核酸酶活性失活(例如,与野生型酶相比,核酸酶失活至少70%、至少80%、至少90%、至少95%、至少97%或100%;或者换句话说,AAV-Cpf1酶或AAV-CRISPR酶,其有利具有非突变或野生型Cas9酶或CRISPR酶的约0%的核酸酶活性,或不超过非突变或野生型Cpf1酶或CRISPR酶的约3%或约5%或约10%的核酸酶活性)时,具有减少的核酸酶活性的AAV-CRISPR酶是最有效的。这可以通过将突变导入AsCpf1及其直系同源物的RuvC和HNH核酸酶结构域来实现。例如,利用选自包括以下、基本由以下组成或由以下组成的组的残基处的突变:根据AsCpf1蛋白的D908、E993或D1263;根据FnCpf1的D917或H1006;或根据LbCpf1的D832、E925、D947或D1180,更优选导入一种或多种选自包括以下、基本由以下组成或由以下组成的组的突变:AsCpf1的D908A、E993A或D1263;FnCpf1的D917A或H1006A;或LbCpf1的D832A、E925A、D947A或D1180A。失活的CRISPR酶可以具有相关联(例如,经由融合蛋白)的一个或多个功能性结构域,例如,至少一个去稳定结构域;或者,例如,如本文所述的用于经修饰的sgRNA衔接蛋白的那些,包括例如来自包括以下、基本由以下组成或由以下组成的组的一种或多种结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性和分子开关(例如,光诱导型)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在提供Fok1的情况下,有利的是提供多个Fok1功能结构域以允许功能性二聚体,并且sgRNA被设计以提供适当的间隔用于功能使用(Fok1),如Tsai等Nature Biotechnology,Vol.32,Number 6,June2014)中具体描述的。衔接蛋白可利用已知的接头连接这些功能结构域。在一些情况下,额外提供至少一个NLS是有利的。在一些情况下,将NLS定位在N末端是有利的。当包含多于一个功能结构域时,功能结构域可以是相同或不同。通常,一个或多个功能结构域在失活的AAV-CRISPR酶上的定位是允许功能结构域的正确空间方向以影响关于归属的功能效应的靶向。例如,如果功能结构域是转录激活子(例如,VP64或p65),则转录激活子被置于允许其影响靶标转录的空间方向。同样地,转录阻遏物将有利地定位以影响靶标转录,并且核酸酶(例如,Fok1)将有利地定位以切割或部分切割靶标。这可以包括除AAV-CRISPR酶的N/C末端之外的位置。将功能结构域定位于SpCas9蛋白的Rec1结构域、Rec2结构域、HNH结构域或PI结构域或对应于这些结构域的任何直系同源物是有利的;并且再次提到功能结构域可以是DD。将功能性结构域定位于AsCpf1蛋白的Rec1结构域或Rec2结构域或对应于这些结构域的任何直系同源物在一些情况下可以是优选的。Fok1功能结构域可以连接在N末端。当包括多于一个功能结构域时,功能结构域可以是相同或不同。
衔接蛋白可以是任何数量的蛋白质,其与导入至经修饰的sgRNA的适体或识别位点结合,并且一旦sgRNA引入AAV-CRISPR复合物中,其允许一个或多个功能结构域的合适定位,以影响具有归属功能的靶标。如本申请中详细解释的,这些可以是外壳蛋白,优选噬菌体外壳蛋白。与这样的衔接蛋白相关的功能结构域(例如,以融合蛋白的形式)可包括,例如,来自包括以下、基本由以下组成或由以下组成的组的一种或多种结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性和分子开关(例如,光诱导型)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在功能结构域是转录激活子或转录阻遏物的情况下,额外提供至少NLS并且优选在N末端是有利的。当包含多于一个功能结构域时,功能结构域可以是相同或不同。衔接蛋白可利用已知的接头连接这些功能结构域。这样的接头可用于将AAV(例如,衣壳或VP2)与CRISPR酶相关联或使CRISPR酶包含AAV(或反之亦然)。
因此,sgRNA(例如,经修饰的sgRNA)、失活的AAV-CRISPR酶(具有或不具有功能性结构域)和具有一个或多个功能性结构域的结合蛋白可以各自单独地被包括在组合物中并被单独地或共同施用于宿主。或者,这些组分可以以单个组合物的形式提供以施用于宿主,例如,AAV-CRISPR酶可以递送RNA或指导或sgRNA或经修饰的sgRNA和/或CRISPR系统的其他组分。对宿主的施用可以通过病毒载体进行,有利地使用AAV-CRISPR酶作为递送载体,尽管其他载体可以用于递送除CRISPR系统的酶之外的组分,并且这样的病毒载体可以是,例如,慢病毒载体、腺病毒载体、AAV载体。多种变异适于引发基因组基因座事件,包括DNA切割、基因激活或基因失活。使用提供的组分,本领域技术人员可以有利地且特异性地靶向具有相同或不同功能结构域的单个或多个基因座以引发一个或多个基因组基因座事件。组合物可以以多种方法应用于细胞文库的筛选和体内功能建模(例如,lincRNA的基因激活和功能鉴定;功能获得建模;功能丧失建模;出于优化和筛选目的使用本发明的组合物用于建立细胞系和转基因动物)。
在一个方面,本发明提供了用于药物或治疗的上述实施方式中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方式中任一项的细胞;或用于通过操纵与疾病或失调相关的基因组基因座中的靶序列来修饰生物体或非人体生物体的方法;或用于治疗或抑制由与真核生物或非人生物中的疾病相关的遗传基因座中的一个或多个突变引起的状况的方法;或用于体外、离体或体内基因或基因组编辑;或用于体外、离体或体内基因治疗。
在一个方面,本发明提供包含上述实施方式中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方式中任一项的细胞的药物组合物。
在一个方面,本发明提供治疗或抑制由真核生物或非人生物的基因组基因座的一个或多个突变引起的状况或疾病的方法,所述方法包括在有需要的受试者或非人受试者的靶序列中操纵在所述基因组基因座的编码、非编码或调控元件内的靶序列,包括通过操纵靶序列来修饰受试者或非人受试者,并且其中所述状况或疾病易感于通过操纵靶序列进行的治疗或抑制,包括提供治疗,所述治疗包括递送包含上述实施方式中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方式中任一项的细胞的组合物。
在一个方面,本发明提供上述实施方式中任一项的颗粒递送系统或递送系统或病毒颗粒或以上实施方式中任一项的细胞在离体或体内基因或基因组编辑中的用途;或用于体外、离体或体内基因治疗的用途。
在一个方面,本发明提供了上述实施方式中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方式中任一项的细胞在制备用于体外、离体或体内基因或基因组编辑的药物中的用途,或用于体外、离体或体内基因治疗的用途,或在通过操纵与疾病相关的基因组基因座的靶序列来修饰生物或非人生物的方法中的用途,或在治疗或抑制由真核生物或非人生物中的基因组基因座中的一个或多个突变引起的状况或疾病的方法中的用途。
在一个方面,本发明提供了在需要这样的治疗的受试者中个体化或个性化治疗遗传疾病的方法,其包括:
(a)将一个或多个突变导入至离体组织、器官或细胞系或体内转基因非人类哺乳动物,其包括将包含上述实施方式中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方式中任一项的细胞的组合物递送至组织、器官、细胞或哺乳动物的细胞,其中所述特定突变或精确序列取代与遗传疾病相关或已经相关;
(b)在已经递送载体的细胞上测试遗传疾病的治疗,所述细胞具有与遗传疾病相关的特定突变或精确序列取代;和
(c)基于步骤(b)的治疗测试的结果治疗受试者。
在一个方面,本发明提供了一种对与在真核生物或非人生物中的基因组基因座相关的疾病建模的方法,所述方法包括操纵在所述基因组基因座的编码、非编码或调控元件内的靶序列,包括递送非天然存在或工程化的包含病毒载体系统的组合物,所述病毒载体系统包含一种或多种可操作地编码组合物用于其表达的病毒载体,其中所述组合物包含上述实施方式中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方式中任一项的细胞。
在一个方面,所述方法提供通过在感兴趣的基因组基因座上操纵靶序列来修饰生物或非人生物的方法,所述方法包括施用组合物,所述组合物包含上述实施方式中任一项的颗粒递送系统或递送系统或病毒颗粒或以上实施方式中任一项的细胞。
在任一所描述的方法中,链断裂可以是单链断裂或双链断裂。
调控元件可包含诱导型启动子。多核苷酸和/或载体系统可包含诱导型系统。
本发明还提供了一种载体系统,所述载体系统包括一种或多种载体,所述一种或多种载体包含一种或多种编码非天然存在的或工程化的组合物的组分的多核苷酸分子,所述组合物是具有本文所述或本文所述的方法中任一项所限定的特性的组合物。
本发明还提供一种非天然存在的或工程化的组合物,或编码所述组合物的组分的一种或多种多核苷酸,或载体系统,所述载体系统包括一种或多种编码在治疗的治疗方法中使用的所述组合物的组分的多核苷酸。治疗的治疗方法可包含基因或基因组编辑或基因治疗。
本文所述的核酸靶向系统、载体系统、载体和组合物可用于各种核酸靶向应用,改变或修饰基因产物的合成,例如蛋白质、核酸切割、核酸编辑、核酸剪接;靶核酸的运输、靶核酸的追踪、靶核酸的分离、靶核酸的可视化等。
通常,并且在整个说明书中,术语“载体”是指能够转运与其连接的另一种核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离末端,没有游离末端(例如,环状)的核酸分子;包括DNA、RNA或两者的核酸分子;和本领域已知的其他多核苷酸种类。一种类型的载体是“质粒”,所述质粒是指环状双链DNA环,其中可以例如通过标准的分子克隆技术,插入另外的DNA片段。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装成病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)的载体中。病毒载体还包含由病毒携带的用于转染到宿主细胞中的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起始子的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在导入宿主细胞后被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够引导可操作地连接至其的基因的表达。这样的载体在本文中称为“表达载体”。用于和导致在真核细胞中表达的载体在本文中可称为“真核表达载体”。在重组DNA技术中使用的常见表达载体通常是以质粒的形式。
在某些实施方式中,载体系统包含反向顺序的启动子-指导表达盒。
重组表达载体可以包含适合在宿主细胞中表达核酸的形式的本发明的核酸,这意味着所述重组表达载体包含一个或多个调控元件,所述调控元件可以基于用于表达的宿主细胞进行选择,并且可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许所述核苷酸序列表达的方式与所述调控元件连接(例如,在体外转录/翻译系统或当载体被导入宿主细胞时,在所述宿主细胞中)。
术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如,转录终止信号,例如,多腺苷酸化信号和聚U序列)。这些调控元件描述于例如Goeddel、GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185、AcademicPress、San Diego、Calif.(1990)。调控元件包括在许多类型的宿主细胞中引导核苷酸序列组成型表达的那些和仅在某些宿主细胞中引导核苷酸序列表达的那些(例如,组织特异性调控序列)。组织特异性启动子可以主要在期望的感兴趣的组织中引导表达,例如,肌肉、神经元、骨骼、皮肤、血液、特定器官(例如,肝脏,胰腺)或特定细胞类型(例如,淋巴细胞)。调控元件还可以以时间依赖性方式引导表达,例如,以细胞周期依赖性或发育阶段依赖性的方式,其可以是或可以不是组织或细胞类型特异性。在一些实施方式中,载体包含一个或多个pol III启动子(例如,1、2、3,4、5或更多个pol III启动子),一个或多个pol II启动子(例如,1、2、3、4、5或更多个pol II启动子),一个或多个pol I启动子(例如,1、2、3、4、5或更多个pol I启动子),或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见,例如,Boshart等,Cell,41:521-530(1985)]、SV40启动子,二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。术语“调控元件”还包括增强子元件,例如WPRE;CMV增强子;HTLV-I的LTR中的R-U5’片段(Mol.Cell.Biol.、Vol.8(1)、p.466-472、1988);SV40增强子;和兔β-珠蛋白的外显子2和3之间的内含子序列(Proc.Natl.Acad.Sci.USA.、Vol.78(3)、p.1527-31、1981)。本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、期望的表达水平等因素。可将载体导入宿主细胞中从而产生由本文所述的核酸编码的转录物、蛋白质或肽,包括融合蛋白或肽(例如,规律成簇的间隔短回文重复序列(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。
有利的载体包括慢病毒和腺相关病毒,并且还可以选择这样的载体的类型用于靶向特定类型的细胞。
在一些实施方式中,驱动核酸靶向系统的一个或多个元件的表达的一种或多种载体被导入宿主细胞中,使得所述核酸靶向系统的元件的表达引导核酸靶向复合物在一个或多个靶位点形成。例如,核酸靶向效应模块和核酸靶向指导RNA可各自可操作地连接至单独载体上的单独调控元件。可以将核酸靶向系统的RNA递送至转基因核酸靶向效应模块的动物或哺乳动物,例如,组成型或诱导型或条件型表达核酸靶向效应模块的动物或哺乳动物;或另外表达核酸靶向效应模块或包含含有核酸靶向效应模块的细胞的动物或哺乳动物,例如通过事先向其施用编码和体内表达核酸靶向效应模块的一种或多种载体。或者,可以将由相同或不同调控元件表达的两个或更多个元件组合在单一载体中,且一种或多种另外的载体提供不包含在第一载体中的核酸靶向系统的任何组分。在单个载体中组合的核酸靶向系统元件可以以任何合适的方向排列,例如,一个元件位于相对于第二元件的5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同或相反的链上,并且以相同或相反的方向取向。在一些实施方式中,单个启动子驱动编码核酸靶向效应模块的转录物和嵌入至一个或多个内含子序列内的核酸靶向指导RNA(例如,各自在不同的内含子中,两个或更多个在至少一个内含子,或全部在单个内含子中)的表达。在一些实施方式中,核酸靶向效应模块和核酸靶向指导RNA可操作地连接至同一启动子并由其表达。
在一个方面,本发明提供了包括一种或多种载体的载体系统,其中所述一种或多种载体包含:
a)可操作地连接至编码如本文所限定的工程化CRISPR蛋白的核苷酸序列的第一调控元件;和任选地
b)可操作地连接至编码一种或多种核酸分子的一种或多种核苷酸序列的第二调控元件,所述核酸分子包含含有指导序列、直接重复序列的指导RNA,任选地其中组分(a)和(b)位于相同或不同的载体。
本发明还提供了工程化的、非天然存在的规律成簇的间隔短回文重复序列(CRISPR)-CRISPR相关(Cas效应模块)(CRISPR-Cas效应模块)载体系统,其包括一种或多种载体,所述载体包含:
a)可操作地连接至编码本文任一发明构建体的非天然存在的CRISPR酶的核苷酸序列的第一调控元件;
b)可操作地连接至编码一种或多种指导RNA的一种或多种核苷酸序列的第二调控元件,所述指导RNA包含指导序列、直接重复序列,
其中,
组分(a)和(b)位于相同或不同的载体,
形成CRISPR复合物;
指导RNA靶向靶多核苷酸基因座,并且酶改变多核苷酸基因座,并且
CRISPR复合物中的酶具有与未修饰的酶相比降低的修饰一个或多个脱靶基因座的能力和/或CRISPR复合物中的酶具有与未修饰的酶相比增加的修饰一个或多个靶基因座的能力。
如本文所用,CRISPR Cas效应模块或CRISRP效应模块包括但不限于Cas9、Cpf1、C2c2、组13b和C2c1。在一些实施方式中,可以工程化CRISPR-Cas效应模块。
在这样的系统中,组分(II)可包含可操作地连接至包含指导序列、直接重复序列的多核苷酸序列的第一调控元件,并且其中组分(II)可包含可操作地连接至编码CRISPR酶的多核苷酸序列第二调控元件。在这样的系统中,在适用的情况下,指导RNA可以包含嵌合RNA。
在这样的系统中,组分(I)可包含可操作地连接至指导序列和直接重复序列的第一调控元件,并且其中成分(II)可包含可操作地连接至编码CRISPR酶的多核苷酸序列的第二调控元件。这样的系统可以包含一种以上的指导RNA,并且每种指导RNA具有不同的靶标,由此存在多重。组分(a)和(b)可以在相同的载体上。
在包含载体的任何这样的系统中,一种或多种载体可包括一种或多种病毒载体,例如一种或多种逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒。
在包含调控元件的任何这样的系统中,至少一种所述调控元件可包含组织特异性启动子。组织特异性启动子可以指导哺乳动物血细胞、哺乳动物肝细胞或哺乳动物眼中的表达。
在任何上述组合物或系统的直接重复序列可包括一种或多种蛋白质相互作用的RNA适体。一种或多种适体可位于四元环中。一种或多种适体可能能够结合MS2噬菌体外壳蛋白。
在任何上述组合物或系统中,细胞可以是真核细胞或原核细胞;其中CRISPR复合物可在细胞中起作用,并且由此CRISPR复合物的酶具有与未修饰的酶相比降低的修饰细胞的一个或多个脱靶基因座的能力和/或由此CRISPR复合物中的酶具有与未修饰的酶相比增加的修饰一个或多个靶基因座的能力。
本发明还提供了任何上述组合物或来自任何上述系统的CRISPR复合物。
本发明还提供了在细胞中修饰感兴趣的基因座的方法,其包括使细胞与任何本文所述的工程化CRISPR酶(例如工程化Cas效应模块)、组合物或任何本文所述的系统或载体系统,或其中细胞包含在细胞内存在的任何本文所述的CRISPR复合物。在这些方法中,细胞可以是原核或真核细胞,优选真核细胞。在这些方法中,生物可包括细胞。在这些方法中,生物可以不是人或其他动物。
在某些实施方式中,本发明还提供了一种非天然存在的、工程化的组合物(例如,工程化Cas9、Cpf1、C2c2、C2c1,组29/30,13B,或任何可装配到AAV载体的Cas蛋白)。参考US8,697,359中的图19A、19B、19C、19D和20A-F,其通过引用并入本文以提供也可以使用的其他蛋白质的列表和指导。
任何这样的方法可以是离体或体外进行。
用于应用CRISPRCas系统的方法
作为核酸酶效应蛋白
在一些实施方式中,未修饰的核酸靶向效应蛋白可具有切割活性。在一些实施方式中,RNA靶向的效应蛋白可以引导靶序列的位置处或附近的一条或两条核酸(DNA或RNA)链的切割,例如靶序列内和/或靶序列的互补内或在与靶序列相关的序列处。在一些实施方式中,核酸靶向效应蛋白可以引导离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个碱基对内的一条或两条DNA或RNA链的切割。在一些实施方式中,切割可以是交错的,即产生粘性末端。在一些实施方式中,切割是具有5’突出端的交错切割。在一些实施方式中,切割是具有1至5个核苷酸(优选4或5个核苷酸)的5’突出端的交错切割。在一些实施方式中,切割位点远离PAM,例如,切割发生在非靶链上的第18个核苷酸之后和靶链上的第23个核苷酸之后。在一些实施方式中,切割位点发生在非靶链上的第18个核苷酸(从PAM开始计数)之后和靶链上的第23个核苷酸(从PAM开始计数)之后。在一些实施方式中,载体编码核酸靶向效应蛋白,其可以相对于相应的野生型酶被突变,使得突变的核酸靶向效应蛋白缺乏切割含有靶序列的靶多核苷酸的一条或两条DNA或RNA链的能力。
如本文所述的根据本发明的方法包括在真核细胞中诱导一个或多个突变(在体外,即在分离的真核细胞中),如本文所讨论的,所述方法包括向细胞递送如本文所述的载体。突变可以包括通过指导RNA或sgRNA在细胞的每个靶序列处的一个或多个核苷酸的导入、缺失或置换。突变可以包括通过指导RNA或sgRNA在所述细胞的每个靶序列处的1-75个核苷酸的导入、缺失或置换。突变可包括通过指导RNA或sgRNA在所述细胞的每个靶序列处的1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的导入、缺失或置换。突变可包括通过指导RNA或sgRNA在所述细胞的每个靶序列处的5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的导入、缺失或置换。突变可包括通过指导RNA或sgRNA在所述细胞的每个靶序列处的10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的导入、缺失或置换。突变可包括通过指导RNA或sgRNA在所述细胞的每个靶序列处的20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的导入、缺失或置换。突变可包括通过指导RNA或sgRNA在所述细胞的每个靶序列处的40、45、50、75、100、200、300、400或500个核苷酸的导入、缺失或置换。
起靶向结合蛋白作用的效应蛋白
(f)缺乏核酸酶活性的效应蛋白
如本文所述,Cpf1效应蛋白的相应催化结构域也可以被突变以产生缺失所有DNA切割活性或具有显著降低的DNA切割活性的突变Cpf1效应蛋白。在一些实施方式中,当突变酶的RNA切割活性为约不超过非突变形式的酶的核酸切割活性的25%、10%、5%、1%、0.1%、0.01%或更低时,可认为核酸靶向效应蛋白基本上缺失所有RNA切割活性;例如,与非突变形式相比,突变形式的核酸切割活性为零或可忽略不计。可以参照与最大核酸酶共有同源性的一般类型的酶来鉴定效应蛋白,所述最大核酸酶具有来自V型/VI型CRISPR系统的多个核酸酶结构域。最优选地,效应蛋白是Cpf1。在另一个实施方式中,效应蛋白是V型蛋白。关于衍生,申请人意指衍生的酶在很大程度上是基于野生型酶(在与其具有高度序列同源性的意义上),但是已经以本领域已知的或如本文所述的某种方式被突变(修饰)。
在特定的实施方式中,Cpf1效应蛋白包含一个或多个异源功能结构域。所述一个或多个异源功能结构域可包含一个或多个核定位信号(NLS)结构域。所述一个或多个异源功能结构域可包含至少两个或更多个NLS。所述一个或多个异源功能结构域可包含一个或多个转录激活结构域。转录激活域可包含VP64。所述一个或多个异源功能结构域可包含一个或多个转录抑制结构域。转录抑制结构域可包含KRAB结构域或SID结构域。所述一个或多个异源功能结构域可包含一个或多个核酸酶结构域。所述一个或多个核酸酶结构域可包含Fok1。
出于以下讨论的目的,功能性结构域的参照可以是与CRISPR酶相关联的功能结构域或与衔接蛋白相关联的功能结构域。
在本发明的实践中并且如下所述,gRNA的环可以延伸,通过插入可以招募衔接蛋白的不同的RNA环或不同的序列而不与Cas(例如,Cpf1)蛋白碰撞,所述衔接蛋白可以结合不同的RNA环或不同的序列。所述衔接蛋白可包括但不限于存在于噬菌体外壳蛋白多样性内的正交RNA结合蛋白/适体组合。这样的外壳蛋白的列表包括但不限于:Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、7s和PRR1。这些衔接蛋白或正交RNA结合蛋白可以进一步招募包含一个或多个功能结构域的效应蛋白或融合蛋白。在一些实施方式中,功能结构域可以选自:转座酶结构域、整合酶结构域、重组酶结构域、解离酶结构域、转化酶结构域、蛋白酶结构域、DNA甲基转移酶结构域、DNA羟甲基化酶结构域、DNA去甲基化酶结构域、组蛋白乙酰化酶结构域、组蛋白去乙酰化酶结构域、核酸酶结构域、抑制结构域、激活子结构域、核定位信号结构域、转录调节蛋白(或转录复合物招募)结构域、细胞摄取活性相关结构域、核酸结合结构域、抗体呈递结构域、组蛋白修饰酶、组蛋白修饰酶的招募者、组蛋白修饰酶的抑制子、组蛋白甲基转移酶、组蛋白去甲基化酶、组蛋白激酶、组蛋白磷酸酶、组蛋白核糖酶、组蛋白去核糖酶(histone deribosylase)、组蛋白泛素酶、组蛋白去泛素化酶、组蛋白生物素酶和组蛋白尾蛋白酶。在一些优选的实施方式中,功能结构域是转录激活结构域,例如但不限于VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。在一些实施方式中,功能结构域是转录抑制结构域,优选KRAB。在一些实施方式中,转录抑制结构域是SID,或SID的多联体(例如SID4X)。在一些实施方式中,功能结构域是表观遗传修饰结构域,从而提供表观遗传修饰酶。在一些实施方式中,功能结构域是激活结构域,其可以是P65激活结构域。在一些实施方式中,功能结构域是脱氨酶,例如胞苷脱氨酶。可以将胞苷脱氨酶引导至靶核酸,在靶核酸处胞苷脱氨酶引导胞苷转化为尿苷,导致C至T的置换(互补链上的G至A)。在这样的实施方式中,核苷酸置换可以在没有DNA切割的情况下进行。
包含死亡指导序列的指导RNA
在一个方面,本发明提供了指导序列,其以允许形成CRISPR复合物并成功结合靶标,同时不允许成功的核酸酶活性(即没有核酸酶活性/没有插入缺失活性)的方式进行修饰。对于解释的问题,这样的修改的指导序列被称为“死亡指导”或“死亡指导序列”。这些死亡指导或死亡指导序列可以被认为在核酸酶活性方面是催化失活的或构象失活的。核酸酶活性可以使用本领域常用的surveyor分析或深度测序来测量,优选surveyor分析。类似地,死亡指导序列可以不充分地参与关于促进催化活性或区分中靶和脱靶结合活性的能力的生产性(productive)碱基配对。
死亡指导序列用于引导CRISPR复合物与靶序列的序列特异性结合的能力可通过任何合适的测定法评估。例如,足以形成CRISPR复合物的CRISPR系统的组分(包括待测试的死亡指导序列)可以被提供给具有相应靶序列的宿主细胞(例如通过转染编码CRISPR序列的组分的载体),然后评估靶序列内的优先切割,例如通过本文所述的surveyor测定法。类似地,可以通过提供靶序列、CRISPR复合物的组分(包括待测试的死亡指导序列和不同于测试死亡指导序列的对照指导序列),并比较测试和对照指导序列反应之间靶序列的结合或切割速率,在试管中评估靶多核苷酸序列的切割。其他测定法是可能的,并且对于本领域技术人员而言也是如此。可以选择死亡指导序列以靶向任何靶序列。在一些实施方式中,靶序列是细胞基因组内的序列。
若干结构参数允许合适的框架以获得这样的死亡指导。如本领域所知,gRNA-CRISPR效应蛋白特异性的一个方面是其与这些指导适当地连接的直接重复序列。特别是,这意味着直接重复序列被设计为依赖于CRISPR效应蛋白的来源。因此,可用于经验证的死亡指导序列的结构数据可用于设计Cpf1特定等同物。例如,两种或更多种Cpf1效应蛋白的直系同源核酸酶结构域RuvC之间的结构相似性可用于转移设计等同的死亡指导。在特定的实施方式中,死亡指导序列比各自的指导序列短,这导致活性的Cpf1特异性插入缺失的形成。死亡指导序列比针对相同Cpf1的相应指导短5%、10%、20%、30%、40%、50%,导致活性的Cpf1特异性插入缺失形成。
本文上下文以及本领域现有技术下的死亡指导的使用为体外、离体,和体内应用中的网络生物学和/或系统生物学提供了一个令人惊讶和预料不到的平台,从而允许多重基因靶向,特别是双向多重基因靶向。在使用死亡指导之前,解决多个靶标,例如激活、抑制和/或沉默基因活性,一直是具有挑战性的,并且在某些情况下是不可能的。通过使用死亡指导,可以在例如同一细胞、同一动物或同一患者中解决多个靶标,从而解决多个活动。这种多重可以同时发生或交错一段期望的时间段。
例如,死亡指导现在第一次允许使用gRNA作为基因靶向的手段,而没有核酸酶活性的后果,同时提供用于激活或抑制的定向手段。包含死亡指导的指导RNA可以被修饰以进一步包含允许激活或抑制基因活性形式的元件,特别是如本文其他地方所述的蛋白质蛋白衔接子(例如适体),允许基因效应子的功能性放置(例如基因活动的激活子或阻遏物)。一个实例是引入适体,如本文和本领域现有技术中所解释的。通过工程化包含死亡指导的gRNA以引入蛋白质相互作用适体(Konermann等,“Genome-scale transcriptionactivation by an engineered CRISPR-Cas9complex,”doi:10.1038/nature14136,通过引用并入本文),可以组装由多个不同的效应结构域组成的合成转录激活复合物。这可以在天然转录激活过程之后建模。例如,可以将选择性结合效应子的适体(例如,激活子或阻遏物;二聚化的MS2噬菌体外壳蛋白作为具有激活子或阻遏物的融合蛋白)或自身结合效应子(例如,激活子或阻遏物)的蛋白质附加至死亡gRNA四环和/或茎环2。在MS2的情况下,融合蛋白MS2-VP64与四环和/或茎环2结合,进而介导例如Neurog2的转录上调。其他转录激活子是例如VP64、P65、HSF1和MyoD1。仅仅通过这个概念的实例,用PP7相互作用茎环替代MS2茎环可用于招募抑制元件。
因此,在本文提供的方法的特定的实施方式中,使用了死亡指导,其中gRNA还包含如本文所述提供基因活化或抑制的修饰。死亡gRNA可包含一种或多种适体。适体可以对基因效应子、基因激活子或基因阻遏物特异。或者,适体可以对蛋白质特异,而蛋白质又特异于并招募/结合特定的基因效应子、基因激活子或基因阻遏物。如果存在多个用于激活子或阻遏物招募的位点,则优选所述位点特异于激活子或阻遏物。如果存在多个用于激活子或阻遏物结合的位点,则这些位点可以特异于相同的激活子或相同的阻遏物。这些位点也可以特异于不同的激活子或不同的阻遏物。基因效应子、基因激活子、基因抑制子可以以融合蛋白的形式存在。
在特定的实施方式中,死亡gRNA包含非天然存在的或工程化的组合物,所述组合物包含两种或更多种衔接蛋白,其中每种蛋白与一种或多种功能结构域相关联,并且其中所述衔接蛋白结合插入至死亡gRNA的至少一个环的不同RNA序列。在某些实施方式中,衔接蛋白是包含功能结构域的融合蛋白,所述融合蛋白任选地包含衔接蛋白和功能结构域之间的接头,所述接头任选地包括GlySer接头。在某些实施方式中,与衔接蛋白相关联的一种或多种功能结构域选自:转录激活结构域和转录抑制结构域。在某些实施方式中,与衔接蛋白相关联的一种或多种功能结构域选自:VP64、p65、MyoD1、HSF1、RTA或SET7/9、KRAB结构域、NuE结构域、NcoR结构域、SID结构域或SID4X结构域。在某些实施方式中,与衔接蛋白相关联的一种或多种功能结构域中的至少一种具有一种或多种活性,所述活性包括甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性、RNA切割活性、DNA切割活性或核酸结合活性。在某些实施方式中,DNA切割活性归因于Fok1核酸酶。在某些实施方式中,修饰死亡gRNA,使得在死亡gRNA结合衔接蛋白并进一步结合Cpf1和靶标后,功能结构域处于允许功能结构域在其归属功能中起作用的空间方向。在某些实施方式中,死亡gRNA的至少一个环是四环和/或环2。在某些实施方式中,死亡gRNA的四环和环2通过插入不同的RNA序列而被修饰。在某些实施方式中,与一种或多种衔接蛋白结合的不同RNA序列的插入是适体序列。在某些实施方式中,适体序列是对相同衔接蛋白特异的两种或更多种适体序列。在某些实施方式中,适体序列是对不同衔接蛋白特异的两种或更多种适体序列。在某些实施方式中,衔接蛋白包含MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、7s、PRR1。在某些实施方式中,第一衔接蛋白与p65结构域相关联,而第二衔接蛋白与HSF1结构域相关联。在某些实施方式中,组合物包含具有至少三个功能结构域的Cpf1 CRISPR-Cas复合物,其中至少一个与Cpf1相关联,并且其中至少两个与死亡gRNA相关联。
使用两种不同的适体(每种适体与不同的核酸靶向指导RNA相关联)允许使用激活子-衔接蛋白融合和阻遏物-衔接蛋白融合以及不同的核酸靶向指导RNA以激活一个DNA或RNA的表达,同时抑制另一个。它们连同它们的不同指导RNA可以以多重方法一起或基本上一起施用。可以同时使用大量这样的经修饰的核酸靶向指导RNA,例如10或20或30种等,而仅需递送一种(或至少最少数量)效应蛋白分子,因为相对较小数量的效应蛋白分子可以与大量经修饰的指导一起使用。衔接蛋白可以与一种或多种激活子或一种或多种阻遏物相关联(优选连接或融合)。例如,衔接蛋白可以与第一激活子和第二激活子相关联。第一和第二激活子可以是相同的,但它们优选是不同的激活子。可以使用三种或甚至四种或更多种激活子(或阻遏物),但是包装尺寸可能限制数量高于5个的不同功能结构域。相对于与衔接蛋白直接融合,优选使用接头,其中两个或多个功能结构域与衔接蛋白相关联。合适的接头可包括GlySer接头。
还可以设想的是,核酸靶向的效应蛋白-指导RNA复合物作为整体可与两个或更多个功能结构域相关联。例如,可以存在两个或更多个与核酸靶向效应蛋白相关联的功能结构域,或者可以存在两个或更多个与指导RNA相关联的功能结构域(通过一个或多个衔接蛋白),或者可以存在一个或多个与核酸靶向效应蛋白相关联的功能结构域和与一个或多个与指导RNA相关联的功能结构域(通过一个或多个衔接蛋白)。
衔接蛋白和激活子或阻遏物之间的融合可包含接头。例如,可以使用GlySer接头GGGS(SEQ ID NO:18)。它们可以用于3((GGGGS)3(SEQ ID NO:19))或6(SEQ ID NO:20),9(SEQ ID NO:21)或甚至12(SEQ ID NO:22)或更多的重复,以根据需要提供合适的长度。接头可以在指导RNA和功能结构域(激活子或阻遏物)之间,或在核酸靶向的Cas蛋白(Cas)和功能结构域(激活子或阻遏物)之间使用。接头使用户能够设计适当数量的“机械灵活性”。
本发明包括核酸靶向复合物,其包含核酸靶向效应蛋白和指导RNA,其中核酸靶向效应蛋白包含至少一个突变,使得核酸靶向效应蛋白具有不超过5%的不含有所述至少一个突变的核酸靶向效应蛋白的活性,并且任选地包含至少一个或多个核定位序列;指导RNA包含能够与细胞中感兴趣的RNA中的靶序列杂交的指导序列;其中,核酸靶向效应蛋白与两个或多个功能结构域相关联;或通过插入与一种或多种衔接蛋白结合的不同RNA序列来修饰指导RNA的至少一个环,其中衔接蛋白与两个或多个功能结构域相关联;或核酸靶向Cas蛋白与一个或多个功能结构域相关联,并且通过插入与一种或多种衔接蛋白结合的不同的RNA序列来修饰指导RNA的至少一个环,并且其中衔接蛋白与一个或多个功能结构域相关联。
在某些实施方式中,方法可以涉及使用第二gRNA,其中第二gRNA是能够与第二靶序列杂交的活gRNA,使得第二Cpf1CRISPR-Cas系统被引导至细胞中感兴趣的第二基因组基因座,在第二基因组基因座处具有产生自系统的Cpf1酶的核酸酶活性的可检测的插入缺失活性。因此,在某些实施方式中,方法涉及多个死gRNA和/或多个活gRNA。
用于设计设计、评估或选择用于将Cpf1 CRISPR-CAS系统引导到靶基因座的死亡指导RNA靶向序列(死亡指导序列)的方法例如在WO2016094872描述了,其整体引用并入本文。
在特定的实施方式中,选择用于将功能化的Cpf1引导至生物体中的基因座而不切割的死亡指导RNA靶向序列的方法包括a)在基因座中定位一个或多个CRISPR基序;b)通过如下步骤分析每个CRISPR基序下游的序列:i)选择与CRISPR基序相邻的10至15nt,ii)确定序列的GC含量,和c)如果序列的GC含量大于30%或大于40%,选择10至15nt序列作为在死亡指导RNA中使用的靶序列。在某些实施方式中,靶序列的GC含量为35%或更多、40%或更多、45%或更多、50%或更多、55%或更多、60%或更多、65%或更多、或70%或者更多。在某些实施方式中,靶序列的GC含量为30%至40%或40%至50%或50%至60%或60%至70%。在本发明的一个实施方式中,分析基因座中的两个或更多个序列,并选择具有最高GC含量的序列。在一个实施方式中,其中评估GC含量的靶序列的部分是最接近PAM的15个靶核苷酸的10至15个连续核苷酸。在本发明的一个实施方式中,其中考虑GC含量的指导部分是最接近PAM的15个核苷酸的10至11个核苷酸或11至12个核苷酸或12至13个核苷酸或13或14或15个连续核苷酸。已经观察到,具有16至20个核苷酸的死亡指导RNA中GC含量的增加与DNA切割增加和功能激活减少相一致。
本文已经证实功能化Cpf1的效率可以通过添加核苷酸至指导RNA不与CRISPR基序下游的靶序列相匹配的3’端而增加。例如,对于长度为11至15nt的死亡指导RNA,较短的指导可以不太可能促进靶切割,但在促进CRISPR系统结合和功能控制方面也不太有效。据信对于Cpf1可以观察到类似效果。
多重(串联)靶向方法
发明人已经显示,如本文所定义的CRISPR酶可以使用多于一种RNA指导而不丧失活性。这使得能够使用具有本文定义的单一酶、系统或复合物的本文定义的CRISPR酶、系统或复合物用于靶向多个DNA靶标、基因或基因座。指导RNA可以串联排列,任选地由核苷酸序列(例如本文定义的直接重复序列)分开。不同指导RNA的位置是不影响活性的串联。
因此,Cpf1酶可以形成CRISPR系统或复合物的一部分,其进一步包含串联排列的指导RNA(gRNA),所述指导RNA包含2、3、4、5、6、7、8、9、10、15、25、30或大于30个的指导序列,每个指导序列能够与细胞中感兴趣的基因组基因座中的靶序列特异性杂交。在一些实施方式中,功能性Cpf1 CRISPR系统或复合物结合多个靶序列。在一些实施方式中,功能性CRISPR系统或复合物可以编辑多个靶序列,例如,靶序列可以包含基因组基因座,并且在一些实施方式中,可以存在基因表达的改变。在一些实施方式中,功能性CRISPR系统或复合物可进一步包含另外的功能结构域。在一些实施方式中,本发明提供了一种改变或修饰多种基因产物表达的方法。所述方法可以包括导入至含有所述靶核酸(例如DNA分子)或含有和表达靶核酸(例如DNA分子)的细胞;例如,靶核酸可以编码基因产物或提供基因产物的表达(例如,调控序列)。在一些一般实施方式中,用于多重靶向的Cpf1酶与一个或多个功能结构域相关联。在一些更特定的实施方式中,用于多重靶向的CRISPR酶是如本文其他地方所定义的死亡Cpf1。在一些实施方式中,每个指导序列的长度为至少16、17、18、19、20、25个核苷酸,或16-30个,或16-25个,或16-20个核苷酸之间。
Cong等(Science Feb 15;339(6121):819-23(2013)和本文引用的其他出版物提供了使用CRISPR效应蛋白的多重基因组工程的实例。更具体地,使用Cpf1的多重基因编辑描述于Zetsche等,2016(doi:http://dx.doi.org/10.1101/049122)。
本申请提供了开发核酸靶向系统的治疗用途的方法。核酸靶向复合物是修饰靶DNA或RNA(单链或双链,线性或超螺旋)的有效手段。核酸靶向复合物具有多种用途,包括在多种细胞类型中修饰(例如,缺失,插入,易位,失活,激活)靶DNA或RNA。因此,核酸靶向复合物在例如基因治疗、药物筛选、疾病诊断和预后中具有广泛的应用。示例性的核酸靶向复合物包含与感兴趣的靶基因座内的靶序列杂交的指导RNA复合的DNA或RNA靶向效应蛋白。
本发明涉及开发基于CRISPR系统的治疗剂。在特定的实施方式中,治疗剂包含DNA靶向效应蛋白和/或能够与感兴趣的靶序列杂交的指导RNA。在特定的实施方式中,治疗剂是包括一种或多种载体的载体系统,其中所述一种或多种载体包括:a)第一调控元件,其可操作地连接至编码Cpf1效应蛋白的核苷酸序列;和b)第二调控元件,其可操作地连接至编码一种或多种核酸分子的一种或多种核苷酸序列,所述核酸分子包含指导RNA,所述指导RNA包含指导序列、直接重复序列;其中组分(a)和(b)位于相同或不同的载体上。在特定的实施方式中,治疗剂是包含递送系统的组合物,所述递送系统可操作地配置成递送CRISPR-Cpf1复合物组分或一种或多种包含或编码所述组分的多核苷酸序列至细胞,并且其中所述CRISPR-Cpf1复合物可在细胞中操作;CRISPR-Cas复合物组分,CRISPR-Cpf1复合物组分,包含(I)如本文所述的Cpf1效应蛋白;和包含指导序列和直接重复序列的指导RNA。在任何这样的组合物中,递送系统可包括酵母系统、脂质转染系统、显微注射系统、基因枪系统、病毒体、脂质体、免疫脂质体、聚阳离子、脂质:核酸缀合物或人工病毒粒子,或本文所述的任何其他系统。在特定的实施方式中,递送是通过颗粒、纳米颗粒、脂质或细胞穿透肽(CPP)。
在任何这样的组合物中,组合物可包含多于一种指导RNA,并且每种指导RNA具有不同的靶标,从而存在多重。在包含调控元件的任何这样的系统中,至少一种所述调控元件可包含组织特异性启动子。组织特异性启动子可以引导哺乳动物血细胞、哺乳动物肝细胞或哺乳动物眼中的表达。在任何上述组合物或系统中,直接重复序列可包含一种或多种与蛋白质相互作用的RNA适体。一种或种个适体可以位于四环中。一种或多种适体可以能够结合MS2噬菌体外壳蛋白。
在特定的实施方式中,本文提供的方法是在细胞中修饰感兴趣的基因座的方法,所述方法包括使细胞与任何本文所述Cpf1效应蛋白接触。任何这样的方法可以是离体或体内。
因此,本发明提供了在有需要的个体中治疗疾病、失调或感染的方法,所述方法包括鉴定合适的治疗条件和施用有效量的本文所述的组合物、系统或CRISPR-Cpf1复合物。所述疾病、失调或感染可以包括病毒感染。病毒感染可以是HBV。所述方法也可以是用于基因或基因组编辑的方法。
用Cpf1基因编辑或改变靶基因座
在一个实施方式中,模板核酸通过参与同源重组来改变靶位置的结构。在一个实施方式中,模板核酸改变靶位置的序列。在一个实施方式中,模板核酸导致将修饰的或非天然存在的碱基引入靶核酸中。
模板序列可以经历破坏介导或催化的与靶序列的重组。在一个实施方式中,模板核酸可以包含对应于靶序列上被Cpf1介导的切割事件切割的位点的序列。在一个实施方式中,模板核酸可包含对应于以下两者的序列,在第一Cpf1介导的事件中被切割的靶序列上的第一位点,和在第二Cpf1介导的事件中被切割的靶序列上的第二位点。
在某些实施方式中,模板核酸可以包含导致翻译序列的编码序列改变的序列,例如,导致蛋白质产物中一个氨基酸置换另一个氨基酸的序列,例如,将突变等位基因转变为野生型等位基因,将野生型等位基因转变为突变等位基因,和/或导入终止密码子、插入氨基酸残基、缺失氨基酸残基、或无义突变。在某些实施方式中,模板核酸可包含导致非编码序列改变的序列,例如外显子或5’或3’非翻译或非转录区域的改变。这些改变包括控制元件(例如启动子、增强子和顺式作用或反式作用控制元件)的改变。
与靶基因中的靶位置具有同源性的模板核酸可用于改变靶序列的结构。模板序列可用于改变不需要的结构,例如不需要的或突变的核苷酸。模板核酸可包含以下序列,当整合时,所述序列导致:降低阳性对照元件的活性;增加阳性对照元件的活性;降低阴性对照元件的活性;增加阴性对照元件的活性;降低基因的表达;增加基因的表达;增加对失调或疾病的抵抗力;增加对病毒进入的抵抗力;校正突变或改变不需要的氨基酸残基;赋予、增加、消除或降低基因产物的生物学特性,例如,增加酶的酶活性,或增加基因产物与另一分子相互作用的能力。
模板核酸可以包括导致以下的序列:靶序列的1、2、3、4、5、6、7、8、9、10、11、12或更多个核苷酸的序列中的变化。在一个实施方式中,模板核酸的长度可以是20+/-10、30+/-10、40+/-10、50+/-10、60+/-10、70+/-10、80+/-10、90+/-10、100+/-10、110+/-10、120+/-10、130+/-10、140+/-10、150+/-10、160+/-10,170+/-10、180+/-10、190+/-10、200+/-10、210+/-10、220+/-10个核苷酸。在一个实施方式中,模板核酸的长度可以是30+/-20、40+/-20、50+/-20、60+/-20、70+/-20、80+/-20、90+/-20、100+/-20、110+/-20、120+/-20、130+/-20、140+/-20、150+/-20、160+/-20、170+/-20、180+/-20、190+/-20、200+/-20、210+/-20、220+/-20个核苷酸。在一个实施方式中,模板核酸为10-1、000、20-900、30-800、40-700、50-600、50-500、50-400、50-300、50-200或50-100个核苷酸。
模板核酸包含以下组分:[5’同源臂]-[置换序列]-[3’同源臂]。同源臂提供重组到染色体中,从而用置换序列替换不期望的元件,例如突变或特征。在一个实施方式中,同源臂位于最远侧切割位点的侧翼。在一个实施方式中,5’同源臂的3’末端是置换序列的5’末端旁边的位置。在一个实施方式中,5’同源臂可从置换序列的5’端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸5’。在一个实施方式中,3’同源臂的5’末端是置换序列的3’末端旁边的位置。在一个实施方式中,3’同源臂可以从置换序列的3’末端延伸至少10、20、30、40、50、100、200、300、400、500、600,的700、800、900、1000、1500或2000个核苷酸3’。
在某些实施方式中,可以缩短一个或两个同源臂以避免包含某些序列重复元件。例如,可以缩短5’同源臂以避免序列重复元件。在其他实施方式中,可以缩短3’同源臂以避免序列重复元件。在一些实施方式中,可缩短5’和3’同源臂以避免包含某些序列重复元件。
在某些实施方式中,用于校正突变的模板核酸可以设计用作单链寡核苷酸。当使用单链寡核苷酸时,5’和3’同源臂的长度可以至多约200个碱基对(bp),例如,至少25、50、75、100、125、150、175或200bp。
Cpf1效应蛋白复合物系统促进非同源末端连接
在某些实施方式中,核酸酶诱导的非同源末端连接(NHEJ)可用于靶向基因特异性敲除。核酸酶诱导的NHEJ也可用于去除(例如,缺失)感兴趣基因中的序列。通常,NHEJ通过将两端连接在一起来修复DNA中的双链断裂;然而,通常,仅当两个相容的末端恰好在通过双链断裂形成它们时完美连接时才恢复原始序列。双链断裂的DNA末端通常是酶加工的对象,导致在末端重新连接之前在一条或两条链上添加或去除核苷酸。这导致在NHEJ修复位点处的DNA序列中存在插入和/或缺失(indel)突变。这些突变的三分之二通常改变阅读框,因此产生非功能性蛋白质。另外,维持阅读框但插入或删除大量序列的突变可破坏蛋白质的功能。这是基因座依赖性的,因为关键功能结构域中的突变可能比蛋白质的非关键区域中的突变更不可耐受。NHEJ产生的插入缺失突变在性质上是不可预测的;但是,在给定的断裂位点某些插入序列是有利的,并且在群体中过度表现,可能是由于微观同源的小区域。缺失的长度可以广泛变化;最常见的是在1-50bp范围内,但它们可以容易地大于50bp,例如,它们可以容易地达到大于约100-200bp。插入往往更短,并且通常包含紧邻断裂位点的序列的短重复。然而,有可能获得大的插入,并且在这些情况下,插入的序列通常可追溯到基因组的其他区域或细胞中存在的质粒DNA。
因为NHEJ是诱变过程,所以只要不需要产生特定的最终序列,它也可以用于缺失小序列基序。如果双链断裂靶向至短的靶序列附近,则由NHEJ修复引起的缺失突变通常跨越并因此去除不需要的核苷酸。为了缺失较大的DNA片段,导入两个双链断裂(在序列的每一侧各一个),可以在去除整个插入序列的两个末端之间产生NHEJ。同时。这两种方法都可用于缺失特定的DNA序列;然而,NHEJ易出错的性质仍可能在修复位点产生插入缺失突变。
双链切割Cpf1分子和单链或切口酶Cpf1分子均可用于本文所述的方法和组合物中以产生NHEJ介导的插入缺失。靶向至基因(例如,编码区,例如,感兴趣的基因的早期编码区)的NHEJ介导的插入缺失可用于敲除(即,消除表达)感兴趣的基因。例如,感兴趣基因的早期编码区包含紧接在转录起始位点之后、在编码序列的第一外显子内或在转录起始位点的500bp内的序列(例如,小于500、450、400、350、300、250、200、150、100或50bp)。
在一个实施方式中,其中指导RNA和Cpf1核酸酶产生双链断裂以诱导NHEJ介导的插入缺失,指导RNA可以被配置成将一个双链断裂定位在靶位置核苷酸的附近。在一个实施方式中,切割位点可以在离靶位置0-500bp之间(例如,离靶位置小于500、400、300、200、100、50、40、30、25、20、15、10、9,8、7、6、5、4、3、2或1bp)。
在一个实施方式中,其中与Cpf1切口酶复合的两个指导RNA诱导两个单链断裂以诱导NHEJ介导的插入缺失,可以配置两个指导RNA以定位两个单链断裂以为靶位置的核苷酸提供NHEJ修复。
Cpf1效应蛋白复合物可以递送功能效应子
与CRISPR-Cas介导的通过在DNA水平上突变基因而永久地消除表达的基因敲除不同,CRISPR-Cas敲低允许通过使用人工转录因子暂时减少基因表达。突变Cpf1蛋白的DNA切割结构域两者中的关键残基,例如FnCpf1蛋白(例如,FnCpf1蛋白的D917或H1006突变,或根据AsCpf1蛋白的D908、E993或D1263,或根据LbCpf1蛋白的D832、E925、D947或D1180),导致产生催化失活的Cpf1。催化失活的Cpf1与指导RNA复合并定位至该指导RNA靶向结构域指定的DNA序列,然而,它不切割靶DNA。将失活Cpf1蛋白(例如FnCpf1蛋白(例如D917A和H1006A突变))融合至效应结构域,例如转录抑制结构域,使得能够将效应子招募到指导RNA指定的任何DNA位点。在某些实施方式中,Cpf1可以与转录抑制结构域融合并招募到基因的启动子区域。特别是对于基因抑制,本文考虑阻断内源转录因子的结合位点将有助于下调基因表达。在另一个实施方式中,可以将失活Cpf1与染色质修饰蛋白融合。改变染色质状态可导致靶基因的表达降低。
在一个实施方式中,指导RNA分子可以靶向已知的转录反应元件(例如,启动子、增强子等),已知的上游激活序列,和/或具有疑似能够控制靶DNA表达的未知或已知功能的序列。
在一些方法中,可以使靶多核苷酸失活以实现细胞中的表达的修饰。例如,当CRISPR复合物与细胞中的靶序列结合时,靶多核苷酸被失活,使得序列不被转录,编码的蛋白质不产生,或者序列不起野生型序列的作用。例如,可以使蛋白质或microRNA编码序列失活,从而不产生蛋白质。
在某些实施方式中,CRISPR酶包含选自D917A、E1006A和D1225A的一个或多个突变和/或一个或多个突变是在CRISPR酶的RuvC结构域中或者是如本文其它部分所讨论的突变。在一些实施方式中,CRISPR酶在催化结构域中具有一个或多个突变,其中当转录时,直接重复序列形成单个茎环,并且指导序列引导CRISPR复合物与靶序列序列特异性结合,并且其中酶还包含功能结构域。在一些实施方式中,功能结构域是转录激活结构域,优选VP64。在一些实施方式中,功能结构域是转录抑制结构域,优选KRAB。在一些实施方式中,转录抑制结构域是SID或SID的串联(例如SID4X)。在一些实施方式中,功能结构域是表观遗传修饰结构域,从而提供表观遗传修饰酶。在一些实施方式中,功能结构域是激活结构域,其可以是P65激活结构域。
失活CRISPR Cpf1酶用于检测方法,例如FISH。
在一个方面,本发明提供了工程化的非天然存在的CRISPR-Cas系统,其包括本文所述的催化失活的Cas蛋白,优选失活的Cpf1(dCpf1),并且在诸如荧光原位杂交(FISH)的检测方法中使用该系统。缺乏产生DNA双链断裂能力的dCpf1可以与标志物(例如,荧光蛋白,例如,增强的绿色荧光蛋白(eEGFP))融合,并与小的指导RNA共表达以在体内靶向臂间、中心和端粒的重复序列。dCpf1系统可用于可视化人类基因组中的重复序列和个体基因两者。标记的dCpf1 CRISPR-cas系统的这样的新应用可以在成像细胞和研究功能性核结构中是重要的,特别是在核体积小或复杂的三维结构的情况下。(Chen B,Gilbert LA,CiminiBA,Schnitzbauer J,Zhang W,Li GW,Park J,Blackburn EH,Weissman JS,Qi LS,HuangB.2013.Dynamic imaging of genomic loci in living human cells by an optimizedCRISPR/Cas system.Cell 155(7):1479-91.doi:10.1016/j.cell.2013.12.001.)
核酸、氨基酸和蛋白质、调控序列、载体等
本发明使用核酸结合靶DNA序列。这是有利的,因为核酸生产比蛋白质更容易和更便宜,并且特异性可以根据寻求同源性处的伸展长度而变化。例如,不需要复杂的多个手指的3-D定位。术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。它们是指任何长度的聚合形式的核苷酸,可以是脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可以具有任何三维结构,并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码或非编码区、从连锁分析定义的基因座(基因座)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、microRNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。该术语还包括具有合成骨架的核酸样结构,参见例如Eckstein,1991;Baserga等,1992;Milligan,1993;WO 97/03211;WO96/39154;Mata,1997;Strauss-Soukup,1997;and Samstag,1996。多核苷酸可包含一个或多个修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果存在,可以在聚合物组装之前或之后赋予对核苷酸结构的修饰。核苷酸序列可被非核苷酸组分中断。聚合后可以进一步修饰多核苷酸,例如通过与标记组分缀合。如本文所用,术语“野生型”是本领域技术人员理解的术语,并且是指生物体、品系、基因或特征在其在自然界中出现的典型形式,区别于突变体或变体形式。“野生型”可以是基线。如本文所用,术语“变体”应当被认为是指具有偏离自然界中出现的模式的性质的展示。术语“非天然存在的”或“工程化的”可互换使用并表示人工的参与。当提及核酸分子或多肽时,意指核酸分子或多肽至少基本上不含在自然中它们与之天然相关的和如见于自然中的至少一种其他组分。“互补性”是指核酸通过传统的Watson-Crick碱基配对或其它非传统类型与另外的核酸序列形成氢键的能力。百分比互补性表示核酸分子中可与第二核酸序列形成氢键(例如,Watson-Crick碱基配对)的残基百分比(例如,10个中的5、6、7、8、9、10个为50%、60%、70%、80%、90%和100%互补)。“完全互补”是指核酸序列的所有连续残基将与第二核酸序列中相同数量的连续残基氢键结合。如本文所用,“基本上互补”是指互补程度为在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%,或指在严格条件下杂交的两个核酸。如本文所用,用于杂交的“严格条件”是指在这种条件下,具有靶序列互补性的核酸主要与靶序列杂交并且基本上不与非靶序列杂交。严格条件通常是序列依赖性的,并且取决于许多因素而变化。通常,序列越长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例详细描述于Tijssen(1993),Laboratory Techniques In Biochemistry And MolecularBiology-Hybridization With Nucleic Acid Probes Part I,Second Chapter“Overviewof principles of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N.Y.。在提及多核苷酸序列的情况下,还设想了互补或部分互补的序列。这些优选能够在高度严格的条件下与对照序列杂交。通常,为了使杂交速率最大化,选择相对低严格性的杂交条件:比热熔点(Tm)低约20至25℃。Tm是50%特定靶序列在确定的离子强度和pH下与溶液中的完全互补探针杂交的温度。通常,为了要求至少约85%的杂交序列的核苷酸互补性,选择高度严格的洗脱条件(比Tm低约5至15℃)。为了要求杂交序列的至少约70%的核苷酸互补性,选择中等严格的洗脱条件(比Tm低约15至30℃)。高度许可(非常低的严格性)洗涤条件可低至Tm以下50℃,允许杂交序列之间的高水平错配。本领域技术人员将认识到,杂交和洗涤阶段中的其他物理和化学参数也可以被改变,以影响来自靶序列和探针序列之间的特定同源性水平的可检测杂交信号的结果。优选的高度严格条件包括在42℃下在50%甲酰胺、5×SSC和1%SDS中孵育,或在65℃下在5×SSC和1%SDS中孵育,在65℃下在0.2×SSC和0.1%SDS中洗脱。“杂交”是指其中一种或多种多核苷酸反应形成复合物的反应,所述复合物通过核苷酸残基的碱基之间的氢键稳定。氢键可以通过WatsonCrick碱基配对、Hoogstein结合或以任何其他序列特异性方式发生。复合物可包含形成双链结构的两条链、形成多链复合物的三条或更多条链、单一自杂交链或这些的任何组合。杂交反应可以构成更广泛过程中的步骤,例如PCR的启动或酶对多核苷酸的切割。能够与给定序列杂交的序列称为给定序列的“互补序列”。如本文所用,术语“基因组基因座”或“基因座”(复数基因座)是染色体上基因或DNA序列的特定位置。“基因”是指编码具有功能作用在生物体中发挥的多肽或RNA链的DNA或RNA段,因此是活生物体中的遗传性的分子单元。出于本发明的目的,可以认为基因包含调节基因产物产生的区域,无论这些调控序列是否与编码和/或转录序列相邻。因此,基因包括但不必限于启动子序列、终止子、翻译调控序列例如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起始子、基质附着位点和基因座控制区域。如本文所用,“基因组基因座的表达”或“基因表达”是来自基因的信息用于合成功能性基因产物的过程。基因表达的产物通常是蛋白质,但是在非蛋白质编码基因例如rRNA基因或tRNA基因中,产物是功能性RNA。基因表达的过程被所有已知的生命:真核生物(包括多细胞生物)、原核生物(细菌和古细菌)和病毒,用于产生功能性产品以生存。如本文所用,基因或核酸的“表达”不仅包括细胞基因表达,还包括在克隆系统和任何其他环境中核酸的转录和翻译。如本文所用,“表达”还指多核苷酸从DNA模板转录(例如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可统称为“基因产物”。如果多核苷酸衍生自基因组DNA,则表达可包括在真核细胞中mRNA的剪接。术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,是指任何长度的氨基酸聚合物。聚合物可以是直链或支链的,它可以包含修饰的氨基酸,并且可以被非氨基酸中断。该术语还包括已经修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作,例如与标记组分的缀合。如本文所用,术语“氨基酸”包括天然和/或非天然的或合成的氨基酸,包括甘氨酸和D或L光学异构体,以及氨基酸类似物和肽模拟物。如本文所用,术语“结构域”或“蛋白质结构域”是指蛋白质序列的一部分,其可以独立于蛋白质链的其余部分存在并起作用。如本发明各方面所述,序列同一性与序列同源性有关。可以通过眼睛或者更通常地,借助于容易获得的序列比较程序,进行同源性比较。这些商业上可获得的计算机程序可以计算两个或更多个序列之间的百分比(%)同源性,并且还可以计算由两个或更多个氨基酸或核酸序列共享的序列同一性。
如本文所用,术语“野生型”是本领域技术人员理解的术语,并且是指生物体、品系、基因或特征在其在自然界中出现时的典型形式,区别于突变体或变体形式。“野生型”可以是基线。
如本文所用,术语“变体”应当被认为是指具有偏离自然界中出现的模式的性质的展示。
术语“非天然存在的”或“工程化的”可互换使用并表示人工的参与。当提及核酸分子或多肽时,术语是指核酸分子或多肽至少基本上不含至少一种与自然天然存在的自然相关的其他组分。
如本文所用,术语“野生型”是本领域技术人员理解的术语,并且是指生物体,菌株,基因或特征的典型形式,因为它在自然界中发生,区别于突变体或变体形式。“野生型”可以是基线。
如本文所用,术语“变体”应当被认为是指具有偏离自然界中发生的模式的品质的展示。
术语“非天然存在的”或“工程化的”可互换使用并表示人的手的参与。当提及核酸分子或多肽时,意指核酸分子或多肽至少基本上不含在自然中它们与之天然相关的和如见于自然中的至少一种其他组分。在所有方面和实施方式中,无论它们是否包括这些术语,应理解,优选地,它可以是任选的,因此优选包括或不优选不包括。此外,术语“非天然存在的”和“工程化的”可以互换使用,因此可以单独使用或组合使用,并且一种或其他可以替代提到两者一起。特别是,“工程化的”优选代替“非天然存在的”或“非天然存在的和/或工程化的”。
序列同源性可以通过本领域已知的许多计算机程序中的任何一种产生,例如BLAST或FASTA等。用于进行这种比对的合适的计算机程序是GCG Wisconsin Bestfit包(University of Wisconsin,U.S.A;Devereux等,1984,Nucleic Acids Research 12:387)。可以进行序列比较的其他软件的实例包括但不限于BLAST包(参见Ausubel等,1999ibid–Chapter 18)、FASTA(Atschul等,1990,J.Mol.Biol.,403-410)和GENEWORKS比较工具套件。BLAST和FASTA都可用于离线和在线搜索(参见Ausubel等,1999ibid,pages 7-58to 7-60)。然而,最好使用GCG Bestfit程序。可以在连续序列上计算百分比(%)序列同源性,即,一个序列与另一个序列比对,并且一个序列中的每个氨基酸或核苷酸与另一个序列中的相应氨基酸或核苷酸直接比较,每次一个残基。这称为“无缺口”比对。通常,这种无缺口比对仅在相对较短数量的残基上进行。虽然这是非常简单和一致的方法,但是没有考虑到,例如,在一对其他相同的序列中,一次插入或缺失可能导致以下氨基酸残基不对齐,从而可能导致当进行全局比对时,%同源性大大降低。因此,大多数序列比较方法被设计为产生最佳比对,其考虑可能的插入和缺失而不过度惩罚整体同源性或同一性评分。这通过在序列比对中插入“缺口”以试图最大化局部同源性或同一性来实现。然而,这些更复杂的方法将“缺口罚分”分配给比对中出现的每个缺口,以便对于相同数量的相同氨基酸,序列比对具有尽可能少的缺口-反映两条比较序列之间更高的相关性-可能会获得比有许多缺口的分数更高的分数。通常使用“亲和缺口成本”,其对于缺口的存在收取相对高的成本并且对缺口中的每个后续残基收取较小的惩罚。这是最常用的缺口评分系统。当然,高缺口惩罚可以产生具有较少缺口的优化比对。大多数比对程序允许修改缺口惩罚。但是,当使用这种软件进行序列比较时,优选使用默认值。例如,当使用GCG Wisconsin Bestfit软件包时,氨基酸序列的默认缺口惩罚是缺口为-12,延伸为-4。因此,计算最大%同源性首先需要产生最佳比对,同时考虑缺口罚分。用于进行这种比对的合适的计算机程序是GCG WisconsinBestfit包(Devereux等,1984Nuc.Acids Research 12p387)。可以进行序列比较的其他软件的实例包括但不限于BLAST包(参见Ausubel等,1999Short Protocols in MolecularBiology,4th Ed.–Chapter 18),FASTA(Altschul等,1990J.Mol.Biol.403-410)和GENEWORKS比较工具套件。BLAST和FASTA均可用于离线和在线搜索(参见Ausubel等,1999,Short Protocols in Molecular Biology,pages 7-58to 7-60)。但是,对于某些应用,优选使用GCG Bestfit程序。一种名为BLAST 2Sequences的新工具也可用于比较蛋白质和核苷酸序列(参见FEMS Microbiol Lett.1999 174(2):247-50;FEMS Microbiol Lett.1999177(1):187-8和美国国立卫生研究院的网站上的国家生物技术信息中心的网站)。尽管可以根据同一性来测量最终的%同源性,但是比对过程本身通常不基于全有或全无(all-or-nothing)配对比较。相反,通常使用缩放的相似性分数矩阵,其基于化学相似性或进化距离为每个成对比较分配分数。常用的这种矩阵的一个实例是BLOSUM62矩阵-BLAST程序套件的默认矩阵。GCG Wisconsin程序通常使用公共默认值或自定义符号比较表(如果提供)(有关详细信息,请参阅用户手册)。对于某些应用,优选使用GCG软件包的公共默认值,或者对于其他软件,使用默认矩阵,例如BLOSUM62。或者,可以使用DNASIS TM(Hitachi Software)中的多重比对特征,基于类似于CLUSTAL的算法(Higgins DG&Sharp PM(1988),Gene 73(1),237-244)计算百分比同源性。一旦软件产生最佳比对,就可以计算%同源性,优选%序列同一性。软件通常将此作为序列比较的一部分并生成数值结果。序列还可以具有氨基酸残基的缺失、插入或置换,其产生沉默变化并产生功能等同的物质。有意的氨基酸置换可以是基于氨基酸性质的相似性(例如极性、电荷、溶解度、疏水性、亲水性和/或残基的两亲性质)进行,因此将氨基酸成组在一起作为功能组是有用的。氨基酸可以仅基于其侧链的性质而成组在一起。然而,包含突变数据也更有用。由此衍生的氨基酸组可能出于结构原因是保守的。这些组可以以维恩图(Livingstone C.D.and Barton G.J.(1993)“Protein sequencealignments:a strategy for the hierarchical analysis of residue conservation”Comput.Appl.Biosci.9:745-756)(Taylor W.R.(1986)
“The classification of amino acid conservation”J.Theor.Biol.119;205-218)的形式描述。例如根据下表可以进行保守置换,其描述了通常接受的维恩图氨基酸分组。
术语“受试者”、“个体”和“患者”在本文中可互换用于指脊椎动物,优选哺乳动物,更优选人。哺乳动物包括但不限于鼠、猿猴、人、农场动物、运动动物和宠物。还包括体内获得的或体外培养的生物实体的组织、细胞及其后代。
术语“治疗剂”、“治疗能力剂”或“治疗剂”可互换使用,并且是指在施用于受试者时赋予一些有益效果的分子或化合物。有益效果包括使得能够诊断确定;改善疾病、症状、障碍或病理状况;减少或预防疾病、症状、失调或状况的发作;并且通常抵抗疾病、症状、失调或病理状况。
如本文所用,“治疗”或“治疗”或“缓解”或“改善”可互换使用。这些术语是指用于获得有益或期望结果的方法,包括但不限于治疗益处和/或预防益处。治疗益处是指治疗中对一种或多种疾病、状况或症状的任何治疗相关的改善或作用。关于预防益处,组合物可以施用于有发展特定疾病、状况或症状风险的受试者,或施用于报告疾病的一种或多种生理症状的受试者,即使疾病、状况或症状可能还没有被证实。
术语“有效量”或“治疗有效量”是指足以产生有益或所需结果的药剂的量。治疗有效量可以根据以下一个或多个而变化:受试者和治疗中的疾病状况、受试者的体重和年龄、疾病状况的严重程度、施用方式等,其可以容易地由本领域普通技术人员确定。该术语还适用于将通过本文所述的任何一种成像方法提供用于检测的图像的剂量。具体剂量可以根据以下一种或多种而变化:所选择的特定药剂、要遵循的给药方案、是否与其他化合物联合施用、施用时间、待成像组织和其被携带的物理递送系统。
除非另有说明,本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,这些技术在本领域的技术范围内。参见Sambrook,Fritsch and Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL,2ndedition(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel,等eds.,(1987));the series METHODS IN ENZYMOLOGY(Academic Press,Inc.):PCR 2:APRACTICAL APPROACH(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlowand Lane,eds.(1988)ANTIBODIES,A LABORATORY MANUAL,和ANIMAL CELL CULTURE(R.I.Freshney,ed.(1987)).
本发明的实施方式包括可包含同源置换(置换和替换均在本文中用于表示现有氨基酸残基或核苷酸与替代残基或核苷酸的交换)的序列(多核苷酸或多肽),所述置换可以发生,例如,在氨基酸的情况下,类似对类似置换,例如碱性对碱性、酸性对酸性、极性对极性等。也可能发生非同源置换,即从一类残基到另一类或可替代地涉及包括非天然氨基酸例如鸟氨酸(下文称为Z)、二氨基丁酸鸟氨酸(下文称为B)、正亮氨酸鸟氨酸(下文称为O)、吡啶丙氨酸、噻吩丙氨酸、萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可包含合适的间隔基团,其可插入序列的任何两个氨基酸残基之间,包括烷基例如甲基、乙基或丙基,以及氨基酸间隔子如甘氨酸或β-丙氨酸残基。本领域技术人员可以很好地理解另一种形式的变异,其涉及拟肽形式的一个或多个氨基酸残基的存在。为避免疑义,“拟肽形式”用于指变体氨基酸残基,其中α-碳取代基位于残基的氮原子而不是α-碳上。制备拟肽形式的肽的方法是本领域已知的,例如Simon RJ等,PNAS(1992)89(20),9367-9371and Horwell DC,TrendsBiotechnol.(1995)13(4),132-134。
同源性建模:其他Cpf1直系同源物中的相应残基可以通过Zhang等,2012(Nature;490(7421):556-60)and Chen等,2015(PLoS Comput Biol;11(5):e1004248)的方法鉴定,其是预测由结构域基序界面介导的相互作用的计算蛋白质-蛋白质相互作用(PPI)方法。PrePPI(Predicting PPI)是基于结构的PPI预测方法,使用贝叶斯统计框架将结构证据与非结构证据相结合。该方法涉及采用一对查询蛋白质并使用结构比对来鉴定对应于其实验确定的结构或同源模型的结构代表。通过考虑全局和局部几何关系,结构比对进一步用于鉴定近距离和远距离结构邻域两者。每当结构代表的两个邻域形成蛋白质数据库中报告的复合物时,这定义了用于对两个查询蛋白质之间的相互作用进行建模的模板。通过将代表性结构叠加在模板中对应的结构邻域上来创建复合体的模型。该方法在Dey等,2013(ProtSci;22:359-66)中进一步描述。
出于本发明的目的,扩增意指使用引物和能够以合理保真度复制靶序列的聚合酶的任何方法。扩增可以通过天然或重组DNA聚合酶进行,例如TaqGold TM、T7DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段和逆转录酶。优选的扩增方法是PCR。
功能结构域
一些实施方式中,一个或多个功能结构域与Cpf1效应蛋白相关联。在一些实施方式中,一个或多个功能结构域与衔接蛋白相关联,例如与Konnerman等(Nature 517,583–588,29January 2015)的修饰的指导一起使用。在一些实施方式中,一个或多个功能结构域与死亡gRNA(dRNA)相关联。在一些实施方式中,具有活性Cpf1效应蛋白的dRNA复合物通过功能结构域在一个基因座处引导基因调节,而gRNA通过活性Cpf1效应蛋白在另一基因座处引导DNA切割,例如如Dahlman等,‘Orthogonal gene control with a catalyticallyactive Cas9nuclease’(印刷中)的CRISPR-Cas9系统中类似地描述。在一些实施方式中,选择dRNA以与脱靶调节相比使对感兴趣基因座的调节的选择性最大化。在一些实施方式中,选择dRNA以使靶基因调节最大化并使靶切割最小化
出于以下讨论的目的,对功能结构域的提及可以是与Cpf1效应蛋白相关联的功能结构域或与衔接蛋白相关联的功能结构域。
在本发明的实践中,gRNA的环可以延伸,通过插入可以招募衔接蛋白的不同的RNA环或不同的序列而不与Cpf1蛋白碰撞,所述衔接蛋白可以结合不同的RNA环或不同的序列。衔接蛋白可包括但不限于存在于噬菌体外壳蛋白多样性内的正交RNA结合蛋白/适体组合。这样的外壳蛋白的列表包括但不限于:Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、7s和PRR1。这些衔接蛋白或正交RNA结合蛋白可以进一步招募包含一个或多个功能结构域的效应蛋白或融合蛋白。在一些实施方式中,功能结构域可以选自:转座酶结构域、整合酶结构域、重组酶结构域、解离酶结构域、转化酶结构域、蛋白酶结构域、DNA甲基转移酶结构域、DNA羟甲基化酶结构域、DNA去甲基化酶结构域、组蛋白乙酰化酶结构域、组蛋白去乙酰化酶结构域、核酸酶结构域、抑制结构域、激活子结构域、核定位信号结构域、转录调节蛋白(或转录复合物招募)结构域、细胞摄取活性相关结构域、核酸结合结构域、抗体呈递结构域、组蛋白修饰酶、组蛋白修饰酶的招募者、组蛋白修饰酶的抑制子、组蛋白甲基转移酶、组蛋白去甲基化酶、组蛋白激酶、组蛋白磷酸酶、组蛋白核糖酶、组蛋白去核糖酶(histonederibosylase)、组蛋白泛素酶、组蛋白去泛素化酶、组蛋白生物素酶和组蛋白尾蛋白酶。在一些优选的实施方式中,功能结构域是转录激活结构域,例如但不限于VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。在一些实施方式中,功能结构域是转录抑制结构域,优选KRAB。在一些实施方式中,转录抑制结构域是SID,或SID的多联体(例如SID4X)。在一些实施方式中,功能结构域是表观遗传修饰结构域,从而提供表观遗传修饰酶。在一些实施方式中,功能结构域是激活结构域,其可以是P65激活结构域。
在一些实施方式中,一个或多个功能结构域是NLS(核定位序列)或NES(核输出信号)。在一些实施方式中,一个或多个功能结构域是转录激活结构域,其包含VP64、p65、MyoD1、HSF1、RTA、SET7/9和组蛋白乙酰转移酶。本文涉及与CRISPR酶相关联的那些的对活化(或激活子)结构域的其他提及包括任何已知的转录激活结构域,特别是VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。
在一些实施方式中,一个或多个功能结构域是转录抑制结构域。在一些实施方式中,转录抑制结构域是KRAB结构域。在一些实施方式中,转录抑制结构域是NuE结构域、NcoR结构域、SID结构域或SID4X结构域。
在一些实施方式中,一个或多个功能结构域具有一种或多种活性,所述活性包括甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸结合活性。
在一些实施方式中,组蛋白修饰结构域也是优选的。以下讨论示例性组蛋白修饰结构域。转座酶结构域、HR(同源重组)机器结构域、重组酶结构域和/或整合酶结构域也优选作为本发明的功能结构域。在一些实施方式中,DNA整合活性包括HR机器结构域、整合酶结构域、重组酶结构域和/或转座酶结构域。在一些实施方式中,组蛋白乙酰转移酶是优选的。
在一些实施方式中,DNA切割活性归因于核酸酶。在一些实施方式中,核酸酶包括Fok1核酸酶。参见“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,JenniferA.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.KeithJoung Nature Biotechnology 32(6):569-77(2014),涉及二聚体RNA指导的FokI核酸酶,其识别扩展的序列并且可以在人细胞中高效编辑内源基因。
在一些实施方式中,一个或多个功能结构域与Cpf1效应蛋白附着,使得在结合sgRNA和靶标时,功能结构域处于允许功能结构域以其归属功能起作用的空间方向。
在一些实施方式中,一个或多个功能结构域与衔接蛋白附着,使得在Cpf1效应蛋白与gRNA和靶标结合后,功能结构域处于允许功能结构域以其归属功能起作用的空间方向。
在一个方面,本发明提供如本文所讨论的组合物,其中所述一个或多个功能结构域经由接头,任选地GlySer接头,与Cpf1效应蛋白或接头蛋白附着,如本文所述。
内源性转录抑制通常由染色质修饰酶(例如组蛋白甲基转移酶(HMT)和去乙酰化酶(HDAC))介导。抑制性组蛋白效应结构域是已知的,并且示例性表提供如下。在示例性表中,优选小尺寸的蛋白质和功能性截短以促进有效的病毒包装(例如通过AAV)。然而,通常,结构域可包括HDAC、组蛋白甲基转移酶(HMT)和组蛋白乙酰转移酶(HAT)的抑制子以及HDAC和HMT招募蛋白。在一些实施方式中,功能结构域可以是或包括HDAC效应结构域、HDAC招募者效应结构域、组蛋白甲基转移酶(HMT)效应结构域、组蛋白甲基转移酶(HMT)招募者效应结构域,或组蛋白乙酰转移酶抑制子效应结构域。
HDAC效应结构域
因此,本发明的阻遏物结构域可选自组蛋白甲基转移酶(HMT)、组蛋白去乙酰化酶(HDAC)、组蛋白乙酰转移酶(HAT)抑制子,以及HDAC和HMT招募蛋白。
HDAC结构域可以是上表中的任何一个,即:HDAC8、RPD3、MesoLo4、HDAC11、HDT1、SIRT3、HST2、CobB、HST2、SIRT5、Sir2A或SIRT6。
在一些实施例中,功能结构域可以是HDAC招募者效应结构域。优选的实例包括下表中的那些,即MeCP2、MBD2b、Sin3a、NcoR、SALL1、RCOR1。NcoR在本实施例中举例说明,并且尽管是优选的,但设想该类别中的其它也是有用的。
HDAC招募者效应结构域的表
在一些实施方式中,功能结构域可以是甲基转移酶(HMT)效应结构域。优选的实例包括下表中的那些,即NUE、vSET、EHMT2/G9A、SUV39H1、dim-5、KYP、SUVR4、SET4、SET1、SETD8和TgSET8。NUE在本实施例中举例说明,尽管是优选的,但设想该类别中的其他也是有用的。
组蛋白甲基转移酶(HMT)效应结构域的表
在一些实施方式中,功能结构域可以是组蛋白甲基转移酶(HMT)招募者效应结构域。优选的实例包括下表中的那些,即Hp1a、PHF19和NIPP1。
组蛋白甲基转移酶(HMT)招募者效应结构域的表
在一些实施方式中,功能结构域可以是组蛋白乙酰转移酶抑制子效应结构域。优选的实例包括下表中列出的SET/TAF-1β。
组蛋白乙酰转移酶抑制子效应结构域的表
除了启动子或启动子-近端元件之外,还优选靶向内源(调控)控制元件(例如增强子和沉默子)。因此,除了靶向启动子之外,本发明还可用于靶向内源控制元件(包括增强子和沉默子)。这些控制元件可以位于转录起始位点(TSS)的上游和下游,从离TSS 200bp开始到100kb远。靶向已知的控制元件可用于激活或抑制感兴趣的基因。在一些情况下,单个控制元件可以影响多个靶基因的转录。因此,可以使用靶向单个控制元件来同时控制多个基因的转录。
另一方面,靶向推定的控制元件(例如通过平铺推定的控制元件的区域以及元件周围200bp至100kB)可以用作验证这些元件(通过测量感兴趣基因的转录)或检测新的控制元件(例如,通过平铺感兴趣基因的TSS上游和下游100k b)的手段。此外,在理解疾病的遗传原因的上下文中,靶向推定的控制元件可以是有用的。与疾病表型相关的许多突变和常见SNP变体位于编码区之外。用本文所述的激活或抑制系统靶向这样的区域可以之后是以下的转录的读出:a)推定的靶标的组(例如,位于控制元件的最近处的基因的组)或b)全转录组读出,通过例如RNAseq或微阵列。这将允许鉴定参与疾病表型的可能候选基因。这样的候选基因可用作新的药物靶标。
本文提及组蛋白乙酰转移酶(HAT)抑制子。然而,在一些实施方式中,替代方案是一个或多个功能结构域包含乙酰转移酶,优选组蛋白乙酰转移酶。这些在表观基因组学领域中是有用的,例如在询问表观基因组的方法中。询问表观基因组的方法可包括,例如,靶向表观基因组序列。靶向表观基因组序列可包括引导至表观基因组靶序列的指导。在一些实施方式中,表观基因组靶序列可包括启动子、沉默子或增强子序列。
使用与本文所述的Cpf1效应蛋白(优选死亡Cpf1效应蛋白,更优选死亡FnCpf1效应蛋白)连接的功能结构域以靶向表观基因组序列,这可用于激活或抑制启动子、沉默子或增强子。
乙酰转移酶的实例是已知的,但在一些实施方式中可包括组蛋白乙酰转移酶。在一些实施方式中,组蛋白乙酰转移酶可包含人乙酰转移酶p300的催化核心(Gerbasch&Reddy,Nature Biotech 6th April 2015)。
在一些优选的实施方式中,功能结构域与死亡Cas9效应蛋白连接以靶向和激活表观基因组序列,例如启动子或增强子。还可提供引导至这样的启动子或增强子的一种或多种指导以引导CRISPR酶与这样的启动子或增强子的结合。
本文使用的术语“与...相关联”涉及功能结构域与Cpf1效应蛋白或衔接蛋白的关联。它用于一个分子如何与另外的分子“相关联”,例如在衔接蛋白和功能结构域之间,或在Cpf1效应蛋白和功能结构域之间。在这种蛋白质-蛋白质相互作用的情况下,可以以抗体识别表位的方式的识别来观察这种相关联。或者,一种蛋白质可以通过两者的融合与另外的蛋白质相关联,例如一种亚基与另外的亚基融合。融合通常通过将一个的氨基酸序列添加到另外的氨基酸序列而发生,例如通过将编码每个蛋白质或亚基的核苷酸序列拼接在一起。或者,这可以基本上被视为两个分子之间的结合或直接连接,例如融合蛋白。在任何情况下,融合蛋白可包含两个感兴趣亚基之间的接头(即酶和功能结构域之间或衔接蛋白和功能结构域之间)。因此,在一些实施方式中,Cpf1效应蛋白或衔接蛋白通过与功能结构域结合而与其相关联。在其他实施方式中,Cpf1效应蛋白或衔接蛋白与功能结构域相关联,因为两者融合在一起,任选地通过中间接头。
功能结构域或融合蛋白的附着可以通过接头,例如柔性甘氨酸-丝氨酸(GlyGlyGlySer)或(GGGS)3或刚性α-螺旋接头,例如(Ala(GluAlaAlaAlaLys)Ala)。接头例如(GGGGS)3优选用于分开蛋白质或肽结构域。优选(GGGGS)3,因为它是相对长的接头(15个氨基酸)。甘氨酸残基是最灵活的,并且丝氨酸残基增加了接头位于蛋白质外部的可能性。(GGGGS)6(GGGGS)9或(GGGGS)12可以优选用作替代物。其他优选的替代物是(GGGGS)1、(GGGGS)2、(GGGGS)4、(GGGGS)5、(GGGGS)7、(GGGGS)8、(GGGGS)10或(GGGGS)11。可以使用替代接头,但高度灵活的接头被认为是最有效的,其允许Cpf1的2个部分最大限度地聚集在一起,从而重构Cpf1活性。一种替代方式在于核质蛋白的NLS可以用作接头。例如,也可以在Cpf1和任何功能结构域之间使用接头。同样,本文可以使用(GGGGS)3接头(或者6、9或12个重复的版本),或者核质蛋白的NLS可以用作Cas9和功能结构域之间的接头。
Cpf1效应蛋白复合物可用于非动物生物,例如植物、藻类、真菌、酵母等
Cpf1效应蛋白系统(例如,单个或多重)可以与作物基因组学的最新进展结合使用。本文描述的系统可用于执行有效且成本可负担的植物基因或基因组询问或编辑或操作——例如,用于快速调查和/或选择和/或询问和/或比较和/或操作和/或转化植物基因或基因组;例如,创建、鉴定、开发、优化或赋予植物性状或特征或转化植物基因组。因此可以改善植物、具有新性状或特征组合的新植物或具有增强的性状的新植物的生产。Cpf1效应子蛋白质系统可用于定点整合(SDI)或基因编辑(GE)或任何近反向育种(NRB)或反向育种(RB)技术中的植物。利用本文所述的Cpf1效应蛋白系统的方面可以类似于在植物中使用CRISPR-Cas(例如,CRISPR-Cas9)系统,并且提及亚利桑那大学网站“CRISPR-PLANT”(http://www.genome.arizona.edu/crispr/)(由宾夕法尼亚州立大学和AGI支持)。本发明的实施方式可用于植物中的基因组编辑或先前已使用RNAi或类似的基因组编辑技术的地方;参见,例如,Nekrasov,“Plant genome editing made easy:targeted mutagenesis inmodel and crop plants using the CRISPR-Cas system,”Plant Methods 2013,9:39(doi:10.1186/1746-4811-9-39);Brooks,“Efficient gene editing in tomato in thefirst generation using the CRISPR-Cas9system,”Plant Physiology September2014pp 114.247577;Shan,“Targeted genome modification of crop plants using aCRISPR-Cas system,”Nature Biotechnology 31,686-688(2013);Feng,“Efficientgenome editing in plants using a CRISPR/Cas system,”Cell Research(2013)23:1229–1232.doi:10.1038/cr.2013.114;published online 20August 2013;Xie,“RNA-guided genome editing in plants using a CRISPR-Cas system,”Mol Plant.2013Nov;6(6):1975-83.doi:10.1093/mp/sst119.Epub 2013Aug 17;Xu,“Gene targeting usingthe Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice,”Rice 2014,7:5(2014),Zhou等,“Exploiting SNPs for biallelic CRISPR mutations in theoutcrossing woody perennial Populus reveals 4-coumarate:CoA ligasespecificity and Redundancy,”New Phytologist(2015)(Forum)1-4(available onlineonly at www.newphytologist.com);Caliando等,“Targeted DNA degradation using aCRISPR device stably carried in the host genome,NATURE COMMUNICATIONS 6:6989,DOI:10.1038/ncomms7989,www.nature.com/naturecommunications DOI:10.1038/ncomms7989;美国专利号6,603,061-Agrobacterium-Mediated Plant TransformationMethod;美国专利号7,868,149-Plant Genome Sequences and Uses Thereof和US 2009/0100536-Transgenic Plants with Enhanced Agronomic Traits,这些文献的每一项的全部内容和公开均通过引用整体并入本文。在本发明的实践中,Morrell等“Crop genomics:advances and applications,”Nat Rev Genet.2011Dec 29;13(2):85-96的内容和公开内容;这些中的每一项都通过引用并入本文,包括本文的实施方式可以如何用于植物。因此,除非另有说明,否则本文提及的动物细胞也可适用、比照适用于植物细胞;并且,本文中具有降低的脱靶效应的酶和使用这种酶的系统可用于植物应用,包括本文提到的那些。
Cpf1-CRISPR系统对植物和酵母的应用
定义:
通常,术语“植物”涉及通过细胞分裂而特征性地生长的植物界的任何各种光合作用的、真核的、单细胞的或多细胞的生物,含有叶绿体,并且具有由纤维素组成的细胞壁。术语植物包括单子叶植物和双子叶植物。具体而言,植物旨在包括但不限于被子植物和裸子植物,例如金合欢、苜蓿、苋菜、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、布鲁塞尔的豆芽、白菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷物、芹菜、板栗、樱桃、大白菜、柑橘、克莱门汀、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、莴苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、花生、地面樱桃、胶铁杉、山核桃、羽衣甘蓝、猕猴桃、大头菜、落叶松、生菜、韭菜、柠檬、石灰、蝗虫、松、掌叶铁线蕨、玉米、芒果、枫树、甜瓜、小米、蘑菇、芥末、坚果、橡树、燕麦、油棕榈、秋葵、洋葱、橙子、观赏植物或花或树、木瓜、棕榈、欧芹、欧洲防风草、豌豆、桃、花生、梨、泥炭、胡椒、柿子、木豆、松、菠萝、车前草、李子、石榴、土豆、南瓜、菊苣、萝卜、油菜、覆盆子、大米、黑麦、高粱、红花、淡黄色、大豆、菠菜、云杉、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、西红柿、树木、小黑麦、草坪草、萝卜、藤、核桃、豆瓣菜、西瓜、小麦、山药、红豆杉和西葫芦。术语植物还包括藻类,其主要是光合自养生物,主要通过缺乏根、叶和其他表征高等植物的器官而统一。
使用本文所述的Cpf1系统进行基因组编辑的方法可用于赋予基本上任何植物所需的性状。通过使用本公开的核酸构建体和上述各种转化方法,多种植物和植物细胞系统可以被工程化以获得本文所述的期望的生理学和农艺学特征。在优选的实施方式中,用于工程化的感兴趣的植物和植物细胞包括但不限于那些单子叶和双子叶植物,例如作物,包括谷类作物(例如小麦、玉米、水稻、小米、大麦),水果作物(例如西红柿、苹果、梨、草莓、橙子),饲料作物(例如苜蓿),根茎类蔬菜作物(例如胡萝卜土豆、甜菜、山药),绿叶蔬菜作物(例如莴苣、菠菜);开花植物(例如矮牵牛、玫瑰、菊花),针叶树和松树(例如松树、云杉),用于植物修复的植物(例如重金属积累植物);油料作物(例如向日葵、油菜籽)和用于实验目的植物(例如拟南芥)。因此,该方法和CRISPR-Cas系统可用于广泛的植物,例如属于以下目的双子叶植物:Magniolales,Illiciales,Laurales,Piperales,Aristochiales,Nymphaeales,Ranunculales,Papeverales,Sarraceniaceae,Trochodendrales,Hamamelidales,Eucomiales,Leitneriales,Myricales,Fagales,Casuarinales,Caryophyllales,Batales,Polygonales,Plumbaginales,Dilleniales,Theales,Malvales,Urticales,Lecythidales,Violales,Salicales,Capparales,Ericales,Diapensales,Ebenales,Primulales,Rosales,Fabales,Podostemales,Haloragales,Myrtales,Cornales,Proteales,San tales,Rafflesiales,Celastrales,Euphorbiales,Rhamnales,Sapindales,Juglandales,Geraniales,Polygalales,Umbellales,Gentianales,Polemoniales,Lamiales,Plantaginales,Scrophulariales,Campanulales,Rubiales,Dipsacales和Asterales;这些方法和CRISPR-Cas系统可以与单子叶植物一起使用,例如属于以下目的那些:Alismatales,Hydrocharitales,Najadales,Triuridales,Commelinales,Eriocaulales,Restionales,Poales,Juncales,Cyperales,Typhales,Bromeliales,Zingiberales,Arecales,Cyclanthales,Pandanales,Arales,Lilliales和Orchid ales,或属于Gymnospermae的植物,例如属于以下目的那些:Pinales,Ginkgoales,Cycadales,Araucariales,Cupressales和Gnetales。
本文所述的Cpf1 CRISPR系统和使用方法可用于广泛的植物物种,包括在下文的双子叶植物、单子叶植物或裸子植物属的非限制性列表中:Atropa,Alseodaphne,Anacardium,Arachis,Beilschmiedia,甘蓝,红花,Cocculus,巴豆,黄瓜,柑橘,Citrullus,辣椒,长春花,科科斯,Coffea,南瓜,Daucus,Duguetia,Eschscholzia,榕,草莓,Glaucium,甘氨酸,Gossypium,Helianthus,橡胶树,Hyoscyamus,Lactuca,Landolphia,Linum,Litsea,Lycopersicon,Lupinus,,Manihot,Majorana,Malus,Medicago,Nicotiana,Olea,Parthenium,Papaver,Persea,菜豆,Pistacia,Pisum,Pyrus,Prunus,Raphanus,Ricinus,千里光,Sinomenium,Stephania,Sinapis,Solanum,Theobroma,Trifolium,Trigonella,Vicia,Vinca,Vilis和Vigna;和属Allium,Andropogon,Aragrostis,芦笋,燕麦,Cynodon,Elaeis,Festuca,Festulolium,Heterocallis,Hordeum,浮萍,Lolium,Musa,Oryza,Panicum,Pannesetum,Phleum,Poa,Secale,高粱,Triticum,玉米,冷杉,Cunninghamia,Ephedra,Picea,Pinus和Pseudotsuga。
Cpf1 CRISPR系统和使用方法也可用于广泛的“藻类”或“藻类细胞”;包括例如选自多种真核门的藻类,包括红藻(红藻),绿藻(绿藻),褐藻(硅藻),硅藻(硅藻),鞭毛藻和甲藻以及原核门蓝藻(蓝绿藻)。术语“藻类”包括例如选自以下的藻类:Amphora,Anabaena,Anikstrodesmis,Botryococcus,Chaetoceros,Chlamydomonas,Chlorella,Chlorococcum,Cyclotella,Cylindrotheca,Dunaliella,Emiliana,Euglena,Hematococcus,Isochrysis,Monochrysis,Monoraphidium,Nannochloris,Nannnochloropsis,Navicula,Nephrochloris,Nephroselmis,Nitzschia,Nodularia,Nostoc,Oochromonas,Oocystis,Oscillartoria,Pavlova,Phaeodactylum,Playtmonas,Pleurochrysis,Porhyra,Pseudoanabaena,Pyramimonas,Stichococcus,Synechococcus,Synechocystis,Tetraselmis,Thalassiosira和Trichodesmium。
可以根据本发明的方法处理植物的一部分,即“植物组织”,以产生改良的植物。植物组织还包括植物细胞。如本文所用的术语“植物细胞”是指活体植物的个体单位,在完整的整株植物中或在体外组织培养物中生长的分离形式,在培养基或琼脂上,在生长培养基或缓冲液中悬浮或作为更高组织的单元的一部分,例如植物组织,植物器官或整株植物。
“原生质体”是指使用例如机械或酶的方法完全或部分除去其保护性细胞壁的植物细胞,从而产生活植物的完整生物化学感受态单元,其可以在适当的生长条件下重建其细胞壁、增殖并且再生成长为整个植物。
术语“转化”广泛地指通过借助于农杆菌或多种化学或物理方法之一导入DNA来对植物宿主进行遗传修饰的过程。如本文所用,术语“植物宿主”是指植物,包括植物的任何细胞、组织、器官或后代。可转化许多合适的植物组织或植物细胞,包括但不限于原生质体、体细胞胚、花粉、叶、幼苗、茎、愈伤组织、匍匐茎、微块茎和枝条。植物组织还指这种植物、种子、后代、繁殖体的任何克隆,无论是有性还是无性生成,以及任何这些的后代,例如插条或种子。
如本文所用的术语“转化的”是指其中已经导入了外源DNA分子(例如构建体)的细胞、组织、器官或生物体。导入的DNA分子可以整合到受体细胞、组织、器官或生物体的基因组DNA中,使得导入的DNA分子传递给随后的后代。在这些实施方式中,“转化的”或“转基因的”细胞或植物还可以包括细胞或植物的后代和由育种程序产生的后代,所述育种程序使用这样的转化植物作为杂交亲本并且表现出由导入的DNA分子的存在而产生的改变的表型。优选地,转基因植物是可育的并且能够通过有性繁殖将导入的DNA传递给后代。
术语“后代”,例如转基因植物的后代,是由植物或转基因植物出生、产生或衍生的后代。导入的DNA分子也可以瞬时导入受体细胞,使得导入的DNA分子不被之后的后代继承,因此不被认为是“转基因的”。因此,如本文所用,“非转基因的”植物或植物细胞是不含稳定整合到其基因组中的外源DNA的植物。
如本文所用的术语“植物启动子”是能够在植物细胞中起始转录的启动子,无论其来源是否是植物细胞。示例性的合适的植物启动子包括但不限于从植物、植物病毒和细菌例如农杆菌或根瘤菌获得的那些,其包含在植物细胞中表达的基因。
如本文所用,“真菌细胞”是指真菌界内的任何类型的真核细胞。真菌界内的门包括子囊菌,担子菌,Blastocladiomycota,Chytridiomycota,Glomeromycota,Microsporidia和Neocallimastigomycota。真菌细胞可包括酵母、霉菌和丝状真菌。在一些实施方式中,真菌细胞是酵母细胞。
如本文所用,术语“酵母细胞”是指子囊菌门(Ascomycota)和担子菌门(Basidiomycota)内的任何真菌细胞。酵母细胞可包括出芽酵母细胞、裂殖酵母细胞和霉菌细胞。不限于这些生物,在实验室和工业环境中使用的许多类型的酵母是子囊菌门的一部分。在一些实施方式中,酵母细胞是酿酒酵母(S.cerervisiae)、马克斯克鲁维酵母(Kluyveromyces marxianus)或Issatchenkia orientalis细胞。其他酵母细胞可以包括但不限于念珠菌属(例如,白色念珠菌)、耶氏酵母属(例如,Yarrowia lipolytica)、毕赤酵母属(例如,Pichia pastoris)、克鲁维酵母属(例如,乳酸克鲁维酵母和马克斯克鲁维酵母)、脉孢菌属(Neurospora spp.)(例如,粗糙脉孢菌(Neurospora crassa))、镰刀菌属(Fusarium spp.)(例如,Fusarium oxysporum)和Issatchenkia spp.(例如,Issatchenkiaorientalis,又名Pichia kudriavzevii和Candida acidothermophilum)。在一些实施方式中,真菌细胞是丝状真菌细胞。如本文所用,术语“丝状真菌细胞”是指生长成细丝(即菌丝或菌丝体)的任何类型的真菌细胞。丝状真菌细胞的实例可包括但不限于曲霉属(Aspergillus spp.)(例如,黑曲霉(Aspergillus niger))、木霉属(Trichoderma spp.)(例如,里氏木霉(Trichoderma reesei))、Rhizopus spp.(例如,Rhizopus oryzae)和Mortierella spp.(例如,Mortierella isabellina)。
在一些实施方式中,真菌细胞是工业菌株。如本文所用,“工业菌株”是指在工业过程(例如,以商业或工业规模生产产品)中使用或从工业过程中分离的任何真菌细胞菌株。工业菌株可以指通常用于工业过程的真菌物种,或者它可以指也可以用于非工业目的(例如,实验室研究)的真菌物种的分离物。工业过程的实例可包括发酵(例如,在食品或饮料产品的生产中)、蒸馏、生物燃料生产、化合物的生产和多肽的生产。工业菌株的实例可包括但不限于JAY270和ATCC4124。
在一些实施方式中,真菌细胞是多倍体细胞。如本文所用,“多倍体”细胞可以指其基因组以多于一个拷贝存在的任何细胞。多倍体细胞可以指天然发现为多倍体状态的细胞类型,或者它可以指已经被诱导以多倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活或改良减数分裂、胞质分裂或DNA复制)。多倍体细胞可以指整个基因组是多倍体的细胞,或者它可以指在特定的感兴趣基因组基因座中是多倍体的细胞。不希望受理论束缚,据信指导RNA的丰度相对于单倍体细胞更可能是多倍体细胞的基因组工程中的限速成分,因此使用本文所述的Cpf1 CRISPR系统的方法可以利用使用某种真菌细胞类型。
在一些实施方式中,真菌细胞是二倍体细胞。如本文所用,“二倍体”细胞可以指其基因组以两个拷贝存在的任何细胞。二倍体细胞可以指天然发现为二倍体状态的细胞类型,或者它可以指已经被诱导以二倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活或改良减数分裂、胞质分裂或DNA复制)。例如,酿酒酵母菌株S228C可以维持在单倍体或二倍体状态。二倍体细胞可以指整个基因组是二倍体的细胞,或者它可以指在特定的基因组基因座中是二倍体的细胞。在一些实施方式中,真菌细胞是单倍体细胞。如本文所用,“单倍体”细胞可以指其基因组以一个拷贝存在的任何细胞。单倍体细胞可以指天然发现为单倍体状态的细胞类型,或者它可以指已经被诱导以单倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活或改良减数分裂、胞质分裂或DNA复制)。例如,酿酒酵母菌株S228C可以维持在单倍体或二倍体状态。单倍体细胞可以指整个基因组是单倍体的细胞,或者它可以指在特定的感兴趣基因组基因座中是单倍体的细胞。
如本文所用,“酵母表达载体”是指含有一种或多种编码RNA和/或多肽的序列的核酸,并且可以进一步含有控制核酸表达的任何所需元件,以及能够在酵母细胞内复制和维持表达载体的任何元件。很多合适的酵母表达载体及其特征是本领域已知的;例如,在Yeast Protocols,2nd edition,Xiao,W.,ed.(Humana Press,New York,2007)andBuckholz,R.G.and Gleeson,M.A.(1991)Biotechnology(NY)9(11):1067-72中描述了各种载体和技术。酵母载体可以包含但不限于着丝粒(CEN)序列、自主复制序列(ARS)、可操作地连接至感兴趣的序列或基因的启动子(例如,RNA聚合酶III启动子)、终止子(例如RNA聚合酶III终止子)、复制起始子和标志物基因(例如,营养缺陷型、抗生素或其他选择标志物)。用于酵母的表达载体的实例可包括质粒、酵母人工染色体、2μ质粒、酵母整合质粒、酵母复制质粒、穿梭载体和附加型质粒。
在植物和植物细胞的基因组中稳定整合Cpf1 CRISPR系统组分
在特定的实施方式中,设想导入编码Cpf1 CRISPR系统的组分的多核苷酸以稳定整合到植物细胞的基因组中。在这些实施方式中,转化载体或表达系统的设计可以根据指导RNA和/或Cpf1基因表达的时间、地点和条件进行调整。
在特定的实施方式中,设想将Cpf1 CRISPR系统的组分稳定地导入植物细胞的基因组DNA中。另外地或替代地,设想将Cpf1 CRISPR系统的组分导入以稳定整合到植物细胞器的DNA中,例如但不限于质体、线粒体或叶绿体。
用于稳定整合到植物细胞基因组中的表达系统可含有一种或多种以下元件:可用于在植物细胞中表达指导RNA和/或Cpf1酶的启动子元件;5’非翻译区以增强表达;内含子元件以进一步增强某些细胞(例如单子叶细胞)中的表达;多克隆位点以提供方便的限制性位点用于插入指导RNA和/或Cpf1基因序列和其他期望元件;和3’非翻译区以提供表达的转录物的有效终止。
表达系统的元件可以在一个或多个表达构建体上,所述表达构建体是环状的,例如质粒或转化载体,或非环状的,例如线性双链DNA。
在特定的实施方式中,Cfp1CRISPR表达系统至少包括:
(a)编码与植物中的靶序列杂交的指导RNA(gRNA)的核苷酸序列,并且其中指导RNA包含指导序列和直接重复序列,和
(b)编码Cpf1蛋白的核苷酸序列,
其中组分(a)或(b)位于相同或不同的构建体上,并且由此不同的核苷酸序列可以在植物细胞中相同或不同的可操作调控元件的控制下。
可以通过各种常规技术将含有Cpf1 CRISPR系统的组分和(适用时)模板序列的一个或多个DNA构建体导入植物、植物部分或植物细胞的基因组中。该过程通常包括如下步骤:选择合适的宿主细胞或宿主组织,将构建体导入至宿主细胞或宿主组织,以及从其再生植物细胞或植物。
在特定的实施方式中,可以使用例如但不限于电穿孔、显微注射,植物细胞原生质体的气溶胶束注射的技术将DNA构建体导入植物细胞中,或者可以使用基因枪方法(例如作为DNA粒子轰击(还参见Fu等,Transgenic Res.2000Feb;9(1):11-9))将DNA构建体直接导入植物组织。粒子轰击的基础是朝向细胞加速包覆感兴趣的基因的颗粒,导致颗粒穿透原生质体并且通常稳定地整合到基因组中(参见,例如,Klein等,Nature(1987),Klein etah,Bio/Technology(1992),Casas et ah,Proc.Natl.Acad.Sci.USA(1993))。
在特定的实施方式中,可以通过农杆菌介导的转化将含有Cpf1CRISPR系统的组分的DNA构建体导入植物中。DNA构建体可以与合适的T-DNA侧翼区组合,并导入常规的根癌农杆菌(Agrobacterhmi tumefaciens)宿主载体中。可以通过感染植物或通过将植物原生质体与含有一种或多种Ti(肿瘤诱导)质粒的农杆菌细菌孵育,将外源DNA引入植物的基因组中(参见,例如,Fraley等,(1985),Rogers等,(1987)and U.S.Pat.No.5,563,055)。
植物启动子
为了确保在植物细胞中的适当表达,本文所述的Cpf1 CRISPR系统的组分通常置于植物启动子(即在植物细胞中可操作的启动子)的控制下。设想使用不同类型的启动子。
组成型植物启动子是能够在植物的所有或几乎所有发育阶段期间在所有或几乎所有植物组织中表达其控制的开放阅读框(ORF)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35S启动子。“受调节的启动子”是指不是以组成型而是以时间和/或空间调节的方式引导基因表达的启动子,并且包括组织特异性、组织优选和诱导型启动子。不同的启动子可以引导在不同组织或细胞类型中的,或在不同发育阶段处的,或响应于不同环境条件的基因表达。在特定的实施方式中,一种或多种Cpf1CRISPR组分在组成型启动子(例如,花椰菜花叶病毒35S启动子)的控制下表达。组织优选的启动子可用于靶向特定植物组织内某些细胞类型的增强表达,例如叶子或根中的维管细胞或种子的特定细胞中。用于Cpf1 CRISPR系统的特定启动子的实例见于Kawamata等,(1997)Plant Cell Physiol 38:792-803;Yamamoto等,(1997)Plant J 12:255-65;Hire等,(1992)Plant Mol Biol 20:207-18,Kuster等,(1995)Plant Mol Biol 29:759-72,andCapana等,(1994)Plant Mol Biol 25:681-91。
可诱导的并且允许基因编辑或基因表达的时空控制的启动子的实例可以使用能量形式。能量形式可包括但不限于声能、电磁辐射、化学能和/或热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)、或光诱导型系统(光敏色素,LOV结构域或隐花色素),例如,以序列特异性的方式引导转录活性变化的光诱导型转录效应子(LITE)。光诱导型系统的组分可包括Cpf1 CRISPR酶、光响应性细胞色素异源二聚体(例如来自拟南芥)和转录激活/抑制结构域。诱导型DNA结合蛋白的其他实例及其使用方法在US 61/736465和US 61/721,283中提供,其通过整体引用并入本文。
在特定的实施方式中,瞬时或诱导型表达可以通过使用例如化学调节的启动子来实现,即由此外源化学物质的应用诱导基因表达。基因表达的调节也可以通过化学抑制型启动子获得,其中化学物质的应用抑制基因表达。化学诱导型启动子包括但不限于由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等,(1997)Plant Cell Physiol38:568-77)、由用作芽前除草剂的疏水亲电子化合物激活的玉米GST启动子(GST-U-27,W093/01294)和由水杨酸激活的烟草PR-1a启动子(Ono等,(2004)Biosci BiotechnolBiochem 68:803-7)。受抗生素调节的启动子,例如四环素诱导型和四环素抑制型启动子(Gatz等,(1991)Mol Gen Genet 227:229-37;U.S.Patent Nos.5,814,618and 5,789,156)也可用于本文。
在特定植物细胞器中易位和/或表达
表达系统可包含用于在特定植物细胞器中易位和/或表达的元件。
叶绿体靶向
在特定的实施方式中,设想CRISPR-Cas系统用于特异性修饰叶绿体基因或确保在叶绿体中表达。出于该目的,使用叶绿体转化方法或将Cpf1 CRISPR组分区隔至叶绿体。例如,在质体基因组中导入遗传修饰可以减少生物安全性问题,例如通过花粉的基因流动。
叶绿体转化的方法是本领域已知的,包括粒子轰击、PEG处理和显微注射。另外,如WO2010061186中所述,可以使用涉及将转化盒从核基因组易位至质体的方法。
可替代地,设想将一种或多种Cpf1 CRISPR组分靶向至植物叶绿体。这通过在表达构建体中整合到编码叶绿体转运肽(CTP)或质体转运肽的序列来实现,所述序列可操作地连接至编码Cpf1 CRISPR蛋白的序列的5’区。在易位到叶绿体中的过程中,CTP被除去。表达蛋白的叶绿体靶向是本领域技术人员熟知的(参见例如Protein Transport intoChloroplasts,2010,Annual Review of Plant Biology,Vol.61:157-180)。在这样的实施方式中,还期望将指导RNA靶向至植物叶绿体。可用于通过叶绿体定位序列将指导RNA易位到叶绿体中的方法和构建体描述于例如US 20040142476中,其通过引用并入本文。这些构建体的变体可以整合到本发明的表达系统中,以有效地易位Cpf1 CRISPR-指导RNA。
在藻类细胞中导入编码CRISPR-Cpf1靶向系统的多核苷酸。
转基因藻类(或其他植物例如油菜)可特别用于植物油或生物燃料例如醇(尤其是甲醇和乙醇)或其他产品的生产。这些可以被设计成表达或过表达高含量的油或醇以用于石油或生物燃料工业。
US 8945839描述了使用Cas9工程化微藻(莱茵衣藻(Chlamydomonasreinhardtii)细胞)种)的方法。使用类似的工具,本文描述的Cpf1 CRISPR系统的方法可以应用于衣藻的种和其他藻类。在特定的实施方式中,将Cpf1和指导RNA导入藻类中,使用在组成型启动子例如Hsp70A-Rbc S2或β2-微管蛋白的控制下表达Cpf1的载体来表达。任选地使用含有T7启动子的载体递送指导RNA。或者,可以将Cpf1mRNA和体外转录的指导RNA递送至藻类细胞。电穿孔方案是技术人员可得的,例如来自GeneArt ChlamydomonasEngineering kit的标准推荐方案。
在特定的实施方式中,本文使用的核酸内切酶是分裂Cpf1酶。如在WO2015086795中针对Cpf1所描述的,分裂Cpf1酶优选在藻类中用于靶基因组修饰。Cpf1分裂系统的使用特别适用于在藻类细胞中基因组靶向的诱导方法并且避免Cpf1过表达的潜在毒性作用。在特定的实施方式中,可以将Cpf1分裂结构域(RuvC和HNH结构域)同时或依次导入细胞中,使得分裂Cpf1结构域处理藻类细胞中的靶核酸序列。与野生型Cpf1相比,分裂Cpf1的尺寸减小允许用其他方法将CRISPR系统递送至细胞,例如使用本文所述的细胞穿透肽。对于产生经遗传修饰的藻类,该方法令人特别感兴趣。
在酵母细胞中导入编码Cpf1组分的多核苷酸
在特定的实施方式中,本发明涉及Cpf1 CRISPR系统在酵母细胞中用于基因组编辑的用途。可以用于导入编码Cpf1 CRISPR系统组分的多核苷酸的转化酵母细胞的方法是技术人员所公知的,并且通过Kawai等,2010,Bioeng Bugs.2010Nov-Dec;1(6):395–403综述。非限制性实例包括通过乙酸锂处理(其可进一步包括载体DNA和PEG处理)、轰击或通过电穿孔转化酵母细胞。
在植物和植物细胞中Cpf1CRISP系统组分的瞬时表达
在特定的实施方式中,设想指导RNA和/或Cpf1基因在植物细胞中瞬时表达。在这些实施方式中,Cpf1 CRISPR系统仅在指导RNA和Cpf1蛋白存在于细胞中时才能确保靶基因的修饰,从而可以进一步控制基因组修饰。由于Cpf1酶的表达是瞬时的,从这种植物细胞再生的植物通常不含外源DNA。在特定的实施方式中,Cpf1酶由植物细胞稳定表达,并且指导序列被瞬时表达。
在特定的实施方式中,可以使用植物病毒载体将Cpf1 CRISPR系统组分导入植物细胞中(Scholthof等1996,Annu Rev Phytopathol.1996;34:299-323)。在其他特定的实施方式中,病毒载体是来自DNA病毒的载体。例如,双粒病毒(例如,卷心菜叶卷曲病毒、豆黄矮病毒、小麦矮化病毒、西红柿叶卷曲病毒、玉米条纹病毒、烟草叶卷曲病毒或西红柿金花叶病毒)或纳米病毒(例如,蚕豆坏死黄色病毒)。在其他特定的实施方式中,病毒载体是来自RNA病毒的载体。例如,tobravirus(例如,烟草拨浪鼓病毒、烟草花叶病毒),potexvirus(例如,马铃薯病毒X)或hordeivirus(例如,大麦条纹花叶病毒)。植物病毒的复制基因组是非整合性载体。
在特定的实施方式中,用于瞬时表达Cpf1 CRISPR构建体的载体是例如pEAQ载体,其适合于在原生质体中农杆菌介导的瞬时表达(Sainsbury F.等,Plant Biotechnol J.2009Sep;7(7):682-93)。使用修饰的甘蓝叶卷曲病毒(CaLCuV)载体在表达CRISPR酶的稳定转基因植物中表达gRNA,证实基因组位置的精确靶向(Scientific Reports 5,Articlenumber:14926(2015),doi:10.1038/srepl4926)。
在特定的实施方式中,可以将编码指导RNA和/或Cpf1基因的双链DNA片段瞬时导入至植物细胞中。在这些实施方式中,提供足量的导入的双链DNA片段以修饰细胞,但在预期的一段时间后或在一次或多次细胞分裂后不会持续存在。植物中直接DNA转移的方法是本领域技术人员已知的(参见,例如,Davey等Plant Mol Biol.1989Sep;13(3):273-85)。
在其他的实施方式中,将编码Cpf1蛋白的RNA多核苷酸导入植物细胞中,然后由宿主细胞翻译和加工,产生足够量的蛋白质以修饰细胞(存在至少一种指导RNA),但在预期的一段时间后或在一次或多次细胞分裂后不会持续存在。用于将mRNA导入植物原生质体以瞬时表达的方法是本领域技术人员已知的(参见,例如,Gallie,Plant Cell Reports(1993),13;119-122)。
还设想了上述不同方法的组合。
将Cpf1 CRISPR组分递送至植物细胞
在特定的实施方式中,令人感兴趣的是将Cpf1 CRISPR系统的一种或多种组分直接递送至植物细胞。这对于非转基因植物的产生是尤其有意义的(见下文)。在特定的实施方式中,一种或多种Cpf1组分在植物或植物细胞外制备并递送至细胞。例如,在特定实施方式中,Cpf1蛋白在导入植物细胞之前在体外制备。Cpf1蛋白可通过本领域技术人员已知的各种方法制备,包括重组生产。表达后,对Cpf1蛋白进行分离、重折叠(如果需要)、纯化并任选地处理以除去任何纯化标签,例如His标签。一旦获得粗制的、部分纯化的或更完全纯化的Cpf1蛋白,就可以将所述蛋白导入植物细胞中。
在特定的实施方式中,将Cpf1蛋白与靶向感兴趣基因的指导RNA混合以形成预组装的核糖核蛋白。
可以通过电穿孔、通过被Cpf1相关基因产物包被的颗粒进行轰击、通过化学转染或通过细胞膜的一些其他转运方式将个体组分或预组装的核糖核蛋白导入植物细胞中。例如,已经证实用预组装的CRISPR核糖核蛋白转染植物原生质体确保了植物基因组的靶向修饰(如Woo等Nature Biotechnology,2015;DOI:10.1038/nbt.3389所述)。
在特定的实施方式中,使用纳米颗粒将Cpf1 CRISPR系统组分导入植物细胞中。可以将作为蛋白质或核酸或其组合的组分加载到纳米颗粒上或包装在纳米颗粒中并应用于植物(例如描述于WO 2008042156和US 20130185823中)。特别是,如WO2015089419中所述,本发明的实施方式包括上载或包装编码Cpf1蛋白的DNA分子、编码指导RNA的DNA分子和/或分离的指导RNA的纳米颗粒。
将Cpf1 CRISPR系统的一种或多种组分导入植物细胞的其他方法是使用细胞穿透肽(CPP)。因此,本发明的特定的实施方式包括含有与Cpf1蛋白连接的细胞穿透肽的组合物。在本发明的特定的实施方式中,Cpf1蛋白和/或指导RNA与一种或多种CPP偶联以有效地将它们转运到植物原生质体内,还参见Ramakrishna(20140Genome Res.2014Jun;24(6):1020-7for Cpf1 in human cells)。在其他的实施方式中,Cpf1基因和/或指导RNA由一种或多种环状或非环状DNA分子编码,所述DNA分子偶联至一种或多种用于植物原生质体递送的CPP。然后将植物原生质体再生成植物细胞并进一步再生植物。CPP通常被描述为少于35个氨基酸的短肽,其源自蛋白质或来自能够以受体非依赖性方式跨细胞膜转运生物分子的嵌合序列。CPP可以是阳离子肽、具有疏水序列的肽、两亲性肽、具有富含脯氨酸和抗微生物序列的肽,以及嵌合或二分肽(Pooga和Langel 2005)。CPP能够穿透生物膜并因此触发各种生物分子移动穿过细胞膜进入细胞质并改善其细胞内途径,从而促进生物分子与靶标的相互作用。CPP的实例包括:Tat(HIV1型病毒复制所需的核转录激活蛋白)、穿透蛋白、Kaposi成纤维细胞生长因子(FGF)信号肽序列、整联蛋白β3信号肽序列;多精氨酸多肽Args序列、富含鸟嘌呤的分子转运蛋白、甜箭肽等。
使用Cpf1 CRISPR系统制备经遗传修饰的非转基因植物
在特定的实施方式中,本文所述的方法用于修饰内源基因或修饰它们的表达而不永久将任何外源基因(包括编码CRISPR组分的那些)导入植物的基因组,从而避免在植物基因组中存在外源DNA。这可以是令人感兴趣的,因为非转基因植物的监管要求不那么严格。
在特定的实施方式中,这通过Cpf1 CRISPR组分的瞬时表达来确保。在特定的实施方式中,一种或多种CRISPR组分在一种或多种病毒载体上表达,所述病毒载体产生足够的Cpf1蛋白和指导RNA以始终如一地稳定地确保根据本文所述的方法修饰感兴趣的基因。
在特定的实施方式中,CPF1CRISPR构建体的瞬时表达确保是在植物原生质体中,从而不整合到基因组中。有限的表达窗口可足以使Cpf1 CRISPR系统确保本文所述的靶基因的修饰。
在特定的实施方式中,CPF1 CRISPR系统的不同组分在递送分子的颗粒(例如如本文以上所述的纳米颗粒或CPP分子)的辅助下,单独或混合地导入植物细胞、原生质体或植物组织中。
通过本文所述的Cpf1核酸酶的直接活性和任选的导入模板DNA或通过使用Cpf1CRISPR靶向的基因修饰,Cpf1 CRISPR组分的表达可诱导基因组的靶向修饰。上文描述的不同策略允许Cpf1介导的靶向基因组编辑,而不需要将Cpf1 CRISPR组分导入植物基因组中。瞬时导入植物细胞的组分通常在杂交时除去。
检测植物基因组的修饰—选择标志物
在特定的实施方式中,其中方法涉及修饰植物基因组的内源靶基因,可以使用任何合适的方法在用Cpf1 CRISPR系统感染或转染植物、植物部分或植物细胞后确定是否在靶位点发生了基因靶向或靶诱变。在方法涉及导入转基因的情况下,可以通过选择或筛选工程化植物材料中转基因的存在或转基因编码的性状来鉴定和分离转化的植物细胞、愈伤组织、组织或植物。物理和生物化学方法可用于鉴定含有插入基因构建体或内源DNA修饰的植物或植物细胞转化体。这些方法包括但不限于:1)Southern分析或PCR扩增,用于检测和确定重组DNA插入或修饰的内源基因的结构;2)Northern印迹,S1RNase保护,引物延伸或逆转录酶-PCR扩增,用于检测和检查基因构建体的RNA转录物;3)用于检测酶或核酶活性的酶测定法,其中这样的基因产物由基因构建体编码或表达受遗传修饰的影响;4)蛋白质凝胶电泳,蛋白质印迹技术,免疫沉淀或酶联免疫测定,其中基因构建体或内源基因产物是蛋白质。其他技术,例如原位杂交、酶染色和免疫染色,也可用于检测重组构建体的存在或表达或检测特定植物器官和组织中内源基因的修饰。进行所有这些测定的方法是本领域技术人员公知的。
另外(或替代地),编码CPF1CRISPR组分的表达系统通常被设计为包含一个或多个可选择的或可检测的标志物,所述标志物提供在早期阶段和大规模下分离或有效选择包含和/或已被Cpf1 CRISPR系统修饰的细胞的手段。
在农杆菌介导的转化的情况下,标记盒可以邻近或在T-DNA边界侧翼之间和被包含在二元载体之间。在另一个实施方式中,标记盒可以在T-DNA之外。选择标记盒也可以在与表达盒相同的T-DNA边界内或附近,或者可以在二元载体(例如,2T-DNA系统)上的第二个T-DNA内的其他位置。
对于粒子轰击或原生质体与转化,表达系统可以包含一种或多种分离的线性片段,或者可以是可能含有细菌复制元件、细菌选择标志物或其它可检测元件的较大构建体的一部分。包含编码指导和/或Cpf1的多核苷酸的表达盒可以与标记盒物理连接,或者可以与编码标记盒的第二核酸分子混合。标记盒由表达允许有效选择转化细胞的可检测或可选择标志物的必需元件组成。
基于选择标志物选择细胞的程序将取决于标志物基因的性质。在特定的实施方式中,使用选择标志物,即允许基于标志物的表达直接选择细胞的标志物。选择标志物可以赋予阳性或阴性选择,并且对外部底物的存在是条件性的或非条件性的(Miki等2004,107(3):193–232)。最常见的是,抗生素或除草剂抗性基因用作标志物,其中通过在含有抑制量的抗生素或除草剂的培养基上生长工程化植物材料来进行选择,标志物基因赋予对所述抗生素或除草剂的抗性。这样的基因的实例是赋予对抗生素的抗性的基因,例如潮霉素(hpt)和卡那霉素(nptII),以及赋予对除草剂抗性的基因,如草丁膦(bar)和氯磺隆(als)。
转化的植物和植物细胞也可以通过筛选可见标志物的活性来鉴定,所述可见标志物通常是能够处理有色底物的酶(例如,β葡糖醛酸酶、荧光素酶,B或C1基因)。这种选择和筛选方法是本领域技术人员公知的。
植物培养和再生
在特定的实施方式中,可培养具有经修饰的基因组并且通过本文所述的任何方法产生或获得的植物细胞,以再生具有转化或修饰的基因型并因此具有期望表型的完整植物。常规再生技术是本领域技术人员公知的。这种再生技术的具体实例依赖于组织培养生长培养基中某些植物激素的操作,并且通常依赖于已与期望核苷酸序列一起导入的杀菌剂和/或除草剂标志物。在其他特定的实施方式中,从培养的原生质体、植物愈伤组织、外植体、器官、花粉、胚胎或其部分获得植物再生(参见,例如,Evans等(1983),Handbook ofPlant Cell Culture,Klee等(1987)Ann.Rev.of Plant Phys.)。
在特定的实施方式中,本文所述的转化或改良植物可以自花授粉而为本发明的纯合改良植物提供种子(对于DNA修饰,纯合)或与非转基因植物或不同改良植物杂交而为杂合植物提供种子。当将重组DNA导入植物细胞时,这种杂交所得植物是对于重组DNA分子是杂合的植物。通过从改良植物杂交并包含遗传修饰(可以是重组DNA)而获得的这种纯合和杂合植物在本文中称为“后代”。后代植物是来自原始转基因植物并且含有通过本文提供的方法导入的基因组修饰或重组DNA分子的植物。或者,可以通过上述方法之一使用Cfp1酶获得遗传修饰的植物,因而没有外源DNA引入基因组中。通过进一步育种获得的这样的植物的后代也可含有遗传修饰。通过任何常用于不同作物的育种方法进行繁殖(例如,Allard,Principles of Plant Breeding,John Wiley&Sons,NY,U.of CA,Davis,CA,50-98(1960)。
产生具有增强的农艺性状的植物
本文所提供的基于Cpf1的CRISPR系统可用于导入靶向的双链或单链断裂和/或导入基因激活子和或阻遏物系统,并且非限制性地可用于基因靶向、基因置换、定向诱变、靶向缺失或插入、靶向倒位和/或靶向易位。通过共同表达多个靶向RNA以在单个细胞中实现多重修饰,可以确保多重基因组修饰。该技术可用于具有改进特性的植物的高精度工程化,包括增强的营养质量、增加的抗病性和对生物和非生物胁迫的抗性,以及增加的商业上有价值的植物产品或异源化合物的产量。
在特定的实施方式中,本文所述的Cpf1 CRISPR系统用于将靶向的双链断裂(DSB)导入内源DNA序列中。DSB激活细胞DNA修复途径,其可以被利用在断裂位点附近实现期望DNA序列的修饰。这是令人感兴趣的,其中内源基因的失活可以赋予或促成期望的性状。在特定的实施方式中,在DSB位点促进与模板序列的同源重组,以导入感兴趣的基因。
在特定的实施方式中,Cpf1 CRISPR系统可以用作通用的核酸结合蛋白,其与用于激活和/或抑制内源植物基因的功能结构域融合或可操作地连接。示例性功能结构域可包括但不限于翻译起始子、翻译激活子、翻译阻遏物、核酸酶(特别是核糖核酸酶)、剪接体、珠子、光诱导/可控结构域或化学诱导/可控结构域。通常在这些实施方式中,Cpf1蛋白包含至少一个突变,使得其具有不超过5%的不具有所述至少一个突变的Cpf1蛋白的活性;指导RNA包含能够与靶序列杂交的指导序列。
本文所述的方法通常导致“改良植物”的产生,因为与野生型植物相比,它们具有一种或多种期望的性状。在特定的实施方式中,获得的植物、植物细胞或植物部分是转基因植物,其包含引入至植物全部或部分细胞的基因组中的外源DNA序列。在特定的实施方式中,获得非转基因的遗传修饰的植物、植物部分或细胞,因为没有外源DNA序列引入至植物的任何植物细胞的基因组中。在这样的实施方式中,改良植物是非转基因植物。只有在确保内源基因的修饰且在植物基因组中没有导入或维持外源基因的情况下,所得遗传修饰作物不含外源基因,并因此基本上可以认为是非转基因的。Cpf1 CRISPR系统用于植物基因组编辑的不同应用在下面更详细地描述:
a)导入一种或多种外源基因以赋予感兴趣的农业性状
本发明提供了基因编辑或修饰与感兴趣的靶基因座相关或感兴趣的靶基因座处的基因的方法,其中所述方法包括将Cpf1效应蛋白复合物导入植物细胞,由此Cpf1效应蛋白复合物有效地起作用以将DNA插入(例如,编码外源感兴趣基因)整合到植物细胞的基因组中。在优选的实施方式中,通过HR利用外源导入的DNA模板或修复模板促进DNA插入的整合。通常,外源导入的DNA模板或修复模板与Cpf1效应蛋白复合物或一种组分或多核苷酸载体一起递送,用于表达复合物的组分。
本文提供的Cpf1 CRISPR系统允许靶向基因递送。越来越清楚的是,表达感兴趣的基因的效率在很大程度上取决于整合到基因组中的位置。本方法允许外源基因靶向整合到基因组中的期望位置。可以基于先前生成的事件的信息来选择位置,或者可以通过本文其他地方公开的方法来选择位置。
在特定的实施方式中,本文提供的方法包括(a)向细胞中导入包含指导RNA的Cpf1CRISPR复合物,所述指导RNA包含直接重复序列和指导序列,其中指导序列杂交至植物细胞内源的靶序列;(b)当指导序列与靶序列杂交并在指导序列靶向的序列处或附近诱导双链断裂时,向植物细胞中导入与指导RNA复合的Cpf1效应分子;(c)向细胞中导入编码HDR修复模板的核苷酸序列,所述HDR修复模板编码感兴趣的基因并且由于HDR而被导入DS断裂的位置。在特定的实施方式中,导入步骤可以包括向植物细胞递送一种或多种编码Cpf1效应蛋白、指导RNA和修复模板的多核苷酸。在特定的实施方式中,通过DNA病毒(例如,双生病毒)或RNA病毒(例如,烟草脆裂病毒)将多核苷酸递送到细胞中。在特定的实施方式中,导入步骤包括向植物细胞递送含有一种或多种编码Cpf1效应蛋白、指导RNA和修复模板的多核苷酸序列的T-DNA,其中通过农杆菌递送。编码Cpf1效应蛋白的核酸序列可以与启动子可操作地连接,例如组成型启动子(例如,花椰菜花叶病毒35S启动子),或细胞特异性或诱导型启动子。在特定的实施方式中,通过微粒轰击导入多核苷酸。在特定的实施方式中,方法还包括在导入步骤后筛选植物细胞以确定是否已导入修复模板即感兴趣的基因。在特定的实施方式中,方法包括从植物细胞再生植物的步骤。在其他实施方式中,方法包括交叉繁殖植物以获得遗传上期望的植物谱系。下面列出了编码感兴趣性状的外源基因的实例。
b)编辑内源基因以赋予感兴趣的农业性状
本发明提供了基因编辑或修饰与感兴趣的靶基因座相关或感兴趣的靶基因座处的基因的方法,其中所述方法包括将Cpf1效应蛋白复合物导入植物细胞,由此Cpf1复合物修饰植物内源基因的表达。这可以以不同方式实现。在特定的实施方式中,期望消除内源基因的表达,并且Cpf1 CRISPR复合物用于靶向和切割内源基因以修饰基因表达。在这些实施方式中,本文提供的方法包括(a)向植物细胞中导入包含指导RNA的Cpf1 CRISPR复合物,所述指导RNA包含直接重复序列和指导序列,其中指导序列杂交至植物细胞基因组中感兴趣的基因内的靶序列;(b)向细胞中导入Cpf1效应蛋白,其在与指导RNA(包含与靶序列杂交的指导序列)结合后,确保在指导序列靶向的序列处或附近发生双链断裂;在特定的实施方式中,导入步骤可以包括向植物细胞递送一种或多种编码Cpf1效应蛋白和指导RNA的多核苷酸。
在特定的实施方式中,通过DNA病毒(例如,双生病毒)或RNA病毒(例如,烟草脆裂病毒)将多核苷酸递送到细胞中。在特定的实施方式中,导入步骤包括向植物细胞递送含有一种或多种编码Cpf1效应蛋白和指导RNA的多核苷酸序列的T-DNA,其中通过农杆菌递送。编码Cpf1 CRISPR系统组分的多核苷酸序列可以与启动子可操作地连接,例如组成型启动子(例如,花椰菜花叶病毒35S启动子),或细胞特异性或诱导型启动子。在特定的实施方式中,通过微粒轰击导入多核苷酸。在特定的实施方式中,方法还包括在导入步骤后筛选植物细胞以确定感兴趣基因的表达是否已被修饰。在特定的实施方式中,方法包括从植物细胞再生植物的步骤。在其他实施方式中,方法包括交叉繁殖植物以获得遗传上期望的植物谱系。
在上述方法的特定的实施方式中,通过靶向突变疾病易感基因或编码植物防御基因的负调节子(例如Mlo基因)的基因获得抗病作物。在一种特定的实施方式中,通过靶向取代植物基因中的特定核苷酸(例如,编码乙酰乳酸合酶(ALS)和原卟啉原氧化酶(PPO)的那些)产生除草剂耐受性作物。在特定的实施方式中,通过编码非生物胁迫耐受性的负调节子的基因的靶向突变来实现耐旱和耐盐作物,通过Waxy基因的靶向突变来实现低直链淀粉谷物,通过糊粉层中主要脂肪酶基因的靶向突变来实现降低酸败度的水稻或其他谷物,等等。在特定的实施方式中。下面列出了编码感兴趣性状的内源基因的更广泛的列表。
c)通过Cpf1 CRISPR系统调节内源基因以赋予感兴趣的农业性状
本文还提供了使用本文提供的Cpf1蛋白调节(即激活或抑制)内源基因表达的方法。这些方法利用通过Cpf1复合物靶向植物基因组的不同RNA序列。更特别是,不同的RNA序列与两个或更多个衔接蛋白(例如适体)结合,由此每个衔接蛋白与一个或多个功能结构域结合,并且其中与衔接蛋白结合的一个或多个功能结构域中的至少一个具有一种或多种活性,包括甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性、RNA切割活性、DNA切割活性或核酸结合活性的活性;功能结构域用于调节内源植物基因的表达,以获得期望的性状。通常,在这些实施方式中,Cpf1效应蛋白具有一个或多个突变使得它具有不超过5%的不具有所述至少一个突变的Cpf1效应蛋白的核酸酶活性。
在特定的实施方式中,本文提供的方法包括以下步骤:(a)将包含指导RNA的Cpf1CRISPR复合物导入细胞中,所述指导RNA包含直接重复序列和指导序列,其中所述指导序列杂交至植物细胞内源的靶序列;(b)当指导序列与靶序列杂交时,向植物细胞中导入与指导RNA复合的Cpf1效应分子;并且其中,指导RNA被修饰为包含与功能结构域结合的不同RNA序列(适体)和/或Cpf1效应蛋白因其与功能结构域连接而被修饰。在特定的实施方式中,导入步骤可以包括向植物细胞递送一种或多种编码(修饰的)Cpf1效应蛋白和(修饰的)指导RNA的多核苷酸。用于这些方法的Cpf1 CRISPR系统的组分的细节在本文其他地方描述。
在特定的实施方式中,通过DNA病毒(例如,双生病毒)或RNA病毒(例如,烟草脆裂病毒)将多核苷酸递送到细胞中。在特定的实施方式中,导入步骤包括向植物细胞递送含有一种或多种编码Cpf1效应蛋白和指导RNA的多核苷酸序列的T-DNA,其中通过农杆菌递送。编码一种或多种Cpf1 CRISPR系统组分的多核苷酸序列可以与启动子可操作地连接,例如组成型启动子(例如,花椰菜花叶病毒35S启动子),或细胞特异性或诱导型启动子。在特定的实施方式中,通过微粒轰击导入多核苷酸。在特定的实施方式中,方法还包括在导入步骤后筛选植物细胞以确定感兴趣基因的表达是否已被修饰。在特定的实施方式中,方法包括从植物细胞再生植物的步骤。在其他实施方式中,方法包括交叉繁殖植物以获得遗传上期望的植物谱系。下面列出了编码感兴趣性状的内源基因的更广泛的列表。
使用Cpf1修饰多倍体植物
许多植物都是多倍体,这意味着他们携带他们基因组的重复副本-有时多达六个,如小麦。利用Cpf1 CRISPR效应蛋白的本发明的方法可以“多重化”以影响基因的所有拷贝或一次靶向数十个基因。例如,在特定的实施方式中,本发明的方法用于同时确保负责对抗疾病的抑制性防御的不同基因中的功能突变的丧失。在特定的实施方式中,本发明的方法用于同时抑制小麦植物细胞中TaMLO-A1、TaMLO-B1和TaMLO-D1核酸序列的表达并从其再生小麦植物,以确保小麦植物对白粉病具有抗性(也参见WO2015109752)。
赋予农艺性状的示例性基因
如本文如上所述,在特定的实施方式中,本发明包括本文所述的Cpf1 CRISPR系统用于插入感兴趣的DNA(包括一个或多个植物可表达基因)的用途。在其他特定的实施方式中,本发明包括使用本文所述的Cpf1系统用于部分或完全缺失一种或多种植物表达基因的方法和工具。在其他的特定的实施方式中,本发明包括使用本文所述的Cpf1系统的方法和工具,以确保通过突变、置换、插入一种或多种核苷酸来修饰一种或多种植物表达的基因。在其他特定的实施方式中,本发明包括使用本文所述的Cpf1 CRISPR系统,以通过特异性修饰一种或多种引导所述基因表达的调控元件来确保修饰一种或多种植物表达基因的表达的修饰。
在特定的实施方式中,本发明包括方法,所述方法涉及导入外源基因和/或靶向内源基因和它们的调控元件,例如如下面所列出:
1.赋予对病虫害抗性的基因:
植物抗病基因。可以用克隆抗性基因转化植物以工程化对特定病原体菌株具有抗性的植物。参见,例如,Jones等,Science 266:789(1994)(cloning of the tomato Cf-9gene for resistance to Cladosporium fulvum);Martin等,Science 262:1432(1993)(tomato Pto gene for resistance to Pseudomonas syringae pv.tomato encodes aprotein kinase);Mindrinos等,Cell 78:1089(1994)(Arabidopsmay be RSP2gene forresistance to Pseudomonas syringae)。在病原体感染期间上调或下调的植物基因可以被工程化用于病原体抗性。参见,例如,Thomazella等,bioRxiv 064824;doi:https://doi.org/10.1101/064824Epub.July 23,2016(具有SlDMR6-1(在病原体感染期间通常上调)缺失的西红柿植物)。
基因赋予对害虫例如大豆胞囊线虫的抗性。参见,例如,PCT申请WO96/30517;PCT申请WO93/19181。
苏云金芽孢杆菌蛋白参见,例如,Geiser等,Gene 48:109(1986)。
凝集素,参见,例如,Van Damme等,Plant Molec.Biol.24:25(1994)。
维生素结合蛋白,例如亲和素,参见PCT申请US93/06487,教导使用亲和素和亲和素同源物作为对害虫的杀幼虫剂。
酶抑制剂,例如蛋白酶或蛋白酶抑制剂或淀粉酶抑制剂。参见,例如,Abe等,J.Biol.Chem.262:16793(1987),Huub等,Plant Molec.Biol.21:985(1993)),Sumitani等,Biosci.Biotech.Biochem.57:1243(1993)和美国专利号5,494,813。
昆虫特异性激素或信息素,例如蜕皮类固醇或保幼激素,其变体,基于其的模拟物,或拮抗剂或其激动剂。参见,例如Hammock等,Nature 344:458(1990)。
昆虫特异性肽或神经肽,其在表达后破坏受影响的害虫的生理。例如Regan,J.Biol.Chem.269:9(1994)and Pratt等,Biochem.Biophys.Res.Comm.163:1243(1989)。还参见美国专利号5,266,317。
由蛇、黄蜂或任何其他生物体天然产生的昆虫特异性毒液。例如,参见Pang等,Gene 116:165(1992)。
负责单萜、倍半萜、类固醇、异羟肟酸、苯丙烷衍生物或具有杀虫活性的其他非蛋白分子的超积累的酶。
参与生物活性分子的修饰,包括翻译后修饰的酶;例如,糖酵解酶、蛋白水解酶、脂肪分解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶,无论是天然的还是合成的。参见PCT申请WO93/02197,Kramer等,Insect Biochem.Molec.Biol.23:691(1993)and Kawalleck等,Plant Molec.Biol.21:673(1993)。
刺激信号转导的分子。例如,参见Botella等,Plant Molec.Biol.24:757(1994),and Griess等,Plant Physiol.104:1467(1994)。
病毒侵入性蛋白质或由其衍生的复合毒素。参见Beachy等,Ann.rev.Phytopathol.28:451(1990)。
由病原体或寄生虫在自然界中产生的发育阻滞蛋白。参见Lamb等,Bio/Technology 10:1436(1992)and Toubart等,Plant J.2:367(1992)。
植物天然产生的发育抑制蛋白。例如,Logemann等,Bio/Technology 10:305(1992)。
在植物中,病原体通常是宿主特异性的。例如,一些镰刀菌种导致西红柿枯萎,但只攻击西红柿,而其他镰刀菌种只攻击小麦。植物具有抵抗大多数病原体的现有和诱导的防御。植物世代的突变和重组事件导致遗传变异,从而引起易感性,特别是因为病原体比植物更频繁地繁殖。在植物中可以存在非宿主抗性,例如,宿主和病原体是不相容的,或者可以对病原体的所有种族具有部分抗性(这通常由许多基因控制)和/或对一些病原体的种族但不是其他种族的完全抗性。这种抗性通常由少数基因控制。使用CRISP-Cpf1系统的方法和组分,现在存在一种新工具来诱导预期的特定突变。因此,可以分析抗性基因来源的基因组,并且在具有期望特征或性状的植物中,使用Cpf1CRISPR系统的方法和组分来诱导抗性基因的上升。本系统可以比以前的诱变剂更精确地进行,因此加速和改进植物育种计划。
2.涉及植物疾病的基因,例如WO2013046247中列出的那些:
水稻的疾病:Magnaporthe grisea,Cochliobolus miyabeanus,Rhizoctoniasolani,Gibberella fujikuroi;Wheat diseases:Erysiphe graminis,Fusariumgraminearum,F.avenaceum,F.culmorum,Microdochium nivale,Puccinia striiformis,P.graminis,P.recondita,Micronectriella nivale,Typhula sp.,Ustilago tritici,Tilletia caries,Pseudocercosporella herpotrichoides,Mycosphaerellagraminicola,Stagonospora nodorum,Pyrenophora tritici-repentis;Barleydiseases:Erysiphe graminis,Fusarium graminearum,F.avenaceum,F.culmorum,Microdochium nivale,Puccinia striiformis,P.graminis,P.hordei,Ustilago nuda,Rhynchosporium secalis,Pyrenophora teres,Cochliobolus sativus,Pyrenophoragraminea,Rhizoctonia solani;Maize diseases:Ustilago maydis,Cochliobolusheterostrophus,Gloeocercospora sorghi,Puccinia polysora,Cercospora zeae-maydis,Rhizoctonia solani;
柑橘的疾病:Diaporthe citri,Elsinoe fawcetti,Penicillium digitatum,P.italicum,Phytophthora parasitica,Phytophthora citrophthora;Apple diseases:Monilinia mali,Valsa ceratosperma,Podosphaera leucotricha,Alternariaalternata apple pathotype,Venturia inaequalis,Colletotrichum acutatum,Phytophtora cactorum;
梨的疾病:Venturia nashicola,V.pirina,Alternaria alternata Japanesepear pathotype,Gymnosporangium haraeanum,Phytophtora cactorum;
桃的疾病:Monilinia fructicola,Cladosporium carpophilum,Phomopsis sp.;
葡萄的疾病:Elsinoe ampelina,Glomerella cingulata,Uninula necator,Phakopsora ampelopsidis,Guignardia bidwellii,Plasmopara viticola;
柿子的疾病:Gloesporium kaki,Cercospora kaki,Mycosphaerela nawae;
葫芦的疾病:Colletotrichum lagenarium,Sphaerotheca fuliginea,Mycosphaerella melonis,Fusarium oxysporum,Pseudoperonospora cubensis,Phytophthora sp.,Pythium sp.;
西红柿的疾病:Alternaria solani,Cladosporium fulvum,Phytophthorainfestans;Pseudomonas syringae pv.Tomato;Phytophthora capsici;Xanthomonas
茄子的疾病:Phomopsis vexans,Erysiphe cichoracearum;Brassicaceousvegetable diseases:Alternaria japonica,Cercosporella brassicae,Plasmodiophorabrassicae,Peronospora parasitica;
威尔士洋葱的疾病:Puccinia allii,Peronospora destructor;
大豆的疾病:Cercospora kikuchii,Elsinoe glycines,Diaporthe phaseolorumvar.sojae,Septoria glycines,Cercospora sojina,Phakopsora pachyrhizi,Phytophthora sojae,Rhizoctonia solani,Corynespora casiicola,Sclerotiniasclerotiorum;
芸豆的疾病:Colletrichum lindemthianum;
花生的疾病:Cercospora personata,Cercospora arachidicola,Sclerotiumrolfsii;
豌豆的疾病:Erysiphe pisi;
土豆的疾病:Alternaria solani,Phytophthora infestans,Phytophthoraerythroseptica,Spongospora subterranean,f.sp.Subterranean;
草莓的疾病:Sphaerotheca humuli,Glomerella cingulata;
茶的疾病:Exobasidium reticulatum,Elsinoe leucospila,Pestalotiopsissp.,Colletotrichum theae-sinensis;
烟草的疾病:Alternaria longipes,Erysiphe cichoracearum,Colletotrichumtabacum,Peronospora tabacina,Phytophthora nicotianae;
菜籽的疾病:Sclerotinia sclerotiorum,Rhizoctonia solani;
棉花的疾病:Rhizoctonia solani;
甜菜的疾病:Cercospora beticola,Thanatephorus cucumeris,Thanatephoruscucumeris,Aphanomyces cochlioides;
玫瑰的疾病:Diplocarpon rosae,Sphaerotheca pannosa,Peronospora sparsa;
菊花和菊科的疾病:Bremia lactuca,Septoria chrysanthemi-indici,Pucciniahoriana;
各种植物的疾病:Pythium aphanidermatum,Pythium debarianum,Pythiumgraminicola,Pythium irregulare,Pythium ultimum,Botrytis cinerea,Sclerotiniasclerotiorum;
萝卜的疾病:Alternaria brassicicola;
结缕草的疾病:Sclerotinia homeocarpa,Rhizoctonia solani;
香蕉的疾病:Mycosphaerella fijiensis,Mycosphaerella musicola;
向日葵的疾病:Plasmopara halstedii;
在各种植物的生长初始阶段由曲霉属、青霉属、镰刀菌属、赤霉属、木霉属、Thielaviopsis spp.、根霉属、毛霉属、Corticium spp.、Rhoma spp.、Rhizoctonia spp.、Diplodia spp.等引起的种子疾病或疾病;
由Polymixa spp.,Olpidium spp.等介导的各种植物的病毒疾病。
3.赋予除草剂抗性的基因实例:
对抑制生长点或分生组织的除草剂的抗性,诸如咪唑啉酮或磺酰脲,例如,Lee等人,分别为Lee等,EMBO J.7:1241(1988),and Miki等,Theor.Appl.Genet.80:449(1990)。
草甘膦耐受性(分别通过例如突变5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)的基因、aroA基因和草甘膦乙酰转移酶(GAT)基因而赋予的抗性),或对其它膦化合物的抗性,例如草铵膦(来自链霉菌种的草胺膦乙酰转移酶(PAT)基因,包括吸水链霉菌和绿色链霉菌),以及对通过ACCase抑制子编码基因的吡啶氧基或苯氧基丙酸和环己酮的抗性。参见,例如,美国专利号4,940,835和美国专利号6,248,876,美国专利号4,769,061,EP No.0333033和美国专利号4,975,374。还参见EP No.0242246,DeGreef等,Bio/Technology 7:61(1989),Marshall等,Theor.Appl.Genet.83:435(1992),Castle et.al.的WO 2005012515和WO2005107437。
对抑制光合作用的除草剂的抗性,诸如三嗪(psbA基因和gs+基因)或苄腈(腈水解酶基因)和谷胱甘肽-S-转移酶,Przibila等,Plant Cell 3:169(1991),U.S.Pat.No.4,810,648,and Hayes等,Biochem.J.285:173(1992)。
编码使除草剂解毒的酶或对抑制具有抗性的突变型谷氨酰胺合酶的基因,例如美国专利申请序列号11/760,602。或解毒酶是编码膦丝菌素乙酰转移酶的酶(例如来自链霉菌种的bar或pat蛋白)。膦丝菌素乙酰转移酶例如描述于美国专利号5,561,236;5,648,477;5,646,024;5,273,894;5,637,489;5,276,268;5,739,082;5,908,810和7,112,665。
羟基苯丙酮酸加氧酶(HPPD)抑制子,即天然存在的HPPD抗性酶,或编码突变或嵌合HPPD酶的基因,如WO96/38567,WO99/24585和WO99/24586,WO2009/144079,WO2002/046387或美国专利号6,768,044中所述。
4.涉及非生物胁迫耐受性的基因的实例:
如WO00/04173或WO/2006/045633所述,能够降低植物细胞或植物中聚(ADP-核糖)聚合酶(PARP)基因的表达和/或活性的转基因。
如WO2004/090140所述,能够降低植物或植物细胞的PARG编码基因的表达和/或活性的转基因。
编码烟酰胺腺嘌呤二核苷酸补救合成路径的植物功能酶的转基因,包括烟酰胺酶、烟酸磷酸核糖转移酶、烟酸单核苷酸腺苷转移酶、烟酰胺腺嘌呤二核苷酸合成酶或烟碱酰胺磷酸基糖基转移酶,如例如EP04077624.7,WO2006/133827,PCT/EP07/002,433,EP1999263或WO2007/107326所述。
参与碳水化合物生物合成的酶包括描述于以下的那些,例如EP 0571427,WO 95/04826,EP 0719338,WO 96/15248,WO 96/19581,WO 96/27674,WO 97/11188,WO 97/26362,WO 97/32985,WO 97/42328,WO 97/44472,WO 97/45545,WO 98/27212,WO 98/40503,WO99/58688,WO 99/58690,WO 99/58654,WO 00/08184,WO 00/08185,WO 00/08175,WO 00/28052,WO 00/77229,WO 01/12782,WO 01/12826,WO 02/101059,WO 03/071860,WO 2004/056999,WO 2005/030942,WO 2005/030941,WO 2005/095632,WO 2005/095617,WO 2005/095619,WO 2005/095618,WO 2005/123927,WO 2006/018319,WO 2006/103107,WO 2006/108702,WO 2007/009823,WO 00/22140,WO 2006/063862,WO 2006/072603,WO 02/034923,EP 06090134.5,EP 06090228.5,EP 06090227.7,EP 07090007.1,EP 07090009.7,WO 01/14569,WO 02/79410,WO 03/33540,WO 2004/078983,WO 01/19975,WO 95/26407,WO 96/34968,WO 98/20145,WO 99/12950,WO 99/66050,WO 99/53072,美国专利号6,734,341,WO00/11192,WO 98/22604,WO 98/32326,WO 01/98509,WO 01/98509,WO 2005/002359,美国专利号5,824,790,美国专利号6,013,861,WO 94/04693,WO 94/09144,WO 94/11520,WO95/35026或WO 97/20936,或参与多果糖生产,尤其是菊粉和果聚糖类的酶,如EP 0663956,WO 96/01904,WO 96/21023,WO 98/39460和WO 99/24593所公开,α-1,4-葡聚糖的生产,如WO 95/31553,US 2002031826,美国专利号6,284,479,美国专利号5,712,107,WO 97/47806,WO 97/47807,WO 97/47808和WO00/14249所公开,α-1,6支链α-1,4-葡聚糖的生产,如WO 00/73422所公开,交替糖的生产,如例如WO 00/47727,WO 00/73422,EP 06077301.7,美国专利号5,908,975和EP 0728213所公开,透明质酸的生产,如例如WO 2006/032538,WO2007/039314,WO 2007/039315,WO 2007/039316,JP 2006304779和WO 2005/012529所公开。
改善抗旱性的基因。例如,WO2013122472公开了功能性泛素蛋白连接酶蛋白(UPL)蛋白,更特别是,UPL3的缺失或降低的水平导致植物对水需求减少或对干旱的抗性提高。具有增加的干旱耐受性的转基因植物的其他实例公开于例如US 2009/0144850、US 2007/0266453和WO 2002/083911中。US2009/0144850描述了由于DR02核酸的表达改变而显示出耐旱表型的植物。US 2007/0266453描述了由于DR03核酸的表达改变而显示出耐旱表型的植物,WO 2002/08391描述了由于在保卫细胞中表达的ABC转运蛋白的活性降低而对干旱胁迫具有增加的耐受性的植物。另一个实例是Kasuga和合着者(1999)的工作,他们描述了转基因植物中编码DREB1A的cDNA的过表达在正常生长条件下激活了许多胁迫耐受基因的表达,并导致对干旱、盐负荷和冷冻的耐受性提高。然而,DREB1A的表达还在正常生长条件下导致严重的生长迟缓(Kasuga(1999)Nat Biotechnol 17(3)287-291)。
在其他特定的实施方式中,作物植物可以通过影响特定植物性状而被改良。例如,通过开发抗农药植物、改善植物抗病性、改善植物昆虫和线虫抗性、提高植物对寄生杂草的抗性、改善植物耐旱性、提高植物营养价值、改善植物对胁迫的抗性、避免自花授粉、植物饲料消化率生物量、谷物产量等。下文提供了一些具体的非限制性实例。
除了单基因的定向突变,Cpf1 CRISPR复合物在植物中可以被设计为允许多个基因的定向突变、染色体片段缺失、转基因的位点特异性整合、体内位点定向诱变和精确的基因置换或等位基因交换。因此,本文描述的方法在基因发现和验证、突变和顺式育种以及杂种育种中具有广泛的应用。这些应用促进了新一代遗传修饰作物的产生,其具有各种改良的农艺性状,例如除草剂抗性、抗病性、非生物胁迫耐受性、高产量和优异品质。
使用Cpf1基因创造雄性不育植物
杂交植物相比近交植物通常具有有利的农艺性状。然而,对于自花授粉植物,杂种的产生可以具有挑战性。在不同的植物类型中,已经鉴定了对植物生育力,更特别是雄性生育力重要的基因。例如,在玉米中,已鉴定出至少两种在生育力方面重要的基因(AmitabhMohanty International Conference on New Plant Breeding Molecular TechnologiesTechnology Development And Regulation,Oct 9-10,2014,Jaipur,India;SvitashevPlant Physiol.2015Oct;169(2):931-45;Djukanovic等Plant J.2013Dec;76(5):888-99)。本文提供的方法可用于靶向雄性生育力所需的基因,从而产生可以容易地杂交以产生杂种的雄性不育植物。在特定的实施方式中,本文提供的Cpf1 CRISPR系统用于细胞色素P450样基因(MS26)或大范围核酸酶基因(MS45)的定向诱变,从而赋予玉米植物雄性不育。这样遗传改变的玉米植物可用于杂交育种计划。
增加植物的生育期
在特定的实施方式中,本文所提供的方法用于延长植物的生育阶段,例如水稻植物。例如,可以靶向水稻生育阶段基因如Ehd3以在该基因中产生突变,并且可以选择小植株用于延长的再生植物生育阶段(如CN 104004782中所述)。
使用Cpf1在感兴趣的作物中产生遗传变异
作物植物中野生种质和遗传变异的可获得性是作物改良计划的关键,但来自作物植物的种质的可用的多样性是有限的。本发明设想了在感兴趣的种质中产生多样性遗传变异的方法。在Cpf1 CRISPR系统的这种应用中,提供了靶向植物基因组中的不同位置的指导RNA文库,并将其与Cpf1效应蛋白一起导入植物细胞中。以这种方式,可以产生基因组规模的点突变和基因敲除的集合。在特定的实施方式中,方法包括从如此获得的细胞产生植物部分或植物,并筛选细胞以获得感兴趣的性状。靶基因可包括编码区和非编码区。在特定的实施方式中,性状是胁迫耐受性,并且方法是产生胁迫耐受性作物品种的方法。
使用Cpf1影响果实成熟
成熟是水果和蔬菜成熟过程中的正常阶段。在它开始后仅几天,它使水果或蔬菜不能食用。这一过程给农民和消费者带来了重大损失。在特定的实施方式中,本发明的方法用于减少乙烯的产生。通过确保以下一项或多项来确保这一点:a.抑制ACC合酶基因表达。ACC(1-氨基环丙烷-1-羧酸)合酶是负责将S-腺苷甲硫氨酸(SAM)转化为ACC的酶;乙烯生物合成的第二步到最后一步。当将合酶基因的反义(“镜像”)或截短拷贝插入至植物基因组时,酶表达受到阻碍;b.插入ACC脱氨酶基因。编码该酶的基因来自绿色假单胞菌(Pseudomonas chlororaphis),其是常见的非致病性土壤细菌。它将ACC转化为不同的化合物,从而减少可用于乙烯生产的ACC的量;c.插入SAM水解酶基因。该方法类似于ACC脱氨酶,其中当前体代谢物的量减少时,乙烯的产生受到阻碍;在这种情况下,SAM被转化为高丝氨酸。编码该酶的基因获自大肠杆菌T3噬菌体,和d.抑制ACC氧化酶基因的表达。ACC氧化酶是催化ACC氧化成乙烯的酶,这是乙烯生物合成途径的最后一步。使用本文所述的方法,ACC氧化酶基因的下调导致乙烯产生的抑制,从而延迟果实成熟。在特定的实施方式中,作为上述修饰的补充或替代,本文所述的方法是用于修饰乙烯受体,以干扰水果获得的乙烯信号。在特定的实施方式中,编码乙烯结合蛋白的ETR1基因的表达被修饰,更特别是被抑制。在特定的实施方式中,作为上述修饰的补充或替代,本文所述的方法用于修饰编码聚半乳糖醛酸酶(PG)的基因的表达,所述酶是负责果胶(维持植物细胞壁完整性的物质)分解的酶。果胶分解在成熟过程开始时发生,导致果实软化。因此,在特定的实施方式中,本文所述的方法用于在PG基因中导入突变或抑制PG基因的激活,以减少产生的PG酶的量,从而延迟果胶降解。
因此,在特定的实施方式中,方法包括使用Cpf1 CRISPR系统,以确保植物细胞的基因组中的一个或多个修饰(例如,如上所述)和从其再生植物。在特定的实施方式中,植物是西红柿植物。
增加植物的储存寿命
在特定的实施方式中,本发明的方法用于修饰参与影响植物或植物部分的贮存寿命的化合物的产生的基因。更特别是,修饰是在防止马铃薯块茎中还原糖积累的基因中。在高温处理时,这些还原糖与游离氨基酸反应,产生棕色、苦味的产品和升高水平的丙烯酰胺(潜在的致癌物质)。在特定的实施方式中,本文提供的方法用于降低或抑制液泡转化酶基因(VInv)的表达,其编码将蔗糖分解成葡萄糖和果糖的蛋白质(Clasen等DOI:10.1111/pbi.12370)。
使用Cpf1 CRISPR系统确保增值性状
在特定的实施方式中Cpf1 CRISPR系统被用于生产营养改善的农作物。在特定的实施方式中,本文提供的方法适应于产生“功能性食品”,即改性的食品或食品成分,其可提供超出其所含的传统营养素和/或“营养品”的健康益处,即可被视为食品或部分食物并提供健康益处包括预防和治疗疾病的物质。在特定的实施方式中,保健品可用于预防和/或治疗癌症、糖尿病、心血管疾病和高血压中的一种或多种。
营养改善的作物的实例包括(Newell-McGloughlin,Plant Physiology,July2008,Vol.147,pp.939–953):
经修饰的蛋白质质量、含量和/或氨基酸组成,例如已经在如下描述,百喜草(Bahiagrass)(Luciani等2005,Florida Genetics Conference Poster),油菜籽(Roesler等,1997,Plant Physiol 11375–81),玉米(Cromwell等,1967,1969J Anim Sci 26 1325–1331,O’Quin等2000J Anim Sci 78 2144–2149,Yang等2002,Transgenic Res 11 11–20,Young等2004,Plant J 38 910–922),土豆(Yu J and Ao,1997Acta Bot Sin 39 329–334;Chakraborty等2000,Proc Natl Acad Sci USA 97 3724–3729;Li等2001)Chin Sci Bull46 482–484,水稻(Katsube等1999,Plant Physiol 120 1063–1074),Soybean(Dinkins等2001,Rapp 2002,In Vitro Cell Dev Biol Plant 37 742–747),甘薯(Egnin andPrakash 1997,In Vitro Cell Dev Biol 33 52A)。
必需氨基酸含量,例如已经在如下描述,油菜籽(Falco等1995,Bio/Technology13 577–582),羽扇豆(White等2001,J Sci Food Agric 81 147–154),玉米(Lai andMessing,2002,Agbios 2008GM crop database(March 11,2008)),土豆(Zeh等2001,PlantPhysiol 127792–802),高梁(Zhao等2003,Kluwer Academic Publishers,Dordrecht,TheNetherlands,pp 413–416),大豆(Falco等1995Bio/Technology 13 577–582;Galili等2002Crit Rev Plant Sci 21167–204)。
油和脂肪酸,例如油菜籽(Dehesh等(1996)Plant J 9 167–172[PubMed];DelVecchio(1996)INFORM International News on Fats,Oils and Related Materials 7230–243;Roesler等(1997)Plant Physiol 113 75–81[PMC free article][PubMed];Froman and Ursin(2002,2003)Abstracts of Papers of the American ChemicalSociety 223U35;James等(2003)Am J Clin Nutr 77 1140–1145[PubMed];Agbios(2008,above);coton(Chapman等(2001).J Am Oil Chem Soc 78 941–947;Liu等(2002)J AmColl Nutr 21 205S–211S[PubMed];O'Neill(2007)Australian Life Scientist.http://www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2(June 17,2008),亚麻籽(Abbadi等,2004,Plant Cell 16:2734–2748),Maize(Young等,2004,Plant J 38 910–922),油棕(Jalani等1997,J Am Oil Chem Soc 74 1451–1455;Parveez,2003,AgBiotechNet 1131–8),水稻(Anai等,2003,Plant Cell Rep 21 988–992),大豆(Reddyand Thomas,1996,Nat Biotechnol 14 639–642;Kinney and Kwolton,1998,BlackieAcademic and Professional,London,pp 193–213),向日葵(Arcadia,Biosciences2008)。
碳水化合物,例如对菊苣描述的果聚糖(Smeekens(1997)Trends Plant Sci 2286–287,Sprenger等(1997)FEBS Lett 400 355–358,Sévenier等(1998)Nat Biotechnol16 843–846),玉米(Caimi等(1996)Plant Physiol 110 355–363),土豆(Hellwege等,1997Plant J12 1057–1065),甜菜(Smeekens等1997,above),菊粉,如对土豆描述的(Hellewege等2000,Proc Natl Acad Sci USA 97 8699–8704),淀粉,如对水稻描述的(Schwall等(2000)Nat Biotechnol 18 551–554,Chiang等(2005)Mol Breed 15 125–143),
维生素和类胡萝卜素,例如对以下描述的:芥花籽油(Shintani and DellaPenna(1998)Science 282 2098–2100),玉米(Rocheford等(2002).J Am Coll Nutr 21 191S–198S,Cahoon等(2003)Nat Biotechnol 21 1082–1087,Chen等(2003)Proc Natl Acad SciUSA 1003525–3530),芥菜种(Shewmaker等(1999)Plant J 20 401–412,土豆(Ducreux等,2005,J Exp Bot 56 81–89),水稻(Ye等(2000)Science 287 303–305),草莓(Agius等(2003),Nat Biotechnol 21 177–181),西红柿(Rosati等(2000)Plant J 24 413–419,Fraser等(2001)J Sci Food Agric 81 822–827,Mehta等(2002)Nat Biotechnol 20 613–618,Díaz de la Garza等(2004)Proc Natl Acad Sci USA 101 13720–13725,Enfissi等(2005)Plant Biotechnol J 3 17–27,DellaPenna(2007)Proc Natl Acad Sci USA 1043675–3676.
功能性次级代谢物,例如对以下描述的:苹果(stilbenes,Szankowski等(2003)Plant Cell Rep 22:141–149),苜蓿(resveratrol,Hipskind and Paiva(2000)Mol PlantMicrobe Interact 13 551–562),猕猴桃(resveratrol,Kobayashi等(2000)Plant CellRep 19 904–910),玉米和大豆(flavonoids,Yu等(2000)Plant Physiol 124 781–794),土豆(anthocyanin and alkaloid glycoside,Lukaszewicz等(2004)J Agric Food Chem 521526–1533),水稻(flavonoids&resveratrol,Stark-Lorenzen等(1997)Plant Cell Rep16 668–673,Shin等(2006)Plant Biotechnol J 4 303–315),西红柿(+resveratrol,chlorogenic acid,flavonoids,stilbene;Rosati等(2000)above,Muir等(2001)Nature19 470–474,Niggeweg等(2004)Nat Biotechnol 22 746–754,Giovinazzo等(2005)PlantBiotechnol J 3 57–69),小麦(caffeic and ferulic acids,resveratrol;United PressInternational(2002));和
矿物质可用性,例如对以下描述的:苜蓿(植酸酶,Austin-Phillips等(1999)http://www.molecularfarming.com/nonmedical.html),生菜(铁,Goto等(2000)TheorAppl Genet 100 658–664),水稻(铁,Lucca等(2002)J Am Coll Nutr 21 184S–190S),玉米,大豆和小麦(植酸酶,Drakakaki等(2005)Plant Mol Biol 59 869–880,Denbow等(1998)Poult Sci 77 878–881,Brinch-Pedersen等(2000)Mol Breed 6195–206)。
在特定的实施方式中,增值性状与存在于植物中的化合物的设想的健康益处相关。例如,在特定的实施方式中,通过应用本发明的方法获得增值作物以确保修饰或诱导/增加一种或多种下列化合物的合成:
类胡萝卜素,例如存在于胡萝卜中的与可以对细胞造成损害的自由基中和的α-胡萝卜素,或在各种水果和蔬菜中中和自由基的β-胡萝卜素。
叶黄素,存在于绿色蔬菜中,有助于维持健康的视力。
番茄红素,存在于西红柿和西红柿产品中,据信其降低了前列腺癌的风险。
玉米黄质,存在于柑橘和玉米中,其有助于健康视力的维持。
膳食纤维,例如存在于麦麸中的不溶性纤维,其可以降低乳腺和/或结肠癌的风险,和存在于燕麦中的β-葡聚糖,存在于车前子(Psylium)和全麦谷物中的可溶性纤维,其可以降低心血管疾病(CVD)的风险。
脂肪酸,例如ω-3脂肪酸,其可降低CVD的风险,并改善心理和视觉功能,共轭亚油酸,其可改善身体成分,可降低某些癌症的风险,和GLA,其可降低癌症和CVD的炎症风险,可改善身体成分。
类黄酮,例如羟基肉桂酸酯,其存在于具有类似抗氧化剂活性的小麦中,可降低退行性疾病的风险,水果和蔬菜中存在的黄酮醇、儿茶素和单宁可中和自由基,并可降低癌症的风险。
硫代葡萄糖苷、吲哚、异硫氰酸盐,例如硫菌素,存在于十字花科蔬菜(西兰花、羽衣甘蓝)、辣根,其可中和自由基,可降低癌症风险。
酚类物质,例如葡萄中存在的二苯乙烯,可降低退行性疾病、心脏病和癌症的风险,可能具有长寿效果,和存在于蔬菜和柑橘种的咖啡酸和阿魏酸,其具有类似抗氧化剂活性,可降低退行性疾病、心脏病和眼科疾病的风险,和存在于可可中的表儿茶素,其具有类型抗氧化活性,可降低退行性疾病和心脏病的风险。
植物甾烷醇/甾醇,存在于玉米、大豆、小麦和木油中,可通过降低血液胆固醇水平来降低冠心病的风险。
果聚糖、菊粉、低聚果糖,存在于菊芋、葱、洋葱粉中,可改善肠胃健康。
皂苷,存在于大豆中,其可降低LDL胆固醇。
大豆蛋白,存在于大豆中,其可以降低心脏病的风险。
植物雌激素例如大豆中存在的异黄酮可以减少更年期症状,例如潮热,可以减少骨质疏松症,例如在亚麻、黑麦和蔬菜中存在的CVD和木脂素,可以预防心脏病和一些癌症,可以降低LDL胆固醇,总胆固醇。
存在于洋葱、大蒜、橄榄、韭葱和扇贝中的硫化物和硫醇例如二烯丙基硫化物,和存在于十字花科蔬菜中的烯丙基甲基三硫化物,二硫醇硫酸盐可降低LDL胆固醇,有助于维持健康的免疫系统
存在于蔓越莓、可可中的单宁,例如原花青素,可以改善泌尿道健康,可以降低CVD和高血压的风险。
此外,本发明的方法还设想修饰蛋白/淀粉的功能性、保质期、味道/美学、纤维品质和过敏原、抗营养素和毒素减少性状。
因此,本发明包括用于产生具有营养增值的植物的方法,所述方法包括使用本文所述的Cpf1 CRISPR系统向植物细胞中导入编码参与产生营养增值的组分的酶的基因,和从所述植物细胞再生植物,所述植物的特征在于增加所述营养增值的组分的表达。在特定的实施方式中,Cpf1 CRISPR系统用于间接地修饰这些化合物的内源合成,例如通过修饰控制该化合物代谢的一种或多种转录因子。使用Cpf1 CRISPR系统将感兴趣的基因导入植物细胞和/或修饰内源基因的方法在上文中描述。
已经被修饰以赋予增值性状的植物中的修饰的一些具体实例是:具有修饰的脂肪酸代谢的植物,例如通过用硬脂酰-ACP去饱和酶的反义基因转化植物以增加植物的硬脂酸含量。参见Knultzon等,Proc.Natl.Acad.Sci.U.S.A.89:2624(1992)。另一个实例涉及降低肌醇六磷酸含量,例如通过克隆然后重新导入与单个等位基因相关的DNA,所述等位基因可能是以低水平植酸为特征的玉米突变体的原因。参见Raboy等,Maydica 35:383(1990)。
类似地,在强启动子的控制下调节玉米糊粉层中类黄酮的产生的玉米(Zea mays)Tfs C1和R的表达,推测通过激活整个途径而导致拟南芥(拟南芥)中花青素的高积累速率(Bruce等,2000,Plant Cell 12:65–80)。DellaPenna(Welsch等,2007Annu Rev PlantBiol 57:711–738)发现Tf RAP2.2及其相互作用配偶体SINAT2增加了拟南芥叶片中的类胡萝卜素形成。表达TfDof1诱导了编码碳骨架生成酶的基因的上调、氨基酸含量的显著增加以及转基因拟南芥中Glc水平的降低(Yanagisawa,2004Plant Cell Physiol 45:386–391),并且DOF Tf AtDof1.1(OBP2)上调拟南芥中硫代葡萄糖苷生物合成途径中的所有步骤(Skirycz等,2006Plant J 47:10–24)。
减少植物中的过敏原
在特定的实施方式,本文提供的方法被用于产生过敏原水平降低的植物,这使得它们对于消费者更安全。在特定的实施方式中,方法包括修饰一种或多种负责产生植物过敏原的基因的表达。例如,在特定的实施方式中,方法包括下调植物细胞(例如黑麦草植物细胞)中Lolp5基因的表达并从其再生植物以降低所述植物的花粉的过敏原性(Bhalla等1999,Proc.Natl.Acad.Sci.USA Vol.96:11676–11680)。
花生过敏和对豆类的过敏通常是真正且严重的健康问题。本发明的Cpf1效应蛋白系统可用于鉴定和编辑或沉默编码这样的豆类的过敏原蛋白的基因。不对这些基因和蛋白质进行限制,Nicolaou等鉴定了在花生、大豆、扁豆、豌豆、羽扇豆、青豆和绿豆中的过敏原蛋白。参见Nicolaou等,Current Opinion in Allergy and Clinical Immunology 2011;11(3):222)。
感兴趣的内源基因的筛选方法
本文提供的方法进一步允许鉴定参与生产营养增值组分的有价值的基因或通常在跨种、门和植物界影响感兴趣的农艺性状的基因。使用本文所述的Cpf1 CRISPR系统通过选择性靶向例如编码植物中的代谢途径的酶的基因,可以鉴定负责植物的某些营养方面的基因。类似地,通过选择性地靶向可以影响所需农艺性状的基因,可以鉴定相关基因。因此,本发明包括对编码参与具有特定营养价值和/或农艺性状的化合物生产的酶的基因的筛选方法。
Cpf1 CRISPR系统在植物和酵母中的进一步应用
Cpf1 CRISPR系统在生物燃料生产中的用途
如本文使用的术语“生物燃料”是从植物和植物衍生的资源制成的替代燃料。可再生生物燃料可以从有机物中提取,其能量是通过碳固定过程获得的,或者是通过生物质的使用或转化而获得的。该生物质可以直接用于生物燃料,或者可以通过热转化、化学转化和生化转化转化为方便的含能量物质。这种生物质转化可以使燃料成为固体、液体或气体形式。有两种类型的生物燃料:生物乙醇和生物柴油。生物乙醇主要通过纤维素(淀粉)的糖发酵过程生产,其主要来源于玉米和甘蔗。另一方面,生物柴油主要生产自油料作物例如油菜籽、棕榈油和大豆。生物燃料主要用于运输。
增强用于生物燃料生产的植物特性
在特定的实施方式中,使用本文所述的Cpf1 CRISPR系统的方法用于改变细胞壁的性质以便于通过关键水解剂的接近而获得发酵种更高效的糖释放。在特定的实施方式中,纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要成分。纤维素和木质素的生物合成是共同调节的。通过降低植物中木质素的比例,可以增加纤维素的比例。在特定的实施方式中,本文描述的方法用于下调植物中的木质素生物合成,从而增加可发酵的碳水化合物。更特别是,本文描述的方法用于下调至少第一木质素生物合成基因,所述基因选自在WO2008064289A2中公开的4-香豆酸3-羟化酶(C3H)、苯丙氨酸氨裂解酶(PAL)、肉桂酸4-羟化酶(C4H)、羟基肉桂酰转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰CoA3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰辅酶A还原酶(CCR)、4-香豆酸-CoA连接酶(4CL)、木质素特异性糖基转移酶和醛脱氢酶(ALDH)。
在特定的实施方式中,本文所述的方法用于产生在发酵过程中产生低水平乙酸的植物物料(也参见WO 2010096488)。更特别是,本文公开的方法用于在Cas1L的同源物中产生突变以减少多糖乙酰化。
修饰酵母用于生物燃料生产
在特定的实施方式中,本文提供的Cpf1酶用于通过重组微生物生产生物乙醇。例如,Cpf1可用于工程化微生物,例如酵母,以从可发酵糖产生生物燃料或生物聚合物,并任选地能够降解源自农业废物的植物衍生的木质纤维素作为可发酵糖的来源。更特别是,本发明提供了方法,由此Cpf1 CRISPR复合物用于将生物燃料生产所需的外源基因导入微生物和/或修饰可能干扰生物燃料合成的内源基因。更特别是,所述方法涉及将一种或多种核苷酸序列导入微生物例如酵母中,所述核苷酸序列编码参与丙酮酸转化为乙醇或另一种感兴趣产物的酶。在特定的实施方式中,所述方法确保导入一种或多种酶,所述酶允许微生物降解纤维素,例如纤维素酶。在其他实施方式中,Cpf1CRISPR复合物用于修饰与生物燃料生产途径竞争的内源性代谢途径。
因此,在更特定的实施方式中,本文所述的方法用于如下修饰微生物:
导入至少一种异源核酸或增加至少一种编码植物细胞壁降解酶的内源核酸的表达,使得所述微生物能够表达所述核酸并产生和分泌所述植物细胞壁降解酶;
导入至少一种异源核酸或增加至少一种编码将丙酮酸转化为乙醛的酶的内源核酸任选地与至少一种编码将乙醛转化为乙醇的酶的异源核酸的组合的表达,使得所述宿主细胞能够表达所述核酸;和/或
修饰至少一种编码在所述宿主细胞中的代谢途径中的酶的核酸,其中所述途径产生丙酮酸产生乙醛或乙醛产生乙醇以外的代谢物,并且其中所述修饰导致所述代谢物产生减少,或导入至少一种编码所述酶抑制子的核酸。
修饰藻类和植物以生产植物油或生物燃料
转基因藻类或其他植物例如油菜可特别用于生产植物油或生物燃料,例如醇(尤其是甲醇和乙醇)。这些可以被工程化以表达或过表达高含量的油或醇用于石油或生物燃料工业。
根据本发明的特定的实施方式,Cpf1 CRISPR系统用于产生富含脂质的硅藻,其可用于生物燃料生产。
在特定的实施方式,设想特异性修饰涉及修饰由所述藻类细胞产生的脂质的数量和/或的脂质的质量的基因。编码参与脂肪酸合成途径的酶的基因的实例可编码具有如下活性的蛋白,例如乙酰辅酶A羧化酶、脂肪酸合酶、3-酮酰基-酰基-载体蛋白合成酶III、甘油-3-磷酸脱氢酶(G3PDH)、烯酰-酰基载体蛋白还原酶(烯酰-ACP-还原酶)、甘油-3-磷酸酰基转移酶、溶血磷脂酰基转移酶或二酰基甘油酰基转移酶、磷脂:二酰基甘油酰基转移酶、磷脂酸磷酸酶、脂肪酸硫酯酶、例如棕榈酰蛋白硫酯酶,或苹果酸酶活性。在其他的实施方式中,设想产生具有增加的脂质积累的硅藻。这可以通过靶向降低脂质分解代谢的基因来实现。用于本发明的方法的特别感兴趣的是参与三酰基甘油和游离脂肪酸活化的基因,以及直接参与脂肪酸β-氧化的基因,例如酰基辅酶A合成酶、3-酮酰基-CoA硫解酶酰基辅酶A氧化酶活性和磷酸葡糖苷酶。本文描述的Cpf1 CRISPR系统和方法可用于在硅藻中特异性激活这样的基因以增加其脂质含量。
微藻等生物广泛用于合成生物学。Stovicek等(Metab.Eng.Comm.,2015;2:13描述了工业酵母(例如,酿酒酵母)的基因组编辑以有效地生产用于工业生产的强大菌株。Stovicek使用用于酵母的经密码子优化的Cpf1 CRISPR9系统同时破坏内源基因的等位基因和敲入异源基因。Cpf1和gRNA均表达自基因组的或附加体的基于2μ的载体位置。作者还表明,通过优化Cpf1和gRNA表达水平可以提高基因破坏效率。Hlavová等(Biotechnol.Adv.2015)讨论了使用例如CRISPR的技术开发微藻物种或菌株以靶向细胞核和叶绿体基因以进行插入诱变和筛选。Stovicek和Hlavová的方法可以应用于本发明的Cpf1效应蛋白系统。
US 8945839描述了一种使用Cpf1工程化微藻(莱茵衣藻细胞)物种)的方法。使用类似的工具,本文描述的Cpf1 CRISPR系统的方法可以应用于衣藻物种和其他藻类。在特定的实施方式中,将Cpf1和指导RNA导入藻类中,所述藻类使用在组成型启动子例如Hsp70A-Rbc S2或β2-微管蛋白的控制下表达Cpf1的载体表达。使用含有T7启动子的载体递送指导RNA。或者,可以将Cpf1 mRNA和体外转录的指导RNA递送至藻类细胞。电穿孔方案遵循GeneArt Chlamydomonas Engineering kit的标准推荐方案。
Cpf1在产生能够生产脂肪酸的微生物中的用途
在特定的实施方式中,本发明的方法用于产生能够产生脂肪酯的基因工程化微生物,例如脂肪酸甲酯(“FAME”)和脂肪酸乙酯(“FAEE”“),
通常,通过表达或过表达编码硫酯酶的基因、编码酰基辅酶A合成酶的基因和编码酯合成酶的基因,可以工程化宿主细胞以从存在于培养基中的碳源(例如醇)产生脂肪酯。因此,本文提供的方法用于修饰微生物以过表达或导入硫酯酶基因、编码酰基辅酶A合成酶的基因和编码酯合成酶的基因。在特定的实施方式中,硫酯酶基因选自tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl或fatA。在特定的实施方式中,编码酰基辅酶A合酶的基因选自fadDJadK、BH3103、pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa39或编码具有相同特性的酶的鉴定基因。在特定的实施方式中,编码酯合成酶的基因是编码来自中国西蒙地菌(Simmondsia chinensis)、不动杆菌属ADP(Acinetobacter sp.ADP)、博尔库门氏杆菌(Alcanivorax borkumensis)、假单胞菌(Pseudomonas aeruginosa)、翡翠原杆菌(Fundibacter jadensis)、拟南芥(Arabidopsis thaliana)、富营养碱性菌(Alkaligenes eutrophus)或其变种的合成酶/酰基-CoA:二酰基甘油酰基转移酶的基因。另外地或替代地,本文提供的方法用于在微生物中降低编码酰基辅酶A脱氢酶的基因、编码外膜蛋白受体的基因和编码脂肪酸生物合成的转录调节因子的基因中的至少一种的表达。在特定的实施方式中,这些基因中的一种或多种被失活,例如通过导入突变。在特定的实施方式中,编码酰基辅酶A脱氢酶的基因是fadE。在特定的实施方式中,编码脂肪酸生物合成的转录调节因子的基因编码DNA转录抑制因子,例如fabR。
另外地或替代地,微生物被修饰以减少编码丙酮酸甲酸裂解酶的基因、编码乳酸脱氢酶的基因中的至少一个或两者的表达。在特定的实施方式中,编码丙酮酸甲酸裂解酶的基因是pflB。在特定的实施方式中,编码乳酸脱氢酶的基因是IdhA。在特定的实施方式中,这些基因中的一种或多种被失活,例如通过在其中导入突变。
在特定的实施方式中,微生物选自埃希菌属、芽孢杆菌属、乳酸杆菌属、红藻球菌属、Synechococcus、Synechoystis、假单胞菌属、曲霉属、木霉菌属、脉孢菌属、镰刀菌属、腐质霉属、根茎菌属、克鲁维酵母属、毕赤酵母属、毛霉属、菌丝体属、青霉属、黄褐斑菌属、平菇属、曲霉属、黄孢菌属、酵母菌属、短食单胞菌属、裂殖酵母属、雅罗菌属或链霉菌属。
Cpf1 CRISPR在产生能够生产有机酸的微生物中的用途
本文提供的方法被进一步用于工程化能够生产有机酸,更特别是从戊糖或己糖生产有机酸的微生物。在特定的实施方式中,方法包括向微生物中导入外源LDH基因。在特定的实施方式中,通过失活编码参与内源代谢途径的蛋白质的内源基因来额外地或替代地增加微生物中的有机酸产生,所述内源代谢途径产生除感兴趣的有机酸之外的代谢物和/或其中内源代谢途径消耗有机酸。在特定的实施方式中,修饰确保减少了除感兴趣的有机酸之外的代谢物的产生。根据特定的实施方式,方法是用于导入至少一种工程化基因缺失和/或失活其中消耗有机酸的内源途径或编码参与内源途径的产物的基因,所述内源途径产生除感兴趣的有机酸之外的代谢物。在特定的实施方式中,至少一种工程化基因缺失或失活是在一种或多种编码酶的基因中,所述酶选自丙酮酸脱羧酶(pdc)、富马酸还原酶、醇脱氢酶(adh)、乙醛脱氢酶、磷酸烯醇丙酮酸羧化酶(ppc)、D-乳酸脱氢酶(d-ldh)、L-乳酸脱氢酶(l-ldh)、乳酸2-单加氧酶。在其他的实施方式中,至少一种工程化基因缺失和/或失活是在编码丙酮酸脱羧酶(pdc)的内源基因中。
在其他的实施方式中,微生物被工程化以产生乳酸并且至少一个工程化的基因缺失和/或失活是在编码乳酸脱氢酶的内源基因中。另外地或替代地,微生物包含至少一种编码细胞色素依赖性乳酸脱氢酶(例如细胞色素B2依赖性L-乳酸脱氢酶)的内源基因的工程化基因缺失或失活。
Cpf1在利用酵母菌株产生改良的木糖或纤维二糖中的用途
在特定的实施方式中,CPF1CRISPR系统可以被应用来选择用于利用酵母菌株改善的木糖或纤维二糖。易错PCR可用于扩增涉及木糖利用或纤维二糖利用途径的一种(或多种)基因。涉及木糖利用途径和纤维二糖利用途径的基因的实例可包括但不限于Ha,S.J.,等(2011)Proc.Natl.Acad.Sci.USA 108(2):504-9and Galazka,J.M.,等(2010)Science330(6000):84-6中描述的那些。得到的双链DNA分子文库(每个包含这样的选择基因中的随机突变)可以与Cpf1 CRISPR系统的组分共转化到酵母菌株(例如S288C)中,并且可以用增强的木糖或纤维二糖利用能力来选择菌株,如WO2015138855中所述。
Cpf1在产生用于类异戊二烯生物合成的改良酵母菌株中的用途
Tadas等描述了多重CRISPR/Cpf1系统成功应用于面包酵母酿酒酵母的一个转化步骤中多达5个不同基因组基因座的基因组工程(Metabolic EngineeringVolume 28,March 2015,Pages 213–222)导致具有高甲羟戊酸(工业上重要的类异戊二烯生物合成途径的关键中间体)产生的菌株。在特定的实施方式中,Cpf1 CRISPR系统可以以本文所述的多重基因组工程的方法应用以鉴定用于类异戊二烯合成的其他高产酵母菌株。
Cpf1在产生生产乳酸的酵母菌株中的用途
在另一个实施方式中,包括了多重Cpf1 CRISPR系统的成功应用。与VratislavStovicek等(Metabolic Engineering Communications,Volume 2,December 2015,Pages13–22)类似,可以在单一转化事件中设计和获得改进的生产乳酸的菌株。在一种特定的实施方式中,Cpf1CRISPR系统用于同时插入异源乳酸脱氢酶基因和破坏两个内源基因PDC1和PDC5基因。
Cpf1 CRISPR系统在植物中的进一步应用
在特定的实施方式中,CRISPR系统,优选本文所述的Cpf1 CRISPR系统,可用于遗传元件动力学的可视化。例如,CRISPR成像可以显示重复或非重复的基因组序列,报告端粒长度变化和端粒运动并监测整个细胞周期中基因座的动态(Chen等,Cell,2013)。这些方法也可以应用于植物。
CRISPR系统,优选本文所述的Cpf 1CRISPR系统的其他应用,是体外和体内靶向基因破坏阳性选择筛选(Malina等,Genes and Development,2013)。这些方法也可以应用于植物。
在特定的实施方式中,失活Cpf1核酸内切酶与组蛋白修饰酶的融合可以在复合表观基因组中导入定制变化(Rusk等,Nature Methods,2014)。这些方法也可以应用于植物。
在特定的实施方式中,CRISPR系统,优选本文所述的Cpf1CRISPR系统,可用于纯化染色质的特定部分并鉴定相关蛋白,从而阐明它们在转录中的调节作用(Waldrip等,Epigenetics,2014)。这些方法也可以应用于植物。
在特定的实施方式中,本发明可以被用作在植物系统中用于病毒去除的疗法,因为其能够切割病毒DNA和RNA。先前在人体系统中的研究已证实利用CRISPR成功靶向单链RNA病毒,丙型肝炎(A.Phice,等,Proc.Natl.Acad.Sci,2015)以及双链DNA病毒,乙型肝炎(V.Ramanan等,Sci.Rep,2015)。这些方法也可以适应于在植物中使用Cpf1 CRISPR系统。
在特定的实施方式中,本发明可用于改变基因组复杂性。在其他特定的实施方式中,CRISPR系统,优选本文所述的Cpf1 CRISPR系统,可用于破坏或改变染色体数量并产生仅含有来自一个亲本的染色体的单倍体植物。可诱导这样的植物经历染色体复制并转化为仅含有纯合等位基因的二倍体植物(Karimi-Ashtiyani等,PNAS,2015;Anton等,Nucleus,2014)。这些方法也可以应用于植物。
在特定的实施方式中,本文所述的Cpf1 CRISPR系统可用于自切割。在这些实施方式中,Cpf1酶和gRNA的启动子可以是组成型启动子,并且第二个gRNA在同一转化盒中导入,但由诱导型启动子控制。可以指定该第二gRNA诱导在Cpf1基因中的位点特异性切割,以产生非功能性Cpf1。在另一种特定的实施方式中,第二gRNA在转化盒的两端诱导切割,导致去除来自宿主基因组的盒子。该系统提供对Cas酶的细胞暴露的受控持续时间,并进一步最小化脱靶编辑。此外,CRISPR/Cas盒两端的切割可用于产生具有双等位基因突变的无转基因T0植物(关于Cpf1,如例如Moore等,Nucleic Acids Research,2014;Schaeffer等,PlantScience,2015)。Moore等人的方法可以应用于本文所述的Cpf1 CRISPR系统。
Sugano等(Plant Cell Physiol.2014Mar;55(3):475-81.doi:10.1093/pcp/pcu014.Epub 2014Jan 18)报道了Cpf1 CRISPR9在地钱马鞭草(MarchantiapolymorphaL.)的靶向诱变中的应用,其作为研究陆地植物进化的模式物种已经出现。鉴定并克隆了M.polymorpha的U6启动子以表达gRNA。设计gRNA的靶序列以破坏编码M.polymorpha中的生长素响应因子1(ARF1)的基因。使用农杆菌介导的转化,Sugano等在M.polymorpha的配子体后代(generation)分离出稳定突变体。使用花椰菜花叶病毒35S或M.polymorpha EF1α启动子表达Cpf1来实现基于Cpf1 CRISPR9的体内定点诱变。显示生长素抗性表型的分离的突变体个体不是嵌合的。此外,通过T1植物的无性繁殖产生稳定的突变体。使用基于CRIPSR-Cpf1的靶向诱变容易建立多个arf1等位基因。Sugano等人的方法可以应用于本发明的Cpf1效应蛋白系统。
Kabadi等(Nucleic Acids Res.2014Oct 29;42(19):e147.doi:10.1093/nar/gku749.Epub 2014Aug 13)开发了一种单一的慢病毒系统通过独立的RNA聚合酶III启动子来表达Cpf1变异体、报告基因和多达四种sgRNAs,所述启动子通过方便的Golden Gate克隆方法整合到载体中。每个sgRNA被有效表达并且可以在永生化和原代人细胞中介导多重基因编辑和持续转录激活。Kabadi等人的方法可以应用于本发明的Cpf1效应蛋白系统。
Ling等(BMC Plant Biology 2014,14:327)基于pGreen或pCAMBIA骨架以及gRNA开发了Cpf1 CRISPR9二元载体组。除了BsaI之外,该工具包不需要限制酶来产生具有玉米密码子优化的Cpf1和一种或多种gRNA的最终构建体,所述构建体在少至一个克隆步骤中具有高效率。该工具包使用玉米原生质体、转基因玉米品系和转基因拟南芥品系进行验证,并显示出高效率和特异性。更重要的是,使用该工具包,在T1代的转基因幼苗中检测到三个拟南芥基因的靶向突变。此外,多基因突变可以被下一代遗传。(指导RNA)模块载体集,作为植物中多重基因组编辑的工具包。Lin等人的工具箱可以应用于本发明的Cpf1效应蛋白系统。
通过Cpf1 CRISPR9进行靶向植物基因组编辑的方案也可基于volume 1284of theseries Methods in Molecular Biology pp 239-255 10February 2015中针对Cpf1CRISPR9系统公开的方案获得。描述了使用拟南芥和本塞姆氏烟草原生质体作为模型细胞系统来设计、构建和评估用于植物密码子优化的Cpf1(pcoCpf1)介导的基因组编辑的双重gRNA的详细步骤。还讨论了应用Cpf1 CRISPR9系统在整株植物中产生靶向基因组修饰的策略。该章节中描述的方案可以应用于本发明的Cpf1效应蛋白质系统。
Ma等(Mol Plant.2015Aug 3;8(8):1274-84.doi:10.1016/j.molp.2015.04.007)报道了强大的Cpf1 CRISPR9载体系统,其利用植物密码子优化的Cpf1基因以在单子叶植物和双子叶植物获得方便和高效的多重基因组编辑。Ma等人设计基于PCR的步骤快速产生多重sgRNA表达盒,其可以通过Golden Gate连接或Gibson组装在一轮克隆中组装成二元Cpf1CRISPR9载体。有了这个系统,Ma等人在水稻中编辑了46个靶位点,平均突变率为85.4%,大部分为双等位和纯合状态。Ma等人通过同时靶向基因家族的多个(多达8个)成员、生物合成途径中的多个基因或单个基因中的多个位点,提供T0水稻和T1拟南芥植物中功能丧失基因突变的实例。Ma等人的方法可以应用于本发明的Cpf1效应蛋白系统。
Lowder等(Plant Physiol.2015Aug 21.pii:pp.00636.2015)还开发了Cpf1CRISPR9工具箱,可以对植物中的表达、沉默或非编码基因进行多重基因组编辑和转录调控。该工具箱为研究人员提供了方案和试剂以使用Golden Gate和Gateway克隆方法快速有效地组装用于单子叶植物和双子叶植物的功能性Cpf1 CRISPR9T-DNA构建体。它具有全套功能,包括植物内源基因的多重基因编辑和转录激活或抑制。基于T-DNA的转化技术是现代植物生物技术、遗传学、分子生物学和生理学的基础。因此,申请人开发了将Cpf1(野生型、切口酶或dCpf1)和gRNA组装成感兴趣的T-DNA目的载体的方法。组装方法基于Golden Gate组装和MultiSiteGateway重组。组装需要三个模块。第一个模块是Cpf1入门载体,其含有无启动子的Cpf1或其侧翼为attL1和attR5位点的衍生基因。第二个模块是gRNA进入载体,其含有侧翼为attL5和attL2位点的入门gRNA表达盒。第三个模块包括含有attR1-attR2的目的T-DNA载体,所述载体为Cpf1表达提供了选择的启动子。Lowder等人的工具箱可以应用于本发明的Cpf1效应蛋白系统。
Wang等(bioRxiv 051342;doi:https://doi.org/10.1101/051342;Epub.May 12,2016)展示了使用在单个启动子的控制下具有多个gRNA-tRNA单元的多重基因编辑构建体在六倍体小麦中编辑影响重要农艺性状的四种基因的同源拷贝。
在一种有利的实施方式中,植物可以是树。本发明还可以将本文公开的CRISPRCas系统用于草本系统(参见,例如,Belhaj等,Plant Methods 9:39and Harrison等,Genes&Development 28:1859–1872)。在一种特别有利的实施方式中,本发明的CRISPR Cas系统可以靶向树中的单核苷酸多态性(SNP)(参见,例如,Zhou等,New Phytologist,Volume208,Issue 2,pages 298–301,October 2015)。在Zhou等的研究中,作者在木本多年生杨树中应用CRISPR Cas系统,其使用4-香豆酸:CoA连接酶(4CL)基因家族作为案例研究,并且靶向的两个4CL基因实现了100%的突变效率,每个检测的转化体都携带双等位基因修饰。在Zhou等的研究中,Cpf1 CRISPR9系统对单核苷酸多态性(SNP)高度敏感,因为由于靶序列中的SNP,第三个4CL基因的切割被废除。这些方法可以应用于本发明的Cpf1效应蛋白系统。
Zhou等(New Phytologist,Volume 208,Issue 2,pages 298–301,October 2015)的方法可以如下应用于本发明。分别与木质素和类黄酮生物合成相关的两个4CL基因4CL1和4CL2被靶向用于Cpf1CRISPR9编辑。常规用于转化的Populus tremula×alba克隆717-1B4与基因组测序的毛果杨(Populus trichocarpa)不同。因此,用内部717RNA-Seq数据对从对照基因组设计的4CL1和4CL2gRNA进行询问,以确保不存在限制Cas效率的SNP。还包括为4CL5(4CL1的基因组拷贝)设计第三gRNA。相应的717序列在PAM附近/内部的每个等位基因中携带一个SNP,预期两者消除4CL5-gRNA的靶向。所有三个gRNA靶位点都位于第一个外显子内。对于717转化,在二元载体中在Medicago U6.6启动子下表达gRNA,以及在CaMV 35S启动子的控制下表达人密码子优化的Cas。仅使用Cas的载体的转化可以用作对照。对随机选择的4CL1和4CL2系进行扩增子测序。然后处理数据并在所有情况下确认双等位基因突变。这些方法可以应用于本发明的Cpf1效应蛋白系统。随机选择的4CL1和4CL2系进行扩增子测序。然后处理数据并在所有情况下确认双等位基因突变。这些方法可以应用于本发明的Cpf1效应蛋白系统。
在植物中,病原体通常是宿主特异性的。例如,Fusarium oxysporumf.sp.lycopersici导致西红柿枯萎,但只攻击西红柿,并且F.oxysporum f.dianthiiPuccinia graminis f.sp.tritici只攻击小麦。植物具有抵抗大多数病原体的现有和诱导的防御。植物世代的突变和重组事件导致遗传变异,从而引起易感性,特别是当病原体比植物更频繁的繁殖时。在植物中可能存在非宿主抗性,例如宿主和病原体是不相容的。还可以存在水平抗性,例如对病原体的所有种族的部分抗性,通常由许多基因控制,以及垂直抗性,例如对病原体的一些种族但不对其他种族的完全抗性,通常由少数基因控制。在Gene-for-Gene水平上,植物和病原体一起进化,并且一个平衡中的遗传变化改变另一个。因此,育种者通过天然变异组合用于产量、质量、均匀性、耐力、抗性最有用的基因。抗性基因的来源包括天然或外来品种、传家宝品种、野生植物亲缘和诱导突变,例如用诱变剂处理植物材料。使用本发明,向植物育种者提供诱导突变的新工具。因此,本领域技术人员可以分析抗性基因来源的基因组,并且在具有期望特征或性状的品种中使用本发明以诱导抗性基因的出现,这比先前的诱变剂更精确,因此加速和改善植物育种计划。
下表提供了可使用Cpf1 CRISPR复合物、经修饰的效应蛋白、系统和优化方法来改进生物生产的另外的参考文献和相关领域。
改良的植物和酵母细胞
本发明还提供了由本文提供的方法可获得的和已获得的植物和酵母细胞。通过本文所述方法获得的改良植物可通过基因的表达用于食品或饲料生产,例如确保对植物害虫、除草剂、干旱、低温或高温、过量水等的耐受性。
通过本文所述方法获得的改良植物,尤其是作物和藻类,可通过表达例如比野生型中通常所见的更高蛋白质、碳水化合物、营养素或维生素水平而用于食品或饲料生产中。在这方面,优选改良的植物,尤其是豆类和块茎。
改良的藻类或其他植物例如油菜可特别用于生产植物油或生物燃料,例如醇(尤其是甲醇和乙醇)。这些可以被工程化以表达或过表达高含量的油或醇,用于石油或生物燃料工业。
本发明还提供了植物的改良部分。植物部分包括但不限于叶、茎、根、块茎、种子、胚乳、胚珠和花粉。如本文所设想的植物部分可以是活的、不存活的、可再生的和/或不可再生的。
本文还涵盖提供根据本发明的方法产生的植物细胞和植物。通过传统育种方法产生的包含基因修饰的植物的配子、种子、胚、合子或体细胞、后代或杂种也包括在本发明的范围内。这样的植物可含有在靶序列处插入的或代替靶序列的异源或外源DNA序列。或者,这样的植物可仅含有一个或多个核苷酸的改变(突变、缺失、插入、置换)。因此,通过特定修饰的存在,这样的植物将仅与其祖先植物不同。
因此,本发明提供了通过本发明方法产生的植物、动物或细胞,或其后代。后代可以是所产生的植物或动物的克隆,或者可以通过与同一物种的其他个体杂交以将进一步期望的性状渗入其后代而由有性繁殖产生。在多细胞生物,特别是动物或植物的情况下,细胞可以是体内或离体的。
使用如本文所述的Cpf1系统进行基因组编辑的方法可用于赋予基本上任何植物、藻类、真菌、酵母等期望的性状。多种植物、藻类、真菌、酵母等以及植物藻类、真菌、酵母细胞或组织系统可以使用本公开的核酸构建体和上述各种转化方法进行工程化以获得本文所述的期望生理学和农艺学特征。
在特定的实施方式中,本文描述的方法用于修饰内源基因或修饰它们的表达而不永久地导入任何外源基因(包括编码CRISPR组分的那些)到植物、藻类、真菌、酵母等的基因组中,以避免在植物基因组中存在外源DNA。这可以是令人感兴趣的,因为非转基因植物的监管要求不那么严格。
本文所提供的CRISPR系统可用于导入靶向的双链或单链断裂和/或导入基因激活子和或阻遏物系统,并且非限制性地可用于基因靶向、基因置换、定向诱变、靶向缺失或插入、靶向倒位和/或靶向易位。通过共同表达多个靶向RNA以在单个细胞中实现多重修饰,可以确保多重基因组修饰。该技术可用于具有改良特性的植物的高精度工程化,包括增强的营养质量、增加的抗病性和对生物和非生物胁迫的抗性,以及增加的商业上有价值的植物产品或异源化合物的产量。
本文所述的方法通常导致“改良的植物、藻类、真菌、酵母等”的产生,因为与野生型植物相比,它们具有一种或多种期望的性状。在特定的实施方式中,获得的植物、藻类、真菌、酵母等,细胞或部分是转基因植物,其包含整合到全部或部分细胞的基因组中的外源DNA序列。在特定的实施方式中,获得非转基因的基因修饰的植物、藻类、真菌、酵母等,部分或细胞,因为没有外源DNA序列整合到植物的任何细胞的基因组中。在这样的实施方式中,改良的植物、藻类、真菌、酵母等是非转基因的。只有在确保内源基因的修饰并且在植物、藻类、真菌、酵母等基因组中没有导入或维持外源基因的情况下,所得的基因修饰的作物不含有外源基因,因此基本上可以认为是非转基因的。Cpf1 CRISPR系统用于植物、藻类、真菌、酵母等基因组编辑的不同应用包括但不限于:导入一种或多种外源基因以赋予感兴趣的农业性状;编辑内源基因以赋予感兴趣的农业性状;通过Cpf1 CRISPR系统调节内源基因以赋予感兴趣的农业性状。赋予农艺性状的示例性基因包括但不限于赋予对害虫或疾病的抗性的基因;参与植物疾病的基因,例如WO 2013046247中列出的那些;赋予对除草剂、杀真菌剂等的抗性的基因;参与(非生物)胁迫耐受的基因。使用Cpf1 CRISPR系统的其他方面包括但不限于:产生(雄性)不育植物;增加植物/藻类等的生育期;在感兴趣的作物中产生基因变异;影响果实成熟;增加植物/藻类等的储存期限;减少植物/藻类等过敏原;确保增值性状(例如营养改善);感兴趣的内源基因的筛选方法;生物燃料、脂肪酸、有机酸等的生产。
Cpf1效应蛋白复合物可用于非人类生物/动物
在一个方面,本发明提供了一种非人真核生物;优选多细胞真核生物,其包含根据任何所述实施方式的真核宿主细胞。在其他方面,本发明提供了真核生物;优选多细胞真核生物,其包含根据任何所述实施方式的真核宿主细胞。在这些方面的一些实施方式中,生物可以是动物;例如哺乳动物。此外,生物可以是节肢动物,例如昆虫。本发明还可以扩展到其他农业应用,例如,农场和生产动物。例如,猪具有许多特征,使其作为有吸引力的生物医学模型,特别是在再生医学中。具体而言,具有严重联合免疫缺陷(SCID)的猪可以提供用于再生医学、异种移植(本文其他地方也讨论)和肿瘤发展的有用模型,并且将有助于开发用于人SCID患者的治疗。Lee等,(Proc Natl Acad Sci U S A.2014May 20;111(20):7260-5)利用报告基因指导的转录激活因子样效应核酸酶(TALEN)系统在体细胞中高效地产生重组激活基因(RAG)2的靶向修饰,包括一些影响两个等位基因的那些。
Lee等,(Proc Natl Acad Sci U S A.2014May 20;111(20):7260-5)的方法可以类似地如下应用于本发明。通过靶向修饰胎儿成纤维细胞中的RAG2,然后进行SCNT和胚胎移植,产生变异的猪。将编码CRISPR Cas和报告分子的构建体电穿孔到胎儿来源的成纤维细胞中。48小时后,将表达绿色荧光蛋白的转染细胞以每孔一个细胞的估计的稀释分选到96孔板的个体孔中。通过扩增位于任何CRISPR Cas切割位点侧翼的基因组DNA片段,然后对PCR产物进行测序,来筛选RAG2的靶向修饰。在筛选并确保缺乏异位突变后,携带RAG2靶修饰的细胞用于SCNT。将极体与卵母细胞的相邻细胞质的一部分(推测含有中期II板)一起除去,并将供体细胞置于卵周中。然后对重建的胚胎进行电穿孔以使供体细胞与卵母细胞融合,然后进行化学活化。将活化的胚胎在猪合子培养基3(PZM3)中与0.5μM Scriptaid(S7817;Sigma-Aldrich)一起孵育14-16小时。然后洗涤胚胎以除去Scriptaid并在PZM3中培养直至它们被转移到替代猪的输卵管中。
本发明还适用于修饰其他动物(例如奶牛)的SNP。Tan等(Proc Natl Acad Sci US A.2013Oct 8;110(41):16526–16531)扩展了家畜基因编辑工具箱,包括转录激活子样(TAL)效应核酸酶(TALEN)-和规律成簇的间隔短回文重复序列(CRISPR)/Cpf1-刺激的同源定向修复(HDR)(使用质粒,rAAV和寡核苷酸模板)。根据他们的方法,基因特异性gRNA序列被克隆到Church lab gRNA载体(AddgeneID:41824)中(Mali P,等(2013)RNA-GuidedHuman Genome Engineering via Cpf1.Science 339(6121):823-826)。通过共转染hCpf1质粒(AddgeneID:41815)或从RCIScript-hCpf1合成的mRNA提供Cpf1核酸酶。通过将来自hCpf1质粒(包括hCpf1cDNA)的XbaI-AgeI片段亚克隆到RCIScript质粒中构建该RCIScript-hCpf1。
Heo等(Stem Cells Dev.2015Feb 1;24(3):393-402.doi:10.1089/scd.2014.0278.Epub 2014Nov 3)报道了使用牛多能细胞和规律成簇的间隔短回文重复序列(CRISPR)/Cpf1核酸酶在牛基因组中进行高效基因靶向。首先,Heo等通过yamanaka因子和GSK3β和MEK抑制剂(2i)处理的异位表达,从牛体细胞成纤维细胞产生诱导多能干细胞(iPSC)。Heo等观察到这些牛iPSC与幼稚多能干细胞(pluripotent stem cells)在畸胎瘤中的基因表达和发育潜力高度相似。此外,特异于牛NANOG基因座的Cpf1 CRISPR9核酸酶显示牛iPSC和胚胎中牛基因组的高效编辑。
提供动物(如奶牛)的概况分析,以执行和传递具有经济重要性的经济特征,如畜体组成、畜体质量、母性和繁殖性状以及平均日增重。对综合概况的分析始于DNA标记(最常见的是单核苷酸多态性或SNP)的发现。概况背后的所有标记都是由研究机构(包括大学,研究组织和政府实体,例如USDA)的独立科学家发现的。然后在的验证群体中分析标记。使用代表不同生产环境和生物类型的多种资源群体,通常与来自牛肉行业的种畜、牛犊、饲养场和/或包装部门的行业合作伙伴合作,以收集不常见的表型。牛基因组数据库是广泛可用的,参见例如NAGRP牛基因组协调计划(http://www.animalgenome.org/cattle/maps/db.html)。因此,本发明可以应用于靶向牛SNP。本领域技术人员可利用上述方案靶向SNP并将其应用于牛SNP,如Tan等或Heo等所述。
Qingjian Zou等(Journal of Molecular Cell Biology Advance Accesspublished October 12,2015)通过靶向狗肌肉生长抑制素(MSTN)基因(骨骼肌质量的负调节子)的第一外显子,证实狗的肌肉质量增加。首先,通过将具有Cpf1载体的靶向MSTN的sgRNA共转染到犬胚胎成纤维细胞(CEF)中来验证sgRNA的效率。此后,通过用Cpf1mRNA和MSTN sgRNA的混合物显微注射具有正常形态的胚胎并将受精卵自动移植到同一母狗的输卵管中来产生MSTN KO狗。与其野生型同窝姐妹相比,敲除的幼犬在大腿上显示出明显的肌肉表型。
牲畜-猪
在一些实施方式中,牲畜中的病毒靶标可包括猪CD163,例如猪巨噬细胞。CD163与PRRS病毒(猪繁殖与呼吸综合征病毒,动脉病毒)的感染(被认为是通过病毒细胞进入)相关。PRRS病毒感染,特别是在猪肺泡巨噬细胞(在肺部发现)导致先前无法治愈的猪综合症(“神秘猪病”或“蓝耳病”),其导致痛苦,包括家猪的生殖障碍、体重减轻和高死亡率。机会性感染,例如地方性肺炎、脑膜炎和耳水肿,常常是由于巨噬细胞活性丧失引起的免疫缺陷。由于抗生素使用和经济损失(估计每年6.6亿美元)增加,它还产生重大的经济和环境影响。
据密苏里大学并与Genus Plc合作的Kristin M Whitworth和Dr RandallPrather等(Nature Biotech 3434published online 07December 2015)报告,使用Cpf1CRISPR9靶向CD163,并且编辑的猪的后代在暴露于PRRSv时具有抗性。一只首建者雄性和一只首建者雌性,均在CD163的外显子7中具有突变,被培育以产生后代。该首建者雄性在一个等位基因的外显子7中具有11-bp缺失,其导致在结构域5中的氨基酸45处的移码突变和错义翻译以及随后在氨基酸64处的过早终止密码子。另一个等位基因具有外显子7中的2-bp添加和前一个内含子中的377-bp缺失,预测其导致结构域5的前49个氨基酸的表达,然后是氨基酸85的过早终止代码。母猪在一个等位基因中具有7bp添加,当翻译时预测表达结构域5的前48个氨基酸,然后是氨基酸70处的过早终止密码子。母猪的另一个等位基因是不可扩增的。预测选择的后代是无效的(null)动物(CD163-/-),即CD163敲除。
因此,在一些实施方式中,可以通过CRISPR蛋白靶向猪肺泡巨噬细胞。在一些实施方式中,猪CD163可以被CRISPR蛋白靶向。在一些实施方式中,可通过诱导DSB或通过插入或缺失敲除猪CD163,例如外显子7的靶向缺失或修饰,包括如上所述那些中的一个或多个,或在基因的其他区域中,例如外显子5的缺失或修饰。
还设想了编辑的猪及其后代,例如CD163敲除的猪。这可以是用于牲畜、育种或建模目的(即猪模型)。还提供了包含基因敲除的精液。
CD163是清道夫受体富含半胱氨酸(SRCR)超家族的成员。基于体外研究,蛋白质的SRCR结构域5是负责去包装和释放病毒基因组的结构域。因此,SRCR超家族的其他成员也可以被靶向以评估对其他病毒的抗性。PRRSV也是哺乳动物动脉病毒组的成员,其还包括鼠乳酸脱氢酶升高病毒、猿猴出血热病毒和马动脉炎病毒。动脉病毒具有重要的发病性质,包括巨噬细胞向性和引起严重疾病和持续感染的能力。因此,可以靶向动脉病毒,特别是鼠乳酸脱氢酶升高病毒、猿猴出血热病毒和马动脉炎病毒,例如通过猪CD163或其他物种中的同源物,并且还提供鼠、猿和马模型以及敲除。
实际上,这种方法可以扩展到导致其他可能传染给人类的牲畜疾病的病毒或细菌,例如猪流感病毒(SIV)菌株,其中包括流感C和流感A亚型H1N1、H1N2、H2N1、H3N1、H3N2和H2N3,以及上述肺炎、脑膜炎和水肿。
Cpf1效应蛋白复合物可用于非动物生物,例如植物、藻类、真菌、酵母等
使用如本文所述的Cpf1系统进行基因组编辑的方法可用于赋予基本上任何植物、藻类、真菌、酵母等期望的性状。多种植物、藻类、真菌、酵母等和植物藻类、真菌、酵母细胞或组织可以使用本公开的核酸构建体和上述各种转化方法进行工程化以获得本文所述的期望生理学和农艺学特征。
在特定的实施方式中,本文描述的方法用于修饰内源基因或修饰它们的表达而不永久地导入任何外源基因(包括编码CRISPR组分的那些)到植物、藻类、真菌、酵母等的基因组中,以避免在植物基因组中存在外源DNA。这可以是令人感兴趣的,因为非转基因植物的监管要求不那么严格。
本文所提供的CRISPR系统可用于导入靶向的双链或单链断裂和/或导入基因激活子和或阻遏物系统,并且非限制性地可用于基因靶向、基因置换、定向诱变、靶向缺失或插入、靶向倒位和/或靶向易位。通过共同表达多个靶向RNA以在单个细胞中实现多重修饰,可以确保多重基因组修饰。该技术可用于具有改良特性的植物的高精度工程化,包括增强的营养质量、增加的抗病性和对生物和非生物胁迫的抗性,以及增加的商业上有价值的植物产品或异源化合物的产量。
本文所述的方法通常导致“改良的植物、藻类、真菌、酵母等”的产生,因为与野生型植物相比,它们具有一种或多种期望的性状。在特定的实施方式中,获得的植物、藻类、真菌、酵母等,细胞或部分是转基因植物,其包含整合到全部或部分细胞的基因组中的外源DNA序列。在特定的实施方式中,获得非转基因的基因修饰的植物、藻类、真菌、酵母等,部分或细胞,因为没有外源DNA序列整合到植物的任何细胞的基因组中。在这样的实施方式中,改良的植物、藻类、真菌、酵母等是非转基因的。只有在确保内源基因的修饰并且在植物、藻类、真菌、酵母等基因组中没有导入或维持外源基因的情况下,所得的基因修饰的作物不含有外源基因,因此基本上可以认为是非转基因的。Cpf1 CRISPR系统用于植物、藻类、真菌、酵母等基因组编辑的不同应用包括但不限于:导入一种或多种外源基因以赋予感兴趣的农业性状;编辑内源基因以赋予感兴趣的农业性状;通过Cpf1 CRISPR系统调节内源基因以赋予感兴趣的农业性状。赋予农艺性状的示例性基因包括但不限于赋予对害虫或疾病的抗性的基因;参与植物疾病的基因,例如WO 2013046247中列出的那些;赋予对除草剂、杀真菌剂等的抗性的基因;参与(非生物)胁迫耐受的基因。使用Cpf1 CRISPR系统的其他方面包括但不限于:产生(雄性)不育植物;增加植物/藻类等的生育期;在感兴趣的作物中产生基因变异;影响果实成熟;增加植物/藻类等的储存期限;减少植物/藻类等过敏原;确保增值性状(例如营养改善);感兴趣的内源基因的筛选方法;生物燃料、脂肪酸、有机酸等的生产。
用RNA指导的Cpf1效应蛋白复合物进行治疗性靶向
显而易见的是,设想本系统可用于靶向任何感兴趣的多核苷酸序列。本发明提供非天然存在的或工程化的组合物,或编码所述组合物的组分的一种或多种多核苷酸,或包含编码所述组合物的组分的一种或多种多核苷酸的载体或递送系统,用于在体内、离体或体外修饰靶细胞,并且可以以改变细胞的方式进行,使得一旦被修饰,CRISPR修饰的细胞的后代或细胞系保留改变的表型。经修饰的细胞和后代可以是多细胞生物的一部分,例如具有CRISPR系统在体外或体内应用至期望细胞类型的植物或动物。CRISPR发明可以是治疗性治疗方法。所述治疗性治疗方法可包括基因或基因组编辑或基因治疗。
处理病原体,如细菌、真菌和寄生虫病原体
本发明还可用于处理细菌、真菌和寄生虫病原体。大多数研究工作都集中在开发新的抗生素上,这些抗生素一旦开发出来,就会遇到同样的耐药性问题。本发明提供了克服这些困难的新型的基于CRISPR的替代方案。此外,与现有抗生素不同,基于CRISPR的治疗可以具有对病原体的特异性,诱导靶病原体的细菌细胞死亡,同时避免有益细菌。
Jiang等(“RNA-guided editing of bacterial genomes using Cpf1 CRISPRsystems,”Nature Biotechnology vol.31,p.233-9,March 2013)使用Cpf1 CRISPR9系统突变或杀死肺炎链球菌和大肠杆菌。这项将精确突变导入基因组的工作依赖于靶向的基因组位点处的双RNA:Cpf1引导切割以杀死未突变的细胞,并避免了对可选择标志物或反选择系统的需要。CRISPR系统可用于逆转抗生素抗性并消除菌株之间的抗性转移。Bickard等人表明Cpf1被重编程为靶向毒性基因,杀死有毒性的但不是无毒的金黄色葡萄球菌。重新编程核酸酶以靶向抗生素抗性基因,破坏了具有抗生素抗性基因的葡萄球菌质粒,并免疫了质粒携带的抗性基因的扩散。(参见Bikard等,“Exploiting Cpf1CRISPR nucleases toproduce sequence-specific antimicrobials,”Nature Biotechnology vol.32,1146–1150,doi:10.1038/nbt.3043,published online 05October 2014.)Bikard表明Cpf1CRISPR9抗微生物剂在体内起作用以杀死小鼠皮肤定植模型中的金黄色葡萄球菌。类似地,Yosef等人使用CRISPR系统靶向编码赋予β-内酰胺抗生素抗性的酶的基因(参见Yousef等,“Temperate and lytic bacteriophages programmed to sensitize and killantibiotic-resistant bacteria,”Proc.Natl.Acad.Sci.USA,vol.112,p.7267–7272,doi:10.1073/pnas.1500107112published online May 18,2015)。
CRISPR系统可用于编辑对其他遗传方法具有抗性的寄生虫的基因组。例如,显示Cpf1 CRISPR9系统在约氏疟原虫基因组中导入双链断裂(参见Zhang等,“EfficientEditing of Malaria Parasite Genome Using the CRISPR/Cpf1System,”mBio.vol.5,e01414-14,Jul-Aug2014)。Ghorbal等(“Genome editing in the human malariaparasite Plasmodium falciparumusing the Cpf1 CRISPR9system,”NatureBiotechnology,vol.32,p.819-821,doi:10.1038/nbt.2925,published online June 1,2014)修饰了两个基因orc1和kelch13的序列,其推定分别在基因沉默和对青蒿素的抗性中具有作用。尽管没有直接选择修饰,但在适当位点改变的寄生虫以非常高的效率恢复,表明使用该系统可以产生中性或甚至有害的突变。Cpf1 CRISPR9也用于修饰其他致病性寄生虫的基因组,包括弓形虫(参见Shen等,“Efficient gene disruption in diverse strainsof Toxoplasma gondii using CRISPR/CPF1,”mBio vol.5:e01114-14,2014;and Sidik等,“Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cpf1,”PLoSOne vol.9,e100450,doi:10.1371/journal.pone.0100450,published online June 27,2014)。
Vyas等(“A Candida albicans CRISPR system permits genetic engineeringof essential genes and gene families,”Science Advances,vol.1,e1500248,DOI:10.1126/sciadv.1500248,April 3,2015)采用CRISPR系统克服长期存在的障碍以在白色念珠菌中进行基因工程化,并在单个实验中有效突变多个不同基因的两个拷贝。在多种机制有助于抗药性的生物中,Vyas产生纯合双突变体,其不再显示由亲本临床分离株Can90显示的对氟康唑或环己酰亚胺的超抗性。Vyas还通过创建条件等位基因获得了白色念珠菌必需基因中的纯合的功能丧失突变。核糖体RNA加工所需的DCR1的无效等位基因在低温下是致死的,但在高温下是可存活的。Vyas使用导入无义突变的修复模板和分离dcr1/dcr1突变体,这些突变体在16℃时无法生长。
本发明的CRISPR系统通过破坏染色体基因座用于恶性疟原虫。Ghorbal等(“Genome editing in the human malaria parasite Plasmodium falciparum usingthe Cpf1 CRISPR9system”,Nature Biotechnology,32,819-821(2014),DOI:10.1038/nbt.2925,June 1,2014)使用CRISPR系统在疟疾基因组中导入特异性基因敲除和单核苷酸置换。为了使Cpf1 CRISPR9系统适应恶性疟原虫,Ghorbal等生成表达载体,用于在pUF1-Cpf1附加体中的疟原虫调控元件的控制下,所述附加体也携带药物选择标志物ydhodh,其对DSM1(恶性疟原虫二氢乳清酸脱氢酶(PfDHODH)抑制子)产生抗性,以及用于sgRNA的转录,使用恶性疟原虫U6小核(sn)RNA调控元件将指导RNA和供体DNA模板置于同一质粒pL7上进行同源重组重组。另见Zhang C.等(“Efficient editing of malaria parasite genomeusing the CRISPR/Cpf1system”,MBio,2014Jul 1;5(4):E01414-14,doi:10.1128/MbIO.01414-14)和Wagner等(“Efficient Cpf1CRISPR9-mediated genome editing inPlasmodium falciparum,Nature Methods 11,915-918(2014),DOI:10.1038/nmeth.3063).。
处理病原体,例如病毒病原体,例如HIV
Cas介导的基因组编辑可用于在体细胞组织中导入保护性突变以对抗非遗传性或复杂性疾病。例如,NHEJ介导的淋巴细胞中CCR5受体的失活(Lombardo等,NatBiotechnol.2007Nov;25(11):1298-306)可以是规避HIV感染的可行策略,而缺失PCSK9(Cohen等,Nat Genet.2005Feb;37(2):161-5)orangiopoietin(Musunuru等,N Engl JMed.2010Dec 2;363(23):2220-7)可以提供对抗他汀类药物的高胆固醇血症或高脂血症的治疗效果。虽然这些靶标也可以使用siRNA介导的蛋白质敲低来解决,但NHEJ介导的基因失活的独特优势是能够在不需要继续治疗的情况下实现永久性治疗益处。与所有基因疗法一样,确定每种提议的治疗用途具有有利的益处-风险比当然是重要的。
将编码Cpf1和指导RNA的质粒DNA以及修复模板水力递送到成年小鼠酪氨酸血症模型的肝脏中,显示能够在250个细胞中的~1个中校正突变体Fah基因并拯救野生型Fah蛋白的表达(Nat Biotechnol.2014年6月;32(6):551-3)。此外,临床试验成功地使用ZF核酸酶通过离体敲除CCR5受体来对抗HIV感染。在所有患者中,HIV DNA水平降低,并且在四分之一的患者中,HIV RNA变得不可检测(Tebas等,N Engl J Med.2014Mar 6;370(10):901-10)。这两个结果都证实了可编程核酸酶作为新治疗平台的前景。
在另一个实施方式中,具有靶向由HIV tat/rev共有的共同外显子的siRNA、核仁定位的TAR诱饵和抗CCR5特异性锤头状核酶(参见,例如,DiGiusto等(2010)Sci TranslMed 2:36ra43)的自失活慢病毒载体可以用于和/或适应于本发明的Cpf1 CRISPR系统。可以收集每千克患者体重至少2.5×106个CD34+细胞,并在含有2μmol/L-谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)和血小板生成素(10ng/ml)(CellGenix)的X-VIVO 15培养基(Lonza)中于密度为2×106个细胞/ml下预刺激16至20小时。预先刺激的细胞可以在用纤连蛋白(25mg/cm2)包被的75-cm2组织培养瓶(RetroNectin,Takara BioInc.)中用慢病毒转导16-24小时,感染复数为5。
利用本领域的知识和本公开的教导,技术人员可以校正免疫缺陷病症例如HIV/AIDS的HSC,包括使HSC与靶向和敲除CCR5的Cpf1CRISPR9系统接触。靶向和敲除含有CCR5和Cpf1蛋白的颗粒的指导RNA(并且有利地是双指导方法,例如,一对不同的指导RNA;例如,在原代人CD4+T细胞和CD34+造血干细胞和祖细胞(HSPCs)中靶向两种临床相关基因B2M和CCR5的指导RNA),的HSPC))与HSC接触。可以施用如此接触的细胞;并任选地治疗/扩增;cf.Cartier.还参见Kiem,“Hematopoietic stem cell-based gene therapy for HIVdisease,”Cell Stem Cell.Feb 3,2012;10(2):137–147;通过引用将其及其引用的文献并入本文;Mandal等,“Efficient Ablation of Genes in Human Hematopoietic Stem andEffector Cells using CRISPR/Cpf1,”Cell Stem Cell,Volume 15,Issue 5,p643–652,6November 2014;通过引用将其及其引用的文献并入本文。还提及Ebina,“CRISPR/Cpf1system to suppress HIV-1expression by editing HIV-1integrated proviralDNA”SCIENTIFIC REPORTS|3:2510|DOI:10.1038/srep02510,通过引用将其及其引用的文献并入本文,作为使用Cpf1 CRISPR9系统对抗HIV/AIDS的另一种手段。
用于HIV治疗的基因组编辑的基本原理源于观察到CCR5(病毒的细胞共同受体)的功能丧失突变的纯合子个体对感染具有高度抗性并且在其他方面是健康的,表明通过基因组编辑模拟该突变可以是安全有效的治疗策略[Liu,R.,等Cell86,367-377(1996)]。当HIV感染患者从对功能丧失CCR5突变纯合的供体进行异基因骨髓移植时,导致无法检测到的HIV水平和恢复正常的CD4T细胞计数时[Hutter,G.等,The New England journal ofmedicine 360,692-698(2009)],这一想法得到了临床验证。尽管由于成本和潜在的移植物抗宿主病,骨髓移植对大多数HIV患者来说不是现实的治疗策略,需要将患者自身T细胞转化为CCR5的HIV疗法。
使用ZFNs和NHEJ敲除人源化小鼠HIV模型中CCR5的早期研究表明,CCR5编辑的CD4T细胞的移植改善了病毒载量和CD4T细胞计数[Perez,E.E.,等Nature biotechnology26,808-816(2008)]。重要的是,这些模型还显示HIV感染导致CCR5无效细胞的选择,这表明编辑赋予适应性优势并且可能允许少量编辑的细胞产生治疗效果。
由于这一和其他有希望的临床前研究,在患者T细胞中敲除CCR5的基因组编辑疗法现已在人类中进行了测试[Holt,N.,等Nature biotechnology 28,839-847(2010);Li,L.,等Molecular therapy:the journal of the American Society of Gene Therapy21,1259-1269(2013)]。在最近的I期临床试验中,去除了来自HIV患者的CD4+T细胞,用设计用于敲除CCR5基因的ZFN进行编辑,并自体移植回患者[Tebas,P.,等The New Englandjournal of medicine 370,901-910(2014)]。
在另一项研究(Mandal等,Cell Stem Cell,Volume 15,Issue 5,p643–652,6November 2014)中,Cpf1 CRISPR9靶向人类CD4+T细胞和CD34+造血干细胞和祖细胞(HSPCs)中的两个临床相关基因B2M和CCR5。单个RNA指导的使用导致HSPC中的高效诱变,但在T细胞中没有。双指导方法改善了两种细胞类型的基因缺失功效。使用Cpf1 CRISPR9进行基因组编辑的HSPC保留了多向潜能。通过HSPC中的靶捕获测序检查预测的中靶和脱靶突变,并且仅在一个位点观察到低水平的脱靶诱变。这些结果表明Cpf1 CRISPR9可以在最小的脱靶诱变下有效地消融HSPC中的基因,其对于基于造血细胞的疗法具有广泛的适用性。
Wang等(PLoS One.2014Dec 26;9(12):e115987.doi:10.1371/journal.pone.0115987)使用表达Cpf1和CCR5指导RNA的慢病毒载体通过CRISPR相关蛋白9(Cpf1)和单个指导RNA(指导RNA)来沉默CCR5。Wang等表明将表达Cpf1和CCR5指导RNA的慢病毒载体单轮转导到HIV-1易感的人CD4+细胞中,产生高频率的CCR5基因破坏。CCR5基因破坏的细胞不仅对R5-趋性(tropic)HIV-1(包括传播/建立者(T/F)HIV-1分离株)具有抗性,而且在R5-趋性HIV-1感染期间也具有优于CCR5基因未破坏细胞的选择性优势。通过T7核酸内切酶I测定法甚至在转导后84天在稳定转导的细胞未检测到与这些CCR5指导RNA高度同源的潜在脱靶位点处的基因组突变。
Fine等(Sci Rep.2015Jul 1;5:10777.doi:10.1038/srep10777)鉴定了表达化脓链球菌Cpf1(SpCpf1)蛋白片段的双盒系统,所述Cpf1蛋白片段在细胞中一起剪接以形成能够进行位点特异性DNA切割的功能性蛋白质。使用特异的CRISPR指导链,Fine等证实了该系统作为单一Cpf1和作为一对Cpf1切口酶在人HEK-293T细胞中切割HBB和CCR5基因的功效。与标准转染剂量的野生型SpCpf1(wtSpCpf1)相比,反式剪接的SpCpf1(tsSpCpf1)显示约35%的核酸酶活性,但在较低剂量水平下具有显著降低的活性。相对于wtSpCpf1,tsSpCpf1的开放阅读框长度大大减少,可能允许将更复杂和更长的遗传元件包装到AAV载体中,包括组织特异性启动子、多重指导RNA表达和与SpCpf1融合的效应结构域。
Li等(J Gen Virol.2015Aug;96(8):2381-93.doi:10.1099/vir.0.000139.Epub2015Apr 8)证实Cpf1 CRISPR9可以有效地介导细胞系中CCR5基因座的编辑,导致敲除CCR5在细胞表面的表达。下一代测序揭示了在预测的CCR5切割位点周围导入了各种突变。对于分析的三种最有效的指导RNA中的每一种,在15个最高评分潜在位点处未检测到显著的脱靶效应。通过构建携带Cpf1CRISPR9组分的嵌合Ad5F35腺病毒,Li等人有效转导原代CD4+T淋巴细胞并破坏CCR5表达,并且阳性转导细胞具有HIV-1抗性。
本领域技术人员可以利用如上研究,例如Holt,N.,等Nature biotechnology 28,839-847(2010),Li,L.,等Molecular therapy:the journal of the American Societyof Gene Therapy 21,1259-1269(2013),Mandal等,Cell Stem Cell,Volume 15,Issue 5,p643–652,6November2014,Wang等(PLoS One.2014Dec 26;9(12):e115987.doi:10.1371/journal.pone.0115987),Fine等(Sci Rep.2015Jul 1;5:10777.doi:10.1038/srep10777)和Li等(J Gen Virol.2015Aug;96(8):2381-93.doi:10.1099/vir.0.000139.Epub2015Apr 8),用于通过本发明的CRISPR Cas系统靶向CCR5。
处理病原体,如病毒病原体,如HBV
本发明还可用于处理乙型肝炎病毒(HBV)。然而,通过例如优化剂量和序列(参见,例如,Grimm等,Nature vol.441,26May 2006),必须调整CRISPR Cas系统以避免RNAi的缺点,例如过度内源性microRNA途径的风险。例如,考虑低剂量,例如每个人约1-10×1014的颗粒。在另一个实施方式中,针对HBV的CRISPR Cas系统可以在脂质体中施用,例如稳定的核酸-脂质颗粒(SNALP)(参见,例如,Morrissey等,Nature Biotechnology,Vol.23,No.8,August 2005)。考虑每日静脉内注射约1、3或5mg/kg/天的靶向SNALP中的HBV RNA的CRISPRCas。每日治疗可以超过约三天,然后每周治疗约五周。在另一个实施方式中,Chen等(GeneTherapy(2007)14,11–19)的系统可以用于和/或适应于本发明的CRISPR Cas系统。Chen等使用双链腺相关病毒8-假型载体(dsAAV2/8)来递送shRNA。单次施用携带HBV特异性shRNA的dsAAV2/8载体(每只小鼠1×1012个载体基因组)有效抑制HBV转基因小鼠肝脏中HBV蛋白、mRNA和复制DNA的稳定水平,导致在循环中HBV负荷减少最多可达2-3log10。在载体施用后,显著的HBV抑制持续至少120天。shRNA的治疗效果是靶序列依赖性的,并且不涉及干扰素的激活。对于本发明,可以将针对HBV的CRISPR Cas系统克隆到AAV载体中,例如dsAAV2/8载体,并施用于人,例如,以每个人约1×1015个载体基因组至约1×1016载体基因组。在另一个实施方式中,Wooddell等(Molecular Therapy vol.21no.5,973–985May 2013)的方法可以用于和/或适应于本发明的CRISPR Cas系统。Woodell等表明将肝细胞靶向、N-乙酰半乳糖胺缀合的蜂毒肽样肽(NAG-MLP)与靶向凝血因子VII(F7)的肝脏-向性胆固醇缀合的siRNA(chol-siRNA)的简单共注射导致在小鼠和非人灵长类动物中有效的F7敲低,而临床化学或细胞因子的诱导没有发生变化。使用HBV感染的瞬时和转基因小鼠模型,Wooddell等表明NAG-MLP与靶向保守的HBV序列的强效chol-siRNAs单次共注射导致病毒RNA、蛋白质和病毒DNA的多重对数抑制,效果持续时间长。对于本发明,可以设想例如约6mg/kg的NAG-MLP和6mg/kg的HBV特定CRISPR Cas的静脉内共注射。在替代方案中,可在第一天递送约3mg/kg的NAG-MLP和3mg/kg的HBV特异性CRISPR Cas,然后两周后施用约2-3mg/kg的NAG-MLP和2-3mg/kg HBV特异性CRISPR Cas。
在一些实施方式中,靶序列是HBV序列。在一些实施方式中,靶序列包含在附加型病毒核酸分子中,所述附加型病毒核酸分子未整合到生物的基因组中从而操纵附加型病毒核酸分子。在一些实施方式中,附加型核酸分子是双链DNA多核苷酸分子或是共价闭合的环状DNA(cccDNA)。在一些实施方式中,与不提供复合物的生物的细胞中附加型病毒核酸分子的量相比,CRISPR复合物能够减少生物的细胞中附加型病毒核酸分子的量,或者能够操纵附加型病毒核酸分子以促进附加型核酸分子的降解。在一些实施方式中,靶HBV序列整合到生物的基因组中。在一些实施方式中,当在细胞内形成时,CRISPR复合物能够操纵整合的核酸以促进从生物的基因组中切除全部或部分靶HBV核酸。在一些实施方式中,至少一种靶HBV核酸包含在整合到生物的基因组中的双链DNA多核苷酸cccDNA分子和/或病毒DNA中,并且其中CRISPR复合物操纵至少一种靶HBV核酸以切割病毒cccDNA和/或整合的病毒DNA。在一些实施方式中,切割包含将一个或多个双链断裂,任选地至少两个双链断裂,导入病毒cccDNA和/或整合的病毒DNA中。在一些实施方式中,切割是通过将一个或多个单链断裂,任选地至少两个单链断裂,导入病毒cccDNA和/或整合的病毒DNA中。在一些实施方式中,一个或多个双链断裂或一个或多个单链断裂导致在病毒cccDNA序列和/或整合的病毒DNA序列中形成一个或多个插入或缺失突变(INDEL)。
Lin等(Mol Ther Nucleic Acids.2014Aug 19;3:e186.doi:10.1038/mtna.2014.38)设计了针对基因型A的HBV的8种gRNA。利用HBV特异性gRNA,Cpf1 CRISPR9系统显著减少了转染有HBV表达载体的Huh-7细胞中的HBV核心和表面蛋白的产生。在八种筛选的gRNA中,鉴定了两种有效的gRNA。靶向保守的HBV序列的一种gRNA针对不同的基因型起作用。使用流体动力学-HBV持久性小鼠模型,Lin等进一步证实该系统可切割含肝内含HBV基因组的质粒并促进其体内清除,导致血清表面抗原水平降低。这些数据表明Cpf1CRISPR9系统可以在体外和体内破坏HBV表达模板,表明其在根除持续性HBV感染方面的潜力。
Dong等(Antiviral Res.2015Jun;118:110-7.doi:10.1016/j.antiviral.2015.03.015.Epub 2015Apr 3)使用Cpf1 CRISPR9系统靶向HBV基因组并有效抑制HBV感染。Dong等合成了四种针对HBV保守区域的单指导RNA(指导RNA)。这些指导RNA与Cpf1的表达降低了Huh7细胞以及HBV复制细胞HepG2.2.15中的病毒产生。Dong等进一步证实Cpf1 CRISPR9直接切割和切割介导的诱变发生在转染细胞的HBV cccDNA中。在携带HBV cccDNA的小鼠模型中,通过快速尾静脉注射指导RNA-Cpf1质粒导致低水平的cccDNA和HBV蛋白。
Liu等(J Gen Virol.2015Aug;96(8):2252-61.doi:10.1099/vir.0.000159.Epub2015Apr 22)设计了8种靶向不同HBV基因型的保守区域的指导RNA(gRNA),这可以在体外和体内显著抑制HBV复制以研究使用Cpf1 CRISPR9系统破坏HBV DNA模板的可能性。HBV特异性gRNA/Cpf1系统可抑制细胞中不同基因型HBV的复制,并且通过单个gRNA/Cpf1系统,病毒DNA显著降低,通过不同gRNA/Cpf1系统的组合,病毒DNA被清除。
Wang等(World J Gastroenterol.2015Aug 28;21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)设计了针对基因型A-D的HBV的15种gRNA。选择覆盖HBV调节区的两种上述gRNA(双重gRNA)的11种组合。通过测量培养上清液中的HBV表面抗原(HBsAg)或e抗原(HBeAg)来检测每种gRNA和11种双重gRNA对HBV(基因型A-D)复制的抑制的效率。使用聚合酶链反应(PCR)和测序方法检测在双重gRNA和HBV表达载体共转染的HuH7细胞中对HBV表达载体的破坏,并且使用KCl沉淀、质粒安全的ATP依赖性DNA酶(PSAD)消化、滚环扩增和定量PCR组合的方法在HepAD38细胞中鉴定cccDNA的破坏。通过线粒体四唑鎓测定法评估这些gRNA的细胞毒性。所有gRNA均可显著降低培养上清液中HBsAg或HBeAg的产生,这取决于gRNA针对的区域。所有双重gRNA均可有效抑制基因型A-D的HBV的HBsAg和/或HBeAg的产生,并且当与单独使用单一gRNA相比,双重gRNA抑制HBsAg和/或HBeAg的产生的功效显著增加。此外,通过PCR直接测序,我们证实这些双重gRNA可以通过去除两个使用的gRNA的切割位点之间的片段来特异性地破坏HBV表达模板。最重要的是,gRNA-5和gRNA-12的组合不仅可以有效抑制HBsAg和/或HBeAg的产生,还可以破坏HepAD38细胞中的cccDNA库。
Karimova等(Sci Rep.2015Sep 3;5:13734.doi:10.1038/srep13734)鉴定了HBV基因组的S和X区域中的跨基因型保守HBV序列,所述HBV基因组被靶向用于Cpf1切口酶的特异性和有效切割。该方法不仅破坏了报告细胞系中的附加型cccDNA和染色体整合的HBV靶位点,而且还破坏了慢性和新生感染的肝细胞瘤细胞系中的HBV复制。
本领域技术人员可以利用如上研究,例如,Lin等(Mol Ther NucleicAcids.2014Aug 19;3:e186.doi:10.1038/mtna.2014.38),Dong等(AntiviralRes.2015Jun;118:110-7.doi:10.1016/j.antiviral.2015.03.015.Epub 2015Apr 3),Liu等(J Gen Virol.2015Aug;96(8):2252-61.doi:10.1099/vir.0.000159.Epub 2015Apr22),Wang等(World J Gastroenterol.2015Aug 28;21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)and Karimova等(Sci Rep.2015Sep 3;5:13734.doi:10.1038/srep13734)用于通过本发明的CRISPR Cas系统靶向HBV。
慢性乙型肝炎病毒(HBV)感染是普遍的、致命的,并且由于感染细胞中病毒附加型DNA(cccDNA)的持续存在而很少治愈。Ramanan等(Ramanan V,Shlomai A,Cox DB,SchwartzRE,Michailidis E,Bhatta A,Scott DA,Zhang F,Rice CM,Bhatia SN,.Sci Rep.2015Jun2;5:10833.doi:10.1038/srep10833,published online 2nd June 2015.)显示CRISPR/Cpf1系统可以特异性地靶向和切割HBV基因组中的保守区域,从而强有力地抑制病毒基因表达和复制。在持续表达Cpf1和适当选择的指导RNA后,他们证实了Cpf1对cccDNA的切割以及cccDNA和病毒基因表达和复制的其他参数的显著降低。因此,他们表明直接靶向病毒附加型DNA是一种控制病毒并可能治愈病人的新型治疗方法。这也在以The Broad Institute等的名义的WO2015089465A1中描述,其内容通过引用并入本文。
因此,在一些实施方式中,优选靶向HBV中的病毒附加型DNA。
本发明也可以应用于处理病原体,例如细菌、真菌和寄生虫病原体。大多数研究工作都集中在开发新的抗生素上,这些抗生素一旦开发出来,就会遇到同样的耐药性问题。本发明提供了克服这些困难的新型基于CRISPR的替代方案。此外,与现有抗生素不同,基于CRISPR的治疗可以具有对病原体的特异性,诱导靶病原体的细菌细胞死亡,同时避免有益细菌。
本发明还可以用于处理丙型肝炎病毒(HCV)。Roelvinki等(Molecular Therapyvol.20no.9,1737-1749Sep 2012)的方法可以应用于CRISPR Cas系统。例如,例如AAV8的AAV载体可以是考虑的载体,并且可以考虑例如每千克体重(vg/kg)约1.25×1011至1.25×1013载体基因组的剂量。本发明还可用于处理病原体,例如细菌、真菌和寄生虫病原体。大多数研究工作都集中在开发新的抗生素上,这些抗生素一旦开发出来,就会遇到同样的耐药性问题。本发明提供了克服这些困难的新型基于CRISPR的替代方案。与现有抗生素不同,基于CRISPR的治疗可以具有对病原体的特异性,诱导靶病原体的细菌细胞死亡,同时避免有益细菌。
Jiang等(“RNA-guided editing of bacterial genomes using Cpf1 CRISPRsystems,”Nature Biotechnology vol.31,p.233-9,March 2013)使用Cpf1 CRISPR9系统突变或杀死肺炎链球菌和大肠杆菌。这项将精确突变导入基因组的工作依赖于双RNA:靶向的基因组位点处的Cpf1引导切割以杀死未突变的细胞,并避免了对可选择标志物或反选择系统的需要。CRISPR系统可用于逆转抗生素抗性并消除菌株之间的抗性转移。Bickard等人表明Cpf1被重编程为靶向毒性基因,杀死有毒性的但不是无毒的金黄色葡萄球菌。重新编程核酸酶以靶向抗生素抗性基因,破坏了具有抗生素抗性基因的葡萄球菌质粒,并免疫了质粒携带的抗性基因的扩散。(参见Bikard等,“Exploiting Cpf1 CRISPR nucleases toproduce sequence-specific antimicrobials,”Nature Biotechnology vol.32,1146–1150,doi:10.1038/nbt.3043,published online 05October 2014.)Bikard表明Cpf1CRISPR9抗微生物剂在体内起作用以杀死小鼠皮肤定植模型中的金黄色葡萄球菌。类似地,Yosef等人使用CRISPR系统靶向编码赋予β-内酰胺抗生素抗性的酶的基因(参见Yousef等,“Temperate and lytic bacteriophages programmed to sensitize and killantibiotic-resistant bacteria,”Proc.Natl.Acad.Sci.USA,vol.112,p.7267–7272,doi:10.1073/pnas.1500107112published online May 18,2015)。
CRISPR系统可用于编辑对其他遗传方法具有抗性的寄生虫的基因组。例如,显示Cpf1 CRISPR9系统在约氏疟原虫基因组中导入双链断裂(参见Zhang等,“EfficientEditing of Malaria Parasite Genome Using the CRISPR/Cpf1System,”mBio.vol.5,e01414-14,Jul-Aug 2014)。Ghorbal等(“Genome editing in the human malariaparasite Plasmodium falciparumusing the Cpf1 CRISPR9system,”NatureBiotechnology,vol.32,p.819-821,doi:10.1038/nbt.2925,published online June 1,2014)修饰了两个基因orc1和kelch13的序列,其推定分别在基因沉默和对青蒿素的抗性中具有作用。尽管没有直接选择修饰,但在适当位点改变的寄生虫以非常高的效率恢复,表明使用该系统可以产生中性或甚至有害的突变。Cpf1 CRISPR9也用于修饰其他致病性寄生虫的基因组,包括弓形虫(参见Shen等,“Efficient gene disruption in diverse strainsof Toxoplasma gondii using CRISPR/CPF1,”mBio vol.5:e01114-14,2014;and Sidik等,“Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cpf1,”PLoSOne vol.9,e100450,doi:10.1371/journal.pone.0100450,published online June 27,2014)。
Vyas等(“A Candida albicans CRISPR system permits genetic engineeringof essential genes and gene families,”Science Advances,vol.1,e1500248,DOI:10.1126/sciadv.1500248,April 3,2015)采用CRISPR系统克服长期存在的障碍以在白色念珠菌中进行基因工程化,并在单个实验中有效突变多个不同基因的两个拷贝。在多种机制有助于抗药性的生物中,Vyas产生纯合双突变体,其不再显示由亲本临床分离株Can90显示的对氟康唑或环己酰亚胺的超抗性。Vyas还通过创建条件等位基因获得了白色念珠菌必需基因中的纯合的功能丧失突变。核糖体RNA加工所需的DCR1的无效等位基因在低温下是致死的,但在高温下是可存活的。Vyas使用导入无义突变的修复模板和分离dcr1/dcr1突变体,这些突变体在16℃时无法生长。
治疗具有遗传或表观遗传方面的疾病
本发明的Cpf1 CRISPR系统可用于校正先前使用TALEN和ZFN尝试而成功有限并且已被鉴定为Cpf1系统的潜在靶标的基因突变,包括如在Editas Medicine的已公布的申请中所述的方法,使用Cpf1系统靶向基因座以通过基因疗法治疗性地解决疾病,包括Gluckmann等的WO 2015/048577CRISPR-RELATED METHODS AND COMPOSITIONS;Glucksmann等的WO 2015/070083CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNINGgRNAS;在一些实施方式中,提供了原发性开角型青光眼(POAG)的治疗、预防或诊断。靶标优选是MYOC基因。这在WO2015153780中描述,其公开内容通过引用并入本文。
提及Maeder等的WO2015/134812 CRISPR/CAS-RELATED METHODS ANDCOMPOSITIONS FOR TREATING USHER SYNDROME AND RETINITIS PIGMENTOSA。通过本文的教导,本发明包括结合本文的教导应用的这些文献的方法和材料。在眼部和听觉基因治疗的一个方面,用于治疗亚瑟综合征和视网膜色素的方法和组合物可以适应于本发明的Cpf1CRISPR系统(参见,例如,WO2015/134812)。在一个实施方式中,WO2015/134812涉及通过基因编辑治疗或延迟IIA类型的Usher综合征(USH2A、USH11A)和视网膜色素变性39(RP39)的发作或进展,例如,使用Cpf1 CRISPR9介导的方法来校正USH2A基因第2299位鸟嘌呤缺失(例如,替换USH2A基因2299位缺失的鸟嘌呤残基)。在相关方面,通过用一种或多种核酸酶、一种或多种切口酶或其组合来切割来靶向突变,例如,用校正点突变(例如,单核苷酸,例如,鸟嘌呤,缺失)的供体模板诱导HDR。突变USH2A基因的改变或校正可以通过任何机制介导。可以与突变HSH2A基因的改变(例如,校正)相关联的示例性机制包括但不限于非同源末端连接、微同源介导的末端连接(MMEJ)、同源定向修复(例如,内源性供体模板介导的)、SDSA(合成依赖性链退火)、单链退火或单链侵入。在一个实施方式中,用于治疗亚瑟综合征和视网膜色素变性的方法可包括获得受试者携带的突变的知识,例如,通过对USH2A基因的适当部分进行测序。
因此,在一些实施方式中,提供了色素性视网膜炎的治疗、预防或诊断。已知许多不同的基因与色素性视网膜炎相关或导致色素性视网膜炎,例如RP1、RP2等。在一些实施方式中,这些基因被靶向,并通过提供合适的模板敲除或修复。在一些实施方式中,通过注射递送至眼睛。
在一些实施方式中,一种或多种视网膜色素变性基因可以选自:RP1(视网膜色素变性蛋白-1),RP2(视网膜色素变性蛋白-2),RPGR(视网膜色素变性蛋白-3),PRPH2(视网膜色素变性蛋白-7),RP9(视网膜色素变性蛋白-9),IMPDH1(视网膜色素变性蛋白-10),PRPF31(视网膜色素变性蛋白-11),CRB1(视网膜色素变性蛋白-12,常染色体隐性遗传),PRPF8(视网膜色素变性蛋白-13),TULP1(视网膜色素变性蛋白-14),CA4(视网膜色素变性蛋白-17),HPRPF3(视网膜色素变性蛋白-18),ABCA4(视网膜色素变性蛋白-19),EYS(视网膜色素变性蛋白-25),CERKL(视网膜色素变性蛋白-26),FSCN2(视网膜色素变性蛋白-30),TOPORS(视网膜色素变性蛋白-31),SNRNP200(视网膜色素变性蛋白33),SEMA4A(视网膜色素变性蛋白-35),PRCD(视网膜色素变性蛋白-36),NR2E3(视网膜色素变性蛋白-37),MERTK(视网膜色素变性蛋白-38),USH2A(视网膜色素变性蛋白-39))PROM1(视网膜色素变性蛋白-41),KLHL7(视网膜色素变性蛋白-42),CNGB1(视网膜色素变性蛋白-45),BEST1(视网膜色素变性蛋白-50),TTC8(视网膜色素变性蛋白51),C2orf71(视网膜色素变性蛋白54),ARL6(视网膜色素变性蛋白55),ZNF513(视网膜色素变性蛋白58),DHDDS(视网膜色素变性蛋白59),BEST1(视网膜色素变性蛋白,同心(concentric)),PRPH2(视网膜色素变性,双基因(digenic)),LRAT(视网膜色素变性蛋白,青少年(juvenile)),SPATA7(视网膜色素变性蛋白,青少年,常染色体隐性遗传)),CRX(视网膜色素变性蛋白,迟发性显性遗传)和/或RPGR(视网膜色素变性蛋白,X连锁和鼻呼吸道感染,有或没有耳聋)。
在一些实施方式中,视网膜色素变性基因是MERTK(视网膜色素变性蛋白-38)或USH2A(视网膜色素变性蛋白-39)。
还提及WO2015/138510,并且通过本文的教导,本发明(使用Cpf1 CRISPR9系统)包括提供治疗或延迟莱伯先天性黑朦10(LCA 10)的发作或进展。LCA 10由CEP290基因突变引起,例如c.2991+1655,CEP290基因中的腺嘌呤至鸟嘌呤突变,这在内含子26中产生隐蔽的剪接位点。这是CEP290中内含子26的核苷酸1655处的突变,例如A到G突变。CEP290也称为:CT87;MKS4;POC3;RD16;BBS14;JBTS5;LCAJO;NPHP6;SLSN6;和3H11Ag(参见,例如,WO 2015/138510)。在基因治疗的一个方面,本发明涉及在CEP290基因的至少一个等位基因中的LCA靶位置(例如,c.2991+1655;A至G)的位点附近导入一个或多个断裂。改变LCA10靶位置是指(1)在紧邻或包括LCA10靶位置(例如,c.2991+1655A至G)的断裂诱导的插入缺失(在本文中也称为NHEJ介导的插入缺失)的导入,或(2)基因组序列(包括在LCA10靶位置的突变(例如,c.2991+1655A至G))的断裂诱导的缺失(在本文中也称为NHEJ介导的缺失)。两种方法都引起由LCA10靶位置处的突变导致的隐蔽剪接位点的丧失或破坏。因此,具体设想Cpf1在LCA治疗中的用途。
研究人员正在考虑是否可以采用基因疗法来治疗多种疾病。基于Cpf1效应蛋白的本发明的CRISPR系统被设想用于这样的治疗用途,包括但不限于进一步的示例性靶向区域和通过如下的递送方法。使用本系统可以有效治疗的病症或疾病的一些实例包括在本文包括的基因和参考文献的实例中,并且当前与那些病症相关联的也在那里提供。示例性的基因和病症并非详尽无遗。
治疗循环系统的疾病
本发明还考虑将Cpf1 CRISPR系统,特别是本文所述的新型CRISPR效应蛋白系统,递送至血液或造血干细胞。Wahlgren等(Nucleic Acids Research,2012,Vol.40,No.17e130)的血浆外泌体先前已被描述并且可用于将CRISPR Cas系统递送至血液。还考虑本发明的核酸靶向系统以治疗血红蛋白病,例如地中海贫血和镰状细胞病。参见,例如,国际专利公开号WO2013/126794,其可用于可由本发明的CRISPR Cas系统靶向的潜在靶标。
Drakopoulou,“Review Article,The Ongoing Challenge of HematopoieticStem Cell-Based Gene Therapy forβ-Thalassemia,”Stem Cells International,Volume 2011,Article ID 987980,10pages,doi:10.4061/2011/987980,通过引用将其及其引用文献并入本文,如同完整列出一样,其讨论使用递送β-珠蛋白或γ-珠蛋白基因的慢病毒来修饰HSC。与使用慢病毒相反,利用本领域的知识和本公开的教导,技术人员可以使用靶向并校正突变的Cpf1 CRISPR系统(例如,使用合适的HDR模板,其提供β-珠蛋白或γ-珠蛋白的编码序列,有利地是非镰状β-珠蛋白或γ-珠蛋白)来校正β-地中海贫血的HSC;具体而言,指导RNA可以靶向引起β-地中海贫血的突变,并且HDR可以提供β-珠蛋白或γ-珠蛋白的正确表达的编码。靶向突变的指导RNA和含有颗粒的Cas蛋白与携带突变的HSC接触。颗粒还可含有合适的HDR模板以校正突变以正确表达β-珠蛋白或γ-球蛋白;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。可以施用如此接触的细胞;并任选地处理/扩展;参见Cartier。在这方面,提及:Cavazzana,“Outcomes of Gene Therapy forβ-Thalassemia Major via Transplantation of Autologous Hematopoietic Stem CellsTransduced Ex Vivo with a LentiviralβA-T87Q-Globin Vector.”tif2014.org/abstractFiles/Jean%20Antoine%20Ribeil_Abstract.pdf;Cavazzana-Calvo,“Transfusion independence and HMGA2activation after gene therapy of humanβ-thalassaemia”,Nature 467,318–322(16September 2010)doi:10.1038/nature09328;Nienhuis,“Development of Gene Therapy for Thalassemia,Cold Spring HarborPerpsectives in Medicine,doi:10.1101/cshperspect.a011833(2012),LentiGlobinBB305,a lentiviral vector containing an engineeredβ-globin gene(βA-T87Q);和Xie等,“Seamless gene correction ofβ-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cpf1and piggyback”Genome Research gr.173427.114(2014)http://www.genome.org/cgi/doi/10.1101/gr.173427.114(Cold Spring HarborLaboratory Press);这是Cavazzana涉及人β-地中海贫血的工作的主题和Xie的工作的主题,全部文献以及其中或与其相关的引用文献通过引用并入本文。在本发明中,HDR模板可以提供于HSC以表达工程化的β-珠蛋白基因(例如,βA-T87Q),或如Xie中的β-珠蛋白。
Xu等(Sci Rep.2015Jul 9;5:12065.doi:10.1038/srep12065)设计了TALEN和Cpf1 CRISPR9以直接靶向珠蛋白基因中的内含子2突变位点IVS2-654。Xu等使用TALEN和Cpf1 CRISPR9在IVS2-654位点观察到不同频率的双链断裂(DSB),并且当与piggyBac转座子供体组合时,TALEN与Cpf1 CRISPR9相比介导更高的同源基因靶向效率。此外,与TALEN相比,Cpf1 CRISPR9观察到更明显的脱靶事件。最后,使用OP9共培养系统选择TALENs校正的iPSC克隆用于成红细胞分化,并且检测到HBB的转录比未校正的细胞相对更高。
Song等(Stem Cells Dev.2015May 1;24(9):1053-65.doi:10.1089/scd.2014.0347.Epub 2015Feb 5)使用CRISPR/Cpf1校正β-Thal iPSC;基因校正的细胞表现出正常的核型和完整的多能性,因为人胚胎干细胞(hESCs)没有显示脱靶效应。然后,Song等评估了基因校正的β-Thal iPSC的分化效率。Song等发现在造血分化期间,基因校正的β-Thal iPSC显示出增加的胚胎体比率和各种造血祖细胞百分比。更重要的是,与未校正组相比,基因校正的β-Thal iPSC系恢复了HBB表达并降低了活性氧的产生。Song等的研究表明,一旦用Cpf1 CRISPR9系统校正,β-Thal iPSC的造血分化效率就会大大提高。可以利用本文描述的Cpf1 CRISPR系统进行类似的方法,例如包含Cpf1效应蛋白的系统。
镰状细胞性贫血是一种常染色体隐性遗传疾病,其中红细胞变成镰状。它是由β-珠蛋白基因中的单碱基置换引起的,其位于染色体11的短臂上。结果,产生缬氨酸而不是谷氨酸,导致产生镰状血红蛋白(HbS)。这导致形成扭曲的红细胞形状。由于这种异常形状,可以阻塞小血管,对骨骼、脾脏和皮肤组织造成严重损害。这可能导致疼痛发作、频繁感染、手足综合症或甚至多器官衰竭。扭曲的红细胞也更容易发生溶血,导致严重的贫血。正如β-地中海贫血一样,镰状细胞性贫血可以通过用Cpf1 CRISPR系统修饰HSC来校正。该系统允许通过切割其DNA然后让它自我修复来特异性地编辑细胞的基因组。将Cas蛋白插入并由RNA指导引导至突变位点,然后在该位点切割DNA。同时,插入健康版本的序列。细胞自身的修复系统使用该序列来固定诱导切割。以这种方式,Cpf 1CRISPR允许校正先前获得的干细胞中的突变。利用本领域的知识和本公开的教导,技术人员可以使用靶向并校正突变的Cpf1CRISPR系统来校正镰状细胞贫血症的HSC(例如,使用合适的HDR模板,其递送β-珠蛋白(有利地是非镰状β-珠蛋白)的编码序列);具体而言,指导RNA可以靶向引起镰状细胞贫血的突变,并且HDR可以提供β-珠蛋白的正确表达的编码。靶向突变的指导RNA和含有颗粒的Cas蛋白与携带突变的HSC接触。该颗粒还可含有合适的HDR模板以校正突变以正确表达β-珠蛋白;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。可以施用如此接触的细胞;并任选地处理/扩展;参见Cartier。HDR模板可以提供于HSC以表达工程化的β-珠蛋白基因(例如,βA-T87Q),或如Xie中的β-珠蛋白。
Williams,“Broadening the Indications for Hematopoietic Stem CellGenetic Therapies,”Cell Stem Cell 13:263-264(2013),通过引用将其及其引用文献并入本文,如同完整列出一样,报道慢病毒介导的基因转移至来自患有溶酶体贮积病异染性脑白质营养不良疾病(MLD)的患者的HSC/P细胞,这是一种由芳基硫酸酯酶A(ARSA)缺陷引起的遗传性疾病,导致神经脱髓鞘;和慢病毒介导的基因转移至Wiskott-Aldrich综合征(WAS)患者的HSC中(患者具有WAS蛋白缺陷(所述WAS蛋白为小GTPase CDC42的效应子,调节血细胞谱系中的细胞骨架功能),因此患有反复感染的免疫缺陷、自身免疫症状和血小板减少症伴有异常小和功能失调的血小板,导致出血过多和白血病和淋巴瘤的风险增加)。与使用慢病毒相反,利用本领域的知识和本公开的教导,技术人员可以使用靶向并校正突变(芳基硫酸酯酶A(ARSA)的缺陷)(例如,使用合适的递送ARSA的编码序列的HDR模板)的Cpf1CRISPR系统来校正MLD(芳基硫酸酯酶A(ARSA)的缺陷)的HSC;具体而言,指导RNA可以靶向产生MLD(缺陷的ARSA)的突变,并且HDR可以提供编码以正确表达ARSA。靶向突变的指导RNA和含有颗粒的Cas蛋白与携带突变的HSC接触。颗粒还可以包含合适的HDR模板以校正突变以正确表达ARSA;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。可以施用如此接触的细胞;并任选地处理/扩展;参见Cartier。与使用慢病毒相反,利用本领域的知识和本公开的教导,本领域技术人员可以使用靶向并校正突变(WAS蛋白的缺陷)(例如,合适的递送WAS蛋白的编码序列的HDR模板)的Cpf1 CRISPR系统来校正WAS的HSC;具体而言,指导RNA可以靶向产生WAS(缺陷的WAS蛋白)的突变,并且HDR可以提供编码以正确表达WAS蛋白。靶向突变的指导RNA和含有颗粒的Cas蛋白与携带突变的HSC接触。颗粒还可以包含合适的HDR模板以校正突变以正确表达WAS蛋白;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。可以施用如此接触的细胞;并任选地处理/扩展;参见Cartier。
Watts,“Hematopoietic Stem Cell Expansion and Gene Therapy”Cytotherapy13(10):1164–1171.doi:10.3109/14653249.2011.620748(2011),通过引用将其及其引用文献并入本文,如同完整列出一样,讨论了造血干细胞(HSC)基因疗法,例如病毒介导的HSC基因疗法,作为许多失调的极具吸引力的治疗选择,包括血液学症状、包括HIV/AIDS在内的免疫缺陷,以及其他遗传性失调,例如溶酶体贮积病,包括SCID-X1、ADA-SCID、β-地中海贫血、X连锁CGD、Wiskott-Aldrich综合征、Fanconi贫血、肾上腺脑白质营养不良(ALD)和异染性脑白质营养不良(MLD)。
转让给Cellectis的美国专利公开号20110225664、20110091441、20100229252、20090271881和20090222937涉及CREI变体,其中两个I-CreI单体中的至少一个具有至少两个置换,在LAGLIDADG(SEQ ID NO:26)核心结构域的两个功能性亚结构域的每一个中具有一个置换,所述两个功能性亚结构域分别位于I-CreI的26至40位和44至77位,所述变体能够从人白细胞介素-2受体γ链(IL2RG)基因(也命名为常见细胞因子受体γ链基因或γC基因)切割DNA靶序列。在美国专利公开号20110225664、20110091441、20100229252、20090271881和20090222937中鉴定的靶序列可用于本发明的核酸靶向系统。
严重联合免疫缺陷(SCID)由淋巴细胞T成熟缺陷引起,总是与B淋巴细胞中的功能缺陷相关(Cavazzana-Calvo等,Annu.Rev.Med.,2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。总体发病率估计为75000例新生儿中的1例。未经治疗的SCID患者会发生多次机会性微生物感染,一般不会存活超过一年。SCID可以通过来自家族供体的同种异体造血干细胞转移来治疗。与供体的组织相容性可以广泛变化。在腺苷脱氨酶(ADA)缺陷(SCID形式之一)的情况下,可以通过注射重组腺苷脱氨酶来治疗患者。
由于已经证实ADA基因在SCID患者中发生突变(Giblett等,Lancet,1972,2,1067-1069),因此已经鉴定了SCID中涉及的多种其他基因(Cavazzana-Calvo等,Annu.Rev.Med.,2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。SCID有四个主要原因:(1)最常见的SCID形式,SCID-X1(X连锁SCID或X-SCID),是由IL2RG基因突变引起的,导致缺乏成熟的T淋巴细胞和NK细胞。IL2RG编码γC蛋白(Noguchi,等,Cell,1993,73,147-157),它是至少五种白细胞介素受体复合物的常见组分。这些受体通过JAK3激酶激活多种靶标(Macchi等,Nature,1995,377,65-68),其失活导致与γC失活相同的综合症;(ii)ADA基因突变导致嘌呤代谢缺陷,这对淋巴细胞前体是致命的,这反过来导致B、T和NK细胞的准缺失;(iii)V(D)J重组是免疫球蛋白和T淋巴细胞受体(TCR)成熟的必要步骤。重组激活基因1和2(RAG1和RAG2)和Artemis(参与该过程的三个基因)中的突变导致不存在成熟的T和B淋巴细胞;(iv)还报道了参与T细胞特异性信号转导的其他基因例如CD45的突变,尽管它们代表少数病例(Cavazzana-Calvo等,(iii)V(D)J重组是免疫球蛋白和T淋巴细胞受体(TCR)成熟的必要步骤。重组激活基因1和2(RAG1和RAG2)和Artemis(参与该过程的三个基因)中的突变导致不存在成熟的T和B淋巴细胞;(iv)还报道了参与T细胞特异性信号转导的其他基因如CD45的突变,尽管它们代表少数病例(Cavazzana-Calvo等,Annu.Rev.Med.,2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。由于已经鉴定了它们的遗传基础,由于两个主要原因,不同的SCID形式已经成为基因治疗方法的范例(Fischer等,Immunol.Rev.,2005,203,98-109)。首先,与所有血液疾病一样,可以设想离体治疗。造血干细胞(HSCs)可以从骨髓中回收,并保留其多能特性,用于少数细胞分裂。因此,它们可以在体外进行治疗,然后重新注射到患者体内,在那里他们重新填充骨髓。其次,由于SCID患者淋巴细胞的成熟受损,校正的细胞具有选择性优势。因此,少数校正细胞可以恢复功能性免疫系统。该假设通过以下被多次验证:(i)与SCID患者的突变逆转相关的免疫功能的部分恢复(Hirschhorn等,Nat.Genet.,1996,13,290-295;Stephan等,N.Engl.J.Med.,1996,335,1563-1567;Bousso等,Proc.Natl.,Acad.Sci.USA,2000,97,274-278;Wada等,Proc.Natl.Acad.Sci.USA,2001,98,8697-8702;Nishikomori等,Blood,2004,103,4565-4572),(ii)体外校正造血细胞的SCID-X1缺陷(Candotti等,Blood,1996,87,3097-3102;Cavazzana-Calvo等,Blood,1996,Blood,88,3901-3909;Taylor等,Blood,1996,87,3103-3107;Hacein-Bey等,Blood,1998,92,4090-4097),(iii)在动物模型中在体内校正SCID-X1(Soudais等,Blood,2000,95,3071-3077;Tsai等,Blood,2002,100,72-79)、JAK-3(Bunting等,Nat.Med.,1998,4,58-64;Bunting等,Hum.Gene Ther.,2000,11,2353-2364)和RAG2(Yates等,Blood,2002,100,3942-3949)缺陷,和(iv)基因治疗临床试验的结果(Cavazzana-Calvo等,Science,2000,288,669-672;Aiuti等,Nat.Med.,2002;8,423-425;Gaspar等,Lancet,2004,364,2181-2187)。
转让给Children’s Medical Center Corporation and the President andFellows of Harvard College的美国专利公开号20110182867涉及通过BCL11A表达或活性抑制子(例如RNAi和抗体)调节造血祖细胞中胎儿血红蛋白表达(HbF)的方法和用途。美国专利公开号20110182867中公开的靶标,例如BCL11A,可以被本发明的CRISPR Cas系统靶向用于调节胎儿血红蛋白表达。另见Bauer等(Science 11October 2013:Vol.342no.6155pp.253-257)和Xu等(Science 18November 2011:Vol.334no.6058pp.993-996)了解其他BCL11A靶标。
利用本领域的知识和本公开的教导,技术人员可以校正遗传性血液失调(例如,β-地中海贫血症、血友病或遗传性溶酶体贮积病)的HSC。
HSC-递送至和编辑造血干细胞;和特殊条件。
术语“造血干细胞”或“HSC”意指广泛地包括被认为是HSC的那些细胞,例如,产生所有其他血细胞并来自中胚层的血细胞;位于红骨髓中,其被包含在大多数骨骼的核中。本发明的HSC包括具有造血干细胞表型的细胞,其通过小尺寸、缺乏谱系(lin)标志物、以及属于分化系列簇的标志物来鉴定,例如:CD34、CD38、CD90、CD133、CD105、CD45和c-kit,干细胞因子的受体。造血干细胞对用于检测谱系定型的标志物是阴性的,因此称为Lin-;并且,在通过FACS纯化期间,多达14种不同的成熟血液谱系标志物,例如用于骨髓的CD13和CD33、用于红细胞的CD71、用于B细胞的CD19、用于人类的巨核细胞的CD61等;用于B细胞的B220(鼠CD45)、用于单核细胞的Mac-1(CD11b/CD18)、用于粒细胞的Gr-1、用于红细胞的Ter119、用于T细胞的Il7Ra、CD3、CD4、CD5、CD8等,小鼠HSC标志物:CD34lo/-、SCA-1+、Thy1.1+/lo、CD38+、C-kit+、lin-和人类HSC标志物:CD34+、CD59+、Thy1/CD90+、CD38lo/-、C-kit/CD117+,和lin-HSC被通过标志物鉴定。因此,在本文讨论的实施方式中,HSC可以是CD34+细胞。HSC也可以是CD34-/CD38-的造血干细胞。在本领域中被认为是HSC的细胞表面上可能缺乏c-kit的干细胞属于本发明的范围,以及CD133+细胞同样被认为是本领域的HSC。
可以将Cpf1 CRISPR(例如Cpf1)系统工程化以靶向HSC中的遗传基因座或基因座。可以制备Cas(例如Cpf1)蛋白和sgRNA,所述Cas蛋白有利地进行密码子优化以用于真核细胞,尤其是哺乳动物细胞,例如,人细胞,例如,HSC,所述sgRNA靶向HSC中基因座或基因座,例如,基因EMX1。这些可以通过颗粒递送。颗粒可以通过Cas(例如Cpf1)蛋白和gRNA混合形成。gRNA和Cas(例如Cpf1)蛋白的混合物可以例如与包含、基本由其组成或由表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇组成的混合物混合,由此形成含有gRNA和Cas(例如Cpf1)蛋白的颗粒。本发明包括由这种方法制造的颗粒和颗粒以及其用途。
更一般地,可以使用有效的方法形成颗粒。首先,Cas(例如Cpf1)蛋白与靶向基因EMX1或对照基因LacZ的gRNA可以以合适的例如3:1至1:3或2:1至1:2或1:1的摩尔比,在合适的温度下,例如15-30℃,例如20-25℃,例如室温,在合适的时间,例如15-45,例如30分钟,有利地在无菌的无核酸酶的缓冲液中,例如1×PBS中混合在一起。单独地,颗粒组分例如或包含:表面活性剂,例如,阳离子脂质,例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP);磷脂,例如,二肉豆蔻酰磷脂酰胆碱(DMPC);可生物降解的聚合物,例如乙二醇聚合物或PEG,和脂蛋白,例如,低密度脂蛋白,例如,胆固醇,可以溶解在醇中,有利地是C1-6烷基醇,例如甲醇、乙醇、异丙醇,例如100%乙醇。可以将两种溶液混合在一起以形成含有Cas(例如Cpf1)-gRNA复合物的颗粒。在某些实施方式中,颗粒可含有HDR模板。这可以是与含有gRNA+Cas(例如Cpf1)蛋白的颗粒共同施用的颗粒,或者除了使HSC与含有gRNA+Cas(例如Cpf1)蛋白的颗粒接触外,还使HSC与包含HDR模板的粒子接触;或者使HSC与含有HDR模板的颗粒接触;或者使HSC与含有所有gRNA、Cas(例如Cpf1)和HDR模板的颗粒接触。HDR模板可以通过单独的载体施用,由此在第一种情况下颗粒穿透HSC细胞并且单独的载体也穿透细胞,其中HSC基因组由gRNA+Cas(例如Cpf1)修饰,并且HDR模板也存在,由此,基因组基因座由HDR修饰;例如,这可以导致校正突变。
在颗粒形成后,96孔板中的HSC可以每孔用15μg Cas(例如Cpf1)蛋白转染。转染后三天,可以收获HSC,并且可以量化EMX1基因座处的插入和缺失(插入缺失)的数量。
这说明了如何使用靶向HSC中一种或多种感兴趣的基因组基因座的Cpf1 CRISPR(例如Cpf1)来修饰HSC。待修饰的HSC可以在体内,即在生物体内,例如人或非人真核生物,例如动物,例如鱼,例如斑马鱼,哺乳动物,例如灵长类动物,例如,猿、黑猩猩、猕猴,啮齿动物,例如,小鼠、兔、大鼠、犬或狗,牲畜(牛/牛、绵羊/绵羊、山羊或猪),家禽或家禽,例如鸡。待修饰的HSC可以是体外的,即在这样的生物的外部。并且,经修饰的HSC可以离体使用,即,可以从生物体获得或分离这种生物体的一种或多种HSC,任选地可以扩增HSC,通过组合物来修饰HSC,所述组合物包含靶向HSC中的遗传基因座或基因座的Cpf1 CRISPR(例如Cpf1),例如,通过使HSC与所述组合物接触,其中组合物包含含有CRISPR酶和一种或多种靶向HSC中一种或多种遗传基因座的gRNA的颗粒,例如通过将gRNA和Cas(例如Cpf1)蛋白的混合物与包含以下,或基本上由以下组成或由以下组成的混合物混合而获得或可获得的颗粒:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇(其中一种或多种gRNA靶向HSC中的一种或多种遗传基因座),任选地扩增得到的经修饰的HSC和向生物体施用获得的经修饰的HSC。在一些情况下,分离的或获得的HSC可以来自第一生物,例如来自与第二生物相同物种的生物,所述第二生物可以是施用获得的经修饰的HSC至其的生物,例如,第一生物可以是第二生物的供体(例如亲本或兄弟姐妹中的亲属)。经修饰的HSC可具有基因修饰以解决或减缓或减轻个体或受试者或患者的疾病症状或病症状态。经修饰的HSC,例如,在第一生物供体至第二生物的情况下,可具有基因修饰以使HSC具有一种或多种蛋白质,例如更类似于第二生物的表面标志物或蛋白质。经修饰的HSC可以具有基因修饰以模拟个体或受试者或患者的疾病或病症状态,并且将被重新施用于非人生物以制备动物模型。HSC的扩展在本领域技术人员基于本公开和本领域的知识的范围内,参见,例如,Lee,“Improved ex vivoexpansion of adult hematopoietic stem cells by overcoming CUL4-mediateddegradation of HOXB4.”Blood.2013May 16;121(20):4082-9.doi:10.1182/blood-2012-09-455204.Epub 2013Mar 21。
如所指出的,为了改善活性,在将整个复合物配制成颗粒之前,可以将gRNA与Cas(例如Cpf1)蛋白预复合。制剂可以用已知的不同组分的不同摩尔比制成,以促进核酸向细胞内的递送(例如1,2-二油酰-3-三甲基铵-丙烷(DOTAP)、1,2-二十四烷酰基-sn-甘油-3-磷酸胆碱(DMPC)、聚乙二醇(PEG)和胆固醇)例如DOTAP:DMPC:PEG:胆固醇摩尔比可以是DOTAP 100,DMPC 0,PEG 0,胆固醇0;或DOTAP 90,DMPC 0,PEG 10,胆固醇0;或DOTAP 90,DMPC 0,PEG 5,胆固醇5。DOTAP 100,DMPC 0,PEG 0,胆固醇0。因此,本发明包括混合gRNA、Cas(例如Cpf1)蛋白和形成颗粒的组分;以及来自这种混合的颗粒。
在一个优选的实施方式中,含有Cas(例如Cpf1)-gRNA复合物的颗粒可以通过将Cas(例如Cpf1)蛋白和一种或多种gRNA一起,优选以1:1摩尔比的酶:指导RNA混合而形成。单独地,已知促进核酸递送的不同组分(例如DOTAP、DMPC、PEG和胆固醇)溶解,优选溶解在乙醇中。将两种溶液混合在一起以形成含有Cas(例如Cpf1)-gRNA复合物的颗粒。在形成颗粒后,可以将Cas(例如Cpf1)-gRNA复合物转染到细胞(例如,HSC)中。可以应用条形码。颗粒,Cas-9和/或gRNA可以是具有条形码。
本发明的一个实施方式包括制备含有gRNA和Cas(例如Cpf1)蛋白的颗粒的方法,所述方法包括将gRNA和Cas(例如Cpf1)蛋白的混合物与包含以下或基本上由以下组成或由以下组成的混合物混合:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和酒精。一个实施方式包括来自该方法的含有gRNA和Cas(例如Cpf1)蛋白的颗粒。在一个实施方式中,本发明包括颗粒在通过操纵感兴趣的基因组基因座中的靶序列来修饰感兴趣的基因组基因座或生物或非人生物的方法中的用途,所述方法包括将含有感兴趣的基因组基因座的细胞与颗粒接触,其中gRNA靶向感兴趣的基因组基因座;或通过操纵感兴趣的基因组基因座中的靶序列修饰感兴趣的基因组基因座或生物或非人生物的方法,所述方法包括将含有感兴趣的基因组基因座的细胞与颗粒接触,其中gRNA靶向感兴趣的基因组基因座。在这些实施方式中,感兴趣的基因组基因座有利地是HSC中的基因组基因座。
治疗应用的考虑因素:基因组编辑疗法中的考虑因素是序列特异性核酸酶的选择,例如Cpf1核酸酶的变体。每种核酸酶变体可具有其自身独特的优点和缺点,其中许多必须在治疗的上下文中平衡以最大化治疗益处。到目前为止,两种使用核酸酶的治疗性编辑方法已显示出显著的希望:基因破坏和基因校正。基因破坏涉及刺激NHEJ以在遗传元件中产生靶向插入缺失,通常导致对患者有益的丧失功能的突变。相反,基因校正使用HDR直接逆转引起疾病的突变,恢复功能,同时保持校正元件的生理调节。HDR还可用于将治疗性转基因插入基因组中限定的“安全港”基因座以恢复缺失的基因功能。为了使特定的编辑疗法有效,必须在靶细胞群中实现足够高水平的修饰以逆转疾病症状。该治疗性修饰“阈值”由治疗后编辑的细胞的适应性和逆转症状所需的基因产物的量决定。关于适应性,相对于未经编辑的对应物,对于治疗细胞编辑产生三种可能的结果:增加,中性或降低适应性。在适应性增加的情况下,例如在SCID-X1的治疗中,修饰的造血祖细胞相对于其未编辑的对应物选择性地扩增。SCID-X1是由IL2RG基因突变引起的疾病,其功能是造血细胞淋巴细胞谱系正常发育所必需的[Leonard,W.J.,等Immunological reviews 138,61-86(1994);Kaushansky,K.&Williams,W.J.Williams hematology,(McGraw-Hill Medical,New York,2010)]。在接受SCID-X1病毒基因治疗的患者的临床试验中,以及SCID-X1突变的自发校正的罕见例子中,校正的造血祖细胞可能能够克服这种发育障碍并相对于患病的对应物进行扩增以进行介导治疗[Bousso,P.,等Proceedings of the National Academy ofSciences of the United States of America 97,274-278(2000);Hacein-Bey-Abina,S.,等The New England journal of medicine 346,1185-1193(2002);Gaspar,H.B.,等Lancet 364,2181-2187(2004)]。在这种情况下,在编辑的细胞具有选择性优势的情况下,甚至可以通过扩增来扩增低数量的编辑细胞,从而为患者提供治疗益处。相比之下,编辑其他造血疾病,如慢性肉芽肿病(CGD),将不改变编辑的造血祖细胞的适应性,增加治疗修饰阈值。CGD由编码吞噬氧化酶蛋白的基因突变引起,吞噬氧化酶蛋白通常被嗜中性粒细胞用于产生杀死病原体的活性氧物质[Mukherjee,S.&Thrasher,A.J.Gene 525,174-181(2013)]。由于这些基因的功能障碍不影响造血祖细胞的适应性或发育,但仅影响成熟的造血细胞类型对抗感染的能力,因此在该疾病中可能没有编辑细胞的优先扩增。实际上,在基因治疗试验中没有观察到CGD中基因修正细胞的选择性优势,导致长期细胞植入困难[Malech,H.L.,等Proceedings of the National Academy of Sciences of the UnitedStates of America 94,12133-12138(1997);Kang,H.J.,等Molecular therapy:thejournal of the American Society of Gene Therapy 19,2092-2101(2011)]。因此,需要显著更高水平的编辑来治疗例如CGD之类的疾病,其中相对于编辑产生增加的靶细胞适应性的疾病,编辑产生中性适应性优势。如果编辑产生适合性缺点,如恢复癌细胞中肿瘤抑制基因的功能的情况,则经修饰的细胞将被其疾病对应物击败,导致治疗的益处相对于编辑率较低。后一类疾病特别难以用基因组编辑疗法治疗。
除了细胞适应性,治疗疾病所必需的基因产物的量也影响必须实现以逆转症状的治疗性基因组编辑的最低水平。B型血友病是一种疾病,其中基因产物水平的微小变化可导致临床结果的显著变化。这种疾病是由编码因子IX的基因的突变引起的,因子IX是一种通常由肝脏分泌到血液中的蛋白质,在那里它起到凝血级联反应的成分的作用。B型血友病的临床严重程度与因子IX活性的量有关。虽然严重疾病与不到1%的正常活性相关,但较轻微的疾病形式与大于1%的因子IX活性相关[Kaushansky,K.&Williams,W.J.Williamshematology,(McGraw-Hill Medical,New York,2010);Lofqvist,T.,等Journal ofinternal medicine 241,395-400(1997)]。这表明,能够将因子IX表达恢复到甚至一小部分肝细胞的编辑疗法可能对临床结果产生很大影响。一项使用ZFNs在出生后不久校正B型血友病小鼠模型的研究表明,3-7%的校正足以逆转疾病症状,为这一假设提供临床前证据[Li,H.,等Nature 475,217-221(2011)]。
其中基因产物水平的微小变化可以影响临床结果的失调和其中经编辑的细胞具有适应性优势的疾病是基因组编辑治疗的理想靶标,因为基于当前的技术治疗修饰阈值足够低,可以获得很高的成功率。靶向这些疾病现已成功地在临床前水平和I期临床试验中进行了编辑治疗。需要改良的DSB修复途径操控和核酸酶递送以将这些有希望的结果扩展到对经编辑的细胞具有中性适应性优势的疾病,或者其中需要更大量的基因产物用于治疗的疾病。下表显示了基因组编辑应用于治疗模型的一些实例,并且下表中的参考文献和那些参考文献中引用的文献在本文中通过引用并入本文,如同完整列出一样。
解决上表中的每个条件,使用Cpf1 CRISPR(例如Cpf1)系统通过HDR介导的突变校正或HDR介导的正确基因序列的插入来靶向,有利地通过本文的递送系统,例如颗粒递送系统,是在本领域技术人员基于本公开内容和本领域的知识的范围内。因此,一个实施方式包括使B型血友病、SCID(例如,SCID-X1、ADA-SCID)或携带遗传性酪氨酸血症突变的HSC与靶向B型血友病、SCID(例如,SCID-X1、ADA-SCID)或遗传性酪氨酸血症(例如,如Li、Genovese或Yin)相关的感兴趣的基因组基因座的含有gRNA和Cas(例如Cpf1)蛋白的颗粒接触。颗粒还可以包含合适的HDR模板来校正突变;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。在这方面,提到B型血友病是由编码因子IX(凝血级联的关键组分)的基因的功能丧失突变引起的X连锁隐性遗传病。在严重受影响的个体中将因子IX活性恢复至其水平的1%以上可以将疾病转化为显著更温和的形式,因为从年轻时起预防性地将重组因子IX输注到这些患者中以达到这样的水平在很大程度上改善了临床并发症。利用本领域的知识和本公开的教导,本领域技术人员可以使用靶向并校正突变(由编码因子IX的基因中的功能丧失突变引起的X-连锁隐性病症)(例如,使用合适的递送因子IX的编码序列的HDR模板)的Cpf1 CRISPR(例如Cpf1)系统来校正B型血友病相关的HSC;具体而言,gRNA可以靶向引起B型血友病的突变,并且HDR可以提供因子IX的正确表达的编码。靶向含有突变和Cas(例如Cpf1)蛋白的颗粒的gRNA与携带所述突变的HSC接触。所述颗粒还可含有合适的HDR模板以校正突变用于正确表达因子IX;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。可以施用如此接触的细胞;并任选地处理/扩展;参见Cartier,在本文中讨论。
在Cartier,“MINI-SYMPOSIUM:X-Linked Adrenoleukodystrophypa,Hematopoietic Stem Cell Transplantation and Hematopoietic Stem Cell GeneTherapy in X-Linked Adrenoleukodystrophy,”Brain Pathology 20(2010)857–862中,通过引用将其及其引用文献并入本文,如同完整列出一样,人们认识到同种异体造血干细胞移植(HSCT)被用于向患有Hurler病的患者的大脑递送正常的溶酶体酶,并讨论了HSC基因治疗以治疗ALD。在两名患者中,在粒细胞集落刺激因子(G-CSF)动员后收集外周CD34+细胞,并用骨髓增生性肉瘤病毒增强子、阴性对照区域缺失、dl587rev引物结合位点置换(MND)-ALD的慢病毒载体转导。在低浓度的细胞因子存在下,用MND-ALD载体转导患者的CD34+细胞16小时。在转导后冷冻转导的CD34+细胞以在5%的细胞上进行各种安全性测试,具体包括三种具有复制能力的慢病毒(RCL)测定。CD34+细胞的转导功效的范围为35%至50%,平均慢病毒整合拷贝数在0.65至0.70之间。在解冻转导的CD34+细胞后,在用白消安和环磷酰胺完全清髓后,用超过4.106转导的CD34+细胞/kg重新输注入患者。消融患者的HSC以促进基因校正的HSC的植入。两名患者在第13天和第15天之间发生血液学恢复。第一名患者在12个月时发生了几乎完全的免疫恢复,第二名患者在9个月时发生了几乎完全的免疫恢复。与使用慢病毒相反,基于本领域的知识和本公开的教导,本领域技术人员可以使用靶向并校正突变(例如,使用合适的HDR模板)的Cpf1CRISPR(Cpf1)系统来校正ALD的HSC;具体而言,gRNA可以靶向ABCD1中的突变,ABCD1是位于编码ALD(过氧化物酶体膜转运蛋白)的X染色体上的基因,并且HDR可以提供编码以正确表达蛋白质。将靶向含有突变和Cas(Cpf1)蛋白的颗粒的gRNA与HSC接触,例如携带如Cartier中的突变的CD34+细胞。该颗粒还可含有合适的HDR模板以校正过氧化物酶体膜转运蛋白表达的突变;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。如此接触的细胞任选地可以如Cartier中那样进行治疗。如此接触的细胞可以如Cartier中那样施用。
提及WO2015/148860,通过本文的教导,本发明包括结合本文的教导应用的这些文献的方法和材料。在血液相关疾病基因治疗的一个方面,用于治疗β地中海贫血的方法和组合物可以适应于本发明的Cpf1 CRISPR系统(参见,例如,WO2015/148860)。在一个实施方式中,WO2015/148860涉及治疗或预防β地中海贫血或其症状,例如,通过改变B细胞CLL/淋巴瘤11A(BCL11A)的基因。BCL11A基因也称为B细胞CLL/淋巴瘤11A、BCL11A-L、BCL11A-S、BCL11AXL、CTIP1、HBFQTL5和ZNF。BCL11A编码参与调节珠蛋白基因表达的锌指蛋白。通过改变BCL11A基因(例如,BCL11A基因的一个或两个等位基因),可以增加γ珠蛋白的水平。γ珠蛋白可以取代血红蛋白复合物中的β珠蛋白并有效地将氧气携带到组织中,从而改善β地中海贫血症的表型。
还提及WO2015/148863,并且通过本文的教导,本发明包括这些文献的方法和材料,其可以适应于本发明的Cpf1 CRISPR系统。在治疗和预防镰状细胞病(遗传性血液病)的方面,WO2015/148863包括改变BCL11A基因。通过改变BCL11A基因(例如,BCL11A基因的一个或两个等位基因),可以增加γ珠蛋白的水平。γ珠蛋白可以取代血红蛋白复合物中的β珠蛋白并有效地将氧气携带到组织中,从而改善镰状细胞病的表型。
在本发明的一个方面,通过适应本发明的Cpf1 CRISPR系统,可以理解涉及编辑靶核酸序列或调节靶核酸序列表达的方法和组合物,及其与癌症免疫疗法相关的应用。参考WO2015/161276中基因疗法的应用,其涉及可通过改变一种或多种T细胞表达的基因(例如,一种或多种FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC和/或TRBC基因)来用于影响T细胞增殖、存活和/或功能的方法和组合物。在相关的方面,通过改变一种或多种T细胞表达的基因,例如CBLB和/或PTPN6基因、FAS和/或BID基因、CTLA4和/或PDCDI和/或TRAC和/或TRBC基因,可以影响T细胞增殖。
嵌合抗原受体(CAR)19T细胞在患者恶性肿瘤中表现出抗白血病作用。然而,白血病患者通常没有足够的T细胞来收集,这意味着治疗必须涉及来自供体的经修饰的T细胞。因此,有兴趣建立供体T细胞库。Qasim等(“First Clinical Application of TalenEngineered Universal CAR19T Cells in B-ALL”ASH 57th Annual Meeting andExposition,Dec.5-8,2015,Abstract 2046(https://ash.confex.com/ash/2015/webprogram/Paper81653.htmlpublished online November 2015)讨论了修饰CAR19T细胞以通过破坏T细胞受体表达和CD52靶向来消除移植物抗宿主的疾病的风险。此外,靶向CD52细胞使得它们对阿仑单抗变得不敏感,因此允许阿仑单抗预防宿主介导的人白细胞抗原(HLA)错配的CAR19T细胞的排斥。研究人员使用编码与RQR8连接的4g7CAR19(CD19scFv-4-1BB-CD3ζ)的第三代自失活慢病毒载体,然后用两对TALEN mRNA电穿孔细胞以用于T细胞受体(TCR)α恒定链基因座和CD52基因座的多重靶向。使用CliniMacsα/βTCR耗尽法来耗尽仍然在离体扩增后表达TCR的细胞,产生具有<1%TCR表达的T细胞产物(UCART19),其中85%表达CAR19,并且64%变为CD52阴性。施用经修饰的CAR19T细胞以治疗患者的复发性急性淋巴细胞白血病。本文提供的教导提供了提供经修饰的造血干细胞及其后代的有效方法,包括但不限于骨髓和淋巴系血液细胞,包括T细胞、B细胞、单核细胞、巨噬细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、红细胞、树突细胞、巨核细胞或血小板、自然杀伤细胞及其前体和祖细胞。这样的细胞可以通过敲除、敲入或者以其他方式调节靶标(例如以如上所述去除或调节CD52和其他靶标(例如但不限于CXCR4和PD-1))来修改。因此,本发明的组合物,细胞和方法可用于调节免疫应答和治疗(但不限于)恶性肿瘤、病毒感染和免疫失调,同时修饰向患者施用T细胞或其他细胞。
提及WO2015/148670并且通过本文的教导,本发明包括结合本文的教导应用的该文献的方法和材料。在基因治疗的一个方面,包括用于编辑与人免疫缺陷病毒(HIV)和获得性免疫缺陷综合症(AIDS)相关或与之相关的靶序列的方法和组合物。在相关方面,本文所述的发明包括通过在CC趋化因子受体5型(CCR5)的基因中导入一个或多个突变来预防和治疗HIV感染和AIDS。CCR5基因也称为CKR5、CCR-5、CD195、CKR-5、CCCKR5、CMKBR5、IDDM22和CC-CKR-5。在另一方面,本文所述的发明包括提供以预防或减少HIV感染和/或预防或降低HIV进入宿主细胞的能力,例如,已经感染的受试者。HIV的示例性宿主细胞包括但不限于CD4细胞、T细胞、肠相关淋巴组织(GALT)、巨噬细胞、树突细胞、骨髓前体细胞和小胶质细胞。病毒进入宿主细胞需要病毒糖蛋白gp41和gp120与CD4受体和共同受体(例如CCR5)的相互作用。如果宿主细胞表面上不存在共同受体(例如CCR5),则病毒不能结合并进入宿主细胞。因此阻碍了疾病的进展。通过敲除或敲低宿主细胞中的CCR5,例如通过导入保护性突变(例如CCR5δ32突变),防止HIV病毒进入宿主细胞。
X连锁慢性肉芽肿病(CGD)是由于吞噬细胞NADPH氧化酶的活性不存在或降低而导致宿主防御的遗传性失调。使用Cpf1 CRISPR(Cpf1)系统,其靶向并校正突变(吞噬细胞NADPH氧化酶的缺失或降低的活性)(例如,使用合适的递送吞噬细胞NADPH氧化酶的编码序列的HDR模板);具体而言,gRNA可以靶向产生CGD(缺陷的吞噬细胞NADPH氧化酶)的突变,并且HDR可以提供编码以正确表达吞噬细胞NADPH氧化酶。将靶向含突变和Cas(Cpf1)蛋白的颗粒的gRNA与携带突变的HSC接触。该颗粒还可含有合适的HDR模板以校正突变以正确表达吞噬细胞NADPH氧化酶;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。可以施用如此接触的细胞;并任选地处理/扩展;cf.Cartier。
范可尼贫血症:至少15种基因中的突变(FANCA、FANCB、FANCC、FANCD1/BRCA2、FANCD2、FANCE、FANCF、FANCG,FANCI、FANCJ/BACH1/BRIP1、FANCL/PHF9/POG、FANCM、FANCN/PALB2、FANCO/Rad51C和FANCP/SLX4/BTBD12)可引起范可尼贫血。由这些基因产生的蛋白质参与称为FA途径的细胞过程。当制造新的DNA拷贝(称为DNA复制)时,FA途径开启(激活),而由于DNA损伤而被阻断。FA途径将某些蛋白质发送到损伤区域,从而触发DNA修复,从而可以继续进行DNA复制。FA途径具体响应于称为链间交联(ICL)的某种类型的DNA损伤。在相反的DNA链上的两个DNA构建块(核苷酸)异常附着或连接在一起时发生ICL,这阻止了DNA复制过程。ICL可以是由体内产生的有毒物质积聚或某些癌症治疗药物治疗引起的。与范可尼贫血相关的八种蛋白质组合在一起形成称为FA核心复合物的复合物。FA核心复合物激活两种蛋白质,称为FANCD2和FANCI。这两种蛋白质的活化使DNA修复蛋白质进入ICL区域,因此可以去除交联并继续DNA复制。FA核心复合物。更特别是,FA核心复合物是由FANCA、FANCB、FANCC、FANCE、FANCF、FANCG、FANCL和FANCM组成的核多蛋白复合物,起到E3泛素连接酶的作用并介导ID复合物的激活,所述ID复合物是由FANCD2和FANCI组成的异二聚体。一旦单一泛素化,它与FA途径下游的经典肿瘤抑制因子相互作用,包括FANCD1/BRCA2、FANCN/PALB2、FANCJ/BRIP1和FANCO/Rad51C,从而通过同源重组(HR)促进DNA修复。80-90%的FA病例是由于三种基因FANCA、FANCC和FANCG之一的突变引起的。这些基因提供了产生FA核心复合物组分的指示。与FA核心复合物相关的这些基因的突变将导致复合物无功能并破坏整个FA途径。结果,DNA损伤无法有效修复,ICL随着时间的推移而积累。Geiselhart,“ReviewArticle,Disrupted Signaling through the Fanconi Anemia Pathway Leads toDysfunctional Hematopoietic Stem Cell Biology:Underlying Mechanisms andPotential Therapeutic Strategies,”Anemia Volume 2012(2012),Article ID 265790,http://dx.doi.org/10.1155/2012/265790讨论了FA和动物实验,其涉及股骨内注射编码FANCC基因的慢病毒,导致体内HSC的校正。使用靶向与FA相关的一个或多个突变的Cpf1CRISPR(Cpf1)系统,例如具有gRNA和HDR模板(分别靶向一个或多个FANCA、FANCC或FANCG的突变)的Cpf1 CRISPR(Cpf1)系统,产生FA并提供FANCA、FANCC或FANCG中的一个或多个的校正表达;例如,gRNA可靶向FANCC的突变,并且HDR可以提供用于FANCC的正确表达的编码。将靶向含突变(例如,涉及FA的一个或多个,例如FANCA、FANCC或FANCG中的任何一种或多种的突变)和Cas(Cpf1)蛋白的颗粒的gRNA与携带突变的HSC接触。颗粒还可含有合适的HDR模板以校正突变,以正确表达在FA中涉及的一种或多种蛋白质,例如FANCA、FANCC或FANCG中的任何一种或多种;或者HSC可以与包含或递送HDR模板的第二颗粒或载体接触。可以施用如此接触的细胞;并任选地处理/扩增;参见Cartier。
本文讨论中的颗粒,例如,关于含有gRNA和Cas(Cpf1),任选地HDR模板,或HDR模板;例如关于B型血友病、SCID、SCID-X1、ADA-SCID、遗传性酪氨酸血症、β-地中海贫血、X连锁CGD、Wiskott-Aldrich综合征、范可尼贫血、肾上腺脑白质营养不良(ALD)、异染性脑白质营养不良(MLD)、HIV/AIDS、免疫缺陷病、血液病或遗传性溶酶体贮积病),可通过将gRNA和Cas(Cpf1)蛋白质的混合物(任选地含有HDR模板,或当期望关于模板的单独颗粒时,仅含有HDR模板的这样的混合物)与包含以下或基本上由以下组成或由以下组成的混合物相混合而有利地获得或可获得:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇组成(其中一种或多种gRNA靶向HSC中的一种或多种遗传基因座)。
实际上,本发明特别适合用基因组编辑治疗造血遗传疾病,和免疫缺陷疾病,例如遗传性免疫缺陷疾病,特别是通过使用本文讨论的颗粒技术。遗传免疫缺陷是其中本发明的基因组编辑干预可以成功的疾病。原因包括:免疫细胞是其子集的造血细胞是治疗可达的。它们可以从体内移除并自体移植或同种异体移植。此外,某些遗传性免疫缺陷,例如严重的联合免疫缺陷(SCID),对免疫细胞造成增殖不利。通过罕见的自发的“逆向”突变而校正导致SCID的遗传病变表明校正甚至一个淋巴细胞祖细胞可以足以恢复患者的免疫功能.../../../Users/t_kowalski/AppData/Local/Microsoft/Windows/Temporar yInternet Files/Content.Outlook/GA8VY8LK/Treating SCID for Ellen.docx-_ENREF_1参见Bousso,P.,等Diversity,functionality,and stability of the T cellrepertoire derived in vivo from a single human T cell precursor.Proceedingsof the National Academy of Sciences of the United States of America 97,274-278(2000)。经编辑的细胞的选择性优势允许甚至低水平的编辑以产生治疗效果。本发明的这种效果可以在SCID、Wiskott-Aldrich综合征和本文提到的其他病症中看到,包括其他遗传性造血疾病,例如α-和β-地中海贫血,其中血红蛋白缺乏对红系祖细胞的适应性产生负面影响。
NHEJ和HDR DSB修复的活性因细胞类型和细胞状态而显著不同。NHEJ不受细胞周期的高度调节,并且在细胞类型中是有效的,允许可接近的靶细胞群中的高水平基因破坏。相反,HDR主要在S/G2阶段起作用,因此仅限于活跃分裂的细胞,限制需要对有丝分裂细胞进行精确基因组修饰的治疗[Ciccia,A.&Elledge,S.J.Molecular cell 40,179-204(2010);Chapman,J.R.,等Molecular cell 47,497-510(2012)]。
通过HDR校正的效率可以通过靶基因座的表观遗传状态或序列,或者使用特定的修复模板构型(单链相对于双链,长相对于短同源臂)来控制[Hacein-Bey-Abina,S.,等TheNew England journal of medicine 346,1185-1193(2002);Gaspar,H.B.,等Lancet 364,2181-2187(2004);Beumer,K.J.,等G3(2013)]。NHEJ和HDR机器在靶细胞中的相对活性也可以影响基因校正效率,因为这些途径可以竞争解决DSB[Beumer,K.J.,等Proceedings ofthe National Academy of Sciences of the United States of America 105,19821-19826(2008)]。HDR还施加了NHEJ策略中未见到的递送挑战,因为它需要同时提供核酸酶和修复模板。在实践中,到目前为止,这些限制导致治疗相关细胞类型中HDR水平低。因此,临床转化在很大程度上集中于NHEJ策略以治疗疾病,尽管现在已经描述了概念验证的临床前HDR治疗用于B型血友病和遗传性酪氨酸血症的小鼠模型[Li,H.,等Nature 475,217-221(2011);Yin,H.,等Nature biotechnology 32,551-553(2014)]。
任何给定的基因组编辑应用可以包括蛋白质、小RNA分子和/或修复模板的组合,使得这些多个部分的递送实质上比小分子治疗更具挑战性。已经开发了两种用于递送基因组编辑工具的主要策略:离体和体内。在离体治疗中,将患病细胞从体内移除,编辑然后移植回患者体内。离体编辑具有的优点是可以很好地定义靶细胞群,并且可以指定递送至细胞的治疗分子的特定剂量。当脱靶修饰是顾虑时,后一种考虑可以特别重要,因为滴定核酸酶的量可以减少这种突变(Hsu等,2013)。由于用于蛋白质和核酸进入培养细胞中的用于研究和基因治疗应用的有效递送系统的开发,离体方法的另一个优点是通常可以获得高的编辑速率。
离体方法可能存在限制应用于少数疾病的缺点。例如,靶细胞必须能够在体外操作下存活。对于许多组织,例如大脑,在体外培养细胞是一项重大挑战,因为细胞不能存活,或失去其体内功能所必需的特性。因此,基于本公开内容和本领域的知识,使得能够通过Cpf1 CRISPR(Cpf1)系统对适合于离体培养和操作的成体干细胞群的组织进行离体治疗,例如造血系统。[Bunn,H.F.&Aster,J.Pathophysiology of blood disorders,(McGraw-Hill,New York,2011)]
体内基因组编辑涉及将编辑系统直接递送至其天然组织中的细胞类型。体内编辑允许治疗其中受影响的细胞群不适于离体操作的疾病。此外,将核酸酶递送至原位细胞允许治疗多种组织和细胞类型。这些特性可能允许体内治疗应用于比离体治疗更广泛的疾病。
迄今为止,通过使用具有确定的组织特异性趋性的病毒载体,已经在很大程度上实现了体内编辑。这些载体目前在携带货物的能力和趋性方面受到限制,这将这种治疗方式限制于在其中使用临床上有用的载体进行转导是有效的器官系统,例如肝脏、肌肉和眼睛[Kotterman,M.A.&Schaffer,D.V.Nature reviews.Genetics 15,445-451(2014);Nguyen,T.H.&Ferry,N.Gene therapy 11Suppl 1,S76-84(2004);Boye,S.E.,等Moleculartherapy:the journal of the American Society of Gene Therapy 21,509-519(2013)]。
体内递送的潜在障碍是响应于治疗所需的大量病毒而产生的免疫应答,但这种现象不是基因组编辑所独有的,并且在其他基于病毒的基因疗法中观察到[Bessis,N.,等Gene therapy 11Suppl 1,S10-17(2004)]。编辑核酸酶本身的肽也可能在MHC I类分子上呈递而刺激免疫反应,虽然没有证据支持这种情况发生在临床前水平。这种治疗模式的另一个主要困难是控制体内基因组编辑的核酸酶的分布和随后的剂量,导致可能难以预测的脱靶突变谱。然而,基于本公开和本领域的知识,包括使用基于病毒和颗粒的疗法用于治疗癌症、HSC的体内修饰,例如通过颗粒或病毒递送,是在技术人员的范围内。
体外编辑治疗:造血细胞的纯化、培养和移植的长期临床专业知识使得影响血液系统的疾病例如SCID、范可尼贫血、Wiskott-Aldrich综合征和镰状细胞贫血成为离体编辑疗法的焦点。关注造血细胞的另一个原因是,由于先前为血液失调设计基因疗法的努力,已经存在相对高效的递送系统。利用这些优点,这种治疗模式可以应用于其中编辑细胞具有适应性优势的疾病,使得少量移植的经编辑的细胞可以扩增和治疗疾病。一种这样的疾病是HIV,其中感染导致CD4+T细胞的适应性缺陷。
最近已将体外编辑疗法扩展到包括基因校正策略。Genovese及其同事最近的一篇论文克服了HDR离体的障碍,他们在从患有SCID-X1的患者获得的造血干细胞(HSC)中实现了对突变的IL2RG基因的基因校正[Genovese,P.,等Nature 510,235-240(2014)]。Genovese等使用多模式策略在HSC中完成基因校正。首先,使用含有编码用于IL2RG的治疗cDNA的HDR模板的整合缺陷型慢病毒转导HSC。转导后,用编码靶向IL2RG中的突变热点的ZFN的mRNA电穿孔细胞以刺激基于HDR的基因校正。为了提高HDR率,用小分子优化培养条件以促进HSC分裂。通过优化的培养条件、核酸酶和HDR模板,来自SCID-X1患者的基因校正的HSC以治疗相关的比率在培养中获得。来自未受影响的个体的HSC经历了相同的基因校正步骤,可以维持小鼠的长期造血功能(HSC功能的金标准)。HSC能够产生所有造血细胞类型并且可以自体移植,使其成为针对所有造血遗传疾病的极其有价值的细胞群[Weissman,I.L.&Shizuru,J.A.Blood 112,3543-3553(2008)]。原则上,基因校正的HSC可用于治疗多种遗传性血液疾病,使该研究成为治疗性基因组编辑的一个令人兴奋的突破。
体内编辑疗法:可以基于本公开和本领域的知识中有利地使用体内编辑。对于有效递送的器官系统,已经有许多令人兴奋的临床前治疗成功。成功的体内编辑疗法的第一个实例在B型血友病小鼠模型中得到证实[Li,H.,等Nature 475,217-221(2011)]。如前所述,B型血友病是由编码因子IX的基因中的功能丧失突变引起的X连锁隐性疾病,因子IX是凝血级联的关键组分。在严重受影响的个体中将因子IX活性恢复至其水平的1%以上可以将疾病转化为显著更温和的形式,因为从年轻时起预防性地将重组因子IX输注到这些患者中以达到这样的水平在很大程度上改善了临床并发症[Lofqvist,T.,等Journal ofinternal medicine 241,395-400(1997)]。因此,仅需要低水平的HDR基因校正来改变患者的临床结果。此外,因子IX由肝脏合成和分泌,肝脏是可以通过编码编辑系统的病毒载体有效转导的器官。
使用编码ZFN的肝细胞腺相关病毒(AAV)血清型和校正HDR模板,在鼠的肝脏的突变人源化因子IX基因中实现了至多7%的基因校正[Li,H.,等Nature 475,217-221(2011)]。这导致凝块形成动力学(凝血级联的功能的测量指标)的改善,首次证实体内编辑疗法不仅可行,而且有效。如本文所讨论的,本领域技术人员根据本文的教导和本领域的知识(例如,Li)通过颗粒治疗B型血友病,所述颗粒含有HDR模板和靶向X连锁隐形疾病的突变的Cpf1 CRISPR(Cpf1)系统以逆转功能丧失突变。
在本文中研究的基础上,其他研究小组最近利用Cpf1 CRISPR对肝脏进行体内基因组编辑,成功治疗了遗传性酪氨酸血症的小鼠模型,并产生了可以预防心血管疾病的突变。这两个不同的应用证实了这种方法对于涉及肝功能障碍的疾病的多功能性[Yin,H.,等Nature biotechnology 32,551-553(2014);Ding,Q.,等Circulation research 115,488-492(2014)]。将体内编辑应用于其他器官系统是必要的,用以证实该策略可广泛应用。目前,正在努力优化病毒和非病毒载体,以扩大可用这种治疗方式治疗的疾病范围[Kotterman,M.A.&Schaffer,D.V.Nature reviews.Genetics 15,445-451(2014);Yin,H.,等Nature reviews.Genetics 15,541-555(2014)]。如本文所讨论的,本领域技术人员基于本文的教导和本领域的知识(例如,Yin)立足于用含有HDR模板和靶向突变的Cpf1 CRISPR(Cpf1)系统的颗粒来治疗遗传性酪氨酸血症。
靶向缺失,治疗应用:基因的靶向缺失可以是优选的。因此,优选涉及免疫缺陷失调、血液病或遗传性溶酶体贮积病的基因,例如B型血友病、SCID、SCID-X1、ADA-SCID、遗传性酪氨酸血症、β-地中海贫血、X-连锁的CGD、Wiskott-Aldrich综合征、范可尼贫血、肾上腺脑白质营养不良(ALD)、异染性脑白质营养不良(MLD)、HIV/AIDS、其他代谢紊乱、编码与疾病有关的错误折叠蛋白的基因、导致与疾病有关的功能丧失的基因;通常,使用任何本文所述的递送系统可以在HSC中靶向的突变,颗粒系统被认为是有利的。
在本发明中,按照Tangri等人首次提出的与促红细胞生成素相关的并随后开发的方法可以特别地降低CRISPR酶的免疫原性。因此,定向进化或合理设计可用于降低宿主物种(人或其他物种)中CRISPR酶(例如Cpf1)的免疫原性。
基因组编辑:本发明的CRISPR/Cas(Cpf1)系统可用于校正先前使用TALEN和ZFN和慢病毒进行尝试的有限成功的基因突变,包括本文所讨论的;还参见WO2013163628。
治疗脑、中枢神经和免疫系统的疾病
本发明还考虑将Cpf1 CRISPR系统递送至脑或神经元。例如,RNA干扰(RNAi)通过降低HTT(亨廷顿氏病的致病基因)的表达为该病症提供治疗潜力(参见,例如,McBride等,Molecular Therapy vol.19no.12Dec.2011,pp.2152-2162),因此申请人假定它可以用于和/或适应于Cpf1 CRISPR系统。可以使用算法产生Cpf1 CRISPR系统以降低反义序列的脱靶潜力。Cpf1 CRISPR序列可靶向小鼠、恒河猴或人类亨廷顿蛋白的外显子52中的序列,并在病毒载体如AAV中表达。包括人在内的动物可以注射每个半球大约三次微注射(总共六次注射):第一次,前连合的前侧1mm(12μl)和剩余两次注射(分别为12μl和10μl),间隔第一次注射尾部3和6毫米,1e12vg/ml的AAV,速度约1μl/分钟,将针留在原位额外5分钟以使注射液从针尖扩散。
DiFiglia等(PNAS,October 23,2007,vol.104,no.43,17204–17209)观察到单次施用靶向Htt的siRNA至成体纹状体可使突变Htt沉默,减弱神经元病理,并延迟在快速发作的病毒转基因小鼠HD模型中观察到的异常行为表型。DiFiglia将10μM的2μl Cy3标记的cc-siRNA-Htt或未缀合的siRNA-Htt经纹状体内注射小鼠。在本发明中可以考虑用于人的类似剂量的靶向Htt的CRISPR Cas,例如,可以经纹状体内注射约5-10ml 10μM的靶向Htt的CRISPR Cas。
在另一个例子中,Boudreau等(Molecular Therapy vol.17no.6june 2009)将5μl表达htt特异性RNAi病毒(4×1012病毒基因组/ml)的重组AAV血清型2/1载体注射到纹状体(straiatum)中。在本发明中可以考虑用于人的类似剂量的靶向Htt的CRISPR Cas,例如,可以经纹状体内注射约10-20ml的4×1012病毒基因组/ml的靶向Htt的CRISPR Cas。
在另一个实例中,可以连续施用靶向HTT的CRISPR Cas(参见,例如,Yu等,Cell150,895–908,August 31,2012)。Yu等人利用递送0.25毫升/小时的渗透泵(型号2004)以递送300毫克/天的ss-siRNA或磷酸盐缓冲盐水(PBS)(Sigma Aldrich)28天,并设计递送0.5μl/hr的泵(型号2002)用于递送75mg/天阳性对照MOE ASO 14天。泵(Durect Corporation)填充有在无菌PBS中稀释的ss-siRNA或MOE,然后在植入前于37℃孵育24或48个小时(型号2004)。用2.5%异氟烷麻醉小鼠,并在颅底进行中线切口。使用立体定位导向器,将插管植入右侧脑室并用Loctite粘合剂固定。将连接到Alzet渗透微型泵的导管连接到套管上,并将泵皮下放置在中间(midscapular)区域中。切口用5.0尼龙缝线封闭。在本发明中可以考虑用于人的类似剂量的靶向Htt的CRISPR Cas,例如,可以施用约500至1000g/天靶向Htt的CRISPR Cas。
在另一种连续输注的实例中,Stiles等(Experimental Neurology 233(2012)463–471)将带有钛针尖的实质内导管植入右侧壳核中。将导管连接到皮下植入腹部的II泵(Medtronic Neurological,Minneapol Is,MN)。在以6μL/天输注磷酸盐缓冲盐水7天后,用测试物质重新填充泵并编程为连续递送7天。以约0.1至0.5μL/min的不同输注速率输注约2.3至11.52mg/天的siRNA。在本发明中可以考虑用于人的类似剂量的靶向Htt的CRISPR Cas,例如,可以施用约20至200mg/天靶向Htt的CRISPR Cas。在另一个实例中,转让给Sangamo的美国专利公开号20130253040的方法也可以从TALES适应为用于治疗亨廷顿氏病的本发明的核酸靶向系统。
在另一个实例中,转让给Sangamo的美国专利公开号20130253040(WO2013130824)的方法也可以从TALES适应为用于治疗亨廷顿氏病的本发明的CRISPR Cas系统。
以The Broad Institute等的名义的WO2015089354A1,通过引用并入本文,描述了用于亨廷顿氏病(HP)的靶标。关于亨廷顿氏病的CRISPR复合物的可能靶基因:PRKCE;IGF1;EP300;RCOR1;PRKCZ;HDAC4;和TGM2。因此,PRKCE;IGF1;EP300;RCOR1;PRKCZ;HDAC4和TGM2中的一个或多个可在本发明的一些实施方式中被选择作为亨廷顿氏病的靶标。
其他三核苷酸重复疾病。这些可以包括以下任何一种:I类包括亨廷顿氏病(HD)和脊髓小脑性共济失调;II类扩展在表型上是多样的,异质扩展通常很小,但也存在于基因的外显子中;和III类包括脆性X综合征、肌强直性营养不良、两种脊髓小脑性共济失调、青少年肌阵挛性癫痫和弗里德赖希氏共济失调。
本发明的另一方面涉及利用Cpf1 CRISPR系统来校正已经鉴定为与拉弗拉病相关的EMP2A和EMP2B基因中的缺陷。拉弗拉病是一种常染色体隐性遗传病,其特征是进行性肌阵挛性癫痫,其可能在青春期开始为癫痫发作。一些疾病病例可能是由尚待鉴定的基因突变引起的。这种疾病导致癫痫发作,肌肉痉挛,行走困难,痴呆,最终导致死亡。目前没有已证实有效对抗疾病进展的疗法。与癫痫相关的其他遗传异常也可以被Cpf1 CRISPR系统靶向,并且潜在的遗传学在Genetics of Epilepsy and Genetic Epilepsies,edited byGiuliano Avanzini,Jeffrey L.Noebels,Mariani Foundation Paediatric Neurology:20;2009)中进一步描述。
转让给Sangamo BioSciences,Inc.的美国专利公开号20110158957的方法涉及失活的T细胞受体(TCR)基因也可以为被修饰为本发明的CRISPR Cas系统。在另一个实例中,转让给Sangamo BioSciences,Inc.的美国专利公开号20100311124和转让给Cellectis的美国专利公开号20110225664的方法,也涉及失活谷氨酰胺合成酶基因表达基因也可以被修饰为本发明的CRISPR Cas系统。
大脑的递送选择包括将CRISPR酶和指导RNA以DNA或RNA的形式包封到脂质体中并与分子特洛伊木马缀合以进行跨血脑屏障(BBB)递送。已显示分子特洛伊木马对于将B-gal表达载体递送到非人灵长类动物的脑中是有效的。相同的方法可用于递送含有CRISPR酶和指导RNA的载体。例如,Xia CF and Boado RJ,Pardridge WM("Antibody-mediatedtargeting of siRNA via the human insulin receptor using avidin-biotintechnology."Mol Pharm.2009May-Jun;6(3):747-51.doi:10.1021/mp800194)描述了通过联合使用受体特异性单克隆抗体(mAb)和亲和素-生物素技术将短干扰RNA(siRNA)递送至培养的和体内的细胞如何是可能的。作者还报道,因为靶向mAb和siRNA之间的键合使用亲和素-生物素技术是稳定的,并且在静脉内施用靶向siRNA后在体内观察到在远端位点例如脑的RNAi效应。
Zhang等(Mol Ther.2003Jan;7(1):11-8.))描述了编码报告基因例如荧光素酶的表达质粒如何被包裹在由85nm聚乙二醇化免疫脂质体组成的“人工病毒”内部,其通过人胰岛素受体(HIR)的单克隆抗体(MAb)被靶向至恒河猴脑的体内。HIRMAb使携带外源基因的脂质体在静脉注射后能够进行转胞吞作用穿过血脑屏障和进行内吞作用通过神经元质膜。恒河猴的脑中荧光素酶基因表达水平相对于大鼠高50倍。通过组织化学和共聚焦显微镜证实了灵长类动物脑中β-半乳糖苷酶基因的广泛神经元表达。作者指出,这种方法使成人可逆性转基因在24小时内成为可能。因此,优选使用免疫脂质体。这些可以与抗体缀合使用以靶向特定组织或细胞表面蛋白。
阿尔茨海默氏病
美国专利公开号20110023153描述了锌指核酸酶用于基因修饰与阿尔茨海默氏病相关的细胞、动物和蛋白质的用途。一旦被修饰,细胞和动物可以使用已知方法进行进一步测试,使用AD研究中常用的测量方法研究靶向突变对AD发展和/或进展的影响-例如,但不限于,学习和记忆、焦虑、抑郁、成瘾和感觉运动功能以及测量行为、功能、病理、代谢和生化功能的测定法。
本公开包括编辑编码与AD相关的蛋白质的任何染色体序列。通常基于AD相关蛋白与AD病症的实验关联来选择AD相关蛋白。例如,相对于没有AD病症的群体,AD相关蛋白的产生速率或循环浓度在具有AD病症的群体中可升高或降低。蛋白质水平的差异可以使用蛋白质组学技术来评估,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱。或者,AD相关蛋白可通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定,所述基因组技术包括但不限于DNA微阵列分析、基因表达系列分析(SAGE)和定量实时聚合酶链反应(Q-PCR)。
阿尔茨海默病相关蛋白的实例可包括,例如,由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的泛素样修饰物激活酶1(UBA1)或由UBA3基因编码的NEDD8激活酶E1催化亚基蛋白质(UBE1C)。
作为非限制性实例,与AD相关的蛋白质包括但不限于如下列出的蛋白质:染色体序列编码蛋白ALAS2δ-氨基乙酰丙酸合成酶2(ALAS2)ABCA1 ATP结合盒转运蛋白(ABCA1)ACE血管紧张素I转换酶(ACE)APOE载脂蛋白E前体(APOE)APP淀粉样蛋白前体蛋白(APP)AQP1水通道蛋白1蛋白(AQP1)BIN1 Myc盒依赖性相互作用蛋白1或桥接整合子1蛋白(BIN1)BDNF脑源性神经营养因子(BDNF)BTNL8丁酰胆碱样蛋白8(BTNL8)C1ORF49染色体1开放阅读框49 CDH4钙粘蛋白-4 CHRNB2神经元乙酰胆碱受体亚基β-2CKLFSF2 CKLF样MARVEL跨膜结构域蛋白2(CKLFSF2)CLEC4E C型凝集素结构域4,成员e(CLEC4E)CLU丛生蛋白(也称为载脂蛋白J),CR1红细胞补体受体1(CR1,也称为CD35,C3b/C4b受体和免疫粘附受体),CR1L红细胞补体受体1(CR1L),CSF3R粒细胞集落刺激因子3受体(CSF3R),CST3胱抑素C或胱抑素3,CYP2C细胞色素P450 2C,DAPK1死亡相关蛋白激酶1(DAPK1),ESR1雌激素受体1,IgA受体的FCAR Fc片段(FCAR,也称为CD89),IgG的FCGR3B Fc片段,低亲和力IIIb,受体(FCGR3B或CD16b),FFA2游离脂肪酸受体2(FFA2),FGA纤维蛋白原(因子I),GAB2 GRB2-相关结合蛋白2(GAB2),GAB2 GRB2相关结合蛋白2(GAB2),GALP甘丙肽样肽,GAPDHS甘油醛-3-磷酸脱氢酶,生精(GAPDHS),GMPB GMBP HP触珠蛋白(HP),HTR7 5-羟色胺(血清素)受体7(腺苷酸环化酶偶联),IDE胰岛素降解酶,IF127 IF127 IFI6干扰素,α诱导蛋白6(IFI6)IFIT2干扰素诱导蛋白与四十肽重复2(IFIT2),IL1RN白细胞介素-1受体拮抗剂(IL-1RA),IL8RA白细胞介素8受体,α(IL8RA或CD181),IL8RB白细胞介素8受体,β(IL8RB),JAG1锯齿状1(JAG1),KCNJ15钾内向整流通道,亚家族J,成员15(KCNJ15),LRP6低密度脂蛋白受体相关蛋白6(LRP6),MAPT微管相关蛋白tau(MAPT),MARK4MAP/微管亲和力-调节激酶4(MARK4),MPHOSPH1 M期磷蛋白1MTHFR5,10-亚甲基四氢叶酸还原酶MX2干扰素诱导的GTP结合蛋白Mx2 NBN尼布林,也称为NBN NCSTN尼克斯汀NIACR2烟酸受体2(NIACR2,也称为GPR109B)NMNAT3烟酰胺核苷酸腺苷酰转移酶3NTM神经调节素(或HNT)ORM1Orosmucoid1(ORM1)或α-1-酸糖蛋白1P2RY13P2Y嘌呤受体13(P2RY13)PBEF1烟酰胺磷酸核糖转移酶(NAmPRTase或Nampt)也称为前B细胞集落增强因子1(PBEF1)或内脂素PCK1磷酸烯醇丙酮酸羧激酶PICALM磷脂酰肌醇结合网格蛋白装配蛋白(PICALM)PLAU尿激酶型纤溶酶原激活剂(PLAU)PLXNC1丛蛋白C1(PLXNC1)PRNP朊病毒蛋白PSEN1早老蛋白1蛋白(PSEN1)PSEN2早老蛋白2蛋白(PSEN2)PTPRA蛋白酪氨酸磷酸酶受体A型蛋白(PTPRA)RALGPS2Ral GEF具有PH结构域和SH3结合基序2(RALGPS2)G蛋白信号类2的RGSL2调节子(RGSL2)SELENBP1硒结合蛋白1(SELNBP1)SLC25A37铁转铁蛋白-1SORL1分拣蛋白相关受体L(DLR类)A含有重复序列的蛋白质(SORL1)TF转铁蛋白TFAM线粒体转录因子A TNF肿瘤坏死因子TNFRSF10C肿瘤坏死因子受体超家族成员10C(TNFRSF10C)TNFSF10肿瘤坏死因子受体超家族,(TRAIL)成员10a(TNFSF10)UBA1泛素样修饰物激活酶1(UBA1)UBA3NEDD8激活酶E1催化亚基蛋白(UBE1C)UBB泛素B蛋白(UBB)UBQLN1 Ubiquilin-1UCHL1泛素羧基末端酯酶L1蛋白(UCHL1)UCHL3泛素羧基末端水解酶同工酶L3蛋白(UCHL3)VLDLR极低密度脂蛋白受体蛋白(VLDLR)
在示例性实施方式中,其染色体序列被编辑的与AD相关的蛋白质可以是由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR),由UBA1基因编码的泛素样修饰物激活酶1(UBA1),由UBA3基因编码的NEDD8活化酶E1催化亚基蛋白(UBE1C),由AQP1基因编码的水通道蛋白1蛋白(AQP1),由UCHL1基因编码的泛素羧基末端酯酶L1蛋白(UCHL1),由UCHL3基因编码的泛素羧基末端水解酶同工酶L3蛋白(UCHL3),由UBB基因编码的泛素B蛋白(UBB),由MAPT基因编码的微管相关蛋白tau(MAPT),由PTPRA基因编码的蛋白酪氨酸磷酸酶受体A型蛋白质(PTPRA),由PICALM基因编码的磷脂酰肌醇结合网格蛋白装配蛋白(PICALM),由CLU基因编码的簇蛋白(也称为载脂蛋白J),由PSEN1基因编码的早老素1蛋白,由PSEN2基因编码的早老素2蛋白分拣蛋白相关受体L(DLR类)A由SORL1基因编码的含重复蛋白(SORL1)蛋白,APP基因编码的淀粉样蛋白前体蛋白(APP),APOE编码的载脂蛋白E前体(APOE)基因,或由BDNF基因编码的脑源性神经营养因子(BDNF)。在一个示例性实施方式中,基因修饰的动物是大鼠,经编辑的与AD相关的蛋白质的染色体序列如下:APP淀粉样蛋白前体蛋白(APP)NM_019288 AQP1水通道蛋白1蛋白(AQP1)NM_012778 BDNF脑源性神经营养因子NM_012513CLU簇蛋白(也称为NM_053021载脂蛋白J)MAPT微管相关蛋白NM_017212tau(MAPT)PICALM磷脂酰肌醇结合NM_053554网格蛋白装配蛋白(PICALM)PSEN1早老蛋白1蛋白质(PSEN1)NM_019163 PSEN2早老蛋白2蛋白(PSEN2)NM_031087 PTPRA蛋白酪氨酸磷酸酶NM_012763受体A型蛋白(PTPRA)SORL1分拣蛋白相关受体L(DLRNM_053519,类)含有重复序列XM_001065506,蛋白质(SORL1)XM_217115 UBA1泛素样修饰物激活NM_001014080酶1(UBA1)UBA3 NEDD8激活酶E1 NM_057205催化亚基蛋白(UBE1C)UBB泛素B蛋白(UBB)NM_138895UCHL1泛素羧基末端NM_017237酯酶L1蛋白(UCHL1)UCHL3泛素羧基末端NM_001110165水解酶同工酶L3蛋白(UCHL3)VLDLR极低密度脂蛋白NM_013155受体蛋白(VLDLR)
动物或细胞可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个编码与AD相关的蛋白质的破坏的染色体序列,和0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个编码与AD相关的蛋白质的染色体整合的序列。
编辑的或整合的染色体序列可以被修饰以编码与AD相关的改变的蛋白质。AD相关染色体序列中的许多突变与AD相关。例如,APP中的错义突变V7171(即位置717处的缬氨酸变为异亮氨酸)导致家族性AD。早老素-1蛋白中的多个突变,例如H163R(即163位的组氨酸变为精氨酸)、A246E(即246位的丙氨酸变为谷氨酸)、L286V(即286位的亮氨酸变为缬氨酸)和C410Y(即410位的半胱氨酸变为酪氨酸)引起家族性阿尔茨海默病3型。早老素-2蛋白的突变,例如N141I(即141位的天冬酰胺变为异亮氨酸)、M239V(即239位的蛋氨酸变为缬氨酸)和D439A(即439位的天冬氨酸变为丙氨酸),引起家族性阿尔茨海默氏病4型。本领域已知AD相关基因和疾病中基因变异体的其他关联。例如,参见Waring等(2008)Arch.Neurol.65:329-334,其通过引用整体并入本文。
分泌酶病症
美国专利公开号20110023146描述了锌指核酸酶用于基因修饰与分泌酶相关病症相关的细胞、动物和蛋白质的用途。分泌酶对于将前蛋白质加工成其生物活性形式是必不可少的。分泌酶途径的各种组分中的缺陷导致许多病症,特别是具有标志性淀粉样蛋白形成或淀粉样斑块的病症,例如阿尔茨海默氏病(AD)。
分泌酶病症和与这些病症相关的蛋白质是一组多样的蛋白质,其影响对许多病症的易感性、病症的存在、病症的严重性或其任何组合。本公开包括编辑编码与分泌酶病症相关的蛋白质的任何染色体序列。通常基于分泌酶相关蛋白与分泌酶病症的发展的实验关联来选择与分泌酶病症相关的蛋白质。例如,相对于没有分泌酶病症的群体,在具有分泌酶病症的群体中,与分泌酶病症相关的蛋白质的产生速率或循环浓度可升高或降低。蛋白质水平的差异可以使用蛋白质组学技术评估,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱。或者,与分泌酶病症相关的蛋白质可以通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定,所述基因组技术包括但不限于DNA微阵列分析、基因表达的连续分析(SAGE)和定量实时聚合酶链反应(Q-PCR)。
作为非限制性实例,与分泌酶病症相关的蛋白质包括PSENEN(早老素增强子2同源物(秀丽隐杆线虫)),CTSB(组织蛋白酶B),PSEN1(早老素1),APP(淀粉样蛋白β(A4)前体蛋白),APH1B(前咽缺陷1同源B(秀丽隐杆线虫)),PSEN2(早老素2(阿尔茨海默病4)),BACE1(β-位点APP-裂解酶1),ITM2B(完整膜蛋白2B),CTSD(组织蛋白酶)D),NOTCH1(Notch同系物1,易位相关(果蝇)),TNF(肿瘤坏死因子(TNF超家族,成员2)),INS(胰岛素),DYT10(肌张力障碍10),ADAM17(ADAM金属肽酶结构域17),APOE(载脂蛋白E),ACE(血管紧张素I转换酶(肽酰二肽酶A)1),STN(他汀类),TP53(肿瘤蛋白p53),IL6(白细胞介素6(干扰素,β2)),NGFR(神经生长因子受体(TNFR超家族,成员16)),IL1B(白细胞介素1,β),ACHE(乙酰胆碱酯酶(Yt血型))),CTNNB1(连环蛋白(钙粘蛋白相关蛋白),β1,88kDa),IGF1(胰岛素样生长因子1(生长调节素C)),IFNG(干扰素,γ),NRG1(神经调节蛋白1),CASP3(半胱天冬酶3,凋亡相关的半胱氨酸肽酶),MAPK1(丝裂原活化蛋白激酶1),CDH1(钙粘蛋白1,1型,E-钙粘蛋白(上皮)),APBB1(淀粉样蛋白β(A4)前体蛋白结合,B家族,成员1(Fe65)),HMGCR(3-羟基-3-甲基戊二酰辅酶A还原酶),CREB1(cAMP反应元件结合蛋白1),PTGS2(前列腺素-内过氧化物合成酶2(前列腺素G/H合酶和环加氧酶)),HES1(分裂1的多毛和增强子,(果蝇)),CAT(过氧化氢酶),TGFB1(转化生长因子,β1),ENO2(烯醇酶2(γ,神经元)),ERBB4(v-erb-a成红细胞白血病病毒癌基因同源物4(禽)),TRAPPC10(转运蛋白质颗粒复合物10),MAOB(单胺氧化酶B)),NGF(神经生长因子(β多肽)),MMP12(基质金属肽酶12(巨噬细胞弹性蛋白酶)),JAG1(锯齿状1(Alagille综合征)),CD40LG(CD40配体),PPARG(过氧化物酶体增殖物激活受体γ),FGF2(成纤维细胞生长因子2(碱性)),IL3(白细胞介素3(集落刺激因子,多重)),LRP1(低密度脂蛋白受体相关蛋白1),NOTCH4(Notch同系物4(果蝇)),MAPK8(丝裂原活化蛋白激酶8),PREP(脯氨酰内肽酶),NOTCH3(Notch同系物3(果蝇)),PRNP(朊病毒蛋白),CTSG(组织蛋白酶G),EGF(表皮生长因子(β-尿抑胃素)),REN(肾素),CD44(CD44分子(印度血型)),SELP(选择素P(颗粒膜蛋白140kDa,抗原CD62)),GHR(生长激素受体),ADCYAP1(腺苷酸环化酶激活多肽1(垂体)),INSR(胰岛素受体),GFAP(胶质原纤维酸性蛋白),MMP3(基质金属肽酶3(基质溶素1,前积酶)),MAPK10(丝裂原活化蛋白激酶10),SP1(Sp1转录因子),MYC(v-myc骨髓细胞瘤病病毒致癌基因同源物(禽)),CTSE(组织蛋白酶E),PPARA(过氧化物酶体增殖物激活受体α),JUN(jun癌基因),TIMP1(TIMP金属肽酶抑制剂1),IL5(白细胞介素5(集落刺激因子,嗜酸性粒细胞)),IL1A(白细胞介素1,α),MMP9(基质金属肽酶9(明胶酶B,92kDa明胶酶,92kDa IV型胶原酶)),HTR4(5-羟色胺(血清素))受体4),HSPG2(硫酸乙酰肝素蛋白多糖2),KRAS(v-Ki-ras2基尔斯特大鼠肉瘤病毒致癌基因同源物),CYCS(细胞色素c,体细胞),SMG1(SMG1同源物,磷脂酰肌醇3激酶相关激酶(秀丽隐杆线虫)),IL1R1(白细胞介素1受体,I型),PROK1(前动力蛋白1),MAPK3(丝裂原活化蛋白激酶3),NTRK1(神经营养酪氨酸激酶,受体,1型),IL13(白细胞介素13),MME(膜金属内肽酶),TKT(转酮醇酶),CXCR2(趋化因子(C-X-C基序)受体2),IGF1R(胰岛素样生长因子1受体),RARA(视黄酸受体,α),CREBBP(CREB结合蛋白),PTGS1(前列腺素-内过氧化物合成酶1(前列腺素G/H合酶和环加氧酶)),GALT(半乳糖-1-磷酸尿苷酰转移酶),CHRM1(胆碱能受体,毒蕈碱1),ATXN1(共济失调蛋白1),PAWR(PRKC,细胞凋亡,WT1,调节子),NOTCH2(Notch同源物2(果蝇)),M6PR(甘露糖-6-磷酸受体(阳离子依赖性)),CYP46A1(细胞色素P450,家族46,亚家族A,多肽1),CSNK1D(酪蛋白激酶1,δ),MAPK14(丝裂原活化蛋白激酶14),PRG2(蛋白多糖2,骨髓(天然杀伤细胞激活剂,嗜酸性粒细胞主要基础蛋白)),PRKCA(蛋白激酶C,α),L1CAM(L1细胞粘附分子),CD40(CD40分子,TNF受体超家族成员5),NR1I2(核受体亚家族1,I组,成员2),JAG2(锯齿状2),CTNND1(连环蛋白(钙粘蛋白相关蛋白),δ1),CDH2(钙粘蛋白2,1型,N-钙粘蛋白(神经元)),CMA1(糜蛋白酶1,肥大细胞),SORT1(分拣蛋白1),DLK1(δ样1同源物(果蝇)),THEM4(硫酯酶超家族成员4),JUP(连接plakoglobin),CD46(CD46分子,补体调节蛋白),CCL11(趋化因子(C-C基序)配体11),CAV3(小窝3),RNASE3(核糖核酸酶,RNaseA家族,3(嗜酸性粒细胞阳离子蛋白质)),HSPA8(热休克70kDa蛋白8),CASP9(半胱天冬酶9,凋亡相关半胱氨酸肽酶),CYP3A4(细胞色素P450,家族3,亚家族A,多肽4),CCR3(趋化因子(CC基序)受体3),TFAP2A(转录因子AP-2α(活化增强子结合蛋白2α)),SCP2(甾醇载体蛋白2),CDK4(细胞周期蛋白依赖性激酶4),HIF1A(缺氧诱导因子1,α亚基(碱性螺旋-环-螺旋转录因子)),TCF7L2(转录因子7样2(T细胞特异性,HMG-box)),IL1R2(白细胞介素1受体,II型),B3GALTL(β1,3-半乳糖基转移酶样),MDM2(Mdm2p53结合蛋白同源物(小鼠)),RELA(v-rel网状内皮细胞增生病毒致癌基因同源物A(禽)),CASP7(半胱天冬酶7,凋亡相关半胱氨酸肽酶),IDE(胰岛素降解酶),FABP4(脂肪酸结合蛋白4,脂肪细胞),CASK(钙/钙调蛋白依赖性丝氨酸蛋白激酶(MAGUK家族)),ADCYAP1R1(腺苷酸环化酶激活多肽1(垂体)受体I型),ATF4(激活转录因子4(tax反应性增强子元件B67)),PDGFA(血小板衍生生长因子α多肽),C21或f33(染色体21开放阅读框33),SCG5(分泌粒V(7B2蛋白)),RNF123(无名指蛋白123),NFKB1(B细胞1中的κ轻链多肽基因增强子的核因子),ERBB2(v-erb-b2成红细胞白血病病毒致癌基因同源物2,神经/成胶质细胞瘤衍生的致癌基因同源物(禽)),CAV1(小窝1,细胞膜穴样蛋白,22kDa),MMP7(基质金属肽酶7)(溶素,子宫)),TGFA(转化生长因子,α),RXRA(维甲酸X受体,α),STX1A(突触1A(脑)),PSMC4(蛋白酶体(prosome,macropain)26S亚基,ATP酶,4),P2RY2(嘌呤能受体P2Y,G蛋白偶联,2),TNFRSF21(肿瘤坏死因子受体超家族,成员21),DLG1(圆盘,大同系物1(果蝇)),NUMBL(num同源物(果蝇)样),SPN(唾液酸蛋白),PLSCR1(磷脂刮酶1),UBQLN2(ubiquilin 2),UBQLN1(ubiquilin 1),PCSK7(前蛋白转化酶枯草杆菌蛋白酶/kexin 7型),SPON1(spondin 1,细胞外基质蛋白),SILV(银同源物(小鼠)),QPCT(谷氨酰胺-肽环转移酶),HESS(分裂5的毛发和增强子(果蝇)),GCC1(包含1的GRIP和卷曲螺旋结构域),及其任何组合。
基因修饰的动物或细胞可包含1、2、3、4、5、6、7、8、9、10更多个编码与分泌酶病症相关的蛋白质的破坏的染色体序列,和0、1、2、3、4、5、6、7、8、9、10或更多个编码与分泌酶病症相关的破坏的蛋白质的染色体整合序列。
ALS
美国专利公开号20110023144描述了锌指核酸酶用于基因修饰与肌萎缩侧索硬化(ALS)疾病相关的细胞、动物和蛋白质的用途。ALS的特征在于伴随自主运动的大脑皮层、脑干和脊髓中某些神经细胞的逐渐稳定退化。
运动神经元病症和与这些病症相关的蛋白质是一组多样的蛋白质,其影响对发展运动神经元病症的易感性、运动神经元病症的存在、运动神经元病症的严重性或其任何组合。本公开包括编辑编码与ALS疾病(特定运动神经元病症)相关的蛋白质的任何染色体序列。通常基于ALS相关蛋白与ALS的实验关联来选择与ALS相关的蛋白质。例如,相对于没有ALS的群体,在患有ALS的群体中,与ALS相关的蛋白质的产生速率或循环浓度可升高或降低。蛋白质水平的差异可以使用蛋白质组学技术评估,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱。或者,与ALS相关的蛋白质可以通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定,所述基因组技术包括但不限于DNA微阵列分析、基因表达的系列分析(SAGE)和定量实时聚合酶链反应(Q-PCR)。
作为非限制性实例,与ALS相关的蛋白质包括但不限于以下蛋白质:SOD1超氧化物歧化酶1,ALS3肌萎缩性侧面可溶性硬化症3SETX senataxin ALS5肌萎缩侧索硬化5FUS融合于肉瘤ALS7肌萎缩侧索硬化症7ALS2肌萎缩侧索DPP6二肽基肽酶6硬化2NEFH神经丝,重PTGS1前列腺素-多肽内过氧化物合酶1SLC1A2溶质载体家族1TNFRSF10B肿瘤坏死因子(神经胶质高亲和受体超家族,谷氨酸转运蛋白),成员10b成员2PRPH外周蛋白HSP90AA1热休克蛋白90kDaα(细胞溶质),A类成员1GRIA2谷氨酸受体,IFNG干扰素,γ离子型,AMPA 2S100BS100钙结合FGF2成纤维细胞生长因子2蛋白B AOX1醛氧化酶1CS柠檬酸合成酶TARDBP TARDNA结合蛋白TXN硫氧还蛋白RAPH1 Ras结合MAP3K5丝裂原活化蛋白(RaIGDS/AF-6)和激酶5pleckstrin同源结构域1NBEAL1 neurobeachin-like 1GPX1谷胱甘肽过氧化物酶1ICA1L胰岛细胞自身抗原RAC1ras相关C3肉毒杆菌1.69kDa样毒素底物1MAPT微管相关ITPR2肌醇1,4,5-蛋白tau三磷酸受体,2型ALS2CR4肌萎缩侧肌GLS谷氨酰胺酶硬化2(幼年)染色体区,候选4ALS2CR8肌萎缩侧CNTFR睫状神经营养因子硬化2(幼年)受体染色体区,候选8ALS2CR11肌萎缩侧FOLH1叶酸水解酶1硬化2(幼年)染色体区,候选11FAM117B家族具有序列P4HB脯氨酰4-羟化酶,相似性117,成员Bβ多肽CNTF睫状神经营养因子SQSTM1sequestosome 1STRADB STE20相关激酶NAIP NLR家族,凋亡适配子β抑制蛋白YWHAQ酪氨酸3-SLC33A1溶质载体家族33单加氧酶/tryptoph(乙酰-CoA转运蛋白),5-单加氧酶成员1活化蛋白,θ多肽TRAK2运输蛋白,4图4同源,SAC1驱动蛋白结合2脂质磷酸酶结构域含有NIF3L1NIF3NGG1相互作用INA internexin神经元因子3样1中间丝蛋白,αPARD3B par-3分配COX8A细胞色素c氧化酶缺陷3同源物B亚基VIIIA CDK15细胞周期蛋白依赖性激酶HECW1HECT,C2和WW15结构域含有E3泛素蛋白连接酶1NOS1一氧化氮合酶1MET met原癌基因SOD2超氧化物歧化酶2,HSPB1热休克27kDa线粒体蛋白1NEFL神经丝,轻CTSB组织蛋白酶B多肽ANG血管生成素,HSPA8热休克70kDa核糖核酸酶,RNaseA蛋白8家族,5VAPB VAMP(泡囊-ESR1雌激素受体1相关膜蛋白)-相关蛋白B和C SNCA突触核蛋白,αHGF肝细胞生长因子CAT过氧化氢酶ACTB肌动蛋白,βNEFM神经丝,中TH酪氨酸羟化酶多肽BCL2B细胞CLL/淋巴瘤2FAS Fas(TNF受体超家族,成员6)CASP3caspase 3,凋亡-CLU clusterin相关半胱氨酸肽酶SMN1运动神经元存活G6PD葡萄糖-6-磷酸1,端粒脱氢酶BAX BCL2相关X HSF1热休克转录蛋白因子1RNF19A无名指蛋白19AJUN jun致癌基因ALS2CR12肌萎缩侧HSPA5热休克70kDa硬化2(幼年)蛋白5染色体区,候选12MAPK14丝裂原活化蛋白IL10白细胞介素10激酶14APEX1APEX核酸酶TXNRD1硫氧还蛋白还原酶1(多功能DNA修复酶)1NOS2一氧化氮合酶2,TIMP1TIMP金属肽酶诱导型抑制子1CASP9 caspase9,凋亡-XIAP X连锁抑制子相关半胱氨酸凋亡肽酶GLG1高尔基糖蛋白1EPO促红细胞生成素VEGFA血管内皮ELN弹性蛋白生长因子A GDNF胶质细胞源性NFE2L2核因子(红细胞-神经营养因子衍生2)-样2SLC6A3溶质载体家族6HSPA4热休克70kDa(神经递质蛋白4转运蛋白,多巴胺),成员3APOE载脂蛋白E PSMB8蛋白酶体(prosome,macropain)亚基,β型,8DCTN1 dynactin 1TIMP3 TIMP金属肽酶抑制子3KIFAP3驱动蛋白相关SLC1A1溶质载体家族1蛋白3(神经元/上皮高亲和力谷氨酸转运蛋白,系统Xag),成员1SMN2存活运动神经元CCNC细胞周期蛋白C2,着丝粒MPP4膜蛋白,STUB1 STIP1同源性和U-棕榈酰化4盒含蛋白1ALS2淀粉样蛋白β(A4)PRDX6过氧化物酶6前体蛋白SYP突触素CABIN1钙调神经磷酸酶结合蛋白1CASP1 caspase1,凋亡-GART磷酸核糖基甘氨酸相关半胱氨酸脱甲酰转移酶,肽酶磷酸核糖基合成酶,磷酸核糖基氨基米唑合成酶CDK5细胞周期蛋白依赖性激酶5ATXN3 ataxin 3RTN4 reticulon 4C1QB补体成分1,q亚组分,B链VEGFC神经生长因子HTT亨廷顿受体PARK7帕金森病7XDH黄嘌呤脱氢酶GF AP胶质原纤维酸性MAP2微管相关蛋白2CYCS细胞色素c,IgG的体细胞FCGR3B Fc片段,低亲和力IIIb,CCS铜伴侣用于UBL5泛素样5超氧化物歧化酶MMP9基质金属肽酶SLC18A3溶质载体家族189((泡囊乙酰胆碱),成员3TRPM7瞬时受体HSPB2热休克27kDa潜在阳离子通道,蛋白质2亚家族M,成员7AKT1v-akt鼠胸腺瘤DERL1 Der1样结构域家族,病毒癌基因同源物1成员1CCL2趋化因子(C-C基序)NGRN neugrin,神经突配体2向外生长相关GSR谷胱甘肽还原酶TPPP3微管蛋白聚合促进蛋白家族成员3APAF1凋亡肽酶BTBD10BTB(POZ)结构域激活因子1含有10GLUD1谷氨酸CXCR4趋化因子(C-X-C基序)脱氢酶1受体4SLC1A3溶质载体家族1FLT1 fms相关酪氨酸(胶质高亲和力谷氨酸转运蛋白),成员3激酶1PON1对氧磷酶1AR雄激素受体LIF白血病抑制因子ERBB3v-erb-b2成红细胞白血病病毒癌基因同源物3LGALS1凝集素,半乳糖苷-CD44 CD44分子结合,可溶性,1TP53肿瘤蛋白p53 TLR3 toll样受体3GRIA1谷氨酸受体,GAPDH甘油醛-3-离子型,AMPA1磷酸脱氢酶GRIK1谷氨酸受体,DES结蛋白离子型,红藻氨酸盐1CHAT胆碱乙酰转移酶FLT4fms相关酪氨酸激酶4CHMP2B染色质修饰BAG1 BCL2相关蛋白2B athanogeneMT3金属硫蛋白3CHRNA4胆碱能受体,烟碱,α4GSS谷胱甘肽合成酶BAK1 BCL2-拮抗剂/杀手1KDR激酶插入结构域GSTP1谷胱甘肽S-转移酶受体(III型pi 1受体酪氨酸激酶)OGG1 8-氧鸟嘌呤DNA IL6白细胞介素6(干扰素,糖基化酶β2)。
动物或细胞可包含1、2、3、4、5、6、7、8、9、10或更多个编码与ALS相关的蛋白质的破坏的染色体序列,和0、1、2、3、4、5、6 7、8、9、10或更多个编码与ALS相关的破坏蛋白质的染色体整合序列。与ALS相关的优选蛋白质包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩侧索硬化2)、FUS(在肉瘤中融合)、TARDBP(TARDNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)和VAGFC(血管内皮生长因子C)及其任何组合。
自闭症
美国专利公开号20110023145描述了锌指核酸酶用于基因修饰与自闭症谱系障碍(ASD)相关的细胞、动物和蛋白质的用途。自闭症谱系障碍(ASD)是一组以社会交往和沟通中的定性损伤,和行为、兴趣和活动的限制重复和刻板模式为特征的障碍。三种病症:自闭症、阿斯伯格综合症(AS)和普遍存在的发育障碍-未另外规定(PDD-NOS),是同一种疾病的连续体,其具有与智力功能和医疗条件相关的不同程度的严重性。ASD主要是遗传决定的疾病,遗传率约为90%。
美国专利公开号20110023145包括编辑编码与ASD相关的蛋白质的任何染色体序列,其可以应用于本发明的CRISPR Cas系统。通常基于与ASD相关的蛋白质与ASD发病率或指征的实验关联来选择与AS相关的蛋白质。例如,相对于没有ASD的群体,在具有ASD的群体中,与ASD相关的蛋白质的产生速率或循环浓度可升高或降低。蛋白质水平的差异可以使用蛋白质组学技术评估,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱。或者,与ASD相关的蛋白质可以通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定,所述基因组技术包括但不限于DNA微阵列分析、基因表达的系列分析(SAGE)和定量实时聚合酶链反应(Q-PCR)。
可以与ASD相关蛋白质相关的疾病状态或病症的非限制性实例包括自闭症、阿斯伯格综合症(AS)、普遍存在的发育障碍-未另外规定(PDD-NOS)、Rett综合症、结节性硬化症、苯丙酮尿症、Smith-Lemli-Opitz综合症和脆性X综合症。作为非限制性实例,与ASD相关的蛋白质包括但不限于以下蛋白质:ATP10C氨基磷脂-MET MET受体转运ATP酶酪氨酸激酶(ATP10C)BZRAP1 MGLUR5(GRM5)代谢型谷氨酸受体5(MGLUR5)CDH10钙粘蛋白-10MGLUR6(GRM6)代谢型谷氨酸受体6(MGLUR6)CDH9钙粘蛋白-9NLGN1 Neuroligin-1 CNTN4接触素-4NLGN2Neuroligin-2 CNTNAP2接触素相关SEMA5A Neuroligin-3蛋白样2(CNTNAP2)DHCR77-脱氢胆固醇NLGN4X Neuroligin-4 X-还原酶(DHCR7)连接DOC2A双C2样结构域-NLGN4YNeuroligin-4 Y-含蛋白α连接DPP6二肽基NLGN5 Neuroligin-5氨肽酶样蛋白6EN2engrailed 2(EN2)NRCAM神经细胞粘附分子(NRCAM)MDGA2脆性X智力迟钝NRXN1Neurexin-11(MDGA2)FMR2(AFF2)AF4/FMR2家族成员2OR4M2嗅觉受体(AFF2)4M2 FOXP2叉头盒蛋白P2OR4N4嗅觉受体(FOXP2)4N4 FXR1脆性X智力OXTR催产素受体延迟,常染色体(OXTR)同源物1(FXR1)FXR2脆性X智力PAH苯丙氨酸阻滞,常染色体酶(PAH)同源物2(FXR2)GABRA1γ-氨基丁酸PTEN磷酸酶和受体亚基α-1张力蛋白同源物(GABRA1)(PTEN)GABRA5GABAA(γ-氨基丁酸PTPRZ1受体型酸)受体α5酪氨酸蛋白亚基(GABRA5)磷酸酶ζ(PTPRZ1)GABRB1γ-氨基丁酸RELN Reelin受体亚基β-1(GABRB1)GABRB3 GABAA(γ-氨基丁酸RPL10 60S核糖体酸)受体β3亚基蛋白L10(GABRB3)GABRG1γ-氨基丁酸SEMA5A Semaphorin-5A受体亚基γ-1(SEMA5A)(GABRG1)HIRIP3 HIRA相互作用蛋白3SEZ6L2癫痫发作相关6同源物(小鼠)-样2HOXA1同源异形盒蛋白Hox-A1 SHANK3 SH3和多个(HOXA1)锚蛋白重复域3(SHANK3)IL6白细胞介素-6SHBZRAP1SH3和多个锚蛋白重复域3(SHBZRAP1)LAMB1层粘连蛋白亚基β-1SLC6A4Serotonin(LAMB1)转运蛋白(SERT)MAPK3丝裂原活化蛋白TAS2R1味觉受体激酶3 2型成员1TAS2R1MAZ Myc相关锌指TSC1结节性硬化蛋白1MDGA2MAM结构域含TSC2结节性硬化糖基磷脂酰肌醇蛋白2锚2(MDGA2)MECP2甲基CpG结合UBE3A泛素蛋白2(MECP2)连接酶E3A(UBE3A)MECP2甲基CpG结合WNT2无翼型蛋白2(MECP2)MMTV整合位点家族,成员2(WNT2)
其染色体序列被编辑的ASD相关的蛋白质的身份可以并且将会变化。在优选的实施方式中,其染色体序列被编辑的ASD相关的蛋白质可以是由BZRAP1基因编码的苯并二氮杂平受体(外周)相关蛋白1(BZRAP1),由AFF2基因编码的AF4/FMR2家族成员2蛋白(AFF2)(也称为MFR2),由FXR1基因编码的脆性X智力迟钝的常染色体同源物1蛋白(FXR1),由FXR2基因编码的脆性X智力迟钝的常染色体同源物2蛋白(FXR2),由MDGA2基因编码的含有糖基磷脂酰肌醇锚2蛋白的MAM结构域(MDGA2),由MECP2基因编码的甲基CpG结合蛋白2(MECP2),由MGLUR5-1基因(也称为GRM5)编码的代谢型谷氨酸受体5(MGLUR5),由NRXN1基因编码的neurexin1蛋白或由SEMA5A基因编码的semaphorin-5A蛋白(SEMA5A)。在一个示例性实施方式中,基因修饰的动物是大鼠,被编辑的编码ASD相关的蛋白质的染色体序列如下所列:BZRAP1苯并二氮杂平受体XM_002727789,(外周)相关的XM_213427,蛋白质1(BZRAP1)XM_002724533,XM_001081125AFF2(FMR2)AF4/FMR2家族成员2XM_219832,(AFF2)XM_001054673FXR1脆性X智力NM_001012179迟钝,常染色体同源物1(FXR1)FXR2脆性X智力NM_001100647迟钝,常染色体同源物2(FXR2)MDGA2MAM结构域含有NM_199269糖基磷脂酰肌醇锚2(MDGA2)MECP2甲基CpG结合NM_022673蛋白2(MECP2)MGLUR5代谢型谷氨酸NM_017012(GRM5)受体5(MGLUR5)NRXN1Neurexin-1NM_021767SEMA5A Semaphorin-5A(SEMA5A)NM_001107659。
三核苷酸重复扩增疾病
美国专利公开号20110016540描述了锌指核酸酶用于基因修饰与三核苷酸重复扩增疾病相关的细胞、动物和蛋白质的用途。三核苷酸重复扩增疾病是复杂的进行性障碍,其涉及发育神经生物学并且经常影响认知以及感觉运动功能。
三核苷酸重复扩增蛋白是一组多样的蛋白质,其与发展三核苷酸重复扩增疾病的易感性、三核苷酸重复扩增疾病的存在、三核苷酸重复扩增疾病的严重性或其任何组合相关。三核苷酸重复扩增疾病由重复类型决定分为两类。最常见的重复序列是三联体CAG,当其存在于基因的编码区中时,编码氨基酸谷氨酰胺(Q)。因此,这些疾病被称为聚谷氨酰胺(polyQ)疾病并且包括以下疾病:亨廷顿病(HD);脊髓延髓肌肉萎缩症(SBMA);脊髓小脑共济失调(SCA类型1、2、3、6、7和17);和Dentatorubro-Pallidoluysian萎缩(DRPLA)。剩余的三核苷酸重复扩增疾病不涉及CAG三联体或CAG三联体不在基因的编码区中,因此被称为非聚谷氨酰胺疾病。非聚谷氨酰胺疾病包括脆性X综合症(FRAXA);脆性XE智力迟钝(FRAXE);Friedreich Ataxia(FRDA);肌强直性营养不良(DM);和Spinocerebellar Ataxias(SCA类型8和12)。
通常基于与三核苷酸重复扩增疾病相关的蛋白质与三核苷酸重复扩增疾病的实验关联来选择与三核苷酸重复扩增疾病相关的蛋白质。例如,相对于没有三核苷酸重复扩增疾病的群体,在具有三核苷酸重复扩增疾病的群体中,与三核苷酸重复扩增疾病相关的蛋白质的产生速率或循环浓度可升高或降低。蛋白质水平的差异可以使用蛋白质组学技术评估,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱。或者,与三核苷酸重复扩增疾病相关的蛋白质可以通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定,所述基因组技术包括但不限于DNA微阵列分析、基因表达的连续分析(SAGE)和定量实时聚合酶链反应(Q-PCR)。
与三核苷酸重复扩增疾病相关的蛋白质的非限制性实例包括AR(雄激素受体),FMR1(脆性X智力迟钝1),HTT(亨廷顿蛋白),DMPK(肌营养不良肌-蛋白激酶),FXN(frataxin),ATXN2(ataxin 2),ATN1(atrophin 1),FEN1(皮瓣结构特异性核酸内切酶1),TNRC6A(含有6A的三核苷酸重复),PABPN1(聚(A)结合蛋白,核1),JPH3(junctophilin 3),MED15(介体复合物亚基15),ATXN1(ataxin 1),ATXN3(ataxin 3),TBP(TATA盒结合蛋白),CACNA1A(钙通道,电压依赖性,P/Q型,α1A亚基),ATXN80S(ATXN8相反链(非-蛋白质编码)),PPP2R2B(蛋白磷酸酶2,调节亚基B,β),ATXN7(ataxin 7),TNRC6B(含有6B的三核苷酸重复),TNRC6C(含有6C的三核苷酸重复),CELF3(CUGBP,Elav样家族成员3),MAB21L1(mab-21-样1(秀丽隐杆线虫)),MSH2(mutS同源物2,结肠癌,非息肉1型(大肠杆菌)),TMEM185A(跨膜蛋白185A),SIX5(SIX同源异形盒5),CNPY3(canopy 3同源物(斑马鱼)),FRAXE(脆性位点,叶酸类型,稀有,fra(X)(q28)E),GNB2(鸟嘌呤核苷酸结合蛋白(G蛋白),β多肽2),RPL14(核糖体蛋白L14),ATXN8(ataxin 8),INSR(胰岛素受体),TTR(转甲状腺素蛋白),EP400(E1A结合蛋白p400),GIGYF2(GRB10相互作用GYF蛋白2),OGG1(8-氧鸟嘌呤DNA糖基化酶),STC1(斯钙素1),CNDP1(肌肽二肽酶1(金属肽酶M20家族)),C10orf2(染色体10开放阅读框2),MAML3mastermind-样3(果蝇),DKC1(先天性角化不良1,dyskerin),PAXIP1(PAX相互作用(与转录激活结构域)蛋白1),CASK(钙/钙调蛋白依赖性丝氨酸蛋白激酶(MAGUK家族)),MAPT(微管相关蛋白tau),SP1(Sp1转录因子)),POLG(聚合酶(DNA导向),γ),AFF2(AF4/FMR2家族,成员2),THBS1(血小板反应蛋白1),TP53(肿瘤蛋白p53),ESR1(雌激素受体1),CGGBP1(CGG三联体重复结合蛋白1),ABT1(基础转录激活因子1),KLK3(激肽释放酶相关肽酶3),PRNP(朊蛋白),JUN(jun癌基因),KCNN3(钾中间体/小电导钙激活通道,亚家族N,成员3),BAX(BCL2相关X蛋白),FRAXA(脆性位点,叶酸类型,稀有,fra(X)(q27.3)A(大疱性,智力迟钝)),KBTBD10(含有10的kelch重复和BTB(POZ)结构域),MBNL1(肌肉盲样(果蝇)),RAD51(RAD51同源物(RecA同源物,大肠杆菌)酿酒酵母),NCOA3(核受体辅激活因子3),ERDA1(扩增重复结构域,CAG/CTG1),TSC1(结节性硬化1),COMP(软骨寡聚基质蛋白),GCLC(谷氨酸-半胱氨酸连接酶,催化亚基),RRAD(与糖尿病相关的Ras相关),MSH3(mutS同源物3(大肠杆菌)),DRD2(多巴胺受体D2),CD44(CD44分子(印度血型)),CTCF(CCCTC结合因子(锌指蛋白)),CCND1(细胞周期蛋白D1),CLSPN(claspin同源物(非洲爪蟾)),MEF2A(肌细胞增强因子2A),PTPRU(蛋白酪氨酸磷酸酶,受体类型,U),GAPDH(甘油醛-3-磷酸脱氢酶),TRIM22(含有三联基序的22),WT1(Wilms肿瘤1),AHR(芳香烃受体),GPX1(谷胱甘肽过氧化物酶1),TPMT(硫嘌呤S-甲基转移酶),NDP(Norrie病(假胶质瘤)),ARX(与aristaless相关的同源异形盒),MUS81(MUS81核酸内切酶同源物(酿酒酵母)),TYR(酪氨酸酶(oculocutaneousalbinismIA)),EGR1(早期生长反应1),UNG(尿嘧啶-DNA糖基化酶),NUMBL(麻木同源物(果蝇)样),FABP2(脂肪酸结合蛋白2,肠),EN2(雕刻同源异形盒2),CRYGC(晶状体蛋白,γC),SRP14(信号识别颗粒14kDa(同源Alu RNA结合蛋白)),CRYGB(晶体蛋白,γB),PDCD1(程序性细胞死亡1),HOXA1(同源异形盒A1),ATXN2L(ataxin 2样),PMS2(PMS2减数分裂后分离增加2(酿酒酵母)),GLA(半乳糖苷酶,α),CBL(Cas-Br-M(鼠)亲嗜性逆转录病毒转化序列),FTH1(铁蛋白,重多肽1),IL12RB2(白细胞介素12受体,β2),OTX2(弓形虫同源异形盒2),HOXA5(同源异形盒A5),POLG2(聚合酶(DNA导向),γ2,辅助亚基),DLX2(无远端同源异形盒2),SIRPA(信号调节蛋白α),OTX1(正交同源异形盒1),AHRR(芳基烃受体阻遏物),MANF(中脑星形胶质细胞衍生的神经营养因子),TMEM158(跨膜蛋白158(基因/假基因))和ENSG00000078687。
与三核苷酸重复扩增疾病相关的优选蛋白质包括HTT(亨廷顿),AR(雄激素受体),FXN(frataxin),Atxn3(ataxin),Atxn1(ataxin),Atxn2(ataxin),Atxn7(ataxin),Atxn10(ataxin),DMPK(肌营养不良肌肉蛋白激酶),Atn1(atrophin1),CBP(creb结合蛋白),VLDLR(极低密度脂蛋白受体)及其任何组合。
治疗听力疾病
本发明还考虑将Cpf1 CRISPR系统递送至一只或两只耳朵。
研究人员正在研究基因治疗是否可用于辅助当前的耳聋治疗-即耳蜗植入物。耳聋通常由丢失或损坏的毛细胞引起,丢失或损坏的毛细胞不能将信号传递给听觉神经元。在这种情况下,耳蜗植入物可用于对声音响应并将电信号传输到神经细胞。但是这些神经元经常退化并从耳蜗中退缩,因为受损的毛细胞释放的生长因子较少。
美国专利申请20120328580描述了将药物组合物注射到耳朵中(例如,耳朵给药),例如注射到耳蜗的腔内(例如,Scala中耳、Sc前庭和Sc鼓室),例如,使用注射器,例如,单剂量注射器。例如,本文所述的一种或多种化合物可通过鼓室内注射(例如,进入中耳)和/或注射到外耳、中耳和/或内耳中来施用。这些方法通常用于本领域,例如,用于将类固醇和抗生素施用至人耳内。注射可以是,例如,通过耳朵的圆窗或通过耳蜗囊。其他内耳施用方法是本领域已知的(参见,例如,Salt and Plontke,Drug Discovery Today,10:1299-1306,2005)。
在另一种施用方式中,药物组合物可以通过导管或泵原位施用。例如,导管或泵可以将药物组合物引导到耳蜗腔或耳朵的圆窗和/或结肠腔中。McKenna等人(美国公开号2006/0030837)和Jacobsen等人(美国专利号7,206,639)描述了适用于将本文所述的一种或多种化合物施用到耳朵内(例如人耳)中的示例性药物递送装置和方法。在一些实施例中,导管或泵可以在外科手术期间定位在例如患者的耳朵(例如,外耳、中耳和/或内耳)中。在一些实施方式中,导管或泵可以定位在例如患者的耳朵(例如,外耳、中耳和/或内耳)中,而无需外科手术。
替代地或另外地,本文所述的一种或多种化合物可以与佩戴在外耳中的机械装置(例如耳蜗植入物或助听器)组合施用。Edge等人(美国公开号2007/0093878)描述了适用于本发明的示例性耳蜗植入物。
在一些实施方式中,上述施用方式可以以任何顺序组合,并且可以是同时的或分散的。
替代地或另外地,本发明可以根据任何食品和药物管理局批准的方法施用,例如,如CDER数据标准手册,版本号004(可在fda.give/cder/dsm/DRG/drg00301.htm获得)中所述。
通常,美国专利申请20120328580中描述的细胞治疗方法可用于促进细胞在体外向成熟细胞类型的内耳(例如,毛细胞)完全或部分分化。然后可以将由这些方法产生的细胞移植或植入需要这种治疗的患者体内。实施这些方法所需的细胞培养方法,包括鉴定和选择合适细胞类型的方法,促进所选细胞完全或部分分化的方法,鉴定完全或部分分化细胞类型的方法,以及植入完全或部分分化细胞的方法如下所述。
适用于本发明的细胞包括但不限于能够完全或部分分化成内耳成熟细胞的细胞,例如当例如在体外与一种或多种本文所述化合物接触时的毛细胞(例如,内毛细胞和/或外毛细胞)。能够分化成毛细胞的示例性细胞包括但不限于干细胞(例如,内耳干细胞,成体干细胞,骨髓衍生的干细胞,胚胎干细胞,间充质干细胞,皮肤干细胞,iPS细胞和脂肪来源的干细胞),祖细胞(例如,内耳祖细胞),支持细胞(例如,Deiters细胞,支柱细胞,内部指骨细胞,顶盖细胞和Hensen细胞)和/或生殖细胞。在Li等人(美国公开号2005/0287127)和Li等人(美国专利号11/953,797)中描述了干细胞用于替代内耳感觉细胞的用途。Edge等人的PCT/US2007/084654中描述了骨髓来源的干细胞用于替代内耳感觉细胞的用途。iPS细胞描述于例如Takahashi等,Cell,Volume 131,Issue 5,Pages 861-872(2007);Takahashi andYamanaka,Cell 126,663-76(2006);Okita等,Nature 448,260-262(2007);Yu,J.等,Science 318(5858):1917-1920(2007);Nakagawa等,Nat.Biotechnol.26:101-106(2008);and Zaehres and Scholer,Cell 131(5):834-835(2007)。可以通过分析(例如,定性或定量地)一种或多种组织特异性基因的存在来鉴定这种合适的细胞。例如,基因表达可以通过检测一种或多种组织特异性基因的蛋白质产物来检测。蛋白质检测技术涉及使用针对适当抗原的抗体染色蛋白质(例如,使用细胞提取物或全细胞)。在这种情况下,适当的抗原是组织特异性基因表达的蛋白质产物。虽然原则上可以标记第一抗体(即,结合抗原的抗体),但是使用针对第一抗体的第二抗体(例如,抗-IgG)更常见(并且改善可视化)。该第二抗体与荧光染料或用于比色反应的适当酶或金珠(用于电子显微镜)或与生物素-亲和素蛋白系统缀合,从而可以识别初级抗体(primary antibody)的位置,从而识别抗原的位置。
本发明的CRISPR Cas分子可通过将药物组合物直接应用于外耳而递送至耳朵,其中组合物基于US公开申请20110142917进行修饰。在一些实施方式中,将药物组合物应于耳道。递送到耳朵也可以称为听觉或耳部递送。
在一些实施方式中,本发明的RNA分子在脂质体或脂质转染制剂中递送,并且可以通过本领域技术人员公知的方法来制备。例如,在美国专利号593,972、5,589,466和5,580,859中描述了这样的方法,其通过引用并入本文。
专门针对增强的和改进的siRNA递送至哺乳动物的递送系统已经被开发(参见,例如Shen等FEBS Let.2003,539:111-114;Xia等,Nat.Biotech.2002,20:1006-1010;Reich等,Mol.Vision.2003,9:210-216;Sorensen等,J.Mol.Biol.2003,327:761-766;Lewis等,Nat.Gen.2002,32:107-108and Simeoni等,NAR 2003,31,11:2717-2724)并且可以应用于本发明。siRNA最近已成功用于抑制灵长类动物中的基因表达(参见,例如,Tolentino等,Retina 24(4):660),其也可应用于本发明。
Qi等公开了通过新的可以应用于本发明的核酸靶向系统的蛋白质递送技术经完整的圆窗将siRNA有效转染到内耳的方法(参见,例如,Qi等,Gene Therapy(2013),1-9)。特别是,TAT双链RNA结合结构域(TAT-DRBDs)(可以将Cy3标记的siRNA转染到内耳细胞中,包括内毛细胞和外毛细胞、壶腹嵴、胞囊斑和球囊斑)经完整圆窗的渗透成功地用于在体内递送双链siRNA以治疗各种内耳疾病和保持听觉功能。可以考虑约40μl的10mM RNA作为给药至耳朵的剂量。
根据Rejali等(Hear Res.2007Jun;228(1-2):180-7),通过良好保留螺旋神经节神经元可以改善耳蜗植入物功能,所述螺旋神经节神经元是植入物和脑源性神经营养因子(BDNF)的电刺激的目标,先前已被证实可以增强实验性耳聋患者的螺旋神经节存活率。Rejali等人测试了耳蜗植入电极的改进设计,所述电极包含由具有BDNF基因插入物的病毒载体转导的成纤维细胞的包被。为了完成这种类型的离体基因转移,Rejali等人用具有BDNF基因盒插入物的腺病毒转导豚鼠成纤维细胞,并确定这些细胞分泌BDNF,然后通过琼脂糖凝胶将BDNF分泌细胞附着到耳蜗植入电极,并将电极植入鼓室中。Rejali等人确定与对照电极相比,植入48天后表达BDNF的电极能够在耳蜗基底转角中保留显著更多的螺旋神经节神经元,并证实了将耳蜗植入疗法与离体基因转移相结合以增强螺旋神经节存活的可行性。这种系统可以应用于本发明的核酸靶向系统以递送至耳朵。
Mukherjea等(Antioxidants&Redox Signaling,Volume 13,Number 5,2010)记载了使用短干扰(si)RNA敲除NOX3消除了顺铂的耳毒性,这可以通过保护OHCs免受损伤和减少听觉脑干反应(ABR)的阈值变化来证实。不同剂量的siNOX3(0.3、0.6和0.9μg)被施用至大鼠,并通过实时RT-PCR评估NOX3表达。与经鼓室施用乱序siRNA或未处理的耳蜗相比,最低剂量的NOX3siRNA(0.3μg)未显示对NOX3mRNA的任何抑制。然而,与对照杂乱siRNA相比,施用更高剂量的NOX3siRNA(0.6和0.9μg)降低了NOX3表达。这样的系统可以应用于本发明的CRISPR Cas系统,用于以约2mg至约4mg用于施用至人的CRISPR Cas的剂量经鼓室给药。
Jung等(Molecular Therapy,vol.21no.4,834–841apr.2013)证实,在应用siRNA后,胞囊中的Hes5水平降低,并且这些胞囊中的毛细胞数量显著大于对照处理后的毛细胞数量。数据表明siRNA技术可用于诱导内耳中的修复和再生,并且Notch信号传导途径是特异性基因表达抑制的潜在有用靶标。Jung等注射2μl体积的8μg Hes5 siRNA,其通过向冻干的siRNA中加入无菌生理盐水至耳前庭上皮而制备。这种系统可以应用于本发明的核酸靶向系统,用于以约1至约30mg的用于施用至人的CRISPR Cas的剂量施用至耳朵的前庭上皮。
基因靶向非分裂细胞(神经元和肌肉)
非分裂(特别是非分裂,完全分化)细胞类型存在基因靶向或基因组工程化的问题,例如因为同源重组(HR)通常在G1细胞周期阶段被抑制。然而,在研究细胞控制正常DNA修复系统的机制时,Durocher发现了一种先前未知的开关,其可以在非分裂细胞中保持HR“关闭”,并设计了一种策略来重新切换此开关。Orthwein等(Daniel Durocher’s lab atthe Mount Sinai Hospital in Ottawa,Canada)最近报道(Nature 16142,publishedonline 9Dec 2015)已经证实可以解除对HR的抑制,并在肾脏(293T)和骨肉瘤(U2OS)细胞中成功完成基因靶向。已知肿瘤抑制因子BRCA1、PALB2和BRAC2通过HR促进DNA DSB修复。他们发现BRCA1与PALB2-BRAC2的复合物的形成受PALB2上的泛素位点(E3泛素连接酶在该位点起作用)的控制。该E3泛素连接酶由与cullin-3(CUL3)-RBX1复合的KEAP1(PALB2-相互作用蛋白)组成。PALB2泛素化抑制其与BRCA1的相互作用,并被去泛素化酶USP11(其本身在细胞周期控制下)抵消。BRCA1-PALB2相互作用的恢复与DNA末端切除的激活相结合足以诱导G1中的同源重组,如通过包括针对USP11或KEAP1(表达自pX459载体)的基于Cpf1 CRISPR9的基因靶向测定法的多种方法所测量。然而,当利用KEAP1消除或PALB2-KR突变体表达在具有切除能力的G1细胞中恢复BRCA1-PALB2相互作用时,检测到基因靶向事件的强烈增加。
因此,在一些实施方式中,优选细胞中HR的再激活,尤其是非分裂的,完全分化的细胞类型。在一些实施方式中,在一些实施方式中优选促进BRCA1-PALB2相互作用。在一些实施方式中,靶细胞是非分裂细胞。在一些实施方式中,靶细胞是神经元或肌肉细胞。在一些实施方式中,靶细胞在体内靶向。在一些实施方式中,细胞处于G1并且HR被抑制。在一些实施方式中,优选使用KEAP1消除,例如抑制KEAP1活性的表达。KEAP1消除可以通过siRNA实现,例如如Orthwein等人所示。或者,优选表达PALB2-KR突变体(缺少BRCA1相互作用结构域中的所有8个Lys残基),或者与KEAP1消除组合或单独使用。PALB2-KR与BRCA1相互作用而不管细胞周期位置如何。因此,在一些实施方式中,优选促进或恢复BRCA1-PALB2相互作用,特别是在G1细胞中,特别是在靶细胞是非分裂的,或者去除和返回(离体基因靶向)有问题的情况下,例如神经元或肌肉细胞。KEAP1siRNA可从ThermoFischer获得。在一些实施方式中,BRCA1-PALB2复合物可以递送至G1细胞。在一些实施方式中,PALB2去泛素化可以通过例如增加的去泛素化酶USP11的表达来促进,因此可以设想构建体可以用于促进或上调去泛素化酶USP11的表达或活性。
治疗眼病
本发明还考虑将Cpf1 CRISPR系统递送至一只或两只眼睛。
在本发明的特定的实施方式中,Cpf1 CRISPR系统可用于校正由多种基因突变引起的眼部缺陷,所述基因突变进一步描述于Genetic Diseases of the Eye,SecondEdition,edited by Elias I.Traboulsi,Oxford University Press,2012。
在一些实施方式中,待治疗或靶向的病症是眼病。在一些实施方式中,眼病可包括青光眼。在一些实施方式中,眼病包括视网膜退行性疾病。在一些实施方式中,视网膜退行性疾病选自Stargardt病、Bardet-Biedl综合症、Best疾病、蓝锥单色性、慢性血症、锥-杆营养不良、先天性静止夜失明、增强的S-Cone综合症、青少年X-连锁视网膜劈裂、Leber先天性黑朦、Malattia Leventinesse、Norrie疾病或X连锁家族性渗出性玻璃体视网膜病变、模式营养不良、Sorsby营养不良、Usher综合症、色素性视网膜炎、全色盲或黄斑营养不良或退化、视网膜色素变性、全色盲和年龄相关性黄斑变性。在一些实施方式中,视网膜变性疾病是Leber先天性黑朦(LCA)或色素性视网膜炎。在一些实施方式中,任选地通过玻璃体内注射或视网膜下注射将CRISPR系统递送至眼睛。
对于施用至眼睛,特别优选慢病毒载体,特别是马传染性贫血病毒(EIAV)。
在另一个实施方式中,还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,尤其是对于眼基因治疗(参见,例如,Balagaan,J Gene Med 2006;8:275–285,Published online 21November 2005in Wiley InterScience(www.interscience.wiley.com).DOI:10.1002/jgm.845)。考虑具有驱动靶基因表达的巨细胞病毒(CMV)启动子的载体。还考虑了前房内、视网膜下、眼内和玻璃体内注射(参见,例如,Balagaan,J Gene Med 2006;8:275–285,Published online 21November 2005inWiley InterScience(www.interscience.wiley.com).DOI:10.1002/jgm.845)。可以借助于手术显微镜进行眼内注射。对于视网膜下和玻璃体内注射,可以通过温和的数字压力使眼睛脱垂,并且使用隐形眼镜系统使眼睛可视化,所述隐形眼镜系统由覆盖有玻璃显微镜载玻片盖玻片的角膜上的一滴偶联介质溶液组成。对于视网膜下注射,安装在5-μlHamilton注射器上的10毫米34号针头的尖端可以在直接可视化的情况下通过上赤道巩膜切向朝向后极部前进,直到针头的孔在视网膜下空间可见。然后,可注射2μl载体悬浮液以产生优良的大疱性视网膜脱离,从而证实视网膜下载体给药。该方法产生自密封巩膜切开术,允许载体悬浮液保留在视网膜下空间中,直到它被RPE吸收,通常在手术后48小时内。可以在下半球重复该过程以产生较差的视网膜脱离。该技术导致大约70%的神经感觉视网膜和RPE暴露于载体悬浮液。对于玻璃体内注射,针尖可以通过角膜巩膜缘后1mm处的巩膜前进,并且将2μl载体悬浮液注射到玻璃体腔中。对于前房注射,针尖可以通过角膜巩膜缘穿刺术前进,朝向中央角膜,并且可以注射2μl载体悬浮液。对于前房注射,针尖可以通过角膜巩膜缘穿刺术前进,朝向中央角膜,并且可以注射2μl载体悬浮液。这些载体可以以1.0-1.4×1010或1.0-1.4×109转导单位(TU)/ml的滴度注射。
在另一个实施方式中,也考虑了(基于马传染性贫血病毒的慢病毒基因治疗载体),其表达通过视网膜下注射递送的血管生成抑制蛋白endostain和血管抑制素用于治疗年龄相关性黄斑变性的网状形式(参见,例如,Binley等,HUMAN GENE THERAPY23:980–991(September 2012))。可以针对本发明的Cpf1 CRISPR系统修饰这种载体。每只眼睛可以用以每只眼睛1.1×105个转导单位(TU/眼睛)的剂量治疗,总体积为100μl。
在另一个实施方式中,可考虑E1-、部分E3-、E4-缺失的腺病毒载体用于递送至眼睛。28例患有晚期新生血管性年龄相关性黄斑变性(AMD)的患者被给予表达人色素上皮衍生因子(AdPEDF.ll)的E1-、部分E3-、E4-缺失的腺病毒载体的单次玻璃体内注射(参见,例如,Campochiaro等,Human Gene Therapy 17:167-176(February 2006))。研究了106到109.5颗粒单元(PU)的剂量范围并且没有与AdPEDF.ll相关的严重不良事件且没有剂量限制性毒性(参见,例如,Campochiaro等,Human Gene Therapy 17:167-176(February 2006))。腺病毒载体介导的眼基因转移似乎是治疗眼病的可行方法,并且可以应用于CRISPR Cas系统。
在另一个实施方式中,RXi Pharmaceuticals的系统可以用于和/或适应将CRISPR Cas递送至眼睛。在该系统中,单次玻璃体内施用3μg的sd-rxRNA导致PPIBmRNA水平的序列特异性降低14天。可以将系统应用于本发明的核酸靶向系统,考虑向人施用约3至20mg剂量的CRISPR。
Millington-Ward等(Molecular Therapy,vol.19no.4,642–649 apr.2011)描述了腺相关病毒(AAV)载体,其递送基于RNA干扰(RNAi)的视紫红质抑制因子和抗抑制的密码子修饰的视紫红质替代基因(由于RNAi靶位点上的简并位置处的核苷酸改变)。Millington-Ward等人将6.0×108vp或1.8×1010vp AAV经视网膜下注射到眼睛中。Millington-Ward等人的AAV载体可以应用于本发明的CRISPR Cas系统,考虑向人施用约2×1011至约6×1013vp的剂量。
Dalkara等(Sci Transl Med 5,189ra76(2013))也涉及体内定向进化以形成AAV载体,其在非损伤性注射到眼睛的玻璃体液中后在整个视网膜中递送野生型形式的缺陷基因。Dalkara描述了7聚肽展示文库和由来自AAV1、2、4、5、6、8和9的cap基因的DNA改组而构建的AAV文库。在CAG或Rho启动子下表达GFP的rcAAV文库和rAAV载体被包装,并且通过定量PCR获得抗脱氧核糖核酸酶的基因组滴度。汇集文库,进行两轮进化,每次进化包括初始文库多样化,然后是三个体内选择步骤。在每个这样的步骤中,P30rho-GFP小鼠被玻璃体内注射2ml经碘克沙醇纯化、磷酸盐缓冲盐水(PBS)透析的基因组滴度约为1×1012vg/ml的文库。Dalkara等人的AAV载体可以应用于本发明的核酸靶向系统,考虑向人施用约1×1015至约1×1016vg/ml的剂量。
在一种特定的实施方式中,视紫红质基因可以被靶向用于治疗视网膜色素变性(RP),其中转让给Sangamo BioSciences,Inc.的美国专利公开号20120204282的系统可以根据本发明的CRISPR Cas系统进行修饰。
在另一个实施方式中,转让给Cellectis的美国专利公开号20130183282的方法涉及从人视紫红质基因切割靶序列的方法,其也可以被修饰为本发明的核酸靶向系统。
转让给Academia Sinica的美国专利公开号20130202678涉及治疗视网膜病和威胁视力的眼科疾病的方法,所述方法涉及将Puf-A基因(在眼组织的视网膜神经节和色素细胞中表达并且显示出独特的抗凋亡活性)递送至眼睛的视网膜下或玻璃体内空间。特别是,理想的靶标是zgc:193933,prdm1a,spata2,tex10,rbb4,ddx3,zp2.2,Blimp-1和HtrA2,它们都可以被本发明的核酸靶向系统靶向。
Wu(Cell Stem Cell,13:659-62,2013)设计了一种指导RNA,其引导Cpf1至在小鼠中引起白内障的单碱基对突变,并在本文中处诱导DNA切割。然后使用给予受精卵修复机制的其他野生型等位基因或寡核苷酸来校正破坏的等位基因的序列并校正突变小鼠中引起白内障的基因缺陷。
美国专利公开号20120159653描述了锌指核酸酶用于基因修饰与黄斑变性(MD)相关的细胞、动物和蛋白质的用途。黄斑变性(MD)是老年人视力损害的主要原因,但也是儿童疾病的标志性症状,例如Stargardt病、Sorsby眼底和致命的儿童神经退行性疾病,其发病年龄与婴儿期一样年轻。由于视网膜的损伤,黄斑变性导致视野中心(黄斑)的视力丧失。目前现有的动物模型没有概括出在人类中观察到的疾病的主要标志。包含编码与MD相关的蛋白质的突变基因的可用动物模型也产生高度可变的表型,使人类疾病和治疗发展的转化成问题。
美国专利公开号20120159653的一个方面涉及编辑编码MD相关的蛋白质的任何染色体序列,其可以应用于本发明的核酸靶向系统。通常基于MD相关的蛋白质与MD病症的实验关联来选择与MD相关的蛋白质。例如,相对于没有MD病症的群体,在患有MD病症的群体中,与MD相关的蛋白质的产生速率或循环浓度可升高或降低。蛋白质水平的差异可以使用蛋白质组学技术评估,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱。或者,与MD相关的蛋白质可以通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定,包括但不限于DNA微阵列分析、基因表达的连续分析(SAGE)和定量实时聚合酶链反应(Q-PCR)。
作为非限制性实例,与MD相关的蛋白质包括但不限于以下蛋白质:(ABCA4)ATP结合盒,亚家族A(ABC1),成员4ACHM1全色盲(视杆细胞单色)1ApoE载脂蛋白E(ApoE)C1QTNF5(CTRP5)C1q和肿瘤坏死因子相关蛋白5(C1QTNF5)C2补体成分2(C2)C3补体成分(C3)CCL2趋化因子(C-C基序)配体2(CCL2)CCR2趋化因子(C-C基序)受体2(CCR2)CD36分化簇36CFB补体因子B CFH补体因子CFH H CFHR1补体因子H相关1CFHR3补体因子H相关3CNGB3环核苷酸门控通道β3CP铜蓝蛋白(CP)CRP C反应蛋白(CRP)CST3胱抑素C或半胱氨酸蛋白酶抑制子3(CST3)CTSD组织蛋白酶D(CTSD)CX3CR1趋化因子(C-X3-C基序)受体1ELOVL4极长链脂肪酸的延长4ERCC6切除修复交叉补充啮齿动物修复缺陷,互补组6FBLN5 Fibulin-5 FBLN5Fibulin5 FBLN6 Fibulin6 FSCN2 fascin(FSCN2)HMCN1 Hemicentrin 1HMCN1hemicentin 1HTRA1 HtrA丝氨酸肽酶1(HTRA1)HTRA1 HtrA丝氨酸肽酶1IL-6白细胞介素6IL-8白细胞介素8LOC387715假定蛋白质PLEKHA1 Pleckstrin含同源域家族A成员1(PLEKHA1)PROM1 Prominin1(PROM1或CD133)PRPH2 Peripherin-2RPGR视网膜色素变性GTP酶调节子SERPING1 serpin肽酶抑制子,进化枝G,成员1(C1-抑制子)TCOF1Treacle TIMP3金属蛋白酶抑制子3(TIMP3)TLR3 Toll样受体3。
其染色体序列被编辑的MD相关的蛋白质的身份可以并且将会变化。在优选的实施方式中,其染色体序列被编辑的MD相关的蛋白质可以是ATP结合盒,由ABCR基因编码的亚家族A(ABC1)成员4蛋白(ABCA4),由APOE基因编码的载脂蛋白E蛋白(APOE),由CCL2基因编码的趋化因子(C-C基序)配体2蛋白(CCL2),由CCR2基因编码的趋化因子(C-C基序)受体2蛋白(CCR2),由CP基因编码的铜蓝蛋白(CP),由CTSD基因编码的组织蛋白酶D蛋白(CTSD),或由TIMP3基因编码的金属蛋白酶抑制子3蛋白(TIMP3)。在一种示例性实施方式中,基因修饰的动物是大鼠,被编辑的编码MD相关的蛋白质的染色体序列可以是:(ABCA4)ATP结合盒,NM_000350亚家族A(ABC1),成员4APOE载脂蛋白E NM_138828(APOE)CCL2趋化因子(C-C NM_031530基序)配体2(CCL2)CCR2趋化因子(C-C NM_021866基序)受体2(CCR2)CP铜蓝蛋白(CP)NM_012532CTSD组织蛋白酶D(CTSD)NM_134334TIMP3金属蛋白酶NM_012886抑制子3(TIMP3)。动物或细胞可包含1、2、3、4、5、6、7或更多种编码MD相关的蛋白质的破坏的染色体序列和0、1、2、3、4、5、6、7或更多种编码MD相关的破坏的蛋白质的染色体整合序列。
可以修饰编辑的或整合的染色体序列以编码改变的MD相关的蛋白质。MD相关染色体序列中的多个突变与MD相关。与MD相关的染色体序列中的突变的非限制性实例包括可能导致MD的包括在ABCR蛋白中的那些,E471K(即471位的谷氨酸变为赖氨酸),R1129L(即1129位的精氨酸变为亮氨酸),T1428M(即1428位的苏氨酸变为甲硫氨酸),R1517S(即1517位的精氨酸变为丝氨酸),I1562T(即1562位的异亮氨酸变为苏氨酸),G1578R(即1578位的甘氨酸变为精氨酸);在CCR2蛋白中,V64I(即192位的缬氨酸变为异亮氨酸);在CP蛋白中,G969B(即969位的甘氨酸变为天冬酰胺或天冬氨酸);在TIMP3蛋白中,S156C(即156位的丝氨酸变为半胱氨酸),G166C(即166位的甘氨酸变为半胱氨酸),G167C(即167位的甘氨酸变为半胱氨酸),Y168C(即168位的酪氨酸)变为半胱氨酸),S170C(即170位的丝氨酸变为半胱氨酸),Y172C(即172位的酪氨酸变为半胱氨酸)和S181C(即181位的丝氨酸变为半胱氨酸)。MD相关基因和疾病中基因变异体的其他关联是本领域已知的。
CRISPR系统对于校正由常染色体显性基因引起的疾病是有用的。例如,CRISPR/Cpf1用于去除导致眼睛中受体丧失的常染色体显性基因。Bakondi,B.等,In Vivo CRISPR/Cpf1Gene Editing Corrects Retinal Dystrophy in the S334ter-3Rat Model ofAutosomal Dominant Retinitis Pigmentosa.Molecular Therapy,2015;DOI:10.1038/mt.2015.220。
治疗循环和肌肉疾病
本发明还考虑将本文所述的Cpf1 CRISPR系统(例如Cpf1效应蛋白系统)递送至心脏。对于心脏,优选心肌热带腺相关病毒(AAVM),特别是AAVM41,其在心脏中显示优先的基因转移(参见,例如,Lin-Yanga等,PNAS,March 10,2009,vol.106,no.10)。给药可以是全身性的或局部的。考虑约1-10×1014个载体基因组的剂量用于全身给药。还参见例如Eulalio等(2012)Nature 492:376and Somasuntharam等(2013)Biomaterials 34:7790。
例如,美国专利公开号20110023139描述了使用锌指核酸酶来基因修饰与心血管疾病相关的细胞、动物和蛋白质的用途。心血管疾病通常包括高血压、心脏病发作、心力衰竭、中风和TIA。涉及心血管疾病的任何染色体序列或由涉及心血管疾病的任何染色体序列编码的蛋白质可以用于本公开所述的方法。通常基于心血管相关蛋白与心血管疾病发展的实验关联来选择心血管相关蛋白。例如,相对于没有心血管病症的群体,在具有心血管病症的群体中,心血管相关蛋白的生产速率或循环浓度可升高或降低。蛋白质水平的差异可以使用蛋白质组学技术评估,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱。或者,心血管相关蛋白可以通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定,所述基因组技术包括但不限于DNA微阵列分析、基因表达的连续分析(SAGE)和定量实时聚合酶链反应(Q-PCR)。
举例来说,染色体序列可包括但不限于IL1B(白细胞介素1,β),XDH(黄嘌呤脱氢酶),TP53(肿瘤蛋白p53),PTGIS(前列腺素12(前列环素)合成酶),MB(肌红蛋白),IL4(白细胞介素4),ANGPT1(血管生成素1),ABCG8(ATP结合盒,亚家族G(WHITE),成员8),CTSK(组织蛋白酶K),PTGIR(前列腺素12(前列环素)受体(IP)),KCNJ11(内向整流钾通道,亚家族J,成员11),INS(胰岛素),CRP(C-反应蛋白,五聚蛋白相关),PDGFRB(血小板衍生生长因子受体,β多肽),CCNA2(细胞周期蛋白A2),PDGFB(血小板衍生生长因子β多肽(猿猴肉瘤病毒(v-sis)癌基因同源物)),KCNJ5(内向整流钾通道,亚家族J,成员5),KCNN3(钾中间体/小电导钙激活通道,亚家族N,成员3),CAPN10(钙蛋白酶10),PTGES(前列腺素E合酶),ADRA2B(肾上腺素能,α-2B-,受体),ABCG5(ATP结合盒,亚家族G(WHITE),成员5),PRDX2(过氧化还原酶2),CAPN5(钙蛋白酶5),PARP14(聚(ADP-核糖)聚合酶家族,成员14),MEX3C(mex-3同源物C(秀丽隐杆线虫)),ACE血管紧张素I转化酶(肽酰二肽酶A)1),TNF(肿瘤坏死因子(TNF超家族,成员2)),IL6(白细胞介素6(干扰素,β2)),STN(他汀类),SERPINE1(丝氨酸蛋白酶抑制子肽酶抑制子,进化枝E(nexin,纤溶酶原激活物抑制子1型),成员1),ALB(白蛋白),ADIPOQ(脂联素,C1Q和含胶原结构域),APOB(载脂蛋白B(包括Ag(x)抗原)),APOE(载脂蛋白E),LEP(瘦素),MTHFR(5,10-亚甲基四氢叶酸还原酶)(NADPH)),APOA1(载脂蛋白A-I),EDN1(内皮素1),NPPB(利尿钠肽前体B),NOS3(一氧化氮合酶3(内皮细胞)),PPARG(过氧化物酶体增殖物激活受体γ),PLAT(纤溶酶原活化子,组织),PTGS2(前列腺素-内过氧化物合酶2(前列腺素G/H合酶和环加氧酶)),CETP(胆固醇酯转移蛋白,血浆),AGTR1(血管紧张素II受体,1型),HMGCR(3-羟基-3-甲基戊二酰-辅酶A还原酶),IGF1(胰岛素样生长因子1(生长调节素C)),SELE(选择素E),REN(肾素),PPARA(过氧化物酶体增殖物激活受体α),PON1(对氧磷酶1),KNG1(激肽原1),CCL2(趋化因子(C-C基序)配体2),LPL(脂蛋白脂酶),VWF(冯维勒布兰德因子),F2(凝血因子II(凝血酶)),ICAM1(细胞间粘附分子1),TGFB1(转化生长因子,β1)),NPPA(利尿钠肽前体A),IL10(白细胞介素10),EPO(促红细胞生成素),SOD1(超氧化物歧化酶1,可溶性),VCAM1(血管细胞粘附分子1),IFNG(干扰素,γ),LPA(脂蛋白,Lp(a)),MPO(髓过氧化物酶),ESR1(雌激素受体1),MAPK1(丝裂原活化蛋白激酶1),HP(触珠蛋白),F3(凝血因子III(促凝血酶原激酶,组织因子)),CST3(胱抑素C)),COG2(寡聚高尔基复合物2的成分),MMP9(基质金属肽酶9(明胶酶B,92kDa明胶酶,92kDa IV型胶原酶)),SERPINC1(丝氨酸蛋白酶抑制子肽酶抑制子,进化枝C(抗凝血酶),成员1),F8(凝血因子VIII,促凝血成分),HMOX1(血红素加氧酶(去循环)1),APOC3(载脂蛋白C-III),IL8(白细胞介素8),PROK1(前动力蛋白1),CBS(胱硫醚-β-合成酶),NOS2(一氧化氮合成酶2,诱导型),TLR4(toll样受体4),SELP(选择素P(颗粒膜蛋白140kDa,抗原CD62)),ABCA1(ATP结合盒,亚家族A(ABC1),成员1),AGT(血管紧张素原(丝氨酸蛋白酶抑制肽酶抑制子,进化枝A,成员8)),LDLR(低密度脂蛋白受体),GPT(谷氨酸-丙酮酸转氨酶(丙氨酸氨基转移酶)),VEGFA(血管内皮生长因子A),NR3C2(核受体亚家族3,组C,成员2),IL18(白细胞介素18(干扰素-γ-诱导因子)),NOS1(一氧化氮合酶1(神经元)),NR3C1(核受体亚家族3,C组,成员1(糖皮质激素受体)),FGB(纤维蛋白原β链),HGF(肝细胞生长因子(庚肽A;散射因子)),IL1A(白细胞介素1,α),RETN(抵抗素),AKT1(v-akt鼠胸腺瘤病毒癌基因同源物1),LIPC(脂肪酶,肝),HSPD1(热休克60kDa蛋白1(伴侣蛋白)),MAPK14(丝裂原活化蛋白激酶14),SPP1(分泌磷蛋白1),ITGB3(整合素,β3(血小板糖蛋白111a,抗原CD61)),CAT(过氧化氢酶),UTS2(尿压素2),THBD(血栓调节蛋白),F10(凝血因子X),CP(铜蓝蛋白(铁氧化酶)),TNFRSF11B(肿瘤坏死因子受体超家族,成员11b),EDNRA(内皮素受体A型),EGFR(表皮生长因子受体(成红细胞白血病病毒(v-erb-b)癌基因同源物,禽)),MMP2(基质金属肽酶2(明胶酶A,72kDa明胶酶,72kDaIV型胶原酶)),PLG(纤溶酶原),NPY(神经肽Y),RHOD(ras同源基因家族,成员D),MAPK8(丝裂原活化蛋白激酶8),MYC(v-myc骨髓细胞瘤病病毒癌基因同源物(禽)),FN1(纤连蛋白1),CMA1(糜蛋白酶1,肥大细胞),PLAU(纤溶酶原激活子,尿激酶),GNB3(鸟嘌呤核苷酸结合蛋白(G蛋白),β多肽3),ADRB2(肾上腺素能,β-2-,受体,表面),APOA5(载脂蛋白AV),SOD2(超氧化物歧化酶2,线粒体),F5(凝血因子V(促凝血球蛋白原,不稳定因子)),VDR(维生素D(1,25-二羟基维生素D3)受体),ALOX5(花生四烯酸5-脂氧合酶),HLA-DRB1(主要组织相容性复合物,II类,DRβ1),PARP1(聚(ADP-核糖)聚合酶1),CD40LG(CD40配体),PON2(对氧磷酶2),AGER(高级糖基化终产物特异性受体),IRS1(胰岛素受体底物1)),PTGS1(前列腺素-内过氧化物合成酶1(前列腺素G/H合酶和环加氧酶)),ECE1(内皮素转换酶1),F7(凝血因子VII(血清凝血酶原转化促进剂)),URN(白细胞介素1受体拮抗剂),EPHX2(环氧化物水解酶2,细胞质),IGFBP1(胰岛素样生长因子结合蛋白1),MAPK10(丝裂原活化蛋白激酶10),FAS(Fas(TNF受体超家族,成员6)),ABCB1(ATP结合盒,亚家族B(MDR/TAP),成员1),JUN(jun癌基因),IGFBP3(胰岛素样生长因子结合蛋白3),CD14(CD14分子),PDE5A(磷酸二酯酶5A,cGMP特异性),AGTR2(血管紧张素II受体),2型),CD40(CD40分子,TNF受体超家族成员5),LCAT(卵磷脂-胆固醇酰基转移酶),CCR5(趋化因子(C-C基序)受体5),MMP1(基质金属肽酶1(间质胶原酶)),TIMP1(TIMP金属肽酶抑制子1),ADM(肾上腺髓质素),DYT10(肌张力障碍10),STAT3(信号转导和转录激活因子3(急性期反应因子)),MMP3(基质金属肽酶3(基质溶素1,前积酶)),ELN(弹性蛋白),USF1(上游转录因子1),CFH(补体因子H),HSPA4(热休克70kDa蛋白4),MMP12(基质金属肽酶12(巨噬细胞弹性蛋白酶))),MME(膜金属内肽酶),F2R(凝血因子II(凝血酶)受体),SELL(选择素L),CTSB(组织蛋白酶B),ANXA5(膜联蛋白A5),ADRB1(肾上腺素能,β-1-,受体),CYBA(细胞色素b-245,α多肽),FGA(纤维蛋白原α链),GGT1(γ-谷氨酰转移酶1),LIPG(脂肪酶,内皮细胞),HIF1A(缺氧诱导因子1,α亚基(碱性螺旋-环-螺旋转录因子)),CXCR4(趋化因子(C-X-C基序)受体4),PROC(蛋白C(凝血因子Va和VIIIa的失活子)),SCARB1(清道夫受体B类,成员1),CD79A(CD79a分子,免疫球蛋白相关α),PLTP(磷脂转运蛋白),ADD1(内收蛋白1(α)),FGG(纤维蛋白原γ链),SAA1(血清淀粉样蛋白A1),KCNH2(钾电压门控通道,亚家族H(eag相关),成员2),DPP4(二肽基肽酶4),G6PD(葡萄糖-6-磷酸脱氢酶),NPR1(利尿钠肽受体A/鸟苷酸环化酶A(atrionatriuretic肽受体A)),VTN(玻连蛋白),KIAA0101(KIAA0101),FOS(FBJ小鼠骨肉瘤病毒癌基因同源物),TLR2(toll样受体2),PPIG(肽基脯氨酸异构酶G(亲环蛋白G)),IL1R1(白细胞介素1受体,I型),AR(雄激素受体),CYP1A1(细胞色素P450,家族1,亚家族A,多肽1),SERPINA1(丝氨酸蛋白酶抑制肽酶抑制子,进化枝A(α-1抗蛋白酶,抗胰蛋白酶),成员1),MTR(5-甲基四氢叶酸-高半胱氨酸甲基转移酶),RBP4(视黄醇结合蛋白4,血浆),APOA4(载脂蛋白A-IV),CDKN2A(细胞周期蛋白依赖性激酶抑制子2A(黑色素瘤,p16,抑制CDK4)),FGF2(成纤维细胞生长因子2(碱性)),EDNRB(内皮素受体B型),ITGA2(整合素,α2(CD49B,VLA-2受体的α2亚基)),CABIN1(神经钙蛋白结合蛋白1),SHBG(性激素结合球蛋白),HMGB1(高迁移率族组合框1),HSP90B2P(热休克蛋白90kDaβ(Grp94),成员2(假基因)),CYP3A4(细胞色素P450,家族3,亚家族A,多肽4),GJA1(间隙连接蛋白,α1,43kDa),CAV1(小窝1,细胞膜穴样蛋白,22kDa),ESR2(雌激素受体2(ERβ)),LTA(淋巴毒素α(TNF超家族,成员1)),GDF15(生长分化因子15),BDNF(脑源性神经营养因子),CYP2D6(细胞色素P450,家族2,亚家族D,多肽6),NGF(神经生长因子(β多肽)),SP1(Sp1转录因子),TGIF1(TGFB诱导因子同源异形盒1),SRC(v-src肉瘤(Schmidt-Ruppin A-2)病毒癌基因同源物(禽)),EGF(表皮生长因子(β-尿抑胃素)),PIK3CG(磷酸肌醇-3-激酶,催化,γ多肽),HLA-A(主要组织相容性复合物,类别I,A),KCNQ1(钾电压门控通道,KQT样亚家族,成员1),CNR1(大麻素受体1(脑)),FBN1(原纤维蛋白1),CHKA(胆碱激酶α),BEST1(bestrophin1),APP(淀粉样蛋白β)(A4)前体蛋白),CTNNB1(连环蛋白(钙粘蛋白相关蛋白),β1,88kDa),IL2(白细胞介素2),CD36(CD36分子(血小板反应蛋白受体)),PRKAB1(蛋白激酶,AMP激活,β1非催化亚基),TPO(甲状腺过氧化物酶),ALDH7A1(醛脱氢酶7家族,成员A1),CX3CR1(趋化因子(C-X3-C基序)受体1),TH(酪氨酸羟化酶),F9(凝血因子IX)),GH1(生长激素1),TF(转铁蛋白),HFE(血色素沉着症),IL17A(白细胞介素17A),PTEN(磷酸酶和张力蛋白同源物),GSTM1(谷胱甘肽S-转移酶mu1),DMD(肌营养不良蛋白),GATA4(GATA结合蛋白4),F13A1(凝血因子XIII,A1多肽),TTR(转甲状腺素蛋白)),FABP4(脂肪酸结合蛋白4,脂肪细胞),PON3(对氧磷酶3),APOC1(载脂蛋白C-I),INSR(胰岛素受体),TNFRSF1B(肿瘤坏死因子受体超家族,成员1B),HTR2A(5-羟色胺(血清素))受体2A),CSF3(集落刺激因子3(粒细胞)),CYP2C9(细胞色素P450,家族2,亚家族C,多肽9),TXN(硫氧还蛋白),CYP11B2(细胞色素P450,家族11,亚家族B,多肽2),PTH(甲状旁腺激素),CSF2(集落刺激因子2(粒细胞-巨噬细胞)),KDR(激酶插入结构域受体(III型受体酪氨酸激酶)),PLA2G2A(磷脂酶A2,IIA组(血小板,滑液)),B2M(β-2-微球蛋白),THBS1(血小板反应蛋白1),GCG(胰高血糖素),RHOA(ras同源基因家族,成员A),ALDH2(醛脱氢酶2家族(线粒体)),TCF7L2(转录因子7样2(T细胞特异性,HMG-box)),BDKRB2(缓激肽受体B2),NFE2L2(核因子(红细胞衍生2)样2),NOTCH1(Notch同源物1,易位相关(果蝇)),UGT1A1(UDP葡萄糖醛酸转移酶1家族,多肽A1),IFNA1(干扰素,α1),PPARD(过氧化物酶体增殖物激活受体δ),SIRT1(sirtuin(沉默交配型信息调节2同源物)1(酿酒酵母)),GNRH1(促性腺激素释放激素1(黄体生成释放激素)),PAPPA(妊娠相关血浆蛋白A,冠毛素1),ARR3(抑制蛋白3,视黄醛(X-arrestin)),NPPC(利尿钠肽前体C),AHSP(α血红蛋白稳定蛋白),PTK2(PTK2蛋白酪氨酸激酶2),IL13(白细胞介素13),MTOR(雷帕霉素的机制靶标(丝氨酸/苏氨酸激酶)),ITGB2(整合素,β2(补体成分3受体3和4亚基)),GSTT1(谷胱甘肽S-转移酶theta1),IL6ST(白细胞介素6信号转导子(gp130,制瘤素M受体)),CPB2(羧肽酶B2(血浆)),CYP1A2(细胞色素P450,家族1,亚家族A,多肽2),HNF4A(肝细胞核因子4,α),SLC6A4(溶质载体家族6(神经递质转运蛋白,血清素),成员4),PLA2G6(磷脂酶A2,VI组(细胞溶质,钙非依赖性)),TNFSF11(肿瘤坏死因子(配体)超家族,成员11),SLC8A1(溶质载体家族8(钠/钙交换剂),成员1),F2RL1(凝固因子II(凝血酶)受体样1),AKR1A1(醛酮还原酶家族1,成员A1(醛还原酶)),ALDH9A1(醛脱氢酶9家族,成员A1),BGLAP(骨γ-羧基谷氨酸(gla)蛋白),MTTP(微粒体甘油三酯转运蛋白),MTRR(5-甲基四氢叶酸-高半胱氨酸甲基转移酶还原酶),SULT1A3(磺基转移酶家族,细胞溶质,1A,苯酚优选,成员3),RAGE(肾肿瘤抗原),C4B(补体成分4B(Chido血型),P2RY12(嘌呤能受体P2Y,G蛋白偶联,12),RNLS(renalase,FAD依赖性胺氧化酶),CREB1(cAMP反应元件结合蛋白1),POMC(proopiomelanocortin),RAC1(ras相关C3肉毒杆菌毒素底物1(rho家族,小GTP结合蛋白Rac1)),LMNA(lamin NC),CD59(CD59分子,补体调节蛋白质),SCN5A(钠通道,电压门控,V型,α亚基),CYP1B1(细胞色素P450,家族1,亚家族B,多肽1),MIF(巨噬细胞移动抑制因子(糖基化抑制因子)),MMP13(基质金属肽酶13(胶原酶3)),TIMP2(TIMP金属肽酶抑制子2),CYP19A1(细胞色素P450,家族19,亚家族A,多肽1),CYP21A2(细胞色素P450,家族21,亚家族A,多肽2),PTPN22(蛋白质酪氨酸磷酸酶,非受体22型(淋巴样)),MYH14(肌球蛋白,重链14,非肌肉),MBL2(甘露糖结合凝集素(蛋白C)2,可溶性(调理性缺陷)),SELPLG(选择素P配体),AOC3(胺氧化酶,含铜3(血管粘附蛋白1)),CTSL1(组织蛋白酶L1),PCNA(增殖细胞核抗原),IGF2(胰岛素样生长因子2(生长调节素A)),ITGB1(整合素,β1(纤连蛋白受体,β多肽,抗原CD29包括MDF2,MSK12)),CAST(钙蛋白酶抑制蛋白),CXCL12(趋化因子(C-X-C基序)配体12(基质细胞衍生因子1)),IGHE(免疫球蛋白重常数ε),KCNE1(钾电压门控通道,Isk相关家族,成员1),TFRC(转铁蛋白受体(p90,CD71)),COL1A1(胶原蛋白,I型,α1),COL1A2(胶原蛋白,I型,α2),IL2RB(白细胞介素2受体,β),PLA2G10(磷脂酶A2,X组),ANGPT2(血管生成素2),PROCR(蛋白C受体,内皮细胞(EPCR)),NOX4(NADPH氧化酶4),HAMP(铁调素抗菌肽),PTPN11(蛋白酪氨酸磷酸酶,非受体11型),SLC2A1(溶质载体家族2(促进葡萄糖转运蛋白),成员1),IL2RA(白细胞介素2受体,α),CCL5(趋化因子(C-C基序)配体5),IRF1(干扰素调节因子1),CFLAR(CASP8和FADD样凋亡调节因子),CALCA(降钙素相关多肽α),EIF4E(真核翻译起始因子4E),GSTP1(谷胱甘肽S-转移酶pi 1)),JAK2(Janus激酶2),CYP3A5(细胞色素P450,家族3,亚家族A,多肽5),HSPG2(硫酸乙酰肝素蛋白多糖2),CCL3(趋化因子(C-C基序)配体3),MYD88(骨髓分化初级应答基因(88)),VIP(血管活性肠肽),SOAT1(甾醇O-酰基转移酶1),ADRBK1(肾上腺素能,β,受体激酶1),NR4A2(核受体亚家族4,A组,成员2),MMP8(基质金属肽酶8(中性粒细胞胶原酶)),NPR2(利尿钠肽受体B/鸟苷酸环化酶B(atrionatriuretic肽受体B)),GCH1(GTP环化水解酶1),EPRS(谷氨酰-脯氨酰tRNA合成酶),PPARGC1A(过氧化物酶体增殖物激活受体γ,共激活因子1α),F12(凝血因子XII(Hageman因子)),PECAM1(血小板/内皮细胞粘附分子),CCL4(趋化因子(C-C基序)配体4),SERPINA3(丝氨酸蛋白酶抑制子肽酶抑制子,进化枝A(α-1抗蛋白酶,抗胰蛋白酶),成员3),CASR(钙敏感受体),GJA5(间隙连接蛋白,α5,40kDa),FABP2(脂肪酸结合蛋白2,肠),TTF2(转录终止因子,RNA聚合酶II),PROS1(蛋白S(α)),CTF1(心肌营养素1),SGCB(肌聚糖蛋白,β(43kDa肌营养不良蛋白相关糖蛋白)),YME1L1(YME1样1(酿酒酵母)),CAMP(cathelicidin抗菌肽),ZC3H12A(含有12A的锌指CCCH型),AKR1B1(醛酮还原酶家族1,成员B1(醛糖还原酶)),DES(结蛋白),MMP7(基质金属肽酶7(基质溶解素,子宫)),AHR(芳香烃受体),CSF1(集落刺激因子1(巨噬细胞)),HDAC9(组蛋白去乙酰化酶9),CTGF(结缔组织生长因子),KCNMA1(钾大电导钙激活通道,亚家族M,α成员1),UGT1A(UDP葡糖醛酸基转移酶1家族,多肽A复合基因座),PRKCA(蛋白激酶C,α),COMT(儿茶酚-β-甲基转移酶),S100B(S100钙结合蛋白B),EGR1(早期生长反应1),PRL(催乳素),IL15(白细胞介素15),DRD4(多巴胺受体D4),CAMK2G(钙/钙调蛋白依赖性蛋白激酶IIγ),SLC22A2(溶质载体家族22(有机阳离子转运蛋白),成员2),CCL11(趋化因子(C-C基序)配体11),PGF(B321胎盘生长因子),THPO(血小板生成素),GP6(糖蛋白VI(血小板)),TACR1(速激肽受体1),NTS(神经降压素),HNF1A(HNF1同源异形盒A),SST(生长抑素),KCND1(钾电压门控通道,Shal相关亚家族,成员1),LOC646627(磷脂酶抑制子),TBXAS1(血栓素A合成酶1(血小板)),CYP2J2(细胞色素P450,家族2,亚家族J,多肽2),TBXA2R(血栓素A2受体),ADH1C(醇脱氢酶1C(I类),γ多肽),ALOX12(花生四烯酸12-脂氧合酶,AHSG(α-2-HS-糖蛋白),BHMT(甜菜碱-高半胱氨酸甲基转移酶),GJA4(间隙连接蛋白,α4,37kDa),SLC25A4(溶质载体家族25(线粒体载体;腺嘌呤核苷酸转运蛋白),成员4),ACLY(ATP柠檬酸裂解酶),ALOX5AP(花生四烯酸5-脂氧合酶激活蛋白),NUMA1(核有丝分裂器蛋白1),CYP27B1(细胞色素P450,家族27,亚家族B,多肽1),CYSLTR2(半胱氨酰白三烯受体2),SOD3(超氧化物歧化酶3,细胞外),LTC4S(白三烯C4合成酶),UCN(尿皮质素),GHRL(生长素释放肽/肥胖抑制素前肽),APOC2(载脂蛋白C-II),CLEC4A(C型凝集素结构域家族4,成员A),KBTBD10(含有10的kelch重复和BTB(POZ)结构域),TNC(生腱蛋白C),TYMS(胸苷酸合成酶),SHCl(SHC(含有Src同源性2结构域)转化蛋白1),LRP1(低密度脂蛋白受体相关蛋白1),SOCS3(细胞因子信号传导抑制因子3),ADH1B(乙醇脱氢酶1B(I类),β多肽),KLK3(激肽释放酶相关肽酶3),HSD11B1(羟基类固醇(11-β)脱氢酶1),VKORC1(维生素K环氧化物还原酶复合物,亚基1),SERPINB2(丝氨酸蛋白酶抑制子肽酶抑制子,进化枝B(卵清蛋白),成员2),TNS1(张力蛋白1),RNF19A(无名指蛋白19A),EPOR(促红细胞生成素受体),ITGAM(整合素,αM(补体成分3受体3亚基)),PITX2(配对样同源域2),MAPK7(丝裂原活化蛋白激酶7),FCGR3A(IgG的Fc片段,低亲和力111a,受体(CD16a)),LEPR(瘦素受体),ENG(内皮糖蛋白),GPX1(谷胱甘肽过氧化物酶1),GOT2(谷氨酸-草酰乙酸转氨酶2,线粒体(天冬氨酸氨基转移酶2)),HRH1(组胺受体H1),NR112(核受体亚家族1,I组,成员2),CRH(促肾上腺皮质激素释放激素),HTR1A(5-羟色胺(血清素)受体1A),VDAC1(电压依赖性阴离子通道1),HPSE(乙酰肝素酶),SFTPD(表面活性蛋白D),TAP2(转运蛋白2,ATP结合盒,亚家族B(MDR/TAP)),RNF123(无名指蛋白123),PTK2B(PTK2B蛋白酪氨酸激酶2β),NTRK2(神经营养酪氨酸激酶,受体,2型),IL6R(白细胞介素6受体),ACHE(乙酰胆碱酯酶(Yt血型)),GLP1R(胰高血糖素样肽1受体),GHR(生长激素受体),GSR(谷胱甘肽还原酶),NQO1(NAD(P)H脱氢酶,醌1),NR5A1(核受体亚家族5,A组,成员1),GJB2(间隙连接蛋白,β2,26kDa)),SLC9A1(溶质载体家族9(钠/氢交换剂),成员1),MAOA(单胺氧化酶A),PCSK9(前蛋白转化酶枯草杆菌蛋白酶/kexin9型),FCGR2A(IgG的Fc片段,低亲和力IIa,受体(CD32)),SERPINF1(丝氨酸蛋白酶抑制肽酶抑制子,进化枝F(α-2抗纤溶酶,色素上皮衍生因子),成员1),EDN3(内皮素3),DHFR(二氢叶酸还原酶),GAS6(生长停滞特异性6),SMPD1(鞘磷脂磷酸二酯酶1,酸性溶酶体),UCP2(解偶联蛋白2(线粒体,质子载体)),TFAP2A(转录因子AP-2α(激活增强子结合蛋白2α)),C4BPA(补体成分4结合蛋白,α)),SERPINF2(丝氨酸蛋白酶抑制肽酶抑制子,进化枝F(α-2抗纤溶酶,色素上皮衍生因子),成员2),TYMP(胸苷磷酸化酶),ALPP(碱性磷酸酶,胎盘(里根同工酶)),CXCR2(趋化因子(C-X-C基序)受体2),SLC39A3(溶质载体家族39(锌转运蛋白),成员3),ABCG2(ATP结合盒,亚家族G(WHITE),成员2),ADA(腺苷脱氨酶),JAK3(Janus激酶3),HSPA1A(热休克70kDa蛋白1A),FASN(脂肪酸合成酶),FGF1(成纤维细胞生长因子1(酸性)),F11(凝血因子XI),ATP7A(ATP酶,Cu++转运,α多肽),CR1(补体成分(3b/4b)受体1(Knops血型)),GFAP(胶质原纤维酸性蛋白),ROCK1(Rho相关,含有蛋白激酶1的卷曲螺旋),MECP2(甲基CpG结合蛋白2(Rett综合症)),MYLK(肌球蛋白轻链激酶),BCHE(丁酰胆碱酯酶),LIPE(脂肪酶,激素敏感),PRDX5(过氧化还原酶5),ADORA1(腺苷A1受体),WRN(Werner综合症,RecQ类螺旋酶),CXCR3(趋化因子(C-X-C基序)受体3),CD81(CD81分子),SMAD7(SMAD家族成员7),LAMC2(层粘连蛋白,γ2),MAP3K5(丝裂原活化蛋白激酶激酶5),CHGA(嗜铬粒蛋白A(甲状旁腺分泌蛋白1)),IAPP(胰岛淀粉样蛋白多肽),RHO(视紫红质),ENPP1(外核苷酸焦磷酸酶/磷酸二酯酶1),PTHLH(甲状旁腺激素样激素),NRG1(神经调节蛋白1),VEGFC(血管内皮生长因子C),ENPEP(谷氨酰氨肽酶(氨肽酶A)),CEBPB(CCAAT/增强子结合蛋白(C/EBP),β),NAGLU(N-乙酰氨基葡萄糖苷酶,α-),F2RL3(凝血因子II(凝血酶))受体样3),CX3CL1(趋化因子(C-X3-C基序)配体1),BDKRB1(缓激肽受体B1),ADAMTS13(ADAM金属肽酶与血小板反应蛋白1型基序,13),ELANE(弹性蛋白酶,中性粒细胞表达),ENPP2(外核苷酸焦磷酸酶/磷酸二酯酶2),CISH(细胞因子可诱导的含SH2蛋白),GAST(胃泌素),MYOC(肌球蛋白,小梁网诱导糖皮质激素反应),ATP1A2(ATP酶,Na+/K+转运,α2多肽),NF1(神经纤维蛋白1),GJB1(间隙连接蛋白,β1,32kDa),MEF2A(肌细胞增强因子2A),VCL(钮蛋白),BMPR2(骨形态发生蛋白受体,II型(丝氨酸/苏氨酸激酶)),TUBB(微管蛋白,β),CDC42(细胞分裂周期42(GTP结合蛋白,25kDa)),KRT18(角蛋白18),HSF1(热休克转录因子1),MYB(v-myb骨髓增生异常病毒癌基因同源物(禽)),PRKAA2(蛋白激酶,AMP激活,α2催化亚基),ROCK2(Rho相关,含有卷曲螺旋的蛋白激酶2),TFPI(组织因子途径抑制子(脂蛋白相关凝血抑制子)),PRKG1(蛋白激酶,cGMP依赖性,I型),BMP2(骨形态发生蛋白2),CTNND1(连环蛋白(钙粘蛋白相关蛋白),δ1),CTH(胱硫醚酶(胱硫醚γ-裂解酶)),CTSS(组织蛋白酶S),VAV2(vav2鸟嘌呤核苷酸交换因子),NPY2R(神经肽Y受体Y2),IGFBP2(胰岛素样生长因子结合蛋白2,36kDa),CD28(CD28分子),GSTA1(谷胱甘肽S-转移酶α1),PPIA(肽基脯氨酸异构酶A(亲环蛋白A)),APOH(载脂蛋白H(β-2-糖蛋白I)),S100A8(S100钙结合蛋白A8),IL11(白细胞介素11),ALOX15(花生四烯酸15-脂氧合酶),FBLN1(纤蛋白1),NR1H3(核受体亚家族1,H组,成员3),SCD(硬脂酰-CoA去饱和酶(δ-9-去饱和酶)),GIP(胃抑制多肽),CHGB(嗜铬粒蛋白B(纤维蛋白粗粒蛋白1)),PRKCB(蛋白激酶C,β),SRD5A1(甾体-5-α-还原酶,α多肽1(3-氧代-5α-甾体δ4-脱氢酶α1)),HSD11B2(羟基类固醇(11-β)脱氢酶2),CALCRL(降钙素受体样),GALNT2(UDP-N-乙酰基-α-D-半乳糖胺:多肽N-乙酰半乳糖胺基转移酶2(GalNAc-T2)),ANGPTL4(血管生成素样4),KCNN4(钾中间体/小电导钙激活通道,亚家族N,成员4),PIK3C2A(磷酸肌醇-3激酶,2类,α多肽),HBEGF(肝素结合)EGF样生长因子),CYP7A1(细胞色素P450,家族7,亚家族A,多肽1),HLA-DRB5(主要组织相容性复合物,II类,DRβ5),BNIP3(BCL2/腺病毒E1B19kDa相互作用蛋白3),GCKR(葡萄糖激酶(己糖激酶4)调节子),S100A12(S100钙结合蛋白A12),PADI4(肽基精氨酸脱亚胺酶,IV型),HSPA14(热休克70kDa蛋白14),CXCR1(趋化因子(C-X-C基序)受体1),H19(H19,印迹母系表达的转录物(非蛋白质编码)),KRTAP19-3(角蛋白相关蛋白19-3),IDDM2(胰岛素依赖型糖尿病2),RAC2(ras相关C3肉毒杆菌毒素底物2(rho家族,小GTP结合蛋白Rac2)),RYR1(兰尼碱受体1(骨骼)),CLOCK(时钟同源物(小鼠)),NGFR(神经生长因子受体(TNFR超家族,成员16)),DBH(多巴胺β-羟化酶(多巴胺β-单加氧酶)),CHRNA4(胆碱能受体,烟碱,α4),CACNA1C(钙通道,电压依赖性,L型,α1C亚基),PRKAG2(蛋白激酶,AMP激活,γ2非催化亚基),CHAT(胆碱乙酰转移酶),PTGDS(前列腺素D2合成酶21kDa(脑)),NR1H2(核受体亚家族1,H组,成员2),TEK(TEK酪氨酸激酶,内皮细胞),VEGFB(血管内皮生长因子B),MEF2C(肌细胞增强因子2C),MAPKAPK2(丝裂原活化蛋白激酶活化蛋白激酶2),TNFRSF11A(肿瘤坏死因子受体超家族,成员11a,NFκB激活剂),HSPA9(热休克70kDa蛋白9(mortalin)),CYSLTR1(半胱氨酰白三烯受体1),MAT1A(蛋氨酸腺苷转移酶I,α),OPRL1(阿片受体样1),IMPA1(肌醇(myo)-1(或4)-单磷酸酶1),CLCN2(氯通道2),DLD(二氢硫辛酰胺脱氢酶),PSMA6(蛋白酶体(前体,macropain)亚基,α型,6),PSMB8(蛋白酶体(前体,macropain)亚基,β型,8(大型多功能肽酶7)),CHI3L1(几丁质酶3样1(软骨糖蛋白-39)),ALDH1B1(醛脱氢酶1家族,成员B1),PARP2(聚(ADP-核糖)聚合酶2),STAR(类固醇生成急性调节蛋白),LBP(脂多糖结合蛋白),ABCC6(ATP结合盒,亚家族C(CFTR/MRP),成员6),RGS2(G蛋白信号调节因子2,24kDa),EFNB2(ephrin-B2),GJB6(间隙连接蛋白,β6,30kDa),APOA2(载脂蛋白A-II),AMPD1(腺苷一磷酸脱氨酶1),DYSF(dysferlin,肢带肌营养不良症2B(常染色体隐性遗传)),FDFT1(法呢基二磷酸法尼基转移酶1),EDN2(内皮素2),CCR6(趋化因子(C-C基序)受体6),GJB3(间隙连接蛋白,β3,31kDa),IL1RL1(白细胞介素1受体样1),ENTPD1(外核苷三磷酸二磷酸水解酶1),BBS4(巴德特-比德尔综合症4),CELSR2(钙粘蛋白,EGFLAG七通G型受体2(火烈鸟同源物,果蝇)),F11R(F11受体),RAPGEF3(Rap鸟嘌呤核苷酸交换因子(GEF)3),HYAL1(透明质酸氨基葡萄糖苷酶1),ZNF259(锌指蛋白259),ATOX1(ATX1抗氧化蛋白1同源物(酵母)),ATF6(激活转录因子6),KHK(酮己酮酶(果糖激酶)),SAT1(亚精胺/精胺N1-乙酰转移酶1),GGH(γ-谷氨酰水解酶(结合酶,叶酸多丙种球蛋白水解酶)),TIMP4(TIMP金属肽酶抑制子4),SLC4A4(溶质载体家族4,碳酸氢钠协同转运蛋白,成员4),PDE2A(磷酸二酯酶2A,cGMP刺激),PDE3B(磷酸二酯酶3B,cGMP抑制),FADS1(脂肪酸去饱和酶1),FADS2(脂肪酸去饱和酶2),TMSB4X(胸腺素β4,X-连接),TXNIP(硫氧还蛋白相互作用蛋白),LIMS1(LIM和衰老细胞抗原样结构域1),RHOB(ras同源基因家族,成员B),LY96(淋巴细胞抗原96),FOXO1(叉头盒O1),PNPLA2(含有2的patatin样磷脂酶结构域),TRH(促甲状腺激素释放激素),GJC1(间隙连接蛋白,γ1,45kDa),SLC17A5(溶质载体家族17(阴离子/糖转运蛋白),成员5),FTO(脂肪量和肥胖相关),GJD2(间隙连接蛋白,δ2,36kDa),PSRC1(脯氨酸/富含丝氨酸的卷曲螺旋1),CASP12(半胱天冬酶12(基因/假基因)),GPBAR1(G蛋白偶联胆汁酸受体1),PXK(含有丝氨酸/苏氨酸激酶的PX结构域),IL33(白细胞介素33),TRIB1(tribbles同源物1(果蝇)),PBX4(前B细胞白血病同源异形盒4),NUPR1(核蛋白,转录调节因子,1),15-Sep(15kDa硒蛋白),CILP2(软骨中间层蛋白2),TERC(端粒酶RNA组分),GGT2(γ-谷氨酰转移酶2),MT-CO1(线粒体编码的细胞色素c氧化酶I)和UOX(尿酸氧化酶,假基因)。任何这些序列可以是Cpf1 CRISPR系统的靶标,例如,以解决突变。
在另外的实施方式中,染色体序列可以进一步选自Pon1(对氧磷酶1),LDLR(LDL受体),ApoE(载脂蛋白E),Apo B-100(载脂蛋白B-100),ApoA(载脂蛋白(a)),ApoA1(载脂蛋白A1),CBS(胱硫醚B-合酶),糖蛋白IIb/IIb,MTHRF(5,10-亚甲基四氢叶酸还原酶(NADPH)及其组合。在一次迭代中,染色体序列和由涉及心血管疾病的染色体序列编码的蛋白质可以选自Cacna1C,Sod1,Pten,Ppar(α),ApoE,瘦蛋白及其组合作为Cpf1 CRISPR系统的靶标。
治疗肝和肾疾病
本发明还考虑将本文所述的Cpf1 CRISPR系统(例如Cpf1效应蛋白系统)递送至肝脏和/或肾脏。诱导细胞摄取治疗性核酸的递送策略包括物理力或载体系统,例如基于病毒、脂质或复合物的递送或纳米载体。从临床相关性较低的初始应用来看,当系统地用流体动力学高压注射将核酸用于肾细胞时,广泛的基因治疗病毒和非病毒载体已经应用于在体内靶向不同动物肾病模型中的转录后事件(Csaba Révész and Péter Hamar(2011).Delivery Methods to Target RNAs in the Kidney,Gene Therapy Applications,Prof.Chunsheng Kang(Ed.),ISBN:978-953-307-541-9,InTech,Available from:http://www.intechopen.com/books/gene-therapy-applications/delivery-me thods-to-target-rnas-inthe-kidney)。肾脏的递送方法可包括Yuan等(Am J Physiol RenalPhysiol 295:F605–F617,2008)中的那些,其研究了体内递送靶向花生四烯酸代谢的12/15-脂氧合酶(12/15-LO)途径的小干扰RNA(siRNA)是否可以在链脲佐菌素注射的1型糖尿病小鼠模型中改善肾损伤和糖尿病肾病(DN)。为了在肾脏中实现更好的体内可及和siRNA表达,Yuan等人使用与胆固醇缀合的双链12/15-Lo siRNA寡核苷酸。将约400μg的siRNA皮下注射到小鼠中。Yuang等人的方法可以应用于本发明的CRISPR Cas系统,考虑将1-2g与胆固醇缀合的CRISPR Cas皮下注射至人以供递送至肾脏。
Molitoris等(J Am Soc Nephrol 20:1754–1764,2009)利用近端小管细胞(PTC)作为肾脏内寡核苷酸重吸收的位点,以测试siRNA靶向p53的功效,p53是细胞凋亡途径中的关键蛋白,可预防肾损伤。在缺血性损伤后4小时后静脉注射针对p53的裸合成siRNA最大限度地保护了PTC和肾功能。Molitoris等人的数据表明静脉内给药后,siRNA快速递送至近端小管细胞。对于剂量-反应分析,给大鼠注射剂量为siP53,0.33;1、3或5mg/kg,在相同的四个时间点给予,导致累积剂量分别为1.32;4、12和20mg/kg。测试的所有siRNA剂量在第1天产生SCr降低作用,较高剂量与PBS处理的缺血对照大鼠相比在约5天内有效。12和20mg/kg累积剂量提供了最好的保护作用。Molitoris等人的方法可以应用至本发明的核酸靶向系统,考虑将12和20mg/kg累积剂量用于人以递送至肾脏。
Thompson等(Nucleic Acid Therapeutics,Volume 22,Number 4,2012)报道了在啮齿动物和非人灵长类动物中静脉内给药后合成的小干扰RNA I5NP的毒理学和药代动力学特性。I5NP被设计成通过RNA干扰(RNAi)途径起作用以暂时抑制促凋亡蛋白p53的表达,并且正在开发以保护细胞免于急性缺血/再灌注损伤,例如在主要心脏手术期间可能发生的急性肾损伤和肾移植后可能发生的延迟移植功能。需要在啮齿动物中摄入800mg/kgI5NP,在非人灵长类动物中摄入1,000mg/kg I5NP,以引起不良反应,这在猴子中被单独分离以直接影响血液,包括补体的亚临床活化和凝血时间略微增加。在大鼠中,对于I5NP的大鼠类似物没有观察到另外的副作用,表明该作用可能代表合成RNA双链体的类效应,而不是与I5NP的预期药理活性相关的毒性。总之,这些数据支持静脉内施用用于保护急性缺血/再灌注损伤后的肾功能的I5NP的临床试验。在猴中未观察到的不良反应水平(NOAEL)为500mg/kg。在剂量水平至多25mg/kg的静脉内给药后,在猴子中没有观察到对心血管、呼吸和神经学参数的影响。因此,可考虑将类似剂量用于将CRISPR Cas静脉内施用于人的肾脏。
Shimizu等(J Am Soc Nephrol 21:622–633,2010)开发了一种系统,用于通过基于聚(乙二醇)-聚(L-赖氨酸)的载体将siRNA靶向递送至肾小球。siRNA/纳米载体复合物的直径约为10至20nm,其大小允许其穿过有孔内皮移动以进入系膜。在腹膜内注射荧光标记的siRNA/纳米载体复合物后,Shimizu等人长时间检测血液循环中的siRNA。重复腹膜内施用丝裂原活化蛋白激酶1(MAPK1)siRNA/纳米载体复合物抑制肾小球肾炎小鼠模型中的肾小球MAPK1mRNA和蛋白表达。为了研究siRNA积累,将与PIC纳米载体复合的Cy5标记的siRNA(0.5ml,5nmol siRNA含量),裸Cy5标记的siRNA(0.5ml,5nmol)或封装在HVJ-E(0.5ml,5nmol siRNA含量)中的Cy5标记的siRNA施用于BALBc小鼠。Shimizu等人的方法可以应用于本发明的核酸靶向系统,考虑以约10-20μmol CRISPR Cas与约1-2升的纳米载体复合的剂量用于对人进行腹膜内给药并递送至肾脏。肾脏的递送方法总结如下:
靶向肝脏或肝细胞
提供靶向肝细胞。这可以是体外或体内。优选肝细胞。本文中Cpf1蛋白(例如Cpf1)的递送可以通过病毒载体,尤其是AAV(特别是AAV2/6)载体。这些可以通过静脉内注射给药。
无论是体外还是体内,肝脏的优选靶标是白蛋白基因。这是所谓的“安全港”,因为白蛋白以非常高的水平表达,因此可以容忍在成功进行基因编辑后白蛋白产量的一些减少。还优选的是,从白蛋白启动子/增强子看到的高水平表达允许有效水平的正确或转基因产生(来自插入的供体模板)得以实现,即使仅编辑了一小部分肝细胞。
Wechsler等(reported at the 57th Annual Meeting and Exposition of theAmerican Society of Hematology-abstract available online at https:// ash.confex.com/ash/2015/webprogram/Paper86495.html and presented on 6thDecember 2015)已经显示了白蛋白的内含子1是合适的靶位点。他们的工作使用锌指在该靶位点切割DNA,并且可以产生合适的指导序列以指导CRISPR蛋白在相同位点的切割。
使用高表达的基因(基因的高活性增强剂/启动子)例如白蛋白中的靶标还允许使用无启动子的供体模板,例如由Wechsler等报道,并且这也广泛适用于肝靶向之外。高表达基因的其他实例是已知的。
其他肝脏疾病
在特定的实施方式中,本发明的CRISPR蛋白用于治疗肝疾病例如转甲状腺素蛋白淀粉样变性(ATTR)、α-1抗胰蛋白酶缺乏和新陈代谢的其它基于肝的先天性代谢障碍。FAP是由编码转甲状腺素蛋白(TTR)的基因突变引起的。虽然它是一种常染色体显性遗传疾病,但不是所有携带者会发病。已知TTR基因中的超过100个突变与该疾病相关。常见突变的实例包括V30M。使用iRNA的研究证实了基于基因沉默的TTR治疗的原则(Ueda等2014TranslNeurogener.3:19)。威尔逊病(WD)是由编码ATP7B的基因的突变引起的,ATP7B仅在肝细胞中发现。有超过500种与WD有关的突变,在东亚等特定地区的流行率增加。其他实例是A1ATD(由SERPINA1基因突变引起的常染色体隐性遗传疾病)和PKU(由苯丙氨酸羟化酶(PAH)基因突变引起的常染色体隐性遗传疾病)。
肝脏相关的血液疾病,特别是血友病,特别是B型血友病
已经在小鼠(体外和体内)和非人灵长类动物(体内)中实现了肝细胞的成功基因编辑,表明通过肝细胞中的基因编辑/基因组工程处理血液病症是可行的。特别是,在非人灵长类动物中已经显示人类F9(hF9)基因在肝细胞中的表达,这提示在人类中对B型血友病的治疗。
Wechsler等在美国血液学会第57届年会和博览会(57th Annual Meeting andExposition of the American Society of Hematology)上报道(摘要于2015年12月6日发布,可在线访问https://ash.confex.com/ash/2015/webprogram/Paper86495.html)他们通过体内基因编辑成功地从非人灵长类动物的肝细胞中表达人F9(hF9)。这是通过使用1)靶向白蛋白基因座的内含子1的两个锌指核酸酶(ZFN)和2)人F9供体模板构建体来实现的。ZFN和供体模板在静脉内注射的单独的肝细胞腺相关病毒血清型2/6(AAV2/6)载体上编码,导致hF9基因的校正拷贝靶向插入至一部分肝脏肝细胞中的白蛋白基因座。
选择白蛋白基因座作为“安全港”,因为这种最丰富的血浆蛋白的产量超过10g/天,并且这些水平上的适度降低是良好耐受的。由高活性白蛋白增强子/启动子驱动,基因组编辑的肝细胞产生治疗量的正常hFIX(hF9),而非白蛋白。显示了hF9转基因在白蛋白基因座处的靶向整合以及该基因剪接到白蛋白转录物中。
小鼠研究:通过尾静脉注射以1.0×1013载体基因组(vg)/kg给C57BL/6小鼠施用编码小鼠替代试剂的载体(n=20)或AAV2/6载体(n=25)。经处理小鼠的血浆hFIX的ELISA分析显示了在6个月研究期间持续的50-1053ng/mL的峰值水平。对来自小鼠血浆的FIX活性的分析证实了与表达水平相当的生物活性。
非人灵长类动物(NHP)研究:以1.2×1013vg/kg(n=5/组)单次静脉内共注入编码NHP靶向白蛋白特异性ZFN的AAV2/6载体和人F9供体导致在该大型动物模型中>50ng/mL(>正常值的1%)。使用较高的AAV2/6剂量(至多1.5×1014vg/kg)可在一只动物中在研究期间(3个月)产生动物血浆hFIX水平达到1000ng/ml(或正常值的20%),最高可达2000ng/ml(或正常值的50%)。
该治疗在小鼠和NHP中具有良好的耐受性,在任一物种于治疗剂量下没有与AAV2/6ZFN+供体治疗相关的显著毒理学发现。Sangamo(美国加利福尼亚州)已向FDA申请并获准进行世界上第一个体内基因组编辑应用的人体临床试验。这是紧随在EMEA批准Glybera基因疗法治疗脂蛋白脂肪酶缺乏症之后。
因此,在一些实施方式中,优选使用以下任何或所有:
·AAV(尤其是AAV2/6)载体,优选通过静脉内注射给药;
·白蛋白作为基因编辑/转基因插入/模板的靶标-特别是在白蛋白的内含子1中;
·人类F9供体模板;和/或
·无启动子供体模板。
B型血友病
因此,在一些实施方式中,优选本发明用于治疗B型血友病。因此优选通过提供合适的指导RNA靶向F9(因子IX)。理想情况下,酶和指导可以靶向产生F9的肝脏,尽管它们可以一起或分开递送。在一些实施方式中,提供了模板,并且这是人F9基因。应理解,hF9模板包含野生或“正确”版本的hF9,以便有效治疗。在一些实施方式中,可以使用双载体系统:用于Cpf1的一个载体和用于修复模板的一个载体。修复模板可包括两种或更多种修复模板,例如来自不同哺乳动物物种的两种F9序列。在一些实施方式中,提供了小鼠和人F9序列。这可以递送给小鼠。Yang Yang,John White,McMenamin Deirdre和Peter Bell博士在第58届美国血液学会年会(2016年11月)上发表报告说,这增加了效力和准确性。第二载体将因子IX的人序列插入小鼠基因组中。在一些实施方式中,靶向插入导致嵌合高活性因子IX蛋白的表达。在一些实施方式中,这是在天然小鼠因子IX启动子的控制下。将这种双组分系统(载体1和载体2)以增加的剂量注射到新生和成年“敲除”小鼠中导致稳定的因子IX活性的表达和活性在正常(或甚至更高)水平下超过四个月。在治疗人的情况下,可以用天然人F9启动子代替。在一些实施方式中,恢复野生表型。
在另一个实施方式中,可以递送F9的B型血友病版本以产生具有或携带B型血友病表型即不能产生野生型F9的模型生物、细胞或细胞系(例如鼠或非人灵长类动物模型生物、细胞或细胞系)、模型生物、细胞或细胞系。
A型血友病
在一些实施方式中,F9(因子IX)基因可以被上述F8(因子VIII)基因置换,导致治疗A型血友病(通过提供正确的F8基因)和/或产生A型血友病模型生物、细胞或细胞系(通过提供不正确的A型血友病的F8基因)。
C型血友病
在一些实施方式中,F9(因子IX)基因可以被上述F11(因子XI)基因置换,导致治疗C型血友病(通过提供正确的F11基因)和/或产生C型血友病模型生物、细胞或细胞系(通过提供不正确的C型血友病的F11基因)。
运甲状腺素蛋白淀粉样变性
运甲状腺素蛋白是主要在肝脏中产生存在于血清和CSF中的蛋白质,其携带与视黄醇(维生素A)结合的甲状腺素激素和视黄醇结合蛋白。超过120种不同的突变可引起甲状腺素转运蛋白淀粉样变性(ATTR),这是一种遗传性基因疾病,其中蛋白质的突变形式聚集在组织,特别是外周神经系统中,引起多发性神经病。家族性淀粉样多发性神经病(FAP)是最常见的TTR疾病,并且在2014年被认为影响欧洲每10万人中47人。Val30Met的TTR基因突变被认为是最常见的突变,导致估计50%的FAP病例。在没有肝脏移植(迄今为止唯一已知的治疗方法)的情况下,该疾病通常在诊断后十年内致命。大多数病例是单基因的。
在ATTR的小鼠模型中,可以通过递送CRISPR/Cpf1以剂量依赖性方式编辑TTR基因。在一些实施方式中,Cpf1以mRNA提供。在一些实施方式中,Cpf1mRNA和指导RNA包装在LNP中。在LNP中包装的包含Cpf1mRNA和指导RNA的系统在肝脏中实现至多60%的编辑效率,血清TTR水平降低至多80%。因此,在一些实施方式中,靶向运甲状腺素蛋白,特别是校正Val30Met突变。因此,在一些实施方式中,治疗ATTR。
α-1抗胰蛋白酶缺乏症
α-1抗胰蛋白酶(A1AT)是在肝脏中产生的,其主要作用是在肺中降低嗜中性弹性蛋白酶(降解结缔组织的酶)的活性。α-1抗胰蛋白酶缺乏症(ATTD)是由编码A1AT的SERPINA1基因的突变引起的疾病。A1AT的产生受损导致肺的结缔组织逐渐退化,导致类似肺气肿的症状。
多种突变可引起ATTD,尽管最常见的突变是Glu342Lys(称为Z等位基因,野生型称为M)或Glu264Val(称为S等位基因),并且每个等位基因同样促成疾病状态,两个受影响的等位基因导致更明显的病理生理学。这些结果不仅导致敏感器官(例如肺)的结缔组织降解,而且肝脏中突变体的积累可导致蛋白质毒性。目前的治疗集中于通过注射从捐献的人血浆中回收的蛋白质来替代A1AT。在严重的情况下,可考虑进行肺和/或肝移植。
该疾病的常见变体再次是单基因的。在一些实施方式中,靶向SERPINA1基因。在一些实施方式中,校正Glu342Lys突变(称为Z等位基因,野生型称为M)或Glu264Val突变(称为S等位基因)。因此,在一些实施方式中,有缺陷的基因需要被野生型功能基因置换。在一些实施方式中,需要敲除和修复方法,因此提供修复模板。在双等位基因突变的情况下,在一些实施方式中,纯合突变仅需要一种指导RNA,但在杂合突变的情况下,可能需要两种指导RNA。在一些实施方式中,递送至肺或肝。
先天性新陈代谢错误
先天性代谢错误(IEM)是一个伞形组的影响代谢过程的疾病。在一些实施方式中,待治疗IEM。这些疾病中的大多数本质上是单基因的(例如苯丙酮尿症),并且病理生理学是由具有固有毒性的物质的异常积累或导致不能合成必需物质的突变引起的。取决于IEM的性质,CRISPR/Cpf1可用于促进单独敲除,或与通过修复模板替换缺陷基因组合。在一些实施方式中,可受益于CRISPR/Cpf1技术的示例性疾病是原发性高草酸尿1型(PH1)、精氨酸琥珀酸裂解酶缺乏、鸟氨酸转氨甲酰酶缺乏、苯丙酮尿症或PKU,以及枫糖尿病。
治疗上皮和肺部疾病
本发明还考虑将本文所述的Cpf1 CRISPR系统(例如Cpf1效应蛋白系统)递送至一个或两个肺。
尽管基于AAV-2的载体最初被提议用于CFTR递送至CF气道,但是其他血清型如AAV-1、AAV-5、AAV-6和AAV-9在多种肺上皮模型中表现出改善的基因转移效率(参见,例如,Li等,Molecular Therapy,vol.17no.12,2067-2077Dec 2009)。在体外转导人气道上皮细胞时,AAV-1被证实比AAV-2和AAV-5效率高约100倍,尽管在体内转导AAV-1的小鼠气管气道上皮细胞的效率与AAV-5相当。其他研究表明,AAV-5在体外基因递送至人呼吸道上皮(HAE)时比AAV-2高50倍,并且比在体内小鼠肺气道上皮中显著更有效。AAV-6在体外人体呼吸道上皮细胞和体内小鼠气道中也显示出比AAV-2更有效。最近的分离株AAV-9显示在体内小鼠鼻和肺泡上皮细胞中比AAV-5更高的基因转移效率,检测到超过9个月的基因表达,这表明AAV可以在体内实现长期基因表达(CFTR基因递送载体的期望特性)。此外,证实AAV-9可以重新施用至小鼠肺,而不会丧失CFTR表达和最小的免疫后果。CF和非CF HAE培养物可以用100μl AAV载体在顶端表面上接种数小时(参见,例如,Li等,Molecular Therapy,vol.17no.12,2067-2077Dec 2009)。MOI可能从1×103变化至4×105个载体基因组/细胞,取决于病毒浓度和实验目的。考虑上述引用的载体用于本发明的递送和/或施用。
Zamora等(Am J Respir Crit Care Med Vol 183.pp 531–538,2011)报道了RNA干扰治疗剂应用于人类感染性疾病治疗中的实例以及抗病毒药物在呼吸道合胞病毒(RSV)感染的肺移植受者上的随机试验。Zamora等人在患有RSV呼吸道感染的LTX受者中进行了随机、双盲、安慰剂对照试验。允许患者接受RSV标准治疗。每天施用雾化的ALN-RSV01(0.6mg/kg)或安慰剂,持续3天。该研究表明,靶向RSV的RNAi治疗剂可以安全地施用于患有RSV感染的LTX受者中。每日三次的剂量的ALN-RSV01不会导致呼吸道症状恶化或肺功能受损,并且没有表现出任何全身性促炎作用,例如诱导细胞因子或CRP。药代动力学显示吸入后仅有短暂的瞬时全身暴露,与临床前动物数据一致,显示ALN-RSV01(经静脉内或通过吸入给药)通过外切核酸酶介导的消化和肾脏排泄迅速从循环中清除。Zamora等人的方法可以应用于本发明的核酸靶向系统和雾化的CRISPR Cas,例如剂量为0.6mg/kg可以考虑用于本发明。
治疗肺病的受试者可以例如在自发呼吸时每个肺内经支气管内递送接受药学有效量的雾化AAV载体系统。因此,雾化递送通常优选用于AAV递送。腺病毒或AAV颗粒可用于递送。可以将每个与一个或多个调控序列可操作地连接的合适的基因构建体克隆到递送载体中。在这种情况下,提供以下构建体作为实例:用于Cas(Cpf1)的Cbh或EF1a启动子,用于指导RNA的U6或H1启动子):优选的排列是使用CFTRδ508靶向指导,deltaF508突变的修复模板和密码子优化的Cpf1酶,任选地具有一个或多个核定位信号或序列(NLS),例如两(2)个NLS。还设想了没有NLS的构建体。
治疗肌肉系统的疾病
本发明还考虑将本文所述的Cpf1 CRISPR系统(例如Cpf1效应蛋白系统)递送至肌肉。
Bortolanza等(Molecular Therapy vol.19no.11,2055–2064Nov.2011)显示,在面肩肱型肌营养不良症(FSHD)发作后,FRG1小鼠中RNA干扰表达盒的全身递送导致剂量依赖性长期FRG1敲低而没有毒性迹象。Bortolanza等发现单次静脉注射5×1012vg的rAAV6-sh1FRG1可以挽救FRG1小鼠的肌肉组织病理学和肌肉功能。详细地,使用25号Terumo注射器将200μl含有2×1012或5×1012vg载体的生理溶液注射到尾静脉中。Bortolanza等人的方法可以应用于表达CRISPR Cas的AAV并以约2×1015或2×1016vg载体的剂量注射到人体内。
Dumonceaux等(Molecular Therapy vol.18no.5,881–887May 2010)使用针对肌生成抑制素受体AcvRIIb mRNA(sh-AcvRIIb)的RNA干扰技术抑制肌肉生长抑制素途径。准肌营养不良蛋白的恢复由载体化U7外显子跳跃技术(U7-DYS)介导。将携带单独的sh-AcvrIIb构建体、单独的U7-DYS构建体或两种构建体的组合的腺相关载体注射到营养不良的mdx小鼠的胫骨前肌(TA)肌肉中。用1011个AAV病毒基因组进行注射。Dumonceaux等人的方法可以例如,以约1014至约1015vg载体的剂量应用至表达CRISPR Cas的AAV并注射入人体内。
Kinouchi等(Gene Therapy(2008)15,1126–1130)报道了通过用未化学修饰的siRNA与去端肽胶原(ATCOL)的纳米颗粒形成在体内将siRNA递送到正常或患病小鼠的骨骼肌中的有效性。ATCOL介导的siRNA靶向肌肉生长抑制素(骨骼肌生长的负调节剂)在小鼠骨骼肌或静脉内的局部应用引起在应用后几周内肌肉质量的显著增加。这些结果意味着ATCOL介导的siRNA应用是未来治疗包括肌肉萎缩在内的疾病的有力工具。根据制造商的说明将MstsiRNA(终浓度,10mM)与ATCOL(局部给药的最终浓度,0.5%)(AteloGene,Kohken,Tokyo,Japan)混合。通过戊巴比妥(25mg/kg,i.p.)麻醉小鼠(20周龄雄性C57BL/6)后,将Mst-siRNA/ATCOL复合物注射到咬肌和股二头肌中。Kinouchi等人的方法可以应用于CRISPR Cas并注射到人体中,例如,以约500至1000ml的剂量将40μM溶液注入肌肉中。Hagstrom等(Molecular Therapy Vol.10,No.2,August 2004)描述了一种血管内非病毒方法,其能够有效且可重复地将核酸递送至哺乳动物肢体肌肉的肌肉细胞(肌纤维)。该过程涉及将裸质粒DNA或siRNA注射到肢体的远端静脉中,所述肢体通过止血带或血压袖带瞬时分离。通过以足够的体积快速注射以使核酸溶液外渗到肌肉组织中,从而促进向肌纤维的核酸递送。在小型和大型动物中实现了骨骼肌中高水平的转基因表达,毒性最小。还获得了siRNA递送至肢体肌肉的证据。为了将质粒DNA静脉内注射到恒河猴中,将三通旋塞连接到两个注射泵(Model PHD 2000;Harvard Instruments),每个注射泵装载一个注射器。注射罂粟碱5分钟后,以1.7或2.0ml/s的速率注射pDNA(在40-100ml盐水中15.5至25.7mg)。对于本发明的表达CRISPR Cas的质粒DNA,可以按比例放大,将约300至500mg于800至2000ml盐水注射至人体。对于注射到大鼠中的腺病毒载体,将2×109感染性颗粒于3ml普通生理盐水溶液(NSS)注入。对于表达本发明的CRISPR Cas的腺病毒载体,这可以按比例放大,约1×1013感染性颗粒于10升NSS被注射至人体中。对于siRNA,将12.5μg的siRNA经大隐静脉注射至大鼠中,并将750μg的siRNA经大隐静脉注射至灵长类动物。这可以按比例放大用于本发明的CRISPR Cas,例如,向人的大隐静脉注射约15至约50mg。
还参见,例如,WO2013163628 A2,突变基因的遗传校正,杜克大学的公开申请描述了校正的努力,例如,导致过早终止密码子和截短的基因产物的移码突变可以通过核酸酶介导的非同源末端连接来校正,例如治疗Duchenne肌营养不良症((“DMD”)由于肌营养不良蛋白基因突变导致肌肉退化的隐性、致命、X连锁疾病)的那些。导致DMD的大多数肌营养不良蛋白突变是外显子的缺失,其破坏阅读框架并导致肌营养不良蛋白基因中的过早翻译终止。抗肌萎缩蛋白是一种细胞质蛋白,其为细胞膜的负责调节肌细胞的完整性和功能的肌萎缩蛋白聚糖复合物提供结构稳定性。本文可互换使用的肌营养不良蛋白基因或“DMD基因”是在基因座Xp21处的2.2兆碱基。初级转录测量约2,400kb,成熟mRNA约14kb。79个外显子编码超过3500个氨基酸的蛋白质。在DMD患者中,外显子51经常与框架破坏性缺失相邻,并且已经在基于寡核苷酸的外显子跳跃的临床试验中被靶向。外显子51跳跃化合物eteplirsen的临床试验最近报道了48周内显著的功能益处,即与基线相比有平均47%的肌营养不良蛋白阳性纤维。外显子51中的突变非常适合通过基于NHEJ的基因组编辑进行永久性校正。
转让给Cellectis的美国专利公开号20130145487的方法涉及从人肌营养不良蛋白基因(DMD)切割靶序列的大范围核酸酶变体,所述方法也可以被修改为本发明的核酸靶向系统。
治疗皮肤疾病
本发明还考虑将本文所述的Cpf1 CRISPR系统(例如Cpf1效应蛋白系统)递送至皮肤。
Hickerson等(Molecular Therapy—Nucleic Acids(2013)2,e129)涉及用于向人和小鼠皮肤递送自我递送(sd)-siRNA的电动微针阵列皮肤递送装置。将基于siRNA的皮肤治疗剂转化为临床的主要挑战是开发有效的递送系统。已经在各种皮肤输送技术上投入了大量的努力但成功有限。在用siRNA治疗皮肤的临床研究中,与皮下针注射相关的剧烈疼痛阻止了在试验中招募更多患者,这强调需要改善的更“患者友好”(即,很少或没有疼痛)的递送方式。微针代表了一种递送包括siRNA的大的带电货物穿过主要屏障、角质层的有效的方式,并且通常被认为比传统的皮下注射针更少疼痛。包括Hickerson等人使用的电动微针阵列(MMNA)装置的电动“印章式”微针装置已显示在无毛小鼠研究中是安全的并引起很少或没有疼痛,如由如下所证实(i)在化妆品工业中的广泛使用和(ii)有限测试中几乎所有志愿者发现使用该装置的痛苦比注射(flushot)要小得多所,表明使用该装置进行siRNA递送将导致比在先前临床试验中使用皮下注射针头注射所经历的疼痛少得多的疼痛。MMNA装置(由Bomtech Electronic Co,Seoul,South Korea以Triple-M或Tri-M销售)适应于将siRNA递送至小鼠和人皮肤。将sd-siRNA溶液(至多300μl的0.1mg/ml RNA)引入一次性Tri-M针筒(Bomtech)的腔室中,设定为0.1mm的深度。用于治疗人体皮肤,在处理之前,手动拉伸去识别的皮肤(在外科手术后立即获得)并钉在软木平台上。使用具有28号0.5英寸针头的胰岛素注射器进行所有皮内注射。Hickerson等人的MMNA装置和方法可以被使用和/或调整以递送本发明的CRISPR Cas,例如,以至多300μl的0.1mg/ml CRISPR Cas的剂量至皮肤。
Leachman等(Molecular Therapy,vol.18no.2,442–446Feb.2010)涉及用于治疗罕见皮肤病(pachyony chiacongenita,PC)(包含致残性足底角化病的常染色体显性遗传综合症)的Ib期临床试验,其利用第一种基于短干扰RNA(siRNA)的皮肤治疗剂。该siRNA称为TD101,特异性且有效地靶向角蛋白6a(K6a)N171K突变体mRNA而不影响野生型K6a mRNA。
Zheng等(PNAS,July 24,2012,vol.109,no.30,11975–11980)显示球形核酸纳米颗粒缀合物(SNA-NC)(由高度定向、共价固定的siRNA的致密壳包围的金核)在施用后数小时内自由渗透在体外约100%的角质形成细胞、小鼠皮肤和人表皮中。Zheng等表明,单次应用25nM表皮生长因子受体(EGFR)SNA-NC 60小时证实在人体皮肤中的有效基因敲低。对于固定在SNA-NC中用于给药至皮肤的CRISPR Cas,可以考虑类似的剂量。
癌症
在一些实施方式中,提供了癌症的治疗、预防或诊断。靶标优选为FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC或TRBC基因中的一种或多种。癌症可以是淋巴瘤、慢性淋巴细胞白血病(CLL)、B细胞急性淋巴细胞白血病(B-ALL)、急性淋巴细胞白血病、急性髓性白血病、非霍奇金淋巴瘤(NHL)、弥漫性大细胞淋巴瘤(DLCL)、多发性骨髓瘤、肾细胞癌(RCC)、神经母细胞瘤、结直肠癌、乳腺癌、卵巢癌、黑色素瘤、肉瘤、前列腺癌、肺癌、食道癌、肝细胞癌、胰腺癌、星形细胞瘤、间皮瘤、头颈癌和髓母细胞瘤中的一种或多种。这可以用工程化嵌合抗原受体(CAR)T细胞来实施。这在WO2015161276中描述,其公开内容通过引用并入本文并在下文中描述。
在一些实施例中,适合于治疗或预防癌症的靶基因可以包括在WO2015048577中描述的那些,其公开内容通过引用并入本文。
Usher综合症或视网膜色素变性-39
在一些实施方式中,提供了Usher综合症或色素性视网膜炎39的治疗、预防或诊断。靶标优选为USH2A基因。在一些实施方式中,提供了2299位的G缺失(2299delG)的校正。这在WO2015134812A1中有所描述,其公开内容通过引用并入本文。
自身免疫和炎症性疾病
在一些实施方式中,治疗自身免疫疾病和炎性疾病。这些包括例如多发性硬化症(MS)或类风湿性关节炎(RA)。
囊性纤维化(CF)
在一些实施方式中,提供了囊性纤维化的治疗、预防或诊断。靶标优选为SCNN1A或CFTR基因。这在WO2015157070中描述,其公开内容通过引用并入本文。
Schwank等(Cell Stem Cell,13:653–58,2013)使用Cpf1 CRISPR9来校正与人干细胞中的囊性纤维化相关的缺陷。该团队的靶标是离子通道、囊性纤维化跨膜导体受体(CFTR)的基因。CFTR中的缺失导致在囊性纤维化患者中蛋白质错误折叠。使用来自两名囊性纤维化患儿的细胞样本培养的肠道干细胞,Schwank等能够使用CRISPR以及含有待插入的修复序列的供体质粒来纠正缺陷。研究人员随后将细胞培养成肠道“类器官”或微型肠道,并显示它们正常运作。在这种情况下,大约一半的克隆类器官进行了适当的基因校正。
在一些实施方式中,例如治疗囊性纤维化。因此优选递送至肺。优选校正F508突变(ΔF508,全名CFTRΔF508或F508del-CFTR)。在一些实施方式中,靶标可以是ABCC7、CF或MRP7。
Duchenne的肌肉萎缩症
Duchenne的肌营养不良症(DMD)是一种隐性的、性连锁的肌肉萎缩疾病,其在出生时影响大约1/5000的男性。肌营养不良蛋白基因的突变导致骨骼肌中缺乏通常用于将肌纤维的细胞骨架连接到基底层的肌营养不良蛋白。由这些突变引起的缺乏肌营养不良蛋白导致过量的钙进入体细胞,造成线粒体破裂,破坏细胞。目前的治疗方法侧重于缓解DMD的症状,平均寿命为约26年。
已经在小鼠模型中证实了治疗某些类型的DMD的CRISPR/Cpf1的功效。在一项这样的研究中,在小鼠中通过敲除突变外显子导致功能性蛋白质,从而部分纠正肌营养不良表型(参见Nelson等(2016)Science,Long等(2016)Science,and Tabebordbar等(2016)Science)。
在一些实施方式中,治疗DMD。在一些实施方式中,通过注射递送至肌肉。
糖原贮积病,包括1a
糖原贮积病1a是由葡萄糖-6-磷酸酶缺乏引起的遗传性疾病。该缺乏损害了肝脏从糖原和糖异生产生游离葡萄糖的能力。在一些实施方式中,靶向编码葡萄糖-6-磷酸酶的基因。在一些实施方式中,治疗糖原贮积病1a。在一些实施方式中,通过将Cpf1(蛋白质或mRNA形式)包封在脂质颗粒(例如LNP)中来递送至肝脏。
在一些实施方式中,糖原贮积病(包括图1a)例如通过靶向与症状/疾病/感染相关的多核苷酸被靶向并优选治疗。相关的多核苷酸包括DNA,其可包括基因(其中基因包括任何编码序列和调控元件,例如增强子或启动子)。在一些实施方式中,相关多核苷酸可包括SLC2A2、GLUT2、G6PC、G6PT、G6PT1、GAA、LAMP2、LAMPB、AGL、GDE、GBE1、GYS2、PYGL或PFKM基因。
Hurler综合症
Hurler综合症(又称粘多糖酵母菌I型(MPS I)、Hurler氏病)是由于α-L艾杜糖醛酸酶(负责溶酶体中粘多糖降解的酶)缺乏而导致糖胺聚糖(以前称为粘多糖)积累的遗传病。Hurler综合症经常被归类为溶酶体贮积性疾病,临床上与Hunter综合症有关。Hunter综合症与X连锁,而Hurler综合症为常染色体隐性。根据症状的严重程度,MPS I分为三个亚型。这三种类型都是由于α-L-艾杜糖醛酸酶缺乏或水平不足所致。MPS I H或Hurler综合症是MPS I亚型中最严重的一种。其他两种类型是MPS I S或Scheie综合症和MPS I H-S或Hurler-Scheie综合症。MPS I父母所生的孩子携带有缺陷的IDUA基因,该基因已被定位到4号染色体的4p16.3位点。该基因因其艾杜糖醛酸酶酶蛋白产物而命名为idua。截至2001年,已有52种不同的idua基因突变被证实可导致Hurler综合症。通过逆转录病毒、慢病毒、AAV甚至非病毒载体传递艾杜糖醛酸酶基因成功治疗MPS I的小鼠、狗和猫模型。
在一些实施方式中,靶向α-L-艾杜糖醛酸酶基因并且优选提供修复模板。
HIV和AIDS
在一些实施方式中,提供了HIV和AIDS的治疗、预防或诊断。靶标优选是HIV中的CCR5基因。这在WO2015148670A1中描述,其公开内容通过引用并入本文。
β地中海贫血
在一些实施方式中,提供了β地中海贫血的治疗、预防或诊断。靶标优选为BCL11A基因。这在WO2015148860中描述,其公开内容通过引用并入本文。
镰状细胞病(SCD)
在一些实施方式中,提供了镰状细胞病(SCD)的治疗、预防或诊断。靶标优选为HBB或BCL11A基因。这在WO2015148863中描述,其公开内容通过引用并入本文。
单纯疱疹病毒1和2
疱疹病毒科是由具有75-200个基因的线性双链DNA基因组组成的病毒家族。出于基因编辑的目的,最常研究的家族成员是单纯疱疹病毒-1(HSV-1),这种病毒与其他病毒载体相比具有明显的数量优势(Vannuci等(2003)综述)。因此,在一些实施方式中,病毒载体是HSV病毒载体。在一些实施方式中,HSV病毒载体是HSV-1。
HSV-1具有大约152kb双链DNA的大基因组。该基因组由多于80个基因组成,其中许多基因可以被替换或去除,允许在30-150kb之间的基因插入。衍生自HSV-1的病毒载体通常分成3组:能够复制的减毒载体、不能复制的重组载体和称为扩增子的有缺陷的辅助依赖性载体。先前已经证实使用HSV-1作为载体的基因转移,例如用于治疗神经性疼痛(参见,例如,Wolfe等(2009)Gene Ther)和类风湿性关节炎(参见,例如,Burton等(2001)StemCells)。
因此,在一些实施方式中,病毒载体是HSV病毒载体。在一些实施方式中,HSV病毒载体是HSV-1。在一些实施方式中,载体用于递送一种或多种CRISPR组分。其对于Cpf1和一种或多种指导RNA(例如2种或更多种,3种或更多种,或4种或更多种指导RNA)的递送可能特别有用。在一些实施方式中,载体因此在多重系统中是有用的。在一些实施方式中,该递送用于治疗神经性疼痛或类风湿性关节炎。
在一些实施方式中,提供了HSV-1(单纯疱疹病毒1)的治疗、预防或诊断。靶标优选为HSV-1中的UL19、UL30、UL48或UL50基因。这在WO2015153789中有所描述,其公开内容通过引用并入本文。
在其他实施方式中,提供了HSV-2(单纯疱疹病毒2)的治疗、预防或诊断。靶标优选为HSV-2中的UL19、UL30、UL48或UL50基因。这在WO2015153791中有所描述,其公开内容通过引用并入本文。
在一些实施方式中,提供了原发性开角型青光眼(POAG)的治疗、预防或诊断。靶标优选是MYOC基因。这在WO2015153780中有所描述,其公开内容通过引用并入本文。
过继细胞疗法
本发明还考虑使用本文所述的Cpf1 CRISPR系统(例如Cpf1效应蛋白系统)来修饰用于过继疗法的细胞。因此,本发明的各方面包括对选择的抗原(例如肿瘤相关抗原)特异的免疫系统细胞(例如T细胞)的过继转移(参见Maus等,2014,Adoptive Immunotherapyfor Cancer or Viruses,Annual Review of Immunology,Vol.32:189-225;Rosenbergand Restifo,2015,Adoptive cell transfer as personalized immunotherapy forhuman cancer,Science Vol.348no.6230pp.62-68;和Restifo等,2015,Adoptiveimmunotherapy for cancer:harnessing the T cell response.Nat.Rev.Immunol.12(4):269-281;和Jenson and Riddell,2014,Design and implementation of adoptivetherapy with chimeric antigen receptor-modified T cells.Immunol Rev.257(1):127–144)。例如,通过引入具有选择的肽特异性的新TCRα和β链,可以采用各种策略通过改变T细胞受体(TCR)的特异性来基因修饰T细胞(参见美国专利号8,697,854;PCT专利公开:WO2003020763,WO2004033685,WO2004044004,WO2005114215,WO2006000830,WO2008038002,WO2008039818,WO2004074322,WO2005113595,WO2006125962,WO2013166321,WO2013039889,WO2014018863,WO2014083173;美国专利号8,088,379)。
作为TCR修饰的替代或补充,可以使用嵌合抗原受体(CAR)以产生具有已被描述的多种受体嵌合构建体的免疫应答细胞,例如特异于所选择靶标(例如恶性细胞)的T细胞(参见美国专利号5,843,728;5,851,828;5,912,170;6,004,811;6,284,240;6,392,013;6,410,014;6,753,162;8,211,422;和PCT公开WO9215322)。替代的CAR构建体可以表征为属于连续世代。第一代CAR通常由对抗原特异的抗体的单链可变片段组成,例如包含与特定抗体的VH连接的VL,其通过柔性接头连接(例如通过CD8α铰链结构域和CD8α跨膜结构域)至CD3ζ或FcRγ的跨膜和细胞内信号传导结构域(scFv-CD3ζ或scFv-FcRγ;参见美国专利号7,741,465;美国专利号5,912,172;美国专利号5,906,936)。第二代CAR包含一个或多个共刺激分子的细胞内结构域,例如在胞内结构域内的CD28、OX40(CD134)或4-1BB(CD137)(例如scFv-CD28/OX40/4-1BB-CD3ζ;见美国专利号8,911,993;8,916,381;8,975,071;9,101,584;9,102,760;9,102,761)。第三代CAR包括共刺激性胞内结构域的组合,例如CD3ζ链、CD97、GDI1a-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB或CD28信号传导结构域(例如scFv-CD28-4-1BB-CD3ζ或scFv-CD28-OX40-CD3ζ;参见美国专利号8,906,682;美国专利号8,399,645;美国专利号5,686,281;PCT公开号WO2014134165;PCT公开号WO2012079000)。或者,可以通过在抗原特异性T细胞中表达CAR来协调共刺激,选择所述T细胞以便在其天然αβTCR与例如专职抗原呈递细胞上的抗原结合后激活和扩增,伴随着共刺激。另外,可以在免疫应答细胞上提供另外的工程化受体,例如以改善T细胞攻击的靶向和/或使副作用最小化。
替代技术可用于转化靶向免疫应答细胞,例如原生质体融合、脂质转染、转染或电穿孔。可以使用多种载体,例如逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、质粒或转座子,例如睡美人转座子(参见美国专利号6,489,458;7,148,203;7,160,682;7,985,739;8,227,432)可以被使用以引入CAR,例如使用通过CD3ζ和CD28或CD137的第二代抗原特异性CAR信号传导。病毒载体可以例如包括基于HIV、SV40、EBV、HSV或BPV的载体。
靶向用于转化的细胞可以例如包括T细胞、自然杀伤(NK)细胞、细胞毒性T淋巴细胞(CTL)、调节性T细胞、人胚胎干细胞,肿瘤浸润淋巴细胞(TIL)或从其淋巴细胞可以分化的多能干细胞。表达期望CAR的T细胞可以例如通过与共表达癌抗原和共刺激分子的γ-照射的活化和增殖细胞(AaPC)共培养来选择。工程化的CART细胞可以扩增,例如通过在可溶性因子例如IL-2和IL-21存在下在AaPC上共培养。例如,可以进行该扩增以提供记忆CAR+T细胞(其可以例如通过非酶促数字阵列和/或多组流式细胞术测定)。以这种方式,可以提供对携带抗原的肿瘤具有特异性细胞毒活性的CAR T细胞(任选地与期望的趋化因子例如干扰素-γ的产生一起)。这种CAR T细胞可以例如用于动物模型,例如用于威胁肿瘤异种移植物。
可以调整例如前述的方法以提供治疗方法和/或增加患有疾病(例如瘤形成)的受试者的存活,例如通过施用有效量的包含与所选择抗原结合的抗原识别受体的免疫应答细胞,其中结合激活免疫反应细胞,从而治疗或预防疾病(例如瘤形成,病原体感染,自身免疫疾病或同种异体移植反应)。在CAR T细胞疗法中的剂量可以例如包括施用106至109个细胞/kg,可具有或没有淋巴细胞消除过程,例如使用环磷酰胺。
在一个实施方式中,可以将治疗施用于经历免疫抑制治疗的患者。由于编码这种免疫抑制剂的受体的基因的失活,细胞或细胞群可以对至少一种免疫抑制剂产生抗性。不受理论束缚,免疫抑制治疗应有助于在患者体内选择和扩增根据本发明的免疫应答或T细胞。
根据本发明的细胞或细胞群的施用可以以任何方便的方式进行,包括通过气溶胶吸入、注射、摄取、输血、植入或移植。细胞或细胞群可以经皮下、皮内、肿瘤内、结内、髓内、肌内、静脉内或淋巴内注射或腹膜内施用给患者。在一个实施方式中,本发明的细胞组合物优选通过静脉内注射施用。
细胞或细胞群的施用可以包括施用104-109个细胞/kg体重,优选105-106个细胞/kg体重,包括在这些范围内的所有细胞数的整数值。在CART细胞疗法中的剂量可以例如包括施用106至109个细胞/kg,可具有或没有淋巴细胞消除过程,例如使用环磷酰胺。细胞或细胞群可以以一剂量或多剂量施用。在另一个实施方式中,有效量的细胞以单剂量施用。在另一个实施方式中,有效量的细胞在一段时间内以多于一剂量施用。给药时间在管理医师的判断范围内,并取决于患者的临床状况。细胞或细胞群可以从任何来源获得,例如血库或供体。虽然个体需求变化,但针对特定疾病或病症确定给定细胞类型的有效量的最佳范围在本领域技术人员的技能范围内。有效量是指提供治疗或预防益处的量。施用的剂量取决于接受者的年龄、健康和体重,同时治疗的种类(如果有的话),治疗频率和期望效果的性质。
在另一个实施方式中,肠胃外施用有效量的细胞或包含那些细胞的组合物。施用可以是静脉内施用。可以通过在肿瘤内注射直接施用。
为了防止可能的不良反应,工程化免疫应答细胞可以配备转基因形式的转基因安全开关,其使细胞易于暴露于特定信号。例如,单纯疱疹病毒胸苷激酶(TK)基因可以这种方式使用,例如通过引入用作干细胞移植后供体淋巴细胞输注的同种异体T淋巴细胞(Greco,等,Improving the safety of cell therapy with the TK-suicidegene.Front.Pharmacol.2015;6:95)。在这样的细胞中,施用核苷类前药例如更昔洛韦或阿昔洛韦导致细胞死亡。替代的安全性开关构建体包括例如通过施用使两个非功能性icasp9分子在一起以形成活性酶的小分子二聚化剂触发的诱导型caspase 9。已经描述了用于实施细胞增殖控制的多种替代方法(参见美国专利公开号20130071414;PCT专利公开WO2011146862;PCT专利公开WO2014011987;PCT专利公开WO2013040371;Zhou等BLOOD,2014,123/25:3895–3905;Di Stasi等,The New England Journal of Medicine 2011;365:1673-1683;Sadelain M,The New England Journal of Medicine 2011;365:1735-173;Ramos等,Stem Cells 28(6):1107-15(2010))。
在过继疗法的进一步改进中,使用如本文所述的Cpf1 CRISPR系统的基因组编辑可用于使免疫应答细胞适应于替代实施方式,例如提供编辑的CAR T细胞(参见Poirot等,2015,Multiplex genome edited T-cell manufacturing platform for"off-the-shelf"adoptive T-cell immunotherapies,Cancer Res 75(18):3853)。例如,可以编辑免疫应答细胞以删除一些或所有类型的HLA II型和/或I型分子的表达,或敲除可能抑制期望的免疫应答的选择的基因,例如PD1基因。
可以使用如本文所述的任何CRISPR系统及其使用方法来编辑细胞。可以通过本文所述的任何方法将CRISPR系统递送至免疫细胞。在优选的实施方式中,离体编辑细胞并转移至有需要的受试者。可以编辑免疫应答细胞、CART细胞或用于过继细胞转移的任何细胞。可以进行编辑以消除潜在的同种异体反应性T细胞受体(TCR),破坏化学治疗剂的靶标,阻断免疫检查点,激活T细胞和/或增加功能衰竭或功能失调的CD8+T细胞的分化和/或增殖(参见PCT专利公开:WO2013176915,WO2014059173,WO2014172606,WO2014184744和WO2014191128)。编辑可导致基因失活。
通过使基因失活,意图使感兴趣的基因不以功能性蛋白质形式表达。在一种特别是实施方式中,CRISPR系统特异性催化一种靶向的基因的切割,从而使所述靶向的基因失活。所引起的核酸链断裂通常通过同源重组或非同源末端连接(NHEJ)的不同机制修复。然而,NHEJ是一种不完美的修复过程,通常导致切割位点的DNA序列发生变化。通过非同源末端连接(NHEJ)修复通常导致小的插入或缺失(Indel)并且可以用于产生特定的基因敲除。已经发生切割诱导的诱变事件的细胞可以通过本领域熟知的方法鉴定和/或选择。
T细胞受体(TCR)是响应于抗原呈递参与T细胞活化的细胞表面受体。TCR通常由两条链α和β组成,它们组装形成异二聚体并与CD3转导亚基结合形成细胞表面上存在的T细胞受体复合物。TCR的每条α和β链由免疫球蛋白样N-末端可变区(V)和恒定区(C)、疏水性跨膜结构域和短细胞质区域组成。至于免疫球蛋白分子,α和β链的可变区是通过V(D)J重组产生的,在T细胞群中产生大量多样的抗原特异性。然而,与识别完整抗原的免疫球蛋白相反,T细胞被加工的肽片段与MHC分子(引入T细胞识别抗原的额外维度,称为MHC限制)结合激活。通过T细胞受体识别供体和受体之间的MHC差异导致T细胞增殖和移植物抗宿主病(GVHD)的潜在发展。TCRα或TCRβ的失活可导致从T细胞表面消除TCR,从而防止识别同种异体抗原以及由此引起的GVHD。然而,TCR破坏通常导致CD3信号传导组分的消除并改变进一步T细胞扩增的手段。
同种异体细胞被宿主免疫系统迅速排斥。已经证实,存在于未照射的血液制品中的同种异体白细胞将持续不超过5至6天(Boni,Muranski等2008Blood 1;112(12):4746-54)。因此,为了防止同种异体细胞的排斥,通常必须在一定程度上抑制宿主的免疫系统。然而,在过继细胞转移的情况下,免疫抑制药物的使用也对引入的治疗性T细胞具有不利影响。因此,为了在这些条件下有效地使用过继免疫疗法,引入的细胞需要对免疫抑制治疗具有抗性。因此,在一种特定的实施方式中,本发明还包括修饰T细胞以使其对免疫抑制剂具有抗性的步骤,优选通过失活至少一种编码免疫抑制剂的靶标的基因。免疫抑制剂是通过多种作用机制之一抑制免疫功能的药剂。免疫抑制剂可以是但不限于钙调神经磷酸酶抑制剂、雷帕霉素的靶标、白细胞介素-2受体α链阻断剂、肌苷一磷酸脱氢酶抑制剂、二氢叶酸还原酶抑制剂、皮质类固醇或免疫抑制抗代谢物。本发明允许通过失活T细胞中免疫抑制剂的靶标而赋予T细胞免疫抑制抗性以进行免疫治疗。作为非限制性实例,免疫抑制剂的靶标可以是免疫抑制剂的受体,例如:CD52、糖皮质激素受体(GR)、FKBP家族基因成员和亲环蛋白家族基因成员。
免疫检查点是抑制途径,其减缓或阻止免疫反应并防止免疫细胞的不受控制的活性造成的过度组织损伤。在某些实施方式中,靶向的免疫检查点是程序性死亡-1(PD-1或CD279)基因(PDCD1)。在其他实施方式中,靶向的免疫检查点是细胞毒性T淋巴细胞相关抗原(CTLA-4)。在另外的实施方式中,靶向的免疫检查点是CD28和CTLA4Ig超家族的另一成员,例如BTLA、LAG3、ICOS、PDL1或KIR。在进一步另外的实施方式中,靶向的免疫检查点是TNFR超家族的成员,例如CD40、OX40、CD137、GITR、CD27或TIM-3。
其他免疫检查点包括含Src同源性2结构域的蛋白酪氨酸磷酸酶1(SHP-1)(WatsonHA,等,SHP-1:the next checkpoint target for cancer immunotherapy?Biochem SocTrans.2016Apr15;44(2):356-62)。SHP-1是广泛表达的抑制蛋白酪氨酸磷酸酶(PTP)。在T细胞中,它是抗原依赖性激活和增殖的负调节子。它是一种胞质蛋白,因此不适用于抗体介导的治疗,但其在激活和增殖中的作用使其成为过继转移策略中基因操作的有吸引力的靶标,例如嵌合抗原受体(CAR)T细胞。免疫检查点还可包括具有Ig和ITIM结构域的T细胞免疫受体(TIGIT/Vstm3/WUCAM/VSIG9)和VISTA(Le Mercier I,等,(2015)Beyond CTLA-4andPD-1,the generation Z of negative checkpoint regulators.Front.Immunol.6:418)。
WO2014172606涉及MT1和/或MT1抑制剂用于增加耗尽的CD8+T细胞的增殖和/或活性以及降低CD8+T细胞耗竭(例如,减少功能耗尽或无应答的CD8+免疫细胞)的用途。在某些实施方式中,金属硫蛋白通过在过继转移的T细胞中的基因编辑来靶向。
在某些实施方式中,基因编辑的靶标可以是参与免疫检查点蛋白质表达的至少一个靶基因座。这样的靶标可包括但不限于CTLA4,PPP2CA,PPP2CB,PTPN6,PTPN22,PDCD1,ICOS(CD278),PDL1,KIR,LAG3,HAVCR2,BTLA,CD160,TIGIT,CD96,CRTAM,LAIR1,SIGLEC7,SIGLEC9,CD244(2B4),TNFRSF10B,TNFRSF10A,CASP8,CASP10,CASP3,CASP6,CASP7,FADD,FAS,TGFBRII,TGFRBRI,SMAD2,SMAD3,SMAD4,SMAD10,SKI,SKIL,TGIF1,IL10RA,IL10RB,HMOX2,IL6R,IL6ST,EIF2AK4,CSK,PAG1,SIT1,FOXP3,PRDM1,BATF,VISTA,GUCY1A2,GUCY1A3,GUCY1B2,GUCY1B3,MT1,MT2,CD40,OX40,CD137,GITR,CD27,SHP-1或TIM-3。在优选的实施方式中,靶向参与PD-1或CTLA-4基因表达的基因座。在其他优选的实施方式中,靶向基因的组合,例如但不限于PD-1和TIGIT。
在其他实施方式中,编辑至少两个基因。成对基因可包括但不限于PD1和TCRα,PD1和TCRβ,CTLA-4和TCRα,CTLA-4和TCRβ,LAG3和TCRα,LAG3和TCRβ,Tim3和TCRα,Tim3和TCRβ,BTLA和TCRα。,BTLA和TCRβ,BY55和TCRα,BY55和TCRβ,TIGIT和TCRα,TIGIT和TCRβ,B7H5和TCRα,B7H5和TCRβ,LAIR1和TCRα,LAIR1和TCRβ,SIGLEC10和TCRα,SIGLEC10和TCRβ,2B4和TCRα,2B4和TCRβ。
无论是在T细胞的基因修饰之前还是之后,T细胞通常可以使用例如美国专利6,352,694 6534055;6905680;5858358;6887466;6905681;7144575;7232566;7175843;5883223;6905874;6797514;6867041;和7,572,631中所述的方法进行活化和扩增。T细胞可以在体外或体内扩增。
除非另有说明,本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,这些技术在本领域的技术范围内。参见MOLECULAR CLONING:A LABORATORY MANUAL,2nd edition(1989)(Sambrook,Fritsch andManiatis);MOLECULAR CLONING:A LABORATORY MANUAL,4th edition(2012)(Green andSambrook);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(1987)(F.M.Ausubel,等eds.);the series METHODS IN ENZYMOLOGY(Academic Press,Inc.);PCR 2:A PRACTICALAPPROACH(1995)(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.);ANTIBODIES,ALABORATORY MANUAL(1988)(Harlow and Lane,eds.);ANTIBODIES A LABORATORY MANUAL,2nd edition(2013)(E.A.Greenfield ed.);和ANIMAL CELL CULTURE(1987)(R.I.Freshney,ed.)。
除非另有说明,本发明的实践采用用于产生基因修饰小鼠的常规技术。参见Marten H.Hofker and Jan van Deursen,TRANSGENIC MOUSE METHODS AND PROTOCOLS,2nd edition(2011)。
在一些实施方式中,本文描述的发明包括用于过继免疫疗法的方法,其中T细胞通过CRISPR离体编辑以调节至少一个基因,并随后施用于有需要的患者。在一些实施方式中,CRISPR编辑包括敲除或敲低在编辑的T细胞中至少一个靶基因的表达。在一些实施方式中,除了调节靶基因外,还通过CRISPR离体编辑T细胞以(1)敲入编码嵌合抗原受体(CAR)或T细胞受体(TCR)的外源基因,(2)敲除或敲低免疫检查点受体的表达,(3)敲除或敲低内源性TCR的表达,(4)人白细胞抗原I类(HLA-1)蛋白的敲除或敲低表达,和/或(5)敲除或敲低编码由外源CAR或TCR靶向的抗原的内源基因的表达。
在一些实施方式中,T细胞与编码CRISPR效应蛋白的腺相关病毒(AAV)载体以及包含可与靶序列杂交的指导序列、tracr配对序列和可与tracr配对序列杂交的tracr序列的指导分子离体接触。在一些实施方式中,T细胞与包含与指导分子复合的CRISPR效应蛋白的核糖核蛋白(RNP)离体接触(例如,通过电穿孔),其中所述指导分子包含可与靶序列杂交的指导序列、tracr配对序列和可与tracr配对序列杂交的tracr序列。参见Rupp等,Scientific Reports 7:737(2017);Liu等,Cell Research 27:154-157(2017)。在一些实施方式中,T细胞与编码CRISPR效应蛋白的mRNA以及包含可与靶序列杂交的指导序列、tracr配对序列和可与tracr配对序列杂交的tracr序列的指导分子离体接触(例如,通过电穿孔)。见Eyquem等,Nature 543:113-117(2017)。在一些实施方式中,T细胞不与慢病毒或逆转录病毒载体离体接触。
在一些实施方式中,方法包括通过CRISPR离体编辑T细胞以敲入编码CAR的外源基因,从而允许编辑的T细胞基于位于细胞表面上的特定蛋白质的表达识别癌细胞。在一些实施方式中,通过CRISPR离体编辑T细胞以敲入编码TCR的外源基因,从而允许编辑的T细胞识别源自癌细胞表面或内部的蛋白质。在一些实施方式中,方法包括提供外源CAR编码或TCR编码序列作为供体序列,所述供体序列可以通过同源定向修复(HDR)整合到由CRISPR指导序列靶向的基因组基因座中。在一些实施方式中,将外源CAR或TCR靶向内源性TCRα恒定(TRAC)基因座可以减少强直CAR信号传导并促进CAR在单次或重复暴露于抗原后的有效内化和重新表达,从而延迟效应T细胞的分化和耗竭。见Eyquem等,Nature 543:113-117(2017)。
在一些实施方式中,方法包括通过CRISPR离体编辑T细胞以阻断一个或多个免疫检查点受体以减少癌细胞的免疫抑制。在一些实施方式中,通过CRISPR离体编辑T细胞以敲除或敲低参与程序性死亡-1(PD-1)信号传导途径的内源基因,例如PD-1和PD-L1。在一些实施方式中,通过CRISPR离体编辑T细胞以突变Pdcd1基因座或CD274基因座。在一些实施方式中,使用靶向PD-1的第一外显子的一种或多种指导序列通过CRISPR离体编辑T细胞。参见Rupp等,Scientific Reports 7:737(2017);Liu等,Cell Research 27:154-157(2017)。
在一些实施方式中,方法包括通过CRISPR离体编辑T细胞以消除潜在的同种异体反应性TCR以允许同种异体过继转移。在一些实施方式中,通过CRISPR离体编辑T细胞以敲除或敲低编码TCR(例如,αβTCR)的内源基因以避免移植物抗宿主病(GVHD)。在一些实施方式中,通过CRISPR离体编辑T细胞以突变TRAC基因座。在一些实施方式中,使用靶向TRAC的第一外显子的一种或多种指导序列通过CRISPR离体编辑T细胞。参见Liu等,CellResearch27:154-157(2017)。在一些实施方式中,方法包括使用CRISPR将编码CAR或TCR的外源基因敲入TRAC基因座,同时敲除内源性TCR(例如,在CAR cDNA之后的编码自切割P2A肽的供体序列)。参见Eyquem等,Nature 543:113-117(2017)。在一些实施方式中,外源基因包含无启动子的CAR编码或TCR编码序列,其可操作地插入内源性TCR启动子的下游。
在一些实施方式中,方法包括通过CRISPR离体编辑T细胞以敲除或敲低编码HLA-1蛋白的内源基因以使编辑的T细胞的免疫原性最小化。在一些实施方式中,通过CRISPR离体编辑T细胞以突变β-2微球蛋白(B2M)基因座。在一些实施方式中,使用靶向B2M的第一外显子的一种或多种指导序列通过CRISPR离体编辑T细胞。参见Liu等,Cell Research 27:154-157(2017)。在一些实施方式中,方法包括使用CRISPR将编码CAR或TCR的外源基因敲入B2M基因座,同时敲除内源性B2M(例如,在CAR cDNA之后的编码自切割P2A肽的供体序列)参见Eyquem等,Nature 543:113-117(2017)。在一些实施方式中,外源基因包含无启动子的CAR编码或TCR编码序列,其可操作地插入内源性B2M启动子的下游。
在一些实施方式中,方法包括通过CRISPR离体编辑T细胞以敲除或敲低编码外源CAR或TCR靶向的抗原的内源基因。在一些实施方式中,通过CRISPR离体编辑T细胞以敲除或敲低选自人端粒酶逆转录酶(hTERT)、存活蛋白、小鼠双分钟2同源物(MDM2)、细胞色素P4501B 1(CYP1B)、HER2/neu、Wilms’肿瘤基因1(WT1)、livin、甲胎蛋白(AFP)、癌胚抗原(CEA)、粘蛋白16(MUC16)、MUC1、前列腺特异性膜抗原(PSMA)、p53或细胞周期蛋白(DI)的肿瘤抗原的表达(参见WO2016/011210)。在一些实施方式中,通过CRISPR离体编辑T细胞以敲除或敲低选自B细胞成熟抗原(BCMA)、跨膜激活剂和CAML整合子(TACI)或B细胞激活因子受体(BAFF-R)、CD38、CD138、CS-1、CD33、CD26、CD30、CD53、CD92、CD100、CD148、CD150、CD200、CD261、CD262或CD362的抗原的表达(参见WO2017/011804)。
基因驱动
本发明还考虑使用本文所述的Cpf1 CRISPR系统(例如Cpf1效应蛋白系统)以提供RNA指导的基因驱动,例如在类似于PCT专利公开WO2015/105928中描述的基因驱动的系统中。这种系统可以例如提供通过向种系细胞中引入编码RNA指导的DNA核酸酶和一种或多种指导RNA的核酸序列来提供改变真核生殖细胞的方法。指导RNA可以被设计成与种系细胞的基因组DNA上的一个或多个靶位置互补。编码RNA指导的DNA核酸酶的核酸序列和编码指导RNA的核酸序列可以在侧翼序列之间的构建体上提供,其中启动子排列使得种系细胞可以表达RNA指导的DNA核酸酶和指导RNA,以及任何也位于侧翼序列之间的期望的货物编码序列。侧翼序列通常包含与所选靶染色体上的相应序列相同的序列,使得侧翼序列与构建体编码的组分一起工作以通过同源重组等机制促进外源核酸构建体序列在靶切割位点插入基因组DNA,使种系细胞对外源核酸序列纯合。通过这种方式,基因驱动系统能够在整个繁殖群体中渗入期望的货物基因(Gantz等,2015,Highly efficient Cpf1-mediated genedrive for population modification of the malaria vector mosquito Anophelesstephensi,PNAS 2015,published ahead of print November 23,2015,doi:10.1073/pnas.1521077112;Esvelt等,2014,Concerning RNA-guided gene drives for thealteration of wild populations eLife2014;3:e03401)。在选择的实施方式中,可以选择在基因组中具有很少潜在脱靶位点的靶序列。使用多种指导RNA靶向靶基因座内的多个位点可能会增加切割频率并阻碍驱动抗性等位基因的进化。截短的指导RNA可以减少脱靶切割。可以使用配对的切口酶代替单个核酸酶,以进一步提高特异性。基因驱动构建体可包括编码转录调节因子的货物序列,例如以激活同源重组基因和/或抑制非同源末端连接。可以在必需基因内选择靶位点,使得非同源末端连接事件可以导致致死性而不是产生驱动抗性等位基因。基因驱动构建体可以工程化以在一系列温度范围内的多种宿主中发挥作用(Cho等2013,Rapid and Tunable Control of Protein Stability in Caenorhabditiselegans Using a Small Molecule,PLoS ONE 8(8):e72393.doi:10.1371/journal.pone.0072393)。
异种移植
本发明还考虑使用本文所述的Cpf1 CRISPR系统(例如Cpf1效应蛋白系统)以提供适应于提供用于移植的修饰组织的RNA指导的DNA核酸酶。例如,RNA指导的DNA核酸酶可用于敲除,敲低或破坏动物中的选择基因,例如转基因猪(例如人血红素加氧酶-1转基因猪系),例如通过破坏编码人免疫系统识别的表位(即异种抗原基因)的基因的表达。用于破坏的候选猪基因可以例如包括α(1,3)-半乳糖基转移酶和胞苷一磷酸-N-乙酰神经氨酸羟化酶基因(参见PCT专利公开WO2014/066505)。此外,编码内源性逆转录病毒的基因可能被破坏,例如编码所有猪内源性逆转录病毒的基因(参见Yang等,2015,Genome-wideinactivation of porcine endogenous retroviruses(PERVs),Science 27November2015:Vol.350no.6264pp.1101-1104)。此外,RNA指导的DNA核酸酶可用于靶向异源移植供体动物中的其他基因整合的位点,例如人CD55基因,以改善针对超急性排斥的保护。
一般基因治疗注意事项
疾病相关基因和多核苷酸以及疾病特异性信息的实例可从McKusick-NathansInstitute of Genetic Medicine,Johns Hopkins University(Baltimore,Md.)andNational Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.)获得,可在万维网上找到。
这些基因和途径中的突变可导致产生不适当量的不适当蛋白质或蛋白质,从而影响功能。2012年12月12日提交的美国临时申请61/736,527中的基因、疾病和蛋白质的其他实例在本文中通过引用并入本文。这些基因、蛋白质和途径可以是本发明的CRISPR复合物的靶多核苷酸。表A和B中列出了疾病相关基因和多核苷酸的实例。表C中列出了信号传导生化途径相关基因和多核苷酸的实例。
表A
表B
表C
本发明的实施方式还包括与敲除基因、扩增基因和修复与DNA重复不稳定性和神经障碍相关的特定突变相关的方法和组合物(Robert D.Wells,Tetsuo Ashizawa,GeneticInstabilities and Neurological Diseases,Second Edition,Academic Press,Oct 13,2011–Medical)。已经发现串联重复序列的特定方面导致20多种人类疾病(New insightsinto repeat instability:role of RNA·DNA hybrids.McIvor EI,Polak U,NapieralaM.RNA Biol.2010Sep-Oct;7(5):551-8)。可以利用本发明的效应蛋白系统来校正这些基因组不稳定性的缺陷。
本发明的另外多个方面包括校正与多种基因疾病相关的缺陷,这些基因疾病在国立卫生研究院的网站上以基因疾病为主题进一步描述(网站:health.nih.gov/topic/GeneticDisorders)。基因性脑疾病可包括但不限于肾上腺脑白质营养不良、胼质体发育、Aicardi综合症、Alpers病、阿尔茨海默病、Barth综合征、Batten病、CADASIL、小脑变性、法布里病、Gerstmann-Straussler-Scheinker病、亨廷顿氏病和其他三重复疾病、Leigh病、Lesch-Nyhan综合征、Menkes病,线粒体肌病和NINDS Colpocephaly。这些疾病更进一步在国立卫生研究院网站上的基因性脑病症的小节下有所描述。
关于CRISPR系统使用方法的一般性评论
在特定的实施方式中,本文描述的方法可包括靶向一种或多种感兴趣的多核苷酸靶标。感兴趣的多核苷酸靶标可以是与特定疾病或其治疗相关的、与感兴趣的给定特性的产生相关的、或与感兴趣的分子的产生相关的靶标。当提到“多核苷酸靶标”的靶向时,这可以包括靶向编码区、内含子、启动子和任何其他5’或3’调节区中的一个或多个,例如终止区、核糖体结合位点、增强子、沉默子等。基因可以编码任何感兴趣的蛋白质或RNA。因此,靶标可以是可以转录成mRNA、tRNA或rRNA的编码区,也可以是参与其复制、转录和调节的蛋白质的识别位点。
在特定的实施方式中,本文描述的方法可以包括靶向感兴趣的一个或多个基因,其中至少一个感兴趣的基因编码长的非编码RNA(lncRNA)。虽然已发现lncRNA对细胞功能至关重要。由于已发现必需的lncRNA对于每种细胞类型不同(C.P.Fulco等,2016,Science,doi:10.1126/science.aag2445;N.E.Sanjana等,2016,Science,doi:10.1126/science.aaf8325),本文提供的方法可以包括确定与感兴趣细胞的细胞功能相关的lncRNA的步骤。
在通过整合外源多核苷酸模板修饰靶多核苷酸的示例性方法中,通过CRISPR复合物将双链断裂引入基因组序列中,通过同源重组外源多核苷酸模板修复断裂,使得模板整合到基因组中。双链断裂的存在促进了模板的整合。
在其他的实施方式中,本发明提供了修饰真核细胞中多核苷酸表达的方法。该方法包括通过使用结合多核苷酸的CRISPR复合物来增加或减少靶多核苷酸的表达。
在一些方法中,可以使靶多核苷酸失活以实现细胞中表达的修饰。例如,当CRISPR复合物与细胞中的靶序列结合时,靶多核苷酸被失活,使得序列不被转录,编码的蛋白质不产生,或者序列不起野生型序列的作用。例如,可以使蛋白质或microRNA编码序列失活,从而不产生蛋白质。
在一些方法中,可以使控制序列失活,使得其不再起控制序列的作用。如本文所用,“控制序列”是指影响核酸序列的转录、翻译或可接近性的任何核酸序列。控制序列的实例包括启动子、转录终止子和增强子是控制序列。失活的靶序列可包括缺失突变(即一个或多个核苷酸的缺失)、插入突变(即一个或多个核苷酸的插入)或无义突变(即将单个核苷酸置换为另一个核苷酸,使得引入终止密码子)。在一些方法中,靶序列的失活导致靶序列的“敲除”。
本文还提供了功能基因组学的方法,其涉及通过引入多种组合扰动来鉴定细胞相互作用并将观察到的基因组、基因、蛋白质组学,表观遗传和/或表型效应与单细胞中检测到的扰动相关联,也称为“扰动-seq”。在一个实施方式中,这些方法结合单细胞RNA测序(RNA-seq)和基于规律成簇的间隔短回文重复(CRISPR)的扰动(Dixit等2016,Cell 167,1853–1866;Adamson等2016,Cell 167,1867–1882)。通常,这些方法涉及向细胞群中的多个细胞引入许多组合扰动,其中相对于未接受任何扰动并在单个细胞中检测扰动的一个或多个细胞,多个细胞中的每个细胞接受至少1次扰动,检测单个细胞中的基因组、基因、蛋白质组、表观遗传和/或表型差异;并且通过应用考虑共变量以测量差异的模型来确定与扰动相关的测量差异,从而推断出细胞间和/或细胞内网络或电路。更特别是,单细胞测序包括记录每个RNA的来源细胞的细胞条形码。更特别是,单细胞测序包括独特分子标识符(UMI),由此确定单个细胞中测量信号的捕获率,例如转录物拷贝数或探针结合事件。
这些方法可用于细胞回路的组合探测、用于解剖细胞回路、用于描绘分子通路和/或用于识别用于治疗剂开发的相关靶标。更特别是,这些方法可用于基于其分子谱来鉴定细胞群。有机(例如疾病)和诱导(例如通过小分子)状态之间的基因表达谱的相似性可以识别临床有效的疗法。
因此,在特定的实施方式中,本文提供的治疗方法包括,使用如上所述扰动-SEQ确定用于从受试者中分离的细胞群的最佳的治疗性靶标和/或治疗剂。
在特定的实施方式中,以本文其它地方提到pertub-SEQ方法作为用于确定,在一个分离的细胞或细胞系,细胞电路这可能影响生产的感兴趣的分子的。
另外的CRISPR-Cas9开发和使用考虑
基于CRISPR-Cas9开发和使用的方面,本发明可以进一步说明和扩展,如以下文章中所述,特别是涉及在细胞核生物中CRISPR蛋白复合物的递送和RNA指导的内切核酸酶的用途:
Multiplex genome engineering using CRISPR/Cas systems.Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,&Zhang,F.Science Feb 15;339(6121):819-23(2013);
RNA-guided editing of bacterial genomes using CRISPR-Cassystems.Jiang W.,Bikard D.,Cox D.,Zhang F,Marraffini LA.Nat Biotechnol Mar;31(3):233-9(2013);
One-Step Generation of Mice Carrying Mutations in Multiple Genes byCRISPR/Cas-Mediated Genome Engineering.Wang H.,Yang H.,Shivalila CS.,DawlatyMM.,Cheng AW.,Zhang F.,Jaenisch R.Cell May 9;153(4):910-8(2013);
Optical control of mammalian endogenous transcription and epigeneticstates.Konermann S,Brigham MD,Trevino AE,Hsu PD,Heidenreich M,Cong L,PlattRJ,Scott DA,Church GM,Zhang F.Nature.Aug 22;500(7463):472-6.doi:10.1038/Nature12466.Epub 2013Aug 23(2013);
Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome EditingSpecificity.Ran,FA.,Hsu,PD.,Lin,CY.,Gootenberg,JS.,Konermann,S.,Trevino,AE.,Scott,DA.,Inoue,A.,Matoba,S.,Zhang,Y.,&Zhang,F.Cell Aug 28.pii:S0092-8674(13)01015-5(2013-A);
DNA targeting specificity of RNA-guided Cas9 nucleases.Hsu,P.,Scott,D.,Weinstein,J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalem,O.,Cradick,TJ.,Marraffini,LA.,Bao,G.,&Zhang,F.Nat Biotechnol doi:10.1038/nbt.2647(2013);
Genome engineering using the CRISPR-Cas9 system.Ran,FA.,Hsu,PD.,Wright,J.,Agarwala,V.,Scott,DA.,Zhang,F.Nature Protocols Nov;8(11):2281-308(2013-B);
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells.Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science Dec 12.(2013).[Epub ahead of print];
Crystal structure of cas9 in complex with guide RNA and targetDNA.Nishimasu,H.,Ran,FA.,Hsu,PD.,Konermann,S.,Shehata,SI.,Dohmae,N.,Ishitani,R.,Zhang,F.,Nureki,O.Cell Feb 27,156(5):935-49(2014);
Genome-wide binding of the CRISPR endonuclease Cas9 in mammaliancells.Wu X.,Scott DA.,Kriz AJ.,Chiu AC.,Hsu PD.,Dadon DB.,Cheng AW.,TrevinoAE.,Konermann S.,Chen S.,Jaenisch R.,Zhang F.,Sharp PA.Nat Biotechnol.Apr20.doi:10.1038/nbt.2889(2014);
CRISPR-Cas9 Knockin Mice for Genome Editing and CancerModeling.Platt RJ,Chen S,Zhou Y,Yim MJ,Swiech L,Kempton HR,Dahlman JE,ParnasO,Eisenhaure TM,Jovanovic M,Graham DB,Jhunjhunwala S,Heidenreich M,Xavier RJ,Langer R,Anderson DG,Hacohen N,Regev A,Feng G,Sharp PA,Zhang F.Cell 159(2):440-455 DOI:10.1016/j.cell.2014.09.014(2014);
Development and Applications of CRISPR-Cas9 for Genome Engineering,Hsu PD,Lander ES,Zhang F.,Cell.Jun 5;157(6):1262-78(2014).
Genetic screens in human cells using the CRISPR/Cas9 system,Wang T,Wei JJ,Sabatini DM,Lander ES.,Science.January 3;343(6166):80–84.doi:10.1126/science.1246981(2014);
Rational design of highly active sgRNAs for CRISPR-Cas9-mediatedgene inactivation,Doench JG,Hartenian E,Graham DB,Tothova Z,Hegde M,Smith I,Sullender M,Ebert BL,Xavier RJ,Root DE.,(published online 3 September 2014)Nat Biotechnol.Dec;32(12):1262-7(2014);
In vivo interrogation of gene function in the mammalian brain usingCRISPR-Cas9,Swiech L,Heidenreich M,Banerjee A,Habib N,Li Y,Trombetta J,Sur M,Zhang F.,(published online 19 October 2014)Nat Biotechnol.Jan;33(1):102-6(2015);
Genome-scale transcriptional activation by an engineered CRISPR-Cas9complex,Konermann S,Brigham MD,Trevino AE,Joung J,Abudayyeh OO,Barcena C,Hsu PD,Habib N,Gootenberg JS,Nishimasu H,Nureki O,Zhang F.,Nature.Jan 29;517(7536):583-8(2015).
A split-Cas9architecture for inducible genome editing andtranscription modulation,Zetsche B,Volz SE,Zhang F.,(published online02February 2015)Nat Biotechnol.Feb;33(2):139-42(2015);
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth andMetastasis,Chen S,Sanjana NE,Zheng K,Shalem O,Lee K,Shi X,Scott DA,Song J,PanJQ,Weissleder R,Lee H,Zhang F,Sharp PA.Cell 160,1246–1260,March 12,2015(multiplex screen in mouse),and
In vivo genome editing using Staphylococcus aureus Cas9,Ran FA,CongL,Yan WX,Scott DA,Gootenberg JS,Kriz AJ,Zetsche B,Shalem O,Wu X,Makarova KS,Koonin EV,Sharp PA,Zhang F.,(published online 01April 2015),Nature.Apr 9;520(7546):186-91(2015).
Shalem等,“High-throughput functional genomics using CRISPR-Cas9,”Nature Reviews Genetics 16,299-311(May 2015).
Xu等,“Sequence determinants of improved CRISPR sgRNA design,”GenomeResearch 25,1147-1157(August 2015).
Parnas等,“A Genome-wide CRISPR Screen in Primary Immune Cells toDissect Regulatory Networks,”Cell 162,675-686(July 30,2015).
Ramanan等,CRISPR/Cas9cleavage of viral DNA efficiently suppresseshepatitis B virus,”Scientific Reports 5:10833.doi:10.1038/srep10833(June 2,2015)
Nishimasu等,Crystal Structure of Staphylococcus aureus Cas9,”Cell162,1113-1126(Aug.27,2015)
BCL11A enhancer dissection by Cas9-mediated in situ saturatingmutagenesis,Canver等,Nature 527(7577):192-7(Nov.12,2015)doi:10.1038/nature15521.Epub 2015Sep 16.
Cpf1Is a Single RNA-Guided Endonuclease of a Class 2CRISPR-CasSystem,Zetsche等,Cell 163,759-71(Sep 25,2015).
Discovery and Functional Characterization of Diverse Class 2CRISPR-Cas Systems,Shmakov等,Molecular Cell,60(3),385–397doi:10.1016/j.molcel.2015.10.008Epub October 22,2015.
Rationally engineered Cas9nucleases with improved specificity,Slaymaker等,Science 2016Jan 1 351(6268):84-88doi:10.1126/science.aad5227.Epub2015Dec 1.[Epub ahead of print].
Gao等,“Engineered Cpf1Enzymes with Altered PAM Specificities,”bioRxiv 091611;doi:http://dx.doi.org/10.1101/091611(Dec.4,2016)
其各自通过引用并入本文,可以在本发明的实践中考虑,并在下面简要讨论:
Cong等人工程化II型CRISPR-Cas系统用于基于嗜热链球菌Cas9和化脓链球菌Cas9的真核细胞,并且表明Cas9核酸酶可以被短RNA导向,以诱导人和小鼠细胞中DNA的精确切割。他们的研究进一步表明Cas9转化为切口酶可用于促进真核细胞中的同源定向修复且具有最小的诱变活性。另外,他们的研究表明,可以将多个指导序列编码成单个CRISPR阵列,以便能够同时编辑哺乳动物基因组内的多个内源基因组位点,证实了RNA引导的核酸酶技术的易编程性和广泛适用性。这种利用RNA编码细胞中序列特异性DNA切割的能力定义了一类新的基因组工程工具。这些研究进一步表明,其他CRISPR基因座可能可以移植到哺乳动物细胞中,也可以介导哺乳动物的基因组切割。重要的是,可以设想可以进一步改进CRISPR-Cas系统的若干方面以提高其效率和多功能性。
江等人使用与双RNA复合的规律成簇的间隔短回文重复序列(CRISPR)相关的Cas9核酸内切酶以在肺炎链球菌和大肠杆菌的基因组中引入精确的突变。该方法依赖于双RNA:Cas9导向的靶基因组位点处的切割以杀死未突变的细胞并且避免了对可选择标志物或反选择系统的需要。该研究报道了通过改变短CRISPR RNA(crRNA)的序列来重编程双RNA:Cas9特异性,从而在编辑模板上进行单核苷酸和多核苷酸改变。
该研究表明,同时使用两种crRNA可实现多重诱变。此外,当该方法在肺炎链球菌中与重组工程组合使用时,使用所述方法回收的近100%细胞含有期望突变,而在大肠杆菌中,65%被回收的细胞含有突变。
王等人(2013)使用CRISPR/Cas系统用于一步产生在多个基因上携带突变的小鼠,这传统上通过胚胎干细胞中的顺序重组和/或与具有单个突变的小鼠的耗时杂交在多个步骤中产生。CRISPR/Cas系统将极大地加速功能冗余基因和上位基因相互作用的体内研究。
Konermann等(2013)解决了本领域对多功能和稳健技术的需求,这些技术能够对基于CRISPR Cas9酶的DNA结合结构域以及转录激活因子样效应物进行光学和化学调节。
Ran等人(2013-A)描述了将Cas9切口酶突变体与配对的指导RNA组合以引入靶向双链断裂的方法。这解决了来自微生物CRISPR-Cas系统的Cas9核酸酶通过指导序列靶向特定基因组基因座的问题,其可以耐受DNA靶标的某些错配,从而促进不希望的脱靶诱变。因为基因组中的单个缺口以高保真度修复,所以通过适当偏移的指导RNA同时切割是双链断裂所需的,并且扩展了用于靶切割的特异性识别碱基的数量。
作者证实,使用配对切口可以将细胞系中的脱靶活性降低50至1,500倍,并促进小鼠受精卵中的基因敲除而不牺牲靶向切割效率。这种多功能策略可以实现需要高特异性的各种基因组编辑应用。
Hsu等人(2013)表征了人类细胞中SpCas9靶向特异性的特征以指导靶位点的选择并避免脱靶效应。该研究评估了在293T和293FT细胞中>100个预测的基因组脱靶基因座上>700个指导RNA变体和SpCas9诱导的indel突变水平。作者认为SpCas9以序列依赖的方式耐受不同位置的指导RNA和靶DNA之间的错配,对错配的数量,位置和分布敏感。作者进一步表明,SpCas9介导的切割不受DNA甲基的影响,并且可以滴定SpCas9和sgRNA的剂量以最小化脱靶修饰。此外,为了促进哺乳动物基因组工程应用,作者报道了提供基于网络的软件工具来指导靶序列的选择和验证以及脱靶分析。
Ran等人(2013-B)描述了用于通过哺乳动物细胞中的非同源末端连接(NHEJ)或同源定向修复(HDR)进行Cas9介导的基因组编辑的一组工具,以及用于下游功能研究的修饰细胞系的产生。为了使脱靶切割最小化,作者进一步描述了使用具有成对指导RNA的Cas9切口酶突变体的双切口策略。
作者提供的方案通过实验获得了选择的靶位点、评估切割效率和分析脱靶活性的指南。研究表明,从靶标设计开始,基因修饰可在1-2周内完成,修饰的克隆细胞系可在2-3周内获得。
Shalem等人描述了一种在全基因组范围内询问基因功能的新方法。他们的研究表明,基因组规模CRISPR-Cas9敲除(GeCKO)文库的递送用64,751个独特指导序列靶向18,080个基因,使能够在人类细胞中进行阴性和阳性选择筛选两者。
首先,作者展示了使用GeCKO文库来鉴定癌症和多能干细胞中细胞活力所必需的基因。接下来,在黑色素瘤模型中,作者筛选了与维罗非尼(一种抑制突变蛋白激酶BRAF的治疗药物)抗性相关的基因。他们的研究表明,排名最高的候选人包括先前验证的基因NF1和MED12以及新的命中NF2,CUL3,TADA2B和TADA1。作者观察到靶向相同基因的独立指导RNA与高命中率确认之间的高度一致性,因此证实了使用Cas9进行基因组规模筛选的前景。
Nishimasu等人报道了化脓链球菌Cas9与sgRNA及其靶DNA复合的晶体结构,分辨率为2.5A°。该结构揭示了由靶识别和核酸酶裂片组成的双叶结构,在其界面处将sgRNA:DNA异源双链体容纳在带正电荷的凹槽中。鉴于识别叶对于结合sgRNA和DNA是必需的,核酸酶叶包含HNH和RuvC核酸酶结构域,其适当地定位用于分别切割靶DNA的互补链和非互补链。核酸酶叶还含有羧基-末端结构域,其负责与原型间隔子邻近基序(PAM)的相互作用。这种高分辨率结构和伴随的功能分析揭示了Cas9对RNA指导的DNA靶向的分子机制,从而为合理设计新的多功能基因组编辑技术铺平了道路。吴等人映射了来自化脓链球菌的催化失活的Cas9(dCas9)的全基因组结合位点,所述化脓链球菌载有小鼠胚胎干细胞(mESC)中的单指导RNA(sgRNA)。作者表明,测试了四种sgRNA中的每一种将dCas9靶向至数十至数千个基因组位点,通常以sgRNA中的5个核苷酸的种子区域和NGG原型间隔子邻近基序(PAM)为特征。染色质不可接近性降低了dCas9与具有匹配种子序列的其他位点的结合;因此,70%的脱靶位点与基因相关。作者表明,用催化活性Cas9转染的mESC中295个dCas9结合位点的靶向测序仅鉴定了一个突变超过背景水平的位点。作者提出了Cas9结合和切割的双态模型,其中种子匹配触发结合,但是需要与靶DNA的广泛配对进行切割。
Piatt等人建立了Cre依赖性Cas9敲入小鼠。作者使用腺相关病毒(AAV)-、慢病毒或颗粒介导的神经细胞、免疫细胞和内皮细胞中的指导RNA递送证实了体内和体外基因组编辑。
Hsu等人(2014)是一篇综述文章,一般性地讨论从酸奶到基因组编辑的CRISPR-Cas9历史,包括细胞的遗传筛选。
王等人(2014)涉及一种合并的、功能丧失的遗传筛选方法,适用于使用基因组规模的慢病毒单指导RNA(sgRNA)文库的阳性和阴性选择。
Doench等创建了一个sgRNA池,在一组六个内源性小鼠和三个内源性人类基因的所有可能的靶位点上平铺,并通过抗体染色和流式细胞术定量评估它们产生其靶基因的无效等位基因的能力。作者表明PAM的优化改善了活性,并提供了设计sgRNA的在线工具。
Swiech等人证实AAV介导的SpCas9基因组编辑可以实现大脑中基因功能的反向遗传研究。
Konermann等(2015)讨论了在指南上的适当位置附着多个效应结构域的能力,例如转录激活因子,功能性和表观基因组调节因子,例如具有和不具有接头的茎或四环。
Zetsche等表明Cas9酶可以分成两部分,因此可以控制Cas9的组装以进行活化。
Chen等人涉及多重筛选,其通过证实小鼠中全基因组体内CRISPR-Cas9筛选揭示调节肺转移的基因。
Ran等人(2015)涉及SaCas9及其编辑基因组的能力,并证实人们不能从生化分析中推断。
Shalem等人(2015)描述了催化失活的Cas9(dCas9)融合用于合成抑制(CRISPRi)或激活(CRISPRa)表达,显示使用Cas9进行基因组规模筛选的优势,包括阵列和汇集筛选、使基因组基因座失活的敲除方法和调节转录活性的策略。
Xu等人(2015)评估了在基于CRISPR的筛选中有助于单指导RNA(sgRNA)效率的DNA序列特征。作者探讨了切割位点的CRISPR/Cas9敲除效率和核苷酸偏好。作者还发现CRISPRi/a的序列偏好与CRISPR/Cas9敲除的序列偏好显著不同。
Parnas等(2015)将全基因组合并的CRISPR-Cas9文库引入树突细胞(DC)中以鉴定控制细菌脂多糖(LPS)诱导肿瘤坏死因子(Tnf)的基因。已知Tlr4信号传导的调节因子和先前未知的候选物,并将其分类为三个功能模块,其对LPS的经典反应具有不同的影响。
Ramanan等(2015)证实了感染细胞中病毒附加型DNA(cccDNA)的切割。HBV基因组以3.2kb双链附加型DNA物种存在于受感染肝细胞的细胞核中,称为共价闭合环状DNA(cccDNA),它是HBV生命周期中的关键组分,其复制不受当前疗法的抑制。作者表明,特异性靶向HBV高度保守区域的sgRNA可以有效抑制病毒复制并消耗cccDNA。
Nishimasu等人(2015)报道了SaCas9与单指导RNA(sgRNA)及其双链DNA靶标(含有5'-TTGAAT-3'PAM和5-TTGGGT-3'PAM)复合的晶体结构。SaCas9与SpCas9的结构比较突出了结构保守性和分歧,解释了它们不同的PAM特异性和直系同源sgRNA识别。
Canver等人(2015)证实了基于CRISPR-Cas9的非编码基因组元件的功能研究。作者我们开发了合并的CRISPR-Cas9指导RNA文库以对人和小鼠BCL11A增强子进行原位饱和诱变,揭示了增强子的关键特征。
Zetsche等(2015)报道了Cpfl的特征,Cpfl是来自Francisella novicida U112的2类CRISPR核酸酶,具有与Cas9不同的特征。Cpfl是缺乏tracrRNA的单个RNA引导的核酸内切酶,利用富含T的原型间隔子邻近基序,并通过交错的DNA双链断裂切割DNA。
Shmakov等(2015)报告了三种不同的2类CRISPR-Cas系统。两种系统CRISPR酶(C2cl和C2c3)含有与Cpf1远远相关的RuvC样内切核酸酶结构域。与Cpfl不同,C2cl依赖于crRNA和tracrRNA进行DNA切割。第三种酶(C2c2)含有两个预测的HEPN RNase结构域,并且不依赖于tracrRNA
Slaymaker等(2016)报道了使用结构引导蛋白工程以提高化脓链球菌Cas9(SpCas9)的特异性。作者开发了“增强的特异性”SpCas9(eSpCas9)变体,其保持稳定的中靶切割,同时降低了脱靶效应。
本文提供的方法和工具以Cpf1为例,Cpf1是不利用tracrRNA的II类核酸酶。如本文所述已经在不同的细菌物种中鉴定了Cpf1的直系同源物。可以使用本领域中描述的方法鉴定具有相似性质的其他II型核酸酶(Shmakov等2015,60:385–397;Abudayeh等2016,Science,5;353(6299))。在特定的实施方式中,用于鉴定新型CRISPR效应蛋白的这样的方法可包括从编码种子(鉴定CRISPRCas基因座的存在)的数据库中选择序列,鉴定所选择的序列中位于包含开放阅读框(ORF)的种子的10kb内的基因座,从中选择包含ORF的基因座的步骤,其中仅单个ORF编码具有大于700个氨基酸且与已知CRISPR效应子不超过90%同源性的新型CRISPR效应子。在特定的实施方式中,种子是CRISPR-Cas系统常见的蛋白质,例如Cas1。在进一步的实施方式中,CRISPR阵列用作种子以鉴定新的效应蛋白。
已经证实了本发明的有效性。例如通过电穿孔可以转染包含Cpf1和crRNA的预装配的重组CRISPR-Cpf1复合物,导致高突变率和不存在可检测的脱靶突变。Hur,J.K.等,Targeted mutagenesis in mice by electroporation of Cpf1ribonucleoproteins,NatBiotechnol.2016Jun 6.doi:10.1038/nbt.3596.[印刷前的电子版]。全基因组分析显示Cpf1具有高度特异性。通过一种测量,在人HEK293T细胞中测定的SpCas9的体外切割位点显著少于SpCas9的切割位点。Kim,D.等,Genome-wide analysis reveals specificities ofCpf1 endonucleases in human cells,Nat Biotechnol.2016Jun 6.doi:10.1038/nbt.3609.[印刷前的电子版]。采用Cas9的有效多重系统已经在果蝇中使用从含有发明tRNA的阵列加工的gRNA进行了证实。Port,F.等,Expansion of the CRISPR toolbox inan animal with tRNA-flanked Cas9and Cpf1gRNAs.doi:http://dx.doi.org/10.1101/046417。
此外,“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,JenniferA.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.KeithJoung Nature Biotechnology 32(6):569-77(2014),涉及二聚体RNA引导的FokI核酸酶,其识别扩展的序列并且可以在人细胞中高效编辑内源基因。
关于CRISPR-Cas系统,其组分,和这样的组分的递送,包括方法、材料、递送载体、载体、颗粒、AAV,及其制备和使用,包括量和制剂的一般信息,均在本发明的实践中有用,参考:美国专利号8,697,359,8,771,945,8,795,965,8,865,406,8,871,445,8,889,356,8,889,418,8,895,308,8,906,616,8,932,814,8,945,839,8,993,233和8,999,641;美国专利公开US 2014-0310830(美国申请序列号14/105,031),US 2014-0287938 A1(美国申请序列号14/213,991),US 2014-0273234 A1(美国申请序列号14/293,674),US2014-0273232 A1(美国申请序列号14/290,575),US 2014-0273231(美国申请序列号14/259,420),US 2014-0256046 A1(美国申请序列号14/226,274),US 2014-0248702 A1(美国申请序列号14/258,458),US 2014-0242700 A1(美国申请序列号14/222,930),US 2014-0242699A1(美国申请序列号14/183,512),US 2014-0242664 A1(美国申请序列号14/104,990),US 2014-0234972 A1(美国申请序列号14/183,471),US 2014-0227787 A1(美国申请序列号14/256,912),US 2014-0189896 A1(美国申请序列号14/105,035),US 2014-0186958(美国申请序列号14/105,017),US 2014-0186919 A1(美国申请序列号14/104,977),US 2014-0186843A1(美国申请序列号14/104,900),US 2014-0179770 A1(美国申请序列号14/104,837)andUS 2014-0179006 A1(美国申请序列号14/183,486),US 2014-0170753(US App Ser No14/183,429);US 2015-0184139(美国申请序列号14/324,960);14/054,414欧洲专利申请EP 2 771 468(EP13818570.7),EP 2 764 103(EP13824232.6),和EP 2 784 162(EP14170383.5);和PCT专利申请WO 2014/093661(PCT/US2013/074743),WO 2014/093694(PCT/US2013/074790),WO 2014/093595(PCT/US2013/074611),WO 2014/093718(PCT/US2013/074825),WO 2014/093709(PCT/US2013/074812),WO 2014/093622(PCT/US2013/074667),WO 2014/093635(PCT/US2013/074691),WO 2014/093655(PCT/US2013/074736),WO 2014/093712(PCT/US2013/074819),WO 2014/093701(PCT/US2013/074800),WO 2014/018423(PCT/US2013/051418),WO 2014/204723(PCT/US2014/041790),WO 2014/204724(PCT/US2014/041800),WO 2014/204725(PCT/US2014/041803),WO 2014/204726(PCT/US2014/041804),WO 2014/204727(PCT/US2014/041806),WO 2014/204728(PCT/US2014/041808),WO 2014/204729(PCT/US2014/041809),WO 2015/089351(PCT/US2014/069897),WO 2015/089354(PCT/US2014/069902),WO 2015/089364(PCT/US2014/069925),WO 2015/089427(PCT/US2014/070068),WO 2015/089462(PCT/US2014/070127),WO 2015/089419(PCT/US2014/070057),WO 2015/089465(PCT/US2014/070135),WO 2015/089486(PCT/US2014/070175),PCT/US2015/051691,PCT/US2015/051830.。还参考分别于2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日和2013年5月28日提交的美国临时专利申请61/758,468;61/802174;61/806375;61/814263;61/819,803和61/828,130。还参考了2013年6月17日提交的美国临时专利申请61/836,123。另外参考均于2013年6月17日提交的美国临时专利申请61/835,931,61/835,936,61/835,973,61/836,080,61/836,101和61/836,127。还参考美国临时专利申请61/862,468和61/862,355(2013年8月5日提交)。2013年8月28日提交的61/871,301;2013年9月25日提交的61/960,777和2013年10月28日提交的61/961,980。进一步参考:2014年10月28日提交的PCT/US2014/62558和均于2013年12月12日提交的美国临时专利申请序列号:61/915,148,61/915,150,
61/915,153,61/915,203,61/915,251,61/915,301,61/915,267,61/915,260和61/915,397;2013年1月29日和2013年2月25日提交的61/757,972和61/768,959;2014年6月11日提交的62/010,888和62/010,879;2014年6月10日提交的62/010,329,62/010,439和62/010,441;均于2014年2月12日提交的61/939,228和61/939,242;2014年4月15日提交的61/980,012;2014年8月17日提交的62/038,358;均于2014年9月25日提交的62/055,484,62/055,460和62/055,487和2014年10月27日提交的美国专利申请61/069,243。参考了2014年6月10日提交的PCT申请号PCT/US14/41806,指定美国。参考2014年1月22日提交的美国临时专利申请61/930214。参考了2014年6月10日提交的PCT申请号PCT/US14/41806,指定美国。
还提及美国申请62/180,709,17-Jun-15,PROTECTED GUIDE RNAS(PGRNAS);美国申请62/091,455,提交于12-Dec-14,PROTECTED GUIDE RNAS(PGRNAS);美国申请62/096,708,24-Dec-14,PROTECTED GUIDE RNAS(PGRNAS);美国申请62/091,462,12-Dec-14,62/096,324,23-Dec-14,62/180,681,17-Jun-2015,和62/237,496,5-Oct-2015,DEAD GUIDESFOR CRISPR TRANSCRIPTION FACTORS;美国申请62/091,456,12-Dec-14和62/180,692,17-Jun-2015,ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS;美国申请62/091,461,12-Dec-14,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs);美国申请62/094,903,19-Dec-14,UNBIASED IDENTIFICATION OF DOUBLE-STRANDBREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING;美国申请62/096,761,24-Dec-14,ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZEDENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION;美国申请62/098,059,30-Dec-14,62/181,641,18-Jun-2015,and 62/181,667,18-Jun-2015,RNA-TARGETINGSYSTEM;美国申请62/096,656,24-Dec-14and 62/181,151,17-Jun-2015,CRISPR HAVINGOR ASSOCIATED WITH DESTABILIZATION DOMAINS;美国申请62/096,697,24-Dec-14,CRISPR HAVING OR ASSOCIATED WITH AAV;美国申请62/098,158,30-Dec-14,ENGINEEREDCRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS;美国申请62/151,052,22-Apr-15,CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING;美国申请62/054,490,24-Sep-14,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMSAND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLEDELIVERYCOMPONENTS;美国申请61/939,154,12-FEB-14,SYSTEMS,METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CASSYSTEMS;美国申请62/055,484,25-Sep-14,SYSTEMS,METHODS AND COMPOSITIONS FORSEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;美国申请62/087,537,4-Dec-14,SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCEMANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;美国申请62/054,651,24-Sep-14,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMSAND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS INVIVO;美国申请62/067,886,23-Oct-14,DELIVERY,USE AND THERAPEUTIC APPLICATIONSOF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OFMULTIPLE CANCER MUTATIONS IN VIVO;美国申请62/054,675,24-Sep-14和62/181,002,17-Jun-2015,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES;美国申请62/054,528,24-Sep-14,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS IN IMMUNE DISEASES OR DISORDERS;美国申请62/055,454,25-Sep-14,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATIONPEPTIDES(CPP);美国申请62/055,460,25-Sep-14,MULTIFUNCTIONAL-CRISPR COMPLEXESAND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES;美国申请62/087,475,4-Dec-14和62/181,690,18-Jun-2015,FUNCTIONAL SCREENING WITH OPTIMIZEDFUNCTIONALCRISPR-CAS SYSTEMS;美国申请62/055,487,25-Sep-14,FUNCTIONALSCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;美国申请62/087,546,4-Dec-14和62/181,687,18-Jun-2015,MULTIFUNCTIONAL CRISPR COMPLEXES AND/OROPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES;和美国申请62/098,285,30-Dec-14,CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTHAND METASTASIS.
还提及美国申请62/181,659,18-Jun-2015和62/207,318,19-Aug-2015,ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS,ENZYME AND GUIDE SCAFFOLDS OFCAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION.Mention is made of美国申请62/181,663,18-Jun-2015和62/245,264,22-Oct-2015,NOVEL CRISPR ENZYMES ANDSYSTEMS,美国申请62/181,675,18-Jun-2015,62/285,349,22-Oct-2015,62/296,522,17-Feb-2016和62/320,231,8-Apr-2016,NOVEL CRISPR ENZYMES AND SYSTEMS,美国申请62/232,067,24-Sep-2015,美国申请14/975,085,18-Dec-2015,欧洲申请号16150428.7,美国申请62/205,733,16-Aug-2015,美国申请62/201,542,5-Aug-2015,美国申请62/193,507,16-Jul-2015,和美国申请62/181,739,18-Jun-2015,各自题为NOVEL CRISPR ENZYMES ANDSYSTEMS和美国申请62/245,270,22-Oct-2015,NOVEL CRISPR ENZYMES AND SYSTEMS。还提及美国申请61/939,256,12-Feb-2014,和WO 2015/089473(PCT/US2014/070152),12-Dec-2014,各自题为ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED GUIDE COMPOSITIONSWITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION.还提及PCT/US2015/045504,15-Aug-2015,美国申请62/180,699,17-Jun-2015,和美国申请62/038,358,17-Aug-2014,各自题为GENOME EDITING USING CAS9NICKASES.
另外,还提及PCT申请PCT/US14/70057,代理人案卷号47627.99.2060和BI-2013/107,题为“DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMSAND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERYCOMPONENTS(要求一项或多项或所有美国临时专利申请的优先权:62/054,490,提交于2014年9月24日;62/010,441,提交于2014年6月10日;和61/915,118,61/915,215和61/915,148,各自提交于2013年12月12日)(“the Particle Delivery PCT”),通过引用并入本文,和PCT申请PCT/US14/70127,代理人案卷号47627.99.2091和BI-2013/101,题为“DELIVERY,USEAND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORGENOME EDITING“(要求一项或多项或所有美国临时专利申请的优先权:61/915,176;61/915,192;61/915,215;61/915,107,61/915,145;61/915,148;和61/915,153,各自提交于2013年12月12日)(“the Eye PCT”),通过引用并入本文,涉及制备含sgRNA和Cpf1蛋白的颗粒的方法以及由该方法得到的颗粒,所述方法包括将包含sgRNA和Cpf1蛋白(和任选地HDR模板)的混合物与包含以下或基本上由以下组成或由以下组成的混合物混合:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇。例如,其中Cpf1蛋白和sgRNA以合适(例如3:1至1:3或2:1至1:2或1:1)的摩尔比在合适的温度(例如,15-30℃,例如,20-25℃,例如,室温)下混合合适的时间(例如15-45,例如30分钟),有利地在无菌、无核酸酶的缓冲液,例如1×PBS中。单独地,颗粒组分例如或包含:表面活性剂,例如阳离子脂质,例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP);磷脂,例如二肉豆蔻酰磷脂酰胆碱(DMPC);可生物降解的聚合物,例如乙二醇聚合物或PEG,和脂蛋白,例如低密度脂蛋白,例如胆固醇,溶解在醇中,有利地是C1-6烷基醇,例如甲醇,乙醇,异丙醇,例如,100%乙醇。将两种溶液混合在一起以形成含有Cas9-sgRNA复合物的颗粒。因此,在将整个复合物配制成颗粒之前,可以将sgRNA与Cas9蛋白预复合。制剂可以用已知的不同组分的不同摩尔比制备,以促进核酸向细胞内的递送(例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP),1,2-二十四烷酰基-sn-甘油-3-酮磷酸胆碱(DMPC),聚乙二醇(PEG)和胆固醇)。例如DOTAP:DMPC:PEG:胆固醇摩尔比可以是DOTAP100,DMPC0,PEG0,胆固醇0;或DOTAP90,DMPC0,PEG10,胆固醇0;或DOTAP90,DMPC0,PEG5,胆固醇5,DOTAP100,DMPC0,PEG0,胆固醇0。该应用相应地包括混合sgRNA、Cpf1蛋白和形成颗粒的组分;以及由所述混合得到的颗粒。本发明的各方面可涉及颗粒;例如,使用类似于颗粒递送PCT或EyePCT的方法的颗粒,例如通过混合包含本发明中的sgRNA和/或Cpf1的混合物和形成颗粒的组分,例如,如颗粒递送PCT或在眼PCT中以形成颗粒和由所述混合得到的颗粒(或者,当然,如本发明中涉及sgRNA和/或Cpf1的其他颗粒)。
本发明可以用作研究程序的一部分,其中存在结果或数据的传输。计算机系统(或数字设备)可用于接收、传输、显示和/或存储结果、分析数据和/或结果,和/或产生结果和/或数据和/或分析的报告。计算机系统可以被理解为可以从媒体(例如,软件)和/或网络端口(例如,来自因特网)读取指令的逻辑装置,其可以可选地连接到具有固定媒体的服务器。计算机系统可以包括CPU、磁盘驱动器、例如键盘和/或鼠标的输入设备以及显示器(例如监视器)中的一个或多个。可以通过通信介质到本地或远程位置的服务器来实现数据通信,例如指令或报告的传输。通信介质可以包括发送和/或接收数据的任何装置。例如,通信介质可以是网络连接,无线连接或互联网连接。这种连接可以提供通过万维网的通信。可以设想,可以通过这样的网络或连接(或用于发送信息的任何其他合适的装置,包括但不限于邮寄物理报告,例如打印输出)来发送与本发明有关的数据以用于接收和/或由接收者审查。接收器可以是但不限于个人或电子系统(例如,一个或多个计算机,和/或一个或多个服务器)。在一些实施方式中,计算机系统包括一个或多个处理器。处理器可以与计算机系统的一个或多个控制器、计算单元和/或其他单元相关联,或者根据需要植入固件中。如果以软件实现,则例程可以存储在任何计算机可读存储器中,例如RAM、ROM、闪存、磁盘、激光盘或其他合适的存储介质中。同样地,该软件可以通过任何已知的传送方法传送到计算设备,包括例如通过诸如电话线、因特网、无线连接等的通信信道,或者通过诸如可移动介质的可传送介质。各种步骤可以实现为各种块、操作、工具、模块和技术,其又可以用硬件、固件、软件或硬件、固件和/或软件的任何组合来实现。当以硬件实现时,部分或全部块、操作、技术等可以在例如定制集成电路(IC)、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)中实现。可以在本发明的实施方式中使用客户端-服务器、关系数据库架构、可编程逻辑阵列(PLA)等。客户端-服务器体系结构是网络体系结构,其中网络上的每个计算机或进程是客户端或服务器。服务器计算机通常是专用于管理磁盘驱动器(文件服务器)、打印机(打印服务器)或网络流量(网络服务器)的强大计算机。客户端计算机包括用户运行应用程序的PC(个人计算机)或工作站,以及如本文所公开的示例输出设备。客户端计算机依靠服务器计算机来获取资源,例如文件、设备甚至处理能力。在本发明的一些实施方式中,服务器计算机处理所有数据库功能。客户端计算机可以具有处理所有前端数据管理的软件,并且还可以接收来自用户的数据输入。包括计算机可执行代码的机器可读介质可以采用许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,例如任何计算机等中的任何存储设备,例如可用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,例如这种计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括在计算机系统内构成总线的线。载波传输介质可以采用电或电磁信号,或声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,常见形式的计算机可读介质包括例如:软盘、软盘、硬盘、磁带、任何其他磁介质、CD-ROM,DVD或DVD-ROM、任何其他光学介质、穿孔卡纸磁带、具有孔图案的任何其他物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或盒式磁带、载波传输数据或指令、电缆或传输这样的载体的链路wave、或计算机可以从中读取编程代码和/或数据的任何其他介质。许多这些形式的计算机可读介质可以涉及将一个或多个指令的一个或多个序列传送到处理器以供执行。因此,本发明包括执行本文讨论的任何方法,并且从中存储和/或传输数据和/或结果和/或其分析,以及来自执行本文讨论的任何方法的产品,包括中间体。
贯穿本公开内容,已提及CRISPR或CRISPR-Cas复合物或系统。CRISPR系统或复合物可靶向核酸分子,例如,CRISPR-Cpf1复合物可靶向并切割或切口(nick)或单纯位于靶DNA分子(取决于Cpf1是否具有使其成为切口酶或“死亡”的突变)。这样的系统或复合物适于实现候选疾病基因的组织特异性和时间控制的靶向缺失。实例包括但不限于涉及胆固醇和脂肪酸代谢的基因、淀粉样蛋白疾病、显性失活疾病、潜伏性病毒感染以及其他疾病。因此,这样的系统或复合物的靶序列可以在候选疾病基因中,例如:
因此,就CRISPR或CRISPR-Cas复合物而言,本发明考虑了造血功能障碍的矫正。严重联合免疫缺陷(SCID)由淋巴细胞T成熟缺陷引起,总是与B淋巴细胞中的功能缺陷相关(Cavazzana-Calvo等,Annu.Rev.Med.,2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。在腺苷脱氨酶(ADA)缺乏(SCID形式之一)的情况下,可以通过注射重组腺苷脱氨酶来治疗患者。由于已经证实ADA基因在SCID患者中发生突变(Giblett等,Lancet,1972,2,1067-1069),因此已经鉴定了SCID中涉及的多种其他基因(Cavazzana-Calvo等,Annu.Rev.Med.,2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。SCID有四个主要原因:(1)最常见的SCID形式,SCID-X1(X连锁SCID或X-SCID),是由IL2RG基因突变引起的,导致缺乏成熟的T淋巴细胞和NK细胞。IL2RG编码γC蛋白(Noguchi,等,Cell,1993,73,147-157),它是至少五种白细胞介素受体复合物的常见组分。这些受体通过JAK3激酶激活多种靶标(Macchi等,Nature,1995,377,65-68),其失活导致与γC失活相同的综合症;(ii)ADA基因突变导致嘌呤代谢缺陷,这对淋巴细胞前体是致命的,这反过来导致B、T和NK细胞的准缺失;(iii)V(D)J重组是免疫球蛋白和T淋巴细胞受体(TCR)成熟的必要步骤。重组激活基因1和2(RAG1和RAG2)和Artemis(参与该过程的三个基因)中的突变导致不存在成熟的T和B淋巴细胞;(iv)还报道了参与T细胞特异性信号转导的其他基因例如CD45的突变,尽管它们代表少数病例(Cavazzana-Calvo等,(iii)V(D)J重组是免疫球蛋白和T淋巴细胞受体(TCR)成熟的必要步骤。重组激活基因1和2(RAG1和RAG2)和Artemis(参与该过程的三个基因)中的突变导致不存在成熟的T和B淋巴细胞;(iv)还报道了参与T细胞特异性信号转导的其他基因如CD45的突变,尽管它们代表少数病例(Cavazzana-Calvo等,Annu.Rev.Med.,2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。在本发明的各方面,关于CRISPR或CRISPR-Cas复合物,考虑系统,本发明考虑它可用于校正由多种基因突变引起的眼部缺陷,其进一步描述于Genetic Diseases of the Eye,SecondEdition,edited by Elias I.Traboulsi,Oxford University Press,2012。待校正的眼部缺陷的非限制性实例包括黄斑变性(MD)、色素性视网膜炎(RP)。与眼部缺陷相关的基因和蛋白质的非限制性实例包括但不限于以下蛋白质:(ABCA4)ATP结合盒,亚家族A(ABC1),成员4ACHM1全色盲(视杆细胞单色)1ApoE载脂蛋白E(ApoE)C1QTNF5(CTRP5)C1q和肿瘤坏死因子相关蛋白5(C1QTNF5)C2补体成分2(C2)C3补体成分(C3)CCL2趋化因子(C-C基序)配体2(CCL2)CCR2趋化因子(CC基序)受体2(CCR2)CD36分化簇36CFB补体因子B CFH补体因子CFHH CFHR1补体因子H相关1CFHR3补体因子H相关3CNGB3环核苷酸门控通道β3CP铜蓝蛋白(CP)CRP C反应蛋白(CRP)CST3半胱氨酸蛋白酶抑制剂C或胱抑素3(CST3)CTSD组织蛋白酶D(CTSD)CX3CR1趋化因子(C-X3-C基序)受体1ELOVL4超长链脂肪酸的延长4ERCC6切除修复交叉互补啮齿动物修复缺陷,互补组6FBLN5 Fibulin-5 FBLN5 Fibulin5 FBLN6 Fibulin6FSCN2 fascin(FSCN2)HMCN1 Hemicentin 1HMCN1 hemicentin 1HTRA1 HtrA丝氨酸肽酶1(HTRA1)HTRA1 HtrA丝氨酸肽酶1IL-6白细胞介素6IL-8白细胞介素8LOC387715假定蛋白质PLEKHA1 Pleckstrin同源结构域家族成员1(PLEKHA1)PROM1 Prominin1 (PROM1或CD133)PRPH2 Peripherin-2 RPGR视网膜色素变性GTPase调节子SERPING1 serpin肽酶抑制剂,进化枝G,成员1(C1-抑制剂)TCOF1Treacle TIMP3金属蛋白酶抑制剂3(TIMP3)TLR3 Toll-样受体3。关于CRISPR或CRISPR-Cas复合物,本发明也考虑递送至心脏。对于心脏,优选心肌热带腺相关病毒(AAVM),特别是AAVM41,其在心脏中显示优先的基因转移(参见,例如,Lin-Yanga等,PNAS,March 10,2009,vol.106,no.10)。例如,美国专利公开号20110023139描述了锌指核酸酶用于基因修饰与心血管疾病相关的细胞、动物和蛋白质的用途。心血管疾病通常包括高血压、心脏病发作、心力衰竭、中风和TIA。举例来说,染色体序列可包括但不限于IL1B(白细胞介素1,β),XDH(黄嘌呤脱氢酶),TP53(肿瘤蛋白p53),PTGIS(前列腺素12(前列环素)合成酶),MB(肌红蛋白),IL4(白细胞介素4),ANGPT1(血管生成素1),ABCG8(ATP结合盒,亚家族G(WHITE),成员8),CTSK(组织蛋白酶K),PTGIR(前列腺素12(前列环素)受体(IP)),KCNJ11(内向整流钾通道,亚家族J,成员11),INS(胰岛素),CRP(C-反应蛋白,五聚蛋白相关),PDGFRB(血小板衍生生长因子受体,β多肽),CCNA2(细胞周期蛋白A2),PDGFB(血小板衍生生长因子β多肽(猿猴肉瘤病毒(v-sis)癌基因同源物)),KCNJ5(内向整流钾通道,亚家族J,成员5),KCNN3(钾中间体/小电导钙激活通道,亚家族N,成员3),CAPN10(钙蛋白酶10),PTGES(前列腺素E合酶),ADRA2B(肾上腺素能,α-2B-,受体),ABCG5(ATP结合盒,亚家族G(WHITE),成员5),PRDX2(过氧化还原酶2),CAPN5(钙蛋白酶5),PARP14(聚(ADP-核糖)聚合酶家族,成员14),MEX3C(mex-3同源物C(秀丽隐杆线虫)),ACE血管紧张素I转化酶(肽酰二肽酶A)1),TNF(肿瘤坏死因子(TNF超家族,成员2)),IL6(白细胞介素6(干扰素,β2)),STN(他汀类),SERPINE1(丝氨酸蛋白酶抑制子肽酶抑制子,进化枝E(nexin,纤溶酶原激活物抑制子1型),成员1),ALB(白蛋白),ADIPOQ(脂联素,C1Q和含胶原结构域),APOB(载脂蛋白B(包括Ag(x)抗原)),APOE(载脂蛋白E),LEP(瘦素),MTHFR(5,10-亚甲基四氢叶酸还原酶)(NADPH)),APOA1(载脂蛋白A-I),EDN1(内皮素1),NPPB(利尿钠肽前体B),NOS3(一氧化氮合酶3(内皮细胞)),PPARG(过氧化物酶体增殖物激活受体γ),PLAT(纤溶酶原活化子,组织),PTGS2(前列腺素-内过氧化物合酶2(前列腺素G/H合酶和环加氧酶)),CETP(胆固醇酯转移蛋白,血浆),AGTR1(血管紧张素II受体,1型),HMGCR(3-羟基-3-甲基戊二酰-辅酶A还原酶),IGF1(胰岛素样生长因子1(生长调节素C)),SELE(选择素E),REN(肾素),PPARA(过氧化物酶体增殖物激活受体α),PON1(对氧磷酶1),KNG1(激肽原1),CCL2(趋化因子(C-C基序)配体2),LPL(脂蛋白脂酶),VWF(冯维勒布兰德因子),F2(凝血因子II(凝血酶)),ICAM1(细胞间粘附分子1),TGFB1(转化生长因子,β1)),NPPA(利尿钠肽前体A),IL10(白细胞介素10),EPO(促红细胞生成素),SOD1(超氧化物歧化酶1,可溶性),VCAM1(血管细胞粘附分子1),IFNG(干扰素,γ),LPA(脂蛋白,Lp(a)),MPO(髓过氧化物酶),ESR1(雌激素受体1),MAPK1(丝裂原活化蛋白激酶1),HP(触珠蛋白),F3(凝血因子III(促凝血酶原激酶,组织因子)),CST3(胱抑素C)),COG2(寡聚高尔基复合物2的成分),MMP9(基质金属肽酶9(明胶酶B,92kDa明胶酶,92kDa IV型胶原酶)),SERPINC1(丝氨酸蛋白酶抑制子肽酶抑制子,进化枝C(抗凝血酶),成员1),F8(凝血因子VIII,促凝血成分),HMOX1(血红素加氧酶(去循环)1),APOC3(载脂蛋白C-III),IL8(白细胞介素8),PROK1(前动力蛋白1),CBS(胱硫醚-β-合成酶),NOS2(一氧化氮合成酶2,诱导型),TLR4(toll样受体4),SELP(选择素P(颗粒膜蛋白140kDa,抗原CD62)),ABCA1(ATP结合盒,亚家族A(ABC1),成员1),AGT(血管紧张素原(丝氨酸蛋白酶抑制肽酶抑制子,进化枝A,成员8)),LDLR(低密度脂蛋白受体),GPT(谷氨酸-丙酮酸转氨酶(丙氨酸氨基转移酶)),VEGFA(血管内皮生长因子A),NR3C2(核受体亚家族3,组C,成员2),IL18(白细胞介素18(干扰素-γ-诱导因子)),NOS1(一氧化氮合酶1(神经元)),NR3C1(核受体亚家族3,C组,成员1(糖皮质激素受体)),FGB(纤维蛋白原β链),HGF(肝细胞生长因子(庚肽A;散射因子)),IL1A(白细胞介素1,α),RETN(抵抗素),AKT1(v-akt鼠胸腺瘤病毒癌基因同源物1),LIPC(脂肪酶,肝),HSPD1(热休克60kDa蛋白1(伴侣蛋白)),MAPK14(丝裂原活化蛋白激酶14),SPP1(分泌磷蛋白1),ITGB3(整合素,β3(血小板糖蛋白111a,抗原CD61)),CAT(过氧化氢酶),UTS2(尿压素2),THBD(血栓调节蛋白),F10(凝血因子X),CP(铜蓝蛋白(铁氧化酶)),TNFRSF11B(肿瘤坏死因子受体超家族,成员11b),EDNRA(内皮素受体A型),EGFR(表皮生长因子受体(成红细胞白血病病毒(v-erb-b)癌基因同源物,禽)),MMP2(基质金属肽酶2(明胶酶A,72kDa明胶酶,72kDa IV型胶原酶)),PLG(纤溶酶原),NPY(神经肽Y),RHOD(ras同源基因家族,成员D),MAPK8(丝裂原活化蛋白激酶8),MYC(v-myc骨髓细胞瘤病病毒癌基因同源物(禽)),FN1(纤连蛋白1),CMA1(糜蛋白酶1,肥大细胞),PLAU(纤溶酶原激活子,尿激酶),GNB3(鸟嘌呤核苷酸结合蛋白(G蛋白),β多肽3),ADRB2(肾上腺素能,β-2-,受体,表面),APOA5(载脂蛋白AV),SOD2(超氧化物歧化酶2,线粒体),F5(凝血因子V(促凝血球蛋白原,不稳定因子)),VDR(维生素D(1,25-二羟基维生素D3)受体),ALOX5(花生四烯酸5-脂氧合酶),HLA-DRB1(主要组织相容性复合物,II类,DRβ1),PARP1(聚(ADP-核糖)聚合酶1),CD40LG(CD40配体),PON2(对氧磷酶2),AGER(高级糖基化终产物特异性受体),IRS1(胰岛素受体底物1)),PTGS1(前列腺素-内过氧化物合成酶1(前列腺素G/H合酶和环加氧酶)),ECE1(内皮素转换酶1),F7(凝血因子VII(血清凝血酶原转化促进剂)),URN(白细胞介素1受体拮抗剂),EPHX2(环氧化物水解酶2,细胞质),IGFBP1(胰岛素样生长因子结合蛋白1),MAPK10(丝裂原活化蛋白激酶10),FAS(Fas(TNF受体超家族,成员6)),ABCB1(ATP结合盒,亚家族B(MDR/TAP),成员1),JUN(jun癌基因),IGFBP3(胰岛素样生长因子结合蛋白3),CD14(CD14分子),PDE5A(磷酸二酯酶5A,cGMP特异性),AGTR2(血管紧张素II受体),2型),CD40(CD40分子,TNF受体超家族成员5),LCAT(卵磷脂-胆固醇酰基转移酶),CCR5(趋化因子(C-C基序)受体5),MMP1(基质金属肽酶1(间质胶原酶)),TIMP1(TIMP金属肽酶抑制子1),ADM(肾上腺髓质素),DYT10(肌张力障碍10),STAT3(信号转导和转录激活因子3(急性期反应因子)),MMP3(基质金属肽酶3(基质溶素1,前积酶)),ELN(弹性蛋白),USF1(上游转录因子1),CFH(补体因子H),HSPA4(热休克70kDa蛋白4),MMP12(基质金属肽酶12(巨噬细胞弹性蛋白酶))),MME(膜金属内肽酶),F2R(凝血因子II(凝血酶)受体),SELL(选择素L),CTSB(组织蛋白酶B),ANXA5(膜联蛋白A5),ADRB1(肾上腺素能,β-1-,受体),CYBA(细胞色素b-245,α多肽),FGA(纤维蛋白原α链),GGT1(γ-谷氨酰转移酶1),LIPG(脂肪酶,内皮细胞),HIF1A(缺氧诱导因子1,α亚基(碱性螺旋-环-螺旋转录因子)),CXCR4(趋化因子(C-X-C基序)受体4),PROC(蛋白C(凝血因子Va和VIIIa的失活子)),SCARB1(清道夫受体B类,成员1),CD79A(CD79a分子,免疫球蛋白相关α),PLTP(磷脂转运蛋白),ADD1(内收蛋白1(α)),FGG(纤维蛋白原γ链),SAA1(血清淀粉样蛋白A1),KCNH2(钾电压门控通道,亚家族H(eag相关),成员2),DPP4(二肽基肽酶4),G6PD(葡萄糖-6-磷酸脱氢酶),NPR1(利尿钠肽受体A/鸟苷酸环化酶A(atrionatriuretic肽受体A)),VTN(玻连蛋白),KIAA0101(KIAA0101),FOS(FBJ小鼠骨肉瘤病毒癌基因同源物),TLR2(toll样受体2),PPIG(肽基脯氨酸异构酶G(亲环蛋白G)),IL1R1(白细胞介素1受体,I型),AR(雄激素受体),CYP1A1(细胞色素P450,家族1,亚家族A,多肽1),SERPINA1(丝氨酸蛋白酶抑制肽酶抑制子,进化枝A(α-1抗蛋白酶,抗胰蛋白酶),成员1),MTR(5-甲基四氢叶酸-高半胱氨酸甲基转移酶),RBP4(视黄醇结合蛋白4,血浆),APOA4(载脂蛋白A-IV),CDKN2A(细胞周期蛋白依赖性激酶抑制子2A(黑色素瘤,p16,抑制CDK4)),FGF2(成纤维细胞生长因子2(碱性)),EDNRB(内皮素受体B型),ITGA2(整合素,α2(CD49B,VLA-2受体的α2亚基)),CABIN1(神经钙蛋白结合蛋白1),SHBG(性激素结合球蛋白),HMGB1(高迁移率族组合框1),HSP90B2P(热休克蛋白90kDaβ(Grp94),成员2(假基因)),CYP3A4(细胞色素P450,家族3,亚家族A,多肽4),GJA1(间隙连接蛋白,α1,43kDa),CAV1(小窝1,细胞膜穴样蛋白,22kDa),ESR2(雌激素受体2(ERβ)),LTA(淋巴毒素α(TNF超家族,成员1)),GDF15(生长分化因子15),BDNF(脑源性神经营养因子),CYP2D6(细胞色素P450,家族2,亚家族D,多肽6),NGF(神经生长因子(β多肽)),SP1(Sp1转录因子),TGIF1(TGFB诱导因子同源异形盒1),SRC(v-src肉瘤(Schmidt-Ruppin A-2)病毒癌基因同源物(禽)),EGF(表皮生长因子(β-尿抑胃素)),PIK3CG(磷酸肌醇-3-激酶,催化,γ多肽),HLA-A(主要组织相容性复合物,类别I,A),KCNQ1(钾电压门控通道,KQT样亚家族,成员1),CNR1(大麻素受体1(脑)),FBN1(原纤维蛋白1),CHKA(胆碱激酶α),BEST1(bestrophin 1),APP(淀粉样蛋白β)(A4)前体蛋白),CTNNB1(连环蛋白(钙粘蛋白相关蛋白),β1,88kDa),IL2(白细胞介素2),CD36(CD36分子(血小板反应蛋白受体)),PRKAB1(蛋白激酶,AMP激活,β1非催化亚基),TPO(甲状腺过氧化物酶),ALDH7A1(醛脱氢酶7家族,成员A1),CX3CR1(趋化因子(C-X3-C基序)受体1),TH(酪氨酸羟化酶),F9(凝血因子IX)),GH1(生长激素1),TF(转铁蛋白),HFE(血色素沉着症),IL17A(白细胞介素17A),PTEN(磷酸酶和张力蛋白同源物),GSTM1(谷胱甘肽S-转移酶mu1),DMD(肌营养不良蛋白),GATA4(GATA结合蛋白4),F13A1(凝血因子XIII,A1多肽),TTR(转甲状腺素蛋白)),FABP4(脂肪酸结合蛋白4,脂肪细胞),PON3(对氧磷酶3),APOC1(载脂蛋白C-I),INSR(胰岛素受体),TNFRSF1B(肿瘤坏死因子受体超家族,成员1B),HTR2A(5-羟色胺(血清素))受体2A),CSF3(集落刺激因子3(粒细胞)),CYP2C9(细胞色素P450,家族2,亚家族C,多肽9),TXN(硫氧还蛋白),CYP11B2(细胞色素P450,家族11,亚家族B,多肽2),PTH(甲状旁腺激素),CSF2(集落刺激因子2(粒细胞-巨噬细胞)),KDR(激酶插入结构域受体(III型受体酪氨酸激酶)),PLA2G2A(磷脂酶A2,IIA组(血小板,滑液)),B2M(β-2-微球蛋白),THBS1(血小板反应蛋白1),GCG(胰高血糖素),RHOA(ras同源基因家族,成员A),ALDH2(醛脱氢酶2家族(线粒体)),TCF7L2(转录因子7样2(T细胞特异性,HMG-box)),BDKRB2(缓激肽受体B2),NFE2L2(核因子(红细胞衍生2)样2),NOTCH1(Notch同源物1,易位相关(果蝇)),UGT1A1(UDP葡萄糖醛酸转移酶1家族,多肽A1),IFNA1(干扰素,α1),PPARD(过氧化物酶体增殖物激活受体δ),SIRT1(sirtuin(沉默交配型信息调节2同源物)1(酿酒酵母)),GNRH1(促性腺激素释放激素1(黄体生成释放激素)),PAPPA(妊娠相关血浆蛋白A,冠毛素1),ARR3(抑制蛋白3,视黄醛(X-arrestin)),NPPC(利尿钠肽前体C),AHSP(α血红蛋白稳定蛋白),PTK2(PTK2蛋白酪氨酸激酶2),IL13(白细胞介素13),MTOR(雷帕霉素的机制靶标(丝氨酸/苏氨酸激酶)),ITGB2(整合素,β2(补体成分3受体3和4亚基)),GSTT1(谷胱甘肽S-转移酶theta1),IL6ST(白细胞介素6信号转导子(gp130,制瘤素M受体)),CPB2(羧肽酶B2(血浆)),CYP1A2(细胞色素P450,家族1,亚家族A,多肽2),HNF4A(肝细胞核因子4,α),SLC6A4(溶质载体家族6(神经递质转运蛋白,血清素),成员4),PLA2G6(磷脂酶A2,VI组(细胞溶质,钙非依赖性)),TNFSF11(肿瘤坏死因子(配体)超家族,成员11),SLC8A1(溶质载体家族8(钠/钙交换剂),成员1),F2RL1(凝固因子II(凝血酶)受体样1),AKR1A1(醛酮还原酶家族1,成员A1(醛还原酶)),ALDH9A1(醛脱氢酶9家族,成员A1),BGLAP(骨γ-羧基谷氨酸(gla)蛋白),MTTP(微粒体甘油三酯转运蛋白),MTRR(5-甲基四氢叶酸-高半胱氨酸甲基转移酶还原酶),SULT1A3(磺基转移酶家族,细胞溶质,1A,苯酚优选,成员3),RAGE(肾肿瘤抗原),C4B(补体成分4B(Chido血型),P2RY12(嘌呤能受体P2Y,G蛋白偶联,12),RNLS(renalase,FAD依赖性胺氧化酶),CREB1(cAMP反应元件结合蛋白1),POMC(proopiomelanocortin),RAC1(ras相关C3肉毒杆菌毒素底物1(rho家族,小GTP结合蛋白Rac1)),LMNA(lamin NC),CD59(CD59分子,补体调节蛋白质),SCN5A(钠通道,电压门控,V型,α亚基),CYP1B1(细胞色素P450,家族1,亚家族B,多肽1),MIF(巨噬细胞移动抑制因子(糖基化抑制因子)),MMP13(基质金属肽酶13(胶原酶3)),TIMP2(TIMP金属肽酶抑制子2),CYP19A1(细胞色素P450,家族19,亚家族A,多肽1),CYP21A2(细胞色素P450,家族21,亚家族A,多肽2),PTPN22(蛋白质酪氨酸磷酸酶,非受体22型(淋巴样)),MYH14(肌球蛋白,重链14,非肌肉),MBL2(甘露糖结合凝集素(蛋白C)2,可溶性(调理性缺陷)),SELPLG(选择素P配体),AOC3(胺氧化酶,含铜3(血管粘附蛋白1)),CTSL1(组织蛋白酶L1),PCNA(增殖细胞核抗原),IGF2(胰岛素样生长因子2(生长调节素A)),ITGB1(整合素,β1(纤连蛋白受体,β多肽,抗原CD29包括MDF2,MSK12)),CAST(钙蛋白酶抑制蛋白),CXCL12(趋化因子(C-X-C基序)配体12(基质细胞衍生因子1)),IGHE(免疫球蛋白重常数ε),KCNE1(钾电压门控通道,Isk相关家族,成员1),TFRC(转铁蛋白受体(p90,CD71)),COL1A1(胶原蛋白,I型,α1),COL1A2(胶原蛋白,I型,α2),IL2RB(白细胞介素2受体,β),PLA2G10(磷脂酶A2,X组),ANGPT2(血管生成素2),PROCR(蛋白C受体,内皮细胞(EPCR)),NOX4(NADPH氧化酶4),HAMP(铁调素抗菌肽),PTPN11(蛋白酪氨酸磷酸酶,非受体11型),SLC2A1(溶质载体家族2(促进葡萄糖转运蛋白),成员1),IL2RA(白细胞介素2受体,α),CCL5(趋化因子(C-C基序)配体5),IRF1(干扰素调节因子1),CFLAR(CASP8和FADD样凋亡调节因子),CALCA(降钙素相关多肽α),EIF4E(真核翻译起始因子4E),GSTP1(谷胱甘肽S-转移酶pi1)),JAK2(Janus激酶2),CYP3A5(细胞色素P450,家族3,亚家族A,多肽5),HSPG2(硫酸乙酰肝素蛋白多糖2),CCL3(趋化因子(C-C基序)配体3),MYD88(骨髓分化初级应答基因(88)),VIP(血管活性肠肽),SOAT1(甾醇O-酰基转移酶1),ADRBK1(肾上腺素能,β,受体激酶1),NR4A2(核受体亚家族4,A组,成员2),MMP8(基质金属肽酶8(中性粒细胞胶原酶)),NPR2(利尿钠肽受体B/鸟苷酸环化酶B(atrionatriuretic肽受体B)),GCH1(GTP环化水解酶1),EPRS(谷氨酰-脯氨酰tRNA合成酶),PPARGC1A(过氧化物酶体增殖物激活受体γ,共激活因子1α),F12(凝血因子XII(Hageman因子)),PECAM1(血小板/内皮细胞粘附分子),CCL4(趋化因子(C-C基序)配体4),SERPINA3(丝氨酸蛋白酶抑制子肽酶抑制子,进化枝A(α-1抗蛋白酶,抗胰蛋白酶),成员3),CASR(钙敏感受体),GJA5(间隙连接蛋白,α5,40kDa),FABP2(脂肪酸结合蛋白2,肠),TTF2(转录终止因子,RNA聚合酶II),PROS1(蛋白S(α)),CTF1(心肌营养素1),SGCB(肌聚糖蛋白,β(43kDa肌营养不良蛋白相关糖蛋白)),YME1L1(YME1样1(酿酒酵母)),CAMP(cathelicidin抗菌肽),ZC3H12A(含有12A的锌指CCCH型),AKR1B1(醛酮还原酶家族1,成员B1(醛糖还原酶)),DES(结蛋白),MMP7(基质金属肽酶7(基质溶解素,子宫)),AHR(芳香烃受体),CSF1(集落刺激因子1(巨噬细胞)),HDAC9(组蛋白去乙酰化酶9),CTGF(结缔组织生长因子),KCNMA1(钾大电导钙激活通道,亚家族M,α成员1),UGT1A(UDP葡糖醛酸基转移酶1家族,多肽A复合基因座),PRKCA(蛋白激酶C,α),COMT(儿茶酚-β-甲基转移酶),S100B(S100钙结合蛋白B),EGR1(早期生长反应1),PRL(催乳素),IL15(白细胞介素15),DRD4(多巴胺受体D4),CAMK2G(钙/钙调蛋白依赖性蛋白激酶IIγ),SLC22A2(溶质载体家族22(有机阳离子转运蛋白),成员2),CCL11(趋化因子(C-C基序)配体11),PGF(B321胎盘生长因子),THPO(血小板生成素),GP6(糖蛋白VI(血小板)),TACR1(速激肽受体1),NTS(神经降压素),HNF1A(HNF1同源异形盒A),SST(生长抑素),KCND1(钾电压门控通道,Shal相关亚家族,成员1),LOC646627(磷脂酶抑制子),TBXAS1(血栓素A合成酶1(血小板)),CYP2J2(细胞色素P450,家族2,亚家族J,多肽2),TBXA2R(血栓素A2受体),ADH1C(醇脱氢酶1C(I类),γ多肽),ALOX12(花生四烯酸12-脂氧合酶,AHSG(α-2-HS-糖蛋白),BHMT(甜菜碱-高半胱氨酸甲基转移酶),GJA4(间隙连接蛋白,α4,37kDa),SLC25A4(溶质载体家族25(线粒体载体;腺嘌呤核苷酸转运蛋白),成员4),ACLY(ATP柠檬酸裂解酶),ALOX5AP(花生四烯酸5-脂氧合酶激活蛋白),NUMA1(核有丝分裂器蛋白1),CYP27B1(细胞色素P450,家族27,亚家族B,多肽1),CYSLTR2(半胱氨酰白三烯受体2),SOD3(超氧化物歧化酶3,细胞外),LTC4S(白三烯C4合成酶),UCN(尿皮质素),GHRL(生长素释放肽/肥胖抑制素前肽),APOC2(载脂蛋白C-II),CLEC4A(C型凝集素结构域家族4,成员A),KBTBD10(含有10的kelch重复和BTB(POZ)结构域),TNC(生腱蛋白C),TYMS(胸苷酸合成酶),SHCl(SHC(含有Src同源性2结构域)转化蛋白1),LRP1(低密度脂蛋白受体相关蛋白1),SOCS3(细胞因子信号传导抑制因子3),ADH1B(乙醇脱氢酶1B(I类),β多肽),KLK3(激肽释放酶相关肽酶3),HSD11B1(羟基类固醇(11-β)脱氢酶1),VKORC1(维生素K环氧化物还原酶复合物,亚基1),SERPINB2(丝氨酸蛋白酶抑制子肽酶抑制子,进化枝B(卵清蛋白),成员2),TNS1(张力蛋白1),RNF19A(无名指蛋白19A),EPOR(促红细胞生成素受体),ITGAM(整合素,αM(补体成分3受体3亚基)),PITX2(配对样同源域2),MAPK7(丝裂原活化蛋白激酶7),FCGR3A(IgG的Fc片段,低亲和力111a,受体(CD16a)),LEPR(瘦素受体),ENG(内皮糖蛋白),GPX1(谷胱甘肽过氧化物酶1),GOT2(谷氨酸-草酰乙酸转氨酶2,线粒体(天冬氨酸氨基转移酶2)),HRH1(组胺受体H1),NR112(核受体亚家族1,I组,成员2),CRH(促肾上腺皮质激素释放激素),HTR1A(5-羟色胺(血清素)受体1A),VDAC1(电压依赖性阴离子通道1),HPSE(乙酰肝素酶),SFTPD(表面活性蛋白D),TAP2(转运蛋白2,ATP结合盒,亚家族B(MDR/TAP)),RNF123(无名指蛋白123),PTK2B(PTK2B蛋白酪氨酸激酶2β),NTRK2(神经营养酪氨酸激酶,受体,2型),IL6R(白细胞介素6受体),ACHE(乙酰胆碱酯酶(Yt血型)),GLP1R(胰高血糖素样肽1受体),GHR(生长激素受体),GSR(谷胱甘肽还原酶),NQO1(NAD(P)H脱氢酶,醌1),NR5A1(核受体亚家族5,A组,成员1),GJB2(间隙连接蛋白,β2,26kDa)),SLC9A1(溶质载体家族9(钠/氢交换剂),成员1),MAOA(单胺氧化酶A),PCSK9(前蛋白转化酶枯草杆菌蛋白酶/kexin 9型),FCGR2A(IgG的Fc片段,低亲和力IIa,受体(CD32)),SERPINF1(丝氨酸蛋白酶抑制肽酶抑制子,进化枝F(α-2抗纤溶酶,色素上皮衍生因子),成员1),EDN3(内皮素3),DHFR(二氢叶酸还原酶),GAS6(生长停滞特异性6),SMPD1(鞘磷脂磷酸二酯酶1,酸性溶酶体),UCP2(解偶联蛋白2(线粒体,质子载体)),TFAP2A(转录因子AP-2α(激活增强子结合蛋白2α)),C4BPA(补体成分4结合蛋白,α)),SERPINF2(丝氨酸蛋白酶抑制肽酶抑制子,进化枝F(α-2抗纤溶酶,色素上皮衍生因子),成员2),TYMP(胸苷磷酸化酶),ALPP(碱性磷酸酶,胎盘(里根同工酶)),CXCR2(趋化因子(C-X-C基序)受体2),SLC39A3(溶质载体家族39(锌转运蛋白),成员3),ABCG2(ATP结合盒,亚家族G(WHITE),成员2),ADA(腺苷脱氨酶),JAK3(Janus激酶3),HSPA1A(热休克70kDa蛋白1A),FASN(脂肪酸合成酶),FGF1(成纤维细胞生长因子1(酸性)),F11(凝血因子XI),ATP7A(ATP酶,Cu++转运,α多肽),CR1(补体成分(3b/4b)受体1(Knops血型)),GFAP(胶质原纤维酸性蛋白),ROCK1(Rho相关,含有蛋白激酶1的卷曲螺旋),MECP2(甲基CpG结合蛋白2(Rett综合症)),MYLK(肌球蛋白轻链激酶),BCHE(丁酰胆碱酯酶),LIPE(脂肪酶,激素敏感),PRDX5(过氧化还原酶5),ADORA1(腺苷A1受体),WRN(Werner综合症,RecQ类螺旋酶),CXCR3(趋化因子(C-X-C基序)受体3),CD81(CD81分子),SMAD7(SMAD家族成员7),LAMC2(层粘连蛋白,γ2),MAP3K5(丝裂原活化蛋白激酶激酶5),CHGA(嗜铬粒蛋白A(甲状旁腺分泌蛋白1)),IAPP(胰岛淀粉样蛋白多肽),RHO(视紫红质),ENPP1(外核苷酸焦磷酸酶/磷酸二酯酶1),PTHLH(甲状旁腺激素样激素),NRG1(神经调节蛋白1),VEGFC(血管内皮生长因子C),ENPEP(谷氨酰氨肽酶(氨肽酶A)),CEBPB(CCAAT/增强子结合蛋白(C/EBP),β),NAGLU(N-乙酰氨基葡萄糖苷酶,α-),F2RL3(凝血因子II(凝血酶))受体样3),CX3CL1(趋化因子(C-X3-C基序)配体1),BDKRB1(缓激肽受体B1),ADAMTS13(ADAM金属肽酶与血小板反应蛋白1型基序,13),ELANE(弹性蛋白酶,中性粒细胞表达),ENPP2(外核苷酸焦磷酸酶/磷酸二酯酶2),CISH(细胞因子可诱导的含SH2蛋白),GAST(胃泌素),MYOC(肌球蛋白,小梁网诱导糖皮质激素反应),ATP1A2(ATP酶,Na+/K+转运,α2多肽),NF1(神经纤维蛋白1),GJB1(间隙连接蛋白,β1,32kDa),MEF2A(肌细胞增强因子2A),VCL(钮蛋白),BMPR2(骨形态发生蛋白受体,II型(丝氨酸/苏氨酸激酶)),TUBB(微管蛋白,β),CDC42(细胞分裂周期42(GTP结合蛋白,25kDa)),KRT18(角蛋白18),HSF1(热休克转录因子1),MYB(v-myb骨髓增生异常病毒癌基因同源物(禽)),PRKAA2(蛋白激酶,AMP激活,α2催化亚基),ROCK2(Rho相关,含有卷曲螺旋的蛋白激酶2),TFPI(组织因子途径抑制子(脂蛋白相关凝血抑制子)),PRKG1(蛋白激酶,cGMP依赖性,I型),BMP2(骨形态发生蛋白2),CTNND1(连环蛋白(钙粘蛋白相关蛋白),δ1),CTH(胱硫醚酶(胱硫醚γ-裂解酶)),CTSS(组织蛋白酶S),VAV2(vav2鸟嘌呤核苷酸交换因子),NPY2R(神经肽Y受体Y2),IGFBP2(胰岛素样生长因子结合蛋白2,36kDa),CD28(CD28分子),GSTA1(谷胱甘肽S-转移酶α1),PPIA(肽基脯氨酸异构酶A(亲环蛋白A)),APOH(载脂蛋白H(β-2-糖蛋白I)),S100A8(S100钙结合蛋白A8),IL11(白细胞介素11),ALOX15(花生四烯酸15-脂氧合酶),FBLN1(纤蛋白1),NR1H3(核受体亚家族1,H组,成员3),SCD(硬脂酰-CoA去饱和酶(δ-9-去饱和酶)),GIP(胃抑制多肽),CHGB(嗜铬粒蛋白B(纤维蛋白粗粒蛋白1)),PRKCB(蛋白激酶C,β),SRD5A1(甾体-5-α-还原酶,α多肽1(3-氧代-5α-甾体δ4-脱氢酶α1)),HSD11B2(羟基类固醇(11-β)脱氢酶2),CALCRL(降钙素受体样),GALNT2(UDP-N-乙酰基-α-D-半乳糖胺:多肽N-乙酰半乳糖胺基转移酶2(GalNAc-T2)),ANGPTL4(血管生成素样4),KCNN4(钾中间体/小电导钙激活通道,亚家族N,成员4),PIK3C2A(磷酸肌醇-3激酶,2类,α多肽),HBEGF(肝素结合)EGF样生长因子),CYP7A1(细胞色素P450,家族7,亚家族A,多肽1),HLA-DRB5(主要组织相容性复合物,II类,DRβ5),BNIP3(BCL2/腺病毒E1B19kDa相互作用蛋白3),GCKR(葡萄糖激酶(己糖激酶4)调节子),S100A12(S100钙结合蛋白A12),PADI4(肽基精氨酸脱亚胺酶,IV型),HSPA14(热休克70kDa蛋白14),CXCR1(趋化因子(C-X-C基序)受体1),H19(H19,印迹母系表达的转录物(非蛋白质编码)),KRTAP19-3(角蛋白相关蛋白19-3),IDDM2(胰岛素依赖型糖尿病2),RAC2(ras相关C3肉毒杆菌毒素底物2(rho家族,小GTP结合蛋白Rac2)),RYR1(兰尼碱受体1(骨骼)),CLOCK(时钟同源物(小鼠)),NGFR(神经生长因子受体(TNFR超家族,成员16)),DBH(多巴胺β-羟化酶(多巴胺β-单加氧酶)),CHRNA4(胆碱能受体,烟碱,α4),CACNA1C(钙通道,电压依赖性,L型,α1C亚基),PRKAG2(蛋白激酶,AMP激活,γ2非催化亚基),CHAT(胆碱乙酰转移酶),PTGDS(前列腺素D2合成酶21kDa(脑)),NR1H2(核受体亚家族1,H组,成员2),TEK(TEK酪氨酸激酶,内皮细胞),VEGFB(血管内皮生长因子B),MEF2C(肌细胞增强因子2C),MAPKAPK2(丝裂原活化蛋白激酶活化蛋白激酶2),TNFRSF11A(肿瘤坏死因子受体超家族,成员11a,NFκB激活剂),HSPA9(热休克70kDa蛋白9(mortalin)),CYSLTR1(半胱氨酰白三烯受体1),MAT1A(蛋氨酸腺苷转移酶I,α),OPRL1(阿片受体样1),IMPA1(肌醇(myo)-1(或4)-单磷酸酶1),CLCN2(氯通道2),DLD(二氢硫辛酰胺脱氢酶),PSMA6(蛋白酶体(前体,macropain)亚基,α型,6),PSMB8(蛋白酶体(前体,macropain)亚基,β型,8(大型多功能肽酶7)),CHI3L1(几丁质酶3样1(软骨糖蛋白-39)),ALDH1B1(醛脱氢酶1家族,成员B1),PARP2(聚(ADP-核糖)聚合酶2),STAR(类固醇生成急性调节蛋白),LBP(脂多糖结合蛋白),ABCC6(ATP结合盒,亚家族C(CFTR/MRP),成员6),RGS2(G蛋白信号调节因子2,24kDa),EFNB2(ephrin-B2),GJB6(间隙连接蛋白,β6,30kDa),APOA2(载脂蛋白A-II),AMPD1(腺苷一磷酸脱氨酶1),DYSF(dysferlin,肢带肌营养不良症2B(常染色体隐性遗传)),FDFT1(法呢基二磷酸法尼基转移酶1),EDN2(内皮素2),CCR6(趋化因子(C-C基序)受体6),GJB3(间隙连接蛋白,β3,31kDa),IL1RL1(白细胞介素1受体样1),ENTPD1(外核苷三磷酸二磷酸水解酶1),BBS4(巴德特-比德尔综合症4),CELSR2(钙粘蛋白,EGF LAG七通G型受体2(火烈鸟同源物,果蝇)),F11R(F11受体),RAPGEF3(Rap鸟嘌呤核苷酸交换因子(GEF)3),HYAL1(透明质酸氨基葡萄糖苷酶1),ZNF259(锌指蛋白259),ATOX1(ATX1抗氧化蛋白1同源物(酵母)),ATF6(激活转录因子6),KHK(酮己酮酶(果糖激酶)),SAT1(亚精胺/精胺N1-乙酰转移酶1),GGH(γ-谷氨酰水解酶(结合酶,叶酸多丙种球蛋白水解酶)),TIMP4(TIMP金属肽酶抑制子4),SLC4A4(溶质载体家族4,碳酸氢钠协同转运蛋白,成员4),PDE2A(磷酸二酯酶2A,cGMP刺激),PDE3B(磷酸二酯酶3B,cGMP抑制),FADS1(脂肪酸去饱和酶1),FADS2(脂肪酸去饱和酶2),TMSB4X(胸腺素β4,X-连接),TXNIP(硫氧还蛋白相互作用蛋白),LIMS1(LIM和衰老细胞抗原样结构域1),RHOB(ras同源基因家族,成员B),LY96(淋巴细胞抗原96),FOXO1(叉头盒O1),PNPLA2(含有2的patatin样磷脂酶结构域),TRH(促甲状腺激素释放激素),GJC1(间隙连接蛋白,γ1,45kDa),SLC17A5(溶质载体家族17(阴离子/糖转运蛋白),成员5),FTO(脂肪量和肥胖相关),GJD2(间隙连接蛋白,δ2,36kDa),PSRC1(脯氨酸/富含丝氨酸的卷曲螺旋1),CASP12(半胱天冬酶12(基因/假基因)),GPBAR1(G蛋白偶联胆汁酸受体1),PXK(含有丝氨酸/苏氨酸激酶的PX结构域),IL33(白细胞介素33),TRIB1(tribbles同源物1(果蝇)),PBX4(前B细胞白血病同源异形盒4),NUPR1(核蛋白,转录调节因子,1),15-Sep(15kDa硒蛋白),CILP2(软骨中间层蛋白2),TERC(端粒酶RNA组分),GGT2(γ-谷氨酰转移酶2),MT-CO1(线粒体编码的细胞色素c氧化酶I)和UOX(尿酸氧化酶,假基因)。在另外的实施方式中,染色体序列可以进一步选自Pon1(对氧磷酶1),LDLR(LDL受体),ApoE(载脂蛋白E),Apo B-100(载脂蛋白B-100),ApoA(载脂蛋白(a)),ApoA1(载脂蛋白A1),CBS(胱硫醚B-合酶),糖蛋白IIb/IIb,MTHRF(5,10-亚甲基四氢叶酸还原酶(NADPH)及其组合。在一次迭代中,染色体序列和由涉及心血管疾病的染色体序列编码的蛋白质可以选自Cacna1C,Sod1,Pten,Ppar(α),ApoE,瘦蛋白及其组合作为CRISPR-Cas系统的靶标。因此,本文提供了关于CRISPR或CRISPR-Cas系统或复合物的示例性靶标。
这些专利、专利出版物和申请中的每一项以及其中或在其审查期间引用的所有文献(“引用文献”)和在引用文献中引用或参考的所有文献,以及在其中或其中的任何文件和通过引用并入的文献中提到的任何产品的任何说明、描述、产品说明书和产品说明书均通过引用并入本文,并且可以用于本发明的实践中。所有文献(例如,这些专利、专利出版物和申请以及所引用的文献)通过引用并入本文,其程度如同每个单独的文件被具体和单独地指出通过引用并入。
另外的示例性实施方式
本发明的方面由在下文编号的陈述所捕获。
1.一种用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法,所述方法包括:
任选地,选择一种或多种治疗性靶标,
任选地,选择一种或多种CRISPR-Cas系统功能,
任选地,选择一种或多种CRISPR-Cas系统递送模式,
任选地,选择一种或多种CRISPR-Cas系统递送载体或表达系统,和
对选择的与所述CRISPR-Cas系统和/或其功能相关的参数或变量进行优化,
其中对特异性、功效和/或安全性进行优化。
2.根据陈述1所述的方法,其中所述选择的参数或变量选自CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度、CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性、CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应蛋白尺寸、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
3.根据陈述1或2所述的方法,
其中对特异性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度,
其中对功效进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、CRISPR效应蛋白尺寸、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性,和
其中对安全性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
4.根据陈述1-3中任一项所述的方法,其中对选择的与所述CRISPR-Cas系统和/或其功能相关的参数或变量进行优化取决于一种或多种治疗性靶标,基于CRISPR-Cas系统的治疗性靶标调节、修饰或操控的模式或类型,和/或CRISPR-Cas系统组分的递送。
5.根据陈述1-4中任一项所述的方法,其中所述治疗性靶标是单个基因、基因座或其他基因组位点,或者多个基因、基因座或其他基因组位点。
6.根据陈述1-5中任一项所述的方法,其中所述基于CRISPR-Cas系统的疗法或治疗剂涉及
靶标破坏,例如靶标突变,例如导致基因敲除,
特定靶位点的替换,例如导致靶标校正,
特定靶位点的移除,例如导致靶标缺失,和/或
靶位点功能的调节,例如靶位点活性或可及性,任选地导致(转录的和/或表观遗传的)基因或基因组区域激活或者基因或基因组区域沉默。
7.根据陈述1-6中任一项所述的方法,其中所述CRISPR-Cas系统功能包括
基因组突变,例如单基因组突变或多基因组突变,
基因敲除,例如单基因敲除或多基因敲除,
基因校正,例如单基因校正或多基因校正,
基因组区域缺失,例如单基因组区域缺失或多基因组区域缺失,和/或
基因或基因组区域功能,例如单个或多个基因或基因组区域活性。
8.根据陈述1-7中任一项所述的方法,所述递送模式包括
递送gRNA和/或CRISPR效应蛋白,
递送gRNA和/或CRISPR效应子mRNA,或
递送gRNA和/或作为基于DNA的表达系统的CRISPR效应子。
9.根据陈述1-8中任一项所述的方法,其中所述递送载体和/或表达系统包括脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统,任选地腺病毒、AAV或慢病毒表达/递送系统。
10.根据陈述1-9中任一项所述的方法,其中
CRISPR效应子特异性是通过选择最特异性的CRISPR效应子来优化,例如通过选择最特异性的CRISPR效应子直系同源物或通过增加特异性的特定CRISPR效应子突变,
gRNA特异性是通过选择最特异性的gRNA来优化,例如通过选择具有低同源性的gRNA,即至少一个或优选多个,例如至少2个,或优选至少3个与脱靶位点的错配,
PAM限制性是通过选择具有最限制性的PAM识别的CRISPR效应子来优化,例如通过选择具有更限制性的PAM识别的CRISPR效应子直系同源物或通过增加或改变PAM限制性的特定CRISPR效应子突变,
CRISPR效应子活性是通过选择最具有活性的CRISPR效应子来优化,例如通过选择最具有活性的CRISPR效应子直系同源物或通过增加活性的特定CRISPR效应子突变,
gRNA活性是通过选择最具有活性的gRNA来优化,例如通过通过RNA修饰增加gRNA稳定性,
靶位点选择是通过选择基因、基因座或其他基因组区域内的靶位点的最佳位置来优化,例如通过选择具有群体内的低变异性例如多态性的早期和/或保守外显子或结构域中的靶位点,或通过最小化脱靶效应,例如脱靶限定为与靶标相比具有1-5、1-4或优选1-3个错配,优选还考虑群体内的变异性,
CRISPR效应子稳定性是通过选择具有合适半衰期,例如优选短半衰期,同时仍能够保持足够活性的CRISPR效应子来优化,例如通过选择具有特定半衰期的合适的CRISPR效应子直系同源物或通过影响半衰期或稳定性的特定CRISPR效应子突变或修饰,例如包括稳定或去稳定结构域或序列,
CRISPR效应子mRNA稳定性是通过增加或减少CRISPR效应子mRNA稳定性来优化,例如通过通过mRNA修饰增加或减少CRISPR效应子mRNA稳定性,
gRNA稳定性是通过增加或减少gRNA稳定性来优化,例如通过通过RNA修饰增加或减少gRNA稳定性,
CRISPR效应蛋白或mRNA免疫原性或毒性是通过降低CRISPR效应蛋白或mRNA免疫原性或毒性来优化,例如通过mRNA或蛋白质修饰,
gRNA免疫原性或毒性是通过降低gRNA免疫原性或毒性来优化,例如通过gRNA修饰,
CRISPR效应蛋白或mRNA剂量或滴度是通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化,
gRNA剂量或滴度是通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化,
CRISPR效应蛋白尺寸是通过选择最小的蛋白质尺寸以提高递送效率来优化,特别是对于病毒介导的递送,
CRISPR效应子、gRNA和/或CRISPR-Cas复合物表达水平是通过限制或延长表达持续时间和/或限制或增加表达水平来优化,例如通过使用自失活CRISPR-Cas系统,例如包括自靶向gRNA,通过使用具有有限的表达持续时间的病毒载体,通过使用用于低或高表达水平的合适启动子,通过组合个体CRISP-Cas系统组分的不同递送方法,例如病毒介导的CRISPR效应子编码核酸递送与非病毒介导的gRNA递送组合,或病毒介导的gRNA递送与非病毒介导的CRISPR效应蛋白或mRNA递送组合,和
CRISPR效应子、gRNA或CRISPR-Cas复合物时空表达是通过对条件型和/或诱导型表达系统的合适选择来优化,包括可控的CRISPR效应子活性、任选地去稳定的CRISPR效应子,和/或分裂的CRISPR效应子,和/或细胞或组织特异性表达系统。
11.根据陈述1-10中任一项所述的方法,其中对选择的与所述CRISPR-Cas系统和/或其功能相关的参数或变量进行优化取决于所述治疗性靶标的选择、所述CRISPR-Cas系统功能、所述CRISPR-Cas系统递送模式和/或所述CRISPR-Cas系统递送载体或表达系统。
12.根据陈述1-11中任一项所述的方法,其中在靶生物的群体水平上优化gRNA特异性。
13.根据陈述12所述的方法,其中对gRNA特异性进行优化包括使群体中的gRNA靶位点序列变异最小化和/或使群体中的gRNA脱靶发生率最小化。
14.根据陈述12或13所述的方法,其包括:
(a)为感兴趣治疗性基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,和
从所述选择的靶位点中(亚)选择靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,
(b)为感兴趣治疗性基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,或
为感兴趣治疗性基因座选择gRNA靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,
任选地估计治疗群体所需要的(亚)选择的靶位点的数量,
任选地针对个体受试者验证所述(亚)选择的靶位点中的一个或多个,
任选地设计识别所述(亚)选择的靶位点中的一个或多个的一种或多种gRNA。
15.一种用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂或者用于开发或设计用于基于CRISPR-Cas系统的疗法或治疗剂的gRNA的方法,其包括
(a)为感兴趣治疗性基因座选择gRNA靶位点,其中所述靶位点具有在靶生物群体中最小的序列变异,和
从所述选择的靶位点中(亚)选择一个或多个靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,
(b)为感兴趣治疗性基因座选择gRNA靶位点,其中所述靶位点具有在靶生物群体中最小的序列变异,或
为感兴趣治疗性基因座选择gRNA靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,
任选地估计治疗群体所需要的(亚)选择的靶位点的数量,
任选地针对个体受试者验证所述(亚)选择的靶位点中的一个或多个,
任选地设计识别所述(亚)选择的靶位点中的一个或多个的一种或多种gRNA。
16.根据陈述15所述的方法,其中所述方法是在靶生物群体中,用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂或者用于开发或设计用于基于CRISPR-Cas系统的疗法或治疗剂的gRNA的方法。
17.根据陈述12-16中任一项所述的方法,其中具有在群体中最小的序列变异的所述靶位点的特征在于在所述群体的至少99%,优选至少99.9%,更优选至少99.99%中不存在序列变异。
18.根据陈述12-17中任一项所述的方法,其中所述群体包括至少1000个个体,例如至少5000个个体,例如至少10000个个体,例如至少50000个个体。
19.根据陈述12-18中任一项所述的方法,其中所述脱靶位点的特征在于所述脱靶位点和所述gRNA之间的至少一个错配,和/或所述脱靶位点的特征在于所述脱靶位点和所述gRNA之间的最多5个,优选最多4个,更优选最多3个错配,优选两者。
20.根据陈述12-19中任一项所述的方法,其中针对所述群体中的高频单倍型确定所述群体中的脱靶位点的所述最小数量。
21.根据陈述20所述的方法,其中所述高频单倍型的特征在于在所述群体的至少0.1%中出现。
22.根据陈述12至21中任一项所述的方法,其中(亚)选择的变异的数量,例如在大规模测序数据集中捕获的低频序列变异。
23.根据陈述12-22中任一项所述的方法,其中估计治疗给定大小的群体所需要的(亚)选择的靶位点的数量。
24.根据陈述12-23中任一项所述的方法,其中通过基因组测序,优选全基因组测序,验证所述(亚)选择的靶标。
25.一种用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法,其包括:
针对目标群体中的一个或多个基因座选择靶序列组,其中所述靶序列不含在所述目标群体中以高于阈值等位基因频率出现的变体;
去除任何具有高频脱靶候选者的铂靶序列(相对于该组中的其他铂靶)以定义最终靶序列组;
基于所述最终靶序列组制备CRISPR-Cas系统组,其中制备的许多CRISP-Cas系统是至少部分地基于目标群体的大小。
26.根据陈述25所述的方法,其还包括:
获得待治疗的受试者的基因组测序数据;和
用选自所述CRISPR-Cas系统组的CRISPR-Cas系统治疗所述受试者,其中选择的所述CRISPR-Cas系统是至少部分地基于所述个体的所述基因组测序数据。
27.根据陈述26所述的方法,其中所述基因组测序数据是全基因组测序数据。
28.根据陈述2至27所述的方法,其中基于一个或多个参数的优化进一步选择靶序列,所述一个或多个参数由以下组成:PAM类型(天然的或修饰的),PAM核苷酸含量,PAM长度,靶序列长度,PAM限制性,靶切割效率,和基因、基因座或其他基因组区域内的靶序列位置。
29.根据陈述2至28中任一项所述的方法,其中基于一个或多个参数的优化选择所述CRISPR-Cas系统组中的每个CRISPR-Cas系统的效应蛋白,所述一个或多个参数选自效应蛋白尺寸、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性、效应蛋白特异性、效应蛋白稳定性或半衰期、效应蛋白免疫原性或毒性。
30.根据陈述2至29中任一项所述的方法,其中所述指导RNA是tru指导、护送的指导或受保护的指导。
31.根据陈述1至30中任一项所述的方法,其中所述CRISPR-Cas系统功能包括基因组突变、基因敲除、基因校正、基因组区域缺失、基因或基因组区域功能的调节。
32.根据陈述31所述的方法,其中基因或基因组区域功能的调节包括调节基因活性或可及性,任选地导致转录的和/或表观遗传的基因或基因组区域激活或者基因或基因组区域沉默。
33.根据陈述1至32中任一项所述的方法,其中递送包括递送gRNA和/或CRISPR效应蛋白,递送gRNA和/或CRISPR效应子mRNA,或者递送gRNA和/或作为基于DNA的表达系统的CRISPR效应子。
34.根据陈述33所述的方法,其中用于递送所述CRISPR-Cas系统或其组分的递送载体和/或表达系统包括脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统。
35.根据陈述1-34中任一项所述的方法,其中使用基于测序的双链断裂检测测定法测定脱靶候选者、PAM限制性、靶切割效率或效应蛋白特异性。
36.工程化Cpf1蛋白质用于降低所述Cpf1蛋白质的脱靶活性的用途,
其中所述蛋白质与包含RNA的核酸分子复合以形成CRISPR复合物,
其中所述核酸分子在所述CRISPR复合物中时靶向一个或多个靶多核苷酸基因座,
其中所述蛋白质相对于未修饰的蛋白质包含至少一个修饰,所述修饰改变所述Cpf1蛋白质与所述核酸分子,或所述靶多核苷酸基因座的链,或脱靶多核苷酸基因座的链的关联。
37.一种用于降低Cpf1蛋白质的脱靶活性的系统,其包括工程化Cpf1蛋白质和包含RNA的核酸分子;
其中所述蛋白质与所述核酸分子复合以形成CRISPR复合物,
其中所述核酸分子在所述CRISPR复合物中时靶向一个或多个靶多核苷酸基因座,
其中所述蛋白质相对于未修饰的蛋白质包含至少一个修饰,所述修饰改变所述Cpf1蛋白质与所述核酸分子,或所述靶多核苷酸基因座的链,或脱靶多核苷酸基因座的链的关联。
38.根据陈述46或47所述的用途或系统,其中所述Cpf1蛋白质相对于未修饰的蛋白质包含至少两个修饰,所述修饰改变所述Cpf1蛋白质与所述核酸分子的关联。
39.根据陈述46-48中任一项所述的用途或系统,其中所述修饰包括改变PAM识别的一个或多个氨基酸置换。
40.根据陈述46-48中任一项所述的用途或系统,其中所述修饰包括参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号在位置11、12、13、14、15、16、17、34、36、39、40、43、46、47、50、54、57、58、111、126、127、128、129、130、131、132、133、134、135、136、157、158、159、160、161、162、163、164,165、166、167、168、169、170、171、172、173、174、175、176、177、178、532、533、534、535、536、537、538、539、540、541、542,543、544、545、546、547、548、549、550、551、552、553、554、555、556、565、566、567、568、569、570、571、572、573、574、575,592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616,617、618、619、620、626、627、628、629、630、631、632、633、634、635、636、637、638、642、643、644、645、646、647、648、649,651、652、653、654、655、656、676、679、680、682、683,684、685、686、687、688、689、690、691、692、693、707、711、714、715、716、717、718、719、720、721、722、739、765、768、769,773、777、778、779、780、781、782、783、784、785、786、871、872、873、874、875、876、877、878、879、880、881、882、883、884或1048处的一个或多个氨基酸置换。
41.根据陈述46-48中任一项所述的用途或系统,其中所述修饰包括在结合沟槽中的一个或多个氨基酸置换。
42.根据陈述46-48中任一项所述的用途或系统,其中所述蛋白质修饰中的至少一个包括参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号在位置R909、R912、R930、R947、K949、R951、R955、K965、K968、K1000、K1002、R1003、K1009、K1017、K1022、K1029、K1035、K1054、K1072、K1086、R1094、K1095、K1109、K1118、K1142、K1150、K1158、K1159、R1220、R1226、R1242和/或R1252处的氨基酸置换。
43.根据陈述46-48中任一项所述的用途或系统,其中所述蛋白质修饰中的至少一个包括参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号在位置K324、K335、K337、R331、K369、K370、R386、R392、R393、K400、K404、K406、K408、K414、K429、K436、K438、K459、K460、K464、R670、K675、R681、K686、K689、R699、K705、R725、K729、K739、K748和/或K752处的氨基酸置换。
44.根据陈述46-48中任一项所述的用途或系统,其中所述蛋白质修饰中的至少一个包括参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号在位置R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、K1072、K1086、F1103、R1226和/或R1252处的氨基酸置换。
45.根据陈述46-48中任一项所述的用途或系统,其中所述蛋白质修饰中的至少一个包括参考LbCpf1(毛螺菌科细菌ND2006)的氨基酸位置编号在位置R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、R1138、R1165和/或R1252处的氨基酸置换。
46.根据陈述46-48和51-55中任一项所述的用途或系统,其中所述修饰包括丙氨酸置换。
47.根据陈述46-48和51-55中任一项所述的用途或系统,其中所述修饰包括K949A。
48.根据陈述46-57中任一项所述的用途或系统,其中所述Cpf1蛋白包括来自生物的Cpf1蛋白,所述生物来自包括以下的属:链球菌属、弯曲菌属、Nitratifractor、葡萄球菌属、Parvibaculum、罗斯氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属、棒杆菌属、肉食杆菌属、红细菌属、李斯特菌属、Paludibacter、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯氏菌属、军团菌属、脂环酸芽孢杆菌属、Methanomethyophilus、卟啉单胞菌属、普雷沃氏菌属、拟杆菌属、创伤球菌属、Letospira、脱硫弧菌属、Desulfonatronum、丰佑菌科、肿块芽胞杆菌属、芽孢杆菌属、Brevibacilus、甲基杆菌属或氨基酸球菌属。
49.根据陈述46-58中任一项所述的用途或系统,其中所述Cpf1蛋白质包含一个或多个核定位信号(NLS)结构域,优选至少两个或更多个NLS结构域。
50.根据陈述46-59中任一项所述的用途或系统,其中所述Cpf1蛋白质包含影响Cpf1催化活性和/或Cpf1稳定性的修饰或突变。
51.根据陈述46至59中任一项所述的用途或系统,其中所述Cpf1蛋白质包含一个或多个异源功能结构域,所述异源功能结构域具有以下活性中的一种或多种:甲基化酶活性、脱氨酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性和核酸结合活性。
52.根据陈述46至59中任一项所述的用途或系统,其还包括外源模板多核苷酸。
53.根据陈述46至62中任一项所述的系统,其中所述系统被包括在递送系统中或者由一种或多种载体整体或部分地编码或递送;并且任选地所述一种或多种载体被包括在递送系统中,优选单个载体。
54.根据陈述63所述的系统,其中所述一种或多种载体包括一种或多种病毒载体;或一种或多种逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。
55.根据陈述62所述的系统,其中所述递送系统包括颗粒(优选包含脂质、糖、金属或蛋白质)、酵母系统、脂质转染系统、显微注射系统、基因枪系统,病毒体、泡囊(优选外来体或脂质体)、免疫脂质体、聚阳离子、脂质:核酸缀合物或人工病毒粒子。
56.根据陈述65所述的系统,其中所述颗粒包含与指导RNA复合的根据陈述46-61中任一项所述的工程化Cpf1蛋白质。
57.一种真核细胞,其包含根据陈述46-66中任一项所述的系统,优选其中所述细胞是体外、离体或体内宿主细胞或细胞系或其后代,其中所述宿主细胞或细胞系不是人类生殖细胞系。
58.根据陈述67所述的细胞,其中所述细胞包括干细胞或干细胞系。
59.根据陈述67或68所述的细胞,其中所述细胞是动物或植物细胞,优选人细胞。
60.一种在细胞或细胞系中调节基因表达或修饰感兴趣的靶基因座的方法,其中所述方法包括将根据陈述46-66中任一项所述的系统导入所述细胞或细胞系,从而获得修饰的细胞或细胞系。
61.根据陈述70所述的方法,其中进一步培养所述修饰的细胞或细胞系以产生后代。
62.一种体外或离体修饰感兴趣的靶基因座的方法,所述方法包括向所述基因座递送包含根据陈述46-66中任一项所述的系统的非天然存在的或工程化的组合物,其中所述Cpf1蛋白质与一种或多种核酸组分形成复合物,并且在所述复合物与感兴趣的靶基因座结合后,所述Cpf1蛋白质诱导所述感兴趣的靶基因座的修饰。
63.一种产生具有由感兴趣的基因编码的感兴趣的修饰的性状的植物的方法,所述方法包括使植物细胞与根据陈述46-66中任一项所述的系统接触或使所述植物细胞经受根据陈述72所述的方法,从而修饰或导入所述感兴趣的基因,并从所述植物细胞再生植物。
64.一种通过操纵感兴趣的基因组基因座处的一个或多个靶序列来修饰生物体的方法,其包括将根据陈述46-66中任一项所述的系统递送至所述生物体,从而获得修饰的生物体。
65.根据陈述74所述的方法,其中所述生物是植物或藻类。
66.一种通过操纵感兴趣的基因组基因座处的一个或多个靶序列来修饰细胞或细胞系的离体方法,其包括向所述细胞递送根据陈述46-66中任一项所述的系统,从而获得修饰的细胞或细胞系,其中所述方法不包括用于修饰人类的种系遗传特性的过程。
67.根据陈述76所述的方法,其中进一步培养所述修饰的细胞或细胞系以产生后代。
68.根据陈述46-66中任一项所述的系统用于离体基因或基因组编辑的用途,其中所述用途不包括用于修饰人类的种系遗传特性的过程。
69.根据陈述46-66中任一项所述的系统,根据陈述67-69所述的细胞,或通过根据陈述70-71或76-77所述的陈述产生的细胞、细胞系或其后代,用于疗法。
70.根据陈述79所述使用的系统或细胞,其中所述疗法是用于基因或基因组编辑,或基因疗法。
71.根据陈述79或80所述使用的系统或细胞,其中所述疗法是用于治疗以下中的一种或多种:血液和凝血疾病和病症;细胞失调和肿瘤疾病和病症;炎症和免疫相关疾病和病症;代谢、肝脏、肾脏和蛋白质疾病和病症;肌肉/骨骼疾病和病症;神经和神经元疾病和病症;和眼部疾病和病症。
72.通过陈述70-71或76-77所述的方法获得或可获得的细胞或细胞系。
73.一种用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法,其包括:
a.选择一个或多个靶基因座;
b.选择一种或多种CRISPR-Cas系统功能;
c.任选地,选择一种或多种递送模式;
d.制备基于步骤(a)-(c)选择的CRISPR-Cas系统。
74.根据前述陈述中任一项所述的方法,其中选择一个或多个靶标、靶序列或靶基因座包括优化靶标、靶序列或靶基因座的位置、长度、特异性和PAM特征中的一种或多种。
75.根据陈述74所述的方法,其中优化靶标的位置包括在具有低变异性的基因、基因座或其他基因组区域内选择靶序列。
76.根据陈述75所述的方法,其中低变异性包括选择具有低变异性的早期和/或保守外显子或结构域。
77.根据陈述75所述的方法,其中优化靶标的位置包括选择在群体的至少99%中不存在序列变异的靶基因座。
78.根据陈述77所述的方法,其中所述群体包括至少1000个个体。
79.根据陈述74所述的方法,其中优化靶标的长度包括选择在所述一个或多个靶基因座内5至25个核苷酸之间的靶序列。
80.根据陈述79所述的方法,其中靶序列长度是20个核苷酸。
81.根据陈述74所述的方法,其中优化靶标的特异性包括选择使脱靶候选者最小化的靶基因座。
82.根据陈述81所述的方法,其中脱靶候选者具有1-3个错配或远端PAM错配。
83.根据陈述82所述的方法,其中使用基于测序的双链断裂(DSB)检测测定法鉴定脱靶候选者。
84.根据陈述83所述的方法,其中所述基于测序的DSB检测测定法包括用包含引物结合位点的衔接子标记DSB的位点、用条形码或独特分子标识符标记DSB的位点,或其组合。
85.根据陈述73所述的方法,其中优化PAM特征包括优化PAM的核苷酸含量。
86.根据陈述85所述的方法,其中优化PAM的核苷酸含量是选择具有基序的PAM,所述基序使所述一个或多个靶基因座中的丰度最大化、使突变频率最小化,或两者。
87.根据陈述73所述的方法,其中选择一种或多种CRISP-Cas系统功能包括选择最佳效应蛋白、最佳指导RNA或两者中的一种或多种。
88.根据陈述87所述的方法,其中选择最佳效应蛋白包括优化效应蛋白的类型、尺寸、PAM特异性、效应蛋白稳定性、免疫原性或毒性、功能特异性和功效中的一种或多种。
89.根据陈述88所述的方法,其中所述效应蛋白是天然存在的或经修饰的效应蛋白。
90.根据陈述89所述的方法,其中所述经修饰的效应蛋白是切口酶、脱氨酶或失活的效应蛋白。
91.根据陈述87-90中任一项所述的方法,其中优化尺寸包括选择具有最小尺寸的蛋白效应子。
92.根据陈述88所述的方法,其中优化PAM特异性包括选择具有经修饰的PAM特异性的效应蛋白。
93.根据陈述88所述的方法,其中优化效应蛋白稳定性包括选择具有短半衰期,同时保持足够活性的效应蛋白,例如通过选择具有特定半衰期或稳定性的合适的CRISPR效应子直系同源物。
94.根据陈述88所述的方法,其中优化免疫原性或毒性包括通过蛋白质修饰使效应蛋白免疫原性或毒性最小化。
95.根据陈述88所述的方法,其中优化功能特异性包括选择蛋白效应子,所述蛋白效应子在所述指导RNA和一个或多个靶基因座之间具有降低的错配和/或凸起耐受性。
96.根据陈述88所述的方法,其中优化功效包括优化总体效率、表观遗传耐受性或两者。
97.根据陈述96所述的方法,其中使总体效率最大化包括选择在具有不同染色质复杂性的靶基因座中具有均一酶活性的效应蛋白、选择具有限于开放染色质可及性区域的酶活性的效应蛋白。
98.根据陈述96所述的方法,其中使用ATAC-seq或DNA-邻近连接测定法中的一种或多种测量染色质可及性。
99.根据陈述96所述的方法,其中优化表观遗传耐受性包括优化甲基化耐受性、表观遗传标志竞争或两者。
100.根据陈述96所述的方法,其中优化甲基化耐受性包括选择修饰甲基化DNA的效应蛋白。
101.根据陈述96所述的方法,其中优化表观遗传耐受性包括选择不能修饰染色体沉默区域的效应蛋白、选择能够修饰染色体沉默区域的效应蛋白,或选择不富集表观遗传标志物的靶基因座。
102.根据陈述856所述的方法,其中选择经优化的指导RNA包括优化gRNA稳定性、gRNA免疫原性或两者。
103.根据陈述102所述的方法,其中优化gRNA稳定性和/或gRNA免疫原性包括RNA修饰。
104.根据陈述103所述的方法,其中所述修饰包括从所述gRNA的靶互补区的3’末端移除1-3个核苷酸。
105.根据陈述103所述的方法,其中所述修饰包括延伸的gRNA和/或反式RNA/DNA元件,其在所述gRNA中产生稳定结构,其与脱靶基因座的靶标处的gRNA碱基配对竞争,或在所述gRNA和靶序列之间的延伸的互补核苷酸,或两者。
106.根据前述陈述中任一项所述的方法,其中所述递送模式包括递送gRNA和/或CRISPR效应蛋白、递送gRNA和/或CRISPR效应mRNA,或者递送gRNA和/或作为基于DNA的表达系统的CRISPR效应子。
107.根据陈述106所述的方法,其中所述递送模式还包括从脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统选择递送载体和/或表达系统。
108.陈述106至107中任一项的方法,其中表达是通过对条件型和/或诱导型表达系统的选择来优化的时空表达,包括可控的CRISPR效应子活性、任选地去稳定的CRISPR效应子,和/或分裂的CRISPR效应子,和/或细胞或组织特异性表达系统。
本发明将在以下实施例中进一步说明,这些实施例仅用于说明目的,并不意图以任何方式限制本发明。
实施例
实施例1:体内Cpf1的材料和方法
DNA构建体
已经通过使用正向PCR引物包括
HA-NLS(aacacaggaccggtgccaccatgtacccatacgatgttccagattacgcttcgccgaagaaaaagcgcaaggtcgaagcgtccacacagttcgagggctttaccaacctgtatcaggtgagc
(spA)(gcggccgcacacaaaaaaccaacacacagatctaatgaaaataaagatcttttattgaattcttagttgcgcagctcctggatgtaggccagcc)(ref)对编码AsCpf1的序列(ref)进行PCR扩增,和将得到的PCR模板克隆到在使用人突触蛋白(Synapsin)启动子(hSyn)之下的AAV骨架中而产生AAVhSyn-HA-NLS-AsCpf1-spA载体。为了产生AAVpU6-sgRNA(SapI)-hSyn-GFP-KASH-hGH和pU6-3xgRNA-hSyn-GFP-KASH-hGH载体,分别编码pU6-DR(SapI)和pU6-3xgRNA的基因块已经克隆到AAVhSyn-GFP-KASH-hGH骨架中(未公开)。已经通过测序验证所有构建体。为了产生AAVsMecp2-HA-NLS-AsCpf1-spA-tRNAp-3xgRNA载体,编码tRNA启动子(tRNAp)和3xgRNA重复的基因块已经与PCR扩增的sMecp2-HA-NLS-Cas组装并连接到AAV骨架中。
生产AAV载体
可如前所述制备在DMEM培养基中的AAV1颗粒(ref)。简言之,使用聚(乙烯亚胺)(PEI)用转基因质粒、pAAV1血清型质粒和pDF6辅助质粒转染HEK293FT细胞。48小时后收集含有低滴度AAV1颗粒的DMEM培养基并无菌过滤。对于高滴度AAV1/2生产,用等比率的AAV1和AAV2血清型质粒和pDF6辅助质粒转染HEK293FT细胞。转染后48小时,收获细胞并在肝素亲和柱(ref)上纯化高滴度AAV1/2病毒。为了产生高滴度PHP.B病毒载体,使用PEI,每2.1×107个铺板的细胞用下列质粒混合物共转染HEK293T细胞:5.7μg转基因质粒、10.4μg腺病毒辅助质粒pAdDF6、8.7μg AAV-PHP.B rep-cap包装质粒。转染后120小时,收获细胞并通过三个循环的冻融制备细胞裂解物,与PEG沉淀的上清液组合并用Benzonase(Sigma-Aldrich,St.Louis,MO)(50U/ml细胞裂解物,37℃,30分钟)处理。通过碘克沙醇(iodixanol)密度梯度超速离心(Optiprep密度梯度培养基,Axis-Shield,Oslo,Norway)从细胞裂解物纯化AAV。通过使用100kDa分子量截留离心装置(Amicon Ultra-15,Merck Millipore,Cork,Ireland),通过1,500×g的三轮离心,通过用PBS替换来除去残留的碘克沙醇。在用DNA酶I处理母液(stock)后,使用对小鼠Mecp2启动子序列特异的探针和引物(Integrated DNATechnologies,Coralville,IA)通过实时定量PCR
(qPCR)测定AAV载体的滴度。
原代皮层神经元培养
用于获得用于组织培养的神经元的小鼠根据由Broad机构动物护理和使用委员会(Broad’s Institutional Animal Care and Use Committee)(IACUC)批准的方案处死。从出生后P0.5天的小鼠脑(ref)制备原代神经元,并将其铺板在聚-D-赖氨酸(PDL)包被的24孔板(BD Biosciences)或层粘连蛋白/PDL包被的盖玻片(VWR)上。培养物在37℃和5%CO2下生长在补充有B27、Glutamax(Life Technologies)和青霉素/链霉素混合物的Neurobasal A培养基中。为抑制神经胶质细胞增殖,48小时后将终浓度为10μM的胞嘧啶-β-D-阿拉伯呋喃糖苷(AraC,Sigma)加入培养基中,72小时后用新鲜培养基替换。对于AAV1转导,如前所述,用低滴度AAV1感染培养的神经元(ref)。转导一周后,收获神经元以分离基因组DNA(QuickExtract DNA抽提缓冲液(Epicenter))或在4%多聚甲醛(PFA)中固定以进行免疫荧光染色。
将AAV1/2立体定向注射到小鼠脑中
Broad机构动物护理和使用委员会(IACUC)批准本文所述的所有动物程序。根据批准的程序对成年(12-16周龄)雄性C57BL/6N小鼠进行开颅,并且将1μl的1:1AAV混合物(5.87x1013Vg/ml单个载体AAV-PHP.BsMecp2-HA-NLS-AsCpf1-spA-tRNAp-3xgRNA;5.25x1013Vg/mlofhSyn-GFP-KASH)注入到背齿状脑回(前/后:-1.7;中侧:+/-0.6;背/腹:-2.15)。在收回之前将移液管保持原位3-5分钟以防止泄漏。注射后,缝合切口并在手术后根据批准的IACUC方案施用术后镇痛药三天。
将AAV-PHP.B全身递送到小鼠中
AAV-PHP.B载体以150μl体积经尾静脉施用到6-8周龄的雄性和雌性C57BL/6J小鼠(Charles River)。对于单一载体
AAV-PHP.BsMecp2-HA-NLS-AsCpf1-spA-tRNAp-3xgRNA,施用1×1012vg/小鼠的剂量。对于AAV-PHP.B双载体中的每一个,施用5×1011vg/小鼠的剂量。
从完整脑组织纯化细胞核
可以如前所述纯化来自AAV1/2注射的海马组织的细胞核。简言之,解剖组织在冰冷均质化缓冲液(HB)(320mM蔗糖、5mM CaCl、3mM Mg(AC)2、10mM Tris pH 7.8、0.1mMEDTA、0.1%NP40、0.1mM PMSF、1mMβ-巯基乙醇)中使用2ml A型和B型Dounce匀浆器(Sigma)进行匀浆。对于梯度离心,可以使用OptiPrepTM密度梯度培养基(Sigma)。将样品在10,100×g(7,500rpm)下在4℃下离心30分钟(Beckman Coulter,SW28转子)。细胞核沉淀再悬浮在65mMβ甘油磷酸(pH 7.0)、2mM MgCl2、25mM KCl、340mM蔗糖和5%甘油中。最后,使用明视场显微镜控制纯化的核的数量和质量。
细胞核的荧光激活细胞分选(FACS)
纯化的细胞核可以用DyeCycleTMRuby Stain(1:500,LifeTechnologies)共标记,并用Beckman Coulter MoFlo Astrios EQ细胞分选仪(BroadInstitute Flow Cytometry Core)分选。将单个和群体(500个核)GFP-KASH+和GFP-KASH-细胞核收集在含有5μl QuickExtract DNA抽提缓冲液(Epicentre)的96孔板中,并在2000×g下旋转2分钟。每个96孔板包括两个空孔作为阴性对照。
基因组DNA抽提和Indel分析
Quick Extract DNA抽提缓冲液(Epicentre)中的DNA可用于靶向的基因组基因座的PCR扩增。以下PCR引物在一个PCR反应中一起使用:Mecp2fw GGTCTCATGTGTGGCACTCA,Mecp2rv
TGTCCAACCTTCAGGCAAGG,Nlgn3fw
GTAACGTCCTGGACACTGTGG,Nlgn3rv
TTGGTCCAATAGGTCATGACG,Drd1fw
TGGCTAAGCCTGGCCAAGAACG,Drd1rv
TCAGGATGAAGGCTGCCTTCGG。根据制造商的方案进行个体靶标的SURVEYOR核酸酶测定(Transgenomics)。如前所述进行条带强度定量(ref)。对于下一代测序(NGS),PCR扩增的靶向区域与Illumina P5接头以及针对靶扩增子的独特样品特异性条形码连接。通过Qubit2.0荧光计(Life Technologies)对条形码化和纯化的DNA样品进行定量,并以等摩尔比合并。然后用Illumina MiSeq Personal Sequencer(Life Technologies)对测序文库进行测序,读取长度为300bp。如前所述分析用于合并的和单个的核的MiSeq读数(ref)。
蛋白质印迹分析
AAV注射的齿状脑回组织在100μl含有0.1%SDS和蛋白酶抑制剂(Roche,Sigma)的冰冷RIPA缓冲液(Cell Signaling)中裂解,并在Bioruptor sonicater(Diagenode)中超声1分钟。使用BCA蛋白测定试剂盒(PierceBiotechnology、Inc.)测定蛋白质浓度,并在还原条件下在4-15%Tris-HCl凝胶(Bio-Rad)上分离蛋白质样品,并使用一抗进行蛋白质印迹分析:小鼠抗HA(Cell Signaling 1:500),小鼠抗GFP(Roche,1:500),兔抗微管蛋白(CellSignaling,1:10,000),然后是二抗小鼠和抗兔HRP抗体(Sigma-Aldrich,1:10,000)。使用Amersham Imager 600对印迹进行成像。
免疫荧光染色
病毒递送3-4周后,按照批准的IACUC方案将小鼠经心脏用PBS灌注随后用PFA灌注。将30μm自由浮动切片(Leica,VT1000S)在柠檬酸钠缓冲液(10mM柠檬酸三钠脱水物、0.05%Tween20,pH 6.0)中煮沸2分钟,并在室温下冷却20分钟。切片用TBST(137mM NaCl、20mM Tris pH 7.6、0.2%Tween-20)中的4%正常山羊血清(NGS)封闭1小时。将一抗在含4%NGS的TBST中稀释,并将切片在4℃孵育过夜。在TBST中洗涤3次后,将样品与二抗在室温下一起孵育1小时。用TBST洗涤3次后,使用包含DAPI的VECTASHIELD HardSet MountingMedium对切片进行封片,并用共聚焦显微镜(Zeiss LSM 710,Ax10ImagerZ2,Zen2012Software)观察。使用以下一抗:小鼠抗NeuN(Millipore,1:50-1:400);鸡抗GFP(Aveslabs,1:200-1:400);兔抗HA(Cell Signaling,1:100)。使用生物素化的抗兔(1:200)然后使用链霉亲和素Alexa568(1:500)(Life Technologies),扩增抗HA信号传导。抗鸡Alexa488和抗小鼠647二抗(Life Technologies)以1:1000使用。
统计分析
所有实验可以用最少两个独立的生物学重复进行。使用Student's双尾t检验,使用Prism6(GraphPad)进行统计。
用于Cpf1体内递送的病毒载体
1.hSyn-HA-NLS-AsCpf1-spA(AsCpf1双载体)
2.sMecp2-HA-NLS-AsCpf1-spA-tRNAp-sgRNA(SapI)(单载体支架)
3.U6p-sgRNA(SapI)-hSyn-GFP-KASH-hGH(双载体支架)
4.U6p-3xsgRNA(Mecp2、Nlgn3、Drd1)-hSyn-GFP-KASH-hGH(3xsgRNA双载体)
5.mMecp2-HA-NLS-AsCpf1-spA-tRNAp-3xsgRNA(Mecp2、Nlgn3、Drd1)(3xsgRNA单载体)
hSyn:人突触蛋白启动子
gtgtctagactgcagagggccctgcgtatgagtgcaagtgggttttaggaccaggatgaggcggggtgggggtgcctacctgacgaccgaccccgacccactggacaagcacccaacccccattccccaaattgcgcatcccctatcagagagggggaggggaaacaggatgcggcgaggcgcgtgcgcactgccagcttcagcaccgcggacagtgccttcgcccccgcctggcggcgcgcgccaccgccgcctcagcactgaaggcgcgctgacgtcactcgccggtcccccgcaaactccccttcccggccaccttggtcgcgtccgcgccgccgccggcccagccggaccgcaccacgcgaggcgcgagataggggggcacgggcgcgaccatctgcgctgcggcgccggcgactcagcgctgcctcagtctgcggtgggcagcggaggagtcgtgtcgtgcctgagagcgcagtcgagaa
sMecp2:短Mecp2启动子(小鼠)
agctgaatggggtccgcctcttttccctgcctaaacagacaggaactcctgccaattgagggcgtcaccgctaaggctccgccccagcctgggctccacaaccaatgaagggtaatctcgacaaagagcaaggggtggggcgcgggcgcgcaggtgcagcagcacacaggctggtcgggagggcggggcgcgacgtctgccgtgcggggtcccggcatcggttgcgcgc
HA:HA-Tag
atgtacccatacgatgttccagattacgct
NLS:核定位序列
tcgccgaagaaaaagcgcaaggtcgaagcgtcc
spA:短聚A信号
aataaaagatctttattttcattagatctgtgtgttggttttttgtgt
tRNAp:tRNA启动子
ggctcgttggtctaggggtatgattctcgcttagggtgcgagaggtcccgggttcaaatcccggacgagccc
pU6:U6启动子
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacacc
sgRNA(SapI):用于间隔子的AsCpf1直接重复和SapI克隆位点
gtaatttctactgttgtagatggaagagcatatatgctcttcttttttt
PCR引物:
AsCpf1NLS-HA-fw
aacacaggaccggtGccAccatgtacccatacgatgttccagattacgcttcgccgaagaaaaagcgcaaggtcgaagcgtccACACAGTTCGAGGGCTTTACCAACCTGTATCAGGTGAGC
AsCpf1-spA-rv
gcggccgcACACAAAAAACCAACACACAGATCTAATGAAAATAAAGATCTTTTATTgaattcttaGTTGCGCAGCTCCTGGATGTAGGCCAGCC
LbCpf1NLS-HA-fw
TACCGGATCCCCGGGTACCGGTATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCAGCAAGCTGGAGAAGTTTACAAACTGCTACTCC
LbCpf1-spA-rv
GCGGCCGCACACAAAAAACCAACACACAGATCTAATGAAAATAAAGATCTTTTATTGAATTCTTAGTGCTTCACGCTGGTCTGGGCGTACTCCAGCCACTCCTTGTTAGAGATGG
基因块(小鼠):
Cpf1小鼠(载体1)Mecp2/Nlgn3/Drd1
cctacgctagcctgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTAATTTCTACTCTTGTAGATCCTGCCTCTGCTGGCTCTGCTAATTTCTACTCTTGTAGATCGGCGGGTCTCAGGGTTGTCTAATTTCTACTCTTGTAGATTGTCCCTGCTTATCCTGTCCTTTTTTcgACGCGT
Cpf1小鼠(载体2)Mecp2/Nlgn3/Drd1
cctacgctagcctgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTAATTTCTACTCTTGTAGATTTCGCCTTCTTAAACTTCAGTAATTTCTACTCTTGTAGATGTGTCCCTATGGTAGGTCCCTAATTTCTACTCTTGTAGATTCATCTCTTTAGCTGTGTCATTTTTTcgACGCGT
基因块(AsCpf1直接重复和SapI克隆位点)
CcctacgctagcctgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTAATTTCTACTCTTGTAGATgaagagcgagctcttcTTTTTTcgACGCGTgt
(粗体表示SapI克隆位点)
前crRNA阵列设计和克隆
将crRNA设计为由直接重复组成的四个寡核苷酸(IDT),每个之后是crRNA(表2)。寡核苷酸通过其粘性末端设计有利于单向退火。将寡核苷酸(终浓度10μM)在10X T4连接酶缓冲液(终浓度1X;NEB)和T4PNK(5单位;NEB)中退火。将热循环仪条件调节至37°30分钟,95°5分钟,然后以-5℃/分钟下降至25°。将退火的寡核苷酸以1:10稀释(终浓度1μM),并在室温下30分钟使用T7DNA连接酶(Enzymatics)连接到BsmBI-cut pcDNA-huCpf1-U6中。将构建体转化到STBL3细菌中并铺板在含氨苄青霉素(100g/ml)的琼脂平板上。在标准LB培养基(Broad Facilities)中生长单菌落16小时。根据QIAquick Spin Miniprep方案(QIAGEN)从细菌中收获质粒DNA。
表1|用于单个和前crRNA阵列表达的Cpf1指导序列
DNMT1 23nt指导 CTGATGGTCCATGTCTGTTACTC
EMX1 23nt指导 TGGTTGCCCACCCTAGTCATTGG
VEGFA 23nt指导 CTAGGAATATTGAAGGGGGCAGG
GRIN2b 23nt指导 GTGCTCAATGAAAGGAGATAAGG
表2|用于阵列克隆的DNA寡核苷酸
实施例2:AsCpf1被有效地递送至大脑并介导编辑
AsCpf1有效地切割原代神经元(图1)。AsCpf1和指导RNA在感染后靶向神经元的细胞核。感染后7天,在三个独立的情况下观察到多重切割。用于AsCpf1递送到小鼠海马中的立体定向AAV1/2注射也显示病毒递送和病毒递送3周后的GFP荧光(图2A)。使用双载体方法将AsCpf1和GFP-KASH全身递送到成年小鼠中在全身尾静脉注射后3周显示免疫染色,因此显示将Syn-GFP-KASH载体递送到各个脑区域的神经元中(图3A)。在全身尾静脉共注射双载体后3周解剖的各个脑区域的下一代测序插入缺失分析显示在三个靶基因座处脑的各个区域的插入缺失。将AAV1/2双载体立体定向注射到成年小鼠海马中通过免疫染色和蛋白质印迹显示病毒递送(图4B-D)。在立体定向注射3周后对GFP+分选的细胞核的下一代测序插入缺失分析显示雄性小鼠中Drd1的单等位基因和双等位基因修饰。Mecp2和Nlgn3是x染色体基因,因此仅编辑一个等位基因(图4E-F)。还显示了多重编辑效率。h)实施例NGS读数显示所有三种靶基因中的插入缺失(图4G)。可以将Cpf1包装到单个AAV中,从而允许在细胞中高效编辑(图5)。使用单个病毒载体确保每个受感染的细胞表达酶和指导RNA。在双载体设计中,细胞需要被至少两种单独的病毒载体感染。(上部)单载体设计。(下部)神经元在细胞核中表达Cpf1,并且Surveyor分析显示指导RNA介导的切割。
参考表3,根据如下描述每个序列元件:
对于以下序列元件,可以根据以下来源找到进一步的细节:对于mMeCP2,http://www.ncbi.nlm.nih.gov/pubmed/21476867。对于tRNA-Pro,http://www.ncbi.nlm.nih.gov/pubmed/26187160,对于EFS,http://science.sciencemag.org/content/343/6166/84.全部;对于MVMI,http://www.ncbi.nlm.nih.gov/pubmed/18059373
表4.对细菌和古细菌基因组中2类CRISPR-Cas系统的全面普查
实施例3
人类遗传变异对于基于CRISPR的治疗性基因组编辑的影响
方法
数据集
我们的靶标变异分析使用来自60,706个全球不同个体的Exome AggregationConsortium(ExAC)数据集进行1。我们对脱靶候选者的研究使用千人基因组计划第3阶段数据集进行,该数据集包含2504个全球不同个体的分阶段全基因组序列2。
全外显子组靶标变异分析
我们包括了人外显子组中用于CRISPR酶SpCas9-WT、SpCas9-VQR、SpCas9-VRER、SaCas9和AsCpf1的所有靶标,其映射到外显子的蛋白质编码区,每个ExAC样品的平均覆盖度为至少20个读数。为了分析这些靶标的变异,如前所述我们包括了ExAC数据集中所有通过质量过滤的错义或同义变体1。因为公开可用的ExAC数据集仅包括每个变体的摘要信息,所以不可能确定在单个基因组靶标中出现的多个变体是否出现在不同的单倍型上。因此,我们将靶标变异频率计算为个体靶标中的变体的最大频率。虽然准确地估计了群体中大多数靶标的变异,但这种方法确实低估了包含存在于不同单倍型上的多个高频变体的稀有靶标的变异频率。铂靶标定义为ExAC群体中最大变异频率小于0.01%的那些。
脱靶候选者分析
包括在千人基因组第3阶段数据集中的分阶段单倍型被用于产生2504个个体的全基因组等位基因特异性参考。如前所述我们在我们的分析中包括了千人基因组第3阶段数据集中通过质量过滤的所有单核苷酸多态性2。每种治疗相关基因,CEP290、CFTR、DMD、G6PC、HBB、IDUA、IL2RG、PCSK9、PDCD1、SERPINA1、TTR、VEGFA的多达100个蛋白质编码铂靶标被选择用于蛋白质SpCas9-WT、SpCas9-VQR、SaCas9和AsCpf1。针对2504个千人基因组个体中的每一个的参照搜索每个基因的靶标,以分析对每个个体特异的脱靶候选者。出于本研究的目的,脱靶候选者被定义为针对特定指导RNA-酶组合的非预期的全基因组靶标,其与指导RNA原型间隔子具有小于或等于3个错配。申请人执行了主成分分析(PCA),考虑到了少于100%的千人基因组个体中存在的所有脱靶候选者。
现在已经发现并工程化了许多RNA指导的CRISPR核酸酶作为基因组编辑的工具,每个具有不同的PAM(Cong,L.等Multiplex Genome Engineering Using CRISPR/CasSystems.Science 339,819–823(2013);Mali,P.等RNA-Guided Human GenomeEngineering via Cas9.Science 339,823–826(2013);Ran,F.A.等In vivo genomeediting using Staphylococcus aureus Cas9.Nature 520,186–191(2015);Kleinstiver,B.P.等Engineered CRISPR-Cas9nucleases with altered PAMspecificities.Nature 523,481–485(2015);Zetsche,B.等Cpf1Is a Single RNA-GuidedEndonuclease of a Class 2CRISPR-Cas System.Cell 163,759–771(2015))(表5)。
表5:
按照等位基因频率的全外显子组PAM变异(%)
表5:对于每种CRISPR核酸内切酶,含有靶标的PAM改变变体的分数(n指定对于每种酶在人外显子组中蛋白质编码靶标的数量)。
对于治疗设计,考虑到具有不同PAM要求的多种酶是有利的,因为它增加了治疗性基因座的可用基因组靶标的数量。因此,我们评估了对于SpCas9(PAM=NGG),SpCas9-VQR(NGA),SpCas9-VRER(NGCG),SaCas9(NNGRRT)和AsCpf1(TTTN),人类外显子组中每个PAM的变异,所有这些目前都是被认为是CRISPR治疗开发的候选酶(最近报道的eSpCas9和SpCas9-HF具有与SpCas9相同的NGG PAM,因此在本文中不单独考虑(Slaymaker,I.M.等Rationally engineered Cas9nucleases with improved specificity.Science 351,84–88(2016);Kleinstiver,B.P.等High-fidelity CRISPR–Cas9nucleases with nodetectable genome-wide off-target effects.Nature 529,490–495(2016)))。对于每种核酸酶,我们确定了改变PAM识别的含有外显子PAM的变体的分数。对于ExAC群体,含有靶标的PAM改变变体的总分数对于所有酶(21-35%)是相似的,除了SpCas9-VRER,其在80%的靶标中受PAM改变变体的影响(表5,图13)。用于SpCas9-VRER的PAM含有CpG基序,已显示其是高度可突变的(Lek等,2016,上文)。与这些结果一致,我们发现CG是人类外显子组中最高度可突变的2-nt PAM基序,并且CpG基序中含有的胞嘧啶和鸟嘌呤残基中的66%显示对于60,706个ExAC个体的变异(Lek等,2016,上文)(图9b,c;表6)。这些结果表明,使用含有CG基序的PAM的酶显著更受人类基因组中靶标变异的影响。
表4:
表6:人外显子组中个体核苷酸(nt)的总残基的分数和含变异的残基的分数。
考虑到对于所有ExAC个体的完全靶标变异,我们发现对于SpCas9、SpCas9-VQR、SaCas9和AsCpf1,人外显子组中93-95%的靶标含有可能改变酶活性的变体(图9d,e;表7)。在ExAC数据集中捕获的大多数(88%)靶标变异是杂合的,突出了这样的事实:这种靶标变异中的大部分是以低频率在群体中出现(图9d,f;表7)。
表5:
按照等位基因频率的全外显子组PAM变异(%)
表7:对于每种CRISPR核酸内切酶,含有靶标变异的靶标的分数(n指定对于每种酶在人外显子组中蛋白质编码靶标的数量)。
ExAC数据集足够大,其提供蛋白质编码基因组中以群体中大于或等于0.01%(10,000个等位基因中的1个)的等位基因频率出现的变体的接近全面覆盖(Lek等2016,上文)。因此,我们使用该数据集编制了SpCas9、Cas9-VQR、SaCas9和AsCpf1的全外显子组靶位点的纲要,其不含以≥0.01%等位基因频率出现的变体(称为铂靶标;将在线提供)(图10a)。这些铂靶标在>99.99%的群体中是有效的(图10b)。为了进一步分析,我们关注12种治疗相关基因,包括目前是治疗开发焦点的那些(参见图14,包括基因概述)。对于这些基因,大约三分之二的可能的蛋白质编码靶标符合我们的铂标准,PCSK9含有最小分数的符合我们的铂标准的靶标(50%)(表8)。
表8:
12个治疗相关基因的铂靶标和非铂靶标的数量
虽然优选设计对个体患者特异性的RNA指导,但从监管角度来看这可能是具有挑战性的并且成本过高。在治疗设计期间从这些铂靶作出选择将使在具有最少数量的RNA指导的患者群体中的功效最大化。当靶向具有多于一种高频单倍型的区域时,有必要为每个独立的单倍型设计多个RNA指导。
我们发现,对于所检测的12个基因中的每一个,高变异靶标或铂靶标沿着外显子成簇。例如,PCSK9外显子4的5’半部中的所有靶标都是铂,而对外显子5存在极少的铂靶标(图10c)。即使对于具有高变异频率的PCSK9外显子1-4区域,仍然可以找到用于一些酶的少量铂靶标(图10c)。PCSK9的这一观察结果代表了本研究中调查的其他基因,并表明考虑具有不同PAM要求的多种酶增加了发现铂靶标的可能性。
当设计RNA指导时,除了使靶标变异最小化之外,还有必要通过最小化由于基因组中与靶标相似的位点引起的潜在脱靶活性来确保安全性。全基因组CRISPR核酸酶活性的无偏调查表明,大多数的脱靶活性发生在与RNA指导至多三个错配的基因座处12,18,19,20,8,21,22,23。用于Cas9靶标选择的当前方法通过RNA指导错配的数量和位置两者,对在参照人类基因组中发现的脱靶候选者进行排序,假设含有少于3个错配或含有PAM远端错配的基因座更有可能被切割12,13,14。然而,在个体的群体中,这种策略由于存在多个单倍型(相关变体的组)而变得复杂,其将在候选脱靶位点处含有不同位置或数量的错配(图11a)。我们使用分阶段的单核苷酸变体调用以重建千人基因组群体中的每个个体的等位基因特异性全基因组序列24。对于本文考虑的12个基因中的铂靶标,我们量化了由所有千人基因组单倍型引起的脱靶候选者(定义为与给定RNA指导最多三个错配的基因组基因座)。在这个相对小的群体(2504个个体)中,超过一半的含有单倍型的脱靶候选者是常见的(存在于≥10%的个体中)(图11b)。然而,在该群体中,每个RNA指导的脱靶候选者的数量与单倍型频率反向相关(图11b)。这一趋势表明,对于大群体,给定RNA指导的脱靶候选者中的大多数将在个体之间不同。
对于这12个基因中的个体RNA指导,我们发现在千人基因组群体中SpCas9、SpCas9-VQR、SaCas9和AsCpf1的脱靶候选者的数量从0变化到大于10,000(图11c)。脱靶数量的这种大的变化中的大部分反映了个体靶序列在人类基因组内有多独特或重复。例如,具有更长PAM并因此具有更少基因组靶标的SaCas9每个RNA指导具有平均更少的脱靶候选者(图11c)。另外,在群体中,给定基因座处的脱靶候选者的数量进一步被多个单倍型加重,使得随着群体大小增加,个体脱靶基因座的单倍型的数量也增加。因此,对于以高频单倍型存在的每个脱靶候选者,在大群体中,多个较低频率的单倍型可能存在,RNA指导错配数量减少。这些数据表明最小化以高频单倍型出现的脱靶候选者的数量对于选择治疗性RNA指导至关重要。通过最小化这些高频单倍型的脱靶候选者,将同样最小化以低频单倍型出现的独特地影响个体或少数患者的脱靶候选者。目前的千人基因组数据集提供了在群体中以至多0.1%出现的等位基因(被认为是高频变体的下界)的全面覆盖,允许我们鉴定具有人类群体中以高频单倍型出现的最少脱靶候选者的铂靶标24,4
在我们考虑的12个基因中,一些相对于其余的人类基因组更加重复,其影响每个基因的潜在RNA指导的特异性(图12a)。例如,在PCSK9外显子2-5中,我们观察到具有高或低数量的脱靶候选者的铂靶标分别倾向于在基因组内重复或独特的序列区域中成簇(图12b)。这种模式适用于研究的所有12个基因。有趣的是,在外显子的重复区域内,我们鉴定了具有数量显著减少的脱靶候选者的铂靶标。这些发现进一步支持了这样的见解:使用具有不同PAM要求的多种酶将增强安全性和功效两者。增强的特异性酶eSpCas9和Cas9-HF1的使用将进一步降低在脱靶候选位点处切割的可能性,但是即使使用这些酶,避免具有大量脱靶候选者的重复治疗性靶标仍然是重要的16,17
因为千人基因组项目提供了每个个体的人口统计信息,所以我们使用该数据来探索给定个体的多少脱靶候选变异是由群体人口统计学解释。对于靶向本文考虑的12个基因的RNA指导的所有脱靶候选者,我们进行了主成分分析(PCA),并发现前五个主成分非常有效地将个体按照大陆、次大陆和性别分开(图12c,图15-17)分开。累积地,群体人口统计学解释给定个体的脱靶候选者的12%,表明通过设计特定地理或基因型患者亚群体的治疗性靶标可以增强治疗剂的安全性和功效。
在本文中,我们确定了群体基因变异对使用化脓链球菌(Sp)Cas9、SpCas9变体VQR和VRER、金黄色葡萄球菌(Sa)Cas9和氨基酸球菌属(As)Cpf1的治疗性基因组编辑的影响1,2,8,9,3。我们发现广泛变异可能大大改变这些酶的功效,并且我们显示独特的患者特异性的脱靶候选者将是对安全性的最大挑战。这些结果为设计基于CRISPR的治疗剂提供了框架,强调了为每个靶基因座开发多个指导RNA-酶对的需要,并表示治疗前全基因组测序将是确保跨患者群体的治疗的统一功效和安全性所需要的。
实施例:AsCpf1PAM识别的定向进化
Cpf1是2类V型CRISPR效应子。它是单RNA指导的核酸内切酶,通过交错的双链断裂切割DNA。多重基因组编辑是有效的。Cpf1切割PAM的远端:下游18和23bp(Zetsche等(2015)Cell;163:759-771)。
野生型AsCpf1(例如AsCpf1和LbCpf1)识别PAM序列TTTV(其中V是A、C或G)。
替代的PAM序列将拓展PAM谱系,并因此扩展可能的靶序列的量。此外,较短的PAM序列同样允许增加可能的靶序列的量。人类基因组含有41%GC、59%AT(29.5%T)。一排3个T的可能性=0.0257(2.57%)。大约每40个碱基将遇到TTT。一排4个T的可能性为0.00758。因此,在任何给定的基因组起始位置,TTTV的可能性为1.81%。大约每55个碱基就可以遇到TTTV。
通过AsCpf1(氨基酸球菌物种BV3L6,UniProtKB/Swiss-Prot登录号U2UMQ6.1;genbank登录号961512548)的诱变,拓展了PAM识别。当与DNA结合时,Cpf1的PI(PAM相互作用)和REC1结构域与PAM序列非常接近。生成整个PAM近端区域中的点突变并评估替代的PAM识别。产生突变Cpf1文库,其中不同的Cpf1突变体在能够在大肠杆菌中表达的CamR质粒(pACYS Cpf1质粒)上编码。质粒还含有侧翼为直接重复的间隔子序列,用于重构能够结合DNA靶基因座的功能性CPRISPR/Cpf1复合物。将文库在大肠杆菌中转化以产生含有Cpf1突变体文库的大肠杆菌。
包含侧翼为PAM序列的靶序列并且进一步包含AmpR标志物的第二质粒转化至突变Cpf1大肠杆菌文库中。这是针对大量替代PAM序列而平行进行的。
文库复杂性为32、256(84个位置*32个密码子*12个PAM)
在Cam/Amp培养基上的选择允许鉴定被特定Cpf1突变体识别的替代PAM序列。如果PAM序列被特定的Cpf1突变体识别,则切割含有AmpR的质粒并丧失Amp抗性。因此,文库成员的特定缺失识别出特定的PAM序列。对包含Cpf1突变体并且在筛选中耗尽的质粒的测序鉴定了识别替代PAM序列的特定Cpf1突变体。
将以上描述的方法用野生型AsCpf1(图18)验证。证实了野生型AsCpf1(TTTC)识别的PAM序列确实不能维持在Cam/Amp培养基上的细菌生长。
然后将上述方法应用到突变AsCpf1文库。作为对照,在没有PAM序列的筛选中,不同Cpf1突变体的表现表明特定突变体没有显著的过量或不足,而在具有被野生型Cpf1识别的PAM序列的筛选中不同的Cpf1突变体的表现表明显著不足(或野生型Cpf1的耗尽)。用于各种替代PAM序列的不同Cpf1突变体的表现显示于图18C。从图18C,明显的是各种Cpf1突变体识别非经典PAM序列。
观察到,具有S542R突变的AsCpf1突变体能够识别至少PAM序列TCCC。此外,具有S542R的AsCpf1突变体能够识别至少PAM序列TTCC。突变S542R允许识别TCCC和TTCC(允许在PAM的第3位置处的C)。
具有各种K548突变的AsCpf1突变体能够至少识别PAM序列TATC。至少突变体K548A、K548G、K548L、K548R、K548I、K548N、K548C、K548Q、K548H、K548F、K548S、K548T、K548W、K548Y、K548V能够识别PAM序列TATC。具有各种K548突变的AsCpf1突变体能够至少识别PAM序列TGTC。至少突变体K548G、K548R、K548C、K548Q、K548H、K548S、K548T、K548W、K548Y、K548V能够识别PAM序列TGTC。K548为PAM的第二碱基提供胸腺嘧啶严格性。许多替代aa允许识别TATC或TGTC PAM。
鉴定了另外的AsCpf1突变体(数据未显示),其识别另外的替代PAM序列:167A(识别NTTV或TTV)、604A(识别TTTV)、607A(识别TCCC)。
进行体外切割实验(基本上如Zetsche等(2015),Cell 163:1-13中所述),其中来自表达AsCpf1的哺乳动物细胞的裂解物在试管中与在靶位点之前含有8bp随机化PAM的质粒文库一起温育。包含可靶向PAM的PAM文库的成员被切割,而所有其他PAM保持完整。对未切割的PAM进行测序并与阴性对照进行比较。相对于对照,耗尽的PAM表示Cpf1可以切割的那些-图21中显示了耗尽的PAM序列的集合组的序列标志。
基于Cpf1蛋白的结构考虑及其与gRNA和靶序列的相互作用,发现AsCpf1(氨基酸球菌物种BV3L6)的以下氨基酸残基与PAM序列物理邻近(即在PAM的1.4nm内):Y11、Q12、V13、S14、K15、T16、L17、Q34、F36、E39、D40、R43、H46、Y47、L50、I54、I57、Y58、I111、A126、E127、I128、Y129、K130,G131、L132、F133、K134、A135、E136、A157、L158、L159、R160、S161、F162、D163、K164、F165、T166、T167、Y168、F169、S170、G171、F172、Y173、E174、N175,R176、K177、N178、K532、L533、N534、F535、Q536、M537、P538、T539、L540、A541、S542、G543、W544、D545、V546、N547、K548、E549、K550、N551、N552、G553,A554、I555、L556、L565、G566、I567、M568、P569,K570、Q571、K572、G573、R574、Y575、K592、M593、Y594、Y595、D596、Y597、F598、P599、D600、A601、A602、K603、M604、I605、P606、K607、C608、S609、T610,Q611、L612、K613、A614、V615、T616、A617、H618、F619、Q620、I626、L627、L628、S629、N630、N631、F632、I633、E634、P635、L636、E637、I638、I642、Y643,D644、L645、N646、N647、P648、E649、E651、P652、K653、K654、F655、Q656、W676、F679、T680、D682、F683、L684、S685、K686、Y687、T688、K689、T690、T691,S692、I693、L707、Y711、L714、N715、P716、L717、L718、Y719、H720、I721、S722、K739、W765、L768、F769、N773、T777、S778、I779、K780、L781、N782、G783,Q784、A785、E786、F871、H872、V873、P874、I875、T876、L877、N878、Y879、Q880、A881、A882、N883、S884和Q1048。
预期这些残基中的一个或多个突变影响PAM识别。
以下氨基酸残基被选择用于诱变,并因此导致使所指示的氨基酸残基突变的突变的Cpf1蛋白:K130、G131、L132、F133、K134、A135、E136、F162、D163、K164、F165,T166、T167、Y168、F169、S170、G171、F172、Y173、E174、N175、R176、K177、Q536、M537、P538、T539、L540、A541、S542、G543、W544、D545、V546、N547、K548,E549、K550、N551、N552、K570、Q571、K572、G573、Y595、D596、Y597、F598、P599、D600、A601、A602、K603、M604、I605、P606、K607、C608、S609、T610、Q611,L612、K613、A614、V615、N630、N631、F632、N646、N647、P648、E649、K650、E651、P652、K653、F683、L684、S685、K686、Y687、T688、K689或T690。
在使用AsCpf1突变体文库的细菌PAM筛选中筛选以下PAM序列:TATC、TGTC、TATT、TTCC、TCCC、TTAC、TCTT和TTGC。
下表显示发现的与指定的突变体(AsCpf1)相关的PAM序列,如在细菌PAM筛选中所鉴定的(中间栏),从其假定推定的PAM(右栏)。至少所示的PAM序列被指定的突变体识别。以粗体表示的是已产生和测试的突变体。基于结构考虑以及所产生的突变体的PAM序列的知识,假定其他突变体的PAM序列。
为了评估全局PAM偏好,将包含S542R/K607R(下文称“RR”)、S542R/K548V(下文称“RV”)和S542R/K548V/N552R(下文称“RVR”)的变体通过体外PAM鉴定测试与野生型进行比较。将来自表达AsCpf1(或变体)的HEK293细胞的细胞裂解物与体外转录的crRNA和含有前面是简并序列的恒定靶标(5’-NNNNNNNN-靶标)的质粒DNA文库一起孵育。对于每个Cpf1变体,进行10次重复的切割反应,每次孵育不同的时间,以确定切割动力学。
WT AsCpf1在TTTV的PAM处最具有活性(图21A),在NTTV、TCTV、TTCV和TTTT观察到低切割率,与在HEK293细胞中观察一致。
图21显示了在体外切割测定中确定的用于S542R/K607R(“RR”)AsCpf1突变体的(N)YCV,例如TYCV、VYCV,或YCV PAM序列的验证。类似地,体外切割测定验证用于AsCpf1突变体S542R/K548V的PAM序列为AYV、TYV和TGYV。还发现该突变体识别经典PAM TTTV具有比野生型AsCpf1更高的效率,但具有降低的特异性。图21A显示野生型和RR和RVR变体对所有4-碱基PAM基序的标准化切割率。RVR变体在TATV PAM具有最高活性,相比之下野生型对该PAM的活性很小或没有。这些PAM增加了Cpf1在人类基因组的非重复区域中的靶向范围(图21B)并且减小了不可被靶向的基因组DNA段的大小(图21C)。
实施例5-截断的指导。
每孔用400ng AS或LbCpf1编码质粒和100ng U6::crRNA PCR片段在24孔板中转染HEK293FT细胞。使用靶向DNMT1-3或DNMT1-4、长度在24nt(全长)和14nt(从3’末端截短)之间的指导。长度为24nt至19nt的指导展示了与酶两者相似的活性。使用18nt指导略微降低了活性,并且使用17nt至15nt的指导进一步降低了活性。使用少于15nt的指导观察到很少或没有活性(图19B-E)。
实施例6-部分结合指导。
每孔用400ng AS或LbCpf1编码质粒和100ng U6::crRNA PCR片段在24孔板中转染HEK293FT细胞。使用靶向DNMT1-3或DNMT1-4、全长24nt的指导。匹配核苷酸的数量从24nt(全长)到14nt不等,匹配的核苷酸最接近PAM,并且非匹配的核苷酸在3’端。
匹配24nt至19nt的指导展示了与酶两者相似的活性。使用匹配18nt的指导略微降低了活性。匹配17nt至15nt的指导表现出很少或没有可检测的活性。对于匹配少于15nt的指导,活性不可检测。(图20B-E)。
实施例7-在哺乳动物细胞中验证Cpf1突变体。
将不同的Cpf1突变体(氨基酸球菌物种BV3L6,基本上如Zetsche等(2015),Cell,163:759-771中所述)克隆到真核表达载体中(作为实例,在图25中提供用于评估具有S542/K607R突变的AsCpf1的表达载体;相似的表达载体设计用于其他Cpf1突变体)并在HEK293T细胞中转染,并且基于插入缺失百分比的检测来评估基因组编辑。产生以下Cpf1突变体,并包含单个或多个点突变(即单个或多个氨基酸突变)。表中还显示了测试的PAM序列和围绕并包括所记载的氨基酸突变的Cpf1核酸序列(从位置539至552)。
对应于图22中指示的靶序列号的靶序列在下表中指出(不是对于每个靶序列,结果显示在图22中)。
对于与多种PAM序列相关的靶序列(在DNMT1基因内选择指导RNA靶位点),如图22所示或与指定的相关的不同靶基因的多种靶序列,评估在HEK细胞中的插入缺失活性%。
RR和RVR变体在HEK293细胞中在它们的优选PAM处进行比较(图23),并在所评估的四种基因(CFTR、DNMT1、EMX1和VEGFA)中介导稳健的编辑。特别地,关于RR,14/16(88%)的TYCV靶位点具有>20%的插入缺失(相比于WT的3/16),关于RVR,10/13(77%)的TATV靶位点具有>20%的插入缺失(相比于WT的0/13)。此外,RR变体在VYCV靶位点处也具有显著活性(对于25/37(68%)的位点,具有>20%的插入缺失)(图23),尽管该活性略低于在TYCV位点处,与体外切割试验一致。还在鼠Neuro2a细胞中测试了RR变体(图23C)并且观察到高编辑率(对于7/9TYCV或CCCC位点,>20%的插入缺失)。
如图24中所示的用于AsCpf1S542R/K607R突变体的YCN PAM序列。将所示Cpf1突变体的插入缺失%与野生型Cpf1或阴性对照(无Cpf1转染)的插入缺失%进行比较。
图24的不同靶序列和靶基因如下表所示,以及侧翼PAM序列,导致对于S542R/K607R突变体的一致PAM序列YCN。
使用BLISS(双链断裂原位标记和测序)评估RR和RVR变体的全基因组编辑特异性,其定量基因组中的DNA双链断裂(DSB)。为了将变体与野生型进行比较,分析限于携带可被所有三种酶可靠地切割的PAM的靶位点;TTTV是唯一符合此标准的PAM,尽管它对RR变体的活性较低。对于评估的四个靶位点中的三个(VEGFA、GRIN2B和DNMT1),对于WT或变体,没有从任一BLISS鉴定的基因座的深度测序检测到的脱靶活性(图27a)。对于第四个靶位点(EMX1),BLISS鉴定了6个具有可检测插入缺失的脱靶位点;所有6个位点都有TTCA PAM,并且在指导的前19bp中不超过一个错配。这两种变体与野生型相比在这些脱靶位点具有增加的活性,这与它们增加的识别TTCA PAM的能力一致。另一方面,当靶向具有已知TTTV脱靶位点的不同位点时,变体表现出降低的脱靶活性(图27b),这也与PAM偏好一致。总的来说,这些结果表明变体保留了与WT AsCpf1相当的高水平编辑特异性。
测试了是否可通过去除非特异性接触(例如在带正电荷或极性残基与靶DNA之间)来改善特异性。位于假设与非靶DNA链相互作用的蛋白质的裂缝中的K949A与RR和RVR变体组合进行测试,K949A减少了在评估的所有脱靶位点处的切割,同时保持高水平的中靶活性(图27C)。
因为Cpf1家族酶具有强序列和结构同源性,AsCpf1中的S542、K548、N552和K607位置在其他Cpf1直系同源物中具有毫无疑义的对应。基于晶体结构,可以类似地对LbCpf1进行工程化以识别TYCV/CCCC和TATV PAM,例如分别通过突变G532R/K595R和G532R/K538V/Y542R。
在293FT细胞中的Cpf1切割活性
针对人表达作出密码子优化的Cpf1蛋白被合成为具有N-末端核定位标签并克隆到GenScript的pcDNA3.1CMV表达质粒。使用Herculase II(Agilent Technologies)产生包含驱动crRNA序列表达的U6启动子的PCR扩增子。使用Lipofectamine 2000试剂(LifeTechnologies)将400ng Cpf1表达质粒和100ng crRNA PCR产物转染到24孔板中的75-90%汇合度的HEK293FT细胞。使用QuickExtractTM DNA Extraction Solution(Epicentre)收获基因组DNA。
深度测序以表征293FT细胞中的Cpf1插入缺失模式
如所述转染并收获HEK293FT细胞以评估Cpf1切割的活性。使用双轮PCR区域扩增侧翼为DNMT1靶标的基因组区域,以将Illumina P5接头以及独特样品特异性条形码添加至靶扩增子。PCR产物在2%E-凝胶(Invitrogen)跑胶,使用Qiaquick Spin Column(Qiagen)按照制造商推荐的方案进行凝胶抽提。合并样品并通过Qubit 2.0荧光计(LifeTechnologies)定量。将制备的cDNA文库在MiSeq(Illumina)上测序。使用Geneious6.0.3Read Mapper的Python实施来映射插入缺失。
实施例8:示例性脂质颗粒
本发明的脂质颗粒可以如下制备。使用N,N'-二甲基丙烷-1,3-二胺和丙烯酸2-(癸基二磺酰基)乙酯制备化合物80-O14B。在5-mL Teflon衬里玻璃螺旋盖小瓶中,将具有二硫键的丙烯酸酯以2.4:1的摩尔比添加到胺中。将混合物在90℃下搅拌两天。冷却后,形成的脂质样化合物可以不经纯化而使用,或使用硅胶快速色谱法纯化。制备的化合物任选地以质子核磁共振表征。
将上面制备的脂质体样化合物溶解在1mg/mL浓度的乙酸钠溶液(25mM,pH=5.5)。任选地,还包含胆固醇和1,2-二油酰基-sn-甘油基-3-磷酸乙醇胺(“DOPE”)。
包含纯合成脂质或合成脂质与赋形剂(例如胆固醇、聚乙二醇化脂质或DOPE)组合的合成脂质纳米颗粒以特定浓度(例如,0.1mg/ml-2mg/ml)与病毒颗粒混合(例如,AAV病毒颗粒)。在典型的实验中,AAV浓度为109AAV/μg脂质纳米颗粒。混合后,将混合物在室温下放置15分钟。在成像之前,使用涡旋混合样品1分钟。
在一个实施方式中,将包含AAV衣壳或衣壳亚基蛋白的AAV组合物导入所得混合物中并在室温下温育15分钟。(AAV衣壳和衣壳亚基蛋白可以是野生型衣壳亚基或进一步含有包含异源蛋白质或肽的杂合AAV衣壳亚基。)脂质样化合物和AVV组分之间的重量比是变化的,例如5:1、10:1、20:1或50:1。由此制备的复合组合物可以在细胞中使用。
实施例9:杂合AAV-脂质颗粒
杂合AAV-脂质颗粒通过混合AAV8载体与包封纯化的带负超电荷的CRE重组蛋白的脂质纳米颗粒(109个AAV病毒粒子/μg脂质)而配制。杂合AAV-脂质颗粒用于感染HEK293T细胞。使用针对CRE活性的DsRed报告体,在转染后48小时,将通过杂合AAV-脂质颗粒进行的CRE的蛋白质递送与脂质-CRE制剂进行比较(图44)。
实施例10:AAV/脂质纳米复合物的颗粒尺寸直径的测定
AAV/脂质纳米复合物的直径可以通过使用透射电子显微镜(TEM)对复合物成像来测定。参见图32、33、34、38。
***
虽然本文已经显示和描述了本发明的优选实施方式,但是对于本领域技术人员显而易见的是这样的实施方式仅以举例的方式提供。在不脱离本发明的情况下,本领域技术人员现在将想到许多变化、改变和置换。应理解,本文所述的本发明实施方式的各种替代方案可用于实施本发明。旨在以下权利要求限定本发明的范围,并且由此覆盖这些权利要求及其等同方式范围内的方法和结构。

Claims (182)

1.一种工程化CRISPR-Cas效应蛋白,其中所述蛋白质与核酸分子复合以形成CRISPR复合物,所述核酸分子包含指导序列,其中在所述CRISPR复合物中,所述核酸分子靶向一个或多个多核苷酸基因座,并且所述蛋白质相对于未修饰的蛋白质包含至少一个修饰,所述修饰使与野生型相比,所述CRISPR复合物与结合位点的结合增强和/或改变编辑偏好。
2.根据权利要求1所述的工程化CRISPR-Cas效应蛋白,其中所述编辑偏好是用于插入缺失信息。
3.根据权利要求1或2所述的工程化CRISPR-Cas效应蛋白,其中所述至少一个修饰使一个或多个特定插入缺失的形成增加。
4.根据权利要求3所述的工程化CRISPR-Cas效应蛋白,其中所述CRISPR-Cas效应蛋白为V型CRISPR-Cas效应蛋白。
5.根据权利要求4所述的工程化CRISPR-Cas效应蛋白,其中所述V型CRISPR-Cas效应蛋白是Cpf1或其直系同源物。
6.根据权利要求5所述的工程化CRISPR-Cas效应蛋白,其中所述至少一个修饰位于C-末端RuvC样结构域、N-末端α-螺旋区、混合α和β区或其组合。
7.根据权利要求6所述的工程化CRISPR-Cas效应蛋白,其中所述至少一个修饰导致在靶区域中邻近A、T、G或C插入A,在所述靶区域中邻近A、T、G或C插入T,邻近A、T、G或C插入G,邻近A、T、C或G插入C,或其组合。
8.根据权利要求1所述的工程化CRISPR-Cas效应蛋白,其还包含至少一个额外突变,所述额外突变改变所述效应蛋白对包含所述指导序列的所述核酸分子或所述靶多核苷酸基因座的结合特性,改变对所述核酸分子或靶多核苷酸的结合动力学,或改变对所述核酸分子的结合特异性。
9.一种用于修饰感兴趣的靶基因座的工程化系统,其包括:
(a)指导分子,其包含指导序列,或编码指导分子的核苷酸;和
(b)根据前述权利要求中任一项所述的CRISPR-Cas效应子,或编码所述CRISPR-Cas效应蛋白的核苷酸。
10.根据权利要求9所述的系统,其中组分(a)和(b)被编码在相同或不同的载体上。
11.一种用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法,所述方法包括:
任选地,选择一种或多种治疗性靶标,
任选地,选择一种或多种CRISPR-Cas系统功能,
任选地,选择一种或多种CRISPR-Cas系统递送模式,
任选地,选择一种或多种CRISPR-Cas系统递送载体或表达系统,和
对选择的与所述CRISPR-Cas系统和/或其功能相关的参数或变量进行优化,
其中对特异性、功效和/或安全性进行优化。
12.根据权利要求11所述的方法,其中所述选择的参数或变量选自包括以下的组:CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度、CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性、CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应蛋白尺寸、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
13.根据权利要求11或12所述的方法,
其中对特异性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度,
其中对功效进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、CRISPR效应蛋白尺寸、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性,和
其中对安全性进行优化包括优化一个或多个参数或变量,所述参数或变量选自CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
14.根据权利要求11-13中任一项所述的方法,其中对选择的与所述CRISPR-Cas系统和/或其功能相关的参数或变量进行优化取决于一种或多种治疗性靶标,基于CRISPR-Cas系统的治疗性靶标调节、修饰或操控的模式或类型,和/或CRISPR-Cas系统组分的递送。
15.根据权利要求11-14中任一项所述的方法,其中所述治疗性靶标是单个基因、基因座或其他基因组位点,或者多个基因、基因座或其他基因组位点。
16.根据权利要求11-15中任一项所述的方法,其中所述基于CRISPR-Cas系统的疗法或治疗剂涉及
靶标破坏,例如靶标突变,例如导致基因敲除,
特定靶位点的替换,例如导致靶标校正,
特定靶位点的移除,例如导致靶标缺失,和/或
靶位点功能的调节,例如靶位点活性或可及性,任选地导致(转录的和/或表观遗传的)基因或基因组区域激活或者基因或基因组区域沉默。
17.根据权利要求11-16中任一项所述的方法,其中所述CRISPR-Cas系统功能包括
基因组突变,例如单基因组突变或多基因组突变,
基因敲除,例如单基因敲除或多基因敲除,
基因校正,例如单基因校正或多基因校正,
基因组区域缺失,例如单基因组区域缺失或多基因组区域缺失,和/或
基因或基因组区域功能,例如单或多基因或基因组区域活性。
18.根据权利要求11-17中任一项所述的方法,所述递送模式包括
递送gRNA和/或CRISPR效应蛋白,
递送gRNA和/或CRISPR效应子mRNA,或
递送gRNA和/或作为基于DNA的表达系统的CRISPR效应子。
19.根据权利要求11-18中任一项所述的方法,其中所述递送载体和/或表达系统包括脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统,任选地腺病毒、AAV或慢病毒表达/递送系统。
20.根据权利要求11-19中任一项所述的方法,其中
CRISPR效应子特异性是通过选择最特异性的CRISPR效应子来优化,例如通过选择最特异性的CRISPR效应子直系同源物或通过增加特异性的特定CRISPR效应子突变,
gRNA特异性是通过选择最特异性的gRNA来优化,例如通过选择具有低同源性的gRNA,即至少一个或优选多个,例如至少2个,或优选至少3个与脱靶位点的错配,
PAM限制性是通过选择具有最限制性的PAM识别的CRISPR效应子来优化,例如通过选择具有更限制性的PAM识别的CRISPR效应子直系同源物或通过增加或改变PAM限制性的特定CRISPR效应子突变,
CRISPR效应子活性是通过选择最具有活性的CRISPR效应子来优化,例如通过选择最具有活性的CRISPR效应子直系同源物或通过增加活性的特定CRISPR效应子突变,
gRNA活性是通过选择最具有活性的gRNA来优化,例如通过通过RNA修饰增加gRNA稳定性,
靶位点选择是通过选择基因、基因座或其他基因组区域内的靶位点的最佳位置来优化,例如通过选择具有群体内的低变异性例如多态性的早期和/或保守外显子或结构域中的靶位点,或通过最小化脱靶效应,例如脱靶限定为与靶标相比具有1-5、1-4或优选1-3个错配,优选还考虑群体内的变异性,
CRISPR效应子稳定性是通过选择具有合适半衰期,例如优选短半衰期,同时仍能够保持足够活性的CRISPR效应子来优化,例如通过选择具有特定半衰期的合适的CRISPR效应子直系同源物或通过影响半衰期或稳定性的特定CRISPR效应子突变或修饰,例如包括稳定或去稳定结构域或序列,
CRISPR效应子mRNA稳定性是通过增加或减少CRISPR效应子mRNA稳定性来优化,例如通过通过mRNA修饰增加或减少CRISPR效应子mRNA稳定性,
gRNA稳定性是通过增加或减少gRNA稳定性来优化,例如通过通过RNA修饰增加或减少gRNA稳定性,
CRISPR效应蛋白或mRNA免疫原性或毒性是通过降低CRISPR效应蛋白或mRNA免疫原性或毒性来优化,例如通过mRNA或蛋白质修饰,
gRNA免疫原性或毒性是通过降低gRNA免疫原性或毒性来优化,例如通过gRNA修饰,
CRISPR效应蛋白或mRNA剂量或滴度是通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化,
gRNA剂量或滴度是通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化,
CRISPR效应蛋白尺寸是通过选择最小的蛋白质尺寸以提高递送效率来优化,特别是对于病毒介导的递送,
CRISPR效应子、gRNA和/或CRISPR-Cas复合物表达水平是通过限制或延长表达持续时间和/或限制或增加表达水平来优化,例如通过使用自失活CRISPR-Cas系统,例如包括自靶向gRNA,通过使用具有有限的表达持续时间的病毒载体,通过使用用于低或高表达水平的合适启动子,通过组合用于个体CRISP-Cas系统组分的不同递送方法,例如病毒介导的CRISPR效应子编码核酸递送与非病毒介导的gRNA递送组合,或病毒介导的gRNA递送与非病毒介导的CRISPR效应蛋白或mRNA递送组合,和
CRISPR效应子、gRNA或CRISPR-Cas复合物时空表达是通过对条件型和/或诱导型表达系统的合适选择来优化,包括可控的CRISPR效应子活性、任选地去稳定的CRISPR效应子,和/或分裂的CRISPR效应子,和/或细胞或组织特异性表达系统。
21.根据权利要求11-20中任一项所述的方法,其中对选择的与所述CRISPR-Cas系统和/或其功能相关的参数或变量进行优化取决于所述治疗性靶标的选择、所述CRISPR-Cas系统功能、所述CRISPR-Cas系统递送模式和/或所述CRISPR-Cas系统递送载体或表达系统。
22.根据权利要求11-21中任一项所述的方法,其中在靶生物的群体水平上优化gRNA特异性。
23.根据权利要求22所述的方法,其中对gRNA特异性进行优化包括使群体中的gRNA靶位点序列变异最小化和/或使群体中的gRNA脱靶发生率最小化。
24.根据权利要求22或23所述的方法,其包括:
(a)针对感兴趣的治疗性基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,和
从所述选择的靶位点中(亚)选择靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,
(b)针对感兴趣的治疗性基因座选择gRNA靶位点,其中所述靶位点具有在群体中最小的序列变异,或
针对感兴趣的治疗性基因座选择gRNA靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,
任选地估计治疗群体所需要的(亚)选择的靶位点的数量,
任选地针对个体受试者验证所述(亚)选择的靶位点中的一个或多个,
任选地设计识别所述(亚)选择的靶位点中的一个或多个的一种或多种gRNA。
25.一种用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂或者用于开发或设计用于基于CRISPR-Cas系统的疗法或治疗剂的gRNA的方法,其包括
(a)针对感兴趣的治疗性基因座选择gRNA靶位点,其中所述靶位点具有在靶生物群体中最小的序列变异,和
从所述选择的靶位点中(亚)选择一个或多个靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,
(b)针对感兴趣的治疗性基因座选择gRNA靶位点,其中所述靶位点具有在靶生物群体中最小的序列变异,或
针对感兴趣的治疗性基因座选择gRNA靶位点,其中针对所述靶位点导向的gRNA识别所述群体中最小数量的脱靶位点,
任选地估计治疗群体所需要的(亚)选择的靶位点的数量,
任选地针对个体受试者验证所述(亚)选择的靶位点中的一个或多个,
任选地设计识别所述(亚)选择的靶位点中的一个或多个的一种或多种gRNA。
26.根据权利要求25所述的方法,其中所述方法是在靶生物群体中,用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂或者用于开发或设计用于基于CRISPR-Cas系统的疗法或治疗剂的gRNA的方法。
27.根据权利要求22-26中任一项所述的方法,其中具有在群体中最小的序列变异的所述靶位点的特征在于在所述群体的至少99%,优选至少99.9%,更优选至少99.99%中不存在序列变异。
28.根据权利要求22-27中任一项所述的方法,其中所述群体包括至少1000个个体,例如至少5000个个体,例如至少10000个个体,例如至少50000个个体。
29.根据权利要求22-28中任一项所述的方法,其中所述脱靶位点的特征在于所述脱靶位点和所述gRNA之间的至少一个错配,和/或所述脱靶位点的特征在于所述脱靶位点和所述gRNA之间的最多5个,优选最多4个,更优选最多3个错配,优选两者。
30.根据权利要求22-29中任一项所述的方法,其中针对所述群体中的高频单倍型确定所述群体中的脱靶位点的所述最小数量。
31.根据权利要求30所述的方法,其中所述高频单倍型的特征在于在所述群体的至少0.1%中出现。
32.根据权利要求22至31中任一项所述的方法,其中(亚)选择的变异的数量,例如在大规模测序数据集中捕获的低频序列变异。
33.根据权利要求22-32中任一项所述的方法,其中估计治疗给定大小的群体所需要的(亚)选择的靶位点的数量。
34.根据权利要求22-33中任一项所述的方法,其中通过基因组测序,优选全基因组测序,验证所述(亚)选择的靶标。
35.一种用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法,其包括:
针对目标群体中的一个或多个基因座选择靶序列组,其中所述靶序列不含在所述目标群体中以高于阈值等位基因频率出现的变体;
去除任何具有高频脱靶候选者的靶序列(相对于该组中的其他铂靶)以定义最终靶序列组;
基于所述最终靶序列组制备CRISPR-Cas系统组,其中制备的许多CRISP-Cas系统是至少部分地基于目标群体的大小。
36.根据权利要求35所述的方法,其还包括:
获得待治疗的受试者的基因组测序数据;和
用选自所述CRISPR-Cas系统组的CRISPR-Cas系统治疗所述受试者,其中选择的CRISPR-Cas系统是至少部分地基于所述个体的所述基因组测序数据。
37.根据权利要求36所述的方法,其中所述基因组测序数据是全基因组测序数据。
38.根据权利要求35至37所述的方法,其中基于一个或多个参数的优化进一步选择靶序列,所述一个或多个参数由以下组成:PAM类型(天然的或修饰的),PAM核苷酸含量,PAM长度,靶序列长度,PAM限制性,靶切割效率,和基因、基因座或其他基因组区域内的靶序列位置。
39.根据权利要求35至38中任一项所述的方法,其中基于一个或多个参数的优化选择所述CRISPR-Cas系统组中的每个CRISPR-Cas系统的效应蛋白,所述一个或多个参数选自效应蛋白尺寸、效应蛋白到达具有高染色质可及性的区域的能力、跨基因组靶标的均一酶活性的程度、表观遗传耐受性、错配/凸起耐受性、效应蛋白特异性、效应蛋白稳定性或半衰期、效应蛋白免疫原性或毒性。
40.根据权利要求35至39中任一项所述的方法,其中所述指导RNA是tru指导、护送的指导或受保护的指导。
41.根据权利要求35至40中任一项所述的方法,其中所述CRISPR-Cas系统功能包括基因组突变、基因敲除、基因校正、基因组区域缺失、基因或基因组区域功能的调节。
42.根据权利要求41所述的方法,其中基因或基因组区域功能的调节包括调节基因活性或可及性,任选地导致转录的和/或表观遗传的基因或基因组区域激活或基因或者基因组区域沉默。
43.根据权利要求35至42中任一项所述的方法,其中递送包括递送gRNA和/或CRISPR效应蛋白,递送gRNA和/或CRISPR效应子mRNA,或者递送gRNA和/或作为基于DNA的表达系统的CRISPR效应子。
44.根据权利要求43所述的方法,其中用于递送所述CRISPR-Cas系统或其组分的递送载体和/或表达系统包括脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统。
45.根据权利要求35-44中任一项所述的方法,其中使用基于测序的双链断裂检测测定法测定脱靶候选者、PAM限制性、靶切割效率或效应蛋白特异性。
46.工程化Cpf1蛋白质用于降低所述Cpf1蛋白质的脱靶活性的用途,
其中所述蛋白质与包含RNA的核酸分子复合以形成CRISPR复合物,
其中所述核酸分子在所述CRISPR复合物中时靶向一个或多个靶多核苷酸基因座,
其中所述蛋白质相对于未修饰的蛋白质包含至少一个修饰,所述修饰改变所述Cpf1蛋白质与所述核酸分子,或所述靶多核苷酸基因座的链,或脱靶多核苷酸基因座的链的关联。
47.一种用于降低Cpf1蛋白质的脱靶活性的系统,其包括工程化Cpf1蛋白质和包含RNA的核酸分子;
其中所述蛋白质与所述核酸分子复合以形成CRISPR复合物,
其中所述核酸分子在所述CRISPR复合物中时靶向一个或多个靶多核苷酸基因座,
其中所述蛋白质相对于未修饰的蛋白质包含至少一个修饰,所述修饰改变所述Cpf1蛋白质与所述核酸分子,或所述靶多核苷酸基因座的链,或脱靶多核苷酸基因座的链的关联。
48.根据权利要求46或47所述的用途或系统,其中所述Cpf1蛋白质相对于未修饰的蛋白质包含至少两个修饰,所述修饰改变所述Cpf1蛋白质与所述核酸分子的关联。
49.根据权利要求46-48中任一项所述的用途或系统,其中所述修饰包括改变PAM识别的一个或多个氨基酸置换。
50.根据权利要求46-48中任一项所述的用途或系统,其中所述修饰包括参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号在位置11、12、13、14、15、16、17、34、36、39、40、43、46、47、50、54、57、58、111、126、127、128、129、130、131、132、133、134、135、136、157、158、159、160、161、162、163、164,165、166、167、168、169、170、171、172、173、174、175、176、177、178、532、533、534、535、536、537、538、539、540、541、542,543、544、545、546、547、548、549、550、551、552、553、554、555、556、565、566、567、568、569、570、571、572、573、574、575,592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616,617、618、619、620、626、627、628、629、630、631、632、633、634、635、636、637、638、642、643、644、645、646、647、648、649,651、652、653、654、655、656、676、679、680、682、683,684、685、686、687、688、689、690、691、692、693、707、711、714、715、716、717、718、719、720、721、722、739、765、768、769,773、777、778、779、780、781、782、783、784、785、786、871、872、873、874、875、876、877、878、879、880、881、882、883、884或1048处的一个或多个氨基酸置换。
51.根据权利要求46-48中任一项所述的用途或系统,其中所述修饰包括在结合沟槽中的一个或多个氨基酸置换。
52.根据权利要求46-48中任一项所述的用途或系统,其中所述蛋白质修饰中的至少一个包括参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号在位置R909、R912、R930、R947、K949、R951、R955、K965、K968、K1000、K1002、R1003、K1009、K1017、K1022、K1029、K1035、K1054、K1072、K1086、R1094、K1095、K1109、K1118、K1142、K1150、K1158、K1159、R1220、R1226、R1242和/或R1252处的氨基酸置换。
53.根据权利要求46-48中任一项所述的用途或系统,其中所述蛋白质修饰中的至少一个包括参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号在位置K324、K335、K337、R331、K369、K370、R386、R392、R393、K400、K404、K406、K408、K414、K429、K436、K438、K459、K460、K464、R670、K675、R681、K686、K689、R699、K705、R725、K729、K739、K748和/或K752处的氨基酸置换。
54.根据权利要求46-48中任一项所述的用途或系统,其中所述蛋白质修饰中的至少一个包括参考AsCpf1(氨基酸球菌物种BV3L6)的氨基酸位置编号在位置R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、K1072、K1086、F1103、R1226和/或R1252处的氨基酸置换。
55.根据权利要求46-48中任一项所述的用途或系统,其中所述蛋白质修饰中的至少一个包括参考LbCpf1(毛螺菌科细菌ND2006)的氨基酸位置编号在位置R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、R1138、R1165和/或R1252处的氨基酸置换。
56.根据权利要求46-48和51-55中任一项所述的用途或系统,其中所述修饰包括丙氨酸置换。
57.根据权利要求46-48和51-55中任一项所述的用途或系统,其中所述修饰包括K949A。
58.根据权利要求46-57中任一项所述的用途或系统,其中所述Cpf1蛋白包括来自生物的Cpf1蛋白,所述生物来自包括以下的属:链球菌属、弯曲菌属、Nitratifractor、葡萄球菌属、Parvibaculum、罗斯氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属、棒杆菌属、肉食杆菌属、红细菌属、李斯特菌属、Paludibacter、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯氏菌属、军团菌属、脂环酸芽孢杆菌属、Methanomethyophilus、卟啉单胞菌属、普雷沃氏菌属、拟杆菌属、创伤球菌属、Letospira、脱硫弧菌属、Desulfonatronum、丰佑菌科、肿块芽胞杆菌属、芽孢杆菌属、Brevibacilus、甲基杆菌属或氨基酸球菌属。
59.根据权利要求46-58中任一项所述的用途或系统,其中所述Cpf1蛋白质包含一个或多个核定位信号(NLS)结构域,优选至少两个或更多个NLS结构域。
60.根据权利要求46-59中任一项所述的用途或系统,其中所述Cpf1蛋白质包含影响Cpf1催化活性和/或Cpf1稳定性的修饰或突变。
61.根据权利要求46至59中任一项所述的用途或系统,其中所述Cpf1蛋白质包含一个或多个异源功能结构域,所述异源功能结构域具有以下活性中的一种或多种:甲基化酶活性、脱氨酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性和核酸结合活性。
62.根据权利要求46至59中任一项所述的用途或系统,其还包括外源模板多核苷酸。
63.根据权利要求46至62中任一项所述的系统,其中所述系统被包括在递送系统中或者由一种或多种载体整体或部分地编码或递送;并且任选地所述一种或多种载体被包括在递送系统中,优选单个载体。
64.根据权利要求63所述的系统,其中所述一种或多种载体包括一种或多种病毒载体;或一种或多种逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。
65.根据权利要求62所述的系统,其中所述递送系统包括颗粒(优选包含脂质、糖、金属或蛋白质)、酵母系统、脂质转染系统、显微注射系统、基因枪系统,病毒体、泡囊(优选外来体或脂质体)、免疫脂质体、聚阳离子、脂质:核酸缀合物或人工病毒粒子。
66.根据权利要求65所述的系统,其中所述颗粒包含与指导RNA复合的根据权利要求46-61中任一项所述的工程化Cpf1蛋白质。
67.一种真核细胞,其包含根据权利要求46-66中任一项所述的系统,优选其中所述细胞是体外、离体或体内宿主细胞或细胞系或其后代,其中所述宿主细胞或细胞系不是人类生殖细胞系。
68.根据权利要求67所述的细胞,其中所述细胞包括干细胞或干细胞系。
69.根据权利要求67或68所述的细胞,其中所述细胞是动物或植物细胞,优选人细胞。
70.一种在细胞或细胞系中调节基因表达或修饰感兴趣的靶基因座的方法,其中所述方法包括将根据权利要求46-66中任一项所述的系统导入所述细胞或细胞系,从而获得修饰的细胞或细胞系。
71.根据权利要求70所述的方法,其中进一步培养所述修饰的细胞或细胞系以产生后代。
72.一种体外或离体修饰感兴趣的靶基因座的方法,所述方法包括向所述基因座递送包含根据权利要求46-66中任一项所述的系统的非天然存在的或工程化的组合物,其中所述Cpf1蛋白质与一种或多种核酸组分形成复合物,并且在所述复合物与感兴趣的靶基因座结合后,所述Cpf1蛋白质诱导所述感兴趣的靶基因座的修饰。
73.一种产生具有由感兴趣的基因编码的感兴趣的修饰的性状的植物的方法,所述方法包括使植物细胞与根据权利要求46-66中任一项所述的系统接触或使所述植物细胞经受根据权利要求72所述的方法,从而修饰或导入所述感兴趣的基因,并从所述植物细胞再生植物。
74.一种通过操纵感兴趣的基因组基因座处的一个或多个靶序列来修饰生物体的方法,其包括将根据权利要求46-66中任一项所述的系统递送至所述生物体,从而获得修饰的生物体。
75.根据权利要求74所述的方法,其中所述生物是植物或藻类。
76.一种通过操纵感兴趣的基因组基因座处的一个或多个靶序列来修饰细胞或细胞系的离体方法,其包括向所述细胞递送根据权利要求46-66中任一项所述的系统,从而获得修饰的细胞或细胞系,其中所述方法不包括用于修饰人类的种系遗传特性的过程。
77.根据权利要求76所述的方法,其中进一步培养所述修饰的细胞或细胞系以产生后代。
78.根据权利要求46-66中任一项所述的系统用于离体基因或基因组编辑的用途,其中所述用途不包括用于修饰人类的种系遗传特性的过程。
79.根据权利要求46-66中任一项所述的系统,根据权利要求67-69所述的细胞,或通过根据权利要求70-71或76-77所述的权利要求产生的细胞、细胞系或其后代,用于疗法。
80.根据权利要求79所述使用的系统或细胞,其中所述疗法是用于基因或基因组编辑,或基因疗法。
81.根据权利要求79或80所述使用的系统或细胞,其中所述疗法是用于治疗以下中的一种或多种:血液和凝血疾病和病症;细胞失调和肿瘤疾病和病症;炎症和免疫相关疾病和病症;代谢、肝脏、肾脏和蛋白质疾病和病症;肌肉/骨骼疾病和病症;神经和神经元疾病和病症;和眼部疾病和病症。
82.通过权利要求70-71或76-77所述的方法获得或可获得的细胞或细胞系。
83.一种用于开发或设计基于CRISPR-Cas系统的疗法或治疗剂的方法,其包括:
(a)选择一个或多个靶基因座;
(b)选择一种或多种CRISPR-Cas系统功能;
(c)任选地,选择一种或多种递送模式;
(d)制备基于步骤(a)-(c)选择的CRISPR-Cas系统。
84.根据前述权利要求中任一项所述的方法,其中选择一个或多个靶标、靶序列或靶基因座包括优化靶标、靶序列或靶基因座的位置、长度、特异性和PAM特征中的一种或多种。
85.根据权利要求84所述的方法,其中优化靶标的位置包括在具有低变异性的基因、基因座或其他基因组区域内选择靶序列。
86.根据权利要求85所述的方法,其中低变异性包括选择具有低变异性的早期和/或保守外显子或结构域。
87.根据权利要求85所述的方法,其中优化靶标的位置包括选择在群体的至少99%中不存在序列变异的靶基因座。
88.根据权利要求87所述的方法,其中所述群体包括至少1000个个体。
89.根据权利要求84所述的方法,其中优化靶标的长度包括选择在所述一个或多个靶基因座内5至25个核苷酸之间的靶序列。
90.根据权利要求89所述的方法,其中靶序列长度是20个核苷酸。
91.根据权利要求84所述的方法,其中优化靶标的特异性包括选择使脱靶候选者最小化的靶基因座。
92.根据权利要求91所述的方法,其中脱靶候选者具有1-3个错配或远端PAM错配。
93.根据权利要求92所述的方法,其中使用基于测序的双链断裂(DSB)检测测定法鉴定脱靶候选者。
94.根据权利要求93所述的方法,其中所述基于测序的DSB检测测定法包括用包含引物结合位点的衔接子标记DSB的位点、用条形码或独特分子标识符标记DSB的位点,或其组合。
95.根据权利要求83所述的方法,其中优化PAM特征包括优化PAM的核苷酸含量。
96.根据权利要求95所述的方法,其中优化PAM的核苷酸含量是选择具有基序的PAM,所述基序使所述一个或多个靶基因座中的丰度最大化、使突变频率最小化,或两者。
97.根据权利要求83所述的方法,其中选择一种或多种CRISPR-Cas系统功能包括选择最佳效应蛋白、最佳指导RNA或两者中的一种或多种。
98.根据权利要求97所述的方法,其中选择最佳效应蛋白包括优化效应蛋白的类型、尺寸、PAM特异性、效应蛋白稳定性、免疫原性或毒性、功能特异性和功效中的一种或多种。
99.根据权利要求98所述的方法,其中所述效应蛋白是天然存在的或经修饰的效应蛋白。
100.根据权利要求99所述的方法,其中所述经修饰的效应蛋白是切口酶、脱氨酶或失活的效应蛋白。
101.根据权利要求97-100中任一项所述的方法,其中优化尺寸包括选择具有最小尺寸的蛋白效应子。
102.根据权利要求98所述的方法,其中优化PAM特异性包括选择具有经修饰的PAM特异性的效应蛋白;或其中优化效应蛋白稳定性包括选择具有短半衰期,同时保持足够活性的效应蛋白,例如通过选择具有特定半衰期或稳定性的合适的CRISPR效应子直系同源物;或其中优化免疫原性或毒性包括通过蛋白质修饰使效应蛋白免疫原性或毒性最小化;或其中优化功能特异性包括选择蛋白效应子,所述蛋白效应子在所述指导RNA和一个或多个靶基因座之间具有降低的错配和/或凸起耐受性;或其中优化功效包括优化总体效率、表观遗传耐受性或两者;或其中优化表观遗传耐受性包括优化甲基化耐受性、表观遗传标志竞争或两者;或其中优化甲基化耐受性包括选择修饰甲基化DNA的效应蛋白;或其中优化表观遗传耐受性包括选择不能修饰染色体沉默区域的效应蛋白、选择能够修饰染色体沉默区域的效应蛋白,或选择不富集表观遗传标志物的靶基因座。
103.根据权利要求10202所述的方法,其中使总体效率最大化包括选择在具有不同染色质复杂性的靶基因座中具有均一酶活性的效应蛋白、选择具有限于开放染色质可及性区域的酶活性的效应蛋白。
104.根据权利要求10303所述的方法,其中使用ATAC-seq或DNA-邻近连接测定法中的一种或多种测量染色质可及性。
105.根据权利要求96所述的方法,其中选择经优化的指导RNA包括优化gRNA稳定性、gRNA免疫原性或两者。
106.根据权利要求10505所述的方法,其中优化gRNA稳定性和/或gRNA免疫原性包括RNA修饰。
107.根据权利要求10606所述的方法,其中所述修饰包括从所述gRNA的靶互补区的3’末端移除1-3个核苷酸;或其中修饰包括延伸的gRNA和/或反式RNA/DNA元件,其在所述gRNA中产生稳定结构,其与脱靶基因座的靶标处的gRNA碱基配对竞争,或在所述gRNA和靶序列之间的延伸的互补核苷酸,或两者。
108.根据前述权利要求中任一项所述的方法,其中所述递送模式包括递送gRNA和/或CRISPR效应蛋白、递送gRNA和/或CRISPR效应mRNA,或者递送gRNA和/或作为基于DNA的表达系统的CRISPR效应子。
109.根据权利要求10808所述的方法,其中所述递送模式还包括从脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统选择递送载体和/或表达系统。
110.根据权利要求10808-10909中任一项所述的方法,其中表达是通过对条件型和/或诱导型表达系统的选择来优化的时空表达,包括可控的CRISPR效应子活性、任选地去稳定的CRISPR效应子,和/或分裂的CRISPR效应子,和/或细胞或组织特异性表达系统。
111.一种用于将效应蛋白和至少一种CRISPR指导RNA递送至细胞的载体,其包含:
(a)可操作地连接至编码所述效应蛋白的多核苷酸序列的最小启动子;和,
(b)可操作地连接至编码至少一种指导RNA的多核苷酸序列的第二最小启动子;
其中包含两个最小启动子和多核苷酸序列的载体序列的长度小于4.4Kb。
112.根据权利要求111所述的载体,其中所述载体是AAV载体。
113.根据权利要求111所述的载体,其中所述效应蛋白是CRISPR酶。
114.根据权利要求113所述的载体,其中所述CRISPR酶是SaCas9、Cpf1、Cas13b或C2c2。
115.一种用于将效应蛋白和至少一种CRISPR指导RNA递送至细胞的慢病毒载体,其包含可操作地连接至编码Cpf1的多核苷酸序列的启动子和可操作地连接至编码至少一种指导RNA的多核苷酸序列的第二启动子,其中所述多核苷酸序列是在相反反向上。
116.一种在细胞中表达效应蛋白和指导RNA的方法,其包括将根据权利要求111-114中任一项所述的载体导入细胞。
117.根据权利要求111-114中任一项所述的载体,其中所述最小启动子是Mecp2启动子、tRNA启动子或U6;或其中所述最小启动子是组织特异性的。
118.一种颗粒递送系统,其包含复合病毒颗粒,其中所述复合病毒颗粒包含脂质、病毒衣壳蛋白,和蛋白质或肽。
119.根据权利要求118所述的颗粒递送系统,其中所述颗粒递送系统包括吸附至脂质体的病毒颗粒。
120.根据权利要求119所述的颗粒递送系统,其中所述脂质体包含阳离子脂质。
121.根据权利要求118或119所述的颗粒递送系统,其中CRISPR-Cas系统组分附着于所述病毒衣壳蛋白。
122.根据权利要求119所述的颗粒递送系统,其中所述脂质体包含CRISPR-Cas系统组分。
123.一种递送系统,其包括与脂质颗粒组合的一种或多种杂合病毒衣壳蛋白,其中所述杂合病毒衣壳蛋白包含附着于非衣壳蛋白的至少一部分的病毒衣壳蛋白的至少一部分。
124.根据权利要求123所述的递送系统,其中所述病毒衣壳蛋白附着于所述脂质颗粒的表面,或其中所述病毒衣壳蛋白通过静电相互作用附着于所述脂质颗粒的表面,或其中所述病毒衣壳蛋白通过疏水相互作用附着于所述脂质颗粒的表面。
125.一种递送系统,其包括含有脂质层的颗粒,其中杂合病毒衣壳蛋白包埋在所述脂质层中,所述杂合病毒衣壳蛋白包含附着于非衣壳蛋白的至少一部分的病毒衣壳蛋白。
126.根据权利要求125所述的递送系统,其中所述颗粒具有100-1000nm的尺寸。
127.根据权利要求118、123或125所述的递送系统,其中所述蛋白质或肽具有至多兆道尔顿的分子量,任选地其中所述蛋白质或肽具有在110-160kDA范围内的分子量。
128.根据权利要求125所述的递送系统,其中所述蛋白质或肽包括CRISPR蛋白质或肽,任选地V型CRISPR蛋白质。
129.根据权利要求125所述的递送系统,其中所述蛋白质或肽包括Cas9、Cpf1或C2c2。
130.根据权利要求118、123或125所述的递送系统,其中所述脂质、脂质颗粒或脂质层包含至少一种阳离子脂质。
131.根据权利要求130所述的递送系统,其中所述阳离子脂质选自EC16-63、80-O14B、80-O16B、80-O18B、87-O14B、87-O16B、87-O18B、1-O16B、1-O18B、80-O14、80-O16、80-O18、87-O14、87-O16、87-O18、1-N16、1-N18、87-N17、87-N16、87-N18、EC16-1、EC16-3、EC16-12和EC16-14。
132.根据权利要求118、123或125所述的递送系统,其中所述脂质、脂质颗粒或脂质层还包含野生型衣壳蛋白。
133.根据权利要求132所述的递送系统,其中杂合衣壳蛋白与野生型衣壳蛋白的比率为1:10至1:1。
134.根据权利要求118、123或125所述的递送系统,其中所述病毒是腺病毒科或细小病毒科或弹状病毒科或含有G蛋白的包膜病毒。
135.根据权利要求125所述的递送系统,其中所述病毒是腺相关病毒(AAV)或腺病毒或VSV或狂犬病病毒。
136.根据权利要求118、123或125所述的递送系统,其中所述病毒是逆转录病毒。
137.根据权利要求136所述的递送系统,其中所述病毒是慢病毒。
138.根据权利要求136所述的递送系统,其中所述病毒是鼠白血病病毒(MuMLV)。
139.根据权利要求123或125所述的递送系统,其中所述病毒衣壳蛋白包括VP1、VP2或VP3。
140.根据权利要求139所述的递送系统,其中所述病毒衣壳蛋白是VP3,并且所述非衣壳蛋白插入或链接或连接到VP3环3或环6。
141.根据权利要求123或125所述的递送系统,其中所述病毒被递送到细胞内部。
142.根据权利要求141所述的递送系统,其中所述病毒衣壳蛋白和所述非衣壳蛋白在递送到细胞中后能够解离。
143.根据权利要求123或125所述的递送系统,其中所述病毒衣壳蛋白通过接头附着于所述非衣壳蛋白。
144.根据权利要求143所述的递送系统,其中所述接头包含氨基酸,或其中所述接头是化学接头,或其中所述接头是可切割的,或其中所述接头是可生物降解的,或其中所述接头包含(GGGGS)1-3、ENLYFQG或二硫化物。
145.根据权利要求143所述的递送系统,其中所述非衣壳蛋白的每个末端通过接头部分附着于所述衣壳蛋白。
146.根据权利要求123或125所述的递送系统,其中所述非衣壳蛋白附着于所述病毒衣壳蛋白的外部部分、所述衣壳蛋白的内部部分、形成衣壳之前的所述病毒衣壳蛋白、形成衣壳之后的所述病毒衣壳蛋白,或者被包封在所述脂质颗粒内。
147.根据权利要求123所述的递送系统,其中所述病毒衣壳蛋白和所述非衣壳蛋白是融合蛋白。
148.根据权利要求147所述的递送系统,其中所述融合蛋白附着于所述脂质颗粒的表面。
149.根据权利要求123或125所述的递送系统,其中所述非衣壳蛋白包含靶向部分、标签或一个或多个异源核定位信号(NLS)。
150.根据权利要求149所述的递送系统,其中所述靶向部分包含受体配体。
151.根据权利要求128所述的递送系统,其还包括指导RNS,任选地与所述CRISPR蛋白复合。
152.根据权利要求151所述的递送系统,其包括蛋白酶或编码蛋白酶的核酸分子,所述蛋白酶被表达,由此所述蛋白酶切割所述接头。
153.根据权利要求123或125所述的递送系统,其包括第一杂合病毒衣壳蛋白和第二杂合病毒衣壳蛋白,其中所述第一杂合病毒衣壳蛋白包含附着于蛋白质的第一部分的病毒衣壳蛋白,并且其中所述第二杂合病毒衣壳蛋白包含附着于所述蛋白质的第二部分的第二病毒衣壳蛋白,其中所述蛋白质的第一部分和所述蛋白质的第二部分能够联合以形成功能性蛋白质。
154.根据权利要求153所述的递送系统,其中所述蛋白质的第一部分是CRISPR蛋白的第一部分,并且其中所述蛋白质的第二部分是CRISPR蛋白的第二部分,其中所述CRISPR蛋白的第一部分和所述CRISPR蛋白的第二部分能够联合以形成功能性CRISPR蛋白。
155.根据权利要求153所述的递送系统,其中所述第一杂合病毒衣壳蛋白和所述第二病毒衣壳蛋白在同一病毒颗粒的表面上。
156.根据权利要求153所述的递送系统,其中所述第一杂合病毒衣壳蛋白位于第一病毒颗粒的内部,并且所述第二杂合病毒衣壳蛋白位于第二病毒颗粒的内部。
157.根据权利要求153或154所述的递送系统,其中所述蛋白质或CRISPR蛋白的第一部分与配体对的第一成员连接,并且所述蛋白质或CRISPR蛋白的第二部分与配体对的第二成员连接,其中所述配体对的第一部分与所述配体对的第二部分在细胞中结合。
158.根据权利要求157所述的递送系统,其中所述配体对的第一部分与所述配体对的第二部分的结合是诱导型的。
159.根据权利要求153或154所述的递送系统,其中所述蛋白质或CRISPR蛋白的第一部分和所述蛋白质或CRISPR蛋白的第二部分中的任一者或两者包含一个或多个NLS或一个或多个核输出信号(NES)。
160.一种颗粒递送系统,其包括杂合病毒衣壳蛋白或杂合病毒外部蛋白,其中所述杂合病毒衣壳或外部蛋白包含附着于蛋白质的至少一部分的病毒衣壳或外部蛋白。
161.根据权利要求160所述的递送系统,其中蛋白质具有至多兆道尔顿的分子量,或具有在110至160kDa的范围内的分子量,或包括CRISPR蛋白。
162.根据权利要求160或161所述的颗粒递送系统,其中所述病毒是腺病毒科或细小病毒科或逆转录病毒或弹状病毒科或含有G蛋白的包膜病毒。
163.根据权利要求160所述的颗粒递送系统,其中所述病毒是腺相关病毒(AAV)、腺病毒、慢病毒、鼠白血病病毒(MuMLV)、VSV或狂犬病病毒。
164.根据权利要求160所述的颗粒递送系统,其中所述衣壳或外部蛋白包括具有VP1、VP2或VP3的衣壳蛋白。
165.根据权利要求164所述的颗粒递送系统,其中所述衣壳蛋白是VP3,并且所述非衣壳蛋白插入或附着于VP3环3或环6。
166.根据权利要求160所述的颗粒递送系统,其中所述病毒被递送至细胞内部。
167.根据权利要求160所述的颗粒递送系统,其中所述衣壳或外部蛋白和所述非衣壳蛋白在递送到细胞中后可解离。
168.根据权利要求160或161所述的颗粒递送系统,其中所述衣壳或外部蛋白通过接头附着于所述蛋白质。
169.根据权利要求168所述的颗粒递送系统,其中所述接头包含氨基酸、(GGGGS)1-3、ENLYFQG或二硫化物。
170.根据权利要求168所述的颗粒递送系统,其中所述接头是化学接头、是可切割的或是可生物降解的。
171.根据权利要求168所述的颗粒递送系统,其包括蛋白酶或编码蛋白酶的核酸分子,所述蛋白酶被表达,由此可以存在所述接头的切割。
172.根据权利要求168所述的颗粒递送系统,其中所述CRISPR蛋白的每个末端通过接头部分附着于所述衣壳或外部蛋白。
173.根据权利要求160所述的颗粒递送系统,其中所述蛋白质附着于所述衣壳或外部蛋白的外部部分,或其中所述蛋白质附着于所述衣壳或外部蛋白的内部部分,或其中在形成所述衣壳或外部蛋白之前所述蛋白质附着于所述衣壳或外部蛋白,或其中在形成所述衣壳或外部蛋白之后所述蛋白质附着于所述衣壳或外部蛋白。
174.根据权利要求160所述的颗粒递送系统,其中所述衣壳或外部蛋白和所述蛋白质是融合蛋白。
175.根据权利要求174所述的颗粒递送系统,其中将所述融合蛋白引入衣壳或外部蛋白。
176.根据权利要求160所述的颗粒递送系统,其中所述CRISPR蛋白包含靶向部分。
177.根据权利要求176所述的颗粒递送系统,其中所述靶向部分包含受体配体。
178.根据权利要求160所述的病毒,其中所述蛋白质包含标签。
179.一种病毒颗粒,其包含衣壳或外部蛋白,所述衣壳或外部蛋白具有一种或多种杂合病毒衣壳或外部蛋白,所述杂合病毒衣壳或外部蛋白包含附着于蛋白质或CRISPR蛋白的病毒衣壳或外部蛋白。
180.一种调查或研究方法,其包括使递送系统与细胞接触,任选地真核细胞,由此将所述递送系统的组分递送到所述细胞中,从所述接触获得数据或结果,并传输所述数据或结果。
181.一种来自权利要求180所述的方法的细胞或者权利要求180所述的方法的细胞。
182.一种来自权利要求180所述的方法的细胞产物或者权利要求180所述的方法的细胞产物,其包括其中所述细胞产物是从本来是所述细胞的野生型但由于所述接触改变而来。
CN201780064300.8A 2016-08-17 2017-08-17 新型crispr酶和系统 Pending CN110114461A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662376372P 2016-08-17 2016-08-17
US62/376,372 2016-08-17
US201662437023P 2016-12-20 2016-12-20
US62/437,023 2016-12-20
PCT/US2017/047459 WO2018035388A1 (en) 2016-08-17 2017-08-17 Novel crispr enzymes and systems

Publications (1)

Publication Number Publication Date
CN110114461A true CN110114461A (zh) 2019-08-09

Family

ID=61197035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780064300.8A Pending CN110114461A (zh) 2016-08-17 2017-08-17 新型crispr酶和系统

Country Status (4)

Country Link
US (3) US11352647B2 (zh)
EP (1) EP3500671A4 (zh)
CN (1) CN110114461A (zh)
WO (1) WO2018035388A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110424039A (zh) * 2019-09-16 2019-11-08 东北大学 基于水滑石纳米缓蚀微胶囊的镁合金耐蚀自修复微弧氧化涂层的制备方法
CN110511286A (zh) * 2019-08-29 2019-11-29 上海科技大学 一种rna碱基编辑分子
CN110628737A (zh) * 2019-10-14 2019-12-31 南京农业大学 一个调控黄瓜矮化性状相关基因及其应用
CN112941075A (zh) * 2021-02-02 2021-06-11 同济大学 一种构建甲状腺功能障碍及心脏长qt综合征双表型大鼠模型的方法
CN113046392A (zh) * 2019-12-27 2021-06-29 深圳华大生命科学研究院 治疗β-球蛋白功能缺失的重组慢病毒载体及制备方法和应用
CN114480474A (zh) * 2020-11-11 2022-05-13 海南师范大学 一种海洋微拟球藻转录激活CRISPRa系统的构建及其应用
CN114555826A (zh) * 2019-08-16 2022-05-27 杰克逊实验室 非重复基因组基因座的活细胞成像
CN114586735A (zh) * 2020-12-04 2022-06-07 南京大学 Pparg基因定点突变小鼠模型的构建与应用
CN114639442A (zh) * 2022-03-30 2022-06-17 中国农业科学院农业基因组研究所 一种基于单核苷酸多态性预测开放阅读框的方法及系统
WO2022166954A1 (en) * 2021-02-07 2022-08-11 Huigene Therapeutics Co., Ltd. Rna adeno-associated virus (raav) vector and uses thereof
US20220259616A1 (en) * 2017-04-18 2022-08-18 Yale University A Platform for T Lymphocyte Genome Engineering and In Vivo High-Throughput Screening Thereof
WO2023066413A1 (zh) * 2021-10-21 2023-04-27 中国农业科学院生物技术研究所 Dmp蛋白及其编码基因与应用
CN116268138A (zh) * 2023-04-26 2023-06-23 四川轻化工大学 一种提升藏茶中茶多糖含量的方法

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2841572B1 (en) 2012-04-27 2019-06-19 Duke University Genetic correction of mutated genes
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
JP7030522B2 (ja) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
CN108026526B (zh) 2015-06-09 2023-05-12 爱迪塔斯医药公司 用于改善移植的crispr/cas相关方法和组合物
US10648020B2 (en) 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems
EP3786294A1 (en) 2015-09-24 2021-03-03 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
EP3362571A4 (en) 2015-10-13 2019-07-10 Duke University GENOMIC ENGINEERING WITH TYPE I CRISPRISMS IN EUKARYOTIC CELLS
WO2017165826A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP4047092A1 (en) 2016-04-13 2022-08-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
CA3026112A1 (en) 2016-04-19 2017-10-26 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
US11078481B1 (en) 2016-08-03 2021-08-03 KSQ Therapeutics, Inc. Methods for screening for cancer targets
US20200283743A1 (en) * 2016-08-17 2020-09-10 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2018035388A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
US11078483B1 (en) 2016-09-02 2021-08-03 KSQ Therapeutics, Inc. Methods for measuring and improving CRISPR reagent function
WO2018191750A2 (en) * 2017-04-14 2018-10-18 The Broad Institute Inc. Novel delivery of large payloads
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
WO2018204777A2 (en) 2017-05-05 2018-11-08 The Broad Institute, Inc. Methods for identification and modification of lncrna associated with target genotypes and phenotypes
WO2018220210A1 (en) * 2017-06-02 2018-12-06 Institut National De La Sante Et De La Recherche Medicale (Inserm) Recombinant lentiviral vector for stem cell-based gene therapy of sickle cell disorder
JP2020524497A (ja) 2017-06-09 2020-08-20 エディタス・メディシン,インコーポレイテッド 操作されたcas9ヌクレアーゼ
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
WO2019135816A2 (en) * 2017-10-23 2019-07-11 The Broad Institute, Inc. Novel nucleic acid modifiers
HRP20230828T1 (hr) * 2018-03-14 2023-11-10 Arbor Biotechnologies, Inc. Novi sustavi i enzimi koji ciljaju na crispr dna
EP3768328A4 (en) * 2018-03-23 2021-12-22 Refuge Biotechnologies, Inc. GENE REGULATION THROUGH CONDITIONAL NUCLEAR LOCALIZATION OF GENE-MODULATING POLYPEPTIDES
US20190336585A1 (en) * 2018-05-03 2019-11-07 John Lawrence Mee Method for sustainable human cognitive enhancement
EP3790964A4 (en) * 2018-05-11 2022-06-08 Beam Therapeutics, Inc. METHODS OF SUPPRESSING PATHOGENIC MUTATIONS USING BASIC PROGRAMMABLE EDITOR SYSTEMS
EP3820487A4 (en) * 2018-05-14 2022-03-09 Themba Inc. GENE EDIT FOR AUTOIMMUNE DISEASES
WO2019222555A1 (en) 2018-05-16 2019-11-21 Arbor Biotechnologies, Inc. Novel crispr-associated systems and components
US20190359985A1 (en) * 2018-05-22 2019-11-28 John Lawrence Mee Adjustable method for sustainable human cognitive enhancement
CA3101477A1 (en) * 2018-05-30 2019-12-05 M2X2 Therapeutics, Inc. Cell therapy
US20190390193A1 (en) * 2018-06-23 2019-12-26 John Lawrence Mee Reversible method for sustainable human cognitive enhancement
BR112020026246A2 (pt) 2018-06-26 2021-04-20 The Broad Institute Inc. composições, sistemas e métodos de amplificação com base em nickase dupla crispr
MX2020013836A (es) 2018-06-26 2021-05-27 Massachusetts Inst Technology Métodos, sistemas y diagnósticos de amplificación basados en el sistema efector crispr.
WO2020014570A1 (en) * 2018-07-13 2020-01-16 Kansas State University Research Foundation Multi-locus gene drive system
SG11202101290SA (en) * 2018-08-08 2021-03-30 Integrated Dna Technologies Inc Novel mutations that enhance the dna cleavage activity of acidaminococcus sp. cpf1
CA3111477A1 (en) * 2018-09-12 2020-03-19 Institute For Basic Science Composition for inducing death of cells having mutated gene, and method for inducing death of cells having mutated gene by using composition
RU2712492C1 (ru) * 2018-11-26 2020-01-29 Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий Средство разрезания днк на основе cas9 белка из defluviimonas sp.
WO2020124050A1 (en) 2018-12-13 2020-06-18 The Broad Institute, Inc. Tiled assays using crispr-cas based detection
AU2019398351A1 (en) * 2018-12-14 2021-06-03 Pioneer Hi-Bred International, Inc. Novel CRISPR-Cas systems for genome editing
US20200254103A1 (en) * 2019-02-11 2020-08-13 John Mee Method for treating neurological conditions and improving human cognition
WO2020186231A2 (en) 2019-03-14 2020-09-17 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics
WO2020191102A1 (en) 2019-03-18 2020-09-24 The Broad Institute, Inc. Type vii crispr proteins and systems
WO2020214724A1 (en) * 2019-04-15 2020-10-22 The Trustees Of The University Of Pennsylvania Compositions for regulating and self-inactivating enzyme expression and methods for modulating off-target activity of enzymes
CN110229849B (zh) * 2019-05-31 2021-09-17 中国科学院深圳先进技术研究院 时空调控型uPA基因表达非病毒载体及其制备方法和应用
GB201909597D0 (en) 2019-07-03 2019-08-14 Univ Wageningen Crispr type v-u1 system from mycobacterium mucogenicum and uses thereof
WO2021026294A1 (en) * 2019-08-06 2021-02-11 Children's Medical Center Corporation Methods and compositions for reconstituting microglia
EP4047087A4 (en) * 2019-08-19 2023-08-23 Southern Medical University CONSTRUCTION AND APPLICATION OF HIGH-FIDELITY CRISPR/ASCPF1 MUTANTS
WO2021046257A1 (en) 2019-09-03 2021-03-11 The Broad Institute, Inc. Crispr effector system based multiplex cancer diagnostics
CA3153005A1 (en) * 2019-09-05 2021-03-11 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
US11844800B2 (en) 2019-10-30 2023-12-19 Massachusetts Institute Of Technology Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia
CN110747187B (zh) * 2019-11-13 2022-10-21 电子科技大学 识别TTTV、TTV双PAM位点的Cas12a蛋白、植物基因组定向编辑载体及方法
US20210155924A1 (en) * 2019-11-27 2021-05-27 Stitch Bio, Llc Methods and compositions for inducing tumor cell death
WO2021146184A1 (en) 2020-01-13 2021-07-22 Fluent Biosciences Inc. Single cell sequencing
EP4121016A1 (en) 2020-03-16 2023-01-25 Fluent Biosciences Inc. Multi-omic analysis in monodisperse droplets
WO2021216674A1 (en) * 2020-04-24 2021-10-28 University Of Massachusetts Improved cas 12a/nls mediated therapeutic gene editing platforms
US20230201375A1 (en) * 2020-04-27 2023-06-29 Duke University Targeted genomic integration to restore neurofibromin coding sequence in neurofibromatosis type 1 (nf1)
CN111505287B (zh) * 2020-05-07 2023-04-07 军事科学院军事医学研究院军事兽医研究所 以乙醛脱氢酶作为信号转导系统检测食源性病原菌的生物传感器及其制备方法和应用
WO2021224506A1 (en) * 2020-05-08 2021-11-11 Universitat Pompeu Fabra Crispr-cas homology directed repair enhancer
TW202208632A (zh) * 2020-05-27 2022-03-01 美商同源醫藥公司 用於恢復pah基因功能的腺相關病毒組成物及其使用方法
JP2024519094A (ja) * 2021-05-18 2024-05-08 フルーエント バイオサイエンシーズ インコーポレイテッド 予めテンプレート化された即時区画におけるゲノム発現摂動
AU2022284804A1 (en) 2021-06-01 2023-12-07 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
US11814689B2 (en) 2021-07-21 2023-11-14 Montana State University Nucleic acid detection using type III CRISPR complex
CN113481210B (zh) * 2021-07-27 2022-07-19 中国农业科学院棉花研究所 棉花GhDof1.7基因在促进植物耐盐中的应用
WO2023029532A1 (en) * 2021-08-30 2023-03-09 Huigene Therapeutics Co., Ltd. Engineered cas6 protein and uses thereof
CN113584076B (zh) * 2021-08-31 2023-09-15 西南大学 沉默桑实杯盘菌G蛋白β亚基编码基因CsGβ2的沉默载体及其应用和方法
WO2023077360A1 (zh) * 2021-11-04 2023-05-11 云南农业大学 一种构建重症免疫缺陷和肝损伤双重猪模型的方法及应用
CN114686524B (zh) * 2022-06-01 2022-09-30 中山大学 一种利用基因编辑生产1龄雌性黄鳍鲷的方法
CN116516051A (zh) * 2023-04-21 2023-08-01 华中农业大学 ATAC-seq介导精准靶向编辑在水稻抗病中的应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140359799A1 (en) * 2011-12-23 2014-12-04 Case Western Reserve University Targeted gene modification using hybrid recombinant adeno-associated virus
WO2015089364A1 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
WO2016049251A1 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
CN105793425A (zh) * 2013-06-17 2016-07-20 布罗德研究所有限公司 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用
US20160208243A1 (en) * 2015-06-18 2016-07-21 The Broad Institute, Inc. Novel crispr enzymes and systems

Family Cites Families (180)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
DE3751873T2 (de) 1986-04-09 1997-02-13 Genzyme Corp Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US6007845A (en) 1994-07-22 1999-12-28 Massachusetts Institute Of Technology Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers
US5855913A (en) 1997-01-16 1999-01-05 Massachusetts Instite Of Technology Particles incorporating surfactants for pulmonary drug delivery
US5985309A (en) 1996-05-24 1999-11-16 Massachusetts Institute Of Technology Preparation of particles for inhalation
US5846946A (en) 1996-06-14 1998-12-08 Pasteur Merieux Serums Et Vaccins Compositions and methods for administering Borrelia DNA
GB9907461D0 (en) 1999-03-31 1999-05-26 King S College London Neurite regeneration
FR2761689B1 (fr) 1997-04-02 1999-06-25 Transgene Sa Fibre adenovirale modifiee et adenovirus cibles
GB9720465D0 (en) 1997-09-25 1997-11-26 Oxford Biomedica Ltd Dual-virus vectors
CA2307016A1 (en) 1997-10-24 1999-05-06 Life Technologies, Inc. Recombinational cloning using nucleic acids having recombination sites
US6750059B1 (en) 1998-07-16 2004-06-15 Whatman, Inc. Archiving of vectors
CA2341061A1 (en) 1998-08-27 2000-03-09 Aventis Pharma S.A. Targeted adenovirus vectors for delivery of heterologous genes
ATE454445T1 (de) * 1998-11-10 2010-01-15 Univ North Carolina Virusvektoren und verfahren für ihre herstellung und verabreichung.
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
WO2001058940A2 (en) 2000-02-09 2001-08-16 Genvec, Inc. Adenoviral capsid containing chimeric protein ix
GB0024550D0 (zh) 2000-10-06 2000-11-22 Oxford Biomedica Ltd
WO2002032396A2 (en) 2000-10-16 2002-04-25 Massachusetts Institute Of Technology Lipid-protein-sugar particles for delivery of nucleic acids
WO2003000851A2 (en) 2001-06-22 2003-01-03 The Trustees Of The University Of Pennsylvania Method for rapid screening of bacterial transformants and novel simian adenovirus proteins
US7109293B2 (en) * 2001-08-10 2006-09-19 Ahram Biosystems Inc. System for detecting protease
WO2003045304A2 (en) 2001-09-26 2003-06-05 Mayo Foundation For Medical Education And Research Mutable vaccines
GB0125216D0 (en) 2001-10-19 2001-12-12 Univ Strathclyde Dendrimers for use in targeted delivery
GB0126251D0 (en) * 2001-11-01 2002-01-02 Imp College Innovations Ltd Methods
JP2005512598A (ja) 2001-12-21 2005-05-12 オックスフォード バイオメディカ (ユーケー) リミテッド Eiavなどのレンチウイルス発現ベクターを使用するトランスジェニック生物の作製方法
WO2004002453A1 (en) 2002-06-28 2004-01-08 Protiva Biotherapeutics Ltd. Method and apparatus for producing liposomes
GB0220467D0 (en) 2002-09-03 2002-10-09 Oxford Biomedica Ltd Composition
EP1648519B1 (en) 2003-07-16 2014-10-08 Protiva Biotherapeutics Inc. Lipid encapsulated interfering rna
NZ592917A (en) 2003-09-15 2012-12-21 Protiva Biotherapeutics Inc Stable polyethyleneglycol (PEG) dialkyloxypropyl (DAA) lipid conjugates
US20050123596A1 (en) 2003-09-23 2005-06-09 Kohane Daniel S. pH-triggered microparticles
GB0325379D0 (en) 2003-10-30 2003-12-03 Oxford Biomedica Ltd Vectors
EP1771206B1 (en) 2004-05-05 2018-04-11 Silence Therapeutics GmbH Lipids, lipid complexes and use thereof
US7745651B2 (en) 2004-06-07 2010-06-29 Protiva Biotherapeutics, Inc. Cationic lipids and methods of use
WO2005121348A1 (en) 2004-06-07 2005-12-22 Protiva Biotherapeutics, Inc. Lipid encapsulated interfering rna
WO2006020071A2 (en) 2004-07-16 2006-02-23 The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Vaccines against aids comprising cmv/r-nucleic acid constructs
GB0422877D0 (en) 2004-10-14 2004-11-17 Univ Glasgow Bioactive polymers
DK1830888T3 (en) 2004-12-27 2015-10-19 Silence Therapeutics Gmbh LIPID COMPLEX COATED WITH PEG AND APPLICATION THEREOF
EP1940734A2 (en) 2005-08-10 2008-07-09 Northwestern University Composite particles
US7838658B2 (en) 2005-10-20 2010-11-23 Ian Maclachlan siRNA silencing of filovirus gene expression
CA2628300C (en) 2005-11-02 2018-04-17 Protiva Biotherapeutics, Inc. Modified sirna molecules and uses thereof
GB0526211D0 (en) 2005-12-22 2006-02-01 Oxford Biomedica Ltd Viral vectors
WO2007126764A2 (en) * 2006-03-27 2007-11-08 The Regents Of The University Of California Chemically modified viral capsids as targeted delivery vectors for diagnostic and therapeutic agents
WO2007121947A1 (en) 2006-04-20 2007-11-01 Silence Therapeutics Ag. Lipoplex formulations for specific delivery to vascular endothelium
US7915399B2 (en) 2006-06-09 2011-03-29 Protiva Biotherapeutics, Inc. Modified siRNA molecules and uses thereof
EP2046266A4 (en) 2006-07-21 2009-11-04 Massachusetts Inst Technology ENDMODICIFIED POLY (BETA AMINO ESTER) AND ITS USE
JP2008078613A (ja) 2006-08-24 2008-04-03 Rohm Co Ltd 窒化物半導体の製造方法及び窒化物半導体素子
US20100099858A1 (en) 2006-09-28 2010-04-22 Mirkin Chad A Maximizing Oligonucleotide Loading on Gold Nanoparticle
CN110066224A (zh) 2006-10-03 2019-07-30 阿尔尼拉姆医药品有限公司 含脂质的制品
EP2225002A4 (en) 2007-12-31 2011-06-22 Nanocor Therapeutics Inc RNA INTERFERENCE FOR THE TREATMENT OF CARDIAC SUFFICIENCIES
US9688718B2 (en) 2008-01-11 2017-06-27 Lawrence Livermore National Security, Llc Nanolipoprotein particles comprising hydrogenases and related products, methods and systems
US20090215879A1 (en) 2008-02-26 2009-08-27 University Of North Carolina At Chapel Hill Methods and compositions for adeno-associated virus (aav) with hi loop mutations
PL2279254T3 (pl) 2008-04-15 2017-11-30 Protiva Biotherapeutics Inc. Nowe preparaty lipidowe do dostarczania kwasów nukleinowych
EP2283029A1 (en) 2008-06-04 2011-02-16 Medical Research Council Peptides
EP2323630B1 (en) 2008-06-30 2014-11-19 Silenseed Ltd Methods, compositions and systems for local delivery of drugs
EP2309980A1 (en) 2008-07-08 2011-04-20 S.I.F.I. Societa' Industria Farmaceutica Italiana Ophthalmic compositions for treating pathologies of the posterior segment of the eye
US9273296B2 (en) 2008-09-08 2016-03-01 Cellectis Meganuclease variants cleaving a DNA target sequence from a glutamine synthetase gene and uses thereof
CN102264915B (zh) 2008-10-29 2014-04-16 桑格摩生物科学股份有限公司 失活谷氨酰胺合成酶基因表达的方法和组合物
EP2344578A2 (en) 2008-10-30 2011-07-20 David Liu Micro-spherical porous biocompatible scaffolds and methods and apparatus for fabricating same
AU2009311667B2 (en) 2008-11-07 2016-04-14 Massachusetts Institute Of Technology Aminoalcohol lipidoids and uses thereof
US20110023145A1 (en) 2008-12-04 2011-01-27 Sigma-Aldrich Co. Genomic editing of genes involved in autism spectrum disorders
US8734816B2 (en) 2009-01-05 2014-05-27 Stc.Unm Porous nanoparticle supported lipid bilayer nanostructures
WO2010129602A2 (en) 2009-05-04 2010-11-11 Fred Hutchinson Cancer Research Center Cocal vesiculovirus envelope pseudotyped retroviral vectors
IL292615B2 (en) 2009-07-01 2023-11-01 Protiva Biotherapeutics Inc Nucleic acid-lipid particles, preparations containing them and their uses
WO2011000108A1 (en) 2009-07-01 2011-01-06 Protiva Biotherapeutics, Inc. Compositions and methods for silencing apolipoprotein b
WO2011028929A2 (en) 2009-09-03 2011-03-10 The Regents Of The University Of California Nitrate-responsive promoter
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US8956828B2 (en) 2009-11-10 2015-02-17 Sangamo Biosciences, Inc. Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases
US20110152957A1 (en) 2009-12-21 2011-06-23 Cem Shaquer Chaos-based detection of atrial fibrillation using an implantable medical device
US20110200582A1 (en) 2009-12-23 2011-08-18 Novartis Ag Lipids, lipid compositions, and methods of using them
DK201070194A (en) 2010-05-08 2011-11-09 Univ Koebenhavn A method of stabilizing mRNA
US8372951B2 (en) 2010-05-14 2013-02-12 National Tsing Hua University Cell penetrating peptides for intracellular delivery
ES2536791T3 (es) 2010-05-28 2015-05-28 Oxford Biomedica (Uk) Ltd Administración de vectores lentivirales al cerebro
EP2609135A4 (en) 2010-08-26 2015-05-20 Massachusetts Inst Technology POLY (BETA-AMINO ALCOHOLS), THEIR PREPARATION AND USES THEREOF
US20120190609A1 (en) 2010-08-30 2012-07-26 Martin Bader Method for producing a lipid particle, the lipid particle itself and its use
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
WO2012135025A2 (en) 2011-03-28 2012-10-04 Massachusetts Institute Of Technology Conjugated lipomers and uses thereof
WO2012135805A2 (en) 2011-03-31 2012-10-04 modeRNA Therapeutics Delivery and formulation of engineered nucleic acids
US20120295960A1 (en) 2011-05-20 2012-11-22 Oxford Biomedica (Uk) Ltd. Treatment regimen for parkinson's disease
EP3069785A1 (en) 2011-10-25 2016-09-21 The University Of British Columbia Limit size lipid nanoparticles and related methods
WO2013064911A2 (en) 2011-11-04 2013-05-10 Nitto Denko Corporation Single use system for sterilely producing lipid-nucleic acid particles
FI123955B (en) 2011-11-25 2014-01-15 Oncos Therapeutics Ltd Oncolytic adenovirus
US20140308304A1 (en) 2011-12-07 2014-10-16 Alnylam Pharmaceuticals, Inc. Lipids for the delivery of active agents
CN104114572A (zh) 2011-12-16 2014-10-22 现代治疗公司 经修饰的核苷、核苷酸和核酸组合物
US20130185823A1 (en) 2012-01-16 2013-07-18 Academia Sinica Mesoporous silica nanoparticle-mediated delivery of dna into arabidopsis root
PT2825156T (pt) * 2012-03-16 2017-11-02 Merck Patent Gmbh Aminoácidos lipídicos de direcionamento
BR112014004528A2 (pt) 2012-04-18 2019-09-24 Arrowhead Res Corp polímeros de poli(acrilato) para entrega de ácido nucleico in vivo
EP2877213B1 (en) 2012-07-25 2020-12-02 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
ES2883590T3 (es) 2012-12-12 2021-12-09 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
PT2931898E (pt) 2012-12-12 2016-06-16 Harvard College Manipulação e otimização de sistemas, métodos e composições para manipulação de sequências com domínios funcionais
CN113528577A (zh) 2012-12-12 2021-10-22 布罗德研究所有限公司 用于序列操纵的系统、方法和优化的指导组合物的工程化
ES2701749T3 (es) 2012-12-12 2019-02-25 Broad Inst Inc Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
WO2014093701A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
DK2898075T3 (en) 2012-12-12 2016-06-27 Broad Inst Inc CONSTRUCTION AND OPTIMIZATION OF IMPROVED SYSTEMS, PROCEDURES AND ENZYME COMPOSITIONS FOR SEQUENCE MANIPULATION
CN114634950A (zh) 2012-12-12 2022-06-17 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
PL2784162T3 (pl) 2012-12-12 2016-01-29 Broad Inst Inc Opracowanie systemów, metod oraz zoptymalizowanych kompozycji przewodnikowych do manipulacji sekwencyjnej
WO2014118272A1 (en) 2013-01-30 2014-08-07 Santaris Pharma A/S Antimir-122 oligonucleotide carbohydrate conjugates
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US9693958B2 (en) 2013-03-15 2017-07-04 Cureport, Inc. Methods and devices for preparation of lipid nanoparticles
WO2014186366A1 (en) 2013-05-13 2014-11-20 Tufts University Nanocomplexes for delivery of saporin
WO2014186348A2 (en) 2013-05-14 2014-11-20 Tufts University Nanocomplexes of modified peptides or proteins
EP3470530B1 (en) 2013-05-23 2020-11-25 The Board of Trustees of the Leland Stanford Junior University Transposition into native chromatin for analysis ofchromatin
EP3011033B1 (en) 2013-06-17 2020-02-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
ES2777217T3 (es) 2013-06-17 2020-08-04 Broad Inst Inc Suministro, modificación y optimización de sistemas de guía en tándem, métodos y composiciones para la manipulación de secuencias
DK3011031T3 (da) 2013-06-17 2020-12-21 Broad Inst Inc Fremføring og anvendelse af crispr-cas-systemerne, vektorer og sammensætninger til levermålretning og -terapi
JP6665088B2 (ja) 2013-06-17 2020-03-13 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための最適化されたCRISPR−Cas二重ニッカーゼ系、方法および組成物
ES2767318T3 (es) 2013-06-17 2020-06-17 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para generar modelos y actuar sobre enfermedades y trastornos de células posmitóticas
TW201534578A (zh) 2013-07-08 2015-09-16 Daiichi Sankyo Co Ltd 新穎脂質
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
WO2015048577A2 (en) 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
CN112618732A (zh) 2013-10-22 2021-04-09 夏尔人类遗传性治疗公司 用于递送信使rna的脂质制剂
CN106459995B (zh) 2013-11-07 2020-02-21 爱迪塔斯医药有限公司 使用统治型gRNA的CRISPR相关方法和组合物
US9365610B2 (en) 2013-11-18 2016-06-14 Arcturus Therapeutics, Inc. Asymmetric ionizable cationic lipid for RNA delivery
CN105873568B (zh) 2013-12-05 2019-10-08 赛伦斯治疗有限公司 用于肺特异性递送的工具
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
WO2015089473A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
JP2017501149A (ja) 2013-12-12 2017-01-12 ザ・ブロード・インスティテュート・インコーポレイテッド 粒子送達構成成分を用いた障害及び疾患の標的化のためのcrispr−cas系及び組成物の送達、使用及び治療適用
MX2016007324A (es) 2013-12-12 2017-03-06 Broad Inst Inc Suministro, uso y aplicaciones terapeuticas de los sistemas y composiciones crispr-cas para actuar sobre hbv y trastornos y enfermedades virales.
KR20160089527A (ko) 2013-12-12 2016-07-27 더 브로드 인스티튜트, 인코퍼레이티드 게놈 편집을 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료적 응용
EP3080260B1 (en) 2013-12-12 2019-03-06 The Broad Institute, Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
CA2932436A1 (en) 2013-12-12 2015-06-18 The Broad Institute, Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
CA2933134A1 (en) 2013-12-13 2015-06-18 Cellectis Cas9 nuclease platform for microalgae genome engineering
EP3114227B1 (en) 2014-03-05 2021-07-21 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
US9938521B2 (en) 2014-03-10 2018-04-10 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating leber's congenital amaurosis 10 (LCA10)
AU2015236128A1 (en) 2014-03-25 2016-11-10 Editas Medicine Inc. CRISPR/CAS-related methods and compositions for treating HIV infection and AIDS
WO2015148863A2 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
WO2015148860A1 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating beta-thalassemia
EP3540061A1 (en) 2014-04-02 2019-09-18 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating primary open angle glaucoma
SG10201912171PA (en) 2014-04-18 2020-02-27 Editas Medicine Inc Crispr-cas-related methods, compositions and components for cancer immunotherapy
CN106604994B (zh) 2014-06-23 2021-12-14 通用医疗公司 通过测序评估的DSBs的全基因组无偏鉴定(GUIDE-Seq)
WO2016011381A1 (en) * 2014-07-18 2016-01-21 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Reducing cxcr4 expression and/or function to enhance engraftment of hematopoietic stem cells
US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
DK3180426T3 (da) 2014-08-17 2020-03-30 Broad Inst Inc Genomredigering ved anvendelse af cas9-nickaser
WO2016027264A1 (en) 2014-08-21 2016-02-25 Ramot At Tel-Aviv University Ltd. Targeted liposomes encapsulating iron complexes and their uses
WO2016049163A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
AU2015343307B2 (en) 2014-11-06 2021-05-20 Iff Us Holding, Llc Peptide-mediated delivery of RNA-guided endonuclease into cells
KR20240013283A (ko) * 2014-12-03 2024-01-30 애질런트 테크놀로지스, 인크. 화학적 변형을 갖는 가이드 rna
EP3985115A1 (en) 2014-12-12 2022-04-20 The Broad Institute, Inc. Protected guide rnas (pgrnas)
WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
WO2016100562A1 (en) 2014-12-16 2016-06-23 Danisco Us Inc Compositions and methods for helper strain-mediated fungal genome modification
KR102350405B1 (ko) 2014-12-16 2022-01-11 다니스코 유에스 인크. 진균 게놈 변형 시스템 및 사용 방법
BR112017012765A2 (pt) 2014-12-17 2018-01-16 Du Pont ?métodos para editar uma sequência de nucleotídeos, célula e linhagem de e. coli e método para produzir uma célula de e. coli?
US11172675B2 (en) 2014-12-22 2021-11-16 Oro Agri Inc. Nano particulate delivery system
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
EP3702456A1 (en) 2014-12-24 2020-09-02 The Broad Institute, Inc. Crispr having or associated with destabilization domains
US20180155708A1 (en) * 2015-01-08 2018-06-07 President And Fellows Of Harvard College Split Cas9 Proteins
WO2016124765A1 (en) * 2015-02-06 2016-08-11 Cellectis Primary hematopoietic cells genetically engineered by slow release of nucleic acids using nanoparticles
AU2016245347B2 (en) 2015-04-10 2021-01-28 Feldan Bio Inc. Polypeptide-based shuttle agents for improving the transduction efficiency of polypeptide cargos to the cytosol of target eukaryotic cells, uses thereof, methods and kits relating to same
DK3310764T3 (da) 2015-06-19 2023-07-17 Massachusetts Inst Technology Alkenylsubstituerede 2,5-piperazindioner og deres anvendelse i sammensætninger til overførsel af et middel til et individ eller en celle
US20180208945A1 (en) 2015-07-28 2018-07-26 Danisco Us Inc. Genome editing systems and methods of use
AU2016326695B2 (en) 2015-09-23 2019-11-28 Massachusetts Institute Of Technology Compositions and methods for modified dendrimer nanoparticle vaccine delivery
DK3362560T3 (da) 2015-10-12 2022-11-07 Dupont Us Holding Llc Beskyttede dna-templater til genmodificering og forøget homolog rekombination i celler og fremgangsmåder til anvendelse
AU2016342038B2 (en) 2015-10-22 2022-09-08 Massachusetts Institute Of Technology Type VI-B CRISPR enzymes and systems
WO2017100158A1 (en) 2015-12-11 2017-06-15 Danisco Us Inc. Methods and compositions for enhanced nuclease-mediated genome modification and reduced off-target site effects
EP3390631B1 (en) 2015-12-18 2020-04-08 Danisco US Inc. Methods and compositions for t-rna based guide rna expression
EP3390632A1 (en) 2015-12-18 2018-10-24 Danisco US Inc. Methods and compositions for polymerase ii (pol-ii) based guide rna expression
WO2018035388A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140359799A1 (en) * 2011-12-23 2014-12-04 Case Western Reserve University Targeted gene modification using hybrid recombinant adeno-associated virus
CN105793425A (zh) * 2013-06-17 2016-07-20 布罗德研究所有限公司 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用
WO2015089364A1 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
WO2016049251A1 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
US20160208243A1 (en) * 2015-06-18 2016-07-21 The Broad Institute, Inc. Novel crispr enzymes and systems

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
IAN M. SLAYMAKER ET AL.: ""Rationally engineered Cas9 nucleases with improved specificity"" *
IAN M. SLAYMAKER ET AL.: ""Rationally engineered Cas9 nucleases with improved specificity"", 《SCIENCE》 *
IAN M. SLAYMAKER ET AL.: ""Rationally engineered Cas9 nucleases with improved specificity"", 《SCIENCE》, vol. 351, no. 6268, 17 December 2015 (2015-12-17), pages 84 - 88 *
IAN M. SLAYMAKER ET AL.: ""Rationally engineered Cas9 nucleases with improved specificity"", 《SCIENCE》, vol. 351, no. 6268, pages 84 - 10 *
LUHAN YANG ET AL.: ""Targeted and genome-wide sequencing reveal single nucleotide variations impacting specificity of Cas9 in human stem cells"", 《NATURE COMMUNICATIONS》, vol. 5, pages 1 - 6 *
PATRICK D. HSU ET AL.: ""Development and Applications of CRISPR-Cas9 for Genome Engineering"" *
PATRICK D. HSU ET AL.: ""Development and Applications of CRISPR-Cas9 for Genome Engineering"", 《CELL》, vol. 157, pages 1262 - 1278 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11926839B2 (en) * 2017-04-18 2024-03-12 Yale University Platform for T lymphocyte genome engineering and in vivo high-throughput screening thereof
US20220259616A1 (en) * 2017-04-18 2022-08-18 Yale University A Platform for T Lymphocyte Genome Engineering and In Vivo High-Throughput Screening Thereof
CN114555826A (zh) * 2019-08-16 2022-05-27 杰克逊实验室 非重复基因组基因座的活细胞成像
CN110511286B (zh) * 2019-08-29 2022-08-02 上海科技大学 一种rna碱基编辑分子
CN110511286A (zh) * 2019-08-29 2019-11-29 上海科技大学 一种rna碱基编辑分子
CN110424039B (zh) * 2019-09-16 2021-08-10 东北大学 基于水滑石纳米缓蚀微胶囊的镁合金耐蚀自修复微弧氧化涂层的制备方法
CN110424039A (zh) * 2019-09-16 2019-11-08 东北大学 基于水滑石纳米缓蚀微胶囊的镁合金耐蚀自修复微弧氧化涂层的制备方法
CN110628737A (zh) * 2019-10-14 2019-12-31 南京农业大学 一个调控黄瓜矮化性状相关基因及其应用
CN110628737B (zh) * 2019-10-14 2022-06-07 南京农业大学 一个调控黄瓜矮化性状相关基因及其应用
CN113046392A (zh) * 2019-12-27 2021-06-29 深圳华大生命科学研究院 治疗β-球蛋白功能缺失的重组慢病毒载体及制备方法和应用
CN113046392B (zh) * 2019-12-27 2023-04-07 深圳市禾沐基因生物技术有限责任公司 治疗β-球蛋白功能缺失的重组慢病毒载体及制备方法和应用
CN114480474B (zh) * 2020-11-11 2023-06-06 海南师范大学 一种海洋微拟球藻转录激活CRISPRa系统的构建及其应用
CN114480474A (zh) * 2020-11-11 2022-05-13 海南师范大学 一种海洋微拟球藻转录激活CRISPRa系统的构建及其应用
CN114586735A (zh) * 2020-12-04 2022-06-07 南京大学 Pparg基因定点突变小鼠模型的构建与应用
CN114586735B (zh) * 2020-12-04 2024-02-09 南京大学 Pparg基因定点突变小鼠模型的构建与应用
CN112941075B (zh) * 2021-02-02 2023-02-10 同济大学 一种构建甲状腺功能障碍及心脏长qt综合征双表型大鼠模型的方法
CN112941075A (zh) * 2021-02-02 2021-06-11 同济大学 一种构建甲状腺功能障碍及心脏长qt综合征双表型大鼠模型的方法
WO2022166954A1 (en) * 2021-02-07 2022-08-11 Huigene Therapeutics Co., Ltd. Rna adeno-associated virus (raav) vector and uses thereof
CN115209924A (zh) * 2021-02-07 2022-10-18 辉大(上海)生物科技有限公司 Rna腺相关病毒(raav)载体及其用途
WO2023066413A1 (zh) * 2021-10-21 2023-04-27 中国农业科学院生物技术研究所 Dmp蛋白及其编码基因与应用
CN114639442A (zh) * 2022-03-30 2022-06-17 中国农业科学院农业基因组研究所 一种基于单核苷酸多态性预测开放阅读框的方法及系统
CN114639442B (zh) * 2022-03-30 2024-01-30 中国农业科学院农业基因组研究所 一种基于单核苷酸多态性预测开放阅读框的方法及系统
CN116268138A (zh) * 2023-04-26 2023-06-23 四川轻化工大学 一种提升藏茶中茶多糖含量的方法
CN116268138B (zh) * 2023-04-26 2024-05-03 四川轻化工大学 一种提升藏茶中茶多糖含量的方法

Also Published As

Publication number Publication date
EP3500671A1 (en) 2019-06-26
WO2018035388A1 (en) 2018-02-22
EP3500671A4 (en) 2020-07-29
US20200080112A1 (en) 2020-03-12
US11352647B2 (en) 2022-06-07
US20230108784A1 (en) 2023-04-06
US20240018552A1 (en) 2024-01-18

Similar Documents

Publication Publication Date Title
JP7280312B2 (ja) 新規crispr酵素及び系
CN110114461A (zh) 新型crispr酶和系统
US20220162584A1 (en) Cpf1 complexes with reduced indel activity
CN110312799A (zh) 新型crispr酶和系统
AU2017257274B2 (en) Novel CRISPR enzymes and systems
TWI813532B (zh) 降低脱靶效應的crispr酶突變
US20210079366A1 (en) Cas12a systems, methods, and compositions for targeted rna base editing
EP3728576A1 (en) Cas12b systems, methods, and compositions for targeted rna base editing
JP2021532815A (ja) 新規Cas12b酵素およびシステム
EP3728575A1 (en) Cas12b systems, methods, and compositions for targeted dna base editing
WO2017106657A1 (en) Novel crispr enzymes and systems
TWI837592B (zh) 新型crispr酶以及系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination