CN111886341A - 使用crispr的高效体内敲入 - Google Patents

使用crispr的高效体内敲入 Download PDF

Info

Publication number
CN111886341A
CN111886341A CN201880090785.2A CN201880090785A CN111886341A CN 111886341 A CN111886341 A CN 111886341A CN 201880090785 A CN201880090785 A CN 201880090785A CN 111886341 A CN111886341 A CN 111886341A
Authority
CN
China
Prior art keywords
vector
sgrna
host cell
gene
locus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880090785.2A
Other languages
English (en)
Inventor
冯波
何向军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Publication of CN111886341A publication Critical patent/CN111886341A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了用于体内基因组编辑的组合物、方法和试剂盒。本发明还提供了用于治疗体细胞组织疾病的组合物、方法和试剂盒。

Description

使用CRISPR的高效体内敲入
相关申请
本申请要求2018年1月5日提交的美国专利申请号62/614,229的优先权,出于所有目的将其全部内容通过引用以其全文特此并入。
发明背景
已经证明基因组编辑工具,例如锌指核酸酶(ZFN)(Urnov等人.,Nature ReviewGenetics,11:636-46(2010))、转录激活因子样效应物核酸酶(TALEN)(Sung等人.,NatureBiotechnology,31:23-24(2013)和成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关蛋白9(Cas9)(Cho等人.,Nature Biotechnology,31:230-2(2013))是用于产生经遗传修饰的细胞和动物的有效工具。
基因组编辑工具能以多种不同的方式起作用,包括通过缺失、插入、突变或取代特定的核酸序列来改变细胞的基因组。这些基因组改变可以是基因特异性的或位置特异性的。上述经工程化的核酸酶可以切割细胞基因组中明确的DNA序列以产生DNA双链断裂(DSB),并通过非同源末端连接(NHEJ)或同源定向重组(HDR)修复机制刺激DNA修复(Kim等人.,Nature Review Genetics,15:321-34,(2014))。通常,“敲除”基因被认为比“敲入”基因更容易,因为通过核酸酶复合物引入基因组的DSB被NHEJ更快地修复。NHEJ诱导的突变比HDR介导的遗传修饰发生的频率更高,因为NHEJ贯穿整个细胞周期发生,而HDR仅在S和G2期发生(Deriano和Roth,Annu.Rev,Genet.[遗传学年度评论],47:433-55,(2013))。因此,与NHEJ诱导的突变相比,HDR介导的精确遗传修饰的效率相对较低(Lombardo等人.,Nat.Biotechnol.,25,1298-1306,2007)。
基因疗法是治疗遗传性疾病的有前景的策略,但由于治疗性基因向活组织递送的低效以及当前技术提供的不稳定性和短暂性表达,在过去的二十年中,基因疗法一直受到很大的阻碍。
迄今为止,使用经工程化的核酸酶的两种基因组编辑方法-基因破坏和基因校正-已在治疗应用中显示出显著的前景。基因破坏涉及刺激NHEJ以在遗传元件中创建靶向的插入缺失(indel),通常会导致对受试者有益的功能丧失(LOF)突变。相反,基因校正使用HDR直接逆转引起疾病的突变,恢复功能,同时保留经校正的元件的生理调节。HDR还可以用于将治疗性转基因插入基因组中明确的“安全港(safe harbor)”基因座以恢复缺失的基因功能。然而,通过HDR在体内敲入治疗性基因的效率非常低。
NHEJ是一种DNA修复机制,通过所述机制,一个或多个核苷酸从DSB的末端插入或缺失(插入缺失)以促进断裂末端的连接(Lieber,Annu.Rev.Biochem.,79,181-211,(2010))。NHEJ介导的DSB修复通常会导致移码突变,从而引入提前终止密码子或导致无义介导的mRNA转录物衰变——有效地“敲除”所述基因。先前,并未考虑用NHEJ将基因插入细胞的基因组中,因为为了获得功能性基因和所得蛋白质,需要更高的插入精度来避免移码突变。
因此,基因“敲入”方法常规地依赖于HDR,一种更精确但效率较低的DNA修复机制,其依赖于DNA模板进行DNA修复。例如,研究人员已经报道,当NHEJ DNA修复途径被抑制时(例如,通过失活连接酶IV、KU70和KU80(Chu等人,Nature Biotechnology,33,543-548(2015));通过引入SCR7(Lin等人.,Scientific Reports,6,34531(2016))),或当HDR DNA修复途径增强时(例如,通过共表达RAD52(Shao等人,International Journal ofBiochemistry and Cell Biology,In Press,(2017)),或通过施用AcrIIA4来使Cas9无法切口(Shin等人.,Science Advances,3,1701620(2017))),由CRISPR/Cas9系统介导的基因组编辑被增强。
本发明人先前使用无同源性供体检测了外源DNA的体外基因组整合(美国临时专利申请号62/256,514和62/288,974;美国专利申请号15/354,329;和He,X.,等人.Knock-inof large reporter genes in human cells via CRISPR/Cas9-induced homology-dependent and independent DNA repair.Nucleic Acids Res 44,e85(2016))。结果表明CRISPR/Cas9偶联的NHEJ修复机制能以高效率介导大DNA片段的敲入;并且本文建立的新型敲入方法在所有经检测的人细胞系中均显著优于通常使用的基于HDR的敲入策略(美国临时专利申请号62/256,514和62/288,974;美国专利申请号15/354,329;和He,X.,等人.Knock-in of large reporter genes in human cells via CRISPR/Cas9-inducedhomology-dependent and independent DNA repair.Nucleic Acids Res 44,e85(2016))。
在这里,发明人证明了使用基因特异性供体载体,结合基因座特异性辅助构建体和通用型辅助构建体,通过CRISPR/Cas9偶联的NHEJ将大的DNA片段(包括基因)体内“敲入”到活生物体的体细胞组织中,以有效地将所需基因插入宿主细胞基因组中预先选定的基因座中。大DNA片段(例如本文使用的基因)的靶向基因组整合的发展提供了长期基因表达的潜力,从而导致产生足够水平的编码蛋白或mRNA以治疗活生物体中的各种疾病。
发明简述
在第一方面,本发明提供了用于将所需基因插入宿主细胞基因组中选定的基因座的方法,例如,插入在所选遗传基因座的3’UTR处,其中所述宿主细胞在活生物体内。通过NHEJ修复机制进行操作,所述方法包括使宿主细胞或活生物体与以下项接触的步骤:(i)供体载体,其编码所需基因、任选的在基因5’端处的内部核糖体进入位点(ires)元件、以及一个或两个sgRNA靶位点;(ii)基因座特异性辅助载体,其编码至少一个(任选地多于一个,例如两个或更多个)与宿主细胞基因组中选定的核酸序列互补的sgRNA;(iii)通用型辅助载体,其编码至少一个与供体载体中一个或两个sgRNA靶位点互补的sgRNA,例如,所述靶位点在所选基因座的3’UTR处;以及如果所述基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpf1蛋白时的(iv)Cas或Cpf1蛋白,从而使所述供体载体线性化以形成供体DNA片段,从而供体DNA片段通过NHEJ介导的敲入进入活生物体的宿主细胞基因组。(iv)中的所述Cas或Cpf1蛋白能以其蛋白质形式或以其编码多核苷酸序列的形式(例如,包含编码Cas或Cpf1蛋白的多核苷酸序列并能够指导所述蛋白质表达的表达盒或载体)提供。在一些实施方案中,所述基因座特异性辅助载体和通用型辅助载体可以组合为一个载体,从而携带基因座特异性sgRNA和通用型sgRNA两者。在一些实施方案中,宿主细胞在活生物体的肝内。在一些实施方案中,宿主细胞是活生物体的造血干细胞。在一个实施方案中,宿主细胞是活生物体内的体细胞。
在一个实施方案中,所述方法进一步包括从获得自所述活生物体的样品中检测由插入的所需基因编码的蛋白质或RNA。在一个实施方案中,所述样品包括获得自所述活生物体的组织的组织切片、血液样品、活组织检查物或细胞裂解物。
在另一个实施方案中,所述方法进一步包括对从获得自所述活生物体的样品中NHEJ介导敲入的所需基因的功能性进行评估。在一个实施方案中,评估NHEJ介导敲入的所需基因的功能性包括对活生物体组织中基因表达产物(例如mRNA和蛋白质)的水平、量或相对量进行评价。
在一个实施方案中,所述供体载体具有单一的(即,仅一个)sgRNA靶位点。在另一个实施方案中,所述供体载体具有两个sgRNA靶位点,其中所述sgRNA靶位点中的每个与宿主细胞基因组中的不同核酸序列互补。在另一个实施方案中,所述两个sgRNA靶位点可以被设计为使得它们靶向相同的基因组区域(例如,相同的内含子、外显子或相同的UTR区),但靶向该基因组区域中不同的核酸序列(例如,彼此的上游或下游)。
在一个实施方案中,所述供体载体具有单一的(即,仅一个)目的基因。在一些实施方案中,所需基因包括任何基因。在另一个实施方案中,所需基因与遗传性疾病相关联。在又另一个实施方案中,所需基因是已知直接导致遗传病的进展或发作的基因(例如,对于糖尿病而言的胰岛素或对于乙型血友病而言的因子IX)。在另一个实施方案中,所述供体载体可以包含两种目的基因。在又另一个实施方案中,所述供体载体可以包含一种或多种目的基因。
在一个实施方案中,所述基因座特异性辅助载体编码Cas9或Cpf1。在另一个实施方案中,所述通用型辅助载体编码Cas9或Cpf1。在一个实施方案中,所述基因座特异性辅助载体或所述通用型辅助载体编码Cas蛋白。
在一些实施方案中,所述供体载体、基因座特异性辅助载体和/或通用型辅助载体选自质粒、AAV病毒颗粒、腺病毒颗粒、慢病毒颗粒和DNA纳米颗粒复合物。在一个实施方案中,所述供体载体是质粒或AAV病毒颗粒。在另一个实施方案中,所述基因座特异性辅助载体是质粒或AAV病毒颗粒。在又另一个实施方案中,所述通用型辅助载体是质粒或AAV病毒颗粒。在一个实施方案中,所述供体载体、基因座特异性辅助载体和/或通用型辅助载体均是质粒或均是病毒载体。在另一个实施方案中,所述供体载体、基因座特异性辅助载体和/或通用型辅助载体均是AAV病毒载体。
在一个实施方案中,所述活生物体是人或非人动物。在一个实施方案中,所述活生物体是患有糖尿病、血友病、镰状细胞性贫血、囊胞性纤维症、杜氏肌营养不良、血色沉着病、先天性聋、家族性高胆固醇血症、亨廷顿病、泰-萨病(Tay-Sachs)或苯丙酮尿症的人。在一个实施方案中,所述活生物体是被诊断为、被怀疑为患有基因遗传性疾病或正在遭受基因遗传性疾病的人。在另一个实施方案中,所述活生物体是被诊断为、被怀疑为患有乙型血友病或正在遭受乙型血友病的人。在一个实施方案中,所述活生物体是被诊断为、被怀疑为患有糖尿病或正在遭受糖尿病的人。
在一个实施方案中,所述供体载体编码人基因。在一个实施方案中,所述供体载体编码人基因和单一sgRNA靶位点。在一个实施方案中,所述供体载体编码一个或多个人基因和一个或多个sgRNA靶位点。在一个实施方案中,所述供体载体编码hINS基因和单一sgRNA靶位点。在一些实施方案中,所述供体载体编码hINS基因和两个sgRNA靶位点。在另一个实施方案中,所述供体载体编码hF9基因和单一sgRNA靶位点。在一些实施方案中,所述供体载体编码hF9基因和两个sgRNA靶位点。
在一个实施方案中,用于插入所需基因的选定的基因座是Actb、Alb或GAPDH。
在一个实施方案中,所述基因座特异性辅助载体和所述通用型辅助载体各自编码单一sgRNA。在一个实施方案中,所述基因座特异性辅助载体和所述通用型辅助载体的sgRNA包含约20个核苷酸的核酸区,所述核酸区与宿主细胞基因组中的选定的核酸序列互补。
在第二方面,本发明提供了用于在受试者中治疗体细胞组织疾病的方法。所述方法包括向有需要的受试者施用治疗有效量的以下项的步骤:(a)供体载体,其编码所需基因和一个或两个sgRNA靶位点;(b)基因座特异性辅助载体,其编码至少一个(任选地多于一个,例如两个或更多个)与宿主细胞基因组中选定的核酸序列互补的sgRNA;(c)通用型辅助载体,其编码至少一个与所述供体载体中一个或两个sgRNA靶位点互补的sgRNA;以及如果所述基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(d)Cas或Cpfl蛋白,从而治疗受试者的体细胞组织疾病。(iv)中的所述Cas或Cpf1蛋白能以其蛋白质形式或以其编码多核苷酸序列的形式(例如,包含编码Cas或Cpf1蛋白的多核苷酸序列并能够指导所述蛋白质表达的表达盒或载体)提供。在一些实施方案中,所述基因座特异性辅助载体和通用型辅助载体可以组合为一个载体,从而携带基因座特异性sgRNA和通用型sgRNA两者。
在一个实施方案中,所述供体载体具有单一sgRNA靶位点。在另一个实施方案中,所述供体载体具有两个sgRNA靶位点,其中所述sgRNA靶位点中的每个与宿主细胞基因组中的不同核酸序列互补。在另一个实施方案中,所述两个sgRNA靶位点可以被设计为使得它们靶向相同的基因组区域(例如,相同的内含子、外显子或相同的UTR区),但靶向该基因组区域中不同的核酸序列(例如,彼此的上游或下游)。
在一个实施方案中,所述方法进一步包括在来自受试者的样品中检测由所需基因编码的基因产物的表达。在一些实施方案中,所述基因表达产物包括由所需基因表达的mRNA转录物和蛋白质。
在另一个实施方案中,所述方法进一步包括确认由所需基因编码的RNA或蛋白质的表达足以治疗体细胞组织疾病。在一个实施方案中,确认由所需基因编码的RNA或蛋白质的表达可以包括在向受试者施用后对由所需基因编码的RNA或蛋白质的水平、量或相对量进行检测(例如,可视化)、测量、定量一段时间。在一些实施方案中,所述确认可以包括一种或多种基因表达测定或一种或多种蛋白质测定。在一些实施方案中,所述确认可以包括通过荧光显微法对蛋白质可视化。在一个实施方案中,向受试者施用后的所述一段时间的范围可以是向受试者施用后的2天至一年。在另一个实施方案中,施用后的所述一段时间可以包括规律的时间间隔,例如每周一次、每月一次、每两个月一次或每季度一次。在一些实施方案中,施用后的所述一段时间为施用后少于一个月,并且任选地,每月或每季度进行一次随访以确认样品中基因产物的持续表达。
在一个实施方案中,所述体细胞组织疾病是遗传性疾病。在另一个实施方案中,所述体细胞组织疾病是代谢性障碍。在一些情况下,所述体细胞组织疾病是由单一基因的突变导致的疾病。在一些实施方案中,所述遗传性疾病选自糖尿病、血友病、镰状细胞性贫血、囊胞性纤维症、杜氏肌营养不良、血色沉着病、先天性聋、家族性高胆固醇血症、亨廷顿病、泰-萨病或苯丙酮尿症。在一个实施方案中,所述体细胞组织疾病是血友病。在另一个实施方案中,所述体细胞组织疾病是1型糖尿病。
在第三方面,本发明提供了用于治疗体细胞组织疾病的试剂盒,所述试剂盒包含至少如下这些组分:(i)包含供体载体的第一容器,其中所述供体载体编码所需基因和一个或两个sgRNA靶位点;(ii)包含基因座特异性辅助载体的第二容器,其中所述基因座特异性辅助载体编码至少一个(任选地多于一个,例如两个或更多个)与宿主细胞基因组中选定的核酸序列互补的sgRNA;和(iii)包含通用型辅助载体的第三容器,其中所述通用型辅助载体编码至少一个与供体载体中的一个或两个sgRNA靶位点互补的sgRNA。在一些实施方案中,所述基因座特异性辅助载体和通用型辅助载体可以组合为一个载体,从而携带基因座特异性sgRNA和通用型sgRNA两者,并且该组合的载体被放置在除(i)中所述的第一容器之外的单独容器中。
在一个实施方案中,所述试剂盒进一步包含Cas或Cpf1蛋白或编码Cas或Cpfl蛋白的核酸(例如,包含编码Cas或Cpf1蛋白的多核苷酸序列并能够指导所述蛋白质表达的表达盒或载体)。在一个实施方案中,所述试剂盒包含试剂盒的使用说明或说明手册。在一个实施方案中,所述试剂盒进一步包含宿主细胞。在一些实施方案中,所述试剂盒中的宿主细胞是来自活生物体体细胞组织的宿主细胞。在另一个实施方案中,所述试剂盒中的宿主细胞是生殖细胞。在一些实施方案中,所述第一、第二和第三容器可以进一步包含一种或多种另外的试剂或用于储存或保持所述供体载体、通用型辅助载体和基因座特异性辅助载体的防腐剂。
在一个实施方案中,所述供体载体编码单一sgRNA靶位点。在另一个实施方案中,所述通用型辅助载体和所述基因座特异性辅助载体二者均编码单一sgRNA。在一些实施方案中,所述通用型辅助载体和所述基因座特异性辅助载体二者均编码两个sgRNA,总计四个不同的sgRNA。
在第四方面,本发明提供了用于在体内基因组编辑的组合物,所述组合物包含至少如下这些组分:(i)供体载体,其中所述供体载体编码所需基因和一个或两个sgRNA靶位点;(ii)基因座特异性辅助载体,其中所述基因座特异性辅助载体编码至少一个(任选地多于一个,例如两个或更多个)与宿主细胞基因组中选定的核酸序列互补的小指导RNA(sgRNA);(iii)通用型辅助载体,其中所述通用型辅助载体编码至少一个与所述供体载体中的一个或两个sgRNA靶位点互补的sgRNA;和(iv)宿主细胞,其中所述宿主细胞是活生物体内的体细胞。在一些实施方案中,所述基因座特异性辅助载体和通用型辅助载体可以组合为一个载体,从而携带基因座特异性sgRNA和通用型sgRNA两者。
在一些实施方案中,所述宿主细胞是动物细胞。在一些实施方案中,所述宿主细胞是非人动物细胞(比如啮齿动物细胞、猫细胞、犬细胞、猪细胞、马(quine)细胞或羊细胞)。在一些实施方案中,所述宿主细胞是肝细胞、肾细胞、骨细胞或血细胞。在一个实施方案中,所述宿主细胞是活生物体内的体细胞。在又另一个实施方案中,所述宿主细胞是生殖细胞。在一些实施方案中,所述宿主细胞在活生物体的肝内。在一些实施方案中,所述宿主细胞是活生物体的造血干细胞。
附图简述
图1A-1E:通过水动力注射的NHEJ介导的体内敲入。图1A是针对质粒介导的体内敲入的水动力注射的示意图。图1B是ires-GFP基因在小鼠Actb基因座3’-UTR内的位置处的质粒介导的NHEJ敲入的示意图。图1C显示在水动力注射不同的质粒组合后5天收获的新鲜小鼠肝的直接图像。上排和中间排显示来自对照组的肝图像,而下排显示NHEJ介导的敲入组。处于低放大率(0.7x)的明视野图像显示在左列;而处于低(0.7x)和高(4x)放大率的荧光图像分别显示在中间列和右列。图1D是从整合连接处扩增的PCR产物的凝胶电泳图像,证实了在体内的非定向型NHEJ介导的敲入。PCR反应中使用的引物如图1B所示。图1E公开了由通过NHEJ介导的体内敲入引入的GFP基因所表达的报告基因信号的免疫组织化学染色。左图显示来自用空载体(对照)注射的小鼠的组织样品;并且右图显示来自用NHEJ介导的敲入质粒注射的小鼠肝组织的显著染色,表明成功敲入和肝细胞中报告基因的表达。
图2A-2G:通过水动力注射,NHEJ介导的体内敲入逆转小鼠的1型糖尿病(T1DM)。图2A是概述经由尾静脉注射链脲霉素(STZ)的示例性方法的示意图。图2B代表在STZ治疗之前和之后(在第0天和第7天)测量的体重、血糖和血浆胰岛素水平的条形图数据。图2C是显示在小鼠Alb基因的3’-UTR处NHEJ介导的hINS敲入的示意图。在此,通过水动力注射将sg-Alb、sg-A和NHEJ-hINS供体构建体共同注射进STZ诱导的T1DM小鼠中。图2D是显示在NHEJ介导的hINS体内敲入之前(第0天)和之后(第7天)检测的血糖水平的条形图。使用靶向Alb的两个sg-RNA,并且命名为sg-Alb1和sg-Alb2。图2E显示在野生型小鼠、T1DM小鼠、或具有NHEJ介导的hINS敲入的T1DM小鼠中,在葡萄糖耐受测试(CTT)期间,血糖水平随时间的调节。图2F显示在NHEJ介导的hINS体内敲入之前(D0)和之后(D4)检测的血浆胰岛素水平。图2G显示肝组织的免疫组织荧光染色,表明在肝细胞中成功的hINS敲入和表达。所显示的图像是来自空白对照小鼠的组织(左侧)和携带成功的hINS基因敲入的经注射小鼠的组织(右侧)。
图3A-3D:通过水动力注射NHEJ介导的体内敲入,用于人凝血因子IX(FIX)表达以校正乙型血友病。图3A是显示水动力注射用于瞬时表达(CMV-hF9)或NHEJ介导的hF9体内敲入的质粒的示例性示意图,hF9是编码人FIX的基因。图3B证明小鼠中hF9的成功的瞬时表达。条形图中显示了在水动力注射后第1、2和5天(D1、D2和D5),小鼠血清中检测的人FIX的浓度。图3C是显示NHEJ介导的hF9(在Alb 3’-UTR处)敲入的示例性示意图(上图)。在NHEJ介导的体内敲入后,在第1、3、5和7天(D1、D3、D5和7),通过ELISA检测血清中的分泌型人FIX(下图)。图3D显示肝组织的免疫组织荧光染色,表明在小鼠肝细胞中成功的hF9的敲入和表达。所显示的图像是来自模拟小鼠的组织(左侧)和携带成功的hF9基因敲入的经注射小鼠的组织(右侧)。
图4A-4D:在体外和体内条件下,AAV偶联的NHEJ介导的敲入。图4A是证明AAV偶联的NHEJ介导的敲入在体外人细胞(在GAPDH基因座处)中或在小鼠细胞(在Actb基因座处)中的示例性示意图。图4B显示在人HEK293T细胞中对AAV偶联的NHEJ介导的敲入的流式分析。在AAV供体组群中GFP阳性细胞的存在代表eGFP基因的成功敲入。图4C是显示在小鼠中AAV介导的瞬时表达(AAV-CMV-GFP)或AAV偶联的NHEJ介导的体内敲入的示例性示意图。图4D显示在AAV注射后第5天收获的新鲜小鼠肝的直接成像。上排显示AAV-CMV-GFP的表达,表明转导效率。中排显示来自AAV偶联的NHEJ介导的体内敲入的GFP表达;而下排显示来自对照组的肝图像。处于低放大率(0.7x)的明视野图像显示在左列;而处于低(0.7x)和高(4x)放大率的荧光图像分别显示在中间列和右列。
图5A-5C:AAV偶联的NHEJ介导的hF9敲入。图5A是证明在小鼠中AAV偶联的NHEJ介导的hF9敲入(在Alb基因座处)的示例性示意图。图5B是血浆的ELISA测试,所述血浆从具有AAV偶联的NHEJ介导的hF9敲入的小鼠收集。图5C是定量RT-PCR数据,以检测肝组织中hF9的RNA表达,所述肝组织在AAV注射后3个月收集。
发明详述
应当理解,本文所使用的术语仅出于描述具体实施方案的目的,并非旨在进行限制。如本说明书和所附权利要求书中所使用的,除非上下文另外明确指出,否则单数形式“一(“a”)”、“一个(“an”)”和“所述(“the”)”包括复数。因此,例如,关于“多核苷酸”包括一个或多个多核苷酸,并且关于“载体”包括一个或多个载体。
除非另有定义,否则本文使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同含义。尽管与本文描述的那些类似或等同的其他方法和材料可用于本发明,但是本文描述了优选的材料和方法。
鉴于本说明书的教导,本领域的普通技术人员可以采用例如通过以下标准文献所教导的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组多核苷酸的常规技术:A Laboratory Manual,Second edition,E.A.Greenfield,Cold SpringHarbor Laboratory Press,ISBN 978-1-936113-81-1(2014);Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications,6th Edition,R.I.Freshney,Wiley-Blackwell,ISBN 978-0-470-52812-9(2010);Transgenic AnimalTechnology,Third Edition:A Laboratory Handbook,C.A.Pinkert,Elsevier,ISBN 978-0124104907(2014);The Laboratory Mouse,Second Edition,H.Hedrich,AcademicPress,ISBN 978-0123820082(2012);Manipulating the Mouse Embryo:A LaboratoryManual,R.Behringer,等人.,Cold Spring Harbor Laboratory Press,ISBN 978-1936113019(2013);PCR 2:A Practical Approach,M.J.McPherson,等人.,IRL Press,ISBN 978-0199634248(1995);Methods in MolecularBiology(Series),J.M.Walker,ISSN1064-3745,Humana Press;RNA:A Laboratory Manual,D.C.Rio,eta,Cold Spring HarborLaboratory Press,ISBN 978-0879698911(2010);Methods in Enzymology(Series),Academic Press;Molecular Cloning:A Laboratory Manual(Fourth Edition),M.R.Green,等人.,Cold Spring Harbor Laboratory Press,ISBN 978-1605500560(2012);Bioconjugate Techniques,Third Edition,G.T.Hermanson,Academic Press,ISBN 978-0123822390(2013);Methods in Plant Biochemistry and MolecularBiology,W.V.Dashek,CRC Press,ISBN 978-0849394805(1997);Plant Cell CultureProtocols(Methods in Molecular Biology),V.M.Loyola-Vargas,等人.,Humana Press,ISBN 978-1617798177(2012);Plant Transformation Technologies,C.N.Stewart,等人.,Wiley-Blackwell,ISBN 978-0813821955(2011);Recombinant Proteins fromPlants(Methods in Biotechnology),C.Cunningham,等人.,Humana Press,ISBN 978-1617370212(2010);Plant Genomics:Methods and Protocols(Methods in MolecularBiology,D.J.Somers,等人.,Humana Press,ISBN 978-1588299970(2009);PlantBiotechnology:Methods in Tissue Culture and Gene Transfer,R.Keshavachandran,等人.,Orient Blackswan,ISBN 978-8173716164(2008)。成簇的规律间隔的短回文重复序列(CRISPR)和相关的CRISPR相关蛋白(Cas蛋白,例如Cas3)构成了CRISPR-Cas系统(参见,例如,Barrangou,R.,等人.,Science 315:1709-1712(2007))。
I.定义
如本文所用,“Cas蛋白”、“Cas”和“CRISPR/Cas蛋白”是指CRISPR相关蛋白(Cas),包括但不限于1类I型CRISPR相关蛋白、1类III型CRISPR相关蛋白、和1类IV型CRISPR相关蛋白、2类II型CRISPR相关蛋白、2类V型CRISPR相关蛋白以及2类VI型CRISPR相关蛋白。2类Cas蛋白包括Cas9蛋白、由Cas9直系同源物编码的Cas9样蛋白、Cas9样合成蛋白、Cpf1蛋白、由Cpf1直系同源物编码的蛋白质、Cpf1样合成蛋白、C2c1蛋白、C2c2蛋白、C2c3蛋白,及其变体和修饰形式。在一些实施方案中,Cas蛋白是2类CRISPR相关蛋白,例如一种或多种2类II型CRISPR相关蛋白(如Cas9)、一种或多种2类V型CRISPR相关蛋白(如Cpf1)、一种或多种2类VI型CRISPR相关蛋白(如C2c2)。在另一个实施方案中,Cas蛋白是一种或多种2类II型CRISPR相关蛋白(如Cas9)或一种或多种2类V型CRISPR相关蛋白(如Cpf1)。通常,Cas蛋白能够与一种或多种多核苷酸(通常是RNA)相互作用以形成核蛋白复合物(通常是核糖核蛋白复合物)。
如本文所用,术语“Cas9”或“Cas9蛋白”是指衍生自2类II型CRISPR-Cas9系统的Cas9野生型蛋白质、Cas9蛋白的修饰形式、Cas9蛋白的变体、Cas9直系同源物,及其组合。Cas9蛋白包括但不限于来源于酿脓链球菌(UniProtKB:Q99ZW2(CAS9_STRP1))、嗜热链球菌(UniProtKB:G3ECR1(CAS9_STRTR))和金黄色酿脓葡萄球菌(UniProtKB:J7RUA5(CAS9_STAAU))的Cas9。使用本领域技术人员已知的序列相似性检索方法可以鉴定Cas9同系物。靶向特异性是由指导RNA(通常是单一指导RNA“sgRNA”)与基因组基因座和前间区序列邻近基序(PAM)的互补碱基配对决定的。Cas9是2类II型CRISPR系统的特征蛋白。
如本文所用,术语“Cpf1蛋白”是指衍生自2类V型CRISPR-Cpf1系统的Cpf1野生型蛋白质、Cpf1蛋白的修饰形式、Cpf1蛋白的变体、Cpf1直系同源物,及其组合。Cpf1蛋白包括但不限于来自氨基酸球菌属物种(Acidaminococcus sp.)(UniProtKB:U2UMQ6(CPF1_ACISB))和土拉弗朗西斯菌(Francisella tularensis)(UniProtKB:A0Q7Q2(CPF1_FRATN))的Cpf1。使用本领域技术人员已知的序列相似性检索方法可以鉴定Cpf1同系物(例如,参见以上Cas9靶向特异性)。Cpf1是2类V型CRISPR系统的特征蛋白。
如本文所用,“小指导RNA”或“sgRNA”是指能够与Cas蛋白(例如Cas9蛋白)相关联的多核苷酸组分。通常,sgRNA能够与Cas9蛋白形成核蛋白复合物,其中所述复合物(Cas9-sgRNA)能够靶向与前间区序列邻近基序(PAM)序列互补的核酸序列。sgRNA包含与靶核酸序列(即,DNA)互补的约20个核苷酸的片段,使得当sgRNA识别靶核酸中的互补序列时,Cas9-sgRNA复合物指导靶核酸序列的Cas9切割。因此,sgRNA是非可变支架序列5’的对靶核酸(即,靶DNA)具有特异性的大约20个碱基(范围在从约10-50、15-45或20-40个,例如15、20、25或30个碱基)的序列。对Cas9-sgRNA的修饰是本领域已知的,包括一个或多个3’发夹元件的缺失,上部茎、凸出、下部茎和5’发夹区域的修饰(参见,例如美国专利公开号20140315985;20150376586;20160257973;和20160289673)。
如本文所用,术语“CRISPR系统”是指对外源遗传元件赋予抗性的原核生物免疫系统(参见,Bhaya,D.,Davison,M.&Barrangou,R.CRISPR-Cas systems in bacteria andarchaea:versatile small RNAs for adaptive defense and regulation.Annu RevGenet 45,273-97(2011))。CRISPR是成簇的规律间隔的短回文重复序列的缩写,是包含从质粒或噬菌体获得的短而重复的碱基序列的原核DNA区段。这些区段可以转录成RNA并形成与CRISPR相关蛋白(Cas蛋白,如Cas9)结合的支架。可以指导经组合的复合物(例如核糖核苷酸复合物,Cas9-sgRNA)降解存在于由这些经转录的区段特异性识别的DNA中的靶序列,从而获得对外源遗传元件的免疫力(参见,例如Jinek,M.等人.A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science 337,816-21(2012)和Mali,P.等人.RNA-guided human genome engineering via Cas9.Science 39,823-6(2013))。
如本文所用,术语“靶位点”或“sgRNA靶位点”是指本发明的多核苷酸构建体(例如,供体构建体),其具有与宿主细胞基因组中的相应靶位点(例如,在基因插入的预期位点处的核酸序列)共享实质序列相同性的核酸序列。在一些实施方案中,sgRNA靶位点将与宿主细胞基因组中的相应靶位点具有实质序列相同性(即,与宿主细胞基因组中的靶位点具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或完全的序列相同性)。
如本文所用,“载体”、“质粒”、“构建体”或“表达载体”是指将遗传物质(例如外源遗传物质)引入细胞中的多核苷酸运载体。载体可以是线性的或环状的。载体可以包含能够在适合的宿主细胞中实现载体复制的重复序列(即,复制起点)。在适合的宿主细胞(例如,体细胞组织细胞)转化后,载体可以独立于宿主基因组复制和起作用或整合进宿主基因组。除了其他方面,载体设计取决于载体的预期用途和宿主细胞。显然,针对具体用途和宿主细胞类型的载体设计在本领域技术水平内。载体的四种主要类型是质粒、病毒载体、粘粒和人工染色体。通常,载体包含复制起点、多克隆位点(MCS)和/或可选择性标记。表达载体通常包含表达盒。
如本文所用,“供体载体”是指编码至少一个sgRNA靶位点和所需目的基因的载体。在一些实施方案中,所述供体载体包含单一sgRNA靶位点。在另一个实施方案中,所述供体载体包含两个sgRNA靶位点。在又另一个其他实施方案中,所述供体载体包括单一所需基因。而在其他实施方案中,所述供体载体包含一个或多个基因(如两个所需基因)。在一些实施方案中,所述供体载体包含与编码所需基因的核酸序列相邻的其他侧翼核酸序列,所述侧翼核酸序列与宿主细胞基因组中插入靶位点中的核酸序列是相同的。在一些实施方案中,所述供体载体被核酸酶(如Cas蛋白)切割,从而形成线性DNA片段。在一个实施方案中,线性DNA片段被插入宿主细胞基因组中而没有形成移码突变,导致与所插入的所需基因相应的mRNA转录物和蛋白质的产生。
如本文所用,“基因座特异性辅助载体”是指编码至少一个与宿主细胞基因组中的核酸序列互补的sgRNA的载体。在一些实施方案中,所述基因座特异性辅助载体编码单一sgRNA。在另一个实施方案中,所述特异性辅助载体编码两个sgRNA。在又另一个其他实施方案中,所述基因座特异性辅助载体的每个sgRNA与宿主细胞基因组中不同的选定核酸序列互补。在一些实施方案中,所述基因座特异性辅助载体的sgRNA与侧翼于宿主细胞基因组中所需基因的核酸序列互补。在一些实施方案中,所述基因座特异性辅助载体的经编码的sgRNA通过与CRISPR/Cas复合物相互作用在宿主细胞基因组中产生核酸链断裂。在一个实施方案中,宿主细胞基因组中的核酸链断裂从宿主细胞基因组中去除基因的现存版本(例如,突变形式或功能异常形式),从而允许通过来自供体载体的线性DNA片段插入所需基因。
如本文所用,“通用型辅助载体”是指编码至少一个与所述供体载体中的一个或两个sgRNA靶位点互补的sgRNA的载体。在一些实施方案中,所述通用型辅助载体编码单一sgRNA。在另一个实施方案中,所述通用型辅助载体编码两个sgRNA。在又另一个其他实施方案中,编码所述通用型辅助载体的sgRNA的每个与所述供体载体中的不同sgRNA靶位点互补。在一些实施方案中,由所述通用型辅助载体编码的sgRNA与所述供体载体中的sgRNA靶位点互补(例如沿着其长度)。在一些实施方案中,由所述通用型辅助载体编码的sgRNA与CRISPR/Cas复合物在所述供体载体中的靶位点处产生核酸链断裂。在一个实施方案中,在所述供体载体中的靶位点处的所述核酸链断裂产生可以插入宿主细胞基因组中的线性供体DNA片段。
如本文所用,“表达盒”是指使用重组方法或通过合成手段产生的多核苷酸构建体,并且包含可操作地连接至选定的多核苷酸以促进所选多核苷酸在宿主细胞(例如体细胞组织细胞,例如肝细胞)中表达的调节序列。例如,所述调节序列可以促进所选多核苷酸在宿主细胞中的转录,或所选多核苷酸在宿主细胞中的转录和翻译。例如,表达盒可以整合进宿主细胞的基因组或存在于载体中以形成表达载体。在一些实施方案中,表达盒包含用于在体细胞组织细胞内进行基因表达的质粒或病毒载体,所述质粒或病毒载体产生充足多肽或RNA(例如,mRNA),从而治疗人类病症或疾病。表达盒的一个实例是构建体,其包含编码与启动子(例如其天然启动子)可操作地连接的本发明多肽的多核苷酸序列,其中所述表达盒被引入异源微生物中。在一些实施方案中,表达盒包含编码本发明多肽的多核苷酸序列,其中所述多核苷酸被靶向微生物基因组中的位置,使得所述多核苷酸序列的表达由所述微生物中存在的启动子驱动。
如本文所用,术语“核酸序列”、“核苷酸序列”,“寡核苷酸”和“多核苷酸”是可互换的,并且是指核苷酸的聚合形式。核苷酸可以是脱氧核糖核苷酸(DNA)、核糖核苷酸(RNA)、其类似物或其组合,并且可以具有任何长度。多核苷酸可以执行任何功能,并且可以具有任何二级和三级结构。所述术语涵盖天然核苷酸的已知类似物以及在碱基、糖部分和/或磷酸部分中进行修饰的核苷酸。特定核苷酸的类似物具有相同的碱基配对特异性(例如,与T配对的A碱基类似物)。多核苷酸可以包含一个经修饰的核苷酸或多个经修饰的核苷酸。经修饰的核苷酸的实例包括氟化的核苷酸、甲基化的核苷酸以及核苷酸类似物。在聚合物组装之前或之后可以对核苷酸进行修饰。聚合作用后,可以例如经由与标记组分或靶结合组分缀合对多核苷酸进行另外地修饰。核苷酸序列可以掺入非核苷酸组分。术语还涵盖核酸,所述核酸包含合成的、天然存在的和非天然存在的经修饰的主链残基或键,并与参考多核苷酸(例如,DNA或RNA)具有相似的结合特性。此类类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性甲基膦酸酯、2-O-甲基核糖核苷酸、肽-核酸(PNA)、锁核酸(LNA)和吗啉代结构。
如本文所用,术语“选定的核酸序列”是指与被鉴定、预定、选定或选择为用于将所需基因插入进宿主细胞基因组的位点的核酸序列互补的核酸序列。所选核酸序列可以通过本领域已知的任何适当的方式来鉴定。在一个实施方案中,通过使用核酸序列比对过程(例如BLASTTM)或核酸序列同源性来鉴定选定的核酸序列。通常,选定的核酸序列与鉴定为在宿主细胞基因组中用于插入所需基因的位点的核酸序列具有高度互补性(例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或完全互补性(即,100%))。
如本文所用,“双链断裂”或“DSB”是指DNA的双链区段的两条链均被切断。在某些情况下,如果发生这种断裂,则可以说一条链具有“粘性末端”或“突出端”,其中暴露一个或多个核苷酸,而不是氢键键合到DNA其他(相反)链的核苷酸上。在其他情况下,尽管存在DSB,DNA的两条链仍保持彼此完全碱基配对,则可能出现“钝端”。显然,通常认为CRISPR-Cas系统适合于将双链断裂诱导进宿主细胞的基因组。然而,已经鉴定了与靶核酸序列结合但不能催化宿主基因组中双链断裂的核酸酶缺陷型Cas蛋白。
如本文所用,“序列相同性”或“序列相似性”通常是指使用具有各种加权参数的算法,将第一多核苷酸或多肽与第二多核苷酸或多肽进行比较的核苷酸碱基或氨基酸的百分比相同性。可以使用通过各种方法和计算机程序(例如,BLAST、CS-BLAST、FASTA、HMMER、L-ALIGN等)的序列比对来确定两个多核苷酸或两个多肽之间的序列相同性,所述方法和计算机程序可以通过万维网在包括但不限于GENBANK(website:ncbi.nlm.nih.gov/genbank/)和EMBL-EBI(网站:website:ebi.ac.uk)的站点获得。通常使用各种方法或计算机程序的标准默认参数来计算两个多核苷酸或两个多肽序列之间的序列相同性。如本文所用,两个多核苷酸或两个多肽之间高度的序列相同性通常在约90%相同性和100%相同性之间,例如约90%相同性或更高,优选约95%相同性或更高,更优选地约98%相同性或更高。如本文所用,两个多核苷酸或两个多肽之间中度的序列相同性通常在约80%相同性至85%相同性之间,例如约80%相同性或更高,优选地约85%相同性。如本文所用,两个多核苷酸或两个多肽之间低度的序列相同性通常在约50%相同性和75%相同性之间,例如约50%相同性、优选地约60%相同性、更优选地约75%相同性。例如,Cas蛋白(例如,包含氨基酸取代的Cas9或包含氨基酸取代的Cpf1)可以在其长度上与参考Cas蛋白(例如,分别是野生型Cas9或野生型Cpf1)具有中度的序列相同性,或优选地高度的序列相同性。
如本文所用,术语“可操作地连接”是指将多核苷酸序列或氨基酸序列置于与彼此保持功能性关系。例如,如果调节序列调节或有助于调节多核苷酸的转录,则调节序列(例如启动子或增强子)与编码基因产物的多核苷酸“可操作地连接”。可操作地连接的调节元件通常与编码序列相连。然而,即使增强子与启动子相距高达几千个碱基或更多,增强子可以发挥功能。因此,一些调节元件可以与多核苷酸序列可操作地连接,但是不与多核苷酸序列相连。类似地,翻译调节元件有助于调节来自多核苷酸的蛋白质表达。
如本文所用,术语“表达”是指多核苷酸从DNA模板的转录,从而产生例如信使RNA(mRNA)或其他RNA转录物(例如,非编码RNA,如结构型或支架型RNA)。所述术语进一步指将经转录的mRNA翻译成肽、多肽或蛋白质的过程。转录物和经编码的多肽可被统称为“基因产物”。
如本文所用,“基因组区域”或“选定的基因座”是宿主细胞基因组中染色体区段的特定位置或定位。在一些实施方案中,它可以包括在染色体上所需基因的DNA序列的特定定位或位置。在另一个实施方案中,可以指存在于核酸(例如,DNA)靶序列位点的任一侧的染色体的区段,或可替代地还包括核酸靶序列位点的一部分。在一个实施方案中,供体构建体具有足够的同源性以进行与相应基因组区域的非同源末端连接。在一些实施方案中,供体构建体与侧翼于靶序列位点的基因组区域共享显著的序列同源性。在一个实施方案中,供体构建体与靶序列位点的显著同源性包括至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或完全(100%)序列同源性。
如本文所用,“基因”是指包含外显子和相关调节序列的多核苷酸序列。基因包括进一步包含内含子和/或非翻译区(UTR)。在一些实施方案中,本申请涉及将一个或多个基因插入活生物体内的细胞(例如体细胞组织细胞)的基因组中。在一些实施方案中,可以插入一个或多个基因以替换功能异常的基因或包含任选地导致宿主生物体中疾病表现的一个或多个突变的基因。在一个实施方案中,宿主生物体是人,并且所述基因是人胰岛素(hINS)或人因子IX(hFIX)。
术语“所需基因”是指一种或多种需要基因组整合到宿主生物体内的体细胞组织细胞的基因组中的基因的鉴定和应用。例如,可能期望用相应的功能性基因替换肝细胞基因组中功能异常的基因,从而产生足够量或水平的RNA转录物或多肽以减轻、减少或治疗生物学病症或疾病。
如本文所用,“宿主细胞”通常是指活生物体的细胞。细胞是活生物体的基本结构单元、功能单元和/或生物学单元。细胞可以来源于具有一种或多种细胞的任何生物体。宿主细胞的实例包括但不限于:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物体的细胞、原生动物细胞、真菌细胞(例如酵母细胞)、动物细胞、无脊椎动物(例如果蝇、刺胞动物、棘皮动物和线虫)的细胞,脊椎动物(例如鱼、两栖动物、爬行动物、鸟类、哺乳动物)的细胞,植物细胞(即作物植物,如棉花、烟草、玉米、稻、小麦、番茄、草莓)和哺乳动物的细胞(例如猪、牛、山羊、绵羊、啮齿动物、大鼠、小鼠、狗、猫、非人灵长类动物和人)。在本发明的上下文中使用的术语宿主细胞通常是指脊椎动物亚门内的动物细胞,并且包括从动物中制备的单个动物细胞或细胞培养物,其可以是或已经是本发明的载体或经分离的多核苷酸的受体。宿主细胞包括单个宿主细胞的后代,并且由于自然、偶然或有意的突变和/或修饰,所述后代不一定与原始亲本细胞完全相同(在形态学或在总DNA互补方面)。因此,宿主细胞包括本发明的载体或多核苷酸已被引入其中的细胞(包括通过转化或转染)。例如,在优选的实施方案中,宿主细胞是存在于人的体细胞组织(例如,肝、肾、脾、胆囊、胃、膀胱、子宫、肠、胰、结肠、肺、心、脑、肌肉、骨、咽和喉)中的人细胞。在另一个实施方案中,所述宿主细胞是生殖细胞。
如本文所用,“体细胞组织”是指无助于配子产生的活生物体的细胞(例如,不是生殖细胞)。体细胞组织包括已分化为各种内部器官的细胞。例如,体细胞组织包括肝、肾、脾、胆囊、胃、膀胱、子宫、肠、胰腺、结肠、肺、心、脑、肌肉、骨、皮肤、眼、咽和喉内的细胞,或从这些器官之一获得的细胞。在一个实施方案中,体细胞组织可包括来自肝的特定细胞,称为肝细胞。在另一个实施方案中,体细胞组织可以包括来自脑的特定细胞,称为神经元。在一些实施方案中,体细胞组织包括血细胞(例如,红细胞、淋巴细胞、红和白血细胞、T细胞和辅助细胞)。例如,在一些实施方案中,本发明可以用于治疗血液相关的障碍,例如血红蛋白病,例如地中海贫血和镰状细胞病(例如,参见PCT公开号WO/2013/126794的体细胞组织,其可以被本文所述的CRISPR-Cas9-NHEJ介导的构建体靶向)。
如本文所用,“受试者”、“宿主”或“生物体”是指脊索动物门的任何成员,更优选脊椎动物亚门的任何成员,或最优选哺乳动物纲的任何成员(包括但不限于人和其他灵长类动物,包括非人灵长类动物,如猕猴、黑猩猩和其他猴子和类人猿类;家畜,如牛、绵羊、猪、山羊和马;家养哺乳动物,如狗和猫;实验动物,包括兔、小鼠、大鼠和豚鼠;鸟类,包括家养、野生和猎鸟类,如鸡、火鸡、鸭和鹅。所述术语不指具体的年龄或性别。因此,成人、年轻人和新生儿以及男性和女性受试者都旨在被覆盖。在一些实施方案中,宿主细胞衍生自受试者(例如,组织特异性细胞,例如肝细胞)。在一些实施方案中,所述受试者是非人受试者。
如本文所用,术语“活生物体”或“活生物”是指能够对外部刺激(如热、光、水或大气条件)做出响应的生物体。在一些实施方案中,活生物体是指目前存活而非死亡的动物。在一些实施方案中,活生物体是指呼吸的动物,例如但不限于小鼠、大鼠、兔、山羊或人。在另一个实施方案中,活生物体可以包括细胞培养物(例如,从人或动物体细胞组织克隆的细胞),从中可以获得对外部刺激的响应。在一些情况下,活生物体是转基因动物。
如本文所用,“样本”是指较大的整体或群组中有代表性的部分或单一项目。在一些情况下,样品是细胞、细胞裂解物、组织切片、组织活检物、液体活检物、血液或其他生物流体(例如但不限于从生物体获得的唾液、痰液、尿液、粪便、血浆/血清、母乳、精液、前列腺液、阴道分泌物、汗液、粘液、胆汁和脑脊髓液)。在一些情况下,样品是真核细胞,例如来自哺乳动物(例如,猪、牛、山羊、绵羊、啮齿动物、大鼠、小鼠、狗、猫、非人灵长类动物和人)的细胞。在一些实施方案中,细胞是衍生自生物体的细胞培养物细胞。在另一种情况下,样品来自活生物体。在一些实施方案中,样品可以包括来自不同来源(例如,两种或更多种密切相关的宿主,例如但不限于亲本/后代或兄弟姐妹)的多个样品。在一些实施方案中,样品可以包括来自不同来源(例如,两种或更多种不相关的宿主,例如但不限于不同种族)的多个样品。在优选的实施方案中,宿主细胞是存在于人的体细胞组织(例如,肝、肾、脾、胆囊、胃、膀胱、子宫、肠、胰、结肠、肺、心、脑、肌肉、骨、咽和喉)中的人细胞。
术语“野生型”、“天然存在的”和“未经修饰的”在本文中用来表示自然界中存在的典型(或最常见)形式、外观、表型或菌株;例如,细胞、生物体、特征、多核苷酸、蛋白质、大分子复合物、基因、RNA、DNA或基因组的典型形式,当它们存在时并可以从天然来源中分离出。在引入有意修饰之前,野生型用作原始亲本形式。因此,突变体、变体、工程化形式、重组形式和修饰形式不是野生型形式。
如本文所用,术语“遗传工程化的”、“重组的”和“经修饰的”是可互换的,并且表示超出野生型形式的有意人为操纵。
如本文所用,“转基因动物”是指其基因组被遗传修饰的动物。所述术语包括转基因动物的后代(任何世代),只要所述后代具有遗传修饰即可。在一些实施方案中,所述术语是指与包含来自转基因动物的细胞的组织培养物相对的整个活体动物(例如,活体小鼠)。
如本文所用,术语“水动力注射”是指质粒递送方法,并且通常可以包括将大量流体快速注射到血管(例如,小鼠尾静脉)中以将遗传物质递送到细胞中。
如本文所用,术语“AAV”或“腺相关病毒”是指感染人和一些其他灵长类动物的包装了线性单链DNA基因组的小(25nm)的无包膜病毒。AAV具有非常低的免疫原性。AAV可以感染分裂细胞和静止细胞,并且能以染色体外状态持续存在,而不会整合到宿主细胞的基因组中。这些特点使AAV成为用于基因疗法的理想递送工具。实际上,重组DNA咨询委员会和食品药品监督管理局已经批准了关于将AAV用作人临床试验的递送载体的超过40种方案(参见Daya和Burns,Clin.Microbiol.Rev.,21(4):583-593(2008))。
如本文所用,术语“HDR”、“同源定向重组”或“同源重组”是指一种DNA修复机制。面对DNA DSB断裂,细胞可以基于完整的等位基因或模板,利用姐妹染色单体或任何提供的供体通过围绕DNA DSB断裂位点的配对同源序列对断裂进行修复。对于CRISPR/Cas9活性的HDR效率可以被调节(例如Rad52和/或Scr7的表达)或抑制(例如,DNA连接酶IV或NHEJ途径的抑制),以提高HDR修复的效率(参见,例如Chu等人.,Nat.Biotech,33:543-548(2015))。
如本文所用,术语“NHEJ”或“非同源末端连接”是指一种DNA修复机制(参见,例如Davis和Chen,Transl Cancer Res.,2(3):130-143(2013))。面对DNA DSB断裂,细胞可以通过识别和末端处理在DSB位点处存在的核苷酸并将DNA末端连接在一起来修复DSB断裂。在此过程中,可以插入或缺失(indel)一些(1-10bp)核苷酸,从而导致移码突变。因为DNA DSB末端不需要同源模板即可连接(与HDR相反),所以NHEJ被称为非同源的。NHEJ在整个动物界中都是进化保守的,并且是哺乳动物细胞中最主要的修复途径。
如本文所用,术语“敲入(“knock-in”或“knocking in”)”是指如下遗传工程的过程,通过所述过程,范围可以在小于100bp至高达数百千碱基对(kb)并含有一个或多个基因的所需DNA片段被插入宿主细胞的基因组中。在具体的实施方案中,所述术语是指将功能性基因插入宿主细胞,导致产生正常的mRNA转录物和相应于所述功能基因的蛋白质。在一些情况下,所述术语是指通过敲入过程用正常基因替换宿主细胞中的非功能性或功能异常的基因。敲入是指特定的插入位点,并因此可以视为靶向插入。敲入不同于“敲除”过程,所述敲除过程缺失宿主细胞基因组中靶位点的一部分,或将不完整/不相关的核酸序列插入靶位点,从而破坏目的基因的表达。在一些实施方案中,敲入方法产生功能获得(GOF)而不是功能丧失(LOF)基因型。在优选的实施方案中,敲入过程由非同源末端连接(NHEJ)介导。
如本文所用,术语“INS”或“胰岛素”是本领域技术人员理解的术语,并且表示在胰腺β细胞中高度表达的蛋白质编码基因。人胰岛素在本文中被称为“hINS”(UniProt:P01308)。胰岛素蛋白发挥作用触发各种细胞摄取血糖,以产生能量并降低葡萄糖水平。因此,它已被广泛用于治疗1型糖尿病(T1DM)。
如本文所用,术语“F9”或“因子IX”是本领域技术人员理解的术语,并且表示在肝中高度表达的蛋白质编码基因。人胰岛素在本文中被称为“hF9”(UniProt:P00740)。该蛋白质的缺乏会导致严重的出血性障碍,乙型血友病,可通过注射最初由野生型hF9基因编码的经纯化的因子IX蛋白来恢复。
如本文所用,术语“乙型血友病”是指由FIX缺乏或有限的水平引起的疾病,并表征为凝血障碍。静脉内输注FIX可以有效治疗这种疾病。
如本文所用,术语“HEK293T”是本领域技术人员理解的术语,并且表示包含SV40大T抗原的人胚胎肾293细胞(HEK293)的变体。所述抗原允许包含SV40复制起点的经转染质粒进行游离复制,从而导致经转染的质粒的扩增和所需基因产物的时间表达延长。
如本文所用,术语“3’-UTR”是本领域技术人员理解的术语,并且是指紧接翻译终止密码子的信使RNA(mRNA)的部分。mRNA分子从基因的DNA序列转录而来,并且可以之后翻译成相应的蛋白质。
如本文所用,术语“ires”是本领域技术人员理解的术语,并且是指内部核糖体进入位点区段,其已知可吸引真核生物核糖体翻译起始复合物,并因此促进翻译起始而与通常使用的5'-末端7mG帽结构的存在无关。
如本文所用,术语“eGFP”是本领域技术人员理解的术语,并且是指具有F64L点突变的增强的绿色荧光蛋白,其在37℃下效率倍增。因此,eGFP导致GFP在哺乳动物细胞中的显著表现。
如本文所用,术语“Actb”或“肌动蛋白”是本领域技术人员理解的术语,并且是指在小鼠或人基因组中称为β-肌动蛋白的基因组基因座。人Actb在本文中被称为“hActb”(UniProt:P60709(ACTB_HUMAN))。小鼠肌动蛋白在本文中被称为“Actb”(UniProt:P60710(ACTB_MOUSE))。肌动蛋白基因产生高度保守的蛋白质,所述蛋白质参与细胞运动性、结构和完整性。
如本文所用,术语“Alb”或“白蛋白”是本领域技术人员理解的术语,并且是指在小鼠或人基因组中的基因组基因座白蛋白。人Alb在本文中被称为“hAlb”(UniProt:P02768(ALBU_HUMAN))。小鼠白蛋白在本文中被称为“Alb”(UniProt:P07724(ALBU_MOUSE))。白蛋白基因通常在大多数的人组织和细胞中稳定且组成型地按高水平表达。
如本文所用,术语“GAPDH”是本领域技术人员理解的术语,并且是指产生甘油醛3-磷酸脱氢酶的管家基因。人GAPDH在本文中被称为“hGAPDH”(UniProt:P04406(G3P_HUMAN))。小鼠GAPDH在本文中被称为“GAPDH”(UniProt:P16858(G3P_MOUSE))。GAPDH基因通常在大多数的人组织和细胞中稳定且组成型地按高水平表达。因此,GAPDH通常被用作蛋白质印迹的对照以检查蛋白质表达水平,或用于qPCR以检查mRNA表达水平。
如本文所用,术语“STZ”或“链脲霉素”是指天然存在的并且对产生胰岛素的胰腺β细胞特别有毒的化学品。因此,该药物已被用于建立1型糖尿病的动物模型或用作针对β细胞癌的药物治疗。
如本文所用,术语“T1DM”、“1型糖尿病(“type 1diabetes”或“type 1diabeticmellitus”)”是指一类代谢性疾病,其被表征为导致体内高血糖的胰岛素产生不足。典型症状是尿频、口渴感增加、饥饿感增加和体重减轻。通常通过注射给予胰岛素治疗以治疗所述疾病。
如本文所用,“遗传性疾病”是由期望的基因的缺失或缺陷(功能丧失)或不希望或有缺陷的基因的表达(功能获得)引起的病症或疾病。功能丧失性遗传障碍的一个实例是血友病,一种由凝血因子VIII(FVIII,甲型血友病)或因子IX(FIX,乙型血友病)缺乏引起的遗传性出血性障碍。功能获得性遗传障碍的一个实例是亨廷顿病,一种由病理性“HTT”基因(编码亨廷顿蛋白)引起的疾病,所述基因编码在体内积累并导致神经元(特别是在基底神经节和大脑皮层中)逐渐破坏的突变蛋白。
在一些实施方案中,遗传性疾病可以被传送(例如,通过无症状携带者父母)至随后的世代或后代。在一些实施方案中,遗传性疾病可包括常染色体隐性遗传疾病。在另一个实施方案中,遗传性疾病可包括常染色体显性疾病。在一些实施方案中,遗传性疾病包括但不限于神经肌肉疾病、心血管疾病、发育性疾病和代谢性疾病。在一个实施方案中,遗传性疾病包括但不限于自闭症谱系障碍、心肌病、纤毛疾病、先天性糖基化障碍、先天性肌无力综合征、癫痫和癫痫发作障碍、眼部障碍、糖原贮积障碍、遗传性癌症综合征、遗传性周期性发热综合征、炎症性肠病、溶酶体贮积障碍、多发性骨骺发育不良、神经肌肉障碍或努南综合征及相关障碍。
在一个实施方案中,遗传性疾病可以是基因中单一核酸突变的结果。在一些实施方案中,单一核酸突变遗传性疾病可以包括但不限于糖尿病、血友病、镰状细胞性贫血、囊胞性纤维症、杜氏肌营养不良、血色沉着病、先天性聋、家族性高胆固醇血症、亨廷顿病、泰-萨病或苯丙酮尿症。
如本文所用,“代谢性疾病”是指干扰正常代谢的疾病或病症。存在若干种具有遗传基础的代谢性疾病。例如,泰-萨病是一种基于遗传的代谢性障碍,存在于阿什肯纳兹犹太家庭、魁北克东南部的法国加拿大人和路易斯安那州的卡津人中。由于环境条件或生活方式(例如,怀孕、长期禁食、营养不良或肥胖)的改变,可能会引起其他新陈代谢病症。在一个实施方案中,代谢性疾病可包括但不限于胱氨酸病、胱氨酸尿症、法布里(Fabry)病、半乳糖血症、戈谢(Gaucher)病、霍塔普(Harntup)病、高胱氨酸尿症、亨特(Hunter)综合征、莱施-奈恩(Lesch-Nyhan)综合征、尼曼匹克(Niemann-Pick)病、庞贝氏(Pompe)病、卟啉症、施艾氏(Scheie)综合征、酪氨酸血症和肝糖原累积症。在另一个实施方案中,代谢性疾病是内分泌疾病,例如糖尿病或甲状腺功能减退。
如本文所用,术语“治疗(“treatment”、“treating”和“treat”)”是指成功治疗或缓解疾病或病症的标志,包括任何客观或主观参数,例如消减;缓解;减少症状或延迟症状发作;退化或下降的速度减慢;使变性的最后点减少衰弱;和/或改善受试者的身体或精神健康。
如本文所用,“杂交(“hybridization”或“hybridize”或“hybridizing”)”或“退火(“anneal”或“annealing”)”是通过氢碱基配对,结合两个互补单链DNA或RNA分子以形成单个双链分子(DNA/DNA、DNA/RNA、RNA/RNA)的过程。杂交严格性通常由杂交温度和杂交缓冲液的盐浓度确定;例如高温和低盐提供了高严格性杂交条件。针对不同杂交条件的盐浓度范围和温度范围的实例如下:高严格性,大约0.01M至大约0.05M的盐,杂交温度低于Tm 5℃至10℃;中严格性,大约0.16M至大约0.33M盐,杂交温度低于Tm 20℃至29℃;和低严格性,大约0.33M至大约0.82M盐,杂交温度在低于Tm 40℃至48℃,双链体核酸的Tm是通过本领域熟知的标准方法计算的(参见,例如Maniatis,T.,等人.,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory Press:New York(1982);Casey,J.,等人.,Nucleic Acids Research 4:1539-1552(1977);Bodkin,D.K.,等人.,Journalof Virological Methods 10(1):45-52(1985);Wallace,R.B.,等人.,Nucleic AcidsResearch 9(4):879-894(1981))。估计Tm的算法预测工具还是公开可获得的(参见,例如,网站:tmcalculator.neb.com)。用于杂交的高严格性条件通常是指在与靶序列具有互补性的核酸主要与靶序列杂交,并且基本上不与非靶序列或脱靶序列杂交情况下的条件。在本发明的上下文中,杂交条件通常是中严格性,优选高严格性。
II.靶向基因组操纵系统
经工程化的核酸酶的最新突破打开了基因组编辑的新纪元。最初被鉴定用于微生物适应性免疫的CRISPR/Cas9系统由于其优异的简便性、低成本和强大的性能而产生了特别显著的影响(参见,例如Doudna,J.A.&Charpentier,E.Genome editing.The newfrontier of genome engineering with CRISPR-Cas9.Science 346,1258096(2014)和Hsu,P.D.,Lander,E.S.&Zhang,F.Development and applications of CRISPR-Cas9 forgenome engineering.Cell 157,1262-78(2014),二者通过引用以其全文并入本文中。
通过与可程序化的小指导RNA(sgRNA)形成复合物,可以将Cas内切核酸酶引导至基因组内预先选定的位置处以切割DNA并引入双链断裂(DSB)(参见,例如Jinek,M.等人.Aprogrammable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity.Science 337,816-21(2012)和Mali,P.等人.RNA-guided human genomeengineering via Cas9.Science 339,823-6(2013),二者通过引用以其全文并入本文中)。在预先选定的靶位点的后续DNA断裂触发主要通过非同源末端连接(NHEJ)或同源定向修复(HDR)途径的内在修复过程。
转基因的位点特异性整合传统上是通过HDR途径实现的。使用CRISPR/Cas技术,通过并入由CRISPR/Cas系统诱导的位点特异性DNA切割,大大提高了HDR效率。此外,已经做出努力研究来提高CRISPR/Cas9诱导的HDR效率,以进一步增强DNA的精确靶向基因组插入。然而,尽管付出了巨大的努力,通过CRISPR偶联的HDR敲入大DNA片段(例如基因)仍然相对无效。基于HDR的敲入方法的低效率极大地阻碍了其应用,尤其是在体内条件下针对体细胞组织的转基因敲入。
本文所述的CRISPR/Cas基因组序列操纵系统旨在普遍地靶向基本上源自任何活生物体的体细胞组织细胞中的任何基因。这些系统包括需要将插入事件插入宿主细胞基因组的基因靶向系统,以及含有被引入靶基因组基因座的功能性基因的供体构建体。插入事件是基于供体构建体与其插入位点之间的核苷酸序列同源性。
可用于实施本发明的重组多核苷酸构建体、细胞、方法、组合物和试剂盒以及这些系统的各种应用详细描述如下。
III.组合物
本文描述了可用作CRISPR/Cas系统的组分的组合物,用于体内基因组编辑和/或靶向遗传元件。这些组分可用于各种应用,包括但不限于,用于鉴定可调节表型的遗传元件的筛选,用于识别遗传相互作用,用于开发/鉴定经优化的sgRNA,用于先导化合物发现/改良和用于基因疗法(例如,用宿主细胞基因组中基因的功能性拷贝替换突变型基因或功能异常型基因)。所述组分包括sgRNA、Cas蛋白、供体载体、基因座特异性辅助载体和通用型辅助载体。
A.sgRNA
所述sgRNA通常从5’至3’包含:结合区、5’发夹区、3’发夹区和转录终止序列。sgRNA被配置为与小指导RNA介导的核酸酶(例如,Cas蛋白,例如但不限于Cas9或Cpf1)形成稳定且有活性的复合物。在一些情况下,可以优化sgRNA以增强编码sgRNA的多核苷酸在宿主细胞中的表达。
5’发夹区的长度可以在约15和约50个核苷酸之间(例如,长度是约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33,34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或约50个核苷酸)。在一些情况下,所述5’发夹区的长度在约30-45个核苷酸之间(例如,长度是约31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些情况下,所述5’发夹区的长度是或是至少约31个核苷酸(例如,长度是至少约31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些情况下,所述5’发夹区包含一个或多个环或凸起,每个环或凸起为约1、2、3、4、5、6、7、8、9或10个核苷酸。在一些情况下,所述5’发夹区包含在约10和30个互补碱基对之间(例如,11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个互补碱基对)的茎部。在一些实施方案中,所述5’发夹的结合区可以包含四个或更少的连续尿嘧啶核苷酸(参见,例如US20160289673)。
在一些实施方案中,所述5’发夹区可以包含蛋白质结合结构或小分子结合结构。在一些情况下,5’发夹功能(例如,与sgRNA介导的核酸酶相互作用或组装)可以通过药物、生长因子、小分子配体或与5’茎-环的蛋白质结合结构结合的蛋白质被有条件地激活。在一些实施方案中,所述5’发夹区可包含非天然核苷酸。例如,可以掺入非天然核苷酸以增强蛋白质-RNA相互作用,或增加sgRNA的热稳定性或抗降解性。
sgRNA通常在5’和3’发夹区之间包含间插序列。5’发夹区和3’发夹区之间的间插序列的长度可以在约0至约50个核苷酸之间,优选地在约10和约50个核苷酸之间(例如,长度是或约为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸)。在一些情况下,所述间插序列被设计为线性、非结构化、基本线性或基本非结构化。在一些实施方案中,所述间插序列可包含非天然核苷酸。例如,可以掺入非天然核苷酸以增强蛋白质-RNA相互作用,或增加sgRNA:Cas蛋白复合物的热稳定性或抗降解性。作为另一个实例,可以掺入天然核苷酸以增加sgRNA的热稳定性或抗降解性。
3’发夹区可以包含约3、4、5、6、7或8个核苷酸环以及约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸或更长的茎部。在一些情况下,所述3’发夹区可以包含蛋白质结合结构、小分子结合结构、激素结合结构或代谢物结合结构,所述结构可以有条件地稳定sgRNA的二级和/或三级结构。在一些实施方案中,所述3’发夹区可包含非天然核苷酸。例如,可以掺入天然核苷酸以增加sgRNA:Cas复合物的蛋白质-RNA相互作用或增加其活性。例如,可以掺入天然核苷酸以增加sgRNA的热稳定性或抗降解性。
在一些实施方案中,sgRNA包括在其3’末端的终止结构。在一些情况下,sgRNA包括另外的3’发夹区(例如,在终止之前和在第一3’发夹区之后),所述3’发夹区可以与蛋白质、小分子、激素等相互作用,用于稳定化或另外的功能性,例如sgRNA:Cas组装或活性的条件性稳定化或条件性调节。
通常,结合区被设计成与靶遗传区或选定的基因座互补(例如,完全互补)或基本上互补。在一些情况下,在结合区的3’或5’末端的19个核苷酸与靶遗传区或所选基因座完全互补。在一些情况下,可以改变结合区以增加稳定性。例如,可以掺入非天然核苷酸以增加RNA抗降解性。在一些情况下,可以改变或设计结合区以避免或减少结合区中的二级结构形成。在一些情况下,可以设计结合区以优化G-C含量。在一些情况下,G-C含量优选在约40%和约60%之间(例如40%、45%、50%、55%、60%)。在一些情况下,可以选择结合区,使得其以促进sgRNA有效转录的序列开始。例如,结合区可以在5′末端处以G核苷酸开始。在一些情况下,结合区可以包含经修饰的核苷酸,例如但不限于经甲基化的或磷酸化的核苷酸。
在一些实施方案中,选择sgRNA以便不具有显著的脱靶效应。在一些情况下,可以测定针对脱靶遗传区或选定的基因座的sgRNA结合区的相似性。可以滤除具有超过预定阈值的高度相似性的sgRNA。在一些情况下,可以使用评分指标以手动或自动方式对包括前间区序列邻近基序(PAM)序列在内的候选结合区进行评分。因此,可以选择具有可接受数量的脱靶错配的sgRNA结合区用于合成。
在一些实施方案中,sgRNA靶向基因处或其附近的特定区域。例如,可以将sgRNA靶向基因转录起始位点5’的0-750bp区(上游)处或其附近的区域。在一些情况下,所述区域的0-750bp靶向可以提供或通过sgRNA:Cas复合物提供增强的转录激活。例如,可使体细胞与融合至转录激活因子或表位融合结构域的Cas蛋白以及靶向一个或多个基因的转录起始位点5’的0-750bp区的sgRNA(或sgRNA的文库)接触。
作为另一个实例,可以将sgRNA靶向在基因转录起始位点3’的0-1000bp区(下游)处或在其附近的区域。在一些情况下,所述区域的0-1000bp靶向可以提供或通过sgRNA:Cas复合物提供增强的转录阻抑。例如,可使体细胞与融合至转录阻抑因子或表位融合结构域的Cas蛋白以及靶向一个或多个基因的转录起始位点3’的0-1000bp区的sgRNA(或sgRNA的文库)接触。
在一些实施方案中,基于自动或手动标注的数据库,sgRNA靶向在转录起始位点(TSS)处或其附近的区域。例如,由Ensembl/GENCODE或APPRIS管线注释的转录物(Rodriguez等人.,Nucleic Acids Research,January;41(Database issue):D110-7(2013))可用于鉴定TSS和靶向TSS的遗传元件上游0-750bp(例如,用于靶向一个或多个转录激活结构域)或下游0-1000bp(例如,用于靶向一个或多个转录阻抑结构域)。
在一些实施方案中,sgRNA靶向被预测为相对不含核小体的基因组区域。核小体的位置和占有率可以通过使用微球菌核酸酶(MNase)进行酶消化来测定。MNase是一种内切-外切核酸酶,可优先消化裸DNA和核小体之间接头中的DNA,从而富集与核小体相关的DNA。为确定全基因组的核小体组织,使用高通量测序技术(MNase-seq)对MNase消化后残留的DNA进行测序。因此,具有高MNase-seq信号的区域被预测为被核小体相对占据,并且具有低MNase-seq信号的区域被预测为相对未被核小体占据。照此,在一些实施方案中,sgRNA靶向具有低MNase-Seq信号的基因组区域。
B.Cas蛋白
本文披露了小指导RNA依赖性核酸酶及其衍生物。在一些情况下,sgRNA介导的核酸酶是Cas蛋白(例如,Cas9或Cpf1)。例如,所述sgRNA介导的核酸酶可以是1类或2类CRISPR相关蛋白。在一些实施方案中,所述sgRNA介导的核酸酶可以是I、II、III、IV或V型CRISPR相关蛋白。在一个实施方案中,Cas蛋白是Cpf1蛋白或由Cpf1直系同源物编码的Cpf1样蛋白。在优选的实施方案中,Cas蛋白是Cas9蛋白或由Cas9直系同源物编码的Cas9样蛋白。
在一些情况下,sgRNA介导的核酸酶可以是经修饰的Cas9蛋白。Cas9蛋白可以是通过本领域已知的任何方法修饰的。例如,可以对Cas9蛋白进行密码子优化以在宿主细胞或在体外表达系统中表达。可替代地,Cas蛋白可以被工程化以具有经改善的特性,例如但不限于稳定性、增强的靶结合或减少的聚集。在优选的实施方案中,Cas蛋白在选定的基因座处催化DNA双链断裂,以将所需基因插入宿主细胞基因组中。
C.表达盒与载体
本文还描述了用于在宿主细胞中产生sgRNA的表达盒和载体。所述表达盒可以包含与编码sgRNA的多核苷酸可操作地连接的启动子(例如,异源启动子或天然启动子)。所述启动子可以是诱导型或组成型。所述启动子可以是组织特异性的。在一些情况下,所述启动子是U6、H1或脾病灶形成病毒(SFFV)长末端重复启动子。在一些情况下,与人延长因子1启动子(EF1A)相比,所述启动子是弱哺乳动物启动子。在一些情况下,所述弱哺乳动物启动子是泛素C启动子或磷酸甘油酸激酶1启动子(PGK)。在一些情况下,在不存在诱导物的情况下,所述弱哺乳动物启动子是TetOn启动子。在一些实施方案中,选择所选sgRNA启动子的强度以表达与Cas蛋白的量成比例的sgRNA的量。所述表达盒可以在载体中,例如质粒、病毒载体、慢病毒载体、AAV载体、腺病毒颗粒、DNA-纳米颗粒复合物(参见,例如,WO/2016/097377)等。所述sgRNA表达盒可以是游离型或整合在宿主细胞中。在优选的实施方案中,所述表达盒在载体(例如质粒或AAV病毒颗粒)中。
在一个实施方案中,本发明的Cas蛋白和一种或多种sgRNA可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型递送至例如活生物体。例如,制剂和剂量在美国专利号8,454,972(腺病毒的制剂、剂量)、美国专利号8,404,658(AAV的制剂、剂量)和美国专利号5,846,946(DNA质粒的制剂、剂量)以及来自涉及慢病毒、AAV和腺病毒的临床试验和关于临床试验的出版物中进行了描述。
对于AAV的实例,施用途径、制剂和剂量可以如下所述但不限于:美国专利号8,454,972以及涉及AAV的临床试验中。
对于腺病毒,施用途径、制剂和剂量可以如下所述但不限于:美国专利号8,404,658以及涉及腺病毒的临床试验中。
对于质粒递送,施用途径、制剂和剂量可以如下所述但不限于:美国专利号5,846,946以及涉及质粒的临床研究中。
任何载体的剂量可以基于或外推至平均70kg的个体,并且可以针对不同体重和种类的患者、受试者、哺乳动物进行调整。施用频率在医学或兽医师(例如医师,兽医)的技能范围内,这取决于通常的因素(包括年龄、性别、总体健康状况、患者或受试者的其他病症以及待解决的特定病症或症状)。
D.供体载体
通常,所述供体载体包含AAV、腺病毒、质粒或其他适合的载体。在一些实施方案中,所述供体载体可以包括表达盒。在一个实施方案中,所述供体载体编码单一所需基因和一个sgRNA靶位点。在另一个实施方案中,所述供体载体编码单一所需基因和两个sgRNA靶位点。所需基因可以是任何适合的基因。在具体的实施方案中,所述所需基因是已知引起遗传性疾病(例如,囊胞性纤维症)或与遗传性疾病密切相关的基因。例如,所述所需基因可以包括代谢性疾病(例如,糖尿病或苯丙酮尿症)。在一个实施方案中,所述所需基因是导致受试者中疾病表现的主要原因。例如,所述疾病可以包括由于单个基因突变而表现出的疾病(例如,镰状细胞性贫血)。
在一个实施方案中,所述供体载体编码人基因,例如人胰岛素或人因子IX。在一些实施方案中,所述供体载体适合于向动物,例如非人动物(如猪)施用。在另一个实施方案中,所述供体载体适合于向人类动物(例如,婴儿或更小)施用。在一个实施方案中,所述供体载体适合于向人类动物(例如,婴儿或更小)施用以治疗体细胞组织疾病(例如,囊胞性纤维症)。
在一些情况下,所述供体载体编码人胰岛素基因和单一sgRNA靶位点。在一个实施方案中,所述供体载体的sgRNA靶位点包含侧翼于人胰岛素基因的3’或5’区域的核酸序列,使得所述供体载体在线性化成线性DNA片段后可以插入宿主细胞基因组中的预期位置处。
在一些情况下,所述供体载体编码人因子IX基因和单个sgRNA靶位点。在一个实施方案中,所述供体载体的sgRNA靶位点包含侧翼于人因子IX基因的3’或5’区域的核酸序列,使得所述供体载体在线性化成线性DNA片段后可以插入宿主细胞基因组中的预期位置处。
E.基因座特异性辅助载体
通常,所述基因座特异性辅助载体包含AAV、腺病毒、质粒或其他适合的载体。在一些实施方案中,所述基因座特异性辅助载体可以包括表达盒。在一个实施方案中,所述基因座特异性辅助载体编码单一sgRNA。在优选的实施方案中,所述基因座特异性辅助载体编码一个(或多个)与宿主细胞基因组中选定的核酸序列互补的sgRNA。在另一个实施方案中,所述基因座特异性辅助载体编码两个sgRNA,其各自与宿主细胞基因组中不同的所选核酸序列互补。在一个实施方案中,所述基因座特异性辅助载体进一步包含编码Cas蛋白的核酸序列。在一个实施方案中,所述基因座特异性辅助载体进一步包含编码Cas9蛋白的核酸序列。在一些情况下,所述基因座特异性辅助载体可以与以下所述的通用型辅助载体组合以形成单一组合的载体,从而携带基因座特异性sgRNA和通用型sgRNA二者。
F.通用型辅助载体
通常,所述通用型辅助载体包含AAV、腺病毒、质粒或其他适合的载体。在一些实施方案中,所述通用型辅助载体可以包括表达盒。在一个实施方案中,所述通用型辅助载体编码单一sgRNA。在优选的实施方案中,所述通用型辅助载体编码一个(或多个)与供体载体中的一个(或多个)sgRNA靶位点互补的sgRNA。在另一个实施方案中,所述通用型辅助载体编码两个sgRNA,其各自与供体载体中的不同sgRNA靶位点互补。在一个实施方案中,所述通用型辅助载体进一步包含编码Cas蛋白的核酸序列。在优选的实施方案中,所述通用型辅助载体进一步包含编码Cas9蛋白的核酸序列。
在一方面,用于在体内进行基因组编辑的组合物包含(i)供体载体;(ii)基因座特异性辅助载体;和(iii)通用型辅助载体。在一些实施方案中,所述组合物进一步包含位于活生物体体细胞组织内的宿主细胞。所述宿主细胞可以是动物细胞,例如人或非人动物。在优选的实施方案中,所述宿主细胞是哺乳动物细胞。在某些情况下,所述宿主细胞是来自肝、肾、脾、胆囊、胃、膀胱、子宫、肠、胰、结肠、肺、心、脑、肌肉、骨、咽和喉的哺乳动物细胞。在另一个实施方案中,所述宿主细胞是来自哺乳动物的血细胞(例如,红血球、淋巴细胞、红和白血细胞、T细胞和辅助细胞)。在一个实施方案中,所述宿主细胞可以包括所述宿主细胞的后代。
在一些实施方案中,所述供体载体是质粒或AAV病毒颗粒。在一些实施方案中,所述供体载体编码用于插入宿主细胞基因组的单一基因。在一个实施方案中,所述供体载体编码用于插入宿主细胞基因组的一个或多个基因(例如,两个基因)。所述供体载体还包含一个或多个sgRNA靶位点。在一个实施方案中,sgRNA靶位点包含大约20bp的核酸区。在一些实施方案中,所述供体载体编码单一sgRNA位点;而在其他实施方案中,所述供体载体编码两个sgRNA靶位点。如本文所述,sgRNA靶位点允许sgRNA:Cas复合物有效地靶向供体载体,使得在所述供体载体中发生链断裂,从而导致线性化DNA片段的形成。线性DNA片段保留了一个或多个基因的编码,并且线性DNA片段的一个或多个sgRNA靶位点允许将线性DNA片段插入宿主细胞基因组。
在一个实施方案中,所述基因座特异性辅助载体是质粒或AAV病毒颗粒。在一些实施方案中,所述基因座特异性辅助载体编码至少一个sgRNA,其与宿主细胞基因组中选定的核酸序列互补。在一些实施方案中,所述基因座特异性辅助载体编码单一sgRNA,其与宿主细胞基因组中的选定的核酸序列互补。在另一个实施方案中,所述基因座特异性辅助载体编码两个sgRNA,其与宿主细胞基因组中的选定的核酸序列互补。
在一个实施方案中,所述通用型辅助载体是质粒或AAV病毒颗粒。在一些实施方案中,所述通用型辅助载体编码至少一个sgRNA,其与供体载体中的sgRNA互补。在一些实施方案中,所述通用型辅助载体编码单一sgRNA,其与供体载体中的sgRNA互补。在另一个实施方案中,所述通用型辅助载体编码两个sgRNA,其与供体载体中的两个sgRNA互补。在又另一个实施方案中,所述通用型辅助载体编码两个或更多个sgRNA,其与供体载体中的两个或更多个sgRNA靶位点互补。
如以下实施例所示,可以将本发明的病毒(例如,AV或AAV)载体或质粒载体施用(例如,注射)至受试者或受试者的目的组织中。对于细胞类型特异性基因组修饰,Cas蛋白的表达可以由细胞类型特异性启动子驱动。例如,肝特异性表达可以使用白蛋白启动子(参见,例如,Wooddell等人.,Journal of Gene Medicine,10(5):551-63(2008)),而神经元特异性表达可以使用突触蛋白I启动子(参见,例如,Kugler等人.,Gene Therapy,10:337-347(2003))。
IV.方法
本文描述了在宿主细胞基因组中的选定的基因座处插入所需基因的方法。还描述了用于进行CRISPR/Cas基因组编辑的方法。仍进一步,描述了用于在受试者中治疗体细胞组织疾病的方法。
在一个实施方案中,本发明提供了在宿主细胞基因组中的选定的基因座处插入所需基因的方法。在一些实施方案中,所述宿主细胞是活生物体内的体细胞。在一些实施方案中,所述方法包括使活生物体与以下项接触:(i)供体载体;(ii)基因座特异性辅助载体;(iii)通用型辅助载体;和(iv)Cas或Cpfl蛋白(如果基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白);线性化供体载体以形成供体DNA片段,并且由此使供体DNA片段通过NHEJ介导的敲入进入到活生物体体细胞组织的宿主细胞基因组中。
在一个实施方案中,所述方法包括使活生物体与以下项接触:(i)供体载体,其编码所需基因和一个或两个sg-RNA靶位点;(ii)基因座特异性辅助载体,其编码至少一个sgRNA,所述sgRNA与宿主细胞基因组中的选定的核酸序列互补;(iii)通用型辅助载体,其编码至少一个sgRNA,所述sgRNA与供体载体中的一个或两个sg-RNA靶位点互补;和如果所述基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(iv)Cas或Cpfl蛋白,从而使所述供体载体线性化以形成供体DNA片段,从而使所述供体DNA片段通过NHEJ介导的敲入进入到活生物体体细胞组织中的宿主细胞基因组中。
在另一个实施方案中,所述方法包括使活生物体与以下项接触:(i)供体载体,其编码所需基因和单一sg-RNA靶位点;(ii)基因座特异性辅助载体,其编码单一sgRNA,所述sgRNA与宿主细胞基因组中的选定的核酸序列互补;(iii)通用型辅助载体,其编码单一sgRNA,所述sgRNA与供体载体中的单一sg-RNA靶位点互补;和如果所述基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(iv)Cas或Cpfl蛋白,从而使所述供体载体线性化以形成供体DNA片段,从而使所述供体DNA片段通过NHEJ介导的敲入进入活生物体体细胞组织中的宿主细胞基因组中。
在一些实施方案中,所述供体载体包含单一所需基因。在一个实施方案中,所述单一所需基因是在宿主中疾病表现的原因的基因(例如,CFTR基因)。
在另一个实施方案中,所述供体载体编码单一sg-RNA靶位点,其中所述单一sgRNA靶位点与至少一个由通用型辅助载体编码的sgRNA互补。在一个实施方案中,所述基因座特异性辅助载体或通用型辅助载体进一步包含编码Cas蛋白的核酸序列。在优选的实施方案中,所述基因座特异性辅助载体或通用型辅助载体进一步包含编码Cas9蛋白的核酸序列。
在一些实施方案中,所述方法适用于将所需基因插入动物,例如非人动物(如小鼠)中。所述方法还适用于将所需基因插入人(例如,新生婴儿)中。在其他情况下,所述方法适合于将所需基因插入患有遗传性疾病(例如,家族性扩张性心肌病或乙型血友病)的人中。在其他实施方案中,所述方法适合于将所需基因插入患有代谢性疾病的人(例如,患有代谢性障碍,如苯丙酮尿症的新生儿)中。在一些实施方案中,所述方法特别适合于替换宿主基因组中功能异常或不存在的基因。在一些实施方案中,所需基因是人胰岛素或人因子IX。
在一个实施方案中,所述方法的供体载体编码人基因,例如人胰岛素或人因子IX。在一些实施方案中,所述方法的供体载体适合于向动物,例如非人动物(如猪)施用。在另一个实施方案中,所述方法的供体载体适合于向人类动物(例如,婴儿或更小)施用。在优选的实施方案中,所述方法的供体载体适合于向人类动物(例如,婴儿)施用以治疗体细胞组织疾病(例如,囊胞性纤维症)。
在一个实施方案中,所述方法的供体载体编码人胰岛素基因和单一sgRNA靶位点。在另一个实施方案中,所述方法的供体载体编码人因子IX基因和单一sgRNA靶位点。在一些实施方案中,所述基因座特异性辅助载体和/或通用型辅助载体的sgRNA包含约20个核苷酸的核酸区,所述核酸区与宿主细胞基因组中的选定的核酸序列或供体载体中的sgRNA靶位点互补。
在一些实施方案中,通过在宿主中鉴定所需目的基因并评估所需基因的核酸序列3’或5’来确定用于将所需基因插入宿主细胞基因组中的选定的基因座,从而鉴定用于引入双链断裂的一个或多个位点,这将允许在不存在移码突变的情况下插入所需基因。对于本领域技术人员显而易见的是,存在用于选择基因组基因座的各种指南(参见,例如Ran等人.,Nature Protocols,8(11):2281-2308(2013),通过引用以其全文并入本文)。
在一个实施方案中,所述方法进一步包括检测宿主细胞中由所需基因编码的基因产物。在一些情况下,所述基因产物可以包括由所需基因编码的mRNA转录物或蛋白质。在一种情况下,可以通过基因表达测定(例如,
Figure BDA0002666236730000261
测定或RT-qPCR测定)或蛋白质表达测定(例如,蛋白质印迹法)来检测基因产物。在一个实施方案中,所述方法可以包括检测由获得自活生物体的样品中插入的基因编码的蛋白质或RNA。
可以使用本领域中任何已知的方法来实现对在宿主细胞中由所需基因编码的基因产物进行的检测。用于对由插入宿主细胞基因组中的所需基因表达的基因产物进行检测的适合方法的实例包括但不限于实时聚合酶链反应(RT-PCR)、逆转录定量聚合酶链反应(RT-qPCR)、RNA印迹法、定量聚合酶链式反应(qPCR)、酶联免疫吸附测定(ELISA)、下一代测序、荧光激活细胞分选(FACS)和蛋白质印迹法。
基因产物检测的另一种形式包括蛋白质在宿主细胞中的定位。例如,可以将包括但不限于绿色荧光蛋白(GFP)的荧光蛋白(FP)掺入供体载体中,使得在将供体DNA片段插入宿主基因组细胞中时也可以表达FP。
另外地或可替代地,在宿主细胞中由所需基因表达的蛋白质可以通过对表达的蛋白质具有特异性的标记抗体来检测。然后可以例如使用荧光显微镜观察荧光mRNA或蛋白质的检测。在又另一个实施方案中,在宿主细胞中由所需基因表达的蛋白质可以使用酶联免疫吸附测定(ELISA)检测。
在一些实施方案中,所述方法进一步包括对获得自活生物体的样品中插入的所需基因的功能性进行评估。在一个实施方案中,对插入的所需基因的功能性进行的评估包括对宿主细胞中一种或多种基因产物的量(或相对量)进行测量或定量;并且将一种或多种基因产物的量(或相对量)与来自对照样品宿主细胞的基因产物的参考量(或相对量)进行比较。在优选的实施方案中,对照样品包括来自不具有插入的所需基因的、相同或相关生物体(例如,通过物种或谱系)的宿主细胞。在一些实施方案中,对照样品可以包括缺少所需基因的宿主细胞。在另一个实施方案中,对照样品可以包括来自具有插入的所需基因的野生型形式的、相同或相关生物体(例如,通过物种或谱系)的宿主细胞。
在一个实施方案中,对插入的所需基因的功能性进行的评估可以包括将由具有插入的所需基因的宿主细胞产生的基因产物的量(或相对量)与由具有野生型基因组而未经遗传修饰(例如基因编辑)的宿主细胞产生的基因产物的量(或相对量)进行比较。在另一个实施方案中,对插入的所需基因的功能性进行的评估可以包括将由具有插入的所需基因(来自患有遗传性疾病的受试者)的宿主细胞产生的基因产物的量(或相对量)与由来自缺少遗传性疾病(即,具有野生型基因型)的受试者的宿主细胞产生的基因产物的量(或相对量)进行比较。
在一些实施方案中,评估可以包括本领域已知的用于比较两组生物学数据的任何方法。在一个实施方案中,评估可以包括确定在表达具有插入的所需基因的基因产物的宿主细胞(例如,测试样品)与表达具有野生型基因型的基因产物的宿主细胞(例如,对照样品)之间是否存在统计学上相关的差异(例如,P<0.05)。例如,适合的统计学分析包括Fisher精确检验,Wilcoxon检验和Student T检验。在一些实施方案中,在对照样品和测试样品(例如,插入的所需基因)中基因表达产物的水平之间没有统计学差异,这表明对于宿主细胞中所需的基因,将所需基因插入宿主细胞中已经恢复了野生型功能性。在一些实施方案中,宿主细胞中所需基因的野生型功能性的恢复可导致宿主中疾病或病症的治疗。在优选的实施方案中,所述方法包括治疗宿主中的体细胞组织疾病。
在一方面,本发明提供了基因组编辑的方法,所述方法包括使活生物体与以下项接触:(i)供体载体;(ii)基因座特异性辅助载体;(iii)通用型辅助载体;和如果基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(iv)Cas或Cpfl蛋白(可以处于蛋白质形式或编码核酸的形式);线性化供体载体以形成供体DNA片段,并且由此使供体DNA片段通过NHEJ介导的敲入进入到活生物体的宿主细胞基因组中。
在一个实施方案中,所述方法包括使活生物体与以下项接触:(i)供体载体,其编码所需基因和一个或两个sg-RNA靶位点;(ii)基因座特异性辅助载体,其编码至少一个sgRNA,所述sgRNA与宿主细胞基因组中的选定的核酸序列互补;(iii)通用型辅助载体,其编码至少一个sgRNA,所述sgRNA与供体载体中的一个或两个sg-RNA靶位点互补;和如果基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(iv)Cas或Cpfl蛋白(处于蛋白质形式或编码所述蛋白质的核酸形式),从而使所述供体载体线性化以形成供体DNA片段,从而使所述供体DNA片段通过NHEJ介导的敲入进入到活生物体的宿主细胞基因组中。
在另一个实施方案中,所述方法包括使活生物体与以下项接触:(i)供体载体,其编码所需基因和单个sg-RNA靶位点;(ii)基因座特异性辅助载体,其编码单个sgRNA,所述sgRNA与宿主细胞基因组中的选定的核酸序列互补;(iii)通用型辅助载体,其编码单一sgRNA,所述sgRNA与供体载体中的单一sg-RNA靶位点互补;和如果基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(iv)Cas或Cpfl蛋白(可以处于蛋白质或编码核酸的形式),从而使所述供体载体线性化以形成供体DNA片段,从而使所述供体DNA片段通过NHEJ介导的敲入进入到活生物体的宿主细胞基因组中。
在一些实施方案中,所述供体载体包含单一所需基因。在一个实施方案中,所述单一所需基因是在活生物体中疾病表现的原因的基因(例如,CFTR基因)。
在一方面,本发明提供了用于在受试者中治疗体细胞组织疾病的方法,所述方法包括(i)向有需要的受试者施用治疗有效量的以下项:(a)编码所需基因和一个或两个sg-RNA靶位点的供体载体;(b)编码至少一个sgRNA的基因座特异性辅助载体,所述sgRNA与宿主细胞基因组中选定的核酸序列互补;(c)编码至少一个sgRNA的通用型辅助载体,所述sgRNA与所述供体载体中一个或两个sg-RNA靶位点互补;以及如果基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的的(d)Cas或Cpfl蛋白(可以处于蛋白质或编码核酸的形式),从而治疗受试者的体细胞组织疾病。
在一个实施方案中,所述供体载体编码单一sgRNA靶位点和单一基因。在另一个实施方案中,所述基因座特异性辅助载体编码单个sgRNA,所述sgRNA与宿主细胞基因组中的选定的核酸序列互补。在又另一个实施方案中,所述通用型辅助载体编码单一sgRNA,所述sgRNA与宿主细胞基因组中的选定的核酸序列互补。在一些实施方案中,所述通用型辅助载体或所述基因座特异性辅助载体编码Cas蛋白。在一个实施方案中,所述Cas蛋白是Cas9蛋白。
在一些实施方案中,所述方法进一步包括在来自受试者的样品中检测由所需基因编码的基因产物(例如,mRNA或蛋白质)的表达。在一个实施方案中,所述方法进一步包括确认由所需基因编码的基因产物的表达足以治疗体细胞组织疾病。
在一些实施方案中,所述方法适合于治疗遗传性疾病(例如,家族性扩张型心肌病或乙型血友病)。在其他实施方案中,所述方法适合于治疗患有代谢性疾病的人(例如,患有代谢性障碍,如苯丙酮尿症的新生儿)。在一些实施方案中,所述方法特别适合通过在宿主细胞基因组中用功能性基因替换有缺陷或功能异常的基因来治疗体细胞组织疾病。在一些实施方案中,所述方法治疗人乙型血友病或1型糖尿病。
在一个实施方案中,所述方法进一步包括检测宿主细胞中由所需基因编码的基因产物的表达。在一些情况下,所述基因产物可以包括由所需基因编码的mRNA转录物或蛋白质。在一种情况下,可以通过基因表达测定(例如,
Figure BDA0002666236730000281
测定或RT-qPCR测定)或蛋白质表达测定(例如,蛋白质印迹法)来检测基因产物。在一个实施方案中,所述方法可以包括从获得自活生物体的样品检测由插入的基因编码的蛋白质或RNA。
可以使用本领域中任何已知的方法来实现对在宿主细胞中由所需基因编码的基因产物的表达进行检测。用于对由插入宿主细胞基因组中的所需基因表达的基因产物进行检测的适合方法的实例包括但不限于实时聚合酶链反应(RT-PCR)、逆转录定量聚合酶链反应(RT-qPCR)、RNA印迹法、定量聚合酶链式反应(qPCR)、酶联免疫吸附测定(ELISA)、下一代测序、荧光激活细胞分选(FACS)和蛋白质印迹法。
基因产物检测的另一种形式包括mRNA在宿主细胞中的定位。例如,可以将包括但不限于绿色荧光蛋白(GFP)的荧光蛋白(FP)掺入供体载体中,使得在将供体DNA片段插入宿主基因组细胞中时还表达FP。
另外地或可替代地,在宿主细胞中由所需基因表达的蛋白质可以通过对表达的蛋白质具有特异性的标记抗体来检测。然后可以例如使用荧光显微镜观察荧光mRNA或蛋白质的检测。在又另一个实施方案中,在宿主细胞中由所需基因表达的蛋白质可以使用酶联免疫吸附测定(ELISA)检测。
在一个实施方案中,治疗体细胞疾病包括以一定量(或相对量)产生一种或多种由所需基因编码的mRNA转录物或蛋白质,所述量(或相对量)相对于缺乏插入的所需基因的样品(例如缺少所需基因的宿主细胞)中是统计学显著的。在另一个实施方案中,治疗体细胞疾病包括在具有插入的所需基因的宿主细胞中确认基因表达的水平足以治疗体细胞组织疾病。普通技术人员将理解,基因的水平,特别是与疾病相关的基因的水平是本领域已知的。通过将具有插入的所需基因的宿主细胞中基因表达的水平(例如,%倍数增加或%倍数减少)与另一宿主细胞中同一基因的正常或参考样品进行比较,可以确定与参考宿主细胞相比,具有插入的基因的宿主细胞是否表达更多、更少或大约相同的基因表达。
在另一个实施方案中,治疗体细胞组织疾病包括表达一种或多种基因产物,所述产物导致与所述体细胞组织疾病有关的一种或多种症状的改善。在又另一个实施方案中,治疗体细胞组织疾病包括与缺少所需基因的宿主细胞相比,将一种或多种基因产物的表达增加至少20%、30%、40%、50%、60%、70%、80%、90%或更多。在一些实施方案中,治疗体细胞组织疾病包括与缺少所需基因的宿主细胞相比,将一种或多种基因产物的表达增加至少2倍、3倍、4倍、5倍、6倍、7倍或更多倍。
在一些实施方案中,所述方法包括向受试者施用供体载体、特异性辅助载体和通用型辅助载体。任选地,如果所述通用型辅助载体或基因座特异性辅助载体不编码Cas蛋白,则可以向受试者施用编码Cas蛋白的不同载体。
在一个实施方案中,供体载体、特异性辅助载体和通用型辅助载体可以静脉内、鞘内、脊髓内、腹膜内、肌内、鼻内、皮下、口服、局部和/或通过吸入施用。在优选的实施方案中,所述供体载体、特异性辅助载体和通用型辅助载体通过静脉内施用。在另一个实施方案中,将所述供体载体、特异性辅助载体和通用型辅助载体以相同体积,顺序地或同时共施用于宿主。
明显的是,将所述供体载体、特异性辅助载体和通用型辅助载体以与剂型制剂相容的方式,并以将治疗有效的量施用。术语“治疗有效量”是指被施用的有效治疗疾病、障碍或病症例如缓解正在治疗的疾病的一种或多种症状的药剂(例如,本文所述的供体载体、特异性辅助载体和通用型辅助载体)的量,和/或所述量将预防正在进行治疗的受试者患有或处于发展风险中的疾病的一种或多种症状的量。剂量的大小也将由在特定宿主中施用特定药剂伴随的任何不良副作用的存在、性质和程度来确定。确定用于特定情况的适当剂量在执业医师的技术范围内。
在一个实施方案中,所述体细胞组织疾病是遗传性疾病。在一些实施方案中,所述遗传性疾病选自糖尿病、血友病、镰状细胞性贫血、囊胞性纤维症、杜氏肌营养不良、血色沉着病、先天性聋、家族性高胆固醇血症、亨廷顿病、泰-萨病或苯丙酮尿症。在另一个实施方案中,所述体细胞组织疾病是代谢性障碍。在又另一个实施方案中,所述体细胞组织疾病是由单一基因的突变导致的疾病。
V.试剂盒
本文所述还包括用于治疗体细胞组织疾病的试剂盒。本文进一步描述了用于进行CRISPR/Cas基因组编辑和/或转录调节的试剂盒。在一些实施方案中,试剂盒披露于本文中,可以用于进行CRISPR/Cas基因组编辑和转录调节。
在一方面,用于治疗体细胞组织疾病的试剂盒包含:(i)第一容器,其包含供体载体;(ii)第二容器,其包含基因座特异性辅助载体;和(iii)第三容器,其包含通用型辅助载体。在一个实施方案中,所述第一容器的供体载体编码一个或两个sgRNA靶位点和所需基因。在一个实施方案中,所述第二容器的基因座特异性辅助载体编码至少一个sgRNA,所述sgRNA与宿主细胞基因组中选定的核酸序列互补;在一个实施方案中,所述第三容器的通用型辅助载体编码至少一个sgRNA,所述sgRNA与所述供体载体中的一个或多个sgRNA靶位点互补。在一些实施方案中,所述试剂盒进一步包含在第四容器中的宿主细胞(例如,人肝细胞或神经元)。在一些实施方案中,所述试剂盒进一步包含在第五容器中的Cas蛋白或编码Cas蛋白的载体。在一个实施方案中,所述试剂盒进一步包含一种或多种另外的试剂以检测/测量由所需基因产生的基因产物(例如,mRNA转录物或蛋白质)。在一些实施方案中,所述试剂盒进一步包含参考、对照或标准,通过所述参考、对照或标准可以将所需基因的基因产物的表达评估为治疗体细胞组织疾病。
在另一个方面,用于进行CRISPR/Cas基因组编辑的试剂盒包含:(i)第一容器,其包含供体载体;(ii)第二容器,其包含基因座特异性辅助载体;和(iii)第三容器,其包含通用型辅助载体。在一个实施方案中,所述第一容器的供体载体编码一个或两个sgRNA靶位点和所需基因。在一个实施方案中,所述第二容器的基因座特异性辅助载体编码至少一个sgRNA,所述sgRNA与宿主细胞基因组中选定的核酸序列互补;在一个实施方案中,所述第三容器的通用型辅助载体编码至少一个sgRNA,所述sgRNA与所述供体载体中的一个或多个sgRNA靶位点互补。在一些实施方案中,所述试剂盒进一步包含在第四容器中的宿主细胞(例如,人肝细胞或神经元)。在一些实施方案中,所述试剂盒进一步包含在第五容器中的Cas蛋白或编码Cas蛋白的载体。在一个实施方案中,所述试剂盒进一步包含一种或多种另外的试剂以检测/测量由所需基因产生的基因产物(例如,mRNA转录物或蛋白质)。在一些实施方案中,所述试剂盒进一步包含参考、对照或标准,通过所述参考、对照或标准将所需基因的基因产物的表达作为对基因组编辑的指示。
在又另一个方面,用于进行CRISPR/Cas转录调节的试剂盒包含:(i)第一容器,其包含供体载体;(ii)第二容器,其包含基因座特异性辅助载体;和(iii)第三容器,其包含通用型辅助载体。在一个实施方案中,所述第一容器的供体载体编码一个或两个sgRNA靶位点和所需基因。在一个实施方案中,所述第二容器的基因座特异性辅助载体编码至少一个sgRNA,所述sgRNA与宿主细胞基因组中选定的核酸序列互补。在一个实施方案中,所述第三容器的通用型辅助载体编码至少一个sgRNA,所述sgRNA与所述供体载体中的一个或多个sgRNA靶位点互补。在一些实施方案中,所述试剂盒进一步包含在第四容器中的宿主细胞(例如,人肝细胞或神经元)。在一些实施方案中,所述试剂盒进一步包含在第五容器中的Cas蛋白或编码Cas蛋白的载体。在一个实施方案中,所述试剂盒进一步包含一种或多种另外的试剂以检测/测量由所需基因产生的基因产物(例如,mRNA转录物或蛋白质)。在一些实施方案中,所述试剂盒进一步包含参考、对照或标准,通过所述参考、对照或标准可以将所需基因的基因产物的表达评估为在宿主细胞中调节(即,增加或减少)转录。
在一些实施方案中,所述试剂盒包含多个容器,其中所述供体载体、基因座特异性辅助载体和通用型辅助载体各自包含在不同的(有区别的)容器中。将很容易地看出所述第一、第二和第三容器可以是相同、相似或不同的材料。可以考虑本领域已知的任何合适的储存或反应器皿容器(例如,塑料管或Eppendorf管)。在优选的实施方案中,所述第一、第二和第三容器具有相同的材料。在一些实施方案中,将所述第一、第二和/或第三容器在冰上、在-20℃或优选-80℃下储存或保持直至需要。同样明显的是,所述第一、第二和/或第三容器可以包括其他试剂,包括但不限于缓冲液、dNTP或酶。在某些实施方案中,所述试剂盒包括使用说明书(例如,在计算机可读介质上或可通过超链接访问)或使用说明手册。
本申请中引用的所有专利、专利申请和其他出版物,包括GenBank登录号或类似的序列识别号出于所有目的通过引用以全文并入本文。
实施例
本发明的各方面在以下实施例中说明。已经做出努力以确保所使用的数字(例如,量、浓度、百分比变化等)的准确性,但应当考虑一些实验误差和偏差。除非另有说明,否则温度为摄氏度,并且压力为大气压或接近大气压。应当理解,这些实施例仅以举例说明的方式给出,并不旨在限制诸位发明人认为是本发明各个方面的范围。
实施例1:一般实验材料与方法
水动力注射
将质粒溶解于盐水中至浓度为60μg/ml,,并且针对每只小鼠注射的总体积为其体重的10%(例如,对于20克为2ml)。对于通过质粒注射的体内敲入测定,对于每种制粒组分的剂量是彼此相等的。为保证成功转染,在5秒内完成小鼠注射。
AAV包装
将AAV-DJ和AAV辅助系统用于病毒包装(参见,例如,Grieger,J.C.,Choi,V.W.&Samulski,R.J.Production and characterization of adeno-associated viralvectors.Nat Protoc 1,1412-28(2006))。在具有80%铺满率的293FT细胞中进行转染,并且在转染后3天,收集病毒。简而言之,从细胞质和核物质中提取病毒,然后以超高速进行梯度离心。最后,将病毒颗粒浓缩,并用超离心100KD过滤器进一步纯化。
链脲霉素(STZ)诱导的小鼠模型1型糖尿病(T1DM)
链脲霉素(STZ)购自Sigma-Aldrich(St.Louis,MO),在-20℃下储存,并溶解于柠檬酸钠(pH 4.5)中以立即使用。将浓度为160mg/kg用作该糖尿病模型的单次注射。
血糖和胰岛素测量
除非另有说明,否则在进行血糖测量之前,使小鼠禁食6小时。基本上根据制造商的说明,使用Contour Next血糖仪(Bayer AG,NJ)和相关的检测条通过尾静脉出血测量血糖水平。除非另有说明,否则在禁食6小时后收集血液血清用于胰岛素检测。基本上根据制造商的说明,使用从香港大学购买的超灵敏小鼠胰岛素试剂盒,通过ELISA法测定胰岛素水平。
血液因子IX(FIX)测量
如上所述收集血液血清用于胰岛素检测。基本上根据制造商的说明,将因子IX(FIX)ELISA试剂盒(Abcam,目录号ab108831)用于测量FIX浓度。
血液血清收集
利用毛细作用从眼静脉收集小鼠血液样本。将血液样本在室温下放置20分钟以凝结,然后离心收集上层透明血清。将小鼠血清样本保持在-80℃下用于进一步分析。
免疫组织化学染色
将百分之四的甲醛用于固定组织样品以使蛋白质交联。然后将固定的组织样本包埋在石蜡中,并切成5μm切片。收集切片并将其安装在粘合性载玻片上,并根据标准程序通过阻断处理,并逐步与一抗和二抗孵育。之后,将切片用DAB(发色团3,3'-二氨基联苯胺)染色,洗涤并脱水,然后在显微镜下成像。
荧光激活细胞分选分析
荧光激活细胞分选(FACS)分析仪(BD LSRFortessa细胞分析仪)配置有单个488nm氩离子激光器(200mW)。激光通过激发细胞荧光蛋白(eGFP)或细胞内颗粒度来诱导光散射。在FITC-A(GFP)对数标度上的门内记录的事件提供了GFP表达水平的良好指示,并且计数表明GFP阳性细胞的数量。将GFP阳性细胞占门控区域总计数的比率定义为靶向效率。
基因组整合的基因组DNA提取和PCR检测
基本上根据制造商的说明,使用基因组DNA提取试剂盒(Tiangen)提取培养细胞中的基因组DNA。为从肝组织中提取基因组DNA,在37oC下使用Tris缓冲液和蛋白酶K过夜消化,然后用75%的乙醇纯化。通常,将200ng基因组DNA用于含有Phusion高保真DNA聚合酶(New England Biolabs)的PCR反应,所述反应基本上根据制造商的说明进行。
肝收获和成像
立即从处死的小鼠中收获小鼠肝,用PBS渗透,然后在配备有荧光成像系统的Olympus SZX16立体显微镜下直接成像。
实施例2:质粒构建
Cas9和sgRNA
PX330-Cas9质粒购自addgene(addgene目录号:42230),如先前所述使用MIT-CRISPR Designer选择sgRNA靶向位点(He,X.等人.Knock-in of large reporter genesin human cells via CRISPR/Cas9-induced homology-dependent and independent DNArepair..Nucleic Acids Res 44,e85(2016))。
AAV-Cas9-sgRNA质粒购自addgene(addgene目录号:61591),并且基于网站(casblastr.org)的输出设计了sgRNA靶序列。通过使两个合成的寡核苷酸退火,并在PX330-Cas9或Bsa1的Bbs1处插入AAV-Cas9,构建所有sgRNA。
NHEJ供体
如先前所述使用NHEJ-GFP供体(He,X.等人.Knock-in of large reporter genesin human cells via CRISPR/Cas9-induced homology-dependent and independent DNArepair..Nucleic Acids Res 44,e85(2016))。然后通过Msc1和Nsi1双重消化用hINS或hF9CDS替换GFP盒,以分别构建NHEJ-hINS供体和NHEJ-hF9供体。
AAV供体
AAV供体的主链购自addgene(addgene目录号:21894)。将两个含有多个克隆位点(MCS)的寡核苷酸合成,使其退火,并通过Not1和Spe1消化插入该主链。
合成sgRNA靶序列并将其插入MCS,然后从相应的NHEJ供体扩增IRES-eGFP-PA、IRES-hINS-PA或IRES-hF9-PA盒,并插入MCS以分别产生AAV-NHEJ-eGFP、AAV-NHEJ-荧光素酶、AAV-NHEJ-hINS或AAV-NHEJ-hF9。
异位过表达质粒
起始质粒是pEGFP-N1(addgene目录号:6085-1)。用hINS或hF9 CDS替换eGFP盒,以分别构建CMV-hINS和CMV-hF9质粒,用于异位表达。
实施例3:NHEJ介导的体内高效敲入
最近,发明人小组建立了新颖的体外方法,以通过CRISPR/Cas9偶联的NHEJ修复机制高效敲入大DNA片段(例如,基因)(参见He,X.等人.Knock-in of large reporter genesin human cells via CRISPR/Cas9-induced homology-dependent and independent DNArepair.Nucleic Acids Res 44,e85(2016)和美国临时专利申请号62/256,514和62/288,974;美国专利申请号15/354,329;在所有检查的人类细胞系中,发现这种CRISPR/Cas9-NHEJ敲入方法显著优于常用的基于HDR的敲入策略。
然而,由于在体内条件下将治疗性转基因有效且位点特异性整合到体细胞组织中的需求很高,并且可能在临床应用中具有重大影响,例如对遗传性疾病的矫正;因此,启动了一个项目,以探索用于体内敲入和基因治疗的新颖CRISPR/Cas9-NHEJ方法。
如本文所公开的,构建新系统以采用CRISPR/Cas9-NHEJ方法在小鼠肝中体内敲入和表达转基因。通过CRISPR/Cas9-NHEJ方法,在体内条件下,针对有效敲入不同转基因的过程,新系统获得了优异的结果,所述方法本身是基于动物的生物医学或临床前研究的宝贵新工具和技术。
使用已知的1型糖尿病(T1DM)小鼠模型,发明人证明了体内敲入方法可以成功地将编码人胰岛素的转基因hINS引入小鼠肝的基因组中,并且这种整合导致延长在注射的小鼠中人胰岛素的表达和分泌(参见实施例4)。值得注意地,实施例4中所述的基于基因的治疗方法成功逆转了T1DM小鼠中的高血糖症状。
使用实施例5中描述的类似的基因治疗方法,将hF9转基因成功引入小鼠肝中,并且在小鼠模型中以显著水平实现了人FIX的延长表达和分泌。
先前已描述了使用单切NHEJ供体,对外源DNA进行体外基因组整合的效率的测试(参见美国临时专利申请号62/256,514和62/288,974;美国专利申请号15/354,329;和He,X.等人.Knock-in of large reporter genes in human cells via CRISPR/Cas9-induced homology-dependent and independent DNA repair.Nucleic Acids Res 44,e85(2016)),通过水动力注射,经由尾静脉将所述供体连同Cas9-sgA和Cas9-sgActb一起递送至小鼠中(sgA是指特定sgRNA)(参见图1A和1B)。
由于Actb在小鼠组织中组成型地且高度表达,因此具有成功敲入ires-GFP转基因的细胞将变为GFP阳性。注射5天后处死小鼠,并收集肝用于敲入分析。图1C的荧光图像清楚地显示了在经注射的小鼠中大量肝细胞为GFP阳性(图1C,下排),但是在对照组中没有(图1C,中排和上排)。从肝组织中提取的基因组DNA的PCR验证了ires-GFP转基因成功整合到小鼠Actb基因的3'-UTR处的靶位点中,发现该靶点在两个方向都存在(图1D(中间泳道)。
免疫组织化学染色进一步证实了来自经注射的小鼠肝中ires-GFP蛋白的存在(图1E)。总的来说,这些结果表明,使用定制设计的质粒可以有效地实现CRISPR/Cas9-NHEJ介导的转基因体内敲入进小鼠肝(即体细胞组织)中。
实施例4:通过水动力注射,CRISPR/CAS9-NHEJ介导的体内敲入逆转了1型糖尿病
接下来,我们集中于两种类型的人类疾病,即1型糖尿病(T1DM)和乙型血友病,以解决体内敲入策略在逆转疾病表型方面的功效。对T1DM和乙型血友病的分子性质和病理学机制进行了深入研究。T1DM和乙型血友病均在世界范围内具有很高的社会影响力,这使得通过基于基因的疗法对这些疾病进行长期治疗变得高度期望。
T1DM患者的特征在于胰岛β细胞的丢失和胰岛素合成不足,为此,所述患者终生每天施用胰岛素对于生存是至关重要的(Huen等人.,An Update on the Epidemiology ofChildhood Diabetes in Hong Kong.HK J Paediatr(New Series)14,252-259(2009))。
链脲霉素(STZ)对胰β-细胞具有选择性毒性,并且已被广泛用于在动物模型中诱导1型糖尿病(T1DM)(Deeds,M.C.等人,Single dose streptozotocin-induced diabetes:considerations for study design in islet transplantation models.Lab Anim 45,131-40(2011)。
在该研究中,首先通过尾静脉将标准剂量的STZ注射到小鼠中以诱导T1DM(图2A)。在注射STZ之后,小鼠的体重在七天的过程中急剧降低(图2B,左图),并且相同小鼠的血糖水平极剧增加(图2B,中图)。在对照组中体重或血糖水平未见显著的变化。
此外,通过ELISA检查了血清/血浆胰岛素水平,并且在七天的过程中在治疗的小鼠中观察到显著的降低(图2B,右图)。这些数据表明T1DM可以在小鼠中被强烈诱导,并且STZ诱导的T1DM小鼠可以用作评估CRISPR/Cas9-NHEJ介导的体内敲入的治疗潜力的模型。
接下来,研究了通过CRISPR/Cas9-NHEJ体内敲入方法以逆转T1DM小鼠高血糖的敲入人INS cDNA的潜力。构建了新颖的NHEJ供体,其携带了基于NHEJ敲入的ires-hINS片段(图2C)。同时,为了确保转基因的高水平表达,检查了若干个潜在的靶基因座并鉴定了高活性靶位点。
在向T1DM小鼠水动力注射携带ires-hINS、sg-A和sgTarget(在此是sg-Alb)的NHEJ供体后,检查了经注射的小鼠的血清葡萄糖水平。经注射的小鼠的血糖水平在一周后成功降低至正常水平(图2D),并且血浆胰岛素水平也在施用后4天内增加(图2F),证明了新开发的体内敲入策略的治疗效果以及当前方法和构建体的功效。此外,对肝组织中hINS敲入的免疫组织荧光染色进一步证实了通过该方法成功地敲入和表达了hINS(图2G)。
实施例5:CRISPR/Cas9-NHEJ介导的体内敲入可以在小鼠中引入人FIX表达和矫正乙型血友病
乙型血友病是由人F9(hF9)基因编码的凝血因子IX(FIX)缺乏引起的X连锁出血性障碍,影响全世界25,000至30,000名男性中的1名(Au,W.Y.等人.A synopsis of currenthaemophilia care in Hong Kong.Hong Kong Med J 17,189-94(2011)。对于这些患者,通过每周2-3次蛋白质输注进行终生治疗对于治疗和预防是需要的。
乙型血友病是由凝血因子IX(FIX)不足或受限的数量引起的。检查了上述新开发的体内NHEJ敲入系统(例如T1DM的治疗)是否可用于提供FIX来减轻或治愈乙型血友病。类似于hINS敲入,构建了携带ires-hF9的新颖供体,并将其与sg-A和sg-Alb一起通过尾静脉注射到小鼠中(图3A)。
通过水动力注射在小鼠肝中恒定表达人hF9 cDNA的递送导致成功的FIX表达和分泌(图3C)。施用后在小鼠血液血清中成功检测到分泌的FIX蛋白,并在施用后至少七天保持高水平,这将提供足够水平的FIX,以长期减轻异常出血症状。此外,免疫组织荧光染色证实了FIX在肝细胞中的表达,表明了新开发的构建体和治疗乙型血友病的方法的显著潜力(图3D)。
相反,通过水动力注射在小鼠肝中瞬时表达人hF9 cDNA的递送导致成功的FIX表达和分泌(图3B)。然而,在施用后两天内小鼠血液血清中分泌的FIX蛋白的水平显著降低,并且在施用后5天内几乎无法检测到。证明瞬时递送系统不足以减轻乙型血友病的异常出血症状。
实施例6:用于CRISPR/Cas9-NHEJ敲入的腺相关病毒(AAV)
通过在过去二十年中的广泛研究,已经建立了针对人乙型血友病的基于腺相关病毒(AAV)的基因疗法,并在临床试验中证明优异的疗效和安全性记录(参见,Herzog,R.W.ACure For Hemophilia:the Promise Becomes a Reality.Mol Ther 24,1503-4(2016);Nathwani,A.C.等人.Long-term safety and efficacy of factor IX genetherapy in hemophilia B.N Engl J Med 371,1994-2004(2014);Naldini,L.Genetherapy returns to centre stage.Nature 526,351-60(2015);和Hartmann,J.&Croteau,S.E.2017Clinical trials update:Innovations in hemophilia therapy.Am JHematol 91,1252-1260(2016)。
在最近的研究中,所有接受基于AAV的人类F9基因转移的六名患者均显示出FIX成功产生,约为正常值的1-6%,从而减少了超过90%的出血发作并且使用预防性FIX进行输注(Nathwani,A.C.等人.Long-term safety and efficacy of factor IX gene therapyin hemophilia B.N Engl J Med 371,1994-2004(2014))。
尽管T1DM的基因治疗进展缓慢,但研究表明,胰岛素的异位产生可在不同动物模型中强烈逆转T1DM(Elsner,M.等人.Reversal of diabetes through gene therapy ofdiabetic rats by hepatic insulin expression via lentiviral transduction.MolTher 20,918-26(2012);Han,J.,McLane,B.,Kim,E.H.,Yoon,J.W.&Jun,H.S.Remission ofdiabetes by insulin gene therapy using a hepatocyte-specific and glucose-responsive synthetic promoter.Mol Ther 19,470-8(2011);和Callejas,D.等人.Treatment of diabetes and long-term survival after insulin and glucokinasegene therapy.Diabetes 62,1718-29(2013)。这些进展已经证明了基于基因的治疗在乙型血友病和T1DM中的巨大潜力。然而,由于转基因表达的持续丧失,这些方法只能获得瞬时的治疗效果。因此,仍需要基于CRISPR/Cas9-NHEJ的敲入方法,所述方法可支持有效且长期的转基因表达,以提供持久的治疗并减少强化治疗的负担。
腺相关病毒(AAV)是非病原性,非整体性细小病毒。AAV基因传递载体正在被研究作为用于多种遗传性和获得性人类疾病的基因治疗的载体。AAV无法自我传播,在经转导的细胞中维持游离体的能力以及对免疫系统的相对无害影响,使其成为延长体内基因表达的首选载体。基于AAV开发的假病毒传递系统已被视为用于体内应用和基因治疗的最安全的运载体(参见Hastie,E.&Samulski,R.J.Adeno-associated virus at 50:a goldenanniversary of discovery,research,and gene therapy success--a personalperspective.Hum Gene Ther 26,257-65(2015))。为了利用这种安全的递送工具,研究了是否可以将AAV系统应用于递送DNA成分以支持在基因治疗的体内条件下高效CRISPR/Cas9-NHEJ介导的敲入。
首先,构建了NHEJ介导的敲入所需的基于AAV的质粒,包括AAV供体、AAV-Cas9-sgA和AAV-Cas9-sg靶(图4A)。为了验证所述系统是否有效,首先选择了人GAPDH 3’-UTR作为靶位点,然后使用ires-GFP报告基因在人细胞系中检测了基于AAV的NHEJ敲入(参见He,X.等人.Knock-in of large reporter genes in human cells via CRISPR/Cas9-inducedhomology-dependent and independent DNA repair.Nucleic Acids Res 44,e85(2016))。将经纯化的AAV颗粒(包括AAV供体、AAV-Cas9-sgA和AAV-Cas9-sgGAPDH)转导到人HEK293T细胞中,并且流式细胞分析表明约2.6%的细胞为GFP阳性并带有转基因整合(图4B,右图);而对照组显示几乎没有可检测到的GFP阳性细胞(图4B,左图),表明AAV系统适合于递送DNA组分并支持CRISPR/Cas9-NHEJ介导的敲入。
为了检查基于AAV的系统是否可用于NHEJ介导的体内敲入,将携带所需DNA组分的AAV假病毒颗粒通过尾静脉注射到小鼠中(图4C)。通过靶向小鼠Actb 3’-UTR,在来自敲入组(图4D,上排)的小鼠肝中检测到GFP阳性细胞,而在对照组(图4D,下排)中未检测到。总之,结果表明AAV可以与CRISPR/Cas9诱导的NHEJ偶联以实现高效的体内敲入,这可以开发为逆转T1DM和乙型血友病的治疗系统。
实施例7:用于人F9基因的CRISPR/Cas9-NHEJ体内敲入的腺相关病毒(AAV)
为直接证明该方法的临床转化潜力,研究了通过AAV转导在小鼠肝中敲入hF9cDNA(图5A)。在转导AAV组分后,每周收集血浆进行FIX检测。根据ELISA结果,即使在AAV注射后三个月,血浆中也始终检测到FIX分泌(图5B)。同时,qRT-PCR结果还表明,在用于敲入的AAV注射后3个月,hF9基因在小鼠肝中表达(图5C)。总之,收集的结果表明我们的AAV介导的NHEJ敲入可以作为用于长期基因治疗的治疗策略。
通过将临床上适用的AAV系统偶联至用于体内敲入的该CRISPR/Cas9-NHEJ敲入方法,本发明人已经证明基于AAV的CRISPR/Cas9-NHEJ方法可以用相当的效率引入转基因敲入,但毒性低得多。这使得该系统特别适合于临床应用。
总体而言,由于NHEJ机制在体内条件下占主导地位,本文提出的CRISPR/Cas9-NHEJ体内敲入方法表现出经改善的整合效率,显著高于当前基于HDR的敲入技术。此外,这种方法在宿主细胞基因组中的特定靶位点处引入了有效的转基因整合,这些整合在宿主细胞中是永久的,并可以因此支持长期表达和潜在的持久性治疗作用。
发明人已经鉴定出活性靶位点,其可以确保高效的转基因整合,并在敲入后使转基因的表达处于高水平。此外,本公开提供并预期了供体构建体的各种设计,包括与CRISPR/Cas9-NHEJ系统结合的优化的临床上可接受的AAV供体。这些有利条件使本文公开的系统、组合物、试剂盒和方法易于使用并且对于各种研究和临床应用具有灵活性。如实施例4和5所示,本文公开的CCRISPR/Cas9-NHEJ系统已经证明是使用小鼠模型研究各种疾病或基因功能的优秀工具,并且可以容易地适用于任何其他物种。值得注意地,本文使用的T1DM和乙型血友病小鼠模型已经证明,本文公开的CRISPR/Cas9-NHEJ敲入方法显示出用于开发针对各种人类疾病的基于基因的新颖疗法的巨大潜力。

Claims (37)

1.一种在宿主细胞基因组中选定基因座处插入所需基因的方法,其中所述宿主细胞在活生物体内,所述方法包括:
使活生物体与以下项接触:
(i)供体载体,其编码所需基因和一个或两个sgRNA靶位点;
(ii)基因座特异性辅助载体,其编码至少一个小指导RNA(sgRNA),所述小指导RNA与宿主细胞基因组中的选定核酸序列互补;
(iii)通用型辅助载体,其编码至少一个sgRNA,所述sgRNA与供体载体中的一个或两个sgRNA靶位点互补;和
如果所述基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(iv)Cas或Cpfl蛋白,
从而使所述供体载体线性化以形成供体DNA片段,从而使所述供体DNA片段通过NHEJ介导的敲入进入到所述活生物体的宿主细胞基因组中。
2.如权利要求1所述的方法,其中所述供体载体进一步包含在所需基因5’末端处的内部核糖体进入位点(ires)元件。
3.如权利要求1所述的方法,其中在所选基因座的3’UTR处插入所需基因,并且其中至少一个由所述基因座特异性辅助载体编码的小指导RNA(sgRNA)与所选基因座3’UTR处的选定的核酸序列互补。
4.如权利要求1所述的方法,进一步包括从获得自活生物体的样品检测由插入的所需基因编码的蛋白质或RNA。
5.如权利要求1所述的方法,进一步包括从获得自活生物体的样品评估插入的所需基因的功能性。
6.如权利要求1所述的方法,其中所述供体载体包含一个或两个sgRNA靶位点。
7.如权利要求1所述的方法,其中所述供体载体包含一个或多个所需基因。
8.如权利要求1所述的方法,其中所述基因座特异性辅助载体编码Cas9。
9.如权利要求1所述的方法,其中所述通用型辅助载体编码Cas9。
10.如权利要求1所述的方法,其中所述供体载体、基因座特异性辅助载体和/或通用型辅助载体选自质粒、AAV病毒颗粒、腺病毒颗粒、慢病毒颗粒和DNA纳米颗粒复合物。
11.如权利要求1所述的方法,其中将所述供体载体、基因座特异性辅助载体和通用型辅助载体作为AAV病毒颗粒进行递送。
12.如权利要求1所述的方法,其中所述宿主细胞在活生物体的肝内。
13.如权利要求1所述的方法,其中所述宿主细胞是造血干细胞。
14.如权利要求1所述的方法,其中所述活生物体是患有遗传性疾病的人。
15.如权利要求1所述的方法,其中所述活生物体是患有糖尿病的人。
16.如权利要求1所述的方法,其中所述供体载体包含hINS基因和一个或两个sgRNA靶位点。
17.如权利要求1所述的方法,其中所述活生物体是患有乙型血友病的人。
18.如权利要求15所述的方法,其中所述供体载体包含hF9基因和一个或两个sgRNA靶位点。
19.如权利要求1所述的方法,其中所选基因座是Actb、Alb或GAPDH。
20.如权利要求1所述的方法,其中所述至少一个指导RNA包含约20个核苷酸的核酸区,其与宿主细胞基因组中的所选核酸序列互补。
21.一种用于在受试者中治疗体细胞组织疾病的方法,所述方法包括向有需要的受试者施用治疗有效量的以下项:
(a)供体载体,其编码所需基因和一个或两个sgRNA靶位点;
(b)基因座特异性辅助载体,其编码至少一个sgRNA,所述sgRNA与宿主细胞基因组中的选定的核酸序列互补。
(c)通用型辅助载体,其编码至少一个sgRNA,所述sgRNA与供体载体中的一个或两个sgRNA靶位点互补;和
如果所述基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(d)Cas或Cpfl蛋白,
从而治疗受试者的体细胞组织疾病。
22.如权利要求21所述的方法,其中所述方法进一步包括在来自受试者的样品中检测由所需基因编码的RNA或蛋白质的表达。
23.如权利要求22所述的方法,其中所述方法进一步包括确认由所需基因编码的RNA或蛋白质的表达足以治疗体细胞组织疾病。
24.如权利要求21所述的方法,其中所述体细胞组织疾病是遗传性疾病。
25.如权利要求21所述的方法,其中所述体细胞组织疾病是代谢性障碍。
26.如权利要求21所述的方法,其中所述体细胞组织疾病是由单一基因的突变导致的疾病。
27.如权利要求24所述的方法,其中所述遗传性疾病选自糖尿病、血友病、镰状细胞性贫血、地中海贫血、丙酸血症、囊胞性纤维症、肾上腺脑白质营养不良、杜氏肌营养不良、血色沉着病、先天性聋、家族性高胆固醇血症、亨廷顿病、泰-萨病或苯丙酮尿症。
28.一种用于治疗体细胞组织疾病的试剂盒,其包含:
(i)包含供体载体的第一容器,其中所述供体载体编码所需基因和一个或两个sgRNA靶位点;
(ii)包含基因座特异性辅助载体的第二容器,其中所述基因座特异性辅助载体编码至少一个sgRNA,所述sgRNA与宿主细胞基因组中的选定的核酸序列互补;和
(iii)包含通用型辅助载体的第三容器,其中所述通用型辅助载体编码至少一个sgRNA,所述sgRNA与所述供体载体中的一个或两个sgRNA靶位点互补。
29.如权利要求28所述的试剂盒,所述试剂盒进一步包含Cas或Cpfl蛋白或编码Cas或Cpfl蛋白的载体。
30.如权利要求28所述的试剂盒,所述试剂盒进一步包含说明手册。
31.一种用于在体内进行基因组编辑的组合物,其包含:
(i)供体载体,其中所述供体载体编码所需基因和一个或两个sgRNA靶位点;
(ii)基因座特异性辅助载体,其中所述基因座特异性辅助载体编码至少一个小指导RNA(sgRNA),所述sgRNA与宿主细胞基因组中的选定的核酸序列互补;
(iii)通用型辅助载体,其中所述通用型辅助载体编码至少一个sgRNA,所述sgRNA与所述供体载体中的一个或两个sgRNA靶位点互补。和
如果所述基因座特异性辅助载体或通用型辅助载体不编码Cas或Cpfl蛋白时的(iv)Cas或Cpfl蛋白,
从而治疗受试者的体细胞组织疾病。
32.如权利要求31所述的组合物,所述组合物进一步包含宿主细胞。
33.如权利要求32所述的组合物,其中所述宿主细胞是动物细胞。
34.如权利要求32所述的组合物,其中所述宿主细胞是肝细胞、肾细胞、肺细胞、骨细胞或血细胞。
35.如权利要求32所述的组合物,其中所述宿主细胞是人细胞。
36.如权利要求32所述的组合物,其中所述宿主细胞是活生物体内的体细胞。
37.如权利要求32所述的组合物,其中所述宿主细胞是生殖细胞。
CN201880090785.2A 2018-01-05 2018-12-25 使用crispr的高效体内敲入 Pending CN111886341A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862614229P 2018-01-05 2018-01-05
US62/614,229 2018-01-05
PCT/CN2018/123517 WO2019134561A1 (en) 2018-01-05 2018-12-25 High efficiency in vivo knock-in using crispr

Publications (1)

Publication Number Publication Date
CN111886341A true CN111886341A (zh) 2020-11-03

Family

ID=67143880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880090785.2A Pending CN111886341A (zh) 2018-01-05 2018-12-25 使用crispr的高效体内敲入

Country Status (2)

Country Link
CN (1) CN111886341A (zh)
WO (1) WO2019134561A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112582024A (zh) * 2020-12-23 2021-03-30 广州赛业百沐生物科技有限公司 一种基因定点敲入载体构建方法、系统及平台

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220017939A (ko) 2019-06-07 2022-02-14 리제너론 파마슈티칼스 인코포레이티드 인간화 알부민 좌위를 포함하는 비-인간 동물
CN110628825A (zh) * 2019-10-14 2019-12-31 上海捷易生物科技有限公司 一种依赖nhej的报告基因敲入组合物及其使用方法
WO2021170089A1 (en) * 2020-02-28 2021-09-02 The Chinese University Of Hong Kong Engineering immune cells via simultaneous knock-in and gene disruption

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160058889A1 (en) * 2014-08-11 2016-03-03 The Board Of Regents Of The University Of Texas System Prevention of muscular dystrophy by crispr/cas9-mediated gene editing
CN106893739A (zh) * 2015-11-17 2017-06-27 香港中文大学 用于靶向基因操作的新方法和系统
US20170202931A1 (en) * 2016-01-15 2017-07-20 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of neurologic disease
CN107429263A (zh) * 2015-01-15 2017-12-01 斯坦福大学托管董事会 调控基因组编辑的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103388006B (zh) * 2013-07-26 2015-10-28 华东师范大学 一种基因定点突变的构建方法
CN104342457A (zh) * 2014-10-17 2015-02-11 杭州师范大学 一种将外源基因定点整合到靶标基因的方法
CN106032540B (zh) * 2015-03-16 2019-10-25 中国科学院上海生命科学研究院 CRISPR/Cas9核酸内切酶体系的腺相关病毒载体构建及其用途
EP3356520B1 (en) * 2015-10-02 2022-03-23 The U.S.A. as represented by the Secretary, Department of Health and Human Services Lentiviral protein delivery system for rna-guided genome editing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160058889A1 (en) * 2014-08-11 2016-03-03 The Board Of Regents Of The University Of Texas System Prevention of muscular dystrophy by crispr/cas9-mediated gene editing
CN107429263A (zh) * 2015-01-15 2017-12-01 斯坦福大学托管董事会 调控基因组编辑的方法
CN106893739A (zh) * 2015-11-17 2017-06-27 香港中文大学 用于靶向基因操作的新方法和系统
US20170202931A1 (en) * 2016-01-15 2017-07-20 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of neurologic disease

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BACHU,R等: "CRISPR-Cas Targeted plasmid integration into mammalian cells via Non-homologous end joining", 《BIOTECHNOLOGY AND BIOENGINEERING》 *
BACHU,R等: "CRISPR-Cas Targeted plasmid integration into mammalian cells via Non-homologous end joining", 《BIOTECHNOLOGY AND BIOENGINEERING》, 7 July 2015 (2015-07-07) *
OHMORI等: "CRISPR/Cas9-mediated genome editing via postnatal administration of AAV vector cures haemophilia B mice", SCRIENTIFIC REPORTS, no. 7, pages 1 - 11 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112582024A (zh) * 2020-12-23 2021-03-30 广州赛业百沐生物科技有限公司 一种基因定点敲入载体构建方法、系统及平台

Also Published As

Publication number Publication date
WO2019134561A1 (en) 2019-07-11

Similar Documents

Publication Publication Date Title
JP7365374B2 (ja) ヌクレアーゼ介在性遺伝子発現調節
CN108779466B (zh) 用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法
WO2019134561A1 (en) High efficiency in vivo knock-in using crispr
JP2021519067A (ja) 常染色体優性疾患のための遺伝子編集
CN105683376A (zh) 用于治疗遗传病状的方法和组合物
JP2020500541A (ja) ヒト化デュシェンヌ型筋ジストロフィー変異を有するdmdレポーターモデル
US11492614B2 (en) Stem loop RNA mediated transport of mitochondria genome editing molecules (endonucleases) into the mitochondria
US20220218843A1 (en) Non-disruptive gene therapy for the treatment of mma
JP2022505139A (ja) ゲノム編集の方法及び構築物
CN110249051A (zh) 增强功能性髓鞘产生的方法和组合物
JP2018501791A (ja) 改変g6pcをコードするアデノ随伴ウイルスベクターおよびその使用
JP2022113700A (ja) CRISPR-Casゲノム編集に基づく、Fel d1ノックアウト並びに関連組成物及び方法
US20230165976A1 (en) Htra1 modulation for treatment of amd
CN110760511A (zh) 一种用于治疗杜氏肌营养不良症的gRNA、表达载体、CRISPR-Cas9系统
US20230323322A1 (en) Split cas12 systems and methods of use thereof
EP3810273A1 (en) Crispr interference based htt allelic suppression and treatment of huntington disease
CN115279184A (zh) B4galt1介导的功能的啮齿动物模型
US20230303990A1 (en) Pyruvate kinase deficiency (pkd) gene editing treatment method
US20230220402A1 (en) Use of an orphan motif to increase expression of a heterologous transgene
US20230265382A1 (en) Production system for helper-dependent adenovirus
WO2020187272A1 (zh) 一种用于基因治疗的融合蛋白及其应用
US20220380756A1 (en) Methods and compositions for treating thalassemia or sickle cell disease
CN115427568A (zh) Rp1相关视网膜变性的基于单倍型的治疗
CN113444722A (zh) 单碱基编辑介导的剪接修复在制备治疗脊髓性肌萎缩症中的应用
CN114854791A (zh) 一种新型CRISPR-Cas9系统载体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination