CN117580942A - 肝细胞的基因修饰 - Google Patents

肝细胞的基因修饰 Download PDF

Info

Publication number
CN117580942A
CN117580942A CN202280042878.4A CN202280042878A CN117580942A CN 117580942 A CN117580942 A CN 117580942A CN 202280042878 A CN202280042878 A CN 202280042878A CN 117580942 A CN117580942 A CN 117580942A
Authority
CN
China
Prior art keywords
base editor
gene
guide rnas
genetically modified
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280042878.4A
Other languages
English (en)
Inventor
朱塞佩·恰拉梅拉
J·M·格尔克
R·穆雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bim Medical Co ltd
Original Assignee
Bim Medical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bim Medical Co ltd filed Critical Bim Medical Co ltd
Publication of CN117580942A publication Critical patent/CN117580942A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/067Hepatocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/37Digestive system
    • A61K35/407Liver; Hepatocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Epidemiology (AREA)
  • Physiology (AREA)
  • Nutrition Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明提供了生产适用于肝细胞移植的基因修饰的人肝细胞的方法,其包括:通过引入碱基编辑器以及一种或多种与一个或多个I类或II类基因中的靶序列杂交的gRNA,来破坏分离的人肝细胞中或肝细胞祖细胞中的一个或多个主要组织相容性复合体(MHC)I类或II类基因,由此生产基因修饰的人肝细胞。

Description

肝细胞的基因修饰
相关申请的交叉引用
本申请要求于2021年4月16日提交的美国临时专利申请系列号63/176,104的优先权,该美国临时专利申请出于所有目的通过引用整体并入本文中。
背景技术
原位肝移植(OLT)是治疗终末期肝病、急性肝衰竭和基于肝脏的代谢紊乱的金标准。OLT有几个主要缺点,包括供体器官稀缺、手术相关并发症的风险、手术费用高以及需要终生免疫抑制。
肝细胞移植(HT)是非常有吸引力且临床安全的OLT替代方案,因为它侵入性较小且成本较低,并且如果需要可以重复进行。HT的局限性与高质量肝细胞的供应有限以及同种异体移植物的移植/长期接受度不足有关。虽然在接受同种异体肝细胞移植的患者中看到了令人鼓舞的临床改善,尽管有免疫抑制,但长期功效仍然受到细胞同种异体移植物的长期接受度有限的阻碍。
发明内容
人原代肝细胞具有高度免疫原性,因此需要在移植前进行替代性免疫调节策略以改善肝细胞的移植。目前使用肝细胞治疗肝病存在一些障碍。它们通常是:1)人肝细胞供应有限;以及2)受试者肝细胞移植不足。高质量肝细胞的供应有限至少部分地是由于可从中分离出高质量肝细胞的供体肝脏供应有限。作为肝细胞生物反应器的人源化动物模型的生产和使用,使得人肝细胞的获取和扩增对于项目规模开发来说是可行的。上面提到的第二个障碍是,尽管有免疫抑制,但移植不足迄今为止仍限制了细胞同种异体移植物的长期接受度。本发明人令人惊讶地发现了基因修饰肝细胞的独特方法,其使得基因修饰的肝细胞适合施用于有此需要的受试者。
在一些方面,提供了生产适用于肝细胞移植的基因修饰的人肝细胞的方法,该方法包括:通过引入碱基编辑器以及一种或多种与一个或多个I类或II类基因中的靶序列杂交的gRNA,来破坏分离的人肝细胞中或肝细胞祖细胞中的一个或多个主要组织相容性复合体(MHC)I类或II类基因,由此生产基因修饰的人肝细胞。在一些实施例中,破坏一个或多个MHC I类或II类基因发生在分离的人肝细胞中。分离的人肝细胞可以是新鲜分离的或先前扩增的。MHC I类和II类基因是本领域已知的。例如,MHC I类基因包括HLA-A、HLA-B、HLA-C、HLA-E、HLA-F、HLA-G、HLA-K和HLA-L。例如,MHC II类基因包括HLA-DP、HLA-DM、HLA-DOA、HLA-DOB、HLA-DQ、HLA-DR。
在一些实施例中,碱基编辑器包含融合至脱氨酶的CRISPR蛋白。
在一些实施例中,基因修饰的人肝细胞在靶序列中具有一个或多个核碱基编辑。例如,基因修饰可以具有一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或多于十个核碱基编辑。
在一些实施例中,基因修饰的人肝细胞具有经破坏的靶序列。在一些实施例中,经破坏的靶序列导致靶基因的表达降低。在一些实施例中,经破坏的靶序列导致靶基因的表达增加。
在一些实施例中,基因修饰的人肝细胞具有降低或消除的同种异体反应性。因此,在一些实施例中,基因修饰的人肝细胞具有降低的同种异体反应性。在一些实施例中,基因修饰的人肝细胞具有消除的同种异体反应性。“消除”意指通过使用本领域已知的方法不存在可检测的同种异体反应性。
在一些实施例中,I类或II类基因选自B2M、CD142、CIITA、HLA-A或HLA-B基因中的一种或多种。因此,在一些实施例中,I类或II类基因是B2M。在一些实施例中,I类或II类基因是CD142。在一些实施例中,I类或II类基因是CIITA。在一些实施例中,I类或II类基因是HLA-A。在一些实施例中,I类或II类基因是HLA-B。
在一些实施例中,将终止密码子或剪接位点引入到B2M、CD142、CIITA、HLA-A或HLA-B基因中的一种或多种中。因此,在一些实施例中,将终止密码子引入到B2M、CD142、CIITA、HLA-A或HLA-B基因中的一种或多种中。在一些实施例中,将剪接位点引入到B2M、CD142、CIITA、HLA-A或HLA-B基因中的一种或多种中。
在一些实施例中,在B2M基因的核苷酸位置19处引入剪接位点。
在一些实施例中,在B2M基因的核苷酸位置5处引入终止密码子。
在一些实施例中,在CD142基因的核苷酸位置28处引入剪接位点。
在一些实施例中,在CD142基因的核苷酸位置19处引入终止密码子。
在一些实施例中,在CIITA基因的核苷酸位置147处引入剪接位点。
在一些实施例中,在CIITA基因的核苷酸位置130处引入终止密码子。
在一些实施例中,CRISPR蛋白是Cas9或Cas12。因此,在一些实施例中,CRISPR蛋白是Cas9蛋白。在一些实施例中,CRISPR蛋白是Cas12蛋白。
在一些实施例中,Cas9来自酿脓链球菌(Streptococcus pyogenes)(SpCas9)或金黄色葡萄球菌(Staphylococcus aureus)(SaCas9)。因此,在一些实施例中,Cas9来自酿脓链球菌(SpCas9)。在一些实施例中,Cas9来自金黄色葡萄球菌(SaCas9)。本领域描述了从多种细菌中获得或修饰的各种Cas9蛋白,包括具有突变的Cas9。Cas9及其突变体描述于各种出版物中,包括例如WO 2013/176772、US10,266,850、WO 2014/093661、WO 2014/093655、WO2014/093595,其内容通过引用并入本文中。
各种Cas12蛋白是本领域已知的并且包括例如2类V型和VI型蛋白。例如,2类V型Cas12包括:Cas12a、Cas12b、Cas12c等。Cas12的各种名称已被使用,并包括Cpf1、C2c1、C2c1p、C2c3、C2cp3、C2c2p。在本文公开的方法的一些实施例中,使用来自2类V型或VI型蛋白的Cas12蛋白。例如,在一些实施例中,用于本文所述方法的合适的Cas12包括Cas12a蛋白。在一些实施例中,用于本文所述方法的合适的Cas12包括Cas12b蛋白。在一些实施例中,用于本文所述方法的合适的Cas12包括Cas12c蛋白。在一些实施例中,用于本文所述方法的合适的Cas12包括Cpf1蛋白。在一些实施例中,用于本文所述方法的合适的Cas12包括C2c1蛋白。在一些实施例中,用于本文所述方法的合适的Cas12包括C2c1p蛋白。在一些实施例中,用于本文所述方法的合适的Cas12包括C2c3蛋白。在一些实施例中,用于本文所述方法的合适的Cas12包括C2cp3蛋白。在一些实施例中,用于本文所述方法的合适的Cas12包括C2c2p蛋白。WO/2016/205711和WO/2016/205749中描述了各种Cas12,其内容通过引用并入。
在一些实施例中,Cas9蛋白是超精确Cas9。在一些实施例中,Cas9蛋白包含参考SpyCas9(SEQ ID NO:68)与N692A、M694A、Q695A和/或H698A对应的突变。在一些实施例中,Cas9蛋白是高保真Cas9。在一些实施例中,Cas9蛋白包含参考SpyCas9(SEQ ID NO:68)与N467A、R661A、Q695A和/或Q926A对应的突变。在一些实施例中,Cas9蛋白是SuperFi-Cas9。在一些实施例中,Cas9蛋白包含突变,其中与SpyCas9(SEQ ID NO:68)对应的Y1016、R1019、Y1010、Y1013、K1031、Q1027和/或V1018残基突变为天冬氨酸。
在一些实施例中,CRISPR蛋白融合至腺嘌呤或腺苷碱基编辑器(ABE)、胞苷或胞嘧啶碱基编辑器(CBE)或肌苷碱基编辑器(IBE)。因此,在一些实施例中,CRISPR蛋白融合至ABE。在一些实施例中,CRIPSR蛋白融合至CBE。在一些实施例中,CRISPR蛋白融合至IBE。在一些实施例中,CRISPR融合至包含腺嘌呤或腺苷脱氨酶结构域或者胞苷或胞嘧啶脱氨酶结构域的碱基编辑器。在一些实施例中,CRISPR融合至包含腺嘌呤或腺苷脱氨酶结构域以及胞苷或胞嘧啶脱氨酶结构域的碱基编辑器。
在一些实施例中,CRISPR蛋白包含核定位序列(NLS)和/或FLAG、HIS或HA标签。因此,在一些实施例中,CRISPR蛋白包含NLS。在一些实施例中,CRISPR蛋白包含FLAG标签。在一些实施例中,CRISPR蛋白包含HIS标签。在一些实施例中,CRISPR蛋白包含HA标签。
在一些实施例中,CRISPR蛋白包含SEQ ID NO:1(SpCas9)、SEQ ID NO:2(SaCas9)或SEQ ID NO:3(Cpf1 Cas12)中的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少10个突变。SpCas9、SaCas9和Cpf1 Cas12的氨基酸序列如下表所示。
示例性CRISPR蛋白序列、其修饰和碱基编辑器融合
在一些实施例中,突变是氨基酸取代。
在一些实施例中,至少一个突变产生失活的Cas9(dCas9)。
在一些实施例中,至少一个突变是Cas9的PAM相互作用结构域、RuvC结构域和/或HNH结构域中的一个或多个氨基酸取代。因此,在一些实施例中,至少一个突变是PAM相互作用结构域中的一个或多个氨基酸取代。在一些实施例中,至少一个突变是RuvC结构域中的一个或多个氨基酸取代。在一些实施例中,至少一个突变是HNH结构域中的一个或多个氨基酸取代。在一些实施例中,至少一个或多个氨基酸取代发生在PAM相互作用结构域、RuvC结构域和HNH结构域中。在一些实施例中,至少一个或多个氨基酸取代发生在PAM相互作用结构域和RuvC结构域中。在一些实施例中,至少一个或多个氨基酸取代发生在PAM相互作用结构域和HNH结构域中。在一些实施例中,至少一个或多个氨基酸取代发生在RuvC结构域和HNH结构域中。
在一些实施例中,至少一个突变是SpCas9的氨基酸10处的天冬氨酸到丙氨酸的取代(D10A),或其在Cas9蛋白中的对应突变。
在一些实施例中,至少一个突变是SpCas9的氨基酸840处的组氨酸到丙氨酸的取代(H840A),或其在Cas9蛋白中的对应突变。
在一些实施例中,Cas9蛋白具有切口酶活性。在一些实施例中,Cas9蛋白中的一个或多个突变使Cas9催化失活,否则称为“失活的Cas9”或“dCas9”。
在一些实施例中,CRISPR蛋白融合至腺苷脱氨酶并且具有与SEQ ID NO:65至少80%相同的氨基酸序列
在一些实施例中,CRISPR蛋白融合至胞嘧啶脱氨酶并且具有与SEQ ID NO:4至64至少80%相同的氨基酸序列
在一些实施例中,SpCas9蛋白识别包含5'-NGG-3'、5'-NGA-3'或5'-NGC-3'的PAM序列。因此,在一些实施例中,SpCas9蛋白识别包含5'-NGG-3'的PAM序列。在一些实施例中,SpCas9蛋白识别包含5'-NGA-3'的PAM序列。在一些实施例中,SpCas9蛋白识别包含5'-NGC-3'的PAM序列。
在一些实施例中,SaCas9蛋白识别包含5'-NNNRRT-3'或5'-NNGRRT-3'的PAM序列。在一些实施例中,SaCas9蛋白识别包含5'-NNNRRT-3'的PAM序列。在一些实施例中,SaCas9蛋白识别包含5'-NNGRRT-3'的PAM序列。
在一些实施例中,Cas12蛋白识别包含5'-RTTN-3'的PAM序列。
在一些实施例中,分离的人肝细胞已经在先前冷冻保存并随后解冻。在一些实施例中,分离的人肝细胞是原代培养物。在一些实施例中,分离的人肝细胞是新鲜分离的。
在一些实施例中,与非基因修饰的人肝细胞相比,基因修饰的人肝细胞过表达CIITA。在一些实施例中,基因修饰的人肝细胞过表达B2M。在一些实施例中,基因修饰的人肝细胞过表达B2M-HLA-E融合蛋白。在一些实施例中,基因修饰的人肝细胞过表达PDL1。在一些实施例中,基因修饰的人肝细胞过表达PDL2。
在一些实施例中,将基因修饰的人肝细胞移植到人源化动物模型中以用于扩增。
在一些实施例中,人源化动物模型是FRG猪、FRG小鼠或FRG大鼠。因此,在一些实施例中,人源化动物模型是FRG猪。在一些实施例中,人源化动物模型是FRG小鼠。在一些实施例中,人源化动物模型是FRG大鼠。
在一些实施例中,首先将基因修饰的人肝细胞移植到FRG小鼠或FRG大鼠中以用于初始细胞扩增。在一些实施例中,首先将基因修饰的人肝细胞移植到FRG小鼠中以用于初始扩增。在一些实施例中,首先将基因修饰的人肝细胞移植到FRG大鼠中以用于初始扩增。
在一些实施例中,在初始细胞扩增之后,将基因修饰细胞随后移植到FRG猪中以用于进一步的细胞扩增。
在一些实施例中,初始扩增的细胞或进一步扩增的细胞是从动物中分离出来的。
在一些实施例中,初始扩增的细胞或进一步扩增的细胞是通过荧光激活细胞分选、免疫磁性细胞分离、密度梯度离心和/或免疫密度细胞分离来分离的。任何种类的保持细胞活力的分离策略均可用于本文的方法中。在一些实施例中,细胞是通过荧光激活细胞分选来分离的。在一些实施例中,细胞是通过免疫磁性细胞分离来分离的。在一些实施例中,细胞是通过密度梯度离心来分离的。在一些实施例中,细胞是通过免疫密度细胞分离来分离的。
在一些实施例中,基因修饰的人肝细胞具有一个、两个、三个或更多个核碱基编辑。因此,在一些实施例中,基因修饰的人肝细胞具有一个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有两个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有三个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有四个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有五个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有六个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有七个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有八个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有九个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有十个核碱基编辑。在一些实施例中,基因修饰的人肝细胞具有十个以上的核碱基编辑。
在一些实施例中,与一个以上的向导物组合使用的单个碱基编辑器产生两个、三个或更多个核碱基编辑。因此,在一些实施例中,与一个以上的向导物组合使用的单个碱基编辑器产生两个核碱基编辑。在一些实施例中,与一个以上的向导物组合使用的单个碱基编辑器产生三个核碱基编辑。在一些实施例中,与一个以上的向导物组合使用的单个碱基编辑器产生三个以上的核碱基编辑。因此,此方法允许核碱基编辑的多重化。
在一些实施例中,一个以上的碱基编辑器产生一个、两个、三个或更多个核碱基编辑。
在一些方面,提供了核酸,其编码碱基编辑器和一种或多种与如本文所述的靶序列杂交的gRNA。
在一些实施例中,核酸经过密码子优化以用于在哺乳动物细胞中表达。
在一些实施例中,核酸经过密码子优化以用于在人细胞中表达。
在一些方面,提供了编码本文所述的核酸的载体。
在一些方面,提供了真核细胞,其包含碱基编辑器和一种或多种与本文所述的靶序列杂交的gRNA。
在一些实施例中,细胞是哺乳动物细胞。在一些实施例中,细胞是人类细胞。在一些实施例中,人细胞是肝细胞。
在一些方面,提供了治疗肝病的方法,该方法包括向有此需要的受试者施用根据本文所述的方法所生产的基因修饰的人肝细胞。
在一些实施例中,将基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。
在一些实施例中,向有此需要的受试者施用约100至150亿个基因修饰的人肝细胞。在一些实施例中,将基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。在一些实施例中,将约50至200亿个基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。在一些实施例中,将约100至120亿个基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。在一些实施例中,将约120至150亿个基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。
在一些方面,提供了碱基编辑器和一种或多种靶向B2M基因的向导RNA,其中碱基编辑器和对应的一种或多种向导RNA选自表2。
在一些方面,提供了碱基编辑器和一种或多种靶向CD142基因的向导RNA,其中碱基编辑器和对应的一种或多种向导RNA选自表3。
在一些方面,提供了碱基编辑器和一种或多种靶向CIITA基因的向导RNA,其中碱基编辑器和对应的一种或多种向导RNA选自表4。
在一些方面,碱基编辑器和一种或多种靶向HLA-A基因的向导RNA,其中碱基编辑器和对应的一种或多种向导RNA选自表5。
在一些方面,碱基编辑器和一种或多种靶向HLA-B基因的向导RNA,其中碱基编辑器和对应的一种或多种向导RNA选自表6。
在一些实施例中,提供了碱基编辑器和一种或多种向导RNA,其中对靶基因进行了一个、两个、三个或三个以上的编辑。
在一些实施例中,向导RNA序列包含相对于向导靶向序列的1至4个错配。在一些实施例中,向导RNA序列包含对应于表2A至6A中列出的序列中的任一者或表2至6中列出的原间隔序列中的任一者的RNA版本中的1至4个错配。
在一些方面,提供了包含碱基编辑器和一种或多种向导RNA的细胞。
在一些方面,如本文所述提供了具有MHC基因中的一个或多个编辑的基因修饰的人肝细胞。
在一些实施例中,MHC基因选自B2M、CD142、CIITA、HLA-A和/或HLA-B。因此,在一些实施例中,MHC基因是B2M基因。在一些实施例中,MHC基因是CD142基因。在一些实施例中,MHC基因是CIITA基因。在一些实施例中,MHC基因是HLA-A基因。在一些实施例中,MHC基因是HLA-B基因。
在一些实施例中,与非基因修饰的人肝细胞相比,对B2M、CD142、CIITA、HLA-A和/或HLA-B基因中的一种或多种的编辑,引起B2M、CD142、CIITA、HLA-A和/或HLA-B基因的表达增加。例如,在一些实施例中,对B2M基因的编辑引起B2M基因的表达增加。在一些实施例中,对CD142基因的编辑引起CD142基因的表达增加。在一些实施例中,对CIITA基因的编辑引起CIITA基因的表达增加。在一些实施例中,对HLA-A基因的编辑引起HLA-A基因的表达增加。在一些实施例中,对HLA-B基因的编辑引起HLA-B基因的表达增加。
定义
为了更容易理解本发明,下面首先定义某些术语。用于以下术语和其它术语的另外的定义在整个说明书中阐述。
一个或一种(a/an):冠词“一个”和“一种”在本文中指代冠词的一个/种或多于一个/种(即,至少一个/种)语法宾语。举例来说,“要素”意指一个要素或多于一个要素。
大约(approximately)或约(about):如本文中所用的术语“大约”或“约”在应用于所关注的一个或多个值时是指与所述参考值类似的值。在某些实施方案中,术语“大约”或“约”是指处于在任一方向上(大于或小于)所述参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小的值的范围,除非另有说明或从上下文可以明显看出(除非该数字将超过一个可能的值的100%)。
关联(associated with):如果一个事件或实体的存在、水平和/或形式与另一个事件或实体的存在、水平和/或形式有关,则两个事件或实体彼此“相关”,如该术语在本文所使用。例如,如果特定实体(例如,多肽)的存在、水平和/或形式与疾病、病症或病状的发病率和/或易感性有关(例如,跨相关群体),则该特定实体被认为与特定疾病、病症或病状相关。在一些实施例中,如果两个或更多个实体直接或间接相互作用,使得其在物理上彼此接近和保持彼此接近,则其在物理上彼此“缔合”。在一些实施方案中,在物理上彼此相关的两个或更多个实体彼此共价连接;在一些实施方案中,在物理上彼此相关的两个或更多个实体彼此不共价连接,而是非共价关联,例如借助于氢键、凡得瓦尔力相互相用(van derWaals interaction)、疏水性相互作用、磁性和其组合相关联。
碱基编辑器:“碱基编辑器(BE)”或“核碱基编辑器(NBE)”意指结合多核苷酸并具有核碱基修饰活性的药剂。在各个实施例中,碱基编辑器包括核碱基修饰多肽(例如,脱氨酶)和多核苷酸可编程核苷酸结合结构域以及向导多核苷酸(例如,向导RNA)。在各个实施例中,药剂是生物分子复合物,该生物分子复合物包括具有碱基编辑活性的蛋白质结构域,即,能够修饰核酸分子(例如,DNA)内的碱基(例如,A、T、C、G或U)的结构域。在一些实施例中,所述多核苷酸可编程DNA结合结构域融合或连接到脱氨酶结构域。在一个实施例中,所述药剂是包括一个或多个具有碱基编辑活性的结构域的融合蛋白。在另一个实施例中,具有碱基编辑活性的蛋白质结构域与向导RNA连接(例如,通过向导RNA上的RNA结合基序和与脱氨酶融合的RNA结合结构域)。在一些实施例中,所述具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨基。在一些实施例中,所述碱基编辑器能够使DNA分子内的一个或多个碱基脱氨基。在一些实施例中,所述碱基编辑器能够使DNA内的胞嘧啶(C)或腺苷(A)脱氨基。在一些实施例中,所述碱基编辑器能够使DNA内的胞嘧啶(C)和腺苷(A)脱氨基。在一些实施例中,所述碱基编辑器是胞苷碱基编辑器(CBE)。在一些实施例中,碱基编辑器是胞嘧啶碱基编辑器(CBE)。在一些实施例中,碱基编辑器是腺苷碱基编辑器(ABE)。在一些实施例中,碱基编辑器是腺嘌呤碱基编辑器(ABE)。在一些实施例中,碱基编辑器是腺苷或腺嘌呤碱基编辑器(ABE)以及胞嘧啶或胞苷碱基编辑器(CBE)。在一些实施方案中,碱基编辑器为与腺苷脱氨酶融合的无核酸酶活性的Cas9(dCas9)。在一些实施方案中,碱基编辑器与碱基切除修复抑制剂(例如UGI结构域或dISN结构域)融合。在一些实施方案中,融合蛋白包括与脱氨酶融合的Cas9切口酶和碱基切除修复抑制剂,如UGI或dISN结构域。在其它实施例中,所述碱基编辑器是无碱基碱基编辑器。碱基编辑器的细节在国际PCT申请第PCT/2017/045381号(WO2018/027078)和第PCT/US2016/058344号(WO2017/070632)中进行了描述,所述国际PCT申请中的每一个都通过引用整体并入本文。还参见Komor,A.C.等人,“Programmable editing of a target base in genomic DNA without double-strandedDNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.等人,“Programmable baseediting of A·T to G·C in genomic DNA without DNA cleavage”Nature 551,464-471(2017);Komor,A.C.等人,“Improved base excision repair inhibition andbacteriophage Mu Gam protein yields C:G-to-T:A base editors with higherefficiency and product purity”Science Advances 3:eaao4774(2017)和Rees,H.A.等人,“Base editing:precision chemistry on the genome and transcriptome ofliving cells.”Nat Rev Genet.2018年12月;19(12):770-788.doi:10.1038/s41576-018-0059-1,该文献的全部内容在此通过引用并入。如本文所用,术语“碱基编辑器”还可以包括CRISPR蛋白,如Cas9或Cas12蛋白。
碱基编辑活性:“碱基编辑活性”意指对多核苷酸内的碱基进行化学改变。在一个实施例中,第一碱基转化为第二碱基。在一个实施例中,碱基编辑活性是胞苷脱氨酶活性,例如,将靶C·G转化为T·A。在另一个实施例中,碱基编辑活性是腺苷或腺嘌呤脱氨酶活性,例如,将A·T转化为G·C。在另一个实施例中,碱基编辑活性是胞苷脱氨酶活性,例如,将靶C·G转化为T·A,以及腺苷或腺嘌呤脱氨酶活性,例如,将A·T转化为G·C。
碱基编辑器系统:术语“碱基编辑器系统”是指用于编辑靶核苷酸序列的核碱基的系统。在各个实施例中,碱基编辑器(BE)系统包括(1)多核苷酸可编程核苷酸结合结构域(例如,Cas9或Cas12)、脱氨酶结构域和胞苷脱氨酶结构域,其用于将靶核苷酸序列中的核碱基脱氨基;以及(2)一种或多种向导多核苷酸(例如,向导RNA)与多核苷酸可编程核苷酸结合结构域结合。在各个实施例中,碱基编辑器(BE)系统包括选自腺苷脱氨酶或胞苷脱氨酶的核碱基编辑器结构域,以及具有核酸序列特异性结合活性的结构域。在一些实施例中,碱基编辑器系统包括(1)碱基编辑器(BE),所述碱基编辑器包括多核苷酸可编程DNA结合结构域和脱氨酶结构域,其用于将靶核苷酸序列中的一个或多个核碱基脱氨基;以及(2)一种或多种向导RNA与多核苷酸可编程DNA结合结构域结合。在一些实施例中,所述多核苷酸可编程核苷酸结合结构域是多核苷酸可编程DNA结合结构域。在一些实施例中,所述碱基编辑器是胞苷碱基编辑器(CBE)。在一些实施例中,所述碱基编辑器是腺嘌呤或腺苷碱基编辑器(ABE)。在一些实施例中,所述碱基编辑器是腺嘌呤或腺苷碱基编辑器(ABE)或胞苷碱基编辑器(CBE)。
生物活性:如本文所用,短语“生物活性”是指在生物系统中,特别是在生物体中具有活性的任何药剂的特性。例如,当施用于生物体时对所述生物体具有生物效应的药剂被视为是生物活性的。在特定实施例中,当肽具有生物活性时,所述肽的共享肽的至少一种生物活性的部分通常被称为“生物活性”部分。
切割:如本文所用,切割是指由本文所述的CRISPR系统的核酸酶产生的靶核酸中的断裂。在一些实施例中,切割事件是双链DNA断裂。在一些实施例中,切割事件是单链DNA断裂。在一些实施例中,切割事件是单链RNA断裂。在一些实施例中,切割事件是双链RNA断裂。
互补:如本文所用,互补是指核酸链形成沃森-克里克(Watson-Crick)碱基配对,使得A碱基与T配对,并且C碱基与G配对,或与第二核酸链上的碱基形成非传统碱基配对。换句话说,它是指在适当的条件下彼此杂交的核酸。
成簇规律间隔的短回文重复序列(Clustered Interspaced Short PalindromicRepeat,CRISPR)相关(Cas)系统:如本文所用,CRISPR-Cas9系统是指参与CRISPR效应子的表达或指导CRISPR效应子活性的核酸和/或蛋白质,包含编码CRISPR效应子的序列、RNA向导以及来自CRISPR基因座的其它序列和转录物。在一些实施例中,CRISPR系统是经工程化、非天然存在的CRISPR系统。在一些实施例中,CRISPR系统的组分可以包含编码系统的一种或多种组分的核酸(例如,载体)、蛋白质形式的组分或其组合。
CRISPR阵列:如本文所用,术语“CRISPR阵列”是指包含CRISPR重复序列和间隔子的核酸(例如,DNA)区段,该区段从第一个CRISPR重复的第一个核苷酸开始并且到最后一个(末端)CRISPR重复的最后一个核苷酸结束。通常,CRISPR阵列中的每个间隔子位于两个重复序列之间。如本文所用,术语“CRISPR重复序列”或“CRISPR同向重复序列”或“同向重复序列”是指多个短的同向重复序列,所述短的直接重复序列在CRISPR阵列内显示非常少或无序列变异。
CRISPR相关蛋白(Cas):如本文所用,术语“CRISPR相关蛋白”、“CRISPR效应子”、“效应子”或“CRISPR酶”是指执行酶活性或结合由RNA向导指定的核酸上的靶位点的蛋白。在不同实施例中,CRISPR效应子具有核酸核酸内切酶活性、切口酶活性、核酸外切酶活性、转座酶活性和/或切除活性。在一些实施例中,Cas是高精度Cas。在一些实施例中,Cas是高保真Cas。在一些实施例中,Cas是SuperFi-Cas。在一些实施例中,高精度Cas、高保真Cas和SuperFi-Cas如Bravo,J.等人Structural basis for mismatch surveillance byCRISPR-Cas9 Nature,603,2022年3月中所述。
crRNA:如本文所用,术语“CRISPR RNA”或“crRNA”是指包含由CRISPR效应子用于靶向特定核酸序列的向导序列的RNA分子。通常,crRNA含有介导靶识别的序列和与tracrRNA形成双链体的序列。在一些实施例中,crRNA:tracrRNA双链体与CRISPR效应子结合。
离体:如本文所用,术语“离体”是指在细胞或组织中发生的事件,该细胞或组织在多细胞生物体外而不是在多细胞生物体内生长。
功能等同物或类似物:如本文所用,术语“功能等同物”或“功能类似物”在氨基酸序列的功能衍生物的上下文中表示保留与原始序列的生物活性(功能或结构)基本上类似的生物活性的分子。功能衍生物或等同物可以是天然衍生物或是合成制备的。示例性功能衍生物包含具有一个或多个氨基酸的取代、缺失或添加的氨基酸序列,条件是蛋白质的生物活性是保守的。取代氨基酸理想地具有与该取代氨基酸类似的物理化学性质。理想的相似物理化学性质包含电荷、体积、疏水性、亲水性等的相似性。
半衰期:如本文所用,术语“半衰期”是量(如蛋白浓度或活性)下降到其在时间段开始时测量的值的一半所需的时间。
改善、增加或减少:如本文所用,术语“改善”、“增加”或“减少”或其语法等效物表示相对于基线测量值的值,该基线测量值如在开始本文所述的治疗之前在同一个体中的测量值,或在不存在本文所述的治疗的情况下在对照受试者(或多个对照受试者)中的测量值。“对照受试者”是患有与正在治疗的受试者相同形式的疾病的受试者,所述受试者与正在接受治疗的受试者的年龄大致相同。
抑制:如本文所用,术语“抑制(inhibition)”、“抑制(inhibit)”和“抑制(inhibiting)”是指减少或降低所关注的蛋白质或基因的活性和/或表达的过程或方法。通常,抑制蛋白质或基因是指将蛋白质或基因的表达或相关活性降低至少10%或更多,例如,20%、30%、40%或50%、60%、70%、80%、90%或更多,或表达或相关活性降低大于1倍、2倍、3倍、4倍、5倍、10倍、50倍、100倍或更多,如通过本文所述或本领域公认的一种或多种方法测量的。
杂交:如本文所用,术语“杂交”是指两个或更多个核酸通过沃森-克里克配对、胡斯坦(Hoogstein)结合或其它序列特异性结合在两个核酸的碱基之间通过氢键而彼此结合的反应。能够与另一序列杂交的序列被称为该序列的“补体”,并且被称为“互补的”或表现出“互补性”。
插入缺失(indel):如本文所用,术语“插入缺失”是指核酸序列中碱基的插入或缺失。它通常会导致突变并且是遗传变异的一种常见形式。
体外:如本文所使用的,术语“体外”是指发生在人工环境,例如测试管或反映器皿中、细胞培养基等中而不是多细胞生物体内的事件。
体内:如本文所用,术语“体内”是指在多细胞生物体如人或非人动物内发生的事件。在基于细胞的系统的情况下,该术语可用于指代在活细胞(与例如体外系统相反)内发生的事件。
突变:如本文所用,术语“突变”具有本领域的普通含义,并且包含例如点突变、取代、插入、缺失、倒位和缺失。
寡核苷酸:如本文所用,术语“寡核苷酸”通常是指单链或双链DNA的介于约5与约100个核苷酸之间的多核苷酸。寡核苷酸也称为“寡聚物(oligomer)”或“寡聚物(oligo)”,并且可以从基因中分离出来,或化学合成。
PAM:术语“PAM”或“原间隔相邻基序”是指短核酸序列(长度通常为2至6个碱基对),该序列位于如CRISPR-Cas9等CRISPR系统所靶向切割的核酸区域之后。Cas核酸酶切割需要PAM并且通常在切割位点下游3至4个核苷酸处发现PAM。
多肽:如本文所用,术语“多肽”是指通过肽键连接在一起的连续氨基酸链。所述术语用于指任何长度的氨基酸链,但本领域普通技术人员将理解所述术语不限于长链并且可以指包括通过肽键连接在一起的两个氨基酸的最小链。如本领域技术人员所知,可以加工和/或修饰多肽。如本文所用,术语“多肽”和“肽”可互换使用。
预防:如本文所用,当与疾病、病症和/或病状的发生结合使用时,术语“预防(prevent)”或“预防(prevention)”是指降低发生疾病、病症和/或病状的风险。
蛋白质:如本文所使用的术语“蛋白质”是指一种或多种作为离散单元发挥作用的多肽。如果单个多肽为离散功能单元且不需要与其它多肽进行永久或暂时的物理缔合以形成离散功能单元,那么术语“多肽”和“蛋白质”可以互换地使用。如果离散功能单位由多于一种物理上彼此缔合的多肽组成,则术语“蛋白质”是指物理偶联并作为离散单位一起发挥作用的多种多肽。
参考:“参考”实体、系统、数量、条件集合等是与本文所述的测试实体、系统、数量、条件集合等进行比较的实体、系统、数量、条件集合等。例如,在一些实施例中,“参考”抗体是如本文所述未经工程化的对照抗体。
RNA向导:术语RNA向导是指促进本文所述的蛋白质靶向靶核酸的RNA分子。示例性“RNA向导”或“向导RNA”包含但不限于crRNA或crRNA与同源tracrRNA的组合。后者可能是独立的RNA或使用连接子(sgRNA)融合为单个RNA。在一些实施例中,RNA向导经工程化以包含化学或生物化学修饰。在一些实施例中,RNA向导可以包含一个或多个核苷酸。
受试者:如本文所用,术语“受试者”意指需要对其进行诊断、预后或治疗的任何受试者。例如,受试者可以是哺乳动物,例如人或非人灵长类动物(如猿、猴、猩猩或黑猩猩)、狗、猫、豚鼠、兔、大鼠、小鼠、马、牛或奶牛。
sgRNA:术语“sgRNA”或“单向导RNA”是指含有(i)向导序列(crRNA序列)和(ii)Cas9核酸酶募集序列(tracrRNA)的单向导RNA。
基本同一性:短语“基本同一性”在本文中用于指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的,如果两个序列在对应位置含有相同残基,则它们通常被认为是“基本上相同的”。如本领域所熟知的,可以使用多种算法中的任何一种来比较氨基酸或核酸序列,所述算法包含商业计算机程序中可用的那些,如用于核苷酸序列的BLASTN和用于氨基酸序列的BLASTP、有空位的BLAST和PSI-BLAST。此类示例性程序在以下中描述:Altschul等人,Basic local alignment search tool,J.Mol.Biol.,215(3):403-410,1990;Altschul等人,Methods in Enzymology;Altschul等人,Nucleic Acids Res.25:3389-3402,1997;Baxevanis等人,Bioinformatics:A Practical Guide to the Analysisof Genes and Proteins,Wiley,1998;以及Misener等人,(编辑),BioinformaticsMethods and Protocols(Methods in Molecular Biology,第132卷),Humana Press,1999。除了鉴定相同序列之外,上述程序通常提供对同一性程度的指示。在一些实施例中,如果在相关延伸段的残基上至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的对应残基相同,则认为两个序列基本上相同。在一些实施例中,所述相关延伸段是完整序列。在一些实施例中,所述相关延伸段为至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500个或更多个残基。
靶核酸:如本文所用,术语“靶核酸”是指CRISPR-Cas9系统结合到的任何长度的核苷酸(寡核苷酸或多核苷酸),脱氧核糖核苷酸、核糖核苷酸或其类似物。靶核酸可以具有三维结构,可以包含编码区或非编码区,可以包含外显子、内含子、mRNA、tRNA、rRNA、siRNA、shRNA、miRNA、核酶、cDNA、质粒、载体、外源序列、内源序列。靶核酸可以包括经修饰的核苷酸,所述经修饰的核苷酸包含甲基化核苷酸或核苷酸类似物。靶核酸可以散布有非核酸组分。靶核酸不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体或包括嘌呤和嘧啶碱基或其它天然的、经化学或生化修饰的、非天然的或衍生的核苷酸碱基的聚合物。
治疗有效量:如本文所用,术语“治疗有效量”是指以适用于任何医学治疗的合理益处/风险比赋予经治疗受试者治疗效果的治疗性分子(例如,本文所述的经工程化的抗体)的量。疗效可以是客观的(即,可通过某一测试或标记测量)或主观的(即,受试者给出效果的指示或感受到效果)。具体地,“治疗有效量”是指有效治疗、改善或预防特定疾病或病状,或表现出可检测的治疗或预防作用的治疗性分子或组合物的量,如通过改善与疾病相关的症状、预防或延迟疾病发作,和/或还减轻疾病症状的严重性或频率。可以在可以包括多个单位剂量的给药方案中施用的治疗有效量。对于任何特定的治疗性分子,治疗有效量(和/或有效给药方案内的适当单位剂量)可以变化,例如,取决于施用途径,以及与其它药剂的组合。此外,任何特定受试者的特定治疗有效量(和/或单位剂量)可能取决于多种因素,包含所治疗的病症和病症的严重程度;所采用的特定药剂的活性;所采用的特定组合物;受试者的年龄、体重、总体健康状况、性别和饮食;施用时间、施用途径和所采用的特定治疗性分子的排泄率或代谢率;治疗的持续时间;以及医学领域众所周知的类似因素。
tracrRNA:如本文所用,术语“tracrRNA”或“反式激活crRNA”是指包含形成CRISPR相关蛋白结合特定靶核酸所需结构的序列的RNA。
治疗:如本文所用,术语“治疗(treatment)”(还有“治疗(treat/treating)”是指施用治疗性分子(例如,本文所述的CRISPR-Cas治疗性蛋白或系统),该治疗性分子部分或完全减轻、改善、缓解、抑制疾病、病症和/或病状的一或多种症状或特征,延迟疾病、病症和/或病状的一或多种症状或特征的发作,降低疾病、病症和/或病状的一或多种症状或特征的严重程度和/或降低疾病、病症和/或病状的一或多种症状或特征的发病率。此类治疗可以是针对未出现相关疾病、病症和/或病状的病征的受试者和/或针对仅出现疾病、病症和/或病状的早期病征的受试者。或者或另外,这种治疗可以是针对出现相关疾病、病症和/或病状的一种或多种确定病征的个体。
附图说明
图1A是示出了B2M基因BE4-相容靶序列和ABE-相容靶序列以及相关PAM和原间隔区位点的示意图。图1B是示出了B2M基因的碱基编辑的图。这些研究的数据示出了使用ABE编辑器(ABE7.10)或BE4编辑器的B2M基因的编辑效率。
图2A是示出了CIITA BE4-相容靶序列和ABE-相容靶序列以及相关PAM和原间隔区位点的示意图。图2B是示出了CIITA基因的碱基编辑的图。这些研究的数据示出了使用ABE编辑器(ABE8.2m)或BE4编辑器的CIITA基因的编辑效率。
图3A是B2M靶基因在示例性4天和6天的培养、编辑后反应后的碱基编辑效率以及CIITA基因在培养6天、编辑后反应时的碱基编辑效率的图。图3B是用于分析CIITA基因的蛋白质水平KO并评估编辑效率的流式细胞术数据。
图4是通过流式细胞术的B2M和CIITA靶基因相对于HEK2 S2对照的碱基编辑效率的图。
图5A是描绘了用于示例性碱基编辑器的核转染和转染的示例性反应条件和mRNA:gRNA比率的表。
图5B是示出了在mRNA:sgRNA的示例性比率为1:1、2:1、3:1、4:1时,BE4基因座处的示例性碱基编辑效率和细胞活力的图。
图6是示出了B2M基因座处的碱基编辑效率和细胞活力的图。条形代表了B2M基因座处的编辑效率;点代表了通过流式细胞术评估的B2M阴性细胞的百分比;“HEK2-2”表示靶向的对照基因座。
图7是示出了B2M基因座与转基因引入(Tg#1或Tg#2)组合以整合到离体程序中的比较基因编辑效率的图。
图8是示出了双工程(包括BE4 B2M基因基因座(loci)处的碱基编辑以及转基因引入)的效率的图。
具体实施方式
本文描述了适合用于治疗疾病的基因修饰的人肝细胞的生产。还描述了包含获得基因修饰的人肝细胞的载体、核酸和/或细胞的合适组合物。此外,描述了使用基因修饰的肝细胞治疗有此需要的受试者的各种方法。
生产基因修饰的人肝细胞的方法
提供了生产适用于肝细胞移植的基因修饰的人肝细胞的方法,该方法包括:通过引入碱基编辑器以及一种或多种与一个或多个I类或II类基因中的靶序列杂交的gRNA,来破坏分离的人肝细胞中或肝细胞祖细胞中的一个或多个主要组织相容性复合体(MHC)I类或II类基因,由此生产基因修饰的人肝细胞。基因修饰的人肝细胞可以具有一个或多个核碱基编辑,从而改变对应的MHC I类或II类基因的表达。替代性地或补充地,基因修饰的人肝细胞减少或抑制一个或多个MHC I类或II类基因的表达。以此方式,基因修饰的肝细胞一旦移植到有此需要的受试者中,将不会引起将导致移植的基因修饰的肝细胞选择性死亡的排斥。因此,基因修饰的人肝细胞具有降低或消除的同种异体反应性。
任何种类或MHC I类或II类基因都可以被靶向以减少、消除或抑制基因表达。例如,MHC I类基因包括HLA-A、HLA-B、HLA-C、HLA-E、HLA-F、HLA-G、HLA-K和HLA-L。例如,MHCII类基因包括HLA-DP、HLA-DM、HLA-DOA、HLA-DOB、HLA-DQ、HLA-DR。在一些实施例中,靶向一个或多个MHC I类或II类基因以增加基因表达。在一些实施例中,靶向一个或多个MHC I类或II类基因以减少基因表达。在一些实施例中,与非基因修饰的人肝细胞相比,基因修饰的人肝细胞过表达CD47和/或CD142。
分离的人肝细胞可以从任何合适的供体中获得。在一些实施例中,供体没有肝病。在一些实施例中,供体有肝病。该方法可用于新鲜分离的肝细胞或一次冷冻然后解冻的肝细胞。在一些实施例中,该方法使用从祖细胞或干细胞中获得的肝细胞。例如,祖细胞或干细胞可以是任何合适的多能细胞,如诱导多能细胞(iPS细胞)或胚胎干(ES)细胞。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向B2M基因的向导RNA,其中表2中列出的碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向CD142基因的向导RNA,其中表3中列出的碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向CIITA基因的向导RNA,其中表4中列出的碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向HLA-A基因的向导RNA,其中表5中列出的碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向HLA-B基因的向导RNA,其中表6中列出的碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
在一些实施例中,本文提供了包含表2中列出的原间隔序列中的任一者的RNA版本的向导RNA。在一些实施例中,向导RNA包含表3中列出的原间隔序列中的任一者的RNA版本。在一些实施例中,向导RNA包含表4中列出的原间隔序列中的任一者的RNA版本。在一些实施例中,向导RNA包含表5中列出的原间隔序列中的任一者的RNA版本。在一些实施例中,向导RNA包含表6中列出的原间隔序列中的任一者的RNA版本。
在一些实施例中,本文提供了包含表2A中列出的序列中的任一者的向导RNA。在一些实施例中,向导RNA包含表3A中列出的序列中的任一者。在一些实施例中,向导RNA包含表4A中列出的序列中的任一者。在一些实施例中,向导RNA包含表5A中列出的序列中的任一者。在一些实施例中,向导RNA包含表6A中列出的序列中的任一者。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向B2M基因的向导RNA,其中表2A中列出的碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向CD142基因的向导RNA,其中表3A中列出的碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向CIITA基因的向导RNA,其中表4A中列出的碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向HLA-A基因的向导RNA,其中表5A中列出的碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
在一些实施例中,该方法包括碱基编辑器和一种或多种靶向HLA-B基因的向导RNA,其中表6A中列出的碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
各种碱基编辑器可用于制备基因修饰的人肝细胞的方法中。
包含CRISPR蛋白和腺嘌呤碱基编辑器(ABE)、胞苷碱基编辑器(CBE)或肌苷碱基编辑器(IBE)中的任一者或多者的碱基编辑器适用于本文所述的方法。在一些实施例中,本文所述的方法可以通过使用CRISPR蛋白实现所关注的基因(如MHC I类或II类基因中的一个或多个)的靶向抑制来实现。
适用于本文所述方法的CRISPR蛋白在全文中进行了描述,并且包括任何Cas9或Cas12 CRISPR蛋白。例如,Cas9可以选自任何合适的细菌,包括所述的从酿脓链球菌(SpCas9)或金黄色葡萄球菌(SaCas9)中分离出来的Cas9。适用于本文所述方法的Cas12CRISPR蛋白包含任何2类V型或VI型Cas12蛋白,包括例如2类V型Cas12包括:Cas12a、Cas12b、Cas12c等。
适用于本文所述方法的CRISPR蛋白可以具有一个或多个突变。一个或多个突变可产生作为切口酶或催化失活的CRISPR蛋白的CRISPR蛋白。“突变”意指点突变、取代、缺失、倒位或融合中的任一者或其任何组合。融合可以发生在CRISPR蛋白的任何位置,例如,N-末端、C-末端或N-末端与C-末端之间。为了获得切口酶或催化失活的CRISPR蛋白,一个或多个突变可以在PAM相互作用结构域、RuvC结构域和/或HNH结构域中的任一者或其任何组合中进行。本领域描述了各种突变,并且包括例如US 9,790,490中描述的那些,其内容并入本文。
在一些实施例中,Cas9是高保真Cas9。在一些实施例中,高保真Cas9变体包含增强的特异性,其最大限度地减少了脱靶切割。在一些实施例中,Cas9是超精确Cas9。在一些实施例中,经工程化的变体,例如“超精确Cas9”(与SpyCas9对应的N692A、M694A、Q695A和/或H698A突变)和/或“高保真Cas9”(与SpyCas9对应的N467A、R661A、Q695A和/或Q926A突变)被使用,其主要包含REC3结构域内的突变并实现更高的特异性和保真度。高保真变体降低了Cas9稳定错配和减少脱靶DNA切割的能力。在一些实施例中,特异性的增加伴随着靶向切割效率约100倍的损失。在一些实施例中,使用SuperFi-Cas9,其是维持与野生型Cas9相当的靶向切割率的高保真变体。在一些实施例中,SuperFi-Cas9包含RuvC环中的突变。在一些实施例中,突变抑制了促进gRNA-TS双链体的随后切割的扭曲式构象的形成。在一些实施例中,与SpyCas9对应的Y1016、R1019、Y1010、Y1013、K1031、Q1027和/或V1018残基突变为例如天冬氨酸。(Bravo,J.等人Structural basis for mismatch surveillance by CRISPR-Cas9 Nature,603,2022年3月)。
在一些实施例中,CRISPR蛋白与脱氨酶(如本文所述的腺苷脱氨酶、胞嘧啶脱氨酶或肌苷脱氨酶)融合。碱基编辑器的多种配置可以实现多个碱基编辑的多重类型。例如,在一些实施例中,单个碱基编辑器与一个以上的向导物组合使用以产生两个、三个或更多个核碱基编辑。替代性地,在一些实施例中,使用与合适的向导物配对的多个碱基编辑器,以产生两个、三个或更多个核碱基编辑。多个碱基编辑器和相关的向导物示出在表2、表3、表4、表5和表6中。因此,在一些实施例中,提供了碱基编辑器和合适的向导物以靶向一个或多个特定基因,如B2M基因、CD142基因、CIITA基因、HLA-A基因和HLA-B基因。
在一些实施例中,碱基编辑系统在一种或多种载体中提供。例如,碱基编辑系统可以在单个载体中或者由递送碱基编辑系统的组分的一种以上的载体组成的“分裂载体”中提供。对应的核酸可以经密码子优化。进行此类密码子优化以优化用于在人细胞中表达的核酸。
在产生基因修饰的肝细胞之后,将基因修饰的细胞在合适的人源化动物模型中扩增。这种扩增允许产生足以移植到有此需要的受试者中的合适数量的细胞。各种人源化动物模型是本领域已知的,并且包括例如FRG猪、FRG小鼠和FRG大鼠动物。在一些实施例中,基因修饰的肝细胞在FRG小鼠和/或FRG小鼠动物内进行第一次扩增,然后在较大的人源化FRG动物(如猪)中进行第二次扩增。一般来说,每只FRG小鼠约50至100万个细胞生成约8000万至1.5亿个肝细胞。一般来说,每只FRG大鼠约50至100万个细胞生成约4.8至9亿个肝细胞。就细胞扩增而言,FRG猪通常可以比FRG大鼠多生成约100倍。
在扩增阶段之后,随后从FRG动物中分离出基因修饰的人肝细胞。此类分离遵循本领域已知的方法并且包括例如,荧光激活细胞分选、免疫磁性细胞分离、密度梯度离心和/或免疫密度细胞分离。
治疗肝病的方法
本文描述了使用所描述的基因修饰的人肝细胞来治疗患有肝病的受试者的方法。基因修饰的人肝细胞可用于治疗各种肝病,包括例如,α-1抗胰蛋白酶缺乏症、1型克里格勒-纳贾尔(Crigler-Najjar)综合征、家族性高胆固醇血症、先天性凝血因子VII缺乏症、A型血友病、I型糖原贮积病、婴儿型雷弗素姆(refusum)病、枫糖浆尿病、新生儿血色素沉着症、2型进行性家族性肝内胆汁淤积症(PFIC2)、尿素循环缺陷,如鸟氨酸转氨甲酰酶(OTC)缺乏症、精氨琥珀酸裂解酶缺乏症、1型氨甲酰磷酸合酶缺乏症、瓜氨酸血症、威尔逊氏(Wilson's)病、急性肝衰竭、妊娠期脂肪肝和慢加急性肝衰竭。因此,本文所述的方法可用于治疗先天性或获得性肝病。因此,在一些实施例中,基因修饰的人肝细胞用于治疗α-1抗胰蛋白酶缺乏症。在一些实施例中,基因修饰的人肝细胞用于治疗1型克里格勒-纳贾尔综合征。在一些实施例中,基因修饰的人肝细胞用于治疗家族性高胆固醇血症。在一些实施例中,基因修饰的人肝细胞用于治疗先天性凝血因子VII缺乏症。在一些实施例中,基因修饰的人肝细胞用于治疗A型血友病。在一些实施例中,基因修饰的人肝细胞用于治疗I型糖原贮积病。在一些实施例中,基因修饰的人肝细胞用于治疗婴儿型雷弗素姆病。在一些实施例中,基因修饰的人肝细胞用于治疗枫糖浆尿病。在一些实施例中,基因修饰的人肝细胞用于治疗新生儿血色素沉着症。在一些实施例中,基因修饰的人肝细胞用于治疗2型进行性家族性肝内胆汁淤积症(PFIC2)。在一些实施例中,基因修饰的人肝细胞用于治疗2型进行性家族性肝内胆汁淤积症(PFIC2)。在一些实施例中,基因修饰的人肝细胞用于治疗尿素循环缺陷,如鸟氨酸转氨甲酰酶(OTC)缺乏症、精氨琥珀酸裂解酶缺乏症、1型氨甲酰磷酸合酶缺乏症、瓜氨酸血症、威尔逊氏病。在一些实施例中,基因修饰的人肝细胞用于治疗急性肝衰竭。在一些实施例中,基因修饰的人肝细胞用于治疗妊娠期脂肪肝。在一些实施例中,基因修饰的人肝细胞用于治疗慢加急性肝衰竭。
治疗有此需要的受试者的方法包括施用本文所述的基因修饰的人肝细胞。多种施用模式适用于治疗有此需要的受试者,如门静脉内输注或注射细胞。在一些实施例中,将基因修饰的人肝细胞施用到有此需要的受试者的门静脉中。出于给药目的,向有此需要的受试者施用基因修饰的人肝细胞的量为约50至200亿个细胞。在一些实施例中,将约50至200亿个基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。在一些实施例中,将约100至120亿个基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。在一些实施例中,将约120至150亿个基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。
在一些实施例中,以肝总质量的约2%至15%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约5%至10%的量向受试者施用基因修饰的肝细胞。因此,在一些实施例中,以肝总质量的约2%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约3%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约4%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约5%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约6%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约7%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约8%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约9%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约10%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约11%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约12%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约13%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约14%的量向受试者施用基因修饰的肝细胞。在一些实施例中,以肝总质量的约15%的量向受试者施用基因修饰的肝细胞。
在一些实施例中,向受试者施用剂量高达每公斤体重约2×108个细胞的基因修饰的肝细胞。在一些实施例中,向受试者施用每公斤体重约1.5×108个细胞的基因修饰的肝细胞。在一些实施例中,向受试者施用每公斤体重约1.2×108个细胞的基因修饰的肝细胞。在一些实施例中,向受试者施用每公斤体重约1.0×108个细胞的基因修饰的肝细胞。在一些实施例中,向受试者施用每公斤体重约0.8×108个细胞的基因修饰的肝细胞。在一些实施例中,向受试者施用每公斤体重约0.5×108个细胞的基因修饰的肝细胞。
CRISPR融合蛋白
在一些实施例中,Cas9或Cas12蛋白融合至一个或多个异源蛋白质结构域。在一些实施例中,Cas9或Cas12酶融合至约1、2、3、4、5、6、7、8、9、10个以上或更多个蛋白质结构域。在一些实施例中,异源蛋白质结构域融合至Cas9或Cas12酶的C-末端。在一些实施例中,异源蛋白质结构域融合至Cas9或Cas12酶的N-末端。在一些实施例中,异源蛋白质结构域在内部融合至Cas9或Cas12酶的C-末端与N-末端之间。在一些实施例中,内部融合在Cas9RuvCI、RuvC II、RuvCIII、HNH、REC I或PAM相互作用结构域内进行。
Cas9或Cas12蛋白可以直接或间接连接至另一个蛋白质结构域。在一些实施例中,合适的CRISPR系统包含连接Cas9蛋白和异源蛋白的连接子或间隔子。氨基酸连接子或间隔子通常被设计为柔性的或者被设计为在两个蛋白质部分之间插入结构,如α-螺旋。连接子或间隔子可以相对较短,也可以较长。通常,连接子或间隔子包含例如长度为1至100(例如,1至100、5至100、10至100、20至100、30至100、40至100、50至100、60至100、70至100、80至100、90至100、5至55、10至50、10至45、10至40、10至35、10至30、10至25、10至20)个氨基酸。在一些实施例中,连接子或间隔子的长度等于或长于1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个氨基酸。通常,较长的连接子可以减少空间位阻。在一些实施例中,连接子将包含甘氨酸和丝氨酸残基的混合物。在一些实施例中,连接子可以另外包含苏氨酸、脯氨酸和/或丙氨酸残基。
在一些实施例中,Cas9或Cas12蛋白融合至细胞定位信号、表位标签、报告基因以及具有酶活性、表观遗传修饰活性、RNA切割活性、核酸结合活性、转录调节活性的蛋白质结构域。在一些实施例中,Cas9蛋白融合至核定位序列(NLS)、FLAG标签、HIS标签和/或HA标签。
合适的融合配偶体包括但不限于提供以下活性的多肽:甲基转移酶活性、去甲基化酶活性、乙酰转移酶活性、去乙酰化酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、肉豆蔻酰化活性、去肉豆蔻酰化活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性或核酸酶活性,其中任何一种都可以修饰DNA或DNA相关多肽(例如,组蛋白或DNA结合蛋白)。在一些实施例中,Cas9蛋白融合至组蛋白去甲基化酶、转录激活子或脱氨酶。
其它合适的融合配偶体包括但不限于边界元件(例如,CTCF)、提供外围募集的蛋白质及其片段(例如,核纤层蛋白A、核纤层蛋白B等)和蛋白质对接元件(例如,FKBP/FRB、Pill/Abyl等)。
在特定实施例中,Cas9融合至胞苷或腺苷脱氨酶结构域,例如,用于碱基编辑。在一些实施例中,Cas9融合至腺嘌呤和胞嘧啶碱基编辑器(ACBE或CABE),其中ACBE或CABE是通过将TadA的异二聚体和活化诱导的胞苷脱氨酶(AID)融合至Cas9切口酶(nCas9)的N-末端和C-末端来生成的。在一些实施例中,ACBE或CABE在同一靶位点处同时诱导C至T和A至G碱基编辑。Xie,J等人ACBE,a new base editor for simultaneous C-to-T and A-to-Gsubstitutions in mammalian systems.BMC Biology(18:131),2020)
在特定实施例中,Cas9或Cas12融合至胞苷或腺苷脱氨酶结构域,例如,用于碱基编辑。在一些实施例中,术语“胞苷脱氨酶”和“胞嘧啶脱氨酶”可以互换使用。在某些实施例中,胞苷脱氨酶结构域可与本文所述的任何胞苷脱氨酶具有70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。在一些实施例中,胞苷脱氨酶结构域具有胞苷脱氨酶活性(例如,将C转化为U)。在某些实施例中,腺苷脱氨酶结构域可与本文所述的任何腺苷脱氨酶具有70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。在一些实施例中,腺苷脱氨酶结构域具有腺苷脱氨酶活性(例如,将A转化为I)。在一些实施例中,术语“腺苷脱氨酶”和“腺嘌呤脱氨酶”可以互换使用。
在一些实施例中,胞苷脱氨酶可包含载脂蛋白B mRNA编辑复合体(APOBEC)家族脱氨酶的全部或一部分。APOBEC是进化上保守的胞苷脱氨酶家族。此家族的成员是C至U编辑酶。APOBEC样蛋白的N-末端结构域是催化结构域,而C-末端结构域是伪催化结构域。更具体地,催化结构域是锌依赖性胞苷脱氨酶结构域并且对于胞苷脱氨作用很重要。APOBEC家族成员包括APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(“APOBEC3E”现在指此)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4和活化诱导的(胞苷)脱氨酶。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC1脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC2脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3A脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3B脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3C脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3D脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3E脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3F脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3G脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC3H脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含APOBEC4脱氨酶的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含活化诱导的脱氨酶(AID)的全部或一部分。在一些实施例中,掺入融合蛋白中的脱氨酶包含胞苷脱氨酶1(CDA1)的全部或一部分。应当理解,融合蛋白可以包含来自任何合适的生物体(例如,人或大鼠)的脱氨酶。在一些实施例中,融合蛋白的脱氨酶结构域来自人、黑猩猩、大猩猩、猴、奶牛、狗、大鼠或小鼠。在一些实施例中,融合蛋白的脱氨酶结构域源自大鼠(例如,大鼠APOBEC1)。在一些实施例中,脱氨酶结构域是人APOBEC1。在一些实施例中,脱氨酶结构域是pmCDA1。
下面提供了示例性胞苷脱氨酶的序列。
pmCDA1(海七鳃鳗(Petromyzon marinus))
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV(SEQ ID NO:4)
人AID:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV(SEQ ID NO:5)
人AID:
(下划线:核定位序列;双下划线:核输出信号)
小鼠AID:
(下划线:核定位序列;双下划线:核输出信号)
犬AID:
(下划线:核定位序列;双下划线:核输出信号)
牛AID:
(下划线:核定位序列;双下划线:核输出信号)
大鼠AID:
(下划线:核定位序列;双下划线:核输出信号)
clAID(家犬(Canis lupus familiaris)):
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(SEQ ID NO:11)
btAID(家牛(Bos Taurus)):MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(SEQ ID NO:12)
mAID(小家鼠(Mus musculus)):
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(SEQ ID NO:13)
rAPOBEC-1(褐家鼠(Rattus norvegicus)):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO:14)
maAPOBEC-1(金色大鼠(Mesocricetus auratus)):
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLYHHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI(SEQ ID NO:15)
ppAPOBEC-1(婆罗洲猩猩(Pongo pygmaeus)):
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR(SEQ ID NO:16)
ocAPOBEC1(穴兔(Oryctolagus cuniculus)):
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLFQHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR(SEQ ID NO:17)
mdAPOBEC-1(短尾负鼠(Monodelphis domestica)):MNSKTGPSVGDATLRRRIKPWEFVAFFNPQELRKETCLLYEIKWGNQNIWRHSNQNTSQHAEINFMEKFTAERHFNSSVRCSITWFLSWSPCWECSKAIRKFLDHYPNVTLAIFISRLYWHMDQQHRQGLKELVHSGVTIQIMSYSEYHYCWRNFVDYPQGEEDYWPKYPYLWIMLYVLELHCIILGLPPCLKISGSHSNQLALFSLDLQDCHYQKIPYNVLVATGLVQPFVTWR(SEQ ID NO:18)
ppAPOBEC-2(婆罗洲猩猩(Pongo pygmaeus)):
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK(SEQ ID NO:19)
btAPOBEC-2(家牛):
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(SEQ ID NO:20)
mAPOBEC-3-(1)(小家鼠):
MQPQRLGPRAGMGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYISVPSSSSSTLSNICLTKGLPETRFWVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS(SEQ IDNO:21)
小鼠APOBEC-3-(2):
(斜体:核酸编辑结构域)
大鼠APOBEC-3:
/>
(斜体:核酸编辑结构域)
hAPOBEC-3A(智人(Homo sapiens)):
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN(SEQ ID NO:24)
hAPOBEC-3F(智人):
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE(SEQ ID NO:25)
恒河猴APOBEC-3G:
(斜体:核酸编辑结构域;下划线:细胞质定位信号)
黑猩猩APOBEC-3G:
(斜体:核酸编辑结构域;下划线:细胞质定位信号)
绿猴APOBEC-3G:
(斜体:核酸编辑结构域;下划线:细胞质定位信号)
人APOBEC-3G:
(斜体:核酸编辑结构域;下划线:细胞质定位信号)
人APOBEC-3F:
(斜体:核酸编辑结构域)
人APOBEC-3B:
(斜体:核酸编辑结构域)
大鼠APOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL(SEQ ID NO:32)
牛APOBEC-3B:
MDGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI(SEQ ID NO:33)
黑猩猩APOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG(SEQ ID NO:34)人APOBEC-3C:
(斜体:核酸编辑结构域)
大猩猩APOBEC-3C
(斜体:核酸编辑结构域)
人APOBEC-3A:
(斜体:核酸编辑结构域)
恒河猴APOBEC-3A:
/>
(斜体:核酸编辑结构域)
牛APOBEC-3A:
(斜体:核酸编辑结构域)
人APOBEC-3H:
(斜体:核酸编辑结构域)
恒河猴APOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR(SEQ ID NO:41)
人APOBEC-3D:
(斜体:核酸编辑结构域)
人APOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR(SEQ ID NO:43)
小鼠APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK(SEQ ID NO:44)
大鼠APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO:45)
人APOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK(SEQ ID NO:46)
小鼠APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(SEQ ID NO:47)
大鼠APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(SEQ ID NO:48)
牛APOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(SEQ ID NO:49)
海七鳃鳗CDA1(pmCDAl):
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV(SEQ ID NO:50)
人APOBEC3G D316R D317R:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN(SEQ ID NO:51)
人APOBEC3G A链:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ(SEQ ID NO:52)
人APOBEC3G A链D120R D121R:
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ(SEQ ID NO:53)
hAPOBEC-4(智人):
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTFPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFTDVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK(SEQID NO:54)
mAPOBEC-4(小家鼠):
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF(SEQ ID NO:55)
rAPOBEC-4(褐家鼠(Rattus norvegicus)):MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYPQTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILYSNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFTDALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV(SEQ ID NO:56)
mfAPOBEC-4(食蟹猴(Macaca fascicularis)):
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTYPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFTDVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK(SEQ IDNO:57)
pmCDA-1(海七鳃鳗):
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRV(SEQ ID NO:58)
pmCDA-2(海七鳃鳗):MELREVVDCALASCVRHEPLSRVAFLRCFAAPSQKPRGTVILFYVEGAGRGVTGGHAVNYNKQGTSIHAEVLLLSAVRAALLRRRRCEDGEEATRGCTLHCYSTYSPCRDCVEYIQEFGASTGVRVVIHCCRLYELDVNRRRSEAEGVLRSLSRLGRDFRLMGPRDAIALLLGGRLANTADGESGASGNAWVTETNVVEPLVDMTGFGDEDLHAQVQRNKQIREAYANYASAVSLMLGELHVDPDKFPFLAEFLAQTSVEPSGTPRETRGRPRGASSRGPEIGRQRPADFERALGAYGLFLHPRIVSREADREEIKRDLIVVMRKHNYQGP(SEQ ID NO:59)
pmCDA-5(海七鳃鳗):
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFT(SEQ ID NO:60)
yCD(酿酒酵母(Saccharomyces cerevisiae)):
MVTGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE(SEQ ID NO:61)rAPOBEC-1(δ177-186):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO:62)
rAPOBEC-1(δ202-213):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQHYQRLPPHILWATGLK(SEQ ID NO:63)
小鼠APOBEC-3:
(斜体:核酸编辑结构域)
在一些实施例中,腺苷脱氨酶可包含腺苷脱氨酶ADAR(例如,ADAR1或ADAR2)的全部或一部分。在另一个实施例中,腺苷脱氨酶可包含腺苷脱氨酶ADAT的全部或一部分。在一些实施例中,腺苷脱氨酶可包含来自大肠杆菌(Escherichia coli)(EcTadA)的ADAT的全部或一部分,其包含以下突变中的一种或多种:D108N、A106V、D147Y、E155V、L84F、H123Y、I157F,或另一种腺苷脱氨酶中的对应突变。腺苷脱氨酶可源自任何合适的生物体(例如,大肠杆菌)。在一些实施例中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌(Salmonella typhi)、腐败希瓦氏菌(Shewanellaputrefaciens)、流感嗜血杆菌(Haemophilus influenzae)、新月柄杆菌(Caulobactercrescentus)或枯草芽孢杆菌(Bacillus subtilis)。在一些实施例中,腺苷脱氨酶来自大肠杆菌。在一些实施例中,腺嘌呤脱氨酶是天然存在的腺苷脱氨酶,其包括与本文提供的突变中的任一者(例如,ecTadA中的突变)对应的一个或多个突变。任何同源蛋白中的对应残基可以通过例如序列比对和同源残基的测定来鉴定。任何天然存在的腺苷脱氨酶(例如,与ecTadA具有同源性)中与本文所述的突变中的任一者(例如,ecTadA中鉴定的突变中的任一者)对应的突变可以相应地生成。在特定实施例中,TadA是PCT/US2017/045381(WO 2018/027078)中描述的TadA中的任一者,其通过引用整体并入本文。通过多轮进化和选择(例如,TadA*7.10=来自第七轮进化的变体10)鉴定出突变在单链DNA上具有理想的腺苷脱氨酶活性,如表7所示。
表7.TadA变体的基因型
/>
在一些实施例中,TadA作为单体或二聚体(例如,野生型大肠杆菌TadA和经工程化的TadA变体的异二聚体)提供。在一些实施例中,腺苷脱氨酶是第八代TadA*8变体,如下表8所示。
表8:TadA8*腺苷脱氨酶变体
/>
在一些实施例中,腺苷脱氨酶是第九代TadA*9变体,其包含在选自以下项的氨基酸位置处的改变:TadA变体的21、23、25、38、51、54、70、71、72、72、94、124、133、138、139、146和158处,如下面的参考序列所示:
在一个实施例中,腺苷脱氨酶变体包含在选自以下项的两个或更多个氨基酸位置处的改变:上面的TadA参考序列的21、23、25、38、51、54、70、71、72、94、124、133、138、139、146和158处。在另一个实施例中,腺苷脱氨酶变体包含选自以下项的一个或多个(例如,2、3、4个)改变:SEQ ID NO.1的R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R和A158K。在其它实施例中,腺苷脱氨酶变体进一步包含以下改变中的一种或多种:Y147T、Y147R、Q154S、Y123H和Q154R。在其它实施例中,腺苷脱氨酶变体包含选自以下项的相对于上面的TadA参考序列的改变的组合:
E25F+V82S+Y123H,T133K+Y147R+Q154R;
E25F+V82S+Y123H+Y147R+Q154R;L51W+V82S+Y123H+C146R+Y147R+Q154R;
Y73S+V82S+Y123H+Y147R+Q154R;
P54C+V82S+Y123H+Y147R+Q154R;
N38G+V82T+Y123H+Y147R+Q154R;
N72K+V82S+Y123H+D139L+Y147R+Q154R;
E25F+V82S+Y123H+D139M+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
E25F+V82S+Y123H+T133K+Y147R+Q154R;
E25F+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+P124W+Y147R+Q154R;
L51W+V82S+Y123H+C146R+Y147R+Q154R;
P54C+V82S+Y123H+Y147R+Q154R;
Y73S+V82S+Y123H+Y147R+Q154R;
N38G+V82T+Y123H+Y147R+Q154R;
R23H+V82S+Y123H+Y147R+Q154R;
R21N+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+Y147R+Q154R+A158K;
N72K+V82S+Y123H+D139L+Y147R+Q154R;
E25F+V82S+Y123H+D139M+Y147R+Q154R;
M70V+V82S+M94V+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;E25F+I76Y+V82S+Y123H+Y147R+
Q154R;I76Y+V82T+Y123H+Y147R+Q154R;N38G+I76Y+V82S+Y123H+Y147R+Q154R;
R23H+I76Y+V82S+Y123H+Y147R+Q154R;
P54C+I76Y+V82S+Y123H+Y147R+Q154R;
R21N+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82S+Y123H+D138M+Y147R+Q154R;
Y72S+I76Y+V82S+Y123H+Y147R+Q154R;E25F+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82T+Y123H+Y147R+Q154R;
N38G+I76Y+V82S+Y123H+Y147R+Q154R;
R23H+I76Y+V82S+Y123H+Y147R+Q154R;
P54C+I76Y+V82S+Y123H+Y147R+Q154R;
R21N+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82S+Y123H+D138M+Y147R+Q154R;
Y72S+I76Y+V82S+Y123H+Y147R+Q154R;和
V82S+Q154R;
N72K+V82S+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R+A158K;
M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
N72K_V82S+Y123H+Y147R+Q154R;
Q71M_V82S+Y123H+Y147R+Q154R;M70V+V82S+M94V+Y123H+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R+A158K;和
M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。
在一些实施例中,脱氨酶或其它多肽序列缺乏甲硫氨酸,例如当被包含作为融合蛋白的组分时。这可以改变位置的编号。然而,技术人员将理解,此类对应的突变是指相同的突变,例如,Y73S和Y72S以及D139M和D138M。
在一些实施例中,Cas9或Cas12融合至核定位序列,该核定位序列包括SV40大T抗原、核质蛋白、c-myc、hRNPA1 M9、来自输入蛋白-α的IBB结构域的NLS;肌瘤T蛋白、人p53、c-abl IV、流感病毒NS1、肝炎病毒δ抗原、小鼠Mx1、人聚(ADP-核糖)聚合酶、类固醇激素受体(人)糖皮质激素的NLS。
在一些实施例中,Cas9或Cas12蛋白融合至表位标签,该表位标签包括但不限于血凝素(HA)标签、组氨酸(His)标签、FLAG标签、Myc标签、V5标签、VSV-G标签、SNAP标签、硫氧还蛋白(Trx)标签。
在一些实施例中,Cas9或Cas12融合至报告基因,该报告基因包括但不限于谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素转移酶(CAT)、HcRed、DsRed、青色荧光蛋白、黄色荧光蛋白和蓝色荧光蛋白、绿色荧光蛋白(GFP),包括增强版本或超折叠GFP,以及报告基因的其它修饰版本。
在一些实施例中,经工程化的Cas9或Cas12蛋白的血清半衰期是通过与异源蛋白(如人血清白蛋白、转铁蛋白、人IgG)和/或唾液酸化肽(如羧基末端肽(CTP,绒毛膜促性腺激素β链的))融合来增加的。
在一些实施例中,经工程化的Cas9或Cas12蛋白的血清半衰期是通过与不稳定结构域(包括但不限于联会蛋白、泛素、FKBP12-L106P和/或二氢叶酸还原酶)融合来缩短的。
提供增加或降低的稳定性的合适的融合配偶体包括但不限于降解决定子(degron)序列。本领域普通技术人员容易将降解决定子理解为控制其所属蛋白质的稳定性的氨基酸序列。例如,包含降解决定子序列的蛋白质的稳定性至少部分地由降解决定子序列控制。在一些情况下,合适的降解决定子是组成型的,使得该降解决定子独立于实验控制而对蛋白质稳定性发挥其影响(即,该降解决定子不是药物诱导型、温度诱导型的等)。在一些情况下,降解决定子为变体Cas9多肽提供可控的稳定性,使得变体Cas9多肽可以根据所需条件“开启”(即,稳定)或“关闭”(即,不稳定、降解)。例如,如果降解决定子是温度敏感性降解决定子,则变体Cas9多肽可以在低于阈值温度(例如,42℃、41℃、40℃、39℃、38℃、37℃、36℃、35℃、34℃、33℃、32℃、31℃、30℃等)时起作用(即,“开启”、稳定),但在高于阈值温度时不起作用(即,“关闭”、降解)。作为另一个实例,如果降解决定子是药物诱导型降解决定子,则药物的存在或不存在可以将蛋白质从“关闭”(即,不稳定)状态转换到“开启”(即,稳定)状态,或反之亦然。示例性药物诱导型降解决定子源自FKBP12蛋白。降解决定子的稳定性由与降解决定子结合的小分子的存在或不存在控制。
合适的降解决定子的实例包括但不限于由Shield-1、DHFR、生长素和/或温度控制的那些降解决定子。合适的降解决定子的非限制性实例是本领域已知的(例如,Dohmen等人,Science,1994.263(5151):第1273至1276页:Heat-inducibledegron:a method forconstructing temperature-sensitive mutants;Schoeber等人,Am J Physiol RenalPhysiol.2009年1月;296(l):F204-l l:Conditional fast expression and function ofmultimeric TRPV5channels using Shield-1;Chu等人,Bioorg Med Chem Lett.2008年11月15日;18(22):5941-4:Recent progress with FKBP-derived destabilizing domains;Kanemaki,Pflugers Arch.2012年12月28日:Frontiers of protein expression controlwith conditional degrons;Yang等,Mol Cell.2012年11月30日;48(4):487-8:Titivatedfor destruction:the methyl degron;Barbour等人,Biosci Rep.2013年1月18日;33(1).:Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase;以及Greussing等人,J VisExp.2012年11月10日;(69):Monitoring of ubiquitin-proteasome activity in livingcells using a Degron(dgn)-destabilized green fluorescent protein(GFP)-basedreporter protein;该文献中的全部在此通过引用整体并入)。
示例性降解决定子序列已在细胞和动物中得到充分表征和测试。因此,将失活的Cas9或Cas12融合至降解决定子序列,产生“可调节的”和“诱导型”失活的Cas9或Cas12多肽。
本文所述的融合配偶体中的任一者可以以任何期望的组合使用。作为说明这一点的一个非限制性实例,Cas9或Cas12融合蛋白可包含用于检测的YFP序列、用于稳定性的降解决定子序列和用于增加靶DNA转录的转录激活子序列。此外,dCas9融合蛋白中可使用的融合配偶体的数量是无限的。在一些情况下,Cas9融合蛋白包含一种或多种(例如,两种或更多种、三种或更多种、四种或更多种、或者五种或更多种)异源序列。
重组基因技术
根据本公开,可以采用本领域技术范围内的常规分子生物学、微生物学和重组DNA技术。此类技术描述于文献中(参见,例如,Sambrook,Fritsch&Maniatis,MolecularCloning:A Laboratory Manual,第二版(1989)Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.;DNA Cloning:A Practical Approach,第I卷和第II卷(D.N.Glover编1985);Oligonucleotide Synthesis(M.J.Gait编1984);Nucleic AcidHybridization(B.D.Hames&S.J.Higgins编(1985));Transcription And Translation(B.D.Hames&S.J.Higgins编(1984));Animal Cell Culture(R.I.Freshney编(1986));Immobilized Cells and Enzymes(IRL Press,(1986));B.Perbal,APractical Guide ToMolecular Cloning(1984);F.M.Ausubel等人(编),Current Protocols in MolecularBiology,John Wiley&Sons,Inc.(1994)。
基因(如编码多肽(如本文所述的经工程化的Cas9或Cas12酶)的核酸)的重组表达可以包括构建包含编码该多肽的核酸的表达载体。一旦获得了多核苷酸,就可以使用本领域已知的技术通过重组DNA技术来生产用于生产多肽的载体。已知的方法可用于构建包含多肽编码序列以及适当的转录控制信号和翻译控制信号的表达载体。这些方法包括例如体外重组DNA技术、合成技术和体内基因重组。
可以通过常规技术将表达载体转移至宿主细胞,然后可以通过常规技术培养转染的细胞以生产多肽。
在一些实施例中,编码靶向DNA的RNA和/或Cas9或Cas12蛋白的核苷酸序列可操作地连接至控制元件,例如,转录控制元件,如启动子。转录控制元件可以在真核细胞(例如,哺乳动物细胞),或原核细胞(例如细菌或古细菌细胞)中起作用。在一些实施例中,真核细胞是人细胞。在一些实施例中,编码靶向DNA的RNA和/或Cas9或Cas12蛋白的核苷酸序列可操作地连接至多个控制元件,该控制元件允许所编码的核苷酸序列在原核和真核细胞中表达。
启动子可以是组成型活性启动子(即,组成型处于活性/“ON”状态的启动子),它可以是诱导型启动子(即,其活性/“ON”或失活/“OFF”状态受外部刺激(例如,特定温度、化合物或蛋白质的存在)控制的启动子),它可以是空间限制性启动子(即转录控制元件、增强子等)(例如组织特异性启动子、细胞类型特异性启动子等),并且它可以是时间限制性启动子(即启动子在胚胎发育的特定阶段或生物过程的特定阶段(例如小鼠的毛囊周期)处于“ON”状态或“OFF”状态)。
合适的启动子可源自病毒并因此可称为病毒启动子,或者它们可源自任何生物体,包括原核或真核生物体。合适的启动子可用于驱动任何RNA聚合酶(例如,pol I、polII、pol III)的表达。示例性启动子包括但不限于SV40早期启动子、小鼠乳腺肿瘤病毒长末端重复(LTR)启动子;腺病毒主要晚期启动子(Ad MLP);单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子(如CMV即刻早期启动子区(CMVIE))、劳斯(Rous)肉瘤病毒(RSV)启动子、人U6小核启动子(U6)(Miyagishi等人,Nature Biotechnology 20,497-500(2002)),anenhanced U6 promoter(例如,Xia等人,Nucleic Acids Res.2003年9月1日;31(17)),和/或人HI启动子(HI)。
诱导型启动子的实例包括但不限于T7 RNA聚合酶启动子、T3 RNA聚合酶启动子、异丙基-β-D-硫代吡喃半乳糖苷(IPTG)调节的启动子、乳糖诱导的启动子、热休克启动子、四环素调节的启动子(例如,Tet-ON、Tet-OFF等)、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等。因此,诱导型启动子可以通过包括但不限于多西环素、RNA聚合酶,例如多西环素、RNA聚合酶(例如T7 RNA聚合酶)、雌激素受体和/或雌激素受体融合体的分子来调节。
在一些实施例中,启动子是空间限制性启动子(即,细胞类型特异性启动子、组织特异性启动子等),使得在多细胞生物体中,启动子在特定细胞的子集中具有活性(即“ON”)。空间限制性启动子也可以称为增强子、转录控制元件、控制序列等。可以使用任何方便的空间限制性启动子,并且合适的启动子(例如,脑特异性启动子、驱动神经元子集中的表达的启动子、驱动种系中的表达的启动子、驱动肺中的表达的启动子、驱动肌肉中的表达的启动子、驱动胰腺胰岛细胞中的表达的启动子等)的选择将取决于生物体。因此,空间限制性启动子可用于调节编码受试者定点多肽的核酸在多种不同组织和细胞类型中的表达,这取决于生物体。一些空间限制性启动子也在时间上受到限制,使得启动子在胚胎发育的特定阶段或生物过程的特定阶段(例如,毛囊周期)处于“ON”状态或“OFF”状态。
核碱基编辑器
在一些实施例中,本文提供的碱基编辑器中的任一者导致靶多核苷酸序列中小于50%、小于40%、小于30%、小于20%、小于19%、小于18%、小于17%、小于16%、小于15%、小于14%、小于13%、小于12%、小于11%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%、小于0.2%、小于0.1%、小于0.09%、小于0.08%、小于0.07%、小于0.06%、小于0.05%、小于0.04%、小于0.03%、小于0.02%或小于0.01%的插入缺失形成。
本公开的一些方面基于以下认识:本文提供的碱基编辑器中的任一者能够在核酸(例如,受试者基因组内的核酸)中高效地产生预期突变,如点突变,而不会产生大量非预期突变,如非预期点突变。在一些实施例中,本文提供的碱基编辑器中的任一者能够产生至少0.01%的预期突变(即至少0.01%的碱基编辑效率)。在一些实施例中,本文提供的碱基编辑器中的任一者能够产生至少0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%或99%的预期突变。
在一些实施例中,本文提供的碱基编辑器能够产生大于1:1的预期点突变与插入缺失的比率。在一些实施例中,本文提供的碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少8.5:1、至少9:1、至少10:1、至少11:1、至少12:1、至少13:1、至少14:1,至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少200:1、至少300:1、至少400:1、至少500:1、至少600:1、至少700:1、至少800:1、至少900:1、或至少1000:1或更多的预期点突变与插入缺失的比率。
预期突变和插入缺失的数量可以使用任何合适的方法来确定,例如,如国际PCT申请号PCT/2017/045381(WO2018/027078)和PCT/US2016/058344(WO2017/070632);Komor,A.C.等人,“Programmable editing of a target base in genomic DNA withoutdouble-stranded DNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.等人,“Programmable base editing of A·T to G·C in genomic DNAwithout DNAcleavage”Nature 551,464-471(2017);以及Komor,A.C.等人,“Improved base excisionrepair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A baseeditors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)中所述;该文献的全部内容在此通过引用并入。
在一些实施例中,为了计算插入缺失频率,扫描测序读数以与位于可出现插入缺失的窗口两侧侧接的两个10-bp序列精确匹配。如果未找到精确匹配,则将该读数从分析中排除。如果此插入缺失窗口的长度与参考序列完全匹配,则将该读数分类为不包含插入缺失。如果插入缺失窗口比参考序列长或短两个或更多个碱基,则将测序读数分别分类为插入或缺失。在一些实施例中,本文提供的碱基编辑器可限制核酸区域中插入缺失的形成。在一些实施例中,该区域位于碱基编辑器靶向的核苷酸处或者碱基编辑器靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸内的区域。
在靶核苷酸区域处形成的插入缺失的数量可取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施例中,在将靶核苷酸序列(例如,细胞基因组内的核酸)暴露于碱基编辑器至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天后,确定插入缺失的数量和比例。应当理解,本文所述的碱基编辑器的特征可以应用于融合蛋白中的任一者,或使用本文提供的融合蛋白的方法。
治疗应用
本文所述的方法和组合物可以具有各种治疗应用,例如用于治疗肝病。
在一些实施例中,本文所述的CRISPR方法或系统可用于编辑靶核酸,以修饰靶核酸(例如,通过插入、缺失或突变一个或多个核酸残基)。例如,在一些实施例中,本文所述的CRISPR系统包含外源供体模板核酸(例如,DNA分子或RNA分子),该外源供体模板核酸包含所需的核酸序列。在解决用本文所述的CRISPR系统诱导的切割事件后,细胞的分子机制将利用外源供体模板核酸来修复和/或解决切割事件。可替代地,细胞的分子机制可以利用内源模板来修复和/或解决切割事件。在一些实施例中,本文所述的CRISPR系统可用于改变靶核酸,导致插入、缺失和/或点突变)。在一些实施例中,所述插入是无痕插入(即,将预期的核酸序列插入靶核酸中,从而导致在解决切割事件后没有另外的非预期的核酸序列)。供体模板核酸可以是双链或单链核酸分子(例如,DNA或RNA)。在一些实施例中,本文所述的CRISPR方法或系统包含核碱基编辑器。
在期望将多核苷酸序列插入靶DNA序列的应用中,还向细胞提供包括待插入的供体序列的多核苷酸。“供体序列”或“供体多核苷酸”意指待插入在由定点修饰多肽诱导的切割位点处的核酸序列。供体多核苷酸将在切割位点处与基因组序列含有足够的同源性,例如与侧接切割位点(例如,在切割位点的约50个碱基或更少以内,例如在约30个碱基内、在约15个碱基内、在约10个碱基内、在约5个碱基内,或紧侧接切割位点)的核苷酸序列具有70%、80%、85%、90%、95%或100%的同源性,以支持其与和其具有同源性的基因组序列之间的同源性定向修复。供体和基因组序列之间具有序列同源性的大约为25、50、100或200个核苷酸或超过200个核苷酸(或介于10与200或更多个核苷酸之间的任何整数值)将支持同源性定向修复。供体序列可以是任意长度,例如10个核苷酸或更多、50个核苷酸或更多、100个核苷酸或更多、250个核苷酸或更多、500个核苷酸或更多、1000个核苷酸或更多、5000个核苷酸或更多等。
所述供体序列通常与其替换的基因组序列不同。相反,所述供体序列可以含有相对于基因组序列的至少一个或多个单碱基改变、插入、缺失、倒置或重排,只要存在足够的同源性以支持同源性定向修复即可。在一些实施例中,所述供体序列包括由两个同源区域侧接的非同源序列,使得靶DNA区域与两个侧接序列之间的同源定向修复导致非同源序列在靶区域处的插入。供体序列还可以包括载体骨架,所述载体骨架含有与所关注的DNA区域不同源并且不打算插入所关注的DNA区域的序列。通常,供体序列的同源区域与需要重组的基因组序列将具有至少50%的序列同一性。在某些实施例中,存在60%、70%、80%、90%、95%、98%、99%或99.9%的序列同一性。根据供体多核苷酸的长度,可以存在介于1%与100%序列同一性之间的任何值。
与基因组序列相比,供体序列可以包括某些序列差异,例如限制性位点、核苷酸多态性、可选择标志物(例如,耐药基因、荧光蛋白、酶等)等,该序列差异可以用于评估供体序列在切割位点处的成功插入,或在一些情况下可以用于其它目的(例如,表示在靶向基因组基因座处的表达)。在一些情况下,如果定位于编码区中,则此类核苷酸序列差异将不会改变氨基酸序列,或将使沉默氨基酸发生改变(即,不影响蛋白质的结构或功能的改变)。可替代地,这些序列差异可以包含侧接重组序列,如FLP、loxP序列等,所述重组序列可以在稍后的时间被激活以去除标志物序列。
所述供体序列可以作为单链DNA、单链RNA、双链DNA或双链RNA提供给细胞。它可以线性或圆形形式引入细胞中。如果以线性形式引入,可以通过本领域技术人员已知的方法保护供体序列的末端(例如,防止核酸外切降解)。例如,将一个或多个双脱氧核苷酸残基添加到线性分子的3'末端及/或将自互补寡核苷酸连接到一个或两个末端。用于保护外源多核苷酸免于降解的另外的方法包含但不限于添加末端氨基以及使用经过修饰的核苷酸间键,例如硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。作为保护线性供体序列末端的替代方案,可以在同源区域之外包含额外长度的序列,所述同源区域可以在不影响重组的情况下被降解。可以将供体序列作为载体分子的一部分引入细胞,所述载体分子具有额外序列,例如复制起点、启动子和编码抗生素抗性的基因。此外,供体序列可以作为裸核酸、作为与如脂质体或泊洛沙姆等药剂复合的核酸引入,或者可以通过病毒(例如,腺病毒、AAV)递送,如上文对于编码靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的核酸所述。
按照上述方法,可以离体切割和修饰,即“基因修饰”所关注的DNA区域。在一些实施例中,当将可选择标志物插入所关注的DNA区域时,通过将经基因修饰的细胞与剩余细胞群分离,可以使细胞群富集包括经基因修饰的细胞。在富集之前,“基因修饰的”细胞可能仅占细胞群的约1%或更多(例如,2%或更多、3%或更多、4%或更多、5%或更多、6%或更多、7%或更多、8%或更多、9%或更多、10%或更多、15%或更多,或20%或更多)。“经基因修饰的”细胞的分离可以通过适于所使用的可选择标志物的任何方便的分离技术来实现。例如,如果已插入荧光标志物,则可以通过荧光激活细胞分选来使细胞分离,而如果已插入细胞表面标志物,则可以通过亲和分离技术将细胞与异质群体分离,例如磁分离、亲和层析、用附着到固体基质上的亲和试剂进行“淘选”或其它方便的技术。提供精确分离的技术包括荧光激活细胞分选仪,其复杂程度各不相同,如多个颜色通道、低角度和钝角光散射检测通道、阻抗通道等。可以通过使用与失活细胞相关的染料(例如碘化丙啶)来针对失活细胞选择细胞。可以采用不会过度损害经基因修饰的细胞的活力的任何技术。以此方式实现包括经修饰的DNA的细胞高度富集的细胞组合物。“高度富集”是指经过遗传修饰的细胞将为细胞组合物的70%或更多、75%或更多、80%或更多、85%或更多、90%或更多,例如细胞组合物的约95%或更多或98%或更多。换言之,所述组合物可以是基本上纯的经基因修饰的细胞的组合物。
通过本文所述的方法所生产的基因修饰的细胞(例如,基因修饰的人肝细胞)可以立即使用。可替代地,所述细胞可以在液氮温度下冷冻并长期储存,解冻并能够重复使用。在这种情况下,细胞通常会被冷冻在10%二甲亚砜(DMSO)、50%血清、40%缓冲介质或如本领域中常用的其它某种溶液中以将细胞保存在这种冷冻温度下,并且以本领域中已知的用于解冻冷冻培养细胞的方式解冻。
基因修饰的细胞可以在各种培养条件下体外培养。所述细胞可以在培养物中扩增,即在促进其增殖的条件下生长。培养基可以是液体或半固体,例如包含琼脂、甲基纤维素等。细胞群体可以悬浮在适当的营养培养基中,如伊思柯夫(Iscove's)改良的DMEM或RPMI 1640,通常补充有胎牛血清(约5%至10%)、L-谷氨酰胺、硫醇,特别是2-巯基乙醇和抗生素,例如青霉素和链霉素。培养物可以含有调节性T细胞对其有应答的生长因子。如本文所定义的,生长因子是能够通过对跨膜受体的特定作用促进细胞在培养物或完整组织中存活、生长和/或分化的分子。生长因子包含多肽和非多肽因子。
可以将已经以此方式进行基因修饰的细胞移植到受试者体内,用于基因治疗等目的,例如治疗疾病或作为抗病毒、抗病原体或抗癌治疗剂,用于在农业中生产经基因修饰的生物体,或用于生物学研究。受试者可以是新生儿、青少年或成人。特别关注的是哺乳动物受试者。以用本方法处理的哺乳动物物种包含犬和猫;马;牛;绵羊等和灵长类动物,特别是人类。动物模型,特别是小型哺乳动物(例如小鼠、大鼠、豚鼠、仓鼠、兔形目动物(例如兔子)等)可以用于实验研究。
细胞可以单独或与合适的底物或基质一起提供给受试者,例如,以支持它们在被移植的组织中的生长和/或组织。在一些实施例中,可以通过以下任何途径将细胞引入受试者:肠胃外、皮下、静脉内、颅内、脊柱内、眼内或进入脊髓液。细胞可以通过注射、导管等引入。
向受试者施用治疗的次数可以变化。将经基因修饰的细胞引入受试者可能是一次性事件;但在某些情况下,这种治疗可能会在有限的时间段内引起改善并且需要进行一系列持续的重复治疗。在其它情况下,在观察到效果之前,可能需要多次施用经基因修饰的细胞。确切的方案取决于疾病或病状、疾病的阶段和正在治疗的个体受试者的参数。
药物制剂是在药学上可接受的媒剂中包含本文所述的一种或多种碱基编辑器或碱基编辑器系统的组合物。“药学上可接受的媒剂”可以是由联邦或州政府的监管机构批准的或者在美国
药典或其它公认药典中列出的在如人类等哺乳动物中使用的媒剂。术语“媒剂”是指本发明的化合物与其一起调配用于向哺乳动物施用的稀释剂、佐剂、赋形剂或载体。此类药物媒剂可以是脂质,例如脂质体,例如脂质体树状物;液体,如水和油,包含石油、动物、植物或合成来源的油,如花生油、大豆油、矿物油、芝麻油等,盐水;阿拉伯树胶、明胶、淀粉糊、滑石、角蛋白、胶体二氧化硅、尿素等。另外,可以使用助剂、稳定剂、增稠剂、润滑剂和着色剂。药物组合物可以调配成固体、半固体、液体或气体形式的制剂,如片剂、胶囊、粉末、颗粒、软膏、溶液、栓剂、注射剂、吸入剂、凝胶、微球和气雾剂。因此,DNA靶向RNA和/或定点修饰多肽和/或供体多核苷酸的施用可以多种方式实现,包含口服、口腔、直肠、肠胃外、腹膜内、皮内、经皮、气管内、眼内等施用。活性剂在施用后可以是全身性的,也可以通过使用局部施用、壁内施用或使用植入物来定位,所述植入物起到在植入部位保留活性剂量的作用。所述活性剂可以被调配成立即活性或可以被调配成缓释。
给予特定患者的有效量将取决于多种因素,其中一些因素因患者而异。有能力的临床医生将能够确定有效量的治疗剂以施用于患者,以根据需要停止或逆转疾病状况的进展。利用LD50动物数据和所述药剂可用的其它信息,临床医生可以根据施用途径确定个体的最大安全剂量。例如,假设治疗组合物被施用到更大的体液中,静脉内施用的剂量可能大于鞘内施用的剂量。类似地,可以以更高剂量或以重复剂量施用快速从体内清除的组合物,以维持治疗浓度。利用普通技能,有能力的临床医生将能够在常规临床试验过程中优化特定治疗剂的剂量。
取决于期望的调配物,药物组合物可以包含药学上可接受的、无毒的稀释剂载体,所述载体被定义为通常用于调配用于动物或人类施用的药物组合物的载体。对稀释剂进行选择以免影响所述组合物的生物活性。此类稀释剂的实例是蒸馏水、缓冲水、生理盐水、PBS、林格氏(Ringer's)溶液、葡萄糖溶液和汉克氏(Hank's)溶液。另外,药物组合物或调配物可以包含其它载体、佐剂、或无毒的、非治疗性的、非免疫原性的稳定剂、赋形剂等。所述组合物还可以包含接近生理条件的另外的物质,如pH调节剂和缓冲剂、毒性调节剂、润湿剂和去污剂。
所述组合物还可以包含多种稳定剂中的任何一种,如抗氧化剂。当药物组合物包含多肽时,该多肽可以与增强多肽的体内稳定性或以其它方式增强其药理学性质(例如,增加多肽的半衰期,降低其毒性并提高溶解度或吸收)的各种众所周知的化合物复合。此类修饰剂或络合剂的实例包含硫酸盐、葡萄糖酸盐、柠檬酸盐和磷酸盐。组合物的核酸或多肽也可以与增强其体内属性的分子复合。此类分子包含例如碳水化合物、多胺、氨基酸、其它肽、离子(例如,钠、钾、钙、镁、锰)和脂质。
可以施用药物组合物用于预防和/或治疗性处理。可以根据细胞培养物和/或实验动物中的标准药学程序确定活性成分的毒性和治疗功效,包含例如确定LD50(对50%群体致死的剂量)和ED50(对50%群体治疗有效的剂量)。毒性作用与治疗效果之间的剂量比为治疗指数并且所述治疗指数可以被表示为比率LD50/ED50。优选展现出大的治疗指数的疗法。
从细胞培养和/或动物研究获得的数据可以用于调配人类使用的一系列剂量。活性成分的剂量通常在包含低毒性ED50在内的循环浓度范围内。根据所采用的剂型和所利用的施用通路,剂量可以在此范围内变化。
用于调配药物组合物的组分优选地具有高纯度并且基本上不含潜在有害污染物(例如,至少是国家食品(NF)级,通常至少是分析级,并且更通常至少是药物级)。此外,用于体内使用的组合物通常是无菌的。就必须在使用前合成给定化合物而言,所得产物通常基本上不含任何潜在的毒性剂,特别是任何可能存在于合成或纯化过程中的内毒素。用于肠胃外施用的组合物也是无菌的、基本上等渗的并且在GMP条件下制备。
递送系统
本文所述的碱基编辑器或碱基编辑器系统或其组分、其核酸分子和/或编码或提供其组分的核酸分子、CRISPR相关蛋白或RNA向导物可以通过各种递送系统如载体(例如质粒和递送载体)来递送。下面描述了示例性实施例。碱基编辑器或碱基编辑器系统(例如,包含Cas9或Cas12,并且任选地包含本文所述的核碱基编辑器)可以在包含在病毒载体中的核酸上编码。病毒载体可包含慢病毒、腺病毒、逆转录病毒和腺相关病毒(AAV)。可以根据应用选择病毒载体。例如,AAV由于其温和的免疫原性而通常用于体内基因递送。腺病毒通常被用作疫苗,因为它们诱导强烈的免疫原性反应。病毒载体的包装能力会限制可包装到载体中的碱基编辑器的大小。例如,AAV的包装容量为约4.5kb,包含两个145个碱基反向末端重复序列(ITR)。
AAV是小型单链DNA依赖性病毒,属于细小病毒科。4.7kb野生型(wt)AAV基因组由两个基因组成,分别编码四种复制蛋白和三种衣壳蛋白,并且两侧侧接有145-bp反向末端重复序列(ITR)。病毒粒子由三种衣壳蛋白Vp1、Vp2和Vp3组成,它们以1:1:10的比率从相同的开放阅读框中产生,但由差异的剪接(Vp1)和替代性翻译起始位点(分别为Vp2和Vp3)产生。Vp3是病毒粒子中最丰富的亚基,并参与细胞表面的受体识别,从而定义病毒的嗜性。已在Vp1的独特N末端鉴定出在病毒感染性中起作用的磷脂酶结构域。
与wt AAV类似,重组AAV(rAAV)利用顺式作用的145-bp ITR以侧接载体转基因盒,为外源DNA提供高达4.5kb的包装。感染后,rAAV可以表达本发明的融合蛋白,并且通过以游离形式存在于环状由头到尾(head-to-tail)串联体中而持续存在而不整合到宿主基因组中。尽管体外和体内有很多成功使用此系统的rAAV的实例,但当基因编码序列的长度等于或大于wt AAV基因组的大小时,有限的包装能力限制了AAV介导的基因递送的使用。
AAV载体的小型包装容量使得大量超过此大小的基因的递送和/或大型生理调节元件的使用具有挑战性。这些挑战可以通过例如将待递送的蛋白质分成两个或更多个片段来解决,其中N-末端片段融合至分裂的内含肽-N,并且C-末端片段融合至分裂的内含肽-C。然后将这些片段包装到两个或更多个AAV载体中。如本文所用,“内含肽”是指连接侧接N-末端和C-末端外显子(例如,待连接的片段)的自剪接蛋白质内含子(例如,肽)。某些内含肽用于连接异源蛋白片段的用途描述于例如,Wood等人,J.Biol.Chem.289(21);14512-9(2014)中。例如,当融合至单独的蛋白质片段时,内含肽IntN和IntC相互识别,将自身剪接并同时连接它们所融合的蛋白质片段的侧接N-末端外显肽和C-末端外显肽,由此从这两个蛋白质片段中重建全长蛋白。其它合适的内含肽对于本领域技术人员来说是显而易见的。
在一些实施例中,本发明的CRISPR系统的长度可以变化。在一些实施例中,蛋白质片段的长度范围从2个氨基酸至约1000个氨基酸。在一些实施例中,蛋白质片段的长度范围从约5个氨基酸至约500个氨基酸。在一些实施例中,蛋白质片段的长度范围从约20个氨基酸至约200个氨基酸。在一些实施例中,蛋白质片段的长度范围从约10个氨基酸至约100个氨基酸。其它长度的合适的蛋白质片段对于本领域技术人员来说是显而易见的。
在一些实施例中,核酸酶(例如,Cas9或Cas12)的一部分或片段融合至内含肽。核酸酶可融合至内含肽的N-末端或C-末端。在一些实施例中,融合蛋白的一部分或片段融合至内含肽,并融合至AAV衣壳蛋白。内含肽、核酸酶和衣壳蛋白可以以任何排列(例如,核酸酶-内含肽-衣壳、内含肽-核酸酶-衣壳、衣壳-内含肽-核酸酶等)融合在一起。在一些实施例中,内含肽的N-末端融合至融合蛋白的C-末端,并且内含肽的C-末端融合至AAV衣壳蛋白的N-末端。
在一个实施例中,双AAV载体是通过将大的转基因表达盒分成两个单独的半部(5'端和3'端,或头和尾)来生成的,其中该盒中的每一半都被包装在单个AAV载体(<5kb)中。然后,全长转基因表达盒的重新组装是通过两种双AAV载体共感染同一细胞之后来实现的,然后:(1)5'基因组和3'基因组之间的同源重组(HR)(双AAV重叠载体);(2)ITR介导的5'基因组和3'基因组的由尾到头的串联体化(双AAV反式剪接载体);或(3)这两种机制的组合(双AAV混合载体)。双AAV载体在体内的使用导致全长蛋白的表达。双AAV载体平台的使用代表了用于大小>4.7kb的转基因的高效且可行的基因转移策略。
本文所述的用于设计碱基编辑器的所公开策略可用于生成能够包装到病毒载体中的碱基编辑器。使用基于RNA或DNA病毒的系统来递送碱基编辑器利用了高度进化的过程,用于将病毒靶向培养中或宿主中的特定细胞并将病毒有效载荷运输到细胞核或宿主细胞基因组。病毒载体可以直接施用于培养中的细胞、患者(体内),或者它们可以用于在体外处处理细胞,并且修饰的细胞可任选地施用于患者(离体)。传统的基于病毒的系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法可以整合到宿主基因组中,这通常导致插入的转基因的长期表达。此外,已在许多不同的细胞类型和靶组织中观察到高转导效率。
逆转录病毒的嗜性可以通过掺入外源包膜蛋白来改变,从而扩大靶细胞的潜在靶标群体。慢病毒载体是能够转导或感染非分裂细胞的逆转录病毒载体,并且通常产生高病毒滴度。因此,逆转录病毒基因转移系统的选择可能取决于靶组织。逆转录病毒载体包含具有至多6kb至10kb外源序列包装能力的顺式作用长末端重复序列。最小的顺式作用LTR足以复制和包装载体,然后该载体用于将治疗基因整合到靶细胞中以提供永久性的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些逆转录病毒载体(参见,例如,Buchscher等人,J.Virol.66:2731-2739(1992);Johann等人,J.Virol.66:1635-1640(1992);Sommnerfelt等人,Virol.176:58-59(1990);Wilson等人,J.Virol.63:2374-2378(1989);Miller等人,J.Virol.65:2220-2224(1991);PCT/US94/05700)。
逆转录病毒载体,特别是慢病毒载体,可能需要小于给定长度的多核苷酸序列以高效整合到靶细胞中。例如,与较小大小的逆转录病毒载体相比,长度大于9kb的逆转录病毒载体可导致低病毒滴度。在一些方面,本公开的CRISPR系统(例如,包含本文所公开的Cas9)具有足够的大小,以便能够通过逆转录病毒载体来高效包装和递送至靶细胞中。在一些情况下,Cas9的大小使得即使当与向导核酸和/或可靶向核酸酶系统的其它组分一起表达时,也允许高效的包装和递送。
在优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有非常高的转导效率并且不需要细胞分裂。利用此类载体,已经获得了高滴度和高水平的表达。此载体可以在相对简单的系统中大量生产。腺相关病毒(“AAV”)载体还可用于用靶核酸转导细胞,例如,用于体外生产核酸和肽,以及用于体内和离体基因治疗程序(参见,例如,West等人,Virology 160:38-47(1987);美国专利号4,797,368;WO93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建描述于许多出版物中,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);以及Samulski等人,J.Virol.63:03822-3828(1989)。
因此,碱基编辑器或碱基编辑器系统(例如,包含本文所公开的Cas9或Cas12)可以用病毒载体递送。碱基编辑器系统的一种或多种组分可以在一个或多个病毒载体上编码。例如,碱基编辑器和向导核酸可以在单个病毒载体上编码。在其它情况下,碱基编辑器和向导核酸在不同的病毒载体上编码。在任一情况下,碱基编辑器和向导核酸均可以可操作地连接至启动子和终止子。
病毒载体上编码的组分的组合可以通过所选病毒载体的载物大小限制来确定。
碱基编辑器的非病毒递送
用于碱基编辑器和碱基编辑器系统的非病毒递送方法也是可用的。非病毒核酸载体的一个重要类别是纳米颗粒,它可以是有机的或无机的。纳米颗粒在本领域中是众所周知的。任何合适的纳米颗粒设计都可以用于递送基因组编辑系统组分或编码此类组分的核酸。例如,有机(例如,脂质和/或聚合物)纳米颗粒可以适合用作本公开的某些实施例中的递送媒剂。用于纳米颗粒调配物和/或基因转移的示例性脂质示于表9(下文)中。
表9
/>
表10列出了用于基因转移和/或纳米颗粒调配物的示例性聚合物。
表10
/>
表11总结了用于编码本文所述Cas9的多核苷酸的递送方法。
表11
在另一方面,基因组编辑系统组分或编码此类组分(例如,任选地融合至具有生物活性的多肽(例如核碱基编辑器)的核酸结合蛋白(如例如Cas9或其变体,或者Cas12或其变体),以及靶向所关注的基因组核酸序列的gRNA)的核酸的递送,可以通过将核糖核蛋白(RNP)递送至细胞来实现。RNP包括与靶向gRNA复合的核酸结合蛋白,例如Cas9。可以使用已知方法将RNP递送到细胞,该方法如电穿孔、核转染或阳离子脂质介导的方法,例如,如Zuris,J.A.等人,2015,Nat.Biotechnology,33(1):73-80所报道。RNP有利于在CRISPR碱基编辑系统中使用,特别是对于难以转染的细胞,例如原代细胞。另外,RNP还可以缓解细胞中蛋白质表达可能出现的困难,特别是当真核启动子(例如,可以用于CRISPR质粒的CMV或EF1A)表达不佳时。有利地,RNP的使用不需要将外源DNA递送到细胞中。此外,由于包括核酸结合蛋白和gRNA复合物的RNP会随着时间的推移而降解,因此使用RNP有可能限制脱靶效应。以与基于质粒的技术类似的方式,RNP可以用于递送结合蛋白(例如,Cas9变体或Cas12变体)和指导同源定向修复(HDR)。
用于驱动碱基编辑器或碱基编辑器系统的启动子(例如,包含本文所述的Cas9或Cas12)可以包含AAV ITR。这对于消除对可能占用载体空间的额外启动子元件的需要是有利的。释放的额外空间可以用于驱动其它元件的表达,如向导核酸或可选择标志物。ITR活性相对较弱,因此可以用于降低因所选核酸酶过度表达而导致的潜在毒性。
任何合适的启动子都可以用于驱动Cas9和适当时向导核酸的表达。对于普遍表达,可以使用的启动子包括CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。对于脑或其它CNS细胞表达,合适的启动子可以包括:用于所有神经元的突触素I(SynapsinI),用于兴奋性神经元的CaMKIIalpha,用于GABA能神经元的GAD67或GAD65或VGAT等。对于肝细胞表达,合适的启动子包括白蛋白启动子。对于肺细胞表达,合适的启动子可以包含SP-B。对于内皮细胞,合适的启动子可以包含ICAM。对于造血细胞,合适的启动子可以包含IFNβ或CD45。对于成骨细胞,合适的启动子可以包含OG-2。
在一些情况下,本公开的Cas9具有足够小的大小以允许单独的启动子在同一核酸分子内驱动碱基编辑器和相容向导核酸的表达。例如,载体或病毒载体可以包括与编码碱基编辑器的核酸可操作地连接的第一启动子和与向导核酸可操作地连接的第二启动子。
用于驱动向导核酸表达的启动子包括:Pol III启动子,如U6或H1或者使用Pol II启动子和内含子盒来表达gRNA腺相关病毒(AAV)。
可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其它质粒或病毒载体类型来递送本文所述的带有或者不带有一个或多个向导核酸的Cas9或Cas12,特别是使用来自例如美国专利第8,454,972号的调配物和剂量(腺病毒的调配物、剂量)、美国专利第8,404,658号(AAV的调配物、剂量)和美国专利第5,846,946号(DNA质粒的调配物、剂量)以及涉及慢病毒、AAV和腺病毒的临床试验的临床试验和出版物。例如,对于AAV,施用途径、调配物和剂量可以如美国专利第8,454,972号中和涉及AAV的临床试验中那样。对于腺病毒,施用途径、调配物和剂量可以如美国专利第8,404,658号和涉及腺病毒的临床试验中那样。对于质粒递送,施用途径、调配物和剂量可以如美国专利第5,846,946号和涉及质粒的临床研究中那样。剂量可以基于或外推到平均70kg的个体(例如,成年男性),并且可以针对不同体重和物种的患者、受试者、哺乳动物进行调整。施用频率在医疗或兽医从业者(例如,医师、兽医)的范围内,这取决于常见因素,包含年龄、性别、一般健康状况、患者或受试者的其它状况以及正在解决的特定病状或症状。病毒载体可以注射到所关注的组织中。对于细胞类型特异性碱基编辑,碱基编辑器和任选的向导核酸的表达可以由细胞类型特异性启动子驱动。
对于体内递送,AAV可能优于其它病毒载体。在一些情况下,AAV具有低毒性,这可能是由于纯化方法不需要对可以激活免疫反应的细胞颗粒进行超离心。在一些情况下,AAV导致插入诱变的可能性很小,因为它未整合到宿主基因组中。
AAV的包装限制为4.5或4.75Kb。大于4.5或4.75Kb的构建体可以导致病毒产量显著降低。例如,SpCas9相当大,基因本身超过4.1Kb,这使其很难包装到AAV中。因此,本公开的实施例包含使用长度比常规Cas9短的公开的Cas9。
AAV可以是AAV1、AAV2、AAV5或其任何组合。可以根据要靶向的细胞选择AAV的类型;例如,可以选择AAV血清型1、2、5或混合衣壳AAV1、AAV2、AAV5或其任何组合用于靶向脑或神经元细胞;并且可以选择AAV4用于靶向心脏组织。AAV8可用于递送到肝脏。关于这些细胞的某些AAV血清型的列表可以在Grimm,D.等人,《病毒学杂志(J.Virol.)》82:5887-5911(2008))中找到。
慢病毒是复杂的逆转录病毒,其能够在有丝分裂和有丝分裂后细胞中感染并表达其基因。最常见的慢病毒是人类免疫缺陷病毒(HIV),它利用其它病毒的包膜糖蛋白来靶向多种细胞类型。
慢病毒可以如下制备。克隆pCasES10(包含慢病毒转移质粒骨架)后,转染前一天在含有10%胎牛血清且不含抗生素的DMEM中,将低传代(p=5)的HEK293FT接种到T-75烧瓶中,以达到50%融合。20小时后,将培养基更换为OptiMEM(无血清)培养基,并在4小时后完成转染。用10μg慢病毒转移质粒(pCasES10)和以下包装质粒转染细胞:5μg pMD2.G(VSV-g假型)和7.5μg psPAX2(gag/pol/rev/tat)。转染可在4mL OptiMEM中使用阳离子脂质递送剂(50μl Lipofectamine 2000和100ul Plus试剂)进行。6小时后,将培养基更换为含有10%胎牛血清的不含抗生素的DMEM。这些方法在细胞培养过程中使用血清,但优选无血清方法。
慢病毒可以如下纯化。48小时后收获病毒上清液。首先清除上清液的碎片,并通过0.45μm低蛋白结合(PVDF)过滤器进行过滤。然后将它们在超速离心机中以24,000rpm的速度旋转2小时。将病毒沉淀在4℃下重悬于50μl DMEM中过夜。然后将它们等分并立即在-80℃下冷冻。
在另一个实施例中,还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体。在另一个实施例中,一种基于马传染性贫血病毒的慢病毒基因治疗载体,其表达血管抑制蛋白内皮抑素和血管抑素,其预期通过视网膜下注射递送。在另一个实施例中,考虑使用自失活慢病毒载体。
系统的任何RNA,例如引导RNA,可以以RNA的形式递送。编码mRNA的Cas9或Cas12可以使用体外转录来生成。例如,Cas9或Cas12 mRNA可以使用包含以下元件的PCR盒来合成:T7启动子、可选的kozak序列(GCCACC)、核酸酶序列和3'UTR(如来自β珠蛋白-polyA尾的3'UTR)。该盒可用于T7聚合酶的转录。向导多核苷酸(例如,gRNA)还可以使用包含T7启动子、然后是序列“GG”和向导多核苷酸序列的盒进行体外转录。
为了增强表达并降低可能的毒性,可以修饰Cas9序列和/或向导核酸以包含一种或多种修饰的核苷,例如使用假-U或5-甲基-C。
一些实施例中的公开内容包括修饰细胞或生物体的方法。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人灵长类动物、牛、猪、啮齿动物或小鼠细胞。通过本公开的碱基编辑器、组合物和方法将修饰引入细胞可以使得细胞和细胞的后代被改变,以改善生物制品(如抗体、淀粉、酒精或其它所需的细胞输出物)的生产。通过本公开的方法将修饰引入细胞可以使得细胞和细胞的后代包括改变所生产的生物制品的改变。
该系统可以包含一种或多种不同的载体。在一个方面,Cas9或Cas12经密码子优化以在所需细胞类型、优选地真核细胞、优选地哺乳动物细胞或人细胞中表达。在一些实施例中,细胞是人肝细胞。
通常,密码子优化是指通过用在该宿主细胞的基因中更常用或最常用的密码子替换天然序列的至少一个密码子(例如,约或多于约1、2、3、4、5、10、15、20、25、50或更多个密码子),同时维持天然氨基酸序列,来修饰核酸序列以增强所关注的宿主细胞中表达的过程。不同的物种对特定氨基酸的某些密码子表现出特定的偏倚。密码子偏倚(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA的翻译效率又被认为取决于待翻译密码子的特性以及特定转移RNA(tRNA)分子的可用性等。细胞中所选tRNA的优势通常反映了肽合成中最常用的密码子。因此,可以基于密码子优化来定制基因以在给定生物体中实现最佳基因表达。密码子使用表很容易获得,例如,可在www.kazusa.orjp/codon/(2002年7月9日访问)上的“密码子使用数据库”中获得,并且这些表可以以多种方式进行修改。参见,Nakamura,Y.等人"Codon usage tabulated from the internationalDNA sequence databases:status for the year 2000"Nucl.Acids Res.28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可用的,如GeneForge(Aptagen;雅各布斯,宾夕法尼亚州)也是可用的。在一些实施例中,编码经工程化的核酸酶的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个,或所有密码子)与特定氨基酸最常用的密码子对应。
包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。此类细胞包括包装腺病毒的293细胞,以及包装逆转录病毒的psi.2细胞或PA317细胞。基因疗法中使用的病毒载体通常由将核酸载体包装到病毒颗粒中的生产者细胞系产生。载体通常含有包装和随后整合到宿主中所需的最小病毒序列,其它病毒序列被待表达的多核苷酸的表达盒所替代。缺失的病毒功能通常由包装细胞系反式提供。例如,用于基因疗法的AAV载体通常仅具有来自AAV基因组的ITR序列,这些序列是包装和整合到宿主基因组中所必需的。病毒DNA可以被包装在细胞系中,该细胞系含有编码其它AAV基因的辅助质粒,即rep和cap,但缺少ITR序列。该细胞系也可以感染腺病毒作为辅助。辅助病毒可以促进AAV载体的复制和来自辅助质粒的AAV基因的表达。在一些情况下,由于缺乏ITR序列,辅助质粒并没有大量包装。可以通过例如热处理来减少腺病毒的污染,腺病毒对热处理比AAV更敏感。
药物组合物
本公开的其它方面涉及包含碱基编辑器或碱基编辑器系统(例如,包含本文公的Cas9或Cas12)的药物组合物。如本文所用,术语“药物组合物”是指调配用于药物用途的组合物。在一些实施例中,药物组合物进一步包含药学上可接受的载体。在一些实施例中,药物组合物包含另外的药剂(例如,用于特异性递送、增加半衰期或其它治疗化合物)。
如本文所用,术语“药学上可接受的载体”意指药学上可接受的材料、组合物或媒剂,如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如,润滑剂、滑石粉、硬脂酸镁、硬脂酸钙或硬脂酸锌、或硬脂酸),或溶剂封装材料,涉及将化合物从身体的一个部位(例如,递送部位)携带或运输到另一部位(例如,器官、组织或身体的一部分)。药学上可接受的载体在与调配物的其它成分相容并且对受试者的组织无害的意义上是“可接受的”(例如,生理相容的、无菌的、生理pH等)。
可用作药学上可接受的载体的材料的一些非限制性实例包括:(1)糖类,如乳糖、葡萄糖和蔗糖;(2)淀粉,如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素;(4)西黄蓍胶粉;(5)麦芽;(6)明胶;(7)润滑剂,如硬脂酸镁、十二烷基硫酸钠和滑石粉;(8)赋形剂,如可可脂和栓剂蜡;(9)油类,如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;(10)二醇类,如丙二醇;(11)多元醇,如甘油、山梨醇、甘露醇和聚乙二醇(PEG);(12)酯类,如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格氏溶液;(19)乙醇;(20)pH缓冲溶液;(21)聚酯、聚碳酸酯和/或聚酐;(22)膨松剂,如多肽和氨基酸;(23)血清醇,如乙醇;以及(23)药物调配物中使用的其它无毒相容物质。润湿剂、着色剂、脱模剂、涂层剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于调配物中。术语如“赋形剂”、“载体”、“药学上可接受的载体”、“媒剂”等在本文中可互换使用。
药物组合物可包含一种或多种pH缓冲化合物以将调配物的pH维持在反映生理pH的预定水平,如在约5.0至约8.0的范围内。用于水性液体调配物中的pH缓冲化合物可以是氨基酸或氨基酸混合物,如组氨酸或氨基酸混合物(如组氨酸和甘氨酸)。替代性地,pH缓冲化合物优选是将调配物的pH维持在预定水平(如在约5.0至约8.0的范围内)且不螯合钙离子的药剂。此类pH缓冲化合物的说明性实例包括但不限于咪唑和乙酸根离子。pH缓冲化合物可以以适合将调配物的pH维持在预定水平的任何量存在。
药物组合物也可以包含一种或多种渗透调节剂,即,将调配物的渗透性质(例如,张力、渗透度和/或渗透压)调节至受体个体的血流和血细胞可接受的水平的化合物。渗透调节剂可以是不螯合钙离子的药剂。渗透调节剂可以是本领域技术人员已知或可获得的调节了调配物的渗透性质的任何化合物。本领域技术人员可以凭经验确定给定渗透调节剂用于本发明调配物的适用性。合适类型的渗透调节剂的说明性实例包括但不限于:盐类,如氯化钠和醋酸钠;糖类,如蔗糖、葡萄糖和甘露醇;氨基酸,如甘氨酸;以及这些药剂和/或药剂类型中的一种或多种的混合物。渗透调节剂可以以足以调节调配物的渗透性质的任何浓度存在。
在一些实施例中,药物组合物被调配用于递送至受试者,例如,用于基因编辑。施用本文所述药物组合物的合适途径包括但不限于:局部、皮下、经皮、皮内、病灶内、关节内、腹膜内、膀胱内、经粘膜、齿龈、牙内、耳蜗内、经鼓膜、器官内、硬膜外、鞘内、肌内、静脉内、血管内、骨内、眼周、瘤内、脑内和脑室内施用。
在一些实施例中,将本文所述的药物组合物局部施用至患病部位。在一些实施例中,本文所述的药物组合物通过注射、通过导管、通过栓剂或通过植入物施用于受试者,该植入物是多孔、无孔或凝胶状材料,包括膜(如硅橡胶膜)或纤维。
在其它实施例中,本文所述的药物组合物在控释系统中递送。在一个实施例中,可以使用泵(参见,例如,Langer,1990,Science 249:1527-1533;Sefton,1989,CRCCrit.Ref.Biomed.Eng.14:201;Buchwald等人,1980,Surgery 88:507;Saudek等人.,1989,N.Engl.J.Med.321:574)。在另一个实施例中,可以使用聚合材料。(参见,例如,MedicalApplications of Controlled Release(Langer和Wise编,CRC Press,Boca Raton,Fla.,1974);Controlled Drug Bioavailability,Drug Product Design and Performance(Smolen和Ball编,Wiley,New York,1984);Ranger和Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61。也参见Levy等,1985,Science 228:190;During等人,1989,Ann.Neurol.25:351;Howard等人,1989,J.Neurosurg.71:105。)讨论了其它控释系统,例如,在上述的Langer中。
在一些实施例中,根据例程程序将药物组合物调配为适于静脉内或皮下施用于受试者(例如,人)的组合物。在一些实施例中,用于通过注射施用的药物组合物是用作增溶剂和局部麻醉剂(如利多卡因(lignocaine))的无菌等渗溶液,以缓解注射部位的疼痛。一般地,将成分分开或混合在一起以单位剂型提供,例如,作为在气密封容器中的干燥冻干粉或无水浓缩剂,该气密封容器诸如指示活性剂的量的安瓿或小药囊。在通过输注施用药物时,可以用含有无菌药用级水或盐水的输注瓶分配。当通过注射施用药物组合物时,可以提供无菌注射用水或盐水的安瓿,使得可以在施用之前混合成分。
用于全身施用的药物组合物可以是液体,例如无菌盐水、乳酸林格氏溶液或汉克氏溶液。另外,药物组合物可以是固体形式并在使用前立即重新溶解或悬浮。还考虑了冻干形式。药物组合物可以包含在脂质颗粒或囊泡(如脂质体或微晶)内,其也适用于肠胃外施用。该颗粒可以具有任何合适的结构,如单层或多层,只要其中包含组合物即可。化合物可以被包埋在含有融合脂质二油酰基磷脂酰乙醇胺(DOPE)、低水平(5至10mol%)阳离子脂质的“稳定的质粒-脂质颗粒”(SPLP)中,并通过聚乙二醇(PEG)涂层进行稳定化(Zhang Y.P.等人,Gene Ther.1999,6:1438-47)。带正电荷的脂质如N-[1-(2,3-二油酰氧基)丙基]-N,N,N-三甲基-甲基硫酸铵或“DOTAP”对于此类颗粒和囊泡是特别优选的。此类脂质颗粒的制备是众所周知的。参见,例如,美国专利号4,880,635;4,906,477;4,911,928;4,917,951;4,920,016;和4,921,757;该专利中的每一个都通过引用并入本文。
例如,本文所述的药物组合物可以作为单位剂量施用或包装。当涉及本公开的药物组合物使用时,术语“单位剂量”是指适合作为用于受试者的单位剂量的物理离散单位,每个单位含有经计算可产生与所需的稀释剂(即,载体或载剂)相关的所需治疗效果的预定量的活性物质。
此外,药物组合物可以作为药物试剂盒提供,其包含(a)含有冻干形式的本发明化合物的容器以及(b)含有药学上可接受的稀释剂(例如,用于复溶或稀释本发明的冻干化合物的无菌稀释剂)的第二容器。任选地,与此类容器相关联的可以是呈监管药品或生物制品的制造、使用或销售的政府机构规定的形式的通知,该通知反映了制造、使用或销售机构获得的用于人类施用的批准。
在另一方面,包括含有可用于治疗上述疾病的材料的制品。在一些实施例中,该制品包含容器和标签。合适的容器包含例如瓶子、小瓶、注射器和试管。容器可以由各种材料如玻璃或塑料形成。在一些实施例中,容器容纳有效治疗本文所述疾病的组合物并且可以具有无菌进入端口。例如,容器可以是静脉内溶液袋或具有可被皮下注射针刺穿的塞子的小瓶。组合物中的活性剂是本发明的化合物。在一些实施例中,容器上的标签或与容器相关的标签表明该组合物用于治疗所选择的疾病。制品可以进一步包括第二容器,该第二容器包括药学上可接受的缓冲液,如磷酸盐-缓冲盐水、林格氏溶液或葡萄糖溶液。制品可以进一步包括从商业和用户的观点来看所需的其它材料,包括其它缓冲剂、稀释剂、过滤器、针、注射器和带有使用说明的包装插页。
在一些实施例中,碱基编辑器或碱基编辑器系统(例如,包含本文所述的Cas9或Cas12)作为药物组合物的一部分提供。在一些实施例中,药物组合物包含本文所提供的融合蛋白中的任一者。在一些实施例中,药物组合物包含本文所提供的复合物中的任一者。在一些实施例中,药物组合物包含核糖核蛋白复合物,该核糖核蛋白复合物包含与gRNA和阳离子脂质形成复合物的RNA向导的核酸酶(例如,Cas9)。在一些实施例中,药物组合物包含gRNA、核酸可编程DNA结合蛋白、阳离子脂质和药学上可接受的赋形剂。药物组合物可以任选地包含一种或多种另外的治疗活性物质。
试剂盒
在一方面,本发明提供了包含上述方法和组合物中公开的元件中的任一者或多者的试剂盒。在一些实施例中,试剂盒包含载体系统和使用试剂盒的说明书。在一些实施例中,载体系统包含用于插入向导序列的一个或多个插入位点,其中当表达时,向导序列指导CRISPR复合物与真核细胞中的靶序列进行序列特异性结合,其中CRISPR复合物包含与以下项复合的CRISPR酶:(1)与靶序列杂交的向导序列,以及(2)与tracr序列杂交的序列;和/或(b)第二调节元件,其可操作地连接至包含核定位序列的编码所述CRISPR酶的酶编码序列。元件可以单独地或组合地提供,并且可以在任何合适的容器(如小瓶、瓶子或管)中提供。在一些实施例中,试剂盒包括一种或多种语言的说明书,例如多于一种语言的说明书。
在一些实施例中,试剂盒包含核碱基编辑器。
在一些实施例中,试剂盒包含用于在利用本文所述的一种或多种元件的方法中使用的一种或多种试剂。试剂可以在任何合适的容器中提供。例如,试剂盒可以提供一种或多种反应或储存缓冲液。试剂可以以可用于特定测定的形式提供,或者以需要在使用前加入一种或多种其它组分的形式提供(例如,以浓缩物或冻干形式)。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施例中,缓冲液是碱性的。在一些实施例中,缓冲液的pH为约7至约10。在一些实施例中,试剂盒包含与用于插入到载体中的向导序列对应的一种或多种寡核苷酸,以便可操作地连接向导序列和调节元件。在一些实施例中,试剂盒包含同源重组模板多核苷酸。
本文提及的所有出版物、专利申请、专利和其它参考文献通过引用整体并入本文。另外,材料、方法和实例仅是说明性的并且不旨在进行限制。除非另外定义,否则本文中使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管类似或等效于本文所述的方法和材料的方法和材料可以用于实践或测试本发明,但本文描述了合适的方法和材料。
实例
以下实例描述了制造和实施本发明的优选模式中的一些。然而,应当理解,这些实例仅用于说明性目的,并不意味着限制本发明的范围。
实例1.在原代人肝细胞中使用Cas9进行体外碱基编辑用于肝移植
此实例说明了靶向原代人肝细胞中的示例性MHC I类或II类抗原基因的体外Cas9碱基编辑。
在此实例中,进行碱基编辑以靶向MHC I类或II类抗原基因,以努力减少包含原代肝细胞的同种异体移植物的免疫排斥。
简而言之,将靶向示例性MHC I类或II类抗原基因、B2M和CIITA的剪接位点和/或终止密码子内的特定核苷酸位置的Cas9向导RNA设计为用于引入肝细胞(表1)。
接种后24小时,用含有融合至腺嘌呤碱基编辑器(ABE)或胞苷碱基编辑器(CBE)的Cas9酶和向导RNA(表1)的表达载体转染原代人肝细胞。转染后5天收获细胞并提取总DNA。
进行深度测序以表征原代人肝细胞中的A至G转换或C至T转换。使用两轮PCR扩增示例性靶标,以将Illumina衔接子以及独特的条形码加入到靶标扩增子中。将PCR产物在2%凝胶上运行并提取凝胶。对样品进行汇集、定量,并制备cDNA文库并在MiSeq上进行测序。通过深度测序确定A至G以及C至T转换的百分比,并观察碱基编辑。
表1.靶基因、位点策略和核苷酸定位
此实例中的结果表明,向导RNA和Cas9实现了原代人肝细胞中的B2M和CIITA免疫基因的碱基编辑。
也在人肝细胞的原代培养物中进行了碱基编辑。对于这些研究,评估了碱基编辑器靶向培养的原代人肝细胞(PHH)中的B2M(HLAMHC I类)和/或CIITA(HLA MHC II类)的能力。C-T(BE4)和A-G(ABE)编辑器都经过测试。Cas9核酸酶(SpCas9)也用作编辑对照。对经设计用于破坏B2M基因中以及CIITA基因中的剪接位点的向导RNA与BE4或ABE的组合进行了测试。当与Cas9核酸酶一起使用时,这些向导物也显示出生成插入缺失。对人原代肝细胞进行接种并用含有编码碱基编辑器(或Cas9)的RNA和向导RNA的混合物进行转染(脂质转染)。转染5天后收获细胞,进行基因组DNA提取和NGS分析。
来自这些碱基编辑实验的数据示出在图1A至1B中以及图2A至2B中。图1A示出了用于生成潜在剪接位点的B2M碱基编辑器靶标,以红色表示。图1A也示出了预期剪接位点区域之外的潜在旁观者编辑,以灰色表示。图2A示出了用于生成潜在剪接位点的CIITA碱基编辑器靶标,以红色表示。图2A也示出了预期剪接位点区域之外的潜在旁观者编辑,以灰色表示。
这两项研究的数据均表明B2M基因(图2A)和CIITA基因(图2B)的碱基编辑效果显著。图1B示出了使用BE4碱基编辑器的B2M编辑效率高达55%。即,BE4在BE-4相关位点处产生55%的C至T转换。图1B也示出了使用ABE位点编辑器(ABE7.10)在B2M ABE相关位点处具有最佳编辑功效,其产生35%的A至G转换。Cas9被用作基因破坏的直接比较-碱基编辑在提议的剪接位点处显示出与Cas9生成的插入缺失相当或更好的编辑效率。图2B示出了使用ABE编辑器(ABE8.2m)和BE4来靶向CIITA基因的碱基编辑的结果。结果表明,ABE编辑器的编辑效果显著,A至G的转换为40%,并且BE4的C至T的转换高达50%。与图1B一样,Cas9被用作基因破坏的直接比较-碱基编辑在提议的剪接位点处显示出与Cas9生成的插入缺失相当或更好的编辑效率。
实例2.用于原代人肝细胞中多个免疫基因的碱基编辑的多重向导RNA。
此实例说明了多重基因编辑可靶向多个免疫系统基因并降低用于肝移植的同种异体肝细胞的免疫原性。
由于免疫反应,肝移植会受到移植物排斥。在此实例中,Cas9使用靶向多个免疫系统基因的多重向导RNA进行基因编辑,以减少/消除免疫反应并提高所移植肝细胞的移植物存活。
靶向示例性B2M、CD142和CIITA基因中的多个基因基因座的向导RNA将被克隆到表达载体中,该表达载体从多个启动子中或者从多顺反子转录本中表达多个向导物。这些多重向导RNA将与Cas9酶一起引入肝细胞中。
使用多重向导RNA进行碱基编辑的效率将通过深度测序确定A至G以及C至T转换的百分比来测量。
实例3.用于鉴定免疫系统基因的其它向导RNA的生物信息学筛选
此实例表明了使用生物信息学筛选鉴定出靶向免疫系统基因的其它向导RNA。
使用生物信息学筛选来寻找其它向导RNA,以扩大CRISPR对免疫系统基因的靶向范围。所靶向的示例性免疫系统基因包括MHC I类或II类基因,包括β2微球蛋白(B2M)和II类主要组织相容性复合体反式激活因子(CIITA)。该筛选利用来自酿脓链球菌的Cas9种子序列。使用BLAST的tblastn变体进行生物信息学分析,考虑BLAST命中的e值阈值为1e至6。将进行另外的生物信息学筛选以确定靶向其它示例性免疫系统基因(包括CD142和人白细胞抗原A(HLA-A)和人白细胞抗原B(HLA-B))的向导RNA。
示例性免疫系统基因B2M、CD142、CIITA、HLA-A和HLA-B的向导RNA序列及其PAM示出在表2、3、4、5和6中。示例性间隔序列示出在表2A、3A、4A、5A和6A中。
表2.B2M靶基因的碱基编辑器、PAM序列、向导RNA。
/>
表2A.B2M靶基因的间隔序列。
/>
/>
表3.CD142靶基因的碱基编辑器、PAM序列、向导RNA。
/>
/>
/>
表3A.CD142靶基因的间隔序列。
/>
/>
/>
表4.CIITA靶基因的碱基编辑器、PAM序列、向导RNA。
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
表4A.CIITA靶基因RNA的间隔序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
表5.HLA-A靶基因的碱基编辑器、PAM序列、向导RNA。
/>
表5A.HLA-A靶基因的间隔序列。
/>
/>
表6.HLA-B靶基因的碱基编辑器、PAM序列、向导RNA。
/>
表6A.HLA-B靶基因的间隔序列。
/>
实例4.大规模生产碱基编辑的人肝细胞
此实例说明了碱基编辑的人肝细胞的大规模生产。
将获得冷冻保存的原代肝细胞或可接种/可移植的原代肝细胞。如实例1和2所述,将在肝细胞上进行多重基因编辑。
所产生的修饰的人肝细胞将通过测量A至G以及C至T碱基转换来验证。
修饰的人肝细胞将被引入FRG小鼠中并进行扩增以进行大规模生产。
约2至5亿个细胞将直接从原代人肝细胞培养物中或从FRG小鼠中移植到FRG猪体内。
此实例的结果将生产消除或减少用于肝移植的宿主免疫反应的大规模碱基编辑的人类肝细胞。
实例5.评估肝衰竭和代谢性疾病的FRG小鼠模型中的碱基编辑肝细胞的移植
此实例说明了Fah-/-/Rag2-/-/Il2rg-/-(FRG)小鼠(肝衰竭和代谢性疾病的动物模型)中的移植和碱基编辑肝细胞保留。
通过以约5x 109个噬斑形成单位(pfu/小鼠)的剂量静脉内施用表达尿激酶的腺病毒(uPA病毒)来对FRG小鼠进行预处理。
uPA施用24至48小时后,将脾内注射约一百万个碱基编辑肝细胞,并撤回NTBC。只有当撤回药物2-(2-硝基-4-三氟甲基苯甲酰基)-1,3-环己二酮(NTBC)时,才会出现延胡索酰乙酰乙酸水解酶(Fah)突变小鼠的肝病。FRG小鼠撤回NTBC会导致肝细胞逐渐损伤,除非得到纠正,否则最终会在4至8周后死亡。
将测定FAH酶活性以确定所移植细胞的肝细胞功能。另外,将测定人白蛋白水平,以确认人编辑细胞的存在。将进行组织学/IHC分析以确认移植。
此实例的结果将确定小鼠模型中所移植的碱基编辑肝细胞的移植和保留的体内效率。
实例6.评估FRG猪生物反应器中肝细胞的移植
此实例说明了在FRG猪生物反应器中移植碱基编辑细胞,以大规模生产肝细胞。
在FRG猪生物反应器中获得并扩增肝细胞,克服了由于用于器官移植的供体肝脏供应受限而导致高质量肝细胞供应受限的问题。
为了评估编辑的肝细胞的移植和扩增,将在FRG猪模型中通过门静脉输注来移植WT和碱基编辑肝细胞。
移植后,将不对受体猪使用保护性药物2-(2-硝基-4-三氟甲基苯甲酰基)-1,3-环己二酮(NTBC),为延胡索酰乙酰乙酸水解酶(Fah+)细胞的扩增提供选择性优势。
将在移植后1、3和6个月后评估人白蛋白水平,以确认FRG猪中人编辑细胞的存在。将用肝素化毛细血管收集少量血液。用Tris缓冲盐水稀释后,使用人白蛋白ELISA定量试剂盒测定人白蛋白浓度。肝脏的人源化程度通常与人血白蛋白水平相关,使得1mg/mL与约20%的人肝细胞对应。
还将在第4个月或第6个月时对小鼠肝组织进行免疫组织化学分析,以确认有足够的移植。对FAH或人白蛋白或细胞角蛋白表达进行免疫组织化学分析。
在约12个月结束时,将通过流式细胞术来分离、分类和表征扩增的人肝细胞存在/不存在I类和II类标志物,并使用下一代测序来评估移植后的编辑保留(图1)。
此实例的结果将表明使用FRG猪生物反应器可大规模生产适用于肝移植的碱基编辑后的修饰肝细胞。
实例7.评估原代人肝细胞(PHH)接种方案中的碱基编辑效率
此实例评估了靶向示例性靶基因座(例如,B2M或CIITA)的示例性碱基编辑器(例如,ABE8.8、ABE8.20和BE4)的碱基编辑效率。
简而言之,原代人肝细胞在碱基编辑反应后培养第4天和/或第6天时解离。使用EditR软件使用Sanger测序文件来评估碱基编辑效率,并通过流式细胞术来评估解离PHH的对应的蛋白质敲除,这些操作在编辑反应后培养第4天和/或第6天时进行。
结果显示出B2M在第4天和第6天时间点以及CIITA在第6天时间点的编辑效率(图3A)。B2M蛋白水平KO效率显示为在第6天时间点测定的B2M阴性(B2M-)细胞的百分比(图3B)。
流式细胞术分析HLAII类表达,以评估CIITA的蛋白质水平KO,显示出无论用于靶向CIITA基因座的编辑试剂如何,所使用的PHH基本上是HLA II类阴性(图3B)。
结果表明,在两个基因座处均观察到了高效的编辑,并且通过流式细胞术测定的B2M蛋白KO水平与B2M的编辑效率相关。
总体而言,结果证实ABE8.20和BE4以及ABE8.8编辑试剂可高效降低接种的PHH中的B2M表达,表明了高效的碱基编辑。碱基编辑器在编辑CIITA基因座方面也很有效。
实例8.比较通过核转染和转染将碱基编辑器递送至原代人肝细胞(PHH)的效率
此实例评估了通过核转染与转染在原代人肝细胞(PHH)中递送示例性碱基编辑试剂的效率。
简而言之,将靶向示例性靶基因B2M的碱基编辑器转染或核转染至PHH,并测定DNA和蛋白质水平上的B2M KO效率。使用在PHH解离之前添加的活性/失活染色剂,通过流式细胞术来评估编辑的PHH的细胞活力,以测定解离前的细胞活力。
简而言之,通过核转染(Lonza 4D-Nucleofector)或在图5A中列出的条件下转染,用碱基编辑试剂对PHH进行工程化。
工程化后,培养细胞并在处理后第6天评估DNA和蛋白质水平上的B2M KO以及细胞活力。
如图5B所示,在相同的实验条件(BE4/gRNA 3:1)下,与基于核转染的递送相比,基于转染的递送导致PHH中的B2M基因KO效率明显更高(B2M KO评分:91.5%对60.0%;%B2M-细胞:91.8%对62.2%),并且编辑后细胞活力也更高(%活力:60.3%对49.6%)。
总体而言,结果表明,相对于核转染,通过转染递送至PHH得到提高的碱基编辑效率和更高的编辑后活力。
实例9.评估PHH离体制备方案中的碱基编辑试剂
此实例评估了使用示例性碱基编辑试剂在接种的PHH中编辑靶向基因座的效率,然后将其整合到制备PHH的离体程序中,以用于细胞扩增。
简而言之,如实例8所述,通过转染用碱基编辑试剂对PHH进行工程化。
通过转染来递送靶向B2M基因座的示例性碱基编辑器。B2M基因座处的碱基编辑效率示出在图6中;其中点代表通过流式细胞术测定的B2M-细胞的百分比,并且“HEK2-2”表示所靶向的对照基因座(图6)。
结果表明,使用ABE8.8、ABE8.20和BE4中的每一个都观察到B2M靶基因座处的编辑效率超过80%。通过流式细胞术,在用ABE8.8、ABE8.20或BE4编辑的B2M靶向样品中也观察到相应高百分比的B2M-细胞。
离体程序包括引入转基因,因此,评估了使用示例性编辑试剂根据离体程序编辑B2M基因座并在PHH中引入转基因的双工程的效率。
使用BE4与引入两个示例性转基因中的一个(Tg#1或Tg#2)组合进行B2M基因座处的碱基编辑。示出在图7中的结果表明,在B2M基因座处测定或通过流式细胞术定量B2M-细胞,使用BE4的基因编辑并没有因整合到包括转基因引入的离体程序中而发生很大改变。总体而言,结果表明BE4和转基因的双工程效率很高。
如图8所示,流式细胞术测定结果表明,与仅在B2M处单独修饰的细胞(“BE4B2MOnly”)相比,超过80%同时受到靶向B2M的BE4和Tg#1修饰的细胞(“BE4 B2M+Tg#1”)均为B2M阴性且Tg#1阳性的(“B2M-/Tg#1+”)。使用靶向B2M的BE4和Tg#2进行修饰也能有效生成双工程化细胞。
总体而言,结果表明用BE4和转基因对PHH进行双工程化对于离体制备PHH是有效的。
等同物和范围
本领域中的技术人员仅使用常规实验将认识到或能够确定本文所描述的本发明具体实施例的许多等同物。本发明的范围不旨在限于上述说明,而是如随附权利要求书中所述。

Claims (94)

1.一种生产适用于肝细胞移植的基因修饰的人肝细胞的方法,其包括:通过引入碱基编辑器以及一种或多种与一个或多个I类或II类基因中的靶序列杂交的gRNA,来破坏分离的人肝细胞中或肝细胞祖细胞中的一个或多个主要组织相容性复合体(MHC)I类或II类基因,由此生产基因修饰的人肝细胞。
2.根据权利要求1所述的方法,其中所述碱基编辑器包含融合至脱氨酶中的CRISPR蛋白。
3.根据权利要求1或2所述的方法,其中所述基因修饰的人肝细胞在靶序列中具有一个或多个核碱基编辑。
4.根据权利要求1或2所述的方法,其中所述基因修饰的人肝细胞具有经破坏的靶序列。
5.根据权利要求1所述的方法,其中所述基因修饰的人肝细胞具有降低或消除的同种异体反应性。
6.根据前述权利要求中任一项所述的方法,其中所述I类或II类基因选自B2M、CD142、CIITA、HLA-A或HLA-B基因中的一种或多种。
7.根据权利要求6所述的方法,其中将终止密码子或剪接位点引入到所述B2M、CD142、CIITA、HLA-A或HLA-B基因中的一种或多种中。
8.根据权利要求7所述的方法,其中在B2M基因的核苷酸位置19处引入剪接位点。
9.根据权利要求7所述的方法,其中在B2M基因的核苷酸位置5处引入终止密码子。
10.根据权利要求7所述的方法,其中在CD142基因的核苷酸位置28处引入剪接位点。
11.根据权利要求7所述的方法,其中在CD142基因的核苷酸位置19处引入终止密码子。
12.根据权利要求7所述的方法,其中在CIITA基因的核苷酸位置147处引入剪接位点。
13.根据权利要求7所述的方法,其中在CIITA基因的核苷酸位置130处引入终止密码子。
14.根据前述权利要求中任一项所述的方法,其中所述CRISPR蛋白是Cas9或Cas12。
15.根据前述权利要求中任一项所述的方法,其中所述Cas9来自酿脓链球菌(SpCas9)或金黄色葡萄球菌(SaCas9)。
16.根据权利要求15所述的Cas9蛋白,其中所述Cas9蛋白是超精确Cas9。
17.根据权利要求15所述的Cas9蛋白,其中所述Cas9蛋白包含参考SpyCas9(SEQ IDNO:68)与N692A、M694A、Q695A和/或H698A对应的突变。
18.根据权利要求15所述的Cas9蛋白,其中所述Cas9蛋白是高保真Cas9。
19.根据权利要求15所述的Cas9蛋白,其中所述Cas9蛋白包含参考SpyCas9(SEQ IDNO:68)与N467A、R661A、Q695A和/或Q926A对应的突变。
20.根据权利要求15所述的Cas9蛋白,其中所述Cas9蛋白是SuperFi-Cas9。
21.根据权利要求15所述的Cas9蛋白,其中与SpyCas9(SEQ ID NO:68)对应的Y1016、R1019、Y1010、Y1013、K1031、Q1027和/或V1018残基突变为天冬氨酸。
22.根据权利要求2至15中任一项所述的方法,其中所述CRISPR蛋白融合至腺嘌呤碱基编辑器(ABE)、胞苷碱基编辑器(CBE)或肌苷碱基编辑器(IBE)。
23.根据权利要求22所述的方法,其中所述CRISPR融合至包含腺嘌呤或腺苷脱氨酶结构域或者胞苷或胞嘧啶脱氨酶结构域的碱基编辑器。
24.根据权利要求22所述的方法,其中所述CRISPR融合至包含腺嘌呤或腺苷脱氨酶结构域以及胞苷或胞嘧啶脱氨酶结构域的碱基编辑器。
25.根据权利要求22至24中任一项所述的方法,其中所述CRISPR蛋白包含核定位序列(NLS)和/或FLAG、HIS或HA标签。
26.根据权利要求22至25中任一项所述的方法,其中所述CRISPR蛋白包含SEQ ID NO:1(SpCas9)、SEQ ID NO:2(SaCas9)或SEQ ID NO:3(Cas12)中的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少10个突变。
27.根据权利要求26所述的方法,其中所述突变是氨基酸取代。
28.根据权利要求26或27中任一项所述的方法,其中所述至少一个突变产生核酸酶失活的Cas9(dCas9)。
29.根据权利要求28所述的方法,其中所述至少一个突变是Cas9的RuvC结构域和/或HNH结构域中的一个或多个氨基酸取代。
30.根据权利要求29所述的方法,其中所述至少一个突变是SpCas9的氨基酸10处的天冬氨酸到丙氨酸的取代(D10A),或其在Cas9蛋白中的对应突变。
31.根据权利要求29所述的方法,其中所述至少一个突变是SpCas9的氨基酸840处的组氨酸到丙氨酸的取代(H840A),或其在Cas9蛋白中的对应突变。
32.根据前述权利要求中任一项所述的方法,其中所述Cas9蛋白具有切口酶活性。
33.根据前述权利要求中任一项所述的方法,其中所述CRISPR蛋白融合至腺苷脱氨酶并且具有与SEQ ID NO:65至少80%相同的氨基酸序列。
34.根据权利要求22至32中任一项所述的方法,其中所述CRISPR蛋白融合至胞嘧啶脱氨酶中并且具有与SEQ ID NO:4至64至少80%相同的氨基酸序列。
35.根据权利要求22至34中任一项所述的方法,其中所述SpCas9蛋白识别包含5'-NGG-3'、5'-NGA-3'或5'-NGC-3'的PAM序列。
36.根据权利要求22至34中任一项所述的方法,其中所述SaCas9蛋白识别包含5'-NNNRRT-3'或5'-NNGRRT-3'的PAM序列。
37.根据权利要求14和22至34中任一项所述的方法,其中所述Cas12蛋白识别包含5'-RTTN-3'的PAM序列。
38.根据前述权利要求中任一项所述的方法,其中所述分离的人肝细胞已经在先前冷冻保存并随后解冻。
39.根据权利要求22至38中任一项所述的方法,其中与非基因修饰的人肝细胞相比,所述基因修饰的人肝细胞过表达CD47和/或CD142。
40.根据前述权利要求中任一项所述的方法,其中将所述基因修饰的人肝细胞移植到人源化动物模型中以用于扩增。
41.根据权利要求40所述的方法,其中所述人源化动物模型是FRG猪、FRG小鼠或FRG大鼠。
42.根据权利要求40或41所述的方法,其中首先将所述基因修饰的人肝细胞移植到所述FRG小鼠或FRG大鼠中以用于初始细胞扩增。
43.根据权利要求42所述的方法,其中在所述初始细胞扩增之后,将基因修饰细胞随后移植到所述FRG猪中以用于进一步的细胞扩增。
44.根据权利要求42或43所述的方法,其中初始扩增的细胞或进一步扩增的细胞是从动物中分离出来的。
45.根据权利要求44所述的方法,其中所述初始扩增的细胞或所述进一步扩增的细胞是通过荧光激活细胞分选、免疫磁性细胞分离、密度梯度离心和/或免疫密度细胞分离来分离的。
46.根据权利要求1至45中任一项所述的方法,其中所述基因修饰的人肝细胞具有一个、两个、三个或更多个核碱基编辑。
47.根据权利要求46所述的方法,其中单个碱基编辑器与一个以上的向导物组合产生所述两个、三个或更多个核碱基编辑。
48.根据权利要求46所述的方法,其中一个以上的碱基编辑器产生所述一个、两个、三个或更多个核碱基编辑。
49.根据前述权利要求中任一项所述的方法,其中与非基因修饰的人肝细胞相比,所述基因修饰的人肝细胞过表达CD47和/或CD142。
50.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述B2M基因的向导RNA,其中表2中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
51.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述CD142基因的向导RNA,其中表3中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
52.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述CIITA基因的向导RNA,其中表4中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
53.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述HLA-A基因的向导RNA,其中表5中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
54.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述HLA-B基因的向导RNA,其中表6中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
55.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述B2M基因的向导RNA,其中表2A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
56.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述CD142基因的向导RNA,其中表3A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
57.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述CIITA基因的向导RNA,其中表4A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
58.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述HLA-A基因的向导RNA,其中表5A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
59.根据前述权利要求中任一项所述的方法,其中所述方法包含碱基编辑器和一种或多种靶向所述HLA-B基因的向导RNA,其中表6A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
60.一种核酸,其编码根据前述权利要求中任一项所述碱基编辑器和一种或多种与靶序列杂交的gRNA。
61.根据权利要求60所述的核酸,其中所述核酸经过密码子优化以用于在哺乳动物细胞中表达。
62.根据权利要求60所述的核酸,其中所述核酸经过密码子优化以用于在人类细胞中表达。
63.一种载体,其编码根据权利要求60至62中任一项所述的核酸。
64.一种真核细胞,其包含所述碱基编辑器和一种或多种与靶序列杂交的包含表2A至6A中列出的序列中的任一者或表2至6中列出的原间隔序列中的任一者的RNA版本的gRNA。
65.根据权利要求64所述的真核细胞,其中所述细胞是人细胞。
66.根据权利要求65所述的真核细胞,其中所述人细胞是肝细胞。
67.一种治疗肝病的方法,所述方法包括向有此需要的受试者施用根据权利要求1至15和22至59中任一项所生产的基因修饰的人肝细胞。
68.根据权利要求67所述的方法,其中将所述基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。
69.根据权利要求67所述的方法,其中将约100至150亿个基因修饰的人肝细胞注射到有此需要的受试者的门静脉中。
70.一种碱基编辑器和一种或多种靶向B2M基因的向导RNA,其中表2中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
71.一种碱基编辑器和一种或多种靶向CD142基因的向导RNA,其中表3中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
72.一种碱基编辑器和一种或多种靶向CIITA基因的向导RNA,其中表4中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
73.一种碱基编辑器和一种或多种靶向HLA-A基因的向导RNA,其中表5中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
74.一种碱基编辑器和一种或多种靶向HLA-B基因的向导RNA,其中表6中列出的所述碱基编辑器和对应的一种或多种包含原间隔序列中的任一者的RNA版本的向导RNA被选择。
75.所述碱基编辑器和一种或多种包含表2A至6A中列出的序列中的任一者或表2至6中列出的原间隔序列中的任一者的RNA版本的向导RNA,其中对靶基因进行了一个、两个、三个或三个以上的编辑。
76.一种向导RNA,其包含表2中列出的原间隔序列中的任一者的RNA版本。
77.一种向导RNA,其包含表3中列出的原间隔序列中的任一者的RNA版本。
78.一种向导RNA,其包含表4中列出的原间隔序列中的任一者的RNA版本。
79.一种向导RNA,其包含表5中列出的原间隔序列中的任一者的RNA版本。
80.一种向导RNA,其包含表6中列出的原间隔序列中的任一者的RNA版本。
81.一种向导RNA,其包含表2A中列出的序列中的任一者。
82.一种向导RNA,其包含表3A中列出的序列中的任一者。
83.一种向导RNA,其包含表4A中列出的序列中的任一者。
84.一种向导RNA,其包含表5A中列出的序列中的任一者。
85.一种向导RNA,其包含表6A中列出的序列中的任一者。
86.一种碱基编辑器和一种或多种靶向B2M基因的向导RNA,其中表2A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
87.一种碱基编辑器和一种或多种靶向CD142基因的向导RNA,其中表3A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
88.一种碱基编辑器和一种或多种靶向CIITA基因的向导RNA,其中表4A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
89.一种碱基编辑器和一种或多种靶向HLA-A基因的向导RNA,其中表5A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
90.一种碱基编辑器和一种或多种靶向HLA-B基因的向导RNA,其中表6A中列出的所述碱基编辑器和对应的一种或多种包含序列中的任一者的向导RNA被选择。
91.一种细胞,其包含碱基编辑器和一种或多种包含表2A-6A中列出的序列中的任一者或表2-6中列出的原间隔序列中的任一者的RNA版本的向导RNA。
92.一种基因修饰的人肝细胞,其具有根据权利要求1至15和22至59中任一项所述的方法的MHC基因中的一个或多个编辑。
93.根据权利要求90所述的基因修饰的人肝细胞,其中所述MHC基因选自B2M、CD142、CIITA、HLA-A和/或HLA-B。
94.根据权利要求91所述的基因修饰的人肝细胞,其中与非基因修饰的人肝细胞相比,对B2M、CD142、CIITA、HLA-A和/或HLA-B基因中的一种或多种的编辑,引起所述B2M、CD142、CIITA、HLA-A和/或HLA-B基因的表达增加。
CN202280042878.4A 2021-04-16 2022-04-15 肝细胞的基因修饰 Pending CN117580942A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163176104P 2021-04-16 2021-04-16
US63/176,104 2021-04-16
PCT/US2022/025078 WO2022221699A1 (en) 2021-04-16 2022-04-15 Genetic modification of hepatocytes

Publications (1)

Publication Number Publication Date
CN117580942A true CN117580942A (zh) 2024-02-20

Family

ID=81585615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280042878.4A Pending CN117580942A (zh) 2021-04-16 2022-04-15 肝细胞的基因修饰

Country Status (7)

Country Link
EP (1) EP4323501A1 (zh)
JP (1) JP2024514649A (zh)
KR (1) KR20240007651A (zh)
CN (1) CN117580942A (zh)
AU (1) AU2022256513A1 (zh)
CA (1) CA3215435A1 (zh)
WO (1) WO2022221699A1 (zh)

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4880635B1 (en) 1984-08-08 1996-07-02 Liposome Company Dehydrated liposomes
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
JPH0825869B2 (ja) 1987-02-09 1996-03-13 株式会社ビタミン研究所 抗腫瘍剤包埋リポソ−ム製剤
US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5846946A (en) 1996-06-14 1998-12-08 Pasteur Merieux Serums Et Vaccins Compositions and methods for administering Borrelia DNA
EP2397490B1 (en) 2004-07-16 2013-09-04 THE UNITED STATES OF AMERICA, represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES Vaccine constructs and combinations of vaccines designed to improve the breadth of the immune response to diverse strains and clades of HIV
CN101970051A (zh) 2007-12-31 2011-02-09 纳诺科尔治疗公司 用于治疗心力衰竭的rna干扰
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
ES2728782T3 (es) 2012-05-25 2019-10-28 Univ California Métodos y composiciones para la modificación de ADN objetivo dirigida por ARN y para la modulación de la transcripción dirigida por ARN
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP4286404A3 (en) 2012-12-12 2024-02-14 The Broad Institute Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
ES2576128T3 (es) 2012-12-12 2016-07-05 The Broad Institute, Inc. Modificación por tecnología genética y optimización de sistemas, métodos y composiciones para la manipulación de secuencias con dominios funcionales
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3436575A1 (en) 2015-06-18 2019-02-06 The Broad Institute Inc. Novel crispr enzymes and systems
CN105139759B (zh) 2015-09-18 2017-10-10 京东方科技集团股份有限公司 一种拼接屏
JP7067793B2 (ja) 2015-10-23 2022-05-16 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸塩基編集因子およびその使用
WO2018007871A1 (en) * 2016-07-08 2018-01-11 Crispr Therapeutics Ag Materials and methods for treatment of transthyretin amyloidosis
JP7231935B2 (ja) 2016-08-03 2023-03-08 プレジデント アンド フェローズ オブ ハーバード カレッジ アデノシン核酸塩基編集因子およびそれらの使用
JP2022532174A (ja) * 2019-05-10 2022-07-13 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 修飾多能性細胞
US11116797B2 (en) * 2019-09-05 2021-09-14 Crispr Therapeutics Ag Universal donor cells

Also Published As

Publication number Publication date
CA3215435A1 (en) 2022-10-20
EP4323501A1 (en) 2024-02-21
JP2024514649A (ja) 2024-04-02
AU2022256513A1 (en) 2023-11-02
WO2022221699A1 (en) 2022-10-20
KR20240007651A (ko) 2024-01-16

Similar Documents

Publication Publication Date Title
AU2016381313B2 (en) Compositions and methods for the treatment of hemoglobinopathies
WO2018170184A1 (en) Systems and methods for the treatment of hemoglobinopathies
US20230242884A1 (en) Compositions and methods for engraftment of base edited cells
JP2023504264A (ja) 合成ガイドrna、組成物、方法、およびそれらの使用
US20200032251A1 (en) Stem loop rna mediated transport of mitochondria genome editing molecules (endonucleases) into the mitochondria
US20230279373A1 (en) Novel crispr enzymes, methods, systems and uses thereof
US20200338213A1 (en) Systems and methods for treating hyper-igm syndrome
EP3707266A1 (en) Targeted integration systems and methods for the treatment of hemoglobinopathies
US20240167008A1 (en) Novel crispr enzymes, methods, systems and uses thereof
KR20230136188A (ko) 유전적으로 변형된 간세포 집단
CN117580942A (zh) 肝细胞的基因修饰
WO2023114953A2 (en) Novel crispr enzymes, methods, systems and uses thereof
US20220228142A1 (en) Compositions and methods for editing beta-globin for treatment of hemaglobinopathies
KR20240037299A (ko) Crispr/cas 편집 시스템용 가이드 rna
CN117916373A (zh) 用于crispr/cas编辑系统的引导rna
WO2023196772A1 (en) Novel rna base editing compositions, systems, methods and uses thereof
JP2023545497A (ja) グリコーゲン貯蔵症1a型を治療するための組成物及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination