CN116685349A - 抗自相残杀的修饰的免疫细胞及其使用方法 - Google Patents

抗自相残杀的修饰的免疫细胞及其使用方法 Download PDF

Info

Publication number
CN116685349A
CN116685349A CN202180078866.2A CN202180078866A CN116685349A CN 116685349 A CN116685349 A CN 116685349A CN 202180078866 A CN202180078866 A CN 202180078866A CN 116685349 A CN116685349 A CN 116685349A
Authority
CN
China
Prior art keywords
cell
gene sequence
modified
seq
immune cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180078866.2A
Other languages
English (en)
Inventor
杰森·盖尔克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bim Medical Co ltd
Original Assignee
Bim Medical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bim Medical Co ltd filed Critical Bim Medical Co ltd
Publication of CN116685349A publication Critical patent/CN116685349A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • C07K16/2806Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against CD2
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4611T-cells, e.g. tumor infiltrating lymphocytes [TIL], lymphokine-activated killer cells [LAK] or regulatory T cells [Treg]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4631Chimeric Antigen Receptors [CAR]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464402Receptors, cell surface antigens or cell surface determinants
    • A61K39/464429Molecules with a "CD" designation not provided for elsewhere
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70507CD2
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70521CD28, CD152
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0646Natural killers cells [NK], NKT cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2239/00Indexing codes associated with cellular immunotherapy of group A61K39/46
    • A61K2239/27Indexing codes associated with cellular immunotherapy of group A61K39/46 characterized by targeting or presenting multiple antigens
    • A61K2239/28Expressing multiple CARs, TCRs or antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2239/00Indexing codes associated with cellular immunotherapy of group A61K39/46
    • A61K2239/46Indexing codes associated with cellular immunotherapy of group A61K39/46 characterised by the cancer treated
    • A61K2239/48Blood cells, e.g. leukemia or lymphoma
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/33Fusion polypeptide fusions for targeting to specific cell types, e.g. tissue specific targeting, targeting of a bacterial subspecies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Biotechnology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • General Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oncology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明的特征在于具有增强的抗肿瘤活性的抗自相残杀的修饰的免疫细胞(例如,T细胞或NK细胞)以及用于产生和使用所述细胞的方法。还提供了使用抗自相残杀的修饰的免疫细胞来治疗瘤形成(例如,T细胞或NK细胞恶性肿瘤)的方法。

Description

抗自相残杀的修饰的免疫细胞及其使用方法
相关申请的交叉引用
本申请要求2020年9月25日提交的美国临时申请号63/083,540的优先权,所述申请的全部内容特此通过引用整体并入。
序列表
本申请含有序列表,所述序列表已经以ASCII格式以电子方式提交,并且特此通过引用整体并入。所述ASCII副本创建于2021年9月24日,名称为180802-045001PCT_SL.txt,并且大小为2,266,391字节。
背景技术
自体和同种异体免疫疗法是肿瘤治疗方法,其中将表达嵌合抗原受体的免疫细胞施用至受试者。为了生成表达嵌合抗原受体(CAR)的免疫细胞,首先从受试者(自体)或者从分离自接受治疗的受试者的供体(同种异体)收集免疫细胞,并且进行遗传修饰以表达嵌合抗原受体。所得细胞(例如,CAR T细胞)在其细胞表面上表达嵌合抗原受体,并且在施用于受试者后,嵌合抗原受体结合肿瘤细胞表达的标志物。这种与肿瘤标志物的相互作用激活CAR-T细胞,然后CAR-T细胞杀死肿瘤细胞。但为了使自体或同种异体细胞疗法有效且高效,必须克服或避免相当数量的条件和细胞反应。靶抗原在肿瘤细胞和健康免疫细胞上的共同表达可能会提供额外的挑战,诸如T细胞自相残杀。编辑参与此过程的基因可以增强CAR-T细胞的功能并且产生对自相残杀的抗性,但目前用于进行此类编辑的方法有可能在CAR-T细胞中诱导大规模的基因组重排,从而对其功效产生负面影响。因此,迫切需要更精确地修饰免疫细胞,尤其是CAR-T细胞的技术。本申请针对此需求和其他重要需求。
发明内容
如下文所述,本发明的特征在于具有增强的抗肿瘤活性和自相残杀抗性的遗传修饰的免疫细胞(例如,T细胞或NK细胞)。本发明的特征还在于用于产生和使用这些修饰的免疫细胞的方法。还提供了使用抗自相残杀的修饰的免疫细胞来治疗瘤形成(例如,T细胞或NK细胞恶性肿瘤)的方法。
在一个方面,本发明提供了包含抗CD2结合结构域和CD2信号传导结构域的嵌合抗原受体(CAR)。在一些实施方案中,CAR还包括跨膜结构域和一个或多个额外的信号传导结构域。在一些实施方案中,跨膜结构域是CD8α跨膜结构域。在一些实施方案中,一个或多个额外的信号传导结构域选自CD3ζ信号传导结构域、CD28信号传导结构域和CD137(4-1BB)信号传导结构域。在一些实施方案中,一个或多个额外的信号传导结构域是CD3ζ信号传导结构域。
在另一个方面,本发明提供了嵌合抗原受体(CAR),其包含抗C D2结合结构域;CD8α跨膜结构域;CD2信号传导结构域和/或CD28信号传导结构域;和CD3ζ信号传导结构域。在一些实施方案中,CD2信号传导结构域被CD28信号传导结构域替换。在一些实施方案中,CAR还包括CD28信号传导结构域和/或CD137(4-1BB)信号传导结构域。在一些实施方案中,CAR还包括前导肽序列。在一些实施方案中,前导肽序列与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:METDTLLLWVLL LWVPGSTG。在一些实施方案中,CD2信号传导结构域与CD2细胞质结构域具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性。在一些实施方案中,CD2细胞质结构域与人CD2细胞质结构域的残基235-351具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性。在一些实施方案中,CD2信号传导结构域与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
TKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSN(SEQ ID NO:370)。在一些实施方案中,CD8α跨膜结构域与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
SDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYC(SEQ ID NO:371)。在一些实施方案中,CD3ζ信号传导结构域与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:RVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:372)。在一些实施方案中,CD28信号传导结构域与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
RSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS(SEQ ID NO:373)。在一些实施方案中,CD137(4-1BB)信号传导结构域与以下氨基酸序列之一具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
KRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL(SEQ ID NO:374);或
RFSVVKRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL(SEQ ID NO:375)。
在一些实施方案中,抗CD2结合结构域包含scFv轻链序列,所述序列与以下氨基酸序列之一具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:376);
EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:377);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378);
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:379);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378);或
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:380)。
在一些实施方案中,抗CD2结合结构域包含scFv重链序列,所述序列与以下氨基酸序列之一具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:377)
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:376);
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:379);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378);
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:380);和DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378)。
在一些实施方案中,CAR还包括接头。在一些实施方案中,接头将scFv轻链序列连接至抗CD2结合结构域的scFv重链序列。在一些实施方案中,接头包含序列(GGGGS)n(SEQID NO:247),其中n是1至10的整数。在一些实施方案中,接头包含序列(GGGGS)3(SEQ IDNO:381)。
在一些实施方案中,抗CD2结合结构域包含抗CD2scFv,所述抗CD2scFv与以下氨基酸序列之一具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKGGGGSGGGGSGGGGSEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:382);
EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:383);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:384);
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:385);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:386);或
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:387)。
在一些实施方案中,CAR与以下序列中的任一者的氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
METDTLLLWVLLLWVPGSTGDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKGGGGSGGGGSGGGGSEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:754);
METDTLLLWVLLLWVPGSTGEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:755);
METDTLLLWVLLLWVPGSTGDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:756);
METDTLLLWVLLLWVPGSTGQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:757);
METDTLLLWVLLLWVPGSTGDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQID NO:758);
METDTLLLWVLLLWVPGSTGQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:759);
METDTLLLWVLLLWVPGSTGDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKGGGGSGGGGSGGGGSEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:761);
METDTLLLWVLLLWVPGSTGEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:762);
METDTLLLWVLLLWVPGSTGDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:763);
METDTLLLWVLLLWVPGSTGQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPRv(SEQ ID NO:764);
METDTLLLWVLLLWVPGSTGDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:765);和
METDTLLLWVLLLWVPGSTGQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:766)。
在另一个方面,本发明提供了修饰的免疫细胞,其包含:如本文所提供的任何嵌合抗原受体;和所述修饰的免疫细胞的基因组中的一个或多个突变,所述突变使修饰的免疫细胞的内源CD2基因失活。在一些实施方案中,修饰的免疫细胞还包括至少一个额外的基因序列或其调控元件中的一个或多个突变。在一些实施方案中,一个或多个突变是至少一个单一靶标核碱基修饰。在一些实施方案中,至少一个单一靶标核碱基修饰由一个或多个碱基编辑器生成。在一些实施方案中,一个或多个碱基编辑器是CBE和/或ABE。在一些实施方案中,与没有修饰的对照细胞相比,单一靶标核碱基修饰减少或消除表达和/或功能。在一些实施方案中,与没有修饰的对照细胞相比,表达和/或功能减少至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在一些实施方案中,至少一个额外的基因序列包含检查点抑制基因序列、免疫反应调控基因序列和/或免疫原性基因序列。在一些实施方案中,至少一个额外的基因序列包含检查点抑制基因序列。在一些实施方案中,检查点抑制基因序列包含PDCD1/PD-1基因序列。在一些实施方案中,至少一个额外的基因序列包含TRAC基因序列。在一些实施方案中,至少一个额外的基因序列包含T细胞标志物基因序列。在一些实施方案中,至少一个额外的基因序列包含CD52基因序列。在一些实施方案中,至少一个额外的基因序列包含TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列。
在又另一个方面,本发明提供了修饰的免疫细胞,其包含:如本文所提供的任何嵌合抗原受体;和修饰的免疫细胞中的CD2基因序列、TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列或其调控元件中的每一个中的使基因序列中的每一个的表达失活的至少一个单一靶标核碱基修饰。在一些实施方案中,与没有修饰的相同类型的对照细胞相比,修饰的免疫细胞表现出自相残杀抗性和增加的抗肿瘤活性。在一些实施方案中,对免疫细胞进行离体修饰。在一些实施方案中,修饰的免疫细胞不包含可检测的易位。在一些实施方案中,免疫细胞包含少于1%的插入缺失。在一些实施方案中,免疫细胞包含少于5%的非靶标编辑。在一些实施方案中,免疫细胞包含少于5%的脱靶编辑。在一些实施方案中,至少一个单一靶标核碱基修饰在外显子中。在一些实施方案中,至少一个单一靶标核碱基修饰在CD2基因序列的外显子2、外显子3、外显子4或外显子5内。在一些实施方案中,至少一个单一靶标核碱基修饰引入提前终止密码子。在一些实施方案中,至少一个单一靶标核碱基修饰在CD2基因序列的外显子2、外显子3、外显子4或外显子5内引入提前终止密码子。在一些实施方案中,至少一个单一靶标核碱基修饰在剪接供体位点或剪接受体位点中。在一些实施方案中,至少一个单一靶标核碱基修饰在CD2基因序列的外显子3剪接供体位点中。在一些实施方案中,至少一个单一靶标核碱基修饰由一个或多个碱基编辑器生成。在一些实施方案中,一个或多个碱基编辑器是CBE和/或ABE。在一些实施方案中,免疫细胞是哺乳动物细胞。在一些实施方案中,免疫细胞是人细胞。在一些实施方案中,免疫细胞是细胞毒性T细胞、调节性T细胞、辅助T细胞、树突状细胞、B细胞或NK细胞。在一些实施方案中,免疫细胞来源于单个人供体。在一些实施方案中,免疫细胞从健康受试者获得。
在一个方面,本发明提供了修饰的免疫细胞群,其中多个细胞群包含如本文所提供的任何修饰的免疫细胞。
在另一个方面,本发明提供了修饰的免疫细胞群,其中多个细胞群包含:a.如本文所提供的任何嵌合抗原受体;和b.修饰的免疫细胞的基因组中的一个或多个突变,所述突变使修饰的免疫细胞的内源CD2基因失活。在一些实施方案中,修饰的免疫细胞群还包括至少一个额外的基因序列或其调控元件中的一个或多个突变。在一些实施方案中,一个或多个突变是至少一个单一靶标核碱基修饰。在一些实施方案中,与没有修饰的对照细胞相比,至少一个单一靶标核碱基修饰减少或消除表达和/或功能。在一些实施方案中,修饰的免疫细胞群的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%中的表达和/或功能减少。在一些实施方案中,修饰的免疫细胞群的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%包含一种或多种突变。在一些实施方案中,至少一个额外的基因序列包含检查点抑制基因序列、免疫反应调控基因序列和/或免疫原性基因序列。在一些实施方案中,至少一个额外的基因序列包含检查点抑制基因序列。在一些实施方案中,检查点抑制基因序列包含PDCD1/PD-1基因序列。在一些实施方案中,至少一个额外的基因序列包含TRAC基因序列。在一些实施方案中,至少一个额外的基因序列包含T细胞标志物基因序列。在一些实施方案中,至少一个额外的基因序列包含CD52基因序列。在一些实施方案中,至少一个额外的基因序列包含TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列。
在又另一个方面,本发明提供了修饰的免疫细胞群,其包含:如本文所提供的任何嵌合抗原受体;和修饰的免疫细胞群中的CD2基因序列、TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列或其调控元件中的每一个中的使基因序列中的每一个的表达失活的至少一个单一靶标核碱基修饰。在一些实施方案中,与没有修饰的相同类型的对照细胞群相比,修饰的免疫细胞群表现出自相残杀抗性和增加的抗肿瘤活性。在一些实施方案中,对免疫细胞群进行离体修饰。在一些实施方案中,修饰的免疫细胞群不包含可检测的易位。在一些实施方案中,修饰的免疫细胞群包含少于1%的插入缺失。在一些实施方案中,修饰的免疫细胞群包含少于5%的非靶标编辑。
在一些实施方案中,修饰的免疫细胞群包含少于5%的脱靶编辑。在一些实施方案中,至少一个单一靶标核碱基修饰在外显子中。在一些实施方案中,至少一个单一靶标核碱基修饰在CD2基因序列的外显子2、外显子3、外显子4或外显子5内。在一些实施方案中,至少一个单一靶标核碱基修饰引入提前终止密码子。在一些实施方案中,至少一个单一靶标核碱基修饰在CD2基因序列的外显子2、外显子3、外显子4或外显子5内引入提前终止密码子。在一些实施方案中,至少一个单一靶标核碱基修饰在剪接供体位点或剪接受体位点中。在一些实施方案中,至少一个单一靶标核碱基修饰在CD2基因序列的外显子3剪接供体位点中。在一些实施方案中,至少一个单一靶标核碱基修饰由一个或多个碱基编辑器生成。在一些实施方案中,一个或多个碱基编辑器是CBE和/或ABE。在一些实施方案中,修饰的免疫细胞群的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%包含至少一个单一靶标核碱基修饰。
在一些实施方案中,免疫细胞是哺乳动物细胞。在一些实施方案中,免疫细胞是人细胞。在一些实施方案中,免疫细胞是细胞毒性T细胞、调节性T细胞、辅助T细胞、树突状细胞、B细胞或NK细胞。在一些实施方案中,免疫细胞来源于单个人供体。在一些实施方案中,免疫细胞从健康受试者获得。
在一个方面,本发明提供了一种用于富集如本文所提供的任何修饰的免疫细胞群的方法。在一些实施方案中,方法包括从修饰的免疫细胞群中去除:a)不具有失活的CD2基因的细胞;和/或b)表达α/βT细胞受体(TCRαβ)的细胞。在一些实施方案中,通过向修饰的免疫细胞群施用抗CD2 CAR来去除CD2+细胞。在一些实施方案中,使用TCRαβ消耗柱来去除TCRαβ+细胞。
在另一个方面,本发明提供了一种用于产生抗自相残杀的修饰的免疫细胞的方法。在一些实施方案中,方法包括:i)在修饰的免疫细胞的基因组中生成一个或多个突变,所述突变使修饰的免疫细胞的内源CD2基因失活;ii)在修饰的免疫细胞中表达如本文所提供的任何嵌合抗原受体(CAR)。
在又另一个方面,本发明提供了一种用于产生抗自相残杀的修饰的免疫细胞群的方法。在一些实施方案中,方法包括:i)在修饰的免疫细胞群的基因组中生成一个或多个突变,所述突变使修饰的免疫细胞群的内源CD2基因失活;ii)在修饰的免疫细胞群中表达如本文所提供的任何嵌合抗原受体(CAR)。在一些实施方案中,方法还包括至少一个额外的基因序列或其调控元件中的一个或多个突变。在一些实施方案中,一个或多个突变是至少一个单一靶标核碱基修饰。在一些实施方案中,至少一个单一靶标核碱基修饰由一个或多个碱基编辑器生成。在一些实施方案中,一个或多个碱基编辑器是CBE和/或ABE。
在一些实施方案中,与没有修饰的对照细胞相比,单一靶标核碱基修饰减少或消除表达和/或功能。在一些实施方案中,与没有修饰的对照细胞相比,表达和/或功能减少至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在一些实施方案中,修饰的免疫细胞群的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%中的表达和/或功能减少。在一些实施方案中,至少一个额外的基因序列包含检查点抑制基因序列、免疫反应调控基因序列和/或免疫原性基因序列。在一些实施方案中,至少一个额外的基因序列包含检查点抑制基因序列。在一些实施方案中,检查点抑制基因序列包含PDCD1/PD-1基因序列。在一些实施方案中,至少一个额外的基因序列包含TRAC基因序列。在一些实施方案中,至少一个额外的基因序列包含T细胞标志物基因序列。在一些实施方案中,至少一个额外的基因序列包含CD52基因序列。在一些实施方案中,至少一个额外的基因序列包含TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列。
在一个方面,本发明提供了一种用于产生抗自相残杀的修饰的免疫细胞的方法。在一些实施方案中,方法包括:i)在修饰的免疫细胞的基因组中生成一个或多个突变,所述突变使修饰的免疫细胞的内源CD2基因序列、内源TRAC基因、内源PDCD1/PD-1基因、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或内源CD52基因中的每一个失活;和ii)在修饰的免疫细胞中表达如本文所提供的任何嵌合抗原受体(CAR)。
在另一个方面,本发明提供了一种用于产生抗自相残杀的修饰的免疫细胞群的方法。在一些实施方案中,方法包括:i)在修饰的免疫细胞群的基因组中生成一个或多个突变,所述突变使修饰的免疫细胞群的内源CD2基因序列、内源TRAC基因、内源PDCD1/PD-1基因、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或内源CD52基因失活;和ii)在修饰的免疫细胞群中表达如本文所提供的任何嵌合抗原受体(CAR)。
在一些实施方案中,与没有修饰的相同类型的对照细胞相比,修饰的免疫细胞表现出自相残杀抗性和增加的抗肿瘤活性。在一些实施方案中,对免疫细胞进行离体修饰。在一些实施方案中,修饰的免疫细胞不包含可检测的易位。在一些实施方案中,免疫细胞包含少于1%的插入缺失。在一些实施方案中,免疫细胞包含少于5%的非靶标编辑。在一些实施方案中,免疫细胞包含少于5%的脱靶编辑。在一些实施方案中,单一靶标核碱基修饰在外显子中。在一些实施方案中,单一靶标核碱基修饰在CD2基因序列的外显子2、外显子3、外显子4或外显子5内。在一些实施方案中,单一靶标核碱基修饰引入提前终止密码子。在一些实施方案中,单一靶标核碱基修饰在CD2基因序列的外显子2、外显子3、外显子4或外显子5内引入提前终止密码子。在一些实施方案中,单一靶标核碱基修饰在剪接供体位点或剪接受体位点中。在一些实施方案中,单一靶标核碱基修饰在CD2基因序列的外显子3剪接供体位点中。在一些实施方案中,CAR经由病毒转导在免疫细胞中表达。在一些实施方案中,CAR经由慢病毒转导在免疫细胞中表达。
在一些实施方案中,生成一个或多个突变的步骤包括使至少一个单一靶标核碱基脱氨基。在一些实施方案中,通过包含脱氨酶的多肽执行脱氨基。在一些实施方案中,脱氨酶与核酸可编程DNA结合蛋白(napDNAbp)缔合形成碱基编辑器。在一些实施方案中,碱基编辑器是CBE和/或ABE。在一些实施方案中,脱氨酶与核酸可编程DNA结合蛋白(napDNAbp)融合。在一些实施方案中,napDNAbp包含Cas9多肽或其部分。在一些实施方案中,napDNAbp包含Cas9切口酶或核酸酶死亡Cas9。在一些实施方案中,napDNAbp包含Cas12多肽或其部分。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,单一靶标核碱基是胞嘧啶(C),并且其中修饰包括将C转化为胸腺嘧啶(T)。在一些实施方案中,脱氨酶是腺苷脱氨酶。在一些实施方案中,单一靶标核碱基是腺苷(A),并且其中修饰包括将A转化为鸟嘌呤(G)。在一些实施方案中,碱基编辑器还包含尿嘧啶糖基化酶抑制剂。在一些实施方案中,生成一个或多个突变的步骤还包括使免疫细胞与碱基编辑器和一个或多个指导核酸序列接触。在一些实施方案中,一个或多个指导核酸序列将napDNAbp靶向至CD2基因序列或其调控元件。在一些实施方案中,一个或多个指导核酸序列中的每一个将napDNAbp靶向至CD2基因序列、CD52基因序列、TRAC基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或PDC1/PD-1基因序列或其调控元件。
在一些实施方案中,一个或多个指导核酸序列包含选自表1、表2A和/或表2B的一个或多个间隔序列的序列。在一些实施方案中,一个或多个间隔序列选自由以下组成的组:CUUGGGUCAGGACAUCAACU(SEQ ID NO:388);CGAUGAUCAGGAUAUCUACA(SEQ ID NO:389);CACGCACCUGGACAGCUGAC(SEQ ID NO:390);AAACAGAGGAGUCGGAGAAA(SEQ ID NO:391);ACACAAGUUCACCAGCAGAA(SEQ ID NO:392);GUUCAGCCAAAACCUCCCCA(SEQ ID NO:393);AUACAAGUCCAGGAGAUCUU(SEQ ID NO:394);和UUCAGCACCAGCCUCAGAAG(SEQ ID NO:395)。
在一些实施方案中,经由电穿孔、核转染、病毒转导或其组合将碱基编辑器和一个或多个指导核酸序列引入免疫细胞。在一些实施方案中,经由电穿孔将碱基编辑器和一个或多个指导核酸序列引入免疫细胞。在一些实施方案中,免疫细胞是哺乳动物细胞。在一些实施方案中,免疫细胞是人细胞。在一些实施方案中,免疫细胞是细胞毒性T细胞、调节性T细胞、辅助T细胞、树突状细胞、B细胞或NK细胞。在一些实施方案中,免疫细胞来源于单个人供体。在一些实施方案中,免疫细胞从健康受试者获得。
在一个方面,本发明提供了一种药物组合物,其包含药学上可接受的赋形剂中的有效量的如本文所提供的任何修饰的免疫细胞或任何修饰的免疫细胞群。
在另一个方面,本发明提供了一种治疗受试者的瘤形成的方法。在一些实施方案中,方法包括向受试者施用有效量的如本文所提供的任何修饰的免疫细胞、任何修饰的免疫细胞群或任何药物组合物。在一些实施方案中,已经对受试者的瘤形成进行免疫表型分析。在一些实施方案中,瘤形成是CD2+。在一些实施方案中,瘤形成进一步是CD5+和/或CD7+。在一些实施方案中,方法还包括基于瘤形成的免疫表型同时或依次向受试者施用一种或多种额外的修饰的免疫细胞。在一些实施方案中,方法还包括同时或依次向受试者施用有效量的CD5修饰的免疫细胞和/或CD7修饰的免疫细胞。在一些实施方案中,CD5修饰的免疫细胞和/或CD7修饰的免疫细胞在至少一种基因序列或其调控元件中包含一个或多个突变以增加自相残杀抗性、抗肿瘤活性、对移植物抗宿主病(GVHD)的抗性、对宿主抗移植物病(HVGD)的抗性、免疫抑制或其组合。在一些实施方案中,免疫细胞是哺乳动物细胞。在一些实施方案中,免疫细胞是人细胞。在一些实施方案中,免疫细胞是细胞毒性T细胞、调节性T细胞、辅助T细胞、树突状细胞、B细胞或NK细胞。在一些实施方案中,受试者先前已经接受过淋巴细胞清除治疗。在一些实施方案中,淋巴细胞清除涉及施用环磷酰胺、氟达拉滨(fludarabine)和/或阿仑单抗(alemtuzumab)(Cy/Flu/Campath)。在一些实施方案中,受试者对化学疗法难治或具有高肿瘤负荷。在一些实施方案中,受试者随后接受同种异体造血干细胞移植(allo-HSCT)治疗。
在又另一个方面,本发明提供了一种核酸,其编码如本文所提供的任何嵌合抗原受体(CAR)。
在一个方面,本发明提供了一种用于治疗受试者的瘤形成的试剂盒。在一些实施方案中,试剂盒包括如本文所提供的任何嵌合抗原受体(CAR)、任何修饰的免疫细胞、任何修饰的免疫细胞群、任何药物组合物或任何核酸。在一些实施方案中,试剂盒还包括碱基编辑器多肽或编码碱基编辑器多肽的多核苷酸,其中碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和脱氨酶。在一些实施方案中,napDNAbp是Cas9或Cas12。在一些实施方案中,编码碱基编辑器的多核苷酸是mRNA序列。在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,试剂盒还包括一个或多个指导核酸序列。在一些实施方案中,一个或多个指导核酸序列靶向CD2。在一些实施方案中,一个或多个指导核酸序列靶向CD2、CD52、TRAC、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或PDC1/PD-1中的每一个。在一些实施方案中,一个或多个指导核酸序列包含选自表1、表2A和/或表2B的指导核酸序列的序列。在一些实施方案中,一个或多个指导核酸序列选自由以下组成的组:CUUGGGUCAGGACAUCAACU(SEQ ID NO:388);CGAUGAUCAGGAUAUCUACA(SEQ ID NO:389);CACGCACCUGGACAGCUGAC(SEQ ID NO:390);AAACAGAGGAGUCGGAGAAA(SEQ ID NO:391);ACACAAGUUCACCAGCAGAA(SEQ ID NO:392);GUUCAGCCAAAACCUCCCCA(SEQ ID NO:393);AUACAAGUCCAGGAGAUCUU(SEQ ID NO:394);和UUCAGCACCAGCCUCAGAAG(SEQ ID NO:395)。
在一些实施方案中,试剂盒还包括CD5修饰的免疫细胞、CD5修饰的免疫细胞群或包含CD5修饰的免疫细胞或修饰的免疫细胞群的药物组合物。在一些实施方案中,试剂盒还包括CD7修饰的免疫细胞、CD7修饰的免疫细胞群或包含CD7修饰的免疫细胞或修饰的免疫细胞群的药物组合物。在一些实施方案中,试剂盒还包括用于治疗瘤形成的书面说明书。
在另一个方面,本发明提供了如本文所提供的任何药物组合物、任何方法或任何试剂盒,其中瘤形成是T细胞或NK细胞恶性肿瘤。在一些实施方案中,T细胞或NK细胞恶性肿瘤在前体T细胞或NK细胞中。在一些实施方案中,T细胞或NK细胞恶性肿瘤在成熟T细胞或NK细胞中。在一些实施方案中,瘤形成选自由以下组成的组:T细胞急性淋巴细胞白血病(T-ALL)、蕈样肉芽肿(MF)、塞扎里综合征(Sézary syndrome,SS)、外周T/NK细胞淋巴瘤、间变性大细胞淋巴瘤ALK+、原发性皮肤T细胞淋巴瘤、T细胞大颗粒淋巴细胞白血病、血管免疫母细胞性T/NK细胞淋巴瘤、肝脾T细胞淋巴瘤、原发性皮肤CD30+淋巴增生性病症、结外NK/T细胞淋巴瘤、成人T细胞白血病/淋巴瘤、T细胞幼淋巴细胞白血病、皮下脂膜炎样T细胞淋巴瘤、原发性皮肤γ-δT细胞淋巴瘤、侵袭性NK细胞白血病和肠病相关T细胞淋巴瘤。在一些实施方案中,受试者是人受试者。
定义
除非另外定义,否则本文所用的所有技术性和科学性术语具有本发明所属领域中的技术人员通常所理解的含义。以下参考文献向技术人员提供在本发明中使用的许多术语的一般定义:Singleton等人,Dictionary of Microbiology and Molecular Biology(第2版1994);The Cambridge Dictionary of Science and Technology(Walker编辑,1988);The Glossary of Genetics,第5版,R.Rieger等人(编辑),Springer Verlag(1991);和Hale&Marham,The Harper Collins Dictionary of Biology(1991)。如本文所用,除非另外指明,否则以下术语具有下文赋予其的含义。
“腺嘌呤”或”9H-嘌呤-6-胺”意指具有分子式C5H5N5的嘌呤核碱基,其具有结构并且对应于CAS号73-24-5。/>
“腺苷”或“4-氨基-1-[(2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)氧杂环戊烷-2-基]嘧啶-2(1H)-酮”意指经由糖苷键附接至核糖的腺嘌呤分子,其具有结构并且对应于CAS号65-46-3。其分子式为C10H13N5O4
“腺苷脱氨酶”或“腺嘌呤脱氨酶”意指能够催化腺嘌呤或腺苷的水解脱氨基的多肽或其片段。在一些实施方案中,脱氨酶或脱氨酶结构域是催化腺苷水解脱氨成肌苷或催化脱氧腺苷水解脱氨成脱氧肌苷的腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(DNA)中的腺嘌呤或腺苷的水解脱氨基。本文提供的腺苷脱氨酶(例如,工程化的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体(例如,真核生物、原核生物),包括但不限于藻类、细菌、真菌、植物、无脊椎动物(例如,昆虫)和脊椎动物(例如,两栖动物、哺乳动物)。在一些实施方案中,腺苷脱氨酶是具有一个或多个改变的腺苷脱氨酶变体,并且能够使靶多核苷酸(例如,DNA、RNA)中的腺嘌呤和胞嘧啶脱氨基。在一些实施方案中,靶多核苷酸是单链或双链的。在一些实施方案中,腺苷脱氨酶变体能够使DNA中的腺嘌呤和胞嘧啶脱氨基。在一些实施方案中,腺苷脱氨酶变体能够使单链DNA中的腺嘌呤和胞嘧啶脱氨基。在一些实施方案中,腺苷脱氨酶变体能够使RNA中的腺嘌呤和胞嘧啶脱氨基。
“腺苷脱氨酶活性”意指催化多核苷酸中腺嘌呤或腺苷脱氨基成鸟嘌呤。在一些实施方案中,如本文所提供的腺苷脱氨酶变体保持腺苷脱氨酶活性(例如,参考腺苷脱氨酶(例如,TadA*8.20或TadA*8.19)的活性的至少约30%、40%、50%、60%、70%、80%、90%或更多)。
“腺苷碱基编辑器(ABE)”意指包含腺苷脱氨酶的碱基编辑器。
“腺苷碱基编辑器(ABE)多核苷酸”意指编码ABE的多核苷酸。“腺苷碱基编辑器8(ABE8)多肽”或“ABE8”意指如本文所定义的包含腺苷脱氨酶变体的碱基编辑器,所述腺苷脱氨酶变体包含以下参考序列的氨基酸位置82和/或166处的改变:MSEVEFSHEYWMRHALT LAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQID NO:1)。
在一些实施方案中,如本文所述,ABE8相对于参考序列包含进一步改变。
“腺苷碱基编辑器8(ABE8)多核苷酸”意指编码ABE8多肽的多核苷酸。
“施用”在本文中是指向患者或受试者提供一种或多种本文所述的组合物。
“剂”意指任何小分子化合物、抗体、核酸分子或多肽、或其片段。
如本文所用,“同种异体”是指相比之下在遗传上与细胞不同的相同物种的细胞。
“改变”意指如通过标准本领域已知方法(诸如本文所述的那些)检测到的分析物、基因或多肽的水平、结构或活性的变化(增加或减少)。如本文所用,改变包括表达水平的10%的变化、表达水平的25%的变化、40%的变化和50%或更大的变化。在一些实施方案中,改变包括核碱基或氨基酸的插入、缺失或取代。
“改善”意指减少、抑制、衰减、减弱、阻止或稳定疾病的发展或进展。
“类似物”意指不相同但具有类似功能或结构特征的分子。例如,多肽类似物保留了对应的天然存在的多肽的生物活性,同时相对于天然存在的多肽具有增强类似物功能的某些生物化学修饰。此类生物化学修饰可以增加类似物的蛋白酶抗性、膜渗透性或半衰期,而不改变例如配体结合。类似物可包括非天然氨基酸。
“碱基编辑器(BE)”或“核碱基编辑器多肽(NBE)”意指结合多核苷酸并且具有核碱基修饰活性的剂。在各种实施方案中,碱基编辑器包含与指导多核苷酸(例如,指导RNA(gRNA))结合的核碱基修饰多肽(例如,脱氨酶)和多核苷酸可编程核苷酸结合结构域(例如,Cas9或Cpf1)。碱基编辑器的代表性核酸和蛋白质序列在序列表中作为SEQ ID NO:2-11提供。
“碱基编辑活性”意指以化学方式改变多核苷酸内的碱基。在一个实施方案中,将第一种碱基转化为第二种碱基。在一个实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如,将靶标C·G转化成T·A。在另一个实施方案中,碱基编辑活性是腺苷或腺嘌呤脱氨酶活性,例如,将A·T转化成G·C。
术语“碱基编辑器系统”是指用于编辑靶核苷酸序列的核碱基的分子间复合物。在各种实施方案中,碱基编辑器(BE)系统包含(1)多核苷酸可编程核苷酸结合结构域、脱氨酶结构域(例如,胞苷脱氨酶或腺苷脱氨酶),其用于使靶核苷酸序列中的核碱基脱氨基;和(2)与多核苷酸可编程核苷酸结合结构域结合的一种或多种指导多核苷酸(例如,指导RNA)。在各种实施方案中,碱基编辑器(BE)系统包含选自腺苷脱氨酶或胞苷脱氨酶的核碱基编辑器结构域,以及具有核酸序列特异性结合活性的结构域。在一些实施方案中,碱基编辑器系统包含(1)碱基编辑器(BE),其包含多核苷酸可编程DNA结合结构域和用于使靶核苷酸序列中的一个或多个核碱基脱氨基的脱氨酶结构域;和(2)与多核苷酸可编程DNA结合结构域结合的一种或多种指导RNA。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程DNA结合结构域。在一些实施方案中,碱基编辑器是胞苷碱基编辑器(CBE)。在一些实施方案中,碱基编辑器是腺嘌呤或腺苷碱基编辑器(ABE)。在一些实施方案中,碱基编辑器是腺嘌呤或腺苷碱基编辑器(ABE)或胞苷或胞嘧啶碱基编辑器(CBE)。
“β-2微球蛋白(B2M)多肽”意指与下文提供的UniProt登录号P61769或其片段具有至少约85%氨基酸序列同一性并且具有免疫调节活性的蛋白质。
>sp|P61769|B2MG_人β-2-微球蛋白OS=智人OX=9606GN=B2MPE=1SV=1
MSRSVALAVLALLSLSGLEAIQRTPKIQVYSRHPAENGKSNFL NCYVSGFHPSDIEVDLLKNGERIEKVEHSDLSFSKDWSFYLLYYTE FTPTEKDEYACRVNHVTLSQPKIVKWDRDM(SEQ ID NO:728)。
“β-2-微球蛋白(B2M)多核苷酸”意指编码B2M多肽的核酸分子。β-2-微球蛋白基因编码与主要组织相容性复合物相关的血清蛋白。B2M参与宿主CD8+T细胞的非自我识别。下文提供了示例性B2M多核苷酸序列。
>DQ217933.1智人β-2-微球蛋白(B2M)基因,完整cds
CATGTCATAAATGGTAAGTCCAAGAAAAATACAGGTATTCCCCCCCAAAGAAAACTGTAAAATCGACTTTTTTCTATCTGTACTGTTTTTTATTGGTTTTTAAATTGGTTTTCCAAGTGAGTAAATCAGAATCTATCTGTAATGGATTTTAAATTTAGTGTTTCTCTGTGATGTAGTAAACAAGAAACTAGAGGCAAAAATAGCCCTGTCCCTTGCTAAACTTCTAAGGCACTTTTCTAGTACAACTCAACACTAACATTTCAGGCCTTTAGTGCCTTATATGAGTTTTTAAAAGGGGGAAAAGGGAGGGAGCAAGAGTGTCTTAACTCATACATTTAGGCATAACAATTATTCTCATATTTTAGTTATTGAGAGGGCTGGTAGAAAAACTAGGTAAATAATATTAATAATTATAGCGCTTATTAAACACTACAGAACACTTACTATGTACCAGGCATTGTGGGAGGCTCTCTCTTGTGCATTATCTCATTTCATTAGGTCCATGGAGAGTATTGCATTTTCTTAGTTTAGGCATGGCCTCCACAATAAAGATTATCAAAAGCCTAAAAATATGTAAAAGAAACCTAGAAGTTATTTGTTGTGCTCCTTGGGGAAGCTAGGCAAATCCTTTCAACTGAAAACCATGGTGACTTCCAAGATCTCTGCCCCTCCCCATCGCCATGGTCCACTTCCTCTTCTCACTGTTCCTCTTAGAAAAGATCTGTGGACTCCACCACCACGAAATGGCGGCACCTTATTTATGGTCACTTTAGAGGGTAGGTTTTCTTAATGGGTCTGCCTGTCATGTTTAACGTCCTTGGCTGGGTCCAAGGCAGATGCAGTCCAAACTCTCACTAAAATTGCCGAGCCCTTTGTCTTCCAGTGTCTAAAATATTAATGTCAATGGAATCAGGCCAGAGTTTGAATTCTAGTCTCTTAGCCTTTGTTTCCCCTGTCCATAAAATGAATGGGGGTAATTCTTTCCTCCTACAGTTTATTTATATATTCACTAATTCATTCATTCATCCATCCATTCGTTCATTCGGTTTACTGAGTACCTACTATGTGCCAGCCCCTGTTCTAGGGTGGAAACTAAGAGAATGATGTACCTAGAGGGCGCTGGAAGCTCTAAAGCCCTAGCAGTTACTGCTTTTACTATTAGTGGTCGTTTTTTTCTCCCCCCCGCCCCCCGACAAATCAACAGAACAAAGAAAATTACCTAAACAGCAAGGACATAGGGAGGAACTTCTTGGCACAGAACTTTCCAAACACTTTTTCCTGAAGGGATACAAGAAGCAAGAAAGGTACTCTTTCACTAGGACCTTCTCTGAGCTGTCCTCAGGATGCTTTTGGGACTATTTTTCTTACCCAGAGAATGGAGAAACCCTGCAGGGAATTCCCAAGCTGTAGTTATAAACAGAAGTTCTCCTTCTGCTAGGTAGCATTCAAAGATCTTAATCTTCTGGGTTTCCGTTTTCTCGAATGAAAAATGCAGGTCCGAGCAGTTAACTGGCTGGGGCACCATTAGCAAGTCACTTAGCATCTCTGGGGCCAGTCTGCAAAGCGAGGGGGCAGCCTTAATGTGCCTCCAGCCTGAAGTCCTAGAATGAGCGCCCGGTGTCCCAAGCTGGGGCGCGCACCCCAGATCGGAGGGCGCCGATGTACAGACAGCAAACTCACCCAGTCTAGTGCATGCCTTCTTAAACATCACGAGACTCTAAGAAAAGGAAACTGAAAACGGGAAAGTCCCTCTCTCTAACCTGGCACTGCGTCGCTGGCTTGGAGACAGGTGACGGTCCCTGCGGGCCTTGTCCTGATTGGCTGGGCACGCGTTTAATATAAGTGGAGGCGTCGCGCTGGCGGGCATTCCTGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCTACTCTCTCTTTCTGGCCTGGAGGCTATCCAGCGTGAGTCTCTCCTACCCTCCCGCTCTGGTCCTTCCTCTCCCGCTCTGCACCCTCTGTGGCCCTCGCTGTGCTCTCTCGCTCCGTGACTTCCCTTCTCCAAGTTCTCCTTGGTGGCCCGCCGTGGGGCTAGTCCAGGGCTGGATCTCGGGGAAGCGGCGGGGTGGCCTGGGAGTGGGGAAGGGGGTGCGCACCCGGGACGCGCGCTACTTGCCCCTTTCGGCGGGGAGCAGGGGAGACCTTTGGCCTACGGCGACGGGAGGGTCGGGACAAAGTTTAGGGCGTCGATAAGCGTCAGAGCGCCGAGGTTGGGGGAGGGTTTCTCTTCCGCTCTTTCGCGGGGCCTCTGGCTCCCCCAGCGCAGCTGGAGTGGGGGACGGGTAGGCTCGTCCCAAAGGCGCGGCGCTGAGGTTTGTGAACGCGTGGAGGGGCGCTTGGGGTCTGGGGGAGGCGTCGCCCGGGTAAGCCTGTCTGCTGCGGCTCTGCTTCCCTTAGACTGGAGAGCTGTGGACTTCGTCTAGGCGCCCGCTAAGTTCGCATGTCCTAGCACCTCTGGGTCTATGTGGGGCCACACCGTGGGGAGGAAACAGCACGCGACGTTTGTAGAATGCTTGGCTGTGATACAAAGCGGTTTCGAATAATTAACTTATTTGTTCCCATCACATGTCACTTTTAAAAAATTATAAGAACTACCCGTTATTGACATCTTTCTGTGTGCCAAGGACTTTATGTGCTTTGCGTCATTTAATTTTGAAAACAGTTATCTTCCGCCATAGATAACTACTATGGTTATCTTCTGCCTCTCACAGATGAAGAAACTAAGGCACCGAGATTTTAAGAAACTTAATTACACAGGGGATAAATGGCAGCAATCGAGATTGAAGTCAAGCCTAACCAGGGCTTTTGCGGGAGCGCATGCCTTTTGGCTGTAATTCGTGCATTTTTTTTTAAGAAAAACGCCTGCCTTCTGCGTGAGATTCTCCAGAGCAAACTGGGCGGCATGGGCCCTGTGGTCTTTTCGTACAGAGGGCTTCCTCTTTGGCTCTTTGCCTGGTTGTTTCCAAGATGTACTGTGCCTCTTACTTTCGGTTTTGAAAACATGAGGGGGTTGGGCGTGGTAGCTTACGCCTGTAATCCCAGCACTTAGGGAGGCCGAGGCGGGAGGATGGCTTGAGGTCCGTAGTTGAGACCAGCCTGGCCAACATGGTGAAGCCTGGTCTCTACAAAAAATAATAACAAAAATTAGCCGGGTGTGGTGGCTCGTGCCTGTGGTCCCAGCTGCTCCGGTGGCTGAGGCGGGAGGATCTCTTGAGCTTAGGCTTTTGAGCTATCATGGCGCCAGTGCACTCCAGCGTGGGCAACAGAGCGAGACCCTGTCTCTCAAAAAAGAAAAAAAAAAAAAAAGAAAGAGAAAAGAAAAGAAAGAAAGAAGTGAAGGTTTGTCAGTCAGGGGAGCTGTAAAACCATTAATAAAGATAATCCAAGATGGTTACCAAGACTGTTGAGGACGCCAGAGATCTTGAGCACTTTCTAAGTACCTGGCAATACACTAAGCGCGCTCACCTTTTCCTCTGGCAAAACATGATCGAAAGCAGAATGTTTTGATCATGAGAAAATTGCATTTAATTTGAATACAATTTATTTACAACATAAAGGATAATGTATATATCACCACCATTACTGGTATTTGCTGGTTATGTTAGATGTCATTTTAAAAAATAACAATCTGATATTTAAAAAAAAATCTTATTTTGAAAATTTCCAAAGTAATACATGCCATGCATAGACCATTTCTGGAAGATACCACAAGAAACATGTAATGATGATTGCCTCTGAAGGTCTATTTTCCTCCTCTGACCTGTGTGTGGGTTTTGTTTTTGTTTTACTGTGGGCATAAATTAATTTTTCAGTTAAGTTTTGGAAGCTTAAATAACTCTCCAAAAGTCATAAAGCCAGTAACTGGTTGAGCCCAAATTCAAACCCAGCCTGTCTGATACTTGTCCTCTTCTTAGAAAAGATTACAGTGATGCTCTCACAAAATCTTGCCGCCTTCCCTCAAACAGAGAGTTCCAGGCAGGATGAATCTGTGCTCTGATCCCTGAGGCATTTAATATGTTCTTATTATTAGAAGCTCAGATGCAAAGAGCTCTCTTAGCTTTTAATGTTATGAAAAAAATCAGGTCTTCATTAGATTCCCCAATCCACCTCTTGATGGGGCTAGTAGCCTTTCCTTAATGATAGGGTGTTTCTAGAGAGATATATCTGGTCAAGGTGGCCTGGTACTCCTCCTTCTCCCCACAGCCTCCCAGACAAGGAGGAGTAGCTGCCTTTTAGTGATCATGTACCCTGAATATAAGTGTATTTAAAAGAATTTTATACACATATATTTAGTGTCAATCTGTATATTTAGTAGCACTAACACTTCTCTTCATTTTCAATGAAAAATATAGAGTTTATAATATTTTCTTCCCACTTCCCCATGGATGGTCTAGTCATGCCTCTCATTTTGGAAAGTACTGTTTCTGAAACATTAGGCAATATATTCCCAACCTGGCTAGTTTACAGCAATCACCTGTGGATGCTAATTAAAACGCAAATCCCACTGTCACATGCATTACTCCATTTGATCATAATGGAAAGTATGTTCTGTCCCATTTGCCATAGTCCTCACCTATCCCTGTTGTATTTTATCGGGTCCAACTCAACCATTTAAGGTATTTGCCAGCTCTTGTATGCATTTAGGTTTTGTTTCTTTGTTTTTTAGCTCATGAAATTAGGTACAAAGTCAGAGAGGGGTCTGGCATATAAAACCTCAGCAGAAATAAAGAGGTTTTGTTGTTTGGTAAGAACATACCTTGGGTTGGTTGGGCACGGTGGCTCGTGCCTGTAATCCCAACACTTTGGGAGGCCAAGGCAGGCTGATCACTTGAAGTTGGGAGTTCAAGACCAGCCTGGCCAACATGGTGAAATCCCGTCTCTACTGAAAATACAAAAATTAACCAGGCATGGTGGTGTGTGCCTGTAGTCCCAGGAATCACTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCTGAGATCTCACCACTGCACACTGCACTCCAGCCTGGGCAATGGAATGAGATTCCATCCCAAAAAATAAAAAAATAAAAAAATAAAGAACATACCTTGGGTTGATCCACTTAGGAACCTCAGATAATAACATCTGCCACGTATAGAGCAATTGCTATGTCCCAGGCACTCTACTAGACACTTCATACAGTTTAGAAAATCAGATGGGTGTAGATCAAGGCAGGAGCAGGAACCAAAAAGAAAGGCATAAACATAAGAAAAAAAATGGAAGGGGTGGAAACAGAGTACAATAACATGAGTAATTTGATGGGGGCTATTATGAACTGAGAAATGAACTTTGAAAAGTATCTTGGGGCCAAATCATGTAGACTCTTGAGTGATGTGTTAAGGAATGCTATGAGTGCTGAGAGGGCATCAGAAGTCCTTGAGAGCCTCCAGAGAAAGGCTCTTAAAAATGCAGCGCAATCTCCAGTGACAGAAGATACTGCTAGAAATCTGCTAGAAAAAAAACAAAAAAGGCATGTATAGAGGAATTATGAGGGAAAGATACCAAGTCACGGTTTATTCTTCAAAATGGAGGTGGCTTGTTGGGAAGGTGGAAGCTCATTTGGCCAGAGTGGAAATGGAATTGGGAGAAATCGATGACCAAATGTAAACACTTGGTGCCTGATATAGCTTGACACCAAGTTAGCCCCAAGTGAAATACCCTGGCAATATTAATGTGTCTTTTCCCGATATTCCTCAGGTACTCCAAAGATTCAGGTTTACTCACGTCATCCAGCAGAGAATGGAAAGTCAAATTTCCTGAATTGCTATGTGTCTGGGTTTCATCCATCCGACATTGAAGTTGACTTACTGAAGAATGGAGAGAGAATTGAAAAAGTGGAGCATTCAGACTTGTCTTTCAGCAAGGACTGGTCTTTCTATCTCTTGTACTACACTGAATTCACCCCCACTGAAAAAGATGAGTATGCCTGCCGTGTGAACCATGTGACTTTGTCACAGCCCAAGATAGTTAAGTGGGGTAAGTCTTACATTCTTTTGTAAGCTGCTGAAAGTTGTGTATGAGTAGTCATATCATAAAGCTGCTTTGATATAAAAAAGGTCTATGGCCATACTACCCTGAATGAGTCCCATCCCATCTGATATAAACAATCTGCATATTGGGATTGTCAGGGAATGTTCTTAAAGATCAGATTAGTGGCACCTGCTGAGATACTGATGCACAGCATGGTTTCTGAACCAGTAGTTTCCCTGCAGTTGAGCAGGGAGCAGCAGCAGCACTTGCACAAATACATATACACTCTTAACACTTCTTACCTACTGGCTTCCTCTAGCTTTTGTGGCAGCTTCAGGTATATTTAGCACTGAACGAACATCTCAAGAAGGTATAGGCCTTTGTTTGTAAGTCCTGCTGTCCTAGCATCCTATAATCCTGGACTTCTCCAGTACTTTCTGGCTGGATTGGTATCTGAGGCTAGTAGGAAGGGCTTGTTCCTGCTGGGTAGCTCTAAACAATGTATTCATGGGTAGGAACAGCAGCCTATTCTGCCAGCCTTATTTCTAACCATTTTAGACATTTGTTAGTACATGGTATTTTAAAAGTAAAACTTAATGTCTTCCTTTTTTTTCTCCACTGTCTTTTTCATAGATCGAGACATGTAAGCAGCATCATGGAGGTAAGTTTTTGACCTTGAGAAAATGTTTTTGTTTCACTGTCCTGAGGACTATTTATAGACAGCTCTAACATGATAACCCTCACTATGTGGAGAACATTGACAGAGTAACATTTTAGCAGGGAAAGAAGAATCCTACAGGGTCATGTTCCCTTCTCCTGTGGAGTGGCATGAAGAAGGTGTATGGCCCCAGGTATGGCCATATTACTGACCCTCTACAGAGAGGGCAAAGGAACTGCCAGTATGGTATTGCAGGATAAAGGCAGGTGGTTACCCACATTACCTGCAAGGCTTTGATCTTTCTTCTGCCATTTCCACATTGGACATCTCTGCTGAGGAGAGAAAATGAACCACTCTTTTCCTTTGTATAATGTTGTTTTATTCTTCAGACAGAAGAGAGGAGTTATACAGCTCTGCAGACATCCCATTCCTGTATGGGGACTGTGTTTGCCTCTTAGAGGTTCCCAGGCCACTAGAGGAGATAAAGGGAAACAGATTGTTATAACTTGATATAATGATACTATAATAGATGTAACTACAAGGAGCTCCAGAAGCAAGAGAGAGGGAGGAACTTGGACTTCTCTGCATCTTTAGTTGGAGTCCAAAGGCTTTTCAATGAAATTCTACTGCCCAGGGTACATTGATGCTGAAACCCCATTCAAATCTCCTGTTATATTCTAGAACAGGGAATTGATTTGGGAGAGCATCAGGAAGGTGGATGATCTGCCCAGTCACACTGTTAGTAAATTGTAGAGCCAGGACCTGAACTCTAATATAGTCATGTGTTACTTAATGACGGGGACATGTTCTGAGAAATGCTTACACAAACCTAGGTGTTGTAGCCTACTACACGCATAGGCTACATGGTATAGCCTATTGCTCCTAGACTACAAACCTGTACAGCCTGTTACTGTACTGAATACTGTGGGCAGTTGTAACACAATGGTAAGTATTTGTGTATCTAAACATAGAAGTTGCAGTAAAAATATGCTATTTTAATCTTATGAGACCACTGTCATATATACAGTCCATCATTGACCAAAACATCATATCAGCATTTTTTCTTCTAAGATTTTGGGAGCACCAAAGGGATACACTAACAGGATATACTCTTTATAATGGGTTTGGAGAACTGTCTGCAGCTACTTCTTTTAAAAAGGTGATCTACACAGTAGAAATTAGACAAGTTTGGTAATGAGATCTGCAATCCAAATAAAATAAATTCATTGCTAACCTTTTTCTTTTCTTTTCAGGTTTGAAGATGCCGCATTTGGATTGGATGAATTCCAAATTCTGCTTGCTTGCTTTTTAATATTGATATGCTTATACACTTACACTTTATGCACAAAATGTAGGGTTATAATAATGTTAACATGGACATGATCTTCTTTATAATTCTACTTTGAGTGCTGTCTCCATGTTTGATGTATCTGAGCAGGTTGCTCCACAGGTAGCTCTAGGAGGGCTGGCAACTTAGAGGTGGGGAGCAGAGAATTCTCTTATCCAACATCAACATCTTGGTCAGATTTGAACTCTTCAATCTCTTGCACTCAAAGCTTGTTAAGATAGTTAAGCGTGCATAAGTTAACTTCCAATTTACATACTCTGCTTAGAATTTGGGGGAAAATTTAGAAATATAATTGACAGGATTATTGGAAATTTGTTATAATGAATGAAACATTTTGTCATATAAGATTCATATTTACTTCTTATACATTTGATAAAGTAAGGCATGGTTGTGGTTAATCTGGTTTATTTTTGTTCCACAAGTTAAATAAATCATAAAACTTGATGTGTTATCTCTTATATCTCACTCCCACTATTACCCCTTTATTTTCAAACAGGGAAACAGTCTTCAAGTTCCACTTGGTAAAAAATGTGAACCCCTTGTATATAGAGTTTGGCTCACAGTGTAAAGGGCCTCAGTGATTCACATTTTCCAGATTAGGAATCTGATGCTCAAAGAAGTTAAATGGCATAGTTGGGGTGACACAGCTGTCTAGTGGGAGGCCAGCCTTCTATATTTTAGCCAGCGTTCTTTCCTGCGGGCCAGGTCATGAGGAGTATGCAGACTCTAAGAGGGAGCAAAAGTATCTGAAGGATTTAATATTTTAGCAAGGAATAGATATACAATCATCCCTTGGTCTCCCTGGGGGATTGGTTTCAGGACCCCTTCTTGGACACCAAATCTATGGATATTTAAGTCCCTTCTATAAAATGGTATAGTATTTGCATATAACCTATCCACATCCTCCTGTATACTTTAAATCATTTCTAGATTACTTGTAATACCTAATACAATGTAAATGCTATGCAAATAGTTGTTATTGTTTAAGGAATAATGACAAGAAAAAAAAGTCTGTACATGCTCAGTAAAGACACAACCATCCCTTTTTTTCCCCAGTGTTTTTGATCCATGGTTTGCTGAATCCACAGATGTGGAGCCCCTGGATACGGAAGGCCCGCTGTACTTTGAATGACAAATAACAGATTTAAA(SEQ ID NO:729)
术语“Cas9”或“Cas9结构域”是指包含Cas9蛋白或其片段(例如,包含Cas9的活性、非活性或部分活性DNA切割结构域和/或Cas9的gRNA结合结构域的蛋白质)的RNA指导的核酸酶。Cas9核酸酶有时也称为casnl核酸酶或CRISPR(成簇规律间隔短回文重复序列)相关核酸酶。
“嵌合抗原受体”或“CAR”意指包含细胞外抗原结合结构域的合成或工程化受体,所述细胞外抗原结合结构域与一个或多个细胞内信号传导结构域(例如,T细胞信号传导结构域)接合,将对抗原的特异性赋予免疫效应细胞。在一些实施方案中,CAR包括跨膜结构域。
“嵌合抗原受体T细胞”或“CAR-T细胞”意指表达CAR的T细胞,所述CAR具有由CAR的抗体衍生的靶向结构域确定的抗原特异性。如本文所用,“CAR-T细胞”包括T细胞或NK细胞。如本文所用,“CAR-T细胞”包括被工程改造以表达CAR或T细胞受体(TCR)的细胞。在一些实施方案中,CAR-T细胞可以是任选地限定比例的CD4+辅助T细胞和/或CD8+效应T细胞。制备CAR(例如,用于治疗癌症)的方法是公开可用的(参见,例如,Park等人,TrendsBiotechnol.,29:550-557,2011;Grupp等人,N Engl J Med.,368:1509-1518,2013;Han等人,J.Hematol Oncol.6:47,2013;Haso等人,(2013)Blood,121,1165-1174;PCT公开WO2012/079000、WO2013/059593;和美国公开2012/0213783,所述文献和公开各自通过引用整体并入本文)。
“II类主要组织相容性复合物反式激活因子(CIITA)”意指与NCBI登录号NP_001273331.1或其片段具有至少约85%氨基酸序列同一性并且具有免疫调节活性的蛋白质。下文提供了示例性氨基酸序列。
>NP_001273331.1MHC II类反式激活因子同工型1[智人]
MRCLAPRPAGSYLSEPQGSSQCATMELGPLEGGYLELLNSDADPLCLYHFYDQMDLAGEEEIELYSEPDTDTINCDQFSRLLCDMEGDEETREAYANIAELDQYVFQDSQLEGLSKDIFIEHIGPDEVIGESMEMPAEVGQKSQKRPFPEELPADLKHWKPAEPPTVVTGSLLVGPVSDCSTLPCLPLPALFNQEPASGQMRLEKTDQIPMPFSSSSLSCLNLPEGPIQFVPTISTLPHGLWQISEAGTGVSSIFIYHGEVPQASQVPPPSGFTVHGLPTSPDRPGSTSPFAPSATDLPSMPEPALTSRANMTEHKTSPTQCPAAGEVSNKLPKWPEPVEQFYRSLQDTYGAEPAGPDGILVEVDLVQARLERSSSKSLERELATPDWAERQLAQGGLAEVLLAAKEHRRPRETRVIAVLGKAGQGKSYWAGAVSRAWACGRLPQYDFVFSVPCHCLNRPGDAYGLQDLLFSLGPQPLVAADEVFSHILKRPDRVLLILDGFEELEAQDGFLHSTCGPAPAEPCSLRGLLAGLFQKKLLRGCTLLLTARPRGRLVQSLSKADALFELSGFSMEQAQAYVMRYFESSGMTEHQDRALTLLRDRPLLLSHSHSPTLCRAVCQLSEALLELGEDAKLPSTLTGLYVGLLGRAALDSPPGALAELAKLAWELGRRHQSTLQEDQFPSADVRTWAMAKGLVQHPPRAAESELAFPSFLLQCFLGALWLALSGEIKDKELPQYLALTPRKKRPYDNWLEGVPRFLAGLIFQPPARCLGALLGPSAAASVDRKQKVLARYLKRLQPGTLRARQLLELLHCAHEAEEAGIWQHVVQELPGRLSFLGTRLTPPDAHVLGKALEAAGQDFSLDLRSTGICPSGLGSLVGLSCVTRFRAALSDTVALWESLQQHGETKLLQAAEEKFTIEPFKAKSLKDVEDLGKLVQTQRTRSSSEDTAGELPAVRDLKKLEFALGPVSGPQAFPKLVRILTAFSSLQHLDLDALSENKIGDEGVSQLSATFPQLKSLETLNLSQNNITDLGAYKLAEALPSLAASLLRLSLYNNCICDVGAESLARVLPDMVSLRVMDVQYNKFTAAGAQQLAASLRRCPHVETLAMWTPTIPFSVQEHLQQQDSRISLR(SEQ ID NO:730)
“II类主要组织相容性复合物反式激活因子(CIITA)”意指编码CIITA多肽的核酸。下文提供了示例性CIITA核酸序列。
>NM_001286402.1智人II类主要组织相容性复合物反式激活因子(CIITA),转录物变体1,mRNA
GGTTAGTGATGAGGCTAGTGATGAGGCTGTGTGCTTCTGAGCTGGGCATCCGAAGGCATCCTTGGGGAAGCTGAGGGCACGAGGAGGGGCTGCCAGACTCCGGGAGCTGCTGCCTGGCTGGGATTCCTACACAATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGATCCCAGCTGTGCTCTGGACAGGCATGTTCTCTGAGGACACTAACCACGCTGGACCTTGAACTGGGTACTTGTGGACACAGCTCTTCTCCAGGCTGTATCCCATGAGCCTCAGCATCCTGGCACCCGGCCCCTGCTGGTTCAGGGTTGGCCCCTGCCCGGCTGCGGAATGAACCACATCTTGCTCTGCTGACAGACACAGGCCCGGCTCCAGGCTCCTTTAGCGCCCAGTTGGGTGGATGCCTGGTGGCAGCTGCGGTCCACCCAGGAGCCCCGAGGCCTTCTCTGAAGGACATTGCGGACAGCCACGGCCAGGCCAGAGGGAGTGACAGAGGCAGCCCCATTCTGCCTGCCCAGGCCCCTGCCACCCTGGGGAGAAAGTACTTCTTTTTTTTTATTTTTAGACAGAGTCTCACTGTTGCCCAGGCTGGCGTGCAGTGGTGCGATCTGGGTTCACTGCAACCTCCGCCTCTTGGGTTCAAGCGATTCTTCTGCTTCAGCCTCCCGAGTAGCTGGGACTACAGGCACCCACCATCATGTCTGGCTAATTTTTCATTTTTAGTAGAGACAGGGTTTTGCCATGTTGGCCAGGCTGGTCTCAAACTCTTGACCTCAGGTGATCCACCCACCTCAGCCTCCCAAAGTGCTGGGATTACAAGCGTGAGCCACTGCACCGGGCCACAGAGAAAGTACTTCTCCACCCTGCTCTCCGACCAGACACCTTGACAGGGCACACCGGGCACTCAGAAGACACTGATGGGCAACCCCCAGCCTGCTAATTCCCCAGATTGCAACAGGCTGGGCTTCAGTGGCAGCTGCTTTTGTCTATGGGACTCAATGCACTGACATTGTTGGCCAAAGCCAAAGCTAGGCCTGGCCAGATGCACCAGCCCTTAGCAGGGAAACAGCTAATGGGACACTAATGGGGCGGTGAGAGGGGAACAGACTGGAAGCACAGCTTCATTTCCTGTGTCTTTTTTCACTACATTATAAATGTCTCTTTAATGTCACAGGCAGGTCCAGGGTTTGAGTTCATACCCTGTTACCATTTTGGGGTACCCACTGCTCTGGTTATCTAATATGTAACAAGCCACCCCAAATCATAGTGGCTTAAAACAACACTCACATTTA(SEQ ID NO:731)
“细胞毒性T淋巴细胞相关蛋白4(CTLA-4)多肽”意指与NCBI登录号EAW70354.1或其片段具有至少约85%序列同一性的蛋白质。下文提供了示例性氨基酸序列:
>EAW70354.1细胞毒性T淋巴细胞相关蛋白4[智人]
MACLGFQRHKAQLNLATRTWPCTLLFFLLFIPVFCKAMHVAQPAVVLASSRGIASFVCEYASPGKATEVRVTVLRQADSQVTEVCAATYMMGNELTFLDDSICTGTSSGNQVNLTIQGLRAMDTGLYICKVELMYPPPYYLGIGNGTQIYVIDPEPCPDSDFLLWILAAVSSGLFFYSFLLTAVSLSKMLKKRSPLTTGVYVKMPPTEPECEKQFQPYFIPIN(SEQ ID NO:732)
“细胞毒性T淋巴细胞相关蛋白4(CTLA-4)多核苷酸”意指编码CTLA-4多肽的核酸分子。CTLA-4基因编码免疫球蛋白超家族,并且编码将抑制信号传递给T细胞的蛋白质。下文提供了示例性CTLA-4核酸序列。
>BC074842.2智人细胞毒性T淋巴细胞相关蛋白4,mRNA(cDNA克隆MGC:104099图像:30915552),完整cds
GACCTGAACACCGCTCCCATAAAGCCATGGCTTGCCTTGGATTTCAGCGGCACAAGGCTCAGCTGAACCTGGCTACCAGGACCTGGCCCTGCACTCTCCTGTTTTTTCTTCTCTTCATCCCTGTCTTCTGCAAAGCAATGCACGTGGCCCAGCCTGCTGTGGTACTGGCCAGCAGCCGAGGCATCGCCAGCTTTGTGTGTGAGTATGCATCTCCAGGCAAAGCCACTGAGGTCCGGGTGACAGTGCTTCGGCAGGCTGACAGCCAGGTGACTGAAGTCTGTGCGGCAACCTACATGATGGGGAATGAGTTGACCTTCCTAGATGATTCCATCTGCACGGGCACCTCCAGTGGAAATCAAGTGAACCTCACTATCCAAGGACTGAGGGCCATGGACACGGGACTCTACATCTGCAAGGTGGAGCTCATGTACCCACCGCCATACTACCTGGGCATAGGCAACGGAACCCAGATTTATGTAATTGATCCAGAACCGTGCCCAGATTCTGACTTCCTCCTCTGGATCCTTGCAGCAGTTAGTTCGGGGTTGTTTTTTTATAGCTTTCTCCTCACAGCTGTTTCTTTGAGCAAAATGCTAAAGAAAAGAAGCCCTCTTACAACAGGGGTCTATGTGAAAATGCCCCCAACAGAGCCAGAATGTGAAAAGCAATTTCAGCCTTATTTTATTCCCATCAATTGAGAAACCATTATGAAGAAGAGAGTCCATATTTCAATTTCCAAGAGCTGAGG(SEQID NO:733)
“分化簇2(CD2)多肽”意指与NCBI登录号NP_001758.2或其片段具有至少约85%氨基酸序列同一性并且具有免疫调节活性的蛋白质。下文提供了示例性氨基酸序列。
>NP_001758.2T细胞表面抗原CD2同工型2前体[智人]
CD2细胞质结构域(氨基酸残基235-351)以粗体显示。来自智人的示例性CD2多肽的结构在图4中示出。
“分化簇2(CD2)多核苷酸”意指编码CD2多肽的核酸。下文提供了示例性CD2核酸序列。>NM_001767.5智人CD2分子(CD2),转录物变体2,mRNA
“分化簇5(CD5)多肽”意指与NCBI登录号NP_001333385.1或其片段具有至少约85%氨基酸序列同一性并且具有免疫调节活性的蛋白质。下文提供了示例性氨基酸序列。
>NP_001333385.1T细胞表面糖蛋白CD5同工型2[智人]
MVCSQSWGRSSKQWEDPSQASKVCQRLNCGVPLSLGPFLVTYTPQSSIICYGQLGSFSNCSHSRNDMCHSLGLTCLEPQKTTPPTTRPPPTTTPEPTAPPRLQLVAQSGGQHCAGVVEFYSGSLGGTISYEAQDKTQDLENFLCNNLQCGSFLKHLPETEAGRAQDPGEPREHQPLPIQWKIQNSSCTSLEHCFRKIKPQKSGRVLALLCSGFQPKVQSRLVGGSSICEGTVEVRQGAQWAALCDSSSARSSLRWEEVCREQQCGSVNSYRVLDAGDPTSRGLFCPHQKLSQCHELWERNSYCKKVFVTCQDPNPAGLAAGTVASIILALVLLVVLLVVCGPLAYKKLVKKFRQKKQRQWIGPTGMNQNMSFHRNHTATVRSHAENPTASHVDNEYSQPPRNSHLSAYPALEGALHRSSMQPDNSSDSDYDLHGAQRL(SEQ IDNO:736)
“分化簇5(CD5)多核苷酸”意指编码CD5多肽的核酸。下文提供了示例性CD5核酸序列。>NM_001346456.1智人CD5分子(CD5),转录物变体2,mRNA
/>
“分化簇7(CD7)多肽”意指与NCBI参考序列:NP_006128.1或其片段具有至少约85%氨基酸序列同一性并且具有免疫调节活性的蛋白质。下文提供了示例性氨基酸序列。
>NP_006128.1T细胞抗原CD7前体[智人]
“分化簇7(CD7)多核苷酸”意指编码CD7多肽的核酸分子。下文提供了示例性CD7核酸序列。
>NM_006137.7智人CD7分子(CD7),mRNA
“分化簇137(CD137)多肽”意指与NCBI参考序列:NP_001552.2或其片段具有至少约85%氨基酸序列同一性的蛋白质。CD137也称为4-1BB。下文提供了示例性氨基酸序列。
>NP_001552.2肿瘤坏死因子受体超家族成员9前体[智人]
“分化簇137(CD137)多核苷酸”意指编码CD137多肽的核酸分子。下文提供了示例性CD137核酸序列。
>NM_001561.6智人TNF受体超家族成员9(TNFRSF9),mRNA
/>
/>
“分化簇247(CD247)多肽”意指与NCBI参考序列:NP_932170.1或其片段具有至少约85%氨基酸序列同一性的蛋白质。CD137也称为CD3ζ。下文提供了示例性氨基酸序列。
>NP_932170.1T细胞表面糖蛋白CD3ζ链同工型1前体[智人]
“分化簇247(CD247)多核苷酸”意指编码CD247多肽的核酸分子。下文提供了示例性CD247核酸序列。
>NM_198053.3智人CD247分子(CD247),转录物变体1,mRNA
“共同施用(co-administration)”或“共同施用(co-administered)”是指在治疗过程期间施用两种或更多种治疗剂或药物组合物。这种共同施用可以是同时施用或依次施用。在施用第一种药物组合物或治疗剂之后的治疗过程期间的任何时间可以发生随后施用的治疗剂或药物组合物的依次施用。
术语“保守氨基酸取代”或“保守突变”是指一个氨基酸被具有共同性质的另一个氨基酸替换。定义单个氨基酸之间的共同性质的实用方法是分析同源生物体的对应蛋白质之间氨基酸变化的归一化频率(Schulz,G.E.和Schirmer,R.H.,Principles of ProteinStructure,Springer-Verlag,New York(1979))。根据此类分析,可以定义氨基酸组,其中组内的氨基酸优先彼此交换,因此在它们对整体蛋白质结构的影响方面彼此最相似(Schulz,G.E.和Schirmer,R.H.,同上)。保守突变的非限制性实例包括氨基酸的氨基酸取代,例如赖氨酸取代精氨酸,反之亦然,使得可以维持正电荷;谷氨酸取代天冬氨酸,反之亦然,使得可以维持负电荷;丝氨酸取代苏氨酸,使得可以维持游离的-OH;以及谷氨酰胺取代天冬酰胺,使得可以维持游离的–NH2
如本文可互换使用的术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸区段。编码序列也可以称为开放阅读框。所述区域或序列以起始密码子更靠近5'端并且终止密码子更靠近3'端进行结合。可与本文所述的碱基编辑器一起使用的终止密码子包括以下:
谷氨酰胺CAG→TAG终止密码子
CAA→TAA
精氨酸CGA→TGA
色氨酸TGG→TGA
TGG→TAG
TGG→TAA
“复合物”意指两个或更多个分子的组合,其相互作用依赖于分子间力。分子间力的非限制性实例包括共价和非共价相互作用。非共价相互作用的非限制性实例包括氢键、离子键、卤素键、疏水键、范德华相互作用(例如,偶极-偶极相互作用、偶极诱导的偶极相互作用和伦敦色散力)和π效应。在一个实施方案中,复合物包含多肽、多核苷酸或一种或多种多肽与一种或多种多核苷酸的组合。在一个实施方案中,复合物包含一种或多种多肽和多核苷酸(例如,指导RNA),所述多肽缔合形成碱基编辑器(例如,包含核酸可编程DNA结合蛋白(诸如Cas9)和脱氨酶的碱基编辑器)。在一个实施方案中,复合物通过氢键保持在一起。应当理解,碱基编辑器的一种或多种组分(例如,脱氨酶或核酸可编程DNA结合蛋白)可共价或非共价缔合。作为一个实例,碱基编辑器可包括与核酸可编程DNA结合蛋白共价连接(例如,通过肽键)的脱氨酶。或者,碱基编辑器可包括非共价缔合的脱氨酶和核酸可编程DNA结合蛋白(例如,其中碱基编辑器的一种或多种组分以反式提供,并且直接缔合或经由另一个分子(诸如蛋白质或核酸)缔合)。在一个实施方案中,复合物的一种或多种组分通过氢键保持在一起。
“胞嘧啶”或“4-氨基嘧啶-2(1H)-酮”意指具有分子式C4H5N3O的嘌呤核碱基,其具有结构并且对应于CAS号71-30-7。
“胞苷”意指经由糖苷键附接至核糖的胞嘧啶分子,其具有结构并且对应于CAS号65-46-3。其分子式为C9H13N3O5
“胞苷碱基编辑器(CBE)”意指包含胞苷脱氨酶的碱基编辑器。
“胞苷碱基编辑器(CBE)多核苷酸”意指包含CBE的多核苷酸。
“胞苷脱氨酶”或“胞嘧啶脱氨酶”意指能够使胞苷或胞嘧啶脱氨基的多肽或其片段。在一个实施方案中,胞苷脱氨酶将胞嘧啶转化成尿嘧啶或将5-甲基胞嘧啶转化成胸腺嘧啶。术语“胞苷脱氨酶”和“胞嘧啶脱氨酶”在整个申请中可互换使用。海七鳃鳗胞嘧啶脱氨酶1(PmCDA1)(SEQ ID NO:13-14)、激活诱导的胞苷脱氨酶(AICDA)(SEQ ID NO:15-21)和APOBEC(SEQ ID NO:12-61)是示例性胞苷脱氨酶。其他示例性胞苷脱氨酶(CDA)序列在序列表中作为SEQ ID NO:62-66和SEQ ID NO:67-189提供。
“胞嘧啶”意指具有分子式C4H5N3O的嘧啶核碱基。
“胞嘧啶脱氨酶活性”意指催化胞嘧啶或胞苷的脱氨基。在一个实施方案中,具有胞嘧啶脱氨酶活性的多肽将氨基转化成羰基。在一个实施方案中,胞嘧啶脱氨酶将胞嘧啶转化成尿嘧啶(即,C转化成U)或将5-甲基胞嘧啶转化成胸腺嘧啶(即,5mC转化成T)。在一些实施方案中,如本文所提供的胞嘧啶脱氨酶相对于参考胞嘧啶脱氨酶具有增加的胞嘧啶脱氨酶活性(例如,至少10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或更多)。
如本文所用,术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或其片段。
在一些实施方案中,腺苷脱氨酶是TadA脱氨酶。在一些实施方案中,TadA脱氨酶是TadA*7.10变体。在一些实施方案中,TadA*7.10变体是TadA*8。在一些实施方案中,TadA*8是TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23或TadA*8.24。
“检测”是指鉴定待检测的分析物的存在、不存在或量。在一个实施方案中,检测多核苷酸或多肽中的序列改变。在另一个实施方案中,检测插入缺失的存在。
“可检测标记”意指这样一种组合物,当其与感兴趣的分子连接时,使后者可经由光谱、光化学、生物化学、免疫化学或化学方式检测。例如,有用的标记包括放射性同位素、磁珠、金属珠、胶体颗粒、荧光染料、电子致密试剂、酶(例如,如通常用于酶联免疫吸附测定(ELISA))、生物素、地高辛(digoxigenin)或半抗原。
“疾病”意指损害或干扰细胞、组织或器官的正常功能的任何病状或病症。在一个实施方案中,疾病是瘤形成或癌症。在一些实施方案中,疾病是T细胞或NK细胞恶性肿瘤。在一些实施方案中,T细胞或NK细胞恶性肿瘤在前体T细胞或NK细胞中。在一些实施方案中,T细胞或NK细胞恶性肿瘤在成熟T细胞或NK细胞中。疾病的非限制性实例包括T细胞急性淋巴细胞白血病(T-ALL)、蕈样肉芽肿(MF)、塞扎里综合征(SS)、外周T/NK细胞淋巴瘤、间变性大细胞淋巴瘤ALK+、原发性皮肤T细胞淋巴瘤、T细胞大颗粒淋巴细胞白血病、血管免疫母细胞性T/NK细胞淋巴瘤、肝脾T细胞淋巴瘤、原发性皮肤CD30+淋巴增生性病症、结外NK/T细胞淋巴瘤、成人T细胞白血病/淋巴瘤、T细胞幼淋巴细胞白血病、皮下脂膜炎样T细胞淋巴瘤、原发性皮肤γ-δT细胞淋巴瘤、侵袭性NK细胞白血病和肠病相关T细胞淋巴瘤。
“有效量”意指相对于未治疗的患者或没有疾病的个体(即,健康个体),改善疾病症状所需的剂或活性化合物(例如,如本文所述的碱基编辑器)的量,或者是足以引起期望生物反应的剂或活性化合物的量。用于实施本发明以治疗性治疗疾病的活性化合物的有效量根据施用方式、受试者的年龄、体重和一般健康状况而变化。最终,主治医师或兽医将决定适当的量和剂量方案。这种量被称为“有效”量。在一个实施方案中,有效量是足以在细胞(例如,体外或体内细胞)中的感兴趣的基因中引入改变的本发明的碱基编辑器的量。在一个实施方案中,有效量是实现治疗效果所需的碱基编辑器的量。这种治疗效果不需要足以改变受试者、组织或器官的所有细胞中的致病基因,而仅需要足以改变受试者、组织或器官中存在的约1%、5%、10%、25%、50%、75%或更多细胞中的致病基因。在一个实施方案中,有效量足以改善疾病的一种或多种症状。
如本文所用,“表位”意指抗原决定簇。表位是抗原分子的一部分,表位的结构决定了识别和结合它的特异性抗体分子。
“片段”意指多肽或核酸分子的一部分。此一部分含有参考核酸分子或多肽的全长的至少约10%、20%、30%、40%、50%、60%、70%、80%或90%。片段可含有10、20、30、40、50、60、70、80、90或100、200、300、400、500、600、700、800、900或1000个核苷酸或氨基酸。
“自相残杀”意指免疫细胞被其他免疫细胞杀伤,包括自身抗原驱动的免疫细胞杀伤。在某些实施方案中,本发明的免疫细胞被遗传修饰以防止或减少被表达嵌合抗原受体(CAR)的免疫细胞识别的抗原的表达,从而防止或减少自相残杀。在各种实施方案中,自相残杀可能在体内发生(例如,在受试者中)或离体发生(例如,在免疫细胞制剂中)。
“移植物抗宿主病”(GVHD)是指供体的移植细胞生成针对宿主细胞的免疫反应的病理性病状。
“指导多核苷酸”意指多核苷酸或多核苷酸复合物,其对靶序列具有特异性并且可以与多核苷酸可编程核苷酸结合结构域蛋白(例如,Cas9或Cpf1)形成复合物。在一个实施方案中,指导多核苷酸是指导RNA(gRNA)。gRNA可以作为两个或更多个RNA的复合物存在,或者作为单个RNA分子存在。
如本文所用,术语“造血干细胞”(“HSC”)是指具有自我更新和分化成含有不同谱系的成熟血细胞的能力的未成熟血细胞,所述成熟血细胞包括但不限于粒细胞(例如,前髓细胞、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞)、红细胞(例如,网织红细胞、红细胞)、凝血细胞(例如,原巨核细胞、血小板产生原巨核细胞、血小板)、单核细胞(例如,单核细胞、巨噬细胞)、树突状细胞、小胶质细胞、破骨细胞和淋巴细胞(例如,NK细胞、B细胞和T细胞)。此类细胞可包括CD34+细胞。CD34+细胞是表达CD34细胞表面标志物的未成熟细胞。在人中,CD34+细胞被认为包括具有以上定义的干细胞性质的细胞亚群,而在小鼠中,HSC是CD34-。此外,HSC还指代长期再生HSC(LT-HSC)和短期再生HSC(ST-HSC)。LT-HSC和ST-HSC基于功能潜力和细胞表面标志物表达进行区分。例如,人HSC是CD34+、CD38-、CD45RA-、CD90+、CD49F+和lin-(成熟谱系标志物阴性,所述标志物包括CD2、CD3、CD4、CD7、CD8、CD10、CD1 1B、CD19、CD20、CD56、CD235A)。在小鼠中,骨髓LT-HSC是CD34-、SCA-1+、C-kit+、CD135-、Slamfl/CD150+、CD48-和lin-(成熟谱系标志物阴性,所述标志物包括Ter119、CD11b、Gr1、CD3、CD4、CD8、B220、IL7ra),而ST-HSC是CD34+、SCA-1+、C-kit+、CD135-、Slamfl/CD150+和lin-(成熟谱系标志物阴性,所述标志物包括Ter1 19、CD1 1b、Gr1、CD3、CD4、CD8、B220、IL7ra)。此外,在稳态条件下,ST-HSC的静止性低于LT-HSC,而增殖性高于LT-HSC。然而,LT-HSC具有更大的自我更新潜力(即,它们在整个成年期都存活,并且可以在接连的接受者之间连续移植),而ST-HSC的自我更新有限(即,它们只能存活有限的时间段,并且不具有连续移植的潜力)。任何这些HSC都可以用于本文所述的方法中。ST-HSC特别有用,因为它们具有高度增殖性,因此可以更快地产生分化后代。
如本文所用,术语“造血干细胞功能潜力”是指造血干细胞的功能性质,其包括:1)多潜能性(其指代分化成多种不同血液谱系的能力,所述血液谱系包括但不限于粒细胞(例如,前髓细胞、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞)、红细胞(例如,网织红细胞、红细胞)、凝血细胞(例如,原巨核细胞、血小板产生原巨核细胞、血小板)、单核细胞(例如,单核细胞、巨噬细胞)、树突状细胞、小胶质细胞、破骨细胞和淋巴细胞(例如,NK细胞、B细胞和T细胞),2)自我更新(其指代造血干细胞产生具有与母细胞同等潜力的子细胞的能力,此外这种能力可以在个体的一生中反复发生而不耗尽),以及3)造血干细胞或其后代被重新引入移植接受者的能力,它们借此回到造血干细胞生态位并重新建立高产且持续的造血作用。”
“异源”或“外源”意指这样的多核苷酸或多肽:1)已通过实验掺入到多核苷酸或多肽序列中,所述多核苷酸或多肽在自然界中通常不存在;或2)已通过实验置于通常不包含所述多核苷酸或多肽的细胞中。在一些实施方案中,“异源”意指多核苷酸或多肽已通过实验置于非天然环境中。在一些实施方案中,异源多核苷酸或多肽来源于第一物种或宿主生物体,并被掺入到来源于第二物种或宿主生物体的多核苷酸或多肽中。在一些实施方案中,第一物种或宿主生物体与第二物种或宿主生物体不同。在一些实施方案中,异源多核苷酸是DNA。在一些实施方案中,异源多核苷酸是RNA。
“宿主抗移植物病”(HVGD)是指宿主的免疫系统生成针对供体的移植细胞的免疫反应的病理性病状。“杂交”意指互补核碱基之间的氢键合,其可以是沃森-克里克(Watson-Crick)、胡斯坦(Hoogsteen)或反向胡斯坦氢键合。例如,腺嘌呤和胸腺嘧啶是通过形成氢键配对的互补核碱基。
“免疫细胞”意指能够生成免疫反应的免疫系统细胞。
“免疫效应细胞”意指淋巴细胞,其一旦被激活,就能够对靶细胞产生免疫反应。在一些实施方案中,免疫效应细胞是效应T细胞。在一些实施方案中,效应T细胞是幼稚CD8+T细胞、细胞毒性T细胞、自然杀伤T(NKT)细胞、自然杀伤(NK)细胞或调节性T(Treg)细胞。在一些实施方案中,免疫效应细胞是效应NK细胞。在一些实施方案中,效应T细胞是胸腺细胞、未成熟T淋巴细胞、成熟T淋巴细胞、静息T淋巴细胞或激活的T淋巴细胞。在一些实施方案中,免疫效应细胞是CD4+CD8+T细胞或CD4-CD8-T细胞。在一些实施方案中,免疫效应细胞是辅助T细胞。在一些实施方案中,辅助T细胞是辅助T细胞1(Th1)、辅助T细胞2(Th2)或表达CD4的辅助T细胞(CD4+T细胞)。
“免疫反应调控基因”或“免疫反应调控因子”意指编码参与免疫反应调控的多肽的基因。免疫反应调控基因可以以多种机制或在不同水平上调控免疫反应。例如,免疫反应调控基因可抑制或促进免疫细胞(例如,T细胞)的激活。免疫反应调控基因可增加或降低免疫细胞的激活阈值。在一些实施方案中,免疫反应调控基因正向调控免疫细胞信号转导途径。在一些实施方案中,免疫反应调控基因负向调控免疫细胞信号转导途径。在一些实施方案中,免疫反应调控基因编码抗原、抗体、细胞因子或神经内分泌。
“免疫原性基因”意指编码能够引发免疫反应的多肽的基因。例如,免疫原性基因可编码引发免疫反应的免疫原。在一些实施方案中,免疫原性基因编码细胞表面蛋白。在一些实施方案中,免疫原性基因编码细胞表面抗原或细胞表面标志物。在一些实施方案中,细胞表面标志物是T细胞标志物或B细胞标志物。在一些实施方案中,免疫原性基因编码CD2、CD3e、CD3δ、CD3γ、TRAC、TRBC1、TRBC2、CD4、CD5、CD7、CD8、CD19、CD23、CD27、CD28、CD30、CD33、CD52、CD70、CD127、CD122、CD130、CD132、CD38、CD69、CD11a、CD58、CD99、CD103、CCR4、CCR5、CCR6、CCR9、CCR10、CXCR3、CXCR4、CLA、CD161、B2M或CIITA多肽。
“增加”意指至少10%、25%、50%、75%或100%的正向改变。
术语“碱基修复的抑制剂”、“碱基修复抑制剂”、“IBR”或其语法等同物是指能够抑制核酸修复酶(例如碱基切除修复酶)活性的蛋白质。
“内含肽”是蛋白质的片段,它能够自我切除并且在称为蛋白质剪接的过程中用肽键接合剩余片段(外显肽)。
术语“分离的”、“纯化的”或“生物学上纯的”是指材料在不同程度上不含天然状态下通常伴随它的组分。“分离”表示与原始来源或环境分开的程度。“纯化”表示高于分离的分开的程度。“纯化的”或“生物学上纯的”蛋白质充分不含其他材料,使得任何杂质不对蛋白质的生物性质产生实质性影响或引起其他不良后果。也就是说,如果本发明的核酸或肽在通过重组DNA技术产生时基本上不含细胞材料、病毒材料或培养基,或者在化学合成时基本上不含化学前体或其他化学物质,则它是纯化的。纯度和均匀性通常使用分析性化学技术来确定,例如聚丙烯酰胺凝胶电泳或高效液相色谱法。术语“纯化的”可以表示核酸或蛋白质在电泳凝胶中基本上产生一条带。对于可以进行修饰(例如磷酸化或糖基化)的蛋白质,不同的修饰可产生不同的分离蛋白质,所述不同的分离蛋白质可单独纯化。
“分离的多核苷酸”意指不含有以下基因的核酸(例如,DNA),所述基因在本发明的核酸分子所来源的生物体的天然基因组中侧接基因。因此,所述术语包括例如掺入到载体中的重组DNA;掺入到自主复制的质粒或病毒中的重组DNA;或掺入到原核生物或真核生物的基因组DNA中的重组DNA;或者作为独立于其他序列的独立分子(例如,通过PCR或限制性核酸内切酶消化产生的cDNA或基因组或cDNA片段)存在的重组DNA。此外,所述术语包括从DNA分子转录的RNA分子,以及作为编码额外多肽序列的杂合基因的一部分的重组DNA。
“分离的多肽”意指已经与天然伴随其的组分分开的本发明的多肽。通常,当多肽按重量计不含至少60%与其天然缔合的蛋白质和天然存在的有机分子时,所述多肽是“分离的”。优选地,制剂按重量计是本发明的多肽的至少75%,更优选地至少90%并且最优选地至少99%。本发明的分离多肽可例如通过从天然来源中提取、通过表达编码这种多肽的重组核酸、或通过化学合成蛋白质来获得。可以通过任何适当的方法(例如柱色谱法、聚丙烯酰胺凝胶电泳或通过HPLC分析)来测量纯度。
如本文所用,术语“接头”是指连接两个部分的分子。在一个实施方案中,术语“接头”是指共价接头(例如,共价键)或非共价接头。
“标志物”意指在与疾病或病症相关的表达、水平、结构或活性方面具有改变的任何蛋白质或多核苷酸。在实施方案中,疾病或病症是T细胞或NK细胞恶性肿瘤。在一些情况下,标志物是CD2多肽。
如本文所用,术语“突变”是指序列(例如,核酸或氨基酸序列)内的残基被另一个残基取代,或序列内一个或多个残基的缺失或插入。突变在本文中通常通过鉴定原始残基、然后通过残基在序列内的位置以及通过新取代的残基的身份来描述。用于进行本文提供的氨基酸取代(突变)的各种方法是本领域众所周知的,并且由例如Green和Sambrook,Molecular Cloning:A Laboratory Manual(第4版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.(2012))提供。
“瘤形成”是指表现出异常生长或增殖的细胞或组织。术语瘤形成涵盖癌症和实体瘤。在一些实施方案中,瘤形成是T细胞或NK细胞恶性肿瘤。在一些实施方案中,T细胞或NK细胞恶性肿瘤在前体T细胞或NK细胞中。在一些实施方案中,T细胞或NK细胞恶性肿瘤在成熟T细胞或NK细胞中。瘤形成的非限制性实例包括T细胞急性淋巴细胞白血病(T-ALL)、蕈样肉芽肿(MF)、塞扎里综合征(SS)、外周T/NK细胞淋巴瘤、间变性大细胞淋巴瘤ALK+、原发性皮肤T细胞淋巴瘤、T细胞大颗粒淋巴细胞白血病、血管免疫母细胞性T/NK细胞淋巴瘤、肝脾T细胞淋巴瘤、原发性皮肤CD30+淋巴增生性病症、结外NK/T细胞淋巴瘤、成人T细胞白血病/淋巴瘤、T细胞幼淋巴细胞白血病、皮下脂膜炎样T细胞淋巴瘤、原发性皮肤γ-δT细胞淋巴瘤、侵袭性NK细胞白血病和肠病相关T细胞淋巴瘤。
术语“非保守突变”涉及不同基团之间的氨基酸取代,例如,赖氨酸取代色氨酸,或苯丙氨酸取代丝氨酸等。在这种情况下,非保守氨基酸取代优选不干扰功能变体或不抑制功能变体的生物活性。非保守氨基酸取代可以增强功能变体的生物活性,使得功能变体的生物活性与野生型蛋白相比增加。
如本文所用,术语“核酸”和“核酸分子”是指包含核碱基和酸性部分的化合物,例如核苷、核苷酸或核苷酸聚合物。通常,聚合物核酸(例如包含三个或更多个核苷酸的核酸分子)是线性分子,其中相邻的核苷酸经由磷酸二酯键联彼此连接。在一些实施方案中,“核酸”是指单独的核酸残基(例如核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含三个或更多个单独核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可互换使用以指代核苷酸聚合物(例如,一串至少三个核苷酸)。在一些实施方案中,“核酸”涵盖RNA以及单链和/或双链DNA。核酸可以是天然存在的,例如,在基因组、转录物、mRNA、tRNA、rRNA、siRNA、snRNA、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的背景下。另一方面,核酸分子可以是非天然存在的分子,例如重组DNA或RNA、人工染色体、工程化基因组或其片段,或合成DNA、RNA、DNA/RNA杂交体,或包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物,例如具有非磷酸二酯骨架的类似物。核酸可以从天然来源中纯化,使用重组表达系统产生,并且任选地纯化、化学合成等。在适当的情况下,例如,在化学合成的分子的情况下,核酸可以包含核苷类似物,诸如具有化学修饰的碱基或糖和骨架修饰的类似物。除非另有说明,否则核酸序列以5'至3'方向表示。在一些实施方案中,核酸是或包含天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷);核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并-嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤和2-硫代胞苷);化学修饰的碱基;生物修饰的碱基(例如,甲基化碱基);嵌入性碱基(intercalated base);修饰的糖(2′-例如,氟核糖、核糖、2′-脱氧核糖、阿拉伯糖和己糖);和/或修饰的磷酸基团(例如,硫代磷酸酯和5′-N-亚磷酰胺键联)。
术语“核定位序列”、“核定位信号”或“NLS”是指促进蛋白质输入到细胞核中的氨基酸序列。核定位序列是本领域已知的并且例如在P lank等人,2000年11月23日提交的国际PCT申请PCT/EP2000/011690中描述,所述申请在2001年5月31日公布为WO/2001/038547,所述申请的内容关于其示例性核定位序列的公开内容通过引用并入本文。在其他实施方案中,NLS是例如由Koblan等人,Nature Biote ch.2018doi:10.1038/nbt.4172描述的优化的NLS。在一些实施方案中,NLS包含氨基酸序列KRTADGSEFESPKKKRKV(SEQ ID NO:190)、KRPAATKKAGQAKKKK(SEQ ID NO:191)、KKTELQTT NAENKTKKL(SEQ ID NO:192)、KRGINDRNFWRGENGRKTR(SEQ ID NO:193)、RKSGKIAAIVVKRPRK(SEQ ID NO:194)、P KKKRKV(SEQ ID NO:195)或MDSLLMNRRKFLYQFKNVRWA KGRRETYLC(SEQ ID NO:196)。
在本文中可互换使用的术语“核碱基”、“含氮碱基”或“碱基”是指形成核苷的含氮生物化合物,核苷又是核苷酸的组分。核碱基形成碱基对并且相互堆叠的能力直接导致长链螺旋结构,诸如核糖核酸(RNA)和脱氧核糖核酸(DNA)。五种核碱基——腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)——被称为主要碱基或规范碱基。腺嘌呤和鸟嘌呤来源于嘌呤,而胞嘧啶、尿嘧啶和胸腺嘧啶来源于嘧啶。DNA和RNA还可以含有其他修饰的(非主要)碱基。非限制性示例性修饰的核碱基可包括次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶(m5C)和5-氢甲基胞嘧啶。次黄嘌呤和黄嘌呤可以通过诱变剂的存在产生,两者都是通过脱氨基(用羰基替换胺基)产生的。可以自腺嘌呤修饰得到次黄嘌呤。可以自鸟嘌呤修饰得到黄嘌呤。可以由胞嘧啶的脱氨基产生尿嘧啶。“核苷”由核碱基和五碳糖(核糖或脱氧核糖)组成。核苷的实例包括腺苷、鸟苷、尿苷、胞苷、5-甲基尿苷(m5U)、脱氧腺苷、脱氧鸟苷、胸苷、脱氧尿苷和脱氧胞苷。具有修饰核碱基的核苷的实例包括肌苷(I)、黄苷(X)、7-甲基鸟苷(m7G)、二氢尿苷(D)、5-甲基胞苷(m5C)和假尿苷(Ψ)。“核苷酸”由核碱基、五碳糖(核糖或脱氧核糖)和至少一个磷酸基团组成。
术语“核酸可编程DNA结合蛋白”或“napDNAbp”可与“多核苷酸可编程核苷酸结合结构域”互换使用以指代与核酸(例如,DNA或RNA)缔合的蛋白质,所述核酸诸如将napDNAbp指导至特定核酸序列的指导核酸或指导多核苷酸(例如,gRNA)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程DNA结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程RNA结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是Cas9蛋白。Cas9蛋白可以与指导RNA缔合,所述指导RNA将Cas9蛋白指导至与指导RNA互补的特定DNA序列。在一些实施方案中,napDNAbp是Cas9结构域,例如核酸酶活性Cas9、Cas9切口酶(nCas9)或核酸酶失活Cas9(dCas9)。核酸可编程DNA结合蛋白的非限制性实例包括Cas9(例如,dCas9和nCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i和Cas12j/CasΦ(Cas12j/Casphi)。Cas酶的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(也称为Csn1或Csx12)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Cpf1、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Cas效应蛋白、V型Cas效应蛋白、VI型Cas效应蛋白、CARF、DinG、其同系物或其修饰或工程化版本。其他核酸可编程DNA结合蛋白也在本公开的范围内,但它们可能没有在本公开中具体列出。参见,例如,Makarova等人“Classification and Nomenclature ofCRISPR-Cas Systems:Where from Here?”CRISPR J.2018年10月;1:325-336.doi:10.1089/crispr.2018.0033;Yan等人,“Functionally diverse type V CRISPR-Cassystems”Science.2019年1月4日;363(6422):88-91.doi:10.1126/science.aav7271,每篇文献的全部内容特此通过引用并入。示例性核酸可编程DNA结合蛋白和编码核酸可编程DNA结合蛋白的核酸序列在序列表中作为SEQ ID NO:197-230提供。
如本文所用,术语“核碱基编辑结构域”或“核碱基编辑蛋白”是指可以催化RNA或DNA中的核碱基修饰的蛋白质或酶,所述修饰诸如胞嘧啶(或胞苷)至尿嘧啶(或尿苷)或胸腺嘧啶(或胸苷),以及腺嘌呤(或腺苷)至次黄嘌呤(或肌苷)的脱氨基,以及非模板核苷酸添加和插入。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域(例如,腺嘌呤脱氨酶或腺苷脱氨酶;或胞苷脱氨酶或胞嘧啶脱氨酶)。
如本文所用,如“获得剂”中的“获得”包括合成、购买或以其他方式获取剂。
“受试者”意指哺乳动物,包括但不限于人或非人哺乳动物,诸如牛科动物、马科动物、犬科动物、羊(ovine)、啮齿动物或猫科动物。在一个实施方案中,“患者”是指发展疾病或病症的可能性高于平均水平的哺乳动物受试者。示例性患者可以是人、非人灵长类动物、猫、狗、猪、牛、猫、马、骆驼、美洲驼、山羊、绵羊、啮齿动物(例如,小鼠、兔子、大鼠或豚鼠)和可以受益于本文公开的疗法的其他哺乳动物。示例性人患者可以是男性和/或女性。
“有需要的患者”或“有需要的受试者”在本文中指代被诊断为患有、有风险患上、预定患有或怀疑患有疾病或病症的患者。
术语“致病性突变”、“致病性变异”、“致病突变”、“致病变异”、“有害突变”或“易患突变”是指与疾病或病症相关或者增加个体对某种疾病或病症的易感性或易患性的遗传改变或突变。在一些实施方案中,致病性突变包括由基因编码的蛋白质中的至少一个野生型氨基酸被至少一个致病性氨基酸取代。在一些实施方案中,致病性突变在终止区(例如,终止密码子)中。在一些实施方案中,致病性突变在非编码区(例如,内含子、启动子等)中。
术语“药学上可接受的载剂”意指参与将化合物从身体的一个部位(例如,递送部位)运载或运输到另一个部位(例如,器官、组织或身体的一部分)的药学上可接受的材料、组合物或媒介物,诸如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如,润滑剂、滑石镁(talc magnesium)、硬脂酸钙或硬脂酸锌、或硬脂酸)或溶剂封装材料。药学上可接受的载剂在与制剂的其他成分相容并且对受试者的组织无害(例如,生理相容性、无菌、生理pH等)的意义上是“可接受的”。诸如“赋形剂”、“载剂”、“药学上可接受的载剂”、“媒介物”等的术语在本文中可互换使用。
术语“药物组合物”意指配制用于药物用途的组合物。在一些实施方案中,药物组合物还包含药学上可接受的载剂。在一些实施方案中,药物组合物包含额外的剂(例如,用于特异性递送、增加半衰期或其他治疗化合物)。
“程序性细胞死亡1(PDCD1或PD-1)多肽”意指与NCBI登录号AJS10360.1或其片段具有至少约85%氨基酸序列同一性的蛋白质。PD-1蛋白被认为在免疫反应期间和耐受条件下参与T细胞功能调控。下文提供了示例性B2M多肽序列。
>AJS10360.1程序性细胞死亡1蛋白[智人]
MQIPQAPWPVVWAVLQLGWRPGWFLDSPDRPWNPPTFSPALLVVTEGDNATFTCSFSNTSESFVLNWYRMSPSNQTDKLAAFPEDRSQPGQDCRFRVTQLPNGRDFHMSVVRARRNDSGTYLCGAISLAPKAQIKESLRAELRVTERRAEVPTAHPSPSPRPAGQFQTLVVGVVGGLLGSLVLLVWVLAVICSRAARGTIGARRTGQPLKEDPSAVPVFSVDYGELDFQWREKTPEPPVPCVPEQTEYATIVFPSGMGTSSPARRGSADGPRSAQPLRPEDGHCSWPL(SEQ IDNO:744)
“程序性细胞死亡1(PDCD1或PD-1)多核苷酸”意指编码PD-1多肽的核酸分子。PDCD1基因编码抑制性细胞表面受体,所述受体以抗原特异性方式抑制T细胞效应子功能。下文提供了示例性PDCD1核酸序列。
>AY238517.1智人程序性细胞死亡1(PDCD1)mRNA,完整cds
ATGCAGATCCCACAGGCGCCCTGGCCAGTCGTCTGGGCGGTGCTACAACTGGGCTGGCGGCCAGGATGGTTCTTAGACTCCCCAGACAGGCCCTGGAACCCCCCCACCTTCTCCCCAGCCCTGCTCGTGGTGACCGAAGGGGACAACGCCACCTTCACCTGCAGCTTCTCCAACACATCGGAGAGCTTCGTGCTAAACTGGTACCGCATGAGCCCCAGCAACCAGACGGACAAGCTGGCCGCCTTCCCCGAGGACCGCAGCCAGCCCGGCCAGGACTGCCGCTTCCGTGTCACACAACTGCCCAACGGGCGTGACTTCCACATGAGCGTGGTCAGGGCCCGGCGCAATGACAGCGGCACCTACCTCTGTGGGGCCATCTCCCTGGCCCCCAAGGCGCAGATCAAAGAGAGCCTGCGGGCAGAGCTCAGGGTGACAGAGAGAAGGGCAGAAGTGCCCACAGCCCACCCCAGCCCCTCACCCAGGCCAGCCGGCCAGTTCCAAACCCTGGTGGTTGGTGTCGTGGGCGGCCTGCTGGGCAGCCTGGTGCTGCTAGTCTGGGTCCTGGCCGTCATCTGCTCCCGGGCCGCACGAGGGACAATAGGAGCCAGGCGCACCGGCCAGCCCCTGAAGGAGGACCCCTCAGCCGTGCCTGTGTTCTCTGTGGACTATGGGGAGCTGGATTTCCAGTGGCGAGAGAAGACCCCGGAGCCCCCCGTGCCCTGTGTCCCTGAGCAGACGGAGTATGCCACCATTGTCTTTCCTAGCGGAATGGGCACCTCATCCCCCGCCCGCAGGGGCTCAGCTGACGGCCCTCGGAGTGCCCAGCCACTGAGGCCTGAGGATGGACACTGCTCTTGGCCCCTCTGA(SEQ ID NO:745)
“启动子”意指指导核酸转录的一系列核酸控制序列。启动子包括转录起始位点附近的必要核酸序列。启动子还任选地包括远端增强子或抑制因子序列元件。“组成型启动子”是持续具有活性并且不受外部信号或分子调控的启动子。相反,“诱导型启动子”的活性受外部信号或分子(例如,转录因子)的调控。例如,启动子可以是CMV启动子。
术语“蛋白质”、“肽”、“多肽”及其语法等同物在本文中可互换使用,并且指代通过肽(酰胺)键连接在一起的氨基酸残基的聚合物。蛋白质、肽或多肽可以是天然存在的、重组的或合成的、或其任何组合。
如本文所用的术语“融合蛋白”是指包含来自至少两个不同蛋白质的蛋白质结构域的杂交多肽。
如本文在蛋白质或核酸的上下文中使用的术语“重组的”是指自然界中不存在,而是人类工程改造的产物的蛋白质或核酸。例如,在一些实施方案中,重组蛋白或核酸分子包含氨基酸或核苷酸序列,所述氨基酸或核苷酸序列与任何天然存在的序列相比包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个或至少七个突变。
“减少”意指至少10%、25%、50%、75%或100%的负向改变。
“参考”意指标准或对照条件。在一个实施方案中,参考是野生型或健康细胞。在其他实施方案中而不限于,参考是未处理的细胞,其未经受测试条件,或经受安慰剂或生理盐水、培养基、缓冲液和/或不含有感兴趣的多核苷酸的对照载体。在一个实施方案中,参考是含有未编辑的靶基因或包含未根据本公开的方法编辑的靶基因的细胞。在一些情况下,靶基因是CD2基因。
“参考序列”是用作序列比较基础的定义序列。参考序列可以是特定序列的子集或全部;例如,全长cDNA或基因序列的区段,或完整的cDNA或基因序列。对于多肽,参考多肽序列的长度将通常为至少约16个氨基酸、至少约20个氨基酸、至少约25个氨基酸、约35个氨基酸、约50个氨基酸或约100个氨基酸。对于核酸,参考核酸序列的长度将通常为至少约50个核苷酸、至少约60个核苷酸、至少约75个核苷酸、约100个核苷酸或约300个核苷酸或其周围或其间的任何整数。在一些实施方案中,参考序列是感兴趣的蛋白质的野生型序列。在其他实施方案中,参考序列是编码野生型蛋白质的多核苷酸序列。
术语“RNA可编程核酸酶”和“RNA指导的核酸酶”与一种或多种不是切割靶标的RNA一起使用(例如,结合或缔合)。在一些实施方案中,当与RNA复合时,RNA可编程核酸酶可称为核酸酶:RNA复合物。通常,结合的RNA被称为指导RNA(gRNA)。在一些实施方案中,RNA可编程核酸酶是(CRISPR相关系统)Cas9核酸内切酶,例如来自化脓性链球菌(Streptococcuspyogenes)的Cas9(Csnl)。
如本文所用,术语“scFv”或“单链抗体”是指单链Fv抗体,其中来自抗体的重链和轻链的可变结构域已经接合形成一条链。scFv片段含有单一多肽链,所述单一多肽链包括被接头分开的抗体轻链的可变区(VL)(例如,CDR-L1、CDR-L2和/或CDR-L3)和抗体重链的可变区(VH)(例如,CDR-H1、CDR-H2和/或CDR-H3)。接合scFv片段的VL和VH区的接头可以是由蛋白氨基酸组成的肽接头。可以使用替代接头以增加scFv片段对蛋白水解降解的抗性(例如,含有D-氨基酸的接头),以便增强scFv片段的溶解度(例如,亲水性接头,诸如含有聚乙二醇的接头或含有重复甘氨酸和丝氨酸残基的多肽),以提高分子的生物物理稳定性(例如,含有形成分子内或分子间二硫键的半胱氨酸残基的接头),或以减弱scFv片段的免疫原性(例如,含有糖基化位点的接头)。本领域普通技术人员还将理解,可以修饰本文所述的scFv分子的可变区,使得它们的氨基酸序列与其来源于的抗体分子不同。例如,可以进行导致氨基酸残基处的保守取代或变化的核苷酸或氨基酸取代(例如,在CDR和/或框架残基中)以保持或增强scFv结合被对应抗体识别的抗原的能力。
“选择性结合”意指特异性结合细胞表面蛋白的野生型版本,但表现出降低的结合或无法结合包含突变的细胞表面蛋白。
“信号传导结构域”意指在T细胞中表达的蛋白质的细胞内部分,其转导T细胞效应子功能信号(例如,激活信号),并且指导T细胞执行特定功能。T细胞激活可以由多种因素诱导,包括同源抗原与T细胞表面上的T细胞受体的结合以及同源配体与T细胞表面上的共刺激分子的结合。T细胞共刺激分子是T细胞上的同源结合配偶体,其特异性结合共刺激配体,从而介导T细胞的共刺激反应,诸如但不限于增殖。共刺激分子包括但不限于MHC I类分子。在一些实施方案中,共刺激结构域是CD2细胞质结构域。T细胞的激活导致免疫反应,诸如T细胞增殖和分化(参见,例如,Smith-Garvin等人,Annu.Rev.Immunol.,27:591-619,2009)。示例性T细胞信号传导结构域是本领域已知的。非限制性实例包括CD2、CD3ζ、CD8、CD28、CD27、CD154、GITR(TNFRSF18)、CD134(OX40)和CD137(4-1BB)信号传导结构域。
术语“单核苷酸多态性(SNP)”是发生在基因组中的特定位置处的单个核苷酸的变异,其中每种变异在群体内以某种可测量的程度存在(例如,大于1%)。
“特异性结合”意指识别且结合本发明的多肽和/或核酸分子,但基本上不识别且不结合样品(例如,生物样品)中的其他分子的核酸分子、多肽、多肽/多核苷酸复合物、化合物或分子。
“基本相同”意指多肽或核酸分子表现出与参考氨基酸序列具有至少50%的同一性。在一个实施方案中,参考序列是野生型氨基酸或核酸序列。在另一个实施方案中,参考序列是本文所述的氨基酸或核酸序列中的任一者。在一个实施方案中,这种序列在氨基酸水平或核酸水平上与用于比较的序列具有至少60%、80%、85%、90%、95%或甚至99%的同一性。
序列同一性通常使用序列分析软件(例如,Sequence Analysis SoftwarePackage of the Genetics Computer Group,University of Wisconsin BiotechnologyCenter,1710University Avenue,Madison,Wis.53705、BLAST、BESTFIT、GAP或PILEUP/PRETTYBOX程序)来测量。这样的软件通过将同源度分配给各种取代、缺失和/或其他修饰来匹配相同或相似的序列。保守性取代通常包括以下组内的取代:甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;和苯丙氨酸、酪氨酸。在确定同一性程度的示例性方法中,可以使用BLAST程序,其中e-3与e-100之间的概率得分指示密切相关的序列。
例如,COBALT与以下参数一起使用:
a)比对参数:空位罚分-11、-1和末端空位罚分-5、-1,
b)CDD参数:使用RPS BLAST开启;Blast E值0.003;查找保守列并重新计算开启,以及
c)查询簇集参数:使用查询簇开启;字号4;最大簇距离0.8;Alphabet Regular。
例如,EMBOSS Needle与以下参数一起使用:
a)矩阵:BLOSUM62;
b)空位开放:10;
c)空位扩展:0.5;
d)输出形式:配对;
e)末端空位罚分:错误;
f)末端空位开放:10;以及
g)末端空位扩展:0.5。
可用于本发明的方法的核酸分子包括编码本发明多肽或其片段的任何核酸分子。此类核酸分子不需要与内源核酸序列具有100%同一性,但通常将表现出基本同一性。与内源序列具有“基本同一性”的多核苷酸通常能够与双链核酸分子的至少一条链杂交。可用于本发明的方法的核酸分子包括编码本发明多肽或其片段的任何核酸分子。此类核酸分子不需要与内源核酸序列具有100%同一性,但通常将表现出基本同一性。与内源序列具有“基本同一性”的多核苷酸通常能够与双链核酸分子的至少一条链杂交。“杂交”意指在各种严格条件下在互补多核苷酸序列(例如,本文所述的基因)或其部分之间配对形成双链分子。(参见,例如,Wahl,G.M.和S.L.Berger(1987)Methods Enzymol.152:399;Kimmel,A.R.(1987)Methods Enzymol.152:507)。
例如,严格的盐浓度将通常小于约750mM NaCl和75mM柠檬酸三钠,优选小于约500mM NaCl和50mM柠檬酸三钠,并且更优选小于约250mM NaCl和25mM柠檬酸三钠。低严格性杂交可以在不存在有机溶剂(例如,甲酰胺)的情况下获得,而高严格性杂交可以在至少约35%甲酰胺、并且更优选至少约50%甲酰胺的存在下获得。严格的温度条件将通常包括至少约30℃、更优选至少约37℃、并且最优选至少约42℃的温度。不同的额外参数,诸如杂交时间、洗涤剂(例如,十二烷基硫酸钠(SDS))浓度、以及包括或排除载剂DNA,是本领域技术人员众所周知的。不同级别的严格性根据需要通过组合这些不同条件来完成。在优选的实施方案中,杂交将在30℃下在750mM NaCl、75mM柠檬酸三钠和1%SDS中发生。在更优选的实施方案中,杂交将在37℃下在500mM NaCl、50mM柠檬酸三钠、1%SDS、35%甲酰胺、和100μg/ml变性鲑精DNA(ssDNA)中发生。在最优选的实施方案中,杂交将在42℃下在250mM NaCl、25mM柠檬酸三钠、1%SDS、50%甲酰胺和200μg/ml ssDNA中发生。这些条件的有用变化对本领域技术人员将是显而易见的。
对于大多数应用,杂交后的洗涤步骤的严格性也将会有所不同。洗涤严格性条件可以通过盐浓度和温度来定义。如上所述,可以通过降低盐浓度或提高温度来提高洗涤严格性。例如,洗涤步骤的严格盐浓度将优选小于约30mM NaCl和3mM柠檬酸三钠,并且最优选小于约15mM NaCl和1.5mM柠檬酸三钠。洗涤步骤的严格温度条件将通常包括至少约25℃、更优选至少约42℃、甚至更优选至少约68℃的温度。在一个实施方案中,洗涤步骤将在25℃下在30mM NaCl、3mM柠檬酸三钠和0.1%SDS中发生。在另一个实施方案中,洗涤步骤将在42℃下在15mM NaCl、1.5mM柠檬酸三钠和0.1%SDS中发生。在更优选的实施方案中,洗涤步骤将在68℃下在15mM NaCl、1.5mM柠檬酸三钠和0.1%SDS中发生。这些条件的额外变化对本领域技术人员将是显而易见的。杂交技术是本领域技术人员众所周知的,并且在例如Benton和Davis(Science 196:180,1977);Grunstein和Hogness(Proc.Natl.Acad.Sci.,USA 72:3961,1975);Ausubel等人(Current Protocols in Molecular Biology,WileyInterscience,New York,2001);Berger和Kimmel(Guide to Molecular CloningTechniques,1987,Academic Press,New York);和Sambrook等人,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory Press,New York中描述。
“分裂”意指分成两个或更多个片段。
“分裂的Cas9蛋白”或“分裂的Cas9”是指作为由两个单独的核苷酸序列编码的N末端片段和C末端片段提供的Cas9蛋白。对应于Cas9蛋白的N末端部分和C末端部分的多肽可以被剪接以形成“重构的”Cas9蛋白。
术语“靶位点”是指核酸分子内被脱氨酶(例如,胞苷或腺嘌呤脱氨酶)、包含脱氨酶的融合蛋白(例如,dCas9-腺苷脱氨酶融合蛋白)、或碱基编辑器(例如,如本文所公开的腺嘌呤或腺苷碱基编辑器(ABE)或胞苷或胞嘧啶碱基编辑器(CBE))脱氨的序列。
“T细胞受体α恒定区(TRAC)多肽”意指与NCBI登录号P01848.2或其片段具有至少约85%氨基酸序列同一性并且具有免疫调节活性的蛋白质。下文提供了示例性氨基酸序列。
>sp|P01848.2|TRAC_人推荐名:完整=T细胞受体α恒定区
IQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKTVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSCDVKLVEKSFETDTNLNFQNLSVIGFRILLLKVAGFNLLMTLRLWSS(SEQID NO:746)
“T细胞受体α恒定区(TRAC)多核苷酸”意指编码TRAC多肽的核酸。下文提供了示例性TRAC核酸序列。
UCSC人类基因组数据库,基因ENSG00000277734.8人T细胞受体α链(TCR-α)
catgctaatcctccggcaaacctctgtttcctcctcaaaaggcaggaggtcggaaagaataaacaatgagagtcacattaaaaacacaaaatcctacggaaatactgaagaatgagtctcagcactaaggaaaagcctccagcagctcctgctttctgagggtgaaggatagacgctgtggctctgcatgactcactagcactctatcacggccatattctggcagggtcagtggctccaactaacatttgtttggtactttacagtttattaaatagatgtttatatggagaagctctcatttctttctcagaagagcctggctaggaaggtggatgaggcaccatattcattttgcaggtgaaattcctgagatgtaaggagctgctgtgacttgctcaaggccttatatcgagtaaacggtagtgctggggcttagacgcaggtgttctgatttatagttcaaaacctctatcaatgagagagcaatctcctggtaatgtgatagatttcccaacttaatgccaacataccataaacctcccattctgctaatgcccagcctaagttggggagaccactccagattccaagatgtacagtttgctttgctgggcctttttcccatgcctgcctttactctgccagagttatattgctggggttttgaagaagatcctattaaataaaagaataagcagtattattaagtagccctgcatttcaggtttccttgagtggcaggccaggcctggccgtgaacgttcactgaaatcatggcctcttggccaagattgatagcttgtgcctgtccctgagtcccagtccatcacgagcagctggtttctaagatgctatttcccgtataaagcatgagaccgtgacttgccagccccacagagccccgcccttgtccatcactggcatctggactccagcctgggttggggcaaagagggaaatgagatcatgtcctaaccctgatcctcttgtcccacagATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGgtaagggcagctttggtgccttcgcaggctgtttccttgcttcaggaatggccaggttctgcccagagctctggtcaatgatgtctaaaactcctctgattggtggtctcggccttatccattgccaccaaaaccctctttttactaagaaacagtgagccttgttctggcagtccagagaatgacacgggaaaaaagcagatgaagagaaggtggcaggagagggcacgtggcccagcctcagtctctccaactgagttcctgcctgcctgcctttgctcagactgtttgccccttactgctcttctaggcctcattctaagccccttctccaagttgcctctccttatttctccctgtctgccaaaaaatctttcccagctcactaagtcagtctcacgcagtcactcattaacccaccaatcactgattgtgccggcacatgaatgcaccaggtgttgaagtggaggaattaaaaagtcagatgaggggtgtgcccagaggaagcaccattctagttgggggagcccatctgtcagctgggaaaagtccaaataacttcagattggaatgtgttttaactcagggttgagaaaacagctaccttcaggacaaaagtcagggaagggctctctgaagaaatgctacttgaagataccagccctaccaagggcagggagaggaccctatagaggcctgggacaggagctcaatgagaaaggagaagagcagcaggcatgagttgaatgaaggaggcagggccgggtcacagggccttctaggccatgagagggtagacagtattctaaggacgccagaaagctgttgatcggcttcaagcaggggagggacacctaatttgcttttcttttttttttttttttttttttttttttttgagatggagttttgctcttgttgcccaggctggagtgcaatggtgcatcttggctcactgcaacctccgcctcccaggttcaagtgattctcctgcctcagcctcccgagtagctgagattacaggcacccgccaccatgcctggctaattttttgtatttttagtagagacagggtttcactatgttggccaggctggtctcgaactcctgacctcaggtgatccacccgcttcagcctcccaaagtgctgggattacaggcgtgagccaccacacccggcctgcttttcttaaagatcaatctgagtgctgtacggagagtgggttgtaagccaagagtagaagcagaaagggagcagttgcagcagagagatgatggaggcctgggcagggtggtggcagggaggtaaccaacaccattcaggtttcaaaggtagaaccatgcagggatgagaaagcaaagaggggatcaaggaaggcagctggattttggcctgagcagctgagtcaatgatagtgccgtttactaagaagaaaccaaggaaaaaatttggggtgcagggatcaaaactttttggaacatatgaaagtacgtgtttatactctttatggcccttgtcactatgtatgcctcgctgcctccattggactctagaatgaagccaggcaagagcagggtctatgtgtgatggcacatgtggccagggtcatgcaacatgtactttgtacaaacagtgtatattgagtaaatagaaatggtgtccaggagccgaggtatcggtcctgccagggccaggggctctccctagcaggtgctcatatgctgtaagttccctccagatctctccacaaggaggcatggaaaggctgtagttgttcacctgcccaagaactaggaggtctggggtgggagagtcagcctgctctggatgctgaaagaatgtctgtttttccttttagAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGgtaagacaggggtctagcctgggtttgcacaggattgcggaagtgatgaacccgcaataaccctgcctggatgagggagtgggaagaaattagtagatgtgggaatgaatgatgaggaatggaaacagcggttcaagacctgcccagagctgggtggggtctctcctgaatccctctcaccatctctgactttccattctaagcactttgaggatgagtttctagcttcaatagaccaaggactctctcctaggcctctgtattcctttcaacagctccactgtcaagagagccagagagagcttctgggtggcccagctgtgaaatttctgagtcccttagggatagccctaaacgaaccagatcatcctgaggacagccaagaggttttgccttctttcaagacaagcaacagtactcacataggctgtgggcaatggtcctgtctctcaagaatcccctgccactcctcacacccaccctgggcccatattcatttccatttgagttgttcttattgagtcatccttcctgtggtagcggaactcactaaggggcccatctggacccgaggtattgtgatgataaattctgagcacctaccccatccccagaagggctcagaaataaaataagagccaagtctagtcggtgtttcctgtcttgaaacacaatactgttggccctggaagaatgcacagaatctgtttgtaaggggatatgcacagaagctgcaagggacaggaggtgcaggagctgcaggcctcccccacccagcctgctctgccttggggaaaaccgtgggtgtgtcctgcaggccatgcaggcctgggacatgcaagcccataaccgctgtggcctcttggttttacagATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGgtgaggggccttgaagctgggagtggggtttagggacgcgggtctctgggtgcatcctaagctctgagagcaaacctccctgcagggtcttgcttttaagtccaaagcctgagcccaccaaactctcctacttcttcctgttacaaattcctcttgtgcaataataatggcctgaaacgctgtaaaatatcctcatttcagccgcctcagttgcacttctcccctatgaggtaggaagaacagttgtttagaaacgaagaaactgaggccccacagctaatgagtggaggaagagagacacttgtgtacaccacatgccttgtgttgtacttctctcaccgtgtaacctcctcatgtcctctctccccagtacggctctcttagctcagtagaaagaagacattacactcatattacaccccaatcctggctagagtctccgcaccctcctcccccagggtccccagtcgtcttgctgacaactgcatcctgttccatcaccatcaaaaaaaaactccaggctgggtgcgggggctcacacctgtaatcccagcactttgggaggcagaggcaggaggagcacaggagctggagaccagcctgggcaacacagggagaccccgcctctacaaaaagtgaaaaaattaaccaggtgtggtgctgcacacctgtagtcccagctacttaagaggctgagatgggaggatcgcttgagccctggaatgttgaggctacaatgagctgtgattgcgtcactgcactccagcctggaagacaaagcaagatcctgtctcaaataataaaaaaaataagaactccagggtacatttgctcctagaactctaccacatagccccaaacagagccatcaccatcacatccctaacagtcctgggtcttcctcagtgtccagcctgacttctgttcttcctcattccagATCTGCAAGATTGTAAGACAGCCTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGCAATGCCACCAACTGGATCCTACCCGAATTTATGATTAAGATTGCTGAAGAGCTGCCAAACACTGCTGCCACCCCCTCTGTTCCCTTATTGCTGCTTGTCACTGCCTGACATTCACGGCAGAGGCAAGGCTGCTGCAGCCTCCCCTGGCTGTGCACATTCCCTCCTGCTCCCCAGAGACTGCCTCCGCCATCCCACAGATGATGGATCTTCAGTGGGTTCTCTTGGGCTCTAGGTCCTGCAGAATGTTGTGAGGGGTTTATTTTTTTTTAATAGTGTTCATAAAGAAATACATAGTATTCTTCTTCTCAAGACGTGGGGGGAAATTATCTCATTATCGAGGCCCTGCTATGCTGTGTATCTGGGCGTGTTGTATGTCCTGCTGCCGATGCCTTCATTAAAATGATTTGGAAGAGCAGA(SEQ ID NO:747)
上文小写的核苷酸是非翻译区或内含子,并且大写的核苷酸是外显子。
>X02592.1人T细胞受体α链(TCR-α)mRNA
TTTTGAAACCCTTCAAAGGCAGAGACTTGTCCAGCCTAACCTGCCTGCTGCTCCTAGCTCCTGAGGCTCAGGGCCCTTGGCTTCTGTCCGCTCTGCTCAGGGCCCTCCAGCGTGGCCACTGCTCAGCCATGCTCCTGCTGCTCGTCCCAGTGCTCGAGGTGATTTTTACCCTGGGAGGAACCAGAGCCCAGTCGGTGACCCAGCTTGGCAGCCACGTCTCTGTCTCTGAAGGAGCCCTGGTTCTGCTGAGGTGCAACTACTCATCGTCTGTTCCACCATATCTCTTCTGGTATGTGCAATACCCCAACCAAGGACTCCAGCTTCTCCTGAAGTACACATCAGCGGCCACCCTGGTTAAAGGCATCAACGGTTTTGAGGCTGAATTTAAGAAGAGTGAAACCTCCTTCCACCTGACGAAACCCTCAGCCCATATGAGCGACGCGGCTGAGTACTTCTGTGCTGTGAGTGATCTCGAACCGAACAGCAGTGCTTCCAAGATAATCTTTGGATCAGGGACCAGACTCAGCATCCGGCCAAATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGATCTGCAAGATTGTAAGACAGCCTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGTAATGCCACCAACTGGATCCTACCCGAATTTATGATTAAGATTGCTGAAGAGCTGCCAAACACTGCTGCCACCCCCTCTGTTCCCTTATTGCTGCTTGTCACTGCCTGACATTCACGGCAGAGGCAAGGCTGCTGCAGCCTCCCCTGGCTGTGCACATTCCCTCCTGCTCCCCAGAGACTGCCTCCGCCATCCCACAGATGATGGATCTTCAGTGGGTTCTCTTGGGCTCTAGGTCCTGGAGAATGTTGTGAGGGGTTTATTTTTTTTTAATAGTGTTCATAAAGAAATACATAGTATTCTTCTTCTCAAGACGTGGGGGGAAATTATCTCATTATCGAGGCCCTGCTATGCTGTGTGTCTGGGCGTGTTGTATGTCCTGCTGCCGATGCCTTCATTAAAATGATTTGGAA(SEQID NO:748)
“T细胞受体β恒定区1多肽(TRBC1)”意指与NCBI登录号P01850或其片段具有至少约85%氨基酸序列同一性并且具有免疫调节活性的蛋白质。下文提供了示例性氨基酸序列。
>sp|P01850|TRBC1_人T细胞受体β恒定区1OS=智人OX=9606GN=TRBC1PE=1SV=4
DLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF(SEQ ID NO:749)
“T细胞受体β恒定区1多核苷酸(TRBC1)”意指编码TRBC1多肽的核酸。下文提供了示例性TRBC1核酸序列。
>X00437.1
CTGGTCTAGAATATTCCACATCTGCTCTCACTCTGCCATGGACTCCTGGACCTTCTGCTGTGTGTCCCTTTGCATCCTGGTAGCGAAGCATACAGATGCTGGAGTTATCCAGTCACCCCGCCATGAGGTGACAGAGATGGGACAAGAAGTGACTCTGAGATGTAAACCAATTTCAGGCCACAACTCCCTTTTCTGGTACAGACAGACCATGATGCGGGGACTGGAGTTGCTCATTTACTTTAACAACAACGTTCCGATAGATGATTCAGGGATGCCCGAGGATCGATTCTCAGCTAAGATGCCTAATGCATCATTCTCCACTCTGAAGATCCAGCCCTCAGAACCCAGGGACTCAGCTGTGTACTTCTGTGCCAGCAGTTTCTCGACCTGTTCGGCTAACTATGGCTACACCTTCGGTTCGGGGACCAGGTTAACCGTTGTAGAGGACCTGAACAAGGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTGTGCCTGGCCACAGGCTTCTTCCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTTACCTCGGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTCAAGAGAAAGGATTTCTGAAGGCAGCCCTGGAAGTGGAGTTAGGAGCTTCTAACCCGTCATGGTTCAATACACATTCTTCTTTTGCCAGCGCTTCTGAAGAGCTGCTCTCACCTCTCTGCATCCCAATAGATATCCCCCTATGTGCATGCACACCTGCACACTCACGGCTGAAATCTCCCTAACCCAGGGGGAC(SEQ ID NO:750)
“T细胞受体β恒定区2多肽(TRBC2)”意指与NCBI登录号A0A5B9或其片段具有至少约85%氨基酸序列同一性并且具有免疫调节活性的蛋白质。下文提供了示例性氨基酸序列。
.>sp|A0A5B9|TRBC2_人T细胞受体β恒定区2OS=智人OX=9606GN=TRBC2PE=1SV=2
DLKNVFPPKVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSESYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDSRG(SEQ ID NO:751)
“T细胞受体β恒定区2多核苷酸(TRBC2)”意指编码TRAC多肽的核酸。下文提供了示例性TRBC2核酸序列。
>NG_001333.2:655095-656583智人7号染色体上的T细胞受体β基因座(TRB)
AGGACCTGAAAAACGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTATGCCTGGCCACAGGCTTCTACCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGGTGAGTGGGGCCTGGGGAGATGCCTGGAGGAGATTAGGTGAGACCAGCTACCAGGGAAAATGGAAAGATCCAGGTAGCGGACAAGACTAGATCCAGAAGAAAGCCAGAGTGGACAAGGTGGGATGATCAAGGTTCACAGGGTCAGCAAAGCACGGTGTGCACTTCCCCCACCAAGAAGCATAGAGGCTGAATGGAGCACCTCAAGCTCATTCTTCCTTCAGATCCTGACACCTTAGAGCTAAGCTTTCAAGTCTCCCTGAGGACCAGCCATACAGCTCAGCATCTGAGTGGTGTGCATCCCATTCTCTTCTGGGGTCCTGGTTTCCTAAGATCATAGTGACCACTTCGCTGGCACTGGAGCAGCATGAGGGAGACAGAACCAGGGCTATCAAAGGAGGCTGACTTTGTACTATCTGATATGCATGTGTTTGTGGCCTGTGAGTCTGTGATGTAAGGCTCAATGTCCTTACAAAGCAGCATTCTCTCATCCATTTTTCTTCCCCTGTTTTCTTTCAGACTGTGGCTTCACCTCCGGTAAGTGAGTCTCTCCTTTTTCTCTCTATCTTTCGCCGTCTCTGCTCTCGAACCAGGGCATGGAGAATCCACGGACACAGGGGCGTGAGGGAGGCCAGAGCCACCTGTGCACAGGTGCCTACATGCTCTGTTCTTGTCAACAGAGTCTTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCTTGCTAGGGAAGGCCACCTTGTATGCCGTGCTGGTCAGTGCCCTCGTGCTGATGGCCATGGTAAGGAGGAGGGTGGGATAGGGCAGATGATGGGGGCAGGGGATGGAACATCACACATGGGCATAAAGGAATCTCAGAGCCAGAGCACAGCCTAATATATCCTATCACCTCAATGAAACCATAATGAAGCCAGACTGGGGAGAAAATGCAGGGAATATCACAGAATGCATCATGGGAGGATGGAGACAACCAGCGAGCCCTACTCAAATTAGGCCTCAGAGCCCGCCTCCCCTGCCCTACTCCTGCTGTGCCATAGCCCCTGAAACCCTGAAAATGTTCTCTCTTCCACAGGTCAAGAGAAAGGATTCCAGAGGCTAG(SEQ ID NO:752)
如本文所用,“转导”意指经由病毒载体将基因或遗传物质转移至细胞。
如本文所用,“转化”是指在通过引入外源核酸产生的细胞中引入遗传变化的过程。
“转染”是指经由化学或物理方式将基因或遗传物质转移至细胞。
“易位”意指非同源染色体之间的核酸区段的重排。
“跨膜结构域”意指插入到脂质双层(诸如细胞或病毒或病毒样粒子的脂质双层)中的氨基酸序列。跨膜结构域可用于将感兴趣的蛋白质(例如,CAR)锚定至膜。跨膜结构域可以来源于天然来源或合成来源。在来源是天然的的情况下,结构域可来源于任何膜结合或跨膜蛋白。用于所公开的CAR的跨膜结构域可以至少包括T细胞受体CD28、CD3ε、CD45、CD4、CD5、CD8、CD9、CD16、CD22、CD33、CD37、CD64、CD80、CD86、CD134、CD137、CD154的α、β或ζ链的跨膜区。在一些实施方案中,跨膜结构域来源于CD4、CD8α、CD28和CD3ζ。在一些实施方案中,跨膜结构域是CD8α铰链和跨膜结构域。
如本文所使用,术语“治疗(treat)”、“治疗(treating)”、“治疗(treatment)”等是指减少或改善病症和/或与其相关的症状或获得期望的药理学和/或生理作用。应当理解,尽管不排除,但治疗病症或病状不需要完全消除病症、病状或与其相关的症状。在一些实施方案中,作用是治疗性的,即不限于,所述作用部分地或完全地减少、减弱、废除、减轻、缓解、降低疾病和/或可归因于所述疾病的不利症状的强度或治愈疾病和/或可归因于所述疾病的不利症状。在一些实施方案中,作用是预防性的,即,所述作用保护或预防疾病或病状的发生或复发。为此,目前公开的方法包括施用治疗有效量的如本文所述的组合物。
“尿嘧啶糖基化酶抑制剂”或“UGI”意指抑制尿嘧啶切除修复系统的剂。包含胞苷脱氨酶的碱基编辑器将胞嘧啶转化成尿嘧啶,然后通过DNA复制或修复将尿嘧啶转化为胸腺嘧啶。在碱基编辑器中包含尿嘧啶DNA糖基化酶(UGI)抑制剂防止将U变回C的碱基切除修复。示例性UGI包含如下氨基酸序列:
>splP14739IUNGI_BPPB2尿嘧啶-DNA糖基化酶抑制剂
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(SEQ ID NO:231)。
术语“载体”是指将核酸序列引入细胞从而产生转化细胞的方式。载体包括质粒、转座子、噬菌体、病毒、脂质体和附加体。“表达载体”是包含待在受体细胞中表达的核苷酸序列的核酸序列。表达载体可包括额外的核酸序列以促进和/或有助于引入序列(诸如起始序列、终止序列、增强子序列、启动子序列和分泌序列)的表达。
本文提供的范围被理解为所述范围内的所有值的简写。例如,1至50的范围被理解为包括由1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50组成的组的任何数字、数字组合或子范围。
在本文中的变量的任何定义中列举化学基团的列表包括将所述变量定义为任何单个基团或所列基团的组合。关于本文的变量或方面的实施方案的列举包括作为任何单一实施方案或与任何其他实施方案或其部分组合的实施方案。
所有术语旨在按照本领域技术人员所理解的那样来理解。除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。
在本申请中,除非另外明确说明,否则单数的使用包括复数。必须注意的是,除非上下文另有明确规定,否则如说明书中所用,单数形式“一种/个(a)”、“一种/个(an)”和“所述(the)”包括复数指示物。在本申请中,除非另有说明,否则“或”的使用意指“和/或”。此外,术语“包括(including)”以及其它形式,诸如“包括(include)”、“包括(includes)”和“包括(included)”的使用不受限制。
如本说明书和权利要求中所用,词语“包含(comprising)”(以及包含(comprising)的任何形式,诸如“包含(comprise)”和“包含(comprises)”)、“具有(having)”(以及具有(having)的任何形式,诸如“具有(have)”和“具有(has)”)、“包括(including)”(以及包括(including)的任何形式,诸如“包括(includes)”和“包括(include)”)或“含有(containing)”(以及含有(containing)的任何形式,诸如“含有(contains)”和“含有(contain)”)是包含性的或开放式的,并且不排除额外的、未列举的元素或方法步骤。考虑本说明书中讨论的任何实施方案可以以本公开的任何方法或组合物实现,且反之亦然。此外,本公开的组合物可以用于实现本公开的方法。
术语“约”或“大约”意指在由本领域普通技术人员确定的特定值的可接受误差范围内,所述可接受误差范围将部分取决于所述值是如何测量或确定的,即测量系统的限制。例如,根据本领域的实践,“约”可以意指在1个或超过1个标准偏差内。或者,“约”可以意指给定值的至多20%、至多10%、至多5%或至多1%的范围。或者,特别是关于生物系统或过程,所述术语可以意指在值的数量级内,例如,5倍内、2倍内。当特定值在本申请和权利要求书中描述时,除非另外规定,否则应假定术语“约”意指在特定值的可接受误差范围内。
在本说明书中提及“一些实施方案(some embodiments)”、“一个实施方案(anembodiment)”、“一个实施方案(one embodiment)”或“其他实施方案(otherembodiments)”意指结合所述实施方案描述的特定特征、结构或特性包括在本公开的至少一些实施方案中,但不一定包括在本公开的所有实施方案中。
附图说明
图1是可用于靶向T-ALL肿瘤细胞的抗自相残杀CD2 CAR-T的示意图。
图2是示意图,其描绘了表达含有CD2共刺激结构域的抗CD2嵌合抗原受体(CAR)(或者,CD2 CAR)的T细胞和肿瘤细胞。
图3描绘了示例性抗CD2嵌合抗原受体(CAR)的结构和氨基酸序列。抗CD2 CAR结构包括前导肽序列、scFv轻链序列、(GGGGS)3(SEQ ID NO:381)接头序列、scFv重链序列、CD8α铰链和跨膜结构域序列、CD2细胞质结构域序列和CD3ζ结构域序列。图3中示出的序列对应于SEQ ID NO:754和381。
图4描绘了人CD2蛋白的结构和氨基酸序列。人CD2蛋白结构包括细胞外结构域、铰链和跨膜结构域以及CD2细胞质结构域。图4中示出的序列对应于SEQ ID NO:734。
图5提供了对应于流式细胞术图的直方图,其描绘了使用六种不同的sgRNA使D7T细胞中的CD2表达失活。单克隆抗体克隆RPA2.0用于检测CD2。每次测试使用5μL CD2-APC。仅电穿孔(EP)用作阴性对照。
图6是描绘用CD2 CAR-T细胞治疗患者的临床方案的流程图。
图7A-图7E提供了流式细胞术图,其证明了指定抗CD2嵌合抗原受体(CAR)在T细胞表面上表达。取样用于图7A-图7E的制备的同一细胞群被取样用于图8A-图8F的制备。在图7A-图7E中,符号“LV”后跟数字表示用编码对应于所述数字的抗CD2 CAR的慢病毒载体(LV)转导的细胞群(例如,LV118代表使用编码pCAR_BTx118((SEQ ID NO:754)的慢病毒载体转导的细胞,参见表20),“UTD”代表含有已根据本文提供的方法使用碱基编辑敲除的CD2基因的“未转导细胞”,而“仅EP”代表“仅电穿孔(EP)”,代表含有未编辑的功能性CD2基因并且未用任何慢病毒载体转导的细胞。用于图7A-图7E的制备的设门如下:针对单峰>活细胞设门。表面表达抗CD2嵌合抗原受体(CAR)的细胞落在每个图右侧的轮廓区域内;例如,LV129显示抗CD2 CAR的低表面表达,而LV123显示抗CD2 CAR的相对高表面表达。在转染后第10天进行测量。图7A-图7E的每个图中轮廓区域内的数字代表发现表面表达抗CD2 CAR(“CAR+”)并因此落入轮廓区域内的计数的总细胞的百分比。
图8A-图8F提供了流式细胞术图、一组直方图,其证明了用指定抗CD2 CAR构建体转导的细胞群针对根据本文提供的方法使用碱基编辑对CD2基因表达进行敲除的细胞进行自我纯化,以及表格,所述表格提供了图8A-图8F中使用的样品名称、子集名称和慢病毒载体。取样用于图7A-图7E的制备的同一细胞群被取样用于图8A-图8F的制备。在图8A-图8E中,符号“LV”后跟数字表示用编码对应于所述数字的抗CD2 CAR的慢病毒载体(LV)转导的细胞群(例如,LV118代表使用编码pCAR_BTx118((SEQ ID NO:754)的慢病毒载体转导的细胞,参见表20),“UTD”代表含有已根据本文提供的方法使用碱基编辑敲除的CD2基因的“未转导细胞”,而“仅EP”代表“仅电穿孔(EP)”,代表含有未编辑的功能性CD2基因并且未用任何慢病毒载体转导的细胞。用于图8A-图8E的制备的设门如下:针对单峰>活细胞>CD45+设门。表面表达CD2的细胞落在每个图左侧的轮廓区域外;例如,LV129显示CD2的相对高表面表达,而LV123显示抗CD2CAR的相对低表面表达。具有指定抗CD2 CAR的高表面表达的细胞群对应地显示出低CD2表面表达至无CD2表面表达。因此,不受理论的束缚,通过将图8A-图8E与图7A-图7E进行比较,证明了有效表达抗CD2嵌合抗原受体(CAR)的细胞群针对CD2表达被敲除的细胞进行自我纯化。在转染后第10天进行测量。图8F提供了对应于图8A-图8F的流式细胞术图的直方图。在图8F中,图中呈现的直方图从上到下的顺序对应于表中呈现的直方图的描述的顺序(图例)。特别地,在图8F中,呈现的直方图从上到下分别对应于F2(仅EP(无CD2编辑))、F1(UTD)、E6(LV123(无CD2编辑))、E5(LV122(无CD2编辑))、E4(LV121(无CD2编辑))、E3(LV120(无CD2编辑))、E2(LV119(无CD2编辑))、E1(LV118(无CD2编辑))、D12(LV129(CD2编辑))、D11(LV128(CD2编辑))、D10(LV127(CD2编辑))、D9(LV126(CD2编辑))、D8(LV125(CD2编辑))、D7(LV124(CD2编辑))、D6(LV123(CD2编辑))、D5(LV122(CD2编辑))、D4(LV121(CD2编辑))、D3(LV120(CD2编辑))、D2(LV119(CD2编辑))、D1(LV118(CD2编辑))。图8A-图8E的每个图中轮廓区域内的数字代表无法表面表达CD2(“CD2阴性”)并因此落入轮廓区域内的计数的总细胞的百分比。
图9提供了条形图,其示出了用指定慢病毒载体转导后第10天取得的总细胞计数。在图9中,符号“LV”后跟数字表示用编码对应于所述数字的抗CD2 CAR的慢病毒载体(LV)转导的细胞群(例如,LV118代表使用编码pCAR_BTx118((SEQ ID NO:754)的慢病毒载体转导的细胞,参见表20),“UTD”代表“未转染的细胞”,“CD2编辑”表示含有根据本文提供的方法敲除的CD2基因的细胞群,并且“无编辑”表示含有未根据本文提供的方法敲除的功能性CD2基因的细胞群。偶数编号的抗CD2 CAR仅包含CD2共刺激结构域,而奇数编号的抗CD2 CAR仅包含CD28共刺激结构域。不受理论的束缚,编辑的(“CD2编辑”)和未编辑的(“无编辑”)包含含有CD28共刺激结构域的CAR的细胞之间的较大差异与CD28共刺激结构域具有比包含CD2共刺激结构域的对应CAR更强的共刺激效应相一致。
图10A-图10D提供了流式细胞术图,其证明了有必要敲除表达抗CD2嵌合抗原受体(CAR)的细胞群中的CD2基因的表达以防止自相残杀。在图10A-图10D中,符号“LV”后跟数字表示用编码对应于所述数字的抗CD2 CAR的慢病毒载体(LV)转导的细胞群(例如,LV118代表使用编码pCAR_BTx118((SEQ ID NO:754)的慢病毒载体转导的细胞,参见表20),“CD2编辑”表示含有根据本文提供的方法敲除的CD2基因的细胞群,并且“无编辑”表示含有未根据本文提供的方法敲除的功能性CD2基因的细胞群。图10A-图10D的每个图中轮廓区域内的数字代表发现表面表达抗CD2 CAR(“CAR+”)并因此落入轮廓区域内的计数的总细胞的百分比。用于图10A-图10D的制备的设门如下:针对单峰>活细胞设门。从图10A-图10D可以看出,包含功能性CD2基因并表达指定CAR构建体的细胞群通过彼此靶向和杀伤来造成自相残杀。
图11A-图11D提供了流式细胞术图,其证明了有必要敲除表达抗CD2嵌合抗原受体(CAR)的细胞群中的CD2基因的表达以防止自相残杀。在图11A-11D中,符号“LV”后跟数字表示用编码对应于所述数字的抗CD2 CAR的慢病毒载体(LV)转导的细胞群(例如,LV118代表使用编码pCAR_BTx118((SEQ ID NO:754)的慢病毒载体转导的细胞,参见表20),“CD2编辑”表示含有根据本文提供的方法敲除的CD2基因的细胞群,并且“无编辑”表示含有未根据本文提供的方法敲除的功能性CD2基因的细胞群。每个图中示出了落入轮廓区域内的活淋巴细胞。图11A-图11D的每个图中轮廓区域内的数字代表作为活淋巴细胞并因此落入轮廓区域内的总细胞的百分比。从图11A-图11D可以看出,包含功能性CD2基因并表达指定CAR构建体的细胞群通过彼此靶向和杀伤来造成自相残杀。
图12A和图12B提供了条形图,其证明了抗CD2 CAR-T细胞在CD2+癌细胞的存在下被激活并且仅显示出低水平的基底信号传导(tonic signaling)。将细胞与指定的癌细胞分离生长或共培养。CD2+癌细胞是Jurkat细胞(用于研究急性T细胞白血病等的永生化人T淋巴细胞系)。作为阴性对照,抗CD2 CAR-T细胞在不存在任何癌细胞或存在CD2-CCRF细胞(T淋巴母细胞样细胞系)的情况下生长。为了测量T细胞激活,测量了干扰素γ(IFN-γ)的水平。更高水平的干扰素γ(IFN-γ)表明更高的细胞激活。因此,图12A显示只有暴露于CD2+Jurkat细胞的抗CD2 CAR-T细胞显示出高水平的激活。图12B是图12A的分解图,其更详细地示出了在抗CD2 CAR-T细胞中观察到的低水平的基底激活。在图12A和图12B中,“UTD”代表未转导的细胞。
具体实施方案
本发明的特征在于具有增强的抗肿瘤活性和自相残杀抗性的遗传修饰的免疫细胞。本发明的特征还在于用于产生和使用这些修饰的免疫效应细胞(例如,T细胞或NK细胞)的方法。
本发明至少部分基于以下发现:抗CD2 CAR-T细胞在CD2+癌细胞的存在下被激活,但对自相残杀具有抗性。
修饰免疫效应细胞以表达嵌合抗原受体并敲除或敲低特定基因以减弱它们的表达可能对免疫细胞功能具有的负面影响是使用包含如本文所述的胞苷脱氨酶或腺苷脱氨酶的碱基编辑器系统完成的。
自体、患者衍生的嵌合抗原受体T细胞(CAR-T)疗法已经证明在治疗一些癌症方面具有显著功效。虽然这些产品已经导致对患者的显著临床益处,但生成个性化疗法的需求产生了巨大的制造挑战和财务负担。同种异体CAR-T疗法被开发为这些挑战的潜在解决方案,其具有与自体产品相似的临床功效特征,同时使用来源于单一健康供体的细胞来治疗许多患者,从而大幅降低了商品成本和批次间差异。
大多数第一代同种异体CAR-T使用核酸酶在靶T细胞群中引入两个或更多个靶向基因组DNA双链断裂(DSB),这依赖于容易出错的DNA修复来生成以半随机方式敲除靶基因的突变。此类基于核酸酶的基因敲除策略旨在降低移植物抗宿主病和宿主排斥CAR-T的风险。然而,多个DSB的同时诱导导致最终细胞产物含有大规模基因组重排,诸如平衡和不平衡易位,以及相对高丰度的局部重排,包括倒位和大缺失。此外,随着由诱导的DSB进行的同时遗传修饰的数量增加,在处理的细胞群中观察到相当大的遗传毒性。这有可能显著降低每次制造运行的细胞扩增潜力,从而减少每个健康供体可以治疗的患者数量。
碱基编辑器(BE)是一类新兴的基因编辑试剂,其使能够对靶基因组DNA进行高效、用户定义的修饰,而不产生DSB。在此处,提出了一种产生同种异体CAR-T细胞的替代方式,即使用碱基编辑技术减少或消除可检测的基因组重排,同时改善细胞扩增。与仅核酸酶编辑策略相反,通过碱基编辑同时修饰一个或多个(例如,一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个基因座)产生高效的基因敲除,而没有可检测的易位事件。
在一些实施方案中,在免疫细胞中使用本文提供的碱基编辑组合物和方法来修饰至少一个或多个基因或其调控元件。在一些实施方案中,至少一个或多个基因或其调控元件包含选自CD2、TRAC、CD52、TRBC1、TRBC2、B2M和CIITA和PD-1的一个或多个基因。在一些实施方案中,至少一个或多个基因或其调控元件包含选自CD5、TRAC、CD52和CIITA和PD-1的一个或多个基因。在一些实施方案中,至少一个或多个基因或其调控元件包含选自CD3、CD7、TRAC、CD52和PD-1的一个或多个基因。在一些实施方案中,至少一个或多个基因或其调控元件包含选自TRAC、CD2、CD5、CD7、CD52和PD-1的一个或多个基因。在一些实施方案中,至少一个或多个基因或其调控元件选自ACAT1、ACLY、ADORA2A、AXL、B2M、BATF、BCL2L11、BTLA、CAMK2D、cAMP、CASP8、CBLB、CCR5、CD2、CD3D、CD3E、CD3G、CD4、CD5、CD7、CD8A、CD33、CD38、CD52、CD70、CD82、CD86、CD96、CD123、CD160、CD244、CD276、CDK8、CDKN1B、Chi3l1、CIITA、CISH、CSF2CSK、CTLA-4、CUL3、Cyp11a1、DCK、DGKA、DGKZ、DHX37、ELOB(TCEB2)、ENTPD1(CD39)、FADD、FAS、GATA3、IL6、IL6R、IL10、IL10RA、IRF4、IRF8、JUNB、Lag3、、LAIR-1(CD305)、LDHA、LIF、LYN、MAP4K4、MAPK14、MCJ、MEF2D、MGAT5、NR4A1、NR4A2、NR4A3、NT5E(CD73)、ODC1、OTULINL(FAM105A)、PAG1、PDCD1、PDIA3、PHD1(EGLN2)、PHD2(EGLN1)、PHD3(EGLN3)、PIK3CD、PIKFYVE、PPARa、PPARd、PRDMI1、PRKACA、PTEN、PTPN2、PTPN6、PTPN11、PVRIG(CD112R)、RASA2、RFXANK、SELPG/PSGL1、SIGLEC15、SLA、SLAMF7、SOCS1、Spry1、Spry2、STK4、SUV39、H1TET2、TGFbRII、TIGIT、Tim-3、TMEM222、TNFAIP3、TNFRSF8(CD30)、TNFRSF10B、TOX、TOX2、、TRAC、TRBC1、TRBC2、UBASH3A、VHL、VISTA、XBP1、YAP1和ZC3H12A。基因的多重编辑可能可用于产生具有改进治疗性质的CAR-T细胞疗法。这种方法解决了多重编辑的T细胞产品的已知限制,并且是向下一代基于细胞的精准疗法的有前途的发展。
在一个方面,本文提供了通用CAR-T细胞。在一些实施方案中,本文所述的CAR-T细胞是同种异体细胞。在一些实施方案中,通用CAR-T细胞是同种异体T细胞,其可以用于表达期望的CAR,并且可以普遍适用,无论供体和受体的免疫原性相容性如何。同种异体免疫细胞可来源于一个或多个供体。在某些实施方案中,同种异体免疫细胞来源于单个人供体。例如,同种异体T细胞可来源于单个健康人供体的PBMC。在某些实施方案中,同种异体免疫细胞来源于多个人供体。在一些实施方案中,可以如本文所述通过使用基因修饰在多个基因座(例如,三个、四个、五个、六个、七个、八个、九个、十个或更多个遗传基因座)处引入并发编辑来生成通用CAR-T细胞。如本文所述的修饰或并发修饰可以是由碱基编辑器生成的基因编辑,诸如碱基编辑。碱基编辑器可以是C碱基编辑器或A碱基编辑器。如本文所讨论的,碱基编辑可用于实现基因破坏,使得基因不表达。通过碱基编辑进行的修饰可用于实现基因表达的减少。在一些实施方案中,碱基编辑器可用于引入遗传修饰,使得编辑的基因不生成结构上或功能上可行的蛋白质产物。在一些实施方案中,修饰(诸如本文所述的并发修饰)可包括遗传编辑(诸如碱基编辑),使得基因产物的表达或功能性以任何方式改变。例如,与基线表达水平相比,基因产物的表达可以增强或上调。在一些实施方案中,基因产物的活性或功能性可由于碱基编辑或多个碱基编辑事件协同作用而上调。
在一些实施方案中,通用CAR-T细胞的生成可能优于自体T细胞(CAR-T),自体T细胞可能难以生成以供紧急使用。对于许多与工程改造自体T细胞以表达CAR并且最终在医疗紧急情况时获取用于移植的期望细胞产物的不确定性有关的情况,同种异体方法优于自体细胞制备。然而,对于同种异体T细胞或“现成”T细胞,重要的是仔细协商宿主对CAR-T细胞的反应性(HVGD)以及同种异体T细胞对宿主细胞的潜在敌意(GVHD)。鉴于这种情况,碱基编辑可以成功地用于生成多个同时基因编辑事件,使得(a)可以减少或下调抗原的表达以生成抗自相残杀的免疫细胞;(b)可以生成缺乏或表达少量内源T细胞受体的平台细胞类型,所述受体例如TCRα链(诸如经由TRAC的碱基编辑)或TCRβ链(诸如通过TRBC1/TRBC2的碱基编辑);和/或(c)可以减少或下调可能与宿主组织系统不相容的抗原的表达,反之亦然。
在一些实施方案中,本文所述的方法可以用于生成表达CAR-T的自体T细胞。在一些实施方案中,多个碱基编辑事件可以在单个电穿孔事件中完成,从而降低电穿孔事件相关的毒性。可以使用任何已知的用于将外源遗传物质掺入到细胞中的方法来替代电穿孔,并且本领域已知的此类方法特此考虑用于本文所述的任何方法。
在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的修饰的免疫效应细胞(例如,CAR-T细胞),所述免疫效应细胞缺乏CD2或具有降低的CD2水平并且表达含有CD2共刺激结构域的CD2嵌合抗原受体。在一些实施方案中,向受试者施用的CD2修饰的免疫细胞在一个或多个基因或调控元件(例如,CD52、TRAC、PD-1)中用本文提供的碱基编辑组合物和方法进一步修饰。
如本文所示,碱基编辑与CAR插入的组合是用于生成具有最小基因组重排的抗自相残杀同种异体T细胞的有用策略。基因的多重编辑还可用于产生具有改进治疗性质的CAR-T细胞疗法。这种方法解决了CAR-T疗法的已知限制,并且是向下一代基于细胞的精准疗法的有前途的发展。
靶基因的编辑
下表1、表2A和表2B中描述了可用于本公开的方法的示例性指导RNA间隔子。在一个实施方案中,含有表1中所列间隔子的gRNA分子也含有spCas9支架。在各种实施方案中,指导RNA包含本文所述的支架序列(例如,spCas9支架序列)。在一些实施方案中,指导RNA被设计成破坏剪接位点(即,剪接受体(SA)或剪接供体(SD)。在一些实施方案中,指导RNA被设计成使得碱基编辑导致提前终止密码子。表1、表2A和表2B提供了被设计成破坏剪接位点或导致提前终止密码子的gRNA靶序列的不完全列表。
表1.CD2指导RNA间隔序列和靶序列
表2A.gRNA靶序列和间隔序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
为了产生上述基因编辑,从受试者收集T细胞或NK细胞,并将其与两种或更多种指导RNA和核碱基编辑器多肽接触,所述核碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和胞苷脱氨酶或腺苷脱氨酶。或者,细胞可以是本领域已知的任何细胞类型或细胞系,包括免疫细胞(例如,T细胞或NK细胞)或永生化的人细胞系,诸如293T、K562或U20S。或者,可以使用原代细胞(例如,人)。细胞也可以从组织活检、手术、血液、血浆、血清或其他生物流体中获得。在一些实施方案中,使待编辑的细胞与至少一种核酸接触,其中至少一种核酸编码两种或更多种指导RNA和核碱基编辑器多肽,所述核碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和胞苷脱氨酶。在一些实施方案中,gRNA包含核苷酸类似物。这些核苷酸类似物可以抑制细胞过程中的gRNA降解。表1、表2A和表2B提供了待用于gRNA的靶序列。
核碱基编辑器
可用于本文所述的方法和组合物的是编辑、修饰或改变多核苷酸的靶核苷酸序列的核碱基编辑器。本文所述的核碱基编辑器通常包括多核苷酸可编程核苷酸结合结构域和核碱基编辑结构域(例如,腺苷脱氨酶或胞苷脱氨酶)。当与结合的指导多核苷酸(例如,gRNA)结合时,多核苷酸可编程核苷酸结合结构域可以特异性结合靶多核苷酸序列,从而将碱基编辑器定位到期望编辑的靶核酸序列。
在某些实施方案中,本文提供的核碱基编辑器包含一种或多种改善碱基编辑活性的特征。例如,本文提供的任何核碱基编辑器可包含具有降低的核酸酶活性的Cas9结构域。在一些实施方案中,本文提供的任何核碱基编辑器可具有不具有核酸酶活性的Cas9结构域(dCas9),或具有切割双链DNA分子的一条链的Cas9结构域,其被称为Cas9切口酶(nCas9)。不希望受任何特定理论的束缚,催化残基(例如,H840)的存在维持Cas9切割与靶向核碱基相对的非编辑(例如,非脱氨基)链的活性。催化残基的突变(例如,D10至A10)防止含有靶向残基(例如,A或C)的编辑(例如,脱氨基)链的切割。此类Cas9变体可以根据gRNA定义的靶序列在特定位置处生成单链DNA断裂(切口),从而导致非编辑链的修复,最终产生非编辑链上的核碱基变化。
多核苷酸可编程核苷酸结合结构域
多核苷酸可编程核苷酸结合结构域与多核苷酸(例如,RNA、DNA)结合。碱基编辑器的多核苷酸可编程核苷酸结合结构域本身可以包含一个或多个结构域(例如,一个或多个核酸酶结构域)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域的核酸酶结构域可以包含核酸内切酶或核酸外切酶。核酸内切酶可以切割双链核酸的单链或双链核酸分子的两条链。在一些实施方案中,多核苷酸可编程核苷酸结合结构域的核酸酶结构域可以切割靶多核苷酸的零条、一条或两条链。
可掺入到碱基编辑器中的多核苷酸可编程核苷酸结合结构域的非限制性实例包括CRISPR蛋白衍生结构域、限制性核酸酶、大范围核酸酶、TAL核酸酶(TALEN)和锌指核酸酶(ZFN)。在一些实施方案中,碱基编辑器包含多核苷酸可编程核苷酸结合结构域,所述多核苷酸可编程核苷酸结合结构域包含天然或修饰的蛋白质或其部分,其能够在CRISPR(即,成簇规律间隔短回文重复序列)介导的核酸修饰期间经由结合的指导核酸来结合核酸序列。这种蛋白质在本文中被称为“CRISPR蛋白”。因此,本文公开了包含多核苷酸可编程核苷酸结合结构域的碱基编辑器,所述多核苷酸可编程核苷酸结合结构域包含CRISPR蛋白的全部或部分(即,包含CRISPR蛋白的全部或部分作为结构域的碱基编辑器,所述结构域也称为碱基编辑器的“CRISPR蛋白衍生结构域”)。与野生型或天然版本的CRISPR蛋白相比,可以对掺入到碱基编辑器中的CRISPR蛋白衍生结构域进行修饰。例如,如下所述,CRISPR蛋白衍生结构域相对于野生型或天然版本的CRISPR蛋白可以包含一个或多个突变、插入、缺失、重排和/或重组。
可以用于本文的Cas蛋白包括1类和2类。Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(也称为Csn1或Csx12)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1(例如,SEQ ID NO:232)、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i和Cas12j/CasΦ、CARF、DinG、其同系物或其修饰版本。CRISPR酶可以指导靶序列处(诸如靶序列内和/或靶序列的互补链内)的一条或两条链的切割。例如,CRISPR酶可以指导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个碱基对内的一条或两条链的切割。
可以使用编码CRISPR酶的载体,所述CRISPR酶相对于对应的野生型酶是突变的,使得突变的CRISPR酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。Cas蛋白(例如,Cas9、Cas12)或Cas结构域(例如,Cas9、Cas12)可以指代与野生型示例性Cas多肽或Cas结构域具有至少或至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性和/或序列同源性的多肽或结构域。Cas(例如,Cas9、Cas12)可以指代Cas蛋白的野生型或修饰形式,其可以包含氨基酸变化,诸如缺失、插入、取代、变异、突变、融合、嵌合或它们的任何组合。
在一些实施方案中,碱基编辑器的CRISPR蛋白衍生结构域可以包括来自以下的Cas9的全部或部分:溃疡棒状杆菌(Corynebacterium ulcerans)(NCBI档案号:NC_015683.1、NC_017317.1);白喉棒状杆菌(Corynebacterium diphtheria)(NCBI档案号:NC_016782.1、NC_016786.1);栖蚜蝇螺原体(Spiroplasma syrphidicola)(NCBI档案号:NC_021284.1);中间普雷沃氏菌(Prevotella intermedia)(NCBI档案号:NC_017861.1);台湾螺原体(Spiroplasma taiwanense)(NCBI档案号:NC_021846.1);鱼型链球菌(Streptococcus iniae)(NCBI档案号:NC_021314.1);波罗的海贝尔氏菌(Belliellabaltica)(NCBI档案号:NC_018010.1);扭曲冷弯曲菌(Psychroflexus torquis)(NCBI档案号:NC_018721.1);嗜热链球菌(Streptococcus thermophilus)(NCBI档案号:YP_820832.1);无害李斯特氏菌(Listeria innocua)(NCBI档案号:NP_472073.1);空肠弯曲菌(Campylobacter jejuni)(NCBI档案号:YP_002344900.1);脑膜炎奈瑟菌(Neisseriameningitidis)(NCBI档案号:YP_002342100.1)、化脓性链球菌或金黄色葡萄球菌(Staphylococcus aureus)。
Cas9核酸酶序列和结构是本领域技术人员众所周知的(参见,例如,“Completegenome sequence of an Ml strain of Streptococcus p yogenes.”Ferretti等人,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,等人,Nature 471:602-607(2011);和“A programmable dual-RNA-guided DNA endonuclease in ad aptivebacterial immunity.”Jinek M.,等人,Science 337:816-821(2012),所述文献中的每一者的全部内容通过引用并入本文)。Cas9直系同源物已经在各种物种中描述,包括但不限于化脓性链球菌和嗜热链球菌。基于本公开,其他合适的Cas9核酸酶和序列对于本领域技术人员将是显而易见的,并且此类Cas9核酸酶和序列包括来自Chylin ski,Rhun和Charpentier,“The tracrRNA and Cas9families of type II CRISPR-Cas immunitysystems”(2013)RNA Biology 10:5,726-737中公开的生物体和基因座的Cas9序列;所述文献的全部内容通过引用并入本文。
高保真Cas9结构域
本公开的一些方面提供了高保真Cas9结构域。高保真Cas9结构域是本领域已知的并且例如在Kleinstiver,B.P.,等人“High-fidelity C RISPR-Cas9nucleases with nodetectable genome-wide off-target eff ects.”Nature 529,490-495(2016);和Slaymaker,I.M.,等人“Rationa lly engineered Cas9nucleases with improvedspecificity.”Science 351,84-88(2015)中描述;所述文献中的每一者的全部内容通过引用并入本文。示例性高保真Cas9结构域在序列表中作为SEQ ID NO:233提供。在一些实施方案中,相对于对应的野生型Cas9结构域,高保真Cas9结构域是包含一个或多个突变的工程化Cas9结构域,所述突变减少Cas9结构域与DNA的糖-磷酸骨架之间的静电相互作用。减少了与DNA的糖-磷酸骨架的静电相互作用的高保真Cas9结构域具有较少的脱靶效应。在一些实施方案中,Cas9结构域(例如,野生型Cas9结构域(SEQ ID NO:197和200))包含一个或多个突变,所述突变减少Cas9结构域与DNA的糖-磷酸骨架之间的缔合。在一些实施方案中,Cas9结构域包含一个或多个突变,所述突变将Cas9结构域与DNA的糖-磷酸骨架之间的缔合减少至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%或至少70%。
在一些实施方案中,本文提供的任何Cas9融合蛋白包含D10A、N497X、R661X、Q695X和/或Q926X突变中的一种或多种,或包含本文提供的任何氨基酸序列中的对应突变,其中X是任何氨基酸。。在一些实施方案中,高保真Cas9酶是SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1或超准确Cas9变体(HypaCas9)。在一些实施方案中,修饰的Cas9eSpCas9(1.1)含有丙氨酸取代,所述丙氨酸取代削弱HNH/RuvC凹槽与非靶DNA链之间的相互作用,从而防止脱靶位点处的链分开和切割。类似地,SpCas9-HF1通过丙氨酸取代来降低脱靶编辑,所述丙氨酸取代破坏Cas9与DNA磷酸骨架的相互作用。HypaC as9在REC3结构域中含有突变(SpCas9N692A/M694A/Q695A/H698A),所述突变增加Cas9校对和靶标区分。所有三种高保真酶生成的脱靶编辑都少于野生型Cas9。
排他性降低的Cas9结构域
通常,Cas9蛋白,诸如来自化脓性链球菌的Cas9(spCas9),需要“原间隔序列临近基序(PAM)”或PAM样基序,它是2-6个碱基对的DNA序列,紧跟CRISPR细菌适应性免疫系统中的Cas9核酸酶靶向的DNA序列之后。NGG PAM序列的存在需要结合特定的核酸区域,其中“NGG”中的“N”是腺苷(A)、胸苷(T)或胞嘧啶(C),并且G是鸟苷。这可能会限制在基因组内编辑期望碱基的能力。在一些实施方案中,本文提供的碱基编辑融合蛋白可能需要放置在精确位置,例如包含位于PAM上游的靶碱基的区域。参见例如,Komor,A.C.,等人,“Programmable editing of a target base in genomic DNA without double-strandedDNA cleavage”Nature 533,420-424(2016),所述文献的全部内容特此通过引用并入。能够结合PAM序列的spCas9蛋白的示例性多肽序列在序列表中作为SEQ ID NO:197、201和234-237提供。因此,在一些实施方案中,本文提供的任何融合蛋白可含有Cas9结构域,所述Cas9结构域能够结合不含有规范(例如,NGG)PAM序列的核苷酸序列。结合非规范PAM序列的Cas9结构域已经在本领域中进行描述,并且对于技术人员将是显而易见的。例如,结合非规范PAM序列的Cas9结构域已经在Kleinstiver,B.P.,等人,“Engineered CRISPR-Cas9nucleases with altered PAM specificities”Nature 523,481-485(2015);和Kleinstiver,B.P.,等人,“Broadening the targeting range of Staphylococcusaureus CRISPR-Cas9by modifying PAM recognition”Nature Biotechnology 33,1293-1298(2015)中描述;每篇文献的全部内容特此通过引用并入。
切口酶
在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以包含切口酶结构域。本文中的术语“切口酶”是指包含核酸酶结构域的多核苷酸可编程核苷酸结合结构域,其能够仅切割双链核酸分子(例如,DNA)中的两条链中的一条链。在一些实施方案中,通过将一个或多个突变引入到活性多核苷酸可编程核苷酸结合结构域中,切口酶可以来源于完全催化活性(例如,天然)形式的多核苷酸可编程核苷酸结合结构域。例如,在多核苷酸可编程核苷酸结合结构域包含来源于Cas9的切口酶结构域的情况下,Cas9衍生的切口酶结构域可以包括D10A突变和位置840处的组氨酸。在此类实施方案中,残基H840保留催化活性并且因此可以切割核酸双链体的单链。在另一个实例中,Cas9衍生的切口酶结构域可以包含H840A突变,而位置10处的氨基酸残基仍然是D。在一些实施方案中,通过去除切口酶活性不需要的核酸酶结构域的全部或部分,切口酶可以来源于完全催化活性(例如,天然)形式的多核苷酸可编程核苷酸结合结构域。例如,在多核苷酸可编程核苷酸结合结构域包含来源于Cas9的切口酶结构域的情况下,Cas9衍生的切口酶结构域可以包含RuvC结构域或HNH结构域的全部或部分的缺失。
在一些实施方案中,野生型Cas9对应于或包含以下氨基酸序列:
(单下划线:HNH结构域;双下划线:RuvC结构域)。/>
在一些实施方案中,被包含切口酶结构域(例如,Cas9衍生的切口酶结构域、Cas12衍生的切口酶结构域)的碱基编辑器切割的核酸双链体靶多核苷酸序列的链是未被碱基编辑器编辑的链(即,被碱基编辑器切割的链与包含待编辑碱基的链相反)。在其他实施方案中,包含切口酶结构域(例如,Cas9衍生的切口酶结构域、Cas12衍生的切口酶结构域)的碱基编辑器可以切割被靶向用于编辑的DNA分子的链。在此类实施方案中,非靶向链未被切割。
在一些实施方案中,Cas9核酸酶具有无活性的(例如,失活的)DNA切割结构域,也就是说,Cas9是切口酶,称为“nCas9”蛋白(对于“切口酶”Cas9)。Cas9切口酶可以是能够仅切割双链核酸分子(例如,双链DNA分子)的一条链的Cas9蛋白。在一些实施方案中,Cas9切口酶切割双链核酸分子的靶链,这意味着Cas9切口酶切割与结合至Cas9的gRNA(例如,sgRNA)碱基配对(互补)的链。在一些实施方案中,Cas9切口酶包含D10A突变并且具有位置840处的组氨酸。在一些实施方案中,Cas9切口酶切割双链核酸分子的非靶标、未碱基编辑的链,这意味着Cas9切口酶切割不与结合至Cas9的gRNA(例如,sgRNA)碱基配对的链。在一些实施方案中,Cas9切口酶包含H840A突变,并且具有位置10处的天冬氨酸残基或对应突变。在一些实施方案中,Cas9切口酶包含与本文提供的Cas9切口酶中的任一种具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。基于本公开和本领域的知识,其他合适的Cas9切口酶对于本领域技术人员将是显而易见的,并且在本公开的范围内。
示例性催化性Cas9切口酶(nCas9)的氨基酸序列如下:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:201)
Cas9核酸酶具有两个功能性核酸内切酶结构域:RuvC和HNH。Cas9在靶标结合后发生构象变化,所述构象变化定位核酸酶结构域以切割靶DNA的相反链。Cas9介导的DNA切割的最终结果是靶DNA(PAM序列上游约3-4个核苷酸)内的双链断裂(DSB)。所得DSB然后通过两种通用修复途径之一进行修复:(1)高效但容易出错的非同源末端接合(NHEJ)途径;或(2)效率较低但高保真度的同源指导修复(HDR)途径。
非同源末端接合(NHEJ)和/或同源指导修复(HDR)的“效率”可以通过任何方便的方法计算。例如,在一些实施方案中,效率可以用成功HDR的百分比来表示。例如,surveyor核酸酶测定可以用于生成切割产物,并且产物与底物的比率可以用于计算百分比。例如,直接切割含有新整合的限制性序列的DNA的surveyor核酸酶可以用作成功HDR的结果。更多的切割底物表明更高的HDR百分比(更高的HDR效率)。作为说明性实例,HDR的分数(百分比)可以使用以下等式计算:[(切割产物)/(底物加切割产物)](例如,(b+c)/(a+b+c),其中“a”是DNA底物的条带强度,并且“b”和“c”是切割产物)。
在一些实施方案中,效率可以用成功NHEJ的百分比表示。例如,T7核酸内切酶I测定可以用于生成切割产物,并且产物与底物的比率可以用于计算NHEJ的百分比。T7核酸内切酶I切割由野生型和突变DNA链杂交产生的错配异源双链体DNA(NHEJ在原始断裂位点处生成小的随机插入或缺失(插入缺失))。更多的切割表明更高的NHEJ百分比(更高的NHEJ效率)。作为说明性实例,NHEJ的分数(百分比)可以使用以下等式计算:(1-(1-(b+c)/(a+b+c))1/2)×100,其中“a”是DNA底物的条带强度,并且“b”和“c”是切割产物(Ran等人,Cell.2013年9月12日;154(6):1380-9;和Ran等人,Nat Protoc.2013年11月;8(11):2281–2308)。
NHEJ修复途径是最具活性的修复机制,并且它经常在DSB位点处引起小的核苷酸插入或缺失(插入缺失)。NHEJ介导的DSB修复的随机性具有重要的实际意义,因为表达Cas9和gRNA或指导多核苷酸的细胞群可以导致多种突变。在大多数实施方案中,NHEJ在靶DNA中产生小插入缺失,所述小插入缺失导致氨基酸缺失、插入或移码突变,从而导致靶基因的开放阅读框(ORF)内的提前终止密码子。理想的最终结果是靶基因内的功能丧失突变。
虽然NHEJ介导的DSB修复通常破坏基因的开放阅读框,但同源指导修复(HDR)可以用于生成特定的核苷酸变化,范围为单个核苷酸变化到大的插入,如添加荧光团或标签。
为了利用HDR进行基因编辑,可以使用gRNA和Cas9或Cas9切口酶将含有期望序列的DNA修复模板递送到感兴趣的细胞类型中。修复模板可以含有期望的编辑以及紧邻靶标上游和下游的额外同源序列(称为左和右同源臂)。每个同源臂的长度可以取决于引入的变化的大小,较大的插入需要较长的同源臂。修复模板可以是单链寡核苷酸、双链寡核苷酸或双链DNA质粒。即使在表达Cas9、gRNA和外源修复模板的细胞中,HDR的效率通常也很低(小于10%的修饰等位基因)。HDR的效率可以通过同步细胞来增强,因为HDR发生在细胞周期的S和G2阶段期间。NHEJ中涉及的化学或遗传抑制基因也可以增加HDR频率。
在一些实施方案中,Cas9是修饰的Cas9。给定的gRNA靶向序列可以在存在部分同源性的整个基因组中具有额外的位点。这些位点被称为脱靶,并且在设计gRNA时需要考虑这些位点。除了优化gRNA设计外,还可以通过修饰Cas9来提高CRISPR特异性。Cas9通过两个核酸酶结构域RuvC和HNH的组合活性生成双链断裂(DSB)。Cas9切口酶是SpCas9的D10A突变体,保留一个核酸酶结构域并且生成DNA切口而不是DSB。切口酶系统还可以与HDR介导的基因编辑相组合以进行特定的基因编辑。
催化死亡的核酸酶
本文还提供了包含催化死亡的(即,不能切割靶多核苷酸序列)多核苷酸可编程核苷酸结合结构域的碱基编辑器。本文中的术语“催化死亡”和“核酸酶死亡”可互换使用,以指代多核苷酸可编程核苷酸结合结构域,所述结构域具有一个或多个突变和/或缺失,导致其不能切割核酸链。在一些实施方案中,催化死亡的多核苷酸可编程核苷酸结合结构域碱基编辑器可以由于一个或多个核酸酶结构域中的特定点突变而缺乏核酸酶活性。例如,在包含Cas9结构域的碱基编辑器的情况下,Cas9可以包含D10A突变和H840A突变两者。此类突变使两个核酸酶结构域失活,从而导致核酸酶活性的丧失。在其他实施方案中,催化死亡的多核苷酸可编程核苷酸结合结构域可以包含全部或部分催化结构域(例如,RuvC1和/或HNH结构域)的一个或多个缺失。在另外的实施方案中,催化死亡的多核苷酸可编程核苷酸结合结构域包含点突变(例如,D10A或H840A)以及全部或部分核酸酶结构域的缺失。dCas9结构域是本领域已知的并且例如在Qi等人,“Repurposing CRISPR as an RNA-guidedplatform for sequence-specific control of gene expression.”Cell.2013;152(5):1173-83中描述,所述文献的全部内容通过引用并入本文。
基于本公开和本领域的知识,其他合适的无核酸酶活性的dCas9结构域对于本领域技术人员将是显而易见的,并且在本公开的范围内。此类其他的示例性合适的无核酸酶活性的Cas9结构域包括但不限于D10A/H840A、D10A/D839A/H840A和D10A/D839A/H840A/N863A突变体结构域(参见,例如,Prashant等人,CAS9transcriptional activ ators fortarget specificity screening and paired nickases for coopera tive genomeengineering.Nature Biotechnology.2013;31(9):833-838,所述文献的全部内容通过引用并入本文)。
在一些实施方案中,dCas9对应于或包含部分或全部具有使Cas9核酸酶活性失活的一个或多个突变的Cas9氨基酸序列。在一些实施方案中,无核酸酶活性的dCas9结构域包含本文所列出的氨基酸序列的D10X突变和H840X突变,或本文提供的任何氨基酸序列中的对应突变,其中X是任何氨基酸变化。在一些实施方案中,无核酸酶活性的dCas9结构域包含本文所列出的氨基酸序列的D10A突变和H840A突变,或本文提供的任何氨基酸序列中的对应突变。在一些实施方案中,无核酸酶活性的Cas9结构域包含克隆载体pPlatTET-gRNA2(登录号BAV54124)中列出的氨基酸序列。
在一些实施方案中,变体Cas9蛋白可以切割指导靶序列的互补链,但具有降低的切割双链指导靶序列的非互补链的能力。例如,变体Cas9蛋白可以具有减小RuvC结构域的功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变体Cas9蛋白具有D10A(氨基酸位置10处的天冬氨酸至丙氨酸),并且因此可以切割双链指导靶序列的互补链,但具有降低的切割双链指导靶序列的非互补链的能力(因此当变体Cas9蛋白切割双链靶核酸时导致单链断裂(SSB)而不是双链断裂(DSB))(参见,例如,Jinek等人,Science.2012Aug.17;337(6096):816-21)。
在一些实施方案中,变体Cas9蛋白可以切割双链指导靶序列的非互补链,但具有降低的切割指导靶序列的互补链的能力。例如,变体Cas9蛋白可以具有减小HNH结构域(RuvC/HNH/RuvC结构域基序)的功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变体Cas9蛋白具有H840A(氨基酸位置840处的组氨酸至丙氨酸)突变,并且因此可以切割指导靶序列的非互补链,但具有降低的切割指导靶序列的互补链的能力(因此当变体Cas9蛋白切割双链指导靶序列时导致SSB而不是DSB)。这样的Cas9蛋白具有降低的切割指导靶序列(例如,单链指导靶序列)的能力,但保留结合指导靶序列(例如,单链指导靶序列)的能力。
作为另一个非限制性实例,在一些实施方案中,变体Cas9蛋白具有W476A和W1126A突变,使得多肽具有降低的切割靶DNA的能力。这样的Cas9蛋白具有降低的切割靶DNA(例如,单链靶DNA)的能力,但保留结合靶DNA(例如,单链靶DNA)的能力。
作为另一个非限制性实例,在一些实施方案中,变体Cas9蛋白具有P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得多肽具有降低的切割靶DNA的能力。这样的Cas9蛋白具有降低的切割靶DNA(例如,单链靶DNA)的能力,但保留结合靶DNA(例如,单链靶DNA)的能力。
作为另一个非限制性实例,在一些实施方案中,变体Cas9蛋白具有H840A、W476A和W1126A突变,使得多肽具有降低的切割靶DNA的能力。这样的Cas9蛋白具有降低的切割靶DNA(例如,单链靶DNA)的能力,但保留结合靶DNA(例如,单链靶DNA)的能力。作为另一个非限制性实例,在一些实施方案中,变体Cas9蛋白具有H840A、D10A、W476A和W1126A突变,使得多肽具有降低的切割靶DNA的能力。这样的Cas9蛋白具有降低的切割靶DNA(例如,单链靶DNA)的能力,但保留结合靶DNA(例如,单链靶DNA)的能力。在一些实施方案中,变体Cas9在Cas9HNH结构域的位置840处恢复了催化His残基(A840H)。
作为另一个非限制性实例,在一些实施方案中,变体Cas9蛋白具有H840A、P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得多肽具有降低的切割靶DNA的能力。这样的Cas9蛋白具有降低的切割靶DNA(例如,单链靶DNA)的能力,但保留结合靶DNA(例如,单链靶DNA)的能力。作为另一个非限制性实例,在一些实施方案中,变体Cas9蛋白具有D10A、H840A、P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得多肽具有降低的切割靶DNA的能力。这样的Cas9蛋白具有降低的切割靶DNA(例如,单链靶DNA)的能力,但保留结合靶DNA(例如,单链靶DNA)的能力。在一些实施方案中,当变体Cas9蛋白具有W476A和W1126A突变或当变体Cas9蛋白具有P475A、W476A、N477A、D1125A、W1126A和D1127A突变时,变体Cas9蛋白不高效地结合PAM序列。因此,在一些此类实施方案中,当在结合方法中使用这种变体Cas9蛋白时,所述方法不需要PAM序列。换句话说,在一些实施方案中,当在结合方法中使用这种变体Cas9蛋白时,所述方法可以包括指导RNA,但是所述方法可以在不存在PAM序列的情况下执行(并且结合的特异性因此由指导RNA的靶向区段提供)。可以使其他残基突变以实现以上作用(即,使一个或另一个核酸酶部分失活)。作为非限制性实例,残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987可以被改变(即,被取代)。此外,除了丙氨酸取代以外的突变是合适的。
在一些实施方案中,具有降低的催化活性的变体Cas9蛋白(例如,当Cas9蛋白具有D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987突变,例如,D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A和/或D986A),所述变体Cas9蛋白仍可以以位点特异性方式结合靶DNA(因为它仍通过指导RNA指导至靶DNA序列),只要它保留与指导RNA相互作用的能力即可。
在一些实施方案中,变体Cas蛋白可以是spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK或spCas9-LRVSQL。
在一些实施方案中,Cas9结构域是来自金黄色葡萄球菌的Cas9结构域(SaCas9)。在一些实施方案中,SaCas9结构域是核酸酶活性SaCas9、无核酸酶活性的SaCas9(SaCas9d)或SaCas9切口酶(SaCas9n)。在一些实施方案中,SaCas9包含N579A突变,或在随附提交的序列表中提供的任何氨基酸序列中的对应突变。
在一些实施方案中,SaCas9结构域、SaCas9d结构域、或SaCas9n结构域可以结合具有非规范PAM的核酸序列。在一些实施方案中,SaCas9结构域、SaCas9d结构域、或SaCas9n结构域可以结合具有NNGRRT或NNGRRV PAM序列的核酸序列。在一些实施方案中,SaCas9结构域包含E781X、N967X和R1014X突变中的一个或多个,或本文提供的任何氨基酸序列中的对应突变,其中X是任何氨基酸。在一些实施方案中,SaCas9结构域包含E781K、N967K和R1014H突变中的一个或多个,或本文提供的任何氨基酸序列中的一个或多个对应突变。在一些实施方案中,SaCas9结构域包含E781K、N967K或R1014H突变,或本文提供的任何氨基酸序列中的对应突变。
在一些实施方案中,融合蛋白中存在的Cas9结构域之一可以用不需要PAM序列的指导核苷酸序列可编程DNA结合蛋白结构域替换。在一些实施方案中,Cas9是SaCas9。SaCas9的残基A579可以从N579突变以产生SaCas9切口酶。残基K781、K967和H1014可以从E781、N967和R1014突变以产生SaKKH Cas9。
在一些实施方案中,使用包括氨基酸取代D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E和T1337R(SpCas9-MQKFRAER)并且对改变的PAM 5'-NGC-3'具有特异性的修饰的SpCas9。
化脓性链球菌Cas9的替代方案可以包括来自Cpf1家族的在哺乳动物细胞中展现出切割活性的RNA指导的核酸内切酶。来自普雷沃氏菌和土拉弗朗西斯菌1(Francisella1)的CRISPR(CRISPR/Cpf1)是一种类似于CRISPR/Cas9系统的DNA编辑技术。Cpf1是II类CRISPR/Cas系统的RNA指导的核酸内切酶。这种获得性免疫机制存在于普雷沃氏菌和土拉弗朗西斯菌中。Cpf1基因与CRISPR基因座相关,编码使用指导RNA来寻找并切割病毒DNA的核酸内切酶。Cpf1是一种比Cas9更小并且更简单的核酸内切酶,其克服了CRISPR/Cas9系统的一些限制。与Cas9核酸酶不同,Cpf1介导的DNA切割的结果是具有短3'突出端的双链断裂。Cpf1的交错切割模式可以开辟定向基因转移的可能性,类似于传统的限制性酶克隆,这可以提高基因编辑的效率。与上述Cas9变体和直系同源物一样,Cpf1也可以将可以被CRISPR靶向的位点数量扩展至缺乏SpCas9所偏爱的NGG PAM位点的富含AT的区域或富含AT的基因组。Cpf1基因座含有混合的α/β结构域、RuvC-I,之后是螺旋区域、RuvC-II和锌指样结构域。Cpf1蛋白具有类似于Cas9的RuvC结构域的RuvC样核酸内切酶结构域。
此外,与Cas9不同,Cpf1没有HNH核酸内切酶结构域,并且Cpf1的N末端没有Cas9的α-螺旋识别叶。Cpf1CRISPR-Cas结构域结构显示,Cpf1在功能上是独一无二的,被归类为2类V型CRISPR系统。Cpf1基因座编码Cas1、Cas2和Cas4蛋白,与II型系统相比,它们更类似于I型和III型系统。功能性Cpf1不需要反式激活CRISPR RNA(tracrRNA),因此,仅需要CRISPR(crRNA)。这有利于基因组编辑,因为Cpf1不仅比Cas9小,而且它的sgRNA分子也更小(核苷酸数量大约是Cas9的一半)。与Cas9靶向的富含G的PAM相比,Cpf1-crRNA复合物通过识别原间隔序列临近基序5'-YTN-3'或5'-TTN-3'来切割靶DNA或RNA。在识别PAM之后,Cpf1引入具有4个或5个核苷酸的突出端的粘端样DNA双链断裂。
在一些实施方案中,Cas9是对改变的PAM序列具有特异性的Cas9变体。在一些实施方案中,额外的Cas9变体和PAM序列在Miller,S.M.,等人Continuous evolution ofSpCas9variants compatible with non-G PAMs,Nat.Biotechnol.(2020)中描述,所述文献的全部内容通过引用并入本文。在一些实施方案中,Cas9变体没有特定的PAM要求。在一些实施方案中,Cas9变体(例如,SpCas9变体)对NRNH PAM具有特异性,其中R是A或G并且H是A、C或T。在一些实施方案中,SpCas9变体对PAM序列AAA、TAA、CAA、GAA、TAT、GAT或CAC具有特异性。在一些实施方案中,SpCas9变体包含位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337或1339或其对应位置处的氨基酸取代。在一些实施方案中,SpCas9变体包含位置1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335或1337或其对应位置处的氨基酸取代。在一些实施方案中,SpCas9变体包含位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333或其对应位置处的氨基酸取代。在一些实施方案中,SpCas9变体包含位置1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339或其对应位置处的氨基酸取代。在一些实施方案中,SpCas9变体包含位置1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349或其对应位置处的氨基酸取代。SpCas9变体的示例性氨基酸取代和PAM特异性在表3A-表3D中示出。
表3A SpCas9变体和PAM特异性
/>
/>
/>
在一些实施方案中,核酸可编程DNA结合蛋白(napDNAbp)是微生物CRISPR-Cas系统的单一效应子。微生物CRISPR-Cas系统的单一效应子包括但不限于Cas9、Cpf1、Cas12b/C2c1和Cas12c/C2c3。通常,微生物CRISPR-Cas系统分为1类和2类系统。1类系统具有多亚基效应子复合物,而2类系统具有单一蛋白质效应子。例如,Cas9和Cpf1是2类效应子。除了Cas9和Cpf1之外,Shmakov等人,“Discovery and Functional CharacterizationofDiverse Class 2CRISPR Cas Systems”,Mol.Cell,2015年11月5日;60(3):385-397还已经描述了三种不同的2类CRISPR-Cas系统(Cas12b/C2c1和Cas12c/C2c3),所述文献的全部内容特此通过引用并入。所述系统Cas12b/C2c1和Cas12c/C2c3中的两个的效应子含有与Cpf1相关的RuvC样核酸内切酶结构域。第三个系统含有具有两个预测的HEPN核糖核酸酶结构域的效应子。成熟CRISPR RNA的产生不依赖于tracrRNA,这与Cas12b/C2c1产生CRISPRRNA不同。Cas12b/C2c1依赖于CRISPR RNA和tracrRNA两者以进行DNA切割。
在一些实施方案中,napDNAbp是环状置换的(circular permutant)(例如,SEQ IDNO:238)。
据报道,酸土芽孢杆菌(Alicyclobaccillus acidoterrastris)Cas12b/C2c1(AacC2c1)的晶体结构与嵌合单分子指导RNA(sgRNA)复合。参见,例如,Liu等人,“C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”,Mol.Cell,2017年1月19日;65(2):310-322,其全部内容特此通过引用并入。据报道,酸土芽孢杆菌(Alicyclobacillus acidoterrestris)C2c1中的晶体结构与靶DNA结合成三元复合物。参见例如,Yang等人,“PAM-dependent Target DNA Recognition and Cleavage byC2C1CRISPR-Cas endonuclease”,Cell,2016年12月15日;167(7):1814-1828,其全部内容特此通过引用并入。AacC2c1的具有靶DNA链和非靶DNA链两者的具有催化能力的构象,都被独立地捕获在单个RuvC催化口袋内,Cas12b/C2c1介导的切割导致靶DNA的交错的七核苷酸断裂。Cas12b/C2c1三元复合物与先前鉴定的Cas9和Cpf1对应物之间的结构比较证明了CRISPR-Cas9系统使用的机制的多样性。
在一些实施方案中,本文提供的任何融合蛋白的核酸可编程DNA结合蛋白(napDNAbp)可以是Cas12b/C2c1或Cas12c/C2c3蛋白。在一些实施方案中,napDNAbp是Cas12b/C2c1蛋白。在一些实施方案中,napDNAbp是Cas12c/C2c3蛋白。在一些实施方案中,napDNAbp包含与天然存在的Cas12b/C2c1或Cas12c/C2c3蛋白具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。在一些实施方案中,napDNAbp是天然存在的Cas12b/C2c1或Cas12c/C2c3蛋白。在一些实施方案中,napDNAbp包含与本文提供的napDNAbp序列中的任一个具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。应当理解,根据本公开也可以使用来自其他细菌物种的Cas12b/C2c1或Cas12c/C2c3。
在一些实施方案中,napDNAbp是指Cas12c。在一些实施方案中,Cas12c蛋白是Cas12c1(SEQ ID NO:239)或Cas12c1的变体。在一些实施方案中,Cas12蛋白是Cas12c2(SEQID NO:240)或Cas12c2的变体。在一些实施方案中,Cas12蛋白是来自嗜油菌属(Oleiphilus)物种HI0009(即,OspCas12c;SEQ ID NO:241)的Cas12c蛋白或OspCas12c的变体。这些Cas12c分子已经在Yan等人,“Functionally Diverse Type V CRISPR-CasSystems,”Science,2019年1月4日;363:88-91中描述;其全部内容特此通过引用并入。在一些实施方案中,napDNAbp包含与天然存在的Cas12c1、Cas12c2或OspCas12c蛋白具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。在一些实施方案中,napDNAbp是天然存在的Cas12c1、Cas12c2或OspCas12c蛋白。在一些实施方案中,napDNAbp包含与本文所述的任何Cas12c1、Cas12c2或OspCas12c蛋白具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。应当理解,根据本公开也可以使用来自其他细菌物种的Cas12c1、Cas12c2或OspCas12c。
在一些实施方案中,napDNAbp是指Cas12g、Cas12h或Cas12i,其已经在例如Yan等人,“Functionally Diverse Type V CRISPR-Cas Systems,”Science,2019年1月4日;363:88-91中描述;每篇文献的全部内容特此通过引用并入。示例性Cas12g、Cas12h和Cas12i多肽序列在序列表中作为SEQ ID NO:242-245提供。通过聚合超过10TB的序列数据,鉴定出新类别的V型Cas蛋白,其显示出与先前表征的V类蛋白(包括Cas12g、Cas12h和Cas12i)较弱的相似性。在一些实施方案中,Cas12蛋白是Cas12g或Cas12g的变体。在一些实施方案中,Cas12蛋白是Cas12h或Cas12h的变体。在一些实施方案中,Cas12蛋白是Cas12i或Cas12i的变体。应当理解,其他RNA指导的DNA结合蛋白可用作napDNAbp,并且在本公开的范围内。在一些实施方案中,napDNAbp包含与天然存在的Cas12g、Cas12h或Cas12i蛋白具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。在一些实施方案中,napDNAbp是天然存在的Cas12g、Cas12h或Cas12i蛋白。在一些实施方案中,napDNAbp包含与本文所述的任何Cas12g、Cas12h或Cas12i蛋白具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。应当理解,根据本公开也可以使用来自其他细菌物种的Cas12g、Cas12h或Cas12i。在一些实施方案中,Cas12i是Cas12i1或Cas12i2。
在一些实施方案中,本文提供的任何融合蛋白的核酸可编程DNA结合蛋白(napDNAbp)可以是Cas12j/CasΦ蛋白。Cas12j/CasΦ在Pausch等人,“CRISPR-CasΦfromhuge phages is a hypercompact genome editor,”Science,2020年7月17日,第369卷,第6501期,第333-337页中描述,所述文献通过引用整体并入本文。在一些实施方案中,napDNAbp包含与天然存在的Cas12j/CasΦ蛋白具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。在一些实施方案中,napDNAbp是天然存在的Cas12j/CasΦ蛋白。在一些实施方案中,napDNAbp是无核酸酶活性的(“死亡”)Cas12j/CasΦ蛋白。应当理解,根据本公开也可以使用来自其他物种的Cas12j/CasΦ。
具有内部插入的融合蛋白
本文提供了融合蛋白,其包含融合至核酸可编程核酸结合蛋白(例如,napDNAbp)的异源多肽。异源多肽可以是天然中不存在的多肽或野生型napDNAbp多肽序列。异源多肽可以在napDNAbp的C末端、napDNAbp的N末端融合至napDNAbp,或者插入到napDNAbp的内部位置。在一些实施方案中,异源多肽是脱氨酶(例如,胞苷或腺苷脱氨酶)或其功能片段。例如,融合蛋白可以包含侧接有Cas9或Cas12(例如,Cas12b/C2c1)多肽的N末端片段和C末端片段的脱氨酶。在一些实施方案中,胞苷脱氨酶是APOBEC脱氨酶(例如,APOBEC1)。在一些实施方案中,腺苷脱氨酶是TadA(例如,TadA*7.10或TadA*8)。在一些实施方案中,TadA是TadA*8或TadA*9。如本文所述的TadA序列(例如,TadA7.10或TadA*8)是适用于上述融合蛋白的脱氨酶。
在一些实施方案中,融合蛋白包含以下结构:
NH2-[napDNAbp的N末端片段]-[脱氨酶]-[napDNAbp的C末端片段]-COOH;
NH2-[Cas9的N末端片段]-[腺苷脱氨酶]-[Cas9的C末端片段]-COOH;
NH2-[Cas12的N末端片段]-[腺苷脱氨酶]-[Cas12的C末端片段]-COOH;
NH2-[Cas9的N末端片段]-[胞苷脱氨酶]-[Cas9的C末端片段]-COOH;
NH2-[Cas12的N末端片段]-[胞苷脱氨酶]-[Cas12的C末端片段]-COOH;
其中“]-[”的每个实例是任选的接头。
脱氨酶可以是环状置换的脱氨酶。例如,脱氨酶可以是环状置换的腺苷脱氨酶。在一些实施方案中,脱氨酶是环状置换的TadA,其在TadA参考序列中编号的氨基酸残基116、136或65处是环状置换的。
融合蛋白可以包含多于一种脱氨酶。融合蛋白可以包含例如1、2、3、4、5种或更多种脱氨酶。在一些实施方案中,融合蛋白包含一种或两种脱氨酶。融合蛋白中的两种或更多种脱氨酶可以是腺苷脱氨酶、胞苷脱氨酶或其组合。两种或更多种脱氨酶可以是同源二聚体或异源二聚体。可以将两种或更多种脱氨酶串联插入到napDNAbp中。在一些实施方案中,两种或更多种脱氨酶在napDNAbp中可以不串联。
在一些实施方案中,融合蛋白中的napDNAbp是Cas9多肽或其片段。Cas9多肽可以是变体Cas9多肽。在一些实施方案中,Cas9多肽是Cas9切口酶(nCas9)多肽或其片段。在一些实施方案中,Cas9多肽是核酸酶死亡Cas9(dCas9)多肽或其片段。融合蛋白中的Cas9多肽可以是全长Cas9多肽。在一些情况下,融合蛋白中的Cas9多肽可以不是全长Cas9多肽。相对于天然存在的Cas9蛋白,Cas9多肽可以例如在N末端或C末端处被截短。Cas9多肽可以是环状置换的Cas9蛋白。Cas9多肽可以是仍然能够结合靶多核苷酸和指导核酸序列的Cas9多肽的片段、部分或结构域。
在一些实施方案中,Cas9多肽是化脓性链球菌Cas9(SpCas9)、金黄色葡萄球菌Cas9(SaCas9)、嗜热链球菌1Cas9(St1Cas9)或本文所述的任何Cas9多肽的片段或变体。
在一些实施方案中,融合蛋白包含插入到Cas9内的腺苷脱氨酶结构域和胞苷脱氨酶结构域。在一些实施方案中,腺苷脱氨酶融合在Cas9内,并且胞苷脱氨酶融合至C末端。在一些实施方案中,腺苷脱氨酶融合在Cas9内,并且胞苷脱氨酶融合至N末端。在一些实施方案中,胞苷脱氨酶融合在Cas9内,并且腺苷脱氨酶融合至C末端。在一些实施方案中,胞苷脱氨酶融合在Cas9内,并且腺苷脱氨酶融合至N末端。
具有腺苷脱氨酶和胞苷脱氨酶以及Cas9的融合蛋白的示例性结构提供如下:
NH2-[Cas9(腺苷脱氨酶)]-[胞苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[Cas9(腺苷脱氨酶)]-COOH;
NH2-[Cas9(胞苷脱氨酶)]-[腺苷脱氨酶]-COOH;或
NH2-[腺苷脱氨酶]-[Cas9(胞苷脱氨酶)]-COOH。
在一些实施方案中,以上通用结构中使用的“-”指示任选的接头的存在。
在各种实施方案中,催化结构域具有DNA修饰活性(例如,脱氨酶活性),诸如腺苷脱氨酶活性。在一些实施方案中,腺苷脱氨酶是TadA(例如,TadA*7.10)。在一些实施方案中,TadA是TadA*8。在一些实施方案中,TadA*8融合在Cas9内,并且胞苷脱氨酶融合至C末端。在一些实施方案中,TadA*8融合在Cas9内,并且胞苷脱氨酶融合至N末端。在一些实施方案中,胞苷脱氨酶融合在Cas9内,并且TadA*8融合至C末端。在一些实施方案中,胞苷脱氨酶融合在Cas9内,并且TadA*8融合至N末端。具有TadA*8和胞苷脱氨酶以及Cas9的融合蛋白的示例性结构提供如下:
NH2-[Cas9(TadA*8)]-[胞苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[Cas9(TadA*8)]-COOH;
NH2-[Cas9(胞苷脱氨酶)]-[TadA*8]-COOH;或
NH2-[TadA*8]-[Cas9(胞苷脱氨酶)]-COOH。
在一些实施方案中,以上通用结构中使用的“-”指示任选的接头的存在。
异源多肽(例如,脱氨酶)可以插入到napDNAbp(例如,Cas9或Cas12(例如,Cas12b/C2c1))中的合适位置,例如,使得napDNAbp保留其结合靶多核苷酸和指导核酸的能力。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)可以插入到napDNAbp中,而不损害脱氨酶的功能(例如,碱基编辑活性)或napDNAbp的功能(例如,结合靶核酸和指导核酸的能力)。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)可以插入到napDNAbp中的例如无序区域或包含高温因子或B因子的区域,如结晶学研究所示。不太有序、无序或非结构化的蛋白质区域,例如溶剂暴露区域和环,可以用于插入而不损害结构或功能。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)可以插入到napDNAbp的柔性环区或溶剂暴露区域中。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到Cas9或Cas12b/C2c1多肽的柔性环中。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)的插入位置通过Cas9多肽的晶体结构的B因子分析来确定。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)插入到Cas9多肽的包含高于平均的B因子的区域(例如,与总蛋白质或包含无序区域的蛋白质结构域相比更高的B因子)。B因子或温度因子可以指示原子自其平均位置的波动(例如,由于温度依赖性原子振动或晶格中的静态无序)。骨架原子的高B因子(例如,高于平均的B因子)可以指示具有相对高局部迁移率(local mobility)的区域。这种区域可以用于插入脱氨酶而不损害结构或功能。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)可以插入到具有Cα原子的残基的位置,所述Cα原子的B因子比总蛋白质的平均B因子高50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或超过200%。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)可以插入到具有Cα原子的残基的位置,所述Cα原子的B因子比包含所述残基的Cas9蛋白质结构域的平均B因子高50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或超过200%。包含高于平均的B因子的Cas9多肽位置可以包括,例如,以上Cas9参考序列中编号的残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247和1248。包含高于平均的B因子的Cas9多肽区域可以包括,例如,以上Cas9参考序列中编号的残基792-872、792-906和2-791。
异源多肽(例如,脱氨酶)可以插入到napDNAbp中的选自由以下组成的组的氨基酸残基处:以上Cas9参考序列中编号的768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,异源多肽插入到以上Cas9参考序列中编号的氨基酸位置768-769、791-792、792-793、1015-1016、1022-1023、1026-1027、1029-1030、1040-1041、1052-1053、1054-1055、1067-1068、1068-1069、1247-1248或1248-1249或其对应氨基酸位置之间。在一些实施方案中,异源多肽插入到以上Cas9参考序列中编号的氨基酸位置769-770、792-793、793-794、1016-1017、1023-1024、1027-1028、1030-1031、1041-1042、1053-1054、1055-1056、1068-1069、1069-1070、1248-1249或1249-1250或其对应氨基酸位置之间。在一些实施方案中,异源多肽替换选自由以下组成的组的氨基酸残基:以上Cas9参考序列中编号的768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248,或另一个Cas9多肽中的对应氨基酸残基。应当理解,关于插入位置对以上Cas9参考序列的提及是出于说明目的。如本文讨论的插入不限于以上Cas9参考序列的Cas9多肽序列,而是包括变体Cas9多肽(例如,Cas9切口酶(nCas9)、核酸死亡Cas9(dCas9)、缺乏核酸酶结构域的Cas9变体、截短的Cas9、或缺乏部分或完整HNH结构域的Cas9结构域)中的对应位置处的插入。
异源多肽(例如,脱氨酶)可以插入到napDNAbp中的选自由以下组成的组的氨基酸残基处:以上Cas9参考序列中编号的768、792、1022、1026、1040、1068和1247,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,异源多肽插入到以上Cas9参考序列中编号的氨基酸位置768-769、792-793、1022-1023、1026-1027、1029-1030、1040-1041、1068-1069或1247-1248或其对应氨基酸位置之间。在一些实施方案中,异源多肽插入到以上Cas9参考序列中编号的氨基酸位置769-770、793-794、1023-1024、1027-1028、1030-1031、1041-1042、1069-1070或1248-1249或其对应氨基酸位置之间。在一些实施方案中,异源多肽替换选自由以下组成的组的氨基酸残基:以上Cas9参考序列中编号的768、792、1022、1026、1040、1068和1247,或另一个Cas9多肽中的对应氨基酸残基。
异源多肽(例如,脱氨酶)可以插入到napDNAbp中的如本文所述的氨基酸残基处,或者插入到另一个Cas9多肽中的对应氨基酸残基处。在一个实施方案中,异源多肽(例如,脱氨酶)可以插入到napDNAbp中的选自由以下组成的组的氨基酸残基处:以上Cas9参考序列中编号的1002、1003、1025、1052-1056、1242-1247、1061-1077、943-947、686-691、569-578、530-539和1060-1077,或另一个Cas9多肽中的对应氨基酸残基。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)可以插入到残基的N末端或C末端或替换残基。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到残基的C末端。
在一些实施方案中,腺苷脱氨酶(例如,TadA)插入到选自由以下组成的组的氨基酸残基处:以上Cas9参考序列中编号的1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,腺苷脱氨酶(例如,TadA)被插入以替换以上Cas9参考序列中编号的残基792-872、792-906或2-791,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,腺苷脱氨酶插入到选自由以下组成的组的氨基酸的N末端处:以上Cas9参考序列中编号的1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,腺苷脱氨酶插入到选自由以下组成的组的氨基酸的C末端处:以上Cas9参考序列中编号的1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,腺苷脱氨酶被插入以替换选自由以下组成的组的氨基酸:以上Cas9参考序列中编号的1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,胞苷脱氨酶(例如,APOBEC1)插入到选自由以下组成的组的氨基酸残基处:以上Cas9参考序列中编号的1016、1023、1029、1040、1069和1247,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,胞苷脱氨酶插入到选自由以下组成的组的氨基酸的N末端处:以上Cas9参考序列中编号的1016、1023、1029、1040、1069和1247,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,胞苷脱氨酶插入到选自由以下组成的组的氨基酸的C末端处:以上Cas9参考序列中编号的1016、1023、1029、1040、1069和1247,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,胞苷脱氨酶被插入以替换选自由以下组成的组的氨基酸:以上Cas9参考序列中编号的1016、1023、1029、1040、1069和1247,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基768处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基768的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基768的C末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸残基768,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基791处或氨基酸残基792处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基791的N末端处或氨基酸792的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸791的C末端处或氨基酸792的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸791或氨基酸792,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1016处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1016的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1016的C末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸残基1016,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1022处或氨基酸残基1023处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1022的N末端处或氨基酸残基1023的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1022的C末端处或氨基酸残基1023的C末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸残基1022或氨基酸残基1023,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1026处或氨基酸残基1029处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1026的N末端处或氨基酸残基1029的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1026的C末端处或氨基酸残基1029的C末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸残基1026或氨基酸残基1029,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1040处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1040的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1040的C末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸残基1040,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1052处或氨基酸残基1054处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1052的N末端处或氨基酸残基1054的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1052的C末端处或氨基酸残基1054的C末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸残基1052或氨基酸残基1054,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1067处,或氨基酸残基1068处,或氨基酸残基1069处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1067的N末端处,或氨基酸残基1068的N末端处,或氨基酸残基1069的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1067的C末端处,或氨基酸残基1068的C末端处,或氨基酸残基1069的C末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸残基1067,或氨基酸残基1068,或氨基酸残基1069,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1246处,或氨基酸残基1247处,或氨基酸残基1248处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1246的N末端处,或氨基酸残基1247的N末端处,或氨基酸残基1248的N末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)插入到以上Cas9参考序列中编号的氨基酸残基1246的C末端处,或氨基酸残基1247的C末端处,或氨基酸残基1248的C末端处,或另一个Cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)被插入以替换以上Cas9参考序列中编号的氨基酸残基1246,或氨基酸残基1247,或氨基酸残基1248,或另一个Cas9多肽中的对应氨基酸残基。
在一些实施方案中,异源多肽(例如,脱氨酶)插入到Cas9多肽的柔性环中。柔性环部分可以选自由以下组成的组:以上Cas9参考序列中编号的530-537、569-570、686-691、943-947、1002-1025、1052-1077、1232-1247或1298-1300,或另一个Cas9多肽中的对应氨基酸残基。柔性环部分可以选自由以下组成的组:以上Cas9参考序列中编号的1-529、538-568、580-685、692-942、948-1001、1026-1051、1078-1231或1248-1297,或另一个Cas9多肽中的对应氨基酸残基。
异源多肽(例如,腺嘌呤脱氨酶)可以插入到对应于以下氨基酸残基的Cas9多肽区域中:以上Cas9参考序列中编号的1017-1069、1242-1247、1052-1056、1060-1077、1002-1003、943-947、530-537、568-579、686-691、1242-1247、1298-1300、1066-1077、1052-1056或1060-1077,或另一个Cas9多肽中的对应氨基酸残基。
异源多肽(例如,腺嘌呤脱氨酶)可以被插入以替换Cas9多肽的缺失区域。缺失区域可以对应于Cas9多肽的N末端或C末端部分。在一些实施方案中,缺失区域对应于以上Cas9参考序列中编号的残基792-872,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,缺失区域对应于以上Cas9参考序列中编号的残基792-906,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,缺失区域对应于以上Cas9参考序列中编号的残基2-791,或另一个Cas9多肽中的对应氨基酸残基。在一些实施方案中,缺失区域对应于以上Cas9参考序列中编号的残基1017-1069,或其对应氨基酸残基。
示例性内部融合物碱基编辑器在下表4中提供:
表4:Cas9蛋白中的插入基因座
BE ID 修饰 其他ID
IBE001 Cas9 TadA ins 1015 ISLAY01
IBE002 Cas9 TadA ins 1022 ISLAY02
IBE003 Cas9 TadA ins 1029 ISLAY03
IBE004 Cas9 TadA ins 1040 ISLAY04
IBE005 Cas9 TadA ins 1068 ISLAY05
IBE006 Cas9 TadA ins 1247 ISLAY06
IBE007 Cas9 TadA ins 1054 ISLAY07
IBE008 Cas9 TadA ins 1026 ISLAY08
IBE009 Cas9 TadA ins 768 ISLAY09
IBE020 δHNH TadA 792 ISLAY20
IBE021 N末端融合单一TadA螺旋截短165-端 ISLAY21
IBE029 TadA-循环置换116ins 1067 ISLAY29
IBE031 TadA-循环置换136ins 1248 ISLAY31
IBE032 TadA-循环置换136ins 1052 ISLAY32
IBE035 δ792-872TadA ins ISLAY35
IBE036 δ792-906TadA ins ISLAY36
IBE043 TadA-循环置换65ins 1246 ISLAY43
IBE044 TadA ins C末端截短2 791 ISLAY44
异源多肽(例如,脱氨酶)可以插入到Cas9多肽的结构或功能结构域内。异源多肽(例如,脱氨酶)可以插入到Cas9多肽的两个结构或功能结构域之间。异源多肽(例如,脱氨酶)可以被插入以替换Cas9多肽的结构或功能结构域,例如,从Cas9多肽中删除所述结构域之后。Cas9多肽的结构或功能结构域可以包括例如RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI或HNH。
在一些实施方案中,Cas9多肽缺乏一个或多个选自由以下组成的组的结构域:RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI或HNH结构域。在一些实施方案中,Cas9多肽缺乏核酸酶结构域。在一些实施方案中,Cas9多肽缺乏HNH结构域。在一些实施方案中,Cas9多肽缺乏HNH结构域的一部分,使得Cas9多肽具有降低或消除的HNH活性。在一些实施方案中,Cas9多肽包含核酸酶结构域的缺失,并且脱氨酶被插入以替换核酸酶结构域。在一些实施方案中,HNH结构域是缺失的,并且脱氨酶被插入到它的位置。在一些实施方案中,RuvC结构域中的一个或多个是缺失的,并且脱氨酶被插入到它的位置。
包含异源多肽的融合蛋白可以侧接有napDNAbp的N末端和C末端片段。在一些实施方案中,融合蛋白包含侧接有Cas9多肽的N末端片段和C末端片段的脱氨酶。N末端片段或C末端片段可以结合靶多核苷酸序列。N末端片段的C末端或C末端片段的N末端可以包含Cas9多肽的柔性环的一部分。N末端片段的C末端或C末端片段的N末端可以包含Cas9多肽的α-螺旋结构的一部分。N末端片段或C末端片段可以包含DNA结合结构域。N末端片段或C末端片段可以包含RuvC结构域。N末端片段或C末端片段可以包含HNH结构域。在一些实施方案中,N末端片段和C末端片段都不包含HNH结构域。
在一些实施方案中,N末端Cas9片段的C末端包含氨基酸,当融合蛋白使靶核碱基脱氨基时,所述氨基酸接近靶核碱基。在一些实施方案中,C末端Cas9片段的N末端包含氨基酸,当融合蛋白使靶核碱基脱氨基时,所述氨基酸接近靶核碱基。不同脱氨酶的插入位置可以不同,以便使靶核碱基与N末端Cas9片段的C末端或C末端Cas9片段的N末端的氨基酸接近。例如,脱氨酶的插入位置可以在选自由以下组成的组的氨基酸残基处:以上Cas9参考序列中编号的1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,或另一个Cas9多肽中的对应氨基酸残基。
融合蛋白的N末端Cas9片段(即,融合蛋白中侧接脱氨酶的N末端Cas9片段)可以包含Cas9多肽的N末端。融合蛋白的N末端Cas9片段可以包含至少约100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸的长度。融合蛋白的N末端Cas9片段可以包含对应于以下氨基酸残基的序列:以上Cas9参考序列中编号的1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918或1-1100,或另一个Cas9多肽中的对应氨基酸残基。N末端Cas9片段可以包含序列,所述序列与以上Cas9参考序列中编号的氨基酸残基1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918或1-1100或另一个Cas9多肽中的对应氨基酸残基具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%序列同一性。
融合蛋白的C末端Cas9片段(即,融合蛋白中侧接脱氨酶的C末端Cas9片段)可以包含Cas9多肽的C末端。融合蛋白的C末端Cas9片段可以包含至少约100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸的长度。融合蛋白的C末端Cas9片段可以包含对应于以下氨基酸残基的序列:以上Cas9参考序列中编号的1099-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368或56-1368,或另一个Cas9多肽中的对应氨基酸残基。N末端Cas9片段可以包含序列,所述序列与以上Cas9参考序列中编号的氨基酸残基1099-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368或56-1368或另一个Cas9多肽中的对应氨基酸残基具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%序列同一性。
融合蛋白的N末端Cas9片段和C末端Cas9片段合在一起可能不对应于全长天然存在的Cas9多肽序列,例如,如以上Cas9参考序列中所列出的。
本文所述的融合蛋白可以实现靶向脱氨基,同时减少非靶位点(例如,脱靶位点)处的脱氨基,诸如减少全基因组假脱氨基。本文所述的融合蛋白可以实现靶向脱氨基,同时减少非靶位点处的旁观者脱氨基。例如,与包含融合至Cas9多肽的N末端或C末端的脱氨酶的末端融合蛋白相比,不期望的脱氨基或脱靶脱氨基可以减少至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%。例如,与包含融合至Cas9多肽的N末端或C末端的脱氨酶的末端融合蛋白相比,不期望的脱氨基或脱靶脱氨基可以减少至少1倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、至少15倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。
在一些实施方案中,融合蛋白的脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)使R环范围内的不超过两个核碱基脱氨基。在一些实施方案中,融合蛋白的脱氨酶使R环范围内的不超过三个核碱基脱氨基。在一些实施方案中,融合蛋白的脱氨酶使R环范围内的不超过2、3、4、5、6、7、8、9或10个核碱基脱氨基。R环是三链核酸结构,包括DNA:RNA杂交体、DNA:DNA或RNA:RNA互补结构以及与单链DNA相关的结构。如本文所用,当靶多核苷酸与CRISPR复合物或碱基编辑复合物接触时,可形成R环,其中指导多核苷酸(例如,指导RNA)的一部分与靶多核苷酸(例如,靶DNA)的一部分杂交并且发生置换。在一些实施方案中,R环包含间隔序列与靶DNA互补序列的杂交区域。R环区域的长度可以是约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核碱基对。在一些实施方案中,R环区域的长度是约20个核碱基对。应当理解,如本文所用,R环区域不限于与指导多核苷酸杂交的靶DNA链。例如,可以将R环区域内的靶核碱基编辑至包含指导RNA的互补链的DNA链,或者可以将其编辑至作为指导RNA的互补链的相反链的DNA链。在一些实施方案中,R环区域中的编辑包括将非互补链(原间隔序列链)上的核碱基编辑至靶DNA序列中的指导RNA。
本文所述的融合蛋白可以在不同于规范碱基编辑的编辑窗口中实现靶标脱氨基。在一些实施方案中,靶核碱基在靶多核苷酸序列中的PAM序列上游约1至约20个碱基。在一些实施方案中,靶核碱基在靶多核苷酸序列中的PAM序列上游约2至约12个碱基。在一些实施方案中,靶核碱基距离PAM序列或在其上游约1至9个碱基对、约2至10个碱基对、约3至11个碱基对、约4至12个碱基对、约5至13个碱基对、约6至14个碱基对、约7至15个碱基对、约8至16个碱基对、约9至17个碱基对、约10至18个碱基对、约11至19个碱基对、约12至20个碱基对、约1至7个碱基对、约2至8个碱基对、约3至9个碱基对、约4至10个碱基对、约5至11个碱基对、约6至12个碱基对、约7至13个碱基对、约8至14个碱基对、约9至15个碱基对、约10至16个碱基对、约11至17个碱基对、约12至18个碱基对、约13至19个碱基对、约14至20个碱基对、约1至5个碱基对、约2至6个碱基对、约3至7个碱基对、约4至8个碱基对、约5至9个碱基对、约6至10个碱基对、约7至11个碱基对、约8至12个碱基对、约9至13个碱基对、约10至14个碱基对、约11至15个碱基对、约12至16个碱基对、约13至17个碱基对、约14至18个碱基对、约15至19个碱基对、约16至20个碱基对、约1至3个碱基对、约2至4个碱基对、约3至5个碱基对、约4至6个碱基对、约5至7个碱基对、约6至8个碱基对、约7至9个碱基对、约8至10个碱基对、约9至11个碱基对、约10至12个碱基对、约11至13个碱基对、约12至14个碱基对、约13至15个碱基对、约14至16个碱基对、约15至17个碱基对、约16至18个碱基对、约17至19个碱基对、约18至20个碱基对。在一些实施方案中,靶核碱基距离PAM序列或在其上游约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个碱基对。在一些实施方案中,靶核碱基在PAM序列上游约1、2、3、4、5、6、7、8或9个碱基对。在一些实施方案中,靶核碱基在PAM序列上游约2、3、4或6个碱基对。
融合蛋白可以包含多于一种异源多肽。例如,融合蛋白可以额外包含一个或多个UGI结构域和/或一个或多个核定位信号。两个或更多个异源结构域可以串联插入。两个或更多个异源结构域可以插入到使得它们在NapDNAbp中不串联的位置。
融合蛋白可包含脱氨酶与napDNAbp多肽之间的接头。接头可以是肽或非肽接头。例如,接头可以是XTEN、(GGGS)n(SEQ ID NO:246)、(GGGGS)n(SEQ ID NO:247)、(G)n、(EAAAK)n(SEQ ID NO:248)、(GGS)n、SGSETPGTSESATPES(SEQ ID NO:249)。在一些实施方案中,融合蛋白包含N末端Cas9片段与脱氨酶之间的接头。在一些实施方案中,融合蛋白包含C末端Cas9片段与脱氨酶之间的接头。在一些实施方案中,使用接头将napDNAbp的N末端和C末端片段连接至脱氨酶。在一些实施方案中,在没有接头的情况下将N末端和C末端片段接合至脱氨酶结构域。在一些实施方案中,融合蛋白包含N末端Cas9片段与脱氨酶之间的接头,但不包含C末端Cas9片段与脱氨酶之间的接头。在一些实施方案中,融合蛋白包含C末端Cas9片段与脱氨酶之间的接头,但不包含N末端Cas9片段与脱氨酶之间的接头。
在一些实施方案中,融合蛋白中的napDNAbp是Cas12多肽(例如,Cas12b/C2c1)或其片段。Cas12多肽可以是变体Cas12多肽。在其他实施方案中,Cas12多肽的N末端或C末端片段包含核酸可编程DNA结合结构域或RuvC结构域。在其他实施方案中,融合蛋白含有Cas12多肽与催化结构域之间的接头。在其他实施方案中,接头的氨基酸序列是GGSGGS(SEQID NO:250)或GSSGSETPGTSES ATPESSG(SEQ ID NO:251)。在其他实施方案中,接头是刚性接头。在以上方面的其他实施方案中,接头由GGAGGCTCTGGAGGAAGC(SEQ ID NO:252)或GGCTCTTCTGGATCTGAAACACCTGGCAC AAGCGAGAGCGCCACCCCTGAGAGCTCTGGC(SEQ ID NO:253)编码。
包含侧接有Cas12多肽的N末端和C末端片段的异源催化结构域的融合蛋白也可用于如本文所述的方法中的碱基编辑。包含Cas12和一个或多个脱氨酶结构域(例如,腺苷脱氨酶)的融合蛋白,或包含侧接有Cas12序列的腺苷脱氨酶结构域的融合蛋白也可用于靶序列的高特异性和高效碱基编辑。在一个实施方案中,嵌合Cas12融合蛋白含有插入到Cas12多肽内的异源催化结构域(例如,腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)。在一些实施方案中,融合蛋白包含插入到Cas12内的腺苷脱氨酶结构域和胞苷脱氨酶结构域。在一些实施方案中,腺苷脱氨酶融合在Cas12内,并且胞苷脱氨酶融合至C末端。在一些实施方案中,腺苷脱氨酶融合在Cas12内,并且胞苷脱氨酶融合至N末端。在一些实施方案中,胞苷脱氨酶融合在Cas12内,并且腺苷脱氨酶融合至C末端。在一些实施方案中,胞苷脱氨酶融合在Cas12内,并且腺苷脱氨酶融合至N末端。具有腺苷脱氨酶和胞苷脱氨酶以及Cas12的融合蛋白的示例性结构提供如下:
NH2-[Cas12(腺苷脱氨酶)]-[胞苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[Cas12(腺苷脱氨酶)]-COOH;
NH2-[Cas12(胞苷脱氨酶)]-[腺苷脱氨酶]-COOH;或
NH2-[腺苷脱氨酶]-[Cas12(胞苷脱氨酶)]-COOH;
在一些实施方案中,以上通用结构中使用的“-”指示任选的接头的存在。
在各种实施方案中,催化结构域具有DNA修饰活性(例如,脱氨酶活性),诸如腺苷脱氨酶活性。在一些实施方案中,腺苷脱氨酶是TadA(例如,TadA*7.10)。在一些实施方案中,TadA是TadA*8。在一些实施方案中,TadA*8融合在Cas12内,并且胞苷脱氨酶融合至C末端。在一些实施方案中,TadA*8融合在Cas12内,并且胞苷脱氨酶融合至N末端。在一些实施方案中,胞苷脱氨酶融合在Cas12内,并且TadA*8融合至C末端。在一些实施方案中,胞苷脱氨酶融合在Cas12内,并且TadA*8融合至N末端。具有TadA*8和胞苷脱氨酶以及Cas12的融合蛋白的示例性结构提供如下:
N-[Cas12(TadA*8)]-[胞苷脱氨酶]-C;
N-[胞苷脱氨酶]-[Cas12(TadA*8)]-C;
N-[Cas12(胞苷脱氨酶)]-[TadA*8]-C;或
N-[TadA*8]-[Cas12(胞苷脱氨酶)]-C。
在一些实施方案中,以上通用结构中使用的“-”指示任选的接头的存在。
在其他实施方案中,融合蛋白含有一个或多个催化结构域。在其他实施方案中,一个或多个催化结构域中的至少一个插入到Cas12多肽内或融合到Cas12N末端或C末端。在其他实施方案中,一个或多个催化结构域中的至少一个插入到Cas12多肽的环、α螺旋区域、非结构化部分或溶剂可接触部分内。在其他实施方案中,Cas12多肽是Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、C as12i或Cas12j/CasΦ。在其他实施方案中,Cas12多肽与外村尚芽孢杆菌(Bacillus hisashii)Cas12b、热噬淀粉芽孢杆菌(Bacillusthermoa mylovorans)Cas12b、芽孢杆菌属物种V3-13Cas12b或脂环酸芽孢杆菌(Alicyclobacillus acidiphilus)Cas12b(SEQ ID NO:254)具有至少约85%的氨基酸序列同一性。在其他实施方案中,Cas12多肽与外村尚芽孢杆菌Cas12b(SEQ ID NO:255)、热噬淀粉芽孢杆菌Cas12b、芽孢杆菌属物种V3-13Cas12b或脂环酸芽孢杆菌Cas12b具有至少约90%的氨基酸序列同一性。在其他实施方案中,Cas12多肽与外村尚芽孢杆菌Cas12b、热噬淀粉芽孢杆菌Cas12b(SEQ ID NO:256)、芽孢杆菌属物种V3-13Cas12b(SEQ ID NO:257)或脂环酸芽孢杆菌Cas12b具有至少约95%的氨基酸序列同一性。在其他实施方案中,Cas12多肽含有外村尚芽孢杆菌Cas12b、热噬淀粉芽孢杆菌Cas12b、芽孢杆菌属物种V3-13Cas12b或脂环酸芽孢杆菌Cas12b的片段或基本上由其组成。在实施方案中,Cas12多肽含有BvCas12b(V4),其在一些实施方案中表达为5'mRNA帽---5'UTR---bhCas12b---终止序列---3'UTR---120polyA尾(SEQ ID NO:258-260)。
在其他实施方案中,催化结构域插入到BhCas12b的氨基酸位置153-154、255-256、306-307、980-981、1019-1020、534-535、604-605或344-345或Cas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i或Cas12j/CasΦ的对应氨基酸残基之间。在其他实施方案中,催化结构域插入到BhCas12b的氨基酸P153与S154之间。在其他实施方案中,催化结构域插入到BhCas12b的氨基酸K255与E256之间。在其他实施方案中,催化结构域插入到BhCas12b的氨基酸D980与G981之间。在其他实施方案中,催化结构域插入到BhCas12b的氨基酸K1019与L1020之间。在其他实施方案中,催化结构域插入到BhCas12b的氨基酸F534与P535之间。在其他实施方案中,催化结构域插入到BhCas12b的氨基酸K604与G605之间。在其他实施方案中,催化结构域插入到BhCas12b的氨基酸H344与F345之间。在其他实施方案中,催化结构域插入到BvCas12b的氨基酸位置147和148、248和249、299和300、991和992或1031和1032或Cas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i或Cas12j/CasΦ的对应氨基酸残基之间。在其他实施方案中,催化结构域插入到BvCas12b的氨基酸P147与D148之间。在其他实施方案中,催化结构域插入到BvCas12b的氨基酸G248与G249之间。在其他实施方案中,催化结构域插入到BvCas12b的氨基酸P299与E300之间。在其他实施方案中,催化结构域插入到BvCas12b的氨基酸G991与E992之间。在其他实施方案中,催化结构域插入到BvCas12b的氨基酸K1031与M1032之间。在其他实施方案中,催化结构域插入到AaCas12b的氨基酸位置157和158、258和259、310和311、1008和1009或1044和1045或Cas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i或Cas12j/CasΦ的对应氨基酸残基之间。在其他实施方案中,催化结构域插入到AaCas12b的氨基酸P157与G158之间。在其他实施方案中,催化结构域插入到AaCas12b的氨基酸V258与G259之间。在其他实施方案中,催化结构域插入到AaCas12b的氨基酸D310与P311之间。在其他实施方案中,催化结构域插入到AaCas12b的氨基酸G1008与E1009之间。在其他实施方案中,催化结构域插入到AaCas12b的氨基酸G1044与K1045之间。
在其他实施方案中,融合蛋白含有核定位信号(例如,二分核定位信号)。在其他实施方案中,核定位信号的氨基酸序列是MAPKKKR KVGIHGVPAA(SEQ ID NO:261)。在以上方面的其他实施方案中,核定位信号由以下序列编码:
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGA GTCCCAGCAGCC(SEQ ID NO:262)。在其他实施方案中,Cas12b多肽含有使RuvC结构域的催化活性沉默的突变。在其他实施方案中,Cas12b多肽含有D574A、D829A和/或D952A突变。在其他实施方案中,融合蛋白还含有标签(例如,流感血凝素标签)。
在一些实施方案中,融合蛋白包含具有内部融合的核碱基编辑结构域(例如,全部或部分脱氨酶结构域,例如腺苷脱氨酶结构域)的napDNAbp结构域(例如,Cas12衍生结构域)。在一些实施方案中,napDNAbp是Cas12b。在一些实施方案中,碱基编辑器包含BhCas12b结构域,所述BhCas12b结构域具有插入在下表5中提供的基因座处的内部融合的TadA*8结构域。
表5:Cas12b蛋白中的插入基因座
作为非限制性实例,腺苷脱氨酶(例如,TadA*8.13)可以插入到BhCas12b中以产生有效编辑核酸序列的融合蛋白(例如,TadA*8.13-BhCas12b)。
在一些实施方案中,本文所述的碱基编辑系统是具有插入到Cas9中的TadA的ABE。具有插入到Cas9中的TadA的相关ABE的多肽序列在所附序列表中作为SEQ ID NO:263-308提供。
在一些实施方案中,生成腺苷碱基编辑器以将TadA或其变体插入到Cas9多肽中的鉴定位置。
示例性但非限制性的融合蛋白在国际PCT申请号PCT/US2020/016285和美国临时申请号62/852,228和62/852,224中描述,所述申请的内容通过引用整体并入本文。
A至G编辑
在一些实施方案中,本文所述的碱基编辑器包含腺苷脱氨酶结构域。碱基编辑器的这种腺苷脱氨酶结构域可以通过将腺嘌呤(A)脱氨基形成肌苷(I)来促进将腺嘌呤(A)核碱基编辑成鸟嘌呤(G)核碱基,肌苷(I)具有G的碱基配对性质。腺苷脱氨酶能够使脱氧核糖核酸(DNA)中的脱氧腺苷残基的腺嘌呤脱氨基(即,去除胺基)。在一些实施方案中,A至G碱基编辑器还包含肌苷碱基切除修复抑制剂,例如尿嘧啶糖基化酶抑制剂(UGI)结构域或无催化活性的肌苷特异性核酸酶。不希望受任何特定理论的束缚,UGI结构域或无催化活性的肌苷特异性核酸酶可以抑制或防止脱氨基的腺苷残基(例如,肌苷)的碱基切除修复,这可以提高碱基编辑器的活性或效率。
包含腺苷脱氨酶的碱基编辑器可以作用于任何多核苷酸,包括DNA、RNA和DNA-RNA杂交体。在某些实施方案中,包含腺苷脱氨酶的碱基编辑器可以使包含RNA的多核苷酸的靶标A脱氨基。例如,碱基编辑器可以包含能够使RNA多核苷酸和/或DNA-RNA杂交体多核苷酸的靶标A脱氨基的腺苷脱氨酶结构域。在一个实施方案中,掺入到碱基编辑器中的腺苷脱氨酶包含作用于RNA的腺苷脱氨酶(ADAR,例如ADAR1或ADAR2)或作用于tRNA的腺苷脱氨酶(ADAT)的全部或部分。包含腺苷脱氨酶结构域的碱基编辑器还可以能够使DNA多核苷酸的A核碱基脱氨基。在一个实施方案中,碱基编辑器的腺苷脱氨酶结构域包含全部或部分的ADAT,所述ADAT包含允许ADAT使DNA中的靶标A脱氨基的一个或多个突变。例如,碱基编辑器可以包含来自大肠杆菌的ADAT(EcTadA)的全部或部分,所述ADAT包含以下突变中的一个或多个:D108N、A106V、D147Y、E155V、L84F、H123Y、I156F、或另一种腺苷脱氨酶中的对应突变。示例性ADAT同系物多肽序列在序列表中作为SEQ ID NO:1和309-315提供。
腺苷脱氨酶可以来源于任何合适的生物体(例如,大肠杆菌)。在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌(Salmonella typhi)、腐败希瓦氏菌(Shewanella putrefaciens)、流感嗜血杆菌(Haemophilus influenzae)、新月柄杆菌(Caulobacter crescentus)或枯草芽孢杆菌(Bacillus subtilis)。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。在一些实施方案中,腺嘌呤脱氨酶是天然存在的腺苷脱氨酶,其包括对应于本文提供的任何突变(例如,ecTadA中的突变)的一个或多个突变。任何同源蛋白质中的对应残基可以通过例如同源残基的序列比对和测定来鉴定。可以相应地生成对应于本文所述的任何突变(例如,ecTadA中鉴定的任何突变)的任何天然存在的腺苷脱氨酶(例如,与ecTadA具有同源性的腺苷脱氨酶)中的突变。
在一些实施方案中,腺苷脱氨酶包含与本文提供的任何腺苷脱氨酶中列出的氨基酸序列中的任一个具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。应当理解,本文提供的腺苷脱氨酶可包括一个或多个突变(例如,本文提供的任何突变)。本公开提供了具有特定同一性百分比的任何脱氨酶结构域加上本文所述的任何突变或其组合。在一些实施方案中,与参考序列或本文提供的任何腺苷脱氨酶相比,腺苷脱氨酶包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变的氨基酸序列。在一些实施方案中,与本领域已知或本文所述的氨基酸序列中的任一个相比,腺苷脱氨酶包含具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的连续氨基酸残基的氨基酸序列。
应当理解,可以将本文提供的任何突变(例如,基于TadA参考序列)引入到其他腺苷脱氨酶中,诸如大肠杆菌TadA(ecTadA)、金黄色葡萄球菌TadA(saTadA)、或其他腺苷脱氨酶(例如,细菌腺苷脱氨酶)。对于技术人员显而易见的是,额外的脱氨酶可以类似地比对以鉴定可以如本文提供的那样突变的同源氨基酸残基。因此,可以在具有同源氨基酸残基的其他腺苷脱氨酶(例如,ecTada)中产生在TadA参考序列中鉴定的任何突变。还应当理解,可以在TadA参考序列或另一种腺苷脱氨酶中单独或以任何组合产生本文提供的任何突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D108X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D108G、D108N、D108V、D108A或D108Y突变,或另一种腺苷脱氨酶中的对应突变。然而,应当理解,额外的脱氨酶可以类似地比对以鉴定可以如本文提供的那样突变的同源氨基酸残基。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106V突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E155X突变,或另一种腺苷脱氨酶中的对应突变,其中X的存在表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E155D、E155G或E155V突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D147X突变,或另一种腺苷脱氨酶中的对应突变,其中X的存在表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D147Y突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106X、E155X或D147X突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含E155D、E155G或E155V突变。在一些实施方案中,腺苷脱氨酶包含D147Y。
还应当理解,可以在ecTadA或另一种腺苷脱氨酶中单独或以任何组合产生本文提供的任何突变。例如,腺苷脱氨酶可含有TadA参考序列中的D108N、A106V、E155V和/或D147Y突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的以下突变组(突变组由“;”分隔),或另一种腺苷脱氨酶中的对应突变:D108N和A106V;D108N和E155V;D108N和D147Y;A106V和E155V;A106V和D147Y;E155V和D147Y;D108N、A106V和E155V;D108N、A106V和D147Y;D108N、E155V和D147Y;A106V、E155V和D147Y;和D108N、A106V、E155V和D147Y。然而,应当理解,可以在腺苷脱氨酶(例如,ecTadA)中产生本文提供的对应突变的任何组合。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X和/或K157X突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X的存在表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、或A56S、E59G、E85K、或E85G、M94L、I95L、V102A、F104L、A106V、R107C、或R107H、或R107P、D108G、或D108N、或D108V、或D108A、或D108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D和/或K157R突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8X、D108X和/或N127X突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、D108N和/或N127S突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X和/或T166X突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154H或Q154R、E155G或E155V或E155D、K161Q、Q163H和/或T166P突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变。
在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8X、D108X、N127X、D147X、R152X和Q154X组成的组的一个、两个、三个、四个、五个或六个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8X、M61X、M70X、D108X、N127X、Q154X、E155X和Q163X组成的组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8X、D108X、N127X、E155X和T166X组成的组的一个、两个、三个、四个或五个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。
在一些实施方案中,腺苷脱氨酶包含选自由H8X、A106X和D108X组成的组的一个、两个、三个、四个、五个或六个突变,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由H8X、R26X、L68X、D108X、N127X、D147X和E155X组成的组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。
在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8X、R126X、L68X、D108X、N127X、D147X和E155X组成的组的一个、两个、三个、四个、五个、六个或七个突变,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8X、D108X、A109X、N127X和E155X组成的组的一个、两个、三个、四个或五个突变,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。
在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8Y、D108N、N127S、D147Y、R152C和Q154H组成的组的一个、两个、三个、四个、五个或六个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8Y、M61I、M70V、D108N、N127S、Q154R、E155G和Q163H组成的组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8Y、D108N、N127S、E155V和T166P组成的组的一个、两个、三个、四个或五个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8Y、A106T、D108N、N127S、E155D和K161Q组成的组的一个、两个、三个、四个、五个或六个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8Y、R26W、L68Q、D108N、N127S、D147Y和E155V组成的组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8Y、D108N、A109T、N127S和E155G组成的组的一个、两个、三个、四个或五个突变,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变。
在一些实施方案中,腺苷脱氨酶包含另一种腺苷脱氨酶中的对应突变中的一个或多个或一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D108N、D108G或D108V突变,或另一种腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106V和D108N突变,或另一种腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R107C和D108N突变,或另一种腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、D108N、N127S、D147Y和Q154H突变,或另一种腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、D108N、N127S、D147Y和E155V突变,或另一种腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D108N、D147Y和E155V突变,或另一种腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、D108N和N127S突变,或另一种腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106V、D108N、D147Y和E155V突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的S2X、H8X、I49X、L84X、H123X、N127X、I156X和/或K160X突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X的存在表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的S2A、H8Y、I49F、L84F、H123Y、N127S、I156F和/或K160S突变中的一个或多个,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变。
在一些实施方案中,腺苷脱氨酶包含L84X突变腺苷脱氨酶,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的L84F突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H123X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H123Y突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的I156X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的I156F突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的L84X、A106X、D108X、H123X、D147X、E155X和I156X组成的组的一个、两个、三个、四个、五个、六个或七个突变,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的S2X、I49X、A106X、D108X、D147X和E155X组成的组的一个、两个、三个、四个、五个或六个突变,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8X、A106X、D108X、N127X和K160X组成的组的一个、两个、三个、四个或五个突变,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸的存在。
在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的L84F、A106V、D108N、H123Y、D147Y、E155V和I156F组成的组的一个、两个、三个、四个、五个、六个或七个突变,或另一种腺苷脱氨酶中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的S2A、I49F、A106V、D108N、D147Y和E155V组成的组的一个、两个、三个、四个、五个或六个突变。
在一些实施方案中,腺苷脱氨酶包含选自由TadA参考序列中的H8Y、A106T、D108N、N127S和K160S组成的组的一个、两个、三个、四个或五个突变,或另一种腺苷脱氨酶中的一个或多个对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E25X、R26X、R107X、A142X和/或A143X突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X的存在表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q和/或A143R突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含本文所述的对应于TadA参考序列的突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E25X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E25M、E25D、E25A、E25R、E25V、E25S或E25Y突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R26X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R26G、R26N、R26Q、R26C、R26L或R26K突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R107X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R107P、R107K、R107A、R107N、R107W、R107H或R107S突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A142X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A142N、A142D、A142G突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A143X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q和/或A143R突变,或另一种腺苷脱氨酶(例如,ecTadA)中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X和/或K161X突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个对应突变,其中X的存在表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N和/或K161T突变中的一个或多个,或另一种腺苷脱氨酶(例如,ecTadA)中的一个或多个对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H36X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H36L突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的N37X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的N37T或N37S突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的P48X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的P48T或P48L突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R51X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R51H或R51L突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的S146X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的S146R或S146C突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的K157X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的K157N突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的P48X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的P48S、P48T或P48A突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A142X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A142N突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的W23X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的W23R或W23L突变,或另一种腺苷脱氨酶中的对应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R152X突变,或另一种腺苷脱氨酶中的对应突变,其中X表示除野生型腺苷脱氨酶中的对应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R152P或R52H突变,或另一种腺苷脱氨酶中的对应突变。
在一个实施方案中,腺苷脱氨酶可包含突变H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F和K157N。在一些实施方案中,相对于TadA参考序列,腺苷脱氨酶包含以下的突变组合,其中组合中的每个突变由“_”分隔,并且突变的每个组合在括号之间:
(A106V_D108N),
(R107C_D108N),
(H8Y_D108N_N127S_D147Y_Q154H),
(H8Y_D108N_N127S_D147Y_E155V),
(D108N_D147Y_E155V),
(H8Y_D108N_N127S),
(H8Y_D108N_N127S_D147Y_Q154H),
(A_106V_D108N_D147Y_E155V),
(D108Q_D147Y_E155V),
(D108M_D147Y_E155V),
(D108L_D147Y_E155V),
(D108K_D147Y_E155V),
(D108I_D147Y_E155V),
(D108F_D147Y_E155V),
(A106V_D108N_D147Y),
(A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V),
(E59A猫死亡_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A_106V_D108N_H123Y_D147Y_E155V_1156F),
(D103A_D104N),
(G22P_D103A_D104N),
(D103A_D104N_S138A),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107HD108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25D_R26G_L84F_A106V_R107K_D108N_H23Y_A142N_A143G_D147Y_E155V_I156F),
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D157Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_1156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),
(R26G_A106V_D_108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R5lL_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)
(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_1156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_1156F_K157N),
(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_1156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155VI156F_K157N_K160E_K16lT),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_1156F),
(P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48T_149V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A_106V_D108N_H123Y_A142N_S146C_D147Y_E155V_1156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N),
(W23L_H36L_P48A_R5lL_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N),(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V_1156F_K157N).
在一些实施方案中,TadA脱氨酶是TadA变体。在一些实施方案中,TadA变体是TadA*7.10。在特定的实施方案中,融合蛋白包含单一TadA*7.10结构域(例如,作为单体提供)。在其他实施方案中,融合蛋白包含能够形成异源二聚体的TadA*7.10和TadA(Wt)。在一个实施方案中,本发明的融合蛋白包含与TadA*7.10连接的野生型TadA,TadA*7.10连接至Cas9切口酶。
在一些实施方案中,TadA*7.10包含至少一个改变。在一些实施方案中,腺苷脱氨酶包含以下序列中的改变:
TadA*7.10
IGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTF EPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:1)
在一些实施方案中,TadA*7.10包含氨基酸82和/或166处的改变。在特定的实施方案中,TadA*7.10包含以下改变中的一个或多个:Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R。在其他实施方案中,TadA*7.10的变体包含选自以下组的改变组合:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;和I76Y+V82S+Y123H+Y147R+Q154R。
在一些实施方案中,腺苷脱氨酶变体(例如,TadA*8)包含缺失。在一些实施方案中,腺苷脱氨酶变体包含C末端的缺失。在特定的实施方案中,腺苷脱氨酶变体相对于TadA参考序列TadA*7.10包含从残基149、150、151、152、153、154、155、156和157开始的C末端缺失,或包含另一个TadA中的对应突变。
在其他实施方案中,腺苷脱氨酶变体(例如,TadA*8)是相对于TadA参考序列TadA*7.10包含以下改变中的一个或多个:Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R,或包含另一个TadA中的对应突变的单体。在其他实施方案中,腺苷脱氨酶变体(TadA*8)是相对于TadA参考序列TadA*7.10包含选自以下组的改变组合:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;和I76Y+V82S+Y123H+Y147R+Q154R,或包含另一个TadA中的对应突变的单体。
在其他实施方案中,腺苷脱氨酶变体是包含两个腺苷脱氨酶结构域(例如,TadA*8)的同源二聚体,所述腺苷脱氨酶结构域各自相对于TadA参考序列TadA*7.10具有以下改变中的一个或多个:Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R,或具有另一个TadA中的对应突变。在其他实施方案中,腺苷脱氨酶变体是包含两个腺苷脱氨酶结构域(例如,TadA*8)的同源二聚体,所述腺苷脱氨酶结构域各自相对于TadA参考序列TadA*7.10具有选自以下组的改变组合:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;和I76Y+V82S+Y123H+Y147R+Q154R,或具有另一个TadA中的对应突变。
在其他实施方案中,腺苷脱氨酶变体是野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,TadA*8)的异源二聚体,其相对于TadA参考序列TadA*7.10包含以下改变中的一个或多个:Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R,或包含另一个TadA中的对应突变。在其他实施方案中,腺苷脱氨酶变体是野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,TadA*8)的异源二聚体,其相对于TadA参考序列TadA*7.10包含选自以下组的改变组合:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;和I76Y+V82S+Y123H+Y147R+Q154R,或包含另一个TadA中的对应突变。
在其他实施方案中,腺苷脱氨酶变体是TadA*7.10结构域和腺苷脱氨酶变体结构域(例如,TadA*8)的异源二聚体,其相对于TadA参考序列TadA*7.10包含以下改变中的一个或多个:Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R,或包含另一个TadA中的对应突变。在其他实施方案中,腺苷脱氨酶变体是TadA*7.10结构域和腺苷脱氨酶变体结构域(例如,TadA*8)的异源二聚体,其相对于TadA参考序列TadA*7.10包含选自以下组的改变组合:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;和I76Y+V82S+Y123H+Y147R+Q154R,或包含另一个TadA中的对应突变。
在特定的实施方案中,腺苷脱氨酶异源二聚体包含TadA*8结构域和选自以下的腺苷脱氨酶结构域:金黄色葡萄球菌(S.aureus)TadA、枯草芽孢杆菌(B.subtilis)TadA、鼠伤寒沙门氏菌(S.typhimurium)TadA、腐败希瓦氏菌(S.putrefaciens)TadA、流感嗜血杆菌F3031(H.influenzae)TadA、新月柄杆菌(C.crescentus)TadA、硫还原地杆菌(G.sulfurreducens)TadA或TadA*7.10。
在一些实施方案中,腺苷脱氨酶是TadA*8。在一个实施方案中,腺苷脱氨酶是TadA*8,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD(SEQ IDNO:316)
在一些实施方案中,TadA*8是截短的。在一些实施方案中,相对于全长TadA*8,截短的TadA*8丢失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N末端氨基酸残基。在一些实施方案中,相对于全长TadA*8,截短的TadA*8丢失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个C末端氨基酸残基。在一些实施方案中,腺苷脱氨酶变体是全长TadA*8。
在一些实施方案中,TadA*8是TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23或TadA*8.24。
在其他实施方案中,本公开的碱基编辑器包含腺苷脱氨酶变体(例如,TadA*8)单体,所述单体相对于TadA参考序列TadA*7.10包含以下改变中的一个或多个:R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和/或D167N,或包含另一个TadA中的对应突变。在其他实施方案中,腺苷脱氨酶变体(TadA*8)单体相对于TadA参考序列TadA*7.10包含选自以下组的改变组合:R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N;V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;V88A+T111R+D119N+F149Y;和A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N,或包含另一个TadA中的对应突变。
在其他实施方案中,碱基编辑器包含野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,TadA*8)的异源二聚体,所述异源二聚体相对于TadA参考序列TadA*7.10包含以下改变中的一个或多个:R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和/或D167N,或包含另一个TadA中的对应突变。在其他实施方案中,碱基编辑器包含野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,TadA*8)的异源二聚体,所述异源二聚体相对于TadA参考序列TadA*7.10包含选自以下组的改变组合:R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N;V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;V88A+T111R+D119N+F149Y;和A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N,或包含另一个TadA中的对应突变。
在其他实施方案中,碱基编辑器包含TadA*7.10结构域和腺苷脱氨酶变体结构域(例如,TadA*8)的异源二聚体,所述异源二聚体相对于TadA参考序列TadA*7.10包含以下改变中的一个或多个:R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和/或D167N,或包含另一个TadA中的对应突变。在其他实施方案中,碱基编辑器包含TadA*7.10结构域和腺苷脱氨酶变体结构域(例如,TadA*8)的异源二聚体,所述异源二聚体相对于TadA参考序列TadA*7.10包含选自以下组的改变组合:R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N;V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;V88A+T111R+D119N+F149Y;和A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N,或包含另一个TadA中的对应突变。
在一些实施方案中,TadA*8是如表6中所示的变体。表6示出了TadA氨基酸序列中的某些氨基酸位置编号以及TadA-7.10腺苷脱氨酶中的那些位置中存在的氨基酸。表6还示出了在噬菌体辅助非连续进化(PANCE)和噬菌体辅助连续进化(PACE)后,TadA变体相对于TadA-7.10的氨基酸变化,如M.Richter等人,2020,Nature Biotech nology,doi.org/10.1038/s41587-020-0453-z中所述,其全部内容通过引用并入本文。在一些实施方案中,TadA*8是TadA*8a、TadA*8b、TadA*8c、TadA*8d或TadA*8e。在一些实施方案中,TadA*8是TadA*8e。
表6.选择TadA*8变体TadA氨基酸编号
在一个实施方案中,本发明的融合蛋白包含连接至本文所述的腺苷脱氨酶变体(例如,TadA*8)的野生型TadA,所述TadA*8连接至Cas9切口酶。在特定的实施方案中,融合蛋白包含单一TadA*8结构域(例如,作为单体提供)。在其他实施方案中,融合蛋白包含能够形成异源二聚体的TadA*8和TadA(wt)。
在一些实施方案中,腺苷脱氨酶包含与本文提供的任何腺苷脱氨酶中列出的氨基酸序列中的任一个具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。应当理解,本文提供的腺苷脱氨酶可包括一个或多个突变(例如,本文提供的任何突变)。本公开提供了具有特定同一性百分比的任何脱氨酶结构域加上本文所述的任何突变或其组合。在一些实施方案中,与参考序列或本文提供的任何腺苷脱氨酶相比,腺苷脱氨酶包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变的氨基酸序列。在一些实施方案中,与本领域已知或本文所述的氨基酸序列中的任一个相比,腺苷脱氨酶包含具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的连续氨基酸残基的氨基酸序列。
在特定的实施方案中,TadA*8在以粗体显示的任何以下位置处包含一个或多个突变。在其他实施方案中,TadA*8在使用下划线显示的任何位置处包含一个或多个突变:
例如,TadA*8相对于TadA参考序列TadA*7.10包含单独的氨基酸位置82和/或166处的改变(例如,V82S、T166R)或包含所述改变与以下中的任何一个或多个的组合:Y147T、Y147R、Q154S、Y123H和/或Q154R,或包含另一个TadA中的对应突变。在特定的实施方案中,相对于TadA参考序列TadA*7.10,改变组合选自以下组:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;和I76Y+V82S+Y123H+Y147R+Q154R,或另一个TadA中的对应突变。
在一些实施方案中,TadA*8是截短的。在一些实施方案中,相对于全长TadA*8,截短的TadA*8丢失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N末端氨基酸残基。在一些实施方案中,相对于全长TadA*8,截短的TadA*8丢失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个C末端氨基酸残基。在一些实施方案中,腺苷脱氨酶变体是全长TadA*8。
在一个实施方案中,本发明的融合蛋白包含连接至本文所述的腺苷脱氨酶变体(例如,TadA*8)的野生型TadA,所述TadA*8连接至Cas9切口酶。在特定的实施方案中,融合蛋白包含单一TadA*8结构域(例如,作为单体提供)。在其他实施方案中,碱基编辑器包含能够形成异源二聚体的TadA*8和TadA(wt)。
在特定的实施方案中,融合蛋白包含单一(例如,作为单体提供)TadA*8。在一些实施方案中,TadA*8与Cas9切口酶连接。在一些实施方案中,本发明的融合蛋白包含野生型TadA(TadA(wt))与TadA*8连接的异源二聚体。在其他实施方案中,本发明的融合蛋白包含TadA*7.10与TadA*8连接的异源二聚体。在一些实施方案中,碱基编辑器是包含TadA*8变体单体的ABE8。在一些实施方案中,碱基编辑器是包含TadA*8和TadA(wt)的异源二聚体的ABE8。在一些实施方案中,碱基编辑器是包含TadA*8和TadA*7.10的异源二聚体的ABE8。在一些实施方案中,碱基编辑器是包含TadA*8的异源二聚体的ABE8。在一些实施方案中,TadA*8选自表6、表12或表13。在一些实施方案中,ABE8选自表12、表13或表15。
在一些实施方案中,腺苷脱氨酶是TadA*9变体。在一些实施方案中,腺苷脱氨酶是TadA*9变体,其选自下述变体并参考以下序列(称为TadA*7.10):
在一些实施方案中,腺苷脱氨酶包含以下改变中的一个或多个:R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R和A158K。一个或多个改变在以上序列中以下划线和粗体显示。
在一些实施方案中,腺苷脱氨酶包含以下改变组合中的一个或多个:V82S+Q154R+Y147R;V82S+Q154R+Y123H;V82S+Q154R+Y147R+Y123H;Q154R+Y147R+Y123H+I76Y+V82S;V82S+I76Y;V82S+Y147R;V82S+Y147R+Y123H;V82S+Q154R+Y123H;Q154R+Y147R+Y123H+I76Y;V82S+Y147R;V82S+Y147R+Y123H;V82S+Q154R+Y123H;V82S+Q154R+Y147R;V82S+Q154R+Y147R;Q154R+Y147R+Y123H+I76Y;Q154R+Y147R+Y123H+I76Y+V82S;I76Y_V82S_Y123H_Y147R_Q154R;Y147R+Q154R+H123H;和V82S+Q154R。
在一些实施方案中,腺苷脱氨酶包含以下改变组合中的一个或多个:E25F+V82S+Y123H,T133K+Y147R+Q154R;E25F+V82S+Y123H+Y147R+Q154R;L51W+V82S+Y123H+C146R+Y147R+Q154R;Y73S+V82S+Y123H+Y147R+Q154R;P54C+V82S+Y123H+Y147R+Q154R;N38G+V82T+Y123H+Y147R+Q154R;N72K+V82S+Y123H+D139L+Y147R+Q154R;E25F+V82S+Y123H+D139M+Y147R+Q154R;Q71M+V82S+Y123H+Y147R+Q154R;E25F+V82S+Y123H+T133K+Y147R+Q154R;E25F+V82S+Y123H+Y147R+Q154R;V82S+Y123H+P124W+Y147R+Q154R;L51W+V82S+Y123H+C146R+Y147R+Q154R;P54C+V82S+Y123H+Y147R+Q154R;Y73S+V82S+Y123H+Y147R+Q154R;N38G+V82T+Y123H+Y147R+Q154R;R23H+V82S+Y123H+Y147R+Q154R;R21N+V82S+Y123H+Y147R+Q154R;V82S+Y123H+Y147R+Q154R+A158K;N72K+V82S+Y123H+D139L+Y147R+Q154R;E25F+V82S+Y123H+D139M+Y147R+Q154R;和M70V+V82S+M94V+Y123H+Y147R+Q154R
在一些实施方案中,腺苷脱氨酶包含以下改变组合中的一个或多个:Q71M+V82S+Y123H+Y147R+Q154R;E25F+I76Y+V82S+Y123H+Y147R+Q154R;I76Y+V82T+Y123H+Y147R+Q154R;N38G+I76Y+V82S+Y123H+Y147R+Q154R;R23H+I76Y+V82S+Y123H+Y147R+Q154R;P54C+I76Y+V82S+Y123H+Y147R+Q154R;R21N+I76Y+V82S+Y123H+Y147R+Q154R;I76Y+V82S+Y123H+D139M+Y147R+Q154R;Y73S+I76Y+V82S+Y123H+Y147R+Q154R;E25F+I76Y+V82S+Y123H+Y147R+Q154R;I76Y+V82T+Y123H+Y147R+Q154R;N38G+I76Y+V82S+Y123H+Y147R+Q154R;R23H+I76Y+V82S+Y123H+Y147R+Q154R;P54C+I76Y+V82S+Y123H+Y147R+Q154R;R21N+I76Y+V82S+Y123H+Y147R+Q154R;I76Y+V82S+Y123H+D139M+Y147R+Q154R;Y73S+I76Y+V82S+Y123H+Y147R+Q154R;and V82S+Q154R;N72K_V82S+Y123H+Y147R+Q154R;Q71M_V82S+Y123H+Y147R+Q154R;V82S+Y123H+T133K+Y147R+Q154R;V82S+Y123H+T133K+Y147R+Q154R+A158K;M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;N72K_V82S+Y123H+Y147R+Q154R;Q71M_V82S+Y123H+Y147R+Q154R;M70V+V82S+M94V+Y123H+Y147R+Q154R;V82S+Y123H+T133K+Y147R+Q154R;V82S+Y123H+T133K+Y147R+Q154R+A158K;和M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。在一些实施方案中,腺苷脱氨酶被表达为单体。在其他实施方案中,腺苷脱氨酶被表达为异源二聚体。在一些实施方案中,脱氨酶或其他多肽序列缺乏甲硫氨酸,例如当作为融合蛋白的组分被包括时。这可以改变位置的编号。然而,技术人员将理解此类对应突变是指相同的突变,例如Y73S和Y72S以及D139M和D138M。
在一些实施方案中,TadA*9变体包含如本文所述的表16中所述的改变。在一些实施方案中,TadA*9变体是单体。在一些实施方案中,TadA*9变体是与野生型TadA腺苷脱氨酶的异源二聚体。在一些实施方案中,TadA*9变体是与另一个TadA变体(例如,TadA*8、TadA*9)的异源二聚体。TadA*9腺苷脱氨酶的其他详细信息在国际PCT申请号PCT/2020/049975中描述,所述申请通过引用整体并入本文。
可以将本文提供的任何突变和任何额外突变(例如,基于ecTadA氨基酸序列)引入到任何其他腺苷脱氨酶中。可以在TadA参考序列或另一种腺苷脱氨酶(例如,ecTadA)中单独或以任何组合产生本文提供的任何突变。
A至G核碱基编辑蛋白的详细信息在国际PCT申请号PCT/2017/045381(WO2018/027078)和Gaudelli,N.M.,等人,“Programmable base editing of A·T to G·C ingenomic DNA without DNA cl eavage”Nature,551,464-471(2017)中描述,其全部内容特此通过引用并入。
C至T编辑
在一些实施方案中,本文公开的碱基编辑器包含融合蛋白,所述融合蛋白包含胞苷脱氨酶,所述胞苷脱氨酶能够使多核苷酸的靶胞苷(C)碱基脱氨基以产生尿苷(U),其具有胸腺嘧啶的碱基配对性质。在一些实施方案中,例如在多核苷酸是双链(例如,DNA)的情况下,尿苷碱基然后可以被胸苷碱基取代(例如,通过细胞修复机制)以产生C:G至T:A转变。在其他实施方案中,碱基编辑器将核酸中的C脱氨基为U不能伴随将U取代为T。
多核苷酸中的靶标C产生U的脱氨基是可以由本文所述的碱基编辑器执行的一类碱基编辑的非限制性实例。在另一个实例中,包含胞苷脱氨酶结构域的碱基编辑器可以介导胞嘧啶(C)碱基向鸟嘌呤(G)碱基的转化。例如,通过碱基编辑器的胞苷脱氨酶结构域进行的胞苷的脱氨基产生的多核苷酸的U可以通过碱基切除修复机制(例如,通过尿嘧啶DNA糖基化酶(UDG)结构域)从多核苷酸中切除,从而产生脱碱基位点。然后可以通过例如转位(translesion)聚合酶将脱碱基位点对面的核碱基取代为(例如,通过碱基修复机制)另一个碱基,诸如C。虽然脱碱基位点对面的核碱基通常被C替换,但也可能发生其他取代(例如,A、G或T)。
因此,在一些实施方案中,本文所述的碱基编辑器包含能够使多核苷酸中的靶标C脱氨基为U的脱氨结构域(例如,胞苷脱氨酶结构域)。此外,如下所述,碱基编辑器可以包含额外的结构域,所述结构域促进在一些实施方案中将脱氨基产生的U转化为T或G。例如,包含胞苷脱氨酶结构域的碱基编辑器还可以包含尿嘧啶糖基化酶抑制剂(UGI)结构域以介导U被T取代,从而完成C至T碱基编辑事件。在另一个实例中,碱基编辑器可以掺入转位聚合酶来提高C至G碱基编辑的效率,因为转位聚合酶可以促进脱碱基位点对面的C的掺入(即,导致脱碱基位点处的G的掺入,从而完成C至G碱基编辑事件)。
包含胞苷脱氨酶作为结构域的碱基编辑器可以使任何多核苷酸(包括DNA、RNA和DNA-RNA杂交体)中的靶标C脱氨基。通常,胞苷脱氨酶催化位于多核苷酸的单链部分的环境中的C核碱基。在一些实施方案中,包含靶标C的整个多核苷酸可以是单链的。例如,掺入到碱基编辑器中的胞苷脱氨酶可以使单链RNA多核苷酸中的靶标C脱氨基。在其他实施方案中,包含胞苷脱氨酶结构域的碱基编辑器可以作用于双链多核苷酸,但靶标C可以位于在脱氨反应时处于单链状态的多核苷酸的一部分中。例如,在NAGPB结构域包含Cas9结构域的实施方案中,在Cas9-gRNA-靶DNA复合物的形成期间可以留下若干个未配对的核苷酸,从而导致形成Cas9“R环复合物”。这些未配对的核苷酸可以形成单链DNA泡,所述单链DNA泡可以用作单链特异性核苷酸脱氨酶(例如,胞苷脱氨酶)的底物。
在一些实施方案中,碱基编辑器的胞苷脱氨酶可以包含载脂蛋白B mRNA编辑复合物(APOBEC)家族脱氨酶的全部或部分。APOBEC是进化上保守的胞苷脱氨酶家族。这个家族的成员是C至U编辑酶。APOBEC样蛋白的N末端结构域是催化结构域,而C末端结构域是伪催化结构域。更具体地说,催化结构域是锌依赖性胞苷脱氨酶结构域,并且对胞苷脱氨基很重要。APOBEC家族成员包括APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(“APOBEC3E”现在指代此)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4和激活诱导(胞苷)脱氨酶。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC1脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC2脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3A脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3B脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3C脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3D脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3E脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3F脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3G脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC3H脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC4脱氨酶的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含激活诱导脱氨酶(AID)的全部或部分。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含胞苷脱氨酶1(CDA1)的全部或部分。应当理解,碱基编辑器可以包含来自任何合适的生物体(例如,人或大鼠)的脱氨酶。在一些实施方案中,碱基编辑器的脱氨酶结构域来自人、黑猩猩、大猩猩、猴子、牛、狗、大鼠或小鼠。在一些实施方案中,碱基编辑器的脱氨酶结构域来源于大鼠(例如,大鼠APOBEC1)。在一些实施方案中,碱基编辑器的脱氨酶结构域是人APOBEC1。在一些实施方案中,碱基编辑器的脱氨酶结构域是pmCDA1。
下文提供了可以根据本公开的方面与Cas9融合的其他示例性脱氨酶。在实施方案中,脱氨酶是激活诱导脱氨酶(AID)。应当理解,在一些实施方案中,可以使用相应序列的活性结构域,例如,不具有定位信号的结构域(不具有核输出信号、细胞质定位信号的核定位序列)。
本公开的一些方面基于以下认识,即调节本文所述的任何融合蛋白的脱氨酶结构域催化活性,例如通过在脱氨酶结构域中产生点突变,会影响融合蛋白(例如,碱基编辑器)的持续合成能力(processivity)。例如,减少但不消除碱基编辑融合蛋白内的脱氨酶结构域的催化活性的突变可以降低脱氨酶结构域将催化与靶标残基相邻的残基的脱氨基的可能性,从而缩小脱氨基窗口。缩小脱氨基窗口的能力可以防止与特定靶标残基相邻的残基的不需要的脱氨基,这可以减少或防止脱靶效应。
例如,在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包含选自由rAPOBEC1的H121X、H122X、R126X、R126X、R118X、W90X、W90X和R132X组成的组的一个或多个突变,或另一个APOBEC脱氨酶中的一个或多个对应突变,其中X是任何氨基酸。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包含选自由rAPOBEC1的H121R、H122R、R126A、R126E、R118A、W90A、W90Y和R132E组成的组的一个或多个突变,或另一个APOBEC脱氨酶中的一个或多个对应突变。
在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包含选自由hAPOBEC3G的D316X、D317X、R320X、R320X、R313X、W285X、W285X、R326X组成的组的一个或多个突变,或另一个APOBEC脱氨酶中的一个或多个对应突变,其中X是任何氨基酸。在一些实施方案中,本文提供的任何融合蛋白包含APOBEC脱氨酶,所述APOBEC脱氨酶包含选自由hAPOBEC3G的D316R、D317R、R320A、R320E、R313A、W285A、W285Y、R326E组成的组的一个或多个突变,或另一个APOBEC脱氨酶中的一个或多个对应突变。
在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包含rAPOBEC1的H121R和H122R突变,或另一个APOBEC脱氨酶中的一个或多个对应突变。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的R126A突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的R126E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的R118A突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的W90A突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的W90Y突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的R132E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的W90Y和R126E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的R126E和R132E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的W90Y和R132E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含rAPOBEC1的W90Y、R126E和R132E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。
在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的D316R和D317R突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,本文提供的任何融合蛋白包含有包含hAPOBEC3G的R320A突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的R320E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的R313A突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的W285A突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的W285Y突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的R326E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的W285Y和R320E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的R320E和R326E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的W285Y和R326E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。在一些实施方案中,掺入到碱基编辑器中的APOBEC脱氨酶可以包括包含hAPOBEC3G的W285Y、R320E和R326E突变或另一个APOBEC脱氨酶中的一个或多个对应突变的APOBEC脱氨酶。
许多修饰的胞苷脱氨酶是可商购获得的,包括但不限于SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3和YEE-BE3,其可以从Addgene获得(质粒85169、85170、85171、85172、85173、85174、85175、85176、85177)。在一些实施方案中,掺入到碱基编辑器中的脱氨酶包含APOBEC1脱氨酶的全部或部分。
在一些实施方案中,本发明的融合蛋白包含一个或多个胞苷脱氨酶结构域。在一些实施方案中,本文提供的胞苷脱氨酶能够使胞嘧啶或5-甲基胞嘧啶脱氨基为尿嘧啶或胸腺嘧啶。在一些实施方案中,本文提供的胞苷脱氨酶能够使DNA中的胞嘧啶脱氨基。胞苷脱氨酶可来源于任何合适的生物体。在一些实施方案中,胞苷脱氨酶是天然存在的胞苷脱氨酶,其包括对应于本文提供的任何突变的一个或多个突变。本领域技术人员将能够鉴定任何同源蛋白质中的对应残基,例如,通过同源残基的序列比对和测定。因此,本领域技术人员将能够在任何天然存在的胞苷脱氨酶中生成对应于本文所述的任何突变的突变。在一些实施方案中,胞苷脱氨酶来自原核生物。在一些实施方案中,胞苷脱氨酶来自细菌。在一些实施方案中,胞苷脱氨酶来自哺乳动物(例如,人)。
在一些实施方案中,胞苷脱氨酶包含与本文列出的胞苷脱氨酶氨基酸序列中的任一种具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。应当理解,本文提供的胞苷脱氨酶可包括一个或多个突变(例如,本文提供的任何突变)。一些实施方案提供了编码任何前述方面或如本文所描绘的胞苷脱氨酶核碱基编辑器多肽的多核苷酸分子。在一些实施方案中,多核苷酸是密码子优化的。
本公开提供了具有特定同一性百分比的任何脱氨酶结构域加上本文所述的任何突变或其组合。在一些实施方案中,与参考序列或本文提供的任何胞苷脱氨酶相比,胞苷脱氨酶包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变的氨基酸序列。在一些实施方案中,与本领域已知或本文所述的氨基酸序列中的任一个相比,胞苷脱氨酶包含具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的连续氨基酸残基的氨基酸序列。
本发明第二蛋白的融合蛋白包含两个或更多个核酸编辑结构域。
C至T核碱基编辑蛋白的详细信息在国际PCT申请号PCT/US2016/058344(WO2017/070632)和Komor,A.C.,等人,“Programmable editing of a target base in genomicDNA without double-stranded DNA cleavage”Nature 533,420-424(2016)中描述,所述申请和文献的全部内容特此通过引用并入。
指导多核苷酸
当与结合的指导多核苷酸(例如,gRNA)结合时,多核苷酸可编程核苷酸结合结构域可以特异性结合靶多核苷酸序列(即,经由结合的指导核酸的碱基与靶多核苷酸序列的碱基之间的互补碱基配对),从而将碱基编辑器定位到期望编辑的靶核酸序列。在一些实施方案中,靶多核苷酸序列包含单链DNA或双链DNA。在一些实施方案中,靶多核苷酸序列包含RNA。在一些实施方案中,靶多核苷酸序列包含DNA-RNA杂交体。
CRISPR是针对移动遗传元件(病毒、转座元件和缀合质粒)提供保护的适应性免疫系统。CRISPR簇含有间隔子、与先行移动元件(an tecedent mobile element)互补的序列和靶标入侵核酸(target invading nucleic acid)。CRISPR簇被转录并加工成CRISPR RNA(crRNA)。在II型CRISPR系统中,pre-crRNA的正确加工需要反式编码的小R NA(tracrRNA)、内源核糖核酸酶3(rnc)和Cas9蛋白。tracrRNA用作pre-crRNA的核糖核酸酶3辅助加工的指导。随后,Cas9/crRNA/t racrRNA通过核酸内切酶切割与间隔子互补的线性或环状dsDNA靶标。与crRNA不互补的靶标链首先通过核酸内切酶切割,然后通过核酸外切酶修剪3'-5'。在自然界中,DNA结合和切割通常需要蛋白质和两种RNA。然而,可以对单一指导RNA(“sgRNA”,或简称为“gRNA”)进行工程改造,以便将crRNA和tracrRNA的方面掺入到单一RNA种类中。参见,例如,Jinek M.,等人Science 337:816-821(2012),其全部内容特此通过引用并入。Cas9识别CRISPR重复序列中的短基序(PAM或原间隔序列临近基序),以帮助区分自身与非自身。参见例如,“Complete genome sequence of an M1strain of Streptoc occuspyogenes.”Ferretti,J.J.等人,Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPRRNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.等人,Nature 471:602-607(2011);和“Programmable dual-RNA-guided DNAendonuclease in a daptive bacterial immunity.”Jinek M.等人,Science 337:816-821(2012),所述文献各自的全部内容通过引用并入本文)。
PAM序列可以是本领域已知的任何PAM序列。合适的PAM序列包括但不限于NGG、NGA、NGC、NGN、NGT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW或NAAAAC。Y是嘧啶;N是任何核苷酸碱基;W是A或T。
在一个实施方案中,本文所述的指导多核苷酸可以是RNA或DNA。在一个实施方案中,指导多核苷酸是gRNA。RNA/Cas复合物可以帮助将Cas蛋白“指导”至靶DNA。Cas9/crRNA/tracrRNA通过核酸内切酶切割与间隔子互补的线性或环状dsDNA靶标。与crRNA不互补的靶标链首先通过核酸内切酶切割,然后通过核酸外切酶修剪3'-5'。在自然界中,DNA结合和切割通常需要蛋白质和两种RNA。然而,可以对单一指导RNA(“sgRNA”,或简称为“gRNA”)进行工程改造,以便将crRNA和tracrRNA的方面掺入到单一RNA种类中。参见,例如,Jinek M.等人,Science 337:816-821(2012),其全部内容特此通过引用并入。
在一些实施方案中,指导多核苷酸是至少一个单一指导RNA(“sgRNA”或“gRNA”)。在一些实施方案中,指导多核苷酸包含两个或更多个单独的多核苷酸,其可以经由例如互补碱基配对彼此相互作用(例如,双指导多核苷酸、双gRNA)。例如,指导多核苷酸可包含CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)或者可以包含一种或多种反式激活CRISPR RNA(tracrRNA)。
在一些实施方案中,指导多核苷酸是至少一种tracrRNA。在一些实施方案中,指导多核苷酸不需要PAM序列来将多核苷酸可编程DNA结合结构域(例如,Cas9或Cpf1)指导至靶核苷酸序列。
指导多核苷酸可包括天然或非天然(或不天然)核苷酸(例如,肽核酸或核苷酸类似物)。在一些情况下,指导核酸序列的靶向区域的长度可以是至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。指导核酸的靶向区域的长度可以在10-30个核苷酸之间,或在15-25个核苷酸之间,或在15-20个核苷酸之间。
在一些实施方案中,本文提供的碱基编辑器利用一个或多个指导多核苷酸(例如,多个gRNA)。在一些实施方案中,单一指导多核苷酸用于本文所述的不同碱基编辑器。例如,单一指导多核苷酸可以用于胞苷碱基编辑器和腺苷碱基编辑器。
在一些实施方案中,本文所述的方法可以利用工程化Cas蛋白。指导RNA(gRNA)是一种短的合成RNA,其由Cas结合所必需的支架序列和用户定义的约20个核苷酸的间隔子构成,所述间隔子定义了待修饰的基因组靶标。示例性gRNA支架序列在序列表中作为SEQ IDNO:317-327提供。因此,技术人员可以改变Cas蛋白特异性的基因组靶标,这部分由与基因组的其他部分相比,gRNA靶向序列对基因组靶标的特异性如何来决定。
在其他实施方案中,指导多核苷酸可以在单个分子中包含核酸的多核苷酸靶向部分和核酸的支架部分(即,单分子指导核酸)。例如,单分子指导多核苷酸可以是单一指导RNA(sgRNA或gRNA)。本文中的术语指导多核苷酸序列考虑能够与碱基编辑器相互作用并且将碱基编辑器引导至靶多核苷酸序列的任何单分子、双分子或多分子核酸。
通常,指导多核苷酸(例如,crRNA/trRNA复合物或gRNA)包含“多核苷酸靶向区段”,所述多核苷酸靶向区段包括能够识别并结合靶多核苷酸序列的序列,以及“蛋白质结合区段”,所述蛋白质结合区段使指导多核苷酸在碱基编辑器的多核苷酸可编程核苷酸结合结构域组分内稳定。在一些实施方案中,指导多核苷酸的多核苷酸靶向区段识别并结合DNA多核苷酸,从而促进DNA中碱基的编辑。在其他情况下,指导多核苷酸的多核苷酸靶向区段识别并结合RNA多核苷酸,从而促进RNA中碱基的编辑。本文中的“区段”是指分子的部分或区域,例如,指导多核苷酸中的一段连续核苷酸。区段还可以指代复合物的区域/部分,使得区段可以包含多于一个分子的区域。例如,在指导多核苷酸包含多个核酸分子的情况下,蛋白质结合区段可以包括例如沿着互补区域杂交的多个单独分子的全部或部分。在一些实施方案中,包含两个单独分子的靶向DNA的RNA的蛋白质结合区段可以包含(i)长度为100个碱基对的第一RNA分子的碱基对40-75;和(ii)长度为50个碱基对的第二RNA分子的碱基对10-25。除非另外在特定背景下明确定义,否则“区段”的定义不限于特定数量的总碱基对,不限于来自给定RNA分子的任何特定数量的碱基对,不限于复合物内的特定数量的单独分子,并且可以包括具有任何总长度的RNA分子的区域并且可以包括与其他分子互补的区域。
指导多核苷酸可以化学合成、酶促合成或通过其组合合成。例如,可以使用标准的基于亚磷酰胺的固相合成方法来合成gRNA。或者,可以通过将编码gRNA的DNA可操作地连接至由噬菌体RNA聚合酶识别的启动子控制序列来体外合成gRNA。合适的噬菌体启动子序列的实例包括T7、T3、SP6启动子序列或其变体。在gRNA包含两个单独分子(例如,crRNA和tracrRNA)的实施方案中,crRNA可以化学合成并且tracrRNA可以酶促合成。
指导多核苷酸可以例如由编码gRNA的DNA(例如,包含编码gRNA的序列的DNA载体)表达。gRNA可以单独编码或与编码的碱基编辑器一起编码。可将此类DNA序列一起或单独引入到表达系统(例如,细胞)中。例如,可以将编码多核苷酸可编程核苷酸结合结构域和gRNA的DNA序列引入到细胞中,每个DNA序列可以是单独分子的一部分(例如,含有多核苷酸可编程核苷酸结合结构域编码序列的一个载体和含有gRNA编码序列的第二载体),或者两个DNA序列可以是相同分子的一部分(例如,含有多核苷酸可编程核苷酸结合结构域和gRNA的编码(和调控)序列的一个载体)。RNA可以从合成的DNA分子(例如,基因片段)转录。gRNA分子可以在体外转录。
gRNA或指导多核苷酸可以包含三个区域:位于5'端的第一区域,其可以与染色体序列中的靶位点互补、第二内部区域,其可以形成茎环结构、以及第三3'区域,其可以是单链的。每个gRNA的第一区域也可以不同,使得每个gRNA将融合蛋白指导至特定靶位点。此外,每个gRNA的第二和第三区域在所有gRNA中可以相同。
gRNA或指导多核苷酸的第一区域可以与染色体序列中的靶位点处的序列互补,使得gRNA的第一区域可以与靶位点碱基配对。在一些情况下,gRNA的第一区域可以包含或包含约10个核苷酸至25个核苷酸(即,10个核苷酸至25个核苷酸;或约10个核苷酸至约25个核苷酸;或10个核苷酸至约25个核苷酸;或约10个核苷酸至25个核苷酸)或更多。例如,gRNA的第一区域与染色体序列中的靶位点之间的碱基配对区域的长度可以是或可以是约10、11、12、13、14、15、16、17、18、19、20、22、23、24、25个或更多核苷酸。有时,gRNA的第一区域的长度可以是或可以是约19、20或21个核苷酸。
gRNA或指导多核苷酸还可以包含形成二级结构的第二区域。例如,由gRNA形成的二级结构可以包含茎(或发夹)和环。环和茎的长度可以变化。例如,环的长度范围可以是或可以是约3个至10个核苷酸,并且茎的长度范围可以是或可以是约6个至20个碱基对。茎可以包含具有1至10个或约10个核苷酸的一个或多个凸起。第二区域的总长度的范围可以是或可以是约16个至60个核苷酸。例如,环的长度可以是或可以是约4个核苷酸,并且茎可以是或可以是约12个碱基对。
gRNA或指导多核苷酸还可以在3'端包含第三区域,其可以基本上是单链的。例如,第三区域有时不与感兴趣的细胞中的任何染色体序列互补,并且有时不与gRNA的其余部分互补。此外,第三区域的长度可以变化。第三区域的长度可以多于或多于约4个核苷酸。例如,第三区域的长度范围可以是或可以是约5个至60个核苷酸。
gRNA或指导多核苷酸可以靶向基因靶标的任何外显子或内含子。在一些情况下,指导可以靶向基因的外显子1或2,在其他情况下,指导可以靶向基因的外显子3或4。在一些实施方案中,组合物包含全部靶向相同外显子的多个gRNA或靶向不同外显子的多个gRNA。可以靶向基因的外显子和/或内含子。
gRNA或指导多核苷酸可以靶向具有约20个核苷酸或少于约20个核苷酸(例如,至少约5、10、15、16、17、18、19、20、21、22、23、24、25、30个核苷酸)或约1-100个核苷酸之间的任何数量的核苷酸(例如,5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100)的核酸序列。靶核酸序列可以是紧邻PAM的第一个核苷酸的5'的20个碱基或约20个碱基。gRNA可以靶向核酸序列。靶核酸可以是至少或至少约1-10、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90或1-100个核苷酸。
用于选择、设计和验证指导多核苷酸(例如,gRNA和靶向序列)的方法在本文中描述并且是本领域技术人员已知的。例如,为了最大限度地减少核碱基编辑器系统中的脱氨酶结构域(例如,AID结构域)的潜在底物混杂的影响,可以最大限度地减少可能会无意中成为脱氨基靶标的残基(例如,可能存在于靶核酸基因座内的单链DNA上的脱靶C残基)的数量。此外,可以使用软件工具来优化对应于靶核酸序列的gRNA,例如以最大限度地减少基因组中总脱靶活性。例如,对于使用化脓性链球菌Cas9的每个可能的靶向结构域选择,可以在基因组中鉴定所有脱靶序列(在选定的PAM之前,例如在NAG或NGG之前),所述脱靶序列含有多达一定数量(例如,1、2、3、4、5、6、7、8、9或10个)的错配碱基对。可以鉴定与靶位点互补的gRNA的第一区域,并且可以根据总预测的脱靶分数对所有第一区域(例如,crRNA)进行排序;排名靠前的靶向结构域代表可能具有最大的在靶活性和最小的脱靶活性的那些。候选靶向gRNA可以通过使用本领域已知和/或如本文列出的方法进行功能评价。
作为非限制性实例,可以使用DNA序列搜索算法来鉴定与Cas9一起使用的gRNA的crRNA中的靶DNA杂交序列。基于如Bae S.,Park J.,&Kim J.-S.Cas-OFFinder:A fast andversatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases.Bioinformatics 30,1473-1475(2014)中所述的公开工具cas-OFFinder,使用自定义gRNA设计软件进行gRNA设计。这种软件在计算指导的全基因组脱靶倾向后对其进行评分。对于长度范围为17至24的指导,通常考虑完美匹配至7个错配范围内的匹配。一旦通过计算确定了脱靶位点,就计算每个指导的总分,并使用网络界面在表格输出中进行总结。除了鉴定与PAM序列相邻的潜在靶位点之外,软件还鉴定与所选靶位点相差1、2、3个或多于3个核苷酸的所有PAM相邻序列。可以获得靶核酸序列(例如,靶基因)的基因组DNA序列,并且可以使用公开可用的工具(例如,RepeatMasker程序)来筛选重复元件。RepeatMasker搜索输入DNA序列中的重复元件和低复杂性区域。输出是给定查询序列中存在的重复的详细注释。
鉴定后,基于gRNA(例如,crRNA)的第一区域到靶位点的距离、它们的正交性以及与相关PAM序列紧密匹配的5'核苷酸的存在(例如,5'G,其基于鉴定含有相关PAM的人类基因组中的紧密匹配,所述相关PAM例如化脓性链球菌的NGG PAM,金黄色葡萄球菌的NNGRRT或NNGRRV PAM),将gRNA的第一区域排序成不同的等级。如本文所用,正交性是指人类基因组中含有最少数量的与靶序列的错配的序列的数量。例如,“高水平的正交性”或“良好的正交性”可指代20-mer靶向结构域,其在人类基因组中除了预期靶标之外没有相同的序列,也没有在靶序列中含有一个或两个错配的任何序列。可以选择具有良好正交性的靶向结构域来最大限度地减少脱靶DNA切割。
gRNA然后可以作为RNA分子或非RNA核酸分子(例如,DNA分子)引入到细胞或胚胎中。在一个实施方案中,将编码gRNA的DNA可操作地连接至启动子控制序列,以在感兴趣的细胞或胚胎中表达所述gRNA。RNA编码序列可以可操作地连接至由RNA聚合酶III(Pol III)识别的启动子序列。可以用于表达gRNA的质粒载体包括但不限于px330载体和px333载体。在一些情况下,质粒载体(例如,px333载体)可以包含至少两个gRNA编码DNA序列。此外,载体可以包含额外的表达控制序列(例如,增强子序列、Kozak序列、聚腺苷酸化序列、转录终止序列等)、选择性标志物序列(例如,GFP或抗生素抗性基因,诸如嘌呤霉素(puromycin))、复制起点等。编码gRNA的DNA分子还可以是线性的。编码gRNA或指导多核苷酸的DNA分子还可以是环状的。
在一些实施方案中,报告系统用于检测碱基编辑活性和测试候选指导多核苷酸。在一些实施方案中,报告系统包含基于报告基因的测定,其中碱基编辑活性导致报告基因的表达。例如,报告系统可包括包含失活起始密码子的报告基因,例如模板链上从3'-TAC-5'至3'-CAC-5'的突变。靶标C成功脱氨后,对应的mRNA将被转录为5'-AUG-3'而不是5'-GUG-3',从而实现报告基因的翻译。合适的报告基因对应本领域技术人员将是显而易见的。报告基因的非限制性实例包括编码绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、萤光素酶、分泌型碱性磷酸酶(SEAP)的基因,或其表达可检测并且对于本领域技术人员显而易见的任何其他基因。报告系统可以用于测试许多不同的gRNA,例如,以便确定相对于靶DNA序列,相应的脱氨酶将靶向哪些残基。还可以测试靶向非模板链的sgRNA,以便评估特定碱基编辑蛋白(例如,Cas9脱氨酶融合蛋白)的脱靶效应。在一些实施方案中,可以设计此类gRNA,使得突变的起始密码子将不与gRNA碱基配对。指导多核苷酸可以包含标准核糖核苷酸、修饰的核糖核苷酸(例如,假尿苷)、核糖核苷酸异构体和/或核糖核苷酸类似物。在一些实施方案中,指导多核苷酸可以包含至少一种可检测标记。可检测标记可以是荧光团(例如,FAM、TMR、Cy3、Cy5、德克萨斯红、俄勒冈绿、Alexa Fluors、Halo标签或合适的荧光染料)、检测标签(例如,生物素、洋地黄毒苷等)、量子点或金颗粒。
在一些实施方案中,碱基编辑器系统可包含多个指导多核苷酸,例如gRNA。例如,gRNA可靶向包含在碱基编辑器系统中的一个或多个靶基因座(例如,至少1个gRNA、至少2个gRNA、至少5个gRNA、至少10个gRNA、至少20个gRNA、至少30个gRNA、至少50个gRNA)。多个gRNA序列可以串联排列并且优选被同向重复分开。
指导多核苷酸可以包含一种或多种修饰以提供具有新的或增强的特征的核酸。指导多核苷酸可以包含核酸亲和标签。指导多核苷酸可以包含合成核苷酸、合成核苷酸类似物、核苷酸衍生物和/或修饰的核苷酸。
在一些情况下,gRNA或指导多核苷酸可以包含修饰。可以在gRNA或指导多核苷酸的任何位置处进行修饰。可以对单一gRNA或指导多核苷酸进行多于一种修饰。gRNA或指导多核苷酸可以在修饰后进行质量控制。在一些情况下,质量控制可以包括PAGE、HPLC、MS或其任何组合。
gRNA或指导多核苷酸的修饰可以是取代、插入、缺失、化学修饰、物理修饰、稳定化、纯化或其任何组合。
gRNA或指导多核苷酸也可以通过以下进行修饰:5'腺苷酸、5’鸟苷-三磷酸帽、5'N7-甲基鸟苷-三磷酸帽、5'三磷酸帽、3'磷酸、3'硫代磷酸、5'磷酸、5'硫代磷酸、Cis-Syn胸苷二聚体、三聚体、C12间隔子、C3间隔子、C6间隔子、d间隔子、PC间隔子、r间隔子、间隔子18、间隔子9、3'-3'修饰、5'-5'修饰、脱碱基、吖啶、偶氮苯、生物素、生物素BB、生物素TEG、胆甾醇基TEG(cholesteryl TEG)、脱硫生物素TEG、DNP TEG、DNP-X、DOTA、dT-生物素、双重生物素、PC生物素、补骨脂素C2、补骨脂素C6、TINA、3'DABCYL、黑洞淬灭剂1、黑洞淬灭剂2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、羧基接头、硫醇接头、2’-脱氧核糖核苷类似物嘌呤、2’-脱氧核糖核苷类似物嘧啶、核糖核苷类似物、2’-O-甲基核糖核苷类似物、糖修饰类似物、摆动/通用碱基、荧光染料标记、2’-氟RNA、2’-O-甲基RNA、甲基膦酸酯、磷酸二酯DNA、磷酸二酯RNA、硫代磷酸酯DNA、硫代磷酸酯RNA、UNA、假尿苷-5'-三磷酸、5'-甲基胞苷-5'-三磷酸或其任何组合。
在一些情况下,修饰是永久性的。在其他情况下,修饰是短暂的。在一些情况下,对gRNA或指导多核苷酸进行多种修饰。gRNA或指导多核苷酸修饰可以改变核苷酸的物理化学性质,诸如它们的构象、极性、疏水性、化学反应性、碱基配对相互作用或其任何组合。
通过用分离的gRNA或用包含编码指导RNA和启动子的序列的质粒DNA转染细胞,可以将指导多核苷酸转移至细胞中。也可以以其他方式将gRNA或指导多核苷酸转移至细胞中,诸如使用病毒介导的基因递送。可以分离gRNA或指导多核苷酸。例如,gRNA可以以分离的RNA的形式转染到细胞或生物体中。可以使用本领域已知的任何体外转录系统通过体外转录来制备gRNA。可以将gRNA以分离的RNA形式而不是以包含gRNA编码序列的质粒形式转移至细胞中。
修饰也可以是硫代磷酸酯替代物。在一些情况下,天然磷酸二酯键可以容易被细胞核酸酶快速降解,并且;使用硫代磷酸酯(PS)键替代物对核苷酸间键联的修饰对于通过细胞降解的水解可以更稳定。修饰可以增加gRNA或指导多核苷酸的稳定性。修饰还可以增强生物活性。在一些情况下,硫代磷酸酯增强的RNA gRNA可以抑制核糖核酸酶A、核糖核酸酶T1、小牛血清核酸酶或其任何组合。这些性质可以允许PS-RNA gRNA用于体内或体外暴露于核酸酶的可能性较高的应用。例如,可以在gRNA的5'或3'端处的最后3-5个核苷酸之间引入硫代磷酸酯(PS)键,其可以抑制核酸外切酶降解。在一些情况下,可以在整个gRNA中添加硫代磷酸酯键以减少核酸内切酶的攻击。
在一些实施方案中,指导RNA被设计成破坏剪接位点(即,剪接受体(SA)或剪接供体(SD)。在一些实施方案中,指导RNA被设计成使得碱基编辑导致提前终止密码子。
原间隔序列临近基序
术语“原间隔序列临近基序(PAM)”或PAM样基序是指紧跟CRISPR细菌适应性免疫系统中的Cas9核酸酶靶向的DNA序列之后的2-6个碱基对的DNA序列。在一些实施方案中,PAM可以是5'PAM(即,位于原间隔序列的5'端的上游)。在其他实施方案中,PAM可以是3'PAM(即,位于原间隔序列的5'端的下游)。PAM序列对于靶标结合至关重要,但确切的序列取决于Cas蛋白的类型。PAM序列可以是本领域已知的任何PAM序列。合适的PAM序列包括但不限于NGG、NGA、NGC、NGN、NGT、NGTT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW或NAAAAC。Y是嘧啶;N是任何核苷酸碱基;W是A或T。
本文提供的碱基编辑器可以包含CRISPR蛋白衍生结构域,其能够结合含有规范或非规范原间隔序列临近基序(PAM)序列的核苷酸序列。PAM位点是靠近靶多核苷酸序列的核苷酸序列。本公开的一些方面提供了碱基编辑器,其包含具有不同PAM特异性的全部或部分CRISPR蛋白。
例如,Cas9蛋白,诸如来自化脓性链球菌的Cas9(spCas9),通常需要规范的NGGPAM序列来结合特定的核酸区域,其中“NGG”中的“N”是腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C),并且G是鸟嘌呤。PAM可以是CRISPR蛋白质特异性的,并且在包含不同CRISPR蛋白衍生结构域的不同碱基编辑器之间可以不同。PAM可以是靶序列的5'或3'。PAM可以位于靶序列的上游或下游。PAM的长度可以是1、2、3、4、5、6、7、8、9、10个或更多个核苷酸。通常,PAM的长度在2-6个核苷酸之间。
在一些实施方案中,PAM是“NRN”PAM,其中“NRN”中的“N”是腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C),并且R是腺嘌呤(A)或鸟嘌呤(G);或者PAM是“NYN”PAM,其中NYN中的“N”是腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C),并且Y是胞苷(C)或胸腺嘧啶(T),例如,如R.T.Walton等人,2020,Science,10.1126/science.aba8853(2020)中所述,其全部内容通过引用并入本文。
下表7中描述了若干种PAM变体。
表7.Cas9蛋白和对应的PAM序列
变体 PAM
spCas9 NGG
spCas9-VRQR NGA
spCas9-VRER NGCG
xCas9(sp) NGN
saCas9 NNGRRT
saCas9-KKH NNNRRT
spCas9-MQKSER NGCG
spCas9-MQKSER NGCN
spCas9-LRKIQK NGTN
spCas9-LRVSQK NGTN
spCas9-LRVSQL NGTN
spCas9-MQKFRAER NGC
Cpf1 5'(TTTV)
SpyMac 5'-NAA-3'
在一些实施方案中,PAM是NGC。在一些实施方案中,NGC PAM被Cas9变体识别。在一些实施方案中,NGC PAM变体包括选自D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E和T1337R(统称为“MQKFRAER”)的一个或多个氨基酸取代。
在一些实施方案中,PAM是NGT。在一些实施方案中,NGT PAM被Cas9变体识别。在一些实施方案中,NGT PAM变体通过在一个或多个残基1335、1337、1135、1136、1218和/或1219处的靶向突变生成。在一些实施方案中,NGT PAM变体通过在一个或多个残基1219、1335、1337、1218处的靶向突变产生。在一些实施方案中,NGT PAM变体通过在一个或多个残基1135、1136、1218、1219和1335处的靶向突变产生。在一些实施方案中,NGT PAM变体选自下表8A和表8B中提供的靶向突变组。
表8A:残基1219、1335、1337、1218处的NGT PAM变体突变
变体 E1219V R1335Q T1337 G1218
1 F V T
2 F V R
3 F V Q
4 F V L
5 F V T R
6 F V R R
7 F V Q R
8 F V L R
9 L L T
10 L L R
11 L L Q
12 L L L
13 F I T
14 F I R
15 F I Q
16 F I L
17 F G C
18 H L N
19 F G C A
20 H L N V
21 L A W
22 L A F
23 L A Y
24 I A W
25 I A F
26 I A Y
表8B:残基1135、1136、1218、1219和1335处的NGT PAM变体突变
变体 D1135L S1136R G1218S E1219V R1335Q
27 G
28 V
29 I
30 A
31 W
32 H
33 K
34 K
35 R
36 Q
37 T
38 N
39 I
40 A
41 N
42 Q
43 G
44 L
45 S
46 T
47 L
48 I
49 V
50 N
51 S
52 T
53 F
54 Y
55 N1286Q I1331F
在一些实施方案中,NGT PAM变体选自表8A和表8B中的变体5、7、28、31或36。在一些实施方案中,变体具有改善的NGT PAM识别。
在一些实施方案中,NGT PAM变体在残基1219、1335、1337和/或1218处具有突变。在一些实施方案中,选择具有突变的NGT PAM变体以改善对下表9中提供的变体的识别。
表9:残基1219、1335、1337和1218处的NGT PAM变体突变
变体 E1219V R1335Q T1337 G1218
1 F V T
2 F V R
3 F V Q
4 F V L
5 F V T R
6 F V R R
7 F V Q R
8 F V L R
在一些实施方案中,NGT PAM选自下表10中提供的变体。
表10.NGT PAM变体
在一些实施方案中,NGTN变体是变体1。在一些实施方案中,NGTN变体是变体2。在一些实施方案中,NGTN变体是变体3。在一些实施方案中,NGTN变体是变体4。在一些实施方案中,NGTN变体是变体5。在一些实施方案中,NGTN变体是变体6。
在一些实施方案中,Cas9结构域是来自化脓性链球菌的Cas9结构域(SpCas9)。在一些实施方案中,SpCas9结构域是核酸酶活性SpCas9、无核酸酶活性的SpCas9(SpCas9d)或SpCas9切口酶(SpCas9n)。在一些实施方案中,SpCas9包含D9X突变,或本文提供的任何氨基酸序列中的对应突变,其中X是除D之外的任何氨基酸。在一些实施方案中,SpCas9包含D9A突变,或本文提供的任何氨基酸序列中的对应突变。在一些实施方案中,SpCas9结构域、SpCas9d结构域、或SpCas9n结构域可以结合具有非规范PAM的核酸序列。在一些实施方案中,SpCas9结构域、SpCas9d结构域、或SpCas9n结构域可以结合具有NGG、NGA或NGCG PAM序列的核酸序列。
在一些实施方案中,SpCas9结构域包含D1135X、R1335X和T1337X突变中的一个或多个,或本文提供的任何氨基酸序列中的对应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含D1135E、R1335Q和T1337R突变中的一个或多个,或本文提供的任何氨基酸序列中的对应突变。在一些实施方案中,SpCas9结构域包含D1135E、R1335Q和T1337R突变,或本文提供的任何氨基酸序列中的对应突变。在一些实施方案中,SpCas9结构域包含D1135X、R1335X和T1337X突变中的一个或多个,或本文提供的任何氨基酸序列中的对应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含D1135V、R1335Q和T1337R突变中的一个或多个,或本文提供的任何氨基酸序列中的对应突变。在一些实施方案中,SpCas9结构域包含D1135V、R1335Q和T1337R突变,或本文提供的任何氨基酸序列中的对应突变。在一些实施方案中,SpCas9结构域包含D1135X、G1218X、R1335X和T1337X突变中的一个或多个,或本文提供的任何氨基酸序列中的对应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含D1135V、G1218R、R1335Q和T1337R突变中的一个或多个,或本文提供的任何氨基酸序列中的对应突变。在一些实施方案中,SpCas9结构域包含D1135V、G1218R、R1335Q和T1337R突变,或本文提供的任何氨基酸序列中的对应突变。
在一些实例中,由本文公开的碱基编辑器的CRISPR蛋白衍生结构域识别的PAM可以在相对于编码碱基编辑器的插入物(例如,AAV插入物)单独的寡核苷酸上提供给细胞。在此类实施方案中,在单独的寡核苷酸上提供PAM可以允许切割原本不能被切割的靶序列,因为在与靶序列相同的多核苷酸上不存在相邻的PAM。
在一个实施方案中,化脓性链球菌Cas9(SpCas9)可以用作基因组工程改造的CRISPR核酸内切酶。然而,可以使用其他的。在一些实施方案中,可以使用不同的核酸内切酶来靶向某些基因组靶标。在一些实施方案中,可以使用具有非NGG PAM序列的合成SpCas9衍生变体。此外,已经鉴定了来自不同物种的其他Cas9直系同源物,并且这些“非SpCas9”可以结合也可以用于本公开的多种PAM序列。例如,相对较大的SpCas9(大约4kb编码序列)可以导致携带SpCas9cDNA的质粒不能在细胞中有效表达。相反,金黄色葡萄球菌Cas9(SaCas9)的编码序列比SpCas9短大约1000个碱基,可能允许其在细胞中有效表达。与SpCas9类似,SaCas9核酸内切酶能够在体外和小鼠体内修饰哺乳动物细胞中的靶基因。在一些实施方案中,Cas蛋白可以靶向不同的PAM序列。在一些实施方案中,例如,靶基因可以与Cas9PAM,5'-NGG相邻。在其他实施方案中,其他Cas9直系同源物可以具有不同的PAM要求。例如,其他PAM,诸如嗜热链球菌(CRISPR1的5'-NNAGAA和CRISPR3的5'-NGGNG)和脑膜炎奈瑟菌(5'-NNNNGATT)的那些,也可以与靶基因相邻。
在一些实施方案中,对于化脓性链球菌系统,靶基因序列可以在5'-NGG PAM之前(即,位于其5'),并且20-nt指导RNA序列可以与相反链碱基配对以介导与PAM相邻的Cas9切割。在一些实施方案中,相邻切割可以是PAM上游的3个碱基对或约3个碱基对。在一些实施方案中,相邻切割可以是PAM上游的10个碱基对或约10个碱基对。在一些实施方案中,相邻切割可以是PAM上游的0-20个碱基对或约0-20个碱基对。例如,相邻切割可以紧邻PAM上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个碱基对。相邻切割也可以位于PAM下游1至30个碱基对。能够结合PAM序列的示例性SpCas9蛋白的序列如下:
在一些实施方案中,工程化SpCas9变体能够识别侧接有3'H(非G PAM)的原间隔序列临近基序(PAM)序列(参见表3A-表3D)。在一些实施方案中,SpCas9变体识别NRNH PAM(其中R是A或G,并且H是A、C或T)。在一些实施方案中,非G PAM是NRRH、NRTH或NRCH(参见例如,Miller,S.M.,等人Continuous evolution of SpCas9variants compatible with non-GPAMs,Nat.Biotechnol.(2020),其内容通过引用整体并入本文)。
在一些实施方案中,Cas9结构域是重组Cas9结构域。在一些实施方案中,重组Cas9结构域是SpyMacCas9结构域。在一些实施方案中,SpyMacCas9结构域是核酸酶活性SpyMacCas9、无核酸酶活性的SpyMacCas9(SpyMacCas9d)或SpyMacCas9切口酶(SpyMacCas9n)。在一些实施方案中,SaCas9结构域、SaCas9d结构域、或SaCas9n结构域可以结合具有非规范PAM的核酸序列。在一些实施方案中,SpyMacCas9结构域、SpCas9d结构域、或SpCas9n结构域可以结合具有NAA PAM序列的核酸序列。
具有天然5'-NAAN-3'PAM特异性的猕猴链球菌(Streptococcus macacae)中的SpyCas9的示例性Cas9A同系物的序列是本领域已知的,并且例如由Chatterjee,等人,“ACas9with PAM recognition for adenine dinucleotides”,Nature Communications,第11卷,文章编号2474(2020)描述,并且在序列表中是SEQ ID NO:237。
在一些实施方案中,变体Cas9蛋白具有H840A、P475A、W476A、N477A、D1125A、W1126A和D1218A突变,使得多肽具有降低的切割靶DNA或RNA的能力。这样的Cas9蛋白具有降低的切割靶DNA(例如,单链靶DNA)的能力,但保留结合靶DNA(例如,单链靶DNA)的能力。作为另一个非限制性实例,在一些实施方案中,变体Cas9蛋白具有D10A、H840A、P475A、W476A、N477A、D1125A、W1126A和D1218A突变,使得多肽具有降低的切割靶DNA的能力。这样的Cas9蛋白具有降低的切割靶DNA(例如,单链靶DNA)的能力,但保留结合靶DNA(例如,单链靶DNA)的能力。在一些实施方案中,当变体Cas9蛋白具有W476A和W1126A突变或当变体Cas9蛋白具有P475A、W476A、N477A、D1125A、W1126A和D1218A突变时,变体Cas9蛋白不高效地结合PAM序列。因此,在一些此类情况下,当在结合方法中使用这种变体Cas9蛋白时,所述方法不需要PAM序列。换句话说,在一些实施方案中,当在结合方法中使用这种变体Cas9蛋白时,所述方法可以包括指导RNA,但是所述方法可以在不存在PAM序列的情况下执行(并且结合的特异性因此由指导RNA的靶向区段提供)。可以使其他残基突变以实现以上作用(即,使一个或另一个核酸酶部分失活)。作为非限制性实例,残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987可以被改变(即,被取代)。此外,除了丙氨酸取代以外的突变是合适的。
在一些实施方案中,碱基编辑器的CRISPR蛋白衍生结构域可以包含具有规范PAM序列(NGG)的Cas9蛋白的全部或部分。在其他实施方案中,碱基编辑器的Cas9衍生结构域可以采用非规范PAM序列。此类序列已经在本领域中进行描述,并且对于技术人员将是显而易见的。例如,结合非规范PAM序列的Cas9结构域已经在Kleinsti ver,B.P.,等人,“Engineered CRISPR-Cas9nucleases with altered PAM specificities”Nature 523,481-485(2015);和Kleinstiver,B.P.,等人,“Broadening the targeting range ofStaphylococcus aureus CRISPR-Cas9by modifying PAM recognition”NatureBiotechnolog y 33,1293-1298(2015);R.T.Walton等人“Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9variants”Scienc e 10.1126/science.aba8853(2020);Hu等人“Evolved Cas9variants w ith broad PAMcompatibility and high DNA specificity,”Nature,2018年4月5日,556(7699),57-63;Miller等人,“Continuous evolutio n of SpCas9variants compatible with non-GPAMs”Nat.Biotechno l.,2020年4月;38(4):471-481中描述;每篇文献的全部内容特此通过引用并入。
包含NapDNAbp和胞苷脱氨酶和/或腺苷脱氨酶的融合蛋白
本公开的一些方面提供了融合蛋白,其包含Cas9结构域或其他核酸可编程DNA结合蛋白(例如,Cas12)以及一个或多个胞苷脱氨酶或腺苷脱氨酶结构域。应当理解,Cas9结构域可以是本文提供的任何Cas9结构域或Cas9蛋白(例如,dCas9或nCas9)。在一些实施方案中,本文提供的任何Cas9结构域或Cas9蛋白(例如,dCas9或nCas9)可以与本文提供的任何胞苷脱氨酶和/或腺苷脱氨酶融合。本文公开的碱基编辑器的结构域可以按任何顺序排列。
在一些实施方案中,融合蛋白包含以下结构域A-C、A-D或A-E:
NH2-[A-B-C]-COOH;
NH2-[A-B-C-D]-COOH;或
NH2-[A-B-C-D-E]-COOH;
其中A和C或A、C和E各自包含以下中的一种或多种:
腺苷脱氨酶结构域或其活性片段,
胞苷脱氨酶结构域或其活性片段,并且
其中B或B和D各自包含一个或多个具有核酸序列特异性结合活性的结构域。
在一些实施方案中,融合蛋白包含以下结构:
NH2-[An-Bo-Cn]-COOH;
NH2-[An-Bo-Cn-Do]-COOH;或
NH2-[An-Bo-Cp-Do-Eq]-COOH;
其中A和C或A、C和E各自包含以下中的一种或多种:
腺苷脱氨酶结构域或其活性片段,
胞苷脱氨酶结构域或其活性片段,并且
其中n为整数:1、2、3、4或5,其中p为整数:0、1、2、3、4或5;其中q为整数0、1、2、3、4或5;并且其中B或B和D各自包含具有核酸序列特异性结合活性的结构域;并且其中o是整数:1、2、3、4或5。
例如但不限于,在一些实施方案中,融合蛋白包含以下结构:
NH2-[腺苷脱氨酶]-[Cas9结构域]-COOH;
NH2-[Cas9结构域]-[腺苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[Cas9结构域]-COOH;
NH2-[Cas9结构域]-[胞苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[Cas9结构域]-[腺苷脱氨酶]-COOH;
NH2-[腺苷脱氨酶]-[Cas9结构域]-[胞苷脱氨酶]-COOH;
NH2-[腺苷脱氨酶]-[胞苷脱氨酶]-[Cas9结构域]-COOH;
NH2-[胞苷脱氨酶]-[腺苷脱氨酶]-[Cas9结构域]-COOH;
NH2-[Cas9结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-COOH;或
NH2-[Cas9结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-COOH。
在一些实施方案中,本文提供的任何Cas12结构域或Cas12蛋白可以与本文提供的任何胞苷或腺苷脱氨酶融合。例如但不限于,在一些实施方案中,融合蛋白包含以下结构:
NH2-[腺苷脱氨酶]-[Cas12结构域]-COOH;
NH2-[Cas12结构域]-[腺苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[Cas12结构域]-COOH;
NH2-[Cas12结构域]-[胞苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[Cas12结构域]-[腺苷脱氨酶]-COOH;
NH2-[腺苷脱氨酶]-[Cas12结构域]-[胞苷脱氨酶]-COOH;
NH2-[腺苷脱氨酶]-[胞苷脱氨酶]-[Cas12结构域]-COOH;
NH2-[胞苷脱氨酶]-[腺苷脱氨酶]-[Cas12结构域]-COOH;
NH2-[Cas12结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-COOH;或
NH2-[Cas12结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-COOH。
在一些实施方案中,腺苷脱氨酶是TadA*8。示例性融合蛋白结构包括以下:
NH2-[TadA*8]-[Cas9结构域]-COOH;
NH2-[Cas9结构域]-[TadA*8]-COOH;
NH2-[TadA*8]-[Cas12结构域]-COOH;或
NH2-[Cas12结构域]-[TadA*8]-COOH。
在一些实施方案中,融合蛋白的腺苷脱氨酶包含TadA*8和胞苷脱氨酶和/或腺苷脱氨酶。在一些实施方案中,TadA*8是TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23或TadA*8.24。
示例性融合蛋白结构包括以下:
NH2-[TadA*8]-[Cas9/Cas12]-[腺苷脱氨酶]-COOH;
NH2-[腺苷脱氨酶]-[Cas9/Cas12]-[TadA*8]-COOH;
NH2-[TadA*8]-[Cas9/Cas12]-[胞苷脱氨酶]-COOH;或
NH2-[胞苷脱氨酶]-[Cas9/Cas12]-[TadA*8]-COOH。
在一些实施方案中,融合蛋白的腺苷脱氨酶包含TadA*9和胞苷脱氨酶和/或腺苷脱氨酶。示例性融合蛋白结构包括以下:
NH2-[TadA*9]-[Cas9/Cas12]-[腺苷脱氨酶]-COOH;
NH2-[腺苷脱氨酶]-[Cas9/Cas12]-[TadA*9]-COOH;
NH2-[TadA*9]-[Cas9/Cas12]-[胞苷脱氨酶]-COOH;或
NH2-[胞苷脱氨酶]-[Cas9/Cas12]-[TadA*9]-COOH。
在一些实施方案中,融合蛋白可以包含侧接有Cas9或Cas12多肽的N末端片段和C末端片段的脱氨酶。在一些实施方案中,融合蛋白包含侧接有Cas9或Cas12多肽的N末端片段和C末端片段的胞苷脱氨酶。在一些实施方案中,融合蛋白包含侧接有Cas9或Cas12多肽的N末端片段和C末端片段的腺苷脱氨酶。
在一些实施方案中,包含胞苷脱氨酶或腺苷脱氨酶和napDNAbp(例如,Cas9或Cas12结构域)的融合蛋白不包括接头序列。在一些实施方案中,接头存在于胞苷或腺苷脱氨酶与napDNAbp之间。在一些实施方案中,以上通用结构中使用的“-”指示任选的接头的存在。在一些实施方案中,胞苷或腺苷脱氨酶和napDNAbp经由本文提供的任何接头融合。例如,在一些实施方案中,胞苷或腺苷脱氨酶和napDNAbp经由本文提供的任何接头融合。
应当理解,本公开的融合蛋白可以包含一个或多个额外特征。例如,在一些实施方案中,融合蛋白可包含抑制剂、细胞质定位序列、输出序列,诸如核输出序列、或其他定位序列,以及可用于融合蛋白的增溶、纯化或检测的序列标签。本文提供的合适的蛋白质标签包括但不限于生物素羧化酶载体蛋白(BCCP)标签、myc标签、钙调蛋白标签、FLAG标签、血凝素(HA)标签、多组氨酸标签(也称为组氨酸标签或His标签)、麦芽糖结合蛋白(MBP)标签、nus标签、谷胱甘肽-S-转移酶(GST)标签、绿色荧光蛋白(GFP)标签、硫氧还蛋白标签、S标签、Softag(例如,Softag 1、Softag 3)、链球菌标签、生物素连接酶标签、FlAsH标签、V5标签和SBP标签。其他合适的序列对于本领域技术人员将是显而易见的。在一些实施方案中,融合蛋白包含一个或多个His标签。
示例性但非限制性的融合蛋白在国际PCT申请号PCT/2017/044935、PCT/US2019/044935和PCT/US2020/016288中描述,所述申请各自通过引用整体并入本文。
包含核定位序列(NLS)的融合蛋白
在一些实施方案中,本文提供的融合蛋白还包含一个或多个(例如,2、3、4、5个)核靶向序列,例如核定位序列(NLS)。在一个实施方案中,使用二分NLS。在一些实施方案中,NLS包含促进包含NL S的蛋白质输入到细胞核中(例如,通过核转运)的氨基酸序列。在一些实施方案中,NLS融合至融合蛋白的N末端或C末端。在一些实施方案中,NLS融合至nCas9结构域或dCas9结构域的C末端或N末端。在一些实施方案中,NLS融合至Cas12结构域的N末端或C末端。在一些实施方案中,NLS融合至胞苷或腺苷脱氨酶的N末端或C末端。在一些实施方案中,NLS经由一个或多个接头融合至融合蛋白。在一些实施方案中,NLS在没有接头的情况下融合至融合蛋白。在一些实施方案中,NLS包含本文提供或提及的NLS序列中的任一个的氨基酸序列。额外的核定位序列是本领域已知的,并且对于技术人员将是显而易见的。例如,NLS序列在Plank等人,PCT/EP2000/011690中描述,所述文献的内容关于其示例性核定位序列的公开内容通过引用并入本文。在一些实施方案中,NLS包含氨基酸序列PKKKRKVEGADKRTADGSEFESPKKKRKV(SEQ ID NO:328)、K RTADGSEFESPKKKRKV(SEQ ID NO:190)、KRPAATKKAGQA KKKK(SEQ ID NO:191、KKTELQTTNAENKTKKL(SEQ ID N O:192)、KRGINDRNFWRGENGRKTR(SEQ ID NO:193)、RKSG KIAAIVVKRPRKPKKKRKV(SEQ ID NO:329)或MDSLLMNRRK FLYQFKNVRWAKGRRETYLC(SEQ ID NO:196)。
在一些实施方案中,包含胞苷或腺苷脱氨酶、Cas9结构域和NLS的融合蛋白不包含接头序列。在一些实施方案中,存在结构域或蛋白质(例如,胞苷或腺苷脱氨酶、Cas9结构域或NLS)中的一个或多个之间的接头序列。在一些实施方案中,接头存在于胞苷脱氨酶和腺苷脱氨酶结构域和napDNAbp之间。在一些实施方案中,以下通用结构中使用的“-”指示任选的接头的存在。在一些实施方案中,胞苷脱氨酶和腺苷脱氨酶和napDNAbp经由本文提供的任何接头融合。例如,在一些实施方案中,胞苷脱氨酶和腺苷脱氨酶和napDNAbp经由本文提供的任何接头融合。
在一些实施方案中,具有胞苷或腺苷脱氨酶和napDNAbp(例如,Cas9或Cas12)结构域的示例性napDNAbp(例如,Cas9或Cas12)融合蛋白的通用结构包含以下结构中的任一种,其中NLS是核定位序列(例如,本文提供的任何NLS),NH2是融合蛋白的N末端,并且COOH是融合蛋白的C末端:
NH2-NLS-[胞苷脱氨酶]-[napDNAbp结构域]-COOH;
NH2-NLS[napDNAbp结构域]-[胞苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[napDNAbp结构域]-NLS-COOH;
NH2-[napDNAbp结构域]-[胞苷脱氨酶]-NLS-COOH;
NH2-NLS-[腺苷脱氨酶]-[napDNAbp结构域]-COOH;
NH2-NLS[napDNAbp结构域]-[腺苷脱氨酶]-COOH;
NH2-[腺苷脱氨酶]-[napDNAbp结构域]-NLS-COOH;
NH2-[napDNAbp结构域]-[腺苷脱氨酶]-NLS-COOH;
NH2-NLS-[胞苷脱氨酶]-[napDNAbp结构域]-[腺苷脱氨酶]-COOH;
NH2-NLS-[腺苷脱氨酶]-[napDNAbp结构域]-[胞苷脱氨酶]-COOH;
NH2-NLS-[腺苷脱氨酶][胞苷脱氨酶]-[napDNAbp结构域]-COOH;
NH2-NLS-[胞苷脱氨酶]-[腺苷脱氨酶]-[napDNAbp结构域]-COOH;
NH2-NLS-[napDNAbp结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-COOH;
NH2-NLS-[napDNAbp结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[napDNAbp结构域]-[腺苷脱氨酶]-NLS-COOH;
NH2-[腺苷脱氨酶]-[napDNAbp结构域]-[胞苷脱氨酶]-NLS-COOH;
NH2-[腺苷脱氨酶][胞苷脱氨酶]-[napDNAbp结构域]-NLS-COOH;
NH2-[胞苷脱氨酶]-[腺苷脱氨酶]-[napDNAbp结构域]-NLS-COOH;
NH2-[napDNAbp结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-NLS-COOH;或
NH2-[napDNAbp结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-NLS-COOH。在一些实施方案中,NLS存在于接头中,或者NLS侧接有接头,例如本文所述的接头。二分NLS包含两个碱性氨基酸簇,它们被相对较短的间隔序列分开(因此二分成2个部分,而单份NLS则不是)。核质蛋白的NLS,即KR[PAATKKAGQA]KKKK(SEQ ID NO:191),是普遍的二分信号的原型:两个碱性氨基酸簇,被约10个氨基酸的间隔子分开。示例性二分NLS的序列如下:
PKKKRKVEGADKRTADGSEFESPKKKRKV(SEQ ID NO:328)
可以使用编码包含一个或多个核定位序列(NLS)的CRISPR酶的载体。例如,可以使用或使用约1、2、3、4、5、6、7、8、9、10个NLS。CRISPR酶可以包含氨基末端处或附近的NLS、羧基末端处或附近的约或多于约1、2、3、4、5、6、7、8、9、10个NLS,或其任何组合(例如,氨基末端处的一个或多个NLS和羧基末端处的一个或多个NLS)。当存在多于一个NLS时,每个NLS可以独立于其他NLS选择,使得单个NLS可以存在于多于一个拷贝中和/或与一个或多个其他NLS组合存在于一个或多个拷贝中。
方法中使用的CRISPR酶可包含约6个NLS。当距离NLS最近的氨基酸在沿着多肽链从N末端至C末端的约50个氨基酸内(例如,在1、2、3、4、5、10、15、20、25、30、40或50个氨基酸内)时,NLS被认为在N末端或C末端附近。
额外结构域
本文所述的碱基编辑器可以包括有助于促进多核苷酸的核碱基编辑、修饰或改变的任何结构域。在一些实施方案中,碱基编辑器包含多核苷酸可编程核苷酸结合结构域(例如,Cas9)、核碱基编辑结构域(例如,脱氨酶结构域)和一个或多个额外结构域。在一些实施方案中,额外结构域可以促进碱基编辑器的酶促或催化功能、碱基编辑器的结合功能,或者可以是可以干扰期望碱基编辑结果的细胞机制的抑制剂(例如,酶)。在一些实施方案中,碱基编辑器可以包含核酸酶、切口酶、重组酶、脱氨酶、甲基转移酶、甲基化酶、乙酰化酶、乙酰转移酶、转录激活因子或转录抑制因子结构域。
在一些实施方案中,碱基编辑器可以包含尿嘧啶糖基化酶抑制剂(UGI)结构域。在一些实施方案中,细胞DNA修复对U:G异源双链体DNA的存在有反应可能是细胞中核碱基编辑效率降低的原因。在此类实施方案中,尿嘧啶DNA糖基化酶(UDG)可以催化从细胞中的DNA去除U,这可以启动碱基切除修复(BER),主要导致U:G对逆转为C:G对。在此类实施方案中,BER可以在包含一个或多个结构域的碱基编辑器中被抑制,所述结构域与单链结合、阻断编辑的碱基、抑制UGI、抑制BER、保护编辑的碱基且/或促进未编辑的链的修复。因此,本公开考虑了包含UGI结构域的碱基编辑器融合蛋白。
在一些实施方案中,碱基编辑器包含双链断裂(DSB)结合蛋白的全部或部分作为结构域。例如,DSB结合蛋白可以包括噬菌体Mu的Gam蛋白,其可以结合DSB的末端并且可以保护它们免于降解。参见Komor,A.C.,等人,“Improved base excision repairinhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editorswith higher efficiency and product purity”Science Advances 3:eaao4774(2017),其全部内容特此通过引用并入。
此外,在一些实施方案中,Gam蛋白可以融合至碱基编辑器的N末端。在一些实施方案中,Gam蛋白可以融合至碱基编辑器的C末端。噬菌体Mu的Gam蛋白可以结合双链断裂(DSB)的末端并保护它们免于降解。在一些实施方案中,使用Gam结合DSB的游离端可以减少碱基编辑过程期间的插入缺失形成。在一些实施方案中,174个残基的Gam蛋白融合至碱基编辑器的N末端。参见Komor,A.C.,等人,“Improved base excision repair inhibitionand bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higherefficiency and product purity”Science Advances 3:eaao4774(2017)。在一些实施方案中,相对于野生型结构域,一个或多个突变可以改变碱基编辑器结构域的长度。例如,至少一个结构域中的至少一个氨基酸的缺失可以减少碱基编辑器的长度。在另一种情况下,相对于野生型结构域,一个或多个突变不改变结构域的长度。例如,任何结构域中的取代都不改变碱基编辑器的长度。
此类碱基编辑器的非限制性实例(其中所有结构域的长度与野生型结构域相同)可以包括:
NH2-[核碱基编辑结构域]-接头1-[APOBEC1]-接头2-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-接头1-[APOBEC1]-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-[APOBEC1]-接头2-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-[APOBEC1]-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-接头1-[APOBEC1]-接头2-[核碱基编辑结构域]-[UGI]-COOH;
NH2-[核碱基编辑结构域]-接头1-[APOBEC1]-[核碱基编辑结构域]-[UGI]-COOH;
NH2-[核碱基编辑结构域]-[APOBEC1]-接头2-[核碱基编辑结构域]-[UGI]-COOH;
NH2-[核碱基编辑结构域]-[APOBEC1]-[核碱基编辑结构域]-[UGI]-COOH;
NH2-[UGI]-[核碱基编辑结构域]-接头1-[APOBEC1]-接头2-[核碱基编辑结构域]-COOH;
NH2-[UGI]-[核碱基编辑结构域]-接头1-[APOBEC1]-[核碱基编辑结构域]-COOH;
NH2-[UGI]-[核碱基编辑结构域]-[APOBEC1]-接头2-[核碱基编辑结构域]-COOH;或
NH2-[UGI]-[核碱基编辑结构域]-[APOBEC1]-[核碱基编辑结构域]-COOH。
碱基编辑器系统
本文提供了用于使用碱基编辑器系统来编辑核碱基的系统、组合物和方法。在一些实施方案中,碱基编辑器系统包括(1)碱基编辑器(BE),其包含多核苷酸可编程核苷酸结合结构域和用于编辑核碱基的核碱基编辑结构域(例如,脱氨酶结构域);和(2)与多核苷酸可编程核苷酸结合结构域结合的指导多核苷酸(例如,指导RNA)。在一些实施方案中,碱基编辑器系统是胞苷碱基编辑器(CBE)或腺苷碱基编辑器(ABE)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程DNA或RNA结合结构域。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶结构域可以是胞苷脱氨酶或胞嘧啶脱氨酶。在一些实施方案中,脱氨酶结构域可以是腺嘌呤脱氨酶或腺苷脱氨酶。在一些实施方案中,腺苷碱基编辑器可以使DNA中的腺嘌呤脱氨基。在一些实施方案中,碱基编辑器能够使DNA中的胞苷脱氨基。
在一些实施方案中,如本文所提供的碱基编辑系统提供了一种新的基因组编辑方法,其使用含有催化缺陷化脓性链球菌Cas9、脱氨酶(例如,胞苷或腺苷脱氨酶)和碱基切除修复抑制剂的融合蛋白在DNA中诱导可编程的单核苷酸(C→T或A→G)变化,而不生成双链DNA断裂,不需要供体DNA模板,并且不诱导过量的随机插入和缺失。
核碱基编辑蛋白的详细信息在国际PCT申请号PCT/2017/045381(WO2018/027078)和PCT/US2016/058344(WO2017/070632)中描述,所述申请各自通过引用整体并入本文。也参见Komor,A.C.,等人,“Programmable editing of a target base in genomic DNAwithout double-stranded DNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.等人,“Programmable base editing of A·T to G·C in genomic DNA without DNAcleavage”Nature 551,464-471(2017);和Komor,A.C.,等人,“Improved base excisionrepair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A baseeditors with higher efficiency and product purity”Science Advances 3:eaao4774(2017),所述文献的全部内容特此通过引用并入。
本文提供的碱基编辑器系统的使用包括以下步骤:(a)使受试者的多核苷酸(例如,双链或单链DNA或RNA)的靶核苷酸序列与包含核碱基编辑器(例如,腺苷碱基编辑器或胞苷碱基编辑器)和指导多核酸(例如,gRNA)的碱基编辑器系统接触,其中靶核苷酸序列包含靶向的核碱基对;(b)诱导所述靶区域的链分开;(c)将靶区域单链中的所述靶核碱基对的第一核碱基转化为第二核碱基;和(d)切割所述靶区域的不多于一条链,其中与第一核碱基互补的第三核碱基被与第二核碱基互补的第四核碱基替换。应当理解,在一些实施方案中,省略了步骤(b)。在一些实施方案中,所述靶向的核碱基对是一个或多个基因中的多个核碱基对。在一些实施方案中,本文提供的碱基编辑器系统能够对一个或多个基因中的多个核碱基对进行多重编辑。在一些实施方案中,多个核碱基对位于同一基因中。在一些实施方案中,多个核碱基对位于一个或多个基因中,其中至少一个基因位于不同的基因座中。
在一些实施方案中,切割的单链(切口链)与指导核酸杂交。在一些实施方案中,切割的单链与包含第一核碱基的链相反。在一些实施方案中,碱基编辑器包含Cas9结构域。在一些实施方案中,第一碱基是腺嘌呤,并且第二碱基不是G、C、A或T。在一些实施方案中,第二碱基是肌苷。
在一些实施方案中,单一指导多核苷酸可用于将脱氨酶靶向至靶核酸序列。在一些实施方案中,指导多核苷酸的单个对可以用于将不同的脱氨酶靶向至靶核酸序列。
碱基编辑器系统的核碱基组分和多核苷酸可编程核苷酸结合组分可以彼此共价或非共价缔合。例如,在一些实施方案中,脱氨酶结构域可以通过多核苷酸可编程核苷酸结合结构域而被靶向至靶核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至脱氨酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以通过与脱氨酶结构域非共价相互作用或缔合而将脱氨酶结构域靶向至靶核苷酸序列。例如,在一些实施方案中,核碱基编辑组分(例如,脱氨酶组分)可以包含额外的异源部分或结构域,所述异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外的异源部分或结构域相互作用、缔合,或能够形成复合物。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合指导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽接头。在一些实施方案中,额外的异源部分可能能够结合多核苷酸接头。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是K同源(KH)结构域、MS2外壳蛋白结构域、PP7外壳蛋白结构域、SfMu Com外壳蛋白结构域、不育α基序(steril alpha motif)、端粒酶Ku结合基序和Ku蛋白、端粒酶Sm7结合基序和Sm7蛋白、或RNA识别基序。
碱基编辑器系统还可以包含指导多核苷酸组分。应当理解,碱基编辑器系统的组分可以经由共价键、非共价相互作用或其缔合和相互作用的任何组合而彼此缔合。在一些实施方案中,脱氨酶结构域可以通过指导多核苷酸而被靶向至靶核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的核碱基编辑组分(例如,脱氨酶组分)可以包含额外的异源部分或结构域(例如,多核苷酸结合结构域,诸如RNA或DNA结合蛋白),所述异源部分或结构域能够与指导多核苷酸的部分或区段(例如,多核苷酸基序)相互作用、缔合或能够形成复合物。在一些实施方案中,额外的异源部分或结构域(例如,多核苷酸结合结构域,诸如RNA或DNA结合蛋白)可以融合或连接至脱氨酶结构域。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合指导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽接头。在一些实施方案中,额外的异源部分可能能够结合多核苷酸接头。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是K同源(KH)结构域、MS2外壳蛋白结构域、PP7外壳蛋白结构域、SfMu Com外壳蛋白结构域、不育α基序、端粒酶Ku结合基序和Ku蛋白、端粒酶Sm7结合基序和Sm7蛋白、或RNA识别基序。
在一些实施方案中,碱基编辑器系统还可以包含碱基切除修复(BER)组分的抑制剂。应当理解,碱基编辑器系统的组分可以经由共价键、非共价相互作用或其缔合和相互作用的任何组合而彼此缔合。BER组分的抑制剂可包含碱基切除修复抑制剂。在一些实施方案中,碱基切除修复的抑制剂可以是尿嘧啶DNA糖基化酶抑制剂(UGI)。在一些实施方案中,碱基切除修复的抑制剂可以是肌苷碱基切除修复抑制剂。在一些实施方案中,碱基切除修复的抑制剂可以通过多核苷酸可编程核苷酸结合结构域而被靶向至靶核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至碱基切除修复的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至脱氨酶结构域和碱基切除修复的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以通过与碱基切除修复的抑制剂非共价相互作用或缔合而将碱基切除修复的抑制剂靶向至靶核苷酸序列。例如,在一些实施方案中,碱基切除修复组分的抑制剂可以包含额外的异源部分或结构域,所述异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外的异源部分或结构域相互作用、缔合,或能够形成复合物。在一些实施方案中,碱基切除修复的抑制剂可以通过指导多核苷酸而被靶向至靶核苷酸序列。例如,在一些实施方案中,碱基切除修复的抑制剂可以包含额外的异源部分或结构域(例如,多核苷酸结合结构域,诸如RNA或DNA结合蛋白),所述异源部分或结构域能够与指导多核苷酸的部分或区段(例如,多核苷酸基序)相互作用、缔合或能够形成复合物。在一些实施方案中,指导多核苷酸的额外的异源部分或结构域(例如,多核苷酸结合结构域,诸如RNA或DNA结合蛋白)可以融合或连接至碱基切除修复的抑制剂。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合指导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽接头。在一些实施方案中,额外的异源部分可能能够结合多核苷酸接头。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是K同源(KH)结构域、MS2外壳蛋白结构域、PP7外壳蛋白结构域、SfMu Com外壳蛋白结构域、不育α基序、端粒酶Ku结合基序和Ku蛋白、端粒酶Sm7结合基序和Sm7蛋白、或RNA识别基序。
在一些实施方案中,碱基编辑器抑制编辑链的碱基切除修复(BER)。在一些实施方案中,碱基编辑器保护或结合未编辑的链。在一些实施方案中,基本编辑器包含UGI活性。在一些实施方案中,碱基编辑器包含无催化活性的肌苷特异性核酸酶。在一些实施方案中,碱基编辑器包含切口酶活性。在一些实施方案中,碱基对的预期编辑位于PAM位点的上游。在一些实施方案中,碱基对的预期编辑位于PAM位点上游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,碱基对的预期编辑位于PAM位点的下游。在一些实施方案中,预期编辑的碱基对位于PAM位点下游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。
在一些实施方案中,方法不需要规范的(例如,NGG)PAM位点。在一些实施方案中,核碱基编辑器包含接头或间隔子。在一些实施方案中,接头或间隔子的长度为1-25个氨基酸。在一些实施方案中,接头或间隔子的长度为5-20个氨基酸。在一些实施方案中,接头或间隔子的长度为10、11、12、13、14、15、16、17、18、19或20个氨基酸。
在一些实施方案中,本文提供的碱基编辑融合蛋白需要定位在精确位置,例如,靶碱基位于定义区域(例如,“脱氨基窗口”)内的位置。在一些实施方案中,靶标可以在4个碱基的区域内。在一些实施方案中,这样的定义的靶区域可以位于PAM上游大约15个碱基。参见Komor,A.C.,等人,“Programmable editing of a target base in genomic DNAwithout double-stranded DNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.,等人,“Programmable base editing of A·T to G·C in genomic DNA without DNAcleavage”Nature 551,464-471(2017);和Komor,A.C.,等人,“Improved base excisionrepair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A baseeditors with higher efficiency and product purity”Science Advances 3:eaao4774(2017),所述文献的全部内容特此通过引用并入。
在一些实施方案中,靶区域包含靶窗口,其中靶窗口包含靶核碱基对。在一些实施方案中,靶窗口包含1-10个核苷酸。在一些实施方案中,靶窗口的长度是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,碱基对的预期编辑在靶窗口内。在一些实施方案中,靶窗口包含碱基对的预期编辑。在一些实施方案中,方法使用本文提供的任何碱基编辑器来执行。在一些实施方案中,靶窗口是脱氨基窗口。脱氨基窗口可以是碱基编辑器作用于靶核苷酸并使其脱氨基的定义区域。在一些实施方案中,脱氨基窗口在2、3、4、5、6、7、8、9或10个碱基的区域内。在一些实施方案中,脱氨基窗口位于PAM上游5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基。
本公开的碱基编辑器可以包含促进靶多核苷酸序列编辑的任何结构域、特征或氨基酸序列。例如,在一些实施方案中,碱基编辑器包含核定位序列(NLS)。在一些实施方案中,碱基编辑器的NLS位于脱氨酶结构域与多核苷酸可编程核苷酸结合结构域之间。在一些实施方案中,碱基编辑器的NLS位于多核苷酸可编程核苷酸结合结构域的C末端。
可以存在于如本文所公开的碱基编辑器中的其他示例性特征是定位序列,诸如细胞质定位序列、输出序列,诸如核输出序列、或其他定位序列,以及可用于融合蛋白的增溶、纯化或检测的序列标签。本文提供的合适的蛋白质标签包括但不限于生物素羧化酶载体蛋白(BCCP)标签、myc标签、钙调蛋白标签、FLAG标签、血凝素(HA)标签、多组氨酸标签(也称为组氨酸标签或His标签)、麦芽糖结合蛋白(MBP)标签、nus标签、谷胱甘肽-S-转移酶(GST)标签、绿色荧光蛋白(GFP)标签、硫氧还蛋白标签、S标签、Softag(例如,Softag 1、Softag3)、链球菌标签、生物素连接酶标签、FlAsH标签、V5标签和SBP标签。其他合适的序列对于本领域技术人员将是显而易见的。在一些实施方案中,融合蛋白包含一个或多个His标签。
在一些实施方案中,非限制性示例性胞苷碱基编辑器(CBE)包括BE1(APOBEC1-XTEN-dCas9)、BE2(APOBEC1-XTEN-dCas9-UGI)、BE3(APOBEC1-XTEN-dCas9(A840H)-UGI)、BE3-Gam、saBE3、saBE4-Gam、BE4、BE4-Gam、saBE4或saB4E-Gam。BE4将APOBEC1-Cas9n(D10A)接头延伸至32个氨基酸,并且将Cas9n-UGI接头延伸至9个氨基酸,并且将UGI的第二个拷贝附加至构建体的C末端,同时将另一个9个氨基酸的接头附加到单个碱基编辑器构建体中。碱基编辑器saBE3和saBE4将化脓性链球菌Cas9n(D10A)替换为较小的金黄色葡萄球菌Cas9n(D10A)。BE3-Gam、saBE3-Gam、BE4-Gam和saBE4-Gam具有Gam蛋白的174个残基,其经由16个氨基酸的XTEN接头融合至BE3、saBE3、BE4和saBE4的N末端。
在一些实施方案中,腺苷碱基编辑器(ABE)可以使DNA中的腺嘌呤脱氨基。在一些实施方案中,通过用天然或工程化的大肠杆菌TadA、人ADAR2、小鼠ADA或人ADAT2替换BE3的APOBEC1组分而生成ABE。在一些实施方案中,ABE包含进化的TadA变体。在一些实施方案中,ABE是ABE 1.2(TadA*-XTEN-nCas9-NLS)。在一些实施方案中,TadA*包含A106V和D108N突变。
在一些实施方案中,ABE是第二代ABE。在一些实施方案中,ABE是ABE2.1,其在TadA*(TadA*2.1)中包含额外的突变D147Y和E155V。在一些实施方案中,ABE是融合至催化失活版本的人烷基腺嘌呤DNA糖基化酶(具有E125Q突变的AAG)的ABE2.2、ABE2.1。在一些实施方案中,ABE是融合至催化失活版本的大肠杆菌Endo V(具有D35A突变而失活)的ABE2.3、ABE2.1。在一些实施方案中,ABE是ABE2.6,其接头的长度是ABE2.1中的接头的两倍(32个氨基酸,(SGGS)2(SEQ ID NO:330)-XTEN-(SGGS)2(SEQ ID NO:330))。在一些实施方案中,ABE是ABE2.7,它是与额外的野生型TadA单体栓系在一起的ABE2.1。在一些实施方案中,ABE是ABE2.8,它是与额外的TadA*2.1单体栓系在一起的ABE2.1。在一些实施方案中,ABE是ABE2.9,它是进化的TadA(TadA*2.1)与ABE2.1的N末端的直接融合。在一些实施方案中,ABE是ABE2.10,它是野生型TadA与ABE2.1的N末端的直接融合。在一些实施方案中,ABE是ABE2.11,它是在TadA*单体的N末端具有失活E59A突变的ABE2.9。在一些实施方案中,ABE是ABE2.12,它是在内部TadA*单体中具有失活E59A突变的ABE2.9。
在一些实施方案中,ABE是第三代ABE。在一些实施方案中,ABE是ABE3.1,它是具有三个额外的TadA突变(L84F、H123Y和I156F)的ABE2.3。
在一些实施方案中,ABE是第四代ABE。在一些实施方案中,ABE是ABE4.3,它是具有额外的TadA突变A142N(TadA*4.3)的ABE3.1。
在一些实施方案中,ABE是第五代ABE。在一些实施方案中,ABE是ABE5.1,它是通过将来自存活克隆(H36L、R51L、S146C和K157N)的一组共有突变输入到ABE3.1中而生成的。在一些实施方案中,ABE是ABE5.3,它具有异源二聚体构建体,所述异源二聚体构建体含有融合至内部进化的TadA*的野生型大肠杆菌TadA。在一些实施方案中,ABE是ABE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12、ABE5.13或ABE5.14,如下表11所示。在一些实施方案中,ABE是第六代ABE。在一些实施方案中,ABE是ABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5或ABE6.6,如下表11所示。在一些实施方案中,ABE是第七代ABE。在一些实施方案中,ABE是ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9或ABE7.10,如下表11所示。
表11.ABE的基因型
/>
/>
在一些实施方案中,碱基编辑器是第八代ABE(ABE8)。在一些实施方案中,ABE8含有TadA*8变体。在一些实施方案中,ABE8具有单体构建体,所述单体构建体含有TadA*8变体(“ABE8.x-m”)。在一些实施方案中,ABE8是ABE8.1-m,其具有单体构建体,所述单体构建体含有具有Y147T突变的TadA*7.10(TadA*8.1)。在一些实施方案中,ABE8是ABE8.2-m,其具有单体构建体,所述单体构建体含有具有Y147R突变的TadA*7.10(TadA*8.2)。在一些实施方案中,ABE8是ABE8.3-m,其具有单体构建体,所述单体构建体含有具有Q154S突变的TadA*7.10(TadA*8.3)。在一些实施方案中,ABE8是ABE8.4-m,其具有单体构建体,所述单体构建体含有具有Y123H突变的TadA*7.10(TadA*8.4)。在一些实施方案中,ABE8是ABE8.5-m,其具有单体构建体,所述单体构建体含有具有V82S突变的TadA*7.10(TadA*8.5)。在一些实施方案中,ABE8是ABE8.6-m,其具有单体构建体,所述单体构建体含有具有T166R突变的TadA*7.10(TadA*8.6)。在一些实施方案中,ABE8是ABE8.7-m,其具有单体构建体,所述单体构建体含有具有Q154R突变的TadA*7.10(TadA*8.7)。在一些实施方案中,ABE8是ABE8.8-m,其具有单体构建体,所述单体构建体含有具有Y147R、Q154R和Y123H突变的TadA*7.10(TadA*8.8)。在一些实施方案中,ABE8是ABE8.9-m,其具有单体构建体,所述单体构建体含有具有Y147R、Q154R和I76Y突变的TadA*7.10(TadA*8.9)。在一些实施方案中,ABE8是ABE8.10-m,其具有单体构建体,所述单体构建体含有具有Y147R、Q154R和T166R突变的TadA*7.10(TadA*8.10)。在一些实施方案中,ABE8是ABE8.11-m,其具有单体构建体,所述单体构建体含有具有Y147T和Q154R突变的TadA*7.10(TadA*8.11)。在一些实施方案中,ABE8是ABE8.12-m,其具有单体构建体,所述单体构建体含有具有Y147T和Q154S突变的TadA*7.10(TadA*8.12)。
在一些实施方案中,ABE8是ABE8.13-m,其具有单体构建体,所述单体构建体含有具有Y123H(Y123H从H123Y反转)、Y147R、Q154R和I76Y突变的TadA*7.10(TadA*8.13)。在一些实施方案中,ABE8是ABE8.14-m,其具有单体构建体,所述单体构建体含有具有I76Y和V82S突变的TadA*7.10(TadA*8.14)。在一些实施方案中,ABE8是ABE8.15-m,其具有单体构建体,所述单体构建体含有具有V82S和Y147R突变的TadA*7.10(TadA*8.15)。在一些实施方案中,ABE8是ABE8.16-m,其具有单体构建体,所述单体构建体含有具有V82S、Y123H(Y123H从H123Y反转)和Y147R突变的TadA*7.10(TadA*8.16)。在一些实施方案中,ABE8是ABE8.17-m,其具有单体构建体,所述单体构建体含有具有V82S和Q154R突变的TadA*7.10(TadA*8.17)。在一些实施方案中,ABE8是ABE8.18-m,其具有单体构建体,所述单体构建体含有具有V82S、Y123H(Y123H从H123Y反转)和Q154R突变的TadA*7.10(TadA*8.18)。在一些实施方案中,ABE8是ABE8.19-m,其具有单体构建体,所述单体构建体含有具有V82S、Y123H(Y123H从H123Y反转)、Y147R和Q154R突变的TadA*7.10(TadA*8.19)。在一些实施方案中,ABE8是ABE8.20-m,其具有单体构建体,所述单体构建体含有具有I76Y、V82S、Y123H(Y123H从H123Y反转)、Y147R和Q154R突变的TadA*7.10(TadA*8.20)。在一些实施方案中,ABE8是ABE8.21-m,其具有单体构建体,所述单体构建体含有具有Y147R和Q154S突变的TadA*7.10(TadA*8.21)。在一些实施方案中,ABE8是ABE8.22-m,其具有单体构建体,所述单体构建体含有具有V82S和Q154S突变的TadA*7.10(TadA*8.22)。在一些实施方案中,ABE8是ABE8.23-m,其具有单体构建体,所述单体构建体含有具有V82S和Y123H(Y123H从H123Y反转)突变的TadA*7.10(TadA*8.23)。在一些实施方案中,A BE8是ABE8.24-m,其具有单体构建体,所述单体构建体含有具有V82S、Y123H(Y123H从H123Y反转)和Y147T突变的TadA*7.10(T adA*8.24)。
在一些实施方案中,ABE8具有异源二聚体构建体,所述异源二聚体构建体含有与TadA*8变体融合的野生型大肠杆菌TadA(“ABE8.x-d”)。在一些实施方案中,ABE8是ABE8.1-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y147T突变的TadA*7.10(TadA*8.1)。在一些实施方案中,ABE8是ABE8.2-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y147R突变的TadA*7.10(TadA*8.2)。在一些实施方案中,ABE8是ABE8.3-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Q154S突变的TadA*7.10(TadA*8.3)。在一些实施方案中,ABE8是ABE8.4-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y123H突变的TadA*7.10(TadA*8.4)。在一些实施方案中,ABE8是ABE8.5-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V82S突变的TadA*7.10(TadA*8.5)。在一些实施方案中,ABE8是ABE8.6-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有T166R突变的TadA*7.10(TadA*8.6)。在一些实施方案中,ABE8是ABE8.7-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Q154R突变的TadA*7.10(T adA*8.7)。在一些实施方案中,ABE8是ABE8.8-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y147R、Q154R和Y123H突变的TadA*7.10(TadA*8.8)。在一些实施方案中,ABE8是ABE8.9-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y147R、Q154R和I76Y突变的TadA*7.10(TadA*8.9)。在一些实施方案中,ABE8是ABE8.10-d,其具有含有野生型大肠杆菌Tad A的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y147R、Q154R和T166R突变的TadA*7.10(TadA*8.10)。在一些实施方案中,ABE8是ABE8.11-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y147T和Q154R突变的TadA*7.10(TadA*8.11)。在一些实施方案中,ABE8是ABE8.12-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y147T和Q154S突变的Tad A*7.10(TadA*8.12)。在一些实施方案中,ABE8是ABE8.13-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y123H(Y123H从H123Y反转)、Y147R、Q154R和I76Y突变的TadA*7.10(TadA*8.13)。在一些实施方案中,A BE8是ABE8.14-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有I76Y和V82S突变的TadA*7.10(TadA*8.14)。在一些实施方案中,ABE8是ABE8.15-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V82S和Y147R突变的TadA*7.10(TadA*8.15)。在一些实施方案中,ABE8是ABE8.16-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌T adA融合至具有V82S、Y123H(Y123H从H123Y反转)和Y147R突变的TadA*7.10(TadA*8.16)。在一些实施方案中,ABE8是ABE8.17-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V82S和Q154R突变的TadA*7.10(TadA*8.17)。在一些实施方案中,ABE8是ABE8.18-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌T adA融合至具有V82S、Y123H(Y123H从H123Y反转)和Q154R突变的TadA*7.10(TadA*8.18)。在一些实施方案中,ABE8是ABE8.19-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V82S、Y123H(Y123H从H123Y反转)、Y147R和Q154R突变的TadA*7.10(TadA*8.19)。在一些实施方案中,ABE8是ABE8.20-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有I76Y、V82S、Y123H(Y123H从H123Y反转)、Y147R和Q154R突变的Tad A*7.10(TadA*8.20)。在一些实施方案中,ABE8是ABE8.21-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有Y147R和Q154S突变的TadA*7.10(TadA*8.21)。在一些实施方案中,ABE8是ABE8.22-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V82S和Q154S突变的TadA*7.10(TadA*8.22)。在一些实施方案中,ABE8是ABE8.23-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V82S和Y123H(Y123H从H123Y反转)突变的TadA*7.10(TadA*8.23)。在一些实施方案中,ABE8是ABE8.24-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V82S、Y123H(Y123H从H123Y反转)和Y147T突变的TadA*7.10(TadA*8.24)。
在一些实施方案中,ABE8具有异源二聚体构建体,所述异源二聚体构建体含有融合至TadA*8变体的TadA*7.10(“ABE8.x-7”)。在一些实施方案中,ABE8是ABE8.1-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y147T突变的TadA*7.10(TadA*8.1)。在一些实施方案中,ABE8是ABE8.2-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y147R突变的TadA*7.10(TadA*8.2)。在一些实施方案中,ABE8是ABE8.3-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Q154S突变的TadA*7.10(TadA*8.3)。在一些实施方案中,ABE8是ABE8.4-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y123H突变的TadA*7.10(TadA*8.4)。在一些实施方案中,ABE8是ABE8.5-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S突变的TadA*7.10(TadA*8.5)。在一些实施方案中,ABE8是ABE8.6-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有T166R突变的TadA*7.10(TadA*8.6)。在一些实施方案中,ABE8是ABE8.7-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Q154R突变的TadA*7.10(TadA*8.7)。在一些实施方案中,ABE8是ABE8.8-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y147R、Q154R和Y123H突变的TadA*7.10(TadA*8.8)。在一些实施方案中,ABE8是ABE8.9-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y147R、Q154R和I76Y突变的TadA*7.10(TadA*8.9)。在一些实施方案中,ABE8是ABE8.10-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y147R、Q154R和T166R突变的TadA*7.10(TadA*8.10)。在一些实施方案中,ABE8是ABE8.11-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y147T和Q154R突变的TadA*7.10(TadA*8.11)。在一些实施方案中,ABE8是ABE8.12-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y147T和Q154S突变的TadA*7.10(TadA*8.12)。在一些实施方案中,ABE8是ABE8.13-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y123H(Y123H从H123Y反转)、Y147R、Q154R和I76Y突变的TadA*7.10(TadA*8.13)。在一些实施方案中,ABE8是ABE8.14-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有I76Y和V82S突变的TadA*7.10(TadA*8.14)。在一些实施方案中,ABE8是ABE8.15-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S和Y147R突变的TadA*7.10(TadA*8.15)。在一些实施方案中,ABE8是ABE8.16-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S、Y123H(Y123H从H123Y反转)和Y147R突变的TadA*7.10(TadA*8.16)。在一些实施方案中,ABE8是ABE8.17-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S和Q154R突变的TadA*7.10(TadA*8.17)。在一些实施方案中,ABE8是ABE8.18-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S、Y123H(Y123H从H123Y反转)和Q154R突变的TadA*7.10(TadA*8.18)。在一些实施方案中,ABE8是ABE8.19-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S、Y123H(Y123H从H123Y反转)、Y147R和Q154R突变的TadA*7.10(TadA*8.19)。在一些实施方案中,ABE8是ABE8.20-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有I76Y、V82S、Y123H(Y123H从H123Y反转)、Y147R和Q154R突变的TadA*7.10(TadA*8.20)。在一些实施方案中,ABE8是ABE8.21-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有Y147R和Q154S突变的TadA*7.10(TadA*8.21)。在一些实施方案中,ABE8是ABE8.22-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S和Q154S突变的TadA*7.10(TadA*8.22)。在一些实施方案中,ABE8是ABE8.23-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S和Y123H(Y123H从H123Y反转)突变的TadA*7.10(TadA*8.23)。在一些实施方案中,ABE8是ABE8.24-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V82S、Y123H(Y123H从H123Y反转)和Y147T突变的TadA*7.10(TadA*8.24)。
[1]在一些实施方案中,ABE是ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d或ABE8.24-d,如下表12所示。
表12:腺苷碱基编辑器8(ABE8)变体
/>
/>
在一些实施方案中,ABE8是ABE8a-m,其具有单体构建体,所述单体构建体含有具有R26C、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和D167N突变的TadA*7.10(TadA*8a)。在一些实施方案中,ABE8是ABE8b-m,其具有单体构建体,所述单体构建体含有具有V88A、A109S、T111R、D119N、H122N、F149Y、T166I和D167N突变的TadA*7.10(TadA*8b)。在一些实施方案中,ABE8是ABE8c-m,其具有单体构建体,所述单体构建体含有具有R26C、A109S、T111R、D119N、H122N、F149Y、T166I和D167N突变的TadA*7.10(TadA*8c)。在一些实施方案中,ABE8是ABE8d-m,其具有单体构建体,所述单体构建体含有具有V88A、T111R、D119N和F149Y突变的TadA*7.10(TadA*8d)。在一些实施方案中,ABE8是ABE8e-m,其具有单体构建体,所述单体构建体含有具有A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和D167N突变的TadA*7.10(TadA*8e)。
在一些实施方案中,ABE8是ABE8a-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I和D167N突变的TadA*7.10(TadA*8a)。在一些实施方案中,ABE8是ABE8b-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V88A、A109S、T111R、D119N、H122N、F149Y、T166I和D167N突变的TadA*7.10(TadA*8b)。在一些实施方案中,ABE8是ABE8c-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有R26C、A109S、T111R、D119N、H122N、F149Y、T166I和D167N突变的TadA*7.10(TadA*8c)。在一些实施方案中,ABE8是ABE8d-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有V88A、T111R、D119N和F149Y突变的TadA*7.10(TadA*8d)。在一些实施方案中,ABE8是ABE8e-d,其具有含有野生型大肠杆菌TadA的异源二聚体构建体,所述野生型大肠杆菌TadA融合至具有A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和D167N突变的TadA*7.10(TadA*8e)。
在一些实施方案中,ABE8是ABE8a-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I和D167N突变的TadA*7.10(TadA*8a)。在一些实施方案中,ABE8是ABE8b-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V88A、A109S、T111R、D119N、H122N、F149Y、T166I和D167N突变的TadA*7.10(TadA*8b)。在一些实施方案中,ABE8是ABE8c-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有R26C、A109S、T111R、D119N、H122N、F149Y、T166I和D167N突变的TadA*7.10(TadA*8c)。在一些实施方案中,ABE8是ABE8d-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有V88A、T111R、D119N和F149Y突变的TadA*7.10(TadA*8d)。在一些实施方案中,ABE8是ABE8e-7,其具有含有TadA*7.10的异源二聚体构建体,所述TadA*7.10融合至具有A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和D167N突变的TadA*7.10(TadA*8e)。
在一些实施方案中,ABE是ABE8a-mABE8a-m、ABE8b-m、ABE8c-m、ABE8d-m、ABE8e-m、ABE8a-d、ABE8b-d、ABE8c-d、ABE8d-d或ABE8e-d,如下表13所示。在一些实施方案中,ABE是ABE8e-m或ABE8e-d。当与除SpCas9外的Cas同系物(例如SaCas9、SaCas9-KKH、Cas12a同系物,例如,LbCas12a、enAs-Cas12a、SpCas9-NG和环状置换的CP1028-SpCas9和CP1041-SpCas9)一起使用时,ABE8e显示出高效的腺嘌呤碱基编辑活性和低插入缺失形成。除了表13中显示的ABE8e的突变之外,通过将V106W取代引入到TadA结构域中,减少了脱靶RNA和DNA编辑(如在M.Richter等人,2020,Nature Biotechnology,doi.org/10.1038/s41587-020-0453-z中所述,所述文献的全部内容通过引用并入本文)。
表13:额外的腺苷碱基编辑器8变体。在表中,“单体”表示包含单个TadA*7.10的ABE,所述TadA*7.10包含指定的改变,并且“异源二聚体”表示包含TadA*7.10的ABE,所述TadA*7.10包含融合至大肠杆菌TadA腺苷脱氨酶的指定改变。
/>
在一些实施方案中,碱基编辑器(例如,ABE8)通过将腺苷脱氨酶变体(例如,TadA*8)克隆到包括环状置换的Cas9(例如,CP5或CP6)和二分核定位序列的支架中而生成。在一些实施方案中,碱基编辑器(例如,ABE7.9、ABE7.10或ABE8)是NGC PAM CP5变体(化脓性链球菌Cas9或spVRQR Cas9)。在一些实施方案中,碱基编辑器(例如,ABE7.9、ABE7.10或ABE8)是AGA PAM CP5变体(化脓性链球菌Cas9或spVRQR Cas9)。在一些实施方案中,碱基编辑器(例如,ABE7.9、ABE7.10或ABE8)是NGC PAM CP6变体(化脓性链球菌Cas9或spVRQR Cas9)。在一些实施方案中,碱基编辑器(例如,ABE7.9、ABE7.10或ABE8)是AGA PAM CP6变体(化脓性链球菌Cas9或spVRQR Cas9)。
在一些实施方案中,ABE具有如下表14所示的基因型。
表14.ABE的基因型
23 26 36 37 48 49 51 72 84 87 105 108 123 125 142 145 147 152 155 156 157 161
ABE7.9 L R L N A L N F S V N Y G N C Y P V F N K
ABE7.10 R R L N A L N F S V N Y G A C Y P V F N K
如下表15所示,描述了40个ABE8的基因型。表明了ABE的进化大肠杆菌TadA部分中的残基位置。当与ABE7.10突变不同时,示出了ABE8的突变变化。在一些实施方案中,ABE具有如下表15所示的ABE中的一种的基因型。
表15.进化TadA中的残基身份
在一些实施方案中,碱基编辑器是ABE8.1,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:
ABE8.1_Y147T_CP5_NGC PAM_单体
/>
在以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示来源于Cas9的序列,斜体序列表示接头序列,并且下划线序列表示二分核定位序列。所附序列表中提供了其他ABE8序列(SEQ ID NO:332-354)。
在一些实施方案中,碱基编辑器是第九代ABE(ABE9)。在一些实施方案中,ABE9含有TadA*9变体。ABE9碱基编辑器包括包含氨基酸序列的腺苷脱氨酶变体,所述变体含有相对于ABE 7*10参考序列的改变,如本文所述。示例性ABE9变体在表16中列出。ABE9碱基编辑器的详细信息在国际PCT申请号PCT/2020/049975中描述,所述申请通过引用整体并入本文。
表16.腺苷碱基编辑器9(ABE9)变体。在表中,“单体”表示包含单个TadA*7.10的ABE,所述TadA*7.10包含指定的改变,并且“异源二聚体”表示包含TadA*7.10的ABE,所述TadA*7.10包含融合至大肠杆菌TadA腺苷脱氨酶的指定改变。
/>
/>
在一些实施方案中,碱基编辑器包含有包含尿嘧啶糖基化酶抑制剂(UGI)的全部或部分的结构域。在一些实施方案中,碱基编辑器包含有包含核酸聚合酶的全部或部分的结构域。在一些实施方案中,碱基编辑器可以包含核酸聚合酶(NAP)的全部或部分作为结构域。例如,碱基编辑器可以包含真核NAP的全部或部分。在一些实施方案中,掺入到碱基编辑器中的NAP或其部分是DNA聚合酶。在一些实施方案中,掺入到碱基编辑器中的NAP或其部分具有转位聚合酶活性。在一些实施方案中,掺入到碱基编辑器中的NAP或其部分是转位DNA聚合酶。在一些实施方案中,掺入到碱基编辑器中的NAP或其部分是Rev7、Rev1复合物、聚合酶ι、聚合酶κ或聚合酶η。在一些实施方案中,掺入到碱基编辑器中的NAP或其部分是真核聚合酶α、β、γ、δ、ε、γ、η、ι、κ、λ、μ或ν组分。在一些实施方案中,掺入到碱基编辑器中的NAP或其部分包含与核酸聚合酶(例如,转位DNA聚合酶)具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或99.5%同一性的氨基酸序列。在一些实施方案中,掺入到碱基编辑器中的核酸聚合酶或其部分是转位DNA聚合酶。
在一些实施方案中,碱基编辑器的结构域可以包括多个结构域。例如,包含来源于Cas9的多核苷酸可编程核苷酸结合结构域的碱基编辑器可以包含对应于野生型或天然Cas9的REC叶和NUC叶的REC叶和NUC叶。在另一个实例中,碱基编辑器可以包含RuvCI结构域、BH结构域、REC1结构域、REC2结构域、RuvCII结构域、L1结构域、HNH结构域、L2结构域、RuvCIII结构域、WED结构域、TOPO结构域或CTD结构域中的一个或多个。在一些实施方案中,碱基编辑器的一个或多个结构域包含相对于包含所述结构域的野生型版本多肽的突变(例如,取代、插入、缺失)。例如,多核苷酸可编程DNA结合结构域的HNH结构域可以包含H840A取代。在另一个实例中,多核苷酸可编程DNA结合结构域的RuvCI结构域可以包含D10A取代。
本文公开的碱基编辑器的不同结构域(例如,相邻结构域)可以在使用或不使用一个或多个接头结构域(例如,XTEN接头结构域)的情况下彼此连接。在一些实施方案中,接头结构域可以是键(例如,共价键)、化学基团或连接两个分子或部分的分子,所述两个分子或部分例如融合蛋白的两个结构域,例如像第一结构域(例如,Cas9衍生结构域)和第二结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)。在一些实施方案中,接头是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,接头是酰胺键联的碳氮键。在某些实施方案中,接头是环状或非环状的、取代或未取代的、支链或非支链的脂肪族或杂脂肪族接头。在某些实施方案中,接头是聚合的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,接头包含氨基链烷酸的单体、二聚体或聚合物。在一些实施方案中,接头包含氨基链烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在一些实施方案中,接头包含氨基己酸(Ahx)的单体、二聚体或聚合物。在某些实施方案中,接头基于碳环部分(例如,环戊烷、环己烷)。在其他实施方案中,接头包含聚乙二醇部分(PEG)。在某些实施方案中,接头包含芳基或杂芳基部分。在某些实施方案中,接头基于苯环。接头可以包括功能化部分以促进亲核试剂(例如,硫醇、氨基)从肽附接至接头。任何亲电子试剂都可以用作接头的一部分。示例性亲电子试剂包括但不限于激活的酯、激活的酰胺、迈克尔受体(Michael acceptor)、烷基卤化物、芳基卤化物、酰基卤化物和异硫氰酸酯。在一些实施方案中,接头接合RNA可编程核酸酶的gRNA结合结构域,包括Cas9核酸酶结构域和核酸编辑蛋白的催化结构域。在一些实施方案中,接头接合dCas9和第二结构域(例如,UGI等)。
接头
在某些实施方案中,接头可用于连接本发明的任何肽或肽结构域。接头可以和共价键一样简单,或者可以是长度为许多原子的聚合物接头。在某些实施方案中,接头是多肽或基于氨基酸。在其他实施方案中,接头不是肽样的。在某些实施方案中,接头是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,接头是酰胺键联的碳-氮键。在某些实施方案中,接头是环状或非环状的、取代或未取代的、支链或非支链的脂肪族或杂脂肪族接头。在某些实施方案中,接头是聚合的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,接头包含氨基链烷酸的单体、二聚体或聚合物。在某些实施方案中,接头包含氨基链烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在某些实施方案中,接头包含氨基己酸(Ahx)的单体、二聚体或聚合物。在某些实施方案中,接头基于碳环部分(例如,环戊烷、环己烷)。在其他实施方案中,接头包含聚乙二醇部分(PEG)。在其他实施方案中,接头包含氨基酸。在某些实施方案中,接头包含肽。在某些实施方案中,接头包含芳基或杂芳基部分。在某些实施方案中,接头基于苯环。接头可包括功能化部分以促进亲核试剂(例如,硫醇、氨基)从肽附接至接头。任何亲电子试剂都可用作接头的一部分。示例性亲电子试剂包括但不限于激活的酯、激活的酰胺、迈克尔受体、烷基卤化物、芳基卤化物、酰基卤化物和异硫氰酸酯。
通常,接头位于两个基团、分子或其他部分之间或侧接有两个基团、分子或其他部分,并且经由共价键连接至每个基团、分子或其他部分,从而连接两者。在一些实施方案中,接头是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,接头是有机分子、基团、聚合物或化学部分。在一些实施方案中,接头长度为2-100个氨基酸,例如长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。在一些实施方案中,接头长度为约3至约104(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100)个氨基酸。也考虑更长或更短的接头。
在一些实施方案中,本文提供的任何融合蛋白包含经由接头彼此融合的胞苷或腺苷脱氨酶和Cas9结构域。可以采用胞苷或腺苷脱氨酶与Cas9结构域之间的各种接头长度和柔性(例如,范围从(GGGS)n(SEQ ID NO:246)、(GGGGS)n(SEQ ID NO:247)和(G)n形式的非常柔性的接头至(EAAAK)n(SEQ ID NO:248)、(SGGS)n(SEQ ID NO:355)、SGSETPGTSESATPES(SEQ ID NO:249)(参见,例如,Guilinger JP,等人Fusion of catalytically inactiveCas9to FokI nuclease improves the specificity of genome modification.Nat.Biotechnol.2014;32(6):577-82;全部内容通过引用并入本文)和(XP)n形式的更刚性的接头),以便实现胞苷或腺苷脱氨酶核碱基编辑器活性的最佳长度。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,接头包含(GGS)n基序,其中n是1、3或7。在一些实施方案中,本文提供的任何融合蛋白的胞苷脱氨酶或腺苷脱氨酶和Cas9结构域经由包含氨基酸序列SGSETPGTSESATPES(SEQ ID NO:249)的接头融合,所述接头也可以称为XTEN接头。
在一些实施方案中,碱基编辑器的结构域经由包含以下氨基酸序列的接头融合:
SGGSSGSETPGTSESATPESSGGS(SEQ ID NO:356)、
SGGSSGGSSGSETPGTSESATPESSGGSSGGS(SEQ ID NO:357)或
GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS(SEQ ID NO:358)。
在一些实施方案中,碱基编辑器的结构域经由包含氨基酸序列SGSETPGTSESATPES(SEQ ID NO:249)的接头融合,所述接头也可称为XTEN接头。在一些实施方案中,接头包含氨基酸序列SGGS。在一些实施方案中,接头长度为24个氨基酸。在一些实施方案中,接头包含氨基酸序列SGGSSGGSSGSETPGTSESATPES(SEQ ID NO:359)。在一些实施方案中,接头长度为40个氨基酸。在一些实施方案中,接头包含氨基酸序列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS(SEQ ID NO:360)。在一些实施方案中,接头长度为64个氨基酸。在一些实施方案中,接头包含氨基酸序列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS(SEQ ID NO:361)。在一些实施方案中,接头长度为92个氨基酸。在一些实施方案中,接头包含氨基酸序列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS(SEQ ID NO:362)。
在一些实施方案中,接头包含多个脯氨酸残基并且长度为5-21、5-14、5-9、5-7个氨基酸,例如,PAPAP(SEQ ID NO:363)、PAPAPA(SEQ ID NO:364)、PAPAPAP(SEQ ID NO:365)、PAPAPAPA(SEQ ID NO:366)、P(AP)4(SEQ ID NO:367)、P(AP)7(SEQ ID NO:368)、P(AP)10(SEQ ID NO:369)(参见,例如,Tan J,Zhang F,Karcher D,Bock R.Engineering ofhigh-precision base editors for site-specific single nucleotidereplacement.Nat Commun.2019 Jan 25;10(1):439;全部内容通过引用并入本文)。这种富含脯氨酸的接头也称为“刚性”接头。
在另一个实施方案中,碱基编辑器系统包含这样的组分(蛋白质),其与脱氨酶(DNA脱氨酶)(例如,腺苷或胞苷脱氨酶)非共价相互作用,并且将腺苷或胞苷脱氨酶短暂吸引至靶多核苷酸序列中的靶核碱基以进行特异性编辑,具有最小或减少的旁观者效应或邻靶效应(target-adjacent effect)。这种涉及脱氨酶相互作用蛋白的非共价系统和方法用于将DNA脱氨酶吸引至特定的基因组靶核碱基,并且解耦(decouple)在靶和邻靶编辑事件,从而增强更精确的单碱基取代突变的实现。在一个实施方案中,脱氨酶相互作用蛋白与脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)结合而不阻断或干扰脱氨酶的活性(催化)位点与靶核碱基(例如,分别地,腺苷或胞苷)结合。诸如称为“MagnEdit”的系统涉及与Cas9和gRNA复合物栓系的相互作用蛋白,并且可以吸引共表达的腺苷或胞苷脱氨酶(外源或内源)以编辑特定的基因组靶位点,并且在McCann,J.等人,2020,“MagnEdit–interacting factorsthat recruit DNA-editing enzymes to single base targets,”Life-Science-Alliance,第3卷,No.4(e201900606),(doi 10.26508/Isa.201900606)中描述,所述文献的内容通过引用整体并入本文。在一个实施方案中,DNA脱氨酶是如本文所述的腺苷脱氨酶变体(例如,TadA*8)。
在另一个实施方案中,称为“Suntag”的系统涉及非共价相互作用组分,所述组分用于将碱基编辑器的蛋白质(例如,腺苷脱氨酶或胞苷脱氨酶)组分或其多个拷贝募集至多核苷酸靶位点以实现所述位点处的碱基编辑,同时减少邻靶编辑,例如,如在Tanenbaum,M.E.等人,“A protein tagging system for signal amplification in gene expression and fluorescence imaging,”Cell.2014年10月23日;159(3):635–646.doi:10.1016/j.cell.2014.09.039;和在Huang,Y.-H.等人,2017,“DNA epigenome editing usingCRISPR-Cas SunTag-directed DNM T3A,”Genome Biol 18:176.doi:10.1186/s13059-017-1306-z中所述,所述文献各自的内容通过引用整体并入本文。在一个实施方案中,DNA脱氨酶是如本文所述的腺苷脱氨酶变体(例如,TadA*8)。
具有指导RNA的核酸可编程DNA结合蛋白
本文提供了用于在细胞中进行碱基编辑的组合物和方法。本文还提供了包含指导多核酸序列(例如,如本文所提供的指导RNA序列或2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个指导RNA的组合)的组合物。在一些实施方案中,如本文所提供的用于碱基编辑的组合物还包含编码碱基编辑器(例如,C-碱基编辑器或A-碱基编辑器)的多核苷酸。例如,用于碱基编辑的组合物可包含mRNA序列,其编码所提供的BE、BE4、ABE和一个或多个指导RNA的组合。用于碱基编辑的组合物可包含本文提供的碱基编辑器多肽和任何指导RNA中的一个或多个的组合。这种组合物可用于通过不同的递送方法(例如,电穿孔、核转染、病毒转导或转染)在细胞中实现碱基编辑。在一些实施方案中,用于碱基编辑的组合物包含mRNA序列,其编码本文提供的用于电穿孔的碱基编辑器和一个或多个指导RNA序列的组合。
本公开的一些方面提供了复合物,其包含本文提供的任何融合蛋白和结合至所述融合蛋白的核酸可编程DNA结合蛋白(napDNAbp)结构域(例如,Cas9(例如,dCas9、核酸酶活性Cas9或Cas9切口酶)或Cas12)的指导RNA。这些复合物也称为核糖核蛋白(RNP)。在一些实施方案中,指导核酸(例如,指导RNA)的长度为15-100个核苷酸并且包含与靶序列互补的至少10个连续核苷酸的序列。在一些实施方案中,指导RNA的长度是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施方案中,指导RNA包含与靶序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的序列。在一些实施方案中,靶序列是DNA序列。在一些实施方案中,靶序列是RNA序列。在一些实施方案中,靶序列是细菌、酵母、真菌、昆虫、植物或动物的基因组中的序列。在一些实施方案中,靶序列是人类基因组中的序列。在一些实施方案中,靶序列的3'端紧邻规范PAM序列(NGG)。在一些实施方案中,靶序列的3'端紧邻非规范PAM序列(例如,表7中列出的序列或5'-NAA-3')。在一些实施方案中,指导核酸(例如,指导RNA)与感兴趣的基因(例如,与疾病或病症相关的基因)中的序列互补。
本公开的一些方面提供了使用本文提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供了包括使DNA分子与本文提供的任何融合蛋白接触并且与至少一种指导RNA接触的方法,其中指导RNA的长度约为15-100个核苷酸,并且包含与靶序列互补的至少10个连续核苷酸的序列。在一些实施方案中,靶序列的3'端紧邻AGC、GAG、TTT、GTG或CAA序列。在一些实施方案中,靶序列的3'端紧邻NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN或5'(TTTV)序列。在一些实施方案中,靶序列的3'端紧邻例如TTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR或YTN PAM位点。
应当理解,相应序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如,在成熟蛋白质的前体和成熟蛋白质本身中不同,并且物种与物种之间的序列差异可能会影响编号。本领域技术人员将能够通过本领域众所周知的方法,例如通过同源残基的序列比对和测定,来鉴定任何同源蛋白质和相应编码核酸中的相应残基。
对于本领域技术人员将显而易见的是,为了将本文公开的任何融合蛋白靶向至靶位点,例如包含待编辑突变的位点,通常需要将融合蛋白与指导RNA一起共表达。如本文别处更详细解释的,指导RNA通常包含允许napDNAbp(例如,Cas9或Cas12)结合的tracrRNA框架和赋予napDNAbp:核酸编辑酶/结构域融合蛋白以序列特异性的指导序列。或者,指导RNA和tracrRNA可作为两个核酸分子分别提供。在一些实施方案中,指导RNA包含一种结构,其中指导序列包含与靶序列互补的序列。指导序列的长度通常为20个核苷酸。基于本公开,适合用于将napDNAbp:核酸编辑酶/结构域融合蛋白靶向至特定基因组靶位点的指导RNA的序列对于本领域技术人员将是显而易见的。此类合适的指导RNA序列通常包含与待编辑的靶核苷酸上游或下游50个核苷酸内的核酸序列互补的指导序列。本文提供了一些适合用于将所提供的任何融合蛋白靶向至特定靶序列的示例性指导RNA序列。
预测sgRNA的不同部分形成与Cas9(例如,SpyCas9)和/或DNA靶标相互作用的各种特征。已经在天然crRNA:tracrRNA双链体和引导Cas9核酸内切酶活性的单一指导RNA(sgRNA)内鉴定出六个保守模块(参见Briner等人,Guide RNA Functional ModulesDirect Cas9 Activity and Orthogonality Mol Cell.2014 Oct 23;56(2):333-339)。所述六个模块包括负责DNA靶向的间隔子、由CRISPR重复:tracrRNA双链体形成的上位茎、凸起、下位茎、来自tracrRNA的3'端的连结(nexus)和发夹。上位茎和下位茎主要通过与磷酸骨架的序列独立性相互作用与Cas9相互作用。在一些实施方案中,上位茎是非必要的。在一些实施方案中,下位茎基部处的保守尿嘧啶核苷酸序列是非必要的。凸起参与和Cas9的Rec1结构域的特定侧链相互作用。U44的核碱基与Tyr 325和His 328的侧链相互作用,而G43与Tyr 329相互作用。连结形成sgRNA:Cas9相互作用的核心,并且位于sgRNA与Cas9和靶DNA之间的交汇处。A51和A52的核碱基与Phe 1105的侧链相互作用;U56与Arg 457和Asn459相互作用;U59的核碱基插入到由Arg 74、Asn 77、Pro 475、Leu 455、Phe 446和Ile 448的侧链定义的疏水口袋中;C60与Leu 455、Ala 456和Asn 459相互作用,并且C61与Arg 70的侧链相互作用,Arg 70的侧链又与C15相互作用。在一些实施方案中,这些突变中的一个或多个在用于Cas9(例如,spyCas9)的sgRNA的凸起和/或连结中产生以优化sgRNA:Cas9相互作用。
此外,tracrRNA连结和发夹对于Cas9配对非常关键,并且可以交换以跨越分隔不同Cas9蛋白的正交性屏障,这有助于进一步利用正交Cas9蛋白。在一些实施方案中,连结和发夹交换以靶向正交Cas9蛋白。在一些实施方案中,sgRNA不含上位茎、发夹1和/或下位茎的序列柔性,以设计更紧凑且构象稳定的指导RNA。在一些实施方案中,使用具有各种嵌合指导的单一Cas9或通过同时使用具有嵌合sgRNA的不同组合的正交系统来修饰模块以优化多重编辑。关于指导功能模块及其方法的详细信息在例如Briner等人,Guide RNAFunctional Modules Direct Cas9 Activity and Orthogonality Mol Cell.2014年10月23日;56(2):333-339中描述,其内容通过引用整体并入本文。
本文公开的碱基编辑器的结构域可以按任何顺序排列。包含融合蛋白的碱基编辑器的非限制性实例可以排列如下,所述融合蛋白包含例如多核苷酸可编程核苷酸结合结构域(例如,Cas9或Cas12)和脱氨酶结构域(例如,胞苷或腺苷脱氨酶):
NH2-[核碱基编辑结构域]-接头1-[核碱基编辑结构域]-COOH;
NH2-[脱氨酶]-接头1-[核碱基编辑结构域]-COOH;
NH2-[脱氨酶]-接头1-[核碱基编辑结构域]-接头2-[UGI]-COOH;
NH2-[脱氨酶]-接头1-[核碱基编辑结构域]-COOH;
NH2-[腺苷脱氨酶]-接头1-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-[脱氨酶]-COOH;
NH2-[脱氨酶]-[核碱基编辑结构域]-[肌苷BER抑制剂]-COOH;
NH2-[脱氨酶]-[肌苷BER抑制剂]-[核碱基编辑结构域]-COOH;
NH2-[肌苷BER抑制剂]-[脱氨酶]-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-[脱氨酶]-[肌苷BER抑制剂]-COOH;
NH2-[核碱基编辑结构域]-[肌苷BER抑制剂]-[脱氨酶]-COOH;
NH2-[肌苷BER抑制剂]-[核碱基编辑结构域]-[脱氨酶]-COOH;
NH2-[核碱基编辑结构域]-接头1-[脱氨酶]-接头2-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-接头1-[脱氨酶]-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-[脱氨酶]-接头2-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-[脱氨酶]-[核碱基编辑结构域]-COOH;
NH2-[核碱基编辑结构域]-接头1-[脱氨酶]-接头2-[核碱基编辑结构域]-[肌苷BER抑制剂]-COOH;
NH2-[核碱基编辑结构域]-接头1-[脱氨酶]-[核碱基编辑结构域]-[肌苷BER抑制剂]-COOH;
NH2-[核碱基编辑结构域]-[脱氨酶]-接头2-[核碱基编辑结构域]-[肌苷BER抑制剂]-COOH;
NH2-[核碱基编辑结构域]-[脱氨酶]-[核碱基编辑结构域]-[肌苷BER抑制剂]-COOH;
NH2-[肌苷BER抑制剂]-[核碱基编辑结构域]-接头1-[脱氨酶]-接头2-[核碱基编辑结构域]-COOH;
NH2-[肌苷BER抑制剂]-[核碱基编辑结构域]-接头1-[脱氨酶]-[核碱基编辑结构域]-COOH;
NH2-[肌苷BER抑制剂]-[核碱基编辑结构域]-[脱氨酶]-接头2-[核碱基编辑结构域]-COOH;或
NH2-[肌苷BER抑制剂]NH2-[核碱基编辑结构域]-[脱氨酶]-[核碱基编辑结构域]-COOH。
在一些实施方案中,本文提供的碱基编辑融合蛋白需要定位在精确位置,例如,靶碱基位于定义区域(例如,“脱氨基窗口”)内的位置。在一些实施方案中,靶标可以在4个碱基的区域内。在一些实施方案中,这样的定义的靶区域可以位于PAM上游大约15个碱基。参见Komor,A.C.,等人,“Programmable editing of a target base in genomic DNAwithout double-stranded DNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.,等人,“Programmable base editing of A·T to G·C in genomic DNA without DNAcleavage”Nature 551,464-471(2017);和Komor,A.C.,等人,“Improved base excisionrepair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A baseeditors with higher efficiency and product purity”Science Advances 3:eaao4774(2017),所述文献的全部内容特此通过引用并入。
定义的靶区域可以是脱氨基窗口。脱氨基窗口可以是碱基编辑器作用于靶核苷酸并使其脱氨基的定义区域。在一些实施方案中,脱氨基窗口在2、3、4、5、6、7、8、9或10个碱基的区域内。在一些实施方案中,脱氨基窗口位于PAM上游5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基。
本公开的碱基编辑器可以包含促进靶多核苷酸序列编辑的任何结构域、特征或氨基酸序列。例如,在一些实施方案中,碱基编辑器包含核定位序列(NLS)。在一些实施方案中,碱基编辑器的NLS位于脱氨酶结构域与napDNAbp结构域之间。在一些实施方案中,碱基编辑器的NLS位于napDNAbp结构域的C末端。
可以包含在融合蛋白中的蛋白质结构域的非限制性实例包括脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶)、尿嘧啶糖基化酶抑制剂(UGI)结构域、表位标签、报告基因序列和/或具有本文所述的活性中的一种或多种的蛋白质结构域。
可以用表位标签、报告蛋白、其他结合结构域来检测或标记结构域。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的实例包括但不限于谷胱甘肽-5-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β-半乳糖苷酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和包括蓝色荧光蛋白(BFP)的自发荧光蛋白。额外的蛋白质序列可以包括结合DNA分子或结合其他细胞分子的氨基酸序列,包括但不限于麦芽糖结合蛋白(MBP)、S标签、Lex A DNA结合结构域(DBD)融合物、GAL4DNA结合结构域融合物、和单纯疱疹病毒(HSV)BP16蛋白融合物。
使用包含胞苷或腺苷脱氨酶和Cas9结构域的融合蛋白的方法
本公开的一些方面提供了使用本文提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供了包括使DNA分子与本文提供的任何融合蛋白接触,并且与本文所述的至少一种指导RNA接触的方法。
在一些实施方案中,本发明的融合蛋白用于编辑感兴趣的靶基因。特别地,本文所述的胞苷脱氨酶或腺苷脱氨酶核碱基编辑器能够在靶序列内产生多个突变。这些突变可能影响靶标的功能。例如,当使用胞苷脱氨酶或腺苷脱氨酶核碱基编辑器靶向调控区域时,调控区域的功能被改变,并且下游蛋白的表达减少或被消除。
应当理解,相应序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如,在成熟蛋白质的前体和成熟蛋白质本身中不同,并且物种与物种之间的序列差异可能会影响编号。本领域技术人员将能够通过本领域众所周知的方法,例如通过同源残基的序列比对和测定,来鉴定任何同源蛋白质和相应编码核酸中的相应残基。
对于本领域技术人员将显而易见的是,为了将如本文所公开的包含Cas9结构域和胞苷或腺苷脱氨酶的任何融合蛋白靶向至靶位点,例如包含待编辑突变的位点,通常需要将融合蛋白与指导RNA(例如,sgRNA)一起共表达。如本文别处更详细解释的,指导RNA通常包含允许Cas9结合的tracrRNA框架和赋予Cas9:核酸编辑酶/结构域融合蛋白以序列特异性的指导序列。或者,指导RNA和tracrRNA可作为两个核酸分子分别提供。在一些实施方案中,指导RNA包含一种结构,其中指导序列包含与靶序列互补的序列。指导序列的长度通常为20个核苷酸。基于本公开,适合用于将Cas9:核酸编辑酶/结构域融合蛋白靶向至特定基因组靶位点的指导RNA的序列对于本领域技术人员将是显而易见的。此类合适的指导RNA序列通常包含与待编辑的靶核苷酸上游或下游50个核苷酸内的核酸序列互补的指导序列。本文提供了一些适合用于将所提供的任何融合蛋白靶向至特定靶序列的示例性指导RNA序列。
碱基编辑器效率
在一些实施方案中,本文提供的方法的目的是经由基因编辑改变基因和/或基因产物。本文提供的核碱基编辑蛋白可以用于基于基因编辑的体外或体内人类疗法。技术人员将理解,本文提供的核碱基编辑蛋白,例如包含多核苷酸可编程核苷酸结合结构域(例如,Cas9)和核碱基编辑结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)的融合蛋白,可以用于将核苷酸从A编辑成G或从C编辑成T。
有利地,如本文所提供的碱基编辑系统提供基因组编辑而不生成双链DNA断裂,不需要供体DNA模板,并且不像CRISPR可能做的那样诱导过量的随机插入和缺失。在一些实施方案中,本公开提供了碱基编辑器,其在核酸(例如,受试者基因组内的核酸)中高效地生成预期突变,诸如终止密码子,而不生成大量非预期突变,诸如非预期的点突变。在一些实施方案中,预期突变是由特定碱基编辑器(例如,腺苷碱基编辑器或胞苷碱基编辑器)生成的突变,所述特定碱基编辑器与指导多核苷酸(例如,gRNA)结合,被特别设计以生成预期突变。在一些实施方案中,预期突变处于与疾病或病症(例如,T细胞或NK细胞恶性肿瘤)相关的靶抗原相关的基因中。在一些实施方案中,预期突变是与疾病或病症(例如,T细胞或NK细胞恶性肿瘤)相关的靶抗原相关的基因中的腺嘌呤(A)至鸟嘌呤(G)的点突变(例如,SNP)。在一些实施方案中,预期突变是基因的编码区或非编码区(例如,调控区域或元件)内的腺嘌呤(A)至鸟嘌呤(G)的点突变。在一些实施方案中,预期突变是与疾病或病症(例如,T细胞或NK细胞恶性肿瘤)相关的靶抗原相关的基因中的胞嘧啶(C)至胸腺嘧啶(T)的点突变(例如,SNP)。在一些实施方案中,预期突变是基因的编码区或非编码区(例如,调控区域或元件)内的胞嘧啶(C)至胸腺嘧啶(T)的点突变。在一些实施方案中,预期突变是生成终止密码子的点突变,例如基因编码区内的提前终止密码子。在一些实施方案中,预期突变是消除终止密码子的突变。
本发明的碱基编辑器有利地修饰了编码蛋白质的特定核苷酸碱基,而不生成显著比例的插入缺失。如本文所用,“插入缺失”是指核酸内的核苷酸碱基的插入或缺失。此类插入或缺失可以导致基因编码区内的移码突变。在一些实施方案中,期望生成在核酸内高效修饰(例如,使突变)特定核苷酸而不在核酸中生成大量插入或缺失(即,插入缺失)的碱基编辑器。在一些实施方案中,期望生成在核酸内高效修饰(例如,使突变或甲基化)特定核苷酸而不在核酸中生成大量插入或缺失(即,插入缺失)的碱基编辑器。在某些实施方案中,与插入缺失相比,本文提供的任何碱基编辑器可以生成更大比例的预期修饰(例如,甲基化)。在某些实施方案中,与插入缺失相比,本文提供的任何碱基编辑器可以生成更大比例的预期修饰(例如,突变)。
在一些实施方案中,本文提供的碱基编辑器能够生成大于1:1的预期突变与插入缺失比率(即,预期点突变:非预期点突变)。在一些实施方案中,本文提供的碱基编辑器能够生成至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少200:1、至少300:1、至少400:1、至少500:1、至少600:1、至少700:1、至少800:1、至少900:1或至少1000:1或更大的预期突变与插入缺失比率。可以使用任何合适的方法来确定预期突变和插入缺失的数量。
在一些实施方案中,本文提供的碱基编辑器可以限制核酸区域中插入缺失的形成。在一些实施方案中,所述区域在碱基编辑器靶向的核苷酸处,或者是碱基编辑器靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸内的区域。在一些实施方案中,本文提供的任何碱基编辑器可以将核酸区域处的插入缺失的形成限制为小于1%、小于1.5%、小于2%、小于2.5%、小于3%、小于3.5%、小于4%、小于4.5%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于12%、小于15%或小于20%。在核酸区域处形成的插入缺失的数量可取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方案中,插入缺失的数量或比例在将核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器后至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天确定。
本公开的一些方面基于以下认识,即本文提供的任何碱基编辑器都能够在核酸(例如,受试者基因组内的核酸)中高效地生成预期突变,而不生成大量非预期突变(例如,假脱靶编辑或旁观者编辑)。在一些实施方案中,预期突变是由特定碱基编辑器生成的突变,所述特定碱基编辑器与gRNA结合,被特别设计以生成预期突变。在一些实施方案中,预期突变是生成终止密码子的突变,例如基因编码区内的提前终止密码子。在一些实施方案中,预期突变是消除终止密码子的突变。在一些实施方案中,预期突变是改变基因剪接的突变。在一些实施方案中,预期突变是改变基因的调控序列(例如,基因启动子或基因抑制因子)的突变。在一些实施方案中,本文提供的任何碱基编辑器都能够生成大于1:1的预期突变与非预期突变比率(即,预期点突变:非预期点突变)。在一些实施方案中,本文提供的任何碱基编辑器都能够生成至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1或至少1000:1或更大的预期突变与非预期突变比率。应当理解,本文所述的碱基编辑器的特征可应用于本文提供的任何融合蛋白或使用融合蛋白的方法。
碱基编辑常被称为“修饰”,诸如遗传修饰、基因修饰和核酸序列修饰,并且基于上下文可以清楚地理解所述修饰是碱基编辑修饰。因此,碱基编辑修饰是核苷酸碱基水平的修饰,例如作为整篇本公开讨论的脱氨酶活性的结果,所述碱基编辑修饰然后导致基因序列的变化,并且可能影响基因产物。因此,实质上,本文所述的基因编辑修饰可在结构上和/或功能上导致基因修饰,其中基因产物的表达可被修饰,例如,基因的表达被敲除;或者相反,被增强,或者一些情况下,基因功能或活性可被修饰。使用本文公开的方法,可以将碱基编辑效率确定为其中执行碱基编辑的基因的敲低效率,其中碱基编辑旨在敲低基因的表达。可通过用任何检测测定确定表达水平来定量验证敲低水平,所述检测测定诸如例如通过流式细胞术的蛋白质表达水平测定;用于检测RNA表达的测定,诸如定量RT-PCR、northern印迹分析,或任何其他合适的测定,诸如焦磷酸测序;并且可通过核苷酸测序反应进行定性验证。
在一些实施方案中,修饰(例如,单碱基编辑)导致基因靶向表达减少至少10%。在一些实施方案中,碱基编辑效率可导致基因靶向表达减少至少10%。在一些实施方案中,碱基编辑效率可导致基因靶向表达减少至少20%。在一些实施方案中,碱基编辑效率可导致基因靶向表达减少至少30%。在一些实施方案中,碱基编辑效率可导致基因靶向表达减少至少40%。在一些实施方案中,碱基编辑效率可导致基因靶向表达减少至少50%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少60%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少70%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少80%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少90%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少91%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少92%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少93%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少94%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少95%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少96%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少97%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少98%。在一些实施方案中,碱基编辑效率可导致靶向基因表达减少至少99%。在一些实施方案中,碱基编辑效率可导致靶向基因的敲除(基因表达的100%敲低)。
在一些实施方案中,本文提供的任何碱基编辑器系统都导致靶多核苷酸序列中的小于50%、小于40%、小于30%、小于20%、小于19%、小于18%、小于17%、小于16%、小于15%、小于14%、小于13%、小于12%、小于11%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%、小于0.2%、小于0.1%、小于0.09%、小于0.08%、小于0.07%、小于0.06%、小于0.05%、小于0.04%、小于0.03%、小于0.02%或小于0.01%的插入缺失形成。
在一些实施方案中,靶向修饰(例如,单碱基编辑)用于同时靶向至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个不同的内源序列,以使用不同的指导RNA进行碱基编辑。在一些实施方案中,靶向修饰(例如,单碱基编辑)用于依次靶向至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个不同的内源基因序列,以使用不同的指导RNA进行碱基编辑。
本公开的一些方面基于以下认识,即本文提供的任何碱基编辑器都能够在核酸(例如,受试者基因组内的核酸)中高效地生成预期突变,诸如点突变,而不生成大量的非预期突变,诸如非预期点突变(即,旁观者突变)。在一些实施方案中,本文提供的任何碱基编辑器都能够生成至少0.01%的预期突变(即,至少0.01%的碱基编辑效率)。在一些实施方案中,本文提供的任何碱基编辑器都能够生成至少0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%或99%的预期突变。
在一些实施方案中,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都导致靶多核苷酸序列中的小于50%、小于40%、小于30%、小于20%、小于19%、小于18%、小于17%、小于16%、小于15%、小于14%、小于13%、小于12%、小于11%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%、小于0.2%、小于0.1%、小于0.09%、小于0.08%、小于0.07%、小于0.06%、小于0.05%、小于0.04%、小于0.03%、小于0.02%或小于0.01%的插入缺失形成。在一些实施方案中,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都导致靶多核苷酸序列中的小于0.8%的插入缺失形成。在一些实施方案中,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都导致靶多核苷酸序列中的至多0.8%的插入缺失形成。在一些实施方案中,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都导致靶多核苷酸序列中的小于0.3%的插入缺失形成。在一些实施方案中,与包含ABE7碱基编辑器之一的碱基编辑器系统相比,包含所描述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都导致靶多核苷酸序列中的较低的插入缺失形成。在一些实施方案中,与包含ABE7.10的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都导致靶多核苷酸序列中的较低的插入缺失形成。
在一些实施方案中,与包含ABE7碱基编辑器之一的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都具有插入缺失频率的降低。在一些实施方案中,与包含ABE7碱基编辑器之一的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都具有插入缺失频率的至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的降低。在一些实施方案中,与包含ABE7.10的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的碱基编辑器系统具有插入缺失频率的至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的降低。
本发明提供了具有增加的效率和特异性的腺苷脱氨酶变体(例如,ABE8变体)。特别地,本文所述的腺苷脱氨酶变体更有可能在多核苷酸内编辑期望的碱基,并且不太可能编辑不预期改变的碱基(例如,“旁观者”)。
在一些实施方案中,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑系统都具有减少的旁观者编辑或突变。在一些实施方案中,非预期的编辑或突变是旁观者突变或旁观者编辑,例如,靶核苷酸序列的靶窗口中的非预期或非靶标位置中的靶碱基(例如,A或C)的碱基编辑。在一些实施方案中,与包含ABE7碱基编辑器(例如,ABE7.10)的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑系统都具有减少的旁观者编辑或突变。在一些实施方案中,与包含ABE7碱基编辑器(例如,ABE7.10)的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑系统都具有减少至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的旁观者编辑或突变。在一些实施方案中,与包含ABE7碱基编辑器(例如,ABE7.10)的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑系统都具有减少至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3.0倍的旁观者编辑或突变。
在一些实施方案中,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑系统都具有减少的假编辑。在一些实施方案中,非预期编辑或突变是假突变或假编辑,例如,基因组的非预期或非靶标区域中的靶碱基(例如,A或C)的非特异性编辑或指导独立性编辑。在一些实施方案中,与包含ABE7碱基编辑器(例如,ABE7.10)的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑系统都具有减少的假编辑。在一些实施方案中,与包含ABE7碱基编辑器(例如,ABE7.10)的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑系统都具有减少至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的假编辑。在一些实施方案中,与包含ABE7碱基编辑器(例如,ABE7.10)的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑系统都具有减少至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3.0倍的假编辑。
在一些实施方案中,本文所述的任何ABE8碱基编辑器变体都具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的碱基编辑效率。在一些实施方案中,碱基编辑效率可通过计算细胞群中编辑的核碱基的百分比来测量。在一些实施方案中,如通过细胞群中编辑的核碱基测量的,本文所述的任何ABE8碱基编辑器变体都具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的碱基编辑效率。
在一些实施方案中,与ABE7碱基编辑器相比,本文所述的任何ABE8碱基编辑器变体都具有更高的碱基编辑效率。在一些实施方案中,与ABE7碱基编辑器(例如,ABE7.10)相比,本文所述的任何ABE8碱基编辑器变体都具有高至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%的碱基编辑效率。
在一些实施方案中,与ABE7碱基编辑器(例如,ABE7.10)相比,本文所述的任何ABE8碱基编辑器变体都具有高至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍的碱基编辑效率。
在一些实施方案中,本文所述的任何ABE8碱基编辑器变体都具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的在靶碱基编辑效率。在一些实施方案中,如通过细胞群中编辑的靶核碱基测量的,本文所述的任何ABE8碱基编辑器变体都具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的在靶碱基编辑效率。
在一些实施方案中,与ABE7碱基编辑器相比,本文所述的任何ABE8碱基编辑器变体都具有更高的在靶碱基编辑效率。在一些实施方案中,与ABE7碱基编辑器(例如,ABE7.10)相比,本文所述的任何ABE8碱基编辑器变体都具有高至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%的在靶碱基编辑效率。
在一些实施方案中,与ABE7碱基编辑器(例如,ABE7.10)相比,本文所述的任何ABE8碱基编辑器变体都具有高至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍的在靶碱基编辑效率。
本文所述的ABE8碱基编辑器变体可经由质粒、载体、LNP复合物或mRNA递送至宿主细胞。在一些实施方案中,本文所述的任何ABE8碱基编辑器变体作为mRNA递送至宿主细胞。在一些实施方案中,如通过编辑的核碱基测量的,经由基于核酸的递送系统(例如,mRNA)递送的ABE8碱基编辑器具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的在靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送的ABE8碱基编辑器相比,通过mRNA系统递送的ABE8碱基编辑器具有更高的碱基编辑效率。在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体都具有高至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%的在靶编辑效率。在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体都具有高至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍的在靶编辑效率。
在一些实施方案中,包含本文所述的ABE8碱基编辑器变体之一的任何碱基编辑器系统都导致靶多核苷酸序列中的小于50%、小于40%、小于30%、小于20%、小于19%、小于18%、小于17%、小于16%、小于15%、小于14%、小于13%、小于12%、小于11%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%、小于0.2%、小于0.1%、小于0.09%、小于0.08%、小于0.07%、小于0.06%、小于0.05%、小于0.04%、小于0.03%、小于0.02%或小于0.01%的脱靶编辑。
在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体都具有较低的指导脱靶编辑效率。在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体都具有低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的指导脱靶编辑效率。在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体都具有低至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3.0倍的指导脱靶编辑效率。在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体的指导脱靶编辑效率都减少至少约2.2倍。
在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体都具有较低的指导独立性脱靶编辑效率。在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体都具有低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的指导独立性脱靶编辑效率。在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的任何ABE8碱基编辑器变体都具有低至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少5.0倍、至少10.0倍、至少20.0倍、至少50.0倍、至少70.0倍、至少100.0倍、至少120.0倍、至少130.0倍或至少150.0倍的指导独立性脱靶编辑效率。在一些实施方案中,与当通过质粒或载体系统递送时相比,当通过mRNA系统递送时,本文所述的ABE8碱基编辑器变体的指导独立性脱靶编辑效率(例如,假RNA脱氨基)减少134.0倍。在一些实施方案中,本文所述的ABE8碱基编辑器变体不增加整个基因组的指导独立性突变率。
在一些实施方案中,单个基因递送事件(例如,通过转导、转染、电穿孔或任何其他方法)可以用于靶向细胞基因组内5个序列的碱基编辑。在一些实施方案中,单个基因递送事件可以用于靶向细胞基因组内6个序列的碱基编辑。在一些实施方案中,单个基因递送事件可以用于靶向细胞基因组内7个序列的碱基编辑。在一些实施方案中,单个电穿孔事件可以用于靶向细胞基因组内8个序列的碱基编辑。在一些实施方案中,单个基因递送事件可以用于靶向细胞基因组内9个序列的碱基编辑。在一些实施方案中,单个基因递送事件可以用于靶向细胞基因组内10个序列的碱基编辑。在一些实施方案中,单个基因递送事件可以用于靶向细胞基因组内20个序列的碱基编辑。在一些实施方案中,单个基因递送事件可以用于靶向细胞基因组内30个序列的碱基编辑。在一些实施方案中,单个基因递送事件可以用于靶向细胞基因组内40个序列的碱基编辑。在一些实施方案中,单个基因递送事件可以用于靶向细胞基因组内50个序列的碱基编辑。
在一些实施方案中,本文所述的方法(例如,碱基编辑方法)具有最小脱靶效应至不具有脱靶效应。
在一些实施方案中,本文所述的碱基编辑方法导致至少50%的细胞群已被成功编辑(即,细胞已被成功工程改造)。在一些实施方案中,本文所述的碱基编辑方法导致至少55%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少60%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少65%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少70%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少75%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少80%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少85%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少90%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少95%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的细胞群已被成功编辑。
在一些实施方案中,碱基编辑干预后的活细胞恢复大于碱基编辑事件发生时起始细胞群的至少60%、70%、80%、90%。在一些实施方案中,如上所述的活细胞恢复为约70%。在一些实施方案中,如上所述的活细胞恢复为约75%。在一些实施方案中,如上所述的活细胞恢复为约80%。在一些实施方案中,如上所述的活细胞恢复为约85%。在一些实施方案中,如上所述的活细胞恢复为碱基编辑事件发生时群中细胞的约90%或约91%、92%、93%、94%、95%、96%、97%、98%或99%或100%。
在一些实施方案中,工程化细胞群可以在体外进一步扩增约2倍、约3倍、约4倍、约5倍、约6倍、约7倍、约8倍、约9倍、约10倍、约15倍、约20倍、约25倍、约30倍、约35倍、约40倍、约45倍、约50倍或约100倍。
可以使用任何合适的方法来确定预期突变和插入缺失的数量,例如,如在国际PCT申请号PCT/2017/045381(WO2018/027078)和PC T/US2016/058344(WO2017/070632);Komor,A.C.,等人,“Program mable editing of a target base in genomic DNAwithout double-stra nded DNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.,等人,“Programmable base editing of A·T to G·C in genomic DNA without DNAcleavage”Nature 551,464-471(2017);和Kom or,A.C.,等人,“Improved base excisionrepair inhibition and bacter iophage Mu Gam protein yields C:G-to-T:A baseeditors with highe r efficiency and product purity”Science Advances 3:eaao4774(2017)中所述;所述文献的全部内容特此通过引用并入。
在一些实施方案中,为了计算插入缺失频率,扫描测序读数以获得与两个10-bp序列的精确匹配,这两个10-bp序列侧接在可以发生插入缺失的窗口的两侧。如果未定位到精确匹配,则将读数从分析中排除。如果这种插入缺失窗口的长度与参考序列精确匹配,则将读数归类为不含有插入缺失。如果插入缺失窗口比参考序列长或短两个或更多个碱基,则将测序读数分别归类为插入或缺失。在一些实施方案中,本文提供的碱基编辑器可以限制核酸区域中插入缺失的形成。在一些实施方案中,所述区域在碱基编辑器靶向的核苷酸处,或者是碱基编辑器靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸内的区域。
在靶核苷酸区域形成的插入缺失的数量可以取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方案中,插入缺失的数量或比例在将靶核苷酸序列(例如,细胞基因组内的核酸)暴露于碱基编辑器后至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天确定。应当理解,如本文所述的碱基编辑器的特征可以应用于本文提供的任何融合蛋白或使用融合蛋白的方法。
碱基编辑器效率的详细信息在国际PCT申请号PCT/2017/045381(WO 2018/027078)和PCT/US2016/058344(WO 2017/070632)中描述,所述申请各自通过引用整体并入本文。也参见Komor,A.C.,等人,“Programmable editing of a target base in genomicDNA without double-stranded DNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.等人,“Programmable base editing of A·T to G·C in genomic DNA withoutDNA cleavage”Nature 551,464-471(2017);和Komor,A.C.,等人,“Improved baseexcision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:Abase editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017),所述文献的全部内容特此通过引用并入。在一些实施方案中,使用本文提供的方法编辑一个或多个基因中的多个核碱基对导致至少一个预期突变的形成。在一些实施方案中,所述至少一个预期突变的所述形成导致基因正常功能的破坏。在一些实施方案中,所述至少一个预期突变的所述形成减少或消除由基因编码的蛋白质的表达。应当理解,可以使用本文提供的任何方法或方法组合来完成多重编辑。
多重编辑
在一些实施方案中,本文提供的碱基编辑器系统能够对一个或多个基因或多核苷酸序列中的多个核碱基对进行多重编辑。在一些实施方案中,多个核碱基对位于同一基因中或一个或多个基因中,其中至少一个基因位于不同的基因座中。在一些实施方案中,多重编辑可以包含一种或多种指导多核苷酸。在一些实施方案中,多重编辑可以包含一种或多种碱基编辑器系统。在一些实施方案中,多重编辑可以包含一种或多种具有单一指导多核苷酸或多种指导多核苷酸的碱基编辑器系统。在一些实施方案中,多重编辑可以包含具有单一碱基编辑器系统的一种或多种指导多核苷酸。在一些实施方案中,多重编辑可以包含至少一种指导多核苷酸,所述指导多核苷酸需要或不需要PAM序列来靶向结合靶多核苷酸序列。在一些实施方案中,多重编辑可以包含至少一种不需要PAM序列来靶向结合靶多核苷酸序列的指导多核苷酸和至少一种需要PAM序列来靶向结合靶多核苷酸序列的指导多核苷酸的混合物。应当理解,使用如本文所述的任何碱基编辑器进行的多重编辑的特征可以应用于使用本文提供的任何碱基编辑器的方法的任何组合。还应当理解,使用如本文所述的任何碱基编辑器进行的多重编辑可以包含多个核碱基对的依次编辑。
在一些实施方案中,多个核碱基对在一个或多个基因中。在一些实施方案中,多个核碱基对在同一基因中。在一些实施方案中,一个或多个基因中的至少一个基因位于不同的基因座中。
在一些实施方案中,编辑是在至少一个蛋白质编码区中、在至少一个蛋白质非编码区中、或在至少一个蛋白质编码区和至少一个蛋白质非编码区中的多个核碱基对的编辑。
在一些实施方案中,编辑与一种或多种指导多核苷酸结合。在一些实施方案中,所述碱基编辑器系统可以包含一种或多种碱基编辑器系统。在一些实施方案中,碱基编辑器系统可以包含一种或多种与单一指导多核苷酸或多种指导多核苷酸结合的碱基编辑器系统。在一些实施方案中,编辑与具有单一碱基编辑器系统的一种或多种指导多核苷酸结合。在一些实施方案中,编辑与至少一种不需要PAM序列来靶向结合靶多核苷酸序列的指导多核苷酸结合,或者与至少一种需要PAM序列来靶向结合靶多核苷酸序列的指导多核苷酸结合,或者与至少一种不需要PAM序列来靶向结合靶多核苷酸序列的指导多核苷酸和至少一种需要PAM序列来靶向结合靶多核苷酸序列的指导多核苷酸的混合物结合。应当理解,使用如本文所述的任何碱基编辑器进行的多重编辑的特征可以应用于使用本文提供的任何碱基编辑器的方法的任何组合。还应当理解,编辑可以包含多个核碱基对的依次编辑。
在一些实施方案中,能够多重编辑一个或多个基因中的多个核碱基对的碱基编辑器系统包含ABE7、ABE8和/或ABE9碱基编辑器之一。在一些实施方案中,与包含ABE7碱基编辑器之一的能够多重编辑的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的能够多重编辑的碱基编辑器系统具有更高的多重编辑效率。在一些实施方案中,与包含ABE7碱基编辑器之一的能够多重编辑的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的能够多重编辑的碱基编辑器系统具有高至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%的多重编辑效率。在一些实施方案中,与包含ABE7碱基编辑器之一的能够多重编辑的碱基编辑器系统相比,包含本文所述的ABE8碱基编辑器变体之一的能够多重编辑的碱基编辑器系统具有高至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少4.0倍、至少4.5倍、至少5.0倍、至少5.5倍或至少6.0倍的多重编辑效率。
嵌合抗原受体和CAR-T细胞
本发明提供了使用本文所述的核碱基编辑器修饰的表达嵌合抗原受体(CAR)的免疫细胞。修饰免疫细胞以表达嵌合抗原受体可以增强免疫细胞的免疫反应活性,其中嵌合抗原受体对抗原上的表位具有亲和力,其中抗原与生物体的改变的健康有关。例如,嵌合抗原受体可以对肿瘤细胞中表达的蛋白质上的表位具有亲和力。因为CAR-T细胞可以独立于主要组织相容性复合物(MHC)发挥作用,所以激活的CAR-T细胞可以杀伤表达抗原的肿瘤细胞。CAR-T细胞的直接作用逃避了肿瘤细胞防御机制,所述防御机制已经响应于MHC呈递抗原至免疫细胞而发生进化。
然而,与肿瘤细胞相关的靶抗原也可在健康免疫细胞上表达。因此,激活的CAR-T细胞不仅杀伤表达靶抗原的肿瘤细胞,还杀伤同样表达靶抗原的健康免疫细胞。为了防止免疫细胞的这种自相残杀或自我杀伤,本发明提供了一种CAR-T,所述CAR-T已使用核碱基编辑器进行修饰,以减少或消除靶抗原(例如,CD2)的表达,从而提供自相残杀抗性。在一些实施方案中,本发明提供了一种抗自相残杀的修饰的免疫效应细胞,其表达嵌合抗原受体以靶向肿瘤细胞。
一些实施方案包含自体免疫细胞免疫疗法,其中免疫细胞获自患有疾病或健康改变的受试者,所述患有疾病或健康改变的特征在于表达表面标志物的癌细胞或以其他方式改变的细胞。对获得的免疫细胞进行遗传修饰以表达嵌合抗原受体,并且有效地针对特定抗原重定向。因此,在一些实施方案中,免疫细胞从需要CAR-T免疫疗法的受试者获得。在一些实施方案中,在从受试者获得这些自体免疫细胞后不久,对它们进行培养和修饰。在其他实施方案中,获得自体细胞然后储存以供将来使用。对于可能正在接受未来将减少免疫细胞计数的平行治疗的个体,这种实践可能是可取的。在同种异体免疫细胞免疫疗法中,免疫细胞可以从除将接受治疗的受试者外的供体获得。在一些实施方案中,免疫细胞从健康受试者或供体获得,并且对免疫细胞进行遗传修饰以表达嵌合抗原受体,并且有效地针对特定抗原重定向。将经修饰以表达嵌合抗原受体后的免疫细胞施用于受试者以治疗瘤形成(例如,T细胞或NK细胞恶性肿瘤)。在一些实施方案中,待修饰以表达嵌合抗原受体的免疫细胞可以从预先存在的免疫细胞储存培养物中获得。
免疫细胞和/或免疫效应细胞可以使用本领域已知的标准技术从收集自受试者或供体的样品中分离或纯化。例如,可以通过裂解红细胞并通过离心去除外周单核血细胞来从全血样品中分离或纯化免疫效应细胞。免疫效应细胞可以使用选择性纯化方法进一步分离或纯化,所述方法基于细胞特异性标志物(诸如CD25、CD3、CD4、CD8、CD28、CD45RA或CD45RO)来分离免疫效应细胞。在一个实施方案中,CD4+用作选择T细胞的标志物。在一个实施方案中,CD8+用作选择T细胞的标志物。在一个实施方案中,CD4+和CD8+用作选择调节性T细胞的标志物。
在另一个实施方案中,本发明提供了在负责TCRαβ表面表达的TCR恒定区(TRAC)具有靶向基因敲除的T细胞。TCRαβ缺陷型CAR T细胞与同种异体免疫疗法相容(Qasim等人,Sci.Transl.Med.9,eaaj2013(2017);Valton等人,Mol Ther.2015Sep;23(9):1507–1518)。如果需要,使用CliniMACS磁珠消耗来去除残留的TCRαβT细胞,以最大限度地降低GVHD的风险。在另一个实施方案中,本发明提供了经离体选择以识别受体造血细胞上表达的次要组织相容性抗原的供体T细胞,从而最大限度地降低移植物抗宿主病(GVHD)的风险,移植物抗宿主病是移植后发病率和死亡率的主要原因(Warren等人,Blood 2010;115(19):3869-3878)。另一种用于分离或纯化免疫效应细胞的技术是流式细胞术。在荧光激活细胞分选中,使用对免疫效应细胞标志物具有亲和力的荧光标记抗体来标记样品中的免疫效应细胞。使用适用于表达标志物的细胞的设门策略来分离细胞。例如,可以通过使用例如对免疫效应细胞标志物(例如,CD4、CD8、CD28、CD45)具有特异性的荧光标记抗体和对应的设门策略从样品中的其他细胞中分离T淋巴细胞。在一个实施方案中,采用了CD4设门策略。在一个实施方案中,采用了CD8设门策略。在一个实施方案中,采用了CD4和CD8设门策略。在一些实施方案中,采用对免疫效应细胞具有特异性的其他标志物的设门策略来代替CD4和/或CD8设门策略,或与CD4和/或CD8设门策略的组合。
本发明中考虑的免疫效应细胞是效应T细胞。在一些实施方案中,效应T细胞是幼稚CD8+T细胞、细胞毒性T细胞、自然杀伤T(NKT)细胞、自然杀伤(NK)细胞或调节性T(Treg)细胞。在一些实施方案中,效应T细胞是胸腺细胞、未成熟T淋巴细胞、成熟T淋巴细胞、静息T淋巴细胞或激活的T淋巴细胞。在一些实施方案中,免疫效应细胞是CD4+CD8+T细胞或CD4-CD8-T细胞。在一些实施方案中,免疫效应细胞是辅助T细胞。在一些实施方案中,辅助T细胞是辅助T细胞1(Th1)、辅助T细胞2(Th2)或表达CD4的辅助T细胞(CD4+T细胞)。在一些实施方案中,免疫效应细胞是效应NK细胞。在一些实施方案中,免疫效应细胞是任何其他T细胞亚群。除了嵌合抗原受体之外,修饰的免疫效应细胞还可表达外源细胞因子、不同的嵌合受体或将增强免疫效应细胞信号传导或功能的任何其他剂。例如,嵌合抗原受体和细胞因子的共表达可增强CAR-T细胞裂解靶细胞的能力。
如本发明中所考虑的嵌合抗原受体包含细胞外结合结构域、跨膜结构域和细胞内结构域。抗原与细胞外结合结构域的结合可以激活CAR-T细胞并生成效应反应,其包括CAR-T细胞增殖、细胞因子产生和导致抗原表达细胞死亡的其他过程。在本发明的一些实施方案中,嵌合抗原受体还包含接头。在一些实施方案中,接头是(GGGGS)n接头(SEQ ID NO:247)。在一些实施方案中,接头是(GGGGS)3接头(SEQ ID NO:381)。在一些实施方案中,本发明的CAR包括前导肽序列(例如,抗原结合结构域的N末端)。示例性前导肽氨基酸序列是:METDTLLLWVLLLWVPGSTG(SEQ ID NO:753)。
在各种实施方案中,CAR-T特异性靶向CD2。示例性抗CD2 CAR包括但不限于UCART-2(Wugen Inc.)。以下提供了示例性CAR氨基酸序列:
>pCAR_BTx118(大鼠_LO-CD2a_VL-VH-CD2-3z)
>pCAR_BTx120(大鼠LO-CD2a VH-VL-CD2-3z)
/>
>pCAR BTx122(HuLO CD2a VL-HuLO-CD2a VH-CD2-3z)
>pCAR_BTx124(HuLO-CD2a VH-HuLO CD2a VL-CD2-3z)
>pCAR_BTx126(HuLO-CD2a VL-MEDI-507 VH-CD2-3z)
>pCAR_BTx128(MEDI-507 VH-HuLO-CD2a-CD2-3z)
>pCAR_BTx119(大鼠LO-CD2a VL-VH-CD28-3z)
>pCAR_BTx121(大鼠LO-CD2a VH-VL-CD28-3z)
>pCAR_BTx123(HuLO CD2a VL-HuLO-CD2a VH-CD28-3z)
>pCAR_BTx125(HuLO-CD2a VH-HuLO CD2a VL-CD28-3z)
>pCAR_BTx127(HuLO-CD2a VL-MEDI-507 VH-CD28-3z)
>pCAR_BTx129(MEDI-507 VH-HuLO-CD2a-CD28-3z)
/>
在上述序列中,星号(*)表示终止密码子,粗体序列表示抗CD2 scFv序列,下划线序列表示信号肽,双下划线序列表示CD8α跨膜结构域,斜体序列表示CD2细胞质信号传导结构域或共刺激结构域,纯文本序列表示CD28细胞质信号传导结构域或共刺激结构域,并且虚线下划线序列表示CD3ζ功能结构域或TCR信号传导结构域。在各种实施方案中,CAR特异性结合CD5。示例性抗CD5 CAR包括但不限于CD5CAR (iCell Gene Therapeutics)。在各种实施方案中,CAR特异性结合CD7。示例性抗CD7 CAR包括但不限于CAR-pNK(PersonGenBiomedicine (Suzhou) Co Ltd)和CD7.CAR/28ζ CAR T细胞(Baylor College ofMedicine)、UCART7 (Washington University in St Louis)。
在各种实施方案中,CAR-T细胞具有低水平的基底信号传导。在实施方案中,基底信号传导是参考细胞中的基底信号传导的约或小于约10、9、8、7、6、5、4、3、2、0.5或0.1倍。参考细胞的非限制性实例是不表达CAR的T细胞或表达参考CAR的T细胞。
本文还提供了编码本文所述的嵌合抗原受体的核酸。在一些实施方案中,核酸是分离的或纯化的。可以使用本领域已知的方法来完成核酸的离体递送。例如,可以用编码嵌合抗原受体的核酸载体转化从受试者获得的免疫细胞。载体然后可用于转化受体免疫细胞,使得这些细胞然后将表达嵌合抗原受体。转化免疫细胞的高效方法包括转染和转导。此类方法是本领域众所周知的。例如,用于递送编码嵌合抗原受体的核酸分子(和编码碱基编辑器的一种或多种核酸)的适用方法可见于国际申请号PCT/US2009/040040和美国专利号8,450,112;9,132,153;和9,669,058,其各自整体并入本文。此外,本文所述的用于递送编码碱基编辑器的核酸的那些方法和载体适用于递送编码嵌合抗原受体的核酸。
在实施方案中,用编码本公开的嵌合抗原受体(CAR)的多核苷酸(例如,上文列出的那些)转导的细胞群中的约或至少约10%、20%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%表面表达CAR。
本发明的一些方面提供了包含嵌合抗原和改变的内源基因的免疫细胞,所述改变的内源基因提供自相残杀抗性、增强免疫细胞功能、对免疫抑制(immunosuppression)或抑制(inhibition)的抗性或其组合。在一些实施方案中,改变的内源基因可通过碱基编辑产生。在一些实施方案中,碱基编辑可减少或减弱基因表达。在一些实施方案中,碱基编辑可减少或减弱基因激活。在一些实施方案中,碱基编辑可减少或减弱基因产物的功能性。在一些其他实施方案中,碱基编辑可激活或增强基因表达。在一些实施方案中,碱基编辑可增加基因产物的功能性。在一些实施方案中,改变的内源基因可在外显子、内含子、外显子-内含子结(exon-intron injunction)或其调控元件中被修饰或编辑。修饰可以是对基因或其调控元件中的单个核碱基进行编辑。修饰可以在外显子、多于一个外显子、内含子、或多于一个内含子或其组合中。修饰可以在基因的开放阅读框中。修饰可以在基因的非翻译区,例如3'-UTR或5'-UTR。在一些实施方案中,修饰在内源基因的调控元件中。在一些实施方案中,修饰在启动子、增强子、操纵子、沉默子、绝缘子、终止子、转录起始序列、翻译起始序列(例如,Kozak序列)或其任何组合中。
表达内源免疫细胞受体以及嵌合抗原受体的同种异体免疫细胞可识别并攻击宿主细胞,这种情况称为移植物抗宿主病(GVHD)。免疫细胞受体复合物的α组分由TRAC基因编码,并且在一些实施方案中,编辑这个基因,使得TCR复合物的α亚基无功能或不存在。因为这种亚基是内源免疫细胞信号传导所必需的,所以编辑这个基因可以降低由同种异体免疫细胞引起的移植物抗宿主病的风险。
在本发明的一些实施方案中,在CAR-T细胞中编辑PDCD1基因以敲除或敲低表达。PDCD1基因编码细胞表面受体PD-1,PD-1是免疫细胞中表达的免疫系统检查点,并且其通过促进抗原特异性免疫细胞的凋亡参与降低自身免疫。通过敲除或敲低PDCD1基因的表达,修饰的CAR-T细胞不太可能凋亡,更可能增殖,并且可以逃避程序性细胞死亡免疫检查点。在一些实施方案中,在转化细胞以表达嵌合抗原受体之前,免疫细胞中可能发生提供自相残杀抗性、增强免疫细胞功能或减少免疫抑制(immunosuppression)或抑制(inhibition)的基因编辑。在其他方面,即在已经转化免疫细胞以表达嵌合抗原受体之后,CAR-T细胞中可能发生提供自相残杀抗性、增强免疫细胞功能或减少免疫抑制(immunosuppression)或抑制(inhibition)的基因编辑。
在本发明的一些实施方案中,在CAR-T细胞中编辑CD2基因以敲除或敲低表达。然后转化CAR-T以表达具有CD2共刺激结构域的嵌合抗原受体。通过敲除或敲低CD2基因的表达,修饰的CAR-T细胞不太可能发生自相残杀。
在一些实施方案中,免疫细胞可包含嵌合抗原受体(CAR)和一个或多个编辑的基因、其一个或多个调控元件或其组合,其中编辑的基因的表达被敲除或敲低。在一些实施方案中,所述CAR-T细胞与类似但不进一步具有如本文所述的一个或多个编辑的基因的CAR-T细胞相比,具有增加的自相残杀抗性。在一些实施方案中,所述CAR-T细胞与类似但不进一步具有如本文所述的一个或多个编辑的基因的CAR-T细胞相比,具有降低的免疫原性。在一些实施方案中,所述CAR-T细胞与类似但不进一步具有如本文所述的一个或多个编辑的基因的CAR-T相比,具有较低的激活阈值。在一些实施方案中,所述CAR-T细胞与类似但不进一步具有如本文所述的一个或多个编辑的基因的CAR-T细胞相比,具有增加的抗瘤形成活性。可通过碱基编辑来编辑一个或多个基因。在一些实施方案中,一个或多个基因或其一个或多个调控元件或其组合可选自由以下组成的组:CD2抗原(CD2);CD3抗原(CD3);CD5抗原(CD5);CD7抗原(CD7);CD52抗原(CD52);T细胞受体α恒定(TRAC);和程序性细胞死亡1(PDCD1或PD-1)。在一些实施方案中,编辑CD2、CD5或CD7。在一些实施方案中,编辑CD2、CD5或CD7与CD3、CD52、TRAC和/或PD-1中的一个或多个的组合。
在一些实施方案中,免疫细胞包含嵌合抗原受体和一个或多个编辑的基因、其调控元件或其组合。编辑的基因可以是免疫反应调控基因、免疫原性基因、检查点抑制基因、参与免疫反应的基因、细胞表面标志物(例如,T细胞表面标志物)、或其任何组合。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的基因,所述编辑的基因与激活的T细胞增殖、α-βT细胞激活、γ-δT细胞激活、T细胞增殖的正调控、辅助T细胞增殖或分化的负调控、或其调控元件、或其组合相关。在一些实施方案中,编辑的基因可以是检查点抑制基因,例如像PD1基因、PDC1基因,或者与其形成或激活的途径相关或调控所述途径的成员。
在一些实施方案中,本文提供了具有编辑的TRAC基因的免疫细胞(其中,TRAC基因可包含一个、两个、三个、四个、五个、六个、七个八个、九个、十个或更多个碱基编辑),使得免疫细胞不表达内源功能性T细胞受体α链。在一些实施方案中,免疫细胞是表达嵌合抗原受体的T细胞(CAR-T细胞)。在一些实施方案中,本文提供了在TRAC基因中具有碱基编辑的CAR-T细胞,使得CAR-T细胞具有减少的或可忽略的或没有内源T细胞受体α蛋白的表达。
在一些实施方案中,免疫细胞包含编辑的CD2基因,并且额外包含至少一个编辑的基因。在一些实施方案中,免疫细胞包含编辑的CD5基因,并且额外包含至少一个编辑的基因。在一些实施方案中,免疫细胞包含编辑的CD7基因,并且额外包含至少一个编辑的基因。至少一个编辑的基因可选自前述段落中提及的基因列表。
在一个实施方案中,免疫细胞可包含编辑的CD2基因、编辑的PD-1基因、编辑的CD52基因、编辑的TRAC基因或其任何组合,其中编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含编辑的CD2基因、编辑的PD-1基因、编辑的CD52基因和编辑的TRAC基因,其中编辑的基因的表达被敲除或敲低。
在一个实施方案中,免疫细胞可包含编辑的CD5基因、编辑的PD-1基因、编辑的CD52基因、编辑的TRAC基因或其任何组合,其中编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含编辑的CD5基因、编辑的PD-1基因、编辑的CD52基因和编辑的TRAC基因,其中编辑的基因的表达被敲除或敲低。
在一个实施方案中,免疫细胞可包含编辑的CD7基因和编辑的CD3基因、编辑的PD-1基因、编辑的CD52基因、编辑的TRAC基因或其任何组合,其中编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含编辑的CD7基因、编辑的PD-1基因、编辑的CD52基因和编辑的CD3基因,其中编辑的基因的表达被敲除或敲低。
在一些实施方案中,本文提供了具有编辑的CIITA基因的免疫细胞,使得免疫细胞不表达内源功能性II类主要组织相容性复合物反式激活因子。在一些实施方案中,本文提供了具有编辑的CIITA基因的CAR-T细胞,使得CAR-T细胞表现出减少的或可忽略的或不表现出内源II类主要组织相容性复合物反式激活因子的表达。
在一些实施方案中,本文提供了具有编辑的TRBC1或TRBC2基因的免疫细胞,使得免疫细胞不表达内源功能性T细胞受体β链。在一些实施方案中,本文提供了具有编辑的TRBC1/TRBC2基因的CAR-T细胞,使得CAR-T细胞表现出减少的或可忽略的或不表现出内源T细胞受体β链的表达。
在一些实施方案中,本文提供了具有编辑的B2M基因的免疫细胞,使得免疫细胞不表达内源功能性β-2-微球蛋白。在一些实施方案中,本文提供了具有编辑的B2M基因的CAR-T细胞,使得CAR-T细胞表现出减少的或可忽略的或不表现出内源β-2-微球蛋白的表达。
在一些实施方案中,免疫细胞包含编辑的CD2基因、编辑的TRBC1基因、编辑的TRBC2基因、编辑的TRAC基因、编辑的PD-1基因、编辑的CD52基因、编辑的CD7基因、编辑的CD5基因、编辑的CIITA基因、编辑的B2M基因或其组合。在一些实施方案中,免疫细胞可以是CAR-T细胞。在一些实施方案中,每个编辑的基因可包含单个碱基编辑。在一些实施方案中,每个编辑的基因可包含基因的不同区域处的多个碱基编辑。
在一些实施方案中,单个修饰事件(诸如电穿孔)可引入一个或多个基因编辑。在一些实施方案中,可同时在一个或多个基因中引入至少一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十或更多个编辑。
在一些实施方案中,可以对免疫细胞(包括但不限于包含选自任何上述基因编辑的编辑的基因的任何免疫细胞)进行编辑,以在其他基因中生成增强CAR-T功能或减少细胞的免疫抑制(immunosuppression)或抑制(inhibition)的突变。
细胞外结合结构域
本发明的嵌合抗原受体包括细胞外结合结构域。本文考虑的嵌合抗原受体的细胞外结合结构域包含对特定抗原具有亲和力的抗体或其抗原结合片段的氨基酸序列。在一些实施方案中,抗原是CD2。在一些实施方案中,抗原是CD5。在一些实施方案中,抗原是CD7。
在一些实施方案中,嵌合抗原受体包含抗体的氨基酸序列。在一些实施方案中,嵌合抗原受体包含抗体的抗原结合片段的氨基酸序列。细胞外结合结构域的抗体(或其片段)部分识别并结合抗原的表位。在一些实施方案中,嵌合抗原受体的抗体片段部分是单链可变片段(scFv)。scFv包含单克隆抗体的轻和可变片段。在其他实施方案中,嵌合抗原受体的抗体片段部分是多链可变片段,其可以包含多于一个细胞外结合结构域并因此同时结合多于一个抗原。在多链可变片段实施方案中,铰链区可分隔不同的可变片段,从而提供必要的空间排列和柔性。
在一些实施方案中,细胞外结合结构域是抗CD2scFv。在一些实施方案中,抗CD2scFv与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKGGGGSGGGGSGGGGSEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:382)。
在一些实施方案中,抗CD2scFv与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:383)。
在一些实施方案中,抗CD2scFv与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:384)。
在一些实施方案中,抗CD2scFv与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:385)。
在一些实施方案中,抗CD2scFv与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:386)。
在一些实施方案中,抗CD2scFv与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:387)。
在其他实施方案中,嵌合抗原受体的抗体部分包含至少一条重链和至少一条轻链。在一些实施方案中,嵌合抗原受体的抗体部分包含两条通过二硫桥接合的重链和两条轻链,其中每条轻链通过二硫桥与重链之一接合。在一些实施方案中,轻链包含恒定区和可变区。存在于抗体可变区中的互补决定区负责抗体对特定抗原的亲和力。因此,识别不同抗原的抗体包含不同的互补决定区。互补决定区存在于细胞外结合结构域的可变结构域中,并且可变结构域(即,可变重和可变轻)可以用接头连接,或者在一些实施方案中,用二硫桥连接。在一些实施方案中,可变重链和可变轻链通过(GGGGS)n接头(SEQ ID NO:247)连接,其中n是1至10的整数。在一些实施方案中,接头是(GGGGS)3接头(SEQ ID NO:381)。
在一些实施方案中,嵌合抗原受体的抗体部分包含至少一条抗CD2轻链。在一些实施方案中,抗CD2轻链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQ RTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLG VYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:376)
在一些实施方案中,抗CD2轻链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRP KQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSL TSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:377)
在一些实施方案中,抗CD2轻链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLL QRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDV GVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378)。
在一些实施方案中,抗CD2轻链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQA PGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSS LTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:379)。
在一些实施方案中,抗CD2轻链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLL QRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDV GVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378)。
在一些实施方案中,抗CD2轻链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQ APGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMEL SRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:380)。
在一些实施方案中,嵌合抗原受体的抗体部分包含至少一条抗CD2重链。在一些实施方案中,抗CD2scFv重链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRP KQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSL TSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:377)
在一些实施方案中,嵌合抗原受体的抗体部分包含至少一条抗CD2重链。在一些实施方案中,抗CD2scFv重链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQ RTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLG VYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:376)
在一些实施方案中,嵌合抗原受体的抗体部分包含至少一条抗CD2重链。在一些实施方案中,抗CD2scFv重链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQA PGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSS LTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:379)。
在一些实施方案中,嵌合抗原受体的抗体部分包含至少一条抗CD2重链。在一些实施方案中,抗CD2scFv重链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLL QRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDV GVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378)。
在一些实施方案中,嵌合抗原受体的抗体部分包含至少一条抗CD2重链。在一些实施方案中,抗CD2scFv重链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQ APGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMEL SRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:380)。
在一些实施方案中,嵌合抗原受体的抗体部分包含至少一条抗CD2重链。在一些实施方案中,抗CD2scFv重链与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLL QRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDV GVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378)。
在一些实施方案中,被细胞外结构域识别并结合的抗原是蛋白质或肽、核酸、脂质或多糖。抗原可以是异源的,诸如在致病性细菌或病毒中表达的那些。抗原也可以是合成的;例如,一些个体对合成乳胶极度过敏,并且暴露于这种抗原可能会导致极度免疫反应。在一些实施方案中,抗原是自体的,并且在患病或以其他方式改变的细胞上表达。例如,在一些实施方案中,抗原在肿瘤细胞中表达。在一些实施方案中,肿瘤细胞是恶性T细胞或NK细胞。在一些实施方案中,恶性T细胞或NK细胞是恶性前体T细胞或NK细胞。在一些实施方案中,恶性T细胞或NK细胞是恶性成熟T细胞或NK细胞。瘤形成的非限制性实例包括T细胞急性淋巴细胞白血病(T-ALL)、蕈样肉芽肿(MF)、塞扎里综合征(SS)、外周T/NK细胞淋巴瘤、间变性大细胞淋巴瘤ALK+、原发性皮肤T细胞淋巴瘤、T细胞大颗粒淋巴细胞白血病、血管免疫母细胞性T/NK细胞淋巴瘤、肝脾T细胞淋巴瘤、原发性皮肤CD30+淋巴增生性病症、结外NK/T细胞淋巴瘤、成人T细胞白血病/淋巴瘤、T细胞幼淋巴细胞白血病、皮下脂膜炎样T细胞淋巴瘤、原发性皮肤γ-δT细胞淋巴瘤、侵袭性NK细胞白血病和肠病相关T细胞淋巴瘤。
抗体-抗原相互作用是由氢键、静电或疏水相互作用或范德华力引起的非共价相互作用。嵌合抗原受体的细胞外结合结构域对抗原的亲和力可以使用下式计算:
KA=[抗体-抗原]/[抗体][抗原],其中
[抗体]=抗体上未占据的结合位点的摩尔浓度;
[抗原]=抗原上未占据的结合位点的摩尔浓度;并且
[抗体-抗原]=抗体-抗原复合物的摩尔浓度。
抗体-抗原相互作用也可以基于抗原与抗体的解离来表征。解离常数(KD)是缔合速率与解离速率的比率,并且与亲和常数成反比。因此,KD=1/KA。本领域技术人员将熟悉这些概念,并且将知道可以使用传统方法(诸如ELISA测定)来计算这些常数。
跨膜结构域
本发明的嵌合抗原受体包括跨膜结构域。本文所述的嵌合抗原受体的跨膜结构域跨越CAR-T细胞的脂质双层细胞膜,并且分隔细胞外结合结构域与细胞内信号传导结构域。在一些实施方案中,这个结构域来源于具有跨膜结构域的其他受体,而在其他实施方案中,这个结构域是合成的。在一些实施方案中,跨膜结构域可以来源于非人跨膜结构域,并且在一些实施方案中,是人源化的。“人源化”意指对编码跨膜结构域的核酸序列进行优化,使得其在人受试者中更可靠或更高效地表达。在一些实施方案中,跨膜结构域来源于在人免疫效应细胞中表达的另一种跨膜蛋白。此类蛋白质的实例包括但不限于T细胞受体(TCR)复合物的亚基、PD1或任何分化簇蛋白质或在免疫效应细胞中表达并具有跨膜结构域的其他蛋白质。在一些实施方案中,跨膜结构域将是合成的,并且此类序列将包含许多疏水残基。
用于所公开的CAR的跨膜结构域可以至少包括T细胞受体CD28、CD3ε、CD45、CD4、CD5、CD8、CD9、CD16、CD22、CD33、CD37、CD64、CD80、CD86、CD134、CD137、CD154的α、β或ζ链的跨膜区。在一些实施方案中,跨膜结构域来源于CD4、CD8α、CD28和CD3ζ。
在一些实施方案中,跨膜结构域是CD8α铰链和跨膜结构域。在一些实施方案中,CD8α铰链和跨膜结构域与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
SDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYC(SEQ ID NO:371)。
在一些实施方案中,嵌合抗原受体被设计成在跨膜结构域与细胞外结构域、细胞内结构域或两者之间包含间隔子。此类间隔子的长度可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,间隔子的长度可以是20、30、40、50、60、70、80、90或100个氨基酸。在仍其他实施方案中,间隔子的长度可以在100与500个氨基酸之间。间隔子可以是将一个结构域连接至另一个结构域并且用于定位此类连接的结构域以增强或优化嵌合抗原受体功能的任何多肽。
细胞内信号传导结构域
本发明的嵌合抗原受体包括细胞内信号传导结构域。细胞内信号传导结构域是在T细胞中表达的蛋白质的细胞内部分,其转导T细胞效应子功能信号(例如,激活信号),并且指导T细胞执行特定功能。T细胞激活可以由多种因素诱导,包括同源抗原与T细胞表面上的T细胞受体的结合以及同源配体与T细胞表面上的共刺激分子的结合。T细胞共刺激分子是T细胞上的同源结合配偶体,其特异性结合共刺激配体,从而介导T细胞的共刺激反应,诸如但不限于增殖。共刺激分子包括但不限于MHC I类分子。T细胞的激活导致免疫反应,诸如T细胞增殖和分化(参见,例如,Smith-Garvin等人,Annu.Rev.Immunol.,27:591-619,2009)。示例性T细胞信号传导结构域是本领域已知的。非限制性实例包括CD3ζ、CD8、CD28、CD27、CD154、GITR(TNFRSF18)、CD134(OX40)和CD137(4-1BB)信号传导结构域。
本文考虑的嵌合抗原受体的细胞内信号传导结构域包含初级信号传导结构域。在一些实施方案中,嵌合抗原受体包含初级信号传导结构域和次级或共刺激信号传导结构域。
在一些实施方案中,初级信号传导结构域包含一个或多个基于免疫受体酪氨酸的激活基序或ITAM。在一些实施方案中,初级信号传导结构域包含多于一个ITAM。掺入到嵌合抗原受体中的ITAM可来源于来自其他细胞受体的ITAM。在一些实施方案中,包含ITAM的初级信号传导结构域可来源于TCR复合物的亚基,诸如CD3γ、CD3ε、CD3ζ或CD3δ。在一些实施方案中,包含ITAM的初级信号传导结构域可来源于FcRγ、FcRβ、CD5、CD22、CD79a、CD79b或CD66d。
在一些实施方案中,初级信号传导结构域选自由CD8、CD28、CD134(OX40)、CD137(4-1BB)和CD3ζ组成的组。
在一些实施方案中,初级信号传导结构域是CD3ζ信号传导结构域。在一些实施方案中,CD3ζ信号传导结构域与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
RVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRG RDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRG KGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:372)
在一些实施方案中,初级信号传导结构域是CD28信号传导结构域。在一些实施方案中,CD28信号传导结构域与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
RSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS(SEQ ID NO:373)
在一些实施方案中,初级信号传导结构域是CD137(4-1BB)信号传导结构域。在一些实施方案中,CD137(4-1BB)信号传导结构域与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
KRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL(SEQ ID NO:374)
在一些实施方案中,CD137(4-1BB)信号传导结构域与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
RFSVVKRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEE GGCEL(SEQ ID NO:375)
在一些实施方案中,初级信号传导结构域是CD134(OX40)信号传导结构域。在一些实施方案中,CD134(OX40)信号传导结构域与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
RRDQRLPPDAHKPPGGGSFRTPIQEEQADAHSTLAKI(SEQ ID NO:760)
在一些实施方案中,次级或共刺激信号传导结构域来源于CD2、CD4、CDS、CD8α、CD28、CD83、CD134、CD137(4-1BB)、ICOS或CD154或其组合。在一些实施方案中,共信号传导结构域是CD2细胞质结构域。在一些实施方案中,CD2信号传导结构域与如下提供的示例性氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
TKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNP ATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVH QQKGPPLPRPRVQPKPPHGAAENSLSPSSN(SEQ ID NO:370)
在一些实施方案中,CAR包含一个或多个信号传导结构域。在一些实施方案中,CAR包含CD2信号传导结构域和CD3ζ信号传导结构域。在一些实施方案中,CAR包含CD2信号传导结构域和CD28信号传导结构域。在一些实施方案中,CAR包含CD2信号传导结构域和CD137(4-1BB)信号传导结构域。在一些实施方案中,CAR包含CD2信号传导结构域、CD28信号传导结构域和CD3ζ信号传导结构域。在一些实施方案中,CAR包含CD2信号传导结构域、CD137(4-1BB)信号传导结构域和CD3ζ信号传导结构域。在一些实施方案中,CD2信号传导结构域来源于CD2细胞质结构域。在一些实施方案中,CD2信号传导结构域来源于人CD2细胞质结构域。
免疫细胞中的靶基因编辑
在一些实施方案中,本文提供了一种在内源基因或其调控元件中具有至少一个修饰的免疫细胞。在一些实施方案中,免疫细胞可在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个内源基因或其调控元件中包含进一步的修饰。在一些实施方案中,至少一个修饰是单核碱基修饰。在一些实施方案中,至少一个修饰是通过碱基编辑进行的。碱基编辑可位于基因的任何合适位置处,或位于基因的调控元件中。因此,可以理解,例如起始密码子处的单碱基编辑可以完全消除基因的表达。在一些实施方案中,碱基编辑可在外显子内的位点处执行。在一些实施方案中,碱基编辑可在多于一个外显子上的位点处执行。在一些实施方案中,碱基编辑可在基因中的多个外显子中的任何外显子处执行。在一些实施方案中,碱基编辑可将提前终止密码子引入到外显子中,导致翻译产物的缺乏或导致可能被错误折叠并因此被降解消除的截短,或可产生容易降解的不稳定mRNA。在一些实施方案中,免疫细胞是T细胞。在一些实施方案中,免疫细胞是CAR-T细胞。在一些实施方案中,免疫细胞是NK细胞。
在一些实施方案中,编辑的基因可以是免疫反应调控基因、免疫原性基因、检查点抑制基因、参与免疫反应的基因、细胞表面标志物(例如,T细胞表面标志物)、或其任何组合。在一些实施方案中,编辑的基因与激活的T细胞增殖、α-βT细胞激活、γ-δT细胞激活、T细胞增殖的正调控、辅助T细胞增殖或分化的负调控、或其调控元件、或其组合相关。在一些实施方案中,编辑的基因可以是检查点抑制基因。在一些实施方案中,检查点抑制基因是例如PD1基因、PDC1基因,或者与其形成或激活的途径相关或调控所述途径的成员。在一些实施方案中,编辑的基因是TRAC基因。在一些实施方案中,编辑的基因是CD2基因。在一些实施方案中,编辑的基因是CD3基因。在一些实施方案中,编辑的基因是B2M基因。在一些实施方案中,编辑的基因是CIITA基因。在一些实施方案中,编辑的基因是TRBC1/2基因。在一些实施方案中,编辑的基因是CD5基因。在一些实施方案中,编辑的基因是CD7基因。在一些实施方案中,编辑的基因是CD52基因。在一些实施方案中,至少一个编辑的基因选自PD-1、CD2、CD3、CD5、CD7、CD52、B2M、TRBC1/2、CIITA和TRAC或其组合。在一些实施方案中,编辑PD-1、CD2、CD52和TRAC基因。在一些实施方案中,编辑PD-1、CD2、CD52、B2M、TRBC1/2、CIITA和TRAC基因。在一些实施方案中,编辑PD-1、CD5、CD52和TRAC基因。在一些实施方案中,编辑PD-1、CD3、CD7和CD52基因。
在一些实施方案中,内源基因的编辑减少基因的表达。在一些实施方案中,与没有修饰的对照细胞相比,内源基因的编辑使基因的表达减少至少50%。在一些实施方案中,与没有修饰的对照细胞相比,内源基因的编辑使基因的表达减少至少60%。在一些实施方案中,与没有修饰的对照细胞相比,内源基因的编辑使基因的表达减少至少70%。在一些实施方案中,与没有修饰的对照细胞相比,内源基因的编辑使基因的表达减少至少80%。在一些实施方案中,与没有修饰的对照细胞相比,内源基因的编辑使基因的表达减少至少90%。在一些实施方案中,与没有修饰的对照细胞相比,内源基因的编辑使基因的表达减少至少100%。在一些实施方案中,内源基因的编辑消除基因表达。
在一些实施方案中,可对例如人CD2基因的外显子1、外显子2、或外显子3、或外显子4或外显子5执行碱基编辑。在一些实施方案中,人CD2基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人CD2基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人CD2基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人CD2基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人CD2基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3、外显子4、外显子5或其任何组合处对人CD2基因执行一个或多个碱基编辑作用。
在一些实施方案中,人CD2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置8来执行。在一些实施方案中,人CD2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置4来执行。在一些实施方案中,人CD2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置6来执行。在一些实施方案中,人CD2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置7来执行。在一些实施方案中,人CD2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置9来执行。在一些实施方案中,人CD2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子4的位置4来执行。在一些实施方案中,人CD2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子4的位置5来执行。在一些实施方案中,人CD2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子5的位置4来执行。
在一些实施方案中,可对例如人PDC1/PD-1基因的外显子1、外显子2、或外显子3、或外显子4或外显子5执行碱基编辑。在一些实施方案中,人PDC1/PD-1基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人PDC1/PD-1基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人PDC1/PD-1基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人PDC1/PD-1基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人PDC1/PD-1基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3、外显子4、外显子5或其任何组合处对人PDC1/PD-1基因执行一个或多个碱基编辑作用。
在一些实施方案中,人PDC1/PD-1A基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置4、6、7、8或9来执行。在一些实施方案中,人PDC1/PD-1A基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置4、6、7、8或9来执行。在一些实施方案中,人PDC1/PD-1A基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置7、8或9来执行。在一些实施方案中,人PDC1/PD-1A基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置5、7或8来执行。在一些实施方案中,人PDC1/PD-1A基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子5的位置5或8来执行。
在一些实施方案中,可对例如人CD7基因的外显子1、外显子2、或外显子3执行碱基编辑。在一些实施方案中,人CD7基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人CD7基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人CD7基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3或其任何组合处对人CD7基因执行一个或多个碱基编辑作用。在一些实施方案中,人CD7基因中的碱基编辑在外显子1内的位置4、8、9处执行。在一些实施方案中,人CD7基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置5、6、7、8或9来执行。在一些实施方案中,人CD7基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置4或9来执行。
在一些实施方案中,可对例如人CD52基因的外显子1、外显子2、或外显子3执行碱基编辑。在一些实施方案中,人CD52基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人CD52基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人CD7基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3或其任何组合处对人CD52基因执行一个或多个碱基编辑作用。在一些实施方案中,人CD52基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置4或7来执行。在一些实施方案中,人CD52基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置5、6或7来执行。
在一些实施方案中,可对例如人CD5基因的外显子1、外显子2、或外显子3、或外显子4、或外显子5、或外显子6、或外显子7、或外显子8、或外显子9、或外显子10执行碱基编辑。在一些实施方案中,人CD5基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子6内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子7内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子8内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子9内的位点处执行。在一些实施方案中,人CD5基因中的碱基编辑在外显子10内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10或其任何组合处对人CD5基因执行一个或多个碱基编辑作用。
在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置6来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置6来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置5和/或6来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置5和/或6来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置5、6、8和/或9来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子4的位置4或5来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子5的位置4、5、7、8或9来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子6的位置4、5、6、7、8和/或9来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子7的位置4来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子8的位置4、5或7来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子9的位置6或8来执行。在一些实施方案中,人CD5基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子10的位置9来执行。
在一些实施方案中,可对例如人TRAC基因(UCSC基因组数据库ENSG00000277734.8)的外显子1、或外显子2、或外显子3、或外显子4执行碱基编辑。在一些实施方案中,人TRAC基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人TRAC基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人TRAC基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人TRAC基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3、外显子4或其任何组合处对TRAC基因执行一个或多个碱基编辑作用。在一些实施方案中,人TRAC基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置5、6或9来执行。
在一些实施方案中,可对例如人B2M基因(染色体15,NC_000015.10,44711492–44718877;示例性mRNA序列NM_004048)的外显子1、外显子2、外显子3或外显子4执行碱基编辑。在一些实施方案中,人B2M基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人B2M基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人B2M基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人B2M基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3、外显子4或其任何组合处对人B2M基因执行一个或多个碱基编辑作用。在一些实施方案中,人B2M基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置5来执行。在一些实施方案中,人B2M基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置4、6或9来执行。
在一些实施方案中,可对例如人CIITA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外显子11、外显子12、外显子13、外显子14、外显子15、外显子16、外显子17、外显子18或外显子19执行碱基编辑。在一些实施方案中,人CD52基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子6内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子7内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子8内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子9内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子10内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子11内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子12内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子13内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子14内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子15内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子16内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子17内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子18内的位点处执行。在一些实施方案中,人CIITA基因中的碱基编辑在外显子19内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外显子11、外显子12、外显子13、外显子14、外显子15、外显子16、外显子17、外显子18、外显子19或其任何组合处对人CIITA基因执行一个或多个碱基编辑作用。
在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置6或7来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置7或8来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子4的位置8来执行。在一些实施方案中,人CIITA中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子7的位置4、7或8来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子8的位置8来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子9的位置4、6或7来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子10的位置4、5或7来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子11的位置4、5、6、7或8来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子12的位置6来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子14的位置4或5来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子15的位置4、7或8来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子16的位置5、7或8来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子17的位置7或8来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子18的位置5来执行。在一些实施方案中,人CIITA基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子19的位置5、6、7或8来执行。
在一些实施方案中,可对例如人TRBC1基因的外显子1、外显子2、或外显子3执行碱基编辑。在一些实施方案中,人TRBC1基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人TRBC1基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人TRBC1基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3或其任何组合处对人TRBC1基因执行一个或多个碱基编辑作用。在一些实施方案中,人TRBC1基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置5、6、7或8来执行。在一些实施方案中,人TRBC1基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置8来执行。在一些实施方案中,人TRBC1基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置4或5来执行。
在一些实施方案中,可对例如人TRBC2基因的外显子1、外显子2、或外显子3执行碱基编辑。在一些实施方案中,人TRBC2基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人TRBC2基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人TRBC2基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,可以在外显子1、外显子2、外显子3或其任何组合处对人TRBC2基因执行一个或多个碱基编辑作用。在一些实施方案中,人TRBC2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子1的位置5、6、7或8来执行。在一些实施方案中,人TRBC2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子2的位置7或8来执行。在一些实施方案中,人TRBC2基因中的碱基编辑通过编辑靶向指导RNA间隔序列的外显子3的位置4来执行。
在一些实施方案中,可对内含子执行碱基编辑。例如,可对内含子执行碱基编辑。在一些实施方案中,碱基编辑可在内含子内的位点处执行。在一些实施方案中,碱基编辑可在一个或多个内含子的位点处执行。在一些实施方案中,碱基编辑可在基因的多个内含子中的任何外显子处执行。在一些实施方案中,可对外显子、内含子或外显子和内含子的任何组合执行一个或多个碱基编辑。
在一些实施方案中,修饰或碱基编辑可以在启动子位点内。在一些实施方案中,可将碱基编辑引入到替代启动子位点内。在一些实施方案中,碱基编辑可在5'调控元件中,诸如在增强子中。在一些实施方案中,可引入碱基编辑以破坏核酸结合蛋白的结合位点。示例性核酸结合蛋白可以是聚合酶、核酸酶、促旋酶、拓扑异构酶、甲基化酶或甲基转移酶、转录因子、增强子、PABP、锌指蛋白等。
在一些实施方案中,碱基编辑可用于剪接中断以沉默靶蛋白表达。在一些实施方案中,碱基编辑可生成剪接受体-剪接供体(SA-SD)位点。生成SA-SD的靶向碱基编辑或SA-SD位点处的靶向碱基编辑可以导致基因表达减少。在一些实施方案中,碱基编辑器(例如,ABE、CBE)用于靶向构成剪接受体和剪接供体位点的二核苷酸基序,所述剪接受体和剪接供体位点是每个内含子的第一个和最后两个核苷酸。例如,CD2的外显子3剪接供体(SD)位点可以是碱基编辑的靶标。在一些实施方案中,用腺苷碱基编辑器(ABE)实现剪接中断。在一些实施方案中,用胞苷碱基编辑器(CBE)实现剪接中断。在一些实施方案中,碱基编辑器(例如,ABE、CBE)用于通过产生终止密码子来编辑外显子。
在一些实施方案中,本文提供了在一个或多个内源基因中具有至少一个修饰的免疫细胞。在一些实施方案中,免疫细胞可在一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个内源基因中具有至少一个修饰。在一些实施方案中,修饰在内源基因中生成提前终止密码子。在一些实施方案中,终止密码子沉默靶蛋白表达。在一些实施方案中,修饰是单碱基修饰。在一些实施方案中,修饰通过碱基编辑生成。提前终止密码子可在外显子、内含子或非翻译区中生成。在一些实施方案中,碱基编辑可用于在一个或多个替代阅读框中引入多于一个终止密码子。例如,可以在外显子2内的位置8处、外显子3内的位置4处、外显子3内的位置6处、外显子3内的位置9处、外显子4内的位置4处、外显子4内的位置5处、或外显子5内的位置4处引入提前终止密码子。在一些实施方案中,终止密码子通过腺苷碱基编辑器(ABE)生成。在一些实施方案中,终止密码子通过胞苷碱基编辑器(CBE)生成。在一些实施方案中,CBE生成以下编辑中的任一个(以带下划线的字体显示)以生成终止密码子:CAG→TAG;CAA→TAA;CGA→TGA;TGG→TGA;TGG→TAG;或TGG→TAA
在一些实施方案中,可在3'-UTR处引入修饰/碱基编辑,例如,在聚腺苷酸化(poly-A)位点处。在一些实施方案中,可对5'-UTR区域执行碱基编辑。
递送系统
如本文所述评价核碱基编辑器靶向基因(例如,CD2)中的一个或多个核苷酸的适合性。在一个实施方案中,用编码本文所述的碱基编辑系统的一种或多种核酸分子以及编码报告基因(例如,GFP)的少量载体转染、转导或以其他方式修饰感兴趣的单个细胞。这些细胞可以是本领域已知的任何细胞系,包括免疫细胞(例如,T细胞或NK细胞)或永生化的人细胞系,诸如293T、K562或U20S。或者,可以使用原代细胞(例如,人)。细胞也可从受试者或个体中获得,诸如从组织活检、手术、血液、血浆、血清或其他生物流体中获得。此类细胞可能与最终的细胞靶标相关。
可使用病毒载体执行递送。在一个实施方案中,可使用脂质转染(诸如Lipofectamine或Fugene)或通过电穿孔来执行转染。转染后,报告基因(例如,GFP)的表达可以通过荧光显微镜或流式细胞术来确定,以确认一致和高水平的转染。这些初步转染可以包含不同的核碱基编辑器以确定哪些编辑器组合提供最大活性。系统可以包含一种或多种不同的载体。在一个实施方案中,碱基编辑器针对期望细胞类型的表达进行了密码子优化,所述细胞类型优先是真核细胞,优选哺乳动物细胞或人细胞。
如本文所述评估核碱基编辑器的活性,即通过对细胞的基因组进行测序以检测靶序列中的改变。对于Sanger测序,将纯化的PCR扩增子克隆到质粒骨架中,转化,小量制备,并使用单一引物进行测序。也可使用下一代测序(NGS)技术执行测序。当使用下一代测序时,扩增子可以是300-500bp,预期的切割位点不对称放置。在PCR之后,可将下一代测序衔接子和条形码(例如,Illumina多重衔接子和索引)添加至扩增子的末端,例如用于高通量测序(例如在Illumina MiSeq上)。可以选择在初始测试中诱导最大水平的靶特异性改变的融合蛋白用于进一步评估。
在特定实施方案中,核碱基编辑器用于靶向感兴趣的多核苷酸。在一个实施方案中,本发明的核碱基编辑器与一个或多个用于靶向细胞基因组内的一个或多个感兴趣的核酸序列的指导RNA结合递送至细胞(例如,免疫细胞(例如,T细胞或NK细胞)),从而改变一个或多个靶基因(例如,CD2)。在一些实施方案中,碱基编辑器被一种或多种指导RNA靶向以将一个或多个编辑引入至一个或多个感兴趣的基因(例如,CD2、TRAC、B2M、CIITA、TRBC1、TRBC2、PD-1、CD52)的序列。在一些实施方案中,对一个或多个感兴趣的基因的序列的一个或多个编辑减少或消除由所述基因编码的蛋白质在宿主细胞(例如,免疫细胞(例如,T细胞或NK细胞))中的表达。在一些实施方案中,由一个或多个感兴趣的基因(例如,CD2)编码的一个或多个蛋白质的表达在宿主细胞(例如,免疫细胞(例如,T细胞或NK细胞))中被完全敲除或消除。
在一些实施方案中,宿主细胞是哺乳动物细胞。在一些实施方案中,宿主细胞是人细胞。在一些实施方案中,宿主细胞是免疫细胞。在一些实施方案中,免疫细胞是T细胞。在一些实施方案中,免疫细胞是NK细胞。在一些实施方案中,将一个或多个编辑引入到选自CD2、CD3、CD5、CD7、CD52、B2M、CIITA、TRBC1、TRBC2、TRAC和PD-1或其组合的一个或多个基因中。在一些实施方案中,将一个或多个编辑引入到CD2基因中。在一些实施方案中,将一个或多个编辑引入到CD5基因中。在一些实施方案中,将一个或多个编辑引入到CD7基因中。在一些实施方案中,将一个或多个编辑引入到CD2、CD52、TRAC和PD-1基因中。在一些实施方案中,将一个或多个编辑引入到CD5、CD52、TRAC和PD-1基因中。在一些实施方案中,将一个或多个编辑引入到CD7、CD3、CD52和PD-1基因中。
碱基编辑器系统的基于核酸的递送
编码根据本公开的碱基编辑器系统的核酸分子可以通过本领域已知的方法或如本文所述在体外或体内施用于受试者或递送至细胞中。例如,包含脱氨酶(例如,胞苷或腺嘌呤脱氨酶)的碱基编辑器系统可以通过载体(例如,病毒或非病毒载体)或通过裸露的DNA、DNA复合物、脂质纳米颗粒或前述组合物的组合来递送。
纳米颗粒可以是有机的或无机的,可用于递送碱基编辑器系统或其组分。纳米颗粒是本领域众所周知的,并且任何合适的纳米颗粒可以用于递送碱基编辑器系统或其组分,或递送编码此类组分的核酸分子。在一个实例中,有机(例如,脂质和/或聚合物)纳米颗粒适合用作本公开的某些实施方案中的递送媒介物。用于纳米颗粒制剂和/或基因转移的示例性脂质在表17(下文)中示出。
表17.用于基因转移的脂质。
/>
表18列出了用于基因转移和/或纳米颗粒制剂的示例性聚合物。
表18.用于基因转移的聚合物。
/>
表19总结了编码本文所述的融合蛋白的多核苷酸的递送方法。
表19.递送方法。
在另一个方面,碱基编辑器系统组分或编码此类组分的核酸(例如,多核苷酸可编程核苷酸结合结构域(例如,Cas9),例如像Cas9或其变体,以及靶向感兴趣的核酸序列的gRNA)的递送可以通过将核糖核蛋白(RNP)递送至细胞来完成。RNP包含多核苷酸可编程核苷酸结合结构域(例如,Cas9)与靶向gRNA的复合物。本文所述的RNP或多核苷酸可使用已知方法递送至细胞,所述方法诸如电穿孔、核转染或阳离子脂质介导的方法,例如,如由Zuris,J.A.等人,2015,Nat.Biotechnology,33(1):73-80报道,所述文献通过引用整体并入。RNP有利于在CRISPR碱基编辑系统中使用,特别是对于难以转染的细胞,诸如原代细胞。此外,RNP还可以减轻关于细胞中蛋白质表达可能出现的困难,尤其是当可用于CRISPR质粒的真核启动子(例如,CMV或EF1A)未充分表达时。有利地,使用RNP不需要将外来DNA递送到细胞中。此外,因为包含核酸结合蛋白和gRNA复合物的RNP随着时间的推移而降解,所以使用RNP有可能限制脱靶效应。以类似于基于质粒的技术的方式,RNP可以用于递送结合蛋白(例如,Cas9变体)和指导同源定向修复(HDR)。
例如,编码碱基编辑器系统的核酸分子可以作为裸露的DNA或RNA通过转染或电穿孔直接递送至细胞(例如,免疫细胞,诸如NK细胞或T细胞),或者可以与促进靶细胞的摄取的分子(例如,N-乙酰基半乳糖胺)缀合。也可以使用编码碱基编辑器系统和/或其组分的载体。在特定的实施方案中,多核苷酸,例如编码碱基编辑器系统或其功能组分的mRNA,可以与一种或多种如本文所述的指导RNA共电穿孔。
核酸载体可以包含编码本文所述的融合蛋白的结构域的一个或多个序列。载体还可以编码可操作地连接至核定位信号、核仁定位信号或线粒体定位信号的碱基编辑器系统的蛋白质组分。作为一个实例,载体可以包括Cas9编码序列,其包括一个或多个核定位序列(例如,来自SV40的核定位序列)和一个或多个脱氨酶。
载体还可以包括任何合适数量的调控/控制元件,例如启动子、增强子、内含子、聚腺苷酸化信号、Kozak共有序列或内部核糖体进入位点(IRES)。这些元件是本领域众所周知的。
根据本公开的载体包括重组病毒载体。示例性病毒载体在上文中列出。也可以使用本领域已知的其他病毒载体。此外,病毒颗粒可以用于递送核酸和/或蛋白质形式的碱基编辑器系统组分。例如,“空”病毒粒子可以组装成含有碱基编辑器系统或组分作为货物。也可以对病毒载体和病毒粒子进行工程改造以掺入靶向配体来改变靶组织特异性。
本文所述的载体可包含调控元件以驱动碱基编辑器系统或其组分的表达。此类载体包括具有反向长末端重复序列的腺相关病毒(AAV ITR)。使用AAV-ITR可以有利于消除对额外启动子元件的需求,所述启动子元件会占用载体中的空间。释放的额外空间可以用于驱动额外元件的表达,诸如指导核酸或选择性标志物的表达。ITR活性可以用于降低由于过表达引起的潜在毒性。
可以使用任何合适的启动子来驱动碱基编辑器系统或其组分的表达,并且在合适的情况下,驱动指导核酸的表达。对于普遍表达,启动子包括CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链。对于大脑或其他CNS细胞表达,合适的启动子包括:所有神经元的突触蛋白I、兴奋性神经元的CaMKIIα、GABA能神经元的GAD67或GAD65或VGAT。对于肝细胞表达,合适的启动子包括白蛋白启动子。对于肺细胞表达,合适的启动子包括SP-B。对于内皮细胞,合适的启动子包括ICAM。对于造血细胞表达,合适的启动子包括IFNβ或CD45。对于成骨细胞表达,合适的启动子可以包括OG-2。
在一些实施方案中,本公开的碱基编辑器系统具有足够小的大小以允许单独的启动子驱动碱基编辑器和相容的指导核酸在同一核酸分子内的表达。例如,载体或病毒载体可以包含可操作地连接至编码碱基编辑器的核酸的第一启动子和可操作地连接至指导核酸的第二启动子。
用于驱动指导核酸表达的启动子可以包括:Pol III启动子,诸如U6或H1。使用PolII启动子和内含子盒来表达gRNA腺相关病毒(AAV)。
在特定实施方案中,本发明的融合蛋白由存在于病毒载体(例如,腺相关病毒(AAV)、AAV3、AAV3b、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh8、AAV10及其变体)或任何病毒载体的合适衣壳蛋白中的多核苷酸编码。因此,在一些方面,本公开涉及融合蛋白的病毒递送。病毒载体的实例包括逆转录病毒载体(例如莫洛尼鼠白血病病毒,MML-V)、腺病毒载体(例如AD100)、慢病毒载体(基于HIV和FIV的载体)、疱疹病毒载体(例如HSV-2)。
在一些方面,本文所述的用于编辑细胞中特定基因的方法可以用于遗传修饰细胞。
在一些方面,本文所述的用于编辑免疫细胞中特定基因的方法可以用于遗传修饰CAR-T细胞。此类CAR-T细胞和产生此类CAR-T细胞的方法在国际申请号PCT/US2016/060736、PCT/US2016/060734、PCT/US2016/034873、PCT/US2015/040660、PCT/EP2016/055332、PCT/IB2015/058650、PCT/EP2015/067441、PCT/EP2014/078876、PCT/EP2014/059662、PCT/IB2014/061409、PCT/US2016/019192、PCT/US2015/059106、PCT/US2016/052260、PCT/US2015/020606、PCT/US2015/055764、PCT/CN2014/094393、PCT/US2017/059989、PCT/US2017/027606和PCT/US2015/064269中描述,所述申请各自的内容特此整体并入。
病毒载体
本文所述的碱基编辑器可以用病毒载体递送。在一些实施方案中,本文公开的碱基编辑器可以在包含在病毒载体中的核酸上编码。在一些实施方案中,碱基编辑器系统的一种或多种组分可以在一个或多个病毒载体上编码。例如,碱基编辑器和指导核酸可以在单个病毒载体上编码。在其他实施方案中,碱基编辑器和指导核酸在不同的病毒载体上编码。在任一种情况下,碱基编辑器和指导核酸可以各自可操作地连接至启动子和终止子。病毒载体上编码的组分的组合可以通过所选病毒载体的货物大小限制来确定。
使用基于RNA或DNA病毒的系统来递送碱基编辑器利用了高度进化的过程,以将病毒靶向至培养物或宿主中的特定细胞,并且将病毒有效载荷运输至细胞核或宿主细胞基因组。病毒载体可以直接施用于培养物中的细胞、患者(体内),或者它们可以用于体外处理细胞,并且修饰的细胞可以任选地施用于患者(离体)。基于常规病毒的系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关和单纯疱疹病毒载体。使用逆转录病毒、慢病毒和腺相关病毒基因转移方法可以整合到宿主基因组中,通常导致插入的转基因的长期表达。此外,在许多不同的细胞类型和靶组织中观察到高转导效率。
病毒载体可以包括慢病毒(例如,基于HIV和FIV的载体)、腺病毒(例如,AD100)、逆转录病毒(例如,莫洛尼鼠白血病病毒,MML-V)、疱疹病毒载体(例如,HSV-2)和腺相关病毒(AAV)、或其他质粒或病毒载体类型,特别是使用来自例如美国专利号8,454,972(腺病毒的制剂、剂量)、美国专利号8,404,658(AAV的制剂、剂量)和美国专利号5,846,946(DNA质粒的制剂、剂量)以及来自临床试验和关于涉及慢病毒、AAV和腺病毒的临床试验的出版物的制剂和剂量。例如,对于AAV,施用途径、制剂和剂量可以如美国专利号8,454,972和涉及AAV的临床试验中那样。对于腺病毒,施用途径、制剂和剂量可以如美国专利号8,404,658和涉及腺病毒的临床试验中那样。对于质粒递送,施用途径、制剂和剂量可以如美国专利号5,846,946和涉及质粒的临床研究中那样。剂量可以基于或外推至平均70kg的个体(例如,成年男性),并且可以针对不同体重和物种的患者、受试者、哺乳动物进行调整。施用频率在医疗或兽医从业者(例如,医生、兽医)的范围内,这取决于通常的因素,包括年龄、性别、一般健康状况、患者或受试者的其他病状以及正在解决的特定病状或症状。可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性碱基编辑,碱基编辑器和任选的指导核酸的表达可以由细胞类型特异性启动子驱动。
逆转录病毒的趋向性可以通过掺入外来的包膜蛋白来改变,从而扩增靶细胞的潜在靶群。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,具有至多6-10kb的外来序列的包装能力。最小的顺式作用LTR足以复制和包装载体,所述载体然后用于将治疗基因整合到靶细胞中以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)及其组合的那些(参见,例如,Buchscher等人,J.Virol.66:2731-2739(1992);Johann等人,J.Virol.66:1635-1640(1992);Sommnerfelt等人,Virol.176:58-59(1990);Wilson等人,J.Virol.63:2374-2378(1989);Miller等人,J.Virol.65:2220-2224(1991);PCT/US94/05700)。
逆转录病毒载体,尤其是慢病毒载体,可能需要小于给定长度的多核苷酸序列以高效整合到靶细胞中。例如,与较小大小的逆转录病毒载体相比,长度大于9kb的逆转录病毒载体可能导致低病毒滴度。在一些方面,本公开的碱基编辑器具有足够的大小,以便能够高效地经由逆转录病毒载体包装并递送至靶细胞中。在一些实施方案中,碱基编辑器的大小允许即使当与指导核酸和/或可靶向核酸酶系统的其他组分一起表达时也能高效包装和递送。
包装细胞通常用于形成能够感染宿主细胞的病毒粒子。此类细胞包括包装腺病毒的293细胞和包装逆转录病毒的psi.2细胞或PA317细胞。基因疗法中使用的病毒载体通常是通过产生将核酸载体包装到病毒粒子中的细胞系而生成的。载体通常含有包装和随后整合到宿主中所需的最小病毒序列、被待表达的多核苷酸的表达盒替换的其他病毒序列。丢失的病毒功能通常由包装细胞系反式提供。例如,用于基因疗法的腺相关病毒(“AAV”)载体通常仅具有来自AAV基因组的ITR序列,所述序列是包装和整合到宿主基因组中所需的。病毒DNA可以包装在细胞系中,所述细胞系含有编码其他AAV基因(即rep和cap)但缺乏ITR序列的辅助质粒。细胞系也可以用腺病毒作为辅助感染。辅助病毒可以促进AAV载体的复制和来自辅助质粒的AAV基因的表达。在一些情况下,由于缺乏ITR序列,辅助质粒未大量包装。可以通过例如腺病毒比AAV更敏感的热处理来减少腺病毒的污染。
在优选短暂表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有非常高的转导效率,并且不需要细胞分裂。使用此类载体,已经获得了高滴度和表达水平。这种载体可以在相对简单的系统中大量生产。AAV载体也可以用于用靶核酸转导细胞,例如在核酸和肽的体外生产中,以及用于体内和离体基因疗法程序(参见,例如,West等人,Virology 160:38-47(1987);美国专利号4,797,368;WO 93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建在许多出版物中描述,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);和Samulski等人,J.Virol.63:03822-3828(1989)。
在一些实施方案中,AAV载体用于用编码如本文所提供的碱基编辑器或碱基编辑器系统的多核苷酸转导感兴趣的细胞。AAV是一种小型单链DNA依赖性病毒,属于细小病毒科。4.7kb的野生型(wt)AAV基因组由两个基因组成,所述两个基因分别编码四种复制蛋白和三种衣壳蛋白,并且每侧侧接有145-bp的反向末端重复序列(ITR)。病毒体由三种衣壳蛋白Vp1、Vp2和Vp3组成,它们以1:1:10的比率自相同的开放阅读框但自差异剪接(Vp1)和替代翻译起始位点(分别为Vp2和Vp3)产生。Vp3是病毒体中最丰富的亚基,并且参与细胞表面处的受体识别,这确定病毒的趋向性。已在Vp1的独特N末端鉴定出在病毒感染性中发挥作用的磷脂酶结构域。
与wt AAV类似,重组AAV(rAAV)利用顺式作用的145-bp ITR以侧接载体转基因盒,从而提供至多4.5kb的外来DNA包装。感染后,rAAV可以表达本发明的融合蛋白,并且通过以游离形式存在于环状头尾多联体中持续存在而不整合到宿主基因组中。尽管有许多在体外和体内使用这种系统的成功rAAV实例,但当基因的编码序列长度等于或大于wt AAV基因组时,有限的包装容量限制了AAV介导的基因递送的使用。
可以基于应用选择病毒载体。例如,对于体内基因递送,AAV可能优于其他病毒载体。在一些实施方案中,AAV允许低毒性,这可能是由于纯化方法不需要可以激活免疫反应的细胞颗粒的超速离心。在一些实施方案中,AAV允许低概率引起插入诱变,因为它不整合到宿主基因组中。腺病毒通常用作疫苗,因为它们诱导强烈的免疫原性反应。病毒载体的包装容量会限制可以包装到载体中的碱基编辑器的大小。
AAV具有约4.5Kb或4.75Kb的包装容量,包括两个145个碱基的反向末端重复序列(ITR)。这意味着公开的碱基编辑器以及启动子和转录终止子可以刚好放入到单个病毒载体中。大于4.5或4.75Kb的构建体会导致病毒产量显著降低。例如,SpCas9非常大,基因本身超过4.1Kb,这使得很难包装到AAV中。因此,本公开的实施方案包括利用所公开的长度比常规碱基编辑器短的碱基编辑器。在一些实例中,碱基编辑器小于4kb。所公开的碱基编辑器可以小于4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb或1.5kb。在一些实施方案中,所公开的碱基编辑器的长度为4.5kb或更小。
AAV可以是AAV1、AAV2、AAV5或其任何组合。可以根据待靶向的细胞来选择AAV的类型;例如,可以选择AAV血清型1、2、5或杂交衣壳AAV1、AAV2、AAV5或其任何组合以靶向大脑或神经元细胞;并且可以选择AAV4以靶向心脏组织。AAV8可用于递送至肝脏。关于这些细胞的某些AAV血清型的列表可见于Grimm,D.等人,J.Virol.82:5887-5911(2008))。
在一些实施方案中,慢病毒载体用于用编码如本文所提供的碱基编辑器或碱基编辑器系统的多核苷酸转导感兴趣的细胞。慢病毒是复杂的逆转录病毒,其具有在有丝分裂细胞和有丝分裂后细胞中感染且表达其基因的能力。最常见的慢病毒是人类免疫缺陷病毒(HIV),其使用其他病毒的包膜糖蛋白来靶向广泛的细胞类型。
慢病毒可以如下制备。在克隆pCasES10(其含有慢病毒转移质粒骨架)后,将低传代(p=5)的HEK293FT接种到T-75方瓶中,在转染前一天在含有10%胎牛血清且不含抗生素的DMEM中达到50%汇合度。20小时后,将培养基更换为OptiMEM(无血清)培养基,并且在4小时后进行转染。用10μg慢病毒转移质粒(pCasES10)和以下包装质粒转染细胞:5μg的pMD2.G(VSV-g假型)和7.5μg的psPAX2(gag/pol/rev/tat)。转染可以在具有阳离子脂质递送剂(50μl Lipofectamine 2000和100μl Plus试剂)的4mL OptiMEM中进行。6小时后,将培养基更换为含有10%胎牛血清的无抗生素DMEM。这些方法在细胞培养期间使用血清,但优选无血清方法。
慢病毒可以如下纯化。48小时后收获病毒上清液。首先清除上清液中的碎片并通过0.45μm低蛋白结合(PVDF)过滤器过滤。然后将它们在超速离心机中以24,000rpm离心2小时。将病毒沉淀在4℃下重悬在50μl DMEM中过夜。然后将它们等分并立即在-80℃下冷冻。
在另一个实施方案中,还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类动物慢病毒载体。在另一个实施方案中,考虑经由视网膜下注射递送(一种基于马传染性贫血病毒的慢病毒基因治疗载体,其表达血管抑制蛋白内皮抑素和血管抑素)。在另一个实施方案中,考虑使用自灭活慢病毒载体。
系统的任何RNA,例如指导RNA或碱基编辑器编码mRNA,可以以RNA的形式递送。可以使用体外转录生成碱基编辑器编码mRNA。例如,可以使用含有以下元件的PCR盒来合成核酸酶mRNA:T7启动子、任选的kozak序列(GCCACC)、核酸酶序列和3'UTR,诸如来自β球蛋白-polyA尾的3'UTR。所述盒可以用于T7聚合酶的转录。指导多核苷酸(例如,gRNA)也可以使用来自含有T7启动子的盒的体外转录,然后使用序列“GG”和指导多核苷酸序列来转录。
为了增强表达且降低可能的毒性,可以修饰碱基编辑器编码序列和/或指导核酸以包括一个或多个修饰的核苷,例如使用假-U或5-甲基-C。
AAV载体的小包装容量使得递送超过这个大小的许多基因和/或使用大的生理调控元件具有挑战性。这些挑战可以例如通过将待递送的一个或多个蛋白质分成两个或更多个片段来解决,其中N末端片段融合至分裂的内含肽-N,并且C末端片段融合至分裂的内含肽-C。然后将这些片段包装到两个或更多个AAV载体中。如本文所用,“内含肽”是指连结侧翼N末端和C末端外显肽(例如,待接合的片段)的自剪接蛋白内含子(例如,肽)。某些内含肽用于接合异源蛋白质片段的用途描述于例如Wood等人,J.Biol.Chem.289(21);14512-9(2014)中。例如,当融合至单独的蛋白质片段时,内含肽IntN和IntC彼此识别,将自身剪接出来,并且同时连结与其融合的蛋白质片段的侧翼N末端和C末端外显肽,从而重构来自两个蛋白质片段的全长蛋白质。其他合适的内含肽对于本领域技术人员将是显而易见的。
本发明的融合蛋白片段的长度可以不同。在一些实施方案中,蛋白质片段的长度范围为2个氨基酸至约1000个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约5个氨基酸至约500个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约20个氨基酸至约200个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约10个氨基酸至约100个氨基酸。其他长度的合适的蛋白质片段对于本领域技术人员将是显而易见的。
在一个实施方案中,双重AAV载体是通过将大的转基因表达盒分成两个单独的一半(5'和3'端,或头和尾)而生成的,其中所述盒的每一半都包装在单个AAV载体(小于5KB)中。然后在通过两个双重AAV载体共感染同一细胞后实现全长转基因表达盒的重新组装,然后进行:(1)5'与3'基因组之间的同源重组(HR)(双重AAV重叠载体);(2)ITR介导的5'和3'基因组的尾对头串联(双重AAV反式剪接载体);或(3)这两种机制的组合(双重AAV杂交载体)。在体内使用双重AAV载体导致全长蛋白质的表达。使用双重AAV载体平台描绘了一种高效且可行的用于大小大于4.7kb的转基因的基因转移策略。
内含肽
内含肽(介入蛋白(intervening protein))是在多种不同生物体中发现的自动加工结构域,它执行被称为蛋白质剪接的过程。蛋白质剪接是由肽键的切割和形成组成的多步骤生化反应。虽然蛋白质剪接的内源底物是在含有内含肽的生物体中发现的蛋白质,但内含肽也可以用于对几乎任何多肽骨架进行化学操作。
在蛋白质剪接中,内含肽通过切割两个肽键而将自身从前体多肽中切除,从而经由形成新的肽键而连结侧翼外显肽(外部蛋白质)序列。这种重排发生在翻译后(或可能是共翻译的)。内含肽介导的蛋白质剪接自发发生,仅需要折叠内含肽结构域。
约5%的内含肽是分裂内含肽,其被转录且翻译成两种独立的多肽,即N-内含肽和C-内含肽,每一种都与一个外显肽融合。翻译后,内含肽片段自发且非共价地组装成规范的内含肽结构,以便以反式执行蛋白质剪接。蛋白质剪接机制需要一系列酰基转移反应,所述反应导致内含肽-外显肽连接处的两个肽键的切割和N-外显肽与C-外显肽之间的新肽键的形成。这个过程由接合N-外显肽和内含肽N末端的肽键的激活启动。几乎所有内含肽在其N末端具有半胱氨酸或丝氨酸,其攻击C末端N-外显肽残基的羰基碳。这种N至O/S的酰基转移由保守的苏氨酸和组氨酸(称为TXXH基序)以及常见的天冬氨酸促进,这导致形成线性(硫)酯中间体。接下来,通过为半胱氨酸、丝氨酸或苏氨酸的第一个C-外显肽残基(+1)的亲核攻击对这种中间体进行反式(硫)酯化。所得的支链(硫)酯中间体通过独特的转化而分解:内含肽的高度保守的C末端天冬酰胺的环化。这个过程由组氨酸(见于高度保守的HNF基序)和倒数第二个组氨酸促进,并且还可能涉及天冬氨酸。这种琥珀酰亚胺形成反应从反应性复合物中切除内含肽,并且留下通过非肽键联附接的外显肽。这种结构以内含肽独立性方式迅速重排成稳定的肽键。
在一些实施方案中,核酸酶(例如,Cas9)的部分或片段与内含肽融合。核酸酶可以融合至内含肽的N末端或C末端。在一些实施方案中,融合蛋白的部分或片段与内含肽融合并且与AAV衣壳蛋白融合。内含肽、核酸酶和衣壳蛋白可以以任何排列方式融合在一起(例如,核酸酶-内含肽-衣壳、内含肽-核酸酶-衣壳、衣壳-内含肽-核酸酶等)。在一些实施方案中,碱基编辑器的N末端片段(例如,ABE、CBE)融合至分裂的内含肽-N,而C末端片段融合至分裂的内含肽-C。然后将这些片段包装到两个或更多个AAV载体中。在一些实施方案中,内含肽的N末端融合至融合蛋白的C末端,而内含肽的C末端融合至AAV衣壳蛋白的N末端。
在一个实施方案中,内含肽用于接合移植到AAV衣壳蛋白上的胞苷或腺苷碱基编辑器蛋白的片段或部分。某些内含肽用于接合异源蛋白质片段的用途描述于例如Wood等人,J.Biol.Chem.289(21);14512-9(2014)中。例如,当融合至单独的蛋白质片段时,内含肽IntN和IntC彼此识别,将自身剪接出来,并且同时连结与其融合的蛋白质片段的侧翼N末端和C末端外显肽,从而重构来自两个蛋白质片段的全长蛋白质。其他合适的内含肽对于本领域技术人员将是显而易见的。
在一些实施方案中,ABE在SpCas9的选定区域内的Ala、Ser、Thr或Cys残基处分裂成N末端和C末端片段。这些区域对应于通过Cas9晶体结构分析确定的环区域。
在氨基酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589和S590处,每个片段的N末端融合至内含肽-N,而每个片段的C末端融合至内含肽C,所述氨基酸位置在以下序列中以大写字母表示(称为“Cas9参考序列”)。
药物组合物
在一些方面,本发明提供了一种药物组合物,其包含本文所述的任何遗传修饰的免疫细胞、碱基编辑器、融合蛋白或融合蛋白-指导多核苷酸复合物。更具体地,本文提供了药物组合物,其包含表达嵌合抗原受体(CAR)的遗传修饰的免疫细胞或此类免疫细胞的群体,其中所述修饰的免疫细胞或其群体具有至少一个编辑的基因以提供自相残杀抗性,增强修饰的免疫细胞的功能,或减少修饰的免疫细胞的免疫抑制(immunosuppression)或抑制(inhibition),其中编辑的基因的表达被敲除或敲低。在一些实施方案中,至少一个编辑的基因是CD2、CD3CD5、CD7、CD52、B2M、CIITA、TRBC1、TRBC2、TRAC、PD-1或其组合。在一些实施方案中,编辑CD2、CD5或CD7。在一些实施方案中,编辑CD2、CD6或CD7与选自CD3、CD52、TRAC和/或PD-1的一个或多个基因的组合。
本发明还提供了用于富集修饰的免疫细胞群的方法。在一些实施方案中,用于富集修饰的免疫细胞群的方法包括施用抗CD2 CAR以杀伤修饰的免疫细胞群中不具有失活CD2基因的细胞。在一些实施方案中,用于富集修饰的免疫细胞群的方法包括从修饰的免疫细胞群中去除表达α/βT细胞受体(TCRαβ)的细胞。在一些实施方案中,使用TCRαβ消耗柱来去除TCRαβ+细胞。在一些实施方案中,从修饰的免疫细胞群中去除表达CD2和TCRαβ的细胞以富集所述群。在一些实施方案中,修饰的免疫细胞群在施用于受试者之前富集。在一些实施方案中,本发明的药物组合物包含富集的修饰的免疫细胞群。
可以根据已知技术制备本发明的药物组合物。参见,例如,Remington,TheScience And Practice of Pharmacy(第21版2005)。一般来讲,在施用或储存之前将免疫细胞或其群体与合适的载剂混合,并且在一些实施方案中,药物组合物还包含药学上可接受的载剂。合适的药学上可接受的载剂通常包含惰性物质,其帮助将药物组合物施用于受试者,帮助将药物组合物加工成可递送的制剂,或帮助在施用前储存药物组合物。药学上可接受的载剂可以包括可以稳定、优化或以其他方式改变制剂的形式、稠度、粘度、pH、药代动力学、溶解度的剂。此类剂包括缓冲剂、润湿剂、乳化剂、稀释剂、包封剂和皮肤渗透增强剂。例如,载剂可以包括但不限于盐水、缓冲盐水、右旋糖、精氨酸、蔗糖、水、甘油、乙醇、山梨糖醇、右旋糖酐、羧甲基纤维素钠及其组合。
可以用作药学上可接受的载剂的材料的一些非限制性实例包括:(1)糖,诸如乳糖、葡萄糖和蔗糖;(2)淀粉,诸如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,诸如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和乙酸纤维素;(4)粉末状黄蓍胶;(5)麦芽;(6)明胶;(7)润滑剂,诸如硬脂酸镁、月桂基硫酸钠和滑石粉;(8)赋形剂,诸如可可脂和栓剂蜡;(9)油,诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;(10)二醇,诸如丙二醇;(11)多元醇,诸如甘油、山梨糖醇、甘露糖醇和聚乙二醇(PEG);(12)酯,诸如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,诸如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格氏溶液(Ringer's solution);(19)乙醇;(20)pH缓冲溶液;(21)聚酯、聚碳酸酯和/或聚酐;(22)膨松剂,诸如多肽和氨基酸;(23)血清醇,诸如乙醇;和(23)药物制剂中采用的其他无毒相容物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于制剂中。
药物组合物可以包含一种或多种pH缓冲化合物以将制剂的pH维持在反映生理pH的预定水平,诸如约5.0至约8.0的范围内。水性液体制剂中使用的pH缓冲化合物可以是氨基酸或氨基酸混合物,诸如组氨酸或氨基酸(诸如组氨酸和甘氨酸)混合物。或者,pH缓冲化合物优选是将制剂的pH维持在预定水平(诸如约5.0至约8.0的范围内)并且不螯合钙离子的剂。此类pH缓冲化合物的说明性实例包括但不限于咪唑和乙酸根离子。pH缓冲化合物可以以适合将制剂的pH维持在预定水平的任何量存在。
药物组合物还可以含有一种或多种渗透调节剂,即,将制剂的渗透性质(例如,张力、渗透度和/或渗透压)调节至受体个体的血流和血细胞可接受的水平的化合物。渗透调节剂可以是不螯合钙离子的剂。渗透调节剂可以是本领域技术人员已知或可获得的调节制剂渗透性质的任何化合物。本领域技术人员可以凭经验确定用于本发明制剂的给定渗透调节剂的适合性。合适类型的渗透调节剂的说明性实例包括但不限于:盐,诸如氯化钠和乙酸钠;糖,诸如蔗糖、右旋糖和甘露糖醇;氨基酸,诸如甘氨酸;以及这些剂和/或剂类型中的一种或多种的混合物。渗透调节剂可以以足以调节制剂渗透性质的任何浓度存在。
除了修饰的免疫细胞或其群体和载剂之外,本发明的药物组合物还可以包括可用于治疗疾病的至少一种额外的治疗剂。在一些实施方案中,至少一种额外的治疗剂是一种或多种额外的修饰的免疫细胞,或其一种或多种修饰的免疫细胞群。在一些实施方案中,一种或多种额外的修饰的免疫效应细胞包含至少一个编辑的基因以敲除或敲低编辑的基因的表达。在一些实施方案中,至少一个编辑的基因是CD2、CD3CD5、CD7、CD52、B2M、CIITA、TRBC1、TRBC2、TRAC、PD-1或其组合。在一些实施方案中,编辑CD2、CD5或CD7。在一些实施方案中,编辑CD2、CD6或CD7与选自CD3、CD52、TRAC、B2M、CIITA、TRBC1、TRBC2和/或PD-1的一个或多个基因的组合。
在一些实施方案中,药物组合物包含缺乏或具有降低水平的CD2并表达含有CD2共刺激结构域的CD2嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)、和缺乏或具有降低水平的CD5并表达CD5嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,CD2和/或CD5修饰的免疫效应细胞(例如,CAR-T细胞)含有选自CD3、CD52、TRAC、PD-1或其任何组合的一个或多个编辑的基因。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者共同施用有效量的缺乏或具有降低水平的CD2并表达含有CD2共刺激结构域的CD2嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)和有效量的缺乏或具有降低水平的CD7的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,CD2和/或CD7修饰的免疫效应细胞(例如,CAR-T细胞)包含选自CD3、CD52、TRAC、PD-1或其任何组合的一个或多个编辑的基因。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者共同施用有效量的缺乏或具有降低水平的CD2并表达含有CD2共刺激结构域的CD2嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)、有效量的缺乏或具有降低水平的CD5的修饰的免疫效应细胞(例如,CAR-T细胞)和有效量的缺乏或具有降低水平的CD7的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,CD2、CD5和/或CD7修饰的免疫效应细胞(例如,CAR-T细胞)含有选自CD3、CD52、TRAC、PD-1或其任何组合的一个或多个编辑的基因。
在一些实施方案中,本文所述的药物组合物还包含化疗剂。在一些实施方案中,药物组合物还包含细胞因子肽或编码细胞因子肽的核酸序列。在一些实施方案中,包含修饰的免疫细胞或其群体的药物组合物可以与额外的治疗剂分开施用。
本发明的药物组合物可以用于治疗对自体或同种异体免疫细胞免疫疗法有反应的任何疾病或病状。例如,在一些实施方案中,药物组合物可用于治疗瘤形成。在一些实施方案中,瘤形成是T细胞或NK细胞恶性肿瘤。在一些实施方案中,T细胞或NK细胞恶性肿瘤在前体T细胞或NK细胞中。在一些实施方案中,T细胞或NK细胞恶性肿瘤在成熟T细胞或NK细胞中。瘤形成的非限制性实例包括T细胞急性淋巴细胞白血病(T-ALL)、蕈样肉芽肿(MF)、塞扎里综合征(SS)、外周T/NK细胞淋巴瘤、间变性大细胞淋巴瘤ALK+、原发性皮肤T细胞淋巴瘤、T细胞大颗粒淋巴细胞白血病、血管免疫母细胞性T/NK细胞淋巴瘤、肝脾T细胞淋巴瘤、原发性皮肤CD30+淋巴增生性病症、结外NK/T细胞淋巴瘤、成人T细胞白血病/淋巴瘤、T细胞幼淋巴细胞白血病、皮下脂膜炎样T细胞淋巴瘤、原发性皮肤γ-δT细胞淋巴瘤、侵袭性NK细胞白血病和肠病相关T细胞淋巴瘤。
关于本发明的遗传修饰的免疫细胞的治疗用途的一个考虑因素是实现最佳或令人满意的效果所必需的细胞数量。待施用的细胞数量可因接受治疗的受试者而异。在一个实施方案中,将104至1010个之间、105至109个之间或106至108个之间的本发明的遗传修饰的免疫反应细胞施用于人受试者。在一些实施方案中,将至少约1x 108、2x 108、3x 108、4x108和5x 108个本发明的遗传修饰的免疫细胞施用于人受试者。确定精确的有效剂量可基于每个个体受试者的因素,包括他们的体型、年龄、性别、体重和状况。本领域技术人员根据本公开和本领域知识可以容易地确定剂量。
技术人员可以容易地确定组合物中和待在本发明的方法中施用的细胞数量和任选的添加剂、媒介物和/或载剂的量。通常,添加剂(除了一种或多种活性免疫细胞之外)以约0.001至50%(重量)的磷酸盐缓冲盐水溶液存在,并且活性成分以微克至毫克的数量级存在,诸如约0.0001至约5重量%,优选约0.0001至约1重量%,仍更优选约0.0001至约0.05重量%或约0.001至约20重量%,优选约0.01至约10重量%,并且仍更优选约0.05至约5重量%。当然,对于待施用于动物或人的任何组合物,以及对于任何特定的施用方法,因此优选确定:毒性,诸如通过在合适的动物模型(例如,啮齿动物,诸如小鼠)中确定致死量(LD)和LD50;以及一种或多种组合物的剂量、其中组分的浓度和施用一种或多种组合物的时间,这引起合适的反应。根据技术人员的知识、本公开和本文引用的文件,此类确定不需要过度实验。并且,无需过度实验即可确定依次施用的时间。
在一个实施方案中,本文所述的方法和组合物可用于生成表达CAR并且可具有一个或多个碱基编辑修饰的工程化T细胞,使得工程化T细胞可以针对靶标增强特异性免疫反应。CAR可特异性地针对抗原靶标,抗原可由宿主中的细胞呈递。在一些实施方案中,免疫反应涵盖细胞毒性。在一些实施方案中,工程化T细胞针对其靶标具有增强的细胞毒性反应。在一些实施方案中,与非工程化T细胞相比,工程化T细胞诱导针对其靶标的增强的细胞毒性反应。在一些实施方案中,与非工程化细胞相比,工程化T细胞表现出增强至少1.1倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍或更多倍的细胞毒性反应。在一些实施方案中,与非工程化细胞相比,工程化T细胞可以杀伤多至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少200%、至少500%或至少1000%的靶细胞。在一些实施方案中,T细胞可以诱导更高的记忆反应。在一些实施方案中,T细胞可以诱导比非工程化细胞更低的炎性细胞因子水平,也就是说,工程化细胞不引起细胞因子风暴反应。
在一些实施方案中,将工程化T细胞施用于同种异体宿主,其中工程化T细胞不被宿主排斥。在一些实施方案中,同种异体T细胞诱导宿主的可忽略或最小的排斥。在一些实施方案中,工程化T细胞具有自相残杀抗性。
在一些实施方案中,药物组合物被配制用于递送至受试者。施用本文所述的药物组合物的合适途径包括但不限于:局部、皮下、透皮、皮内、病灶内、关节内、腹膜内、膀胱内、透粘膜、牙龈、牙内、耳蜗内、经鼓室、器官内、硬膜外、鞘内、肌肉内、静脉内、血管内、骨内、眼周、肿瘤内、脑内和脑室内施用。
在一些实施方案中,将本文所述的药物组合物局部施用至患病部位(例如,肿瘤部位)。在一些实施方案中,本文所述的药物组合物通过注射、通过导管的方式、通过栓剂的方式或通过植入物的方式施用于受试者,所述植入物由多孔、无孔或凝胶状材料(包括膜,诸如硅橡胶膜,或纤维)构成。
在其他实施方案中,本文所述的药物组合物在控释系统中递送。在一个实施方案中,可以使用泵(参见,例如,Langer,1990,Science249:1527-1533;Sefton,1989,CRCCrit.Ref.Biomed.Eng.14:201;Buchwald等人,1980,Surgery 88:507;Saudek等人,1989,N.Engl.J.Med.321:574)。在另一个实施方案中,可以使用聚合物材料。(参见,例如,Medical Applications of Controlled Release(Langer和Wise编辑,CRC Press,BocaRaton,Fla.,1974);Controlled Drug Bioavailability,Drug Product Design andPerformance(Smolen和Ball编辑,Wiley,New York,1984);Ranger和Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61.另见Levy等人,1985,Science 228:190;During等人,1989,Ann.Neurol.25:351;Howard等人,1989,J.Neurosurg.71:105)。其他控释系统在例如Langer,同上中讨论。
在一些实施方案中,药物组合物根据常规程序配制成适合静脉内或皮下施用于受试者(例如,人)的组合物。在一些实施方案中,用于注射施用的药物组合物是用作增溶剂和减轻注射部位的疼痛的局部麻醉剂(诸如利多卡因(lignocaine))的无菌等渗溶液。一般来讲,成分单独提供或一起混合在单位剂型中,例如,作为指示活性剂的量的气密容器(诸如安瓿或小袋)中的干燥的冻干粉末或无水浓缩物。在药物待通过输注施用的情况下,可以用含有无菌药用级水或盐水的输注瓶分配药物。在药物组合物通过注射施用的情况下,可以提供装有无菌注射用水或盐水的安瓿,以便可以在施用前混合成分。
用于全身施用的药物组合物可以是液体,例如无菌盐水、乳酸林格氏溶液或汉克氏溶液(Hank's solution)。此外,药物组合物可以呈固体形式并且在使用前立即重新溶解或悬浮。也考虑了冻干形式。药物组合物可以包含在脂质颗粒或囊泡(诸如脂质体或微晶)中,其也适用于肠胃外施用。颗粒可以具有任何合适的结构,诸如单层或多层,只要其中含有组合物即可。化合物可以包埋在含有融合脂质二油酰磷脂酰乙醇胺(DOPE)、低水平(5-10mol%)阳离子脂质的“稳定质粒-脂质颗粒”(SPLP)中,并且通过聚乙二醇(PEG)涂层稳定(Zhang Y.P.等人,Gene Ther.1999,6:1438-47)。带正电的脂质,诸如N-[1-(2,3-二油酰氧基)丙基]-N,N,N-三甲基-甲基硫酸铵或“DOTAP”,特别优选用于此类颗粒和囊泡。此类脂质颗粒的制备是众所周知的。参见,例如,美国专利号4,880,635;4,906,477;4,911,928;4,917,951;4,920,016;和4,921,757,其各自通过引用并入本文。
例如,本文所述的药物组合物可以作为单位剂量施用或包装。当参考本公开的药物组合物使用时,术语“单位剂量”是指适合作为单一剂量用于受试者的物理离散单位,每个单位含有经计算与所需稀释剂结合产生期望治疗效果的预定量的活性材料;所述稀释剂即载剂或媒介物。
此外,药物组合物可以作为包含以下的药盒提供:(a)含有冻干形式的本发明的化合物的容器和(b)含有药学上可接受的稀释剂(例如,用于重溶或稀释本发明的冻干化合物的无菌稀释剂)的第二容器。任选与此类容器相关的可以是规范药物或生物产品的制造、使用或销售的政府机构规定的形式的通知,所述通知反映了制造、使用或销售机构批准用于人施用。
在另一个方面,包括了含有可用于治疗上述疾病的材料的制品。在一些实施方案中,制品包含容器和标记。合适的容器包括例如瓶、小瓶、注射器和试管。所述容器可由各种材料(诸如玻璃或塑料)形成。在一些实施方案中,容器装有有效治疗本文所述疾病的组合物并且可以具有无菌进入孔。例如,容器可以是具有皮下注射针可刺穿的塞子的静脉溶液袋或小瓶。组合物中的活性剂是本发明的化合物。在一些实施方案中,容器上或与容器相关的标记表明组合物用于治疗所选疾病。制品还可以包含第二容器,所述第二容器包含药学上可接受的缓冲液,诸如磷酸盐缓冲盐水、林格氏溶液或右旋糖溶液。其还可以包括商业和用户角度期望的其他材料,包括其他缓冲液、稀释剂、过滤器、针头、注射器以及具有使用说明的包装插页。
在一些实施方案中,本文所述的任何融合蛋白、gRNA和/或复合物作为药物组合物的一部分提供。在一些实施方案中,药物组合物包含本文提供的任何融合蛋白。在一些实施方案中,药物组合物包含本文提供的任何复合物。在一些实施方案中,药物组合物包含核糖核蛋白复合物,所述核糖核蛋白复合物包含与gRNA和阳离子脂质形成复合物的RNA指导的核酸酶(例如,Cas9)。在一些实施方案中,药物组合物包含gRNA、核酸可编程DNA结合蛋白、阳离子脂质和药学上可接受的赋形剂。药物组合物可以任选地包含一种或多种额外的治疗活性物质。
在一些实施方案中,将本文提供的组合物施用于受试者,例如人受试者,以便在受试者内实现靶向基因组修饰。在一些实施方案中,从受试者获得细胞,并且使细胞与本文提供的任何药物组合物接触。在一些实施方案中,任选地在已经在细胞中实现或检测到期望的基因组修饰之后,将从受试者中取出并且离体与药物组合物接触的细胞重新引入到受试者中。递送包含核酸酶的药物组合物的方法是已知的,并且描述于例如美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824中,所有所述专利的公开内容通过引用整体并入本文。尽管本文提供的药物组合物的描述主要针对适合施用于人的药物组合物,但技术人员将理解此类组合物通常适合施用于各种动物或生物体,例如,用于兽医用途。
为了使组合物适合施用于各种动物而对适合施用于人的药物组合物进行修饰是众所周知的,并且普通技术的兽医药理学家仅通过普通的(如果有的话)实验就可以设计和/或执行这样的修饰。考虑施用药物组合物的受试者包括但不限于人和/或其他灵长类动物;哺乳动物、家养动物、宠物和商业相关的哺乳动物,诸如牛、猪、马、羊、猫、狗、小鼠和/或大鼠;和/或鸟类,包括商业相关的鸟类,诸如鸡、鸭、鹅和/或火鸡。
本文所述的药物组合物的制剂可以通过药理学领域已知的或以后开发的任何方法来制备。一般来讲,此类制备方法包括以下步骤:将一种或多种活性成分与赋形剂和/或一种或多种其他辅助成分结合,然后,如果需要和/或期望,将产品成型和/或包装成期望的单剂量或多剂量单位。药物制剂可以额外包含药学上可接受的赋形剂,其如本文所用包括适合期望的特定剂型的任何和所有的溶剂、分散介质、稀释剂或其他液体媒介物、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂、固体粘合剂、润滑剂等。Remington’s The Science and Practice of Pharmacy,第21版,A.R.Gennaro(Lippincott,Williams&Wilkins,Baltimore,MD,2006;通过引用整体并入本文)公开了用于配制药物组合物的各种赋形剂和用于药物组合物制备的已知技术。对于用于生产包含核酸酶的药物组合物的其他合适的方法、试剂、赋形剂和溶剂,另见PCT申请PCT/US2010/055131(公开号WO2011/053982 A8,2010年11月2日提交),其通过引用整体并入本文。
除非任何常规赋形剂介质与物质或其衍生物不相容,诸如通过产生任何不期望的生物效应或以其他有害的方式与药物组合物的任何其他一种或多种组分相互作用,否则其用途考虑在本公开的范围内。
如上所述的组合物可以以有效量施用。有效量将取决于施用方式、所治疗的特定病状和期望的结果。它还可能取决于病状的阶段、受试者的年龄和身体状况、协同治疗的性质(如果有的话)以及执业医生众所周知的类似因素。对于治疗应用,它是足以实现医学上期望的结果的量。
在一些实施方案中,根据本公开的组合物可以用于治疗多种疾病、病症和/或病状中的任一种。
治疗方法
本发明的一些方面提供了治疗有需要的受试者的方法,所述方法包括向有需要的受试者施用有效治疗量的如本文所述的药物组合物。更具体地,治疗方法包括向有需要的受试者施用一种或多种药物组合物,所述药物组合物包含表达嵌合受体(CAR)并具有至少一个编辑的基因(例如,CD2)的修饰的免疫细胞群,其中至少一个编辑的基因提供自相残杀抗性,增强功能,或降低修饰的免疫细胞的免疫抑制(immunosuppression)或抑制(inhibition),并且其中至少一个编辑的基因的表达被敲除或敲低。在一些实施方案中,治疗方法是自体免疫细胞疗法。在其他实施方案中,治疗方法是同种异体免疫细胞疗法。
在某些实施方案中,通过遗传修饰免疫细胞以表达本文考虑的嵌合抗原受体(CAR),将免疫细胞的特异性重定向至在受试者的患病或改变的细胞的表面上表达的标志物(例如,CD2)。在一些实施方案中,治疗方法包括向受试者施用如本文所述的免疫细胞,其中免疫细胞已经被遗传修饰以将其特异性重定向至肿瘤细胞上表达的标志物(例如,CD2)。因此,本公开的一些实施方案提供了一种治疗受试者的瘤形成的方法。在一些实施方案中,瘤形成是T细胞或NK细胞恶性肿瘤。在一些实施方案中,T细胞或NK细胞恶性肿瘤在前体T细胞或NK细胞中。在一些实施方案中,T细胞或NK细胞恶性肿瘤在成熟T细胞或NK细胞中。瘤形成的非限制性实例包括T细胞急性淋巴细胞白血病(T-ALL)、蕈样肉芽肿(MF)、塞扎里综合征(SS)、外周T/NK细胞淋巴瘤、间变性大细胞淋巴瘤ALK+、原发性皮肤T细胞淋巴瘤、T细胞大颗粒淋巴细胞白血病、血管免疫母细胞性T/NK细胞淋巴瘤、肝脾T细胞淋巴瘤、原发性皮肤CD30+淋巴增生性病症、结外NK/T细胞淋巴瘤、成人T细胞白血病/淋巴瘤、T细胞幼淋巴细胞白血病、皮下脂膜炎样T细胞淋巴瘤、原发性皮肤γ-δT细胞淋巴瘤、侵袭性NK细胞白血病和肠病相关T细胞淋巴瘤。
在一些实施方案中,治疗方法包括向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的修饰的免疫效应细胞(例如,CAR-T细胞),所述细胞缺乏或具有降低水平的功能性T细胞受体α恒定(TRAC)、分化簇2(CD2)、分化簇3(CD3)、分化簇5(CD5)、分化簇7(CD7)、分化簇52(CD52)和/或程序性细胞死亡1(PD-1)、β-2微球蛋白(B2M)、II类主要组织相容性复合物反式激活因子(CIITA)、T细胞受体β恒定1(TRBC1)、T细胞受体β恒定2(TRBC2)或其组合。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的修饰的免疫效应细胞(例如,CAR-T细胞),所述免疫效应细胞缺乏CD2或具有降低的CD2水平并且表达含有CD2共刺激结构域的CD2嵌合抗原受体。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD5并表达CD5嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD7并表达CD7嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的功能性TRAC的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD3的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD52的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的PD-1的修饰的免疫效应细胞(例如,CAR-T细胞)。
在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD2并且缺乏或具有降低水平的TRAC、CD52、B2M、CIITA、TRBC1、TRBC2和/或PD-1或其组合并且表达含有CD2共刺激结构域的CD2嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD2、TRAC、CD52、B2M、CIITA、TRBC1、TRBC2和PD-1并且表达含有CD2共刺激结构域的CD2嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD5并且缺乏或具有降低水平的TRAC、CD52、B2M、CIITA、TRBC1、TRBC2和/或PD-1或其组合并且表达CD5嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD5、TRAC、CD52、B2M、CIITA、TRBC1、TRBC2和PD-1或其组合并且表达CD5嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD7并且缺乏或具有降低水平的TRAC、CD3、CD52、B2M、CIITA、TRBC1、TRBC2和/或PD-1或其组合并且表达CD7嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者施用有效量的缺乏或具有降低水平的CD7、CD3、CD52、B2M、CIITA、TRBC1、TRBC2和PD-1并且表达CD7嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。
在一些实施方案中,治疗受试者的瘤形成的方法包括向受试者施用如本文所述的免疫细胞和一种或多种额外的治疗剂。例如,本发明的免疫细胞可以与一种或多种额外的修饰的免疫细胞共同施用。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者共同施用有效量的缺乏或具有降低水平的CD2并表达含有CD2共刺激结构域的CD2嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)和有效量的缺乏或具有降低水平的CD5并且表达CD5嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者共同施用有效量的缺乏或具有降低水平的CD2并表达含有CD2共刺激结构域的CD2嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)和有效量的缺乏或具有降低水平的CD7并且表达CD7嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。在一些实施方案中,向患有或有倾向发展瘤形成(例如,T细胞或NK细胞恶性肿瘤)的受试者共同施用有效量的缺乏或具有降低水平的CD2并表达含有CD2共刺激结构域的CD2嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)、有效量的缺乏或具有降低水平的CD5并且表达CD5嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)和有效量的缺乏或具有降低水平的CD7并且表达CD7嵌合抗原受体的修饰的免疫效应细胞(例如,CAR-T细胞)。
在一些实施方案中,本发明的免疫细胞可以与细胞因子共同施用。在一些实施方案中,细胞因子是IL-2、IFN-α、IFN-γ或其组合。在一些实施方案中,免疫细胞与化疗剂共同施用。化疗剂可以是环磷酰胺、多柔比星(doxorubicin)、长春新碱(vincristine)、泼尼松(prednisone)或利妥昔单抗(rituximab)或其组合。其他化疗剂包括奥妥珠单抗(obinutuzumab)、苯达莫司汀(bendamustine)、苯丁酸氮芥(chlorambucil)、环磷酰胺、依鲁替尼(ibrutinib)、甲氨蝶呤(methotrexate)、阿糖胞苷(cyt arabine)、地塞米松(dexamethasone)、顺铂(cisplatin)、硼替佐米(borte zomib)、氟达拉滨(fludarabine)、艾代拉里斯(idelalisib)、阿卡替尼(ac alabrutinib)、来那度胺(lenalidomide)、维奈托克(venetoclax)、环磷酰胺、异环磷酰胺、依托泊苷(etoposide)、喷司他丁(pentostatin)、美法仑(melphalan)、卡非佐米(carfilzomib)、伊沙佐米(ixazomib)、帕比司他(panobinostat)、达雷木单抗(daratumumab)、埃罗妥珠单抗(elotuzum ab)、沙利度胺(thalidomide)、来那度胺或泊马度胺(pomalidomide)或其组合。这种共同施用可以是同时施用或依次施用。在施用第一种药物组合物或治疗剂之后的治疗过程期间的任何时间可以发生随后施用的治疗剂或药物组合物的依次施用。
在本发明的一些实施方案中,施用的免疫细胞在体内增殖并且可以在受试者体内持续一段延长的时间。在一些实施方案中,本发明的免疫细胞可以成熟为记忆免疫细胞并在受试者体内保持循环,从而生成能够积极响应于表达由嵌合抗原受体识别的标志物的患病或改变细胞的复发的细胞群。
可以使用包括但不限于输注、输液或肠胃外的常规技术来进行本文考虑的药物组合物的施用。在一些实施方案中,肠胃外施用包括血管内、静脉内、肌肉内、动脉内、鞘内、肿瘤内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下和胸骨内输注或注射。
试剂盒
本发明提供了用于治疗受试者的瘤形成的试剂盒。在一些实施方案中,试剂盒用于治疗T细胞或NK细胞恶性肿瘤。在一些实施方案中,T细胞或NK细胞恶性肿瘤在前体T细胞或NK细胞中。在一些实施方案中,T细胞或NK细胞恶性肿瘤在成熟T细胞或NK细胞中。在一些实施方案中,试剂盒用于治疗选自由以下组成的组的瘤形成:T细胞急性淋巴细胞白血病(T-ALL)、蕈样肉芽肿(MF)、塞扎里综合征(SS)、外周T/NK细胞淋巴瘤、间变性大细胞淋巴瘤ALK+、原发性皮肤T细胞淋巴瘤、T细胞大颗粒淋巴细胞白血病、血管免疫母细胞性T/NK细胞淋巴瘤、肝脾T细胞淋巴瘤、原发性皮肤CD30+淋巴增生性病症、结外NK/T细胞淋巴瘤、成人T细胞白血病/淋巴瘤、T细胞幼淋巴细胞白血病、皮下脂膜炎样T细胞淋巴瘤、原发性皮肤γ-δT细胞淋巴瘤、侵袭性NK细胞白血病和肠病相关T细胞淋巴瘤。在一些实施方案中,试剂盒用于治疗人受试者。
在一些实施方案中,试剂盒包含如本文所提供的任何嵌合抗原受体。在一些实施方案中,试剂盒包含编码如本文所提供的任何嵌合抗原受体的核酸。在一些实施方案中,试剂盒包含如本文所提供的任何修饰的免疫细胞。在一些实施方案中,试剂盒包括用CD2共刺激结构域工程改造的CD2嵌合抗原受体(CAR)。在一些实施方案中,试剂盒包括具有自相残杀抗性的修饰的免疫细胞,所述免疫细胞包含CD2多肽中的突变并且表达用CD2共刺激结构域工程改造的CD2嵌合抗原受体(CAR)。在一些实施方案中,试剂盒还包括表达CD5 CAR的修饰的免疫细胞和/或表达CD7 CAR的修饰的免疫细胞。在一些实施方案中,任何免疫细胞还包含CD3、TRAC、PD1、B2M、CIITA、TRBC1、TRBC2和/或CD52多肽或其组合中的突变。在一些实施方案中,试剂盒包括本文提供的任何修饰的免疫细胞的群体。在一些实施方案中,试剂盒包含如本文所提供的任何药物组合物。在一些实施方案中,试剂盒包括CD2修饰的免疫细胞群或包含CD2修饰的免疫细胞或修饰的免疫细胞群的药物组合物。在一些实施方案中,试剂盒包括CD5修饰的免疫细胞群或包含CD5修饰的免疫细胞或修饰的免疫细胞群的药物组合物。在一些实施方案中,试剂盒包括CD7修饰的免疫细胞群或包含CD7修饰的免疫细胞或修饰的免疫细胞群的药物组合物。
在一些实施方案中,试剂盒还包括碱基编辑器多肽或编码碱基编辑器多肽的多核苷酸,其中碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和脱氨酶。在一些实施方案中,napDNAbp是Cas9或Cas12。在一些实施方案中,编码碱基编辑器的多核苷酸是mRNA序列。在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
本发明还提供了包含核酸构建体的试剂盒,所述核酸构建体包含编码核碱基编辑器和指导RNA的核苷酸序列。在一些实施方案中,核酸构建体包含驱动核碱基编辑器表达的异源启动子。在一些实施方案中,本公开提供了包含核酸构建体的试剂盒,所述核酸构建体包含:(a)编码融合至如本文所提供的胞苷或腺苷脱氨酶的(a)Cas9结构域的核苷酸序列;和(b)驱动(a)序列表达的异源启动子。在一些实施方案中,Cas9结构域融合至胞苷脱氨酶。在一些实施方案中,Cas9结构域融合至腺苷脱氨酶。
在一些实施方案中,试剂盒包含胞苷脱氨酶核碱基编辑器和指导RNA。在一些实施方案中,试剂盒包含腺苷脱氨酶核碱基编辑器和指导RNA。在一些实施方案中,试剂盒还包含一个或多个指导核酸序列。在一些实施方案中,一个或多个指导核酸序列靶向CD2。在一些实施方案中,一个或多个指导核酸序列靶向CD2、CD52、TRAC、B2M、CIITA、TRBC1、TRBC2和PDC1/PD-1中的每一个。在一些实施方案中,指导RNA具有与编码CD2的基因的核酸序列具有至少85%互补性的核酸序列。在一些实施方案中,试剂盒包含胞苷脱氨酶核碱基编辑器和CD2指导RNA。在一些实施方案中,指导RNA具有与编码CD5的基因的核酸序列具有至少85%互补性的核酸序列。在一些实施方案中,指导RNA具有与编码CD7的基因的核酸序列具有至少85%互补性的核酸序列。在一些实施方案中,试剂盒还可包括一个或多个额外的指导RNA,每个指导RNA具有与编码TRAC、PD1、B2M、CIITA、TRBC1、TRBC2和/或CD52的基因的核酸序列具有至少85%互补性的核酸序列。
瘤形成治疗试剂盒还可包含关于在瘤形成治疗中使用修饰的免疫细胞的书面说明。在其他实施方案中,说明包括以下中的至少一项:注意事项;警告;临床研究;和/或参考文献。说明可直接打印在容器上(如果存在),或作为贴在容器上的标记,或作为提供在容器中或与容器一起提供的单独的纸张、小册子、卡片或文件夹。在另一个实施方案中,试剂盒可以包含标记或单独插页(包装插页)形式的关于合适的操作参数的说明。在又另一个实施方案中,试剂盒可以包含一个或多个容器,所述容器具有用作检测、校准或归一化的标准的适当阳性和阴性对照或对照样品。试剂盒还可以包含第二容器,所述第二容器包含药学上可接受的缓冲液,诸如(无菌)磷酸盐缓冲盐水、林格氏溶液或右旋糖溶液。其还可以包括商业和用户角度期望的其他材料,包括其他缓冲液、稀释剂、过滤器、针头、注射器以及具有使用说明的包装插页。
除非另有说明,否则本发明的实践采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,所述技术完全在技术人员的能力范围内。此类技术在文献中充分解释,所述文献诸如"Molecular Cloning:A Laboratory Manual",第二版(Samb rook,1989);"Oligonucleotide Synthesis"(Gait,1984);"Animal Cell Culture"(Freshney,1987);"Methods in Enzymology""Handbook o f Experimental Immunology"(Weir,1996);"Gene Transfer Vectors for Mammalian Cells"(Miller和Calos,1987);"Current Protocols in Molecular Biology"(Ausubel,1987);"PCR:The PolymeraseChain Reaction",(Mullis,1994);"Current Protocols in Immunology"(Col igan,1991)。这些技术适用于生产本发明的多核苷酸和多肽,并且因此可以考虑用于进行和实践本发明。用于特定实施方案的特别有用的技术将在以下部分中讨论。
提出以下实施例以便向本领域普通技术人员提供关于如何制备和使用本发明的测定、筛选和治疗方法的完整公开内容和描述,并且不旨在限制发明人视作其发明的内容的范围。
实施例
实施例1:用抗自相残杀的CAR-T细胞治疗T-ALL
T细胞急性淋巴细胞白血病(T-ALL)是一种侵袭性骨髓恶性肿瘤。在儿童中诊断出约12-15%的T-ALL病例。复发后5年生存率低于25%。护理标准是使用化学疗法诱导第二次缓解,然后进行同种异体造血干细胞移植(alloHSCT)。然而,许多患者对化学疗法难治或具有高肿瘤负荷,并且无法诱导作为alloHSCT的桥梁的深度缓解。此外,经过大量预治疗的患者通常不适合自体CAR-T治疗。因此,需要替代治疗选项来治疗T-ALL。
为了检查编辑的CAR-T细胞是否可以诱导患者的缓解以便桥接alloHSCT治疗,使用多重编辑来产生抗自相残杀的CAR-T细胞。如图1所示,对表达CD2嵌合抗原受体的T细胞进行编辑以减少或消除用于靶向CD3-CD2+或CD3+CD2+T-ALL肿瘤细胞的CD2、TRAC、CD52和PD-1的表达。用CD2共刺激结构域对抗CD2嵌合抗原受体(CAR)进行工程改造,所述CD2共刺激结构域对应于人CD2细胞质结构域的残基235-351(图3、图4)。抗CD2 CAR的结构和氨基酸序列在图3中示出,并且含有前导肽序列、scFv轻链、(GGGGS)3(SEQ ID NO:381)接头、scFv重链、CD8α铰链和跨膜结构域、人CD2细胞质结构域和CD3ζ结构域。然后将抗CD2 CAR转染到编辑的T细胞中,以生成靶向表达CD2的恶性T细胞的CD2 CAR-T细胞(图2)。
如图6所示,在第-7天用Cy/Flu/Campath对约30-40名T-ALL患者进行淋巴细胞清除。在第0天,向患者输注CD2 CAR-T细胞。然后在第65天用Cy/Flu/TBI/ATG对患者进行预调理。在第70天,患者接受alloHSCT治疗。CD2 CAR-T细胞治疗预期诱导T细胞发育不全,并且允许T-ALL患者接受alloHSCT治疗。
实施例2:抗自相残杀的CAR-T细胞的制造
为了制造CD2 CAR-T细胞,从健康供体接受冷冻单采(apheresis)。然后用Plasmatherm(Barkey GmbH&Co.KG)将单采解冻。使用CliniMACS Prodigy(MiltenyiBiotec)从解冻的单采中分离出CD4和CD8T细胞。然后使用TransAct(一种即用型试剂,可从Miltenyi Biotec获得,用于经由CD3和CD28扩增和激活人T细胞)激活T细胞。使用Lonza SDNucleofector(一种电穿孔装置)通过电穿孔将mRNA编码碱基编辑器和指导RNA递送到T细胞中。在碱基编辑之后,经由慢病毒转导将CD2嵌合抗原受体(CAR)(参见例如,图3)递送到T细胞中。然后在培养物中扩增T细胞。使用流式细胞术验证CD2 CAR表达。然后用可控速率冰箱(CRF)将收获的CAR-T细胞冷冻保存。
在将CD2 CAR-T细胞与CD2-或CD2+靶细胞系共培养后,使用细胞因子ELISA验证CD2CAR-T细胞的基底和抗原诱导型信号传导。还测量了针对CD2+肿瘤细胞系的体外细胞毒性。
实施例3:使用胞嘧啶碱基编辑消除T细胞中的CD2表达
为了减少或消除T细胞中的CD2表达,生成(Agilent)了包含如上表1中提供的间隔序列的胞苷碱基编辑器BE4、单一指导RNA(sgRNA)。用于sgRNA的支架序列是spCas9支架。
通过使用流式细胞术、下一代测序、和蛋白质印迹分析,针对最少n=3个供体和最少n=5个抗体克隆来筛选指导,以验证CD2编辑(图5)。使用单克隆抗体克隆RPA2.10(目录号300202)来检测CD2。每次测试使用5μL CD2-APC。仅电穿孔(EP)用作阴性对照。使用胞苷碱基编辑器与CD2指导RNA高效减少或消除了T细胞中的CD2表达。
实施例4:使用多重修饰的免疫效应细胞的T细胞或NK细胞恶性肿瘤的组合疗法
为了检查使用多重遗传修饰的CAR-T细胞是否可以增强T细胞或NK细胞恶性肿瘤患者的治疗,基于患者的免疫表型向他们施用一种或多种修饰的CAR-T细胞。使用流式细胞术和/或序列分析,对来自患者样品的免疫细胞进行免疫表型分析,以确定是否存在CD2、CD5和CD7。通过电穿孔将mRNA编码碱基编辑器和指导RNA递送至免疫细胞中,以编辑CD2、CD5或CD7中任一者与TRAC、CD52、B2M、CIITA、TRBC1、TRBC2和PD-1的组合,从而减少和或消除这些基因在免疫细胞中的表达。在碱基编辑之后,经由慢病毒转导将使用CD2共刺激结构域工程改造的CD2嵌合抗原受体(CAR)(参见例如,图3)、CD5 CAR或CD7 CAR递送至修饰的免疫细胞中,以分别产生CD2、CD5和CD7 CAR-T细胞。
患有免疫表型为CD2+CD5+CD7-的癌症的患者接受CD2 CAR-T细胞和CD5 CAR-T细胞的治疗。患有免疫表型为CD2+CD5-CD7+的癌症的患者接受CD2 CAR-T细胞和CD7 CAR-T细胞的治疗。患有免疫表型为CD2+CD5+CD7+的癌症的患者接受CD2 CAR-T细胞、CD5 CAR-T细胞和CD7 CAR-T细胞的治疗。
实施例4:敲除CD2嵌合抗原受体(CAR)-T细胞中的CD2表达是有益的
进行实验以评价使用碱基编辑敲除细胞中的CD2基因对CD2CAR-T细胞的自相残杀的影响。使用实施例1-4中描述的方法来制备经碱基编辑以敲除CD2基因表达的T细胞群(例如,未转导的细胞(“UTD”)或“CD2编辑”细胞),以及用下表20中列出的抗CD2嵌合抗原受体(CAR)构建体转导的T细胞群。实验中使用的慢病毒载体为可商购获得的第3代假型慢病毒载体。
表20抗CD2 CAR构建体(在构建体中,以下是从N末端至C末端的结构域结构的一般描述:scFv结构域、共刺激结构域、CD3z信号传导结构域)
构建体 序列
CAR BTx118 大鼠LO-CD2a VL-VH-CD2-3z
CAR BTx119 大鼠LO-CD2a VL-VH-CD28-3z
CAR BTx120 大鼠LO-CD2a VH-VL-CD2-3z
CAR BTx121 大鼠LO-CD2a VH-VL-CD28-3z
CAR BTx122 HuLO CD2a VL-HuLO-CD2a VH-CD2-3z
CAR BTx123 HuLO CD2a VL-HuLO-CD2a VH-CD28-3z
CAR BTx124 HuLO-CD2a VH-HULO CD2a VL-CD2-3z
CAR BTx125 HuLO-CD2a VH-HuLO CD2a VL-CD28-3z
CAR BTx126 HuLO-CD2a VL-MEDl-507 VH-CD2-3z
CAR BTx127 HuLO-CD2a VL-MEDl-507 VH-CD28-3z
CAR BTx128 MEDI-507 VH-HuLO-CD2a-CD2-3Z
CAR BTx129 MEDI-507 VH-HuLO-CD2a-CD28-3Z
转导后10天,使用流式细胞术评价每个细胞群中的CD2和CAR表达(参见图7A-图7E、图8A-图8F、图9、图10A-图10D和图11A-图11D)。确定了经碱基编辑以敲除CD2基因表达的抗CD2 CAR-T细胞对表面表达CD2的细胞自我富集(图7A-图7E、图8A-图8F)。发现其中至少50%的细胞表面表达CAR的CAR-T细胞群被认为证明了CAR构建体的良好表达。不受理论的束缚,观察结果支持以下假设:与在表达类似CAR但CD28共刺激结构域被CD2共刺激结构域替换的未编辑T细胞中相比,表达具有CD28共刺激结构域的CAR的T细胞在具有活性CD2表达的未编辑细胞中显示出更高水平的表观T细胞激活(图9)。还发现通过碱基编辑敲除抗CD2 CAR-T细胞中的CD2基因导致自相残杀水平降低(图10A-图10D和图11A-图11D)。因此,证明了使用碱基编辑敲除CD2 CAR-T细胞中的CD2基因表达是有利的。
评估了CD2 CAR-T细胞刺激和基底激活(图12A和图12B)。将CD2 CAR-T细胞与CD2+Jurkat细胞或CD2-CCRF细胞分离生长或共培养。通过测量干扰素γ(IFN-γ)的水平来测量激活。CD2 CAR-T细胞仅在CD2+Jurkat细胞的存在下显示出高水平的激活(图12A),并且当细胞分离生长时,仅观察到低水平的基底激活(图12B)。
其他实施方案
从前述描述来看,显而易见的是,可以对本文所述的本发明进行改变和修改以使其适用于各种用途和条件。此类实施方案也在以下权利要求的范围内。
在本文变量的任何定义中列举的元素列表包括将该变量定义为任何单个元素或所列元素的组合(或子组合)。本文列举的实施方案包括作为任何单一实施方案或与任何其他实施方案或其部分组合的实施方案。
在本说明书中提到的所有专利和出版物均通过引用并入本文,其程度如同每个独立的专利和出版物具体地和单独地表示为通过引用并入。

Claims (188)

1.一种嵌合抗原受体(CAR),其包含
抗CD2结合结构域;和
CD2信号传导结构域和/或CD28信号传导结构域。
2.如权利要求1所述的CAR,其还包含跨膜结构域和一个或多个额外的信号传导结构域。
3.如权利要求2所述的CAR,其中所述跨膜结构域是CD8α跨膜结构域。
4.如权利要求2或3所述的CAR,其中所述一个或多个额外的信号传导结构域选自CD3ζ信号传导结构域、CD28信号传导结构域和CD137(4-1BB)信号传导结构域。
5.如权利要求4所述的CAR,其中所述一个或多个额外的信号传导结构域是CD3ζ信号传导结构域。
6.一种嵌合抗原受体(CAR),其包含
抗CD2结合结构域;
CD8α跨膜结构域;
CD2信号传导结构域和/或CD28信号传导结构域;和
CD3ζ信号传导结构域。
7.如权利要求5所述的CAR,其中所述CAR包含所述CD28信号传导结构域和/或CD137(4-1BB)信号传导结构域。
8.如权利要求1-7中任一项所述的CAR,其还包含前导肽序列。
9.如权利要求8所述的CAR,其中所述前导肽序列与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:METDTLLLWVLLLWVPGSTG。
10.如权利要求1-9中任一项所述的CAR,其中所述CD2信号传导结构域与CD2细胞质结构域具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性。
11.如权利要求10所述的CAR,其中所述CD2细胞质结构域与人CD2细胞质结构域的残基235-351具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性。
12.如权利要求1-11中任一项所述的CAR,其中所述CD2信号传导结构域与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
TKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSN(SEQ ID NO:370)。
13.如权利要求3-12中任一项所述的CAR,其中所述CD8α跨膜结构域与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
SDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYC(SEQ ID NO:371)。
14.如权利要求4-13中任一项所述的CAR,其中所述CD3ζ信号传导结构域与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
RVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:372)。
15.如权利要求1-14中任一项所述的CAR,其中所述CD28信号传导结构域与以下氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
RSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS(SEQ ID NO:373)。
16.如权利要求4-15中任一项所述的CAR,其中所述CD137(4-1BB)信号传导结构域与以下氨基酸序列之一具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
KRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL(SEQ ID NO:374);或
RFSVVKRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL(SEQ ID NO:375)。
17.如权利要求1-16中任一项所述的CAR,其中所述抗CD2结合结构域包含与以下氨基酸序列之一具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性的scFv轻链序列:
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:376);
EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:377);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378);
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:379);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378);或
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:380)。
18.如权利要求1-17中任一项所述的CAR,其中所述抗CD2结合结构域包含与以下氨基酸序列之一具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性的scFv重链序列:
EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:377)
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:376);
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:379);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378);
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:380);和
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:378)。
19.如权利要求1-18中任一项所述的CAR,其还包含接头。
20.如权利要求19所述的CAR,其中所述接头将所述scFv轻链序列连接至所述抗CD2结合结构域的所述scFv重链序列。
21.如权利要求19或20所述的CAR,其中所述接头包含序列(GGGGS)n(SEQ ID NO:247),其中n是1至10的整数。
22.如权利要求19-21中任一项所述的CAR,其中所述接头包含序列(GGGGS)3(SEQ IDNO:381)。
23.如权利要求1-22中任一项所述的CAR,其中所述抗CD2结合结构域包含与以下氨基酸序列之一具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性的抗CD2 scFv:
DVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKGGGGSGGGGSGGGGSEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:382);
EVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELK(SEQ ID NO:383);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSS(SEQ ID NO:384);
QVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:385);
DVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSS(SEQ ID NO:386);或
QVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIK(SEQ ID NO:387)。
24.一种嵌合抗原受体(CAR),其中所述CAR与以下氨基酸序列中的任一者的氨基酸序列具有至少85%、至少90%、至少95%、至少98%、至少99%或100%的同一性:
METDTLLLWVLLLWVPGSTGDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKGGGGSGGGGSGGGGSEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:754);
METDTLLLWVLLLWVPGSTGEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:755);
METDTLLLWVLLLWVPGSTGDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:756);
METDTLLLWVLLLWVPGSTGQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:757);
METDTLLLWVLLLWVPGSTGDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:758);
METDTLLLWVLLLWVPGSTGQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCTKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSNRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:759);
METDTLLLWVLLLWVPGSTGDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKGGGGSGGGGSGGGGSEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:761);
METDTLLLWVLLLWVPGSTGEVQLQQSGPELQRPGASVKLSCKASGYIFTEYYMYWVKQRPKQQLELVGRIDPEDGSIDYVEKFKKKATLTADTSSNTAYMQLSSLTSEDTATYFCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVLTQTPPTLLATIGQSVSISCRSSQSLLHSSGNTYLNWLLQRTGQSPQPLIYLVSKLESGVPNRFSGSGSGTDFTLKISGVEAEDLGVYYCMQFTHYPYTFGAGTKLELKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:762);
METDTLLLWVLLLWVPGSTGDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:763);
METDTLLLWVLLLWVPGSTGQVQLVQSGAEVKKPGASVKVSCKASGYTFTEYYMYWVRQAPGQGLELMGRIDPEDGSIDYVEKFKKKVTLTADTSSSTAYMELSSLTSDDTAVYYCARGKFNYRFAYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPRv(SEQ ID NO:764);
METDTLLLWVLLLWVPGSTGDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKGGGGSGGGGSGGGGSQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:765);和
METDTLLLWVLLLWVPGSTGQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYMHWVRQAPGQGLEWMGRINPNSGGTNYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGRTEYIVVAEGFDYWGQGTLVTVSSGGGGSGGGGSGGGGSDVVMTQSPPSLLVTLGQPASISCRSSQSLLHSSGNTYLNWLLQRPGQSPQPLIYLVSKLESGVPDRFSGSGSGTDFTLKISGVEAEDVGVYYCMQFTHYPYTFGQGTKLEIKSDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR(SEQ ID NO:766)。
25.一种修饰的免疫细胞,其包含:
如权利要求1-24中任一项所述的嵌合抗原受体;和
所述修饰的免疫细胞的基因组中的使所述修饰的免疫细胞的内源CD2基因失活的一个或多个突变。
26.如权利要求25所述的修饰的免疫细胞,其还包含至少一个额外的基因序列或其调控元件中的一个或多个突变。
27.如权利要求25或26所述的修饰的免疫细胞,其中所述一个或多个突变是至少一个单一靶标核碱基修饰。
28.如权利要求27所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰由一种或多种碱基编辑器生成。
29.如权利要求28所述的修饰的免疫细胞,其中所述一种或多种碱基编辑器是CBE和/或ABE。
30.如权利要求27-29中任一项所述的修饰的免疫细胞,其中与没有所述修饰的对照细胞相比,所述单一靶标核碱基修饰减少或消除表达和/或功能。
31.如权利要求30所述的修饰的免疫细胞,其中与没有所述修饰的对照细胞相比,表达和/或功能减少至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。
32.如权利要求26-31中任一项所述的修饰的免疫细胞,其中所述至少一个额外的基因序列包含检查点抑制基因序列、免疫反应调控基因序列和/或免疫原性基因序列。
33.如权利要求26-32中任一项所述的修饰的免疫细胞,其中所述至少一个额外的基因序列包含检查点抑制基因序列。
34.如权利要求32或33所述的修饰的免疫细胞,其中所述检查点抑制基因序列包含PDCD1/PD-1基因序列。
35.如权利要求26-34中任一项所述的修饰的免疫细胞,其中所述至少一个额外的基因序列包含TRAC基因序列。
36.如权利要求26-35中任一项所述的修饰的免疫细胞,其中所述至少一个额外的基因序列包含T细胞标志物基因序列。
37.如权利要求26-36中任一项所述的修饰的免疫细胞,其中所述至少一个额外的基因序列包含CD52基因序列。
38.如权利要求26-37中任一项所述的修饰的免疫细胞,其中所述至少一个额外的基因序列包含TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列。
39.一种修饰的免疫细胞,其包含:
如权利要求1-24中任一项所述的嵌合抗原受体;和
所述修饰的免疫细胞中的CD2基因序列、TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列或其调控元件中的每一个中的使所述基因序列中的每一个的表达失活的至少一个单一靶标核碱基修饰。
40.如权利要求25-39中任一项所述的修饰的免疫细胞,其中与没有所述修饰的相同类型的对照细胞相比,所述修饰的免疫细胞表现出自相残杀抗性和增加的抗肿瘤活性。
41.如权利要求25-40中任一项所述的修饰的免疫细胞,其中对所述免疫细胞进行离体修饰。
42.如权利要求25-41中任一项所述的修饰的免疫细胞,其中所述修饰的免疫细胞不包含可检测的易位。
43.如权利要求25-41中任一项所述的修饰的免疫细胞,其中所述免疫细胞包含小于1%的插入缺失。
44.如权利要求25-41中任一项所述的修饰的免疫细胞,其中所述免疫细胞包含小于5%的非靶标编辑。
45.如权利要求25-41中任一项所述的修饰的免疫细胞,其中所述免疫细胞包含小于5%的脱靶编辑。
46.如权利要求27-45中任一项所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰在外显子中。
47.如权利要求46所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰在所述CD2基因序列的外显子2、外显子3、外显子4或外显子5内。
48.如权利要求27-47中任一项所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰引入提前终止密码子。
49.如权利要求48所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰在所述CD2基因序列的外显子2、外显子3、外显子4或外显子5内引入提前终止密码子。
50.如权利要求27-47中任一项所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰在剪接供体位点或剪接受体位点中。
51.如权利要求50所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰在所述CD2基因序列的外显子3剪接供体位点中。
52.如权利要求27-51中任一项所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰由一种或多种碱基编辑器生成。
53.如权利要求52所述的修饰的免疫细胞,其中所述一种或多种碱基编辑器是CBE和/或ABE。
54.如权利要求25-53中任一项所述的修饰的免疫细胞,其中所述免疫细胞是哺乳动物细胞。
55.如权利要求25-54中任一项所述的修饰的免疫细胞,其中所述免疫细胞是人细胞。
56.如权利要求25-55中任一项所述的修饰的免疫细胞,其中所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助T细胞、树突状细胞、B细胞或NK细胞。
57.如权利要求25-56中任一项所述的修饰的免疫细胞,其中所述免疫细胞来源于单个人供体。
58.如权利要求25-57中任一项所述的修饰的免疫细胞,其中所述免疫细胞从健康受试者获得。
59.一种修饰的免疫细胞群,其中多个所述细胞群包含如权利要求25-57中任一项所述的修饰的免疫细胞。
60.一种修饰的免疫细胞群,其中多个所述细胞群包含
a.如权利要求1-24中任一项所述的嵌合抗原受体;和
b.所述修饰的免疫细胞的基因组中的使所述修饰的免疫细胞的内源CD2基因失活的一个或多个突变。
61.如权利要求60所述的修饰的免疫细胞群,其还包含至少一个额外的基因序列或其调控元件中的一个或多个突变。
62.如权利要求60或61所述的修饰的免疫细胞群,其中所述一个或多个突变是至少一个单一靶标核碱基修饰。
63.如权利要求62所述的修饰的免疫细胞群,其中与没有所述修饰的对照细胞相比,所述至少一个单一靶标核碱基修饰减少或消除表达和/或功能。
64.如权利要求63所述的修饰的免疫细胞群,其中所述修饰的免疫细胞群的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%中的表达和/或功能减少。
65.如权利要求59-64中任一项所述的修饰的免疫细胞群,其中所述修饰的免疫细胞群的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%包含所述一个或多个突变。
66.如权利要求61-65中任一项所述的修饰的免疫细胞群,其中所述至少一个额外的基因序列包含检查点抑制基因序列、免疫反应调控基因序列和/或免疫原性基因序列。
67.如权利要求61-66中任一项所述的修饰的免疫细胞群,其中所述至少一个额外的基因序列包含检查点抑制基因序列。
68.如权利要求67所述的修饰的免疫细胞群,其中所述检查点抑制基因序列包含PDCD1/PD-1基因序列。
69.如权利要求61-68中任一项所述的修饰的免疫细胞群,其中所述至少一个额外的基因序列包含TRAC基因序列。
70.如权利要求61-69中任一项所述的修饰的免疫细胞群,其中所述至少一个额外的基因序列包含T细胞标志物基因序列。
71.如权利要求61-70中任一项所述的修饰的免疫细胞群,其中所述至少一个额外的基因序列包含CD52基因序列。
72.如权利要求61-71中任一项所述的修饰的免疫细胞群,其中所述至少一个额外的基因序列包含TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列。
73.一种修饰的免疫细胞群,其包含:
如权利要求1-24中任一项所述的嵌合抗原受体;和
所述修饰的免疫细胞群中的CD2基因序列、TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列或其调控元件中的每一个中的使所述基因序列中的每一个的表达失活的至少一个单一靶标核碱基修饰。
74.如权利要求59-73中任一项所述的修饰的免疫细胞群,其中与没有所述修饰的相同类型的对照细胞群相比,所述修饰的免疫细胞群表现出自相残杀抗性和增加的抗肿瘤活性。
75.如权利要求59-74中任一项所述的修饰的免疫细胞群,其中对所述免疫细胞群进行离体修饰。
76.如权利要求59-75中任一项所述的修饰的免疫细胞群,其中所述修饰的免疫细胞群不包含可检测的易位。
77.如权利要求59-75中任一项所述的修饰的免疫细胞群,其中所述修饰的免疫细胞群包含小于1%的插入缺失。
78.如权利要求59-75中任一项所述的修饰的免疫细胞群,其中所述修饰的免疫细胞群包含小于5%的非靶标编辑。
79.如权利要求59-75中任一项所述的修饰的免疫细胞群,其中所述修饰的免疫细胞群包含小于5%的脱靶编辑。
80.如权利要求62-79中任一项所述的修饰的免疫细胞群,其中所述至少一个单一靶标核碱基修饰在外显子中。
81.如权利要求80所述的修饰的免疫细胞群,其中所述至少一个单一靶标核碱基修饰在所述CD2基因序列的外显子2、外显子3、外显子4或外显子5内。
82.如权利要求62-81中任一项所述的修饰的免疫细胞群,其中所述至少一个单一靶标核碱基修饰引入提前终止密码子。
83.如权利要求82所述的修饰的免疫细胞群,其中所述至少一个单一靶标核碱基修饰在所述CD2基因序列的外显子2、外显子3、外显子4或外显子5内引入提前终止密码子。
84.如权利要求62-81中任一项所述的修饰的免疫细胞群,其中所述至少一个单一靶标核碱基修饰在剪接供体位点或剪接受体位点中。
85.如权利要求84所述的修饰的免疫细胞群,其中所述至少一个单一靶标核碱基修饰在所述CD2基因序列的外显子3剪接供体位点中。
86.如权利要求62-85中任一项所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰由一种或多种碱基编辑器生成。
87.如权利要求86所述的修饰的免疫细胞,其中所述一种或多种碱基编辑器是CBE和/或ABE。
88.如权利要求62-87中任一项所述的修饰的免疫细胞群,其中所述修饰的免疫细胞群的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%包含所述至少一个单一靶标核碱基修饰。
89.如权利要求59-88中任一项所述的修饰的免疫细胞群,其中所述免疫细胞是哺乳动物细胞。
90.如权利要求59-89中任一项所述的修饰的免疫细胞群,其中所述免疫细胞是人细胞。
91.如权利要求59-90中任一项所述的修饰的免疫细胞群,其中所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助T细胞、树突状细胞、B细胞或NK细胞。
92.如权利要求59-91中任一项所述的修饰的免疫细胞群,其中所述免疫细胞来源于单个人供体。
93.如权利要求59-91中任一项所述的修饰的免疫细胞群,其中所述免疫细胞从健康受试者获得。
94.一种用于富集如权利要求59-93中任一项所述的修饰的免疫细胞群的方法,所述方法包括从修饰的免疫细胞群中去除
a)不具有失活CD2基因的细胞;和/或
b)表达α/βT细胞受体(TCRαβ)的细胞。
95.如权利要求94所述的方法,其中通过向所述修饰的免疫细胞群施用抗CD2 CAR来去除CD2+细胞。
96.如权利要求94或95所述的方法,其中使用TCRαβ消耗柱来去除TCRαβ+细胞。
97.一种用于产生抗自相残杀的修饰的免疫细胞的方法,所述方法包括:
i)生成所述修饰的免疫细胞的基因组中的使所述修饰的免疫细胞的内源CD2基因失活的一个或多个突变;和
ii)在所述修饰的免疫细胞中表达如权利要求1-24中任一项所述的嵌合抗原受体(CAR)。
98.一种用于产生抗自相残杀的修饰的免疫细胞群的方法,所述方法包括:
i)生成修饰的免疫细胞群的基因组中的使所述修饰的免疫细胞群的内源CD2基因失活的一个或多个突变;和
ii)在所述修饰的免疫细胞群中表达如权利要求1-24中任一项所述的嵌合抗原受体(CAR)。
99.如权利要求97或98所述的方法,其还包括至少一个额外的基因序列或其调控元件中的一个或多个突变。
100.如权利要求97-99中任一项所述的方法,其中所述一个或多个突变是至少一个单一靶标核碱基修饰。
101.如权利要求100所述的修饰的免疫细胞,其中所述至少一个单一靶标核碱基修饰由一种或多种碱基编辑器生成。
102.如权利要求101所述的修饰的免疫细胞,其中所述一种或多种碱基编辑器是CBE和/或ABE。
103.如权利要求100-102中任一项所述的方法,其中与没有所述修饰的对照细胞相比,所述单一靶标核碱基修饰减少或消除表达和/或功能。
104.如权利要求103所述的方法,其中与没有所述修饰的对照细胞相比,表达和/或功能减少至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。
105.如权利要求103所述的方法,其中所述修饰的免疫细胞群的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%中的表达和/或功能减少。
106.如权利要求99-105中任一项所述的方法,其中所述至少一个额外的基因序列包含检查点抑制基因序列、免疫反应调控基因序列和/或免疫原性基因序列。
107.如权利要求99-106中任一项所述的方法,其中所述至少一个额外的基因序列包含检查点抑制基因序列。
108.如权利要求107所述的方法,其中所述检查点抑制基因序列包含PDCD1/PD-1基因序列。
109.如权利要求99-108中任一项所述的方法,其中所述至少一个额外的基因序列包含TRAC基因序列。
110.如权利要求99-109中任一项所述的方法,其中所述至少一个额外的基因序列包含T细胞标志物基因序列。
111.如权利要求99-110中任一项所述的方法,其中所述至少一个额外的基因序列包含CD52基因序列。
112.如权利要求99-111中任一项所述的方法,其中所述至少一个额外的基因序列包含TRAC基因序列、PDCD1/PD-1基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或CD52基因序列。
113.一种用于产生抗自相残杀的修饰的免疫细胞的方法,其包括:
i)在所述修饰的免疫细胞的基因组中生成使所述修饰的免疫细胞的内源CD2基因序列、内源TRAC基因、内源PDCD1/PD-1基因、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或内源CD52基因中的每一个失活的一个或多个突变;和
ii)在所述修饰的免疫细胞中表达如权利要求1-24中任一项所述的嵌合抗原受体(CAR)。
114.一种用于产生抗自相残杀的修饰的免疫细胞群的方法,其包括:
i)在修饰的免疫细胞群的基因组中生成使所述修饰的免疫细胞群的内源CD2基因序列、内源TRAC基因、内源PDCD1/PD-1基因、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或内源CD52基因失活的一个或多个突变;和
ii)在所述修饰的免疫细胞群中表达如权利要求1-24中任一项所述的嵌合抗原受体(CAR)。
115.如权利要求97-114中任一项所述的方法,其中与没有所述修饰的相同类型的对照细胞相比,所述修饰的免疫细胞表现出自相残杀抗性和增加的抗肿瘤活性。
116.如权利要求97-115中任一项所述的方法,其中对所述免疫细胞进行离体修饰。
117.如权利要求97-116中任一项所述的方法,其中所述修饰的免疫细胞不包含可检测的易位。
118.如权利要求97-116中任一项所述的方法,其中所述免疫细胞包含小于1%的插入缺失。
119.如权利要求97-116中任一项所述的方法,其中所述免疫细胞包含小于5%的非靶标编辑。
120.如权利要求97-116中任一项所述的方法,其中所述免疫细胞包含小于5%的脱靶编辑。
121.如权利要求97-120中任一项所述的方法,其中所述单一靶标核碱基修饰在外显子中。
122.如权利要求121所述的方法,其中所述单一靶标核碱基修饰在所述CD2基因序列的外显子2、外显子3、外显子4或外显子5内。
123.如权利要求99-122中任一项所述的方法,其中所述单一靶标核碱基修饰引入提前终止密码子。
124.如权利要求123所述的方法,其中所述单一靶标核碱基修饰在所述CD2基因序列的外显子2、外显子3、外显子4或外显子5内引入提前终止密码子。
125.如权利要求99-122中任一项所述的方法,其中所述单一靶标核碱基修饰在剪接供体位点或剪接受体位点中。
126.如权利要求125所述的方法,其中所述单一靶标核碱基修饰在所述CD2基因序列的外显子3剪接供体位点中。
127.如权利要求97-126中任一项所述的方法,其中所述CAR经由病毒转导在所述免疫细胞中表达。
128.如权利要求97-127中任一项所述的方法,其中所述CAR经由慢病毒转导在所述免疫细胞中表达。
129.如权利要求97-128中任一项所述的方法,其中所述生成一个或多个突变的步骤包括使至少一个单一靶标核碱基脱氨基。
130.如权利要求129所述的方法,其中所述脱氨基通过包含脱氨酶的多肽执行。
131.如权利要求130所述的方法,其中所述脱氨酶与核酸可编程DNA结合蛋白(napDNAbp)缔合以形成碱基编辑器。
132.如权利要求131所述的方法,其中所述碱基编辑器是CBE和/或ABE。
133.如权利要求131或132所述的方法,其中所述脱氨酶与所述核酸可编程DNA结合蛋白(napDNAbp)融合。
134.如权利要求131-133中任一项所述的方法,其中所述napDNAbp包含Cas9多肽或其部分。
135.如权利要求131-133中任一项所述的方法,其中所述napDNAbp包含Cas9切口酶或核酸酶死亡Cas9。
136.如权利要求131-133中任一项所述的方法,其中所述napDNAbp包含Cas12多肽或其部分。
137.如权利要求130-136中任一项所述的方法,其中所述脱氨酶是胞苷脱氨酶。
138.如权利要求129-137中任一项所述的方法,其中所述单一靶标核碱基是胞嘧啶(C)并且其中所述修饰包括将所述C转化为胸腺嘧啶(T)。
139.如权利要求130-136中任一项所述的方法,其中所述脱氨酶是腺苷脱氨酶。
140.如权利要求129-136或139中任一项所述的方法,其中所述单一靶标核碱基是腺嘌呤(A)并且其中所述修饰包括将所述A转化为鸟嘌呤(G)。
141.如权利要求131-140中任一项所述的方法,其中所述碱基编辑器还包含尿嘧啶糖基化酶抑制剂。
142.如权利要求131-141中任一项所述的方法,其中所述生成一个或多个突变的步骤还包括使所述免疫细胞与所述碱基编辑器和一个或多个指导核酸序列接触。
143.如权利要求142所述的方法,其中所述一个或多个指导核酸序列将所述napDNAbp靶向至所述CD2基因序列或其调控元件。
144.如权利要求142所述的方法,其中所述一个或多个指导核酸序列中的每一个将所述napDNAbp靶向至所述CD2基因序列、CD52基因序列、TRAC基因序列、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或PDC1/PD-1基因序列或其调控元件。
145.如权利要求142-144中任一项所述的方法,其中所述一个或多个指导核酸序列包含选自表1、表2A和/或表2B的一个或多个指导核酸序列的序列。
146.如权利要求142-145中任一项所述的方法,其中所述一个或多个指导核酸序列包含选自由以下组成的组的间隔子:
CUUGGGUCAGGACAUCAACU(SEQ ID NO:388);CGAUGAUCAGGAUAUCUACA(SEQ ID NO:389);
CACGCACCUGGACAGCUGAC(SEQ ID NO:390);AAACAGAGGAGUCGGAGAAA(SEQ ID NO:391);ACACAAGUUCACCAGCAGAA(SEQ ID NO:392);GUUCAGCCAAAACCUCCCCA(SEQ ID NO:393);AUACAAGUCCAGGAGAUCUU(SEQ ID NO:394);和UUCAGCACCAGCCUCAGAAG(SEQ ID NO:395)。
147.如权利要求132-146中任一项所述的方法,其中经由电穿孔、核转染、病毒转导或其组合将所述碱基编辑器和一个或多个指导核酸序列引入到所述免疫细胞中。
148.如权利要求131-147中任一项所述的方法,其中经由电穿孔将所述碱基编辑器和一个或多个指导核酸序列引入到所述免疫细胞中。
149.如权利要求94-148中任一项所述的方法,其中所述免疫细胞是哺乳动物细胞。
150.如权利要求94-149中任一项所述的方法,其中所述免疫细胞是人细胞。
151.如权利要求94-150中任一项所述的方法,其中所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助T细胞、树突状细胞、B细胞或NK细胞。
152.如权利要求94-151中任一项所述的方法,其中所述免疫细胞来源于单个人供体。
153.如权利要求94-152中任一项所述的方法,其中所述免疫细胞从健康受试者获得。
154.一种药物组合物,其包含药学上可接受的赋形剂中的有效量的如权利要求25-58中任一项所述的修饰的免疫细胞或如权利要求59-93中任一项所述的修饰的免疫细胞群。
155.一种治疗受试者的瘤形成的方法,所述方法包括向所述受试者施用有效量的如权利要求25-58中任一项所述的修饰的免疫细胞、如权利要求59-93中任一项所述的修饰的免疫细胞群、或如权利要求154所述的药物组合物。
156.如权利要求155所述的方法,其中已经对所述受试者的所述瘤形成进行免疫表型分析。
157.如权利要求155或156所述的方法,其中所述瘤形成是CD2+
158.如权利要求157所述的方法,其中所述瘤形成进一步是CD5+和/或CD7+
159.如权利要求155-157中任一项所述的方法,其还包括基于所述瘤形成的免疫表型同时或依次向所述受试者施用一种或多种额外的修饰的免疫细胞。
160.如权利要求158或159所述的方法,其还包括同时或依次向所述受试者施用有效量的CD5修饰的免疫细胞和/或CD7修饰的免疫细胞。
161.如权利要求160所述的方法,其中所述CD5修饰的免疫细胞和/或CD7修饰的免疫细胞在至少一种基因序列或其调控元件中包含一个或多个突变以增加自相残杀抗性、抗肿瘤活性、对移植物抗宿主病(GVHD)的抗性、对宿主抗移植物病(HVGD)的抗性、免疫抑制或其组合。
162.如权利要求155-161中任一项所述的方法,其中所述免疫细胞是哺乳动物细胞。
163.如权利要求155-162中任一项所述的方法,其中所述免疫细胞是人细胞。
164.如权利要求155-163中任一项所述的方法,其中所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助T细胞、树突状细胞、B细胞或NK细胞。
165.如权利要求155-164中任一项所述的方法,其中所述受试者先前已接受淋巴细胞清除治疗。
166.如权利要求165所述的方法,其中所述淋巴细胞清除涉及施用环磷酰胺、氟达拉滨和/或阿仑单抗(Cy/Flu/Campath)。
167.如权利要求155-166中任一项所述的方法,其中所述受试者对化学疗法难治或具有高肿瘤负荷。
168.如权利要求155-167中任一项所述的方法,其中所述受试者随后接受同种异体造血干细胞移植(allo-HSCT)治疗。
169.一种核酸,其编码如权利要求1-24中任一项所述的嵌合抗原受体。
170.一种用于治疗受试者的瘤形成的试剂盒,所述试剂盒包含如权利要求1-24中任一项所述的嵌合抗原受体、如权利要求25-58中任一项所述的修饰的免疫细胞、如权利要求59-93中任一项所述的修饰的免疫细胞群、如权利要求154所述的药物组合物或如权利要求169所述的核酸。
171.如权利要求170所述的试剂盒,其还包含碱基编辑器多肽或编码碱基编辑器多肽的多核苷酸,其中所述碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和脱氨酶。
172.如权利要求171所述的试剂盒,其中所述napDNAbp是Cas9或Cas12。
173.如权利要求171或172所述的试剂盒,其中编码所述碱基编辑器的所述多核苷酸是mRNA序列。
174.如权利要求171-173中任一项所述的试剂盒,其中所述脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
175.如权利要求171-174中任一项所述的试剂盒,其中所述脱氨酶是胞苷脱氨酶。
176.如权利要求170-175中任一项所述的试剂盒,其还包含一个或多个指导核酸序列。
177.如权利要求176所述的试剂盒,其中所述一个或多个指导核酸序列靶向CD2。
178.如权利要求176所述的试剂盒,其中所述一个或多个指导核酸序列靶向CD2、CD52、TRAC、B2M基因序列、CIITA基因序列、TRBC1基因序列、TRBC2基因序列和/或PDC1/PD-1中的每一个。
179.如权利要求176-178中任一项所述的试剂盒,其中所述一个或多个指导核酸序列包含选自表1、表2A和/或表2B的指导核酸序列的序列。
180.如权利要求176-179中任一项所述的试剂盒,其中所述一个或多个指导核酸序列包含选自由以下组成的组的间隔子:
CUUGGGUCAGGACAUCAACU(SEQ ID NO:388);CGAUGAUCAGGAUAUCUACA(SEQ ID NO:389);
CACGCACCUGGACAGCUGAC(SEQ ID NO:390);AAACAGAGGAGUCGGAGAAA(SEQ ID NO:391);ACACAAGUUCACCAGCAGAA(SEQ ID NO:392);GUUCAGCCAAAACCUCCCCA(SEQ ID NO:393);AUACAAGUCCAGGAGAUCUU(SEQ ID NO:394);和UUCAGCACCAGCCUCAGAAG(SEQ ID NO:395)。
181.如权利要求170-180中任一项所述的试剂盒,其还包含CD5修饰的免疫细胞、CD5修饰的免疫细胞群、或包含CD5修饰的免疫细胞或修饰的免疫细胞群的药物组合物。
182.如权利要求170-181中任一项所述的试剂盒,其还包含CD7修饰的免疫细胞、CD7修饰的免疫细胞群、或包含CD7修饰的免疫细胞或修饰的免疫细胞群的药物组合物。
183.如权利要求170-182中任一项所述的试剂盒,其还包含用于治疗所述瘤形成的书面说明。
184.如权利要求154所述的药物组合物、如权利要求155-168中任一项所述的方法、或如权利要求170-183中任一项所述的试剂盒,其中所述瘤形成是T细胞或NK细胞恶性肿瘤。
185.如权利要求184所述的药物组合物、方法或试剂盒,其中所述T细胞或NK细胞恶性肿瘤在前体T细胞或NK细胞中。
186.如权利要求184所述的药物组合物、方法或试剂盒,其中所述T细胞或NK细胞恶性肿瘤在成熟T细胞或NK细胞中。
187.如权利要求154所述的药物组合物、如权利要求153-166中任一项所述的方法、或如权利要求168-181中任一项所述的试剂盒,其中所述瘤形成选自由以下组成的组:T细胞急性淋巴细胞白血病(T-ALL)、蕈样肉芽肿(MF)、塞扎里综合征(SS)、外周T/NK细胞淋巴瘤、间变性大细胞淋巴瘤ALK+、原发性皮肤T细胞淋巴瘤、T细胞大颗粒淋巴细胞白血病、血管免疫母细胞性T/NK细胞淋巴瘤、肝脾T细胞淋巴瘤、原发性皮肤CD30+淋巴增生性病症、结外NK/T细胞淋巴瘤、成人T细胞白血病/淋巴瘤、T细胞幼淋巴细胞白血病、皮下脂膜炎样T细胞淋巴瘤、原发性皮肤γ-δT细胞淋巴瘤、侵袭性NK细胞白血病和肠病相关T细胞淋巴瘤。
188.如权利要求154所述的药物组合物、如权利要求155-168中任一项所述的方法、或如权利要求170-183中任一项所述的试剂盒,其中所述受试者是人受试者。
CN202180078866.2A 2020-09-25 2021-09-24 抗自相残杀的修饰的免疫细胞及其使用方法 Pending CN116685349A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063083540P 2020-09-25 2020-09-25
US63/083,540 2020-09-25
PCT/US2021/052035 WO2022067089A1 (en) 2020-09-25 2021-09-24 Fratricide resistant modified immune cells and methods of using the same

Publications (1)

Publication Number Publication Date
CN116685349A true CN116685349A (zh) 2023-09-01

Family

ID=80845857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180078866.2A Pending CN116685349A (zh) 2020-09-25 2021-09-24 抗自相残杀的修饰的免疫细胞及其使用方法

Country Status (5)

Country Link
EP (1) EP4216972A1 (zh)
CN (1) CN116685349A (zh)
AU (1) AU2021347359A1 (zh)
CA (1) CA3196831A1 (zh)
WO (1) WO2022067089A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023034742A1 (en) * 2021-08-30 2023-03-09 The Board Of Trustees Of The Leland Stanford Junior University T cells with cell-surface expression of adenosine deaminase and uses thereof
WO2024077118A2 (en) 2022-10-06 2024-04-11 Bicara Therapeutics Inc. Multispecific proteins and related methods

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2990416B1 (en) * 2014-08-29 2018-06-20 GEMoaB Monoclonals GmbH Universal chimeric antigen receptor expressing immune cells for targeting of diverse multiple antigens and method of manufacturing the same and use of the same for treatment of cancer, infections and autoimmune disorders
AU2016225012B2 (en) * 2015-02-27 2020-09-03 Kevin Chen Chimeric antigen receptors (CARS) targeting hematologic malignancies, compositions and methods of use thereof
WO2018027036A1 (en) * 2016-08-03 2018-02-08 Dipersio John F Gene editing of car-t cells for the treatment of t cell malignancies with chimeric antigen receptors
EP3898692A4 (en) * 2018-12-19 2022-10-19 The Trustees of the University of Pennsylvania USE OF INACTIVATED CD2/5/7 ANTI-CD2/5/7 CHIMERIC ANTIGEN RECEPTOR T LYMPHOCYTES AGAINST T LYMPHOCYTE LYMPHOCYTE LYMPHOMAS AND LEUKEMIAS
KR20210116526A (ko) * 2019-01-16 2021-09-27 빔 테라퓨틱스, 인크. 증진된 항-신생물 활성 및 면역억제 내성을 갖는 변형된 면역 세포

Also Published As

Publication number Publication date
AU2021347359A1 (en) 2023-05-18
WO2022067089A1 (en) 2022-03-31
CA3196831A1 (en) 2022-03-31
EP4216972A1 (en) 2023-08-02

Similar Documents

Publication Publication Date Title
US20230080198A1 (en) Modified immune cells having adenosine deaminase base editors for modifying a nucleobase in a target sequence
AU2020208616A1 (en) Modified immune cells having enhanced anti-neoplasia activity and immunosuppression resistance
EP4034138A2 (en) Compositions and methods for treatment of liquid cancers
EP4022051A2 (en) Compositions and methods for non-toxic conditioning
AU2022331424A1 (en) Persistent allogeneic modified immune cells and methods of use thereof
CN114040970A (zh) 使用腺苷脱氨酶碱基编辑器编辑疾病相关基因的方法,包括遗传性疾病的治疗
US20210102183A1 (en) Engineered cascade components and cascade complexes
US20230242884A1 (en) Compositions and methods for engraftment of base edited cells
EP4219720A2 (en) Engineered cascade components and cascade complexes
JP2022533673A (ja) プログラム可能塩基エディターシステムを用いた一塩基多型編集法
CN116685349A (zh) 抗自相残杀的修饰的免疫细胞及其使用方法
AU2022224054A1 (en) Recombinant rabies viruses for gene therapy
WO2023235813A2 (en) Modified regulatory t cells and methods of using the same
WO2023108107A2 (en) Modified immune cells and methods of using the same
WO2024044750A2 (en) Modified allogeneic cells and methods and compositions for the preparation thereof
WO2024006772A2 (en) Adenosine deaminase base editors and methods for use thereof
KR20240012377A (ko) 염기 편집기의 자기-불활성화용 조성물 및 방법
WO2023115012A2 (en) Compositions and methods for the treatment of spinal muscular atrophy (sma)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination