CN114072495A - 具有增强的抗肿瘤活性和免疫抑制抗性的经修饰的免疫细胞 - Google Patents

具有增强的抗肿瘤活性和免疫抑制抗性的经修饰的免疫细胞 Download PDF

Info

Publication number
CN114072495A
CN114072495A CN202080021571.7A CN202080021571A CN114072495A CN 114072495 A CN114072495 A CN 114072495A CN 202080021571 A CN202080021571 A CN 202080021571A CN 114072495 A CN114072495 A CN 114072495A
Authority
CN
China
Prior art keywords
gene sequence
gene
exon
cell
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080021571.7A
Other languages
English (en)
Inventor
J·M·格尔克
A·D·爱德华兹
D·默里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bim Medical Co ltd
Original Assignee
Bim Medical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bim Medical Co ltd filed Critical Bim Medical Co ltd
Publication of CN114072495A publication Critical patent/CN114072495A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4611T-cells, e.g. tumor infiltrating lymphocytes [TIL], lymphokine-activated killer cells [LAK] or regulatory T cells [Treg]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4631Chimeric Antigen Receptors [CAR]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4632T-cell receptors [TCR]; antibody T-cell receptor constructs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4636Immune checkpoint inhibitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464401Neoantigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464402Receptors, cell surface antigens or cell surface determinants
    • A61K39/464416Receptors for cytokines
    • A61K39/464417Receptors for tumor necrosis factors [TNF], e.g. lymphotoxin receptor [LTR], CD30
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/06Immunosuppressants, e.g. drugs for graft rejection
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2239/00Indexing codes associated with cellular immunotherapy of group A61K39/46
    • A61K2239/46Indexing codes associated with cellular immunotherapy of group A61K39/46 characterised by the cancer treated
    • A61K2239/48Blood cells, e.g. leukemia or lymphoma
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/095Fusion polypeptide containing a localisation/targetting motif containing a nuclear export signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/31Combination therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Oncology (AREA)
  • Hematology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Developmental Biology & Embryology (AREA)
  • Virology (AREA)
  • Transplantation (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)

Abstract

如下所述,本发明的特征在于具有增强的抗肿瘤活性、对免疫抑制的抗性和降低引起移植物抗宿主反应的风险的基因经修饰的免疫细胞或其组合。本发明的特征还在于生产和使用这些经修饰的免疫效应细胞的方法。

Description

具有增强的抗肿瘤活性和免疫抑制抗性的经修饰的免疫细胞
本申请主张2019年1月16日提交的美国临时申请号62/793,277和2019年4月29日提交的美国临时申请号62/839,870的效益。
技术领域
自体和同种异体免疫疗法是肿瘤治疗方法,其中向个体施用表达嵌合抗原受体的免疫细胞。为了产生表达嵌合抗原受体(CAR)的免疫细胞,首先从个体(自体)或从接受治疗的个体(同种异体)分离的供体收集免疫细胞,并进行基因修饰以表达嵌合抗原受体。所得细胞在其细胞表面(例如,CART细胞)表达嵌合抗原受体,以及在施用于个体后,嵌合抗原受体与肿瘤细胞表达的标记物结合。这种与肿瘤标志物的相互作用激活了CAR-T细胞,然后细胞杀死肿瘤细胞。但是为了使自体或同种异体细胞疗法有效和高效,必须克服或避免显著的条件和细胞反应,例如抑制T细胞信号传送。对于同种异体细胞疗法,移植物抗宿主病和宿主对CAR-T细胞的排斥可能会带来额外的挑战。编辑参与这些过程的基因可以增强CAR-T细胞功能和对免疫抑制或抑制的抗性,但目前进行此类编辑的方法有可能在CAR-T细胞中诱导大量的基因组重排,从而对其功效产生负面影响。因此,迫切需要更精确地修饰免疫细胞,尤其是CAR-T细胞的技术。本发明即是针对此需求和其他重要需求。
发明内容
如下所述,本发明的特征在于具有增强的抗肿瘤活性、对免疫抑制的抗性和降低引起移植物抗宿主反应或宿主抗移植物反应的风险的基因经修饰的免疫细胞,其中宿主CD8+T细胞识别移植物(例如,移植受者产生针对移植器官的免疫应答)或其组合为非自身的。在一个实施方案中,向具有或具有发展移植物抗宿主病(GVHD)倾向的个体施用缺乏或具有降低水平的功能性TRAC的CAR-T细胞。在一个实施方案中,向具有或具有发展宿主抗移植物疾病(HVGD)倾向的个体施用缺乏或具有降低水平的功能性β2微球蛋白(B2M)的CAR-T细胞。本发明的特征还在于生产和使用这些经修饰的免疫细胞的方法。
在一方面,本文提供了一种通过多重编辑产生降低的免疫原性和/或增加的抗肿瘤活性的经修饰的免疫细胞的方法,所述方法包含:在免疫细胞的群体中至少四个基因序列或其调控元件中的每个的单个靶核碱基处修饰调控元件,从而产生免疫原性降低和/或抗肿瘤活性增加的经修饰的免疫细胞。
在另在一方面,本文提供了一种通过多重编辑产生免疫原性降低和/或抗肿瘤活性增加的修饰免疫细胞的群体的方法,所述方法包含:在免疫细胞的群体中至少四个基因序列或其调控元件中的每个的单个靶核碱基处修饰调控元件,从而产生免疫原性降低和/或抗肿瘤活性增加的经修饰的免疫细胞的群体。
在一些实施方案中,至少四个基因序列中的至少一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
在一些实施方案中,所述修饰降低至少四个基因序列中至少一个的表达。
在一些实施方案中,与没有经修饰的对照细胞相比,至少四个基因中的至少一个的表达降低了至少80%。
在一些实施方案中,与没有经修饰的对照细胞相比,至少四个基因中每一个的表达降低至少80%。
在一些实施方案中,在至少50%的免疫细胞的群体中,至少四个基因中的至少一个的表达降低。
在一些实施方案中,在至少50%的免疫细胞的群体中,至少四个基因中的每一个的表达降低。
在一些实施方案中,至少四个基因序列包含TRAC基因序列。
在一些实施方案中,至少四个基因序列包含检查点抑制剂基因序列。
在一些实施方案中,至少四个基因序列包含PDCD1基因序列。
在一些实施方案中,至少四个基因序列包含T细胞标记基因序列。
在一些实施方案中,至少四个基因序列包含CD52基因序列。
在一些实施方案中,至少四个基因序列包含CD7基因序列。
在一些实施方案中,至少四个基因序列包含TRAC基因序列、PDCD1基因序列、CD52基因序列或CD7基因序列。
在一些实施方案中,至少四个序列包含TCR复合基因序列、CD7基因序列、CD52基因序列和选自由CIITA、CD2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列、和CIITA基因序列所组成的群组的基因序列。
在一些实施方案中,至少四个基因序列包含选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组的基因序列。
本文描述的一些实施方案的方法包含在所述免疫细胞中的五个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
本文描述的一些实施方案的方法包含在所述免疫细胞中的六个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
本文描述的一些实施方案的方法包含在所述免疫细胞中的七个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
本文描述的一些实施方案的方法包含在所述免疫细胞中的八个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
本文描述的一些实施方案的方法包含在所述免疫细胞的群体中的五个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
本文描述的一些实施方案的方法包含在所述免疫细胞的群体中的六个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
本文描述的一些实施方案的方法包含在所述免疫细胞的群体中的七个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
本文描述的一些实施方案的方法包含在所述免疫细胞的群体中的八个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
在一些实施方案中,所述五个、六个、七个或八个基因序列或其调控元件选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组。
在一些实施方案中,五个、六个、七个或八个基因序列或其调控元件包含CD3基因序列、CD7基因序列、CD2基因序列、CD5基因序列和CD52基因序列。
在一些实施方案中,所述修饰包含使单个靶核碱基脱氨基。
在一些实施方案中,脱氨基是通过包含脱氨酶的多肽进行的。
在一些实施方案中,脱氨酶与核酸可编程DNA结合蛋白(napDNAbp)结合以形成碱基编辑器。
在一些实施方案中,脱氨酶与核酸可编程DNA结合蛋白(napDNAbp)融合。
在一些实施方案中,napDNAbp包含Cas9多肽或其部分。
在一些实施方案中,napDNAbp包含Cas9切口酶或无核酸酶活性的Cas9。
在一些实施方案中,脱氨酶是胞苷脱氨酶。
在一些实施方案中,单个靶核碱基是胞嘧啶(C)以及其中修饰包含将C转化为胸腺嘧啶(T)。
在一些实施方案中,碱基编辑器进一步包含尿嘧啶糖基化酶抑制剂。
在一些实施方案中,脱氨酶是腺苷脱氨酶。
在一些实施方案中,单个靶核碱基是腺苷(A)以及其中修饰包含将A转化为鸟嘌呤(G)。
在一些实施方案中,修饰包含使免疫细胞与向导核酸序列接触。
在一些实施方案中,修饰包含使免疫细胞与至少四个向导核酸序列接触,其中每个向导核酸序列将napDNAbp靶向至少四个基因序列或其调控元件之一。
在一些实施方案中,向导核酸序列包含选自表8A、表8B或表8C的向导RNA序列的序列。
在一些实施方案中,向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组的序列。
在一些实施方案中,修饰包含通过使用反转录酶(reverse transcriptase)和延伸的向导核酸序列的靶引物反转录(target-primed reverse transcription)用不同的核碱基替换单个靶核碱基。
在一些实施方案中,延伸的向导核酸序列包含反转录模板序列、反转录引物结合位点或其组合。
在一些实施方案中,单个靶核碱基在外显子中。
在一些实施方案中,修饰在外显子中产生提前终止密码子。
在一些实施方案中,单个靶核碱基在TRAC基因序列的外显子1、外显子2或外显子3内。
在一些实施方案中,单个靶核碱基在PCDCl基因序列的外显子1、外显子2或外显子5内。
在一些实施方案中,单个靶核碱基在CD52基因序列的外显子1或外显子2内。
在一些实施方案中,单个靶核碱基在CD7基因序列的外显子1、外显子2或外显子3内。
在一些实施方案中,单个靶核碱基在B2M基因序列的外显子1或外显子2内。
在一些实施方案中,单个靶核碱基在CD5基因序列的外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8内。
在一些实施方案中,单个靶核碱基在CD2基因序列的外显子2、外显子3、外显子4或外显子5内。
在一些实施方案中,单个靶核碱基在CIITA基因序列的外显子1、外显子2、外显子4、外显子7、外显子8、外显子9、外显子10、外显子11、外显子12、外显子14、外显子15、外显子18或外显子19内。
在一些实施方案中,单个靶核碱基在剪接供体位点或剪接受体位点中。
在一些实施方案中,单个靶核碱基位于TRAC基因序列的外显子1剪接受体位点、外显子1剪接供体位点或外显子3剪接受体位点中。
在一些实施方案中,单个靶核碱基位于PDCD1基因序列的外显子1剪接受体位点、外显子1剪接供体位点、外显子2剪接受体位点、外显子3剪接供受体位点、外显子4剪接受体位点、外显子4剪接供体位点,或外显子5剪接受体位点中。
在一些实施方案中,单个靶核碱基位于CD52基因序列的外显子1剪接供体位点或外显子2剪接受体位点中。
在一些实施方案中,单个靶核碱基位于CD7基因序列的外显子1剪接供体位点、外显子2剪接供体位点、外显子2剪接受体位点或外显子3剪接受体位点中。
在一些实施方案中,单个靶核碱基位于B2M基因序列的外显子1剪接供体位点、外显子2剪接供体位点、外显子2剪接受体位点或外显子3剪接受体位点中。
在一些实施方案中,单个靶核碱基在CD2基因序列的外显子3剪接供体位点中。
在一些实施方案中,单个靶核碱基位于CD5基因序列的外显子1剪接供体位点、外显子1剪接受体位点、外显子3剪接受体位点、外显子3剪接供体位点、外显子4剪接受体位点、外显子5剪接供体位点、外显子6剪接受体位点、外显子9剪接供体位点、外显子10剪接受体位点中。
在一些实施方案中,单个靶核碱基位于CIITA基因序列的外显子1剪接供体位点、外显子7剪接供体位点、外显子8剪接受体位点、外显子9切片供体位点、外显子10剪接受体位点、外显子11剪接受体位点、外显子14剪接受体位点、外显子14剪接供体位点、外显子15剪接供体位点、外显子16剪接受体位点、外显子16剪接供体位点、外显子17剪接受体位点、外显子17剪接供体位点,或外显子19剪接受体位点中。
在一些实施方案中,免疫细胞是人类细胞。在一些实施方案中,免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
在一些实施方案中,免疫细胞的群体是人类细胞。
在一些实施方案中,免疫细胞的群体是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
在一些实施方案中,修饰是离体的。
在一些实施方案中,免疫细胞或免疫细胞的群体源自单个人类供体。
在一些实施方案中,所述方法进一步包含使免疫细胞或免疫细胞的群体与编码外源功能性嵌合抗原受体(CAR)或其功能性片段的多核苷酸接触。
在一些实施方案中,使免疫细胞或免疫细胞的群体与包含编码CAR的多核苷酸的慢病毒接触。
在一些实施方案中,使免疫细胞或免疫细胞的群体与napDNAbp和包含编码CAR的多核苷酸的供体DNA序列接触。
在一些实施方案中,napDNAbp是Cas12b。
在一些实施方案中,CAR特异性结合与肿瘤相关的标志物。
在一些实施方案中,肿瘤是T细胞癌、B细胞癌、淋巴瘤、白血病或多发性骨髓瘤。
在一些实施方案中,CAR特异性结合CD7。
在一些实施方案中,CAR特异性结合BCMA。
在一些实施方案中,免疫细胞或免疫细胞的群体不包含可检测的易位。在一些实施方案中,至少50%的免疫细胞的群体表达CAR。在一些实施方案中,至少50%的免疫细胞的群体是有活力的。在一些实施方案中,免疫细胞的群体的至少50%扩增没有经修饰的相同类型的对照细胞的群体的扩增率的至少80%。
在本文描述的一些实施方案的方法中,修饰在免疫细胞中产生小于1%的插入缺失。在一些实施方案中,修饰在免疫细胞中产生小于5%的非靶编辑。在一些实施方案中,修饰在免疫细胞中产生少于5%的脱靶编辑。
在一方面,本文提供的是根据前述段落中描述的一些实施方案产生的经修饰的免疫细胞。
在一方面,本文提供的是根据前述段落中描述的一些实施方案产生的经修饰的免疫细胞的群体。
在另一方面,本文提供具有降低的免疫原性或增加的抗肿瘤活性的经修饰的免疫细胞,其中所述经修饰的免疫细胞在至少四个基因序列或其调控元件的每一个中包含单个靶核碱基修饰。在一些实施方案中,在上述经修饰的免疫细胞中,至少四个基因序列中的每一个都是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
在前述实施方案的经修饰的免疫细胞中,至少四个基因序列包含TCR复合体基因序列。
在一些实施方案中,至少四个基因序列包含TRAC基因序列。在一些实施方案中,至少四个基因序列包含检查点抑制剂基因序列。在一些实施方案中,至少四个基因序列包含PDCD1基因序列。
在一些实施方案中,至少四个基因序列包含T细胞标记基因序列。
在一些实施方案中,至少四个基因序列包含CD52基因序列。
在一些实施方案中,至少四个基因序列包含CD7基因序列。
在一些实施方案中,与没有经修饰的对照细胞相比,至少四个基因之一的表达降低了至少80%。
在一些实施方案中,与没有经修饰的对照细胞相比,至少四个基因中每一个的表达降低至少90%。
在一些实施方案中,免疫细胞在五个基因序列或其调控元件中的每一个中的单个靶核碱基处包含修饰,其中五个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调控基因序列或免疫原性基因序列。
在一些实施方案中,免疫细胞在六个基因序列或其调控元件中的每一个中的单个靶核碱基处包含修饰,其中六个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调控基因序列或免疫原性基因序列。
在一些实施方案中,免疫细胞在七个基因序列或其调控元件中的每一个中的单个靶核碱基处包含修饰,其中七个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调控基因序列或免疫原性基因序列。
在一些实施方案中,免疫细胞在八个基因序列或其调控元件中的每一个中的单个靶核碱基处包含修饰,其中八个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调控基因序列或免疫原性基因序列。
在一些实施方案中,与没有经修饰的对照细胞相比,五个、六个、七个或八个基因中至少一个的表达降低了至少90%。
在一些实施方案中,与没有经修饰的对照细胞相比,五个、六个、七个或八个基因中每一个的表达降低至少90%。
在一些实施方案中,五个、六个、七个或八个基因序列或其调控元件包含选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组的基因序列。
在一方面,本文提供了在CD3基因序列、CD5基因序列、CD52基因序列和CD7基因序列的每一个中包含单个靶核碱基经修饰的经修饰的免疫细胞,其中与没有经修饰的相同类型的对照细胞相比,所述经修饰的免疫细胞表现出降低的免疫原性或增加的抗肿瘤活性。
在一些实施方案中,经修饰的免疫细胞进一步包含在CD2基因序列、CIITA或其各自的调控元件中的单个靶核碱基修饰。
在一些实施方案中,经修饰的免疫细胞在TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列或TRBC2基因、CD4基因序列、CD30基因序列、CD33基因序列、CD70基因序列、B2M基因序列和CIITA基因序列或其各自的调控元件中进一步包含单个靶核碱基修饰序列进一步包含基因序列。
在一些实施方案中,经修饰的免疫细胞在TRAC基因序列、PDCD1基因序列、CD52基因序列、CD7基因序列、CD2基因序列、CD5基因序列、CIITA基因序列和B2M基因序列中的每一个中包含单个核碱基修饰。
在一些实施方案中,经修饰的免疫细胞不包含可检测的易位。
在一些实施方案中,经修饰的免疫细胞包含少于1%的插入缺失。
在一些实施方案中,经修饰的免疫细胞包含少于5%的非靶编辑。
在一些实施方案中,经修饰的免疫细胞包含少于5%的脱靶编辑。
在一些实施方案中,与对照细胞相比,经修饰的免疫具有增加的生长或活力。在一些实施方案中,对照细胞是用Cas9核酸酶经修饰的免疫细胞。
在一些实施方案中,经修饰的免疫细胞是哺乳动物细胞。
在一些实施方案中,经修饰的免疫细胞是人类细胞。
在一些实施方案中,经修饰的免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
在一些实施方案中,经修饰的免疫细胞在离体培养物中。
在一些实施方案中,经修饰的免疫细胞源自单个人类供体。
在一些实施方案中,经修饰的免疫细胞进一步包含编码外源功能性嵌合抗原受体(CAR)或其功能性片段的多核苷酸。
在一些实施方案中,编码CAR的多核苷酸整合在免疫细胞的基因组中。
在一些实施方案中,CAR特异性结合与肿瘤相关的标志物。
在一些实施方案中,肿瘤是T细胞癌、B细胞癌、淋巴瘤、白血病或多发性骨髓瘤。
在一些实施方案中,CAR特异性结合CD7。
在一些实施方案中,CAR特异性结合BCMA。
在一些实施方案中,单个靶核碱基在外显子中。
在一些实施方案中,单个靶核碱基在TRAC基因序列的外显子1、外显子2或外显子3内。
在一些实施方案中,单个靶核碱基在PCDCl基因序列的外显子1、外显子2或外显子5内。
在一些实施方案中,单个靶核碱基在CD52基因序列的外显子1或外显子2内。
在一些实施方案中,单个靶核碱基在CD7基因序列的外显子1、外显子2或外显子3内。
在一些实施方案中,单个靶核碱基位于剪接供体位点或剪接受体位点。
在一些实施方案中,单个靶核碱基位于TRAC基因序列的外显子1剪接受体位点、外显子1剪接供体位点或外显子3剪接受体位点中。
在一些实施方案中,单个靶核碱基位于PDCD1基因序列的外显子1剪接受体位点、外显子1剪接供体位点、外显子2剪接受体位点、外显子3剪接供体位点、外显子4剪接受体位点、外显子4剪接供体位点或外显子5剪接受体位点中。
在一些实施方案中,单个靶核碱基位于CD52基因序列的外显子1剪接供体位点或外显子2剪接受体位点中。
在一些实施方案中,单个靶核碱基位于CD7基因序列的外显子1剪接供体位点、外显子2剪接供体位点、外显子2剪接受体位点或外显子3剪接受体位点中。
在一方面,本文提供了经修饰的免疫细胞的群体,其中多个所述细胞群体在至少四个基因序列或其调控元件的每一个中包含单个靶核碱基修饰,以及其中,与没有经修饰的相同类型的多个对照细胞相比,具有经修饰的多个所述细胞群体表现出降低的免疫原性或增加的抗肿瘤活性。
在一些实施方案中,多个细胞包含所述群体的至少50%。
在一些实施方案中,至少四个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
在一些实施方案中,至少四个基因序列包含TCR组分基因序列、检查点抑制剂基因序列或T细胞标记基因序列。
在一些实施方案中,至少四个基因序列包含TRAC基因序列。
在一些实施方案中,至少四个基因序列包含PDCD1基因序列。
在一些实施方案中,至少四个基因序列包含CD52基因序列。
在一些实施方案中,至少四个基因序列包含CD7基因序列。
在一些实施方案的群体中,与没有经修饰的对照细胞相比,具有经修饰的多个细胞中至少四个基因中的至少一个的表达降低了至少80%
在一些实施方案的群体中,与没有经修饰的对照细胞相比,在具有经修饰的多个细胞中,至少四个基因中每一个的表达降低至少80%。
在一些实施方案中,多个群包含在五个基因序列或其调控元件中每一个的单个靶核碱基处的修饰,其中,五个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调控基因序列或免疫原性基因序列。
在一些实施方案中,多个群在六个基因序列或其调控元件中每一个的单个靶核碱基处包含修饰,其中,六个序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
在一些实施方案中,多个群包含在七个基因序列或其调控元件中每一个的单个靶核碱基处的修饰,其中,七个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调控基因序列或免疫原性基因序列。
在一些实施方案中,多个群在八个基因序列或其调控元件中每一个的单个靶核碱基处包含修饰,其中,八个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调控基因序列或免疫原性基因序列。
在一些实施方案的群体中,与没有经修饰的对照细胞相比,在具有经修饰的多个细胞中,五个、六个、七个或八个基因中的至少一个的表达降低至少90%。
在一些实施方案的群中,与没有经修饰的对照细胞相比,在具有经修饰的多个细胞中,五个、六个、七个或八个基因中的每一个的表达降低至少90%。
在一些实施方案的群中,与没有经修饰的对照细胞相比,在具有经修饰的多个细胞中,五个、六个、七个或八个基因中的至少一个的表达降低了至少90%修改。
在一些实施方案中,与没有经修饰的对照细胞相比,在具有经修饰的多个细胞中,五个、六个、七个或八个基因中每一个的表达降低至少90%。
在一些实施方案中,五个、六个、七个或八个基因序列或其调控元件选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组。
在一方面,本文提供经修饰的免疫细胞的群体,其中多个群在TRAC基因序列、PDCD1基因序列、CD52基因序列和CD52基因序列的每一个中包含单个靶核碱基修饰,以及其中与没有经修饰的相同类型的多个对照细胞相比,具有经修饰的群的免疫原性降低或抗肿瘤活性增加。
在一些实施方案中,多个所述群体进一步包含在CD2基因序列、CD5基因序列、CIITA基因序列、B2M基因序列或其调控元件中的的每一个的单个靶核碱基修饰。在一些实施方案中,多个所述群体进一步包含选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列或其各自的调控元件所组成的群组的基因序列中的单个靶核碱基修饰。在一些实施方案中,多个所述群体在TRAC基因序列、PDCD1基因序列、CD52基因序列、CD7基因序列、CD2基因序列、CD5基因序列、CIITA基因序列和B2M基因序列中的每一个中的单个核碱基修饰。
在一些实施方案的经修饰的免疫细胞的群体中,多个所述群体不包含可检测的易位。
在一些实施方案的经修饰的免疫细胞的群体中,至少60%的免疫细胞的群体是有活力的。在一些实施方案的经修饰的免疫细胞的群体中,免疫细胞的群体的至少60%扩增没有经修饰的相同类型的对照细胞的群体的扩增率的至少80%。在一些实施方案的经修饰的免疫细胞的群体中,免疫细胞的群体是人类细胞。在一些实施方案的经修饰的免疫细胞的群体中,免疫细胞的群体是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。在一些实施方案的经修饰的免疫细胞的群体中,免疫细胞的群体源自单个人类供体。在一些实施方案的经修饰的免疫细胞的群体中,具有经修饰的多个细胞进一步包含编码外源功能性嵌合抗原受体(CAR)或其功能片段的多核苷酸。
在一些实施方案中,至少50%的免疫细胞的群体表达CAR。
在一些实施方案中,CAR特异性结合与肿瘤相关的标志物。
在一些实施方案中,肿瘤是T细胞癌、B细胞癌、淋巴瘤、白血病或多发性骨髓瘤。
在一些实施方案中,CAR特异性结合CD7。
在一些实施方案中,CAR特异性结合BCMA。
在一些实施方案中,单个靶核碱基在外显子中。
在一些实施方案中,单个靶核碱基在TRAC基因序列的外显子1、外显子2或外显子3内。
在一些实施方案中,单个靶核碱基在PCDCl基因序列的外显子1、外显子2或外显子5内。
在一些实施方案中,单个靶核碱基在CD52基因序列的外显子1或外显子2内。
在一些实施方案中,单个靶核碱基在CD7基因序列的外显子1、外显子2或外显子3内。
在一些实施方案的经修饰的免疫细胞的群体中,单个靶核碱基位于剪接供体位点或剪接受体位点中。
在一些实施方案中,单个靶核碱基位于TRAC基因序列的外显子1剪接受体位点、外显子1剪接供体位点或外显子3剪接受体位点中。
在一些实施方案中,单个靶核碱基位于PDCD1基因序列的外显子1剪接受体位点、外显子1剪接供体位点、外显子2剪接受体位点、外显子3剪接供体位点、外显子4剪接受体位点、外显子4剪接供体位点或外显子5剪接受体位点中。
在一些实施方案中,单个靶核碱基位于CD52基因序列的外显子1剪接供体位点或外显子2剪接受体位点中。
在一些实施方案中,单个靶核碱基位于CD7基因序列的外显子1剪接供体位点、外显子2剪接供体位点、外显子2剪接受体位点或外显子3剪接受体位点中。
在一方面,本文提供包含脱氨酶和核酸序列的组成物,其中所述向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组中的序列。
在一些实施方案中,脱氨酶与核酸可编程DNA结合蛋白(napDNAbp)结合以形成碱基编辑器。
在一些实施方案中,napDNAbp包含Cas9切口酶或无核酸酶活性的Cas9,以及其中脱氨酶是胞苷脱氨酶。
在一些实施方案中,碱基编辑器进一步包含尿嘧啶糖基化酶抑制剂。
在一些实施方案中,napDNAbp包含Cas9切口酶或无核酸酶活性的Cas9,以及其中脱氨酶是腺苷脱氨酶。
在一方面,本文提供包含聚合酶和向导核酸序列的组成物,其中向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组中的序列。
在一些实施方案中,聚合酶是反转录酶,以及其中向导核酸序列是包含反转录模板序列、反转录引物结合位点或其组合的延伸向导核酸序列。
在一方面,本文提供了一个用于产生具有降低的免疫原性和/或增加的抗肿瘤活性的经修饰的免疫细胞的方法,所述方法包含:a)修饰免疫细胞中第一基因序列或其调控元件中的单个靶核碱基;b)用Cas12多肽修饰免疫细胞中的第二基因序列或其调控元件,其中Cas12多肽在第二基因序列中产生位点特异性切割;其中第一基因和第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因,从而产生免疫原性降低和/或抗肿瘤活性增加的修饰免疫细胞。
在一些实施方案中,所述方法进一步包含在免疫细胞中表达外源功能嵌合抗原受体(CAR)或其功能片段。
在一些实施方案中,将编码CAR或其功能片段的多核苷酸插入到由Cas12多肽产生的位点特异性切割中。
在一些实施方案中,Cas12多肽是Cas12b多肽。
在一方面,本文提供了一个用于产生具有降低的免疫原性和/或增加的抗肿瘤活性的经修饰的免疫细胞的方法,所述方法包含:
a)修饰免疫细胞中第一基因序列或其调控元件中的单个靶核碱基;b)通过在第二基因中插入外源功能性嵌合抗原受体(CAR)或其功能片段或外源功能性T细胞受体或其功能片段来修饰免疫细胞中的第二基因序列或其调控元件;其中第一基因和第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因,从而产生免疫原性降低和/或抗肿瘤活性增加的修饰免疫细胞。
在一些实施方案中,步骤b)进一步包含用核酸可编程DNA结合蛋白(napDNAbp)在第二基因序列中产生位点特异性切割。
在一些实施方案中,napDNAbp是Cas12b。
在一些实施方案中,与没有经修饰的相同类型的对照细胞相比,第一基因的表达降低至少60%或其中第二基因的表达降低至少60%。
在一些实施方案中,第一基因选自由CD3ε、CD3γ、CD3δ、CD4、TRAC、TRBC1、TRBC2、PDCD1、CD30、CD33、CD7、CD52、B2M、CD70、CIITA、CD2和CD5所组成的群组。
在一些实施方案中,第一基因或第二基因选自由TRAC、CIITA、CD2、CD5、CD7和CD52所组成的群组。
在一些实施方案中,第二基因是TRAC。
在一些实施方案中,步骤a)进一步包含在两个其他基因序列或其调控元件中修饰单个靶核碱基。
在一些实施方案中,步骤a)进一步包含在三个其他基因序列或其调控元件中修饰单个靶核碱基。
在一些实施方案中,步骤a)进一步包含在四个其他基因序列或其调控元件中修饰单个靶核碱基。
在一些实施方案中,步骤a)进一步包含在五个其他基因序列或其调控元件中修饰单个靶核碱基。
在一些实施方案中,步骤a)进一步包含在六个其他基因序列或其调控元件中修饰单个靶核碱基。
在一些实施方案中,步骤a)进一步包含在七个其他基因序列或其调控元件中修饰单个靶核碱基。
在一些实施方案中,步骤a)中的修饰包含用包含脱氨酶和核酸可编程DNA结合蛋白(napDNAbp)的碱基编辑器使单个靶核碱基脱氨基。
在一些实施方案中,napDNAbp包含Cas9切口酶或无核酸酶活性的Cas9。
在一些实施方案中,脱氨酶是胞苷脱氨酶,以及其中修饰包含将胞苷(C)转化为胸腺嘧啶(T)。
在一些实施方案中,脱氨酶是腺苷脱氨酶,以及其中修饰包含将腺嘌呤(A)转化为鸟嘌呤(G)。
在一些实施方案中,a)中的修饰包含使免疫细胞与向导核酸序列接触。
在一些实施方案中,向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组的序列。
在一些实施方案中,b)中的修饰包含使免疫细胞与向导核酸序列接触。
在一些实施方案中,向导核酸序列包含选自表1中的序列的序列。
在一些实施方案中,a)中的修饰包含通过用反转录酶和延伸的向导核酸序列的靶引物反转录用不同的核苷碱基替换单个靶核苷碱基,其中,延伸的向导核酸序列包含反转录转录模板序列、反转录引物结合位点或其组合。
在一些实施方案中,其中a)和b)中的修饰在免疫细胞中产生小于1%的插入缺失。
在一些实施方案中,a)和b)中的修饰在免疫细胞中产生小于5%的脱靶修饰。
在一些实施方案中,a)和b)中的修饰在免疫细胞中产生小于5%的非靶修饰。
在一些实施方案中,免疫细胞是人类细胞。
在一些实施方案中,免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
在一些实施方案中,CAR特异性结合与肿瘤相关的标志物。
在一些实施方案中,CAR特异性结合CD7。
在一方面,本文提供具有降低的免疫原性和/或增加的抗肿瘤活性的经修饰的免疫细胞,其中所述经修饰的免疫细胞包含:
a)第一基因序列或其调控元件中的单个靶核碱基修饰;b)第二基因序列或其调控元件中的修饰,其中所述修饰是由Cas12多肽产生的位点特异性切割;其中第一基因和第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因。在一个实施方案中,免疫细胞进一步包含外源功能性嵌合抗原受体(CAR)或其功能片段。
在一些实施方案中,将编码CAR或其功能片段的多核苷酸插入到由Cas12多肽产生的位点特异性切割中。
在一方面,本文提供具有降低的免疫原性和/或增加的抗肿瘤活性的经修饰的免疫细胞,所述经修饰的免疫细胞包含:a)在免疫细胞中第一基因序列或其调控元件中的单个靶核碱基修饰;b)在第二基因序列或其调控元件中的修饰,其中所述修饰是外源嵌合抗原受体(CAR)或其功能片段或外源T细胞受体或其功能片段的插入;其中第一基因和第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因。
在一些实施方案中,b)中的修饰是通过用Cas12b进行位点特异性切割而产生的。
在一些实施方案中,与没有经修饰的相同类型的对照细胞相比,第一基因的表达降低至少60%或其中第二基因的表达降低至少60%。
在一些实施方案中,第一基因或第二基因选自由CD3ε、CD3γ、CD3δ、CD4、TRAC、TRBC1、TRBC2、PDCD1、CD30、CD33、CD7、CD52、B2M、CD70、CIITA、CD2和CD5所组成的群组。
在一些实施方案中,第一基因或第二基因选自由TRAC、CD2、CD5、CD7和CD52所组成的群组。
在一些实施方案中,第二基因是TRAC。
在一些实施方案中,免疫细胞进一步包含在两个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
在一些实施方案中,免疫细胞进一步包含在三个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
在一些实施方案中,免疫细胞进一步包含在四个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
在一些实施方案中,免疫细胞进一步包含在五个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
在一些实施方案中,免疫细胞进一步包含在六个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
在一些实施方案中,免疫细胞进一步包含在七个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
在一些实施方案中,a)中的修饰由包含脱氨酶和核酸可编程DNA结合蛋白(napDNAbp)的碱基编辑器产生。
在一些实施方案中,脱氨酶是胞苷脱氨酶,以及修饰包含将胞苷(C)转化为胸腺嘧啶(T)。
在一些实施方案中,脱氨酶是腺苷脱氨酶,以及其中,修饰包含将腺嘌呤(A)转化为鸟嘌呤(G)。
在一些实施方案中,免疫细胞包含在基因组中小于1%的插入缺失。
在一些实施方案中,免疫细胞是人细胞。
在一些实施方案中,免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
在一些实施方案中,CAR特异性结合与肿瘤相关的标志物。
在一些实施方案中,CAR特异性结合CD7。
在一些实施方案中,b)中的修饰是在TRAC基因序列的外显子1中的插入。
在一方面,本文提供经修饰的免疫细胞的群体,其中,多个免疫细胞的群体包含:a)免疫细胞中第一基因序列或其调控元件中的单个靶核碱基修饰;b)第二基因序列或其调控元件中的修饰,其中所述修饰是由Cas12多肽产生的位点特异性切割;其中第一基因和第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因,以及其中,多个所述群体包含外源嵌合抗原受体(CAR)或其功能片段。
在一些实施方案中,将编码CAR或其功能片段的多核苷酸插入到由Cas12多肽产生的位点特异性切割中。
在一方面,本文提供了经修饰的免疫细胞的群体,其中多个免疫细胞的群体包含:a)在第一基因序列或其调控元件中的单个靶核碱基修饰;b)在第二基因序列或其调控序列中的修饰,其中所述修饰是外源嵌合抗原受体(CAR)或其功能片段或外源T细胞受体或其功能片段的插入;其中第一基因和第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因,以及其中在a)或b)中具有经修饰的多个细胞表现出降低的免疫原性和/或增加的抗肿瘤活性。在一些实施方案中,b)中的修饰是通过用Cas12b进行位点特异性切割产生的。在一些实施方案中,与没有经修饰的相同类型的多个对照细胞相比,在a)或b)中具有所述经修饰的所述多个细胞中,第一基因的表达降低至少60%或其中第二基因的表达降低至少60%。
在一些实施方案中,第一基因或第二基因选自由CD3ε、CD3γ、CD3δ、CD4、TRAC、TRBC1、TRBC2、PDCD1、CD30、CD33、CD7、CD52、B2M、CD70、CIITA、CD2和CD5所组成的群组。
在一些实施方案中,第一基因或第二基因选自由TRAC、CIITA、CD2、CD5、CD7和CD52所组成的群组。
在一些实施方案中,第一基因是TRAC、CD7或CD52。
在一些实施方案中,第二基因是TRAC。
在一些实施方案中,在a)或b)中具有经修饰的所述多个细胞进一步包含在两个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
在一些实施方案中,在a)或b)中具有经修饰的所述多个细胞进一步包含在三个、四个、五个或六个其他基因序列或其调控元件中的单个靶核碱基。
在一些实施方案中,a)中的修饰由包含脱氨酶和核酸可编程DNA结合蛋白(napDNAbp)的碱基编辑器产生以形成碱基编辑器。
在一些实施方案中,脱氨酶是胞苷脱氨酶,以及其中修饰包含将胞苷(C)转化为胸腺嘧啶(T)。
在一些实施方案中,脱氨酶是腺苷脱氨酶,以及其中修饰包含将腺嘌呤(A)转化为鸟嘌呤(G)。
在一些实施方案中,碱基编辑器进一步包含尿嘧啶糖基化酶抑制剂。
在一些实施方案中,至少60%的免疫细胞的群体是有活力的。
在一些实施方案中,免疫细胞的群体的至少60%扩增没有经修饰的相同类型的对照细胞的群体的扩增率的至少80%。
在一些实施方案中,与对照细胞的群体相比,经修饰的免疫细胞的群体具有增加的经修饰的免疫细胞的产量。在一些实施方案中,对照的群体是用Cas9核酸酶经修饰的免疫细胞的群体。
在一些实施方案中,免疫细胞是人类细胞。
在一些实施方案中,免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
在一些实施方案中,CAR特异性结合与肿瘤相关的标志物。
在一些实施方案中,CAR特异性结合CD7。
在一些实施方案中,在b)中的修饰是在TRAC基因序列的外显子1中的插入。
在一方面,本文提供了一种产生具有增加的抗肿瘤活性的经修饰的免疫细胞的方法,所述方法包含:修饰免疫细胞中Cbl原癌基因B(CBLB)基因序列或其调控元件中的单个靶核碱基,与未经修饰的免疫细胞相比,所述修饰降低了免疫细胞的激活阈值;从而产生具有增加的抗肿瘤活性的经修饰的免疫细胞。
在一方面,本文提供了一种组成物,其包含具有增加的抗肿瘤活性的经修饰的免疫细胞,其中所述经修饰的免疫细胞包含:在Cbl原癌基因B(CBLB)基因序列或其调控元件中单个靶核碱基的修饰,其中,与没有经修饰的相同类型的对照免疫细胞相比,经修饰的免疫细胞表现出降低的激活阈值。
在一方面,本文提供的是免疫细胞的群体,其中,多个免疫细胞的群体包含:在CBLB基因序列或其调控元件中单个靶核碱基的修饰,其中,多个与没有经修饰的相同类型的对照免疫细胞的群体相比,包含经修饰的免疫细胞的群体表现出降低的激活阈值。
在一方面,本文提供了一种产生具有增加的抗肿瘤活性的经修饰的免疫细胞的群体的方法,所述方法包含:修饰免疫细胞的群体中Cbl原癌基因B(CBLB)基因序列或其调控元件中的单个靶核碱基,其中至少50%的免疫细胞的群体被修饰以包含单个靶核碱基修饰。
在一方面,本文提供了一个组成物,其包含用于碱基编辑的至少四个不同的向导核酸序列。在一些实施方案中,组成物进一步包含编码碱基编辑器多肽的多核苷酸,其中碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和脱氨酶。在一些实施方案中,编码碱基编辑器的多核苷酸是mRNA序列。
在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
在一些实施方案中,组成物进一步包含碱基编辑器多肽,其中碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和脱氨酶。
在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
在一些实施方案中,组成物进一步包含脂质纳米颗粒。
在一些实施方案中,至少四个向导核酸序列各自与选自由CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA所组成的群组的基因序列杂交。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件选自CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA。
在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含一个或多个选自CD2、CD3ε、CD3γ、CD3δ的基因、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件选自ACAT1、ACLY、ADORA2A、AXL、B2M、BATF、BCL2L11、BTLA、CAMK2D、cAMP、CASP8、Cblb、CCR5、CD2、CD3D、CD3E、CD3G、CD4、CD5、CD7、CD8A、CD33、CD38、CD52、CD70、CD82、CD86、CD96、CD123、CD160、CD244、CD276、CDK8、CDKN1B、Chi3l1、CIITA、CISH、CSF2CSK、CTLA-4、CUL3、Cyp11a1、DCK、DGKA、DGKZ、DHX37、ELOB(TCEB2)、ENTPD1(CD39)、FADD、FAS、GATA3、IL6、IL6R、IL10、IL10RA、IRF4、IRF8、JUNB、Lag3、、LAIR-1(CD305)、LDHA、LIF、LYN、MAP4K4、MAPK14、MCJ、MEF2D、MGAT5、NR4A1、NR4A2、NR4A3、NT5E(CD73)、ODC1、OTULINL(FAM105A)、PAG1、PDCD1、PDIA3、PHD1(EGLN2)、PHD2(EGLN1)、PHD3(EGLN3)、PIK3CD、PIKFYVE、PPARa、PPARd、PRDMI1、PRKACA、PTEN、PTPN2、PTPN6、PTPN11、PVRIG(CD112R)、RASA2、RFXANK、SELPG/PSGL1、SIGLEC15、SLA、SLAMF7、SOCS1、Spry1、Spry2、STK4、SUV39、H1TET2、TGFbRII、TIGIT、Tim-3、TMEM222、TNFAIP3、TNFRSF8(CD30)、TNFRSF10B、TOX、TOX2、TRAC、TRBC1、TRBC2、UBASH3A、VHL、VISTA,在一些实施方案中,至少四个向导核酸序列各自与选自由CD3ε、CD3δ、CD3γ、TRAC、TRBC1和TRBC2、CD2、CD5、CD7、CD52、CD70和CIITA所组成的群组的基因序列杂交。
在一些实施方案中,至少四个向导核酸序列包含选自由:UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组的序列。
在一方面,本文提供了一种免疫细胞,其包含上述一些实施方案的组成物,其中通过电穿孔将所述组成物引入免疫细胞中。
在一方面,本文提供了包含上述一些实施方案的组成物的免疫细胞,其中通过电穿孔、核转染、病毒转导或其组合将组成物引入免疫细胞。
本发明的其他特征和优点将从详细描述和权利要求中显而易见。
定义
除非另有定义,本文使用的所有技术和科学术语均具有本领域技术人员通常理解的含义。以下参考文献为本领域技术人员提供了本发明中使用的许多术语的一般定义:Singleton等人,Dictionary of Microbiology and Molecular Biology(2nd ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);TheGlossary of Genetics,5th Ed.,R.Rieger等人(eds.),Springer Verlag(1991);和Hale&Marham,The Harper Collins Dictionary of Biology(1991)。如本文所用,除非另有说明,否则以下术语具有以下赋予其的含义。
“腺苷脱氨酶”是指能够催化腺嘌呤或腺苷水解脱氨的多肽或其片段。在一些实施方案中,脱氨酶或脱氨酶结构域是催化腺苷水解脱氨基为肌苷或脱氧腺苷水解脱氨为脱氧肌苷的腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(DNA)中腺嘌呤或腺苷的水解脱氨。本文提供的腺苷脱氨酶(例如,工程化的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体,例如细菌。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体的天然存在的脱氨酶的变异体。在一些实施方案中,脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域为至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与天然存在的脱氨酶相同。在一些实施方案中,腺苷脱氨酶来自细菌,例如大肠杆菌、金黄色葡萄球菌(S.aureus)、伤寒链球菌(S.typhi)、腐败链球菌(S.putrefaciens)、流感嗜血杆菌(H.influenzae)或新月形杆菌(C.crescentus)。在一些实施方案中,腺苷脱氨酶是TadA脱氨酶。在一些实施方案中,TadA脱氨酶是大肠杆菌TadA(ecTadA)脱氨酶或其片段。
例如,相对于全长ecTadA,截短的ecTadA可能缺少一个或多个N-末端氨基酸。在一些实施方案中,相对于全长ecTadA,截短的ecTadA可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个N末端氨基酸残基。在一些实施方案中,相对于全长ecTadA,截短的ecTadA可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个C末端氨基酸残基。在一些实施方案中,ecTadA脱氨酶不包含N-端甲硫氨酸。在一些实施方案中,TadA脱氨酶是N末端截短的TadA。在特定实施方案中,TadA是国际第PCT/US2017/045381号专利申请案中描述的TadA中的任一个,所述专利通过引用整体并入本文。
在某些实施方案中,腺苷脱氨酶包含氨基酸序列:MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD,其被称为“TadA参考序列”。
在一些实施方案中,TadA脱氨酶是全长大肠杆菌TadA脱氨酶。例如,在某些实施方案中,腺苷脱氨酶包含氨基酸序列:MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
然而,应当理解,在本发明中有用的额外的腺苷脱氨酶对于本领域技术人员是显而易见的以及在本发明的范围内。例如,腺苷脱氨酶可以是作用于tRNA(AD AT)的腺苷脱氨酶的同源物。示例性AD AT同系物包括但不限于:
金黄色葡萄球菌(Staphylococcus aureus,S.aureus)TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAH AEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQS NFNHRAIVDKG VLKEAC S TLLTTFFKNLRANKKS TN
枯草芽孢杆菌(Bacillus subtilis,B.subtilis)TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEML VIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGC S GTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
鼠伤寒沙门氏菌(Salmonella typhimurium,S.typhimurium)TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
腐败希瓦氏菌(Shewanella putrefaciens,S.putrefaciens)TadA:
MDE YWMQVAMQM AEKAEAAGE VPVGA VLVKDGQQIATGYNLS IS QHDPT AHAEI LCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
流感嗜血杆菌F3031(Haemophilus influenzae F3031,H.influenzae)TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNG AKNIQN YRLLNS TLY VTLEPCTMC AG AILHS RIKRLVFGAS D YK TGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSD K
新月形杆菌(Caulobacter crescentus,C.crescentus)TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
硫还原地杆菌(Geobacter sulfurreducens,G.sulfurreducens)TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
TadA7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
“药剂”是指任何小分子化合物、抗体、核酸分子或多肽,或其片段。
“改变”是指基因或多肽的结构、表达水平或活性的变化,如通过标准本领域已知方法例如本文所述的那些方法检测到的。如本文所用,改变(例如,增加或减少)包含表达水平的10%变化、25%变化、40%变化和50%或更大的表达水平变化。
如本文所用,“同种异体的”是指与比较的细胞在遗传上不同的相同物种的细胞。
“类似物”是指不相同但具有类似功能或结构特征的分子。例如,多肽类似物保留了相应天然存在多肽的生物学活性,同时具有某些序列修饰,以增强类似物相对于天然存在多肽的功能。这种修饰可以增加类似物的蛋白酶抗性、膜通透性或半衰期,而不改变例如多核苷酸结合活性。在另一个例子中,多核苷酸类似物保留了相应的天然存在的多核苷酸的生物活性,同时具有相对于天然存在的多核苷酸增强类似物功能的某些修饰。这种修饰可以增加多核苷酸对DNA的亲和力、半衰期和/或核酸酶抗性,类似物可能包括非天然核苷酸或氨基酸。
“抗肿瘤活性(anti-neoplasia activity)”是指防止或抑制肿瘤的成熟和/或增殖。
如本文所用,“自体的”是指来自同一个体的细胞。
“B细胞成熟抗原,或肿瘤坏死因子受体超家族成员17多肽,(BCMA)”是指具有至少约85%的氨基酸序列与NCBI登录号NP_001183或其片段相同的蛋白质,其是在成熟的B淋巴细胞上表达。下面提供了示例性的BCMA多肽序列。
>NP_001183.2肿瘤坏死因子受体超家族成员17[智人]
MLQMAGQCSQNEYFDSLLHACIPCQLRCSSNTPPLTCQRYCNASVTNSVKGTNAILWTCLGLSLIISLAVFVLMFLLRKINSEPLKDEFKNTGSGLLGMANIDLEKSRTGDEIILPRGLEYTVEECTCEDCIKSKPKVDSDHCFPLPAMEEGATILVTTKTNDYCKSLPAALSATEIEKSISAR
所述抗原可以在复发性或难治性多发性骨髓瘤和其他血液肿瘤治疗中靶向。
“B细胞成熟抗原,或肿瘤坏死因子受体超家族成员17,(BCMA)多核苷酸”是指编码BCMA多肽的核酸分子。BCMA基因编码识别B细胞激活因子的细胞表面受体。下面提供了示例性的B2M多核苷酸序列。
>NM_001192.2智人TNF受体超家族成员17(TNFRSF17),mRNA
AAGACTCAAACTTAGAAACTTGAATTAGATGTGGTATTCAAATCCTTAGCTGCCGCGAAGACACAGACAGCCCCCGTAAGAACCCACGAAGCAGGCGAAGTTCATTGTTCTCAACATTCTAGCTGCTCTTGCTGCATTTGCTCTGGAATTCTTGTAGAGATATTACTTGTCCTTCCAGGCTGTTCTTTCTGTAGCTCCCTTGTTTTCTTTTTGTGATCATGTTGCAGATGGCTGGGCAGTGCTCCCAAAATGAATATTTTGACAGTTTGTTGCATGCTTGCATACCTTGTCAACTTCGATGTTCTTCTAATACTCCTCCTCTAACATGTCAGCGTTATTGTAATGCAAGTGTGACCAATTCAGTGAAAGGAACGAATGCGATTCTCTGGACCTGTTTGGGACTGAGCTTAATAATTTCTTTGGCAGTTTTCGTGCTAATGTTTTTGCTAAGGAAGATAAACTCTGAACCATTAAAGGACGAGTTTAAAAACACAGGATCAGGTCTCCTGGGCATGGCTAACATTGACCTGGAAAAGAGCAGGACTGGTGATGAAATTATTCTTCCGAGAGGCCTCGAGTACACGGTGGAAGAATGCACCTGTGAAGACTGCATCAAGAGCAAACCGAAGGTCGACTCTGACCATTGCTTTCCACTCCCAGCTATGGAGGAAGGCGCAACCATTCTTGTCACCACGAAAACGAATGACTATTGCAAGAGCCTGCCAGCTGCTTTGAGTGCTACGGAGATAGAGAAATCAATTTCTGCTAGGTAATTAACCATTTCGACTCGAGCAGTGCCACTTTAAAAATCTTTTGTCAGAATAGATGATGTGTCAGATCTCTTTAGGATGACTGTATTTTTCAGTTGCCGATACAGCTTTTTGTCCTCTAACTGTGGAAACTCTTTATGTTAGATATATTTCTCTAGGTTACTGTTGGGAGCTTAATGGTAGAAACTTCCTTGGTTTCATGATTAAACTCTTTTTTTTCCTGA
“碱基编辑器(BE)”或“核碱基编辑器(NBE)”是指结合多核苷酸并具有核碱基修饰活性的试剂。在一个实施方案中,所述试剂使用核酸可编程DNA结合蛋白以特定序列结合多核苷酸。在另一个实施方案中,碱基编辑器是能够修饰核酸分子(例如,DNA)内的胞苷碱基的酶。在一些实施方案中,碱基编辑器能够使核酸分子内的碱基脱氨基。在一些实施方案中,碱基编辑器能够使DNA分子内的碱基脱氨基。在一些实施方案中,碱基编辑器能够使DNA中的胞苷脱氨基。在一些实施方案中,碱基编辑器是包含胞苷脱氨酶或腺苷脱氨酶的融合蛋白。在一些实施方案中,碱基编辑器是与胞苷脱氨酶或腺苷脱氨酶融合的Cas9蛋白。在一些实施方案中,碱基编辑器是与胞苷脱氨酶或腺苷脱氨酶融合的Cas9切口酶(nCas9)。在一些实施方案中,碱基编辑器与碱基切除修复抑制剂例如UGI结构域融合。在一些实施方案中,融合蛋白包含与脱氨酶和碱基切除修复抑制剂例如UGI结构域融合的Cas9切口酶。在一些实施方案中,胞苷脱氨酶或包含以下结构域A-B的一个或一个腺苷脱氨酶核碱基编辑器多肽:
NH2-[A-B]-COOH,
其中A包含胞苷脱氨酶结构域、腺苷脱氨酶结构域或其活性片段,以及其中B包含一个或多个具有核酸序列特异性结合活性的结构域。在一个实施方案中,前述方面的胞苷或腺苷脱氨酶核碱基编辑器多肽包含:
NH2-[An-Bo]-COOH,其中A包含:胞苷脱氨酶结构域、腺苷脱氨酶结构域或其活性片段,其中n为整数:1、2、3、4或5;其中B包含具有核酸序列特异性结合活性的结构域;以及其中o是整数:1、2、3、4或5。在一个实施方案中,多肽包含一个或多个核定位序列。在一个实施方案中,多肽在N-端或C-端含有至少一个所述核定位序列。在一个实施方案中,包含核定位信号的多肽是二分核定位信号。在一个实施方案中,多肽含有一个或多个由连接子连接的结构域。
在一些实施方案中,碱基编辑器是胞苷碱基编辑器(CBE)。在一些实施方案中,碱基编辑器是腺苷碱基编辑器(ABE)。在一些实施方案中,碱基编辑器是腺苷碱基编辑器(ABE)和胞苷碱基编辑器(CBE)。在一些实施方案中,碱基编辑器是与腺苷脱氨酶融合的无核酸酶活性的Cas9(dCas9)。在一些实施方案中,Cas9是循环排列Cas9(例如,spCas9或saCas9)。循环排列Cas9s是本领域已知的以及描述于例如Oakes等人,Cell 176,254-267,2019。在一些实施方案中,碱基编辑器与碱基切除修复抑制剂融合,例如,UGI结构域或dISN结构域。在一些实施方案中,融合蛋白包含与脱氨酶和碱基切除修复抑制剂例如UGI或dISN结构域融合的Cas9切口酶。在其他实施方案中,碱基编辑器是无碱基(abasic)碱基编辑器。
在一些实施方案中,腺苷脱氨酶从TadA进化而来。在一些实施方案中,多核苷酸可编程DNA结合结构域是CRISPR相关(例如,Cas或Cpf1)酶。在一些实施方案中,碱基编辑器是与脱氨酶结构域融合的无催化活性的Cas9(dCas9)。在一些实施方案中,碱基编辑器是与脱氨酶结构域融合的Cas9切口酶(nCas9)。在一些实施方案中,碱基编辑器与碱基切除修复(BER)抑制剂融合。在一些实施方案中,碱基切除修复抑制剂是尿嘧啶DNA糖基化酶抑制剂(UGI)。在一些实施方案中,碱基切除修复抑制剂是肌苷碱基切除修复抑制剂。碱基编辑器的细节在国际第PCT/2017/045381号专利申请案(第WO2018/027078号专利公开案)和第PCT/US2016/058344号专利申请案(第WO2017/070632号专利公开案)中进行了描述,其各自通过引用整体并入本文。另见Komor,A.C.等人,“Programmable editing of a targetbase in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.等人,“Programmable base editing of A·Tto G·C in genomicDNA without DNA cleavage”Nature 551,464-471(2017);Komor,A.C.等人,“Improvedbase excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:Abase editors with higher efficiency and product purity”Science Advances3:eaao4774(2017)和Rees,H.A.等人,“Base editing:precision chemistry on thegenome and transcriptome of living cells.”Nat Rev Genet.2018Dec;19(12):770-788。doi:10.1038/s41576-018-0059-1,其全部内容在此引入作为参考。
在一些实施方案中,碱基编辑器通过将腺苷脱氨酶变异体(例如,TadA*7.10)克隆到包含循环排列(circular permutant)Cas9(例如,spCAS9)和二分核定位序列的支架中来产生。循环排列Cas9s是本领域已知的以及描述于例如Oakes等人,Cell 176,254-267,2019。示例性循环排列序列在下面列出,其中粗体序列表示源自Cas9的序列,斜体序列表示连接子序列,下划线序列表示二分核定位序列。
CP5(具有MSP“NGC=Pam变异体,具有常规类Cas9 NGG的突变”,PID=蛋白质相互作用结构域和“D10A”切口酶):
Figure BDA0003263753870000301
Figure BDA0003263753870000311
碱基编辑器系统的核碱基组分和多核苷酸可编程核苷酸结合组分可以共价地或非共价地相互关联。例如,在一些实施方案中,脱氨酶结构域可以通过多核苷酸可编程核苷酸结合结构域靶向靶核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至脱氨酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以通过与脱氨酶结构域非共价地相互作用或缔合将脱氨酶结构域靶向靶核苷酸序列。例如,在一些实施方案中,核碱基编辑组分,例如脱氨酶组分,可以包含额外的异源部分或结构域,其能够与作为多核苷酸可编程核苷酸结合结构域一部分的额外的异源部分或结构域相互作用、结合或形成复合物,结合结构域。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与向导多核苷酸结合。在一些实施方案中,额外的异源部分可能能够与多肽连接子结合。在一些实施方案中,额外的异源部分能够与多核苷酸连接子结合。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是K同源(KH)结构域、MS2外壳蛋白结构域、PP7外壳蛋白结构域、SfMu Com外壳蛋白结构域、无菌α基序、端粒酶Ku结合基序和Ku蛋白、端粒酶Sm7结合基序和Sm7蛋白或RNA识别基序。
碱基编辑器系统可以进一步包含向导多核苷酸组分。应当理解,碱基编辑器系统的组分可以通过共价键、非共价相互作用或其关联和相互作用的任何组合彼此关联。在一些实施方案中,脱氨酶结构域可以通过向导多核苷酸靶向靶核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的核碱基编辑组分,例如脱氨酶组分,可以包含额外的异源部分或结构域(例如,多核苷酸结合结构域,例如RNA或DNA结合蛋白),其能够与向导多核苷酸的部分或区段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分或结构域(例如,多核苷酸结合结构域,例如RNA或DNA结合蛋白)可以与脱氨酶结构域融合或连接。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与向导多核苷酸结合。在一些实施方案中,额外的异源部分可能能够与多肽连接子结合。在一些实施方案中,额外的异源部分能够与多核苷酸连接子结合。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是K同源(KH)结构域、MS2外壳蛋白结构域、PP7外壳蛋白结构域、SfMu Com外壳蛋白结构域、无菌α基序、端粒酶Ku结合基序和Ku蛋白、端粒酶Sm7结合基序和Sm7蛋白,或RNA识别基序。
在一些实施方案中,碱基编辑器系统可进一步包含碱基切除修复(BER)组分的抑制剂。应当理解,碱基编辑器系统的组件可以通过共价键、非共价相互作用或其关联和相互作用的任何组合彼此关联。BER组分的抑制剂可以包含碱基切除修复抑制剂。在一些实施方案中,碱基切除修复抑制剂可以是尿嘧啶DNA糖基化酶抑制剂(UGI)。在一些实施方案中,碱基切除修复抑制剂可以是肌苷碱基切除修复抑制剂。在一些实施方案中,碱基切除修复抑制剂可以通过多核苷酸可编程核苷酸结合结构域靶向靶核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以与碱基切除修复抑制剂融合或连接。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以与脱氨酶结构域和碱基切除修复抑制剂融合或连接。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以通过与碱基切除修复抑制剂非共价相互作用或缔合将碱基切除修复抑制剂靶向靶核苷酸序列。例如,在一些实施方案中,碱基切除修复抑制剂组分可包含额外的异源部分或结构域,所述异源部分或结构域能够与额外的异源部分或作为多核苷酸可编程核苷酸结合结构域的结构域相互作用、缔合或形成复合物。结合结构域在一些实施方案中,碱基切除修复抑制剂可以通过向导多核苷酸靶向靶核苷酸序列。例如,在一些实施方案中,碱基切除修复抑制剂可包含能够与相互作用、缔合或能够形成的额外的异源部分或结构域(例如,多核苷酸结合结构域,例如RNA或DNA结合蛋白)与向导多核苷酸的部分或区段(例如,多核苷酸基序)的复合物。在一些实施方案中,向导多核苷酸的额外的异源部分或结构域(例如,多核苷酸结合结构域如RNA或DNA结合蛋白)可以与碱基切除修复抑制剂融合或连接。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与向导多核苷酸结合。在一些实施方案中,额外的异源部分可能能够与多肽连接子结合。在一些实施方案中,额外的异源部分能够与多核苷酸连接子结合。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是K同源(KH)结构域、MS2外壳蛋白结构域、PP7外壳蛋白结构域、SfMu Com外壳蛋白结构域、无菌α基序、端粒酶Ku结合基序和Ku蛋白、端粒酶Sm7结合基序和Sm7蛋白,或RNA识别基序。“碱基编辑活性”是指用于化学改变多核苷酸内的碱基。在一个实施方案中,第一个碱基被转化为第二个碱基。在一个实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如将靶标C·G转化为T·A。在另一个实施方案中,碱基编辑活性是腺苷脱氨酶活性,例如将A·T转化为G·C。
“β-2微球蛋白(B2M)多肽”是指与UniProt登录号P61769或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性的B2M多肽序列。
>sp|P61769|B2MG_人类β-2微球蛋白ΒOS=智人OX=9606GN=B2MPE=1SV=1
MSRSVALAVLALLSLSGLEAIQRTPKIQVYSRHPAENGKSNFLNCYVSGFHPSDIEVDLL
KNGERIEKVEHSDLSFSKDWSFYLLYYTEFTPTEKDEYACRVNHVTLSQPKIVKWDRDM
“β-2-微球蛋白(B2M)多核苷酸”是指编码B2M多肽的核酸分子。β-2-微球蛋白基因编码一种与主要组织相容性复合体相关的血清蛋白。B2M参与宿主CD8+T细胞的非自我识别。下面提供了示例性的B2M多核苷酸序列。
>DQ217933.1智人β-2-微球蛋白(B2M)基因,完整的cds
CATGTCATAAATGGTAAGTCCAAGAAAAATACAGGTATTCCCCCCCAAAGAAAACTGTAAAATCGACTTTTTTCTATCTGTACTGTTTTTTATTGGTTTTTAAATTGGTTTTCCAAGTGAGTAAATCAGAATCTATCTGTAATGGATTTTAAATTTAGTGTTTCTCTGTGATGTAGTAAACAAGAAACTAGAGGCAAAAATAGCCCTGTCCCTTGCTAAACTTCTAAGGCACTTTTCTAGTACAACTCAACACTAACATTTCAGGCCTTTAGTGCCTTATATGAGTTTTTAAAAGGGGGAAAAGGGAGGGAGCAAGAGTGTCTTAACTCATACATTTAGGCATAACAATTATTCTCATATTTTAGTTATTGAGAGGGCTGGTAGAAAAACTAGGTAAATAATATTAATAATTATAGCGCTTATTAAACACTACAGAACACTTACTATGTACCAGGCATTGTGGGAGGCTCTCTCTTGTGCATTATCTCATTTCATTAGGTCCATGGAGAGTATTGCATTTTCTTAGTTTAGGCATGGCCTCCACAATAAAGATTATCAAAAGCCTAAAAATATGTAAAAGAAACCTAGAAGTTATTTGTTGTGCTCCTTGGGGAAGCTAGGCAAATCCTTTCAACTGAAAACCATGGTGACTTCCAAGATCTCTGCCCCTCCCCATCGCCATGGTCCACTTCCTCTTCTCACTGTTCCTCTTAGAAAAGATCTGTGGACTCCACCACCACGAAATGGCGGCACCTTATTTATGGTCACTTTAGAGGGTAGGTTTTCTTAATGGGTCTGCCTGTCATGTTTAACGTCCTTGGCTGGGTCCAAGGCAGATGCAGTCCAAACTCTCACTAAAATTGCCGAGCCCTTTGTCTTCCAGTGTCTAAAATATTAATGTCAATGGAATCAGGCCAGAGTTTGAATTCTAGTCTCTTAGCCTTTGTTTCCCCTGTCCATAAAATGAATGGGGGTAATTCTTTCCTCCTACAGTTTATTTATATATTCACTAATTCATTCATTCATCCATCCATTCGTTCATTCGGTTTACTGAGTACCTACTATGTGCCAGCCCCTGTTCTAGGGTGGAAACTAAGAGAATGATGTACCTAGAGGGCGCTGGAAGCTCTAAAGCCCTAGCAGTTACTGCTTTTACTATTAGTGGTCGTTTTTTTCTCCCCCCCGCCCCCCGACAAATCAACAGAACAAAGAAAATTACCTAAACAGCAAGGACATAGGGAGGAACTTCTTGGCACAGAACTTTCCAAACACTTTTTCCTGAAGGGATACAAGAAGCAAGAAAGGTACTCTTTCACTAGGACCTTCTCTGAGCTGTCCTCAGGATGCTTTTGGGACTATTTTTCTTACCCAGAGAATGGAGAAACCCTGCAGGGAATTCCCAAGCTGTAGTTATAAACAGAAGTTCTCCTTCTGCTAGGTAGCATTCAAAGATCTTAATCTTCTGGGTTTCCGTTTTCTCGAATGAAAAATGCAGGTCCGAGCAGTTAACTGGCTGGGGCACCATTAGCAAGTCACTTAGCATCTCTGGGGCCAGTCTGCAAAGCGAGGGGGCAGCCTTAATGTGCCTCCAGCCTGAAGTCCTAGAATGAGCGCCCGGTGTCCCAAGCTGGGGCGCGCACCCCAGATCGGAGGGCGCCGATGTACAGACAGCAAACTCACCCAGTCTAGTGCATGCCTTCTTAAACATCACGAGACTCTAAGAAAAGGAAACTGAAAACGGGAAAGTCCCTCTCTCTAACCTGGCACTGCGTCGCTGGCTTGGAGACAGGTGACGGTCCCTGCGGGCCTTGTCCTGATTGGCTGGGCACGCGTTTAATATAAGTGGAGGCGTCGCGCTGGCGGGCATTCCTGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCTACTCTCTCTTTCTGGCCTGGAGGCTATCCAGCGTGAGTCTCTCCTACCCTCCCGCTCTGGTCCTTCCTCTCCCGCTCTGCACCCTCTGTGGCCCTCGCTGTGCTCTCTCGCTCCGTGACTTCCCTTCTCCAAGTTCTCCTTGGTGGCCCGCCGTGGGGCTAGTCCAGGGCTGGATCTCGGGGAAGCGGCGGGGTGGCCTGGGAGTGGGGAAGGGGGTGCGCACCCGGGACGCGCGCTACTTGCCCCTTTCGGCGGGGAGCAGGGGAGACCTTTGGCCTACGGCGACGGGAGGGTCGGGACAAAGTTTAGGGCGTCGATAAGCGTCAGAGCGCCGAGGTTGGGGGAGGGTTTCTCTTCCGCTCTTTCGCGGGGCCTCTGGCTCCCCCAGCGCAGCTGGAGTGGGGGACGGGTAGGCTCGTCCCAAAGGCGCGGCGCTGAGGTTTGTGAACGCGTGGAGGGGCGCTTGGGGTCTGGGGGAGGCGTCGCCCGGGTAAGCCTGTCTGCTGCGGCTCTGCTTCCCTTAGACTGGAGAGCTGTGGACTTCGTCTAGGCGCCCGCTAAGTTCGCATGTCCTAGCACCTCTGGGTCTATGTGGGGCCACACCGTGGGGAGGAAACAGCACGCGACGTTTGTAGAATGCTTGGCTGTGATACAAAGCGGTTTCGAATAATTAACTTATTTGTTCCCATCACATGTCACTTTTAAAAAATTATAAGAACTACCCGTTATTGACATCTTTCTGTGTGCCAAGGACTTTATGTGCTTTGCGTCATTTAATTTTGAAAACAGTTATCTTCCGCCATAGATAACTACTATGGTTATCTTCTGCCTCTCACAGATGAAGAAACTAAGGCACCGAGATTTTAAGAAACTTAATTACACAGGGGATAAATGGCAGCAATCGAGATTGAAGTCAAGCCTAACCAGGGCTTTTGCGGGAGCGCATGCCTTTTGGCTGTAATTCGTGCATTTTTTTTTAAGAAAAACGCCTGCCTTCTGCGTGAGATTCTCCAGAGCAAACTGGGCGGCATGGGCCCTGTGGTCTTTTCGTACAGAGGGCTTCCTCTTTGGCTCTTTGCCTGGTTGTTTCCAAGATGTACTGTGCCTCTTACTTTCGGTTTTGAAAACATGAGGGGGTTGGGCGTGGTAGCTTACGCCTGTAATCCCAGCACTTAGGGAGGCCGAGGCGGGAGGATGGCTTGAGGTCCGTAGTTGAGACCAGCCTGGCCAACATGGTGAAGCCTGGTCTCTACAAAAAATAATAACAAAAATTAGCCGGGTGTGGTGGCTCGTGCCTGTGGTCCCAGCTGCTCCGGTGGCTGAGGCGGGAGGATCTCTTGAGCTTAGGCTTTTGAGCTATCATGGCGCCAGTGCACTCCAGCGTGGGCAACAGAGCGAGACCCTGTCTCTCAAAAAAGAAAAAAAAAAAAAAAGAAAGAGAAAAGAAAAGAAAGAAAGAAGTGAAGGTTTGTCAGTCAGGGGAGCTGTAAAACCATTAATAAAGATAATCCAAGATGGTTACCAAGACTGTTGAGGACGCCAGAGATCTTGAGCACTTTCTAAGTACCTGGCAATACACTAAGCGCGCTCACCTTTTCCTCTGGCAAAACATGATCGAAAGCAGAATGTTTTGATCATGAGAAAATTGCATTTAATTTGAATACAATTTATTTACAACATAAAGGATAATGTATATATCACCACCATTACTGGTATTTGCTGGTTATGTTAGATGTCATTTTAAAAAATAACAATCTGATATTTAAAAAAAAATCTTATTTTGAAAATTTCCAAAGTAATACATGCCATGCATAGACCATTTCTGGAAGATACCACAAGAAACATGTAATGATGATTGCCTCTGAAGGTCTATTTTCCTCCTCTGACCTGTGTGTGGGTTTTGTTTTTGTTTTACTGTGGGCATAAATTAATTTTTCAGTTAAGTTTTGGAAGCTTAAATAACTCTCCAAAAGTCATAAAGCCAGTAACTGGTTGAGCCCAAATTCAAACCCAGCCTGTCTGATACTTGTCCTCTTCTTAGAAAAGATTACAGTGATGCTCTCACAAAATCTTGCCGCCTTCCCTCAAACAGAGAGTTCCAGGCAGGATGAATCTGTGCTCTGATCCCTGAGGCATTTAATATGTTCTTATTATTAGAAGCTCAGATGCAAAGAGCTCTCTTAGCTTTTAATGTTATGAAAAAAATCAGGTCTTCATTAGATTCCCCAATCCACCTCTTGATGGGGCTAGTAGCCTTTCCTTAATGATAGGGTGTTTCTAGAGAGATATATCTGGTCAAGGTGGCCTGGTACTCCTCCTTCTCCCCACAGCCTCCCAGACAAGGAGGAGTAGCTGCCTTTTAGTGATCATGTACCCTGAATATAAGTGTATTTAAAAGAATTTTATACACATATATTTAGTGTCAATCTGTATATTTAGTAGCACTAACACTTCTCTTCATTTTCAATGAAAAATATAGAGTTTATAATATTTTCTTCCCACTTCCCCATGGATGGTCTAGTCATGCCTCTCATTTTGGAAAGTACTGTTTCTGAAACATTAGGCAATATATTCCCAACCTGGCTAGTTTACAGCAATCACCTGTGGATGCTAATTAAAACGCAAATCCCACTGTCACATGCATTACTCCATTTGATCATAATGGAAAGTATGTTCTGTCCCATTTGCCATAGTCCTCACCTATCCCTGTTGTATTTTATCGGGTCCAACTCAACCATTTAAGGTATTTGCCAGCTCTTGTATGCATTTAGGTTTTGTTTCTTTGTTTTTTAGCTCATGAAATTAGGTACAAAGTCAGAGAGGGGTCTGGCATATAAAACCTCAGCAGAAATAAAGAGGTTTTGTTGTTTGGTAAGAACATACCTTGGGTTGGTTGGGCACGGTGGCTCGTGCCTGTAATCCCAACACTTTGGGAGGCCAAGGCAGGCTGATCACTTGAAGTTGGGAGTTCAAGACCAGCCTGGCCAACATGGTGAAATCCCGTCTCTACTGAAAATACAAAAATTAACCAGGCATGGTGGTGTGTGCCTGTAGTCCCAGGAATCACTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCTGAGATCTCACCACTGCACACTGCACTCCAGCCTGGGCAATGGAATGAGATTCCATCCCAAAAAATAAAAAAATAAAAAAATAAAGAACATACCTTGGGTTGATCCACTTAGGAACCTCAGATAATAACATCTGCCACGTATAGAGCAATTGCTATGTCCCAGGCACTCTACTAGACACTTCATACAGTTTAGAAAATCAGATGGGTGTAGATCAAGGCAGGAGCAGGAACCAAAAAGAAAGGCATAAACATAAGAAAAAAAATGGAAGGGGTGGAAACAGAGTACAATAACATGAGTAATTTGATGGGGGCTATTATGAACTGAGAAATGAACTTTGAAAAGTATCTTGGGGCCAAATCATGTAGACTCTTGAGTGATGTGTTAAGGAATGCTATGAGTGCTGAGAGGGCATCAGAAGTCCTTGAGAGCCTCCAGAGAAAGGCTCTTAAAAATGCAGCGCAATCTCCAGTGACAGAAGATACTGCTAGAAATCTGCTAGAAAAAAAACAAAAAAGGCATGTATAGAGGAATTATGAGGGAAAGATACCAAGTCACGGTTTATTCTTCAAAATGGAGGTGGCTTGTTGGGAAGGTGGAAGCTCATTTGGCCAGAGTGGAAATGGAATTGGGAGAAATCGATGACCAAATGTAAACACTTGGTGCCTGATATAGCTTGACACCAAGTTAGCCCCAAGTGAAATACCCTGGCAATATTAATGTGTCTTTTCCCGATATTCCTCAGGTACTCCAAAGATTCAGGTTTACTCACGTCATCCAGCAGAGAATGGAAAGTCAAATTTCCTGAATTGCTATGTGTCTGGGTTTCATCCATCCGACATTGAAGTTGACTTACTGAAGAATGGAGAGAGAATTGAAAAAGTGGAGCATTCAGACTTGTCTTTCAGCAAGGACTGGTCTTTCTATCTCTTGTACTACACTGAATTCACCCCCACTGAAAAAGATGAGTATGCCTGCCGTGTGAACCATGTGACTTTGTCACAGCCCAAGATAGTTAAGTGGGGTAAGTCTTACATTCTTTTGTAAGCTGCTGAAAGTTGTGTATGAGTAGTCATATCATAAAGCTGCTTTGATATAAAAAAGGTCTATGGCCATACTACCCTGAATGAGTCCCATCCCATCTGATATAAACAATCTGCATATTGGGATTGTCAGGGAATGTTCTTAAAGATCAGATTAGTGGCACCTGCTGAGATACTGATGCACAGCATGGTTTCTGAACCAGTAGTTTCCCTGCAGTTGAGCAGGGAGCAGCAGCAGCACTTGCACAAATACATATACACTCTTAACACTTCTTACCTACTGGCTTCCTCTAGCTTTTGTGGCAGCTTCAGGTATATTTAGCACTGAACGAACATCTCAAGAAGGTATAGGCCTTTGTTTGTAAGTCCTGCTGTCCTAGCATCCTATAATCCTGGACTTCTCCAGTACTTTCTGGCTGGATTGGTATCTGAGGCTAGTAGGAAGGGCTTGTTCCTGCTGGGTAGCTCTAAACAATGTATTCATGGGTAGGAACAGCAGCCTATTCTGCCAGCCTTATTTCTAACCATTTTAGACATTTGTTAGTACATGGTATTTTAAAAGTAAAACTTAATGTCTTCCTTTTTTTTCTCCACTGTCTTTTTCATAGATCGAGACATGTAAGCAGCATCATGGAGGTAAGTTTTTGACCTTGAGAAAATGTTTTTGTTTCACTGTCCTGAGGACTATTTATAGACAGCTCTAACATGATAACCCTCACTATGTGGAGAACATTGACAGAGTAACATTTTAGCAGGGAAAGAAGAATCCTACAGGGTCATGTTCCCTTCTCCTGTGGAGTGGCATGAAGAAGGTGTATGGCCCCAGGTATGGCCATATTACTGACCCTCTACAGAGAGGGCAAAGGAACTGCCAGTATGGTATTGCAGGATAAAGGCAGGTGGTTACCCACATTACCTGCAAGGCTTTGATCTTTCTTCTGCCATTTCCACATTGGACATCTCTGCTGAGGAGAGAAAATGAACCACTCTTTTCCTTTGTATAATGTTGTTTTATTCTTCAGACAGAAGAGAGGAGTTATACAGCTCTGCAGACATCCCATTCCTGTATGGGGACTGTGTTTGCCTCTTAGAGGTTCCCAGGCCACTAGAGGAGATAAAGGGAAACAGATTGTTATAACTTGATATAATGATACTATAATAGATGTAACTACAAGGAGCTCCAGAAGCAAGAGAGAGGGAGGAACTTGGACTTCTCTGCATCTTTAGTTGGAGTCCAAAGGCTTTTCAATGAAATTCTACTGCCCAGGGTACATTGATGCTGAAACCCCATTCAAATCTCCTGTTATATTCTAGAACAGGGAATTGATTTGGGAGAGCATCAGGAAGGTGGATGATCTGCCCAGTCACACTGTTAGTAAATTGTAGAGCCAGGACCTGAACTCTAATATAGTCATGTGTTACTTAATGACGGGGACATGTTCTGAGAAATGCTTACACAAACCTAGGTGTTGTAGCCTACTACACGCATAGGCTACATGGTATAGCCTATTGCTCCTAGACTACAAACCTGTACAGCCTGTTACTGTACTGAATACTGTGGGCAGTTGTAACACAATGGTAAGTATTTGTGTATCTAAACATAGAAGTTGCAGTAAAAATATGCTATTTTAATCTTATGAGACCACTGTCATATATACAGTCCATCATTGACCAAAACATCATATCAGCATTTTTTCTTCTAAGATTTTGGGAGCACCAAAGGGATACACTAACAGGATATACTCTTTATAATGGGTTTGGAGAACTGTCTGCAGCTACTTCTTTTAAAAAGGTGATCTACACAGTAGAAATTAGACAAGTTTGGTAATGAGATCTGCAATCCAAATAAAATAAATTCATTGCTAACCTTTTTCTTTTCTTTTCAGGTTTGAAGATGCCGCATTTGGATTGGATGAATTCCAAATTCTGCTTGCTTGCTTTTTAATATTGATATGCTTATACACTTACACTTTATGCACAAAATGTAGGGTTATAATAATGTTAACATGGACATGATCTTCTTTATAATTCTACTTTGAGTGCTGTCTCCATGTTTGATGTATCTGAGCAGGTTGCTCCACAGGTAGCTCTAGGAGGGCTGGCAACTTAGAGGTGGGGAGCAGAGAATTCTCTTATCCAACATCAACATCTTGGTCAGATTTGAACTCTTCAATCTCTTGCACTCAAAGCTTGTTAAGATAGTTAAGCGTGCATAAGTTAACTTCCAATTTACATACTCTGCTTAGAATTTGGGGGAAAATTTAGAAATATAATTGACAGGATTATTGGAAATTTGTTATAATGAATGAAACATTTTGTCATATAAGATTCATATTTACTTCTTATACATTTGATAAAGTAAGGCATGGTTGTGGTTAATCTGGTTTATTTTTGTTCCACAAGTTAAATAAATCATAAAACTTGATGTGTTATCTCTTATATCTCACTCCCACTATTACCCCTTTATTTTCAAACAGGGAAACAGTCTTCAAGTTCCACTTGGTAAAAAATGTGAACCCCTTGTATATAGAGTTTGGCTCACAGTGTAAAGGGCCTCAGTGATTCACATTTTCCAGATTAGGAATCTGATGCTCAAAGAAGTTAAATGGCATAGTTGGGGTGACACAGCTGTCTAGTGGGAGGCCAGCCTTCTATATTTTAGCCAGCGTTCTTTCCTGCGGGCCAGGTCATGAGGAGTATGCAGACTCTAAGAGGGAGCAAAAGTATCTGAAGGATTTAATATTTTAGCAAGGAATAGATATACAATCATCCCTTGGTCTCCCTGGGGGATTGGTTTCAGGACCCCTTCTTGGACACCAAATCTATGGATATTTAAGTCCCTTCTATAAAATGGTATAGTATTTGCATATAACCTATCCACATCCTCCTGTATACTTTAAATCATTTCTAGATTACTTGTAATACCTAATACAATGTAAATGCTATGCAAATAGTTGTTATTGTTTAAGGAATAATGACAAGAAAAAAAAGTCTGTACATGCTCAGTAAAGACACAACCATCCCTTTTTTTCCCCAGTGTTTTTGATCCATGGTTTGCTGAATCCACAGATGTGGAGCCCCTGGATACGGAAGGCCCGCTGTACTTTGAATGACAAATAACAGATTTAAA
术语“Cas9”或“Cas9结构域”是指包含Cas9蛋白或其片段(例如,包含活性、无活性或部分活性的Cas9的DNA切割结构域的蛋白质,和/或Cas9的gRNA结合结构域)的RNA-向导的核酸酶。Cas9核酸酶有时也称为casn1核酸酶或CRISPR(“规律成簇间隔短回文重复序列”)相关核酸酶。CRISPR是一种适应性免疫系统,可针对移动遗传元件(病毒、转座元件和接合质粒)提供保护。CRISPR簇包含间隔物、与先行移动元件互补的序列和靶入侵核酸。CRISPR簇被转录并加工成CRISPRRNA(crRNA)。在II型CRISPR系统中,正确处理pre-crRNA需要转编码的小RNA(tracrRNA)、内源性核糖核酸酶3(rnc)和Cas9蛋白。tracrRNA作为核糖核酸酶3辅助处理pre-crRNA的向导。随后,Cas9/crRNA/tracrRNA核酸内切切割与间隔物互补的线性或环状dsDNA靶标。与crRNA不互补的靶链首先通过核酸内切方式切割,然后通过核酸外切方式修剪3′-5'。在自然界中,DNA结合和切割通常需要蛋白质和两种RNA。然而,可以对单向导RNAs(“sgRNA”,或简称为“gNRA”)进行工程化,以便将crRNA和tracrRNA的各个方面整合到单个RNA种类中。参见,例如,Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012),其全部内容通过引用并入本文。Cas9识别CRISPR重复序列(PAM或原型间隔物相邻基序)中的短基序,以帮助区分自我与非自我。Cas9核酸酶序列和结构是本领域技术人员众所周知的(参见,例如,“Completegenome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti等人,JJ,McShan WM,Ajdic DJ,Savic DJ,Savic G.,Lyon K.,Primeaux C.,Sezate S.,SuvorovAN,Kenton S.,Lai HS,Lin SP,Qian Y.,Jia HG,Najar FZ,Ren Q.,Zhu H.,Song L.,White J.、Yuan X.、Clifton SW、Roe BA、McLaughlin RE,Proc.Natl.Acad.Sci.USA 98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and hostfactor RNase III.”Deltcheva E.、Chylinski K.、Sharma CM、Gonzales K.、Chao Y.、Pirzada ZA、Eckert MR、Vogel J.、Charpentier E.,Nature 471:602-607(2011);和“Aprogrammable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity.”Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna JA,CharpentierE.Science 337:816-821(2012),每个的全部内容以引用方式并入本文)。Cas9直系同源體已在各种物种中得到描述,包括但不限于化脓链球菌(S.pyogenes)和嗜热链球菌(S.thermophilus)。基于本发明内容,其他合适的Cas9核酸酶和序列对本领域技术人员来说是显而易见的,以及此类Cas9核酸酶和序列包括来自Chylinski、Rhun和Charpentier,“The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737;其全部内容以引用方式并入本文。在一些实施方案中,Cas9核酸酶具有无活性(例如,失活)DNA切割结构域,即Cas9是切口酶。
核酸酶失活的Cas9蛋白可互换地称为“dCas9”蛋白(对于核酸酶-“死的”Cas9)。用于产生具有无活性DNA切割结构域的Cas9蛋白(或其片段)的方法是已知的(参见,例如,Jinek等人,Science.337:816-821(2012);Qi等人,“Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression”(2013)Cell.28;152(5):1173-83,每篇文献的全部内容通过引用并入本文)。例如,已知Cas9的DNA切割结构域包含两个子结构域,HNH核酸酶子结构域和RuvC1子结构域。HNH子结构域切割与gRNA互补的链,而RuvC1子结构域切割非互补链。这些子结构域内的突变可以使Cas9的核酸酶活性沉默。例如,突变D10A和H840A使化脓性链球菌Cas9的核酸酶活性完全失活(Jinek等人,Science.337:816-821(2012);Qi等人,Cell.28;152(5):1173-83(2013))。在一些实施方案中,提供了包含Cas9片段的蛋白质。例如,在一些实施方案中,蛋白质包含两个Cas9结构域之一:(1)Cas9的gRNA结合结构域;或(2)Cas9的DNA切割结构域。在一些实施方案中,包含Cas9或其片段的蛋白质被称为“Cas9变异体”。Cas9变异体与Cas9或其片段具有同源性。例如,Cas9变异体与野生型Cas9至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,与野生型Cas9相比,Cas9变异体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多的氨基酸变化。在一些实施方案中,Cas9变异体包含Cas9的片段(例如,gRNA结合结构域或DNA切割结构域),使得所述片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%与野生型Cas9的相应片段相同。在一些实施方案中,所述片段是至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%或至少99.5%相应的野生型Cas9的氨基酸长度。
在一些实施方案中,所述片段的长度为至少100个氨基酸。在一些实施方案中,所述片段是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1050 9 1150、1200、1250或至少1300个氨基酸的长度。在一些实施方案中,野生型Cas9相应于来自化脓性链球菌的Cas9(NCBI参考序列:NC_017053.1,核苷酸和氨基酸序列如下)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
MDKK
Figure BDA0003263753870000431
Figure BDA0003263753870000432
AEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQG
Figure BDA0003263753870000441
ENQTTQKGQKNSRERMKRIEE GIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDK NRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERG
Figure BDA0003263753870000442
Figure BDA0003263753870000443
Figure BDA0003263753870000444
Figure BDA0003263753870000445
GGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(单下划线:HNH结构域;双下划线:RuvC结构域)
在一些实施方案中,野生型Cas9相应于或包含以下核苷酸和/或氨基酸序列:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
MDKK
Figure BDA0003263753870000461
Figure BDA0003263753870000462
AEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQG
Figure BDA0003263753870000471
RENQTTQKGQKNSRERMKRIE EGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSD KNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERG
Figure BDA0003263753870000472
Figure BDA0003263753870000473
Figure BDA0003263753870000474
Figure BDA0003263753870000475
GGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(单下划线:HNH结构域;双下划线:RuvC结构域)
在一些实施方案中,野生型Cas9相应于来自化脓性链球菌的Cas9(NCBI参考序列:NC_002737.2(核苷酸序列如下);和Uniprot参考序列:Q99ZW2(氨基酸序列如下)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
MDKK
Figure BDA0003263753870000501
Figure BDA0003263753870000502
AEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQG
Figure BDA0003263753870000503
RENQTTQKGQKNSRERMKRIE EGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSD KNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERG
Figure BDA0003263753870000504
Figure BDA0003263753870000505
Figure BDA0003263753870000506
Figure BDA0003263753870000507
GGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(单下划线:HNH结构域;双下划线:RuvC结构域)。
在一些实施方案中,Cas9是指来自:溃疡棒状杆菌(Corynebacterium ulcerans)(NCBI Refs:NC_015683.1、NC_017317.1)的Cas9;白喉棒状杆菌(Corynebacteriumdiphtheria)(NCBI Refs:NC_016782.1,NC_016786.1);栖蚜蝇螺原体(Spiroplasmasyrphidicola)(NCBI Ref:NC_021284.1);中间型普氏杆菌(Prevotella intermedia)(NCBI Ref:NC_017861.1);中国台湾螺旋体(Spiroplasma,Taiwan,China)(NCBI Ref:NC_021846.1);海豚链球菌(Streptococcus iniae)(NCBI Ref:NC_021314.1);含羞草伯克霍尔德氏菌(Belliella baltica)(NCBI Ref:NC_018010.1);扭曲冷弯曲菌I(PsychroflexusTorquisI)(NCBI Ref:NC_018721.1);嗜热链球菌(Streptococcus thermophilus)(NCBIRef:YP_820832.1)、无害李斯特菌(Listeria innocua)(NCBI Ref:NP_472073.1)、空肠弯曲杆菌(Campylobacter jejuni)(NCBI Ref:YP_002344900.1)或脑膜炎双球菌(Neisseria.meningitidis)(NCBI Ref:YP_002342100.1)或来自任何其他生物体的Cas9。
在一些实施方案中,dCas9相应于或部分或全部包含具有一个或多个使Cas9核酸酶活性失活的突变的Cas9氨基酸序列。例如,在一些实施方案中,dCas9结构域包含D10A和H840A突变或另一个Cas9中的相应突变。在一些实施方案中,dCas9包含dCas9(D10A和H840A)的氨基酸序列:
MDKK
Figure BDA0003263753870000511
Figure BDA0003263753870000512
AEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQG
Figure BDA0003263753870000513
RENQTTQKGQKNSRERMKRIE EGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSD KNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERG
Figure BDA0003263753870000514
Figure BDA0003263753870000515
Figure BDA0003263753870000521
Figure BDA0003263753870000522
GGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(单下划线:HNH结构域;双下划线:RuvC结构域)。
在一些实施方案中,Cas9结构域包含D10A突变,而位置840的残基在上文提供的氨基酸序列中或在本文提供的任何氨基酸序列中的相应位置处保持为组氨酸。
在其他实施方案中,提供了具有除D10A和H840A之外的突变的dCas9变异体,其例如导致核酸酶失活的Cas9(dCas9)。例如,此类突变包含在D10和H840处的其他氨基酸置换,或Cas9核酸酶结构域内的其他置换(例如,HNH核酸酶子结构域和/或RuvC1子结构域中的置换)。
在一些实施方案中,提供了至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同的dCas9的变异体或同源物。在一些实施方案中,dCas9的变异体提供具有较短或较长约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多。
在一些实施方案中,本文提供的Cas9融合蛋白包含Cas9蛋白的全长氨基酸序列,例如本文提供的Cas9序列之一。然而,在其他实施方案中,本文提供的融合蛋白不包含全长Cas9序列,而仅包含其片段。例如,在一些实施方案中,本文提供的Cas9融合蛋白包含Cas9片段,其中所述片段结合crRNA和tracrRNA或sgRNA,但不包含功能性核酸酶结构域,例如,因为其仅包含核酸酶的截短形式结构域或根本没有核酸酶结构域。
本文提供了合适的Cas9结构域和Cas9片段的示例性氨基酸序列,以及Cas9结构域和片段的其他合适的序列对本领域技术人员来说是显而易见的。
在一些实施方案中,Cas9是指来自溃疡棒状杆菌(Corynebacterium ulcerans)(NCBI Refs:NC_015683.1、NC_017317.1)的Cas9;白喉棒状杆菌(Corynebacteriumdiphtheria)(NCBI Refs:NC_016782.1,NC_016786.1);栖蚜蝇螺原体(Spiroplasmasyrphidicola)(NCBI Ref:NC_021284.1);中间型普氏杆菌(Prevotella intermedia)(NCBI Ref:NC_017861.1);中国台湾螺旋体(Spiroplasma,taiwan,China)(NCBI Ref:NC_021846.1);海豚链球菌(Streptococcus iniae)(NCBI Ref:NC_021314.1);含羞草伯克霍尔德氏菌(Belliella baltica)(NCBI Ref:NC_018010.1);扭曲冷弯曲菌I(PsychroflexusTorquisI)(NCBI Ref:NC_018721.1);嗜热链球菌(Streptococcus thermophilus)(NCBIRef:YP_820832.1);无害李斯特菌(Listeria innocua)(NCBI Ref:NP_472073.1);空肠弯曲杆菌(Campylobacter jejuni)(NCBI Ref:YP_002344900.1);或脑膜炎双球菌(Neisseria.meningitidis)(NCBI Ref:YP_002342100.1)。
应当理解,额外的Cas9蛋白(例如,无核酸酶活性的Cas9(dCas9)、Cas9切口酶(nCas9)或核酸酶活性Cas9),包含其变异体和同系物,在本发明的范围内。示例性的Cas9蛋白包含但不限于以下提供的那些。在一些实施方案中,Cas9蛋白是无核酸酶活性的Cas9(dCas9)。在一些实施方案中,Cas9蛋白是Cas9切口酶(nCas9)。在一些实施方案中,Cas9蛋白是核酸酶活性的Cas9。
示例性无催化活性的Cas9(dCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
示例性催化活性Cas9切口酶(nCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
示例性催化活性Cas9:
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
在一些实施方案中,Cas9是指来自古细菌(例如纳米古细菌)的Cas9,其构成单细胞原核微生物的结构域和界。在一些实施方案中,Cas9是指CasX或CasY,其已在例如Burstein等人"New CRISPR-Cas systems from uncultivated microbes."CellRes.2017Feb 21.doi:10.1038/cr.2017.21,其全部内容在此引入作为参考。使用基因组解析的宏基因组学,确定了一些CRISPR-Cas系统,包含在古细菌领域首次报道的Cas9。这个发散的Cas9蛋白被发现在很少被研究的纳米古细菌中作为活性CRISPR-Cas系统的一部分。在细菌中,发现了两个以前未知的系统,CRISPR-CasX和CRISPR-CasY,其是迄今为止发现的最紧凑的系统之一。在一些实施方案中,Cas9是指CasX,或CasX的变异体。在一些实施方案中,Cas9是指CasY或CasY的变异体。应当理解,其他RNA向导的DNA结合蛋白可以用作核酸可编程DNA结合蛋白(napDNAbp),以及在本发明的范围内。
在一些实施方案中,本文提供的核酸可编程DNA结合蛋白(napDNAbp)或任何融合蛋白可以是CasX或CasY蛋白。在一些实施方案中,napDNAbp是CasX蛋白。在一些实施方案中,napDNAbp是CasY蛋白。在一些实施方案中,napDNAbp包含的氨基酸序列为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与天然存在的CasX或CasY蛋白相同。在一些实施方案中,napDNAbp是天然存在的CasX或CasY蛋白。在一些实施方案中,napDNAbp包含的氨基酸序列为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文所述的任何CasX或CasY蛋白相同。应当理解,根据本发明也可以使用来自其他细菌物个的CasX和CasY。
CasX
(uniprot.org/uniprot/F0NN87;uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR-associated Casx protein OS=冰岛硫化叶菌(Sulfolobus islandicus)(菌株HVE10/4)GN=SiH_0402PE=4SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
>tr|F0NH53|F0NH53_SULIR CRISPR associated protein,Casx OS=冰岛硫化叶菌(菌株REY15A)GN=SiRe_0771PE=4SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
CasY(ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR-associated protein CasY[未经培养的俭菌总门(Parcubacteria)群细菌]
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI
术语“Cas12b”或“Cas12b结构域”是指包含Cas12b/C2c1蛋白或其片段的RNA向导的核酸酶(例如,包含Cas12b的活性、无活性或部分活性的DNA切割结构域的蛋白,和/或Cas12b的gRNA结合结构域)。其内容在此引入作为参考)。Cas12b直系同源體已在各种物种中得到描述,包含但不限于酸土脂环酸芽孢杆菌(Alicyclobacillus acidoterrestris)、嗜酸脂环杆菌(Alicyclobacillus acidophilus)(Teng等人,Cell Discov.2018Nov 27;4:63)、外村尚芽孢杆菌(Bacillus hisashi)和芽孢桿菌(Bacillus sp.V3-13)。基于本发明,其他合适的Cas12b核酸酶和序列对于本领域技术人员来说将是显而易见的。
在一些实施方案中,包含Cas12b或其片段的蛋白质被称为“Cas12b变异体”。Cas12b变异体与Cas12b或其片段具有同源性。例如,Cas12b变异体与野生型Cas12b至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,在与野生型Cas12b至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,与野生型Cas12b相比,Cas12b变异体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多的氨基酸变化。在一些实施方案中,Cas12b变异体包含Cas12b的片段(例如,gRNA结合结构域或DNA切割结构域),使得所述片段与野生型Cas12b的相应片段至少约70%相同,至少约80%相同,至少约90%相同。%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,所述片段是至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%或至少99.5%相应野生型Cas12b的氨基酸长度。下面列出了示例性的Cas12b多肽。
Cas12b/C2c1(uniprot.org/uniprot/T0D7A2#2)
sp|T0D7A2|C2C1_ALIAG CRISPR-关联的核酸内切酶C2c1 OS=酸土脂环酸芽孢杆菌(Alicyclobacillus acido-terrestris)(菌株ATCC 49025/DSM 3922/CIP 106132/NCIMB 13137/GD3B)GN=c2c1 PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
AacCas12b嗜酸脂环杆菌(Alicyclobacillus acidiphilus)-WP_067623834
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI
BhCas12b外村尚芽孢杆菌(Bacillus hisashii)NCBI参考序列:WP_095142515
Figure BDA0003263753870000601
Figure BDA0003263753870000611
包含称为BvCas12b V4的变异体(S893R/K846R/E837G更改为上述wt)
BvCas12b芽孢杆菌(Bacillus sp.V3-13)NCBI参考序列:WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
“Cbl原癌基因B(CBLB)多肽”是指与基因库登录号ABC86700.1或其片段具有至少约85%的氨基酸序列同一性的蛋白质,其参与免疫应答的调节。下面提供了示例性CBLB多肽序列。
>ABC86700.1 CBL-B[智人]
MANSMNGRNPGGRGGNPRKGRILGIIDAIQDAVGPPKQAAADRRTVEKTWKLMDKVVRLCQNPKLQLKNSPPYILDILPDTYQHLRLILSKYDDNQKLAQLSENEYFKIYIDSLMKKSKRAIRLFKEGKERMYEEQSQDRRNLTKLSLIFSHMLAEIKAIFPNGQFQGDNFRITKADAAEFWRKFFGDKTIVPWKVFRQCLHEVHQISSGLEAMALKSTIDLTCNDYISVFEFDIFTRLFQPWGSILRNWNFLAVTHPGYMAFLTYDEVKARLQKYSTKPGSYIFRLSCTRLGQWAIGYVTGDGNILQTIPHNKPLFQALIDGSREGFYLYPDGRSYNPDLTGLCEPTPHDHIKVTQEQYELYCEMGSTFQLCKICAENDKDVKIEPCGHLMCTSCLTAWQESDGQGCPFCRCEIKGTEPIIVDPFDPRDEGSRCCSIIDPFGMPMLDLDDDDDREESLMMNRLANVRKCTDRQNSPVTSPGSSPLAQRRKPQPDPLQIPHLSLPPVPPRLDLIQKGIVRSPCGSPTGSPKSSPCMVRKQDKPLPAPPPPLRDPPPPPPERPPPIPPDNRLSRHIHHVESVPSRDPPMPLEAWCPRDVFGTNQLVGCRLLGEGSPKPGITASSNVNGRHSRVGSDPVLMRKHRRHDLPLEGAKVFSNGHLGSEEYDVPPRLSPPPPVTTLLPSIKCTGPLANSLSEKTRDPVEEDDDEYKIPSSHPVSLNSQPSHCHNVKPPVRSCDNGHCMLNGTHGPSSEKKSNIPDLSIYLKGDVFDSASDPVPLPPARPPTRDNPKHGSSLNRTPSDYDLLIPPLGEDAFDALPPSLPPPPPPARHSLIEHSKPPGSSSRPSSGQDLFLLPSDPFVDLASGQVPLPPARRLPGENVKTNRTSQDYDQLPSCSDGSQAPARPPKPRPRRTAPEIHHRKPHGPEAALENVDAKIAKLMGEGYAFEEVKRALEIAQNNVEVARSILREFAFPPPVSPRLNL
“Cbl原癌基因B(CBLB)多核苷酸”是指编码CBLB多肽的核酸分子。CBLB基因编码E3泛素连接酶。下面提供了示例性CBLB核酸序列。其他示例性CBLB基因组序列在NCBI参考序列:NC_000003.12或转录参考NM_001321813.1中指出。
>DQ349203.1智人CBL-B mRNA,完整的cds
ATGGCAAACTCAATGAATGGCAGAAACCCTGGTGGTCGAGGAGGAAATCCCCGAAAAGGTCGAATTTTGGGTATTATTGATGCTATTCAGGATGCAGTTGGACCCCCTAAGCAAGCTGCCGCAGATCGCAGGACCGTGGAGAAGACTTGGAAGCTCATGGACAAAGTGGTAAGACTGTGCCAAAATCCCAAACTTCAGTTGAAAAATAGCCCACCATATATACTTGATATTTTGCCTGATACATATCAGCATTTACGACTTATATTGAGTAAATATGATGACAACCAGAAACTTGCCCAACTCAGTGAGAATGAGTACTTTAAAATCTACATTGATAGCCTTATGAAAAAGTCAAAACGGGCAATAAGACTCTTTAAAGAAGGCAAGGAGAGAATGTATGAAGAACAGTCACAGGACAGACGAAATCTCACAAAACTGTCCCTTATCTTCAGTCACATGCTGGCAGAAATCAAAGCAATCTTTCCCAATGGTCAATTCCAGGGAGATAACTTTCGTATCACAAAAGCAGATGCTGCTGAATTCTGGAGAAAGTTTTTTGGAGACAAAACTATCGTACCATGGAAAGTATTCAGACAGTGCCTTCATGAGGTCCACCAGATTAGCTCTGGCCTGGAAGCAATGGCTCTAAAATCAACAATTGATTTAACTTGCAATGATTACATTTCAGTTTTTGAATTTGATATTTTTACCAGGCTGTTTCAGCCTTGGGGCTCTATTTTGCGGAATTGGAATTTCTTAGCTGTGACACATCCAGGTTACATGGCATTTCTCACATATGATGAAGTTAAAGCACGACTACAGAAATATAGCACCAAACCCGGAAGCTATATTTTCCGGTTAAGTTGCACTCGATTGGGACAGTGGGCCATTGGCTATGTGACTGGGGATGGGAATATCTTACAGACCATACCTCATAACAAGCCCTTATTTCAAGCCCTGATTGATGGCAGCAGGGAAGGATTTTATCTTTATCCTGATGGGAGGAGTTATAATCCTGATTTAACTGGATTATGTGAACCTACACCTCATGACCATATAAAAGTTACACAGGAACAATATGAATTATATTGTGAAATGGGCTCCACTTTTCAGCTCTGTAAGATTTGTGCAGAGAATGACAAAGATGTCAAGATTGAGCCTTGTGGGCATTTGATGTGCACCTCTTGCCTTACGGCATGGCAGGAGTCGGATGGTCAGGGCTGCCCTTTCTGTCGTTGTGAAATAAAAGGAACTGAGCCCATAATCGTGGACCCCTTTGATCCAAGAGATGAAGGCTCCAGGTGTTGCAGCATCATTGACCCCTTTGGCATGCCGATGCTAGACTTGGACGACGATGATGATCGTGAGGAGTCCTTGATGATGAATCGGTTGGCAAACGTCCGAAAGTGCACTGACAGGCAGAACTCACCAGTCACATCACCAGGATCCTCTCCCCTTGCCCAGAGAAGAAAGCCACAGCCTGACCCACTCCAGATCCCACATCTAAGCCTGCCACCCGTGCCTCCTCGCCTGGATCTAATTCAGAAAGGCATAGTTAGATCTCCCTGTGGCAGCCCAACGGGTTCACCAAAGTCTTCTCCTTGCATGGTGAGAAAACAAGATAAACCACTCCCAGCACCACCTCCTCCCTTAAGAGATCCTCCTCCACCGCCACCTGAAAGACCTCCACCAATCCCACCAGACAATAGACTGAGTAGACACATCCATCATGTGGAAAGCGTGCCTTCCAGAGACCCGCCAATGCCTCTTGAAGCATGGTGCCCTCGGGATGTGTTTGGGACTAATCAGCTTGTGGGATGTCGACTCCTAGGGGAGGGCTCTCCAAAACCTGGAATCACAGCGAGTTCAAATGTCAATGGAAGGCACAGTAGAGTGGGCTCTGACCCAGTGCTTATGCGGAAACACAGACGCCATGATTTGCCTTTAGAAGGAGCTAAGGTCTTTTCCAATGGTCACCTTGGAAGTGAAGAATATGATGTTCCTCCCCGGCTTTCTCCTCCTCCTCCAGTTACCACCCTCCTCCCTAGCATAAAGTGTACTGGTCCGTTAGCAAATTCTCTTTCAGAGAAAACAAGAGACCCAGTAGAGGAAGATGATGATGAATACAAGATTCCTTCATCCCACCCTGTTTCCCTGAATTCACAACCATCTCATTGTCATAATGTAAAACCTCCTGTTCGGTCTTGTGATAATGGTCACTGTATGCTGAATGGAACACATGGTCCATCTTCAGAGAAGAAATCAAACATCCCTGACTTAAGCATATATTTAAAGGGAGATGTTTTTGATTCAGCCTCTGATCCCGTGCCATTACCACCTGCCAGGCCTCCAACTCGGGACAATCCAAAGCATGGTTCTTCACTCAACAGGACGCCCTCTGATTATGATCTTCTCATCCCTCCATTAGGTGAAGATGCTTTTGATGCCCTCCCTCCATCTCTCCCACCTCCCCCACCTCCTGCAAGGCATAGTCTCATTGAACATTCAAAACCTCCTGGCTCCAGTAGCCGGCCATCCTCAGGACAGGATCTTTTTCTTCTTCCTTCAGATCCCTTTGTTGATCTAGCAAGTGGCCAAGTTCCTTTGCCTCCTGCTAGAAGGTTACCAGGTGAAAATGTCAAAACTAACAGAACATCACAGGACTATGATCAGCTTCCTTCATGTTCAGATGGTTCACAGGCACCAGCCAGACCCCCTAAACCACGACCGCGCAGGACTGCACCAGAAATTCACCACAGAAAACCCCATGGGCCTGAGGCGGCATTGGAAAATGTCGATGCAAAAATTGCAAAACTCATGGGAGAGGGTTATGCCTTTGAAGAGGTGAAGAGAGCCTTAGAGATAGCCCAGAATAATGTCGAAGTTGCCCGGAGCATCCTCCGAGAATTTGCCTTCCCTCCTCCAGTATCCCCACGTCTAAATCTATAG
“嵌合抗原受体”是指包含细胞外抗原结合结构域、跨膜结构域和赋予免疫细胞抗原特异性的细胞内信号结构域的合成受体。
在本发明中,“包含(comprises)”、“包含(comprising)”、“含有(containing)”和“具有(having)”等可以具有美国专利法中赋予其的含义以及可以表示“包括(includes)”、“包括(includings)”等;“基本上由……组成(consisting essentially of)”或“基本上由……组成(consists essentially of)”同样具有美国专利法中赋予的含义,以及所述术语是开放式的,只要所引用内容的基本或新颖特征,允许存在比所引用内容更多的内容不因比所列举的更多的存在而改变,但排除现有技术实施方案。
“分化簇2(CD2)”是指与NCBI登录号NP_001315538.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_001315538.1T细胞表面抗原CD2异形体1前体[智人]
MSFPCKFVASFLLIFNVSSKGAVSKEITNALETWGALGQDINLDIPSFQMSDDIDDIKWEKTSDKKKIAQFRKEKETFKEKDTYKLFKNGTLKIKHLKTDDQDIYKVSIYDTKGKNVLEKIFDLKIQERVSKPKISWTCINTTLTCEVMNGTDPELNLYQDGKHLKLSQRVITHKWTTSLSAKFKCTAGNKVSKESSVEPVSCPGGSILGQSNGLSAWTPPSHPTSLPFAEKGLDIYLIIGICGGGSLLMVFVALLVFYITKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSLSPSSN
“分化簇2(CD2)”是指编码CD2多肽的核酸。下面提供了示例性CD2核酸序列。
>NM_001328609.2智人CD2分子(CD2),转录变异体1,mRNA
AGTCTCACTTCAGTTCCTTTTGCATGAAGAGCTCAGAATCAAAAGAGGAAACCAACCCCTAAGATGAGCTTTCCATGTAAATTTGTAGCCAGCTTCCTTCTGATTTTCAATGTTTCTTCCAAAGGTGCAGTCTCCAAAGAGATTACGAATGCCTTGGAAACCTGGGGTGCCTTGGGTCAGGACATCAACTTGGACATTCCTAGTTTTCAAATGAGTGATGATATTGACGATATAAAATGGGAAAAAACTTCAGACAAGAAAAAGATTGCACAATTCAGAAAAGAGAAAGAGACTTTCAAGGAAAAAGATACATATAAGCTATTTAAAAATGGAACTCTGAAAATTAAGCATCTGAAGACCGATGATCAGGATATCTACAAGGTATCAATATATGATACAAAAGGAAAAAATGTGTTGGAAAAAATATTTGATTTGAAGATTCAAGAGAGGGTCTCAAAACCAAAGATCTCCTGGACTTGTATCAACACAACCCTGACCTGTGAGGTAATGAATGGAACTGACCCCGAATTAAACCTGTATCAAGATGGGAAACATCTAAAACTTTCTCAGAGGGTCATCACACACAAGTGGACCACCAGCCTGAGTGCAAAATTCAAGTGCACAGCAGGGAACAAAGTCAGCAAGGAATCCAGTGTCGAGCCTGTCAGCTGTCCAGGAGGCAGCATCCTTGGCCAGAGTAATGGGCTCTCTGCCTGGACCCCTCCCAGCCATCCCACTTCTCTTCCTTTTGCAGAGAAAGGTCTGGACATCTATCTCATCATTGGCATATGTGGAGGAGGCAGCCTCTTGATGGTCTTTGTGGCACTGCTCGTTTTCTATATCACCAAAAGGAAAAAACAGAGGAGTCGGAGAAATGATGAGGAGCTGGAGACAAGAGCCCACAGAGTAGCTACTGAAGAAAGGGGCCGGAAGCCCCACCAAATTCCAGCTTCAACCCCTCAGAATCCAGCAACTTCCCAACATCCTCCTCCACCACCTGGTCATCGTTCCCAGGCACCTAGTCATCGTCCCCCGCCTCCTGGACACCGTGTTCAGCACCAGCCTCAGAAGAGGCCTCCTGCTCCGTCGGGCACACAAGTTCACCAGCAGAAAGGCCCGCCCCTCCCCAGACCTCGAGTTCAGCCAAAACCTCCCCATGGGGCAGCAGAAAACTCATTGTCCCCTTCCTCTAATTAAAAAAGATAGAAACTGTCTTTTTCAATAAAAAGCACTGTGGATTTCTGCCCTCCTGATGTGCATATCCGTACTTCCATGAGGTGTTTTCTGTGTGCAGAACATTGTCACCTCCTGAGGCTGTGGGCCACAGCCACCTCTGCATCTTCGAACTCAGCCATGTGGTCAACATCTGGAGTTTTTGGTCTCCTCAGAGAGCTCCATCACACCAGTAAGGAGAAGCAATATAAGTGTGATTGCAAGAATGGTAGAGGACCGAGCACAGAAATCTTAGAGATTTCTTGTCCCCTCTCAGGTCATGTGTAGATGCGATAAATCAAGTGATTGGTGTGCCTGGGTCTCACTACAAGCAGCCTATCTGCTTAAGAGACTCTGGAGTTTCTTATGTGCCCTGGTGGACACTTGCCCACCATCCTGTGAGTAAAAGTGAAATAAAAGCTTTGACTAGA
“分化簇3ε(CD3e或CD3ε)”是指与NCBI登录号NP_000724.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_000724.1T细胞表面糖蛋白CD3ε链前体[智人]
MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI
“分化簇3ε(CD3e或CD3ε)”是指编码CD3e多肽的核酸。下面提供了示例性CD3e核酸序列。
>NM_000733.4智人CD3e分子(CD3E),mRNA
AGAAACCCTCCTCCCCTCCCAGCCTCAGGTGCCTGCTTCAGAAAATGAAGTAGTAAGTCTGCTGGCCTCCGCCATCTTAGTAAAGTAACAGTCCCATGAAACAAAGATGCAGTCGGGCACTCACTGGAGAGTTCTGGGCCTCTGCCTCTTATCAGTTGGCGTTTGGGGGCAAGATGGTAATGAAGAAATGGGTGGTATTACACAGACACCATATAAAGTCTCCATCTCTGGAACCACAGTAATATTGACATGCCCTCAGTATCCTGGATCTGAAATACTATGGCAACACAATGATAAAAACATAGGCGGTGATGAGGATGATAAAAACATAGGCAGTGATGAGGATCACCTGTCACTGAAGGAATTTTCAGAATTGGAGCAAAGTGGTTATTATGTCTGCTACCCCAGAGGAAGCAAACCAGAAGATGCGAACTTTTATCTCTACCTGAGGGCAAGAGTGTGTGAGAACTGCATGGAGATGGATGTGATGTCGGTGGCCACAATTGTCATAGTGGACATCTGCATCACTGGGGGCTTGCTGCTGCTGGTTTACTACTGGAGCAAGAATAGAAAGGCCAAGGCCAAGCCTGTGACACGAGGAGCGGGTGCTGGCGGCAGGCAAAGGGGACAAAACAAGGAGAGGCCACCACCTGTTCCCAACCCAGACTATGAGCCCATCCGGAAAGGCCAGCGGGACCTGTATTCTGGCCTGAATCAGAGACGCATCTGACCCTCTGGAGAACACTGCCTCCCGCTGGCCCAGGTCTCCTCTCCAGTCCCCCTGCGACTCCCTGTTTCCTGGGCTAGTCTTGGACCCCACGAGAGAGAATCGTTCCTCAGCCTCATGGTGAACTCGCGCCCTCCAGCCTGATCCCCCGCTCCCTCCTCCCTGCCTTCTCTGCTGGTACCCAGTCCTAAAATATTGCTGCTTCCTCTTCCTTTGAAGCATCATCAGTAGTCACACCCTCACAGCTGGCCTGCCCTCTTGCCAGGATATTTATTTGTGCTATTCACTCCCTTCCCTTTGGATGTAACTTCTCCGTTCAGTTCCCTCCTTTTCTTGCATGTAAGTTGTCCCCCATCCCAAAGTATTCCATCTACTTTTCTATCGCCGTCCCCTTTTGCAGCCCTCTCTGGGGATGGACTGGGTAAATGTTGACAGAGGCCCTGCCCCGTTCACAGATCCTGGCCCTGAGCCAGCCCTGTGCTCCTCCCTCCCCCAACACTCCCTACCAACCCCCTAATCCCCTACTCCCTCCACCCCCCCTCCACTGTAGGCCACTGGATGGTCATTTGCATCTCCGTAAATGTGCTCTGCTCCTCAGCTGAGAGAGAAAAAAATAAACTGTATTTGGCTGCAA
“分化簇3γ(CD3g或CD3γ)是指与NCBI登录号NP_000064.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_000064.1T细胞表面糖蛋白CD3γ链前体[智人]
MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDGKMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATISGFLFAEIVSIFVLAVGVYFIAGQDGVRQSRASDKQTLLPNDQLYQPLKDREDDQYSHLQGNQLRRN
“分化簇3γ(CD3g或CD3γ)”是指编码CD3g多肽的核酸。下面提供了示例性CD3g核酸序列。
>NM_000073.3智人CD3g分子(CD3G),mRNA
AGTCTAGCTGCTGCACAGGCTGGCTGGCTGGCTGGCTGCTAAGGGCTGCTCCACGCTTTTGCCGGAGGACAGAGACTGACATGGAACAGGGGAAGGGCCTGGCTGTCCTCATCCTGGCTATCATTCTTCTTCAAGGTACTTTGGCCCAGTCAATCAAAGGAAACCACTTGGTTAAGGTGTATGACTATCAAGAAGATGGTTCGGTACTTCTGACTTGTGATGCAGAAGCCAAAAATATCACATGGTTTAAAGATGGGAAGATGATCGGCTTCCTAACTGAAGATAAAAAAAAATGGAATCTGGGAAGTAATGCCAAGGACCCTCGAGGGATGTATCAGTGTAAAGGATCACAGAACAAGTCAAAACCACTCCAAGTGTATTACAGAATGTGTCAGAACTGCATTGAACTAAATGCAGCCACCATATCTGGCTTTCTCTTTGCTGAAATCGTCAGCATTTTCGTCCTTGCTGTTGGGGTCTACTTCATTGCTGGACAGGATGGAGTTCGCCAGTCGAGAGCTTCAGACAAGCAGACTCTGTTGCCCAATGACCAGCTCTACCAGCCCCTCAAGGATCGAGAAGATGACCAGTACAGCCACCTTCAAGGAAACCAGTTGAGGAGGAATTGAACTCAGGACTCAGAGTAGTCCAGGTGTTCTCCTCCTATTCAGTTCCCAGAATCAAAGCAATGCATTTTGGAAAGCTCCTAGCAGAGAGACTTTCAGCCCTAAATCTAGACTCAAGGTTCCCAGAGATGACAAATGGAGAAGAAAGGCCATCAGAGCAAATTTGGGGGTTTCTCAAATAAAATAAAAATAAAAACAAATACTGTGTTTCAGAAGCGCCACCTATTGGGGAAAATTGTAAAAGAAAAATGAAAAGATCAAATAACCCCCTGGATTTGAATATAATTTTTTGTGTTGTAATTTTTATTTCGTTTTTGTATAGGTTATAATTCACATGGCTCAAATATTCAGTGAAAGCTCTCCCTCCACCGCCATCCCCTGCTACCCAGTGACCCTGTTGCCCTCTTCAGAGACAAATTAGTTTCTCTTTTTTTTTTTTTTTTTTTTTTTTTTGAGACAGTCTGGCTCTGTCACCCAGGCTGAAATGCAGTGGCACCATCTCGGCTCACTGCAACCTCTGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGGGCAGCTGGGATTACAGGCACACACTACCACACCTGGCTAATTTTTGTATTTTTAGTAGAGACAGGGTTTTGCTCTGTTGGCCAAGCTGGTCTCGAACTCCTGACCTCAAGTGATCCGCCCGCCTCAGCCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCATGCCTGGTCTTAAAACCAGTTTCTTATATATCTCTCTGGAGGTATTCTAGGCATATATGAGCACATTCTCAAGTACATATTATCCTCCCTTCCCCTATCTTTTAGACAAATGATATCAAACTATACATCTTGTGAGATTATTGCATACCATTATATGAAGATACCATTATATCCTTTTTAATGCAACCATATTGTACAAATAGACTATGATTTATTTAACCTGTTATCTATCAGTGGATATTTAAGTTGGTAGTTGGTTCCAATCTTTTGCTCTTACAACAATTCTGCAATGACTAACATTGTATAAATATCATTTTTAAAAATAATTGCATTGAAGCATAATGTACATGCCATAAAATCCACCCATCTTAAGTGATTTCACCTGTTCTCAGAAATTTTTAGTAAATTTAACTAATTGTACAGCCATTACCATAATCCAGCTTTAGGACATTTTCTTTTTTTTCTTTTCTTTTCTTTTTTTTCTTTTTTTTTTTTTTTTGAAGTGGAATCTTGCTCTGTGGCCCAGGCTGGAGTGCAGTGGCGCGATCTCAGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCGATTCTCTTGCCTTGGCCTCCCGAGTAGCTGAGACTACAGGCACATGCCACCACGCCCAGCTCATTTTTTGTGTATTTAGTATTTGTGTATCTAGTATTTGTGTACTTAGTAGAGACAGGGTTTCACCATGTTGGCCAGGCTGGTCTCCAATTCCTGACCTCAGGCGATCCACCCGCCTTGACCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCGCGCCAGGCCCGTAACTGTATTTTAATATAGCCATTCTATGGATTTAATATGGTATTTTATTATGGCCTTAATTTGCATTTCCCTAGATACTAACCATGCTGAGTGTCCTGTCTTGTGTTTATTAACCATTCATATATTTTTAGTGAAATGTGTATCAAATCTTTTGCCCATTTTTAAGTTGACTTATTTGTTTGTCTTCTTACTATTGGGTTGCATATGTTTTTGATATAAGTCCTTTATCAGATATATGATTTGGAAATATTTTCTACCAATCTGTGGTTTGTTTTTCTTAATGGTGTCTTTTGAAGTGCAAAAGGTTTGAATTTTGAAGTACATTTTATTGATTTTTTCTTCTATATATTGTGCTTTTGGTATCATGTCTAATAAATCTTTACCAAACCCACAGTTACAAAGATTTTCTCCTGTCTTCTTTTTATACTTTTTACAGCTTTATGGTTTTAGCTCTAACAATAAATGTGATTTTGAACATACATAAGACTATTTGTAACAAACACAAATAAATTGAATTGTTGGGCA
“分化簇3δ(CD3d或CD3δ)是指与NCBI登录号NP_000723.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_000723.1T细胞表面糖蛋白CD3δ链异形体A前体[智人]
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGKRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALGVFCFAGHETGRLSGAADTQALLRNDQVYQPLRDRDDAQYSHLGGNWARNK
“分化簇3δ(CD3d或CD3δ)”是指编码CD3d多肽的核酸。下面提供了示例性CD3d核酸序列。
>NM_000732.4智人CD3d分子(CD3D),转录变异体1,mRNA
AGAGAAGCAGACATCTTCTAGTTCCTCCCCCACTCTCCTCTTTCCGGTACCTGTGAGTCAGCTAGGGGAGGGCAGCTCTCACCCAGGCTGATAGTTCGGTGACCTGGCTTTATCTACTGGATGAGTTCCGCTGGGAGATGGAACATAGCACGTTTCTCTCTGGCCTGGTACTGGCTACCCTTCTCTCGCAAGTGAGCCCCTTCAAGATACCTATAGAGGAACTTGAGGACAGAGTGTTTGTGAATTGCAATACCAGCATCACATGGGTAGAGGGAACGGTGGGAACACTGCTCTCAGACATTACAAGACTGGACCTGGGAAAACGCATCCTGGACCCACGAGGAATATATAGGTGTAATGGGACAGATATATACAAGGACAAAGAATCTACCGTGCAAGTTCATTATCGAATGTGCCAGAGCTGTGTGGAGCTGGATCCAGCCACCGTGGCTGGCATCATTGTCACTGATGTCATTGCCACTCTGCTCCTTGCTTTGGGAGTCTTCTGCTTTGCTGGACATGAGACTGGAAGGCTGTCTGGGGCTGCCGACACACAAGCTCTGTTGAGGAATGACCAGGTCTATCAGCCCCTCCGAGATCGAGATGATGCTCAGTACAGCCACCTTGGAGGAAACTGGGCTCGGAACAAGTGAACCTGAGACTGGTGGCTTCTAGAAGCAGCCATTACCAACTGTACCTTCCCTTCTTGCTCAGCCAATAAATATATCCTCTTTCACTCAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
“分化簇4(CD4)”是指与NCBI登录号NP_000607.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_000607.1T细胞表面糖蛋白CD4异构体1前体[智人]
MNRGVPFRHLLLVLQLALLPAATQGKKVVLGKKGDTVELTCTASQKKSIQFHWKNSNQIKILGNQGSFLTKGPSKLNDRADSRRSLWDQGNFPLIIKNLKIEDSDTYICEVEDQKEEVQLLVFGLTANSDTHLLQGQSLTLTLESPPGSSPSVQCRSPRGKNIQGGKTLSVSQLELQDSGTWTCTVLQNQKKVEFKIDIVVLAFQKASSIVYKKEGEQVEFSFPLAFTVEKLTGSGELWWQAERASSSKSWITFDLKNKEVSVKRVTQDPKLQMGKKLPLHLTLPQALPQYAGSGNLTLALEAKTGKLHQEVNLVVMRATQLQKNLTCEVWGPTSPKLMLSLKLENKEAKVSKREKAVWVLNPEAGMWQCLLSDSGQVLLESNIKVLPTWSTPVQPMALIVLGGVAGLLLFIGLGIFFCVRCRHRRRQAERMSQIKRLLSEKKTCQCPHRFQKTCSPI
“分化簇4(CD4)”是指编码CD4多肽的核酸。下面提供了示例性CD4核酸序列。
>NM_000616.5智人CD4分子(CD4),转录变异体1,mRNA
CTCTCTTCATTTAAGCACGACTCTGCAGAAGGAACAAAGCACCCTCCCCACTGGGCTCCTGGTTGCAGAGCTCCAAGTCCTCACACAGATACGCCTGTTTGAGAAGCAGCGGGCAAGAAAGACGCAAGCCCAGAGGCCCTGCCATTTCTGTGGGCTCAGGTCCCTACTGGCTCAGGCCCCTGCCTCCCTCGGCAAGGCCACAATGAACCGGGGAGTCCCTTTTAGGCACTTGCTTCTGGTGCTGCAACTGGCGCTCCTCCCAGCAGCCACTCAGGGAAAGAAAGTGGTGCTGGGCAAAAAAGGGGATACAGTGGAACTGACCTGTACAGCTTCCCAGAAGAAGAGCATACAATTCCACTGGAAAAACTCCAACCAGATAAAGATTCTGGGAAATCAGGGCTCCTTCTTAACTAAAGGTCCATCCAAGCTGAATGATCGCGCTGACTCAAGAAGAAGCCTTTGGGACCAAGGAAACTTTCCCCTGATCATCAAGAATCTTAAGATAGAAGACTCAGATACTTACATCTGTGAAGTGGAGGACCAGAAGGAGGAGGTGCAATTGCTAGTGTTCGGATTGACTGCCAACTCTGACACCCACCTGCTTCAGGGGCAGAGCCTGACCCTGACCTTGGAGAGCCCCCCTGGTAGTAGCCCCTCAGTGCAATGTAGGAGTCCAAGGGGTAAAAACATACAGGGGGGGAAGACCCTCTCCGTGTCTCAGCTGGAGCTCCAGGATAGTGGCACCTGGACATGCACTGTCTTGCAGAACCAGAAGAAGGTGGAGTTCAAAATAGACATCGTGGTGCTAGCTTTCCAGAAGGCCTCCAGCATAGTCTATAAGAAAGAGGGGGAACAGGTGGAGTTCTCCTTCCCACTCGCCTTTACAGTTGAAAAGCTGACGGGCAGTGGCGAGCTGTGGTGGCAGGCGGAGAGGGCTTCCTCCTCCAAGTCTTGGATCACCTTTGACCTGAAGAACAAGGAAGTGTCTGTAAAACGGGTTACCCAGGACCCTAAGCTCCAGATGGGCAAGAAGCTCCCGCTCCACCTCACCCTGCCCCAGGCCTTGCCTCAGTATGCTGGCTCTGGAAACCTCACCCTGGCCCTTGAAGCGAAAACAGGAAAGTTGCATCAGGAAGTGAACCTGGTGGTGATGAGAGCCACTCAGCTCCAGAAAAATTTGACCTGTGAGGTGTGGGGACCCACCTCCCCTAAGCTGATGCTGAGTTTGAAACTGGAGAACAAGGAGGCAAAGGTCTCGAAGCGGGAGAAGGCGGTGTGGGTGCTGAACCCTGAGGCGGGGATGTGGCAGTGTCTGCTGAGTGACTCGGGACAGGTCCTGCTGGAATCCAACATCAAGGTTCTGCCCACATGGTCCACCCCGGTGCAGCCAATGGCCCTGATTGTGCTGGGGGGCGTCGCCGGCCTCCTGCTTTTCATTGGGCTAGGCATCTTCTTCTGTGTCAGGTGCCGGCACCGAAGGCGCCAAGCAGAGCGGATGTCTCAGATCAAGAGACTCCTCAGTGAGAAGAAGACCTGCCAGTGTCCTCACCGGTTTCAGAAGACATGTAGCCCCATTTGAGGCACGAGGCCAGGCAGATCCCACTTGCAGCCTCCCCAGGTGTCTGCCCCGCGTTTCCTGCCTGCGGACCAGATGAATGTAGCAGATCCCCAGCCTCTGGCCTCCTGTTCGCCTCCTCTACAATTTGCCATTGTTTCTCCTGGGTTAGGCCCCGGCTTCACTGGTTGAGTGTTGCTCTCTAGTTTCCAGAGGCTTAATCACACCGTCCTCCACGCCATTTCCTTTTCCTTCAAGCCTAGCCCTTCTCTCATTATTTCTCTCTGACCCTCTCCCCACTGCTCATTTGGATCCCAGGGGAGTGTTCAGGGCCAGCCCTGGCTGGCATGGAGGGTGAGGCTGGGTGTCTGGAAGCATGGAGCATGGGACTGTTCTTTTACAAGACAGGACCCTGGGACCACAGAGGGCAGGAACTTGCACAAAATCACACAGCCAAGCCAGTCAAGGATGGATGCAGATCCAGAGGTTTCTGGCAGCCAGTACCTCCTGCCCCATGCTGCCCGCTTCTCACCCTATGTGGGTGGGACCACAGACTCACATCCTGACCTTGCACAAACAGCCCCTCTGGACACAGCCCCATGTACACGGCCTCAAGGGATGTCTCACATCCTCTGTCTATTTGAGACTTAGAAAAATCCTACAAGGCTGGCAGTGACAGAACTAAGATGATCATCTCCAGTTTATAGACCAGAACCAGAGCTCAGAGAGGCTAGATGATTGATTACCAAGTGCCGGACTAGCAAGTGCTGGAGTCGGGACTAACCCAGGTCCCTTGTCCCAAGTTCCACTGCTGCCTCTTGAATGCAGGGACAAATGCCACACGGCTCTCACCAGTGGCTAGTGGTGGGTACTCAATGTGTACTTTTGGGTTCACAGAAGCACAGCACCCATGGGAAGGGTCCATCTCAGAGAATTTACGAGCAGGGATGAAGGCCTCCCTGTCTAAAATCCCTCCTTCATCCCCCGCTGGTGGCAGAATCTGTTACCAGAGGACAAAGCCTTTGGCTCTTCTAATCAGAGCGCAAGCTGGGAGCACAGGCACTGCAGGAGAGAATGCCCAGTGACCAGTCACTGACCCTGTGCAGAACCTCCTGGAAGCGAGCTTTGCTGGGAGAGGGGGTAGCTAGCCTGAGAGGGAACCCTCTAAGGGACCTCAAAGGTGATTGTGCCAGGCTCTGCGCCTGCCCCACACCCTCCCTTACCCTCCTCCAGACCATTCAGGACACAGGGAAATCAGGGTTACAAATCTTCTTGATCCACTTCTCTCAGGATCCCCTCTCTTCCTACCCTTCCTCACCACTTCCCTCAGTCCCAACTCCTTTTCCCTATTTCCTTCTCCTCCTGTCTTTAAAGCCTGCCTCTTCCAGGAAGACCCCCCTATTGCTGCTGGGGCTCCCCATTTGCTTACTTTGCATTTGTGCCCACTCTCCACCCCTGCTCCCCTGAGCTGAAATAAAAATACAATAAACTTAC
“分化簇5(CD5)”是指与NCBI登录号NP_001333385.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_001333385.1T细胞表面糖蛋白CD5异构体2[智人]
MVCSQSWGRSSKQWEDPSQASKVCQRLNCGVPLSLGPFLVTYTPQSSIICYGQLGSFSNCSHSRNDMCHSLGLTCLEPQKTTPPTTRPPPTTTPEPTAPPRLQLVAQSGGQHCAGVVEFYSGSLGGTISYEAQDKTQDLENFLCNNLQCGSFLKHLPETEAGRAQDPGEPREHQPLPIQWKIQNSSCTSLEHCFRKIKPQKSGRVLALLCSGFQPKVQSRLVGGSSICEGTVEVRQGAQWAALCDSSSARSSLRWEEVCREQQCGSVNSYRVLDAGDPTSRGLFCPHQKLSQCHELWERNSYCKKVFVTCQDPNPAGLAAGTVASIILALVLLVVLLVVCGPLAYKKLVKKFRQKKQRQWIGPTGMNQNMSFHRNHTATVRSHAENPTASHVDNEYSQPPRNSHLSAYPALEGALHRSSMQPDNSSDSDYDLHGAQRL
“分化簇5(CD5)”是指编码CD5多肽的核酸。下面提供了示例性CD5核酸序列。
>NM_001346456.1智人CD5分子(CD5),转录变异体2,mRNA
GAGTCTTGCTGATGCTCCCGGCTGAATAAACCCCTTCCTTCTTTAACTTGGTGTCTGAGGGGTTTTGTCTGTGGCTTGTCCTGCTACATTTCTTGGTTCCCTGACCAGGAAGCAAAGTGATTAACGGACAGTTGAGGCAGCCCCTTAGGCAGCTTAGGCCTGCCTTGTGGAGCATCCCCGCGGGGAACTCTGGCCAGCTTGAGCGACACGGATCCTCAGAGCGCTCCCAGGTAGGCAATTGCCCCAGTGGAATGCCTCGTCAGAGCAGTGCATGGCAGGCCCCTGTGGAGGATCAACGCAGTGGCTGAACACAGGGAAGGAACTGGCACTTGGAGTCCGGACAACTGAAACTTGTCGCTTCCTGCCTCGGACGGCTCAGCTGGTATGACCCAGATTTCCAGGCAAGGCTCACCCGTTCCAACTCGAAGTGCCAGGGCCAGCTGGAGGTCTACCTCAAGGACGGATGGCACATGGTTTGCAGCCAGAGCTGGGGCCGGAGCTCCAAGCAGTGGGAGGACCCCAGTCAAGCGTCAAAAGTCTGCCAGCGGCTGAACTGTGGGGTGCCCTTAAGCCTTGGCCCCTTCCTTGTCACCTACACACCTCAGAGCTCAATCATCTGCTACGGACAACTGGGCTCCTTCTCCAACTGCAGCCACAGCAGAAATGACATGTGTCACTCTCTGGGCCTGACCTGCTTAGAACCCCAGAAGACAACACCTCCAACGACAAGGCCCCCGCCCACCACAACTCCAGAGCCCACAGCTCCTCCCAGGCTGCAGCTGGTGGCACAGTCTGGCGGCCAGCACTGTGCCGGCGTGGTGGAGTTCTACAGCGGCAGCCTGGGGGGTACCATCAGCTATGAGGCCCAGGACAAGACCCAGGACCTGGAGAACTTCCTCTGCAACAACCTCCAGTGTGGCTCCTTCTTGAAGCATCTGCCAGAGACTGAGGCAGGCAGAGCCCAAGACCCAGGGGAGCCACGGGAACACCAGCCCTTGCCAATCCAATGGAAGATCCAGAACTCAAGCTGTACCTCCCTGGAGCATTGCTTCAGGAAAATCAAGCCCCAGAAAAGTGGCCGAGTTCTTGCCCTCCTTTGCTCAGGTTTCCAGCCCAAGGTGCAGAGCCGTCTGGTGGGGGGCAGCAGCATCTGTGAAGGCACCGTGGAGGTGCGCCAGGGGGCTCAGTGGGCAGCCCTGTGTGACAGCTCTTCAGCCAGGAGCTCGCTGCGGTGGGAGGAGGTGTGCCGGGAGCAGCAGTGTGGCAGCGTCAACTCCTATCGAGTGCTGGACGCTGGTGACCCAACATCCCGGGGGCTCTTCTGTCCCCATCAGAAGCTGTCCCAGTGCCACGAACTTTGGGAGAGAAATTCCTACTGCAAGAAGGTGTTTGTCACATGCCAGGATCCAAACCCCGCAGGCCTGGCCGCAGGCACGGTGGCAAGCATCATCCTGGCCCTGGTGCTCCTGGTGGTGCTGCTGGTCGTGTGCGGCCCCCTTGCCTACAAGAAGCTAGTGAAGAAATTCCGCCAGAAGAAGCAGCGCCAGTGGATTGGCCCAACGGGAATGAACCAAAACATGTCTTTCCATCGCAACCACACGGCAACCGTCCGATCCCATGCTGAGAACCCCACAGCCTCCCACGTGGATAACGAATACAGCCAACCTCCCAGGAACTCCCACCTGTCAGCTTATCCAGCTCTGGAAGGGGCTCTGCATCGCTCCTCCATGCAGCCTGACAACTCCTCCGACAGTGACTATGATCTGCATGGGGCTCAGAGGCTGTAAAGAACTGGGATCCATGAGCAAAAAGCCGAGAGCCAGACCTGTTTGTCCTGAGAAAACTGTCCGCTCTTCACTTGAAATCATGTCCCTATTTCTACCCCGGCCAGAACATGGACAGAGGCCAGAAGCCTTCCGGACAGGCGCTGCTGCCCCGAGTGGCAGGCCAGCTCACACTCTGCTGCACAACAGCTCGGCCGCCCCTCCACTTGTGGAAGCTGTGGTGGGCAGAGCCCCAAAACAAGCAGCCTTCCAACTAGAGACTCGGGGGTGTCTGAAGGGGGCCCCCTTTCCCTGCCCGCTGGGGAGCGGCGTCTCAGTGAAATCGGCTTTCTCCTCAGACTCTGTCCCTGGTAAGGAGTGACAAGGAAGCTCACAGCTGGGCGAGTGCATTTTGAATAGTTTTTTGTAAGTAGTGCTTTTCCTCCTTCCTGACAAATCGAGCGCTTTGGCCTCTTCTGTGCAGCATCCACCCCTGCGGATCCCTCTGGGGAGGACAGGAAGGGGACTCCCGGAGACCTCTGCAGCCGTGGTGGTCAGAGGCTGCTCACCTGAGCACAAAGACAGCTCTGCACATTCACCGCAGCTGCCAGCCAGGGGTCTGGGTGGGCACCACCCTGACCCACAGCGTCACCCCACTCCCTCTGTCTTATGACTCCCCTCCCCAACCCCCTCATCTAAAGACACCTTCCTTTCCACTGGCTGTCAAGCCCACAGGGCACCAGTGCCACCCAGGGCCCGGCACAAAGGGGCGCCTAGTAAACCTTAACCAACTTGGTTTTTTGCTTCACCCAGCAATTAAAAGTCCCAAGCTGAGGTAGTTTCAGTCCATCACAGTTCATCTTCTAACCCAAGAGTCAGAGATGGGGCTGGTCATGTTCCTTTGGTTTGAATAACTCCCTTGACGAAAACAGACTCCTCTAGTACTTGGAGATCTTGGACGTACACCTAATCCCATGGGGCCTCGGCTTCCTTAACTGCAAGTGAGAAGAGGAGGTCTACCCAGGAGCCTCGGGTCTGATCAAGGGAGAGGCCAGGCGCAGCTCACTGCGGCGGCTCCCTAAGAAGGTGAAGCAACATGGGAACACATCCTAAGACAGGTCCTTTCTCCACGCCATTTGATGCTGTATCTCCTGGGAGCACAGGCATCAATGGTCCAAGCCGCATAATAAGTCTGGAAGAGCAAAAGGGAGTTACTAGGATATGGGGTGGGCTGCTCCCAGAATCTGCTCAGCTTTCTGCCCCCACCAACACCCTCCAACCAGGCCTTGCCTTCTGAGAGCCCCCGTGGCCAAGCCCAGGTCACAGATCTTCCCCCGACCATGCTGGGAATCCAGAAACAGGGACCCCATTTGTCTTCCCATATCTGGTGGAGGTGAGGGGGCTCCTCAAAAGGGAACTGAGAGGCTGCTCTTAGGGAGGGCAAAGGTTCGGGGGCAGCCAGTGTCTCCCATCAGTGCCTTTTTTAATAAAAGCTCTTTCATCTATAGTTTGGCCACCATACAGTGGCCTCAAAGCAACCATGGCCTACTTAAAAACCAAACCAAAAATAAAGAGTTTAGTTGAGGAGAAAAAAAAAAAAAAAAAAAAAAAAA
“分化簇7(CD7)”是指与NCBI登录号NP_006128.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_006128.1T细胞抗原CD7前体[智人]
MAGPPRLLLLPLLLALARGLPGALAAQEVQQSPHCTTVPVGASVNITCSTSGGLRGIYLRQLGPQPQDIIYYEDGVVPTTDRRFRGRIDFSGSQDNLTITMHRLQLSDTGTYTCQAITEVNVYGSGTLVLVTEEQSQGWHRCSDAPPRASALPAPPTGSALPDPQTASALPDPPAASALPAALAVISFLLGLGLGVACVLARTQIKKLCSWRDKNSAACVVYEDMSHSRCNTLSSPNQYQ
“分化簇7(CD7)”是指编码CD7多肽的核酸。下面提供了示例性CD7核酸序列。
>NM_006137.7智人CD7分子(CD7),mRNA
CTCTCTGAGCTCTGAGCGCCTGCGGTCTCCTGTGTGCTGCTCTCTGTGGGGTCCTGTAGACCCAGAGAGGCTCAGCTGCACTCGCCCGGCTGGGAGAGCTGGGTGTGGGGAACATGGCCGGGCCTCCGAGGCTCCTGCTGCTGCCCCTGCTTCTGGCGCTGGCTCGCGGCCTGCCTGGGGCCCTGGCTGCCCAAGAGGTGCAGCAGTCTCCCCACTGCACGACTGTCCCCGTGGGAGCCTCCGTCAACATCACCTGCTCCACCAGCGGGGGCCTGCGTGGGATCTACCTGAGGCAGCTCGGGCCACAGCCCCAAGACATCATTTACTACGAGGACGGGGTGGTGCCCACTACGGACAGACGGTTCCGGGGCCGCATCGACTTCTCAGGGTCCCAGGACAACCTGACTATCACCATGCACCGCCTGCAGCTGTCGGACACTGGCACCTACACCTGCCAGGCCATCACGGAGGTCAATGTCTACGGCTCCGGCACCCTGGTCCTGGTGACAGAGGAACAGTCCCAAGGATGGCACAGATGCTCGGACGCCCCACCAAGGGCCTCTGCCCTCCCTGCCCCACCGACAGGCTCCGCCCTCCCTGACCCGCAGACAGCCTCTGCCCTCCCTGACCCGCCAGCAGCCTCTGCCCTCCCTGCGGCCCTGGCGGTGATCTCCTTCCTCCTCGGGCTGGGCCTGGGGGTGGCGTGTGTGCTGGCGAGGACACAGATAAAGAAACTGTGCTCGTGGCGGGATAAGAATTCGGCGGCATGTGTGGTGTACGAGGACATGTCGCACAGCCGCTGCAACACGCTGTCCTCCCCCAACCAGTACCAGTGACCCAGTGGGCCCCTGCACGTCCCGCCTGTGGTCCCCCCAGCACCTTCCCTGCCCCACCATGCCCCCCACCCTGCCACACCCCTCACCCTGCTGTCCTCCCACGGCTGCAGCAGAGTTTGAAGGGCCCAGCCGTGCCCAGCTCCAAGCAGACACACAGGCAGTGGCCAGGCCCCACGGTGCTTCTCAGTGGACAATGATGCCTCCTCCGGGAAGCCTTCCCTGCCCAGCCCACGCCGCCACCGGGAGGAAGCCTGACTGTCCTTTGGCTGCATCTCCCGACCATGGCCAAGGAGGGCTTTTCTGTGGGATGGGCCTGGGCACGCGGCCCTCTCCTGTCAGTGCCGGCCCACCCACCAGCAGGCCCCCAACCCCCAGGCAGCCCGGCAGAGGACGGGAGGAGACCAGTCCCCCACCCAGCCGTACCAGAAATAAAGGCTTCTGTGCTTCC
“分化簇30(CD30)”是指与NCBI登录号NP_001234.3或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_001234.3肿瘤坏死因子受体超家族成员8异形体1前体[智人]
MRVLLAALGLLFLGALRAFPQDRPFEDTCHGNPSHYYDKAVRRCCYRCPMGLFPTQQCPQRPTDCRKQCEPDYYLDEADRCTACVTCSRDDLVEKTPCAWNSSRVCECRPGMFCSTSAVNSCARCFFHSVCPAGMIVKFPGTAQKNTVCEPASPGVSPACASPENCKEPSSGTIPQAKPTPVSPATSSASTMPVRGGTRLAQEAASKLTRAPDSPSSVGRPSSDPGLSPTQPCPEGSGDCRKQCEPDYYLDEAGRCTACVSCSRDDLVEKTPCAWNSSRTCECRPGMICATSATNSCARCVPYPICAAETVTKPQDMAEKDTTFEAPPLGTQPDCNPTPENGEAPASTSPTQSLLVDSQASKTLPIPTSAPVALSSTGKPVLDAGPVLFWVILVLVVVVGSSAFLLCHRRACRKRIRQKLHLCYPVQTSQPKLELVDSRPRRSSTQLRSGASVTEPVAEERGLMSQPLMETCHSVGAAYLESLPLQDASPAGGPSSPRDLPEPRVSTEHTNNKIEKIYIMKADTVIVGTVKAELPEGRGLAGPAEPELEEELEADHTPHYPEQETEPPLGSCSDVMLSVEEEGKEDPLPTAASGK
“分化簇30(CD30)”是指编码CD30多肽的核酸。下面提供了示例性CD30核酸序列。
>NM_001243.5智人TNF受体超家族成员8(TNFRSF8),转录变异体1,mRNA
CTGAGTCATCTCTGCACGTGTTTGCCCCCTTTTTTCTTCGCTGCTTGTAGCTAAGTGTTCCTGGAACCAATTTGATACGGGAGAACTAAGGCTGAAACCTCGGAGGAACAACCACTTTTGAAGTGACTTCGCGGCGTGCGTTGGGTGCGGACTAGGTGGCCGCGGCGGGAGTGTGCTGGAGCCTGAAGTCCACGCGCGCGGCTGAGAACCGCCGGGACCGCACGTGGGCGCCGCGCGCTTCCCCCGCTTCCCAGGTGGGCGCCGGCCGCCAGGCCACCTCACGTCCGGCCCCGGGGATGCGCGTCCTCCTCGCCGCGCTGGGACTGCTGTTCCTGGGGGCGCTACGAGCCTTCCCACAGGATCGACCCTTCGAGGACACCTGTCATGGAAACCCCAGCCACTACTATGACAAGGCTGTCAGGAGGTGCTGTTACCGCTGCCCCATGGGGCTGTTCCCGACACAGCAGTGCCCACAGAGGCCTACTGACTGCAGGAAGCAGTGTGAGCCTGACTACTACCTGGATGAGGCCGACCGCTGTACAGCCTGCGTGACTTGTTCTCGAGACGACCTCGTGGAGAAGACGCCGTGTGCATGGAACTCCTCCCGTGTCTGCGAATGTCGACCCGGCATGTTCTGTTCCACGTCTGCCGTCAACTCCTGTGCCCGCTGCTTCTTCCATTCTGTCTGTCCGGCAGGGATGATTGTCAAGTTCCCAGGCACGGCGCAGAAGAACACGGTCTGTGAGCCGGCTTCCCCAGGGGTCAGCCCTGCCTGTGCCAGCCCAGAGAACTGCAAGGAACCCTCCAGTGGCACCATCCCCCAGGCCAAGCCCACCCCGGTGTCCCCAGCAACCTCCAGTGCCAGCACCATGCCTGTAAGAGGGGGCACCCGCCTCGCCCAGGAAGCTGCTTCTAAACTGACGAGGGCTCCCGACTCTCCCTCCTCTGTGGGAAGGCCTAGTTCAGATCCAGGTCTGTCCCCAACACAGCCATGCCCAGAGGGGTCTGGTGATTGCAGAAAGCAGTGTGAGCCCGACTACTACCTGGACGAGGCCGGCCGCTGCACGGCCTGCGTGAGCTGTTCTCGAGATGACCTTGTGGAGAAGACGCCATGTGCATGGAACTCCTCCCGCACCTGCGAATGTCGACCTGGCATGATCTGTGCCACATCAGCCACCAACTCCTGTGCCCGCTGTGTCCCCTACCCAATCTGTGCAGCAGAGACGGTCACCAAGCCCCAGGATATGGCTGAGAAGGACACCACCTTTGAGGCGCCACCCCTGGGGACCCAGCCGGACTGCAACCCCACCCCAGAGAATGGCGAGGCGCCTGCCAGCACCAGCCCCACTCAGAGCTTGCTGGTGGACTCCCAGGCCAGTAAGACGCTGCCCATCCCAACCAGCGCTCCCGTCGCTCTCTCCTCCACGGGGAAGCCCGTTCTGGATGCAGGGCCAGTGCTCTTCTGGGTGATCCTGGTGTTGGTTGTGGTGGTCGGCTCCAGCGCCTTCCTCCTGTGCCACCGGAGGGCCTGCAGGAAGCGAATTCGGCAGAAGCTCCACCTGTGCTACCCGGTCCAGACCTCCCAGCCCAAGCTAGAGCTTGTGGATTCCAGACCCAGGAGGAGCTCAACGCAGCTGAGGAGTGGTGCGTCGGTGACAGAACCCGTCGCGGAAGAGCGAGGGTTAATGAGCCAGCCACTGATGGAGACCTGCCACAGCGTGGGGGCAGCCTACCTGGAGAGCCTGCCGCTGCAGGATGCCAGCCCGGCCGGGGGCCCCTCGTCCCCCAGGGACCTTCCTGAGCCCCGGGTGTCCACGGAGCACACCAATAACAAGATTGAGAAAATCTACATCATGAAGGCTGACACCGTGATCGTGGGGACCGTGAAGGCTGAGCTGCCGGAGGGCCGGGGCCTGGCGGGGCCAGCAGAGCCCGAGTTGGAGGAGGAGCTGGAGGCGGACCATACCCCCCACTACCCCGAGCAGGAGACAGAACCGCCTCTGGGCAGCTGCAGCGATGTCATGCTCTCAGTGGAAGAGGAAGGGAAAGAAGACCCCTTGCCCACAGCTGCCTCTGGAAAGTGAGGCCTGGGCTGGGCTGGGGCTAGGAGGGCAGCAGGGTGGCCTCTGGGAGGCCAGGATGGCACTGTTGGCACCGAGGTTGGGGGCAGAGGCCCATCTGGCCTGAACTGAGGCTCCAGCATCTAGTGGTGGACCGGCCGGTCACTGCAGGGGTCTGGTGGTCTCTGCTTGCATCCCCAACTTAGCTGTCCCCTGACCCAGAGCCTAGGGGATCCGGGGCTTGTACAGAAGAGACAGTCCAAGGGGACTGGATCCCAGCAGTGATGTTGGTTGAGGCAGCAAACAGATGGCAGGATGGGCACTGCCGAGAACAGCATTGGTCCCAGAGCCCTGGGCATCAGACCTTAACCACCAGGCCCACAGCCCAGCGAGGGAGAGGTCGTGAGGCCAGCTCCCGGGGCCCCTGTAACCCTACTCTCCTCTCTCCCTGGACCTCAGAGGTGACACCCATTGGGCCCTTCCGGCATGCCCCCAGTTACTGTAAATGTGGCCCCCAGTGGGCATGGAGCCAGTGCCTGTGGTTGTTTCTCCAGAGTCAAAAGGGAAGTCGAGGGATGGGGCGTCGTCAGCTGGCACTGTCTCTGCTGCAGCGGCCACACTGTACTCTGCACTGGTGTGAGGGCCCCTGCCTGGACTGTGGGACCCTCCTGGTGCTGCCCACCTTCCCTGTCCTGTAGCCCCCTCGGTGGGCCCAGGGCCTAGGGCCCAGGATCAAGTCACTCATCTCAGAATGTCCCCACCAATCCCCGCCACAGCAGGCGCCTCGGGTCCCAGATGTCTGCAGCCCTCAGCAGCTGCAGACCGCCCCTCACCAACCCAGAGAACCTGCTTTACTTTGCCCAGGGACTTCCTCCCCATGTGAACATGGGGAACTTCGGGCCCTGCCTGGAGTCCTTGACCGCTCTCTGTGGGCCCCACCCACTCTGTCCTGGGAAATGAAGAAGCATCTTCCTTAGGTCTGCCCTGCTTGCAAATCCACTAGCACCGACCCCACCACCTGGTTCCGGCTCTGCACGCTTTGGGGTGTGGATGTCGAGAGGCACCACGGCCTCACCCAGGCATCTGCTTTACTCTGGACCATAGGAAACAAGACCGTTTGGAGGTTTCATCAGGATTTTGGGTTTTTCACATTTCACGCTAAGGAGTAGTGGCCCTGACTTCCGGTCGGCTGGCCAGCTGACTCCCTAGGGCCTTCAGACGTGTATGCAAATGAGTGATGGATAAGGATGAGTCTTGGAGTTGCGGGCAGCCTGGAGACTCGTGGACTTACCGCCTGGAGGCAGGCCCGGGAAGGCTGCTGTTTACTCATCGGGCAGCCACGTGCTCTCTGGAGGAAGTGATAGTTTCTGAAACCGCTCAGATGTTTTGGGGAAAGTTGGAGAAGCCGTGGCCTTGCGAGAGGTGGTTACACCAGAACCTGGACATTGGCCAGAAGAAGCTTAAGTGGGCAGACACTGTTTGCCCAGTGTTTGTGCAAGGATGGAGTGGGTGTCTCTGCATCACCCACAGCCGCAGCTGTAAGGCACGCTGGAAGGCACACGCCTGCCAGGCAGGGCAGTCTGGCGCCCATGATGGGAGGGATTGACATGTTTCAACAAAATAATGCACTTCCTTACCTAGTGGCCCTTCACACAACTTTTGAATCTCTAAAAATCCATAAAATCCTTAAAGAACTGTAA
“分化簇33(CD33)”是指与NCBI登录号NP_001763.3或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_001763.3髓细胞表面抗原CD33异构体1前体[智人]
MPLLLLLPLLWAGALAMDPNFWLQVQESVTVQEGLCVLVPCTFFHPIPYYDKNSPVHGYWFREGAIISRDSPVATNKLDQEVQEETQGRFRLLGDPSRNNCSLSIVDARRRDNGSYFFRMERGSTKYSYKSPQLSVHVTDLTHRPKILIPGTLEPGHSKNLTCSVSWACEQGTPPIFSWLSAAPTSLGPRTTHSSVLIITPRPQDHGTNLTCQVKFAGAGVTTERTIQLNVTYVPQNPTTGIFPGDGSGKQETRAGVVHGAIGGAGVTALLALCLCLIFFIVKTHRRKAARTAVGRNDTHPTTGSASPKHQKKSKLHGPTETSSCSGAAPTVEMDEELHYASLNFHGMNPSKDTSTEYSEVRTQ
“分化簇33(CD33)”是指编码CD33多肽的核酸。下面提供了示例性CD33核酸序列。
>NM_001772.4智人CD33分子(CD33),转录变异体1,mRNA
CTGCTCACACAGGAAGCCCTGGAAGCTGCTTCCTCAGACATGCCGCTGCTGCTACTGCTGCCCCTGCTGTGGGCAGGGGCCCTGGCTATGGATCCAAATTTCTGGCTGCAAGTGCAGGAGTCAGTGACGGTACAGGAGGGTTTGTGCGTCCTCGTGCCCTGCACTTTCTTCCATCCCATACCCTACTACGACAAGAACTCCCCAGTTCATGGTTACTGGTTCCGGGAAGGAGCCATTATATCCAGGGACTCTCCAGTGGCCACAAACAAGCTAGATCAAGAAGTACAGGAGGAGACTCAGGGCAGATTCCGCCTCCTTGGGGATCCCAGTAGGAACAACTGCTCCCTGAGCATCGTAGACGCCAGGAGGAGGGATAATGGTTCATACTTCTTTCGGATGGAGAGAGGAAGTACCAAATACAGTTACAAATCTCCCCAGCTCTCTGTGCATGTGACAGACTTGACCCACAGGCCCAAAATCCTCATCCCTGGCACTCTAGAACCCGGCCACTCCAAAAACCTGACCTGCTCTGTGTCCTGGGCCTGTGAGCAGGGAACACCCCCGATCTTCTCCTGGTTGTCAGCTGCCCCCACCTCCCTGGGCCCCAGGACTACTCACTCCTCGGTGCTCATAATCACCCCACGGCCCCAGGACCACGGCACCAACCTGACCTGTCAGGTGAAGTTCGCTGGAGCTGGTGTGACTACGGAGAGAACCATCCAGCTCAACGTCACCTATGTTCCACAGAACCCAACAACTGGTATCTTTCCAGGAGATGGCTCAGGGAAACAAGAGACCAGAGCAGGAGTGGTTCATGGGGCCATTGGAGGAGCTGGTGTTACAGCCCTGCTCGCTCTTTGTCTCTGCCTCATCTTCTTCATAGTGAAGACCCACAGGAGGAAAGCAGCCAGGACAGCAGTGGGCAGGAATGACACCCACCCTACCACAGGGTCAGCCTCCCCGAAACACCAGAAGAAGTCCAAGTTACATGGCCCCACTGAAACCTCAAGCTGTTCAGGTGCCGCCCCTACTGTGGAGATGGATGAGGAGCTGCATTATGCTTCCCTCAACTTTCATGGGATGAATCCTTCCAAGGACACCTCCACCGAATACTCAGAGGTCAGGACCCAGTGAGGAACCCACAAGAGCATCAGGCTCAGCTAGAAGATCCACATCCTCTACAGGTCGGGGACCAAAGGCTGATTCTTGGAGATTTAACACCCCACAGGCAATGGGTTTATAGACATTATGTGAGTTTCCTGCTATATTAACATCATCTTAGACTTTGCAAGCAGAGAGTCGTGGAATCAAATCTGTGCTCTTTCATTTGCTAAGTGTATGATGTCACACAAGCTCCTTAACCTTCCATGTCTCCATTTTCTTCTCTGTGAAGTAGGTATAAGAAGTCCTATCTCATAGGGATGCTGTGAGCATTAAATAAAGGTACACATGGAAAACACCA
“分化簇52(CD52)”是指与NCBI登录号NP_001794.2或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_001794.2CAMPATH-1抗原前体[智人]
MKRFLFLLLTISLLVMVQIQTGLSGQNDTSQTSSPSASSNISGGIFLFFVANAIIHLFCFS
“分化簇52(CD52)”是指编码CD52多肽的核酸。下面提供了示例性CD52核酸序列。
>NM_001803.3智人CD52分子(CD52),mRNA
AGACAGCCCTGAGATCACCTAAAAAGCTGCTACCAAGACAGCCACGAAGATCCTACCAAAATGAAGCGCTTCCTCTTCCTCCTACTCACCATCAGCCTCCTGGTTATGGTACAGATACAAACTGGACTCTCAGGACAAAACGACACCAGCCAAACCAGCAGCCCCTCAGCATCCAGCAACATAAGCGGAGGCATTTTCCTTTTCTTCGTGGCCAATGCCATAATCCACCTCTTCTGCTTCAGTTGAGGTGACACGTCTCAGCCTTAGCCCTGTGCCCCCTGAAACAGCTGCCACCATCACTCGCAAGAGAATCCCCTCCATCTTTGGGAGGGGTTGATGCCAGACATCACCAGGTTGTAGAAGTTGACAGGCAGTGCCATGGGGGCAACAGCCAAAATAGGGGGGTAATGATGTAGGGGCCAAGCAGTGCCCAGCTGGGGGTCAATAAAGTTACCCTTGTACTTGCA
“分化簇70(CD70)”是指与NCBI登录号NP_001243.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_001243.1CD70抗原异构体1[智人]
MPEEGSGCSVRRRPYGCVLRAALVPLVAGLVICLVVCIQRFAQAQQQLPLESLGWDVAELQLNHTGPQQDPRLYWQGGPALGRSFLHGPELDKGQLRIHRDGIYMVHIQVTLAICSSTTASRHHPTTLAVGICSPASRSISLLRLSFHQGCTIASQRLTPLARGDTLCTNLTGTLLPSRNTDETFFGVQWVRP
“分化簇70(CD70)”是指编码CD70多肽的核酸。下面提供了示例性CD70核酸序列。
>NM_001252.5智人CD70分子(CD70),转录变异体1,mRNA
AGAGAGGGGCAGGCTGGTCCCCTGACAGGTTGAAGCAAGTAGACGCCCAGGAGCCCCGGGAGGGGGCTGCAGTTTCCTTCCTTCCTTCTCGGCAGCGCTCCGCGCCCCCATCGCCCCTCCTGCGCTAGCGGAGGTGATCGCCGCGGCGATGCCGGAGGAGGGTTCGGGCTGCTCGGTGCGGCGCAGGCCCTATGGGTGCGTCCTGCGGGCTGCTTTGGTCCCATTGGTCGCGGGCTTGGTGATCTGCCTCGTGGTGTGCATCCAGCGCTTCGCACAGGCTCAGCAGCAGCTGCCGCTCGAGTCACTTGGGTGGGACGTAGCTGAGCTGCAGCTGAATCACACAGGACCTCAGCAGGACCCCAGGCTATACTGGCAGGGGGGCCCAGCACTGGGCCGCTCCTTCCTGCATGGACCAGAGCTGGACAAGGGGCAGCTACGTATCCATCGTGATGGCATCTACATGGTACACATCCAGGTGACGCTGGCCATCTGCTCCTCCACGACGGCCTCCAGGCACCACCCCACCACCCTGGCCGTGGGAATCTGCTCTCCCGCCTCCCGTAGCATCAGCCTGCTGCGTCTCAGCTTCCACCAAGGTTGTACCATTGCCTCCCAGCGCCTGACGCCCCTGGCCCGAGGGGACACACTCTGCACCAACCTCACTGGGACACTTTTGCCTTCCCGAAACACTGATGAGACCTTCTTTGGAGTGCAGTGGGTGCGCCCCTGACCACTGCTGCTGATTAGGGTTTTTTAAATTTTATTTTATTTTATTTAAGTTCAAGAGAAAAAGTGTACACACAGGGGCCACCCGGGGTTGGGGTGGGAGTGTGGTGGGGGGTAGTGGTGGCAGGACAAGAGAAGGCATTGAGCTTTTTCTTTCATTTTCCTATTAAAAAATACAAAAATCA
“II类,主要组织相容性复合物,反式激活剂(CIITA)”是指与NCBI登录号NP_001273331.1或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>NP_001273331.1MHC II类反式激活子异构体1[智人]
MRCLAPRPAGSYLSEPQGSSQCATMELGPLEGGYLELLNSDADPLCLYHFYDQMDLAGEEEIELYSEPDTDTINCDQFSRLLCDMEGDEETREAYANIAELDQYVFQDSQLEGLSKDIFIEHIGPDEVIGESMEMPAEVGQKSQKRPFPEELPADLKHWKPAEPPTVVTGSLLVGPVSDCSTLPCLPLPALFNQEPASGQMRLEKTDQIPMPFSSSSLSCLNLPEGPIQFVPTISTLPHGLWQISEAGTGVSSIFIYHGEVPQASQVPPPSGFTVHGLPTSPDRPGSTSPFAPSATDLPSMPEPALTSRANMTEHKTSPTQCPAAGEVSNKLPKWPEPVEQFYRSLQDTYGAEPAGPDGILVEVDLVQARLERSSSKSLERELATPDWAERQLAQGGLAEVLLAAKEHRRPRETRVIAVLGKAGQGKSYWAGAVSRAWACGRLPQYDFVFSVPCHCLNRPGDAYGLQDLLFSLGPQPLVAADEVFSHILKRPDRVLLILDGFEELEAQDGFLHSTCGPAPAEPCSLRGLLAGLFQKKLLRGCTLLLTARPRGRLVQSLSKADALFELSGFSMEQAQAYVMRYFESSGMTEHQDRALTLLRDRPLLLSHSHSPTLCRAVCQLSEALLELGEDAKLPSTLTGLYVGLLGRAALDSPPGALAELAKLAWELGRRHQSTLQEDQFPSADVRTWAMAKGLVQHPPRAAESELAFPSFLLQCFLGALWLALSGEIKDKELPQYLALTPRKKRPYDNWLEGVPRFLAGLIFQPPARCLGALLGPSAAASVDRKQKVLARYLKRLQPGTLRARQLLELLHCAHEAEEAGIWQHVVQELPGRLSFLGTRLTPPDAHVLGKALEAAGQDFSLDLRSTGICPSGLGSLVGLSCVTRFRAALSDTVALWESLQQHGETKLLQAAEEKFTIEPFKAKSLKDVEDLGKLVQTQRTRSSSEDTAGELPAVRDLKKLEFALGPVSGPQAFPKLVRILTAFSSLQHLDLDALSENKIGDEGVSQLSATFPQLKSLETLNLSQNNITDLGAYKLAEALPSLAASLLRLSLYNNCICDVGAESLARVLPDMVSLRVMDVQYNKFTAAGAQQLAASLRRCPHVETLAMWTPTIPFSVQEHLQQQDSRISLR
“II类,主要组织相容性复合物,反式激活因子(CIITA)”是指编码CIITA多肽的核酸。下面提供了示例性CIITA核酸序列。
>NM_001286402.1智人II类主要组织相容性复合物反式激活因子(CIITA),转录变异体1,mRNA
GGTTAGTGATGAGGCTAGTGATGAGGCTGTGTGCTTCTGAGCTGGGCATCCGAAGGCATCCTTGGGGAAGCTGAGGGCACGAGGAGGGGCTGCCAGACTCCGGGAGCTGCTGCCTGGCTGGGATTCCTACACAATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGATCCCAGCTGTGCTCTGGACAGGCATGTTCTCTGAGGACACTAACCACGCTGGACCTTGAACTGGGTACTTGTGGACACAGCTCTTCTCCAGGCTGTATCCCATGAGCCTCAGCATCCTGGCACCCGGCCCCTGCTGGTTCAGGGTTGGCCCCTGCCCGGCTGCGGAATGAACCACATCTTGCTCTGCTGACAGACACAGGCCCGGCTCCAGGCTCCTTTAGCGCCCAGTTGGGTGGATGCCTGGTGGCAGCTGCGGTCCACCCAGGAGCCCCGAGGCCTTCTCTGAAGGACATTGCGGACAGCCACGGCCAGGCCAGAGGGAGTGACAGAGGCAGCCCCATTCTGCCTGCCCAGGCCCCTGCCACCCTGGGGAGAAAGTACTTCTTTTTTTTTATTTTTAGACAGAGTCTCACTGTTGCCCAGGCTGGCGTGCAGTGGTGCGATCTGGGTTCACTGCAACCTCCGCCTCTTGGGTTCAAGCGATTCTTCTGCTTCAGCCTCCCGAGTAGCTGGGACTACAGGCACCCACCATCATGTCTGGCTAATTTTTCATTTTTAGTAGAGACAGGGTTTTGCCATGTTGGCCAGGCTGGTCTCAAACTCTTGACCTCAGGTGATCCACCCACCTCAGCCTCCCAAAGTGCTGGGATTACAAGCGTGAGCCACTGCACCGGGCCACAGAGAAAGTACTTCTCCACCCTGCTCTCCGACCAGACACCTTGACAGGGCACACCGGGCACTCAGAAGACACTGATGGGCAACCCCCAGCCTGCTAATTCCCCAGATTGCAACAGGCTGGGCTTCAGTGGCAGCTGCTTTTGTCTATGGGACTCAATGCACTGACATTGTTGGCCAAAGCCAAAGCTAGGCCTGGCCAGATGCACCAGCCCTTAGCAGGGAAACAGCTAATGGGACACTAATGGGGCGGTGAGAGGGGAACAGACTGGAAGCACAGCTTCATTTCCTGTGTCTTTTTTCACTACATTATAAATGTCTCTTTAATGTCACAGGCAGGTCCAGGGTTTGAGTTCATACCCTGTTACCATTTTGGGGTACCCACTGCTCTGGTTATCTAATATGTAACAAGCCACCCCAAATCATAGTGGCTTAAAACAACACTCACATTTA
“细胞毒性T淋巴细胞相关蛋白4(CTLA-4)多肽”是指与NCBI登录号EAW70354.1或其片段具有至少约85%序列同一性的蛋白质。下面提供了示例性氨基酸序列:
>EAW70354.1细胞毒性T淋巴细胞相关蛋白4[智人]
MACLGFQRHKAQLNLATRTWPCTLLFFLLFIPVFCKAMHVAQPAVVLASSRGIASFVCEYASPGKATEVRVTVLRQADSQVTEVCAATYMMGNELTFLDDSICTGTSSGNQVNLTIQGLRAMDTGLYICKVELMYPPPYYLGIGNGTQIYVIDPEPCPDSDFLLWILAAVSSGLFFYSFLLTAVSLSKMLKKRSPLTTGVYVKMPPTEPECEKQFQPYFIPIN
“细胞毒性T淋巴细胞相关蛋白4(CTLA-4)多核苷酸”是指编码CTLA-4多肽的核酸分子。CTLA-4基因编码一个免疫球蛋白超家族,并编码一个向T细胞传递抑制信号的蛋白质。下面提供了示例性的CTLA-4核酸序列。
>BC074842.2智人细胞毒性T淋巴细胞相关蛋白4,mRNA(cDNA克隆MGC:104099IMAGE:30915552),完整cds
GACCTGAACACCGCTCCCATAAAGCCATGGCTTGCCTTGGATTTCAGCGGCACAAGGCTCAGCTGAACCTGGCTACCAGGACCTGGCCCTGCACTCTCCTGTTTTTTCTTCTCTTCATCCCTGTCTTCTGCAAAGCAATGCACGTGGCCCAGCCTGCTGTGGTACTGGCCAGCAGCCGAGGCATCGCCAGCTTTGTGTGTGAGTATGCATCTCCAGGCAAAGCCACTGAGGTCCGGGTGACAGTGCTTCGGCAGGCTGACAGCCAGGTGACTGAAGTCTGTGCGGCAACCTACATGATGGGGAATGAGTTGACCTTCCTAGATGATTCCATCTGCACGGGCACCTCCAGTGGAAATCAAGTGAACCTCACTATCCAAGGACTGAGGGCCATGGACACGGGACTCTACATCTGCAAGGTGGAGCTCATGTACCCACCGCCATACTACCTGGGCATAGGCAACGGAACCCAGATTTATGTAATTGATCCAGAACCGTGCCCAGATTCTGACTTCCTCCTCTGGATCCTTGCAGCAGTTAGTTCGGGGTTGTTTTTTTATAGCTTTCTCCTCACAGCTGTTTCTTTGAGCAAAATGCTAAAGAAAAGAAGCCCTCTTACAACAGGGGTCTATGTGAAAATGCCCCCAACAGAGCCAGAATGTGAAAAGCAATTTCAGCCTTATTTTATTCCCATCAATTGAGAAACCATTATGAAGAAGAGAGTCCATATTTCAATTTCCAAGAGCTGAGG
“胞苷脱氨酶”是指能够催化将氨基转化为羰基的脱氨基反应的多肽或其片段。在一个实施方案中,胞苷脱氨酶将胞嘧啶转化为尿嘧啶或将5-甲基胞嘧啶转化为胸腺嘧啶。源自海七鳃鳗(Petromyzon marinus胞嘧啶脱氨酶1)的PmCDA1,或源自哺乳动物(例如,人、猪、牛、马、猴等)的AID(活化诱导胞苷脱氨酶;AICDA)和APOBEC是示例性的胞苷脱氨酶。
PmCDA1的碱基序列和氨基酸序列以及人AID的碱基序列和氨基酸序列如下所示。
>tr|A5H718|A5H718_PETMA胞嘧啶脱氨酶OS=海七鳃鳗OX=7757PE=2SV=1
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV
>EF094822.1海七鳃鳗分离物PmCDA.21胞嘧啶脱氨酶mRNA,完整cds
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGACATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
>tr|Q6QJ80|Q6QJ80_人类激活诱导的胞苷脱氨酶OS=智人OX=9606GN=AICDAPE=2SV=1
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV
>NG_011588.1:5001-15681智人激活诱导胞苷脱氨酶(AICDA)、12号染色体上的RefSeqGene(LRG_17)
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTGGACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAAATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGATCAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAATTCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTACTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTTTAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAATTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTTAGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTATGATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGGCAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGGTGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTATTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAATTTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACAGGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAAGTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAATGTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAAACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAAAGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAAGGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCAGGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAGCACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAGGACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAAAGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTAGGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCTTCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACACACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGATGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGTAAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAAGCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGGTTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTTTTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTGGAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGGCCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATGCATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGTTTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAACAGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTTGAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGGCATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGGTCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCAAAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACTTAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAATATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACCCCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAATGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAGAGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTACAGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAAGATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGGGAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTGGTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAAAATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAAAAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACTTCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGCATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCTTGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTTCCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGGAGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGCAGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACTAGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACACTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTATTCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTTGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATGTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGGATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGCTCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATAGGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGTCAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGGGCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCAGATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCGACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAAAGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCTTCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTATTTTGGAGGGACTGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGGGCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCAACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTGCTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATATTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAATATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTTAATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTTGGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCAGGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCCAAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATTTTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTCCGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCTTTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGTCAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCTATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAAAATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAACAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAAGCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGTCTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCCAAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCAGAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTTCCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCCTAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTGGCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATCTCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTACTTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCTTTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACAATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACAAATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCCACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTGTGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATCATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTCTGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCCTGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCCGACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACCGCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAAAGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAATGAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAAGATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGGGTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTTTTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCCTGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCTTCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTCTTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTCTGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCACATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTTTTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTTCCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTTGAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACGCATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAGACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTTACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTCTGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACTGCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGTAGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTGAGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAACTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCATCTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGTACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAATAAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGCAAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATCATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGGTCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCAAAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCTCATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGGGCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGGCACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCAGTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAAAAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAATTGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGTCCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAGCAACCCTTGCAATGAAGATGAGCAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTATTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTGCGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAAATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAAGCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTAAATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTATATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
载脂蛋白B mRNA编辑酶,催化类多肽(APOBEC)是进化上保守的胞苷脱氨酶家族。所述家族的成员是C-至-U编辑酶。类APOBEC蛋白的N末端结构域是催化结构域,而C末端结构域是假催化结构域。更具体地,催化结构域是锌依赖性胞苷脱氨酶结构域以及对于胞苷脱氨作用很重要。APOBEC家族成员包含APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(“APOBEC3E”现在指此)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4和激活诱导(胞苷)脱氨酶。许多经修饰的胞苷脱氨酶是可商购的,包含但不限于SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3和YEE-BE3,其是可从Addgene获得(质粒85169、85170、85171、85172、85173、85174、85175、85176、85177)。
下面提供了根据本发明内容的方面可以与Cas9融合的其他示例性脱氨酶。应当理解,在一些实施方案中,可以使用相应序列的活性结构域,例如,没有定位信号的结构域(核定位序列,没有核输出信号,细胞质定位信号)。
人类AID:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLP
Figure BDA0003263753870000921
(下划线:核定位序列;双下划线:核输出信号)
小鼠AID:
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLP
Figure BDA0003263753870000922
(下划线:核定位序列;双下划线:核输出信号)
犬类AID:
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLP
Figure BDA0003263753870000934
(下划线:核定位序列;双下划线:核输出信号)
牛AID:
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLP
Figure BDA0003263753870000933
(下划线:核定位序列;双下划线:核输出信号)
大鼠AID:
MAVGSKPKAALVGPHWERERIWCFLCSTGLGTQQTGQTSRWLRPAATQDPVSPPRSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGYLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLTGWGALPAGLMSPARPSDYFYCWNTFV
Figure BDA0003263753870000931
Figure BDA0003263753870000932
(下划线:核定位序列;双下划线:核输出信号)
小鼠APOBEC-3:
Figure BDA0003263753870000935
Figure BDA0003263753870000936
(斜体:核酸编辑结构域)
大鼠APOBEC-3:
Figure BDA0003263753870000937
Figure BDA0003263753870000942
Figure BDA0003263753870000941
(斜体:核酸编辑结构域)
恒河猴APOBEC-3G:
MVEPMDPRTFVSNFNNRPILSGLNTVWLCCEVKTKDPSGPPLDAKIFQGKVYSKAKYHPEMRFLRWFHKWRQLHHDQEYKVTWYVSWSPCTRCANSVATFLAKDPKVTLTIFVARLYYFWKPDYQQALRILCQKRGGPHATMKIMNYNEFQDCWNKFVDGRGKPFKPRNNLPKHYTLLQATLGELLRHLMDPGTFTSNFNNKPWVSGQHETYLCYKVERLHNDTWVPLNQHRGFLRNQAPNIHGFPKGRHAELCFLDLIPFWKLDGQQYRVTCFTSWSPCFSCAQEMAKFISNNEHVSLCIFAARIYDDQGRYQEGLRALHRDGAKIAMMNYSEFEYCWDTFVDRQGRPFQPWDGLDEHSQALSGRLRAI(斜体:核酸编辑结构域;下划线:细胞质定位信号)
黑猩猩APOBEC-3G:
Figure BDA0003263753870000943
(斜体:核酸编辑结构域;下划线:细胞质定位信号)
绿猴APOBEC-3G:
Figure BDA0003263753870000944
(斜体:核酸编辑结构域;下划线:细胞质定位信号)
人类APOBEC-3G:
Figure BDA0003263753870000945
Figure BDA0003263753870000951
(斜体:核酸编辑结构域;下划线:细胞质定位信号)
人类APOBEC-3F:
Figure BDA0003263753870000952
(斜体:核酸编辑结构域)
人类APOBEC-3B:
Figure BDA0003263753870000953
(斜体:核酸编辑结构域)
大鼠APOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL
牛APOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI
黑猩猩APOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG
人类APOBEC-3C:
Figure BDA0003263753870000961
(斜体:核酸编辑结构域)
大猩猩APOBEC3C:
Figure BDA0003263753870000962
(斜体:核酸编辑结构域)
人类APOBEC-3A:
Figure BDA0003263753870000963
Figure BDA0003263753870000971
(斜体:核酸编辑结构域)
恒河猴APOBEC-3A:
Figure BDA0003263753870000972
(斜体:核酸编辑结构域)
牛APOBEC-3A:
Figure BDA0003263753870000973
(斜体:核酸编辑结构域)
人类APOBEC-3H:
Figure BDA0003263753870000974
(斜体:核酸编辑结构域)
恒河猴APOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR
人类APOBEC-3D:
Figure BDA0003263753870000975
Figure BDA0003263753870000981
(斜体:核酸编辑结构域)
人类APOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR小鼠APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK
大鼠APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
人类APOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
小鼠APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
大鼠APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
牛APOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
海七鳃鳗CDA1(pmCDAl)
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV
人类APOBEC3G D316R D317R
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
人类APOBEC3G链A
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISF TYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ
人类APOBEC3G链A D120R D121R
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ
术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或其片段。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体的天然存在的脱氨酶的变异体。在一些实施方案中,脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域为至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与天然存在的脱氨酶相同。在一些实施方案中,脱氨酶是胞嘧啶脱氨酶或腺苷脱氨酶。
“检测”是指鉴定待检测的分析物的存在、不存在或量。
“可检测标记”是指一个组成物,当与感兴趣的分子连接时,通过光谱、光化学、生物化学、免疫化学或化学手段使后者可检测。例如,有用的标记包含放射性同位素、磁珠、金属珠、胶体颗粒、荧光染料、电子致密试剂、酶(例如,通常用于ELISA)、生物素、地高辛或半抗原。
“疾病”是指损害或干扰细胞、组织或器官的正常功能的任何病症或病症。在一个实施方案中,疾病是肿瘤或癌症(例如,多发性骨髓瘤)。
如本文所用,术语“有效量”是指足以引发所需生物反应的生物活性剂的量。在一些实施方案中,本文提供的融合蛋白,例如包含nCas9结构域和一个或多个脱氨酶结构域(例如,胞苷脱氨酶、腺苷脱氨酶)的胞苷脱氨酶或腺苷脱氨酶核碱基编辑器的有效量可以指足以诱导编辑由胞苷脱氨酶或腺苷脱氨酶核碱基编辑器特异性结合和编辑的靶位点的融合蛋白。如本领域技术人员将理解的,试剂例如融合蛋白的有效量可根据各个因素而变化,例如取决于所需的生物反应,例如具体的等位基因、基因组或靶标要编辑的位点、目标细胞或组织以及正在使用的试剂。在CAR-T细胞的上下文中,“有效量”是指给予患者以实现治疗反应所需的细胞数量。
在一些实施方案中,本文提供的融合蛋白,例如包含nCas9结构域和胞苷脱氨酶或腺苷脱氨酶的融合蛋白的有效量可以指足以诱导编辑的融合蛋白的量由融合蛋白特异性结合和编辑的靶位点。如本领域技术人员将理解的,有效量的试剂,例如融合蛋白、核酸酶、胞苷脱氨酶或腺苷脱氨酶、杂合蛋白、蛋白二聚体、蛋白(或蛋白二聚体)的复合物以及多核苷酸或多核苷酸可根据各个因素而变化,例如,取决于所需的生物反应,例如取决于待编辑的特定等位基因、基因组或靶位点,取决于被靶向的细胞或组织,以及关于正在使用的代理。
如本文所用,“表位”是指抗原决定簇。表位是抗原分子的一部分,通过其结构决定识别和结合其的特定抗体分子。
“片段”是指多肽或核酸分子的一部分。所述部分包含参考核酸分子或多肽全长的至少约10%、20%、30%、40%、50%、60%、70%、80%或90%。片段可包含10、20、30、40、50、60、70、80、90或100、200、300、400、500、600、700、800、900或1000个核苷酸或氨基酸。
“移植物抗宿主病”(GVHD)是指其中供体的移植细胞产生针对宿主细胞的免疫应答的病理状况。
“宿主抗移植物疾病”(HVGD)是指其中宿主的免疫系统产生针对供体的移植细胞的免疫应答的病理状况。
“杂交(Hybridization)”是指互补核碱基之间的氢键,其可以是Watson-Crick、Hoogsteen或反向Hoogsteen氢键。例如,腺嘌呤和胸腺嘧啶是互补的核碱基,其通过形成氢键配对。
“免疫细胞”是指能够产生免疫应答的免疫系统细胞。
“免疫效应细胞”是指淋巴细胞,一旦被激活,就能够对靶细胞产生免疫应答。T细胞是示例性的免疫效应细胞。
“免疫应答调节基因”或“免疫应答调节剂”是指编码参与免疫应答调节的多肽的基因。一个免疫应答调节基因可以在多种机制或不同水平上调节免疫应答。例如,免疫应答调节基因可以抑制或促进免疫细胞的激活,例如一个T细胞。免疫应答调节基因可以增加或减少免疫细胞的激活阈值。在一些实施方案中,免疫应答调节基因正向调节免疫细胞信号转导途径。在一些实施方案中,免疫应答调节基因负向调节免疫细胞信号转导途径。在一些实施方案中,免疫应答调节基因编码抗原、抗体、细胞因子或神经内分泌。在一些实施方案中,免疫应答调节基因编码Cblb蛋白。
“免疫原性基因”是指编码能够引发免疫应答的多肽的基因。例如,免疫原性基因可以编码引发免疫应答的免疫原。在一些实施方案中,免疫原性基因编码细胞表面蛋白。在一些实施方案中,免疫原性基因编码细胞表面抗原或细胞表面标志物。在一些实施方案中,细胞表面标志物是T细胞标志物或B细胞标志物。在一些实施方案中,免疫原性基因编码CD2、CD3e、CD3δ、CD3γ、TRAC、TRBC1、TRBC2、CD4、CD5、CD7、CD8、CD19、CD23、CD27、CD28、CD30、CD33、CD52、CD70、CD127、CD122、CD130、CD132、CD38、CD69、CD11a、CD58、CD99、CD103、CCR4、CCR5、CCR6、CCR9、CCR10、CXCR3、CXCR4、CLA、CD161、B2M或CIITA多肽。
术语“碱基修复抑制剂”或“IBR”是指能够抑制核酸修复酶例如碱基切除修复酶的活性的蛋白质。在一些实施方案中,IBR是肌苷碱基切除修复的抑制剂。碱基修复的示例性抑制剂包含APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGG1、hNEIL1、T7 Endol、T4PDG、UDG、hSMUG1和hAAG的抑制剂。在一些实施方案中,IBR是Endo V或hAAG的抑制剂。在一些实施方案中,IBR是无催化活性的EndoV或无催化活性的hAAG。
术语“分离的(isolated)”、“纯化的(purified)”或“生物学纯的(biologicallypure)”是指材料在不同程度上不含在其天然状态下通常伴随的组分。“隔离”表示与原始来源或周围环境的分离程度。“纯化”表示高于隔离度的分离度。“纯化的”或“生物学纯的”蛋白质充分不含其他材料,使得任何杂质不会实质性地影响蛋白质的生物学特性或引起其他不利后果。也就是说,如果本发明的核酸或肽在通过重组DNA技术生产时基本上不含细胞材料、病毒材料或培养基,或者在化学合成时基本上不含化学前体或其他化学品,则所述核酸或肽被纯化。纯度和均匀性通常使用分析化学技术确定,例如聚丙烯酰胺凝胶电泳或高效液相色谱。术语“纯化的”可以表示核酸或蛋白质在电泳凝胶中产生基本上一条带。对于可以进行修饰(例如磷酸化或糖基化)的蛋白质,不同的修饰可能会产生不同的分离蛋白质,这些蛋白质可以单独纯化。
“分离的多核苷酸”是指不含基因的核酸(例如,DNA),在本发明的核酸分子所源自的生物的天然存在的基因组中,所述基因位于基因。因此,所述术语包含,例如,整合到载体中的重组DNA;进入自主复制的质粒或病毒;或进入原核生物或真核生物的基因组DNA;或作为独立于其他序列的独立分子(例如,通过PCR或限制性内切核酸酶消化产生的cDNA或基因组或cDNA片段)存在。此外,所述术语包含从DNA分子转录的RNA分子,以及作为编码额外多肽序列的杂合基因的一部分的重组DNA。
“分离的多肽”是指已经与天然伴随其组分分离的本发明的多肽。通常,当多肽至少60%(重量)不含蛋白质和天然存在的有机分子时,多肽就被分离出来。优选地,所述制剂是至少75重量%,更优选至少90重量%,以及最优选至少99重量%的本发明多肽。本发明的分离的多肽可以获得,例如,通过从天然来源中提取,通过编码这个多肽的重组核酸的表达;或通过化学合成蛋白质。纯度可以通过任何合适的方法测量,例如柱色谱、聚丙烯酰胺凝胶电泳或通过HPLC分析。
如本文所用,术语“连接子”是指键(例如,共价键)、化学基团或连接两个分子或部分的分子,例如融合蛋白的两个结构域,例如、核酸酶失活的Cas9结构域和核酸编辑结构域(例如,胞苷脱氨酶、腺苷脱氨酶)或在嵌合抗原受体的情况下,将可变重(VH)区连接到恒定重(CH)区的连接子。在一些实施方案中,连接子连接融合蛋白的两个结构域,例如无核酸酶的Cas9结构域和核酸编辑结构域(例如,胞苷脱氨酶、腺苷脱氨酶)。在一些实施方案中,连接子连接RNA可编程核酸酶的gRNA结合结构域,包含Cas9核酸酶域和核酸编辑蛋白的催化域。在一些实施方案中,连接子连接dCas9和核酸编辑蛋白。通常,连接子位于两个基团、分子或其他部分之间或两侧,并通过共价键与每个基团、分子或其他部分连接,从而将两者连接起来。在一些实施方案中,连接子是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子的长度为5-100个氨基酸,例如,长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190或200个氨基酸。更长或更短的连接子也被考虑在内。在一些实施方案中,连接子包含氨基酸序列SGSETPGTSESATPES,其也可称为XTEN连接子。在一些实施方案中,连接子包含氨基酸序列SGGS。在一些实施方案中,连接子包含(SGGS)n、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPES或(XP)n基序,或这些中的任何一个,其中n独立地是1和30之间的整数,以及其中X是任何氨基酸。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。
在一些实施方案中,嵌合抗原受体包含至少一个连接子。至少一个连接子将可变重(VH)区连接或连接至嵌合抗原受体胞外结合结构域的恒定重(CH)区。连接子还可以将可变轻(VL)区连接到胞外结合结构域的可变恒定(VC)区。
在一些实施方案中,胞苷脱氨酶或腺苷脱氨酶核碱基编辑器的结构域通过包含以下氨基酸序列的连接子融合,所述连接子的氨基酸序列包含SGGSSGSETPGTSESATPESSGGS、SGGSSGGSSGSETPGTSESATPESSGGSSGGS或GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS。在一些实施方案中,胞苷脱氨酶或腺苷脱氨酶核碱基编辑器的结构域通过包含氨基酸序列SGSETPGTSESATPES的连接子融合,其也可称为XTEN连接子。在一些实施方案中,连接子的长度为24个氨基酸。在一些实施方案中,连接子包含氨基酸序列SGGSSGGSSGSETPGTSESATPES。在一些实施方案中,连接子的长度为40个氨基酸。在一些实施方案中,连接子包含氨基酸序列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS。在一些实施方案中,连接子的长度为64个氨基酸。在一些实施方案中,连接子包含氨基酸序列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS。在一些实施方案中,连接子的长度为92个氨基酸。在一些实施方案中,连接子包含氨基酸序列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGSAPGTSESATPESGPGSEPATS。
“标记物”是指在与疾病或病症相关的表达水平或活性方面具有改变的任何蛋白质或多核苷酸。
如本文所用,术语“突变”是指序列(例如核酸或氨基酸序列)内的残基被另一残基取代,或一个或多个残基在一个或多个残基内的缺失或插入。突变在本文中通常通过鉴定原始残基随后是所述残基在序列中的位置以及通过新取代残基的身份来描述。用于进行本文提供的氨基酸取代(突变)的各个方法是本领域公知的,以及由例如Green和Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.(2012))。
“肿瘤(Neoplasia)”是指表现出异常生长或增殖的细胞或组织。术语肿瘤包含癌症和实体肿瘤。
“活化的T细胞核因子1(NFATc1)多肽”是指与NCBI登录号NM_172390.2或其片段具有至少约85%氨基酸序列同一性的蛋白质,以及是活化的T细胞核因子的组分。T细胞DNA结合转录复合物。下面提供了示例性氨基酸序列。
>NP_765978.1活化细胞的核因子,细胞质1异形体A[智人]
MPSTSFPVPSKFPLGPAAAVFGRGETLGPAPRAGGTMKSAEEEHYGYASSNVSPALPLPTAHSTLPAPCHNLQTSTPGIIPPADHPSGYGAALDGGPAGYFLSSGHTRPDGAPALESPRIEITSCLGLYHNNNQFFHDVEVEDVLPSSKRSPSTATLSLPSLEAYRDPSCLSPASSLSSRSCNSEASSYESNYSYPYASPQTSPWQSPCVSPKTTDPEEGFPRGLGACTLLGSPRHSPSTSPRASVTEESWLGARSSRPASPCNKRKYSLNGRQPPYSPHHSPTPSPHGSPRVSVTDDSWLGNTTQYTSSAIVAAINALTTDSSLDLGDGVPVKSRKTTLEQPPSVALKVEPVGEDLGSPPPPADFAPEDYSSFQHIRKGGFCDQYLAVPQHPYQWAKPKPLSPTSYMSPTLPALDWQLPSHSGPYELRIEVQPKSHHRAHYETEGSRGAVKASAGGHPIVQLHGYLENEPLMLQLFIGTADDRLLRPHAFYQVHRITGKTVSTTSHEAILSNTKVLEIPLLPENSMRAVIDCAGILKLRNSDIELRKGETDIGRKNTRVRLVFRVHVPQPSGRTLSLQVASNPIECSQRSAQELPLVEKQSTDSYPVVGGKKMVLSGHNFLQDSKVIFVEKAPDGHHVWEMEAKTDRDLCKPNSLVVEIPPFRNQRITSPVHVSFYVCNGKRKRSQYQRFTYLPANGNAIFLTVSREHERVGCFF
“活化T细胞核因子1(NFATc1)多核苷酸”是指编码NFATc1多肽的核酸分子。NFATc1基因编码一种蛋白质,所述蛋白质参与T细胞中细胞因子基因,尤其是IL-2和IL-4的可诱导表达。下面提供了测序的示例性核酸。
>NM_172390.2活化T细胞的智人核因子1(NFATC1),转录变异体1,mRNA
GGCGGGCGCTCGGCGACTCGTCCCCGGGGCCCCGCGCGGGCCCGGGCAGCAGGGGCGTGATGTCACGGCAGGGAGGGGGCGCGGGAGCCGCCGGGCCGGCGGGGAGGCGGGGGAGGTGTTTTCCAGCTTTAAAAAGGCAGGAGGCAGAGCGCGGCCCTGCGTCAGAGCGAGACTCAGAGGCTCCGAACTCGCCGGCGGAGTCGCCGCGCCAGATCCCAGCAGCAGGGCGCGGGCACCGGGGCGCGGGCAGGGCTCGGAGCCACCGCGCAGGTCCTAGGGCCGCGGCCGGGCCCCGCCACGCGCGCACACGCCCCTCGATGACTTTCCTCCGGGGCGCGCGGCGCTGAGCCCGGGGCGAGGGCTGTCTTCCCGGAGACCCGACCCCGGCAGCGCGGGGCGGCCGCTTCTCCTGTGCCTCCGCCCGCCGCTCCACTCCCCGCCGCCGCCGCGCGGATGCCAAGCACCAGCTTTCCAGTCCCTTCCAAGTTTCCACTTGGCCCTGCGGCTGCGGTCTTCGGGAGAGGAGAAACTTTGGGGCCCGCGCCGCGCGCCGGCGGCACCATGAAGTCAGCGGAGGAAGAACACTATGGCTATGCATCCTCCAACGTCAGCCCCGCCCTGCCGCTCCCCACGGCGCACTCCACCCTGCCGGCCCCGTGCCACAACCTTCAGACCTCCACACCGGGCATCATCCCGCCGGCGGATCACCCCTCGGGGTACGGAGCAGCTTTGGACGGTGGGCCCGCGGGCTACTTCCTCTCCTCCGGCCACACCAGGCCTGATGGGGCCCCTGCCCTGGAGAGTCCTCGCATCGAGATAACCTCGTGCTTGGGCCTGTACCACAACAATAACCAGTTTTTCCACGATGTGGAGGTGGAAGACGTCCTCCCTAGCTCCAAACGGTCCCCCTCCACGGCCACGCTGAGTCTGCCCAGCCTGGAGGCCTACAGAGACCCCTCGTGCCTGAGCCCGGCCAGCAGCCTGTCCTCCCGGAGCTGCAACTCAGAGGCCTCCTCCTACGAGTCCAACTACTCGTACCCGTACGCGTCCCCCCAGACGTCGCCATGGCAGTCTCCCTGCGTGTCTCCCAAGACCACGGACCCCGAGGAGGGCTTTCCCCGCGGGCTGGGGGCCTGCACACTGCTGGGTTCCCCGCGGCACTCCCCCTCCACCTCGCCCCGCGCCAGCGTCACTGAGGAGAGCTGGCTGGGTGCCCGCTCCTCCAGACCCGCGTCCCCTTGCAACAAGAGGAAGTACAGCCTCAACGGCCGGCAGCCGCCCTACTCACCCCACCACTCGCCCACGCCGTCCCCGCACGGCTCCCCGCGGGTCAGCGTGACCGACGACTCGTGGTTGGGCAACACCACCCAGTACACCAGCTCGGCCATCGTGGCCGCCATCAACGCGCTGACCACCGACAGCAGCCTGGACCTGGGAGATGGCGTCCCTGTCAAGTCCCGCAAGACCACCCTGGAGCAGCCGCCCTCAGTGGCGCTCAAGGTGGAGCCCGTCGGGGAGGACCTGGGCAGCCCCCCGCCCCCGGCCGACTTCGCGCCCGAAGACTACTCCTCTTTCCAGCACATCAGGAAGGGCGGCTTCTGCGACCAGTACCTGGCGGTGCCGCAGCACCCCTACCAGTGGGCGAAGCCCAAGCCCCTGTCCCCTACGTCCTACATGAGCCCGACCCTGCCCGCCCTGGACTGGCAGCTGCCGTCCCACTCAGGCCCGTATGAGCTTCGGATTGAGGTGCAGCCCAAGTCCCACCACCGAGCCCACTACGAGACGGAGGGCAGCCGGGGGGCCGTGAAGGCGTCGGCCGGAGGACACCCCATCGTGCAGCTGCATGGCTACTTGGAGAATGAGCCGCTGATGCTGCAGCTTTTCATTGGGACGGCGGACGACCGCCTGCTGCGCCCGCACGCCTTCTACCAGGTGCACCGCATCACAGGGAAGACCGTGTCCACCACCAGCCACGAGGCCATCCTCTCCAACACCAAAGTCCTGGAGATCCCACTCCTGCCGGAGAACAGCATGCGAGCCGTCATTGACTGTGCCGGAATCCTGAAACTCAGAAACTCCGACATTGAACTTCGGAAAGGAGAGACGGACATCGGGAGGAAGAACACACGGGTACGGCTGGTGTTCCGCGTTCACGTCCCGCAACCCAGCGGCCGCACGCTGTCCCTGCAGGTGGCCTCCAACCCCATCGAATGCTCCCAGCGCTCAGCTCAGGAGCTGCCTCTGGTGGAGAAGCAGAGCACGGACAGCTATCCGGTCGTGGGCGGGAAGAAGATGGTCCTGTCTGGCCACAACTTCCTGCAGGACTCCAAGGTCATTTTCGTGGAGAAAGCCCCAGATGGCCACCATGTCTGGGAGATGGAAGCGAAAACTGACCGGGACCTGTGCAAGCCGAATTCTCTGGTGGTTGAGATCCCGCCATTTCGGAATCAGAGGATAACCAGCCCCGTTCACGTCAGTTTCTACGTCTGCAACGGGAAGAGAAAGCGAAGCCAGTACCAGCGTTTCACCTACCTTCCCGCCAACGGTAACGCCATCTTTCTAACCGTAAGCCGTGAACATGAGCGCGTGGGGTGCTTTTTCTAAAGACGCAGAAACGACGTCGCCGTAAAGCAGCGTGGCGTGTTGCACATTTAACTGTGTGATGTCCCGTTAGTGAGACCGAGCCATCGATGCCCTGAAAAGGAAAGGAAAAGGGAAGCTTCGGATGCATTTTCCTTGATCCCTGTTGGGGGTGGGGGGCGGGGGTTGCATACTCAGATAGTCACGGTTATTTTGCTTCTTGCGAATGTATAACAGCCAAGGGGAAAACATGGCTCTTCTGCTCCAAAAAACTGAGGGGGTCCTGGTGTGCATTTGCACCCTAAAGCTGCTTACGGTGAAAAGGCAAATAGGTATAGCTATTTTGCAGGCACCTTTAGGAATAAACTTTGCTTTTAAGCCTGTAAAAAAAAAAAAAA
术语“核定位序列”、“核定位信号”或“NLS”是指促进蛋白质输入细胞核的氨基酸序列。核定位序列是本领域已知的以及描述于例如Plank等人的国际第PCT/EP2000/011690号专利申请案,2000年11月23日提交,2001年5月31日作为国际第WO/2001/038547号专利公开案公布,其内容以引用方式并入本文以用于其对示例性核定位序列的公开在其他实施方案中,NLS是优化的NLS,例如由Koblan等人,Nature Biotech 2018doi:10.1038/nbt.4172描述。可用于本发明方法的优化序列示于图8A-8E和9。在一些实施方案中,NLS包含氨基酸序列PKKKRKVEGADKRTADGSEFES PKKKRKV、KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSKGKIAAIVVKRPRK、PKKKRKV或MDSLLMNRRKFLYQFKNVRWAKGRRETYLC。
如本文所用,术语“核酸”和“核酸分子”是指包含核碱基和酸性部分例如核苷、核苷酸或核苷酸聚合物的化合物。通常,聚合核酸,例如包含三个或更多个核苷酸的核酸分子是线性分子,其中相邻核苷酸通过磷酸二酯键相互连接。在一些实施方案中,“核酸”是指单个核酸残基(例如核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含三个或更多个单独核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可以互换使用以指核苷酸的聚合物(例如,至少三个核苷酸的串)。在一些实施方案中,“核酸”包含RNA以及单链和/或双链DNA。核酸可以是天然存在的,例如在基因组、转录物、mRNA、tRNA、rRNA、siRNA、snRNA、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的上下文中。另一方面,核酸分子可以是非天然存在的分子,例如重组DNA或RNA、人工染色体、工程基因组或其片段,或合成的DNA、RNA、DNA/RNA杂交体,或包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物,例如具有除磷酸二酯骨架之外的其他骨架的类似物。核酸可以从天然来源纯化、使用重组表达系统产生和任选地纯化、化学合成等。在合适的情况下,例如在化学合成分子的情况下,核酸可以包含核苷类似物,例如具有化学修饰碱基的类似物或糖和骨架修饰。除非另有说明,否则核酸序列以5'到3'方向呈现。在一些实施方案中,核酸是或包含天然核苷(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷);核苷类似物(例如,2-氨基腺苷、2-硫胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟苷和2-硫代胞苷);化学修饰的碱基;生物修饰的碱基(例如甲基化碱基);插入的碱基;经修饰的糖(.,2'-例如,氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖);和/或经修饰的磷酸基团(例如,硫代磷酸酯和5'-N-亚磷酰胺键)。
术语“核酸可编程DNA结合蛋白”或“napDNAbp”是指与核酸(例如DNA或RNA)结合的蛋白质,例如向导核酸,其将napDNAbp向导至特定核酸酸序列。例如,Cas9蛋白可以与向导RNA相关联,所述向导RNA将Cas9蛋白向导至与向导RNA互补的特定DNA序列。在一些实施方案中,napDNAbp、napDNAbp是Cas9结构域,例如核酸酶活性Cas9、Cas9切口酶(nCas9)或核酸酶失活Cas9(dCas9)。核酸可编程DNA结合蛋白的实例包括但不限于Cas9(例如dCas9和nCas9)、CasX、CasY、Cpfl、Cas12b/C2c1和Cas12c/C2c3。其他核酸可编程的DNA结合蛋白也在本发明的范围内,尽管其可能未在本发明中具体列出。
如本文所用,“获得”如在“获得药剂”中包括合成、购买或以其他方式获得药剂。
“程序性细胞死亡1(PDCD1或PD-1)多肽”是指与NCBI登录号AJS10360.1或其片段具有至少约85%的氨基酸序列同一性的蛋白质。PD-1蛋白被认为参与免疫应答和耐受条件下的T细胞功能调节。下面提供了示例性的B2M多肽序列。
>AJS10360.1程序性细胞死亡1蛋白[智人]
MQIPQAPWPVVWAVLQLGWRPGWFLDSPDRPWNPPTFSPALLVVTEGDNATFTCSFSNTSESFVLNWYRMSPSNQTDKLAAFPEDRSQPGQDCRFRVTQLPNGRDFHMSVVRARRNDSGTYLCGAISLAPKAQIKESLRAELRVTERRAEVPTAHPSPSPRPAGQFQTLVVGVVGGLLGSLVLLVWVLAVICSRAARGTIGARRTGQPLKEDPSAVPVFSVDYGELDFQWREKTPEPPVPCVPEQTEYATIVFPSGMGTSSPARRGSADGPRSAQPLRPEDGHCSWPL
“程序性细胞死亡1(PDCD1或PD-1)多核苷酸”是指编码PD-1多肽的核酸分子。PDCD1基因编码抑制性细胞表面受体,所述受体以抗原特异性方式抑制T细胞效应器功能。下面提供了示例性的PDCD1核酸序列。
AY238517.1智人程序性细胞死亡1(PDCD1)mRNA,完整cds
ATGCAGATCCCACAGGCGCCCTGGCCAGTCGTCTGGGCGGTGCTACAACTGGGCTGGCGGCCAGGATGGTTCTTAGACTCCCCAGACAGGCCCTGGAACCCCCCCACCTTCTCCCCAGCCCTGCTCGTGGTGACCGAAGGGGACAACGCCACCTTCACCTGCAGCTTCTCCAACACATCGGAGAGCTTCGTGCTAAACTGGTACCGCATGAGCCCCAGCAACCAGACGGACAAGCTGGCCGCCTTCCCCGAGGACCGCAGCCAGCCCGGCCAGGACTGCCGCTTCCGTGTCACACAACTGCCCAACGGGCGTGACTTCCACATGAGCGTGGTCAGGGCCCGGCGCAATGACAGCGGCACCTACCTCTGTGGGGCCATCTCCCTGGCCCCCAAGGCGCAGATCAAAGAGAGCCTGCGGGCAGAGCTCAGGGTGACAGAGAGAAGGGCAGAAGTGCCCACAGCCCACCCCAGCCCCTCACCCAGGCCAGCCGGCCAGTTCCAAACCCTGGTGGTTGGTGTCGTGGGCGGCCTGCTGGGCAGCCTGGTGCTGCTAGTCTGGGTCCTGGCCGTCATCTGCTCCCGGGCCGCACGAGGGACAATAGGAGCCAGGCGCACCGGCCAGCCCCTGAAGGAGGACCCCTCAGCCGTGCCTGTGTTCTCTGTGGACTATGGGGAGCTGGATTTCCAGTGGCGAGAGAAGACCCCGGAGCCCCCCGTGCCCTGTGTCCCTGAGCAGACGGAGTATGCCACCATTGTCTTTCCTAGCGGAATGGGCACCTCATCCCCCGCCCGCAGGGGCTCAGCTGACGGCCCTCGGAGTGCCCAGCCACTGAGGCCTGAGGATGGACACTGCTCTTGGCCCCTCTGA
本文在蛋白质或核酸的上下文中使用的术语“重组”是指在自然界中不存在但为人类工程产物的蛋白质或核酸。例如,在一些实施方案中,重组蛋白质或核酸分子包含与任何天然存在的序列相比包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个或至少七个突变的氨基酸或核苷酸序列。
“减少”或“增加”分别是指至少10%、25%、50%、75%或100%的负面或正面改变。
“参考”是指标准或对照条件。
“参考序列”是用作序列比较基础的定义序列。参考序列可以是特定序列的子集或全部;例如,全长cDNA或基因序列的片段,或完整的cDNA或基因序列。对于多肽,参考多肽序列的长度通常为至少约16个氨基酸、至少约20个氨基酸、更多至少约25个氨基酸、甚至更优选约35个氨基酸、约50个氨基酸,或约100个氨基酸。对于核酸,参考核酸序列的长度通常为至少约50个核苷酸、至少约60个核苷酸、至少约75个核苷酸和约100个核苷酸或约300个核苷酸或其附近或之间的任何整数。
术语“RNA可编程核酸酶”和“RNA向导的核酸酶”与一种或多种不是切割靶标的RNA一起使用(例如,结合或缔合)。在一些实施方案中,当与RNA形成复合物时,RNA可编程核酸酶可被称为核酸酶:RNA复合物。通常,结合的RNA被称为向导RNA(gRNA)。gRNA可以作为两个或多个RNA的复合物存在,也可以作为单个RNA分子存在。以单个RNA分子形式存在的gRNA可称为单向导RNA(sgRNA),尽管“gRNA”可互换使用,指以单个分子或两个或多个分子的复合体形式存在的向导RNA。通常,作为单一RNA种类存在的gRNA包含两个结构域:(1)与靶核酸具有同源性的结构域(例如,向导Cas9复合物与靶标的结合);(2)结合Cas9蛋白的结构域。在一些实施方案中,结构域(2)相应于称为tracrRNA的序列,以及包含茎环结构。例如,在一些实施方案中,结构域(2)与Jinek等人,Science 337:816-821(2012)中提供的tracrRNA相同或同源,其全部内容通过引用并入本文。gRNA的其他实例(例如,包含结构域2的那些)可以在2013年9月6日提交的名称为“Switchable Cas9 Nucleases and Uses Thereof”的美国临时专利申请号61/874,682和2013年9月6日提交的名称为“Delivery System ForFunctional Nucleases”的美国临时专利申请号61/874,746,每一个的全部内容通过引用整体并入本文。在一些实施方案中,gRNA包含结构域(1)和(2)中的两个或更多个,以及可以被称为“扩展的gRNA”。例如,如本文所述,扩展的gRNA将例如结合两个或更多个Cas9蛋白并在两个或更多个不同区域结合靶核酸。gRNA包含与靶位点互补的核苷酸序列,其介导核酸酶/RNA复合物与所述靶位点的结合,提供核酸酶:RNA复合物的序列特异性。在一些实施方案中,RNA可编程核酸酶是(CRIS PR相关系统)Cas9核酸内切酶,例如来自化脓性链球菌的Cas9(Csnl)(参见例如“化脓性链球菌的M1菌株的完整基因组序列”。“Ferretti J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,Chylinski K.,SharmaCM.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011)。
“特异性结合”是指核酸分子、多肽或其复合物(例如,核酸可编程DNA结合蛋白、向导核酸和嵌合抗原受体),但其基本上不识别和结合样品中的其他分子,例如生物样品。例如,嵌合抗原受体与细胞表面表达的特定标志物特异性结合,但不与细胞表面上的其他多肽、碳水化合物、脂质或任何其他化合物结合。
用于本发明方法的核酸分子包括编码本发明多肽或其片段的任何核酸分子。这样的核酸分子不需要与内源核酸序列100%相同,但通常会表现出基本的同一性。与内源序列具有“基本同一性”的多核苷酸通常能够与双链核酸分子的至少一条链杂交。用于本发明方法的核酸分子包括编码本发明多肽或其片段的任何核酸分子。这样的核酸分子不需要与内源核酸序列100%相同,但通常会表现出基本的同一性。与内源序列具有“基本同一性”的多核苷酸通常能够与双链核酸分子的至少一条链杂交。“杂交”是指在各种严格条件下,在互补多核苷酸序列(例如,本文所述的基因)或其部分之间配对以形成双链分子。(参见,例如,Wahl,G.M.和S.L.Berger(1987)Methods Enzymol.152:399;Kimmel,A.R.(1987)MethodsEnzymol.152:507)。
例如,严格的盐浓度通常低于约750mM NaCl和75mM柠檬酸三钠,优选低于约500mMNaCl和50mM柠檬酸三钠,更优选低于约250mM NaCl和25mM三钠柠檬酸盐。可以在不存在有机溶剂例如甲酰胺的情况下获得低严格杂交,而可以在存在至少约35%甲酰胺,更优选至少约50%甲酰胺的情况下获得高严格杂交。严格的温度条件通常包括至少约30℃,更优选至少约37℃,最优选至少约42℃的温度。改变附加参数,例如杂交时间、去污剂浓度、例如,十二烷基硫酸钠(SDS),以及载体DNA的包含或排除,是本领域技术人员众所周知的。通过根据需要组合这些不同的条件来实现不同程度的严格性。在一个实施方案中,杂交将在30℃下在750mM氯化钠、75mM柠檬酸三钠和1%SDS中发生。在另一个实施方案中,杂交将在37℃下在500mM氯化钠、50mM柠檬酸三钠、1%SDS、35%甲酰胺和100μg/ml变性鲑鱼精子DNA(ssDNA)中发生。在另一个实施方案中,杂交将在42℃下在250mM氯化钠、25mM柠檬酸三钠、1%SDS、50%甲酰胺和200μg/ml ssDNA中发生。这些条件的有用变化对本领域技术人员来说是显而易见的。
对于大多数应用,杂交后的洗涤步骤在严格性方面也会有所不同。洗涤严格条件可以通过盐浓度和温度来定义。如上所述,可以通过降低盐浓度或提高温度来增加洗涤严格性。例如,洗涤步骤的严格盐浓度优选小于约30mM氯化钠和3mM柠檬酸三钠,最优选小于约15mM氯化钠和1.5mM柠檬酸三钠。洗涤步骤的严格温度条件通常包括至少约25℃,更优选至少约42℃,甚至更优选至少约68℃的温度。在一个实施方案中,将发生洗涤步骤在25℃下,在30mM氯化钠、3mM柠檬酸三钠和0.1%SDS中。在更优选的实施方案中,洗涤步骤将在42℃下在15mM氯化钠、1.5mM柠檬酸三钠和0.1%SDS中进行。在更优选的实施方案中,洗涤步骤将在68℃下在15mM氯化钠、1.5mM柠檬酸三钠和0.1%SDS中进行。这些条件的其他变化对本领域技术人员来说是显而易见的。杂交技术是本领域技术人员众所周知的,以及描述于例如Benton和Davis(Science 196:180,1977);Grunstein和Hogness(Proc.Natl.Acad.Sci.,USA 72:3961,1975);Ausubel等人。(Current Protocols inMolecular Biology,Wiley Interscience,New York,2001);Berger和Kimmel(Guide toMolecular Cloning Techniques,1987,Academic Press,New York);和Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,NewYork。
“个体”是指哺乳动物,包括但不限于人类或非人类哺乳动物,例如牛、马、犬、绵羊或猫。个体包括家畜、饲养以生产劳动力和提供商品如食物的驯养动物,包括但不限于牛、山羊、鸡、马、猪、兔和绵羊。
“基本上相同”是指多肽或核酸分子与参考氨基酸序列(例如,本文所述的任一氨基酸序列)或核酸序列(例如,本文所述的任何一种核酸序列)。在一个实施方案中,这样的序列与用于比较的序列在氨基酸水平或核酸有至少60%、80%或85%、90%、95%或甚至99%相同。
通常使用序列分析软件(例如,威斯康星大学生物技术中心遗传学计算机组的序列分析软件包,1710University Avenue,Madison,Wis.53705,BLAST、BESTFIT、GAP或PILEUP/PRETTYBOX程序)。此类软件通过为各种替换、缺失和/或其他修饰指定同源性程度来匹配相同或相似的序列。保守取代通常包括以下组内的取代:甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;和苯丙氨酸、酪氨酸。在确定同一性程度的示例性方法中,可以使用BLAST程序,其中e-3和e-100之间的概率分数表示密切相关的序列。
因为RNA可编程核酸酶(例如,Cas9)使用RNA:DNA杂交来靶向DNA切割位点,这些蛋白质原则上可以靶向由向导RNA指定的任何序列。使用RNA可编程核酸酶例如Cas9进行位点特异性切割(例如,修饰基因组)的方法是本领域已知的(参见例如Cong,L.等人,Multiplexgenome engineering using CRISPR/Cas systems.Science 339,819-823(2013);Mali,P.等人,RNA-guided human genome engineering via Cas9.Science 339,823-826(2013);Hwang,WY等人,Efficient genome editing in zebrafish using a CRISPR-Cassystem.Nature biotechnology 31,227-229(2013);Jinek,M.等人,RNA-programmedgenome editing in human cells.eLife 2,e00471(2013);Dicarlo,JE等人,Genomeengineering in Saccharomyces cerevisiae using CRISPR-Cas systems.NucleicAcids research(2013);Jiang,W.et ah RNA-guided editing of bacterial genomesusing CRISPR-Cas systems.Nature biotechnology 31,233-239(2013);每个的全部内容以引用方式并入本文)。
“tet甲基胞嘧啶双加氧酶2(TET2)多肽”是指与NCBI登录号FM992369.1或其片段具有至少约85%的氨基酸序列同一性以及具有将甲基胞嘧啶转化为5-羟甲基胞嘧啶。所述基因的缺陷与骨髓增殖性疾病有关,所述酶甲基化胞嘧啶的能力有助于转录调节。下面提供了示例性的TET2氨基酸序列。
>CAX30492.1 tet癌基因家族成员2[智人]
MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSYYGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANGERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSIAVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADDADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNLQAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPSEGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERPQNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEILKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQMTSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQVHFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQHKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTKVEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHLVSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYKNRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQEQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQQKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPALEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSYSASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPGLLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRLPPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKMLPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAKMAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTTDSTVTTSPYAFTRVTGPYNRYI
“tet甲基胞嘧啶双加氧酶2(TET2)多核苷酸”是指编码TET2多肽的核酸分子。TETs多肽编码甲基胞嘧啶双加氧酶并具有转录调节活性。示例性的TET2核酸在下面呈现。
>FM992369.1 tet癌基因家族成员2(TET2基因)的智人mRNA
CCGTGCCATCCCAACCTCCCACCTCGCCCCCAACCTTCGCGCTTGCTCTGCTTCTTCTCCCAGGGGTGGAGACCCGCCGAGGTCCCCGGGGTTCCCGAGGGCTGCACCCTTCCCCGCGCTCGCCAGCCCTGGCCCCTACTCCGCGCTGGTCCGGGCGCACCACTCCCCCCGCGCCACTGCACGGCGTGAGGGCAGCCCAGGTCTCCACTGCGCGCCCCGCTGTACGGCCCCAGGTGCCGCCGGCCTTTGTGCTGGACGCCCGGTGCGGGGGGCTAATTCCCTGGGAGCCGGGGCTGAGGGCCCCAGGGCGGCGGCGCAGGCCGGGGCGGAGCGGGAGGAGGCCGGGGCGGAGCAGGAGGAGGCCCGGGCGGAGGAGGAGAGCCGGCGGTAGCGGCAGTGGCAGCGGCGAGAGCTTGGGCGGCCGCCGCCGCCTCCTCGCGAGCGCCGCGCGCCCGGGTCCCGCTCGCATGCAAGTCACGTCCGCCCCCTCGGCGCGGCCGCCCCGAGACGCCGGCCCCGCTGAGTGATGAGAACAGACGTCAAACTGCCTTATGAATATTGATGCGGAGGCTAGGCTGCTTTCGTAGAGAAGCAGAAGGAAGCAAGATGGCTGCCCTTTAGGATTTGTTAGAAAGGAGACCCGACTGCAACTGCTGGATTGCTGCAAGGCTGAGGGACGAGAACGAGGCTGGCAAACATTCAGCAGCACACCCTCTCAAGATTGTTTACTTGCCTTTGCTCCTGTTGAGTTACAACGCTTGGAAGCAGGAGATGGGCTCAGCAGCAGCCAATAGGACATGATCCAGGAAGAGCAAATTCAACTAGAGGGCAGCCTTGTGGATGGCCCCGAAGCAAGCCTGATGGAACAGGATAGAACCAACCATGTTGAGGGCAACAGACTAAGTCCATTCCTGATACCATCACCTCCCATTTGCCAGACAGAACCTCTGGCTACAAAGCTCCAGAATGGAAGCCCACTGCCTGAGAGAGCTCATCCAGAAGTAAATGGAGACACCAAGTGGCACTCTTTCAAAAGTTATTATGGAATACCCTGTATGAAGGGAAGCCAGAATAGTCGTGTGAGTCCTGACTTTACACAAGAAAGTAGAGGGTATTCCAAGTGTTTGCAAAATGGAGGAATAAAACGCACAGTTAGTGAACCTTCTCTCTCTGGGCTCCTTCAGATCAAGAAATTGAAACAAGACCAAAAGGCTAATGGAGAAAGACGTAACTTCGGGGTAAGCCAAGAAAGAAATCCAGGTGAAAGCAGTCAACCAAATGTCTCCGATTTGAGTGATAAGAAAGAATCTGTGAGTTCTGTAGCCCAAGAAAATGCAGTTAAAGATTTCACCAGTTTTTCAACACATAACTGCAGTGGGCCTGAAAATCCAGAGCTTCAGATTCTGAATGAGCAGGAGGGGAAAAGTGCTAATTACCATGACAAGAACATTGTATTACTTAAAAACAAGGCAGTGCTAATGCCTAATGGTGCTACAGTTTCTGCCTCTTCCGTGGAACACACACATGGTGAACTCCTGGAAAAAACACTGTCTCAATATTATCCAGATTGTGTTTCCATTGCGGTGCAGAAAACCACATCTCACATAAATGCCATTAACAGTCAGGCTACTAATGAGTTGTCCTGTGAGATCACTCACCCATCGCATACCTCAGGGCAGATCAATTCCGCACAGACCTCTAACTCTGAGCTGCCTCCAAAGCCAGCTGCAGTGGTGAGTGAGGCCTGTGATGCTGATGATGCTGATAATGCCAGTAAACTAGCTGCAATGCTAAATACCTGTTCCTTTCAGAAACCAGAACAACTACAACAACAAAAATCAGTTTTTGAGATATGCCCATCTCCTGCAGAAAATAACATCCAGGGAACCACAAAGCTAGCGTCTGGTGAAGAATTCTGTTCAGGTTCCAGCAGCAATTTGCAAGCTCCTGGTGGCAGCTCTGAACGGTATTTAAAACAAAATGAAATGAATGGTGCTTACTTCAAGCAAAGCTCAGTGTTCACTAAGGATTCCTTTTCTGCCACTACCACACCACCACCACCATCACAATTGCTTCTTTCTCCCCCTCCTCCTCTTCCACAGGTTCCTCAGCTTCCTTCAGAAGGAAAAAGCACTCTGAATGGTGGAGTTTTAGAAGAACACCACCACTACCCCAACCAAAGTAACACAACACTTTTAAGGGAAGTGAAAATAGAGGGTAAACCTGAGGCACCACCTTCCCAGAGTCCTAATCCATCTACACATGTATGCAGCCCTTCTCCGATGCTTTCTGAAAGGCCTCAGAATAATTGTGTGAACAGGAATGACATACAGACTGCAGGGACAATGACTGTTCCATTGTGTTCTGAGAAAACAAGACCAATGTCAGAACACCTCAAGCATAACCCACCAATTTTTGGTAGCAGTGGAGAGCTACAGGACAACTGCCAGCAGTTGATGAGAAACAAAGAGCAAGAGATTCTGAAGGGTCGAGACAAGGAGCAAACACGAGATCTTGTGCCCCCAACACAGCACTATCTGAAACCAGGATGGATTGAATTGAAGGCCCCTCGTTTTCACCAAGCGGAATCCCATCTAAAACGTAATGAGGCATCACTGCCATCAATTCTTCAGTATCAACCCAATCTCTCCAATCAAATGACCTCCAAACAATACACTGGAAATTCCAACATGCCTGGGGGGCTCCCAAGGCAAGCTTACACCCAGAAAACAACACAGCTGGAGCACAAGTCACAAATGTACCAAGTTGAAATGAATCAAGGGCAGTCCCAAGGTACAGTGGACCAACATCTCCAGTTCCAAAAACCCTCACACCAGGTGCACTTCTCCAAAACAGACCATTTACCAAAAGCTCATGTGCAGTCACTGTGTGGCACTAGATTTCATTTTCAACAAAGAGCAGATTCCCAAACTGAAAAACTTATGTCCCCAGTGTTGAAACAGCACTTGAATCAACAGGCTTCAGAGACTGAGCCATTTTCAAACTCACACCTTTTGCAACATAAGCCTCATAAACAGGCAGCACAAACACAACCATCCCAGAGTTCACATCTCCCTCAAAACCAGCAACAGCAGCAAAAATTACAAATAAAGAATAAAGAGGAAATACTCCAGACTTTTCCTCACCCCCAAAGCAACAATGATCAGCAAAGAGAAGGATCATTCTTTGGCCAGACTAAAGTGGAAGAATGTTTTCATGGTGAAAATCAGTATTCAAAATCAAGCGAGTTCGAGACTCATAATGTCCAAATGGGACTGGAGGAAGTACAGAATATAAATCGTAGAAATTCCCCTTATAGTCAGACCATGAAATCAAGTGCATGCAAAATACAGGTTTCTTGTTCAAACAATACACACCTAGTTTCAGAGAATAAAGAACAGACTACACATCCTGAACTTTTTGCAGGAAACAAGACCCAAAACTTGCATCACATGCAATATTTTCCAAATAATGTGATCCCAAAGCAAGATCTTCTTCACAGGTGCTTTCAAGAACAGGAGCAGAAGTCACAACAAGCTTCAGTTCTACAGGGATATAAAAATAGAAACCAAGATATGTCTGGTCAACAAGCTGCGCAACTTGCTCAGCAAAGGTACTTGATACATAACCATGCAAATGTTTTTCCTGTGCCTGACCAGGGAGGAAGTCACACTCAGACCCCTCCCCAGAAGGACACTCAAAAGCATGCTGCTCTAAGGTGGCATCTCTTACAGAAGCAAGAACAGCAGCAAACACAGCAACCCCAAACTGAGTCTTGCCATAGTCAGATGCACAGGCCAATTAAGGTGGAACCTGGATGCAAGCCACATGCCTGTATGCACACAGCACCACCAGAAAACAAAACATGGAAAAAGGTAACTAAGCAAGAGAATCCACCTGCAAGCTGTGATAATGTGCAGCAAAAGAGCATCATTGAGACCATGGAGCAGCATCTGAAGCAGTTTCACGCCAAGTCGTTATTTGACCATAAGGCTCTTACTCTCAAATCACAGAAGCAAGTAAAAGTTGAAATGTCAGGGCCAGTCACAGTTTTGACTAGACAAACCACTGCTGCAGAACTTGATAGCCACACCCCAGCTTTAGAGCAGCAAACAACTTCTTCAGAAAAGACACCAACCAAAAGAACAGCTGCTTCTGTTCTCAATAATTTTATAGAGTCACCTTCCAAATTACTAGATACTCCTATAAAAAATTTATTGGATACACCTGTCAAGACTCAATATGATTTCCCATCTTGCAGATGTGTAGAGCAAATTATTGAAAAAGATGAAGGTCCTTTTTATACCCATCTAGGAGCAGGTCCTAATGTGGCAGCTATTAGAGAAATCATGGAAGAAAGGTTTGGACAGAAGGGTAAAGCTATTAGGATTGAAAGAGTCATCTATACTGGTAAAGAAGGCAAAAGTTCTCAGGGATGTCCTATTGCTAAGTGGGTGGTTCGCAGAAGCAGCAGTGAAGAGAAGCTACTGTGTTTGGTGCGGGAGCGAGCTGGCCACACCTGTGAGGCTGCAGTGATTGTGATTCTCATCCTGGTGTGGGAAGGAATCCCGCTGTCTCTGGCTGACAAACTCTACTCGGAGCTTACCGAGACGCTGAGGAAATACGGCACGCTCACCAATCGCCGGTGTGCCTTGAATGAAGAGAGAACTTGCGCCTGTCAGGGGCTGGATCCAGAAACCTGTGGTGCCTCCTTCTCTTTTGGTTGTTCATGGAGCATGTACTACAATGGATGTAAGTTTGCCAGAAGCAAGATCCCAAGGAAGTTTAAGCTGCTTGGGGATGACCCAAAAGAGGAAGAGAAACTGGAGTCTCATTTGCAAAACCTGTCCACTCTTATGGCACCAACATATAAGAAACTTGCACCTGATGCATATAATAATCAGATTGAATATGAACACAGAGCACCAGAGTGCCGTCTGGGTCTGAAGGAAGGCCGTCCATTCTCAGGGGTCACTGCATGTTTGGACTTCTGTGCTCATGCCCACAGAGACTTGCACAACATGCAGAATGGCAGCACATTGGTATGCACTCTCACTAGAGAAGACAATCGAGAATTTGGAGGAAAACCTGAGGATGAGCAGCTTCACGTTCTGCCTTTATACAAAGTCTCTGACGTGGATGAGTTTGGGAGTGTGGAAGCTCAGGAGGAGAAAAAACGGAGTGGTGCCATTCAGGTACTGAGTTCTTTTCGGCGAAAAGTCAGGATGTTAGCAGAGCCAGTCAAGACTTGCCGACAAAGGAAACTAGAAGCCAAGAAAGCTGCAGCTGAAAAGCTTTCCTCCCTGGAGAACAGCTCAAATAAAAATGAAAAGGAAAAGTCAGCCCCATCACGTACAAAACAAACTGAAAACGCAAGCCAGGCTAAACAGTTGGCAGAACTTTTGCGACTTTCAGGACCAGTCATGCAGCAGTCCCAGCAGCCCCAGCCTCTACAGAAGCAGCCACCACAGCCCCAGCAGCAGCAGAGACCCCAGCAGCAGCAGCCACATCACCCTCAGACAGAGTCTGTCAACTCTTATTCTGCTTCTGGATCCACCAATCCATACATGAGACGGCCCAATCCAGTTAGTCCTTATCCAAACTCTTCACACACTTCAGATATCTATGGAAGCACCAGCCCTATGAACTTCTATTCCACCTCATCTCAAGCTGCAGGTTCATATTTGAATTCTTCTAATCCCATGAACCCTTACCCTGGGCTTTTGAATCAGAATACCCAATATCCATCATATCAATGCAATGGAAACCTATCAGTGGACAACTGCTCCCCATATCTGGGTTCCTATTCTCCCCAGTCTCAGCCGATGGATCTGTATAGGTATCCAAGCCAAGACCCTCTGTCTAAGCTCAGTCTACCACCCATCCATACACTTTACCAGCCAAGGTTTGGAAATAGCCAGAGTTTTACATCTAAATACTTAGGTTATGGAAACCAAAATATGCAGGGAGATGGTTTCAGCAGTTGTACCATTAGACCAAATGTACATCATGTAGGGAAATTGCCTCCTTATCCCACTCATGAGATGGATGGCCACTTCATGGGAGCCACCTCTAGATTACCACCCAATCTGAGCAATCCAAACATGGACTATAAAAATGGTGAACATCATTCACCTTCTCACATAATCCATAACTACAGTGCAGCTCCGGGCATGTTCAACAGCTCTCTTCATGCCCTGCATCTCCAAAACAAGGAGAATGACATGCTTTCCCACACAGCTAATGGGTTATCAAAGATGCTTCCAGCTCTTAACCATGATAGAACTGCTTGTGTCCAAGGAGGCTTACACAAATTAAGTGATGCTAATGGTCAGGAAAAGCAGCCATTGGCACTAGTCCAGGGTGTGGCTTCTGGTGCAGAGGACAACGATGAGGTCTGGTCAGACAGCGAGCAGAGCTTTCTGGATCCTGACATTGGGGGAGTGGCCGTGGCTCCAACTCATGGGTCAATTCTCATTGAGTGTGCAAAGCGTGAGCTGCATGCCACAACCCCTTTAAAGAATCCCAATAGGAATCACCCCACCAGGATCTCCCTCGTCTTTTACCAGCATAAGAGCATGAATGAGCCAAAACATGGCTTGGCTCTTTGGGAAGCCAAAATGGCTGAAAAAGCCCGTGAGAAAGAGGAAGAGTGTGAAAAGTATGGCCCAGACTATGTGCCTCAGAAATCCCATGGCAAAAAAGTGAAACGGGAGCCTGCTGAGCCACATGAAACTTCAGAGCCCACTTACCTGCGTTTCATCAAGTCTCTTGCCGAAAGGACCATGTCCGTGACCACAGACTCCACAGTAACTACATCTCCATATGCCTTCACTCGGGTCACAGGGCCTTACAACAGATATATATGAAGATATATATGATATCACCCCCTTTTGTTGGTTACCTCACTTGAAAAGACCACAACCAACCTGTCAGTAGTATAGTTCTCATGACGTGGGCAGTGGGGAAAGGTCACAGTATTCATGACAAATGTGGTGGGAAAAACCTCAGCTCACCAGCAACAAAAGAGGTTATCTTACCATAGCACTTAATTTTCACTGGCTCCCAAGTGGTCACAGATGGCATCTAGGAAAAGACCAAAGCATTCTATGCAAAAAGAAGGTGGGGAAGAAAGTGTTCCGCAATTTACATTTTTAAACACTGGTTCTATTATTGGACGAGATGATATGTAAATGTGATCCCCCCCCCCCGCTTACAACTCTACACATCTGTGACCACTTTTAATAATATCAAGTTTGCATAGTCATGGAACACAAATCAAACAAGTACTGTAGTATTACAGTGACAGGAATCTTAAAATACCATCTGGTGCTGAATATATGATGTACTGAAATACTGGAATTATGGCTTTTTGAAATGCAGTTTTTACTGTAATCTTAACTTTTATTTATCAAAATAGCTACAGGAAACATGAATAGCAGGAAAACACTGAATTTGTTTGGATGTTCTAAGAAATGGTGCTAAGAAAATGGTGTCTTTAATAGCTAAAAATTTAATGCCTTTATATCATCAAGATGCTATCAGTGTACTCCAGTGCCCTTGAATAATAGGGGTACCTTTTCATTCAAGTTTTTATCATAATTACCTATTCTTACACAAGCTTAGTTTTTAAAATGTGGACATTTTAAAGGCCTCTGGATTTTGCTCATCCAGTGAAGTCCTTGTAGGACAATAAACGTATATATGTACATATATACACAAACATGTATATGTGCACACACATGTATATGTATAAATATTTTAAATGGTGTTTTAGAAGCACTTTGTCTACCTAAGCTTTGACAACTTGAACAATGCTAAGGTACTGAGATGTTTAAAAAACAAGTTTACTTTCATTTTAGAATGCAAAGTTGATTTTTTTAAGGAAACAAAGAAAGCTTTTAAAATATTTTTGCTTTTAGCCATGCATCTGCTGATGAGCAATTGTGTCCATTTTTAACACAGCCAGTTAAATCCACCATGGGGCTTACTGGATTCAAGGGAATACGTTAGTCCACAAAACATGTTTTCTGGTGCTCATCTCACATGCTATACTGTAAAACAGTTTTATACAAAATTGTATGACAAGTTCATTGCTCAAAAATGTACAGTTTTAAGAATTTTCTATTAACTGCAGGTAATAATTAGCTGCATGCTGCAGACTCAACAAAGCTAGTTCACTGAAGCCTATGCTATTTTATGGATCATAGGCTCTTCAGAGAACTGAATGGCAGTCTGCCTTTGTGTTGATAATTATGTACATTGTGACGTTGTCATTTCTTAGCTTAAGTGTCCTCTTTAACAAGAGGATTGAGCAGACTGATGCCTGCATAAGATGAATAAACAGGGTTAGTTCCATGTGAATCTGTCAGTTAAAAAGAAACAAAAACAGGCAGCTGGTTTGCTGTGGTGGTTTTAAATCATTAATTTGTATAAAGAAGTGAAAGAGTTGTATAGTAAATTAAATTGTAAACAAAACTTTTTTAATGCAATGCTTTAGTATTTTAGTACTGTAAAAAAATTAAATATATACATATATATATATATATATATATATATATATATGAGTTTGAAGCAGAATTCACATCATGATGGTGCTACTCAGCCTGCTACAAATATATCATAATGTGAGCTAAGAATTCATTAAATGTTTGAGTGATGTTCCTACTTGTCATATACCTCAACACTAGTTTGGCAATAGGATATTGAACTGAGAGTGAAAGCATTGTGTACCATCATTTTTTTCCAAGTCCTTTTTTTTATTGTTAAAAAAAAAAGCATACCTTTTTTCAATACTTGATTTCTTAGCAAGTATAACTTGAACTTCAACCTTTTTGTTCTAAAAATTCAGGGATATTTCAGCTCATGCTCTCCCTATGCCAACATGTCACCTGTGTTTATGTAAAATTGTTGTAGGTTAATAAATATATTCTTTGTCAGGGATTTAACCCTTTTATTTTGAATCCCTTCTATTTTACTTGTACATGTGCTGATGTAACTAAAACTAATTTTGTAAATCTGTTGGCTCTTTTTATTGTAAAGAAAAGCATTTTAAAAGTTTGAGGAATCTTTTGACTGTTTCAAGCAGGAAAAAAAAATTACATGAAAATAGAATGCACTGAGTTGATAAAGGGAAAAATTGTAAGGCAGGAGTTTGGCAAGTGGCTGTTGGCCAGAGACTTACTTGTAACTCTCTAAATGAAGTTTTTTTGATCCTGTAATCACTGAAGGTACATACTCCATGTGGACTTCCCTTAAACAGGCAAACACCTACAGGTATGGTGTGCAACAGATTGTACAATTACATTTTGGCCTAAATACATTTTTGCTTACTAGTATTTAAAATAAATTCTTAATCAGAGGAGGCCTTTGGGTTTTATTGGTCAAATCTTTGTAAGCTGGCTTTTGTCTTTTTAAAAAATTTCTTGAATTTGTGGTTGTGTCCAATTTGCAAACATTTCCAAAAATGTTTGCTTTGCTTACAAACCACATGATTTTAATGTTTTTTGTATACCATAATATCTAGCCCCAAACATTTGATTACTACATGTGCATTGGTGATTTTGATCATCCATTCTTAATATTTGATTTCTGTGTCACCTACTGTCATTTGTTAAACTGCTGGCCAACAAGAACAGGAAGTATAGTTTGGGGGGTTGGGGAGAGTTTACATAAGGAAGAGAAGAAATTGAGTGGCATATTGTAAATATCAGATCTATAATTGTAAATATAAAACCTGCCTCAGTTAGAATGAATGGAAAGCAGATCTACAATTTGCTAATATAGGAATATCAGGTTGACTATATAGCCATACTTGAAAATGCTTCTGAGTGGTGTCAACTTTACTTGAATGAATTTTTCATCTTGATTGACGCACAGTGATGTACAGTTCACTTCTGAAGCTAGTGGTTAACTTGTGTAGGAAACTTTTGCAGTTTGACACTAAGATAACTTCTGTGTGCATTTTTCTATGCTTTTTTAAAAACTAGTTTCATTTCATTTTCATGAGATGTTTGGTTTATAAGATCTGAGGATGGTTATAAATACTGTAAGTATTGTAATGTTATGAATGCAGGTTATTTGAAAGCTGTTTATTATTATATCATTCCTGATAATGCTATGTGAGTGTTTTTAATAAAATTTATATTTATTTAATGCACTCTAAGTGTTGTCTTCCT
“转化生长因子受体2(TGFBRII)多肽”是指与NCBI登录号ABG65632.1或其片段具有至少约85%序列同一性并具有免疫抑制活性的蛋白质。下面提供了示例性氨基酸序列。
>ABG65632.1转化生长因子β受体II[智人]
MGRGLLRGLWPLHIVLWTRIASTIPPHVQKSVNNDMIVTDNNGAVKFPQLCKFCDVRFSTCDNQKSCMSNCSITSICEKPQEVCVAVWRKNDENITLETVCHDPKLPYHDFILEDAASPKCIMKEKKKPGETFFMCSCSSDECNDNIIFSEEYNTSNPDLLLVIFQVTGISLLPPLGVAISVIIIFYCYRVNRQQKLSSTWETGKTRKLMEFSEHCAIILEDDRSDISSTCANNINHNTELLPIELDTLVGKGRFAEVYKAKLKQNTSEQFETVAVKIFPYEEYASWKTEKDIFSDINLKHENILQFLTAEERKTELGKQYWLITAFHAKGNLQEYLTRHVISWEDLRKLGSSLARGIAHLHSDHTPCGRPKMPIVHRDLKSSNILVKNDLTCCLCDFGLSLRLDPTLSVDDLANSGQVGTARYMAPEVLESRMNLENVESFKQTDVYSMALVLWEMTSRCNAVGEVKDYEPPFGSKVREHPCVESMKDNVLRDRGRPEIPSFWLNHQGIQMVCETLTECWDHDPEARLTAQCVAERFSELEHLDRLSGRSCSEEKIPEDGSLNTTK
“转化生长因子受体2(TGFBRII)多核苷酸”是指编码TGFBRII多肽的核酸。TGFBRII基因编码具有丝氨酸/苏氨酸激酶活性的跨膜蛋白。下面提供了示例性的TGFBRII核酸。
>M85079.1人TGF-βII型受体mRNA,完整cds
GTTGGCGAGGAGTTTCCTGTTTCCCCCGCAGCGCTGAGTTGAAGTTGAGTGAGTCACTCGCGCGCACGGAGCGACGACACCCCCGCGCGTGCACCCGCTCGGGACAGGAGCCGGACTCCTGTGCAGCTTCCCTCGGCCGCCGGGGGCCTCCCCGCGCCTCGCCGGCCTCCAGGCCCCTCCTGGCTGGCGAGCGGGCGCCACATCTGGCCCGCACATCTGCGCTGCCGGCCCGGCGCGGGGTCCGGAGAGGGCGCGGCGCGGAGCGCAGCCAGGGGTCCGGGAAGGCGCCGTCCGTGCGCTGGGGGCTCGGTCTATGACGAGCAGCGGGGTCTGCCATGGGTCGGGGGCTGCTCAGGGGCCTGTGGCCGCTGCACATCGTCCTGTGGACGCGTATCGCCAGCACGATCCCACCGCACGTTCAGAAGTCGGTTAATAACGACATGATAGTCACTGACAACAACGGTGCAGTCAAGTTTCCACAACTGTGTAAATTTTGTGATGTGAGATTTTCCACCTGTGACAACCAGAAATCCTGCATGAGCAACTGCAGCATCACCTCCATCTGTGAGAAGCCACAGGAAGTCTGTGTGGCTGTATGGAGAAAGAATGACGAGAACATAACACTAGAGACAGTTTGCCATGACCCCAAGCTCCCCTACCATGACTTTATTCTGGAAGATGCTGCTTCTCCAAAGTGCATTATGAAGGAAAAAAAAAAGCCTGGTGAGACTTTCTTCATGTGTTCCTGTAGCTCTGATGAGTGCAATGACAACATCATCTTCTCAGAAGAATATAACACCAGCAATCCTGACTTGTTGCTAGTCATATTTCAAGTGACAGGCATCAGCCTCCTGCCACCACTGGGAGTTGCCATATCTGTCATCATCATCTTCTACTGCTACCGCGTTAACCGGCAGCAGAAGCTGAGTTCAACCTGGGAAACCGGCAAGACGCGGAAGCTCATGGAGTTCAGCGAGCACTGTGCCATCATCCTGGAAGATGACCGCTCTGACATCAGCTCCACGTGTGCCAACAACATCAACCACAACACAGAGCTGCTGCCCATTGAGCTGGACACCCTGGTGGGGAAAGGTCGCTTTGCTGAGGTCTATAAGGCCAAGCTGAAGCAGAACACTTCAGAGCAGTTTGAGACAGTGGCAGTCAAGATCTTTCCCTATGAGGAGTATGCCTCTTGGAAGACAGAGAAGGACATCTTCTCAGACATCAATCTGAAGCATGAGAACATACTCCAGTTCCTGACGGCTGAGGAGCGGAAGACGGAGTTGGGGAAACAATACTGGCTGATCACCGCCTTCCACGCCAAGGGCAACCTACAGGAGTACCTGACGCGGCATGTCATCAGCTGGGAGGACCTGCGCAAGCTGGGCAGCTCCCTCGCCCGGGGGATTGCTCACCTCCACAGTGATCACACTCCATGTGGGAGGCCCAAGATGCCCATCGTGCACAGGGACCTCAAGAGCTCCAATATCCTCGTGAAGAACGACCTAACCTGCTGCCTGTGTGACTTTGGGCTTTCCCTGCGTCTGGACCCTACTCTGTCTGTGGATGACCTGGCTAACAGTGGGCAGGTGGGAACTGCAAGATACATGGCTCCAGAAGTCCTAGAATCCAGGATGAATTTGGAGAATGCTGAGTCCTTCAAGCAGACCGATGTCTACTCCATGGCTCTGGTGCTCTGGGAAATGACATCTCGCTGTAATGCAGTGGGAGAAGTAAAAGATTATGAGCCTCCATTTGGTTCCAAGGTGCGGGAGCACCCCTGTGTCGAAAGCATGAAGGACAACGTGTTGAGAGATCGAGGGCGACCAGAAATTCCCAGCTTCTGGCTCAACCACCAGGGCATCCAGATGGTGTGTGAGACGTTGACTGAGTGCTGGGACCACGACCCAGAGGCCCGTCTCACAGCCCAGTGTGTGGCAGAACGCTTCAGTGAGCTGGAGCATCTGGACAGGCTCTCGGGGAGGAGCTGCTCGGAGGAGAAGATTCCTGAAGACGGCTCCCTAAACACTACCAAATAGCTCTTATGGGGCAGGCTGGGCATGTCCAAAGAGGCTGCCCCTCTCACCAAA
“具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)多肽”是指与NCBI登录号ACD74757.1或其片段具有至少约85%序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性的TIGIT氨基酸序列。
>ACD74757.1具有Ig和ITIM结构域的T细胞免疫受体[智人]
MRWCLLLIWAQGLRQAPLASGMMTGTIETTGNISAEKGGSIILQCHLSSTTAQVTQVNWEQQDQLLAICNADLGWHISPSFKDRVAPGPGLGLTLQSLTVNDTGEYFCIYHTYPDGTYTGRIFLEVLESSVAEHGARFQIPLLGAMAATLVVICTAVIVVVALTRKKKALRIHSVEGDLRRKSAGQEEWSPSAPSPPGSCVQAEAAPAGLCGEQRGEDCAELHDYFNVLSYRSLGNCSFFTETG
“具有Ig和ITIM结构域(TIGIT)多核苷酸的T细胞免疫受体”是指编码TIGIT多肽的核酸。TIGIT基因编码与肿瘤和T细胞耗竭相关的抑制性免疫受体。下面提供了示例性核酸序列。
>EU675310.1具有Ig和ITIM结构域(TIGIT)mRNA的智人T细胞免疫受体,完整的cds
CGTCCTATCTGCAGTCGGCTACTTTCAGTGGCAGAAGAGGCCACATCTGCTTCCTGTAGGCCCTCTGGGCAGAAGCATGCGCTGGTGTCTCCTCCTGATCTGGGCCCAGGGGCTGAGGCAGGCTCCCCTCGCCTCAGGAATGATGACAGGCACAATAGAAACAACGGGGAACATTTCTGCAGAGAAAGGTGGCTCTATCATCTTACAATGTCACCTCTCCTCCACCACGGCACAAGTGACCCAGGTCAACTGGGAGCAGCAGGACCAGCTTCTGGCCATTTGTAATGCTGACTTGGGGTGGCACATCTCCCCATCCTTCAAGGATCGAGTGGCCCCAGGTCCCGGCCTGGGCCTCACCCTCCAGTCGCTGACCGTGAACGATACAGGGGAGTACTTCTGCATCTATCACACCTACCCTGATGGGACGTACACTGGGAGAATCTTCCTGGAGGTCCTAGAAAGCTCAGTGGCTGAGCACGGTGCCAGGTTCCAGATTCCATTGCTTGGAGCCATGGCCGCGACGCTGGTGGTCATCTGCACAGCAGTCATCGTGGTGGTCGCGTTGACTAGAAAGAAGAAAGCCCTCAGAATCCATTCTGTGGAAGGTGACCTCAGGAGAAAATCAGCTGGACAGGAGGAATGGAGCCCCAGTGCTCCCTCACCCCCAGGAAGCTGTGTCCAGGCAGAAGCTGCACCTGCTGGGCTCTGTGGAGAGCAGCGGGGAGAGGACTGTGCCGAGCTGCATGACTACTTCAATGTCCTGAGTTACAGAAGCCTGGGTAACTGCAGCTTCTTCACAGAGACTGGTTAGCAACCAGAGGCATCTTCTGG
“T细胞受体α常数(TRAC)多肽”是指与NCBI登录号P01848.2或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
>sp|P01848.2|TRAC_人类RecName:完整=T细胞受体α常数
IQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKTVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSCDVKLVEKSFETDTNLNFQNLSVIGFRILLLKVAGFNLLMTLRLWSS
“T细胞受体α常数(TRAC)多核苷酸”是指编码TRAC多肽的核酸。下面提供了示例性的TRAC核酸序列。
UCSC人类基因组数据库,基因ENSG00000277734.8人类T细胞受体α链(TCR-α)
catgctaatcctccggcaaacctctgtttcctcctcaaaaggcaggaggtcggaaagaataaacaatgagagtcacattaaaaacacaaaatcctacggaaatactgaagaatgagtctcagcactaaggaaaagcctccagcagctcctgctttctgagggtgaaggatagacgctgtggctctgcatgactcactagcactctatcacggccatattctggcagggtcagtggctccaactaacatttgtttggtactttacagtttattaaatagatgtttatatggagaagctctcatttctttctcagaagagcctggctaggaaggtggatgaggcaccatattcattttgcaggtgaaattcctgagatgtaaggagctgctgtgacttgctcaaggccttatatcgagtaaacggtagtgctggggcttagacgcaggtgttctgatttatagttcaaaacctctatcaatgagagagcaatctcctggtaatgtgatagatttcccaacttaatgccaacataccataaacctcccattctgctaatgcccagcctaagttggggagaccactccagattccaagatgtacagtttgctttgctgggcctttttcccatgcctgcctttactctgccagagttatattgctggggttttgaagaagatcctattaaataaaagaataagcagtattattaagtagccctgcatttcaggtttccttgagtggcaggccaggcctggccgtgaacgttcactgaaatcatggcctcttggccaagattgatagcttgtgcctgtccctgagtcccagtccatcacgagcagctggtttctaagatgctatttcccgtataaagcatgagaccgtgacttgccagccccacagagccccgcccttgtccatcactggcatctggactccagcctgggttggggcaaagagggaaatgagatcatgtcctaaccctgatcctcttgtcccacagATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGgtaagggcagctttggtgccttcgcaggctgtttccttgcttcaggaatggccaggttctgcccagagctctggtcaatgatgtctaaaactcctctgattggtggtctcggccttatccattgccaccaaaaccctctttttactaagaaacagtgagccttgttctggcagtccagagaatgacacgggaaaaaagcagatgaagagaaggtggcaggagagggcacgtggcccagcctcagtctctccaactgagttcctgcctgcctgcctttgctcagactgtttgccccttactgctcttctaggcctcattctaagccccttctccaagttgcctctccttatttctccctgtctgccaaaaaatctttcccagctcactaagtcagtctcacgcagtcactcattaacccaccaatcactgattgtgccggcacatgaatgcaccaggtgttgaagtggaggaattaaaaagtcagatgaggggtgtgcccagaggaagcaccattctagttgggggagcccatctgtcagctgggaaaagtccaaataacttcagattggaatgtgttttaactcagggttgagaaaacagctaccttcaggacaaaagtcagggaagggctctctgaagaaatgctacttgaagataccagccctaccaagggcagggagaggaccctatagaggcctgggacaggagctcaatgagaaaggagaagagcagcaggcatgagttgaatgaaggaggcagggccgggtcacagggccttctaggccatgagagggtagacagtattctaaggacgccagaaagctgttgatcggcttcaagcaggggagggacacctaatttgcttttcttttttttttttttttttttttttttttttgagatggagttttgctcttgttgcccaggctggagtgcaatggtgcatcttggctcactgcaacctccgcctcccaggttcaagtgattctcctgcctcagcctcccgagtagctgagattacaggcacccgccaccatgcctggctaattttttgtatttttagtagagacagggtttcactatgttggccaggctggtctcgaactcctgacctcaggtgatccacccgcttcagcctcccaaagtgctgggattacaggcgtgagccaccacacccggcctgcttttcttaaagatcaatctgagtgctgtacggagagtgggttgtaagccaagagtagaagcagaaagggagcagttgcagcagagagatgatggaggcctgggcagggtggtggcagggaggtaaccaacaccattcaggtttcaaaggtagaaccatgcagggatgagaaagcaaagaggggatcaaggaaggcagctggattttggcctgagcagctgagtcaatgatagtgccgtttactaagaagaaaccaaggaaaaaatttggggtgcagggatcaaaactttttggaacatatgaaagtacgtgtttatactctttatggcccttgtcactatgtatgcctcgctgcctccattggactctagaatgaagccaggcaagagcagggtctatgtgtgatggcacatgtggccagggtcatgcaacatgtactttgtacaaacagtgtatattgagtaaatagaaatggtgtccaggagccgaggtatcggtcctgccagggccaggggctctccctagcaggtgctcatatgctgtaagttccctccagatctctccacaaggaggcatggaaaggctgtagttgttcacctgcccaagaactaggaggtctggggtgggagagtcagcctgctctggatgctgaaagaatgtctgtttttccttttagAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGgtaagacaggggtctagcctgggtttgcacaggattgcggaagtgatgaacccgcaataaccctgcctggatgagggagtgggaagaaattagtagatgtgggaatgaatgatgaggaatggaaacagcggttcaagacctgcccagagctgggtggggtctctcctgaatccctctcaccatctctgactttccattctaagcactttgaggatgagtttctagcttcaatagaccaaggactctctcctaggcctctgtattcctttcaacagctccactgtcaagagagccagagagagcttctgggtggcccagctgtgaaatttctgagtcccttagggatagccctaaacgaaccagatcatcctgaggacagccaagaggttttgccttctttcaagacaagcaacagtactcacataggctgtgggcaatggtcctgtctctcaagaatcccctgccactcctcacacccaccctgggcccatattcatttccatttgagttgttcttattgagtcatccttcctgtggtagcggaactcactaaggggcccatctggacccgaggtattgtgatgataaattctgagcacctaccccatccccagaagggctcagaaataaaataagagccaagtctagtcggtgtttcctgtcttgaaacacaatactgttggccctggaagaatgcacagaatctgtttgtaaggggatatgcacagaagctgcaagggacaggaggtgcaggagctgcaggcctcccccacccagcctgctctgccttggggaaaaccgtgggtgtgtcctgcaggccatgcaggcctgggacatgcaagcccataaccgctgtggcctcttggttttacagATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGgtgaggggccttgaagctgggagtggggtttagggacgcgggtctctgggtgcatcctaagctctgagagcaaacctccctgcagggtcttgcttttaagtccaaagcctgagcccaccaaactctcctacttcttcctgttacaaattcctcttgtgcaataataatggcctgaaacgctgtaaaatatcctcatttcagccgcctcagttgcacttctcccctatgaggtaggaagaacagttgtttagaaacgaagaaactgaggccccacagctaatgagtggaggaagagagacacttgtgtacaccacatgccttgtgttgtacttctctcaccgtgtaacctcctcatgtcctctctccccagtacggctctcttagctcagtagaaagaagacattacactcatattacaccccaatcctggctagagtctccgcaccctcctcccccagggtccccagtcgtcttgctgacaactgcatcctgttccatcaccatcaaaaaaaaactccaggctgggtgcgggggctcacacctgtaatcccagcactttgggaggcagaggcaggaggagcacaggagctggagaccagcctgggcaacacagggagaccccgcctctacaaaaagtgaaaaaattaaccaggtgtggtgctgcacacctgtagtcccagctacttaagaggctgagatgggaggatcgcttgagccctggaatgttgaggctacaatgagctgtgattgcgtcactgcactccagcctggaagacaaagcaagatcctgtctcaaataataaaaaaaataagaactccagggtacatttgctcctagaactctaccacatagccccaaacagagccatcaccatcacatccctaacagtcctgggtcttcctcagtgtccagcctgacttctgttcttcctcattccagATCTGCAAGATTGTAAGACAGCCTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGCAATGCCACCAACTGGATCCTACCCGAATTTATGATTAAGATTGCTGAAGAGCTGCCAAACACTGCTGCCACCCCCTCTGTTCCCTTATTGCTGCTTGTCACTGCCTGACATTCACGGCAGAGGCAAGGCTGCTGCAGCCTCCCCTGGCTGTGCACATTCCCTCCTGCTCCCCAGAGACTGCCTCCGCCATCCCACAGATGATGGATCTTCAGTGGGTTCTCTTGGGCTCTAGGTCCTGCAGAATGTTGTGAGGGGTTTATTTTTTTTTAATAGTGTTCATAAAGAAATACATAGTATTCTTCTTCTCAAGACGTGGGGGGAAATTATCTCATTATCGAGGCCCTGCTATGCTGTGTATCTGGGCGTGTTGTATGTCCTGCTGCCGATGCCTTCATTAAAATGATTTGGAAGAGCAGA
以上小写的核苷酸是非翻译区或内含子,大写的核苷酸是外显子。
>X02592.1 T细胞受体α链(TCR-α)的人类mRNA
TTTTGAAACCCTTCAAAGGCAGAGACTTGTCCAGCCTAACCTGCCTGCTGCTCCTAGCTCCTGAGGCTCAGGGCCCTTGGCTTCTGTCCGCTCTGCTCAGGGCCCTCCAGCGTGGCCACTGCTCAGCCATGCTCCTGCTGCTCGTCCCAGTGCTCGAGGTGATTTTTACCCTGGGAGGAACCAGAGCCCAGTCGGTGACCCAGCTTGGCAGCCACGTCTCTGTCTCTGAAGGAGCCCTGGTTCTGCTGAGGTGCAACTACTCATCGTCTGTTCCACCATATCTCTTCTGGTATGTGCAATACCCCAACCAAGGACTCCAGCTTCTCCTGAAGTACACATCAGCGGCCACCCTGGTTAAAGGCATCAACGGTTTTGAGGCTGAATTTAAGAAGAGTGAAACCTCCTTCCACCTGACGAAACCCTCAGCCCATATGAGCGACGCGGCTGAGTACTTCTGTGCTGTGAGTGATCTCGAACCGAACAGCAGTGCTTCCAAGATAATCTTTGGATCAGGGACCAGACTCAGCATCCGGCCAAATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGATCTGCAAGATTGTAAGACAGCCTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGTAATGCCACCAACTGGATCCTACCCGAATTTATGATTAAGATTGCTGAAGAGCTGCCAAACACTGCTGCCACCCCCTCTGTTCCCTTATTGCTGCTTGTCACTGCCTGACATTCACGGCAGAGGCAAGGCTGCTGCAGCCTCCCCTGGCTGTGCACATTCCCTCCTGCTCCCCAGAGACTGCCTCCGCCATCCCACAGATGATGGATCTTCAGTGGGTTCTCTTGGGCTCTAGGTCCTGGAGAATGTTGTGAGGGGTTTATTTTTTTTTAATAGTGTTCATAAAGAAATACATAGTATTCTTCTTCTCAAGACGTGGGGGGAAATTATCTCATTATCGAGGCCCTGCTATGCTGTGTGTCTGGGCGTGTTGTATGTCCTGCTGCCGATGCCTTCATTAAAATGATTTGGAA
“T细胞受体β常数1多肽(TRBC1)”是指与NCBI登录号P01850或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
.>sp|P01850|TRBC1_人类T细胞受体β常数1OS=智人OX=9606GN=TRBC1 PE=1
SV=4DLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF
“T细胞受体β常数1多核苷酸(TRBC1)”是指编码TRBC1多肽的核酸。下面提供了示例性的TRBC1核酸序列。
>X00437.1CTGGTCTAGAATATTCCACATCTGCTCTCACTCTGCCATGGACTCCTGGACCTTCTGCTGTGTGTCCCTTTGCATCCTGGTAGCGAAGCATACAGATGCTGGAGTTATCCAGTCACCCCGCCATGAGGTGACAGAGATGGGACAAGAAGTGACTCTGAGATGTAAACCAATTTCAGGCCACAACTCCCTTTTCTGGTACAGACAGACCATGATGCGGGGACTGGAGTTGCTCATTTACTTTAACAACAACGTTCCGATAGATGATTCAGGGATGCCCGAGGATCGATTCTCAGCTAAGATGCCTAATGCATCATTCTCCACTCTGAAGATCCAGCCCTCAGAACCCAGGGACTCAGCTGTGTACTTCTGTGCCAGCAGTTTCTCGACCTGTTCGGCTAACTATGGCTACACCTTCGGTTCGGGGACCAGGTTAACCGTTGTAGAGGACCTGAACAAGGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTGTGCCTGGCCACAGGCTTCTTCCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTTACCTCGGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTCAAGAGAAAGGATTTCTGAAGGCAGCCCTGGAAGTGGAGTTAGGAGCTTCTAACCCGTCATGGTTCAATACACATTCTTCTTTTGCCAGCGCTTCTGAAGAGCTGCTCTCACCTCTCTGCATCCCAATAGATATCCCCCTATGTGCATGCACACCTGCACACTCACGGCTGAAATCTCCCTAACCCAGGGGGAC
“T细胞受体β常数2多肽(TRBC2)”是指与NCBI登录号A0A5B9或其片段具有至少约85%的氨基酸序列同一性并具有免疫调节活性的蛋白质。下面提供了示例性氨基酸序列。
.>sp|A0A5B9|TRBC2_人类T细胞受体β常数2OS=智人OX=9606GN=TRBC2 PE=1
SV=2DLKNVFPPKVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSESYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDSRG
“T细胞受体β常数2多核苷酸(TRBC2)”是指编码TRAC多肽的核酸。下面提供了示例性的TRBC2核酸序列。
>NG_001333.2:655095-656583 7号染色体上的智人T细胞受体β基因座(TRB)
AGGACCTGAAAAACGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTATGCCTGGCCACAGGCTTCTACCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGGTGAGTGGGGCCTGGGGAGATGCCTGGAGGAGATTAGGTGAGACCAGCTACCAGGGAAAATGGAAAGATCCAGGTAGCGGACAAGACTAGATCCAGAAGAAAGCCAGAGTGGACAAGGTGGGATGATCAAGGTTCACAGGGTCAGCAAAGCACGGTGTGCACTTCCCCCACCAAGAAGCATAGAGGCTGAATGGAGCACCTCAAGCTCATTCTTCCTTCAGATCCTGACACCTTAGAGCTAAGCTTTCAAGTCTCCCTGAGGACCAGCCATACAGCTCAGCATCTGAGTGGTGTGCATCCCATTCTCTTCTGGGGTCCTGGTTTCCTAAGATCATAGTGACCACTTCGCTGGCACTGGAGCAGCATGAGGGAGACAGAACCAGGGCTATCAAAGGAGGCTGACTTTGTACTATCTGATATGCATGTGTTTGTGGCCTGTGAGTCTGTGATGTAAGGCTCAATGTCCTTACAAAGCAGCATTCTCTCATCCATTTTTCTTCCCCTGTTTTCTTTCAGACTGTGGCTTCACCTCCGGTAAGTGAGTCTCTCCTTTTTCTCTCTATCTTTCGCCGTCTCTGCTCTCGAACCAGGGCATGGAGAATCCACGGACACAGGGGCGTGAGGGAGGCCAGAGCCACCTGTGCACAGGTGCCTACATGCTCTGTTCTTGTCAACAGAGTCTTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCTTGCTAGGGAAGGCCACCTTGTATGCCGTGCTGGTCAGTGCCCTCGTGCTGATGGCCATGGTAAGGAGGAGGGTGGGATAGGGCAGATGATGGGGGCAGGGGATGGAACATCACACATGGGCATAAAGGAATCTCAGAGCCAGAGCACAGCCTAATATATCCTATCACCTCAATGAAACCATAATGAAGCCAGACTGGGGAGAAAATGCAGGGAATATCACAGAATGCATCATGGGAGGATGGAGACAACCAGCGAGCCCTACTCAAATTAGGCCTCAGAGCCCGCCTCCCCTGCCCTACTCCTGCTGTGCCATAGCCCCTGAAACCCTGAAAATGTTCTCTCTTCCACAGGTCAAGAGAAAGGATTCCAGAGGCTAG
如本文所用,“转导(transduction)”是指通过病毒载体将基因或遗传物质转移至细胞。
如本文所用,“转化(transformation)”是指在通过引入外源核酸产生的细胞中引入遗传变化的过程。
“转染(transfection)”是指通过化学或物理方式将基因或遗传物质转移至细胞。
“易位(translocation)”是指核酸区段在非同源染色体之间的重排。
如本文所用,术语“治疗(treat)”、“治疗(treating)”、“治疗(treatment)”等是指减少或改善病症和/或与其相关的症状。应当理解,尽管不排除,治疗障碍或病症并不需要消除障碍、病症或与其相关的症状。
如本文所用,术语“尿嘧啶糖基化酶抑制剂”或“UGI”是指能够抑制尿嘧啶-DNA糖基化酶碱基切除修复酶的蛋白质。在一些实施方案中,多肽还包含一种或多种(例如,1、2、3、4、5种)尿嘧啶糖基化酶抑制剂。在一些实施方案中,UGI结构域包含野生型UGI或其修饰形式。在一些实施方案中,本文提供的UGI蛋白质包括UGI的片段和与UGI或UGI片段同源的蛋白质。例如,在一些实施方案中,UGI结构域包含下文阐述的氨基酸序列的片段。在一些实施方案中,UGI片段包含的氨基酸序列包含至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%本文提供的示例性UGI序列。在一些实施方案中,UGI包含与本文下文阐述的氨基酸序列同源的氨基酸序列,或与本文下文阐述的氨基酸序列的片段同源的氨基酸序列。在一些实施方案中,包含UGI或UGI片段或UGI或UGI片段的同源物的蛋白质被称为“UGI变异体”。UGI变异体与UGI或其片段具有同源性。例如,UGI变异体与野生型UGI或如本文所述的UGI至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少96%相同、至少97%相同、至少98%相同、至少99%相同、至少99.5%相同或至少99.9%相同。在一些实施方案中,UGI变异体包含UGI的片段,使得所述片段与野生型UGI或如下所述的UGI的相应片段至少70%相同、至少80%相同、至少90%相同、至少95%相同、至少96%相同、至少97%相同、至少98%相同、至少99%相同、至少99.5%相同或至少99.9%相同。在一些实施方案中,UGI包含以下氨基酸序列:
>splP14739IUNGI_BPPB2尿嘧啶-DNA糖基化酶抑制剂
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLT S D APEYKPW ALVIQDS NGENKIKML
术语“载体(vector)”是指将核酸序列引入细胞中从而产生转化细胞的手段。载体包括质粒、转座子、噬菌体、病毒、脂质体和附加体。“表达载体”是包含待在受体细胞中表达的核苷酸序列的核酸序列。表达载体可包括额外的核酸序列以促进和/或促进引入序列的表达,例如起始、终止、增强子、启动子和分泌序列。
“T细胞受体相关蛋白激酶70(ZAP70)多肽的zeta链”是指与NCBI登录号AAH53878.1具有至少约85%的氨基酸序列同一性并具有激酶活性的蛋白质。下面提供了示例性氨基酸序列。
>AAH53878.1 Zeta链(TCR)相关蛋白激酶70kDa[智人]
MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVRFHHFPIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGVFDCLRDAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMPWYHSSLTREEAERKLYSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDTLWQLVEYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSDGYTPEPARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGSVRQGVYRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAEALMLVMEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEEKNFVHRDLAARNVLLVNRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVWSYGVTMWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKWEDRPDFLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA
“T细胞受体相关蛋白激酶70(ZAP70)多核苷酸的zeta链”是指编码ZAP70多肽的核酸。ZAP70基因编码一种参与T细胞发育和淋巴细胞活化的酪氨酸激酶。缺乏功能性ZAP10可导致严重的联合免疫缺陷,其特征是缺乏CD8+T细胞。下面提供了示例性的ZAP70核酸序列。
>BC053878.1智人zeta链(TCR)相关蛋白激酶70kDa,mRNA(cDNA克隆MGC:61743IMAGE:5757161),完整cds
GCTTGCCGGAGCTCAGCAGACACCAGGCCTTCCGGGCAGGCCTGGCCCACCGTGGGCCTCAGAGCTGCTGCTGGGGCATTCAGAACCGGCTCTCCATTGGCATTGGGACCAGAGACCCCGCAAGTGGCCTGTTTGCCTGGACATCCACCTGTACGTCCCCAGGTTTCGGGAGGCCCAGGGGCGATGCCAGACCCCGCGGCGCACCTGCCCTTCTTCTACGGCAGCATCTCGCGTGCCGAGGCCGAGGAGCACCTGAAGCTGGCGGGCATGGCGGACGGGCTCTTCCTGCTGCGCCAGTGCCTGCGCTCGCTGGGCGGCTATGTGCTGTCGCTCGTGCACGATGTGCGCTTCCACCACTTTCCCATCGAGCGCCAGCTCAACGGCACCTACGCCATTGCCGGCGGCAAAGCGCACTGTGGACCGGCAGAGCTCTGCGAGTTCTACTCGCGCGACCCCGACGGGCTGCCCTGCAACCTGCGCAAGCCGTGCAACCGGCCGTCGGGCCTCGAGCCGCAGCCGGGGGTCTTCGACTGCCTGCGAGACGCCATGGTGCGTGACTACGTGCGCCAGACGTGGAAGCTGGAGGGCGAGGCCCTGGAGCAGGCCATCATCAGCCAGGCCCCGCAGGTGGAGAAGCTCATTGCTACGACGGCCCACGAGCGGATGCCCTGGTACCACAGCAGCCTGACGCGTGAGGAGGCCGAGCGCAAACTTTACTCTGGGGCGCAGACCGACGGCAAGTTCCTGCTGAGGCCGCGGAAGGAGCAGGGCACATACGCCCTGTCCCTCATCTATGGGAAGACGGTGTACCACTACCTCATCAGCCAAGACAAGGCGGGCAAGTACTGCATTCCCGAGGGCACCAAGTTTGACACGCTCTGGCAGCTGGTGGAGTATCTGAAGCTGAAGGCGGACGGGCTCATCTACTGCCTGAAGGAGGCCTGCCCCAACAGCAGTGCCAGCAACGCCTCAGGGGCTGCTGCTCCCACACTCCCAGCCCACCCATCCACGTTGACTCATCCTCAGAGACGAATCGACACCCTCAACTCAGATGGATACACCCCTGAGCCAGCACGCATAACGTCCCCAGACAAACCGCGGCCGATGCCCATGGACACGAGCGTGTATGAGAGCCCCTACAGCGACCCAGAGGAGCTCAAGGACAAGAAGCTCTTCCTGAAGCGCGATAACCTCCTCATAGCTGACATTGAACTTGGCTGCGGCAACTTTGGCTCAGTGCGCCAGGGCGTGTACCGCATGCGCAAGAAGCAGATCGACGTGGCCATCAAGGTGCTGAAGCAGGGCACGGAGAAGGCAGACACGGAAGAGATGATGCGCGAGGCGCAGATCATGCACCAGCTGGACAACCCCTACATCGTGCGGCTCATTGGCGTCTGCCAGGCCGAGGCCCTCATGCTGGTCATGGAGATGGCTGGGGGCGGGCCGCTGCACAAGTTCCTGGTCGGCAAGAGGGAGGAGATCCCTGTGAGCAATGTGGCCGAGCTGCTGCACCAGGTGTCCATGGGGATGAAGTACCTGGAGGAGAAGAACTTTGTGCACCGTGACCTGGCGGCCCGCAACGTCCTGCTGGTTAACCGGCACTACGCCAAGATCAGCGACTTTGGCCTCTCCAAAGCACTGGGTGCCGACGACAGCTACTACACTGCCCGCTCAGCAGGGAAGTGGCCGCTCAAGTGGTACGCACCCGAATGCATCAACTTCCGCAAGTTCTCCAGCCGCAGCGATGTCTGGAGCTATGGGGTCACCATGTGGGAGGCCTTGTCCTACGGCCAGAAGCCCTACAAGAAGATGAAAGGGCCGGAGGTCATGGCCTTCATCGAGCAGGGCAAGCGGATGGAATGCCCACCAGAGTGTCCACCCGAACTGTACGCACTCATGAGTGACTGCTGGATCTACAAGTGGGAGGATCGCCCCGACTTCCTGACCGTGGAGCAGCGCATGCGAGCCTGTTACTACAGCCTGGCCAGCAAGGTGGAAGGGCCCCCAGGCAGCACACAGAAGGCTGAGGCTGCCTGTGCCTGAGCTCCCGCTGCCCAGGGGAGCCCTCCACACCGGCTCTTCCCCACCCTCAGCCCCACCCCAGGTCCTGCAGTCTGGCTGAGCCCTGCTTGGTTGTCTCCACACACAGCTGGGCTGTGGTAGGGGGTGTCTCAGGCCACACCGGCCTTGCATTGCCTGCCTGGCCCCCTGTCCTCTCTGGCTGGGGAGCAGGGAGGTCCGGGAGGGTGCGGCTGTGCAGCCTGTCCTGGGCTGGTGGCTCCCGGAGGGCCCTGAGCTGAGGGCATTGCTTACACGGATGCCTTCCCCTGGGCCCTGACATTGGAGCCTGGGCATCCTCAGGTGGTCAGGCGTAGATCACCAGAATAAACCCAGCTTCCCTCTTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
除非具体说明或从上下文显而易见,如本文所用,术语“或”被理解为包括在内。除非具体说明或从上下文显而易见,如本文所用,术语“一个(a)”、“一个(an)”和“所述(the)”应理解为单数或复数。
除非具体说明或从上下文显而易见,如本文所用,术语“约(about)”被理解为在本领域的正常容差范围内,例如在平均值的2个标准偏差内。“约”可以理解为在10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.05%或0.01%以内规定的值。除非上下文另有明确说明,否则本文提供的所有数值均由术语约修饰。
本文提供的范围被理解为所述范围内所有值的简写。例如,1至50的范围被理解为包括来自由1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50组成的群组中的任何数字、数字组合或子范围。
在本文中变量的任何定义中对化学基团列表的引用包括将所述变量定义为任何单个基团或所列基团的组合。此处对变量或方面的实施方案的叙述包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。
本文提供的任何组成物或方法可以与本文提供的任何其他组成物和方法中的一种或多种组合。
附图说明
图1A至1B是影响T细胞功能的三种蛋白质的图示。如图1A是TRAC蛋白的说明,其是移植物抗宿主病的关键成分。如图1B是B2M蛋白的图示,B2M蛋白是存在于有核细胞上的MHC1类抗原呈递复合物的组分,可被宿主的CD8+T细胞识别。如图1C是导致PDCD1基因表达的T细胞信号传导的说明,以及由此产生的PD-1蛋白起到抑制T细胞信号传导的作用。
图2是碱基编辑后靶基因表达下调的细胞百分比图。“EP”表示电穿孔。
图3是未转导的细胞或用BE4碱基编辑系统或Cas9核酸酶转导的细胞中观察到的遗传修饰类型的百分比图。
图4是描绘靶核苷酸修饰百分比的图,如通过流式细胞术(FC)在用BE4和将BE4向导至剪接位点受体(SA)或供体(SD)的sgRNA转导的细胞中测定的靶蛋白表达阴性的细胞百分比测量的)或产生终止密码子。对照细胞模拟电穿孔(EP)。
图5是破坏剪接位点受体(SA)、剪接供体(SD)或产生终止密码子的BE4系统的图解。
图6是总结用于破坏靶基因的sgRNA的脱靶结合位点的图表。
图7是总结用BE4或Cas9编辑的表现出降低的蛋白质表达的细胞百分比的流式细胞术(FC)数据的图。细胞被B2M或CD3门控,后者是TRAC表达的代表。
图8A是未编辑对照细胞的FACS数据的散点图。图8B是已在B2M、TRAC和PD1基因座处编辑的细胞的FACS数据的散点图。
图9是说明本文描述的碱基编辑技术修饰可对CAR-T免疫疗法产生负面影响的特定基因的有效性的图。
图10是描绘检测和量化基因修饰和易位的液滴数字PCR(ddPCR)方案的图。
图11展示了两个图表,显示了从使用BE4系统或Cas9系统编辑的细胞的次世代测序(NGS)分析或ddPCR生成的数据。
图12是说明Cbl-b在抑制T细胞活化中所起的作用的示意图。
图13是描绘通过剪接位点的破坏的Cbl-b敲弱效率的图。SA=剪接位点供体;SD=剪接位点供体;STOP—产生的终止密码子;2°Only=仅二抗;C373是指功能丧失变异体(C373R);RL1-A::APC-A=激光;ICS=细胞内染色。
图14是说明T细胞中GRIN2B和DNMT1基因中Cas12b介导的插入缺失率的图。EP表示电穿孔。
图15是总结通过电穿孔(EP)用bvCas12b和特异性针对TRAC、GRIN2B和DNMT1并针对CD3门控的向导RNA转导的细胞的荧光辅助细胞分选(FACS)数据的图。
图16是转导CAR-P2A-mCherry慢病毒的细胞的荧光辅助细胞分选数据的散点图,表明CAR表达。
图17是荧光辅助细胞分选数据的散点图,其证明了用聚(1,8-辛二醇柠檬酸盐)(POC)慢病毒载体转导的细胞中的CAR表达。
图18是显示BE4以高产品纯度产生高效、持久的基因敲除的图。
图19A是代表性的FACS分析,显示由于BE4或spCas9的基因敲除导致蛋白质表面表达的丧失。如图19B是显示BE4或spCas9敲除基因导致B2M表面表达丧失的图。
图20是描绘B2M、TRAC和PD-1靶位点位置的示意图。当B2M、TRAC和PD-1序列重组时,可以检测到易位。
图21是显示多路碱基编辑不显着损害细胞扩增的图。
图22是显示BE4产生具有与spCas9相似的在靶编辑效率和细胞表型的三重编辑T细胞的图。
图23描绘了显示三重编辑的CD3-、B2M-、PD1-T细胞的产生的流式细胞术分析。
图24描绘了显示BE4和Cas9编辑的细胞中的CAR表达的流式细胞术分析。
图25是显示CAR-T细胞杀伤或抗原阳性细胞的图。
图26是显示Cas12b和BE4可以配对以在T细胞中进行有效多重编辑的图。
图27是显示Cas12b可以通过在Cas12核酸酶和靶向基因座的sgRNA存在下将编码CAR的双链DNA模板引入细胞来向导嵌合抗原受体(CAR)插入基因座的图。
图28A和28B是显示使用碱基编辑靶向图中所示基因的蛋白质敲弱(阴性%)的图,如通过流式细胞术测定的,相对于未编辑的对照门控。数字代表重复实验的结果。每组条件的条形按照键中列出的顺序(从左到右)(从上到下)显示。八个条形图中每个条形的标识从左到右相应于CD3、CD7、CD52、PD1、B2M CD2、HLADR(CIITA代理人)和CD5。
具体实施方式
本发明的特征在于具有增强的抗肿瘤活性、对免疫抑制的抗性和引起移植物抗宿主反应或宿主抗移植反应或其组合的风险降低的遗传经修饰的免疫细胞。本发明的特征还在于生产和使用这些经修饰的免疫细胞(例如免疫效应细胞,如T细胞)的方法。
在一个实施方案中,具有或具有发展移植物抗宿主病(GVHD)的倾向的个体被施用缺乏或具有降低水平的功能性TRAC的CAR-T细胞。在一个实施方案中,具有或具有发展宿主抗移植物疾病(HVGD)的倾向的个体被施用缺乏或具有降低水平的功能性β2微球蛋白(B2M)的CAR-T细胞。
使用包含胞苷脱氨酶或腺苷脱氨酶的碱基编辑器系统来修饰免疫效应细胞以表达嵌合抗原受体并敲除或敲弱特定基因以减少其表达可能对免疫细胞功能产生的负面影响。在此描述。
自体的、源自患者的嵌合抗原受体-T细胞(CAR-T)疗法在治疗一些血液癌症方面已显示出显着的功效。虽然这些产品为患者带来了显着的临床益处,但产生个性化疗法的需求带来了巨大的制造挑战和财务负担。同种异体CAR-T疗法被开发为应对这些挑战的潜在解决方案,具有与自体产品相似的临床疗效特征,同时使用来自单个健康供体的细胞治疗许多患者,从而大大降低了商品成本和批次间的差异。
大多数第一代同种异体CAR-T使用核酸酶在靶T细胞群中引入两个或多个靶向基因组DNA双链断裂(DSB),依靠容易出错的DNA修复来产生敲除靶基因的突变一种半随机的方式。这种基于核酸酶的基因敲除策略旨在降低移植物抗宿主病和宿主排斥CAR-T的风险。然而,同时诱导多个DSB导致最终细胞产物包含大规模基因组重排,例如平衡和不平衡易位,以及相对高丰度的局部重排,包括倒位和大缺失。此外,随着越来越多的同步遗传修饰由诱导的DSBs进行,在处理过的细胞群中观察到相当大的遗传毒性。这有可能显着降低每次生产运行的细胞扩增潜力,从而减少每个健康供体可以治疗的患者数量。
碱基编辑器(BEs)是一类新兴的基因编辑试剂,其能够高效地、使用者定义的目标基因组DNA修饰,而无需创建DSB。在这里,提出了一种生产同种异体CAR-T细胞的替代方法,通过使用碱基编辑技术来减少或消除可检测的基因组重排,同时提高细胞扩增。如本文所示,与仅核酸酶编辑策略相比,通过碱基编辑同时修饰多个基因座,例如三个、四个、五个、六个、七个、八个、九个、十个或更多个基因座产生高效没有检测到易位事件的基因敲除。
在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件在免疫细胞中用本文提供的碱基编辑组成物和方法进行修饰。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含一个或多个选自CD3e、CD3δ、CD3γ、TRAC、TRBC1和TRBC2。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含一个或多个选自CD3e、CD3δ、CD3γ、TRAC、TRBC1和TRBC2、CD7和CD52。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含一个或多个选自CD3e、CD3δ、CD3γ、TRAC、TRBC1、TRBC2的基因、CD2、CD5、CD7和CD52。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含一个或多个选自TRAC、CD7和CD52的基因。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含一个或多个选自TRAC、CD2、CD5、CD7和CD52的基因。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含一个或多个选自CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件选自CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含一个或多个选自CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA。在一些实施方案中,至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件选自ACAT1、ACLY、ADORA2A、AXL、B2M、BATF、BCL2L11、BTLA、CAMK2D、cAMP、CASP8、Cblb、CCR5、CD2、CD3D、CD3E、CD3G、CD4、CD5、CD7、CD8A、CD33、CD38、CD52、CD70、CD82、CD86、CD96、CD123、CD160、CD244、CD276、CDK8、CDKN1B、Chi3l1、CIITA、CISH、CSF2CSK、CTLA-4、CUL3、Cyp11a1、DCK、DGKA、DGKZ、DHX37、ELOB(TCEB2)、ENTPD1(CD39)、FADD、FAS、GATA3、IL6、IL6R、IL10、IL10RA、IRF4、IRF8、JUNB、Lag3、、LAIR-1(CD305)、LDHA、LIF、LYN、MAP4K4、MAPK14、MCJ、MEF2D、MGAT5、NR4A1、NR4A2、NR4A3、NT5E(CD73)、ODC1、OTULINL(FAM105A)、PAG1、PDCD1、PDIA3、PHD1(EGLN2)、PHD2(EGLN1)、PHD3(EGLN3)、PIK3CD、PIKFYVE、PPARa、PPARd、PRDMI1、PRKACA、PTEN、PTPN2、PTPN6、PTPN11、PVRIG(CD112R)、RASA2、RFXANK、SELPG/PSGL1、SIGLEC15、SLA、SLAMF7、SOCS1、Spry1、Spry2、STK4、SUV39、H1TET2、TGFbRII、TIGIT、Tim-3、TMEM222、TNFAIP3、TNFRSF8(CD30)、TNFRSF10B、TOX、TOX2、、TRAC、TRBC1、TRBC2、UBASH3A、VHL、VISTA、XBP1、YAP1和ZC3H12A。在一些实施方案中,至少8个选自CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA的基因或其调控元件被本文提供的碱基编辑组成物和方法修饰。
在一方面,本文提供的是通用CAR-T细胞。在一些实施方案中,本文所述的CAR-T细胞是同种异体细胞。在一些实施方案中,通用CAR-T细胞是可用于表达所需CAR的同种异体T细胞,以及可以普遍适用,而不管供体和受体的免疫原性相容性如何。同种异体免疫细胞可以来自一个或多个供体。在某些实施方案中,同种异体免疫细胞源自单个人类供体。例如,同种异体T细胞可以源自单个健康人类供体的PBMC。在某些实施方案中,同种异体免疫细胞源自多个人类供体。在一些实施方案中,如本文所述,可以通过使用基因修饰在多个基因座(例如三个、四个、五个、六个、七个、八个、九个、十个或更多个)处引入并发编辑来产生通用CAR-T细胞基因位点。如本文所述的修饰或并发修饰可以是由碱基编辑器产生的基因编辑,例如碱基编辑。碱基编辑器可以是C碱基编辑器或A碱基编辑器。如本文所讨论的,碱基编辑可用于实现基因破坏,使得基因不表达。通过碱基编辑进行的修饰可用于实现基因表达的减少。在一些实施方案中,碱基编辑器可用于引入遗传修饰,使得经编辑的基因不产生结构上或功能上有活力的蛋白质产物。在一些实施方案中,修饰,例如本文所述的并发修饰,可以包括基因编辑,例如碱基编辑,从而以任何方式改变基因产物的表达或功能。例如,与基线表达水平相比,基因产物的表达可以被增强或上调。在一些实施方案中,基因产物的活性或功能可以作为碱基编辑或协同作用的多个碱基编辑事件的结果而被上调。
在一些实施方案中,通用CAR-T细胞的产生可能优于自体T细胞(CAR-T),自体T细胞(CAR-T)可能难以产生以用于紧急用途。在许多情况下,同种异体方法比自体细胞制备更优选,这些情况涉及工程自体T细胞表达CAR的不确定性,并最终在医疗紧急情况下获得所需的移植细胞产品。然而,对于同种异体T细胞或“现成的”T细胞,重要的是要仔细协商宿主对CAR-T细胞(HVGD)的反应性以及同种异体T细胞对宿主细胞的潜在敌意(GVHD)。鉴于这种情况,碱基编辑可以成功地用于生成多个同时发生的基因编辑事件,这样(a)可以生成缺乏或表达少量内源性T细胞受体的平台细胞类型,例如,TCRα链(例如通过TRAC的碱基编辑)或TCRβ链(例如通过TRBC1/TRBC2的碱基编辑);(b)有可能减少或下调与宿主组织系统不相容的抗原的表达,反之亦然。
在一些实施方案中,本文所述的方法可用于产生表达CAR-T的自体T细胞。
在一些实施方案中,多个碱基编辑事件可以在单个电穿孔事件中完成,从而降低与电穿孔事件相关的毒性。可使用任何已知的将外源遗传物质掺入细胞的方法来代替电穿孔,以及本领域已知的此类方法在此预期用于本文所述的任何方法中。
在一项实验中,碱基编辑器BE4展示了对T细胞中三个细胞表面靶标(TRAC、B2M和PD-1)的高效多重碱基编辑,将基因表达敲除95%、95%和88%,分别在单次电穿孔中产生具有高百分比细胞的细胞群,其中B2M和CD3的蛋白质表达降低。编辑这些基因中的每一个都可能有助于创建具有改进治疗特性的CAR-T细胞疗法。每个基因都通过单个靶向碱基变化(C到T)沉默,而不会产生双链断裂。结果,BE4处理的细胞也没有显示任何可测量的易位(大规模基因组重排),而接受相同的三个核酸酶编辑的细胞确实显示了可检测的基因组重排。
因此,将TRAC基因的基于核酸酶的敲除与同时BE-介导的两个额外基因的敲除结合产生具有最小基因组重排的同质同种异体T细胞群。在一些实施方案中,可以在2个额外基因,或3个额外基因,或4个额外基因,或5个额外基因,或6个额外基因,或7个额外基因,或8个额外的基因,或9个额外的基因,或10个额外的基因,或11个额外的基因,或12个额外的基因,或更多中同时进行BE介导的敲除或敲弱或其组合,以产生具有最小基因组重排的同种异体T细胞群,并能够在以下位置靶向插入CAR转基因TRAC基因座。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑来提供三个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑来提供4个同时的基因敲除或敲弱。在一些实施方案中,本发明通过碱基编辑以及TRAC基因座处的CAR转基因提供5个同时的基因敲除或敲弱。在一些实施方案中,本发明通过碱基编辑以及TRAC基因座处的CAR转基因提供6个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑,提供了7个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑来提供8个同时的基因敲除或敲弱。在一些实施方案中,本发明通过碱基编辑以及TRAC基因座处的CAR转基因提供9个同时的基因敲除或敲弱。在一些实施方案中,本发明通过碱基编辑以及TRAC基因座处的CAR转基因提供10个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑来提供11个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑来提供12个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑,提供了13个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑,提供了14个同时的基因敲除或敲弱。在一些实施方案中,本发明通过碱基编辑以及TRAC基因座处的CAR转基因提供15个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑,提供了16个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑,提供了17个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑来提供18个同时的基因敲除或敲弱。在一些实施方案中,本发明通过在TRAC基因座处连同CAR转基因一起进行碱基编辑来提供19个同时的基因敲除或敲弱。在一些实施方案中,本发明通过碱基编辑以及TRAC基因座处的CAR转基因提供20个同时的基因敲除或敲弱。总之,这表明与单独的核酸酶方法相比,单独的碱基编辑或结合单个核酸酶敲除和CAR插入是一种有用的策略,可用于生成具有最小基因组重排的同种异体T细胞。这种方法解决了多重编辑T细胞产品的已知局限性,是朝着下一代基于细胞的精确疗法的有希望的发展。
嵌合抗原受体和CAR-T细胞
本发明提供了使用本文所述的表达嵌合抗原受体的核碱基编辑器经修饰的免疫细胞。修饰免疫细胞以表达嵌合抗原受体可以增强免疫细胞的免疫应答活性,其中嵌合抗原受体对抗原上的表位具有亲和力,其中抗原与生物体的适应性改变有关。例如,嵌合抗原受体可以对肿瘤细胞中表达的蛋白质上的表位具有亲和力。由于CAR-T细胞可以独立于主要组织相容性复合体(MHC)发挥作用,因此活化的CAR-T细胞可以杀死表达抗原的肿瘤细胞。CAR-T细胞的直接作用逃避了肿瘤细胞防御机制,这些机制是响应MHC向免疫细胞呈递抗原而进化的。
在一些实施方案中,本发明提供表达嵌合抗原受体的免疫效应细胞,所述嵌合抗原受体靶向参与自身免疫应答的B细胞(例如,表达针对个体自身组织产生的抗体的个体的B细胞)。
一些实施方案包含自体免疫细胞免疫疗法,其中免疫细胞获自患有疾病或适应性改变的个体,其特征在于表达表面标志物的癌性或其他改变的细胞。获得的免疫细胞经过基因改造以表达嵌合抗原受体,并有效地针对特定抗原重新定向。因此,在一些实施方案中,免疫细胞获自需要CAR-T免疫疗法的个体。在一些实施方案中,这些自体免疫细胞在从个体获得后不久被培养和修饰。在其他实施方案中,获得自体细胞然后储存以备将来使用。对于可能正在接受平行治疗的个体,这种做法可能是可取的,这些治疗将在未来减少免疫细胞计数。在同种异体免疫细胞免疫疗法中,免疫细胞可以从将接受治疗的个体以外的供体获得。在修饰以表达嵌合抗原受体之后,将免疫细胞施用于个体以治疗肿瘤。在一些实施方案中,可以从预先存在的免疫细胞原种培养物中获得要被修饰以表达嵌合抗原受体的免疫细胞。
可以使用本领域已知的标准技术从由个体或供体收集的样品中分离或纯化免疫细胞和/或免疫效应细胞。例如,可以通过裂解红细胞并通过离心去除外周单核血细胞,从全血样品中分离或纯化免疫效应细胞。可以使用选择性纯化方法进一步分离或纯化免疫效应细胞,所述方法基于细胞特异性标志物例如CD25、CD3、CD4、CD8、CD28、CD45RA或CD45RO分离免疫效应细胞。在一个实施方案中,CD25+用作选择调节性T细胞的标记。在另一个实施方案中,本发明提供在负责TCRαβ表面表达的TCR恒定区(TRAC)处具有靶向基因敲除的T细胞。TCRαβ缺陷型CAR T细胞与同种异体免疫疗法兼容(Qasim等人,Sci.Transl.Med.9,eaaj2013(2017);Valton等人,Mol Ther.2015Sep;23(9):1507–1518)。如果需要,可以使用CliniMACS磁珠去除法去除残留的TCRαβT细胞,以最大限度地降低GVHD的风险。在另一个实施方案中,本发明提供离体选择的供体T细胞以识别受体造血细胞上表达的次要组织相容性抗原,从而将移植物抗宿主病(GVHD)的风险降至最低,移植物抗宿主病(GVHD)是移植后发病率和死亡率的主要原因(Warren等人,Blood 2010;115(19):3869-3878)。另一种分离或纯化免疫效应细胞的技术是流式细胞术。在荧光激活细胞分选中,对免疫效应细胞标记物具有亲和力的荧光标记抗体用于标记样品中的免疫效应细胞。适用于表达标记的细胞的门控策略用于分离细胞。例如,T淋巴细胞可以通过使用例如对免疫效应细胞标记物(例如CD4、CD8、CD28、CD45)和相应的门控策略特异的荧光标记抗体与样品中的其他细胞分离。在一个实施方案中,采用CD45门控策略。在一些实施方案中,使用针对免疫效应细胞特异性的其他标志物的门控策略代替CD45门控策略或与CD45门控策略组合。
本发明中考虑的免疫效应细胞是效应T细胞。在一些实施方案中,效应T细胞是初始CD8+T细胞、细胞毒性T细胞或调节性T(Treg)细胞。在一些实施方案中,效应T细胞是胸腺细胞、未成熟T淋巴细胞、成熟T淋巴细胞、静息T淋巴细胞或活化T淋巴细胞。在一些实施方案中,免疫效应细胞是CD4+CD8+T细胞或CD4-CD8-T细胞。在一些实施方案中,免疫效应细胞是辅助性T细胞。在一些实施方案中,辅助性T细胞是辅助性T细胞1(Th1)、辅助性T细胞2(Th2)或表达CD4的辅助性T细胞(CD4+T细胞)。在一些实施方案中,免疫效应细胞是T细胞的任何其他子集。除了嵌合抗原受体之外,经修饰的免疫效应细胞还可以表达外源细胞因子、不同的嵌合受体或任何其他能增强免疫效应细胞信号传导或功能的试剂。例如,嵌合抗原受体和细胞因子的共表达可以增强CAR-T细胞裂解靶细胞的能力。
本发明中考虑的嵌合抗原受体包含胞外结合结构域、跨膜结构域和胞内结构域。抗原与细胞外结合结构域的结合可以激活CAR-T细胞并产生效应反应,包括CAR-T细胞增殖、细胞因子产生和其他导致抗原表达细胞死亡的过程。在本发明的一些实施方案中,嵌合抗原受体进一步包含连接子。
本文考虑的嵌合抗原受体的胞外结合结构域包含对特定抗原具有亲和力的抗体或其抗原结合片段的氨基酸序列。在各种实施方案中,CAR特异性结合5T4。示例性抗5T4CAR包括但不限于CART-5T4(Oxford BioMedica plc)和UCART-5T4(Cellectis SA)。
在各种实施方案中,CAR特异性结合α-胎蛋白。示例性的抗α-胎蛋白CAR包括但不限于ET-1402(Eureka Therapeutics Inc)。在各种实施方案中,CAR特异性结合Axl。示例性抗Axl CAR包括但不限于CCT-301-38(F1 Oncology Inc)。在各种实施方案中,CAR特异性结合B7H6。示例性抗B7H6 CAR包括但不限于CYAD-04(Celyad SA)。
在各种实施方案中,CAR特异性结合BCMA。示例性的抗BCMA CAR包括但不限于ACTR-087+SEA-BCMA(Seattle Genetics Inc)、ALLO-715(Cellectis SA)、ARI-0002(Institut d'Investigacions Biomediques August Pi I Sunyer)、bb-2121(bluebirdbio Inc)、bb-21217(bluebird bio Inc)、CART-BCMA(University of Pennsylvania)、CT-053(Carsgen Therapeutics Ltd)、Descartes-08(Cartesian Therapeutics)、FCARH-143(Juno Therapeutics Inc)、ICTCAR-032(Innovative Cellular Therapeutics Co Ltd)、IM21 CART(Beijing Immunochina Medical Science&Technology Co Ltd)、JCARH-125(Memorial Sloan-Kettering Cancer Center)、KITE-585(Kite Pharma Inc)、LCAR-B38M(Nanjing Legend)Biotech Co Ltd)、LCAR-B4822M(Nanjing Legend Biotech Co Ltd)、MCARH-171(Memorial Sloan-Kettering Cancer Center)、P-BCMA-101(PoseidaTherapeutics Inc)、P-BCMA-ALLO1(Poseida Therapeutics Inc)、spCART-269(上海Unicar-Therapy Bio-medicine Technology Co Ltd)和BCMA02/bb2121(bluebird bioInc)。BCMA02/bb2121 CAR的多肽序列如下:
MALPVTALLLPLALLLHAARPDIVLTQSPPSLAMSLGKRATISCRASESVTILGSHLIHWYQQKPGQPPTLLIQLASNVQTGVPARFSGSGSRTDFTLTIDPVEEDDVAVYYCLQSRTIPRTFGGGTKLEIKGSTSGSGKPGSGEGSTKGQIQLVQSGPELKKPGETVKISCKASGYTFTDYSINWVKRAPGKGLKWMGWINTETREPAYAYDFRGRFAFSLETSASTAYLQINNLKYEDTATYFCALDYSYAMDYWGQGTSVTVSSAAATTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR
在各种实施方案中,CAR特异性结合CCK2R。示例性抗CCK2R CAR包括但不限于抗CCK2R CAR-T衔接分子(CAM)+抗FITC CAR T细胞疗法(癌症)、Endocyte/Purdue(PurdueUniversity)、
在各种实施方案中,CAR特异性结合CD抗原。示例性的抗CD抗原CAR包括但不限于VM-802(ViroMed Co Ltd)。在各种实施方案中,CAR特异性结合CD123。示例性抗CD123 CAR包括但不限于MB-102(Fortress Biotech Inc)、RNACART123(University ofPennsylvania)、SFG-iMC-CD123.zeta(Bellicum Pharmaceuticals Inc)和UCART-123(Cellectis SA)。在各种实施方案中,CAR特异性结合CD133。示例性的抗CD133 CAR包括但不限于KD-030(南京Kaedi Biotech Inc)。在各种实施方案中,CAR特异性结合CD138。示例性抗CD138 CAR包括但不限于ATLCAR.CD138(UNC Lineberger综合癌症中心)和CART-138(中国人民解放军总医院)。在各种实施方案中,CAR特异性结合CD171。示例性抗CD171 CAR包括但不限于JCAR-023(Juno Therapeutics Inc)。在各种实施方案中,CAR特异性结合CD19。示例性抗CD19 CAR包括但不限于1928z-41BBL(Memorial Sloan-Kettering CancerCenter)、1928z-E27(Memorial Sloan-Kettering Cancer Center)、19-28z-T2(广州Institutes of Biomedicine and Health)、4G7-CARD(University College London)、4SCAR19(深圳基因免疫医学研究所)、ALLO-501(Pfizer Inc)、ATA-190(QIMR Berghofer医学研究所)、AUTO-1(University College London)、AVA-008(Avacta)Ltd)、axicabtageneciloleucel(Kite Pharma Inc)、BG-T19(广州Bio-gene Technology Co Ltd.)、BinD-19(深圳BinDeBio Ltd.),BPX-401(Bellicum Pharmaceuticals Inc)、CAR19h28TM41BBz(Westmead Institute for Medical Research)、C-CAR-011(中国人民解放军总医院)、CD19CART(Innovative Cellular Therapeutics Co Ltd)、CIK-CAR.CD19(FormulaPharmaceuticals Inc)、CLIC-1901(Ottawa Hospital Research Institute)、CSG-CD19(Carsgen Therapeutics)Ltd)、CTL-119(University of Pennsylvania)、CTX-101(CRISPRTherapeutics AG)、DSCAR-01(上海恒瑞生物科技有限公司)、ET-190(EurekaTherapeutics Inc)、FT-819(Memorial Sloan-Kettering Cancer Center)、ICAR-19(Immune Cell Therapy Inc),IM19 CAR-T(北京Immunochina Medical Science&Technology Co Ltd)、JCAR-014(Juno Therapeutics Inc)、JWCAR-029(MingJuTherapeutics(上海)Co.,Ltd)、KD-C-19(南京Kaedi Biotech Inc)、LinCART19(iCellGene Therapeutics)、lisocabtagene maraleucel(Juno Therapeutics Inc)、MatchCART(上海Hrain Biotechnology)、MB-CART19.1(上海儿童医学中心)、PBCAR-0191(PrecisionBioSciences Inc)、PCAR-019(PersonGen Biomedicine(苏州)Co Ltd)、pCAR-19B(Chongqing Precision Biotech Co Ltd)、PZ-01(品泽生命科技有限公司)、RB-1916(Refuge Biotechnologies Inc)、SKLB-083019(成都银河生物医药有限公司)、spCART-19(上海尤尼卡-治疗生物医学科技有限公司)、TBI-1501(Takara Bio Inc)、TC-110(TCR2Therapeutics Inc)、TI-1007(Timmune Biotech Inc)、tisagenlecleucel(AbramsonCancer Center of the University of Pennsylvania)、U-CART(上海Bioray LaboratoryInc)、UCART-19(Wugen Inc)、UCART-19(Cellectis SA)、vadacabtagene leraleucel(Memorial Sloan-Kettering Cancer Center)、XLCART-001(南京Medical University)和yinnuokati-19(深圳Innovation Immunotechnology Co Ltd)。在各种实施方案中,CAR特异性结合CD2。示例性抗CD2 CAR包括但不限于UCART-2(Wugen Inc)。在各种实施方案中,CAR特异性结合CD20。示例性抗CD20 CAR包括但不限于ACTR-087(新加坡国立大学)、ACTR-707(Unum Therapeutics Inc)、CBM-C20.1(中国人民解放军总医院)、MB-106(FredHutchinson Cancer Research Center)和MB-CART20.1(Miltenyi Biotec GmbH)。
在各个实施方案中,CAR特异性结合CD22。示例性的抗CD22 CAR包括但不限于抗CD22 CAR T细胞疗法(B细胞急性淋巴细胞白血病)、University of Pennsylvania(University of Pennsylvania)、CD22-CART(上海尤尼卡-治疗生物医学科技有限公司)、JCAR-018(Opus Bio Inc)、MendCART(上海恒润生物科技)和UCART-22(Cellectis SA)。在各种实施方案中,CAR特异性结合CD30。示例性抗CD30 CAR包括但不限于ATLCAR.CD30(UNCLineberger综合癌症中心)、CBM-C30.1(中国人民解放军总医院)和Hu30-CD28zeta(国家癌症研究所)。在各种实施方案中,CAR特异性结合CD33。示例性的抗CD33 CAR包括但不限于抗CD33 CARγδT细胞疗法(急性髓性白血病)、TC BioPharm/University College London(University College London)、CAR33VH(Opus Bio Inc)、CART-33(中国人民解放军总医院)、CIK-CAR.CD33(Formula Pharmaceuticals Inc)、UCART-33(Cellectis SA)和VOR-33(Columbia University)。
在各种实施方案中,CAR特异性结合CD38。示例性抗CD38 CAR包括但不限于UCART-38(Cellectis SA)。在各种实施方案中,CAR特异性结合CD38A2。示例性的抗CD38 A2 CAR包括但不限于T-007(TNK Therapeutics Inc)。在各种实施方案中,CAR特异性结合CD4。示例性抗CD4 CAR包括但不限于CD4CAR(iCell Gene Therapeutics)。在各种实施方案中,CAR特异性结合CD44。示例性抗CD44 CAR包括但不限于CAR-CD44v6(Istituto Scientifico HSan Raffaele)。在各种实施方案中,CAR特异性结合CD5。示例性抗CD5 CAR包括但不限于CD5CAR(iCell Gene Therapeutics)。在各种实施方案中,CAR特异性结合CD7。示例性抗CD7CAR包括但不限于CAR-pNK(PersonGen Biomedicine(苏州)Co Ltd)和CD7.CAR/28zeta CART细胞(Baylor College of Medicine)、UCART7(Washington University in St Louis)。
在各种实施方案中,CAR特异性结合CDH17。示例性抗CDH17 CAR包括但不限于ARB-001.T(Arbele Ltd)。在各种实施方案中,CAR特异性结合CEA。示例性的抗CEA CAR包括但不限于HORC-020(HumOrigin Inc)。在各种实施方案中,CAR特异性结合嵌合TGF-β受体(CTBR)。示例性的抗嵌合TGF-β受体(CTBR)CAR包括但不限于CAR-CTBR T细胞(bluebirdbio Inc)。在各种实施方案中,CAR特异性结合Claudin18.2。示例性的抗Claudin18.2 CAR包括但不限于CAR-CLD18 T细胞(Carsgen Therapeutics Ltd)和KD-022(南京KaediBiotech Inc)。
在各种实施方案中,CAR特异性结合CLL1。示例性抗CLL1 CAR包括但不限于KITE-796(Kite Pharma Inc)。在各种实施方案中,CAR特异性结合DLL3。示例性抗DLL3 CAR包括但不限于AMG-119(Amgen Inc)。在各种实施方案中,CAR特异性结合双BCMA/TACI(APRIL)。示例性抗双BCMA/TACI(APRIL)CAR包括但不限于AUTO-2(Autolus TherapeuticsLimited)。在各种实施方案中,CAR特异性结合双CD19/CD22。示例性抗双CD19/CD22 CAR包括但不限于AUTO-3(Autolus Therapeutics Limited)和LCAR-L10D(南京Legend BiotechCo Ltd)。在各种实施方案中,CAR特异性结合CD19。在各种实施方案中,CAR特异性结合双CLL1/CD33。示例性抗双CLL1/CD33 CAR包括但不限于ICG-136(iCell GeneTherapeutics)。在各种实施方案中,CAR特异性结合双EpCAM/CD3。示例性抗双EpCAM/CD3CAR包括但不限于IKT-701(Icell Kealex Therapeutics)。在各种实施方案中,CAR特异性结合Dual ErbB/4ab。示例性的抗双ErbB/4ab CAR包括但不限于LEU-001(King's CollegeLondon)。在各种实施方案中,CAR特异性结合双FAP/CD3。示例性抗双FAP/CD3 CAR包括但不限于IKT-702(Icell Kealex Therapeutics)。在各种实施方案中,CAR特异性结合EBV。示例性的抗EBV CAR包括但不限于TT-18(Tessa Therapeutics Pte Ltd)。
在各种实施方案中,CAR特异性结合EGFR。示例性抗EGFR CAR包括但不限于抗EGFRCAR T细胞疗法(CBLB MegaTAL,癌症)、bluebird bio(bluebird bio Inc)、表达CTLA-4检查点抑制剂+PD-1检查点抑制剂单克隆抗体(EGFR阳性晚期实体肿瘤)的抗EGFR CAR T细胞疗法、上海细胞治疗研究所(上海细胞治疗研究所)、CSG-EGFR(Carsgen TherapeuticsLtd)和EGFR-IL12-CART(Pregene(深圳)生物技术有限公司)。
在各种实施方案中,CAR特异性结合EGFRvIII。示例性的抗EGFRvIII CAR包括但不限于KD-035(南京Kaedi Biotech Inc)和UCART-EgfrVIII(Cellectis SA)。在各种实施方案中,CAR特异性结合Flt3。示例性的抗Flt3 CAR包括但不限于ALLO-819(Pfizer Inc)和AMG-553(Amgen Inc)。在各种实施方案中,CAR特异性结合叶酸受体。示例性的抗叶酸受体CAR包括但不限于EC17/CAR T(Endocyte Inc)。在各种实施方案中,CAR特异性结合G250。示例性抗G250 CAR包括但不限于自体T淋巴细胞疗法(G250-scFV转导的肾细胞癌)、伊拉斯谟医学中心(Daniel den Hoed癌症中心)。
在各种实施方案中,CAR特异性结合GD2。示例性抗GD2 CAR包括但不限于1RG-CART(University College London)、4SCAR-GD2(深圳基因免疫医学研究所)、C7R-GD2.CART细胞(Baylor College of Medicine)、CMD-501(Baylor College of Medicine)、CSG-GD2(Carsgen Therapeutics Ltd)、GD2-CART01(Bambino Gesu Hospital and ResearchInstitute)、GINAKIT细胞(Baylor College of Medicine)、iC9-GD2-CAR-IL-15T细胞(UNCLineberger Comprehensive Cancer Center)和IKT-703(Icell Kealex Therapeutics)。在各种实施方案中,CAR特异性结合GD2和MUC1。示例性抗GD2/MUC1 CAR包括但不限于PSMACAR-T(University of Pennsylvania)。
在各种实施方案中,CAR特异性结合GPC3。示例性抗GPC3 CAR包括但不限于ARB-002.T(Arbele Ltd)、CSG-GPC3(Carsgen Therapeutics Ltd)、GLYCAR(Baylor College ofMedicine)和TT-14(Tessa Therapeutics Pte Ltd)。在各种实施方案中,CAR特异性结合Her2。示例性抗Her2 CAR包括但不限于ACTR-087+trastuzumab(Unum Therapeutics Inc)、ACTR-707+trastuzumab(Unum Therapeutics Inc)、CIDeCAR(Bellicum PharmaceuticalsInc)、MB-103(Mustang Bio Inc)、RB-H21(Refuge Biotechnologies Inc)和TT-16(BaylorCollege of Medicine)。在各种实施方案中,CAR特异性结合IL13R。示例性的抗IL13R CAR包括但不限于MB-101(City of Hope)和YYB-103(YooYoung Pharmaceuticals Co Ltd)。在各种实施方案中,CAR特异性结合整联蛋白β-7。示例性抗整合素β-7CAR包括但不限于MMG49CAR T细胞疗法(Osaka University)。在各种实施方案中,CAR特异性结合LC抗原。示例性的抗LC抗原CAR包括但不限于VM-803(ViroMed Co Ltd)和VM-804(ViroMed Co Ltd)。
在各种实施方案中,CAR特异性结合间皮素。示例性抗间皮素CAR包括但不限于CARMA-hMeso(Johns Hopkins University)、CSG-MESO(Carsgen Therapeutics Ltd)、iCasp9M28z(Memorial Sloan-Kettering Cancer Center)、KD-021(南京Kaedi BiotechInc)、m-28z-T2(广州生物医学与健康研究院)、MesoCART(University of Pennsylvania)、meso-CAR-T+PD-78(MirImmune LLC)、RB-M1(Refuge Biotechnologies Inc)和TC-210(TCR2 Therapeutics Inc)。
在各种实施方案中,CAR特异性结合MUC1。示例性抗MUC1 CAR包括但不限于抗MUC1CAR T细胞疗法+PD-1敲除T细胞疗法(食道癌/NSCLC)、广州安杰生物医学科技/悉尼科技大学(广州安杰生物医学科技有限公司)、ICTCAR-043(Innovative Cellular TherapeuticsCo Ltd)、ICTCAR-046(Innovative Cellular Therapeutics Co Ltd)、P-MUC1C-101(Poseida Therapeutics Inc)和TAB-28z(OncoTab Inc)。在各种实施方案中,CAR特异性结合MUC16。示例性抗MUC16 CAR包括但不限于4H1128Z-E27(Eureka Therapeutics Inc)和JCAR-020(Memorial Sloan-Kettering Cancer Center)。
在各种实施方案中,CAR特异性结合nfP2X7。示例性的抗nfP2X7 CAR包括但不限于BIL-022c(Biosceptre International Ltd)。在各种实施方案中,CAR特异性结合PSCA。示例性的抗PSCA CAR包括但不限于BPX-601(Bellicum Pharmaceuticals Inc)。在各种实施方案中,CAR特异性结合PSMA。CIK-CAR.PSMA(Formula Pharmaceuticals Inc)和P-PSMA-101(Poseida Therapeutics Inc)。在各种实施方案中,CAR特异性结合ROR1。示例性的抗ROR1 CAR包括但不限于JCAR-024(Fred Hutchinson Cancer Research Center)。在各种实施方案中,CAR特异性结合ROR2。示例性抗ROR2 CAR包括但不限于CCT-301-59(F1 OncologyInc)。在各种实施方案中,CAR特异性结合SLAMF7。示例性抗SLAMF7 CAR包括但不限于UCART-CS1(Cellectis SA)。在各种实施方案中,CAR特异性结合TRBC1。示例性的抗TRBC1CAR包括但不限于AUTO-4(Autolus Therapeutics Limited)。在各种实施方案中,CAR特异性结合TRBC2。示例性的抗TRBC2 CAR包括但不限于AUTO-5(Autolus TherapeuticsLimited)。在各种实施方案中,CAR特异性结合TSHR。示例性抗TSHR CAR包括但不限于ICTCAT-023(Innovative Cellular Therapeutics Co Ltd)。在各种实施方案中,CAR特异性结合VEGFR-1。示例性的抗VEGFR-1CAR包括但不限于SKLB-083017(四川大学)。
在各种实施方案中,CAR是AT-101(AbClon Inc);AU-101、AU-105和AU-180(AuroraBiopharma Inc);CARMA-0508(Carisma Therapeutics);CAR-T(Fate Therapeutics Inc);CAR-T(Cell Design Labs Inc);CM-CX1(Celdara Medical LLC);CMD-502、CMD-503和CMD-504(Baylor College of Medicine);CSG-002和CSG-005(Carsgen Therapeutics Ltd);ET-1501、ET-1502和ET-1504(Eureka Therapeutics Inc);FT-61314(Fate TherapeuticsInc);GB-7001(上海基因化学有限公司);IMA-201(Immatics Biotechnologies GmbH);IMM-005和IMM-039(Immunome Inc);ImmuniCAR(TC BioPharm Ltd);NT-0004和NT-0009(BioNTech Cell and Gene Therapies GmbH)、OGD-203(OGD2 Pharma SAS)、PMC-005B(PharmAbcine)和TI-7007(Timmune Biotech Inc)。
在一些实施方案中,嵌合抗原受体包含抗体的氨基酸序列。在一些实施方案中,嵌合抗原受体包含抗体的抗原结合片段的氨基酸序列。胞外结合结构域的抗体(或其片段)部分识别并结合抗原的表位。在一些实施方案中,嵌合抗原受体的抗体片段部分是单链可变片段(scFv)。scFV包含单克隆抗体的轻片段和可变片段。在其他实施方案中,嵌合抗原受体的抗体片段部分是多链可变片段,其可包含多于一个细胞外结合结构域并因此同时结合多于一种抗原。在多链可变片段实施方案中,铰链区可以分隔不同的可变片段,提供必要的空间排列和灵活性。
在其他实施方案中,嵌合抗原受体的抗体部分包含至少一条重链和至少一条轻链。在一些实施方案中,嵌合抗原受体的抗体部分包含通过二硫键连接的两条重链和两条轻链,其中轻链各自通过二硫桥连接到重链之一。在一些实施方案中,轻链包含恒定区和可变区。位于抗体可变区的互补决定区负责抗体对特定抗原的亲和力。因此,识别不同抗原的抗体包含不同的互补决定区。互补决定区位于胞外结合结构域的可变结构域中,以及可变结构域(即可变重链和可变轻链)可以与连接子连接,或者在一些实施方式中,与二硫键连接。
在一些实施方案中,被胞外结构域识别和结合的抗原是蛋白质或肽、核酸、脂质或多糖。抗原可以是异源的,例如在病原细菌或病毒中表达的抗原。抗原也可以是合成的;例如,有些人对合成乳胶极度过敏,接触这种抗原会导致极端的免疫应答。在一些实施方案中,抗原是自体的,以及在患病或以其他方式改变的细胞上表达。例如,在一些实施方案中,抗原在肿瘤细胞中表达。在一些实施方案中,肿瘤细胞是实体肿瘤细胞。在其他实施方案中,肿瘤细胞是血液癌症,例如B细胞癌。在一些实施方案中,B细胞癌是淋巴瘤(例如霍奇金淋巴瘤或非霍奇金淋巴瘤)或白血病(例如B细胞急性淋巴细胞白血病)。示例性B细胞淋巴瘤包括弥漫性大B细胞淋巴瘤(DLBCL)、原发性纵隔B细胞淋巴瘤、滤泡性淋巴瘤、慢性淋巴细胞白血病(CLL)、小淋巴细胞淋巴瘤(SLL)、套细胞淋巴瘤、边缘区淋巴瘤、伯基特淋巴瘤、类伯基特淋巴瘤、淋巴浆细胞淋巴瘤(Waldenstrom巨球蛋白血症)和毛细胞白血病。在一些实施方案中,B细胞癌是多发性骨髓瘤。
抗体-抗原相互作用是由氢键、静电或疏水相互作用或范德华力引起的非共价相互作用。嵌合抗原受体的胞外结合结构域对抗原的亲和力可用下式计算:
KA=[抗体-抗原]/[抗体][抗原],其中
[Ab]=抗体上未占据结合位点的摩尔浓度;
[Ag]=抗原上未占据的结合位点的摩尔浓度;和
[Ab-Ag]=抗体-抗原复合物的摩尔浓度。
抗体-抗原相互作用也可以基于抗原与抗体的解离来表征。解离常数(KD)是结合率与解离率的比值,与亲和力常数成反比。因此,KD=1/KA。本领域技术人员将熟悉这些概念以及将知道传统方法,例如ELISA测定,可用于计算这些常数。
本文描述的嵌合抗原受体的跨膜结构域跨越CAR-T细胞脂质双层细胞膜并将细胞外结合结构域和细胞内信号传导结构域分开。在一些实施方案中,所述结构域源自具有跨膜结构域的其他受体,而在其他实施方案中,所述结构域是合成的。在一些实施方案中,跨膜结构域可源自非人跨膜结构域,以及在一些实施方案中,人源化。“人源化”是指使编码跨膜结构域的核酸序列得到优化,从而使其在人类个体中更可靠或有效地表达。在一些实施方案中,跨膜结构域源自在人免疫效应细胞中表达的另一种跨膜蛋白。此类蛋白质的实例包括但不限于T细胞受体(TCR)复合物、PD1或任何分化蛋白簇或其他蛋白质的亚基,其在免疫效应细胞中表达并具有跨膜结构域。在一些实施方案中,跨膜结构域将是合成的,以及此类序列将包含许多疏水残基。
在一些实施方案中,嵌合抗原受体被设计成在跨膜结构域和细胞外结构域、细胞内结构域或两者之间包含间隔物。此类间隔物的长度可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,间隔物的长度可为20、30、40、50、60、70、80、90或100个氨基酸。在其他实施方案中,间隔物的长度可以在100和500个氨基酸之间。间隔物可以是将一个结构域连接到另一个结构域并用于定位这样的连接结构域以增强或优化嵌合抗原受体功能的任何多肽。
本文考虑的嵌合抗原受体的胞内信号结构域包含初级信号结构域。在一些实施方案中,嵌合抗原受体包含初级信号结构域和次级或共刺激信号结构域。在一些实施方案中,结构域包含一个或多个基于酪氨酸的免疫受体激活基序或ITAM。在一些实施方案中,初级信号结构域包含一个以上的ITAM。整合到嵌合抗原受体中的ITAM可以源自其他细胞受体的ITAM。在一些实施方案中,包含ITAM的初级信号结构域可源自TCR复合物的亚基,例如CD3γ、CD3ε、CD3ζ或CD3δ(参见图1A)。在一些实施方案中,包含ITAM的初级信号结构域可以源自FcRγ、FcRβ、CD5、CD22、CD79a、CD79b或CD66d。在一些实施方案中,次级信号结构域源自CD28。在其他实施方案中,次级信号结构域源自CD2、CD4、CDS、CD8α、CD83、CD134、CD137、ICOS或CD154。
本文还提供了编码本文所述嵌合抗原受体的核酸。在一些实施方案中,核酸被分离或纯化。核酸的离体递送可以使用本领域已知的方法来完成。例如,可以用编码嵌合抗原受体的核酸载体转化从个体获得的免疫细胞。然后可以使用所述载体转化受体免疫细胞,从而使这些细胞表达嵌合抗原受体。转化免疫细胞的有效方法包括转染和转导。这样的方法是本领域公知的。例如,递送编码嵌合抗原受体的核酸分子(和编码碱基编辑器的核酸)的适用方法可以在国际第PCT/US2009/040040号专利申请案和美国专利号8,450,112;9,132,153;和9,669,058中找到,每个都在此全文并入。此外,本文描述的用于递送编码碱基编辑器的核酸的那些方法和载体适用于递送编码嵌合抗原受体的核酸。
本发明的一些方面提供了包含嵌合抗原和改变的内源基因的免疫细胞,所述改变的内源基因增强免疫细胞功能、对免疫抑制或抑制的抗性或其组合。在一些实施方案中,改变的内源基因可以通过碱基编辑产生。在一些实施方案中,碱基编辑可以减少或减弱基因表达。在一些实施方案中,碱基编辑可以减少或减弱基因激活。在一些实施方案中,碱基编辑可以减少或减弱基因产物的功能。在一些其他实施方案中,碱基编辑可以激活或增强基因表达。在一些实施方案中,碱基编辑可以增加基因产物的功能。在一些实施方案中,可以在外显子、内含子、外显子-内含子指令或其调控元件中修饰或编辑改变的内源基因。修饰可以编辑为基因或其调控元件中的单个核碱基。修饰可以在外显子、多于一个外显子、内含子或多于一个内含子,或其组合中。修饰可以在基因的开放阅读框中。修饰可以在基因的非翻译区,例如3'-UTR或5'-UTR。在一些实施方案中,修饰在内源基因的调控元件中。在一些实施方案中,修饰在启动子、增强子、操纵子、沉默子、绝缘子、终止子、转录起始序列、翻译起始序列(例如,Kozak序列)或其任何组合中。
表达内源性免疫细胞受体以及嵌合抗原受体的同种异体免疫细胞可以识别并攻击宿主细胞,这种情况称为移植物抗宿主病(GVHD)。免疫细胞受体复合物的α组分由TRAC基因编码,以及在一些实施方案中,所述基因被编辑使得TCR复合物的α亚基无功能或不存在。由于所述亚基是内源性免疫细胞信号传导所必需的,因此编辑所述基因可以降低由同种异体免疫细胞引起的移植物抗宿主病的风险。
宿主免疫细胞可以潜在地将同种异体CAR-T细胞识别为非自身细胞并引发免疫应答以去除非自身细胞。B2M在几乎所有有核细胞中表达并与MHC I类复合物相关(图1B)。循环宿主CD8+T细胞可以将这种B2M蛋白识别为非自身并杀死同种异体细胞。为了克服这种移植排斥,在一些实施方案中,将B2M基因编辑为敲除或敲弱表达。
在本发明的一些实施方案中,在CAR-T细胞中编辑PDCD1基因以敲除或敲弱表达。PDCD1基因编码细胞表面受体PD-1,一种在免疫细胞中表达的免疫系统检查点,其通过促进抗原特异性免疫细胞的凋亡参与降低自身免疫。通过敲除或敲弱PDCD1基因的表达,修饰后的CAR-T细胞凋亡的可能性较小,增殖的可能性较大,以及可以逃脱程序性细胞死亡免疫检查点。
CBLB基因编码在抑制免疫效应细胞活化中起重要作用的E3泛素连接酶。参考图1C所示,CBLB蛋白有利于导致免疫效应细胞耐受的信号通路,并积极抑制导致免疫效应细胞活化的信号传导。因为免疫效应细胞活化对于CAR-T细胞在移植后体内增殖是必需的,所以在本发明的一些实施方案中,CBLB被编辑为敲除或敲弱表达。
在一些实施方案中,在细胞被转化以表达嵌合抗原受体之前,可以在免疫细胞中进行基因编辑以增强免疫细胞的功能或减少免疫抑制或抑制。在其他方面,可以在CAR-T细胞中进行基因编辑以增强免疫细胞的功能或减少免疫抑制或抑制,即在免疫细胞被转化以表达嵌合抗原受体之后。
在一些实施方案中,免疫细胞可包含嵌合抗原受体(CAR)和一种或多种编辑基因、其一种或多种调节元件或其组合,其中编辑基因的表达被敲除或敲弱.在一些实施方案中,与类似的CAR-T细胞相比,CAR-T细胞具有降低的免疫原性,但没有进一步具有如本文所述的一种或多种编辑基因。在一些实施方案中,与类似的CAR-T相比,CAR-T细胞具有较低的激活阈值,但没有进一步具有如本文所述的一种或多种编辑基因。在一些实施方案中,与类似的CAR-T细胞相比,CAR-T细胞具有增加的抗肿瘤活性,但没有进一步具有如本文所述的一种或多种编辑基因。一个或多个基因可以通过碱基编辑进行编辑。在一些实施方案中,一种或多种基因,或其一种或多种调控元件,或其组合可以选自下列所组成的群组:c-abl致癌基因1(Abl1);c-abl癌基因2(Abl2);去整合素和金属蛋白酶结构域8(Adam8);去整合素和金属蛋白酶结构域17(Adam 17);腺苷脱氨酶(Ada);腺苷激酶(Adk);腺苷A2a受体(Adora2a);腺苷调节分子1(Adrm1);晚期糖基化终产物特异性受体(Ager)同种异体移植炎症因子1(Aif1);自身免疫调节剂(Aire);锚蛋白重复和LEM结构域(Ankle1);annecin A1(Anxa1);连接子相关蛋白复合物3β1sububit(Ap3b1);连接子相关蛋白复合物3δ1sububit(Ap3d1);类β淀粉蛋白(A4)前体蛋白结合家族B成员1相互作用蛋白(Apbb1ip);WNT信号通路调节剂(Apc);精氨酸酶肝(Arg 1);II型精氨酸酶(Arg 2);自噬相关5(Atg5);AtPase Cu++转运,α多肽(Atp7a);5-氮杂胞苷诱导基因2(Azi2);β2微球蛋白(B2m);BL2相关的细胞死亡激动剂(Bad);碱性亮氨酸拉链转录因子,类ATF(Batf);BCL2相关X蛋白(Bax);B细胞白血病/淋巴瘤2(Bcl2);B细胞白血病/淋巴瘤2相关蛋白A1d(Bcl2a1d);B细胞白血病/淋巴瘤(Bcl3);B细胞白血病/淋巴瘤6(Bcl6);B细胞白血病/淋巴瘤10(Bcl10);B细胞白血病/淋巴瘤11a(Bcl11a);B细胞白血病/淋巴瘤11b(Bcl11b);Bloom综合征、类RecQ解旋酶(Blm);Bmi1多梳无名指癌基因(Bmi 1);骨形态发生蛋白4(Bmp4);Braf转化基因(Braf);B和T淋巴细胞相关(Btla);Butyrophilin,亚科2,成员A1(Btn2a1);Butyrophilin,亚科2,成员A2(Btn2a2);类嗜酪蛋白1(Btnl1);类嗜酪蛋白2(Btnl2);类嗜酪蛋白6(Btnl6);钙通道,电压依赖性,β4亚基(Cacnb4);caspase招募结构域家族成员11名(Card11);加帽蛋白调节剂和肌球蛋白1连接子2(Carmil2);Caspase3(Casp3);小窝1(Cav1);核心结合因子β(Cbfb);CasitasB系淋巴瘤b(Cblb);包含88B(Ccdc88b)的线圈-线圈结构域;趋化因子(C-C基序)配体2(Ccl2);趋化因子(C-C基序)配体5(Ccl5);趋化因子(C-C基序)配体19(Ccl19);趋化因子(C-C基序)配体20(Ccl20);细胞周期蛋白D3(Ccnd3);趋化因子(C-C基序)受体2(Ccr2);趋化因子(C-C基序)受体6(Ccr6);趋化因子(C-C基序)受体7(Ccr7);趋化因子(C-C基序)受体9(Ccr9);CD1d1抗原(Cd1d1);CD1d2抗原(CD1d2);CD2抗原(CD2);CD3抗原,δ多肽(CD3d);CD3抗原,ε多肽(CD3d);CD4抗原(Cd4);CD5抗原(Cd5);CD6抗原(Cd6);CD8抗原(Cd8);CD24a抗原(Cd24a);CD27抗原(CD27);CD28抗原(Cd28);CD40配体(Cd40lg);CD44抗原(Cd44);CD46抗原,补体调节蛋白(Cd46);CD47抗原(Rh相关抗原,整合素相关信号转导器)(Cd47);CD48抗原(Cd48);CD59b抗原(Cd59b);CD74抗原(Cd74);CD80抗原(Cd80);CD81抗原(Cd81);CD83抗原(Cd83);CD86抗原(Cd86);CD151抗原(Cd151);CD160抗原(Cd160);CD209e抗原(Cd209e);CD244分子A(Cd244a);CD274抗原(Cd274);CD276抗原(Cd276);CD300A分子(Cd300a);类钙粘蛋白26(Cdh26);细胞周期蛋白依赖性激酶(Cdk6);细胞周期蛋白依赖性激酶抑制剂2A(Cdkn2a);癌胚抗原相关细胞粘附分子(Ceacam1);CCAAT/增强子结合蛋白(C/EBP)、β(Cebpb);环GMP-AMP合酶(Cgas);染色质解旋酶DNA结合蛋白7(Chd7);胆碱能受体,烟碱,α多肽7(Chrna7);C型凝集素域家族2,成员i(Clec2i);C型凝集素域家族4,成员a2(Clec4a2);C型凝集素域家族4,成员d(Clec4d);C型凝集素域家族4,成员e(Clec4e);C型凝集素域家族4,成员f(Clec4f);C型凝集素域家族4,成员g(Clec4g);唇裂和腭裂相关跨膜蛋白1(Clptm1);coronin,肌动蛋白结合蛋白1A(Coro1a);富含半胱氨酸的蛋白3(Crip3);c-src酪氨酸激酶(Csk);细胞毒性T淋巴细胞相关蛋白2α(Ctla2a);细胞毒性T淋巴细胞相关蛋白4(Ctla4);连环蛋白(钙粘蛋白相关蛋白),β1(Ctnnb1);胞苷5'-三磷酸合酶(Ctps);柯萨奇病毒和腺病毒受体(Cxadr);趋化因子(C-X-C基序)配体12(Cxcl12);趋化因子(C-X-C基序)受体(Cxcr4);CYLD赖氨酸63去泛素化酶(Cyld);细胞色素P450,家族26,亚家族b,多肽(Cyp26b1);多里奇基二磷酸寡糖蛋白糖转移酶(Ddost);脱氧hypusine合酶(Dhps);dicer1,核糖核酸酶III型(Dicer1);盘状大MAGUK支架蛋白1(Dlg1);盘状大MAGUK支架蛋白5(Dlg5);类δ经典Notch配体4(Dll4);DnaJ热休克蛋白家族(Hsp40)成员A3(Dnaja3);胞质分裂的奉献者2(Dock2);胞质分裂的奉献者8(Dock8);二肽基肽酶4(Dpp4);drosha,核糖核酸酶III型(Drosha);deltex1,E3泛素连接酶(Dtx1);双特异性磷酸酶3(Dusp3);双特异性磷酸酶10(Dusp10);双特异性磷酸酶22(Dusp22);双同源盒B-like1(Duxbl1);Epstein-Barr病毒诱导基因3(Ebi3);肝配蛋白B1(Efnb1);肝配蛋白B2(Efnb2);肝配蛋白B3(Efnb3);早期生长反应1(Egr1);早期生长反应3(Egr3);真核翻译起始因子2α激酶4(Eif2ak4);类E74因子4(Elf4);中胚层蛋白(Eomes);Eph受体B4(Ephb4);Eph受体B6(Ephb6);促红细胞生成素(Epo);erb-b2受体酪氨酸激酶(Erbb2);凝血因子II(凝血酶)类受体1(F2rl1);Fas(TNFRSF6)通过死亡结构域(Fadd)相关;具有序列相似性49的家族,成员B(Fam49b);Fanconi贫血,A组互补(Fanca);Fanconi贫血,互补组D2(Fancd2);Fas(TNF受体超家族成员6)(Fas);Fc受体,IgE,高亲和力I,γ多肽(Fcer1g);类纤维蛋白原蛋白1(Fgl1);类纤维蛋白原蛋白2(Fgl2);FK506结合蛋白1a(Fkbp1a);FK506结合蛋白1b((Fkbp1b);flotillin2(Flot2);类FMS酪氨酸激酶(Flt3);叉头盒J1(Foxj1);叉头盒N1(Foxn1);叉头盒P1(Foxp1);叉头盒P3(Foxp3);岩藻糖基转移酶7(Fut7);Fyn原癌基因(Fyn);卷曲类受体5(Fzd5);卷曲类受体7(Fzd7);卷曲类受体8(Fzd8);生长停滞和DNA损伤诱导型45γ(Gadd45g);GATA结合蛋白3(GATA3);GTPase,IMAP家族成员1(Gimap1);间隙连接蛋白,α1(Gja1);GLI-Kruppel家族成员GLI3(Gli3);3-磷酸甘油酰基转移酶,线粒体(Gpam);G蛋白偶联受体18(Gpr18);凝溶胶蛋白(Gsn);组织相容性2,II类抗原A,α(H2-Aa);组织相容性2,II类抗原A,β1(H2-Ab1);组织相容性2,II类,位点DMa(H2-DMa);组织相容性2,M区位点3(H3-M3);组织相容性2,O区α位点(H2-Oa);组织相容性2,T区位点23(H2-T23);甲型肝炎v病毒细胞受体2(Havcr2);造血1(hem1);hes家族bHLH转录因子1(Hes1);稳态铁调节剂(Hfe);H2.0-likehomeobox(Hlx);HCLS1结合蛋白3(Hs1bp3);含有(Hsh2d)的造血SH2结构域;热休克蛋白90,α(胞质),A类成员1(Hsp90aa1);热休克蛋白1(伴侣蛋白)(Hspd1);热休克105kDa/110kDa蛋白1(Hsph1);细胞间粘附分子1(Icam1);诱导型T细胞共刺激剂(Icos);icos配体(Icosl);吲哚胺2,3-双加氧酶1(Ido1);干扰素α1(Ifna1);干扰素α2(Ifna2);干扰素α4(Ifna4);干扰素α5(Ifna5);干扰素α6(Ifna6);干扰素α7(Ifna7);干扰素α9(Ifna9);干扰素α11(Ifna11);干扰素α12(Ifna12);干扰素α13(Ifna13);干扰素α14(Ifna14);干扰素α15(Ifna15);干扰素α16(Ifna16);干扰素αB(Ifnab);干扰素(α和β)受体1(Ifnar1);干扰素β1(Ifnb1);干扰素γ(Ifng);干扰素κ(Ifnk);干扰素zeta(Ifnz);类胰岛素生长因子1(Igf1);类胰岛素生长因子2(Igf2);类胰岛素生长因子结合蛋白2(Igfbp2);印度刺猬(Ihh);IKAROS家族锌指1(Ikzf1);白介素1β(Il1b;白介素1家族,成员8(Il1f8);白介素1受体类2(Il1rl2);白介素2(Il2);白介素2受体,α链(Il2ra);白介素2受体,γ链(Il2rg));白细胞介素4(Il4);白细胞介素4受体,α(Il4ra);白介素6(Il6);白细胞介素6信号传感器(Il6st);白细胞介素7(Il7);白细胞介素7受体(Il7r);白细胞介素12a(Il12a);白细胞介素12b(Il12b);白细胞介素12受体,β1(Il12rb1);白细胞介素15(Il15);白细胞介素18(Il18);白细胞介素18受体1(Il18r1);白细胞介素20受体β(Il20rb);白细胞介素21(Il21);白细胞介素23,α亚基p19(Il23a);白细胞介素27(Il27);胰岛素II(Ins2);干扰素调节因子1(Irf1);干扰素调节因子4(Irf4);痒,E3泛素蛋白连接酶(Itch);整合素,αD(Itgad);整合素αL(Itgal);整合素αM(Itgam);整合素αV(Itgav);整合素αX(Itgax);整合素β2(Itgb2);IL2诱导型T细胞激酶(Itk);肌醇1,4,5-三磷酸3-激酶B(Itpkb);锯齿状2(Jag2);Janus激酶3(Jak3);连接粘附分子像9(Jam9);jumonji结构域包含6(Jmjd6);K(赖氨酸)乙酰转移酶2A(Kat2a);KDEL(Lys-Asp-Glu-Leu)内质网蛋白滞留受体1(Kdelr1);KIT原癌基因受体酪氨酸激酶(Kit);淋巴细胞激活基因3(Lag3);用于激活T细胞的连接子(Lat);淋巴细胞跨膜连接子1(Lax1);淋巴细胞蛋白酪氨酸激酶(Lck);淋巴细胞胞质蛋白1(Lcp1);淋巴增强子结合因子1(Lef1);瘦素(Lep);瘦素受体(Lepr);LFNGO-岩藻糖基肽3-β-N-乙酰氨基葡萄糖转移酶(Lfng);凝集素,半乳糖结合,可溶性1(Lgals1);凝集素,半乳糖结合,可溶性3(Lgals3);凝集素,半乳糖结合,可溶性8(Lgals8);凝集素,半乳糖结合,可溶性9(Lgals9);连接酶IV,DNA,ATP依赖性(Lig4);类白细胞免疫球蛋白受体,亚家族B,成员4A(Lilrb4a);类肢体区域1(Lmbrl);LIM结构域只有1(Lmo1);类赖氨酰氧化酶3(Loxl3);含有32(Lrrc32)的富含亮氨酸的重复序列;淋巴细胞抗原9(Ly9);MAD1类有丝分裂停滞缺陷11(Mad1l1);v-maf肌肉腱膜纤维肉瘤癌基因家族,蛋白B(禽类)(Mafb);MALT1副半胱天冬酶(Malt1);丝裂原活化蛋白激酶8相互作用蛋白1(Mapk8ip10);膜相关环-CH型手指7(Marchf7);中期因子(Mdk);甲基转移酶3(Mettl3);类MHC I白细胞2(Mill2);髓鞘蛋白零类2(Mpzl2);moesin(msn);雷帕霉素激酶(Mtor)的机制靶点;成髓细胞癌基因(Myb);肌球蛋白,重多肽9,非肌肉(Myh9);非SMC凝聚素II复合物,亚基H2(Ncaph2);酪氨酸激酶衔接蛋白1(Nck1)的非催化区;酪氨酸激酶衔接蛋白2(Nck2)的非催化区;NCK相关蛋白1类(Nckap1l);核受体共阻遏物1(Ncor1);尼克斯特林(Ncstn);Nedd4家族相互作用蛋白1(Ndfip1);神经前体细胞表达,发育下调4(Nedd4);活化T细胞的核因子,细胞质,钙调神经磷酸酶依赖性(Nfatc3);B细胞中κ轻多肽基因增强子的核因子抑制剂δ(Nfkbid);非同源末端连接因子1(Nhej1);NFKB激活蛋白(Nkap);NK2同源盒3(Nkx2-3);NLR家族,包含3(Nlrc3)的CARD结构域;NLR家族,含有3个pyrin结构域(Nlrp3);Notch调控的锚蛋白重复蛋白(Nrarp);包含5OTU结构域(Otud5);嘌呤能受体P2X,配体门控离子通道,7(P2rx7);与鞘糖脂微区1(Pag1)相关的磷蛋白;POZ(BTB)和含锌指1(Patz1)的AT钩;PRKC,细胞凋亡,WT1,调节剂(Pawr);配对盒1(Pax1);程序性细胞死亡1配体2(Pdcd1lg2);磷酸二酯酶5A,cGMP特异性(Pde5a);佩利诺1(Peli1);磷酸肌醇-3-激酶调节亚基(Pik3r6);磷脂酶A2,IIA组(Pla2g2a);磷脂酶A2,组IID(Pla2g2d);磷脂酶A2,IIE组(Pla2g2e);磷脂酶A2,IIF组(Pla2g2f);嘌呤核苷磷酸化酶(Pnp);蛋白磷酸酶3,催化亚基,β异形体(Ppp3cb);包含1PR结构域,具有ZNF结构域(Prdm1);过氧还蛋白2(Prdx2);蛋白激酶,cAMP依赖性调节,I型,α(Prkar1a);蛋白激酶C,theta2(Prkcq);蛋白激酶C,zeta(Prkcz);蛋白激酶,DNA激活,催化多肽(Prkdc);Prosaposin(Psap);早老素1(Psen1);早老素2(Psen2);前列腺素E受体4(EP4异形体)(Ptger4);蛋白酪氨酸磷酸酶,非受体2型(Ptpn2);蛋白酪氨酸磷酸酶,非受体6型(Ptpn6);蛋白酪氨酸磷酸酶,非受体22型(淋巴)(Ptpn22);蛋白酪氨酸磷酸酶,受体类型,C(Ptprc);PYD和包含7CARD结构域个(Pycard);RAB27A,RAS癌基因家族成员(Rab27a);RAB29,RAS癌基因家族成员(Rab29);(Rac家族小GTPase2);重组激活基因1(Rag1);重组激活基因2(Rag2);RAS蛋白激活剂像3(Rasal3);RAS鸟苷释放蛋白1(Rasgrp1);RINGCCCH(C3H)结构域1(Rc3h1);无名指和CCCH型锌指结构域2(Rc3h2);ras同源家族成员A(Rhoa);ras同源家族成员H(Rhoh);受体(TNFRSF)-相互作用的丝氨酸-苏氨酸激酶2(Ripk2);RHO家族相互作用细胞极化调节器2(Ripor2);RAR相关孤儿受体α(Rora);RAR相关孤儿受体γ(Ror);核糖体蛋白L22(Rpl22);核糖体蛋白S6(Rps6);含有2(Rsad2)的自由基S-腺苷甲硫氨酸结构域;矮小相关转录因子1(Runx1);矮小相关转录因子2(Runx2);矮小相关转录因子3(Runx3);T细胞识别的鳞状细胞癌抗原(Sart1);SAM和SH3结构域包含3(Sash3);特殊的富含AT的序列结合蛋白1(Satb1);Syndecan4(Sdc4);硒蛋白K(Selenok);sema结构域、免疫球蛋白结构域(Ig)、跨膜结构域(TM)和短胞质结构域,(semaphorin)4A(Sema4a);表面活性剂相关蛋白D(Sftpd);包含无名指1(Sh3rf1)的SH3结构域;src同源2包含结构域的转化蛋白B(Shb);音速刺猬(嘘);信号调节蛋白α(Sirpa);信号调节蛋白β1A(Sirpb1a);信号调节蛋白β1B(Sirpb1b);信号调节蛋白β1C(Sirpb1c);抑制诱导跨膜连接子1(Sit1);Src-like-adaptor2(Sla2);SLAM家族成员6(Slamf6);溶质载体家族4(阴离子交换剂),成员1;(Slc4a1);溶质载体家族11(质子耦合二价金属离子转运蛋白),成员1(Slc11a1);溶质载体家族46,成员2(Slc46a2);施拉芬1;SMAD家庭成员3(Smad3);SMAD家庭成员7(Smad7);细胞因子信号抑制剂1(Socs1);细胞因子信号抑制因子5(Socs5);细胞因子信号抑制因子6(Socs6);SOSRas/Rac鸟嘌呤核苷酸交换因子1(Sos1)、SOSRas/Rac鸟嘌呤核苷酸交换因子2(Sos2)、SRY(性别决定区Y)-框4(Sox4);唾液酸蛋白(Spn);信号转导和转录激活因子3(Stat3);信号转导和转录激活因子5A(Stat5A);信号转导和转录激活因子5B(Stat5B);丝氨酸/苏氨酸激酶11(Stk11);突触融合蛋白11(Stx11);脾酪氨酸激酶(Syk);T细胞相互作用,激活骨髓细胞1(Tarm1)上的受体;T-box21(Tbx21);T细胞,免疫调节剂1,ATPase,H+转运,溶酶体V0蛋白A3(Tcirg1);转化生长因子,β1(Tgfb1);转化生长因子,β受体II(Tgfbr2);胸腺细胞选择相关(Themis);胸腺细胞抗原1,theta(Thy1);具有Ig和ITIM结构域(Tigit)的T细胞免疫受体;跨膜蛋白98(Tmem98);类跨膜131(Tmem131l);肿瘤坏死因子,α诱导蛋白8类2(Tnfa1p8l2);肿瘤坏死因子受体超家族,成员4(Tnfrsf4);肿瘤坏死因子受体超家族,成员13c(Tnfrsf13c);肿瘤坏死因子(配体)超家族,成员4(Tnfsf4);肿瘤坏死因子(配体)超家族,成员8(Tnfsf8);肿瘤坏死因子(配体)超家族,成员9(Tnfsf9);肿瘤坏死因子(配体)超家族,成员11(Tnfsf11);肿瘤坏死因子(配体)超家族,成员13b(Tnfsf13b);肿瘤坏死因子(配体)超家族,成员14(Tnfsf14);肿瘤坏死因子(配体)超家族,成员18(Tnfsf18);TNF受体相关因子6(Traf6);在骨髓细胞类2(Trem12)上表达的触发受体;T细胞受体α连接18(Traj18);三素修复核酸外切酶1(Trex1);转化相关蛋白53(Trp53);TSC复合亚基1(Tsc1);扭曲原肠胚形成BMP信号调节剂1(Twsg1);血管细胞粘附分子1(Vcam1);vanin1(Vnn1);V-set和含有4免疫球蛋白结构域(Vsig4);WD重复和FYVE结构域包含4(Wdfy4);无翼型MMTV集成位点家族,成员1(Wnt1);无翼型MMTV集成位点家族,成员4(Wnt4);包含E3泛素蛋白连接酶1(Wwp1)的WW结构域;趋化因子(C基序)配体1(Xcl1);锌指和BTB结构域包含1(Zbtb1);锌指和BTB结构域含有7B(Zbtb7B);锌指CCCH型含8(Zc3h8);锌指CCCH型含12A(Zc3h12a);锌指CCCH型含12D(Zc3h12d);锌指E-box结合同源框1(Zeb1);锌指蛋白36,C3H型(Zfp36);锌指蛋白36,类C3H型1(Zfp36L1);锌指蛋白36,类C3H型2(Zfp36L2);和锌指蛋白683(Zfp683)。
在一些实施方案中,免疫细胞包含嵌合抗原受体和一种或多种编辑基因、其调节元件或其组合。编辑的基因可以是免疫应答调节基因、免疫原性基因、检查点抑制剂基因、参与免疫应答的基因、细胞表面标志物,例如。T细胞表面标志物,或其任何组合。在一些实施方案中,免疫细胞包含嵌合抗原受体和与活化的T细胞增殖相关的编辑基因,例如Fyn、Itgad、Itgal、Itgam、Itgb2、Satb1或Ephb6、其调控元件,或其组合。在一些实施方案中,免疫细胞包含嵌合抗原受体和与α-βT细胞活化相关的编辑基因,例如Dock2、Rorc、Lef1或TCF7、其调节元件或其组合。在一些实施方案中,免疫细胞包含嵌合抗原受体和与γ-δT细胞活化相关的编辑基因,例如Jag2、Sox13、Mill2或Jaml、其调节元件或其组合。在一些实施方案中,免疫细胞包含嵌合抗原受体和与T细胞增殖的正调节相关的编辑基因,例如,Cd24a、Cd86、Epo、Fadd、Icosl、Igfl、Igf2、Igfbp2、Tnfsf4、Tnfsf9、Gpam、Il2、Il2ra、Il4、Stat5a、Stat5b、Gli3、Ihh、Itpkb、Nkap、Shh、Ada、Cd24a、Cd28、Ceacam1、Socs1、Cd83、Cd81、Cd74、Bad、Gata3、白细胞介素2受体链、白介素4、白介素7、白介素12a或FoxP3或其调控元件,或其组合。在一些实施方案中,免疫细胞包含嵌合抗原受体和负调节辅助性T细胞增殖或分化的编辑基因,例如Xcl1、Jak3、Rc3h1、Rc3h2、Tbx21、Zbtb7b、Tbx21、Zc3h12a、Smad3、Loxl3、Socs5、Zfp35或Bcl6或其调控元件,或其组合。在一些实施方案中,编辑的基因可以是检查点抑制剂基因,例如,例如PD1基因、PDL1基因,或与其形成或激活的途径相关或调节其的成员。
在一些实施方案中,本文提供具有编辑的TRAC基因的免疫细胞(其中,TRAC基因可以包含一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个碱基编辑),使得免疫细胞不表达内源性功能性T细胞受体α链。在一些实施方案中,免疫细胞是表达嵌合抗原受体的T细胞(CAR-T细胞)。在一些实施方案中,本文提供了在TRAC基因中具有碱基编辑的CAR-T细胞,使得所述CAR-T细胞具有减少的或可忽略的内源性T细胞受体α蛋白的表达或没有表达。
在一些实施方案中,免疫细胞包含经编辑的TRAC基因,以及另外包含至少一种经编辑的基因。至少一个编辑基因可以选自前述段落中提到的基因列表。在一个实施方案中,免疫细胞可以包含编辑的TRAC基因、编辑的PDCD1基因、编辑的CD52基因、编辑的CD7基因、编辑的B2M基因、编辑的CD5基因、编辑的CBLB基因或其任意组合。在一些实施方案中,单个修饰事件(例如电穿孔)可以引入一个或多个基因编辑。在一些实施方案中,至少四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十或更多个编辑可以同时引入一个或多个基因中。
在一些实施方案中,免疫细胞包含经编辑的TRAC基因和经编辑的PDCD1、CD52、CD7、B2M、CD5或CBLB基因,或其组合。在一些实施方案中,免疫细胞包含一个或多个编辑基因,选自TRAC、PDCD1、CD52、CD7、B2M、CD5、B2M、CD5和CBLB基因。
在一些实施方案中,免疫细胞可以包含编辑的TRAC基因、编辑的CD2基因、编辑的CD3ε基因、编辑的CD3γ基因、编辑的CD3δ基因、编辑的CD5基因、编辑的CD7基因、编辑的CD30基因、编辑的CD33基因、编辑的B2M基因、编辑的CD52基因、编辑的CD70基因、编辑的CBLB基因、编辑的CIITA基因或其任何组合。
在一些实施方案中,本文提供具有编辑的TRBC1或TRBC2基因的免疫细胞,使得免疫细胞不表达内源性功能性T细胞受体β链。在一些实施方案中,本文提供具有编辑的TRBC1/TRBC2基因的CAR-T细胞,使得CAR-T细胞表现出内源性T细胞受体β链的表达降低或可忽略不计或不表达。
在一些实施方案中,免疫细胞包含编辑的TRBC1/TRBC2基因,此外,至少包含编辑的基因。至少一个编辑基因可以选自前述段落中提到的基因列表。在一些实施方案中,免疫细胞包含编辑的TRBC1/TRBC2基因和编辑的PDCD1、CD52或CD7基因,或其组合。在一些实施方案中,CAR-T细胞包含一个或多个碱基编辑基因,选自TRBC1/TRBC2基因、PDCD1、CD52和CD7基因。在一些实施方案中,每个编辑的基因可以包含单个碱基编辑。在一些实施方案中,每个编辑基因可以在基因的不同区域包含多个碱基编辑。
在一些实施方案中,免疫细胞包含编辑的TRBC1/TRBC2基因和编辑的PDCD1、CD52、CD7、B2M、CD5或CBLB基因,或其组合。在一些实施方案中,免疫细胞可以是CAR-T细胞。在一些实施方案中,CAR-T细胞包含一个或多个编辑基因,选自TRBC1/TRBC2、PDCD1、CD52、CD7、B2M、CD5、B2M、CD5和CBLB基因。
在一些实施方案中,免疫细胞可以包含编辑的TRBC1/TRBC2基因、编辑的CD2基因、编辑的CD3ε基因、编辑的CD3γ基因、编辑的CD3δ基因、编辑的CD5基因、编辑的CD7基因、编辑的CD30基因、编辑的CD33基因、编辑的B2M基因、编辑的CD52基因、编辑的CD70基因、编辑的CBLB基因、编辑的CIITA基因或其任何组合。
在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRAC、B2M、PDCD1、CBLB基因或其组合,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRAC基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRAC和B2M基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRAC和PDCD1基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRAC和CBLB基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRAC、B2M和PDCD1基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRAC、B2M和CBLB基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞或免疫效应细胞包含嵌合抗原受体和编辑的TRAC、PDCD1和CBLB基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原和编辑的TRAC、B2M、PDCD1和CBLB基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的B2M基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的B2M和PDCD1基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的B2M和CBLB基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的B2M、PDCD1和CBLB基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的PDCD基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的PDCD1和CBLB基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的CBLB,编辑基因的表达被敲除或敲弱。
在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRAC、编辑的CD2基因、编辑的CD3ε基因、编辑的CD3γ基因、编辑的CD3δ基因、编辑的CD5基因、编辑的CD7基因、编辑的CD30基因、编辑的CD33基因、编辑的B2M基因、编辑的CD52基因、编辑的CD70基因、编辑的CBLB基因、编辑的CIITA基因或其任何组合,其中编辑的基因的表达是被敲除或敲弱。
在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TRBC1或TRBC2基因、编辑的CD2基因、编辑的CD3ε基因、编辑的CD3γ基因、编辑的CD3δ基因、编辑的CD5基因、编辑的CD7基因、编辑的CD30基因、编辑的CD33基因、编辑的B2M基因、编辑的CD52基因、编辑的CD70基因、编辑的CBLB基因、编辑的CIITA基因或其任何组合,其中编辑的基因被敲除或敲弱。
在一些实施方案中,可以编辑免疫细胞,包括但不限于包含选自任何上述基因编辑的编辑基因的任何免疫细胞,以在其他基因中产生增强CAR-T功能或降低CAR-T功能的突变。免疫抑制或抑制细胞。例如,在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2、ZAP70、NFATc1、TET2基因或其组合,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2和ZAP70基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2和ZAP70基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2和NFATC1基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2和TET2基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2、ZAP70和NFATC1基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2、ZAP70和TET2基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TGFBR2、NFATC1和TET2基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原和编辑的TGFBR2、ZAP70、NFATC1和TET2基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的ZAP70基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的ZAP70和NFATC1基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的ZAP70和TET2基因,其中编辑的基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的ZAP70、PDCD1和TET2基因,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的PCCDC1基因,其中编辑的基因的表达被敲除或被敲弱。在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的PCDC1和TET2基因,其中编辑的基因的表达被敲除或敲弱。以及在一些实施方案中,免疫细胞包含嵌合抗原受体和编辑的TET2,编辑的基因的表达被敲除或敲弱。
免疫细胞中靶基因的编辑
在一些实施方案中,本文提供在内源基因或其调控元件中具有至少一个经修饰的免疫细胞。在一些实施方案中,免疫细胞可以在至少两个、至少三个、四个、五个、六个、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十或更多个内源基因或其调控元件中包含至少一个修饰。在一些实施方案中,至少一个修饰是单个核碱基修饰。在一些实施方案中,至少一个修饰是通过碱基编辑进行的。碱基编辑可以位于基因的任何合适位置,或位于基因的调控元件中。因此,可以理解例如在起始密码子处的单碱基编辑可以完全消除基因的表达。在一些实施方案中,碱基编辑可以在外显子内的位点进行。在一些实施方案中,碱基编辑可以在一个以上外显子的位点进行。在一些实施方案中,碱基编辑可以在基因中多个外显子的任何外显子处进行。在一些实施方案中,碱基编辑可将过早的终止密码子引入外显子,导致缺少翻译产物或截短的可能错误折叠从而通过降解消除,或可能产生容易降解的不稳定mRNA。在一些实施方案中,免疫细胞是T细胞。在一些实施方案中,免疫细胞是CAR-T细胞。
在一些实施方案中,可以在例如人TRAC基因(UCSC基因组数据库ENSG00000277734.8)的外显子1,或外显子2,或外显子3或外显子4上进行碱基编辑。在一些实施方案中,在外显子1内的位点进行人TRAC基因的碱基编辑。在一些实施方案中,在外显子2内的位点进行人TRAC基因的碱基编辑。在一些实施方案中,在人TRAC基因中进行碱基编辑在外显子3内的位点。在一些实施方案中,在外显子4内的位点进行人类TRAC基因的碱基编辑。在一些实施方案中,可以对人类TRAC基因的外显子1、外显子2、外显子3、外显子4或其任意组合进行一种或多种碱基编辑。
例如,可以对人B2M基因(染色体15,NC_000015.10,44711492-44718877;示例性mRNA序列4NM_0040)的外显子1,或外显子2,或外显子3或外显子4进行碱基编辑。在一些实施方式中,人B2M基因的碱基编辑在外显子1内的位点进行。在一些实施方式中,人B2M基因的碱基编辑在外显子2内的位点进行。在一些实施方式中,人B2M基因中的碱基编辑在外显子3内的位点。在一些实施方案中,在外显子4内的位点进行人类B2M基因的碱基编辑。在一些实施方案中,可以对人类B2M基因的外显子1、外显子2、外显子3、外显子4或其任意组合进行一种或多种碱基编辑。
在一些实施方案中,可以对内含子进行碱基编辑。例如,可以对内含子进行碱基编辑。在一些实施方案中,碱基编辑可以在内含子内的位点进行。在一些实施方式中,碱基编辑可以在一个以上内含子的位点进行。在一些实施方案中,碱基编辑可以在基因中多个内含子的任何外显子处进行。在一些实施方案中,可以对外显子、内含子或外显子和内含子的任何组合进行一种或多种碱基编辑。
例如,可以对例如人TRAC基因中的任何一个或多个内含子进行碱基编辑。在一些实施方案中,人TRAC基因的碱基编辑在内含子1内的位点进行。在一些实施方案中,人TRAC基因的碱基编辑在内含子2内的位点进行。在一些实施方案中,人TRAC基因的碱基编辑进行在内含子3内的位点上。在一些实施方案中,可以对人TRAC基因在外显子1、外显子2、外显子3、外显子4、内含子1、内含子2、内含子3或其任何组合处进行一项或多项碱基编辑操作.在一些实施方案中,可以对人TRAC基因的最后一个非编码外显子进行一个或多个碱基编辑。
在一些实施方案中,修饰或碱基编辑可以在启动子位点内。在一些实施方案中,碱基编辑可被引入替代的启动子位点内。在一些实施方案中,碱基编辑可以在5'调控元件中,例如增强子。在一些实施方案中,可以引入碱基编辑以破坏核酸结合蛋白的结合位点。示例性的核酸结合蛋白可以是聚合酶、核酸酶、促旋酶、拓扑异构酶、甲基化酶或甲基转移酶、转录因子、增强子、PABP、锌指蛋白等。
在一些实施方案中,碱基编辑可产生剪接受体-剪接供体(SA-SD)位点。例如,产生SA-SD或在SA-SD位点的靶向碱基编辑会导致基因表达降低。例如,TRACC5的外显子1SD位点可能是碱基编辑(GT-AT)的目标;可以靶向TRAC外显子3SA中断(AG-AA);C6位置的B2M外显子1SD可能会被碱基编辑(GT-AT)破坏;可以靶向C6处的B2M外显子3SA(AG-AA)。
在一些实施方案中,本文提供一种免疫细胞,在一个或多个内源基因中具有至少一个修饰。在一些实施方案中,免疫细胞可具有一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九个、二十个或更多个内源基因。在一些实施方案中,修饰在内源基因中产生过早终止密码子。在一些实施方案中,修饰是单碱基修饰。在一些实施方案中,修饰是通过碱基编辑产生的。过早终止密码子可以在外显子、内含子或非翻译区中产生。在一些实施方案中,碱基编辑可用于在一个或多个替代阅读框中引入一个以上的终止密码子。例如,可以通过碱基编辑在TRAC的外显子3C4位置(CAA-TAA)引入一个过早的终止密码子。
在一些实施方案中,修饰/碱基编辑可以在3'-UTR处引入,例如,在聚腺苷酸化(poly-A)位点中。在一些实施方案中,碱基编辑可以在5'-UTR区域上进行。
嵌合抗原受体插入免疫细胞基因
在一些实施方案中,嵌合抗原受体被插入到TRAC基因中。这有好处。首先,由于TRAC在免疫细胞中高度表达,当其构建体被设计为将嵌合抗原受体插入到TRAC基因中时,嵌合抗原受体将类似地表达,使得受体的表达由TRAC启动子驱动。其次,将嵌合抗原受体插入TRAC基因将敲除TRAC表达。在一些实施方案中,本文所述的基因编辑系统可用于将嵌合抗原受体插入TRAC基因座中。特异于TRAC基因座的gRNA可以将基因编辑系统向导至所述基因座并启动双链DNA切割。在特定实施方案中,gRNA与Cas12b结合使用。在各个实施方案中,基因编辑系统与具有编码CAR受体的序列的核酸结合使用。在下表1A中提供了示例性向导RNA。
表1A
Figure BDA0003263753870001701
Figure BDA0003263753870001711
编码嵌合抗原受体和核酸的DNA构建体,其包含位于gRNA靶向序列侧翼的延伸的TRAC DNA片段。不受理论的束缚,构建体结合互补的TRAC序列,然后将位于构建体上TRAC序列附近的嵌合抗原受体DNA插入病变部位,有效地敲除TRAC基因并敲除在嵌合抗原受体核酸中。表1提供了TRAC基因的向导RNA,可以将碱基编辑机制向导到TRAC基因座,从而能够插入嵌合抗原受体核酸。前11个gRNAS用于BhCas12b核酸酶。第二组11个用于BvCas12b核酸酶。这些都是为了通过创建双链断裂在TRAC插入CAR,而不是用于碱基编辑。
表1B:TRAC向导RNA
Figure BDA0003263753870001721
Figure BDA0003263753870001731
Figure BDA0003263753870001741
表1B:接续
Figure BDA0003263753870001742
Figure BDA0003263753870001751
前11个gRNA用于BhCas12b核酸酶。第二组11个gRNA用于BvCas12b核酸酶。首先是粗体的支架序列。
在一些实施方案中,可以使用BE4碱基编辑器将编码本发明嵌合抗原受体的核酸靶向TRAC基因座。在一些实施方案中,嵌合抗原受体使用CRISPR/Cas9碱基编辑系统靶向TRAC基因座。
为了产生上述基因编辑,从个体收集免疫细胞并与两个或多个向导RNA和包含核酸可编程DNA结合蛋白(napDNAbp)和胞苷脱氨酶或腺苷脱氨酶的核碱基编辑器多肽接触。在一些实施方案中,收集的免疫细胞与至少一个核酸接触,其中所述至少一个核酸编码两个或更多个向导RNA和包含核酸可编程DNA结合蛋白(napDNAbp)和胞苷脱氨酶的核碱基编辑器多肽。在一些实施方案中,gRNA包含核苷酸类似物。这些核苷酸类似物可以抑制细胞过程中gRNA的降解。表2提供了用于gRNA的目标序列。
表2:示例性目标序列
Figure BDA0003263753870001761
Figure BDA0003263753870001771
Figure BDA0003263753870001781
本发明中使用的胞苷和腺苷脱氨酶核碱基编辑器可以作用于DNA,包括单链DNA。介绍了使用其在免疫细胞中的靶核碱基序列中产生经修饰的方法。
在某些实施方案中,本文提供的融合蛋白包含一种或多种改善融合蛋白的碱基编辑活性的特征。例如,本文提供的任何融合蛋白可以包含具有降低的核酸酶活性的Cas9结构域。在一些实施方案中,本文提供的任何融合蛋白可具有不具有核酸酶活性的Cas9结构域(dCas9),或切割双链DNA分子的一条链的Cas9结构域,称为Cas9切口酶(nCas9)。不希望受任何特定理论的束缚,催化残基(例如,H840)的存在保持了Cas9切割与靶向核碱基相对的非编辑(例如,非甲基化)链的活性。催化残基(例如,D10到A10)的突变可防止包含靶A残基的编辑链的切割。此类Cas9变异体可以根据gRNA定义的靶序列在特定位置产生单链DNA断裂(缺口),从而修复非编辑链,最终导致非编辑链上的核碱基发生变化。
腺苷脱氨酶
在一些实施方案中,本发明的融合蛋白包含腺苷脱氨酶结构域。在一些实施方案中,本文提供的腺苷脱氨酶能够使腺嘌呤脱氨。在一些实施方案中,本文提供的腺苷脱氨酶能够使DNA脱氧腺苷残基中的腺嘌呤脱氨基。腺苷脱氨酶可以源自任何合适的生物体(例如,大肠杆菌)。在一些实施方案中,腺嘌呤脱氨酶是天然存在的腺苷脱氨酶,其包括一个或多个相应于本文提供的任何突变(例如,ecTadA中的突变)的突变。本领域技术人员将能够鉴定任何同源蛋白质中的相应残基,例如通过序列比对和同源残基的确定。因此,本领域技术人员将能够在任何天然存在的腺苷脱氨酶(例如,与ecTadA具有同源性)中产生相应于本文所述的任何突变(例如,在ecTadA中鉴定的任何突变)的突变。在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌、柄杆菌或枯草芽孢杆菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。
在一个实施方案中,本发明的融合蛋白包含与TadA7.10连接的野生型TadA,TadA7.10与Cas9切口酶连接。在特定实施方案中,融合蛋白包含单个TadA7.10结构域(例如,作为单体提供)。在其他实施方案中,ABE7.10编辑器包含能够形成异源二聚体的TadA7.10和TadA(wt)。相关序列如下:
TadA(wt):
SEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA7.10:
SEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
在一些实施方案中,腺苷脱氨酶包含的氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与在此所提供的任何腺苷脱氨酶中列出的任何一个氨基酸序列相同。应当理解,本文提供的腺苷脱氨酶可以包括一个或多个突变(例如,本文提供的任何突变)。本发明内容提供了具有一定百分比鉴定的任何脱氨酶结构域加上本文所述的任何突变或其组合。在一些实施方案中,与参考序列或本文提供的任何腺苷脱氨酶相比,腺苷脱氨酶包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,与本领域已知或本文所述的任一氨基酸序列相比,腺苷脱氨酶包含具有至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少有170个相同的连续氨基酸残基。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D108X突变,或另一腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D108G、D108N、D108V、D108A或D108Y突变,或另一种腺苷脱氨酶中的相应突变。然而,应当理解,可以类似地比对额外的脱氨酶以鉴定可以如本文提供的突变的同源氨基酸残基。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106V突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E155X突变,或另一种腺苷脱氨酶中的相应突变,其中X的存在表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸.在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E155D、E155G或E155V突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D147X突变,或另一种腺苷脱氨酶中的相应突变,其中X的存在表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸.在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D147Y突变或另一种腺苷脱氨酶中的相应突变。
应当理解,本文提供的任何突变(例如,基于TadA参考序列的ecTadA氨基酸序列)可以引入其他腺苷脱氨酶,例如金黄色葡萄球菌TadA(saTadA),或其他腺苷脱氨酶(例如,细菌腺苷脱氨酶)。本领域技术人员很清楚如何与ecTadA中的突变残基同源。因此,在ecTadA中鉴定的任何突变都可以在具有同源氨基酸残基的其他腺苷脱氨酶中进行。还应当理解,本文提供的任何突变可以在ecTadA或另一种腺苷脱氨酶中单独或以任何组合进行。例如,腺苷脱氨酶可在TadA参考序列中含有D108N、A106V、E155V和/或D147Y突变,或在另一种腺苷脱氨酶中含有相应的突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的以下突变组(突变组由“;”分隔),或另一种腺苷脱氨酶中的相应突变:D108N和A106V;D108N和E155V;D108N和D147Y;A106V和E155V;A106V和D147Y;E155V和D147Y;D108N、A106V和E55V;D108N、A106V和D147Y;D108N、E55V和D147Y;A106V、E55V和D147Y;和D108N、A106V、E55V和D147Y。然而,应当理解,本文提供的相应突变的任何组合可以在腺苷脱氨酶(例如,ecTadA)中进行。
在一些实施方案中,腺苷脱氨酶包含在TadA参考序列中的一种或多种以下突变:H8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F164X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X和/或K157X,或另一种腺苷脱氨酶中的一个或多个相应突变,其中X的存在表示任何其他氨基酸比野生型腺苷脱氨酶中的相应氨基酸。在一些实施方案中,腺苷脱氨酶包含H8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E或A56S、E59G、E85K或E85G、M94L、1951、V102A、F104L、A106V、R107C,或R107H,或R107P、D108G,或D108N,或D108V,或D108A,或D108Y、Kl 101、Ml 18K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D和/或K157R,或另一种腺苷脱氨酶中的一个或多个相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的一个或多个H8X、D108X和/或N127X突变,或另一个腺苷脱氨酶中的一个或多个相应突变,其中X指示任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的一个或多个H8Y、D108N和/或N127S突变,或另一个腺苷脱氨酶中的一个或多个相应突变。
在一些实施方案中,腺苷脱氨酶包含在TadA参考序列中H8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X和/或T166X的突变,或在另一种腺苷脱氨酶中的一个或多个相应突变,其中X表示存在除野生型腺苷脱氨酶中相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含在参考序列中H8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154H或Q154R、E155G或E155V或E155D、K161Q、Q163H和/或T166P的突变,或另一种腺苷脱氨酶中的一个或多个相应突变。
在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个或六个选自由H8X、D108X、N127X、D147X、R152X和Q154X所组成的群组的突变,或相应的另一种腺苷脱氨酶中的一个或多个突变,其中X表示存在除野生型腺苷脱氨酶中相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含一个、两个、三个、四个、五个、六个、七个或八个突变,其选自由TadA参考序列中的H8X、M61X、M70X、D108X、N127X、Q154X、E155X和Q163X所组成的群组的序列,或另一种腺苷脱氨酶中的相应突变或突变,其中X表示存在除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个或五个选自由H8X、D108X、N127X、E155X和T166X所组成的群组的突变,或另一腺苷中的一个或多个相应突变脱氨酶,其中X表示存在除野生型腺苷脱氨酶中相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含一个、两个、三个、四个、五个或六个选自由H8X、A106X和D108X所组成的群组的突变,或另一种腺苷脱氨酶中的一个或多个相应突变,其中X表示存在除了野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个、六个或七个选自由H8X、R126X、L68X、D108X、N127X、D147X和E155X所组成的群组的突变,或另一种腺苷脱氨酶中的相应突变或突变,其中X表示存在除野生型腺苷脱氨酶中相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个或五个选自由H8X、D108X、A109X、N127X和E155X所组成的群组的突变,或另一腺苷脱氨酶中的一个或多个相应突变,其中X表示野生型腺苷脱氨酶中除相应氨基酸之外的任何氨基酸的存在。
在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个或六个选自由H8Y、D108N、N127S、D147Y、R152C和Q154H所组成的群组的突变,或相应的另一种腺苷脱氨酶的突变或突变。在一些实施方案中,腺苷脱氨酶包含一个、两个、三个、四个、五个、六个、七个或八个突变,选自由TadA参考中的H8Y、M61I、M70V、D108N、N127S、Q154R、E155G和Q163H所组成的群组的序列,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个或五个选自由H8Y、D108N、N127S、E155V和T166P所组成的群组的突变,或另一腺苷脱氨酶中的一个或多个相应突变.在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个或六个选自由H8Y、A106T、D108N、N127S、E155D和K161Q所组成的群组的突变,或相应的一个或多个突变在另一种腺苷脱氨酶中。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个、六个或七个选自由H8Y、R126W、L68Q、D108N、N127S、D147Y和E155V所组成的群组的突变,或相应的突变或另一种腺苷脱氨酶的突变。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个或五个选自由H8Y、D108N、A109T、N127S和E155G所组成的群组的突变,或在另一种腺苷脱氨酶中的一个或多个相应突变。
在一些实施方案中,腺苷脱氨酶包含另一种腺苷脱氨酶中的一个或多个或一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D108N、D108G或D108V突变,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106V和D108N突变,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R107C和D108N突变,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、D108N、N127S、D147Y和Q154H突变,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、R24W、D108N、N127S、D147Y和E155V突变,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的D108N、D147Y和E155V突变,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H8Y、D108N和N127S突变,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A106V、D108N、D147Y和E155V突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的S2X、H8X、I49X、L84X、H123X、N127X、I156X和/或K160X中的一种或多种突变,或另一种腺苷脱氨酶中的一种或多种相应突变,其中X的存在表示除野生型腺苷脱氨酶中相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的S2A、H8Y、I49F、L84F、H123Y、N127S、I156F和/或K160S中的一种或多种突变,或另一种腺苷脱氨酶中的一种或多种相应突变。
在一些实施方案中,腺苷脱氨酶包含L84X突变腺苷脱氨酶,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的L84F突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H123X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H123Y突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的I157X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的I157F突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个、六个或七个选自由L84X、A106X、D108X、H123X、D147X、E155X和I156X所组成的群组的突变,或另一种腺苷脱氨酶中的一个或多个相应突变,其中X表示存在除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个或六个选自由S2X、I49X、A106X、D108X、D147X和E155X所组成的群组的突变,或相应的一个或多个突变在另一种腺苷脱氨酶中,其中X表示存在除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个或五个选自由H8X、A106X、D108X、N127X和K160X所组成的群组的突变,或在另一种腺苷脱氨酶中的一个或多个相应突变,其中X表示野生型腺苷脱氨酶中除相应氨基酸之外的任何氨基酸的存在。
在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个、六个或七个选自由L84F、A106V、D108N、H123Y、D147Y、E155V和I156F所组成的群组的突变,或另一种腺苷脱氨酶的相应突变。在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个、五个或六个选自由S2A、I49F、A106V、D108N、D147Y和E155V所组成的群组的突变。
在一些实施方案中,腺苷脱氨酶在TadA参考序列中包含一个、两个、三个、四个或五个选自由H8Y、A106T、D108N、N127S和K160S所组成的群组的突变,或相应的一个或多个突变另一种腺苷脱氨酶。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E25X、R26X、R107X、A142X和/或A143X突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个相应突变,其中X的存在表示除野生型腺苷脱氨酶中相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R07K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q和/或A143R突变,或另一个或多个相应的脱氨酸酶突变在一些实施方案中,腺苷脱氨酶包含一个或多个本文所述的相应于TadA参考序列的突变,或另一个腺苷脱氨酶中的一个或多个相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E25X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的E25M、E25D、E25A、E25R、E25V、E25S或E25Y突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R26X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R26G、R26N、R26Q、R26C、R26L或R26K突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R107X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R107P、R07K、R107A、R107N、R107W、R107H或R107S突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A142X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A142N、A142D、A142G突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A143X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q和/或A143R突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TADA参考序列中的H36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X和/或K161X中的一种或多种突变,或另一种腺苷脱氨酶中的一个或多个相应突变,其中X的存在表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中一种或多种的H36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N和/或K161T的突变,或另一种腺苷脱氨酶中的一个或多个相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H36X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的H36L突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的N37X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的N37T或N37S突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的P48X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的P48T或P48L突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R51X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R51H或R51L突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的S146X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的S146R或S146C突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的K157X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的K157N突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的P48X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的P48S、P48T或P48A突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A142X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的A142N突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的W23X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的W23R或W23L突变,或另一种腺苷脱氨酶中的相应突变。
在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R152X突变,或另一种腺苷脱氨酶中的相应突变,其中X表示除野生型腺苷脱氨酶中的相应氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含TadA参考序列中的R152P或R52H突变,或另一种腺苷脱氨酶中的相应突变。
在一个实施方案中,腺苷脱氨酶可包含突变H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F和K157N。在一些实施方案中,腺苷脱氨酶包含以下相对于TadA参考序列的突变组合,其中组合的每个突变由“_”分隔以及每个突变组合在括号之间:(A106V_D108N)、(R107C_D108N)、(H8Y_D108N_S127S_D147Y_Q154H)、(H8Y_R24W_D108N_N127S_D147Y_E155V)、(D108N_D147Y_E155V)、(H8Y_D108N_S127S)、(H8Y_D108N_N127S_D147Y_Q154H)、(A106V_D108N_D147Y_E155V)(D108Q_D147Y_E155V)(D108M_D147Y_E155V)、(D108L_D147Y_E155V)、(D108K_D147Y_E155V)、(D108I_D147Y_E155V)、(D108F_D147Y_E155V)、(A106V_D108N_D147Y)、(A106V_D108M_D147Y_E155V)、(E59A_A106V_D108N_D147Y_E155V)、(E59A cat dead_A106V_D108N_D147Y_E155V)、(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、(D103A_D014N)、(G22P_D103A_D104N)、(G22P_D103A_D104N_S138A)、(D103A_D104N_S138A)、(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I15 6F)、(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I15 6F)、(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I15 6F)、(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),(A106V_D108N_A142N_D147Y_E155V),(R26G_A106V_D108N_A142N_D147Y_E155V)、(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、(A106V_R107K_D108N_A142N_D147Y_E155V)、(A106V_D108N_A142N_A143G_D147Y_E155V)、(A106V_D108N_A142N_A143L_D147Y_E155V)、(H36L_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F_K157N)、(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、(N72S_L84F_A106V_D108N_H123Y_S 146R_D147Y_E155V_I156F)、(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F_K157N)、(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N),(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、(L84F_A106V_D108N_D147Y_E155V_I156F)、(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E),(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、(P48S_A142N),(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),(P48T_I49V_A142N),(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N)、(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F_K157N)、(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155 V_I156F_K157N)。
胞苷脱氨酶
除了腺苷脱氨酶之外,本发明的融合蛋白还包含一种或多种胞苷脱氨酶。在一些实施方案中,本文提供的胞苷脱氨酶能够将胞嘧啶或5-甲基胞嘧啶脱氨基为尿嘧啶或胸腺嘧啶。在一些实施方案中,本文提供的胞苷脱氨酶能够使DNA中的胞嘧啶脱氨。胞苷脱氨酶可源自任何合适的生物体。在一些实施方案中,胞苷脱氨酶是天然存在的胞苷脱氨酶,其包括一个或多个相应于本文提供的任何突变的突变。本领域技术人员将能够鉴定任何同源蛋白质中的相应残基,例如通过序列比对和同源残基的确定。因此,本领域技术人员将能够在与本文所述的任何突变相相应的任何天然存在的胞苷脱氨酶中产生突变。在一些实施方案中,胞苷脱氨酶来自原核生物。在一些实施方案中,胞苷脱氨酶来自细菌。在一些实施方案中,胞苷脱氨酶来自哺乳动物(例如人类)。
在一些实施方案中,胞苷脱氨酶包含的氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文所述的任何一种胞苷脱氨酶氨基酸序列相同。应当理解,本文提供的胞苷脱氨酶可以包括一个或多个突变(例如,本文提供的任何突变)。一些实施方案提供了编码任何先前方面或如本文所描绘的胞苷脱氨酶核碱基编辑器多肽的多核苷酸分子。在一些实施方案中,多核苷酸是密码子优化的。
本发明提供具有一定百分比同一性的任何脱氨酶结构域加上本文所述的任何突变或其组合。在一些实施方案中,与参考序列或本文提供的任何胞苷脱氨酶相比,胞苷脱氨酶包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,与本领域已知或本文所述的任一氨基酸序列相比,胞苷脱氨酶包含具有至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的连续氨基酸残基。
本发明的第二蛋白质的融合蛋白包含两个或更多个核酸编辑结构域。在一些实施方案中,核酸编辑域可以催化C到U碱基的变化。在一些实施方案中,核酸编辑域是脱氨酶域。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白BmRNA-编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,脱氨酶是APOBEC1脱氨酶。在一些实施方案中,脱氨酶是APOBEC2脱氨酶。在一些实施方案中,脱氨酶是APOBEC3脱氨酶。在一些实施方案中,脱氨酶是APOBEC3A脱氨酶。在一些实施方案中,脱氨酶是APOBEC3B脱氨酶。在一些实施方案中,脱氨酶是APOBEC3C脱氨酶。在一些实施方案中,脱氨酶是APOBEC3D脱氨酶。在一些实施方案中,脱氨酶是APOBEC3E脱氨酶。在一些实施方案中,脱氨酶是APOBEC3F脱氨酶。在一些实施方案中,脱氨酶是APOBEC3G脱氨酶。在一些实施方案中,脱氨酶是APOBEC3H脱氨酶。在一些实施方案中,脱氨酶是APOBEC4脱氨酶。在一些实施方案中,脱氨酶是活化诱导的脱氨酶(AID)。在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶是人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方案中,脱氨酶是人脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶,例如rAPOBECl。在一些实施方案中,脱氨酶是海七鰓鰻(Petromyzonmarinus)胞苷脱氨酶1(pmCDA1)。在一些实施方案中,脱氨酶是人APOBEC3G。在一些实施方案中,脱氨酶是人APOBEC3G的片段。在一些实施方案中,脱氨酶是包含D316R D317R突变的人APOBEC3G变异体。在一些实施方案中,脱氨酶是人APOBEC3G的片段以及包含相应于D316RD317R突变的突变。在一些实施方案中,核酸编辑结构域为至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%),或至少99.5%与本文所述的任何脱氨酶的脱氨酶结构域相同。
在某些实施方案中,本文提供的融合蛋白包含一种或多种改善融合蛋白的碱基编辑活性的特征。例如,本文提供的任何融合蛋白可以包含具有降低的核酸酶活性的Cas9结构域。在一些实施方案中,本文提供的任何融合蛋白可具有无核酸酶活性的Cas9结构域(dCas9),或切割双链DNA分子的一条链的Cas9结构域,称为Cas9切口酶(nCas9)。
核碱基编辑器的Cas9结构域
在一些方面,核酸可编程DNA结合蛋白(napDNAbp)选自由Cas9、CasX、CasY、Cpfl、Cas12b/C2c1和Cas12c/C2c3或其活性片段所组成的群组。在另一个实施方案中,napDNAbp结构域包含能够切割核酸序列的反向互补链的催化结构域。在另一个实施方案中,napDNAbp结构域不包含能够切割核酸序列的催化结构域。在另一个实施方案中,Cas9是dCas9或nCas9。在另一个实施方案中,napDNAbp包含核碱基编辑器。
在一些实施方案中,核酸可编程DNA结合蛋白(napDNAbp)是Cas9结构域。本文提供了非限制性的示例性Cas9域。Cas9结构域可以是核酸酶活性Cas9结构域、核酸酶无活性Cas9结构域(无核酸酶活性的Cas9或dCas9)或Cas9切口酶(nCas9)。在一些实施方案中,Cas9结构域是核酸酶活性结构域。例如,Cas9结构域可以是切割双链核酸的两条链(例如双链DNA分子的两条链)的Cas9结构域。在一些实施方案中,Cas9结构域包含如本文所述的任一氨基酸序列。在一些实施方案中,Cas9结构域包含至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文所述的任一氨基酸序列相同。在一些实施方案中,与本文所列氨基酸序列中的任一者相比,Cas9结构域包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个或更多个突变。在一些实施方案中,与本文所述的任一氨基酸序列相比,Cas9结构域包含具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的连续氨基酸残基。
在一些实施方案中,Cas9结构域是无核酸酶活性的Cas9结构域(dCas9)。例如,dCas9结构域可以结合双链核酸分子(例如,通过gRNA分子)而不切割双链核酸分子的任何一条链。在一些实施方案中,核酸酶失活的dCas9结构域包含本文所述氨基酸序列的D10X突变和H840X突变,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸变化。在一些实施方案中,核酸酶失活的dCas9结构域包含本文所述氨基酸序列的D10A突变和H840A突变,或本文提供的任何氨基酸序列中的相应突变。作为一个例子,无核酸酶活性的Cas9结构域包含在克隆载体pPlatTET-gRNA2(登录号BAV54124)中列出的氨基酸序列。MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(参见,例如,Qi等人,“Repurposing CRISPR as an RNA-guided platform for sequence-specificcontrol of gene expression.”Cell.2013;152(5):1173-83,其全部内容通过引用并入本文)。
基于本发明内容和本领域知识,其他合适的核酸酶无活性dCas9结构域对于本领域技术人员来说将是显而易见的,以及在本发明内容的范围内。这种额外的示例性合适的无核酸酶活性的Cas9结构域包括但不限于D10A/H840A、D10A/D839A/H840A和D10A/D839A/H840A/N863A突变结构域(参见,例如Prashant等人,CAS9 transcriptional activatorsfor target specificity screening and paired nickases for cooperative genomeengineering.Nature Biotechnology.2013;31(9):833-838,其全部内容通过引用并入本文)。在一些实施方案中,dCas9结构域包含至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文提供的任何一个dCas9域相同。在一些实施方案中,与本文所列氨基酸序列中的任一者相比,Cas9结构域包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个或更多个突变。在一些实施方案中,与本文所述的任一氨基酸序列相比,Cas9结构域包含具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的连续氨基酸残基。
在一些实施方案中,Cas9结构域是Cas9切口酶。Cas9切口酶可以是仅能够切割双链核酸分子(例如双链DNA分子)的一条链的Cas9蛋白。在一些实施方案中,Cas9切口酶切割双链核酸分子的靶链,意味着Cas9切口酶切割与结合至Cas9的gRNA(例如,sgRNA)碱基配对(互补)的链。在一些实施方案中,Cas9切口酶包含D10A突变以及在位置840处具有组氨酸。在一些实施方案中,Cas9切口酶切割双链核酸分子的非靶标、非碱基编辑链,意味着Cas9切口酶切割不与结合到Cas9的gRNA(例如,sgRNA)碱基配对的链。在一些实施方案中,Cas9切口酶包含H840A突变以及在位置10处具有天冬氨酸残基,或相应的突变。在一些实施方案中,Cas9切口酶包含至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文提供的任何一种Cas9切口酶相同。基于本发明内容和本领域知识,其他合适的Cas9切口酶对于本领域技术人员来说是显而易见的,以及在本发明内容的范围内。
降低PAM独占性的Cas9结构域
本发明的一些方面提供了具有不同PAM特异性的Cas9结构域。在一个特定的实施方案中,本发明的特征在于包含nCas9结构域和dCas9结构域的核碱基编辑器融合蛋白,其中每个Cas9结构域具有不同的PAM特异性。通常,Cas9蛋白,例如来自化脓性链球菌(spCas9)的Cas9,需要典型的NGG PAM序列来结合特定的核酸区域,其中“NGG”中的“N”是腺苷(A)、胸苷(T),或胞嘧啶(C),G是鸟苷。这可能会限制编辑基因组内所需碱基的能力。在一些实施方案中,本文提供的碱基编辑融合蛋白可能需要放置在精确位置,例如包含位于PAM上游的靶碱基的区域。参见例如Komor,A.C.等人,“Programmable editoring of a targetbase in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016),其全部内容通过引用并入本文。因此,在一些实施方案中,本文提供的任何融合蛋白包含可结合不包含典范(例如,NGG)PAM序列的核苷酸序列的Cas9结构结构域。结合非典范PAM序列的Cas9结构域已在本领域中描述以及对技术人员来说是显而易见的。例如,结合非典范PAM序列的Cas9结构域已在Kleinstiver,B.P.等人,“Engineered CRISPR-Cas9nucleases with changed PAM specificities”Nature 523,481-485(2015)中有所描述;和Kleinstiver,B.P.等人,“Broadening the targeting range of Staphylococcusaureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology 33,1293-1298(2015);每个的全部内容在此通过引用并入本文。下表3描述了几种PAM变异体:
表3.Cas9蛋白和相应的PAM序列
变异体 PAM
spCas9 NGG
spCas9-VRQR NGA
spCas9-VRER NGCG
xCas9(sp) NGN
saCas9 NNGRRT
saCas9-KKH NNNRRT
spCas9-MQKSER NGCG
spCas9-MQKSER NGCN
spCas9-LRKIQK NGTN
spCas9-LRVSQK NGTN
spCas9-LRVSQL NGTN
Cpf1 5’(TTTV)
在一些实施方案中,Cas9结构域是来自金黄色葡萄球菌(SaCas9)的Cas9结构域。在一些实施方案中,SaCas9结构域是核酸酶活性的SaCas9、核酸酶失活的SaCas9(SaCas9d)或SaCas9切口酶(SaCas9n)。在一些实施方案中,SaCas9包含N579A突变,或本文提供的任何氨基酸序列中的相应突变。
在一些实施方案中,SaCas9结构域、SaCas9d结构域或SaCas9n结构域可结合具有非典范PAM的核酸序列。在一些实施方案中,SaCas9结构域、SaCas9d结构域或SaCas9n结构域可以结合具有NNGRRT PAM序列的核酸序列。在一些实施方案中,SaCas9结构域包含E781X、N967X和R1014X突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,SaCas9结构域包含E781K、N967K和R1014H突变中的一个或多个,或本文提供的任何氨基酸序列中的一个或多个相应突变。在一些实施方案中,SaCas9结构域包含E781K、N967K或R1014H突变,或本文提供的任何氨基酸序列中的相应突变。
示例性SaCas9序列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
上述加下划线和粗体的残基N579可以突变(例如,突变到A579)以产生SaCas9切口酶。
示例性SaCas9n序列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
上述的残基A579可以从N579突变以产生SaCas9切口酶,用下划线和粗体表示。
示例性SaKKH Cas9n序列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
上述的残基A579可以从N579突变以产生SaCas9切口酶,用下划线和粗体表示。上述的残基K781、K967和H1014,可以从E781、N967和R1014突变以产生SaKKHCas9,用下划线和斜体表示。
在一些实施方案中,Cas9结构域是来自化脓性链球菌(SpCas9)的Cas9结构域。在一些实施方案中,SpCas9结构域是核酸酶活性SpCas9、核酸酶失活SpCas9(SpCas9d)或SpCas9切口酶(SpCas9n)。在一些实施方案中,SpCas9包含D9X突变,或本文提供的任何氨基酸序列中的相应突变,其中X是除D之外的任何氨基酸。在一些实施方案中,SpCas9包含D9A突变,或相应突变在本文提供的任何氨基酸序列中。在一些实施方案中,SpCas9结构域、SpCas9d结构域或SpCas9n结构域可结合具有非典范PAM的核酸序列。在一些实施方案中,SpCas9结构域、SpCas9d结构域或SpCas9n结构域可结合具有NGG、NGA或NGCG PAM序列的核酸序列。在一些实施方案中,SpCas9结构域包含D1134X、R1334X和T1336X突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含一个或多个D1134E、R1334Q和T1336R突变,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1134E、R1334Q和T1336R突变,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1134X、R1334X和T1336X突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含D1134V、R1334Q和T1336R突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1134V、R1334Q和T1336R突变,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1134X、G1217X、R1334X和T1336X突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含D1134V、G1217R、R1334Q和T1336R突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1134V、G1217R、R1334Q和T1336R突变,或本文提供的任何氨基酸序列中的相应突变。
在一些实施方案中,本文提供的任何融合蛋白的Cas9结构域包含至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文所述的Cas9多肽相同。在一些实施方案中,本文提供的任何融合蛋白的Cas9结构域包含本文描述的任何Cas9多肽的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9结构域由本文描述的任何Cas9多肽的氨基酸序列组成。
示例性SpCas9
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
示例性SpCas9n
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
示例性SpEQR Cas9
Figure BDA0003263753870002031
上述残基E1134、Q1334和R1336,其可以从D1134、R1334和T1336突变以产生SpEQRCas9,用下划线和粗体表示。
示例性SpVQR Cas9
Figure BDA0003263753870002041
上述的残基V1134、Q1334和R1336可以从D1134、R1334和T1336突变以产生SpVQRCas9,用下划线和粗体表示。示例性SpVRER Cas9
Figure BDA0003263753870002042
Figure BDA0003263753870002051
上述残基V1134、R1217、Q1334和R1336,其可以从D1134、G1217、R1334和T1336突变以产生SpVRER Cas9,用下划线和粗体表示。
高保真Cas9结构域
本发明的一些方面提供高保真Cas9结构域。在一些实施方案中,高保真Cas9结构域是工程化的Cas9结构域,其包含一个或多个突变,与相应的野生型Cas9结构域相比,这些突变减少了Cas9结构域和DNA的糖-磷酸骨架之间的静电相互作用。不希望受任何特定理论的束缚,与DNA的糖-磷酸骨架的静电相互作用减少的高保真Cas9结构域可能具有较少的脱靶效应。在一些实施方案中,Cas9结构域(例如,野生型Cas9结构域)包含一种或多种降低Cas9结构域与DNA的糖-磷酸骨架之间的关联的突变。在一些实施方案中,Cas9结构域包含一种或多种突变,其将Cas9结构域与DNA的糖-磷酸骨架之间的关联降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%或至少70%。
在一些实施方案中,本文提供的任何Cas9融合蛋白包含N497X、R661X、Q695X和/或Q926X突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,本文提供的任何Cas9融合蛋白包含N497A、R661A、Q695A和/或Q926A突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,Cas9结构域包含D10A突变,或本文提供的任何氨基酸序列中的相应突变。具有高保真度的Cas9结构域是本领域已知的以及对本领域技术人员来说是显而易见的。例如,Kleinstiver,B.P.等人“High-fidelity CRISPR-Cas9 nucleases with no detectablegenome-wide off-target effects.”Nature 529,490-495(2016);和Slaymaker,I.M.等人“Rationally engineered Cas9 nucleases with improved specificity.”Science 351,84-88(2015);已经描述了具有高保真度的Cas9结构域。每个的全部内容通过引用并入本文。
相对于Cas9的高保真Cas9结构域突变以粗体和下划线显示
Figure BDA0003263753870002061
Figure BDA0003263753870002071
核酸可编程DNA结合蛋白
本发明的一些方面提供了核酸可编程的DNA结合蛋白,其可用于将蛋白质(例如碱基编辑器)向导至特定核酸(例如,DNA或RNA)序列。核酸可编程DNA结合蛋白包含但不限于Cas9(例如dCas9和nCas9)、CasX、CasY、Cpf1、Cas12b/C2c1和Cas12c/C2c3。具有与Cas9不同的PAM特异性的核酸可编程DNA结合蛋白的一个例子是来自普氏杆菌(Prevotella)和弗朗西斯菌(Francisella)1(Cpf1)的规律成簇间隔短回文重复序列。与Cas9类似,Cpf1也是2类CRISPR效应器,已经表明Cpf1介导强大的DNA干扰,其特征与Cas9不同。Cpf1是一种单一的RNA向导的内切核酸酶,缺乏tracrRNA,其利用富含T的原始间隔物相邻基序(TTN、TTTN或YTN)。此外,Cpf1通过交错的DNA双链断裂来切割DNA。在16个Cpf1家族蛋白中,来自酸球菌属和毛螺菌科的两个酶被证明在人类细胞中具有有效的基因组编辑活性。Cpf1蛋白是本领域已知的,以及之前已经描述过,例如Yamano等人,“Crystal structure of Cpf1 incomplex with guide RNA and target DNA.”Cell(165)2016,p.949-962;其全部内容在此引入作为参考。
也可用于本组成物和方法的是核酸酶失活的Cpfl(dCpfl)变异体,其可用作向导核苷酸序列可编程的DNA结合蛋白结构域。Cpf1蛋白具有与Cas9的RuvC结构域相似但不具有HNH核酸内切酶结构域的类RuvC核酸内切酶结构域,且Cpf1的N末端不具有Cas9的α-螺旋识别叶。Zetsche等人,Cell,163,759-771,2015(通过引用并入本文)表明,Cpf1的类RuvC结构域负责切割两条DNA链并使类RuvC结构域失活失活Cpf1核酸酶活性。例如,与新弗朗西斯菌(Francisella novicida)Cpf1中的D917A、E1006A或D1255A相应的突变会使Cpf1核酸酶活性失活。在一些实施方案中,本发明的dCpf1包含相应于D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A或D917A/E1006A/D12255A的突变。应当理解,根据本发明可以使用使Cpf1的RuvC结构域失活的任何突变,例如置换突变、缺失或插入。
在一些实施方案中,本文提供的任何融合蛋白的核酸可编程DNA结合蛋白(napDNAbp)可以是Cpfl蛋白。在一些实施方案中,Cpf1蛋白是Cpf1切口酶(nCpf1)。在一些实施方案中,Cpf1蛋白是核酸酶失活的Cpf1(dCpf1)。在一些实施方案中,Cpfl、nCpfl或dCpfl包含至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文公开的Cpf1序列相同。在一些实施方案中,dCpf1包含至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文公开的Cpf1序列的氨基酸序列相同,以及包含相应于D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A或D917A/E1006A/D1255A的突变。应当理解,根据本发明也可以使用来自其他细菌物种的Cpf1。
野生型新弗朗西斯菌Cpfl(D917、E1006和D1255以粗体和下划线表示)
Figure BDA0003263753870002081
Figure BDA0003263753870002091
新弗朗西斯菌Cpfl D917A(A917、E1006和D1255用粗体和下划线表示)
Figure BDA0003263753870002092
Figure BDA0003263753870002101
新弗朗西斯菌Cpfl E1006A(D917、A1006和D1255用粗体和下划线表示)
Figure BDA0003263753870002102
新弗朗西斯菌Cpfl D1255A(D917、E1006和A1255用粗体和下划线表示)
Figure BDA0003263753870002111
新弗朗西斯菌Cpfl D917A/E1006A(A917、A1006和D1255用粗体和下划线表示)
Figure BDA0003263753870002112
Figure BDA0003263753870002121
新弗朗西斯菌Cpfl D917A/D1225A(A917、E1006和A1255用粗体和下划线表示)
Figure BDA0003263753870002122
Figure BDA0003263753870002131
新弗朗西斯菌Cpfl E1006A/D1225A(D917、A1006和A1255用粗体和下划线表示)
Figure BDA0003263753870002132
Figure BDA0003263753870002141
新弗朗西斯菌Cpfl D917A/D1225A(A917、A1006和A1255用粗体和下划线表示)
Figure BDA0003263753870002142
Cas9核酸酶具有两个功能性核酸内切酶结构域:RuvC和HNH。Cas9在目标结合后发生构象变化,定位核酸酶结构域以切割目标DNA的相反链。Cas9介导的DNA切割的最终结果是目标DNA(PAM序列上游约3至4个核苷酸)内的双链断裂(DSB)。然后通过两种一般修复途径之一修复产生的DSB:(1)有效但容易出错的非同源末端连接(NHEJ)途径;或(2)效率较低但保真度高的同源定向修复(HDR)途径。
非同源末端连接(NHEJ)和/或同源定向修复(HDR)的“效率”可以通过任何方便的方法计算。例如,在某些情况下,效率可以用成功HDR的百分比来表示。例如,surveyor核酸酶测定可用于产生切割产物,以及产物与底物的比率可用于计算百分比。例如,可以使用surveyor核酸酶直接切割含有作为成功HDR的结果的新整合的限制性序列的DNA。更多裂解的底物表明更高的HDR百分比(更高的HDR效率)。作为说明性示例,可以使用以下等式[(裂解产物)/(底物加裂解产物)]计算HDR的分数(百分比)(例如,(b+c)/(a+b+c),其中“a”是DNA底物的条带强度,“b”和“c”是切割产物)。
在一些情况下,效率可以用成功NHEJ的百分比来表示。例如,T7核酸内切酶I测定可用于产生裂解产物,产物与底物的比率可用于计算NHEJ的百分比。T7核酸内切酶Icleave由野生型和突变DNA链杂交产生的错配异源双链DNA(NHEJ在原始断裂位点产生小的随机插入或缺失(indel))。更多的切割表明更高的NHEJ百分比(更高的NHEJ效率)。作为说明性示例,NHEJ的分数(百分比)可以使用以下等式计算:(1-(1-(b+c)/(a+b+c))1/2)×100,其中“a”是DNA底物的条带强度,“b”和“c”是切割产物(Ran等人,2013年9月12日;154(6):1380-9;和Ran等人,Nat Protoc.2013年11月;8(11):2281–2308)。
NHEJ修复途径是最活跃的修复机制,其经常在DSB位点引起小核苷酸插入或缺失(indels)。NHEJ介导的DSB修复的随机性具有重要的实际意义,因为表达Cas9和gRNA或向导多核苷酸的细胞群会导致多种突变。在大多数情况下,NHEJ会在目标DNA中产生小的插入缺失,导致氨基酸缺失、插入或移码突变,从而导致目标基因的开放阅读框(ORF)内过早终止密码子。理想的最终结果是目标基因内的功能丧失突变。
虽然NHEJ介导的DSB修复经常破坏基因的开放阅读框,但同源定向修复(HDR)可用于产生特定核苷酸变化,范围从单个核苷酸变化到大插入,如添加荧光团或标签。
为了利用HDR进行基因编辑,可以将包含所需序列的DNA修复模板与gRNA和Cas9或Cas9切口酶一起递送到感兴趣的细胞类型中。修复模板可以包含所需的编辑以及紧邻目标上游和下游的其他同源序列(称为左右同源臂)。每个同源臂的长度取决于引入的变化的大小,更大的插入需要更长的同源臂。修复模板可以是单链寡核苷酸、双链寡核苷酸或双链DNA质粒。即使在表达Cas9、gRNA和外源修复模板的细胞中,HDR的效率通常也很低(<10%的修饰等位基因)。HDR的效率可以通过同步细胞来提高,因为HDR发生在细胞周期的S和G2阶段。NHEJ中涉及的化学或遗传抑制基因也可以增加HDR频率。
在一些实施方案中,Cas9是经修饰的Cas9。给定的gRNA靶向序列可以在整个基因组中具有额外的位点,其中存在部分同源性。这些位点称为脱靶位点,在设计gRNA时需要加以考虑。除了优化gRNA设计,还可以通过对Cas9的修改来提高CRISPR的特异性。Cas9通过两个核酸酶结构域RuvC和HNH的联合活性产生双链断裂(DSB)。Cas9切口酶是SpCas9的D10A突变异体,保留一个核酸酶结构域并产生DNA切口而不是DSB。切口酶系统还可以与HDR介导的基因编辑相结合,以进行特定的基因编辑。
在一些情况下,Cas9是变异体Cas9蛋白。变异体Cas9多肽具有与野生型Cas9蛋白的氨基酸序列相比相差一个氨基酸的氨基酸序列(例如,具有缺失、插入、取代、融合)。在一些情况下,变异体Cas9多肽具有降低Cas9多肽的核酸酶活性的氨基酸变化(例如,缺失、插入或取代)。例如,在一些情况下,变异体Cas9多肽具有少于50%、少于40%、少于30%、少于20%、少于10%、少于5%或少于1%的核酸酶相应的野生型Cas9蛋白的活性。在某些情况下,变异体Cas9蛋白没有实质性的核酸酶活性。当主题Cas9蛋白是没有实质性核酸酶活性的变异体Cas9蛋白时,其可以被称为“dCas9”。
在一些情况下,变异体Cas9蛋白具有降低的核酸酶活性。例如,变异体Cas9蛋白表现出小于约20%、小于约15%、小于约10%、小于约5%、小于约1%或小于约0.1%的核酸内切酶活性。野生型Cas9蛋白,例如野生型Cas9蛋白。
在一些情况下,变异体Cas9蛋白可以切割向导靶序列的互补链,但切割双链向导靶序列的非互补链的能力降低。例如,变异体Cas9蛋白可以具有降低RuvC结构域功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变异体Cas9蛋白具有D10A(在氨基酸位置10处天冬氨酸到丙氨酸)以及因此可以切割双链向导靶序列的互补链但切割非-双链向导靶序列的互补链(因此当变异体Cas9蛋白切割双链靶核酸时导致单链断裂(SSB)而不是双链断裂(DSB))(参见,例如,Jinek等人,Science.2012年8月17日;337(6096):816-21)。
在一些情况下,变异体Cas9蛋白可以切割双链向导靶序列的非互补链,但切割向导靶序列的互补链的能力降低。例如,变异体Cas9蛋白可以具有降低HNH结构域(RuvC/HNH/RuvC结构域基序)功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变异体Cas9蛋白具有H840A(在氨基酸位置840处组氨酸至丙氨酸)突变,因此可切割向导靶序列的非互补链但切割向导目标序列的互补链(因此,当变异体Cas9蛋白切割双链向导目标序列时,会产生SSB而不是DSB)。此类Cas9蛋白切割向导靶序列(例如,单链向导靶序列)的能力降低,但保留结合向导靶序列(例如,单链向导靶序列)的能力。
在一些情况下,变异体Cas9蛋白切割双链靶DNA的互补链和非互补链的能力降低。作为非限制性实例,在一些情况下,变异体Cas9蛋白包含D10A和H840A突变两者,使得多肽切割双链靶DNA的互补链和非互补链的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。
作为另一个非限制性实例,在一些情况下,变异体Cas9蛋白含有W476A和W1126A突变,使得多肽切割靶DNA的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。
作为另一个非限制性实例,在一些情况下,变异体Cas9蛋白含有P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得多肽切割靶DNA的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。
作为另一个非限制性实例,在一些情况下,变异体Cas9蛋白含有H840A、W476A和W1126A突变,使得多肽切割靶DNA的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。作为另一个非限制性实例,在一些情况下,变异体Cas9蛋白含有H840A、D10A、W476A和W1126A突变,使得多肽切割靶DNA的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。在一些实施方案中,变异体Cas9在Cas9HNH结构域(A840H)中的位置840处恢复了催化性His残基。
作为另一个非限制性实例,在一些情况下,变异体Cas9蛋白包含H840A、P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得多肽切割靶DNA的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。作为另一个非限制性实例,在一些情况下,变异体Cas9蛋白含有D10A、H840A、P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得多肽切割目标DNA的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。在一些情况下,当变异体Cas9蛋白包含W476A和W1126A突变或当变异体Cas9蛋白包含P475A、W476A、N477A、D1125A、W1126A和D1127A突变时,变异体Cas9蛋白不能有效地结合PAM序列。因此,在一些此类情况下,当此类变异体Cas9蛋白用于结合方法时,所述方法不需要PAM序列。换言之,在某些情况下,当这种变异体Cas9蛋白用于结合方法时,所述方法可以包括向导RNA,但是所述方法可以在不存在PAM序列的情况下进行(以及结合的特异性是因此由向导RNA的靶向片段提供)。可以突变其他残基以实现上述效果(即失活一个或其他核酸酶部分)。作为非限制性实例,残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987可以被改变(即,被取代)。此外,丙氨酸取代以外的突变也是合适的。
在一些实施方案中,具有降低的催化活性的变异体Cas9蛋白(例如,当Cas9蛋白具有D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987突变,例如D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A和/或D986A),变异体Cas9蛋白仍然可以以位点特异性方式结合靶DNA(因为其仍然被向导RNA向导到靶DNA序列),只要其保留与向导RNA相互作用的能力。
在一些实施方案中,变异体Cas蛋白可以是spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK或spCas9-LRVSQL。
化脓性链球菌Cas9的替代物可包括来自Cpfl家族的RNA向导的核酸内切酶,其在哺乳动物细胞中显示出切割活性。普氏杆菌和弗朗西斯菌1(CRISPR/Cpf1)的CRISPR是一种类似于CRISPR/Cas9系统的DNA编辑技术。Cpf1是II类CRISPR/Cas系统的RNA向导的核酸内切酶。这种获得性免疫机制存在于普氏杆菌和弗朗西斯菌中。Cpf1基因与CRISPR基因座相关,编码内切核酸酶,使用向导RNA寻找和切割病毒DNA。Cpf1是一种比Cas9更小、更简单的核酸内切酶,克服了CRISPR/Cas9系统的一些限制。与Cas9核酸酶不同,Cpf1介导的DNA切割的结果是具有短3'突出端的双链断裂。Cpf1的交错切割模式可以开辟定向基因转移的可能性,类似于传统的限制酶克隆,可以提高基因编辑的效率。与上述Cas9变异体和直系同源體一样,Cpf1还可以将CRISPR可靶向的位点数量扩大到富含AT的区域或富含AT的基因组,这些区域缺乏SpCas9青睐的NGG PAM位点。Cpf1基因座包含一个混合的α/β结构域、一个RuvC-I后跟一个螺旋区域、一个RuvC-II和一个类锌指结构域。Cpf1蛋白具有类似于Cas9的RuvC结构域的类RuvC核酸内切酶结构域。此外,Cpf1没有HNH核酸内切酶结构域,以及Cpf1的N末端没有Cas9的α-螺旋识别叶。Cpf1CRISPR-Cas域架构表明Cpf1在功能上是独一无二的,被归类为2类V型CRISPR系统。Cpf1基因座编码的Cas1、Cas2和Cas4蛋白更类似于I型和III型,而不是来自II型系统。功能性Cpf1不需要反式激活CRISPRRNA(tracrRNA),因此,只需要CRISPR(crRNA)。这有利于基因组编辑,因为Cpf1不仅比Cas9小,而且其sgRNA分子更小(大约是Cas9的一半核苷酸)。与Cas9靶向的富含G的PAM相比,Cpf1-crRNA复合物通过识别原型间隔物相邻基序5'-YTN-3'来切割目标DNA或RNA。鉴定PAM后,Cpf1引入了一个类粘性末端DNA双链断裂,有4或5个核苷酸突出端。
包含两个napDNAbp的融合蛋白,一个脱氨酶结构域
本发明的一些方面提供包含具有切口酶活性的napDNAbp结构域(例如,nCas结构域)和无催化活性的napDNAbp(例如,dCas结构域)和核碱基编辑器(例如,腺苷脱氨酶结构域、胞苷脱氨酶结构域)的融合蛋白,其中至少napDNAbp结构域通过连接子连接。应当理解,Cas结构域可以是本文提供的任何Cas结构域或Cas蛋白(例如,dCas9和nCas9)。在一些实施方案中,任何Cas结构域、DNA结合蛋白域或Cas蛋白包含但不限于Cas9(例如dCas9和nCas9)、Cas12a/Cpf1、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h和Cas12i。与Cas9具有不同PAM特异性的可编程多核苷酸结合蛋白的一个例子是来自普氏杆菌和弗朗西斯菌的规律成簇间隔短回文重复序列(Cpf1)。与Cas9类似,Cpf1也是2类CRISPR效应器。例如但不限于,在一些实施方案中,融合蛋白包含结构,其中脱氨酶是腺苷脱氨酶或胞苷脱氨酶:
NH2-[deaminase]-[nCas domain]-[dCas domain]-COOH;
NH2-[deaminase]-[dCas domain]-[nCas domain]-COOH;
NH2-[nCas domain]-[dCas domain]-[deaminase]-COOH;
NH2-[dCas domain]-[nCas domain]-[deaminase]-COOH;
NH2-[nCas domain]-[deaminase]-[dCas domain]-COOH;
NH2-[dCas domain]-[deaminase]-[nCas domain]-COOH;
在一些实施方案中,以上通用架构中使用的“-”表示存在任选的连接子。在一些实施方案中,脱氨酶和napDNAbp(例如,Cas结构域)不通过连接子序列连接,而是直接融合。在一些实施方案中,连接子存在于脱氨酶结构域和napDNAbp之间。在一些实施方案中,脱氨酶或其他核碱基编辑器直接融合到dCas以及连接子连接dCas和nCas9。在一些实施方案中,脱氨酶和napDNAbps通过本文提供的任何连接子融合。例如,在一些实施方案中,脱氨酶和napDNAbp通过下文标题为“连接子”的部分中提供的任何连接子融合。在一些实施方案中,dCas结构域和脱氨酶紧邻以及nCas结构域通过连接子连接到这些结构域(5’或3’)。
原型间隔物相邻基序(Protospacer Adjacent Motif)
术语“原型间隔物相邻基序(PAM)”或类PAM基序是指紧接在CRISPR细菌适应性免疫系统中Cas9核酸酶靶向的DNA序列之后的2-6个碱基对DNA序列。在一些实施方案中,PAM可以是5’PAM(即,位于原型间隔物5’端的上游)。在其他实施方式中,PAM可以是3’PAM(即,位于原型间隔物5’端的下游)。
PAM序列对于靶标结合是必不可少的,但确切的序列取决于Cas蛋白的类型。
本文提供的碱基编辑器可包含CRISPR蛋白衍生的结构域,其能够结合包含典范或非典范原型间隔物相邻基序(PAM)序列的核苷酸序列。PAM位点是靠近目标多核苷酸序列的核苷酸序列。本发明的一些方面提供包含具有不同PAM特异性的全部或部分CRISPR蛋白的碱基编辑器。例如,典型的Cas9蛋白,例如来自化脓性链球菌(spCas9)的Cas9,需要典型的NGGPAM序列来结合特定的核酸区域,其中“NGG”中的“N”是腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C),以及G是鸟嘌呤。PAM可以是CRISPR蛋白质特异性的,以及在包含不同CRISPR蛋白质衍生结构域的不同碱基编辑器之间可以不同。PAM可以是目标序列的5'或3'。PAM可以位于目标序列的上游或下游。PAM的长度可以是1、2、3、4、5、6、7、8、9、10个或更多个核苷酸。通常,PAM的长度在2至6个核苷酸之间。表1中描述了几种PAM变异体。
在一些实施方案中,SpCas9对PAM核酸序列5’-NGC-3’或5’-NGG-3’具有特异性。在上述方面的各个实施方案中,SpCas9是表1中列出的Cas9或Cas9变异体。在上述方面的各个实施方案中,经修饰的SpCas9是spCas9-MQKFRAER。在一些实施方案中,变异体Cas蛋白可以是spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、SpCas9-MQKFRAER、spCas9-MQKSER、spCas9-LRKIQK或spCas9-LRVSQL。在一个具体实施方案中,使用包括氨基酸取代D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E和T1337R(SpCas9-MQKFRAER)以及对改变的PAM 5’-NGC-3’具有特异性的修饰SpCas9。
在一些实施方案中,PAM是NGT。在一些实施方案中,NGTPAM是变异体。在一些实施方案中,NGTPAM变异体通过在一个或多个残基1335、1337、1135、1136、1218和/或1219处的靶向突变产生。在一些实施方案中,NGTPAM变异体通过一个或多个处的靶向突变产生残基1219、1335、1337、1218。在一些实施方案中,NGTPAM变异体是通过在一个或多个残基1135、1136、1218、1219和1335处的靶向突变产生的。在一些实施方案中,NGTPAM变异体选自下表4和5中提供的一组靶向突变。
表4:残基1219、1335、1337、1218处的NGT PAM变异体突变
Figure BDA0003263753870002221
Figure BDA0003263753870002231
表5:残基1135、1136、1218、1219和1335处的NGT PAM变异体突变
变异体 D1135L S1136R G1218S E1219V R1335Q
27 G
28 V
29 I
30 A
31 W
32 H
33 K
34 K
35 R
36 Q
37 T
38 N
39 I
40 A
41 N
42 Q
43 G
44 L
45 S
46 T
47 L
48 I
49 V
50 N
51 S
52 T
53 F
54 Y
55 N1286Q I1331F
在一些实施方案中,NGT PAM变异体选自表2和3中的变异体5、7、28、31或36。在一些实施方案中,变异体具有改进的NGT PAM识别。
在一些实施方案中,NGT PAM变异体在残基1219、1335、1337和/或1218处具有突变。在一些实施方案中,从下表6中提供的变异体中选择具有突变以提高识别的NGT PAM变异体。
表6:残基1219、1335、1337和1218处的NGT PAM变异体突变
变异体 E1219V R1335Q T1337 G1218
1 F V T
2 F V R
3 F V Q
4 F V L
5 F V T R
6 F V R R
7 F V Q R
8 F V L R
在一些实施方案中,NGT PAM选自下表7中提供的变异体。
表7:NGT PAM变异体
Figure BDA0003263753870002251
在一些实施方案中,Cas9结构域是来自化脓性链球菌(SpCas9)的Cas9结构域。在一些实施方案中,SpCas9结构域是核酸酶活性SpCas9、核酸酶失活SpCas9(SpCas9d)或SpCas9切口酶(SpCas9n)。在一些实施方案中,SpCas9包含D9X突变,或本文提供的任何氨基酸序列中的相应突变可以与本文提供的任何胞苷脱氨酶或腺苷脱氨酶融合。
在一些实施方案中,SpCas9结构域包含D1135X、R1335X和T1336X突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含D1135E、R1335Q和T1336R突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1135E、R1335Q和T1336R突变,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1135X、R1335X和T1336X突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含D1135V、R1335Q和T1336R突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1135V、R1335Q和T1336R突变,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1135X、G1217X、R1335X和T1336X突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,SpCas9结构域包含D1135V、G1217R、R1335Q和T1336R突变中的一个或多个,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,SpCas9结构域包含D1135V、G1217R、R1335Q和T1336R突变,或本文提供的任何氨基酸序列中的相应突变。
在一些实施方案中,本文提供的任何融合蛋白的Cas9结构域包含的氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文所述的Cas9多肽相同。在一些实施方案中,本文提供的任何融合蛋白的Cas9结构域包含本文描述的任何Cas9多肽的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9结构域由本文描述的任何Cas9多肽的氨基酸序列组成。
在一些实例中,可将本文公开的碱基编辑器的CRISPR蛋白衍生结构域识别的PAM提供给细胞在与编码碱基编辑器的插入物(例如,AAV插入物)不同的寡核苷酸上。在这样的实施方案中,在单独的寡核苷酸上提供PAM可以允许切割否则将不能被切割的靶序列,因为在与靶序列相同的多核苷酸上不存在相邻的PAM。
在一个实施方案中,化脓链球菌Cas9(SpCas9)可用作基因组工程的CRISPR核酸内切酶。但是,也可以使用其他的。在一些实施方案中,不同的核酸内切酶可用于靶向某些基因组靶标。在一些实施方案中,可以使用具有非NGG PAM序列的合成SpCas9衍生变异体。此外,已经鉴定了来自不同物种的其他Cas9直系同源體,以及这些“非SpCas9”可以结合也可用于本发明的多种PAM序列。例如,相对较大的SpCas9(大约4千碱基(kb)编码序列)会导致携带SpCas9cDNA的质粒无法在细胞中有效表达。相反,金黄色葡萄球菌Cas9(SaCas9)的编码序列比SpCas9短约1千碱基,可能使其在细胞中有效表达。与SpCas9类似,SaCas9核酸内切酶能够在体外和小鼠体内修饰哺乳动物细胞中的靶基因。在一些实施方案中,Cas蛋白可以靶向不同的PAM序列。在一些实施方案中,靶基因可以与例如Cas9PAM、5’-NGG相邻。在其他实施方案中,其他Cas9直系同源體可具有不同的PAM要求。例如,其他PAM,例如嗜热链球菌(CRISPR1为5'-NNAGAA,CRISPR3为5'-NGGNG)和脑膜炎双球菌(Neisseriameningiditis)(5'-NNNNGATT)的PAM也可以与目标基因相邻。
在一些实施方案中,对于化脓性链球菌系统,靶基因序列可以在(即,5'到)5'-NGGPAM之前,以及20-nt向导RNA序列可以与相反链碱基配对以介导与PAM相邻的Cas9裂解。在一些实施方案中,相邻切割可以是或可以是PAM上游的约3个碱基对。在一些实施方案中,相邻切割可以是或可以是PAM上游的约10个碱基对。在一些实施方案中,相邻切割可以是或可以是PAM上游的约0-20个碱基对。例如,相邻的切割可以紧挨着1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29或30个PAM上游的碱基对。相邻的切割也可以在PAM的下游1到30个碱基对。能够结合PAM序列的示例性SpCas9蛋白的序列如下:
示例性的结合PAM的SpCas9的氨基酸序列如下:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
示例性的结合PAM的SpCas9n的氨基酸序列如下:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
示例性的结合PAM的SpEQR Cas9的氨基酸序列如下:
Figure BDA0003263753870002291
Figure BDA0003263753870002301
在所述序列中,残基E1135、Q1335和R1337可从D1135、R1335和T1337突变以产生SpEQR Cas9,用下划线和粗体表示。
示例性的结合PAM的SpVQR Cas9的氨基酸序列如下:
Figure BDA0003263753870002302
在所述序列中,残基V1135、Q1335和R1336可以从D1135、R1335和T1336突变以产生SpVQRCas9,用下划线和粗体表示。
示例性的结合PAM的SpVRERCas9的氨基酸序列如下:
Figure BDA0003263753870002311
在一些实施方案中,Cas9结构域是重组Cas9结构域。在一些实施方案中,重组Cas9结构域是SpyMacCas9结构域。在一些实施方案中,SpyMacCas9结构域是核酸酶活性的SpyMacCas9、核酸酶失活的SpyMacCas9(SpyMacCas9d)或SpyMacCas9切口酶(SpyMacCas9n)。在一些实施方案中,SaCas9结构域、SaCas9d结构域或SaCas9n结构域可结合具有非典范PAM的核酸序列。在一些实施方案中,SpyMacCas9结构域、SpCas9d结构域或SpCas9n结构域可以结合具有NAA PAM序列的核酸序列。
示例性SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDIGDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.
在一些情况下,变异体Cas9蛋白包含H840A、P475A、W476A、N477A、D1125A、W1126A和D1218A突变,使得多肽切割靶DNA或RNA的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。作为另一个非限制性实例,在一些情况下,变异体Cas9蛋白含有D10A、H840A、P475A、W476A、N477A、D1125A、W1126A和D1218A突变,使得多肽切割目标DNA的能力降低。此类Cas9蛋白切割靶DNA(例如,单链靶DNA)的能力降低,但保留结合靶DNA(例如,单链靶DNA)的能力。在某些情况下,当变异体Cas9蛋白包含W476A和W1126A突变或当变异体Cas9蛋白包含P475A、W476A、N477A、D1125A、W1126A和D1218A突变时,变异体Cas9蛋白不能有效地结合PAM序列。因此,在一些此类情况下,当此类变异体Cas9蛋白用于结合方法时,所述方法不需要PAM序列。换言之,在某些情况下,当这种变异体Cas9蛋白用于结合方法时,所述方法可以包括向导RNA,但是所述方法可以在不存在PAM序列的情况下进行(以及结合的特异性是因此由向导RNA的靶向片段提供)。可以突变其他残基以实现上述效果(即失活一个或其他核酸酶部分)。作为非限制性实例,残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987可以被改变(即,被取代)。此外,丙氨酸取代以外的突变也是合适的。在一些实施方案中,碱基编辑器的CRISPR蛋白衍生结构域可包含具有典范PAM序列(NGG)的Cas9蛋白的全部或部分。在其他实施方案中,碱基编辑器的Cas9衍生结构域可采用非典范PAM序列。此类序列已在本领域中描述以及对本领域技术人员来说是显而易见的。例如,结合非典范PAM序列的Cas9结构域已在Kleinstiver,B.P.等人,“Engineered CRISPR-Cas9 nucleases with changed PAMspecificities”Nature 523,481-485(2015)中有所描述;和Kleinstiver,B.P.等人,“Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 bymodifying PAM recognition”Nature Biotechnology 33,1293-1298(2015);每个的全部内容在此通过引用并入。
在一些实施方案中,Cas9结构域可以被对PAM序列没有要求的向导核苷酸序列可编程的DNA结合蛋白结构域替换。
在一些实施方案中,核酸可编程DNA结合蛋白(napDNAbp)是微生物CRISPR-Cas系统的单一效应物。微生物CRISPR-Cas系统的单一效应器包括但不限于Cas9、Cpf1、Cas12b/C2c1和Cas12c/C2c3。通常,微生物CRISPR-Cas系统分为1类和2类系统。1类系统具有多亚基效应复合物,而2类系统具有单个蛋白质效应器。例如,Cas9和Cpf1是2类效应器。除了Cas9和Cpf1之外,Shmakov等人在“Discovery and Functional Characterization of DiverseClass 2CRISPR Cas Systems”,Mol.Cell,2015Nov.5;60(3):385-397描述了三个不同的2类CRISPR-Cas系统(Cas12b/C2c1和Cas12c/C2c3),其全部内容在此引入作为参考。其中两个系统Cas12b/C2c1和Cas12c/C2c3的效应子包含与Cpf1相关的类RuvC核酸内切酶结构域。第三个系统包含一个具有两个预测HEPNRNase结构域的效应子。成熟CRISPR RNA的产生不依赖于tracr RNA,这与Cas12b/C2c1产生的CRISPR RNA不同。Cas12b/C2c1依赖CRISPR RNA和tracr RNA进行DNA切割。
已报道酸地环脂酸杆菌Cas12b/C2c1(AacC2c1)的晶体结构与嵌合单分子向导RNA(sgRNA)复合。参见例如,Liu等人,“C2c1-sgRNA Complex Structure Reveals RNA-GuidedDNA Cleavage Mechanism”,Mol.Cell,2017Jan.19;65(2):310-322,其全部内容通过引用并入本文。在以三元复合物形式与靶DNA结合的酸土脂环酸芽孢杆菌Cas12b/C2c1中也报道了晶体结构。参见例如,Yang等人,“PAM-dependent Target DNA Recognition andCleavage by C2C1CRISPR-Cas endonuclease”,Cell,2016Dec.15;167(7):1814-1828,其全部内容在此引入作为参考。AacC2c1的具有催化能力的构象,包含目标DNA链和非目标DNA链,已被独立地捕获在单个RuvC催化口袋内,Cas12b/C2c1介导的切割导致目标DNA的七核苷酸交错断裂。Cas12b/C2c1三元复合物与先前鉴定的Cas9和Cpf1相应物之间的结构比较证明了CRISPR-Cas9系统使用的机制的多样性。
在一些实施方案中,本文提供的任何融合蛋白的核酸可编程DNA结合蛋白(napDNAbp)可以是Cas12b/C2c1或Cas12c/C2c3蛋白。在一些实施方案中,napDNAbp是Cas12b/C2c1蛋白。在一些实施方案中,napDNAbp是Cas12c/C2c3蛋白。在一些实施方案中,napDNAbp包含的氨基酸序列为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与天然存在的Cas12b/C2c1或Cas12c/C2c3蛋白相同。在一些实施方案中,napDNAbp是天然存在的Cas12b/C2c1或Cas12c/C2c3蛋白。在一些实施方案中,napDNAbp包含的氨基酸序列为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文提供的任何一个napDNAbp序列相同。应当理解,根据本发明也可以使用来自其他细菌物个的Cas12b/C2c1或Cas12c/C2c3。CRISPR-Cas12b由例如Teng等人在Cell Discovery(2018)4:63中描述,所述文献通过引用整体并入本文。
Cas12b/C2c1(uniprot.org/uniprot/T0D7A2#2)
sp|T0D7A2|C2C1_ALIAG CRISPR-相关核酸内切酶C2c1 OS=酸土脂环酸芽孢杆菌(菌株ATCC 49025/DSM 3922/CIP 106132/NCIMB13137/GD2SV1B=13137/GD3C1B)
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
AacCas12b(嗜酸脂环杆菌)-WP_067623834
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI
BvCas12b(芽孢杆菌V3-13)NCBI参考序列:WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
BhCas12b(外村尚芽孢杆菌)NCBI参考序列:WP_095142515
Figure BDA0003263753870002371
包括称为BvCas12b V4的变异体(S893R/K846R/E837G更改为上述wt)
BhCas12b(V4)表达如下:5’mRNA Cap---5’UTR---bhCas12b---STOP序列---3’UTR---120polyA尾
5’UTR:
GGGAAATAAGAGAGAAAAGAAGAGTAAGAAGAAATATAAGAGCCACC
3’UTR(TriLink standard UTR)
GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGA
bhCas12b(V4)的核酸序列
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGCCACCAGATCCTTCATCCTGAAGATCGAGCCCAACGAGGAAGTGAAGAAAGGCCTCTGGAAAACCCACGAGGTGCTGAACCACGGAATCGCCTACTACATGAATATCCTGAAGCTGATCCGGCAAGAGGCCATCTACGAGCACCACGAGCAGGACCCCAAGAATCCCAAGAAGGTGTCCAAGGCCGAGATCCAGGCCGAGCTGTGGGATTTCGTGCTGAAGATGCAGAAGTGCAACAGCTTCACACACGAGGTGGACAAGGACGAGGTGTTCAACATCCTGAGAGAGCTGTACGAGGAACTGGTGCCCAGCAGCGTGGAAAAGAAGGGCGAAGCCAACCAGCTGAGCAACAAGTTTCTGTACCCTCTGGTGGACCCCAACAGCCAGTCTGGAAAGGGAACAGCCAGCAGCGGCAGAAAGCCCAGATGGTACAACCTGAAGATTGCCGGCGATCCCTCCTGGGAAGAAGAGAAGAAGAAGTGGGAAGAAGATAAGAAAAAGGACCCGCTGGCCAAGATCCTGGGCAAGCTGGCTGAGTACGGACTGATCCCTCTGTTCATCCCCTACACCGACAGCAACGAGCCCATCGTGAAAGAAATCAAGTGGATGGAAAAGTCCCGGAACCAGAGCGTGCGGCGGCTGGATAAGGACATGTTCATTCAGGCCCTGGAACGGTTCCTGAGCTGGGAGAGCTGGAACCTGAAAGTGAAAGAGGAATACGAGAAGGTCGAGAAAGAGTACAAGACCCTGGAAGAGAGGATCAAAGAGGACATCCAGGCTCTGAAGGCTCTGGAACAGTATGAGAAAGAGCGGCAAGAACAGCTGCTGCGGGACACCCTGAACACCAACGAGTACCGGCTGAGCAAGAGAGGCCTTAGAGGCTGGCGGGAAATCATCCAGAAATGGCTGAAAATGGACGAGAACGAGCCCTCCGAGAAGTACCTGGAAGTGTTCAAGGACTACCAGCGGAAGCACCCTAGAGAGGCCGGCGATTACAGCGTGTACGAGTTCCTGTCCAAGAAAGAGAACCACTTCATCTGGCGGAATCACCCTGAGTACCCCTACCTGTACGCCACCTTCTGCGAGATCGACAAGAAAAAGAAGGACGCCAAGCAGCAGGCCACCTTCACACTGGCCGATCCTATCAATCACCCTCTGTGGGTCCGATTCGAGGAAAGAAGCGGCAGCAACCTGAACAAGTACAGAATCCTGACCGAGCAGCTGCACACCGAGAAGCTGAAGAAAAAGCTGACAGTGCAGCTGGACCGGCTGATCTACCCTACAGAATCTGGCGGCTGGGAAGAGAAGGGCAAAGTGGACATTGTGCTGCTGCCCAGCCGGCAGTTCTACAACCAGATCTTCCTGGACATCGAGGAAAAGGGCAAGCACGCCTTCACCTACAAGGATGAGAGCATCAAGTTCCCTCTGAAGGGCACACTCGGCGGAGCCAGAGTGCAGTTCGACAGAGATCACCTGAGAAGATACCCTCACAAGGTGGAAAGCGGCAACGTGGGCAGAATCTACTTCAACATGACCGTGAACATCGAGCCTACAGAGTCCCCAGTGTCCAAGTCTCTGAAGATCCACCGGGACGACTTCCCCAAGGTGGTCAACTTCAAGCCCAAAGAACTGACCGAGTGGATCAAGGACAGCAAGGGCAAGAAACTGAAGTCCGGCATCGAGTCCCTGGAAATCGGCCTGAGAGTGATGAGCATCGACCTGGGACAGAGACAGGCCGCTGCCGCCTCTATTTTCGAGGTGGTGGATCAGAAGCCCGACATCGAAGGCAAGCTGTTTTTCCCAATCAAGGGCACCGAGCTGTATGCCGTGCACAGAGCCAGCTTCAACATCAAGCTGCCCGGCGAGACACTGGTCAAGAGCAGAGAAGTGCTGCGGAAGGCCAGAGAGGACAATCTGAAACTGATGAACCAGAAGCTCAACTTCCTGCGGAACGTGCTGCACTTCCAGCAGTTCGAGGACATCACCGAGAGAGAGAAGCGGGTCACCAAGTGGATCAGCAGACAAGAGAACAGCGACGTGCCCCTGGTGTACCAGGATGAGCTGATCCAGATCCGCGAGCTGATGTACAAGCCTTACAAGGACTGGGTCGCCTTCCTGAAGCAGCTCCACAAGAGACTGGAAGTCGAGATCGGCAAAGAAGTGAAGCACTGGCGGAAGTCCCTGAGCGACGGAAGAAAGGGCCTGTACGGCATCTCCCTGAAGAACATCGACGAGATCGATCGGACCCGGAAGTTCCTGCTGAGATGGTCCCTGAGGCCTACCGAACCTGGCGAAGTGCGTAGACTGGAACCCGGCCAGAGATTCGCCATCGACCAGCTGAATCACCTGAACGCCCTGAAAGAAGATCGGCTGAAGAAGATGGCCAACACCATCATCATGCACGCCCTGGGCTACTGCTACGACGTGCGGAAGAAGAAATGGCAGGCTAAGAACCCCGCCTGCCAGATCATCCTGTTCGAGGATCTGAGCAACTACAACCCCTACGAGGAAAGGTCCCGCTTCGAGAACAGCAAGCTCATGAAGTGGTCCAGACGCGAGATCCCCAGACAGGTTGCACTGCAGGGCGAGATCTATGGCCTGCAAGTGGGAGAAGTGGGCGCTCAGTTCAGCAGCAGATTCCACGCCAAGACAGGCAGCCCTGGCATCAGATGTAGCGTCGTGACCAAAGAGAAGCTGCAGGACAATCGGTTCTTCAAGAATCTGCAGAGAGAGGGCAGACTGACCCTGGACAAAATCGCCGTGCTGAAAGAGGGCGATCTGTACCCAGACAAAGGCGGCGAGAAGTTCATCAGCCTGAGCAAGGATCGGAAGTGCGTGACCACACACGCCGACATCAACGCCGCTCAGAACCTGCAGAAGCGGTTCTGGACAAGAACCCACGGCTTCTACAAGGTGTACTGCAAGGCCTACCAGGTGGACGGCCAGACCGTGTACATCCCTGAGAGCAAGGACCAGAAGCAGAAGATCATCGAAGAGTTCGGCGAGGGCTACTTCATTCTGAAGGACGGGGTGTACGAATGGGTCAACGCCGGCAAGCTGAAAATCAAGAAGGGCAGCTCCAAGCAGAGCAGCAGCGAGCTGGTGGATAGCGACATCCTGAAAGACAGCTTCGACCTGGCCTCCGAGCTGAAAGGCGAAAAGCTGATGCTGTACAGGGACCCCAGCGGCAATGTGTTCCCCAGCGACAAATGGATGGCCGCTGGCGTGTTCTTCGGAAAGCTGGAACGCATCCTGATCAGCAAGCTGACCAACCAGTACTCCATCAGCACCATCGAGGACGACAGCAGCAAGCAGTCTATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG
包含Cas9结构域和胞苷脱氨酶或腺苷脱氨酶的融合蛋白
本发明的一些方面提供包含Cas9结构域或其他核酸可编程DNA结合蛋白和一个或多个胞苷脱氨酶或腺苷脱氨酶结构域的融合蛋白。应当理解,Cas9结构域可以是本文提供的任何Cas9结构域或Cas9蛋白(例如,dCas9或nCas9)。在一些实施方案中,本文提供的任何Cas9结构域或Cas9蛋白(例如,dCas9或nCas9)可以与本文提供的任何胞苷脱氨酶融合。例如但不限于,在一些实施方案中,融合蛋白包含以下结构:
NH2-[胞苷脱氨酶]-[Cas9 domain]-COOH;或
NH2-[Cas9 domain]-[胞苷脱氨酶]-COOH。
在一些实施方案中,包含胞苷脱氨酶或腺苷脱氨酶和napDNAbp(例如Cas9结构域)的融合蛋白不包含连接子序列。在一些实施方案中,连接体存在于胞苷或腺苷脱氨酶与napDNAbp之间。在一些实施方案中,以上通用架构中使用的“-”表示可选连接子的存在。在一些实施方案中,胞苷或腺苷脱氨酶和napDNAbp通过本文提供的任何连接子融合。例如,在一些实施方案中,胞苷或腺苷脱氨酶和napDNAbp通过标题为“连接子”的部分中的任何连接子融合。
包含核定位序列(NLS)的融合蛋白
在一些实施方案中,本文提供的融合蛋白进一步包含一个或多个(例如,2、3、4、5)核靶向序列,例如核定位序列(NLS)。在一个实施方案中,使用二分NLS。在一些实施方案中,NLS包含促进包含NLS的蛋白质输入细胞核(例如,通过核转运)的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白进一步包含核定位序列(NLS)。在一些实施方案中,NLS与融合蛋白的N-末端融合。在一些实施方案中,NLS与融合蛋白的C末端融合。在一些实施方案中,NLS与Cas9结构域的N末端融合。在一些实施方案中,NLS与Cas9结构域的C末端融合。在一些实施方案中,NLS与胞苷或腺苷脱氨酶的N-末端融合。在一些实施方案中,NLS与胞苷或腺苷脱氨酶的C末端融合。在一些实施方案中,NLS通过一个或多个连接子与融合蛋白融合。在一些实施方案中,NLS在没有连接子的情况下与融合蛋白融合。在一些实施方案中,NLS包含本文提供或提及的任一NLS序列的氨基酸序列。额外的核定位序列是本领域已知的以及对本领域技术人员来说是显而易见的。例如,Plank等人,国际第PCT/EP2000/011690中描述了NLS序列,所述文献的内容以引用的方式并入本文中,因为其公开了示例性核定位序列。在一些实施方案中,NLS包含氨基酸序列KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRKPKKKRKV或MDSLLMNRRKFLYQFKNVRWAKGRRETYLC。
在一些实施方案中,具有胞苷或腺苷脱氨酶和Cas9结构域的示例性Cas9融合蛋白的一般结构包含以下结构中的任一种,其中NLS是核定位序列(例如,本文提供的任何NLS)、NH2是融合蛋白的N末端,COOH是融合蛋白的C末端:
NH2-NLS-[胞苷脱氨酶]-[Cas9结构域]-COOH;
NH2-NLS[Cas9结构域]-[胞苷脱氨酶]-COOH;
NH2-[胞苷脱氨酶]-[Cas9结构域]-NLS-COOH;或
NH2-[Cas9结构域]-[胞苷脱氨酶]-NLS-COOH。
NH2-NLS-[腺苷脱氨酶]-[Cas9结构域]-COOH;
NH2-NLS[Cas9结构域]-[adenosine deaminase]-COOH;
NH2-[腺苷脱氨酶]-[Cas9结构域]-NLS-COOH;或
NH2-[Cas9结构域]-[adenosine deaminase]-NLS-COOH。
在一些实施方案中,NLS存在于连接子中或NLS侧接连接子,例如本文所述。二分NLS包含两个基本氨基酸簇,其由相对较短的间隔物序列分隔(因此二分-2部分,而单部分NLS不是)。核质蛋白的NLS KR[PAATKKAGQA]KKKK是无处不在的二分信号的原型:两个碱性氨基酸簇,由大约10个氨基酸的间隔物隔开。
示例性二分NLS的序列如下:
PKKKRKVEGADKRTADGSEFES PKKKRKV
在一些实施方案中,包含胞苷或腺苷脱氨酶、Cas9结构域和NLS的融合蛋白不包含连接子序列。在一些实施方案中,存在一个或多个结构域或蛋白质(例如,胞苷或腺苷脱氨酶、Cas9结构域或NLS)之间的连接子序列。
应当理解,本发明的融合蛋白可以包含一个或多个附加特征。例如,在一些实施方案中,融合蛋白可包含抑制剂、细胞质定位序列、输出序列,例如核输出序列或其他定位序列,以及可用于溶解、纯化或检测融合的序列标签。蛋白质。本文提供的合适的蛋白质标签包括但不限于生物素羧化酶载体蛋白(BCCP)标签、myc标签、钙调蛋白标签、FLAG标签、血凝素(HA)标签、多组氨酸标签,也称为组氨酸标签或His-标签、麦芽糖结合蛋白(MBP)-标签、nus-标签、谷胱甘肽-S-转移酶(GST)-标签、绿色荧光蛋白(GFP)-标签、硫氧还蛋白-标签、S-标签、Softags(例如,Softag1、Softag3)、链标签、生物素连接酶标签、Flash标签、V5标签和SBP标签。其他合适的序列对本领域技术人员来说是显而易见的。在一些实施方案中,融合蛋白包含一个或多个His标签。
连接子
在某些实施方案中,连接子可用于连接本发明的任何肽或肽域。连接子可以像共价键一样简单,或者其可以是多个原子长度的聚合连接子。在某些实施方案中,连接子是多肽或基于氨基酸。在其他实施方案中,连接子不是类肽的。在某些实施方案中,连接子是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,连接子是酰胺键的碳-氮键。在某些实施方案中,连接子是环状或无环、取代或未取代、支链或未支链的脂族或杂脂族连接子。在某些实施方案中,连接子是聚合的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,连接子包含氨基链烷酸的单体、二聚体或聚合物。在某些实施方案中,连接子包含氨基链烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在某些实施方案中,连接子包含氨基己酸(Ahx)的单体、二聚体或聚合物。在某些实施方案中,连接子基于碳环部分(例如,环戊烷、环己烷)。在其他实施方案中,连接子包含聚乙二醇部分(PEG)。在其他实施方案中,连接子包含氨基酸。在某些实施方案中,连接子包含肽。在某些实施方案中,连接子包含芳基或杂芳基部分。在某些实施方案中,连接子基于苯环。连接子可以包括功能化部分以促进亲核试剂(例如,硫醇、氨基)从肽连接到连接子。任何亲电子试剂都可以用作连接子的一部分。示例性的亲电子试剂包括但不限于活化酯、活化酰胺、迈克尔受体、卤代烷、芳基卤、酰基卤和异硫氰酸酯。
在一些实施方案中,连接子是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是键(例如共价键)、有机分子、基团、聚合物或化学部分。在一些实施方案中,胞苷或腺苷脱氨酶和napDNAbp通过包含4、16、32或104个氨基酸长度的连接子融合。在一些实施方案中,连接子的长度为约3至约104个氨基酸。在一些实施方案中,本文提供的任何融合蛋白包含通过连接子彼此融合的胞苷或腺苷脱氨酶和Cas9结构域。例如,可以使用胞苷或腺苷脱氨酶与Cas9结构域之间的各种连接子长度和灵活性(例如,从(GGGS)n、(GGGGS)n和(G)n形式的非常灵活的连接子到更刚性的连接子(EAAAK)n、(SGGS)n、SGSETPGTSESATPES(参见,例如Guilinger JP、Thompson DB、Liu DR.Fusion ofcatalytically inactive Cas9 to FokI nuclease improves the specificity ofgenome modification.Nat.Biotechnol.2014;32(6):577-82;全部内容通过引用并入本文)和(XP)n)以实现胞苷或腺苷脱氨酶核碱基编辑器活性的最佳长度。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接子包含(GGS)n基序,其中n是1、3或7。在一些实施方案中,胞苷脱氨酶或腺苷脱氨酶和本文提供的任何融合蛋白的Cas9结构域通过包含氨基酸序列SGSETPGTSESATPES的连接子融合。
Cas9与向导RNA的复合物
本发明的一些方面提供包含本文提供的任何融合蛋白和结合到融合蛋白的Cas9结构域(例如,dCas9、核酸酶活性Cas9或Cas9切口酶)的向导RNA的复合物。这些复合物也称为核糖核蛋白(RNP)。在一些实施方案中,向导核酸(例如向导RNA)的长度为15至100个核苷酸以及包含与靶序列互补的至少10个连续核苷酸的序列。在一些实施方案中,向导RNA是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸长。在一些实施方案中,向导RNA包含15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个与靶序列互补的连续核苷酸的序列。在一些实施方案中,靶序列是DNA序列。在一些实施方案中,靶序列是RNA序列。在一些实施方案中,靶序列是哺乳动物基因组中的序列。在一些实施方案中,靶序列是人类基因组中的序列。在一些实施方案中,靶序列的3'端紧邻典范PAM序列(NGG)。在一些实施方案中,向导核酸(例如向导RNA)与疾病或病症相关的序列互补。
在一些实施方案中,向导RNA被设计成破坏剪接位点(即,剪接受体(SA)或剪接供体(SD)。在一些实施方案中,向导RNA被设计为使得碱基编辑导致过早终止密码子。表8A、表8B和表8C提供了旨在破坏剪接位点或导致过早终止密码子的gRNA靶序列的非详尽列表。
本文提供了用于在宿主细胞中进行碱基编辑的组成物和方法,例如。免疫细胞。本文进一步提供了包含向导多核酸序列的组成物,例如一个向导RNA序列,或2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多如本文提供的向导RNA的组合。在一些实施方案中,如本文提供的用于碱基编辑的组成物进一步包含编码碱基编辑器的多核苷酸,例如C-碱基编辑器或A-碱基编辑器。例如,用于碱基编辑的组成物可以包含编码BE、BE4、ABE和一种或多种所提供的向导RNA的组合的mRNA序列。用于碱基编辑的组成物可以包含碱基编辑器多肽和一种或多种本文提供的任何向导RNA的组合。这种组成物可用于通过不同的递送方法,例如电穿孔、核转染、病毒转导或转染,在免疫细胞中实现碱基编辑。在一些实施方案中,用于碱基编辑的组成物包含编码碱基编辑器的mRNA序列和本文提供的用于电穿孔的一种或多种向导RNA序列的组合。
表8A:gRNA:剪接位点和终止密码子
Figure BDA0003263753870002451
Figure BDA0003263753870002461
Figure BDA0003263753870002471
Figure BDA0003263753870002481
Figure BDA0003263753870002491
Figure BDA0003263753870002501
Figure BDA0003263753870002511
Figure BDA0003263753870002521
Figure BDA0003263753870002531
Figure BDA0003263753870002541
Figure BDA0003263753870002551
Figure BDA0003263753870002561
Figure BDA0003263753870002571
Figure BDA0003263753870002581
Figure BDA0003263753870002591
表8B
Figure BDA0003263753870002601
表8C
Figure BDA0003263753870002611
Figure BDA0003263753870002621
Figure BDA0003263753870002631
Figure BDA0003263753870002641
Figure BDA0003263753870002651
Figure BDA0003263753870002661
Figure BDA0003263753870002671
Figure BDA0003263753870002681
Figure BDA0003263753870002691
Figure BDA0003263753870002701
Figure BDA0003263753870002711
Figure BDA0003263753870002721
Figure BDA0003263753870002731
Figure BDA0003263753870002741
Figure BDA0003263753870002751
Figure BDA0003263753870002761
Figure BDA0003263753870002771
Figure BDA0003263753870002781
Figure BDA0003263753870002791
Figure BDA0003263753870002801
Figure BDA0003263753870002811
Figure BDA0003263753870002821
Figure BDA0003263753870002831
Figure BDA0003263753870002841
Figure BDA0003263753870002851
Figure BDA0003263753870002861
Figure BDA0003263753870002871
Figure BDA0003263753870002881
Figure BDA0003263753870002891
使用包含胞苷或腺苷脱氨酶和Cas9结构域的融合蛋白的方法
本发明的一些方面提供了使用本文提供的融合蛋白或复合物的方法。例如,本发明的一些方面提供了包含使DNA分子与本文提供的任何融合蛋白和至少一个向导RNA接触的方法,其中向导RNA长约15至100个核苷酸以及包含至少与目标序列互补的10个连续核苷酸。在一些实施方案中,靶序列的3'端紧邻典范PAM序列(NGG)。在一些实施方案中,靶序列的3'末端不与典范PAM序列(NGG)直接相邻。在一些实施方案中,靶序列的3'端紧邻AGC、GAG、TTT、GTG或CAA序列。在一些实施方案中,靶序列的3'端紧邻NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN或5'(TTTV)序列。
在一些实施方案中,本发明的融合蛋白用于诱变感兴趣的靶标。特别地,本文所述的胞苷脱氨酶或腺苷脱氨酶核碱基编辑器能够在靶序列内产生多个突变。这些突变可能会影响目标的功能。例如,当使用胞苷脱氨酶或腺苷脱氨酶核碱基编辑器靶向调控区时,调控区的功能发生改变,下游蛋白的表达降低。
应当理解,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如,成熟蛋白质的前体和成熟蛋白质本身,物种之间的序列差异可能会影响编号。本领域技术人员将能够通过本领域众所周知的方法,例如通过序列比对和同源残基的测定,鉴定任何同源蛋白质和相应编码核酸中的相应残基。
本领域技术人员显而易见的是,为了将包含Cas9结构域和胞苷或腺苷脱氨酶的任何融合蛋白,如本文公开的,靶向靶位点,例如,包含对于要编辑的突变,通常需要将融合蛋白与向导RNA(例如sgRNA)共表达。如本文别处更详细解释的,向导RNA通常包含允许Cas9结合的tracrRNA框架和赋予Cas9:核酸编辑酶/结构域融合蛋白序列特异性的向导序列。或者,向导RNA和tracrRNA可以作为两个核酸分子分开提供。在一些实施方案中,向导RNA包含一种结构,其中向导序列包含与靶序列互补的序列。向导序列的长度通常为20个核苷酸。基于本发明,用于将Cas9:核酸编辑酶/结构域融合蛋白靶向特定基因组靶位点的合适的向导RNA的序列对于本领域技术人员来说将是显而易见的。此类合适的向导RNA序列通常包含与待编辑的靶核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。本文提供了一些适用于将任何提供的融合蛋白靶向特定靶序列的示例性向导RNA序列。
碱基编辑器效率
本发明的一些方面基于以下认识:本文提供的任何碱基编辑器可以修饰特定核苷酸碱基而不产生相当大比例的插入缺失。如本文所用,“插入缺失”是指核酸内核苷酸碱基的插入或缺失。这种插入或缺失可导致基因编码区内的移码突变。在一些实施方案中,期望产生有效修饰(例如突变)核酸内的特定核苷酸而不在核酸中产生大量插入或缺失(即,插入缺失)的碱基编辑器。在一些实施方案中,期望产生有效修饰(例如突变或甲基化)核酸内的特定核苷酸而不在核酸中产生大量插入或缺失(即,插入缺失)的碱基编辑器。在某些实施方案中,与插入缺失相比,本文提供的任何碱基编辑器可以产生更大比例的预期修饰(例如,甲基化)。在某些实施方案中,本文提供的任何碱基编辑器与插入缺失相比可以产生更大比例的预期修饰(例如,突变)。在一些实施方案中,本文提供的碱基编辑器能够产生大于1:1的预期突变与插入缺失的比率。在一些实施方案中,本文提供的碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少200:1、至少300:1、至少400:1、至少500:1、至少600:1、至少700:1、至少800:1、至少900:1,或至少1000:1,或更多的预期突变与插入缺失的比率。可以使用任何合适的方法确定预期突变和插入缺失的数量。
在一些实施方案中,本文提供的碱基编辑器可以限制核酸区域中插入缺失的形成。在一些实施方案中,所述区域位于碱基编辑器靶向的核苷酸处或碱基编辑器靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸内的区域。在一些实施方案中,本文提供的任何碱基编辑器可将核酸区域处插入缺失的形成限制为小于1%、小于1.5%、小于2%、小于2.5%、小于3%、小于3.5%、小于4%、小于4.5%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于12%、小于15%或小于20%。在核酸区域形成的插入缺失的数量可取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方案中,插入缺失的数量或比例在至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少将核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器3天、至少4天、至少5天、至少7天、至少10天或至少14天。
本发明的一些方面基于这样的认识,即本文提供的任何碱基编辑器能够有效地在核酸(例如个体基因组内的核酸)中产生预期突变而不产生大量的意外突变。在一些实施方案中,预期突变是由与gRNA结合的特定碱基编辑器产生的突变,专门设计用于产生预期突变。在一些实施方案中,预期突变是产生终止密码子的突变,例如基因编码区内的提前终止密码子。在一些实施方案中,预期突变是消除终止密码子的突变。在一些实施方案中,预期突变是改变基因剪接的突变。在一些实施方案中,预期突变是改变基因(例如,基因启动子或基因阻遏物)的调控序列的突变。在一些实施方案中,本文提供的任何碱基编辑器能够产生大于1:1的预期突变与非预期突变(例如,预期突变:非预期突变)的比率。在一些实施方案中,本文提供的任何碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少1.5:1、至少2:1、至少2:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1,至少8:1,至少10:1,至少12:1,至少15:1,至少20:1,至少25:1,至少30:1,至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1或至少1000:1或更多的预期突变与非预期突变的比率。应当理解,本文“碱基编辑器效率”部分中描述的碱基编辑器的特征可应用于任何融合蛋白,或使用本文提供的融合蛋白的方法。
碱基编辑通常被称为“修饰”,例如基因修饰、基因修饰和核酸序列的修饰,以及基于修饰是碱基编辑经修饰的上下文是可以清楚理解的。因此,碱基编辑修饰是核苷酸碱基水平的修饰,例如作为本发明通篇讨论的脱氨酶活性的结果,然后导致基因序列的改变,以及可能影响基因产物。因此,本质上,本文所述的基因编辑修饰可导致基因在结构和/或功能上的修饰,其中基因产物的表达可被修饰,例如基因的表达被敲除;或者相反,可以增强,或者在某些情况下,可以修改基因功能或活性。使用本文公开的方法,可以将碱基编辑效率确定为进行碱基编辑的基因的敲弱效率,其中碱基编辑旨在敲弱基因的表达。敲弱水平可以通过任何检测测定法确定表达水平来定量验证,例如蛋白质表达水平测定法,例如,通过流式细胞术;用于检测RNA表达的分析,例如定量RT-PCR、北方印迹分析或任何其他合适的分析,例如焦磷酸测序;以及可以通过核苷酸测序反应进行定性验证。
在一些实施方案中,修饰例如单碱基编辑导致基因靶向表达降低至少10%。在一些实施方案中,碱基编辑效率可导致基因靶向表达降低至少10%。在一些实施方案中,碱基编辑效率可导致基因靶向表达降低至少20%。在一些实施方案中,碱基编辑效率可导致基因靶向表达降低至少30%。在一些实施方案中,碱基编辑效率可导致基因靶向表达降低至少40%。在一些实施方案中,碱基编辑效率可导致基因靶向表达降低至少50%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少60%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少70%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少80%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少90%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少91%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少92%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少93%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少94%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少95%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少96%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少97%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少98%。在一些实施方案中,碱基编辑效率可导致靶向基因表达降低至少99%。在一些实施方案中,碱基编辑效率可导致靶向基因的敲除(基因表达的100%敲弱)。
在一些实施方案中,靶向修饰,例如单碱基编辑,同时用于靶向至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个不同的内源序列,用于使用不同的向导RNA进行碱基编辑。在一些实施方案中,靶向修饰,例如单碱基编辑,用于顺序靶向至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多不同的内源基因序列,用于使用不同的向导RNA进行碱基编辑。
在一些实施方案中,单个基因递送事件(例如,通过转导、转染、电穿孔或任何其他方法)可用于靶向细胞基因组内5个序列的碱基编辑。在一些实施方案中,单个基因递送事件可用于靶向细胞基因组内6个序列的碱基编辑。在一些实施方案中,单个基因递送事件可用于靶向细胞基因组内7个序列的碱基编辑。在一些实施方案中,单个电穿孔事件可用于靶向细胞基因组内8个序列的碱基编辑。在一些实施方案中,单个基因递送事件可用于靶向细胞基因组内9个序列的碱基编辑。在一些实施方案中,单个基因递送事件可用于靶向细胞基因组内10个序列的碱基编辑。在一些实施方案中,单个基因递送事件可用于靶向细胞基因组内20个序列的碱基编辑。在一些实施方案中,单个基因递送事件可用于靶向细胞基因组内30个序列的碱基编辑。在一些实施方案中,单个基因递送事件可用于靶向细胞基因组内40个序列的碱基编辑。在一些实施方案中,单个基因递送事件可用于靶向细胞基因组内50个序列的碱基编辑。
在一些实施方案中,本文所述的方法,例如,碱基编辑方法具有最小到没有脱靶效应。
在一些实施方案中,本文所述的碱基编辑方法导致至少50%的细胞群已被成功编辑(即,已成功改造的细胞)。在一些实施方案中,本文所述的碱基编辑方法导致至少55%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少60%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少65%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少70%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少75%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少80%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少85%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少90%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致至少95%的细胞群已被成功编辑。在一些实施方案中,本文所述的碱基编辑方法导致约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的细胞群已被成功编辑。
在一些实施方案中,碱基编辑干预后的活细胞回收率大于碱基编辑事件时细胞群的至少60%、70%、80%、90%。在一些实施方案中,如上所述的活细胞回收率为约70%。在一些实施方案中,如上所述的活细胞回收率为约75%。在一些实施方案中,如上所述的活细胞回收率为约80%。在一些实施方案中,如上所述的活细胞回收率为约85%。在一些实施方案中,如上所述的活细胞回收率为约90%,或约91%、92%、93%、94%、95%、96%、97%、98%或99%,或100%碱基编辑事件时细胞群中的细胞。
在一些实施方案中,工程化细胞群可在体外进一步扩增约2倍、约3倍、约4倍、约5倍、约6倍、约7倍、约8倍、约9倍、约10倍、约15倍、约20倍、约25倍、约30倍、约35倍、约40倍、约45倍、约50倍,或约100倍。
编辑核酸的方法
本发明的一些方面提供了用于编辑核酸的方法。在一些实施方案中,所述方法是用于编辑核酸的核碱基(例如,双链DNA序列的碱基对)的方法。在一些实施方案中,所述方法包含以下步骤:a)使核酸的目标区域(例如,双链DNA序列)与包含碱基编辑器(例如,与胞苷或腺苷融合的Cas9结构域)的复合物接触脱氨酶)和向导核酸(例如,gRNA),其中目标区域包含目标核碱基对,b)诱导所述目标区域的链分离,c)将所述目标核碱基对的第一个核碱基转化为单链目标区域与第二核碱基,和d)切割不超过所述目标区域的一条链,其中与第一核碱基互补的第三核碱基被与第二核碱基互补的第四核碱基替换。在一些实施方案中,所述方法导致核酸中少于20%的插入缺失形成。应当理解,在一些实施方案中,步骤b被省略。在一些实施方案中,所述方法导致小于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或小于0.1%插入缺失形成率。在一些实施方案中,所述方法进一步包含用与第四核碱基互补的第五核碱基替换第二核碱基,从而产生预期的编辑碱基对(例如,C·G至T·A)。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。
在一些实施方案中,靶核苷酸中的预期产物与非预期产物的比率为至少2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或200:1或更高。在一些实施方案中,预期突变与插入缺失形成的比率大于1:1、10:1、50:1、100:1、500:1或1000:1或更多。在一些实施方案中,切割的单链(切口链)与向导核酸杂交。在一些实施方案中,切割的单链与包含第一核碱基的链相反。在一些实施方案中,碱基编辑器包含Cas9结构域。在一些实施方案中,碱基编辑器保护或结合非编辑链。在一些实施方案中,碱基编辑器包含切口酶活性。在一些实施方案中,预期的编辑碱基对在PAM位点的上游。在一些实施方案中,预期的编辑碱基对是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20PAM位点上游的核苷酸。在一些实施方案中,预期的编辑碱基对在PAM位点的下游。在一些实施方案中,预期的编辑碱基对是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20PAM位点下游的核苷酸流。在一些实施方案中,所述方法不需要典范的(例如,NGG)PAM位点。在一些实施方案中,核碱基编辑器包含连接子。在一些实施方案中,连接子的长度为1至25个氨基酸。在一些实施方案中,连接子长度为5至20个氨基酸。在一些实施方案中,连接子的长度为10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一个实施方案中,连接子的长度为32个氨基酸。在另一个实施方案中,“长连接子”的长度为至少约60个氨基酸。在其他实施方案中,连接子长度在约3至100个氨基酸之间。在一些实施方案中,靶区域包含靶窗口,其中靶窗口包含靶核碱基对。在一些实施方案中,靶窗口包含1至10个核苷酸。在一些实施方案中,靶窗口的长度为1至9、1至8、1至7、1至6、1至5、1至4、1至3、1至2或1个核苷酸。在一些实施方案中,靶窗口的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对在靶窗口内。在一些实施方案中,靶窗口包含预期的编辑碱基对。在一些实施方案中,使用本文提供的任何碱基编辑器来执行所述方法。在一些实施方案中,靶窗口是甲基化窗口。
在一些实施方案中,本发明提供了用于编辑核苷酸的方法。在一些实施方案中,本发明提供了一个用于编辑双链DNA序列的核碱基对的方法。在一些实施方案中,所述方法包含a)使双链DNA序列的靶区域与包含碱基编辑器和向导核酸(例如gRNA)的复合物接触,其中靶区域包含靶核碱基对,b)诱导所述靶区域的链分离,c)将靶区域的单链中的所述靶核碱基对的第一个核碱基转化为第二个核碱基,d)切割不超过一条所述靶区域的链,其中第三个核碱基互补第一核碱基被与第二核碱基互补的第四核碱基替换,以及第二核碱基被与第四核碱基互补的第五核碱基替换,从而产生预期的编辑碱基对,其中产生预期的碱基对的效率编辑的碱基对至少为5%。应当理解,在一些实施方案中,步骤b被省略。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。在一些实施方案中,通过本文描述的方法进行的碱基编辑在任何特定基因位点可具有至少10%的碱基转化效率。在一些实施方案中,通过本文描述的方法在任何特定基因位点进行的碱基编辑可具有至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%至少55%或至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%、96%、97%、98%或至少99%的碱基转化效率。在一些实施方案中,通过本文描述的方法进行的碱基编辑在任何特定基因位点可具有至少70%的碱基转换效率。在一些实施方案中,通过本文所述方法进行的碱基编辑在任何特定基因位点可具有至少80%的碱基转化效率。在一些实施方案中,通过本文描述的方法进行的碱基编辑在任何特定基因位点可具有至少90%的碱基转化效率。
在一些实施方案中,所述方法导致小于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%、或小于0.1%的插入缺失形成。在一些实施方案中,靶核苷酸处的预期产物与非预期产物的比率为至少2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或200:1或更高。在一些实施方案中,预期突变与插入缺失形成的比率大于1:1、10:1、50:1、100:1、500:1或1000:1或更多。在一些实施方案中,切割的单链与向导核酸杂交。在一些实施方案中,切割的单链与包含第一核碱基的链相反。在一些实施方案中,核碱基编辑器包含切口酶活性。在一些实施方案中,预期的编辑碱基对在PAM位点的上游。在一些实施方案中,预期的编辑碱基对是PAM位点上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对在PAM位点的下游。在一些实施方案中,预期的编辑碱基对是PAM位点下游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸流。在一些实施方案中,所述方法不需要典范的(例如,NGG)PAM位点。在一些实施方案中,核碱基编辑器包含连接子。在一些实施方案中,连接子的长度为1-25个氨基酸。在一些实施方案中,连接子长度为5至20个氨基酸。在一些实施方案中,连接子的长度为10、11、12、13、14、15、16、17、18、19或20个氨基酸。例如,在一些实施方案中,靶区域包含靶窗口,其中靶窗口包含靶核碱基对。在一些实施方案中,靶窗口包含1至10个核苷酸。在一些实施方案中,靶窗口的长度为1至9、1至8、1至7、1至6、1至5、1至4、1至3、1至2或1个核苷酸。在一些实施方案中,靶窗口的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对出现在靶窗口内。在一些实施方案中,靶窗口包含预期的编辑碱基对。在一些实施方案中,核碱基编辑器是本文提供的任何一个碱基编辑器。
基于核酸的胞苷或腺苷脱氨酶核碱基编辑器的传递
根据本发明内容的编码胞苷或腺苷脱氨酶核碱基编辑器的核酸可通过本领域已知的方法或如本文所述施用于个体或递送至细胞中。例如,胞苷或腺苷脱氨酶核碱基编辑器可以通过例如载体(例如病毒或非病毒载体)、基于非载体的方法(例如,使用裸DNA或DNA复合物)或其组合递送。
编码胞苷或腺苷脱氨酶核碱基编辑器的核酸可作为裸DNA或RNA直接递送至细胞,例如通过转染或电穿孔,或可缀合至促进细胞摄取的分子(例如,N-乙酰半乳糖胺)靶细胞。也可以使用核酸载体,例如载体。在特定实施方案中,多核苷酸,例如编码碱基编辑器或其功能组分的mRNA可以与如本文所述的多种向导RNA的组合共电穿孔。
核酸载体可包含编码本文所述的融合蛋白的结构域的一个或多个序列。载体还可以包含编码信号肽的序列(例如,用于核定位、核仁定位或线粒体定位),与编码蛋白质的序列相关联(例如,插入或融合到)。作为一个实例,核酸载体可包括Cas9编码序列,其包括一种或多种核定位序列(例如,来自SV40的核定位序列)和一种或多种脱氨酶。
核酸载体还可以包括任何合适数量的调节/控制元件,例如启动子、增强子、内含子、聚腺苷酸化信号、Kozak共有序列或内部核糖体进入位点(IRES)。这些元件在本领域中是众所周知的。
根据本发明的核酸载体包括重组病毒载体。示例性病毒载体如上文所述。也可以使用本领域已知的其他病毒载体。此外,病毒颗粒可用于递送核酸和/或肽形式的基因组编辑系统组件。例如,“空”病毒颗粒可以组装成包含任何合适的货物。病毒载体和病毒颗粒也可以被设计成结合靶向配体来改变靶组织特异性。
除了病毒载体,非病毒载体可用于递送编码根据本发明的基因组编辑系统的核酸。一类重要的非病毒核酸载体是纳米颗粒,其可以是有机的或无机的。纳米颗粒是本领域公知的。任何合适的纳米颗粒设计均可用于递送基因组编辑系统组分或编码此类组分的核酸。例如,有机(例如脂质和/或聚合物)纳米颗粒可适合用作本发明的某些实施方案中的递送载体。用于纳米颗粒制剂和/或基因转移的示例性脂质示于表9(以下)。
表9
Figure BDA0003263753870003001
Figure BDA0003263753870003011
表10列出了用于基因转移和/或纳米颗粒制剂的示例性聚合物。
表10
Figure BDA0003263753870003012
Figure BDA0003263753870003021
下表11总结了编码本文所述融合蛋白的多核苷酸的递送方法。
表11
Figure BDA0003263753870003022
在特定实施方案中,本发明的融合蛋白由病毒载体(例如,腺相关病毒(AAV)、AAV3、AAV3b、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh8、AAV10及其变异体)或任何病毒载体的合适衣壳蛋白。因此,在一些方面,本发明内容涉及融合蛋白的病毒递送。病毒载体的例子包括反转录病毒载体(例如马洛尼鼠白血病病毒,MML-V)、腺病毒载体(例如AD100)、慢病毒载体(基于HIV和FIV的载体)、疱疹病毒载体(例如HSV-2)。
在一个实施方案中,内含肽用于连接移植到AAV衣壳蛋白上的胞苷或腺苷脱氨酶碱基编辑器蛋白的片段或部分。如本文所用,“内含子”是指连接侧翼N-末端和C-末端外显子(例如,待连接的片段)的自剪接蛋白质内含子(例如,肽)。某些内含肽用于连接异源蛋白质片段的用途在例如Wood等人,J.Biol.Chem.289(21);14512-9(2014)。例如,当与分离的蛋白质片段融合时,内含肽IntN和IntC相互识别,将自身剪断并同时连接其所融合的蛋白质片段的侧翼N和C末端外显肽,从而重建全长来自两个蛋白质片段的蛋白质。其他合适的内含肽对本领域技术人员来说是显而易见的。
本发明的融合蛋白的片段的长度可以不同。在一些实施方案中,蛋白质片段的长度为2个氨基酸至约1000个氨基酸。在一些实施方案中,蛋白质片段的长度为约5个氨基酸至约500个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约20个氨基酸至约200个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约10个氨基酸至约100个氨基酸。其他长度的合适蛋白质片段对本领域技术人员来说是显而易见的。
在一些实施方案中,核酸酶的一部分或片段(例如,脱氨酶的片段,例如胞苷或腺苷脱氨酶,或Cas9的片段)与内含肽融合。核酸酶可以融合到内含肽的N末端或C末端。在一些实施方案中,融合蛋白的一部分或片段与内含肽融合并与AAV衣壳蛋白融合。内含肽、核酸酶和衣壳蛋白可以任何排列融合在一起(例如,核酸酶-内含肽-衣壳、内含肽-核酸酶-衣壳、衣壳-内含肽-核酸酶等)。在一些实施方案中,内含肽的N-末端与融合蛋白的C-末端融合,以及内含肽的C-末端与AAV衣壳蛋白的N-末端融合。
在一些方面,本文所述的用于编辑免疫细胞中特定基因的方法可用于遗传修饰CAR-T细胞。此类CAR-T细胞和产生此类CAR-T细胞的方法描述于国际第PCT/US2016/060736号专利申请案、国际第PCT/US2016/060734号专利申请案、国际第PCT/US2016/034873号专利申请案、国际第PCT/US2015/040660号专利申请案、国际第PCT/EP2016/055332号专利申请案、国际第PCT/IB2015/058650号专利申请案、国际第PCT/EP2015/067441号专利申请案、国际第PCT/EP2014/078876号专利申请案、国际第PCT/EP2014/059662号专利申请案、国际第PCT/IB2014/061409号专利申请案、国际第PCT/US2016/019192号专利申请案、国际第PCT/US2015/059106号专利申请案、国际第PCT/US2016/052260号专利申请案、国际第PCT/US2015/020606号专利申请案、国际第PCT/US2015/055764号专利申请案、国际第PCT/CN2014/094393号专利申请案、国际第PCT/US2017/059989号专利申请案、国际第PCT/US2017/027606号专利申请案和国际第PCT/US2015/064269号专利申请案的全部内容在此并入。
药物组成物
在一些方面,本发明提供了包含本发明的基因经修饰的免疫细胞的药物组成物。更具体地,本文提供了药物组成物,其包含表达嵌合抗原受体的基因经修饰的免疫细胞或此类免疫细胞的群体,其中所述经修饰的免疫细胞或其群体具有至少一个经编辑的基因被编辑以增强经修饰的免疫细胞的功能或减少经修饰的免疫细胞的免疫抑制或抑制,其中编辑基因的表达被敲除或敲弱。在一些实施方案中,至少一个编辑基因是TRAC、B2M、PDCD1、CBLB、TGFBR2、ZAP70、NFATc1、TET2或其组合。
本发明的药物组成物可以根据已知技术制备。参见例如Remington,The ScienceAnd Practice of Pharmacy(21st ed.2005)。通常,免疫细胞或其群在施用或储存之前与合适的载体混合,以及在一些实施方案中,药物组成物进一步包含药学上可接受的载体。合适的药学上可接受的载体通常包含惰性物质,这些惰性物质有助于将药物组成物给予个体,有助于将药物组成物加工成可递送的制剂,或有助于在给药前储存药物组成物。药学上可接受的载体可以包括能够稳定、优化或以其他方式改变制剂的形式、稠度、粘度、pH、药代动力学、溶解度的试剂。此类试剂包括缓冲剂、润湿剂、乳化剂、稀释剂、包封剂和皮肤渗透促进剂。例如,载体可包括但不限于盐水、缓冲盐水、葡萄糖、精氨酸、蔗糖、水、甘油、乙醇、山梨糖醇、葡聚糖、羧甲基纤维素钠及其组合。
除了经修饰的免疫细胞或其群和载体之外,本发明的药物组成物可以包含至少一个用于治疗疾病的另外的治疗剂。例如,本文描述的药物组成物的一些实施方案还包含化疗剂。在一些实施方案中,药物组成物进一步包含细胞因子肽或编码细胞因子肽的核酸序列。在一些实施方案中,包含经修饰的免疫细胞或其群体的药物组成物可以与另外的治疗剂分开施用。
本发明的药物组成物可用于治疗对自体或同种异体免疫细胞免疫疗法有反应的任何疾病或病症。例如,在一些实施方案中,药物组成物可用于治疗肿瘤。在一些实施方案中,肿瘤是血液癌症。在一些实施方案中,血液癌症是B细胞癌,以及在一些实施方案中,B细胞癌是多发性骨髓瘤。在一些实施方案中,B细胞癌是复发性/难治性多发性骨髓瘤的复发。
关于本发明的遗传经修饰的免疫细胞的治疗用途的一个考虑因素是实现最佳或令人满意的效果所必需的细胞数量。待施用的细胞量可因接受治疗的个体而异。在一个实施方案中,向人类个体施用104至1010、105至109或106至108之间的本发明遗传经修饰的免疫应答细胞。在一些实施方案中,向人类个体施用至少约1×108、2×108、3×108、4×108和5×108个本发明的遗传经修饰的免疫细胞。确定精确的有效剂量可能基于每个个体个体的因素,包括他们的大小、年龄、性别、体重和状况。本领域技术人员根据本发明内容和本领域知识可以容易地确定剂量。
本领域技术人员可以容易地确定组成物中的细胞数量和任选的添加剂、赋形剂和/或载体的量,并在本发明的方法中施用。通常,添加剂(除活性免疫细胞外)以0.001至50%(重量)的磷酸盐缓冲盐水溶液存在,活性成分以微克至毫克的数量级存在,例如约0.0001至约5wt%,优选约0.0001至约1wt%,还更优选约0.0001至约0.05wt%或约0.001至约20wt%,优选约0.01至约10wt%,再更优选约0.05至约5重量%。当然,对于施用于动物或人的任何组成物,以及对于任何特定的给药方法,因此优选确定:毒性,例如通过确定合适动物模型中的致死剂量(LD)和LD50(例如,啮齿动物,如老鼠);以及组成物的剂量、其中组分的浓度和施用组成物的时间,这会引起合适的反应。根据本领域技术人员的知识、本发明内容和本文引用的文件,此类确定不需要过多的实验。以及,无需过度实验即可确定连续给药的时间。
在一个实施方案中,本文所述的方法和组成物可用于产生表达CAR且可具有一种或多种碱基编辑经修饰的工程化T细胞,使得工程化T细胞可针对靶标产生特异性免疫应答。CAR可以特异性地针对抗原靶,抗原可以由宿主中的细胞呈递。在一些实施方案中,免疫应答包含细胞毒性。在一些实施方案中,工程化T细胞针对其靶具有增强的细胞毒性反应。在一些实施方案中,与非工程化T细胞相比,工程化T细胞诱导针对其靶的增强的细胞毒性反应。在一些实施方案中,与非工程化细胞相比,工程化T细胞表现出至少1.1倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍或更多的增强的细胞毒性反应。在一些实施方案中,工程化T细胞比非工程化细胞可以杀死至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少200%、至少500%或至少1000%更多的靶细胞。在一些实施方案中,T细胞可以诱导更高的记忆反应。在一些实施方案中,T细胞可诱导比非工程化细胞更低水平的炎性细胞因子,即工程化细胞不引起细胞因子风暴反应。
在一些实施方案中,将工程化T细胞施用于同种异体宿主,其中工程化T细胞没有被宿主排斥。在一些实施方案中,同种异体T细胞引起宿主的可忽略的或最小的排斥。
治疗方法
本发明的一些方面提供了治疗有需要的个体的方法,所述方法包含向有需要的个体施用有效治疗量的如本文所述的药物组成物。更具体地,治疗方法包含向有需要的个体施用药物组成物,所述药物组成物包含表达嵌合受体并具有至少一个编辑基因的修饰免疫细胞的群体,其中所述至少一种编辑基因增强功能或降低经修饰的免疫细胞的免疫抑制或抑制,以及其中至少一个编辑基因的表达被敲除或敲弱。在一些实施方案中,治疗方法是自体免疫细胞疗法。在其他实施方案中,治疗方法是同种异体免疫细胞疗法。
在某些实施方案中,通过遗传修饰免疫细胞以表达本文考虑的嵌合抗原受体,将免疫细胞的特异性重定向至在个体患病或改变的细胞表面上表达的标记物。在一些实施方案中,治疗方法包含向个体施用如本文所述的免疫细胞,其中免疫细胞已被遗传修饰以将其特异性重定向至在肿瘤细胞上表达的标记物。在一些实施方案中,肿瘤是B细胞癌;例如,B细胞癌如淋巴瘤、白血病或骨髓瘤,如多发性骨髓瘤。因此,本发明的一些实施方案提供了治疗个体的肿瘤的方法。在一些实施方案中,被治疗的肿瘤是B细胞癌。在一些实施方案中,B细胞癌是淋巴瘤、白血病或多发性骨髓瘤。
在个体中治疗肿瘤的方法的一些实施方案包含向个体施用如本文所述的免疫细胞和一种或多种另外的治疗剂。例如,本发明的免疫细胞可以与细胞因子共同施用。在一些实施方案中,细胞因子是IL-2、IFN-á、
Figure BDA0003263753870003071
或其组合。在一些实施方案中,免疫细胞与化疗剂共同施用。化疗剂可以是环磷酰胺(cyclophosphamide)、多柔比星(doxorubicin)、长春新碱(vincristine)、泼尼松(prednisone)或利妥昔单抗(rituximab),或其组合。其他化疗药物包括奥比妥珠单抗(obinutuzumab)、苯达莫司汀(bendamustine)、苯丁酸氮芥(chlorambucil)、环磷酰胺(cyclophosphamide)、依鲁替尼(ibrutinib)、甲氨蝶呤(methotrexate)、阿糖胞苷(cytarabine)、地塞米松(dexamethasone)、顺铂(cisplatin)、硼替佐米(bortezomib)、氟达拉滨(fludarabine)、艾德拉利西布(idelalisib)、阿卡布替尼(acalabrutinib)、来那度胺(lenalidomide)、唯可来(venetoclax)、环磷酰胺(cyclophosphamide)、异环磷酰胺(ifosfamide)、依托泊苷(etoposide)、喷司他丁(pentostatin)、美法仑(melphalan)、卡非佐米(carfilzomib)、伊沙佐米(ixazomib)、帕比司他(panobinostat)、达雷妥尤单抗(daratumumab)、埃洛妥珠单抗(elotuzumab)、沙利度胺(lenalidomide)、来那度胺(thalidomide)或泊马度胺(pomalidomide),或其组合。“共同施用”是指在治疗过程中施用两种或更多种治疗剂或药物组成物。这种共同给药可以是同时给药或顺序给药。后续给药的治疗剂或药物组成物的顺序给药可以在给药第一种药物组成物或治疗剂后的治疗过程中的任何时间进行。
在本发明的一些实施方案中,施用的免疫细胞在体内增殖以及可以在个体体内持续较长时间。在一些实施方案中,本发明的免疫细胞可以成熟为记忆免疫细胞并在个体体内保持循环,从而产生能够积极响应表达嵌合抗原识别的标志物的患病或改变的细胞的复发的细胞群受体。
本文考虑的药物组成物的施用可以使用常规技术进行,包括但不限于输注、输注或肠胃外。在一些实施方案中,肠胃外施用包括血管内、静脉内、肌肉内、动脉内、鞘内、瘤内、皮内、腹膜内、经气管、皮下、皮下、关节内、囊下、蛛网膜下和胸骨内输注或注射。
试剂盒、载体、细胞
本发明还提供了包含核酸构建体的试剂盒,所述核酸构建体包含编码胞苷或腺苷脱氨酶核碱基编辑器的核苷酸序列,至少两个向导RNA,每个向导RNA具有与以下核酸序列至少85%互补的核酸序列编码TRAC、B2M、PD1、CBLB和/或CTLA4的基因。在一些实施方案中,编码胞苷或腺苷脱氨酶的核苷酸序列包含驱动胞苷或腺苷脱氨酶核碱基编辑器表达的异源启动子。
本发明的一些方面提供了包含核酸构建体的试剂盒,所述核酸构建体包含(a)编码(a)与本文提供的胞苷或腺苷脱氨酶融合的Cas9结构域的核苷酸序列;(b)驱动(a)序列表达的异源启动子。
本发明的一些方面提供了用于治疗肿瘤的试剂盒,其包含经修饰的免疫细胞或具有降低的免疫原性和增强的抗肿瘤活性的免疫细胞,所述免疫或免疫细胞包含TRAC、B2M、PDl、CBLB和/或CTLA4多肽,或其组合。在一些实施方案中,经修饰的免疫细胞还包含对与肿瘤相关的标记物具有亲和力的嵌合抗原受体。肿瘤治疗试剂盒包含使用经修饰的免疫细胞治疗肿瘤的书面说明。
除非另有说明,本发明的实践采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,这些技术完全在本领域技术人员的能力范围内。此类技术在文献中得到了充分解释,例如“Molecular Cloning:A Laboratory Manual”,第二版(Sambrook,1989);“Oligonucleotide Synthesis”(Gait,1984);“Animal Cell Culture”(Freshney,1987);“Methods in Enzymology”“Handbook of Experimental Immunology”(Weir,1996);“Gene Transfer Vectors for Mammalian Cells”(Miller和Calos,1987);“Current Protocols in Molecular Biology”(Ausubel,1987);“PCR:The PolymeraseChain Reaction”,(Mullis,1994);“Current Protocols in Immunology”(Coligan,1991)。这些技术适用于生产本发明的多核苷酸和多肽,因此,可以在制造和实践本发明时加以考虑。特定实施方案的特别有用的技术将在以下部分中讨论。
提出以下实施方案是为了向本领域技术人员提供如何进行和使用本发明的测定、筛选和治疗方法的完整公开和描述,以及不旨在限制发明人认为他们的发明的范围。
实施方案
实施方案1:在免疫细胞中表达的基因中剪接位点的破坏和终止密码子的引入
核碱基编辑器BE4用于破坏剪接位点并将终止密码子插入免疫细胞中表达的基因子集中。质粒构建体pCMV_BE4max编码BE4,其包含具有胞苷脱氨酶活性的APOBEC-1胞苷脱氨酶结构域、包含D10A突变并具有切口酶活性的Cas9结构域,以及两个尿嘧啶DNA糖基化酶抑制剂(UGI)结构域。UGI是一个来自枯草芽孢杆菌噬菌体PBS1的83个氨基酸残基蛋白,可有效阻止编辑免疫细胞中表达的某些基因的剪接位点。BE4还包含N末端和C末端核定位信号(NLS)。
>pCMV_BE4max
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACAGCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCCTCAGAGACTGGGCCTGTCGCCGTCGATCCAACCCTGCGCCGCCGGATTGAACCTCACGAGTTTGAAGTGTTCTTTGACCCCCGGGAGCTGAGAAAGGAGACATGCCTGCTGTACGAGATCAACTGGGGAGGCAGGCACTCCATCTGGAGGCACACCTCTCAGAACACAAATAAGCACGTGGAGGTGAACTTCATCGAGAAGTTTACCACAGAGCGGTACTTCTGCCCCAATACCAGATGTAGCATCACATGGTTTCTGAGCTGGTCCCCTTGCGGAGAGTGTAGCAGGGCCATCACCGAGTTCCTGTCCAGATATCCACACGTGACACTGTTTATCTACATCGCCAGGCTGTATCACCACGCAGACCCAAGGAATAGGCAGGGCCTGCGCGATCTGATCAGCTCCGGCGTGACCATCCAGATCATGACAGAGCAGGAGTCCGGCTACTGCTGGCGGAACTTCGTGAATTATTCTCCTAGCAACGAGGCCCACTGGCCTAGGTACCCACACCTGTGGGTGCGCCTGTACGTGCTGGAGCTGTATTGCATCATCCTGGGCCTGCCCCCTTGTCTGAATATCCTGCGGAGAAAGCAGCCCCAGCTGACCTTCTTTACAATCGCCCTGCAGTCTTGTCACTATCAGAGGCTGCCACCCCACATCCTGTGGGCCACAGGCCTGAAGTCTGGAGGATCTAGCGGAGGATCCTCTGGCAGCGAGACACCAGGAACAAGCGAGTCAGCAACACCAGAGAGCAGTGGCGGCAGCAGCGGCGGCAGCGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGTGACAGCGGCGGGAGCGGCGGGAGCGGGGGGAGCACTAATCTGAGCGACATCATTGAGAAGGAGACTGGGAAACAGCTGGTCATTCAGGAGTCCATCCTGATGCTGCCTGAGGAGGTGGAGGAAGTGATCGGCAACAAGCCAGAGTCTGACATCCTGGTGCACACCGCCTACGACGAGTCCACAGATGAGAATGTGATGCTGCTGACCTCTGACGCCCCCGAGTATAAGCCTTGGGCCCTGGTCATCCAGGATTCTAACGGCGAGAATAAGATCAAGATGCTGAGCGGAGGATCCGGAGGATCTGGAGGCAGCACCAACCTGTCTGACATCATCGAGAAGGAGACAGGCAAGCAGCTGGTCATCCAGGAGAGCATCCTGATGCTGCCCGAAGAAGTCGAAGAAGTGATCGGAAACAAGCCTGAGAGCGATATCCTGGTCCATACCGCCTACGACGAGAGTACCGACGAAAATGTGATGCTGCTGACATCCGACGCCCCAGAGTATAAGCCCTGGGCTCTGGTCATCCAGGATTCCAACGGAGAGAACAAAATCAAAATGCTGTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAGGAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGATCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
为了确定BE4在免疫细胞中敲弱或消除蛋白质表达的有效性,用编码BE4的mRNA和靶向与供体的G碱基互补的C碱基的sgRNA共转染第一免疫细胞的群体或TRAC外显子1、TRAC外显子3或B2M外显子1的受体剪接位点,具体取决于特定的靶位点。mRNA是通过体外转录产生的,(TriLin Biotechnologies)。简而言之,将4微克BE4 mRNA和2微克合成gRNA电穿孔到1M CD3+T细胞(NucleofectorTM平台,LonzaBioscience)中。然后将细胞培养3天,以便有足够的时间进行碱基编辑。为了比较,第二个免疫细胞的群体用编码Cas9核酸酶和sgRNA的mRNA共转染,这些mRNA靶向B2M外显子1供体剪接位点的G碱基。没有观察到BE4编辑和Cas9编辑之间的明显差异,以及每个编辑基因的敲弱率大于90%,而未电穿孔的对照细胞没有显着的击倒率(图2)。
假设如果用编码催化单链切口的BE4的mRNA或用催化双链断裂的Cas9核酸酶转染细胞,则导致所观察到的靶基因敲弱的遗传修饰将不同。为了验证这一假设,免疫细胞与编码BE4碱基编辑器和靶向供体G碱基的sgRNA的2微克BE4/1microgm sgRNA(中等)或4微克BE4/2微克sgRNA(高)RNA共转染B2M外显子1的剪接位点。孵育3、5和7天后,收集DNA并测序。参考图3所示,大多数碱基编辑仅显示剪接位点的破坏,并以预期的方式(即,反义链中的C到T转换被合并,导致有义链中的G到A转换)。这些结果与从用Cas9核酸酶转染的细胞获得的结果形成对比,这表明Cas9转染细胞中的大多数编辑是插入缺失(图3)。
剪接位点的破坏和终止密码子的引入可以有效地敲弱靶基因的表达。BE4介导的TRAC外显子3中的剪接受体和B2M外显子1和PDCD1外显子1中的剪接供体的编辑导致全长蛋白质的表达降低(图4和5)。在剪接位点中观察到的BE4介导的变化是C到T的转换,尽管也观察到插入缺失和C到G的转换。将赭石终止密码子插入PDCD1基因的外显子2,其中外显子中的连续胞苷残基被靶向并编辑为胸苷残基,也导致基因表达的显着降低,尽管减少程度低于TRAC和B2M基因(图4)。这些结果进一步表明,BE4介导的对免疫细胞中表达的基因的单次或连续胞苷碱基编辑导致基因表达的有效减少。
实施方案2:剪接位点破坏和终止密码子插入的计算机分析
为了确定设计的gRNA是否会结合异位靶标,使用CAS-OFFinder分析gRNA的核酸序列。参考图6所示,“X”凸起类型表示gRNA与基因组DNA对齐,任何差异都是错配。随着错配数量从1增加到4,潜在的异地结合增加。例如,TRAC外显子3剪接受体的结果表明,当有3个错配时,有26个异位结合的可能性,而有164个可能有4个错配。
如果gRNA有凸起,其中gRNA有20个碱基对,但与基因组DNA的19个碱基对对齐,则会产生凸起。再次参考图6、当TRAC外显子3剪接受体gRNA有一个碱基对的凸起时,异位结合的可能性随着错配的增加而增加;然而,可能性的数量明显低于没有凸起时(即凸起大小为零时)。
实施方案3:免疫细胞中的多重碱基编辑
为了确定BE4是否可以介导多个基因的碱基编辑以产生多重敲弱细胞,免疫细胞用编码BE4碱基编辑器的mRNA以及靶向B2M、TRAC、PDl或其组合中。参考图7所示,通过流式细胞术测量,BE4系统引发了有效的敲弱,以确定在单、双和三基因编辑中蛋白质产量减少的细胞百分比。细胞根据B2M和CD3表达进行门控,CD3表达作为TRAC表达的代理。由于PD1染色效率低下,因此未对表达所述蛋白质的细胞进行直接测量。单基因、双基因和三基因编辑的细胞群之间没有观察到差异,以及修饰为敲弱B2M、TRAC和PD1(三基因编辑)表达的免疫细胞与未经修饰的对照免疫细胞明显不同(图8)。
对导致蛋白质表达降低的基因的修饰总结在图9中。具体而言,与在实施方案1中描述的导致单基因修饰表达降低的机制类似,在经修饰的B2M单修饰基因细胞群和B2M+PD1、B2M+TRAC和B2M+TRAC+PD1多修饰基因细胞群中观察到C到T的转变构成了大量的编辑。插入缺失和颠换构成了在编辑基因中观察到的遗传变化中微不足道的少数。
因此,通过单向靶向测序(UDiTaS;Giannoukos等人,BMC Genomics.2018Mar 21;19(1):212。doi:10.1186/s12864-018-4561-9)评估,通过碱基编辑同时修饰三个基因座产生了高效的基因敲除,没有可检测的易位事件。此外,在BE4编辑的基因中未检测到易位。液滴数字聚合酶链反应(ddPCR)策略(图10)用于检测B2M、TRAC和PD1BE4编辑基因之间的易位。从用BE4或Cas9经修饰的细胞中提取的DNA以生成B2M+TRAC+PD1编辑,使用QX200液滴数字仪器(Bio-Rad)进行次世代测序(NGS)分析,以确定BE4和Cas9编辑的确切序列。如图左面板所示。如图11所示,大多数细胞中的B2M、TRAC和PD1基因被修饰。ddPCR分析显示,在BE4编辑的细胞中不存在易位,但在大约1.7%的Cas9编辑的细胞中观察到易位(图11,右图)。表12进一步说明在BE4编辑的细胞中未观察到易位。
表12
碱基编辑器 易位 控制扩增子液滴 实验扩增子液滴
Cas9核酸酶 B2M-TRAC 61,206 585
B2M-PDCD1 55,970 291
PDCD1-TRAC 59,600 112
BE4 B2M-TRAC 90,717 0
B2M-PDCD1 89,028 0
PDCD1-TRAC 83,501 0
实施方案4:Cbl原癌基因B(CBLB)的BE4介导的编辑
Cbl-b是一种T细胞受体(TCR)信号蛋白,其负调节TCR复合物信号(图12)。因为当Cbl-b信号被抑制时,T细胞的激活阈值较低,敲除或降低所述基因可以显着提高T细胞或表达CAR的T细胞的有效性。为了确定Cbl-b基因是否易受胞苷脱氨介导的修饰,细胞用编码BE4和sgRNA的mRNA共转染,其靶向外显子8和16的剪接位点受体、外显子8、10、11和12的剪接位点供体、,或者会促进外显子1、4和8中终止密码子的插入。用流式细胞术分析所得细胞。
参考图13所示,外显子12的剪接位点供体和外显子8的剪接位点受体的破坏导致Cbl-b表达的最大降低(分别为67.2%和57.4%)。在用外显子8剪接位点受体和外显子12剪接位点供体sgRNA转染的细胞中,略多于60%的细胞被成功编辑(图13,条形图)。
实施方案5:免疫细胞中的Cas12b核酸酶表征
Cas12b/c2c1位点特异性靶向并切割双链核酸分子的两条链。两个不同的Cas12b/c2c1蛋白BhCas12b和BvCas12b通过确定酶介导目标核酸分子中插入缺失的倾向来表征。编码Cas12b/c2c1蛋白的mRNA与特异于GRIN2B基因位点和DNMT1基因位点的向导RNA一起被电穿孔到T细胞中。将细胞培养3-5天,然后分离细胞DNA。插入缺失率由次世代测序确定。参考图14所示,从用BhCas12b蛋白处理的细胞中分离的DNA在GRIN2B基因中的插入缺失百分比(约75%)比从用BvCas12b蛋白处理的细胞中分离的DNA(约20%)高得多。在从用BhCas12b处理的细胞分离的DNA中观察到的DNMT1基因中的插入缺失(约20%)比在从用BvCas12b处理的细胞分离的DNA(约0%)中观察到的DNA中观察到的比率更高。
BhCas12b(V4)蛋白用于破坏TRAC基因。T细胞通过电穿孔与编码BhCas12b(V4)蛋白的mRNA以及对GRIN2B、DNMT1和TRAC基因中的基因座特异的向导RNA进行转导。电穿孔后96小时,使用荧光辅助细胞分选(FACS)分析对细胞进行评估,细胞被门控CD3(TRAC的代表)。参考图15所示,用编码GFP的质粒或BhCas12b(V4)和对GRIN2B或DNMT1特异的向导RNA转导的T细胞中,大约95%是CD3+。那些被转导以表达BhCas12b(V4)和对TRAC基因中的位点特异的向导RNA的细胞不太可能是CD3+(大约2%到大约50%,取决于所使用的向导RNA)。测试的11个TRAC向导RNA中的三个导致大约100%BhCas12b(V4)介导的插入缺失。
实施方案6:CAR-P2A-mCherry慢病毒表达表征
使用CAR-P2A-mCherry慢病毒转导细胞以表达嵌合抗原受体(CAR),并使用荧光辅助细胞分选(FACS)分析CAR表达。细胞未染色,与R-藻红蛋白(PE)或异硫氰酸荧光素(FITC)偶联的BCMA蛋白一起孵育。由于BCMA是CAR的靶抗原,表达CAR的细胞将结合染料标记的BCMA。参考图16所示,对于未染色的细胞,FACS分析仅检测到转导样品中存在mCherry,并有一些溢出到PE通道中。BCMA-PE通道显示出超出溢出中所见的高度阳性信号,这些结果在与BCMA-FITC孵育的细胞中得到证实。染料标记的BCMA蛋白检测结果表明CAR的表达与mCherry的表达几乎相同。参考图17,通过FACS分析在用聚(1,8-辛二醇柠檬酸盐)(POC)慢病毒载体转导的细胞中检测到85%的CAR表达。
实施方案7:BE4以高产品纯度产生高效、持久的基因敲除
BE4介导多个基因的碱基编辑以产生多重敲弱细胞。免疫细胞与编码BE4碱基编辑器的mRNA以及靶向B2M、TRAC、PD1或其组合中特定位点的sgRNA共转染。如测序数据所示,碱基编辑在修饰细胞方面是有效的,以及持续时间长达至少7天(图18)。观察到高产品纯度,因为C到T的转变构成了观察到的大量编辑。插入缺失和C-至-G和C-至-A颠换构成了在编辑基因中观察到的遗传变化中微不足道的少数。碱基编辑在生成所需修饰方面也与spCas9核酸酶一样有效。
如通过流式细胞术测量的,BE4系统引发有效敲弱,其鉴定具有降低的表面表达的细胞百分比(图19A)。以B2M表达为门控的细胞表现出细胞表面B2M蛋白质的丧失。通过流式细胞术测量,碱基编辑在产生B2M蛋白敲除方面也与spCas9核酸酶一样有效。
实施方案8:正交易位检测分析不能检测三重编辑T细胞中BE4诱导的重排
用编码BE4碱基编辑器的mRNA以及靶向B2M、TRAC和PDl中特定位点的sgRNA共转染免疫细胞。使用能够检测B2M、TRAC和PD1靶基因之间不希望的特定易位的易位检测测定法评估三重编辑的T细胞(图20)。值得注意的是,在任何BE4编辑基因中均未检测到这些特定易位(表13)。相比之下,Cas9处理的细胞显示出低但可检测的易位水平。因此,与使用Cas9核酸酶的多重编辑相比,使用BE4碱基编辑器对T细胞进行多重编辑不会产生易位。
表13
类型 对照(%) BE4-处理(%) Cas9-处理(%)
在靶的修改(B2M/TRAC/PDCD1) 0 89.9/97.9/89.1 53.0/77.2/55.2
B2M-A/TRAC-A 0 0 0.925
B2M-A/TRAC-B 0 0 0.353
B2M-A/PDCD1-A 0 0 1.647
B2M-A/PDCD1-B 0 0 0.508
B2M-B/TRAC-A* 0 0 0.505
LLoDBE4=0.1%
*如果易位包括B2M基因座的局部重排,则B2M-B仅可在本实验中测量
实施方案9:多重碱基编辑不会显着损害细胞扩增
对具有BE4和spCas9sgRNA的B2M、TRAC和PDl靶标进行了广泛的向导筛选。基于单重测试选择指导以提高编辑效率和扩展性。使用BE4和spCas9比较了1、2和3次编辑的最终细胞产量,并标准化为仅电穿孔的对照。当进行多达3次编辑时,具有所需编辑的BE4编辑单元显示出高产量(图21)。相比之下,spCas9编辑的细胞在增加多重编辑数量时表现出降低的产量。因此,即使在进行多达3次编辑时,多重碱基编辑单元也能保持高细胞扩增。因此,与spCas9处理的样品相比,BE4产生了多重编辑的T细胞,没有可检测的基因组重排,同时还保持了高细胞扩增。
实施方案10:BE4产生的三重编辑T细胞具有与spCas9相似的在靶编辑效率和细胞 表型
用编码BE4碱基编辑器的mRNA以及靶向B2M、TRAC和PDl中特定位点的sgRNA共转染T细胞。如测序数据所示,碱基编辑在修改所有三个位点的细胞方面是有效的(图22)。通过碱基编辑对基因的修饰类似于使用spCas9核酸酶的修饰。流式细胞术还显示B2M和CD3的表面表达降低(图23,上图)。与仅电穿孔的对照细胞相比,BE4和Cas9多重编辑细胞显示出细胞表面B2M和CD3蛋白的显着减少(>95%CD3-/B2M-)。尽管PD1染色效率较低,但与仅电穿孔的对照细胞相比,在BE4和Cas9多重编辑细胞中观察到PD1显着减少(~90%)(图23,下图)。
实施方案11:BE4编辑不改变CAR表达或抗原依赖性细胞杀伤
用编码BE4碱基编辑器的mRNA以及靶向B2M、TRAC和PDl中特定位点的sgRNA共转染T细胞。通过整合编码抗BCMACAR的慢病毒载体引入了靶向BCMA的嵌合抗原受体(CAR)。与未接受慢病毒载体的未处理细胞相比,通过流式细胞术在BE4和Cas9编辑细胞中观察到CAR表达(图24)。通过对表达BCMA的细胞进行核染色并检测细胞核染色的缺失来评估CAR-T细胞的细胞杀伤情况,表明细胞死亡。在用载体转导并表达CAR的细胞中观察到抗原依赖性细胞杀伤,包括BE4和Cas9编辑的T细胞(图25)。相反,未用载体转导的未处理细胞不显示细胞杀伤活性。因此,与仅使用核酸酶的细胞相比,BE4生成的CAR-T细胞表现出可比的基因破坏、细胞表型和抗原依赖性细胞杀伤。
实施方案12:Cas12b和BE4可以配对用于T细胞中的高效多重编辑
CD3-、B2M-T细胞仅使用BE4或使用BE4和Cas12b产生。对于仅使用BE4生成的T细胞,T细胞与编码BE4碱基编辑器的mRNA以及靶向B2M和TRAC中特定位点的sgRNA共转染。对于使用BE4和Cas12b生成的T细胞,T细胞与编码BE4碱基编辑器的mRNA、靶向B2M中特定位点的sgRNA、编码BhCas12b(V4)的mRNA和靶向外显子3的Cas12bsgRNA共转染TRAC基因,用于破坏TRAC基因。使用荧光辅助细胞分选(FACS)分析评估所得T细胞以检测B2M和CD3细胞表面表达。使用BE4的敲除仅显示与使用BE4和Cas12b的敲除淘汰赛相似的配置文件。特别是,高百分比的T细胞是CD3-、B2M-:86%(仅BE4)和88%(BE4+Cas12b),而其他可能的表型CD3-、B2M+;CD3+、B2M+T细胞;CD3+、B2M-在细胞群中较少出现(图26)。相比之下,仅电穿孔对照显示具有高百分比(97.8%)CD3+B2M+细胞和非常低百分比的CD3-、B2M-细胞的群体。
Cas12b用于产生CD3-、CAR+T细胞。用编码BhCas12b(V4)的mRNA、靶向TRAC基因外显子3的Cas12bsgRNA和编码BCMA02(一个抗BCMACAR)的双链DNA(dsDNA)供体模板共转染T细胞。使用荧光辅助细胞分选(FACS)分析评估T细胞以检测CD3和BCMA02细胞表面表达。当在存在sgRNA的情况下将越来越多的Cas12b引入细胞时,CD3表达降低,如细胞群向CD3象限的转变所见(图27)。当在相同条件下将越来越多的供体模板引入细胞时,在细胞群中观察到向CD3-、CAR+象限的转变。
因此,Cas12b可以与BE4配对以产生多重编辑的T细胞,最小化由多重双链断裂引起的基因组重排。
实施方案13:八个目标的高效多重敲除
在所述实施方案中,PBMC从三个供体中分离并用可溶性CD3和CD28抗体活化。在激活后的第3天,使用LONZA 4D电穿孔装置,用包含2微克重组BE4和1微克sgRNA的反应混合物对T细胞进行电穿孔。(sgRNA电穿孔见表10)。在指明的情况下,一半(1/2)gRNA剂量为每个sgRNA0.5微克;2xmRNA剂量=4微克mRNA,每个sgRNA0.5微克。sgRNA从Synthego或Agilent获得。
通过流式细胞术测量基因表达的敲弱百分比。为了确定CIITA基因的碱基编辑效率,使用HLADR作为染色的替代蛋白。这些结果表明,可以在单个电穿孔事件中同时对大量基因成功地进行高效和有效的多重碱基编辑。
表14
靶序列
CD3 TTCGTATCTGTAAAACCAAG
CD7 CCTACCTGTCACCAGGACCA
CD52 CTCTTACCTGTACCATAACC
PD1 CACCTACCTAAGAACCATCC
B2M ACTCACGCTGGATAGCCTCC
CD5 ACTCACCCAGCATCCCCAGC
CIITA CACTCACCTTAGCCTGAGCA
CD2 CACGCACCTGGACAGCTGAC
如图28A和图28B所示,实现了每个靶基因的敲弱。
其他实施方案
从前面的描述中,显然可以对这里描述的本发明进行变化和修改以将其应用于各种用途和条件。这样的实施方案也在所附权利要求的范围内。
在本文中对变量的任何定义中的元素列表的叙述包括将所述变量定义为任何单个元素或所列元素的组合(或子组合)。此处对实施方案的叙述包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。
本说明书中提及的所有专利和出版物均以引用方式并入本文,其程度就好像每个独立的专利和出版物都被具体地和单独地指示为以引用方式并入一样。

Claims (283)

1.一种通过多重编辑产生免疫原性降低和/或抗肿瘤活性增加的经修饰的免疫细胞的方法,所述方法包含:在免疫细胞中至少四个基因序列或其调控元件中的每个的单个靶核碱基处修饰,从而产生免疫原性降低和/或抗肿瘤活性增加的所述经修饰的免疫细胞。
2.一种通过多重编辑产生免疫原性降低和/或抗肿瘤活性增加的经修饰的免疫细胞的群体的方法,所述方法包含:在免疫细胞的群体中至少四个基因序列或其调控元件中的每个的单个靶核碱基处修饰,从而产生免疫原性降低和/或抗肿瘤活性增加的所述经修饰的免疫细胞的群体。
3.根据权利要求1或2所述的方法,其特征在于,所述至少四个基因序列中的至少一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述修饰降低所述至少四个基因序列中的至少一个的表达。
5.根据权利要求1中任一项所述的方法,其特征在于,与没有所述经修饰的对照细胞相比,所述至少四个基因中的至少一个的表达降低至少80%。
6.根据权利要求5所述的方法,其特征在于,与没有所述经修饰的对照细胞相比,所述至少四个基因中每一个的表达降低至少80%。
7.根据权利要求2所述的方法,其特征在于,在至少50%的所述免疫细胞的群体中,所述至少四个基因中至少一个的表达降低。
8.根据权利要求7所述的方法,其特征在于,在至少50%的所述免疫细胞的群体中,所述至少四个基因中每一个的表达降低。
9.根据前述权利要求中任一项的方法,其特征在于,所述至少四个基因序列包含TCR复合基因序列。
10.根据权利要求9所述的方法,其特征在于,所述至少四个基因序列包含TRAC基因序列。
11.根据权利要求1至8中任一项所述的方法,其特征在于,所述至少四个基因序列包含检查点抑制剂基因序列。
12.根据权利要求10所述的方法,其特征在于,所述至少四个基因序列包含PDCD1基因序列。
13.根据权利要求1至8中任一项所述的方法,其特征在于,所述至少四个基因序列包含T细胞标记基因序列。
14.根据权利要求13所述的方法,其特征在于,所述至少四个基因序列包含CD52基因序列。
15.根据权利要求13所述的方法,其特征在于,所述至少四个基因序列包含CD7基因序列。
16.根据权利要求1至15中任一项所述的方法,其特征在于,所述至少四个基因序列包含TRAC基因序列、PDCD1基因序列、CD52基因序列或CD7基因序列。
17.根据权利要求1至16中任一项所述的方法,其特征在于,所述至少四个序列包含TCR复合基因序列、CD7基因序列、CD52基因序列和选自由CD2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组的基因序列。
18.根据权利要求1至17中任一项所述的方法,其特征在于,所述至少四个基因序列包含选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组的基因序列。
19.根据权利要求1、5和6中任一项所述的方法,包含在所述免疫细胞中的五个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
20.根据权利要求1、5和6中任一项所述的方法,包含在所述免疫细胞中的六个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
21.根据权利要求1、5和6中任一项所述的方法,包含在所述免疫细胞中的七个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
22.根据权利要求1、5和6中任一项所述的方法,包含在所述免疫细胞中的八个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
23.根据权利要求2、7和8中任一项所述的方法,包含在所述免疫细胞的群体中的五个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
24.根据权利要求2、7和8中任一项所述的方法,包含在所述免疫细胞的群体中的六个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
25.根据权利要求2、7和8中任一项所述的方法,包含在所述免疫细胞的群体中的七个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
26.根据权利要求2、7和8中任一项所述的方法,包含在所述免疫细胞的群体中的八个基因序列或其调控元件中的每个的单个靶核碱基处修饰。
27.根据权利要求19至26中任一项所述的方法,其特征在于,所述五个、六个、七个或八个基因序列或其调控元件选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组。
28.根据权利要求19至27中任一项所述的方法,其特征在于,所述五个、六个、七个或八个基因序列或其调控元件包含CD3基因序列、CD7基因序列、CD2基因序列、CD5基因序列和CD52基因序列。
29.根据前述权利要求中任一项所述的方法,其特征在于,所述修饰包含使所述单个靶核碱基脱氨基。
30.根据权利要求29所述的方法,其特征在于,所述脱氨基是通过包含脱氨酶的多肽进行的。
31.根据权利要求30所述的方法,其特征在于,所述脱氨酶与核酸可编程DNA结合蛋白(napDNAbp)结合以形成碱基编辑器。
32.根据权利要求31所述的方法,其特征在于,所述脱氨酶与所述核酸可编程DNA结合蛋白(napDNAbp)融合。
33.根据权利要求32所述的方法,其特征在于,所述napDNAbp包含Cas9多肽或其部分。
34.根据权利要求33所述的方法,其特征在于,所述napDNAbp包含Cas9切口酶或无核酸酶活性的Cas9。
35.根据权利要求30至34中任一项所述的方法,其特征在于,所述脱氨酶是胞苷脱氨酶。
36.根据权利要求35所述的方法,其特征在于,所述单个靶核碱基是胞嘧啶(C),以及其中,所述修饰包含将所述C转化为胸腺嘧啶(T)。
37.根据权利要求36所述的方法,其特征在于,所述碱基编辑器进一步包含尿嘧啶糖基化酶抑制剂。
38.根据权利要求30至34中任一项所述的方法,其特征在于,所述脱氨酶是腺苷脱氨酶。
39.根据权利要求38所述的方法,其特征在于,所述单个靶核碱基是腺苷(A),以及其中,所述修饰包含将所述A转化为鸟嘌呤(G)。
40.根据权利要求30至39中任一项所述的方法,其特征在于,所述修饰包含使所述免疫细胞与向导核酸序列接触。
41.根据权利要求40所述的方法,其特征在于,所述修饰包含使所述免疫细胞与至少四个向导核酸序列接触,其中,每个向导核酸序列将所述naDNAbp靶向所述至少四个基因序列或其调控元件之一。
42.根据权利要求40所述的方法,其特征在于,所述向导核酸序列包含选自表8A、表8B或表8C的向导RNA序列的序列。
43.根据权利要求40所述的方法,其特征在于,所述向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组的序列。
44.根据权利要求1至28中任一项所述的方法,其特征在于,所述修饰包含通过靶引物反转录用不同的核碱基替换所述单个靶核碱基,所述靶引物反转录使用反转录酶和延伸的向导核酸序列进行。
45.根据权利要求44所述的方法,其特征在于,所述延伸的向导核酸序列包含反转录模板序列、反转录引物结合位点或其组合。
46.根据权利要求1至45中任一项所述的方法,其特征在于,所述单个靶核碱基在外显子中。
47.根据权利要求46所述的方法,其特征在于,所述修饰在所述外显子中产生提前终止密码子。
48.根据权利要求46或47所述的方法,其特征在于,所述单个靶核碱基在所述TRAC基因序列的外显子1、外显子2或外显子3内。
49.根据权利要求46或47所述的方法,其特征在于,所述单个靶核碱基在所述PCDC1基因序列的外显子1、外显子2或外显子5内。
50.根据权利要求46或47所述的方法,其特征在于,所述单个靶核碱基在所述CD52基因序列的外显子1或外显子2内。
51.根据权利要求46或47所述的方法,其特征在于,所述单个靶核碱基在所述CD7基因序列的外显子1、外显子2或外显子3内。
52.根据权利要求46或47所述的方法,其特征在于,所述单个靶核碱基在所述B2M基因序列的外显子1或外显子2内。
53.根据权利要求46或47所述的方法,其特征在于,所述单个靶核碱基在所述CD5基因序列的外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8内。
54.根据权利要求46或47所述的方法,其特征在于,所述单个靶核碱基在所述CD2基因序列的外显子2、外显子3、外显子4或外显子5内。
55.根据权利要求46或47所述的方法,其特征在于,所述单个靶核碱基在所述CIITA基因序列的外显子1、外显子2、外显子4、外显子7、外显子8、外显子9、外显子10、外显子11、外显子12、外显子14、外显子15、外显子18或外显子19内。
56.根据权利要求1至45中任一项所述的方法,其特征在于,所述单个靶核碱基在剪接供体位点或剪接受体位点中。
57.根据权利要求50所述的方法,其特征在于,所述单个靶核碱基在所述TRAC基因序列的外显子1剪接受体位点、外显子1剪接供体位点或外显子3剪接受体位点中。
58.根据权利要求50所述的方法,其特征在于,所述单个靶核碱基在所述PDCD1基因序列的外显子1剪接受体位点、外显子1剪接供体位点、外显子2剪接受体位点、外显子3剪接供体位点、外显子4剪接受体位点、外显子4剪接供体位点或外显子5剪接受体位点中。
59.根据权利要求50所述的方法,其特征在于,所述单个靶核碱基位于所述CD52基因序列的外显子1剪接供体位点或外显子2剪接受体位点中。
60.根据权利要求50所述的方法,其特征在于,所述单个靶核碱基在所述CD7基因序列的外显子1剪接供体位点、外显子2剪接供体位点、外显子2剪接受体位点或外显子3剪接受体位点中。
61.根据权利要求50所述的方法,其特征在于,所述单个靶核碱基在所述B2M基因序列的外显子1剪接供体位点、外显子2剪接供体位点、外显子2剪接受体位点或外显子3剪接受体位点中。
62.根据权利要求50所述的方法,其特征在于,所述单个靶核碱基在所述CD2基因序列的外显子3剪接供体位点中。
63.根据权利要求50所述的方法,其特征在于,所述单个靶核碱基在所述CD5基因序列的外显子1剪接供体位点、外显子1剪接受体位点、外显子3剪接受体位点、外显子3剪接供体位点、外显子4剪接受体位点、外显子5剪接供体位点、外显子6剪接受体位点、外显子9剪接供体位点、外显子10剪接受体位点中。
64.根据权利要求50所述的方法,其特征在于,所述单个靶核碱基在所述CIITA基因序列的外显子1剪接供体位点、外显子7剪接供体位点、外显子8剪接受体位点、外显子9剪接供体位点、外显子10剪接受体位点、外显子11剪接受体位点、外显子14剪接受体位点、外显子14剪接供体位点、外显子15剪接供体位点、外显子16剪接受体位点、外显子16剪接供体位点、外显子17剪接受体位点、外显子17剪接供体位点或外显子19剪接受体位点中。
65.根据权利要求4至64中任一项所述的方法,其特征在于,所述免疫细胞是人类细胞。
66.根据权利要求65所述的方法,其特征在于,所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
67.根据权利要求7至66中任一项所述的方法,其特征在于,所述免疫细胞的群体是人类细胞。
68.根据权利要求67所述的方法,其特征在于,所述免疫细胞的群体是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
69.根据权利要求1至68中任一项所述的方法,其特征在于,所述修饰是离体的。
70.根据权利要求1至69中任一项所述的方法,其特征在于,所述免疫细胞或所述免疫细胞的群体是源自单个人类供体。
71.根据权利要求1至70中任一项所述的方法,进一步包含使所述免疫细胞或所述免疫细胞的群体与编码外源功能性嵌合抗原受体(CAR)或其功能性片段的多核苷酸接触。
72.根据权利要求71所述的方法,包含使所述免疫细胞或所述免疫细胞的群体与包含编码所述CAR的所述多核苷酸的慢病毒接触。
73.根据权利要求71所述的方法,包含使所述免疫细胞或所述免疫细胞的群体与naDNAbp和包含编码所述CAR的所述多核苷酸的供体DNA序列接触。
74.根据权利要求73所述的方法,其特征在于,所述napDNAbp是Cas12b。
75.根据权利要求71至74中任一项所述的方法,其特征在于,所述CAR特异性结合与肿瘤相关的标志物。
76.根据权利要求75所述的方法,其特征在于,所述肿瘤是T细胞癌、B细胞癌、淋巴瘤、白血病或多发性骨髓瘤。
77.根据权利要求76所述的方法,其特征在于,所述CAR特异性结合CD7。
78.根据权利要求76所述的方法,其特征在于,所述CAR特异性结合BCMA。
79.根据权利要求2至78中任一项所述的方法,其特征在于,所述免疫细胞或所述免疫细胞的群体不包含可检测的易位。
80.根据权利要求79所述的方法,其特征在于,至少50%的所述免疫细胞的群体表达所述CAR。
81.根据权利要求79所述的方法,其特征在于,至少50%的所述免疫细胞的群体是有活力的。
82.根据权利要求79所述的方法,其特征在于,至少50%的所述免疫细胞的群体扩增没有所述经修饰的相同类型的对照细胞的群体的扩增率的至少80%。
83.根据权利要求4至79中任一项所述的方法,其特征在于,所述修饰在所述免疫细胞中产生小于1%的插入缺失。
84.根据权利要求4至79中任一项所述的方法,其特征在于,所述修饰在所述免疫细胞中产生小于5%的非靶编辑。
85.根据权利要求4至79中任一项所述的方法,其特征在于,所述修饰在所述免疫细胞中产生小于5%的脱靶编辑。
86.一种根据权利要求4至85中任一项所述的方法产生的经修饰的免疫细胞。
87.一种根据权利要求7至85中任一项所述的方法产生的经修饰的免疫细胞的群体。
88.一种具有降低的免疫原性或增加的抗肿瘤活性的经修饰的免疫细胞,其特征在于,所述经修饰的免疫细胞在至少四个基因序列或其调控元件的每一个中包含单个靶核碱基修饰。
89.根据权利要求88所述的经修饰的免疫细胞,其特征在于,所述至少四个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
90.根据权利要求88或89所述的经修饰的免疫细胞,其特征在于,所述至少四个基因序列包含TCR复合基因序列。
91.根据权利要求90所述的经修饰的免疫细胞,其特征在于,所述至少四个基因序列包含TRAC基因序列。
92.根据权利要求88或89所述的经修饰的免疫细胞,其特征在于,所述至少四个基因序列包含检查点抑制剂基因序列。
93.根据权利要求92所述的经修饰的免疫细胞,其特征在于,所述至少四个基因序列包含PDCD1基因序列。
94.根据权利要求88或89所述的经修饰的免疫细胞,其特征在于,所述至少四个基因序列包含T细胞标记基因序列。
95.根据权利要求94所述的经修饰的免疫细胞,其特征在于,所述至少四个基因序列包含CD52基因序列。
96.根据权利要求94所述的经修饰的免疫细胞,其特征在于,所述至少四个基因序列包含CD7基因序列。
97.根据权利要求88-96中任一项所述的经修饰的免疫细胞,其特征在于,与没有所述经修饰的对照细胞相比,所述至少四个基因之一的表达降低至少80%。
98.根据权利要求97所述的经修饰的免疫细胞,其特征在于,与没有所述经修饰的对照细胞相比,所述至少四个基因中每一个的表达降低至少90%。
99.根据权利要求88至98中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞在五个基因序列或其调控元件中的每一个中的单个靶核碱基处包含修饰,其中,所述五个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
100.根据权利要求88至98中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞在六个基因序列或其调控元件中的每一个中的单个靶核碱基处包含修饰,其中,所述六个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
101.根据权利要求88至98中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞在七个基因序列或其调控元件中的每一个中的单个靶核碱基处包含修饰,其中,所述七个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
102.根据权利要求88至98中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞在八个基因序列或其调控元件中的每一个中的单个靶核碱基处包含修饰,其中,所述八个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
103.根据权利要求99至102中任一项所述的经修饰的免疫细胞,其特征在于,与没有所述经修饰的对照细胞相比,所述五个、六个、七个或八个基因中的至少一个的表达降低至少90%。
104.根据权利要求99至102中任一项所述的经修饰的免疫细胞,其特征在于,与没有所述经修饰的对照细胞相比,所述五个、六个、七个或八个基因中的每一个的表达降低至少90%。
105.根据权利要求99至104中任一项所述的经修饰的免疫细胞,其特征在于,所述五个、六个、七个或八个基因序列或其调控元件包含选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组的基因序列。
106.一种经修饰的免疫细胞,其在CD3基因序列、CD5基因序列、CD52基因序列和CD7基因序列的每一个中包含单个靶核碱基修饰,其中,与没有所述经修饰的相同类型的对照细胞相比,所述经修饰的免疫细胞表现出降低的免疫原性或增加的抗肿瘤活性。
107.根据权利要求106所述的经修饰的免疫细胞,其特征在于,所述免疫细胞在CD2基因序列、CIITA或其每个的调控元件中进一步包含单个靶核碱基修饰。
108.根据权利要求106所述的经修饰的免疫细胞,其特征在于,所述免疫细胞在TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列或TRBC2基因序列、CD4基因序列、CD30基因序列、CD33基因序列、CD70基因序列、B2M基因序列和CIITA基因序列或其每个的调控元件中进一步包含单个靶核碱基修饰。
109.根据权利要求107所述的经修饰的免疫细胞,其特征在于,所述免疫细胞在TRAC基因序列、PDCD1基因序列、CD52基因序列、CD7基因序列、CD2基因序列、CD5基因序列、CIITA基因序列和B2M基因序列中的每一个中包含单个核碱基修饰。
110.根据权利要求88至109中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞不包含可检测的易位。
111.根据权利要求88至110中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞包含少于1%的插入缺失。
112.根据权利要求88至110中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞包含少于5%的非靶编辑。
113.根据权利要求88至110中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞包含少于5%的脱靶编辑。
114.根据权利要求88至110中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞是哺乳动物细胞。
115.根据权利要求88至110中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞是人类细胞。
116.根据权利要求88至115中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
117.根据权利要求88至116中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞在离体培养物中。
118.根据权利要求88至117中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞源自单个人类供体。
119.根据权利要求88至118中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞进一步包含编码外源功能性嵌合抗原受体(CAR)或其功能性片段的多核苷酸。
120.根据权利要求119所述的经修饰的免疫细胞,其特征在于,编码所述CAR的所述多核苷酸整合在所述免疫细胞的所述基因组中。
121.根据权利要求119或120所述的经修饰的免疫细胞,其特征在于,所述CAR特异性结合与肿瘤相关的标志物。
122.根据权利要求119或120的经修饰的免疫细胞,其特征在于,所述肿瘤是T细胞癌、B细胞癌、淋巴瘤、白血病或多发性骨髓瘤。
123.根据权利要求119至122中任一项所述的经修饰的免疫细胞,其特征在于,所述CAR特异性结合CD7。
124.根据权利要求119至122中任一项所述的经修饰的免疫细胞,其特征在于,所述CAR特异性结合BCMA。
125.根据权利要求88至124中任一项所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基在外显子中。
126.根据权利要求125所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基在所述TRAC基因序列的外显子1、外显子2或外显子3内。
127.根据权利要求125所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基在所述PCDC1基因序列的外显子1、外显子2或外显子5内。
128.根据权利要求125所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基在所述CD52基因序列的外显子1或外显子2内。
129.根据权利要求125所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基在CD7基因序列的外显子1、外显子2或外显子3内。
130.根据权利要求88至124中任一项所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基位于剪接供体位点或剪接受体位点。
131.根据权利要求130所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基位于所述TRAC基因序列的外显子1剪接受体位点、外显子1剪接供体位点或外显子3剪接受体位点中。
132.根据权利要求130所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基位于所述PDCD1基因序列的外显子1剪接受体位点、外显子1剪接供体位点、外显子2剪接受体位点、外显子3剪接供体位点、外显子4剪接受体位点、外显子4剪接供体位点或外显子5剪接受体位点中。
133.根据权利要求130所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基位于所述CD52基因序列的外显子1剪接供体位点或外显子2剪接受体位点中。
134.根据权利要求130所述的经修饰的免疫细胞,其特征在于,所述单个靶核碱基位于所述CD7基因序列的外显子1剪接供体位点、外显子2剪接供体位点、外显子2剪接受体位点或外显子3剪接受体位点中。
135.一种经修饰的免疫细胞的群体,其特征在于,多个所述细胞的群体在至少四个基因序列或其调控元件的每一个中包含单个靶核碱基修饰,以及其中,与没有经修饰的相同类型的多个对照细胞相比,所述多个具有经修饰的所述细胞的群体表现出降低的免疫原性或增加的抗肿瘤活性。
136.根据权利要求135所述的经修饰的免疫细胞的群体,其特征在于,所述多个细胞包含所述群体的至少50%。
137.根据权利要求135或136所述的经修饰的免疫细胞的群体,其特征在于,所述至少四个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
138.根据权利要求137所述的经修饰的免疫细胞的群体,其特征在于,所述至少四个基因序列包含TCR组分基因序列、检查点抑制剂基因序列或T细胞标记基因序列。
139.根据权利要求137所述的经修饰的免疫细胞的群体,其特征在于,所述至少四个基因序列包含TRAC基因序列。
140.根据权利要求137所述的经修饰的免疫细胞的群体,其特征在于,所述至少四个基因序列包含PDCD1基因序列。
141.根据权利要求137所述的经修饰的免疫细胞的群体,其特征在于,所述至少四个基因序列包含CD52基因序列。
142.根据权利要求137所述的经修饰的免疫细胞的群体,其特征在于,所述至少四个基因序列包含CD7基因序列。
143.根据权利要求135至142中任一项所述的经修饰的免疫细胞的群体,其特征在于,与没有所述经修饰的对照细胞相比,在具有所述经修饰的所述多个细胞中,所述至少四个基因中的至少一个的表达降低至少80%。
144.根据权利要求143所述的经修饰的免疫细胞的群体,其特征在于,与没有所述经修饰的对照细胞相比,在具有所述经修饰的所述多个细胞中,所述至少四个基因中每一个的表达降低至少80%。
145.根据权利要求135至144中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述多个所述群体包含在五个基因序列或其调控元件中每一个的单个靶核碱基处的修饰,其中,所述五个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
146.根据权利要求135至144中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述多个所述群体包含在六个基因序列或其调控元件中每一个的单个靶核碱基处的修饰,其中,所述六个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
147.根据权利要求135至144中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述多个所述群体包含在七个基因序列或其调控元件中每一个的单个靶核碱基处的修饰,其中,所述七个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
148.根据权利要求135至144中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述多个所述群体包含在八个基因序列或其调控元件中的每一个的单个靶核碱基处的修饰,其中,所述八个基因序列中的每一个是检查点抑制剂基因序列、免疫应答调节基因序列或免疫原性基因序列。
149.根据权利要求145至148中任一项所述的经修饰的免疫细胞的群体,其特征在于,与没有所述经修饰的对照细胞相比,在具有所述经修饰的所述多个细胞中,所述五个、六个、七个或八个基因中的至少一个的表达降低至少90%。
150.根据权利要求145至148中任一项所述的经修饰的免疫细胞的群体,其特征在于,与没有所述经修饰的对照细胞相比,在具有所述经修饰的所述多个细胞中,所述五个、六个、七个或八个基因中的每一个表达降低至少90%。
151.根据权利要求145至148中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述五个、六个、七个或八个基因序列或其调控元件选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列所组成的群组。
152.一种经修饰的免疫细胞的群体,其特征在于,多个所述群体在TRAC基因序列、PDCD1基因序列、CD52基因序列和CD7基因序列的每一个中包含单个靶核碱基修饰,以及其中,与没有所述经修饰的相同类型的多个对照细胞相比,所述多个具有所述经修饰的所述群体的免疫原性降低或抗肿瘤活性增加。
153.根据权利要求152所述的经修饰的免疫细胞的群体,其特征在于,所述多个所述群体进一步包含在CD2基因序列、CD5基因序列、CIITA基因序列、B2M基因序列或其调控元件中的每一个的单个靶核碱基修饰。
154.根据权利要求152所述的经修饰的免疫细胞的群体,其特征在于,所述多个所述群体进一步包含在选自由CD2基因序列、TRAC基因序列、CD3ε基因序列、CD3γ基因序列、CD3δ基因序列、TRBC1基因序列、TRBC2基因序列、CD4基因序列、CD5基因序列、CD7基因序列、CD30基因序列、CD33基因序列、CD52基因序列、CD70基因序列、B2M基因序列和CIITA基因序列或其各自的调控元件所组成的群组的基因序列中的单个靶核碱基修饰。
155.根据权利要求153所述的经修饰的免疫细胞的群体,其特征在于,所述多个所述群体包含在TRAC基因序列、PDCD1基因序列、CD52基因序列、CD7基因序列、CD2基因序列、CD5基因序列、CIITA基因序列和B2M基因序列的每一个中的单个核碱基修饰。
156.根据权利要求135至155中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述多个所述群体不包含可检测的易位。
157.根据权利要求135至156中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞的群体的至少60%是有活力的。
158.根据权利要求135至156中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞的群体的至少60%扩增没有所述经修饰的相同类型的对照细胞的群体的扩增率的至少80%。
159.根据权利要求135至158中任一项所述的经修饰的免疫细胞的群体,其特征在于,免疫细胞的群体是人类细胞。
160.根据权利要求135至159中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞的群体是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
161.根据权利要求135至160中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞的群体是源自单个人类供体。
162.根据权利要求135至161中任一项所述的经修饰的免疫细胞的群体,其特征在于,经修饰的所述多个具有所述经修饰的细胞进一步包含编码外源功能性嵌合抗原受体(CAR)或其功能片段的多核苷酸。
163.根据权利要求162所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞的群体的至少50%表达所述CAR。
164.根据权利要求162或163所述的经修饰的免疫细胞的群体,其特征在于,所述CAR特异性结合与肿瘤相关的标志物。
165.根据权利要求164所述的经修饰的免疫细胞的群体,其特征在于,所述肿瘤是T细胞癌、B细胞癌、淋巴瘤、白血病或多发性骨髓瘤。
166.根据权利要求165所述的经修饰的免疫细胞的群体,其特征在于,所述CAR特异性结合CD7。
167.根据权利要求165所述的经修饰的免疫细胞的群体,其特征在于,所述CAR特异性结合BCMA。
168.根据权利要求135至167中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基在外显子中。
169.根据权利要求168所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基在所述TRAC基因序列的外显子1、外显子2或外显子3内。
170.根据权利要求168所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基在所述PCDC1基因序列的外显子1、外显子2或外显子5内。
171.根据权利要求168所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基在所述CD52基因序列的外显子1或外显子2内。
172.根据权利要求168所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基在CD7基因序列的外显子1、外显子2或外显子3内。
173.根据权利要求135至167中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基位于剪接供体位点或剪接受体位点中。
174.根据权利要求173所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基位于所述TRAC基因序列的外显子1剪接受体位点、外显子1剪接供体位点或外显子3剪接受体位点中。
175.根据权利要求173所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基位于所述PDCD1基因序列的外显子1剪接受体位点、外显子1剪接供体位点、外显子2剪接受体位点、外显子3剪接供体位点、外显子4剪接受体位点、外显子4剪接供体位点或外显子5剪接受体位点中。
176.根据权利要求173所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基位于所述CD52基因序列的外显子1剪接供体位点或外显子2剪接受体位点中。
177.根据权利要求173所述的经修饰的免疫细胞的群体,其特征在于,所述单个靶核碱基位于所述CD7基因序列的外显子1剪接供体位点、外显子2剪接供体位点、外显子2剪接受体位点或外显子3剪接受体位点中。
178.一种包含脱氨酶和核酸序列的组成物,其特征在于,所述向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组中的序列。
179.根据权利要求178所述的组成物,其特征在于,所述脱氨酶与核酸可编程DNA结合蛋白(napDNAbp)相关以形成碱基编辑器。
180.根据权利要求179所述的组成物,其特征在于,所述napDNAbp包含Cas9切口酶或无核酸酶活性的Cas9,以及其中,所述脱氨酶是胞苷脱氨酶。
181.根据权利要求180所述的组成物,其特征在于,所述碱基编辑器进一步包含尿嘧啶糖基化酶抑制剂。
182.根据权利要求166所述的组成物,其特征在于,所述napDNAbp包含Cas9切口酶或无核酸酶活性的Cas9,以及其中,所述脱氨酶是腺苷脱氨酶。
183.一种包含聚合酶和向导核酸序列的组成物,其特征在于,所述向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组中的序列。
184.根据权利要求170所述的组成物,其特征在于,所述聚合酶是反转录酶,以及其中,所述向导核酸序列是包含反转录模板序列、反转录引物结合位点或其组合的延伸向导核酸序列。
185.一种产生免疫原性降低和/或抗肿瘤活性增加的经修饰的免疫细胞的方法,所述方法包含:
a)修饰免疫细胞中第一基因序列或其调控元件中的单个靶核碱基;和
b)用Cas12多肽修饰所述免疫细胞中的第二基因序列或其调控元件,其中,所述Cas12多肽在所述第二基因序列中产生位点特异性切割;
其中,所述第一基因和所述第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因,
从而产生免疫原性降低和/或抗肿瘤活性增加的经修饰的免疫细胞。
186.根据权利要求185所述的方法,进一步包含在所述免疫细胞中表达外源功能性嵌合抗原受体(CAR)或其功能性片段。
187.根据权利要求186所述的方法,其特征在于,将编码所述CAR或其所述功能片段的多核苷酸插入到由所述Cas12多肽产生的所述位点特异性切割中。
188.根据权利要求187所述的方法,其特征在于,所述Cas12多肽是Cas12b多肽。
189.一种产生免疫原性降低和/或抗肿瘤活性增加的经修饰的免疫细胞的方法,所述方法包含:
a)修饰免疫细胞中第一基因序列或其调控元件中的单个靶核碱基;和
b)修饰所述免疫细胞中的第二基因序列或其调控元件,其是通过在所述第二基因中插入外源功能性嵌合抗原受体(CAR)或其功能片段或外源功能性T细胞受体或其功能片段来进行;
其中,所述第一基因和所述第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因,
从而产生免疫原性降低和/或抗肿瘤活性增加的经修饰的免疫细胞。
190.根据权利要求189所述的方法,其特征在于,步骤b)进一步包含用核酸可编程DNA结合蛋白(napDNAbp)在所述第二基因序列中产生位点特异性切割。
191.根据权利要求190所述的方法,其特征在于,所述napDNAbp是Cas12b。
192.根据权利要求185至191中任一项所述的方法,其特征在于,与没有所述经修饰的相同类型的对照细胞相比,所述第一基因的表达降低至少60%,或其中,所述第二基因的表达降低至少60%。
193.根据权利要求138至192中任一项所述的方法,其特征在于,所述第一基因选自由CD3ε、CD3γ、CD3δ、CD4、TRAC、TRBC1、TRBC2、PDCD1、CD30、CD33、CD7、CD52、B2M、CD70、CIITA、CD2和CD5所组成的群组。
194.根据权利要求193的方法,其特征在于,所述第一基因或所述第二基因选自由TRAC、CIITA、CD2、CD5、CD7和CD52所组成的群组。
195.根据权利要求185至194中任一项所述的方法,其特征在于,所述第二基因是TRAC。
196.根据权利要求185至195中任一项所述的方法,其特征在于,步骤a)进一步包含在两个其他基因序列或其调控元件中修饰单个靶核碱基。
197.根据权利要求185至195中任一项所述的方法,其特征在于,步骤a)进一步包含在三个其他基因序列或其调控元件中修饰单个靶核碱基。
198.根据权利要求185至195中任一项所述的方法,其特征在于,步骤a)进一步包含在四个其他基因序列或其调控元件中修饰单个靶核碱基。
199.根据权利要求185至195中任一项所述的方法,其特征在于,步骤a)进一步包含在五个其他基因序列或其调控元件中修饰单个靶核碱基。
200.根据权利要求185至195中任一项所述的方法,其特征在于,步骤a)进一步包含在六个其他基因序列或其调控元件中修饰单个靶核碱基。
201.根据权利要求185至195中任一项所述的方法,其特征在于,步骤a)进一步包含在七个其他基因序列或其调控元件中修饰单个靶核碱基。
202.根据权利要求185至201中任一项所述的方法,其特征在于,步骤a)中的所述修饰包含用包含脱氨酶和核酸可编程DNA结合蛋白(napDNAbp)的碱基编辑器使所述单个靶核碱基脱氨基。
203.根据权利要求202所述的方法,其特征在于,所述napDNAbp包含Cas9切口酶或无核酸酶活性的Cas9。
204.根据权利要求203所述的方法,其特征在于,所述脱氨酶是胞苷脱氨酶,以及其中,所述修饰包含将胞苷(C)转化为胸腺嘧啶(T)。
205.根据权利要求203所述的方法,其特征在于,所述脱氨酶是腺苷脱氨酶,以及其中,所述修饰包含将腺嘌呤(A)转化为鸟嘌呤(G)。
206.根据权利要求185至205任一项的方法,其特征在于,a)中的所述修饰包含使所述免疫细胞与向导核酸序列接触。
207.根据权利要求206所述的方法,其特征在于,所述向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组的序列。
208.根据权利要求185至207中任一项所述的方法,其特征在于,b)中的所述修饰包含使所述免疫细胞与向导核酸序列接触。
209.根据权利要求208所述的方法,其特征在于,所述向导核酸序列包含选自表1中的序列的序列。
210.根据权利要求185至209中任一项所述的方法,其特征在于,在a)中的所述修饰包含通过用反转录酶和延伸的向导核酸序列的靶引物反转录用不同的核苷碱基替换所述单个靶核苷碱基,其中,所述延伸的向导核酸序列包含反转录模板序列、反转录引物结合位点或其组合。
211.根据权利要求185至210中任一项所述的方法,其特征在于,a)和b)中的所述修饰在所述免疫细胞中产生小于1%的插入缺失。
212.根据权利要求185至211中任一项所述的方法,其特征在于,a)和b)中的所述修饰在所述免疫细胞中产生小于5%的脱靶修饰。
213.根据权利要求185至211中任一项所述的方法,其特征在于,a)和b)中的所述修饰在所述免疫细胞中产生小于5%的非靶修饰。
214.根据权利要求185至213中任一项所述的方法,其特征在于,所述免疫细胞是人类细胞。
215.根据权利要求214所述的方法,其特征在于,所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
216.根据权利要求186至215中任一项所述的方法,其特征在于,所述CAR特异性结合与肿瘤相关的标志物。
217.根据权利要求216所述的方法,其特征在于,所述CAR特异性结合CD7。
218.一种具有降低的免疫原性和/或增加的抗肿瘤活性的经修饰的免疫细胞,其特征在于,所述经修饰的免疫细胞包含:
a)在第一基因序列或其调控元件中的单个靶核碱基修饰;和
b)在第二基因序列或其调控元件中的修饰,其中,所述修饰是由Cas12多肽产生的位点特异性切割;
其中,所述第一基因和所述第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因。
219.根据权利要求218所述的经修饰的免疫细胞,其特征在于,所述免疫细胞进一步包含外源功能性嵌合抗原受体(CAR)或其功能性片段。
220.根据权利要求219所述的经修饰的免疫细胞,其特征在于,将编码所述CAR或其所述功能片段的多核苷酸插入到由所述Cas12多肽产生的所述位点特异性切割中。
221.一种具有降低的免疫原性和/或增加的抗肿瘤活性的经修饰的免疫细胞,所述经修饰的免疫细胞包含:
a)在免疫细胞中第一基因序列或其调控元件中的单个靶核碱基修饰;和
b)在第二基因序列或其调控元件中的修饰,其中,所述修饰是外源嵌合抗原受体(CAR)或其功能片段或外源T细胞受体或其功能片段的插入;
其中,所述第一基因和所述第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因。
222.根据权利要求221所述的经修饰的免疫细胞,其特征在于,b)中的所述修饰是通过用Cas12b进行位点特异性切割而产生的。
223.根据权利要求218至222中任一项所述的经修饰的免疫细胞,其特征在于,与没有所述经修饰的相同类型的对照细胞相比,所述第一基因的表达降低至少60%,或其中,所述第二基因的表达降低至少60%。
224.根据权利要求218至223中任一项所述的经修饰的免疫细胞,其特征在于,所述第一基因或所述第二基因选自由CD3ε、CD3γ、CD3δ、CD4、TRAC、TRBC1、TRBC2、PDCD1、CD30、CD33、CD7、CD52、B2M、CD70、CIITA、CD2和CD5所组成的群组。
225.根据权利要求193所述的方法,其特征在于,所述第一基因或所述第二基因选自由TRAC、CD2、CD5、CD7和CD52所组成的群组。
226.根据权利要求225所述的经修饰的免疫细胞,其特征在于,所述第二基因是TRAC。
227.根据权利要求218至226中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞进一步包含在两个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
228.根据权利要求218至226中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞进一步包含在三个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
229.根据权利要求218至226中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞进一步包含在四个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
230.根据权利要求218至226中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞进一步包含在五个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
231.根据权利要求218至226中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞进一步包含在六个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
232.根据权利要求218至226中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞进一步包含在七个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
233.根据权利要求218至232中任一项所述的经修饰的免疫细胞,其特征在于,a)中的所述修饰由包含脱氨酶和核酸可编程DNA结合蛋白(napDNAbp)的碱基编辑器产生。
234.根据权利要求233所述的经修饰的免疫细胞,其特征在于,所述脱氨酶是胞苷脱氨酶,以及其中,所述修饰包含将胞苷(C)转化为胸腺嘧啶(T)。
235.根据权利要求233所述的经修饰的免疫细胞,其特征在于,所述脱氨酶是腺苷脱氨酶,以及其中,所述修饰包含将腺嘌呤(A)转化为鸟嘌呤(G)。
236.根据权利要求218至235中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞包含在所述基因组中小于1%的插入缺失。
237.根据权利要求218至236中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞是人类细胞。
238.根据权利要求218至237中任一项所述的经修饰的免疫细胞,其特征在于,所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
239.根据权利要求218至238中任一项所述的经修饰的免疫细胞,其特征在于,所述CAR特异性结合与肿瘤相关的标志物。
240.根据权利要求239所述的经修饰的免疫细胞,其特征在于,所述CAR特异性结合CD7。
241.根据权利要求218至240中任一项所述的经修饰的免疫细胞,其特征在于,b)中的所述修饰是在所述TRAC基因序列的外显子1中的插入。
242.一种经修饰的免疫细胞的群体,其特征在于,多个所述免疫细胞的群体包含:
a)在免疫细胞中第一基因序列或其调控元件中的单个靶核碱基修饰;和
b)在第二基因序列或其调控元件中的修饰,其中,所述修饰是由Cas12多肽产生的位点特异性切割;
其中,所述第一基因和所述第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因,
以及其中,所述多个所述群体包含外源嵌合抗原受体(CAR)或其功能片段。
243.根据权利要求242所述的经修饰的免疫细胞的群体,其特征在于,将编码所述CAR或其所述功能片段的多核苷酸插入到由所述Cas12多肽产生的所述位点特异性切割中。
244.一种经修饰的免疫细胞的群体,其特征在于,多个所述免疫细胞的群体包含:
a)在第一基因序列或其调控元件中的单个靶核碱基修饰;和
b)在第二基因序列或其调控序列中的修饰,其中,所述修饰是外源嵌合抗原受体(CAR)或其功能片段或外源T细胞受体或其功能片段的插入;
其中,所述第一基因和所述第二基因中的每一个是免疫原性基因、检查点抑制剂基因或免疫应答调节基因,以及其中,在a)或b)中具有所述经修饰的所述多个细胞表现出降低的免疫原性和/或增加的抗肿瘤活性。
245.根据权利要求244所述的经修饰的免疫细胞的群体,其特征在于,b)中的所述修饰是通过用Cas12b进行位点特异性切割而产生的。
246.根据权利要求242至245中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述第一基因的表达降低至少60%,或其中,与没有所述经修饰的相同类型的多个对照细胞相比,在a)或b)中具有所述经修饰的所述多个细胞中所述第二基因的表达降低至少60%。
247.根据权利要求242至246中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述第一基因或所述第二基因选自由CD3ε、CD3γ、CD3δ、CD4、TRAC、TRBC1、TRBC2、PDCD1、CD30、CD33、CD7、CD52、B2M、CD70、CIITA、CD2和CD5所组成的群组。
248.根据权利要求247所述的经修饰的免疫细胞的群体,其特征在于,所述第一基因或所述第二基因选自由TRAC、CIITA、CD2、CD5、CD7和CD52所组成的群组。
249.根据权利要求248所述的经修饰的免疫细胞的群体,其特征在于,所述第一基因是TRAC、CD7或CD52。
250.根据权利要求248所述的经修饰的免疫细胞的群体,其特征在于,所述第二基因是TRAC。
251.根据权利要求242至250中任一项所述的经修饰的免疫细胞的群体,其特征在于,在a)或b)中具有所述经修饰的所述多个细胞进一步包含在两个其他基因序列或其调控元件中的单个靶核碱基中的修饰。
252.根据权利要求251所述的经修饰的免疫细胞的群体,其特征在于,在a)或b)中具有所述经修饰的所述多个细胞进一步包含在三个、四个、五个或六个其他基因序列或其调控元件中的单个靶核碱基。
253.根据权利要求242至252中任一项所述的经修饰的免疫细胞的群体,其特征在于,在a)中的所述修饰由碱基编辑器产生,所述碱基编辑器包含脱氨酶和核酸可编程DNA结合蛋白(napDNAbp)以形成碱基编辑器。
254.根据权利要求253所述的经修饰的免疫细胞的群体,其特征在于,所述脱氨酶是胞苷脱氨酶,以及其中,所述修饰包含将胞苷(C)转化为胸腺嘧啶(T)。
255.根据权利要求253所述的经修饰的免疫细胞的群体,其特征在于,所述脱氨酶是腺苷脱氨酶,以及其中,所述修饰包含将腺嘌呤(A)转化为鸟嘌呤(G)。
256.根据权利要求254所述的经修饰的免疫细胞的群体,其特征在于,所述碱基编辑器进一步包含尿嘧啶糖基化酶抑制剂。
257.根据权利要求242至256中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞的群体的至少60%是有活力的。
258.根据权利要求242至256中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞的群体的至少60%扩增没有所述经修饰的相同类型的对照细胞的群体的扩增率的至少80%。
259.根据权利要求242至258中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞是人类细胞。
260.根据权利要求242至259中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述免疫细胞是细胞毒性T细胞、调节性T细胞、辅助性T细胞、树突细胞、B细胞或NK细胞。
261.根据权利要求242至260中任一项所述的经修饰的免疫细胞的群体,其特征在于,所述CAR特异性结合与肿瘤相关的标志物。
262.根据权利要求261所述的经修饰的免疫细胞的群体,其特征在于,所述CAR特异性结合CD7。
263.根据权利要求242至262中任一项所述的经修饰的免疫细胞的群体,其特征在于,在b)中的所述修饰是在所述TRAC基因序列的外显子1中的插入。
264.一种产生增加的抗肿瘤活性的经修饰的免疫细胞的方法,所述方法包含:修饰免疫细胞中Cbl原癌基因B(CBLB)基因序列或其调控元件中的单个靶核碱基,其中,与缺少所述经修饰的免疫细胞相比,所述修饰降低了所述免疫细胞的激活阈值;从而产生具有增加的抗肿瘤活性的经修饰的免疫细胞。
265.一种包含增加的抗肿瘤活性的经修饰的免疫细胞的组成物,其特征在于,所述经修饰的免疫细胞包含:在Cbl原癌基因B(CBLB)基因序列或其调控元件中的单个靶核碱基中的修饰,其中,与没有所述经修饰的相同类型的对照免疫细胞相比,所述经修饰的免疫细胞表现出降低的激活阈值。
266.一种免疫细胞的群体,其特征在于,多个所述免疫细胞的群体包含:在CBLB基因序列或其调控元件中的单个靶核碱基中的修饰,其中,与没有所述经修饰的相同类型的对照免疫细胞的群体相比,包含所述经修饰的所述多个所述免疫细胞的所述群体表现出降低的激活阈值。
267.一种产生增加的抗肿瘤活性的经修饰的免疫细胞的群体的方法,所述方法包含:修饰免疫细胞的群体中Cbl原癌基因B(CBLB)基因序列或其调控元件中的单个靶核碱基,其中,至少50%的所述免疫细胞的群体被修饰以包含所述单个靶核碱基修饰。
268.一种组成物,其包含用于碱基编辑的至少四个不同的向导核酸序列。
269.根据权利要求268所述的组成物,进一步包含编码碱基编辑器多肽的多核苷酸,其中,所述碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和脱氨酶。
270.根据权利要求269所述的组成物,其特征在于,编码所述碱基编辑器的所述多核苷酸是mRNA序列。
271.根据权利要求269或270所述的组成物,其特征在于,所述脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
272.根据权利要求268的组成物,进一步包含碱基编辑器多肽,其中,所述碱基编辑器多肽包含核酸可编程DNA结合蛋白(napDNAbp)和脱氨酶。
273.根据权利要求272的组成物,其特征在于,所述脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
274.根据权利要求272或273所述的组成物,进一步包含脂质纳米颗粒。
275.根据权利要求267至274中任一项所述的组成物,其特征在于,所述至少四个向导核酸序列各自与选自由CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA所组成的群组的基因序列杂交。在一些实施方案中,所述至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件选自CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA。在一些实施方案中,所述至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件包含选自CD2、CD3ε、CD3γ、CD3δ、CD4、CD5、CD7、CD30、CD33、CD52、CD70和CIITA的一或多者。在一些实施方案中,所述至少1、2、3、4、5、6、7、8个或更多个基因或其调控元件选自ACAT1、ACLY、ADORA2A、AXL、B2M、BATF、BCL2L11、BTLA、CAMK2D、cAMP、CASP8、Cblb、CCR5、CD2、CD3D、CD3E、CD3G、CD4、CD5、CD7、CD8A、CD33、CD38、CD52、CD70、CD82、CD86、CD96、CD123、CD160、CD244、CD276、CDK8、CDKN1B、Chi3l1、CIITA、CISH、CSF2CSK、CTLA-4、CUL3、Cyp11a1、DCK、DGKA、DGKZ、DHX37、ELOB(TCEB2)、ENTPD1(CD39)、FADD、FAS、GATA3、IL6、IL6R、IL10、IL10RA、IRF4、IRF8、JUNB、Lag3、LAIR-1(CD305)、LDHA、LIF、LYN、MAP4K4、MAPK14、MCJ、MEF2D、MGAT5、NR4A1、NR4A2、NR4A3、NT5E(CD73)、ODC1、OTULINL(FAM105A)、PAG1、PDCD1、PDIA3、PHD1(EGLN2)、PHD2(EGLN1)、PHD3(EGLN3)、PIK3CD、PIKFYVE、PPARa、PPARd、PRDMI1、PRKACA、PTEN、PTPN2、PTPN6、PTPN11、PVRIG(CD112R)、RASA2、RFXANK、SELPG/PSGL1、SIGLEC15、SLA、SLAMF7、SOCS1、Spry1、Spry2、STK4、SUV39、H1TET2、TGFbRII、TIGIT、Tim-3、TMEM222、TNFAIP3、TNFRSF8(CD30)、TNFRSF10B、TOX、TOX2、TRAC、TRBC1、TRBC2、UBASH3A、VHL、VISTA、XBP1、YAP1和ZC3H12A。
276.根据权利要求267至274中任一项所述的组成物,其特征在于,所述至少四个向导核酸序列各自与选自由CD3ε、CD3δ、CD3γ、TRAC、TRBC1和TRBC2、CD2、CD5、CD7、CD52、CD70和CIITA所组成的群组的基因序列杂交。
277.根据权利要求267至274中任一项所述的组成物,其特征在于,所述至少四个向导核酸序列包含选自由UUCGUAUCUGUAAAACCAAG、CCUACCUGUCACCAGGACCA、CUCUUACCUGUACCAUAACC、CACCUACCUAAGAACCAUCC、ACUCACGCUGGAUAGCCUCC、ACUCACCCAGCAUCCCCAGC、CACUCACCUUAGCCUGAGCA和CACGCACCUGGACAGCUGAC所组成的群组的序列。
278.一种包含根据权利要求267至277中任一项所述的组成物的免疫细胞,其特征在于,通过电穿孔将所述组成物引入所述免疫细胞。
279.一种包含根据权利要求267至277中任一项所述的组成物的免疫细胞,其特征在于,通过电穿孔、核转染、病毒转导或其组合将所述组成物引入所述免疫细胞。
280.根据权利要求86和88至134中任一项所述的经修饰的免疫细胞,与对照细胞相比,所述经修饰的免疫细胞具有增加的生长或活力。
281.根据权利要求280所述的经修饰的免疫细胞,其特征在于,所述对照细胞是用Cas9核酸酶经修饰的免疫细胞。
282.根据权利要求87和135至179所述的经修饰的免疫细胞的群体,与对照细胞的群体相比,所述经修饰的免疫细胞的群体具有增加的修饰免疫细胞的产量。
283.根据权利要求282所述的经修饰的免疫细胞的群体,其特征在于,所述对照的群体是用Cas9核酸酶经修饰的免疫细胞的群体。
CN202080021571.7A 2019-01-16 2020-01-16 具有增强的抗肿瘤活性和免疫抑制抗性的经修饰的免疫细胞 Pending CN114072495A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962793277P 2019-01-16 2019-01-16
US62/793,277 2019-01-16
US201962839870P 2019-04-29 2019-04-29
US62/839,870 2019-04-29
PCT/US2020/013964 WO2020150534A2 (en) 2019-01-16 2020-01-16 Modified immune cells having enhanced anti-neoplasia activity and immunosuppression resistance

Publications (1)

Publication Number Publication Date
CN114072495A true CN114072495A (zh) 2022-02-18

Family

ID=71613446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080021571.7A Pending CN114072495A (zh) 2019-01-16 2020-01-16 具有增强的抗肿瘤活性和免疫抑制抗性的经修饰的免疫细胞

Country Status (9)

Country Link
US (1) US20220133790A1 (zh)
EP (1) EP3911735A4 (zh)
JP (1) JP2022518463A (zh)
KR (1) KR20210116526A (zh)
CN (1) CN114072495A (zh)
AU (1) AU2020208616A1 (zh)
CA (1) CA3126699A1 (zh)
SG (1) SG11202107555XA (zh)
WO (1) WO2020150534A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113980896A (zh) * 2021-10-27 2022-01-28 中国人民解放军军事科学院军事医学研究院 Irf1在调控间充质干细胞免疫调节作用及产品上的应用
CN114774364A (zh) * 2022-04-26 2022-07-22 深圳市体内生物医药科技有限公司 一种嵌合抗原受体t细胞及其制备方法和应用
CN116590237A (zh) * 2023-05-29 2023-08-15 上海贝斯昂科生物科技有限公司 一种遗传修饰的自然杀伤细胞及其制备和用途
WO2024193562A1 (zh) * 2023-03-21 2024-09-26 苏州沙砾生物科技有限公司 一种修饰的细胞及其用途

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018229351B2 (en) 2017-02-28 2024-01-04 Vor Biopharma, Inc. Compositions and methods for inhibition of lineage specific proteins
SG11202101994XA (en) 2018-08-28 2021-03-30 Vor Biopharma Inc Genetically engineered hematopoietic stem cells and uses thereof
CA3149897A1 (en) * 2019-09-03 2021-03-11 Daniel Getts Methods and compositions for genomic integration
US20240238344A1 (en) * 2020-08-28 2024-07-18 Vor Biopharma Inc. Compositions and methods for cd123 modification
WO2022056459A1 (en) * 2020-09-14 2022-03-17 Vor Biopharma, Inc. Compositions and methods for cd5 modification
EP4214318A1 (en) * 2020-09-18 2023-07-26 Vor Biopharma Inc. Compositions and methods for cd7 modification
WO2022067089A1 (en) * 2020-09-25 2022-03-31 Beam Therapeutics Inc. Fratricide resistant modified immune cells and methods of using the same
WO2022072643A1 (en) * 2020-09-30 2022-04-07 Vor Biopharma Inc. Compositions and methods for cd30 gene modification
EP4240379A1 (en) * 2020-11-04 2023-09-13 The Board of Trustees of the Leland Stanford Junior University Methods and compositions for enhancing efficacy of therapeutic immune cells
WO2022113056A1 (en) 2020-11-30 2022-06-02 Crispr Therapeutics Ag Gene-edited natural killer cells
US20240335536A1 (en) * 2020-12-03 2024-10-10 Nkarta, Inc. Methods of engineering immune cells for enhanced potency and persistence and uses of engineered cells in immunotherapy
JP2023553935A (ja) * 2020-12-11 2023-12-26 インテリア セラピューティクス,インコーポレイテッド 脱アミノ化を伴うゲノム編集のためのポリヌクレオチド、組成物、及び方法
US11473060B2 (en) 2020-12-30 2022-10-18 Crispr Therapeutics Ag Compositions and methods for differentiating stem cells into NK cells
EP4284918A1 (en) * 2021-01-29 2023-12-06 Allogene Therapeutics, Inc. Knockdown or knockout of one or more of tap2, nlrc5, beta2m, trac, rfx5, rfxap and rfxank to mitigate t cell recognition of allogeneic cell products
WO2022215978A1 (ko) * 2021-04-05 2022-10-13 주식회사 셀렌진 Pdcd-1 유전자에 상보적인 가이드 rna 및 이의 용도
CN113179160B (zh) * 2021-04-15 2022-03-18 中国电子科技集团公司第三十研究所 一种适用于qkd中私钥放大的最优输入码长处理方法及单元
CA3217458A1 (en) * 2021-05-06 2022-11-10 Spyro Mousses Sirna constructs for inhibiting gene expression in targeted cancer cells
AU2022272235A1 (en) * 2021-05-11 2023-12-21 Myeloid Therapeutics, Inc. Methods and compositions for genomic integration
WO2023023515A1 (en) * 2021-08-16 2023-02-23 Beam Therapeutics Inc. Persistent allogeneic modified immune cells and methods of use thereof
CN118215490A (zh) * 2021-08-30 2024-06-18 小利兰·斯坦福大学董事会 具有腺苷脱氨酶的细胞表面表达的t细胞及其用途
IL311570A (en) 2021-10-14 2024-05-01 Arsenal Biosciences Inc Immune cells with common expression chain and logic gate systems
CN118369110A (zh) * 2021-11-03 2024-07-19 英特利亚治疗股份有限公司 用于免疫疗法的cd38组合物和方法
EP4447980A2 (en) * 2021-12-14 2024-10-23 The Trustees of The University of Pennsylvania Cd5 modified cells comprising chimeric antigen receptors (cars) for treatment of solid tumors
WO2023235813A2 (en) * 2022-06-03 2023-12-07 Beam Therapeutics Inc. Modified regulatory t cells and methods of using the same
US20240059744A1 (en) * 2022-07-25 2024-02-22 Interius Biotherapeutics, Inc. Mutated polypeptides, compositions comprising the same, and uses thereof
WO2024054062A1 (ko) * 2022-09-08 2024-03-14 주식회사 에이조스바이오 세포 내 형질주입을 위한 신규한 폴리펩타이드 조성물
WO2024059824A2 (en) * 2022-09-16 2024-03-21 Arsenal Biosciences, Inc. Immune cells with combination gene perturbations
WO2024064642A2 (en) * 2022-09-19 2024-03-28 Tune Therapeutics, Inc. Compositions, systems, and methods for modulating t cell function
EP4455157A1 (en) * 2023-04-27 2024-10-30 Fundacion Publica Andaluza Progreso Y Salud M.P.- Fps Polynuceotide for t cell specific transgene expression

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170020922A1 (en) * 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
CN107249606A (zh) * 2014-10-31 2017-10-13 宾夕法尼亚大学董事会 改变修饰的t细胞中的基因表达及其用途
US20180171298A1 (en) * 2015-06-30 2018-06-21 Cellectis Methods for improving functionality in nk cell by gene inactivation using specific endonuclease
CN108753823A (zh) * 2018-06-20 2018-11-06 李广磊 利用碱基编辑技术实现基因敲除的方法及其应用
US20180320163A1 (en) * 2015-06-18 2018-11-08 The Broad Institute Inc. Novel crispr enzymes and systems
CN108949825A (zh) * 2018-07-30 2018-12-07 苏州茂行生物科技有限公司 一种靶向her2的car-t细胞的制备方法及应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10167457B2 (en) * 2015-10-23 2019-01-01 President And Fellows Of Harvard College Nucleobase editors and uses thereof
EP3481434A4 (en) * 2016-07-05 2020-06-24 The Johns Hopkins University CRISPR / CAS9 COMPOSITIONS AND METHODS FOR TREATING RETINE DEGENERENCES

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107249606A (zh) * 2014-10-31 2017-10-13 宾夕法尼亚大学董事会 改变修饰的t细胞中的基因表达及其用途
US20180320163A1 (en) * 2015-06-18 2018-11-08 The Broad Institute Inc. Novel crispr enzymes and systems
US20180171298A1 (en) * 2015-06-30 2018-06-21 Cellectis Methods for improving functionality in nk cell by gene inactivation using specific endonuclease
US20170020922A1 (en) * 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
CN108753823A (zh) * 2018-06-20 2018-11-06 李广磊 利用碱基编辑技术实现基因敲除的方法及其应用
CN108949825A (zh) * 2018-07-30 2018-12-07 苏州茂行生物科技有限公司 一种靶向her2的car-t细胞的制备方法及应用

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BEAU WEBBER等: "Multiplex Human T Cell Engineering without Double-Strand Break Induction Using the Cas9 Base Editor System", 《BLOOD》, vol. 132, pages 1 - 4 *
KOMOR AC等: "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity", 《SCI ADV》, vol. 03, no. 08, pages 1 - 9 *
LIU X等: "CRISPR-Cas9-mediated multiplex gene editing in CAR-T cells", 《CELL RES》, vol. 27, no. 01, pages 154 - 157, XP055555205, DOI: 10.1038/cr.2016.142 *
REES HA等: "Base editing: precision chemistry on the genome and transcriptome of living cells", 《NAT REV GENET》, vol. 19, no. 12, pages 770 - 788 *
ZAFRA MP等: "Optimized base editors enable efficient editing in cells, organoids and mice", 《NAT BIOTECHNOL》, vol. 36, no. 09, pages 888 - 893, XP036929662, DOI: 10.1038/nbt.4194 *
陶永等: "单碱基编辑工具及在基因治疗中的应用及前景", 《中华耳科学杂志》, vol. 16, no. 02, pages 150 - 154 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113980896A (zh) * 2021-10-27 2022-01-28 中国人民解放军军事科学院军事医学研究院 Irf1在调控间充质干细胞免疫调节作用及产品上的应用
CN113980896B (zh) * 2021-10-27 2023-10-20 中国人民解放军军事科学院军事医学研究院 Irf1在调控间充质干细胞免疫调节作用及产品上的应用
CN114774364A (zh) * 2022-04-26 2022-07-22 深圳市体内生物医药科技有限公司 一种嵌合抗原受体t细胞及其制备方法和应用
CN114774364B (zh) * 2022-04-26 2024-04-26 深圳市体内生物医药科技有限公司 一种嵌合抗原受体t细胞及其制备方法和应用
WO2024193562A1 (zh) * 2023-03-21 2024-09-26 苏州沙砾生物科技有限公司 一种修饰的细胞及其用途
CN116590237A (zh) * 2023-05-29 2023-08-15 上海贝斯昂科生物科技有限公司 一种遗传修饰的自然杀伤细胞及其制备和用途
CN116590237B (zh) * 2023-05-29 2023-10-31 上海贝斯昂科生物科技有限公司 一种遗传修饰的自然杀伤细胞及其制备和用途

Also Published As

Publication number Publication date
US20220133790A1 (en) 2022-05-05
EP3911735A4 (en) 2023-07-12
WO2020150534A9 (en) 2020-08-13
AU2020208616A1 (en) 2021-08-12
EP3911735A2 (en) 2021-11-24
KR20210116526A (ko) 2021-09-27
SG11202107555XA (en) 2021-08-30
CA3126699A1 (en) 2020-07-23
WO2020150534A3 (en) 2020-10-01
WO2020150534A2 (en) 2020-07-23
JP2022518463A (ja) 2022-03-15

Similar Documents

Publication Publication Date Title
CN114072495A (zh) 具有增强的抗肿瘤活性和免疫抑制抗性的经修饰的免疫细胞
CN112823011A (zh) 基于t细胞的免疫疗法的基因靶标
CN111757937A (zh) 腺苷碱基编辑器的用途
CA3129157A1 (en) Modified immune cells having adenosine deaminase base editors for modifying a nucleobase in a target sequence
US20240287453A1 (en) Persistent allogeneic modified immune cells and methods of use thereof
US20170029774A1 (en) Production of engineered t-cells by sleeping beauty transposon coupled with methotrexate selection
CA3155667A1 (en) Compositions and methods for treatment of liquid cancers
TW202235617A (zh) 用於減少細胞中ii類mhc之組合物及方法
WO2022067089A1 (en) Fratricide resistant modified immune cells and methods of using the same
US20240325533A1 (en) Modified immune cells and methods of using the same
WO2023235813A9 (en) Modified regulatory t cells and methods of using the same
WO2024215414A1 (en) Modified immune effector cells with improved efficacy
CN118234865A (zh) 持久性同种异体修饰免疫细胞及其使用方法
KR20230044537A (ko) 원하는 표현형을 갖는 car t 세포의 조작 및 선택을 위한 조성물 및 방법
WO2024197020A2 (en) Immunosuppressant-resistant modified allogeneic modified immune cells and methods for use thereof
WO2024044750A2 (en) Modified allogeneic cells and methods and compositions for the preparation thereof
CN116802274A (zh) 用于减少细胞中ii类mhc的组合物和方法
CN116507722A (zh) 用于crispr v型系统的含有dna的多核苷酸和引导物及制备和使用其的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination