CN116323920A - 富集基因工程t细胞的方法 - Google Patents

富集基因工程t细胞的方法 Download PDF

Info

Publication number
CN116323920A
CN116323920A CN202180069138.5A CN202180069138A CN116323920A CN 116323920 A CN116323920 A CN 116323920A CN 202180069138 A CN202180069138 A CN 202180069138A CN 116323920 A CN116323920 A CN 116323920A
Authority
CN
China
Prior art keywords
protein
nucleotide sequence
cell
cells
dhfr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180069138.5A
Other languages
English (en)
Inventor
卡斯汀·黎奈曼
汤玛士·奎曼
盖文·M·班斗
杰罗恩·W·J·凡·赫斯特
孔向俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dutch Shangxin Gene Therapy Co
Original Assignee
Dutch Shangxin Gene Therapy Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dutch Shangxin Gene Therapy Co filed Critical Dutch Shangxin Gene Therapy Co
Publication of CN116323920A publication Critical patent/CN116323920A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0026Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5)
    • C12N9/0028Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5) with NAD or NADP as acceptor (1.5.1)
    • C12N9/003Dihydrofolate reductase [DHFR] (1.5.1.3)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y105/00Oxidoreductases acting on the CH-NH group of donors (1.5)
    • C12Y105/01Oxidoreductases acting on the CH-NH group of donors (1.5) with NAD+ or NADP+ as acceptor (1.5.1)
    • C12Y105/01003Dihydrofolate reductase (1.5.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Mycology (AREA)
  • Veterinary Medicine (AREA)
  • Developmental Biology & Embryology (AREA)
  • Virology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开的各种实施方案涉及用于选择基因工程细胞的方法。一些实施方案涉及用本发明公开的方法生产的细胞。

Description

富集基因工程T细胞的方法
任何优先权申请的援引并入
在与本申请一起提交的申请数据表中确定的用于外国或国内优先权要求的任何和所有申请在此均以引用的方式并入。本申请要求于2020年8月7日提交的序列号63/062854的美国临时申请、2021年1月8日提交的序列号63/135460的申请,2021年4月2日提交的序列号63/170269的申请和2021年7月14日提交的序列号63/221808的申请的优先权,它们的全文在此通过引用的方式并入。
序列表引用
本申请与序列表一起以电子格式提交。序列表以2021年8月4日创建的名为SEQUENCE_LISTING_NTBV024WO.txt的文件提供,其大小为70,430字节。电子格式序列表中的信息的全文在此通过引用的方式并入。
技术领域
本发明属于细胞治疗和/或基因治疗领域。一些实施方案也属于细胞或基因工程领域。
背景技术
细胞疗法是一种将活细胞注射、移植或植入患者体内以实现药效(medicinaleffect)的疗法,例如通过在免疫治疗过程中移植能够通过细胞介导的免疫对抗癌细胞的T细胞,或移植干细胞以再生患病组织。
发明内容
本文描述的一些实施方案涉及用于选择基因工程细胞的方法。所述方法包括ⅰ)将至少一种可操作用于在细胞中表达的两部分核苷酸序列(two-part nucleotidesequence)导入所述细胞,其中所述细胞具有存活和/
或增殖所必需的蛋白,在正常细胞培养基中所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,并且其中所述至少一种两部分核苷酸序列包含编码存活和/或增殖所必需的蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码目的蛋白(例如,对细胞而言是外源性的蛋白);和ⅱ)在正常细胞培养基中培养所述细胞以选择表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞。
本文描述的一些实施方案涉及用于选择基因工程细胞的方法。所述方法包括ⅰ)将至少一种可操作用于在细胞中表达的两部分核苷酸序列导入所述细胞,其中所述细胞具有存活和/或增殖必需的蛋白,在所选培养条件下所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,并且其中所述至少一种两部分核苷酸序列包含编码允许存活和/或增殖的蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码对所述细胞而言是外源性的蛋白;和ⅱ)在使得富集表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的体外增殖条件下培养所述细胞。
本文描述的一些实施方案涉及用于富集基因工程细胞的方法。所述方法包括:ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到所述细胞在正常体外增殖条件下不能存活和/或增殖的水平;ⅱ)导入至少一种两部分核苷酸序列,所述两部分核苷酸序列可操作用于在所述细胞中表达并且包含编码所述第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中所述第二部分蛋白对所述细胞而言是外源性的,和ⅲ)在正常的体外增殖条件下培养所述细胞以富集表达所述第一蛋白和所述第二蛋白两者的细胞。
本文描述的一些实施方案涉及一种细胞,其包括ⅰ)内源性二氢叶酸还原酶(endogenous dihydrofolate reductase,(DHFR)),其被抑制到细胞在正常细胞培养基中不能存活和/或增殖的水平,和ⅱ)至少一种两部分核苷酸序列,其包含编码DHFR的第一部分核苷酸序列和编码新生抗原(neo-antigen)T细胞受体复合物的第二部分核苷酸序列。
本文描述的一些实施方案涉及用于富集基因工程细胞的方法。所述方法包括ⅰ)导入至少一种可操作用于在细胞中表达的两部分核苷酸序列,并且所述两部分核苷酸序列包含编码为细胞提供对选择压力的抗性的第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中第二部分蛋白对细胞而言是外源性的,和ⅱ)在含有至少一种导致表达第一蛋白和第二蛋白两者的细胞富集的补充剂(supplement)的细胞培养基中培养细胞。
本文所述的一些实施方案涉及用于富集基因工程T细胞的方法。所述方法包括ⅰ)通过在TRA或TRB启动子下游整合两部分核苷酸序列,将包含编码氨甲蝶呤(methotrexate)抗性DHFR蛋白的第一部分核苷酸序列和编码T细胞受体复合物或嵌合抗原受体的第二部分核苷酸序列的两部分核苷酸序列导入T细胞,和ⅱ)在含有导致表达第一蛋白和第二蛋白两者的细胞富集的氨甲蝶呤的细胞培养基中培养细胞。
本文描述的一些实施方案涉及用于富集经工程改造以表达外源性T细胞受体基因的T细胞的方法。所述方法包括ⅰ)使用第一CRISPR/Cas9RNP将内源性TRBC基因从其基因座上敲除;ⅱ)使用第二CRISPR/Cas9RNP将编码氨甲蝶呤抗性DHFR基因的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TRBC基因座,其中两种核苷酸序列可操作地连接使得能够从内源性TRBC启动子表达;和ⅲ)在含有导致表达治疗性TCR和氨甲蝶呤抗性DHFR基因两者的T细胞富集的氨甲蝶呤的细胞培养基中培养细胞。
本文描述的一些实施方案涉及T细胞,其包括ⅰ)在氨甲蝶呤的存在下被抑制(suppressed)到细胞不能存活和/或增殖的水平的内源性二氢叶酸还原酶(DHFR),和ⅱ)至少一种两部分核苷酸序列,其包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
本文描述的一些实施方案涉及T细胞,或用于富集经工程改造以表达外源基因的T细胞的方法,其包括ⅰ)因氨甲蝶呤的存在而被抑制到细胞不能存活和/或增殖的水平的内源性DHFR,和ⅱ)至少两种核苷酸序列,包括包含编码与第一结合结构域融合的氨甲蝶呤抗性DHFR蛋白的非功能部分的核苷酸序列的第一核苷酸和包含编码与第二结合结构域融合的氨甲蝶呤抗性DHFR蛋白的非功能部分的核苷酸序列的第二核苷酸,使得当同时表达两种核苷酸时,存在功能性氨甲蝶呤抗性DHFR并且功能性氨甲蝶呤抗性DHFR能够促进含有第一核苷酸和第二核苷酸两者的细胞的选择。所述核苷酸序列中的任一者都可以包含两个以上的部分,使得第一部分包含编码与结合结构域融合的氨甲蝶呤抗性DHFR蛋白的非功能部分的核苷酸序列,并且第二部分包含编码外源基因的核苷酸序列。
对于根据这些实施方案的某些选择方法,随后在含有导致包含所述至少两种核苷酸序列的细胞富集的氨甲蝶呤的细胞培养基中培养T细胞。
本文描述的一些实施方案涉及用于恢复被拆分成多个非功能部分的DHFR蛋白的功能的结合结构域。当结合结构域与DHFR蛋白的互补非功能部分融合时,可以恢复DHFR蛋白的功能。结合结构域可以是天然结合结构域、不与天然蛋白相互作用的工程化结合结构域或诱导性结合结构域。
本文还公开了一种用于选择基因工程细胞的方法。在一些实施方案中,所述方法包括导入至少两种可操作用于在细胞中表达的两部分核苷酸序列。在一些实施方案中,细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到细胞不能存活和/或增殖的水平。在一些实施方案中,第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。在一些实施方案中,第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。在一些实施方案中,当第一融合蛋白和第二融合蛋白两者在细胞中一起表达时,存活和/或增殖必需的蛋白的功能得到恢复。在一些实施方案中,所述方法还包括在导致表达第一两部分核苷酸序列和第二两部分核苷酸序列的细胞的选择的条件下培养细胞。
在一些实施方案中,必需的蛋白是DHFR蛋白。在一些实施方案中,
第一两部分核苷酸序列或第二两部分核苷酸序列的第二部分核苷酸序列对细胞而言是外源性的。在一些实施方案中,第一两部分核苷酸序列或
第二两部分核苷酸序列的第二部分核苷酸序列是TCR。在一些实施方案中,第一结合结构域和第二结合结构域源自GCN4。在一些实施方案中,第一结合结构域和第二结合结构域源自FKBP12。在一些实施方案中,FKBP12具有F36V突变。在一些实施方案中,第一结合结构域源自JUN,并且第二结合结构域源自FOS。在一些实施方案中,第一结合结构域和第二结合结构域具有保持(preserve)相互之间结合的互补突变。在一些实施方案中,第一结合结构域和第二结合结构域都不结合天然结合配偶体(binding partner)。在一些实施方案中,第一结合结构域和第二结合结构域各具有3至7个互补突变。在一些实施方案中,第一结合结构域和第二结合结构域各具有3个互补突变。在一些实施方案中,第一结合结构域和第二结合结构域各具有4个互补突变。在一些实施方案中,必需的蛋白的功能的恢复是诱导的,任选地通过AP1903诱导。在一些实施方案中,培养步骤在氨甲蝶呤存在下进行。
本文还公开了用于富集基因工程细胞的方法。在一些实施方案中,
所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平。在一些实施方案中,所述方法还包括导入至少两种可操作用于在细胞中表达的两部分核苷酸序列。在一些实施方案中,第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。在一些实施方案中,第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。在一些实施方案中,当第一融合蛋白和第二融合蛋白两者在细胞中一起表达时,存活和/或增殖必需的蛋白的功能得到恢复。在一些实施方案中,所述方法还包括在导致表达第一融合蛋白和第二融合蛋白两者的细胞富集的体外增殖条件下培养所述细胞。
在一些实施方案中,必需的蛋白是DHFR蛋白。在一些实施方案中,
第一两部分核苷酸序列或第二两部分核苷酸序列的第二部分核苷酸序列对细胞而言是外源性的。在一些实施方案中,第一两部分核苷酸序列或
第二两部分核苷酸序列的第二部分核苷酸序列是TCR。在一些实施方案中,第一结合结构域和第二结合结构域源自GCN4。在一些实施方案中,第一结合结构域和第二结合结构域源自FKBP12。在一些实施方案中,FKBP12具有F36V突变。在一些实施方案中,第一结合结构域源自JUN,并且第二结合结构域源自FOS。在一些实施方案中,第一结合结构域和第二结合结构域具有保持相互之间结合的互补突变。在一些实施方案中,第一结合结构域和第二结合结构域都不结合天然结合配偶体。在一些实施方案中,第一结合结构域和第二结合结构域各具有3至7个互补突变。
在一些实施方案中,第一结合结构域和第二结合结构域各具有3个互补突变。在一些实施方案中,第一结合结构域和第二结合结构域各具有4个互补突变。在一些实施方案中,必需的蛋白的功能的恢复是诱导的,任选地通过AP1903诱导。在一些实施方案中,培养步骤在氨甲蝶呤存在下进行。
本文提供的一些实施方案涉及用于选择或富集基因工程细胞的方法。在一些实施方案中,所述方法包括将至少一种能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者的两部分核苷酸序列导入细胞。细胞具有存活和/或增殖所必需的蛋白,所述蛋白被降低到细胞在正常细胞培养基中不能存活和/或增殖的水平。所述至少一种两部分核苷酸序列可操作用于在细胞中表达,或者当插入靶基因组中的预定位点时变得可操作用于表达,并且所述至少一种两部分核苷酸序列包括编码存活和/或增殖所必需的蛋白或其变体的第一部分核苷酸序列,和编码待表达蛋白的第二部分核苷酸序列。第二部分核苷酸序列编码目的蛋白。所述方法还包括在没有药理学外源选择压力的正常细胞培养基中培养细胞,以用于选择或富集表达第一部分和第二部分核苷酸序列两者的细胞。
在一些实施方案中,所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白的水平降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平,将至少一种两部分核苷酸序列导入细胞,所述两部分核苷酸序列能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者,并且包括编码第一蛋白或其变体的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列。所述至少一种两部分核苷酸序列可操作用于在细胞中表达,或者当插入靶基因组中的预定位点时变得可操作用于表达。第二部分蛋白是目的蛋白。所述方法还包括在没有药理学外源选择压力的情况下在正常的体外增殖条件下培养细胞,以用于富集表达第一蛋白和第二蛋白两者的细胞。
在一些实施方案中,所述方法包括将至少一种能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者的两部分核苷酸序列导入细胞。所述细胞具有存活和/或增殖必需的蛋白的功能活性,所述功能活性被降低以至于所述细胞不能在正常细胞培养基中存活和/或增殖。所述至少一种两部分核苷酸序列可操作用于在细胞中表达,或者当插入靶基因组中的预定位点时变得可操作用于表达。所述至少一种两部分核苷酸序列包含编码第一蛋白的第一部分核苷酸序列,所述第一蛋白提供与存活和/或增殖所必需的蛋白基本上等同的功能,并且所述第二部分核苷酸序列编码待表达的第二蛋白。第二蛋白是目的蛋白。所述方法还包括在含有至少一种导致富集或选择表达第一蛋白和第二蛋白两者的细胞的补充剂的细胞培养基中培养细胞。
在一些实施方案中,所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白的功能活性降低到所述细胞在正常体外增殖条件下不能存活和/或增殖的水平;将能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者的至少一种两部分核苷酸序列导入细胞中,并且所述至少一种两部分核苷酸序列包括编码提供基本等同的功能的第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列。所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且所述第二蛋白是目的蛋白。
所述方法还包括在含有至少一种导致选择或富集表达第一蛋白和第二蛋白两者的细胞的补充剂的细胞培养基中培养细胞。
在一些实施方案中,所述方法包括将至少两种能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者的两部分核苷酸序列导入细胞。细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制(suppressed)到细胞不能存活和/或增殖的水平。第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码第一目的蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码第二目的蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。当第一融合蛋白和第二融合蛋白在细胞中一起表达时,存活和/或增殖必需的蛋白的功能得到恢复。所述方法还包括在导致选择表达第一两部分核苷酸序列和第二两部分核苷酸序列两者的细胞的条件下培养细胞。
在一些实施方案中,所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白抑制到细胞在正常体外繁殖条件下不能存活和/或增殖的水平,并导入至少两种能够在细胞中表达的两部分核苷酸序列。第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码第一目的蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码第二目的蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。当第一融合蛋白和第二融合蛋白两者在细胞中一起表达时,存活和/或增殖必需的蛋白的功能得到恢复。所述方法还包括在导致表达第一融合蛋白和第二融合蛋白两者的细胞富集的体外增殖条件下培养细胞。
在一些实施方案中,所述方法包括导入至少一种可操作用于在细胞中表达的两部分核苷酸序列。所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,并且所述至少一种两部分核苷酸序列包括编码存活和/或增殖所必需的蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列。第二部分核苷酸序列编码对细胞而言是外源性的蛋白。所述方法还包括在导致选择表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的条件下培养细胞。
在一些实施方案中,所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平,导入至少一种两部分核苷酸序列,所述两部分核苷酸序列可操作用于在细胞中表达并且包含编码第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列。第二部分蛋白对细胞而言是外源性的,并且在导致表达第一蛋白和第二蛋白两者的细胞富集的体外增殖条件下培养细胞。
本文还公开了根据本发明的任何方法制成的细胞。
本文还公开了用于富集基因工程T细胞的方法。在一些实施方案中,
所述方法包括通过在TRA或TRB启动子下游整合两部分核苷酸序列,将包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码T细胞受体复合物或嵌合抗原受体的第二部分核苷酸序列的两部分核苷酸序列导入T细胞,和在含有导致表达第一蛋白和第二蛋白两者的细胞的富集的氨甲蝶呤的细胞培养基中培养细胞。
本文还公开了用于富集经工程改造以表达外源性T细胞受体基因的T细胞的方法。在一些实施方案中,所述方法包括使用第一CRISPR/Cas9RNP将内源性TRBC基因从其基因座上敲除,使用第二CRISPR/Cas9RNP将编码氨甲蝶呤抗性DHFR基因的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TRBC基因座,其中两种核苷酸序列可操作地连接使得能够从内源性TRBC启动子表达,和在含有导致表达治疗性TCR和氨甲蝶呤抗性DHFR基因两者的T细胞富集的氨甲蝶呤的细胞培养基中培养细胞。
本文还公开了T细胞。在一些实施方案中,所述T细胞包含内源性二氢叶酸还原酶(DHFR),其在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平,和至少一种两部分核苷酸序列,其包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
在一些实施方案中,所述T细胞包含内源性二氢叶酸还原酶(DHFR)敲除,和至少一种两部分核苷酸序列,所述两部分核苷酸序列包含编码DHFR蛋白或其变体的第一部分核苷酸序列和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
在一些实施方案中,所述T细胞包含二氢叶酸还原酶(DHFR),其在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平,和至少两种两部分核苷酸序列。第一两部分核苷酸序列包含编码DHFR蛋白或其变体的非功能性的或功能失调的部分的第一种第一部分核苷酸序列(first first-part nucleotide sequence),和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第一种第二部分核苷酸序列(first second-partnucleotide sequence)。所述第二两部分核苷酸序列包含编码DHFR蛋白或其变体的非功能性的或功能失调的部分的第二种第一部分核苷酸序列(second first-part nucleotidesequence),和编码由内源性B2M启动子可操作地表达的目的蛋白的第二种第二部分核苷酸序列(second second-part nucleotide sequence),并且所述细胞具有DHFR活性。
本发明的这些和其他特征、方面和优点将在参照以下描述和所附权利要求后得到更好理解。
附图说明
图1示出了涉及DFHR参与途径的一些实施方案。
图2示出了一些实施方案的基因构建体。
图3描绘了测定在来自两个供体的人T细胞中sgRNAsgDHFR-1的敲除效率的TIDE(Tracking ofIndels by Decomposition)分析的结果(对于BC23和BC26,分别为75%和18%)。
图4描绘了测定在来自两个供体的人T细胞中sgRNAsgDHFR-2的敲除效率的TIDE分析的结果(对于BC23和BC26,分别为34%和75%)。
图5描绘了在电穿孔后第6天在来自两个供体的T细胞中检验NY-ESO-1 1G4 TCR敲入效率的FACS分析的结果。
图6描绘了在电穿孔后第10天在来自两个供体的T细胞中检验NY-ESO-1 1G4 TCR敲入效率的FACS分析的结果。
图7提供了左图和右图,左图示出1G4-TCR KI(敲入)T细胞与1G4-TCR-DHFR KI+DHFR KO T细胞之间的TCR表达水平相当;右图示出在电穿孔后第12天,在两种供体T细胞中的1G4-TCR敲入和1G4-TCR-DHFR KI+DHFR KO T细胞之间的TCR敲入细胞总数相当。
图8描绘了在电穿孔后第5天在来自四个供体(BC29、BC30、BC31和BC32)的T细胞中检验NY-ESO-1 1G4 TCR敲入效率的FACS分析结果。
图9提供了图8的量化数据。
图10提供了左图和右图,左图示出1G4-TCR KI和1G4-TCR-DHFR KI+DHFR KO细胞之间的TCR表达水平相当;右图示出,在四个供体T细胞中,与1G4-DHFR-KI T细胞或1G4-TCR-DHFR-KI+DHFR KO T细胞相比,1G4-TCR敲入条件下的TCR敲入细胞总数较高。
图11提供了使用MTX-荧光素标记法测定DHFR表达的结果。
图12左图示出了图11中描述的用于筛选靶向DHFR的高效向导RNA的方法;右图,使用图11中描述的方法筛选针对DHFR的高效siRNA。
图13A是示出具有对照修复模板1G4 KI的敲入的T细胞的FACS图,图13B是示出具有修复模板1G4-DHFRm KI的敲入的T细胞的FACS图,图13C是示出具有三个供体(BC37、BC38和BC39)和两个技术重复(two technical replicates)的图13A和图13B的量化柱状图。
图14是示出图13中描述的两种敲入条件的T细胞扩增的柱状图。
图15示出通过用抗CD4抗体染色,在图13所述的两种敲入条件下CD4+细胞比例的FACS分析。
图16示出通过用抗CD45RA和抗CD62L抗体染色对TCR敲入细胞表型的FACS分析。
图17示出通过用抗CD27和抗CD28抗体染色对TCR敲入细胞表型的FACS分析。
图18示出通过与肿瘤细胞(供体BC37)共培养来测定T细胞的细胞溶解能力的集落形成试验(colony formation assay)。
图19示出了肿瘤-T细胞共培养试验,其中T细胞来自另外两个供体(BC38和BC39)。
图20是示出当用肿瘤细胞刺激时T细胞的IFNγ产生能力的柱状图。
图21是示出当用肿瘤细胞刺激时T细胞的IFNγ表达水平(通过平均荧光强度,MFI测定)的柱状图。
图22是示出当用肿瘤细胞刺激时T细胞的IL2产生能力的柱状图。左图:IL2产生细胞比例。右图:IL2产生细胞的表达水平。
图23是示出当用肿瘤细胞刺激时T细胞增殖能力的直方图。
图24是将框内(in-frame)外显子整合到基因座中,以使得能够由内源性启动子、内源性剪接位点和内源性终止信号表达的图。
图25是将框内外显子整合到基因位座中,以使得能够由内源性启动子、内源性剪接位点和外源性终止信号表达的图。
图26是将内含子整合到基因座中,以使得能够由内源性启动子、外源性剪接受体位点和外源性终止信号表达的图。
图27A示出了敲除必需的基因的图。图27B示出了敲入编码改变的必需的蛋白和第二蛋白的两部分核苷酸序列的图。
图28示出了BC45、BC46双重转导的FACS结果。
图29示出了BC 45细胞的MTX选择结果。
图30示出了BC 46细胞的MTX选择结果。
图31示出了在较高的MTX浓度中选择BC 45细胞的结果。
图32示出了在较高的MTX浓度中选择BC 46细胞的结果。
图33示出了用于基因工程细胞的选择方法的一些实施方案。
图34示出了SEQ ID NO:1的序列,其是人DHFR野生型蛋白序列。
图35示出了SEQ ID NO:2的序列,其是人MTX抗性DHFR突变体蛋白序列。
图36示出了SEQ ID NO:3的序列,其是编码野生型人DHFR的DNA
序列。
图37示出了SEQ ID NO:4的序列,其是编码野生型人DHFR的密码子经优化且核酸酶抗性的DNA序列。
图38示出了SEQ ID NO:5的序列,其是编码MTX抗性人DHFR突变体的密码子优化的DNA序列。
图39示出了TCR位点特异性整合示意图。
图40示出了关于在没有选择的情况下用TCR编辑T细胞的样本数据。
图41示出了mDHFR-MTX选择策略的实施方案的示意图。
图42示出了在使用和不使用mDHFR-MTX选择策略的实施方案的情况下,经TCR编辑的T细胞的汇总比较。
图43A-43B示出了在使用氨甲蝶呤2天后基于JunMUT3AA-FosMUT3AA的拆分(split)-DHFR选择的FACS结果。
图44A-44D示出了在使用氨甲蝶呤10天后基于JunMUT3AA-FosMUT3AA和JunMUT4AA-FosMUT4AA的断裂-DHFR选择(split-DHFR selection)的FACS结果。
图45A-45B示出了在使用氨甲蝶呤8天后基于FKBP12F36V的断裂-DHFR选择的FACS结果。
图46A-46B示出了在使用氨甲蝶呤6天后比较基于FKBP12F36V的断裂-DHFR选择和基于JunMUT4AA-FosMUT4AA的断裂-DHFR选择的FACS结果。
图47A示出了在不处理或100nM氨甲蝶呤处理4天后,比较基于JunMUT3AA-FosMUT3AA和Jun-Fos的CD90.2和Ly-6G选择的FACS结果。
图47B示出了在不处理或100nM氨甲蝶呤处理4天后,比较基于Jun-FosMUT3AA和JunMUT3AA-Fos的CD90.2和Ly-6G选择的FACS结果。
图48是示出用载体对JUNWT-mDHFR_A+FOSWT-mDHFR_B、JUNMUT3AA-mDHFR_A+FOSMUT3AA-mDHFR_B、JUNWT-mDHFR_A+FOSMUT3AA-mDHFR_B或JUNMUT3AA-mDHFR_A+FOSWT-mDHFR_B感染后,在供体A和供体B中工程化T细胞富集倍数的柱状图。
图49是示出用100nM氨甲蝶呤处理6天、用载体对JUNWT-mDHFR_A+FOSWT-mDHFR_B、JUNMUT3AA-mDHFR_A+FOSMUT3AA-mDHFR_B、JUNWT-mDHFR_A+FOSMUT3AA-mDHFR_B或JUNMUT3AA-mDHFR_A+FOSWT-mDHFR_B感染四天后,在供体A和供体B中工程化T细胞富集倍数的柱状图。
图50是示出用100nM氨甲蝶呤处理6天、用载体对JUNWT-mDHFR_A+FOSWT-mDHFR_B、JUNMUT4AA-mDHFR_A+FOSMUT4AA-mDHFR_B、JUNWT-mDHFR_A+FOSMUT4AA-mDHFR_B或JUNMUT4AA-mDHFR_A+FOSWT-mDHFR_B感染四天后,在供体A和供体B中工程化T细胞富集倍数的柱状图。
图51A和51B示出了来自供体A和供体B的双工程化T细胞的FACS结果,在不处理或用100nM氨甲蝶呤处理6天、用sJUN-mDHFR_A+sFOS-mDHFR_B或sJUNMUT8AA-mDHFR_A+sFOSMUT8AA-mDHFR_B对、sJUN-mDHFR_A+sFOSMUT8AA-mDHFR_B或sJUNMUT8AA-mDHFR_A+sFOS-mDHFR_B感染四天后,使用CD90.2和Ly-6G选择。
图52是示出通过由图51A-51B的FACS图产生的工程化T细胞的倍数富集的量化的柱状图。
图53是示出用载体对FKBP12F36V-mDHFR_A+FKBP12F36V-mDHFR_B感染、不处理或10nMAP1903处理4小时以及用100nM氨甲蝶呤处理6天后,在供体A和供体B中工程化T细胞富集倍数的柱状图。
图54是示出用靶向B2M基因座的五种Cas9 RNP之一处理的人原代T细胞中敲除细胞的百分比的柱状图。
具体实施方式
在上文的发明内容部分、具体实施方式部分以及所附权利要求中,提及了本发明的特定特征。应当理解,在本说明书中的本发明的公开内容包括这些特定特征的所有可能组合。例如,在本发明的特定方面或实施方案或特定权利要求的上下文中公开了特定特征的情况下,该特征也可以在可能的程度上与本发明的其他特定方面和实施方案结合和/或在本发明的其他特定方面和实施方案的上下文中使用,并且通常在本发明中使用。
在特定基因组位点精确导入外源DNA序列(也称为基因敲入),通常需要两个步骤:(1)通过核酸酶在基因组位点导入DNA双链断裂,和(2)通过同源定向修复(HDR)途径使用同源修复模板修复该DNA断裂。这一过程通常效率低下,因为HDR所需的酶仅在细胞周期的S期和G2期具有活性。也就是说,基因敲入很大程度上局限于正在分裂的细胞。鉴于基因敲入过程的总体低效率,一种能够选择和富集那些已经成功经历基因编辑程序的细胞的方法可能是有用的。
为了使得能够通过成功敲入治疗基因构建体来富集细胞,选择压力是有用的,以确保具有敲入事件的原代细胞能够存活,而没有敲入事件的细胞死亡。
本文描述的各种实施方案涉及用于选择基因工程细胞的方法。在那些方法中,通过导入至少一种两部分核苷酸序列来选择基因工程细胞,所述至少一种两部分核苷酸序列编码至少一种对细胞而言是外源性的蛋白(并且例如为了治疗目的而导入)和另一种恢复细胞存活和/或增殖所需的并且已经被抑制的必需的蛋白的功能的蛋白。
细胞存活和/或增殖所需的必需蛋白的功能可被核酸酶或蛋白抑制剂抑制;所述抑制可以是永久性的或暂时性的,并且所述抑制可以是在核苷酸水平或蛋白水平。
细胞存活和/或增殖所需的必需蛋白的功能可以通过外源选择压力来抑制,例如通过小分子介导的抑制所诱导。
可以通过在两部分核苷酸序列中编码必需的蛋白来恢复必需的蛋白。可以对编码的必需的蛋白进行基因工程改造,使得其核苷酸序列具有核酸酶抗性或使得所述蛋白具有蛋白抑制剂抗性。因此,成功再导入必需的蛋白的细胞将获得强于野生型细胞的存活优势,并随着时间的推移而富集。
必需的蛋白可以作为一个连续序列导入或拆分成不同结构域,以允许用多种外源蛋白对细胞进行基因工程。
此外,本文描述的各种实施方案涉及在使用本文描述的用于选择基因工程细胞的方法的过程中所产生的细胞。
本文描述的一些实施方案涉及用于选择基因工程细胞的方法。所述方法包括ⅰ)导入至少一种可操作用于在细胞中表达的两部分核苷酸序列,其中所述细胞具有存活和/或增殖必需的蛋白,所述蛋白被抑制到所述细胞在所选培养条件下不能存活和/或增殖的水平,并且其中所述至少一种两部分核苷酸序列包含编码允许存活和/或增殖的蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码对所述细胞而言是外源性的蛋白;和ⅱ)在允许富集表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的体外增殖条件下培养所述细胞。
本文描述的一些实施方案涉及用于选择基因工程细胞的方法。所述方法包括ⅰ)将细胞中的必需的蛋白抑制到所述细胞在正常培养基中不能存活和/或增殖的水平;ⅱ)导入至少一种可操作用于在细胞中表达的两部分核苷酸序列,其中所述至少一种两部分核苷酸序列包含编码允许存活和/或增殖的蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列;ⅲ)在允许富集表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的正常培养基中培养所述细胞。
本文描述的一些实施方案涉及用于选择基因工程细胞的方法。所述方法包括ⅰ)通过用至少一种化合物补充细胞培养基,将细胞中的必需的蛋白抑制到所述细胞不能存活和/或增殖的水平;ⅱ)通过靶向整合到基因组位点将至少一种两部分核苷酸序列导入细胞中,以实现在细胞中从内源性启动子可操作表达,其中所述至少一种两部分核苷酸序列包含编码允许细胞在经补充的培养基中存活和/或增殖的蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列;ⅲ)在含有至少一种化合物的培养基中培养所述细胞,以使表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞富集。
本文描述的一些实施方案涉及用于选择基因工程细胞的方法。所述方法包括
ⅰ)导入至少两种可操作用于在细胞中表达的两部分核苷酸序列,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞在所选培养条件下不能存活和/或增殖的水平,
其中所述第一两部分核苷酸序列包含编码允许存活和/或增殖的蛋白的第一部分的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,
其中所述第二两部分核苷酸序列包含编码允许存活和/或增殖的蛋白的第二部分的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,
其中所述蛋白的所述部分在所述细胞中共表达时可以形成功能性蛋白;
ⅱ)在允许富集表达所述至少两种两部分核苷酸序列的第一部分和第二部分核苷酸序列两者的细胞的体外增殖条件下培养所述细胞。
一些实施方案示于图33中。这些实施方案的新颖方面包括:
·TCR和CAR的应用
·在T细胞中的使用
·与TCR基因座的位点特异性整合一起使用
·用于癌症治疗
本文所述的一些实施方案涉及T细胞,其包括ⅰ)在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平的内源性DHFR,和ⅱ)至少两种核苷酸序列,包括包含编码与第一结合结构域融合的氨甲蝶呤抗性DHFR蛋白的非功能部分的核苷酸序列的第一核苷酸和包含编码与第二结合结构域融合的氨甲蝶呤抗性DHFR蛋白的非功能部分的核苷酸序列的第二核苷酸,使得当表达两种核苷酸时,存在功能性氨甲蝶呤抗性DHFR并能够促进含有第一核苷酸和第二核苷酸两者的细胞的选择。
本文描述的一些实施方案涉及用于选择基因工程细胞的方法。所述方法包括
ⅰ)导入至少两种可操作用于在细胞中表达的两部分核苷酸序列,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞在所选培养条件下不能存活和/或增殖的水平,
其中所述第一两部分核苷酸序列包含编码融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述融合蛋白包含与允许存活和/或增殖的蛋白的第一非功能部分融合的第一结合结构域,
其中所述第二两部分核苷酸序列包含编码融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述融合蛋白包含与允许存活和/或增殖的蛋白的第二非功能部分融合的第二结合结构域,
其中所述第一结合结构域和第二结合结构域能够在所述细胞中彼此结合,
其中所述蛋白的第一非功能部分和第二非功能部分在所述细胞中共表达时可以形成功能性蛋白;
ⅱ)在允许富集表达所述至少两种两部分核苷酸序列的第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的体外增殖条件下培养所述细胞。
本文所述的一些实施方案涉及用于恢复拆分成多个非功能部分的DHFR蛋白的功能的结合结构域。当结合结构域与DHFR蛋白的互补非功能部分融合时,可以恢复DHFR蛋白的功能。结合结构域可以是天然结合结构域、不与天然蛋白相互作用的工程化结合结构域或诱导性结合结构域。
本文描述的一些实施方案涉及用于选择或富集基因工程细胞的方法。应当理解,术语“选择”和“富集”是指细胞群中所需基因工程细胞的总增加比率。因此,这可以包括,例如,增加基因工程细胞的总数量,减少群体中存在的任何其他细胞的数量,纯化基因工程细胞,它们的任何组合,和其他类似的方法。
在一些实施方案中,所述方法包括将至少一种能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者的两部分核苷酸序列导入细胞。在一些实施方案中,所述细胞具有存活和/或增殖必需的蛋白,所述蛋白被降低到所述细胞在正常细胞培养基中不能存活和/或增殖的水平。所述至少一种两部分核苷酸序列可操作用于在细胞中表达,或者当插入靶基因组中的预定位点时变得可操作用于表达,并且所述至少一种两部分核苷酸序列包括编码存活和/或增殖所必需的蛋白或其变体的第一部分核苷酸序列,和编码待表达蛋白的第二部分核苷酸序列。第二部分核苷酸序列编码目的蛋白。所述方法还包括在没有用于选择或富集表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的药理学外源选择压力的正常细胞培养基中培养所述细胞。
在一些实施方案中,所述方法包括将至少一种对细胞的存活和/或增殖起作用和/或必需的第一蛋白的水平降低到所述细胞在正常体外繁殖条件下不能存活和/或增殖的水平,向细胞中导入至少一种两部分核苷酸序列,所述序列能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者,并且包含编码第一蛋白或其变体的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列。
本领域技术人员将理解,“必需的(essential)”蛋白可以是影响在特定细胞中的生长、复制、细胞周期、基因调控(包括DNA修复、转录、翻译和复制)、应激反应、代谢、凋亡、营养获取、蛋白更新(protein turnover)、细胞表面完整性、必需酶活性、存活或它们的任何组合的任何蛋白。
在一些实施方案中,必需的蛋白的水平的降低是永久性的。在一些实施方案中,必需的蛋白的水平的降低是暂时性的,或者是非永久性的。在一些实施方案中,必需的蛋白的水平的降低是可诱导的。在一些实施方案中,必需的蛋白的水平的降低在单个细胞周期时间段内影响细胞的存活和/或增殖。在一些实施方案中,必需的蛋白的水平的降低影响细胞存活和/或增殖至少约1分钟、至少约10分钟、至少约30分钟、至少约60分钟、至少约2小时、至少约5小时、至少约10小时、至少约20小时、至少约1天、至少约2天、至少约4天、至少约1周、至少约2周、至少约1个月或至少约2个月的时间段。在一些实施方案中,必需的蛋白的水平的降低导致增殖的完全停止(complete halt)。必需的蛋白的水平的降低导致增殖的部分停止(partial halt)。在一些实施方案中,增殖停止至少约5%、至少约10%、至少约20%、至少约30%、至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%。在一些实施方案中,必需的蛋白的水平的降低导致细胞完全死亡。在一些实施方案中,必需的蛋白的水平的降低引发群体中所有细胞的细胞死亡。必需的蛋白的水平的降低引发群体中某些细胞的死亡。在一些实施方案中,细胞群中的细胞死亡(或降低的存活率)增加了至少约5%、至少约10%、至少约20%、至少约30%、至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%。在一些实施方案中,必需的蛋白的水平的降低包括敲除(knock-out)编码必需蛋白的基因。在一些实施方案中,必需的蛋白的水平的降低包括敲低(knock-down)编码必需的蛋白的基因。在一些实施方案中,必需的蛋白的水平的降低包括敲入(knock-in)能够抑制必需的蛋白的基因。在一些实施方案中,敲除和/或敲低由CRISPR核糖核蛋白(CRISPR Ribonucleoprotein,RNP)、TALEN、MegaTAL或任何其他核酸酶介导。在一些实施方案中,瞬时抑制是通过siRNA、miRNA或CRISPR干扰(CRISPRi)实现的。本领域技术人员应当理解,敲除、敲低和其他降低蛋白水平的方法可以使用任何常规方法进行,包括限制性酶和选择盒(selection cassette)、选择性转录抑制、选择性翻译抑制和驱动蛋白靶向降解。在一些实施方案中,必需的蛋白的水平的降低包括RNA水平上必需的蛋白的水平的短暂降低。在一些实施方案中,必需的蛋白的RNA减少了至少约5%、至少约10%、至少约20%、至少约30%、至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%。在一些实施方案中,所述细胞是T细胞、NK细胞、NKT细胞、iNKT细胞、造血干细胞、间充质干细胞、iPSC、神经前体细胞、视网膜基因治疗中的细胞类型或任何其他细胞。
在一些实施方案中,所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且所述第二部分蛋白是目的蛋白。在一些实施方案中,改变第一部分核苷酸序列的核苷酸序列以获得核酸酶、siRNA、miRNA或CRISPRi抗性。在一些实施方案中,改变第一部分核苷酸序列的核苷酸序列以实现至少约5%、至少约10%、至少约20%、至少约30%、至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约100%的核酸酶、siRNA、miRNA或CRISPRi抗性。在一些实施方案中,所述第一部分核苷酸序列编码具有与必需的第一蛋白相同的氨基酸序列的蛋白。在一些实施方案中,第一部分核苷酸序列编码具有与必需的第一蛋白至少约5%、至少约10%、至少约20%、至少约30%、至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的氨基酸序列的蛋白。在一些实施方案中,改变第一部分核苷酸序列以编码改变的蛋白,该改变的蛋白不具有与第一蛋白相同的氨基酸序列。在一些实施方案中,改变的蛋白具有第一蛋白不具有的特定特征。在一些实施方案中,特定特征包括但不限于以下一种或多种:活性降低、活性增加和半衰期改变。在一些实施方案中,与第一蛋白相比,改变的蛋白的活性改变至少约5%、至少约10%、至少约20%、至少约30%、至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%。在一些实施方案中,与第一蛋白相比,改变的蛋白的半衰期缩短。在一些实施方案中,与第一蛋白相比,改变的蛋白的半衰期延长。在一些实施方案中,与第一蛋白相比,改变的蛋白的半衰期延长或缩短至少约1.5倍、至少约2倍、至少约5倍、至少约10倍、至少约20倍、至少约50倍或至少约100倍。在一些实施方案中,第一部分核苷酸序列和第二部分核苷酸序列两者都由同一启动子驱动。在一些实施方案中,第一部分核苷酸序列和第二部分核苷酸序列由不同的启动子驱动。第二部分核苷酸序列包含至少一种治疗基因。
本领域技术人员将理解,“治疗性(therapeutic)”基因或蛋白可以是可用于治疗、预防(prevention)、预防性治疗(prophylaxis)、缓解(palliation)、改善或治愈任何疾病或病症的任何基因或蛋白。
在一些实施方案中,第二部分核苷酸序列编码包含TCRα链和TCRβ链的新生抗原T细胞受体复合物(TCR)。在一些实施方案中,必需的蛋白或第一蛋白是二氢叶酸还原酶(DHFR)、肌苷一磷酸脱氢酶2(IMPDH2)、O-6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)、脱氧胞苷激酶(DCK)、次黄嘌呤磷酸核糖转移酶1(HPRT1)、白细胞介素2受体亚单位γ(IL2RG)、肌动蛋白β(ACTB)、真核翻译延伸因子1α1(EEF1A1)、甘油醛-3-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶1(PGK1)或转铁蛋白受体(TFRC)。在一些实施方案中,第一部分核苷酸序列包含核酸酶抗性或siRNA抗性DHFR基因,并且第二部分核苷酸序列包含TRA基因和TRB基因。在一些实施方案中,第一部分核苷酸序列包含核酸酶抗性或siRNA抗性DHFR基因,并且第二部分核苷酸序列包含TRA基因和TRB基因。在一些实施方案中,TRA基因、TRB基因和DHFR基因由至少一种接头隔开。在一些实施方案中,所述至少一种接头是至少一种自切割2A肽和/或至少一种IRES元件。在一些实施方案中,DHFR基因、TRA基因和TRB基因由内源性TCR启动子或任何其他合适的启动子驱动,所述启动子包括但不限于以下启动子:TRAC、TRBC1/2、DHFR、EEF1A1、ACTB、B2M、CD52、CD2、CD3G、CD3D、CD3E、LCK、LAT、PTPRC、IL2RG、ITGB2、TGFBR2、PDCD1、CTLA4、FAS、TNFRSF1A(TNFR1)、TNFRSF10B(TRAILR2)、ADORA2A、BTLA、CD200R1、LAG3、TIGIT、HAVCR2(TIM3)、VSIR(VISTA)、IL10RA、IL4RA、EIF4A1、FTH1、FTL、HSPA5和PGK1。在一些实施方案中,所述两部分核苷酸序列被整合到细胞的基因组中。在一些实施方案中,所述至少一种两部分核苷酸序列在插入靶基因组中的预定位点时,变得可操作用于表达,并且所述第一部分核苷酸序列和第二部分核苷酸序列均由靶基因组中的启动子驱动。在一些实施方案中,所述整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。在一些实施方案中,所述核酸酶介导的位点特异性整合是通过CRISPRRNP,任选地通过CRISPR/Cas9 RNP实现的。在一些实施方案中,所述方法还包括在没有药理学外源选择压力的正常体外增殖条件下培养细胞以富集表达第一蛋白和第二蛋白两者的细胞。
本领域技术人员应当理解,“正常的体外繁殖条件”包括其中细胞、细胞系或组织样品可被保持的典型条件,但其不包括为了驱动(drive)本文提供的方法而有意省略或添加的变量(例如过程或成分)。
在一些实施方案中,所述方法还包括使用断裂蛋白内含肽系统(Split inteinsystem)。在一些实施方案中,导入的两部分核苷酸序列未被整合到细胞的基因组中。在一些实施方案中,将靶向内源性TCR恒定基因座的CRISPR RNP、编码核酸酶抗性DHFR基因的第一部分核苷酸序列和编码新生抗原TCR的第二部分核苷酸序列递送至细胞。在一些实施方案中,内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。在一些实施方案中,内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。在一些实施方案中,内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。在一些实施方案中,第二CRISPR RNP是为了敲入切割TRAC基因座用于敲入的TRAC RNP。在一些实施方案中,CRISPR RNP是CRISPR/Cas9 RNP。在一些实施方案中,正常细胞培养基是适于未修饰细胞的生长和/或增殖的培养基。在一些实施方案中,正常细胞培养基没有任何外源选择压力。在一些实施方案中,使用CRISPR RNP将第二种两部分核苷酸敲入靶基因组中的预定位点,可选地,其中靶基因组中的预定位点是B2M基因。
在一些实施方案中,所述方法包括将至少一种能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列的两部分核苷酸序列导入细胞。所述细胞具有存活和/或增殖必需的蛋白的功能活性,所述功能活性被降低以至于所述细胞不能在正常细胞培养基中存活和/或增殖。所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且所述至少一种两部分核苷酸序列包含编码第一蛋白的第一部分核苷酸序列以及编码待表达的第二蛋白的第二部分核苷酸序列,所述第一蛋白提供与存活和/或增殖所必需的蛋白基本上等效的功能,所述第二蛋白是目的蛋白。所述方法还包括在含有至少一种导致富集或选择表达第一蛋白和第二蛋白两者的细胞的补充剂的细胞培养基中培养细胞。
在一些实施方案中,所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白的功能活性降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平,并将至少一种两部分核苷酸序列导入细胞,所述两部分核苷酸序列能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者,并且包括编码提供基本上等同的功能的第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列。所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且所述第二蛋白是目的蛋白。所述方法还包括在含有至少一种导致选择或富集表达第一蛋白和第二蛋白两者的细胞的补充剂的细胞培养基中培养细胞。
在一些实施方案中,所述细胞是T细胞、NK细胞、NKT细胞、iNKT细胞、造血干细胞、间充质干细胞、iPSC、神经前体细胞、视网膜基因治疗中的细胞类型或任何其他细胞。在一些实施方案中,所述细胞是哺乳动物。在一些实施方案中,所述细胞是大鼠或小鼠。在一些实施方案中,所述细胞是人。在一些实施方案中,所述细胞来自已建成的或标准的细胞系。在一些实施方案中,所述细胞来自原代组织或原代细胞。在一些实施方案中,第一部分核苷酸序列的核苷酸序列被改变以获得核酸酶、siRNA、miRNA或CRISPRi抗性,并且或者a)编码具有与第一蛋白相同的氨基酸序列的蛋白,或者b)编码相对于第一蛋白具有调整的功能(adjusted functionality)的蛋白。在一些实施方案中,第一部分核苷酸序列被改变以编码改变的蛋白,所述改变的蛋白具有与第一蛋白不同的氨基酸序列。在一些实施方案中,第一部分核苷酸序列编码具有与第一蛋白至少约5%、至少约10%、至少约20%、至少约30%、至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的氨基酸序列的蛋白。在一些实施方案中,改变的蛋白具有第一蛋白不具有的特定特征。所述特定特征包括但不限于以下一项或多项:活性降低、活性增加、对小分子抑制的半衰期抗性改变以及结合小分子后活性增加。在一些实施方案中,与第一蛋白相比,改变的蛋白的活性改变至少约5%、至少约10%、至少约20%、至少约30%、至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%。在一些实施方案中,与第一蛋白相比,改变的蛋白的半衰期缩短。在一些实施方案中,与第一蛋白相比,改变的蛋白的半衰期延长。在一些实施方案中,与第一蛋白相比,改变的蛋白的半衰期延长或缩短至少约1.5倍、至少约2倍、至少约5倍、至少约10倍、至少约20倍、至少约50倍或至少约100倍。在一些实施方案中,第一部分核苷酸序列和第二部分核苷酸序列两者都由同一启动子驱动。在一些实施方案中,第一部分核苷酸序列和第二部分核苷酸序列由不同的启动子驱动。在一些实施方案中,第二部分核苷酸序列包含至少一种治疗基因。在一些实施方案中,第二部分核苷酸序列编码含有TCRα链和TCRβ链的新生抗原T细胞受体复合物(TCR)。在一些实施方案中,必需的蛋白或第一蛋白是二氢叶酸还原酶(DHFR)、肌苷一磷酸脱氢酶2(IMPDH2)、O-6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)、脱氧胞苷激酶(DCK)、次黄嘌呤磷酸核糖基转移酶1(HPRT1)、白细胞介素2受体亚单位γ(IL2RG)、肌动蛋白β(ACTB)、真核翻译延伸因子1α1(EEF1A1)、甘油醛-3-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶1(PGK1)或转铁蛋白受体(TFRC)。在一些实施方案中,第一部分核苷酸序列包含蛋白抑制剂抗性DHFR基因,第二部分核苷酸序列包含TRA基因和TRB基因。在一些实施方案中,TRA基因、TRB基因和DHFR基因被可操作地配置为从一个开放阅读框中表达。TRA基因、TRB基因和DHFR基因在两个或三个开放阅读框中表达。在一些实施方案中,TRA基因、TRB基因和DHFR基因由至少一种接头隔开。在一些实施方案中,TRA基因、TRB基因和DHFR基因由两种接头隔开。在一些实施方案中,至少一种接头、TRA基因、TRB基因和DHFR基因的顺序如下:TRA-接头-TRB-接头-DHFR、TRA-接头-DHFR-接头-TRB、TRB-接头-TRA-接头-DHFR、TRB-接头-DHFR-接头-TRA、DHFR-接头-TRA-接头-TRB或DHFR-接头-TRB-接头-TRA。在一些实施方案中,至少一种接头是至少一种自切割2A肽和/或至少一种IRES元件。在一些实施方案中,DHFR基因、TRA基因和TRB基因由内源性TCR启动子或任何其他合适的启动子驱动,所述启动子包括但不限于以下启动子:TRAC、TRBC1/2、DHFR、EEF1A1、ACTB、B2M、CD52、CD2、CD3G、CD3D、CD3E、LCK、LAT、PTPRC、IL2RG、ITGB2、TGFBR2、PDCD1、CTLA4、FAS、TNFRSF1A(TNFR1)、TNFRSF10B(TRAILR2)、ADORA2A、BTLA、CD200R1、LAG3、TIGIT、HAVCR2(TIM3)、VSIR(VISTA)、IL10RA、IL4RA、EIF4A1、FTH1、FTL、HSPA5和PGK1。在一些实施方案中,两部分核苷酸序列被整合到细胞的基因组中。在一些实施方案中,两部分核苷酸序列未被整合到细胞的基因组中。在一些实施方案中,两部分核苷酸序列未被整合到细胞的基因组中,而是由细胞通过至少一个质粒表达。在一些实施方案中,两部分核苷酸序列被整合到细胞的核基因组中。两部分核苷酸序列被整合到细胞的线粒体基因组中。在一些实施方案中,至少一种两部分核苷酸序列在插入靶基因组中的预定位点时,变得可操作用于表达,并且第一部分核苷酸序列和第二部分核苷酸序列两者均由靶基因组中的启动子驱动。在一些实施方案中,整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。在一些实施方案中,核酸酶介导的位点特异性整合是通过CRISPR RNP,任选地通过CRISPR/Cas9 RNP实现的。在一些实施方案中,所述方法还包括使用断裂蛋白内含肽系统。在一些实施方案中,将靶向内源性TCR恒定基因座的CRISPR RNP、编码蛋白抑制剂抗性DHFR基因的第一部分核苷酸序列和编码新生抗原TCR的第二部分核苷酸序列递送至细胞。在一些实施方案中,内源性TCR基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。在一些实施方案中,通过电穿孔或基于机械或化学膜透化(chemical membrane permeabilization)的方法进行递送。在一些实施方案中,CRISPR RNP是切割TRAC基因座用于敲入的TRAC RNP。在一些实施方案中,CRISPR RNP是CRISPR/Cas9 RNP。在一些实施方案中,其中导致所述细胞的富集或选择的补充剂是允许通过流式细胞术或磁珠富集来富集细胞的抗体。在一些实施方案中,所述导致细胞的富集或选择的补充剂是允许通过流式细胞术或磁珠富集来富集细胞的抗体。在一些实施方案中,第一蛋白介导细胞对补充剂介导的细胞存活和/或增殖损害的抗性。在一些实施方案中,所述补充剂是氨甲蝶呤。在一些实施方案中,第一蛋白是氨甲蝶呤抗性DHFR突变蛋白。
在一些实施方案中,所述方法包括将至少两种能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者的两部分核苷酸序列导入细胞。所述细胞具有存活和/或增殖必需的蛋白,所述存活和/或增殖必需的蛋白被抑制到所述细胞不能存活和/或增殖的水平,并且所述第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码第一目的蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码第二目的蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。当第一融合蛋白和第二融合蛋白两者在细胞中一起表达时,存活和/或增殖必需的蛋白的功能得到恢复。所述方法还包括在导致选择表达第一两部分核苷酸序列和第二两部分核苷酸序列两者的细胞的条件下培养细胞。
在一些实施方案中,所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白抑制到细胞在正常体外繁殖条件下不能存活和/或增殖的水平,并导入至少两种能够在细胞中表达的两部分核苷酸序列。第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码第一目的蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。第二两部分核苷酸序列包括编码第二融合蛋白的第一部分核苷酸序列和编码第二目的蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,并且当所述第一融合蛋白和第二融合蛋白两者在细胞中一起表达时,所述存活和/或增殖必需的蛋白的功能得到复。所述方法还包括在导致表达第一融合蛋白和第二融合蛋白两者的细胞富集的体外增殖条件下培养细胞。
在一些实施方案中,所述方法包括导入至少一种可操作用于在细胞中表达的两部分核苷酸序列。所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,并且所述至少一种两部分核苷酸序列包括编码存活和/或增殖所必需的蛋白的第一部分核苷酸序列和编码待表达的蛋白的第二部分核苷酸序列。第二部分核苷酸序列编码对所述细胞而言是外源性的蛋白;以及在导致选择表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的条件下培养细胞。
在一些实施方案中,所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平,导入至少一种两部分核苷酸序列,所述两部分核苷酸序列可操作用于在细胞中表达并且包含编码第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列。第二部分蛋白对细胞而言是外源性的,并且在导致表达第一蛋白和第二蛋白两者的细胞富集的体外增殖条件下培养细胞。
在一些实施方案中,在至少约1分钟、至少约10分钟、至少约30分钟、至少约60分钟、至少约2小时、至少约5小时、至少约10小时、至少约20小时、至少约1天、至少约2天、至少约3天、至少约4天、至少约5天、至少约6天、至少约1周、至少约2周、至少约1个月或至少约2个月之后,测量细胞存活和/或增殖。在一些实施方案中,使存活和/或增殖所必需的至少第一蛋白的活性降低持续至少约1分钟、至少约10分钟、至少约30分钟、至少约60分钟、至少约2小时、至少约5小时、至少约10小时、至少约20小时、至少约1天、至少约2天、至少约3天、至少约4天,至少约5天、至少约6天、至少约1周、至少约2周、至少约1个月或至少约2个月。在一些实施方案中,使存活和/或增殖所必需的至少第一蛋白的活性永久性的降低。
本文描述的一些实施方案涉及根据本发明的任何方法制备的细胞。
本文所述的一些实施方案涉及用于富集基因工程T细胞的方法。在一些实施方案中,所述方法包括通过在TRA或TRB启动子下游整合两部分核苷酸序列,将包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码T细胞受体复合物或嵌合抗原受体的第二部分核苷酸序列的两部分核苷酸序列导入T细胞,和在含有导致表达第一蛋白和第二种蛋白两者的细胞的富集的氨甲蝶呤的细胞培养基中培养细胞。
本文所述的一些实施方案涉及富集经工程改造以表达外源性T细胞受体基因的T细胞的方法。在一些实施方案中,所述方法包括使用第一CRISPR/Cas9 RNP将内源性TRBC基因从其基因座上敲除,使用第二CRISPR/Cas9 RNP将编码氨甲蝶呤抗性DHFR基因的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TRBC基因座。两种核苷酸序列可操作地连接,以使得能够由内源性TRBC启动子表达,和在含有导致表达治疗性TCR和氨甲蝶呤抗性DHFR基因两者的T细胞富集的氨甲蝶呤的细胞培养基中培养细胞。
在一些实施方案中,必需的蛋白是DHFR蛋白。在一些实施方案中,必需的蛋白是DHFR模拟物(mimic)或类似物(analog)。在一些实施方案中,必需的蛋白与DHFR蛋白或其部分是至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约100%相同的。在一些实施方案中,第一两部分核苷酸序列或第二两部分核苷酸序列的第二部分核苷酸序列对细胞而言是外源性的。在一些实施方案中,第一两部分核苷酸序列或第二两部分核苷酸序列的第二部分核苷酸序列是TCR。在一些实施方案中,第一结合结构域和/或第二结合结构域源自GCN4。在一些实施方案中,第一结合结构域和/或第二结合结构域源自GCN4模拟物或类似物。在一些实施方案中,第一结合结构域和/或第二结合结构域源自与GCN4至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约100%相同的序列。在一些实施方案中,第一结合结构域和/或第二结合结构域包括SEQ ID NO:24。在一些实施方案中,第一结合结构域和/或第二结合结构域包含与SEQ IDNO:24至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的序列。在一些实施方案中,第一融合蛋白和/或第二融合蛋白包含SEQ IDNO:39和/或SEQ ID NO:40。在一些实施方案中,第一融合蛋白和/或第二融合蛋白包含与SEQ ID NO:39和/或SEQ ID NO:40至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的序列。在一些实施方案中,第一融合蛋白和/或第二融合蛋白包含SEQ ID NO:35和/或SEQ ID NO:36。在一些实施方案中,第一融合蛋白和/或第二融合蛋白包含与SEQ ID NO:35和/或SEQ ID NO:36至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的序列。在一些实施方案中,第一融合蛋白和/或第二融合蛋白包含SEQ ID NO:37和/或SEQ ID NO:38。在一些实施方案中,第一融合蛋白和/或第二融合蛋白包含与SEQ ID NO:37和/或SEQ ID NO:38至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的序列。在一些实施方案中,第一融合蛋白和/或第二融合蛋白包含SEQ ID NO:62和/或SEQID NO:63。在一些实施方案中,第一融合蛋白和/或第二融合蛋白包含与SEQ ID NO:62和/或SEQ ID NO:63至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的序列。在一些实施方案中,第一结合结构域和第二结合结构域源自FKBP12。在一些实施方案中,第一结合结构域和第二结合结构域源自FKBP12类似物或模拟物。在一些实施方案中,FKBP12具有F36V突变。在一些实施方案中,第一结合结构域和第二结合结构域源自与FKBP12至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约100%相同的序列。在一些实施方案中,第一结合结构域和/或第二结合结构域包括SEQ ID NO:31。在一些实施方案中,第一结合结构域和/或第二结合结构域包含与SEQ ID NO:31至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的序列。在一些实施方案中,第一结合结构域和/或第二结合结构域源自JUN和/或FOS。在一些实施方案中,第一结合结构域和/或第二结合结构域源自JUN和/或FOS类似物或模拟物。在一些实施方案中,第一结合结构域和/或第二结合结构域源自与JUN和/或FOS至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约100%相同的序列。在一些实施方案中,第一结合结构域和/或第二结合结构域源自SEQ ID NO:26和/或SEQ ID NO:29。在一些实施方案中,第一结合结构域和/或第二结合结构域源自与SEQ ID NO:26和/或SEQ ID NO:29至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的序列。在一些实施方案中,第一结合结构域和/或第二结合结构域源自SEQ ID NO:27和/或SEQ ID NO:30。在一些实施方案中,第一结合结构域和/或第二结合结构域源自与SEQ ID NO:27和/或SEQ ID NO:30至少约50%、至少约75%、至少约80%、至少约90%、至少约95%、至少约99%或至少约100%相同的序列。在一些实施方案中,第一结合结构域和第二结合结构域具有互补突变,以保持相互之间的结合。在一些实施方案中,第一结合结构域和第二结合结构域都不结合天然结合配偶体。在一些实施方案中,其中第一结合结构域和第二结合结构域各具有3至7个互补突变。在一些实施方案中,第一结合结构域和第二结合结构域各具有3个互补突变。在一些实施方案中,第一结合结构域和第二结合结构域各具有4个互补突变。在一些实施方案中,至少两种两部分核苷酸序列被整合到细胞的基因组中。在一些实施方案中,至少两种两部分核苷酸序列未被整合到细胞的基因组中。在一些实施方案中,至少两种两部分核苷酸序列被整合到细胞的核基因组中。在一些实施方案中,至少两种两部分核苷酸序列被整合到细胞的线粒体基因组中。在一些实施方案中,至少两种两部分核苷酸序列不整合到细胞的基因组中,而是由细胞通过至少一个质粒表达。在一些实施方案中,至少两种两部分核苷酸序列在插入靶基因组中的预定位点时变得可操作用于表达,并且第一部分核苷酸序列和第二部分核苷酸序列都由靶基因组中的启动子驱动。在一些实施方案中,整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。在一些实施方案中,核酸酶介导的位点特异性整合是通过CRISPR RNP实现的。在一些实施方案中,通过靶向内源性TCR恒定基因座的CRISPR RNP将第一两部分核苷酸序列传递至细胞,第一种第一部分核苷酸序列编码DHFR蛋白的非功能部分,第一种第二部分核苷酸序列编码新生抗原TCR。在一些实施方案中,通过靶向内源性TCR恒定基因座的CRISPR RNP将第一两部分核苷酸序列传递至细胞,第一种第一部分核苷酸序列编码DHFR蛋白的非功能部分,第一种第二部分核苷酸序列编码新生抗原TCR。在一些实施方案中,第一种第一部分核苷酸序列和第二种第一部分核苷酸序列编码融合蛋白,融合蛋白包含当所述融合蛋白共表达时具有DHFR活性的DHFR蛋白的非功能部分。在一些实施方案中,内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。在一些实施方案中,除了TCR恒定基因座之外的内源性基因座是B2M基因座。在一些实施方案中,递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。在一些实施方案中,CRISPR RNP是CRISPR/Cas9 RNP。
在一些实施方案中,核酸酶使得框内外显子(in-frame exonic)整合到基因座中,以便由内源性启动子、内源性剪接位点和内源性终止信号表达。在一些实施方案中,核酸酶使得框内外显子整合到基因座中,以便由内源性启动子、内源性剪接位点和外源性终止信号表达。在一些实施方案中,这些实施方案可以是本文提供的任何实施方案的一部分。
在一些实施方案中,核酸酶使得能够内含子整合到基因座中,以便由内源性启动子、外源性剪接受体位点和外源性终止信号进行表达。在一些实施方案中,必需的蛋白或第一蛋白被拆分成至少两个单独的功能失调的蛋白部分(dysfunctional proteinportions),其中所述至少两个部分中的每一个均被融合到多聚化结构域,并且其中所述至少两个部分中的每一个均被整合到不同的两部分核苷酸序列中,以便选择其中表达所有不同的两部分核苷酸序列的细胞,可选地,其中必需的蛋白或第一蛋白的功能得到恢复。在一些实施方案中,所述必需的蛋白或第一蛋白被拆分成至少两个单独的功能失调的蛋白部分,其中所述至少两个部分中的每一个均被融合到多聚化结构域,并且其中所述至少两个部分中的每一个均被整合到不同的两部分核苷酸序列中,以便选择其中表达所有不同的两部分核苷酸序列的细胞,可选地,其中所述必需的蛋白或第一蛋白的功能得到部分恢复。所述必需的蛋白或第一蛋白被拆分成至少两个单独的功能失调的蛋白部分,其中所述至少两个部分中的每一个均与多聚化结构域融合,并且其中所述至少两个部分中的每一个均被整合到不同的两部分核苷酸序列中以便选择其中表达所有不同的两部分核苷酸序列的细胞,可选地,其中所述必需的蛋白或第一蛋白的功能恢复至其正常水平的至少约10%,至少约20%,至少约50%、至少约75%、至少约80%、至少约95%、至少约99%或至少约100%。在一些实施方案中,必需的蛋白或第一蛋白被拆分成功能失调的N-末端的一半蛋白(half)和C-末端的y一半蛋白,每一半蛋白与同源或异源二聚化蛋白配偶体(heterodimerizingprotein partner)或断裂蛋白内含肽(split intein)融合。在一些实施方案中,必需的蛋白或第一蛋白是DHFR蛋白。在一些实施方案中,必需的蛋白或第一蛋白是DHFR蛋白类似物或模拟物。在一些实施方案中,必需的蛋白或第一蛋白与DHFR蛋白至少约50%、至少约75%、至少约80%、至少约95%、至少约99%、或至少约100%相同。在一些实施方案中,同源二聚化蛋白(homodimerizing protein)是GCN4、FKBP12或它们的变体。在一些实施方案中,异源二聚化蛋白是Jun/Fos或它们的变体。在一些实施方案中,必需的蛋白的功能的恢复是诱导的。在一些实施方案中,必需的蛋白的功能的恢复是通过AP1903诱导的。在一些实施方案中,诱导必需的蛋白的功能恢复至少约5%、至少约10%、至少约20%、至少约50%、至少约75%、至少约80%、至少约95%、至少约99%或至少约100%。在一些实施方案中,培养步骤在氨甲蝶呤的存在下进行。在一些实施方案中,目的蛋白是T细胞受体。在一些实施方案中,T细胞受体对病毒或肿瘤抗原具有特异性。在一些实施方案中,肿瘤抗原是肿瘤新生抗原。在一些实施方案中,基因工程细胞是原代人T细胞。
本文所述的一些实施方案涉及T细胞。在一些实施方案中,所述T细胞包括在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平的内源性二氢叶酸还原酶(DHFR),和至少一种两部分核苷酸序列,所述至少一种两部分核苷酸序列包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
在一些实施方案中,T细胞包含内源性二氢叶酸还原酶(DHFR)的敲除,和至少一种两部分核苷酸序列,其包含编码DHFR蛋白或其变体的第一部分核苷酸序列,和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
在一些实施方案中,T细胞包含在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平的内源性二氢叶酸还原酶(DHFR),和至少两种两部分核苷酸序列。第一两部分核苷酸序列包含编码DHFR蛋白或其变体的非功能性或功能失调的部分的第一种第一部分核苷酸序列,和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第一种第二部分核苷酸序列。第二两部分核苷酸序列包含编码DHFR蛋白或其变体的非功能性或功能失调的部分的第二种第一部分核苷酸序列,和编码由内源性B2M启动子可操作地表达的目的蛋白的第二种第二部分核苷酸序列,并且其中所述细胞具有DHFR活性。
定义
在本说明书中,词语“包括(comprise)”或变体例如“含有(comprises)”或“包含(comprising)”将被理解为暗示包括所述的要素、整数或步骤,或一组要素、整数或步骤,但不排除任何其他一组、整数或步骤,或一组要素、整数或步骤。
提供以下术语和方法的解释以更好地描述本发明,并指导本领域普通技术人员实践本发明。单数形式的“一个(a)”、“一种(an)”和“该(the)”指一个或一个以上,除非上下文另有明确说明。例如,术语“包含一种核酸分子”包括单个或多个核酸分子,并且被认为等同于短语“包含至少一种核酸分子”。术语“或”是指所述备选要素的单个要素或两个以上要素的组合,除非上下文另有明确说明。如本文所用,“包括(comprises)”是指“包含(includes)”。因此,“包括A或B”是指“包括A、B或A和B”,而不排除其他要素。除非另有说明,否则当本定义可能与其他可能的定义不同时,以本文提供的定义为准。
除非另有说明,否则本文使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。本文提及的所有HUGO基因命名委员会(HUGOGene Nomenclature Committee,HGNC)标识符(ID)均通过引用全部并入本文。尽管与本文所述类似或等效的方法和材料可用于本发明的实践或测试中,但下文描述了合适的方法和材料。材料、方法和实施例仅是说明性的,而不是限制性的。
“T细胞受体”或“TCR”表示在T细胞或T淋巴细胞表面发现的分子,其识别以肽形式结合到主要组织相容性复合体(major histocompatibility complex,MHC)分子上的抗原。TCR由两条不同的蛋白链组成(即,它是一种异源二聚体(hetero dimer))。在人类中,95%的T细胞的TCR由阿尔法(α)链和贝塔(β)链组成(分别由TRA和TRB编码),而5%的T细胞的TCR由伽玛和德尔塔(γ/δ)链组成(分别由TRG和TRD编码)。这一比例在个体发育和疾病状态(如白血病)下会发生变化。它也因物种而异。每个TCR链由两个胞外结构域组成:可变(V)区和恒定(C)区。恒定区靠近细胞膜,后跟一个跨膜区和一个短的胞质尾区(cytoplasmictail),而可变区与肽/MHC复合物结合。TCRα链和TCRβ链的可变区都具有三个高变互补决定区(hypervariable complementarity determining region,CDR),表示为CDR1、CDR2和CDR3。在一些实施方案中,CDR3是主要的抗原识别区。在一些实施方案中,TCRα链基因包含V基因片段和J基因片段,而TCRβ链基因包含有助于TCR多样性的V基因片段、D基因片段和J基因片段。TCR的恒定区由短连接序列(short connecting sequence)组成,其中一个半胱氨酸残基形成二硫键,形成两条链之间的连接。
除其他特征外,T细胞还可通过表达指示功能或活化状态的标志物来表征,所述标志物包括但不限于CD4、CD8、CD25和CD69。在一些实施方案中,所述细胞是T细胞的特定亚群,例如CD4+或CD8+T细胞。在一些实施方案中,所述方法用于T细胞的特定亚群,例如CD4+或CD8+ T细胞。在一些实施方案中,所述方法用于产生T细胞的特定亚群,例如CD4+或CD8+T细胞的过程。在一些实施方案中,所述细胞被活化,例如,表达CD25或CD69。在一些实施方案中,所述方法用于被活化的细胞,例如表达CD25或CD69的细胞。在一些实施方案中,所述方法用于产生被活化的细胞的过程,所述细胞例如表达CD25或CD69。
术语“治疗性TCR”或“治疗性TCR基因”可以指介导所需功能的TCRα链和TCRβ链的特定组合,例如,能够促进宿主的免疫系统对抗疾病。治疗性TCR基因可通过噬菌体、酵母或T细胞展示系统从以重组TCR文库形式表达的体外突变的TCR链中选择。治疗性TCR基因可以是自体的,也可以是异体的。
根据本文所述的一些实施方案,术语“目的蛋白(protein of interest)”可以指除了对细胞的存活和/或增殖必需的蛋白之外要表达的任何蛋白。目的蛋白对细胞而言可能是外源性的。目的蛋白可以是由细胞天然表达但要过表达(overexpressed)的蛋白。蛋白可能用于治疗、诊断、研究或任何其他目的。目的蛋白的实例包括TCR、嵌合抗原受体、开关受体(switch receptor)、细胞因子、酶、生长因子、抗体及它们的修饰型(modifiedversions)。
“基因工程细胞”是指使用生物技术使其基因组成发生变化的细胞。此类变化包括物种边界内和跨物种边界的基因转移、新的天然基因或合成基因的导入或天然基因的去除,以产生改良的或新的生物体或生物体内改良的或新的功能。通过使用重组DNA方法分离和复制感兴趣的遗传物质或通过人工合成DNA获得新的DNA。可以将分离或合成的DNA在导入基因工程细胞之前进行修饰。
“基因工程T细胞”是指使用生物技术使其基因组成发生变化的T细胞。
当在蛋白或多肽的背景下使用时,“接头”是指连接两种蛋白、多肽、肽、结构域、区域(region)或基序(motif)的氨基酸序列,并且可以提供与两个亚结合结构域(sub-binding domain)的相互作用相容的间隔功能,使得所得多肽保持特定的功能或活性。在某些实施方案中,接头由约2至约35个氨基酸或2-35个氨基酸组成,例如约4至约20个氨基酸或4-20个氨基酸、约8至约15个氨基酸或8-15个氨基酸、约15至约25个氨基酸或15-25个氨基酸组成。在一些实施方案中,接头可以富含甘氨酸和/或丝氨酸氨基酸。
“内含肽(intein)”,也被称为“蛋白内含肽”,是能够连接相邻残基的一个或多个蛋白片段。在一些实施方案中,内含肽能够在蛋白剪接期间切除自身和/或连接前体多肽的剩余部分。在一些实施方案中,内含肽通过肽键与其他残基连接在一起。“拆分内含肽(Split intein)”是指前体蛋白的内含肽来自至少两个基因的情况。
术语“无功能的”是指没有活性或活性严重降低的分子、氨基酸、多个氨基酸(amino acids)、核苷酸、多个核苷酸(nucleotides)、结构域、蛋白片段、蛋白、RNA、RNA片段、DNA或DNA片段。
术语“功能障碍(dysfunctional)”是指分子、氨基酸、多个氨基酸(amino acids)、核苷酸、多个核苷酸(nucleotides)、结构域、蛋白片段、蛋白、RNA、RNA片段、DNA或DNA片段不能以预期或完全的方式起作用,并且可能具有或可能不具有异常活性。
如本文所用,术语“新生抗原(neo-antigen)”是指源自肿瘤特异性基因组突变(tumor-specific genomic mutation)的抗原。例如,新生抗原可以由非同义单核苷酸突变导致的肿瘤样品中突变蛋白的表达产生,或由突变诱导的移码(frame-shift)导致的替代开放阅读框的表达产生。因此,新生抗原可能与病理状况有关。在一些实施方案中,“突变的蛋白”是指包含至少一个与在标准氨基酸序列(canonical amino acid sequence)的相同位置中的氨基酸不同的氨基酸的蛋白。在一些实施方案中,突变的蛋白包括相对于标准氨基酸序列的插入、缺失、取代、读码框移动导致的氨基酸氨基酸的加入,或它们的任何组合。“PTM新生抗原”是指具有肿瘤特异性但不基于基因组突变的抗原。PTM新生抗原的例子包括磷酸新生抗原和聚糖新生抗原。
“CRISPR/Cas9”是一种使遗传学家和医学研究人员能够通过删除、添加或改变DNA序列的片段来编辑基因组部分的技术。CRISPR/Cas9系统由两种向DNA导入变化的关键分子组成:一种称为Cas9的酶,它充当一对“分子剪刀”,可以在基因组的特定位置剪切DNA的两条链,从而可以添加或删除DNA片段(bits);一段(piece)称为向导RNA(guide RNA,gRNA)的RNA,由位于较长RNA支架内的一小段预先设计的RNA序列(约长20个碱基)组成。支架部分(scaffold part)与DNA结合,预先设计的序列将Cas9“引导”到基因组的正确部分。这确保了Cas9酶在基因组的正确位置处进行切割。核糖核蛋白(RNP)是一种核糖核酸和RNA结合蛋白的复合物。本领域技术人员将认识到,除了Cas9之外的CRISPR系统可以等效地用于本文描述的各种实施方案中,并且当术语“CRISPR”用于指技术、系统或方法时,术语“CRISPR”指这种系统的种类。
CRISPR干扰(CRISPR interference,CRISPRi)是一种基因扰动(geneticperturbation)技术,允许对原核和真核细胞中的基因表达进行序列特异性抑制。
“TALEN”,或转录激活子样效应因子(Transcription activator-like effector)核酸酶是可以被设计为切割DNA特定序列的限制性酶。它们是通过将TAL效应子DNA结合结构域与DNA切割结构域(DNA cleavage domain)(切割DNA链的核酸酶)融合而制备的。转录激活子样效应因子(TALE)可以被设计成与几乎任何所需的DNA序列结合,因此当与核酸酶结合时,DNA可以在特定位置处被切割。
“MegaTAL”是一种单链稀有切割核酸酶系统(single-chain rare-cleavingnuclease system),其中转录激活子样(TAL)效应因子的DNA结合区用于寻址与单个所需基因组靶位点相邻的位点特异性兆核酸酶(site-specific meganuclease)。该系统允许产生极其活跃和超特异性的致密核酸酶(compact nucleases)。
“siRNA”小干扰RNA,有时被称为短干扰RNA或沉默RNA,是一类双链RNA非编码RNA分子,通常长度为20-27个碱基对,类似于miRNA,并在RNA干扰(RNAi)途径内运行(operating)。它通过在转录后降解mRNA,阻止翻译来干扰具有互补核苷酸序列的特定基因的表达。
“miRNA”(微RNA)是一种在植物、动物和一些病毒中发现的小型非编码RNA分子(含有约22个核苷酸),在RNA沉默和基因表达的转录后调控(post-transcriptionalregulation)中发挥作用。miRNA通过与mRNA分子内互补序列的碱基配对发挥作用。结果,这些mRNA分子被沉默。
各种实施方案
在一些实施方案中,本文提供的方法是用于富集基因工程细胞的选择方法。该方法可以包括:在至少一个编码细胞存活和/或增殖必需的蛋白的基因组位点处引入基因组敲除(genomic knock-out)。见图27A“敲除必需的基因”。所述方法还可以包括导入至少一个核苷酸序列,所述核苷酸序列可操作用于在细胞中表达并且至少编码细胞存活和/或增殖所必需的蛋白。
在一些实施方案中,在没有外源选择压力的情况下实现选择。“外源选择压力”是添加到正常培养基中的、允许选择细胞的补充剂。外源选择压力可以是抑制或激活蛋白或细胞过程的分子(例如,药物分子,例如氨甲蝶呤)、结合到细胞组分以允许对具有该组分的细胞与不具有该组分的细胞(例如,允许通过流式细胞术富集或磁珠富集的抗体)进行物理、光学或磁性分选的分子、或可添加到细胞培养基以不同程度地促进具有修饰的细胞与不具有修饰的细胞的增殖的分子。在一些优选的实施方案中,外源选择压力是药理学外源选择压力(例如,氨甲蝶呤)。在一些实施方案中,重新导入的基因在氨基酸序列上与被基因敲除的内源性基因相同但在核苷酸序列上改变以实现核酸酶抗性,从而使得避免使用突变蛋白,例如DHFR蛋白。在一些实施方案中,导入的核苷酸序列需要整合到细胞的基因组中(即对转基因的稳定表达的要求)。编码必需的蛋白的基因可以整合到目的基因座上。参见图27B“将必需的基因敲入到目的位点”。
在一些实施方案中,所述方法用于富集基因工程T细胞。所述方法包括引入核酸酶介导的T细胞内源性DHFR基因的敲除,并将编码T细胞受体α链、T细胞受体β链和DHFR的核苷酸序列导入T细胞基因组,其中T细胞受体α链、T细胞受体β链和DHFR均可操作地连接以同时表达。见图2。
在一些实施方案中,本文提供的任何选择方法均可用于富集其抗原特异性已被重定向用于细胞治疗的基因工程T细胞。在一些实施方案中,这可用于治疗实体癌的完全个性化的工程化TCR治疗。为此,可以将该方法纳入更多的方法(larger methods)中,以便在单独的患者的基础上从肿瘤活检中鉴定新生抗原特异性TCR基因。鉴定后,可以将此类新生抗原TCR基因通过任何技术导入患者T细胞,包括但不限于CRISPR核酸酶介导的基因敲入,从而将T细胞的抗原特异性重定向至肿瘤新生抗原。最后,可以通过静脉输注将经过基因工程改造的T细胞回输给患者。
为了获得最大的疗效,被回输给患者的大部分基因工程T细胞表达目的新生抗原特异性TCR基因是有用的。因为TCR基因敲入的效率通常在10-30%之间,所以选择方法是有用的,其可以在细胞输注(cell infusion)之前富集成功得到工程化的细胞。在一些实施方案中,这种选择方法可以利用TCR敲入所需的相同分子组分,这意味着T细胞制造过程不需要额外的实验步骤。这可以通过本文提供的各种实施方案中的一些实施方案来实现。
在一些实施方案中,所述策略也适用于富集具有特定基因的基因敲除的细胞,条件是导入用作选择标志物的内源性基因(例如DHFR)作为敲入基因。在一些实施方案中,CRISPR/Cas9核糖核蛋白(RNP)(或任何其他核酸酶,包括其他CRISPR系统)可用于敲除必需的内源性二氢叶酸还原酶(DHFR)基因。见图2上图。第二CRISPR/Cas9 RNP可用于将含有治疗性TCR基因和CRISPR/Cas9核酸酶抗性DHFR基因的构建体敲入内源性TCR基因座。见图2下图。因此,成功敲入TCR基因构建体的细胞将获得强于其他DHFR敲除细胞的存活优势,并在一段时间内变得富集。本文提供的一些实施方案可用于富集基因修饰的细胞,而不受(1)基因递送方法、(2)转基因的性质和(3)靶细胞类型的影响。DFHR参与的通路如图1所示。使用DHFR/氨甲蝶呤(MTX)选择进行多重扩增,以分离高产重组蛋白的克隆。DHFR是一种将叶酸转化为四氢叶酸的还原酶,四氢叶酸是从头核苷酸合成途径(de novo nucleotidesynthesis pathway)中用于细胞增殖的一种必需的前体。当DHFR被抑制时,如果没有额外的补充剂(次黄嘌呤和胸苷(HT)),细胞不能增殖。因此,DHFR选择系统提供了一个可以选择敲入细胞的点。基因构建体的一个实施方案示于图2中。在一些实施方案中,对于这种富集策略,可以敲除内源性DHFR并将其与治疗性转基因(TCRβ和TCRα)一起重新导入。DHFR敲除的细胞将停止增殖和/或死亡,只有重新导入DHFR的细胞(以及转基因TCRβ和TCRα)才能继续增殖和/或存活,从而将得到富集;重新导入的DHFR是核酸酶抗性的,但具有与野生型DHFR相同的氨基酸序列。对于图2中的实施方案,其允许在电穿孔期间共递送(co-deliver)3种组分:
1.TRAC RNP用于切割TRAC基因座以进行基因敲入(knockin)
2.DHFR RNP用于敲除内源性DHFR
3.线性dsDNA模板,包括1G4-TCR和sgRNA抗性DHFR。对于DHFR敲除细胞,只有伴有sgRNA抗性DHFR敲入的细胞才能在正常培养基中增殖。
如上所述,DHFR是在嘌呤核苷酸的合成过程中将二氢叶酸转化为四氢叶酸的必需酶(参见,例如,图1)。因此,DHFR敲除会抑制DNA合成和修复,并优先损害T细胞等高增殖细胞的生长。基于此,提供了本发明的基因编辑富集策略,其中,例如,可以用敲除/抑制内源性DHFR基因的CRISPR/Cas9 RNP复合物(或者,在替代方案中,任何其他相关系统)对细胞进行电穿孔。同时,用靶向内源性TCRα恒定(TRAC)基因的RNP复合物以及编码新生抗原TCR和核酸酶抗性DHFR基因的DNA修复模板对细胞进行电穿孔,所述基因包含RNP复合物不能结合的沉默突变。为确保核酸酶抗性DHFR基因始终与导入的TCR共表达,DNA修复模板可按以下顺序设计:TCRβ-2A-核酸酶抗性DHFR-2A-TCRα,因此可使用自切割2A肽从一个开放阅读框表达三种蛋白。
在一些实施方案中,在TRAC RNP和DNA修复模板电穿孔后10天,20%±10%的T细胞可显示导入的TCR基因的成功敲入。值得注意的是,例如,当DHFR RNP同时被电穿孔时,这可能增加到73%±12%的T细胞。这表明功能性DHFR对T细胞的存活是有用的,并且具有核酸酶抗性的DHFR基因的敲入可用于通过成功的TCR敲入来提高T细胞的频率(frequency),例如,在10天的培养期内提高~5倍(~5fold)。
如本文实施例所示,DHFR选择策略可有效富集敲入细胞。然而,用sgRNA敲除DHFR可以永久改变内源性DHFR基因座。此外,它还会导入非特定的脱靶编辑(off-targetediting)。在一些实施方案中,可以用siRNA替代sgRNA以瞬时抑制内源性DHFR表达,或在T细胞扩增期间用氨甲蝶呤(一种临床批准的DHFR抑制剂)替代sgRNA。
基于现有技术的几种选择系统可用于基因修饰细胞的富集。大多数系统依赖于基于与导入的转基因或导入的标志物(例如表面分子的截短突变体,如EGFR和LNGFR)结合的抗体对修饰细胞的选择。此类系统与所提出的方案有根本不同,因为所提出的方案需要专用的工艺步骤、试剂和/或设备来富集转基因细胞。
与基于基因修饰细胞的现有技术的选择系统相比,本发明的一些实施方案提供了显著的优点,包括以下的一种或多种:
1.无需导入外源基因序列以允许选择:与基于表面标志物(例如,截短的EGFR)、耐药性(例如,氨甲蝶呤)或抗生素抗性(例如,嘌呤霉素或杀稻瘟菌素)介导的选择的替代系统不同,除了转基因之外,没有外源性基因序列被导入细胞。在一些实施方案中,选择仅基于与转基因一起用未改变的氨基酸序列重新导入的必需内源基因的基因敲除。
2.不需要对基因工程细胞进行物理选择:与本领域的其他方法不同,本发明不需要抗体介导的富集(例如通过流式细胞术分选或磁珠富集)。通过在不表达转基因盒的细胞中缺失表达或必需基因的功能抑制来实现选择,而基因工程细胞的功能则由转基因盒恢复。
3.对细胞内源性蛋白的突变体没有要求:先前描述的基于DHFR的选择系统是基于氨甲蝶呤抗性DHFR突变体的产生和导入。DHFR突变体的修饰氨基酸序列具有潜在的免疫原性,可能促进过继转移(adoptive transfer)后的细胞排斥反应。此外,在T细胞的情况下,基因工程T细胞将对氨甲蝶呤产生耐药性。这是不可取的,因为氨甲蝶呤通常用于治疗自身免疫性疾病。不需要突变蛋白型(mutant protein version)极大地方便了该系统与除DHFR以外的其他必需基因的使用。原则上,本文提供的相关各种实施方案可以应用于对基因修饰细胞的存活是必需的任何基因。
4.转基因丢失(transgene loss)的风险降低:由于维持细胞存活的转基因表达的选择性压力(因为表达转基因是实现必需的蛋白或抗性蛋白表达所必需的),可以想象,转基因表达的丢失,例如通过启动子沉默,可能会减少。
5.与复杂的遗传有效负荷相容(genetic payload):本公开的发明使得能够富集从一个基因座表达三种外源导入的蛋白(TCRα、TCRβ和DHFR)的细胞。值得注意的是,可以理解,通过使用额外的2A肽序列或IRES元件可以共富集更多蛋白的表达。此外,本发明允许选择用共发生的基因工程事件修饰的基因工程细胞,例如表达两种两部分核苷酸序列(每个序列都可以编码多个外源导入的蛋白。)
如本文所述,一些实施方案可以具有少于所有五个所述优点(例如,这些优点中的一个、两个、三个或四个)。例如,(1)在内源性DHFR被敲除的实施方案中,敲入的DHFR可以是野生型DHFR,(2)在内源性DHFR被氨甲蝶呤抑制的实施方案中,可以使用氨甲蝶呤抗性的DHFR或断裂-DHFR,同时用来自同一基因座的外源性表达元件维持选择压力。这些实施方案和优点的集合中的每一个都与本发明的各种实施方案一致,并反映在本发明的各种实施方案中。本领域技术人员将会理解,本发明提供了多种多样的发明,而且并非一项发明的所有要素对于其他发明都是必需的。因此,并非本文公开的所有(或必然任何)发明都必然具有一个或多个上述实施方案。本领域的技术人员将能够鉴于本发明、他们的知识和/或为本发明本身提供的特定要素的情况下确定哪些发明将具有上述优点。
在一些实施方案中,可以采用使用siRNA、shRNA、miRNA或CRISPR干扰(CRISPRi)的技术,结合表达包含siRNA、shRNA、miRNA或CRISPRi抗性DHFR基因变体的TCR基因构建体,来代替内源性基因组位点的永久性基因敲除。
在一些实施方案中,可以采用使用氨甲蝶呤(MTX)的内源性DHFR抑制,并结合表达含有MTX抗性DHFR基因的转基因盒,所述转基因盒被框内整合到基因座的外显子中以使得其能够由内源性启动子、内源性剪接位点和内源性终止信号表达。
在一些实施方案中,可以采用使用氨甲蝶呤(MTX)来抑制内源性DHFR,并结合表达包含MTX抗性DHFR基因变体的TCR基因构建体。
在一些实施方案中,选择原则适用于除DHFR以外的其他基因,条件是该基因对于细胞的存活和/或增殖是必需的。
在一些实施方案中,内源性DHFR被核酸酶敲除或敲低(knocked down);选择原则适用于任何其他治疗基因,只要所述治疗基因与重新导入抗核酸酶的DHFR变体相结合即可。
在一些实施方案中,选择原则也适用于其他细胞类型,例如造血干细胞、间充质干细胞、iPSC、神经前体细胞、成纤维细胞、B细胞、NK细胞、单核细胞、巨噬细胞、树突状细胞、视网膜基因治疗中的细胞类型等。
在一些实施方案中,除了通过HDR的核酸酶介导的位点特异性整合外,还可以用其他方式传递转基因,即转座子介导的基因递送、显微注射、脂质体/纳米颗粒介导的基因转移、病毒介导的基因递送、电穿孔或基于机械或化学膜透化的方法。
在一些实施方案中,恢复被抑制的功能或提供对选择性压力的抗性的蛋白可以ⅰ)拆分成可以在细胞内可操作地组合的两个或多个部分,且ⅱ)每个部分均与转基因盒连接,以便允许选择已经成功地同时用所有转基因盒工程化的细胞。在一些实施方案中,恢复被抑制功能的蛋白可以融合到二聚化结构域。在一些实施方案中,二聚化结构域可以源自GCN4、Fos、Jun或FKBP12蛋白。在一些实施方案中,可以使用亮氨酸拉链基序来实现二聚化。在一些实施方案中,可以通过使用断裂蛋白内含肽蛋白来实现二聚化。在一些实施方案中,二聚化结构域可以被修饰(例如,具有对氨基酸序列的改变),以减少或防止与内源性蛋白的二聚化,促进与外源蛋白的二聚化和/或结合。在一些实施方案中,二聚化结构域可以被修饰(例如,具有对氨基酸序列的改变)以添加、去除和/或修饰二聚化结构域的特征(例如,可诱导的二聚化)。
在一些实施方案中,可以采用转基因盒的不同设计,例如,六种不同的取向:
外源性蛋白1-2A-外源性蛋白2-2A-选择优势蛋白
外源性蛋白1-2A-选择优势蛋白-2A-外源性蛋白2
外源性蛋白2-2A-外源性蛋白1-2A-选择优势蛋白
外源性蛋白2-2A-选择优势蛋白-2A-外源性蛋白1
选择优势蛋白-2A-外源性蛋白1-2A-外源性蛋白2
选择优势蛋白-2A-外源性蛋白2-2A-外源性蛋白1
(基于任何2A元件)
在一些实施方案中,可以采用转基因盒的不同设计,例如6种不同取向的TCRa、TCRb和DHFR:
TCRa-2A-TCRb-2A-DHFR
TCRa-2A-DHFR-2A-TCRb
TCRb-2A-TCRa-2A-DHFR
TCRb-2A-DHFR-2A-TCRa
DHFR-2A-TCRa-2A-TCRb
DHFR-2A-TCRb-2A-TCRa
(基于任何2A元件)
在一些实施方案中,两部分核苷酸序列被框内整合到基因座的外显子中,以使得能够由内源性启动子、内源性剪接位点和内源性终止信号表达。
在一些实施方案中,两部分核苷酸序列与其自身的外源性启动子整合在一起,所述启动子使得能够表达第一蛋白、第二蛋白或两者。
在一些实施方案中,TCRa-链和TCRb-链将由内源性TCR启动子驱动,而DHFR蛋白将由外源性诱导的启动子驱动,并且转基因盒具有以下设计之一:
TCRa-2A-TCRb-pA-启动子-DHFR-pA
TCRb-2A-TCRa-pA-启动子-DHFR-pA
TCRa-2A-TCRb-pA-启动子-DHFR-2A(使用内源性TRAC pA)
TCRb-2A-TCRa-pA-启动子-DHFR-2A(使用内源性TRAC pA)
至少两部分核苷酸序列的元件可以由相同或不同的启动子表达。在一些实施方案中,元件由相同的启动子表达,并通过基因接头(使得每个元件单独表达为蛋白)或通过蛋白接头(使得连接的元件表达为单个蛋白,其在翻译后可以被切割或不被切割)连接。基因接头的一个例子是IRES元件。蛋白接头的例子包括2A或甘氨酸-丝氨酸(gly-ser)接头。蛋白也可以表达为元件之间没有任何接头的融合蛋白。
在一些实施方案中,本文提供的任何方法可包括用于富集基因修饰的T细胞的用途。在这些T细胞中,必需的蛋白被抑制,因此细胞不能存活或增殖,除非编码相同的必需的蛋白或其变体的基因工程核苷酸被重新导入到这些细胞中。成功重新导入必需的蛋白的T细胞将比其他敲除细胞获得更强的存活优势,并在一段时间内变得富集。这包括(1)导入任何转基因,包括T细胞受体和嵌合抗原受体以及外源基因,以改变T细胞的表型和/或功能(如显性阴性TGFβ受体、开关受体等)和/或(2)使用任何T细胞亚群(初始T细胞(
Figure BDA0004167204860000471
Tcell)、记忆T细胞、肿瘤浸润淋巴细胞(TIL)等)。
在一些实施方案中,所述方法一般适用于将广泛的转基因递送到不同的细胞类型中。它适用于富集广泛的基因修饰(基因敲除、敲入等),条件是用作选择标志物的内源基因被重新导入到细胞中。
在一些实施方案中,本文提供的方法提供以下的一项或多项:
一种用于富集经CRISPR核酸酶基因编辑的表达治疗性TCR或CAR基因的T细胞的方案,
一种用于富集基因工程T细胞的方案,
一种允许在不使用抗体的情况下进行选择的方法,
一种允许递送复杂和多种转基因的方法。
在一些实施方案中,本文提供的任何方法可用于富集除肿瘤学(oncology)以外的所有治疗领域中的基因工程细胞,例如巴思综合征、β-珠蛋白生成障碍性贫血、囊性纤维化、进行性假肥大性肌营养不良、血友病、镰状细胞病、自身免疫和感染性疾病。
在一些实施方案中,本方法不需要使用载体来表达核酸酶和sgRNA。在一些实施方案中,可以使用核糖核蛋白复合物(核酸酶蛋白+向导RNA)代替DNA载体。
在一些实施方案中,这种方法可能仅导致核酸酶和sgRNA的暂时表达。这可以避免在基因组中的永久整合,使得避免1)随机整合,其可以导致基因破坏和2)核酸酶的连续表达,该核酸酶可能对细胞具有免疫原性或毒性。
在一些实施方案中,两部分核苷酸序列通过质粒介导的、转座子介导的或病毒介导的随机基因组整合而在细胞中表达。在一些实施方案中,两部分核苷酸序列通过靶向位点特异性整合(targeted site-specific integration)到细胞基因组中来表达。在一些实施方案中,通过DNA断裂的同源性导向修复实现靶向位点特异性整合。这可能是理想的,因为质粒或病毒可以随机整合到靶细胞的基因组中。在一些实施方案中,两部分核苷酸序列是线性双链DNA、单链DNA、纳米质粒、腺相关病毒(adeno-associated virus,AAV)或任何其他适合同源定向修复的病毒、环状、线性模板。线性双链DNA可以是开放末端的,也可以是封闭末端的。
在一些实施方案中,所述方法不使用单独的启动子来驱动转基因和货物表达(cargo expression),因为本修复模板将整合到基因组的特定位点,因此,内源性启动子将驱动它们的表达。
在一些实施方案中,本方法不一定需要核酸酶或碱基编辑器(base editor)。相反,siRNA、shRNA、miRNA或CRISPRi将发挥作用。
在一些实施方案中,本方法使用避免核酸酶永久整合的双载体系统。这可能是有用的,因为连续表达的核酸酶可能是有毒的。
在一些实施方案中,不需要使用两个启动子,一个启动子即可偶联(couple)转基因和拯救基因(rescue gene)的表达。在一些实施方案中,这可能是有益的,因为它降低了转基因丢失的可能性。
在一些实施方案中,本文的各种实施方案可以克服以下的一个或多个问题:解决基因敲入效率低(例如,低于20%)的T细胞供体,允许选择敲入细胞。一种更符合cGMP制造要求的方法。避免向细胞中添加抗生素选择标志物或将细胞暴露于其他抗体选择方法。
本文描述的一些实施方案涉及用于富集基因工程细胞的方法。所述方法可以包括:ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平。该方法可以还包括ⅱ)将至少一种两部分核苷酸序列导入细胞,所述两部分核苷酸序列可操作用于在细胞中表达并且包含编码第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中所述第二部分蛋白对细胞而言是外源性的,和ⅲ)在正常体外增殖条件下培养细胞以富集同时表达第一蛋白和第二蛋白的细胞。在一些实施方案中,步骤ⅲ)可以是在导致同时表达第一蛋白和第二蛋白的细胞富集的体外增殖条件下培养细胞。
在这些实施方案中,第一蛋白对于细胞的存活和/或增殖是必需的。必需的蛋白或第一蛋白可以是二氢叶酸还原酶(DHFR)、肌苷一磷酸脱氢酶2(IMPDH2)、O-6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)、脱氧胞苷激酶(DCK)、次黄嘌呤磷酸核糖基转移酶1(HPRT1)、白细胞介素2受体亚单位γ(IL2RG)、肌动蛋白β(ACTB)、真核翻译延伸因子1α1(EEF1A1)、甘油醛-3-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶1(PGK1)或转铁蛋白受体(TFRC)。必需的蛋白的活性可以在核苷酸或蛋白水平上被抑制。如果必需的蛋白的活性被抑制,则细胞不能再在正常的体外增殖条件下存活或增殖,除非在培养基中添加某种物质或将编码相同必需的蛋白的基因工程核苷酸重新导入到这些细胞中。例如,当DHFR被抑制时,如果没有额外的补充剂(次黄嘌呤和胸苷(HT)),或不能将有功能的DHFR重新导入到这些细胞中,细胞就不能增殖。
两部分核苷酸序列的第一部分编码必需的蛋白,其不仅具有改变的核苷酸或蛋白序列以使其能够抵抗用于抑制内源性必需的蛋白的活性的物质,而且还具有恢复细胞在选定的体外增殖条件下存活或增殖的能力。两部分核苷酸序列的第二部分编码第二蛋白,该蛋白对细胞而言是外源性的,并且可以具有治疗功能。例如,第二蛋白可以是含有TCRα链和TCRβ链的TCR复合物。图27B示出了两部分核苷酸序列的实例。
成功重新导入两部分核苷酸序列的细胞将表达必需的蛋白,并恢复细胞在选定的体外增殖条件下存活或增殖的能力,从而获得强于其他细胞的存活优势并在一段时间内富集。在一些实施方案中,核苷酸的第一部分和第二部分被配置为从一个开放阅读框中表达,使得它们在细胞中共表达。因此,富集的细胞可用于下游应用,如T细胞治疗。
本文所述的一些实施方案涉及当细胞具有被抑制的存活和/或增殖必需的蛋白时选择基因工程细胞的方法。所述方法可以包括ⅰ)导入至少一种可操作用于在细胞中表达的两部分核苷酸序列,其中所述细胞具有存活和/或增殖必需的蛋白,所述蛋白被抑制到所述细胞在所选培养条件下不能存活和/或增殖的水平,并且其中所述至少一种两部分核苷酸序列包括编码存活和/或增殖必需的蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,并且所述第二部分核苷酸序列编码对所述细胞而言是外源性的蛋白;所述方法可以还包括ⅱ)在导致选择表达第一部分和第二部分核苷酸序列的细胞的细胞培养条件下培养细胞。
在这些实施方案中,成功重新导入两部分核苷酸序列的细胞将获得强于其他细胞的存活优势,并在一定时间内富集。在一些实施方案中,在正常细胞培养基中选择工程化细胞是可能的。在一些实施方案中,正常细胞培养基是适于未修饰细胞生长和/或增殖的培养基。例如,用于T细胞的正常培养基是购自赛默飞世尔科技(Thermo Fisher Scientific)公司的RPMI 1640。
在一些实施方案中,正常细胞培养基没有外源选择压力,例如药物分子、抗体或允许通过流式细胞术或磁珠富集来富集细胞的任何特定补充剂。在一些实施方案中,基于向细胞培养基中添加导致外源选择压力的组分,工程化细胞的选择是可能的。在一些实施方案中,外源选择压力导致对细胞存活和/或增殖必需的蛋白的抑制。在一些实施方案中,外源选择压力基于向细胞培养基中添加氨甲蝶呤。
在一些实施方案中,活性降低可以是永久性的或暂时性的。在一些实施方案中,活性降低或抑制是通过细胞中必需的蛋白的量或水平的永久或瞬时降低来实现的。在一些实施方案中,蛋白的水平保持不变,但是蛋白的功能被降低或抑制。在一些实施方案中,活性降低或抑制是通过细胞功能活性的永久或瞬时降低来实现的,无论是否降低细胞中的蛋白水平。在一些实施方案中,活性降低或抑制通过细胞功能活性的永久或瞬时降低来实现,而不单独改变细胞中蛋白的水平。在永久的实施方案中,编码必需的蛋白的基因可以被敲除,这从细胞的基因组中永久地除去必需基因。在一些实施方案中,敲除是由CRISPR/Cas9核糖核蛋白(RNP)、TALEN、MegaTAL或任何其他核酸酶介导的。
在瞬时的实施方案中,可以瞬时抑制必需的蛋白的活性。在一些实施方案中,瞬时抑制是通过siRNA、miRNA或CRISPR干扰(CRISPRi)实现的,其中必需的蛋白的活性在RNA水平上受到抑制。在一些实施方案中,瞬时抑制是通过蛋白抑制剂,蛋白抑制剂在蛋白水平上抑制必需的蛋白的活性。一旦将siRNA、miRNA、CRISPR干扰(CRISPRi)或蛋白抑制剂从细胞生长/培养环境中去除,必需的蛋白的活性就会恢复。
在一些实施方案中,必需的蛋白是DHFR,瞬时抑制是由氨甲蝶呤实现的。氨甲蝶呤是一种蛋白抑制剂,可竞争性地抑制DHFR(一种参与四氢叶酸合成的酶),而四氢叶酸被认为是合成DNA、RNA、胸苷酸和蛋白所必需的。因此,DHFR受到抑制的细胞将无法存活或增殖。
在一些实施方案中,所述细胞是T细胞、NK细胞、NKT细胞、iNKT细胞、造血干细胞、间充质干细胞、iPSC、神经前体细胞、视网膜基因治疗中的细胞类型或任何其他细胞。
在一些实施方案中,第一部分核苷酸序列在核苷酸序列上被改变以实现核酸酶、siRNA、miRNA或CRISPRi抗性,但是编码具有与第一蛋白相同的氨基酸序列的蛋白。例如,SEQ ID NO:1(图34)是一种第一部分核苷酸序列,其具有与内源性DHFR基因相比改变的核苷酸序列。SEQ ID NO:1是通过点突变内源性DHFR基因中的某些核苷酸产生的。改变的核苷酸序列使SEQ ID NO:1具有核酸酶抗性。然而,由SEQ ID NO:1编码的DHFR蛋白与内源性DHFR蛋白的氨基酸序列相同,因此具有相同的功能。
在一些实施方案中,第一部分核苷酸序列在核苷酸序列上被改变以编码不具有与第一蛋白相同的氨基酸序列的改变的蛋白,所述改变的蛋白不具有与第一蛋白相同的氨基酸序列。改变的蛋白可以相对于第一蛋白具有调节的功能。在一些实施方案中,改变的蛋白具有第一蛋白不具有的特定特征。在一些实施方案中,特定特征包括但不限于以下的一项或多项:活性降低、活性增加、半衰期改变、对小分子抑制的抗性以及结合小分子后活性增加。例如,通过点突变内源性DHFR基因中的某些核苷酸产生SEQ ID NO:2(图35),并且SEQID NO:2编码氨基酸序列不同于内源性DHFR的改变的DHFR蛋白。改变的DHFR蛋白具有与内源性DHFR相似的活性,但对蛋白抑制剂MTX有抗性。
在一些实施方案中,所述至少一种核苷酸序列可操作用于同时表达第一部分核苷酸序列和第二部分核苷酸序列。当核苷酸序列具有基因转录的所有元件时,它可操作用于表达。这些元件包括但不限于启动子、增强子、TATA盒和poly(A)终止信号。在一些实施方案中,其中一个或多个是可选的。在一些实施方案中,第一部分核苷酸序列和第二部分核苷酸序列均可以由同一个启动子或不同的启动子驱动。
在一些实施方案中,两部分核苷酸序列能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者。如果(ⅰ)一个核苷酸序列可操作用于在细胞中表达或(ⅱ)当插入靶基因组中的预定位点时将变得可操作用于在细胞中表达,则这个核苷酸序列是能够表达的,因为它将具有用于基因转录的所有元件或与用于基因转录的所有元件可操作地连接。这些元件包括但不限于启动子、增强子、TATA盒和poly(A)终止信号。并非所有元件在任何情况下都是表达所必需的。在一些实施方案中,第一部分核苷酸序列和第二部分核苷酸序列均可以由同一个启动子和/或上游序列(例如,增强子)或不同的启动子和/或上游序列(例如,增强子)驱动。
在一些实施方案中,第二部分核苷酸序列包含至少一种治疗基因。治疗基因是用作治疗疾病的药物的基因。例如,编码靶向特定癌症抗原的T细胞受体的基因可用作治疗基因。在一些实施方案中,第二部分核苷酸序列编码含有TCRα链和TCRβ链的新生抗原T细胞受体复合物(TCR)。
在一些实施方案中,第一部分核苷酸序列包含核酸酶抗性、siRNA抗性或蛋白抑制剂抗性DHFR基因,第二部分核苷酸序列包含TRA基因和TRB基因。例如,SEQ ID NO:3(图36)是编码野生型人DHFR的DNA序列;SEQ ID NO:4(图37)是编码野生型人DHFR的密码子优化且具有核酸酶抗性的DNA序列;SEQ ID NO:5(图38)是密码子优化的DNA序列,其编码MTX抗性人DHFR突变体。在一些实施方案中,蛋白抑制剂抗性DHFR基因是氨甲蝶呤抗性DHFR基因。
在一些实施方案中,TRA基因、TRB基因和DHFR基因被可操作地配置为从一个开放阅读框中表达。这种配置的一个优点是,如果细胞表达DHFR并在正常细胞培养基中存活,则细胞也表达TRA基因和TRB基因,并可用于下游应用,如TCR治疗。
在一些实施方案中,TRA基因、TRB基因和DHFR基因通过接头隔开。这些接头允许多个基因从一个开放阅读框中表达。在一些实施方案中,接头、TRA基因、TRB基因和DHFR基因的顺序如下:
TRA-接头-TRB-接头-DHFR,
TRA-接头-DHFR-接头-TRB,
TRB-接头-TRA-接头-DHFR,
TRB-接头-DHFR-接头-TRA,
DHFR-接头-TRA-接头-TRB,或
DHFR-接头-TRB-接头-TRA。
在一些实施方案中,接头是自切割2A肽或IRES元件。自切割2A肽和IRES元件两者都允许在一个开放阅读框下表达多个基因。
在一些实施方案中,DHFR基因、TRA基因和TRB基因由内源性TCR启动子或任何其他合适的启动子驱动,包括但不限于以下启动子:TRAC、TRBC1/2、DHFR、EEF1A1、ACTB、B2M、CD52、CD2、CD3G、CD3D、CD3E、LCK、LAT、PTPRC、IL2RG、ITGB2、TGFBR2、PDCD1、CTLA4、FAS、TNFRSF1A(TNFR1)、TNFRSF10B(TRAILR2)、ADORA2A、BTLA、CD200R1、LAG3、TIGIT、HAVCR2(TIM3)、VSIR(VISTA)、IL10RA、IL4RA、EIF4A1、FTH1、FTL、HSPA5和PGK1。
在一些实施方案中,两部分核苷酸序列被整合到细胞的基因组中。在一些实施方案中,整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。在一些实施方案中,核酸酶介导的位点特异性整合是通过CRISPR/Cas9 RNP实现的。一些实施方案还包括使用断裂蛋白内含肽系统,其中必需的蛋白或第一蛋白可拆分成功能失调的N-末端的一半蛋白和C-末端的一半蛋白,每一半蛋白均与同源或异源二聚化蛋白配偶体或断裂蛋白内含肽融合。只有当两个一半的蛋白在同一细胞中共表达时,必需的蛋白或第一蛋白的功能重建才有可能。在一些实施方案中,必需的蛋白或第一蛋白是DHFR蛋白。(Pelletier JN,Campbell-Valois FX,Michnick SW.Oligomerization domain-directed reassembly of active dihydrofolate reductase from rationallydesigned fragments.Proc.Natl.Acad.Sci.U S A.1998 Oct 13;95(21):12141-6;和RemyI,Michnick SW.Clonal selection and in vivo quantitation of proteininteractions with protein-fragment complementationassays.Proc.Natl.Acad.Sci.U S A.1999May 11;96(10):5394-9,这两篇文献均明确地通过引用整体并入本文以用于任何目的。)
在一些实施方案中,导入的两部分核苷酸序列未被整合到细胞的基因组中。
在一些实施方案中,将靶向内源性TCR恒定基因座的CRISPR/Cas9RNP、编码核酸酶抗性DHFR基因的第一部分核苷酸序列和编码新生抗原TCR的第二部分核苷酸序列递送至细胞。在一些实施方案中,内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。在一些实施方案中,递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。
在一些实施方案中,第一CRISPR/Cas9 RNP用于敲除内源性二氢叶酸还原酶(DHFR)基因,第二CRISPR/Cas9 RNP用于将包含CRISPR/Cas9核酸酶抗性DHFR基因的第一部分核苷酸序列和编码治疗性TCR基因的第二部分核苷酸序列敲入内源性TCR恒定基因座。在这些实施方案中,内源性二氢叶酸还原酶(DHFR)不再表达,导入的核酸酶抗性DHFR基因在核苷酸序列上有改变,但相应的蛋白序列没有改变。在一些实施方案中,第二CRISPR/Cas9RNP是切割TRAC基因座用于敲入的TRAC RNP。
在一些实施方案中,氨甲蝶呤用于抑制第一蛋白,CRISPR/Cas9 RNP用于将编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TCR恒定基因座。在这些实施方案中,内源性第一蛋白仍在表达,但其活性已被氨甲蝶呤抑制;并且导入的核苷酸序列编码具有氨甲蝶呤抗性的DHFR蛋白。
本文描述的一些实施方案涉及根据本文公开的任何方法制备的细胞。
在一些实施方案中,细胞包括:ⅰ)被抑制到细胞在正常细胞培养基中不能存活和/或增殖的水平的内源性二氢叶酸还原酶(DHFR),和ⅱ)至少一种两部分核苷酸序列,其包含编码DHFR的第一部分核苷酸序列和编码新生抗原T细胞受体复合物的第二部分核苷酸序列。
本文描述的一些实施方案涉及用于富集基因工程细胞的方法。所述方法可以包括ⅰ)导入至少一种两部分核苷酸序列,其可操作用于在细胞中表达,并且包括编码第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中第二部分蛋白对细胞而言是外源性的,和ⅱ)在含有至少一种导致表达第一蛋白和第二蛋白两者的细胞富集的补充剂的细胞培养基中培养细胞。
在一些实施方案中,基因工程细胞是原代人T细胞。在一些实施方案中,所述补充剂损害不表达第一蛋白和第二蛋白两者的细胞的存活和/或增殖。在一些实施方案中,至少一种蛋白介导细胞对补充剂介导的细胞存活和/或增殖损害的抗性。在一些实施方案中,所述补充剂是氨甲蝶呤。在一些实施方案中,所述第一蛋白是氨甲蝶呤抗性DHFR突变蛋白。
在一些实施方案中,所述第二蛋白是T细胞受体。在一些实施方案中,所述T细胞受体对病毒或肿瘤抗原具有特异性。在一些实施方案中,改变第一部分核苷酸序列的核苷酸序列以获得核酸酶、siRNA、miRNA或CRISPRi抗性。
在一些实施方案中,所述至少一种两部分核苷酸序列的表达通过位点特异性整合入细胞的内源基因座来实现。在一些实施方案中,通过使用CRISPR/Cas9、TALEN、MegaTAL或允许无痕迹整合到基因座以使得能够从基因座的内源性启动子表达的任何其他核酸酶来实现位点特异性整合到细胞的内源基因座。
在一些实施方案中,核酸酶使得所述两部分核苷酸序列的框内外显子整合到基因座中,以实现由内源性启动子、内源性剪接位点和内源性转录终止信号的表达。在这种配置中,控制两部分核苷酸序列表达的元件都是内源性元件。外显子整合是指所述两部分核苷酸序列被整合到基因座的外显子中的情况。这些实施方案中的一些实施方案的图可以在图24中找到。
在一些实施方案中,核酸酶使得所述两部分核苷酸序列的框内外显子整合到基因座中,以实现由内源性启动子、内源性剪接位点和外源性转录终止信号的表达。在这种配置中,控制所述两部分核苷酸序列表达的元件是内源性元件和外源性元件的混合物。这些实施方案中的一些实施方案的图可以在图25中找到。
在一些实施方案中,核酸酶使得所述两部分核苷酸序列内含子整合(intronicintegration)到基因座中,以使得能够由内源性启动子、外源性剪接受体位点和外源性转录终止信号表达。在这种配置中,控制两部分核苷酸序列表达的元件是内源性元件和外源性元件的混合物。内含子整合是指两部分核苷酸序列整合到基因座的内含子中的情况。这些实施方案的图可以在图26中找到。
在一些实施方案中,使用CRISPR/Cas9 RNP将编码氨甲蝶呤抗性DHFR突变蛋白的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TCR恒定基因座。
一些实施方案还包括用于敲除内源性TRAC或TRBC基因的第二CRISPR/Cas9 RNP。
本文所述的一些实施方案涉及用于富集基因工程T细胞的方法。所述方法包括ⅰ)通过在TRA或TRB启动子的下游整合两部分核苷酸序列,将包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码T细胞受体复合物或嵌合抗原受体的第二部分核苷酸序列的两部分核苷酸序列导入T细胞,和ⅱ)在含有导致表达第一蛋白和第二蛋白两者的细胞富集的氨甲蝶呤(25nM至100nM)的细胞培养基中培养细胞。
本文所述的一些实施方案涉及用于富集经工程改造以表达外源性T细胞受体基因的T细胞的方法。所述方法包括ⅰ)使用第一CRISPR/Cas9 RNP将内源性TRBC基因从其基因座上敲除;ⅱ)使用第二CRISPR/Cas9 RNP将编码氨甲蝶呤抗性DHFR基因的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TRAC基因座,其中两种核苷酸序列被可操作地连接,以便能够由内源性TRAC启动子的表达;和ⅲ)在含有导致表达治疗性TCR和氨甲蝶呤抗性DHFR基因两者的T细胞的富集的氨甲蝶呤的细胞培养基中培养细胞。
本文所述的一些实施方案涉及T细胞,其包括ⅰ)在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平的内源性二氢叶酸还原酶(DHFR),和ⅱ)至少一种两部分核苷酸序列,其包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
在一些实施方案中,用于选择基因工程细胞的方法包括ⅰ)导入至少两种可操作用于在细胞中表达的两部分核苷酸序列。所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到细胞不能存活和/或增殖的水平。第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。第一融合蛋白和第二融合蛋白均可以在细胞中一起表达,并且存活和/或增殖所必需的蛋白的功能通过该共表达而得到恢复。所述方法还包括ⅱ)在导致选择表达第一核苷酸序列和第二两部分核苷酸序列两者的细胞的条件下培养细胞。在一些实施方案中,上述过程中的一个或多个可以用本文提供的任何其他实施方案重复和/或省略和/或修改。
在一些实施方案中,用于富集基因工程细胞的方法包括:ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平;和ⅱ)导入至少两种可操作用于在细胞中表达的两部分核苷酸序列。所述第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。第一融合蛋白和第二融合蛋白均可以在细胞中一起表达,并且存活和/或增殖所必需的蛋白的功能通过该共表达而得到恢复。所述方法可以还包括ⅲ)在导致表达第一融合蛋白和第二融合蛋白两者的细胞富集的体外增殖条件下培养细胞。在一些实施方案中,上述过程中的一个或多个可以用本文提供的任何其他实施方案重复和/或省略和/或修改。
本文描述的一些实施方案涉及用于选择基因工程细胞的方法。本文使用的术语“细胞”可以指来自任何生物体的任何单个细胞、多个细胞或细胞系。在一些实施方案中,所述细胞是真核细胞。在一些实施方案中,所述细胞是哺乳动物。在一些实施方案中,所述细胞是原代细胞或来自原代组织。在一些实施方案中,所述细胞来自建立的细胞系。在一些实施方案中,所述细胞是小鼠、大鼠、非人类灵长类动物或人。应当理解,细胞可以来自任何细胞、组织、器官或器官系统类型。细胞的非限制性实例包括T细胞、CD4+T细胞、CD8+T细胞、CAR T细胞、B细胞、免疫细胞、神经细胞、肌肉细胞、上皮细胞、结缔组织细胞、干细胞、骨细胞、血细胞、内皮细胞、脂肪细胞、性细胞、肾细胞、肺细胞、脑细胞、心脏细胞、根毛细胞、胰腺细胞和癌细胞。
在一些实施方案中,所述方法包括导入至少一种可操作用于在细胞中表达的核苷酸序列。在一些实施方案中,所述方法包括导入至少两种、至少三种、至少四种、至少五种、至少十种序列或至少二十种核苷酸序列。
在一些实施方案中,所述至少一种核苷酸序列包含一个部分。在一些实施方案中,所述至少一种核苷酸序列包含至少两个部分。在一些实施方案中,所述核苷酸序列包含至少三个部分。在一些实施方案中,所述核苷酸序列包含至少四个部分。在一些实施方案中,所述核苷酸序列包含至少五个部分。在一些实施方案中,所述核苷酸序列包含十个部分。在一些实施方案中,所述核苷酸序列包含二十个部分。
在一些实施方案中,细胞存活和/或增殖所必需的至少一种蛋白和/或细胞过程在细胞中被抑制到细胞不能独立存活和/或增殖的水平。本领域技术人员将理解,“必需的”蛋白或细胞系统可以是影响特定细胞的生长、复制、细胞周期、基因调节(包括DNA修复、转录、翻译和复制)、应激反应、代谢、凋亡、营养物获得、蛋白更新、细胞表面完整性、必需的酶活性、存活或它们的任何组合的任何蛋白或细胞系统。还应理解,术语“抑制”可适用于任何表型,从与对照相比,细胞死亡、代谢停滞、细胞周期停滞、应激诱导、蛋白更新停滞、DNA应激和/或生长停滞的一种或多种发生率的显著增加到细胞完全死亡、代谢停滞、细胞周期停滞、应激诱导、蛋白更新停滞、DNA应激和/或生长停滞。在一些实施方案中,抑制可以是部分的或完全的(例如,蛋白的水平可以降低或使其功能活性至少降低大约一些可检测的量,包括但不限于50%、75%、85%、90%、95%、96%、97%、98%、99%或100%)。在一些实施方案中,通过降低细胞中蛋白的水平或量来实现抑制(例如敲除、基因沉默、siRNA、CRISPRi、miRNA、shRNA)。在一些实施方案中,通过在改变或不改变细胞中蛋白的水平的情况下降低蛋白的功能活性(例如,蛋白功能的小分子抑制剂、阻断结合的抗体、降低蛋白功能的突变)来实现抑制。
在一些实施方案中,所述核苷酸序列包含编码融合蛋白的至少一个序列,所述融合蛋白包含与结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。在一些实施方案中,所述核苷酸序列的第一部分包含编码融合蛋白的至少一个序列,所述融合蛋白包含与结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。在一些实施方案中,所述核苷酸序列的第二部分包含编码至少一种待表达蛋白的至少一个序列。
在一些实施方案中,所述核苷酸序列包含编码第二融合蛋白的至少一个序列和编码所述至少一种待表达蛋白的第二核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的第二非功能部分。在一些实施方案中,所述核苷酸序列的第二部分包含编码第二融合蛋白的至少一个序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的第二非功能部分和编码所述至少一种待表达蛋白的第二核苷酸序列。在一些实施方案中,当在细胞中一起表达时,融合蛋白导致至少一种必需的蛋白的成功表达。这将必需的蛋白的功能返还(return)给细胞,使细胞得以存活。虽然本文公开的许多实施例涉及两种融合蛋白的结合,但本领域技术人员应理解,本文公开的相同方法可以在众多的各种融合蛋白下使用,这些融合蛋白可以成功地组合成(combineinto)至少一种必需的蛋白。
如本文所公开的,在一些实施方案中,当第一融合蛋白和第二融合蛋白在细胞中一起表达时,恢复了至少一种对于存活和/或增殖必需的蛋白的功能。在一些实施方案中,当第一融合蛋白和第二融合蛋白在细胞中一起表达时,恢复了至少一种对于存活和/或增殖必需的细胞过程的功能。在一些实施方案中,所述至少一种必需的蛋白或细胞过程与被抑制的蛋白或细胞过程是相同的必需的蛋白或细胞过程。在一些实施方案中,所述至少一种必需的蛋白包含与被抑制蛋白相似的活性。在一些实施方案中,所述至少一种必需的蛋白在至少一种被抑制的细胞途径或过程中发挥作用。在一些实施方案中,所述至少一种必需的蛋白在至少两种必需的细胞途径或过程中发挥作用。在一些实施方案中,至少一种必需的蛋白的表达减轻、激活、恢复或减少被抑制蛋白和/或细胞过程的抑制表型。在一些实施方案中,当表达至少一种必需的蛋白后,细胞的存活和/或增殖增加。在一些实施方案中,当表达至少一种必需的蛋白后,细胞的存活和/或增殖完全恢复。
在一些实施方案中,所述方法还包括在导致选择细胞的条件下培养细胞。在一些实施方案中,所述选择包括所述核苷酸序列上编码的至少一种必需的蛋白的表达。在一些实施方案中,选择包括表达在核苷酸序列上编码的第一两部分核苷酸序列和第二两部分核苷酸序列两者。
在一些实施方案中,所述必需的蛋白是DHFR蛋白。在一些实施方案中,所述必需的蛋白是与DHFR具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或约100%同一性的蛋白。在一些实施方案中,所述蛋白是哺乳动物DHFR蛋白。在一些实施方案中,所述蛋白是人DHFR蛋白。在一些实施方案中,所述蛋白是DHFR类似物。
在一些实施方案中,核苷酸序列对细胞而言是外源性的。在一些实施方案中,第一两部分核苷酸序列和/或第二两部分核苷酸序列的核苷酸序列对细胞而言是外源性的。在一些实施方案中,第一两部分核苷酸序列和/或第二两部分核苷酸序列的第一部分核苷酸序列对细胞而言是外源性的。在一些实施方案中,第一两部分核苷酸序列或第二两部分核苷酸序列的第二部分核苷酸序列对细胞而言是外源性的。在一些实施方案中,第一两部分核苷酸序列和/或第二两部分核苷酸序列的核苷酸序列是TCR。在一些实施方案中,第一两部分核苷酸序列和/或第二两部分核苷酸序列的第一部分核苷酸序列是TCR。在一些实施方案中,第一两部分核苷酸序列和/或第二两部分核苷酸序列的第二部分核苷酸序列是TCR。
在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个源自GCN4。在一些实施方案中,结合结构域源自与GCN4具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或约100%同一性的蛋白。在一些实施方案中,结合结构域源自哺乳动物GCN4蛋白。在一些实施方案中,结合结构域来源于人GCN4蛋白。在一些实施方案中,结合结构域源自GCN4类似物的蛋白。
在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个源自FKBP12。在一些实施方案中,结合结构域源自与FKBP12具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或约100%同一性的蛋白。在一些实施方案中,结合结构域源自哺乳动物FKBP12蛋白。在一些实施方案中,结合结构域源自人FKBP12蛋白。在一些实施方案中,结合结构域源自FKBP12类似物的蛋白。在一些实施方案中,FKBP12具有F36V突变。在一些实施方案中,诱导FKBP12结合。(Straathof KC,PulèMA,Yotnda P,Dotti G,Vanin EF,Brenner MK,Heslop HE,Spencer DM,Rooney CM.An induciblecaspase 9safety switch for T-cell therapy.Blood.2005Jun 1;105(11):4247-54,特此明确地通过引用整体并入本文以用于任何目的)。
在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个源自JUN。在一些实施方案中,结合结构域源自与JUN具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或约100%同一性的蛋白。在一些实施方案中,结合结构域源自哺乳动物JUN蛋白。在一些实施方案中,在一些实施方案中,结合结构域源自JUN类似物的蛋白。
在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个源自FOS。在一些实施方案中,结合结构域源自与FOS具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或约100%同一性的蛋白。在一些实施方案中,结合结构域源自哺乳动物FOS蛋白。在一些实施方案中,结合结构域源自人FOS蛋白。在一些实施方案中,结合结构域源自FOS类似物蛋白。在一些实施方案中,第一结合结构域源自JUN,第二结合结构域源自FOS。在一些实施方案中,相对于野生型JUN和FOS,JUN和FOS具有促进彼此结合的互补变化。(Glover JN,Harrison SC.Crystal structure of the heterodimericbZIP transcription factor c-Fos-c-Jun bound to DNA.Nature.1995 Jan 19;373(6511):257-61,and Glover and Harrison,Nature 1995.Jerome and Muller,Gene Ther2001,and
Figure BDA0004167204860000631
V,Müller R.A synthetic leucine zipper-based dimerizationsystem for combining multiple promoter specificities.Gene Ther.2001May;8(9):725-9,这两篇文献均明确地通过引用整体并入本文以用于任何目的)。
在一些实施方案中,第一结合结构域和第二结合结构域具有互补突变,以保持相互之间的结合。在一些实施方案中,第一结合结构域不结合天然结合配偶体(nativebinding partner)。在一些实施方案中,第二结合结构域不结合天然结合配偶体。在一些实施方案中,第一结合结构域和第二结合结构域都不结合天然结合配偶体。在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个具有3至7个互补突变。在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个具有3个以上互补突变。在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个具有4个以上互补突变。在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个具有5个以上互补突变。在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个具有6个互补突变。在一些实施方案中,第一结合结构域和/或第二结合结构域中的至少一个具有7个互补突变。在一些实施方案中,第一结合结构域与第二结合结构域具有不同数目的互补突变。在一些实施方案中,互补突变是一个或多个电荷对(或电荷转换(charge switch))突变,使得成对的电荷保持在结构中,但是在残基对之间电荷的位置是相反的。例如,在存在通过电荷相互作用与第二残基缔合的第一残基并且在第一残基是带正电的残基并且第二残基是带负电的残基的情况下,可以转换电荷,使得第一残基是带负电的残基并且第二残基是带正电的残基。在一些实施方案中,第一个残基和第二个残基可以存在于(reside)相同的蛋白上。在一些实施方案中,第一个残基和第二个残基存在于在不同的蛋白上。
在一些实施方案中,必需的蛋白的功能的恢复是诱导的。在一些实施方案中,必需的蛋白的功能的恢复由二聚剂(dimerizer agent)诱导。本文所用的术语“二聚剂”具有本领域普通技术人员通常理解的普通含义,包括交联两个或多个结构域的任何小分子或蛋白。二聚剂的非限制性实例是AP1903。如本领域技术人员在考虑本文公开内容的情况下将理解的,当通过二聚剂诱导必需的蛋白的功能的恢复时,二聚剂或诱导剂不被认为是外源选择压力。
在一些实施方案中,培养步骤是在细胞周期抑制剂、生长抑制剂、DNA复制抑制剂、代谢抑制剂、基因表达抑制剂或应激抑制剂(stress inhibitor)中的至少一种存在下进行的。在一些实施方案中,培养步骤是在氨甲蝶呤的存在下进行的。
本文描述的一些实施方案涉及用于富集基因工程细胞的方法。本文所用的术语“富集”具有本领域普通技术人员通常理解的普通含义,包括提高细胞群中期望的细胞类型的比率。富集的非限制性实例包括从群体中纯化期望的细胞类型,增加期望的细胞类型的数量,以及减少不期望的细胞类型的数量。在一些实施方案中,所述方法包括将细胞存活和/或增殖所必需的至少第一蛋白或细胞过程的活性降低到使得细胞不能在正常体外增殖条件下存活和/或增殖的水平。例如,被氨甲蝶呤降低了DHFR活性的细胞在正常体外增殖条件下无法存活和/或增殖,因为可能需要向体外增殖条件加入额外的补充剂(例如,次黄嘌呤和胸苷(HT))。因此,如本领域技术人员在考虑本文公开内容的情况下将理解的,在此背景下中,正常条件(或类似短语)表示不提供补偿具体表示的改变的具体组分的条件。如本文所述,其可以是在给定细胞中影响生长、复制、细胞周期、基因调节(包括DNA修复、转录、翻译和复制)、应激反应、代谢、凋亡、营养物获得、蛋白更新、细胞表面完整性、必需的酶活性或它们的任何组合的任何蛋白或细胞系统。还应理解,术语“抑制”可适用于任何表型,从与对照相比,细胞死亡、代谢停滞、细胞周期停滞、应激诱导、蛋白更新停滞、DNA应激和/或生长停滞的一种或多种发生率的显著增加到细胞完全死亡、代谢停滞、细胞周期停滞、应激诱导、蛋白更新停滞、DNA应激和/或生长停滞。
在一些实施方案中,所述方法还包括导入本文公开的至少一种可操作用于在细胞中表达的核苷酸序列。在一些实施方案中,核苷酸序列包含至少两个部分。如本文所述,这些部分共同发挥作用,以表达至少一种必需的蛋白。应当理解,可以有任意数量的部分共同作用以表达至少一种必需的蛋白。
在一些实施方案中,所述核苷酸序列包含编码融合蛋白的至少一个序列,所述融合蛋白包含与结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。在一些实施方案中,核苷酸序列的第一部分包含编码融合蛋白的至少一个序列,所述融合蛋白包含与结合结构域融合的存活和/或增殖必需的蛋白的非功能部分。在一些实施方案中,核苷酸序列的第二部分包含编码至少一种待表达蛋白的至少一个序列。
在一些实施方案中,所述核苷酸序列包含编码第二融合蛋白的至少一个序列和编码所述至少一种待表达蛋白的第二核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的第二非功能部分。在一些实施方案中,所述核苷酸序列的第二部分包含编码第二融合蛋白的至少一个序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的第二非功能部分和编码所述至少一种待表达蛋白的第二核苷酸序列。在一些实施方案中,在细胞中一起表达的融合蛋白导致至少一种必需的蛋白的成功表达。虽然本文公开的许多实施例涉及两种融合蛋白的结合,但本领域技术人员应理解,本文公开的相同方法可以在任何数量的融合蛋白下使用,这些融合蛋白可以成功组合成一个至少一个必需的蛋白。
在一些实施方案中,当第一融合蛋白和第二融合蛋白在细胞中一起表达时,恢复了至少一种对于存活和/或增殖必需的蛋白的功能。如本文所公开的,在一些实施方案中,当第一融合蛋白和第二融合蛋白在细胞中一起表达时,恢复了至少一个对于存活和/或增殖必需的细胞过程的功能。在一些实施方案中,所述至少一种必需的蛋白或细胞过程与被抑制的蛋白或细胞过程是相同的必需的蛋白或细胞过程。在一些实施方案中,所述至少一种必需的蛋白包含与被抑制蛋白相似的活性。在一些实施方案中,所述至少一种必需的蛋白在至少一种被抑制的细胞途径或过程中发挥作用。在一些实施方案中,所述至少一种必需的蛋白在至少两种必需细胞途径或过程中发挥作用。在一些实施方案中,至少一种必需的蛋白的表达减轻、激活、恢复或减少被抑制蛋白和/或细胞过程的抑制表型。在一些实施方案中,当表达至少一种必需的蛋白后,细胞的存活和/或增殖增加。在一些实施方案中,当表达至少一种必需的蛋白后,细胞的存活和/或增殖得到完全恢复。
在一些实施方案中,所述方法还包括在导致表达第一融合蛋白和第二融合蛋白两者的细胞富集的体外增殖条件下培养所述细胞。
在一些实施方案中,在表1-5中任一个或多个内的一个或多个构建体、序列或亚序列可用于本实施方案和/或本文提供的排列和/或方法和/或组合物中。
表1:gRNA的靶序列
说明 靶序列 SEQ ID NO:
DHFR sgRNA-1 tgattatgggtaagaagacc 10
DHFR sgRNA-2 AACCTTAGGGAACCTCCACA 11
DHFR sgRNA-3 Cggcccggcagatacctgag 12
DHFR sgRNA-4 Gacatggtctggatagttgg 13
DHFR sgRNA-5 gtcgctgtgtcccagaacat 14
DHFR sgRNA-6 cagatacctgagcggtggcc 15
DHFR sgRNA-7 cacattaccttctactgaag 16
DHFR sgRNA-8 cgtcgctgtgtcccagaaca 17
DHFR sgRNA-9 accacaacctcttcagtaga 18
DHFR sgRNA-10 aaattaattctaccctttaa 19
TRAC sgRNA GAGAATCAAAATCGGTGAAT 20
B2M GAGTAGCGCGAGCACAGCTA 21
表2:融合蛋白及相关元件
Figure BDA0004167204860000671
/>
Figure BDA0004167204860000681
/>
Figure BDA0004167204860000691
表3:敲入模板
Figure BDA0004167204860000692
/>
Figure BDA0004167204860000701
/>
Figure BDA0004167204860000711
/>
Figure BDA0004167204860000721
/>
Figure BDA0004167204860000731
/>
Figure BDA0004167204860000741
/>
Figure BDA0004167204860000751
/>
Figure BDA0004167204860000761
/>
Figure BDA0004167204860000771
/>
Figure BDA0004167204860000781
/>
Figure BDA0004167204860000791
/>
Figure BDA0004167204860000801
/>
Figure BDA0004167204860000811
/>
Figure BDA0004167204860000821
/>
Figure BDA0004167204860000831
/>
Figure BDA0004167204860000841
表4:siRNA的靶序列
说明 靶序列 SEQ ID NO:
DHFR siRNA-1 GAGCAGGTTCTCATTGATAACAAGC 56
DHFR siRNA-2 ATCAATTGAGGTACGGAGAAACTGA 57
DHFR siRNA-3 GTCATGGTTGGTTCGCTAAACTGCA 58
DHFR siRNA-4 GCAGGTTCTCATTGATAACAAGCTC 59
DHFR siRNA-5 GTTGACTTTAGATCTATAATTATTT 60
DHFR siRNA-6 AAATCATCAATTGAGGTACGGAGAA 61
表5:新序列
Figure BDA0004167204860000842
实施例1
本实施例表明,同时敲除DHFR和敲入含有核酸酶抗性DHFR基因的TCR基因构建体导致成功敲入TCR的T细胞富集5倍。
图3-图7的材料和方法
分离来自从不同供体BC23和BC26中分离出的两个血沉棕黄层(buffy coat)的人原代T细胞,并用抗CD3/CD28磁珠(赛默飞世尔公司,目录号:111.32D,磁珠:T细胞比例为3:1)活化。活化后两天,收获细胞,将细胞与以下成分一起进行电穿孔:(1)DHFR sgRNA-1/Cas9 RNP,(2)DHFR sgRNA-2/Cas9 RNP,(3)TRAC sgRNA/Cas9 RNP+编码NY-ESO-1 1G4 TCR的敲入模板,(4)TRAC sgRNA/Cas9 RNP+编码NY-ESO-1 1G4 TCR和DHFR的敲入模板,(5)TRAC sgRNA/Cas9 RNP+编码NY-ESO-1 1G4 TCR和DHFR的敲入模板+DHFR sgRNA-1/Cas9RNP。首先将crRNA(32pmol)与TracrRNA(32pmol)在95℃下退火5分钟,室温孵育10分钟后,加入16pmol的Cas9核酸酶,室温孵育15分钟,制备RNP 复合物。RNP复合物在使用前被置于冰上,或置于-80℃下长期储存。电穿孔是通过以下步骤进行的:将100万个活化的T细胞(在20μl P3缓冲液中)与16pmol RNP复合物和1μg修复模板混合,随后使用Lonza 4D-Nucleofector装置以EH-115脉冲代码开始进行电穿孔。对于在条件(1)和(2)中进行电穿孔的细胞,在电穿孔后第5天收获它们,分离基因组DNA,通过PCR扩增DHFR位点并进行TIDE分析(图3和图4)。对于在条件(3)、(4)和(5)中进行电穿孔的细胞,在电穿孔后第6天(图5)和第10天(图6和图7左图)收获细胞用于FACS分析TCR表达。在电穿孔后第12天,还计数了总细胞数,并计算和绘制了TCR敲入细胞图(图7右图)。
图3描绘了用于测定来自两个供体的人T细胞中sgRNAsgDHFR-1的敲除效率的TIDE分析的结果(对于BC23和BC26,分别为75%和18%),提供了内源性DHFR基因可在人原代T细胞内遗传失活(genetically inactivated)的证据。TIDE代表“通过分解追踪插入缺失(Tracking of Indels by Decomposition)”,这是一种通过基因组编辑工具(如CRISPR/Cas9)测量细胞池中产生的插入和缺失(indels)的方法。
图4描绘了用于测定来自两个供体的人T细胞中sgRNA sgDHFR-2的敲除效率的TIDE分析的结果(对于BC23和BC26,分别为34%和75%),提供了内源性DHFR基因可在人原代T细胞内遗传失活的证据。
图5描绘了通过用结合1G4 TCR的β链的抗-Vβ13.1(Biolegend公司,目录号362406)抗体染色来检验来自两个供体(BC23和BC 26)的T细胞中NY-ESO-1 1G4 TCR敲入效率的FACS分析的结果。T细胞与TRAC RNP(在TRAC位点处产生DNA双链断裂)和各种修复双链DNA断裂并因此整合到该位点的修复模板(均含有NY-ESO-1 1G4 TCR序列)一起进行电穿孔。
左列示出了仅编码NY-ESO-1 1G4 TCR的修复模板的敲入,中间列示出了编码与核酸酶抗性DHFR基因(1G4 TCR-DHFR KI)连接的1G4TCR的修复模板的敲入,右列示出了1G4TCR-DHFR修复模板的敲入结合使用DHFR特异性sgRNA同时敲除内源性DHFR。同时敲除内源性DHFR导致在电穿孔后第6天通过递送1G4-DHFR修复模板有效选择T细胞,因为对于BC23和BC26,具有敲入的T细胞的频率分别从9%增加到了51%(5.7倍富集)和从23%增加到了70%(3倍富集)。数据表明,本发明所述的方法可以富集基因修饰的细胞,而不需要物理或药物介导的选择,也不需要导入编码外源基因的基因序列来实现选择。
图6描绘了当核酸酶抗性DHFR转基因包括在编码TCRα/β的DNA修复模板中时,与内源性DHFR的敲除结合,在来自两个供体(BC23和BC26)的T细胞中检验NY-ESO-1 1G4 TCR敲入效率的FACS分析的结果。左列示出仅敲入NY-ESO-1 1G4 TCR,中间列示出敲入1G4TCR-DHFR,右列示出敲入1G4 TCR-DHFR,同时敲除内源性DHFR。数据表明,同时敲除内源性DHFR导致在电穿孔后第10天有效选择具有1G4-DHFR KI的T细胞,因为对于BC23和BC26,具有敲入的T细胞的频率分别从10%增加到了61%(6.1倍富集)和从30%增加到了85%(2.8倍富集)。数据表明,本发明中描述的方法可以富集基因修饰的细胞,而不需要物理或药物介导的选择,并且无需导入编码外源基因的基因序列来允许选择。
上述数据表明,所述方法可以富集基因工程细胞,而不需要物理或药物介导的选择,并且无需导入编码外源基因的基因序列来实现选择。
有各种策略来实现基因编辑T细胞的富集,通过敲入编码目的治疗基因(例如TCRα和TCRβ)和siRNA抗性或抑制剂抗性DHFR基因的DNA修复模板并使用siRNA或抑制剂(氨甲蝶呤)抑制内源性DHFR功能来实现基因编辑的T细胞的富集,而不是敲除内源性DHFR。
图7左图示出,基于对来自两个供体(BC23和BC26)的人T细胞中TCRVβ13.1抗体荧光强度的FACS分析,1G4-TCR KI(knockin,敲入)T细胞和1G4-TCR-DHFR KI+DHFR KO T细胞之间的TCR表达水平相当。抗-Vβ13.1抗体与1G4 TCR的β链结合。这些数据表明,用本发明实现的TCR表达与未修饰的TCR转基因的位点特异性整合相当。
右图示出,电穿孔后第12天,两种供体T细胞中的1G4-TCR敲入和1G4-TCR-DHFR KI+DHFR KO T细胞之间的TCR敲入细胞总数相当,表明使用该方法修饰的T细胞在基因工程改造后增殖了。
图8-图10的材料和方法
分离从来自不同供体BC29、BC30、BC31和BC32中的四个血沉棕黄层的人原代T细胞,并用抗CD3/CD28磁珠活化。活化后两天,收获细胞,用细胞与以下成分一起进行电穿孔:(1)TRAC sgRNA/Cas9 RNP+编码NY-ESO-1 1G4 TCR的敲入模板,(2)TRAC sgRNA/Cas9 RNP+编码NY-ESO-1 1G4 TCR和DHFR的敲入模板,(3)TRAC sgRNA/Cas9 RNP+编码NY-ESO-1 1G4TCR和DHFR+DHFR sgRNA-1/Cas9 RNP的敲入模板。电穿孔和转导参数同上。在第5天收获细胞用于TCR表达的FACS分析(图8、图9和图10左图)。在电穿孔后第12天,还计数了总细胞数,并计算和绘制了TCR敲入细胞图(图10右图)。
图8描绘了当核酸酶抗性DHFR转基因包括在编码TCRα/β的DNA修复模板中时,与内源性DHFR的敲除结合,在电穿孔后第5天在来自来自四个供体(BC29、BC30、BC31和BC32)的T细胞中检验NY-ESO-11G4 TCR敲入效率的FACS分析结果。左列示出了NY-ESO-1 1G4 TCR 的敲入,中间列示出了1G4 TCR-DHFR的敲入,右列示出了1G4 TCR-DHFR的敲入,同时敲除内源性DHFR;抗-Vβ13.1抗体与1G4 TCR的β链结合。数据表明,在电穿孔后第5天,敲入效率对于BC23而言,从25%提高到73%;对于BC30而言,从24%到50%;对于BC31而言,从17%到60%,并且对于BC32而言,从17%至41%。这表明本发明中描述的方法可以富集基因修饰的细胞,而不需要物理或药物介导的选择,并且无需导入编码外源基因的基因序列来实现选择。
图9提供了图8的定量数据,表明该方法可以富集基因修饰的细胞,而不需要物理或药物介导的选择,并且无需导入编码外源基因的基因序列来实现选择。
图10提供了左图,其示出了基于对来自四个供体(BC29、BC30、BC31和BC32)的人T细胞中的TCRVβ13.1荧光强度的FACS分析,在1G4-TCR KI和1G4-TCR-DHFR KI+DHFR KO细胞之间的TCR表达水平是相当的,抗-Vβ13.1抗体与1G4 TCR的β链结合。右图示出,与四个供体T细胞中的1G4-DHFR-KI T细胞或1G4-TCR-DHFR-KI+DHFR KO T细胞相比,1G4-TCR敲入条件下的TCR敲入细胞总数较高。
图11-图12的材料和方法
分离来自血沉棕黄层BC33和BC35的人原代T细胞并用抗CD3/CD28磁珠活化。活化后两天,收获细胞,用细胞与以下成分一起进行电穿孔:(1)靶向DHFR基因座中的10个不同位点的DHFR sgRNA/Cas9 RNP,(2)靶向DHFR mRNA中的6个不同位点的DHFR siRNA。电穿孔后3天,细胞与MTX-荧光素一起孵育过夜,然后收获用于荧光素表达的FACS分析(图12)。
图11提供了使用MTX-荧光素标记来测定DHFR表达的结果,左图示出没有标记的细胞对于荧光素染色基本上是阴性的;中图和右图是已经用MTX-荧光素标记的细胞;中图示出对照细胞(野生型)对荧光素染色基本上是阳性的;右图示出,经DHFR sgRNA电穿孔的细胞对MTX-荧光素染色主要呈阴性。这些数据表明,荧光素标记的MTX可用于识别DHFR敲除的细胞。
图12,左图示出了图11中描述的用于筛选靶向DHFR的高效向导RNA的方法;右图,使用图11中描述的方法筛选针对DHFR的高效siRNA。
以上结果表明:1)DHFR选择策略可以稳健地(robustly)富集TCR敲入细胞,2)MTX标记可以对DHFR表达进行定量。
实施例2
本实施例表明,根据一些实施方案的方法可以通过导入突变DHFR基因并随后用临床批准的药物氨甲蝶呤(MTX)进行选择来有效地富集基因修饰的T细胞。
使用带有编码NY-ESO-1 1G4 TCR(1G4 KI)的对照修复模板或编码与氨甲蝶呤(MTX)抗性DHFR突变基因(1G4-DHFRm KI)连接的1G4TCR的修复模板的CRISPR/Cas9敲入来自三个供体(BC37、BC38和BC39)的T细胞。然后用与1G4 TCR的β链结合的抗Vβ13.1(Biolegend公司,目录号362406)抗体对T细胞进行染色。对于用1G4-DHFRm KI模板修复的细胞,在电穿孔后第3天用0.1μM MTX处理4天。对于用1G4 KI模板修复的细胞,在进行FACS分析前不进行处理。在电穿孔后第11天进行FACS分析。
图13A是示出具有对照修复模板1G4 KI的敲入的T细胞的FACS图,图13B是示出具有修复模板1G4-DHFRm KI的敲入的T细胞的FACS 图,并且图13C是示出图13A和图13B的具有两个技术重复的定量的柱状图。
图13A-图13C中的数据显示,导入MTX抗性DHFRm并且随后用MTX处理细胞导致了敲入T细胞的有效选择,因为对于BC37、BC38和BC39而言,具有成功敲入的T细胞的频率分别从26%增加到了85%(3.3倍富集)、从15%增加到了73%(4.9倍富集)和从26%增加到了83%(3.2倍富集)。数据表明,本发明所述的方法可以通过导入突变DHFR基因并随后用临床批准的药物MTX进行选择来有效地富集基因修饰的细胞。
图14是示出图13中描述的两种敲入条件的T细胞扩增的柱状图。在电穿孔后第10天计数总细胞数,并基于对敲入效率的FACS分析计算TCR敲入细胞数。数据表明,在三个供体中,通过应用MTX选择策略,TCR敲入细胞的产量比常规非选择方法高2-3倍。
实施例3
本实施例表明,根据一些实施方案的有效富集基因修饰的T细胞的方法没有显著改变CD4+细胞的比例。CD4+细胞是人类T细胞的两个主要亚群之一(另一个是CD8+T细胞)。CD4+细胞比例异常将表明免疫功能受损。
图15示出通过用抗CD4抗体(BD生物科学公司,目录号:345768)染色,在图13中所述的两种敲入条件下CD4+细胞比例的FACS分析。数据表明,两种条件下CD4+细胞的比例相当,因此MTX选择策略不会显著改变CD4+细胞的比例。
实施例4
本实施例表明,根据一些实施方案的方法没有显著改变富集的基因修饰T细胞的表型。
图16示出通过用抗CD45RA(BD生物科学公司(BD Biosciences),目录号:563963)和抗CD62L抗体(BD生物科学公司,目录号:562330)染色,在图13中所述的两种敲入条件下TCR敲入细胞表型的FACS分析。CD45RA+CD62L+群体反映了初始干细胞样表型,其具有高度功能性。数据表明,两种敲入条件下CD45RA+CD62L+细胞的比例相当,因此MTX选择策略不会显著改变细胞的表型。
图17示出通过用抗CD27(BD生物科学公司,目录号:740972)和抗CD28抗体(BD生物科学公司,目录号:559770)染色,在图13中所述的两种敲入条件下TCR敲入细胞表型的FACS分析。共受体(co-receptor)CD27和CD28是T细胞共刺激分子,因此,双阳性细胞被认为是高功能T细胞。数据表明,CD27+CD28+细胞的比例在两种敲入条件下相当,因此MTX选择策略没有显著改变细胞的表型。
实施例5
本实施例示出由根据一些实施方案的方法产生的富集的基因修饰的T细胞具有与未经选择产生的T细胞相似的细胞溶解能力。
将人黑色素瘤A375细胞(HLA-A*02:01+NY-ESO-1+)置于6孔板中,并加入不同数目的如实施例2中产生的NY-ESO-1 1G4 TCR敲入T细胞(来自供体BC37)(E:T比例为从0:1至2:1)。5天后,将剩余肿瘤细胞用甲醛固定,并用结晶紫溶液染色。如图18所示,左侧平板为与未编辑的(unedited)T细胞共培养,中间平板为与1G4-敲入T细胞(1G4 KI)共培养,右侧平板为与MTX选择的1G4-DHFRm-敲入T细胞(1G4-DHFRm KI+MTX)共培养。结果表明,这种共培养试验可以证明TCR特异性肿瘤细胞杀伤力,因为没有NY-ESO-1 1G4 TCR表达的未经编辑的T细胞不能杀伤肿瘤细胞,而1G4 TCR敲入T细胞(中间与右侧的平板)可以在中高E:T比例下有效消除(eliminate)肿瘤细胞。结果还表明,通过MTX选择法(右侧平板)产生的T细胞与未经选择产生的T细胞(中间的平板)具有相似的细胞溶解能力。
图19示出了肿瘤-T细胞共培养试验,其中T细胞来自另外两个供体(BC38和BC39)。结果证实,通过MTX选择法产生的T细胞(右列)与未经选择产生的T细胞(左列)具有相似的细胞溶解能力。
实施例6
本实施例示出由根据一些实施方案的方法产生的富集的基因修饰的T细胞具有与不经选择产生的T细胞相似的IFNγ和IL2生产能力。
IFNγ是一种在免疫反应中起核心作用的细胞因子,它被认为是活化T细胞的关键特征之一。为了研究富集的基因修饰的T细胞(如实施例2中产生的)的IFNγ产生能力,将人黑色素瘤A375(HLA-A*02:01+NY-ESO-1+)细胞置于(plated)96孔板中,并在T细胞中加入不同数目的NY-ESO-1 1G4 TCR敲入T细胞(来自两个供体,图20第一行:供体BC37,第二行:供体BC39)(前三列E:T比例为1:2至1:8)。作为刺激的阳性对照,加入了PMA和离子霉素(PMA+ION,右列)。在布雷菲德菌素A(brefeldin A)(高尔基阻断剂(Golgi-plug)BD生物科学公司,目录号:554724)的存在下刺激T细胞过夜,以防止细胞因子分泌,并通过用抗IFNγ抗体(BD生物科学公司,目录号:340452)和抗IL2抗体(BD生物科学公司,目录号:340448)进行细胞内染色,收集T细胞用于IFNγ产生的FACS分析。产生IFNγ的T细胞的比例如图20所示绘制。数据表明,由MTX选择法(1G4-DHFRm KI+MTX)产生的T细胞与未经选择法(1G4 KI)产生的T细胞具有相似的IFNγ生产能力。
图21是示出当用肿瘤细胞刺激时T细胞的IFNγ产生能力的柱状图。如图20所示,用不同E:T比例的A375细胞刺激T细胞,并在此处描绘IFNγ表达水平(由平均荧光强度(MFI)确定)图。数据表明,由MTX选择法(1G4-DHFRm KI+MTX)产生的T细胞产生的IFNγ的量与未经选择产生的T细胞(1G4 KI)产生的IFNγ量相似。
图22是示出当用肿瘤细胞刺激时T细胞的IL2生产能力的柱状图。如图20、图21所示,用不同E:T比例的A375细胞刺激T细胞。此处绘制了产生IL2的细胞的比例(左图)及其表达水平(MFI,右图)。左图表明,由MTX选择法(1G4-DHFRm KI+MTX)产生的T细胞与未经选择产生的T细胞(1G4 KI)相比,IL2生成细胞的比例较高,而右图显示由MTX选择法(1G4-DHFRmKI+MTX)产生的T细胞与未经选择产生的T细胞(1G4 KI)产生的IL2的量相似。
实施例7
本实施例示出,由根据一些实施方案的方法产生的富集的基因修饰的T细胞具有与不经选择产生的T细胞相似的增殖能力。
图23是示出当用肿瘤细胞刺激时T细胞增殖能力的直方图。将A375细胞置于24孔板上,向板上加入不同比例的CFSE标记的T细胞(E:T为1:2和1:4)。3天后收获T细胞,用于CFSE稀释的FACS分析。数据表明,经肿瘤细胞刺激后,由MTX选择法(1G4-DHFRm KI+MTX)产生的T细胞增殖能力与未经选择产生的T细胞(1G4 KI)相当。
实施例8
本实施例表明,断裂-DHFR策略可以有效地富集双工程T细胞,并且这种富集以MTX剂量依赖性方式进行。
图28示出BC45和BC46双重转导的FACS结果。用编码MTX抗性鼠DHFRFS突变体(mDHFRmt)的BEAV逆转录病毒载体(载体A和B)对从两个血沉棕黄层BC45和BC46中分离出的活化人原代T细胞进行双重感染,该突变体拆分成N-末端的一半蛋白和C-末端的一半蛋白(载体A和B),并与同源二聚化(GCN4)或异源二聚化(JUN-FOS)亮氨酸拉链融合。载体A和B还分别编码一个Ly6G或CD90.2转导标记。在病毒感染后第3天进行转导效率的FACS分析。数据表明,使用载体对17-18(GCN4-mDHFRmt_A和GCN4-mDHFRmt_B)和载体对30-31(JUN-mDHFRmt_A-2A和FOS-mDHFRmt_B-2A)对细胞进行了有效转导。这些载体对的双重转导效率在34.4%至72.4%之间。相反,载体对21-22(JUN-mDHFRmt_A和FOS-mDHFRmt_B)和载体对23-24(GCN4-mDHFRmt_A-2A和GCN4-mDHFRmt_B-2A)的双重转导效率相对较低(从0.058%到0.12%)。为了确定是否可以富集双重转导细胞,将载体对17-18和载体对30-31的细胞与大量未转导的细胞混合,以模拟低转导效率环境。
图29示出了BC 45细胞的MTX选择结果。图28的BC45细胞未经处理(第1行),或用25nM(第2行)或50nM(第3行)MTX处理4天(测定转导效率之后),之后通过FACS分析测量双重转导细胞的富集。数据表明,用载体对17-18感染的细胞从11%被富集到41%(25nM MTX;3.7倍)和67%(50nM MTX;6.1倍),用载体对21-22感染的细胞从0.12%被富集到0.53%(50nM MTX;4.4倍),用载体对23-24感染的细胞从0.18%被富集到2.18%(50nM MTX;12倍),以及用载体对30-31感染的细胞从6%被富集到32%(25nM MTX;5.3倍)和63%(50nMMTX;10.5倍)。总之,这些数据表明断裂-DHFR策略可以有效地富集双工程T细胞,并且这种富集以MTX剂量依赖性方式进行。
图30示出了BC 46细胞的MTX选择结果。图28的BC46细胞不作处理(第1行),或用25nM(第2行)或50nM(第3行)MTX处理4天(测定转导效率之后),之后通过FACS分析测量双重转导细胞的富集。数据表明,用载体对17-18感染的细胞从13%被富集到38%(25nM MTX;2.9倍)和68%(50nM MTX;5.2倍),用载体对21-22感染的细胞从0.05%被富集至0.31%(50nM MTX;6.2倍),用载体对23-24感染的细胞从0.14%被富集到0.82%(50nM MTX;5.9倍),用载体对30-31感染的细胞从7%被富集到25%(25nM MTX;3.6倍)和58%(50nM MTX;8.3倍)。总之,这些数据表明断裂-DHFR策略可以有效地富集双工程T细胞,并且这种富集以MTX剂量依赖性方式进行。
图31示出了在较高的MTX浓度下选择BC 45细胞的结果。来自图29的BC45细胞用100nM MTX再连续处理3天,之后通过FACS分析测量双重转导细胞的富集。数据表明,用载体对17-18感染的细胞从7.85%被富集到65.9%(第2行;8.4倍)和75.8%(第3行;9.7倍),用载体对21-22感染的细胞从0.03%被富集到0.34%(第2行;11.3倍)和2.82%(第3行;94倍),用载体对23-24感染的细胞从0.08%被富集到2.33%(第2行;29倍)和11%(第3行;138倍),用载体对30-31感染的细胞从4.4%被富集到68%(第2行;15.5倍)和83%(第3行;18.9倍)。总之,这些数据表明断裂-DHFR策略可以有效地富集双工程T细胞,并且这种富集以MTX剂量依赖性方式进行。
图32示出了在较高MTX浓度下选择BC 46细胞的结果。来自图30的BC46细胞用100nM MTX再连续处理3天,之后通过FACS分析测量双重转导细胞的富集。数据表明,用载体对17-18感染的细胞从9.86%被富集到59%(第2行;6倍)和80%(第3行;8.1倍),用载体对21-22感染的细胞从0.05%被富集到0.2%(第2行;4倍)和1.16%(第3行;23.2倍),用载体对23-24感染的细胞从0.07%被富集到0.4%(第2行;5.7倍)和1.83%(第3行;26.1倍),用载体对30-31感染的细胞从4.5%被富集到47%(第2行;10.4倍)和76%(第3行;16.9倍)。总之,这些数据表明断裂-DHFR策略可以有效地富集双工程T细胞,并且这种富集以MTX剂量依赖性方式进行。
实施例9
本实施例表明,使用突变的JUN-FOS亮氨酸拉链的断裂-DHFR系统可以以与使用野生型JUN-FOS亮氨酸拉链的系统相当的效率富集双工程T细胞。
图43A和43B示出了双工程BC54 T细胞的MTX选择结果。用编码MTX抗性小鼠DHFRFS突变体(mDHFR)的BEAV逆转录病毒载体双重感染从BC54血沉棕黄层中分离出的活化人原代T细胞,该突变体被拆分为N-末端的一半蛋白和C-末端的一半蛋白(载体A和B),与异二聚化的JUN-FOS亮氨酸拉链融合。JUNWT描述的是野生型JUN亮氨酸拉链,FOSWT描述的是野生型FOS亮氨酸拉链,JUNMUT3AA描述的是含有来自FOS的三个酸性氨基酸的突变型JUN亮氨酸拉链,FOSMUT3AA描述的是含有来自JUN的三个碱性氨基酸的突变型FOS亮氨酸拉链。载体A和B还分别编码Ly6G和CD90.2转导标记。从转导后4天开始,细胞或不作处理(第1行),或用100nMMTX处理2天(第2行),之后通过FACS分析测量双重转导细胞的富集。数据表明,用载体对JUNWT-mDHFR_A+FOSWT-mDHFR_B感染的细胞从7.97%被富集到54.1%(6.8倍),用载体对JUNMUT3AA-mDHFR_A+FOSMUT3AA-mDHFR_B感染的细胞从10.3%被富集到57.9%(5.6倍),用载体对JUNWT-mDHFR_A+FOSMUT3AA-mDHFR_B感染的细胞从6.26%被富集到12.0%(1.9倍),并且用载体对JUNMUT3AA-mDHFR_A+FOSWT-mDHFR_B感染的细胞从7.73%被富集到30.5%(3.9倍)。总之,这些数据表明,使用带有三个电荷对突变的突变JUN-FOS亮氨酸拉链的断裂-DHFR系统可以有效地富集双工程T细胞,但三个电荷对突变不足以消除与野生型JUN和FOS亮氨酸拉链的相互作用。
图44A-44D示出了双工程BC76 T细胞的MTX选择结果。用编码MTX抗性鼠DHFRFS突变体(mDHFR)的逆转录病毒载体双重感染从BC76血沉棕黄层中分离出的活化人原代T细胞,该突变体拆分为N-末端的一半蛋白和C-末端的一半蛋白(载体A和B),与异二聚化JUN-FOS亮氨酸拉链融合。JUNWT描述的是野生型JUN亮氨酸拉链,FOSWT描述的是野生型FOS亮氨酸拉链,JUNMUT3AA描述的是含有来自FOS的三个酸性氨基酸的突变型JUN亮氨酸拉链,FOSMUT3AA描述的是含有来自JUN 的三个碱性氨基酸的突变型FOS亮氨酸拉链,JUNMUT4AA描述的是含有来自FOS的4个酸性氨基酸的突变型JUN亮氨酸拉链,FOSMUT4AA描述的是含有来自JUN的4个碱性氨基酸的突变型FOS亮氨酸拉链。载体A和B还分别编码Ly6G和CD90.2转导标记。从转导后4天开始,细胞或不作处理(第1行),或用100nM MTX处理10天(第2行),之后通过FACS 分析测量双重转导细胞的富集。数据表明,用载体对JUNWT-mDHFR_A+FOSWT-mDHFR_B感染的细胞从0.61%被富集到80.4%(132倍),用载体对JUNMUT3AA-mDHFR_A+FOSMUT3AA-mDHFR_B感染的细胞从0.98%被富集到70.9%(72倍),用载体对JUNWT-mDHFR_A+FOSMUT3AA-mDHFR_B感染的细胞从0.97%被富集到3.01%(3.1倍),用载体对JUNMUT3AA-mDHFR_A+FOSWT-mDHFR_B感染的细胞从1.09%被富集到20.9%(19倍),用载体对JUNMUT4AA-mDHFR_A+FOSMUT4AA-mDHFR_B感染的细胞从1.04%被富集到72.6%(70倍),用载体对JUNWT-mDHFR_A+FOSMUT4AA-mDHFR_B感染的细胞从1.00%被富集至1.42%(1.4倍),用载体对JUNMUT4AA-mDHFR_A+FOSWT-mDHFR_B感染的细胞从0.86%被富集到2.23%(2.6倍)。总之,这些数据表明,使用带有四个电荷对突变的突变JUN-FOS亮氨酸拉链的断裂-DHFR系统可以有效地富集双工程T细胞,并且四个电荷对突变足以在很大程度上消除与野生型JUN和FOS亮氨酸拉链的相互作用。
实施例10
本实施例表明,在化学二聚化诱导剂AP1903存在的情况下,使用突变的FKBP12二聚化结构域的断裂-DHFR系统可以富集双工程T细胞。
图45A-45B示出了双工程BC81 T细胞的MTX选择结果。用编码MTX抗性鼠DHFRFS突变体(mDHFR)的逆转录病毒载体双重感染从BC81血沉棕黄层中分离出的活化人原代T细胞,该突变体拆分为N-末端的一半蛋白和C-末端的一半蛋白(载体A和B),与同源二聚化突变FKBP12结构域融合。未转导的描述的是未经转导的细胞,FKBP12F36V描述的是含有F36V突变的FKBP12蛋白,可增强与AP1903二聚剂药物(dimerizer drug)的结合。载体A和B还分别编码一个Ly6G和CD90.2转导标记。从转导后4天开始,细胞或不作处理(第1和2列),或用10nMAP1903处理4小时(第3列)。随后,细胞不作处理(第1行),或用100nM MTX处理8天(第2行),之后通过FACS分析测量双重转导细胞的富集。数据表明,用载体对FKBP12F36V-mDHFR_A+FKBP12F36V-mDHFR_B感染的未经AP1903处理的细胞从0.051%被富集到0.042%(0.82倍),用载体对FKBP12F36V-mDHFR_A+FKBP12F36V-mDHFR_B感染的经过AP1903处理的细胞从0.061%被富集到18.1%(297倍)。总之,这些数据表明,使用突变FKBP12二聚化结构域的断裂-DHFR系统可以有效富集双工程T细胞,并且这种富集以AP1903依赖性方式进行。
实施例11
本实施例表明,使用突变FKBP12二聚化结构域或突变JUN-FOS亮氨酸拉链的断裂-DHFR系统可以富集将第一外源蛋白敲入第一基因座并将第二外源蛋白敲入第二基因座的双工程T细胞。
图46示出双工程BC78 T细胞的MTX选择结果。用Cas9 RNP和编码MTX抗性鼠DHFRFS突变体(mDHFR)的修复模板,对从BC78血沉棕黄层中分离出的活化人原代T细胞进行电穿孔,该突变体拆分为N-末端的一半蛋白和C-末端的一半蛋白(修复模板A和B),与同源二聚化突变FKBP12结构域或异源二聚化突变JUN-FOS亮氨酸拉链融合。未编辑的描述的是未进行电穿孔细胞,FKBP12F36V-mDHFR_A描述的是编码NY-ESO-1 1G4 TCR的修复模板和包含F36V突变的FKBP12蛋白的TRAC基因座敲入,FKBP12F36V-mDHFR_B描述的是编码显性-阴性TGFBR2、Ly6G和包含F36V突变的FKBP12蛋白的修复模板的B2M基因座敲入,JUNMUT4AA-mDHFR_A描述的是编码NY-ESO-1 1G4 TCR的修复模板和含有4个来自FOS的酸性氨基酸的突变JUN亮氨酸拉链,并且FOSMUT4AA-mDHFR_B描述的是编码显性阴性TGFBR2的修复模板、Ly6G和含有4个来自JUN的碱性氨基酸的突变FOS亮氨酸拉链的B2M基因座敲入。从电穿孔后4天开始,细胞或不作处理(第1和3列)或用10nM AP1903处理1小时(第2列)。随后,细胞或不作处理(第1行),或用100nM MTX处理6天(第2行),之后通过FACS分析测量双工程细胞的富集。数据表明,用修复模板对FKBP12F36V-mDHFR_A+FKBP12F36V-mDHFR_B编辑的细胞从0.21%被富集到22.1%(105倍),用修复模板对JUNMUT4AA-mDHFR_A+FOSMUT4AA-mDHFR_B编辑的细胞从0.22%被富集到11.8%(54倍)。总之,这些数据表明,使用突变FKBP12二聚化结构域或具有四个电荷对突变的突变体JUN-FOS亮氨酸拉链的断裂-DHFR系统可以有效地富集将多个外源蛋白敲入两个不同的基因座的双工程T细胞。
实施例12
本实施例表明,使用突变JUN-FOS亮氨酸拉链的断裂-DHFR系统可以以与使用野生型JUN-FOS亮氨酸拉链的系统相当的效率富集双工程T细胞。
图47A、47B和48示出了从供体A和B中MTX选择双工程化T细胞的结果。用编码MTX抗性鼠DHFRFS突变体(mDHFR)的逆转录病毒载体双重感染从两个血沉棕黄层A和B中分离出的活化人原代T细胞,所述突变体拆分为N-末端的一半蛋白和C-末端的一半蛋白(载体A和B),与异源二聚化的JUN-FOS亮氨酸拉链融合。JUNWT描述的是野生型JUN亮氨酸拉链,FOSWT描述的是野生型FOS亮氨酸拉链,JUNMUT3AA描述的是含有3个来自FOS的酸性氨基酸的突变型JUN亮氨酸拉链,FOSMUT3AA描述的是含有3个来自JUN的碱性氨基酸的突变型FOS亮氨酸拉链。载体A和B还分别编码Ly6G和CD90.2转导标记。从转导后4天开始,(来自供体B的)细胞或不作处理(图47A和47B,第1行),或用100nM MTX处理4天(图47A和47B,第2行),之后通过FACS分析测量双重转导细胞的富集。数据表明,用载体对JUNWT-mDHFR_A+FOSWT-mDHFR_B感染的细胞(来自供体B)从5.18%被富集到80.5%(15.5倍),用载体对JUNMUT3AA-mDHFR_A+FOSMUT3AA-mDHFR_B感染的细胞从8.37%被富集到88.1%(10.5倍),用载体对JUNWT-mDHFR_A+FOSMUT3AA-mDHFR_B感染的细胞从5.24%被富集到20.8%(4倍),以及用载体对JUNMUT3AA-mDHFR_A+FOSWT-mDHFR_B感染的细胞从6.28%被富集到70.5%(11.2倍)。总之,这些数据表明,使用带有3个电荷对突变的突变JUN-FOS亮氨酸拉链的断裂-DHFR系统可以有效地富集双工程T细胞,但3个电荷对突变不足以消除与野生型JUN和FOS亮氨酸拉链的相互作用。图48示出了来自供体A和供体B两者的细胞的FACS定量数据。
图49和50示出了从两个供体MTX选择双工程化T细胞的结果。用编码MTX抗性小鼠DHFRFS突变体(mDHFR)的逆转录病毒载体双重感染从两个供体(A和B)的血沉棕黄层中分离出的活化人原代T细胞,该突变体拆分成N-末端的一半蛋白和C-末端的一半蛋白(载体A和B),与长度更短的异源二聚化JUN-FOS亮氨酸拉链融合(本幻灯片(slides)中描述的所有FOS JUN亮氨酸拉链的长度都更短)。JUNWT描述的是野生型JUN亮氨酸拉链,FOSWT描述的是野生型FOS亮氨酸拉链,JUNMUT3AA描述的是含有3个来自FOS的酸性氨基酸的突变型JUN亮氨酸拉链,FOSMUT3AA描述的是含有3个来自JUN的碱性氨基酸的突变型FOS亮氨酸拉链,JUNMUT4AA描述的是含有4个来自FOS的酸性氨基酸的突变型JUN亮氨酸拉链,FOSMUT4AA描述的是含有4个来自JUN的碱性氨基酸的突变型FOS亮氨酸拉链。载体A和B还分别编码Ly6G和CD90.2转导标记。从转导后4天开始,细胞或不作处理,或用100nM MTX处理6天,之后通过FACS分析测量双重转导细胞的富集。数据(图49)表明,用载体对JUNWT-mDHFR_A+FOSWT-mDHFR_B感染的细胞富集了66±6.6倍(供体A)和7.6±1.1倍(供体B),用载体对JUNMUT3AA-mDHFR_A+FOSMUT3AA-mDHFR_B感染的细胞富集了49±1.5倍(供体A)、6.6±0.9倍(供体B),用载体对JUNWT-mDHFR_A+FOSMUT3AA-mDHFR_B感染的细胞富集了1.7±0.1倍(供体A)和1.4±0.17倍(供体B),用JUNMUT3AA-mDHFR_A+FOSWT-mDHFR_B感染的细胞富集了3.2±0.66倍(供体A)和1.5±0.38倍(供体B)。数据(图50)表明,用载体对JUNMUT4AA-mDHFR_A+FOSMUT4AA-mDHFR_B感染的细胞富集了39±13倍(供体A)和4.7±0.32倍(供体B),用载体对JUNWT-mDHFR_A+FOSMUT4AA-mDHFR_B感染的细胞富集了1.5±0.13倍(供体A)和1.2±0.043倍(供体B)倍,并且用载体对JUNMUT4AA-mDHFR_A+FOSWT-mDHFR_B感染的细胞富集了2.2±0.43倍(供体A)和1.5±0.21倍(供体B)。总之,这些数据表明,使用具有3个或4个电荷对突变的较短的JUN-FOS亮氨酸拉链的断裂-DHFR系统可以有效地富集双工程T细胞,并且3个或4个电荷对突变足以在很大程度上消除与野生型JUN和FOS亮氨酸拉链的相互作用。
实施例13
本实施例表明,使用8个电荷对突变JUN-FOS亮氨酸拉链的断裂-DHFR系统不能富集双工程T细胞。
图51A、51B和52示出了从供体A和B中MTX选择双工程化T细胞的结果。用编码MTX抗性鼠DHFRFS突变体(mDHFR)双重感染从两个血沉棕黄层A和B中分离出的活化人原代T细胞,所述突变体拆分为N-末端的一半蛋白和C-末端的一半蛋白(载体A和B),与异源二聚化JUN-FOS亮氨酸拉链融合。sJUN描述的是较短的野生型JUN亮氨酸拉链,sFOS描述的是野生型FOS亮氨酸拉链,sJUNMUT8AA描述的是含有8个来自FOS的酸性氨基酸的较短突变型JUN亮氨酸拉链,sFOSMUT8AA描述的是含有8个来自JUN的碱性氨基酸的突变型FOS亮氨酸拉链。载体A和B还分别编码了Ly6G和CD90.2转导标记。从转导后4天开始,(来自供体B的)细胞或不作处理(图51A和51B,第1行),或用100nM MTX处理6天(图51A和51B,第2行),之后通过FACS分析测量双重转导细胞的富集。数据(图51A和51B)表明,用载体对sJUN-mDHFR_A+sFOS-mDHFR_B感染的细胞(来自供体A)从6.52%被富集到80.4%(12.3倍),用载体对sJUNMUT8AA-mDHFR_A+sFOSMUT8AA-mDHFR_B感染的细胞从0.48%被富集到1.07%(2.2倍),用载体对sJUN-mDHFR_A+sFOSMUT8AA-mDHFR_B感染的细胞从3.91%被富集到6%(1.5倍),并且用载体对sJUNMUT8AA-mDHFR_A+sFOS-mDHFR_B感染的细胞从0.82%被富集到0.73%(0.9倍)。图52中的数据示出了来自供体A和B两者的FACS图的定量。总之,这些数据表明,使用带有8个电荷对突变的突变JUN-FOS亮氨酸拉链的断裂DHFR系统不能富集双工程T细胞。
实施例14
本实施例表明,在化学二聚化诱导剂AP1903存在的情况下,使用突变FKBP12二聚化结构域的断裂-DHFR系统可以富集双工程T细胞。
图53示出了来自供体A和B的双工程化T细胞的MTX选择结果。用编码MTX抗性小鼠DHFRFS突变体(mDHFR)双重感染从两个血沉棕黄层供体A和B中分离出的活化的人原代T细胞,所述突变体拆分为N-末端的一半蛋白和C-末端的一半蛋白(载体A和B),与同源二聚化突变FKBP12结构域融合。未转导的描述的是未经转导的细胞,FKBP12F36V描述的是含有F36V突变的FKBP12蛋白,该突变可增强与AP1903二聚剂药物的结合。载体A和B还分别编码一个Ly6G和CD90.2转导标记。从转导后4天开始,细胞或不作处理,或用10nM AP1903处理4小时。随后,细胞不作处理,或用100nM MTX处理6天,之后通过FACS分析测量双重转导细胞的富集。数据表明,用载体对FKBP12F36V-mDHFR_A+FKBP12F36V-mDHFR_B感染的经过AP1903处理的细胞分别富集了188±53倍(供体A)和39±18倍(供体B)。总之,这些数据表明,使用突变FKBP12二聚化结构域的断裂-DHFR系统可以有效地富集双工程T细胞。
实施例15
本实施例表明,B2M向导序列(guide)可以介导B2M基因座的高效切割。
图54示出了靶向B2M基因座的高效向导序列的筛选结果。将靶向不同B2M基因座的5个Cas9 RNP与从血沉棕黄层中分离出的活化的人原代T细胞一起进行电穿孔。电穿孔后两天,通过测量HLA-ABC表达对细胞进行FACS分析。数据表明,crB2M-4和crB2M-5均可靶向B2M基因座,敲除效率在80%以上。基于该数据,选择crB2M-4和crB2M-5进行后续敲入实验。
示例性配置(a):
1.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将至少一种能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列的两部分核苷酸序列导入细胞,
其中,所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被降低到所述细胞在正常细胞培养基中不能存活和/或增殖的水平,
其中,所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且
其中,所述至少一种两部分核苷酸序列包含编码存活和/或增殖所必需的蛋白或其变体的第一部分核苷酸序列,和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码目的蛋白;和
ⅱ)在没有药理学外源选择压力的正常细胞培养基中培养所述细胞,以选择或富集表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞。
2.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的水平降低到细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)将至少一种能够在细胞中同时表达第一部分核苷酸序列和第二部分核苷酸序列的两部分核苷酸序列导入所述细胞,并且所述两部分核苷酸序列包含编码第一蛋白或其变体的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,
其中所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且
其中所述第二部分蛋白是目的蛋白,和
ⅲ)在没有药物外源选择压力的情况下,在正常的体外增殖条件下培养所述细胞,以富集表达第一蛋白和第二蛋白两者的细胞。
3.根据配置1或2中任一项所述的方法,其中所述必需的蛋白的水平的降低可以是永久性的或暂时性的。
4.根据配置2-3中任一项所述的方法,其中所述必需的蛋白的水平的降低包括敲除编码所述必需的蛋白的基因。
5.根据配置4所述的方法,其中所述敲除由CRISPR核糖核蛋白(RNP)、TALEN、MegaTAL或任何其他核酸酶介导。
6.根据配置2-3中任一项所述的方法,其中所述必需的蛋白的水平的降低包括所述必需的蛋白水平在RNA水平上的瞬时降低。
7.根据配置6所述的方法,其中所述瞬时抑制是通过siRNA,miRNA,或CRISPR干扰(CRISPRi)实现的。
8.根据配置1-7中任一项所述的方法,其中所述细胞是T细胞、NK细胞、NKT细胞、iNKT细胞、造血干细胞、间充质干细胞、iPSC、神经前体细胞、视网膜基因治疗中的细胞类型或任何其他细胞。
9.根据配置1-8中任一项所述的方法,其中所述第一部分核苷酸序列在核苷酸序列上被改变以实现核酸酶、siRNA、miRNA或CRISPRi抗性。
10.根据配置9所述的方法,其中所述第一部分核苷酸序列编码具有与所述必需的第一蛋白相同的氨基酸序列的蛋白。
11.根据前述配置中任一项所述的方法,其中所述第一部分核苷酸序列被改变以编码具有与所述第一蛋白不同的氨基酸序列的改变的蛋白。
12.根据配置11所述的方法,其中所述改变的蛋白具有所述第一蛋白不具有的特定特征。
13.根据配置12所述的方法,其中所述特定特征包括但不限于以下一项或多项:活性降低、活性增加和半衰期改变。
14.根据前述配置中任一项所述的方法,其中所述第一部分核苷酸序列和第二部分核苷酸序列两者都可以由同一启动子或不同的启动子驱动。
15.根据前述配置中任一项所述的方法,其中所述第二部分核苷酸序列包含至少一种治疗基因。
16.根据前述配置中任一项所述的方法,其中所述第二部分核苷酸序列编码包含TCRα链和TCRβ链的新生抗原T细胞受体复合物(TCR)。
17.根据前述配置中任一项所述的方法,其中所述必需的蛋白或第一蛋白是二氢叶酸还原酶(DHFR)、肌苷一磷酸脱氢酶2(IMPDH2)、O-6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)、脱氧胞苷激酶(DCK)、次黄嘌呤磷酸核糖基转移酶1(HPRT1)、白细胞介素2受体亚单位γ(IL2RG)、肌动蛋白β(ACTB)、真核翻译延伸因子1α1(EEF1A1)、甘油醛-3-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶1(PGK1)或转铁蛋白受体(TFRC)。
18.根据前述配置中任一项所述的方法,其中所述第一部分核苷酸序列包含核酸酶抗性或或siRNA抗性DHFR基因,并且所述第二部分核苷酸序列包含TRA基因和TRB基因。
19.根据配置18所述的方法,其中所述TRA基因、TRB基因和DHFR基因被可操作地配置为从一个开放阅读框中表达。
20.根据配置19所述的方法,其中所述TRA基因、TRB基因和DHFR基因由至少一种接头隔开。
21.根据配置20所述的方法,其中所述至少一种接头、TRA基因、TRB基因和DHFR基因的顺序如下:
TRA-接头-TRB-接头-DHFR,
TRA-接头-DHFR-接头-TRB,
TRB-接头-TRA-接头-DHFR,
TRB-接头-DHFR-接头-TRA,
DHFR-接头-TRA-接头-TRB,或
DHFR-接头-TRB-接头-TRA。
22.根据配置20或21所述的方法,其中所述至少一种接头是至少一种自切割2A肽和/或至少一种IRES元件。
23.根据配置18-22中任一项所述的方法,其中所述DHFR基因、TRA基因和TRB基因由内源性TCR启动子或任何其他合适的启动子驱动,所述启动子包括但不限于以下启动子:TRAC、TRBC1/2、DHFR、EEF1A1、ACTB、B2M、CD52、CD2、CD3G、CD3D、CD3E、LCK、LAT、PTPRC、IL2RG、ITGB2、TGFBR2、PDCD1、CTLA4、FAS、TNFRSF1A(TNFR1)、TNFRSF10B(TRAILR2)、ADORA2A、BTLA、CD200R1、LAG3、TIGIT、HAVCR2(TIM3)、VSIR(VISTA)、IL10RA、IL4RA、EIF4A1、FTH1、FTL、HSPA5和PGK1。
24.根据前述配置中任一项所述的方法,其中所述两部分核苷酸序列被整合到所述细胞的基因组中。
25.根据前述配置中任一项所述的方法,其中当将至少一种两部分核苷酸序列插入靶基因组中的预定位点时,所述至少一种两部分核苷酸序列变得可操作用于表达,并且第一部分核苷酸序列和第二部分核苷酸序列均由所述靶基因组中的启动子驱动。
26.根据配置24或25所述的方法,其中所述整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。
27.根据配置26所述的方法,其中所述核酸酶介导的位点特异性整合是通过CRISPR RNP,任选地通过CRISPR/Cas9 RNP实现的。
28.根据配置27所述的方法,其还包括使用断裂蛋白内含肽系统。
29.根据配置1-23中任一项所述的方法,其中所述导入的两部分核苷酸序列未被整合到所述细胞的基因组中。
30.根据配置1-27中任一项所述的方法,其中将靶向内源性TCR恒定基因座的CRISPR RNP、编码核酸酶抗性DHFR基因的第一部分核苷酸序列和编码新生抗原TCR的第二部分核苷酸序列递送至所述细胞。
31.根据配置30所述的方法,其中所述内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。
32.根据配置30或31所述的方法,其中所述递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。
33.根据配置1-5、8-28或30-32中任一项所述的方法,其中第一CRISPR RNP用于敲除内源性二氢叶酸还原酶(DHFR)基因,第二CRISPR RNP用于将包含CRISPR核酸酶抗性(DHFR)基因的第一部分核苷酸序列和编码治疗性TCR基因的第二部分核苷酸序列敲入内源性TCR恒定基因座。
34.根据配置33所述的方法,其中所述第二CRISPR RNP是切割TRAC基因座用于敲入的TRAC RNP。
35.根据配置5、27、30、33或34中任一项所述的方法,其中所述CRISPR RNP是CRISPR/Cas9 RNP。
36.根据配置1-35中任一项所述的方法,其中所述正常细胞培养基是适于未修饰细胞的生长和/或增殖的培养基。
37.根据配置1-36中任一项所述的方法,其中所述正常细胞培养基没有任何外源选择压力。
38.根据配置5-37中任一项所述的方法,其中使用CRISPR RNP将第二种两部分核苷酸敲入所述靶基因组中的预定位点,可选地,其中所述靶基因组中的预定位点是B2M基因。
39.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将至少一种能够在细胞中同时表达第一部分核苷酸序列和第二部分核苷酸序列的两部分核苷酸序列导入细胞,
其中,所述细胞具有存活和/或增殖必需的蛋白的功能活性,所述功能活性被降低以至于所述细胞不能在正常细胞培养基中存活和/或增殖,其中所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且
其中,所述至少一种两部分核苷酸序列包含编码第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,所述第一蛋白提供与存活和/或增殖所必需的蛋白基本等同的功能,其中所述第二蛋白是目的蛋白;和
ⅱ)在细胞培养基中培养所述细胞,所述细胞培养基中含有至少一种导致表达所述第一蛋白和所述第二蛋白两者的细胞的富集或选择的补充剂。
40.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的功能活性降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平;
ⅱ)将至少一种两部分核苷酸序列导入所述细胞,所述两部分核苷酸序列能够在细胞中同时表达第一部分核苷酸序列和第二部分核苷酸序列,并且所述两部分核苷酸序列包含编码提供基本上等同的功能的第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,
其中所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且
其中所述第二蛋白是目的蛋白,和
ⅲ)在细胞培养基中培养所述细胞,所述细胞培养基中含有至少一种导致表达第一蛋白和第二蛋白两者的细胞的选择或富集的补充剂。
41.根据配置39或40所述的方法,其中所述细胞是T细胞、NK细胞、NKT细胞、iNKT细胞、造血干细胞、间充质干细胞、iPSC、神经前体细胞、视网膜基因治疗中的细胞类型或任何其他细胞。
42.根据配置39-41中任一项所述的方法,其中所述第一部分核苷酸序列在核苷酸序列上被改变以实现核酸酶、siRNA、miRNA或CRISPRi抗性,并且a)编码具有与所述第一蛋白相同的氨基酸序列的蛋白,或者b)编码相对于第一蛋白具有调整的功能的蛋白。
43.根据配置39-42中任一项所述的方法,其中所述第一部分核苷酸序列被改变以编码改变的蛋白,所述改变的蛋白具有与所述第一蛋白不同的氨基酸序列。
44.根据配置43所述的方法,其中所述改变的蛋白具有所述第一蛋白不具有的特定特征。
45.根据配置44所述的方法,其中所述特定特征包括但不限于以下一项或多项:活性降低、活性增加、对小分子抑制的半衰期抗性改变以及结合小分子后活性增加。
46.根据配置39-45中任一项所述的方法,其中所述第一部分核苷酸序列和第二部分核苷酸序列两者都可以由同一启动子或不同的启动子驱动。
47.根据配置39-46中任一项所述的方法,其中所述第二部分核苷酸序列包含至少一种治疗基因。
48.根据配置39-47中任一项所述的方法,其中所述第二部分核苷酸序列编码包含TCRα链和TCRβ链的新生抗原T细胞受体复合物(TCR)。
49.根据配置39-48中任一项所述的方法,其中所述必需的蛋白或第一蛋白是二氢叶酸还原酶(DHFR)、肌苷一磷酸脱氢酶2(IMPDH2)、O-6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)、脱氧胞苷激酶(DCK)、次黄嘌呤磷酸核糖基转移酶1(HPRT1)、白细胞介素2受体亚单位γ(IL2RG)、肌动蛋白β(ACTB)、真核翻译延伸因子1α1(EEF1A1)、甘油醛-3-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶1(PGK1)或转铁蛋白受体(TFRC)。
50.根据配置39-49中任一项所述的方法,其中所述第一部分核苷酸序列包含蛋白抑制剂抗性DHFR基因,并且所述第二部分核苷酸序列包含TRA基因和TRB基因。
51.根据配置50所述的方法,其中所述TRA基因、TRB基因和DHFR基因被可操作地配置为从一个开放阅读框中表达。
52.根据配置51所述的方法,其中所述TRA基因、TRB基因和DHFR
基因由至少一种接头隔开。
53.根据配置52所述的方法,其中所述至少一种接头、TRA基因、TRB基因和DHFR基因的顺序如下:
TRA-接头-TRB-接头-DHFR,
TRA-接头-DHFR-接头-TRB,
TRB-接头-TRA-接头-DHFR,
TRB-接头-DHFR-接头-TRA,
DHFR-接头-TRA-接头-TRB,或
DHFR-接头-TRB-接头-TRA。
54.根据配置53所述的方法,其中所述至少一种接头是至少一种自切割2A肽和/或至少一种IRES元件。
55.根据配置50-54中任一项所述的方法,其中所述DHFR基因、TRA基因和TRB基因由内源性TCR启动子或任何其他合适的启动子驱动,所述启动子包括但不限于以下启动子:TRAC、TRBC1/2、DHFR、EEF1A1、ACTB、B2M、CD52、CD2、CD3G、CD3D、CD3E、LCK、LAT、PTPRC、IL2RG、ITGB2、TGFBR2、PDCD1、CTLA4、FAS、TNFRSF1A(TNFR1)、TNFRSF10B(TRAILR2)、ADORA2A、BTLA、CD200R1、LAG3、TIGIT、HAVCR2(TIM3)、VSIR(VISTA)、IL10RA、IL4RA、EIF4A1、FTH1、FTL、HSPA5和PGK1。
56.根据配置39-55中任一项所述的方法,其中所述两部分核苷酸序列被整合到所述细胞的基因组中。
57.根据配置39-56中任一项所述的方法,其中所述至少一种两部分核苷酸序列在插入靶基因组中的预定位点时变得可操作用于表达,并且所述第一部分核苷酸序列和第二部分核苷酸序列均由所述靶基因组中的启动子驱动。
58.根据配置57所述的方法,其中所述整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。
59.根据配置58所述的方法,其中所述核酸酶介导的位点特异性整合是通过CRISPR RNP,任选地通过CRISPR/Cas9 RNP实现的。
60.根据配置59所述的方法,其还包括使用所述断裂蛋白内含肽系统。
61.根据配置39-55中任一项所述的方法,其中所述导入的两部分核苷酸序列未被整合到所述细胞的基因组中。
62.根据配置39-60中任一项所述的方法,其中将靶向内源性TCR恒定基因座的CRISPR RNP、编码蛋白抑制剂抗性DHFR基因的第一部分核苷酸序列和编码新生抗原TCR的第二部分核苷酸序列递送至所述细胞。
63.根据配置62所述的方法,其中所述内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。
64.根据配置62或63所述的方法,其中所述递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。
65.根据配置62-64中任一项所述的方法,其中所述CRISPR RNP是切割所述TRAC基因座用于敲入的TRAC RNP。
66.根据配置59、62或65中任一项所述的方法,其中所述CRISPR RNP是CRISPR/Cas9 RNP。
67.根据配置39-66中任一项所述的方法,其中所述导致细胞富集或选择的补充剂是使通过流式细胞术或磁珠富集来富集所述细胞的抗体。
68.根据配置39-67中任一项所述的方法,其中所述补充剂在不同时表达所述第一蛋白和所述第二蛋白的情况下损害细胞的存活和/或增殖。
69.根据配置68所述的方法,其中所述第一蛋白介导所述细胞对所述补充剂介导的细胞存活和/或增殖损害的抗性。
70.根据配置39-69中任一项所述的方法,其中所述补充剂是氨甲蝶呤。
71.根据配置69或70中任一项所述的方法,其中所述第一蛋白是氨甲蝶呤抗性DHFR突变蛋白。
72.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将至少两种两部分核苷酸序列导入细胞,所述两部分核苷酸序列能够同时在所述细胞中表达第一部分核苷酸序列和第二部分核苷酸序列,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,
其中所述第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码第一目的蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中所述第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码第二目的蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中,当所述第一融合蛋白和所述第二融合蛋白两者在所述细胞中一起表达时,所述存活和/或增殖必需的蛋白的功能得到恢复;和
ⅱ)在导致选择表达第一两部分核苷酸序列和第二两部分核苷酸序列两者的细胞的条件下培养所述细胞。
73.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白抑制到细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)导入至少两种两部分核苷酸序列,所述两部分核苷酸序列能够在所述细胞中表达,
其中所述第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码第一目的蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中所述第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码第二目的蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中,当所述第一融合蛋白和所述第二融合蛋白两者在所述细胞中一起表达时,所述存活和/或增殖必需的蛋白的功能得到恢复,和
ⅲ)在导致富集同时表达第一融合蛋白和第二融合蛋白的细胞的体外增殖条件下培养所述细胞。
74.根据配置72或73所述的方法,其中所述必需的蛋白是DHFR蛋白。
75.根据配置74所述的方法,其中所述第一融合蛋白包含DHFR的N-末端部分,并且所述第二融合蛋白包含DHFR的C-末端部分。
76.根据配置74所述的方法,其中所述第一融合蛋白包含DHFR的C-末端部分,并且所述第二融合蛋白包含DHFR的N-末端部分。
77.根据配置74或75所述的方法,其中所述DHFR的N-末端部分包括SEQ ID NO:22。
78.根据配置74-77中任一项所述的方法,其中所述DHFR的C-末端部分包括SEQ IDNO:23。
79.根据配置72-78中任一项所述的方法,其中所述第一两部分核苷酸序列或第二两部分核苷酸序列中的第二部分核苷酸序列对所述细胞而言是外源性的。
80.根据配置72-79中任一项所述的方法,其中所述第一两部分核苷酸序列或第二两部分核苷酸序列中的第二部分核苷酸序列是TCR。
81.根据配置72-80中任一项所述的方法,其中所述第一结合结构域和第二结合结构域源自GCN4。
82.根据配置72-81中任一项所述的方法,其中所述第一结合结构域和/或第二结合结构域包括SEQ ID NO:24。
83.根据配置72-82中任一项所述的方法,其中所述第一融合蛋白和所述第二融合蛋白包括SEQ ID NO:39或SEQ ID NO:40。
84.根据配置72-80中任一项所述的方法,其中所述第一结合结构域和第二结合结构域源自FKBP12。
85.根据配置84所述的方法,其中所述FKBP12具有F36V突变。
86.根据配置72-80、84或85中任一项所述的方法,其中所述第一结合结构域和/或第二结合结构域包括SEQ ID NO:31。
87.根据配置72-80或84-86中任一项所述的方法,其中所述第一融合蛋白和所述第二融合蛋白包括SEQ ID NO:62或SEQ ID NO:63。
88.根据配置72-80中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域源自JUN和FOS。
89.根据配置88所述的方法,其中所述第一结合结构域和所述第二结合结构域具有互补突变,以保持相互之间的结合。
90.根据配置89所述的方法,其中所述第一结合结构域和所述第二结合结构域都不结合天然结合配偶体。
91.根据配置72-80或88-90中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域各具有3至7个互补突变。
92.根据配置91所述的方法,其中所述第一结合结构域和所述第二结合结构域各具有3个互补突变。
93.根据配置72-80或88-92中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域包括SEQ ID NO:26或SEQ ID NO:29。
94.根据配置72-80或88-93中任一项所述的方法,其中所述第一融合蛋白和所述第二融合蛋白包括SEQ ID NO:35或SEQ ID NO:36。
95.根据配置91所述的方法,其中所述第一结合结构域和所述第二结合结构域各具有4个互补突变。
96.根据配置72-80、88-91或95中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域包括SEQ ID NO:27和SEQ ID NO:30。
97.根据配置72-80、88-91、95或96中任一项所述的方法,其中所述第一融合蛋白和所述第二融合蛋白包括SEQ ID NO:37和SEQ ID NO:38。
98.根据配置72-97中任一项所述的方法,其中所述至少两种两部分核苷酸序列被整合到所述细胞的基因组中。
99.根据配置72-98中任一项所述的方法,其中当将所述至少两种两部分核苷酸序列插入靶基因组中的预定位点时,所述至少两种两部分核苷酸序列变得可操作用于表达,并且所述第一部分核苷酸序列和第二部分核苷酸序列均由所述靶基因组中的启动子驱动。
100.根据配置98或99所述的方法,其中所述整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。
101.根据配置100所述的方法,其中所述核酸酶介导的位点特异性整合是通过CRISPR RNP实现的。
102.根据配置72-101中任一项所述的方法,其中通过靶向内源性TCR恒定基因座的CRISPR RNP将所述第一两部分核苷酸序列递送至所述细胞,所述第一种第一部分核苷酸序列编码DHFR蛋白的非功能部分,并且所述第一种第二部分核苷酸序列编码新生抗原TCR。
103.根据配置72-102中任一项所述的方法,其中通过靶向除了TCR恒定基因座之外的内源性基因座的CRISPR RNP将所述第二两部分核苷酸序列递送至所述细胞,所述第二种第一部分核苷酸序列编码DHFR蛋白的非功能部分,并且所述第二种第二部分核苷酸序列编码目的蛋白。
104.根据配置103所述的方法,其中所述第一种第一部分核苷酸序列和所述第二种第一部分核苷酸序列编码融合蛋白,所述融合蛋白包含当所述融合蛋白共表达时具有DHFR活性的DHFR蛋白的非功能部分。
105.根据配置102-104中任一项所述的方法,其中所述内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。
106.根据配置103-105中任一项所述的方法,其中除了TCR恒定基因座之外的内源性基因座是B2M基因座。
107.根据配置102-106中任一项所述的方法,其中所述递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。
108.根据配置101-107中任一项所述的方法,其中所述CRISPR RNP是CRISPR/Cas9RNP。
109.根据配置26-28、30-38、58-60、62-71或100-108中任一项所述的方法,其中所述核酸酶使得能够框内外显子整合到基因座中,以便由内源性启动子、内源性剪接位点和内源性终止信号表达所述两部分核苷酸之一的至少一部分。
110.根据配置26-28、30-38、58-60、62-71或100-108中任一项所述的方法,其中所述核酸酶使得能够框内外显子整合到基因座中,以便由内源性启动子、内源性剪接位点和外源性终止信号表达所述两部分核苷酸之一的至少一部分。
111.根据配置26-28、30-38、58-60、62-71或100-108中任一项所述的方法,其中所述核酸酶使得能够内含子整合到基因座中,以便由内源性启动子、外源性剪接受体位点和外源性终止信号表达所述两部分核苷酸之一的至少一部分。
112.根据配置1-80中任一项所述的方法,其中所述必需的蛋白或第一蛋白被拆分成至少两个单独的功能失调的蛋白部分,其中所述至少两个部分中的每一个均被融合到多聚体结构域,并且其中所述至少两个部分中的每一个均被整合到不同的两部分核苷酸序列中以允许选择其中表达所有不同的两部分核苷酸序列的细胞,任选地,其中所述必需的蛋白或第一蛋白的功能得到恢复。
113.根据配置1-80中任一项所述的方法,其中所述必需的蛋白或第一蛋白被拆分成功能失调的N-末端的一半蛋白和C-末端的一半蛋白,每一半蛋白均与同源或异源二聚化蛋白配偶体或断裂蛋白内含肽融合。
114.根据配置112或113中任一项所述的方法,其中所述必需的蛋白或第一蛋白是DHFR蛋白。
115.根据配置114所述的方法,其中第一功能失调的蛋白部分包含DHFR的N-末端部分,并且第二功能失调的蛋白部分包含DHFR的C-末端部分。
116.根据配置115所述的方法,其中所述DHFR的N-末端部分包括SEQ ID NO:22。
117.根据配置116所述的方法,其中所述DHFR的C-末端部分包括SEQ ID NO:23。
118.根据配置108-110中任一项所述的方法,其中所述同源二聚化蛋白是GCN4、FKBP12或它们的变体。
119.根据配置108-110中任一项所述的方法,其中所述异源二聚化蛋白是Jun/Fos或它们的变体。
120.根据配置72-76、80-83或108-111中任一项所述的方法,其中所述必需的蛋白的功能的恢复是诱导的,任选地通过AP1903诱导。
121.根据配置72-108中任一项所述的方法,其中所述培养步骤在氨甲蝶呤的存在下进行。
122.根据配置1-121中任一项所述的方法,其中所述目的蛋白是T细胞受体。
123.根据配置122所述的方法,其中所述T细胞受体对病毒或肿瘤抗原具有特异性。
124.根据配置123所述的方法,其中所述肿瘤抗原是肿瘤新生抗原。
125.根据前述配置中任一项所述的方法,其中所述基因工程细胞是原代人T细胞。
126.一种用于富集基因工程T细胞的方法,其包括
ⅰ)通过在TRA或TRB启动子下游整合两部分核苷酸序列,将包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码T细胞受体复合物或嵌合抗原受体的第二部分核苷酸序列的两部分核苷酸序列导入T细胞,和
ⅱ)在含有导致表达第一蛋白和第二蛋白两者的细胞的富集的氨甲蝶呤的细胞培养基中培养细胞。
127.一种用于富集经工程改造以表达外源性T细胞受体基因的T细胞的方法,其包括:
ⅰ)使用第一CRISPR/Cas9 RNP将内源性TRBC基因从其基因座上敲除;
ⅱ)使用第二CRISPR/Cas9 RNP将编码氨甲蝶呤抗性DHFR基因的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TRBC基因座,其中两种核苷酸序列可操作地连接以允许由内源性TRBC启动子表达;和
ⅲ)在含有导致表达治疗性TCR和氨甲蝶呤抗性DHFR基因两者的T细胞富集的氨甲蝶呤的细胞培养基中培养所述细胞。
128.一种用于选择基因工程细胞的方法,其包括:
ⅰ)将至少一种两部分核苷酸序列导入细胞,所述两部分核苷酸序列可操作用于在细胞中表达,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,并且
其中所述至少一种两部分核苷酸序列包含编码存活和/或增殖必需的蛋白的第一部分核苷酸序列,和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码对细胞而言是外源性的蛋白;和
ⅱ)在导致选择同时表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的条件下培养所述细胞。
129.一种用于富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到所述细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)导入至少一种两部分核苷酸序列,所述两部分核苷酸序列可操作用于在所述细胞中表达,并且包括编码所述第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中所述第二部分蛋白对所述细胞而言是外源性的,和
ⅲ)在导致同时表达第一蛋白和第二蛋白两者的细胞富集的体外增殖条件下培养所述细胞。
130.根据上述配置中任一项所述的方法制成的细胞。
131.一种T细胞,其包括:
内源性二氢叶酸还原酶(DHFR),其在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平,和
至少一种两部分核苷酸序列,其包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
132.一种T细胞,其包括:
内源性二氢叶酸还原酶(DHFR)的敲除,和
至少一种两部分核苷酸序列,其包含:
编码DHFR蛋白或其变体的第一部分核苷酸序列;和
编码T细胞受体的第二部分核苷酸序列,所述T细胞受体由内源性TRA或TRB启动子可操作地表达。
133.一种T细胞,其包括:
内源性二氢叶酸还原酶(DHFR),其被配置为在氨甲蝶呤的存在下被抑制到所述细胞不能存活和/或增殖的水平,和
至少两种两部分核苷酸序列,
其中所述第一两部分核苷酸序列包含:
i)第一种第一部分核苷酸序列,其编码DHFR蛋白或其变体的非功能性或功能失调部分;和
ⅱ)第一种第二部分核苷酸序列,其编码由内源性TRA或TRB启动子可操作地表达的T细胞受体,
其中所述第二种两部分核苷酸序列包含:
ⅲ)第二种第一部分核苷酸序列,其编码DHFR蛋白或其变体的非功能性或功能失调部分;和
iv)第二种第二部分核苷酸序列,其编码由内源性B2M启动子可操作地表达的目的蛋白,并且
其中所述细胞被配置为具有DHFR活性。
示例性配置(b):
1.一种用于选择基因工程细胞的方法,其包括:
ⅰ)导入至少一种可操作用于在细胞中表达的两部分核苷酸序列,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞在正常细胞培养基中不能存活和/或增殖的水平,并且
其中所述至少一种两部分核苷酸序列包含编码存活和/或增殖必需的蛋白的第一部分核苷酸序列,和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码对细胞而言是外源性的蛋白;和
ⅱ)在正常细胞培养基中培养细胞以选择表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞。
2.一种用于富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到所述细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)导入至少一种两部分核苷酸序列,所述两部分核苷酸序列可操作用于在所述细胞中表达,并且包括编码所述第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中所述第二部分蛋白对所述细胞而言是外源性的,和
ⅲ)在正常体外增殖条件下培养所述细胞以富集同时表达第一蛋白和第二蛋白的细胞。
3.根据配置2所述的方法,其中所述降低活性可以是永久性的或暂时性的。
4.根据配置2所述的方法,其中所述活性降低包括敲除编码所述必需的蛋白的基因。
5.根据配置4所述的方法,其中所述敲除由CRISPR核糖核蛋白(RNP)、TALEN、MegaTAL或任何其他核酸酶介导。
6.根据配置2所述的方法,其中所述活性降低包括所述必需的蛋白的活性的瞬时抑制。
7.根据配置6所述的方法,其中所述瞬时抑制是通过siRNA,miRNA,CRISPR干扰(CRISPRi)或蛋白抑制剂实现的。
8.根据配置1或2所述的方法,其中所述细胞是T细胞、造血干细胞、间充质干细胞、iPSC、神经前体细胞、视网膜基因治疗中的细胞类型或任何其他细胞。
9.根据配置1或2所述的方法,其中所述第一部分核苷酸序列在核苷酸序列上被改变以实现核酸酶、siRNA、miRNA或CRISPRi抗性,但是a)编码具有与所述第一蛋白相同的氨基酸序列的蛋白或者b)编码相对于所述第一蛋白具有调整的功能的蛋白。
10.根据配置1或2所述的方法,其中所述第一部分核苷酸序列被改变以编码改变的蛋白,所述改变的蛋白具有与所述第一蛋白不同的氨基酸序列。
11.根据配置10所述的方法,其中所述改变的蛋白具有所述第一蛋白不具有的特定特征。
12.根据配置11所述的方法,其中所述特定特征包括但不限于以下一项或多项:活性降低、活性增加、半衰期改变、对小分子抑制的抗性以及结合小分子后活性增加。
13.根据配置1或2所述的方法,其中所述至少一种核苷酸序列可操作用于同时表达所述第一部分核苷酸序列和第二部分核苷酸序列。
14.根据配置1或2所述的方法,其中所述第一部分核苷酸序列和第二部分核苷酸序列两者都可以由同一启动子或不同的启动子驱动。
15.根据配置1或2所述的方法,其中所述第二部分核苷酸序列包含至少一种治疗基因。
16.根据配置1或2所述的方法,其中所述第二部分核苷酸序列编码包含TCRα链和TCRβ链的新生抗原T细胞受体复合物(TCR)。
17.根据配置1或2所述的方法,其中所述必需的蛋白或第一蛋白是二氢叶酸还原酶(DHFR)、肌苷一磷酸脱氢酶2(IMPDH2)、O-6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)、脱氧胞苷激酶(DCK)、次黄嘌呤磷酸核糖基转移酶1(HPRT1)、白细胞介素2受体亚单位γ(IL2RG)、肌动蛋白β(ACTB)、真核翻译延伸因子1α1(EEF1A1)、甘油醛-3-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶1(PGK1)或转铁蛋白受体(TFRC)。
18.根据配置1或2所述的方法,其中所述第一部分核苷酸序列包含具有核酸酶抗性的、siRNA抗性的或蛋白抑制剂抗性的DHFR基因,并且所述第二部分核苷酸序列包含TRA基因和TRB基因。
19.根据配置18所述的方法,其中所述具有蛋白抑制剂抗性的DHFR基因是氨甲蝶呤抗性DHFR基因。
20.根据配置18所述的方法,其中所述TRA基因、TRB基因和DHFR基因被可操作地配置为从一个开放阅读框中表达。
21.根据配置20所述的方法,其中所述TRA基因、TRB基因和DHFR基因由接头隔开。
22.根据配置21所述的方法,其中所述接头、TRA基因、TRB基因和DHFR基因的顺序如下:
TRA-接头-TRB-接头-DHFR,
TRA-接头-DHFR-接头-TRB,
TRB-接头-TRA-接头-DHFR,
TRB-接头-DHFR-接头-TRA,
DHFR-接头-TRA-接头-TRB,或
DHFR-接头-TRB-接头-TRA。
23.根据配置22所述的方法,其中所述接头是自切割2A肽或IRES元件。
24.根据配置18所述的方法,其中所述DHFR基因、TRA基因和TRB基因由内源性TCR启动子或任何其他合适的启动子驱动,所述启动子包括但不限于以下启动子:TRAC、TRBC1/2、DHFR、EEF1A1、ACTB、B2M、CD52、CD2、CD3G、CD3D、CD3E、LCK、LAT、PTPRC、IL2RG、ITGB2、TGFBR2、PDCD1、CTLA4、FAS、TNFRSF1A(TNFR1)、TNFRSF10B(TRAILR2)、ADORA2A、BTLA、CD200R1、LAG3、TIGIT、HAVCR2(TIM3)、VSIR(VISTA)、IL10RA、IL4RA、EIF4A1、FTH1、FTL、HSPA5和PGK1。
25.根据配置1或2所述的方法,其中所述两部分核苷酸序列被整合到所述细胞的基因组中。
26.根据配置25所述的方法,其中所述整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。
27.根据配置26所述的方法,其中所述核酸酶介导的位点特异性整合是通过CRISPR/Cas9 RNP实现的。
28.根据配置27所述的方法,其还包括使用断裂蛋白内含肽系统。
29.根据配置1或2所述的方法,其中所述导入的两部分核苷酸序列未被整合到所述细胞的基因组中。
30.根据配置1或2所述的方法,其中将靶向内源性TCR恒定基因座的CRISPR RNP、编码核酸酶抗性DHFR基因的第一部分核苷酸序列和编码新生抗原TCR的所述第二部分核苷酸序列递送至所述细胞。
31.根据配置30所述的方法,其中所述内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。
32.根据配置30所述的方法,其中所述递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。
33.根据配置2所述的方法,其中使用第一CRISPR/Cas9 RNP敲除内源性二氢叶酸还原酶(DHFR)基因,并且使用第二CRISPR/Cas9 RNP将包含CRISPR/Cas9核酸酶抗性DHFR基因的第一部分核苷酸序列和编码治疗性TCR基因的第二部分核苷酸序列敲入到所述内源性TCR恒定基因座中。
34.根据配置33所述的方法,其中使用氨甲蝶呤抑制所述第一蛋白,并且使用CRISPR/Cas9 RNP将编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入所述内源性TCR恒定基因座。
35.根据配置33所述的方法,其中所述第二CRISPR/Cas9 RNP是切割TRAC基因座用于敲入的TRAC RNP。
36.根据配置1或2所述的方法,其中所述正常细胞培养基是适于未修饰细胞生长和/或增殖的培养基。
37.根据配置1或2所述的方法,其中所述正常细胞培养基没有外源选择压力,例如使得通过流式细胞术或磁珠富集来富集所述细胞的药物分子或抗体。
38.根据上述任何一种方法制成的细胞。
39.一种细胞,其包括:
内源性二氢叶酸还原酶(DHFR),其被抑制到所述细胞不能在正常细胞培养基中存活和/或增殖的水平,和
至少一种包含编码DHFR的第一部分核苷酸序列和编码新生抗原T细胞受体复合物的第二部分核苷酸序列的两部分核苷酸序列。
40.一种用于富集基因工程细胞的方法,其包括:
ⅰ)导入至少一种可操作用于在所述细胞中表达的两部分核苷酸序列,并且所述两部分核苷酸序列包括编码所述第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中所述第二部分蛋白对所述细胞而言是外源性的,和
ⅱ)在含有至少一种导致同时表达所述第一蛋白和所述第二蛋白的细胞富集的补充剂的细胞培养基中培养所述细胞。
41.根据配置40所述的方法,其中所述基因工程细胞是原代人T细胞。
42.根据配置40所述的方法,其中所述补充剂在不同时表达所述第一蛋白和所述第二蛋白的情况下损害细胞的存活和/或增殖。
43.根据配置40所述的方法,其中至少一种蛋白介导所述细胞对所述补充剂介导的细胞存活和/或增殖损害的抗性。
44.根据配置42所述的方法,其中所述补充剂是氨甲蝶呤。
45.根据配置40所述的方法,其中所述第一蛋白是氨甲蝶呤抗性DHFR突变蛋白。
46.根据配置40所述的方法,其中所述第二蛋白是T细胞受体。
47.根据配置46所述的方法,其中所述T细胞受体对病毒或肿瘤抗原具有特异性。
48.根据配置40所述的方法,其中所述第一部分核苷酸序列在核苷酸序列上被改变以实现核酸酶、siRNA、miRNA或CRISPRi抗性。
49.根据配置40所述的方法,其中所述至少一种两部分核苷酸序列的表达通过位点特异性整合入所述细胞的内源性基因座来实现。
50.根据配置49所述的方法,其中位点特异性整合入所述细胞的内源性基因座通过使用CRISPR/Cas9、TALEN、MegaTAL或允许无痕迹整合到基因座以使得能够由所述基因座的内源性启动子表达的任何其他核酸酶实现。
51.根据配置50所述的方法,其中所述核酸酶使得能够框内外显子整合到基因座中,以使得能够由内源性启动子、内源性剪接位点和内源性终止信号表达。
52.根据配置50所述的方法,其中所述核酸酶使得能够框内外显子整合到基因座中,以使得能够由内源性启动子、内源性剪接位点和外源性终止信号表达。
53.根据配置50所述的方法,其中所述核酸酶使得能够内含子整合到基因座中以使得能够由内源性启动子、外源性剪接受体位点和外源性终止信号表达。
54.根据配置40所述的方法,其中使用CRISPR/Cas9 RNP突变将编码氨甲蝶呤抗性DHFR突变蛋白的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TCR恒定基因座。
55.根据配置50和54所述的方法,其还包括用于敲除内源性TRAC或TRBC基因的第二CRISPR/Cas9 RNP。
56.一种用于富集基因工程T细胞的方法,其包括
ⅰ)通过在TRA或TRB启动子下游整合两部分核苷酸序列,将包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码T细胞受体复合物或嵌合抗原受体的第二部分核苷酸序列的两部分核苷酸序列导入T细胞,和
ⅱ)在含有导致表达第一蛋白和第二蛋白两者的细胞的富集的氨甲蝶呤的细胞培养基中培养细胞。
57.一种用于富集经工程改造以表达外源性T细胞受体基因的T细胞的方法,其包括:
ⅰ)使用第一CRISPR/Cas9 RNP将内源性TRBC基因从其基因座上敲除;
ⅱ)使用第二CRISPR/Cas9 RNP将编码氨甲蝶呤抗性DHFR基因的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TRBC基因座,其中两种核苷酸序列可操作地连接使得从内源性TRBC启动子的表达;和
ⅲ)在含有导致表达治疗性TCR和氨甲蝶呤抗性DHFR基因两者的T细胞富集的氨甲蝶呤的细胞培养基中培养所述细胞。
58.一种T细胞,其包括:
在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平的内源性二氢叶酸还原酶(DHFR),和
至少一种两部分核苷酸序列,其包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
59.根据配置1、2或40所述的方法,其中所述必需的蛋白或第一蛋白被拆分成至少两个单独的功能失调的蛋白部分,其中所述至少两个部分中的每一个均被融合到多聚体结构域,并且其中所述至少两个部分中的每一个均被整合到不同的两部分核苷酸序列中以允许选择其中表达所有不同的两部分核苷酸序列的细胞。
60.根据配置59所述的方法,其中所述必需的蛋白或第一蛋白被拆分成功能失调的N-末端的一半蛋白和C-末端的一半蛋白,每一半蛋白均与同源或异源二聚化蛋白配偶体或断裂蛋白内含肽融合。
61.根据配置59所述的方法,其中所述必需的蛋白或第一蛋白是DHFR蛋白。
62.一种用于选择基因工程细胞的方法,其包括:
ⅰ)导入至少一种可操作用于在细胞中表达的两部分核苷酸序列,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,并且
其中所述至少一种两部分核苷酸序列包含编码所述存活和/或增殖必需的蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码对细胞而言是外源性的蛋白;和
ⅱ)在导致选择同时表达第一部分和第二部分核苷酸序列两者的细胞的条件下培养所述细胞。
63.一种用于富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到所述细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)导入至少一种两部分核苷酸序列,所述两部分核苷酸序列可操作用于在所述细胞中表达,并且包括编码所述第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中所述第二部分蛋白对所述细胞而言是外源性的,和
ⅲ)在导致同时表达第一蛋白和第二蛋白两者的细胞富集的体外增殖条件下培养所述细胞。
64.一种用于选择基因工程细胞的方法,其包括:
ⅰ)导入至少两种可操作用于在细胞中表达的两部分核苷酸序列,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,
其中所述第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中所述第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中,当所述第一融合蛋白和所述第二融合蛋白在所述细胞中一起表达时,所述存活和/或增殖必需的蛋白的功能得到恢复;和
ⅱ)在导致选择同时表达第一两部分核苷酸序列和第二两部分核苷酸序列的细胞的条件下培养所述细胞。
65.一种用于富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到所述细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)导入至少两种可操作用于在细胞中表达的两部分核苷酸序列,
其中所述第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中所述第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码待表达蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中,当所述第一融合蛋白和所述第二融合蛋白两者在所述细胞中一起表达时,所述存活和/或增殖必需的蛋白的功能得到恢复,和
ⅲ)在导致富集同时表达第一融合蛋白和第二融合蛋白的细胞的体外增殖条件下培养所述细胞。
66.根据配置64或65所述的方法,其中所述必需的蛋白是DHFR蛋白。
67.根据配置64-66中任一项所述的方法,其中所述第一两部分核苷酸序列或第二两部分核苷酸序列的第二部分核苷酸序列对细胞而言是外源性的。
68.根据配置64-67中任一项所述的方法,其中所述第一两部分核苷酸序列或第二两部分核苷酸序列的第二部分核苷酸序列是TCR。
69.根据配置64-68中任一项所述的方法,其中所述第一结合结构域和第二结合结构域源自GCN4。
70.根据配置64-68中任一项所述的方法,其中所述第一结合结构域和第二结合结构域源自FKBP12。
71.根据配置70所述的方法,其中所述FKBP12具有F36V突变。
72.根据配置64-68中任一项所述的方法,其中所述第一结合结构域源自JUN,并且所述第二结合结构域源自FOS。
73.根据配置72所述的方法,其中所述第一结合结构域和所述第二结合结构域具有互补突变,以保持相互之间的结合。
74.根据配置73所述的方法,其中所述第一结合结构域和所述第二结合结构域都不结合天然结合配偶体。
75.根据配置72-74中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域各具有3至7个互补突变。
76.根据配置75所述的方法,其中所述第一结合结构域和第二结合结构域各具有3个互补突变。
77.根据配置75所述的方法,其中所述第一结合结构域和第二结合结构域各具有4个互补突变。
78.根据配置64-68、70或71中任一项所述的方法,其中所述必需的蛋白的功能的恢复是诱导的,任选地通过AP1903诱导。
79.根据配置64-78中任一项所述的方法,其中所述培养步骤在氨甲蝶呤存在下进行。
序列表
<110> 荷兰商新基因治疗公司
<120> 富集基因工程T细胞的方法
<130> KHP232110304.6
<150> US 63/221808
<151> 2021-07-14
<150> US 63/170269
<151> 2021-04-02
<150> US 63/135460
<151> 2021-01-08
<150> US 63/062854
<151> 2020-08-07
<160> 63
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 187
<212> PRT
<213> 智人(Homo sapiens)
<400> 1
Met Val Gly Ser Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly
1 5 10 15
Ile Gly Lys Asn Gly Asp Leu Pro Trp Pro Pro Leu Arg Asn Glu Phe
20 25 30
Arg Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln
35 40 45
Asn Leu Val Ile Met Gly Lys Lys Thr Trp Phe Ser Ile Pro Glu Lys
50 55 60
Asn Arg Pro Leu Lys Gly Arg Ile Asn Leu Val Leu Ser Arg Glu Leu
65 70 75 80
Lys Glu Pro Pro Gln Gly Ala His Phe Leu Ser Arg Ser Leu Asp Asp
85 90 95
Ala Leu Lys Leu Thr Glu Gln Pro Glu Leu Ala Asn Lys Val Asp Met
100 105 110
Val Trp Ile Val Gly Gly Ser Ser Val Tyr Lys Glu Ala Met Asn His
115 120 125
Pro Gly His Leu Lys Leu Phe Val Thr Arg Ile Met Gln Asp Phe Glu
130 135 140
Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Glu Lys Tyr Lys Leu Leu
145 150 155 160
Pro Glu Tyr Pro Gly Val Leu Ser Asp Val Gln Glu Glu Lys Gly Ile
165 170 175
Lys Tyr Lys Phe Glu Val Tyr Glu Lys Asn Asp
180 185
<210> 2
<211> 187
<212> PRT
<213> 智人(Homo sapiens)
<400> 2
Met Val Gly Ser Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly
1 5 10 15
Ile Gly Lys Asn Gly Asp Phe Pro Trp Pro Pro Leu Arg Asn Glu Ser
20 25 30
Arg Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln
35 40 45
Asn Leu Val Ile Met Gly Lys Lys Thr Trp Phe Ser Ile Pro Glu Lys
50 55 60
Asn Arg Pro Leu Lys Gly Arg Ile Asn Leu Val Leu Ser Arg Glu Leu
65 70 75 80
Lys Glu Pro Pro Gln Gly Ala His Phe Leu Ser Arg Ser Leu Asp Asp
85 90 95
Ala Leu Lys Leu Thr Glu Gln Pro Glu Leu Ala Asn Lys Val Asp Met
100 105 110
Val Trp Ile Val Gly Gly Ser Ser Val Tyr Lys Glu Ala Met Asn His
115 120 125
Pro Gly His Leu Lys Leu Phe Val Thr Arg Ile Met Gln Asp Phe Glu
130 135 140
Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Glu Lys Tyr Lys Leu Leu
145 150 155 160
Pro Glu Tyr Pro Gly Val Leu Ser Asp Val Gln Glu Glu Lys Gly Ile
165 170 175
Lys Tyr Lys Phe Glu Val Tyr Glu Lys Asn Asp
180 185
<210> 3
<211> 561
<212> DNA
<213> 智人(Homo sapiens)
<400> 3
atggttggtt cgctaaactg catcgtcgct gtgtcccaga acatgggcat cggcaagaac 60
ggggacctgc cctggccacc gctcaggaat gaattcagat atttccagag aatgaccaca 120
acctcttcag tagaaggtaa acagaatctg gtgattatgg gtaagaagac ctggttctcc 180
attcctgaga agaatcgacc tttaaagggt agaattaatt tagttctcag cagagaactc 240
aaggaacctc cacaaggagc tcattttctt tccagaagtc tagatgatgc cttaaaactt 300
actgaacaac cagaattagc aaataaagta gacatggtct ggatagttgg tggcagttct 360
gtttataagg aagccatgaa tcacccaggc catcttaaac tatttgtgac aaggatcatg 420
caagactttg aaagtgacac gttttttcca gaaattgatt tggagaaata taaacttctg 480
ccagaatacc caggtgttct ctctgatgtc caggaggaga aaggcattaa gtacaaattt 540
gaagtatatg agaagaatga t 561
<210> 4
<211> 561
<212> DNA
<213> 智人(Homo sapiens)
<400> 4
atggtaggct ccctgaactg tatagttgcg gtatcccaaa atatggggat tggaaagaac 60
ggagaccttc cgtggccgcc cctccgaaat gaatttcgat actttcagag aatgacaact 120
acctcatctg tagagggaaa gcaaaatctg gttatcatgg gaaagaaaac gtggttctct 180
atccctgaaa aaaacagacc tctcaaaggc aggataaatt tggtattgtc aagagaattg 240
aaggaaccgc cacaaggagc tcattttctc agcagatctc tggacgatgc actcaaactc 300
accgaacaac cagaacttgc taataaggtt gatatggtct ggatagttgg gggcagcagt 360
gtatataagg aagccatgaa ccatcctggc catctgaagc tgtttgttac gaggataatg 420
caggacttcg agtccgacac ttttttccca gagattgact tggaaaagta taaactcttg 480
cctgagtatc ctggggttct ctccgatgtc caagaggaga aaggtattaa atataagttt 540
gaagtttatg aaaaaaacga t 561
<210> 5
<211> 561
<212> DNA
<213> 智人(Homo sapiens)
<400> 5
atggtaggct ccctgaactg tatagttgcg gtatcccaaa atatggggat tggaaagaac 60
ggagactttc cgtggccgcc cctccgaaat gaatcccgat actttcagag aatgacaact 120
acctcatctg tagagggaaa gcaaaatctg gttatcatgg gaaagaaaac gtggttctct 180
atccctgaaa aaaacagacc tctcaaaggc aggataaatt tggtattgtc aagagaattg 240
aaggaaccgc cacaaggagc tcattttctc agcagatctc tggacgatgc actcaaactc 300
accgaacaac cagaacttgc taataaggtt gatatggtct ggatagttgg gggcagcagt 360
gtatataagg aagccatgaa ccatcctggc catctgaagc tgtttgttac gaggataatg 420
caggacttcg agtccgacac ttttttccca gagattgact tggaaaagta taaactcttg 480
cctgagtatc ctggggttct ctccgatgtc caagaggaga aaggtattaa atataagttt 540
gaagtttatg aaaaaaacga t 561
<210> 6
<211> 37
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 6
Thr Ile Ala Arg Leu Glu Glu Glu Val Lys Thr Leu Glu Ala Lys Glu
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Glu Glu Lys Val Ala Gln
20 25 30
Leu Glu Gln Lys Val
35
<210> 7
<211> 37
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 7
Leu Arg Asp Thr Leu Gln Ala Lys Thr Asp Gln Leu Lys Asp Asn Gln
1 5 10 15
Ser Ala Leu Gln Thr Arg Ile Ala Asn Leu Leu Lys Lys Gln Glu Lys
20 25 30
Leu Glu Phe Ile Leu
35
<210> 8
<211> 153
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 8
Thr Ile Ala Arg Leu Glu Glu Glu Val Lys Thr Leu Glu Ala Lys Glu
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Glu Glu Lys Val Ala Gln
20 25 30
Leu Glu Gln Lys Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met
35 40 45
Val Arg Pro Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly Ile
50 55 60
Gly Lys Asn Gly Asp Phe Pro Trp Pro Pro Leu Arg Asn Glu Ser Lys
65 70 75 80
Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln Asn
85 90 95
Leu Val Ile Met Gly Arg Lys Thr Trp Phe Ser Ile Pro Glu Lys Asn
100 105 110
Arg Pro Leu Lys Asp Arg Ile Asn Ile Val Leu Ser Arg Glu Leu Lys
115 120 125
Glu Pro Pro Arg Gly Ala His Phe Leu Ala Lys Ser Leu Asp Asp Ala
130 135 140
Leu Arg Leu Ile Glu Gln Pro Glu Leu
145 150
<210> 9
<211> 128
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 9
Leu Arg Asp Thr Leu Gln Ala Lys Thr Asp Gln Leu Lys Asp Asn Gln
1 5 10 15
Ser Ala Leu Gln Thr Arg Ile Ala Asn Leu Leu Lys Lys Gln Glu Lys
20 25 30
Leu Glu Phe Ile Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala
35 40 45
Ser Lys Val Asp Met Val Trp Ile Val Gly Gly Ser Ser Val Tyr Gln
50 55 60
Glu Ala Met Asn Gln Pro Gly His Leu Arg Leu Phe Val Thr Arg Ile
65 70 75 80
Met Gln Glu Phe Glu Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Gly
85 90 95
Lys Tyr Lys Leu Leu Pro Glu Tyr Pro Gly Val Leu Ser Glu Val Gln
100 105 110
Glu Glu Lys Gly Ile Lys Tyr Lys Phe Glu Val Tyr Glu Lys Lys Asp
115 120 125
<210> 10
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 10
tgattatggg taagaagacc 20
<210> 11
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 11
aaccttaggg aacctccaca 20
<210> 12
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 12
cggcccggca gatacctgag 20
<210> 13
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 13
gacatggtct ggatagttgg 20
<210> 14
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 14
gtcgctgtgt cccagaacat 20
<210> 15
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 15
cagatacctg agcggtggcc 20
<210> 16
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 16
cacattacct tctactgaag 20
<210> 17
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 17
cgtcgctgtg tcccagaaca 20
<210> 18
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 18
accacaacct cttcagtaga 20
<210> 19
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 19
aaattaattc taccctttaa 20
<210> 20
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 20
gagaatcaaa atcggtgaat 20
<210> 21
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 21
gagtagcgcg agcacagcta 20
<210> 22
<211> 106
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 22
Met Val Arg Pro Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly
1 5 10 15
Ile Gly Lys Asn Gly Asp Phe Pro Trp Pro Pro Leu Arg Asn Glu Ser
20 25 30
Lys Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln
35 40 45
Asn Leu Val Ile Met Gly Arg Lys Thr Trp Phe Ser Ile Pro Glu Lys
50 55 60
Asn Arg Pro Leu Lys Asp Arg Ile Asn Ile Val Leu Ser Arg Glu Leu
65 70 75 80
Lys Glu Pro Pro Arg Gly Ala His Phe Leu Ala Lys Ser Leu Asp Asp
85 90 95
Ala Leu Arg Leu Ile Glu Gln Pro Glu Leu
100 105
<210> 23
<211> 81
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 23
Ala Ser Lys Val Asp Met Val Trp Ile Val Gly Gly Ser Ser Val Tyr
1 5 10 15
Gln Glu Ala Met Asn Gln Pro Gly His Leu Arg Leu Phe Val Thr Arg
20 25 30
Ile Met Gln Glu Phe Glu Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu
35 40 45
Gly Lys Tyr Lys Leu Leu Pro Glu Tyr Pro Gly Val Leu Ser Glu Val
50 55 60
Gln Glu Glu Lys Gly Ile Lys Tyr Lys Phe Glu Val Tyr Glu Lys Lys
65 70 75 80
Asp
<210> 24
<211> 47
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 24
Asn Thr Glu Ala Ala Arg Arg Ser Arg Ala Arg Lys Leu Gln Arg Met
1 5 10 15
Lys Gln Leu Glu Asp Lys Val Glu Glu Leu Leu Ser Lys Asn Tyr His
20 25 30
Leu Glu Asn Glu Val Ala Arg Leu Lys Lys Leu Val Gly Glu Arg
35 40 45
<210> 25
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 25
Arg Ile Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys Ala Gln Asn
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln Val Ala Gln
20 25 30
Leu Lys Gln Lys Val Met Asn His
35 40
<210> 26
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 26
Arg Ile Ala Arg Leu Glu Glu Glu Val Lys Thr Leu Glu Ala Gln Asn
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Glu Glu Gln Val Ala Gln
20 25 30
Leu Lys Gln Lys Val Met Asn His
35 40
<210> 27
<211> 37
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 27
Arg Ile Ala Arg Leu Glu Glu Glu Val Lys Thr Leu Glu Ala Gln Asn
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Glu Glu Gln Val Ala Gln
20 25 30
Leu Glu Gln Lys Val
35
<210> 28
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 28
Leu Thr Asp Thr Leu Gln Ala Glu Thr Asp Gln Leu Glu Asp Glu Lys
1 5 10 15
Ser Ala Leu Gln Thr Glu Ile Ala Asn Leu Leu Lys Glu Lys Glu Lys
20 25 30
Leu Glu Phe Ile Leu Ala Ala His
35 40
<210> 29
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 29
Leu Thr Asp Thr Leu Gln Ala Lys Thr Asp Gln Leu Lys Asp Glu Lys
1 5 10 15
Ser Ala Leu Gln Thr Arg Ile Ala Asn Leu Leu Lys Glu Lys Glu Lys
20 25 30
Leu Glu Phe Ile Leu Ala Ala His
35 40
<210> 30
<211> 37
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 30
Leu Thr Asp Thr Leu Gln Ala Lys Thr Asp Gln Leu Lys Asp Glu Lys
1 5 10 15
Ser Ala Leu Gln Thr Arg Ile Ala Asn Leu Leu Lys Lys Lys Glu Lys
20 25 30
Leu Glu Phe Ile Leu
35
<210> 31
<211> 107
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 31
Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro
1 5 10 15
Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp
20 25 30
Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe
35 40 45
Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala
50 55 60
Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr
65 70 75 80
Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr
85 90 95
Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 32
<211> 191
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 32
Met Gly Arg Gly Leu Leu Arg Gly Leu Trp Pro Leu His Ile Val Leu
1 5 10 15
Trp Thr Arg Ile Ala Ser Thr Ile Pro Pro His Val Gln Lys Ser Val
20 25 30
Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val Lys Phe Pro
35 40 45
Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys Asp Asn Gln
50 55 60
Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro
65 70 75 80
Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu Asn Ile Thr
85 90 95
Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His Asp Phe Ile
100 105 110
Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu Lys Lys Lys
115 120 125
Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp Glu Cys Asn
130 135 140
Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn Pro Asp Leu
145 150 155 160
Leu Leu Val Ile Phe Gln Val Thr Gly Ile Ser Leu Leu Pro Pro Leu
165 170 175
Gly Val Ala Ile Ser Val Ile Ile Ile Phe Tyr Cys Tyr Arg Val
180 185 190
<210> 33
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 33
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 34
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 34
Ser Gly Gly Gly Ser
1 5
<210> 35
<211> 153
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 35
Arg Ile Ala Arg Leu Glu Glu Glu Val Lys Thr Leu Glu Ala Gln Asn
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Glu Glu Gln Val Ala Gln
20 25 30
Leu Lys Gln Lys Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met
35 40 45
Val Arg Pro Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly Ile
50 55 60
Gly Lys Asn Gly Asp Phe Pro Trp Pro Pro Leu Arg Asn Glu Ser Lys
65 70 75 80
Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln Asn
85 90 95
Leu Val Ile Met Gly Arg Lys Thr Trp Phe Ser Ile Pro Glu Lys Asn
100 105 110
Arg Pro Leu Lys Asp Arg Ile Asn Ile Val Leu Ser Arg Glu Leu Lys
115 120 125
Glu Pro Pro Arg Gly Ala His Phe Leu Ala Lys Ser Leu Asp Asp Ala
130 135 140
Leu Arg Leu Ile Glu Gln Pro Glu Leu
145 150
<210> 36
<211> 128
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 36
Leu Thr Asp Thr Leu Gln Ala Lys Thr Asp Gln Leu Lys Asp Glu Lys
1 5 10 15
Ser Ala Leu Gln Thr Arg Ile Ala Asn Leu Leu Lys Glu Lys Glu Lys
20 25 30
Leu Glu Phe Ile Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala
35 40 45
Ser Lys Val Asp Met Val Trp Ile Val Gly Gly Ser Ser Val Tyr Gln
50 55 60
Glu Ala Met Asn Gln Pro Gly His Leu Arg Leu Phe Val Thr Arg Ile
65 70 75 80
Met Gln Glu Phe Glu Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Gly
85 90 95
Lys Tyr Lys Leu Leu Pro Glu Tyr Pro Gly Val Leu Ser Glu Val Gln
100 105 110
Glu Glu Lys Gly Ile Lys Tyr Lys Phe Glu Val Tyr Glu Lys Lys Asp
115 120 125
<210> 37
<211> 153
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 37
Arg Ile Ala Arg Leu Glu Glu Glu Val Lys Thr Leu Glu Ala Gln Asn
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Glu Glu Gln Val Ala Gln
20 25 30
Leu Glu Gln Lys Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met
35 40 45
Val Arg Pro Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly Ile
50 55 60
Gly Lys Asn Gly Asp Phe Pro Trp Pro Pro Leu Arg Asn Glu Ser Lys
65 70 75 80
Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln Asn
85 90 95
Leu Val Ile Met Gly Arg Lys Thr Trp Phe Ser Ile Pro Glu Lys Asn
100 105 110
Arg Pro Leu Lys Asp Arg Ile Asn Ile Val Leu Ser Arg Glu Leu Lys
115 120 125
Glu Pro Pro Arg Gly Ala His Phe Leu Ala Lys Ser Leu Asp Asp Ala
130 135 140
Leu Arg Leu Ile Glu Gln Pro Glu Leu
145 150
<210> 38
<211> 128
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 38
Leu Thr Asp Thr Leu Gln Ala Lys Thr Asp Gln Leu Lys Asp Glu Lys
1 5 10 15
Ser Ala Leu Gln Thr Arg Ile Ala Asn Leu Leu Lys Lys Lys Glu Lys
20 25 30
Leu Glu Phe Ile Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala
35 40 45
Ser Lys Val Asp Met Val Trp Ile Val Gly Gly Ser Ser Val Tyr Gln
50 55 60
Glu Ala Met Asn Gln Pro Gly His Leu Arg Leu Phe Val Thr Arg Ile
65 70 75 80
Met Gln Glu Phe Glu Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Gly
85 90 95
Lys Tyr Lys Leu Leu Pro Glu Tyr Pro Gly Val Leu Ser Glu Val Gln
100 105 110
Glu Glu Lys Gly Ile Lys Tyr Lys Phe Glu Val Tyr Glu Lys Lys Asp
115 120 125
<210> 39
<211> 163
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 39
Asn Thr Glu Ala Ala Arg Arg Ser Arg Ala Arg Lys Leu Gln Arg Met
1 5 10 15
Lys Gln Leu Glu Asp Lys Val Glu Glu Leu Leu Ser Lys Asn Tyr His
20 25 30
Leu Glu Asn Glu Val Ala Arg Leu Lys Lys Leu Val Gly Glu Arg Gly
35 40 45
Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Val Arg Pro Leu Asn Cys
50 55 60
Ile Val Ala Val Ser Gln Asn Met Gly Ile Gly Lys Asn Gly Asp Phe
65 70 75 80
Pro Trp Pro Pro Leu Arg Asn Glu Ser Lys Tyr Phe Gln Arg Met Thr
85 90 95
Thr Thr Ser Ser Val Glu Gly Lys Gln Asn Leu Val Ile Met Gly Arg
100 105 110
Lys Thr Trp Phe Ser Ile Pro Glu Lys Asn Arg Pro Leu Lys Asp Arg
115 120 125
Ile Asn Ile Val Leu Ser Arg Glu Leu Lys Glu Pro Pro Arg Gly Ala
130 135 140
His Phe Leu Ala Lys Ser Leu Asp Asp Ala Leu Arg Leu Ile Glu Gln
145 150 155 160
Pro Glu Leu
<210> 40
<211> 138
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 40
Asn Thr Glu Ala Ala Arg Arg Ser Arg Ala Arg Lys Leu Gln Arg Met
1 5 10 15
Lys Gln Leu Glu Asp Lys Val Glu Glu Leu Leu Ser Lys Asn Tyr His
20 25 30
Leu Glu Asn Glu Val Ala Arg Leu Lys Lys Leu Val Gly Glu Arg Gly
35 40 45
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Lys Val Asp Met Val
50 55 60
Trp Ile Val Gly Gly Ser Ser Val Tyr Gln Glu Ala Met Asn Gln Pro
65 70 75 80
Gly His Leu Arg Leu Phe Val Thr Arg Ile Met Gln Glu Phe Glu Ser
85 90 95
Asp Thr Phe Phe Pro Glu Ile Asp Leu Gly Lys Tyr Lys Leu Leu Pro
100 105 110
Glu Tyr Pro Gly Val Leu Ser Glu Val Gln Glu Glu Lys Gly Ile Lys
115 120 125
Tyr Lys Phe Glu Val Tyr Glu Lys Lys Asp
130 135
<210> 41
<211> 178
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 41
Arg Ile Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys Ala Gln Asn
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln Val Ala Gln
20 25 30
Leu Lys Gln Lys Val Met Asn His Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Met Val Arg Pro Leu Asn Cys Ile Val Ala Val Ser Gln Asn
50 55 60
Met Gly Ile Gly Lys Asn Gly Asp Phe Pro Trp Pro Pro Leu Arg Asn
65 70 75 80
Glu Ser Lys Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly
85 90 95
Lys Gln Asn Leu Val Ile Met Gly Arg Lys Thr Trp Phe Ser Ile Pro
100 105 110
Glu Lys Asn Arg Pro Leu Lys Asp Arg Ile Asn Ile Val Leu Ser Arg
115 120 125
Glu Leu Lys Glu Pro Pro Arg Gly Ala His Phe Leu Ala Lys Ser Leu
130 135 140
Asp Asp Ala Leu Arg Leu Ile Glu Gln Pro Glu Leu Gly Ser Gly Ala
145 150 155 160
Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
165 170 175
Gly Pro
<210> 42
<211> 153
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 42
Leu Thr Asp Thr Leu Gln Ala Glu Thr Asp Gln Leu Glu Asp Glu Lys
1 5 10 15
Ser Ala Leu Gln Thr Glu Ile Ala Asn Leu Leu Lys Glu Lys Glu Lys
20 25 30
Leu Glu Phe Ile Leu Ala Ala His Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Ala Ser Lys Val Asp Met Val Trp Ile Val Gly Gly Ser Ser
50 55 60
Val Tyr Gln Glu Ala Met Asn Gln Pro Gly His Leu Arg Leu Phe Val
65 70 75 80
Thr Arg Ile Met Gln Glu Phe Glu Ser Asp Thr Phe Phe Pro Glu Ile
85 90 95
Asp Leu Gly Lys Tyr Lys Leu Leu Pro Glu Tyr Pro Gly Val Leu Ser
100 105 110
Glu Val Gln Glu Glu Lys Gly Ile Lys Tyr Lys Phe Glu Val Tyr Glu
115 120 125
Lys Lys Asp Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
130 135 140
Gly Asp Val Glu Glu Asn Pro Gly Pro
145 150
<210> 43
<211> 156
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 43
Arg Ile Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys Ala Gln Asn
1 5 10 15
Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln Val Ala Gln
20 25 30
Leu Lys Gln Lys Val Met Asn His Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Met Val Arg Pro Leu Asn Cys Ile Val Ala Val Ser Gln Asn
50 55 60
Met Gly Ile Gly Lys Asn Gly Asp Phe Pro Trp Pro Pro Leu Arg Asn
65 70 75 80
Glu Ser Lys Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly
85 90 95
Lys Gln Asn Leu Val Ile Met Gly Arg Lys Thr Trp Phe Ser Ile Pro
100 105 110
Glu Lys Asn Arg Pro Leu Lys Asp Arg Ile Asn Ile Val Leu Ser Arg
115 120 125
Glu Leu Lys Glu Pro Pro Arg Gly Ala His Phe Leu Ala Lys Ser Leu
130 135 140
Asp Asp Ala Leu Arg Leu Ile Glu Gln Pro Glu Leu
145 150 155
<210> 44
<211> 131
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 44
Leu Thr Asp Thr Leu Gln Ala Glu Thr Asp Gln Leu Glu Asp Glu Lys
1 5 10 15
Ser Ala Leu Gln Thr Glu Ile Ala Asn Leu Leu Lys Glu Lys Glu Lys
20 25 30
Leu Glu Phe Ile Leu Ala Ala His Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Ala Ser Lys Val Asp Met Val Trp Ile Val Gly Gly Ser Ser
50 55 60
Val Tyr Gln Glu Ala Met Asn Gln Pro Gly His Leu Arg Leu Phe Val
65 70 75 80
Thr Arg Ile Met Gln Glu Phe Glu Ser Asp Thr Phe Phe Pro Glu Ile
85 90 95
Asp Leu Gly Lys Tyr Lys Leu Leu Pro Glu Tyr Pro Gly Val Leu Ser
100 105 110
Glu Val Gln Glu Glu Lys Gly Ile Lys Tyr Lys Phe Glu Val Tyr Glu
115 120 125
Lys Lys Asp
130
<210> 45
<211> 185
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 45
Asn Thr Glu Ala Ala Arg Arg Ser Arg Ala Arg Lys Leu Gln Arg Met
1 5 10 15
Lys Gln Leu Glu Asp Lys Val Glu Glu Leu Leu Ser Lys Asn Tyr His
20 25 30
Leu Glu Asn Glu Val Ala Arg Leu Lys Lys Leu Val Gly Glu Arg Gly
35 40 45
Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Val Arg Pro Leu Asn Cys
50 55 60
Ile Val Ala Val Ser Gln Asn Met Gly Ile Gly Lys Asn Gly Asp Phe
65 70 75 80
Pro Trp Pro Pro Leu Arg Asn Glu Ser Lys Tyr Phe Gln Arg Met Thr
85 90 95
Thr Thr Ser Ser Val Glu Gly Lys Gln Asn Leu Val Ile Met Gly Arg
100 105 110
Lys Thr Trp Phe Ser Ile Pro Glu Lys Asn Arg Pro Leu Lys Asp Arg
115 120 125
Ile Asn Ile Val Leu Ser Arg Glu Leu Lys Glu Pro Pro Arg Gly Ala
130 135 140
His Phe Leu Ala Lys Ser Leu Asp Asp Ala Leu Arg Leu Ile Glu Gln
145 150 155 160
Pro Glu Leu Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
165 170 175
Gly Asp Val Glu Glu Asn Pro Gly Pro
180 185
<210> 46
<211> 160
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 46
Asn Thr Glu Ala Ala Arg Arg Ser Arg Ala Arg Lys Leu Gln Arg Met
1 5 10 15
Lys Gln Leu Glu Asp Lys Val Glu Glu Leu Leu Ser Lys Asn Tyr His
20 25 30
Leu Glu Asn Glu Val Ala Arg Leu Lys Lys Leu Val Gly Glu Arg Gly
35 40 45
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Lys Val Asp Met Val
50 55 60
Trp Ile Val Gly Gly Ser Ser Val Tyr Gln Glu Ala Met Asn Gln Pro
65 70 75 80
Gly His Leu Arg Leu Phe Val Thr Arg Ile Met Gln Glu Phe Glu Ser
85 90 95
Asp Thr Phe Phe Pro Glu Ile Asp Leu Gly Lys Tyr Lys Leu Leu Pro
100 105 110
Glu Tyr Pro Gly Val Leu Ser Glu Val Gln Glu Glu Lys Gly Ile Lys
115 120 125
Tyr Lys Phe Glu Val Tyr Glu Lys Lys Asp Gly Ser Gly Ala Thr Asn
130 135 140
Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
145 150 155 160
<210> 47
<211> 2284
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 47
gccagagtta tattgctggg gttttgaaga agatcctatt aaataaaaga ataagcagta 60
ttattaagta gccctgcatt tcaggtttcc ttgagtggca ggccaggcct ggccgtgaac 120
gttcactgaa atcatggcct cttggccaag attgatagct tgtgcctgtc cctgagtccc 180
agtccatcac gagcagctgg tttctaagat gctatttccc gtataaagca tgagaccgtg 240
acttgccagc cccacagagc cccgcccttg tccatcactg gcatctggac tccagcctgg 300
gttggggcaa agagggaaat gagatcatgt cctaaccctg atcctcttgt cccacagata 360
tccagaaccc tgaccctgcc gtgtaccagc tgagagactc taaatccagt gacaagtctg 420
tctgcctatt cggatctggc gccaccaatt tcagcctgct gaaacaggct ggcgacgtgg 480
aagagaaccc cggacctatg tctatcggcc tgctgtgttg tgccgctctg tctctgcttt 540
gggccggacc tgttaatgcc ggcgtgaccc agacacctaa gttccaggtg ctgaaaaccg 600
gccagagcat gaccctgcag tgcgcccagg atatgaacca cgagtacatg agctggtaca 660
gacaggaccc tggcatgggc ctgagactga tccactattc tgtcggagcc ggcatcaccg 720
accagggcga agttcctaat ggctacaacg tgtccagaag caccaccgag gacttcccac 780
tgagactgct gtctgccgct cctagccaga ccagcgtgta cttttgtgcc agcagctacg 840
tgggcaacac cggcgagctg ttttttggcg agggcagcag actgaccgtg ctggaggacc 900
tgaagaacgt gttccctcca aaggtggccg tgttcgagcc ttctgaggcc gagatcagcc 960
acacacagaa agccacactc gtgtgtctgg ccaccggctt ctaccccgat cacgtggaac 1020
tgtcttggtg ggtcaacggc aaagaggtgc acagcggcgt cagcacagat ccccagcctc 1080
tgaaagaaca gcccgctctg aacgacagcc ggtactgtct gagcagcaga ctgagagtgt 1140
ccgccacctt ctggcagaac cccagaaacc acttcagatg ccaggtgcag ttctacggcc 1200
tgagcgaaaa cgacgagtgg acccaggaca gggccaagcc tgtgacacag atcgtgtctg 1260
ccgaagcctg gggcagagcc gattgtggct ttaccagcga gagctaccag cagggcgtgc 1320
tgtctgccac aatcctgtac gagatcctgc tgggcaaagc cactctgtac gccgtgctgg 1380
tgtctgccct ggtgctgatg gccatggtca agcggaagga tagcagaggc ggcagcggcg 1440
aaggcagagg ctctcttctt acatgcggcg acgtcgaaga aaatcctggg cctatgaagt 1500
ccctgcgggt gctgctggtt atcctgtggc tgcagctgag ctgggtctgg tcccagaaac 1560
aagaagtgac tcagatccca gccgctctga gtgtgcctga gggcgaaaac ctggtcctga 1620
actgcagctt caccgacagc gccatctaca acctgcagtg gttcaggcag gatcccggca 1680
agggactgac aagcctgctg ctgattcaga gcagccagag agagcagacc tccggcagac 1740
tgaatgccag cctggataag agcagcggcc gcagcacact gtatatcgcc gcttctcagc 1800
ctggcgatag cgccacatat ctgtgtgccg tgcgacctct gtacggcggc agctacatcc 1860
ctacatttgg cagaggcacc agcctgatcg tgcaccccta cattcagaac cccgatcctg 1920
ccgtgtatca gctgagagac agcaagtcca gcgacaagag cgtgtgtttg ttcaccgatt 1980
ttgattctca aacaaatgtg tcacaaagta aggattctga tgtgtatatc acagacaaaa 2040
ctgtgctaga catgaggtct atggacttca agagcaacag tgctgtggcc tggagcaaca 2100
aatctgactt tgcatgtgca aacgccttca acaacagcat tattccagaa gacaccttct 2160
tccccagccc aggtaagggc agctttggtg ccttcgcagg ctgtttcctt gcttcaggaa 2220
tggccaggtt ctgcccagag ctctggtcaa tgatgtctaa aactcctctg attggtggtc 2280
tcgg 2284
<210> 48
<211> 2905
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 48
gccagagtta tattgctggg gttttgaaga agatcctatt aaataaaaga ataagcagta 60
ttattaagta gccctgcatt tcaggtttcc ttgagtggca ggccaggcct ggccgtgaac 120
gttcactgaa atcatggcct cttggccaag attgatagct tgtgcctgtc cctgagtccc 180
agtccatcac gagcagctgg tttctaagat gctatttccc gtataaagca tgagaccgtg 240
acttgccagc cccacagagc cccgcccttg tccatcactg gcatctggac tccagcctgg 300
gttggggcaa agagggaaat gagatcatgt cctaaccctg atcctcttgt cccacagata 360
tccagaaccc tgaccctgcc gtgtaccagc tgagagactc taaatccagt gacaagtctg 420
tctgcctatt cggatctggc gccaccaatt tcagcctgct gaaacaggct ggcgacgtgg 480
aagagaaccc cggacctatg tctatcggcc tgctgtgttg tgccgctctg tctctgcttt 540
gggccggacc tgttaatgcc ggcgtgaccc agacacctaa gttccaggtg ctgaaaaccg 600
gccagagcat gaccctgcag tgcgcccagg atatgaacca cgagtacatg agctggtaca 660
gacaggaccc tggcatgggc ctgagactga tccactattc tgtcggagcc ggcatcaccg 720
accagggcga agttcctaat ggctacaacg tgtccagaag caccaccgag gacttcccac 780
tgagactgct gtctgccgct cctagccaga ccagcgtgta cttttgtgcc agcagctacg 840
tgggcaacac cggcgagctg ttttttggcg agggcagcag actgaccgtg ctggaagatc 900
tgaacaaggt gttccctcca gaggtggccg tgttcgagcc ttctgaggcc gagatcagcc 960
acacacagaa agccacactc gtgtgcctgg ccaccggctt ttttcccgat cacgtggaac 1020
tgtcttggtg ggtcaacggc aaagaggtgc acagcggcgt cagcacagat ccccagcctc 1080
tgaaagaaca gcccgctctg aacgacagcc ggtactgtct gtcctccaga ctgagagtgt 1140
ccgccacctt ctggcagaac cccagaaacc acttcagatg ccaggtgcag ttctacggcc 1200
tgagcgagaa cgatgagtgg acccaggata gagccaagcc tgtgacacag atcgtgtctg 1260
ccgaagcctg gggcagagcc gattgtggct ttacctccgt gtcctatcag cagggcgtgc 1320
tgagcgccac aatcctgtat gagatcctgc tgggcaaagc cactctgtac gccgtgctgg 1380
tgtctgccct ggtgctgatg gccatggtca agagaaagga cttcggcagc ggcgaaggca 1440
gaggctctct tcttacatgc ggcgacgtcg aagaaaatcc tgggcctatg gtaggctccc 1500
tgaactgtat agttgcggta tcccaaaata tggggattgg aaagaacgga gaccttccgt 1560
ggccgcccct ccgaaatgaa tttcgatact ttcagagaat gacaactacc tcatctgtag 1620
agggaaagca aaatctggtt atcatgggaa agaaaacgtg gttctctatc cctgaaaaaa 1680
acagacctct caaaggcagg ataaatttgg tattgtcaag agaattgaag gaaccgccac 1740
aaggagctca ttttctcagc agatctctgg acgatgcact caaactcacc gaacaaccag 1800
aacttgctaa taaggttgat atggtctgga tagttggggg cagcagtgta tataaggaag 1860
ccatgaacca tcctggccat ctgaagctgt ttgttacgag gataatgcag gacttcgagt 1920
ccgacacttt tttcccagag attgacttgg aaaagtataa actcttgcct gagtatcctg 1980
gggttctctc cgatgtccaa gaggagaaag gtattaaata taagtttgaa gtttatgaaa 2040
aaaacgatgg atctggcgcc accaatttca gcctgctgaa acaggctggc gacgtggaag 2100
agaaccccgg acctatgaag tccctgcggg tgctgctggt tatcctgtgg ctgcagctga 2160
gctgggtctg gtcccagaaa caagaagtga ctcagatccc agccgctctg agtgtgcctg 2220
agggcgaaaa cctggtcctg aactgcagct tcaccgacag cgccatctac aacctgcagt 2280
ggttcaggca ggatcccggc aagggactga caagcctgct gctgattcag agcagccaga 2340
gagagcagac ctccggcaga ctgaatgcca gcctggataa gagcagcggc cgcagcacac 2400
tgtatatcgc cgcttctcag cctggcgata gcgccacata tctgtgtgcc gtgcgacctc 2460
tgtacggcgg cagctacatc cctacatttg gcagaggcac cagcctgatc gtgcacccct 2520
acattcagaa ccccgatcct gccgtgtatc agctgagaga cagcaagtcc agcgacaaga 2580
gcgtgtgttt gttcaccgat tttgattctc aaacaaatgt gtcacaaagt aaggattctg 2640
atgtgtatat cacagacaaa actgtgctag acatgaggtc tatggacttc aagagcaaca 2700
gtgctgtggc ctggagcaac aaatctgact ttgcatgtgc aaacgccttc aacaacagca 2760
ttattccaga agacaccttc ttccccagcc caggtaaggg cagctttggt gccttcgcag 2820
gctgtttcct tgcttcagga atggccaggt tctgcccaga gctctggtca atgatgtcta 2880
aaactcctct gattggtggt ctcgg 2905
<210> 49
<211> 2905
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 49
gccagagtta tattgctggg gttttgaaga agatcctatt aaataaaaga ataagcagta 60
ttattaagta gccctgcatt tcaggtttcc ttgagtggca ggccaggcct ggccgtgaac 120
gttcactgaa atcatggcct cttggccaag attgatagct tgtgcctgtc cctgagtccc 180
agtccatcac gagcagctgg tttctaagat gctatttccc gtataaagca tgagaccgtg 240
acttgccagc cccacagagc cccgcccttg tccatcactg gcatctggac tccagcctgg 300
gttggggcaa agagggaaat gagatcatgt cctaaccctg atcctcttgt cccacagata 360
tccagaaccc tgaccctgcc gtgtaccagc tgagagactc taaatccagt gacaagtctg 420
tctgcctatt cggatctggc gccaccaatt tcagcctgct gaaacaggct ggcgacgtgg 480
aagagaaccc cggacctatg tctatcggcc tgctgtgttg tgccgctctg tctctgcttt 540
gggccggacc tgttaatgcc ggcgtgaccc agacacctaa gttccaggtg ctgaaaaccg 600
gccagagcat gaccctgcag tgcgcccagg atatgaacca cgagtacatg agctggtaca 660
gacaggaccc tggcatgggc ctgagactga tccactattc tgtcggagcc ggcatcaccg 720
accagggcga agttcctaat ggctacaacg tgtccagaag caccaccgag gacttcccac 780
tgagactgct gtctgccgct cctagccaga ccagcgtgta cttttgtgcc agcagctacg 840
tgggcaacac cggcgagctg ttttttggcg agggcagcag actgaccgtg ctggaagatc 900
tgaacaaggt gttccctcca gaggtggccg tgttcgagcc ttctgaggcc gagatcagcc 960
acacacagaa agccacactc gtgtgcctgg ccaccggctt ttttcccgat cacgtggaac 1020
tgtcttggtg ggtcaacggc aaagaggtgc acagcggcgt cagcacagat ccccagcctc 1080
tgaaagaaca gcccgctctg aacgacagcc ggtactgtct gtcctccaga ctgagagtgt 1140
ccgccacctt ctggcagaac cccagaaacc acttcagatg ccaggtgcag ttctacggcc 1200
tgagcgagaa cgatgagtgg acccaggata gagccaagcc tgtgacacag atcgtgtctg 1260
ccgaagcctg gggcagagcc gattgtggct ttacctccgt gtcctatcag cagggcgtgc 1320
tgagcgccac aatcctgtat gagatcctgc tgggcaaagc cactctgtac gccgtgctgg 1380
tgtctgccct ggtgctgatg gccatggtca agagaaagga cttcggcagc ggcgaaggca 1440
gaggctctct tcttacatgc ggcgacgtcg aagaaaatcc tgggcctatg gtaggctccc 1500
tgaactgtat agttgcggta tcccaaaata tggggattgg aaagaacgga gactttccgt 1560
ggccgcccct ccgaaatgaa tcccgatact ttcagagaat gacaactacc tcatctgtag 1620
agggaaagca aaatctggtt atcatgggaa agaaaacgtg gttctctatc cctgaaaaaa 1680
acagacctct caaaggcagg ataaatttgg tattgtcaag agaattgaag gaaccgccac 1740
aaggagctca ttttctcagc agatctctgg acgatgcact caaactcacc gaacaaccag 1800
aacttgctaa taaggttgat atggtctgga tagttggggg cagcagtgta tataaggaag 1860
ccatgaacca tcctggccat ctgaagctgt ttgttacgag gataatgcag gacttcgagt 1920
ccgacacttt tttcccagag attgacttgg aaaagtataa actcttgcct gagtatcctg 1980
gggttctctc cgatgtccaa gaggagaaag gtattaaata taagtttgaa gtttatgaaa 2040
aaaacgatgg atctggcgcc accaatttca gcctgctgaa acaggctggc gacgtggaag 2100
agaaccccgg acctatgaag tccctgcggg tgctgctggt tatcctgtgg ctgcagctga 2160
gctgggtctg gtcccagaaa caagaagtga ctcagatccc agccgctctg agtgtgcctg 2220
agggcgaaaa cctggtcctg aactgcagct tcaccgacag cgccatctac aacctgcagt 2280
ggttcaggca ggatcccggc aagggactga caagcctgct gctgattcag agcagccaga 2340
gagagcagac ctccggcaga ctgaatgcca gcctggataa gagcagcggc cgcagcacac 2400
tgtatatcgc cgcttctcag cctggcgata gcgccacata tctgtgtgcc gtgcgacctc 2460
tgtacggcgg cagctacatc cctacatttg gcagaggcac cagcctgatc gtgcacccct 2520
acattcagaa ccccgatcct gccgtgtatc agctgagaga cagcaagtcc agcgacaaga 2580
gcgtgtgttt gttcaccgat tttgattctc aaacaaatgt gtcacaaagt aaggattctg 2640
atgtgtatat cacagacaaa actgtgctag acatgaggtc tatggacttc aagagcaaca 2700
gtgctgtggc ctggagcaac aaatctgact ttgcatgtgc aaacgccttc aacaacagca 2760
ttattccaga agacaccttc ttccccagcc caggtaaggg cagctttggt gccttcgcag 2820
gctgtttcct tgcttcagga atggccaggt tctgcccaga gctctggtca atgatgtcta 2880
aaactcctct gattggtggt ctcgg 2905
<210> 50
<211> 2809
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 50
gccagagtta tattgctggg gttttgaaga agatcctatt aaataaaaga ataagcagta 60
ttattaagta gccctgcatt tcaggtttcc ttgagtggca ggccaggcct ggccgtgaac 120
gttcactgaa atcatggcct cttggccaag attgatagct tgtgcctgtc cctgagtccc 180
agtccatcac gagcagctgg tttctaagat gctatttccc gtataaagca tgagaccgtg 240
acttgccagc cccacagagc cccgcccttg tccatcactg gcatctggac tccagcctgg 300
gttggggcaa agagggaaat gagatcatgt cctaaccctg atcctcttgt cccacagata 360
tccagaaccc tgaccctgcc gtgtaccagc tgagagactc taaatccagt gacaagtctg 420
tctgcctatt cggatctggc gccaccaatt tcagcctgct gaaacaggct ggcgacgtgg 480
aagagaaccc cggacctatg tctatcggcc tgctgtgttg tgccgctctg tctctgcttt 540
gggccggacc tgttaatgcc ggcgtgaccc agacacctaa gttccaggtg ctgaaaaccg 600
gccagagcat gaccctgcag tgcgcccagg atatgaacca cgagtacatg agctggtaca 660
gacaggaccc tggcatgggc ctgagactga tccactattc tgtcggagcc ggcatcaccg 720
accagggcga agttcctaat ggctacaacg tgtccagaag caccaccgag gacttcccac 780
tgagactgct gtctgccgct cctagccaga ccagcgtgta cttttgtgcc agcagctacg 840
tgggcaacac cggcgagctg ttttttggcg agggcagcag actgaccgtg ctggaagatc 900
tgcggaacgt gttccctcca aaggtggccg tgtttgagcc tagcgaggcc gagatcagcc 960
acacacagaa agccacactc gtgtgtctgg ccaccggctt ctatcccgat cacgtggaac 1020
tgtcttggtg ggtcaacggc aaagaggtgc acagcggcgt cagcacagat ccccagcctc 1080
tgaaagaaca gcccgctctg aacgacagcc ggtactgtct gtcctccaga ctgagagtgt 1140
ccgccacctt ctggcagaac cccagaaacc acttcagatg ccaggtgcag ttctacggcc 1200
tgagcgagaa cgacaagtgg cctgagggat ctgccaagcc tgtgacacag atcgtgtctg 1260
ccgaagcttg gggcagagcc gattgtggct ttaccagcga gagctaccag cagggcgttc 1320
tgtctgccac catcctgtac gagatcctgc tgggcaaagc cactctgtac gccgtgctgg 1380
tgtctgccct ggtgctgatg gccatggtca agcggaagga tagcagaggc ggaagcggag 1440
aaggcagagg ctctctgctt acatgcggag atgtggaaga aaatcctgga ccaagaatcg 1500
cccgcctgga agaagaggtc aagaccctgg aggcccagaa cagcgagctg gcctctaccg 1560
ccaacatgct ggaagaacag gtcgcccagc tggagcagaa agtcggcggc ggaggatctg 1620
gcggaggcgg atctatggtt cgacccctga attgcatcgt ggccgtgtct cagaacatgg 1680
gcatcggcaa gaacggcgac ttcccttggc ctcctctgcg gaacgagagc aagtacttcc 1740
agagaatgac caccaccagc agcgtggaag gcaagcagaa cctggtcatc atgggcagaa 1800
agacctggtt cagcatcccc gagaagaaca ggcccctgaa ggaccggatc aacatcgtgc 1860
tgagcagaga gctgaaagag cctcctagag gcgcccactt tctggccaag tctctggacg 1920
atgccctgcg gctgattgag cagcctgaac ttggcagcgg cgccacaaac ttttcactgc 1980
tgaagcaagc cggggatgtc gaagagaatc cagggcctat gaagtccctg cgggtgctgc 2040
tggttatcct gtggctgcag ctgagctggg tctggtccca gaaacaagaa gtgactcaga 2100
tcccagccgc tctgagtgtg cctgagggcg aaaacctggt cctgaactgc agcttcaccg 2160
acagcgccat ctacaacctg cagtggttca ggcaggatcc cggcaaggga ctgacaagcc 2220
tgctgctgat tcagagcagc cagagagagc agacctccgg cagactgaat gccagcctgg 2280
ataagagcag cggccgcagc acactgtata tcgccgcttc tcagcctggc gatagcgcca 2340
catatctgtg tgccgtgcga cctctgtacg gcggcagcta catccctaca tttggcagag 2400
gcaccagcct gatcgtgcac ccctacattc agaaccccga tcctgccgtg tatcagctga 2460
gagacagcaa gtccagcgac aagagcgtgt gtttgttcac cgattttgat tctcaaacaa 2520
atgtgtcaca aagtaaggat tctgatgtgt atatcacaga caaaactgtg ctagacatga 2580
ggtctatgga cttcaagagc aacagtgctg tggcctggag caacaaatct gactttgcat 2640
gtgcaaacgc cttcaacaac agcattattc cagaagacac cttcttcccc agcccaggta 2700
agggcagctt tggtgccttc gcaggctgtt tccttgcttc aggaatggcc aggttctgcc 2760
cagagctctg gtcaatgatg tctaaaactc ctctgattgg tggtctcgg 2809
<210> 51
<211> 2617
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 51
gaagttctcc ttctgctagg tagcattcaa agatcttaat cttctgggtt tccgttttct 60
cgaatgaaaa atgcaggtcc gagcagttaa ctggctgggg caccattagc aagtcactta 120
gcatctctgg ggccagtctg caaagcgagg gggcagcctt aatgtgcctc cagcctgaag 180
tcctagaatg agcgcccggt gtcccaagct ggggcgcgca ccccagatcg gagggcgccg 240
atgtacagac agcaaactca cccagtctag tgcatgcctt cttaaacatc acgagactct 300
aagaaaagga aactgaaaac gggaaagtcc ctctctctaa cctggcactg cgtcgctggc 360
ttggagacag gtgacggtcc ctgcgggcct tgtcctgatt ggctgggcac gcgtttaata 420
taagtggagg cgtcgcgctg gcgggcattc ctgaagctga cagcattcgg gccgagatgt 480
ctcgctccgt ggccttagct ggatctggag aaggcagagg cagcctgctt acatgcggag 540
atgtggaaga aaatcctgga ccaatgggaa gaggcctgct gagaggactg tggcctctgc 600
acattgtgct gtggaccaga atcgccagca caatccctcc acacgtgcag aaaagcgtga 660
acaacgacat gatcgtgacc gacaacaatg gcgccgtgaa gttccctcag ctgtgcaagt 720
tctgcgacgt gcggttcagc acctgtgaca accagaaaag ctgcatgagc aactgcagca 780
tcaccagcat ctgcgagaag ccccaagaag tgtgcgtcgc cgtctggcgg aagaacgacg 840
agaacatcac cctggaaacc gtgtgtcacg accccaagct gccctaccac gacttcatcc 900
tggaagatgc cgcctctcct aagtgcatca tgaaggaaaa gaagaagccc ggcgagacat 960
tcttcatgtg cagctgctcc agcgacgagt gcaacgacaa catcatcttc agcgaagagt 1020
acaacaccag caatcccgac ctgctgctgg tcatcttcca ggtgaccggc atcagcctgc 1080
tgcctccact gggagttgcc atcagcgtga tcatcatctt ttactgctac cgcgtgggat 1140
ctggcgccac caatttcagc ctgctgaaac aggctggcga cgtggaagag aaccccggac 1200
ctctgaccga cacactgcag gccaagacag accaactgaa agatgagaag tctgccctgc 1260
agaccaggat cgctaacctg ctgaaaaaga aagagaagct cgagttcatc ctgggtggcg 1320
gaggatctgg cggaggcgga tctgccagca aggtggacat ggtctggatc gtcggcggct 1380
cctctgtgta ccaagaggcc atgaatcagc ccggacacct gaggctgttc gtgaccagaa 1440
tcatgcaaga gttcgagagc gacacattct tcccagagat cgacctgggc aagtacaagc 1500
tgctgcctga gtatcccggc gtgctgtctg aggtgcaaga ggaaaagggc atcaagtata 1560
agttcgaggt gtacgagaaa aaggatggat ccggcgaagg cagaggatct ctgctgacat 1620
gtggcgacgt ggaagagaac cctggaccta tggatacctg ccacattgcc aagagctgcg 1680
tgctgatcct gctggtcgtt ctgctgtgtg ccgagcgagc acagggcctc gagtgctaca 1740
attgcattgg cgtgccacct gagacaagct gcaacaccac cacctgtcct ttcagcgacg 1800
gcttctgtgt ggccctggaa atcgaagtga tcgtggacag ccaccggtcc aaagtgaagt 1860
ccaacctgtg cctgcctatc tgccccacca cactggacaa caccgagatc acaggcaacg 1920
ccgtgaacgt gaaaacctac tgctgcaaag aggacctctg caacgccgct gttccaacag 1980
gtggaagctc ttggactatg gccggcgtgc tgctgtttag cctggtgtct gttctgctgc 2040
agaccttcct gggatcaggc gccacgaatt ttagcctgct caaacaggcg ggcgacgtag 2100
aagagaaccc aggacctgtg ctcgcgctac tctctctttc tggcctggag gctatccagc 2160
gtgagtctct cctaccctcc cgctctggtc cttcctctcc cgctctgcac cctctgtggc 2220
cctcgctgtg ctctctcgct ccgtgacttc ccttctccaa gttctccttg gtggcccgcc 2280
gtggggctag tccagggctg gatctcgggg aagcggcggg gtggcctggg agtggggaag 2340
ggggtgcgca cccgggacgc gcgctacttg cccctttcgg cggggagcag gggagacctt 2400
tggcctacgg cgacgggagg gtcgggacaa agtttagggc gtcgataagc gtcagagcgc 2460
cgaggttggg ggagggtttc tcttccgctc tttcgcgggg cctctggctc ccccagcgca 2520
gctggagtgg gggacgggta ggctcgtccc aaaggcgcgg cgctgaggtt tgtgaacgcg 2580
tggaggggcg cttggggtct gggggaggcg tcgcccg 2617
<210> 52
<211> 2617
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 52
agtatcttgg ggccaaatca tgtagactct tgagtgatgt gttaaggaat gctatgagtg 60
ctgagagggc atcagaagtc cttgagagcc tccagagaaa ggctcttaaa aatgcagcgc 120
aatctccagt gacagaagat actgctagaa atctgctaga aaaaaaacaa aaaaggcatg 180
tatagaggaa ttatgaggga aagataccaa gtcacggttt attcttcaaa atggaggtgg 240
cttgttggga aggtggaagc tcatttggcc agagtggaaa tggaattggg agaaatcgat 300
gaccaaatgt aaacacttgg tgcctgatat agcttgacac caagttagcc ccaagtgaaa 360
taccctggca atattaatgt gtcttttccc gatattcctc aggtactcca aagattcagg 420
tttactcacg tcatccagca gagaatggaa agtcaaattt cctgaattgc tatgtgtctg 480
ggtttcatcc atccgacatt ggatctggag aaggcagagg cagcctgctt acatgcggag 540
atgtggaaga aaatcctgga ccaatgggaa gaggcctgct gagaggactg tggcctctgc 600
acattgtgct gtggaccaga atcgccagca caatccctcc acacgtgcag aaaagcgtga 660
acaacgacat gatcgtgacc gacaacaatg gcgccgtgaa gttccctcag ctgtgcaagt 720
tctgcgacgt gcggttcagc acctgtgaca accagaaaag ctgcatgagc aactgcagca 780
tcaccagcat ctgcgagaag ccccaagaag tgtgcgtcgc cgtctggcgg aagaacgacg 840
agaacatcac cctggaaacc gtgtgtcacg accccaagct gccctaccac gacttcatcc 900
tggaagatgc cgcctctcct aagtgcatca tgaaggaaaa gaagaagccc ggcgagacat 960
tcttcatgtg cagctgctcc agcgacgagt gcaacgacaa catcatcttc agcgaagagt 1020
acaacaccag caatcccgac ctgctgctgg tcatcttcca ggtgaccggc atcagcctgc 1080
tgcctccact gggagttgcc atcagcgtga tcatcatctt ttactgctac cgcgtgggat 1140
ctggcgccac caatttcagc ctgctgaaac aggctggcga cgtggaagag aaccccggac 1200
ctctgaccga cacactgcag gccaagacag accaactgaa agatgagaag tctgccctgc 1260
agaccaggat cgctaacctg ctgaaaaaga aagagaagct cgagttcatc ctgggtggcg 1320
gaggatctgg cggaggcgga tctgccagca aggtggacat ggtctggatc gtcggcggct 1380
cctctgtgta ccaagaggcc atgaatcagc ccggacacct gaggctgttc gtgaccagaa 1440
tcatgcaaga gttcgagagc gacacattct tcccagagat cgacctgggc aagtacaagc 1500
tgctgcctga gtatcccggc gtgctgtctg aggtgcaaga ggaaaagggc atcaagtata 1560
agttcgaggt gtacgagaaa aaggatggat ccggcgaagg cagaggatct ctgctgacat 1620
gtggcgacgt ggaagagaac cctggaccta tggatacctg ccacattgcc aagagctgcg 1680
tgctgatcct gctggtcgtt ctgctgtgtg ccgagcgagc acagggcctc gagtgctaca 1740
attgcattgg cgtgccacct gagacaagct gcaacaccac cacctgtcct ttcagcgacg 1800
gcttctgtgt ggccctggaa atcgaagtga tcgtggacag ccaccggtcc aaagtgaagt 1860
ccaacctgtg cctgcctatc tgccccacca cactggacaa caccgagatc acaggcaacg 1920
ccgtgaacgt gaaaacctac tgctgcaaag aggacctctg caacgccgct gttccaacag 1980
gtggaagctc ttggactatg gccggcgtgc tgctgtttag cctggtgtct gttctgctgc 2040
agaccttcct gggatcaggc gccacgaatt ttagcctgct caaacaggcg ggcgacgtag 2100
aagagaaccc aggacctgaa gttgacttac tgaagaatgg agagagaatt gaaaaagtgg 2160
agcattcaga cttgtctttc agcaaggact ggtctttcta tctcttgtac tacactgaat 2220
tcacccccac tgaaaaagat gagtatgcct gccgtgtgaa ccatgtgact ttgtcacagc 2280
ccaagatagt taagtggggt aagtcttaca ttcttttgta agctgctgaa agttgtgtat 2340
gagtagtcat atcataaagc tgctttgata taaaaaaggt ctatggccat actaccctga 2400
atgagtccca tcccatctga tataaacaat ctgcatattg ggattgtcag ggaatgttct 2460
taaagatcag attagtggca cctgctgaga tactgatgca cagcatggtt tctgaaccag 2520
tagtttccct gcagttgagc agggagcagc agcagcactt gcacaaatac atatacactc 2580
ttaacacttc ttacctactg gcttcctcta gcttttg 2617
<210> 53
<211> 3007
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 53
gccagagtta tattgctggg gttttgaaga agatcctatt aaataaaaga ataagcagta 60
ttattaagta gccctgcatt tcaggtttcc ttgagtggca ggccaggcct ggccgtgaac 120
gttcactgaa atcatggcct cttggccaag attgatagct tgtgcctgtc cctgagtccc 180
agtccatcac gagcagctgg tttctaagat gctatttccc gtataaagca tgagaccgtg 240
acttgccagc cccacagagc cccgcccttg tccatcactg gcatctggac tccagcctgg 300
gttggggcaa agagggaaat gagatcatgt cctaaccctg atcctcttgt cccacagata 360
tccagaaccc tgaccctgcc gtgtaccagc tgagagactc taaatccagt gacaagtctg 420
tctgcctatt cggatctggc gccaccaatt tcagcctgct gaaacaggct ggcgacgtgg 480
aagagaaccc cggacctatg tctatcggcc tgctgtgttg tgccgctctg tctctgcttt 540
gggccggacc tgttaatgcc ggcgtgaccc agacacctaa gttccaggtg ctgaaaaccg 600
gccagagcat gaccctgcag tgcgcccagg atatgaacca cgagtacatg agctggtaca 660
gacaggaccc tggcatgggc ctgagactga tccactattc tgtcggagcc ggcatcaccg 720
accagggcga agttcctaat ggctacaacg tgtccagaag caccaccgag gacttcccac 780
tgagactgct gtctgccgct cctagccaga ccagcgtgta cttttgtgcc agcagctacg 840
tgggcaacac cggcgagctg ttttttggcg agggcagcag actgaccgtg ctggaagatc 900
tgcggaacgt gttccctcca aaggtggccg tgtttgagcc tagcgaggcc gagatcagcc 960
acacacagaa agccacactc gtgtgtctgg ccaccggctt ctatcccgat cacgtggaac 1020
tgtcttggtg ggtcaacggc aaagaggtgc acagcggcgt cagcacagat ccccagcctc 1080
tgaaagaaca gcccgctctg aacgacagcc ggtactgtct gtcctccaga ctgagagtgt 1140
ccgccacctt ctggcagaac cccagaaacc acttcagatg ccaggtgcag ttctacggcc 1200
tgagcgagaa cgacaagtgg cctgagggat ctgccaagcc tgtgacacag atcgtgtctg 1260
ccgaagcttg gggcagagcc gattgtggct ttaccagcga gagctaccag cagggcgttc 1320
tgtctgccac catcctgtac gagatcctgc tgggcaaagc cactctgtac gccgtgctgg 1380
tgtctgccct ggtgctgatg gccatggtca agcggaagga tagcagaggc ggaagcggag 1440
aaggcagagg ctctctgctt acatgcggag atgtggaaga aaatcctgga ccaatgggag 1500
ttcaagtgga gacaatatca ccaggcgatg gaaggacatt ccccaagcga gggcaaacgt 1560
gtgtggtaca ctacactggc atgttggagg acggaaagaa agtcgacagt tcccgcgacc 1620
ggaataagcc tttcaaattc atgctcggca agcaggaggt cattcggggt tgggaggaag 1680
gggtcgcgca aatgagtgtc ggacaacgcg caaaacttac tatttcccca gattacgcct 1740
acggagccac aggtcaccct ggtatcatac caccccacgc gactctggtt tttgatgtcg 1800
aattgctgaa attggaatct ggcggaggct ctatggttcg acccctgaat tgcatcgtgg 1860
ccgtgtctca gaacatgggc atcggcaaga acggcgactt cccttggcct cctctgcgga 1920
acgagagcaa gtacttccag agaatgacca ccaccagcag cgtggaaggc aagcagaacc 1980
tggtcatcat gggcagaaag acctggttca gcatccccga gaagaacagg cccctgaagg 2040
accggatcaa catcgtgctg agcagagagc tgaaagagcc tcctagaggc gcccactttc 2100
tggccaagtc tctggacgat gccctgcggc tgattgagca gcctgaactt ggcagcggcg 2160
ccacaaactt ttcactgctg aagcaagccg gggatgtcga agagaatcca gggcctatga 2220
agtccctgcg ggtgctgctg gttatcctgt ggctgcagct gagctgggtc tggtcccaga 2280
aacaagaagt gactcagatc ccagccgctc tgagtgtgcc tgagggcgaa aacctggtcc 2340
tgaactgcag cttcaccgac agcgccatct acaacctgca gtggttcagg caggatcccg 2400
gcaagggact gacaagcctg ctgctgattc agagcagcca gagagagcag acctccggca 2460
gactgaatgc cagcctggat aagagcagcg gccgcagcac actgtatatc gccgcttctc 2520
agcctggcga tagcgccaca tatctgtgtg ccgtgcgacc tctgtacggc ggcagctaca 2580
tccctacatt tggcagaggc accagcctga tcgtgcaccc ctacattcag aaccccgatc 2640
ctgccgtgta tcagctgaga gacagcaagt ccagcgacaa gagcgtgtgt ttgttcaccg 2700
attttgattc tcaaacaaat gtgtcacaaa gtaaggattc tgatgtgtat atcacagaca 2760
aaactgtgct agacatgagg tctatggact tcaagagcaa cagtgctgtg gcctggagca 2820
acaaatctga ctttgcatgt gcaaacgcct tcaacaacag cattattcca gaagacacct 2880
tcttccccag cccaggtaag ggcagctttg gtgccttcgc aggctgtttc cttgcttcag 2940
gaatggccag gttctgccca gagctctggt caatgatgtc taaaactcct ctgattggtg 3000
gtctcgg 3007
<210> 54
<211> 2815
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 54
gaagttctcc ttctgctagg tagcattcaa agatcttaat cttctgggtt tccgttttct 60
cgaatgaaaa atgcaggtcc gagcagttaa ctggctgggg caccattagc aagtcactta 120
gcatctctgg ggccagtctg caaagcgagg gggcagcctt aatgtgcctc cagcctgaag 180
tcctagaatg agcgcccggt gtcccaagct ggggcgcgca ccccagatcg gagggcgccg 240
atgtacagac agcaaactca cccagtctag tgcatgcctt cttaaacatc acgagactct 300
aagaaaagga aactgaaaac gggaaagtcc ctctctctaa cctggcactg cgtcgctggc 360
ttggagacag gtgacggtcc ctgcgggcct tgtcctgatt ggctgggcac gcgtttaata 420
taagtggagg cgtcgcgctg gcgggcattc ctgaagctga cagcattcgg gccgagatgt 480
ctcgctccgt ggccttagct ggatctggag aaggcagagg cagcctgctt acatgcggag 540
atgtggaaga aaatcctgga ccaatgggaa gaggcctgct gagaggactg tggcctctgc 600
acattgtgct gtggaccaga atcgccagca caatccctcc acacgtgcag aaaagcgtga 660
acaacgacat gatcgtgacc gacaacaatg gcgccgtgaa gttccctcag ctgtgcaagt 720
tctgcgacgt gcggttcagc acctgtgaca accagaaaag ctgcatgagc aactgcagca 780
tcaccagcat ctgcgagaag ccccaagaag tgtgcgtcgc cgtctggcgg aagaacgacg 840
agaacatcac cctggaaacc gtgtgtcacg accccaagct gccctaccac gacttcatcc 900
tggaagatgc cgcctctcct aagtgcatca tgaaggaaaa gaagaagccc ggcgagacat 960
tcttcatgtg cagctgctcc agcgacgagt gcaacgacaa catcatcttc agcgaagagt 1020
acaacaccag caatcccgac ctgctgctgg tcatcttcca ggtgaccggc atcagcctgc 1080
tgcctccact gggagttgcc atcagcgtga tcatcatctt ttactgctac cgcgtgggat 1140
ctggcgccac caatttcagc ctgctgaaac aggctggcga cgtggaagag aaccccggac 1200
ctatgggtgt gcaggtggaa acaatctctc cgggagacgg tcgcactttc ccgaagcgcg 1260
ggcaaacctg tgtcgtacat tacactggca tgttggaaga tggaaaaaag gtcgatagtt 1320
ctcgcgaccg caataagcca ttcaaattca tgctggggaa gcaggaggtt attcgcggat 1380
gggaggaagg agttgcccaa atgtctgtgg gacaaagggc caagttgact attagtcccg 1440
actacgcata cggggcgacc ggacaccccg gtataatacc ccctcacgcc actctggtct 1500
tcgacgtaga gcttttgaaa ctcgagtcag ggggcggatc tgccagcaag gtggacatgg 1560
tctggatcgt cggcggctcc tctgtgtacc aagaggccat gaatcagccc ggacacctga 1620
ggctgttcgt gaccagaatc atgcaagagt tcgagagcga cacattcttc ccagagatcg 1680
acctgggcaa gtacaagctg ctgcctgagt atcccggcgt gctgtctgag gtgcaagagg 1740
aaaagggcat caagtataag ttcgaggtgt acgagaaaaa ggatggatcc ggcgaaggca 1800
gaggatctct gctgacatgt ggcgacgtgg aagagaaccc tggacctatg gatacctgcc 1860
acattgccaa gagctgcgtg ctgatcctgc tggtcgttct gctgtgtgcc gagcgagcac 1920
agggcctcga gtgctacaat tgcattggcg tgccacctga gacaagctgc aacaccacca 1980
cctgtccttt cagcgacggc ttctgtgtgg ccctggaaat cgaagtgatc gtggacagcc 2040
accggtccaa agtgaagtcc aacctgtgcc tgcctatctg ccccaccaca ctggacaaca 2100
ccgagatcac aggcaacgcc gtgaacgtga aaacctactg ctgcaaagag gacctctgca 2160
acgccgctgt tccaacaggt ggaagctctt ggactatggc cggcgtgctg ctgtttagcc 2220
tggtgtctgt tctgctgcag accttcctgg gatcaggcgc cacgaatttt agcctgctca 2280
aacaggcggg cgacgtagaa gagaacccag gacctgtgct cgcgctactc tctctttctg 2340
gcctggaggc tatccagcgt gagtctctcc taccctcccg ctctggtcct tcctctcccg 2400
ctctgcaccc tctgtggccc tcgctgtgct ctctcgctcc gtgacttccc ttctccaagt 2460
tctccttggt ggcccgccgt ggggctagtc cagggctgga tctcggggaa gcggcggggt 2520
ggcctgggag tggggaaggg ggtgcgcacc cgggacgcgc gctacttgcc cctttcggcg 2580
gggagcaggg gagacctttg gcctacggcg acgggagggt cgggacaaag tttagggcgt 2640
cgataagcgt cagagcgccg aggttggggg agggtttctc ttccgctctt tcgcggggcc 2700
tctggctccc ccagcgcagc tggagtgggg gacgggtagg ctcgtcccaa aggcgcggcg 2760
ctgaggtttg tgaacgcgtg gaggggcgct tggggtctgg gggaggcgtc gcccg 2815
<210> 55
<211> 2815
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 55
agtatcttgg ggccaaatca tgtagactct tgagtgatgt gttaaggaat gctatgagtg 60
ctgagagggc atcagaagtc cttgagagcc tccagagaaa ggctcttaaa aatgcagcgc 120
aatctccagt gacagaagat actgctagaa atctgctaga aaaaaaacaa aaaaggcatg 180
tatagaggaa ttatgaggga aagataccaa gtcacggttt attcttcaaa atggaggtgg 240
cttgttggga aggtggaagc tcatttggcc agagtggaaa tggaattggg agaaatcgat 300
gaccaaatgt aaacacttgg tgcctgatat agcttgacac caagttagcc ccaagtgaaa 360
taccctggca atattaatgt gtcttttccc gatattcctc aggtactcca aagattcagg 420
tttactcacg tcatccagca gagaatggaa agtcaaattt cctgaattgc tatgtgtctg 480
ggtttcatcc atccgacatt ggatctggag aaggcagagg cagcctgctt acatgcggag 540
atgtggaaga aaatcctgga ccaatgggaa gaggcctgct gagaggactg tggcctctgc 600
acattgtgct gtggaccaga atcgccagca caatccctcc acacgtgcag aaaagcgtga 660
acaacgacat gatcgtgacc gacaacaatg gcgccgtgaa gttccctcag ctgtgcaagt 720
tctgcgacgt gcggttcagc acctgtgaca accagaaaag ctgcatgagc aactgcagca 780
tcaccagcat ctgcgagaag ccccaagaag tgtgcgtcgc cgtctggcgg aagaacgacg 840
agaacatcac cctggaaacc gtgtgtcacg accccaagct gccctaccac gacttcatcc 900
tggaagatgc cgcctctcct aagtgcatca tgaaggaaaa gaagaagccc ggcgagacat 960
tcttcatgtg cagctgctcc agcgacgagt gcaacgacaa catcatcttc agcgaagagt 1020
acaacaccag caatcccgac ctgctgctgg tcatcttcca ggtgaccggc atcagcctgc 1080
tgcctccact gggagttgcc atcagcgtga tcatcatctt ttactgctac cgcgtgggat 1140
ctggcgccac caatttcagc ctgctgaaac aggctggcga cgtggaagag aaccccggac 1200
ctatgggtgt gcaggtggaa acaatctctc cgggagacgg tcgcactttc ccgaagcgcg 1260
ggcaaacctg tgtcgtacat tacactggca tgttggaaga tggaaaaaag gtcgatagtt 1320
ctcgcgaccg caataagcca ttcaaattca tgctggggaa gcaggaggtt attcgcggat 1380
gggaggaagg agttgcccaa atgtctgtgg gacaaagggc caagttgact attagtcccg 1440
actacgcata cggggcgacc ggacaccccg gtataatacc ccctcacgcc actctggtct 1500
tcgacgtaga gcttttgaaa ctcgagtcag ggggcggatc tgccagcaag gtggacatgg 1560
tctggatcgt cggcggctcc tctgtgtacc aagaggccat gaatcagccc ggacacctga 1620
ggctgttcgt gaccagaatc atgcaagagt tcgagagcga cacattcttc ccagagatcg 1680
acctgggcaa gtacaagctg ctgcctgagt atcccggcgt gctgtctgag gtgcaagagg 1740
aaaagggcat caagtataag ttcgaggtgt acgagaaaaa ggatggatcc ggcgaaggca 1800
gaggatctct gctgacatgt ggcgacgtgg aagagaaccc tggacctatg gatacctgcc 1860
acattgccaa gagctgcgtg ctgatcctgc tggtcgttct gctgtgtgcc gagcgagcac 1920
agggcctcga gtgctacaat tgcattggcg tgccacctga gacaagctgc aacaccacca 1980
cctgtccttt cagcgacggc ttctgtgtgg ccctggaaat cgaagtgatc gtggacagcc 2040
accggtccaa agtgaagtcc aacctgtgcc tgcctatctg ccccaccaca ctggacaaca 2100
ccgagatcac aggcaacgcc gtgaacgtga aaacctactg ctgcaaagag gacctctgca 2160
acgccgctgt tccaacaggt ggaagctctt ggactatggc cggcgtgctg ctgtttagcc 2220
tggtgtctgt tctgctgcag accttcctgg gatcaggcgc cacgaatttt agcctgctca 2280
aacaggcggg cgacgtagaa gagaacccag gacctgaagt tgacttactg aagaatggag 2340
agagaattga aaaagtggag cattcagact tgtctttcag caaggactgg tctttctatc 2400
tcttgtacta cactgaattc acccccactg aaaaagatga gtatgcctgc cgtgtgaacc 2460
atgtgacttt gtcacagccc aagatagtta agtggggtaa gtcttacatt cttttgtaag 2520
ctgctgaaag ttgtgtatga gtagtcatat cataaagctg ctttgatata aaaaaggtct 2580
atggccatac taccctgaat gagtcccatc ccatctgata taaacaatct gcatattggg 2640
attgtcaggg aatgttctta aagatcagat tagtggcacc tgctgagata ctgatgcaca 2700
gcatggtttc tgaaccagta gtttccctgc agttgagcag ggagcagcag cagcacttgc 2760
acaaatacat atacactctt aacacttctt acctactggc ttcctctagc ttttg 2815
<210> 56
<211> 25
<212> DNA
<213> 智人(Homo sapiens)
<400> 56
gagcaggttc tcattgataa caagc 25
<210> 57
<211> 25
<212> DNA
<213> 智人(Homo sapiens)
<400> 57
atcaattgag gtacggagaa actga 25
<210> 58
<211> 25
<212> DNA
<213> 智人(Homo sapiens)
<400> 58
gtcatggttg gttcgctaaa ctgca 25
<210> 59
<211> 25
<212> DNA
<213> 智人(Homo sapiens)
<400> 59
gcaggttctc attgataaca agctc 25
<210> 60
<211> 25
<212> DNA
<213> 智人(Homo sapiens)
<400> 60
gttgacttta gatctataat tattt 25
<210> 61
<211> 25
<212> DNA
<213> 智人(Homo sapiens)
<400> 61
aaatcatcaa ttgaggtacg gagaa 25
<210> 62
<211> 218
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 62
Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro
1 5 10 15
Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp
20 25 30
Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe
35 40 45
Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala
50 55 60
Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr
65 70 75 80
Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr
85 90 95
Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Ser Gly Gly Gly Ser
100 105 110
Met Val Arg Pro Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly
115 120 125
Ile Gly Lys Asn Gly Asp Phe Pro Trp Pro Pro Leu Arg Asn Glu Ser
130 135 140
Lys Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln
145 150 155 160
Asn Leu Val Ile Met Gly Arg Lys Thr Trp Phe Ser Ile Pro Glu Lys
165 170 175
Asn Arg Pro Leu Lys Asp Arg Ile Asn Ile Val Leu Ser Arg Glu Leu
180 185 190
Lys Glu Pro Pro Arg Gly Ala His Phe Leu Ala Lys Ser Leu Asp Asp
195 200 205
Ala Leu Arg Leu Ile Glu Gln Pro Glu Leu
210 215
<210> 63
<211> 193
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 63
Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro
1 5 10 15
Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp
20 25 30
Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe
35 40 45
Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala
50 55 60
Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr
65 70 75 80
Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr
85 90 95
Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Ser Gly Gly Gly Ser
100 105 110
Ala Ser Lys Val Asp Met Val Trp Ile Val Gly Gly Ser Ser Val Tyr
115 120 125
Gln Glu Ala Met Asn Gln Pro Gly His Leu Arg Leu Phe Val Thr Arg
130 135 140
Ile Met Gln Glu Phe Glu Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu
145 150 155 160
Gly Lys Tyr Lys Leu Leu Pro Glu Tyr Pro Gly Val Leu Ser Glu Val
165 170 175
Gln Glu Glu Lys Gly Ile Lys Tyr Lys Phe Glu Val Tyr Glu Lys Lys
180 185 190
Asp

Claims (133)

1.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将至少一种两部分核苷酸序列导入细胞,所述两部分核苷酸序列能够在所述细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者,
其中,所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被降低到所述细胞在正常细胞培养基中不能存活和/或增殖的水平,
其中,所述至少一种两部分核苷酸序列可操作用于在所述细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且
其中,所述至少一种两部分核苷酸序列包含编码存活和/或增殖所必需的蛋白或其变体的第一部分核苷酸序列,和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码目的蛋白;和
ⅱ)在没有药理学外源选择压力的正常细胞培养基中培养所述细胞,以选择或富集表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞。
2.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的水平降低到细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)将至少一种两部分核苷酸序列导入所述细胞,所述两部分核苷酸序列能够在所述细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者,并且所述两部分核苷酸序列包含编码第一蛋白或其变体的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,
其中所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且
其中所述第二部分蛋白是目的蛋白,和
ⅲ)在没有药物外源选择压力的情况下,在正常的体外增殖条件下培养所述细胞,以富集表达第一蛋白和第二蛋白两者的细胞。
3.根据权利要求1或2中任一项所述的方法,其中所述必需的蛋白的水平的降低可以是永久性的或暂时性的。
4.根据权利要求2-3中任一项所述的方法,其中所述必需的蛋白的水平的降低包括敲除编码所述必需的蛋白的基因。
5.根据权利要求4所述的方法,其中所述敲除由CRISPR核糖核蛋白(RNP)、TALEN、MegaTAL或任何其他核酸酶介导。
6.根据权利要求2-3中任一项所述的方法,其中所述必需的蛋白的水平的降低包括所述必需的蛋白的水平在RNA水平上的瞬时降低。
7.根据权利要求6所述的方法,其中所述瞬时抑制是通过siRNA、miRNA或CRISPR干扰(CRISPRi)实现的。
8.根据权利要求1-7中任一项所述的方法,其中所述细胞是T细胞、NK细胞、NKT细胞、iNKT细胞、造血干细胞、间充质干细胞、iPSC、神经前体细胞、视网膜基因治疗中的细胞类型或任何其他细胞。
9.根据权利要求1-8中任一项所述的方法,其中所述第一部分核苷酸序列在核苷酸序列上被改变以实现核酸酶、siRNA、miRNA或CRISPRi抗性。
10.根据权利要求9所述的方法,其中所述第一部分核苷酸序列编码具有与所述必需的第一蛋白相同的氨基酸序列的蛋白。
11.根据前述权利要求中任一项所述的方法,其中所述第一部分核苷酸序列被改变以编码具有与所述第一蛋白不同的氨基酸序列的改变的蛋白。
12.根据权利要求11所述的方法,其中所述改变的蛋白具有所述第一蛋白不具有的特定特征。
13.根据权利要求12所述的方法,其中特定特征包括但不限于以下一项或多项:活性降低、活性增加和半衰期改变。
14.根据前述权利要求中任一项所述的方法,其中所述第一部分核苷酸序列和第二部分核苷酸序列两者可以由同一启动子或不同的启动子驱动。
15.根据前述权利要求中任一项所述的方法,其中所述第二部分核苷酸序列包含至少一种治疗基因。
16.根据前述权利要求中任一项所述的方法,其中所述第二部分核苷酸序列编码包含TCRα链和TCRβ链的新生抗原T细胞受体复合物(TCR)。
17.根据前述权利要求中任一项所述的方法,其中所述必需的蛋白或第一蛋白是二氢叶酸还原酶(DHFR)、肌苷一磷酸脱氢酶2(IMPDH2)、O-6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)、脱氧胞苷激酶(DCK)、次黄嘌呤磷酸核糖基转移酶1(HPRT1)、白细胞介素2受体亚单位γ(IL2RG)、肌动蛋白β(ACTB)、真核翻译延伸因子1α1(EEF1A1)、甘油醛-3-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶1(PGK1)或转铁蛋白受体(TFRC)。
18.根据前述权利要求中任一项所述的方法,其中所述第一部分核苷酸序列包含核酸酶抗性或siRNA抗性DHFR基因,并且所述第二部分核苷酸序列包含TRA基因和TRB基因。
19.根据权利要求18所述的方法,其中所述TRA基因、TRB基因和DHFR基因被可操作地配置为从一个开放阅读框中表达。
20.根据权利要求19所述的方法,其中所述TRA基因、TRB基因和DHFR基因由至少一种接头隔开。
21.根据权利要求20所述的方法,其中所述至少一种接头、TRA基因、TRB基因和DHFR基因的顺序如下:
TRA-接头-TRB-接头-DHFR,
TRA-接头-DHFR-接头-TRB,
TRB-接头-TRA-接头-DHFR,
TRB-接头-DHFR-接头-TRA,
DHFR-接头-TRA-接头-TRB,或
DHFR-接头-TRB-接头-TRA。
22.根据权利要求20或21所述的方法,其中所述至少一种接头是至少一种自切割2A肽和/或至少一种IRES元件。
23.根据权利要求18-22中任一项所述的方法,其中所述DHFR基因、TRA基因和TRB基因由内源性TCR启动子或任何其他合适的启动子驱动,所述启动子包括但不限于以下启动子:TRAC、TRBC1/2、DHFR、EEF1A1、ACTB、B2M、CD52、CD2、CD3G、CD3D、CD3E、LCK、LAT、PTPRC、IL2RG、ITGB2、TGFBR2、PDCD1、CTLA4、FAS、TNFRSF1A(TNFR1)、TNFRSF10B(TRAILR2)、ADORA2A、BTLA、CD200R1、LAG3、TIGIT、HAVCR2(TIM3)、VSIR(VISTA)、IL10RA、IL4RA、EIF4A1、FTH1、FTL、HSPA5和PGK1。
24.根据前述权利要求中任一项所述的方法,其中所述两部分核苷酸序列被整合到所述细胞的基因组中。
25.根据前述权利要求中任一项所述的方法,其中当将至少一种两部分核苷酸序列插入靶基因组中的预定位点时,所述至少一种两部分核苷酸序列变得可操作用于表达,并且所述第一部分核苷酸序列和第二部分核苷酸序列均由所述靶基因组中的启动子驱动。
26.根据权利要求24或25所述的方法,其中所述整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。
27.根据权利要求26所述的方法,其中所述核酸酶介导的位点特异性整合是通过CRISPR RNP,任选地通过CRISPR/Cas9 RNP实现的。
28.根据权利要求27所述的方法,其还包括使用断裂蛋白内含肽系统。
29.根据权利要求1-23中任一项所述的方法,其中所述导入的两部分核苷酸序列未被整合到所述细胞的基因组中。
30.根据权利要求1-27中任一项所述的方法,其中将靶向内源性TCR恒定基因座的CRISPR RNP、编码核酸酶抗性DHFR基因的第一部分核苷酸序列和编码新生抗原TCR的第二部分核苷酸序列递送至所述细胞。
31.根据权利要求30所述的方法,其中所述内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。
32.根据权利要求30或31所述的方法,其中所述递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。
33.根据权利要求1-5、8-28或30-32中任一项所述的方法,其中第一CRISPR RNP用于敲除内源性二氢叶酸还原酶(DHFR)基因,第二CRISPR RNP用于将包含CRISPR核酸酶抗性(DHFR)基因的第一部分核苷酸序列和编码治疗性TCR基因的第二部分核苷酸序列敲入内源性TCR恒定基因座。
34.根据权利要求33所述的方法,其中所述第二CRISPR RNP是切割TRAC基因座用于敲入的TRAC RNP。
35.根据权利要求5、27、30、33或34中任一项所述的方法,其中所述CRISPR RNP是CRISPR/Cas9 RNP。
36.根据权利要求1-35中任一项所述的方法,其中所述正常细胞培养基是适于未修饰细胞的生长和/或增殖的培养基。
37.根据权利要求1-36中任一项所述的方法,其中所述正常细胞培养基没有任何外源选择压力。
38.根据权利要求5-37中任一项所述的方法,其中使用CRISPR RNP将第二种两部分核苷酸敲入所述靶基因组中的预定位点,可选地,其中所述靶基因组中的预定位点是B2M基因。
39.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将至少一种两部分核苷酸序列导入细胞,所述两部分核苷酸序列能够在所述细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者,
其中,所述细胞具有存活和/或增殖必需的蛋白的功能活性,所述功能活性被降低以至于所述细胞不能在正常细胞培养基中存活和/或增殖,
其中,所述至少一种两部分核苷酸序列可操作用于在所述细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且
其中,所述至少一种两部分核苷酸序列包含编码第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,所述第一蛋白提供与存活和/或增殖所必需的蛋白基本等同的功能,其中所述第二蛋白是目的蛋白;和
ⅱ)在细胞培养基中培养所述细胞,所述细胞培养基中含有至少一种导致表达所述第一蛋白和所述第二蛋白两者的细胞的富集或选择的补充剂。
40.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的功能活性降低到细胞在正常体外增殖条件下不能存活和/或增殖的水平;
ⅱ)将至少一种两部分核苷酸序列导入所述细胞,所述两部分核苷酸序列能够在细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者,并且所述两部分核苷酸序列包含编码提供基本上等同的功能的第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,
其中所述至少一种两部分核苷酸序列可操作用于在细胞中表达或当插入靶基因组中的预定位点时变得可操作用于表达,并且
其中所述第二蛋白是目的蛋白,和
ⅲ)在细胞培养基中培养所述细胞,所述细胞培养基中含有至少一种导致表达第一蛋白和第二蛋白两者的细胞的选择或富集的补充剂。
41.根据权利要求39或40所述的方法,其中所述细胞是T细胞、NK细胞、NKT细胞、iNKT细胞、造血干细胞、间充质干细胞、iPSC、神经前体细胞、视网膜基因治疗中的细胞类型或任何其他细胞。
42.根据权利要求39-41中任一项所述的方法,其中所述第一部分核苷酸序列在核苷酸序列上被改变以实现核酸酶、siRNA、miRNA或CRISPRi抗性,并且a)编码具有与所述第一蛋白相同的氨基酸序列的蛋白,或者b)编码相对于第一蛋白具有调整的功能的蛋白。
43.根据权利要求39-42中任一项所述的方法,其中所述第一部分核苷酸序列被改变以编码改变的蛋白,所述改变的蛋白具有与所述第一蛋白不同的氨基酸序列。
44.根据权利要求43所述的方法,其中所述改变的蛋白具有所述第一蛋白不具有的特定特征。
45.根据权利要求44所述的方法,其中所述特定特征包括但不限于以下一项或多项:活性降低、活性增加、对小分子抑制的半衰期抗性改变以及结合小分子后活性增加。
46.根据权利要求39-45中任一项所述的方法,其中所述第一部分核苷酸序列和第二部分核苷酸序列两者都可以由同一启动子或不同的启动子驱动。
47.根据权利要求39-46中任一项所述的方法,其中所述第二部分核苷酸序列包含至少一种治疗基因。
48.根据权利要求39-47中任一项所述的方法,其中所述第二部分核苷酸序列编码包含TCRα链和TCRβ链的新生抗原T细胞受体复合物(TCR)。
49.根据权利要求39-48中任一项所述的方法,其中所述必需的蛋白或第一蛋白是二氢叶酸还原酶(DHFR)、肌苷一磷酸脱氢酶2(IMPDH2)、O-6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)、脱氧胞苷激酶(DCK)、次黄嘌呤磷酸核糖基转移酶1(HPRT1)、白细胞介素2受体亚单位γ(IL2RG)、肌动蛋白β(ACTB)、真核翻译延伸因子1α1(EEF1A1)、甘油醛-3-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶1(PGK1)或转铁蛋白受体(TFRC)。
50.根据权利要求39-49中任一项所述的方法,其中所述第一部分核苷酸序列包含蛋白抑制剂抗性DHFR基因,并且所述第二部分核苷酸序列包含TRA基因和TRB基因。
51.根据权利要求50所述的方法,其中所述TRA基因、TRB基因和DHFR基因被可操作地配置为从一个开放阅读框中表达。
52.根据权利要求51所述的方法,其中所述TRA基因、TRB基因和DHFR基因由至少一种接头隔开。
53.根据权利要求52所述的方法,其中所述至少一种接头、TRA基因、TRB基因和DHFR基因的顺序如下:
TRA-接头-TRB-接头-DHFR,
TRA-接头-DHFR-接头-TRB,
TRB-接头-TRA-接头-DHFR,
TRB-接头-DHFR-接头-TRA,
DHFR-接头-TRA-接头-TRB,或
DHFR-接头-TRB-接头-TRA。
54.根据权利要求53所述的方法,其中所述至少一种接头是至少一种自切割2A肽和/或至少一种IRES元件。
55.根据权利要求50-54中任一项所述的方法,其中所述DHFR基因、TRA基因和TRB基因由内源性TCR启动子或任何其他合适的启动子驱动,所述启动子包括但不限于以下启动子:TRAC、TRBC1/2、DHFR、EEF1A1、ACTB、B2M、CD52、CD2、CD3G、CD3D、CD3E、LCK、LAT、PTPRC、IL2RG、ITGB2、TGFBR2、PDCD1、CTLA4、FAS、TNFRSF1A(TNFR1)、TNFRSF10B(TRAILR2)、ADORA2A、BTLA、CD200R1、LAG3、TIGIT、HAVCR2(TIM3)、VSIR(VISTA)、IL10RA、IL4RA、EIF4A1、FTH1、FTL、HSPA5和PGK1。
56.根据权利要求39-55中任一项所述的方法,其中所述两部分核苷酸序列被整合到所述细胞的基因组中。
57.根据权利要求39-56中任一项所述的方法,其中所述至少一种两部分核苷酸序列在插入靶基因组中的预定位点时变得可操作用于表达,并且所述第一部分核苷酸序列和第二部分核苷酸序列均由所述靶基因组中的启动子驱动。
58.根据权利要求57所述的方法,其中所述整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。
59.根据权利要求58所述的方法,其中所述核酸酶介导的位点特异性整合是通过CRISPR RNP,任选地通过CRISPR/Cas9 RNP实现的。
60.根据权利要求59所述的方法,其还包括使用所述断裂蛋白内含肽系统。
61.根据权利要求39-55中任一项所述的方法,其中所述导入的两部分核苷酸序列未被整合到所述细胞的基因组中。
62.根据权利要求39-60中任一项所述的方法,其中将靶向内源性TCR恒定基因座的CRISPR RNP、编码蛋白抑制剂抗性DHFR基因的第一部分核苷酸序列和编码新生抗原TCR的第二部分核苷酸序列递送至所述细胞。
63.根据权利要求62所述的方法,其中所述内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。
64.根据权利要求62或63所述的方法,其中所述递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。
65.根据权利要求62-64中任一项所述的方法,其中所述CRISPR RNP是切割所述TRAC基因座用于敲入的TRAC RNP。
66.根据权利要求59、62或65中任一项所述的方法,其中所述CRISPR RNP是CRISPR/Cas9 RNP。
67.根据权利要求39-66中任一项所述的方法,其中导致所述细胞富集或选择的补充剂是使通过流式细胞术或磁珠富集来富集所述细胞的抗体。
68.根据权利要求39-67中任一项所述的方法,其中所述补充剂在不表达所述第一蛋白和所述第二蛋白两者的情况下损害细胞的存活和/或增殖。
69.根据权利要求68所述的方法,其中所述第一蛋白介导所述细胞对所述补充剂介导的细胞存活和/或增殖损害的抗性。
70.根据权利要求39-69中任一项所述的方法,其中所述补充剂是氨甲蝶呤。
71.根据权利要求69或70中任一项所述的方法,其中所述第一蛋白是氨甲蝶呤抗性DHFR突变蛋白。
72.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将至少两种两部分核苷酸序列导入细胞,所述两部分核苷酸序列能够在所述细胞中表达第一部分核苷酸序列和第二部分核苷酸序列两者,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,
其中所述第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码第一目的蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中所述第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码第二目的蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中,当所述第一融合蛋白和所述第二融合蛋白两者在所述细胞中一起表达时,所述存活和/或增殖必需的蛋白的功能得到恢复;和
ⅱ)在导致选择表达第一两部分核苷酸序列和第二两部分核苷酸序列两者的细胞的条件下培养所述细胞。
73.一种用于选择或富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白抑制到细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)导入至少两种两部分核苷酸序列,所述两部分核苷酸序列能够在所述细胞中表达,
其中所述第一两部分核苷酸序列包含编码第一融合蛋白的第一部分核苷酸序列和编码第一目的蛋白的第二部分核苷酸序列,所述第一融合蛋白包含与第一结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中所述第二两部分核苷酸序列包含编码第二融合蛋白的第一部分核苷酸序列和编码第二目的蛋白的第二部分核苷酸序列,所述第二融合蛋白包含与第二结合结构域融合的存活和/或增殖必需的蛋白的非功能部分,
其中,当所述第一融合蛋白和所述第二融合蛋白两者在所述细胞中一起表达时,所述存活和/或增殖必需的蛋白的功能得到恢复,和
ⅲ)在导致表达第一融合蛋白和第二融合蛋白两者的细胞富集的体外增殖条件下培养所述细胞。
74.根据权利要求72或73所述的方法,其中所述必需的蛋白是DHFR蛋白。
75.根据权利要求74所述的方法,其中所述第一融合蛋白包含DHFR的N-末端部分,并且所述第二融合蛋白包含DHFR的C-末端部分。
76.根据权利要求74所述的方法,其中所述第一融合蛋白包含DHFR的C-末端部分,并且所述第二融合蛋白包含DHFR的N-末端部分。
77.根据权利要求74或75所述的方法,其中所述DHFR的N-末端部分包括SEQ ID NO:22。
78.根据权利要求74-77中任一项所述的方法,其中所述DHFR的C-末端部分包括SEQ IDNO:23。
79.根据权利要求72-78中任一项所述的方法,其中所述第一两部分核苷酸序列或第二两部分核苷酸序列中的第二部分核苷酸序列对所述细胞而言是外源性的。
80.根据权利要求72-79中任一项所述的方法,其中所述第一两部分核苷酸序列或第二两部分核苷酸序列中的第二部分核苷酸序列是TCR。
81.根据权利要求72-80中任一项所述的方法,其中所述第一结合结构域和第二结合结构域源自GCN4。
82.根据权利要求72-81中任一项所述的方法,其中所述第一结合结构域和/或第二结合结构域包括SEQ ID NO:24。
83.根据权利要求72-82中任一项所述的方法,其中所述第一融合蛋白和所述第二融合蛋白包括SEQ ID NO:39或SEQ ID NO:40。
84.根据权利要求72-80中任一项所述的方法,其中所述第一结合结构域和第二结合结构域源自FKBP12。
85.根据权利要求84所述的方法,其中所述FKBP12具有F36V突变。
86.根据权利要求72-80、84或85中任一项所述的方法,其中所述第一结合结构域和/或第二结合结构域包括SEQ ID NO:31。
87.根据权利要求72-80或84-86中任一项所述的方法,其中所述第一融合蛋白和所述第二融合蛋白包括SEQ ID NO:62或SEQ ID NO:63。
88.根据权利要求72-80中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域源自JUN和FOS。
89.根据权利要求88所述的方法,其中所述第一结合结构域和所述第二结合结构域具有互补突变,以保持相互之间的结合。
90.根据权利要求89所述的方法,其中所述第一结合结构域和所述第二结合结构域都不结合天然结合配偶体。
91.根据权利要求72-80或88-90中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域各具有3至7个互补突变。
92.根据权利要求91所述的方法,其中所述第一结合结构域和所述第二结合结构域各具有3个互补突变。
93.根据权利要求72-80或88-92中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域包括SEQ ID NO:26或SEQ ID NO:29。
94.根据权利要求72-80或88-93中任一项所述的方法,其中所述第一融合蛋白和所述第二融合蛋白包括SEQ ID NO:35或SEQ ID NO:36。
95.根据权利要求91所述的方法,其中所述第一结合结构域和所述第二结合结构域各具有4个互补突变。
96.根据权利要求72-80、88-91或95中任一项所述的方法,其中所述第一结合结构域和所述第二结合结构域包括SEQ ID NO:27和SEQ ID NO:30。
97.根据权利要求72-80、88-91、95或96中任一项所述的方法,其中所述第一融合蛋白和所述第二融合蛋白包括SEQ ID NO:37和SEQ ID NO:38。
98.根据权利要求72-97中任一项所述的方法,其中所述至少两种两部分核苷酸序列被整合到所述细胞的基因组中。
99.根据权利要求72-98中任一项所述的方法,其中当将所述至少两种两部分核苷酸序列插入靶基因组中的预定位点时,所述至少两种两部分核苷酸序列变得可操作用于表达,并且所述第一部分核苷酸序列和第二部分核苷酸序列两者均由所述靶基因组中的启动子驱动。
100.根据权利要求98或99所述的方法,其中所述整合是通过核酸酶介导的位点特异性整合、转座子介导的基因递送或病毒介导的基因递送实现的。
101.根据权利要求100所述的方法,其中所述核酸酶介导的位点特异性整合是通过CRISPR RNP实现的。
102.根据权利要求72-101中任一项所述的方法,其中通过靶向内源性TCR恒定基因座的CRISPR RNP将所述第一两部分核苷酸序列递送至所述细胞,所述第一种第一部分核苷酸序列编码DHFR蛋白的非功能部分,并且所述第一种第二部分核苷酸序列编码新生抗原TCR。
103.根据权利要求72-102中任一项所述的方法,其中通过靶向除了TCR恒定基因座之外的内源性基因座的CRISPR RNP将所述第二两部分核苷酸序列递送至所述细胞,所述第二种第一部分核苷酸序列编码DHFR蛋白的非功能部分,并且所述第二种第二部分核苷酸序列编码目的蛋白。
104.根据权利要求103所述的方法,其中所述第一种第一部分核苷酸序列和所述第二种第一部分核苷酸序列编码融合蛋白,所述融合蛋白包含当所述融合蛋白共表达时具有DHFR活性的DHFR蛋白的非功能部分。
105.根据权利要求102-104中任一项所述的方法,其中所述内源性TCR恒定基因座可以是TCRα恒定(TRAC)基因座或TCRβ恒定(TRBC)基因座。
106.根据权利要求103-105中任一项所述的方法,其中所述除了TCR恒定基因座之外的内源性基因座是B2M基因座。
107.根据权利要求102-106中任一项所述的方法,其中所述递送是通过电穿孔,或基于机械或化学膜透化的方法实现的。
108.根据权利要求101-107中任一项所述的方法,其中所述CRISPR RNP是CRISPR/Cas9RNP。
109.根据权利要求26-28、30-38、58-60、62-71或100-108中任一项所述的方法,其中所述核酸酶使得能够框内外显子整合到基因座中,以便由所述内源性启动子、所述内源性剪接位点和所述内源性终止信号表达所述两部分核苷酸之一的至少一部分。
110.根据权利要求26-28、30-38、58-60、62-71或100-108中任一项所述的方法,其中所述核酸酶使得能够框内外显子整合到基因座中,以便由所述内源性启动子、所述内源性剪接位点和外源性终止信号表达所述两部分核苷酸之一的至少一部分。
111.根据权利要求26-28、30-38、58-60、62-71或100-108中任一项所述的方法,其中所述核酸酶使得能够内含子整合到基因座中,以便由所述内源性启动子、外源性剪接受体位点和外源性终止信号表达所述两部分核苷酸之一的至少一部分。
112.根据权利要求1-80中任一项所述的方法,其中所述必需的蛋白或第一蛋白被拆分成至少两个单独的功能失调的蛋白部分,其中所述至少两个部分中的每一个均被融合到多聚体结构域,并且其中所述至少两个部分中的每一个均被整合到不同的两部分核苷酸序列中以允许选择其中表达所有不同的两部分核苷酸序列的细胞,任选地,其中所述必需的蛋白或第一蛋白的功能得到恢复。
113.根据权利要求1-80中任一项所述的方法,其中所述必需的蛋白或第一蛋白被拆分成功能失调的N-末端的一半蛋白和C-末端的一半蛋白,每一半蛋白均与同源或异源二聚化蛋白配偶体或断裂蛋白内含肽融合。
114.根据权利要求112或113中任一项所述的方法,其中所述必需的蛋白或第一蛋白是DHFR蛋白。
115.根据权利要求114所述的方法,其中第一功能失调的蛋白部分包含DHFR的N-末端部分,并且第二功能失调的蛋白部分包含DHFR的C-末端部分。
116.根据权利要求115所述的方法,其中所述DHFR的N-末端部分包括SEQ ID NO:22。
117.根据权利要求116所述的方法,其中所述DHFR的C-末端部分包括SEQ ID NO:23。
118.根据权利要求108-110中任一项所述的方法,其中所述同源二聚化蛋白是GCN4、FKBP12或它们的变体。
119.根据权利要求108-110中任一项所述的方法,其中所述异源二聚化蛋白是Jun/Fos或它们的变体。
120.根据权利要求72-76、80-83或108-111中任一项所述的方法,其中所述必需的蛋白的功能的恢复是诱导的,任选地通过AP1903诱导。
121.根据权利要求72-108中任一项所述的方法,其中所述培养步骤在氨甲蝶呤的存在下进行。
122.根据权利要求1-121中任一项所述的方法,其中所述目的蛋白是T细胞受体。
123.根据权利要求122所述的方法,其中所述T细胞受体对病毒或肿瘤抗原具有特异性。
124.根据权利要求123所述的方法,其中所述肿瘤抗原是肿瘤新生抗原。
125.根据前述权利要求中任一项所述的方法,其中所述基因工程细胞是原代人T细胞。
126.一种用于富集基因工程T细胞的方法,其包括
ⅰ)通过在TRA或TRB启动子下游整合两部分核苷酸序列,将包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码T细胞受体复合物或嵌合抗原受体的第二部分核苷酸序列的两部分核苷酸序列导入T细胞,和
ⅱ)在含有导致表达第一蛋白和第二蛋白两者的细胞的富集的氨甲蝶呤的细胞培养基中培养细胞。
127.一种用于富集经工程改造以表达外源性T细胞受体基因的T细胞的方法,其包括:
ⅰ)使用第一CRISPR/Cas9 RNP将内源性TRBC基因从其基因座上敲除;
ⅱ)使用第二CRISPR/Cas9 RNP将编码氨甲蝶呤抗性DHFR基因的第一部分核苷酸序列和包含治疗性TCR基因的第二部分核苷酸序列敲入内源性TRBC基因座,其中两种核苷酸序列可操作地连接以允许由内源性TRBC启动子的表达;和
ⅲ)在含有导致表达治疗性TCR和氨甲蝶呤抗性DHFR基因两者的T细胞富集的氨甲蝶呤的细胞培养基中培养所述细胞。
128.一种用于选择基因工程细胞的方法,其包括:
ⅰ)将至少一种两部分核苷酸序列导入细胞,所述两部分核苷酸序列可操作用于在细胞中表达,
其中所述细胞具有存活和/或增殖所必需的蛋白,所述蛋白被抑制到所述细胞不能存活和/或增殖的水平,并且
其中所述至少一种两部分核苷酸序列包含编码存活和/或增殖必需的蛋白的第一部分核苷酸序列,和编码待表达蛋白的第二部分核苷酸序列,其中所述第二部分核苷酸序列编码对细胞而言是外源性的蛋白;和
ⅱ)在导致选择表达第一部分核苷酸序列和第二部分核苷酸序列两者的细胞的条件下培养所述细胞。
129.一种用于富集基因工程细胞的方法,其包括:
ⅰ)将细胞存活和/或增殖所必需的至少第一蛋白的活性降低到所述细胞在正常体外繁殖条件下不能存活和/或增殖的水平;
ⅱ)导入至少一种两部分核苷酸序列,所述两部分核苷酸序列可操作用于在所述细胞中表达,并且包括编码所述第一蛋白的第一部分核苷酸序列和编码待表达的第二蛋白的第二部分核苷酸序列,其中所述第二部分蛋白对所述细胞而言是外源性的,和
ⅲ)在导致表达第一蛋白和第二蛋白两者的细胞富集的体外增殖条件下培养所述细胞。
130.根据上述权利要求中任一项所述的方法制成的细胞。
131.一种T细胞,其包括:
内源性二氢叶酸还原酶(DHFR),其在氨甲蝶呤的存在下被抑制到细胞不能存活和/或增殖的水平,和
至少一种两部分核苷酸序列,其包含编码氨甲蝶呤抗性DHFR蛋白的第一部分核苷酸序列和编码由内源性TRA或TRB启动子可操作地表达的T细胞受体的第二部分核苷酸序列。
132.一种T细胞,其包括:
内源性二氢叶酸还原酶(DHFR)的敲除,和
至少一种两部分核苷酸序列,其包含:
编码DHFR蛋白或其变体的第一部分核苷酸序列;和
编码T细胞受体的第二部分核苷酸序列,所述T细胞受体由内源性TRA或TRB启动子可操作地表达。
133.一种T细胞,其包括:
内源性二氢叶酸还原酶(DHFR),其被配置为在氨甲蝶呤的存在下被抑制到所述细胞不能存活和/或增殖的水平,和
至少两种两部分核苷酸序列,
其中所述第一两部分核苷酸序列包含:
i)第一种第一部分核苷酸序列,其编码DHFR蛋白或其变体的非功能性或功能失调的部分;和
ⅱ)第一种第二部分核苷酸序列,其编码由内源性TRA或TRB启动子可操作地表达的T细胞受体,
其中所述第二两部分核苷酸序列包含:
ⅲ)第二种第一部分核苷酸序列,其编码DHFR蛋白或其变体的非功能性或功能失调的部分;和
iv)第二种第二部分核苷酸序列,其编码由内源性B2M启动子可操作地表达的目的蛋白,并且
其中所述细胞被配置为具有DHFR活性。
CN202180069138.5A 2020-08-07 2021-08-05 富集基因工程t细胞的方法 Pending CN116323920A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202063062854P 2020-08-07 2020-08-07
US63/062,854 2020-08-07
US202163135460P 2021-01-08 2021-01-08
US63/135,460 2021-01-08
US202163170269P 2021-04-02 2021-04-02
US63/170,269 2021-04-02
US202163221808P 2021-07-14 2021-07-14
US63/221,808 2021-07-14
PCT/US2021/071122 WO2022032299A1 (en) 2020-08-07 2021-08-05 Methods to enrich genetically engineered t cells

Publications (1)

Publication Number Publication Date
CN116323920A true CN116323920A (zh) 2023-06-23

Family

ID=77543729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180069138.5A Pending CN116323920A (zh) 2020-08-07 2021-08-05 富集基因工程t细胞的方法

Country Status (10)

Country Link
US (1) US20220041999A1 (zh)
EP (1) EP4192941A1 (zh)
JP (1) JP2023537048A (zh)
KR (1) KR20230065251A (zh)
CN (1) CN116323920A (zh)
AU (1) AU2021320556A1 (zh)
CA (1) CA3188431A1 (zh)
MX (1) MX2023001596A (zh)
TW (1) TW202212352A (zh)
WO (1) WO2022032299A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202246511A (zh) * 2021-02-25 2022-12-01 美商萊爾免疫藥物股份有限公司 靶向ny-eso-1之增強免疫細胞療法
CA3237754A1 (en) 2021-11-15 2023-05-19 Neogene Therapeutics B.V. Engineered t cells with reduced tgf-beta receptor signaling

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11014989B2 (en) * 2015-01-26 2021-05-25 Cellectis Anti-CLL1 specific single-chain chimeric antigen receptors (scCARs) for cancer immunotherapy
BR112018071199A2 (pt) * 2016-04-15 2019-02-12 Memorial Sloan Kettering Cancer Center célula t, população isolada de células t, composição farmacêutica, método de tratamento, método para gerar uma célula t, vetor, célula tronco
US11622977B2 (en) * 2017-05-12 2023-04-11 Crispr Therapeutics Ag Materials and methods for engineering cells and uses thereof in immuno-oncology
CN107201365B (zh) * 2017-05-19 2018-04-20 四川丰讯科技发展有限公司 一种特异性敲除二氢叶酸还原酶基因的sgRNA序列及其应用
WO2019018553A1 (en) * 2017-07-18 2019-01-24 The Broad Institute, Inc. METHODS OF PRODUCING HUMAN CANCER CELL MODELS AND METHODS OF USE
US20200224160A1 (en) * 2018-02-27 2020-07-16 Sorrento Therapeutics, Inc. Process for dna integration using rna-guided endonucleases
EP3781176A4 (en) * 2018-04-09 2022-05-25 The Trustees of the University of Pennsylvania METHODS AND COMPOSITIONS USING A VIRAL VECTOR FOR THE EXPRESSION OF A TRANSGENE AND AN EFFECTOR

Also Published As

Publication number Publication date
EP4192941A1 (en) 2023-06-14
CA3188431A1 (en) 2022-02-10
WO2022032299A1 (en) 2022-02-10
MX2023001596A (es) 2023-04-20
US20220041999A1 (en) 2022-02-10
JP2023537048A (ja) 2023-08-30
TW202212352A (zh) 2022-04-01
AU2021320556A1 (en) 2023-03-09
KR20230065251A (ko) 2023-05-11

Similar Documents

Publication Publication Date Title
US20210139583A1 (en) Production of engineered t-cells by sleeping beauty transposon coupled with methotrexate selection
US11590171B2 (en) Targeted replacement of endogenous T cell receptors
CN110914431B (zh) 经人工操纵的免疫细胞
US20230066806A1 (en) Pooled knock-in screening and heterologous polypeptides co-expressed under the control of endogenous loci
US20220041999A1 (en) Methods to enrich genetically engineered t cells
WO2022266538A2 (en) Compositions and methods for targeting, editing or modifying human genes
WO2023235813A2 (en) Modified regulatory t cells and methods of using the same
WO2024047561A1 (en) Biomaterials and processes for immune synapse modulation of hypoimmunogenicity
CN116802274A (zh) 用于减少细胞中ii类mhc的组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination