CN113481184A - 融合蛋白以及其使用方法 - Google Patents

融合蛋白以及其使用方法 Download PDF

Info

Publication number
CN113481184A
CN113481184A CN202110900953.3A CN202110900953A CN113481184A CN 113481184 A CN113481184 A CN 113481184A CN 202110900953 A CN202110900953 A CN 202110900953A CN 113481184 A CN113481184 A CN 113481184A
Authority
CN
China
Prior art keywords
leu
lys
protein
glu
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110900953.3A
Other languages
English (en)
Inventor
胡家志
尹健行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202110900953.3A priority Critical patent/CN113481184A/zh
Publication of CN113481184A publication Critical patent/CN113481184A/zh
Priority to PCT/CN2022/110597 priority patent/WO2023011638A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15041Use of virus, viral particle or viral elements as a vector
    • C12N2740/15043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Hematology (AREA)
  • Plant Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Virology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Developmental Biology & Embryology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Epidemiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及融合蛋白以及其使用方法。融合蛋白包含第一蛋白和第二蛋白,其中第一蛋白是Cas,如Cas9、Cas12a、Cas12b、Cas12e以及TALEN或ZFN,第二蛋白是核酸外切酶或者核酸内切酶,如TREX2、TREX1、APE1、Artemis、CtIP、Exo1、Mre11、RAD1、RAD9、Tp53、WRN、外切核酸酶V、T5外切核酸酶或T7外切核酸酶。第一蛋白与第二蛋白是直接连接的或者通过接头连接。本发明的融合蛋白可以保证基因编辑过程中的基因组稳定性,降低单基因或多基因编辑过程中的染色体结构变异的产生。本发明的融合蛋白提高CAR‑T构建过程中T细胞的基因组稳定性,防止改造的CAR‑T细胞发生瘤变。

Description

融合蛋白以及其使用方法
技术领域
本发明涉及蛋白质领域,具体地涉及用于基因编辑的融合蛋白。
背景技术
基因编辑安全性一直是影响基因编辑在临床上应用的最大障碍。脱靶活性是比较受关注的一个影响基因编辑安全性的方面,而且多种高保真酶的开发也能降低Cas9等酶的脱靶活性(Kleinstiver et al.,2016;Schmid-Burgk et al.,2020;Slaymaker et al.,2016;Yin et al.,2019)。DNA修复产生的染色质结构变异也是Cas9等基因编辑工具酶进行编辑过程中必然产物,常常与癌症发生偶联在一起。但是由于缺乏有效的鉴定工具,目前对其认识主要是对偶然发现的产物的报道。数篇研究报道了基因编辑产物中包含染色体大片段缺失和染色体易位,这成为阻碍基因编辑临床应用的一个重要方面(Cullot et al.,2019;Egli et al.,2018;Kosicki et al.,2018;Shin et al.,2017)。
针对脱靶效应,目前已经有了通过利用Cas9高保真突变体来减弱的成熟方案,但对于染色体异常结构的产生,从该领域发展至今尚缺乏很好的应对策略。染色体异常结构是由细胞内的DNA修复通路决定,常常与癌症的发生偶联在一起,是一种非常危险的副产物。目前国际上缺乏可以定量检测这些结构的方法。发明人先前的PEM-seq(Primer-extension-mediated sequencing)(Yin et al.,2019)方法可以检测各种DNA修复异常结构。
此外,目前医学以及科研工作者经常将T淋巴细胞进行分离,活化,离体扩增,并注入患者体内以进行过继T细胞免疫疗法(Rosenberg et al.,2008;Laskowski andRezvani,2020)。除了使用患者自身或其他健康供体的原始T细胞外,T细胞最终还可以经过工程化改造以容纳合成的嵌合抗原受体(Chimeric antigen receptor,CAR)或新抗原特异性T细胞受体(T cell receptor,TCR)以增强其抗肿瘤功能(Morgan et al.,2006;Kochenderfer and Rosenberg,2013;Porter et al.,2011;June and Sadelain,2018)。CAR T细胞通过使用抗体的抗原结合结构域直接识别肿瘤细胞进行攻击,从而绕过了主要组织相容性复合物(Major histocompatibility complex,MHC)呈递肿瘤抗原的要求(Kalos and June,2013;Rafiq et al.,2020)。CAR和TCR T细胞都已显示出在癌症治疗中的巨大潜力,特别是对于B细胞恶性肿瘤,除数种市售CAR T疗法外,数百项临床试验已获批准(Wei et al.,2020;Manfredi et al.,2020)。
为了进一步提高工程化改造的CAR或TCR T细胞的特异性和持久性,相关工作利用基因编辑失活导致T细胞功能障碍或衰竭的基因,以开发下一代过继T细胞免疫疗法(Hendriks et al.,2020)。与之相关,相关工作已靶向恒定区中的外显子处靶向TCRα和β链基因TRAC和TRBC,以减少TCR T细胞中转导的肿瘤特异性TCR的错配并增强CAR T细胞中的肿瘤排斥(Stadtmauer et al.,2020;Eyquem et al.,2017),以及免疫检查点因子编程化细胞死亡蛋白1(PD-1)的缺失使工程化的CAR或TCR T细胞在输注后能够在患者体内持续存在(Stadtmauer et al.,2020;Ren et al.,2017a)。消除TRAC,TRBC或人白细胞抗原I类(HLA-1)亚基基因β-2微球蛋白(B2M)可以在植入同种异体T细胞时降低移植物抗宿主疾病(GVHD)的风险(Liu et al.,2016;Ren et al.,2017)。此外,其他基因的破坏也能够增强工程化的T细胞,并有数十项临床试验正在进行(Fraietta et al.,2018;Hendriks et al.,2020)。
虽然锌指核酸酶(Zinc finger nucleases,ZFN),转录激活因子样效应子核酸酶(Transcription activator-like effector nucleases,TALEN)和成簇规则间隔短回文重复序列(CRISPR)-Cpf1已成功应用于破坏CAR T细胞中的单个或多个基因(Torikai etal.,2012;Poirot et al.,2015;Qasim et al.,2017;Dai et al.,2019),但是由于CRISPR-Cas9的多重基因组编辑的高度可行性,目前大多数过继T免疫疗法临床试验都已倾向使用CRISPR-Cas9(Hendriks et al.,2020)。CRISPR-Cas9在被靶向的基因处产生DNA双链断裂(DNA double-stranded breaks,DSB),以高效地同时失活工程化T细胞中的多个基因(Stadtmauer et al.,2020;Liu et al.,2016;Ren et al.,2017)。然而,在T细胞中进行多重基因组编辑时,两个不同靶位点之间通常会形成染色体易位(Stadtmauer et al.,2020;Liu et al.,2016;Ren et al.,2017)。据估计,对于诱导的DSB或来自细胞内源生理活动的DSB,染色体易位发生的频率为千分之一至百分之一(Roukos et al.,2013;Hu etal.,2016;Tubes and Nussenzweig,2017)。进一步而言,人们在T细胞急性成淋巴细胞白血病中经常观察到染色体易位,并且超过三分之一以上涉及TCR基因座(Graux et al.,2006;Cauwelier et al.,2006)。基因编辑过程中产生的染色体易位阻碍了其进一步的应用。
因此,本领域中迫切需要解决基因编辑安全性的基因编辑工具酶。
发明内容
发明人在前期研究中发现,在制造用于过继细胞疗法的工程化T细胞期间,在多重靶向位点及其脱靶位点中形成了大量的染色体易位。而这是由于CRISPR-CAS系统切割的完美修复产物能够被重复切割,进一步增加了切割频率而导致的。上述染色体易位的存在也进一步对基因编辑技术的安全性提出了巨大的挑战。
在此基础上,发明人创造性的发现,如果将Cas蛋白与核酸酶(例如核酸外切酶)融合形成Cas内外双切酶,就可以极大的降低完美修复的出现频率,从而大大降低了CRISPR-CAS系统导致的染色体易位的水平。也就是说,将具有外切核酸酶活性的蛋白质与RNA引导的内切核酸酶如Cas蛋白连接(直接连接或通过接头连接)得到的融合蛋白可以减少或消除细胞修饰(例如利用CRISPR-Cas9的细胞修饰)中的染色体易位或染色体缺失。例如,将CAS9与TREX2核酸外切酶融合,能够将染色体易位水平降低几十倍,达到仅仅略高于碱基编辑器或与之相当的水平。在CRISPR技术中利用本发明的融合蛋白进行嵌合抗原受体(CAR)T细胞中的多重基因编辑,并且在输注之前几乎消除了有害的涉及TCR的染色体易位。此外,在CRISPR技术中使用本发明的融合蛋白还抑制染色体易位并提高单基因编辑的编辑效率。因此,本发明的融合蛋白是一种有效的基因组编辑工具,具有更高的安全性,并可同时维持或提升基因编辑效率。
在一方面,本发明提供了该融合蛋白包含第一蛋白和第二蛋白,其中
其中第一蛋白是Cas蛋白、TALEN或ZFN;
第二蛋白是核酸外切酶或核酸内切酶,例如TREX2(three prime repairexonuclease 2)、TREX1(three prime repair exonuclease 1)、APE1(apurinic/apyrimidinic endodeoxyribonuclease 1)、Artemis蛋白、CtIP(CtBP-interactingprotein)、Exo1(exonuclease 1)、Mre11(MRE11 homolog,double strand break repairnuclease)、RAD1(RAD1 checkpoint DNA exonuclease)、RAD9蛋白、Tp53(tumor proteinp53)、WRN蛋白、外切核酸酶V、T5外切核酸酶或T7外切核酸酶。
在一个实施方案中,Cas蛋白是Cas9、Cas12a、Cas12b或Cas12e蛋白。
在一个实施方案中,第一蛋白与第二蛋白是直接连接的或者通过接头连接。第一蛋白可以在融合蛋白的C端或N端。
在一个实施方案中,Cas9为SpCas9或SaCas9。在一个实施方案中,Cas12a是AsCas12a,Cas12e为PlmCas12e。
在一个实施方案中,接头是(G)n、(GGGGS)n、(EAAAK)n、(XP)n或XTEN接头,其中n是大于等于1的整数,X是任何氨基酸,优选丙氨酸、赖氨酸或谷氨酸。在一个实施方案中,接头是(G)4S接头。在一个实施方案中,n是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100,或其间的任何整数。在一个实施方案中,X是任何天然存在的氨基酸或非天然存在的氨基酸。
在一个实施方案中,TREX2蛋白包含SEQ ID NO.8的氨基酸序列或其中引入R163A、R165A和R167A中一个或多个的氨基酸序列,或者与它们具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
在一个实施方案中,TREX2蛋白包含:
(1)SEQ ID NO.1的氨基酸序列;
(2)SEQ ID NO.1的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.1的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
在一个实施方案中,Cas9蛋白包含:
(1)SEQ ID NO.2的氨基酸序列;
(2)SEQ ID NO.2的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.2的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
在一个实施方案中,融合蛋白包含
(1)SEQ ID NO.3的氨基酸序列;
(2)SEQ ID NO.3的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.3的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列;或
Cas12e蛋白包含:
(1)SEQ ID NO.89的氨基酸序列;
(2)SEQ ID NO.89的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.89的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列;或
Cas12a蛋白包含:
(1)SEQ ID NO.91的氨基酸序列;
(2)SEQ ID NO.91的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.91的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
在另一个方面,本发明提供了核酸,该核酸编码根据本发明的融合蛋白。
在另一个方面,本发明提供了载体,该载体包含根据本发明的核酸。
在另一个方面,本发明提供了宿主细胞,该宿主细胞包含本发明的载体。
在另一个方面,本发明提供了制备本发明的融合蛋白的方法,其包括以下步骤:
(1)在适合于培养宿主细胞的条件下培养本发明的宿主细胞;以及
(2)收获本发明的融合蛋白。
在另一个方面,本发明提供了组合物,该组合物包含本发明的融合蛋白和sgRNA。在一个实施方案中,组合物是核糖核蛋白复合物。在一个实施方案中,核糖核蛋白复合物是CRISPR-Cas系统。在一个实施方案中,CRISPR-Cas系统是CRISPR-Cas9、CRISPR-Cas12a、CRISPR-Cas12b或者CRISPR-Cas12e系统。
在另一个方面,本发明提供了遗传修饰细胞的方法,所述方法包括将根据本发明的融合蛋白、核酸、载体或组合物导入细胞的步骤。优选地,细胞是T细胞或HSC细胞。优选地,细胞是TCR T细胞、NK细胞或CAR-T细胞。
在一个实施方案中,本发明提供了一种减少或者消除利用CRSPR-Cas进行基因编辑时产生的染色体结构变异的方法,其包括将本发明的融合蛋白、核酸、载体或者组合物导入目标细胞的步骤。优选地,细胞是T细胞或HSC细胞,优选地,其中所述细胞是TCR-T细胞或CAR-T细胞。
在一个实施方案中,本发明提供了一种基因编辑方法,其包括将本发明的融合蛋白、核酸、载体或者组合物导入目标细胞的步骤,优选地,其中所述细胞是T细胞或HSC细胞。优选地,细胞是TCR-T细胞或CAR-T细胞。
在一个实施方案中,组合物能够减少或消除基因编辑过程中的染色体异常结构。
在一个实施方案中,基因选自Oct4、MYH7、TRAC、PDCD1、TRBC、UROS、Fzd3、TLX1(HOX11)、TLX3(HOX11L2)、HOXA簇、HAL1、HAL2、LYL1、BHLHB1、LMO1、LMO2、LCK、NOTCH1、CCND2、SIL/TAL1、CALM/AF10、MLL/ENL、MLL/AF6、MLL/AF10、MLL/AFX1、MLL/AF4、NUP214/ABL1、EML1/ABL1、ETV6(TEL)/ABL1、ETV6(TEL)/JAK2、BCR/ABL1、NUP98/RAP1GDS1、B2M、CCR5或VEGFA。
在一个实施方案中,染色体异常结构是染色体易位和/或染色体缺失。
在一个实施方案中,染色体缺失是染色体的大片段缺失。在一个实施方案中,染色体的大片段缺失是100bp-4Mb染色体片段缺失。在一个实施方案中,染色体的大片段缺失可以是200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1kb、5kb、10kb、20kb、30kb、40kb、50kb、100kb、200kb、300kb、500kb、600kb、700kb、800kb、1Mb、2Mb或3Mb的染色体的大片段缺失。
在一个实施方案中,基因编辑通过CRISPR-Cas系统进行,优选通过CRISPR-Cas9系统、CRISPR-Cas12a、CRISPR-Cas12b或者CRISPR-Cas12e进行。
在另一个方面,本发明提供了细胞,其已经通过本发明的方法进行了修饰。在一个实施方案中,所述细胞是T细胞或HSC细胞。在一个实施方案中,所述细胞是TCR T细胞或CAR-T细胞。
在另一个方面,本发明提供了使用本发明的细胞治疗疾病的方法。在另一个方面,本发明提供了本发明的细胞在制备药物中的用途,所述药物用于治疗需要该细胞的受试者中的疾病。在一个实施方案中,疾病是遗传疾病,例如癌症、自身免疫疾病或眼病。在一个实施方案中,杜氏肌营养不良症、β-地中海贫血、镰状细胞贫血、膀胱癌、髓母细胞瘤、子宫颈癌、乙型肝炎、EBV感染、HIV感染和/或隐孢子虫感染、脉络膜血管增生或黑曚症。在一个实施方案中,使用本发明的细胞可以用于细胞疗法。在一个实施方案中,细胞是自体的或者同种异体的。
在另一个方面,本发明提供了本发明的融合蛋白、核酸、载体或组合物减少或消除基因编辑过程中的染色体异常结构的用途。优选地,其中基因选自Oct4、MYH7、TRAC、PDCD1、TRBC、UROS、Fzd3、TLX1(HOX11)、TLX3(HOX11L2)、HOXA簇、HAL1、HAL2、LYL1、BHLHB1、LMO1、LMO2、LCK、NOTCH1、CCND2、SIL/TAL1、CALM/AF10、MLL/ENL、MLL/AF6、MLL/AF10、MLL/AFX1、MLL/AF4、NUP214/ABL1、EML1/ABL1、ETV6(TEL)/ABL1、ETV6(TEL)/JAK2、BCR/ABL1、NUP98/RAP1GDS1、B2M、CCR5或VEGFA。优选地,染色体异常结构是染色体易位和/或染色体缺失。
优选地,染色体缺失是100bp-4Mb的染色体片段缺失。
优选地,所述基因编辑通过CRISPR-Cas系统进行,优选通过CRISPR-Cas9系统、CRISPR-Cas12a、CRISPR-Cas12b或者CRISPR-Cas12e进行。
在本文中,基因编辑可以是单基因编辑或多重基因编辑。
在另一个方面,本发明提供了融合蛋白、核酸、载体或组合物在保证基因编辑过程中的基因组稳定性、提高CAR-T构建过程中T细胞的基因组稳定性或防止改造的CAR-T细胞发生瘤变中的用途。该用途通过降低染色体异常结构实现。
本发明的优点包括:
1.与单独的核酸酶,例如TALEN或ZFN,或Cas蛋白,例如现有的Cas9相比,本发明的融合蛋白可以显著减弱或消除基因编辑过程中的染色体大片段缺失;
2.与单独的核酸酶,例如TALEN或ZFN,或Cas蛋白,例如现有的Cas9相比,本发明的融合蛋白可以显著减弱或消除基因编辑过程中的染色体易位;
3.与单独的核酸酶,例如TALEN或ZFN,或Cas蛋白,例如现有的Cas9相比,本发明的融合蛋白在实现上述1和2点的同时,具有相当甚至略高的基因编辑效率;
4.与现有CAR-T技术相比,可以在保持操作不变、编辑效率不变的情况下,降低所改造的CAR-T细胞的瘤变的可能性,具有显著更高的安全性。
附图说明
图1:Cas9在人T细胞中介导多重基因编辑过程中的染色体易位。
A.在人T细胞中,在Cas9 RNP进行多重基因编辑期间评估染色体易位的示意图。B.PEM-seq检测转染后第3、7和14天,人T细胞中TRAC,TRBC和PDCD1三个位点的编辑效率。该数据来自三个重复的平均值±SD,分别由“圆形”,“三角形”和“正方形”表示。数据检验利用两尾t检验,*p<0.05和**p<0.01。C.Circos图表明了PEM-seq检测到的转染后3天,人T细胞中TRAC,TRBC,PDCD1和TRAC脱靶位点之间的染色体易位。顺时针方向指示染色体排列方向,着丝粒至端粒。染色体易位的连线上面标注了三个重复的平均值,连线的箭头方向指示诱饵与猎物的方向。D.Cas9 RNP转染3、7和14天后,PEM-seq在人T细胞中检测到的TRAC,TRBC和PDCD1之间的染色体易位百分比。染色体易位被表示为诱饵-猎物,例如:TRAC-TRBC代表TRAC与用位于TRAC的诱饵引物克隆的TRBC之间的染色体易位。来自三个重复的平均值±SD。E.PEM-seq检测人T细胞中转染后3、7和14天从所示基因座克隆的一般染色体易位的百分比。来自三个重复的平均值±SD。在每个数据点上方标出平均值。F.针对Cas9 RNP转染后3天,从人T细胞中TRAC,TRBC和PDCD1鉴定的总染色体易位,使用Enrichr的KEGG进行基因注释(maayanlab.cloud/Enrichr/)。横轴表示所示途径中的基因数目。G.在转染后3天,PEM-seq检测从TRAC克隆的人T细胞中Cas9和相应的变体酶诱导的染色体易位的百分比。
图2:CRISPR-Cas9重复切割增强脱靶偏倚。
A.CRISPR-Cas9编辑结果和重复切割的示意图。Cas9通常可以产生完美重新连接,插入缺失和染色体易位。完美重新连接或一些轻度突变的修复产物可以被CRISPR-Cas9重复切割。B.TRAC中靶位点与脱靶位点之间的潜在染色体易位产物的DNA序列。箭头指示用于生成PEM-seq文库的诱饵引物。根据所示的诱饵引物,可形成两种类型的染色体易位产物“可再靶向”和“不可靶向”。浅灰色字母表示与TRAC中靶位点序列不匹配的碱基。C.Cas9:TRAC对TRAC的中靶位点,脱靶位点和染色体易位产物(如图2的B图所示)的体外消化。黑色箭头表示400bp大小的DNA标志物。被切割的DNA由黑色括号指示。D.PEM-seq检测的TRAC中靶位点克隆的人T细胞中“可再靶向”和“不可靶向”染色体易位产物的百分比。接合数目在括号中。脱靶位点偏倚由“不可靶向”与“可再靶向”的比值计算。E.PEM-seq检测到的HEK293T细胞中TRAC,TRBC和PDCD1脱靶的脱靶偏倚。虚线表示比率=1。F.PEM-seq检测HEK293T细胞中RAG1A,RAG1B,DNMT1-1和C-MYC1基因座的脱靶位点处的脱靶偏倚。数据来自三个重复的平均值±SD。虚线表示比率=1。x轴上的数字表示从强到弱的脱靶顺序。G.K562细胞中HBA1基因座的三个脱靶位点(OT1至OT3)的脱靶染色体易位(上)和脱靶偏倚(下)的百分比。横条上标出倍数变化和脱靶偏倚。具有很少接合的脱靶位点以*突出显示。
图3:通过将TREX2与Cas9融合来减少重复切割和染色体易位。
A.Cas9-TREX2融合蛋白的示意图。Cas9和TREX2通过GGGGS接头连接。R163,R165和R167对于DNA结合活性至关重要,而H188对于TREX2的核酸外切酶活性是必需的。B.PEM-seq检测HEK293T细胞中HBA1基因座处的Cas9,Cas9-T2A-TREX2,Cas9X2和Cas9X2d的编辑效率。灰色条表示缺失的比率,深色条表示插入的比率。在每个条上标记缺失率和总编辑效率。C和D.PEM-seq检测到的HEK293T细胞中HBA1处Cas9,Cas9-T2A-TREX2,Cas9X2和Cas9X2d的脱靶偏倚(C)和脱靶染色体易位比(D)。脱靶偏倚和脱靶染色体易位的倍数变化位于每个条形的顶部。E.用于HEK293T细胞中HBA1处Cas9,Cas9-T2A-TREX2,Cas9X2和Cas9X2dPEM-seq文库的染色体易位的Circos图。浅色箭头指示靶向位点,黑色箭头指示已识别的脱靶位点。脱靶染色体易位的百分比用浅色标记,并且一般染色体易位的百分比用黑色标记。F-I.对于HEK293T细胞中的Cas9,Cas9-T2A-TREX2,Cas9X2和Cas9X2d PEM-seq文库,编辑效率(F),编辑事件中的缺失率(G),脱靶染色体易位的百分比(H),一般染色体易位的百分比(I)。n=10,使用的基因座是DNMT1-1,DNMT1-2,EMX1,HBA1,C-MYC1,C-MYC2,CMYC3,RAG1A,RAG1B和RAG1C。注意,对于Cas9X2而言,在几个基因座中未检测到脱靶染色体易位。Wilcoxon检验,*p<0.05,**p<0.01,n.s表示无显著性。
图4:Cas9TX的表现超出Cas9X2的表现。
(A)体外切割测定法测定,在不使用sgRNA的情况下,Cas9X2和Cas9TX对38-mer寡核苷酸的消化。将指定量的蛋白质与7.5nM 38-nt寡核苷酸温育指定时间。NC,BSA作为阴性对照。B和C.在HEK293T细胞中PEM-seq检测HBA1和C-MYC2处的Cas9,Cas9X2,Cas9TX的编辑效率(B),脱靶染色体易位百分比(C,上部)和脱靶偏倚(C,下部)。如图12的C图所示,所示的HBA1脱靶位点是OT3。脱靶染色体易位的倍数变化和计算出的脱靶偏倚位于每个条形的顶部。D-F.PEM-seq检测到的HEK293T细胞中Cas9和Cas9TX的编辑效率(D),脱靶染色体易位的百分比(E)和一般染色体易位的百分比(F)。n=14,使用的基因座是DNMT1-1,DNMT1-2,HBA1,C-MYC1,C-MYC2,C-MYC3,RAG1A,RAG1B,RAG1C,PTEN,TP53,TRAC,TRBC和PDCD1。Wilcoxon检验,**p<0.01和***p<0.001。
图5:Cas9TX将染色体易位抑制到碱基编辑器的水平。A.PEM-seq检测到的RAG1C基因座处,BE4max,ABEmax,Cas9和Cas9TX的断裂位点周围的编辑模式。箭头表示假定的断裂部位。在核苷酸分辨率上显示突变,缺失和插入的累积水平。B和C.对于HEK293T细胞中EMX1,C-MYC2,DNMT1-2,RAG1C和BCL11A处,PEM-seq检测到的Cas9,Cas9TX,BE4max和ABEmax的编辑效率(B)和一般染色体易位百分比(C)。值得注意的是,EMX1和C-MYC2位点不能被ABEmax靶向。D.Circos图显示了HEK293T细胞中RAG1C处Cas9,Cas9TX,BE4max和ABEmax的染色体易位分布。红色箭头指示RAG1C靶位点。Circos图中的数字显示了一般染色体易位的百分比。
图6:评估Cas9TX对基因组稳定性的影响。A.依托泊苷,Cas9或Cas9TX处理的HEK293T细胞的γH2AX的免疫荧光。该图片为共聚焦显微镜在转染后24小时拍摄图像。Cas9和Cas9TX均用P2A-mCherry标签表达。单独的mCherry是阴性对照。B.依托泊苷,Cas9或Cas9TX处理的每个HEK293T细胞中γH2AX焦点的统计数据。两尾t检验,****p<0.00001;n.s,无显著性。C.PEM-seq评估Cas9和Cas9TX对HEK293T细胞中AsCas12a:C-MYC3的编辑效率和染色体易位水平的影响。D.在HEM293T细胞中,PEM-seq检测到的C-MYC2以及鉴定出的C-MYC2脱靶位点处的Cas9和Cas9TX的编辑效率。来自三个重复的平均值±SD。顶部显示了C-MYC2和C-MYC2脱靶的DNA序列。错配的DNA为浅色。E.HEK293T细胞中通过PEM-seq从C-MYC2脱靶位点克隆的染色体易位百分比。来自三个重复的平均值±SD。两尾t检验,**p<0.01。F.在VEGFA和EMX1的靶向和脱靶处的Cas9和Cas9TX的编辑频率。编辑效率由TIDE评估。从Cas9TX到Cas9的倍数变化位于顶部。平均值±SD。
图7:Cas9TX在CAR-T细胞中消除了染色体易位。A.Cas9或Cas9TX RNP制备CAR-T细胞的示意图。从人脐带血获得的人T细胞通过抗CD3/CD28活化3天,由携带抗CD19 scFV的慢病毒感染,然后进行Cas9/Cas9TX RNPs转染。在转染后3天进行CAR-T杀伤测定法,并在转染后3、7和14天通过PEM-seq分析TRAC,TRBC和PDCD1之间的染色体易位。B.FACS检测到的由携带CAR-CFP的慢病毒感染的T细胞的百分比。3次重复的平均值±SD;n.s,无显著性。C.通过PEM-seq检测到的转染后3天的TRAC,TRBC和PDCD1基因处的编辑效率。3次重复的平均值±SD;n.s,无显著性。D.流式细胞术结果检测转染后3天的TCR表达水平。NC是未进行RNP编辑的阴性对照。E和F.Circos图表示通过PEM-seq检测到的RNP转染后第3天,Cas9(E)或Cas9TX(F)在TRAC,TRBC,PDCD1和TRAC脱靶之间的染色体易位。星号表示已识别的TRAC脱靶位点,如图1C的图例中所述。G-I.转染后3、7和14天根据PEM-seq的测定,从TRAC克隆的TRAC-TRBC(G),TRAC-PDCD1(H)的由Cas9或Cas9TX诱导的染色体易位和TRAC一般染色体易位(I)的比率。显示了三个重复的平均值。两尾t检验,*p<0.05,**p<0.01。J.通过CD19+K562杀伤测定法评估Cas9和Cas9TX编辑的CAR-T细胞的杀伤能力。T代表靶细胞,E代表效应细胞。
图8.在CAR-T细胞工程中的多重基因编辑过程中,Cas9TX减少了大的染色体片段缺失。A.基因组编辑过程中大缺失形成的示意图。DNA切除,随后进行Cas9切割,导致DNA丢失,导致大规模DNA缺失。B-D PEM-seq检测,在转染后3天,7天和14天,对于TRAC(A)和PDCD1(B)和TRBC(C),Cas9和Cas9TX得到的大染色体片段缺失的百分比。数据来自三个重复的t检验,**p<0.01。
图9:A.PEM-seq鉴定CRISPR-Cas9编辑结果的示意图。B.在SDS PAGE上显示Cas9和Cas9高保真度变体的纯化。C.在转染后3、7和14天通过人T细胞的巢式PCR检测TRAC,TRBC和PDCD1之间的染色体易位。在第一轮PCR中使用F1和R1,回收产物用于第二轮PCR,第二轮PCR使用F2和R2进行。具体见方法部分。D.在转染后3、7和14天PEM-seq在人T细胞中检测到的指定染色体易位的平均百分比。E.在转染后3天,在人T细胞中PEM-seq检测,从TRAC,TRBC或PDCD1克隆的全基因组染色体易位模式。星号表示TRAC,TRBC,PDCD1靶向以及鉴定的TRAC脱靶。F.在转染后3天,PEM-seq检测,TRAC基因处的Cas9和指定的高保真度变体的编辑效率。注:此处Cas9文库是图1的B图中所示的三个重复之一。G.在转染后3天,人T细胞中的Cas9和指定高保真度变体在已鉴定的TRAC脱靶处的染色体易位接合的分布。
图10:A.PEM-seq检测到的HCT116,K562和U2OS细胞中RAG1A的靶向与脱靶位点之间的脱靶染色体易位偏倚。来自三个重复的平均值±SD。虚线表示比率=1。注意,由于在这些细胞系中相对较少的脱靶染色体易位接合,来自所有已鉴定的脱靶位点的染色体易位接合进行了组合以进行分析。B.示意图显示了利用两个反向引物建立的PEM-seq文库(左图)和使用反向引物PEM-seq文库检测到的脱靶偏倚(右图)。Cas9可以在含sgRNA的断裂末端处持续存在。箭头表示PEM-seq的诱饵引物。C.通过FACS用BrdU和7-AAD双重染色对K562循环细胞和G1停滞的细胞进行细胞周期分析。黑色门表示G1时期。D和E.PEM-seq检测K562正常细胞周期的细胞和G1时期细胞中靶向HBA1,C-MYC1和C-MYC2位点的Cas9的缺失率(D)和编辑效率(E)。F.PEM-seq检测在K562正常细胞周期的细胞和G1细胞中靶向C-MYC1和C-MYC2的Cas9的脱靶位点的染色体易位百分比。倍数变化位于条形的顶部。
图11:A.PEM-seq检测到的HEK293T细胞中HBA1位点的Cas9,Cas9-T2A-TREX2,Cas9X2和Cas9X2d脱靶偏倚。在底部显示已鉴定的脱靶的接合数和计算出的偏差并显示编辑事件的总数。红色数字突出显示了接合很少的位点。B.Circos图显示了在HEK293T细胞中,PEM-seq测定,从C-MYC2克隆的全基因组染色体易位的分布图,例如图3的E图中所述。C-E.在HEK293T细胞中PEM-seq测定,从C-MYC2克隆的Cas9,Cas9-T2A-TREX2,Cas9X2和Cas9X2d的编辑效率(C),脱靶染色体易位百分比(D)和脱靶偏倚(E)。F和G.与PET-seq检测到的HEK293T细胞中的Cas9相比,Cas9-T2A-TREX2,Cas9X2和Cas9X2d的脱靶染色体易位(F)和一般染色体易位(G)的倍数变化。n=10,使用的基因座是DNMT1-1,DNMT1-2,EMX1,HBA1,C-MYC1,C-MYC2,C-MYC3,RAG1A,RAG1B和RAG1C。注意,Cas9X2的几个基因座中未检测到脱靶接合。
图12:A.SDS PAGE显示纯化的TREX2,TREX2-3R,Cas9X2和Cas9TX。B.通过体外切割测定法测定,TREX2和TREX2-3R消化38聚体寡核苷酸。C和D.通过PEM-seq检测到的HEK293T细胞中HBA1(C)或C-MYC2(D)的脱靶位点处的Cas9,Cas9X2和Cas9TX的脱靶偏倚。浅色数字突出显示了接合很少的位点。
图13:A.PEM-seq检测RAG1C基因座处BE4max,ABEmax,Cas9和Cas9TX的编辑结果。编辑产物的百分比显示在右侧。B.PEM-seq检测BE4max,ABEmax,Cas9,Cas9TX的一般染色体易位,编辑事件和总测序事件的接合数,以及RAG1C基因座处的未切割对照。C.PEM-seq检测到的HEK293T细胞中EMX1,C-MYC2,DNMT1-2,RAG1C和BCL11A处Cas9,Cas9TX,BE4max和ABEmax的一般染色体易位百分比。D.PEM-seq检测到的HEK293T细胞中EMX1和MYC2处Cas9,Cas9TX和BE4max脱靶染色体易位的百分比。E.相对于HEK293T细胞中EMX1,C-MYC2,DNMT1-2,RAG1C和BCL11A的编辑效率标准化的Cas9,Cas9TX,BE4max和ABEmax的一般染色体易位百分比。
图14:A-F.PEM-seq检测,转染后3天,7天和14天的CAR T细胞中Cas9和Cas9TX的PDCD1-TRAC(A),PDCD1-TRBC(B),TRBC-TRAC(C),TRBC-PDCD1(D),TRBC一般染色体易位(E),PDCD1一般染色体易位(F)的染色体易位比率。3次重复的平均值±SD,平均值显示在每个点的顶部。两尾t检验,*p<0.05,**p<0.01。(G)。混合后24小时通过FACS检测,以指定比例与CAR-T细胞共培养的CD19+和CD19-K562对照细胞的百分比。CD19+K562细胞带有BFP,CD19-K562细胞带有GFP。
图15:Cas9TX减少染色体易位的模型。A.每一轮Cas9切割后产生完全的重新连接,插入缺失和染色体易位。完全的修复产物可以被Cas9反复切割,插入/缺失和染色体易位的水平在每一轮切割中累积。B.Cas9TX通过增强主要对重复切割具有抗性的插入/缺失来抑制染色体易位,从而减少/抑制完全的重新连接。
具体实施方式
发明人基于PEM-seq(Primer-extension-mediated sequencing,PEM-seq)方法追踪了各种DNA异常染色质修复结构的来源,并最终开发了融合蛋白来消除基因编辑过程中的染色体易位和大片段缺失等异常染色质结构。发明人首先在人类的293T细胞系中测试了本发明的融合蛋白,发现染色体易位和大片段缺失的水平均降低了几倍到数十倍不等。具体而言,为了监测CRISPR-Cas9编辑的T细胞中的染色体易位,发明人采用引物延伸介导的染色体易位测序测定以在编辑后的第3、7和14天灵敏地检测TRAC,TRBC和PDCD1基因处被靶向的T细胞中的染色体易位。发明人在转染后第3天观察到大量染色体易位,而在第14天这些染色体易位仍保有许多。发明人进一步发现,在CRISPR-Cas9编辑的T细胞中高水平的染色体易位是由于在靶位点的反复切割所致。因此,开发了一种新的融合蛋白,可防止重复切割,从而在工程化T细胞中进行多重基因组编辑期间大大抑制染色体易位。而且,与野生型Cas9相比,本发明的融合蛋白在许多被靶向的位置处的编辑能力也得到了增强。值得注意的是,除了在多基因编辑时发挥作用,本发明的融合蛋白在进行单基因编辑时可以提高编辑效率并且在单个靶位点进行基因编辑时消除高水平的染色体易位。
下文提供了本文中使用的定义以便于理解本申请。
如本文中所用,PEM-seq(Primer-extension-mediated sequencing,PEM-seq)方法是一种同时测定CRISPR/Cas9的编辑效率和特异性的高通量测序方法,其结合了线性扩增介导的高通量全基因组易位测序(LAM-HTGTS)与靶向测序技术,可以通过易位捕捉选择性检测CRISPR/Cas9脱靶位点并且通过量化Cas9诱导的不完全DSB修复产物评估编辑效率(Yin,J.,Liu,M.,Liu,Y.,Wu,J.,Gan,T.,Zhang,W.,Li,Y.,Zhou,Y.,and Hu,J.(2019).Optimizing genome editing strategy by primer-extension-mediatedsequencing.Cell Discov 5,18.)。在评估CRISPR/Cas9编辑效率方面,PEM-seq比目前使用的检测方法还有两个优势:(1)PEM-seq中的引物延伸和随机分子条形码(randommolecularbarcode,RMB)消除了其他方法(如T7EI、RFLP、TIDE和靶向测序)中使用的PCR扩增过程中的扩增偏差,和(2)PEM-seq检测小插入/缺失、大缺失、染色体易位(都是CRISPR/Cas9编辑事件),而其它方法只检测小插入/缺失。PEM-seq方法包括引物延伸、桥式衔接头连接、PCR扩增和Illumina测序的捕捉。具体地,将生物素引物置于切割位点的特定距离,例如200-bp内,将生物素引物和超声处理的基因组DNA进行重复的退火和变性。将产物纯化并且加热,并且在冰上快速冷却以进行DNA变性,用链霉亲合素珠纯化生物素化的产物。将DNA-珠清洗后,用T4 DNA连接酶进行桥式衔接头连接。之后,用I5和I7测序引物对珠-DNA复合物进行巢式PCR。通过大小选择珠回收PCR产物,接着用Illumina P5和P7引物通过PCR添加标签。所有PEM-seq文库进行测序(例如2 ×150 bp Hiseq)。
如本文中所用,基因编辑(gene editing)是对生物体的基因组及其转录产物进行定点修饰或者修改以改变目的基因或调控元件的序列、表达量或功能。早期基因编辑技术包括归巢内切酶、锌指核酸内切酶和类转录激活因子效应物。近年来,以CRISPR/Cas9系统为代表的新型技术使基因编辑的研究和应用领域得以迅速拓展。“单基因编辑”是指对生物体的单个基因进行基因编辑。“多基因编辑”是指同时对生物体的多个基因进行基因编辑。
如本文中所用,“CRISPR-Cas”系统是由成簇规律间隔短回文重复序列(CRISPR)和CRISPR结合蛋白(即Cas蛋白)组成的核酸酶系统,能够对真核细胞中几乎所有与原型间隔子邻近基序(protospacer-adjacent motif,PAM)相邻的基因组序列进行切割。一般而言,CRISPR系统的特征为促进在靶序列(在内源CRISPR系统中又称为原型间隔子)的位点处的CRISPR复合物形成的元件。“CRISPR”是指成簇规律间隔短回文重复序列(clusteredregularly interspaced short palindromic repeats),该序列是许多原核生物的免疫系统。CRISPR中包含RNA组分,有时被称为引导RNA(gRNA)。引导RNA一般包含引导序列和骨架序列,这两个序列可以在同一个分子中或不同的分子中。引导RNA的作用为引导Cas蛋白切割与引导序列互补的DNA位点,也即靶序列。一般而言,引导序列是与靶序列具有足够互补性以便与该靶序列杂交、并且引导CRISPR复合物与该靶序列特异性结合的任何多核苷酸序列。引导序列与其相应的靶序列之间的互补程度是约或多于约50%或更多。一般而言,引导序列的长度为约或多于约12个核苷酸。骨架序列为引导RNA中必须的,除引导序列之外的其余序列,一般包含tracr序列和tracr配对序列,这些序列一般不会因为靶序列的变化而改变。引导RNA包括单链引导RNA(sgRNA)以及由crRNA和tracrRNA组成的双链引导RNA。在本文中,引导RNA可以是单链引导RNA(sgRNA)。
在CRISPR复合物形成的背景下,“靶序列”是指设计具有互补性的引导序列所针对的目标序列,其中在靶序列与引导序列之间的杂交促进CRISPR复合物的形成。完全互补性不是必需的,条件是存在足够互补性以引起杂交并且促进CRISPR复合物的形成。CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是驻留在真核细胞的细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调节多核苷酸或无用DNA)。不希望被理论所束缚,该靶序列应当与PAM(原型间隔子邻近基序)相关;也就是说,由CRISPR复合物识别的短序列相关。在本文中,靶序列可以是选自下组的基因:Oct4、MYH7、TRAC、PDCD1、TRBC、UROS、Fzd3、TLX1(HOX11)、TLX3(HOX11L2)、HOXA簇、HAL1、HAL2、LYL1、BHLHB1、LMO1、LMO2、LCK、NOTCH1、CCND2、SIL/TAL1、CALM/AF10、MLL/ENL、MLL/AF6、MLL/AF10、MLL/AFX1、MLL/AF4、NUP214/ABL1、EML1/ABL1、ETV6(TEL)/ABL1、ETV6(TEL)/JAK2、BCR/ABL1、NUP98/RAP1GDS1、B2M、CCR5或VEGFA。
如本文中所用,术语“Cas蛋白”是指CRISPR相关蛋白。Cas蛋白的非限制性实例包括:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8,Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、以及新近发现的Cas12e、其同系物、或其修饰形式。
如本文中所用,“Cas9蛋白”,也称为Csn1,是既参与crRNA生物合成又参与摧毁入侵DNA的蛋白质。已经在不同的细菌物种如嗜热链球菌(S.thermophiles)、无害利斯特氏菌(Listeria innocua)和化脓性链球菌(S.Pyogenes)中描述了Cas9。Cas9蛋白含有两个预测的核酸酶结构域,即位于蛋白质中部的HNH(McrA样)核酸酶结构域和分裂的RuvC样核酸酶结构域(RNAase H折叠)。Cas9变体可以是不天然存在于自然界中并且是由蛋白质工程或通过随机诱变获得的Cas9核酸内切酶。例如,可以通过突变,即化脓性链球菌Cas9核酸内切酶的氨基酸序列中至少一个残基的缺失或插入或取代获得Cas9变体。在一些实施方案中,Cas9蛋白是肺炎链球菌、化脓链球菌或嗜热链球菌Cas9,并且可包括源自于这些生物体的突变的Cas9。这些Cas9是已知的。例如,化脓链球菌(Streptococcus pyogenes)Cas9蛋白的氨基酸序列可见于SwissProt数据库登录号Q99ZW2下,脑膜炎奈瑟氏菌(Neisseriameningitides)Cas9蛋白的氨基酸序列可见于UniProt数据库编号A1IQ68,嗜热链球菌(Streptococcus thermophilus)Cas9蛋白的氨基酸序列可见于UniProt数据库编号Q03LF7,金黄色葡萄球菌(Staphylococcus aureus)Cas9蛋白的氨基酸序列可见于UniProt数据库编号J7RUA5。在本文中,Cas9蛋白可以包含SEQ ID NO:2的氨基酸序列或者可以包含SEQ ID NO.2的氨基酸序列进行了添加、缺失、取代或插入的序列,只要得到的序列具有Cas9蛋白的天然功能。
如本文中所用,“Cas12a蛋白”,又称为Cpf1,是一种缺乏小反式编码RNA的单链RNA引导的内切核酸酶。Cas12a蛋白使用富含T的原型间隔子邻近基序,该基序包含2-6个碱基对的DNA序列以及后面的由CRISPR细菌适应性免疫系统中的Cas9核酸酶靶向的DNA序列。Cas12a蛋白识别富含T的PAM,TTTN,但是该序列是在引导物的5'侧。Cas12a蛋白通过staggered DNA双链断裂切割DNA。Cas12a蛋白最近已经被用作可选的基因组编辑工作,作为一种在基因编辑中有用的分子剪刀。相比于Cas9系统,Cas12a的编辑效率与Cas9的效率相当,在有些靶点低于Cas9。Cas12a的脱靶率极低,相比于Cas9脱靶率高的特性,Cas12a是一种安全的基因编辑工具。Cas12a在切割之后形成粘性末端,而Cas9形成平末端,已有研究表明,Cas12a切割之后的粘性末端相比于Cas9的平末端而言,更容易发生同源重组修复,这也为基因的定点插入和修复提供了更好的工具。在引导RNA的加工方面,Cas12a具有明显的优势,仅仅只需要Cas12a本身就能够完成对前提RNA的加工,而Cas9系统则需要RNaseIII的加工,这极大地促进Cas12a在多基因编辑上的应用。在PAM的识别上,Cas12a识别5’-TTTN-3’或5’-KYTV-3’,Cas9则识别5’-NGG-3’。在本文中,Cas蛋白可以是Cas12a蛋白,例如AsCas12a蛋白。Cas12a蛋白可以包含SEQ ID NO.91的氨基酸序列或由包含SEQ ID NO.92的核酸编码。
如本文中所用,“Cas12e蛋白”是通过对地下水细菌的宏基因组分析鉴定,并表征为RNA引导的DNA核酸酶的Cas蛋白(Liu,J.J.et al.Nature 566,218–223(2019)。它识别5’-TTCN PAM,并在呈递sgRNA(共价连接的crRNA-tracrRNA)时能够在大肠杆菌中进行质粒干扰。除了位于C末端的RuvC域外,它与其他报道的Cas核酸内切酶没有相似之处。Cas12e的上述特征与Cas12的特征相关;然而,Cas12e(约980aa)的大小小于报道的Cas12的大小(约1200aa)。在Liu等人的论文中发现结合sgRNA的Deltaproteobacteria Cas12e(DpbCas12e)包含20-nt引导片段并识别TTCN PAM元件,导致具有10-nt交错末端的dsDNA靶标切割。据报道,当通过与crRNA引导互补ssDNA结合触发时,Cas12表现出不依赖PAM的非特异性ssDNA反式切割活性。Liu等人(Burstein,D.et al.Nature 542,237–241(2017)和Swarts,D.C.&Jinek,M.Mol.Cell 73,589–600.e4(2019))发现Cas12e的反式ssDNA切割活性显著低于Cas12a和Cas12b的活性。他们进一步研究了Cas12e在大肠杆菌和人类细胞中进行基因编辑的潜力。他们发现DpbCas12e能够切割大肠杆菌细胞中的靶基因,而其失活的对应物能够结合靶基因并减少基因表达。此外,他们还表明相关的浮霉菌(Planctomycetes)Cas12e(PlmCas12e)在人类HEK293T细胞中具有基因编辑能力。所有这些数据都为Cas12e作为一种新的基因编辑和CRISPRi工具的发展提供了新的见解。在本文中,Cas蛋白可以是Cas12e蛋白,例如PlmCas12e蛋白。Cas12e蛋白可以包含SEQ ID NO.89所示的氨基酸序列或者可以以包含SEQ ID NO.90的核酸编码。
如本文中所用,“TREX2蛋白”指具有3’至5’外切核酸酶活性并且消除错配的、修饰的、片段化的和正常的核苷酸以产生适合于DNA代谢途径的后续步骤的3’末端的蛋白质。TREX2在DNA复制、修复和重组中发挥作用。在本文中,Trex2蛋白可以包含SEQ ID NO.1的氨基酸序列或者可以包含SEQ ID NO.1的氨基酸序列进行了添加、缺失、取代或插入的序列,只要得到的序列具有本文所述的Trex2蛋白的功能,例如该Trex2蛋白保留消除DNA结合活性的163A,165A和167A的氨基酸残基,或者保留其酶促活性的氨基酸残基。在本文中,可以通过将Cas蛋白,例如Cas9与TREX2的突变体(含有R163A、R165A和R167A中的一个或多个)直接偶联或用接头偶联生成融合蛋白。Trex2蛋白可以是野生型Trex2蛋白(SEQ ID NO.8)或其中引入R163A、R165A和R167A中的一个或多个的变体。
如本文中所用,“变体”是指通过在亲本分子的氨基酸序列中突变或取代至少一个残基获得的分子,该分子保留亲本分子的功能特征。
如本文中所用,“TALE核酸酶”或“TALEN”意指由通常源自转录活化因子样效应物(TALE)的核酸结合结构域和一个核酸酶催化域组成切割核酸靶序列的融合蛋白。催化域优选是核酸酶结构域,更优选具有核酸内切酶活性的结构域,例如I-TevI、ColE7、NucA和Fok-1。在特定实施方案中,TALE结构域可以与大范围核酸酶融合,例如I-CreI和I-OnuI或其功能变体。在更优选的实施方案中,核酸酶是单体TALE核酸酶。单体TALE核酸酶是不需要二聚化以进行特异性识别和切割的TALE核酸酶,例如WO2012138927中所述的工程化的TAL重复序列与I-TevI的催化结构域的融合体。转录活化子如效应物(TALE)来自细菌物种中黄单胞菌属的蛋白质,包含多个重复序列,每个重复序列在位置12和13上包含特异于核酸靶向序列中每个核苷酸碱基的两个残基(RVD)。具有相似的模块化碱基对碱基核酸结合特性(MBBBD)的结合结构域也可以源自最近在不同细菌物种中发现的新模块化蛋白质。新的模块化蛋白具有比TAL重复序列显示更多序列变异性的优势。优选地,与识别不同核苷酸相关的RVD为:识别C的HD,识别T的NG,识别A的NI,识别G或A的NN,识别A、C、G或T的NS,识别T的HG,识别T的IG,识别G的NK,识别C的HA,识别C的ND,识别C的HI,识别G的HN,识别G的NA,识别G或A的SN,识别T的YG,识别A的TL,识别A或G的VT和识别A的SW。TALE核酸酶已经被描述并用于刺激基因靶向和基因修饰(Boch,Scholze等.2009;Moscou和Bogdanove 2009;Christian,Cermak等.2010;Li,Huang等.2011)。定制的TAL核酸酶可以商品名TALENTM商购获得(Cellectis,8rue de la Croix Jarry,75013Paris,France)。在本文中,第一蛋白可以是任何合适的TALEN。
如本文中所用,“锌指核酸酶”或“ZFN”由一个DNA识别域和一个非特异性核酸内切酶构成。DNA识别域是由一系列Cys2-His2锌指蛋白串联组成,一般3~4个。每个锌指蛋白识别并结合一个特异的三联体碱基。锌指蛋白源自转录调控因子家族,在真核生物中从酵母到人类广泛存在,形成alpha-beta-beta二级结构。其中alpha螺旋的16氨基酸残基决定锌指的DNA结合特异性,骨架结构保守。对决定DNA结合特异性的氨基酸引入序列的改变可以获得新的DNA结合特异性。现已公布的从自然界筛选的和人工突变的具有高特异性的锌指蛋白可以识别所有的GNN和ANN以及部分CNN和TNN三联体。多个锌指蛋白可以串联起来形成一个锌指蛋白组识别一段特异的碱基序列,具有很强的特异性和可塑性,适合用于设计ZFN。与锌指蛋白组相连的非特异性核酸内切酶来自FokI的C端的96个氨基酸残基组成的DNA剪切域(Kim et al.,1996)。FokI是来自海床黄杆菌的一种限制性内切酶,只在二聚体状态时才有酶切活性(Kim et al.,1994)。每个FokI单体与一个锌指蛋白组相连构成一个ZFN,识别特定的位点,当两个识别位点相距恰当的距离(6~8bp)时,两个单体ZFN相互作用产生酶切功能,从而达到DNA定点剪切的目的。在本文中,第一蛋白质可以是任何合适的ZFN。
如本文中所用,“接头”指连接两个蛋白部分的一个或多个氨基酸残基。接头可以是柔性接头。在本文中,接头是(G)n、(GGGGS)n、(EAAAK)n、(XP)n或XTEN接头,其中n是大于等于1的整数,X是任何氨基酸,优选丙氨酸、赖氨酸或谷氨酸。优选地,接头是(G)4S接头。本领域技术人员可以选择不同的接头来连接两个蛋白部分,例如Trex2蛋白与Cas9蛋白。n可以是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100,或其间的任何整数。
如本文中所用,“融合蛋白”指两个以上的蛋白部分连接在一起形成的蛋白质,其中蛋白部分各自能够发挥它们的功能。蛋白部分之间可以是直接连接的或者可以通过接头连接,只要蛋白部分各自能够发挥它们的功能。本发明的融合蛋白包含第一蛋白和第二蛋白。第一蛋白是Cas蛋白,TALEN或ZFN,第二蛋白是核酸外切酶或者核酸内切酶。例如,本发明提供了融合蛋白Cas9TX,其是目前基因编辑领域第一个主要用于降低基因编辑过程中的异常染色质修复结构的基因编辑酶。基因编辑酶Cas9TX是通过将Cas9与TREX2的突变体(R163A、R165A和R167A)用(G)4S接头偶联生成。Cas9TX保证基因编辑过程中的基因组稳定性,降低染色体异常结构的产生并且提高CAR-T构建过程中T细胞的基因组稳定性,防止改造的CAR-T细胞发生瘤变。本发明的融合蛋白使用细胞内源的Trex2蛋白的突变体,在使用上具有安全性,其是目前基因编辑领域第一个主要用于降低基因编辑过程中的异常染色质修复结构的基因编辑酶。在本文中,融合蛋白包含SEQ ID NO.3的氨基酸序列或者可以包含SEQ ID NO.3的氨基酸序列进行了添加、缺失、取代或插入的序列。
如本文中所用,“染色体结构变异”通常是指染色体物质的区段以在野生型或者正常细胞中不存在方式异常连接。染色体结构变异的实例包括染色体缺失、扩增、反转、染色体易位等。在本文中,染色体结构变异可以指染色体缺失和/或染色体易位。
如本文中所用,“染色体易位”通常是指在相同或不同的两个染色体之间染色体物质的等量或非等量交换。
如本文中所用,“染色体缺失”或“染色体片段缺失”是指染色体上100bp-4Mb的染色体片段缺失。染色体的大片段缺失可以是200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1kb、5kb、10kb、20kb、30kb、40kb、50kb、100kb、200kb、300kb、500kb、600kb、700kb、800kb、1Mb、2Mb或3Mb的染色体的大片段缺失。
如本文所用,过继细胞转移是将细胞转移到患者体内。这些细胞可能来自患者本人,随后在转移回之前(自体转移)发生了改变,或者它们可能来自另一个体。细胞最常见地是来源于免疫系统,目的是将改善的免疫功能和特性与细胞一起转移回至患者。转移自体细胞或来自患者的细胞可最大程度地减少移植物抗宿主疾病(GVHD)或者组织或器官排斥。
如本文所用,“嵌合抗原受体(chimeric antigen receptor)”或“CAR”是指可用于将一种或多种抗原结合部分移植到免疫效应细胞(诸如T细胞)的基因工程受体。一些CAR也称为“人工T细胞受体”、“嵌合T细胞受体”或“嵌合免疫受体”。CAR可以包含对一种或多种抗原(诸如肿瘤抗原)具有特异性的胞外抗原结合域、跨膜域和T细胞和/或其他受体的胞内信号传导域。嵌合抗原受体修饰的免疫细胞使用遗传工程手段修饰免疫细胞使其表达外源性CAR基因。CAR基因主要包括细胞外识别域和细胞内信号转导结构域:前者用于识别靶细胞表面特异性分子(例如肿瘤表面特异性分子),后者用于启动识别肿瘤表面分子后的免疫细胞应答,发挥细胞毒作用。嵌合抗原受体主要以T-细胞为载体,“CAR-T”即指表达CAR的T细胞。
如本文所用,“T细胞受体”或“TCR”指在T细胞表面上存在的分子,其负责识别在抗原呈递细胞(APC)表面上展示的抗原。每个T细胞都表达独特的TCR,其是通过随机分类基因而产生的,从而确保T细胞可以对几乎任何感染做出反应。TCR还能够从细胞内部识别肿瘤特异性蛋白(抗原)。当肿瘤特异性蛋白(即LMP2)分解成片段时,其会与主要组织相容性复合物(MHC)一起出现在细胞表面。MHC I类分子呈递来源于细胞内部蛋白的肽抗原。可以对TCR进行工程化改造以识别肿瘤特异性蛋白片段/MHC组合。TCR的结构式由包含α链和β链的两种不同蛋白链构成的。异二聚体TCR蛋白通常由高度可变的α链和β链组成,表达为与不变的CD3链分子的复合物的一部分。TCR的α链和β链两者的可变结构域分别具有三个高可变或互补性决定区(CDR)。
如本文所用,术语“TCR T细胞”指已通过分子生物学方法对其进行选择、分离和/或鉴定,以表达响应于目标抗原激活的T细胞受体的T细胞或T细胞群体。T细胞群体可以包含外周血单个核细胞(PBMC)。PBMC可以包含淋巴细胞(T细胞、B细胞、NK细胞)、单核细胞和粒细胞(中性粒细胞、嗜碱性粒细胞和嗜酸性粒细胞)。在人类中,淋巴细胞占PBMC群的大部分,其次是单核细胞,而树突状细胞的百分比很小。可以在包含TCR的任何细胞上修饰TCR,所述细胞包括例如辅助T细胞、细胞毒性T细胞、记忆T细胞、调节性T细胞、自然杀伤T细胞和γδT细胞。
蛋白质变体
在本发明的融合蛋白中,可以对具体的蛋白质进行适当的修改以得到蛋白质变体。例如,可以对本发明的每个蛋白质的氨基酸序列,例如SEQ ID NO:1、2或3所示的氨基酸序列取代、添加、缺失或插入1个或多个,优选2、3、4或5个氨基酸残基的氨基酸序列。
氨基酸添加指在氨基酸序列,例如SEQ ID NO:1或2的C端或N端添加氨基酸。
氨基酸取代指在氨基酸序列,例如SEQ ID NO:1或2的序列的某个位置的某个氨基酸残基被其他氨基酸残基替代。
氨基酸插入指在氨基酸序列例如SEQ ID NO:1或2的序列的适当位置插入氨基酸残基,插入的氨基酸残基也可以全部或部分彼此相邻,或插入的氨基酸之间都不彼此相邻。
氨基酸缺失指可以从氨基酸序列,例如SEQ ID NO:1或2的序列中缺失1、2或3个以上氨基酸。
在本发明中,取代可以是保守氨基酸取代,指与SEQ ID NO:1或2的氨基酸序列相比,有3个,更佳地2个氨基酸或1个氨基酸被性质相似或相近的氨基酸所替换而形成肽。这些保守性变异肽可以根据表1进行氨基酸替换而产生。
在本发明的上下文中,保守取代可以根据以下三个表中的一个或多个中反映的氨基酸类别内的取代来定义:
表1:保守取代的氨基酸残基类别
Figure BDA0003199786810000221
Figure BDA0003199786810000231
表2:备选保守氨基酸残基取代类别
1 A S T
2 D E
3 N Q
4 R K
5 I L M
6 F Y W
表3:氨基酸残基的备选物理和功能分类
Figure BDA0003199786810000232
本发明的蛋白质变体可以通过序列同一性进行表征。为了本发明的目的,使用Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453)测定两个氨基酸序列之间的序列同一性,如在EMBOSS包(EMBOSS:The European Molecular BiologyOpen Software Suite,Rice等,2000,Trends Genet.16:276-277),优选第5.0.0版以上的Needle程序中实施。使用的参数是缺口开放罚分10,缺口延伸罚分0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)替代矩阵。标记为“最长同一性”的Needle的输出(使用-nobrief选项获得)用作百分比同一性,并如下计算:
(相同残基x 100)/(比对长度-比对中的缺口总数)。
在本文中提及第一蛋白和第二蛋白时,特定的蛋白涵盖野生型蛋白质或与其具有氨基酸序列同一性的蛋白质变体。氨基酸序列同一性可以至少85%、90%、95%、96%、97%、98%或99%氨基酸序列。例如提及TREX2蛋白涵盖SEQ ID NO.8的野生型蛋白氨基酸序列或其中引入R163A、R165A和R167A中一个或多个的氨基酸序列,或者与它们具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
递送方法
可以考虑本领域中任何已知的方法对细胞内递送本发明的蛋白质或组合物。非限制性的实例包括病毒转导,电穿孔转染,脂质体递送,聚合物载体,化学载体,脂质复合物,聚合复合物,树枝状聚合物,纳米粒子,乳剂,天然内吞或吞噬途径,细胞穿透肽,显微注射法,微针递送法,粒子轰击法等。
优选的实施方案为电穿孔转染法,可以使用的电传孔仪器的非限制性实例包括:Neon转染系统(Thermo Fisher Scientific),Gemini仪器和AgilePulse/CytoPulse仪器(BTX-Harvard apparatus),4D-Nucleofector系统、Amaxa Nucleofector II、Nucleofector 2b仪器(Lonza),CTX-1500A仪器(Celetrix),MaxCyte GT或VLX仪器(MaxCyte),Gene Pulser Xcell(Biorad)。在厂商的指导的基础上,可修改脉冲持续时间、强度,脉冲之间的间隔,脉冲次数,已达到高转染效率而低死亡率的最佳条件。在本发明的实施方案中,主要转染的细胞类型为人类原代的T细胞、淋巴细胞、外周血单个核细胞,理论上多数细胞类型都可以使用电穿孔转染方法将载体递送至细胞内。
细胞
本发明的CRISPR-Cas系统能用于制备表达嵌合抗原受体(CAR)或T细胞受体的细胞。根据本发明要进行修饰的细胞可以是任何合适的T细胞。例如,T细胞可以是炎性T淋巴细胞、细胞毒性T淋巴细胞、调节性T细胞或辅助性T淋巴细胞。具体而言,T细胞是细胞毒性T淋巴细胞。在某些实施方案中,T细胞选自CD4+T淋巴细胞和CD8+T淋巴细胞。它们能够从血液中提取或源自干细胞。干细胞可以是成年干细胞、胚胎干细胞,更具体而言是非人类干细胞、脐带血干细胞、祖细胞、骨髓干细胞、诱导多能干细胞、全能干细胞或造血干细胞。典型的人类细胞是CD34+细胞。在具体实施方案中,根据本发明要进行修饰的T细胞是人类T细胞。在扩增和遗传修饰本发明的细胞之前,可以通过各种非限制性方法从受试者,如患者获得细胞来源。T细胞可以获自许多非限制性来源,包括外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、感染位点的组织、腹水、胸腔积液、脾脏组织和肿瘤。在本发明的某些实施方案中,可以使用本领域技术人员可利用的和已知的任何数量的T细胞系。在另一个实施方案中,细胞可以源自健康供体或源自确诊患有疾病的患者。在另一实施方案中,细胞是存在不同表型特性的细胞的混合群体的一部分。
核酸和宿主
本发明还提供了TREX2蛋白、Cas9蛋白和融合蛋白的编码核酸。本领域技术人员可以使用核酸来表达这些蛋白质。例如,可以在重组细胞中表达本文提及的各种蛋白质。细胞的类型不受限制,例如细胞可以是真核细胞或者原核细胞。真核细胞可以是真菌细胞,例如酵母细胞,或者昆虫细胞或哺乳动物细胞,例如小鼠细胞。原核细胞可以是细菌细胞,例如大肠杆菌细胞。蛋白质的核酸可以随使用的宿主细胞进行密码子优化。该核酸可以克隆到合适的表达载体中,然后将表达载体导入宿主细胞以进行表达。表达载体的类型不受限制,并且是本领域技术人员公知的。
给出以上描述是为了使本领域技术人员能够制造和使用本发明,并且在特定应用及其要求的背景下提供的。对优选实施方案的各种修改对于本领域技术人员而言将是显而易见的,并且在不脱离本发明的精神和范围的情况下,本文中定义的一般原理可以应用于其他实施方案和应用。因此,本发明无意限制于所示的实施方案,而是与本文公开的原理和特征一致的最宽范围相一致。
实施例
本发明通过下述实施例进一步阐明,但任何实施例或其组合不应当理解为对本发明的范围或实施方案的限制。本发明的范围由所附权利要求书限定,结合本说明书和本领域一般常识,本领域普通技术人员可以清楚地明白权利要求书所限定的范围。在不偏离本发明的精神和范围的前提下,本领域技术人员可以对本发明的技术方案进行任何修改或改变,这种修改和改变也包含在本发明的范围内。
材料和方法
T细胞和电穿孔
使用阴性选择试剂盒(STEMCELL Technologies,目录号19051)从人脐带血中获得人原代T细胞。在37℃和5%CO2下在RPMI 1640(Corning)中培养T细胞,RPMI 1640含有30单位/ml重组人白介素2(IL-2,Gibco,目录号PHC0021),谷氨酰胺(Corning),15%胎牛血清(FBS,Excell Bio),以及青霉素/链霉素(Corning)。在转染Cas9 RNP之前,以1:1比例的人类抗CD3/28珠激活T细胞3天(Thermo Fisher,目录号11161D)。对于电穿孔,将9μgCas9/Cas9TX和6μg sgRNA(对于TRAC,TRBC和PDCD1每个位点分别为2μg,在GeneScript中合成了2'-O-甲基和硫代磷酸酯修饰的sgRNA)在室温混合15分钟,然后使用Celetrix电穿孔仪将其转染到100万个T细胞中,电穿孔仪的参数为Vset=420V,Tset=20ms,Pnum=1N,Tint=1ms。在无磁珠刺激的情况下在培养物中回收T细胞1天,然后再加入抗CD3/28的磁珠进行进一步实验。使用PE/Cyanine7抗人TCRα/β(BioLegend,目录号306719)检查TCR敲除效率。
慢病毒包装和人T细胞感染
使用PEI(Sigma,P3143)将5μg pMD2.G(Addgene 12259),10μg psPAX2(Addgene12260)和20μg抗CD19 scFV 4-1BB质粒(由北京大学魏平博士赠予)共转染到10cm皿中培养的HEK293T细胞(购自ATCC)。用0.45μm过滤器过滤上清液,然后使用Beckman Optima L8-80XP在70,000g下于4℃浓缩2小时。用8μg/mL polybrene(Sigma,TR-1003)用慢病毒以500g感染活化的人类T细胞(刺激后1天)2小时。
纯化Cas9,Cas9高保真变体,TREX,TREX-3R,Cas9X2和Cas9TX
使用pET28a主链(Addgene 53135)表达Cas9,Cas9高保真变体Cas9X2和Cas9TX。使用pDB-His-MBP(Addgene 123365)表达TREX2和TREX2-3R突变体。
为了表达MBP-TREX2融合蛋白,将pDB-His-MBP-TREX2质粒转染到大肠杆菌BL21(DE3)Rosetta细胞中。该方法参考先前的方法(Mazur和Perrino,2001),只是MBP裂解使用TEV代替Genenase进行。
为了表达Cas9,Cas9变体,Cas9X2和Cas9TX,将pET28a质粒转化到大肠杆菌BL21(DE3)Rosetta细胞中,并通过IPTG(Amresco,0487)诱导表达。通过在含有1mM PMSF的裂解缓冲液(20mM HEPES,pH 7.5,10%甘油,0.1%Triton X-100)中超声处理来裂解细胞,并通过在20,000g下离心1小时去除细胞碎片。将上清液加载到HisTrap HP色谱柱(GEHealthcare)上,并在裂解缓冲液中用0至300mM的咪唑梯度洗脱。然后,将组分在Superdex200柱(GE Healthcare)中进行凝胶过滤。最后,使用BSA蛋白质标准品对纯化的蛋白质进行定量,并在使用前储存在-80℃的裂解缓冲液中。
用于TRAC-TRBC,TRAC-PDCD1,TRBC-PDCD1染色体易位的PCR
对于第一轮PCR,GTGTCACAAAGTAAGGATTCTG和CTAGTCTTGTCTGCTACCTGGATC用于TRAC-TRBC染色体易位的扩增,GTGTCACAAAGTAAGGATTCTG和GCACCCTCCCTTCAACCTGACCTGGGAC用于TRAC-PDCD1染色体易位的扩增,CTAGTCTTGTCTGCTACCTGGATC和GCACCCTCCCTTCAACCTGACCTGGGAC用于TRBC-PDCD1染色体易位的扩增。第一轮PCR条件为95℃x 5min,(95℃x 30s,58℃x 30s,72℃x30s)25个循环,72℃x 5min;回收PCR产物,并对于TRAC-TRBC染色体易位的扩增使用TTCTGATGTGTATATCACAG和CTAGTCTTGTCTGCTACCTGGATC进行第二轮PCR,对于TRAC-PDCD1染色体易位的扩增使用TTCTGATGTGTATATCACAG和GAGAAGGCGGCACTCTGGTG进行第二轮PCR,对于TRBC-PDCD1染色体易位的扩增使用CTAGTCTTGTCTGCTACCTGGATC和GCTCACCTCCGCCTGAGCAG进行第二轮PCR,第二轮PCR条件为95℃x 5min,(95℃x 30s,58℃x 30s,72℃x30s)25个循环,72℃x 5min。
PEM-seq分析
如前所述(Yin等人,2019)制备PEM-seq库。简而言之,PEM-seq库的制备过程,将生物素引物置于切割位点的200bp内,将生物素引物和超声处理的基因组DNA进行重复的退火和变性(95℃x 5min退火,(95℃x 2min,58℃x 3min)5个循环,25℃x 5min),然后进行引物延伸。将产物纯化并且加热,并且在冰上快速冷却以进行DNA变性,用链霉亲合素珠纯化生物素化的产物。将DNA-珠清洗后,用T4 DNA连接酶进行桥式衔接头连接(桥式接头-up:GCGACTATAGGGCACGCGTGGNNNNNN-NH2(3’氨基修饰);桥式接头-dn:5Phor/CCACGCGTGCTCTACANNNNTNNNANNNTNNNNAGATCGGAAGAGCACACGTCTGAACTCCAGT-NH2;桥式接头up&dn各取400uM进行95度退火5分钟然后自然冷却到室温)。之后,用I5和I7测序引物对珠-DNA复合物进行巢式PCR。通过大小选择珠回收PCR产物,接着用Illumina P5和P7引物通过PCR添加标签(95℃x 5min,(95℃x 30s,58℃x 30s,72℃x30s)15个循环,72℃x 5min)。对所有PEM-seq文库进行测序(例如2× 150bp Hiseq)。为了用PEM-seq途径更好地分析染色体易位,发明人开发了一个新的染色体易位过滤器模块(去除了相同序列但不同分子条码的测序片段)以过滤错误的染色体易位接合(junctions),包括具有相同随机分子条形码(RMB)的接合和具有高度相似的RMB(<2不匹配)的相同接合序列(Liu,M.,Zhang,W.,Xin,C.,Yin,J.,Shang,Y.,Ai,C.,Li,J.,Meng,F.,and Hu,J.(2021).Global detection of DNA repair outcomesinduced by CRISPR-Cas9.bioRxiv.)。简而言之,PEM-seq可以识别基因组编辑产物:完全的重新连接,插入缺失,染色体易位和其他染色体异常。插入缺失与总识别产物的比率定义为编辑效率。插入缺失定义为缺失(<100bp)和插入(<20bp)。对于碱基编辑器,编辑效率是通过对CRISPResso识别(默认参数)的所有产物进行计数来计算的(>0.2%)。主胞嘧啶或腺嘌呤的编辑频率用作BE4max或ABEmax的“所需”编辑效率,以相对于图13的E图中Cas9和Cas9TX进行的相同编辑效率标准化。
序列与目标位点高度相似(≤8nt错配,考虑sgRNA和PAM序列两者)并且在推测的Cas9切割位点处具有接合的染色体易位热点被认为是脱靶位点。通过排除靶位点附近±20kb和脱靶位点附近±100bp的接合计算出总体染色体易位。
为了计算人T细胞,HEK293T和K562细胞中的脱靶偏倚,对位于脱靶位点±100bp内的接合进行计数。注意,对于图10的A图中的脱靶偏倚的统计量,所有RAG1A脱靶的接合进行组合以计算偏倚,这是因为染色体易位接合数目少。表4-1中列出了用于PEM-seq的引物。
在计算染色体大片段缺失时,我们将PEM-seq结果中缺失大于100bp且小于20kb的测序reads定义为染色体大片段缺失。图8中显示了测定结果。
表4-1:用于PEM-seq文库建立的引物序列以下两个序列完全相同,需要确认。
Figure BDA0003199786810000291
Cas9对DNA片段的体外消化
通常,通过使用T7高效转录试剂盒(TransGen Biotech)在体外转录与支架RNA融合的sgRNA。每个反应中包括100nM浓度的Cas9和300nM RNA。在37℃下在以下条件下消化DNA片段2小时:20mM HEPES(pH 7.5),5%甘油,100mM KCl,1mM二硫苏糖醇,10mM MgCl2和0.5mM EDTA。
对于DNA底物,使用表4中的引物扩增Cas9:TRAC中靶位点及其脱靶位点。通过重叠PCR(第一轮PCR条件为95℃x 5min,(95℃x 30s,58℃x 30s,72℃x30s)25个循环,72℃x5min,从而分别扩增出易位片段的两端;第二轮PCR条件为95℃x 5min,(95℃x 30s,58℃x30s,72℃x30s)25个循环,72℃x 5min,利用易位产物两端作为模板扩增出易位产物)产生与TRAC脱靶的两个末端连接的TRAC中靶位点的构建(可再靶向和不可靶向的染色体易位产物)。
表4-2:体外验证反复切割的引物
Figure BDA0003199786810000301
将K562细胞阻滞于G1期
K562细胞(购自ATCC)用5μM palbociclib(PD-0332991)HCl(Selleck,S1116)处理36小时,然后进行Cas9质粒转染,并且在5μMpalbociclib中再培养,之后收获细胞。为了进行细胞周期分析,将细胞用50μM BrdU标记60分钟,并用多聚甲醛(PFA)在4℃下固定60分钟,然后将抗BrdU(100x,BD)温育40分钟。然后将细胞用7-AAD(250x,BD)染色20分钟,并通过FACS分析。
质粒构建
表5中列出了所有使用的sgRNA。将Cas9,Cas9X2,Cas9-T2A-TREX2,Cas9X2d,Cas9TX,BE4max(由北京大学的伊成器博士赠送),ABEmax(由北京大学的伊成器博士赠送)构建到具有用P2A-mCherry或CMV驱动的mCherry的pX330主链(Addgene 42230)中。sgRNA表达克隆到具有CMV驱动的GFP代替Cas9的不同pX330骨架中。通过重叠PCR获得TREX2-H188A和TREX2-3R突变体,并通过Sanger测序证实。
表5:用于各基因座的sgRNA
Figure BDA0003199786810000302
Figure BDA0003199786810000311
细胞系和转染
在37℃,5%CO2将HEK293T细胞(购自ATCC)培养于Dulbecco改良Eagle培养基(Corning),该培养基含有谷氨酰胺(Corning)、10%胎牛血清(FBS,Excell Bio)、和青霉素/链霉素(Corning)。在37℃,5%CO2将K562细胞培养于RPMI 1640(Corning),该培养基含有谷氨酰胺、15%FBS和青霉素/链霉素(Corning)。通过在6-cm皿中用PEI(Sigma)共转染3μg Cas9质粒和3μg sgRNA质粒制备HEK293T细胞的文库。通过在SF缓冲液(Lonza)中用FF120程序使用4D-核转染仪将Cas9质粒(1μg/100万细胞)和GFP质粒(1μg/100万细胞)共导入K562细胞。通过用mCherry和/或GFP进行FACS分选收集所有样品细胞。
核酸外切酶测定-时程反应反应分析
反应测定(10μL)包含20mM Tris-HCl(pH 7.5),5mM MgCl2、2mM DTT,100μg/mlBSA,7.5nM 38-mer寡核苷酸(Genewiz)和TREX2蛋白或Cas9X2。在室温下温育指定的时间。通过添加30μL乙醇终止反应,并真空干燥。将沉淀物重悬于6μL的1x上样缓冲液中,在95℃下变性5分钟,然后在15%变性聚丙烯酰胺凝胶中分离。
检测γH2AX的免疫荧光
将HEK293T细胞在6孔皿中的载玻片上培养。Cas9/Cas9TX转染或10μM依托泊苷(Sigma,S1225)处理24小时后,将载玻片上的细胞在室温下于4%PFA中固定10分钟,然后进行PBS洗涤。然后将细胞用0.5%TritonX-100透化15分钟。在一抗染色之前,将细胞用3%FBS封闭60分钟。然后将细胞与1:500稀释的抗γH2A.X(磷酸S139)(Abcam,ab2893)在室温温育1小时或者在4℃过夜,然后用0.2%Tween洗涤。然后将细胞用1:500稀释的Alexa 488染色荧光二抗在室温下染色60分钟。然后在室温下使用Hochest 33342(Sigma,B2261)以1mg/mL进行核染色15分钟。最后,将载玻片安装到显微镜载玻片上以进行显微镜分析。图像由尼康A1R高速激光共聚焦显微镜采集,并由ImageJ根据说明进行测量。
CAR-T杀伤测定
将具有CD19和BFP表达的K562细胞或具有FITC(但无CD19)的K562细胞(K562细胞购自ATCC,并且内部制备成表达相应蛋白的细胞)与Cas9/Cas9TX编辑的CAR-T细胞以1:1、5:1、10:1的E:T比共培养24小时。然后通过FACS检测杀伤效率,并通过FlowJo 10.4进行分析。
统计分析
如附图中的图例所示,本文使用了t检验和Wilcoxon检验。数据表示为平均值±SD,p<0.05时认为是显著的。
实施例1:在工程化T细胞中观察到大量染色体易位
为了灵敏地检测CRISPR-Cas9编辑的T细胞中的染色体易位,本实施例采用了引物延伸介导的测序方法(primer extension-mediated translocation sequencin)进行染色体易位捕获,并在本研究中命名为PEM-seq。通常,本实施例将诱饵引物放置在靶位点的断裂末端之一上以生成PEM-seq文库,该文库可以准确地定量靶位点的两个断裂末端之间的插入/缺失(indel)以及诱饵断裂末端和其他DSB末端之间的染色体易位(图9的A图;Yin etal.,2019;Liu et al.,2021)。插入缺失与总测序读段之比定义为编辑效率,而染色体易位百分比计算为染色体易位与插入缺失加上染色体易位之比。本实施例将T细胞从人脐带血血液中富集并通过抗CD3/CD28激活3天,然后对TRAC,TRBC和PDCD1基因进行CRISPR-Cas9处理,如临床规程NCT03399448(Stadtmauer et al.,2020)所用。纯化Cas9蛋白,并与三个sgRNA混合,以核糖核蛋白复合物(RNP)的形式递送;转染后3、7或14天监测T细胞的编辑效率和染色体易位(图1的A图和图9的B图)。CRISPR-Cas9在T细胞中诱导了实质性的编辑结果,转染后第3天,TRAC的编辑效率达到约51.9%,TRAC的编辑效率达到约44.6%,PDCD1的编辑效率达到47.8%(图1的B图和表6)。值得注意的是,TRBC的引导RNA(sgRNA)在同一个TRBC基因中彼此之间有间隔约9.4kb的两个真正的靶位点,本实施例将它们结合起来进行分析。随着培养时间增加到7或14天,本实施例观察到包含编辑产物的细胞百分比变得越来越低,这可能是由于某些编辑细胞的生长迟缓所致(图1的B图)。
为了全面捕获TRAC,TRBC和PDCD1之间的相互染色体易位,本实施例从所有三个靶位点生成了PEM-seq文库。转染后3天,三个靶向基因之间检测到的染色体易位水平在0.37至1.77%之间变化(图1的C和D图)。以TRAC和TRBC之间的染色体易位为例,以TRAC为诱饵时该水平为0.37%,以TRBC为诱饵时该水平为0.58%(图1的C和D图)。与进一步在靶位点周围使用引物进行巢式PCR进一步验证了这些染色体易位(图9的C图)。还发现了Cas9:TRAC的脱靶位点位于先前报道的染色体X的亚端粒区域(Stadtmauer et al.,2020)。TRAC脱靶和三个靶基因之间的染色体易位水平远低于中靶位点之间的染色体易位水平,其范围为0.001%至0.002%(图1的C图)。与之前的报道(Stadtmauer et al.,2020)相一致,在第7天或第14天的染色体易位分析显示染色体易位水平下降(图1的D图)。但是,染色体易位水平在14天时仍保持在0.1%以上(图1的D图),这表明当总共使用约1×108个工程化T细胞时,至少有1×105个含有染色体易位的工程化T细胞注入患者体内。
除了来自其他靶位点或脱靶位点的DSB外,与CRISPR-Cas9诱导的DSB同时发生的基因组内自发产生的DSB也可能与靶DSB一起形成一般染色体易位(Frock et al.,2015)。尽管在不同批次的CRISPR-Cas9处理中水平较低且可能不会复现,但这些一般染色体易位也可以通过PEM-seq捕获。一般染色体易位在整个基因组中广泛分布,在转染后3天时范围为具有不同诱饵的总编辑结果的0.51%至1.96%(图1的E图和图9的D图)。一般染色体易位也与靶位点间染色体易位一样显示出下降(图1的E图)。在总共75,000个鉴定的染色体易位中,CRISPR-Cas9靶向涉及不同癌症途径的数十个基因,并它们与TRAC,TRBC或PDCD1基因融合(图1的F图)。考虑到TRAC和TRBC含有两种强增强子E1和E3,这些一般染色体易位也可能对工程化的T细胞的基因组稳定性构成潜在的威胁。
实施例2:高保真Cas9变体无法抑制染色体易位
目前科学工作者们已经开发了几对高保真Cas9变体来改善CRISPR-Cas9的编辑特异性。因此,本实施例测试了高保真Cas9变体eSpCas9,FeCas9,HF1和Hypa(分别记载于Slaymaker et al.,Yin et al.,2020;Kleinstiver et al.,2016;2016;Chen et al.,2017)是否能抑制工程化T细胞中的染色体易位。本实施例纯化了这些Cas9变体,并将它们与TRAC,TRBC或PDCD1 sgRNA混合以通过RNP递送转染T细胞(图9的B图)。本实施例在TRAC基因处使用了诱饵引物来生成PEM-seq文库。对于这些变体,本实施例检测到与野生Cas9相近的切割效率(图9的F图)。针对TRAC的脱靶位点,本实施例仅在转染后3天在野生型Cas9文库中检测到(图9的G图),此结果表明这些Cas9变体的编辑特异性更高。本实施例在野生型Cas9和Cas9变体的PEM-seq文库中观察到了相近的染色体易位水平(图1的G图)。总的来说,这些数据表明高保真Cas9变体可以抑制Cas9的脱靶活性,但不能有效消除染色体易位。
实施例3:CRISPR-Cas9的重复切割提高DSB的频率
染色体染色体易位的频率通过所涉及的两个DSB的相互作用强度和频率决定(Altet al.,2013)。由于两个给定DSB之间的相互作用强度相对固定,因此本实施例将注意力转向在染色体易位形成中CRISPR-Cas9诱导的DSB频率。CRISPR-Cas9切割后的修复结果包含完全的修复,插入缺失和染色体易位,其中完全修复的产物类似于未切割的靶位点,可被CRISPR-Cas9反复切割以增加DSB频率(图2的A图)。由于未切割的靶位点和经过完全修复的产物彼此之间是无法区分的,因此本实施例检查了TRAC及其脱靶位点之间的染色体易位接合分布,以验证CRISPR-Cas9的重复切割。
TRAC脱靶位点在sgRNA主体内具有四个突变,可产生两种类型的染色体易位产物:不可靶向的产物,丢失原间隔子相邻基序(PAM);可再靶向的产物,其在NGG PAM的N处仅一种突变(图2的B图)。Cas9:TRAC在体外对这些片段的消化表明,CRISPR-Cas9可以将可再靶向的片段与TRAC靶向位点一样有效地裂解,而不可靶向的片段几乎不会被切割(图2的C图)。相应地,PEM-seq鉴定出的染色体易位接合显示出脱靶偏倚,即剩余的可再靶向产物仅是不可靶向产物的四分之一(图2的D图)。与此同时,本实施例也在HEK293T细胞中发现了TRAC位点在该脱靶位点处也展示了相似的脱靶偏倚性(图2的E图)。并且一个新的TRAC的脱靶位点其脱靶偏倚性为2(图2的E图)。与之相似的,在HEK293T细胞中,TRBC和PDCD1也展示了从2.3到3.0的脱靶偏倚性(图2的E图)。本实施例使用PEM-seq重新分析了HEK293T细胞中先前的数据(Yin等人,2019)。在HEK293T细胞中的DNMT1,C-MYC,RAG1基因中的两个位点(RAG1A和RAG1B)以及HCT116,U2OS和K562细胞中的RAG1A位点广泛观察到脱靶偏倚(图2的F图和图10的A以及表7)。在HEK293T细胞的RAG1A位点的总共490个接合处,脱靶偏倚的最高水平达到了约5.6倍(图2的F图以及表7)。这些数据证实了CRISPR-Cas9的重复切割,通常在不同细胞类型中发现。为了排除Cas9在切割后停留在断裂位点对所观测偏倚性的影响(Brinkman et al.,2018),本实施例在HEK293T细胞中在RAG1A位点从DSB的另外一端建立PEM-seq文库(图10的B,左)。正如引物反转导致了可再靶向端与不可靶向端的转变,观测到了偏倚性的反转(图10的B,右),说明了所观测到的反转并非由Cas9的停滞所引起的。总之,这些数据验证了各种细胞类型中CRISPR-Cas9的重复切割。
实施例4:重复的切割导致高水平的染色体易位
为了测试重复切割对染色体易位形成的影响,本实施例在G1阻滞细胞中进行了CRISPR-Cas9编辑和PEM-seq分析,在这些细胞中,断裂末端的加工受到限制,以促进形成完全修复的产物(Symington and Gautier,2011)。为此,在转染CRISPR-Cas9之前,本实施例用5μM CDK抑制剂Palbociclib将K562细胞阻滞于G1期36小时,该CRISPR-Cas9靶向HBA1或C-MYC基因内的两个位点(C-MYC1和C-MYC2)(图10的C图)。通过PEM-seq,相比于全细胞周期的K562细胞,本实施例观察到基因编辑产物中缺失产物的比例在G1时期中有所减少,这一点证实了在G1时期DSB断裂末端加工的减少(图10的D图)。在全细胞周期的的K562细胞中,三个HBA1脱靶的脱靶偏倚分别为1.6、0.8和1.0,而在G1阻滞细胞中显著增加到2.3、4.6和11.3(图2的G),这意味着CRISPR-Cas9在G1期具有强大的重复切割能力。关于染色体易位,G1阻滞细胞中HBA1和三个脱靶基因之间的染色体易位水平比循环细胞高6.0、64.0和23倍(图2G和图10的E图)。G1阻滞细胞中两个C-MYC基因座处获得相似的结果(图10的E和F图)。
实施例5:Cas9-TREX2抑制重复切割和染色体易位
与G1期中重复切割增强相反,本实施例将Cas9与核酸外切酶融合在一起以通过促进末端加工来抑制重复切割。为此,本实施例将Cas9在C末端与人3'-5'核酸外切酶TREX2(Cas9X2,从N端到C端为Cas9-(G)4S-TREX2)或带有H188A突变的无核酸酶活性(nuclease-dead TREX2)TREX2(Cas9X2d,从N端到C端为Cas9-(G)4S-nuclease-dead TREX2)融合在一起(图3的A图;Perrino et al.,2005)。还使用自切割的T2A接头(核苷酸序列:GAGGGCAGAGGAAGTCTGCTAACATGCGGTGACGTCGAGGAGAATCC TGGCCCA;氨基酸序列:EGRGSLLTCGDVEENPGP)代替了(G)4S接头平行测试了Cas9和TREX2的分离形式(T2A-TREX2,从N端到C端为Cas9-T2A-TREX2)。将包含这些CRISPR基因和sgRNA的质粒转染到HEK293T细胞中进行基因靶向,并在72小时后收获基因组DNA,以生成PEM-seq文库。
关于HEK293T细胞中HBA1位点处的CRISPR编辑,本实施例在T2A-TREX2和Cas9X2文库中检测到的缺失水平高于野生型Cas9的情况,表明共表达的和融合的TREX2增强末端加工(图3中的B图)。在HBA1位点处,Cas9X2和T2A-TREX2均显示出相对较高的编辑效率(76.8%、74.6%与56.9%),而Cas9X2d的编辑效率低于野生型Cas9(图3中的B图),这支持如下的观点,即TREX2处理Cas9诱导的断裂末端增强了基因组编辑(Cermak et al.,2017)。此外,与野生型Cas9相比,Cas9X2d和T2A-TREX2降低了三个HBA1脱靶位点处的脱靶偏倚,并且Cas9X2几乎消除了所有三个位点处的脱靶偏倚(图3中的C图和图11中的A图)。因此,所有这三种Cas9衍生酶降低脱靶位点和一般染色体易位水平,对于该脱靶位点和一般染色体易位水平,Cas9X2<<T2A-TREX2<Cas9X2d<野生型Cas9(图3中的D和E图)。更进一步对于Cas9X2,HBA1的第二个脱靶位点处的染色体易位水平甚至降低到低于0.004%(图3中的D)。与此同时,本实施例在确定的C-MYC2脱靶位点处获得了类似的发现(图11中的B-E图)。本实施例还测试了HEK293T细胞中的其他八个位点并获得了类似的发现,只是Cas9X2的编辑效率主要高于野生型Cas9(图3中的F-I和表8)。Cas9X2和T2A-TREX2都显示出消除染色体易位的强大能力,但Cas9X2的表现优于T2A-TREX2(图3中的H和I图)。对于所有靶位点,与野生型Cas9相比,Cas9X2的脱靶染色体易位(减少27至77倍)和一般染色体易位(减少2至13倍)减少(图11中的F和G图)。
实施例6:Cas9TX是用于基因组编辑的更优Cas9X2变体
由于参与DNA修复,TREX2在许多细胞类型中表达,并且TREX2异位表达对细胞存活或细胞周期没有影响(Certo et al.,2012;Mazur and Perrino,2001)。为了进一步提高Cas9X2的安全性,本实施例生成了具有R163A,R165A和R167A突变(TREX2-3R)的Cas9X2变体,以消除TREX2的DNA结合活性(Perrino et al.,2008)。然后,本实施例纯化了TREX2,TREX2-3R及其与Cas9融合的形式,以进行38-nt寡核苷酸的体外消化测定(图12中的A图)。与TREX2相比,TREX2-3R显示出对寡核苷酸的核酸外切酶活性的大幅降低(图12的B图)。在21分钟时0.5nM Cas9X2检测到短于37nt的消化产物,但是对于2.7nM Cas9-TREX2-3R(Cas9TX)在63分钟时也未检测到消化产物(图4的A图),这意味着Cas9TX具有潜在的更好的安全性。
接下来,本实施例将Cas9TX应用于HEK293T细胞中的基因组编辑,并进行了PEM-seq分析。尽管丢失了TREX2的DNA结合能力,但Cas9TX仍可以精确地定位到HBA1和C-MYC靶位点,并且在这两个位点处显示出比Cas9显示略高的编辑效率,Cas9X2也是如此(图4的B图)。Cas9X2和Cas9TX都有效消除了脱靶偏倚,减少了总染色体易位,但是Cas9TX表现优于Cas9X2(图4的C图,图12中的C和D图)。本实施例接着测试了HEK293T细胞中的其他12个位点。发现与Cas9相比,Cas9TX在这些位点中显示出显著更高的编辑效率并且诱导小得多的脱靶染色体易位(图4的D和E图和图11;3.2至54.8倍)。Cas9TX显著降低一般染色体易位(图4中的F图,表8;2.3至11.7倍)。总的来说,这些数据表明,Cas9TX可以像Cas9X2一样大大抑制染色体易位,并且与DNA的非特异性接触降低。
实施例7:Cas9TX诱导的染色体易位水平与碱基编辑器诱导相当
胞嘧啶碱基编辑器(CBE)和腺嘌呤碱基编辑器(ABE)系统目前也被开发来诱导靶位点上的点突变从而完成基因编辑(Gaudelli et al.,2017;Komor et al.,2016)。由于CBE或ABE不产生DSB,因此在碱基编辑系统中很少形成染色体易位。为了比较Cas9TX和碱基编辑器之间的染色体易位水平,本实施例应用CRISPR-Cas9、CRISPR-Cas9TX、胞嘧啶碱基编辑器BE4max和腺嘌呤碱基编辑器ABEmax(Koblan et al.,2018),在HEK293T细胞中靶向EMX1、DNMT1、C-MYC、RAG1、和BCL11A基因内的5个靶位点,然后使用PEM-seq进行染色体易位检测。BE4max可以有效靶向多个胞嘧啶,而ABEmax可以靶向编辑窗口内的多个腺嘌呤,如图5的A图中的RAG1C文库所示。值得注意的是,由于编辑窗口中缺少腺嘌呤,因此ABEmax不能靶向EMX1和C-MYC2位点。相比之下,Cas9诱导大量插入/缺失,在断裂位点附近具有最高的碱基损失。有趣的是,Cas9TX在含有17bp截短sgRNA的断裂末端处显示碱基损失的积累(图5的A图),这是由于切割后驻留的Cas9TX的末端加工造成的(Brinkman et al.,2018)。通过PEM-seq或CRISPResso评估的测试位点处,BE4max和ABEmax的编辑效率通常低于Cas9和Cas9TX的编辑效率(图5的B图和图13中的A图;Clement et al.,2019)。
Cas9在所有五个位点中诱导大量染色体易位,而Cas9TX显示出非常低的染色体易位水平(图5中的C和D图和图13中的B图),这与上述结果一致。相比之下,BE4max和ABEmax均在测试位点诱导极低水平的一般染色体易位,但高于背景水平(图5中的B和C图和图13中的B图)。尽管Cas9TX中的染色体易位水平在所有测试位点均低于0.45%,但仍略高于两个碱基编辑器(图5中的C图和图13中的C图)。此外,使用Cas9TX检测到低水平的脱靶染色体易位,但使用碱基编辑器几乎检测不到脱靶染色体易位(图13中的D图)。然而,考虑到碱基编辑器的切割效率较低并且编辑效率计算了多个可靶向碱基,当相对于相同的编辑效率标准化时,Cas9TX和BE4max之间的差距将进一步缩小(图13中的E图)。因此,当达到相同水平的基因破坏时,Cas9TX可以几乎与碱基编辑系统一样好地抑制一般染色体易位。
实施例8:Cas9TX显示出检测不到的非特异性损伤活性
为了进一步测试使用Cas9TX进行基因组编辑的安全性,本实施例通过质粒转染在HEK293T细胞中表达了不含sgRNA的Cas9-P2A-mCherry或Cas9TX-P2A-mCherry。P2A是一种自我切割的肽,可确保表达Cas9或Cas9TX的细胞被mCherry标记。转染后72小时,本实施例通过抗H2AX抗体在细胞中标记了DSB信号。如预期的那样,拓扑异构酶抑制剂依托泊苷诱导了以γH2AX标记的大量DSB(图6的A和B图;Canela等人,2017)。在表达Cas9和Cas9TX的细胞中,DSB的水平没有显著升高(图6的A和B图),表明在没有sgRNA的情况下,Cas9和Cas9TX均显示出检测不到的非特异性全基因组损伤活性。
接下来,本实施例测试了Cas9TX对其他DSB的影响,通过共表达的AsCas12a和Cas9TX与用于AsCas12a的crRNA进行,靶向在HEK293T细胞中C-MYC基因(C-MYC3)。本实施例在AsCas12a靶位点用诱饵引物进行了PEM-seq分析,发现与Cas9TX共表达比与Cas9共表达时,AsCas12a的编辑效率相对更高(18.8%对21.5%;图6的C图)。此外,与Cas9TX共表达比与Cas9共表达时,AsCas12a:C-MYC3的染色体易位更少(1.5%比2.7%;图6的C图),这表明Cas9TX还可以提高编辑效率并消除其他共表达编辑酶的染色体易位。在这种情况下,本实施例还在确定的Cas9:C-MYC2脱靶位点处使用了带诱饵引物的PEM-seq,以检查Cas9TX对脱靶位点处切割的影响。与Cas9相比,本实施例在Cas9TX的脱靶位点检测到了更高的编辑频率,但是,两者是接近的且与MYC2靶位点的编辑效率成正比(图6的D图)。而且,与Cas9相比,Cas9TX的MYC2脱靶显示少14.6倍的染色体易位(图6的E图)。本实施例还采用了trackingof indels by decomposition(TIDE)粗略地测量了VEGFA或EMX1位点靶向的HEK293T细胞在多个脱靶位点的编辑频率,其中大多数显示出Cas9TX的编辑频率增加,但也与中靶位点的编辑效率成正比(图6的F图)。这些数据表明,Cas9TX可以以相似的水平增强中靶位点和脱靶位点的切割,但可以有效阻止在任何断裂位点处形成染色体易位。
实施例9:Cas9TX消除了工程化CAR T细胞中的染色体易位
为了测试Cas9TX消除工程化T细胞中染色体易位的能力,本实施例首先将编码CD19-41BB-CAR的逆转录病毒(Kawalekar et al.,2016)转导到活化的T细胞中,然后通过RNP递送应用Cas9或Cas9TX编辑TRAC,TRBC或PDCD1基因(图7的A图)。对于Cas9和Ca9TX群体,CAR逆转录病毒的转导效率非常接近(图7的B图)。转染后3天,CRISPR-Cas9和CRISPR-Cas9TX均在总培养T细胞的40-55%处产生插入缺失,约一半的T细胞失去TCR(图7的C和D图,表6)。与CRISPR-Cas9编辑的细胞相比,在CRISPR-Cas9TX编辑的T细胞中,TRAC,TRBC或PDCD1靶位点之间的染色体易位大大降低(图7的E和F图)。TRAC-TRBC或TRAC-PDCD1的染色体易位百分比分别从0.28%和0.33%降低到0.03%和0.01%(图7的G和H图)。在转染后3天,Cas9TX编辑的T细胞中三个中靶位点间的其他染色体易位也显示10-30倍的大幅减少(图14的A-D图)。转染后7天或14天,染色体易位率进一步降低,染色体易位发生的频率为2,000至30,000之一(图7的F,G图和图14的A-D图)。此外,在Cas9TX编辑的T细胞中,TRAC脱靶与三个靶位中的任何一个之间均未观察到染色体易位接合(图7的F图)。对于一般染色体易位,与CRISPR-Cas9编辑的T细胞相比,Cas9TX编辑的T细胞中的比例在转染后3天下降3-5倍,并且一般染色体易位在转染后7天或14天进一步降低了(图7的I图,图14的E和F图)。
为了测试Cas9或Cas9TX编辑的CAR T细胞杀死CD19+K562细胞的能力,本实施例将CAR T细胞与CD19+K562细胞以不同的比例混合。系统中还包括与CD19+细胞相等数量的CD19-K562细胞,以进行最终标准化(Kawalekar et al.,2016)。Cas9TX编辑的T细胞显示出与Cas9编辑细胞相似的CAR能力,当与CAR T细胞以1:1混合时,约72%的CD19+K562细胞被裂解,而以1:5混合时几乎达到100%(图7的J图和图14的G图)。这些数据表明,CRISPR-Cas9TX可以有效消除CAR T细胞中的染色体易位,而不会影响其CD19靶向功能。
讨论
CRISPR-Cas9诱导的DSB经历不同的DNA修复途径以产生一系列的DNA修复结果。非同源末端连接(NHEJ)途径将两个完整或经过轻微加工的断裂末端直接连接在一起,以产生完全的重新连接产物或较小的插入/缺失(Betermier et al.,2014)。据估计,CRISPR-Cas9切割后超过50%的修复结果是来自两个相邻靶位点的测序数据的完全重新结合(Brinkmanet al.,2018;Guo et al.,2018)。完全的重新连接与靶序列无法区别,并且可以被CRISPR-Cas9重复切割。在每一轮切割过程中,几乎没有DSB能够逃脱对DNA损伤响应的监视,并导致染色体易位。因此,染色体易位在整个基因编辑过程中逐渐增加,并最终达到较高水平(图15的A图)。值得注意的是,染色体易位不仅可以发生在Cas9诱导的DSB之间,而且还可以发生在各种细胞活动过程中产生的一般DSB之间(Alt et al.,2013;Casellas et al.,2016;Nussenzweig and Nussenzweig,2010;Tubbs and Nussenzweig,2017)。
已经在许多类型的CRISPR-Cas9编辑的细胞中广泛观察到染色体易位(Eyquem etal.,2017;Liu et al.,2017;Mandal et al.,2014;Ren et al.,2017;Stadtmauer etal.,2020)。据估计,在CRISPR-Cas9靶向的T细胞中的两个靶基因之间以一定频率发生染色体易位,该频率为从PEM-seq粗略计算出的50-300个编辑过的T细胞之一(图1C)。但是,两个I-SceI靶位点之间的染色体易位频率较低,大约为300-1200个细胞之一(Roukos et al.,2013),这可能是因为I-SceI诱导的粘性DSB末端更倾向于被加工。一致地,还发现具有4bp粘性末端的CRISPR-Cas12a(或Cpf1)诱导的染色体易位水平低于CRISPR-Cas9(Bothmer etal.,2020)。关于染色体易位,在强增强子或致癌基因上进行基因编辑可能有风险。在这种情况下,已经广泛研究了涉及来自抗原受体基因座或c-Myc的强增强子的染色体易位,以能够驱动正在发育的淋巴细胞中的肿瘤发生(Alt et al.,2013;Lieber,2016;Nussenzweigand Nussenzweig,2010)。除了在这项研究中在工程化T细胞中在TRAC和TRBC中观察到染色体易位外,造血干细胞和祖细胞(HSPC)中在CRISPR-Cas9靶向CCR5或B2M基因期间产生的染色体易位(Liu et al.,2017;Mandal et al.,2014;Ren et al.,2017;Stadtmauer etal.,2020)也对干细胞的基因组完整性构成威胁,并影响循环系统和免疫系统。
TREX2与Cas9的融合允许切割后立即末端加工,因此可以减少完整断裂末端的百分比(图3)。因此,在最初的切割时,很大一部分完全重新连接会转变为插入缺失。在这种情况下,即使没有重复切割,Cas9TX仍可以略微提高编辑效率,并且在单个位点(图4)或多基因组编辑方案(图7)下将染色体易位保持在背景水平上(图15的A和B图)。分开表达的TREX2和Cas9也可以提高切割效率,如先前报道的那样(Cermak et al.,2017),但是在大多数编辑情况下都无法像Cas9TX一样有效地抑制染色体易位,这可能是由于低效率的及时末端加工引起,这可能会导致完全修复产物的泄漏。此外,Cas9和TREX2的分开形式并未针对RNP传递进行优化,而正如本文所展示的,Cas9TX与RNP相容,并且TREX2-3R的小尺寸(236个氨基酸)也可以将Cas9TX包装成分裂型腺相关病毒(AAV;Chew et al.,2016)中。而且,融合的TREX2应能够提高编辑效率,并抑制其他平末端或3’末端基因编辑酶的染色体易位,因为TREX2更优选这些类型的断裂末端。
尽管由于弱的核酸外切酶活性,野生型TREX2的过表达对细胞没有明显的影响(Certo et al,2012),但还是在TREX2的DNA结合域上引入了突变,以抑制Cas9TX与DNA的非特异性结合(图4)。已证明非特异性DNA结合结构域上的突变能够提高CRISPR-Cas9或碱基编辑器的编辑特异性(Slaymaker et al.,2016;Zhou et al.,2019)。CRISPR-Cas9TX几乎消除了TRAC,TRBC和PDCD1靶位点之间的染色体易位,对CAR的杀伤力没有可检测的影响,优于CRISPR-Cas9(图7)。与Cas9TX相比,高保真度的Cas9变体尽管具有更高的编辑特异性,却无法抑制易位。对于经常用于基因校正但很少用于基因破坏的碱基编辑器,BE4max和ABEmax仍然能够诱导低水平的染色体易位,因为缺口可以低频率转化为DSB(Tubbs andNussenzweig,2017)。CRISPR-Cas9TX仅比BE4max或ABEmax诱导更高水平的一般染色体易位(图5C)。值得注意的是,碱基编辑器还可以靶向RNA (Grunewald et al.,2019;Zhou etal.,2019),而CRISPR-Cas9TX则不存在这种能力。总之,CRISPR-Cas9TX确保与碱基编辑器一样相对良好的基因组完整性。
此外,发明人将本发明的融合蛋白成功应用于改造CAR-T的肿瘤疗法中。利用本发明的融合蛋白敲除CAR-T过程中的TCR和PD-1的编码基因,可以有效提高CAR-T的靶向性以及生存周期。使用Cas9之后,在拟回输的CAR-T中,10万个编辑细胞中存在约300个左右的染色体易位。比较而言,在使用Cas9TX的细胞组中,染色体易位的水平已经降到基线水平,即基本消失。发明人还合作进行了小鼠眼科疾病的模型检测,Cas9中存在的大量染色体易位也在Cas9TX处理的小鼠中消失了。Cas9TX可以显著提高单基因与多基因编辑过程中的基因安全性,在基因编辑的临床应用方面具有较大的应用前景。
参考文献
下文列出本文中提及的参考文献,这些参考文献通过引用并入本文。
Alt,F.W.,Zhang,Y.,Meng,F.L.,Guo,C.,and Schwer,B.(2013).Mechanisms ofprogrammed DNA lesions and genomic instability in the immune system.Cell 152,417-429.
Betermier,M.,Bertrand,P.,and Lopez,B.S.(2014).Is non-homologous end-joining really an inherently error-prone process?PLoS Genet 10,e1004086.
Bothmer,A.,Gareau,K.W.,Abdulkerim,H.S.,Buquicchio,F.,Cohen,L.,Viswanathan,R.,Zuris,J.A.,Marco,E.,Fernandez,C.A.,Myer,V.E.,et al.(2020).Detection and Modulation of DNA Translocations During Multi-Gene GenomeEditing in T Cells.CRISPR J 3,177-187.
Brinkman,E.K.,Chen,T.,de Haas,M.,Holland,H.A.,Akhtar,W.,and vanSteensel,B.(2018).Kinetics and Fidelity of the Repair of Cas9-Induced Double-Strand DNA Breaks.Mol Cell 70,801-813e806.
Canela,A.,Maman,Y.,Jung,S.,Wong,N.,Callen,E.,Day,A.,Kieffer-Kwon,K.R.,Pekowska,A.,Zhang,H.,Rao,S.S.P.,et al.(2017).Genome Organization DrivesChromosome Fragility.Cell 170,507-521 e518.
Casellas,R.,Basu,U.,Yewdell,W.T.,Chaudhuri,J.,Robbiani,D.F.,and DiNoia,J.M.(2016).Mutations,kataegis and translocations in B cells:understanding AID promiscuous activity.Nat Rev Immunol 16,164-176.
Cauwelier,B.,Dastugue,N.,Cools,J.,Poppe,B.,Herens,C.,De Paepe,A.,Hagemeijer,A.,and Speleman,F.(2006).Molecular cytogenetic study of126unselected T-ALL cases reveals high incidence of TCRbeta locusrearrangements and putative new T-cell oncogenes.Leukemia 20,1238-1244.
Cermak,T.,Curtin,S.J.,Gil-Humanes,J.,Cegan,R.,Kono,T.J.Y.,Konecna,E.,Belanto,J.J.,Starker,C.G.,Mathre,J.W.,Greenstein,R.L.,et al.(2017).AMultipurpose Toolkit to Enable Advanced Genome Engineering in Plants.PlantCell 29,1196-1217.
Certo,M.T.,Gwiazda,K.S.,Kuhar,R.,Sather,B.,Curinga,G.,Mandt,T.,Brault,M.,Lambert,A.R.,Baxter,S.K.,Jacoby,K.,et al.(2012).Couplingendonucleases with DNA end-processing enzymes to drive gene disruption.NatMethods 9,973-975.
Chen,J.S.,Dagdas,Y.S.,Kleinstiver,B.P.,Welch,M.M.,Sousa,A.A.,Harrington,L.B.,Sternberg,S.H.,Joung,J.K.,Yildiz,A.,and Doudna,J.A.(2017).Enhanced proofreading governs CRISPR-Cas9 targeting accuracy.Nature 550,407-410.
Chew,W.L.,Tabebordbar,M.,Cheng,J.K.,Mali,P.,Wu,E.Y.,Ng,A.H.,Zhu,K.,Wagers,A.J.,and Church,G.M.(2016).A multifunctional AAV-CRISPR-Cas9 and itshost response.Nat Methods 13,868-874.
Clement,K.,Rees,H.,Canver,M.C.,Gehrke,J.M.,Farouni,R.,Hsu,J.Y.,Cole,M.A.,Liu,D.R.,Joung,J.K.,Bauer,D.E.,et al.(2019).CRISPResso2provides accurateand rapid genome editing sequence analysis.Nat Biotechnol 37,224-226.
Dai,X.,Park,J.J.,Du,Y.,Kim,H.R.,Wang,G.,Errami,Y.,and Chen,S.(2019).One-step generation of modular CAR-T cells with AAV-Cpf1.Nat Methods 16,247-254.
Eyquem,J.,Mansilla-Soto,J.,Giavridis,T.,van der Stegen,S.J.,Hamieh,M.,Cunanan,K.M.,Odak,A.,Gonen,M.,and Sadelain,M.(2017).Targeting a CAR to theTRAC locus with CRISPR/Cas9 enhances tumour rejection.Nature 543,113-117.
Fraietta,J.A.,Nobles,C.L.,Sammons,M.A.,Lundh,S.,Carty,S.A.,Reich,T.J.,Cogdill,A.P.,Morrissette,J.J.D.,DeNizio,J.E.,Reddy,S.,et al.(2018).Disruption of TET2 promotes the therapeutic efficacy of CD19-targeted Tcells.Nature 558,307-312.
Frock,R.L.,Hu,J.,Meyers,R.M.,Ho,Y.J.,Kii,E.,and Alt,F.W.(2015).Genome-wide detection of DNA double-stranded breaks induced by engineerednucleases.Nat Biotechnol 33,179-186.
Gaudelli,N.M.,Komor,A.C.,Rees,H.A.,Packer,M.S.,Badran,A.H.,Bryson,D.I.,and Liu,D.R.(2017).Programmable base editing of A*T to G*C in genomicDNA without DNA cleavage.Nature 551,464-471.
Graux,C.,Cools,J.,Michaux,L.,Vandenberghe,P.,and Hagemeijer,A.(2006).Cytogenetics and molecular genetics of T-cell acute lymphoblastic leukemia:from thymocyte to lymphoblast.Leukemia 20,1496-1510.
Grunewald,J.,Zhou,R.,Iyer,S.,Lareau,C.A.,Garcia,S.P.,Aryee,M.J.,andJoung,J.K.(2019).CRISPR DNA base editors with reduced RNA off-target andself-editing activities.Nat Biotechnol 37,1041-1048.
Guo,T.,Feng,Y.L.,Xiao,J.J.,Liu,Q.,Sun,X.N.,Xiang,J.F.,Kong,N.,Liu,S.C.,Chen,G.Q.,Wang,Y.,et al.(2018).Harnessing accurate non-homologous endjoining for efficient precise deletion in CRISPR/Cas9-mediatedgenomeediting.Genome Biol 19,170.
Hendriks,D.,Clevers,H.,and Artegiani,B.(2020).CRISPR-Cas Tools andTheir Application in Genetic Engineering of Human Stem Cells andOrganoids.Cell Stem Cell 27,705-731.
Hu,J.,Meyers,R.M.,Dong,J.,Panchakshari,R.A.,Alt,F.W.,and Frock,R.L.(2016).Detecting DNA double-stranded breaks in mammalian genomes by linearamplification-mediated high-throughput genome-wide translocationsequencing.Nat Protoc 11,853-871.
June,C.H.,and Sadelain,M.(2018).Chimeric Antigen Receptor Therapy.NEngl J Med 379,64-73.
Kalos,M.,and June,C.H.(2013).Adoptive T cell transfer for cancerimmunotherapy in the era of synthetic biology.Immunity 39,49-60.
Kawalekar,O.U.,RS,O.C.,Fraietta,J.A.,Guo,L.,McGettigan,S.E.,Posey,A.D.,Jr.,Patel,P.R.,Guedan,S.,Scholler,J.,Keith,B.,et al.(2016).DistinctSignaling of Coreceptors Regulates Specific Metabolism Pathways and ImpactsMemory Development in CAR T Cells.Immunity 44,712.
Kleinstiver,B.P.,Pattanayak,V.,Prew,M.S.,Tsai,S.Q.,Nguyen,N.T.,Zheng,Z.,and Joung,J.K.(2016).High-fidelity CRISPR-Cas9 nucleases with nodetectable genome-wide off-target effects.Nature 529,490-495.
Koblan,L.W.,Doman,J.L.,Wilson,C.,Levy,J.M.,Tay,T.,Newby,G.A.,Maianti,J.P.,Raguram,A.,and Liu,D.R.(2018).Improving cytidine and adenine baseeditors by expression optimization and ancestral reconstruction.NatBiotechnol 36,843-846.
Kochenderfer,J.N.,and Rosenberg,S.A.(2013).Treating B-cell cancerwith T cells expressing anti-CD19 chimeric antigen receptors.Nat Rev ClinOncol 10,267-276.
Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.,and Liu,D.R.(2016).Programmable editing of a target base in genomic DNA without double-strandedDNA cleavage.Nature 533,420-424.
Kuppers,R.(2005).Mechanisms of B-cell lymphoma pathogenesis.Nat RevCancer 5,251-262.
Laskowski,T.,and Rezvani,K.(2020).Adoptive cell therapy:Living drugsagainst cancer.J Exp Med 217.
Lieber,M.R.(2016).Mechanisms of human lymphoid chromosomaltranslocations.Nat Rev Cancer 16,387-398.
Liu,M.,Zhang,W.,Xin,C.,Yin,J.,Shang,Y.,Ai,C.,Li,J.,Meng,F.,and Hu,J.(2021).Global detection of DNA repair outcomes induced by CRISPR-Cas9.bioRxiv.
Liu,X.,Zhang,Y.,Cheng,C.,Cheng,A.W.,Zhang,X.,Li,N.,Xia,C.,Wei,X.,Liu,X.,and Wang,H.(2017).CRISPR-Cas9-mediated multiplex gene editing in CAR-Tcells.Cell Res 27,154-157.
Mandal,P.K.,Ferreira,L.M.,Collins,R.,Meissner,T.B.,Boutwell,C.L.,Friesen,M.,Vrbanac,V.,Garrison,B.S.,Stortchevoi,A.,Bryder,D.,et al.(2014).Efficient ablation of genes in human hematopoietic stem and effector cellsusing CRISPR/Cas9.Cell Stem Cell 15,643-652.
Manfredi,F.,Cianciotti,B.C.,Potenza,A.,Tassi,E.,Noviello,M.,Biondi,A.,Ciceri,F.,Bonini,C.,and Ruggiero,E.(2020).TCR Redirected T Cells forCancer Treatment:Achievements,Hurdles,and Goals.Front Immunol 11,1689.
Mazur,D.J.,and Perrino,F.W.(2001).Structure and expression of theTREX1 and TREX2 3'-->5'exonuclease genes.J Biol Chem 276,14718-14727.
Morgan,R.A.,Dudley,M.E.,Wunderlich,J.R.,Hughes,M.S.,Yang,J.C.,Sherry,R.M.,Royal,R.E.,Topalian,S.L.,Kammula,U.S.,Restifo,N.P.,et al.(2006).Cancerregression in patients after transfer of genetically engineeredlymphocytes.Science 314,126-129.
Nussenzweig,A.,and Nussenzweig,M.C.(2010).Origin of chromosomaltranslocations in lymphoid cancer.Cell 141,27-38.
Perrino,F.W.,de Silva,U.,Harvey,S.,Pryor,E.E.,Jr.,Cole,D.W.,andHollis,T.(2008).Cooperative DNA binding and communication across the dimerinterface in the TREX2 3'-->5'-exonuclease.J Biol Chem 283,21441-21452.
Perrino,F.W.,Harvey,S.,McMillin,S.,and Hollis,T.(2005).The humanTREX2 3'->5'-exonuclease structure suggests a mechanism for efficientnonprocessive DNA catalysis.J Biol Chem 280,15212-15218.
Poirot,L.,Philip,B.,Schiffer-Mannioui,C.,Le Clerre,D.,Chion-Sotinel,I.,Derniame,S.,Potrel,P.,Bas,C.,Lemaire,L.,Galetto,R.,et al.(2015).MultiplexGenome-Edited T-cell Manufacturing Platform for"Off-the-Shelf"Adoptive T-cellImmunotherapies.Cancer Res 75,3853-3864.
Porter,D.L.,Levine,B.L.,Kalos,M.,Bagg,A.,and June,C.H.(2011).Chimericantigen receptor-modified T cells in chronic lymphoid leukemia.N Engl J Med365,725-733.
Qasim,W.,Zhan,H.,Samarasinghe,S.,Adams,S.,Amrolia,P.,Stafford,S.,Butler,K.,Rivat,C.,Wright,G.,Somana,K.,et al.(2017).Molecular remission ofinfant B-ALL after infusion of universal TALEN gene-edited CAR T cells.SciTransl Med 9.
Rafiq,S.,Hackett,C.S.,and Brentjens,R.J.(2020).Engineering strategiesto overcome the current roadblocks in CAR T cell therapy.Nat Rev ClinOncol17,147-167.
Ren,J.,Liu,X.,Fang,C.,Jiang,S.,June,C.H.,and Zhao,Y.(2017).MultiplexGenome Editing to Generate Universal CAR T Cells Resistant toPD1Inhibition.Clin Cancer Res 23,2255-2266.
Rosenberg,S.A.,Restifo,N.P.,Yang,J.C.,Morgan,R.A.,and Dudley,M.E.(2008).Adoptive cell transfer:a clinical path to effective cancerimmunotherapy.Nat Rev Cancer 8,299-308.
Roukos,V.,Voss,T.C.,Schmidt,C.K.,Lee,S.,Wangsa,D.,and Misteli,T.(2013).Spatial dynamics of chromosome translocations in livingcells.Science341,660-664.
Slaymaker,I.M.,Gao,L.,Zetsche,B.,Scott,D.A.,Yan,W.X.,and Zhang,F.(2016).Rationally engineered Cas9 nucleases with improvedspecificity.Science351,84-88.
Stadtmauer,E.A.,Fraietta,J.A.,Davis,M.M.,Cohen,A.D.,Weber,K.L.,Lancaster,E.,Mangan,P.A.,Kulikovskaya,I.,Gupta,M.,Chen,F.,et al.(2020).CRISPR-engineered T cells in patients with refractory cancer.Science 367.
Symington,L.S.,and Gautier,J.(2011).Double-strand break end resectionand repair pathway choice.Annu Rev Genet 45,247-271.
Torikai,H.,Reik,A.,Liu,P.Q.,Zhou,Y.,Zhang,L.,Maiti,S.,Huls,H.,Miller,J.C.,Kebriaei,P.,Rabinovich,B.,et al.(2012).A foundation for universal T-cellbased immunotherapy:T cells engineered to express a CD19-specific chimeric-antigen-receptor and eliminate expression of endogenous TCR.Blood119,5697-5705.
Tubbs,A.,and Nussenzweig,A.(2017).Endogenous DNA Damage as a Sourceof Genomic Instability in Cancer.Cell 168,644-656.
Wei,J.,Guo,Y.,Wang,Y.,Wu,Z.,Bo,J.,Zhang,B.,Zhu,J.,and Han,W.(2020).Clinical development of CAR T cell therapy in China:2020update.Cell MolImmunol.
Yin,J.,Liu,M.,Liu,Y.,Wu,J.,Gan,T.,Zhang,W.,Li,Y.,Zhou,Y.,and Hu,J.(2019).Optimizing genome editing strategy by primer-extension-mediatedsequencing.Cell Discov 5,18.
Zhou,C.,Sun,Y.,Yan,R.,Liu,Y.,Zuo,E.,Gu,C.,Han,L.,Wei,Y.,Hu,X.,Zeng,R.,et al.(2019).Off-target RNA mutation induced by DNA base editing and itselimination by mutagenesis.Nature 571,275-278.
序列表
TREX2突变体TREX2-3R氨基酸序列(SEQ ID NO.1):
Figure BDA0003199786810000481
Cas9氨基酸序列(SEQ ID NO.2):
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAADKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDKRPAATKKAGQAKKKK*
Cas9TX氨基酸序列(SEQ ID NO.3):
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAADKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDKRPAATKKAGQAKKKKGGGGSMSEAPRAETFVFLDLEATGLPSVEPEIAELSLFAVHRSSLENPEHDESGALVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLARCRKAGFDGAVVRTLQAFLSRQAGPICLVAHNGFDYDFPLLCAELRRLGARLPRDTVCLDTLPALRGLDRAHSHGTAAAGAQGYSLGSLFHRYFRAEPSAAHSAEGDVHTLLLIFLHRAAELLAWADEQARGWAHIEPMYLPPDDPSLEA*
TREX2突变体核苷酸序列(SEQ ID NO.4):
ATGTCCGAGGCACCCCGGGCCGAGACCTTTGTGTTCCTGGACCTGGAAGCCACTGGGCTCCCCAGTGTGGAGCCCGAGATTGCCGAGCTGTCCCTCTTTGCTGTCCACCGCTCCTCCCTGGAGAACCCGGAGCACGACGAGTCTGGTGCCCTAGTATTGCCCCGGGTCCTGGACAAGCTCACGCTGTGCATGTGCCCGGAGCGCCCCTTCACTGCCAAGGCCAGCGAGATCACCGGCCTGAGCAGTGAGGGCCTGGCGCGATGCCGGAAGGCTGGCTTTGATGGCGCCGTGGTGCGGACGCTGCAGGCCTTCCTGAGCCGCCAGGCAGGGCCCATCTGCCTTGTGGCCCACAATGGCTTTGATTATGATTTCCCCCTGCTGTGTGCCGAGCTGCGGCGCCTGGGTGCTCGCCTGCCTCGGGACACTGTCTGCCTGGACACGCTGCCAGCCCTGCGGGGCCTGGACCGCGCCCACAGCCACGGCACAGCCGCTGCCGGCGCCCAGGGTTACAGCCTCGGCAGCCTCTTCCACCGCTACTTCCGGGCAGAGCCAAGCGCAGCCCACTCAGCCGAGGGCGACGTGCACACCCTGCTCCTGATCTTCCTGCACCGCGCCGCAGAGCTGCTCGCCTGGGCCGATGAGCAGGCCCGTGGGTGGGCCCACATCGAGCCCATGTACTTGCCGCCTGATGACCCCAGCCTGGAGGCCTAA
Cas9核苷酸序列(SEQ ID NO.5):
ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA
Cas9TX核苷酸序列(SEQ ID NO.6):
ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGGGAGGAGGCGGCAGCATGTCCGAGGCACCCCGGGCCGAGACCTTTGTGTTCCTGGACCTGGAAGCCACTGGGCTCCCCAGTGTGGAGCCCGAGATTGCCGAGCTGTCCCTCTTTGCTGTCCACCGCTCCTCCCTGGAGAACCCGGAGCACGACGAGTCTGGTGCCCTAGTATTGCCCCGGGTCCTGGACAAGCTCACGCTGTGCATGTGCCCGGAGCGCCCCTTCACTGCCAAGGCCAGCGAGATCACCGGCCTGAGCAGTGAGGGCCTGGCGCGATGCCGGAAGGCTGGCTTTGATGGCGCCGTGGTGCGGACGCTGCAGGCCTTCCTGAGCCGCCAGGCAGGGCCCATCTGCCTTGTGGCCCACAATGGCTTTGATTATGATTTCCCCCTGCTGTGTGCCGAGCTGCGGCGCCTGGGTGCTCGCCTGCCTCGGGACACTGTCTGCCTGGACACGCTGCCAGCCCTGCGGGGCCTGGACCGCGCCCACAGCCACGGCACAGCCGCTGCCGGCGCCCAGGGTTACAGCCTCGGCAGCCTCTTCCACCGCTACTTCCGGGCAGAGCCAAGCGCAGCCCACTCAGCCGAGGGCGACGTGCACACCCTGCTCCTGATCTTCCTGCACCGCGCCGCAGAGCTGCTCGCCTGGGCCGATGAGCAGGCCCGTGGGTGGGCCCACATCGAGCCCATGTACTTGCCGCCTGATGACCCCAGCCTGGAGGCCTAA
TREX2野生型序列
核苷酸序列(SEQ ID NO.7)
ATGTCCGAGGCACCCCGGGCCGAGACCTTTGTGTTCCTGGACCTGGAAGCCACTGGGCTCCCCAGTGTGGAGCCCGAGATTGCCGAGCTGTCCCTCTTTGCTGTCCACCGCTCCTCCCTGGAGAACCCGGAGCACGACGAGTCTGGTGCCCTAGTATTGCCCCGGGTCCTGGACAAGCTCACGCTGTGCATGTGCCCGGAGCGCCCCTTCACTGCCAAGGCCAGCGAGATCACCGGCCTGAGCAGTGAGGGCCTGGCGCGATGCCGGAAGGCTGGCTTTGATGGCGCCGTGGTGCGGACGCTGCAGGCCTTCCTGAGCCGCCAGGCAGGGCCCATCTGCCTTGTGGCCCACAATGGCTTTGATTATGATTTCCCCCTGCTGTGTGCCGAGCTGCGGCGCCTGGGTGCTCGCCTGCCTCGGGACACTGTCTGCCTGGACACGCTGCCAGCCCTGCGGGGCCTGGACCGCGCCCACAGCCACGGCACACGAGCTAGAGGCAGACAGGGTTACAGCCTCGGCAGCCTCTTCCACCGCTACTTCCGGGCAGAGCCAAGCGCAGCCCACTCAGCCGAGGGCGACGTGCACACCCTGCTCCTGATCTTCCTGCACCGCGCCGCAGAGCTGCTCGCCTGGGCCGATGAGCAGGCCCGTGGGTGGGCCCACATCGAGCCCATGTACTTGCCGCCTGATGACCCCAGCCTGGAGGCCTAA
氨基酸序列(SEQ ID NO.8)
MSEAPRAETFVFLDLEATGLPSVEPEIAELSLFAVHRSSLENPEHDESGALVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLARCRKAGFDGAVVRTLQAFLSRQAGPICLVAHNGFDYDFPLLCAELRRLGARLPRDTVCLDTLPALRGLDRAHSHGTRARGRQGYSLGSLFHRYFRAEPSAAHSAEGDVHTLLLIFLHRAAELLAWADEQARGWAHIEPMYLPPDDPSLEA*
nuclease-dead TREX2序列
核苷酸序列(SEQ ID NO.9)
ATGTCCGAGGCACCCCGGGCCGAGACCTTTGTGTTCCTGGACCTGGAAGCCACTGGGCTCCCCAGTGTGGAGCCCGAGATTGCCGAGCTGTCCCTCTTTGCTGTCCACCGCTCCTCCCTGGAGAACCCGGAGCACGACGAGTCTGGTGCCCTAGTATTGCCCCGGGTCCTGGACAAGCTCACGCTGTGCATGTGCCCGGAGCGCCCCTTCACTGCCAAGGCCAGCGAGATCACCGGCCTGAGCAGTGAGGGCCTGGCGCGATGCCGGAAGGCTGGCTTTGATGGCGCCGTGGTGCGGACGCTGCAGGCCTTCCTGAGCCGCCAGGCAGGGCCCATCTGCCTTGTGGCCCACAATGGCTTTGATTATGATTTCCCCCTGCTGTGTGCCGAGCTGCGGCGCCTGGGTGCTCGCCTGCCTCGGGACACTGTCTGCCTGGACACGCTGCCAGCCCTGCGGGGCCTGGACCGCGCCCACAGCCACGGCACACGAGCTAGAGGCAGACAGGGTTACAGCCTCGGCAGCCTCTTCCACCGCTACTTCCGGGCAGAGCCAAGCGCAGCCGCCTCAGCCGAGGGCGACGTGCACACCCTGCTCCTGATCTTCCTGCACCGCGCCGCAGAGCTGCTCGCCTGGGCCGATGAGCAGGCCCGTGGGTGGGCCCACATCGAGCCCATGTACTTGCCGCCTGATGACCCCAGCCTGGAGGCCTAA
氨基酸序列(SEQ ID NO.10)
Figure BDA0003199786810000531
Figure BDA0003199786810000541
AsCas12a DNA序列(SEQ ID NO.92):
atgacacagttcgagggctttaccaacctgtatcaggtgagcaagacactgcggtttgagctgatcccacagggcaagaccctgaagcacatccaggagcagggcttcatcgaggaggacaaggcccgcaatgatcactacaaggagctgaagcccatcatcgatcggatctacaagacctatgccgaccagtgcctgcagctggtgcagctggattgggagaacctgagcgccgccatcgactcctatagaaaggagaaaaccgaggagacaaggaacgccctgatcgaggagcaggccacatatcgcaatgccatccacgactacttcatcggccggacagacaacctgaccgatgccatcaataagagacacgccgagatctacaagggcctgttcaaggccgagctgtttaatggcaaggtgctgaagcagctgggcaccgtgaccacaaccgagcacgagaacgccctgctgcggagcttcgacaagtttacaacctacttctccggcttttatgagaacaggaagaacgtgttcagcgccgaggatatcagcacagccatcccacaccgcatcgtgcaggacaacttccccaagtttaaggagaattgtcacatcttcacacgcctgatcaccgccgtgcccagcctgcgggagcactttgagaacgtgaagaaggccatcggcatcttcgtgagcacctccatcgaggaggtgttttccttccctttttataaccagctgctgacacagacccagatcgacctgtataaccagctgctgggaggaatctctcgggaggcaggcaccgagaagatcaagggcctgaacgaggtgctgaatctggccatccagaagaatgatgagacagcccacatcatcgcctccctgccacacagattcatccccctgtttaagcagatcctgtccgataggaacaccctgtctttcatcctggaggagtttaagagcgacgaggaagtgatccagtccttctgcaagtacaagacactgctgagaaacgagaacgtgctggagacagccgaggccctgtttaacgagctgaacagcatcgacctgacacacatcttcatcagccacaagaagctggagacaatcagcagcgccctgtgcgaccactgggatacactgaggaatgccctgtatgagcggagaatctccgagctgacaggcaagatcaccaagtctgccaaggagaaggtgcagcgcagcctgaagcacgaggatatcaacctgcaggagatcatctctgccgcaggcaaggagctgagcgaggccttcaagcagaaaaccagcgagatcctgtcccacgcacacgccgccctggatcagccactgcctacaaccctgaagaagcaggaggagaaggagatcctgaagtctcagctggacagcctgctgggcctgtaccacctgctggactggtttgccgtggatgagtccaacgaggtggaccccgagttctctgcccggctgaccggcatcaagctggagatggagccttctctgagcttctacaacaaggccagaaattatgccaccaagaagccctactccgtggagaagttcaagctgaactttcagatgcctacactggcctctggctgggacgtgaataaggagaagaacaatggcgccatcctgtttgtgaagaacggcctgtactatctgggcatcatgccaaagcagaagggcaggtataaggccctgagcttcgagcccacagagaaaaccagcgagggctttgataagatgtactatgactacttccctgatgccgccaagatgatcccaaagtgcagcacccagctgaaggccgtgacagcccactttcagacccacacaacccccatcctgctgtccaacaatttcatcgagcctctggagatcacaaaggagatctacgacctgaacaatcctgagaaggagccaaagaagtttcagacagcctacgccaagaaaaccggcgaccagaagggctacagagaggccctgtgcaagtggatcgacttcacaagggattttctgtccaagtataccaagacaacctctatcgatctgtctagcctgcggccatcctctcagtataaggacctgggcgagtactatgccgagctgaatcccctgctgtaccacatcagcttccagagaatcgccgagaaggagatcatggatgccgtggagacaggcaagctgtacctgttccagatctataacaaggactttgccaagggccaccacggcaagcctaatctgcacacactgtattggaccggcctgttttctccagagaacctggccaagacaagcatcaagctgaatggccaggccgagctgttctaccgccctaagtccaggatgaagaggatggcacaccggctgggagagaagatgctgaacaagaagctgaaggatcagaaaaccccaatccccgacaccctgtaccaggagctgtacgactatgtgaatcacagactgtcccacgacctgtctgatgaggccagggccctgctgcccaacgtgatcaccaaggaggtgtctcacgagatcatcaaggataggcgctttaccagcgacaagttctttttccacgtgcctatcacactgaactatcaggccgccaattccccatctaagttcaaccagagggtgaatgcctacctgaaggagcaccccgagacacctatcatcggcatcgatcggggcgagagaaacctgatctatatcacagtgatcgactccaccggcaagatcctggagcagcggagcctgaacaccatccagcagtttgattaccagaagaagctggacaacagggagaaggagagggtggcagcaaggcaggcctggtctgtggtgggcacaatcaaggatctgaagcagggctatctgagccaggtcatccacgagatcgtggacctgatgatccactaccaggccgtggtggtgctggagaacctgaatttcggctttaagagcaagaggaccggcatcgccgagaaggccgtgtaccagcagttcgagaagatgctgatcgataagctgaattgcctggtgctgaaggactatccagcagagaaagtgggaggcgtgctgaacccataccagctgacagaccagttcacctcctttgccaagatgggcacccagtctggcttcctgttttacgtgcctgccccatatacatctaagatcgatcccctgaccggcttcgtggaccccttcgtgtggaaaaccatcaagaatcacgagagccgcaagcacttcctggagggcttcgactttctgcactacgacgtgaaaaccggcgacttcatcctgcactttaagatgaacagaaatctgtccttccagaggggcctgcccggctttatgcctgcatgggatatcgtgttcgagaagaacgagacacagtttgacgccaagggcacccctttcatcgccggcaagagaatcgtgccagtgatcgagaatcacagattcaccggcagataccgggacctgtatcctgccaacgagctgatcgccctgctggaggagaagggcatcgtgttcagggatggctccaacatcctgccaaagctgctggagaatgacgattctcacgccatcgacaccatggtggccctgatccgcagcgtgctgcagatgcggaactccaatgccgccacaggcgaggactatatcaacagccccgtgcgcgatctgaatggcgtgtgcttcgactcccggtttcagaacccagagtggcccatggacgccgatgccaatggcgcctaccacatcgccctgaagggccagctgctgctgaatcacctgaaggagagcaaggatctgaagctgcagaacggcatctccaatcaggactggctggcctacatccaggagctgcgcaactaa
AsCas12a氨基酸序列(SEQ ID NO.91):
MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN*
PlmCas12e DNA序列(SEQ ID NO.90):
atgcaagagatcaagagaatcaacaagatcagaaggagactggtcaaggacagcaacacaaagaaggccggcaagacaggccccatgaaaaccctgctcgtcagagtgatgacccctgacctgagagagcggctggaaaacctgagaaagaagcccgagaacatccctcagcctatcagcaacaccagcagggccaacctgaacaagctgctgaccgactacaccgagatgaagaaagccatcctgcacgtgtactgggaagagttccagaaagaccccgtgggcctgatgagcagagttgctcagcccgctcctaagaacatcgaccagagaaagctgatccccgtgaaggacggcaacgagagactgacctctagcggctttgcctgcagccagtgttgccagcctctgtacgtgtacaagctggaacaagtgaacgacaagggcaagccccacaccaactacttcggcagatgcaacgtgtccgagcacgagaggctgatcctgctgtctcctcacaagcccgaggccaacgatgagctggtcacatacagcctgggcaagttcggacagagagccctggacttctacagcatccacgtgaccagggagagcaatcaccctgtgaagcccctggaacagatcggcggcaatagctgtgcctctggacctgtgggaaaagccctgagcgacgcctgtatgggagccgtggcatccttcctgaccaagtaccaggacatcatcctggaacaccagaaagtgatcaagaagaacgagaaaagactggccaacctcaaggatatcgccagcgctaacggcctggcctttcctaagatcaccctgcctccacagcctcacaccaaagagggcatcgaggcctacaacaacgtggtggcccagatcgtgatttgggtcaacctgaatctgtggcagaagctgaagatcggcagggacgaagccaagccactgcagagactgaagggcttccctagcttccctctggtggaaagacaggccaatgaagtggattggtgggacatggtctgcaacgtgaagaagctgatcaacgagaagaaagaggatggcaaggttttctggcagaacctggccggctacaagagacaagaagccctgctgccttacctgagcagcgaagaggaccggaagaagggcaagaagttcgccagataccagttcggcgacctgctgctgcacctggaaaagaagcacggcgaggactggggcaaagtgtacgatgaggcctgggagagaatcgacaagaaggtggaaggcctgagcaagcacattaagctggaagaggaaagaaggagcgaggacgcccaatctaaagccgctctgaccgattggctgagagccaaggccagctttgtgatcgagggcctgaaagaggccgacaaggacgagttctgcagatgcgagctgaagctgcagaagtggtacggcgatctgagaggcaagcccttcgccattgaggccgagaacagcatcctggacatcagcggcttcagcaagcagtacaactgcgccttcatttggcagaaagacggcgtcaagaaactgaacctgtacctgatcatcaattacttcaaaggcggcaagctgcggttcaagaagatcaaacccgaggccttcgaggctaacagattctacaccgtgatcaacaaaaagtccggcgagatcgtgcccatggaagtgaacttcaacttcgacgaccccaacctgattatcctgcctctggccttcggcaagagacagggcagagagttcatctggaacgatctgctgagcctggaaaccggctctctgaagctggccaatggcagagtgatcgagaaaaccctgtacaacaggagaaccagacaggacgagcctgctctgtttgtggccctgaccttcgagagaagagaggtgctggacagcagcaacatcaagcccatgaacctgatcggcatcgaccggggcgagaatatccctgctgtgatcgccctgacagaccctgaaggatgcccactgagcagattcaaggactccctgggcaaccctacacacatcctgagaatcggcgagagctacaaagagaagcagaggacaatccaggccgccaaagaggtggaacagagaagagccggcggatactctaggaagtacgccagcaaggccaagaatctggccgacgacatggtccgaaacaccgccagagatctgctgtactacgccgtgacacaggacgccatgctgatcttcgagaatctgagcagaggcttcggccggcagggcaagagaacctttatggccgagaggcagtacaccagaatggaagattggctcacagctaaactggcctacgagggactgcccagcaagacctacctgtccaaaacactggcccagtatacctccaagacctgcagcaattgcggcttcaccatcaccagcgccgactacgacagagtgctggaaaagctcaagaaaaccgccaccggctggatgaccaccatcaacggcaaagagctgaaggttgagggccagatcacctactacaacaggtacaagaggcagaacgtcgtgaaggatctgagcgtggaactggacagactgagcgaagagagcgtgaacaacgacatcagcagctggacaaagggcagatcaggcgaggctctgagcctgctgaagaagaggtttagccacagacctgtgcaagagaagttcgtgtgcctgaactgcggcttcgagacacacgccgatgaacaggctgccctgaacattgccagaagctggctgttcctgagaagccaagagtacaagaagtaccagaccaacaagaccaccggcaacaccgacaagagggcctttgtggaaacctggcagagcttctacagaaaaaagctgaaagaagtctggaagcccgccgtgtaa
PlmCas12e氨基酸序列(SEQ ID NO.89):
MQEIKRINKIRRRLVKDSNTKKAGKTGPMKTLLVRVMTPDLRERLENLRKKPENIPQPISNTSRANLNKLLTDYTEMKKAILHVYWEEFQKDPVGLMSRVAQPAPKNIDQRKLIPVKDGNERLTSSGFACSQCCQPLYVYKLEQVNDKGKPHTNYFGRCNVSEHERLILLSPHKPEANDELVTYSLGKFGQRALDFYSIHVTRESNHPVKPLEQIGGNSCASGPVGKALSDACMGAVASFLTKYQDIILEHQKVIKKNEKRLANLKDIASANGLAFPKITLPPQPHTKEGIEAYNNVVAQIVIWVNLNLWQKLKIGRDEAKPLQRLKGFPSFPLVERQANEVDWWDMVCNVKKLINEKKEDGKVFWQNLAGYKRQEALLPYLSSEEDRKKGKKFARYQFGDLLLHLEKKHGEDWGKVYDEAWERIDKKVEGLSKHIKLEEERRSEDAQSKAALTDWLRAKASFVIEGLKEADKDEFCRCELKLQKWYGDLRGKPFAIEAENSILDISGFSKQYNCAFIWQKDGVKKLNLYLIINYFKGGKLRFKKIKPEAFEANRFYTVINKKSGEIVPMEVNFNFDDPNLIILPLAFGKRQGREFIWNDLLSLETGSLKLANGRVIEKTLYNRRTRQDEPALFVALTFERREVLDSSNIKPMNLIGIDRGENIPAVIALTDPEGCPLSRFKDSLGNPTHILRIGESYKEKQRTIQAAKEVEQRRAGGYSRKYASKAKNLADDMVRNTARDLLYYAVTQDAMLIFENLSRGFGRQGKRTFMAERQYTRMEDWLTAKLAYEGLPSKTYLSKTLAQYTSKTCSNCGFTITSADYDRVLEKLKKTATGWMTTINGKELKVEGQITYYNRYKRQNVVKDLSVELDRLSEESVNNDISSWTKGRSGEALSLLKKRFSHRPVQEKFVCLNCGFETHADEQAALNIARSWLFLRSQEYKKYQTNKTTGNTDKRAFVETWQSFYRKKLKEVWKPAV*
Figure BDA0003199786810000591
Figure BDA0003199786810000601
Figure BDA0003199786810000611
Figure BDA0003199786810000621
Figure BDA0003199786810000631
Figure BDA0003199786810000641
Figure BDA0003199786810000651
Figure BDA0003199786810000661
Figure BDA0003199786810000671
Figure BDA0003199786810000681
Figure BDA0003199786810000691
Figure BDA0003199786810000701
Figure BDA0003199786810000711
Figure BDA0003199786810000721
Figure BDA0003199786810000731
Figure BDA0003199786810000741
序列表
<110> 北京大学
<120> 融合蛋白以及其使用方法
<130> C21P8872
<160> 94
<170> PatentIn version 3.5
<210> 1
<211> 236
<212> PRT
<213> 智人
<400> 1
Met Ser Glu Ala Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu
1 5 10 15
Ala Thr Gly Leu Pro Ser Val Glu Pro Glu Ile Ala Glu Leu Ser Leu
20 25 30
Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu His Asp Glu Ser
35 40 45
Gly Ala Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met
50 55 60
Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu
65 70 75 80
Ser Ser Glu Gly Leu Ala Arg Cys Arg Lys Ala Gly Phe Asp Gly Ala
85 90 95
Val Val Arg Thr Leu Gln Ala Phe Leu Ser Arg Gln Ala Gly Pro Ile
100 105 110
Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys
115 120 125
Ala Glu Leu Arg Arg Leu Gly Ala Arg Leu Pro Arg Asp Thr Val Cys
130 135 140
Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His
145 150 155 160
Gly Thr Ala Ala Ala Gly Ala Gln Gly Tyr Ser Leu Gly Ser Leu Phe
165 170 175
His Arg Tyr Phe Arg Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly
180 185 190
Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Ala Glu Leu
195 200 205
Leu Ala Trp Ala Asp Glu Gln Ala Arg Gly Trp Ala His Ile Glu Pro
210 215 220
Met Tyr Leu Pro Pro Asp Asp Pro Ser Leu Glu Ala
225 230 235
<210> 2
<211> 1423
<212> PRT
<213> 人工序列
<220>
<223> cas9
<400> 2
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1415 1420
<210> 3
<211> 1664
<212> PRT
<213> 人工序列
<220>
<223> Cas9TX
<400> 3
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Gly Gly Gly Ser
1415 1420 1425
Met Ser Glu Ala Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu
1430 1435 1440
Glu Ala Thr Gly Leu Pro Ser Val Glu Pro Glu Ile Ala Glu Leu
1445 1450 1455
Ser Leu Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu His
1460 1465 1470
Asp Glu Ser Gly Ala Leu Val Leu Pro Arg Val Leu Asp Lys Leu
1475 1480 1485
Thr Leu Cys Met Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser
1490 1495 1500
Glu Ile Thr Gly Leu Ser Ser Glu Gly Leu Ala Arg Cys Arg Lys
1505 1510 1515
Ala Gly Phe Asp Gly Ala Val Val Arg Thr Leu Gln Ala Phe Leu
1520 1525 1530
Ser Arg Gln Ala Gly Pro Ile Cys Leu Val Ala His Asn Gly Phe
1535 1540 1545
Asp Tyr Asp Phe Pro Leu Leu Cys Ala Glu Leu Arg Arg Leu Gly
1550 1555 1560
Ala Arg Leu Pro Arg Asp Thr Val Cys Leu Asp Thr Leu Pro Ala
1565 1570 1575
Leu Arg Gly Leu Asp Arg Ala His Ser His Gly Thr Ala Ala Ala
1580 1585 1590
Gly Ala Gln Gly Tyr Ser Leu Gly Ser Leu Phe His Arg Tyr Phe
1595 1600 1605
Arg Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly Asp Val His
1610 1615 1620
Thr Leu Leu Leu Ile Phe Leu His Arg Ala Ala Glu Leu Leu Ala
1625 1630 1635
Trp Ala Asp Glu Gln Ala Arg Gly Trp Ala His Ile Glu Pro Met
1640 1645 1650
Tyr Leu Pro Pro Asp Asp Pro Ser Leu Glu Ala
1655 1660
<210> 4
<211> 711
<212> DNA
<213> 智人
<400> 4
atgtccgagg caccccgggc cgagaccttt gtgttcctgg acctggaagc cactgggctc 60
cccagtgtgg agcccgagat tgccgagctg tccctctttg ctgtccaccg ctcctccctg 120
gagaacccgg agcacgacga gtctggtgcc ctagtattgc cccgggtcct ggacaagctc 180
acgctgtgca tgtgcccgga gcgccccttc actgccaagg ccagcgagat caccggcctg 240
agcagtgagg gcctggcgcg atgccggaag gctggctttg atggcgccgt ggtgcggacg 300
ctgcaggcct tcctgagccg ccaggcaggg cccatctgcc ttgtggccca caatggcttt 360
gattatgatt tccccctgct gtgtgccgag ctgcggcgcc tgggtgctcg cctgcctcgg 420
gacactgtct gcctggacac gctgccagcc ctgcggggcc tggaccgcgc ccacagccac 480
ggcacagccg ctgccggcgc ccagggttac agcctcggca gcctcttcca ccgctacttc 540
cgggcagagc caagcgcagc ccactcagcc gagggcgacg tgcacaccct gctcctgatc 600
ttcctgcacc gcgccgcaga gctgctcgcc tgggccgatg agcaggcccg tgggtgggcc 660
cacatcgagc ccatgtactt gccgcctgat gaccccagcc tggaggccta a 711
<210> 5
<211> 4272
<212> DNA
<213> 人工序列
<220>
<223> Cas9
<400> 5
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260
aagaaaaagt aa 4272
<210> 6
<211> 4995
<212> DNA
<213> 人工序列
<220>
<223> Cas9TX
<400> 6
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260
aagaaaaagg gaggaggcgg cagcatgtcc gaggcacccc gggccgagac ctttgtgttc 4320
ctggacctgg aagccactgg gctccccagt gtggagcccg agattgccga gctgtccctc 4380
tttgctgtcc accgctcctc cctggagaac ccggagcacg acgagtctgg tgccctagta 4440
ttgccccggg tcctggacaa gctcacgctg tgcatgtgcc cggagcgccc cttcactgcc 4500
aaggccagcg agatcaccgg cctgagcagt gagggcctgg cgcgatgccg gaaggctggc 4560
tttgatggcg ccgtggtgcg gacgctgcag gccttcctga gccgccaggc agggcccatc 4620
tgccttgtgg cccacaatgg ctttgattat gatttccccc tgctgtgtgc cgagctgcgg 4680
cgcctgggtg ctcgcctgcc tcgggacact gtctgcctgg acacgctgcc agccctgcgg 4740
ggcctggacc gcgcccacag ccacggcaca gccgctgccg gcgcccaggg ttacagcctc 4800
ggcagcctct tccaccgcta cttccgggca gagccaagcg cagcccactc agccgagggc 4860
gacgtgcaca ccctgctcct gatcttcctg caccgcgccg cagagctgct cgcctgggcc 4920
gatgagcagg cccgtgggtg ggcccacatc gagcccatgt acttgccgcc tgatgacccc 4980
agcctggagg cctaa 4995
<210> 7
<211> 711
<212> DNA
<213> 智人
<400> 7
atgtccgagg caccccgggc cgagaccttt gtgttcctgg acctggaagc cactgggctc 60
cccagtgtgg agcccgagat tgccgagctg tccctctttg ctgtccaccg ctcctccctg 120
gagaacccgg agcacgacga gtctggtgcc ctagtattgc cccgggtcct ggacaagctc 180
acgctgtgca tgtgcccgga gcgccccttc actgccaagg ccagcgagat caccggcctg 240
agcagtgagg gcctggcgcg atgccggaag gctggctttg atggcgccgt ggtgcggacg 300
ctgcaggcct tcctgagccg ccaggcaggg cccatctgcc ttgtggccca caatggcttt 360
gattatgatt tccccctgct gtgtgccgag ctgcggcgcc tgggtgctcg cctgcctcgg 420
gacactgtct gcctggacac gctgccagcc ctgcggggcc tggaccgcgc ccacagccac 480
ggcacacgag ctagaggcag acagggttac agcctcggca gcctcttcca ccgctacttc 540
cgggcagagc caagcgcagc ccactcagcc gagggcgacg tgcacaccct gctcctgatc 600
ttcctgcacc gcgccgcaga gctgctcgcc tgggccgatg agcaggcccg tgggtgggcc 660
cacatcgagc ccatgtactt gccgcctgat gaccccagcc tggaggccta a 711
<210> 8
<211> 236
<212> PRT
<213> 智人
<400> 8
Met Ser Glu Ala Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu
1 5 10 15
Ala Thr Gly Leu Pro Ser Val Glu Pro Glu Ile Ala Glu Leu Ser Leu
20 25 30
Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu His Asp Glu Ser
35 40 45
Gly Ala Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met
50 55 60
Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu
65 70 75 80
Ser Ser Glu Gly Leu Ala Arg Cys Arg Lys Ala Gly Phe Asp Gly Ala
85 90 95
Val Val Arg Thr Leu Gln Ala Phe Leu Ser Arg Gln Ala Gly Pro Ile
100 105 110
Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys
115 120 125
Ala Glu Leu Arg Arg Leu Gly Ala Arg Leu Pro Arg Asp Thr Val Cys
130 135 140
Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His
145 150 155 160
Gly Thr Arg Ala Arg Gly Arg Gln Gly Tyr Ser Leu Gly Ser Leu Phe
165 170 175
His Arg Tyr Phe Arg Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly
180 185 190
Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Ala Glu Leu
195 200 205
Leu Ala Trp Ala Asp Glu Gln Ala Arg Gly Trp Ala His Ile Glu Pro
210 215 220
Met Tyr Leu Pro Pro Asp Asp Pro Ser Leu Glu Ala
225 230 235
<210> 9
<211> 711
<212> DNA
<213> 智人
<400> 9
atgtccgagg caccccgggc cgagaccttt gtgttcctgg acctggaagc cactgggctc 60
cccagtgtgg agcccgagat tgccgagctg tccctctttg ctgtccaccg ctcctccctg 120
gagaacccgg agcacgacga gtctggtgcc ctagtattgc cccgggtcct ggacaagctc 180
acgctgtgca tgtgcccgga gcgccccttc actgccaagg ccagcgagat caccggcctg 240
agcagtgagg gcctggcgcg atgccggaag gctggctttg atggcgccgt ggtgcggacg 300
ctgcaggcct tcctgagccg ccaggcaggg cccatctgcc ttgtggccca caatggcttt 360
gattatgatt tccccctgct gtgtgccgag ctgcggcgcc tgggtgctcg cctgcctcgg 420
gacactgtct gcctggacac gctgccagcc ctgcggggcc tggaccgcgc ccacagccac 480
ggcacacgag ctagaggcag acagggttac agcctcggca gcctcttcca ccgctacttc 540
cgggcagagc caagcgcagc cgcctcagcc gagggcgacg tgcacaccct gctcctgatc 600
ttcctgcacc gcgccgcaga gctgctcgcc tgggccgatg agcaggcccg tgggtgggcc 660
cacatcgagc ccatgtactt gccgcctgat gaccccagcc tggaggccta a 711
<210> 10
<211> 236
<212> PRT
<213> 智人
<400> 10
Met Ser Glu Ala Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu
1 5 10 15
Ala Thr Gly Leu Pro Ser Val Glu Pro Glu Ile Ala Glu Leu Ser Leu
20 25 30
Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu His Asp Glu Ser
35 40 45
Gly Ala Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met
50 55 60
Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu
65 70 75 80
Ser Ser Glu Gly Leu Ala Arg Cys Arg Lys Ala Gly Phe Asp Gly Ala
85 90 95
Val Val Arg Thr Leu Gln Ala Phe Leu Ser Arg Gln Ala Gly Pro Ile
100 105 110
Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys
115 120 125
Ala Glu Leu Arg Arg Leu Gly Ala Arg Leu Pro Arg Asp Thr Val Cys
130 135 140
Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His
145 150 155 160
Gly Thr Arg Ala Arg Gly Arg Gln Gly Tyr Ser Leu Gly Ser Leu Phe
165 170 175
His Arg Tyr Phe Arg Ala Glu Pro Ser Ala Ala Ala Ser Ala Glu Gly
180 185 190
Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Ala Glu Leu
195 200 205
Leu Ala Trp Ala Asp Glu Gln Ala Arg Gly Trp Ala His Ile Glu Pro
210 215 220
Met Tyr Leu Pro Pro Asp Asp Pro Ser Leu Glu Ala
225 230 235
<210> 11
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
gtgtcacaaa gtaaggattc tg 22
<210> 12
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
ctagtcttgt ctgctacctg gatc 24
<210> 13
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
gcaccctccc ttcaacctga cctgggac 28
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
ttctgatgtg tatatcacag 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 15
gagaaggcgg cactctggtg 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 16
gctcacctcc gcctgagcag 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
aggactgctg gagattgctc 20
<210> 18
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
tatgtgggtg ctgaatttca tc 22
<210> 19
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
cctgagaaca atgaaaacaa gtc 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 20
tatcaatatc ccactgatgt atc 23
<210> 21
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 21
gcccgcactg aatgcacttg ggagggtg 28
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
gcaggaacac agatgatggc 20
<210> 23
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
gagaggcctc gttaggagct ctcctttg 28
<210> 24
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 24
ctgaattaaa cagtaccatg ttc 23
<210> 25
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
ggtgactcac ttgggaatcg ggaaggtg 28
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
cctcagaata ggagagagtg 20
<210> 27
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 27
gccttgtatt tgtacagcat taatctgg 28
<210> 28
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 28
ggaggaacaa gaagatgagg aag 23
<210> 29
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 29
ttgcgactct cagctgaatc cactgctg 28
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 30
tgctcccatg gcatcatgac 20
<210> 31
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 31
cccatcaggc tctcagctca gcctgagtgt tgag 34
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 32
cccaggtgaa ggtgtggttc 20
<210> 33
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 33
tctgggtcga ggggcgagat g 21
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
gggttgcggg aggtgtagcg 20
<210> 35
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 35
acgcccttgg aggttaatcc tc 22
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 36
tcccaggtcc gagacggtcc 20
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 37
caagcccagc gacagccgct g 21
<210> 38
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 38
tccttgactc tggcaactgg g 21
<210> 39
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 39
cctgccgtgt accagctgag agactc 26
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 40
aggccccact cacctgctct 20
<210> 41
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 41
cacacggcat ggcatacaaa ttatttc 27
<210> 42
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 42
ctgggcaaac ggccaccgat g 21
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 43
gtgtaccagc tgagagactc 20
<210> 44
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 44
ggcatagcca atccattcag tgatc 25
<210> 45
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 45
tttagcattt actcaaaagt ccacaatcca 30
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 46
tggtggcaat ggataaggcc 20
<210> 47
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 47
aactgtgcta gacatgaggt acttcatgtc ttgcatctgg gtca 44
<210> 48
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 48
aactgtgcta gacatgaggt ctaaggagat cattttggag ttttaagatc 50
<210> 49
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> RAG1A sgRNA序列
<400> 49
gcctctttcc cacccacctt ggg 23
<210> 50
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> RAG1B sgRNA序列
<400> 50
gacttgtttt cattgttctc agg 23
<210> 51
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> RAG1C
<400> 51
gcacctaaca tgatatatta agg 23
<210> 52
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> DNMT1
<400> 52
ttcccggcag atgtttacct tgg 23
<210> 53
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> DNMT2
<400> 53
ccctgcagtt ccctaactga ggg 23
<210> 54
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> C-MYC1
<400> 54
gcttggctat gggaatagaa agg 23
<210> 55
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> C-MYC2
<400> 55
gagtctggat caccttctgc tgg 23
<210> 56
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> C-MYC3
<400> 56
gtacatgcag ttctgcatct tgg 23
<210> 57
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> EMX1
<400> 57
gagtccgagc agaagaagaa ggg 23
<210> 58
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> HBA1
<400> 58
gtgcagagaa gagggtcagt ggg 23
<210> 59
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> PTEN
<400> 59
ggtgagtagc tggttcccgt ggg 23
<210> 60
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> TP53
<400> 60
gaccattact cagctctgag ggg 23
<210> 61
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> TRAC
<400> 61
tgtgctagac atgaggtcta tgg 23
<210> 62
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> TRBC
<400> 62
ggagaatgac gagtggaccc agg 23
<210> 63
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> PDCD1
<400> 63
ggcgccctgg ccagtcgtct ggg 23
<210> 64
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> BCL11A
<400> 64
tttatcacag gctccaggaa ggg 23
<210> 65
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> T2A接头
<400> 65
gagggcagag gaagtctgct aacatgcggt gacgtcgagg agaatcctgg ccca 54
<210> 66
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> T2A接头
<400> 66
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 67
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT1序列
<400> 67
tcctcctccc cacccacctt cag 23
<210> 68
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT1序列
<400> 68
tccttgtttt cattgttctc tgg 23
<210> 69
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT1
<400> 69
ttcatggcag atgtttacct ggg 23
<210> 70
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT1
<400> 70
ggggtgtgga gcttgactat gag 23
<210> 71
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT2
<400> 71
acgtcttccc cacccacctg ggg 23
<210> 72
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT2
<400> 72
catttgtttt cattgttctc tgg 23
<210> 73
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT2
<400> 73
gtccaggcag aagtttacct ggg 23
<210> 74
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT2
<400> 74
aggatgaaga gattggctat ggg 23
<210> 75
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT3
<400> 75
ccctccttcc cacccacttt ggg 23
<210> 76
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT3
<400> 76
gggaagtgga acctggctct ggg 23
<210> 77
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT4
<400> 77
acttccttcc cacccacctt cag 23
<210> 78
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT5
<400> 78
tggatgtgca gcctggctat tgg 23
<210> 79
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT5
<400> 79
tcctcttctc cacccacctc tgg 23
<210> 80
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT6
<400> 80
gcctcttcca cacccaccct ggg 23
<210> 81
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT1
<400> 81
gatgcaagac atgaagtcta agg 23
<210> 82
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT1
<400> 82
agcgcccaag ccagtcgttt agg 23
<210> 83
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT1
<400> 83
agagaatgaa aagtggaccc tgg 23
<210> 84
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT1
<400> 84
cttgagagaa gagggtcagt tgg 23
<210> 85
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT2
<400> 85
aatgttagac atgaggtcta gag 23
<210> 86
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT2
<400> 86
cgggaatgac aagaggaccc agg 23
<210> 87
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT3
<400> 87
gtacagagaa gagagtcagt tgg 23
<210> 88
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> OT3
<400> 88
agtcagagaa gaaggtcagt ggg 23
<210> 89
<211> 978
<212> PRT
<213> Planctomycetes
<400> 89
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 90
<211> 2937
<212> DNA
<213> Planctomycetes
<400> 90
atgcaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 60
aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 120
ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 180
aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 240
atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 300
gctcagcccg ctcctaagaa catcgaccag agaaagctga tccccgtgaa ggacggcaac 360
gagagactga cctctagcgg ctttgcctgc agccagtgtt gccagcctct gtacgtgtac 420
aagctggaac aagtgaacga caagggcaag ccccacacca actacttcgg cagatgcaac 480
gtgtccgagc acgagaggct gatcctgctg tctcctcaca agcccgaggc caacgatgag 540
ctggtcacat acagcctggg caagttcgga cagagagccc tggacttcta cagcatccac 600
gtgaccaggg agagcaatca ccctgtgaag cccctggaac agatcggcgg caatagctgt 660
gcctctggac ctgtgggaaa agccctgagc gacgcctgta tgggagccgt ggcatccttc 720
ctgaccaagt accaggacat catcctggaa caccagaaag tgatcaagaa gaacgagaaa 780
agactggcca acctcaagga tatcgccagc gctaacggcc tggcctttcc taagatcacc 840
ctgcctccac agcctcacac caaagagggc atcgaggcct acaacaacgt ggtggcccag 900
atcgtgattt gggtcaacct gaatctgtgg cagaagctga agatcggcag ggacgaagcc 960
aagccactgc agagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 1020
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 1080
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgctgcct 1140
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagttcggc 1200
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 1260
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 1320
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 1380
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 1440
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 1500
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 1560
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 1620
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 1680
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 1740
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 1800
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 1860
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 1920
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg catcgaccgg 1980
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 2040
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 2100
aagcagagga caatccaggc cgccaaagag gtggaacaga gaagagccgg cggatactct 2160
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 2220
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 2280
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 2340
gattggctca cagctaaact ggcctacgag ggactgccca gcaagaccta cctgtccaaa 2400
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 2460
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 2520
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 2580
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 2640
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 2700
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 2760
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 2820
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 2880
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgtaa 2937
<210> 91
<211> 1307
<212> PRT
<213> Acidaminococcus sp.
<400> 91
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 92
<211> 3924
<212> DNA
<213> Acidaminococcus sp.
<400> 92
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttatg agaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcctctggct gggacgtgaa taaggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa ctaa 3924
<210> 93
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 桥式接头
<220>
<221> misc_feature
<222> (22)..(27)
<223> n is a, c, g, 或t
<400> 93
gcgactatag ggcacgcgtg gnnnnnn 27
<210> 94
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 桥式接头
<220>
<221> misc_feature
<222> (17)..(20)
<223> n是a, c, g, 或t
<220>
<221> misc_feature
<222> (22)..(24)
<223> n是a, c, g, 或t
<220>
<221> misc_feature
<222> (26)..(28)
<223> n是a, c, g, 或t
<220>
<221> misc_feature
<222> (30)..(33)
<223> n是a, c, g, 或t
<400> 94
ccacgcgtgc tctacannnn tnnnannntn nnnagatcgg aagagcacac gtctgaactc 60
cagt 64

Claims (17)

1.融合蛋白,该融合蛋白包含第一蛋白和第二蛋白,
其中第一蛋白是Cas蛋白,TALEN或ZFN,第二蛋白是核酸外切酶或者核酸内切酶,其中第一蛋白与第二蛋白直接连接或者通过接头连接;
优选地,所述Cas蛋白选自Cas9蛋白、Cas12a蛋白、Cas12b蛋白或Cas12e蛋白或其变体,所述Cas9蛋白例如SpCas9或SaCas9蛋白,所述Cas12a蛋白例如AsCas12a蛋白,所述Cas12e蛋白例如PlmCas12e;
优选地,所述核酸外切酶选自TREX2蛋白、TREX1蛋白、APE1蛋白、Artemis蛋白、CtIP蛋白、Exo1蛋白、Mre11蛋白、RAD1蛋白、RAD9蛋白、Tp53蛋白、WRN蛋白、外切核酸酶V、T5外切核酸酶或T7外切核酸酶或其变体;
优选地,其中所述接头是柔性接头,例如(G)n、(GGGGS)n、(EAAAK)n、(XP)n或XTEN接头,其中n是大于等于1的整数,X是任何氨基酸,优选丙氨酸、赖氨酸或谷氨酸;
优选地,第一蛋白在融合蛋白的N端或C端;
优选地,TREX2蛋白包含SEQ ID NO.8的氨基酸序列或其中引入R163A、R165A和R167A中一个或多个的氨基酸序列,或者与它们具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
2.根据权利要求1所述的融合蛋白,其中TREX2蛋白包含:
(1)SEQ ID NO.1的氨基酸序列;
(2)SEQ ID NO.1的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.1的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
3.根据权利要求1或2所述的融合蛋白,其中Cas9蛋白包含:
(1)SEQ ID NO.2的氨基酸序列;
(2)SEQ ID NO.2的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.2的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列;或
Cas12e蛋白包含:
(1)SEQ ID NO.89的氨基酸序列;
(2)SEQ ID NO.89的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.89的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列;或
Cas12a蛋白包含:
(1)SEQ ID NO.91的氨基酸序列;
(2)SEQ ID NO.91的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.91的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
4.根据权利要求1-3中任一项所述的融合蛋白,其包含
(1)SEQ ID NO.3的氨基酸序列;
(2)SEQ ID NO.3的氨基酸序列中添加、缺失、取代或插入一个或多个氨基酸残基的氨基酸序列;或
(3)与SEQ ID NO.3的氨基酸序列具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
5.核酸,该核酸编码根据权利要求1-4中任一项所述的融合蛋白。
6.载体,该载体包含根据权利要求5所述的核酸。
7.宿主细胞,该宿主细胞包含根据权利要求6所述的载体。
8.组合物,该组合物包含根据权利要求1-4中任一项所述的融合蛋白和sgRNA,优选地,其中所述组合物是核糖核蛋白复合物,优选是CRISPR-Cas系统,优选是CRISPR-Cas9、CRISPR-Cas12a、CRISPR-Cas12b或者CRISPR-Cas12e系统。
9.一种遗传修饰细胞的方法,所述方法包括将根据权利要求1-4中任一项所述的融合蛋白、根据权利要求5所述的核酸、根据权利要求6所述的载体、根据权利要求8所述的组合物导入细胞的步骤,优选地,其中所述细胞是T细胞、NK细胞或HSC细胞,优选地,其中所述细胞是TCR T细胞或CAR T细胞。
10.一种减少或者消除利用CRSPR-Cas进行基因编辑时产生的染色体结构变异的方法,其包括将权利要求1-4中任一项所述的融合蛋白、权利要求5所述的核酸、权利要求6所述的载体或者权利要求8所述的组合物导入目标细胞的步骤,优选地,其中所述细胞是T细胞或HSC细胞,优选地,其中所述细胞是TCR-T细胞或CAR-T细胞。
11.一种基因编辑方法,其包括将权利要求1-4中任一项所述的融合蛋白、权利要求5所述的核酸、权利要求6所述的载体或者权利要求8所述的组合物导入目标细胞的步骤,优选地,其中所述细胞是T细胞或HSC细胞,优选地,其中所述细胞是TCR-T细胞或CAR-T细胞。
12.权利要求9-11中任一项的方法,其中组合物能够减少或消除基因编辑过程中的染色体结构变异;优选地,所述基因编辑是单基因编辑或多重基因编辑;
优选地,其中基因选自Oct4、MYH7、TRAC、PDCD1、TRBC、UROS、Fzd3、TLX1(HOX11)、TLX3(HOX11L2)、HOXA簇、HAL1、HAL2、LYL1、BHLHB1、LMO1、LMO2、LCK、NOTCH1、CCND2、SIL/TAL1、CALM/AF10、MLL/ENL、MLL/AF6、MLL/AF10、MLL/AFX1、MLL/AF4、NUP214/ABL1、EML1/ABL1、ETV6(TEL)/ABL1、ETV6(TEL)/JAK2、BCR/ABL1、NUP98/RAP1GDS1、B2M、CCR5或VEGFA;
优选地,其中染色体结构变异是染色体易位和/或染色体缺失;优选地,其中染色体缺失是100bp-4Mb的染色体片段缺失;优选地,所述基因编辑通过CRISPR-Cas系统进行,优选地CRISPR-Cas系统是CRISPR-Cas9系统、CRISPR-Cas12a、CRISPR-Cas12b或者CRISPR-Cas12e系统。
13.细胞,其已经通过根据权利要求9-12中任一项所述的方法进行了修饰或基因编辑,优选地,其中所述细胞是T细胞或HSC细胞,优选地,其中所述细胞是TCR T细胞、NK细胞或CAR T细胞。
14.根据权利要求13的细胞在制备药物中的用途,所述药物用于治疗需要该细胞的受试者中的疾病;优选地,其中所述疾病是遗传疾病,例如癌症、自身免疫疾病或眼病,例如,杜氏肌营养不良症、β-地中海贫血、镰状细胞贫血、膀胱癌、髓母细胞瘤、子宫颈癌、乙型肝炎、EBV感染、HIV感染和/或隐孢子虫感染、脉络膜血管增生或黑曚症。
15.根据权利要求1-4中任一项所述的融合蛋白、权利要求5的核酸、权利要求6的载体或根据权利要求8所述的组合物减少或消除基因编辑过程中的染色体结构变异的用途,优选地,其中基因选自Oct4、MYH7、TRAC、PDCD1、TRBC、UROS、Fzd3、TLX1(HOX11)、TLX3(HOX11L2)、HOXA簇、HAL1、HAL2、LYL1、BHLHB1、LMO1、LMO2、LCK、NOTCH1、CCND2、SIL/TAL1、CALM/AF10、MLL/ENL、MLL/AF6、MLL/AF10、MLL/AFX1、MLL/AF4、NUP214/ABL1、EML1/ABL1、ETV6(TEL)/ABL1、ETV6(TEL)/JAK2、BCR/ABL1、NUP98/RAP1GDS1、B2M、CCR5或VEGFA;
优选地,其中染色体结构变异是染色体易位和/或染色体缺失;优选地,其中染色体缺失是100bp-4Mb缺失的染色体片段缺失;优选地,所述基因编辑通过CRISPR-Cas系统,例如CRISPR-Cas9系统、CRISPR-Cas12a、CRISPR-Cas12b或者CRISPR-Cas12e进行;优选地,所述基因编辑是单基因编辑或多重基因编辑。
16.根据权利要求1-4中任一项所述的融合蛋白、权利要求5的核酸、权利要求6的载体或根据权利要求8所述的组合物在保证基因编辑过程中的基因组稳定性、提高CAR-T构建过程中T细胞的基因组稳定性或防止改造的CAR-T细胞发生瘤变中的用途。
17.制备根据权利要求1-4中任一项所述的融合蛋白的方法,其包括:
在适合于培养宿主细胞的条件下培养根据权利要求7所述的宿主细胞;以及
收获根据权利要求1-4中任一项所述的融合蛋白。
CN202110900953.3A 2021-08-06 2021-08-06 融合蛋白以及其使用方法 Pending CN113481184A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110900953.3A CN113481184A (zh) 2021-08-06 2021-08-06 融合蛋白以及其使用方法
PCT/CN2022/110597 WO2023011638A1 (zh) 2021-08-06 2022-08-05 融合蛋白以及其使用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110900953.3A CN113481184A (zh) 2021-08-06 2021-08-06 融合蛋白以及其使用方法

Publications (1)

Publication Number Publication Date
CN113481184A true CN113481184A (zh) 2021-10-08

Family

ID=77944619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110900953.3A Pending CN113481184A (zh) 2021-08-06 2021-08-06 融合蛋白以及其使用方法

Country Status (2)

Country Link
CN (1) CN113481184A (zh)
WO (1) WO2023011638A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114317492A (zh) * 2021-12-06 2022-04-12 北京大学 一种改造的人工核酸酶系统及其应用
CN114958808A (zh) * 2022-06-02 2022-08-30 清华大学 一种小型编辑基因组的CRISPR/Cas系统及其专用的CasX蛋白
WO2023011638A1 (zh) * 2021-08-06 2023-02-09 北京大学 融合蛋白以及其使用方法
WO2023165613A1 (zh) * 2022-03-03 2023-09-07 清华大学 5'→3'核酸外切酶在基因编辑系统中的用途和基因编辑系统及其编辑方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104284669A (zh) * 2012-02-24 2015-01-14 弗雷德哈钦森癌症研究中心 治疗血红蛋白病的组合物和方法
WO2016191684A1 (en) * 2015-05-28 2016-12-01 Finer Mitchell H Genome editing vectors
WO2017053879A1 (en) * 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
CN108136047A (zh) * 2015-05-13 2018-06-08 西雅图儿童医院(Dba西雅图儿童研究所) 提高原代细胞中基于核酸内切酶的基因编辑
CN108472314A (zh) * 2015-07-31 2018-08-31 明尼苏达大学董事会 修饰的细胞和治疗方法
CN109311984A (zh) * 2016-03-11 2019-02-05 蓝鸟生物公司 基因组编辑的免疫效应细胞
CN109415687A (zh) * 2016-04-07 2019-03-01 蓝鸟生物公司 嵌合抗原受体t细胞组合物
WO2019099943A1 (en) * 2017-11-16 2019-05-23 Astrazeneca Ab Compositions and methods for improving the efficacy of cas9-based knock-in strategies
WO2020146290A1 (en) * 2019-01-07 2020-07-16 Crisp-Hr Therapeutics, Inc. A non-toxic cas9 enzyme and application thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10155938B2 (en) * 2015-04-14 2018-12-18 City Of Hope Coexpression of CAS9 and TREX2 for targeted mutagenesis
CN113481184A (zh) * 2021-08-06 2021-10-08 北京大学 融合蛋白以及其使用方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104284669A (zh) * 2012-02-24 2015-01-14 弗雷德哈钦森癌症研究中心 治疗血红蛋白病的组合物和方法
CN108136047A (zh) * 2015-05-13 2018-06-08 西雅图儿童医院(Dba西雅图儿童研究所) 提高原代细胞中基于核酸内切酶的基因编辑
WO2016191684A1 (en) * 2015-05-28 2016-12-01 Finer Mitchell H Genome editing vectors
CN108472314A (zh) * 2015-07-31 2018-08-31 明尼苏达大学董事会 修饰的细胞和治疗方法
WO2017053879A1 (en) * 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
CN109311984A (zh) * 2016-03-11 2019-02-05 蓝鸟生物公司 基因组编辑的免疫效应细胞
CN109415687A (zh) * 2016-04-07 2019-03-01 蓝鸟生物公司 嵌合抗原受体t细胞组合物
WO2019099943A1 (en) * 2017-11-16 2019-05-23 Astrazeneca Ab Compositions and methods for improving the efficacy of cas9-based knock-in strategies
CN111448313A (zh) * 2017-11-16 2020-07-24 阿斯利康(瑞典)有限公司 用于改善基于Cas9的敲入策略的有效性的组合物和方法
WO2020146290A1 (en) * 2019-01-07 2020-07-16 Crisp-Hr Therapeutics, Inc. A non-toxic cas9 enzyme and application thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FELICITY ALLEN等: "Predicting the mutations generated by repair of Cas9-induced double-strand breaks", 《NATURE BIOTECHNOLOGY》 *
JIANHANG YIN等: "Optimizing genome editing strategy by primer-extension-mediated sequencing", 《CELL DISCOVERY》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023011638A1 (zh) * 2021-08-06 2023-02-09 北京大学 融合蛋白以及其使用方法
CN114317492A (zh) * 2021-12-06 2022-04-12 北京大学 一种改造的人工核酸酶系统及其应用
WO2023165613A1 (zh) * 2022-03-03 2023-09-07 清华大学 5'→3'核酸外切酶在基因编辑系统中的用途和基因编辑系统及其编辑方法
CN114958808A (zh) * 2022-06-02 2022-08-30 清华大学 一种小型编辑基因组的CRISPR/Cas系统及其专用的CasX蛋白
CN114958808B (zh) * 2022-06-02 2024-03-26 清华大学 一种小型编辑基因组的CRISPR/Cas系统及其专用的CasX蛋白

Also Published As

Publication number Publication date
WO2023011638A1 (zh) 2023-02-09

Similar Documents

Publication Publication Date Title
US20200123542A1 (en) Rna compositions for genome editing
JP6816133B2 (ja) 改変ヒトt細胞受容体アルファ定常領域遺伝子を含む遺伝子改変細胞
US9757420B2 (en) Gene editing for HIV gene therapy
CN113481184A (zh) 融合蛋白以及其使用方法
JP6976058B2 (ja) 免疫療法のための化学療法薬耐性t細胞を工学的に作製する方法
AU2006272634B2 (en) Targeted integration and expression of exogenous nucleic acid sequences
JP2022153470A (ja) ゲノムdnaを改変するための方法および組成物
WO2020041249A1 (en) Engineered target specific base editors
CN112272704A (zh) 改造的cascade组分和cascade复合体
KR20240005139A (ko) 인간 t 세포 수용체 알파 불변 영역 유전자에 대한 특이성을 갖는 최적화된 조작된 뉴클레아제
AU2021285983A1 (en) Novel OMNI-59, 61, 67, 76, 79, 80, 81, and 82 CRISPR nucleases
EP4384610A2 (en) Novel omni 115, 124, 127, 144-149, 159, 218, 237, 248, 251-253 and 259 crispr nucleases
WO2023091987A2 (en) Omni 263, 264, 266, 268, 269, 271, 274, 275, 276, 278, 279, 280, 281, 283, 284, 286,287, 288, 290, 291, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 307,308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325,326, 327, 329, 330, 331, 332, 333, 334, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345,346, 347, 348, 349, 350, 351, 352, 353, 354, 356, 357, 358, 359, 360, 361, 362, 363, 364,365, 366, 367, 368, 369, 370, 371, 372, 373, 375, 376, 377, 378, 380, 381, 382, 383, 384, 385, and 386 crispr nucleases
EP4232573A1 (en) Novel omni 56, 58, 65, 68, 71, 75, 78, and 84 crispr nucleases
WO2023107946A2 (en) Omni-103 crispr nuclease-rna complexes
WO2022098693A1 (en) Novel omni-50 crispr nuclease-rna complexes
WO2022170199A2 (en) Omni-103 crispr nuclease
WO2024042168A1 (en) Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases
EP4288086A2 (en) Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, and 131-138 crispr nucleases
WO2024042165A2 (en) Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases
CN118234865A (zh) 持久性同种异体修饰免疫细胞及其使用方法
Checketts Nuclease-Mediated Targeted Gene Insertion at the Adenosine Deaminase Locus in Primary Cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination