CN110036107A - TCRα归巢核酸内切酶变体 - Google Patents

TCRα归巢核酸内切酶变体 Download PDF

Info

Publication number
CN110036107A
CN110036107A CN201780074992.4A CN201780074992A CN110036107A CN 110036107 A CN110036107 A CN 110036107A CN 201780074992 A CN201780074992 A CN 201780074992A CN 110036107 A CN110036107 A CN 110036107A
Authority
CN
China
Prior art keywords
leu
lys
gly
val
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780074992.4A
Other languages
English (en)
Inventor
乔丹·贾儒尔
马克·波格森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
2 savinti biology
Original Assignee
Bluebird Bio Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bluebird Bio Inc filed Critical Bluebird Bio Inc
Publication of CN110036107A publication Critical patent/CN110036107A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0646Natural killers cells [NK], NKT cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0647Haematopoietic stem cells; Uncommitted or multipotent progenitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/11Exodeoxyribonucleases producing 5'-phosphomonoesters (3.1.11)
    • C12Y301/11002Exodeoxyribonuclease III (3.1.11.2)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Television Signal Processing For Recording (AREA)
  • Treating Waste Gases (AREA)

Abstract

本公开提供了改进的基因组编辑组合物和编辑TCRα基因的方法。

Description

TCRα归巢核酸内切酶变体
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求2016年10月28日提交的美国临时申请第62/414,266号和2016年10月11日提交的美国临时申请第62/406,689号的权益,其中的每一个都通过全文引用并入本文中。
关于序列表的声明
与本申请相关的序列表以文本格式提供以代替纸质副本,并且在此通过引用并入说明书中。含有序列表的文本文件的名称是BLBD_077_02WO_ST25.txt。所述文本文件为114KB,于2017年10月11日创建,并通过EFS-Web以电子方式提交,与说明书的提交同时进行。
技术领域
本公开涉及改进的基因组编辑多肽和组合物。更具体地,本公开涉及用于编辑人T细胞受体α(TCRα)基因的核酸酶变体和组合物。
背景技术
全球受到癌症困扰的人数在1975年至2000年间翻了一番。癌症是全球发病率和死亡率的第二大原因,其中在2012年,新发病例约为1410万,癌症相关死亡人数达820万。最常见的癌症是乳腺癌、肺和支气管癌、前列腺癌、结肠和直肠癌、膀胱癌、皮肤黑素瘤、非霍奇金淋巴瘤、甲状腺癌、肾和肾盂癌、子宫内膜癌、白血病和胰腺癌。预计未来二十年内新发癌症病例的数量将增加到2200万。
免疫系统在检测和对抗人类癌症方面具有关键作用。大多数转化细胞很快被免疫哨兵检测到,并通过经由克隆表达的T细胞受体(TCR)对抗原特异性T细胞进行活化而被破坏。因此,癌症可以被认为是免疫病症,免疫系统无法发挥必要的抗肿瘤反应以持久地抑制和消除所述疾病。为了更有效地对抗癌症,在过去几十年中开发的某些免疫疗法干预特别关注于增强T细胞免疫性。这些治疗仅产生了零星的疾病缓解病例,并没有取得实质性的全面成功。
最近,已经在早期临床试验中研究和测试了基于T细胞的分离、修饰、扩增和重新输注的过继性细胞免疫疗法策略。由于其选择性识别和强大的效应机制,T细胞通常是癌症免疫疗法的选择效应细胞。这些治疗表现出不同的成功率,但有少数患者经历了持久的缓解,从而突出了基于T细胞的免疫疗法尚未实现的潜力。
因此,需要更有效、靶向、更安全和持久的疗法来治疗各种形式的癌症和其它免疫病症。此外,需要能够以高效率精确且可再现地破坏内源性TCR基因的方法和组合物。当今对大多数癌症的护理标准在一些或所有这些标准中都不尽如人意。
发明内容
本公开一般部分地涉及切割人TCRα基因的外显子1中的靶位点的归巢核酸内切酶(HE)变体和megaTAL,包括HE变体和megaTAL的组合物及其使用方法。
在各个实施例中,本公开部分地考虑了一种包括I-OnuI归巢核酸内切酶(HE)变体的多肽,所述I-OnuI归巢核酸内切酶变体切割人T细胞受体α(TCRα)基因中的靶位点,其中所述变体包括氨基酸取代:SEQ ID NO:1-5中任一个或其生物活性片段的L26I、R28D、N32R、K34N、S35E、V37N、G38R、S40R、E42S、G44R、V68K、A70T、G73S、N75R、S78M、K80R、L138M、T143N、S159P、S176A、C180H、F182G、I186K、S188V、S190G、K191T、L192A、G193K、Q195Y、Q197G、V199R、S201A、T203S、K207R、Y223S、K225R、S233R、D236E和V238E。
在各个实施例中,本公开部分地涵盖考虑了一种包括I-OnuI归巢核酸内切酶(HE)变体的多肽,所述I-OnuI归巢核酸内切酶变体切割人T细胞受体α(TCRα)基因中的靶位点,其中所述变体包括氨基酸取代:SEQ ID NO:1-5中任一个或其生物活性片段的L26I、R28D、N32R、K34N、S35E、V37N、G38R、S40R、E42S、G44R、V68K、A70T、G73S、N75R、S78M、K80R、L138M、T143N、S159P、S176A、E178D、C180H、F182G、I186K、S188V、S190G、K191T、L192A、G193K、Q195Y、Q197G、V199R、S201A、T203S、K207R、Y223S、K225R、S233R、D236E和V238E。
在特定实施例中,与相应的野生型I-OnuI HE相比,生物活性片段缺少1个、2个、3个、4个、5个、6个、7个或8个N-末端氨基酸。
在某些实施例中,与相应的野生型I-OnuI HE相比,生物活性片段缺少4个N-末端氨基酸。
在另外的实施例中,与相应的野生型I-OnuI HE相比,生物活性片段缺少8个N-末端氨基酸。
在一些实施例中,与相应的野生型I-OnuI HE相比,生物活性片段缺少1个、2个、3个、4个或5个C-末端氨基酸。
在另外的实施例中,与相应的野生型I-OnuI HE相比,生物活性片段缺少C-末端氨基酸。
在特定实施例中,与相应的野生型I-OnuI HE相比,生物活性片段缺少2个C-末端氨基酸。
在特定实施例中,I-OnuI HE变体包括与SEQ ID NO:7-8中任一个所示的氨基酸序列或其生物活性片段具有至少99%同一性的氨基酸序列。
在另外的实施例中,HE变体包括SEQ ID NO:7所示的氨基酸序列或其生物活性片段。
在某些实施例中,HE变体包括SEQ ID NO:8所示的氨基酸序列或其生物活性片段。
在一些实施例中,多肽结合SEQ ID NO:17所示的多核苷酸序列。
在特定实施例中,多肽进一步包括DNA结合结构域。
在另外的实施例中,DNA结合结构域选自由以下组成的组:TALE DNA结合结构域和锌指DNA结合结构域。
在另外的实施例中,TALE DNA结合结构域包括约9.5个TALE重复单元、约10.5个TALE重复单元、约11.5个TALE重复单元、约12.5个TALE重复单元、约13.5个TALE重复单元、约14.5个TALE重复单元或约15.5个TALE重复单元。
在一些实施例中,TALE DNA结合结构域包括11.5个TALE重复单元并结合SEQ IDNO:19所示的多核苷酸序列。
在特定实施例中,TALE DNA结合结构域包括10.5个TALE重复单元并结合SEQ IDNO:18所示的多核苷酸序列。
在某些实施例中,多肽结合并切割SEQ ID NO:20所示的多核苷酸序列。
在特定实施例中,锌指DNA结合结构域包括2个、3个、4个、5个、6个、7个或8个锌指基序。
在另外的实施例中,多肽进一步包括肽连接子和末端加工酶或其生物活性片段。
在特定实施例中,多肽进一步包括病毒自切割2A肽和末端加工酶或其生物活性片段。
在一些实施例中,末端加工酶或其生物活性片段具有5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶、5'瓣状核酸内切酶、解旋酶或模板非依赖性DNA聚合酶活性。
在另外的实施例中,末端加工酶包括Trex2或其生物活性片段。
在特定实施例中,多肽包括SEQ ID NO:10到12中任一个所示的氨基酸序列或其生物活性片段。
在某些实施例中,多肽包括SEQ ID NO:10所示的氨基酸序列或其生物活性片段。
在另外的实施例中,多肽包括SEQ ID NO:11所示的氨基酸序列或其生物活性片段。
在特定实施例中,多肽包括SEQ ID NO:12所示的氨基酸序列或其生物活性片段。
在各个实施例中,提供了一种编码本文考虑的多肽的多核苷酸。
在特定实施例中,本公开部分地考虑了一种编码本文考虑的多肽的mRNA。
在特定实施例中,mRNA包括SEQ ID NO:16-19中任一个所示的序列。
在一些实施例中,提供了一种编码本文考虑的多肽的cDNA。
在某些实施例中,提供了一种包括编码本文考虑的多肽的多核苷酸的载体。
在特定实施例中,提供了一种包括本文考虑的多肽的细胞。
在另外的实施例中,提供了一种包括编码本文考虑的多肽的多核苷酸的细胞。
在另外的实施例中,提供了一种包括本文考虑的载体的细胞。
在特定实施例中,提供了一种由本文考虑的多肽编辑的细胞。
在特定实施例中,细胞是造血细胞。
在一些实施例中,细胞是T细胞。
在某些实施例中,细胞是CD3+、CD4+和/或CD8+细胞。
在特定实施例中,细胞是免疫效应细胞。
在另外的实施例中,细胞是细胞毒性T淋巴细胞(CTL)、肿瘤浸润淋巴细胞(TIL)或辅助T细胞。
在某些实施例中,细胞是自然杀伤(NK)细胞或自然杀伤T(NKT)细胞。
在特定实施例中,细胞的来源是外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、来自感染部位的组织、腹水、胸腔积液、脾脏组织或肿瘤。
附图说明
图1示出了被设计以靶向TCRα基因恒定区的外显子1中的位点的I-OnuI HE变体的靶上和脱靶位点(SEQ ID NO:17和21)的比较。
图2示出了将从对“CCG”三核苷酸序列(SEQ ID NO:17和67)具有高度选择性的模块化HE变体获得的一组氨基酸移植到第一代TCRαHE变体(SEQ ID NO:6)中以生成第二代TCRαHE变体(TCRα2.0)的策略的图解。TCRα2.0HE变体在所需的底物位置处保留对“CCG”的高选择性。
图3示出了在底物位置p456处的第一代TCRαHE变体和TCRα2.0HE变体的增强的选择性谱。图(A)示出了64种可能的核苷酸组合的酵母表面展示切割图,图(B)示出了这些活性的热图。
图4示出了使用CD3表面表达作为读数的TCRα基因座处的基因编辑效率的代表性数据。与用TCRα2.0megaTAL(SEQ ID NO:7)处理的T细胞相比,第一代TCRαmegaTAL(A)(SEQID NO:6)示出了人原代T细胞中基因编辑效率的提高。
图5示出了将靶向突变(E178D)导入TCRα2.0megaTAL(B)中以生成TCRα2.1megaTAL(C)(SEQ ID NO:8)恢复了第一代TCRαmegaTAL(A)的靶上切割活性,同时保留了TCRα2.0megaTAL的靶上选择性。
图6使用生物信息学衍生的推定脱靶位点通过酵母表面展示谱分析示出了TCRα2.1megaTAL的选择性的增加。
图7通过由megaTAL处理的原代T细胞的基因组DNA生成的扩增子的深度测序示出了TCRα2.1megaTAL的选择性的增加。
图8示出了将另外的TALE RVD附加到TCRα2.1megaTAL以使TALE重复从10.5个增加至11.5个(A)进一步增加了原代T细胞中的TCRα2.1megaTAL的靶上活性(SEQ ID NO:68和69)(B)。
图9示出了与含有水稻黄单胞菌(X.oryzae)N-末端TAL结构域的第一代TCRαmegaTAL相比,附加衍生自不同黄单胞菌(Xanthomonas)属成员的合理设计的最小N-末端TAL结构域产生相似活性或在一些情况下产生适度的活性增加。
序列标识符的简要说明
SEQ ID NO:1是野生型I-OnuI LAGLIDADG归巢核酸内切酶(LHE)的氨基酸序列。
SEQ ID NO:2是野生型I-OnuI LHE的氨基酸序列。
SEQ ID NO:3是野生型I-OnuI LHE的生物活性片段的氨基酸序列。
SEQ ID NO:4是野生型I-OnuI LHE的生物活性片段的氨基酸序列。
SEQ ID NO:5是野生型I-OnuI LHE的生物活性片段的氨基酸序列。
SEQ ID NO:6是重编程以结合并切割人TCRα基因恒定区的外显子1中的靶位点的I-OnuI LHE变体的氨基酸序列。
SEQ ID NO:7是重编程以结合并切割人TCRα基因恒定区的外显子1中的靶位点的I-OnuI LHE变体的氨基酸序列。
SEQ ID NO:8是重编程以结合并切割人TCRα基因恒定区的外显子1中的靶位点的I-OnuI LHE变体的氨基酸序列。
SEQ ID NO:9是结合并切割人TCRα基因恒定区的外显子1中的靶位点的megaTAL的氨基酸序列。
SEQ ID NO:10是结合并切割人TCRα基因恒定区的外显子1中的靶位点的megaTAL的氨基酸序列。
SEQ ID NO:11是结合并切割人TCRα基因恒定区的外显子1中的靶位点的megaTAL的氨基酸序列。
SEQ ID NO:12是结合并切割人TCRα基因恒定区的外显子1中的靶位点的megaTAL的氨基酸序列。
SEQ ID NO:13是编码结合并切割人TCRα基因恒定区的外显子1中的靶位点的megaTAL的mRNA序列。
SEQ ID NO:14是编码结合并切割人TCRα基因恒定区的外显子1中的靶位点的megaTAL的mRNA序列。
SEQ ID NO:15是编码结合并切割人TCRα基因恒定区的外显子1中的靶位点的megaTAL的mRNA序列。
SEQ ID NO:16是编码结合并切割人TCRα基因恒定区的外显子1中的靶位点的megaTAL的mRNA序列。
SEQ ID NO:17是人TCRα基因恒定区的外显子1中的I-OnuI LHE变体靶位点。
SEQ ID NO:18是人TCRα基因恒定区的外显子1中的10.5RVD TALE DNA结合结构域靶位点。
SEQ ID NO:19是人TCRα基因恒定区的外显子1中的11.5RVD TALE DNA结合结构域靶位点。
SEQ ID NO:20是人TCRα基因恒定区的外显子1中的megaTAL靶位点。
SEQ ID NO:21是针对靶向SEQ ID NO:17的TCRα核酸酶的人KAT2B基因中的脱靶位点。
SEQ ID NO:22-24是编码NTD变体megaTAL的氨基酸序列。
SEQ ID NO:25-27是编码NTD变体megaTAL的mRNA序列。
SEQ ID NO:28是编码鼠Trex2的氨基酸序列。
SEQ ID NO:29是编码鼠Trex2的mRNA序列。
SEQ ID NO:30-40列出了各种连接子的氨基酸序列。
SEQ ID NO:41-65列出了蛋白酶切割位点和自切割多肽切割位点的氨基酸序列。
在前述序列中,X(如果存在的话)是指任何氨基酸或氨基酸的缺失。
具体实施方式
A.概述
本公开一般部分地涉及改进的基因组编辑组合物及其使用方法。与现有的基于细胞的免疫疗法相比,基因组编辑的免疫效应细胞提供了许多优点,包含但不限于由于降低不期望的自身免疫反应的风险而提高安全性,利用更可预测的治疗性基因表达进行的精确靶向治疗,肿瘤微环境中的耐久性提高的和效力提高。不希望受任何特定理论的束缚,各个实施例中考虑的基因组编辑组合物包括靶向T细胞受体α(TCRα)基因的归巢核酸内切酶和megaTAL,其被改造以提高安全性并增加靶位点特异性、选择性和催化活性。
在特定实施例中,一个或多个TCRα等位基因的修饰消除或基本上消除TCRα等位基因的表达,减少TCRα等位基因的表达,和/或损害,基本上损害或消除TCRα等位基因的一个或多个功能或使TCRα等位基因无功能。在特定实施例中,TCRα功能包含但不限于将CD3募集到细胞表面、抗原的MHC依赖性识别和结合、TCRαβ信号转导的活化。
在各个实施例中考虑的基因组编辑组合物和方法包括核酸酶变体,其被设计以结合并切割人T细胞受体α(TCRα)基因中的靶位点。特定实施例中考虑的核酸酶变体可以用于将双链断裂导入靶多核苷酸序列中,其可以在不存在多核苷酸模板(例如,供体修复模板)的情况下通过非同源末端连接(NHEJ)修复,或在存在供体修复模板的情况下通过同源定向修复(HDR)(即,同源重组)修复。在某些实施例中考虑的核酸酶变体也可以被设计成切口酶,这生成单链DNA断裂,其可以在存在供体修复模板的情况下使用细胞的碱基切除修复(BER)机制或同源重组来修复。NHEJ是一个容易出错的过程,经常形成小的插入和缺失,这会破坏基因功能。同源重组需要同源DNA作为修复的模板,并且可以利用同源重组产生无限多个修饰,这些修饰通过将在靶位点处含有所需序列的供体DNA导入以靶位点为侧翼的区域来指定,所述靶位点位于具有同源性的序列的任一侧的侧翼。
在一个优选实施例中,本文考虑的基因组编辑组合物包括靶向人TCRα基因的归巢核酸内切酶变体或megaTAL。
在各个实施例中,与靶向TCRα基因的现有归巢核酸内切酶或megaTAL相比,本文考虑的靶向归巢核酸内切酶变体或megaTAL的TCRα基因具有增加的对靶位点的结合位点选择性或特异性。
在各个实施例中,与靶向TCRα基因的现有归巢核酸内切酶或megaTAL相比,本文考虑的靶向归巢核酸内切酶变体或megaTAL的TCRα基因具有改进的对靶位点的结合位点选择性或特异性,同时保留高催化活性。
在一个优选实施例中,本文考虑的基因组编辑组合物包括归巢核酸内切酶变体或megaTAL和末端加工酶,例如Trex2。
除非特别相反地指出,否则特定实施例的实践将采用本领域技术范围内的化学、生物化学、有机化学、分子生物学、微生物学、重组DNA技术、遗传学、免疫学和细胞生物学的常规方法。为了说明的目的,下面描述了这些常规方法中的许多常规方法。这些技术在文献中有充分说明。参见例如Sambrook等人,《分子克隆:实验手册(Molecular Cloning:ALaboratory Manual)》(第3版,2001年);Sambrook等人,《分子克隆:实验手册(MolecularCloning:A Laboratory Manual)》(第2版,1989年);Maniatis等人,《分子克隆:实验手册(Molecular Cloning:A Laboratory Manual)》(1982年);Ausubel等人,《现代分子生物学实验指南(Current Protocols in Molecular Biology)》(John Wiley and Sons,2008年7月更新);《精编分子生物学实验指南:现代分子生物学实验指南的方法纲要(ShortProtocols in Molecular Biology:A Compendium of Methods from Current Protocolsin Molecular Biology)》,Greene Pub.Associates and Wiley-Interscience;Glover,《DNA克隆:实用方法(DNA Cloning:A Practical Approach)》,第I卷和第II卷(IRL出版社,牛津,1985年);Anand,《复杂基因组分析技术(Techniques for the Analysis of ComplexGenomes)》(学术出版社,纽约,1992年);《转录和翻译(Transcription and Translation)》(B.Hames和S.Higgins编辑,1984年);Perbal,《分子克隆实用指南(A Practical Guide toMolecular Cloning)》(1984年);Harlow和Lane,《抗体(Antibodies)》,(冷泉港实验室出版社,冷泉港,纽约,1998年),《现代免疫学实验指南(Current Protocols in Immunology)》,Q.E.Coligan,A.M.Kruisbeek,D.H.Margulies,E.M.Shevach和W.Strober编辑,1991年);《免疫学年鉴(Annual Review of Immunology)》;以及《免疫学进展(Advances inImmunology)》等期刊上的专著。
B.定义
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文描述的那些类似或等同的任何方法和材料可以用于特定实施例的实践或测试,但是本文描述了组合物、方法和材料的优选实施例。出于本公开的目的,以下术语定义如下。
冠词“一个(a/an)”和“所述(the)”在本文中用于指代冠词的一个或多于一个(即,至少一个,或一个或多个)语法对象。举例来说,“一个元件”表示一个元件或一个或多个元件。
选择连词(例如,“或”)的使用应被理解为表示选择对象中的一者、两者或其任何组合。
术语“和/或”应被理解为表示选择对象中的一者或两者。
如本文使用,术语“约”或“大约”是指相对于参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度变化了多达15%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度。在一个实施例中,术语“约”或“大约”是指参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%或±1%的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度的范围。
在一个实施例中,范围,例如1到5、约1到5或约1到约5,是指所述范围所涵盖的每个数值。例如,在一个非限制性且仅仅是说明性的实施例中,范围“1到5”等同于表达1、2、3、4、5;或1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5或5.0;或1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9或5.0。
如本文使用,术语“基本上”是指为参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度的80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度。在一个实施例中,“基本上相同”是指产生与参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度大致相同的效应(例如,生理效应)的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度。
在整个本说明书中,除非上下文另有要求,否则词语“包括(comprise/comprises/comprising)”将被理解为暗示包含所述一个步骤或元件或一组步骤或元件但不排除任何其它步骤或元件或任何其它一组步骤或元件。“由……组成”表示包含并限于短语“由……组成”之后的任何内容。因此,短语“由……组成”表示所列出的元件是必需的或强制性的,并且不存在其它元件。“基本上由……组成”表示包含在所述短语之后列出的任何元件,并且限于不干扰或有助于本公开中针对所列元件指定的活性或作用的其它元件。因此,短语“基本上由……组成”表示所列元件是必需的或强制性的,但不存在实质上影响所列元件的活性或作用的其它元件。
在整个本说明书中对“一个实施例(one embodiment/an embodiment)”、“一个特定实施例”、“一个相关实施例”、“某个实施例”,“一个另外的实施例(an additionalembodiment/a further embodiment)”或其组合的引用表示结合所述实施例描述的特定特征、结构或特性包含在至少一个实施例中。因此,在整个本说明书中各处出现的前述短语不一定都指同一实施例。此外,特定特征、结构或特性可以在一个或多个实施例中以任何合适的方式组合。还应理解,在一个实施例中对特征的肯定叙述用作在一个特定实施例中排除所述特征的基础。
术语“离体”通常是指在生物体外发生的活动,例如在生物体外的人工环境中在活体组织中或活体组织上进行的实验或测量,优选具有最小的自然条件改变。在特定实施例中,“离体”程序涉及活细胞或活体组织,其取自生物体并在实验室设备中培养或调节,通常在无菌条件下,通常持续数小时或多至约24小时,但包含多至48小时或72小时,视环境而定。在某些实施例中,可以收集并冷冻这些组织或细胞,然后解冻用于离体处理。使用活细胞或活体组织持续长于几天的组织培养实验或程序通常被认为是“体外”,但是在某些实施例中,此术语可与离体互换使用。
术语“体内”通常是指在生物体内发生的活动。在一个实施例中,在体内改造、编辑或修饰细胞基因组。
“增强”或“促进”或“增加”或“扩增”或“增效”通常是指本文考虑的核酸酶变体、基因组编辑组合物或基因组编辑的细胞产生、引发或引起相较于由媒剂或对照引起的反应更大的反应(即,生理反应)的能力。可测量的反应可以包含改造TCR或CAR表达的增加、HR或HDR效率的增加、结合位点选择性的增加、结合位点特异性的增加、靶上结合的增加、免疫效应细胞扩增、活化、持久性的增加、和/或癌细胞死亡杀伤能力的增加,尤其是根据本领域的认识和本文的描述所显而易见的。“增加的”或“增强的”量通常是“统计上显著的”量,并且可以包含由媒剂或对照产生的反应的1.1倍、1.2倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍或更多倍(例如,500倍、1000倍)(包含其间的大于1的所有整数和小数点,例如1.5倍、1.6倍、1.7倍、1.8倍等)的增加。
“降低”或“削减”或“减小”或“减少”或“减轻”或“消除”或“抑制”或“减弱”通常是指本文考虑的核酸酶变体、基因组编辑组合物或基因组编辑的细胞产生、引发或引起相较于由媒剂或对照引起的反应更小的反应(即,生理反应)的能力。可测量的反应可以包含内源性TCR表达或功能的降低、脱靶结合的降低、与免疫效应细胞耗竭相关的生物标志物的表达的降低等。“降低”或“减少的”量通常是“统计上显著的”量,并且可以包含由载剂或对照产生的反应(参考反应)的1.1倍、1.2倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍或更多倍(例如,500倍、1000倍)(包含其间的大于1的所有整数和小数点,例如1.5倍、1.6倍、1.7倍、1.8倍等)的降低。
“维持(maintain/maintenance)”或“保留”或“没有改变”或“没有实质性改变”或“没有实质性降低”通常是指本文考虑的核酸酶变体、基因组编辑组合物或基因组编辑的细胞产生、引发或引起相较于由载剂或对照引起的反应基本上相似或相当的生理反应(即,下游效应)的能力。相当的反应是与参考反应没有显著差异或差异可测量的反应。
术语“特异性结合亲和力”或“特异性结合(specifically binds/specificallybound/specific binding)”或“特异性靶向”描述了一种分子与另一种分子以比本底结合更大的结合亲和力结合,例如多肽的DNA结合结构域结合到DNA。如果结合结构域以某一亲和力或Ka(即,特定结合相互作用的平衡缔合常数,以1/M为单位)(例如,所述亲和力或Ka大于或等于约105M-1)结合到靶位点或与靶位点缔合,则所述结合结构域“特异性结合”到所述靶位点。在某些实施例中,结合结构域以大于或等于约106M-1、107M-1、108M-1、109M-1、1010M-1、1011M-1、1012M-1或1013M-1的Ka结合到靶位点。“高亲和力”结合结构域是指具有至少107M-1、至少108M-1、至少109M-1、至少1010M-1、至少1011M-1、至少1012M-1、至少1013M-1或更大的Ka的那些结合结构域。
可替代地,亲和力可以被定义为以M为单位的特定结合相互作用的平衡解离常数(Kd)(例如,10-5M到10-13M,或更小)。包括用于特定实施例中考虑的DNA靶位点的一个或多个DNA结合结构域的核酸酶变体的亲和力可以使用常规技术(例如,酵母细胞表面展示),或通过结合缔合,或通过使用标记配体的置换测定容易地确定。
在一个实施例中,特异性结合的亲和力比本底结合大约2倍,比本底结合大约5倍,比本底结合大约10倍,比本底结合大约20倍,比本底结合大约50倍,比本底结合大约100倍,或比本底结合大约1000倍或更多。
术语“选择性地结合(selectively binds/selectively bound/selectivelybinding)”或“选择性地靶向”描述了在存在多个脱靶分子的情况下的一个分子与靶分子的优先结合(靶上结合)。在特定实施例中,HE或megaTAL选择性地结合靶上DNA结合位点比HE或megaTAL结合脱靶DNA靶结合位点多约5次、10次、15次、20次、25次、50次、100次或1000次或更频繁的次数。
“靶上”是指靶位点序列。
“脱靶”是指与靶位点序列相似但不相同的序列。
“靶位点”或“靶序列”是染色体或染色体外核酸序列,如果存在足够的结合和/或切割条件,其定义了结合分子将结合到和/或切割的核酸的一部分。当提及的是参考靶位点或靶序列的仅一条链的多核苷酸序列或SEQ ID NO.时,应理解,由核酸酶变体结合和/或切割的靶位点或靶序列是双链的并且包括参考序列及其互补序列。在一个优选实施例中,靶位点是人TCRα基因中的序列。
“基因”是指编码基因产物的DNA区,以及调节基因产物产生的所有DNA区,无论这些调节序列是否与编码和/或转录序列相邻。基因包含但不限于启动子序列、增强子、沉默子、绝缘子、边界元件、终止子、多聚腺苷酸化序列、转录后反应元件、翻译调节序列(例如,核糖体结合位点和内部核糖体进入位点)、复制起点、基质附着位点和基因座控制区。
如本文使用,术语“遗传改造的”或“遗传修饰的”是指额外的遗传物质以DNA或RNA的形式染色体或染色体外加入到细胞中的总遗传物质。遗传修饰可以靶向或非靶向细胞基因组中的特定位点。在一个实施例中,遗传修饰是位点特异性的。在一个实施例中,遗传修饰不是位点特异性的。
如本文使用,术语“基因组编辑”是指遗传物质在细胞基因组中的靶位点的取代、缺失和/或导入,其恢复、校正、破坏和/或修饰基因或基因产物的表达。特定实施例中考虑的基因组编辑包括将一种或多种核酸酶变体导入细胞中以在细胞基因组中的靶位点处或邻近靶位点生成DNA损伤,任选地在存在供体修复模板的情况下。
如本文使用,术语“量”是指足以实现有益或所需的预防或治疗结果(包含临床结果)的核酸酶变体、基因组编辑组合物或基因组编辑的细胞的“有效量(an amounteffective/an effective amount)”。
“预防有效量”是指足以实现所需的预防结果的核酸酶变体、基因组编辑组合物或基因组编辑的细胞的量。通常但非必要地,由于预防剂量是在疾病之前或疾病的早期阶段在受试者中使用,所以预防有效量小于治疗有效量。
核酸酶变体、基因组编辑组合物或基因组编辑的细胞“治疗有效量”可以根据诸如个体的疾病状态、年龄、性别和体重以及引发个体中的期望反应的能力等因素而不同。治疗有效量还是其中治疗有益效果超过任何毒性或有害作用的量。术语“治疗有效量”包含有效“治疗”受试者(例如,患者)的量。当指示治疗量时,医生可以根据说明书并考虑年龄、体重、肿瘤大小、感染或转移程度以及患者(受试者)病状的个体差异来确定待给予的在特定实施例中考虑的组合物的精确量。
C.核酸酶变体
本文特定实施例中考虑的核酸酶变体适合于基因组编辑TCRα基因中的靶位点,并且包括一个或多个DNA结合结构域和一个或多个DNA切割结构域(例如,一个或多个核酸内切酶和/或核酸外切酶结构域),以及任选的本文考虑的一个或多个连接子。术语“重编程的核酸酶”、“改造的核酸酶”或“核酸酶变体”可互换使用,并且是指包括一个或多个DNA结合结构域和一个或多个DNA切割结构域的核酸酶,其中核酸酶已从亲本核酸酶或天然存在的核酸酶设计和/或修饰,以结合并切割人TCRα基因恒定区的外显子1中的双链DNA靶序列。
在特定实施例中,核酸酶变体结合并切割人TCRα基因恒定区的外显子1中,优选人TCRα基因恒定区的外显子1中的SEQ ID NO:17处,更优选人TCRα基因恒定区外显子1中的SEQ ID NO:17中的序列“ATTC”处的靶序列。
可以从天然存在的核酸酶或从先前的核酸酶变体设计和/或修饰核酸酶变体。特定实施例中考虑的核酸酶变体可以进一步包括一个或多个另外的功能结构域,例如,表现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶的末端加工酶结构域。
结合并切割TCRα基因中的靶序列的核酸酶变体的说明性实例包含但不限于归巢核酸内切酶变体(大范围核酸酶变体)和megaTAL。
1.归巢核酸内切酶(大范围核酸酶)变体
在各个实施例中,归巢核酸内切酶或大范围核酸酶被重编程以将双链断裂(DSB)导入TCRα基因中的靶位点中。在特定实施例中,归巢核酸内切酶变体将双链断裂导入人TCRα基因恒定区的外显子1中,优选人TCRα基因恒定区的外显子1中的SEQ ID NO:17处,更优选人TCRα基因恒定区外显子1中的SEQ ID NO:17中的序列“ATTC”处。“归巢核酸内切酶”和“大范围核酸酶”可互换使用,是指识别12-45个碱基对切割位点的天然存在的核酸酶,并且其通常基于序列和结构基序分为五个家族:LAGLIDADG、GIY-YIG、HNH、His-Cys盒和PD-(D/E)XK。
“参考归巢核酸内切酶”或“参考大范围核酸酶”是指野生型归巢核酸内切酶或在自然界中存在的归巢核酸内切酶。在一个实施例中,“参考归巢核酸内切酶”是指经过修饰以增加基础活性的野生型归巢核酸内切酶。
“改造的归巢核酸内切酶”、“重编程的归巢核酸内切酶”、“归巢核酸内切酶变体”、“改造的大范围核酸酶”、“重编程的大范围核酸酶”或“大范围核酸酶变体”是指包括一个或多个DNA结合结构域和一个或多个DNA切割结构域的归巢核酸内切酶,其中归巢核酸内切酶已从亲本归巢核酸内切酶或天然存在的归巢核酸内切酶设计和/或修饰,以结合并切割TCRα基因中的DNA靶序列。可以从天然存在的归巢核酸内切酶或从另一种归巢核酸内切酶变体设计和/或修饰归巢核酸内切酶变体。特定实施例中考虑的归巢核酸内切酶变体可以进一步包括一个或多个另外的功能结构域,例如,表现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶的末端加工酶结构域。
在特定实施例中,本文考虑的归巢核酸内切酶变体包括与现有归巢核酸内切酶相比增加的对靶位点的选择性,例如SEQ ID NO:6。在特定实施例中,本文考虑的归巢核酸内切酶包括与现有的归巢核酸内切酶相比增加的对靶位点的选择性,同时保留了催化活性,例如SEQ ID NO:6。
归巢核酸内切酶(HE)变体在自然界中不存在,并且可以通过重组DNA技术或通过随机诱变获得。HE变体可以通过在天然存在的HE或HE变体中进行一个或多个氨基酸改变(例如,突变、取代、加入或缺失一个或多个氨基酸)来获得。在特定实施例中,HE变体包括DNA识别界面的一个或多个氨基酸改变。
特定实施例中考虑的HE变体可以进一步包括一个或多个连接子和/或另外的功能结构域,例如,表现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶的末端加工酶结构域。在特定实施例中,将HE变体导入具有表现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶的T细胞中。HE变体和3'加工酶可以分开导入,例如,在不同的载体或分开的mRNA中,或者一起导入,例如作为融合蛋白,或在由病毒自切割肽或IRES元件分开的多顺反子构建体中导入。
“DNA识别界面”是指与核酸靶碱基相互作用的HE氨基酸残基以及相邻的那些残基。对于每个HE,DNA识别界面包括侧链到侧链和侧链到DNA接触的广泛网络,其中大多数必须是识别特定核酸靶序列所独有的。因此,对应于特定核酸序列的DNA识别界面的氨基酸序列显著不同,并且是任何天然HE或HE变体的特征。作为非限制性实例,可以通过构建HE变体文库来衍生特定实施例中考虑的HE变体,其中位于天然HE(或先前生成的HE变体)的DNA识别界面中的一个或多个氨基酸残基是各不相同的。可以使用切割测定针对相对于每个预测的TCRα靶位点的靶切割活性来筛选文库(参见例如Jarjour等人,2009年,《核酸研究(Nuc.Acids Res.)》,37(20):6871-6880)。
LAGLIDADG归巢核酸内切酶(LHE)是研究最深入的归巢核酸内切酶家族,主要编码于古细菌和绿藻和真菌中的细胞器DNA中,并显示出最高的整体DNA识别特异性。LHE包括每条蛋白质链的一个或两个LAGLIDADG催化基序,并分别起同二聚体或单链单体的作用。LAGLIDADG蛋白的结构研究标识了高度保守的核心结构(Stoddard,2005年),其特征在于αββαββα折叠,其中LAGLIDADG基序属于此折叠的第一螺旋。LHE的高效和特异性切割代表了蛋白质支架,以衍生新的高度特异性和选择性的核酸内切酶。然而,改造LHE以结合并切割非天然或非规范靶位点需要在靶位点中多达三分之二的碱基对位置处选择合适的LHE支架,检查靶基因座,选择推定靶位点,并广泛改变LHE以改变其DNA接触点和切割特异性。
LHE的说明性实例包含但不限于I-AabMI、I-AaeMI、I-AniI、I-ApaMI、I-CapIII、I-CapIV、I-CkaMI、I-CpaMI、I-CpaMII、I-CpaMIII、I-CpaMIV、I-CpaMV、I-CpaV、I-CraMI、I-EjeMI、I-GpeMI、I-GpiI、I-GzeMI、I-GzeMII、I-GzeMIII、I-HjeMI、I-LtrII、I-LtrI、I-LtrWI、I-MpeMI、I-MveMI、I-NcrII、I-Ncrl、I-NcrMI、I-OheMI、I-OnuI、I-OsoMI、I-OsoMII、I-OsoMIII、I-OsoMIV、I-PanMI、I-PanMII、I-PanMIII、I-PnoMI、I-ScuMI、I-SmaMI、I-SscMI和I-Vdi141I。
在一个实施例中,重编程的LHE或LHE变体是I-OnuI变体。参见例如SEQ ID NO:7-8。
在一个实施例中,靶向TCRα基因的重编程的I-OnuI LHE或I-OnuI变体由天然I-OnuI或其生物活性片段(SEQ ID NO:1-5)生成。在一个优选实施例中,靶向人TCRα基因的重编程的I-OnuI LHE或I-OnuI变体由现有的I-OnuI变体生成。
在一个实施例中,结合并切割人TCRα基因的I-OnuI LHE包括与SEQ ID NO:7或SEQID NO:8所示的I-OnuI LHE变体及其生物活性片段的DNA识别界面至少99%的序列同一性。
在一个特定实施例中,结合并切割人TCRα基因的I-OnuI LHE变体包括SEQ ID NO:7或SEQ ID NO:8所示的I-OnuI、其生物活性片段和/或其另外的变体的DNA识别界面中的一个或多个氨基酸取代或修饰。
在某些实施例中,HE变体切割TCRα外显子1恒定区靶位点并且包括以下氨基酸取代:SEQ ID NO:1-5中任一个或其生物活性片段的L26I、R28D、N32R、K34N、S35E、V37N、G38R、S40R、E42S、G44R、V68K、A70T、G73S、N75R、S78M、K80R、L138M、T143N、S159P、S176A、C180H、F182G、I186K、S188V、S190G、K191T、L192A、G193K、Q195Y、Q197G、V199R、S201A、T203S、K207R、Y223S、K225R、S233R、D236E和V238E。
在某些实施例中,HE变体切割TCRα外显子1恒定区靶位点并且包括以下氨基酸取代:SEQ ID NO:1-5中任一个或其生物活性片段的L26I、R28D、N32R、K34N、S35E、V37N、G38R、S40R、E42S、G44R、V68K、A70T、G73S、N75R、S78M、K80R、L138M、T143N、S159P、S176A、E178D、C180H、F182G、I186K、S188V、S190G、K191T、L192A、G193K、Q195Y、Q197G、V199R、S201A、T203S、K207R、Y223S、K225R、S233R、D236E和V238E。
在特定实施例中,结合并切割人TCRα基因的I-OnuI LHE变体包括与SEQ ID NO:7或SEQ ID NO:8所示的氨基酸序列或其生物活性片段具有至少99%同一性的氨基酸序列。
在特定实施例中,I-OnuI LHE变体包括SEQ ID NO:7-8中任一个所示的氨基酸序列或其生物活性片段。
在特定实施例中,I-OnuI LHE变体包括SEQ ID NO:7所示的氨基酸序列或其生物活性片段。
在特定实施例中,I-OnuI LHE变体包括SEQ ID NO:8所示的氨基酸序列或其生物活性片段。
2.MegaTAL
在各个实施例中,将包括归巢核酸内切酶变体的megaTAL重编程以将双链断裂(DSB)导入人TCRα基因恒定区的外显子1中的靶位点中。在特定实施例中,megaTAL将DSB导入人TCRα基因恒定区的外显子1中,优选人TCRα基因恒定区的外显子1中的SEQ ID NO:17处,更优选人TCRα基因恒定区外显子1中的SEQ ID NO:17中的序列“ATTC”处。“megaTAL”是指包括TALE DNA结合结构域和归巢核酸内切酶变体的多肽,其结合并切割TCRα基因中的DNA靶序列,并且任选地包括一个或多个连接子和/或另外的功能结构域,例如,表现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶或模板非依赖性DNA聚合酶活性的末端加工酶的末端加工酶结构域。
在特定实施例中,可以将megaTAL与表现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶一起导入细胞中。megaTAL和3'加工酶可以分开导入,例如,在不同的载体或分开的mRNA中,或者一起导入,例如作为融合蛋白,或在由病毒自切割肽或IRES元件分开的多顺反子构建体中导入。
“TALE DNA结合结构域”是类转录激活因子效应子(TALE或TAL效应子)的DNA结合部分,其模拟植物转录激活因子以操纵植物转录组(参见例如Kay等人,2007年,《科学(Science)》,318:648-651)。特定实施例中考虑的TALE DNA结合结构域是从头改造的或从天然存在的TALE改造的,所述天然存在的TALE例如来自野油菜黄单胞菌疮痂致病变体(Xanthomonas campestris pv.vesicatoria)、加德纳黄单胞菌(Xanthomonas gardneri)、半透明黄单胞菌(Xanthomonas translucens)、地毯草黄单胞菌(Xanthomonasaxonopodis)、穿孔黄单胞菌(Xanthomonas perforans)、苜蓿黄单胞菌(Xanthomonasalfalfa)、柑橘黄单胞菌(Xanthomonas citri)、易疮痂黄单胞菌(Xanthomonaseuvesicatoria)和水稻黄单胞菌(Xanthomonas oryzae)的AvrBs3以及来自青枯雷尔氏菌(Ralstonia solanacearum)的brg11和hpx17。用于衍生和设计DNA结合结构域的TALE蛋白的说明性实例公开在美国专利第9,017,967号和其中引用的参考文献中,所有这些文献都通过引用整体并入本文。
在特定实施例中,megaTAL包括TALE DNA结合结构域,其包括一个或多个重复单元,所述重复单元参与TALE DNA结合结构域与其相应的靶DNA序列的结合。单个“重复单元”(也被称为“重复”)的长度通常为33-35个氨基酸。每个TALE DNA结合结构域重复单元包含构成重复可变二残基(RVD)的1个或2个DNA结合残基,通常在重复的第12位和/或第13位。已经确定了用于这些TALE DNA结合结构域的DNA识别的天然(规范)密码,使得第12位和第13位的HD序列会结合到胞嘧啶(C),NG结合到T,NI结合到A,NN结合到G或A,并且NG结合到T。在某些实施例中,考虑了非规范(非典型)RVD。
适用于特定实施例中考虑的特定megaTAL的非规范RVD的说明性实例包含但不限于用于识别鸟嘌呤(G)的HH、KH、NH、NK、NQ、RH、RN、SS、NN、SN、KN;用于识别腺嘌呤(A)的NI、KI、RI、HI、SI;用于识别胸腺嘧啶(T)的NG、HG、KG、RG;用于识别胞嘧啶(C)的RD、SD、HD、ND、KD、YG;用于识别A或G的NV、HN;以及用于识别A或T或G或C的H*、HA、KA、N*、NA、NC、NS、RA、S*,其中(*)表示不存在第13位的氨基酸。适用于特定实施例中考虑的特定megaTAL的RVD的另外的说明性实例进一步包含美国专利第8,614,092号中公开的那些,其通过引用整体并入本文。
在特定实施例中,本文考虑的megaTAL包括TALE DNA结合结构域,其包括3到30个重复单元。在某些实施例中,megaTAL包括3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个TALE DNA结合结构域重复单元。在一个优选实施例中,本文考虑的megaTAL包括TALE DNA结合结构域,其包括5-15个重复单元,更优选7-15个重复单元,更优选9-15个重复单元,更优选9个、10个、11个、12个、13个、14个或15个重复单元。
在特定实施例中,本文考虑的megaTAL包括TALE DNA结合结构域和另外的单截短TALE重复单元,所述TALE DNA结合结构域包括3到30个重复单元,所述另外的单截短TALE重复单元包括位于一组TALE重复单元的C-末端的20个氨基酸,即其为另外的C-末端半TALEDNA结合结构域重复单元(本文其它地方公开的C-帽的氨基酸-20到-1,见下文)。因此,在特定实施例中,本文考虑的megaTAL包括TALE DNA结合结构域,其包括3.5到30.5个重复单元。在某些实施例中,megaTAL包括3.5个、4.5个、5.5个、6.5个、7.5个、8.5个、9.5个、10.5个、11.5个、12.5个、13.5个、14.5个、15.5个、16.5个、17.5个、18.5个、19.5个、20.5个、21.5个、22.5个、23.5个、24.5个、25.5个、26.5个、27.5个、28.5个、29.5个或30.5个TALE DNA结合结构域重复单元。在一个优选实施例中,本文考虑的megaTAL包括TALE DNA结合结构域,其包括5.5-15.5个重复单元,更优选7.5-15.5个重复单元,更优选9.5-15.5个重复单元,更优选9.5个、10.5个、11.5个、12.5个、13.5个、14.5个或15.5个重复单元。
在特定实施例中,megaTAL包括TAL效应子构造,其包括“N-末端结构域(NTD)”多肽、一个或多个TALE重复结构域/单元、“C-末端结构域(CTD)”多肽和归巢核酸内切酶变体。在一些实施例中,NTD、TALE重复和/或CTD结构域来自相同物种。在其它实施例中,NTD、TALE重复和/或CTD结构域中的一个或多个来自不同物种。
如本文使用,术语“N-末端结构域(NTD)”多肽是指天然存在的TALE DNA结合结构域的N-末端部分或片段侧翼的序列。如果存在,NTD序列可以是任何长度,只要TALE DNA结合结构域重复单元保留结合DNA的能力即可。在特定实施例中,NTD多肽包括在TALE DNA结合结构域的N-末端的至少120到至少140个或更多个氨基酸(0是最N-末端重复单元的氨基酸1)。在特定实施例中,NTD多肽包括在TALE DNA结合结构域的N-末端的至少约120个、121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个、137个、138个、139个或至少140个氨基酸。在一个实施例中,本文考虑的megaTAL包括NTD多肽,其为黄单胞菌TALE蛋白的至少约氨基酸+1到+122到至少约+1到+137(0是最N-末端重复单元的氨基酸1)。在特定实施例中,NTD多肽包括在黄单胞菌TALE蛋白的TALE DNA结合结构域的N-末端的至少约122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个或137个氨基酸。在一个实施例中,本文考虑的megaTAL包括NTD多肽,其为雷尔氏菌TALE蛋白的至少氨基酸+1到+121(0是最N-末端重复单元的氨基酸1)。在特定实施例中,NTD多肽包括在雷尔氏菌TALE蛋白的TALEDNA结合结构域的N-末端的至少约121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个或137个氨基酸。
如本文使用,术语“C-末端结构域(CTD)”多肽是指天然存在的TALE DNA结合结构域的C-末端部分或片段侧翼的序列。如果存在,CTD序列可以是任何长度,只要TALE DNA结合结构域重复单元保留结合DNA的能力即可。在特定实施例中,CTD多肽包括在TALE DNA结合结构域的最后一个完全重复的C-末端的至少20到至少85个或更多个氨基酸(前20个氨基酸是在最后一个C-末端完全重复单元的C-末端的半重复单元)。在特定实施例中,CTD多肽包括在TALE DNA结合结构域的最后一个完全重复的C-末端的至少约20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、443个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个或至少85个氨基酸。在一个实施例中,本文考虑的megaTAL包括CTD多肽,其为黄单胞菌TALE蛋白的至少约氨基酸-20到-1(-20是最后一个C-末端完全重复单元的C-末端的半重复单元的氨基酸1)。在特定实施例中,CTD多肽包括在黄单胞菌TALE蛋白的TALE DNA结合结构域的最后一个完全重复的C-末端的至少约20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸。在一个实施例中,本文考虑的megaTAL包括CTD多肽,其为雷尔氏菌TALE蛋白的至少约氨基酸-20到-1(-20是最后一个C-末端完全重复单元的C-末端的半重复单元的氨基酸1)。在特定实施例中,CTD多肽包括在雷尔氏菌TALE蛋白的TALE DNA结合结构域的最后一个完全重复的C-末端的至少约20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸。
在特定实施例中,本文考虑的megaTAL包括融合多肽,其包括被改造以结合靶序列的TALE DNA结合结构域、被重编程以结合并切割靶序列的归巢核酸内切酶和任选的NTD和/或CTD多肽,所述TALE DNA结合结构域、归巢核酸内切酶和任选的NTD和/或CTD多肽任选地通过一个或多个本文其它地方考虑的连接子多肽彼此连接。不希望受任何特定理论的束缚,预期包括TALE DNA结合结构域和任选的NTD和/或CTD多肽的megaTAL与连接子多肽融合,其进一步与归巢核酸内切酶变体融合。因此,TALE DNA结合结构域结合距离由归巢核酸内切酶变体的DNA结合结构域结合的靶序列约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个核苷酸之内的DNA靶序列。以这种方式,本文考虑的megaTAL增加了基因组编辑的特异性、选择性和效率。
在一个实施例中,megaTAL包括归巢核酸内切酶变体和TALE DNA结合结构域,所述TALE DNA结合结构域结合在重编程的归巢核酸内切酶的结合位点上游约4个、5个或6个核苷酸(优选5或6个核苷酸)内的核苷酸序列。
在一个实施例中,megaTAL包括归巢核酸内切酶变体和TALE DNA结合结构域,所述TALE DNA结合结构域结合SEQ ID NO:18所示的核苷酸序列,其在由归巢核酸内切酶变体(SEQ ID NO:17)结合并切割的核苷酸序列的上游6个核苷酸处。在优选实施例中,megaTAL靶序列是SEQ ID NO:18。
在一个实施例中,megaTAL包括归巢核酸内切酶变体和TALE DNA结合结构域,所述TALE DNA结合结构域结合SEQ ID NO:19所示的核苷酸序列,其在由归巢核酸内切酶变体(SEQ ID NO:17)结合并切割的核苷酸序列的上游5个核苷酸处。在优选实施例中,megaTAL靶序列是SEQ ID NO:19。
在特定实施例中,本文考虑的megaTAL包括约122个氨基酸到137个氨基酸的NTD、约9.5个、约10.5个、约11.5个、约12.5个、约13.5个、约14.5个或约15.5个结合重复单元、约20个氨基酸到约85个氨基酸的CTD和I-OnuI LHE变体。在特定实施例中,NTD、DNA结合结构域和CTD中的任何一个、两个或全部可以从相同的物种或不同的物种以任何合适的组合设计。
在特定实施例中,本文考虑的megaTAL包括SEQ ID NO:10-12中任一个所示的氨基酸序列。
在特定实施例中,本文考虑的megaTAL包括SEQ ID NO:10所示的氨基酸序列。
在特定实施例中,本文考虑的megaTAL包括SEQ ID NO:11所示的氨基酸序列。
在特定实施例中,本文考虑的megaTAL包括SEQ ID NO:12所示的氨基酸序列。
在某些实施例中,megaTAL包括TALE DNA结合结构域,并且I-OnuI LHE变体结合并切割SEQ ID NO:17或SEQ ID NO:20所示的核苷酸序列。
3.末端加工酶
特定实施例中考虑的基因组编辑组合物和方法包括使用核酸酶变体和末端加工酶的一个或多个拷贝来编辑细胞基因组。在特定实施例中,单个多核苷酸编码归巢核酸内切酶变体和末端加工酶,其由连接子、自切割肽序列(例如,2A序列)分开,或由IRES序列分开。在特定实施例中,基因组编辑组合物包括编码核酸酶变体的多核苷酸和分开的编码末端加工酶的多核苷酸。在特定实施例中,除了由自切割肽分开的末端加工酶的串联拷贝,基因组编辑组合物包括编码归巢核酸内切酶变体末端加工酶单个多肽融合体的多核苷酸。
术语“末端加工酶”是指修饰多核苷酸链的暴露末端的酶。多核苷酸可以是双链DNA(dsDNA)、单链DNA(ssDNA)、RNA、DNA与RNA的双链杂合体和合成DNA(例如,含有除A、C、G和T以外的碱基)。末端加工酶可以通过加入一个或多个核苷酸,去除一个或多个核苷酸,去除或修饰磷酸根基团和/或去除或修饰羟基来修饰暴露的多核苷酸链末端。末端加工酶可以修饰核酸内切酶切割位点处的末端或通过其它化学或机械手段生成的末端,所述其它化学或机械手段例如剪切(例如,通过细隔距针、加热、超声处理、迷你珠滚磨和雾化)、电离辐射、紫外线辐射、氧自由基、化学水解和化疗剂。
在特定实施例中,特定实施例中考虑的基因组编辑组合物和方法包括使用归巢核酸内切酶变体或megaTAL和DNA末端加工酶来编辑细胞基因组。
术语“DNA末端加工酶”是指修饰DNA的暴露末端的酶。DNA末端加工酶可以修饰平末端或交错末端(具有5'或3'突出端的末端)。DNA末端加工酶可以修饰单链或双链DNA。DNA末端加工酶可以修饰核酸内切酶切割位点处的末端或通过其它化学或机械手段生成的末端,所述其它化学或机械手段例如剪切(例如,通过细隔距针、加热、超声处理、迷你珠滚磨和雾化)、电离辐射、紫外线辐射、氧自由基、化学水解和化疗剂。DNA末端加工酶可以通过加入一个或多个核苷酸,去除一个或多个核苷酸,去除或修饰磷酸根基团和/或去除或修饰羟基来修饰暴露的DNA末端。
适用于本文考虑的特定实施例的DNA末端加工酶的说明性实例包含但不限于:5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶、5'瓣状核酸内切酶、解旋酶、磷酸酶、水解酶和模板非依赖性DNA聚合酶。
适用于本文考虑的特定实施例的DNA末端加工酶的另外的说明性实例包含但不限于Trex2、Trex1、不含跨膜结构域的Trex1、Apollo、Artemis、DNA2、Exo1、ExoT、ExoIII、Fen1、Fan1、MreII、Rad2、Rad9、TdT(末端脱氧核苷酸转移酶)、PNKP、RecE、RecJ、RecQ、λ核酸外切酶、Sox、牛痘DNA聚合酶、核酸外切酶I、核酸外切酶III、核酸外切酶VII、NDK1、NDK5、NDK7、NDK8、WRN、T7-核酸外切酶基因6、禽类成髓细胞瘤病毒整合蛋白(IN)、Bloom、热敏磷酸酶、碱性磷酸酶、多核苷酸激酶(PNK)、ApeI、绿豆核酸酶、Hex1、TTRAP(TDP2)、Sgs1、Sae2、CUP、Polμ、Polλ、MUS81、EME1、EME2、SLX1、SLX4和UL-12。
在特定实施例中,用于编辑本文考虑的细胞基因组的基因组编辑组合物和方法包括多肽,其包括归巢核酸内切酶变体或megaTAL和核酸外切酶。术语“核酸外切酶”是指通过断裂在3'或5'末端的磷酸二酯键的水解反应在多核苷酸链的末端处切割磷酸二酯键的酶或结构域。
适用于本文考虑的特定实施例的核酸外切酶的说明性实例包含但不限于:hExoI、酵母ExoI、大肠杆菌ExoI、hTREX2、小鼠TREX2、大鼠TREX2、hTREX1、小鼠TREX1、大鼠TREX1和大鼠TREX1。
在特定实施例中,DNA末端加工酶是3'或5'核酸外切酶,优选Trex1或Trex2,更优选Trex2,甚至更优选人或小鼠Trex2。
D.多肽
本文考虑了各种多肽,包含但不限于归巢核酸内切酶变体、megaTAL和融合多肽。在优选实施例中,多肽包括SEQ ID NO:1-12和22-24所示的氨基酸序列。除非另有相反的说明,否则“多肽”、“多肽片段”、“肽”和“蛋白质”可互换使用,并且根据常规含义,即用作为氨基酸的序列。在一个实施例中,“多肽”包含融合多肽和其它变体。可以使用各种熟知的重组和/或合成技术中的任何一种制备多肽。多肽不限于具体长度,例如,它们可以包括全长蛋白质序列、全长蛋白质片段或融合蛋白,并且可以包含多肽的翻译后修饰(例如,糖基化、乙酰化、磷酸化等)以及本领域已知的其它修饰(包括天然存在的和非天然存在的)。
如本文使用,“分离的蛋白质”、“分离的肽”或“分离的多肽”等是指从细胞环境以及从与细胞的其它组分的缔合体外合成、分离和/或纯化肽或多肽分子,即它与体内物质没有显著关联。
特定实施例中考虑的多肽的说明性实例包含但不限于归巢核酸内切酶变体、megaTAL、末端加工核酸酶、融合多肽及其变体。
多肽包含“多肽变体”。多肽变体与天然存在的多肽的不同之处可以是一个或多个氨基酸取代、缺失、加入和/或插入。这些变体可以是天然存在的或可以通过合成生成,例如,通过修饰上述多肽序列的一个或多个氨基酸。例如,在特定实施例中,可能需要通过将一个或多个取代、缺失、加入和/或插入导入多肽中来改善结合并切割人TCRα基因中的靶位点的归巢核酸内切酶、megaTAL等的生物性质。在特定实施例中,多肽包含与本文考虑的任何参考序列具有至少约65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的多肽,通常其中变体保持参考序列的至少一种生物活性。
多肽变体包含生物活性“多肽片段”。生物活性多肽片段的说明性实例包含DNA结合结构域、核酸酶结构域等。如本文使用,术语“生物活性片段”或“最小生物活性片段”是指保留天然存在的多肽活性的至少100%、至少90%、至少80%、至少70%、至少60%、至少50%、至少40%、至少30%、至少20%、至少10%或至少5%的多肽片段。在优选实施例中,生物活性是针对靶序列的结合亲和力和/或切割活性。在某些实施例中,多肽片段可以包括长度为至少5到约1700个氨基酸的氨基酸链。应当理解,在某些实施例中,片段的长度为至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、110个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、1100个、1200个、1300个、1400个、1500个、1600个、1700个或更多个氨基酸。在特定实施例中,多肽包括归巢核酸内切酶变体的生物活性片段。在特定实施例中,本文所述的多肽可以包括一个或多个表示为“X”的氨基酸。如果存在于氨基酸SEQ ID NO中,则“X”表示任何氨基酸。一个或多个“X”残基可以存在于本文考虑的特定SEQ ID NO所示的氨基酸序列的N-末端和C-末端。如果不存在“X”氨基酸,则余下的SEQ ID NO所示的氨基酸序列可以被认为是生物活性片段。
在特定实施例中,多肽包括归巢核酸内切酶变体的生物活性片段,例如SEQ IDNO:6-7或megaTAL(SEQ ID NO:10-12)。生物活性片段可以包括N-末端截短和/或C-末端截短。在一个特定实施例中,生物活性片段与相应的野生型归巢核酸内切酶序列相比缺少归巢核酸内切酶变体的1个、2个、3个、4个、5个、6个、7个或8个N-末端氨基酸或包括其缺失,更优选与相应的野生型归巢核酸内切酶序列相比包括归巢核酸内切酶变体的4个N-末端氨基酸的缺失。在一个特定实施例中,生物活性片段与相应的野生型归巢核酸内切酶序列相比缺少归巢核酸内切酶变体的1个、2个、3个、4个或5个C-末端氨基酸或包括其缺失,更优选与相应的野生型归巢核酸内切酶序列相比包括归巢核酸内切酶变体的2个C-末端氨基酸的缺失。在一个特定优选实施例中,生物活性片段与相应的野生型归巢核酸内切酶序列相比缺少归巢核酸内切酶变体的4个N-末端氨基酸和2个C-末端氨基酸或包括其缺失。
在一个特定实施例中,I-OnuI变体包括以下N-末端氨基酸中的1个、2个、3个、4个、5个、6个、7个或8个的缺失:M、A、Y、M、S、R、R、E;和/或以下1个、2个、3个、4个或5个C-末端氨基酸的缺失:R、G、S、F、V。
在一个特定实施例中,I-OnuI变体包括以下N-末端氨基酸中的1个、2个、3个、4个、5个、6个、7个或8个的缺失或取代:M、A、Y、M、S、R、R、E;以下1个、2个、3个、4个或5个C-末端氨基酸的缺失或取代:R、G、S、F、V。
在一个特定实施例中,I-OnuI变体包括以下N-末端氨基酸中的1个、2个、3个、4个、5个、6个、7个或8个的缺失:M、A、Y、M、S、R、R、E;和/或以下1个或2个C-末端氨基酸的缺失:F、V。
在一个特定实施例中,I-OnuI变体包括以下N-末端氨基酸中的1个、2个、3个、4个、5个、6个、7个或8个的缺失或取代:M、A、Y、M、S、R、R、E;和/或以下1个或2个C-末端氨基酸的缺失或取代:F、V。
如上所述,可以以各种方式改变多肽,包含氨基酸取代、缺失、截短和插入。此类操作的方法通常是本领域已知的。例如,参考多肽的氨基酸序列变体可以通过DNA中的突变来制备。诱变和核苷酸序列改变的方法是本领域熟知的。参见例如Kunkel(1985年,《美国科学院院报(Proc.Natl.Acad.Sci.USA.)》,82:488-492),Kunkel等人,(1987年,《酶学方法(Methods in Enzymol)》,154:367-382),美国专利第4,873,192号,Watson,J.D.等人,(《基因分子生物学(Molecular Biology of the Gene)》,第四版,Benjamin/Cummings,门洛帕克,加利福尼亚,1987年)和其中引用的参考文献。关于不影响目标蛋白质的生物活性的适当氨基酸取代的指导可以在Dayhoff等人的模型中找到,(1978年)《蛋白质序列和结构地图集(Atlas of Protein Sequence and Structure)》(国家生物医学研究基金会,华盛顿特区)。
在某些实施例中,变体将含有一个或多个保守取代。“保守取代”是其中一种氨基酸取代具有相似性质的另一种氨基酸,使得肽化学领域的技术人员将预期多肽的二级结构和亲/疏水性质(hydropathic nature)基本上不变。可以在特定实施例中考虑的多核苷酸和多肽的结构中进行修饰,多肽包含具有至少约的多肽并且仍然获得编码具有所需特性的变体或衍生多肽的功能分子。当需要改变多肽的氨基酸序列以产生等同的或甚至改进的变体多肽时,本领域技术人员例如可以改变编码DNA序列的一个或多个密码子,例如根据表1。
表1-氨基酸密码子
可以使用本领域熟知的计算机程序,例如DNASTAR、DNA Strider、Geneious、MacVector或Vector NTI软件,找到确定哪些氨基酸残基可以在不消除生物活性的情况下被取代、插入或缺失的指导。优选地,本文公开的蛋白质变体中的氨基酸变化是保守氨基酸变化,即相似带电荷或不带电荷氨基酸的取代。保守氨基酸改变涉及在其侧链中相关的氨基酸家族之一的取代。天然存在的氨基酸通常分为四个家族:酸性(天冬氨酸盐、谷氨酸盐)、碱性(赖氨酸、精氨酸、组氨酸)、非极性(丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸)、不带电荷极性(甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸)氨基酸。苯丙氨酸、色氨酸和酪氨酸有时被主要分类为芳香族氨基酸。在肽或蛋白质中,合适的氨基酸保守取代是本领域技术人员已知的,并且通常可以在不改变所得分子的生物活性的情况下进行。本领域技术人员认识到,通常,多肽的非必需区中的单个氨基酸取代基本上不改变生物活性(参见例如Watson等人,《基因分子生物学(MolecularBiology of the Gene)》,第4版,1987年,The Benjamin/Cummings Pub.Co.,第224页)。
在一个实施例中,当需要表达两种或更多种多肽时,编码它们的多核苷酸序列可以通过IRES序列分开,如本文其它地方所公开。
特定实施例中考虑的多肽包含融合多肽。在特定实施例中,提供了融合多肽和编码融合多肽的多核苷酸。融合多肽和融合蛋白是指具有至少两个、三个、四个、五个、六个、七个、八个、九个或十个多肽片段的多肽。
在另一个实施例中,两种或更多种多肽可以表达为包括一个或多个本文其它地方公开的自切割多肽序列的融合蛋白。
在一个实施例中,本文考虑的融合蛋白包括一个或多个DNA结合结构域和一个或多个核酸酶,以及一个或多个连接子和/或自切割多肽。
在一个实施例中,本文考虑的融合蛋白包括核酸酶变体;连接子或自切割肽;和末端加工酶,其包含但不限于5'-3'核酸外切酶、5'-3'碱性核酸外切酶和3'-5'核酸外切酶(例如,Trex2)。
融合多肽可以包括一个或多个多肽结构域或片段,包含但不限于信号肽、细胞渗透肽结构域(CPP)、DNA结合结构域、核酸酶结构域等、表位标签(例如,麦芽糖结合蛋白(“MBP”)、谷胱甘肽S转移酶(GST)、HIS6、MYC、FLAG、V5、VSV-G和HA)、多肽连接子和多肽切割信号。融合多肽通常是C-末端到N-末端连接的,但是它们也可以是C-末端到C-末端、N-末端到N-末端或N-末端到C-末端连接的。在特定实施例中,融合蛋白的多肽可以是任何顺序。融合多肽或融合蛋白还可以包含保守修饰的变体、多态变体、等位基因、突变体、亚序列和种间同源物,只要保留了融合多肽的所需活性即可。融合多肽可以通过化学合成方法或通过两个部分之间的化学连接产生,或者通常可以使用其它标准技术制备。包括融合多肽的连接DNA序列与合适的转录或翻译控制元件可操作地连接,如本文其它地方所公开。
融合多肽可以任选地包括可以用于连接多肽内的一个或多个多肽或结构域的连接子。肽连接子序列可以用于将任何两个或更多个多肽组分分开足够的距离,以确保每个多肽折叠成其合适的二级和三级结构,从而使多肽结构域发挥其所需功能。使用本领域的标准技术将此类肽连接子序列掺入融合多肽中。可以基于以下因素选择合适的肽连接子序列:(1)它们能够采用柔性延伸构象;(2)它们不能采用可以与第一和第二多肽上的功能性表位相互作用的二级结构;和(3)缺少可能与多肽功能性表位反应的疏水或带电残基。优选的肽连接子序列含有Gly、Asn和Ser残基。其它近中性氨基酸,例如Thr和Ala,也可以用于连接子序列。可以用作连接子的氨基酸序列包含Maratea等人,《基因(Gene)》,40:39-46,1985;Murphy等人,《美国国家科学院学报(Proc.Natl.Acad.Sci.USA)》,83:8258-8262,1986;美国专利第4,935,233号和美国专利第4,751,180号中公开的那些。当特定融合多肽片段含有可以用于分开功能结构域并防止空间干扰的非必需N-末端氨基酸区时,不需要连接子序列。优选的连接子通常是柔性氨基酸子序列,其作为重组融合蛋白的一部分合成。连接子多肽的长度可以是1到200个氨基酸、1到100个氨基酸,或者1到50个氨基酸,包含其间的所有整数值。
示例性连接子包含但不限于以下氨基酸序列:甘氨酸聚合物(G)n;甘氨酸-丝氨酸聚合物(G1-5S1-5)n,其中n是至少一、二、三、四或五的整数;甘氨酸-丙氨酸聚合物;丙氨酸-丝氨酸聚合物;GGG(SEQ ID NO:30);DGGGS(SEQ ID NO:31);TGEKP(SEQ ID NO:32)(参见例如Liu等人,《美国科学院院报(PNAS)》,5525-5530(1997));GGRR(SEQ ID NO:33)(Pomerantz等人,1995年,同上);(GGGGS)n,其中n=1、2、3、4或5(SEQ ID NO:34)(Kim等人,《美国科学院院报(PNAS)》,93,1156-1160(1996.);EGKSSGSGSESKVD(SEQ ID NO:35)(Chaudhary等人,1990年,《美国科学院院报(Proc.Natl.Acad.Sci.U.S.A.)》,87:1066-1070);KESGSVSSEQLAQFRSLD(SEQ ID NO:36)(Bird等人,1988年,《科学(Science)》,242:423-426),GGRRGGGS(SEQ ID NO:37);LRQRDGERP(SEQ ID NO:38);LRQKDGGGSERP(SEQ IDNO:39);LRQKD(GGGS)2ERP(SEQ ID NO:40)。可替代地,柔性连接子可以使用能够对DNA结合位点和肽本身进行建模的计算机程序(Desjarlais和Berg,《美国科学院院报(PNAS)》,90:2256-2260(1993),《美国科学院院报(PNAS)》,91:11099-11103(1994))或通过噬菌体展示方法来合理设计。
融合多肽可以进一步包括在本文描述的每个多肽结构域之间或在内源性开放阅读框和由供体修复模板编码的多肽之间的多肽切割信号。另外,可以将多肽切割位点置于任何连接子肽序列中。示例性多肽切割信号包含多肽切割识别位点,例如蛋白酶切割位点、核酸酶切割位点(例如,稀有限制酶识别位点、自切割核酶识别位点)和自切割病毒寡肽(参见deFelipe和Ryan,2004年,《运输(traffic)》,5(8);616-26)。
合适的蛋白酶切割位点和自切割肽是本领域技术人员已知的(参见例如Ryan等人,1997年,《普通病毒学杂志(J.Gener.Virol.)》,78,699-722;Scymczak等人(2004年),《自然生物技术(Nature Biotech.)》,5,589-594)。示例性蛋白酶切割位点包含但不限于马铃薯Y病毒NIa蛋白酶(例如,烟草蚀刻病毒蛋白酶)、马铃薯Y病毒HC蛋白酶、马铃薯Y病毒P1(P35)蛋白酶、大麦花叶病毒(byovirus)NIa蛋白酶、大麦花叶病毒RNA-2编码的蛋白酶、口疮病毒L蛋白酶、肠病毒2A蛋白酶、鼻病毒2A蛋白酶、小RNA病毒3C蛋白酶、豇豆花叶病毒24K蛋白酶、线虫传多面体病毒24K蛋白酶、RTSV(水稻东格鲁球状病毒)3C样蛋白酶、PYVF(欧防风黄点病毒)3C样蛋白酶、肝素、凝血酶、因子Xa和肠激酶的切割位点。由于其高切割严格性,在一个实施例中优选TEV(烟草蚀刻病毒)蛋白酶切割位点,例如EXXYXQ(G/S)(SEQ IDNO:41),例如ENLYFQG(SEQ ID NO:42)和ENLYFQS(SEQ ID NO:43),其中X代表任何氨基酸(由TEV引起的发生在Q和G或Q和S之间的切割)。
在某些实施例中,自切割多肽位点包括2A或2A样位点、序列或结构域(Donnelly等人,2001年,《普通病毒学杂志(J.Gen.Virol.)》,82:1027-1041)。在一个特定实施例中,病毒2A肽是口疮病毒2A肽、马铃薯Y病毒2A肽或心病毒2A肽。
在一个实施例中,病毒2A肽选自由以下组成的组:口蹄疫病毒(FMDV)2A肽、马鼻炎A病毒(ERAV)2A肽、明脉扁刺蛾β四体病毒(TaV)2A肽、猪捷申病毒-1(PTV-1)2A肽、泰勒病毒2A肽和脑心肌炎病毒2A肽。
表2中提供了2A位点的说明性实例。
表2:示例性2A位点包含以下序列:
SEQ ID NO:44 GSGATNFSLLKQAGDVEENPGP
SEQ ID NO:45 ATNFSLLKQAGDVEENPGP
SEQ ID NO:46 LLKQAGDVEENPGP
SEQ ID NO:47 GSGEGRGSLLTCGDVEENPGP
SEQ ID NO:48 EGRGSLLTCGDVEENPGP
SEQ ID NO:49 LLTCGDVEENPGP
SEQ ID NO:50 GSGQCTNYALLKLAGDVESNPGP
SEQ ID NO:51 QCTNYALLKLAGDVESNPGP
SEQ ID NO:52 LLKLAGDVESNPGP
SEQ ID NO:53 GSGVKQTLNFDLLKLAGDVESNPGP
SEQ ID NO:54 VKQTLNFDLLKLAGDVESNPGP
SEQ ID NO:55 LLKLAGDVESNPGP
SEQ ID NO:56 LLNFDLLKLAGDVESNPGP
SEQ ID NO:57 TLNFDLLKLAGDVESNPGP
SEQ ID NO:58 LLKLAGDVESNPGP
SEQ ID NO:59 NFDLLKLAGDVESNPGP
SEQ ID NO:60 QLLNFDLLKLAGDVESNPGP
SEQ ID NO:61 APVKQTLNFDLLKLAGDVESNPGP
SEQ ID NO:62 VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQT
SEQ ID NO:63 LNFDLLKLAGDVESNPGP
SEQ ID NO:64 LLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP
SEQ ID NO:65 EARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP
E.多核苷酸
在特定实施例中,提供了编码本文考虑的一种或多种归巢核酸内切酶变体、megaTAL、末端加工酶和融合多肽的多核苷酸。如本文使用,术语“多核苷酸”或“核酸”是指脱氧核糖核酸(DNA)、核糖核酸(RNA)和DNA/RNA杂合体。多核苷酸可以是单链或双链的,并且是重组的、合成的或分离的。多核苷酸包含但不限于:前信使RNA(前mRNA)、信使RNA(mRNA)、RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、合成RNA、基因组RNA(gRNA)、正链RNA(RNA(+))、负链RNA(RNA(-))、tracrRNA、crRNA、单向导RNA(sgRNA)、合成RNA、合成mRNA、基因组DNA(gDNA)、PCR扩增DNA、互补DNA(cDNA)、合成DNA或重组DNA。多核苷酸是指长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少1000个、至少5000个、至少10000个或至少15000个或更多个核苷酸的核苷酸聚合形式,或是核糖核苷酸,或是脱氧核糖核苷酸,或是任一类型核苷酸的修饰形式,以及所有中间长度。容易理解的是,在这种背景下,“中间长度”表示引用值之间的任何长度,例如6个、7个、8个、9个核苷酸等,101个、102个、103个核苷酸等;151个、152个、153个核苷酸等;201个、202个、203个核苷酸等。在特定实施例中,多核苷酸或变体与参考序列具有至少或约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
在特定实施例中,多核苷酸可以是密码子优化的。如本文使用,术语“密码子优化的”是指取代编码多肽的多核苷酸中的密码子以增加多肽的表达、稳定性和/或活性。影响密码子优化的因素包含但不限于以下一种或多种:(i)两种或更多种生物体或基因或合成构建的偏好表之间的密码子偏好的变化,(ii)生物体、基因或基因组内密码子偏好程度的变化,(iii)密码子(包含环境)的系统性变化,(iv)根据其解码tRNA的密码子的变化,(v)根据GC%的密码子的变化,无论是整体还是在三联体的一个位置,(vi)与参考序列(例如,天然存在的序列)的相似程度的变化,(vii)密码子频率截止的变化,(viii)从DNA序列转录的mRNA的结构性质,(ix)关于密码子取代组的设计所基于的DNA序列的功能的先前知识,(x)每个氨基酸的密码子组的系统性变化,和/或(xi)假翻译起始位点的分离去除。
如本文使用,术语“核苷酸”是指杂环含氮碱基与磷酸化糖通过N-糖苷键连接。核苷酸应被理解为包含天然碱基和多种本领域公认的修饰碱基。这些碱基通常位于核苷酸糖部分的1'位置。核苷酸通常包括碱基、糖和磷酸酯基团。在核糖核酸(RNA)中,糖是核糖,并且在脱氧核糖核酸(DNA)中,糖是脱氧核糖,即缺少核糖中存在的羟基的糖。示例性天然含氮碱基包含嘌呤、腺苷(A)和胍(G)、以及嘧啶、胞苷(C)和胸苷(T)(或在RNA背景下,尿嘧啶(U))。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。核苷酸通常是单磷酸酯、二磷酸酯或三磷酸酯。核苷酸可以在糖、磷酸酯和/或碱基部分处被或不被修饰(也可互换地被称为核苷酸类似物、核苷酸衍生物、修饰的核苷酸、非天然核苷酸和非标准核苷酸;参见例如,WO 92/07065和WO 93/15187)。Limbach等人(1994年,《核酸研究(Nucleic Acids Res.)》,22,2183-2196)总结了修饰的核酸碱基的实例。
核苷酸也可以被认为是核苷的磷酸酯,其中酯化发生在与糖的C-5连接的羟基上。如本文使用,术语“核苷”是指杂环含氮碱基与糖通过N-糖苷键连接。核苷在本领域中被认为包含天然碱基,并且还包含众所周知的修饰碱基。这些碱基通常位于核苷糖部分的1'位置。核苷通常包括碱和糖基团。核苷可以在糖和/或碱基部分处被或不被修饰(也可互换地被称为核苷类似物、核苷衍生物、修饰的核苷、非天然核苷或非标准核苷)。同样如上所述,Limbach等人(1994年,《核酸研究(Nucleic Acids Res.)》,22,2183-2196)总结了修饰的核酸碱基的实例。
多核苷酸的说明性实例包含但不限于编码SEQ ID NO:1-12和22-24的多核苷酸和SEQ ID NO:13-16和25-27所示的多核苷酸序列。
在各个说明性实施例中,本文考虑的多核苷酸包含但不限于编码归巢核酸内切酶变体、megaTAL、末端加工酶、融合多肽的多核苷酸,和包括本文考虑的多核苷酸的表达载体、病毒载体和转移质粒。
如本文使用,术语“多核苷酸变体”和“变体”等是指表现出与参考多核苷酸序列的基本序列同一性的多核苷酸或在下文定义的严格条件下与参考序列杂合的多核苷酸。这些术语还涵盖通过加入、缺失、取代或修饰至少一个核苷酸而区别于参考多核苷酸的多核苷酸。因此,术语“多核苷酸变体”和“变体”包含其中已加入或缺失或修饰一个或多个核苷酸或已用不同核苷酸取代一个或多个核苷酸的多核苷酸。在这一点,本领域充分理解,可以对参考多核苷酸进行某些改变,包含突变、加入、缺失和取代,由此改变的多核苷酸保留参考多核苷酸的生物功能或活性。
在一个实施例中,多核苷酸包括在严格条件下与靶核酸序列杂合的核苷酸序列。在“严格条件”下杂合描述了杂合方案,其中彼此具有至少60%同一性的核苷酸序列保持杂合。通常,严格条件被选择为在确定的离子强度和pH下比具体序列的热熔点(Tm)低约5℃。Tm是温度(在确定的离子强度、pH和核酸浓度下),在此温度下,50%与靶序列互补的探针在平衡时与靶序列杂合。由于靶序列通常过量存在,所以在Tm下,50%的探针在平衡时被占用。
如本文使用,叙述“序列同一性”或例如包括“与……具有50%同一性的序列”是指序列在比较窗口上在逐个核苷酸的基础上或在逐个氨基酸的基础上具有同一性的程度。因此,“序列同一性百分比”可以通过以下计算:在比较窗口上比较两个最佳比对序列,确定两个序列中存在相同的核酸碱基(例如,A、T、C、G、I)或相同的氨基酸残基(例如,Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys和Met)的位置的数量以得到匹配位置的数量,用匹配位置的数量除以比较窗口中的位置总数(即,窗口大小),并将结果乘以100以得到序列同一性百分比。包含与本文所述的任何参考序列具有至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性的核苷酸和多肽,通常其中多肽变体保持参考多肽的至少一种生物活性。
用于描述两个或更多个多核苷酸或多肽之间的序列关系的术语包含“参考序列”、“比较窗口”、“序列同一性”、“序列同一性百分比”和“基本同一性”。“参考序列”的长度为至少12个单体单元,但通常为15到18个单体单元,在大多数情况下为至少25个单体单元,所述单体单元包含核苷酸和氨基酸残基。因为两个多核苷酸可以各自包括(1)两个多核苷酸之间相似的序列(即,仅完整多核苷酸序列的一部分),和(2)两个多核苷酸之间不同的序列,通常通过在“比较窗口”上比较两个多核苷酸的序列来进行两个(或更多个)多核苷酸之间的序列比较,以标识和比较具有序列相似性的局部区域。“比较窗口”是指至少6个连续位置,通常约50到约100个连续位置,更通常约100到约150个连续位置的概念性片段,其中将序列与连续位置数量相同的参考序列进行比较,然后对两个序列进行最佳比对。对于两个序列的最佳比对,比较窗口可以包括与参考序列(其不包括加入或缺失)相比约20%或更少的加入或缺失(即,缺口)。用于比对比较窗口的序列的最佳比对可以通过算法的计算机化实现(威斯康星遗传学软件包7.0版本中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputer Group,575Science Drive Madison,WI,USA)进行,或者通过选择的各个方法中的任一个生成的检查和最佳比对(即,导致比较窗口上的同源性百分比最高)。还可以参考BLAST程序家族,例如Altschul等人,1997年,《核酸研究(Nucl.Acids Res.)》,25:3389。序列分析的详细讨论可以在Ausubel等人,《现代分子生物学实验指南(Current Protocolsin Molecular Biology)》,John Wiley&Sons Inc.,1994-1998年,第15章的单元19.3中找到。
如本文使用,“分离的多核苷酸”是指从天然存在状态侧翼的序列纯化的多核苷酸,例如已从通常与片段相邻的序列中去除的DNA片段。在特定实施例中,“分离的多核苷酸”是指互补DNA(cDNA)、重组多核苷酸、合成多核苷酸或自然界中不存在并且已由人工制造的其它多核苷酸。
在各个实施例中,多核苷酸包括编码本文考虑的多肽的mRNA,所述多肽包含但不限于归巢核酸内切酶变体、megaTAL和末端加工酶。在某些实施例中,mRNA包括帽、一个或多个核苷酸和聚(A)尾。
如本文使用,术语“5'帽”或“5'帽结构”或“5'帽部分”是指化学修饰,其已掺入mRNA的5'末端。5'帽参与核输出、mRNA稳定性和翻译。
在特定实施例中,本文考虑的mRNA包括5'帽,其包括mRNA分子的末端鸟苷帽残基与5'-末端转录的正义核苷酸之间的5'-ppp-5'-三磷酸酯键。然后,可以将此5'-鸟苷酸帽甲基化以生成N7-甲基-鸟苷酸残基。
适用于本文考虑的mRNA多核苷酸的特定实施例的5'帽的说明性实例包含但不限于:未甲基化的5'帽类似物,例如G(5′)ppp(5′)G、G(5′)ppp(5′)C、G(5′)ppp(5′)A;甲基化的5′帽类似物,例如m7G(5′)ppp(5′)G、m7G(5′)ppp(5′)C和m7G(5′)ppp(5′)A;二甲基化的5′帽类似物,例如m2,7G(5′)ppp(5′)G、m2,7G(5′)ppp(5′)C和m2,7G(5′)ppp(5′)A;三甲基化的5′帽类似物,例如m2,2,7G(5′)ppp(5′)G、m2,2,7G(5′)ppp(5′)C和m2,2,7G(5′)ppp(5′)A;二甲基化的对称5′帽类似物,例如m7G(5′)pppm7(5′)G、m7G(5′)pppm7(5′)C和m7G(5′)pppm7(5′)A;和抗反向5′帽类似物,例如抗反向帽类似物(ARCA)帽、指定3′O-Me-m7G(5′)ppp(5′)G、2′O-Me-m7G(5′)ppp(5′)G、2′O-Me-m7G(5′)ppp(5′)C、2′O-Me-m7G(5′)ppp(5′)A、m72′d(5′)ppp(5′)G、m72′d(5′)ppp(5′)C、m72′d(5′)ppp(5′)A、3′O-Me-m7G(5′)ppp(5′)C、3′O-Me-m7G(5′)ppp(5′)A、m73′d(5′)ppp(5′)G、m73′d(5′)ppp(5′)C、m73′d(5′)ppp(5′)A及其四磷酸酯衍生物)(参见例如Jemielity等人,《核糖核酸(RNA)》,9:1108-1122(2003))。
在特定实施例中,mRNA包括5'帽,其为7-甲基鸟苷酸(“m7G”),其通过三磷酸酯桥连接到第一转录核苷酸的5'-末端,产生m7G(5′)ppp(5′)N,其中N是任何核苷。
在一些实施例中,mRNA包括5'帽,其中帽是Cap0结构(Cap0结构缺少与碱基1和2连接的核糖的2'-O-甲基残基)、Cap1结构(Cap1结构具有碱基2处的2′-O-甲基残基或Cap2结构(Cap2结构具有与碱基2和3连接的2'-O-甲基残基)。
在一个实施例中,mRNA包括m7G(5′)ppp(5′)G帽。
在一个实施例中,mRNA包括ARCA帽。
在特定实施例中,本文考虑的mRNA包括一种或多种修饰的核苷。
在一个实施例中,mRNA包括一种或多种修饰的核苷,其选自由以下组成的组:假尿苷、吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧甲基-尿苷、1-羧甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷、1-牛磺酸甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫代-假尿苷、5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟甲基胞苷、1-甲基-假异胞苷、吡咯-胞苷、吡咯-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、泽布莱林(zebularine)、5-氮杂-泽布莱林、5-甲基-泽布莱林、5-氮杂-2-硫代-泽布莱林、2-硫代-泽布莱林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷、4-甲氧基-1-甲基-假异胞苷、2-氨基嘌呤、2,6-二氨基嘌呤、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基嘌呤、7-脱氮-8-氮杂-2-氨基嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺-羟基异戊烯基)腺苷、2-甲硫基-N6-(顺-羟基异戊烯基)腺苷、N6-甘氨酰基氨基甲酰基腺苷、N6-苏氨酰基氨基甲酰基腺苷、2-甲硫基-N6-苏氨酰氨基甲酰腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤、2-甲氧基-腺嘌呤、肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-脱氮-鸟苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷和N2,N2-二甲基-6-硫代-鸟苷。
在一个实施例中,mRNA包括一种或多种修饰的核苷,其选自由以下组成的组:假尿苷、吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧甲基-尿苷、1-羧甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷、1-牛磺酸甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。
在一个实施例中,mRNA包括一种或多种修饰的核苷,其选自由以下组成的组:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟甲基胞苷、1-甲基-假异胞苷、吡咯-胞苷、吡咯-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、泽布莱林、5-氮杂-泽布莱林、5-甲基-泽布莱林、5-氮杂-2-硫代-泽布莱林、2-硫代-泽布莱林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。
在一个实施例中,mRNA包括一种或多种修饰的核苷,其选自由以下组成的组:2-氨基嘌呤、2,6-二氨基嘌呤、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基嘌呤、7-脱氮-8-氮杂-2-氨基嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺-羟基异戊烯基)腺苷、2-甲硫基-N6-(顺-羟基异戊烯基)腺苷、N6-甘氨酰基氨基甲酰基腺苷、N6-苏氨酰基氨基甲酰基腺苷、2-甲硫基-N6-苏氨酰氨基甲酰腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤和2-甲氧基-腺嘌呤。
在一个实施例中,mRNA包括一种或多种修饰的核苷,其选自由以下组成的组:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-脱氮-鸟苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷和N2,N2-二甲基-6-硫代-鸟苷。
在一个实施例中,mRNA包括一个或多个假尿苷、一个或多个5-甲基-胞嘧啶和/或一个或多个5-甲基-胞苷。
在一个实施例中,mRNA包括一个或多个假尿苷。
在一个实施例中,mRNA包括一个或多个5-甲基-胞苷。
在一个实施例中,mRNA包括一个或多个5-甲基-胞嘧啶。
在特定实施例中,本文考虑的mRNA包括聚(A)尾,以帮助保护mRNA免于核酸外切酶降解,稳定mRNA并促进翻译。在某些实施例中,mRNA包括3'聚(A)尾结构。
在特定实施例中,聚(A)尾的长度为至少约10个、25个、50个、75个、100个、150个、200个、250个、300个、350个、400个、450个或至少约500个或更多个腺嘌呤核苷酸或任何中间数量的腺嘌呤核苷酸。在特定实施例中,聚(A)尾的长度为至少约125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个、137个、138个、139个、140个、141个、142个、143个、144个、145个、146个、147个、148个、149个、150个、151个、152个、153个、154个、155个、156个、157个、158个、159个、160个、161个、162个、163个、164个、165个、166个、167个、168个、169个、170个、171个、172个、173个、174个、175个、176个、177个、178个、179个、180个、181个、182个、183个、184个、185个、186个、187个、188个、189个、190个、191个、192个、193个、194个、195个、196个、197个、198个、199个、200个、201个、202个、202个、203个、205个、206个、207个、208个、209个、210个、211个、212个、213个、214个、215个、216个、217个、218个、219个、220个、221个、222个、223个、224个、225个、226个、227个、228个、229个、230个、231个、232个、233个、234个、235个、236个、237个、238个、239个、240个、241个、242个、243个、244个、245个、246个、247个、248个、249个、250个、251个、252个、253个、254个、255个、256个、257个、258个、259个、260个、261个、262个、263个、264个、265个、266个、267个、268个、269个、270个、271个、272个、273个、274个或275个或更多个腺嘌呤核苷酸。
在特定实施例中,聚(A)尾的长度为约10到约500个腺嘌呤核苷酸、约50到约500个腺嘌呤核苷酸、约100到约500个腺嘌呤核苷酸、约150到约500个腺嘌呤核苷酸、约200到约500个腺嘌呤核苷酸、约250到约500个腺嘌呤核苷酸、约300到约500个腺嘌呤核苷酸、约50到约450个腺嘌呤核苷酸、约50到约400个腺嘌呤核苷酸、约50到约350个腺嘌呤核苷酸、约100到约500个腺嘌呤核苷酸、约100到约450个腺嘌呤核苷酸、约100到约400个腺嘌呤核苷酸、约100到约350个腺嘌呤核苷酸、约100到约300个腺嘌呤核苷酸、约150到约500个腺嘌呤核苷酸、约150到约450个腺嘌呤核苷酸、约150到约400个腺嘌呤核苷酸、约150到约350个腺嘌呤核苷酸、约150到约300个腺嘌呤核苷酸、约150到约250个腺嘌呤核苷酸、约150到约200个腺嘌呤核苷酸、约200到约500个腺嘌呤核苷酸、约200到约450个腺嘌呤核苷酸、约200到约400个腺嘌呤核苷酸、约200到约350个腺嘌呤核苷酸、约200到约300个腺嘌呤核苷酸、约250到约500个腺嘌呤核苷酸、约250到约450个腺嘌呤核苷酸、约250到约400个腺嘌呤核苷酸、约250到约350个腺嘌呤核苷酸、或约250到约300个腺嘌呤核苷酸或任何中间范围的腺嘌呤核苷酸。
描述多核苷酸方向的术语包含:5'(通常是具有游离磷酸根基团的多核苷酸的末端)和3'(通常是具有游离羟基(OH)基团的多核苷酸的末端)。多核苷酸序列可以以5'到3'方向或3'到5'方向注释。对于DNA和mRNA,5'到3'链被称为“正义”、“正”或“编码”链,因为其序列与前信使(前mRNA)的序列相同[RNA中的尿嘧啶(U)除外,而不是DNA中的胸腺嘧啶(T)]。对于DNA和mRNA,互补3'到5'链,其是由RNA聚合酶转录的链,被称为“模板”、“反义”、“负”或“非编码”链。如本文使用,术语“反向”是指以3'到5'方向写入的5'到3'序列或以5'到3'方向写入的3'到5'序列。
术语“互补的”和“互补性”是指通过碱基配对规则相关的多核苷酸(即,核苷酸序列)。例如,DNA序列5'A G T C A T G 3'的互补链是3'T C A G T A C 5'。后一序列通常被写为反向互补,其中5'末端在左,3'末端在右,即5'C A T G A C T 3'。与其反向互补相等的序列被称为回文序列。互补性可以是“部分的”,其中根据碱基配对规则仅匹配一些核酸碱基。或者,核酸之间可以存在“完全”或“全”互补性。
可以使用本领域已知和可获得的各种成熟技术中的任何一种来制备、操作、表达和/或递送多核苷酸。为了表达所需多肽,可以将编码多肽的核苷酸序列插入合适的载体中。还可以通过将编码多肽的mRNA递送到细胞中来表达所需多肽。
载体的说明性实例包含但不限于质粒、自主复制序列和转座因子,例如SleepingBeauty、PiggyBac。
载体的另外的说明性实例包含但不限于质粒、噬菌粒、粘粒、人工染色体(例如,酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1衍生的人工染色体(PAC))、噬菌体(例如,λ噬菌体或M13噬菌体)和动物病毒。
可用作载体的病毒的说明性实例包含但不限于逆转录病毒(包含慢病毒和整合缺陷型慢病毒)、腺病毒、腺相关病毒、疱疹病毒(例如,单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒和乳多空病毒(例如,SV40)。
表达载体的说明性实例包含但不限于用于在哺乳动物细胞中的表达的pClneo载体(Promega);用于慢病毒介导的基因转移和在哺乳动物细胞中的表达的pLenti4/V5-DESTTM、pLenti6/V5-DESTTM和pLenti6.2/V5-GW/lacZ(Invitrogen)。在特定实施例中,本文公开的多肽的编码序列可以连接到这些用于在哺乳动物细胞中表达多肽的表达载体中。
在特定实施例中,载体是附加型载体或在染色体外维持的载体。如本文使用,术语“附加型的”是指能够复制而不整合到宿主的染色体DNA中且不会从分裂的宿主细胞中逐渐丧失的载体,这也表示所述载体在染色体外或附加地复制。
在特定实施例中,为了实现多个多肽中的每一个的有效翻译,可以通过一种或多种IRES序列或编码自切割多肽的多核苷酸序列分开多核苷酸序列。
如本文使用,“内部核糖体进入位点”或“IRES”是指促进直接内部核糖体进入顺反子(蛋白质编码区)的起始密码子(例如,ATG)的元件,从而导致基因的帽非依赖性翻译。参见例如Jackson等人,1990年,《生物化学的发展趋势(Trends Biochem Sci)》,15(12):477-83)和Jackson和Kaminski,1995年,《核糖核酸(RNA)》,1(10):985-1000。本领域技术人员通常采用的IRES的实例包含美国专利第6,692,736号中所述的那些。本领域已知的“IRES”的另外的实例包含但不限于可从小核糖核酸病毒获得的IRES(Jackson等人,1990年)和可从病毒或细胞mRNA来源获得的IRES,诸如例如免疫球蛋白重链结合蛋白(BiP)、血管内皮生长因子(VEGF)(Huez等人,1998年,《分子细胞生物学(Mol.Cell.Biol.)》,18(11):6178-6190)、成纤维细胞生长因子2(FGF-2)和胰岛素样生长因子(IGFII)、翻译起始因子eIF4G和酵母转录因子TFIID和HAP4、可从Novagen商购获得的脑心肌炎病毒(EMCV)(Duke等人,1992年,《病毒学杂志(J.Virol)》,66(3):1602-9)和VEGF IRES(Huez等人,1998年,《分子细胞生物学(Mol Cell Biol)》,18(11):6178-90)。在小核糖核酸病毒科、二顺反子病毒科和黄病毒科种的病毒基因组中以及HCV、弗里德小鼠白血病病毒(FrMLV)和莫洛尼小鼠白血病病毒(MoMLV)中也报道了IRES。
在一个实施例中,本文考虑的多核苷酸中使用的IRES是EMCV IRES。
在特定实施例中,多核苷酸包括具有共有Kozak序列并编码所需多肽的多核苷酸。如本文使用,术语“Kozak序列”是指短核苷酸序列,其极大地促进mRNA与核糖体的小亚单位的初始结合并增加翻译。共有Kozak序列是(GCC)RCCATGG(SEQ ID NO:66),其中R是嘌呤(A或G)(Kozak,1986年,《细胞(Cell)》,44(2):283-92,和Kozak,1987年,《核酸研究(NucleicAcids Res.)》,15(20):8125-48)。
指导异源核酸转录物的有效终止和多聚腺苷酸化的元件增加了异源基因表达。
在特定实施例中,载体包括编码待表达多肽的多核苷酸的多聚腺苷酸化序列3'。本文使用的术语“聚(A)位点”或“聚(A)序列”表示通过RNA聚合酶II指导新生RNA转录物的终止和多聚腺苷酸化的DNA序列。多聚腺苷酸化序列可以通过向编码序列的3'末端加入聚(A)尾来促进mRNA稳定性,因此有助于提高翻译效率。切割和聚腺苷酸化由RNA中的聚(A)序列指导。哺乳动物前mRNA的核心聚(A)序列具有位于切割-多聚腺苷酸化位点侧翼的两个识别元件。通常,几乎不变的AAUAAA六聚体位于富含U或GU残基的更可变元件上游20-50个核苷酸处。新生转录物的切割发生在这两种元件之间,并且与向5'切割产物加入多达250个腺苷相结合(coupled)。在特定实施例中,核心聚(A)序列是合成聚(A)序列(例如,AATAAA、ATTAAA、AGTAAA)。聚(A)序列的说明性实例包含但不限于SV40聚(A)序列、牛生长激素聚(A)序列(BGHpA)、兔β-珠蛋白聚(A)序列(rβgpA)或本领域已知的另一种合适的异源或内源聚(A)序列。
在特定实施例中,可以通过非病毒和病毒方法将编码一种或多种核酸酶变体、megaTAL、末端加工酶或融合多肽的多核苷酸导入造血细胞,例如T细胞。在特定实施例中,可以通过相同的方法或通过不同的方法,和/或通过相同的载体或通过不同的载体提供一种或多种编码核酸酶和/或供体修复模板的多核苷酸的递送。
术语“载体”在本文中用于指能够转移或转运另一种核酸分子的核酸分子。转移的核酸通常与载体核酸分子连接,例如插入载体核酸分子中。载体可以包含指导细胞中自主复制的序列,或者可以包含足以允许整合到宿主细胞DNA中的序列。在特定实施例中,非病毒载体用于将本文考虑的一个或多个多核苷酸递送到T细胞。
非病毒载体的说明性实例包含但不限于质粒(例如,DNA质粒或RNA质粒)、转座子、粘粒和细菌人工染色体。
特定实施例中考虑的非病毒递送多核苷酸的说明性方法包含但不限于:电穿孔、声致穿孔、脂质转染、显微注射、基因枪(biolistics)、病毒体、脂质体、免疫脂质体、纳米粒子、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒粒子、DEAE-葡聚糖介导的转移、基因枪和热休克。
适用于特定实施例中考虑的特定实施例的多核苷酸递送系统的说明性实例包含但不限于由Amaxa Biosystems、Maxcyte,Inc.、BTX Molecular Delivery Systems和Copernicus Therapeutics Inc.提供的那些。脂质转染试剂是市售的(例如,TransfectamTM和LipofectinTM)。适用于多核苷酸的有效受体识别脂质转染的阳离子和中性脂质已在文献中描述。参见例如Liu等人(2003年),《基因疗法(Gene Therapy)》,10:180–187;和Balazs等人(2011年),《药物递送杂志(Journal of Drug Delivery)》,2011:1-12。在特定实施例中还考虑了抗体靶向的、细菌衍生的、基于非生物纳米细胞的递送。
F.细胞
通过特定实施例中考虑的方法制备的基因组编辑的细胞包括TCRα基因中的一个或多个基因编辑,并且提供用于预防、治疗或改善癌症、GVHD、传染病、自身免疫疾病、免疫缺陷或与之相关的病状中的至少一种症状的改进的基于细胞的治疗剂。不希望受任何特定理论的束缚,据信通过本文考虑的方法制备的基因组编辑的免疫效应细胞具有优异的性质,包含提高的及改善的体内安全性、效力和耐久性。
特定实施例中考虑的基因组编辑的细胞可以是自体的(autologous/autogeneic)(“自身的”)或非自体的(“非自身的”,例如同种异体的、同源的或异种的)。如本文使用,“自体的”是指来自相同受试者的细胞。如本文使用,“同种异体的”是指相同物种的与比较细胞在遗传学上不同的的细胞。如本文使用,“同源的”是指不同受试者的与比较细胞在遗传学相同的细胞。如本文使用,“异种的”是指与比较细胞不同的物种的细胞。在优选实施例中,细胞获自哺乳动物受试者。在一个更优选实施例中,细胞获自灵长类动物受试者,任选地获自非人灵长类动物。在最优选实施例中,细胞获自人类受试者。
“分离的细胞”是指非天然存在的细胞,例如自然界中不存在的细胞、修饰的细胞、改造的细胞等,其已从体内组织或器官获得并且基本上不含细胞外基质。
如本文使用,术语“细胞群”是指多个细胞,其可以由任何数量和/或组合的同质或异质细胞类型构成,如本文其它地方所述。例如,为了转导T细胞,可以从外周血分离或获得细胞群。细胞群可以占待编辑的靶细胞类型的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或约100%。在某些实施例中,可以使用本领域已知的方法从异质细胞群分离或纯化T细胞。
可以使用本文考虑的组合物和方法编辑其基因组的细胞类型的说明性实例包含但不限于细胞系、原代细胞、干细胞、祖细胞和分化细胞及其混合物。
在一个优选实施例中,基因组编辑组合物和方法用于编辑造血细胞,更优选免疫细胞,甚至更优选T细胞。
术语“T细胞”或“T淋巴细胞”是本领域公认的并且旨在包含胸腺细胞、免疫效应细胞、调节T细胞、幼稚T淋巴细胞、未成熟T淋巴细胞、成熟T淋巴细胞、静息T淋巴细胞或活化T淋巴细胞。T细胞可以是T辅助(Th)细胞,例如T辅助1(Th1)或T辅助2(Th2)细胞。T细胞可以是辅助T细胞(HTL;CD4+T细胞)CD4+T细胞、细胞毒性T细胞(CTL;CD8+T细胞)、肿瘤浸润细胞毒性T细胞(TIL;CD8+T细胞)、CD4+CD8+T细胞、CD4-CD8-T细胞或任何其它T细胞亚群。在一个实施例中,T细胞是免疫效应细胞。在一个实施例中,T细胞是NKT细胞。适用于特定实施例的其它说明性T细胞群包含幼稚T细胞和记忆T细胞。
在各个实施例中,基因组编辑的细胞包括免疫效应细胞,其包括通过本文考虑的组合物和方法编辑的TCRα基因。“免疫效应细胞”是免疫系统的任何细胞,其具有一种或多种效应子功能(例如,细胞毒性细胞杀伤活性、细胞因子的分泌,ADCC和/或CDC的诱导)。在特定实施例中考虑的示例性免疫效应细胞是T淋巴细胞,特别是细胞毒性T细胞(CTL;CD8+T细胞)、TIL和辅助T细胞(HTL;CD4+T细胞)。在一个实施例中,免疫效应细胞包含自然杀伤(NK)细胞。在一个实施例中,免疫效应细胞包含自然杀伤T(NKT)细胞。
“有效T细胞”和“幼小T细胞”在特定实施例中可互换使用,并且是指T细胞表型,其中T细胞能够增殖并伴随分化减少。在特定实施例中,幼小T细胞具有“幼稚T细胞”的表型。在特定实施例中,幼小T细胞包括以下生物学标志物中的一种或多种或全部:CD62L、CCR7、CD28、CD27、CD122、CD127、CD197和CD38。在一个实施例中,幼小T细胞包括以下生物学标志物中的一种或多种或全部:CD62L、CD127、CD197和CD38。在一个实施例中,幼小T细胞缺少CD57、CD244、CD160、PD-1、CTLA4和LAG3的表达。
T细胞可以获自许多来源,包含但不限于外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、来自感染部位的组织、腹水、胸腔积液、脾脏组织或肿瘤。
在特定实施例中,细胞群包括免疫效应细胞或T细胞,其包括归巢核酸内切酶变体或megaTAL,其靶向如本文考虑的TCRα基因恒定区的外显子1。
在特定实施例中,细胞群包括免疫效应细胞或T细胞,其包括归巢核酸内切酶变体多肽或megaTAL多肽,其靶向如本文考虑的TCRα基因恒定区的外显子1。
在特定实施例中,细胞群包括免疫效应细胞或T细胞,其包括编码归巢核酸内切酶变体或megaTAL的载体,所述归巢核酸内切酶变体或megaTAL靶向如本文考虑的TCRα基因恒定区的外显子1。
在特定实施例中,细胞群包括免疫效应细胞或T细胞,其包括编码归巢核酸内切酶变体或megaTAL的mRNA,所述归巢核酸内切酶变体或megaTAL靶向如本文考虑的TCRα基因恒定区的外显子1。
G.组合物和制剂
特定实施例中考虑的组合物可以包括一个或多个多肽、多核苷酸、包括其的载体以及基因组编辑组合物和基因组编辑的细胞组合物,如本文所考虑。特定实施例中考虑的基因组编辑组合物和方法可用于编辑细胞或细胞群中人T细胞受体α(TCRα)基因中的靶位点。在优选实施例中,基因组编辑组合物用于编辑造血细胞(例如,T细胞或免疫效应细胞)中的TCRα基因。
在各个实施例中,本文考虑的组合物包括核酸酶变体,和任选的末端加工酶,例如3'-5'核酸外切酶(Trex2)。核酸酶变体可以是mRNA的形式,其通过上文公开的多核苷酸递送方法(例如,电穿孔、脂质纳米颗粒等)导入细胞中。在一个实施例中,包括编码归巢核酸内切酶变体或megaTAL和任选的3'-5'核酸外切酶的mRNA的组合物通过上文公开的多核苷酸递送方法导入细胞中。所述组合物可以用于通过容易出错的NHEJ生成基因组编辑的细胞或基因组编辑的细胞群。
在各个实施例中,本文考虑的组合物包括供体修复模板。可以将组合物递送到表达或将表达核酸酶变体和任选的末端加工酶的细胞。在一个实施例中,可以将组合物递送到表达或将表达归巢核酸内切酶变体或megaTAL和任选的3'-5'核酸外切酶的细胞。在存在供体修复模板的情况下基因编辑酶的表达可以用于通过HDR生成基因组编辑的细胞或基因组编辑的细胞群。
组合物包含但不限于药物组合物。“药物组合物”是指药学上可接受的或生理学上可接受的溶液中配制的组合物,其单独或与一种或多种其它治疗方式组合施用于细胞或动物。还应理解,如果需要,组合物也可以与其它试剂联合施用,例如细胞因子、生长因子、激素、小分子、化学治疗剂、前药、药物、抗体或其它各种药物活性剂。对组合物中也可能包含的其它组分实际上没有限制,条件是另外的试剂不会不利地影响组合物。
短语“药学上可接受的”在本文中用于指在合理的医学判断范围内适合用于与人类和动物的组织接触而不引起过量毒性、刺激、过敏反应或其它问题或并发症,与合理的利益/风险比相称的那些化合物、材料、组合物和/或剂型。
术语“药学上可接受的载剂”是指与治疗细胞一起施用的稀释剂、佐剂、赋形剂或媒剂。药物载剂的说明性实例可以是无菌液体,例如细胞培养基、水和油,所述油包含石油、动物、植物或合成来源的那些,例如花生油、大豆油、矿物油、芝麻油等。盐水溶液和葡萄糖水溶液和甘油溶液也可以用作液体载剂,特别是用于可注射溶液。在特定实施例中,合适的药物赋形剂包含淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂奶粉、甘油、丙烯、乙二醇、水、乙醇等。除非任何常规培养基或试剂与活性成分不相容,否则考虑其在治疗组合物中的使用。补充的活性成分也可以掺入组合物中。
在一个实施例中,包括药学上可接受的载剂的组合物适于施用于受试者。在特定实施例中,包括载剂的组合物适于肠胃外施用,例如血管内(静脉内或动脉内),腹膜内或肌肉内施用。在特定实施例中,包括药学上可接受的载剂的组合物适用于心室内、脊柱内或鞘内施用。药学上可接受的载剂包含无菌水溶液、细胞培养基或分散体。这些培养基和试剂用于药物活性物质的用途是本领域熟知的。除非任何常规培养基或试剂与转导的细胞不相容,否则考虑其在药物组合物中的使用。
在特定实施例中,本文考虑的组合物包括遗传修饰的T细胞和药学上可接受的载剂。包括本文考虑的基于细胞的组合物的组合物可以通过肠内或肠胃外施用方法单独施用或与其它合适的化合物组合施用以实现期望的治疗目标。
药学上可接受的载剂必须具有足够高的纯度和足够低的毒性,以使其适合于向待治疗的人类受试者施用。它还应该保持或增加组合物的稳定性。药学上可接受的载剂可以是液体或固体,并且考虑到计划的施用方式,当与组合物的其它组分组合时,选择药学上可接受的载剂以提供所需的体积、稠度等。例如,药学上可接受的载剂可以是但不限于粘合剂(例如,预胶化的玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素等)、填充剂(例如,乳糖和其它糖、微晶纤维素、果胶、明胶、硫酸钙、乙基纤维素、聚丙烯酸酯、磷酸氢钙等)、润滑剂(例如,硬脂酸镁、滑石、二氧化硅、胶体二氧化硅、硬脂酸、金属硬脂酸盐、氢化植物油、玉米淀粉、聚乙二醇、苯甲酸钠、乙酸钠等)、崩解剂(例如,淀粉、羟基乙酸淀粉钠等)、或润湿剂(例如,月桂基硫酸钠等)。用于本文考虑的组合物的其它合适的药学上可接受的载剂包含但不限于水、盐溶液、醇、聚乙二醇、明胶、直链淀粉、硬脂酸镁、滑石、硅酸、粘性石蜡、羟甲基纤维素、聚乙烯吡咯烷酮等。
这些载剂溶液还可以含有缓冲剂、稀释剂和其它合适的添加剂。本文使用的术语“缓冲剂”是指其化学组成中和酸或碱而没有显著pH变化的溶液或液体。本文考虑的缓冲剂的实例包含但不限于杜尔贝科磷酸盐缓冲盐水(PBS)、林格氏溶液、5%葡萄糖水溶液(D5W)、正常/生理盐水(0.9%NaCl)。
药学上可接受的载剂可以以足以维持组合物的pH为约7的量存在。可替代地,组合物的pH在约6.8到约7.4的范围内,例如为6.8、6.9、7.0、7.1、7.2、7.3和7.4。在再一个实施例中,组合物的pH为约7.4。
本文考虑的组合物可以包括无毒的药学上可接受的培养基。所述组合物可以是混悬液。本文使用的术语“混悬”是指其中细胞不附着于固体支持物的非粘附条件。例如,可以对保持为混悬液的细胞搅动或搅拌,并且不将其粘附到支持物,例如培养皿。
在特定实施例中,本文考虑的组合物配制在混悬液中,其中基因组编辑的T细胞分散在可接受的液体培养基或溶液(例如,盐水或无血清培养基)、静脉输液(IV)袋等等中。可接受的稀释剂包含但不限于水、勃脉力、林格氏溶液、等渗氯化钠(盐水)溶液、无血清细胞培养基和适于低温储存的培养基(例如,培养基)。
在某些实施例中,药学上可接受的载剂基本上不含人类或动物来源的天然蛋白质,并且适合于储存包括基因组编辑的T细胞群的组合物。治疗组合物旨在施用于人类患者,因此基本上不含细胞培养组分,例如牛血清白蛋白、马血清和胎牛血清。
在一些实施例中,将组合物配制在药学上可接受的细胞培养基中。此类组合物适合于向人类受试者施用。在特定实施例中,药学上可接受的细胞培养基是无血清培养基。
与含有血清的培养基相比,无血清培养基具有几个优点,包含简化并更好地定义了组合物,降低了污染程度,消除了传染源的潜在来源并降低了成本。在各个实施例中,无血清培养基是无动物的,并且可以任选地不含蛋白质。任选地,培养基可以含有生物药学上可接受的重组蛋白。“无动物”培养基是指其中组分来源于非动物来源的培养基。重组蛋白质在无动物培养基中代替天然动物蛋白质,并且营养物质从合成、植物或微生物来源获得。相反,“无蛋白”培养基被定义为基本上不含蛋白质。
用于特定组合物的无血清培养基的说明性实例包含但不限于QBSF-60(QualityBiological,Inc.)、StemPro-34(Life Technologies)和X-VIVO 10。
在一个优选实施例中,将包括基因组编辑的T细胞的组合物配制在勃脉力中。
在各个实施例中,将包括基因组编辑的T细胞的组合物配制在低温保存培养基中。例如,具有低温保存剂的低温保存培养基可以用于在解冻后维持高细胞活力结果。用于特定组合物的低温保存培养基的说明性实例包含但不限于CryoStor CS10、CryoStor CS5和CryoStor CS2。
在一个实施例中,将组合物配制在包括50:50的勃脉力A与CryoStor CS10的溶液中。
在特定实施例中,所述组合物基本上不含支原体、内毒素和微生物污染。相对于内毒素而言,“基本上不含”是指每细胞剂量的内毒素含量少于FDA针对生物剂所允许的含量,其为每天5EU/kg体重的总内毒素,即对于平均70公斤的人而言,每总细胞剂量为350EU。在特定实施例中,包括用本文考虑的逆转录病毒载体转导的造血干细胞或祖细胞的组合物含有约0.5EU/mL到约5.0EU/mL,或约0.5EU/mL、1.0EU/mL、1.5EU/mL、2.0EU/mL、2.5EU/mL、3.0EU/mL、3.5EU/mL、4.0EU/mL、4.5EU/mL或5.0EU/mL。
在某些实施例中,考虑了适合于递送多核苷酸的组合物和制剂,包含但不限于编码一种或多种重编程的核酸酶和任选的末端加工酶的一种或多种mRNA。
用于离体递送的示例性制剂还可以包含使用本领域已知的各种转染剂,例如磷酸钙、电穿孔、热休克和各种脂质体制剂(即脂质介导的转染)。如下面更详细描述,脂质体是包裹一部分水性流体的脂质双层。DNA自发地缔合到阳离子脂质体的外表面(凭借其电荷),并且这些脂质体将与细胞膜相互作用。
在特定实施例中,药学上可接受的载剂溶液的制剂是本领域技术人员公知的,例如开发合适的给药和治疗方案以将本文所述的特定组合物用于各种治疗方案中,包含例如肠内和肠胃外,例如血管内、静脉内、动脉内、骨内、心室内、脑内、颅内、脊柱内、鞘内和髓内施用和配制。本领域技术人员将理解,本文考虑的特定实施例可以包括其它制剂,例如制药领域熟知的制剂,其描述于例如《雷明顿:药学的科学与实践(Remington:The Science andPractice of Pharmacy)》,第I卷和第II卷,第22版,Loyd V.Allen Jr.编辑,费城,宾夕法尼亚:医药出版社;2012年中,其全部内容通过引用并入本文。
本说明书中引用的所有出版物、专利申请和授权专利均通过引用并入本文中,如同每个单独的出版物、专利申请或授权专利被具体地和单独地指出以通过引用并入。
尽管为了清楚理解的目的已经通过说明和实例详细地描述了前述实施例,但是根据本文考虑的教导,本领域普通技术人员将容易明白,可以在不脱离所附权利要求的精神或范围的情况下做出某些改变和修改。以下实例仅以说明的方式提供,而不是作为限制。本领域技术人员将容易地认识到可以改变或修改以产生基本相似结果的各种非关键参数。
实例
实例1
改进靶向人TCRα基因的I-OnuI变体的选择性
在靶向人TCRα基因恒定区中的外显子1的I-OnuI变体(SEQ ID NO:6)(“原始TCRαI-OnuI变体”)的DNA识别界面区域中标识亚最佳选择性区域。发现靶位点中的位置p4、p5和p6相对耐受碱基对取代。核苷酸在TCRα靶上位点(p456处的CCG)(SEQ ID NO:17)和KAT2B基因的内含子6中的频繁脱靶位点中(p456处的ACA,参见Osborne等人,2015年)(图1,SEQ IDNO:21)的这些位置处不同。开发了包括在这些位置具有增强的选择性的结构域的I-OnuI变体,以改进总体选择性性质以及KAT2B脱靶位点(SEQ ID NO:21)处的活性的特异性降低。
检查与其天然靶位点复合的野生型I-OnuI蛋白(例如,SEQ ID NO:1-5)的晶体结构,标识了可能接触或接近位置p456的8个氨基酸残基的子集。对靶向人TCRα基因的另一种I-OnuI变体的局部分析标识了与靶向I-OnuI变体的原始TCRα相比具有显著更高的CCG选择性的氨基酸。将靶向I-OnuI变体的TCRα中负责高CCG三联体选择性的氨基酸插入原始TCRαI-OnuI变体中以生成TCRα2.0I-OnuI变体(SEQ ID NO:7)(图2)。使用酵母表面展示针对p456底物位置处的所有64个核苷酸组合评估TCRα2.0I-OnuI变体酶活性(图3)。TCRα2.0 I-OnuI变体表现出显著更好的底物辨别,这由与原始TCRαI-OnuI变体相比切割更少的底物来标记。
实例2
改进TCRα 2.0 megaTAL的催化活性
TCRα基因座的破坏阻止了CD3向细胞表面的运输。可以使用荧光标记的抗CD3抗体和流式细胞术测量CD3表达。基因编辑效率与CD3荧光成反比。
用CD3和CD28活化原代人T细胞,并用体外转录的mRNA电穿孔,所述mRNA编码形式为megaTAL的原始TCRαHE变体(例如,SEQ ID NO:13)或形式为megaTAL的TCRα2.0 HE变体(例如,SEQ ID NO:14)。尽管在p456底物位置处表现出显著增强的选择性,但TCRα2.0megaTAL表现出降低的催化活性,这由与原始TCRα megaTAL相比CD3表达的增加来表示(图4)。随后从megaTAL处理的细胞中分离基因组DNA,并且通过使用PCR与靶位点处的分解跟踪插入缺失(TIDE,参见Brinkman等人,2014年)结合来确认降低的催化活性。
将在另一个I-OnuI变体中增加催化活性的单个氨基酸取代E178D插入TCRα2.0megaTAL的活性位点以生成TCRα2.1 megaTAL(SEQ ID NO:8)。将编码TCRα2.1megaTAL(例如,SEQ ID NO:15)的体外转录的mRNA电穿孔到原代人T细胞中。与TCRα2.0 megaTAL相比,TCRα2.1 megaTAL使CD3敲落增加10倍。图5。
实例3
TCRα2.1 I-OnuI变体和TCRα2.1 megaTAL表现出增强的靶上-脱靶辨别
治疗性基因组编辑具有一定程度的风险,这归因于极低频率的脱靶编辑事件。可以使用现有方法深入表征基因组编辑酶以用于脱靶编辑事件(参见Tsai等人,2016年)。
使用生物信息学算法标识潜在的脱靶位点,所述生物信息学算法扫描人基因组以寻找类似于TCRα靶序列的22-bp序列(SEQ ID NO:17)。使用酵母表面展示对从生物信息学搜索返回的前764个22-bp序列分别进行测定以确定原始TCRαHE变体和TCRα2.1HE变体的切割。与原始TCRα HE变体(图6)相比,TCRα2.1 HE变体表现出增加的对TCRα靶序列的选择性,与实例1中获得的结果一致。
使用来自764底物组的前50个切割的底物的序列信息进行第二生物信息学搜索,以进一步通知搜索。对这些进行测定以确定原始TCRα和TCRα2.1 HE的切割。与原始TCRα HE变体相比,精制的TCRα2.1 HE变体表现出增强的选择性谱。
采用整合酶缺陷型慢病毒载体(IDLV,参见Gabriel,2011年)的第二测定法用于标识另外的体内生成的脱靶位点。简而言之,在酶处理的细胞和空白对照处理的细胞内的双链断裂位点处捕获到IDLV。然后可以对IDLV整合的频率和位置进行绘图,并在两个群体之间进行比较。与空白对照处理的样品相比,酶处理的样品中特定基因组位点处的IDLV摄取频率增加表明酶促切割。使用此方法在KAT2B基因的内含子六(SEQ ID NO:21,Osborne等人,2015年)中标识了原始TCRα mega TAL的原代脱靶位点。
通过对由megaTAL处理的供体来源的原代T细胞生成的扩增子进行深度测序来评价所标识的推定脱靶位点(图7)。TCRα2.1 megaTAL消除了KAT2B基因座处的脱靶编辑,并表现出增强的对靶上位点的选择性,其中与原始TCRα megaTAL相比,潜在的脱靶位点处的活性降低。
实例4
TAL DNA结合结构域的扩展增加TCRα基因组编辑
MegaTAL包含与大范围核酸酶构造的TALE DNA结合结构域融合,以增加对所需靶序列的结合亲和力或寻址(参见Boissel等人,2013年)。为了进一步提高TCRα基因座处的靶上编辑效率,在TALE DNA结合结构域的C-末端附加另外的TALE RVD,以使TALE DNA结合结构域阵列的总长度从10.5增加到11.5个RVD重复并生成11.5RVD TCRα2.1megaTAL(例如,SEQ ID NO:12)。11.5RVD TALE DNA结合结构域识别原始TALE结合位点(SEQ ID NO:18),其中3'末端具有另外的核苷酸(SEQ ID NO:19)。
用编码10.5 RVD和11.5 RVD TCRα2.1 megaTAL的体外转录的mRNA电穿孔人原代T细胞。与使用10.5 RVD TCRα2.1 megaTAL的TCRα编辑相比,11.5 RVD TCRα2.1megaTAL使TCRα编辑增加30-50%,如使用流式细胞术通过CD3敲落测量(图8)。
实例5
变体N-末端TALE构造
MegaTAL是杂合核酸酶,其包含融合到TAL效应子(TALE)构造的归巢核酸内切酶,所述TAL效应子构造包括N-末端结构域、DNA结合结构域和C-末端结构域。一些TALE构造包括约136个氨基酸的最小N-末端区域(Δ-154'),可变数量的含有34个氨基酸RVD的重复(以截短的20个氨基酸重复终止)和约63个氨基酸的最小C-末端区域。
与前述实例中描述的归巢核酸内切酶融合的TALE构造包含衍生自水稻黄单胞菌TALE蛋白的序列。除了水稻黄单胞菌TALE结构域序列之外,最小N-末端TALE结构域(NTD)区域可以衍生自黄单胞菌属的其它成员,例如半透明黄单胞菌和柑橘黄单胞菌。N-末端TALE结构域的多序列比对示出了水稻黄单胞菌与半透明黄单胞菌和柑橘黄单胞菌分别具有85%和87%的序列相似性。为了评估是否可以使用替代物种NTD进一步增强TAL活性,通过合理地取代和组合内源半透明黄单胞菌和柑橘黄单胞菌序列中的以下氨基酸位置来生成杂合NTD:V152G、D153K、D165E、E166K、I167L、P169L、A173P、T174I、Q180E、M183I、H191Q、V205I、V207A、I224V、V227I、A236V、G249S、G257S、V271I(例如,SEQ ID NO:21);V152G、D153K、T170K、V171A、V183I、A200P、A236T、A239V、A244V、E245Q、G257S、L260V、V271I(例如,SEQ ID NO:24);T170K、A200P、Q230H、W231C、S232G、A236T、A239V、A244V、E245Q、G257S(例如,SEQ ID NO:23)。杂合序列(例如,SEQ ID NO:22,23,24)表现出与水稻黄单胞菌N-末端TAL结构域80%的相似性。将这些最小TALE结构域中的每一个单独移植到原始TCRα I-OnuI变体megaTAL的TALE DNA结合结构域的N-末端上。将编码包括TALE N-末端结构域(NTD)变体或水稻黄单胞菌NTD的变体megaTAL的体外转录的mRNA电穿孔到人原代T细胞中以评估TCRα基因座的编辑速率。CD3表达的流式细胞术分析表明,相对于包括水稻黄单胞菌NTD的原始TCRα megaTAL,包括NTD变体结构域的TCRα megaTAL表现出相似的活性,并且在一些情况下表现出略高的活性(图9)。
通常,在以下权利要求中,所使用的术语不应被解释为将权利要求限制为说明书和权利要求中公开的特定实施例,而是应被解释为包含所有可能的实施例以及这些权利要求所赋予的等同的全部范围。因此,权利要求不受本公开的限制。
序列表
<110> 蓝鸟生物公司(bluebird bio, Inc.)
乔丹·贾儒尔(Jarjour, Jordan)
马克·波格森(Pogson, Mark)
<120> TCRα归巢核酸内切酶变体
<130> BLBD-075/00US
<140> PCT/US2017/056178
<141> 2017-10-11
<150> US 62/406,689
<151> 2016-10-11
<150> US 62/414,266
<151> 2016-10-28
<160> 69
<170> SIPOSequenceListing 1.0
<210> 1
<211> 303
<212> PRT
<213> 新榆枯萎病菌(Ophiostoma novo-ulmi)
<400> 1
Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Met Leu Phe Lys Gln
100 105 110
Ala Phe Cys Val Met Glu Asn Lys Glu His Leu Lys Ile Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Ile Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
290 295 300
<210> 2
<211> 303
<212> PRT
<213> 新榆枯萎病菌(Ophiostoma novo-ulmi)
<400> 2
Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
290 295 300
<210> 3
<211> 303
<212> PRT
<213> 新榆枯萎病菌(Ophiostoma novo-ulmi)
<220>
<221> MOD_RES
<222> (1)..(3)
<223> 任何氨基酸或不存在
<400> 3
Xaa Xaa Xaa Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
290 295 300
<210> 4
<211> 303
<212> PRT
<213> 新榆枯萎病菌(Ophiostoma novo-ulmi)
<220>
<221> MOD_RES
<222> (1)..(4)
<223> 任何氨基酸或不存在
<220>
<221> MOD_RES
<222> (302)..(303)
<223> 任何氨基酸或不存在
<400> 4
Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa
290 295 300
<210> 5
<211> 303
<212> PRT
<213> 新榆枯萎病菌(Ophiostoma novo-ulmi)
<220>
<221> MOD_RES
<222> (1)..(8)
<223> 任何氨基酸或不存在
<220>
<221> MOD_RES
<222> (302)..(303)
<223> 任何氨基酸或不存在
<400> 5
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa
290 295 300
<210> 6
<211> 303
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的I-OnuI变体
<400> 6
Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg
20 25 30
Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Lys Ile Thr Asn Ser Gly Asp Arg Ala Val Met Leu Arg
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Asp Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Asn Ala
180 185 190
Lys Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile
210 215 220
Trp Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Glu Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
290 295 300
<210> 7
<211> 303
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的I-OnuI LHE变体
<220>
<221> MOD_RES
<222> (1)..(4)
<223> 任何氨基酸或不存在
<220>
<221> MOD_RES
<222> (302)..(303)
<223> 任何氨基酸或不存在
<400> 7
Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg
20 25 30
Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala
165 170 175
Gly Glu Gly His Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala
180 185 190
Lys Val Tyr Val Gly Leu Arg Phe Ala Ile Ser Gln His Ile Arg Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile
210 215 220
Arg Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Glu Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa
290 295 300
<210> 8
<211> 303
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的I-OnuI LHE变体
<220>
<221> MOD_RES
<222> (1)..(4)
<223> 任何氨基酸或不存在
<220>
<221> MOD_RES
<222> (302)..(303)
<223> 任何氨基酸或不存在
<400> 8
Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg
20 25 30
Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala
165 170 175
Gly Asp Gly His Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala
180 185 190
Lys Val Tyr Val Gly Leu Arg Phe Ala Ile Ser Gln His Ile Arg Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile
210 215 220
Arg Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Glu Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa
290 295 300
<210> 9
<211> 877
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的I-OnuI变体megaTAL构建体
<400> 9
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg
1 5 10 15
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
20 25 30
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
50 55 60
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
100 105 110
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe
580 585 590
Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn Asn
595 600 605
Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu His
610 615 620
Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val
625 630 635 640
Gly Lys Ile Thr Asn Ser Gly Asp Arg Ala Val Met Leu Arg Val Thr
645 650 655
Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro
660 665 670
Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe
675 680 685
Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu
690 695 700
Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Thr Asp Glu Leu
705 710 715 720
Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn
725 730 735
Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp
740 745 750
Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Asn Ala Lys Val
755 760 765
Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys Asn
770 775 780
Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp Glu
785 790 795 800
Lys Asn Lys Ser Glu Phe Ser Trp Leu Glu Phe Val Val Thr Lys Phe
805 810 815
Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu
820 825 830
Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys
835 840 845
Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile
850 855 860
Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
865 870 875
<210> 10
<211> 877
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的megaTAL构建体
<400> 10
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg
1 5 10 15
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
20 25 30
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
50 55 60
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
100 105 110
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe
580 585 590
Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn Asn
595 600 605
Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu His
610 615 620
Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val
625 630 635 640
Gly Lys Ile Thr Asn Ser Gly Asp Arg Ala Val Met Leu Arg Val Thr
645 650 655
Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro
660 665 670
Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe
675 680 685
Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu
690 695 700
Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Thr Asp Glu Leu
705 710 715 720
Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn
725 730 735
Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp
740 745 750
Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Asn Ala Lys Val
755 760 765
Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys Asn
770 775 780
Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp Glu
785 790 795 800
Lys Asn Lys Ser Glu Phe Ser Trp Leu Glu Phe Val Val Thr Lys Phe
805 810 815
Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu
820 825 830
Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys
835 840 845
Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile
850 855 860
Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
865 870 875
<210> 11
<211> 875
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的megaTAL构建体
<400> 11
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg
1 5 10 15
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
20 25 30
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
50 55 60
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
100 105 110
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe
580 585 590
Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn Asn
595 600 605
Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu His
610 615 620
Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val
625 630 635 640
Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val Thr
645 650 655
Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro
660 665 670
Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe
675 680 685
Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu
690 695 700
Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu
705 710 715 720
Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn
725 730 735
Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly Asp
740 745 750
Gly His Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys Val
755 760 765
Tyr Val Gly Leu Arg Phe Ala Ile Ser Gln His Ile Arg Asp Lys Asn
770 775 780
Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Arg Glu
785 790 795 800
Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Glu Val Thr Lys Phe
805 810 815
Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu
820 825 830
Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys
835 840 845
Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile
850 855 860
Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg
865 870 875
<210> 12
<211> 909
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的megaTAL构建体
<400> 12
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg
1 5 10 15
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
20 25 30
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
50 55 60
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
100 105 110
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
500 505 510
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
515 520 525
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile
530 535 540
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
545 550 555 560
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp
565 570 575
Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val
580 585 590
Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg
595 600 605
Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
610 615 620
Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg
625 630 635 640
Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr
645 650 655
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
660 665 670
Lys Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg
675 680 685
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
690 695 700
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
705 710 715 720
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
725 730 735
Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp
740 745 750
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu
755 760 765
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala
770 775 780
Gly Asp Gly His Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala
785 790 795 800
Lys Val Tyr Val Gly Leu Arg Phe Ala Ile Ser Gln His Ile Arg Asp
805 810 815
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile
820 825 830
Arg Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Glu Val Thr
835 840 845
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
850 855 860
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
865 870 875 880
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
885 890 895
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg
900 905
<210> 13
<211> 2634
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 合成的I-OnuI变体megaTAL构建体
<400> 13
augggauccg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60
agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120
gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180
gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240
acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300
uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360
gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420
gcacugacgg gugccccccu gaaccugacc ccggaccaag ugguggcuau cgccagcaac 480
auuggcggca agcaagcgcu cgaaacggug cagcggcugu ugccggugcu gugccaggac 540
cauggccuga ccccggacca agugguggcu aucgccagca acauuggcgg caagcaagcg 600
cucgaaacgg ugcagcggcu guugccggug cugugccagg accauggccu gaccccggac 660
caaguggugg cuaucgccag caacauuggc ggcaagcaag cgcucgaaac ggugcagcgg 720
cuguugccgg ugcugugcca ggaccauggc cugaccccgg accaaguggu ggcuaucgcc 780
agcaacggug gcggcaagca agcgcucgaa acggugcagc ggcuguugcc ggugcugugc 840
caggaccaug gccugacucc ggaccaagug guggcuaucg ccagccacga uggcggcaag 900
caagcgcucg aaacggugca gcggcuguug ccggugcugu gccaggacca uggccugacu 960
ccggaccaag ugguggcuau cgccagccac gauggcggca agcaagcgcu cgaaacggug 1020
cagcggcugu ugccggugcu gugccaggac cauggccuga ccccggacca agugguggcu 1080
aucgccagca acauuggcgg caagcaagcg cucgaaacgg ugcagcggcu guugccggug 1140
cugugccagg accauggccu gaccccggac caaguggugg cuaucgccag caacaauggc 1200
ggcaagcaag cgcucgaaac ggugcagcgg cuguugccgg ugcugugcca ggaccauggc 1260
cugaccccgg accaaguggu ggcuaucgcc agcaacggug gcggcaagca agcgcucgaa 1320
acggugcagc ggcuguugcc ggugcugugc caggaccaug gccugacccc ggaccaagug 1380
guggcuaucg ccagcaacaa uggcggcaag caagcgcucg aaacggugca gcggcuguug 1440
ccggugcugu gccaggacca uggccugacc ccggaccaag ugguggcuau cgccagcaac 1500
auuggcggca agcaagcgcu cgaaagcauu guggcccagc ugagccggcc ugauccggcg 1560
uuggccgcgu ugaccaacga ccaccucguc gccuuggccu gccucggcgg acguccugcc 1620
auggaugcag ugaaaaaggg auugccgcac gcgccggaau ugaucagaag agucaaucgc 1680
cguauuggcg aacgcacguc ccaucgcguu gcgauaucua gagugggagg aagcucgcgc 1740
agagagucca ucaacccaug gauucugacu gguuucgcug augccgaagg aucauucaua 1800
cuagacaucc gcaaccgaaa caacgaaagc aacagauacc gaacuucgcu gagauuccag 1860
aucacccugc acaacaagga caaaucgauu cuggagaaua uccagucgac uuggaagguc 1920
ggcaagauca caaacagcgg cgacagagcc gucaugcuga gggucacccg uuucgaagau 1980
uugaaaguga uuaucgacca cuucgagaaa uauccgcuga uuacccagaa auugggcgau 2040
uacaaguugu uuaaacaggc auucagcguc auggagaaca aagaacaucu uaaggagaau 2100
gggauuaagg agcucguacg aaucaaagcu aagaugaauu ggggucucac ugacgaauug 2160
aaaaaagcau uuccagagaa cauuagcaaa gagcgccccc uuaucaauaa gaacauuccg 2220
aauuucaaau ggcuggcugg auucacaucu ggugauggcu acuucggcgu gaaucuaaaa 2280
aagguaaagg gcaacgcaaa gguauacgug ggacugagau ucucaaucuc acagcacauc 2340
agagacaaga accugaugaa uucauugaua acauaccuag gcugugguuc caucugggag 2400
aagaacaagu cugaguucag uuggcucgag uucgucguaa ccaaauucag cgauaucaac 2460
gacaagauca uuccgguauu ccaggaaaau acucugauug gcgucaaacu cgaggacuuu 2520
gaagauuggu gcaagguugc caaauugauc gaagagaaga aacaccugac cgaauccggu 2580
uuggaugaga uuaagaaaau caagcugaac augaacaaag gucgugucuu cuga 2634
<210> 14
<211> 2634
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 合成的megaTAL构建体
<400> 14
augggauccg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60
agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120
gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180
gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240
acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300
uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360
gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420
gcacugacgg gugccccccu gaaccugacc ccggaccaag ugguggcuau cgccagcaac 480
auuggcggca agcaagcgcu cgaaacggug cagcggcugu ugccggugcu gugccaggac 540
cauggccuga ccccggacca agugguggcu aucgccagca acauuggcgg caagcaagcg 600
cucgaaacgg ugcagcggcu guugccggug cugugccagg accauggccu gaccccggac 660
caaguggugg cuaucgccag caacauuggc ggcaagcaag cgcucgaaac ggugcagcgg 720
cuguugccgg ugcugugcca ggaccauggc cugaccccgg accaaguggu ggcuaucgcc 780
agcaacggug gcggcaagca agcgcucgaa acggugcagc ggcuguugcc ggugcugugc 840
caggaccaug gccugacucc ggaccaagug guggcuaucg ccagccacga uggcggcaag 900
caagcgcucg aaacggugca gcggcuguug ccggugcugu gccaggacca uggccugacu 960
ccggaccaag ugguggcuau cgccagccac gauggcggca agcaagcgcu cgaaacggug 1020
cagcggcugu ugccggugcu gugccaggac cauggccuga ccccggacca agugguggcu 1080
aucgccagca acauuggcgg caagcaagcg cucgaaacgg ugcagcggcu guugccggug 1140
cugugccagg accauggccu gaccccggac caaguggugg cuaucgccag caacaauggc 1200
ggcaagcaag cgcucgaaac ggugcagcgg cuguugccgg ugcugugcca ggaccauggc 1260
cugaccccgg accaaguggu ggcuaucgcc agcaacggug gcggcaagca agcgcucgaa 1320
acggugcagc ggcuguugcc ggugcugugc caggaccaug gccugacccc ggaccaagug 1380
guggcuaucg ccagcaacaa uggcggcaag caagcgcucg aaacggugca gcggcuguug 1440
ccggugcugu gccaggacca uggccugacc ccggaccaag ugguggcuau cgccagcaac 1500
auuggcggca agcaagcgcu cgaaagcauu guggcccagc ugagccggcc ugauccggcg 1560
uuggccgcgu ugaccaacga ccaccucguc gccuuggccu gccucggcgg acguccugcc 1620
auggaugcag ugaaaaaggg auugccgcac gcgccggaau ugaucagaag agucaaucgc 1680
cguauuggcg aacgcacguc ccaucgcguu gcgauaucua gagugggagg aagcucgcgc 1740
agagagucca ucaacccaug gauucugacu gguuucgcug augccgaagg aucauucaua 1800
cuagacaucc gcaaccgaaa caacgaaagc aacagauacc gaacuucgcu gagauuccag 1860
aucacccugc acaacaagga caaaucgauu cuggagaaua uccaguccac uuggaagguc 1920
ggcaagauca caaacagcag ugacagagcc gucaugcuga gggucacccg uuucgaagau 1980
uugaaaguga uuaucgacca cuucgagaaa uauccgcuga uuacccagaa auugggcgau 2040
uacaaguugu uuaaacaggc auucagcguc auggagaaua aagaacaucu uaaggagaau 2100
gggauuaagg agcucguacg aaucaaagcu aagaugaauu ggggucucaa ugacgaauug 2160
aaaaaagcau uuccagagaa cauuagcaaa gagcgccccc uuaucaauaa gaacauuccg 2220
aauuucaaau ggcuggcugg auucacagcu ggugaaggcc auuucggcgu gaaucuaaaa 2280
aagguaaagg gcaccgcaaa gguauacgug ggacugagau ucgcuaucuc acagcacauc 2340
agagacaaga accugaugaa uucauugaua acauaccuag gcugugguuc caucagagag 2400
aagaacaagu cugaguucag auggcucgag uucgaaguaa ccaaauucag cgauaucaac 2460
gacaagauca uuccgguauu ccaggaaaau acucugauug gcgucaaacu cgaggacuuu 2520
gaagauuggu gcaagguugc caaauugauc gaagagaaga aacaccugac cgaauccggu 2580
uuggaugaga uuaagaaaau caagcugaac augaacaaag gucgugucuu cuga 2634
<210> 15
<211> 2628
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 合成的megaTAL构建体
<400> 15
augggauccg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60
agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120
gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180
gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240
acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300
uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360
gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420
gcacugacgg gugccccccu gaaccugacc ccggaccaag ugguggcuau cgccagcaac 480
auuggcggca agcaagcgcu cgaaacggug cagcggcugu ugccggugcu gugccaggac 540
cauggccuga ccccggacca agugguggcu aucgccagca acauuggcgg caagcaagcg 600
cucgaaacgg ugcagcggcu guugccggug cugugccagg accauggccu gaccccggac 660
caaguggugg cuaucgccag caacauuggc ggcaagcaag cgcucgaaac ggugcagcgg 720
cuguugccgg ugcugugcca ggaccauggc cugaccccgg accaaguggu ggcuaucgcc 780
agcaacggug gcggcaagca agcgcucgaa acggugcagc ggcuguugcc ggugcugugc 840
caggaccaug gccugacucc ggaccaagug guggcuaucg ccagccacga uggcggcaag 900
caagcgcucg aaacggugca gcggcuguug ccggugcugu gccaggacca uggccugacu 960
ccggaccaag ugguggcuau cgccagccac gauggcggca agcaagcgcu cgaaacggug 1020
cagcggcugu ugccggugcu gugccaggac cauggccuga ccccggacca agugguggcu 1080
aucgccagca acauuggcgg caagcaagcg cucgaaacgg ugcagcggcu guugccggug 1140
cugugccagg accauggccu gaccccggac caaguggugg cuaucgccag caacaauggc 1200
ggcaagcaag cgcucgaaac ggugcagcgg cuguugccgg ugcugugcca ggaccauggc 1260
cugaccccgg accaaguggu ggcuaucgcc agcaacggug gcggcaagca agcgcucgaa 1320
acggugcagc ggcuguugcc ggugcugugc caggaccaug gccugacccc ggaccaagug 1380
guggcuaucg ccagcaacaa uggcggcaag caagcgcucg aaacggugca gcggcuguug 1440
ccggugcugu gccaggacca uggccugacc ccggaccaag ugguggcuau cgccagcaac 1500
auuggcggca agcaagcgcu cgaaagcauu guggcccagc ugagccggcc ugauccggcg 1560
uuggccgcgu ugaccaacga ccaccucguc gccuuggccu gccucggcgg acguccugcc 1620
auggaugcag ugaaaaaggg auugccgcac gcgccggaau ugaucagaag agucaaucgc 1680
cguauuggcg aacgcacguc ccaucgcguu gcgauaucua gagugggagg aagcucgcgc 1740
agagagucca ucaacccaug gauucugacu gguuucgcug augccgaagg aucauucaua 1800
cuagacaucc gcaaccgaaa caacgaaagc aacagauacc gaacuucgcu gagauuccag 1860
aucacccugc acaacaagga caaaucgauu cuggagaaua uccaguccac uuggaagguc 1920
ggcaagauca caaacagcag ugacagagcc gucaugcuga gggucacccg uuucgaagau 1980
uugaaaguga uuaucgacca cuucgagaaa uauccgcuga uuacccagaa auugggcgau 2040
uacaaguugu uuaaacaggc auucagcguc auggagaaua aagaacaucu uaaggagaau 2100
gggauuaagg agcucguacg aaucaaagcu aagaugaauu ggggucucaa ugacgaauug 2160
aaaaaagcau uuccagagaa cauuagcaaa gagcgccccc uuaucaauaa gaacauuccg 2220
aauuucaaau ggcuggcugg auucacagcu ggugauggcc auuucggcgu gaaucuaaaa 2280
aagguaaagg gcaccgcaaa gguauacgug ggacugagau ucgcuaucuc acagcacauc 2340
agagacaaga accugaugaa uucauugaua acauaccuag gcugugguuc caucagagag 2400
aagaacaagu cugaguucag auggcucgag uucgaaguaa ccaaauucag cgauaucaac 2460
gacaagauca uuccgguauu ccaggaaaau acucugauug gcgucaaacu cgaggacuuu 2520
gaagauuggu gcaagguugc caaauugauc gaagagaaga aacaccugac cgaauccggu 2580
uuggaugaga uuaagaaaau caagcugaac augaacaaag gucguuga 2628
<210> 16
<211> 2733
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 合成的megaTAL构建体
<400> 16
augggauccg ccccuccgaa gaagaagcgg aaagucgugg accuccggac ccuggguuac 60
ucucagcagc agcaggagaa gaucaagccg aaggugcggu cgacuguggc ccagcaucac 120
gaggcccugg ugggacacgg cuucacccac gcccacauug uggcccugag ccagcacccg 180
gcagcgcugg gaaccguggc cgugaccuac cagcacauca uuacugcccu gccugaagcg 240
acccacgagg auaucguggg cgucggaaag cagugguccg gagccagagc cuuggaggcu 300
cugcugacug acgccggaga gcugcggggc ccgccccugc aacuggauac cggccagcuc 360
gugaaaaucg ccaagagagg aggagugacc gccauggaag ccgugcaugc aucccgcaau 420
gcacugacug gugcaccccu gaaccucacu ccugaccagg ucgucgcuau cgcaagcaac 480
aucggaggga aacaagcucu cgagacagug cagcgccucc ugccagugcu uugccaggac 540
cacggccuga cuccagacca gguggucgcu auugcgucga acauuggagg gaagcaagcc 600
cuugaaaccg ugcagaggcu gcucccggug cugugccaag accauggacu caccccggac 660
caaguggugg cuauugcuag caacauuggc gguaagcagg cgcuggagac aguccagcgg 720
cugcugccgg uguugugcca agaucacggu cuuaccccag accaagucgu ggcgauugcc 780
uccaacggug gcggcaagca agcacucgaa acuguccaga gacugcuccc ugugcucugu 840
caagaccacg gguugacccc cgaccaagug guggccaucg ccucccauga uggaggaaag 900
caggcccucg agacugucca gcgacugcuc cccguguugu gucaggauca uggauugacg 960
cccgaucagg ucguggccau ugccucccac gacgguggaa agcaagcgcu ggaaacugug 1020
cagcgguugc ugccgguccu gugccaggac cacggacuga cuccggacca gguggucgcc 1080
aucgcaucca acauuggugg caagcaggcu cucgaaaccg uccaacgccu guugccggug 1140
cugugucagg aucauggacu gaccccggac caaguggugg cuaucgccuc caacaacggg 1200
ggcaaacagg cccuggaaac cgugcaacgc cugcugcccg uccucugcca ggaccacggu 1260
cugaccccug accaggucgu cgcgaucgcg ucaaaugggg ggggcaaaca ggcucuggaa 1320
acggugcagc ggcuccuucc gguguuaugc caggaccacg ggcugacucc cgaccaggug 1380
guggcgaucg ccucgaacaa cggaggcaaa caagcccugg agacugugca gagacuccug 1440
cccgugcugu gccaagacca ugggcucacc ccugaucagg ugguggcaau cgccucaaac 1500
aucggcggga agcaggcacu ggaaacugug cagagacucc ugcccgugcu gugccaagac 1560
caugggcuga ccccggacca agugguggcu aucgccuccc acgacggggg caaacaggcc 1620
cuggaaucca ucgucgcuca gcugagccgg ccugacccag cacucgccgc ccugaccaau 1680
gaccaucugg ucgcccuggc cugccuggga ggcagacccg cgauggacgc ggucaagaag 1740
ggucugccgc acgccccuga gcuuauucgg agagugaaca ggcgcaucgg ugaacgcacc 1800
ucccaucggg ucgcaaucuc uagagugggc ggaucguccc ggcgggaguc caucaauccu 1860
uggauccuga ccggcuucgc cgacgccgaa ggcuccuuca uccuggacau caggaacagg 1920
aacaacgagu caaacaggua ccgcaccucc cuucgguucc agauuacucu gcacaacaag 1980
gauaagucca uccucgagaa cauccaguca accuggaaag ugggcaagau cacuaacucc 2040
ucggaccgcg cagugaugcu ccgggugacc cgcuucgagg accugaaggu gaucauugac 2100
cacuucgaga aguacccucu cauaacccag aagcugggag auuacaagcu guuuaagcag 2160
gcguucuccg ugauggagaa caaagaacac cuuaaggaga augggauuaa ggaacugguc 2220
cgcauuaagg ccaagaugaa cuggggacug aacgacgagu ugaaaaaggc auuuccugaa 2280
aacaucucca aggaacggcc gcucaucaac aagaacauuc ccaauuucaa guggcuggcg 2340
ggguucacug ccggggacgg acacuucgga gugaaccuga agaaggugaa gggcaccgcc 2400
aagguguacg ugggccugcg guucgcgauc agccagcaca uccgggauaa gaaccugaug 2460
aacagccuca ucaccuaccu gggaugcgga agcauccggg agaagaacaa gucagaauuc 2520
cgauggcugg aauuugaagu gaccaaguuc uccgacauca acgacaagau cauccccgug 2580
uuccaggaga acacccucau uggagugaag cuggaggacu ucgaggacug gugcaaggug 2640
gccaagcuca ucgaagagaa gaagcaccug accgaaagcg gccuggauga gauuaagaag 2700
auuaagcuca acaugaacaa gggaagauag uag 2733
<210> 17
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 17
tgtctgccta ttcaccgatt tt 22
<210> 18
<211> 11
<212> DNA
<213> 智人(Homo sapiens)
<400> 18
aaatccagtg a 11
<210> 19
<211> 12
<212> DNA
<213> 智人(Homo sapiens)
<400> 19
aaatccagtg ac 12
<210> 20
<211> 39
<212> DNA
<213> 智人(Homo sapiens)
<400> 20
aaatccagtg acaagtctgt ctgcctattc accgatttt 39
<210> 21
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 21
agtatgccta ttctacaaga aa 22
<210> 22
<211> 877
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的NTD变体megaTAL构建体
<400> 22
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Gly Lys Leu Cys
1 5 10 15
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Leu Lys Leu Lys Ala
20 25 30
Arg Pro Ile Val Ala Gln His His Glu Ala Leu Ile Gly His Gly Phe
35 40 45
Thr Arg Ala Gln Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
50 55 60
Thr Ile Ala Ala Lys Tyr Gln Ala Met Ile Ala Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Val Val Gly Ile Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Thr Leu Glu Val Leu Leu Thr Val Ser Gly Glu Leu Arg Ser Pro Pro
100 105 110
Leu Gln Leu Asp Thr Ser Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Ile Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe
580 585 590
Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn Asn
595 600 605
Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu His
610 615 620
Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val
625 630 635 640
Gly Lys Ile Thr Asn Ser Gly Asp Arg Ala Val Met Leu Arg Val Thr
645 650 655
Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro
660 665 670
Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe
675 680 685
Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu
690 695 700
Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Thr Asp Glu Leu
705 710 715 720
Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn
725 730 735
Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp
740 745 750
Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Asn Ala Lys Val
755 760 765
Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys Asn
770 775 780
Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp Glu
785 790 795 800
Lys Asn Lys Ser Glu Phe Ser Trp Leu Glu Phe Val Val Thr Lys Phe
805 810 815
Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu
820 825 830
Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys
835 840 845
Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile
850 855 860
Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
865 870 875
<210> 23
<211> 877
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的NTD变体megaTAL构建体
<400> 23
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Ser
1 5 10 15
Thr Phe Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
20 25 30
Arg Ser Thr Val Ala Gln His His Ala Ala Leu Val Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Glu Leu Ser Lys His Pro Pro Ala Leu Gly
50 55 60
Thr Ile Ala Ala Arg Tyr Ser Glu Met Ile Ala Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys His Cys Ala Gly Ala Arg
85 90 95
Thr Leu Glu Val Leu Leu Met Val Val Gln Glu Leu Arg Ala Pro Pro
100 105 110
Leu Gln Leu Val Thr Ser Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Val Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe
580 585 590
Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn Asn
595 600 605
Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu His
610 615 620
Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val
625 630 635 640
Gly Lys Ile Thr Asn Ser Gly Asp Arg Ala Val Met Leu Arg Val Thr
645 650 655
Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro
660 665 670
Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe
675 680 685
Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu
690 695 700
Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Thr Asp Glu Leu
705 710 715 720
Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn
725 730 735
Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp
740 745 750
Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Asn Ala Lys Val
755 760 765
Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys Asn
770 775 780
Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp Glu
785 790 795 800
Lys Asn Lys Ser Glu Phe Ser Trp Leu Glu Phe Val Val Thr Lys Phe
805 810 815
Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu
820 825 830
Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys
835 840 845
Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile
850 855 860
Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
865 870 875
<210> 24
<211> 877
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 合成的NTD变体megaTAL构建体
<400> 24
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Gly Lys Leu Ser
1 5 10 15
Thr Phe Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Ala
20 25 30
Arg Ser Thr Val Ala Gln His His Ala Ala Leu Ile Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Glu Leu Ser Lys His Pro Pro Ala Leu Gly
50 55 60
Thr Ile Ala Ala Arg Tyr Ser Glu Met Ile Ala Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Thr Leu Glu Val Leu Leu Met Val Val Gln Glu Leu Arg Ala Pro Pro
100 105 110
Leu Gln Leu Val Thr Ser Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Ile Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe
580 585 590
Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn Asn
595 600 605
Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu His
610 615 620
Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val
625 630 635 640
Gly Lys Ile Thr Asn Ser Gly Asp Arg Ala Val Met Leu Arg Val Thr
645 650 655
Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro
660 665 670
Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe
675 680 685
Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu
690 695 700
Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Thr Asp Glu Leu
705 710 715 720
Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn
725 730 735
Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp
740 745 750
Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Asn Ala Lys Val
755 760 765
Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys Asn
770 775 780
Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp Glu
785 790 795 800
Lys Asn Lys Ser Glu Phe Ser Trp Leu Glu Phe Val Val Thr Lys Phe
805 810 815
Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu
820 825 830
Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys
835 840 845
Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile
850 855 860
Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
865 870 875
<210> 25
<211> 2634
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 合成的NTD变体megaTAL构建体
<400> 25
augggauccg cgccaccuaa gaagaaacgc aaagucggca agcugugcac ccugggcuac 60
agccagcagc agcaggagaa gcugaagcug aaggccagac ccaucguggc ccagcaccac 120
gaggcccuga ucggccacgg cuucaccaga gcccagaucg uggcccugag ccagcacccc 180
gccgcccugg gcaccaucgc cgccaaguac caggccauga ucgccgcccu gcccgaggcc 240
acccacgagg acgugguggg caucggcaag caguggagcg gcgccagaac ccuggaggug 300
cuacugaccg ugagcggcga gcugagaagc cccccccugc agcuggacac cagccagcug 360
cugaagaucg ccaagagagg cggcgugacc gccaucgagg ccgugcacgc cuggcgcaau 420
gcacugacgg gugccccccu gaaccugacc ccggaccaag ugguggcuau cgccagcaac 480
auuggcggca agcaagcgcu cgaaacggug cagcggcugu ugccggugcu gugccaggac 540
cauggccuga ccccggacca agugguggcu aucgccagca acauuggcgg caagcaagcg 600
cucgaaacgg ugcagcggcu guugccggug cugugccagg accauggccu gaccccggac 660
caaguggugg cuaucgccag caacauuggc ggcaagcaag cgcucgaaac ggugcagcgg 720
cuguugccgg ugcugugcca ggaccauggc cugaccccgg accaaguggu ggcuaucgcc 780
agcaacggug gcggcaagca agcgcucgaa acggugcagc ggcuguugcc ggugcugugc 840
caggaccaug gccugacucc ggaccaagug guggcuaucg ccagccacga uggcggcaag 900
caagcgcucg aaacggugca gcggcuguug ccggugcugu gccaggacca uggccugacu 960
ccggaccaag ugguggcuau cgccagccac gauggcggca agcaagcgcu cgaaacggug 1020
cagcggcugu ugccggugcu gugccaggac cauggccuga ccccggacca agugguggcu 1080
aucgccagca acauuggcgg caagcaagcg cucgaaacgg ugcagcggcu guugccggug 1140
cugugccagg accauggccu gaccccggac caaguggugg cuaucgccag caacaauggc 1200
ggcaagcaag cgcucgaaac ggugcagcgg cuguugccgg ugcugugcca ggaccauggc 1260
cugaccccgg accaaguggu ggcuaucgcc agcaacggug gcggcaagca agcgcucgaa 1320
acggugcagc ggcuguugcc ggugcugugc caggaccaug gccugacccc ggaccaagug 1380
guggcuaucg ccagcaacaa uggcggcaag caagcgcucg aaacggugca gcggcuguug 1440
ccggugcugu gccaggacca uggccugacc ccggaccaag ugguggcuau cgccagcaac 1500
auuggcggca agcaagcgcu cgaaagcauu guggcccagc ugagccggcc ugauccggcg 1560
uuggccgcgu ugaccaacga ccaccucguc gccuuggccu gccucggcgg acguccugcc 1620
auggaugcag ugaaaaaggg auugccgcac gcgccggaau ugaucagaag agucaaucgc 1680
cguauuggcg aacgcacguc ccaucgcguu gcgauaucua gagugggagg aagcucgcgc 1740
agagagucca ucaacccaug gauucugacu gguuucgcug augccgaagg aucauucaua 1800
cuagacaucc gcaaccgaaa caacgaaagc aacagauacc gaacuucgcu gagauuccag 1860
aucacccugc acaacaagga caaaucgauu cuggagaaua uccagucgac uuggaagguc 1920
ggcaagauca caaacagcgg cgacagagcc gucaugcuga gggucacccg uuucgaagau 1980
uugaaaguga uuaucgacca cuucgagaaa uauccgcuga uuacccagaa auugggcgau 2040
uacaaguugu uuaaacaggc auucagcguc auggagaaca aagaacaucu uaaggagaau 2100
gggauuaagg agcucguacg aaucaaagcu aagaugaauu ggggucucac ugacgaauug 2160
aaaaaagcau uuccagagaa cauuagcaaa gagcgccccc uuaucaauaa gaacauuccg 2220
aauuucaaau ggcuggcugg auucacaucu ggugauggcu acuucggcgu gaaucuaaaa 2280
aagguaaagg gcaacgcaaa gguauacgug ggacugagau ucucaaucuc acagcacauc 2340
agagacaaga accugaugaa uucauugaua acauaccuag gcugugguuc caucugggag 2400
aagaacaagu cugaguucag uuggcucgag uucgucguaa ccaaauucag cgauaucaac 2460
gacaagauca uuccgguauu ccaggaaaau acucugauug gcgucaaacu cgaggacuuu 2520
gaagauuggu gcaagguugc caaauugauc gaagagaaga aacaccugac cgaauccggu 2580
uuggaugaga uuaagaaaau caagcugaac augaacaaag gucgugucuu cuga 2634
<210> 26
<211> 2634
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 合成的NTD变体megaTAL构建体
<400> 26
augggauccg cgccaccuaa gaagaaacgc aaagucgugg accugagcac cuucggcuac 60
agccagcagc agcaggagaa gaucaagccc aaggugagaa gcaccguggc ccagcaccac 120
gccgcccugg ugggccacgg cuucacccac gcccacaucg uggagcugag caagcacccc 180
cccgcccugg gcaccaucgc cgccagauac agcgagauga ucgccgcccu gcccgaggcc 240
acccacgagg acaucguggg cgugggcaag cacugcgccg gcgccagaac ccuggaggug 300
cugcugaugg uggugcagga gcugagagcu ccaccacugc agcuggugac cagccagcug 360
cugaagaucg ccaagagagg cggcgugacc gccguggagg ccgugcacgc cagccgcaau 420
gcacugacgg gugccccccu gaaccugacc ccggaccaag ugguggcuau cgccagcaac 480
auuggcggca agcaagcgcu cgaaacggug cagcggcugu ugccggugcu gugccaggac 540
cauggccuga ccccggacca agugguggcu aucgccagca acauuggcgg caagcaagcg 600
cucgaaacgg ugcagcggcu guugccggug cugugccagg accauggccu gaccccggac 660
caaguggugg cuaucgccag caacauuggc ggcaagcaag cgcucgaaac ggugcagcgg 720
cuguugccgg ugcugugcca ggaccauggc cugaccccgg accaaguggu ggcuaucgcc 780
agcaacggug gcggcaagca agcgcucgaa acggugcagc ggcuguugcc ggugcugugc 840
caggaccaug gccugacucc ggaccaagug guggcuaucg ccagccacga uggcggcaag 900
caagcgcucg aaacggugca gcggcuguug ccggugcugu gccaggacca uggccugacu 960
ccggaccaag ugguggcuau cgccagccac gauggcggca agcaagcgcu cgaaacggug 1020
cagcggcugu ugccggugcu gugccaggac cauggccuga ccccggacca agugguggcu 1080
aucgccagca acauuggcgg caagcaagcg cucgaaacgg ugcagcggcu guugccggug 1140
cugugccagg accauggccu gaccccggac caaguggugg cuaucgccag caacaauggc 1200
ggcaagcaag cgcucgaaac ggugcagcgg cuguugccgg ugcugugcca ggaccauggc 1260
cugaccccgg accaaguggu ggcuaucgcc agcaacggug gcggcaagca agcgcucgaa 1320
acggugcagc ggcuguugcc ggugcugugc caggaccaug gccugacccc ggaccaagug 1380
guggcuaucg ccagcaacaa uggcggcaag caagcgcucg aaacggugca gcggcuguug 1440
ccggugcugu gccaggacca uggccugacc ccggaccaag ugguggcuau cgccagcaac 1500
auuggcggca agcaagcgcu cgaaagcauu guggcccagc ugagccggcc ugauccggcg 1560
uuggccgcgu ugaccaacga ccaccucguc gccuuggccu gccucggcgg acguccugcc 1620
auggaugcag ugaaaaaggg auugccgcac gcgccggaau ugaucagaag agucaaucgc 1680
cguauuggcg aacgcacguc ccaucgcguu gcgauaucua gagugggagg aagcucgcgc 1740
agagagucca ucaacccaug gauucugacu gguuucgcug augccgaagg aucauucaua 1800
cuagacaucc gcaaccgaaa caacgaaagc aacagauacc gaacuucgcu gagauuccag 1860
aucacccugc acaacaagga caaaucgauu cuggagaaua uccagucgac uuggaagguc 1920
ggcaagauca caaacagcgg cgacagagcc gucaugcuga gggucacccg uuucgaagau 1980
uugaaaguga uuaucgacca cuucgagaaa uauccgcuga uuacccagaa auugggcgau 2040
uacaaguugu uuaaacaggc auucagcguc auggagaaca aagaacaucu uaaggagaau 2100
gggauuaagg agcucguacg aaucaaagcu aagaugaauu ggggucucac ugacgaauug 2160
aaaaaagcau uuccagagaa cauuagcaaa gagcgccccc uuaucaauaa gaacauuccg 2220
aauuucaaau ggcuggcugg auucacaucu ggugauggcu acuucggcgu gaaucuaaaa 2280
aagguaaagg gcaacgcaaa gguauacgug ggacugagau ucucaaucuc acagcacauc 2340
agagacaaga accugaugaa uucauugaua acauaccuag gcugugguuc caucugggag 2400
aagaacaagu cugaguucag uuggcucgag uucgucguaa ccaaauucag cgauaucaac 2460
gacaagauca uuccgguauu ccaggaaaau acucugauug gcgucaaacu cgaggacuuu 2520
gaagauuggu gcaagguugc caaauugauc gaagagaaga aacaccugac cgaauccggu 2580
uuggaugaga uuaagaaaau caagcugaac augaacaaag gucgugucuu cuga 2634
<210> 27
<211> 2634
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 合成的NTD变体megaTAL构建体
<400> 27
augggauccg cgccaccuaa gaagaaacgc aaagucggca agcugagcac cuucggcuac 60
agccagcagc agcaggagaa gaucaagccc aaggccagaa gcaccguggc ccagcaccac 120
gccgcccuga ucggccacgg cuucacccac gcccacaucg uggagcugag caagcacccc 180
cccgcccugg gcaccaucgc cgccagauac agcgagauga ucgccgcccu gcccgaggcc 240
acccacgagg acaucguggg cgugggcaag caguggagcg gcgccagaac ccuggaggug 300
cugcugaugg uggugcagga gcugagagcu ccaccacugc agcuggugac cagccagcug 360
gugaagaucg ccaagagagg cggcgugacc gccaucgagg ccgugcacgc cagccgcaau 420
gcacugacgg gugccccccu gaaccugacc ccggaccaag ugguggcuau cgccagcaac 480
auuggcggca agcaagcgcu cgaaacggug cagcggcugu ugccggugcu gugccaggac 540
cauggccuga ccccggacca agugguggcu aucgccagca acauuggcgg caagcaagcg 600
cucgaaacgg ugcagcggcu guugccggug cugugccagg accauggccu gaccccggac 660
caaguggugg cuaucgccag caacauuggc ggcaagcaag cgcucgaaac ggugcagcgg 720
cuguugccgg ugcugugcca ggaccauggc cugaccccgg accaaguggu ggcuaucgcc 780
agcaacggug gcggcaagca agcgcucgaa acggugcagc ggcuguugcc ggugcugugc 840
caggaccaug gccugacucc ggaccaagug guggcuaucg ccagccacga uggcggcaag 900
caagcgcucg aaacggugca gcggcuguug ccggugcugu gccaggacca uggccugacu 960
ccggaccaag ugguggcuau cgccagccac gauggcggca agcaagcgcu cgaaacggug 1020
cagcggcugu ugccggugcu gugccaggac cauggccuga ccccggacca agugguggcu 1080
aucgccagca acauuggcgg caagcaagcg cucgaaacgg ugcagcggcu guugccggug 1140
cugugccagg accauggccu gaccccggac caaguggugg cuaucgccag caacaauggc 1200
ggcaagcaag cgcucgaaac ggugcagcgg cuguugccgg ugcugugcca ggaccauggc 1260
cugaccccgg accaaguggu ggcuaucgcc agcaacggug gcggcaagca agcgcucgaa 1320
acggugcagc ggcuguugcc ggugcugugc caggaccaug gccugacccc ggaccaagug 1380
guggcuaucg ccagcaacaa uggcggcaag caagcgcucg aaacggugca gcggcuguug 1440
ccggugcugu gccaggacca uggccugacc ccggaccaag ugguggcuau cgccagcaac 1500
auuggcggca agcaagcgcu cgaaagcauu guggcccagc ugagccggcc ugauccggcg 1560
uuggccgcgu ugaccaacga ccaccucguc gccuuggccu gccucggcgg acguccugcc 1620
auggaugcag ugaaaaaggg auugccgcac gcgccggaau ugaucagaag agucaaucgc 1680
cguauuggcg aacgcacguc ccaucgcguu gcgauaucua gagugggagg aagcucgcgc 1740
agagagucca ucaacccaug gauucugacu gguuucgcug augccgaagg aucauucaua 1800
cuagacaucc gcaaccgaaa caacgaaagc aacagauacc gaacuucgcu gagauuccag 1860
aucacccugc acaacaagga caaaucgauu cuggagaaua uccagucgac uuggaagguc 1920
ggcaagauca caaacagcgg cgacagagcc gucaugcuga gggucacccg uuucgaagau 1980
uugaaaguga uuaucgacca cuucgagaaa uauccgcuga uuacccagaa auugggcgau 2040
uacaaguugu uuaaacaggc auucagcguc auggagaaca aagaacaucu uaaggagaau 2100
gggauuaagg agcucguacg aaucaaagcu aagaugaauu ggggucucac ugacgaauug 2160
aaaaaagcau uuccagagaa cauuagcaaa gagcgccccc uuaucaauaa gaacauuccg 2220
aauuucaaau ggcuggcugg auucacaucu ggugauggcu acuucggcgu gaaucuaaaa 2280
aagguaaagg gcaacgcaaa gguauacgug ggacugagau ucucaaucuc acagcacauc 2340
agagacaaga accugaugaa uucauugaua acauaccuag gcugugguuc caucugggag 2400
aagaacaagu cugaguucag uuggcucgag uucgucguaa ccaaauucag cgauaucaac 2460
gacaagauca uuccgguauu ccaggaaaau acucugauug gcgucaaacu cgaggacuuu 2520
gaagauuggu gcaagguugc caaauugauc gaagagaaga aacaccugac cgaauccggu 2580
uuggaugaga uuaagaaaau caagcugaac augaacaaag gucgugucuu cuga 2634
<210> 28
<211> 711
<212> RNA
<213> 小家鼠(Mus musculus)
<400> 28
augucugagc caccucgggc ugagaccuuu guauuccugg accuagaagc cacugggcuc 60
ccaaacaugg acccugagau ugcagagaua ucccuuuuug cuguucaccg cucuucccug 120
gagaacccag aacgggauga uucugguucc uuggugcugc cccguguucu ggacaagcuc 180
acacugugca ugugcccgga gcgccccuuu acugccaagg ccagugagau uacugguuug 240
agcagcgaaa gccugaugca cugcgggaag gcugguuuca auggcgcugu gguaaggaca 300
cugcagggcu uccuaagccg ccaggagggc cccaucugcc uuguggccca caauggcuuc 360
gauuaugacu ucccacugcu gugcacggag cuacaacguc ugggugccca ucugccccaa 420
gacacugucu gccuggacac acugccugca uugcggggcc uggaccgugc ucacagccac 480
ggcaccaggg cucaaggccg caaaagcuac agccuggcca gucucuucca ccgcuacuuc 540
caggcugaac ccagugcugc ccauucagca gaaggugaug ugcacacccu gcuucugauc 600
uuccugcauc gugcuccuga gcugcucgcc ugggcagaug agcaggcccg cagcugggcu 660
cauauugagc ccauguacgu gccaccugau gguccaagcc ucgaagccug a 711
<210> 29
<211> 236
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 29
Met Ser Glu Pro Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu
1 5 10 15
Ala Thr Gly Leu Pro Asn Met Asp Pro Glu Ile Ala Glu Ile Ser Leu
20 25 30
Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu Arg Asp Asp Ser
35 40 45
Gly Ser Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met
50 55 60
Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu
65 70 75 80
Ser Ser Glu Ser Leu Met His Cys Gly Lys Ala Gly Phe Asn Gly Ala
85 90 95
Val Val Arg Thr Leu Gln Gly Phe Leu Ser Arg Gln Glu Gly Pro Ile
100 105 110
Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys
115 120 125
Thr Glu Leu Gln Arg Leu Gly Ala His Leu Pro Gln Asp Thr Val Cys
130 135 140
Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His
145 150 155 160
Gly Thr Arg Ala Gln Gly Arg Lys Ser Tyr Ser Leu Ala Ser Leu Phe
165 170 175
His Arg Tyr Phe Gln Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly
180 185 190
Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Pro Glu Leu
195 200 205
Leu Ala Trp Ala Asp Glu Gln Ala Arg Ser Trp Ala His Ile Glu Pro
210 215 220
Met Tyr Val Pro Pro Asp Gly Pro Ser Leu Glu Ala
225 230 235
<210> 30
<211> 3
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 30
Gly Gly Gly
1
<210> 31
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 31
Asp Gly Gly Gly Ser
1 5
<210> 32
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 32
Thr Gly Glu Lys Pro
1 5
<210> 33
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 33
Gly Gly Arg Arg
1
<210> 34
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 34
Gly Gly Gly Gly Ser
1 5
<210> 35
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 35
Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp
1 5 10
<210> 36
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 36
Lys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser
1 5 10 15
Leu Asp
<210> 37
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 37
Gly Gly Arg Arg Gly Gly Gly Ser
1 5
<210> 38
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 38
Leu Arg Gln Arg Asp Gly Glu Arg Pro
1 5
<210> 39
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 39
Leu Arg Gln Lys Asp Gly Gly Gly Ser Glu Arg Pro
1 5 10
<210> 40
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 示例性连接子序列
<400> 40
Leu Arg Gln Lys Asp Gly Gly Gly Ser Gly Gly Gly Ser Glu Arg Pro
1 5 10 15
<210> 41
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> SITE
<222> ()..()
<223> TEV蛋白酶的切割序列
<220>
<221> SITE
<222> (2)..(3)
<223> Xaa是任何氨基酸
<220>
<221> SITE
<222> (5)..(5)
<223> Xaa是任何氨基酸
<220>
<221> SITE
<222> (7)..(7)
<223> Xaa = Gly或Ser
<400> 41
Glu Xaa Xaa Tyr Xaa Gln Xaa
1 5
<210> 42
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> TEV蛋白酶的切割序列
<400> 42
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 43
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> TEV蛋白酶的切割序列
<400> 43
Glu Asn Leu Tyr Phe Gln Ser
1 5
<210> 44
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 44
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 45
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 45
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 46
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 46
Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
1 5 10
<210> 47
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 47
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 48
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 48
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 49
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 49
Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
1 5 10
<210> 50
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 50
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 51
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 51
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 52
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 52
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 53
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 53
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 54
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 54
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 55
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 55
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 56
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 56
Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210> 57
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 57
Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210> 58
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 58
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 59
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 59
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
1 5 10 15
Pro
<210> 60
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 60
Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 61
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 61
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
1 5 10 15
Asp Val Glu Ser Asn Pro Gly Pro
20
<210> 62
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 62
Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro
1 5 10 15
Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys
20 25 30
Ile Val Ala Pro Val Lys Gln Thr
35 40
<210> 63
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 63
Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro
1 5 10 15
Gly Pro
<210> 64
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 64
Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val
1 5 10 15
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
20 25 30
Asp Val Glu Ser Asn Pro Gly Pro
35 40
<210> 65
<211> 33
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> PEPTIDE
<222> ()..()
<223> 包括2A位点的自切割多肽
<400> 65
Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu
1 5 10 15
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
20 25 30
Pro
<210> 66
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 共有Kozak序列
<400> 66
gccrccatgg 10
<210> 67
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> gene
<222> ()..()
<223> 合成构建体
<220>
<221> misc_feature
<222> (1)..(14)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (18)..(22)
<223> n是a、c、g或t
<400> 67
nnnnnnnnnn nnnnccgnnn nn 22
<210> 68
<211> 47
<212> DNA
<213> 智人(Homo sapiens)
<400> 68
actctaaatc cagtgacaag tctgtctgcc tattcaccga ttttgat 47
<210> 69
<211> 47
<212> DNA
<213> 智人(Homo sapiens)
<400> 69
atcaaaatcg gtgaataggc agacagactt gtcactggat ttagagt 47

Claims (42)

1.一种包括I-OnuI归巢核酸内切酶(HE)变体的多肽,所述变体切割人T细胞受体α(TCRα)基因中的靶位点,其中所述变体包括氨基酸取代:SEQ ID NO:1-5中任一个或其生物活性片段的L26I、R28D、N32R、K34N、S35E、V37N、G38R、S40R、E42S、G44R、V68K、A70T、G73S、N75R、S78M、K80R、L138M、T143N、S159P、S176A、C180H、F182G、I186K、S188V、S190G、K191T、L192A、G193K、Q195Y、Q197G、V199R、S201A、T203S、K207R、Y223S、K225R、S233R、D236E和V238E。
2.一种包括I-OnuI归巢核酸内切酶(HE)变体的多肽,所述变体切割人T细胞受体α(TCRα)基因中的靶位点,其中所述变体包括氨基酸取代:SEQ ID NO:1-5中任一个或其生物活性片段的L26I、R28D、N32R、K34N、S35E、V37N、G38R、S40R、E42S、G44R、V68K、A70T、G73S、N75R、S78M、K80R、L138M、T143N、S159P、S176A、E178D、C180H、F182G、I186K、S188V、S190G、K191T、L192A、G193K、Q195Y、Q197G、V199R、S201A、T203S、K207R、Y223S、K225R、S233R、D236E和V238E。
3.根据权利要求1或权利要求2所述的多肽,其中与相应的野生型I-OnuIHE相比,所述生物活性片段缺少1个、2个、3个、4个、5个、6个、7个或8个N-末端氨基酸。
4.根据权利要求3所述的多肽,其中与相应的野生型I-OnuIHE相比,所述生物活性片段缺少4个N-末端氨基酸。
5.根据权利要求3所述的多肽,其中与相应的野生型I-OnuIHE相比,所述生物活性片段缺少8个N-末端氨基酸。
6.根据权利要求1或权利要求2所述的多肽,其中与相应的野生型I-OnuIHE相比,所述生物活性片段缺少1个、2个、3个、4个或5个C-末端氨基酸。
7.根据权利要求6所述的多肽,其中与相应的野生型I-OnuIHE相比,所述生物活性片段缺少C-末端氨基酸。
8.根据权利要求6所述的多肽,其中与相应的野生型I-OnuIHE相比,所述生物活性片段缺少2个C-末端氨基酸。
9.根据权利要求1到8中任一项所述的多肽,其中所述I-OnuIHE变体包括与SEQ ID NO:7-8中任一个所示的氨基酸序列或其生物活性片段具有至少99%同一性的氨基酸序列。
10.根据权利要求1到9中任一项所述的多肽,其中所述HE变体包括SEQ ID NO:7所示的氨基酸序列或其生物活性片段。
11.根据权利要求1到9中任一项所述的多肽,其中所述HE变体包括SEQ ID NO:8所示的氨基酸序列或其生物活性片段。
12.根据权利要求1到11中任一项所述的多肽,其中所述多肽结合SEQ ID NO:17所示的多核苷酸序列。
13.根据权利要求1到12中任一项所述的多肽,其进一步包括DNA结合结构域。
14.根据权利要求13所述的多肽,其中所述DNA结合结构域选自由以下组成的组:TALEDNA结合结构域和锌指DNA结合结构域。
15.根据权利要求14所述的多肽,其中所述TALE DNA结合结构域包括约9.5个TALE重复单元、约10.5个TALE重复单元、约11.5个TALE重复单元、约12.5个TALE重复单元、约13.5个TALE重复单元、约14.5个TALE重复单元或约15.5个TALE重复单元。
16.根据权利要求14或权利要求15所述的多肽,其中所述TALE DNA结合结构域包括11.5个TALE重复单元并结合SEQ ID NO:19所示的多核苷酸序列。
17.根据权利要求14或权利要求15所述的多肽,其中所述TALE DNA结合结构域包括10.5个TALE重复单元并结合SEQ ID NO:18所示的多核苷酸序列。
18.根据权利要求14到17中任一项所述的多肽,其中所述多肽结合并切割SEQ ID NO:20所示的多核苷酸序列。
19.根据权利要求14所述的多肽,其中所述锌指DNA结合结构域包括2个、3个、4个、5个、6个、7个或8个锌指基序。
20.根据权利要求1到19中任一项所述的多肽,其进一步包括肽连接子和末端加工酶或其生物活性片段。
21.根据权利要求1到20中任一项所述的多肽,其进一步包括病毒自切割2A肽和末端加工酶或其生物活性片段。
22.根据权利要求20或权利要求21所述的多肽,其中所述末端加工酶或其生物活性片段具有5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶、5'瓣状核酸内切酶、解旋酶或模板非依赖性DNA聚合酶活性。
23.根据权利要求20到22中任一项所述的多肽,其中所述末端加工酶包括Trex2或其生物活性片段。
24.根据权利要求1到23中任一项所述的多肽,其中所述多肽包括SEQ ID NO:10到12中任一个所示的氨基酸序列或其生物活性片段。
25.根据权利要求24所述的多肽,其中所述多肽包括SEQ ID NO:10所示的氨基酸序列或其生物活性片段。
26.根据权利要求24所述的多肽,其中所述多肽包括SEQ ID NO:11所示的氨基酸序列或其生物活性片段。
27.根据权利要求24所述的多肽,其中所述多肽包括SEQ ID NO:12所示的氨基酸序列或其生物活性片段。
28.一种编码根据权利要求1到27中任一项所述的多肽的多核苷酸。
29.一种编码根据权利要求1到27中任一项所述的多肽的mRNA。
30.一种编码根据权利要求1到27中任一项所述的多肽的cDNA。
31.一种载体,其包括编码根据权利要求1到27中任一项所述的多肽的多核苷酸。
32.一种细胞,其包括根据权利要求1到27中任一项所述的多肽。
33.一种细胞,其包括编码根据权利要求1到27中任一项所述的多肽的多核苷酸。
34.一种细胞,其包括根据权利要求27所述的载体。
35.一种由根据权利要求1到27中任一项所述的多肽编辑的细胞。
36.根据权利要求32到35中任一项所述的细胞,其中所述细胞是造血细胞。
37.根据权利要求32到36中任一项所述的细胞,其中所述细胞是T细胞。
38.根据权利要求32到37中任一项所述的细胞,其中所述细胞是CD3+、CD4+和/或CD8+细胞。
39.根据权利要求32到38中任一项所述的细胞,其中所述细胞是免疫效应细胞。
40.根据权利要求32到39中任一项所述的细胞,其中所述细胞是细胞毒性T淋巴细胞(CTL)、肿瘤浸润淋巴细胞(TIL)或辅助T细胞。
41.根据权利要求32到39中任一项所述的细胞,其中所述细胞是自然杀伤(NK)细胞或自然杀伤T(NKT)细胞。
42.根据权利要求32到41中任一项所述的细胞,其中所述细胞的来源是外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、来自感染部位的组织、腹水、胸腔积液、脾脏组织或肿瘤。
CN201780074992.4A 2016-10-11 2017-10-11 TCRα归巢核酸内切酶变体 Pending CN110036107A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662406689P 2016-10-11 2016-10-11
US62/406,689 2016-10-11
US201662414266P 2016-10-28 2016-10-28
US62/414,266 2016-10-28
PCT/US2017/056178 WO2018071565A1 (en) 2016-10-11 2017-10-11 TCRa HOMING ENDONUCLEASE VARIANTS

Publications (1)

Publication Number Publication Date
CN110036107A true CN110036107A (zh) 2019-07-19

Family

ID=61905974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780074992.4A Pending CN110036107A (zh) 2016-10-11 2017-10-11 TCRα归巢核酸内切酶变体

Country Status (13)

Country Link
US (2) US11591582B2 (zh)
EP (1) EP3534916A4 (zh)
JP (1) JP7104710B2 (zh)
KR (1) KR20190065382A (zh)
CN (1) CN110036107A (zh)
AU (1) AU2017342273B2 (zh)
CA (1) CA3039812A1 (zh)
IL (1) IL265895A (zh)
MA (1) MA46717A (zh)
MX (1) MX2019004156A (zh)
RU (1) RU2019114035A (zh)
SG (1) SG11201903230QA (zh)
WO (1) WO2018071565A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11214789B2 (en) 2016-05-03 2022-01-04 Flodesign Sonics, Inc. Concentration and washing of particles with acoustics
EP4248979A3 (en) 2016-09-08 2023-12-20 2seventy bio, Inc. Pd-1 homing endonuclease variants, compositions, and methods of use
EP3534916A4 (en) 2016-10-11 2020-09-30 Bluebird Bio, Inc. TCRA HOMING ENDONUCLEASE VARIANTS
CA3040157A1 (en) 2016-10-17 2018-04-26 Bluebird Bio, Inc. Tgf.beta.r2 endonuclease variants, compositions, and methods of use
CN113329760A (zh) * 2018-12-10 2021-08-31 蓝鸟生物公司 归巢核酸内切酶变体
KR20240021235A (ko) 2021-06-14 2024-02-16 2세븐티 바이오, 인코포레이티드 단일 가닥 rna 정제 방법
WO2023081756A1 (en) 2021-11-03 2023-05-11 The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone Precise genome editing using retrons
WO2023141602A2 (en) 2022-01-21 2023-07-27 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2024044723A1 (en) 2022-08-25 2024-02-29 Renagade Therapeutics Management Inc. Engineered retrons and methods of use

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030068972A (ko) * 2002-02-19 2003-08-25 박영일 2단 발효법에 의한 고 순도 멸치액젓 및 그 제조방법
CN1529713A (zh) * 2000-07-17 2004-09-15 用于治疗和诊断卵巢癌的组合物及方法
CN1732263A (zh) * 2002-10-23 2006-02-08 维柯龙药品公司 生物合成糖肽类抗生素a40926的基因及蛋白
US20130137160A1 (en) * 2011-11-30 2013-05-30 Massachusetts Institute Of Technology Nucleotide-Specific Recognition Sequences For Designer TAL Effectors
US20130315884A1 (en) * 2012-05-25 2013-11-28 Roman Galetto Methods for engineering allogeneic and immunosuppressive resistant t cell for immunotherapy
US20140208457A1 (en) * 2011-06-10 2014-07-24 Basf Plant Science Company Gmbh Nuclease Fusion Protein and Uses Thereof
WO2014191527A1 (en) * 2013-05-31 2014-12-04 Cellectis A laglidadg homing endonuclease cleaving the t cell receptor alpha gene and uses thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60203125T2 (de) * 2001-08-31 2006-04-06 Avidex Ltd., Abingdon Löslicher t zell rezeptor
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
US8956828B2 (en) 2009-11-10 2015-02-17 Sangamo Biosciences, Inc. Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases
US20140148361A1 (en) 2010-06-07 2014-05-29 Barry L. Stoddard Generation and Expression of Engineered I-ONUI Endonuclease and Its Homologues and Uses Thereof
US9034813B2 (en) * 2010-09-17 2015-05-19 Ecolab Usa Inc. High performance low viscoelasticity foaming detergent compositions employing extended chain anionic surfactants
EP3534916A4 (en) 2016-10-11 2020-09-30 Bluebird Bio, Inc. TCRA HOMING ENDONUCLEASE VARIANTS

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1529713A (zh) * 2000-07-17 2004-09-15 用于治疗和诊断卵巢癌的组合物及方法
KR20030068972A (ko) * 2002-02-19 2003-08-25 박영일 2단 발효법에 의한 고 순도 멸치액젓 및 그 제조방법
CN1732263A (zh) * 2002-10-23 2006-02-08 维柯龙药品公司 生物合成糖肽类抗生素a40926的基因及蛋白
US20140208457A1 (en) * 2011-06-10 2014-07-24 Basf Plant Science Company Gmbh Nuclease Fusion Protein and Uses Thereof
US20130137160A1 (en) * 2011-11-30 2013-05-30 Massachusetts Institute Of Technology Nucleotide-Specific Recognition Sequences For Designer TAL Effectors
US20130315884A1 (en) * 2012-05-25 2013-11-28 Roman Galetto Methods for engineering allogeneic and immunosuppressive resistant t cell for immunotherapy
WO2014191527A1 (en) * 2013-05-31 2014-12-04 Cellectis A laglidadg homing endonuclease cleaving the t cell receptor alpha gene and uses thereof

Also Published As

Publication number Publication date
EP3534916A1 (en) 2019-09-11
SG11201903230QA (en) 2019-05-30
US20230357736A1 (en) 2023-11-09
KR20190065382A (ko) 2019-06-11
MX2019004156A (es) 2019-09-26
WO2018071565A1 (en) 2018-04-19
EP3534916A4 (en) 2020-09-30
AU2017342273A1 (en) 2019-05-09
RU2019114035A (ru) 2020-11-13
CA3039812A1 (en) 2018-04-19
JP7104710B2 (ja) 2022-07-21
JP2019532674A (ja) 2019-11-14
US11591582B2 (en) 2023-02-28
AU2017342273B2 (en) 2023-07-06
MA46717A (fr) 2019-09-11
IL265895A (en) 2019-06-30
US20220186198A1 (en) 2022-06-16

Similar Documents

Publication Publication Date Title
CN110036107A (zh) TCRα归巢核酸内切酶变体
JP6946384B2 (ja) 脂質ナノ粒子を含む医薬組成物
JP6921797B2 (ja) ヒト疾患に関連する生物製剤およびタンパク質の産生のための修飾ポリヌクレオチド
EP3500696A1 (en) Il-10 receptor alpha homing endonuclease variants, compositions, and methods of use
CN105555954B (zh) 改进的胸苷激酶基因
JP2022516572A (ja) 合成分子フィードバック回路及びその使用方法
WO2019126558A1 (en) Ahr homing endonuclease variants, compositions, and methods of use
WO2024088401A1 (en) Gene editing systems and methods for reducing immunogenicity and graft versus host response
US20220364123A1 (en) Wiskott-aldrich syndrome gene homing endonuclease variants, compositions, and methods of use
US20210230565A1 (en) Bruton&#39;s tyrosine kinase homing endonuclease variants, compositions, and methods of use
WO2023233342A2 (en) Gene-edited natural killer cells
JP2022513750A (ja) ホーミングエンドヌクレアーゼバリアント
CN115552014A (zh) 嵌合衔接子蛋白和调控基因表达的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211029

Address after: 60 Benny street, Cambridge, Massachusetts, USA

Applicant after: 2 savinti biology

Address before: 60 Benny street, Cambridge, Massachusetts, USA

Applicant before: BLUEBIRD BIO, Inc.

TA01 Transfer of patent application right