CN110050066A - TGFβR2核酸内切酶变体、组合物和使用方法 - Google Patents

TGFβR2核酸内切酶变体、组合物和使用方法 Download PDF

Info

Publication number
CN110050066A
CN110050066A CN201780076229.5A CN201780076229A CN110050066A CN 110050066 A CN110050066 A CN 110050066A CN 201780076229 A CN201780076229 A CN 201780076229A CN 110050066 A CN110050066 A CN 110050066A
Authority
CN
China
Prior art keywords
cell
polypeptide
tgf
amino acid
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780076229.5A
Other languages
English (en)
Inventor
乔丹·贾儒尔
凯尔·哈文斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
2 savinti biology
Original Assignee
Bluebird Bio Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bluebird Bio Inc filed Critical Bluebird Bio Inc
Publication of CN110050066A publication Critical patent/CN110050066A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4611T-cells, e.g. tumor infiltrating lymphocytes [TIL], lymphokine-activated killer cells [LAK] or regulatory T cells [Treg]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4631Chimeric Antigen Receptors [CAR]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/46443Growth factors
    • A61K39/464434Transforming growth factor [TGF]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464469Tumor associated carbohydrates
    • A61K39/464471Gangliosides, e.g. GM2, GD2 or GD3
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/06Immunosuppressants, e.g. drugs for graft rejection
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/71Receptors; Cell surface antigens; Cell surface determinants for growth factors; for growth regulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Oncology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Communicable Diseases (AREA)
  • Transplantation (AREA)
  • Hematology (AREA)
  • Pain & Pain Management (AREA)

Abstract

本公开提供了用于编辑TGFβR2基因的改进的基因组编辑组合物和方法。本公开进一步提供了用于预防、治疗癌症、传染病、自身免疫性疾病、炎症性疾病或免疫缺陷或改善其至少一种症状的经过基因组编辑的细胞。

Description

TGFβR2核酸内切酶变体、组合物和使用方法
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求2016年10月28日提交的美国临时申请第62/414,260号和2016年10月17日提交的美国临时申请第62/409,163号的权益,这些美国临时申请中的每一个都以全文引用的方式并入本文中。
关于序列表的声明
与本申请相关的序列表以文本格式提供以代替纸质副本,并且在此通过引用并入本说明书中。包含序列表的文本文件的名称是BLBD_078_02WO_ST25.txt。所述文本文件为79KB,于2017年10月17日创建,并且通过EFS-Web以电子方式与本说明书一同提交。
技术领域
本公开涉及改进的基因组编辑组合物。更具体地,本公开涉及用于编辑人转化生长因子β受体2(TGFβR2)基因的核酸酶变体、组合物和其使用方法。
背景技术
全球受癌症困扰的人数在1975年到2000年间翻了一番。癌症是全球发病率和死亡率的第二大原因,其中在2012年,新发病例约为1410万,癌症相关死亡人数达820万。最常见的癌症是乳腺癌、肺癌和支气管癌、前列腺癌、结肠癌和直肠癌、膀胱癌、皮肤黑色素瘤、非霍奇金淋巴瘤、甲状腺癌、肾癌和肾盂癌、子宫内膜癌、白血病和胰腺癌。预计未来二十年内新发癌症病例的数量将上升到2200万。
免疫系统在检测和对抗人类癌症方面发挥着关键作用。大多数转化细胞很快被免疫哨兵检测到,并通过克隆表达的T细胞受体(TCR)对抗原特异性T细胞进行活化而被破坏。因此,癌症可以被认为是免疫障碍,免疫系统无法发挥必要的抗肿瘤反应以持久地抑制和消除所述疾病。为了更有效地对抗癌症,在过去几十年中开发的某些免疫疗法干预特别关注于增强T细胞免疫性。这些治疗仅产生了零星的疾病缓解病例,并没有取得实质性的全面成功。使用靶向抑制T细胞活化的分子(如CTLA-4或PD-1)的单克隆抗体的最近疗法已显示出更显著的抗肿瘤作用;然而,由于全身免疫活化,这些治疗还与大量毒性相关。
最近,已经在早期临床试验中研究和测试了基于T细胞的分离、修饰、扩增和重新输注的过继性细胞免疫疗法策略。由于其选择性识别和强大的效应机制,T细胞通常是癌症免疫疗法的选择效应细胞。这些治疗表现出不同的成功率,但有少数患者经历了持久的缓解,从而突出了基于T细胞的免疫疗法尚未实现的潜力。
细胞毒性T细胞对肿瘤细胞相关抗原的成功识别启动靶向肿瘤溶解并为任何有效的癌症免疫疗法奠定基础。肿瘤浸润T细胞(TIL)表达特异性指向肿瘤相关抗原的TCR;然而,大量的TIL仅限于少数人类癌症。工程化T细胞受体(TCR)和嵌合抗原受体(CAR)有可能提高基于T细胞的免疫疗法对许多癌症和其它免疫障碍的适用性。
另外,最先进的工程化T细胞仍然受到由癌细胞、炎症细胞、基质细胞和细胞因子组成的复杂的免疫抑制肿瘤微环境的调控。在这些组分中,癌细胞、炎症细胞和抑制性细胞因子对T细胞表型和功能产生不利影响。共同地,肿瘤微环境促使T细胞最终分化为耗竭型T细胞。
T细胞耗竭是慢性环境中的T细胞功能障碍的状态,所述状态以以下为标志:抑制性受体的表达增加或抑制性受体的信号传导增加;效应细胞因子的产生减少;以及对抗和消除癌症的能力下降。耗竭型T细胞还显示出呈分层方式的功能丧失:在耗竭早期,IL-2产生减少并且丧失体外杀伤能力;在耗竭中期,丧失TNF-α产生;并且在耗竭晚期,丧失IFN-γ和GzmB产生。肿瘤微环境中的大多数T细胞分化为耗竭型T细胞并且丧失消除癌症的能力并且最终被清除。
TGFβ是多效细胞因子,已经作为免疫抑制信号分子牵涉进肿瘤微环境。TGFβ结合到TGFβR1和TGFβR2丝氨酸/苏氨酸激酶受体复合物,从而导致下游转录因子Smad2和Smad3的受体介导磷酸化。许多肿瘤通过获得TGFβR2受体和/或下游Smad信号传导蛋白中的突变来避开TGFβ的细胞抑制和抗增殖作用。TGFβ抑制涉及T细胞的体外效应子和溶细胞活性(包含IFNγ分泌)的关键分子。
迄今为止,针对使用中和抗体或激酶抑制剂来抑制TGFβ信号传导的临床试验产生的结果令人失望,并且尚未报道显著的疗效。
发明内容
本公开总体上部分涉及包括切割人转化生长因子β受体2(TGFβR2)基因中的靶位点的归巢核酸内切酶变体和megaTAL的组合物以及使用所述组合物的方法。
在各个实施例中,本公开部分地设想一种包括切割人TGFβR2基因中的靶位点的归巢核酸内切酶(HE)变体的多肽。
在特定实施例中,所述HE变体是LAGLIDADG归巢核酸内切酶(LHE)变体。
在某些实施例中,所述多肽包括所述HE变体的生物活性片段。
在一些实施例中,与对应的野生型HE相比,所述生物活性片段缺少1个、2个、3个、4个、5个、6个、7个或8个N末端氨基酸。
在附加实施例中,与对应的野生型HE相比,所述生物活性片段缺少4个N末端氨基酸。
在某些实施例中,与对应的野生型HE相比,所述生物活性片段缺少8个N末端氨基酸。
在特定实施例中,与对应的野生型HE相比,所述生物活性片段缺少1个、2个、3个、4个或5个C末端氨基酸。
在特定实施例中,与对应的野生型HE相比,所述生物活性片段缺少C末端氨基酸。
在一些实施例中,与对应的野生型HE相比,所述生物活性片段缺少2个C末端氨基酸。
在进一步实施例中,所述HE变体是选自由以下组成的组的LHE的变体:I-AabMI、I-AaeMI、I-AniI、I-ApaMI、I-CapIII、I-CapIV、I-CkaMI、I-CpaMI、I-CpaMII、I-CpaMIII、I-CpaMIV、I-CpaMV、I-CpaV、I-CraMI、I-EjeMI、I-GpeMI、I-GpiI、I-GzeMI、I-GzeMII、I-GzeMIII、I-HjeMI、I-LtrII、I-LtrI、I-LtrWI、I-MpeMI、I-MveMI、I-NcrII、I-Ncrl、I-NcrMI、I-OheMI、I-OnuI、I-OsoMI、I-OsoMII、I-OsoMIII、I-OsoMIV、I-PanMI、I-PanMII、I-PanMIII、I-PnoMI、I-ScuMI、I-SmaMI、I-SscMI和I-Vdi141I。
在特定实施例中,所述HE变体是选自由以下组成的组的LHE的变体:I-CpaMI、I-HjeMI、I-OnuI、I-PanMI和SmaMI。
在进一步实施例中,所述HE变体是I-OnuI LHE变体。
在附加实施例中,所述HE变体包括DNA识别界面中在选自由以下组成的组的氨基酸位置处的一个或多个氨基酸取代:如SEQ ID NO:1-5中所示的I-OnuI LHE氨基酸序列或其生物活性片段的19、24、26、28、30、32、34、35、36、37、38、40、42、44、46、48、59、68、70、72、75、76、77、78、80、82、168、180、182、184、186、188、189、190、191、192、193、195、197、199、201、203、223、225、227、229、231、232、234、236、238和240。
在特定实施例中,所述HE变体包括所述DNA识别界面中在选自由以下组成的组的氨基酸位置处的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选至少40个或更多个氨基酸取代:如SEQ ID NO:1-5中所示的I-OnuI LHE氨基酸序列或其生物活性片段的19、24、26、28、30、32、34、35、36、37、38、40、42、44、46、48、59、68、70、72、75、76、77、78、80、82、168、180、182、184、186、188、189、190、191、192、193、195、197、199、201、203、223、225、227、229、231、232、234、236、238和240。
在特定实施例中,所述HE变体切割TGFβR2靶位点并且包括在选自由以下位置组成的位置组的至少一个位置中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个氨基酸取代:SEQ ID NO:1-5中的任一个或其生物活性片段的26、32、34、35、36、37、38、40、42、44、46、48、68、70、75、76、78、80、116、138、143、159、168、178、180、182、184、188、190、192、193、195、197、199、203、207、223、225、227、232、240和264。
在某些实施例中,所述HE变体切割TGFβR2靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个:SEQ ID NO:1-5中的任一个或其生物活性片段的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R或S190G、L192T、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223R、Y223H、K225Y、K227R、F232N、T240R和E264K。
在一些实施例中,所述HE变体切割TGFβR2靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个:SEQ ID NO:1-5中的任一个或其生物活性片段的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R、L192T、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223R、K225Y、K227R、F232N和T240R。
在特定实施例中,所述HE变体切割TGFβR2靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个:SEQ ID NO:1-5中的任一个或其生物活性片段的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R、L192T、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223H、K225Y、K227R、F232N、T240R和E264K。
在附加实施例中,所述HE变体包括与SEQ ID NO:6-7中的任一个中所示的氨基酸序列至少80%、优选地至少85%、更优选地至少90%或甚至更优选地至少95%相同的氨基酸序列,或其生物活性片段。
在特定实施例中,所述HE变体包括SEQ ID NO:6中所示的所述氨基酸序列或其生物活性片段。
在特定实施例中,所述HE变体包括SEQ ID NO:7中所示的所述氨基酸序列或其生物活性片段。
在特定实施例中,所述多肽结合SEQ ID NO:11中所示的所述多核苷酸序列。
在进一步实施例中,所述多肽进一步包括DNA结合结构域。
在一些实施例中,所述DNA结合结构域选自由以下组成的组:TALE DNA结合结构域和锌指DNA结合结构域。
在某些实施例中,所述TALE DNA结合结构域包括约9.5个TALE重复单元到约15.5个TALE重复单元。
在附加实施例中,所述TALE DNA结合结构域结合所述TGFβR2基因中的多核苷酸序列。
在特定实施例中,所述TALE DNA结合结构域结合SEQ ID NO:12中所示的所述多核苷酸序列。
在某些实施例中,所述多肽结合并切割SEQ ID NO:13中所示的所述多核苷酸序列。
在某些实施例中,所述锌指DNA结合结构域包括2个、3个、4个、5个、6个、7个或8个锌指基序。
在进一步实施例中,所述多肽进一步包括肽连接子和末端加工酶或其生物活性片段。
在特定实施例中,所述多肽进一步包括病毒自切割2A肽和末端加工酶或其生物活性片段。
在附加实施例中,所述末端加工酶或其生物活性片段具有5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶、5'瓣状核酸内切酶、解旋酶或非模板依赖性DNA聚合酶活性。
在特定实施例中,所述末端加工酶包括Trex2或其生物活性片段。
在某些实施例中,所述多肽包括SEQ ID NO:8-9中的任一个中所示的所述氨基酸序列或其生物活性片段。
在进一步实施例中,所述多肽包括SEQ ID NO:8中所示的所述氨基酸序列或其生物活性片段。
在特定实施例中,所述多肽包括SEQ ID NO:9中所示的所述氨基酸序列或其生物活性片段。
在进一步实施例中,所述多肽在SEQ ID NO:11或13中所示的多核苷酸序列处切割所述人TGFβR2基因。
在各个实施例中,本公开部分地设想一种编码本文所设想的多肽的多核苷酸。
在各个实施例中,本公开部分地设想一种编码本文所设想的多肽的mRNA。
在特定实施例中,所述mRNA包括SEQ ID NO:20中所示的所述序列。
在各个实施例中,本公开部分地设想一种编码本文所设想的多肽的cDNA。
在某些实施例中,本公开部分地设想一种包括编码本文所设想的多肽的多核苷酸的载体。
在各个实施例中,本公开部分地设想一种包括本文所设想的多肽的细胞。
在一些实施例中,本公开部分地设想一种包括编码本文所设想的多肽的多核苷酸的细胞。
在各个实施例中,本公开部分地设想一种包括本文所设想的载体的细胞。
在附加实施例中,本公开部分地设想一种包括通过本文所设想的多肽引入的一个或多个基因修饰的细胞。
在特定实施例中,所述细胞包括编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体中的一种或多种的多核苷酸。
在某些实施例中,所述多核苷酸进一步包括可操作地连接到编码所述免疫效力增强子、所述免疫抑制信号阻尼子或所述工程化抗原受体的所述多核苷酸的RNA聚合酶II启动子。
在特定实施例中,所述RNA聚合酶II启动子选自由以下组成的组:短EF1α启动子、长EF1α启动子、人ROSA 26基因座、泛素C(UBC)启动子、磷酸甘油酸激酶-1(PGK)启动子、巨细胞病毒增强子/鸡β-肌动蛋白(CAG)启动子、β-肌动蛋白启动子和骨髓增殖性肉瘤病毒增强子、阴性对照区缺失、dl587rev引物结合位点取代的(MND)启动子。
在一些实施例中,所述多核苷酸进一步编码可操作地连接到所述免疫效力增强子、所述免疫抑制信号阻尼子或所述工程化抗原受体,散布于其之间和/或位于其两侧的一种或多种自切割病毒肽。
在一些实施例中,所述自切割病毒肽是2A肽。
在某些实施例中,所述多核苷酸进一步包括异源多腺苷酸化信号。
在一些实施例中,所述免疫抑制信号阻尼子包括抵消免疫抑制因子的酶功能。
在一些实施例中,所述免疫抑制信号阻尼子包括犬尿氨酸酶活性。
在特定实施例中,所述免疫抑制信号阻尼子包括:结合免疫抑制因子的外结构域,任选地其中所述外结构域是抗体或其抗原结合片段;结合免疫抑制因子的外结构域和跨膜结构域;或结合免疫抑制因子的外结构域、跨膜结构域和无法向所述细胞转导免疫抑制信号的经过修饰的内结构域。
在某些实施例中,所述免疫抑制信号阻尼子的外结构域和/或跨膜结构域是所述TGFβR2的外结构域和/或跨膜结构域。
在一些实施例中,所述免疫效力增强子选自由以下组成的组:双特异性T细胞衔接子分子(BiTE)、免疫增强因子和翻转受体。
在特定实施例中,所述免疫增强因子选自由以下组成的组:细胞因子、趋化因子、细胞毒素、细胞因子受体和其变体。
在附加实施例中,所述翻转受体包括TGFβR2外结构域和跨膜结构域;以及来自CD28、CD134、CD137、CD278和/或CD3ζ的与所述TGFβR2跨膜结构域的C末端框内融合的内结构域。
在某些实施例中,所述翻转受体包括TGFβR2外结构域;从CD3多肽、CD4、CD8α、CD28、CD134或CD137分离的跨膜结构域;以及来自CD28、CD134、CD137、CD278和/或CD3ζ的与所述TGFβR2外结构域的C末端框内融合的内结构域。
在特定实施例中,所述翻转受体包括TGFβR2外结构域;以及从CD3多肽、CD4、CD8α、CD28、CD134或CD137分离的与所述TGFβR2外结构域的C末端框内融合的跨膜结构域和内结构域。
在附加实施例中,所述工程化抗原受体选自由以下组成的组:工程化TCR、CAR、Daric或zetakine。
在特定实施例中,所述工程化受体未整合到所述TGFβR2基因中。
在某些实施例中,编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体中的一种或多种的所述多核苷酸被整合到所述TGFβR2基因中。
在进一步实施例中,包括编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体中的一种或多种的所述多核苷酸的供体修复模板在通过本文所设想的多肽引入的DNA双链断裂位点处整合到所述TGFβR2基因中。
在一些实施例中,所述细胞是造血细胞。
在附加实施例中,所述细胞是T细胞。
在特定实施例中,所述细胞是CD3+、CD4+和/或CD8+细胞。
在特定实施例中,所述细胞是免疫效应细胞。
在进一步实施例中,所述细胞是细胞毒性T淋巴细胞(CTL)、肿瘤浸润淋巴细胞(TIL)或辅助T细胞。
在某些实施例中,所述细胞是自然杀伤(NK)细胞或自然杀伤T(NKT)细胞。
在特定实施例中,所述细胞的来源是外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、来自感染部位的组织、腹水、胸腔积液、脾组织或肿瘤。
在特定实施例中,本公开部分地设想多个包括本文所设想的一种或多种细胞的细胞。
在各个实施例中,本公开部分地设想一种包括本文所设想的一种或多种细胞的组合物。
在某些实施例中,本公开部分地设想一种包括本文所设想的一种或多种细胞的组合物和药学上可接受的载剂。
在各个实施例中,本公开部分地设想一种在细胞中编辑人TGFβR2基因的方法,其包括:将编码本文所设想的多肽的多核苷酸引入所述细胞中,其中所述多肽的表达在人TGFβR2基因的靶位点处产生双链断裂。
在一些实施例中,本公开部分地设想一种在细胞中编辑人TGFβR2基因的方法,其包括:将编码本文所设想的多肽的多核苷酸引入所述细胞中,其中所述多肽的表达在人TGFβR2基因的靶位点处产生双链断裂,其中通过非同源性末端连接(NHEJ)修复所述断裂。
在各个实施例中,本公开部分地设想一种在细胞中编辑人TGFβR2基因的方法,其包括:将编码本文所设想的多肽的多核苷酸和供体修复模板引入所述细胞中,其中所述多肽的表达在人TGFβR2基因的靶位点处产生双链断裂并且通过双链断裂(DSB)的位点处的同源性定向修复(HDR)将所述供体修复模板并入所述人TGFβR2基因中。
在进一步实施例中,所述细胞是造血细胞。
在特定实施例中,所述细胞是T细胞。
在特定实施例中,所述细胞是CD3+、CD4+和/或CD8+细胞。
在某些实施例中,所述细胞是免疫效应细胞。
在一些实施例中,所述细胞是细胞毒性T淋巴细胞(CTL)、肿瘤浸润淋巴细胞(TIL)或辅助T细胞。
在特定实施例中,所述细胞是自然杀伤(NK)细胞或自然杀伤T(NKT)细胞。
在某些实施例中,所述细胞的来源是外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、来自感染部位的组织、腹水、胸腔积液、脾组织或肿瘤。
在特定实施例中,编码所述多肽的所述多核苷酸是mRNA。
在附加实施例中,将编码5'-3'核酸外切酶的多核苷酸引入所述细胞中。
在一些实施例中,将编码Trex2的多核苷酸或其生物活性片段引入所述细胞中。
在进一步实施例中,所述供体修复模板编码与野生型TGFβR2基因相比包括一个或多个突变的TGFβR2基因或其部分。
在特定实施例中,所述供体修复模板编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体中的一种或多种。
在附加实施例中,所述供体修复模板进一步包括可操作地连接到所述免疫效力增强子、所述免疫抑制信号阻尼子或所述工程化抗原受体的RNA聚合酶II启动子。
在进一步实施例中,所述RNA聚合酶II启动子选自由以下组成的组:短EF1α启动子、长EF1α启动子、人ROSA 26基因座、泛素C(UBC)启动子、磷酸甘油酸激酶-1(PGK)启动子、巨细胞病毒增强子/鸡β-肌动蛋白(CAG)启动子、β-肌动蛋白启动子和骨髓增殖性肉瘤病毒增强子、阴性对照区缺失、dl587rev引物结合位点取代的(MND)启动子。
在某些实施例中,所述供体修复模板进一步编码可操作地连接到所述免疫效力增强子、所述免疫抑制信号阻尼子或所述工程化抗原受体,散布于其之间和/或位于其两侧的一种或多种自切割病毒肽。
在附加实施例中,所述自切割病毒肽是2A肽。
在一些实施例中,所述供体修复模板进一步包括异源多腺苷酸化信号。
在某些实施例中,所述免疫抑制信号阻尼子包括抵消免疫抑制因子的酶功能。
在进一步实施例中,所述免疫抑制信号阻尼子包括犬尿氨酸酶活性。
在特定实施例中,所述免疫抑制信号阻尼子包括:结合免疫抑制因子的外结构域,任选地其中所述外结构域是抗体或其抗原结合片段;结合免疫抑制因子的外结构域和跨膜结构域;或结合免疫抑制因子的外结构域、跨膜结构域和无法向所述细胞转导免疫抑制信号的经过修饰的内结构域。
在附加实施例中,所述免疫抑制信号阻尼子的外结构域和/或跨膜结构域是所述TGFβR2的外结构域和/或跨膜结构域。
在某些实施例中,所述免疫效力增强子选自由以下组成的组:双特异性T细胞衔接子分子(BiTE)、免疫增强因子和翻转受体。
在进一步实施例中,所述免疫增强因子选自由以下组成的组:细胞因子、趋化因子、细胞毒素、细胞因子受体和其变体。
在特定实施例中,所述翻转受体包括TGFβR2外结构域和跨膜结构域;以及来自CD28、CD134、CD137、CD278和/或CD3ζ的与所述TGFβR2跨膜结构域的C末端框内融合的内结构域。
在附加实施例中,所述翻转受体包括TGFβR2外结构域;从CD3多肽、CD4、CD8α、CD28、CD134或CD137分离的跨膜结构域;以及来自CD28、CD134、CD137、CD278和/或CD3ζ的与所述TGFβR2外结构域的C末端框内融合的内结构域。
在进一步实施例中,所述翻转受体包括TGFβR2外结构域;以及从CD3多肽、CD4、CD8α、CD28、CD134或CD137分离的与所述TGFβR2外结构域的C末端框内融合的跨膜结构域和内结构域。
在附加实施例中,所述工程化抗原受体选自由以下组成的组:工程化TCR、CAR、Daric或zetakine。
在附加实施例中,所述供体修复模板包括与处于所述DSB的5'端的人TGFβR2基因序列同源的5'同源臂以及与处于所述DSB的3'端的人TGFβR2基因序列同源的3'同源臂。
在特定实施例中,所述5'同源臂和所述3'同源臂的长度独立地选自约100bp到约2500bp。
在一些实施例中,所述5'同源臂和所述3'同源臂的长度独立地选自约600bp到约1500bp。
在一些实施例中,所述5'同源臂为约1500bp,并且所述3'同源臂为约1000bp。
在某些实施例中,所述5'同源臂为约600bp,并且3'所述同源臂为约600bp。
在特定实施例中,病毒载体被用于将所述供体修复模板引入所述细胞中。
在附加实施例中,所述病毒载体是重组腺相关病毒载体(rAAV)或逆转录病毒。
在进一步实施例中,所述rAAV具有一个或多个来自AAV2的ITR。
在某些实施例中,所述rAAV具有选自由以下组成的组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和AAV10。
在附加实施例中,所述rAAV具有AAV2或AAV6血清型。
在一些实施例中,所述逆转录病毒是慢病毒。
在特定实施例中,所述慢病毒是整合酶缺陷型慢病毒(IDLV)。
在各个实施例中,本公开部分地设想一种治疗、预防癌症、传染病、自身免疫性疾病、炎症性疾病和免疫缺陷症或与其相关的病状或改善其至少一种症状的方法,所述方法包括向受试者施用有效量的本文所设想的组合物。
在各个实施例中,本公开部分地设想一种治疗实体癌的方法,所述方法包括向受试者施用有效量的本文所设想的组合物。
在进一步实施例中,所述实体癌包括肝癌、胰腺癌、肺癌、乳腺癌、卵巢癌、前列腺癌、睾丸癌、膀胱癌、脑癌、肉瘤、头颈癌、骨癌、甲状腺癌、肾癌或皮肤癌。
在各个实施例中,本公开部分地设想一种治疗血液恶性肿瘤的方法,所述方法包括向受试者施用有效量的本文所设想的组合物。
在附加实施例中,所述血液恶性肿瘤是白血病、淋巴瘤或多发性骨髓瘤。
附图说明
图1示出了TGFβR2基因和外显子6(SEQ ID NO:60和61)中的HE靶位点。
图2示出了如何经由通过三轮分选针对嵌合“半位点”对NTD和CTD进行工程化(对于CTD结构域来说,三轮并行筛选中只有一轮成功,而对于NTD结构域来说,四轮成功)来对TGFβR2HE进行重编程,随后是融合重编程的结构域并对完整的TGFβR2靶位点进行筛选以分离完全重编程的HE。
图3示出了TGFβR2HE变体在染色体报告子分析中的活性以及在随后的TGFβR2.B3精化中增加活性以在更严格的条件下通过诱变和筛选实现更具活性的变体。
图4示出了TGFβR2.B3.F8HE变体的酵母表面亲和力滴定。
图5示出了精化前和精化后的TGFβR2HE变体(SEQ ID NO:63和64)与野生型I-OnuI蛋白(SEQ ID No:62)的比对,从而突出显示了不一致的位置。
图6示出了TAL RVD与TGFβR2.B3.F8HE变体融合以产生TGFβR2.B3.F8megaTAL的结合位点(SEQ ID NO:65和66)。
图7示出了在连同Trex2一起或在没有Trex2的情况下将TGFβR2.B3.F8megaTAL共递送到T细胞中在靶基因座处示出约65%的编辑。
图8示出了TGFβR2.B3.F8megaTAL处理显著降低通过rTGFβ-1配体刺激对Smad2/3进行的磷酸化。
图9示出了用TGFβR2.B3.F8megaTAL处理的未转导的(A)或表达抗GD2CAR的(B)T细胞的编辑效率。未转导的和抗GD2CAR转导的细胞的编辑率相似,分别为89%和89.6%。
图10示出了TGFβR2.B3.F8megaTAL处理在未转导的和表达抗GD2CAR的人T细胞中显著降低通过rTGFβ-1配体刺激对Smad2/3进行的磷酸化。(A)通过流式细胞术进行pSMAD2/3染色。未染色的细胞用作染色的阴性对照。(B)pSMAD2/3信号的平均荧光强度。
图11示出了用TGFβR2.B3.F8megaTAL电穿孔并在存在rTGFβ-1的情况下与表达GD2的靶细胞共培养的抗GD2CAR T细胞导致暴露于rTGFβ-1的对照处理细胞中IFNγ(A)和IL-2(B)分泌的脱阻抑。
序列标识符简要说明
SEQ ID NO:1是野生型I-OnuI LAGLIDADG归巢核酸内切酶(LHE)的氨基酸序列。
SEQ ID NO:2是野生型I-OnuI LHE的氨基酸序列。
SEQ ID NO:3是野生型I-OnuI LHE的生物活性片段的氨基酸序列。
SEQ ID NO:4是野生型I-OnuI LHE的生物活性片段的氨基酸序列。
SEQ ID NO:5是野生型I-OnuI LHE的生物活性片段的氨基酸序列。
SEQ ID NO:6是被重编程以结合并切割人TGFβR2基因中的靶位点的I-OnuI LHE变体的氨基酸序列。
SEQ ID NO:7是被重编程以结合并切割人TGFβR2基因中的靶位点的I-OnuI LHE变体的氨基酸序列。
SEQ ID NO:8是结合并切割人TGFβR2基因中的靶位点的megaTAL的氨基酸序列。
SEQ ID NO:9是结合并切割人TGFβR2基因中的靶位点的megaTAL的氨基酸序列。
SEQ ID NO:10是结合并切割与鼠Trex2融合的人TGFβR2基因中的靶位点的megaTAL的氨基酸序列。
SEQ ID NO:11是人TGFβR2基因的外显子6中的I-OnuI LHE变体靶位点。
SEQ ID NO:12是人TGFβR2基因的外显子6中的TALE DNA结合结构域靶位点。
SEQ ID NO:13是人TGFβR2基因的外显子6中的megaTAL靶位点。
SEQ ID NO:14是人TGFβR2基因的外显子6中的I-OnuI LHE变体N末端结构域靶位点。
SEQ ID NO:15是人TGFβR2基因的外显子6中的I-OnuI LHE变体N末端结构域靶位点。
SEQ ID NO:16是人TGFβR2基因的外显子6中的I-OnuI LHE变体N末端结构域靶位点。
SEQ ID NO:17是人TGFβR2基因的外显子6中的I-OnuI LHE变体N末端结构域靶位点。
SEQ ID NO:18是人TGFβR2基因的外显子6中的I-OnuI LHE变体C末端结构域靶位点。
SEQ ID NO:19是TGFβR2.B3.F8表面展示质粒的多核苷酸序列。
SEQ ID NO:20是编码TGFβR2.B3.F8megaTAL的mRNA序列。
SEQ ID NO:21是编码鼠Trex2的mRNA序列。
SEQ ID NO:22是编码鼠Trex2的氨基酸序列。
SEQ ID NO:23-33阐述了各种连接子的氨基酸序列。
SEQ ID NO:34-58阐述了蛋白酶切割位点和自切割多肽切割位点的氨基酸序列。
在前述序列中,X(如果存在的话)指任何氨基酸或不存在氨基酸。
具体实施方式
A.概述
本公开总体上部分涉及经改进的基因组编辑组合物及其使用方法。不希望受任何特定理论的束缚,各个实施例中所设想的基因组编辑组合物可以用于预防或治疗癌症、感染性疾病、自身免疫性疾病、炎性疾病和免疫缺陷或与其相关的病状或改善其至少一种症状的病症。困扰现有过继性细胞疗法的一个限制或问题是由于肿瘤微环境介导的耗竭所导致的免疫效应子细胞的低反应性。耗竭型T细胞具有与原初T细胞、效应子T细胞或记忆T细胞明显不同的独特的分子特征。它们被限定为具有降低的细胞因子表达和效应子功能的T细胞。TGFβ信号传导与肿瘤微环境中的T细胞耗竭有关;通过TGFβR1/TGFβR2增加的TGFβ信号传导与降低的T细胞增殖以及减少的IFN-γ产生相关联。
在特定实施例中,通过消除、降低或抑制TGFβR2表达和/或通过TGFβ的信号传导使本文所设想的经基因组编辑的免疫效应子细胞对耗竭更具抗性。
各个实施例中所设想的基因组编辑组合物和方法包括核酸酶变体,所述核酸酶变体被设计成结合并切割人转化生长因子β受体2(TGFβR2)基因中的靶位点。特定实施例中所设想的核酸酶变体可以用于在靶多核苷酸序列中引入双链断裂,所述双链断裂可以在不存在多核苷酸模板例如供体修复模板的情况下通过非同源末端接合(NHEJ)进行修复或在存在供体修复模板的情况下通过同源定向修复(HDR)(即同源重组)进行修复。某些实施例中所设想的核酸酶变体还可以被设计为产生单链DNA断裂的切口酶,所述单链DNA断裂可以在存在供体修复模板的情况下使用细胞的碱基切除修复(BER)机制或同源重组进行修复。NHEJ是一种经常导致形成破坏基因功能的小型插入和缺失的容易出错的过程。同源重组需要同源DNA作为修复模板并且可以被用来通过以下方式创建无限种类的指定修饰:在靶位点处引入含有期望序列的两侧具有与靶位点两侧的区同源的序列的供体DNA。
在一个优选的实施例中,本文所设想的基因组编辑组合物包括靶向人TGFβR2基因的归巢核酸内切酶变体或megaTAL。
在一个优选的实施例中,本文所设想的基因组编辑组合物包括归巢核酸内切酶变体或megaTAL以及末端加工酶例如Trex2。
在各个实施例中,设想了经基因组编辑的细胞。经基因组编辑的细胞包括经编辑的TGFβR2基因,其中编辑策略被设计成通过表达TGFβR2的细胞外配体结合结构域但破坏其转导免疫抑制细胞内信号的能力来降低或消除TGFβR2表达和/或指派TGFβR2作为显性阴性。
在各个实施例中,在T细胞例如免疫效应子细胞中的TGFβR2基因的靶位点中产生DNA断裂,并且经切割的基因组序列末端的NHEJ可能导致具有少量或无TGFβR2表达的细胞,并且优选地导致缺乏或大体上缺乏功能性TGFβR2表达和/或信号传导例如缺乏增加T细胞耗竭的能力的T细胞。不希望受任何特定理论的束缚,缺乏功能性TGFβR2表达的T细胞对免疫抑制和T细胞耗竭更具抗性,并且因此更具持久性和治疗有效性。
在各个其它实施例中,提供了用于修复经切割的TGFβR2基因组序列的供体模板。在DNA断裂位点处,通过同源重组用模板序列修复TGFβR2基因。在特定实施例中,修复模板包括破坏、并且优选地大体上降低或消除功能性TGFβR2表达的多核苷酸序列。
在特定实施例中,TGFβR2基因用编码TGFβR2外结构域的模板修复,所述TGFβR2外结构域对其配体具有增加的亲和力。
在特定实施例中,用编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体的多核苷酸修复TGFβR2基因。
在特定实施例中,用编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体的多核苷酸修复TGFβR2基因,并且将其引入到TGFβR2基因中以采用内源TGFβR2启动子转录地控制免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体的表达。
在优选的实施例中,本文所设想的基因组编辑组合物和方法用于编辑人TGFβR2基因。
因此,与现有的过继性细胞疗法相比,本文所设想的方法和组合物代表了量子改进。
除非特别相反地指出,否则特定实施例的实践将采用本领域技术范围内的化学、生物化学、有机化学、分子生物学、微生物学、重组DNA技术、遗传学、免疫学和细胞生物学的常规方法,出于说明的目的,下面描述了所述方法中的许多方法。这种技术在文献中有充分说明。参见例如,Sambrook等人,《分子克隆:实验室指南(Molecular Cloning:ALaboratory Manual)》(第3版,2001年);Sambrook等人,《分子克隆:实验室指南》(第2版,1989年);Maniatis等人,《分子克隆:实验室指南》(1982年);Ausubel等人,《当代分子生物学实验手册(Current Protocols in Molecular Biology)》(约翰威利父子出版社(Wileyand Sons),2008年7月更新);《精编分子生物学实验指南:当代分子生物学实验手册的方法概要(Short Protocols in Molecular Biology:A Compendium of Methods fromCurrent Protocols in Molecular Biology)》,格林出版协会和威利跨学科出版社(Greene Pub.Associates and Wiley-Interscience);Glover,《DNA克隆:实用方法(DNACloning:A Practical Approach)》,第I卷和第II卷(IRL出版社(IRL Press),牛津,1985年);Anand,《复杂基因组分析技术(Techniques for the Analysis of ComplexGenomes)》,(学术出版社(Academic Press),纽约,1992年);《转录和转译(Transcriptionand Translation)》(B.Hames和S.Higgins编辑,1984年);Perbal,《分子克隆实用指南(APractical Guide to Molecular Cloning)》(1984年);Harlow和Lane,《抗体(Antibodies)》,(冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),冷泉港,纽约,1998年)《当代免疫学指南(Current Protocols in Immunology)》,Q.E.Coligan、A.M.Kruisbeek、D.H.Margulies、E.M.Shevach和W.Strober编辑,1991年):《免疫学年度评论(Annual Review of Immunology)》;以及《免疫学进展(Advances in Immunology)》等期刊上的专著。
B.定义
除非另外限定,否则本文所使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管类似于或等效于本文所描述的方法和材料的任何方法和材料可以用于实践或测试特定实施例,但是本文描述了组合物、方法和材料的优选的实施例。出于本公开的目的,下文中定义了以下术语。
本文所使用的冠词“一个/一种(a/an)”和“所述(the)”是指一个/一种或多于一个或一种(即,至少一个/种、或一个/种或多个/种)所述冠词的语法宾语。举例来说,“元件”意指一个元件或一个或多个元件。
替代方案(例如,“或”)的使用应理解为意指替代方案中的一个、两个或其任何组合。
术语“和/或”应理解为意指替代方案中的一个或两个。
如本文所使用的,术语“约(about)”或“大约(approximately)”是指与参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度相比,变化幅度高达15%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度。在一个实施例中,术语“约”或“大约”是指参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度的±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%或±1%的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度。
在一个实施例中,范围例如1到5、约1到5或约1到约5是指所述范围所涵盖的每个数值。例如,在一个非限制性且仅仅是说明性的实施例中,范围“1到5”等同于表达1、2、3、4、5;或1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5或5.0;或1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9或5.0。
如本文所使用的,术语“基本上(substantially)”是指与参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度相比80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度。在一个实施例中,“基本上相同”是指产生与参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度大致相同的效应例如生理效应的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度。
贯穿本说明书,除非上下文另外要求,否则词语“包括(comprise)”、“包括(comprises)”、“包括(comprising)”将被理解为暗示包含所陈述的步骤或元件或步骤组或元件组,但不排除任何其它步骤或元件或步骤组或元件组。“由……组成(consisting of)”意指包含并限于短语“由……组成”之后的任何内容。因此,短语“由……组成”表明所列出的元件是必需的或强制性的,并且不存在其它元件。“基本上由……组成(consistingessentially of)”意指包含在所述短语之后列出的任何元件,并且限于不干扰或促进本公开中针对所列元件指定的活动或动作的其它元件。因此,短语“基本上由……组成”表明所列元件是必需的或强制性的,但不存在实质上影响所列元件的活动或动作的其它元件。
贯穿本说明书,对“一个实施例(one embodiment)”、“实施例(an embodiment)”、“特定实施例(a particular embodiment)”、“相关实施例(a related embodiment)”、“某个实施例(a particulat embodiment)”、“另外的实施例(an aditional embodiment)”或“另一个实施例(a further embodiment)”或其组合的引用意味着结合所述实施例描述的特定特征、结构或特性包含在至少一个实施例中。因此,前述短语在贯穿本说明书中的各个地方的出现不一定全部指代同一个实施例。此外,在一个或多个实施例中,特定特征、结构或特性可以以任何合适的方式组合。还应理解,在一个实施例中对特征的肯定叙述用作在特定实施例中排除所述特征的基础。
术语“离体(ex vivo)”通常是指在生物体外发生的活动,如在生物体外的人工环境中的活组织中或上进行的实验或测量,优选具有最小的自然条件改变。在特定实施例中,“离体”程序涉及从生物体取得并在实验室设备中通常在无菌条件下并且通常在几小时或高达约24小时但包含高达48小时或72小时(视情况而定)内培养或调节的活细胞或活组织。在某些实施例中,可以收集和冷冻这种组织或细胞,并且随后将其解冻用于离体治疗。使用活细胞或活组织进行的持续时间超过几天的组织培养实验或程序通常被认为是“体外(invitro)”,但在某些实施例中,此术语可以与离体可互换地使用。
术语“体内(in vivo)”通常是指在生物体内发生的活动。在一个实施例中,细胞基因组在体内被工程化、编辑或修饰。
“增强(enhance)”或“促进(promoto)”或“增加(increase)”或“扩展(expand)”或“加强(potentiate)”通常是指与由媒剂或对照物引起的应答相比,本文所设想的产生、引发或引起更大应答(即,生理应答)的核酸酶变体、基因组编辑组合物或经基因组编辑的细胞的能力。可测量的应答可以包含催化活性、结合亲和力、结合位点特异性、结合位点选择性、持久性、细胞溶解活性的增加和/或促炎细胞因子的增加以及从本领域的理解和本文的描述中显而易见的其它可测量的应答。“增加的(increased)”或“增强的(enhanced)”量通常是“统计上显著(statistically significant)”的量,并且可以包含1.1倍、1.2倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍或更多倍(例如,500倍、1000倍)(包含所有整数以及其之间且超过1的小数点,如1.5、1.6、1.7、1.8等)于由媒剂或对照物产生的应答的增加。
“减少(decrease或lower或lessen或reduce)”或“减轻(abate)”或“消除(ablate)”或“抑制(inhibit或dampen)”通常是指与由媒剂或对照物引起的应答相比,本文所设想的核酸酶变体、基因组编辑组合物或经基因组编辑的细胞产生、引发或引起更小的应答(即,生理应答)的能力。可测量的应答可以包含脱靶结合亲和力、脱靶切割特异性、T细胞耗竭等等的降低。“降低的(decresed)”或“减少的(reduced)”量通常是“统计上显著”的量,并且可以包含1.1倍、1.2倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍或更多倍(例如,500倍、1000倍)(包含所有整数以及其之间且超过1的小数点,如1.5、1.6、1.7、1.8等)于由媒剂或对照物产生的应答(参考应答)的减少。
“维持(maintain)”或“保持(preserve)”或“维持(maintenance)”或“无变化(nochange)”或“无实质性变化(no substantial change)”或“无实质性减少(no substantialdecrease)”通常是指与由媒剂或对照物引起的应答相比,本文所设想的核酸酶变体、基因组编辑组合物或经基因组编辑的细胞产生、引发或引起基本相似或相当的生理应答(即,下游效应)的能力。相当的应答是与参考应答没有显著差异或可测量差异的应答。
本文所使用的,术语“特异性结合亲和力(specific binding affinity)”或“特异性结合(specifically binds)”或“特异性结合(specifically bound)”或“特异性结合(specific binding)”或“特异性地靶向(specifically targets)”描述了与背景结合相比,一个分子以更大的结合亲和力与另一个分子结合,例如多肽的DNA结合结构域与DNA结合。如果结合结构域以例如大于或等于约105M-1的亲和力或Ka(即,特定结合相互作用的以1/M为单位的平衡缔合常数)与靶位点结合或相关联,则所述结合被称为与靶位点“特异性结合”。在某些实施例中,结合结构域以大于或等于约106M-1、107M-1、108M-1、109M-1、1010M-1、1011M-1、1012M-1或1013M-1的Ka与靶位点结合。“高亲和力(High affinity)”结合结构域是指Ka为至少107M-1、至少108M-1、至少109M-1、至少1010M-1、至少1011M-1、至少1012M-1、至少1013M-1或更高的那些结合结构域。
可替代地,亲和力可能被定义为特定结合相互作用的以M为单位的平衡解离常数(Kd)(例如,10-5M到10-13M或更低)。包括用于特定实施例中所设想的DNA靶位点的一个或多个DNA结合结构域的核酸酶变体的亲和力可以使用常规技术例如酵母细胞表面展示、或通过结合缔合、或使用标记配体的置换分析法容易地确定。
在一个实施例中,特异性结合的亲和力是背景结合的约2倍、背景结合的约5倍、背景结合的约10倍、背景结合的约20倍、背景结合的约50倍、背景结合的约100倍、或者背景结合的约1000倍或更多倍。
术语“选择性结合(selectively binds)”或“选择性结合(selectively bound)”或“选择性结合(selectively binding)”或“选择性地靶向(selectively targets)”描述了在存在多个脱靶分子的情况下一个分子与靶分子的优先结合(中靶结合)。在特定的实施例中,HE或megaTAL选择性地结合中靶DNA结合位点比HE或megaTAL结合脱靶DNA结合位点更频繁约5倍、10倍、15倍、20倍、25倍、50倍、100倍或1000倍。
“中靶(on-target)”是指靶位点序列。
“脱靶(off-target)”是指与靶位点序列相似但不相同的序列。
“靶位点(target site)”或“靶序列(target sequence)”是染色体或染色体外核酸序列,其限定核酸的结合分子将与其结合和/或将切割的一部分,条件是存在充分的结合和/或切割条件。当参照多核苷酸序列或参照仅引用靶位点或靶序列的一条链的SEQ ID NO时,将应理解,由核酸酶变体结合和/或切割的靶位点或靶序列是双链的并且包括参考序列及其互补序列。在优选的实施例中,靶位点是人TGFβR2基因中的序列。
“重组(recombination)”是指在两个多核苷酸之间交换遗传信息的过程,其包含但不限于通过非同源末端接合(NHEJ)和同源重组进行的供体捕获。出于本公开的目的,“同源重组(HR)”是指在例如通过同源定向修复(HDR)机制修复细胞中的双链断裂期间发生的这种交换的专门形式。此过程需要核苷酸序列同源性,使用“供体”分子作为模板以修复“靶”分子(即,经历双链断裂的分子)并且以各种方式被称为“非交换基因转换(non-crossover gene conversion)”或“短链基因转换(short tract gene conversion)”,因为其导致遗传信息从供体转移到靶。不希望受任何特定理论的束缚,这种转移可以涉及在断裂的靶与供体之间形成的异源双链DNA的失配校正和/或“合成依赖性链退火(synthesis-dependent strand annealing)”,其中供体用于重新合成将成为靶的一部分的遗传信息和/或相关过程。这种专门的HR通常导致靶分子序列的改变,使得供体多核苷酸的序列的一部分或全部并入靶多核苷酸中。
“NHEJ”或“非同源末端接合”是指在不存在供体修复模板或同源序列的情况下双链断裂的解决方案。NHEJ可以在断裂位点处导致插入和缺失。NHEJ由几种子途径介导,这些途径中的每种途径都有不同的突变后果。经典的NHEJ途径(cNHEJ)需要KU/DNA-PKcs/Lig4/XRCC4复合物,以最少的处理将末端连接回一起并且经常导致断裂的精准修复。替代性NHEJ途径(altNHEJ)还在解决dsDNA断裂方面具有活性,但这些途径具有相当大的诱变性,并且经常导致对通过插入和缺失标记的断裂的不精准修复。尽管不希望受任何特定理论的束缚,但是设想到,通过末端加工酶如例如核酸外切酶例如Trex2对dsDNA断裂进行的修饰可能增加不精准修复的可能性。
“切割(cleavage)”是指DNA分子的共价骨架的断裂。切割可以通过多种方法引发,包含但不限于磷酸二酯键的酶促水解或化学水解。单链切割和双链切割两者都是可能的。由于两个不同的单链切割事件,可能发生双链切割。DNA切割可以导致平末端或交错末端的产生。在某些实施例中,本文所设想的多肽和核酸酶变体例如归巢核酸内切酶变体、megaTAL等用于靶双链DNA切割。核酸内切酶切割识别位点可能位于任一DNA链上。
“外源”分子是通常不存在于细胞中但通过一种或多种遗传方法、生物化学方法或其它方法引入到细胞中的分子。示例性外源分子包含但不限于小型有机分子、蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何经过修饰的衍生物或包括上述分子中的一个或多个的任何复合物。用于将外源分子引入到细胞中的方法是本领域技术人员已知的,并且包含但不限于脂质介导的转移(即,脂质体,包含中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、生物聚合物纳米颗粒、磷酸钙共沉淀法、DEAE-葡聚糖介导的转移和病毒载体介导的转移。
“内源”分子是通常在特定环境条件下在特定发育阶段存在于特定细胞中的分子。其它内源分子可以包含蛋白质。
“基因”是指编码基因产物的DNA区以及调控基因产物的产生的所有DNA区,无论这种调控序列是否与编码序列和/或转录序列相邻。基因包含但不限于启动子序列、增强子、沉默子、绝缘子、边界元件、终止子、多腺苷酸化序列、转录后应答元件、转译调控序列如核糖体结合位点和内部核糖体进入位点、复制起点、基质附着位点以及基因座控制区。
“基因表达”是指将基因中含有的信息转化为基因产物。基因产物可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其它类型的RNA)或通过mRNA转译产生的蛋白质。基因产物还包含通过如封端、多腺苷酸化、甲基化和编辑等过程修饰的RNA,以及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化修饰的蛋白质。
如本文所使用的,术语“基因工程化的(genetically engineered)”或“基因修饰的(genetically modified)”是指以DNA或RNA的形式将额外的遗传材料的染色体或染色体外添加到细胞中的总基因材料中。基因修饰可以靶向或不靶向细胞的基因组中的特定位点。在一个实施例中,基因修饰是位点特异性的。在一个实施例中,基因修饰不是位点特异性的。
如本文所使用的,术语“基因组编辑”是指在细胞的基因组中的靶位点处对遗传材料进行的取代、缺失和/或引入,其恢复、校正、破坏和/或修饰基因或基因产物的表达。在特定实施例中所设想的基因组编辑包括将一个或多个核酸酶变体引入到细胞中以在细胞的基因组中的靶位点处或附近产生DNA病变,任选地在存在供体修复模板的情况下。
如本文所使用的,术语“基因疗法”是指将额外的基因材料引入到细胞中的总基因材料中,所述额外的基因材料恢复、校正或修饰基因或基因产物的表达或用于表达治疗性多肽。在特定实施例中,通过基因组编辑将基因材料引入到细胞的基因组中被认为是基因疗法,所述基因材料恢复、校正、破坏或修饰基因或基因产物的表达或用于表达治疗性多肽。
“免疫障碍(immune disorder)”是指引起免疫系统应答的疾病。在特定实施例中,术语“免疫障碍”是指癌症、移植物抗宿主病、自身免疫性疾病或免疫缺陷。在一个实施例中,免疫障碍涵盖传染病。
如本文所使用的,术语“癌症”通常涉及一类疾病或病症,其中异常细胞在没有控制的情况下分裂并且可能侵入附近的组织。
如本文所使用的,术语“恶性(malignant)”是指其中一组肿瘤细胞显示出不受控制的生长(即,超出正常限度的分裂)、侵入(即,侵入和破坏相邻组织)和转移(即,通过淋巴或血液扩散到体内的其它位置)中的一种或多种的癌症。
如本文所使用的,术语“转移(metastasize)”是指癌症从身体的一个部分扩散到另一部分。由已经扩散的细胞形成的肿瘤称为“转移性肿瘤(metastatic tumor)”或“转移(metastasis)”。转移性肿瘤含有与原始(原发性)肿瘤中的细胞相似的细胞。
如本文所使用的,术语“良性(benign)”或“非恶性(non-malignant)”是指可以长得更大但不扩散到身体其它部位的肿瘤。良性肿瘤是自限性的,通常不会侵入或转移。
“癌细胞(cancer cell)”或“肿瘤细胞(tumor cell)”是指癌性生长或组织的单个细胞。肿瘤通常是指由细胞异常生长形成的肿胀或病变,其可以是良性的、恶化前的或恶性的。大多数癌症形成肿瘤,但是一些例如白血病不一定形成肿瘤。对于形成肿瘤的那些癌症,术语癌症(细胞)和肿瘤(细胞)可互换使用。个体中的肿瘤的量是可以按肿瘤的数目、体积或重量来测量的“肿瘤负荷(tumor burden)”。
“移植物抗宿主病”或“GVHD”是指在细胞、组织或实体器官移植后可能发生的并发症。GVHD可以在干细胞或骨髓移植后发生,其中移植的供体细胞攻击移植接受者的身体。人类急性GVHD在移植后约60天内发生,并且通过细胞溶解性淋巴细胞的作用导致对皮肤、肝脏和肠道的损害。慢性GVHD发生较晚并且是主要影响皮肤的系统性自身免疫疾病,其导致B细胞的多克隆活化和Ig和自身抗体的生产过剩。实体器官移植移植物抗宿主病(SOT-GVHD)以两种形式发生。更常见的类型是抗体介导的,其中来自具有O型血的供体的抗体攻击具有A型血、B型血或AB型血的接受者的接受者的红细胞,从而导致轻度短暂的溶血性贫血。第二种形式的SOT-GVHD是与高死亡率相关联的细胞类型,其中供体衍生的T细胞对免疫不同的宿主组织产生免疫攻击,最常见于皮肤、肝脏、胃肠道和骨髓,从而导致这些器官中的并发症。
“移植物抗白血病(graft-versus-leukemia)”或“GVL”是指存在于供体的移植组织如骨髓或外周血中的免疫细胞对人的白血病细胞的免疫应答。
“自身免疫疾病”是指身体对其自身组织的某个成分产生免疫原性(即,免疫系统)应答的疾病。换句话说,免疫系统失去了其将身体内的某个组织或系统识别为“自我”的能力并且靶向并攻击所述组织或系统,好像其是外来的一样。自身免疫疾病的说明性实例包含但不限于:关节炎、炎性肠病、桥本氏甲状腺炎(Hashimoto's thyroiditis)、格雷夫氏病(Grave's disease)、狼疮、多发性硬化症、风湿性关节炎、溶血性贫血、抗免疫性甲状腺炎、全身性红斑狼疮、乳糜泻、克罗恩氏病(Crohn's disease)、结肠炎、糖尿病、硬皮病、牛皮癣等。
“免疫缺陷”是指免疫系统已经被疾病或化学品施用损害的患者的状态。这种病症使得系统缺乏防御外来物质所需数目和类型的血细胞。免疫缺陷病症或疾病是本领域已知的,并且包含例如AIDS(获得性免疫缺陷综合征)、SCID(严重联合免疫缺陷病)、选择性IgA缺乏症、常见变异型免疫缺陷、X连锁性无丙种球蛋白血症、慢性肉芽肿病、高IgM综合征、威斯科特-奥尔德里奇综合征(Wiskott-Aldrich Syndrome)(WAS)和糖尿病。
“传染病”是指可以从人到人或从生物体到生物体传播并且由微生物或病毒剂引起的疾病(例如,普通感冒)。传染病是本领域已知的,并且包含例如肝炎、性传播疾病(例如,衣原体、淋病)、结核病、HIV/AIDS、白喉、乙型肝炎、丙型肝炎、霍乱和流感。
如本文所使用的,术语“个体(individual)”和“受试者(subject)”通常可互换使用,并且指展现出可以使用核酸酶变体、基因组编辑组合物、基因疗法载体、基因组编辑载体、经基因组编辑的细胞和本文其它地方设想的方法治疗的免疫障碍的症状的任何动物。合适的受试者(例如,患者)包含实验室动物(如小鼠、大鼠、兔或豚鼠)、农场动物以及家畜或宠物(如猫或狗)。包含非人灵长类动物以及优选地人类受试者。典型的受试者包含患有、已经被诊断为患有或有风险患有免疫障碍的人类患者。
如本文所使用的,术语“患者”是指已被诊断患有可以用核酸酶变体、基因组编辑组合物、基因疗法载体、基因组编辑载体、经基因组编辑的细胞和本文其它地方设想的方法治疗的免疫障碍的受试者。
如本文所使用的,“治疗(treatment)”或“治疗(treating)”包含对疾病或病理病症的症状或病理的任何有益或期望的效果,并且甚至可以包含所治疗的疾病或病症例如癌症、GVHD、传染病、自身免疫疾病、炎性疾病和免疫缺陷的一个或多个可测量标记物的最小减少。治疗可以任选地涉及延迟疾病或病症的进展。“治疗”不一定表示完全根除或治愈疾病或病症或其相关症状。
如本文所使用的,“预防(prevent)”和类似的词语如“预防(prevention)”、“预防(prevented)”、“预防(preventing)”等指示用于预防、抑制或减少疾病或病症例如癌症、GVHD、传染病、自身免疫疾病、炎性疾病和免疫缺陷发生或复发的可能性的方法。预防还指代延迟疾病或病症的发作或复发或者延迟疾病或病症的症状的发生或复发。如本文所使用的,“预防”和类似词语还包含在疾病或病症发作或复发之前降低疾病或病症的强度、作用、症状和/或负担。
如本文所使用,短语“改善其至少一种症状”是指减少针对其而正对受试者进行治疗的疾病或病症例如癌症、GVHD、传染病、自身免疫疾病、炎性疾病和免疫缺陷的一种或多种症状。在特定实施例中,所治疗的疾病或病症是癌症,其中所改善的一种或多种症状包含但不限于虚弱、疲劳、呼吸短促、容易瘀伤和出血、频繁感染、淋巴结肿大、腹部肿胀或疼痛(由于腹部器官肿大)、骨骼或关节疼痛、骨折、意外体重减轻、食欲不振、盗汗、持续性轻度发烧和排尿减少(由于肾功能受损)。
如本文所使用的,术语“量(amount)”是指核酸酶变体、基因组编辑组合物或经基因组编辑的细胞的足以实现包含临床效果在内的有益或期望的预防或治疗结果的“有效量(amount effective)”或“有效量(effective amount)”。
“预防有效量”是指核酸酶变体、基因组编辑组合物或经基因组编辑的细胞的足以实现期望的预防结果的量。通常但不是必须地,因为在疾病之前或疾病的早期阶段在受试者中使用预防剂量,预防有效量小于治疗有效量。
核酸酶变体、基因组编辑组合物或经基因组编辑的细胞的“治疗有效量”可以根据如个体的疾病状态、年龄、性别和体重等因素以及在个体中引发期望应答的能力而变化。治疗有效量也是治疗有益结果超过任何毒性或有害作用的量。术语“治疗有效量”包含有效“治疗”受试者(例如,患者)的量。当指示治疗量时,待施用的具体实施例中设想的组合物的精确量可以由内科医生根据说明书并考虑年龄、体重、肿瘤大小、感染程度或转移程度以及患者(受试者)的病症的个体差异来确定。
C.核酸酶变体
本文特定实施例中所设想的核酸酶变体适用于基因组编辑TGFβR2基因中的靶位点并且包括一个或多个DNA结合结构域以及一个或多个DNA切割结构域(例如,一个或多个核酸内切酶和/或核酸外切酶结构域)以及任选地一个或多个本文所设想的连接子。术语“重编程的核酸酶”、“工程化的核酸酶”或“核酸酶变体”可互换使用,并且是指包括一个或多个DNA结合结构域以及一个或多个DNA切割结构域的核酸酶,其中所述核酸酶已经被从亲代或天然存在的核酸酶中设计和/或修饰,以结合并切割TGFβR2基因中的双链DNA靶序列。
在特定实施例中,核酸酶变体结合并切割TGFβR2基因的外显子6中的靶序列,优选地在TGFβR2基因的外显子6中的SEQ ID NO:11处,并且更优选地在TGFβR2基因的外显子6中的SEQ ID NO:11中的序列“ATCC”处。
可以从天然存在的核酸酶或先前的核酸酶变体中设计和/或修饰核酸酶变体。特定实施例中所设想的核酸酶变体可以进一步包括一个或多个另外的功能结构域,例如,展现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶的末端加工酶结构域。
结合并切割TGFβR2基因中的靶序列的核酸酶变体的说明性实例包含但不限于归巢核酸内切酶(大范围核酸酶)变体以及megaTAL。
1.归巢核酸内切酶(大范围内切酶)变体
在各个实施例中,归巢核酸内切酶或大范围核酸酶被重编程以在TGFβR2基因中的靶位点中引入双链断裂(DSB)。在特定实施例中,归巢核酸内切酶变体在TGFβR2基因的外显子6中引入双链断裂,优选地在TGFβR2基因的外显子6中的SEQ ID NO:11处,并且更优选地在TGFβR2基因的外显子6中的SEQ ID NO:11中的序列“ATCC”处。
“归巢核酸内切酶”和“大范围核酸酶”可互换使用,并且是指识别12-45个碱基对切割位点并且通常基于序列和结构基序分为五个家族的天然存在的归巢核酸内切酶:LAGLIDADG、GIY-YIG、HNH、His-Cys盒子以及PD-(D/E)XK。
“参考归巢核酸内切酶”或“参考大范围核酸酶”是指在自然界中发现的野生型归巢核酸内切酶或归巢核酸内切酶。在一个实施例中,“参考归巢核酸内切酶”是指经过修饰以增加基础活性的野生型归巢核酸内切酶。
“工程化的归巢核酸内切酶”、“重编程的归巢核酸内切酶”、“归巢核酸内切酶变体”、“工程化的大范围核酸酶”、“重编程的大范围核酸酶”或“大范围核酸酶变体”是指包括一个或多个DNA结合结构域以及一个或多个DNA切割结构域的归巢核酸内切酶,其中所述归巢核酸内切酶已经被从亲代或天然存在的归巢核酸内切酶中设计和/或修饰以结合并切割TGFβR2基因中的DNA靶序列。可以从天然存在的归巢核酸内切酶或另一种归巢核酸内切酶变体中设计和/或修饰归巢核酸内切酶变体。特定实施例中所设想的归巢核酸内切酶变体可能进一步包括一个或多个另外的功能结构域,例如,展现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶的末端加工酶结构域。
归巢核酸内切酶(HE)变体在自然界中不存在,并且可以通过重组DNA技术或通过随机诱变获得。HE变体可以通过在天然存在的HE或HE变体中进行一个或多个氨基酸改变例如突变、替代、添加或缺失一个或多个氨基酸来获得。在特定实施例中,HE变体包括DNA识别界面的一个或多个氨基酸改变。
特定实施例中所设想的HE变体可能进一步包括一个或多个连接子和/或另外的功能结构域,例如,展现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶的末端加工酶结构域。在特定实施例中,使用展现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶将HE变体引入到T细胞中。HE变体和3'加工酶可以单独地引入例如在不同的载体或单独的mRNA中或一起引入例如作为融合蛋白或引入在由病毒自切割肽或IRES元件分离的多顺反子构建体中。
“DNA识别界面”是指与核酸靶碱基相互作用的HE氨基酸残基以及相邻的那些残基。对于每个HE,DNA识别界面包括侧链到侧链和侧链到DNA接触的广泛网络,所述接触中的大多数必定对识别特定核酸靶序列来说是唯一的。因此,DNA识别界面的对应于特定核酸序列的氨基酸序列显著变化,并且是任何天然的或HE变体的特征。通过非限制性实例,可以通过构建HE变体文库来导出特定实施例中所设想的HE变体,在所述文库中,定位在天然HE(或先前产生的HE变体)的DNA识别界面中一个或多个氨基酸残基是变化的。可以使用切割分析法从所述文库中筛选针对每个预测的TGFβR2靶位点的靶切割活性(参见例如Jarjour等人,2009,《核酸研究(Nuc.Acids Res.)》,37(20):6871-6880)。
LAGLIDADG归巢核酸内切酶(LHE)是最充分研究的归巢核酸内切酶家族,其主要编码于古细菌以及绿藻和真菌中的细胞器DNA中并显示出最高的整体DNA识别特异性。LHE包括每个蛋白质链一个或两个LAGLIDADG催化基序,并分别起同源二聚体或单链单体的作用。对LAGLIDADG蛋白的结构研究识别了高度保守的核心结构(Stoddard 2005),其特征在于αββαββα折叠,其中LAGLIDADG基序属于此折叠的第一个螺旋。LHE的高效和特异性切割表示用于衍生新颖的高度特异性的核酸内切酶的蛋白质支架。然而,将LHE工程化为结合并切割非天然或非规范靶位点需要选择适当的LHE支架、检查靶基因座、选择推定靶位点以及广泛改变LHE以改变其DNA接触点和靶向位点中多达三分之二的碱基对位置处的切割特异性。
在一个实施例中,可以由其设计出重编程的LHE或LHE变体的LHE包含但不限于I-CreI和I-SceI。
可以由其设计出重编程的LHE或LHE变体的LHE的说明性实例包含但不限于I-AabMI、I-AaeMI、I-AniI、I-ApaMI、I-CapIII、I-CapIV、I-CkaMI、I-CpaMI、I-CpaMII、I-CpaMIII、I-CpaMIV、I-CpaMV、I-CpaV、I-CraMI、I-EjeMI、I-GpeMI、I-GpiI、I-GzeMI、I-GzeMII、I-GzeMIII、I-HjeMI、I-LtrII、I-LtrI、I-LtrWI、I-MpeMI、I-MveMI、I-NcrII、I-Ncrl、I-NcrMI、I-OheMI、I-OnuI、I-OsoMI、I-OsoMII、I-OsoMIII、I-OsoMIV、I-PanMI、I-PanMII、I-PanMIII、I-PnoMI、I-ScuMI、I-SmaMI、I-SscMI以及I-Vdi141I。
在一个实施例中,重编程的LHE或LHE变体选自由以下组成的组:I-CpaMI变体、I-HjeMI变体、I-OnuI变体、I-PanMI变体以及I-SmaMI变体。
在一个实施例中,重编程的LHE或LHE变体是I-OnuI变体。参见例如SEQ ID NO:6-7。
在一个实施例中,靶向TGFβR2基因的重编程的I-OnuI LHE或I-OnuI变体由天然的I-OnuI或其生物活性片段产生(SEQ ID NO:1-5)。在优选的实施例中,从现有的I-OnuI变体中产生靶向人TGFβR2基因的重编程的I-OnuI LHE或I-OnuI变体。在一个实施例中,针对SEQID NO:11中所示的人TGFβR2基因靶位点产生重编程的I-OnuI LHE。
在特定实施例中,结合并切割人TGFβR2基因的重编程的I-OnuI LHE或I-OnuI变体包括DNA识别界面中的一个或多个氨基酸取代。在特定实施例中,结合并切割人TGFβR2基因的I-OnuI LHE包括与I-OnuI(Taekuchi等人,2011,《美国国家科学院院刊(Proc Natl AcadSci U.S.A)》,2011年8月9日;108(32):13077-13082)或与如SEQ ID NO:6-7中的任一个中阐述的I-OnuI LHE变体、其生物活性片段和/或其另外的变体的DNA识别界面的DNA识别界面至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列一致性。
在一个实施例中,结合并切割人TGFβR2基因的I-OnuI LHE包括与I-OnuI(Taekuchi等人,2011,《美国国家科学院院刊》,2011年8月9日;108(32):13077-13082)或与如SEQ ID NO:6-7中的任一个中阐述的I-OnuI LHE变体、其生物活性片段和/或其另外的变体的DNA识别界面的至少70%、更优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少95%、更优选地至少97%、更优选地至少99%的序列一致性。
在特定实施例中,结合并切割人TGFβR2基因的I-OnuI LHE变体包括如SEQ ID NO:1-7中任一个中阐述的I-OnuI的DNA识别界面中的一个或多个氨基酸取代或修饰、其生物活性片段和/或其另外的变体。
在特定实施例中,结合并切割人TGFβR2基因的I-OnuI LHE变体包括DNA识别界面中的一个或多个氨基酸取代或修饰,特别是在位于I-OnuI(SEQ ID NO:1-5)或如SEQ IDNO:6-7中任一个所示的I-OnuI变体、其生物活性片段和/或其另外的变体的位置24到50、68到82、180到203以及223到240中的子结构域中。
在特定实施例中,结合并切割人TGFβR2基因的I-OnuI LHE包括DNA识别界面中在选自由以下组成的组的氨基酸位置处的一个或多个氨基酸取代或修饰:I-OnuI(SEQ IDNO:1-5)或如SEQ ID NO:6-7中任一个所示的I-OnuI变体、其生物活性片段和/或其另外的变体的19、24、26、28、30、32、34、35、36、37、38、40、42、44、46、48、68、70、72、75、76、77、78、80、82、168、180、182、184、186、188、189、190、191、192、193、195、197、199、201、203、223、225、227、229、231、232、234、236、238和240。
在特定实施例中,结合并切割人TGFβR2基因的I-OnuI LHE变体包括DNA识别界面中的5个、10个、15个、20个、25个、30个、35个、或40个或更多个氨基酸取代或修饰,特别是在位于I-OnuI(SEQ ID NO:1-5)或如SEQ ID NO:6-7中任一个所示的I-OnuI变体、其生物活性片段和/或其另外的变体的位置24到50、68到82、180到203以及223-240中的子结构域中。
在特定实施例中,结合并切割人TGFβR2基因的I-OnuI LHE变体包括在选自由以下组成的组的氨基酸位置处的DNA识别界面中的5个、10个、15个、20个、25个、30个、35个、或40个或更多个氨基酸取代或修饰:I-OnuI(SEQ ID NO:1-5)或如SEQ ID NO:6-7中任一个所示的I-OnuI变体、其生物活性片段和/或其另外的变体的19、24、26、28、30、32、34、35、36、37、38、40、42、44、46、48、59、68、70、72、75、76、77、78、80、82、168、180、182、184、186、188、189、190、191、192、193、195、197、199、201、203、223、225、227、229、231、232、234、236、238和240。
在一个实施例中,结合并切割人TGFβR2基因的I-OnuI LHE变体包括在位于整个I-OnuI序列内任何位置的额外位置处的一个或多个氨基酸取代或修饰。可以被取代和/或修饰的残基包含但不限于与核酸靶接触或直接地或通过水分子与核酸骨架或与核苷酸碱基相互作用的氨基酸。在一个非限制性实例中,本文所设想的结合并切割人TGFβR2基因的I-OnuI LHE变体包括在选自由以下位置组成的位置组的至少一个位置中的一个或多个取代和/或修饰,优选地至少5个、优选地至少10个、优选地至少15个、优选地至少20个、更优选地至少25个、更优选地至少30个、甚至更优选地至少35个、或甚至更优选地至少40个或更多个氨基酸取代:I-OnuI(SEQ ID NO:1-5)或如SEQ ID NO:6-7中任一个所示的I-OnuI变体、其生物活性片段和/或其另外的变体的26、32、34、35、36、37、38、40、42、44、46、48、68、70、75、76、78、80、116、138、143、159、168、178、180、182、184、188、190、192、193、195、197、199、203、207、223、225、227、232、240和264。
在某些实施例中,HE变体切割TGFβR2外显子6靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个、或甚至更优选地至少40个或更多个:I-OnuI(SEQ ID NO:1-5)或如SEQ ID NO:6-7中任一个所示的I-OnuI变体、其生物活性片段和/或其另外的变体的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R或S190G、L192R、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223R、Y223H、K225Y、K227R、F232N、T240R和E264K。
在一些实施例中,HE变体切割TGFβR2靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个:I-OnuI(SEQ ID NO:1-5)或如SEQ ID NO:6-7中任一个所示的I-OnuI变体、其生物活性片段和/或其另外的变体的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R、L192T、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223R、K225Y、K227R、F232N和T240R。
在特定实施例中,HE变体切割TGFβR2靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个:I-OnuI(SEQ ID NO:1-5)或如SEQ ID NO:6-7中任一个所示的I-OnuI变体、其生物活性片段和/或其另外的变体的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R、L192T、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223H、K225Y、K227R、F232N、T240R和E264K。
在特定实施例中,结合并切割人TGFβR2基因的I-OnuI LHE变体包括与SEQ ID NO:6-7中任一个所示的氨基酸序列至少80%、优选地至少85%、更优选地至少90%、或甚至更优选地至少95%相同的氨基酸序列,或其生物活性片段。
在特定实施例中,I-OnuI LHE变体包括SEQ ID NO:6-7中任一个所示的氨基酸序列或其生物活性片段。
在特定实施例中,I-OnuI LHE变体包括SEQ ID NO:6中所示的氨基酸序列或其生物活性片段。
在特定实施例中,I-OnuI LHE变体包括SEQ ID NO:7中所示的氨基酸序列或其生物活性片段。
2.MegaTAL
在各个实施例中,包括归巢核酸内切酶变体的megaTAL被重编程以在TGFβR2基因的靶位点中引入双链断裂(DSB)。在特定实施例中,megaTAL在TGFβR2基因的外显子6中引入DSB,优选地在TGFβR2基因的外显子6中的SEQ ID NO:11处,并且更优选地在TGFβR2基因的外显子6中的SEQ ID NO:11中的序列“ATCC”处。
“megaTAL”是指包括TALE DNA结合结构域和结合并切割TGFβR2基因中的DNA靶序列的归巢核酸内切酶变体的多肽,并且任选地包括一个或多个连接子和/或另外的功能结构域,例如展现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶或模板非依赖性DNA聚合酶活性的末端加工酶的末端加工酶结构域。
在特定实施例中,可以将megaTAL连同展现出5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶(例如,Trex2)、5'瓣状核酸内切酶、解旋酶、模板依赖性DNA聚合酶或模板非依赖性DNA聚合酶活性的末端加工酶一起引入到细胞中。megaTAL和3'加工酶可以单独地引入例如在不同的载体或单独的mRNA中或一起引入例如作为融合蛋白或引入在由病毒自切割肽或IRES元件分离的多顺反子构建体中。
“TALE DNA结合结构域”是转录激活子样效应子(TALE或TAL效应子)的DNA结合部分,其模拟植物转录激活子以操纵植物转录组(参见例如Kay等人,2007,《科学(Science)》318:648-651)。特定实施例中所设想的TALE DNA结合结构域是重新工程化的或来自于天然存在的TALE,例如来自野油菜黄单胞菌叶斑病致病变种(Xanthomonas campestrispv.vesicatoria)、加德纳黄单胞菌(Xanthomonas gardneri)、雀麦褐条病菌(Xanthomonastranslucens),、地毯草黄单胞菌(Xanthomonas axonopodis)、番茄黄单胞菌(Xanthomonasperforans)、苜蓿黄单胞杆菌(Xanthomonas alfalfa)、柑桔溃疡病菌(Xanthomonascitri)、番茄细菌性斑点致病黄单胞菌(Xanthomonas euvesicatoria)和白叶枯病菌(Xanthomonas oryzae)的AvrBs3以及来自青枯雷尔氏菌(Rantstonia solanacearum)的brg11和hpx17。在美国专利号9,017,967和其中引用的参考文献中公开了用于衍生和设计DNA结合结构域的TALE蛋白的说明性实例,所有这些文献都通过引用整体并入本文。
在特定实施例中,megaTAL包括TALE DNA结合结构域,所述结合结构域包括参与TALE DNA结合结构域与其对应的靶DNA序列结合的一个或多个重复单元。单个“重复单元”(也称为“重复”)的长度通常为33个到35个氨基酸。每个TALE DNA结合结构域重复单元包含构成重复可变二残基(RVD)的1个或2个DNA结合残基,通常在重复的位置12和/或位置13处。已经确定了用于DNA识别这些TALE DNA结合结构域的天然(规范)代码,使得位置12和位置13处的HD序列导致与胞嘧啶(C)结合、NG与T结合、NI与A结合、NN与G或A结合并且NG与T结合。在某些实施例中,设想了非规范(非典型)RVD。
适用于特定实施例中所设想的特定megaTAL的非规范RVD的说明性实例包含但不限于:用于识别鸟嘌呤(G)的HH、KH、NH、NK、NQ、RH、RN、SS、NN、SN、KN;用于识别腺嘌呤(A)的NI、KI、RI、HI、SI;用于识别胸腺嘧啶(T)的NG、HG、KG、RG;用于识别胞嘧啶(C)的RD、SD、HD、ND、KD、YG;用于识别A或G的NV、HN;以及用于识别A或T或G或C的H*、HA、KA、N*、NA、NC、NS、RA、S*,其中(*)意指在位置13处的氨基酸不存在。适用于特定实施例中所设想的特定megaTAL的RVD的另外的说明性实例进一步包含美国专利号8,614,092中公开的那些内容,所述美国专利通过引用整体并入本文。
在特定实施例中,本文所设想的megaTAL包括TALE DNA结合结构域,其包括3个到30个重复单元。在某些实施例中,megaTAL包括3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或者30个TALE DNA结合结构域重复单元。在优选的实施例中,本文所设想的megaTAL包括TALE DNA结合结构域,其包括5个到15个重复单元、更优选地7个到15个重复单元、更优选地9个到15个重复单元、并且更优选地9个、10个、11个、12个、13个、14或15个重复单元。
在特定实施例中,本文所设想的megaTAL包括TALE DNA结合结构域,其包括3个到30个重复单元和另外的单个截短的TALE重复单元,所述单个截短的TALE重复单元包括位于一组TALE重复单元的C末端处的20个氨基酸,即另外的C末端半TALE DNA结合结构域重复单元(本文下文其它地方公开的C-帽的氨基酸-20到氨基酸-1)。因此,在特定实施例中,本文所设想的megaTAL包括TALE DNA结合结构域,其包括3.5个到30.5个重复单元。在某些实施例中,megaTAL包括3.5个、4.5个、5.5个、6.5个、7.5个、8.5个、9.5个、10.5个、11.5个、12.5个、13.5个、14.5个、15.5个、16.5个、17.5个、18.5个、19.5个、20.5个、21.5个、22.5个、23.5个、24.5个、25.5个、26.5个、27.5个、28.5个、29.5个或30.5个TALE DNA结合结构域重复单元。在优选的实施例中,本文所设想的megaTAL包括TALE DNA结合结构域,其包括5.5个到15.5个重复单元、更优选地7.5个到15.5个重复单元、更优选地9.5个到15.5个重复单元、并且更优选地9.5个、10.5个、11.5个、12.5个、13.5个、14.5或15.5个重复单元。
在特定实施例中,megaTAL包括TAL效应子架构,其包括“N末端结构域(NTD)”多肽、一个或多个TALE重复结构域/单元、“C末端结构域(CTD)”多肽以及归巢核酸内切酶变体。在一些实施例中,NTD、TALE重复和/或CTD结构域来自相同物种。在其它实施例中,NTD、TALE重复和/或CTD结构域中的一个或多个来自不同物种。
如本文所使用的,术语“N末端结构域(NTD)”多肽是指天然存在的TALE DNA结合结构域的N末端部分或片段两侧的序列。NTD序列(如果存在的话)可以具有任何长度,只要TALE DNA结合结构域重复单元保留结合DNA的能力即可。在特定实施例中,NTD多肽在TALEDNA结合结构域的N末端处包括至少120个到至少140个或更多个氨基酸(0是最N末端重复单元的氨基酸1)。在特定实施例中,NTD多肽在TALE DNA结合结构域的N末端处包括至少约120个、121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个、137个、138个、139个或至少140个氨基酸。在一个实施例中,本文所设想的megaTAL包括黄单胞菌属TALE蛋白的至少约氨基酸+1到氨基酸+122到至少约氨基酸+1到氨基酸+137的NTD多肽(0是最N末端重复单元的氨基酸1)。在特定实施例中,NTD多肽在黄单胞菌属TALE蛋白的TALE DNA结合结构域的N末端处包括至少约122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个或137个氨基酸。在一个实施例中,本文所设想的megaTAL包括雷氏菌属TALE蛋白的至少氨基酸+1到氨基酸+121的NTD多肽(0是最N末端重复单元的氨基酸1)。在特定实施例中,NTD多肽在雷氏菌属TALE蛋白的TALE DNA结合结构域的N末端处包括至少约121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个或137个氨基酸。
如本文所使用的,术语“C末端结构域(CTD)”多肽是指天然存在的TALE DNA结合结构域的C末端部分或片段两侧的序列。CTD序列(如果存在的话)可以具有任何长度,只要TALE DNA结合结构域重复单元保留结合DNA的能力即可。在特定实施例中,CTD多肽在TALEDNA结合结构域的最后一个完整重复的C末端处包括至少20个到至少85个或更多个氨基酸(前20个氨基酸是最后一个C末端完整重复单元的C末端处的半重复单元)。在特定实施例中,CTD多肽在TALE DNA结合结构域的最后一个完整重复的C末端处包括至少约20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、443个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个或至少85个氨基酸。在一个实施例中,本文所设想的megaTAL包括黄单胞菌属TALE蛋白的至少约氨基酸-20到氨基酸-1的CTD多肽(-20是最后一个C末端完整重复单元C末端处的半重复单元的氨基酸1)。在特定实施例中,CTD多肽在黄单胞菌属TALE蛋白的TALEDNA结合结构域的最后一个完整重复的C末端处包括至少约20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸。在一个实施例中,本文设想的megaTAL包括雷氏菌属TALE蛋白的至少约氨基酸-20到氨基酸-1的CTD多肽(-20是最后一个C末端完整重复单元C末端处的半重复单元的氨基酸1)。在特定实施例中,CTD多肽在雷氏菌属TALE蛋白的TALE DNA结合结构域的最后一个完整重复的C末端处包括至少约20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸。
在特定实施例中,本文所设想的megaTAL包括融合多肽,其包括被工程化成结合靶序列的TALE DNA结合结构域、被重编程成结合并切割靶序列的归巢核酸内切酶以及任选地NTD和/或CTD多肽,其任选地通过本文其它地方设想的一个或多个连接子多肽彼此连接。不希望受任何特定理论的束缚,设想了包括TALE DNA结合结构域以及任选的NTD和/或CTD多肽的megaTAL与连接子多肽融合,所述连接子多肽进一步与归巢核酸内切酶变体融合。因此,TALE DNA结合结构域结合DNA靶序列,所述DNA靶序列位于距离与归巢核酸内切酶变体的DNA结合结构域结合的靶序列约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个核苷酸内。以这种方式,本文所设想的megaTAL增加了基因组编辑的特异性和效率。
在一个实施例中,megaTAL包括归巢核酸内切酶变体以及TALE DNA结合结构域,所述TALE DNA结合结构域结合在重编程的归巢核酸内切酶的结合位点上游约4个、5个或6个核苷酸、优选地5个或6个核苷酸内的核苷酸序列。
在一个实施例中,megaTAL包括归巢核酸内切酶变体以及结合SEQ ID NO:12所示的核苷酸序列的TALE DNA结合结构域,所述核苷酸序列位于由归巢核酸内切酶变体(SEQID NO:11)结合并切割的核苷酸序列的上游6个核苷酸处(例如,TALE结合位点与HE结合位点之间存在5个核苷酸)。在优选的实施例中,megaTAL靶序列是SEQ ID NO:13。
在特定实施例中,本文所设想的megaTAL包括一个或多个TALE DNA结合重复单元以及由选自由以下组成的组的LHE设计或重编程的LHE变体:I-AabMI、I-AaeMI、I-AniI、I-ApaMI、I-CapIII、I-CapIV、I-CkaMI、I-CpaMI、I-CpaMII、I-CpaMIII、I-CpaMIV、I-CpaMV、I-CpaV、I-CraMI、I-EjeMI、I-GpeMI、I-GpiI、I-GzeMI、I-GzeMII、I-GzeMIII、I-HjeMI、I-LtrII、I-LtrI、I-LtrWI、I-MpeMI、I-MveMI、I-NcrII、I-Ncrl、I-NcrMI、I-OheMI、I-OnuI、I-OsoMI、I-OsoMII、I-OsoMIII、I-OsoMIV、I-PanMI、I-PanMII、I-PanMIII、I-PnoMI、I-ScuMI、I-SmaMI、I-SscMI、I-Vdi141I及其变体、或优选地I-CpaMI、I-HjeMI、I-OnuI、I-PanMI、SmaMI及其变体、或更优选地I-OnuI及其变体。
在特定实施例中,本文所设想的megaTAL包括NTD、一个或多个TALE DNA结合重复单元、CTD以及选自由以下组成的组的LHE变体:I-AabMI、I-AaeMI、I-AniI、I-ApaMI、I-CapIII、I-CapIV、I-CkaMI、I-CpaMI、I-CpaMII、I-CpaMIII、I-CpaMIV、I-CpaMV、I-CpaV、I-CraMI、I-EjeMI、I-GpeMI、I-GpiI、I-GzeMI、I-GzeMII、I-GzeMIII、I-HjeMI、I-LtrII、I-LtrI、I-LtrWI、I-MpeMI、I-MveMI、I-NcrII、I-Ncrl、I-NcrMI、I-OheMI、I-OnuI、I-OsoMI、I-OsoMII、I-OsoMIII、I-OsoMIV、I-PanMI、I-PanMII、I-PanMIII、I-PnoMI、I-ScuMI、I-SmaMI、I-SscMI、I-Vdi141I及其变体、或优选地I-CpaMI、I-HjeMI、I-OnuI、I-PanMI、SmaMI及其变体、或更优选地I-OnuI及其变体。
在特定实施例中,本文所设想的megaTAL包括NTD、约9.5个到约15.5个TALE DNA结合重复单元以及选自由以下组成的组的LHE变体:I-AabMI、I-AaeMI、I-AniI、I-ApaMI、I-CapIII、I-CapIV、I-CkaMI、I-CpaMI、I-CpaMII、I-CpaMIII、I-CpaMIV、I-CpaMV、I-CpaV、I-CraMI、I-EjeMI、I-GpeMI、I-GpiI、I-GzeMI、I-GzeMII、I-GzeMIII、I-HjeMI、I-LtrII、I-LtrI、I-LtrWI、I-MpeMI、I-MveMI、I-NcrII、I-Ncrl、I-NcrMI、I-OheMI、I-OnuI、I-OsoMI、I-OsoMII、I-OsoMIII、I-OsoMIV、I-PanMI、I-PanMII、I-PanMIII、I-PnoMI、I-ScuMI、I-SmaMI、I-SscMI、I-Vdi141I及其变体、或优选地I-CpaMI、I-HjeMI、I-OnuI、I-PanMI、SmaMI及其变体、或更优选地I-OnuI及其变体。
在特定实施例中,本文所设想的megaTAL包括:约122个氨基酸到137个氨基酸的NTD;约9.5个、约10.5个、约11.5个、约12.5个、约13.5个、约14.5个或约15.5个结合重复单元;约20个氨基酸到约85个氨基酸的CTD;以及I-OnuI LHE变体。在特定实施例中,NTD、DNA结合结构域和CTD中的任何一个、任何两个或全部可以由相同的物种或不同的物种以任何合适的组合设计而成。
在特定实施例中,本文所设想的megaTAL包括SEQ ID NO:8-9中任一个所示的氨基酸序列。
在特定实施例中,本文所设想的megaTAL-Trex2融合蛋白包括SEQ ID NO:10中所示的氨基酸序列。
在某些实施例中,megaTAL包括结合并切割SEQ ID NO:13中所示的核苷酸序列的TALE DNA结合结构域和I-OnuI LHE变体。
3.末端加工酶
在特定实施例中所设想的基因组编辑组合物和方法包括使用核酸酶变体以及末端加工酶的一个或多个拷贝编辑细胞基因组。在特定实施例中,单个多核苷酸对归巢核酸内切酶变体和由连接子、自切割肽序列例如2A序列或由IRES序列分开的末端加工酶进行编码。在特定实施例中,基因组编辑组合物包括编码核酸酶变体的多核苷酸和编码末端加工酶的单独的多核苷酸。在特定实施例中,基因组编辑组合物包括编码除了由自切割肽分开的末端加工酶的串联拷贝之外的归巢核酸内切酶变体末端加工酶单个多肽融合体的多核苷酸。
术语“末端加工酶”是指修饰多核苷酸链的暴露末端的酶。多核苷酸可以是双链DNA(dsDNA)、单链DNA(ssDNA)、RNA、DNA和RNA的双链混杂体、以及合成DNA(例如,含有除A、C、G和T以外的碱基)。末端加工酶可以通过添加一个或多个核苷酸、移除一个或多个核苷酸、移除或修饰磷酸基和/或移除或修饰羟基来修饰暴露的多核苷酸链末端。末端加工酶可以修饰核酸内切酶切割位点处或通过其它化学或机械手段产生的末端处的末端,如剪切(例如通过穿过细针、加热、声波处理、迷你珠子翻滚和雾化)、电离辐射、紫外线辐射、氧自由基、化学水解和化学治疗剂。
在特定实施例中,特定实施例中所设想的基因组编辑组合物和方法包括使用归巢核酸内切酶变体或megaTAL以及DNA末端加工酶编辑细胞基因组。
术语“DNA末端加工酶”是指修饰DNA暴露末端的酶。DNA末端加工酶可以修饰平末端或交错末端(具有5'突出端或3'突出端的末端)。DNA末端加工酶可以修饰单链DNA或双链DNA。DNA末端加工酶可以修饰核酸内切酶切割位点处或通过其它化学或机械手段产生的末端处的末端,如剪切(例如通过穿过细针、加热、声波处理、迷你珠子翻滚和雾化)、电离辐射、紫外线辐射、氧自由基、化学水解和化学治疗剂。DNA末端加工酶可以通过添加一个或多个核苷酸、移除一个或多个核苷酸、移除或修饰磷酸基和/或移除或修饰羟基来修饰暴露的DNA末端。
适用于本文所设想的特定实施例的DNA末端加工酶的说明性实例包含但不限于:5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶、5'瓣状核酸内切酶、解旋酶、磷酸酶、水解酶和模板非依赖性DNA聚合酶。
适用于本文所设想的特定实施例的DNA末端加工酶的另外的说明性实例包含但不限于:Trex2、Trex1、不含跨膜结构域的Trex1、Apollo、Artemis、DNA2、Exo1、ExoT、ExoIII、Fen1、Fan1、MreII、Rad2、Rad9、TdT(末端脱氧核苷酸转移酶)、PNKP、RecE、RecJ、RecQ、λ核酸外切酶、Sox、牛痘DNA聚合酶、核酸外切酶I、核酸外切酶III、核酸外切酶VII、NDK1、NDK5、NDK7、NDK8、WRN、T7-核酸外切酶基因6、禽类成髓细胞瘤病毒整合蛋白(IN)、Bloom、热敏磷酸酶(Antartic Phophatase)、碱性磷酸酶(Alkaline Phosphatase)、多核苷酸激酶(PNK)、ApeI、绿豆核酸酶(Mung Bean nuclease)、Hex1、TTRAP(TDP2)、Sgs1、Sae2、CUP、Pol mu、Polλ、MUS81、EME1、EME2、SLX1、SLX4以及UL-12。
在特定实施例中,用于编辑本文所设想的细胞基因组的基因组编辑组合物和方法包括多肽,其包括归巢核酸内切酶变体或megaTAL以及核酸外切酶。术语“核酸外切酶”是指通过在3'末端或5'末端处破坏磷酸二酯键的水解反应在多核苷酸链末端切割磷酸二酯键的酶。
适用于本文所设想的特定实施例的核酸外切酶的说明性实例包含但不限于:hExoI、酵母ExoI、大肠杆菌ExoI、hTREX2、小鼠TREX2、大鼠TREX2、hTREX1、小鼠TREX1、大鼠TREX1和大鼠TREX1。
在特定实施例中,DNA末端加工酶是3'到5'核酸外切酶,优选地Trex 1或Trex2、更优选地Trex2、并且甚至更优选地人或小鼠Trex2。
D.靶位点
与天然存在的核酸酶相比,特定实施例中所设想的核酸酶变体可以被设计成与任何合适的靶序列结合并且可以具有新颖的结合特异性。在特定实施例中,靶位点是基因的调控区,所述调控区包含但不限于启动子、增强子、阻遏子元件等等。在特定实施例中,靶位点是基因或剪接位点的编码区。在某些实施例中,核酸酶变体被设计成下调或降低基因的表达。在特定实施例中,核酸酶变体和供体修复模板可以被设计成修复或缺失所期望的靶序列。
在各个实施例中,核酸酶变体结合并切割转化生长因子β受体2(TGFβ2)基因中的靶序列。TGFβ2也称为TGF-β受体IIB型、TGF-βII型受体、TGFβ-RII、TGFR-2、TGFR2、转化生长因子β受体II、转化生长因子、β受体II(70/80kDa)、AAT3、FAA3、HNPCC6、MFS2、RIIC以及TAAD2。TGFβ结合到TGFβR1和TGFβR2丝氨酸/苏氨酸激酶受体复合物,从而导致下游转录因子Smad2和Smad3的受体介导磷酸化。TGFβR2信号传导通过抑制体外T细胞的效应子和细胞溶解活性中所涉及的关键分子(包含IFNγ和其它细胞溶解分子的分泌减少)产生TGFβ的细胞抑制和抗增殖效应。
在特定实施例中,归巢核酸内切酶变体或megaTAL在TGFβR2基因的靶位点中引入双链断裂(DSB)。在特定实施例中,归巢核酸内切酶变体或megaTAL在TGFβR2基因的外显子6中引入DSB,优选地在TGFβR2基因的外显子6中的SEQ ID NO:11处,并且更优选地在TGFβR2基因的外显子6中的SEQ ID NO:11中的序列“ATCC”处。
在优选的实施例中,归巢核酸内切酶变体或megaTAL切割双链DNA并将DSB引入到SEQ ID NO:11或13中所示的多核苷酸序列中。
在优选的实施例中,TGFβR2基因是人TGFβR2基因。
E.供体修复模板
核酸酶变体可以用于在靶序列中引入DSB;可以在存在一个或多个供体修复模板的情况下通过同源定向修复(HDR)机制修复DSB。
在各个实施例中,供体修复模板包括编码免疫增强子、免疫抑制信号阻尼子或工程化抗原受体的一个或多个多核苷酸。
在各个实施例中,设想在存在多个供体修复模板的情况下向细胞提供工程化核酸酶,所述供体修复模板独立地编码靶向不同免疫抑制途径的免疫效力增强子和/或免疫抑制信号阻尼子,从而产生具有增加的治疗功效和持久性的经基因组编辑的T细胞。例如,在特定实施例中,靶向PD-1、LAG-3、CTLA-4、TIM3、IL-10R、TIGIT和TGFβR2途径的组合的免疫效力增强子或免疫抑制信号可能是优选的。
在特定实施例中,供体修复模板用于将序列插入到基因组中。在特定优选的实施例中,供体修复模板用于修复或修饰基因组中的序列。
在各个实施例中,通过用腺相关病毒(AAV)、逆转录病毒例如慢病毒、IDLV等、单纯疱疹病毒、腺病毒、或包括供体修复模板的痘苗病毒载体转导细胞来将供体修复模板引入到造血细胞例如T细胞中。
在特定实施例中,供体修复模板包括位于DSB位点侧翼的一个或多个同源臂。
如本文所使用的,术语“同源臂”是指供体修复模板中与通过核酸酶在靶位点处引入的DNA断裂侧翼的DNA序列完全相同或几乎完全相同的核酸序列。在一个实施例中,供体修复模板包括5'同源臂,其包括与DNA断裂位点的DNA序列5'完全相同或几乎完全相同的核酸序列。在一个实施例中,供体修复模板包括3'同源臂,其包括与DNA断裂位点的DNA序列3'完全相同或几乎完全相同的核酸序列。在优选的实施例中,供体修复模板包括5'同源臂和3'同源臂。供体修复模板可以包括与DSB位点紧邻的基因组序列的同源性或与来自DSB位点的任何数目的碱基对内的基因组序列的同源性。在一个实施例中,供体修复模板包括与基因组序列同源约5bp、约10bp、约25bp、约50bp、约100bp、约250bp、约500bp、约1000bp、约2500bp、约5000bp、约10000bp或更多的核酸序列,包含任何中间长度的同源序列。
特定实施例中所设想的同源臂的合适长度的说明性实例可以被独立地选择并且包含但不限于:约100bp、约200bp、约300bp、约400bp、约500bp、约600bp、约700bp、约800bp、约900bp、约1000bp、约1100bp、约1200bp、约1300bp、约1400bp、约1500bp、约1600bp、约1700bp、约1800bp、约1900bp、约2000bp、约2100bp、约2200bp、约2300bp、约2400bp、约2500bp、约2600bp、约2700bp、约2800bp、约2900bp、或约3000bp、或更长的同源臂,包含所有中间长度的同源臂。
合适的同源臂长度的另外的说明性实例包含但不限于:约100bp到约3000bp、约200bp到约3000bp、约300bp到约3000bp、约400bp到约3000bp、约500bp到约3000bp、约500bp到约2500bp,约500bp到约2000bp、约750bp到约2000bp、约750bp到约1500bp、或约1000bp到约1500bp,包含所有中间长度的同源臂。
在特定具体实施例中,5'同源臂和3'同源臂的长度独立地选自约500bp到约1500bp。在一个实施例中,5'同源臂长度为约1500bp,并且3'同源臂长度为约1000bp。在一个实施例中,5'同源臂在约200bp到约600bp之间,并且3'同源臂在约200bp到约600bp之间。在一个实施例中,5'同源臂长度为约200bp,并且3'同源臂长度为约200bp。在一个实施例中,5'同源臂长度为约300bp,并且3'同源臂长度为约300bp。在一个实施例中,5'同源臂长度为约400bp,并且3'同源臂长度为约400bp。在一个实施例中,5'同源臂长度为约500bp,并且3'同源臂长度为约500bp。在一个实施例中,5'同源臂长度为约600bp,并且3'同源臂长度为约600bp。
供体修复模板可以进一步包括一个或多个多核苷酸,如启动子和/或增强子、非转移区(UTR)、Kozak序列、多腺苷酸化信号、另外的限制酶位点、多克隆位点、内部核糖体进入位点(IRES)、重组酶识别位点(例如,LoxP、FRT和Att位点)、终止密码子、转录终止信号以及本文中其它地方设想的编码自切割多肽和表位标记的多核苷酸。
在一个实施例中,供体修复模板包括包含TGFβR2基因或其部分的多核苷酸,并且被设计成在基因组TGFβR2序列中引入一个或多个突变,使得突变体TGFβR2基因产物被表达。在一个实施例中,突变体TGFβR2具有降低的配体结合和/或细胞内信号传导的减少。
在各个实施例中,供体修复模板包括5'同源臂、RNA聚合酶II启动子、编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体的一个或多个多核苷酸以及3'同源臂。
在各个实施例中,用供体修复模板修饰靶位点,所述供体修复模板包括5'同源臂、编码自切割病毒肽例如T2A、免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体、任选地poly(A)信号或自切割肽的一个或多个多核苷酸以及3'同源臂,其中一个或多个多核苷酸的表达受内源TGFβR2启动子控制。
1.免疫效力增强子
在特定实施例中,通过在存在编码免疫效力增强子的供体修复模板的情况下在TGFβR2基因中引入DSB,使本文所设想的经基因组编辑的免疫效应子细胞对免疫抑制因子更有效和/或更具抗性。如本文所使用的,术语“免疫效力增强子”是指刺激和/或增强T细胞活化和/或功能的非天然存在的分子、免疫增强因子、以及将来自肿瘤微环境的免疫抑制信号转化为T细胞或其它免疫细胞中的免疫刺激信号的非天然存在的多肽。
在特定实施例中,免疫效力增强子选自由以下组成的组:双特异性T细胞衔接子(BiTE)分子;免疫增强因子,包含但不限于细胞因子、趋化因子、细胞毒素和/或细胞因子受体;以及翻转受体。
在一些实施例中,免疫效力增强子、免疫增强因子或翻转受体是包括蛋白质去稳定结构域的融合多肽。
a.双特异性T细胞衔接子(BiTE)分子
在特定实施例中,通过在存在编码双特异性T细胞衔接子(BiTE)分子的供体修复模板的情况下在TGFβR2基因中引入DSB,使本文所设想的经基因组编辑的免疫效应子细胞更有效。BiTE分子是二分分子,其包括结合靶抗原的第一结合结构域、如本文其它地方所设想的连接子或间隔子、以及结合免疫效应子细胞上的刺激或共刺激分子的第二结合结构域。第一结合结构域和第二结合结构域可以独立地选自配体、受体、抗体或其抗原结合片段、凝集素和碳水化合物。
在特定实施例中,第一结合结构域和第二结合结构域是抗原结合结构域。
在特定实施例中,第一结合结构域和第二结合结构域是抗体或其抗原结合片段。在一个实施例中,第一结合结构域和第二结合结构域是单链可变片段(scFv)。
在特定实施例中可以由第一结合结构域识别并结合的靶抗原的说明性实例包含但不限于:α叶酸受体、5T4、αvβ6整联蛋白、BCMA、B7-H3、B7-H6、CAIX、CD16、CD19、CD20、CD22、CD30、CD33、CD44、CD44v6、CD44v7/8、CD70、CD79a、CD79b、CD123、CD138、CD171、CEA、CSPG4、EGFR、包含ErbB2(HER2)的EGFR家族、EGFRvIII、EGP2、EGP40、EPCAM、EphA2、EpCAM、FAP、胎儿AchR、FRα、GD2、GD3、磷脂酰肌醇蛋白聚糖-3(GPC3)、HLA-A1+MAGE1/HLA-A2+MAGE1、HLA-A3+MAGE1、HLA-A1+NY-ESO-1、HLA-A2+NY-ESO-1、HLA-A3+NY-ESO-1、IL-11Rα、IL-13Rα2、Lambda、Lewis-Y、Kappa、间皮素、Muc1、Muc16、NCAM、NKG2D配体、NY-ESO-1、PRAME、PSCA、PSMA、ROR1,SSX、存活蛋白、TAG72、TEM、VEGFR2以及WT-1。
靶抗原的其它说明性实施例包含MHC-肽复合物,任选地其中肽由以下加工:α叶酸受体、5T4、αvβ6整联蛋白、BCMA、B7-H3、B7-H6、CAIX、CD16、CD19、CD20、CD22、CD30、CD33、CD44、CD44v6、CD44v7/8、CD70、CD79a、CD79b、CD123、CD138、CD171、CEA、CSPG4、EGFR、包括ErbB2(HER2)的EGFR家族、EGFRvIII、EGP2、EGP40、EPCAM、EphA2、EpCAM、FAP、胎儿AchR、FRα、GD2、GD3、磷脂酰肌醇蛋白聚糖-3(GPC3)、MAGE1、NY-ESO-1、IL-11Rα、IL-13Rα2,Lambda、Lewis-Y、Kappa、间皮素、Muc1、Muc16、NCAM、NKG2D配体、PRAME、PSCA、PSMA、ROR1,SSX、存活蛋白、TAG72、TEM、VEGFR2以及WT-1。
在特定实施例中由第二结合结构域识别并结合的免疫效应子细胞上的刺激或共刺激分子的说明性实例包含但不限于:CD3γ、CD3δ、CD3ε、CD3ζ、CD28、CD134、CD137以及CD278。
在特定实施例中,通过工程化核酸酶在TGFβR2基因中诱导DSB,并且将包括BiTE的供体修复模板引入到细胞中并通过同源重组插入到TGFβR2基因中。
b.免疫增强因子
在特定实施例中,通过在经基因组编辑的细胞或肿瘤微环境中的细胞中增加免疫增强因子,使本文所设想的经基因组编辑的免疫效应子细胞更有效。免疫增强因子是指特定细胞因子、趋化因子、细胞毒素以及增强免疫效应子细胞中的免疫应答的细胞因子受体。在一个实施例中,通过在存在编码细胞因子、趋化因子、细胞毒素或细胞因子受体的供体修复模板的情况下在TGFβR2基因中引入DSB来工程化T细胞。
在特定实施例中,供体修复模板编码选自由以下组成的组的细胞因子:IL-2、胰岛素、IFN-γ、IL-7、IL-21、IL-10、IL-12、IL-15以及TNF-α。
在特定实施例中,供体修复模板编码选自由以下组成的组的趋化因子:MIP-1α、MIP-1β、MCP-1、MCP-3以及RANTES。
在特定实施例中,供体修复模板编码选自由以下组成的组的细胞毒素:穿孔素、颗粒酶A和颗粒酶B。
在特定实施例中,供体修复模板编码选自由以下组成的组的细胞因子受体:IL-2受体、IL-7受体、IL-12受体、IL-15受体和IL-21受体。
c.翻转受体
在另外的实施例中,供体修复模板编码翻转受体或其部分。如本文所使用的,术语“翻转受体”是指将来自肿瘤微环境的免疫抑制信号转化为T细胞中的免疫刺激信号的非天然存在的多肽。在特定实施例中,TGFβR2翻转受体是指包括TGFβR2外结构域或配体结合结构域或其变体、跨膜结构域以及将免疫刺激信号转导到T细胞的内结构域的多肽。在特定实施例中,TGFβR2翻转受体是指包括TGFβR2外结构域或配体结合结构域或其变体、TGFβR2跨膜结构域以及将免疫刺激信号转导到T细胞的内结构域的多肽。在特定实施例中,TGFβR2翻转受体是指包括TGFβR2外结构域或配体结合结构域或其变体以及跨膜结构域以及将免疫刺激信号转导到T细胞的来自蛋白质的内结构域的多肽。在某些实施例中,TGFβR2外结构域变体对TGFβ-1具有增加的结合亲和力。
在一个实施例中,跨膜分离自CD3δ、CD3ε、CD3γ、CD3ζ、CD4、CD5、CD8α、CD9、CD16、CD22、CD27、CD28、CD33、CD37、CD45、CD64、CD80、CD86、CD134、CD137、CD152、CD154、AMN、PD-1和TGFβR2。
在一个实施例中,跨膜分离自CD4、CD8α、CD8β、CD27、CD28、CD134、CD137或CD3多肽。
在一个实施例中,供体修复模板包括TGFβR2翻转受体,其包括TGFβR2外结构域或配体结合结构域、跨膜结构域以及一个或多个细胞内共刺激信号传导结构域和/或初级信号传导结构域。跨膜和内结构域可以从相同的蛋白质或不同的蛋白质中分离。
在一个实施例中,供体修复模板包括TGFβR2翻转受体,其包括TGFβR2外结构域、跨膜结构域以及来自与TGFβR2跨膜结构域的C末端框内融合的CD28、CD134、CD137、CD278和/或CD3ζ的内结构域。
在一个实施例中,供体修复模板包括TGFβR2翻转受体,其包括TGFβR2外结构域或配体结合结构域、TGFβR2跨膜结构域以及一个或多个细胞内共刺激信号传导结构域和/或初级信号传导结构域。
2.免疫抑制信号阻尼子
困扰现有过继性细胞疗法的一个限制或问题是由于肿瘤微环境介导的耗竭所导致的免疫效应子细胞的低反应性。耗竭型T细胞具有与原初T细胞、效应子T细胞或记忆T细胞明显不同的独特的分子特征。它们被限定为具有降低的细胞因子表达和效应子功能的T细胞。
在特定实施例中,通过降低或抑制通过免疫抑制因子的信号传导使本文所设想的经基因组编辑的免疫效应子细胞对耗竭更具抗性。在一个实施例中,通过在存在编码免疫抑制信号阻尼子的供体修复模板的情况下在TGFβR2基因中引入DSB来工程化T细胞。
如本文所使用的,术语“免疫抑制信号阻尼子”是指降低来自肿瘤微环境的免疫抑制信号到T细胞的转导的非天然存在的多肽。在一个实施例中,免疫抑制信号阻尼子是结合免疫抑制因子的抗体或其抗原结合片段。在优选的实施例中,免疫抑制信号阻尼子是指引发对特定免疫抑制因子或信号传导途径的抑制、减弱或显性负效应的多肽,因为阻尼子包括结合免疫抑制因子的外结构域、以及任选地跨膜结构域、以及任选地经过修饰的内结构域(例如,细胞内信号传导结构域)。
在特定实施例中,外结构域是识别并结合免疫抑制因子的细胞外结合结构域。
在特定实施例中,使经过修饰的内结构域突变以降低或抑制免疫抑制信号。合适的突变策略包含但不限于氨基酸取代、添加或缺失。合适的突变进一步包含但不限于用于移除信号传导结构域的内结构域截短、用于移除对信号传导基序活性而言重要的残基的突变内结构域以及用于阻断受体循环的突变内结构域。在特定实施例中,内结构域(当存在时)不转导免疫抑制信号或者具有显著减少的信号传导。
因此,在一些实施例中,免疫抑制信号阻尼子充当来自肿瘤微环境的一个或多个免疫抑制因子的汇,并抑制T细胞中对应的免疫抑制信号传导途径。
通过色氨酸分解代谢介导一种免疫抑制信号。在癌细胞中通过吲哚胺2,3-双加氧酶(IDO)的色氨酸分解代谢导致产生犬尿氨酸,已示出所述犬尿氨酸对肿瘤微环境中的T细胞具有免疫抑制作用。参见例如Platten等人,(2012)《癌症研究(Cancer Res.)》72(21):5435-40。
在一个实施例中,供体修复模板包括具有犬尿氨酸酶活性的酶。
具有适用于特定实施例中的犬尿氨酸酶活性的酶的说明性实例包含但不限于L-犬尿氨酸水解酶。
在一个实施例中,供体修复模板包括编码免疫抑制信号阻尼子的一个或多个多核苷酸,所述免疫抑制信号阻尼子降低或阻断由免疫抑制因子介导的免疫抑制信号传导。
特定实施例中所设想的免疫抑制信号阻尼子所靶向的免疫抑制因子的说明性实例包含但不限于:程序性死亡配体1(PD-L1)、程序性死亡配体2(PD-L2)、转化生长因子β(TGFβ)、巨噬细胞集落刺激因子1(M-CSF1)、肿瘤坏死因子相关凋亡诱导配体(TRAIL)、在SiSo细胞配体上表达的受体结合癌抗原(RCAS1)、Fas配体(FasL)、CD47、白细胞介素-4(IL-4)、白细胞介素-6(IL-6)、白细胞介素-8(IL-8)、白细胞介素-10(IL-10)以及白细胞介素-13(IL-13)。
在各个实施例中,免疫抑制信号阻尼子包括结合免疫抑制因子的抗体或其抗原结合片段。
在各个实施例中,免疫抑制信号阻尼子包括结合免疫抑制因子的外结构域。
在特定实施例中,免疫抑制信号阻尼子包括结合免疫抑制因子的外结构域和跨膜结构域。
在另一个实施例中,免疫抑制信号阻尼子包括结合免疫抑制因子的外结构域、跨膜结构域、以及不转导或具有显著降低的转导免疫抑制信号能力的经过修饰的内结构域。
如本文所使用的,术语“外结构域”是指抗原结合结构域。在一个实施例中,外结构域是将来自肿瘤微环境的免疫抑制信号转导到T细胞的免疫抑制受体的细胞外配体结合结构域。在特定实施例中,外结构域是指包括免疫受体酪氨酸抑制基序(ITIM)和/或免疫受体酪氨酸开关基序(ITSM)的受体的细胞外配体结合结构域。
适用于免疫抑制信号阻尼子的特定实施例中的外结构域的说明性实例包含但不限于抗体或其抗原结合片段或从以下多肽中分离的细胞外配体结合结构域:程序性细胞死亡蛋白1(PD-1)、淋巴细胞活化基因3蛋白(LAG-3)、T细胞免疫球蛋白结构域和粘蛋白结构域蛋白3(TIM3)、细胞毒性T淋巴细胞抗原-4(CTLA-4)、带T淋巴细胞衰减子(BTLA)、T细胞免疫球蛋白和基于免疫受体酪氨酸的抑制基序结构域(TIGIT)、转化生长因子β受体2(TGFβR2)、巨噬细胞集落刺激因子1受体(CSF1R)、白细胞介素4受体(IL4R)、白细胞介素6受体(IL6R)、趋化因子(C-X-C基序)受体1(CXCR1)、趋化因子(C-X-C基序)受体2(CXCR2)、白细胞介素10受体α亚基(IL10R)、白细胞介素13受体α2亚基(IL13Rα2)、肿瘤坏死因子相关凋亡诱导配体(TRAILR1)、在SiSo细胞上表达的受体结合癌抗原(RCAS1R)以及Fas细胞表面死亡受体(FAS)。
在一个实施例中,外结构域包括选自由以下组成的组的受体的细胞外配体结合结构域:PD-1、LAG-3、TIM3、CTLA-4、IL10R、TIGIT、CSF1R以及TGFβR2。
可以在特定实施例中使用许多跨膜结构域。适用于特定实施例中所设想的免疫抑制信号阻尼子的特定实施例中的跨膜结构域的说明性实例包含但不限于以下蛋白质的跨膜结构域:T细胞受体的α或β链、CDδ、CD3ε、CDγ、CD3ζ、CD4、CD5、CD8α、CD9、CD16、CD22、CD27、CD28、CD33、CD37、CD45、CD64、CD80、CD86、CD134、CD137、CD152、CD154以及PD-1。
在特定实施例中,本文所设想的过继性细胞疗法包括抑制或阻断通过TGFβR2转导来自肿瘤微环境的免疫抑制TGFβ信号的免疫抑制信号阻尼子。在一个实施例中,免疫抑制信号阻尼子包括包含TGFβR2细胞外配体结合的外结构域、TGFβR2跨膜结构域、以及截短的非功能性TGFβR2内结构域。在另一个实施例中,免疫抑制信号阻尼子包括包含TGFβR2细胞外配体结合的外结构域、TGFβR2跨膜结构域,并且缺少内结构域。
3.工程化抗原受体
在特定实施例中,本文所设想的经基因组编辑的免疫效应子细胞包括工程化抗原受体。在一个实施例中,通过在存在编码工程化抗原受体的供体修复模板的情况下在一个或多个TGFβR2基因中引入DSB来工程化T细胞。
在特定实施例中,工程化抗原受体是工程化T细胞受体(TCR)、嵌合抗原受体(CAR)、Daric受体或其组分、或嵌合细胞因子受体。
a.工程化TCR
在特定实施例中,本文所设想的经基因组编辑的免疫效应子细胞包括工程化TCR。在一个实施例中,通过在存在编码工程化TCR的供体修复模板的情况下在一个或多个TGFβR2基因中引入DSB来工程化T细胞。在特定实施例中,将工程化TCR插入在单个TGFβR2基因中的DSB处。另一个实施例,将工程化TCR的α链插入到一个TGFβR2基因的DSB中,并将工程化TCR的β链插入到另一个TGFβR2基因中的DSB中。
在一个实施例中,本文所设想的工程化T细胞包括未插入在TGFβR2基因处的工程化TCR、以及免疫抑制信号阻尼子、翻转受体、工程化T细胞受体(TCR)的α和/或β链中的一个或多个、嵌合抗原受体(CAR)、Daric受体或其组分,或者将嵌合细胞因子受体插入到一个或多个TGFβR2基因中的DSB中。
天然存在的T细胞受体包括两个亚基,α链亚基和β链亚基,这两个亚基中的每一个是通过每个T细胞基因组中的重组事件产生的独特蛋白。可以筛选TCR文库对特定靶抗原的选择性。以这种方式,可以选择、克隆对靶抗原具有高亲合力和反应性的天然TCR,并随后将其引入到用于过继性免疫疗法的T细胞群中。
在一个实施例中,通过在一个或多个TGFβR2基因中的DSB处引入包括编码TCR亚基的多核苷酸的供体修复模板来修饰T细胞,其中TCR亚基具有形成TCR的能力,所述TCR赋予T细胞对表达靶抗原的肿瘤细胞的特异性。在特定实施例中,与天然存在的亚基相比,所述亚基具有一个或多个氨基酸取代、缺失、插入或修饰,只要所述亚基保留形成TCR的能力并赋予转染的T细胞归巢到靶细胞的能力,并且参与免疫相关的细胞因子信号传导。工程化TCR还优选地以高亲合力结合展示相关肿瘤相关肽的靶细胞,并且任选地介导在体内呈递相关肽的靶细胞的有效扼杀。
编码工程化TCR的核酸优选地从其在T细胞的(天然存在的)染色体中的自然背景下分离,并且可以被结合到如本文其它地方所述的合适的载体中。核酸和包括其的载体两者都可以转移到细胞中,优选地转移到特定实施例中的T细胞中。然后,经过修饰的T细胞能够表达由转导的一个核酸或多个核酸编码的TCR的一个或多个链。在优选的实施例中,工程化TCR是外源性TCR,因为其被引入到通常不表达特定TCR的T细胞中。工程化TCR的基本方面是其对由主要组织相容性复合物(MHC)或类似免疫组分呈递的肿瘤抗原具有高亲合力。与工程化TCR相比,CAR被工程化成以MHC非依赖性方式结合靶抗原。
TCR可以用附着于TCR的发明性α链或β链的氨基末端或羧基末端部分的另外的多肽表达,只要所附着的另外的多肽不干扰α链或β链形成功能性T细胞受体和MHC依赖性抗原识别的能力即可。
特定实施例中所设想的由工程化TCR识别的抗原包含但不限于癌抗原,包含血液癌和实体瘤上的抗原。说明性抗原包含但不限于α叶酸受体、5T4、αvβ6整联蛋白、BCMA、B7-H3、B7-H6、CAIX、CD19、CD20、CD22、CD30、CD33、CD44、CD44v6、CD44v7/8、CD70、CD79a、CD79b、CD123、CD138、CD171、CEA、CSPG4、EGFR、包含ErbB2(HER2)的EGFR家族、EGFRvIII、EGP2、EGP40、EPCAM、EphA2、EpCAM、FAP、胎儿AchR、FRα、GD2、GD3、磷脂酰肌醇蛋白聚糖-3(GPC3)、HLA-A1+MAGE1/HLA-A2+MAGE1、HLA-A3+MAGE1、HLA-A1+NY-ESO-1、HLA-A2+NY-ESO-1、HLA-A3+NY-ESO-1、IL-11Rα、IL-13Rα2、Lambda、Lewis-Y、Kappa、间皮素、Muc1、Muc16、NCAM、NKG2D配体、NY-ESO-1、PRAME、PSCA、PSMA、ROR1,SSX、存活蛋白、TAG72、TEM、VEGFR2以及WT-1。
在一个实施例中,供体修复模板包括编码RNA聚合酶II启动子或第一自切割病毒肽的多核苷酸以及编码整合到一个经过修饰的和/或非功能性TGFβR2基因中的工程化TCR的α链和/或β链的多核苷酸。
在一个实施例中,供体修复模板包括编码RNA聚合酶II启动子或第一自切割病毒肽的多核苷酸以及编码整合到一个经过修饰的和/或非功能性TGFβR2基因中的工程化TCR的α链和β链的多核苷酸。
在特定实施例中,供体修复模板包括5'到3'的编码第一自切割病毒肽的多核苷酸、编码工程化TCR的α链的多核苷酸、编码第二自切割病毒肽的多核苷酸、以及编码整合到一个经过修饰的和/或非功能性TGFβR2基因中的工程化TCR的β链的多核苷酸。在这种情况下,另一种TGFβR2基因可以是功能性的或者可以具有降低的功能或者已通过DSB变得无功能并且通过NHEJ修复。在一个实施例中,另一种TGFβR2基因已经被本文所设想的工程化核酸酶所修饰,并且可以具有降低的功能或已变得无功能。
在某个实施例中,TGFβR2基因均被修饰并且具有降低的功能或是非功能性的:第一经过修饰的TGFβR2基因包括核酸,所述核酸包括编码第一自切割病毒肽的多核苷酸和编码工程化TCR的α链的多核苷酸,并且第二经过修饰的TGFβR2基因包括编码第二自切割病毒肽的多核苷酸和编码工程化TCR的β链的多核苷酸。
b.嵌合抗原受体(CAR)
在特定实施例中,本文所设想的工程化免疫效应子细胞包括一个或多个嵌合抗原受体(CAR)。在一个实施例中,通过在存在编码CAR的供体修复模板的情况下在一个或多个TGFβR2基因中引入DSB来工程化T细胞。在特定实施例中,将CAR插入在单个TGFβR2基因中的DSB处。
在一个实施例中,本文所设想的工程化T细胞包括未插入在TGFβR2基因处的CAR、以及免疫抑制信号阻尼子、翻转受体、工程化T细胞受体(TCR)的α和/或β链中的一个或多个、嵌合抗原受体(CAR)、Daric受体或其组分,或者将嵌合细胞因子受体插入到一个或多个TGFβR2基因中的DSB中。
在各个实施例中,经基因组编辑的T细胞表达将细胞毒性重定向朝向肿瘤细胞的CAR。CAR是将针对靶抗原(例如,肿瘤抗原)的基于抗体的特异性与T细胞受体活化细胞内结构域组合以产生嵌合蛋白的分子,所述嵌合蛋白展现出特异性抗肿瘤细胞免疫活性。如本文所使用的,术语“嵌合”描述由不同蛋白质的部分或来自不同来源的DNA构成。
在各个实施例中,CAR包括与特异性靶抗原结合的细胞外结构域(也称为结合结构域或抗原特异性结合结构域)、跨膜结构域以及细胞内信号传导结构域。CAR的主要特征是其能够利用单克隆抗体、可溶性配体或细胞特异性共同受体的细胞特异性靶向能力来重定向免疫效应子细胞特异性,由此触发增殖、细胞因子产生、吞噬作用或产生可以以主要组织相容性(MHC)非依赖方式介导靶抗原表达细胞的细胞死亡的分子。
在特定实施例中,CAR包括细胞外结合结构域,其与肿瘤细胞上表达的靶多肽例如靶抗原特异性结合。如本文所使用的,术语“结合结构域”、“细胞外结构域”、“细胞外结合结构域”、“抗原结合结构域”、“抗原特异性结合结构域”和“细胞外抗原特异性结合结构域”可互换使用,并为嵌合受体例如CAR或Daric提供与所关注的靶抗原特异性结合的能力。结合结构域可以包括拥有特异性识别并结合生物分子(例如,细胞表面受体或肿瘤蛋白、脂质、多糖、或其它细胞表面靶分子或其组分)的能力的任何蛋白质、多肽、寡肽或肽。结合结构域包含用于所关注的生物分子的任何天然存在的、合成的、半合成的或重组产生的结合配偶体。
在特定实施例中,细胞外结合结构域包括抗体或其抗原结合片段。
“抗体”是指作为包括至少一个轻链免疫球蛋白可变区或重链免疫球蛋白可变区的多肽的结合剂,所述轻链免疫球蛋白可变区或重链免疫球蛋白可变区特异性识别并结合靶抗原的表位,如肽、脂质、多糖或含有抗原决定簇的核酸如由免疫细胞识别的那些核酸。抗体包含抗原结合片段,例如骆驼Ig(骆驼科抗体或其VHH片段)、Ig NAR、Fab片段、Fab'片段、F(ab)'2片段、F(ab)'3片段、Fv、单链Fv抗体(“scFv”)、bis-scFv、(scFv)2、微抗体、双抗体、三抗体、四抗体、二硫键稳定性Fv蛋白(“dsFv”)以及单结构域抗体(sdAb,纳米抗体)或其它抗体片段。所述术语还包含基因工程形式,如嵌合抗体(例如,人源化鼠抗体)、异缀合抗体(如双特异性抗体)以及其抗原结合片段。还参见《皮尔斯目录与手册(Pierce Catalogand Handbook)》,1994-1995(皮尔斯化学公司(Pierce Chemical Co.),罗克福德,伊利诺伊州);Kuby,《免疫学期刊(J.,Immunology)》,第3版,W.H.弗里曼公司(W.H.Freeman&Co.),纽约,1997。
在一个优选的实施例中,结合结构域是scFv。
在另一个优选的实施例中,结合结构域是骆驼科抗体。
在特定实施例中,CAR包括结合选自由以下组成的组的抗原的细胞外结构域:α叶酸受体、5T4、αvβ6整联蛋白、BCMA、B7-H3、B7-H6、CAIX、CD16、CD19、CD20、CD22、CD30、CD33、CD44、CD44v6、CD44v7/8、CD70、CD79a、CD79b、CD123、CD138、CD171、CEA、CSPG4、EGFR、包含ErbB2(HER2)的EGFR家族、EGFRvIII、EGP2、EGP40、EPCAM、EphA2、EpCAM、FAP、胎儿AchR、FRα、GD2、GD3、磷脂酰肌醇蛋白聚糖-3(GPC3)、HLA-A1+MAGE1/HLA-A2+MAGE1、HLA-A3+MAGE1、HLA-A1+NY-ESO-1、HLA-A2+NY-ESO-1、HLA-A3+NY-ESO-1、IL-11Rα、IL-13Rα2、Lambda、Lewis-Y、Kappa、间皮素、Muc1、Muc16、NCAM、NKG2D配体、NY-ESO-1、PRAME、PSCA、PSMA、ROR1,SSX、存活蛋白、TAG72、TEM、VEGFR2以及WT-1。
在特定实施例中,CAR包括细胞外结合结构域,例如结合抗原的抗体或其抗原结合片段,其中所述抗原是MHC-肽复合物,如I类MHC-肽复合物或II类MHC-肽复合物。
在某些实施例中,CAR包括各个结构域之间的连接子残基。“可变区连接序列”是氨基酸序列,所述氨基酸序列将重链可变区与轻链可变区连接并且提供与两个子结合结构域的相互作用兼容的间隔子功能,使得所得多肽保留与包括相同轻链可变区和重链可变区的抗体相同的靶分子的特异性结合亲和力。在特定实施例中,CAR包括一个、两个、三个、四个或五个或更多个连接子。在特定实施例中,连接子的长度为约1个到约25个氨基酸、约5个到约20个氨基酸、或约10个到约20个氨基酸或任何中间长度的氨基酸。在一些实施例中,连接子长度是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个25个或更多个氨基酸。
在特定实施例中,CAR的结合结构域之后是一个或多个“间隔子结构域”,所述间隔子结构域指的是使抗原结合结构域移动远离效应子细胞表面以实现适当的细胞/细胞接触、抗原结合和活化的区(Patel等人,《基因疗法(Gene Therapy)》,1999;6:412-419)。间隔子结构域可以衍生自天然的、合成的、半合成的或重组的来源。在某些实施例中,间隔子结构域是免疫球蛋白的一部分,其包含但不限于一个或多个重链恒定区,例如CH2和CH3。间隔子结构域可以包含天然存在的免疫球蛋白铰链区或改变的免疫球蛋白铰链区的氨基酸序列。
在一个实施例中,间隔子结构域包括IgG1、IgG4或IgD的CH2和CH3。
在一个实施例中,CAR的结合结构域与一个或多个“铰链结构域”连接,这在将抗原结合结构域定位成远离效应子细胞表面以实现适当的细胞/细胞接触、抗原结合和活化中起作用。CAR通常包括在结合结构域与跨膜结构域(TM)之间的一个或多个铰链结构域。铰链结构域可以衍生自天然的、合成的、半合成的或重组的来源。铰链结构域可以包含天然存在的免疫球蛋白铰链区或改变的免疫球蛋白铰链区的氨基酸序列。
适用于本文所描述的CAR中的说明性铰链结构域包含衍生自如CD8α和CD4等1型膜蛋白的细胞外区的铰链区,所述铰链区可以是来自这些分子的野生型铰链区或可以被改变。在另一个实施例中,铰链结构域包括CD8α铰链区。
在一个实施例中,铰链是PD-1铰链或CD152铰链。
“跨膜结构域”是CAR的一部分,其融合细胞外结合部分和细胞内信号传导结构域并且将CAR锚定于免疫效应子细胞的质膜上。TM结构域可以衍生自天然的、合成的、半合成的或重组的来源。
示例性TM结构域可以衍生自(即,至少包括以下的一个或多个跨膜区):、T细胞受体的α或β链、CD3δ、CD3ε、CD3γ、CD3ζ、CD4、CD5、CD8α、CD9、CD16、CD22、CD27、CD28、CD33、CD37、CD45、CD64、CD80、CD86、CD134、CD137、CD152、CD154、AMN以及PD-1。
在一个实施例中,CAR包括衍生自CD8α的TM结构域。在另一个实施例中,本文所设想的CAR包括衍生自CD8α的TM结构域以及优选地长度为1个、2个、3个、4个、5个、6个、7个、8个、9个或10个氨基酸之间的连接TM结构域和CAR的细胞内信号传导结构域的短的寡肽或多肽连接子。甘氨酸-丝氨酸连接子提供特别合适的连接子。
在特定实施例中,CAR包括细胞内信号传导结构域。“细胞内信号传导结构域”是指CAR的一部分,其参与将与靶抗原结合的有效CAR的消息转导到免疫效应子细胞内部以引发效应子细胞功能,例如活化、细胞因子产生、增殖以及细胞毒活性,包含向CAR结合的靶细胞释放细胞毒性因子或用与细胞外CAR结构域结合的抗原引发的其它细胞应答。
术语“效应子功能”是指细胞的专门功能。T细胞的效应子功能例如可以是包含细胞因子的分泌的细胞溶解活性或辅助活性。因此,术语“细胞内信号传导结构域”是指蛋白质的一部分,其转导效应子功能信号并引导细胞执行专门功能。虽然通常可以采用整个细胞内信号传导结构域,但在许多情况下不必使用整个结构域。就使用细胞内信号传导结构域的截短部分来说,可以使用这种截短部分代替整个结构域,只要其转导效应子功能信号即可。术语细胞内信号传导结构域意指包含细胞内信号传导结构域的足以转导效应子功能信号的任何截短部分。
已知的是,仅通过TCR产生的信号不足以完全活化T细胞,并且还需要次级信号或共刺激信号。因此,可以说T细胞活化由两种不同类型的细胞内信号传导结构域介导:初级信号传导结构域,其通过TCR(例如,TCR/CD3复合物)来启动抗原依赖性初级活化;以及共刺激信号传导结构域,其以抗原非依赖性方式起作用以提供次级信号或共刺激信号。在优选的实施例中,CAR包括细胞内信号传导结构域,其包括一个或多个“共刺激信号传导结构域”和“初级信号传导结构域”。
初级信号传导结构域以刺激方式或以抑制方式调控TCR复合物的初级活化。以刺激方式起作用的初级信号传导结构域可以含有信号传导基序,所述信号传导基序被称为基于免疫受体酪氨酸的活化基序或ITAM。
含有适用于特定实施例中所设想的CAR中的初级信号传导结构域的ITAM的说明性实例包含衍生自FcRγ、FcRβ、CD3γ、CD3δ、CD3ε、CD3ζ、CD22、CD79a、CD79b以及CD66d的那些ITAM。在特定优选的实施例中,CAR包括CD3ζ初级信号传导结构域以及一个或多个共刺激信号传导结构域。细胞内初级信号传导结构域和共刺激信号传导结构域可以以任何顺序与跨膜结构域的羧基末端串联连接。
在特定实施例中,CAR包括用于增强表达CAR受体的T细胞的疗效和扩增的一个或多个共刺激信号传导结构域。如本文所使用的,术语“共刺激信号传导结构域”或“共刺激结构域”是指共刺激分子的细胞内信号传导结构域。
适用于特定实施例中所设想的CAR中的这种共刺激分子的说明性实例包含TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10、CARD11、CD2、CD7、CD27、CD28、CD30、CD40、CD54(ICAM)、CD83、CD134(OX40)、CD137(4-1BB)、CD278(ICOS)、DAP10、LAT、NKD2C、SLP76、TRIM以及ZAP70。在一个实施例中,CAR包括选自由CD28、CD137和CD134组成的组的一个或多个共刺激信号传导结构域以及CD3ζ初级信号传导结构域。
在各个实施例中,CAR包括:结合选自由以下组成的组的抗原的细胞外结构域:BCMA、CD19、CSPG4、PSCA、ROR1和TAG72;从选自由以下组成的组的多肽中分离的跨膜结构域:CD4、CD8α、CD154和PD-1;从选自由以下组成的组的多肽中分离的一个或多个细胞内共刺激信号结构域:CD28、CD134和CD137;以及从选自由以下组成的组的多肽中分离的信号传导结构域:FcRγ、FcRβ、CD3γ、CD3δ、CD3ε、CD3ζ、CD22、CD79a、CD79b和CD66d。
c.Daric受体
在特定实施例中,工程化免疫效应子细胞包括一个或多个Daric受体。如本文所使用的,术语“Daric受体”是指多链工程化抗原受体。在一个实施例中,通过在存在编码Daric的一个或多个组分的供体修复模板的情况下在一个或多个TGFβR2基因中引入DSB来工程化T细胞。在特定实施例中,Daric或其一个或多个组分插入在单个TGFβR2基因中的DSB处。
在一个实施例中,工程化T细胞包括未插入在TGFβR2基因处的Daric、以及免疫抑制信号阻尼子、翻转受体、工程化T细胞受体(TCR)的α和/或β链中的一个或多个、嵌合抗原受体(CAR),或者将Daric受体或其组分插入到一个或多个TGFβR2基因中的DSB中。
Daric架构和组分的说明性实例在PCT公开号WO2015/017214和美国专利公开号20150266973中公开,所述公开中的每一个通过引用整体并入本文。
在一个实施例中,供体修复模板包括以下Daric组分:信号传导多肽,其包括第一多聚化结构域、第一跨膜结构域以及一个或多个细胞内共刺激信号传导结构域和/或初级信号传导结构域;和结合多肽,其包括结合结构域、第二多聚化结构域以及任选地第二跨膜结构域。功能性Daric包括桥接因子,所述桥接因子促进在细胞表面上形成Daric受体复合物,其中桥接因子与信号传导多肽和结合多肽的多聚化结构域相关联并且安置在所述多聚化结构域之间。
在特定实施例中,第一多聚化结构域和第二多聚化结构域与选自由以下组成的组的桥接因子相关联:雷帕霉素或其雷帕霉素类似物、香豆霉素或其衍生物、赤霉素或其衍生物、脱落酸(ABA)或其衍生物、甲氨蝶呤或其衍生物、环孢菌素A或其衍生物、FKCsA或其衍生物、甲氧苄啶(Tmp)-FKBP合成配体或其衍生物、及其任何组合。
雷帕霉素类似物(雷帕霉素类似物(rapalog))的说明性实例包含美国专利号6,649,595中公开的那些,其中雷帕霉素类似物结构通过引用整体并入本文。在某些实施例中,桥接因子是与雷帕霉素相比具有显著降低的免疫抑制作用的雷帕霉素类似物。“显著降低的免疫抑制作用”是指具有至少小于针对等摩尔量的雷帕霉素观察到或预期的0.1倍到0.005倍的免疫抑制作用的雷帕霉素类似物,如在临床上或在人类免疫抑制活性的适当体外(例如,抑制T细胞增殖)或体内替代物中测量的。在一个实施例中,“显著降低的免疫抑制作用”是指在这种体外分析中具有比在相同分析中针对雷帕霉素观察到的EC50值大至少10倍到250倍的EC50值的雷帕霉素类似物。
雷帕霉素类似物的其它说明性实例包含但不限于依维莫司、诺氟莫司(novolimus)、吡美莫司、地磷莫司(ridaforolimus)、他克莫司、替西罗莫司、佐他莫司(umirolimus)和唑他莫司(zotarolimus)。
在某些实施例中,多聚化结构域将与作为雷帕霉素或其雷帕霉素类似物的桥接因子相关联。例如,第一多聚化结构域和第二多聚化结构域是选自FKBP和FRB的一对。FRB结构域是能够与FKBP蛋白质和雷帕霉素或其雷帕霉素类似物一起形成三分复合物的多肽区(蛋白质“结构域”)。FRB结构域存在于许多天然存在的蛋白质中,所述天然存在的蛋白质包含:来自人类和其它物种的mTOR蛋白(在文献中也称为FRAP、RAPT1或RAFT);包含Tor1和Tor2的酵母蛋白;以及念珠菌FRAP同系物。关于这些蛋白质的核苷酸序列、克隆和其它方面的信息在本领域中是已知的。例如,人mTOR的蛋白序列登录号是基因库(GenBank)登录号L34075.1(Brown等人,《自然(Nature)》369:756,1994)。
适用于本文所设想的特定实施例中的FRB结构域通常含有至少约85个到约100个氨基酸残基。在某些实施例中,基于基因库登录号L34075.1的氨基酸序列,用于本公开的融合蛋白中的FRB氨基酸序列将包括93个氨基酸序列Ile-2021到Lys-2113以及T2098L的突变。适用于特定实施例中所设想的Daric中的FRB结构域将能够结合与雷帕霉素或其雷帕霉素类似物相结合的FKBP蛋白的复合物。在某些实施例中,FRB结构域的肽序列包括:(a)天然存在的肽序列,其至少跨越人mTOR的指定的93个氨基酸区或同源蛋白质的对应区;(b)天然存在的FRB的变体,其中天然存在的肽的至多约十个氨基酸、或约1个到约5个氨基酸、或约1个到约3个氨基酸、或在一些实施例中仅一个氨基酸已被缺失、插入或取代;或(c)由核酸分子或由DNA序列编码的肽,所述核酸分子能够选择性地与编码天然存在的FRB结构域的DNA分子混杂,但对于基因密码的简并性,所述DNA序列将能够选择性地与编码天然存在的FRB结构域的DNA分子混杂。
FKBP(FK506结合蛋白)是如FK506、FK520和雷帕霉素等大环内酯的细胞溶质受体,并且在物种系上高度保守。FKBP是蛋白质或蛋白质结构域,其能够结合雷帕霉素或其雷帕霉素类似物并且进一步与含FRB的蛋白质或融合蛋白形成三分复合物。FKBP结构域也可以称为“雷帕霉素结合结构域”。关于各种FKBP物种的核苷酸序列、克隆和其它方面的信息是本领域已知的(参见例如,Staendart等人,《自然》346:671,1990(人FKBP12);Kay,《生物化学期刊(Biochem.J.)》314:361,1996)。其它哺乳动物物种、酵母和其它生物体中的同源FKBP蛋白质也是本领域已知的并且可以用于本文公开的融合蛋白中。特定实施例中所设想的FKBP结构域将能够结合雷帕霉素或其雷帕霉素类似物并且与含FRB的蛋白质参与三分复合物(如可以通过用于检测这种结合的任何直接或间接方式确定的)。
适用于特定实施例中所设想的Daric中的FKBP结构域的说明性实例包含但不限于:优选地从人FKBP12蛋白(基因库登录号AAA58476.1)中分离的天然存在的FKBP肽序列或从其中分离、从另一个人FKBP中分离、从鼠类或其它哺乳动物FKBP中分离、或从一些其它动物、酵母或真菌FKBP中分离的肽序列;天然存在的FKBP序列的变体,其中天然存在的肽的至多约十个氨基酸、或约1个到约5个氨基酸、或约1个到约3个氨基酸、或在一些实施例中仅一个氨基酸已被缺失、插入或取代;或由核酸分子或由DNA序列编码的肽序列,所述核酸分子能够选择性地与编码天然存在的FKBP的DNA分子混杂,但对于基因密码的简并性,所述DNA序列将能够选择性地与编码天然存在的FKBP的DNA分子混杂。
适用于特定实施例中所设想的Daric中的多聚化结构域对的其它说明性实例包含但不限于包含FKBP和FRB、FKBP和钙调磷酸酶、FKBP和亲环蛋白、FKBP和细菌DHFR、钙调磷酸酶和亲环蛋白、PYL1和ABI1、或GIB1和GAI、或其变体。
在其它实施例中,抗桥接因子阻断信号传导多肽和结合多肽与桥接因子相关联。例如,环孢菌素或FK506可以用作抗桥接因子以滴定雷帕霉素,并且因此停止信号传导,因为仅结合一个多聚化结构域。在某些实施例中,抗桥接因子(例如,环孢菌素、FK506)是免疫抑制剂。例如,免疫抑制性抗桥接因子可以用于阻断或最小化特定实施例中设想的Daric组分的功能,并同时抑制或阻断临床环境中的不需要的或病理性的炎症应答。
在一个实施例中,第一多聚化结构域包括FRB T2098L,第二多聚化结构域包括FKBP12,并且桥接因子是雷帕霉素类似物AP21967。
在另一个实施例中,第一多聚化结构域包括FRB,第二多聚化结构域包括FKBP12,并且桥接因子是雷帕霉素、替西罗莫司或依维莫司。
在特定实施例中,信号传导多肽、第一跨膜结构域和结合多肽包括第二跨膜结构域或GPI锚。第一跨膜结构域和第二跨膜结构域的说明性实例从独立地选自由以下组成的组的多肽中分离:CD3δ、CD3ε、CD3γ、CD3ζ、CD4、CD5、CD8α、CD9、CD16、CD22、CD27、CD28、CD33、CD37、CD45、CD64、CD80、CD86、CD134、CD137、CD152、CD154、AMN和PD-1。
在一个实施例中,信号传导多肽包括一个或多个细胞内共刺激信号传导结构域和/或初级信号传导结构域。
适用于特定实施例中所设想的Daric信号传导组分的初级信号传导结构域的说明性实例包含衍生自FcRγ、FcRβ、CD3γ、CD3δ、CD3ε、CD3ζ、CD22、CD79A、CD79b以及CD66d的那些。在特定优选的实施例中,Daric信号传导组分包括CD3ζ初级信号传导结构域以及一个或多个共刺激信号传导结构域。细胞内初级信号传导结构域和共刺激信号传导结构域可以以任何顺序与跨膜结构域的羧基末端串联连接。
适用于特定实施例中所设想的Daric信号传导组分的这种共刺激分子的说明性实例包含TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10、CARD11、CD2、CD7、CD27、CD28、CD30、CD40、CD54(ICAM)、CD83、CD134(OX40)、CD137(4-1BB)、CD278(ICOS)、DAP10、LAT、NKD2C、SLP76、TRIM以及ZAP70。在一个实施例中,Daric信号传导组分包括选自由CD28、CD137和CD134组成的组的一个或多个共刺激信号传导结构域以及CD3ζ初级信号传导结构域。
在特定实施例中,Daric结合组分包括结合结构域。在一个实施例中,结合结构域是抗体或其抗原结合片段。
抗体或其抗原结合片段包括至少一个轻链免疫球蛋白可变区或重链免疫球蛋白可变区,所述轻链免疫球蛋白可变区或重链免疫球蛋白可变区特异性识别并结合靶抗原的表位,如肽、脂质、多糖或含有抗原决定簇的核酸如由免疫细胞识别的那些核酸。抗体包含抗原结合片段,例如骆驼Ig(骆驼科抗体或其VHH片段)、Ig NAR、Fab片段、Fab'片段、F(ab)'2片段、F(ab)'3片段、Fv、单链Fv抗体(“scFv”)、bis-scFv、(scFv)2、微抗体、双抗体、三抗体、四抗体、二硫键稳定性Fv蛋白(“dsFv”)以及单结构域抗体(sdAb,纳米抗体)或其它抗体片段。所述术语还包含基因工程形式,如嵌合抗体(例如,人源化鼠抗体)、异缀合抗体(如双特异性抗体)以及其抗原结合片段。还参见《皮尔斯目录与手册》,1994-1995(皮尔斯化学公司,罗克福德,伊利诺伊州);Kuby,《免疫学期刊》,第3版,W.H.弗里曼公司(W.H.Freeman&Co.),纽约,1997。
在一个优选的实施例中,结合结构域是scFv。
在另一个优选的实施例中,结合结构域是骆驼科抗体。
在特定实施例中,Daric结合组分包括结合选自由以下组成的组的抗原的细胞外结构域:α叶酸受体、5T4、αvβ6整联蛋白、BCMA、B7-H3、B7-H6、CAIX、CD16、CD19、CD20、CD22、CD30、CD33、CD44、CD44v6、CD44v7/8、CD70、CD79a、CD79b、CD123、CD138、CD171、CEA、CSPG4、EGFR、包含ErbB2(HER2)的EGFR家族、EGFRvIII、EGP2、EGP40、EPCAM、EphA2、EpCAM、FAP、胎儿AchR、FRα、GD2、GD3、磷脂酰肌醇蛋白聚糖-3(GPC3)、HLA-A1+MAGE1/HLA-A2+MAGE1、HLA-A3+MAGE1、HLA-A1+NY-ESO-1、HLA-A2+NY-ESO-1、HLA-A3+NY-ESO-1、IL-11Rα、IL-13Rα2、Lambda、Lewis-Y、Kappa、间皮素、Muc1、Muc16、NCAM、NKG2D配体、NY-ESO-1、PRAME、PSCA、PSMA、ROR1,SSX、存活蛋白、TAG72、TEM、VEGFR2以及WT-1。
在一个实施例中,Daric结合组分包括细胞外结构域,例如结合MHC-肽复合物如I类MHC-肽复合物或II类MHC-肽复合物的抗体或其抗原结合片段。
在特定实施例中,本文所设想的Daric组分包括连接两个蛋白质、两个多肽、两个肽、两个结构域、两个区或两个基序的连接子或间隔子。在某些实施例中,连接子包括约两个到约35个氨基酸、或约四个到约20个氨基酸、或约八个到约15个氨基酸、或约15个到约25个氨基酸。在其它实施例中,间隔子可以具有特定结构,如抗体CH2CH3结构域、铰链结构域等等。在一个实施例中,间隔子包括IgG1、IgG4或IgD的CH2结构域和CH3结构域。
在特定实施例中,本文所设想的Daric组分包括一个或多个“铰链结构域”,其在定位结构域以实现适当的细胞/细胞接触、抗原结合和活化中起作用。Daric可以包括在结合结构域与多聚化结构域和/或跨膜结构域(TM)之间或在多聚化结构域与跨膜结构域之间的一个或多个铰链结构域。铰链结构域可以衍生自天然的、合成的、半合成的或重组的来源。铰链结构域可以包含天然存在的免疫球蛋白铰链区或改变的免疫球蛋白铰链区的氨基酸序列。在特定实施例中,铰链是CD8α铰链或CD4铰链。
在一个实施例中,Daric包括信号传导多肽,所述信号传导多肽包括FRB T2098L的第一多聚化结构域、CD8跨膜结构域、4-1BB共刺激结构域以及CD3ζ初级信号传导结构域;结合多肽包括结合CD19的scFv、FKBP12的第二多聚化结构域以及CD4跨膜结构域;并且桥接因子是雷帕霉素类似物AP21967。
在一个实施例中,Daric包括信号传导多肽,所述信号传导多肽包括FRB的第一多聚化结构域、CD8跨膜结构域、4-1BB共刺激结构域以及CD3ζ初级信号传导结构域;结合多肽包括结合CD19的scFv、FKBP12的第二多聚化结构域以及CD4跨膜结构域;并且桥接因子是雷帕霉素、替西罗莫司或依维莫司。
d.Zetakine
在特定实施例中,本文所设想的工程化的免疫效应子细胞包括一个或多个嵌合细胞因子受体。在一个实施例中,通过在存在编码CAR的供体修复模板的情况下在一个或多个TGFβR2基因中引入DSB来工程化T细胞。在特定实施例中,将嵌合细胞因子受体插入在单个TGFβR2基因中的DSB处。
在一个实施例中,本文所设想的工程化T细胞包括未插入在TGFβR2基因处的嵌合细胞因子受体、以及免疫抑制信号阻尼子、翻转受体、工程化T细胞受体(TCR)的α链和/或β链中的一个或多个、嵌合抗原受体(CAR)、Daric受体或其组分,或者将嵌合细胞因子受体插入到一个或多个TGFβR2基因中的DSB中。
在各个实施例中,经基因组编辑的T细胞表达将细胞毒性重定向朝向肿瘤细胞的嵌合细胞因子受体。Zetakine是包括细胞外结构域的嵌合跨膜免疫受体,所述细胞外结构域包括与能够将细胞外结构域系栓到细胞表面的支持区、跨膜区和细胞内信号传导结构域连接的可溶性受体配体。当在T淋巴细胞表面上表达时,Zetakine向表达可溶性受体配体呈特异性的受体的那些细胞引导T细胞活性。Zetakine嵌合免疫受体重定向T细胞的抗原特异性,尤其通过由人类恶性肿瘤所利用的自分泌/旁分泌细胞因子系统使之应用于各种癌症的治疗。
在特定实施例中,嵌合细胞因子受体包括免疫抑制细胞因子或其细胞因子受体结合变体、连接子、跨膜结构域以及细胞内信号传导结构域。
在特定实施例中,细胞因子或其细胞因子受体结合变体选自由以下组成的组:白细胞介素-4(IL-4)、白细胞介素-6(IL-6)、白细胞介素-8(IL-8)、白细胞介素-10(IL-10)和白细胞介素-13(IL-13)。
在某些实施例中,连接子包括CH2CH3结构域、铰链结构域等。在一个实施例中,连接子包括IgG1、IgG4或IgD的CH2结构域和CH3结构域。在一个实施例中,连接子包括CD8α或CD4铰链结构域。
在特定实施例中,跨膜结构域选自由以下组成的组:T细胞受体的α链或β链、CD3δ、CD3ε、CD3γ、CD3ζ、CD4、CD5、CD8α、CD9、CD16、CD22、CD27、CD28、CD33、CD37、CD45、CD64、CD80、CD86、CD134、CD137、CD152、CD154、AMN和PD-1。
在特定实施例中,细胞内信号传导结构域选自由以下组成的组:含有初级信号传导结构域和/或共刺激结构域的ITAM。
在特定实施例中,细胞内信号传导结构域选自由以下组成的组:FcRγ、FcRβ、CD3γ、CD3δ、CD3ε、CD3ζ、CD22、CD79a、CD79b和CD66d。
在特定实施例中,细胞内信号传导结构域选自由以下组成的组:TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10、CARD11、CD2、CD7、CD27、CD28、CD30、CD40、CD54(ICAM)、CD83、CD134(OX40)、CD137(4-1BB)、CD278(ICOS)、DAP10、LAT、NKD2C、SLP76、TRIM和ZAP70。
在一个实施例中,嵌合细胞因子受体包括选自由CD28、CD137和CD134组成的组的一个或多个共刺激信号传导结构域以及CD3ζ初级信号传导结构域。
F.多肽
本文设想了各种多肽,包含但不限于归巢核酸内切酶变体、megaTAL和融合多肽。在优选实施例中,多肽包括SEQ ID NO:1-10中所示的氨基酸序列。除非相反地指出,否则“多肽”、“多肽片段”、“肽”和“蛋白质”可互换使用,并且根据常规含义,即作为氨基酸序列。在一个实施例中,“多肽”包含融合多肽和其它变体。可以使用多种熟知的重组和/或合成技术中的任一种来制备多肽。多肽不限于特定长度,例如,其可以包括全长蛋白质序列、全长蛋白质片段或融合蛋白质,并且可以包含多肽的转译后修饰,例如,糖基化、乙酰化、磷酸化等以及本领域已知的天然存在的和非天然存在的其它修饰。
如本文所用,“分离的蛋白质”、“分离的肽”或“分离的多肽”等是指从细胞环境中并且根据与细胞的其它组分的关联进行体外合成、分离和/或纯化而来的肽或多肽分子,即与体内物质没有显著关联。
在特定实施例中设想的多肽的说明性实例包含但不限于归巢核酸内切酶变体、megaTAL、末端加工核酸酶、融合多肽及其变体。
多肽包含“多肽变体”。多肽变体与天然存在的多肽的不同之处可以在于一个或多个氨基酸取代、缺失、添加和/或插入。这些变体可以是天然存在的或可以通过合成产生,例如通过修饰上述多肽序列的一个或多个氨基酸。例如,在特定实施例中,可能期望通过将一个或多个取代、缺失、添加和/或插入引入到多肽中来改善结合并切割TGFβR2基因中的靶位点的归巢核酸内切酶、megaTAL等的生物学特性。在特定实施例中,多肽包含与本文所设想的任何参考序列具有至少约65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%氨基酸一致性的多肽,通常其中变体维持参考序列的至少一种生物活性。
多肽变体包含具有生物活性的“多肽片段”。具有生物活性的多肽片段的说明性实例包含DNA结合结构域、核酸酶结构域等。如本文所用,术语“生物活性片段”或“最小生物活性片段”是指保留天然存在的多肽活性的至少100%、至少90%、至少80%、至少70%、至少60%、至少50%、至少40%、至少30%、至少20%、至少10%或至少5%的多肽片段。在优选实施例中,生物活性是靶序列的结合亲和力和/或切割活性。在某些实施例中,多肽片段可以包括长度为至少5到约1700个氨基酸的氨基酸链。应当理解的是,在某些实施例中,片段长度为至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、110个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、1100个、1200个、1300个、1400个、1500个、1600个、1700个或更多个氨基酸。在特定实施例中,多肽包括归巢核酸内切酶变体的生物活性片段。在特定实施例中,本文所示的多肽可以包括一个或多个表示为“X”的氨基酸。如果存在于氨基酸SEQ IDNO中,则“X”指代任何氨基酸。一个或多个“X”残基可以存在于本文所设想的SEQ ID NO所具体阐述的氨基酸序列的N末端和C末端处。如果“X”氨基酸不存在,则SEQ ID NO中所示的剩余氨基酸序列可以被认为是生物活性片段。
在特定实施例中,多肽包括归巢核酸内切酶变体的生物活性片段,例如SEQ IDNO:3-7或megaTAL(SEQ ID NO:8-9)。生物活性片段可以包括N末端截短和/或C末端截短。在特定实施例中,与对应的野生型归巢核酸内切酶序列相比,生物活性片段缺乏或包括归巢核酸内切酶变体的1个、2个、3个、4个、5个、6个、7个或8个N末端氨基酸的缺失,更优选地与对应的野生型归巢核酸内切酶序列相比归巢核酸内切酶变体的4个N末端氨基酸的缺失。在特定实施例中,与对应的野生型归巢核酸内切酶序列相比,生物活性片段缺乏或包括归巢核酸内切酶变体的1个、2个、3个、4个或5个C末端氨基酸的缺失,更优选地与对应的野生型归巢核酸内切酶序列相比归巢核酸内切酶变体的2个C末端氨基酸的缺失。在特定优选实施例中,与对应的野生型归巢核酸内切酶序列相比,生物活性片段缺乏或包括归巢核酸内切酶变体的4个N末端氨基酸和2个C末端氨基酸的缺失。
在特定实施例中,I-OnuI变体包括:以下N末端氨基酸的1个、2个、3个、4个、5个、6个、7个或8个的缺失:M、A、Y、M、S、R、R、E;和/或以下1个、2个、3个、4个或5个C末端氨基酸的缺失:R、G、S、F、V。
在特定实施例中,I-OnuI变体包括:以下N末端氨基酸的1个、2个、3个、4个、5个、6个、7个或8个的缺失或取代:M、A、Y、M、S、R、R、E;和/或以下1个、2个、3个、4个或5个C末端氨基酸的缺失或取代:R、G、S、F、V。
在特定实施例中,I-OnuI变体包括:以下N末端氨基酸的1个、2个、3个、4个、5个、6个、7个或8个的缺失:M、A、Y、M、S、R、R、E;和/或以下1个或2个C末端氨基酸的缺失:F、V。
在特定实施例中,I-OnuI变体包括:以下N末端氨基酸的1个、2个、3个、4个、5个、6个、7个或8个的缺失或取代:M、A、Y、M、S、R、R、E;和/或以下1个或2个C末端氨基酸的缺失或取代:F、V。
如上所述,多肽可以以多种方法改变,包含氨基酸取代、缺失、截短和插入。用于此类操纵的方法是本领域所公知的。例如,参考多肽的氨基酸序列变体可以通过DNA中的突变来制备。用于诱变和核苷酸序列改变的方法是本领域众所周知的。参见,例如,Kunkel(1985,《美国国家科学院院刊》,82:488-492),Kunkel等人,(1987,《酶学方法(Methods inEnzymol)》,154:367-382)美国专利号4,873,192,Watson,J.D等人,(《基因的分子生物学(Molecular Biology of the Gene》),第四版,本加民/卡姆明出版社(Benjamin/Cummings),加利福尼亚州门洛帕克市,1987)以及其中引用的参考文献。关于不影响所关注蛋白质的生物活性的适当的氨基酸取代的指导可以在Dayhoff等人,(1978)《蛋白序列和结构图谱(Atlas of Protein Sequence and Structure)》(美国国家生物医学研究基金会(Natl.Biomed.Res.Found.,华盛顿特区)的模型中找到。
在某些实施例中,变体将含有一个或多个保守取代。“保守取代”是其中一个氨基酸被具有类似特性的另一个氨基酸取代使得肽化学领域的技术人员将预期多肽的次级结构和亲水性质基本上不变的取代。可以对特定实施例中所设想的多核苷酸和多肽的结构中进行修改,多肽包含具有至少约并且仍然获得对具有期望特性的变体或衍生多肽进行编码的功能分子的多肽。当期望改变多肽的氨基酸序列以产生等同的或甚至改进的变体多肽时,本领域技术人员例如可以例如根据表1改变编码DNA序列的密码子中的一个或多个。
表1-氨基酸密码子
可以使用如DNASTAR、DNA Strider、Geneious、Mac Vector或Vector NTI软件等本领域熟知的计算机程序发现在没有消除生物活性的情况下确定哪些氨基酸残基可以被取代、插入或缺失的指南。优选地,本文公开的蛋白质变体的氨基酸改变是保守氨基酸改变,即带相似电荷或不带电荷的氨基酸的取代。保守氨基酸改变涉及在其侧链方面相关的氨基酸家族之一的取代。天然存在的氨基酸通常分为四个家族:酸性氨基酸(天冬氨酸、谷氨酸)、碱性氨基酸(赖氨酸、精氨酸、组氨酸)、非极性氨基酸(丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)和极性不带电氨基酸(甘氨酸、天冬酰胺、谷胺酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸)。有时将苯丙氨酸、色氨酸和酪氨酸一起分类为芳族氨基酸。在肽或蛋白质中,氨基酸的适合的保守取代对本领域技术人员而言是熟知的并且通常可以在不改变所得到的分子的生物活性的情况下进行。本领域技术人员认识到,一般而言,在多肽的非必要区域中单个氨基酸取代基本上不改变生物活性(参见,例如,Watson等人《基因的分子生物学》,第4版,1987,本杰明/卡明斯出版公司(Benjamin/CummingsPubCo.),第224页)。
在一个实施例中,在期望表达两个或更多个多肽的情况下,如本文其它地方所公开的,对其进行编码的多核苷酸序列可以通过IRES序列分开。
特定实施例中设想的多肽包含融合多肽。在特定实施例中,提供了融合多肽和编码融合多肽的多核苷酸。融合多肽和融合蛋白是指具有至少两个、三个、四个、五个、六个、七个、八个、九个或十个多肽片段的多肽。
在另一个实施例中,可以将两个或更多个多肽表达为包括如本文其它地方公开的一个或多个自切割多肽序列的融合蛋白。
在一个实施例中,本文设想的融合蛋白包括一个或多个DNA结合结构域和一个或多个核酸酶,以及一个或多个连接子和/或自切割多肽。
在一个实施例中,本文设想的融合蛋白包括核酸酶变体;连接子或自切割肽;以及包含但不限于5'-3'核酸外切酶、5'-3'碱性核酸外切酶和3'-5'核酸外切酶(例如,Trex2)的末端加工酶。
融合多肽可以包括一个或多个多肽结构域或片段,包括但不限于信号肽、细胞渗透性肽结构域(CPP)、DNA结合结构域、核酸酶结构域等、表位标签(例如,麦芽糖结合蛋白(“MBP”)、谷胱甘肽S转移酶(GST)、HIS6、MYC、FLAG、V5、VSV-G和HA)、多肽连接子和多肽切割信号。融合多肽通常是C末端与N末端连接的,但其也可以是C末端与C末端、N末端与N末端或N末端与C末端连接的。在特定实施例中,融合蛋白的多肽可以呈任何顺序。融合多肽或融合蛋白还可以包含保守修饰的变体、多态变体、等位基因、突变体、子序列以及种间同源物,只要保留融合多肽的期望活性即可。融合多肽可以通过化学合成方法或通过两个部分之间的化学连接产生,或者通常可以使用其它标准技术制备。包括融合多肽的连接DNA序列可操作地连接到如本文其它地方所公开的适当的转录或翻译控制元件。
融合多肽可以任选地包括可以用于连接多肽内的一个或多个多肽或结构域的连接子。肽连接子序列可以用于将任何两个或更多个多肽组分分开足够的距离,以确保每个多肽折叠成其适当的次级结构和三级结构,以便使多肽结构域发挥其期望功能。使用本领域的标准技术将这种肽连接子序列并入到融合多肽中。可以基于以下因素选择适当的肽连接子序列:(1)其能够采用灵活的扩展构象;(2)其不能采用可以与第一多肽和第二多肽上的功能性表位相互作用的次级结构;以及(3)缺乏可以与多肽功能性表位反应的疏水残基或带电残基。优选的肽连接子序列含有Gly、Asn和Ser残基。还可以在连接子序列中使用其它近中性氨基酸,如Thr和Ala。可以有效地用作连接子的氨基酸序列包含以下各项中公开的氨基酸序列:Maratea等人,《基因(Gene)》40:39-46,1985;Murphy等人,《美国国家科学院院刊》83:8258-8262,1986;美国专利号4,935,233和美国专利号4,751,180。当特定融合多肽片段含有可以用于分离功能结构域和防止空间干扰的非必需N-末端氨基酸区时,不需要连接子序列。优选的连接子通常是被合成为重组融合蛋白的一部分的柔性氨基酸子序列。连接子多肽的长度可以为1个与200个氨基酸之间、长度可以为1个与100个氨基酸之间或者长度可以为1个与50个氨基酸之间,包含其间的所有整数值。
示例性连接子包含但不限于以下氨基酸序列:甘氨酸聚合物(G)n;甘氨酸-丝氨酸聚合物(G1-5S1-5)n,其中n是至少为一、二、三、四或五的整数;甘氨酸-丙氨酸聚合物;丙氨酸-丝氨酸聚合物;GGG(SEQ ID NO:23);DGGGS(SEQ ID NO:24);TGEKP(SEQ ID NO:25)(参见例如,Liu等人,《美国国家科学院院刊》5525-5530(1997));GGRR(SEQ ID NO:26)(Pomerantz等人1995,同上);(GGGGS)n其中n=1、2、3、4或5(SEQ ID NO:27)(Kim等人,《美国国家科学院院刊》93,1156-1160(1996);EGKSSGSGSESKVD(SEQ ID NO:28)(Chaudhary等人,1990,《美国国家科学院刊》87:1066-1070);KESGSVSSEQLAQFRSLD(SEQ ID NO:29)(Bird等人,1988,《科学》,242:423-426),GGRRGGGS(SEQ ID NO:30);LRQRDGERP(SEQ ID NO:31);LRQKDGGGSERP(SEQ ID NO:32);LRQKD(GGGS)2ERP(SEQ ID NO:33)。可替代地,可以使用能够对DNA结合位点和肽本身两者进行建模的计算机程序(Desjarlais和Berg,《美国国家科学院刊》90:2256-2260(1993),《美国国家科学院刊》91:11099-11103(1994)或通过噬菌体展示方法合理地设计柔性连接子。
融合多肽可以进一步包括本文所描述的各个多肽结构域之间或内源性开放阅读框与供体修复模板编码的多肽之间的多肽切割信号。另外,可以将多肽切割位点置于任何连接子肽序列中。示例性多肽切割信号包含多肽切割识别位点,如蛋白酶切割位点、核酸酶切割位点(例如,稀有限制酶识别位点、自切割核酶识别位点)和自切割病毒寡肽(参见Felipe和Ryan,2004.《转运(Traffic)》,5(8);616-26)。
合适的蛋白酶切割位点和自切割肽对于本领域的技术人员来说是已知的(参见例如,Ryan等人,1997.《普通病毒学期刊(J.Gener.Virol.)》78,699-722;Scymczak等人(2004)《自然生物技术(Nature Biotech.)》5,589-594)。示例性蛋白酶切割位点包含但不限于马铃薯Y病毒NIa蛋白酶(例如,烟草蚀纹病毒蛋白酶)、马铃薯Y病毒HC蛋白酶、马铃薯Y病毒P1(p35)蛋白酶、副病毒NIa蛋白酶、副病毒RNA-2编码蛋白酶、口疮病毒L蛋白酶、肠道病毒2A蛋白酶、鼻病毒2A蛋白酶、核糖酸3C蛋白酶、豇豆花叶病毒24K蛋白酶、线虫传多面体病毒24K蛋白酶、RTSV(水稻东格鲁球形病毒)3C样蛋白酶、PYVF(欧洲防风黄点病毒)3C样蛋白酶、肝素、凝血酶、因子Xa以及肠激酶的切割位点。由于其高的切割严格性,在一个实施例中优选的是TEV(烟草蚀纹病毒)蛋白酶切割位点,例如EXXYXQ(G/S)(SEQ ID NO:34),例如ENLYFQG(SEQ ID NO:35)和ENLYFQS(SEQ ID NO:36),其中X表示任何氨基酸(通过TEV进行的切割发生在Q与G或Q与S之间)。
在某些实施例中,自切割多肽位点包括2A或2A样位点、序列或结构域(Donnelly等人,2001.《普通病毒学期刊(J.Gener.Virol.)》82:1027-1041)。在特定实施例中,病毒2A肽是口疮病毒2A肽、马铃薯Y病毒2A肽或心脏病毒2A肽。
在一个实施例中,病毒2A肽选自由以下组成的组:口蹄疫病毒(FMDV)(F2A)肽、马A型鼻炎病毒(ERAV)(E2A)肽、Thosea asigna病毒(TaV)(T2A)肽、猪捷申病毒-1(PTV-1)(P2A)肽、泰勒病毒2A肽以及脑心肌炎病毒2A肽。
表2中提供了2A位点的说明性实例。
表2:示例性2A位点包含以下序列:
G.多核苷酸
在特定实施例中,提供了编码本文所设想的一个或多个归巢核酸内切酶变体、megaTAL、末端加工酶和融合多肽的多核苷酸。如本文所使用,术语“多核苷酸”或“核酸”是指脱氧核糖核酸(DNA)、核糖核酸(RNA)和DNA/RNA杂合体。多核苷酸可以是单链或双链的并且可以是重组的、合成的或分离的。多核苷酸包含但不限于:前信使RNA(前-mRNA)、信使RNA(mRNA)、RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、基因组RNA(gRNA)、正链RNA(RNA(+))、负链RNA(RNA(-))、tracrRNA、crRNA、单指导RNA(sgRNA)、合成RNA、合成mRNA、基因组DNA(gDNA)、PCR扩增DNA、互补DNA(cDNA)、合成DNA或重组DNA。多核苷酸是指长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少1000个、至少5000个、至少10000个或至少15000个或更多个核苷酸的核苷酸的聚合形式,或者是核糖核苷酸或脱氧核糖核苷酸或者是任一类型核苷酸的修饰形式,以及所有中间长度。容易理解的是,在此上下文中,“中间长度”是指所引用值之间的任何长度,如6、7、8、9等,101、102、103等;151、152、153等;201、202、203等。在特定实施例中,多核苷酸或变体与参考序列具有至少或约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列一致性。
在特定实施例中,多核苷酸可以是密码子优化的。如本文所使用的,术语“密码子优化的”是指取代编码多肽的多核苷酸中的密码子以增加多肽的表达、稳定性和/或活性。影响密码子优化的因素包含但不限于以下中的一种或多种:(i)两个或更多个生物体或基因或合成地构成的密码子偏倚表格之间的密码子偏倚变化;(ii)生物体、基因或基因组内的密码子偏倚度变化;(iii)包含上下文的密码子的系统性变异;(iv)密码子根据其解码tRNA的变化;(v)密码子根据GC%总体上或在三联体中的一个位置处的变化;(vi)与参考序列例如天然存在的序列的相似度变化;(vii)密码子频率截止值的变化;(viii)从DNA序列转录的mRNA的结构性质;(ix)关于设计密码子取代组所基于的DNA序列的功能的先验知识;(x)每个氨基酸的密码子组的系统变化和/或(xi)假性翻译起始位点的分离的去除。
如本文所使用的,术语“核苷酸”是指在N-糖苷中与磷酸化糖连接的杂环含氮碱基。核苷酸被理解成包含天然碱基和多种多样的本领域所认可的经过修饰的碱基。这种碱基通常位于核苷酸糖部分的1'位置。核苷酸通常包括碱、糖和磷酸基团。在核糖核酸(RNA)中,糖为核糖,并且在脱氧核糖核酸(DNA)中,糖为脱氧核糖,即存在于核糖中的缺少羟基的糖。示例性天然含氮碱基包含嘌呤、腺苷(A)和胍(G)、和嘧啶、胞苷(C)和胸苷(T)(或在RNA、尿嘧啶(U)的背景下)。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。核苷酸通常是单磷酸、二磷酸或三磷酸。可以在糖、磷酸和/或碱基部分不修饰或修饰核苷酸(也互换地称为核苷酸类似物、核苷酸衍生物、经过修饰的核苷酸、非天然核苷酸和非标准核苷酸;参见例如,WO 92/07065和WO 93/15187)。Limbach等人,(1994,《核酸研究(Nucleic Acids Res.)》22,2183-2196)总结了经过修饰的核酸碱基的实例。
核苷酸也可以被认为是核苷的磷酸酯,其中酯化发生在与糖的C-5连接的羟基上。如本文所使用的,术语“核苷”是指在N-糖苷中与糖连接的杂环含氮碱基。核苷在本领域中被认为包含天然碱基,并且还包含众所周知的经过修饰的碱基。这种碱基通常位于核苷糖部分的1'位置。核苷通常包括碱基和糖基团。可以在糖和/或碱基部分不修饰或修饰核苷(也互换地称为核苷类似物、核苷衍生物、经过修饰的核苷、非天然核苷或非标准核苷)。也如上文所述,Limbach等人,(1994,《核酸研究》22,2183-2196)总结了经过修饰的核酸碱基的实例。
多核苷酸的说明性实例包含但不限于编码SEQ ID NO:1-10的多核苷酸,和SEQ IDNO:11-20中所示的多核苷酸序列。
在各个说明性实施例中,本文所设想的多核苷酸包含但不限于编码归巢核酸内切酶变体、megaTAL、末端加工酶、融合多肽的多核苷酸以及包括本文所设想的多核苷酸的表达载体、病毒载体和转移质粒。
如本文所使用的,术语“多核苷酸变体”和“变体”等是指显示出与参考多核苷酸序列或在下文限定的严格条件下和参考序列杂交的多核苷酸具有实质性序列一致性的多核苷酸。这些术语还涵盖通过至少一个核苷酸的添加、缺失、取代或修饰而区别于参考多核苷酸的多核苷酸。因此,术语“多核苷酸变体”和“变体”包含其中已经添加或缺失、或修饰或用不同核苷酸代替一个或多个核苷酸的多核苷酸。在这方面,本领域中充分理解的是,可以对参考多核苷酸作出包括突变、添加、缺失以及取代在内的某些改变,由此所改变的多核苷酸保留所述参考多核苷酸的生物功能或活性。
在一个实施例中,多核苷酸包括在严格条件下与靶核酸序列杂交的核苷酸序列。在“严格条件”下杂交描述了其中彼此至少60%完全相同的核苷酸序列保持杂交的杂交方案。通常,严格条件在限定的离子强度和pH下被选择为比特定序列的热熔点(Tm)低约5℃。Tm是平衡时与靶序列互补的探针有50%与靶序列杂交的温度(在限定的离子强度、PH和核酸浓度下)。由于靶序列在Tm下通常过量存在,所以所述探针的50%在平衡时被占据。
如本文所使用的,陈述“序列一致性”或例如包括“与……50%一致的序列”是指在一个比较窗口内,在逐核苷酸的基础上或在逐氨基酸的基础上序列一致的程度。因此,“序列一致性百分比”可以通过以下方式计算:在所述比较窗口内比较两个经最佳比对的序列,确定在这两个序列中出现一致的核酸碱基(例如,A、T、C、G、I)或一致的氨基酸残基(例如,Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys以及Met)的位置的数目,从而得到匹配位置的数目,将所述匹配位置的数目除以所述比较窗口中的位置的总数目(即,窗口大小),并且将结果乘以100以得到序列一致性百分比。包含了与本文所描述的任何参考序列具有至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列一致性的核苷酸和多肽,通常其中多肽变体保持参考多肽的至少一种生物活性。
用于描述两个或更多个多核苷酸或多肽之间的序列关系的术语包含“参考序列”、“比较窗口”、“序列一致性”、“序列一致性百分比”以及“实质性一致性”。“参考序列”的长度为至少12个、但通常为15个到18个,并且通常为至少25个单体单元,包含核苷酸和氨基酸残基。因为两个多核苷酸各自可以包括(1)在所述两个多核苷酸之间类似的序列(即,仅完整多核苷酸序列的一部分),以及(2)在所述两个多核苷酸之间存在差异的序列,通常通过在“比较窗口”内比较所述两个多核苷酸的序列执行两个(或更多个)多核苷酸之间的序列比较以识别和比较具有序列相似性的局部区。“比较窗口”是指至少6个连续位置的概念性片段,通常为约50个到约100个,更通常为约100个到约150个,其中在所述两个序列最佳比对后将序列与相同数目的连续位置的参考序列进行比较。比较窗口可以包括与参考序列(其不包括添加或缺失)相比约20%或更少的添加或缺失(即,缺口)以实现所述两个序列的最佳比对。用于比对比较窗口的序列的最佳比对可以通过算法的计算机化实施方式(美国威斯康星州575Science Drive Madison,遗传学计算机组(Genetics Computer Group),威斯康星遗传学软件包发布(Wisconsin Genetics Software Package Release)7.0中的GAP、BESTFIT、FASTA和TFASTA)或通过检查和由所选择的各种方法中的任何一种产生的最佳比对(即,导致比较窗口内的最高百分比同源性)来进行。还可以参考如例如在Altschul等人,1997,《核酸研究》25:3389中公开的BLAST程序家族。序列分析的详细论述可以见于Ausubel等人,《当代分子生物学实验手册》,约翰威立父子公司(John Wiley&Sons,Inc.),1994-1998,第15章的第19.3单元。
如本文所使用的,“分离的多核苷酸”是指已经从其两侧的处于天然存在状态的序列纯化的多核苷酸,例如,已经从通常与其相邻的序列移除的DNA片段。在特定实施例中,“分离的多核苷酸”是指互补DNA(cDNA)、重组多核苷酸、合成多核苷酸或自然中不存在并且已经通过人手制造的其它多核苷酸。
在各个实施例中,多核苷酸包括编码本文所设想的多肽的mRNA,所述多肽包含但不限于归巢核酸内切酶变体、megaTAL和末端加工酶。在某些实施例中,mRNA包括帽、一个或多个核苷酸和poly(A)尾。
如本文所使用的,术语“5'帽”或“5'帽结构”或“5'帽部分”是指化学修饰,其已掺入mRNA的5'末端。在核输出、mRNA稳定性和翻译中涉及5'帽。
在特定实施例中,本文所设想的mRNA包括5'帽,其包括在末端鸟苷帽残基与mRNA分子的5'-末端转录有义核苷酸之间连接的5'-ppp-5'-三磷酸。然后可以将此5'-鸟苷酸帽甲基化以产生N7-甲基-鸟苷酸残基。
适合于在本文所设想的mRNA多核苷酸的特定实施例中使用的5'帽的说明性实例包含但不限于:未甲基化的5'帽类似物,例如,G(5')ppp(5')G、G(5')ppp(5')C、G(5')pp(5')A;甲基化的5'帽类似物,例如,m7G(5')ppp(5')G、m7G(5')ppp(5')C和m7G(5')ppp(5')A;二甲基化的5'帽类似物,例如,m2,7G(5')ppp(5')G、m2,7G(5')ppp(5')C和m2,7G(5')ppp(5')A;三甲基化的5'帽类似物,例如,m2,2,7G(5')ppp(5')G、m2,2,7G(5')ppp(5')C和m2,2,7G(5')ppp(5')A;二甲基化的对称5'帽类似物,例如,m7G(5')pppm7(5')G、m7G(5')pppm7(5')C和m7G(5')pppm7(5')A;以及抗反向5'帽类似物,例如,抗反向帽类似物(ARCA)帽、指定3'O-Me-m7G(5')ppp(5')G、2'O-Me-m7G(5')ppp(5')G、2'O-Me-m7G(5')ppp(5')C、2'O-Me-m7G(5')ppp(5')A、m72'd(5')ppp(5')G、m72'd(5')ppp(5')C、m72'd(5')ppp(5')A、3'O-Me-m7G(5')ppp(5')C、3'O-Me-m7G(5')ppp(5')A、m73'd(5')ppp(5')G、m73'd(5')ppp(5')C、m73'd(5')ppp(5')A及其四磷酸衍生物)(参见例如,Jemielity等人,RNA,9:1108-1122(2003))。
在特定实施例中,mRNA包括通过三磷酸桥连接至第一转录核苷酸的5'-末端的为7-甲基鸟苷酸(“m7G”)的5'帽,产生m7G(5')ppp(5')N,其中N为任何核苷。
在一些实施例中,mRNA包括5'帽,其中帽是Cap0结构(Cap0结构缺少与碱基1和碱基2连接的核糖的2'-O-甲基残基)、Cap1结构(Cap1结构在碱基2处具有2'-O-甲基)或Cap2结构(Cap2结构具有与碱基2和碱基3连接的2'-O-甲基残基)。
在一个实施例中,mRNA包括m7G(5')ppp(5')G帽。
在一个实施例中,mRNA包括ARCA帽。
在特定实施例中,本文所设想的mRNA包括一个或多个经过修饰的核苷。
在一个实施例中,mRNA包括选自由以下组成的组的一个或多个经过修饰的核苷:假尿苷、吡啶-4-酮核糖核、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧甲基-尿苷、1-羧甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酰甲基尿苷、1-牛磺酰甲基-假尿苷、5-牛磺酰甲基-2-硫代尿苷、1-牛磺酰甲基-4-硫代尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代二氢尿苷、2-硫代二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫代-假尿苷、5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲基胞苷、N4-甲基胞苷、5-羟甲基胞苷、1-甲基-假异胞苷、吡咯并胞苷、吡咯并假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、折布拉林(zebularine)、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷、4-甲氧基-1-甲基-假异胞苷、2-氨基嘌呤、2,6-二氨基嘌呤、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基嘌呤、7-脱氮-8-氮杂-2-氨基嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰基氨基甲酰基腺苷、N6-苏氨酰氨基甲酰基腺苷、2-甲硫基-N6-苏氨酰氨基甲酰腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤、2-甲氧基-腺嘌呤、肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-脱氮-鸟苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷以及N2,N2-二甲基-6-硫代-鸟苷。
在一个实施例中,mRNA包括选自由以下组成的组的一个或多个经过修饰的核苷:假尿苷、吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酰甲基尿苷、1-牛磺酰甲基-假尿苷、5-牛磺酰甲基-2-硫代-尿苷、1-牛磺酰甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷以及4-甲氧基-2-硫代-假尿苷。
在一个实施例中,mRNA包括选自由以下组成的组的一个或多个经过修饰的核苷:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟甲基胞苷、1-甲基-假异胞苷、吡咯并胞苷、吡咯并假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、折布拉林、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷以及4-甲氧基-1-甲基-假异胞苷。
在一个实施例中,mRNA包括选自由以下组成的组的一个或多个经过修饰的核苷:2-氨基嘌呤、2,6-二氨基嘌呤、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基嘌呤、7-脱氮-8-氮杂-2-氨基嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨基甲酰基腺苷、N6-苏氨酰氨基甲酰基腺苷、2-甲硫基-N6-苏氨酰氨基甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤以及2-甲氧基-腺嘌呤。
在一个实施例中,mRNA包括选自由以下组成的组的一个或多个经过修饰的核苷:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-脱氮-鸟苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷以及N2,N2-二甲基-6-硫代-鸟苷。
在一个实施例中,mRNA包括一个或多个假尿苷、一个或多个5-甲基-胞嘧啶和/或一个或多个5-甲基-胞苷。
在一个实施例中,mRNA包括一个或多个假尿苷。
在一个实施例中,mRNA包括一个或多个5-甲基-胞苷。
在一个实施例中,mRNA包括一个或多个5-甲基-胞嘧啶。
在特定实施例中,本文所设想的mRNA包括poly(A)尾,以帮助保护mRNA免于核酸外切酶降解、稳定mRNA并且促进翻译。在某些实施例中,mRNA包括3'poly(A)尾结构。
在特定实施例中,poly(A)尾的长度为至少约10个、25个、50个、75个、100个、150个、200个、250个、300个、350个、400个、450个或至少约500个或更多个腺嘌呤核苷酸或者任何中间数量的腺嘌呤核苷酸。在特定实施例中,poly(A)尾的长度为至少约125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个、137个、138个、139个、140个、141个、142个、143个、144个、145个、146个、147个、148个、149个、150个、151个、152个、153个、154个、155个、156个、157个、158个、159个、160个、161个、162个、163个、164个、165个、166个、167个、168个、169个、170个、171个、172个、173个、174个、175个、176个、177个、178个、179个、180个、181个、182个、183个、184个、185个、186个、187个、188个、189个、190个、191个、192个、193个、194个、195个、196个、197个、198个、199个、200个、201个、202个、202个、203个、205个、206个、207个、208个、209个、210个、211个、212个、213个、214个、215个、216个、217个、218个、219个、220个、221个、222个、223个、224个、225个、226个、227个、228个、229个、230个、231个、232个、233个、234个、235个、236个、237个、238个、239个、240个、241个、242个、243个、244个、245个、246个、247个、248个、249个、250个、251个、252个、253个、254个、255个、256个、257个、258个、259个、260个、261个、262个、263个、264个、265个、266个、267个、268个、269个、270个、271个、272个、273个、274个或275个或更多个腺嘌呤核苷酸。
在特定实施例中,poly(A)尾的长度为约10个到约500个腺嘌呤核苷酸、约50个到约500个腺嘌呤核苷酸、约100个到约500个腺嘌呤核苷酸、约150个到约500个腺嘌呤核苷酸、约200个到约500个腺嘌呤核苷酸、约250个到约500个腺嘌呤核苷酸、约300个到约500个腺嘌呤核苷酸、约50个个约450个腺嘌呤核苷酸、约50个到约400个腺嘌呤核苷酸、约50个到约350个腺嘌呤核苷酸、约100个到约500个腺嘌呤核苷酸、约100个到约450个腺嘌呤核苷酸、约100个到约400个腺嘌呤核苷酸、约100个到约350个腺嘌呤核苷酸、约100个到约300个腺嘌呤核苷酸、约150个到约500个腺嘌呤核苷酸、约150个到约450个腺嘌呤核苷酸、约150个到约400个腺嘌呤核苷酸、约150个到约350个腺嘌呤核苷酸、约150个到约300个腺嘌呤核苷酸、约150个到约250个腺嘌呤核苷酸、约150个到约200个腺嘌呤核苷酸、约200个到约500个腺嘌呤核苷酸、约200个到约450个腺嘌呤核核苷酸、约200个到约400个腺嘌呤核苷酸、约200个到约350个腺嘌呤核苷酸、约200个到约300个腺嘌呤核苷酸、约250个到约500个腺嘌呤核苷酸、约250个到约450个腺嘌呤核苷酸、约250个到约400个腺嘌呤核苷酸、约250个到约350个腺嘌呤核苷酸或约250个到约300个腺嘌呤核苷酸或者任何中间范围的腺嘌呤核苷酸。
描述多核苷酸取向的术语包含:5'(通常是具有游离磷酸基团的多核苷酸的末端)和3'(通常是具有游离羟基(OH)基团的多核苷酸的末端)。多核苷酸序列可以以5'-3'取向或3'-5'取向注释。对于DNA和mRNA,5'-3'链被指定为“有义”链、“正”链或“编码”链,因为其序列与前信使(前mRNA)的序列是一致的[RNA中的尿嘧啶(U)而非DNA中的胸腺嘧啶(T)除外]。对于DNA和mRNA,作为由RNA聚合酶转录的链的互补3'-5'链被指定为“模板”链、“反义”链、“负”链或“非编码”链。如本文所使用的,术语“相反取向”是指以3'-5'取向书写的5'-3'序列或以5'-3'取向书写的3'-5'序列。
术语“互补”和“互补性”是指通过碱基配对规则相关的多核苷酸(即,核苷酸序列)。例如,DNA序列5'A G T C A T G 3'的互补链是3'T C A G T A C 5'。后一序列通常被书写为左边是5'末端并且右边是3'末端的反向互补体5'C A T G A C T 3'。与其反向互补序列相等的序列被称为回文序列。互补性可以是“部分的”,其中根据碱基配对规则仅匹配一些核酸碱基。或者,核酸之间可以存在“完全”或“全部”的互补性。
如本文所使用的术语“核酸盒”或“表达盒”是指载体内可以表达RNA和随后表达多肽的基因序列。在一个实施例中,核酸盒含有一个或多个所关注基因,例如一个或多个所关注多核苷酸。在另一个实施例中,核酸盒含有一个或多个表达控制序列,例如,启动子、增强子、poly(A)序列和一个或多个所关注基因,例如,一个或多个所关注多核苷酸。载体可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个核酸盒。核酸盒在载体内定位且顺序地取向,使得可以将盒中的核酸转录成RNA并在必要时转译成蛋白质或多肽、经历在转化细胞中具有活性所需的适当的转译后修饰并且通过将适合的细胞内隔区靶向细胞外隔区或分泌到细胞外隔区而易位到适合的隔区以具有生物活性。优选地,盒使其3'末端和5'末端适于准备插入到载体中,例如,其在每一末端均具有限制性核酸内切酶位点。在优选实施例中,核酸盒含有用于治疗、预防或改善遗传性障碍的治疗基因的序列。盒可以作为单个单元移除和插入到质粒或病毒载体中。
多核苷酸包含一个或多个所关注多核苷酸。如本文所使用的,术语“所关注多核苷酸”是指对多肽或融合多肽进行编码的多核苷酸或充当用于转录抑制性多核苷酸的模板的多核苷酸,如本文所设想的。
此外,本领域的普通技术人员应理解,由于遗传密码的简并性,存在许多可以对多肽或其变体片段进行编码的核苷酸序列,如本文所设想的。这些多核苷酸中的一些与任何天然基因的核苷酸序列具有最小的同源性。尽管如此,在特定实施例中特别设想了由于密码子使用的差异而变化的多核苷酸,例如针对人类和/或灵长类动物密码子选择而优化的多核苷酸。在一个实施例中,提供了包括特定等位基因序列的多核苷酸。等位基因是内源多核苷酸序列,所述内源多核苷酸序列由于如核苷酸的缺失、添加和/或取代等一个或多个突变而改变。
在某个实施例中,所关注多核苷酸包括供体修复模板。
在某个实施例中,所关注多核苷酸包括抑制性多核苷酸,其包含但不限于siRNA、miRNA、shRNA、核酶或另一种抑制性RNA。
在一个实施例中,包括抑制性RNA的供体修复模板包括一个或多个调节序列,如例如强组成性pol III,例如,如本文其它地方所描述的人类或小鼠U6snRNA启动子、人类和小鼠H1RNA启动子、或人类tRNA-val启动子或强组成性pol II启动子。
无论编码序列本身的长度如何,如本文其它地方所公开或如本领域已知的,在特定实施例中设想的多核苷酸可以与其它DNA序列组合,如启动子和/或增强子、未转译区域(UTR)、Kozak序列、多腺苷酸化信号、另外的限制酶位点、多个克隆位点、内部核糖体进入位点(IRES)、重组酶识别位点(例如,LoxP、FRT和Att位点)、终止密码子、转录终止信号、转录后应答元件以及编码自切割多肽的多核苷酸、表位标签,从而使得其整体长度可以显著变化。因此在特定的实施例中设想的是,可以采用几乎任何长度的多核苷酸片段,其总长度优选地受制备的容易性和在预期的重组DNA方案中的使用的限制。
可以使用本领域已知和可获得的各种成熟技术中的任何一种来制备、操纵、表达和/或递送多核苷酸。为了表达期望的多肽,可以将编码多肽的核苷酸序列插入适当的载体中。还可以通过将编码多肽的mRNA递送到细胞中来表达期望的多肽。
载体的说明性实例包含但不限于质粒、自主复制序列和转座元件,例如睡美人(Sleeping Beauty)、PiggyBac。
载体的另外的说明性实例包含但不限于质粒、噬菌粒、粘粒、人工染色体如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1衍生的人工染色体(PAC)、如λ噬菌体或M13噬菌体等噬菌体以及动物病毒。
可用作载体的病毒的说明性实例包含但不限于逆转录病毒(包含慢病毒)、腺病毒、腺相关病毒、疱疹病毒(例如,单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒和乳多空病毒(例如,SV40)。
表达载体的说明性实例包含但不限于用于在哺乳动物细胞中进行表达的pClneo载体(Promega);用于在哺乳动物细胞中进行慢病毒介导的基因转移和表达的pLenti4/V5-DESTTM、pLenti6/V5-DESTTM和pLenti6.2/V5-GW/lacZ(英杰公司(Invitrogen))。在特定实施例中,本文所公开的多肽的编码序列可以连接到这些表达载体中,用于在哺乳动物细胞中表达多肽。
在特定实施例中,载体是附加型载体或是在染色体外维持的载体。如本文所使用的,术语“附加型”是指能够复制而不整合到宿主的染色体DNA中并且不会从分裂的宿主细胞中逐渐丧失的载体,这也意味着所述载体在染色体外或附加地复制。
表达载体中存在的“表达控制序列”、“控制元件”或“调控序列”是载体——复制起点——的那些非翻译区、选择盒、启动子、增强子、翻译起始信号(Shine Dalgarno序列或Kozak序列)内含子、转录后调控元件、多腺苷酸化序列、5'和3'非翻译区——其与宿主细胞蛋白相互作用以进行转录和翻译。这些元件的强度和特异性可能不同。取决于所利用的载体系统和宿主,可以使用任何数量的合适的转录和翻译元件,包含普遍存在的启动子和诱导型启动子。
在特定实施例中,多核苷酸包括载体,所述载体包含但不限于表达载体和病毒载体。载体可以包括一种或多种外源、内源或异源控制序列,如启动子和/或增强子。“内源控制序列”是与基因组中的给定基因天然连接的序列。“外源控制序列”是通过基因操纵(即分子生物学技术)与被放置成与基因并置使得此基因的转录由所连接的增强子/启动子引导的序列。“异源控制序列”是与被基因操纵的细胞来自不同物种的外源序列。“合成”控制序列可以包括一种或多种内源和/或外源序列和/或在体外或计算机中所确定的为特定疗法提供最佳启动子和/或增强子活性的序列的元件。
如本文所使用的术语“启动子”是指RNA聚合酶结合的多核苷酸(DNA或RNA)的识别位点。RNA聚合酶启动并转录与启动子可操作地连接的多核苷酸。在特定实施例中,在哺乳动物细胞中起作用的启动子包括位于转录启动位点上游大约25个到30个碱基的富含AT的区和/或发现转录起始上游70个到80个碱基的另一序列,其中N可以是任何核苷酸的CNCAAT区。
术语“增强子”是指含有能够提供增强的转录的序列并且在某些情况下可以独立于其相对于另一控制序列的取向而起作用的DNA片段。增强子可以与启动子和/或其它增强子元件协同或叠加地起作用。术语“启动子/增强子”是指含有能够提供启动子和增强子功能的序列的DNA片段。
术语“可操作地连接”是指其中所描述的组分处于允许它们以其预期的方式起作用的关系中的并置。在一个实施例中,所述术语是指核酸表达控制序列(如启动子和/或增强子)与第二多核苷酸序列例如所关注多核苷酸之间的功能性连接,其中表达控制序列引导对应于第二序列的核酸的转录。
如本文所使用的,术语“组成性表达控制序列”是指连续地或连续不断地允许可操作地连接的序列的转录的启动子、增强子或启动子/增强子。组成性表达控制序列可以是允许在各种各样的细胞和组织类型中表达的“普遍存在的”启动子、增强子或启动子/增强子或分别允许在受限种类的细胞和组织类型中表达的“细胞特异性”、“细胞类型特异性”、“细胞谱系特异性”或“组织特异性”启动子、增强子或启动子/增强子。
适合于在特定实施例中使用的说明性普遍存在的表达控制序列包含但不限于巨细胞病毒(CMV)立即早期启动子、病毒猿猴病毒40(SV40)(例如,早期或晚期的)、莫洛尼鼠白血病病毒(MoMLV)LTR启动子、劳斯肉瘤病毒(RSV)LTR、单纯疱疹病毒(HSV)(胸苷激酶)启动子、来自痘苗病毒的H5、P7.5和P11启动子、短延伸因子1-α(EF1a-短)启动子、长延伸因子1-α(EF1a-长)启动子、早期生长应答1(EGR1)、铁蛋白H(FerH)、铁蛋白L(FerL)、甘油醛-3-磷酸脱氢酶(GAPDH)、真核翻译起始因子4A1(EIF4A1)、热休克70kDa蛋白5(HSPA5)、热休克蛋白90kDaβ、成员1(HSP90B1)、热休克蛋白70kDa(HSP70)、β-驱动蛋白(β-KIN)、人ROSA 26基因座(Irions等人,《自然生物技术(Nature Biotechnology)》25,1477-1482(2007))、泛素C启动子(UBC)、磷酸甘油酸激酶-1(PGK)启动子、巨细胞病毒增强子/鸡β-肌动蛋白(CAG)启动子、β-肌动蛋白启动子和骨髓增生性肉瘤病毒增强子、阴性对照区域缺失、dl587rev引物结合位点取代(MND)启动子(Challita等人,《病毒学杂志(J.Viril.)》69(2):748-55(1995))。
在特定实施例中,可能期望使用细胞、细胞类型、细胞谱系或组织特异性表达控制序列来实现期望的多核苷酸序列的细胞类型特异性、谱系特异性或组织特异性表达(例如,仅在细胞类型、细胞谱系或组织的子集中或在发育的特定阶段期间表达编码多肽的特定核酸)。
如本文所使用的,“条件表达”可以指任何类型的条件表达,包含但不限于:诱导型表达;可抑制表达;具有特定生理、生物或疾病状态等的细胞或组织中表达。此定义不旨在排除细胞类型或组织特异性表达。某些实施例提供了所关注多核苷酸的条件表达,例如通过使细胞、组织、生物体等经受导致多核苷酸表达或导致由所关注多核苷酸编码的多核苷酸的表达增加或减少的治疗或病症来控制表达。
诱导型启动子/系统的说明性实例包含但不限于:类固醇诱导型启动子如编码糖皮质激素或雌激素受体的基因的启动子(通过用对应的激素处理可诱导)、金属硫蛋白启动子(通过用各种重金属处理可诱导)、MX-1启动子(通过干扰素可诱导)、“基因开关(GeneSwitch)”米非司酮可调控系统(Sirin等人,2003,《基因(Gene)》,323:67)、cumate诱导型基因开关(WO 2002/088346)、四环素依赖性调控系统等。
还可以通过使用位点特异性DNA重组酶实现条件表达。根据某些实施例,多核苷酸包括用于由位点特异性重组酶介导的重组的至少一个(通常两个)位点。如本文所使用的,术语“重组酶”或“位点特异性重组酶”包含切除或整合蛋白、酶、辅因子或参与涉及一个或多个重组位点(例如,两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个)的重组反应的相关蛋白,所述蛋白可以是野生型蛋白质(参见,Landy,《生物技术当前述评(Current Opinion in Biotechnology)》3:699-707(1993))或突变体、衍生物(例如,含有重组蛋白序列或其片段的融合蛋白)、片段及其变体。适合于在特定实施例中使用的重组酶的说明性实例包含但不限于:Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、ΦC31、Cin、Tn3解离酶、TndX、XerC、XerD、TnpX、Hjc、Gin、SpCCE1和ParA。
多核苷酸可以包括各种各样的位点特异性重组酶中的任何一种的一个或多个重组位点。应当理解,位点特异性重组酶的靶位点是对为例如逆转录病毒载体或慢病毒载体的载体整合需要的任何一个或多个位点的补充。如本文所使用的,术语“重组序列”、“重组位点”或“位点特异性重组位点”是指重组酶识别和结合的特定核酸序列。
例如,Cre重组酶的一个重组位点为作为34个碱基对的序列的loxP,所述序列包括8碱基对核心序列两侧的两个13碱基对反向重复序列(用作重组酶结合位点)(参见Sauer,B.,《生物技术当前述评》5:521-527(1994)的图1)。其它示例性loxP位点包含但不限于:lox511(Hoess等人,1996;Bethke和Sauer,1997)、lox5171(Lee和Saito,1998)、lox2272(Lee和Saito,1998)、m2(Langer等人,2002)、lox71(Albert等人,1995)以及lox66(Albert等人,1995)。
FLP重组酶的适合的识别位点包含但不限于:FRT(McLeod等人,1996)、F1,F2,F3(Schlake和Bode,1994)、F4,F5(Schlake和Bode,1994)、FRT(LE)(Senecoff等人,1988)、FRT(RE)(Senecoff等人,1988)。
识别序列的其它实例为attB、attP、attL和attR序列,其被重组酶λ整合酶识别,例如phi-c31。SSR介导仅在异型位点attB(长度为34bp)和attP(长度为39bp)之间的重组(Groth等人,2000)。分别以细菌和噬菌体基因组上用于噬菌体整合酶的附接位点命名的attB和attP均含有可能由同源二聚体结合的不完全的反向重复序列(Groth等人,2000)。产物位点attL和attR对进一步的介导的重组具有有效惰性(Belteki等人,2003),使得反应不可逆。对于催化插入,已经发现携带attB的DNA插入基因组attP位点比attP位点插入基因组attB位点更容易(Thyagarajan等人,2001;Belteki等人,2003)。因此,典型策略通过同源重组将带有attP的“对接位点”定位到限定的基因座中,然后所述基因座与带有attB的进入序列配合进行插入。
在一个实施例中,本文所设想的多核苷酸包括两侧为一对重组酶识别位点的受体修复模板多核苷酸。在特定实施例中,修复模板多核苷酸两侧为LoxP位点、FRT位点或att位点。
在特定实施例中,本文所设想的多核苷酸包含编码一个或多个多肽的一个或多个所关注多核苷酸。在特定实施例中,为了实现多个多肽中的每一个的有效翻译,可以通过一个或多个IRES序列或编码自切割多肽的多核苷酸序列来分离多核苷酸序列。
如本文所使用的,“内部核糖体进入位点”或“IRES”是指促进引导内部核糖体进入顺反子(蛋白编码区)的如ATG等起始密码子由此导致基因的帽依赖性翻译的元件。参见例如,Jackson等人,1990.《生物化学科学趋势(Trends Biochem Sci)》15(12):477-83)以及Jackson和Kaminski.1995.《RNA》1(10):985-1000。本领域的技术人员通常采用的IRES的实例包含美国专利号6,692,736中所描述的IRES。本领域已知的“IRES”的进一步实例包含但不限于可从小核糖核酸病毒(Jackson等人,1990)获得的IRES以及可从病毒或细胞mRNA源获得的IRES,如例如,免疫球蛋白重链结合蛋白(BiP)、血管内皮生长因子(VEGF)(Huez等人,1998,《分子细胞生物学(Mol.Cell.Biol.)》18(11):6178-6190)、成纤维细胞生长因子2(FGF-2)以及胰岛素样生长因子(IGFII)、可翻译起始因子eIF4G与酵母转录因子TFIID和HAP4、可从Novagen商购获得的脑心肌炎病毒(EMCV)(Duke等人,1992.《病毒学杂志(J.Virol.)》66(3):1602-9)和VEGF IRES(Huez等人,1998.《分子细胞生物学》18(11):6178-90)。在小核糖核酸病毒科、二顺反子病毒科与黄病毒科的病毒基因组以及在HCV、弗里德(Firend)鼠白血病病毒(FrMLV)和莫洛尼鼠白血病病毒(MoMLV)中也报告了IRES。
在一个实施例中,本文所设想的多核苷酸中使用的IRES是EMCV IRES。
在特定实施例中,多核苷酸包括具有共有Kozak序列且编码期望的多肽的多核苷酸。如本文所使用的,术语“Kozak序列”是指极大促进mRNA与核糖体的小亚基的初始结合并增加翻译的短核苷酸序列。共有Kozak序列是(GCC)RCCATGG(SEQ ID NO:59),其中R是嘌呤(A或G)(Kozak,1986.《细胞(Cell.)》44(2):283-92,以及Kozak,1987.《核酸研究》15(20):8125-48)。
引导异源核酸转录物的有效终止和多腺苷酸化的元件增加了异源基因表达。通常在多腺苷酸化信号的下游发现转录终止信号。在特定实施例中,载体包括编码待表达多肽的多核苷酸的多腺苷酸化序列3′。如本文所使用的术语“polyA位点”或“polyA序列”表示通过RNA聚合酶II引导新生RNA转录物的终止和多腺苷酸化的DNA序列。多腺苷酸化序列可以通过向编码序列的3'末端添加polyA尾来促进mRNA稳定性,并且因此有助于提高翻译效率。切割和多腺苷酸化由RNA中的poly(A)序列引导。哺乳动物前mRNA的核心poly(A)序列具有位于切割-多腺苷酸化位点两侧的两个识别元件。通常,几乎不变的AAUAAA六聚体位于富含U或GU残基的更加可变元件的上游20-50个核苷酸处。新生转录物的切割发生在这两种元件之间,并且与向5'切割产物添加的多达250个腺苷偶联。在特定实施例中,核心poly(A)序列是理想的polyA序列(例如,AATAAA、ATTAAA、AGTAAA)。在特定实施例中,poly(A)序列是SV40polyA序列、牛生长激素polyA序列(BGHpA)、兔β-球蛋白polyA序列(rβgpA)或本领域已知的另一适合的异源或内源polyA序列。
在一些实施例中,多核苷酸或携带多核苷酸的细胞利用自杀基因,包含可诱导的自杀基因,来降低直接毒性和/或不受控制的增殖的风险。在特定实施例中,自杀基因对携带多核苷酸或细胞的宿主没有免疫原性。可以使用的自杀基因的某个实例是半胱天冬酶-9或半胱天冬酶-8或胞嘧啶脱氨酶。可以使用特定的二聚化学诱导剂(CID)来活化半胱天冬酶-9。
在某些实施例中,多核苷酸包括导致本文所设想的基因修饰的细胞易于在体内进行阴性选择的基因片段。“阴性选择”是指可以由于个体的体内病症的改变而消除的输注细胞。阴性可选择表型可以由赋予施用药剂例如化合物敏感性的基因的插入而产生。阴性选择基因是本领域已知的,并且包含但不限于:赋予更昔洛韦敏感性的I型单纯疱疹病毒胸苷激酶(HSV-I TK)基因;细胞次黄嘌呤磷酸核糖基转移酶(HPRT)基因;细胞腺嘌呤磷酸核糖转移酶(APRT)基因以及细菌胞嘧啶脱氨酶。
在一些实施例中,基因修饰的细胞包括多核苷酸,所述多核苷酸进一步包括能够在体外选择阴性可选择表型的细胞的阳性标志物。阳性可选择标志物可以是基因,其在被引入宿主细胞后表达允许阳性选择携带基因的细胞的显性表型。这种类型的基因是本领域已知的,并且包含但不限于赋予潮霉素B抗性的潮霉素-B磷酸转移酶基因(hph)、来自编码对抗生素G418的抗性的Tn5的氨基糖苷磷酸转移酶基因(neo或aph)、二氢叶酸还原酶(DHFR)基因、腺苷脱氨酶基因(ADA)以及多抗药性(MDR)基因。
在一个实施例中,阳性可选择标志物与阴性可选择元件连接,使得阴性可选择元件的损失也必然伴随着阳性可选择标志物的丧失。在特定实施例中,阳性和阴性可选择标志物融合,使得一个的丧失必须导致另一个的丧失。作为表达产物产生赋予上文所描述的期望阳性和阴性选择特征的多肽的融合多核苷酸的实例是潮霉素磷酸转移酶胸苷激酶融合基因(HyTK)。此基因的表达产生赋予体外阳性选择的潮霉素B抗性以及体内阴性选择的更昔洛韦敏感性的多肽。还参见S.D.Lupton的PCT US91/08442和PCT/US94/05601的公开案,其描述了对由显性阳性可选择标志物与阴性可选择标志物的融合衍生的双功能可选择融合基因的使用。
优选的阳性可选择标志物衍生自选自hph、nco和gpt组成的组的基因,并且优选的阴性可选择标志物衍生自选自由胞嘧啶脱氨酶、HSV-I TK、VZV TK、HPRT、APRT和gpt组成的组的基因。在特定实施例中所设想的示范性双功能可选择融合基因包含但不限于其中阳性可选择标志物衍生自hph或neo并且阴性可选择标志物衍生自胞嘧啶脱氨酶或TK基因或可选择标志物的基因。
在特定实施例中,编码一种或多种核酸酶变体、megaTAL、末端加工酶或融合多肽的多核苷酸可以通过非病毒和病毒方法引入到造血细胞中,例如T细胞。在特定实施例中,编码核酸酶和/或供体修复模板的一种或多种多核苷酸的递送可以通过相同的方法或通过不同的方法和/或通过相同的载体或通过不同的载体来提供。
术语“载体”在本文中用于指能够转移或转运另一个核酸分子的核酸分子。转移的核酸通常与载体核酸分子连接,例如,插入载体核酸分子中。载体可以包含引导细胞中自主复制的序列,或者可以包含足以允许整合到宿主细胞DNA中的序列。在特定实施例中,非病毒载体用于将本文所设想的一个或多个多核苷酸递送至T细胞。
非病毒载体的说明性实例包含但不限于质粒(例如,DNA质粒或RNA质粒)、转座子、粘粒以及细菌人工染色体。
在特定实施例中所设想的多核苷酸的非病毒递送的说明性方法包含但不限于:电穿孔、声孔、脂质转染、显微注射、基因枪法、病毒体、脂质体、免疫脂质体、纳米颗粒、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒粒子、DEAE-葡聚糖介导的转移、基因枪和热休克。
适合在特定实施例中所设想的特定实施例中使用的多核苷酸递送系统的说明性实例包含但不限于由Amaxa Biosystems、Maxcyte,Inc.、BTX Molecular DeliverySystems和Copernicus Therapeutics Inc.提供的系统。脂质转染试剂是商业销售的(例如,TransfectamTM和LipofectinTM)。已经在文献中描述了适合于多核苷酸的有效受体识别脂质转染的阳离子脂质和中性脂质。参见例如,Liu等人,(2003)《基因疗法》.10:180-187;以及Balazs等人(2011)《药物递送杂志(Jounal of Drug Delivery)》.2011:1-12。在特定实施例中还设想了抗体靶向的、细菌衍生的、非生物的基于纳米细胞的递送。
如下文所描述的,包括在特定实施例中所设想的多核苷酸的病毒载体可以通过向个体患者施用进行体内递送,通常通过全身施用(例如,静脉内、腹膜内、肌肉内、皮下或颅内输注)或局部应用。可替代地,载体可以离体递送到细胞,如从个体患者移植的细胞(例如,动员的外周血、淋巴细胞、骨髓抽吸物、组织活检等)或通用供体造血干细胞,然后将细胞再植入患者体内。
在一个实施例中,直接向生物体施用包括核酸酶变体和/或供体修复模板的病毒载体以在体内转导细胞。可替代地,可以施用裸DNA。通过通常用于引入分子与血液或组织细胞最终接触的任何途径施用,包含但不限于注射、输注、局部施用和电穿孔。施用这种核酸的合适的方法是本领域技术人员可获得的并且是公知的,并且尽管可以使用多于一种途径来施用特定组合物,但是特定途径通常可以提供比另一条途径更直接且更有效的反应。
适合于在本文所设想的特定实施例中使用的病毒载体系统的说明性实例包含但不限于腺病毒伴随病毒(AAV)、逆转录病毒、单纯疱疹病毒、腺病毒以及痘苗病毒载体。
在各个实施例中,通过用包括一个或多个多核苷酸的重组腺病毒伴随病毒(rAAV)转导,将编码核酸酶变体和/或供体修复模板的一个或多个多核苷酸引入造血细胞例如T细胞中。
AAV是一种小型(约26nm)复制缺陷型、主要是附加型无包膜病毒。AAV可以感染分裂和非分裂细胞,并且可以将其基因组并入到宿主细胞的基因组中。重组AAV(rAAV)通常至少由转基因和其调节序列以及5'和3'AAV反向末端重复序列(ITR)构成。ITR序列的长度约为145bp。在特定实施例中,rAAV包括从AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9或AAV10分离的ITR和衣壳序列。
在一些实施例中,使用嵌合rAAV,从一种AAV血清型分离ITR序列,并从不同的AAV血清型分离衣壳序列。例如,具有衍生自AAV2的ITR序列和衍生自AAV6的衣壳序列的rAAV被称为AAV2/AAV6。在特定实施例中,rAAV载体可以包括来自AAV2的ITR,以及来自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9或AAV10中任一种的衣壳蛋白。在优选实施例中,rAAV包括衍生自AAV2的ITR序列和衍生自AAV6的衣壳序列。在优选实施例中,rAAV包括衍生自AAV2的ITR序列和衍生自AAV2的衣壳序列。
在一些实施例中,工程和选择方法可以应用于AAV衣壳,以使其更有可能转导所关注细胞。
已经公开了rAAV载体的构建、制备和其纯化,例如在美国专利号9,169,494;9,169,492;9,012,224;8,889,641;8,809,058;以及8,784,799中,所述美国专利中的每一个通过引用以其全文并入本文中。
在各个实施例中,通过用包括一个或多个多核苷酸的逆转录病毒例如慢病毒转导细胞,将编码核酸酶变体和/或供体修复模板的一个或多个多核苷酸引入造血细胞中。
如本文所使用的,术语“逆转录病毒”是指RNA病毒,所述RNA病毒将其基因组RNA逆转录为直线型双链DNA拷贝,并且随后将其基因组DNA共价整合到宿主基因组中。适合于在特定实施例中使用的说明性逆转录病毒包含但不限于:莫洛尼鼠白血病病毒(M-MuLV)、莫洛尼鼠肉瘤病毒(MoMSV)、哈维鼠肉瘤病毒(HaMuSV)、鼠类乳腺肿瘤病毒(MuMTV)、长臂猿白血病病毒(GaLV)、猫白血病病毒(FLV)、泡沫病毒、弗里德鼠白血病病毒、鼠干细胞病毒(MSCV)和劳斯肉瘤病毒(RSV)以及慢病毒。
如本文所使用的,术语“慢病毒”是指复杂逆转录病毒的组(或属)。说明性慢病毒包含但不局限于:HIV(人类免疫缺陷病毒;包含HIV 1型和HIV 2);维斯纳—梅迪病毒(VMV)病毒;山羊关节炎-脑炎病毒(CAEV);马传染性贫血病毒(EIAV);猫免疫缺陷病毒(FIV);牛免疫缺陷病毒(BIV);以及猿猴免疫缺陷病毒(SIV)。在一个实施例中,优选基于HIV的载体主链(即,HIV顺式作用序列元件)。
在各个实施例中,本文所设想的慢病毒载体包括一个或多个LTR,以及以下辅助元件中的一个或多个或全部:cPPT/FLAP、Psi(Ψ)包装信号、输出元件、poly(A)序列,并且可以任选地包括WPRE或HPRE、绝缘子元件、可选择标志物和细胞自杀基因,如本文其它地方所讨论的。
在特定实施例中,本文所设想的慢病毒载体可以是整合的或非整合的或整合缺陷型慢病毒。如本文所使用的,术语“整合缺陷型慢病毒”或“IDLV”是指具有缺乏将病毒基因组整合到宿主细胞的基因组的能力的整合酶的慢病毒。已经在专利申请WO2006/010834中描述了无整合能力的病毒载体,所述专利申请通过引用以其全部内容并入本文。
适合于降低整合酶活性的HIV-1pol基因中的说明性突变包含但不限于:H12N、H12C、H16C、H16V、S81R、D41A、K42A、H51A、Q53C、D55V、D64E、D64V、E69A、K71A、E85A、E87A、D116N、D1161、D116A、N120G、N1201、N120E、E152G、E152A、D35E、K156E、K156A、E157A、K159E、K159A、K160A、R166A、D167A、E170A、H171A、K173A、K186Q、K186T、K188T、E198A、R199c、R199T、R199A、D202A、K211A、Q214L、Q216L、Q221L、W235F、W235E、K236S、K236A、K246A、G247W、D253A、R262A、R263A以及K264H。
在一个实施例中,HIV-1整合酶缺陷型pol基因包括D64V、D116I、D116A、E152G或E152A突变;D64V、D116I和E152G突变;或D64V、D116A和E152A突变。
在一个实施例中,HIV-1整合酶缺陷型pol基因包括D64V突变。
术语“长末端重复序列(LTR)”是指位于逆转录病毒DNA末端的碱基对的结构域,其在其天然序列环境中是直接重复序列并含有U3、R和U5区。
如本文所使用的,术语“FLAP元件”或“cPPT/FLAP”是指其序列包含逆转录病毒的中心多嘌呤段和中心终止序列(cPPT和CTS)例如HIV-1和HIV-2的核酸。在美国专利号6,682,907和Zennou等人,2000,《细胞》,101:173中描述了合适的FLAP元件。在另一实施例中,慢病毒载体含有具有cPPT元件和/或CTS元件中的一个或多个突变的FLAP元件。在又另一实施例中,慢病毒载体包括cPPT元件或CTS元件。在又另一实施例中,慢病毒载体不包括cPPT元件或CTS元件。
如本文所使用的,术语“包装信号”或“包装序列”是指位于逆转录病毒基因组内的psi[Ψ]序列,所述序列是将病毒RNA插入病毒衣壳或颗粒中所需要的,参见例如,Clever等人,1995.《病毒学杂志(J.of Virology)》,第69卷,第4期;第2101-2109页。
术语“输出元件”是指调节RNA转录物从细胞核向细胞质转运的顺式作用转录后调节元件。RNA输出元件的实例包含但不限于人类免疫缺陷病毒(HIV)rev应答元件(RRE)(参见例如,Cullen等人,1991.《病毒学杂志》65:1053;以及Cullen等人,1991.《细胞》58:423),以及乙型肝炎病毒转录后调节元件(HPRE)。
在特定实施例中,通过将转录后调节元件、有效的多腺苷酸化位点和任选地转录终止信号结合到载体中,增加了病毒载体中异源序列的表达。各种转录后调节元件可以增加异源核酸在蛋白上的表达,例如,土拨鼠肝炎病毒转录后调节元件(WPRE;Zufferey等人,1999,《病毒学杂志》,73:2886);乙型肝炎病毒中存在的转录后调节元件(HPRE)(Huang等人,《分子细胞生物学》,5:3864);等(Liu等人,1995,《基因与发展(Genes Dev.)》,9:1766)。
由于修饰LTR,慢病毒载体优选地含有几种安全性增强。“自身失活”(SIN)载体是指复制缺陷型载体,例如,其中已经修饰(例如,通过缺失或取代)称为U3区的右(3')LTR增强子-启动子区,以防止病毒转录超过第一轮病毒复制。通过用异源启动子替换5'LTR的U3区来提供额外的安全性增强,以在病毒颗粒的产生过程中驱动病毒基因组的转录。可以使用的异源启动子的实例包含例如病毒猿猴病毒40(SV40)(例如,早期或晚期)、巨细胞病毒(CMV)(例如,立即早期的)、莫洛尼鼠白血病病毒(MoMLV)、劳斯肉瘤病毒(RSV)和单纯疱疹病毒(HSV)(胸苷激酶)启动子。
如本文所使用的术语“假型”或“假型包装”是指其病毒包膜蛋白已经被具有优选特征的另一病毒的病毒包膜蛋白取代的病毒。例如,HIV可以用水疱性口炎病毒G蛋白(VSV-G)包膜蛋白进行假型包装,这允许HIV感染更广泛的细胞,因为HIV包膜蛋白(由env基因编码)通常将病毒靶向CD4+呈递细胞。
在某些实施例中,根据已知方法产生慢病毒载体。参见例如,Kutner等人,《BMC生物技术(BMC Biotechnol)》2009;9:10doi:10.1186/1472-6750-9-10;Kutner等人《自然实验手册(Nat.Protoc.)》2009;4(4):495-505.doi:10.1038/nprot.2009.22。
根据本文所设想的某些具体实施例,大多数或所有病毒载体主链序列都衍生自慢病毒,例如,HIV-1。然而,应当理解,可以使用或组合逆转录病毒和/或慢病毒序列的许多不同的源,并且可以适应某些慢病毒序列中的许多取代和更改,而不损害转移载体执行本文所描述的功能的能力。此外,多种慢病毒载体在本领域是已知的,参见Naldini等人,(1996a、1996b和1998);Zufferey等人,(1997);Dull等人,1998,美国专利号6,013,516;和5,994,136,其中许多可以适于产生本文所设想的病毒载体或转移质粒。
在各个实施例中,通过用包括一个或多个多核苷酸的腺病毒转录细胞,将编码核酸酶变体和/或供体修复模板的一个或多个多核苷酸引入造血细胞中。
基于腺病毒的载体能够在许多细胞类型中具有极高转导效率并且并不要求细胞分裂。使用这种载体,已经获得了高滴度和高表达水平。此载体可以在相对简单的系统中大量制备。将大多数腺病毒载体工程化,使得转基因取代Ad E1a、E1b和/或E3基因;随后,在以反式提供缺失的基因功能的人293细胞中繁殖复制缺陷型载体。Ad载体可以在体内转导多种类型的组织,包含如在肝、肾和肌肉中发现的非分裂的分化细胞。常规Ad载体具有很大的承载能力。
复制缺陷的当前腺病毒载体的产生和繁殖可以利用命名为293的独特辅助细胞系,所述辅助细胞系通过Ad5DNA片段从人胚胎肾细胞转化并组成性地表达E1蛋白(Graham等人,1977)。由于E3区域可从腺病毒基因组中分配出来(Jones和Shenk,1978),所以目前的腺病毒载体在293细胞的帮助下在E1、D3区或两个区中携带外源DNA(Graham和Prevec,1991)。腺病毒载体已经用于真核基因表达(Levrero等人,1991;Gomez-Foix等人,1992)和疫苗开发(Grunhaus和Horwitz,1992;Graham和Prevec,1992)。向不同的组织施用重组腺病毒方面的研究包含气管滴注(Rosenfeld等人,1991;Rosenfeld等人,1992)、肌肉注射(Ragot等人,1993)、外周静脉注射(Herz和Gerard,1993)以及立体定向脑内接种(Le GalLa Salle等人,1993)。在临床试验中使用Ad载体的实例涉及用于伴随肌内注射的抗肿瘤免疫的多核苷酸疗法(Sterman等人,《人类基因疗法(Hum.Gene Ther.)》7:1083-9(1998))。
在各个实施例中,通过用包括一个或多个多核苷酸的单纯疱疹病毒例如HSV-1、HSV-2转导细胞,将编码核酸酶变体和/或供体修复模板的一个或多个多核苷酸引入造血细胞中。
成熟HSV病毒粒子由包膜的二十面体衣壳组成,其中病毒基因组由152kb的线性双链DNA分子组成。在一个实施例中,基于HSV的病毒载体缺乏一个或多个必需或非必需的HSV基因。在一个实施例中,基于HSV的病毒载体为复制缺陷型。大多数复制缺陷型HSV载体含有缺失以去除一个或多个中早期、早期或晚期HSV基因从而防止复制。例如,HSV载体可能缺乏选自由以下组成的组的立即早期基因:ICP4、ICP22、ICP27、ICP47及其组合。HSV载体的优点是其进入可以导致长期DNA表达的潜伏期的能力,以及其可以容纳高达25kb的外源DNA插入物的大型病毒DNA基因组。在例如美国专利号5,837,532、5,846,782和5,804,413及国际专利申请WO 91/02788、WO 96/04394、WO 98/15637和WO 99/06583中描述了基于HSV的载体,所述专利中的每一个通过引用以其全部内容并入本文。
H.经基因组编辑的细胞
用在特定实施例中设想的方法制造的经基因组编辑的细胞包括TGFβR2基因中的一种或多种基因编辑,并且提供改进的基于细胞的疗法以预防、治疗癌症、GVHD、传染病、自身免疫疾病、免疫缺陷或与其相关的病状或改善其至少一种症状。不希望束缚于任何特定理论,相信本文所设想的组合物和方法部分地通过使治疗性细胞对免疫抑制信号和耗竭更有抵抗力来提高过继性细胞疗法的功效。
在特定实施例中设想的经基因组编辑的细胞可以是自体(autologous)/自体的(autogeneic)(“自我”)或非自体的(“非自我的”,例如同种异体的、同基因的或异种的)。如本文所使用的,“自体”(“Autologous”)是指来自相同受试者的细胞。如本文所使用的,“同种异体的”是指同一物种的在基因上与比较细胞不同的细胞。如本文所使用的,“同基因的”是指不同受试者的在基因上与比较细胞完全相同的细胞。如本文所使用的,“异种的”是指与比较细胞属于不同物种的细胞。在优选实施例中,细胞从哺乳动物受试者获得。在更优选实施例中,细胞从灵长类动物受试者获得,任选地为非人类灵长类动物。在最优选实施例中,细胞从人类受试者获得。
“分离的细胞”是指已经从体内组织或器官获得并且基本上不含细胞外基质的非天然存在的细胞,例如自然界中不存在的细胞、经过修饰的细胞、工程化细胞等。
如本文所使用的,术语“细胞群”是指可以由如本文其它地方所描述的任何数量和/或组合的同质或异质细胞类型构成的多个细胞。例如,为了转导T细胞,可以从外周血分离或获得细胞群。细胞群可以包括约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或约100%待编辑的靶细胞类型。在某些实施例中,可以使用本领域已知的方法从异质细胞群中分离或纯化T细胞。
可以使用本文设想的组合物或方法编辑其基因组的细胞类型的说明性实例包含但不限于细胞系、原代细胞、干细胞、祖细胞和分化细胞及其混合物。
在优选实施例中,基因组编辑组合物和方法用于编辑造血细胞,更优选地编辑免疫细胞,并且甚至更优选地编辑T细胞。
术语“T细胞”或“T淋巴细胞”是本领域公认的并且旨在包含胸腺细胞、免疫效应细胞、调节性T细胞、初始T淋巴细胞、未成熟T淋巴细胞、成熟T淋巴细胞、静息T淋巴细胞或活化T淋巴细胞。T细胞可以是T辅助(Th)细胞,例如T辅助1(Th1)细胞或T辅助2(Th2)细胞。T细胞可以是辅助T细胞(HTL;CD4+T细胞)CD4+T细胞、细胞毒性T细胞(CTL;CD8+T细胞)、肿瘤浸润性细胞毒性T细胞(TIL;CD8+T细胞)、CD4+CD8+T细胞、CD4-CD8-T细胞或T细胞的任何其它亚群。在一个实施例中,所述T细胞是免疫效应细胞。在一个实施例中,所述T细胞是NKT细胞。适合于在特定实施例中使用的其它说明性T细胞群包含初始T细胞和记忆T细胞。
在各个实施例中,经基因组编辑的细胞包括免疫效应细胞,所述免疫效应细胞包括通过本文所设想的组合物和方法编辑的TGFβR2基因。“免疫效应细胞”是免疫系统的任何细胞,其具有一种或多种效应功能(例如,细胞毒性细胞杀伤活性,细胞因子分泌,ADCC和/或CDC的诱导)。在特定实施例中设想的说明性免疫效应细胞是T淋巴细胞,特别是细胞毒性T细胞(CTL;CD8+T细胞)、TIL和辅助T细胞(HTL;CD4+T细胞)。在一个实施例中,免疫效应细胞包含自然杀伤(NK)细胞。在一个实施例中,免疫效应细胞包含自然杀伤T(NKT)细胞。
“有效T细胞”和“幼小T细胞”在特定实施例中可互换使用,并且指T细胞表型,其中T细胞能够增殖并伴随分化减少。在特定实施例中,幼小T细胞具有“初始T细胞”的表型。在特定实施例中,幼小T细胞包括以下生物标志物中的一种或多种或全部:CD62L、CCR7、CD28、CD27、CD122、CD127、CD197和CD38。在一个实施例中,幼小T细胞包括以下生物标志物中的一种或多种或全部:CD62L、CD127、CD197和CD38。在一个实施例中,幼小T细胞缺乏CD57、CD244、CD160、PD-1、CTLA4、PD-1和LAG3的表达。
可以从许多来源获得T细胞,包含但不限于:外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、来自感染位点的组织、腹水、胸腔积液、脾组织和肿瘤。
在特定实施例中,包括免疫效应细胞或T细胞的细胞群包括经编辑的TGFβR2基因,其中编辑为由NHEJ修复的DSB。在特定实施例中,免疫效应细胞或T细胞包括经编辑的TGFβR2基因,其中编辑为由NHEJ修复的DSB。在特定实施例中,编辑是在TGFβR2基因的编码序列中、优选地在TGFβR2基因的外显子6中、更有选地在TGFβR2基因的外显子6中的SEQ ID NO:11(或SEQ ID NO:13)处插入或删除(INDEL)约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个核苷酸。
在特定实施例中,包括免疫效应细胞或T细胞的细胞群包括经编辑的TGFβR2基因,所述TGFβR2基因包括掺入由HDR修复的DSB的供体修复模板。
在特定实施例中,包括免疫效应细胞或T细胞的细胞群包括经编辑的TGFβR2基因,所述TGFβR2基因包括供体修复模板,所述供体修复模板包括TGFβR2基因或其部分,并且所述细胞群被设计成在基因组TGFβR2序列中引入一个或多个突变以修饰TGFβR2表达或信号传导,并且优选地,减少或消除TGFβR2表达和/或信号传导。
在各个实施例中,经基因组编辑的细胞包括TGFβR2基因中的编辑,并且进一步包括编码TGFβR2翻转受体的多核苷酸、双特异性T细胞衔接子(BiTE)分子;细胞因子(例如,IL-2、胰岛素、IFN-γ、IL-7、IL-21、IL-10、IL-12、IL-15和TNF-α)、趋化因子(例如,MIP-1α、MIP-1β、MCP-1、MCP-3和RANTES)、细胞毒素(例如,穿孔素、颗粒酶A和颗粒酶B)、细胞因子受体(例如,IL-2受体、IL-7受体、IL-12受体、IL-15受体和IL-21受体)或工程化抗原受体(例如,工程化T细胞受体(TCR)、嵌合抗原受体(CAR)、Daric受体或其组分或嵌合细胞因子受体)。在一个实施例中,将包括多核苷酸和核酸酶变体的供体修复模板引入细胞中,并且通过HDR修复在TGFβR2基因中的DSB位点处将多核苷酸掺入细胞基因组中。也可以在除TGFβR2基因之外的位点处将多核苷酸引入细胞中,例如通过用包括多核苷酸的载体转导细胞。
I.组合物和配制品
如本文所设想,在特定实例例中设想的组合物可以包括一种或多种多肽、多核苷酸、包括相同物质的载体以及基因组编辑组合物和经基因组编辑的细胞组合物。在特定实施例中设想的基因组编辑组合物和方法可用于编辑细胞或细胞群中人转化生长因子β受体2(TGFβR2)基因中的靶位点。在优选实施例中,基因组编辑组合物用于编辑造血细胞例如T细胞或免疫效应细胞中的TGFβR2基因。
在各个实例中,本文所设想的组合物包括核酸酶变体、以及任选地末端加工酶,例如3'-5'核酸外切酶(Trex2)。核酸酶变体可以呈通过上文所公开的例如电穿孔、脂质纳米颗粒等多核苷酸递送方法引入细胞的mRNA的形式。在一个实施例中,经由上文所公开的多核苷酸递送方法将包括编码归巢核酸内切酶变体或megaTAL、以及任选地3'-5'核酸外切酶的mRNA的组合物引入细胞中。组合物可以用于通过易错NHEJ产生经基因组编辑的细胞或经基因组编辑的细胞群。
在各个实施例中,本文所设想的组合物包括受体修复模板。可以将组合物递送到表达或将表达核酸酶变体以及任选地末端加工酶的细胞。在一个实施例中,可以将组合物递送到表达或将表达归巢核酸内切酶变体或megaTAL以及任选地3'-5'核酸外切酶的细胞。在存在供体修复模板的情况下基因编辑酶的表达可以用于通过HDR产生经基因组编辑的细胞或经基因组编辑的细胞群。
在特定实施例中,本文所设想的组合物包括细胞群、核酸酶变体、以及任选地供体修复模板。在特定实施例中,本文所设想的组合物包括细胞群、核酸酶变体、末端加工酶、以及任选地供体修复模板。核酸酶变体和/或末端加工酶可以呈通过上文所公开的多核苷酸递送方法引入细胞中的mRNA的形式。
在特定实施例中,本文所设想的组合物包括细胞群、归巢核酸内切酶变体或megaTAL、以及任选地供体修复模板。在特定实施例中,本文所设想的组合物包括细胞群、归巢核酸内切酶变体或megaTAL、3'-5'核酸外切酶、以及任选地供体修复模板。归巢核酸内切酶变体、megaTAL和/或3'-5'核酸外切酶可以呈通过上文所公开的多核苷酸递送方法引入细胞中的mRNA的形式。
在特定实施例中,细胞群包括经基因修饰的免疫效应细胞。
组合物包含但不限于药物组合物。“药物组合物”是指在药学上可接受的或生理学上可接受的溶液中配制的用于单独地或与一种或多种其它治疗形式组合地向细胞或动物施用的组合物。还应理解的是,如果需要,组合物也可以与其它药剂组合施用,如例如,细胞因子、生长因子、激素、小分子、化学治疗剂、前药、药物、抗体或其它各种药物活性剂。实际上对也可以包含在组合物中的其它组分没有限制,条件是额外的药剂不会不利地影响组合物。
本文采用的短语“药学上可接受的”是指在合理医学判断范围内的那些化合物、材料、组合物和/或剂型,这些是适合用于与人类和动物组织接触使用而没有过多的毒性、刺激、过敏反应或其它问题或并发症,与合理的益处/风险比相称。
术语“药学上可接受的载剂”是指对治疗细胞施用的稀释剂、佐剂、赋形剂或媒剂。药物载剂的说明性实例可以是无菌液体,如细胞培养基、水和油,包含石油、动物、植物或合成来源的那些油,如花生油、大豆油、矿物油、芝麻油等。盐水溶液以及葡萄糖和甘油水溶液也可以用作液体载剂,特别是对于可注射溶液而言。在特定实施例中,合适的药物赋形剂包含淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、稻米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂奶粉、甘油、丙烯、乙二醇、水、乙醇等。除了任何常规培养基或试剂与所述活性成分不相容的情况之外,设想其在治疗性组合物中的用途。补充性活性成分也可以并入到组合物中。
在一个实施例中,包括药学上可接受的载剂的组合物适合于向受试者施用。在特定实施例中,包括载剂的组合物适合于肠胃外施用,例如,血管内(静脉内或动脉内)、腹膜内或肌肉内施用。在特定实施例中,包括药学上可接受的载剂的组合物适合于心室内、脊柱内或鞘内施用。药学上可接受的载剂包含无菌水溶液、细胞培养基或分散体。这些培养基和药剂用于药物活性物质的用途是本领域公知的。除了任何常规培养基或药剂与转导的细胞不相容的情况之外,设想其在药物组合物中的用途。
在特定实施例中,本文所设想的组合物包括经基因修饰的T细胞和药学上可接受的载剂。包括本文所设想的基于细胞的组合物的组合物可以通过肠内或肠胃外施用方法单独地施用或与其它适合的化合物组合地施用,以实现期望的治疗目的。
药学上可接受的载剂必须具有足够高的纯度和足够低的毒性,以使其适合于向正在治疗的人类受试者施用。药学上可接受的载剂应当保持或增加组合物的稳定性。药学上可接受的载剂可以是液体的或固体的并且在考虑计划的施用方式的情况下被选择成在与组合物的其它组分组合时提供期望的容积、稠度等。例如,药学上可接受的载剂可以是但不限于:粘合剂(例如,预糊化玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素等)、填充剂(例如,乳糖和其它糖、微晶纤维素、果胶、明胶、硫酸钙、乙基纤维素、聚丙烯酸酯、磷酸氢钙等)、润滑剂(例如,硬脂酸镁、滑石、二氧化硅、胶体二氧化硅、硬脂酸、金属硬脂酸盐、氢化植物油、玉米淀粉、聚乙二醇、苯甲酸钠、乙酸钠等)、崩解剂(例如,淀粉、羧基乙酸淀粉钠等)或润湿剂(例如,月桂基硫酸钠等)。本文所设想的其它合适的药学上可接受载剂包含但不限于:水、盐溶液、醇、聚乙二醇、明胶、直链淀粉、硬脂酸镁、滑石、硅酸、粘性石蜡、羟甲基纤维素、聚乙烯吡咯烷酮等。
这些载剂溶液还可以含有缓冲剂、稀释剂和其它合适的添加剂。如本文所使用的术语“缓冲剂”是指其化学组成中和酸或碱而不显著改变pH的溶液或液体。本文所设想的缓冲剂的实例包含但不限于杜尔贝克氏(Dulbecco's)磷酸盐缓冲盐水(PBS)、林格氏(Ringer's)溶液、5%葡萄糖水溶液(D5W)、正常(normal)/生理(physiologic)盐水(0.9%NaCl)。
药学上可接受的载剂可以以足以维持组合物的pH为约7的量存在。可替代地,组合物的pH范围为约6.8到约7.4,例如,6.8、6.9、7.0、7.1、7.2、7.3和7.4。在又另一实施例中,组合物具有约7.4的pH。
本文所设想的组合物可以包括无毒的药学上可接受的培养基。所述组合物可以是悬浮液。如本文所使用的术语“悬浮液”是指细胞不附着于固体支持物的非粘附条件。例如,可以搅拌(stirred)或搅动(agitated)保持为悬浮液的细胞并且使之不粘附于如培养皿等支持物。
在特定实施例中,本文所设想的组合物在悬浮液中配制,其中经基因组编辑的T细胞分散在静脉注射(IV)袋等中的可接受的液体培养基或溶液例如盐水或无血清培养基内。可接受的稀释剂包含但不限于水、PlasmaLyte、林格氏溶液、等渗氯化钠(盐水)溶液、无血清细胞培养基和适合于低温储存的培养基,例如培养基。
在某些实施例中,药学上可接受的载剂基本上不含源于人或动物的天然蛋白,并且适合于储存包括经基因组编辑的T细胞群的组合物。治疗组合物旨在施用于人类患者,并且因此基本上不含细胞培养组分,如牛血清白蛋白、马血清和胎牛血清。
在一些实施例中,组合物在药学上可接受的细胞培养基中配制。这种组合物适合于向人类受试者施用。在特定实施例中,药学上可接受的细胞培养基为无血清培养基。
与含有血清的培养基相比,无血清培养基具有若干优点,包含简化的和更好定义的组合物、降低的污染程度、消除潜在的感染药剂来源以及更低的成本。在各个实施例中,无血清培养基是无动物的,并且可以任选地是无蛋白的。任选地,培养基可以含有生物药学上可接受的重组蛋白。“无动物”培养基是指其中组分衍生自非动物来源的培养基。重组蛋白在无动物培养基中代替天然动物蛋白质,并且营养物质来自合成、植物或微生物来源。相反,“无蛋白”培养基被定义为基本上不含蛋白质。
在特定组合物中使用的无血清培养基的说明性实例包含但不限于QBSF-60(质量生物有限公司(Quality Biological,Inc.))、StemPro-34(生命技术公司(LifeTechnologies))和X-VIVO 10。
在优选实施例中,包括经基因组编辑的T细胞的组合物在PlasmaLyte中配制。
在各个实施例中,包括经基因组编辑的T细胞的组合物在冷冻保存培养基中配制。例如,具有冷冻保存剂的冷冻保存培养基可以用于在解冻后维持高细胞活力结果。在特定组合物中使用的冷冻保存培养基的说明性实例包含但不限于CryoStor CS10、CryoStorCS5和CryoStor CS2。
在一个实施例中,组合物在包括50:50PlasmaLyte A到CryoStor CS10的溶液中配制。
在特定实施例中,组合物基本上不含支原体、内毒素和微生物污染。关于内毒素,“基本上不含”是指每剂细胞的内毒素含量低于FDA允许的生物制剂的含量,其为每天5EU/kg体重的总内毒素,针对平均70kg的人而言为350EU单位总剂量细胞。在特定实施例中,包括用本文所设想的逆转录病毒载体转导的造血干细胞或祖细胞的组合物含有约0.5EU/mL到约5.0EU/mL或约0.5EU/mL、1.0EU/mL、1.5EU/mL、2.0EU/mL、2.5EU/mL、3.0EU/mL、3.5EU/mL、4.0EU/mL、4.5EU/mL或5.0EU/mL。
在某些实施例中,设想了适合于递送多核苷酸的组合物和配制品,包含但不限于编码一种或多种重编程的核酸酶和任选地末端加工酶的一种或多种mRNA。
用于离体递送的示例性配制品还可以包含使用本领域已知的各种转染剂,如磷酸钙、电穿孔、热休克和各种脂质体配制品(即脂质介导的转染)。如下文更详细描述的,脂质体为包埋一部分水性流体的脂质双层。DNA与阳离子脂质体的外表面自发缔合(凭借其电荷),并且这些脂质体将与细胞膜相互作用。
在特定实施例中,药学上可接受的载剂溶液的配制是本领域技术人员所公知的,和适合的给药和治疗方案的发展一样,以将本文所描述的特定组合物用于各种治疗方案中,包含例如,肠内和肠胃外,例如血管内、静脉内、动脉内、骨内、心室内、脑内、颅内、脊柱内、鞘内以及髓内施用和配制。本领域技术人员应当理解,本文所设想的特定实施例可以包括如制药领域公知的配制品等其它配制品,并且在例如以下各项中描述:《雷明顿:药学科学与实践(Remington:The Science and Practice of Pharmacy)》,第I卷和第II卷.第22版.Loyd V.Allen Jr编辑.Philadelphia,PA:医药出版社;2012,所述文档通过引用以其全部内容并入本文。
J.经基因组编辑的细胞疗法
通过本文所设想的组合物和方法生产的经基因组编辑的细胞提供了改进的药物产品以用于预防、治疗癌症、GVHD、传染病、自身免疫疾病、炎性疾病或免疫缺陷或改善其至少一种症状。如本文所使用,术语“药物产品”是指使用本文所设想的组合物和方法产生的经基因修饰的细胞。在特定实施例中,药物产品包括经基因编辑的免疫效应细胞或T细胞。此外,在特定实施例中所设想的经基因组编辑的T细胞提供更安全和更有效的过继细胞疗法,因为它们对T细胞耗竭具有抗性并且在可以导致持续治疗的肿瘤微环境中显示出增加的耐久性和持久性。
在特定实施例中,向受试者施用有效量的经基因组编辑的免疫效应细胞或包括经编辑的TGFβR2基因的T细胞,以预防、治疗癌症、GVHD、传染病、自身免疫疾病、炎性疾病或免疫缺陷或改善其至少一种症状。
在特定实施例中,经TGFβR2编辑的细胞基本上不表达TGFβR2或缺乏TGFβR2的表达,并且因此缺乏或基本缺乏功能性TGFβR2表达,例如,缺乏增加T细胞耗竭和抑制促炎细胞因子的表达的能力。在特定实施例中,缺乏TGFβR2的经基因组编辑的免疫效应细胞对来自肿瘤微环境的免疫抑制信号更具抗性,并且对T细胞耗竭显示出增加的持久性和抗性。
在特定实施例中,预防、治疗癌症或改善其至少一种症状的方法包括向受试者施用有效量的经基因组编辑的免疫效应细胞或包括经编辑的TGFβR2基因和工程化TCR、CAR或Daric或其它治疗性转基因的T细胞,以将细胞重新定向到肿瘤或癌症。经基因修饰的细胞是更耐久和持久的药物产品,因为通过编辑TGFβR2基因来减少或消除TGFβR2表达使细胞对来自肿瘤微环境的免疫抑制信号更具抗性。
在特定实施例中,本文所设想的经基因组编辑的细胞用于治疗实体瘤或癌症。
在特定实施例中,本文所设想的经基因组编辑的细胞用于治疗实体瘤或癌症,包含但不限于:肾上腺癌、肾上腺皮质癌、肛门癌、阑尾癌、星形细胞瘤、非典型畸胎样/横纹肌样瘤、基底细胞癌、胆管癌、膀胱癌、骨癌、脑/CNS癌、乳腺癌、支气管肿瘤、心脏肿瘤、宫颈癌、胆管癌、软骨肉瘤、脊索瘤、结肠癌、结直肠癌、颅咽管瘤、原位导管癌(DCIS)子宫内膜癌、室管膜瘤、食管癌、鼻腔神经胶质瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、眼癌、输卵管癌、纤维组织肉瘤、纤维肉瘤、胆囊癌、胃癌、胃肠道类癌、胃肠道间质瘤(GIST)、生殖细胞肿瘤、胶质瘤、胶质母细胞瘤、头颈癌、血管母细胞瘤、肝细胞癌、下咽癌、眼内黑色素瘤、卡波西肉瘤、肾癌、喉癌、平滑肌肉瘤、唇癌、脂肪肉瘤、肝癌、肺癌、非小细胞肺癌、肺类癌、恶性间皮瘤、髓样癌、成神经管细胞瘤、脑膜瘤、黑色素瘤、梅克尔细胞癌、中线癌、口腔癌、粘膜肉瘤、骨髓增生异常综合征、骨髓增生性肿瘤、鼻腔和鼻窦癌、鼻咽癌、神经母细胞瘤、少突神经胶质瘤、口腔癌、口腔癌、口咽癌、骨肉瘤、卵巢癌、胰腺癌、胰岛细胞肿瘤、乳头状癌、副神经节瘤、甲状旁腺癌、阴茎癌、咽癌、嗜铬细胞瘤、松果体瘤、垂体瘤、胸膜肺母细胞瘤、原发性腹膜癌、前列腺癌、直肠癌、视网膜母细胞瘤、肾细胞癌、肾盂和输尿管癌、横纹肌肉瘤、唾液腺癌、皮脂腺癌、皮肤癌、软组织肉瘤、鳞状细胞癌、小细胞肺癌、小肠癌、胃癌、汗腺癌、滑膜瘤、睾丸癌、咽喉癌、胸腺癌、甲状腺癌,尿道癌症、子宫癌、子宫肉瘤、阴道癌、血管癌、外阴癌和威尔姆斯肿瘤。
在特定实施例中,本文所设想的经基因组编辑的细胞用于治疗实体瘤或癌症,包含但不限于肝癌、胰腺癌、肺癌、乳腺癌、膀胱癌、脑癌、骨癌、甲状腺癌、肾癌或皮肤癌。
在特定实施例中,本文所设想的经基因组编辑的细胞用于治疗各种癌症,包含但不限于胰腺癌、膀胱癌和肺癌。
在特定实施例中,本文所设想的经基因组编辑的细胞用于治疗液体癌或血液癌。
在特定实施例中,本文所设想的经基因组编辑的细胞用于治疗B细胞恶性肿瘤,包含但不限于:白血病、淋巴瘤和多发性骨髓瘤。
在特定实施例中,本文所设想的经基因组编辑的细胞用于治疗液体癌,包含但不限于白血病、淋巴瘤和多发性骨髓瘤:急性淋巴细胞白血病(ALL)、急性髓性白血病(AML)、成髓细胞白血病、早幼粒细胞白血病、髓单核细胞白血病、单核细胞白血病、红白血病、毛细胞白血病(HCL)、慢性淋巴细胞白血病(CLL)和慢性粒细胞白血病(CML)、慢性髓单核细胞白血病(CMML)和真性红细胞增多症、霍奇金淋巴瘤(Hodgkin lymphoma)、结节性淋巴细胞为主的霍奇金淋巴瘤、伯基特淋巴瘤(Burkitt lymphoma)、小淋巴细胞淋巴瘤(SLL)、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、免疫母细胞性大细胞淋巴瘤、前体B淋巴母细胞淋巴瘤、套细胞淋巴瘤、边缘区淋巴瘤、蕈样真菌病、间变性大细胞淋巴瘤、塞扎里氏综合征(Sézarysyndrome)、前体T淋巴母细胞淋巴瘤、多发性骨髓瘤、明显多发性骨髓瘤、冒烟型多发性骨髓瘤、浆细胞白血病、非分泌性骨髓瘤、IgD骨髓瘤、骨硬化性骨髓瘤、骨的孤立性浆细胞瘤以及髓外浆细胞瘤。
在本文所设想的基因组编辑方法中使用的优选细胞包含自体(autologous)/自体(autogeneic)(“自我”)细胞、优选地造血细胞、更优选地T细胞以及更优选地免疫效应细胞或Treg细胞。
在特定实施例中,提供了包括以下的方法:向有需要的患者单独施用或与一种或多种治疗剂组合施用治疗有效量的本文设想的经基因组编辑的T细胞或包括上述T细胞的组合物。在某些实施例中,细胞用于治疗患有癌症、GVHD、传染病、自身免疫疾病,炎性疾病或免疫缺陷风险的患者。因此,特定实施例包括治疗或预防癌症、传染病、自身免疫疾病、炎性疾病或免疫缺陷或改善其至少一种症状,包括向有此需要的受试者施用治疗有效量的本文所设想的经基因组编辑的细胞。
在一个实施例中,治疗有此需要的受试者的癌症、GVHD、传染病、自身免疫疾病、炎性疾病或免疫缺陷的方法包括施用有效量的例如治疗有效量的包括本文所设想的经基因组编辑的细胞的组合物。施用的数量和频率将由如患者的病状以及患者的疾病的类型和严重性等因素确定,但是适当的剂量可以通过临床试验确定。
在一个说明性实施例中,提供给受试者的有效量的经基因组编辑的细胞为至少2×106个细胞/kg、至少3×106个细胞/kg、至少4×106个细胞/kg、至少5×106个细胞/kg、至少6×106个细胞/kg、至少7×106个细胞/kg、至少8×106个细胞/kg、至少9×106个细胞/kg、或至少10×106个细胞/kg或更多个细胞/kg,包含所有中间剂量的细胞。
在另一说明性实施例中,提供给受试者的有效量的经基因组编辑的细胞为约2×106个细胞/kg、约3×106个细胞/kg、约4×106个细胞/kg、约5×106个细胞/kg、约6×106个细胞/kg、约7×106个细胞/kg、约8×106个细胞/kg、约9×106个细胞/kg、或约10×106个细胞/kg或更多个细胞/kg,包含所有中间剂量的细胞。
在另一说明性实施例中,提供给受试者的有效量的经基因组编辑的细胞为约2×106个细胞/kg到约10×106个细胞/kg、约3×106个细胞/kg到约10×106个细胞/kg、约4×106个细胞/kg到约10×106个细胞/kg、约5×106个细胞/kg到约10×106个细胞/kg、2×106个细胞/kg到约6×106个细胞/kg、2×106个细胞/kg到约7×106个细胞/kg、2×106个细胞/kg到约8×106个细胞/kg、3×106个细胞/kg到约6×106个细胞/kg、3×106个细胞/kg到约7×106个细胞/kg、3×106个细胞/kg到约8×106个细胞/kg、4×106个细胞/kg到约6×106个细胞/kg、4×106个细胞/kg到约7×106个细胞/kg、4×106个细胞/kg到约8×106个细胞/kg、5×106个细胞/kg到约6×106个细胞/kg、5×106个细胞/kg到约7×106个细胞/kg、5×106个细胞/kg到约8×106个细胞/kg或6×106个细胞/kg到约8×106个细胞/kg,包含所有中间剂量的细胞。
本领域普通技术人员将认识到,可能需要多次施用特定实施例中设想的组合物以实现期望的疗法。例如,组合物可以在1周、2周、3周、1个月、2个月、3个月、4个月、5个月、6个月、1年、2年、5年、10年或更长时间的跨度内施用1次、2次、3次、4次、5次、6次、7次、8次、9次或10次或更多次。
在某些实施例中,可能希望向受试者施用活化的T细胞,并且随后重新抽血(或进行单采血液成分术)、从中活化T细胞并且向患者重新输注这些活化的和扩增的T细胞。可以每隔几周进行多次此过程。在某些实施例中,可以抽取10cc到400cc的血来活化T细胞。在某些实施例中,抽取20cc、30cc、40cc、50cc、60cc、70cc、80cc、90cc、100cc、150cc、200cc、250cc、300cc、350cc或400cc或更多量的血来活化T细胞。不受理论束缚,使用此多次抽血/多次重新输注方案可以用于选出某些T细胞群。
可以任何常规方式执行在特定实施例中所设想的组合物的施用,包含通过雾化吸入、注射、摄取、输血、植入或移植。在优选实施例中,肠胃外施用组合物。本文所使用的短语“肠胃外施用(parenteral administration和administered parenterally)”意指除了肠内施用和局部施用以外的通常通过注射进行的施用方式,并且包含但不限于:血管内、静脉内、肌肉内、动脉内、鞘内、囊内、眼眶内、瘤内、心内、真皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下、脊柱内以及胸骨内注射和输注。在一个实施例中,本文所设想的组合物通过直接注射到肿瘤、淋巴结或感染部位向受试者施用。
在一个实施例中,治疗诊断患有癌症的受试者的方法包括:从受试者中除去免疫效应细胞,编辑所述免疫效应细胞的基因组并且产生经基因组编辑的免疫效应细胞群,并且向同一受试者施用经基因组编辑的免疫效应细胞群。在优选实施例中,免疫效应细胞包括T细胞。
用于施用特定实施例中设想的细胞组合物的方法包含有效导致重新引入经离体基因组编辑的免疫效应细胞或重新引入免疫效应细胞的经基因组编辑的祖细胞的方法,所述免疫效应细胞在引入受试者时分化成成熟免疫效应细胞。一种方法包括基因组离体编辑外周血T细胞并将转导的细胞返回到受试者中。
本说明书中引用的所有出版物、专利申请和授权专利均通过引用并入本文,如同每个单独的出版物、专利申请或授权专利被具体地和单独地指示通过引用并入本文。
尽管以上实施例已经出于清楚理解的目的通过说明和举例的方式进行了一些详细的描述,但是对于本领域的普通技术人员而言根据本文预期的教导应该容易清楚的是,在不偏离所附权利要求书的精神或范围下可以对其进行某些改变和变更。仅通过说明的方式而不是通过限制的方式提供以下实例。本领域技术人员将容易识别可以被改变或修改以产生本质上类似的结果的各种非关键参数。
实例
实例1
重编程I-OnuI以破坏人转化生长因子β受体2(TGFβR2)基因
通过构建包含DNA识别界面中的可变氨基酸残基的模块化文库将I-OnuI重编程为靶向TGFβR2基因的外显子6(图1)。为了构建变体,使用寡核苷酸将简并密码子并入I-OnuIDNA结合结构域中。将编码简并密码子的寡核苷酸用作PCR模板以通过酵母菌株酿酒酵母中的间隙重组产生变体库。每个变体库跨越N末端或C末端I-OnuI DNA识别结构域并且包含约107到108个独特的转化体。针对相对于包括对应结构域的“半位点”(SEQ ID No:14-18)的靶位点的切割活性,通过流式细胞术对所产生的表面显示文库进行筛选,如图2所示。
纯化显示了N末端和C末端结构域重编程的I-OnuI HE的酵母并且提取质粒DNA。执行PCR反应以扩增重编程的结构域,所述重编程的结构域随后被融合并被转化为酿酒酵母以产生重编程的结构域组合物库。从此文库中识别出识别存在于TGFβR2基因的外显子6中的完整靶位点(SEQ ID NO:11)的完全重编程的I-OnuI变体并将其纯化。
实例2
靶向TGFβR2基因的外显子6的重编程的I-OnuI归巢核酸内切酶
使用染色体整合的荧光报告基因系统(Certo等人,2011)测量靶向TGFβR2基因的外显子6的重编程的I-OnuI HE的活性。将结合并切割TGFβR2靶序列(SEQ ID NO:11)的完全重编程的I-OnuI HE克隆到哺乳动物表达质粒中并且然后单独转染到包含编码荧光iRFP蛋白的框外基因上游的TGFβR2靶序列的HEK 293T成纤维细胞系中。通过HE切割嵌入的靶位点以及在通过非同源末端连接(NHEJ)途径进行DNA修复之后累积插入缺失(indel)导致大约三分之一的修复基因座将荧光报告基因放置回“框内”。因此,iRFP荧光HEK 293T细胞的百分比被用作染色体嵌入靶序列处的核酸内切酶活性的读数。结合并切割TGFβR2靶序列的完全重编程的I-OnuI HE在细胞染色体环境中显示出中等的iRFP表达效率。图3(上图)。
接下来通过对TGFβR2.B3HE变体(例如,SEQ ID NO:6)执行随机诱变来产生第二I-OnuI变体库。在更严格的切割条件下执行基于显示的流动分选以试图分离出具有提高的催化效率的变体。此过程识别了I-OnuI变体TGFβR2.B3.F8(SEQ ID NO:7),其在染色体荧光报告基因分析中在产生iRFP表达细胞方面具有约4倍的速率。图3(下图)。
TGFβR2.B3.F8相对于亲本变体具有两个氨基酸突变,其中一个位于DNA识别界面内。TGFβR2.B3.F8对外显子6靶位点具有次纳摩尔亲和力。图4。图5示出了代表性I-OnuI变体的相对比对以及包括DNA识别界面的残基的位置信息。
实例3
表征靶向TGFβR2外显子6的MegaTAL
通过将对应于11碱基对TAL阵列靶位点(SEQ ID NO:12)的5-甲基胞嘧啶耐受的10.5单位TAL阵列附着到大范围核酸酶结构域的N末端来将TGFβR2.B3.F8HE变体格式化为TGFβR2.B3.F8megaTAL(SEQ ID NO:9)(如Boissel等人所述,2013)。图6。SEQ ID NO:13中列出了megaTAL靶位点序列。还通过连接子序列(SEQ ID NO:10)将TGFβR2.B3.F8megaTAL格式化为与Trex2的C-末端融合。
通过以下评估megaTAL编辑效率:在细胞因子补充的培养基中用抗CD3抗体和抗CD28抗体来预刺激原代人T细胞48-72小时,并且然后用编码TGFβR2.B3.F8megaTAL的体外转录(IVT)的、戴帽的和多腺苷酸化的mRNA电穿孔所述细胞。另外,添加编码3'-5'核酸外切酶Trex2的IVT-mRNA以通过非同源末端连接(NHEJ)途径增强断裂处理(参见Certo等人,2012)。在细胞因子补充的培养基中将电穿孔后细胞培养7-10天,在此期间,取出等分试样以进行基因组DNA分离,然后跨TGFβR2外显子6靶位点进行PCR扩增。
使用通过分解跟踪插入缺失(Tracking of Indels by DEcomposition)(TIDE,参见Brinkman等人,2014)测量插入缺失的频率。在Trex2存在下,TGFβR2.B3.F8megaTAL的编辑效率约为65%。图7。在靶位点处观察到的主要插入缺失类型为-1bp,但还观察到-2bp、-3bp或-4bp插入缺失。图7。这一分析证实TGFβR2.B3.F8megaTAL在megaTAL处理的人T细胞的相当大一部分中破坏TGFβR2靶位点。
实例4
TGFβR2MegaTAL破坏TGFβ-1诱导的信号传导
TGFβ-1结合到TGFβR2诱导下游信号级联放大,包括SMAD2和SMAD3的磷酸化。如实例3所描述的,用CD3和CD28活化原代人T细胞。用编码TGFβR2.B3.F8megaTAL的体外转录的mRNA电穿孔活化的原代人T细胞。将转染的T细胞扩增另外的7-10天,并跨TGFβR2靶位点使用TIDE来测量编辑效率。
在第10天,用重组TGFβ-1刺激megaTAL处理的T细胞和对照供体T细胞二者,并且通过使用流式细胞术检查SMAD2/3磷酸化来分析TGFβR2信号传导能力。对照细胞显示,rTGFβ-1刺激后,磷酸化的SMAD2/3增加。相比之下,用TGFβR2靶向megaTAL处理的T细胞在rTGFβ-1刺激后表现出最小的pSMAD2/3信号,从而证明TGFβR2基因的破坏会显著减少将以其它形式在TGFβR2信号传导下游发生的细胞内信号传导事件。图8。
实例5
TGFβR2MegaTAL破坏抗-GD2CAR T细胞中TGFβ-1诱导的信号传导
用CD3和CD28活化人外周血单核细胞(PBMC)。活化后二十四小时,对细胞进行模拟物转导或用编码抗GD2CAR的慢病毒转导所述细胞。活化后七十二小时,将模拟物转导的细胞和用抗GD2CAR转导的细胞各自分为三种情况:无电穿孔、模拟物电穿孔或用编码TGFβR2.B3.F8megaTAL的体外转录的mRNA进行电穿孔。将T细胞扩增另外7天,并且跨TGFβR2靶位点使用TIDE来测量编辑效率。图9。
用CD3和CD28活化人PBMC。活化后二十四小时,对细胞进行模拟物转导或用编码抗GD2CAR的慢病毒转导所述细胞。活化后七十二小时,将模拟物转导的细胞和用抗GD2CAR转导的细胞各自分为两种情况:模拟物电穿孔或用编码TGFβR2.B3.F8megaTAL的体外转录的mRNA进行电穿孔。将T细胞扩增另外7天。在第10天,用重组TGFβ-1刺激megaTAL处理的T细胞和对照T细胞二者,并且通过使用流式细胞术检查SMAD2/3磷酸化来分析TGFβR2信号传导能力。相比TGFβR2靶向megaTAL处理的T细胞,对照细胞显示,rTGFβ-1刺激后,磷酸化的SMAD2/3增加。图10。
用CD3和CD28活化人PBMC。活化后二十四小时,对细胞进行模拟物转导或用编码抗GD2CAR的慢病毒转导所述细胞。活化后七十二小时,将模拟物转导的细胞和用抗GD2CAR转导的细胞各自分为三种情况:无电穿孔、模拟物电穿孔或用编码TGFβR2.B3.F8megaTAL的体外转录的mRNA进行电穿孔。将T细胞扩增另外7天。在第10天,在存在或不存在重组TGFβ-1的情况下,将megaTAL处理的T细胞和对照T细胞与表达GD2的癌细胞一起培养。在24小时后测量IFNγ和IL-2分泌。与TGFβ-1存在下的对照处理细胞相比,TGFβR2靶向megaTAL处理的T细胞显示,细胞因子分泌显著增加。图11。
总之,在以下权利要求中,所使用的术语不应当被解释为将权利要求限制于本说明书和权利要求中所公开的特定实施例,而是应当被解释为包含所有可能的实施例,连同这种权利要求有权获得的等效物的整个范围。因此,权利要求书不受本公开限制。
序列表
<110> 蓝鸟生物公司(bluebird bio, Inc.)
乔丹·贾儒尔(Jarjour, Jordan)
凯尔·哈文斯(Havens, Kyle)
<120> TGFβR2核酸内切酶变体、组合物和使用方法
<130> BLBD-078/02WO
<150> US 62/414,260
<151> 2016-10-28
<150> US 62/409,163
<151> 2016-10-17
<160> 66
<170> PatentIn version 3.5
<210> 1
<211> 303
<212> PRT
<213> 新榆长喙壳菌(Ophiostoma novo-ulmi)
<400> 1
Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Met Leu Phe Lys Gln
100 105 110
Ala Phe Cys Val Met Glu Asn Lys Glu His Leu Lys Ile Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Ile Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
290 295 300
<210> 2
<211> 303
<212> PRT
<213> 新榆长喙壳菌(Ophiostoma novo-ulmi)
<400> 2
Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
290 295 300
<210> 3
<211> 303
<212> PRT
<213> 新榆长喙壳菌(Ophiostoma novo-ulmi)
<220>
<221> MOD_RES
<222> (1)..(3)
<223> 任何氨基酸或不存在
<400> 3
Xaa Xaa Xaa Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe
290 295 300
<210> 4
<211> 303
<212> PRT
<213> 新榆长喙壳菌(Ophiostoma novo-ulmi)
<220>
<221> MOD_RES
<222> (1)..(4)
<223> 任何氨基酸或不存在
<220>
<221> MOD_RES
<222> (302)..(303)
<223> 任何氨基酸或不存在
<400> 4
Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa
290 295 300
<210> 5
<211> 303
<212> PRT
<213> 美洲新榆长喙壳菌亚种(线粒体)(Ophiostoma novo-ulmi subsp. americana(mitochondrion))
<220>
<221> MOD_RES
<222> (1)..(8)
<223> 任何氨基酸或不存在
<220>
<221> MOD_RES
<222> (302)..(303)
<223> 任何氨基酸或不存在
<400> 5
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn
20 25 30
Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu
180 185 190
Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile
210 215 220
Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa
290 295 300
<210> 6
<211> 303
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的I-OnuI变体
<220>
<221> MOD_RES
<222> (1)..(4)
<223> 任何氨基酸或不存在
<220>
<221> MOD_RES
<222> (302)..(303)
<223> 任何氨基酸或不存在
<400> 6
Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Met Leu Arg Ile Arg Asn Arg
20 25 30
Asn Gln Arg Lys Ala Asn Tyr Gly Thr Ser Leu Val Phe Glu Ile Gly
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Lys Ile Arg Asn Ser Gly Asp Gly Ser Val Arg Leu Ser
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Asp Gly Ser Phe Gly Val Asp Leu Ile Lys Arg Lys Arg Lys Thr
180 185 190
Thr Val Gly Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile
210 215 220
Tyr Glu Arg Asn Lys Ser Glu Asn Ser Trp Leu Asp Phe Val Val Arg
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa
290 295 300
<210> 7
<211> 303
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的I-OnuI变体
<220>
<221> MOD_RES
<222> (1)..(4)
<223> 任何氨基酸或不存在
<220>
<221> MOD_RES
<222> (302)..(303)
<223> 任何氨基酸或不存在
<400> 7
Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr
1 5 10 15
Gly Phe Ala Asp Ala Glu Gly Ser Phe Met Leu Arg Ile Arg Asn Arg
20 25 30
Asn Gln Arg Lys Ala Asn Tyr Gly Thr Ser Leu Val Phe Glu Ile Gly
35 40 45
Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp
50 55 60
Lys Val Gly Lys Ile Arg Asn Ser Gly Asp Gly Ser Val Arg Leu Ser
65 70 75 80
Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys
85 90 95
Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln
100 105 110
Ala Phe Ser Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile
115 120 125
Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp
130 135 140
Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu
145 150 155 160
Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser
165 170 175
Gly Asp Gly Ser Phe Gly Val Asp Leu Ile Lys Arg Lys Arg Lys Thr
180 185 190
Thr Val Gly Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp
195 200 205
Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile
210 215 220
Tyr Glu Arg Asn Lys Ser Glu Asn Ser Trp Leu Asp Phe Val Val Arg
225 230 235 240
Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn
245 250 255
Thr Leu Ile Gly Val Lys Leu Lys Asp Phe Glu Asp Trp Cys Lys Val
260 265 270
Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp
275 280 285
Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa
290 295 300
<210> 8
<211> 874
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的megaTAL TGFbR2.B3构建体
<400> 8
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg
1 5 10 15
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
20 25 30
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
50 55 60
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
100 105 110
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala
580 585 590
Asp Ala Glu Gly Ser Phe Met Leu Arg Ile Arg Asn Arg Asn Gln Arg
595 600 605
Lys Ala Asn Tyr Gly Thr Ser Leu Val Phe Glu Ile Gly Leu His Asn
610 615 620
Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly
625 630 635 640
Lys Ile Arg Asn Ser Gly Asp Gly Ser Val Arg Leu Ser Val Thr Arg
645 650 655
Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu
660 665 670
Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser
675 680 685
Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu
690 695 700
Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys
705 710 715 720
Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys
725 730 735
Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly
740 745 750
Ser Phe Gly Val Asp Leu Ile Lys Arg Lys Arg Lys Thr Thr Val Gly
755 760 765
Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys Asn Leu
770 775 780
Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile Tyr Glu Arg
785 790 795 800
Asn Lys Ser Glu Asn Ser Trp Leu Asp Phe Val Val Arg Lys Phe Ser
805 810 815
Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile
820 825 830
Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu
835 840 845
Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys
850 855 860
Lys Ile Lys Leu Asn Met Asn Lys Gly Arg
865 870
<210> 9
<211> 874
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的megaTAL TGFbR2.B3.F8构建体
<400> 9
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg
1 5 10 15
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
20 25 30
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
50 55 60
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
100 105 110
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala
580 585 590
Asp Ala Glu Gly Ser Phe Met Leu Arg Ile Arg Asn Arg Asn Gln Arg
595 600 605
Lys Ala Asn Tyr Gly Thr Ser Leu Val Phe Glu Ile Gly Leu His Asn
610 615 620
Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly
625 630 635 640
Lys Ile Arg Asn Ser Gly Asp Gly Ser Val Arg Leu Ser Val Thr Arg
645 650 655
Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu
660 665 670
Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser
675 680 685
Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu
690 695 700
Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys
705 710 715 720
Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys
725 730 735
Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly
740 745 750
Ser Phe Gly Val Asp Leu Ile Lys Arg Lys Arg Lys Thr Thr Val Gly
755 760 765
Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys Asn Leu
770 775 780
Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile Tyr Glu Arg
785 790 795 800
Asn Lys Ser Glu Asn Ser Trp Leu Asp Phe Val Val Arg Lys Phe Ser
805 810 815
Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile
820 825 830
Gly Val Lys Leu Lys Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu
835 840 845
Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys
850 855 860
Lys Ile Lys Leu Asn Met Asn Lys Gly Arg
865 870
<210> 10
<211> 1115
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的megaTAL TGFbR2.B3-Trex2融合蛋白
<400> 10
Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg
1 5 10 15
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
20 25 30
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
35 40 45
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
50 55 60
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
65 70 75 80
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
85 90 95
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
100 105 110
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
115 120 125
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
130 135 140
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
145 150 155 160
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
165 170 175
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
180 185 190
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
195 200 205
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
210 215 220
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
225 230 235 240
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
245 250 255
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
260 265 270
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
275 280 285
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
290 295 300
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
305 310 315 320
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
325 330 335
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
340 345 350
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
355 360 365
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
370 375 380
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
385 390 395 400
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
405 410 415
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
420 425 430
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
435 440 445
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
450 455 460
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
465 470 475 480
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
485 490 495
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala
500 505 510
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
515 520 525
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val
530 535 540
Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg
545 550 555 560
Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly
565 570 575
Gly Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala
580 585 590
Asp Ala Glu Gly Ser Phe Met Leu Arg Ile Arg Asn Arg Asn Gln Arg
595 600 605
Lys Ala Asn Tyr Gly Thr Ser Leu Val Phe Glu Ile Gly Leu His Asn
610 615 620
Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly
625 630 635 640
Lys Ile Arg Asn Ser Gly Asp Gly Ser Val Arg Leu Ser Val Thr Arg
645 650 655
Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu
660 665 670
Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser
675 680 685
Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu
690 695 700
Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys
705 710 715 720
Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys
725 730 735
Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly
740 745 750
Ser Phe Gly Val Asp Leu Ile Lys Arg Lys Arg Lys Thr Thr Val Gly
755 760 765
Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys Asn Leu
770 775 780
Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile Tyr Glu Arg
785 790 795 800
Asn Lys Ser Glu Asn Ser Trp Leu Asp Phe Val Val Arg Lys Phe Ser
805 810 815
Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile
820 825 830
Gly Val Lys Leu Lys Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu
835 840 845
Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys
850 855 860
Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe Ala Ser Thr Gly
865 870 875 880
Ser Glu Pro Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu Ala
885 890 895
Thr Gly Leu Pro Asn Met Asp Pro Glu Ile Ala Glu Ile Ser Leu Phe
900 905 910
Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu Arg Asp Asp Ser Gly
915 920 925
Ser Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met Cys
930 935 940
Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu Ser
945 950 955 960
Ser Glu Ser Leu Met His Cys Gly Lys Ala Gly Phe Asn Gly Ala Val
965 970 975
Val Arg Thr Leu Gln Gly Phe Leu Ser Arg Gln Glu Gly Pro Ile Cys
980 985 990
Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys Thr
995 1000 1005
Gly Leu Gln Arg Leu Gly Ala His Leu Pro Gln Asp Thr Val Cys
1010 1015 1020
Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser
1025 1030 1035
His Gly Thr Arg Ala Gln Gly Arg Lys Ser Tyr Ser Leu Ala Ser
1040 1045 1050
Leu Phe His Arg Tyr Phe Gln Ala Glu Pro Ser Ala Ala His Ser
1055 1060 1065
Ala Glu Gly Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg
1070 1075 1080
Ala Pro Glu Leu Leu Ala Trp Ala Asp Glu Gln Ala Arg Ser Trp
1085 1090 1095
Ala His Ile Glu Pro Met Tyr Val Pro Pro Asp Gly Pro Ser Leu
1100 1105 1110
Glu Ala
1115
<210> 11
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 11
cgaccagaaa ttcccagctt ct 22
<210> 12
<211> 11
<212> DNA
<213> 智人(Homo sapiens)
<400> 12
gttgagagat c 11
<210> 13
<211> 38
<212> DNA
<213> 智人(Homo sapiens)
<400> 13
gttgagagat cgagggcgac cagaaattcc cagcttct 38
<210> 14
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 14
cgaccagaaa ttcaaccttt ta 22
<210> 15
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 15
cgaccagaaa ttctacgtct gc 22
<210> 16
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 16
cgaccagaaa ttccacaggc tc 22
<210> 17
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 17
cgaccagaaa ttcaccgatt tt 22
<210> 18
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 18
cttccaggaa ttcccagctt ct 22
<210> 19
<211> 7244
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的I-OnuI变体TGFbR2.B3.F8表面展示质粒构建体
<400> 19
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120
atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180
aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240
atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300
gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360
tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420
aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480
attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540
atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140
ccgaaggagc taaccgcttt ttttcacaac atgggggatc atgtaactcg ccttgatcgt 1200
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500
ggcagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100
acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cacgcttccc 2160
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220
agggagcttc caggggggaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc cgagcctatg gaaaaacgcc 2340
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580
aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttacctcact 2640
cattaggcac cccaggcttt acactttatg cttccggctc ctatgttgtg tggaattgtg 2700
agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gctcggaatt 2760
aaccctcact aaagggaaca aaagctgggt acccgacagg ttatcagcaa caacacagtc 2820
atatccattc tcaattagct ctaccacagt gtgtgaacca atgtatccag caccacctgt 2880
aaccaaaaca attttagaag tactttcact ttgtaactga gctgtcattt atattgaatt 2940
ttcaaaaatt cttacttttt ttttggatgg acgcaaagaa gtttaataat catattacat 3000
ggcattacca ccatatacat atccatatac atatccatat ctaatcttac ttatatgttg 3060
tggaaatgta aagagcccca ttatcttagc ctaaaaaaac cttctctttg gaactttcag 3120
taatacgctt aactgctcat tgctatattg aagtacggat tagaagccgc cgagcgggtg 3180
acagccctcc gaaggaagac tctcctccgt gcgtcctcgt cttcaccggt cgcgttcctg 3240
aaacgcagat gtgcctcgcg ccgcactgct ccgaacaata aagattctac aatactagct 3300
tttatggtta tgaagaggaa aaattggcag taacctggcc ccacaaacct tcaaatgaac 3360
gaatcaaatt aacaaccata ggatgataat gcgattagtt ttttagcctt atttctgggg 3420
taattaatca gcgaagcgat gatttttgat ctattaacag atatataaat gcaaaaactg 3480
cataaccact ttaactaata ctttcaacat tttcggtttg tattacttct tattcaaatg 3540
taataaaaga tcgaatccta cttcatacat tttcaattaa gatgcagtta cttcgctgtt 3600
tttcaatatt ttctgttatt gcttcagttt tagcacagga actgacaact atatgcgagc 3660
aaatcccctc accaacttta gaatcgacgc cgtactcttt gtcaacgact actattttgg 3720
ccaacgggaa ggcaatgcaa ggagtttttg aatattacaa atcagtaacg tttgtcagta 3780
attgcggttc tcacccctca acaactagca aaggcagccc cataaacaca cagtatgttt 3840
ttaaggacaa tagctcgacg attgaaggta gatacccata cgacgttcca gactacgctc 3900
tgcaggctag tggtggagga ggctctggtg gaggcggtag cggaggcgga gggtcggcta 3960
gctccatcaa cccatggatt ctgactggtt tcgctgatgc cgaaggatcc ttcatgctac 4020
gtatcaggaa cagaaaccaa aggaaagcta attacggaac tagcctggta ttcgaaatcg 4080
gactgcacaa caaggacaaa tcgattctgg agaatatcca gtcgacttgg aaggtcggca 4140
aaatcaggaa cagtggcgac ggtagtgtca gactgagtgt cacacgtttc gaagatttga 4200
aagtgattat cgaccacttc gagaaatatc cgctgattac ccagaaattg ggcgattaca 4260
agttgtttaa acaggcattc agcctcatgg agaacaaaga acatcttaag gagaatggga 4320
ttaaggagct cgtacgaatc aaagctaaga tgaattgggg tctcaatgac gaattgaaaa 4380
aagcatttcc agagaacatt agcaaagagc gtccccttat caataagaac atcccaaatc 4440
tcaaatggct ggctggattc acatctggtg acggctcgtt cggagtggat ctaatcaaga 4500
ggaaaagaaa aactacagta ggagtgggcc tgcgattctc catctcacag cacatcagag 4560
acaagaacct gatgaattca ttgataacat acctaggctg tggtcacatc tacgagagaa 4620
acaagtctga gaatagttgg ctcgatttcg ttgtaagaaa attcagcgat atcaacgaca 4680
agatcattcc ggtattccag gaaaatactc tgattggcgt caaactcaag gactttgaag 4740
attggtgcaa ggttgccaaa ttgatcgaag agaagaaaca cctgaccgaa tccggtttgg 4800
atgagattaa gaaaatcaag ctgaacatga acaaaggtcg tgtcttctct agaggcggtt 4860
ccagaagcgg atctggtact ggcgaacaga aactcataag cgaagaagac cttagcggga 4920
ctggagagca aaagttgatt tctgaggagg atttgtcggg aaccggggag cagaagttaa 4980
tcagtgaaga ggatctcagt ggaacgggcg aacaaaagtt gatctcggag gaagacttat 5040
aatgaagatc tgataacaac agtgtagatg taacaaaatc gactttgttc ccactgtact 5100
tttagctcgt acaaaataca atatactttt catttctccg taaacaacat gttttcccat 5160
gtaatatcct tttctatttt tcgttccgtt accaacttta cacatacttt atatagctat 5220
tcacttctat acactaaaaa actaagacaa ttttaatttt gctgcctgcc atatttcaat 5280
ttgttataaa ttcctataat ttatcctatt agtagctaaa aaaagatgaa tgtgaatcga 5340
atcctaagag aattgagctc caattcgccc tatagtgagt cgtattacaa ttcactggcc 5400
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 5460
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcctttcc 5520
caacagttgc gcagcctgaa tggcgaatgg acgcgccctg tagcggcgca ttaagcgcgg 5580
cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc 5640
ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa 5700
atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac 5760
ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt 5820
tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca 5880
accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt 5940
taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgttta 6000
caatttcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcaggca 6060
agtgcacaaa caatacttaa ataaatacta ctcagtaata acctatttct tagcattttt 6120
gacgaaattt gctattttgt tagagtcttt tacaccattt gtctccacac ctccgcttac 6180
atcaacacca ataacgccat ttaatctaag cgcatcacca acattttctg gcgtcagtcc 6240
accagctaac ataaaatgta agctttcggg gctctcttgc cttccaaccc agtcagaaat 6300
cgagttccaa tccaaaagtt cacctgtccc acctgcttct gaatcaaaca agggaataaa 6360
cgaatgaggt ttctgtgaag ctgcactgag tagtatgttg cagtcttttg gaaatacgag 6420
tcttttaata actggcaaac cgaggaactc ttggtattct tgccacgact catctccatg 6480
cagttggacg acatcaatgc cgtaatcatt gaccagagcc aaaacatcct ccttaggttg 6540
attacgaaac acgccaacca agtatttcgg agtgcctgaa ctatttttat atgcttttac 6600
aagacttgaa attttccttg caataaccgg gtcaattgtt ctctttctat tgggcacaca 6660
tataataccc agcaagtcag catcggaatc aagagcacat tctgcggcct ctgtgctctg 6720
caagccgcaa actttcacca atggaccaga actacctgtg aaattaataa cagacatact 6780
ccaagctgcc tttgtgtgct taatcacgta tactcacgtg ctcaatagtc accaatgccc 6840
tccctcttgg ccctctcctt ttcttttttc gaccgaatta attcttaatc ggcaaaaaaa 6900
gaaaagctcc ggatcaagat tgtacgtaag gtgacaagct atttttcaat aaagaatatc 6960
ttccactact gccatctggc gtcataactg caaagtacac atatattacg atgctgtcta 7020
ttaaatgctt cctatattat atatatagta atgtcgttta tggtgcactc tcagtacaat 7080
ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 7140
ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 7200
ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcga 7244
<210> 20
<211> 2640
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的megaTAL TGFbR2.B3.F8构建体
<400> 20
augggauccg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60
agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120
gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180
gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240
acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300
uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360
gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420
gcacugacgg gugccccccu gaacuuaaca cccgaucaag ugguagcgau agcgucaaac 480
aacgggggua aacaggcuuu ggagacggua cagcgguuau ugccgguacu cugccaggac 540
cacggauuga caccggacca agugguggcg auugcgucca auggcggagg caagcaggca 600
cuagagaccg uccaacggcu ucuucccguu cuuugucagg aucaugggcu aaccccugau 660
cagguagucg cuauagcuuc aaacggcggg ggcaagcaag cacuggagac cguucaacga 720
cuccugccag ugcugugcca agaccacgga cuuaccccag aucaggucgu ugcuauugcc 780
uccaacaaug gcgggaaaca agcguuggaa acugugcaga gacuguuacc ugucuugugu 840
caagaccacg gccucacgcc agaucaggug guagccauag cgucgaacau uggugguaag 900
caagcccuug aaacggucca gcgucuucug ccgguguugu gccaggacca cggacuaacg 960
ccggaucagg ucguagccau ugcuucaaau aauggcggca aacaggcgcu agagacaguc 1020
cagcgccucu ugccuguguu augccaggau cacggcuuaa ccccagacca aguuguggcu 1080
auugcaucua auaucggugg caaacaagcc uuggagacag ugcaacgauu acugccuguc 1140
uuaugucagg aucauggccu gacgcccgau cagguagugg caaucgcauc uaacaaugga 1200
gguaagcaag cacuggagac uguccagaga uuguuacccg uacuauguca agaucauggu 1260
uugacgccug aucagguugu ugcgauagcc agcaauauag gagggaaaca ggcucuugaa 1320
accguacagc gacuucuccc agucuugugc caagaucacg ggcuuacucc ugaucaaguc 1380
guagcuaucg ccagcaaugg aggugggaaa caggcccugg aaaccguaca acgucuccuc 1440
ccaguacuuu gucaagacca cgggcugaca ccugaccaag uuguggcgau agccagucau 1500
gaugggggaa aacaggcacu agagagcauu guggcccagc ugagccggcc ugauccggcg 1560
uuggccgcgu ugaccaacga ccaccucguc gccuuggccu gccucggcgg acguccugcc 1620
auggaugcag ugaaaaaggg auugccgcac gcgccggaau ugaucagaag agucaaucgc 1680
cguauuggcg aacgcacguc ccaucgcguu gcgauaucua gagugggagg aucgcgcaga 1740
gaguccauca acccauggau ucugacuggu uucgcugaug ccgaaggauc cuucaugcua 1800
cguaucagga acagaaacca aaggaaagcu aauuacggaa cuagccuggu auucgaaauc 1860
ggacugcaca acaaggacaa aucgauucug gagaauaucc agucgacuug gaaggucggc 1920
aaaaucagga acaguggcga cgguaguguc agacugagug ucacacguuu cgaagauuug 1980
aaagugauua ucgaccacuu cgagaaauau ccgcugauua cccagaaauu gggcgauuac 2040
aaguuguuua aacaggcauu cagccucaug gagaacaaag aacaucuuaa ggagaauggg 2100
auuaaggagc ucguacgaau caaagcuaag augaauuggg gucucaauga cgaauugaaa 2160
aaagcauuuc cagagaacau uagcaaagag cguccccuua ucaauaagaa caucccaaau 2220
cucaaauggc uggcuggauu cacaucuggu gacggcucgu ucggagugga ucuaaucaag 2280
aggaaaagaa aaacuacagu aggagugggc cugcgauucu ccaucucaca gcacaucaga 2340
gacaagaacc ugaugaauuc auugauaaca uaccuaggcu guggucacau cuacgagaga 2400
aacaagucug agaauaguug gcucgauuuc guuguaagaa aauucagcga uaucaacgac 2460
aagaucauuc cgguauucca ggaaaauacu cugauuggcg ucaaacucaa ggacuuugaa 2520
gauuggugca agguugccaa auugaucgaa gagaagaaac accugaccga auccgguuug 2580
gaugagauua agaaaaucaa gcugaacaug aacaaagguc gugucuucag cggccgcuga 2640
<210> 21
<211> 711
<212> RNA
<213> 小家鼠(Mus musculus)
<400> 21
augucugagc caccucgggc ugagaccuuu guauuccugg accuagaagc cacugggcuc 60
ccaaacaugg acccugagau ugcagagaua ucccuuuuug cuguucaccg cucuucccug 120
gagaacccag aacgggauga uucugguucc uuggugcugc cccguguucu ggacaagcuc 180
acacugugca ugugcccgga gcgccccuuu acugccaagg ccagugagau uacugguuug 240
agcagcgaaa gccugaugca cugcgggaag gcugguuuca auggcgcugu gguaaggaca 300
cugcagggcu uccuaagccg ccaggagggc cccaucugcc uuguggccca caauggcuuc 360
gauuaugacu ucccacugcu gugcacggag cuacaacguc ugggugccca ucugccccaa 420
gacacugucu gccuggacac acugccugca uugcggggcc uggaccgugc ucacagccac 480
ggcaccaggg cucaaggccg caaaagcuac agccuggcca gucucuucca ccgcuacuuc 540
caggcugaac ccagugcugc ccauucagca gaaggugaug ugcacacccu gcuucugauc 600
uuccugcauc gugcuccuga gcugcucgcc ugggcagaug agcaggcccg cagcugggcu 660
cauauugagc ccauguacgu gccaccugau gguccaagcc ucgaagccug a 711
<210> 22
<211> 236
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 22
Met Ser Glu Pro Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu
1 5 10 15
Ala Thr Gly Leu Pro Asn Met Asp Pro Glu Ile Ala Glu Ile Ser Leu
20 25 30
Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu Arg Asp Asp Ser
35 40 45
Gly Ser Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met
50 55 60
Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu
65 70 75 80
Ser Ser Glu Ser Leu Met His Cys Gly Lys Ala Gly Phe Asn Gly Ala
85 90 95
Val Val Arg Thr Leu Gln Gly Phe Leu Ser Arg Gln Glu Gly Pro Ile
100 105 110
Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys
115 120 125
Thr Glu Leu Gln Arg Leu Gly Ala His Leu Pro Gln Asp Thr Val Cys
130 135 140
Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His
145 150 155 160
Gly Thr Arg Ala Gln Gly Arg Lys Ser Tyr Ser Leu Ala Ser Leu Phe
165 170 175
His Arg Tyr Phe Gln Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly
180 185 190
Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Pro Glu Leu
195 200 205
Leu Ala Trp Ala Asp Glu Gln Ala Arg Ser Trp Ala His Ile Glu Pro
210 215 220
Met Tyr Val Pro Pro Asp Gly Pro Ser Leu Glu Ala
225 230 235
<210> 23
<211> 3
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 23
Gly Gly Gly
1
<210> 24
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 24
Asp Gly Gly Gly Ser
1 5
<210> 25
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 25
Thr Gly Glu Lys Pro
1 5
<210> 26
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 26
Gly Gly Arg Arg
1
<210> 27
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 27
Gly Gly Gly Gly Ser
1 5
<210> 28
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 28
Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp
1 5 10
<210> 29
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 29
Lys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser
1 5 10 15
Leu Asp
<210> 30
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 30
Gly Gly Arg Arg Gly Gly Gly Ser
1 5
<210> 31
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 31
Leu Arg Gln Arg Asp Gly Glu Arg Pro
1 5
<210> 32
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 32
Leu Arg Gln Lys Asp Gly Gly Gly Ser Glu Arg Pro
1 5 10
<210> 33
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 示例性连接子序列
<400> 33
Leu Arg Gln Lys Asp Gly Gly Gly Ser Gly Gly Gly Ser Glu Arg Pro
1 5 10 15
<210> 34
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 通过TEV蛋白酶的切割序列
<220>
<221> SITE
<222> (2)..(3)
<223> Xaa是任何氨基酸
<220>
<221> SITE
<222> (5)..(5)
<223> Xaa是任何氨基酸
<220>
<221> SITE
<222> (7)..(7)
<223> Xaa = Gly或Ser
<400> 34
Glu Xaa Xaa Tyr Xaa Gln Xaa
1 5
<210> 35
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 通过TEV蛋白酶的切割序列
<400> 35
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 36
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 通过TEV蛋白酶的切割序列
<400> 36
Glu Asn Leu Tyr Phe Gln Ser
1 5
<210> 37
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 37
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 38
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 38
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 39
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 39
Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
1 5 10
<210> 40
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 40
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 41
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 41
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 42
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 42
Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
1 5 10
<210> 43
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 43
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 44
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 44
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 45
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 45
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 46
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 46
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 47
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 47
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 48
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 48
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 49
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 49
Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210> 50
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 50
Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210> 51
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 51
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 52
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 52
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
1 5 10 15
Pro
<210> 53
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 53
Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 54
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 54
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
1 5 10 15
Asp Val Glu Ser Asn Pro Gly Pro
20
<210> 55
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 55
Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro
1 5 10 15
Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys
20 25 30
Ile Val Ala Pro Val Lys Gln Thr
35 40
<210> 56
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 56
Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro
1 5 10 15
Gly Pro
<210> 57
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 57
Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val
1 5 10 15
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
20 25 30
Asp Val Glu Ser Asn Pro Gly Pro
35 40
<210> 58
<211> 33
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 包括2A位点的自切割多肽
<400> 58
Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu
1 5 10 15
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
20 25 30
Pro
<210> 59
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 共有Kozak序列
<400> 59
gccrccatgg 10
<210> 60
<211> 30
<212> DNA
<213> 智人(Homo sapiens)
<400> 60
agggcgacca gaaattccca gcttctggct 30
<210> 61
<211> 30
<212> DNA
<213> 智人(Homo sapiens)
<400> 61
agccagaagc tgggaatttc tggtcgccct 30
<210> 62
<211> 293
<212> PRT
<213> 新榆长喙壳菌(Ophiostoma novo-ulmi)
<400> 62
Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser
1 5 10 15
Phe Leu Leu Arg Ile Arg Asn Asn Asn Lys Ser Ser Val Gly Tyr Ser
20 25 30
Thr Glu Leu Gly Phe Gln Ile Thr Leu His Asn Lys Asp Lys Ser Ile
35 40 45
Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly Val Ile Ala Asn Ser
50 55 60
Gly Asp Asn Ala Val Ser Leu Lys Val Thr Arg Phe Glu Asp Leu Lys
65 70 75 80
Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys Leu
85 90 95
Gly Asp Tyr Met Leu Phe Lys Gln Ala Phe Cys Val Met Glu Asn Lys
100 105 110
Glu His Leu Lys Ile Asn Gly Ile Lys Glu Leu Val Arg Ile Lys Ala
115 120 125
Lys Leu Asn Trp Gly Leu Thr Asp Glu Leu Lys Lys Ala Phe Pro Glu
130 135 140
Ile Ile Ser Lys Glu Arg Ser Leu Ile Asn Lys Asn Ile Pro Asn Phe
145 150 155 160
Lys Trp Leu Ala Gly Phe Thr Ser Gly Glu Gly Cys Phe Phe Val Asn
165 170 175
Leu Ile Lys Ser Lys Ser Lys Leu Gly Val Gln Val Gln Leu Val Phe
180 185 190
Ser Ile Thr Gln His Ile Lys Asp Lys Asn Leu Met Asn Ser Leu Ile
195 200 205
Thr Tyr Leu Gly Cys Gly Tyr Ile Lys Glu Lys Asn Lys Ser Glu Phe
210 215 220
Ser Trp Leu Asp Phe Val Val Thr Lys Phe Ser Asp Ile Asn Asp Lys
225 230 235 240
Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys Leu Glu
245 250 255
Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu Lys Lys
260 265 270
His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn
275 280 285
Met Asn Lys Gly Arg
290
<210> 63
<211> 293
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的I-OnuI变体
<400> 63
Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser
1 5 10 15
Phe Met Leu Arg Ile Arg Asn Arg Asn Gln Arg Lys Ala Asn Tyr Gly
20 25 30
Thr Ser Leu Val Phe Glu Ile Gly Leu His Asn Lys Asp Lys Ser Ile
35 40 45
Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Arg Asn Ser
50 55 60
Gly Asp Gly Ser Val Arg Leu Ser Val Thr Arg Phe Glu Asp Leu Lys
65 70 75 80
Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys Leu
85 90 95
Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Leu Met Glu Asn Lys
100 105 110
Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile Lys Ala
115 120 125
Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro Glu
130 135 140
Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn Leu
145 150 155 160
Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly Ser Phe Gly Val Asp
165 170 175
Leu Ile Lys Arg Lys Arg Lys Thr Thr Val Gly Val Gly Leu Arg Phe
180 185 190
Ser Ile Ser Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser Leu Ile
195 200 205
Thr Tyr Leu Gly Cys Gly Arg Ile Tyr Glu Arg Asn Lys Ser Glu Asn
210 215 220
Ser Trp Leu Asp Phe Val Val Arg Lys Phe Ser Asp Ile Asn Asp Lys
225 230 235 240
Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys Leu Glu
245 250 255
Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu Lys Lys
260 265 270
His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn
275 280 285
Met Asn Lys Gly Arg
290
<210> 64
<211> 293
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221>
<223> 合成的I-OnuI变体
<400> 64
Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser
1 5 10 15
Phe Met Leu Arg Ile Arg Asn Arg Asn Gln Arg Lys Ala Asn Tyr Gly
20 25 30
Thr Ser Leu Val Phe Glu Ile Gly Leu His Asn Lys Asp Lys Ser Ile
35 40 45
Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Arg Asn Ser
50 55 60
Gly Asp Gly Ser Val Arg Leu Ser Val Thr Arg Phe Glu Asp Leu Lys
65 70 75 80
Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys Leu
85 90 95
Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Leu Met Glu Asn Lys
100 105 110
Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile Lys Ala
115 120 125
Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro Glu
130 135 140
Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn Leu
145 150 155 160
Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly Ser Phe Gly Val Asp
165 170 175
Leu Ile Lys Arg Lys Arg Lys Thr Thr Val Gly Val Gly Leu Arg Phe
180 185 190
Ser Ile Ser Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser Leu Ile
195 200 205
Thr Tyr Leu Gly Cys Gly His Ile Tyr Glu Arg Asn Lys Ser Glu Asn
210 215 220
Ser Trp Leu Asp Phe Val Val Arg Lys Phe Ser Asp Ile Asn Asp Lys
225 230 235 240
Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys Leu Lys
245 250 255
Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu Lys Lys
260 265 270
His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn
275 280 285
Met Asn Lys Gly Arg
290
<210> 65
<211> 47
<212> DNA
<213> 智人(Homo sapiens)
<400> 65
aacgtgttga gagatcgagg gcgaccagaa attcccagct tctggct 47
<210> 66
<211> 47
<212> DNA
<213> 智人(Homo sapiens)
<400> 66
agccagaagc tgggaatttc tggtcgccct cgatctctca acacgtt 47

Claims (124)

1.一种多肽,其包括切割人转化生长因子β受体2(TGFβR2)基因中的靶位点的归巢核酸内切酶(HE)变体。
2.根据权利要求1所述的多肽,其中所述HE变体是LAGLIDADG归巢核酸内切酶(LHE)变体。
3.根据权利要求1或权利要求2所述的多肽,其中所述多肽包括所述HE变体的生物活性片段。
4.根据权利要求3所述的多肽,其中与对应的野生型HE相比,所述生物活性片段缺少1个、2个、3个、4个、5个、6个、7个或8个N末端氨基酸。
5.根据权利要求4所述的多肽,其中与对应的野生型HE相比,所述生物活性片段缺少所述4个N末端氨基酸。
6.根据权利要求4所述的多肽,其中与对应的野生型HE相比,所述生物活性片段缺少所述8个N末端氨基酸。
7.根据权利要求3所述的多肽,其中与对应的野生型HE相比,所述生物活性片段缺少1个、2个、3个、4个或5个C末端氨基酸。
8.根据权利要求7所述的多肽,其中与对应的野生型HE相比,所述生物活性片段缺少所述C末端氨基酸。
9.根据权利要求7所述的多肽,其中与对应的野生型HE相比,所述生物活性片段缺少所述2个C末端氨基酸。
10.根据权利要求1到9中任一项所述的多肽,其中所述HE变体是选自由以下组成的组的LHE的变体:I-AabMI、I-AaeMI、I-AniI、I-ApaMI、I-CapIII、I-CapIV、I-CkaMI、I-CpaMI、I-CpaMII、I-CpaMIII、I-CpaMIV、I-CpaMV、I-CpaV、I-CraMI、I-EjeMI、I-GpeMI、I-GpiI、I-GzeMI、I-GzeMII、I-GzeMIII、I-HjeMI、I-LtrII、I-LtrI、I-LtrWI、I-MpeMI、I-MveMI、I-NcrII、I-Ncrl、I-NcrMI、I-OheMI、I-OnuI、I-OsoMI、I-OsoMII、I-OsoMIII、I-OsoMIV、I-PanMI、I-PanMII、I-PanMIII、I-PnoMI、I-ScuMI、I-SmaMI、I-SscMI和I-Vdi141I。
11.根据权利要求1到10中任一项所述的多肽,其中所述HE变体是选自由以下组成的组的LHE的变体:I-CpaMI、I-HjeMI、I-OnuI、I-PanMI和SmaMI。
12.根据权利要求1到11中任一项所述的多肽,其中所述HE变体是I-OnuI LHE变体。
13.根据权利要求1到12中任一项所述的多肽,其中所述HE变体包括DNA识别界面中在选自由以下组成的组的氨基酸位置处的一个或多个氨基酸取代:如SEQ ID NO:1-5中所示的I-OnuI LHE氨基酸序列或其生物活性片段的19、24、26、28、30、32、34、35、36、37、38、40、42、44、46、48、59、68、70、72、75、76、77、78、80、82、168、180、182、184、186、188、189、190、191、192、193、195、197、199、201、203、223、225、227、229、231、232、234、236、238和240。
14.根据权利要求1到13中任一项所述的多肽,其中所述HE变体包括所述DNA识别界面中在选自由以下组成的组的氨基酸位置处的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选至少40个或更多个氨基酸取代:如SEQ ID NO:1-5中所示的I-OnuI LHE氨基酸序列或其生物活性片段的19、24、26、28、30、32、34、35、36、37、38、40、42、44、46、48、59、68、70、72、75、76、77、78、80、82、168、180、182、184、186、188、189、190、191、192、193、195、197、199、201、203、223、225、227、229、231、232、234、236、238和240。
15.根据权利要求1到14中任一项所述的多肽,其中所述HE变体切割TGFβR2靶位点并且包括在选自由以下位置组成的位置组的至少一个位置中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个氨基酸取代:SEQ ID NO:1-5中的任一个或其生物活性片段的26、32、34、35、36、37、38、40、42、44、46、48、68、70、75、76、78、80、116、138、143、159、168、178、180、182、184、188、190、192、193、195、197、199、203、207、223、225、227、232、240和264。
16.根据权利要求1到15中任一项所述的多肽,其中所述HE变体切割TGFβR2靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个:SEQ ID NO:1-5中的任一个或其生物活性片段的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R或S190G、L192T、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223R、Y223H、K225Y、K227R、F232N、T240R和E264K。
17.根据权利要求1到15中任一项所述的多肽,其中所述HE变体切割TGFβR2靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个:SEQ ID NO:1-5中的任一个或其生物活性片段的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R、L192T、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223R、K225Y、K227R、F232N和T240R。
18.根据权利要求1到15中任一项所述的多肽,其中所述HE变体切割TGFβR2靶位点并且包括以下氨基酸取代中的至少5个、至少15个、优选地至少25个、更优选地至少35个或甚至更优选地至少40个或更多个:SEQ ID NO:1-5中的任一个或其生物活性片段的L26M、N32R、K34Q、S35R、S36K、V37A、G38N、S40G、E42S、G44V、Q46E、T48G、V68K、A70R、N75G、A76S、S78R、K80S、V116L、L138M、T143N、S159P、F168L、E178D、C180S、F182G、N184D、S188R、S190R、L192T、G193T、Q195G、Q197G、V199R、T203S、K207R、Y223H、K225Y、K227R、F232N、T240R和E264K。
19.根据权利要求1到18中任一项所述的多肽,其中所述HE变体包括与SEQ ID NO:6-7中的任一个中所示的氨基酸序列至少80%、优选地至少85%、更优选地至少90%或甚至更优选地至少95%相同的氨基酸序列,或其生物活性片段。
20.根据权利要求1到19中任一项所述的多肽,其中所述HE变体包括SEQ ID NO:6中所示的所述氨基酸序列或其生物活性片段。
21.根据权利要求1到19中任一项所述的多肽,其中所述HE变体包括SEQ ID NO:7中所示的所述氨基酸序列或其生物活性片段。
22.根据权利要求1到21中任一项所述的多肽,其中所述多肽结合SEQ ID NO:11中所示的多核苷酸序列。
23.根据权利要1到22中任一项所述的多肽,其进一步包括DNA结合结构域。
24.根据权利要求23所述的多肽,其中所述DNA结合结构域选自由以下组成的组:TALEDNA结合结构域和锌指DNA结合结构域。
25.根据权利要求24所述的多肽,其中所述TALE DNA结合结构域包括约9.5个TALE重复单元到约15.5个TALE重复单元。
26.根据权利要求24或权利要求25所述的多肽,其中所述TALE DNA结合结构域结合所述TGFβR2基因中的多核苷酸序列。
27.根据权利要求24到26中任一项所述的多肽,其中所述TALE DNA结合结构域结合SEQID NO:12中所示的所述多核苷酸序列。
28.根据权利要求27所述的多肽,其中所述多肽结合并切割SEQ ID NO:13中所示的所述多核苷酸序列。
29.根据权利要求24所述的多肽,其中所述锌指DNA结合结构域包括2个、3个、4个、5个、6个、7个或8个锌指基序。
30.根据权利要求1到29中任一项所述的多肽,其进一步包括:肽连接子和末端加工酶或其生物活性片段。
31.根据权利要求1到30中任一项所述的多肽,其进一步包括:病毒自切割2A肽和末端加工酶或其生物活性片段。
32.根据权利要求30或权利要求31所述的多肽,其中所述末端加工酶或其生物活性片段具有5'-3'核酸外切酶、5'-3'碱性核酸外切酶、3'-5'核酸外切酶、5'瓣状核酸内切酶、解旋酶或非模板依赖性DNA聚合酶活性。
33.根据权利要求30到32中任一项所述的多肽,其中所述末端加工酶包括Trex2或其生物活性片段。
34.根据权利要求1到33中任一项所述的多肽,其中所述多肽包括SEQ ID NO:8或SEQID NO:9中所示的氨基酸序列或其生物活性片段。
35.根据权利要求34所述的多肽,其中所述多肽包括SEQ ID NO:8中所示的所述氨基酸序列或其生物活性片段。
36.根据权利要求34所述的多肽,其中所述多肽包括SEQ ID NO:9中所示的所述氨基酸序列或其生物活性片段。
37.根据权利要求1到36中任一项所述的多肽,其中所述多肽在SEQ ID NO:11或13中所示的多核苷酸序列处切割所述人TGFβR2基因。
38.一种编码根据权利要求1到37中任一项所述的多肽的多核苷酸。
39.一种编码根据权利要求1到37中任一项所述的多肽的mRNA。
40.一种编码根据权利要求1到37中任一项所述的多肽的cDNA。
41.一种载体,其包括编码根据权利要求1到37中任一项所述的多肽的多核苷酸。
42.一种细胞,其包括根据权利要求1到37中任一项所述的多肽。
43.一种细胞,其包括编码根据权利要求1到37中任一项所述的多肽的多核苷酸。
44.一种细胞,其包括根据权利要求41所述的载体。
45.一种细胞,其包括由根据权利要求1到37中任一项所述的多肽引入的一种或多种基因组修饰。
46.根据权利要求42到45中任一项所述的细胞,其中所述细胞包括编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体中的一种或多种的多核苷酸。
47.根据权利要求46所述的细胞,其中所述多核苷酸进一步包括可操作地连接到编码所述免疫效力增强子、所述免疫抑制信号阻尼子或所述工程化抗原受体的所述多核苷酸的RNA聚合酶II启动子。
48.根据权利要求47所述的细胞,其中所述RNA聚合酶II启动子选自由以下组成的组:短EF1α启动子、长EF1α启动子、人ROSA 26基因座、泛素C(UBC)启动子、磷酸甘油酸激酶-1(PGK)启动子、巨细胞病毒增强子/鸡β-肌动蛋白(CAG)启动子、β-肌动蛋白启动子和骨髓增殖性肉瘤病毒增强子、阴性对照区缺失、dl587rev引物结合位点取代的(MND)启动子。
49.根据权利要求46到48中任一项所述的细胞,其中所述多核苷酸进一步编码可操作地连接到所述免疫效力增强子、所述免疫抑制信号阻尼子或所述工程化抗原受体,散布于其之间和/或位于其两侧的一种或多种自切割病毒肽。
50.根据权利要求49所述的细胞,其中所述自切割病毒肽是2A肽。
51.根据权利要求46到50中任一项所述的细胞,其中所述多核苷酸进一步包括异源多腺苷酸化信号。
52.根据权利要求46到51中任一项所述的细胞,其中所述免疫抑制信号阻尼子包括抵消免疫抑制因子的酶功能。
53.根据权利要求52所述的细胞,其中所述免疫抑制信号阻尼子包括犬尿氨酸酶活性。
54.根据权利要求46到51中任一项所述的细胞,其中所述免疫抑制信号阻尼子包括:
(a)结合免疫抑制因子的外结构域,任选地其中所述外结构域是抗体或其抗原结合片段;
(b)结合免疫抑制因子的外结构域和跨膜结构域;或
(c)结合免疫抑制因子的外结构域、跨膜结构域和无法向所述细胞转导免疫抑制信号的经过修饰的内结构域。
55.根据权利要求54所述的细胞,其中所述免疫抑制信号阻尼子的所述外结构域和/或所述跨膜结构域是所述TGFβR2的外结构域和/或跨膜结构域。
56.根据权利要求46到51中任一项所述的细胞,其中所述免疫效力增强子选自由以下组成的组:双特异性T细胞衔接子分子(BiTE)、免疫增强因子和翻转受体。
57.根据权利要求56所述的细胞,其中所述免疫增强因子选自由以下组成的组:细胞因子、趋化因子、细胞毒素、细胞因子受体和其变体。
58.根据权利要求56所述的细胞,其中所述翻转受体包括TGFβR2外结构域和跨膜结构域;以及来自CD28、CD134、CD137、CD278和/或CD3ζ的与所述TGFβR2跨膜结构域的C末端框内融合的内结构域。
59.根据权利要求56所述的细胞,其中所述翻转受体包括TGFβR2外结构域;从CD3多肽、CD4、CD8α、CD28、CD134或CD137分离的跨膜结构域;以及来自CD28、CD134、CD137、CD278和/或CD3ζ的与所述TGFβR2外结构域的C末端框内融合的内结构域。
60.根据权利要求56所述的细胞,其中所述翻转受体包括TGFβR2外结构域;以及从CD3多肽、CD4、CD8α、CD28、CD134或CD137分离的与所述TGFβR2外结构域的C末端框内融合的跨膜结构域和内结构域。
61.根据权利要求46到51中任一项所述的细胞,其中所述工程化抗原受体选自由以下组成的组:工程化TCR、CAR、Daric或zetakine。
62.根据权利要求61所述的细胞,其中所述工程化受体未整合到所述TGFβR2基因中。
63.根据权利要求46到51中任一项所述的细胞,其中编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体中的一种或多种的所述多核苷酸被整合到所述TGFβR2基因中。
64.根据权利要求46到51中任一项所述的细胞,其中包括编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体中的一种或多种的所述多核苷酸的供体修复模板在通过根据权利要求1到37中任一项所述的多肽引入的DNA双链断裂位点处整合到所述TGFβR2基因中。
65.根据权利要求42到64中任一项所述的细胞,其中所述细胞是造血细胞。
66.根据权利要求42到65中任一项所述的细胞,其中所述细胞是T细胞。
67.根据权利要求42到66中任一项所述的细胞,其中所述细胞是CD3+、CD4+和/或CD8+细胞。
68.根据权利要求42到67中任一项所述的细胞,其中所述细胞是免疫效应细胞。
69.根据权利要求42到68中任一项所述的细胞,其中所述细胞是细胞毒性T淋巴细胞(CTL)、肿瘤浸润淋巴细胞(TIL)或辅助T细胞。
70.根据权利要求42到68中任一项所述的细胞,其中所述细胞是自然杀伤(NK)细胞或自然杀伤T(NKT)细胞。
71.根据权利要求42到70中任一项所述的细胞,其中所述细胞的来源为外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、来自感染部位的组织、腹水、胸腔积液、脾组织或肿瘤。
72.根据权利要求42到71中任一项所述的细胞,其中所述细胞包括一个或多个经过修饰的TGFβR2等位基因。
73.根据权利要求72所述的细胞,其中所述一个或多个经过修饰的TGFβR2等位基因是非功能性的或具有显著降低的TGFβR2功能和/或细胞内信号传导。
74.根据权利要求46到51中任一项所述的细胞,其中所述细胞包括编码引入到所述一个或多个经过修饰的TGFβR2等位基因中的免疫效力增强子或免疫抑制信号阻尼子的核酸,并且所述细胞进一步包括未引入到所述一个或多个经过修饰的TGFβR2等位基因中的工程化抗原受体。
75.多种细胞,其包括一种或多种根据权利要求42到74中任一项所述的细胞。
76.一种组合物,其包括一种或多种根据权利要求42到74中任一项所述的细胞。
77.一种组合物,其包括一种或多种根据权利要求42到74中任一项所述的细胞和生理学上可接受的载体。
78.一种在细胞中编辑人TGFβR2基因的方法,其包括:将编码根据权利要求1到37中任一项所述的多肽的多核苷酸引入所述细胞中,其中所述多肽的表达在人TGFβR2基因的靶位点处产生双链断裂。
79.一种在细胞中编辑人TGFβR2基因的方法,其包括:将编码根据权利要求1到37中任一项所述的多肽的多核苷酸引入所述细胞中,其中所述多肽的表达在人TGFβR2基因的靶位点处产生双链断裂,其中通过非同源性末端连接(NHEJ)修复所述断裂。
80.一种在细胞中编辑人TGFβR2基因的方法,其包括:将编码根据权利要求1到37中任一项所述的多肽的多核苷酸和供体修复模板引入所述细胞中,其中所述多肽的表达在人TGFβR2基因的靶位点处产生双链断裂并且通过同源性定向修复(HDR)在所述双链断裂(DSB)的位点处将所述供体修复模板并入所述人TGFβR2基因中。
81.根据权利要求78到80中任一项所述的方法,其中所述细胞是造血细胞。
82.根据权利要求78到81中任一项所述的方法,其中所述细胞是T细胞。
83.根据权利要求78到82中任一项所述的方法,其中所述细胞是CD3+、CD4+和/或CD8+细胞。
84.根据权利要求78到83中任一项所述的方法,其中所述细胞是免疫效应细胞。
85.根据权利要求78到84中任一项所述的方法,其中所述细胞是细胞毒性T淋巴细胞(CTL)、肿瘤浸润淋巴细胞(TIL)或辅助T细胞。
86.根据权利要求78到84中任一项所述的方法,其中所述细胞是自然杀伤(NK)细胞或自然杀伤T(NKT)细胞。
87.根据权利要求78到86中任一项所述的方法,其中所述细胞的来源是外周血单核细胞、骨髓、淋巴结组织、脐带血、胸腺组织、来自感染部位的组织、腹水、胸腔积液、脾组织或肿瘤。
88.根据权利要求78到87中任一项所述的方法,其中编码所述多肽的所述多核苷酸是mRNA。
89.根据权利要求78到88中任一项所述的方法,其中将编码5'-3'核酸外切酶的多核苷酸引入所述细胞中。
90.根据权利要求78到89中任一项所述的方法,其中将编码Trex2的多核苷酸或其生物活性片段引入所述细胞中。
91.根据权利要求80到90中任一项所述的方法,其中所述供体修复模板编码与野生型TGFβR2基因相比包括一个或多个突变的TGFβR2基因或其部分。
92.根据权利要求80到91中任一项所述的方法,其中所述供体修复模板编码免疫效力增强子、免疫抑制信号阻尼子或工程化抗原受体中的一种或多种。
93.根据权利要求92所述的方法,其中所述供体修复模板进一步包括可操作地连接到所述免疫效力增强子、所述免疫抑制信号阻尼子或所述工程化抗原受体的RNA聚合酶II启动子。
94.根据权利要求93所述的方法,其中所述RNA聚合酶II启动子选自由以下组成的组:短EF1α启动子、长EF1α启动子、人ROSA 26基因座、泛素C(UBC)启动子、磷酸甘油酸激酶-1(PGK)启动子、巨细胞病毒增强子/鸡β-肌动蛋白(CAG)启动子、β-肌动蛋白启动子和骨髓增殖性肉瘤病毒增强子、阴性对照区缺失、dl587rev引物结合位点取代的(MND)启动子。
95.根据权利要求92到94中任一项所述的方法,其中所述供体修复模板进一步编码可操作地连接到所述免疫效力增强子、所述免疫抑制信号阻尼子或所述工程化抗原受体,散布于其之间和/或位于其两侧的一种或多种自切割病毒肽。
96.根据权利要求95所述的方法,其中所述自切割病毒肽是2A肽。
97.根据权利要求92到96中任一项所述的方法,其中所述供体修复模板进一步包括异源多腺苷酸化信号。
98.根据权利要求92到97中任一项所述的方法,其中所述免疫抑制信号阻尼子包括抵消免疫抑制因子的酶功能。
99.根据权利要求98所述的方法,其中所述免疫抑制信号阻尼子包括犬尿氨酸酶活性。
100.根据权利要求92到97中任一项所述的方法,其中所述免疫抑制信号阻尼子包括:
(a)结合免疫抑制因子的外结构域,任选地其中所述外结构域是抗体或其抗原结合片段;
(b)结合免疫抑制因子的外结构域和跨膜结构域;或
(c)结合免疫抑制因子的外结构域、跨膜结构域和无法向所述细胞转导免疫抑制信号的经过修饰的内结构域。
101.根据权利要求100所述的方法,其中所述免疫抑制信号阻尼子的所述外结构域和/或所述跨膜结构域是所述TGFβR2的外结构域和/或跨膜结构域。
102.根据权利要求92到97中任一项所述的方法,其中所述免疫效力增强子选自由以下组成的组:双特异性T细胞衔接子分子(BiTE)、免疫增强因子和翻转受体。
103.根据权利要求102所述的方法,其中所述免疫增强因子选自由以下组成的组:细胞因子、趋化因子、细胞毒素、细胞因子受体和其变体。
104.根据权利要求102所述的方法,其中所述翻转受体包括TGFβR2外结构域和跨膜结构域;以及来自CD28、CD134、CD137、CD278和/或CD3ζ的与所述TGFβR2跨膜结构域的C末端框内融合的内结构域。
105.根据权利要求102所述的方法,其中所述翻转受体包括TGFβR2外结构域;从CD3多肽、CD4、CD8α、CD28、CD134或CD137分离的跨膜结构域;以及来自CD28、CD134、CD137、CD278和/或CD3ζ的与所述TGFβR2外结构域的C末端框内融合的内结构域。
106.根据权利要求102所述的方法,其中所述翻转受体包括TGFβR2外结构域;以及从CD3多肽、CD4、CD8α、CD28、CD134或CD137分离的与所述TGFβR2外结构域的C末端框内融合的跨膜结构域和内结构域。
107.根据权利要求92到97中任一项所述的方法,其中所述工程化抗原受体选自由以下组成的组:工程化TCR、CAR、Daric或zetakine。
108.根据权利要求80到107中任一项所述的方法,其中所述供体修复模板包括与处于所述DSB的5'端的人TGFβR2基因序列同源的5'同源臂以及与处于所述DSB的3'端的人TGFβR2基因序列同源的3'同源臂。
109.根据权利要求108所述的方法,其中所述5'同源臂和所述3'同源臂的长度独立地选自约100bp到约2500bp。
110.根据权利要求108或权利要求109所述的方法,其中所述5'同源臂和所述3'同源臂的长度独立地选自约600bp到约1500bp。
111.根据权利要求108到110中任一项所述的方法,其中所述5'同源臂为约1500bp,并且所述3'同源臂为约1000bp。
112.根据权利要求108到111中任一项所述的方法,其中所述5'同源臂为约600bp,并且3'所述同源臂为约600bp。
113.根据权利要求80到112中任一项所述的方法,其中病毒载体被用于将所述供体修复模板引入所述细胞中。
114.根据权利要求113所述的方法,其中所述病毒载体是重组腺相关病毒载体(rAAV)或逆转录病毒。
115.根据权利要求114所述的方法,其中所述rAAV具有一个或多个来自AAV2的ITR。
116.根据权利要求114或权利要求115所述的方法,其中所述rAAV具有选自由以下组成的组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和AAV10。
117.根据权利要求114到116中任一项所述的方法,其中所述rAAV具有AAV2或AAV6血清型。
118.根据权利要求114所述的方法,其中所述逆转录病毒是慢病毒。
119.根据权利要求118所述的方法,其中所述慢病毒是整合酶缺陷型慢病毒(IDLV)。
120.一种治疗、预防癌症、传染病、自身免疫性疾病、炎症性疾病和免疫缺陷症或与其相关的病状的改善其至少一种症状的方法,所述方法包括向受试者施用有效量的根据权利要求76或权利要求77所述的组合物。
121.一种治疗实体癌的方法,所述方法包括向受试者施用有效量的根据权利要求76或权利要求77所述的组合物。
122.根据权利要求121所述的方法,其中所述实体癌包括肝癌、胰腺癌、肺癌、乳腺癌、卵巢癌、前列腺癌、睾丸癌、膀胱癌、脑癌、肉瘤、头颈癌、骨癌、甲状腺癌、肾癌或皮肤癌。
123.一种治疗血液恶性肿瘤的方法,所述方法包括向受试者施用有效量的根据权利要求76或权利要求77所述的组合物。
124.根据权利要求123所述的方法,其中所述血液恶性肿瘤是白血病、淋巴瘤或多发性骨髓瘤。
CN201780076229.5A 2016-10-17 2017-10-17 TGFβR2核酸内切酶变体、组合物和使用方法 Pending CN110050066A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662409163P 2016-10-17 2016-10-17
US62/409,163 2016-10-17
US201662414260P 2016-10-28 2016-10-28
US62/414,260 2016-10-28
PCT/US2017/057014 WO2018075541A1 (en) 2016-10-17 2017-10-17 TGFβR2 ENDONUCLEASE VARIANTS, COMPOSITIONS, AND METHODS OF USE

Publications (1)

Publication Number Publication Date
CN110050066A true CN110050066A (zh) 2019-07-23

Family

ID=62018976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780076229.5A Pending CN110050066A (zh) 2016-10-17 2017-10-17 TGFβR2核酸内切酶变体、组合物和使用方法

Country Status (8)

Country Link
US (1) US11530395B2 (zh)
EP (1) EP3526334A4 (zh)
JP (2) JP7060591B2 (zh)
CN (1) CN110050066A (zh)
AU (1) AU2017346683B2 (zh)
CA (1) CA3040157A1 (zh)
MA (1) MA46543A (zh)
WO (1) WO2018075541A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11708572B2 (en) 2015-04-29 2023-07-25 Flodesign Sonics, Inc. Acoustic cell separation techniques and processes
US11214789B2 (en) 2016-05-03 2022-01-04 Flodesign Sonics, Inc. Concentration and washing of particles with acoustics
US11365226B2 (en) 2016-09-08 2022-06-21 2Seventy Bio, Inc. PD-1 homing endonuclease variants, compositions, and methods of use
BR112020018658A2 (pt) 2018-03-15 2020-12-29 KSQ Therapeutics, Inc. Composições de regulação gênica e métodos para imu-noterapia aprimorada
CN110904045A (zh) * 2018-09-17 2020-03-24 中国科学院动物研究所 经修饰的t细胞、其制备方法及用途
AU2019397364A1 (en) * 2018-12-10 2021-06-24 2Seventy Bio, Inc. Homing endonuclease variants
CN113330113A (zh) * 2018-12-10 2021-08-31 蓝鸟生物公司 Pdcd-1归巢核酸内切酶变体
US20220184131A1 (en) * 2019-05-01 2022-06-16 Juno Therapeutics, Inc. Cells expressing a recombinant receptor from a modified tgfbr2 locus, related polynucleotides and methods
WO2023081900A1 (en) * 2021-11-08 2023-05-11 Juno Therapeutics, Inc. Engineered t cells expressing a recombinant t cell receptor (tcr) and related systems and methods

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101679959A (zh) * 2007-02-19 2010-03-24 赛莱克蒂斯公司 具有新的底物特异性的laglidadg归巢核酸内切酶变体及其用途
WO2014191525A1 (en) * 2013-05-31 2014-12-04 Cellectis A laglidadg homing endonuclease cleaving the c-c chemokine receptor type-5 (ccr5) gene and uses thereof
WO2014191527A1 (en) * 2013-05-31 2014-12-04 Cellectis A laglidadg homing endonuclease cleaving the t cell receptor alpha gene and uses thereof
CN105452287A (zh) * 2013-04-17 2016-03-30 贝勒医学院 免疫抑制性TGF-β信号转换器
US20160184362A1 (en) * 2013-05-29 2016-06-30 Cellectis Methods for engineering t cells for immunotherapy by using rna-guided cas nuclease system
US20160222417A1 (en) * 2007-10-31 2016-08-04 Precision Biosciences, Inc. Rationally-designed single-chain meganucleases with non-palindromic recognition sequences

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
GB8918616D0 (en) 1989-08-15 1989-09-27 Univ Glasgow Herpes simplex virus type 1 mutant
US5804413A (en) 1992-07-31 1998-09-08 University Of Pittsburgh Of The Commonwealth System Of Higher Education Herpes simplex virus strains for gene transfer
GB9415319D0 (en) 1994-07-29 1994-09-21 Medical Res Council HSV viral vector
US5846782A (en) 1995-11-28 1998-12-08 Genvec, Inc. Targeting adenovirus with use of constrained peptide motifs
US6093570A (en) 1995-06-07 2000-07-25 The University Of North Carolina At Chapel Hill Helper virus-free AAV production
US6013516A (en) 1995-10-06 2000-01-11 The Salk Institute For Biological Studies Vector and method of use for nucleic acid delivery to non-dividing cells
AU8605598A (en) 1997-07-31 1999-02-22 University Of Pittsburgh Targeted hsv vectors
US5994136A (en) 1997-12-12 1999-11-30 Cell Genesys, Inc. Method and means for producing high titer, safe, recombinant lentivirus vectors
FR2777909B1 (fr) 1998-04-24 2002-08-02 Pasteur Institut Utilisation de sequences d'adn de structure triplex pour le tranfert de sequences de nucleotides dans des cellules, vecteurs recombinants contenant ces sequences triplex
US6692736B2 (en) 2000-03-24 2004-02-17 Cell Genesys, Inc. Cell-specific adenovirus vectors comprising an internal ribosome entry site
EP1290205B1 (en) 2000-06-01 2006-03-01 University Of North Carolina At Chapel Hill Duplexed parvovirus vectors
FR2872170B1 (fr) 2004-06-25 2006-11-10 Centre Nat Rech Scient Cnrse Lentivirus non interactif et non replicatif, preparation et utilisations
ES2385837T3 (es) 2004-12-15 2012-08-01 The University Of North Carolina At Chapel Hill Vectores quiméricos
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
US8889641B2 (en) 2009-02-11 2014-11-18 The University Of North Carolina At Chapel Hill Modified virus vectors and methods of making and using the same
US20110294217A1 (en) 2009-02-12 2011-12-01 Fred Hutchinson Cancer Research Center Dna nicking enzyme from a homing endonuclease that stimulates site-specific gene conversion
WO2011088081A1 (en) 2010-01-12 2011-07-21 The University Of North Carolina At Chapel Hill Restrictive inverted terminal repeats for viral vectors
JP6141021B2 (ja) 2010-02-05 2017-06-07 ザ・ユニヴァーシティ・オヴ・ノース・キャロライナ・アト・チャペル・ヒル パルボウイルスの形質導入を増強するための組成物および方法
US20140148361A1 (en) * 2010-06-07 2014-05-29 Barry L. Stoddard Generation and Expression of Engineered I-ONUI Endonuclease and Its Homologues and Uses Thereof
EP2680877B1 (en) 2011-02-28 2019-07-10 Seattle Children's Research Institute Coupling endonucleases with end-processing enzymes drive high efficiency gene disruption
US8450107B1 (en) 2011-11-30 2013-05-28 The Broad Institute Inc. Nucleotide-specific recognition sequences for designer TAL effectors
AU2014296626B2 (en) 2013-07-29 2019-03-07 Regeneron Pharmaceuticals, Inc. Multipartite signaling proteins and uses thereof
US20190184035A1 (en) 2016-07-25 2019-06-20 Bluebird Bio, Inc. Bcl11a homing endonuclease variants, compositions, and methods of use
CA3034094A1 (en) 2016-08-16 2018-02-22 Bluebird Bio, Inc. Il-10 receptor alpha homing endonuclease variants, compositions, and methods of use
WO2018039333A1 (en) 2016-08-23 2018-03-01 Bluebird Bio, Inc. Tim3 homing endonuclease variants, compositions, and methods of use
US11365226B2 (en) 2016-09-08 2022-06-21 2Seventy Bio, Inc. PD-1 homing endonuclease variants, compositions, and methods of use
EP3534916A4 (en) 2016-10-11 2020-09-30 Bluebird Bio, Inc. TCRA HOMING ENDONUCLEASE VARIANTS

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101679959A (zh) * 2007-02-19 2010-03-24 赛莱克蒂斯公司 具有新的底物特异性的laglidadg归巢核酸内切酶变体及其用途
US20160222417A1 (en) * 2007-10-31 2016-08-04 Precision Biosciences, Inc. Rationally-designed single-chain meganucleases with non-palindromic recognition sequences
CN105452287A (zh) * 2013-04-17 2016-03-30 贝勒医学院 免疫抑制性TGF-β信号转换器
US20160184362A1 (en) * 2013-05-29 2016-06-30 Cellectis Methods for engineering t cells for immunotherapy by using rna-guided cas nuclease system
WO2014191525A1 (en) * 2013-05-31 2014-12-04 Cellectis A laglidadg homing endonuclease cleaving the c-c chemokine receptor type-5 (ccr5) gene and uses thereof
WO2014191527A1 (en) * 2013-05-31 2014-12-04 Cellectis A laglidadg homing endonuclease cleaving the t cell receptor alpha gene and uses thereof

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AARON E. FOSTER, ET AL.: "Antitumor Activity of EBV-specific T Lymphocytes Transduced With a Dominant Negative TGF-β Receptor", 《J IMMUNOTHER》 *
L ZHANG, ET AL.: "Inhibition of TGF-β signaling in genetically engineered tumor antigen-reactive T cells significantly enhances tumor treatment efficacy", 《GENE THER》 *
RYO TAKEUCHI, ET AL.: "Redesign of extensive protein–DNA interfaces of meganucleases using iterative cycles of in vitro compartmentalization", 《PNAS》 *
TAKEUCHI, R., ET AL.: "Genbank accession number:PDB:3QQY_A", 《GENBANK》 *

Also Published As

Publication number Publication date
JP2019535240A (ja) 2019-12-12
US20200123515A1 (en) 2020-04-23
JP7060591B2 (ja) 2022-04-26
MA46543A (fr) 2019-08-21
WO2018075541A1 (en) 2018-04-26
EP3526334A1 (en) 2019-08-21
AU2017346683B2 (en) 2024-04-18
JP2022103174A (ja) 2022-07-07
US11530395B2 (en) 2022-12-20
CA3040157A1 (en) 2018-04-26
AU2017346683A1 (en) 2019-05-09
EP3526334A4 (en) 2020-09-30

Similar Documents

Publication Publication Date Title
US11912746B2 (en) PD-1 homing endonuclease variants, compositions, and methods of use
KR102590466B1 (ko) Cblb 엔도뉴클레아제 변이체, 조성물 및 사용 방법
US20230174967A1 (en) Donor repair templates multiplex genome editing
CN110050066A (zh) TGFβR2核酸内切酶变体、组合物和使用方法
US20190161530A1 (en) Chimeric antigen receptor t cell compositions
CN109311984A (zh) 基因组编辑的免疫效应细胞
CN109689865A (zh) Bcl11a归巢核酸内切酶变体、组合物和使用方法
EP3500696A1 (en) Il-10 receptor alpha homing endonuclease variants, compositions, and methods of use
US20190262398A1 (en) Tim3 homing endonuclease variants, compositions, and methods of use
WO2019126558A1 (en) Ahr homing endonuclease variants, compositions, and methods of use
RU2779097C2 (ru) Варианты, композиции и способы применения эндонуклеазы cblb
US20210002621A1 (en) Ctla4 homing endonuclease variants, compositions, and methods of use
CN116887853A (zh) 用于定点诱变的组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211101

Address after: 60 Benny street, Cambridge, Massachusetts, USA

Applicant after: 2 savinti biology

Address before: 60 Benny street, Cambridge, Massachusetts, USA

Applicant before: BLUEBIRD BIO, Inc.